Informace o semináři
NAIL095 - Čtvrtek 15:40, S10
Kontaktní informace
- Jiří Iša - jiri (tečka) isa (zavináč) mff (tečka) cuni (tečka) cz
- Ondřej Sýkora - ondrasej (zavináč) centrum (tečka) cz
Podmínky pro udělení zápočtu
Aktivní účast v alespoň třech soutěžích zaměřených na umělou inteligenci, které byly vyhlášeny buď v rámci semináře nebo jako veřejné soutěže (např. v rámci konference). Účast znamená zúčastnit se soutěže s agentem (programem), který úlohu řeší rozumným netriviálním způsobem.
Doporučená literatura
Sutton, Richard S.; Barto, Andrew G.: Reinforcement Learning: An Introduction, MIT Press, 1998. Dostupné online.
Russell, Stuart; Norvig, Peter: Artificial Intelligence: A Modern Approach, Prentice Hall, 2002. Dostupné v knihovně (nebo v lepších knihkupectvích).
Informace o soutěžích
První (interní) soutěž - Mountain Car
Cílem je vytvořit agenta řešícího co nejlépe problém Mountain Car (výjezd do kopce). Archiv uvedený níže obsahuje všechny potřebné soubory nutné pro vývoj a testování agentů při vývoji pro Windows, na jiných systémech je nutné ručně doinstalovat program RL_Glue.
Při testování používejte experiment MountainCarExperimentMFF a prostředí MountainCar-Java, nejjednodušší způsob, jak spustit prostředí pro testování je pomocí skriptu MountainCarExperimentMFF/run_no_agent.bat (resp. run_no_agent.sh) a poté spustit agenta libovolným způsobem (např. z IDE).
- MountainCar.zip (1.5 MB) - obsahuje upravené prostředí a experiment odpovídající pravidlům, podle kterých bude soutěž na závěr vyhodnocena
- RL_Glue - pokud nepracujete na Windows, zde si stáhněte prostředí RL_Glue pro váš systém
- RL_Glue Java Codec API - JavaDoc pro RL_Glue Java Codec
- RL_Glue Java Codec Manual - manuál pro RL_Glue Java Codec (popis na vyšší úrovni než v případě RL_Glue Java Codec API)
Výsledky soutěže:
- Martin P.: 509 581
- Radoslav K.: 476 933
- základní strategie: 402 691
- Petr P.: 347 327
- Jiří D.: 196 438
Druhá (interní) soutěž - Fantom
- Fantom staré Prahy - informace o české variantě hry, popis pravidel
- Fantom - repository se zdrojovými kódy herního serveru (tento server budeme používat v rámci semináře)


