Theory and Practice of Reinforcement Learning
Persone
(Responsabile)
Persone esterne
Schaul Tom
(Co-beneficiario esterno)
Abstract
L'apprendimento con rinforzo (Reinforcement Learning, RL) è strettamente collegato all'agire e all'apprendimento degli animali e degli esseri umani. Senza un insegnante, solamente a partire da segnali occasionali di dolore e di piacere, gli agenti RL devono scoprire come interagire con un ambiente dinamico per massimizzare la loro futura ricompensa attesa. L'approccio tradizionale dell'apprendimento con rinforzo fa delle ipotesi forti riguardo l'ambiente, come le assunzioni di Markov: l'input corrente dell'agente gli dice tutto quello che ha bisogno di sapere sull'ambiente. Spesso ciò non è realistico. Se si vuole restringere il divario tra le capacità di apprendimento degli umani e quelle delle macchine, allora si dovrà studiare come imparare gli algoritmi generali piuttosto che le mappature reattive. Quest¿area sembra destinata a diventare centrale per l'apprendimento delle macchine (ad esempio la robotica) e per l'intelligenza artificiale in generale. In un precedente lavoro, avevamo già ideato degli algoritmi generali che erano applicabili in ambienti (scenari) non-Markoviani. Nel progetto attuale, estenderemo ed applicheremo ulteriormente questi risultati avanzati agli aspetti pratici e teorici degli agenti RL e ricercheremo degli algoritmi di ottimizzazione. I nostri metodi verranno applicati ai più difficili problemi di benchmark RL ed aggiungeremo alle liste attuali di benchmark dei nuovi problemi complicati per ambienti parzialmente osservabili, in cui i metodi RL esistenti hanno grosse difficoltà di applicazione.