Theory and Practice of Reinforcement Learning

Persone

(Responsabile)

Abstract

L'apprendimento con rinforzo (Reinforcement Learning, RL) è strettamente collegato all'agire e all'apprendimento degli animali e degli esseri umani. Senza un insegnante, solamente a partire da segnali occasionali di dolore e di piacere, gli agenti RL devono scoprire come interagire con un ambiente dinamico per massimizzare la loro futura ricompensa attesa. L'approccio tradizionale dell'apprendimento con rinforzo fa delle ipotesi forti riguardo l'ambiente, come le assunzioni di Markov: l'input corrente dell'agente gli dice tutto quello che ha bisogno di sapere sull'ambiente. Spesso ciò non è realistico. Se si vuole restringere il divario tra le capacità di apprendimento degli umani e quelle delle macchine, allora si dovrà studiare come imparare gli algoritmi generali piuttosto che le mappature reattive. Quest¿area sembra destinata a diventare centrale per l'apprendimento delle macchine (ad esempio la robotica) e per l'intelligenza artificiale in generale. In un precedente lavoro, avevamo già ideato degli algoritmi generali che erano applicabili in ambienti (scenari) non-Markoviani. Nel progetto attuale, estenderemo ed applicheremo ulteriormente questi risultati avanzati agli aspetti pratici e teorici degli agenti RL e ricercheremo degli algoritmi di ottimizzazione. I nostri metodi verranno applicati ai più difficili problemi di benchmark RL ed aggiungeremo alle liste attuali di benchmark dei nuovi problemi complicati per ambienti parzialmente osservabili, in cui i metodi RL esistenti hanno grosse difficoltà di applicazione.

Informazioni aggiuntive

Data d'inizio

01.02.2007

Data di fine

01.02.2009

Durata

25 Mesi

Enti finanziatori

SNSF, Swiss National Science Foundation

Stato

Concluso

Categoria

Swiss National Science Foundation / Project Funding / Mathematics, Natural and Engineering Sciences (Division II)

Persone

Formazione

Ricerca

Organizzazione

Theory and Practice of Reinforcement Learning

Persone

Abstract

Informazioni aggiuntive

Indicazioni

Resta in contatto