Apprentissage par renforcement dans les processus de décision Markoviens factorisés

Thomas Degris

Apprentissage par renforcement dans les processus de décision Markoviens factorisés

2007

Thomas Degris

Les methodes classiques d'apprentissage par renforcement ne sont pas applicables aux problemes de grande taille. Les Processus de Decision Markovien Factorises (FMDPs) permettent de representer de tels problemes de facon compacte en specifiant leur structure. Des methodes de planification adaptees aux FMDPs obtiennent de bons resultats mais necessitent que cette structure soit specifiee manuellement. Cette these etudie l'apprentissage de la structure d'un probleme represente par un FMDP en utilisant l'induction d'arbres de decision et propose une adaptation des methodes de planification dans les FMDPs pour obtenir une solution efficace au probleme. Nous etudions cette approche sur plusieurs problemes de grande taille et montrons qu'elle possede des capacites de generalisation et d'agregation necessaires pour la resolution de tels problemes. En l'appliquant a un probleme de jeu video, nous montrons egalement que les representations construites sont lisibles par un operateur humain.

Keywords:

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations