Uma Abordagem de Aprendizado online para o Seguimento de Trajetórias usando Robôs não Holonômicos

Mateus Sousa Franco,S´´érgio R. Barros dos Santos,Fábio Augusto Faria

Uma Abordagem de Aprendizado online para o Seguimento de Trajetórias usando Robôs não Holonômicos

2020

Este artigo investiga a aplicacao de um metodo de Aprendizado por Reforco (RL) para derivar as leis de controle de robos nao holonomico, considerando o acoplamento e a nao linearidade do sistema. Os controladores sao derivados on-line atraves da interacao entre o agente real e o ambiente desconhecido, usando uma abordagem baseada no algoritmo Q-Learning, que visa descobrir qual a melhor acao a ser tomada pelo agente, de modo a maximizar as recompensas recebidas em cada tentativa de execucao do seguimento da trajetoria desejada. Resultados experimentais mostraram que os controladores aprendidos sao capazes de realizar o seguimento de diferentes trajetorias, de forma eficiente, levando em conta a variacao das velocidades de translacao e de rotacao do robo e a maximizacao do valor das recompensas ao longo das iteracoes, conforme apresentado nos estudos de caso.

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations