Uma Abordagem de Aprendizado online para o Seguimento de Trajetórias usando Robôs não Holonômicos
2020
Este artigo investiga a aplicacao de um metodo de Aprendizado por Reforco (RL) para derivar as leis de controle de robos nao holonomico, considerando o acoplamento e a nao linearidade do sistema. Os controladores sao derivados on-line atraves da interacao entre o agente real e o ambiente desconhecido, usando uma abordagem baseada no algoritmo Q-Learning, que visa descobrir qual a melhor acao a ser tomada pelo agente, de modo a maximizar as recompensas recebidas em cada tentativa de execucao do seguimento da trajetoria desejada. Resultados experimentais mostraram que os controladores aprendidos sao capazes de realizar o seguimento de diferentes trajetorias, de forma eficiente, levando em conta a variacao das velocidades de translacao e de rotacao do robo e a maximizacao do valor das recompensas ao longo das iteracoes, conforme apresentado nos estudos de caso.
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI