Uma Abordagem de Aprendizado online para o Seguimento de Trajetórias usando Robôs não Holonômicos

2020 
Este artigo investiga a aplicacao de um metodo de Aprendizado por Reforco (RL) para derivar as leis de controle de robos nao holonomico, considerando o acoplamento e a nao linearidade do sistema. Os controladores sao derivados on-line atraves da interacao entre o agente real e o ambiente desconhecido, usando uma abordagem baseada no algoritmo Q-Learning, que visa descobrir qual a melhor acao a ser tomada pelo agente, de modo a maximizar as recompensas recebidas em cada tentativa de execucao do seguimento da trajetoria desejada. Resultados experimentais mostraram que os controladores aprendidos sao capazes de realizar o seguimento de diferentes trajetorias, de forma eficiente, levando em conta a variacao das velocidades de translacao e de rotacao do robo e a maximizacao do valor das recompensas ao longo das iteracoes, conforme apresentado nos estudos de caso.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []