基于RPkNN-Sarsa（λ）强化学习的机器人路径规划方法

wangjunhong,Hong Jiang,Yuqing Huang,wuxiaoli

基于RPkNN-Sarsa（λ）强化学习的机器人路径规划方法

2013

wangjunhong
Hong Jiang
Yuqing Huang
wuxiaoli

基于kNN-Sarsa（λ）强化学习的机器人路径规划方法虽然收敛速度快,但该算法容易陷入局部最优值,且未考虑环境信息的不完全可观测性。为此,设计了一种随机扰动（random perturbation）kNN-Sarsa（λ）强化学习算法,利用Bayesian规则对传感器探测信息的不确定性进行了处理,建立了基于栅格地图的仿真环境模型。仿真实验结果表明,该方法不仅收敛性好,能有效缓解kNN-Sarsa（λ）算法易陷入局部最优的现象,且在传感器探测信息不确定的情况下仍能搜索到最优路径。

Keywords:

Mathematical analysis
Mathematics

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations