基于RPkNN-Sarsa(λ)强化学习的机器人路径规划方法
2013
基于kNN-Sarsa(λ)强化学习的机器人路径规划方法虽然收敛速度快,但该算法容易陷入局部最优值,且未考虑环境信息的不完全可观测性。为此,设计了一种随机扰动(random perturbation)kNN-Sarsa(λ)强化学习算法,利用Bayesian规则对传感器探测信息的不确定性进行了处理,建立了基于栅格地图的仿真环境模型。仿真实验结果表明,该方法不仅收敛性好,能有效缓解kNN-Sarsa(λ)算法易陷入局部最优的现象,且在传感器探测信息不确定的情况下仍能搜索到最优路径。
Keywords:
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI