原创基于强化学习的机器人自适应路径规划方法

 2010-6-15 10:34  3164 9 9 分类: MCU/ 嵌入式

基于强化学习的机器人自适应路径规划方法

北京理工大学机器人研究中心童亮龚建伟熊光明陆际联高峻尧等

Robotics Research Center, Beijing Institute of Technology.

L. Tong, J.W. Gong, G.M. Xiong, J.L. Lu

转载此文请署名作者并标明来自龚建伟技术主页 http://www.gjwtech.com

此文工作已在学术期刊上正式发表

路径规划是智能机器人关键问题之一，它包括全局路径规划和局部路径规划，局部路径规划是路径规划的难点。当环境复杂时，很难得到好的路径规划结果，特别是动态环境中，传统的方法解决起来比较困难。在这种情形下，强化学习被认为是获取未知环境下自主机器人控制策略的比较合适的方法，这里将强化学习方法用于机器人学习控制，以实现在复杂动态环境下的机器人自适应路径规划。

本文提出了一种机器人基于强化学习在动态环境中的路径规划方法，通过利用改进的值函数逼近网络CMAC，使得系统具有在连续状态中在线学习的特点，因此使决策系统具有自适应性。通过自适应的学习，机器人控制器建立起了环境状态到控制输出的直接映射，可以使机器人在动态未知的环境中有效避开障物并以最短路径到达目标位置。从仿真的结果来看，具有很好的适应性，路径规划算法的设计相对来说也比较简单，同时具有较好的实时性能，是解决动态环境中路径规划问题的一种可行方法。

1 路径规划问题 1
2 常用机器人路径规划方法 2
2.1传统路径规划方法 2
2.2智能路径规划方法 5
3 动态环境的机器人自适应路径规划 7
3.1改进CMAC网络的Q-Learning系统 8
3.2路径规划控制总体模型设计 9
3.2学习系统的环境感知及行为模型 10
3.3强化函数的设定 11
4 系统学习结果及讨论 12
5小结 14
　

本文全文为PDF文档，需要带中文字库的Adobe Reader（5.0以上版本）

写原创有奖励！2025面包板原创奖励正在进行中