基于强化学习的机器人自适应路径规划方法 |
|
北京理工大学机器人研究中心 童亮 龚建伟 熊光明 陆际联 高峻尧等 Robotics Research Center, Beijing Institute of Technology. L. Tong, J.W. Gong, G.M. Xiong, J.L. Lu 转载此文请署名作者 并标明来自龚建伟技术主页 http://www.gjwtech.com 此文工作已在学术期刊上正式发表
|
路径规划是智能机器人关键问题之一,它包括全局路径规划和局部路径规划,局部路径规划是路径规划的难点。当环境复杂时,很难得到好的路径规划结果,特别是动态环境中,传统的方法解决起来比较困难。在这种情形下,强化学习被认为是获取未知环境下自主机器人控制策略的比较合适的方法,这里将强化学习方法用于机器人学习控制,以实现在复杂动态环境下的机器人自适应路径规划。 本文提出了一种机器人基于强化学习在动态环境中的路径规划方法,通过利用改进的值函数逼近网络CMAC,使得系统具有在连续状态中在线学习的特点,因此使决策系统具有自适应性。通过自适应的学习,机器人控制器建立起了环境状态到控制输出的直接映射,可以使机器人在动态未知的环境中有效避开障物并以最短路径到达目标位置。从仿真的结果来看,具有很好的适应性,路径规划算法的设计相对来说也比较简单,同时具有较好的实时性能,是解决动态环境中路径规划问题的一种可行方法。
1 路径规划问题 1 本文全文为PDF文档,需要带中文字库的Adobe Reader(5.0以上版本) |
文章评论(0条评论)
登录后参与讨论