未知动态环境中基于分层强化学习的移动机器人路径规划

被引：15

作者：

沈晶

顾国昌

刘海波

机构：

[1] 哈尔滨工程大学计算机科学与技术学院

来源：

机器人 | 2006年 / 05期

关键词：

移动机器人; 未知动态环境; 路径规划; 分层强化学习;

D O I：

10.13973/j.cnki.robot.2006.05.017

中图分类号：

TP242 [机器人];

学科分类号：

1111 ;

摘要：

提出了一种基于分层强化学习的移动机器人路径规划算法.该算法利用强化学习方法的无环境模型学习能力以及分层强化学习方法的局部策略更新能力,克服了路径规划方法对全局环境的静态信息或动态障碍物的运动信息的依赖性.仿真实验结果表明了算法的可行性,尽管在规划速度上没有明显的优势,但其应对未知动态环境的学习能力是现有其它方法无法比拟的.

引用

收藏

页码：544 / 547+552 +552

页数：5

相关论文

共 13 条

[1] 动态复杂环境下的机器人路径规划蚂蚁预测算法 [J].

朱庆保 .

计算机学报, 2005, (11) :142-150

[2] 动态环境下基于改进人工势场法的机器人运动规划 [J].

覃柯 ;

孙茂相 ;

孙昌志 .

沈阳工业大学学报, 2004, (05) :568-571+582

[3] 动态环境中基于遗传算法的移动机器人路径规划的方法 [J].

刘国栋 ;

谢宏斌 ;

李春光 .

机器人, 2003, (04) :327-330+343

[4] 动态环境中的移动机器人避碰规划研究 [J].

徐潼 ;

唐振民 .

机器人, 2003, (02) :117-122+139

[5] 动态环境中基于模糊神经网络的机器人路径规划的一种新方法 [J].

谢宏斌 ;

刘国栋 ;

李春光 .

江南大学学报, 2003, (01) :20-23+27

[6] 一种动态环境下移动机器人的路径规划方法 [J].

朴松昊 ;

洪炳熔 .

机器人, 2003, (01) :18-21+43

[7] 一类动态不确定环境下机器人的滚动路径规划 [J].

席裕庚 ;

张纯刚 .

自动化学报, 2002, (02) :161-175

[8] 全局环境未知时基于滚动窗口的机器人路径规划 [J].

张纯刚 ;

席裕庚 .

中国科学E辑:技术科学, 2001, (01) :51-58

[9] Q-学习及其在智能机器人局部路径规划中的应用研究 [J].

张汝波 ;

杨广铭 ;

顾国昌 ;

张国印 .

计算机研究与发展, 1999, (12) :1430-1436

[10]

强化学习理论及应用[M]. 哈尔滨工程大学出版社 , 张汝波编著, 2001