进化强化学习及其在机器人路径跟踪中的应用

被引:6
作者
段勇 [1 ]
崔宝侠 [1 ]
徐心和 [2 ]
机构
[1] 沈阳工业大学信息科学与工程学院
[2] 东北大学信息科学与工程学院
关键词
强化学习; 自适应启发评价; 遗传算法; 路径跟踪;
D O I
10.13195/j.cd.2009.04.54.duany.013
中图分类号
TP242 [机器人];
学科分类号
1111 ;
摘要
研究了一种基于自适应启发评价(AHC)强化学习的移动机器人路径跟踪控制方法.AHC的评价单元(ACE)采用多层前向神经网络来实现,将TD(λ)算法和梯度下降法相结合来更新神经网络的权值.AHC的动作选择单元(ASE)由遗传算法优化的模糊推理系统(FIS)构成.ACE网络的输出构成二次强化信号,用于指导ASE的学习.最后将所提出的算法应用于移动机器人的行为学习,较好地解决了机器人的复杂路径跟踪问题.
引用
收藏
页码:532 / 536+541 +541
页数:6
相关论文
共 3 条
[1]   全方位移动机器人鲁棒控制 [J].
许巍丽 ;
孙茂相 .
沈阳工业大学学报, 2007, (03) :312-316+343
[2]   动态环境下自主移动机器人的导航复杂性 [J].
石鸿雁 ;
孙昌志 ;
陈冬阳 ;
安跃军 .
沈阳工业大学学报, 2006, (05) :534-537+552
[3]   A smooth path tracking algorithm for wheeled mobile robots with dynamic constraints [J].
Koh, KC ;
Cho, HS .
JOURNAL OF INTELLIGENT & ROBOTIC SYSTEMS, 1999, 24 (04) :367-385