共 3 条
进化强化学习及其在机器人路径跟踪中的应用
被引:6
作者:
段勇
[1
]
崔宝侠
[1
]
徐心和
[2
]
机构:
[1] 沈阳工业大学信息科学与工程学院
[2] 东北大学信息科学与工程学院
来源:
关键词:
强化学习;
自适应启发评价;
遗传算法;
路径跟踪;
D O I:
10.13195/j.cd.2009.04.54.duany.013
中图分类号:
TP242 [机器人];
学科分类号:
1111 ;
摘要:
研究了一种基于自适应启发评价(AHC)强化学习的移动机器人路径跟踪控制方法.AHC的评价单元(ACE)采用多层前向神经网络来实现,将TD(λ)算法和梯度下降法相结合来更新神经网络的权值.AHC的动作选择单元(ASE)由遗传算法优化的模糊推理系统(FIS)构成.ACE网络的输出构成二次强化信号,用于指导ASE的学习.最后将所提出的算法应用于移动机器人的行为学习,较好地解决了机器人的复杂路径跟踪问题.
引用
收藏
页码:532 / 536+541
+541
页数:6
相关论文