Q-学习及其在智能机器人局部路径规划中的应用研究

被引:17
作者
张汝波
杨广铭
顾国昌
张国印
机构
[1] 哈尔滨工程大学计算机系!哈尔滨,哈尔滨工程大学计算机系!哈尔滨,哈尔滨工程大学计算机系!哈尔滨,哈尔滨工程大学计算机系!哈尔滨
关键词
Q-学习; 神经网络; 智能机器人; 局部路径规划;
D O I
暂无
中图分类号
TP242.6 [智能机器人];
学科分类号
081104 ;
摘要
强化学习一词来自于行为心理学,这门学科把行为学习看成反复试验的过程,从而把环境状态映射成相应的动作.在设计智能机器人过程中,如何来实现行为主义的思想、在与环境的交互中学习行为动作? 文中把机器人在未知环境中为躲避障碍所采取的动作看作一种行为,采用强化学习方法来实现智能机器人避碰行为学习.Q-学习算法是类似于动态规划的一种强化学习方法,文中在介绍了Q-学习的基本算法之后,提出了具有竞争思想和自组织机制的Q-学习神经网络学习算法;然后研究了该算法在智能机器人局部路径规划中的应用,在文中的最后给出了详细的仿真结果
引用
收藏
页码:1430 / 1436
页数:7
相关论文
共 2 条
[1]  
Simple Statistical Gradient-Following Algorithms for Connectionist Reinforcement Learning[J] . Ronald J. Williams.Machine Learning . 1992 (3)
[2]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)