Q-学习及其在智能机器人局部路径规划中的应用研究

被引：17

作者：

张汝波

杨广铭

顾国昌

张国印

机构：

[1] 哈尔滨工程大学计算机系!哈尔滨,哈尔滨工程大学计算机系!哈尔滨,哈尔滨工程大学计算机系!哈尔滨,哈尔滨工程大学计算机系!哈尔滨

来源：

计算机研究与发展 | 1999年 / 12期

关键词：

Q-学习; 神经网络; 智能机器人; 局部路径规划;

D O I：

暂无

中图分类号：

TP242.6 [智能机器人];

学科分类号：

081104 ;

摘要：

强化学习一词来自于行为心理学，这门学科把行为学习看成反复试验的过程，从而把环境状态映射成相应的动作．在设计智能机器人过程中，如何来实现行为主义的思想、在与环境的交互中学习行为动作？文中把机器人在未知环境中为躲避障碍所采取的动作看作一种行为，采用强化学习方法来实现智能机器人避碰行为学习．Ｑ－学习算法是类似于动态规划的一种强化学习方法，文中在介绍了Ｑ－学习的基本算法之后，提出了具有竞争思想和自组织机制的Ｑ－学习神经网络学习算法；然后研究了该算法在智能机器人局部路径规划中的应用，在文中的最后给出了详细的仿真结果

引用

页码：1430 / 1436

页数：7