面向多机器人系统的增强学习研究进展综述

被引:20
作者
吴军
徐昕
王健
贺汉根
机构
[1] 国防科技大学机电工程与自动化学院
基金
湖南省自然科学基金;
关键词
多机器人系统; 多智能体; 增强学习; 随机对策; 马氏决策过程;
D O I
10.13195/j.cd.2011.11.4.wuj.014
中图分类号
TP242 [机器人];
学科分类号
1111 ;
摘要
基于增强学习的多机器人系统优化控制是近年来机器人学与分布式人工智能的前沿研究领域.多机器人系统具有分布、异构和高维连续空间等特性,使得面向多机器人系统的增强学习的研究面临着一系列挑战,为此,对其相关理论和算法的研究进展进行了系统综述.首先,阐述了多机器人增强学习的基本理论模型和优化目标;然后,在对已有学习算法进行对比分析的基础上,重点探讨了多机器人增强学习理论与应用研究中的困难和求解思路,给出了若干典型问题和应用实例;最后,对相关研究进行了总结和展望.
引用
收藏
页码:1601 / 1610+1615 +1615
页数:11
相关论文
共 26 条
[1]   多智能体强化学习在足球机器人中的研究与应用 [J].
刘春阳 ;
谭应清 ;
柳长安 ;
马莹巍 .
电子学报, 2010, 38 (08) :1958-1962
[2]   一种基于案例推理的多agent强化学习方法研究 [J].
李珺 ;
潘启树 ;
洪炳镕 .
机器人, 2009, 31 (04) :320-326
[3]   多智能体强化学习及其在足球机器人角色分配中的应用 [J].
段勇 ;
崔宝侠 ;
徐心和 .
控制理论与应用, 2009, 26 (04) :371-376
[4]   进化强化学习及其在机器人路径跟踪中的应用 [J].
段勇 ;
崔宝侠 ;
徐心和 .
控制与决策, 2009, 24 (04) :532-536+541
[5]   强化学习中的迁移:方法和进展 [J].
王皓 ;
高阳 ;
陈兴国 .
电子学报, 2008, 36(S1) (S1) :39-43
[6]   强化学习在足球机器人基本动作学习中的应用 [J].
段勇 ;
杨淮清 ;
崔宝侠 ;
徐心和 .
机器人, 2008, (05) :453-459
[7]   基于强化学习的多机器人编队导航 [J].
赵杰 ;
姜健 ;
臧希喆 .
辽宁工程技术大学学报, 2007, (06) :915-918
[8]   一种新的多智能体Q学习算法 [J].
郭锐 ;
吴敏 ;
彭军 ;
彭姣 ;
曹卫华 .
自动化学报, 2007, (04) :367-372
[9]   一种新颖的多agent强化学习方法 [J].
周浦城 ;
洪炳镕 ;
黄庆成 .
电子学报, 2006, (08) :1488-1491
[10]   基于强化学习算法的多机器人系统的冲突消解策略 [J].
任燚 ;
陈宗海 .
控制与决策 , 2006, (04) :430-434+439