多智能体强化学习在城市交通网络信号控制方法中的应用综述

被引：29

作者：

杨文臣 ^{[1
,2
]}

张轮 ^{[2
]}

Zhu Feng ^{[3
]}

机构：

[1] 云南省交通规划设计研究院陆地交通气象灾害防治技术国家工程实验室

[2] 同济大学道路与交通工程教育部重点实验室

[3] 南洋理工大学土木与环境工程学院

来源：

计算机应用研究 | 2018年 / 35卷 / 06期

关键词：

智能交通; 交通控制; 多智能体强化学习; 闭环反馈; 联动协调; 数据驱动;

D O I：

暂无

中图分类号：

TP273 [自动控制、自动控制系统]; U491.51 [];

学科分类号：

080201 ; 0835 ; 082302 ; 082303 ;

摘要：

交通信号控制系统在物理位置和控制逻辑上分散于动态变化的网络交通环境,将每个路口的交通信号控制器看做一个异质的智能体,非常适合采用无模型、自学习、数据驱动的多智能体强化学习(MARL)方法建模与描述。为了研究该方法的现状、存在问题及发展前景,系统跟踪了多智能体强化学习在国内外交通控制领域的具体应用,包括交通信号MARL控制概念模型、完全孤立的多智能体强化学习(MARL)的控制、部分状态合作的多智能体强化学习控制和动作联动的多智能体强化学习(MARL)控制,分析其技术特征和代际差异,讨论了多智体强化学习方法在交通信号控制中的研究动向,提出了发展网络交通信号多智能体强化学习集成控制的关键问题在于强化学习控制机理、联动协调性、交通状态特征抽取和多模式整合控制。

引用

页码：1613 / 1618

页数：6

共 20 条

[1]

面向城市自适应交通信号控制的强化学习方法研究.[D].夏新海.华南理工大学.2013, 05

[2]

A junction-tree based learning algorithm to optimize network wide traffic control: A coordinated multi-agent framework.[J].Feng Zhu;H.M. Abdul Aziz;Xinwu Qian;Satish V. Ukkusuri.Transportation Research Part C.2015,

[3]

Adaptive Group-based Signal Control by Reinforcement Learning.[J].Junchen Jin;Xiaoliang Ma.Transportation Research Procedia.2015,

[4]

Using high-resolution event-based data for traffic modeling and control: An overview.[J].Xinkai Wu;Henry X. Liu.Transportation Research Part C.2014,

[5] Hierarchical control of traffic signals using Q-learning with tile coding [J].

Abdoos, Monireh ;

Mozayani, Nasser ;

Bazzan, Ana L. C. .

APPLIED INTELLIGENCE, 2014, 40 (02) :201-213

[6]

Adaptive multi-objective reinforcement learning with hybrid exploration for traffic signal control based on cooperative multi-agent framework.[J].Mohamed A. Khamis;Walid Gomaa.Engineering Applications of Artificial Intelligence.2014,

[7] Distributed learning and multi-objectivity in traffic light control [J].

Brys, Tim ;

Pham, Tong T. ;

Taylor, Matthew E. .

CONNECTION SCIENCE, 2014, 26 (01) :65-83

[8] The evolution of urban traffic control: changing policy and technology [J].

Hamilton, Andrew ;

Waterson, Ben ;

Cherrett, Tom ;

Robinson, Andrew ;

Snell, Ian .

TRANSPORTATION PLANNING AND TECHNOLOGY, 2013, 36 (01) :24-43

[9] Towards multi-agent reinforcement learning for integrated network of optimal traffic controllers (MARLIN-OTC) [J].

El-Tantawy, Samah ;

Abdulhai, Baher .

TRANSPORTATION LETTERS-THE INTERNATIONAL JOURNAL OF TRANSPORTATION RESEARCH, 2010, 2 (02) :89-110

[10]

Learning in groups of traffic signals.[J].Ana L.C. Bazzan;Denise de Oliveira;Bruno C. da Silva.Engineering Applications of Artificial Intelligence.2009, 4

← 1 2 →