基于深度强化学习的有轨电车信号优先控制

被引：16

作者：

王云鹏 ^{[1
]}

郭戈 ^{[2
,3
]}

机构：

[1] 大连理工大学控制科学与工程学院

[2] 东北大学流程工业综合自动化国家重点实验室

[3] 东北大学秦皇岛分校控制工程学院

来源：

自动化学报 | 2019年 / 45卷 / 12期

关键词：

有轨电车; 信号优先; 马尔科夫决策过程; 深度强化学习;

D O I：

10.16383/j.aas.c190164

中图分类号：

U482.1 [有轨电车]; TP18 [人工智能理论];

学科分类号：

080204 ; 082304 ; 081104 ; 0812 ; 0835 ; 1405 ;

摘要：

现有的有轨电车信号优先控制系统存在诸多问题,如无法适应实时交通变化、优化求解较为复杂等.本文提出了一种基于深度强化学习的有轨电车信号优先控制策略.不依赖于交叉口复杂交通建模,采用实时交通信息作为输入,在有轨电车整个通行过程中连续动态调整交通信号.协同考虑有轨电车与社会车辆的通行需求,在尽量保证有轨电车无需停车的同时,降低社会车辆的通行延误.采用深度Q网络算法进行问题求解,并利用竞争架构、双Q网络和加权样本池改善学习性能.基于SUMO的实验表明,该模型能够有效地协同提高有轨电车与社会车辆的通行效率.

引用

页码：2366 / 2377

页数：12

共 12 条

[1]

Feature-Based Aggregation and Deep Reinforcement Learning:A Survey and Some New Implementations[J]. Dimitri P.Bertsekas.IEEE/CAA Journal of Automatica Sinica. 2019(01)

[2]

深度Q学习的二次主动采样方法[J]. 赵英男,刘鹏,赵巍,唐降龙.自动化学报. 2019(10)

[3]

Traffic Signal Timing via Deep Reinforcement Learning[J]. Li Li,Yisheng Lv,Fei-Yue Wang.IEEE/CAA Journal of Automatica Sinica. 2016(03)

[4] 深度学习在控制领域的研究现状与展望 [J].

段艳杰 ;

吕宜生 ;

张杰 ;

赵学亮 ;

王飞跃 .

自动化学报, 2016, 42 (05) :643-654

[5] 基于强化学习算法的公交信号优先策略 [J].

舒波 ;

李大铭 ;

赵新良 .

东北大学学报(自然科学版), 2012, 33 (10) :1513-1516

[6] 强化学习研究综述 [J].

高阳 ;

陈世福 ;

陆鑫 .

自动化学报, 2004, (01) :86-100

[7]

Coordinated optimization of tram trajectories with arterial signal timing resynchronization[J] . Yuxiong Ji,Yu Tang,Yuchuan Du,Xi Zhang.Transportation Research Part C . 2019

[8]

Joint optimization of tram timetables and signal timing adjustments at intersections[J] . Jungang Shi,Yanshuo Sun,Paul Schonfeld,Jian Qi.Transportation Research Part C . 2017

[9]

Design of LRT Signal Priority to Improve Arterial Traffic Mobility[J] . Md Tazul Islam,Jatinder Tiwana,Arun Bhowmick,Tony Z. Qiu.Journal of Transportation Engineering . 2016

[10] Design of Reinforcement Learning Parameters for Seamless Application of Adaptive Traffic Signal Control [J].

El-Tantawy, Samah ;

Abdulhai, Baher ;

Abdelgawad, Hossam .

JOURNAL OF INTELLIGENT TRANSPORTATION SYSTEMS, 2014, 18 (03) :227-245

← 1 2 →