基于深度强化学习的有轨电车信号优先控制

被引:16
作者
王云鹏 [1 ]
郭戈 [2 ,3 ]
机构
[1] 大连理工大学控制科学与工程学院
[2] 东北大学流程工业综合自动化国家重点实验室
[3] 东北大学秦皇岛分校控制工程学院
关键词
有轨电车; 信号优先; 马尔科夫决策过程; 深度强化学习;
D O I
10.16383/j.aas.c190164
中图分类号
U482.1 [有轨电车]; TP18 [人工智能理论];
学科分类号
080204 ; 082304 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
现有的有轨电车信号优先控制系统存在诸多问题,如无法适应实时交通变化、优化求解较为复杂等.本文提出了一种基于深度强化学习的有轨电车信号优先控制策略.不依赖于交叉口复杂交通建模,采用实时交通信息作为输入,在有轨电车整个通行过程中连续动态调整交通信号.协同考虑有轨电车与社会车辆的通行需求,在尽量保证有轨电车无需停车的同时,降低社会车辆的通行延误.采用深度Q网络算法进行问题求解,并利用竞争架构、双Q网络和加权样本池改善学习性能.基于SUMO的实验表明,该模型能够有效地协同提高有轨电车与社会车辆的通行效率.
引用
收藏
页码:2366 / 2377
页数:12
相关论文
共 12 条
[1]  
Feature-Based Aggregation and Deep Reinforcement Learning:A Survey and Some New Implementations[J]. Dimitri P.Bertsekas.IEEE/CAA Journal of Automatica Sinica. 2019(01)
[2]  
深度Q学习的二次主动采样方法[J]. 赵英男,刘鹏,赵巍,唐降龙.自动化学报. 2019(10)
[3]  
Traffic Signal Timing via Deep Reinforcement Learning[J]. Li Li,Yisheng Lv,Fei-Yue Wang.IEEE/CAA Journal of Automatica Sinica. 2016(03)
[4]   深度学习在控制领域的研究现状与展望 [J].
段艳杰 ;
吕宜生 ;
张杰 ;
赵学亮 ;
王飞跃 .
自动化学报, 2016, 42 (05) :643-654
[5]   基于强化学习算法的公交信号优先策略 [J].
舒波 ;
李大铭 ;
赵新良 .
东北大学学报(自然科学版), 2012, 33 (10) :1513-1516
[6]   强化学习研究综述 [J].
高阳 ;
陈世福 ;
陆鑫 .
自动化学报, 2004, (01) :86-100
[7]  
Coordinated optimization of tram trajectories with arterial signal timing resynchronization[J] . Yuxiong Ji,Yu Tang,Yuchuan Du,Xi Zhang.Transportation Research Part C . 2019
[8]  
Joint optimization of tram timetables and signal timing adjustments at intersections[J] . Jungang Shi,Yanshuo Sun,Paul Schonfeld,Jian Qi.Transportation Research Part C . 2017
[9]  
Design of LRT Signal Priority to Improve Arterial Traffic Mobility[J] . Md Tazul Islam,Jatinder Tiwana,Arun Bhowmick,Tony Z. Qiu.Journal of Transportation Engineering . 2016
[10]   Design of Reinforcement Learning Parameters for Seamless Application of Adaptive Traffic Signal Control [J].
El-Tantawy, Samah ;
Abdulhai, Baher ;
Abdelgawad, Hossam .
JOURNAL OF INTELLIGENT TRANSPORTATION SYSTEMS, 2014, 18 (03) :227-245