进化博弈中多代理人强化学习模型

被引:23
作者
刘伟兵 [1 ]
王先甲 [2 ,3 ]
机构
[1] 武汉大学政治与公共管理学院
[2] 武汉大学经济与管理学院
[3] 武汉科技大学冶金工业过程系统科学实验室
关键词
博弈论; 进化博弈; 强化学习; Q-学习;
D O I
暂无
中图分类号
F224.32 [博弈论];
学科分类号
1201 ;
摘要
将强化学习引入到进化博弈中,建立了进化博弈中的多代理人强化学习模型,并基于Q-学习给出了算法流程,仿真算例的结果表明多代理人强化学习模型能使得博弈人不断学习、寻求最优策略.
引用
收藏
页码:28 / 33
页数:6
相关论文
共 4 条
[1]   Another approach to mutation and learning in games [J].
Amir, M ;
Berninghaus, SK .
GAMES AND ECONOMIC BEHAVIOR, 1996, 14 (01) :19-43
[2]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
[3]  
Emergence of cooperation and evoluti -onary stability in finite populations. Nowak M.A,Sasaki A,Taylor C. et al. Nature . 2004
[4]  
Ants Can Play Prisoner’’’’s Dilemma. Thlol Y,Acan A. 2003IEEE International Conference on Systems.Man and Cybernetics . 2003