• CN:11-2187/TH
  • ISSN:0577-6686

机械工程学报 ›› 2024, Vol. 60 ›› Issue (10): 86-101.doi: 10.3901/JME.2024.10.086

• 智能感知与行为预测 • 上一篇    下一篇

扫码分享

基于博弈论的右转无信号交叉口行人行为模拟

李文礼1,2, 张祎楠1, 石晓辉1, 王梦昕1   

  1. 1. 重庆理工大学汽车零部件先进制造技术教育部重点实验室 重庆 400054;
    2. 重庆长安汽车股份有限公司 重庆 400020
  • 收稿日期:2023-05-30 修回日期:2024-01-20 出版日期:2024-05-20 发布日期:2024-07-24
  • 作者简介:李文礼(通信作者),男,1983年出生,博士,副教授,硕士研究生导师。主要研究方向为智能交通模拟、智能汽车测试理论与方法、汽车安全测试与仿真。
    E-mail:liwenli@cqut.edu.cn
    张祎楠,男,1999年出生。主要研究方向为行人-车辆交互机理与行为轨迹模拟。
    E-mail:zhangyinan@stu.cqut.edu.cn
    石晓辉,男,1963年出生,博士,教授,博士研究生导师。主要研究方向为汽车摩托车试验检测技术及装备、汽车传动系统动态模拟试验技术、虚拟试验技术。
    E-mail:shixiaohui@cqut.edu.cn
    王梦昕,女,1999年出生。主要研究方向为智能网联汽车与行人行为。
    E-mail:51220402113@stu.cqut.edu.cn
  • 基金资助:
    重庆市自然科学基金(cstc2021jcyj-msxmX0183)、重庆市留学人员回国创业创新支持计划(CX2021070)、重庆市教委科学技术研究(KJQN202201170)和重庆市技术创新与应用发展专项重大(CSTB2022TIAD-STX0003)资助项目。

Game Theory-based Simulation of Pedestrian Behavior at Right-turn Unsignalized Intersections

LI Wenli1,2, ZHANG Yinan1, SHI Xiaohui1, WANG Mengxin1   

  1. 1. Key Laboratory of Advanced Manufacturing Technology for Automobile Parts, Ministry of Education, Chongqing University of Technology, Chongqing 400054;
    2. Chongqing Changan Automobile Co., Ltd., Chongqing 400020
  • Received:2023-05-30 Revised:2024-01-20 Online:2024-05-20 Published:2024-07-24

摘要: 为逼真模拟行人-车辆交互的真实交通场景,融合博弈理论和数据驱动的思想,在逆强化学习和博弈论的基础上提出博弈—深度最大熵逆强化学习算法(Game-deep max entropy inverse reinforcement learning,G-DMIRL)。将行人建模为智能体,通过真实的行人-车辆交互轨迹获取不同博弈决策下的行人的奖励函数,并推断行人-车辆交互的博弈机制,利用获取的奖励函数和动作策略开发出行人行为模拟模型。仿真结果表明,开发的模型在有限状态下能够准确地模拟出不同决策下行人的行为动作,建立的行人-车辆交通场景能够为自动驾驶汽车的识别、预测与路径规划算法的开发验证提供支撑。

关键词: 逆强化学习, 强化学习, 行人-车辆交互, 博弈论, 右转交叉口

Abstract: In order to realistically simulate the real traffic scene of pedestrian-vehicle interaction, this study integrates game theory and data-driven ideas, and proposes a game-deep maximum entropy inverse reinforcement learning algorithm(G-DMIRL), modeling pedestrians as intelligent bodies, obtaining the reward functions of pedestrians under different game decisions through real pedestrian-vehicle interaction trajectories, and inferring the game mechanism of pedestrian-vehicle interaction, and developing a simulation model of pedestrian behavior by using the obtained reward functions and action strategies. The simulation results show that the developed model can accurately simulate the behavioral actions of pedestrians under different decisions in a finite state, and the established pedestrian-vehicle traffic scenario can provide support for the development and validation of recognition, prediction and path planning algorithms for self-driving cars.

Key words: inverse reinforcement learning, reinforcement learning, human-vehicle interaction, game theory, right-turn intersection

中图分类号: