近日,上海交通大学海洋学院已毕业博士生马习文以第一作者在高水平期刊IEEE Transactions on Automation Science and Engineering上发表了题为“Multi-Player Pursuit-Evasion Game with Interaction Constraints: A Cooperative Game Theoretic Approach Based on Coalition Structure”的研究论文,杨劲松研究员和自动化与感知学院张卫东教授为通讯作者。合作者还有中国人民解放军空军工程大学吕茂隆副教授,北京科技大学段凯荣助理教授,上海交通大学谢威副教授。上海交通大学海洋学院为第一完成单位。
在海上监视、执法行动、军事防御等冲突激烈且依赖群体紧密协作的场景中,构建稳定的结构化联盟是提升团队协同能力的关键。传统研究中常用的最优控制、微分博弈等方法,多依赖固定、随机或预设的大规模组队模式,这些模式无法适应群体动态交互与联盟结构的实时变化,容易造成资源浪费。本文从 “社会力模型” 获得启发,提出了基于联盟结构的合作博弈新框架。通过互联网络拓扑下的耦合微分博弈整合多智能体互动,既能解决带障碍与联盟约束的多智能体追逃问题,也为集体智慧的研究提供了新思路。
图1. 具有联盟结构约束的群体追逃博弈流程示意图
本研究旨在解决群体多目标的追逃博弈问题,从合作与竞争角度引入联盟结构约束,通过社交互动网络按个体偏好组建优先通信联盟,构建多连接拓扑和决策空间。融合运动学约束与社会力模型,建立了具备自主避障能力的N人可变和微分博弈模型。理论上证明了收益分配唯一性、联盟结构稳定性及博弈向纳什均衡的收敛性,仿真与实验验证了方法的有效性。
图2. 追捕者与其匹配逃逸者之间的距离
图3. 追捕者在避免碰撞的同时协作追捕逃逸者
本研究创新性地将合作博弈理论与非合作博弈理论整合到群体追逃博弈中。合作博弈理论在联盟间建立了稳健的通信架构,用于处理联盟动态变化并促进高优先级联盟的形成;非合作博弈理论则优化追逃者匹配策略,通过平衡个体利益与联盟目标来建模复杂的博弈过程。
图4. Crazyflie 2.1 无人机的硬件组件
图5. 实验装置的框架和概念图
本研究得到了国家重点研发计划项目(2022ZD0119900),国家自然科学基金项目(U2141234、42227901),上海市科技计划项目(22015810300和19510745200),浙江省自然科学基金(LR21D060002, LGF21D060002),海南省科技专项基金项目(ZDYF2024GXJS003),上海交通大学深蓝计划(SL2021ZD203),南方海洋科学与工程广东省实验室创新团队项目(311021004)的资助。
论文链接:
https://ieeexplore.ieee.org/document/11045714
供稿 | 杨劲松课题组
编辑 | 谢安琪
这里“阅读原文”,查看论文