CN109460056B - 基于量子磷虾群演化机制的无人机集群作战博弈决策方法 - Google Patents
基于量子磷虾群演化机制的无人机集群作战博弈决策方法 Download PDFInfo
- Publication number
- CN109460056B CN109460056B CN201811310155.XA CN201811310155A CN109460056B CN 109460056 B CN109460056 B CN 109460056B CN 201811310155 A CN201811310155 A CN 201811310155A CN 109460056 B CN109460056 B CN 109460056B
- Authority
- CN
- China
- Prior art keywords
- quantum
- krill
- unmanned aerial
- aerial vehicle
- red
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
Abstract
本发明涉及一种基于量子磷虾群演化机制的无人机集群作战博弈决策方法,包括以下步骤:建立无人机协同作战博弈决策模型;初始化量子磷虾群;根据适应度函数计算量子磷虾群中每一只量子磷虾位置的适应度值;更新每只量子磷虾的量子旋转角和量子位置;对量子磷虾群中每只量子磷虾更新后的位置进行适应度计算,通过映射规则得到每只量子磷虾更新后的位置,计算位置的适应度;确定量子磷虾群的全局最优量子位置;循环判断;输出量子磷虾群的全局最优位置,映射为博弈的混合策略组合。本发明结合博弈论对无人机集群作战指挥决策进行分析,通过理性的决策分析使得作战双方都能得到最大的收益,更加符合无人机集群作战的战场环境,有更强的适用性。
Description
技术领域
本发明涉及一种无人机集群作战博弈决策方法,特别是一种基于量子磷虾群演化机制的无人机集群作战博弈决策方法,结合博弈论来进行无人机作战指挥决策分析,属于无人机自主控制领域。
背景技术
无人机集群作战是由多架具备部分自主能力的无人机共同执行战斗任务的过程,是未来空战的主要作战形式,合理的无人机任务分配是提高作战效率的重要手段。面对复杂的战场环境,无人机的任务分配成为决策方首要考虑的问题。
博弈论主要是研究智能体之间相互依存的理性行为,通过理性的决策得到最大化的收益或最小化的惩罚,这与无人机战场环境十分相似,无人机集群作战是对战双方的冲突型决策行为,利用博弈理论可以较好地进行作战指挥博弈分析,攻守双方决策者均需使用自己的策略达到利益最大化或者惩罚最小化,将传统方法中仅考虑作战的某一方发展为兼顾作战双方,使得决策更加贴近现实。
根据已有的技术文献发现,傅莉等在《兵工学报》(2012,Vol.33,No.10,pp.1210-1216)上发表的“无人战机近距空战微分对策建模研究”中对无人机攻击策略的研究主要体现在个体近距格斗研究中,对集群对抗研究少。罗德林等在《控制理论与应用》(2015,Vol.32,No.11,pp.1498-1504)上发表的“基于多agent系统的大规模无人机集群对抗”中将集群中的每一架无人机都视为一个独立agent,建立无人机运动模型,为无人机设计独立的个体行为集,针对每种行为给出决策方法,建立无人机集群对抗决策方法。但是主要集中在对无人机飞行控制技术的研究上,对战术指挥研究较少。
上述方法在解决无人机作战决策问题上虽然都能得到相应结果,但在作战双方的冲突型决策行为上,并没有完善的考虑。因此需要设计一种新的作战指挥决策方法,能够兼顾作战双方,更好地进行作战决策分析。
发明内容
针对上述现有技术,本发明要解决的技术问题是提供一种基于博弈论的基于量子磷虾群演化机制的无人机集群作战博弈决策方法,同时提出了一种量子磷虾群演化机制用来求解博弈过程中的纳什均衡解。
为解决上述技术问题,本发明一种基于量子磷虾群演化机制的无人机集群作战博弈决策方法,包括以下步骤:
步骤一:建立无人机协同作战博弈决策模型,具体为:
博弈双方分别记作红方和蓝方,其中红方拥有无人机Nr架,蓝方拥有无人机Nb架,双方的无人机均分为两种类型:攻击型和干扰型,红方拥有攻击型无人机Tr架,干扰型无人机Dr架,Nr=Tr+Dr,其中攻击型无人机分为两种:攻击对方的攻击型无人机和攻击对方的干扰型无人机,红方攻击对方的攻击型无人机有Ar1架,攻击对方的干扰型无人机有Ar2架,Tr=Ar1+Ar2;蓝方拥有攻击型无人机Tb架,干扰型无人机Db架,Nb=Tb+Db,蓝方攻击对方的攻击型无人机有Ab1架,攻击对方的干扰型无人机有Ab2架,Tb=Ab1+Ab2;
红方的策略集合为s=[s1,s2,…,sN],蓝方的策略集合为s′=[s′1,s′2,…,s′n],其中N和n分别为红方和蓝方的策略总数,红方的第i个策略si代表以i架攻击型无人机去攻击蓝方的攻击型无人机,以Tr-i架攻击型无人机攻击蓝方干扰型无人机,其中i=1,2,…,N,N=Tr+1;蓝方的第j个策略s′j代表以j架攻击型无人机去攻击红方的攻击型无人机,以Tb-j架攻击型无人机攻击红方干扰型无人机,其中j=1,2,…,n,n=Tb+1;
当红方采用第i个策略,蓝方采用第j个策略时红方收益表示为当红方采用第i个策略,蓝方采用第j个策略时蓝方收益表示为其中i=1,2,…,N,j=1,2,…,n;收益值利用效费比来表示,即歼敌与自损的比值,红方的歼敌表示为击落蓝方攻击型无人机给蓝方带来的损失与击落蓝方干扰型无人机给蓝方带来的损失的和,即红方击落蓝方攻击型无人机给蓝方带来的损失其中K为干扰衰减常数且大于1,红方击落蓝方干扰型无人机给蓝方带来的损失其中P0为攻击型无人机的毁伤概率,a为攻击型无人机被击落的损失,P1为干扰型无人机的毁伤概率,b为干扰型无人机被击落的损失;蓝方的歼敌表示为击落红方攻击型无人机给红方带来的损失与击落红方干扰型无人机给红方带来的损失的和,即蓝方击落红方攻击型无人机给红方带来的损失蓝方击落红方干扰型无人机给红方带来的损失红方的歼敌即是蓝方的自损,蓝方的歼敌即是红方的自损,即红方的收益函数为蓝方的收益函数为根据红方和蓝方不同的策略选择,将每种策略下的收益值排列成收益矩阵,红方的策略收益矩阵为蓝方的策略收益矩阵为
博弈中红方的策略集合为s=[s1,s2,…,sN],设在s上的混合策略为x=[x1,x2,…,xN],即红方以概率xi选择策略si,满足xi≥0且蓝方的策略集合为s′=[s′1,s′2,…,s′n],s′上的混合策略为x′=[x′1,x′2,…,x′n],即蓝方以概率x′j选择策略s′j,满足x′j≥0且则博弈的一个混合策略组合可以记为X=[x,x′];红方的期望收益为μr=x(Ur)N×nx′T,蓝方的期望收益为μb=x(Ub)N×nx′T,无人机集群博弈纳什均衡即找到一组混合策略组合X*=[x*,x′*]满足不等式其为无人机集群作战指挥决策博弈的纳什均衡点,代表红方策略收益矩阵(Ur)N×n第i行中的所有元素,代表蓝方策略收益矩阵(Ub)N×n第j列中的所有元素;目标函数可表示为求解纳什均衡点即找到一组混合策略组合X*使得目标函数J(X)达到最小值,即惩罚函数为其中函数当括号中两变量相等时返回0,不相等时返回1,则适应度函数可表示为f(X)=J(X)+p(X);
步骤二:初始化量子磷虾群,具体为:
令量子磷虾群的种群规模为M,问题的维数D=N+n,最大迭代次数为将第t代第i只量子磷虾的量子位置记为d=1,2,…,D,其对应的位置为其中i=1,2,…,M,用来对应一种潜在的混合策略,满足 其中d=1,2,…,D,第t代第i只量子磷虾邻居的诱导运动记为第i只量子磷虾的诱导方向其中第i只量子磷虾邻居的诱导方向为全局诱导方向为第i只量子磷虾的觅食速度觅食方向其中食物的诱导方向为历史最优量子个体诱导方向为第i只量子磷虾的随机扩散速度t为当前迭代次数,初始时令t=0;
步骤三:根据适应度函数计算量子磷虾群中每一只量子磷虾位置的适应度值,具体为:
适应度计算过程如下:按照映射规则将第i只量子磷虾的量子位置映射为位置其中利用适应度函数计算适应度值,其值同时代表其相应量子位置和位置的适应性;适应度值最小的量子磷虾的量子位置即为至今为止整个群体所找到的全局最优量子位置按照映射规则获得全局最优量子位置对应的全局最优位置为
步骤四:更新每只量子磷虾的量子旋转角和量子位置,具体为:
在量子磷虾群中,量子磷虾量子位置的更新是通过三种运动来进行的:诱导运动、觅食活动和随机扩散,三种行为的更新规则如下:
第i只量子磷虾的邻居对第i只量子磷虾的诱导运动表示为其中表示第i只量子磷虾受周围量子磷虾的诱导速度,Nmax是最大诱导速度,ωt为诱导权重,为第i只量子磷虾的诱导方向, 为第i只量子磷虾邻居的诱导方向,αt(g)为全局诱导方向, 为第j个邻居对第i只量子磷虾的影响力,Ki t为第i只量子磷虾位置的适应度值,Kj t为第i只量子磷虾第j个邻居的适应度值,和为量子磷虾群当前最差和最优适应度值,为第j个邻居对第i只量子磷虾量子位置的影响,其中i=1,2,…,M,j=1,2,…,M,且i≠j,ε是防止分母为零而设置的很小的正数,其中Ct为扰动变量,rand是均匀分布在[0,1]之间随机数,为全局最优量子位置的影响力,为当前全局最优量子位置对第i只量子磷虾量子位置的影响;
(2)觅食运动:
觅食速度vf为最大觅食速度,为觅食权重,为觅食方向,其中为食物的诱导方向,为历史最优量子位置的诱导方向,食物量子位置为 为动态变量,为食物影响力,为食物量子位置的适应度值,表示食物量子位置对第i只量子磷虾量子位置的影响力,其中,表示全局最优量子位置影响力,为当前全局最优量子位置对第i只量子磷虾量子位置的影响;
(3)随机扩散:
由以上三个运动速度分量共同更新量子磷虾的量子旋转角,第i只量子磷虾的量子旋转角第d维的更新公式为d=1,2,…,D,是第i只量子磷虾邻居对第i只量子磷虾的诱导运动的第d维,是对第i只量子磷虾觅食速度的第d维,是对第i只量子磷虾随机扩散速度的第d维,第i只量子磷虾量子位置的第d维更新公式为 是速度矢量的比例因子,其中为步长缩放因子,Ud为变量上界,Ld为变量的下界;
执行如下交叉操作:
步骤五:对量子磷虾群中每只量子磷虾更新后的位置进行适应度计算,通过映射规则得到每只量子磷虾更新后的位置,计算位置的适应度,具体为:
步骤六:确定量子磷虾群的全局最优量子位置:
步骤八:输出量子磷虾群的全局最优位置,映射为博弈的混合策略组合。
本发明有益效果:
与现有技术相比,本发明具有以下优点:
(1)本发明为无人机集群作战提供了可靠的决策分析,并设计新颖的量子磷虾群演化机制作为演进策略,所设计的方法具有收敛速度快,收敛精度高的优点,提高了原有磷虾群演化机制的性能。
(2)本发明结合博弈论对无人机集群作战指挥决策进行分析,通过理性的决策分析使得作战双方都能得到最大的收益,更加符合无人机集群作战的战场环境,有更强的适用性。
(3)仿真结果表明,本发明所提出的无人机集群作战指挥决策方法能够得到比粒子群优化(Particle Swarm Optimization,PSO)方法实现更合理的决策方案,从而证明了所设计的决策方法的有效性。
附图说明
图1为基于量子磷虾群演化机制的无人机集群作战决策博弈方法流程图;
图2为利用QKH、KH与PSO时无人机集群作战决策的适应度函数收敛曲线。
具体实施方式
下面结合附图和实施方式对本发明作进一步说明。将基于量子磷虾群演化机制的无人机集群作战决策博弈方法简记为QKH,将基于磷虾群演化机制的无人机集群作战决策博弈方法简记为KH,将基于粒子群算法的无人机集群作战决策博弈方法简记为PSO。
图1是基于量子磷虾群演化机制的无人机集群作战决策博弈方法流程图。本发明结合博弈论来对无人机作战决策进行分析,同时提出了一种量子磷虾群演化机制用来求解无人机作战决策博弈的混合策略纳什均衡解。
本发明解决问题所采用的方案步骤如下:
步骤一:建立无人机协同作战博弈决策模型。
博弈双方分别记作红方和蓝方,其中红方拥有无人机Nr架,蓝方拥有无人机Nb架。双方的无人机分为两种类型:攻击型和干扰型,红方拥有攻击型无人机Tr架,干扰型无人机Dr架,Nr=Tr+Dr,其中攻击型无人机又分为两种:攻击对方的攻击型无人机和攻击对方的干扰型无人机,红方攻击对方的攻击型无人机有Ar1架,攻击对方的干扰型无人机有Ar2架,Tr=Ar1+Ar2。蓝方拥有攻击型无人机Tb架,干扰型无人机Db架,Nb=Tb+Db,蓝方攻击对方的攻击型无人机有Ab1架,攻击对方的干扰型无人机有Ab2架,Tb=Ab1+Ab2。
红方的策略集合为s=[s1,s2,…,sN],蓝方的策略集合为s′=[s′1,s′2,…,s′n],其中N和n分别为红方和蓝方的策略总数,红方的第i个策略si代表以i架攻击型无人机去攻击蓝方的攻击型无人机,以Tr-i架攻击型无人机攻击蓝方干扰型无人机,其中i=1,2,…,N,N=Tr+1。蓝方的第j个策略s′j代表以j架攻击型无人机去攻击红方的攻击型无人机,以Tb-j架攻击型无人机攻击红方干扰型无人机,其中j=1,2,…,n,n=Tb+1。
当红方采用第i个决策,蓝方采用第j个决策时红方收益表示为当红方采用第i个决策,蓝方采用第j个决策时蓝方收益表示为其中i=1,2,…,N,j=1,2,…,n。收益利用效费比来表示,即歼敌与自损的比值。红方的歼敌表示为击落蓝方攻击型无人机给蓝方带来的损失与击落蓝方干扰型无人机给蓝方带来的损失的和,即红方击落蓝方攻击型无人机给蓝方带来的损失其中K为干扰衰减常数,通常大于1,红方击落蓝方干扰型无人机给蓝方带来的损失其中P0为攻击型无人机的毁伤概率,a为攻击型无人机被击落的损失,P1为干扰型无人机的毁伤概率,b为干扰型无人机被击落的损失。蓝方的歼敌表示为击落红方攻击型无人机给红方带来的损失与击落红方干扰型无人机给红方带来的损失的和,即蓝方击落红方攻击型无人机给红方带来的损失蓝方击落红方干扰型无人机给红方带来的损失红方的歼敌即是蓝方的自损,蓝方的歼敌即是红方的自损,即红方的收益函数为蓝方的收益函数为根据红方和蓝方不同的策略选择,将每种策略下的收益值排列成收益矩阵,红方的策略收益矩阵为蓝方的策略收益矩阵为
博弈中红方的策略集合为s=[s1,s2,…,sN],设在s上的混合策略为x=[x1,x2,…,xN],即红方以概率xi选择策略si,满足xi≥0且蓝方的策略集合为s′=[s′1,s′2,…,s′n],s′上的混合策略为x′=[x′1,x′2,…,x′n],即蓝方以概率x′j选择策略s′j,满足x′j≥0且则博弈的一个混合策略组合可以记为X=[x,x′]。红方的期望收益为μr=x(Ur)N×nx′T,蓝方的期望收益为μb=x(Ub)N×nx′T,无人机集群博弈纳什均衡即找到一组混合策略组合X*=[x*,x′*]满足不等式其为无人机集群作战指挥决策博弈的纳什均衡点,代表红方策略收益矩阵(Ur)N×n第i行中的所有元素,代表蓝方策略收益矩阵(Ub)N×n第j列中的所有元素。目标函数可表示为求解纳什均衡点即找到一组混合策略组合X*使得目标函数J(X)达到最小值,即惩罚函数为其中函数当括号中两变量相等时返回0,不相等时返回1。则适应度函数可表示为f(X)=J(X)+p(X)。
步骤二:初始化量子磷虾群。
令量子磷虾群的种群规模为M,问题的维数D=N+n,最大迭代次数为将第t代第i只量子磷虾的量子位置记为d=1,2,…,D,其对应的位置为其中i=1,2,…,M。用来对应一种潜在的混合策略,满足 其中d=1,2,…,D,第t代第i只量子磷虾邻居的诱导运动记为第i只量子磷虾的诱导方向其中第i只量子磷虾邻居的诱导方向为全局诱导方向为第i只量子磷虾的觅食速度觅食方向其中食物的诱导方向为历史最优量子个体诱导方向为第i只量子磷虾的随机扩散速度t为当前迭代次数,初始时令t=0。
步骤三:根据适应度函数计算量子磷虾群中每一只量子磷虾位置的适应度值。
适应度计算过程如下:按照映射规则将第i只量子磷虾的量子位置映射为位置其中利用适应度函数计算适应度值,其值可同时代表其相应量子位置和位置的适应性。适应度值最小的量子磷虾的量子位置即为至今为止整个群体所找到的全局最优量子位置按照映射规则获得全局最优量子位置对应的全局最优位置为
步骤四:更新每只量子磷虾的量子旋转角和量子位置。
在量子磷虾群中,量子磷虾量子位置的更新是通过三种运动来进行的:诱导运动、觅食活动和随机扩散。三种行为的更新规则如下:
第i只量子磷虾的邻居对第i只量子磷虾的诱导运动表示为其中表示第i只量子磷虾受周围量子磷虾的诱导速度,Nmax是最大诱导速度,ωt为诱导权重,为第i只量子磷虾的诱导方向, 为第i只量子磷虾邻居的诱导方向,αt(g)为全局诱导方向。为第j个邻居对第i只量子磷虾的影响力,Ki t为第i只量子磷虾位置的适应度值,Kj t为第i只量子磷虾第j个邻居的适应度值,和为量子磷虾群当前最差和最优适应度值,为第j个邻居对第i只量子磷虾量子位置的影响,其中i=1,2,…,M,j=1,2,…,M,且i≠j,ε是防止分母为零而设置的很小的正数,ε∈[10-20,10-6]。其中Ct为扰动变量,rand是均匀分布在[0,1]之间随机数,为全局最优量子位置的影响力,为当前全局最优量子位置对第i只量子磷虾量子位置的影响。
(2)觅食运动。
觅食速度vf为最大觅食速度,为觅食权重,为觅食方向,其中为食物的诱导方向,为历史最优量子位置的诱导方向。食物量子位置为 为动态变量,为食物影响力,为食物量子位置的适应度值,表示食物量子位置对第i只量子磷虾量子位置的影响力,其中,表示全局最优量子位置影响力,为当前全局最优量子位置对第i只量子磷虾量子位置的影响。
(3)随机扩散。
由以上三个运动速度分量共同更新量子磷虾的量子旋转角,第i只量子磷虾的量子旋转角第d维的更新公式为d=1,2,…,D,是第i只量子磷虾邻居对第i只量子磷虾的诱导运动的第d维,是对第i只量子磷虾觅食速度的第d维,是对第i只量子磷虾随机扩散速度的第d维,第i只量子磷虾量子位置的第d维更新公式为 是速度矢量的比例因子,其中为步长缩放因子,Ud为变量上界,Ld为变量的下界。
为增加种群的多样性,执行如下交叉操作:
步骤五:对量子磷虾群中每只量子磷虾更新后的位置进行适应度计算,通过映射规则得到每只量子磷虾更新后的位置,计算位置的适应度。
步骤六:确定量子磷虾群的全局最优量子位置。
步骤八:输出量子磷虾群的全局最优位置,映射为博弈的混合策略组合。
模型具体参数设置如下:
红方无人机总数Nr=8,其中攻击型无人机Tr=4,干扰型无人机Dr=4。蓝方无人机总数Nb=7,其中攻击型无人机Tb=3,干扰型无人机Db=4。攻击型无人机的毁伤概率P0=0.6,被击落的损失a=1,干扰型无人机的毁伤概率P1=0.5,被击落的损失b=1.5,干扰衰减常数K=e。
基于量子磷虾群演化机制的无人机集群作战决策博弈方法的参数设置如下:种群规模M=30,最大迭代次数 最大诱导速度Nmax=0.01,诱导权重最大觅食速度vf=0.05,觅食权重随机扩散方向δ=[δ1,δ2,…,δD],其中δd是均匀分布在[-1,1]间的随机数,d=1,2,…,D,最大扩散速度Vmax=0.002,步长缩放因子Ct=0.25,变量上界Ud=10,变量下界Ld=-10,交叉概率
图2是利用QKH、KH与PSO时无人机集群作战决策的适应度函数收敛曲线。从仿真图中可以看出,利用粒子群演化机制得到的适应度函数值明显高于利用磷虾群演化机制得到的适应度函数值,利用量子磷虾群演化机制得到的适应度函数值最低,只有0.0149,收敛精度更高。红蓝双方无人机集群对抗博弈混合策略结果如表1所示。
表1红蓝双方无人机集群对抗博弈混合策略结果
本发明利用量子磷虾群演化机制求解来求解无人机作战决策博弈的混合策略纳什均衡解,为无人机集群作战提供了可靠的决策分析,以量子磷虾群演化机制作为演进策略,收敛速度更快,收敛精度更高。该方法的步骤为:建立无人机协同作战博弈模型;初始化量子磷虾群;根据适应度函数计算量子磷虾群中每一只量子磷虾位置的适应度值;更新每只量子磷虾的量子旋转角和量子位置,通过一定的映射规则得到每只量子磷虾新的位置;对量子磷虾群中每只量子磷虾更新后的位置进行适应度计算;确定量子磷虾群的全局最优位置;判断是否达到最大迭代次数;输出量子磷虾群的全局最优位置,映射为博弈的混合策略组合。本发明以量子磷虾群演化机制作为演进策略,减少了运算量和运算时间,获得了更高的收敛精度和更快的收敛速度,有效的解决了传统无人机集群作战决策方法中存在的一些问题,得到了更加可靠的决策分析。
Claims (1)
1.一种基于量子磷虾群演化机制的无人机集群作战博弈决策方法,其特征在于,包括以下步骤:
步骤一:建立无人机协同作战博弈决策模型,具体为:
博弈双方分别记作红方和蓝方,其中红方拥有无人机Nr架,蓝方拥有无人机Nb架,双方的无人机均分为两种类型:攻击型和干扰型,红方拥有攻击型无人机Tr架,干扰型无人机Dr架,Nr=Tr+Dr,其中攻击型无人机分为两种:攻击对方的攻击型无人机和攻击对方的干扰型无人机,红方攻击对方的攻击型无人机有Ar1架,攻击对方的干扰型无人机有Ar2架,Tr=Ar1+Ar2;蓝方拥有攻击型无人机Tb架,干扰型无人机Db架,Nb=Tb+Db,蓝方攻击对方的攻击型无人机有Ab1架,攻击对方的干扰型无人机有Ab2架,Tb=Ab1+Ab2;
红方的策略集合为s=[s1,s2,…,sN],蓝方的策略集合为s′=[s′1,s′2,…,s′n],其中N和n分别为红方和蓝方的策略总数,红方的第i个策略si代表以i架攻击型无人机去攻击蓝方的攻击型无人机,以Tr-i架攻击型无人机攻击蓝方干扰型无人机,其中i=1,2,…,N,N=Tr+1;蓝方的第j个策略s′j代表以j架攻击型无人机去攻击红方的攻击型无人机,以Tb-j架攻击型无人机攻击红方干扰型无人机,其中j=1,2,…,n,n=Tb+1;
当红方采用第i个策略,蓝方采用第j个策略时红方收益表示为当红方采用第i个策略,蓝方采用第j个策略时蓝方收益表示为其中i=1,2,…,N,j=1,2,…,n;收益值利用效费比来表示,即歼敌与自损的比值,红方的歼敌表示为击落蓝方攻击型无人机给蓝方带来的损失与击落蓝方干扰型无人机给蓝方带来的损失的和,即红方击落蓝方攻击型无人机给蓝方带来的损失其中K为干扰衰减常数且大于1,红方击落蓝方干扰型无人机给蓝方带来的损失其中P0为攻击型无人机的毁伤概率,a为攻击型无人机被击落的损失,P1为干扰型无人机的毁伤概率,b为干扰型无人机被击落的损失;蓝方的歼敌表示为击落红方攻击型无人机给红方带来的损失与击落红方干扰型无人机给红方带来的损失的和,即蓝方击落红方攻击型无人机给红方带来的损失蓝方击落红方干扰型无人机给红方带来的损失红方的歼敌即是蓝方的自损,蓝方的歼敌即是红方的自损,即红方的收益函数为蓝方的收益函数为根据红方和蓝方不同的策略选择,将每种策略下的收益值排列成收益矩阵,红方的策略收益矩阵为蓝方的策略收益矩阵为
博弈中红方的策略集合为s=[s1,s2,…,sN],设在s上的混合策略为x=[x1,x2,…,xN],即红方以概率xi选择策略si,满足xi≥0且蓝方的策略集合为s′=[s′1,s′2,…,s′n],s′上的混合策略为x′=[x′1,x′2,…,x′n],即蓝方以概率x′j选择策略s′j,满足x′j≥0且则博弈的一个混合策略组合可以记为X=[x,x′];红方的期望收益为μr=x(Ur)N×nx′T,蓝方的期望收益为μb=x(Ub)N×nx′T,无人机集群博弈纳什均衡即找到一组混合策略组合X*=[x*,x′*]满足不等式其为无人机集群作战指挥决策博弈的纳什均衡点,代表红方策略收益矩阵(Ur)N×n第i行中的所有元素,代表蓝方策略收益矩阵(Ub)N×n第j列中的所有元素;目标函数可表示为求解纳什均衡点即找到一组混合策略组合X*使得目标函数J(X)达到最小值,即惩罚函数为其中函数当括号中两变量相等时返回0,不相等时返回1,则适应度函数可表示为f(X)=J(X)+p(X);
步骤二:初始化量子磷虾群,具体为:
令量子磷虾群的种群规模为M,问题的维数D=N+n,最大迭代次数为将第t代第i只量子磷虾的量子位置记为其对应的位置为其中i=1,2,…,M,用来对应一种潜在的混合策略,满足 其中d=1,2,…,D,第t代第i只量子磷虾邻居的诱导运动记为第i只量子磷虾的诱导方向其中第i只量子磷虾邻居的诱导方向为全局诱导方向为第i只量子磷虾的觅食速度觅食方向其中食物的诱导方向为历史最优量子个体诱导方向为第i只量子磷虾的随机扩散速度t为当前迭代次数,初始时令t=0;
步骤三:根据适应度函数计算量子磷虾群中每一只量子磷虾位置的适应度值,具体为:
适应度计算过程如下:按照映射规则将第i只量子磷虾的量子位置映射为位置其中利用适应度函数计算适应度值,其值同时代表其相应量子位置和位置的适应性;适应度值最小的量子磷虾的量子位置即为至今为止整个群体所找到的全局最优量子位置按照映射规则获得全局最优量子位置对应的全局最优位置为
步骤四:更新每只量子磷虾的量子旋转角和量子位置,具体为:
在量子磷虾群中,量子磷虾量子位置的更新是通过三种运动来进行的:诱导运动、觅食活动和随机扩散,三种行为的更新规则如下:
第i只量子磷虾的邻居对第i只量子磷虾的诱导运动表示为其中表示第i只量子磷虾受周围量子磷虾的诱导速度,Nmax是最大诱导速度,ωt为诱导权重,为第i只量子磷虾的诱导方向, 为第i只量子磷虾邻居的诱导方向,αt(g)为全局诱导方向,为第j个邻居对第i只量子磷虾的影响力,Ki t为第i只量子磷虾位置的适应度值,Kj t为第i只量子磷虾第j个邻居的适应度值,和为量子磷虾群当前最差和最优适应度值,为第j个邻居对第i只量子磷虾量子位置的影响,其中i=1,2,…,M,j=1,2,…,M,且i≠j,ε是防止分母为零而设置的很小的正数,其中Ct为扰动变量,rand是均匀分布在[0,1]之间随机数,为全局最优量子位置的影响力,为当前全局最优量子位置对第i只量子磷虾量子位置的影响;
(2)觅食运动:
觅食速度vf为最大觅食速度,为觅食权重,βi t+1为觅食方向,βi t+1=βi t(f)+βi t(b),其中βi t(f)为食物的诱导方向,βi t(b)为历史最优量子位置的诱导方向,食物量子位置为 为动态变量,为食物影响力,为食物量子位置的适应度值,表示食物量子位置对第i只量子磷虾量子位置的影响力,其中,表示全局最优量子位置影响力,为当前全局最优量子位置对第i只量子磷虾量子位置的影响;
(3)随机扩散:
由以上三个运动速度分量共同更新量子磷虾的量子旋转角,第i只量子磷虾的量子旋转角第d维的更新公式为 是第i只量子磷虾邻居对第i只量子磷虾的诱导运动的第d维,是对第i只量子磷虾觅食速度Fi t+1的第d维,是对第i只量子磷虾随机扩散速度Vi t+1的第d维,第i只量子磷虾量子位置的第d维更新公式为是速度矢量的比例因子,其中为步长缩放因子,Ud为变量上界,Ld为变量的下界;
执行如下交叉操作:
步骤五:对量子磷虾群中每只量子磷虾更新后的位置进行适应度计算,通过映射规则得到每只量子磷虾更新后的位置,计算位置的适应度,具体为:
步骤六:确定量子磷虾群的全局最优量子位置:
步骤八:输出量子磷虾群的全局最优位置,映射为博弈的混合策略组合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811310155.XA CN109460056B (zh) | 2018-11-06 | 2018-11-06 | 基于量子磷虾群演化机制的无人机集群作战博弈决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811310155.XA CN109460056B (zh) | 2018-11-06 | 2018-11-06 | 基于量子磷虾群演化机制的无人机集群作战博弈决策方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109460056A CN109460056A (zh) | 2019-03-12 |
CN109460056B true CN109460056B (zh) | 2021-12-24 |
Family
ID=65609442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811310155.XA Active CN109460056B (zh) | 2018-11-06 | 2018-11-06 | 基于量子磷虾群演化机制的无人机集群作战博弈决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109460056B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110134138B (zh) * | 2019-04-08 | 2022-06-21 | 合肥工业大学 | 对抗环境下无人机智能决策的纳什均衡博弈方法及系统 |
CN110414685B (zh) * | 2019-06-20 | 2020-08-28 | 合肥工业大学 | 多无人机任务分配的纳什均衡博弈智能决策方法及系统 |
CN110442146B (zh) * | 2019-07-22 | 2022-10-25 | 合肥工业大学 | 无人机编队目标分配与空间占位联合决策方法及系统 |
CN111240366A (zh) * | 2019-12-27 | 2020-06-05 | 西安羚控电子科技有限公司 | 一种基于遗传模拟退火算法的蜂群无人机协同攻击方法 |
CN112307613B (zh) * | 2020-10-26 | 2023-07-18 | 沈阳航空航天大学 | 基于自适应权重的无人机集群空-地对抗博弈仿真方法 |
CN112612298B (zh) * | 2020-11-27 | 2023-06-09 | 合肥工业大学 | 对抗环境下多无人机战术决策的多目标博弈方法及装置 |
CN112578685B (zh) * | 2020-12-10 | 2022-04-26 | 沈阳航空航天大学 | 一种基于级联故障的无人机集群对抗仿真方法 |
CN112926825B (zh) * | 2021-01-21 | 2023-10-10 | 哈尔滨工程大学 | 基于多目标量子磷虾群机制的多无人机任务分配方法 |
CN113095465B (zh) * | 2021-04-01 | 2023-10-17 | 哈尔滨工程大学 | 量子大马哈鱼洄游机制演化博弈的水下无人集群任务分配方法 |
CN113608546B (zh) * | 2021-07-12 | 2022-11-18 | 哈尔滨工程大学 | 量子海狮机制的无人机群任务分配方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844628A (zh) * | 2016-03-21 | 2016-08-10 | 昆明理工大学 | 一种基于磷虾优化算法的摇床矿带分带图像分割法 |
CN107045458A (zh) * | 2017-03-09 | 2017-08-15 | 西北工业大学 | 基于多目标量子粒子群算法的无人机协同任务分配方法 |
CN107253194A (zh) * | 2017-07-31 | 2017-10-17 | 中南大学 | 一种运载机器人手臂操控多点映射智能控制方法及系统 |
CN107463094A (zh) * | 2017-07-13 | 2017-12-12 | 江西洪都航空工业集团有限责任公司 | 一种不确定信息下多无人机空战动态博弈方法 |
CN108549402A (zh) * | 2018-03-19 | 2018-09-18 | 哈尔滨工程大学 | 基于量子乌鸦群搜索机制的无人机群任务分配方法 |
-
2018
- 2018-11-06 CN CN201811310155.XA patent/CN109460056B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844628A (zh) * | 2016-03-21 | 2016-08-10 | 昆明理工大学 | 一种基于磷虾优化算法的摇床矿带分带图像分割法 |
CN107045458A (zh) * | 2017-03-09 | 2017-08-15 | 西北工业大学 | 基于多目标量子粒子群算法的无人机协同任务分配方法 |
CN107463094A (zh) * | 2017-07-13 | 2017-12-12 | 江西洪都航空工业集团有限责任公司 | 一种不确定信息下多无人机空战动态博弈方法 |
CN107253194A (zh) * | 2017-07-31 | 2017-10-17 | 中南大学 | 一种运载机器人手臂操控多点映射智能控制方法及系统 |
CN108549402A (zh) * | 2018-03-19 | 2018-09-18 | 哈尔滨工程大学 | 基于量子乌鸦群搜索机制的无人机群任务分配方法 |
Non-Patent Citations (3)
Title |
---|
Optimal Allocation of Measurement Devices for Distribution State Estimation Using Multiobjective Hybrid PSO–Krill Herd Algorithm;S. Prasad等;《IEEE Transactions on Instrumentation and Measurement》;IEEE;20170831;第66卷(第8期);第2022-2035页 * |
基于种群混合协同联盟的属性量子博弈均衡约简;丁卫平等;《电子学报》;中国电子学会;20150131;第43卷(第1期);第45-52页 * |
无人机集群作战指挥决策博弈分析;王宏等;《军事运筹与系统工程》;军事科学院军事运筹分析研究所;20170630;第31卷(第2期);第11-16页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109460056A (zh) | 2019-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109460056B (zh) | 基于量子磷虾群演化机制的无人机集群作战博弈决策方法 | |
CN108680063B (zh) | 一种针对大规模无人机集群动态对抗的决策方法 | |
CN105302153B (zh) | 异构多无人机协同察打任务的规划方法 | |
CN107515618B (zh) | 一种考虑时间窗口的异构无人机协同任务分配方法 | |
CN112269396B (zh) | 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法 | |
CN110083971B (zh) | 一种基于作战推演的自爆式无人机集群作战兵力分配方法 | |
CN108549402B (zh) | 基于量子乌鸦群搜索机制的无人机群任务分配方法 | |
CN112783209B (zh) | 一种基于鸽群智能竞争学习的无人机集群对抗控制方法 | |
CN111240353A (zh) | 基于遗传模糊树的无人机协同空战决策方法 | |
Mora et al. | Effect of noisy fitness in real-time strategy games player behaviour optimisation using evolutionary algorithms | |
CN107330560A (zh) | 一种考虑时序约束的异构飞行器多任务协同分配方法 | |
CN109541960B (zh) | 一种用于飞行器数字化战场对抗的系统和方法 | |
CN114063644B (zh) | 基于鸽群反向对抗学习的无人作战飞机空战自主决策方法 | |
CN110766125A (zh) | 一种基于人工鱼群算法的多目标武器——目标分配方法 | |
Liu et al. | Dynamic multi-swarm differential learning Harris Hawks Optimizer and its application to optimal dispatch problem of cascade hydropower stations | |
Qingwen et al. | Cooperative jamming resource allocation of UAV swarm based on multi-objective DPSO | |
CN116702633B (zh) | 一种基于多目标动态优化的异构弹群任务可靠性规划方法 | |
Li et al. | Multi-uav air combat weapon-target assignment based on genetic algorithm and deep learning | |
Jing et al. | Cooperative task assignment for heterogeneous multi-UAVs based on differential evolution algorithm | |
CN115963731B (zh) | 一种基于改进遗传算法的指挥控制体系网络结构优化方法 | |
Avery et al. | Evolving coordinated spatial tactics for autonomous entities using influence maps | |
CN113095465B (zh) | 量子大马哈鱼洄游机制演化博弈的水下无人集群任务分配方法 | |
Zhao et al. | Shuffled frog leaping algorithm with non-dominated sorting for dynamic weapon-target assignment | |
CN113324545A (zh) | 一种基于混合增强智能的多无人机协同任务规划方法 | |
CN114167899A (zh) | 一种无人机蜂群协同对抗决策方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |