CN105700555A - 一种基于势博弈的多无人机协同搜索方法 - Google Patents

一种基于势博弈的多无人机协同搜索方法 Download PDF

Info

Publication number
CN105700555A
CN105700555A CN201610143227.0A CN201610143227A CN105700555A CN 105700555 A CN105700555 A CN 105700555A CN 201610143227 A CN201610143227 A CN 201610143227A CN 105700555 A CN105700555 A CN 105700555A
Authority
CN
China
Prior art keywords
unmanned plane
action
probability
game
moment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610143227.0A
Other languages
English (en)
Other versions
CN105700555B (zh
Inventor
段海滨
李沛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201610143227.0A priority Critical patent/CN105700555B/zh
Publication of CN105700555A publication Critical patent/CN105700555A/zh
Application granted granted Critical
Publication of CN105700555B publication Critical patent/CN105700555B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/12Target-seeking control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Abstract

本发明是一种基于势博弈的多无人机协同搜索方法,其实施步骤为:步骤一:多无人机协同搜索问题建模;步骤二:多无人机协调运动的势博弈建模和双对数-线性学习法势博弈求解;步骤三:根据传感器探测信息更新概率图,对更新后的概率图进行信息融合,获取目标存在概率;步骤四:根据目标存在概率更新不确定度,并进行多无人机协同搜索。本发明能实现多无人机协同搜索,包含基于势博弈的协调运动、概率图更新、信息融合等过程,由于自身分布式的控制方式,方法计算简单,具有较强的鲁棒性,能有效应对外界干扰。

Description

一种基于势博弈的多无人机协同搜索方法
【技术领域】
本发明是一种基于势博弈的多无人机协同搜索方法,属于无人机自主控制技术领域。
【背景技术】
在无人机所承担的各种任务中,侦察和搜索(ReconnaissanceandSearch)是目前无人机系统的首要任务,执行这类任务的无人机通常称为无人侦察机,典型的包括美军的“全球鹰(GlobalHawk)”、“捕食者(Predator)”、“扫描鹰(ScanEagle)”等无人机,其主要功能为情报侦察、目标搜索、目标指示与定位、动态目标跟踪以及战场监视等等。与侦察卫星相比,无人机的成本低,活动区域不受卫星轨道的限制,控制更加灵活,在针对动态时间敏感目标时,可以在更短时间内获得更高分辨率的实时目标图像;与有人侦察机相比,无人机能够昼夜持续侦察,不必考虑飞行员的疲劳和伤亡,特别在对敌方严密设防的重要地域执行任务时,使用无人机更能体现出其优越性。因此,采用无人机对作战区域进行目标搜索和情报侦察已经成为当前战场信息获取的重要手段。
在无人机执行任务过程中,搜索并且发现任务区域内的目标是后续进行情报搜集、目标定位乃至打击等一系列作战活动的基础和前提。然而,在复杂的战场条件下,由于作战任务区域的环境复杂性、目标的不确定性、传感器设备的不确定性和任务的时间紧迫性等因素,使得目标搜索问题十分复杂,具体表现为:任务区域范围大、环境复杂;目标的类型和运动特性复杂;目标侦察搜索设备的性能有限;目标搜索需要满足任务时间要求等。
对于目标搜索任务来说,单架无人机所挂载的传感器性能有限,通常只能获取有限范围内的目标信息,无法满足对大量目标的搜索和侦察需求;另一方面,由于无人机通常是在高危环境下执行任务,使得其故障率和毁伤率大大增加,此时,多无人机协同执行任务将具备如下的优势:可以通过相互之间的配合提高任务完成的质量;可以通过资源和信息的共享扩展执行任务的能力;可以通过任务的并行执行缩短任务完成的时间、提高任务执行的效率;当出现平台损毁时,可以通过任务重分配增加任务成功的概率。由此可见,组织多架无人机协同执行任务是未来网络化战场上的一种重要作战方式,而如何有效控制多架无人机在复杂环境中协同执行搜索任务也逐渐成为近年来协同控制领域的重要内容。
多无人机协同搜索要求在满足特定任务要求和约束条件下,对多架无人机实施有效的控制,从而以最小的代价高质量的完成对目标的搜索,发现尽可能多的未知目标。显然,协同搜索能够带来更好的作战效能、实现更优的资源利用。目前,多无人机协同控制的结构主要可分为集中式结构和分布式结构。在集中式结构下,多架无人机通常在地面任务控制站(或空中任务控制单元)的统一指挥和控制下执行任务,作为中心的任务控制单元能够进行慎思的规划,具有良好的全局控制与决策能力,但是在未来多无人机网络化作战条件下,集中式控制方式将面临通信等诸多方面的问题。
随着技术的不断发展,无人机系统的性能不断提升,无人机的自主能力也不断增强,分布式方式逐渐成为多无人机协同控制的研究热点。在分布式控制方式下,每架无人机具有相对独立的控制器,多无人机之间通常采取协作的方式来解决全局控制问题,系统具有较好的鲁棒性和容错性,并且大量的计算和决策能够在无人机本地进行,从而实现信息的分散化、控制的分散化,使得控制的可靠性和灵活性大大改善。在上述分布式方式下,无人机平台之间的控制、决策以及信息都是高度分散的,多无人机之间的协同行为依赖于平台之间的信息交互。此时,多无人机协同控制将面临如下挑战:通信的复杂性、计算的实时性、环境的不确定性、信息的不一致性等问题。
【发明内容】
1、发明目的:
本发明提出了一种基于势博弈的多无人机协同搜索方法,其目的是提供一种协同控制方法,使得无人机在执行搜索任务时能够分布式地工作,独立地针对自身所处的环境做决策,从而达到整体效能的最优,同时能够应对通信的复杂性、计算的实时性、信息的不一致性等问题。
2、技术方案:
本发明针对多无人机协同搜索的任务需求,开发了一种鲁棒性强、实时性好的基于势博弈的多无人机协同搜索方法,该方法的步骤如下:
步骤一:多无人机协同搜索问题建模
考虑用n架无人机(记为V={v1,v2,…,vn})对一个连续的任务区域(表示实数域)进行搜索,每架无人机作为独立的决策者采用分布式策略对任务区域进行探索,见附图1。为了表示方便,将连续的任务区域平均分配为M=Lx×Ly个单元(Lx,Ly表示任务区域横向、纵向分配的份数,M表示划分的单元的个数),每个单元用其中心位置g=[x,y]T(x,y表示横、纵坐标的位置,T为数学符号转置)等价代替。无人机vi在时刻t对其覆盖范围内的基本单元进行一次独立的测量,测量结果为Zi,g,t,其中μi,t表示无人机vi在时刻t的位置,Rsi表示无人机传感器的探测范围。若其中心位置位于之内,则某一单元g内的信息可被无人机vi检测到。在时刻t,无人机vi执行一次测量,观测结果表示如下,
Z i , g , t = { 1 , i f | g - μ i , t | ≤ R s i 0 , o t h e r w i s e . - - - ( 1 )
此外,考虑机载传感器的内在特性,将其正确率和误警率分别定义为P(Zi,g,t=1|θg=1)=pc和P(Zi,g,t=1|θg=0)=pf,并假设这两个参数已知,且在整个任务执行过程中保持不变,其中θg表示目标存在于单元g中的概率。
对于多无人机网络的通信拓扑,将其建模为一个动态图Gt=(εt,vt),该动态图中vt为顶点集合,表示为vt={1,2,…,N},εt为连接边集合,表示为εt={{i,j}:i,j∈v;||μi,tj,t||≤RCi},其中μi,t和μj,t表示两个不同无人机vi和vj在时刻t的位置,RCi为无人机的通信范围。无人机vi在时刻t的邻居集合表示为Ni,t={j∈v|{i,j}∈εt}∪{i},为表征方便,设该无人机本身属于其邻居集合。无人机vi在时刻t的度记为di,t=|Ni,t|,表示它将自身位置信息和传感器信息传递给邻居个体的能力。
步骤二:多无人机协调运动的势博弈建模和双对数-线性学习法势博弈求解
(1)多无人机协调运动的势博弈建模
将多无人机协调运动建模成势博弈的过程中,包括三方面的要素:博弈参与者、参与者行动集、效用函数。博弈参与者即为参与搜索过程的n架无人机,需要考虑的为行动集和效用函数的设计。
博弈参与者行动集Ai的设计:它定义了博弈参与者可选择的全部行为,其中的元素被称为行动,是参与者在博弈过程中的决策变量。无人机的搜索效率取决于其传感器性能以及其所在的位置,而特定无人机的传感器性能在执行任务过程中保持不变,所以它的搜索效率由其位置决定。因此,将某一博弈者的行动集定义为在任务区域内它所能选择的位置,Ai={g|g∈Ω},无人机vi的行动表示为ai∈Ai,整个无人机群体的集体行动表示为a=(a1,a2,…,an),称作行动组合。设a(t-1)为无人机vi在时刻t-1的行动组合,则根据无人机运动特性以及障碍物等行动约束,将时刻t行动集简化为上一时刻行动集的函数,受限的行动集,记为见附图2。按惯例规定,对于博弈者任一行动ai∈Ai,有ai∈Ci(ai),即无人机被允许停留在上一时刻的位置。
在无人机被布置到任务器搜集信息时,密度函数(表示正的实数集)用来记录无人机对任务区域内目标时间发生概率的了解程度。由于信号衰减,传感器性能随着目标单元与无人机位置之间的几何距离增大而降低,因此用非减可微函数对传感器的信号强度进行量化分析,q∈Ω为任务区域中单元格的位置,pi为无人机vi的位置。无人机的性能用概率密度函数和信号衰减综合表示如下:
Φ ( a ) = Φ ( p 1 , p 2 , ... , p n ) = ∫ Ω f ( min i ∈ { 1 , 2 , ... n } || q - p i || ) η ( q ) d q - - - ( 2 )
其中
f ( || q - p i || ) = || q - p i || || q - p i || ≤ R S i 0 o t h e r w i s e
式中η(q)为密度函数,RSi为无人机vi的传感距离。
博弈参与者效用函数Ui(ai,a-i)的设计:在效用函数的设计过程中,需考虑所设计博弈的可扩展性、灵活性、信息的局部性、以及效用函数的可求解性等因素。无人机vi的效用函数设计为问题整体效用的边际贡献值,记做
U i ( a i , a - i ) = ∫ Ω f ( min i ∈ { 1 , 2 , ... , n } || q - p i || ) η ( q ) d q - ∫ Ω f ( min i ∈ { 1 , 2 , ... , i - 1 , i + 1 , ... , n } || q - p i || ) η ( q ) d q . - - - ( 3 )
根据势函数的定义,按照式(3)设计效用函数,构成的博弈为势博弈,满足势博弈的相关性质,能利用各种学习算法保证其最优性和收敛性。
(2)双对数-线性学习法的势博弈求解
采用双对数-线性学习法对问题进行求解,减少无人机计算资源的负担,有利于多无人机的实时运动控制。在双对数-线性学习法中,首先按异步时间模型以相同的概率随机选择一架无人机vi∈V改变其位置。与此同时,其他无人机保持之前的行动不变a-i(t)=a-i(t-1)。选择出的无人机从其受限行动集Ci(ai(t-1))中选出尝试动作以改变其位置
P ( a ^ i = a i ) = 1 / z i , ∀ a i ∈ C i ( a i ( t - 1 ) ) \ a i ( t - 1 ) - - - ( 4 )
P ( a ^ i = a i ( t - 1 ) ) = 1 - ( | C i ( a i ( t - 1 ) ) | - 1 ) / z i - - - ( 5 )
其中zi表示无人机vi在受限行动集中行动的最大个数,表示为 z i = max a i ∈ A i | C i ( a i ( t - 1 ) ) | .
无人机vi在选择出尝试动作后,在时刻t按照策略pi(t)∈Δ(Ai)来更新其动作,博弈者策略pi(t)定义如下:
p i a i ( t - 1 ) ( k ) = e 1 τ U i ( a ( t - 1 ) ) e 1 τ U i ( a ( t - 1 ) ) + e 1 τ U i ( a ^ i , a - i ( t - 1 ) ) - - - ( 6 )
p i a ^ i ( t ) = e 1 τ U i ( a ^ i , a - i ( t - 1 ) ) e 1 τ U i ( a ( t - 1 ) ) + e 1 τ U i ( a ^ i , a - i ( t - 1 ) ) - - - ( 7 )
式中Ui(a(t-1))和分别是无人机当前行动的效用以及按照选定尝试动作改变后的假想效用。式中参数τ定义了噪声的强度,即无人机作决策时在多大程度上会选择次优动作。当τ→0时,无人机会以概率1选择a-i(t-1)的最佳应对动作。注意,当时,时,
对于无人机vi∈V和其行动集中的任一对动作可达性表示存在一系列的行动对所有的t∈{1,2,...,m}满足对于无人机vi∈V和其行动集中的任一对动作表示其可逆性。对于构造成效用函数为式(2)的势博弈的多无人机协调运动问题,如果博弈者遵循双对数-线性学习法,并且其受限行动集满足可达性和可逆性,则无人机在t→∞,τ→0时将移动到最大化其覆盖性能的位置。
步骤三:根据传感器探测信息更新概率图,对更新后的概率图进行信息融合,获取目标存在概率
(1)根据传感器探测信息更新概率图
首先根据先验知识建立表征各无人机对任务区域的理解程度的概率图,然后通过贝叶斯规则和在运动过程中获得的信息对概率图进行更新,具体步骤如下。
在搜索过程中,每架无人机vi保存一个它对任务区域所有基础单元的概率图Pi,g,t表示在时刻t目标存在于单元g中的概率,θg=1和θg=0分别表示目标是否存在于单元g。无人机vi根据传感器观测信息Bi,t更新其概率图,公式如下
Pi,g,t=P(θg=1|Bi,t).(8)
目标存在于单元g在无人机vi在时刻t观测值为Zi,g,t时的条件概率P(θg=1|Zi,g,t)按照贝叶斯公式表示为
P ( θ g = 1 | Z i , g , t ) = P ( Z i , g , t | θ g = 1 ) P ( θ g = 1 ) P ( Z i , g , t ) - - - ( 9 )
其中P(θg=1)为目标存在于单元g中的先验概率。将无人机vi在前一时刻t-1对于目标存在于单元g的概率估计Pi,g,t-1作为先验概率,结合对于g在时刻t的观测Zi,g,t,式(9)变为
P i , g , t = P ( Z i , g , t | θ g = 1 ) P i , g , t - 1 P ( Z i , g , t ) - - - ( 10 )
根据贝叶斯公式上式的分母表示为P(Zi,g,t)=P(Zi,g,tg=1)P(θg=1)+P(Zi,g,tg=0)P(θg=0),其中P(Zi,g,tg=1)和P(Zi,g,tg=0)为正确检测率和误警率,为建模部分中的pc和pf。将式(10)代入式(9)中,概率图更新规则表示如下,
P i , g , t = P ( θ g = 1 | Z i , g , t ) = P ( Z i , g , t | θ g = 1 ) P ( θ g = 1 ) P ( Z i , g , t | θ g = 1 ) P ( θ g = 1 ) + P ( Z i , g , t | θ g = 0 ) P ( θ g = 0 ) p c P i , g , t - 1 p c P i , g , t - 1 + p f ( 1 - P i , g , t - 1 ) i f Z i , g , t = 1 ( 1 - p c ) P i , g , t - 1 ( 1 - p c ) P i , g , t - 1 + ( 1 - p f ) ( 1 - P i , g , t - 1 ) i f Z i , g , t = 0 P i , g , t - 1 o t h e r w i s e . - - - ( 11 )
在0<pc<1和0<pf<1时,为了简化运算,设
Q i , g , t = Δ l n ( 1 P i , g , t - 1 ) - - - ( 12 )
则概率更新规则变换为
Q i , g , t = Q i , g , t - 1 + ln p f p c i f Z i , g , t = 1 Q i , g , t - 1 + ln 1 - p f 1 - p c i f Z i , g , t = 0 Q i , g , t - 1 o t h e r w i s e . - - - ( 13 )
这样,对于Pi,g,t∈(0,1),Pi,g,t和Qi,g,t存在一对一映射,可以实现从Qi,g,t恢复Pi,g,t
(2)对更新后的概率图进行信息融合,获取目标存在概率
在步骤三中“根据传感器探测信息更新概率图”部分,无人机vi利用传感器探测到的新息对上一时刻t-1的概率图Hi,g,t进行更新。每架无人机将更新后的概率图传输给它当前的邻居,邻居由通信距离和各自的位置决定。然后,利用线性组合的方式对自身更新的概率图和通信获取的邻居概率图进行融合,如下式
Q i , g , t = ω i , i , t H i , g , t - 1 + Σ j ∈ N i ( t ) ω i , j , t H j , g , t - 1 - - - ( 14 )
其中ωi,j,t是无人机vi概率图Qj,g,t-1的权重。将不是无人机vi邻居个体的权重设为ωi,j,t=0,上式可以写成如下的形式。
Q i , g , t = Σ j = 1 N ω i , j , t H j , g , t - - - ( 15 )
这里Wt=(ωi,j)采用著名的Metropolis权重矩阵,表示为
ω i , i , t = { 1 1 + max { d i ( t ) , d j ( t ) } i f { i , j } ∈ ϵ ( t ) 1 - Σ { i , k } ∈ ϵ ( t ) ω i , k , t ( t ) i f i = j 0 o t h e r w i s e - - - ( 16 )
其中di(t),dj(t)表示节点i和j的度,在实际配置中,可将Wt∈Rn×n存储成稀疏矩阵的形式,减少所需存储空间。若无人机网络连通,则Wt为遍历性双随机矩阵,可使各概率图渐进稳定到平均一致性。该权重矩阵适用于分布式配置,无人机无需了解无人机网络的通信拓扑等全局信息,甚至不需要参与整个任务的无人机数目。
对于式(15)定义的分布式信息估计过程,如果执行任务的无人机网络通信拓扑满足以下两个条件之一,则能够保证渐进收敛到概率图初始状态的平均值:或者无人机的通信网络为连通图;或者无人机的通信网络为存在独立通信失败的连通图。
步骤四:根据目标存在概率更新不确定度,并进行多无人机协同搜索
通过与邻居通信进行信息融合,得到估计值||Qi,j,k||,该值用来刻画无人机vi对于任务区域Ω单元g的不确定度。||Qi,j,k||越大,无人机vi的不确定值越小,反之亦然。而搜索问题构造成了一个具有受限行动集的势博弈,并利用双对数线性学习方法进行协调运动。因此,利用||Qi,j,k||构造势博弈效用函数中的密度函数η(q),形式如下:
η i , g , k = Δ e - k η || Q i , g , k || - - - ( 17 )
其中kη为正的增益参数,ηi,g,k表示无人机vi在时刻k对于单元g的不确定度值。
协同搜索问题被分解为三个连续的部分:协调运动、传感器观测和信息融合更新。开始更新前,每个无人机初始化一个概率图,该图存储着每个单元中目标存在的概率。随后无人机根据步骤二中建立的势博弈模型进行协调运动,以优化整体的搜索性能。当到达新的位置之后,无人机利用传感器对覆盖范围内的单元进行探测。随后,结合探测到的数据,无人机根据步骤三对各自的概率图进行更新,并通过与邻居个体进行通信进行信息融合。重复步骤二和步骤三,直至各单元的不确定度降低到设定的阈值之下,此时搜索任务完成,过程见附图3。
3、优点及效果:
本发明提出了一种基于势博弈的多无人机协同搜索方法,包含基于势博弈的协调运动、概率图更新、信息融合等过程,由于自身分布式的控制方式,方法计算简单,具有较强的鲁棒性,能有效应对外界干扰。此外,该方法还能克服信息的局部性,最终达到多个无人机信息的一致性。协调运动构造成的势博弈,采用双对数-线性学习方法,能保障整体搜索效能的最优。
【附图说明】
图1为多无人机协同搜索示意图。
图2为无人机受限行动集示意图。
图3为多无人机协同搜索流程图。
图4为10架无人机协同搜索过程势函数的进化曲线。
图5(a)为搜索过程中无人机初始状态和环境设置。
图5(b)为搜索过程中无人机最终状态和目标位置。
图中标号及符号说明如下:
1、无人机1的序号;2、无人机2的序号;3、无人机3的序号;
4、无人机4的序号;5、无人机5的序号;6、无人机6的序号;
7、无人机7的序号;RS1、无人机1的传感半径;
RS6、无人机6的传感半径。
【具体实施方式】
下面通过一个具体实例来验证本发明所提出的一种基于势博弈的多无人机协同搜索方法的性能。实验计算机配置为IntelCoreDuoCPUT6600处理器,2.2Ghz主频,4G内存,MATLAB2013版本。该方法其具体实现步骤如下:
步骤一:多无人机协同搜索问题建模和参数初始化设定
考虑用10架无人机(记为V={v1,v2,...,vn})对一个未知的区域进行搜索,每架无人机作为独立的决策者采用分布式策略对任务区域进行探索,区域示意图见附图1(为表示方便,示意图中只显示7架)。将连续的任务区域平均分配为M=100×80个基本单元,每个单元用其中心位置g=[x,y]T等价代替。无人机vi在时刻t对其覆盖范围内的基本单元进行一次独立的测量,测量结果为Zi,g,t,具体测量值如式(18),其中取无人机传感器的探测范围Rsi=10,单位为单元格长度。若其中心位置位于之内,则某一单元g内的信息可被无人机vi检测到。在时刻t,无人机vi执行一次测量,观测结果表示如下,
Z i , g , t = { 1 , i f | g - μ i , t | ≤ R s i 0 , o t h e r w i s e . - - - ( 1 )
此外,考虑机载传感器的内在特性,将其正确率和误警率分别定义为pc=0.9和pf=0.3,并且这两个参数在整个任务执行过程中保持不变。
对于多无人机网络的通信拓扑,将其建模为一个动态图Gt=(εt,vt),该动态图由顶点集合v={1,2,...,N}和连接边集合εt={{i,j}:i,j∈v;||μi,tj,t||≤RC}组成,动态图由无人机位置确定。其中μi,t和μj,t表示两个不同无人机vi和vj在时刻t的位置,任务开始时无人机位置分别为(5,15),(10,15),(15,15),(20,15),(25,15),(5,20),(10,20),(15,20),(20,20),(25,20),无人机的通信具体RCi=50,单位为单元格长度。无人机vi在时刻t的邻居集合表示为Ni,t={j∈v|{i,j}∈εt}∪{i},为表征方便,设该无人机本身属于其邻居集合。无人机vi在时刻t的度记为di,t=|Ni,t|,表示为在无人机通信范围内的其他无人机的个数,它将自身位置信息和传感器信息传递给邻居个体的能力。
步骤二:多无人机协调运动的势博弈建模和双对数-线性学习法势博弈求解
(1)多无人机协调运动的势博弈建模
将多无人机协调运动建模成势博弈的过程中,包括三方面的要素:博弈参与者、参与者行动集、效用函数。博弈参与者即为参与搜索过程的n架无人机,需要考虑的为行动集和效用函数的设计。
博弈参与者vi∈V行动集Ai的设计:它定义了博弈参与者可选择的全部行为,其中的元素被称为行动,是参与者在博弈过程中的决策变量。无人机的搜索效率取决于其传感器性能以及其所在的位置,而特定无人机的传感器性能在执行任务过程中保持不变,所以它的搜索效率由其位置决定。因此,将某一博弈者的行动集定义为在任务区域内它所能选择的位置,Ai={g|g∈Ω},无人机vi的行动表示为ai∈Ai,整个无人机群体的集体行动表示为a=(a1,a2,...,an),称作行动组合。设a(t-1)为无人机vi在时刻t-1的行动组合,则根据无人机运动特性以及障碍物等行动约束,将时刻t行动集简化为上一时刻行动集的函数,受限的行动集,记为见附图2。按惯例规定,对于博弈者任一行动ai∈Ai,有ai∈Ci(ai),即无人机被允许停留在上一时刻的位置。
在无人机被布置到任务器搜集信息时,密度函数用来记录无人机对任务区域内目标时间发生概率的了解程度。由于信号衰减,传感器性能随着目标单元与无人机位置之间的几何距离增大而降低,因此用非减可微函数对传感器的信号强度进行量化分析。无人机的性能用概率密度函数和信号衰减综合表示如下:
Φ ( a ) = Φ ( p 1 , p 2 , ... , p n ) = ∫ Ω f ( min i ∈ { 1 , 2 , ... n } || q - p i || ) η ( q ) d q - - - ( 2 )
其中
f ( || q - p i || ) = || q - p i || || q - p i || ≤ R S i 0 o t h e r w i s e
式中η(q)为密度函数,任务空间的密度函数为η(g)≥0,g∈Ωη(g)=1。
博弈参与者vi∈V效用函数Ui(ai,a-i)的设计:在效用函数的设计过程中,需考虑所设计博弈的可扩展性、灵活性、信息的局部性、以及效用函数的可求解性等因素。无人机vi的效用函数设计为问题整体效用的边际贡献值,记做
U i ( a i , a - i ) = ∫ Ω f ( min i ∈ { 1 , 2 , ... , n } || q - p i || ) η ( q ) d q - ∫ Ω f ( min i ∈ { 1 , 2 , ... , i - 1 , i + 1 , ... , n } || q - p i || ) η ( q ) d q . - - - ( 3 )
式中η(q)和f(||q-pi||)与式(2)定义一致。根据势函数的定义,按照式(3)设计效用函数,构成的博弈为势博弈,满足势博弈的相关性质,能利用各种学习算法保证其最优性和收敛性。
(2)双对数-线性学习法的势博弈求解
采用双对数-线性学习法对问题进行求解,减少无人机计算资源的负担,有利于多无人机的实时运动控制。在双对数-线性学习法中,首先按异步时间模型以相同的概率随机选择一架无人机vi∈V改变其位置。与此同时,其他无人机保持之前的行动不变a-i(t)=a-i(t-1)。选择出的无人机从其受限行动集Ci(ai(t-1))中选出尝试动作以改变其位置
P ( a ^ i = a i ) = 1 / z i , ∀ a i ∈ C i ( a i ( t - 1 ) ) \ a i ( t - 1 ) - - - ( 4 )
P ( a ^ i = a i ( t - 1 ) ) = 1 - ( | C i ( a i ( t - 1 ) ) | - 1 ) / z i - - - ( 5 )
其中zi表示无人机vi在受限行动集中行动的最大个数,表示为在实际配置中zi=8。
无人机vi在选择出尝试动作后,在时刻t按照策略pi(t)∈Δ(Ai)来更新其动作,博弈者策略pi(t)定义如下:
p i a i ( t - 1 ) ( k ) = e 1 τ U i ( a ( t - 1 ) ) e 1 τ U i ( a ( t - 1 ) ) + e 1 τ U i ( a ^ i , a - i ( t - 1 ) ) - - - ( 6 )
p i a ^ i ( t ) = e 1 τ U i ( a ^ i , a - i ( t - 1 ) ) e 1 τ U i ( a ( t - 1 ) ) + e 1 τ U i ( a ^ i , a - i ( t - 1 ) ) - - - ( 7 )
式中Ui(a(t-1))和分别是无人机当前行动的效用以及按照选定尝试动作改变后的假想效用。式中参数τ定义了噪声的强度,为τ=0.2,即无人机作决策时在多大程度上会选择次优动作。当τ→0时,无人机会以概率1选择a-i(t-1)的最佳应对动作。注意,当时, 时,
对于无人机vi∈V和其行动集中的任一对动作可达性表示存在一系列的行动对所有的t∈{1,2,...,m}满足对于无人机vi∈V和其行动集中的任一对动作表示其可逆性。对于构造成效用函数为式(3)的势博弈的多无人机协调运动问题,如果博弈者遵循双对数-线性学习法,并且其受限行动集满足可达性和可逆性,则无人机在t→∞,τ→0时将移动到最大化其覆盖性能的位置。
步骤三:根据传感器探测信息更新概率图,对更新后的概率图进行信息融合,获取目标存在概率
(1)根据传感器探测信息更新概率图
首先根据先验知识建立表征各无人机对任务区域的理解程度的概率图,然后通过贝叶斯规则和在运动过程中获得的信息对概率图进行更新,具体步骤如下。
在搜索过程中,每架无人机vi保存一个它对任务区域所有基础单元的概率图表示在时刻t目标存在于单元g中的概率,θg=1和θg=0分别表示目标存在单元g与否,概率图初始值设置为Pi,g,0=0.5。无人机vi根据传感器观测信息Bi,t更新其概率图,公式如下
Pi,g,t=P(θg=1|Bi,t).(8)
目标存在于单元g在无人机vi在时刻t观测值为Zi,g,t时的条件概率P(θg=1|Zi,g,t)按照贝叶斯公式表示为
P ( θ g = 1 | Z i , g , t ) = P ( Z i , g , t | θ g = 1 ) P ( θ g = 1 ) P ( Z i , g , t ) - - - ( 9 )
其中P(θg=1)为目标存在于单元g中的先验概率。将无人机vi在前一时刻t-1对于目标存在于单元g的概率估计Pi,g,t-1作为先验概率,结合对于g在时刻t的观测Zi,g,t,有
P i , g , t = P ( Z i , g , t | θ g = 1 ) P i , g , t - 1 P ( Z i , g , t ) . - - - ( 10 )
根据贝叶斯公式上式的分母表示为P(Zi,g,t)=P(Zi,g,tg=1)P(θg=1)+P(Zi,g,tg=0)P(θg=0),其中P(Zi,g,tg=1)和P(Zi,g,tg=0)为正确检测率和误警率,为建模部分中的pc和pf。将(10)代入(9),概率图更新规则表示如下,
P i , g , t = P ( θ g = 1 | Z i , g , t ) = P ( Z i , g , t | θ g = 1 ) P ( θ g = 1 ) P ( Z i , g , t | θ g = 1 ) P ( θ g = 1 ) + P ( Z i , g , t | θ g = 0 ) P ( θ g = 0 ) p c P i , g , t - 1 p c P i , g , t - 1 + p f ( 1 - P i , g , t - 1 ) i f Z i , g , t = 1 ( 1 - p c ) P i , g , t - 1 ( 1 - p c ) P i , g , t - 1 + ( 1 - p f ) ( 1 - P i , g , t - 1 ) i f Z i , g , t = 0 P i , g , t - 1 o t h e r w i s e . - - - ( 11 )
在0<pc<1和0<pf<1时,为了简化运算,设
Q i , g , t = Δ l n ( 1 P i , g , t - 1 ) - - - ( 12 )
则概率更新规则变换为
Q i , g , t = Q i , g , t - 1 + ln p f p c i f Z i , g , t = 1 Q i , g , t - 1 + ln 1 - p f 1 - p c i f Z i , g , t = 0 Q i , g , t - 1 o t h e r w i s e . - - - ( 13 )
这样,对于根据Zi,g,t更新的Pi,g,t∈(0,1),Pi,g,t和Qi,g,t存在一对一映射,可以实现从Qi,g,t恢复Pi,g,t
(2)对更新后的概率图进行信息融合,获取目标存在概率
在上述过程中,无人机vi利用传感器探测到的新息对上一时刻t-1的概率图Hi,g,t进行更新。每架无人机将更新后的概率图传输给它当前的邻居,邻居由通信距离和各自的位置决定。然后,利用线性组合的方式对自身更新的概率图和通信获取的邻居概率图进行融合,如下式
Q i , g , t = ω i , i , t H i , g , t - 1 + Σ j ∈ N i ( t ) ω i , j , t H j , g , t - 1 - - - ( 14 )
其中ωi,j,t是无人机vi概率图Qj,g,t-1的权重。将不是无人机vi邻居个体的权重设为ωi,j,t=0,上式可以写成如下的形式。
Q i , g , t = Σ j = 1 N ω i , j , t H j , g , t - - - ( 15 )
这里Wt=(ωi,j)采用著名的Metropolis权重矩阵,表示为
ω i , i , t = { 1 1 + max { d i ( t ) , d j ( t ) } i f { i , j } ∈ ϵ ( t ) 1 - Σ { i , k } ∈ ϵ ( t ) ω i , k , t ( t ) i f i = j 0 o t h e r w i s e - - - ( 16 )
其中di(t),dj(t)表示节点i和j的度,在实际配置中,可将Wt∈Rn×n存储成稀疏矩阵的形式,减少所需存储空间。若无人机网络连通,则Wt为遍历性双随机矩阵,可使各概率图渐进稳定到平均一致性。该权重矩阵适用于分布式配置,无人机无需了解无人机网络的通信拓扑等全局信息,甚至不需要参与整个任务的无人机数目。
对于式(15)定义的分布式信息估计过程,如果执行任务的无人机网络通信拓扑满足以下两个条件之一,则能够保证渐进收敛到概率图初始状态的平均值:无人机的通信网络为连通图;无人机的通信网络为存在独立通信失败的连通图。
步骤四:根据目标存在概率更新不确定度,并进行多无人机协同搜索
通过与邻居通信进行信息融合,得到估计值||Qi,j,k||,该值用来刻画无人机vi对于任务区域Ω单元g的不确定度。||Qi,j,k||越大,无人机vi的不确定值越小,反之亦然。而搜索问题构造成了一个具有受限行动集的势博弈,并利用双对数-线性学习方法进行协调运动。因此,利用||Qi,j,k||构造势博弈效用函数中的密度函数η(q),形式如下:
η i , g , k = Δ e - k η || Q i , g , k || . - - - ( 17 )
其中kη为正的增益参数,设置kη=1,ηi,g,k表示无人机vi在时刻k对于单元g的不确定度值。
通常,协同搜索问题被分解为三个连续的部分:协调运动、传感器观测、信息融合更新。开始更新前,每个无人机初始化一个概率图,该图存储着每个单元中目标存在的概率。随后无人机根据步骤二中建立的势博弈模型进行协调运动,以优化整体的搜索性能。当到达新的位置之后,无人机利用传感器对覆盖范围内的单元进行探测。随后,结合探测到的数据,无人机根据步骤三对各自的概率图进行更新,并通过与邻居个体进行通信进行信息融合。重复步骤二和步骤三,直至各单元的不确定度降低到设定的阈值之下,此时搜索任务完成,过程见附图3。
图4、图5(a)及图5(b)即为实验运行结果,图4为步骤一中定义的任务1的结果,图5(a)、图5(b)为任务2的结果。本发明所提出的多无人机协同搜索算法在已知任务区域信息和未知任务区域信息的情况下都能够成功实现对任务区域的搜索,实现对目标的搜索和覆盖,并具有较强的鲁棒性。
该发明为多个体分布式协调控制问题提供了一条非常有效的方法途径,可广泛应用于机器人、航空、航天等涉及分布式协同控制问题的领域。

Claims (1)

1.一种基于势博弈的多无人机协同搜索方法,其特征在于,该方法的步骤如下:
步骤一:多无人机协同搜索问题建模
用n架无人机对一个连续的任务区域进行搜索,记为V={v1,v2,...,vn};表示实数域;每架无人机作为独立的决策者采用分布式策略对任务区域进行探索,将连续的任务区域平均分配为M=Lx×Ly个单,其中,Lx,Ly表示任务区域横向、纵向分配的份数,M表示划分的单元的个数;每个单元用其中心位置g=[x,y]T等价代替;其中,x,y表示横、纵坐标的位置,T为数学符号转置;无人机vi在时刻t对其覆盖范围内的基本单元进行一次独立的测量,测量结果为Zi,g,t,其中μi,t表示无人机vi在时刻t的位置,Rsi表示无人机传感器的探测范围;若其中心位置位于之内,则某一单元g内的信息被无人机vi检测到;在时刻t,无人机vi执行一次测量,观测结果表示如下,
Z i , g , t = 1 , i f | g - μ i , t | ≤ R s i 0 , o t h e r w i s e . - - - ( 1 )
此外,将正确率和误警率分别定义为P(Zi,g,t=1|θg=1)=pc和P(Zi,g,t=1|θg=0)=pf,并假设这两个参数已知,且在整个任务执行过程中保持不变,其中θg表示目标存在于单元g中的概率;
对于多无人机网络的通信拓扑,将其建模为一个动态图Gt=(εt,vt),该动态图中vt为顶点集合,表示为vt={1,2,...,N},εt为连接边集合,表示为εt={{i,j}:i,j∈v;||μi,tj,t||≤RCi},其中μi,t和μj,t表示两个不同无人机vi和vj在时刻t的位置,RCi为无人机的通信范围;无人机vi在时刻t的邻居集合表示为Ni,t={j∈v|{i,j}∈εt}∪{i},为表征方便,设该无人机本身属于其邻居集合;无人机vi在时刻t的度记为di,t=|Ni,t|,表示它将自身位置信息和传感器信息传递给邻居个体的能力;
步骤二:多无人机协调运动的势博弈建模和双对数-线性学习法势博弈求解
2.1多无人机协调运动的势博弈建模
将多无人机协调运动建模成势博弈的过程中,包括三方面的要素:博弈参与者、参与者行动集及效用函数;博弈参与者即为参与搜索过程的n架无人机,需要考虑的为行动集和效用函数的设计;
博弈参与者行动集Ai的设计:它定义了博弈参与者可选择的全部行为,其中的元素被称为行动,是参与者在博弈过程中的决策变量;无人机的搜索效率取决于其传感器性能以及其所在的位置,将某一博弈者的行动集定义为在任务区域内它所能选择的位置,Ai={g|g∈Ω},无人机vi的行动表示为ai∈Ai,整个无人机群体的集体行动表示为a=(a1,a2,...,an),称作行动组合;设a(t-1)为无人机vi在时刻t-1的行动组合,则根据无人机运动特性以及障碍物等行动约束,将时刻t行动集简化为上一时刻行动集的函数,受限的行动集,记为对于博弈者任一行动ai∈Ai,有ai∈Ci(ai),即无人机被允许停留在上一时刻的位置;
在无人机被布置到任务器搜集信息时,密度函数η:用来记录无人机对任务区域内目标时间发生概率的了解程度;表示正的实数集;由于信号衰减,传感器性能随着目标单元与无人机位置之间的几何距离增大而降低,因此用非减可微函数f(||q-pi||):对传感器的信号强度进行量化分析,q∈Ω为任务区域中单元格的位置,pi为无人机vi的位置;无人机的性能用概率密度函数和信号衰减综合表示如下:
Φ ( a ) = Φ ( p 1 , p 2 , ... , p n ) = ∫ Ω f ( m i n i ∈ { 1 , 2 , ... n } | | q - p i | | ) η ( q ) d q - - - ( 2 )
其中
f ( | | q - p i | | ) = | | q - p i | | | | q - p i | | ≤ R S i 0 o t h e r w i s e
式中η(q)为密度函数,RSi为无人机vi的传感距离;
博弈参与者效用函数Ui(ai,a-i)的设计:无人机vi的效用函数设计为整体效用的边际贡献值,记做
U i ( a i , a - i ) = ∫ Ω f ( min i ∈ { 1 , 2 , ... , n } | | q - p i | | ) η ( q ) d q - ∫ Ω f ( min i ∈ { 1 , 2 , ... , i - 1 , i + 1 , ... , n } | | q - p i | | ) η ( q ) d q . - - - ( 3 )
根据势函数的定义,按照式(3)设计效用函数,构成的博弈为势博弈,满足势博弈的相关性质,能利用各种学习算法保证其最优性和收敛性;
2.2双对数-线性学习法的势博弈求解
采用双对数-线性学习法对问题进行求解,减少无人机计算资源的负担,有利于多无人机的实时运动控制;在双对数-线性学习法中,首先按异步时间模型以相同的概率随机选择一架无人机vi∈V改变其位置;与此同时,其他无人机保持之前的行动不变a-i(t)=a-i(t-1);选择出的无人机从其受限行动集Ci(ai(t-1))中选出尝试动作以改变其位置
P ( a ^ i = a i ) = 1 / z i , ∀ a i ∈ C i ( a i ( t - 1 ) ) \ a i ( t - 1 ) - - - ( 4 )
P ( a ^ i = a i ( t - 1 ) ) = 1 - ( | C i ( a i ( t - 1 ) ) | - 1 ) / z i - - - ( 5 )
其中zi表示无人机vi在受限行动集中行动的最大个数,表示为
无人机vi在选择出尝试动作后,在时刻t按照策略pi(t)∈Δ(Ai)来更新其动作,博弈者策略pi(t)定义如下:
p i a i ( t - 1 ) ( k ) = e 1 τ U i ( a ( t - 1 ) ) e 1 τ U i ( a ( t - 1 ) ) + e 1 τ U i ( a ^ i , a - i ( t - 1 ) ) - - - ( 6 )
p i a ^ i ( t ) = e 1 τ U i ( a ^ i , a - i ( t - 1 ) ) e 1 τ U i ( a ( t - 1 ) ) + e 1 τ U i ( a ^ i , a - i ( t - 1 ) ) - - - ( 7 )
式中Ui(a(t-1))和分别是无人机当前行动的效用以及按照选定尝试动作改变后的假想效用;式中参数τ定义了噪声的强度,即无人机作决策时在多大程度上会选择次优动作;当τ→0时,无人机会以概率1选择a-i(t-1)的最佳应对动作;注意,当时,时,
对于无人机vi∈V和其行动集中的任一对动作可达性表示存在一系列的行动对所有的t∈{1,2,...,m}满足对于无人机vi∈V和其行动集中的任一对动作表示其可逆性;对于构造成效用函数为式(2)的势博弈的多无人机协调运动问题,如果博弈者遵循双对数-线性学习法,并且其受限行动集满足可达性和可逆性,则无人机在t→∞,τ→0时将移动到最大化其覆盖性能的位置;
步骤三:根据传感器探测信息更新概率图,对更新后的概率图进行信息融合,获取目标存在概率
3.1根据传感器探测信息更新概率图
首先根据先验知识建立表征各无人机对任务区域的理解程度的概率图,然后通过贝叶斯规则和在运动过程中获得的信息对概率图进行更新,具体步骤如下;
在搜索过程中,每架无人机vi保存一个它对任务区域所有基础单元的概率图Pi,g,t表示在时刻t目标存在于单元g中的概率,θg=1和θg=0分别表示目标是否存在于单元g;无人机vi根据传感器观测信息Bi,t更新其概率图,公式如下
Pi,g,t=P(θg=1|Bi,t).(8)
目标存在于单元g在无人机vi在时刻t观测值为Zi,g,t时的条件概率P(θg=1|Zi,g,t)按照贝叶斯公式表示为
P ( θ g = 1 | Z i , g , t ) = P ( Z i , g , t | θ g = 1 ) P ( θ g = 1 ) P ( Z i , g , t ) - - - ( 9 )
其中P(θg=1)为目标存在于单元g中的先验概率;将无人机vi在前一时刻t-1对于目标存在于单元g的概率估计Pi,g,t-1作为先验概率,结合对于g在时刻t的观测Zi,g,t,式(9)变为
P i , g , t = P ( Z i , g , t | θ g = 1 ) P i , g , t - 1 P ( Z i , g , t ) - - - ( 10 )
根据贝叶斯公式上式的分母表示为P(Zi,g,t)=P(Zi,g,tg=1)P(θg=1)+P(Zi,g,tg=0)P(θg=0),其中P(Zi,g,tg=1)和P(Zi,g,tg=0)为正确检测率和误警率,为建模部分中的pc和pf;将式(10)代入式(9)中,概率图更新规则表示如下,
P i , g , t = P ( θ g = 1 | Z i , g , t ) = P ( Z i , g , t | θ g = 1 ) P ( θ g = 1 ) P ( Z i , g , t | θ g = 1 ) P ( θ g = 1 ) + P ( Z i , g , t | θ g = 0 ) P ( θ g = 0 ) = p c P i , g , t - 1 p c P i , g , t - 1 + p f ( 1 - P i , g , t - 1 ) i f Z i , g , t = 1 ( 1 - p c ) P i , g , t - 1 ( 1 - p c ) P i , g , t - 1 + ( 1 - p f ) ( 1 - P i , g , t - 1 ) i f Z i , g , t = 0 P i , g , t - 1 o t h e r w i s e . - - - ( 11 )
在0<pc<1和0<pf<1时,为了简化运算,设
Q i , g , t = Δ l n ( 1 P i , g , t - 1 ) - - - ( 12 )
则概率更新规则变换为
Q i , g , t = Q i , g , t - 1 + l n p f p c i f Z i , g , t = 1 Q i , g , t - 1 + l n 1 - p f 1 - p c i f Z i , g , t = 0 Q i , g , t - 1 o t h e r w i s e . - - - ( 13 )
这样,对于Pi,g,t∈(0,1),Pi,g,t和Qi,g,t存在一对一映射,实现从Qi,g,t恢复Pi,g,t
3.2对更新后的概率图进行信息融合,获取目标存在概率
在步骤三中“根据传感器探测信息更新概率图”部分,无人机vi利用传感器探测到的新息对上一时刻t-1的概率图Hi,g,t进行更新;每架无人机将更新后的概率图传输给它当前的邻居,邻居由通信距离和各自的位置决定;然后,利用线性组合的方式对自身更新的概率图和通信获取的邻居概率图进行融合,如下式
Q i , g , t = ω i , i , t H i , g , t - 1 + Σ j ∈ N i ( t ) ω i , j , t H j , g , t - 1 - - - ( 14 )
其中ωi,j,t是无人机vi概率图Qj,g,t-1的权重;将不是无人机vi邻居个体的权重设为ωi,j,t=0,上式写成如下的形式;
Q i , g , t = Σ j = 1 N ω i , j , t H j , g , t - - - ( 15 )
这里Wt=(ωi,j)采用著名的Metropolis权重矩阵,表示为
ω i , i , t = 1 1 + max { d i ( t ) , d j ( t ) } i f { i , j } ∈ ϵ ( t ) 1 - Σ { i , k } ∈ ϵ ( t ) ω i , k , t ( t ) i f i = j 0 o t h e r w i s e - - - ( 16 )
其中di(t),dj(t)表示节点i和j的度,在实际配置中,将Wt∈Rn×n存储成稀疏矩阵的形式,减少所需存储空间;若无人机网络连通,则Wt为遍历性双随机矩阵,使各概率图渐进稳定到平均一致性;该权重矩阵适用于分布式配置,无人机无需了解无人机网络的通信拓扑等全局信息,甚至不需要参与整个任务的无人机数目;
对于式(15)定义的分布式信息估计过程,如果执行任务的无人机网络通信拓扑满足以下两个条件之一,则能够保证渐进收敛到概率图初始状态的平均值:或者无人机的通信网络为连通图;或者无人机的通信网络为存在独立通信失败的连通图;
步骤四:根据目标存在概率更新不确定度,并进行多无人机协同搜索
通过与邻居通信进行信息融合,得到估计值||Qi,j,k||,该值用来刻画无人机vi对于任务区域Ω单元g的不确定度;||Qi,j,k||越大,无人机vi的不确定值越小,反之亦然;而搜索问题构造成了一个具有受限行动集的势博弈,并利用双对数线性学习方法进行协调运动;因此,利用||Qi,j,k||构造势博弈效用函数中的密度函数η(q),形式如下:
η i , g , k = Δ e - k η | | Q i , g , k | | - - - ( 17 )
其中kη为正的增益参数,ηi,g,k表示无人机vi在时刻k对于单元g的不确定度值;
协同搜索问题被分解为三个连续的部分:协调运动、传感器观测和信息融合更新;开始更新前,每个无人机初始化一个概率图,该图存储着每个单元中目标存在的概率;随后无人机根据步骤二中建立的势博弈模型进行协调运动,以优化整体的搜索性能;当到达新的位置之后,无人机利用传感器对覆盖范围内的单元进行探测;随后,结合探测到的数据,无人机根据步骤三对各自的概率图进行更新,并通过与邻居个体进行通信进行信息融合;重复步骤二和步骤三,直至各单元的不确定度降低到设定的阈值之下,此时搜索任务完成。
CN201610143227.0A 2016-03-14 2016-03-14 一种基于势博弈的多无人机协同搜索方法 Active CN105700555B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610143227.0A CN105700555B (zh) 2016-03-14 2016-03-14 一种基于势博弈的多无人机协同搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610143227.0A CN105700555B (zh) 2016-03-14 2016-03-14 一种基于势博弈的多无人机协同搜索方法

Publications (2)

Publication Number Publication Date
CN105700555A true CN105700555A (zh) 2016-06-22
CN105700555B CN105700555B (zh) 2018-04-27

Family

ID=56221628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610143227.0A Active CN105700555B (zh) 2016-03-14 2016-03-14 一种基于势博弈的多无人机协同搜索方法

Country Status (1)

Country Link
CN (1) CN105700555B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959700A (zh) * 2017-03-21 2017-07-18 北京航空航天大学 一种基于上限置信区间算法的无人机群协同巡逻追踪轨迹规划方法
CN106991691A (zh) * 2017-02-24 2017-07-28 北京理工大学 一种适用于摄像机网络下的分布式目标跟踪方法
CN107832850A (zh) * 2017-10-27 2018-03-23 合肥工业大学 对抗环境下无人机占位决策的矩阵博弈方法及装置
CN107844129A (zh) * 2017-11-30 2018-03-27 北京大学深圳研究生院 基于路径规划和信息融合的多无人机协同搜索方法及系统
CN108549233A (zh) * 2018-05-04 2018-09-18 南京航空航天大学 一种带有直觉模糊信息的无人机空战机动博弈方法
CN108616302A (zh) * 2018-04-28 2018-10-02 中国人民解放军陆军工程大学 一种功率控制下的无人机多重覆盖模型及部署方法
CN108632831A (zh) * 2018-05-11 2018-10-09 南京航空航天大学 一种基于动态航迹的无人机群频谱资源分配方法
CN108873936A (zh) * 2018-07-09 2018-11-23 北京电子工程总体研究所 一种基于势博弈的飞行器自主编队方法
CN109635917A (zh) * 2018-10-17 2019-04-16 北京大学 一种多智能体合作决策及训练方法
CN109656271A (zh) * 2018-12-27 2019-04-19 杭州电子科技大学 一种基于数据关联思想的航迹软关联方法
CN109947136A (zh) * 2019-02-28 2019-06-28 清华大学 一种面向无人机群体快速目标搜索的协同主动感知方法
CN110007617A (zh) * 2019-03-29 2019-07-12 北京航空航天大学 一种飞行器半实物仿真系统的不确定度传递分析方法
CN110274588A (zh) * 2019-06-19 2019-09-24 南京航空航天大学 基于无人机集群信息的双层嵌套因子图多源融合导航方法
CN110381442A (zh) * 2019-08-17 2019-10-25 西北工业大学 一种基于隐式信息交互方式的群机器人目标搜索方法
CN110414685A (zh) * 2019-06-20 2019-11-05 合肥工业大学 多无人机任务分配的纳什均衡博弈智能决策方法及系统
CN111142553A (zh) * 2019-12-11 2020-05-12 北京航空航天大学 基于生物捕食能量模型的无人机集群自主任务分配方法
CN111221352A (zh) * 2020-03-03 2020-06-02 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统
CN111487986A (zh) * 2020-05-15 2020-08-04 中国海洋大学 基于全局信息传递机制的水下机器人协同目标搜索方法
CN112363539A (zh) * 2020-11-18 2021-02-12 中国海洋大学 多无人机协同目标搜索方法
WO2021102676A1 (zh) * 2019-11-26 2021-06-03 深圳市大疆创新科技有限公司 物体状态获取方法、可移动平台及存储介质
CN113450282A (zh) * 2021-07-12 2021-09-28 上海交通大学 美化图像的方法和系统
CN113867418A (zh) * 2021-09-17 2021-12-31 南京信息工程大学 一种无人机集群自主协同侦察任务调度方法
CN114237275A (zh) * 2021-09-30 2022-03-25 中国人民解放军陆军工程大学 基于感知-锁定-发现的多无人机博弈协同搜索方法
CN114401037A (zh) * 2022-03-24 2022-04-26 武汉大学 基于联盟形成博弈的无人机通信网络流量卸载方法及系统
CN114501551A (zh) * 2022-04-02 2022-05-13 中国人民解放军军事科学院国防科技创新研究院 基于有序势博弈的多用户分布式异构网络选择策略方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246289A (zh) * 2013-05-07 2013-08-14 西北工业大学 带通信约束的多无人机协同搜索中的目标分配方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246289A (zh) * 2013-05-07 2013-08-14 西北工业大学 带通信约束的多无人机协同搜索中的目标分配方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
HAIBIN DUAN等: "《A Predator-prey Particle Swarm Optimization Approach to Multiple UCAV Air Combat Modeled by Dynamic Game Theory》", 《IEEE/CAA JOURNAL OF AUTOMATICA SINICA》 *
YIREN CHEN等: "Multiple UCAVs Mission Assignment Based on Modified Gravitational Search", 《2014 11TH IEEE INTERNATIONAL CONFERENCE ON CONTROL&AUTOMATION》 *
周志强等: "基于贝叶斯网络的博弈融合态势评估方法", 《计算机与数字工程》 *
李沛等: "基于改进万有引力搜索算法的无人机航路规划", 《中国科学》 *
杜继永等: "多UAV协同搜索的博弈论模型及快速求解方法", 《上海交通大学学报》 *
段海滨等: "基于模糊规则和动态蚁群-贝叶斯网络的无人作战飞机态势评估", 《智能系统学报》 *

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991691A (zh) * 2017-02-24 2017-07-28 北京理工大学 一种适用于摄像机网络下的分布式目标跟踪方法
CN106991691B (zh) * 2017-02-24 2019-10-18 北京理工大学 一种适用于摄像机网络下的分布式目标跟踪方法
CN106959700A (zh) * 2017-03-21 2017-07-18 北京航空航天大学 一种基于上限置信区间算法的无人机群协同巡逻追踪轨迹规划方法
CN106959700B (zh) * 2017-03-21 2019-08-27 北京航空航天大学 一种基于上限置信区间算法的无人机群协同巡逻追踪轨迹规划方法
CN107832850A (zh) * 2017-10-27 2018-03-23 合肥工业大学 对抗环境下无人机占位决策的矩阵博弈方法及装置
CN107844129A (zh) * 2017-11-30 2018-03-27 北京大学深圳研究生院 基于路径规划和信息融合的多无人机协同搜索方法及系统
CN107844129B (zh) * 2017-11-30 2021-03-23 北京大学深圳研究生院 基于路径规划和信息融合的多无人机协同搜索方法及系统
CN108616302B (zh) * 2018-04-28 2020-10-30 中国人民解放军陆军工程大学 一种功率控制下的无人机多重覆盖模型及部署方法
CN108616302A (zh) * 2018-04-28 2018-10-02 中国人民解放军陆军工程大学 一种功率控制下的无人机多重覆盖模型及部署方法
CN108549233A (zh) * 2018-05-04 2018-09-18 南京航空航天大学 一种带有直觉模糊信息的无人机空战机动博弈方法
CN108549233B (zh) * 2018-05-04 2021-04-16 南京航空航天大学 一种带有直觉模糊信息的无人机空战机动博弈方法
CN108632831B (zh) * 2018-05-11 2021-08-10 南京航空航天大学 一种基于动态航迹的无人机群频谱资源分配方法
CN108632831A (zh) * 2018-05-11 2018-10-09 南京航空航天大学 一种基于动态航迹的无人机群频谱资源分配方法
CN108873936A (zh) * 2018-07-09 2018-11-23 北京电子工程总体研究所 一种基于势博弈的飞行器自主编队方法
CN108873936B (zh) * 2018-07-09 2021-06-04 北京电子工程总体研究所 一种基于势博弈的飞行器自主编队方法
CN109635917A (zh) * 2018-10-17 2019-04-16 北京大学 一种多智能体合作决策及训练方法
CN109656271A (zh) * 2018-12-27 2019-04-19 杭州电子科技大学 一种基于数据关联思想的航迹软关联方法
CN109656271B (zh) * 2018-12-27 2021-11-02 杭州电子科技大学 一种基于数据关联思想的航迹软关联方法
CN109947136A (zh) * 2019-02-28 2019-06-28 清华大学 一种面向无人机群体快速目标搜索的协同主动感知方法
CN109947136B (zh) * 2019-02-28 2020-07-10 清华大学 一种面向无人机群体快速目标搜索的协同主动感知方法
CN110007617A (zh) * 2019-03-29 2019-07-12 北京航空航天大学 一种飞行器半实物仿真系统的不确定度传递分析方法
CN110274588A (zh) * 2019-06-19 2019-09-24 南京航空航天大学 基于无人机集群信息的双层嵌套因子图多源融合导航方法
CN110414685B (zh) * 2019-06-20 2020-08-28 合肥工业大学 多无人机任务分配的纳什均衡博弈智能决策方法及系统
CN110414685A (zh) * 2019-06-20 2019-11-05 合肥工业大学 多无人机任务分配的纳什均衡博弈智能决策方法及系统
CN110381442A (zh) * 2019-08-17 2019-10-25 西北工业大学 一种基于隐式信息交互方式的群机器人目标搜索方法
WO2021102676A1 (zh) * 2019-11-26 2021-06-03 深圳市大疆创新科技有限公司 物体状态获取方法、可移动平台及存储介质
CN111142553A (zh) * 2019-12-11 2020-05-12 北京航空航天大学 基于生物捕食能量模型的无人机集群自主任务分配方法
CN111221352A (zh) * 2020-03-03 2020-06-02 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统
CN111221352B (zh) * 2020-03-03 2021-01-29 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统
CN111487986A (zh) * 2020-05-15 2020-08-04 中国海洋大学 基于全局信息传递机制的水下机器人协同目标搜索方法
CN111487986B (zh) * 2020-05-15 2021-03-16 中国海洋大学 基于全局信息传递机制的水下机器人协同目标搜索方法
CN112363539A (zh) * 2020-11-18 2021-02-12 中国海洋大学 多无人机协同目标搜索方法
CN112363539B (zh) * 2020-11-18 2021-09-21 中国海洋大学 多无人机协同目标搜索方法
CN113450282A (zh) * 2021-07-12 2021-09-28 上海交通大学 美化图像的方法和系统
CN113867418A (zh) * 2021-09-17 2021-12-31 南京信息工程大学 一种无人机集群自主协同侦察任务调度方法
CN114237275A (zh) * 2021-09-30 2022-03-25 中国人民解放军陆军工程大学 基于感知-锁定-发现的多无人机博弈协同搜索方法
CN114401037A (zh) * 2022-03-24 2022-04-26 武汉大学 基于联盟形成博弈的无人机通信网络流量卸载方法及系统
CN114401037B (zh) * 2022-03-24 2022-06-17 武汉大学 基于联盟形成博弈的无人机通信网络流量卸载方法及系统
CN114501551A (zh) * 2022-04-02 2022-05-13 中国人民解放军军事科学院国防科技创新研究院 基于有序势博弈的多用户分布式异构网络选择策略方法
CN114501551B (zh) * 2022-04-02 2022-07-01 中国人民解放军军事科学院国防科技创新研究院 基于有序势博弈的多用户分布式异构网络选择策略方法

Also Published As

Publication number Publication date
CN105700555B (zh) 2018-04-27

Similar Documents

Publication Publication Date Title
CN105700555A (zh) 一种基于势博弈的多无人机协同搜索方法
Shakeri et al. Design challenges of multi-UAV systems in cyber-physical applications: A comprehensive survey and future directions
Khan et al. Cooperative robots to observe moving targets
Aggarwal et al. Path planning techniques for unmanned aerial vehicles: A review, solutions, and challenges
CN105892480B (zh) 异构多无人机系统协同察打任务自组织方法
CN104407619B (zh) 不确定环境下的多无人机同时到达多个目标方法
Zhang et al. A review of cooperative path planning of an unmanned aerial vehicle group
CN108731684B (zh) 一种多无人机协同区域监视的航路规划方法
CN113487221B (zh) 面向动态目标观测的空天异构对地观测资源协同调度方法
CN108897312A (zh) 多无人飞行器对大规模环境的持续监控路径规划方法
CN112580537B (zh) 一种用于多无人机系统持续覆盖特定区域的深度强化学习方法
CN111381499B (zh) 基于三维空间射频地图学习的网联飞行器自适应控制方法
Sharma Evolution of unmanned aerial vehicles (UAVs) with machine learning
Desaraju et al. Vision-based Landing Site Evaluation and Trajectory Generation Toward Rooftop Landing.
CN110825112B (zh) 基于多无人机的油田动态侵入目标追踪系统与方法
Hu et al. Multi-UAV coverage path planning: a distributed online cooperation method
Li et al. An adaptive online co-search method with distributed samples for dynamic target tracking
CN113536564B (zh) 基于虚拟仿真的无人蜂群自主协同评估方法及系统
Sai et al. A comprehensive survey on artificial intelligence for unmanned aerial vehicles
Julian et al. Autonomous distributed wildfire surveillance using deep reinforcement learning
CN114237275A (zh) 基于感知-锁定-发现的多无人机博弈协同搜索方法
Orfanus et al. Comparison of UAV-based reconnaissance systems performance using realistic mobility models
Shrestha et al. A distributed deep learning approach for a team of unmanned aerial vehicles for wildfire tracking and coverage
Leong et al. Integrated perception and tactical behaviours in an auto-organizing aerial sensor network
Pisarenko et al. The Structure of the Information Storage “CONTROL_TEA” for UAV Applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant