CN113395708B - 基于全局环境预测的多自主体集中式区域覆盖方法与系统 - Google Patents
基于全局环境预测的多自主体集中式区域覆盖方法与系统 Download PDFInfo
- Publication number
- CN113395708B CN113395708B CN202110789578.XA CN202110789578A CN113395708B CN 113395708 B CN113395708 B CN 113395708B CN 202110789578 A CN202110789578 A CN 202110789578A CN 113395708 B CN113395708 B CN 113395708B
- Authority
- CN
- China
- Prior art keywords
- prediction
- autonomous
- coverage
- base station
- global
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W16/00—Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
- H04W16/18—Network planning tools
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于全局环境预测的多自主体集中式区域覆盖方法与系统。本发明方法中,基站接收各自主体位置及环境数据,基于稀疏近似高斯过程回归方法预测全局环境密度函数,并给出全局预测方差;基站再基于全局预测方差设计自主体控制方案决策模型,通过决策模型对各自主体分配任务,针对决策指标为预测的自主体,基于全局预测方差设计有限步长预测优先控制器,针对决策指标为覆盖的自主体,基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器;通过自主体和基站的持续交互,实现最优覆盖控制。本发明使基站‑多自主体系统自主捕获具有高准确度和高性能的环境密度函数模型,同时使多自主体在有限步长限制下快速实现理想的最优区域覆盖。
Description
技术领域
本发明涉及一种基于全局环境预测的多自主体集中式区域覆盖方法与系统,属于多自主体协同覆盖领域和多自主体智能任务执行技术领域。
背景技术
新世纪以来,随着组网通信及计算机技术的迅猛发展,以无人机集群技术为代表的多自主体集群技术也得到了极大的发展。相比于单个自主体系统,多自主体系统对环境的适应能力更强,具有较好的鲁棒特性能够协同完成更复杂的任务,在联合搜救、巡逻监测、信息采集、救灾消防及军事作战等领域有着广泛的应用。综合考虑多自主体系统发展现状,信息收集和环境监测是各类多自主体系统目前最能发挥其竞争优势的应用领域之一,能广泛应用于各项任务之中,而覆盖任务区域是对环境进行有效监测和信息收集的基础和前提,即多自主体系统需要在给定的时间内迅速覆盖任务区域内感兴趣的目标,任务区域环境信息的不确定度将迅速降低,使得多自主体系统能够在下一阶段任务中获取最大感知收益,例如,在任务环境内高效执行诸如人道救援、空间探测、环境建模、侦察防御等任务。
研究多自主体覆盖控制问题是具有重大意义的,故已有许多研究基于此课题展开。多自主体覆盖控制通过定义面向任务需求的目标函数并将其优化,帮助多自主体系统在任务区域形成最优覆盖。一种经典的分布式覆盖控制方法见文献[1](参见Cortes J,Martinez S,Karatas T, Bullo F.Coverage control for mobile sensing networks[J].IEEE Transactions on robotics and Automation.2004,20(2):243-55.),上述方法利用计算几何中的维诺图理论,将任务区域划分成多个互不重叠的维诺单元,此划分基于多自主体位置得到,每个自主体将对应一个维诺单元,维诺划分构建了更优形式的目标函数,并且当各自主体均处于相应维诺单元的质心时,新目标函数有局部最优值,利用Lloyd算法(又称k-均值聚类算法)设计分布式覆盖控制器,连续迭代生成维诺划分、质心及多自主体控制输入,每个自主体将收敛到各自维诺单元的质心。此文献发表后,许多研究者对此进行了深入拓展,以应对更复杂、更多样的实际问题,然而其中大部分研究包括文献[1],往往假设任务区域的环境密度函数已知,并以此作为覆盖算法的支撑,忽略了环境密度函数几乎不可能提前知道的真相。
高斯过程回归(GPR)是一类统计学习方法见文献[2](参见Williams C K,Rasmussen C E. Gaussian Processes for Machine Learning[M].USA:MIT Press,2006.),用于预测未知函数,并生成预测方差。高斯过程回归是一类非参数贝叶斯模型,它发现于神经网络技术趋于成熟并出现弊端的时期,与神经网络技术不同,此类方法完全由数据驱动,无需考虑函数模型的先验信息,适用于对完全未知的函数进行预测。此外,它通过贝叶斯推断生成概率模型,进而获得预测结果,大大降低了过拟合的风险,同时推断中还将数据的观测噪音纳入考虑,这是一类具有高准确度和高性能的回归方法。高斯过程回归是一种较理想的预测模型,但不可否认其存在计算费用昂贵的弊端,为解决此难题,近年来已有可观数量及质量的研究提出了多种解决办法见文献[3](参见Liu H T,Ong Y-S,ShenX B,and Cai J F.When Gaussian process meets big data:Areview of scalable GPs[J].arXiv preprint arXiv:1807.01065,2018.)。
目前,尚未发现已有研究可以较好解决多自主体系统在未知环境下的任务区域覆盖问题。要解决此问题,需要多自主体系统在有限时间内迅速完成预测未知环境密度函数的任务和覆盖任务区域的任务,极具挑战性,还未见到有效方案。
发明内容
发明目的:针对目前多自主体系统在在未知环境下的任务区域覆盖控制方法空缺,本发明提出一种基于全局环境预测的多自主体集中式区域覆盖方法与系统,通过统计学习方法预测全局未知环境密度函数,基站-多自主体系统可实现最优区域覆盖任务。多自主体采集环境数据并发送于基站,基站通过一种稀疏近似高斯过程回归方法快速获得环境密度函数预测模型,并基于此模型对多自主体做出下一步指示,该方法使基站-多自主体系统自主捕获具有高准确度和高性能的环境密度函数模型,同时使多自主体在有限步长限制下快速实现理想的最优区域覆盖。
技术方案:为了实现上述目的,本发明提出的基于全局环境预测的多自主体集中式区域覆盖方法,包括以下步骤:
基站接收各自主体坐标及采集的环境数据,基于稀疏近似高斯过程回归方法预测全局环境密度函数,并计算全局预测方差;
基于全局预测方差设计自主体控制方案决策模型,当自主体对应单元的预测方差大于等于设定阈值时,决策指标为预测,当自主体对应单元的预测方差小于设定阈值时,决策指标为覆盖;
基站通过决策模型对各自主体分配任务,针对决策指标为预测的自主体,基于全局预测方差设计有限步长预测优先控制器,针对决策指标为覆盖的自主体,基于最优区域覆盖Lloyd 算法设计有限步长覆盖优先控制器。
作为优选,基站接收的第i个自主体的坐标及采集的环境数据表示为(xN(m-1)+i,yN(m-1)+i),其中,xN(m-1)+i∈Rn为第i个自主体第m次采集数据时的位置向量,N为自主体总数,n为任务区域D的维数,yN(m-1)+i∈R为第i个自主体在当前位置采集到的环境值。
进一步地,所述稀疏近似高斯过程回归方法为基于幂期望传播PEP方法的稀疏高斯过程回归方法,基站通过基于PEP方法的稀疏高斯过程回归方法预测全局环境密度函数,并计算全局预测方差,具体为:
假设基站第m次接收各自主体数据{(xN(m-1)+i,yN(m-1)+i),i=1,2,...,N}并存储,基站当前存储的全部数据为{(xi,yi),i=1,2,...,mN};假设环境密度函数服从先验高斯过程φ(x)~GP(0,k(x,x′)),其中0为均值函数,k(x,x′)为协方差函数,假设环境中的观测噪声为高斯白噪声i=1,2,...,mN,其中σy为噪声标准差;
采用幂期望传播收敛形式,通过迭代贝叶斯近似推断,后验分布结果为:
其中为后验均值函数即预测的环境密度函数,∑(x)为预测方差函数,设 u={x′i∈D,i=1,2,...,M}为伪输入点集,M为伪输入点数量,引入 Kxu=[k(x,x′1),k(x,x′2),...,k(x,x′M)],KXu=(k(xi,x′j))ij,i=1,2,...,mN,j=1,2,...,M,KXX=(k(xi,xj))ij,i,j=1,2,...,mN,Kuu=(k(x′i,x′j))ij,i,j=1,2,...,M为协方差向量、矩阵,k(x,x)为k(x,x′)代入x和x本身, VXX=KXX-QXX,diag(VXX)为VXX取对角线构成的对角阵,α∈[0,1] 为指数因子,y=[y1,y2,...,ymN]T为观测值向量,I为单位矩阵。
进一步地,用于超参数训练的对数边缘似然函数为:
作为优选,基站基于全局预测方差设计自主体控制方案决策模型,具体为:
假设基站第m次进行决策,记第i个自主体当前位置为pi=xN(m-1)+i,i=1,2,...,N,N为自主体总数,基站在区域D上进行维诺划分:
其中||·||表示L2范数,每个自主体i都有与之对应的维诺单元Vi,对区域D进行网格划分,网格化后的区域点集为记i=1,2,...,N,基站在上进行预测得到预测环境值集合和预测方差集合通过和设定阈值∑tol∈(0,1) 进行决策:
作为优选,基站基于全局预测方差设计有限步长预测优先控制器,具体为:
假设每次迭代自主体的运动时长均为S,运动最大步长均为H;
有限步长预测优先控制器由如下表示:
其中vi为第i个自主体速度向量,H/S为自主体的最大移动速率。
作为优选,基站基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器,具体为:
假设每次迭代自主体的运动时长均为S,运动最大步长均为H,最优覆盖任务指基于环境密度函数预测模型的覆盖函数的局部最小化,即
其中P={pi,i=1,2,...,N},W={Wi,i=1,2,...,N}为对应各自主体的对区域D的任意划分,N为自主体总数,f(s)=s2为感知收益函数,用于评估自主体对区域中点的感知性能;
当W为维诺划分时,即W=V={Vi,i=1,2,...,N},覆盖函数有更小值
对HV(P)分别关于pi,i=1,2,...,N求微分,可得当pi,i=1,2,...,N恰好为区域Vi的质心时, HV(P)有局部最小值,即
为减少计算量,通过网格划分进行积分近似,求得近似质心
其中dv为网格划分中每一点的对应体积元;
采用Lloyd算法设计有限步长覆盖优先控制器,最终将实现HV(P)局部最小化收敛:
基于相同的发明构思,本发明提出的基于全局环境预测的多自主体集中式区域覆盖系统,包括基站和区域内多个自主体;
所述自主体,用于采集环境数据,向基站发送自身位置及环境数据,以及,接收基站指派的控制任务并进行动作;
所述基站,用于接收各自主体坐标及采集的环境数据,基于稀疏近似高斯过程回归方法预测全局环境密度函数,并计算全局预测方差;基于全局预测方差设计自主体控制方案决策模型,当自主体对应单元的预测方差大于等于设定阈值时,决策指标为预测,当自主体对应单元的预测方差小于设定阈值时,决策指标为覆盖;以及通过决策模型对各自主体分配任务,针对决策指标为预测的自主体,基于全局预测方差设计有限步长预测优先控制器,针对决策指标为覆盖的自主体,基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器。
基于相同的发明构思,本发明提出的一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的基于全局环境预测的多自主体集中式区域覆盖方法。
有益效果:相对于现有技术,本发明的优点如下:
1)相对于大部分多自主体系统覆盖控制方法只适用于任务环境密度函数已知的情况,本发明提出的基于全局环境预测的多自主体集中式区域覆盖方法填补了这一空缺,使得多自主体在完全未知的环境下仍能较好完成覆盖任务,从而快速减少任务环境信息的不确定性,适用于无人机群、无人车群等实操多自主体系统。
2)相对于大部分机器学习和深度学习方法,本发明提出的稀疏近似高斯过程回归方法无需任务环境先验信息,过拟合风险低,通过数据驱动就可以生成具有高准确度和高性能的环境密度函数预测模型,其中,高斯过程回归产生的预测方差起着关键作用,有着指导基站- 多自主体自主完善预测模型的功能。
3)相对于传统的高斯过程回归方法,本发明进一步提出的基于PEP方法的稀疏高斯过程回归方法大幅减少了计算量,涵盖两种实用且流行的稀疏近似高斯过程回归方法,在保证预测模型准确度和性能的前提下,仍可以快速处理大规模数据量,保障了任务执行过程中的实时性,有助于多自主体在有限步长限制下快速实现理想最优区域覆盖。
4)本发明设计的自主体控制方案决策模型以及两种控制器,使得基站可灵活切换多自主体任务,通过有限步长预测优先控制器和有限步长覆盖优先控制器的结合使用,使得实际最优覆盖效果快速提升,有助于多自主体在有限步长限制下快速实现理想最优区域覆盖。
5)本发明所提出的基于全局环境预测的多自主体集中式区域覆盖方法不仅适用于全向有限步长的自主体和凸区域情形,也可方便的拓展到其他外形的自主体和非凸区域情形,以及其他分布式协同覆盖控制问题,具有较广阔的应用前景以及实用性。
综上所述,相对于已有技术,本发明的优点如下:本发明提出的基于全局环境预测的多自主体集中式区域覆盖方法,可以有效实现在未知任务环境下,多自主体系统较好地形成任务区域覆盖网络,具有计算量小,应用范围广等优势,可适用于多类实际多自主体系统的覆盖控制任务。
附图说明
图1是本发明的基于全局环境预测的多自主体集中式区域覆盖方法步骤示意图;
图2是本发明的仿真实验中多自主体初始位置示意图;
图3是本发明的仿真实验中多自主体在未知环境下进行最优覆盖控制结果示意图;
图4是本发明的仿真实验中多自主体在已知环境下进行最优覆盖控制结果示意图;
图5是本发明的仿真实验中任务环境预测效果示意图;
图6是本发明的仿真实验中任务环境覆盖效果示意图;
图7是本发明的仿真实验中多自主体任务状态示意图。
具体实施方式
下面将结合附图和具体实施例就本发明的发明目的、技术方案、发明优点作进一步详细说明。
现有的多自主体系统任务区域覆盖控制方法主要采用基于维诺划分的分布式覆盖控制方法。当前这类方法几乎皆建立在任务环境密度函数已知的假设框架下,这显然是不合理的,因此此类覆盖控制方法在实用性上存在一定问题。
基于以上考虑,本发明实施例公开的一种基于全局环境预测的多自主体集中式区域覆盖方法,基站接收各自主体坐标及采集的环境数据,基于一种稀疏近似高斯过程回归方法预测全局环境密度函数,并给出全局预测方差,基站又通过决策模型对各自主体分配任务,针对决策指标为预测的自主体,基于全局预测方差设计有限步长预测优先控制器,针对决策指标为覆盖的自主体,基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器,通过自主体和基站的持续信息交互,实现在未知环境下的多自主体最优区域覆盖控制。
图1表示了本发明的基于全局环境预测的多自主体集中式区域覆盖方法步骤示意图。在介绍本发明各步骤之前,首先说明本发明任务区域坐标系及相关模型。
本发明实施例中,任务区域全局坐标系模型表示:
其中D为n维任务区域,在D上构建全局坐标系,x为D内任意一点的位置向量。
假设在区域D上,需探测的环境值与位置向量的全局密度函数模型由如下表示:
y=φ(x),x∈D
其中y∈R为真实环境值,如气体浓度、磁场强度等,φ(·)为位置向量与真实环境值的潜在密度函数关系。
本发明实施例中,自主体运动模型表示:
其中N为自主体总数,pi(t)∈Rn为第i个自主体位置向量,vi(t)∈Rn为第i个自主体速度向量,即控制输入。每个自主体皆为全向模型。
基于上述坐标系模型,自主体采集环境数据,向基站发送自身位置及环境数据具体可表示为:
假设N个自主体第m次采集数据。第i个自主体的位置向量为xN(m-1)+i∈Rn,第i个自主体在当前位置采集到的环境值为yN(m-1)+i∈R,第i个自主体向基站发送自身位置及环境数据 (xN(m-1)+i,yN(m-1)+i)。
具体地,本发明实施例公开的基于全局环境预测的多自主体集中式区域覆盖方法,步骤如下:
步骤1:基站接收各自主体坐标及采集的环境数据,基于稀疏近似高斯过程回归方法预测全局环境密度函数,并计算全局预测方差;
步骤2:基于全局预测方差设计自主体控制方案决策模型,当自主体对应单元的预测方差大于等于设定阈值时,决策指标为预测,当自主体对应单元的预测方差小于设定阈值时,决策指标为覆盖;
步骤3:基站通过决策模型对各自主体分配任务,针对决策指标为预测的自主体,基于全局预测方差设计有限步长预测优先控制器,针对决策指标为覆盖的自主体,基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器。
步骤1中基于一种稀疏近似高斯过程回归方法预测全局环境密度函数。该步骤的具体过程为:
假设基站第m次接收各自主体数据{(xN(m-1)+i,yN(m-1)+i),i=1,2,...,N}并存储,基站当前全部存储数据为{(xi,yi),i=1,2,...,mN}。基于当前数据,引入一种高斯过程回归(GPR)方法预测全局环境密度函数,高斯过程(GP)是指函数服从无穷维联合高斯分布,故其有限个函数值服从有限维联合高斯分布,传统的高斯过程回归方法先假设函数服从高斯先验分布,再通过由数据驱动的贝叶斯推断,获得此函数的后验分布,后验分布中的均值函数作为此函数的预测模型,后验分布中的协方差函数生成此函数的预测方差。此方法极具优越性,它是一种非参数的统计学习方法,预测结果均由数据生成,无需提前掌握函数的任何其他信息,适用于对未知环境的预测,此外,预测方差可视为预测函数的置信度,对于环境中置信度较低的点,多自主体在下一步行动中可以针对这些点采集数据,这将显著提高模型预测性能,通过多次迭代,将生成一个准确度较高的环境密度函数预测模型。由于传统高斯过程回归方法有着计算复杂度较高的局限性,不利于多自主体在探索过程中快速完成任务,故引入一种稀疏近似高斯过程回归方法——幂期望传播(PEP)方法,此方法有着较强的灵活性,通过对指数因子α的设定,涵盖了高斯过程领域目前最为流行的两种稀疏近似方法,完全独立训练条件(FITC)先验近似方法和变分自由能(VFE)后验近似方法。
假设环境密度函数服从先验高斯过程φ(x)~GP(0,k(x,x′)),表明函数服从无穷维联合高斯分布,其有限个函数值服从有限维联合高斯分布,其中0为均值函数,k(x,x′)为协方差函数,选取为对称、正定的核函数,这里采用径向基函数形式k(x,x′)=Aexp(-||x-x′||2/2l2),其中A和l是超参数,分别为幅值和长度尺度。记X={xi,i=1,...,mN}为训练输入集, Y={yi,i=1,...,mN}为训练观测集,Φ={φi=φ(xi),i=1,...,mN}为真实输出集,通过贝叶斯推断得到后验分布:
p(φ|Y)=∫p(Φ,φ|Y)dΦ
幂期望传播方法将训练数据逐点引入,前一步的后验分布作为后一步的先验分布迭代进行贝叶斯推断,推断中采用似然函数近似和联合分布近似的方法以减少计算复杂度,近似中引入指数因子α,当α=1时,此方法收敛形式等价于完全独立训练条件稀疏近似高斯过程回归方法,当α=0时,等价于变分自由能稀疏近似高斯过程回归方法。
采用幂期望传播收敛形式,后验分布结果为:
其中为后验均值函数即预测的环境密度函数,∑(x)为预测方差函数,设 u={x′i∈D,i=1,2,...,M}为伪输入点集,可随机选择或视做超参数通过训练得到,M为伪输入点数量,引入Kxu=[k(x,x′1),k(x,x′2),...,k(x,x′M)], KXu=(k(xi,x′j))ij,i=1,2,...,mN,j=1,2,...,M,KXX=(k(xi,xj))ij,i,j=1,2,...,mN, Kuu=(k(x′i,x′j))ij,i,j=1,2,...,M为协方差向量、矩阵,k(x,x)为k(x,x′)代入x和x本身,VXX=KXX-QXX,diag(VXX)为VXX取对角线构成的对角阵,α∈[0,1]为指数因子,y=[y1,y2,...,ymN]T为观测值向量,I为单位矩阵。
用于超参数训练的对数边缘似然函数为:
其中通过最大似然函数法训练超参数,将超参数视为自变量,使用共轭梯度法或BFGS法求解最大值,得到训练后的超参数。由于训练超参数的计算费用较高,采取间隔训练的方式,当m mod m0=0时,训练超参数,其中m0∈N+为间隔步数。当超参数在更新前后变化较小时,停止训练超参数。
步骤2中基于全局预测方差设计自主体控制方案决策模型,该步骤的具体过程为:
假设基站第m次进行决策,记第i个自主体当前位置为pi=xN(m-1)+i,i=1,2,...,N,N为自主体总数,基站在区域D上进行维诺划分:
其中||·||表示L2范数,每个自主体i都有与之对应的维诺单元Vi。对区域D进行网格划分,网格化后的区域点集为记基站在上进行预测得到预测环境值集合和预测方差集合通过和设定阈值∑tol∈(0,1) 进行决策:
步骤3中基站通过决策模型对各自主体分配任务,针对决策指标为预测的自主体,基于全局预测方差设计有限步长预测优先控制器,针对决策指标为覆盖的自主体,基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器。该步骤的具体过程为:
步骤3-1.基站依次针对各自主体运行步骤3-2。
步骤3-2.基站通过决策模型对自主体分配任务,若决策指标为预测,转至步骤3-3,若决策指标为覆盖,转至步骤3-4。
步骤3-3.设定每次迭代自主体的运动时长均为S,运动最大步长均为H。
设计如下有限步长预测优先控制器:
其中vi为第i个自主体速度向量,H/S为自主体的最大移动速率。
步骤3-4.设定每次迭代自主体的运动时长均为S,运动最大步长均为H。此步骤中需要优化如下覆盖函数
其中P={pi,i=1,2,...,N},W={Wi,i=1,2,...,N}为对应各自主体的对区域D的任意划分,N为自主体总数,f(s)=s2为感知收益函数,用于评估自主体对区域中点的感知性能。
引入维诺划分W=V={Vi,i=1,2,...,N}
考虑HV(P)的局部最小化。为求得极值,对HV(P)分别关于pi,i=1,2,...,N求微分
为减少计算量,通过步骤2的网格划分进行积分近似,求得近似质心
其中dv为网格划分中每一点的对应体积元。
为实现HV(P)局部最小化收敛,采用Lloyd算法设计如下有限步长覆盖优先控制器:
以下是本发明所设计的基于全局环境预测的多自主体集中式区域覆盖方法仿真验证实验。假设有12个自主体,任务区域为10m×10m的方形区域,多自主体初始位置由图2给出。每个自主体在每次迭代中最大步长为H=0.2m,任务区域网格划分的网格步长为0.1m,超参数训练的间隔步数为m0=10,自主体控制方案决策阈值为∑tol=0.05,任务迭代次数为300次。假设环境中的真实密度函数为复合高斯分布
观测噪声标准差为σy=1,由控制器设计步骤1,利用基于PEP方法的稀疏高斯过程回归方法对其进行预测,其中指数因子α=0,伪输入点集u视为超参数,通过训练得到。由控制器设计步骤2,给出多自主体任务分配指标。由控制器设计步骤3,给出多自主体运动控制器vi,i=1,2,...,12。迭代步骤1到步骤3,进而完成基于全局环境预测的多自主体集中式区域覆盖任务。仿真结果如图3至图7所示。图3显示,在未知环境密度函数时,使用所设计的最优覆盖控制器,多自主体位置的最终迭代结果,以及环境密度函数的预测模型。图4显示,在已知环境密度函数时,使用传统的基于维诺划分的最优覆盖控制器,多自主体位置的最终迭代结果,以及真实的环境密度函数模型。从图3和图4间的相似性可以看出,通过基于全局环境预测的多自主体集中式区域覆盖方法,不仅得到了较为准确的环境密度函数预测模型,与此同时,多自主体系统还实现了较为理想的最优覆盖控制结果。图5显示,全局预测方差平均值在迭代过程中呈减小趋势,同样验证了任务环境预测效果较好。图6显示,覆盖函数值在迭代过程中的初始阶段虽有上下波动,但随着预测效果的增强,其最终也呈减小趋势并收敛到较小值,同样验证了任务环境覆盖效果较好。图7显示多自主体的任务状态,可以看出在初始阶段多自主体均执行预测任务,随着预测效果的增强,自主体任务状态逐渐向覆盖靠拢,验证了步骤2所设计的控制方案决策模型的有效性。
由以上仿真实验结果可看出,本发明所设计的基于全局环境预测的多自主体集中式区域覆盖方法在未知环境下可以有效实现多自主体系统的最优覆盖控制,并且得到准确度较高且性能较好的任务环境模型,适用于实际多自主体系统覆盖控制应用。
本发明提供了一种基于全局环境预测的多自主体集中式区域覆盖方法,在未知环境下多自主体系统集中式最优覆盖控制应用中有令人满意的结果。
基于相同的发明构思,本发明实施例提供的一种基于全局环境预测的多自主体集中式区域覆盖系统,包括基站和区域内多个自主体;其中自主体用于采集环境数据,向基站发送自身位置及环境数据,以及,接收基站指派的控制任务并进行动作;基站用于接收各自主体坐标及采集的环境数据,基于稀疏近似高斯过程回归方法预测全局环境密度函数,并计算全局预测方差;基于全局预测方差设计自主体控制方案决策模型,当自主体对应单元的预测方差大于等于设定阈值时,决策指标为预测,当自主体对应单元的预测方差小于设定阈值时,决策指标为覆盖;以及通过决策模型对各自主体分配任务,针对决策指标为预测的自主体,基于全局预测方差设计有限步长预测优先控制器,针对决策指标为覆盖的自主体,基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器。
基于相同的发明构思,本发明实施例提供的一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被加载至处理器时实现所述的基于全局环境预测的多自主体集中式区域覆盖方法。
以上仅是本发明的优选实施方式,应当指出,以上实施列对本发明不构成限定,相关工作人员在不偏离本发明技术思想的范围内,所进行的多样变化和修改,均落在本发明的保护范围内。
Claims (3)
1.基于全局环境预测的多自主体集中式区域覆盖方法,其特征在于,该方法包括以下步骤:
基站接收各自主体坐标及采集的环境数据,基于稀疏近似高斯过程回归方法预测全局环境密度函数,并计算全局预测方差;
基于全局预测方差设计自主体控制方案决策模型,当自主体对应单元的预测方差大于等于设定阈值时,决策指标为预测,当自主体对应单元的预测方差小于设定阈值时,决策指标为覆盖;
基站通过决策模型对各自主体分配任务,针对决策指标为预测的自主体,基于全局预测方差设计有限步长预测优先控制器,针对决策指标为覆盖的自主体,基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器;
基站接收的第i个自主体的坐标及采集的环境数据表示为(xN(m-1)+i,yN(m-1)+i),其中,xN(m-1)+i∈Rn为第i个自主体第m次采集数据时的位置向量,N为自主体总数,n为任务区域D的维数,yN(m-1)+i∈R为第i个自主体在当前位置采集到的环境值;
所述稀疏近似高斯过程回归方法为基于幂期望传播PEP方法的稀疏高斯过程回归方法,基站通过基于PEP方法的稀疏高斯过程回归方法预测全局环境密度函数,并计算全局预测方差,具体为:
假设基站第m次接收各自主体数据{(xN(m-1)+i,yN(m-1)+i),i=1,2,...,N}并存储,基站当前存储的全部数据为{(xi,yi),i=1,2,...,mN};假设环境密度函数服从先验高斯过程φ(x)~GP(0,k(x,x′)),其中0为均值函数,k(x,x′)为协方差函数,假设环境中的观测噪声为高斯白噪声其中σy为噪声标准差;
采用幂期望传播收敛形式,通过迭代贝叶斯近似推断,后验分布结果为:
其中为后验均值函数即预测的环境密度函数,Σ(x)为预测方差函数,设u={x′i∈D,i=1,2,...,M}为伪输入点集,M为伪输入点数量,引入Kxu=[k(x,x′1),k(x,x′2),...,k(x,x′M)],KXu=(k(xi,x′j))ij,i=1,2,...,mN,j=1,2,...,M,KXX=(k(xi,xj))ij,i,j=1,2,...,mN,Kuu=(k(x′i,x′j))ij,i,j=1,2,...,M为协方差向量、矩阵,k(x,x)为k(x,x′)代入x和x本身,VXX=KXX-QXX,diag(VXX)为VXX取对角线构成的对角阵,α∈[0,1]为指数因子,y=[y1,y2,…,ymN]T为观测值向量,I为单位矩阵;
用于超参数训练的对数边缘似然函数为:
其中通过最大似然函数法训练超参数,将超参数视为自变量,使用共轭梯度法或BFGS法求解最大值,得到训练后的超参数,采取间隔训练的方式,当m mod m0=0时,训练超参数,其中m0∈N+为间隔步数;n为任务区域D的维数;
基站基于全局预测方差设计自主体控制方案决策模型,具体为:
假设基站第m次进行决策,记第i个自主体当前位置为pi=xN(m-1)+i,i=1,2,...,N,N为自主体总数,基站在区域D上进行维诺划分:
其中||·||表示L2范数,每个自主体i都有与之对应的维诺单元Vi,对区域D进行网格划分,网格化后的区域点集为记基站在上进行预测得到预测环境值集合和预测方差集合通过和设定阈值Σtol∈(0,1)进行决策:
基站基于全局预测方差设计有限步长预测优先控制器,具体为:
假设每次迭代自主体的运动时长均为S,运动最大步长均为H;
有限步长预测优先控制器由如下表示:
其中vi为第i个自主体速度向量,H/S为自主体的最大移动速率;
基站基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器,具体为:
假设每次迭代自主体的运动时长均为S,运动最大步长均为H,最优覆盖任务指基于环境密度函数预测模型的覆盖函数的局部最小化,即
其中P={pi,i=1,2,...,N},W={Wi,i=1,2,...,N}为对应各自主体的对区域D的任意划分,N为自主体总数,f(s)=s2为感知收益函数,用于评估自主体对区域中点的感知性能;
当W为维诺划分时,即W=V={Vi,i=1,2,...,N},覆盖函数有更小值
对HV(P)分别关于pi,i=1,2,…,N求微分,可得当pi,i=1,2,…,N恰好为区域Vi的质心时,HV(P)有局部最小值,即
为减少计算量,通过网格划分进行积分近似,求得近似质心
其中dv为网格划分中每一点的对应体积元;
采用Lloyd算法设计有限步长覆盖优先控制器,最终将实现HV(P)局部最小化收敛:
其中vi为第i个自主体速度向量,H/S为自主体的最大移动速率。
2.实现权利要求1所述的基于全局环境预测的多自主体集中式区域覆盖方法的基于全局环境预测的多自主体集中式区域覆盖系统,其特征在于,包括基站和区域内多个自主体;
所述自主体,用于采集环境数据,向基站发送自身位置及环境数据,以及,接收基站指派的控制任务并进行动作;
所述基站,用于接收各自主体坐标及采集的环境数据,基于稀疏近似高斯过程回归方法预测全局环境密度函数,并计算全局预测方差;基于全局预测方差设计自主体控制方案决策模型,当自主体对应单元的预测方差大于等于设定阈值时,决策指标为预测,当自主体对应单元的预测方差小于设定阈值时,决策指标为覆盖;以及通过决策模型对各自主体分配任务,针对决策指标为预测的自主体,基于全局预测方差设计有限步长预测优先控制器,针对决策指标为覆盖的自主体,基于最优区域覆盖Lloyd算法设计有限步长覆盖优先控制器。
3.一种计算机系统,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现根据权利要求1所述的基于全局环境预测的多自主体集中式区域覆盖方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110789578.XA CN113395708B (zh) | 2021-07-13 | 2021-07-13 | 基于全局环境预测的多自主体集中式区域覆盖方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110789578.XA CN113395708B (zh) | 2021-07-13 | 2021-07-13 | 基于全局环境预测的多自主体集中式区域覆盖方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113395708A CN113395708A (zh) | 2021-09-14 |
CN113395708B true CN113395708B (zh) | 2023-01-31 |
Family
ID=77625894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110789578.XA Active CN113395708B (zh) | 2021-07-13 | 2021-07-13 | 基于全局环境预测的多自主体集中式区域覆盖方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113395708B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115327478B (zh) * | 2022-10-10 | 2023-01-03 | 广东省电信规划设计院有限公司 | 基于无线接入点doa估计的设备定位方法及系统 |
CN115665757A (zh) * | 2022-10-28 | 2023-01-31 | 东南大学 | 分布式未知时变区域多自主体最优覆盖方法与系统 |
CN116486195B (zh) * | 2023-03-22 | 2024-04-16 | 北京百度网讯科技有限公司 | 视频推荐模型的训练方法、视频推荐方法和装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046800B (zh) * | 2019-03-14 | 2020-09-25 | 南京航空航天大学 | 面向空间目标协同观测的卫星集群构形调整规划方法 |
CN110119844B (zh) * | 2019-05-08 | 2021-02-12 | 中国科学院自动化研究所 | 引入情绪调控机制的机器人运动决策方法、系统、装置 |
CN111786713B (zh) * | 2020-06-04 | 2021-06-08 | 大连理工大学 | 一种基于多智能体深度强化学习的无人机网络悬停位置优化方法 |
CN112001585B (zh) * | 2020-07-14 | 2023-09-22 | 北京百度网讯科技有限公司 | 多智能体决策方法、装置、电子设备及存储介质 |
CN112351503B (zh) * | 2020-11-05 | 2022-09-06 | 大连理工大学 | 基于任务预测的多无人机辅助边缘计算资源分配方法 |
CN112925350B (zh) * | 2021-01-15 | 2023-04-07 | 中国人民解放军战略支援部队航天工程大学 | 一种多无人机分布式协同目标搜索方法 |
-
2021
- 2021-07-13 CN CN202110789578.XA patent/CN113395708B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113395708A (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113395708B (zh) | 基于全局环境预测的多自主体集中式区域覆盖方法与系统 | |
Ebadzadeh et al. | CFNN: Correlated fuzzy neural network | |
Tian et al. | Multi-target tracking method based on improved firefly algorithm optimized particle filter | |
Kim et al. | Building occupancy maps with a mixture of Gaussian processes | |
Yang et al. | Online sparse multi-output Gaussian process regression and learning | |
Wang et al. | KNN-based Kalman filter: An efficient and non-stationary method for Gaussian process regression | |
Safarinejadian et al. | Distributed variational Bayesian algorithms for Gaussian mixtures in sensor networks | |
Al-Badarneh et al. | Neuro-evolutionary models for imbalanced classification problems | |
Zhifei et al. | Target maneuver trajectory prediction based on RBF neural network optimized by hybrid algorithm | |
CN114299607A (zh) | 一种基于自动驾驶汽车的人车碰撞危险度分析方法 | |
Wei et al. | Camera control for learning nonlinear target dynamics via Bayesian nonparametric Dirichlet-process Gaussian-process (DP-GP) models | |
Hu et al. | Lyapunov-based reinforcement learning state estimator | |
Babu et al. | A projection based learning in meta-cognitive radial basis function network for classification problems | |
Kharkovskii et al. | Nonmyopic Gaussian process optimization with macro-actions | |
CN104794736A (zh) | 一种基于高斯改进型粒子群粒子滤波的移动目标追踪方法 | |
Yuan et al. | Trainable Spiking-YOLO for low-latency and high-performance object detection | |
Wang et al. | A KNN based Kalman filter Gaussian process regression | |
Tan et al. | Trajectory prediction of flying vehicles based on deep learning methods | |
Ge et al. | Credible Gaussian sum cubature Kalman filter based on non-Gaussian characteristic analysis | |
Jang et al. | Optimized fuzzy clustering by predator prey particle swarm optimization | |
Ebato et al. | Effect of neural decay factors on prediction performance in chaotic echo state networks | |
CN115665757A (zh) | 分布式未知时变区域多自主体最优覆盖方法与系统 | |
Yadav et al. | Machine learning for robust identification of complex nonlinear dynamical systems: applications to earth systems modeling | |
Kurihara et al. | Analysis of convergence property of PSO and its application to nonlinear blind source separation | |
Lv et al. | An improved FastSLAM 2.0 algorithm based on FC&ASD-PSO |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |