CN115665757A - 分布式未知时变区域多自主体最优覆盖方法与系统 - Google Patents

分布式未知时变区域多自主体最优覆盖方法与系统 Download PDF

Info

Publication number
CN115665757A
CN115665757A CN202211332205.0A CN202211332205A CN115665757A CN 115665757 A CN115665757 A CN 115665757A CN 202211332205 A CN202211332205 A CN 202211332205A CN 115665757 A CN115665757 A CN 115665757A
Authority
CN
China
Prior art keywords
autonomous
varying
coverage
unknown time
distributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211332205.0A
Other languages
English (en)
Inventor
付俊杰
汪烨
唐美祺
温广辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202211332205.0A priority Critical patent/CN115665757A/zh
Publication of CN115665757A publication Critical patent/CN115665757A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明公开了一种分布式未知时变区域多自主体最优覆盖方法与系统。本发明方法中,给出一种利用基函数建立未知时变环境密度函数参数化模型方法;为多自主体系统建立了二阶运动学模型;设计了一种基于分布式遗忘因子递推最小二乘估计的未知时变密度函数参数更新方法;给出了一种多自主体系统基于在线密度函数估计的分布式最优覆盖控制策略。通过多自主体系统持续收集环境数据,更新密度函数估计参数,实现多自主体系统最优覆盖控制。本发明使多自主体系统通过分布式交互自主获取具有高准确度的环境密度函数模型,进而实现未知时变环境下最优区域覆盖。

Description

分布式未知时变区域多自主体最优覆盖方法与系统
技术领域
本发明涉及一种分布式未知时变区域多自主体最优覆盖方法与系统,属于多自主体协同控制领域。
背景技术
近年来,随着通信技术以及计算机系统、传感器性能的飞速发展,多自主体系统的成本不断降低,技术功能不断完善。多自主体系统协同控制在联合搜救、智能交通、区域监控等诸多领域的应用则是越来越广泛。相较于单自主体系统,多自主体系统极大提升了对任务的适应性及鲁棒性。覆盖控制作为多自主体系统协同控制的核心工作,近年来得到了广泛的研究。覆盖控制可以应用在许多重要的环境监测和信息采集场景中,其主要目标是提出一种控制律,使多自主体系统在任务区域内收敛到最优的覆盖配置。集中式覆盖控制需整合所有自主体数据信息,集中式处理并向各自主体指派任务,这对于自主体的通信交互能力以及集中节点的储存计算能力提出较高要求,同时集中式数据传输、任务指派也给多自主体系统带来较大的安全性、鲁棒性隐患。分布式覆盖控制则能很好的避免这些问题,各自主体分别进行数据采集,信息处理,并通过通信交互协同完成覆盖任务。
基于分布式处理的多自主体覆盖控制问题具有重大研究意义,现有的许多研究已对于此课题做出显著的贡献。经典的分布式覆盖控制方法是利用维诺划分,将任务区域划分为相应的维诺单元集,通过驱动每个自主体跟踪其对应维诺单元的质心来实现覆盖控制。基于此方法,大量相关研究陆续开展,然而大部分现有研究假设任务区域的环境密度函数已知,这忽略了实际情况中环境密度函数通常是未知的事实。随后,对于任务区域环境密度函数未知的情况得到了很多的关注和研究。这些研究提出了近似未知环境密度函数的估计算法,然而大部分估计算法都具有模型复杂,计算成本高或者假设条件较多的问题。进一步地,关于任务区域密度函数未知且时变的已有研究相对很少。因此,密度函数未知且时变的任务区域的覆盖控制是一个具有挑战性的问题,值得进一步研究。
发明内容
发明目的:针对目前未知时变环境下基于分布式的多自主体系统覆盖控制方法存在的问题及改进需求,本发明提出一种分布式未知时变区域多自主体最优覆盖方法与系统,通过分布式遗忘因子递推最小二乘算法估计未知时变的环境密度函数,进而设计相应的覆盖控制器驱动多自主体系统实现最优区域覆盖控制任务。
技术方案:为了实现上述目的,本发明提出的分布式未知时变区域多自主体最优覆盖方法,包含以下步骤:
各自主体基于分布式遗忘因子递推最小二乘估计算法模型,对感知环境信息与通信所获环境信息进行融合计算,估计未知时变的环境密度函数;
各自主体根据其估计的密度函数,设计相应的基于二阶运动学模型覆盖控制器,生成控制输入,自主体根据控制输入执行相应动作。
感知过程中,对于时刻k的自主体i,i=1,…,N,其位置坐标及采集的环境数据记为(pi,k,φ(pi,k)),其中,N为自主体数量,pi,k∈Rn为自主体i在时刻k的位置向量,n为任务区域Q的维数,φ(pi,k)∈R为自主体i在时刻k采集的环境数据,即密度函数值;
对于未知时变的环境密度函数φ(q,t),假设存在理想参数向量
Figure BDA0003913937580000021
满足:
φ(q,t)=K(q)Ta(t)
其中q∈Q为任务区域内任意点,K:
Figure BDA0003913937580000022
是基函数向量,a(t)是未知时变参数,
Figure BDA0003913937580000023
表示m维正实数向量;
自主体i,i=1,…,N利用分布式遗忘因子递推最小二乘估计算法对未知时变的密度函数的参数a(t)进行估计更新,进而获得估计的密度函数
Figure BDA0003913937580000024
其中
Figure BDA0003913937580000025
为自主体i的估计参数,具体为:
对于自主体i,i=1,…,N,假设已获得时刻k的位置坐标及采集的环境数据(pi,k,φ(pi,k)),利用此数据并结合储存的数据信息
Figure BDA0003913937580000026
和Mi(k-1)进行未知时变的密度函数参数的局部估计,计算生成
Figure BDA0003913937580000027
和Zi(k):
Figure BDA0003913937580000028
其中
Figure BDA0003913937580000029
为自主体i在时刻k-1的未知时变密度函数的估计参数,λ为遗忘因子,0.9≤λ<1;
各自主体之间进行通信交互,自主体i利用通信交互获得的数据信息
Figure BDA0003913937580000031
Figure BDA0003913937580000032
j∈IN进行信息融合,计算生成
Figure BDA0003913937580000033
Figure BDA0003913937580000034
Figure BDA0003913937580000035
其中IN={1,…,N}表示自主体集合,B={bij}N×N是加权邻接矩阵,当自主体i和j能进行通信交互时,bij>0,否则bij=0,并且满足bij=bji
Figure BDA0003913937580000036
Mi(0)初始化为KMI,其中KM为正实数,取值区间可选择为106~1010
进一步地,各自主体根据其估计的密度函数,基于覆盖控制Lloyd算法设计相应的覆盖控制器,具体为:
多自主体系统的覆盖控制目标为实现如下覆盖性能函数的最小化:
Figure BDA0003913937580000037
其中P={pi,i=1,...,N}为N个自主体的当前位置向量,W={Wi,i=1,...,N}为各自主体对凸任务区域Q的任意划分,记Wi是自主体i负责的区域,假设所有自主体的感知模型是一致的,均为全向感知模型,f:
Figure BDA0003913937580000038
为非减可微函数,用于评估自主体对划分的责任区域中各点的感知性能;
进一步地,对Q进行维诺划分V={Vi,i=1,...,N}:
Figure BDA0003913937580000039
维诺区域Vi的广义质量
Figure BDA00039139375800000310
极惯性矩
Figure BDA00039139375800000311
和质心
Figure BDA00039139375800000312
通过下式给出:
Figure BDA00039139375800000313
当选取
Figure BDA00039139375800000314
时,维诺划分下的覆盖性能函数可记为:
Figure BDA00039139375800000315
其中
Figure BDA0003913937580000041
可表示自主体i对于任务区域中点q的感知不确定性;对覆盖性能函数H(P)求关于pi,i∈IN的微分,得到:
Figure BDA0003913937580000042
本发明中自主体的二阶运动学模型满足:
Figure BDA0003913937580000043
Figure BDA0003913937580000044
其中vi为第i个自主体的速度矢量,ui为第i个自主体的控制输入,即加速度矢量,kv为正的常数;根据李雅普诺夫稳定性分析及LaSalle不变集理论,可分析得知当pi,i∈IN均处于维诺区域Vi,i∈IN的质心,即实现质心-维诺配置时,覆盖性能函数有局部最优值;记维诺质心为
Figure BDA0003913937580000045
则有:
Figure BDA0003913937580000046
环境信息未知且时变的情况下,各自主体根据其利用分布式遗忘因子递推最小二乘估计算法估计的密度函数
Figure BDA0003913937580000047
计算相应维诺区域Vi的估计广义质量
Figure BDA0003913937580000048
估计极惯性矩
Figure BDA0003913937580000049
和估计质心
Figure BDA00039139375800000410
Figure BDA00039139375800000411
当每个自主体位于其相应的估计质心
Figure BDA00039139375800000412
时,覆盖性能函数有局部最优值;
进一步地,基于覆盖控制Lloyd算法设计覆盖控制器,使覆盖性能收敛到局部最优:
Figure BDA00039139375800000413
其中
Figure BDA00039139375800000414
为一致正定增益矩阵。
基于相同的发明构思,本发明提出的一种分布式未知时变区域多自主体最优覆盖系统,任务区域内包含多个可进行通信交互的自主体,各自主体包括设有如下模块:环境密度估计模块,用于自主体基于分布式遗忘因子递推最小二乘估计算法模型,对感知环境信息与通信所获环境信息进行融合计算,估计未知时变的环境密度函数;最优覆盖控制模块,用于自主体根据其估计的密度函数,设计相应的基于二阶运动学模型覆盖控制器,生成控制输入,自主体根据控制输入执行相应动作。
基于相同的发明构思,本发明提供的一种分布式未知时变区域多自主体最优覆盖系统,任务区域内包含多个可进行通信交互的自主体;所述自主体包括采集环境数据的传感器,存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的分布式未知时变区域多自主体最优覆盖方法。
基于相同的发明构思,本发明提供的一种计算机系统,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的分布式未知时变区域多自主体最优覆盖方法。
与现有技术相比,本发明具有的有益效果如下:
1)相对于集中式多自主体覆盖控制方法,本发明提出的分布式未知时变区域多自主体最优覆盖方法,不需要整合所有自主体数据信息,集中式处理,而是各自主体分别进行数据采集,信息处理,并通过通信交互协同完成覆盖任务,降低了对于自主体的通信交互能力及储存计算能力的要求,提升了多自主体系统的安全性与鲁棒性。
2)相对于大部分只适用于任务区域环境密度函数已知的多自主体系统覆盖控制方法,本发明提出的分布式未知时变区域多自主体最优覆盖方法更具实用性,可适应性更强,使得多自主体系统不仅能够高效完成未知环境下的覆盖控制任务,还能有效处理环境时变情况下的覆盖控制任务。
3)现有的多自主体系统覆盖控制方法大多使用一阶运动学模型,本发明为多自主体系统建立了二阶运动学模型,二阶运动学模型考虑了自主体的加速度,使自主体的运动更加安全平稳。
4)相对于现有的未知环境密度函数的估计算法,本发明进一步提出的分布式遗忘因子递推最小二乘估计算法具有存储需求低、计算复杂度小及收敛速度快的特点,能够有效估计未知时变的环境密度函数且具有较高估计精度,有助于多自主体系统高效完成覆盖控制任务。
5)本发明提出的分布式未知时变区域多自主体最优覆盖方法与系统可适应性较强,不仅适用于配备全向感知模型传感器的自主体在凸环境区域中的情形,还能拓展至配备其他感知模型传感器的自主体以及非凸环境区域等情形,适用的自主体类型也较多,包括空中、陆地、水下机器人等,具有广泛的应用前景。
附图说明
图1是本发明实施例的分布式未知时变区域多自主体最优覆盖方法步骤示意图;
图2是本发明的仿真实验中多自主体聚集初始位置情形示意图;
图3是本发明的仿真实验中多自主体聚集初始分布情形下覆盖过程中的多自主体状态图;
图4是本发明的仿真实验中多自主体在未知时变环境下聚集初始分布情形覆盖控制结果示意图;
图5是本发明的仿真实验中多自主体聚集初始分布情形下未知时变密度函数估计效果示意图;
图6是本发明的仿真实验中多自主体分散初始位置情形示意图;
图7是本发明的仿真实验中多自主体分散初始分布情形下覆盖过程中的多自主体状态图;
图8是本发明的仿真实验中多自主体在未知时变环境下分散初始分布情形覆盖控制结果示意图;
图9是本发明的仿真实验中多自主体分散初始分布情形下未知时变密度函数估计效果示意图。
具体实施方式
为使本发明的发明目的、技术方案、发明有益效果更加清楚明确,下面将结合附图和具体实施例就本发明的发明目的、技术方案、发明有益效果作进一步详细说明。应注意,所举实施例仅用于解释理解本发明,并不用于限定本发明。
如图1所示,本发明实施例公开的一种分布式未知时变区域多自主体最优覆盖方法,多自主体接受未知时变环境中的覆盖控制任务后,各自主体分别进行感知,采集当前位置的环境数据,然后基于分布式遗忘因子递推最小二乘估计算法模型,自主体对感知的环境信息与通信交互所获环境信息进行融合计算,估计未知且时变的环境密度函数,进而各自主体根据其估计的密度函数,设计相应的基于二阶运动学模型覆盖控制器,生成控制输入,根据控制输入执行相应动作,实现未知时变环境下的多自主体最优区域覆盖控制。
具体地,本发明实施例中,分布式未知时变区域多自主体最优覆盖方法,主要包含以下步骤:
步骤1:各自主体分别进行感知,采集当前位置的环境数据。具体过程如下:
对于时刻k的自主体i,i=1,…,N,其位置坐标及采集的环境数据记为(pi,k,φ(pi,k)),其中,N为自主体数量,pi,k∈Rn为自主体i在时刻k的位置向量,n为任务区域Q的维数,φ(pi,k)∈R为自主体i在时刻k采集的环境数据,即密度函数值。
本发明实施例中,任务区域Q的坐标系模型为:
Figure BDA0003913937580000071
其中q为n维任务区域Q内任一点的位置向量。
假设在任务区域Q中,自主体可探测采集的环境数据与位置向量的关系可由密度函数模型表示,它可以被认为是任务区域上的一个加权函数,用来衡量Q中不同位置的相对重要性。例如,它可以表示事件发生在不同位置的概率,受灾区域不同位置的受灾情况等。直观地说,覆盖控制的目标是希望在密度函数值较大的区域更密集地分配自主体,在密度函数值较小的区域分配较少的自主体。而在实际情况中,环境密度函数一般是先验未知的,并且可能是随时间变化的,对于未知时变的环境密度函数φ(q,t),假设存在一个理想参数向量
Figure BDA0003913937580000072
满足:
φ(q,t)=K(q)Ta(t)
其中K:
Figure BDA0003913937580000073
是基函数向量,a(t)是未知时变参数,
Figure BDA0003913937580000074
表示m维正实数向量。上述假设是可行的,因为只要选择适当的基函数,上述密度函数模型可以表示一大类密度函数。此外,即使密度函数不能精确地写成该形式,也可以通过选择合适的参数得到较好的近似,本发明实施例选择物理解释清晰,表达性强的高斯径向基函数作为K。
步骤2:各自主体之间进行通信交互,基于分布式遗忘因子递推最小二乘估计算法模型,自主体对感知信息与通信所获信息进行融合计算,估计未知时变的环境密度函数。具体过程如下:
自主体i,i=1,…,N利用分布式遗忘因子递推最小二乘估计算法对未知时变密度函数的参数a(t)进行估计更新,进而获得估计的密度函数
Figure BDA0003913937580000075
其中
Figure BDA0003913937580000076
为自主体i的估计参数,具体为:
假设自主体i,i=1,…,N已获得时刻k的位置坐标及采集的环境数据(pi,k,φ(pi,k)),利用此数据并结合储存的数据信息
Figure BDA0003913937580000077
和Mi(k-1)进行未知时变的密度函数参数的局部估计,计算生成
Figure BDA0003913937580000081
和Zi(k):
Figure BDA0003913937580000082
其中
Figure BDA0003913937580000083
为自主体i在时刻k-1的未知时变密度函数的估计参数,λ为遗忘因子,需选择接近于1的正数,通常不小于0.9;
各自主体之间进行通信交互,自主体i利用通信交互获得的数据信息
Figure BDA0003913937580000084
Figure BDA0003913937580000085
j∈IN进行信息融合,计算生成
Figure BDA0003913937580000086
Figure BDA0003913937580000087
Figure BDA0003913937580000088
其中IN={1,…,N}表示自主体集合,B={bij}N×N是加权邻接矩阵,当自主体i和j能进行通信交互时,bij>0,否则bij=0,并且满足bij=bji
Figure BDA0003913937580000089
Mi(0)初始化为KMI,其中KM为正实数,取值区间可选择为106~1010
Figure BDA00039139375800000810
为自主体i在时刻k的未知时变密度函数的估计参数。自主体i根据上述估计算法得到估计参数
Figure BDA00039139375800000811
后,可进一步得到相应的估计密度函数
Figure BDA00039139375800000812
步骤3:各自主体根据其估计的密度函数,设计相应的覆盖控制器,生成控制输入,自主体根据控制输入执行相应动作。具体过程如下:
多自主体系统的覆盖控制目标为实现如下覆盖性能函数的最小化:
Figure BDA00039139375800000813
其中P={pi,i=1,...,N}为N个自主体的当前位置向量,W={Wi,i=1,...,N}为各自主体对凸任务区域Q的任意划分,记Wi是自主体i负责的区域,假设所有自主体的感知模型是一致的,均为全向感知模型,f:
Figure BDA00039139375800000814
为非减可微函数,用于评估自主体对划分的责任区域中各点的感知性能,不失一般性,选取
Figure BDA0003913937580000091
对Q进行维诺划分V={Vi,i=1,...,N}:
Figure BDA0003913937580000092
进一步地,维诺区域Vi的广义质量
Figure BDA0003913937580000093
极惯性矩
Figure BDA0003913937580000094
和质心
Figure BDA0003913937580000095
通过下式给出:
Figure BDA0003913937580000096
当选取
Figure BDA0003913937580000097
时,维诺划分下的覆盖性能函数可记为:
Figure BDA0003913937580000098
其中
Figure BDA0003913937580000099
可表示自主体i对于任务区域中点q的感知不确定性,结合希望密度函数值大的区域更密集的部署自主体的覆盖目标,多自主体系统的覆盖控制目标为实现覆盖性能函数H(P)的最小化便容易理解。为实现覆盖性能函数的最小化,对覆盖性能函数H(P)求关于pi,i∈IN的微分,得到:
Figure BDA00039139375800000910
本发明实施例中,自主体的二阶运动学模型满足:
Figure BDA00039139375800000911
Figure BDA00039139375800000912
其中vi为第i个自主体的速度矢量,ui,i∈IN为第i个自主体的控制输入,即加速度矢量,kv为正的常数。
考虑李雅普诺夫函数:
Figure BDA0003913937580000101
求V的时间导数可以得到:
Figure BDA0003913937580000102
因此V>0,
Figure BDA0003913937580000103
进而根据LaSalle不变集原理可知
Figure BDA0003913937580000104
这意味着当t→∞时有vi=0以及
Figure BDA0003913937580000105
则覆盖性能函数H达到了一个局部最优值,此时pi,i∈IN均处于相应维诺区域Vi,i∈IN的质心,即质心-维诺配置为一个局部最优的覆盖配置。记维诺质心为
Figure BDA0003913937580000106
则有:
Figure BDA0003913937580000107
环境信息未知且时变的情况下,各自主体根据其利用分布式遗忘因子递推最小二乘估计算法估计的密度函数
Figure BDA0003913937580000108
计算相应维诺区域Vi的估计广义质量
Figure BDA0003913937580000109
估计极惯性矩
Figure BDA00039139375800001010
和估计质心
Figure BDA00039139375800001011
Figure BDA00039139375800001012
当每个自主体位于其相应的估计质心
Figure BDA00039139375800001013
时,覆盖性能函数有局部最优值。
为使覆盖性能收敛到局部最优,基于覆盖控制Lloyd算法设计如下覆盖控制器:
Figure BDA00039139375800001014
其中
Figure BDA00039139375800001015
为一致正定增益矩阵。自主体i根据覆盖控制器生成的控制输入ui执行相应覆盖动作。
以下是本发明所设计的分布式未知时变区域多自主体最优覆盖方法的仿真实验。假设有20个自主体,方形任务区域被划分为3×3的网格。密度函数φ(q,t)=K(q)Ta(t)由一组高斯径向基函数参数化,选择K为一个由9个高斯径向基函数组成的向量,K=[K(1),…,K(9)]T,其中K(j),j=1,…,9如下给出:
Figure BDA0003913937580000111
其中δj=0.18为可调整参数,任务区域被划分为3×3的网格,μj,j=1,…,9被选择为每个网格的中心。自主体系统初始覆盖配置中,真实密度函数参数向量被选择为a=[100,amin,amin,amin,amin,amin,amin,amin,100]T,其中amin=0.1,这导致了任务区域内密度函数的一个双峰分布。仿真实验的总覆盖时长设置为60s,迭代步长为0.1s,本发明考虑时变密度函数,令真实密度函数的参数向量在第15s时变化为a=[amin,amin,100,amin,amin,amin100,amin,amin]T,在第30s时变化为a=[amin,100,amin,amin,amin,amin,amin,100,amin]T。自主体i的估计参数
Figure BDA0003913937580000114
初始化为[amin,amin,amin,amin,amin,amin,amin,amin,amin]T,参数估计算法中的遗忘因子设置为λ=0.96,覆盖控制律中的一致正定增益矩阵设置为
Figure BDA0003913937580000112
kv=1。
对于任务区域环境密度函数未知且时变的情况,各自主体需要不断测量采集所处位置的环境信息来估计密度函数。因此,自主体的初始位置会对最终的覆盖配置有一定的影响。直观地,自主体较分散的分布在任务区域时,覆盖效果会相对较好,这得益于分散的自主体可以测量任务区域不同位置的环境信息,而相对聚集分布在任务区域的自主体只能测量聚集区域的局部环境信息。针对多自主体聚集初始分布和分散初始分布在任务区域的情况分别做仿真实验。
多自主体聚集初始分布和分散初始分布情况下的自主体初始位置分别如图2和图6所示,图中*表示密度函数的高斯中心,即密度函数峰值点。不断迭代覆盖方法的步骤1到步骤3,直至达到迭代终止的条件,进而完成未知时变环境中的覆盖任务,迭代终止的条件可设置为最高迭代次数或自主体移动距离低于某一阈值。图3和图7分别给出了聚集初始分布和分散初始分布情况下多自主体系统在15s,30s以及60s(最终时刻)时的覆盖配置。多自主体聚集初始分布和分散初始分布情况下的覆盖控制结果如图4和图8所示,图中刻画了自主体的运动轨迹,“+”表示自主体的最终位置。从图4和图8可以看出,聚集初始分布和分散初始分布的多自主体在使用本发明所述覆盖方法后均达到了局部最优覆盖配置,大量自主体密集分布在密度函数值较大的区域,覆盖效果显著。图5和图9分别给出了聚集初始分布和分散初始分布情况下多自主体的平均参数误差
Figure BDA0003913937580000113
随时间的变化情况。从图中可以看出,未知时变密度函数估计效果良好,参数收敛速度很快,验证了步骤2所述分布式遗忘因子递推最小二乘估计算法的有效性和优异性能。
从上述仿真实验结果可以看出,基于本发明所设计的分布式未知时变区域多自主体最优覆盖方法,多自主体系统在聚集初始分布和分散初始分布两种情况下都高效的估计了未知时变密度函数,有效实现了未知环境中的多自主体最优区域覆盖控制。令人满意的覆盖效果验证了本发明所设计方法的有效性和优异性能。
基于相同的发明构思,本发明实施例公开的一种分布式未知时变区域多自主体最优覆盖系统,任务区域内包含多个可进行通信交互的自主体,各自主体包括设有如下模块:环境密度估计模块,用于自主体基于分布式遗忘因子递推最小二乘估计算法模型,对感知环境信息与通信所获环境信息进行融合计算,估计未知时变的环境密度函数;最优覆盖控制模块,用于自主体根据其估计的密度函数,设计相应的基于二阶运动学模型覆盖控制器,生成控制输入,自主体根据控制输入执行相应动作。
基于相同的发明构思,本发明实施例公开的一种分布式未知时变区域多自主体最优覆盖系统,任务区域内包含多个可进行通信交互的自主体;所述自主体包括采集环境数据的传感器,存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的分布式未知时变区域多自主体最优覆盖方法。
基于相同的发明构思,本发明实施例公开的一种计算机系统,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的分布式未知时变区域多自主体最优覆盖方法。
值得注意的是,以上所述仅是本发明的较为优选实施例,仅用于验证解释本发明,而对本发明不构成限定,相关技术人员在不偏离本发明技术思想的情况下,所作的多样变化、等同替换和修改等,均包含在本发明的保护范围内。

Claims (10)

1.一种分布式未知时变区域多自主体最优覆盖方法,其特征在于,包含以下步骤:
各自主体基于分布式遗忘因子递推最小二乘估计算法模型,对感知环境信息与通信所获环境信息进行融合计算,估计未知时变的环境密度函数;
各自主体根据其估计的密度函数,设计相应的基于二阶运动学模型覆盖控制器,生成控制输入,自主体根据控制输入执行相应动作;
设未知时变的环境密度函数φ(q,t)=K(q)Ta(t),其中q∈Q为任务区域Q内任意点,K是基函数向量,a(t)是未知时变参数;自主体i,i=1,…,N利用分布式遗忘因子递推最小二乘估计算法对未知时变密度函数的参数a(t)进行估计更新,进而获得估计的密度函数
Figure FDA0003913937570000011
其中
Figure FDA0003913937570000012
为自主体i的估计参数,N为自主体数量,具体为:
对于自主体i,i=1,…,N,利用已获得时刻k的位置坐标及采集的环境数据(pi,k,φ(pi,k)),并结合储存的数据信息
Figure FDA0003913937570000013
和Mi(k-1)进行未知时变密度函数参数的局部估计,计算生成
Figure FDA0003913937570000014
和Zi(k):
Figure FDA0003913937570000015
其中
Figure FDA0003913937570000016
为自主体i在时刻k-1的未知时变密度函数的估计参数,λ为遗忘因子,0.9≤λ<1;
各自主体之间进行通信交互,自主体i利用通信交互获得的数据信息
Figure FDA0003913937570000017
Figure FDA0003913937570000018
j∈IN进行信息融合,计算生成
Figure FDA0003913937570000019
Figure FDA00039139375700000110
Figure FDA00039139375700000111
其中IN={1,…,N}表示自主体集合,B={bij}N×N是加权邻接矩阵,当自主体i和j能进行通信交互时,bij>0,否则bij=0,并且满足bij=bji
Figure FDA0003913937570000021
Mi(0)初始化为KMI,其中KM为正实数,取值区间可选择为106~1010
2.根据权利要求1所述的分布式未知时变区域多自主体最优覆盖方法,其特征在于,
各自主体根据其估计的密度函数,基于覆盖控制Lloyd算法设计相应的覆盖控制器。
3.根据权利要求2所述的分布式未知时变区域多自主体最优覆盖方法,其特征在于,
多自主体系统的覆盖控制目标为实现如下覆盖性能函数的最小化:
Figure FDA0003913937570000022
其中P={pi,i=1,...,N}为N个自主体的当前位置向量,W={Wi,i=1,...,N}为各自主体对凸任务区域Q的任意划分,记Wi是自主体i负责的区域,f:
Figure FDA0003913937570000023
为非减可微函数,用于评估自主体对划分的责任区域中各点的感知性能。
4.根据权利要求3所述的分布式未知时变区域多自主体最优覆盖方法,其特征在于,
对Q进行维诺划分V={Vi,i=1,...,N}:
Figure FDA0003913937570000024
自主体i的维诺区域Vi的广义质量
Figure FDA0003913937570000025
极惯性矩
Figure FDA0003913937570000026
和质心
Figure FDA0003913937570000027
为:
Figure FDA0003913937570000028
当选取
Figure FDA0003913937570000029
时,维诺划分下的覆盖性能函数记为:
Figure FDA00039139375700000210
其中
Figure FDA00039139375700000211
可表示自主体i对于任务区域中点q的感知不确定性。
5.根据权利要求4所述的分布式未知时变区域多自主体最优覆盖方法,其特征在于,
自主体的二阶运动学模型满足:
Figure FDA0003913937570000031
Figure FDA0003913937570000032
其中vi为第i个自主体的速度矢量,ui为第i个自主体的控制输入,即加速度矢量,kv为正的常数。
6.根据权利要求5所述的分布式未知时变区域多自主体最优覆盖方法,其特征在于,环境信息未知时变的情况下,各自主体根据其利用分布式遗忘因子递推最小二乘估计算法估计的密度函数
Figure FDA0003913937570000033
计算相应维诺区域Vi的估计广义质量
Figure FDA0003913937570000034
估计极惯性矩
Figure FDA0003913937570000035
和估计质心
Figure FDA0003913937570000036
Figure FDA0003913937570000037
当每个自主体位于其相应的估计质心
Figure FDA0003913937570000038
时,覆盖性能函数有局部最优值;
基于覆盖控制Lloyd算法设计覆盖控制器,使覆盖性能收敛到局部最优:
Figure FDA0003913937570000039
其中
Figure FDA00039139375700000310
为一致正定增益矩阵。
7.一种分布式未知时变区域多自主体最优覆盖系统,其特征在于,任务区域内包含多个可进行通信交互的自主体,各自主体包括设有如下模块:
环境密度估计模块,用于自主体基于分布式遗忘因子递推最小二乘估计算法模型,对感知环境信息与通信所获环境信息进行融合计算,估计未知时变的环境密度函数;
最优覆盖控制模块,用于自主体根据其估计的密度函数,设计相应的基于二阶运动学模型覆盖控制器,生成控制输入,自主体根据控制输入执行相应动作;
所述环境密度估计模块中,设未知时变的环境密度函数φ(q,t)=K(q)Ta(t),其中q∈Q为任务区域Q内任意点,K是基函数向量,a(t)是未知时变参数;自主体i,i=1,…,N利用分布式遗忘因子递推最小二乘估计算法对未知时变密度函数的参数a(t)进行估计更新,进而获得估计的密度函数
Figure FDA00039139375700000311
其中
Figure FDA00039139375700000312
为自主体i的估计参数,N为自主体数量,具体为:
对于自主体i,i=1,…,N,利用已获得时刻k的位置坐标及采集的环境数据(pi,k,φ(pi,k)),并结合储存的数据信息
Figure FDA0003913937570000041
和Mi(k-1)进行未知时变密度函数参数的局部估计,计算生成
Figure FDA0003913937570000042
和Zi(k):
Figure FDA0003913937570000043
其中
Figure FDA0003913937570000044
为自主体i在时刻k-1的未知时变密度函数的估计参数,λ为遗忘因子,0.9≤λ<1;
各自主体之间进行通信交互,自主体i利用通信交互获得的数据信息
Figure FDA0003913937570000045
Figure FDA0003913937570000046
Figure FDA0003913937570000047
进行信息融合,计算生成
Figure FDA0003913937570000048
Figure FDA0003913937570000049
Figure FDA00039139375700000410
其中IN={1,…,N}表示自主体集合,B={bij}N×N是加权邻接矩阵,当自主体i和j能进行通信交互时,bij>0,否则bij=0,并且满足bij=bji
Figure FDA00039139375700000411
Mi(0)初始化为KMI,其中KM为正实数,取值区间可选择为106~1010
8.根据权利要求7所述的分布式未知时变区域多自主体最优覆盖系统,其特征在于,各自主体根据其估计的密度函数,基于覆盖控制Lloyd算法设计相应的覆盖控制器;维诺划分下的覆盖性能函数为:
Figure FDA00039139375700000412
其中
Figure FDA00039139375700000413
可表示自主体i对于任务区域中点q的感知不确定性;
自主体的二阶运动学模型满足:
Figure FDA0003913937570000051
Figure FDA0003913937570000052
其中vi为第i个自主体的速度矢量,ui为第i个自主体的控制输入,即加速度矢量,kv为正的常数;当每个自主体位于其相应的估计质心
Figure FDA0003913937570000053
时,覆盖性能函数有局部最优值;
Figure FDA0003913937570000054
其中
Figure FDA0003913937570000055
为一致正定增益矩阵。
9.一种分布式未知时变区域多自主体最优覆盖系统,其特征在于,任务区域内包含多个可进行通信交互的自主体;所述自主体包括采集环境数据的传感器,存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现根据权利要求1-6任一项所述的分布式未知时变区域多自主体最优覆盖方法。
10.一种计算机系统,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述计算机程序被加载至处理器时实现根据权利要求1-6任一项所述的分布式未知时变区域多自主体最优覆盖方法。
CN202211332205.0A 2022-10-28 2022-10-28 分布式未知时变区域多自主体最优覆盖方法与系统 Pending CN115665757A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211332205.0A CN115665757A (zh) 2022-10-28 2022-10-28 分布式未知时变区域多自主体最优覆盖方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211332205.0A CN115665757A (zh) 2022-10-28 2022-10-28 分布式未知时变区域多自主体最优覆盖方法与系统

Publications (1)

Publication Number Publication Date
CN115665757A true CN115665757A (zh) 2023-01-31

Family

ID=84993162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211332205.0A Pending CN115665757A (zh) 2022-10-28 2022-10-28 分布式未知时变区域多自主体最优覆盖方法与系统

Country Status (1)

Country Link
CN (1) CN115665757A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117706910A (zh) * 2023-12-27 2024-03-15 哈尔滨工业大学 基于滑模控制的不同最大速度的机器人集群覆盖方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105848283A (zh) * 2016-03-18 2016-08-10 南京邮电大学 基于区域划分锚节点移动的DV-Hop定位方法
CN110046800A (zh) * 2019-03-14 2019-07-23 南京航空航天大学 面向空间目标协同观测的卫星集群构形调整规划方法
CN112925350A (zh) * 2021-01-15 2021-06-08 中国人民解放军战略支援部队航天工程大学 一种多无人机分布式协同目标搜索方法
CN113395708A (zh) * 2021-07-13 2021-09-14 东南大学 基于全局环境预测的多自主体集中式区域覆盖方法与系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105848283A (zh) * 2016-03-18 2016-08-10 南京邮电大学 基于区域划分锚节点移动的DV-Hop定位方法
CN110046800A (zh) * 2019-03-14 2019-07-23 南京航空航天大学 面向空间目标协同观测的卫星集群构形调整规划方法
CN112925350A (zh) * 2021-01-15 2021-06-08 中国人民解放军战略支援部队航天工程大学 一种多无人机分布式协同目标搜索方法
CN113395708A (zh) * 2021-07-13 2021-09-14 东南大学 基于全局环境预测的多自主体集中式区域覆盖方法与系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SOOBUM KIM等: "Coverage Control of Mobile Robots With Different Maximum Speeds for Time-Sensitive Applications", 《IEEE ROBOTICS AND AUTOMATION LETTERS》, vol. 7, no. 2, 27 January 2022 (2022-01-27) *
YE WANG等: "Adaptive Coverage Control for Multi-agent Systems in Unknown Environments", 《PROCEEDINGS OF 2021 5TH CHINESE CONFERENCE ON SWARM INTELLIGENCE AND COOPERATIVE CONTROL》, 29 July 2022 (2022-07-29) *
严卫生等: "洋流干扰下的多自主水面无人船最优覆盖控制", 《西北工业大学学报》, vol. 32, no. 5, 31 October 2014 (2014-10-31) *
唐美祺等: "基于稀疏高斯过程的多智能体区域覆盖控制", 《控制工程》, vol. 29, no. 3, 31 March 2022 (2022-03-31) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117706910A (zh) * 2023-12-27 2024-03-15 哈尔滨工业大学 基于滑模控制的不同最大速度的机器人集群覆盖方法及系统
CN117706910B (zh) * 2023-12-27 2024-06-07 哈尔滨工业大学 基于滑模控制的不同最大速度的机器人集群覆盖方法及系统

Similar Documents

Publication Publication Date Title
Yijing et al. Q learning algorithm based UAV path learning and obstacle avoidence approach
CN110989352B (zh) 一种基于蒙特卡洛树搜索算法的群体机器人协同搜索方法
CN115993781B (zh) 抗网络攻击无人集群系统协同控制方法、终端及存储介质
Lee et al. Controlled coverage using time-varying density functions
CN113395708B (zh) 基于全局环境预测的多自主体集中式区域覆盖方法与系统
Rabah et al. Heterogeneous parallelization for object detection and tracking in UAVs
CN112684709B (zh) 一种集群跟踪运动学建模方法、设备及存储介质
CN115665757A (zh) 分布式未知时变区域多自主体最优覆盖方法与系统
CN111983923B (zh) 一种受限多智能体系统编队控制方法、系统及设备
Khaleghi et al. A DDDAMS-based UAV and UGV team formation approach for surveillance and crowd control
Sadhu et al. Aerial-DeepSearch: Distributed multi-agent deep reinforcement learning for search missions
Dirafzoon et al. Coverage control in unknown environments using neural networks
Liu et al. Measurement dissemination-based distributed Bayesian filter using the latest-in-and-full-out exchange protocol for networked unmanned vehicles
Yang et al. Learning continuous control policies for information-theoretic active perception
CN115958606A (zh) 机械臂避障轨迹规划方法、装置和电子设备
CN116528171A (zh) 一种基于力引导定位的移动传感器网络目标追踪方法
Wnuk et al. Tracking branched deformable linear objects with structure preserved registration by branch-wise probability modification
Kim et al. Bridging active exploration and uncertainty-aware deployment using probabilistic ensemble neural network dynamics
Wang et al. Formation control of multiple nonholonomic mobile robots with limited information of a desired trajectory
CN106096565B (zh) 基于传感网络的移动机器人与静态传感器的任务协作方法
Ardilla et al. Multi-Scale Batch-Learning Growing Neural Gas Efficiently for Dynamic Data Distributions
CN112747752B (zh) 基于激光里程计的车辆定位方法、装置、设备和存储介质
Nikitenko et al. Rrts postprocessing for uncertain environments
Khaleghi et al. Analysis of uav/ugv control strategies in a dddams-based surveillance system
Shi et al. A cooperative gene regulatory network target entrapping in GNSS-denied environments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination