CN117687309B - 用于异构集群系统的异步约束输出编队跟踪方法及系统 - Google Patents

用于异构集群系统的异步约束输出编队跟踪方法及系统 Download PDF

Info

Publication number
CN117687309B
CN117687309B CN202410153127.0A CN202410153127A CN117687309B CN 117687309 B CN117687309 B CN 117687309B CN 202410153127 A CN202410153127 A CN 202410153127A CN 117687309 B CN117687309 B CN 117687309B
Authority
CN
China
Prior art keywords
agent
output formation
communication
asynchronous
constraint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410153127.0A
Other languages
English (en)
Other versions
CN117687309A (zh
Inventor
化永朝
苏翎菲
董希旺
于江龙
李晓多
任章
吕金虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202410153127.0A priority Critical patent/CN117687309B/zh
Publication of CN117687309A publication Critical patent/CN117687309A/zh
Application granted granted Critical
Publication of CN117687309B publication Critical patent/CN117687309B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开一种用于异构集群系统的异步约束输出编队跟踪方法及系统,涉及集群系统的输出编队控制领域,所述方法包括:建立异构集群系统的动力学模型和通信拓扑结构模型;通信拓扑结构模型采用随机异步广播通信协议;定义期望的输出编队参考以及求解所述期望的输出编队参考时应用的分布式优化函数和约束条件;应用约束随机次梯度随机投影方法确定每一所述智能体的所述输出编队参考估计值;根据每一所述智能体的所述输出编队参考估计值确定每一所述智能体的输出编队最优跟踪控制协议,以达到期望的输出编队参考。本发明实现了异构集群系统在异步和间歇性通信的情况下的异步约束输出编队最优跟踪。

Description

用于异构集群系统的异步约束输出编队跟踪方法及系统
技术领域
本发明涉及集群系统的输出编队控制领域,特别是涉及一种用于异构集群系统的异步约束输出编队最优跟踪方法及系统。
背景技术
过去几十年来,集群系统的输出编队控制因其在搜救、侦察监视、数据采集、目标探测与定位等军用和民用领域的广泛应用而备受关注。大多数现有工作使用领导者-跟随者一致性方法或无领导者一致性方法,以实现对每个智能体的输出编队参考信号的分布式跟踪。然而,在领导者-跟随者一致性策略下,输出编队参考由领导者设定,无法由所有智能体协商确定,而在无领导者一致性策略下,则没有考虑输出编队参考的性能指标。因此,研究同时考虑分布式计算和编队参考最优性能的输出编队跟踪方法是当前工程领域亟需解决的难题之一。
在实际应用中,分布式约束优化是当前的一个研究热点。在典型的分布式优化问题中,通常假设每个智能体只能访问本地信息,包括目标函数和约束条件。其目标是最小化由本地目标函数之和形成的全局目标函数,并满足由所有本地约束形成的全局约束。投影算子是处理集合约束的常用方法,带有增广拉格朗日函数的原始对偶方法和基于惩罚的原始变量方法通常用于求解不等式约束,在现有工作中已得到广泛研究。此外,针对智能体没有关于确定的集合约束的先验知识,S.Lee等人提出了随机投影算子。随后,S.Lee等人在此基础上提出了带有八卦通信协议的异步算法。然而,从当前的研究结果可以看出,只有很少一部分工作同时考虑了异步通信和可能由链路故障、节点休眠、漏检等造成的间歇性通信。因此,在满足集合约束和不等式约束的同时,在间歇通信条件下收敛到最优解的分布式异步优化问题仍然具有挑战性。
控制领域的分布式优化问题研究引起了许多专家学者的关注。在最近的工作中,P.Lin等人提出了最优控制协议来解决短距离会合问题,即每个智能体被分配到一定的凸区域,目标是在最优位置会合。然而,在工程背景下,执行复杂任务的集群系统需要确保满足约束条件的最优性能,同时收敛到预定的编队配置。L.Jiang等人结合分布式优化算法和自适应控制器设计了一种分布式最优编队控制协议;Z.Hu等人设计了一种分布式算法,在所有智能体满足编队要求的情况下,全局目标函数值在有限时间内最小化。然而,上述研究结果都没有考虑优化问题的约束条件。C.Sun等人提出了一种基于分布式惩罚的方法来解决带有不等式约束的编队控制问题。结果证明,在时不变的无向拓扑结构下,智能体状态会渐近收敛到最优解。然而,从当前的研究结果可以看出,目前为止还没有考虑局部不等式约束以及异步和间歇性通信的最优编队控制问题的研究成果。因此,在异步和间歇通信条件下,同时考虑局部集合约束和不等式约束的编队和最优性能的控制研究仍然值得进一步研究。
在集群系统协同输出编队跟踪的过程中,需要考虑分布式的计算以及输出编队参考信号的最优性能。现有的常用方法中,领导者-跟随者一致性策略的输出编队参考由领导者设定,无法由所有智能体协商确定;无领导者一致性策略没有考虑输出编队参考的性能指标。在进行分布式计算的过程中,节点之间需要进行有效的信息交互和处理,然而在实际环境中可能会遭遇异步通信和可能由链路故障、节点休眠、漏检等造成的间歇性通信。此外,实际环境中有可能会面临复杂约束,例如集合约束和不等式约束,并且智能体可能没有关于确定的集合约束的先验知识。因此,需要研究在异步和间歇性通信的情况下的分布式约束输出编队最优跟踪问题。
发明内容
本发明的目的是提供一种用于异构集群系统的异步约束输出编队跟踪方法及系统,实现了异构集群系统在异步和间歇性通信的情况下的异步约束输出编队最优跟踪。
为实现上述目的,本发明提供了如下方案。
一种用于异构集群系统的异步约束输出编队跟踪方法,具体包括如下步骤。
建立异构集群系统的动力学模型。
以所述异构集群系统的智能体为节点,以所述智能体之间的通信关系为边建立所述异构集群系统的通信拓扑结构模型;所述通信拓扑结构模型采用随机异步广播通信协议;所述通信拓扑结构模型的通信方式包括间歇性通信和异步通信;所述间歇性通信指所述智能体之间的通信链路在随机时刻会断开的通信方式;所述异步通信指每个所述智能体具有速率为1的泊松过程虚拟时钟,所有所述智能体的全局虚拟时钟为速率为N的泊松过程;N表示智能体数量。
基于所述动力学模型和所述通信拓扑结构模型,定义期望的输出编队参考以及求解所述期望的输出编队参考时应用的全局目标函数和约束条件;所述约束条件包括本地集合约束和本地不等式约束。
基于所述全局目标函数和所述约束条件,应用约束随机次梯度随机投影方法确定每一所述智能体的输出编队参考估计值;所述输出编队参考估计值为对所述期望的输出编队参考的估计值。
根据每一所述智能体的所述输出编队参考估计值应用李雅普诺夫方法确定每一所述智能体的输出编队最优跟踪控制协议,以达到所述期望的输出编队参考。
可选的,所述动力学模型表达式为。
其中,;xi(t)和yi(t)是智能体i的状态向量和输出向量;ui(t)是智能体i的控制输入向量;/>是xi(t)的一阶导数;/>,/>是常数矩阵;ni,d,mi表示维度。
可选的,所述通信拓扑结构模型由带有间歇性通信和异步通信的无向时变拓扑定义。
其中,表示节点集合,一个节点代表一个智能体;表示边集合,(i,j)表示智能体i节点和智能体j节点之间的边,如果智能体i能够通过通信网络获得智能体j的信息,则/>,否则/>;在间歇性通信方式下,如果/>,则智能体i和智能体j的通信概率pij>0,否则pij=0。
可选的,所述全局目标函数的表达式为。
所述约束条件的表达式为。
其中,
式中,表示关于输出编队参考的全局变量;fi是智能体i的本地代价函数;gi是智能体i的本地不等式约束函数;/>是智能体i的本地集合约束;/>是智能体i的索引集合;/>是智能体i的简单集合;/>是随机序列且独立同分布,在/>上的概率分布服从正的概率分布。
可选的,在执行步骤“基于所述全局目标函数和所述约束条件,应用约束随机次梯度随机投影方法确定每一所述智能体的输出编队参考估计值”之前,执行下面步骤。
判断每一所述智能体的预先定义的输出编队偏移是否满足编队跟踪可行条件;若满足,则确定每一所述智能体的所述输出编队参考估计值;若不满足,则重新定义所述输出编队偏移。
可选的,所述编队跟踪可行条件为。
式中,满足/>,hi(t)表示t时刻智能体i预先定义的输出编队偏移;/>满足/>,/>表示/>维的零矩阵;/>表示/>的一阶导。
可选的,所述输出编队参考估计值的表达式为。
其中,
式中,是t时刻智能体i的输出编队参考估计值;zi(t)表示t时刻在随机异步广播通信协议下的加权平均编队参考估计值;/>,/>表示t时刻进行信息广播的智能体It的邻居集合,/>表示智能体It和智能体j的通信概率;若智能体/>,则/>,否则/>;/>表示任意向量E在集合/>上的欧式投影,/>;/>表示矩阵/>第i行第j列的元素;/>是t-1时刻智能体j的输出编队参考估计值;/>表示第j个元素为1,其他元素为0的N维向量;/>表示第It个元素为1,其他元素为0的N维向量;T表示转置;/>表示/>维的单位矩阵;/>是一个混合参数,/>;/>是随机次梯度误差;,/>表示智能体i的本地不等式约束函数;/>和/>分别表示fi和gi的梯度或次梯度;如果/>,则/>,否则/>,/>为任意不等于0的常数;/>表示欧式范数;/>和/>表示递减的正步长序列。
可选的,所述智能体的输出编队最优跟踪控制协议的表达式为。
式中,K1i和K2i是恒定增益矩阵;是输出编队时变补偿项,,/>,/>,/>表示/>维的单位矩阵。
本发明提供一种用于异构集群系统的异步约束输出编队跟踪系统,具体包括如下模块。
动力学模型构建模块,用于建立异构集群系统的动力学模型。
通信拓扑结构模型构建模块,用于以所述异构集群系统的智能体为节点,以所述智能体之间的通信关系为边建立所述异构集群系统的通信拓扑结构模型;所述通信拓扑结构模型采用随机异步广播通信协议;所述通信拓扑结构模型的通信方式包括间歇性通信和异步通信;所述间歇性通信指所述智能体之间的通信链路在随机时刻会断开的通信方式;所述异步通信指每个所述智能体具有速率为1的泊松过程虚拟时钟,所有所述智能体的全局虚拟时钟为速率为N的泊松过程;N表示智能体数量。
最优跟踪状态定义模块,用于基于所述动力学模型和所述通信拓扑结构模型,定义期望的输出编队参考以及求解所述期望的输出编队参考的全局目标函数和约束条件;所述约束条件包括本地集合约束和本地不等式约束。
估计模块,用于基于所述全局目标函数和所述约束条件,应用约束随机次梯度随机投影方法确定每一所述智能体的输出编队参考估计值;所述输出编队参考估计值为对所述期望的输出编队参考的估计值。
最优跟踪控制协议确定模块,用于根据每一所述智能体的所述输出编队参考估计值应用李雅普诺夫方法确定每一所述智能体的输出编队最优跟踪控制协议,以达到所述期望的输出编队参考。
可选的,所述智能体的输出编队最优跟踪控制协议的表达式为。
式中,是智能体i的状态向量;K1i和K2i是恒定增益矩阵;/>是输出编队时变补偿项,/>,/>,/>,/>表示/>维的单位矩阵;/>满足/>,hi(t)表示t时刻智能体i预先定义的输出编队偏移;表示/>的一阶导;/>是t时刻智能体i的输出编队参考估计值;/>和/>是异构集群系统的动力学模型的输出向量表达式中的常数矩阵。
根据本发明提供的具体实施例,本发明公开了以下技术效果。
本发明提供一种用于异构集群系统的异步约束输出编队跟踪方法及系统,采用随机异步广播通信协议,以解决间歇性和异步通信问题;应用约束随机投影随机次梯度方法对最优的输出编队参考进行迭代估计,使智能体的实际输出编队参考最小化关于输出编队参考信号的全局目标函数,并满足所有本地集合约束和本地不等式约束;利用李雅普诺夫方法在输出编队参考估计值的基础上实现完全分布式输出编队跟踪,使智能体渐近收敛到预定义的输出编队构型。所以,本发明实现在异步和间歇通信的情况下,能够在渐近收敛到预定义的输出编队构型的同时,最小化关于输出编队参考信号的全局目标函数并满足所有本地集合约束和本地不等式约束,实现了异构集群系统的异步约束输出编队最优跟踪。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的一种用于异构集群系统的异步约束输出编队跟踪方法流程图。
图2为本发明实施例1提供的一种用于异构集群系统的异步约束输出编队跟踪方法构思图。
图3为本发明实施例1提供的理想情况下的通信拓扑结构示意图。
图4为本发明实施例1提供的在一次仿真实验中每隔20个广播时刻的实际通信示意图。
图5为本发明实施例1提供的每个智能体基于估计器的估计值曲线及三个维度上的实际最优编队参考值示意图。
图6为本发明实施例1提供的每个智能体基于估计器的关于约束的统计值曲线。
图7为本发明实施例1提供的每个智能体的输出编队跟踪误差曲线。
图8为本发明实施例1提供的每个智能体在不同时刻的输出状态示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种用于异构集群系统的异步约束输出编队跟踪方法及系统,通过利用约束随机次梯度随机投影方法和李雅普诺夫方法,构建基于估计器的分布式跟踪控制协议,在随机异步广播通信协议下,不同时刻进行信息广播的智能体与其邻居智能体进行信息交互,使智能体仅通过与其邻居进行信息交互实现对最优编队参考信号的输出编队跟踪。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
如图1和2所示,本实施例提供一种用于异构集群系统的异步约束输出编队跟踪方法,首先需要建立异构集群系统的动力学模型;其次需要建立异构集群的拓扑结构模型,来刻画多个智能体之间的通信模型;第三,本发明主要考虑约束输出编队最优跟踪问题,需要对问题进行定义;接下来,得到输出编队最优跟踪控制协议的具体表达形式;最后,对控制协议的参数进行设计。所提出的异步和间歇性通信下针对异构集群系统的分布式约束输出编队最优跟踪方法步骤如下。
S1:建立异构集群系统的动力学模型。
考虑一个由个智能体构成的异构集群系统,其动力学为。
(1)。
其中,;/>和/>是状态向量和输出向量;是控制输入向量,/>是xi(t)的一阶导数;/>分别表示/>维实值向量集合,/>维实值矩阵集合;/>分别表示智能体/>的状态向量维度,输出向量维度,控制输入向量维度;/>,/>和/>是常数矩阵,并且满足/>,/>表示一个矩阵的秩;/>是可稳定的,/>是可检测的。
S2:以所述异构集群系统的智能体为节点,以所述智能体之间的通信关系为边建立所述异构集群系统的通信拓扑结构模型;所述通信拓扑结构模型采用随机异步广播通信协议。通信拓扑结构模型的通信方式包括间歇性通信和异步通信。
通信拓扑可由带有间歇性通信和异步通信的无向时变拓扑定义,其中,/>和/>分别表示节点集合和边集合一个节点表示一个智能体。如果智能体i能够通过通信网络获得智能体j的信息,则,即智能体i的节点和智能体j的节点之间存在边;否则/>,即智能体i的节点和智能体j的节点之间不存在边,/>表示智能体智能体i的节点和智能体j的节点之间的边。智能体/>到智能体/>的一条路径是由/>组成的有序序列。如果对于所有智能体/>存在一条从智能体i到智能体j的路径,则G(t)是连通的。此外,在通信拓扑结构模型中,智能体i的邻居集合被定义为
间歇性通信是指通信链路可能在随机时刻断开。如果,则智能体/>和智能体/>的通信概率为/>;否则/>。此外,间歇性通信的通信失效过程假设是独立同分布的。
异步通信是指每个智能体具有速率为1的泊松过程虚拟时钟,因此,全局虚拟时钟为速率为/>的泊松过程。
本发明采用随机异步广播通信协议,解决间歇性和异步通信问题。其根据异步通信的定义可知,每时刻只有任意一个智能体进行信息广播,因此定义时刻t进行信息广播的智能体为。然后根据间歇性通信的定义,实际接收到广播智能体信息的智能体集合为广播智能体的邻居集合的子集,因此定义时刻t接收到信息的智能体集合为,/>表示进行信息广播的智能体/>与智能体/>的通信概率。随机广播通信协议的定义为假设在时刻t有一个智能体/>进行信息广播,同时进行信息广播的智能体的邻居集合的子集/>中的智能体接收到由智能体/>广播的信息,也就是说,在每一时刻有一个广播智能体进行信息广播,同时其至少一部分邻居智能体能够接收到广播智能体广播的信息。图2中的“与邻居节点进行交互”是指采用随机异步广播通信协议,每一时刻进行信息广播的智能体与其邻居之间进行信息交互。
关于时变通信拓扑G(t),给出了通信拓扑的表达式。
其中,链路失效概率为,/>为可能的拓扑结构,如图3所示,拓扑结构中包括了7个智能体,图3中“1”至“7”表示智能体的编号,图3中,(a)部分为拓扑结构G1;图3中,(b)部分为拓扑结构G2;图3中,(c)部分为拓扑结构G3;图3中,(d)部分为拓扑结构G4,这些拓扑结构示出的是理想情况下的通信拓扑结构,但由于会有异步通信和间歇性通信,实际通信情况为图4中的仿真图,示出的是在一次仿真实验中每隔20个广播时刻的实际通信。这里采用“每隔20个广播时刻”,是一种为了图片展示更加清晰的示例情况。图4中,其中,实心点表示广播节点,空心点表示接收广播信息的节点;图4中的横坐标表示时刻点,纵坐标表示7个智能体的索引(编号),每一时刻点,对于7个智能体,只有一个进行信息广播的智能体,即图4中,每个时刻对应着一个实心点,体现了异步通信方式。在每一时刻,根据每一智能体对应的实心点或空心点来确定是否存在间歇性通信。
S3:基于所述动力学模型和所述通信拓扑结构模型,定义期望的输出编队参考以及求解所述期望的输出编队参考的全局目标函数和约束条件。所述约束条件包括本地集合约束和本地不等式约束。
刻画约束输出编队最优跟踪问题。
定义1:对于任意给定的初始状态,集群系统如果满足。
(2)。
则称为实现了输出编队。其中,是对于智能体i预定义的输出编队偏移,是输出编队参考。
给定预定义的输出编队参考偏移,关于输出编队参考的分布式优化问题为。
(3)。
其中,是关于编队参考的全局变量;/>是智能体i的本地代价函数;/>是智能体i的本地不等式约束函数;/>表示实值数集,表示输入向量为N维实值向量、输出向量为实值的函数;是智能体i的本地集合约束,/>是索引集合,/>是简单集合,/>是随机序列且独立同分布,其在/>上的概率分布服从正的概率分布。式(3)的最优解集和对应的函数值分别被定义为/>和/>
定义2:对于任意给定的初始状态,式(1)定义的集群系统如果满足。
(4)。
则称为实现了对式(3)的最优解的输出编队最优跟踪。
该步骤主要是描述一下集群系统所要达到的最优跟踪状态,后续步骤则不断地迭代对最优的输出编队参考进行估计,使得越来越接近最优的输出编队参考,并设计控制协议对输出参考估计进行编队跟踪,从而实现最优跟踪状态。
S4:基于所述全局目标函数和所述约束条件,应用约束随机次梯度随机投影方法确定每一所述智能体的所述输出编队参考估计值(对应图2中的本地编队参考估计值);所述输出编队参考估计值为对所述期望的输出编队参考的估计值。
S5:根据每一所述智能体的所述输出编队参考估计值应用李雅普诺夫方法确定每一所述智能体的输出编队最优跟踪控制协议,以达到所述期望的输出编队参考。
对于步骤S4和步骤S5,主要思想是首先设计一个估计器(公式(5)中的第二个表达式)来估计期望的输出编队参考/>,然后构建一个状态反馈输出编队跟踪控制器(公式(5)中的第三个表达式/>),在保持时变输出编队的同时跟踪本地估计的最优编队参考。
对于智能体,控制协议设计如下。
(5)。
其中,zi(t)表示在随机异步广播通信协议下的加权平均编队参考估计值,即,若,则/>,该表达式是将Q(t)表达式带入到公式(5)中的第一个表达式zi(t)中得到的,两个zi(t)表示含义相同,只是表现形式不同;,/>表示t时刻进行信息广播的智能体It的邻居集合,PIt,j表示智能体It和智能体j的通信概率;若不满足/>,则/>;/>是t-1时刻第j个智能体的输出编队参考估计值。/>是t时刻智能体i的输出编队参考估计值。/>是控制输入向量。/>,/>表示第j个元素为1,其他元素为0的N维向量;/>表示第It个元素为1,其他元素为0的N维向量;T表示转置。/>表示矩阵/>第i行第j列的元素。/>表示/>维的单位矩阵。/>是一个混合参数。/>是用于确定是否采用通信协议的信息进行更新的判断标志,若/>,则/>且/>;否则且/>,图2中“判断是否为广播节点的实际接收信息邻居”,对应具体值的判断,若智能体i与进行信息广播的智能体进行信息通信(即/>),则,否则/>。/>表示任意向量/>在集合/>上的欧式投影,/>;/>和/>是待设计的函数。/>和/>是待设计的步长序列。/>满足/>,用于驱动输出实现期望的输出编队。/>是待设计的输出编队时变补偿项。和/>是待设计的恒定增益矩阵。
图5的仿真图示出的是每个智能体基于估计器的估计值曲线及三个维度上的实际最优编队参考值,图中示出三条直线,用于分别表示最优输出编队参考在3个维度上的标量值/>。其余曲线表示所有智能体的输出编队参考估计值/>在3个维度上的标量值/>。由图5可知,/>最终趋近于/>,因此说明所提方案能对最优的输出编队参考进行估计,使智能体的实际输出编队参考最小化关于输出编队参考信号的全局目标函数,并满足所有本地集合约束和本地不等式约束。
图6的仿真图示出的是每个智能体基于估计器的关于约束的统计值曲线,图6中,agent1至agent7分别代表7个智能体;图6中,(a)部分为估计值和约束集合之间的距离;图6中,(b)部分为估计值上的非线性不等式约束函数值;表示估计值/>和集合/>之间的距离,/>表示欧式范数。该函数用于证明估计值是否满足集合约束。当/>时,则说明满足集合约束;否则不满足。/>表示关于估计值/>的不等式约束函数值。该函数用于证明估计值是否满足不等式约束。当/>时,则说明满足不等式约束;否则不满足。/>
图7的仿真图示出的是每个智能体的输出编队跟踪误差曲线;表示输出编队最优跟踪误差。该函数用于证明输出值是否实现最优输出编队跟踪。当/>趋近于0时,则说明输出值渐近收敛于最优编队构型,从而实现最优输出编队跟踪;否则没有实现。
图8的仿真图示出的是每个智能体在不同时刻的输出状态;图8中,(a)部分对应t=0s的输出状态;图8中,(b)部分对应t=80s的输出状态;图8中,(c)部分对应t=150s的输出状态;图8中,(d)部分对应t=200s的输出状态。图8中,标记符号“+”表示最优编队参考,其余标记符号表示智能体在各时刻的实际输出状态,实线表示所有智能体形成的实际编队形状。
另外,在执行步骤S4之前要判断每一所述智能体的预先定义的输出编队偏移是否满足编队跟踪可行条件。若满足公式(6)则说明预先定义的输出编队偏移可行,则执行步骤S4,否则重新设计输出编队偏移,并重新判断是否满足编队跟踪可行条件。
所述编队跟踪可行条件为。
(6)。
式中,满足/>,hi(t)表示t时刻智能体i预先定义的输出编队偏移;/>满足/>,/>表示/>维的零矩阵;/>表示/>的一阶导。
其中,关于公式(5)中的相关参数的计算如下。
计算和/>,计算式如下。
(7)。
其中,pi(t)用于实现梯度下降,从而使编队参考估计值渐近收敛于最优值;qi(t)用于使编队参考估计值满足不等式约束;是随机次梯度误差;/>是惩罚因子常数,/>,f0是/>的一个下界,g0是/>的一个下界,/>满足/>,/>表示集合/>的相对内部;,/>表示智能体i的本地不等式约束函数。为了避免式(7)中的全局信息/>,pi(t)和qi(t)的计算式还可以被进一步设计为:(8)。/>
其中,如果,则/>;否则/>,/>为任意不等于0的常数。
计算和/>,为递减的正步长序列。如果计算pi(t)和qi(t)选择式(7),则计算式如下。
(9)。
其中,表示直到时刻t时智能体i属于/>的次数。如果计算pi(t)和qi(t)选择式(8),则计算式如下。
(10)。
计算K1i和K2i。K1i使得Ai+BiK1i满足赫尔维茨定理;K2i满足K2i=Ui-K1iXi,且(Xi,Ui)满足。
(11)。
计算
(12)。
式中,,/>,/>表示/>维的单位矩阵。
本实施例中,针对集群系统在输出编队跟踪的实际应用中,现有研究成果对编队参考信号的分布式生成和最优性能的欠考虑,以及通信网络中各节点信息交互与共享通道和手段受限制所造成的通讯信息“丢包”或缺失的间歇性通信问题与异步通信问题,本发明采用随机异步广播通信协议,以解决间歇性和异步通信问题,结合李雅普诺夫方法和约束随机投影随机次梯度方法,提出一种基于估计器的完全分布式输出编队最优跟踪控制器。最终,本发明所提出的算法在异步和间歇通信的情况下,能够在渐近收敛到预定义的输出编队构型的同时,最小化关于输出编队参考信号的全局目标函数并满足所有本地集合约束和本地不等式约束。
实施例2
本发明提供一种用于异构集群系统的异步约束输出编队跟踪系统,包括如下模块。
动力学模型构建模块,用于建立异构集群系统的动力学模型。
通信拓扑结构模型构建模块,用于以所述异构集群系统的智能体为节点,以所述智能体之间的通信关系为边建立所述异构集群系统的通信拓扑结构模型;所述通信拓扑结构模型采用随机异步广播通信协议。所述通信拓扑结构模型的通信方式包括间歇性通信和异步通信;所述间歇性通信指所述智能体之间的通信链路在随机时刻会断开的通信方式;所述异步通信指每个所述智能体具有速率为1的泊松过程虚拟时钟,所有所述智能体的全局虚拟时钟为速率为N的泊松过程。
最优跟踪状态定义模块,用于基于所述动力学模型和所述通信拓扑结构模型,定义期望的输出编队参考以及求解所述期望的输出编队参考的全局目标函数和约束条件。
估计模块,用于基于所述全局目标函数和所述约束条件,应用约束随机次梯度随机投影方法确定每一所述智能体的所述输出编队参考估计值;所述输出编队参考估计值为对所述期望的输出编队参考的估计值。
最优跟踪控制协议确定模块,用于根据每一所述智能体的所述输出编队参考估计值应用李雅普诺夫方法确定每一所述智能体的输出编队最优跟踪控制协议,以达到所述期望的输出编队参考。
其中,所述智能体的输出编队最优跟踪控制协议的表达式为。
式中,是智能体i的状态向量;K1i和K2i是恒定增益矩阵;/>是输出编队时变补偿项,/>,/>,/>,/>表示/>维的单位矩阵;/>满足/>,hi(t)表示t时刻智能体i预先定义的输出编队偏移;表示/>的一阶导;/>是t时刻智能体i的输出编队参考估计值;/>和/>是异构集群系统的动力学模型的输出向量表达式中的常数矩阵。
实施例3
本实施例提供一种电子设备,包括存储器及处理器,存储器用于存储计算机程序,处理器运行计算机程序以使电子设备执行实施例1的用于异构集群系统的异步约束输出编队跟踪方法。可选地,上述电子设备可以是服务器。
各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种用于异构集群系统的异步约束输出编队跟踪方法,其特征在于,包括:
建立异构集群系统的动力学模型;
以所述异构集群系统的智能体为节点,以所述智能体之间的通信关系为边建立所述异构集群系统的通信拓扑结构模型;所述通信拓扑结构模型采用随机异步广播通信协议;所述通信拓扑结构模型的通信方式包括间歇性通信和异步通信;所述间歇性通信指所述智能体之间的通信链路在随机时刻会断开的通信方式;所述异步通信指每个所述智能体具有速率为1的泊松过程虚拟时钟,所有所述智能体的全局虚拟时钟为速率为N的泊松过程;N表示智能体数量;
基于所述动力学模型和所述通信拓扑结构模型,定义期望的输出编队参考以及求解所述期望的输出编队参考时应用的全局目标函数和约束条件;所述约束条件包括本地集合约束和本地不等式约束;
基于所述全局目标函数和所述约束条件,应用约束随机次梯度随机投影方法确定每一所述智能体的输出编队参考估计值;所述输出编队参考估计值为对所述期望的输出编队参考的估计值;
根据每一所述智能体的所述输出编队参考估计值应用李雅普诺夫方法确定每一所述智能体的输出编队最优跟踪控制协议,以达到所述期望的输出编队参考。
2.根据权利要求1所述的一种用于异构集群系统的异步约束输出编队跟踪方法,其特征在于,所述动力学模型表达式为:
其中,;xi(t)和yi(t)是智能体i的状态向量和输出向量;ui(t)是智能体i的控制输入向量;/>是xi(t)的一阶导数;/>,/>和/>是常数矩阵;ni,d,mi表示维度。
3.根据权利要求2所述的一种用于异构集群系统的异步约束输出编队跟踪方法,其特征在于,所述通信拓扑结构模型由带有间歇性通信和异步通信的无向时变拓扑定义;
其中,表示节点集合,一个节点代表一个智能体;表示边集合,(i,j)表示智能体i和智能体j之间的边,如果智能体i能够通过通信网络获得智能体j的信息,则/>,否则/>;在间歇性通信方式下,如果/>,则智能体i和智能体j的通信概率pij>0,否则pij=0。
4.根据权利要求3所述的一种用于异构集群系统的异步约束输出编队跟踪方法,其特征在于,所述全局目标函数的表达式为:
所述约束条件的表达式为:
其中,
式中,表示关于输出编队参考的全局变量;fi()是智能体i的本地代价函数;gi()是智能体i的本地不等式约束函数;/>是智能体i的本地集合约束;/>是智能体i的索引集合;/>是智能体i的简单集合;/>是随机序列且独立同分布,在/>上的概率分布服从正的概率分布。
5.根据权利要求4所述的一种用于异构集群系统的异步约束输出编队跟踪方法,其特征在于,在执行步骤“基于所述全局目标函数和所述约束条件,应用约束随机次梯度随机投影方法确定每一所述智能体的输出编队参考估计值”之前,包括:
判断每一所述智能体的预先定义的输出编队偏移是否满足编队跟踪可行条件;
若满足,则确定每一所述智能体的所述输出编队参考估计值;
若不满足,则重新定义所述输出编队偏移。
6.根据权利要求5所述的一种用于异构集群系统的异步约束输出编队跟踪方法,其特征在于,所述编队跟踪可行条件为:
式中,满足/>,hi(t)表示t时刻智能体i预先定义的输出编队偏移;满足/>,/>表示/>维的零矩阵;/>表示/>的一阶导。
7.根据权利要求6所述的一种用于异构集群系统的异步约束输出编队跟踪方法,其特征在于,所述输出编队参考估计值的表达式为:
其中,
式中,是t时刻智能体i的输出编队参考估计值;zi(t)表示t时刻在随机异步广播通信协议下的加权平均编队参考估计值;/>,/>表示t时刻进行信息广播的智能体It的邻居集合,/>表示智能体It和智能体j的通信概率;若智能体,则/>,否则/>;/>表示任意向量E在集合/>上的欧式投影,;/>表示矩阵/>第i行第j列的元素;是t-1时刻智能体j的输出编队参考估计值;/>表示第j个元素为1,其他元素为0的N维向量;/>表示第It个元素为1,其他元素为0的N维向量;T表示转置;/>表示/>维的单位矩阵;/>是一个混合参数,/>;/>是随机次梯度误差;,/>表示智能体i的本地不等式约束函数;/>和/>分别表示fi和gi的梯度或次梯度;如果/>,则/>,否则/>,/>为任意不等于0的常数;/>表示欧式范数;/>和/>表示递减的正步长序列。
8.根据权利要求7所述的一种用于异构集群系统的异步约束输出编队跟踪方法,其特征在于,所述智能体的输出编队最优跟踪控制协议的表达式为:
式中,K1i和K2i是恒定增益矩阵;是输出编队时变补偿项,,/>,/>,/>表示/>维的单位矩阵。
9.一种用于异构集群系统的异步约束输出编队跟踪系统,其特征在于,包括:
动力学模型构建模块,用于建立异构集群系统的动力学模型;
通信拓扑结构模型构建模块,用于以所述异构集群系统的智能体为节点,以所述智能体之间的通信关系为边建立所述异构集群系统的通信拓扑结构模型;所述通信拓扑结构模型采用随机异步广播通信协议;所述通信拓扑结构模型的通信方式包括间歇性通信和异步通信;所述间歇性通信指所述智能体之间的通信链路在随机时刻会断开的通信方式;所述异步通信指每个所述智能体具有速率为1的泊松过程虚拟时钟,所有所述智能体的全局虚拟时钟为速率为N的泊松过程;N表示智能体数量;
最优跟踪状态定义模块,用于基于所述动力学模型和所述通信拓扑结构模型,定义期望的输出编队参考以及求解所述期望的输出编队参考的全局目标函数和约束条件;所述约束条件包括本地集合约束和本地不等式约束;
估计模块,用于基于所述全局目标函数和所述约束条件,应用约束随机次梯度随机投影方法确定每一所述智能体的输出编队参考估计值;所述输出编队参考估计值为对所述期望的输出编队参考的估计值;
最优跟踪控制协议确定模块,用于根据每一所述智能体的所述输出编队参考估计值应用李雅普诺夫方法确定每一所述智能体的输出编队最优跟踪控制协议,以达到所述期望的输出编队参考。
10.根据权利要求9所述的一种用于异构集群系统的异步约束输出编队跟踪系统,其特征在于,所述智能体的输出编队最优跟踪控制协议的表达式为:
式中,是智能体i的状态向量;K1i和K2i是恒定增益矩阵;/>是输出编队时变补偿项,/>,/>,/>,/>表示/>维的单位矩阵;满足/>,hi(t)表示t时刻智能体i预先定义的输出编队偏移;/>表示的一阶导;/>是t时刻智能体i的输出编队参考估计值;/>,/>是异构集群系统的动力学模型的输出向量表达式中的常数矩阵。
CN202410153127.0A 2024-02-04 2024-02-04 用于异构集群系统的异步约束输出编队跟踪方法及系统 Active CN117687309B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410153127.0A CN117687309B (zh) 2024-02-04 2024-02-04 用于异构集群系统的异步约束输出编队跟踪方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410153127.0A CN117687309B (zh) 2024-02-04 2024-02-04 用于异构集群系统的异步约束输出编队跟踪方法及系统

Publications (2)

Publication Number Publication Date
CN117687309A CN117687309A (zh) 2024-03-12
CN117687309B true CN117687309B (zh) 2024-04-16

Family

ID=90137529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410153127.0A Active CN117687309B (zh) 2024-02-04 2024-02-04 用于异构集群系统的异步约束输出编队跟踪方法及系统

Country Status (1)

Country Link
CN (1) CN117687309B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019134254A1 (zh) * 2018-01-02 2019-07-11 上海交通大学 一种运用分布式神经网络的实时经济调度计算方法
CN111665848A (zh) * 2020-06-28 2020-09-15 北京航空航天大学 拓扑切换下无人机与无人车异构集群编队跟踪控制方法
KR102264073B1 (ko) * 2020-05-18 2021-06-11 엘아이지넥스원 주식회사 편대 비행체 추적방법 및 장치
CN112987790A (zh) * 2021-03-04 2021-06-18 北京航空航天大学 一种分布式异构集群系统分组编队跟踪控制方法和系统
WO2022057107A1 (zh) * 2020-09-18 2022-03-24 中国人民解放军海军航空大学 面向观测优化的多机异类传感器协同多目标跟踪方法
CN116700012A (zh) * 2023-07-19 2023-09-05 合肥工业大学 一种多智能体的避撞编队合围控制器的设计方法
CN117452975A (zh) * 2023-11-29 2024-01-26 河南科技大学 一种四旋翼无人机集群的保性能协同编队控制设计方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019134254A1 (zh) * 2018-01-02 2019-07-11 上海交通大学 一种运用分布式神经网络的实时经济调度计算方法
KR102264073B1 (ko) * 2020-05-18 2021-06-11 엘아이지넥스원 주식회사 편대 비행체 추적방법 및 장치
CN111665848A (zh) * 2020-06-28 2020-09-15 北京航空航天大学 拓扑切换下无人机与无人车异构集群编队跟踪控制方法
WO2022057107A1 (zh) * 2020-09-18 2022-03-24 中国人民解放军海军航空大学 面向观测优化的多机异类传感器协同多目标跟踪方法
CN112987790A (zh) * 2021-03-04 2021-06-18 北京航空航天大学 一种分布式异构集群系统分组编队跟踪控制方法和系统
CN116700012A (zh) * 2023-07-19 2023-09-05 合肥工业大学 一种多智能体的避撞编队合围控制器的设计方法
CN117452975A (zh) * 2023-11-29 2024-01-26 河南科技大学 一种四旋翼无人机集群的保性能协同编队控制设计方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Output formation-containment of coupled heterogeneous linear systems under intermittent communication;Wang Yanwu 等;Journal of the Franklin Institute;20171231;全文 *
切换网络分布式次梯度优化算法;李甲地 等;计算机科学;20180115(第01期);全文 *
拓扑切换的集群系统分布式分组时变编队跟踪控制;田磊 等;中国科学:信息科学;20200302(第03期);全文 *
间歇通信条件下多无人机保性能编队追踪控制;权婉珍 等;系统工程与电子技术;20211231;第43卷(第11期);全文 *

Also Published As

Publication number Publication date
CN117687309A (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
Yang et al. Fault tolerant cooperative control for a class of nonlinear multi-agent systems
Alavi et al. A distributed event-triggered control strategy for DC microgrids based on publish-subscribe model over industrial wireless sensor networks
CN112180734A (zh) 一种基于分布式自适应事件触发的多智能体一致性方法
CN114020042A (zh) 一种异构无人集群编队合围跟踪控制方法及系统
CN113110039B (zh) 一种多智能体系统的有限时间分布式聚合优化方法
CN111259327A (zh) 基于子图处理的多智能体系统一致性问题的优化方法
Lin et al. Distributed formation control with open-loop Nash strategy
CN112469047B (zh) 一种天地一体化智能网络卫星节点部署方法
CN111414575A (zh) 基于符号函数的多智能体系统的分布式广义跟踪方法
CN113176732A (zh) 一种非线性随机多智能体系统固定时间一致控制方法
Srivastava et al. Distributed min-max optimization in networks
CN109818792B (zh) 一种基于二阶线性系统时变耦合复杂动态网络模型的控制器
CN112947086B (zh) 一种无人机和无人车组成的异构多智能体系统编队控制中执行器故障的自适应补偿方法
CN117687309B (zh) 用于异构集群系统的异步约束输出编队跟踪方法及系统
CN114301910A (zh) 一种物联网环境下的云边协同计算任务卸载方法
Xu et al. An energy-efficient distributed average consensus scheme via infrequent communication
CN116430899A (zh) 基于强化学习的异构集群无人系统事件触发协同控制方法
De et al. Bounded consensus tracking of heterogeneous multiagent systems under digraphs with diverse communication and input delays
CN113359474B (zh) 基于梯度反馈的可扩展分布式多智能体一致性控制方法
CN115933631A (zh) 一种应用于欠驱动无人艇的编队控制器构建方法及装置
CN115167217A (zh) 一种基于混杂触发机制的多智能体协同控制方法及介质
CN114364034A (zh) 基于drl的ris辅助用户中心化去蜂窝系统中资源管理半并行方法
Kuze et al. Hierarchical optimal control method for controlling self-organized networks with light-weight cost
CN116414037B (zh) 一种用于集群系统约束控制的自适应装置
CN116679753B (zh) 一种异构无人系统抗欺骗攻击的编队跟踪控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant