CN114609909A - 一种切换拓扑下的随机多智体系统控制协议的设计方法 - Google Patents

一种切换拓扑下的随机多智体系统控制协议的设计方法 Download PDF

Info

Publication number
CN114609909A
CN114609909A CN202210252865.1A CN202210252865A CN114609909A CN 114609909 A CN114609909 A CN 114609909A CN 202210252865 A CN202210252865 A CN 202210252865A CN 114609909 A CN114609909 A CN 114609909A
Authority
CN
China
Prior art keywords
agent system
agent
control protocol
designing
switching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210252865.1A
Other languages
English (en)
Inventor
陈凯锐
颜川策
朱章谋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou University
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN202210252865.1A priority Critical patent/CN114609909A/zh
Publication of CN114609909A publication Critical patent/CN114609909A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

一种切换拓扑下的随机多智体系统控制协议的设计方法,包括:构建具有切换拓扑且在随机噪声干扰下多智能体系统的高阶线性多智能体系统模型;并设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议;根据控制协议构建切换拓扑图,利用切换拓扑图获取多智能体系统中各个智能体之间的通信关系,确认所述多智能体系统的通信拓扑关系;根据通信拓扑关系定义误差变量,选取李雅普诺夫函数并对所述李雅普诺夫函数对时间进行求导和求期望;设计耦合强度和控制增益矩阵,确认李雅普诺夫函数求期望后的最简式,得到稳定的多智能体系统;本申请整体系统模型的输出在切换拓扑且伴有随机乘性噪声干扰下能够很好地实现一致稳定性。

Description

一种切换拓扑下的随机多智体系统控制协议的设计方法
技术领域
本发明涉及智能体研究技术领域,特别涉及一种切换拓扑下的随机多智体系统控制协议的设计方法。
背景技术
近年来,随机多智能体系统一致稳定性控制问题由于其广泛的民用和军用而备受关注,其应用涉及国计民生的各个领域,如国家电网系统、移动通信网络、城市交通网络等,其正常运行对国民经济发展和社会稳定具有重要的影响。一致性问题的关键就是从有限的邻居智能体的信息到实现整个多智能体系统的全局目标,使网络中的所有节点收敛到一个共同的值。
多智能体系统中往往存在随机噪声的情况,目前大多数学者有关于噪声的研究均表明噪声会破坏系统的稳定性,这种结论也符合我们对噪声的一般认识。对于多智能体网络,节点及其连接经常受到噪声环境的影响,导致节点不能准确地接收到相邻节点的状态。因此,为了提高多智能体系统的稳定性及可靠性,需要在设计控制协议算法的过程中考虑噪声问题对数据传输的影响。
在现有技术中,大部分学者在对于一般多智能体系统,都考虑到了噪声干扰的影响。但是在切换拓扑结构下,并未考虑随机高阶线性多智能体系统的一致性控制的问题。
发明内容
针对上述问题,本发明提供了一种切换拓扑下的随机多智体系统控制协议的设计方法,旨在解决现有技术中无法实现具有切换拓扑结构下高阶多智能体系统在乘性噪声环境下的一致性控制的问题。
第一方面,本申请提供了一种切换拓扑下的随机多智体系统控制协议的设计方法,包括:
构建具有切换拓扑且在随机噪声干扰下多智能体系统的高阶线性多智能体系统模型;
根据高阶线性多智能体系统模型,设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议;
根据控制协议构建切换拓扑图,利用切换拓扑图获取多智能体系统中各个智能体之间的通信关系,根据所述通信关系确认所述多智能体系统的通信拓扑关系;
根据所述通信拓扑关系定义误差变量,选取李雅普诺夫函数并对所述李雅普诺夫函数对时间进行求导和求期望;
设计耦合强度和控制增益矩阵,确认李雅普诺夫函数求期望后的最简式,得到稳定的多智能体系统。
第二方面,本申请提供了一种实施第一方面中任一项所述的切换拓扑下的随机多智体系统控制协议的设计方法的系统,包括:
系统模型构建模块,用于构建具有切换拓扑且在随机噪声干扰下多智能体系统的高阶线性多智能体系统模型;
控制协议设计模块,用于根据高阶线性多智能体系统模型,设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议;
拓扑关系确认模块,用于根据控制协议构建切换拓扑图,利用切换拓扑图获取多智能体系统中各个智能体之间的通信关系,根据所述通信关系确认所述多智能体系统的通信拓扑关系;
期望求解模块,用于根据所述通信拓扑关系定义误差变量,选取李雅普诺夫函数并对所述李雅普诺夫函数对时间进行求导和求期望;
稳定多智能体系统获取模块,用于设计耦合强度和控制增益矩阵,确认李雅普诺夫函数求期望后的最简式,得到稳定的多智能体系统。
第三方面,本申请还提供了一种计算机装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如第一方面中任一项所述的一种切换拓扑下的随机多智体系统控制协议的设计方法。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如第一方面中任一项所述的一种切换拓扑下的随机多智体系统控制协议的设计方法。
本申请相比于现有技术,其可带来如下有益效果:
本发明的技术方案建立了新颖的具有切换拓扑且在随机乘性噪声下系统稳定判据,成功利用代数黎卡提方程构造了带有切换拓扑和随机干扰项的控制器,利用李雅普诺夫和
Figure BDA0003547529530000021
公式解决了系统模型中未知函数对控制器设计所带来的困难。通过实验结果可以得出,整体系统模型的输出在切换拓扑且伴有随机乘性噪声干扰下能够很好地实现一致稳定性。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明实施例提供的一种切换拓扑下的随机多智体系统控制协议的设计方法流程图;
图2是本发明实施例提供的切换拓扑结构图;
图3是本发明实施例提供的智能体状态仿真图;
图4是本发明实施例提供的智能体均方误差仿真图;
图5是本发明实施例提供的一种切换拓扑下的随机多智体系统控制协议的设计系统的框架结构图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。
参见图1实施例所示的一种切换拓扑下的随机多智体系统控制协议的设计方法流程图;
其主要包括如下步骤:
S101、构建具有切换拓扑且在随机噪声干扰下多智能体系统的高阶线性多智能体系统模型。
具体为:构建在随机噪声干扰下多智能体系统的连续时间高阶线性多智体系统模型:
Figure BDA0003547529530000031
yji(t)=xi(t)+gij(xi(t)-xj(t))ξij(t),
其中,xi(t)为连续时间线性多智能体系统的状态向量,xj(t)为邻居智能体的状态向量,
Figure BDA0003547529530000032
为xi(t)的求导,xi(t)=[x1(t),x2(t),…,xN(t)];A为系统矩阵;B为控制矩阵;ui(t)为第i个智能体控制输入,ui(t)=[u1(t),u2(t),...,uN(t)];yji(t)表示智能体j对智能体i的测量关系;gij(·)为噪声强度函数,表示Rn到Rn的映射,存在一个常数ε>0,使||gij(x)||≤ε||x||;ξij(t)是随机测量噪声,其过程满足以下条件:
Figure BDA0003547529530000033
其中,ξij(s)是被积函数,ds为积分变量,ξij(s)ds为被积表达式,对其在0到t时间内求积分可得wij(t),wij(t)为独立的布朗运动,i,j=1,2,...,N,L为多智能体对应的拉普拉斯矩阵,K为控制增益矩阵,N为智能体个数。
现有技术都没有研究高阶系统带随机噪声的模式,而多智能体之间的通信总是会存在噪声,本实施例通过构建具有切换拓扑且在随机噪声干扰下多智能体系统的高阶线性多智能体系统模型,能够解决这种智能体间通信的噪声干扰,其次,运用切换拓扑结构,也能够满足更多情况下的需求。
S102、根据高阶线性多智能体系统模型,设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议。
设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议ui(t),具体为:
Figure BDA0003547529530000041
其中,ui(t)为第i个智能体的控制输入,ui(t)=[u1(t),u2(t),...,uN(t)];c为耦合强度;K为控制增益矩阵;xi(t)为连续时间线性多智能体系统的状态向量,aij(())表示各个切换拓扑图中智能体之间的通信权重,且σ(t)满足引理2中马尔科夫切换要求,xi(t)=[x1(t),x2(t),…,xN(t)];yji(t)表示智能体j对智能体i的测量关系。
在一实施例中,控制增益矩阵K为:
Figure BDA0003547529530000042
其中,P是代数黎卡提方程0=ATP+PA+Q-PBBTP的唯一正定解,A和B分别为系统中的系统矩阵和控制矩阵,且A,B是稳定的,Q是可设计的一个正定矩阵,并且K还伴随一个最优控制问题。
在一实施例中,耦合强度c的区间范围为:
Figure BDA0003547529530000043
其中,λ为特征值,λ2为第二小的特征值,λmin为最小特征值,λmax为最大特征值,Lun为全部切换拓扑图连通的拉普拉斯矩阵,N为节点个数,ε为噪声强度系数。
S103、根据控制协议构建切换拓扑图,利用切换拓扑图获取多智能体系统中各个智能体之间的通信关系,根据所述通信关系确认所述多智能体系统的通信拓扑关系。
参见图2实施例所示的切换拓扑结构图;
设G=(V,E,A)是一个加权有向图,其中V={1,2,...,N}为节点集;
Figure BDA0003547529530000044
为边缘集;加权邻接矩阵A=[aij]∈RN×N表示图的结构;加权有向图G的一条边用(i,j)表示,表示从节点i到节点j的单向信息传输,设定智能体i为节点i,设定智能体j为节点j;若节点j与i之间存在信息通信,则表示为aij=1,否则表示aij=0;若当G是一个无向图时,(i,j)是一个双向的信息传输过程,节点间的通信是双向的,即智能体间的信息是双向的。
所描述的图G是由几个切换的图组成,即
Figure BDA0003547529530000051
其中,m为切换图的个数,r为第r个切换图。设G(σ(t))=(V,E(σ(t)),A(σ(t)))是智能体在t时刻的交互拓扑,其中边集E(σ(t))和邻接矩阵A(σ(t))是时变的。其中节点间的通信是双向的,若节点j与i之间存在信息通信,则表示为aij=1,否则表示aij=0。
S104、根据通信拓扑关系定义误差变量,选取李雅普诺夫函数并对所述李雅普诺夫函数对时间进行求导和求期望;
参见图3和图4所示的智能体状态仿真图与均方误差仿真图;
根据所述通信拓扑关系定义误差变量,具体为:
定义误差变量
Figure BDA0003547529530000052
其中,IN为N×N的单位矩阵,
Figure BDA0003547529530000053
其内部元素全为1/N,In为n×n的单位矩阵,x(t)为连续时间线性多智能体系统的状态向量;
根据定义的误差得到关于方程a的形式:
Figure BDA0003547529530000054
其中,de(t)为对误差e(t)的时间函数求微分,ei(t),ej(t)分别表示第i个智能体的误差和第j个智能体的误差,dt是de(t)对时间的微分,N为智能体个数,IN为N×N的单位矩阵,A为系统矩阵,c为耦合强度,L(σ(t))为各个拓扑图拉普拉斯矩阵,B为控制矩阵,aij(())表示各个切换拓扑图中智能体之间的通信权重,
Figure BDA0003547529530000055
其内部元素全为1/N,In为n×n的单位矩阵,K为控制增益矩阵,gij(·)为噪声强度函数,η为N维的列向量,其中第i个元素为1,其他全为0;wij(t)为独立的布朗运动,是由随机测量噪声ξij(s)对其在0到t时间内求积分可得;
选取李雅普诺夫函数
Figure BDA0003547529530000061
由于具有切换拓扑结构,因此李雅普诺夫函数表示为
Figure BDA0003547529530000062
其中,
Figure BDA0003547529530000063
E[·]表示对中括号内的数值求期望。σ(t)允许一个独特的稳态分布π=[π1,…πm]T
根据公式b,对该选取的李雅普诺夫函数对时间t求导:
Figure BDA0003547529530000064
其中,e(t)为误差,ei(t),ej(t)分别表示第i个智能体的误差和第j个智能体的误差,dt是dV对时间的微分,这里是对误差的微分;E[·]表示对中括号内的数值求期望,N为智能体个数,IN为N*N的单位矩阵,A为系统矩阵,c为耦合强度,m为切换拓扑图的个数,r表示第r个拓扑图,πr或πs为σ(t)所满足的稳态分布π向量中第r个值、第s个值,Lr为各个切换拓扑图拉普拉斯矩阵,且
Figure BDA0003547529530000065
Lun为所有切换拓扑图连通的拉普拉斯矩阵,B为控制矩阵,aij(())表示各个切换拓扑图中智能体之间的通信权重,
Figure BDA0003547529530000066
其内部元素全为1/N,In为n*n的单位矩阵,K为控制增益矩阵,gij(·)为噪声强度函数,P是代数黎卡提方程的唯一正定解,η为N维的列向量,其中第i个元素为1,其他全为0;qrs引理2所述转移速率矩阵中的元素。
S105、设计耦合强度和控制增益矩阵,确认期望最简式,得到稳定的多智能体系统。
设计耦合强度和控制增益矩阵,确认最简式,具体为:
Figure BDA0003547529530000067
公式、黎卡提方程及引理1、2得到
Figure BDA0003547529530000068
的最简式;
Figure BDA0003547529530000071
其中,e(t)为误差,ei(t),ej(t)分别表示第i个智能体的误差和第j个智能体的误差,dt是dV对时间的微分,这里是对误差的微分;E[·]表示对中括号内的数值求期望,N为智能体个数,IN为N*N的单位矩阵,A为系统矩阵,c为耦合强度,m为切换拓扑图的个数,r表示第r个拓扑图,πr或πs为σ(t)所满足的稳态分布π向量中第r个值、第s个值,Lr为各个切换拓扑图拉普拉斯矩阵,且
Figure BDA0003547529530000072
Lun为所有切换拓扑图连通的拉普拉斯矩阵,B为控制矩阵,aij(σ(t))表示各个切换拓扑图中智能体之间的通信权重,
Figure BDA0003547529530000073
其内部元素全为1/N,In为n*n的单位矩阵,K为控制增益矩阵,gij(·)为噪声强度函数,P是代数黎卡提方程的唯一正定解,η为N维的列向量,其中第i个元素为1,其他全为0;qrs引理2所述转移速率矩阵中的元素。
(11)根据比较原理,最终可以得出
Figure BDA0003547529530000074
小于0的结论,并且实现均方稳定:
Figure BDA0003547529530000075
其中
Figure BDA0003547529530000076
且ρ>0。
最终使高阶多智能体系统在具有切换拓扑的情况下克服随机乘性噪声干扰并达到稳定,从而实现一致性。
进一步地,在本发明的随机高阶多智能体系统的设计方法中,公式(a)以及(b)的定义如下:
随机系统为:
Figure BDA0003547529530000081
其中,x表示系统的状态,w是一个标准的随机布朗运动,ηN,t为定义的一个全为1的列向量,第i个元素为1,其他元素为0的n维列向量。
对于任何给定的V(x)与随机系统结合,定义微分算子如下:
Figure BDA0003547529530000082
其中,Tr{A}为矩阵A的迹,h表示任意未知线性函数组成的向量。
控制协议设计目标是为了使系统在切换拓扑条件和乘性噪声环境下仍然能保持稳定,由模型可得耦合强度c和控制增益矩阵K等都需要设计,具体设计步骤如下:
(1)获取在乘性噪声的高阶线性系统动力学方程,具体见公式(a);
(2)根据多智能体间的通信拓扑图进行分析,若节点j与i之间存在信息通信,则表示为aij=1,否则表示aij=0。定义误差变量
Figure BDA0003547529530000086
根据定义的误差得到关于方程(a)的形式:
Figure BDA0003547529530000083
(3)选取李雅普诺夫函数
Figure BDA0003547529530000084
然后对该选取的V求导求期望,根据所设计的耦合强度c、控制增益矩阵K、方程(b)、
Figure BDA0003547529530000085
公式、黎卡提方程及引理1得到最终的最简式。
Figure BDA0003547529530000091
其中,e(t)为误差,ei(t),ej(t)分别表示第i个智能体的误差和第j个智能体的误差,dt就是dV对时间的微分,这里是对李雅普诺夫函数V的微分;N为智能体个数,IN为N*N的单位矩阵,A为系统矩阵,c为耦合强度,L为通讯拓扑图拉普拉斯矩阵,B为控制矩阵,aij表示智能体之间的通信权重,
Figure BDA0003547529530000092
其内部元素全为1/N,In为n*n的单位矩阵,K为控制增益矩阵,gij(·)为噪声强度函数,P是代数黎卡提方程的唯一正定解,η为N维的列向量,其中第i个元素为1,其他全为0;wij(t)为独立的布朗运动,是由随机测量噪声ξij(s),对其在0到t时间内求积分可得;
引理1:如果G是一个无向连通图,则L是N×N的实对称矩阵,其特征值可递增为0=λ1(L)<λ2(L)≤…≤λN(L)并且
Figure BDA0003547529530000093
其中λ2(L)称为G的代数连通性,λ为特征值,L为通信拓扑图的拉普拉斯矩阵,x为状态向量。
引理2:所有随机变量的公共概率空间用
Figure BDA0003547529530000094
表示,其中Ω为基本事件的样本空间;
Figure BDA0003547529530000095
是样本空间子集的σ场;
Figure BDA0003547529530000096
是F上的概率测度。设连续时间马尔科夫过程的无穷小生成元为:{σ(t),t∈R≥0},其中R为全体实数,所有的生成元组成转移速率矩阵Ξ=[qrs]m×m,其中转移速率矩阵的行求和为零,所有的非对角线元素都是非负的。转移速率矩阵由
Figure BDA0003547529530000101
确定。其中qrs是从状态r到状态s的过渡速率,若r≠s,则qrs≥0;qrr=-∑s≠rqrs
o(h)表示比h高阶的无穷小,即
Figure BDA0003547529530000102
公式(a)以及(b)的定义如下:
随机系统为:
Figure BDA0003547529530000103
其中,x表示系统的状态,w是一个标准的随机布朗运动,ηN,i为定义的一个全为1的列向量,第i个元素为1,其他元素为0的n维列向量;
对于任何给定的V(x)与随机系统结合,定义微分算子如下:
Figure BDA0003547529530000104
其中,Tr{A}为矩阵A的迹,h表示任意未知线性函数组成的向量。
耦合强度c的区间范围:
Figure BDA0003547529530000105
控制增益矩阵K为:
Figure BDA0003547529530000106
其中,P是代数黎卡提方程0=ATP+PA+Q-PBBTP的唯一正定解,A和B分别为系统中的系统矩阵和控制矩阵,且A,B是稳定的,Q是可设计的一个正定矩阵,并且K还伴随一个最优控制问题。在对选定的V进行稳定性分析证明时候,对于
Figure BDA0003547529530000107
第一部分的分析
Figure BDA0003547529530000111
而对于
Figure BDA0003547529530000112
的第二部分分析与c上界取值有关,c上界的选取则取决于定义的ρ需要满足系统能实现稳定性原则。
根据均方收敛的原则,对最简式
Figure BDA0003547529530000113
求期望可以得到系统满足均方收敛稳定性的要求。
本发明研究的是闭环反馈模型,并建立了新颖的具有切换拓扑且在随机乘性噪声下系统稳定判据,成功利用代数黎卡提方程构造了带有切换拓扑和随机干扰项的控制协议,利用李雅普诺夫和
Figure BDA0003547529530000114
公式解决了系统模型中未知函数对控制器设计所带来的困难。通过实验结果可以得出,整体系统模型的输出在随机乘性噪声干扰下能够很好地实现一致稳定性。
参见图5实施例所示的一种切换拓扑下的随机多智体系统控制协议的设计系统框架结构图;
本申请还提供了一种实施上述任一实施例所述的切换拓扑下的随机多智体系统控制协议的设计方法的系统,包括:
系统模型构建模块1,用于构建具有切换拓扑且在随机噪声干扰下多智能体系统的高阶线性多智能体系统模型;
控制协议设计模块2,用于根据高阶线性多智能体系统模型,设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议;
拓扑关系确认模块3,用于根据控制协议构建切换拓扑图,利用切换拓扑图获取多智能体系统中各个智能体之间的通信关系,根据所述通信关系确认所述多智能体系统的通信拓扑关系;
期望求解模块4,用于根据所述通信拓扑关系定义误差变量,选取李雅普诺夫函数并对所述李雅普诺夫函数对时间进行求导和求期望;
稳定多智能体系统获取模块5,用于设计耦合强度和控制增益矩阵,确认李雅普诺夫函数求期望后的最简式,得到稳定的多智能体系统。
在一实施例中,本申请还提供了一种计算机装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如上述任一实施例所述的一种切换拓扑下的随机多智体系统控制协议的设计方法。
在一实施例中,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如上述任一实施例所述的一种切换拓扑下的随机多智体系统控制协议的设计方法。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (10)

1.一种切换拓扑下的随机多智体系统控制协议的设计方法,其特征在于,包括:
构建具有切换拓扑且在随机噪声干扰下多智能体系统的高阶线性多智能体系统模型;
根据所述高阶线性多智能体系统模型,设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议;
根据控制协议构建切换拓扑图,利用切换拓扑图获取多智能体系统中各个智能体之间的通信关系,根据所述通信关系确认所述多智能体系统的通信拓扑关系;
根据所述通信拓扑关系定义误差变量,选取李雅普诺夫函数并对所述李雅普诺夫函数对时间进行求导和求期望;
设计耦合强度和控制增益矩阵,确认李雅普诺夫函数求期望后的最简式,得到稳定的多智能体系统。
2.根据权利要求1所述的一种切换拓扑下的随机多智体系统控制协议的设计方法,其特征在于,所述构建具有切换拓扑且在随机噪声干扰下多智能体系统的高阶线性多智能体系统模型,包括:
构建在随机噪声干扰下多智能体系统的连续时间高阶线性多智体系统模型:
Figure FDA0003547529520000011
yji(t)=xi(t)+gij(xi(t)-xj(t))ξij(t),
其中,xi(t)为连续时间线性多智能体系统的状态向量,xj(t)为邻居智能体的状态向量,
Figure FDA0003547529520000012
为xi(t)的求导,xi(t)=[x1(t),x2(t),…,xN(t)];A为系统矩阵;B为控制矩阵;ui(t)为第i个智能体控制输入,ui(t)=[u1(t),u2(t),...,uN(t)];yji(t)表示智能体j对智能体i的测量关系;gij(·)为噪声强度函数,表示Rn到Rn的映射,存在一个常数ε>0,使||gij(x)||≤ε||x||;ξij(t)是随机测量噪声,其过程满足以下条件:
Figure FDA0003547529520000013
其中,ξij(s)是被积函数,ds为积分变量,ξij(s)ds为被积表达式,对其在0到t时间内求积分可得wij(t),wij(t)为独立的布朗运动,i,j=1,2,...,N。
3.根据权利要求2所述的一种切换拓扑下的随机多智体系统控制协议的设计方法,其特征在于,所述根据高阶线性多智能体系统模型,设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议,包括:
设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议ui(t),具体为:
Figure FDA0003547529520000021
其中,ui(t)为第i个智能体的控制输入,ui(t)=[u1(t),u2(t),...,uN(t)];c为耦合强度;K为控制增益矩阵;xi(t)为连续时间线性多智能体系统的状态向量,aij(σ(t))表示各个切换拓扑图中智能体之间的通信权重,xi(t)=[x1(t),x2(t),…,xN(t)];yji(t)表示智能体j对智能体i的测量关系。
4.根据权利要求3所述的一种切换拓扑下的随机多智体系统控制协议的设计方法,其特征在于,所述控制增益矩阵K为:
Figure FDA0003547529520000022
其中,P是代数黎卡提方程0=ATP+PA+Q-PBBTP的唯一正定解,A和B分别为系统中的系统矩阵和控制矩阵,且A,B是稳定的,Q是一个正定矩阵。
5.根据权利要求3所述的一种切换拓扑下的随机多智体系统控制协议的设计方法,其特征在于,所述耦合强度c的区间范围为:
Figure FDA0003547529520000023
其中,λ为特征值,λ2为第二小的特征值,λmin为最小特征值,λmax为最大特征值,Lun为全部切换拓扑图连通的拉普拉斯矩阵,N为节点个数,ε为噪声强度系数。
6.根据权利要求1所述的一种切换拓扑下的随机多智体系统控制协议的设计方法,其特征在于,所述根据所述通信拓扑关系定义误差变量,包括:
定义误差变量
Figure FDA0003547529520000024
其中,IN为N×N的单位矩阵,
Figure FDA0003547529520000025
其内部元素全为1/N,In为n×n的单位矩阵,x(t)为连续时间线性多智能体系统的状态向量。
7.根据权利要求1所述的一种切换拓扑下的随机多智体系统控制协议的设计方法,其特征在于,所述设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议,包括:
设G=(V,E,A)是一个加权有向图,其中V={1,2,…,N}为节点集;
Figure FDA0003547529520000026
为边缘集;加权邻接矩阵A=[aij]∈RN×N表示图的结构;加权有向图G的一条边用(i,j)表示,表示从节点i到节点j的单向信息传输,设定智能体i为节点i,设定智能体j为节点j;若节点j与i之间存在信息通信,则表示为aij=1,否则表示aij=0;若当G是一个无向图时,(i,j)是一个双向的信息传输过程,节点间的通信是双向的,即智能体间的信息是双向的。
8.一种实施权利要求1-7任一项所述的切换拓扑下的随机多智体系统控制协议的设计方法的系统,其特征在于,包括:
系统模型构建模块,用于构建具有切换拓扑且在随机噪声干扰下多智能体系统的高阶线性多智能体系统模型;
控制协议设计模块,用于根据高阶线性多智能体系统模型,设计具有切换拓扑的分布式随机共识的所述多智能体系统的控制协议;
拓扑关系确认模块,用于根据控制协议构建切换拓扑图,利用切换拓扑图获取多智能体系统中各个智能体之间的通信关系,根据所述通信关系确认所述多智能体系统的通信拓扑关系;
期望求解模块,用于根据所述通信拓扑关系定义误差变量,选取李雅普诺夫函数并对所述李雅普诺夫函数对时间进行求导和求期望;
稳定多智能体系统获取模块,用于设计耦合强度和控制增益矩阵,确认李雅普诺夫函数求期望后的最简式,得到稳定的多智能体系统。
9.一种计算机装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一项所述的一种切换拓扑下的随机多智体系统控制协议的设计方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如权利要求1-7中任一项所述的一种切换拓扑下的随机多智体系统控制协议的设计方法。
CN202210252865.1A 2022-03-15 2022-03-15 一种切换拓扑下的随机多智体系统控制协议的设计方法 Pending CN114609909A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210252865.1A CN114609909A (zh) 2022-03-15 2022-03-15 一种切换拓扑下的随机多智体系统控制协议的设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210252865.1A CN114609909A (zh) 2022-03-15 2022-03-15 一种切换拓扑下的随机多智体系统控制协议的设计方法

Publications (1)

Publication Number Publication Date
CN114609909A true CN114609909A (zh) 2022-06-10

Family

ID=81863766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210252865.1A Pending CN114609909A (zh) 2022-03-15 2022-03-15 一种切换拓扑下的随机多智体系统控制协议的设计方法

Country Status (1)

Country Link
CN (1) CN114609909A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134269A (zh) * 2022-06-28 2022-09-30 北京邮电大学 多智能体系统连通性的检测方法和装置
CN115378648A (zh) * 2022-07-18 2022-11-22 深圳市人工智能与机器人研究院 多智能体系统的防网络攻击包含控制方法、装置及终端

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134269A (zh) * 2022-06-28 2022-09-30 北京邮电大学 多智能体系统连通性的检测方法和装置
CN115134269B (zh) * 2022-06-28 2023-08-25 北京邮电大学 多智能体系统连通性的检测方法和装置
CN115378648A (zh) * 2022-07-18 2022-11-22 深圳市人工智能与机器人研究院 多智能体系统的防网络攻击包含控制方法、装置及终端

Similar Documents

Publication Publication Date Title
Crisanti et al. Path integral approach to random neural networks
Zhu et al. Distributed Nash equilibrium seeking in an aggregative game on a directed graph
An et al. Group consensus control for networked multi-agent systems with communication delays
Wang et al. Synchronization and adaptive control of an array of linearly coupled reaction-diffusion neural networks with hybrid coupling
Xie et al. Leader-following consensus in second-order multi-agent systems with input time delay: An event-triggered sampling approach
Esnaashari et al. Irregular cellular learning automata
CN114609909A (zh) 一种切换拓扑下的随机多智体系统控制协议的设计方法
Liang et al. Distributed state estimation for uncertain Markov‐type sensor networks with mode‐dependent distributed delays
Wang et al. Cluster synchronization of a class of multi-agent systems with a bipartite graph topology
Mukherjee et al. Reduced-dimensional reinforcement learning control using singular perturbation approximations
Li et al. Event-triggered consensus in nonlinear multi-agent systems with nonlinear dynamics and directed network topology
Wang et al. Synchronization criteria for impulsive complex dynamical networks with time-varying delay
Liu et al. Cooperative stabilization of a class of LTI plants with distributed observers
CN113110039B (zh) 一种多智能体系统的有限时间分布式聚合优化方法
Zhang et al. Positivity and stability of positive singular Markovian jump time-delay systems with partially unknown transition rates
Hassan et al. On relative-output feedback approach for group consensus of clusters of multiagent systems
Huang et al. Finite-time passivity of delayed multi-weighted complex dynamical networks with different dimensional nodes
Zhang et al. Global iterative learning control based on fuzzy systems for nonlinear multi-agent systems with unknown dynamics
Li et al. Event-triggered sampling scheme for pinning control in multi-agent networks with general nonlinear dynamics
Zhao et al. Sampled-data dynamic output feedback consensus control of multi-agent systems
CN114280930B (zh) 一种随机高阶线性多智能体系统控制协议的设计方法及系统
CN109634138A (zh) 基于图上信号粗化的多智能体系统一致性方法
Du et al. A novel locally regularized automatic construction method for RBF neural models
Hu et al. Output bipartite consensus for second-order heterogeneous uncertain agents with state-dependent cooperation-competition interactions
Liu et al. Scale-free collaborative protocol design for state and regulated state synchronization of multi-agent systems with arbitrary fast convergence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination