CN112925196B - 基于固定时间的多智能体系统二分一致跟踪方法 - Google Patents
基于固定时间的多智能体系统二分一致跟踪方法 Download PDFInfo
- Publication number
- CN112925196B CN112925196B CN202110080128.3A CN202110080128A CN112925196B CN 112925196 B CN112925196 B CN 112925196B CN 202110080128 A CN202110080128 A CN 202110080128A CN 112925196 B CN112925196 B CN 112925196B
- Authority
- CN
- China
- Prior art keywords
- fixed time
- matrix
- graph
- convergence
- dichotomy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0205—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
- G05B13/024—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Complex Calculations (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供了一种基于固定时间的多智能体系统二分一致跟踪方法,使用符号图确定有向图中节点间的交互关系和设计规范变换矩阵D,与有限时间二分一致跟踪方法的不同,固定时间二分一致跟踪不需要系统的初始状态信息,就能实现系统的二分一致跟踪;最后提出了一种基于M矩阵的方法来估计李雅普诺夫函数中所有待估参数,确定固定时间情况下系统收敛时间上界。本发明的有益效果为:本发明为了提高收敛速度和打破需要系统初始状态的局限性,制定了固定时间控制协议来解决不确定有界输入下多智能体系统二分一致收敛问题,此外还设计了基于M矩阵的新方法,高效地确定系统固定时间收敛上界,从而有效地解决了现有的系统收敛时间上界难以估计的问题。
Description
技术领域
本发明涉及多智能体系统技术领域,尤其涉及一种基于固定时间的多智能体系统二分一致跟踪方法。
背景技术
在现实世界中,智能体间不仅存在合作关系,同时也不可避免地存在着竞争关系。例如,生态学中的捕食与被捕食、社会学中的两政党敌对观点形成等问题。在该类问题中,整个系统往往将稳定于两个模值相同、方向完全相反常量。为了进一步研究这类问题,学者们逐步提出了MASs二分一致的概念。并采用带有正、负加权值的符号图来表示该类问题中多智能体间的关联性,其中的正负值分别对应着个体间的同盟和敌对、诚实和虚伪、喜欢和讨厌等等关系。与传统的MASs一致问题中非负图的传统拉普拉斯矩阵不同,该类问题中符号图对应的拉普拉斯矩阵的行和不为零。因此,传统一致问题中的稳定性分析技巧并不能直接应用。加之,有向图对应的拉普拉斯矩阵并不像无向图具有对称性。这些差异都为研究有向图下MASs二分一致问题带来极大的挑战与困难。
收敛速度是一致性协议设计中的一个重要问题。在当前系统控制研究中引入了固定时间控制的概念,即在未知系统初始状态条件下便可预测系统达到一致的时间。
与有限时间MASs二分一致追踪问题不同,固定时间MASs二分一致追踪问题中一致性追踪时间上界独立于系统的初始状态,特别适用无法获得系统初值的大型现实网络系统。在绝大多数的控制协议的研究结果中,固定时间收敛上界需要通过复杂的数学公式计算或仅给出数值仿真值,因此无法有效获取收敛时间上界。从计算优化的角度上来看,应用M-矩阵理论为构造的李雅普诺夫函数提供正参数的解析公式,便可以高效估计固定时间MASs收敛上界。
发明内容
本发明的目的在于提供一种基于固定时间的多智能体系统二分一致跟踪方法,克服了有向图拉普拉斯矩阵非对称性对李雅普诺夫函数构造带来的困难,合理利用符号有向图的路径权重积设计了固定时间多智能体系统二分一致跟踪协议,并利用M-矩阵理论确定了收敛时间上界,高效地实现了多智能体系统二分一致跟踪。
本发明是通过如下措施实现的:基于固定时间的多智能体系统二分一致跟踪方法,包括如下步骤:
步骤1:构建符号图,确定图中节点间的交互信息以及设计规范变换矩阵D;
步骤2:利用固定时间协议处理与初始状态无关的固定时间的二分一致跟踪问题,计算出收敛时间上限;
步骤3:基于M矩阵的方法估计李雅普诺夫函数中的参数,确定固定时间情况下收敛时间上界。
作为本发明提供的一种基于固定时间的多智能体系统二分一致跟踪方法进一步优化方案,所述步骤1的具体步骤为:
步骤1.3:若点k到点j之间的路径权重ajk>0,则两点是协作关系;否则,就是竞争关系;
步骤1.6:如果符号图G中有一个节点vi到其他所有节点均存在一条有向路径,那么图G包含一个生成树T,称vi为它的根节点;
步骤1.7:定义符号图G的拉普拉斯矩阵为L,邻接矩阵为B=diag{b10,b20,…,bN0},若第k个跟随者可以接收领导者的信息,则bk0>0;否则bk0=0;
步骤1.8:假设符号图G是结构平衡,且包含一个生成树T;
步骤1.9:由步骤1.8可以设计规范变换矩阵D=diag{σ1,σ2,…,σN},其中σ1=1,σi=sgn(Pi1),i∈{2,3,…,N},sgn(·)为符号函数;
步骤1.10:根据确定的生成树T,可确定规范变换矩阵D。
作为本发明提供的一种基于固定时间的多智能体系统二分一致跟踪方法进一步优化方案,所述步骤2的具体步骤为:
步骤2.1:构建由一个虚拟领导者和N个跟随者智能体组成的有向拓扑图G=(V,E,A)所构成的动态方程如下:
步骤2.2:虚拟领导者的动态方程被描述如下:
步骤2.3:在固定时间内,提出以下一致追踪协议(c1,c2>0,0<μ<1<v):
步骤2.6:在c2≥ω0的条件下,设定固定时间的收敛上界为:
作为本发明提供的一种基于固定时间的多智能体系统二分一致跟踪方法进一步优化方案,所述步骤3的具体方法为:
步骤3.1:构建正对角矩阵E=diag{ξ1,ξ2,…,ξN}和非奇异M-矩阵H,H=LD+B;
步骤3.3:
(ΠH+HTΠ)·H-11N=Π1N+HTPQp
=Π1N+HTQPp=Π1N+HTQ1N
=Π1N+HT(HT)-11N=Π1N+1N>0
即ΠH+HTΠ元素全为正;
步骤3.4:将李雅普诺夫函数V定义为:
步骤3.5:对V求导数得到:
步骤3.8:结合步骤3.6、3.7的求导内容,得出结论:
步骤3.9:证明可得通过构造李雅普诺夫函数得到正参数ξi的解析公式,固定时间的二分一致跟踪可以在时间Tf内实现,并且与系统的初始状态无关。
与现有技术相比,本发明的有益效果为:本发明为了进一步提高收敛速度及打破需要系统初始状态的局限性,制定了固定时间控制协议来解决不确定有界输入下多智能体系统二分一致收敛问题,此外还设计了一种基于M矩阵新方法,可以高效地确定系统固定时间收敛上界,从而有效地解决了现有技术中系统收敛时间上界难以估计的问题。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1是本发明的基本流程图。
图2为本发明的智能体在固定时间跟踪协议下的状态轨迹图。
图3为本发明的智能体在固定时间跟踪协议下的输入控制图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。当然,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例1
参见图1至图3,本发明提供其技术方案为,基于固定时间的多智能体系统二分一致跟踪方法,包括如下步骤:
步骤1:构建符号图,确定图中节点间的交互信息以及设计规范变换矩阵D;
步骤2:利用固定时间协议处理与初始状态无关的固定时间的二分一致跟踪问题,计算出收敛时间上限;
步骤3:基于M矩阵的方法估计李雅普诺夫函数中的参数,确定固定时间情况下收敛时间上界。
作为本发明提供的一种基于固定时间的多智能体系统二分一致跟踪方法进一步优化方案,步骤1的具体步骤为:
步骤1.3:若点k到点j之间的路径权重ajk>0,则两点是协作关系;否则,就是竞争关系;
步骤1.5:如果符号图G中有一个节点vi到其他所有节点均存在一条有向路径,那么图G包含一个生成树T,称vi为它的根节点;
步骤1.6:定义符号图G的拉普拉斯矩阵为L,邻接矩阵为B=diag{b10,b20,…,bN0},若第k个跟随者可以接收领导者的信息,则bk0>0;否则bk0=0;
步骤1.8:假设符号图G是结构平衡,且包含一个生成树T;
步骤1.9:由步骤1.8可以设计规范变换矩阵D=diag{σ1,σ2,…,σN},其中σ1=1,σi=sgn(Pi1),i∈{2,3,…,N},sgn(·)为符号函数;
步骤1.10:根据确定的生成树T,可确定规范变换矩阵D。
作为本发明提供的一种基于固定时间的多智能体系统二分一致跟踪方法进一步优化方案,步骤2的具体步骤为:
步骤2.1:构建由一个虚拟领导者和N个跟随者智能体组成的有向拓扑图G=(V,E,A)所构成的动态方程如下:
步骤2.2:虚拟领导者的动态方程被描述如下:
步骤2.3:在固定时间内,提出以下一致追踪协议(c1,c2>0,0<μ<1<v):
步骤2.6:在c2≥ω0的条件下,设定固定时间的收敛上界为:
作为本发明提供的一种基于固定时间的多智能体系统二分一致跟踪方法进一步优化方案,步骤3的具体方法为:
步骤3.1:构建正对角矩阵E=diag{ξ1,ξ2,…,ξN}和非奇异M-矩阵H,H=LD+B;
步骤3.3:
(ΠH+HTΠ)·H-11N=Π1N+HTPQp
=Π1N+HTQPp=Π1N+HTQ1N
=Π1N+HT(HT)-11N=Π1N+1N>0
即ΠH+HTΠ元素全为正;
步骤3.4:将李雅普诺夫函数V定义为:
步骤3.5:对V求导数得到:
步骤3.8:结合步骤3.6、3.7的求导内容,得出结论:
步骤3.9:证明可得通过构造李雅普诺夫函数得到正参数ξi的解析公式,固定时间的二分一致跟踪可以在时间Tf内实现,并且与系统的初始状态无关。
为了验证本发明提出的智能体的二分一致跟踪,给出实例数字仿真。
构造一个由5个追随者和一个领导者组成的多智能体系统;
在满足|u0(t)|≤ω0(t)=1的条件下,领导者的输入控制为u0=sin(3t);
求得对角矩阵E=diag{ξ1,ξ2,…,ξN}=PQ=diag{2.2000,0.7059,2.8000,1.6296,0.2703}
由上式可得P21>0,P31<0,P41<0,P51<0,将五个智能体划分为两个不同的子集:v1={1,2}和v2={3,4,5};
相应的对角矩阵D可以设定为D=diag{1,1,-1,-1};
对于固定时间跟踪协议,控制增益定位μ=0.5,v=2,c1=7和c2=1.2≥ω0,
可以计算出固定时间收敛上界:
图2描绘了在固定时间控制协议下的跟随者智能体状态轨迹,可以观察到,跟随者智能体1,2与智能体3,4,5的轨迹完全相反。图3描绘了在固定时间控制协议下的跟随者智能体的输入控制。
从仿真结果可以看出所有智能体大约在0.8s之后实现二分一致跟踪,这小于固定时间跟踪协议下计算的收敛时间上限,有效判断了智能体之间的关系,证明了所提算法的有效性。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种基于固定时间的多智能体系统二分一致跟踪方法,其特征在于,包括以下步骤:
步骤1:构建符号图,确定图中节点间的交互信息以及设计规范变换矩阵D;
步骤2:利用固定时间协议处理与初始状态无关的固定时间的二分一致跟踪问题,计算出收敛时间上限;
步骤3:基于M矩阵的方法估计李雅普诺夫函数中的参数,确定固定时间情况下收敛时间上界;
所述步骤1的具体步骤为:
步骤1.3:若点k到点j之间的路径权重ajk>0,则两点是协作关系;否则,就是竞争关系;
步骤1.6:如果符号图G中有一个节点vi到其他所有节点均存在一条有向路径,那么图G包含一个生成树T,称vi为它的根节点;
步骤1.7:定义符号图G的拉普拉斯矩阵为L,邻接矩阵为B=diag{b10,b20,…,bN0},若第k个跟随者可以接收领导者的信息,则bk0>0;否则bk0=0;
步骤1.8:假设符号图G是结构平衡,且包含一个生成树T;
步骤1.9:由步骤1.8可以设计规范变换矩阵D=diag{σ1,σ2,…,σN},其中σ1=1,σi=sgn(Pi1),i∈{2,3,…,N},sgn(·)为符号函数;
步骤1.10:根据确定的生成树T,可确定规范变换矩阵D;
所述步骤2的具体步骤为:
步骤2.1:构建由一个虚拟领导者和N个跟随者智能体组成的有向拓扑图G=(V,E,A)所构成的动态方程如下:
步骤2.2:虚拟领导者的动态方程被描述如下:
步骤2.3:在固定时间内,提出以下一致追踪协议,c1,c2>0,0<μ<1<v:
步骤2.6:在c2≥ω0的条件下,设定固定时间的收敛上界为:
所述步骤3的具体方法为:
步骤3.1:构建正对角矩阵E=diag{ξ1,ξ2,…,ξN}和非奇异M-矩阵H,H=LD+B;
步骤3.3:
即ΠH+HTΠ元素全为正;
步骤3.4:将李雅普诺夫函数V定义为:
步骤3.5:对V求导数得到:
步骤3.8:结合步骤3.6、3.7的求导内容,得出结论:
步骤3.9:证明可得通过构造李雅普诺夫函数得到正参数ξi的解析公式,固定时间的二分一致跟踪可以在时间Tf内实现,并且与系统的初始状态无关。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110080128.3A CN112925196B (zh) | 2021-01-21 | 2021-01-21 | 基于固定时间的多智能体系统二分一致跟踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110080128.3A CN112925196B (zh) | 2021-01-21 | 2021-01-21 | 基于固定时间的多智能体系统二分一致跟踪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112925196A CN112925196A (zh) | 2021-06-08 |
CN112925196B true CN112925196B (zh) | 2022-08-12 |
Family
ID=76163793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110080128.3A Active CN112925196B (zh) | 2021-01-21 | 2021-01-21 | 基于固定时间的多智能体系统二分一致跟踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112925196B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281053A (zh) * | 2013-07-08 | 2015-01-14 | 哈尔滨点石仿真科技有限公司 | 一种解决通信时滞的多智能体协同控制方法 |
CN104698854A (zh) * | 2015-03-26 | 2015-06-10 | 哈尔滨工业大学 | 网络Euler-Lagrange系统分布式模糊协同跟踪控制方法 |
CN110119087A (zh) * | 2019-05-05 | 2019-08-13 | 西北工业大学 | 一种有向通信下二阶多智能体系统固定时一致性跟踪方法 |
CN111077779A (zh) * | 2019-12-23 | 2020-04-28 | 华东交通大学 | 带扰动混杂多智能体系统实现领导-跟随一致性控制方法 |
CN111258214A (zh) * | 2020-02-25 | 2020-06-09 | 西北工业大学 | 基于有向拓扑的高阶多智能体系统固定时一致性跟踪方法 |
-
2021
- 2021-01-21 CN CN202110080128.3A patent/CN112925196B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281053A (zh) * | 2013-07-08 | 2015-01-14 | 哈尔滨点石仿真科技有限公司 | 一种解决通信时滞的多智能体协同控制方法 |
CN104698854A (zh) * | 2015-03-26 | 2015-06-10 | 哈尔滨工业大学 | 网络Euler-Lagrange系统分布式模糊协同跟踪控制方法 |
CN110119087A (zh) * | 2019-05-05 | 2019-08-13 | 西北工业大学 | 一种有向通信下二阶多智能体系统固定时一致性跟踪方法 |
CN111077779A (zh) * | 2019-12-23 | 2020-04-28 | 华东交通大学 | 带扰动混杂多智能体系统实现领导-跟随一致性控制方法 |
CN111258214A (zh) * | 2020-02-25 | 2020-06-09 | 西北工业大学 | 基于有向拓扑的高阶多智能体系统固定时一致性跟踪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112925196A (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ji et al. | STDEN: Towards physics-guided neural networks for traffic flow prediction | |
Xia et al. | Research on parallel adaptive canopy-k-means clustering algorithm for big data mining based on cloud platform | |
Hu et al. | An improved dual neural network for solving a class of quadratic programming problems and its $ k $-winners-take-all application | |
Shao et al. | A novel analysis on the efficiency of hierarchy among leader-following systems | |
Liang et al. | Distributed state estimation for uncertain Markov‐type sensor networks with mode‐dependent distributed delays | |
Dai et al. | Exponential consensus of non‐linear multi‐agent systems with semi‐Markov switching topologies | |
Xu et al. | Necessary and sufficient conditions for distributed containment control of multi‐agent systems without velocity measurement | |
Su et al. | Event‐triggered consensus of non‐linear multi‐agent systems with sampling data and time delay | |
CN113807520A (zh) | 基于图神经网络的知识图谱对齐模型的训练方法 | |
Xu et al. | A new multi-step backward cloud transformation algorithm based on normal cloud model | |
CN113110039A (zh) | 一种多智能体系统的有限时间分布式聚合优化方法 | |
CN113065974A (zh) | 一种基于动态网络表示学习的链路预测方法 | |
Guan et al. | Structural controllability of directed signed networks | |
CN109033021B (zh) | 一种基于变参收敛神经网络的线性方程求解器设计方法 | |
CN110610019A (zh) | 转移概率部分未知的马尔科夫跳变系统的动力学分析方法 | |
Guoqiang et al. | Study of RBF neural network based on PSO algorithm in nonlinear system identification | |
CN112949835A (zh) | 基于卷积循环神经网络对知识图谱的推理方法及设备 | |
Ma et al. | Finite‐time average consensus based approach for distributed convex optimization | |
Cihan | Stability analysis and controller design for consensus in discrete‐time networks with heterogeneous agent dynamics | |
CN112925196B (zh) | 基于固定时间的多智能体系统二分一致跟踪方法 | |
CN112925197B (zh) | 基于有限时间的多智能体系统二分一致跟踪方法 | |
Guclu et al. | Synchronization landscapes in small-world-connected computer networks | |
Moghaddas et al. | An efficient neurodynamic model to solve nonconvex nonlinear optimization problems and its applications | |
Lu et al. | Laplacian deep echo state network optimized by genetic algorithm | |
CN111091475B (zh) | 一种基于非负矩阵分解的社交网络特征提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |