CN116088317A - 一种基于动态事件触发的多智能体一致性控制方法 - Google Patents
一种基于动态事件触发的多智能体一致性控制方法 Download PDFInfo
- Publication number
- CN116088317A CN116088317A CN202310183106.9A CN202310183106A CN116088317A CN 116088317 A CN116088317 A CN 116088317A CN 202310183106 A CN202310183106 A CN 202310183106A CN 116088317 A CN116088317 A CN 116088317A
- Authority
- CN
- China
- Prior art keywords
- agent
- representing
- state
- event triggering
- dynamic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000004891 communication Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 28
- 230000006399 behavior Effects 0.000 claims description 21
- 238000005259 measurement Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000013461 design Methods 0.000 claims description 7
- 101100001674 Emericella variicolor andI gene Proteins 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 abstract description 5
- 238000004088 simulation Methods 0.000 abstract description 4
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 238000011217 control strategy Methods 0.000 abstract description 2
- 230000001360 synchronised effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于动态事件触发的多智能体一致性控制方法,属于多智能体系统技术领域,包括选择一般线性系统模型,从而确定每个智能体的动态方程;设计事件触发一致性协议及事件触发条件,并进一步证明系统可渐进一致且不存在Zeno行为;本发明的控制方法中为每个智能体设计分布式触发策略,具有估计状态的分布式控制器被用于克服连续通信的需求,并减少传输误差;在所提出的事件触发策略中,当满足自适应触发条件时,每个智能体更新状态且不同步;通过引入自适应动态阈值,可以减少触发次数;另外,证明所提出的控制策略中不会发生Zeno行为;最后,通过仿真验证所提控制协议的可行性。
Description
技术领域
本发明属于多智能体系统技术领域,特别是涉及一种基于动态事件触发的多智能体一致性控制方法。
背景技术
多智能体系统是指具有多个动态演化特征的智能体,通过有限的局部信息交流和协调合作来完成大型、复杂任务的系统;其在无线传感器网络、智能电网、无人机编队飞行等工程领域的应用非常广泛。在传统的一致性控制中,每个智能体需要连续地获取其相邻智能体的状态。因此,需要连续通信,这会增加处理器的计算成本和功耗。此外,当多个智能体进行无线通信时,由于通信拥塞,数据包丢失的概率会增加,从而导致延迟和功耗增加等问题。
对多智能体系统协同控制的研究中,由于智能体自身处理器的计算和智能体之间的通信都需要消耗能量,而通信的能源消耗一般远大于计算;同时,作为智能体的机器人或无人机的机载能源是有限的。在这种情况下,考虑如何增强多智能体系统的续航能力,降低系统性能要求成为一个重要研究方法。
综上,亟需提供一种在事件触发控制下的多智能体系统实现一致性的方法。
发明内容
为了克服现有技术存在的上述缺陷,本发明的目的是提供一种基于动态事件触发的多智能体一致性控制方法,本发明的动态事件触发方法具体包括如下内容,首先,为每个智能体设计分布式触发策略,具有估计状态的分布式控制器被用于克服连续通信的需求,并减少传输误差;在所提出的事件触发策略中,当满足自适应触发条件时,每个智能体更新状态且不同步;通过引入自适应动态阈值,可以减少触发次数;另外,证明所提出的控制策略中不会发生Zeno行为;最后,通过仿真验证所提控制协议的可行性。
本发明通过如下技术方案实现:
第一方面,本发明提供了一种基于动态事件触发的多智能体一致性控制方法,包括以下步骤:
步骤A:选择一般线性系统模型,从而确定每个智能体的动态方程;
步骤B:设计事件触发一致性协议;
步骤C:设计事件触发条件;
步骤D:利用步骤A、B及C证明系统可渐进一致且不存在Zeno行为。
进一步地,步骤A具体如下:
步骤A1:首先根据选择的系统模型写出每个智能体的动态方程,一般线性多智能体系统模型如下所示:
步骤A2:将上述线性多智能体系统中的智能体分为一个领导者和N个跟随者,依据上式,领导者具有的动力学方程如下:
步骤A3:如果智能体i在任意给定初始状态x(0)的条件下满足:
式中,χi表示智能体i的状态,χj表示智能体j的状态;
若满足上述条件,则称该系统可以实现一致性,继续进行下一步,否则该方法不适用。
进一步地,步骤B具体如下:
ui(t)=Kwi(t),i=1,2,…,N
其中,ui表示控制输入,K是常增益矩阵,wij表示智能体i和j之间的连接关系,当时,和是智能体的预估状态,当时,因为领导者系统只依赖于自身的状态,没有外部输入,所以一直成立;wiO表示领导者和跟随者之间的连接关系;若wiO=1,表示跟随者i可以与领导者交换信息,若wiO=0,表示跟随者i不可以与领导者交换信息;
(2)、控制器采用一个估计值,估计值的表达式如下:
在该算法下各智能体之间不需要进行连续通信,目的是为了排除Zeno行为。
进一步地,步骤C具体如下:
建立带有辅助变量μi(t)的动态事件触发条件:
第i个智能体的测量误差定义为:
进而根据触发条件决定是否更新控制器以及智能体之间是否需要传递信息。
进一步地,步骤D具体如下:
D1:利用步骤C中的触发条件证明系统可渐进一致:
D11:根据系统状态x构造Lyapunov函数V(x),首先保证构造的Lyapunov函数是正定的;
D2:利用步骤A中的动态方程和步骤B中的控制器以及估计值表达式进行算法推导,证明系统不存在Zeno行为。
进一步地,步骤D中采用反证法证明系统不存在Zeno行为:首先,假设存在Zeno行为,根据Zeno行为的实际意义可知必存在一个具有聚点的时间序列当触发次数趋于无穷时,此时的时间点为一个固定的时间值;然后根据稳定性分析以及智能体的状态等条件得到矛盾,从而说明不存在Zeno行为。
与现有技术相比,本发明的优点如下:
1、现有技术中大多控制器使用触发引擎的状态来实现一致性,传统控制器是触发时刻的样本值保持不变,直到下一次触发时刻更新样本值;而本发明采用一个估计器来估计两个触发时刻之间的间隔内的未测量状态,减小跟随器状态未被测量时的测量误差,使系统更快达到稳定,考虑了状态不可测时控制输入对领导者的影响,更适合实际工作过程,有效地减少了由于初始状态的过度偏差而导致的触发时刻;
2、本发明的方法通过建立事件触发协议及辅助变量来动态调整触发时间,与传统的触发协议相比,本发明提出的触发协议可以更有效地节省通信资源,减少触发次数。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明的基于动态事件触发的多智能体系统实现一致性方法的流程图;
图2为本发明实施例中多智能体系统的通信拓扑图;
图3为本发明实施例中每个智能体的状态轨迹图;
图4为本发明实施例中智能体的跟踪误差图;
图5为本发明实施例中自适应动态变量的变化曲线图;
图6为本发明实施例中各智能体的触发时刻图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述,以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
实施例1
在无人机编队飞行工程领域进行实例验证,如图1所示为本实施例的一种基于动态事件触发的多智能体系统实现一致性方法流程图,所述实现一致性方法包括以下步骤:
1.选择系统模型:
线性系统是多智能体系统研究的重要分析模型,相比于其他系统,拥有大量的工程应用背景,但算法分析也更加复杂。将事件触发机制引入线性多智能体系统的一致性控制研究中,可在保证系统稳定和一致的前提下,通过减少计算和通信来节约智能体的资源。考虑由N个相同智能体组成的线性系统,智能体被编码为1,…,N。第i个智能体的动态方程被描述为:
领导智能体的动态方程被描述为:
2.设计事件触发一致性协议及触发条件:
2.1、事件触发一致性协议;
ui(t)=Kwi(t),i=1,2,…,N
其中,K是常增益矩阵,wiO表示领导者和跟随者之间的连接关系;若wiO=1,表示跟随者i可以与领导者交换信息,若wiO=0,表示跟随者i不可以与领导者交换信息;当时,和是智能体的预估状态,当时,因为领导者系统只依赖于自身的状态,没有外部输入,所以一直成立;
传统控制器是触发时刻的样本值保持不变,直到下一次触发时刻更新样本值。本发明的控制器通过引入估计值,减小跟随器状态未被测量时的测量误差,使系统更快达到稳定,与现有技术相比,考虑了状态不可测时控制输入对领导者的影响,更适合实际工作过程。
控制器采用一个估计值,估计值的表达式如下:
在该算法下各智能体之间不需要进行连续通信,目的是为了排除Zeno行为。
2.2、事件触发条件。
在多智能体系统中引入动态触发控制,使得系统在误差大时控制率更新加快,系统快速达到稳定;在误差小时控制率更新变慢,智能体之间通信减少;通过这种方式,能达到平衡系统收敛速度和节约资源的目的;
建立带有辅助变量μi(t)的动态事件触发条件:
第i个智能体的测量误差定义为:
根据触发条件决定是否更新控制器以及智能体之间是否需要传递信息。
3.证明系统可渐进一致且不存在Zeno行为:
3.1、利用步骤C中的触发条件证明系统可渐进一致;
考虑如下李雅普诺夫函数:
3.2、利用步骤A中的动态方程和步骤B中的控制器以及估计值表达式进行算法推导,证明系统不存在Zeno行为。
系统的Zeno行为可以被排除,这意味着在有限时间内触发时刻不会被连续触发。
证明:
(1)、如果||A||≠0,则
因此:
(2)、如果||A||=0,则
证明过程与上述类似。
通过分析以上两种情况可以看出智能体不存在Zeno行为,即事件触发不是连续进行的,达到了节约资源的目的。
4.数值仿真
为了证明一致性和排除Zeno行为理论结果的有效性,本实施例验证由一个领导智能体和四个跟随智能体组成的多智能体系统,其通信图如图2所示,其中0代表领导者,数字1-4代表跟随者智能体。
选择参数为mi=[2.8 1.2 1.2 2.4]×10-3,αi=0.004,θi=87.3971,其中i=1,2,3,4。选择智能体的初始状态为:χ0(0)=3,χ7(0)=2,χ2(0)=-4,χ3(0)=4,χ4(0)=-1,选择自适应动态变量为:μ7(0)=2,μ2(0)=0.5,μ3(0)=3,μ4(0)=3。
在设计的事件触发条件和一致性协议下进行信息传递,仿真结果如图3所示,从图3中可以看出每个智能体的状态轨迹,可以看出在给定的自适应事件触发控制算法下,所有智能体的状态最终都达到渐进一致,实现一致性控制目标;图4是智能体的跟踪误差图,从图中可以看出,跟踪误差最终趋于0,所有跟随者的状态都渐进收敛到领导者的状态,实现领导跟踪一致性;图5是设计的自适应动态变量的变化曲线,从图中可以看出随着智能体的状态误差减小,动态变量相应地减少并且系统达到一致;图6是各智能体的触发时刻图,从图中可以看出每个智能体两次触发的时间间隔>0,表明整个控制过程中没有出现Zeno行为。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
Claims (6)
1.一种基于动态事件触发的多智能体一致性控制方法,其特征在于,包括以下步骤:
步骤A:选择一般线性系统模型,从而确定每个智能体的动态方程;
步骤B:设计事件触发一致性协议;
步骤C:设计事件触发条件;
步骤D:利用步骤A、B及C证明系统可渐进一致且不存在Zeno行为。
2.如权利要求1所述的一种基于动态事件触发的多智能体一致性控制方法,其特征在于,步骤A具体如下:
步骤A1:首先根据选择的系统模型写出每个智能体的动态方程,一般线性多智能体系统模型如下所示:
步骤A2:将上述线性多智能体系统中的智能体分为一个领导者和N个跟随者,依据上式,领导者具有的动力学方程如下:
步骤A3:如果智能体i在任意给定初始状态x(0)的条件下满足:
式中,xi表示智能体i的状态,xj表示智能体j的状态;
若满足上述条件,则称该系统可以实现一致性,继续进行下一步,否则该方法不适用。
3.如权利要求1所述的一种基于动态事件触发的多智能体一致性控制方法,其特征在于,步骤B具体如下:
ui(t)=Kwi(t),i=1,2,…,N
其中,ui表示控制输入,K是常增益矩阵,wij表示智能体i和j之间的连接关系,当时,和是智能体的预估状态,当时,因为领导者系统只依赖于自身的状态,没有外部输入,所以一直成立;wi0表示领导者和跟随者之间的连接关系;若wi0=1,表示跟随者i可以与领导者交换信息,若wi0=0,表示跟随者i不可以与领导者交换信息;
(2)、控制器采用一个估计值,估计值的表达式如下:
4.如权利要求1所述的一种基于动态事件触发的多智能体一致性控制方法,其特征在于,步骤C具体如下:
建立带有辅助变量μi(t)的动态事件触发条件:
第i个智能体的测量误差定义为:
进而根据触发条件决定是否更新控制器以及智能体之间是否需要传递信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310183106.9A CN116088317A (zh) | 2023-03-01 | 2023-03-01 | 一种基于动态事件触发的多智能体一致性控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310183106.9A CN116088317A (zh) | 2023-03-01 | 2023-03-01 | 一种基于动态事件触发的多智能体一致性控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116088317A true CN116088317A (zh) | 2023-05-09 |
Family
ID=86204508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310183106.9A Pending CN116088317A (zh) | 2023-03-01 | 2023-03-01 | 一种基于动态事件触发的多智能体一致性控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116088317A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117850325A (zh) * | 2024-03-07 | 2024-04-09 | 南京邮电大学 | 动态事件触发的多机器人一致性协同控制系统和方法 |
-
2023
- 2023-03-01 CN CN202310183106.9A patent/CN116088317A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117850325A (zh) * | 2024-03-07 | 2024-04-09 | 南京邮电大学 | 动态事件触发的多机器人一致性协同控制系统和方法 |
CN117850325B (zh) * | 2024-03-07 | 2024-05-28 | 南京邮电大学 | 动态事件触发的多机器人一致性协同控制系统和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108803349B (zh) | 非线性多智能体系统的最优一致性控制方法及系统 | |
Shen et al. | A novel Markov chain based ILC analysis for linear stochastic systems under general data dropouts environments | |
CN112862281A (zh) | 综合能源系统调度模型构建方法、装置、介质及电子设备 | |
CN110597109B (zh) | 基于事件触发的多智能体一致性控制方法 | |
CN110222883A (zh) | 基于风驱动优化bp神经网络的电力系统负荷预测方法 | |
CN112698634A (zh) | 基于事件触发的交通智能体系统固定时间二分一致性方法 | |
CN116088317A (zh) | 一种基于动态事件触发的多智能体一致性控制方法 | |
CN112684781B (zh) | 一种多智能体分布式模型预测控制方法及系统 | |
CN114626573B (zh) | 基于改进多元宇宙算法优化极限学习机的负荷预测方法 | |
CN110969295A (zh) | 列车区段延误预测误差控制方法 | |
Duan et al. | Sensor scheduling design for complex networks under a distributed state estimation framework | |
CN117762014A (zh) | 一种采用分布式事件触发控制的有限时间协同控制方法 | |
CN114384931A (zh) | 一种基于策略梯度的无人机多目标最优控制方法和设备 | |
CN117806164A (zh) | 一种在DoS攻击下基于动态事件触发的多航天器编队系统的自适应一致性控制方法 | |
CN116430899A (zh) | 基于强化学习的异构集群无人系统事件触发协同控制方法 | |
Duan et al. | Multi-robot dynamic virtual potential point hunting strategy based on FIS | |
CN114185273A (zh) | 一种饱和受限下分布式前置时间一致性控制器的设计方法 | |
Han et al. | Bandwidth-aware transmission scheduling and event-triggered distributed MPC for vehicle platoons | |
CN114879492A (zh) | 一种完全数据驱动的多智能体系统事件触发控制方法 | |
Wei et al. | Event-triggered containment control for multi-agent systems with switching topology in finite-time | |
CN114022026B (zh) | 一种基于事件触发一致性算法的电动汽车充电调度方法 | |
CN113534664A (zh) | 一种基于闭环状态估计的多智能体系统事件触发控制方法 | |
CN116300438A (zh) | 一种混合阶多智能体系统的分布式优化方法 | |
Liu et al. | All Agents Connectivity-Preserving and Error-Based Cooperative Learning Control With Data-Filter Memory-Based Event-Triggered Strategy | |
CN116974195A (zh) | 一种异构无人集群系统的强化学习最优输出跟踪控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |