CN112363392B - 一类模型未知的多智能体分群一致性控制方法 - Google Patents
一类模型未知的多智能体分群一致性控制方法 Download PDFInfo
- Publication number
- CN112363392B CN112363392B CN202011121840.5A CN202011121840A CN112363392B CN 112363392 B CN112363392 B CN 112363392B CN 202011121840 A CN202011121840 A CN 202011121840A CN 112363392 B CN112363392 B CN 112363392B
- Authority
- CN
- China
- Prior art keywords
- agent
- unknown
- model
- control
- designed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000004891 communication Methods 0.000 claims abstract description 21
- 238000013528 artificial neural network Methods 0.000 claims abstract description 7
- 230000001960 triggered effect Effects 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000011217 control strategy Methods 0.000 claims description 2
- 238000013461 design Methods 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 238000005265 energy consumption Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明公开了一类模型未知的多智能体分群一致性控制方法,包括以下步骤:采用基于径向基函数神经网络的自适应算法对未知项进行在线辨识,在此基础上引入事件触发的通信策略,通过智能体节点本身的信息、参考模型信息及其邻居智能体节点的信息,设计分布式控制器,使多智能体达到分群一致性。本发明实现了对一类模型未知的多智能体系统的在线辨识、分布式的事件触发通信策略、分群一致性控制,从而解决了多智能体模型未知、连续通信耗能大,运行时长短的问题。
Description
技术领域
本发明涉及多智能体控制技术领域,特别是涉及对一类模型未知的多智能体分群一致性控制方法。
背景技术
近年来,由于多智能体系统在无人飞行器、智能电网和智能交通控制系统等领域的广泛应用,多智能体系统的协调控制引起了广泛的研究。在多智能体系统的协同控制问题中,达到预定的一致性是智能体进行协调合作的前提条件,因此一致性问题是协调控制研究的重要基础。多智能体的一致性控制在编队控制、群集控制、聚集蜂拥等控制领域都有着广泛的应用。
首先,给出智能体的定义,智能体是具有有限的传感、通信、计算、学习能力的设备或机器。而多智能体系统是由多个智能体组成的网络,各个智能体之间通过网络的拓扑规则来进行通信,从而共同协作来解决复杂化的任务。
随着研究的深入,多智能体系统的拓扑网络结构呈现越来越复杂的态势,以往系统内单一的一致性难以解决一些实际中的复杂问题。系统可能会出现多种不同的子任务需要系统的各部分协调来完成,最终会分群呈现多个不同的一致状态。群一致性是指系统中的所有个体可以被划分为若干个子群,每个子群的个体可以达到一致状态,而不同的子群的个体不一定达到一致状态即保持着各自独立的状态,这种子群体之间的差异性更具有普适性。当不同的子群中的个体都达到相同的状态时,分群一致性就削弱为完全一致性了,因此一致性可以看成是分群一致性中的一种特殊情况。
分群一致性相比于一致性更具普遍意义,但是其控制方法也更加复杂。同时,现有的大多数一致性研究成果都是假设对模型信息完全已知条件下所取得的。事实上,现实世界中的物体总存在未知的非线性特性。因此,研究模型未知的多智能体系统的分群一致性具有实际意义。
同时,由于多智能体系统通常含有数十上百个智能体,采用连续通讯方式,对能量的消耗大,造成资源的浪费。因此考虑引入事件触发机制,能够降低智能体间的通信频率,降低系统能耗,提高系统运行时长。
发明内容
本发明的目的在于提供一类模型未知的多智能体分群一致性控制方法,以解决上述背景技术中提出的问题。
为了实现上述目的,本发明采用如下的技术方案:
一类模型未知的多智能体分群一致性控制方法,包括以下步骤:
S1、明确研究问题动力学模型;
S2:针对动力学模型中的未知项,采用基于RBF人工神经网络的自适应算法来对其进行在线辨识,以满足系统实时性、快速性的要求;
S3:基于事件触发机制设计智能体间的通信策略,达到节省能耗,提高运行时长的目的;
S4:结合S2、S3,利用智能体节点本身的信息以及其邻居智能体节点的信息,在李雅普诺夫稳定性定理下,设计分布式控制器,确保具有未知模型的多智能体达到分群一致性;
S5:将上述未知模型辨识策略、事件触发策略、控制算法通过编程灌入各个多智能体中。
与现有技术相比,本发明的技术亮点是:对模型未知系统设计了在线辨识算法,满足系统的实时性;同时,考虑到连续通信的不足,设计了事件触发通信方式,减少了通信能耗,提高设备运行时长;此外针对更加复杂化的问题,设了分布式控制方法,实现分群一致性。
附图说明
图1为本实施例中多智能体通信拓扑图。
图2为本实施例中多智能体在本文所提出方法下的状态响应图。
图3为本实施例中多智能体在事件触发通信方式下的事件触发时刻图。
具体实施方式
为使本发明的目的、技术方案和优点能够更加清晰、易懂,下面结合附图及实施案例对本发明进一步详细描述。
一类模型未知的多智能体分群一致性控制方法,包括:
S1、明确研究问题动力学模型;
此一类模型未知的多智能体动力学模型含有N个智能体,第i个智能体动力学模型为:
其中,xi(t)∈Rn,ui(t)∈Rn,fi(xi(t))∈Rn分别表示智能体的状态、控制输入和未知非线性函数。
进一步定义跟踪误差:
ei(t)=xi(t)-zi(t),i=1,…,N (2)
在S1中,智能体的通信网络如附图1所示。
对于有向强连通度有如下定义:
S2:针对(1)中未知项fi(xi(t)),采用基于RBF人工神经网络的自适应算法来对其进行在线辨识,以满足系统实时性、快速性的要求。
理想情况下fi(xi(t))=Wi *TG(xi(t))+εi(xi(t)),Wi *表示最优RBF人工神经网络的最优权值矩阵,G(·)表示RBF人工神经网络激活函数,εi表示RBF人工神经网络逼近误差。
最优权值矩阵可根据下式得到:
优选地,G(·)为高斯函数。
式(3)一般用于定性分析,实际中使用
对未知函数的逼近。
进一步优选地,结合自适应算法给出权值矩阵更新率:
其中,δi>0为设计的控制参数。
S3:基于事件触发机制设计智能体间的通信策略,达到节省能耗,提高运行时长的目的;
首先定义第i个智能体的通信状态测量误差:
通信的事件触发控制策略如下:
其中:Ei(t)为第i个智能体的事件触发函数,其设计为
S4:综合上面所述方法,智能体i的控制器设计为:
权值更新如上式(5)所示,且设计各控制参数满足下式:
S5:将上述未知模型辨识策略、事件触发策略、控制算法通过编程灌入各个多智能体中。
在本实施例中,优选地,xi(t)∈R2,ui(t)∈R2,fi(xi(t))∈R2。
本实施例中多智能体通信拓扑对应的新型拉普拉斯如下:
系统的初始值在(0,1)随机生成,x(0)=z(0)。
优选地,系统的控制参数设计如下:
β1=10-5,β2=0.1,γ=2,ki=20,δi=2,i=1,…,N,其余相应参数可由已知信息计算得出。
如图2可以看出各智能体的状态按设定分群趋于一致,即该算法可以实现对模型未知的多智能系统分群一致性控制。如图3可以看出各智能体各自的事件触发时刻和次数,即实现了分布式事件触发控制,降低了系统能耗,提高了系统运行时长。
以上实施例仅是本发明的优选实施方案,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。
Claims (2)
1.一类模型未知的多智能体分群一致性控制方法,其特征在于:包括:
S1:明确研究问题动力学模型;
此一类模型未知的多智能体动力学模型含有N个智能体,第i个智能体动力学模型为:
其中,xi(t)∈Rn,ui(t)∈Rn,fi(xi(t))∈Rn分别表示智能体的状态、控制输入和未知非线性函数;
S2:针对动力学模型中的未知项fi(xi(t)),采用基于RBF人工神经网络的自适应算法来对其进行在线辨识,以满足系统实时性、快速性的要求;
未知函数的逼近使用:
给出权值矩阵更新率:
其中,G(xi(t))为高斯函数,ei(t)=xi(t)-zi(t)为跟踪误差,δi>0为设计的控制参数;
S3:基于事件触发机制设计智能体间的通信策略;
首先定义第i个智能体的通信状态测量误差:
通信的事件触发控制策略如下:
其中:Ei(t)为第i个智能体的事件触发函数,其设计为
S4:结合S2、S3,利用智能体节点本身的信息以及其邻居智能体节点的信息,在李雅普诺夫稳定性定理下,设计分布式控制器,确保具有未知模型的多智能体达到分群一致性;
设计智能体i的控制器设计为:
且各设计控制参数满足下式:
S5:将上述未知模型的辨识策略、事件触发策略、控制算法通过编程灌入各个多智能体中。
2.根据权利要求1所述的一类模型未知的多智能体分群一致性控制方法,其特征在于:智能体的通信网络为有向强连通拓扑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011121840.5A CN112363392B (zh) | 2020-11-16 | 2020-11-16 | 一类模型未知的多智能体分群一致性控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011121840.5A CN112363392B (zh) | 2020-11-16 | 2020-11-16 | 一类模型未知的多智能体分群一致性控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112363392A CN112363392A (zh) | 2021-02-12 |
CN112363392B true CN112363392B (zh) | 2022-05-24 |
Family
ID=74507366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011121840.5A Active CN112363392B (zh) | 2020-11-16 | 2020-11-16 | 一类模型未知的多智能体分群一致性控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112363392B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792844B (zh) * | 2021-08-19 | 2023-07-25 | 中国人民解放军军事科学院国防科技创新研究院 | 基于深度自动编码和特征融合的智能体蜂拥行为控制方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107728471A (zh) * | 2017-09-01 | 2018-02-23 | 南京理工大学 | 针对一类混合异质多智能体系统的分组一致性控制方法 |
CN108803349A (zh) * | 2018-08-13 | 2018-11-13 | 中国地质大学(武汉) | 非线性多智能体系统的最优一致性控制方法及系统 |
CN109507880A (zh) * | 2018-10-17 | 2019-03-22 | 东北大学 | 一种事件驱动策略的多智能体一致性控制方法 |
CN110376889A (zh) * | 2019-07-12 | 2019-10-25 | 哈尔滨理工大学 | 具有时变时滞的异构网络化多智能体系统分组一致的方法 |
CN110442022A (zh) * | 2019-07-19 | 2019-11-12 | 中国工程物理研究院计算机应用研究所 | 带有时滞异构多智能体系统的分组一致性控制方法 |
CN110597109A (zh) * | 2019-08-26 | 2019-12-20 | 同济人工智能研究院(苏州)有限公司 | 基于事件触发的多智能体一致性控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8706914B2 (en) * | 2007-04-23 | 2014-04-22 | David D. Duchesneau | Computing infrastructure |
-
2020
- 2020-11-16 CN CN202011121840.5A patent/CN112363392B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107728471A (zh) * | 2017-09-01 | 2018-02-23 | 南京理工大学 | 针对一类混合异质多智能体系统的分组一致性控制方法 |
CN108803349A (zh) * | 2018-08-13 | 2018-11-13 | 中国地质大学(武汉) | 非线性多智能体系统的最优一致性控制方法及系统 |
CN109507880A (zh) * | 2018-10-17 | 2019-03-22 | 东北大学 | 一种事件驱动策略的多智能体一致性控制方法 |
CN110376889A (zh) * | 2019-07-12 | 2019-10-25 | 哈尔滨理工大学 | 具有时变时滞的异构网络化多智能体系统分组一致的方法 |
CN110442022A (zh) * | 2019-07-19 | 2019-11-12 | 中国工程物理研究院计算机应用研究所 | 带有时滞异构多智能体系统的分组一致性控制方法 |
CN110597109A (zh) * | 2019-08-26 | 2019-12-20 | 同济人工智能研究院(苏州)有限公司 | 基于事件触发的多智能体一致性控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112363392A (zh) | 2021-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108803349B (zh) | 非线性多智能体系统的最优一致性控制方法及系统 | |
Li et al. | Distributed winner-take-all in dynamic networks | |
Enthrakandi Narasimhan et al. | Implementation and study of a novel approach to control adaptive cooperative robot using fuzzy rules | |
CN110286694B (zh) | 一种多领导者的无人机编队协同控制方法 | |
CN113589694B (zh) | 异构多智能体系统的完全分布式抗饱和跟踪控制方法 | |
CN112936286B (zh) | 一种多柔性机械臂系统自适应一致性追踪控制方法及系统 | |
CN108897222B (zh) | 多无人机策略攻击下输出反馈安全协同控制器及控制方法 | |
Mi et al. | Visual sensor network task scheduling algorithm at automated container terminal | |
Yan et al. | Distributed optimization of heterogeneous UAV cluster PID controller based on machine learning | |
CN112363392B (zh) | 一类模型未知的多智能体分群一致性控制方法 | |
CN112936266A (zh) | 网络化机械臂系统自适应一致性切换控制方法及系统 | |
Xiao et al. | Labour division in swarm intelligence for allocation problems: a survey | |
CN116700340A (zh) | 轨迹规划方法、装置及无人机集群 | |
Dong et al. | Reinforcement Learning-Based Wind Farm Control: Toward Large Farm Applications via Automatic Grouping and Transfer Learning | |
Bobyr et al. | Fuzzy algorithm of a mobile robot's motion | |
CN113759935A (zh) | 基于模糊逻辑的智能群体编队移动控制方法 | |
CN115469548A (zh) | 具有输入饱和的未知非线性多智能体有限时间分群一致性控制方法 | |
Ren | Decentralization of virtual structures in formation control of multiple vehicle systems via consensus strategies | |
CN115657722A (zh) | 一种基于事件触发脉冲控制的智能无人集群系统一致性编队控制方法 | |
CN114185273A (zh) | 一种饱和受限下分布式前置时间一致性控制器的设计方法 | |
Yang et al. | Flocking shape analysis of multi-agent systems | |
CN113341729A (zh) | 一种多智能体系统固定时间一致性控制方法 | |
Xu et al. | A formation keeping approach for fixed-wing uavs with exploration proximal policy optimization | |
CN116699989A (zh) | 基于边事件触发的非线性多智能体无梯度优化方法 | |
Cui | An Improved Chaotic Self-Adapting Monkey Algorithm for Multi-UAV Task Assignment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |