CN112363392A - 一类模型未知的多智能体分群一致性控制方法 - Google Patents

一类模型未知的多智能体分群一致性控制方法 Download PDF

Info

Publication number
CN112363392A
CN112363392A CN202011121840.5A CN202011121840A CN112363392A CN 112363392 A CN112363392 A CN 112363392A CN 202011121840 A CN202011121840 A CN 202011121840A CN 112363392 A CN112363392 A CN 112363392A
Authority
CN
China
Prior art keywords
agent
model
unknown
control
recited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011121840.5A
Other languages
English (en)
Other versions
CN112363392B (zh
Inventor
唐文妍
莫海红
吴佳
李坤
郭宇豪
孟江南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangtan University
Original Assignee
Xiangtan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiangtan University filed Critical Xiangtan University
Priority to CN202011121840.5A priority Critical patent/CN112363392B/zh
Publication of CN112363392A publication Critical patent/CN112363392A/zh
Application granted granted Critical
Publication of CN112363392B publication Critical patent/CN112363392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一类模型未知的多智能体分群一致性控制方法,包括以下步骤:采用基于径向基函数神经网络的自适应算法对未知项进行在线辨识,在此基础上引入事件触发的通信策略,通过智能体节点本身的信息、参考模型信息及其邻居智能体节点的信息,设计分布式控制器,使多智能体达到分群一致性。本发明实现了对一类模型未知的多智能体系统的在线辨识、分布式的事件触发通信策略、分群一致性控制,从而解决了多智能体模型未知、连续通信耗能大,运行时长短的问题。

Description

一类模型未知的多智能体分群一致性控制方法
技术领域
本发明涉及多智能体控制技术领域,特别是涉及对一类模型未知的多智能体分群一致性控制方法。
背景技术
近年来,由于多智能体系统在无人飞行器、智能电网和智能交通控制系统等领域的广泛应用,多智能体系统的协调控制引起了广泛的研究。在多智能体系统的协同控制问题中,达到预定的一致性是智能体进行协调合作的前提条件,因此一致性问题是协调控制研究的重要基础。多智能体的一致性控制在编队控制、群集控制、聚集蜂拥等控制领域都有着广泛的应用。
首先,给出智能体的定义,智能体是具有有限的传感、通信、计算、学习能力的设备或机器。而多智能体系统是由多个智能体组成的网络,各个智能体之间通过网络的拓扑规则来进行通信,从而共同协作来解决复杂化的任务。
随着研究的深入,多智能体系统的拓扑网络结构呈现越来越复杂的态势,以往系统内单一的一致性难以解决一些实际中的复杂问题。系统可能会出现多种不同的子任务需要系统的各部分协调来完成,最终会分群呈现多个不同的一致状态。群一致性是指系统中的所有个体可以被划分为若干个子群,每个子群的个体可以达到一致状态,而不同的子群的个体不一定达到一致状态即保持着各自独立的状态,这种子群体之间的差异性更具有普适性。当不同的子群中的个体都达到相同的状态时,分群一致性就削弱为完全一致性了,因此一致性可以看成是分群一致性中的一种特殊情况。
分群一致性相比于一致性更具普遍意义,但是其控制方法也更加复杂。同时,现有的大多数一致性研究成果都是假设对模型信息完全已知条件下所取得的。事实上,现实世界中的物体总存在未知的非线性特性。因此,研究模型未知的多智能体系统的分群一致性具有实际意义。
同时,由于多智能体系统通常含有数十上百个智能体,采用连续通讯方式,对能量的消耗大,造成资源的浪费。因此考虑引入事件触发机制,能够降低智能体间的通信频率,降低系统能耗,提高系统运行时长。
发明内容
本发明的目的在于提供一类模型未知的多智能体分群一致性控制方法,以解决上述背景技术中提出的问题。
为了实现上述目的,本发明采用如下的技术方案:
一类模型未知的多智能体分群一致性控制方法,包括以下步骤:
S1、明确研究问题动力学模型;
S2:针对动力学模型中的未知项,采用基于RBF人工神经网络的自适应算法来对其进行在线辨识,以满足系统实时性、快速性的要求;
S3:基于事件触发机制设计智能体间的通信策略,达到节省能耗,提高运行时长的目的;
S4:结合S2、S3,利用智能体节点本身的信息以及其邻居智能体节点的信息,在李雅普诺夫稳定性定理下,设计分布式控制器,确保具有未知模型的多智能体达到分群一致性;
S5:将上述未知模型辨识策略、事件触发策略、控制算法通过编程灌入各个多智能体中。
与现有技术相比,本发明的技术亮点是:对模型未知系统设计了在线辨识算法,满足系统的实时性;同时,考虑到连续通信的不足,设计了事件触发通信方式,减少了通信能耗,提高设备运行时长;此外针对更加复杂化的问题,设了分布式控制方法,实现分群一致性。
附图说明
图1为本实施例中多智能体通信拓扑图。
图2为本实施例中多智能体在本文所提出方法下的状态响应图。
图3为本实施例中多智能体在事件触发通信方式下的事件触发时刻图。
具体实施方式
为使本发明的目的、技术方案和优点能够更加清晰、易懂,下面结合附图及实施案例对本发明进一步详细描述。
一类模型未知的多智能体分群一致性控制方法,包括:
S1、明确研究问题动力学模型;
此一类模型未知的多智能体动力学模型含有N个智能体,第i个智能体动力学模型为:
Figure BDA0002732255340000031
其中,xi(t)∈Rn,ui(t)∈Rn,fi(xi(t))∈Rn分别表示智能体的状态、控制输入和未知非线性函数。
并在此定义参考模型:
Figure BDA0002732255340000032
其中Ni表示智能体i的邻居集合。
进一步定义跟踪误差:
ei(t)=xi(t)-zi(t),i=1,…,N (2)
在S1中,智能体的通信网络如附图1所示。
对于有向强连通度有如下定义:
Figure BDA0002732255340000033
其中:
Figure BDA0002732255340000034
本发明中使用新型拉普拉斯矩阵
Figure BDA0002732255340000035
其中
Figure BDA0002732255340000036
此外,
Figure BDA0002732255340000037
S2:针对(1)中未知项fi(xi(t)),采用基于RBF人工神经网络的自适应算法来对其进行在线辨识,以满足系统实时性、快速性的要求。
理想情况下fi(xi(t))=Wi *TG(xi(t))+εi(xi(t)),Wi *表示最优RBF人工神经网络的最优权值矩阵,G(·)表示RBF人工神经网络激活函数,εi表示RBF人工神经网络逼近误差。
最优权值矩阵可根据下式得到:
Figure BDA0002732255340000041
优选地,G(·)为高斯函数。
式(3)一般用于定性分析,实际中使用
Figure BDA0002732255340000042
对未知函数的逼近。
进一步优选地,结合自适应算法给出权值矩阵更新率:
Figure BDA0002732255340000043
其中,δi>0为设计的控制参数。
S3:基于事件触发机制设计智能体间的通信策略,达到节省能耗,提高运行时长的目的;
首先定义第i个智能体的通信状态测量误差:
Figure BDA0002732255340000044
通信的事件触发控制策略如下:
Figure BDA0002732255340000045
其中:Ei(t)为第i个智能体的事件触发函数,其设计为
Figure BDA0002732255340000046
其中β1,β2,γ为需要设计的控制参数,
Figure BDA0002732255340000047
exp表示自然对数的底数。
进一步,定义一个M矩阵,
Figure BDA0002732255340000048
便于系统稳定性分析。
S4:综合上面所述方法,智能体i的控制器设计为:
Figure BDA0002732255340000049
权值更新如上式(5)所示,且设计各控制参数满足下式:
Figure BDA0002732255340000051
其中,
Figure BDA0002732255340000052
S5:将上述未知模型辨识策略、事件触发策略、控制算法通过编程灌入各个多智能体中。
在本实施例中,优选地,xi(t)∈R2,ui(t)∈R2,fi(xi(t))∈R2
本实施例中多智能体通信拓扑对应的新型拉普拉斯如下:
Figure BDA0002732255340000053
系统分为三个子群,其中,{1,2}组成一个子群、{3}组成一个子群、{4,5}组成一个子群,
Figure BDA0002732255340000054
系统的初始值在(0,1)随机生成,x(0)=z(0)。
优选地,系统的控制参数设计如下:
β1=10-52=0.1,γ=2,ki=20,δi=2,i=1,…,N,其余相应参数可由已知信息计算得出。
如图2可以看出各智能体的状态按设定分群趋于一致,即该算法可以实现对模型未知的多智能系统分群一致性控制。如图3可以看出各智能体各自的事件触发时刻和次数,即实现了分布式事件触发控制,降低了系统能耗,提高了系统运行时长。
以上实施例仅是本发明的优选实施方案,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。

Claims (8)

1.一类模型未知的多智能体分群一致性控制方法,其特征在于:包括:
S1:明确研究问题动力学模型;
S2:针对动力学模型中的未知项,采用基于RBF人工神经网络的自适应算法来对其进行在线辨识,以满足系统实时性、快速性的要求;
S3:基于事件触发机制设计智能体间的通信策略,达到节省能耗,提高运行时长的目的;
S4:结合S2、S3,利用智能体节点本身的信息以及其邻居智能体节点的信息,在李雅普诺夫稳定性定理下,设计分布式控制器,确保具有未知模型的多智能体达到分群一致性;
S5:将上述未知模型辨识策略、事件触发策略、控制算法通过编程灌入各个多智能体中。
2.根据权利要求1所述的一类模型未知的多智能体分群一致性控制方法,其特征在于:在S1中:
明确一类模型未知的多智能体动力学模型含有N个智能体,第i个智能体动力学模型为:
Figure FDA0002732255330000011
其中,xi(t)∈Rn,ui(t)∈Rn,fi(xi(t))∈Rn分别表示智能体的状态、控制输入和未知非线性函数。
3.根据权利要求2所述的一类模型未知的多智能体分群一致性控制方法,其特征在于:定义参考模型:
Figure FDA0002732255330000012
其中Ni表示智能体i的邻居集合,此外对于一个紧集内的初值满足:
Figure FDA0002732255330000013
4.根据权利要求1所述的一类模型未知的多智能体分群一致性控制方法,其特征在于:智能体的通信网络为有向强连通拓扑。
5.根据权利要求1所述的一类模型未知的多智能体分群一致性控制方法,其特征在于:在S2中:针对未知项fi(xi(t)),采用基于RBF人工神经网络的自适应算法来对其进行在线辨识,包括:
定义跟踪误差:
ei(t)=xi(t)-zi(t),i=1,…,N
未知函数逼近:
Figure FDA0002732255330000014
Figure FDA0002732255330000021
其中,δi>0为设计的控制参数。
6.根据权利要求1所述的一类模型未知的多智能体分群一致性控制方法,其特征在于:在S3中:基于事件触发机制设计智能体间的通信策略,包括:
首先定义第i个智能体的通信状态测量误差:
Figure FDA0002732255330000022
通信的事件触发控制策略如下:
Figure FDA0002732255330000023
其中:Ei(t)为第i个智能体的事件触发函数,其设计为
Figure FDA0002732255330000024
其中β1,β2,γ为需要设计的控制参数,
Figure FDA0002732255330000025
exp表示自然对数的底数。
7.根据权利要求1所述的一类模型未知的多智能体分群一致性控制方法,其特征在于:在S4中:
设计智能体i的控制器设计为:
Figure FDA0002732255330000026
权值更新如权利要求5中所示,且设计各控制参数满足下式:
Figure FDA0002732255330000027
其中,
Figure FDA0002732255330000028
8.根据权利要求1所述的一类模型未知的多智能体分群一致性控制方法,其特征在于:在S5中:
将上述未知模型辨识策略、事件触发策略、控制算法通过编程灌入各个多智能体中。
CN202011121840.5A 2020-11-16 2020-11-16 一类模型未知的多智能体分群一致性控制方法 Active CN112363392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011121840.5A CN112363392B (zh) 2020-11-16 2020-11-16 一类模型未知的多智能体分群一致性控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011121840.5A CN112363392B (zh) 2020-11-16 2020-11-16 一类模型未知的多智能体分群一致性控制方法

Publications (2)

Publication Number Publication Date
CN112363392A true CN112363392A (zh) 2021-02-12
CN112363392B CN112363392B (zh) 2022-05-24

Family

ID=74507366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011121840.5A Active CN112363392B (zh) 2020-11-16 2020-11-16 一类模型未知的多智能体分群一致性控制方法

Country Status (1)

Country Link
CN (1) CN112363392B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792844A (zh) * 2021-08-19 2021-12-14 中国人民解放军军事科学院国防科技创新研究院 基于深度自动编码和特征融合的智能体蜂拥行为控制方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130306276A1 (en) * 2007-04-23 2013-11-21 David D Duchesneau Computing infrastructure
CN107728471A (zh) * 2017-09-01 2018-02-23 南京理工大学 针对一类混合异质多智能体系统的分组一致性控制方法
CN108803349A (zh) * 2018-08-13 2018-11-13 中国地质大学(武汉) 非线性多智能体系统的最优一致性控制方法及系统
CN109507880A (zh) * 2018-10-17 2019-03-22 东北大学 一种事件驱动策略的多智能体一致性控制方法
CN110376889A (zh) * 2019-07-12 2019-10-25 哈尔滨理工大学 具有时变时滞的异构网络化多智能体系统分组一致的方法
CN110442022A (zh) * 2019-07-19 2019-11-12 中国工程物理研究院计算机应用研究所 带有时滞异构多智能体系统的分组一致性控制方法
CN110597109A (zh) * 2019-08-26 2019-12-20 同济人工智能研究院(苏州)有限公司 基于事件触发的多智能体一致性控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130306276A1 (en) * 2007-04-23 2013-11-21 David D Duchesneau Computing infrastructure
CN107728471A (zh) * 2017-09-01 2018-02-23 南京理工大学 针对一类混合异质多智能体系统的分组一致性控制方法
CN108803349A (zh) * 2018-08-13 2018-11-13 中国地质大学(武汉) 非线性多智能体系统的最优一致性控制方法及系统
CN109507880A (zh) * 2018-10-17 2019-03-22 东北大学 一种事件驱动策略的多智能体一致性控制方法
CN110376889A (zh) * 2019-07-12 2019-10-25 哈尔滨理工大学 具有时变时滞的异构网络化多智能体系统分组一致的方法
CN110442022A (zh) * 2019-07-19 2019-11-12 中国工程物理研究院计算机应用研究所 带有时滞异构多智能体系统的分组一致性控制方法
CN110597109A (zh) * 2019-08-26 2019-12-20 同济人工智能研究院(苏州)有限公司 基于事件触发的多智能体一致性控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792844A (zh) * 2021-08-19 2021-12-14 中国人民解放军军事科学院国防科技创新研究院 基于深度自动编码和特征融合的智能体蜂拥行为控制方法
CN113792844B (zh) * 2021-08-19 2023-07-25 中国人民解放军军事科学院国防科技创新研究院 基于深度自动编码和特征融合的智能体蜂拥行为控制方法

Also Published As

Publication number Publication date
CN112363392B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
Castello et al. Adaptive foraging for simulated and real robotic swarms: the dynamical response threshold approach
CN108803349B (zh) 非线性多智能体系统的最优一致性控制方法及系统
Li et al. Distributed winner-take-all in dynamic networks
Enthrakandi Narasimhan et al. Implementation and study of a novel approach to control adaptive cooperative robot using fuzzy rules
Niu et al. An improved intelligent water drops algorithm for solving multi-objective job shop scheduling
Pornsing et al. Novel self-adaptive particle swarm optimization methods
CN110286694B (zh) 一种多领导者的无人机编队协同控制方法
Wang Adaptive output-feedback time-varying formation tracking control for multi-agent systems with switching directed networks
CN112936286B (zh) 一种多柔性机械臂系统自适应一致性追踪控制方法及系统
Yan et al. Distributed optimization of heterogeneous UAV cluster PID controller based on machine learning
CN113589694B (zh) 异构多智能体系统的完全分布式抗饱和跟踪控制方法
CN113625559A (zh) 一种基于指定时间收敛的多智能体系统协同控制方法
CN112363392B (zh) 一类模型未知的多智能体分群一致性控制方法
Xiao et al. Labour division in swarm intelligence for allocation problems: a survey
CN112936266A (zh) 网络化机械臂系统自适应一致性切换控制方法及系统
Paul et al. Efficient planning of multi-robot collective transport using graph reinforcement learning with higher order topological abstraction
Zhan et al. Flocking of discrete-time multi-agent systems with predictive mechanisms
CN115469548A (zh) 具有输入饱和的未知非线性多智能体有限时间分群一致性控制方法
Han et al. Unmanned Aerial Vehicle 3D Trajectory Planning Based on Background of Complex Industrial Product Warehouse Inventory.
Ren Decentralization of virtual structures in formation control of multiple vehicle systems via consensus strategies
CN116700340A (zh) 轨迹规划方法、装置及无人机集群
Khosravi et al. Adaptive fuzzy SMC-based formation design for swarm of unknown time-delayed robots
CN115657722A (zh) 一种基于事件触发脉冲控制的智能无人集群系统一致性编队控制方法
Dong et al. Cooperative federated multi-agent control of large-scale systems
Lee et al. Cooperative particle swarm optimization-based predictive controller for multi-robot formation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant