CN117193146A - 智能体集群的控制方法及相关产品 - Google Patents
智能体集群的控制方法及相关产品 Download PDFInfo
- Publication number
- CN117193146A CN117193146A CN202311470416.5A CN202311470416A CN117193146A CN 117193146 A CN117193146 A CN 117193146A CN 202311470416 A CN202311470416 A CN 202311470416A CN 117193146 A CN117193146 A CN 117193146A
- Authority
- CN
- China
- Prior art keywords
- agent
- matrix
- cluster
- state
- agent cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000001105 regulatory effect Effects 0.000 claims abstract description 4
- 239000003795 chemical substances by application Substances 0.000 claims description 102
- 239000011159 matrix material Substances 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 7
- 230000001276 controlling effect Effects 0.000 claims description 6
- 238000004146 energy storage Methods 0.000 claims description 2
- 239000000758 substrate Substances 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 claims 1
- 230000003993 interaction Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004138 cluster model Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
Landscapes
- Feedback Control In General (AREA)
Abstract
本发明公开了一种智能体集群的控制方法及相关产品。该控制方法中,对于智能体集群中的任一个智能体,按照如下公式确定控制输入,并根据计算得到的控制输入调控自身状态:,其中满足。该方法能够保证智能体系统的无源性和一致性。
Description
技术领域
本发明涉及一种智能体集群的控制方法及相关产品。
背景技术
智能体集群的协同控制问题一直是智能控制领域的研究热点。在智能体集群中,由于智能体之间存在相互影响和耦合,因此要实现协同控制是一项具有挑战性的任务。为了解决这个问题,研究人员一直在探索各种合作控制策略和技术。随着智能体集群在现实世界中的广泛应用,例如智能交通、无人机编队控制、协作式机器人、社交网络等领域,智能体集群的协同控制研究变得更加重要和紧迫。作为一种典型的智能体集群控制,多机器人系统中的一致性控制问题涉及到如何使机器人在动态环境中共同协作以实现相同的目标,比如达到相同的速度,位置和姿态等等。
中国专利CN116540781A公开一种种无人机集群的速度同步方法、装置、设备及介质,其方法包括获取无人机集群中各无人机初始的速度和位置;重复以下步骤,直至无人机集群的速度同步程度达到预设值:根据各无人机的速度和位置确定各无人机的相互作用力和相互作用合力;根据各无人机的相互作用合力更新各无人机的速度和位置。
发明内容
本发明提供一种智能体集群的控制方法及相关产品。
本发明采用如下技术方案:一种智能体集群的控制方法,包括:对于智能体集群中的任一个智能体,按照如下公式确定控制输入,并根据计算得到的控制输入调控自身状态:
;
其中,为第r个智能体的控制输入,t为时间,z是智能体集群中智能体的数量,/>是预设的智能体集群的通信拓扑矩阵/>中的元素,/>和/>为控制增益矩阵,/>为第l个智能体的状态误差,/>为第r个智能体的状态误差;其中,控制增益矩阵/>和/>满足:
;
其中,
;
Iz为z维单位矩阵,为设定的系数,/>和/>为设定的系数矩阵,/>>0,H为设定的正定矩阵,M为设定的对角矩阵,In为n维单位矩阵,/>为设定的正实数,
;
其中,H、M和满足:
;
其中,智能体r的动力学模型如下:
;
σ∈(0,1)是分数阶求导的阶数,cr(t)∈Rn、wr(t)∈Rn和ur(t)∈Rn依次为第r个智能体在时间t的状态、外部输入和控制输入,g(t,cr(t))∈Rn是连续可微分的非线性向量函数,代表Caputo类型的分数阶导数,n是大于0的整数。
本发明采用如下技术方案:一种智能体的控制器,所述智能体为智能体集群中的智能体,所述控制器包括存储器和处理器,所述存储器存储程序,所述处理器运行所述程序以执行前述的方法。
本发明采用如下技术方案:一种智能体,包括前述控制器。
本发明采用如下技术方案:一种程序产品,所述程序产品在处理器上运行时执行前述的方法。
该方法使得智能体集群的工作状态能够达到无源性以及一致性。
附图说明
图1是本发明的智能体集群的控制方法的设计思路。
图2是本发明的一个实施例的智能体集群的通信拓扑图。
图3是图2所示智能体集群中各智能体的输出方程的幅度随时间的变化曲线。
图4是图2所示智能体集群中各智能体的外部输入的幅度随时间的变化曲线。
图5是图2所示智能体集群中各智能体的状态误差的幅度随时间的变化曲线。
具体实施方式
下面结合具体实施例对本发明作进一步的说明,但本发明的保护范围并不限于此。
本发明对智能体集群中智能体的种类不做限定,例如智能体为机器人、无人机、无人船等。本发明对需要达到一致的状态的具体种类不做限定,例如是编队位置、速度、姿态等。
本发明的实施例提供:一种智能体集群的控制方法,包括:对于智能体集群中的任一个智能体,按照如下公式确定控制输入,并根据计算得到的控制输入调控自身状态:
;
其中,为第r个智能体的控制输入,t为时间,z是智能体集群中智能体的数量,/>是预设的智能体集群的通信拓扑矩阵/>中的元素,/>和/>为控制增益矩阵,/>为第l个智能体的状态误差,/>为第r个智能体的状态误差;其中,控制增益矩阵/>和/>满足:
;
其中,
;
Iz为z维单位矩阵,为设定的系数,/>和/>为设定的系数矩阵,/>>0,H为设定的正定矩阵,M为设定的对角矩阵,In为n维单位矩阵,/>为设定的正实数,
;
其中,H、M和满足:
;
其中,智能体r的动力学模型如下:
;
σ∈(0,1)是分数阶求导的阶数,cr(t)∈Rn、wr(t)∈Rn和ur(t)∈Rn依次为第r个智能体在时间t的状态、外部输入和控制输入,g(t,cr(t))∈Rn是连续可微分的非线性向量函数,代表Caputo类型的分数阶导数,n是大于0的整数。
以下结合图1详细介绍该方法的设计以及论证过程。
符号说明:是n*n维矩阵的集合;集合/>代表v个智能体构成的集合,无向边集合/>表示v个智能体之间的无向通信链接;对于一个实对称矩阵/>,表示矩阵G的特征值,且满足/>,/>表示拉普拉斯变换。一个矩阵大于0表示其是正定的;矩阵小于0表示其是负定的;矩阵大于或等于0表示其是半正定的;矩阵小于或等于0表示其是半负定的。
建立非线性分数阶智能体集群模型。
首先介绍一些关于分数阶微积分的基本定义和性质。
定义一:对于任意的,其Caputo分数阶导数被定义为:
;
其中,0<<1,t≥0, />是Euler's Gamma 函数,表达式如下:
。
的拉普拉斯变换为
;
其中,,s代表拉普拉斯域中的变量。
作为指数函数的一个推广概念,Mittag-Lefler函数在分数阶系统的解中起着关键作用,我们给出Mittag-Lefler函数的定义如下。
定义二:带有两个参数的Mittag-Lefler函数 和带有一个参数的Mittag-Lefler函数/> 被定义如下:
;
其中, 并且/>。 特别的,/> 并且/>。此外,
;
其中,t≥0 并且。
根据上述Caputo分数阶导数的定义与性质,建立由z个智能体构成的非线性分数阶多智能体集群的动力学模型,其中每个智能体的动态被建立为
(1);
其中, 代表分数阶的阶数。/>、/>和/>分别代表第r个智能体的状态、外部输入和控制输入。非线性向量函数/>是连续可微分的并且满足下面的条件
;
其中并且。
定义作为智能体集群之间的通信拓扑结构并且满足下面的扩散条件:
。
接下来,构建误差系统。定义智能体集群的误差动态方程。定义所有智能体的状态均值为
,进一步
。
定义所有智能体的状态误差,r=1,2,...,z。 则误差动态方程为:
(2)。
为上述智能体集群的误差动态方程定义输出方程:
(3);
其中 和/> 是预先给定的具有合适维度的常系数矩阵。此外,为了便于陈述,预先给定如下记号:
。
无源性,作为耗散性的一种特例,是基于广义能量概念对系统输出和输入行为的表征。以下给出如下关于非线性分数阶智能体集群无源性相关定义。
定义三.如果存在一个正半定的能量存储函数 S(t) 满足
;
那么非线性分数阶智能体集群(2)和(3)具备输出严格无源性,其中。
本发明的主要目标是通过设计合适的状态反馈控制器使得非线性分数阶智能体集群通过满足系统无源性进而实现一致性,即满足下面的条件
。
设计状态反馈控制器并建立闭环控制系统。
为误差动态系统(2)设计如下状态反馈控制器:
(4);
其中和/>为控制增益矩阵。
那么根据状态反馈控制器,我们可以得到闭环控制系统:
(5)。
给出在状态反馈控制器下保证闭环控制系统实现输出严格无源性的充分条件。
以下定理给出了闭环控制系统(5)实现输出严格无源性的充分条件。
定理一.借助状态反馈控制器,闭环控制系统(5)能够实现输出严格无源性,如果存在一个正常量满足:
(6);
其中,, 并且。
选取如下所示Lyapunov泛函:
(7)。
沿着闭环控制系统的轨迹对V1(t)进行时间导数:
(8)。
计算出所有智能体的误差信息:
。
因此,
(9)。
对非线性项进行放缩:
(10)。
进一步,
(11)。
根据非线性分数阶智能体集群的输出严格无源性定义以及(11)可以实现:
(12)
其中,,。
结合定理条件和(12)则有:
。
因此,闭环控制系统通过状态反馈控制器可以实现输出严格无源性。上述过程保证了智能体集群通过状态反馈控制器(4)能够实现输出严格无源性。下面给出智能体集群通过无源性能够进一步实现一致性的条件。
基于得到的输出严格无源性准则,给出保证非线性分数阶智能体集群实现一致性的充分条件。
定理二.如果闭环控制系统(5)通过状态反馈控制器实现了输出严格无源性, 并且智能体集群的输出方程参数满足,那么非线性分数阶智能体集群可以实现一致性。
考虑到闭环控制系统(5)通过状态反馈控制器实现了输出严格无源性:
;其中,/>。
令分数阶智能体集群外部输入w(t)=0,
(13)
其中。
根据(7)可以得到:
(14)。
根据 (13) 和 (14)可以得到:
。
显然,存在一个非负的函数满足
(15)。
对(15)进行拉普拉斯变换
;
其中 和/> 分别代表/>和/>的拉普拉斯变换后的形式。
可以得到:
(16)。
对(16)进行逆拉普拉斯变换
(17),
其中 是非负的。将 (17) 带入(14) ,得到:
。
进一步,。
因此,智能体集群通过状态反馈控制器(4)能够实现一致性。上述过程保证了智能体集群通过状态反馈控制器(4)在基于输出严格无源性情况下通过调节系统输出参数可以进而实现一致性。
以下提供一个数值化的实例,以对以上方法进行验证。
参考图2,设定六个运行在沙地的地面机器人构成的非线性多地面机器人系统。构建如下分数阶动态模型:
;
其中,地面机器人的个数 r=1,2,...6。
每个地面机器人的非线性项由Chua’s电路构成
;
其中,。
显然,我们通过简单的计算并且/>, 那么非线性函数的条件能够成立。
情形一: 误差动态方程中第 r 个地面机器人的输出表示为:
;
其中,我们给定输出方程的调节系数矩阵
。
地面机器人之间的通信拓扑矩阵如下所示:
。
设定如下参数:
。
以上参数满足定理一,这表明闭环的非线性分数阶多地面机器人系统如预期的一样在状态反馈控制器下能够实现输出严格无源性。仿真结果如图3至图5所示。
情形二:如果我们选择与情形一相同的系统参数和/>。那么可以发现/>,因此定理二也同样能够被满足。仿真结果如图5所示。图5清晰的显示,当时间t增加到1s时,所有地面机器人的误差/>收敛到零,并且可以随着时间的增加而维持。这表明闭环的非线性分数阶多地面机器人系统如预期的一样在状态反馈控制器下保证输出严格无源性的同时实现一致性。
基于相同的发明构思,本发明的实施例还提供:一种智能体的控制器,所述智能体为智能体集群中的智能体,所述控制器包括存储器和处理器,所述存储器存储程序,所述处理器运行所述程序以执行前述的方法。
基于相同的发明构思,本发明的实施例还提供:一种智能体,包括前述控制器。
基于相同的发明构思,本发明的实施例还提供:一种程序产品,所述程序产品在处理器上运行时执行前述的方法。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
本发明的保护范围不限于上述的实施例,显然,本领域的技术人员可以对本发明进行各种改动和变形而不脱离本发明的范围和精神。倘若这些改动和变形属于本发明权利要求及其等同技术的范围,则本发明的意图也包含这些改动和变形在内。
Claims (8)
1.一种智能体集群的控制方法,其特征在于,包括:对于智能体集群中的任一个智能体,按照如下公式确定控制输入,并根据计算得到的控制输入调控自身状态:
;
其中,为第r个智能体的控制输入,t为时间,z是智能体集群中智能体的数量,/>是预设的智能体集群的通信拓扑矩阵/>中的元素,/>和/>为控制增益矩阵,/>为第l个智能体的状态误差,/>为第r个智能体的状态误差;其中,控制增益矩阵/>和/>满足:
;
其中,
;
Iz为z维单位矩阵,为设定的系数,/>和/>为设定的系数矩阵,/>>0,H为设定的正定矩阵,M为设定的对角矩阵,In为n维单位矩阵,/>为设定的正实数,
;
其中,H、M和满足:
;
其中,智能体r的动力学模型如下:
;
σ∈(0,1)是分数阶求导的阶数,cr(t)∈Rn、wr(t)∈Rn和ur(t)∈Rn依次为第r个智能体在时间t的状态、外部输入和控制输入,g(t,cr(t))∈Rn是连续可微分的非线性向量函数,代表Caputo类型的分数阶导数,n是大于0的整数。
2.根据权利要求1所述的方法,其特征在于,对于智能体r,其状态误差定义为:
;
为智能体q的状态。
3.根据权利要求1所述的方法,其特征在于,所述智能体集群的通信拓扑表示为连通的无向图。
4.根据权利要求3所述的方法,其特征在于,
;
其中,B为智能体集群的无向边集合。
5.根据权利要求1所述的方法,其特征在于,、/>和/>满足:
;
其中,,为各智能体的外部输入构成的矩阵,下标为智能体编号;
其中,,为各个智能体的输出方程构成的矩阵,下标为智能体编号,任一个智能体r的输出方程为/>;
其中,S(t)为正半定的能量存储函数。
6.一种智能体的控制器,其特征在于,所述智能体为智能体集群中的智能体,所述控制器包括存储器和处理器,所述存储器存储程序,所述处理器运行所述程序以执行根据权利要求1至5中任一项所述的方法。
7.一种智能体,其特征在于,包括根据权利要求6所述的控制器。
8.一种程序产品,其特征在于,所述程序产品在处理器上运行时执行根据权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311470416.5A CN117193146B (zh) | 2023-11-07 | 2023-11-07 | 智能体集群的控制方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311470416.5A CN117193146B (zh) | 2023-11-07 | 2023-11-07 | 智能体集群的控制方法及相关产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117193146A true CN117193146A (zh) | 2023-12-08 |
CN117193146B CN117193146B (zh) | 2024-01-30 |
Family
ID=89000196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311470416.5A Active CN117193146B (zh) | 2023-11-07 | 2023-11-07 | 智能体集群的控制方法及相关产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117193146B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117687345A (zh) * | 2024-02-01 | 2024-03-12 | 北京中关村实验室 | 多智能体系统的控制方法及相关产品 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110426951A (zh) * | 2019-07-17 | 2019-11-08 | 西北工业大学深圳研究院 | 一种应用于集群智能系统的鲁棒分布式平均跟踪控制方法 |
CN110687915A (zh) * | 2019-10-17 | 2020-01-14 | 哈尔滨工业大学 | 一种基于无向通信拓扑的航天器编队姿态协同控制方法 |
CN115357048A (zh) * | 2022-09-15 | 2022-11-18 | 北京航空航天大学 | 一种不确定性下多无人机时变编队协同跟踪控制方法 |
CN115407661A (zh) * | 2022-09-05 | 2022-11-29 | 天津大学 | 基于方位测量信息多无人机系统非线性鲁棒跟踪控制方法 |
CN116736842A (zh) * | 2023-05-19 | 2023-09-12 | 杭州电子科技大学 | 半马尔可夫切换拓扑下车辆队列的h无穷与无源性控制方法 |
-
2023
- 2023-11-07 CN CN202311470416.5A patent/CN117193146B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110426951A (zh) * | 2019-07-17 | 2019-11-08 | 西北工业大学深圳研究院 | 一种应用于集群智能系统的鲁棒分布式平均跟踪控制方法 |
CN110687915A (zh) * | 2019-10-17 | 2020-01-14 | 哈尔滨工业大学 | 一种基于无向通信拓扑的航天器编队姿态协同控制方法 |
CN115407661A (zh) * | 2022-09-05 | 2022-11-29 | 天津大学 | 基于方位测量信息多无人机系统非线性鲁棒跟踪控制方法 |
CN115357048A (zh) * | 2022-09-15 | 2022-11-18 | 北京航空航天大学 | 一种不确定性下多无人机时变编队协同跟踪控制方法 |
CN116736842A (zh) * | 2023-05-19 | 2023-09-12 | 杭州电子科技大学 | 半马尔可夫切换拓扑下车辆队列的h无穷与无源性控制方法 |
Non-Patent Citations (4)
Title |
---|
SHUO YUAN, ET AL.: "Uncoupled PID Control of Multi-Agent Nonlinear Uncertain Stochastic Systems", INTERNATIONAL FEDERATION OF AUTOMATIC CONTROL, pages 485 - 490 * |
YUE LI, ET AL.: "Finite-time formation control of nonaffine nonlinear systems under directed communication interactions", JOURNAL OF THE FRANKLIN INSTITUTE, pages 7180 - 7205 * |
曹新亮 等: "基于位置信息的混合多智能体蜂拥控制方法", 计算机技术与发展, no. 11, pages 116 - 119 * |
闵海波 等: "多个体协调控制问题综述", 自动化学报, no. 10, pages 1557 - 1570 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117687345A (zh) * | 2024-02-01 | 2024-03-12 | 北京中关村实验室 | 多智能体系统的控制方法及相关产品 |
CN117687345B (zh) * | 2024-02-01 | 2024-05-14 | 北京中关村实验室 | 多智能体系统的控制方法及相关产品 |
Also Published As
Publication number | Publication date |
---|---|
CN117193146B (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Fixed‐time consensus tracking control for second‐order multi‐agent systems with bounded input uncertainties via NFFTSM | |
CN117193146B (zh) | 智能体集群的控制方法及相关产品 | |
Bu et al. | A prescribed performance control approach guaranteeing small overshoot for air-breathing hypersonic vehicles via neural approximation | |
Peng et al. | Distributed model reference adaptive control for cooperative tracking of uncertain dynamical multi‐agent systems | |
CN107086916B (zh) | 一种基于分数阶自适应滑模控制的混沌系统同步方法 | |
CN110193833B (zh) | 多机械臂系统的自适应有限时间命令滤波反步控制方法 | |
Pradhan et al. | Design and implementation of decoupled compensation for a twin rotor multiple‐input and multiple‐output system | |
Tong et al. | Observer-based adaptive finite-time prescribed performance NN control for nonstrict-feedback nonlinear systems | |
Wang et al. | Fully distributed low-complexity control for nonlinear strict-feedback multiagent systems with unknown dead-zone inputs | |
CN113359445A (zh) | 一种多智能体磁滞系统分布式输出反馈渐近一致控制方法 | |
CN113268083A (zh) | 基于动态事件触发的多无人机系统编队跟踪控制方法 | |
Ma et al. | Fast terminal sliding‐mode finite‐time tracking control with differential evolution optimization algorithm using integral chain differentiator in uncertain nonlinear systems | |
Pan et al. | Robust adaptive control of non‐linear time‐delay systems with saturation constraints | |
Yang et al. | Adaptive neural control of nonaffine systems with unknown control coefficient and nonsmooth actuator nonlinearities | |
CN111740658B (zh) | 基于策略迭代的电机系统最优调节控制方法 | |
Bao et al. | Finite-time synchronization control for bilateral teleoperation systems with asymmetric time-varying delay and input dead zone | |
CN109514559B (zh) | 基于输出重定义的柔性机械臂时标分离鲁棒控制方法 | |
Cheng et al. | Bounded decoupling control for flexible‐joint robot manipulators with state estimation | |
CN111474922A (zh) | 一种连续非线性系统的控制器构建方法 | |
Zhao et al. | Robust adaptive fault‐tolerant quantized control of nonlinear systems with constraints on system behaviors and states | |
CN117452975A (zh) | 一种四旋翼无人机集群的保性能协同编队控制设计方法 | |
CN114839883B (zh) | 非线性欠驱动水下航行器定深抗干扰鲁棒l1控制方法 | |
Liu et al. | Neural Network Identification and Sliding Mode Control for Hysteresis Nonlinear System with Backlash‐Like Model | |
Gao | Adaptive Neural Control for Hysteresis Motor Driving Servo System with Bouc‐Wen Model | |
Kim et al. | Sensorless non‐linear position‐stabilising control for magnetic levitation systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |