CN114609915B - 一种未知控制方向的时变多智能体协同控制方法 - Google Patents
一种未知控制方向的时变多智能体协同控制方法 Download PDFInfo
- Publication number
- CN114609915B CN114609915B CN202210342634.XA CN202210342634A CN114609915B CN 114609915 B CN114609915 B CN 114609915B CN 202210342634 A CN202210342634 A CN 202210342634A CN 114609915 B CN114609915 B CN 114609915B
- Authority
- CN
- China
- Prior art keywords
- agent
- unknown
- function
- time
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004891 communication Methods 0.000 claims abstract description 23
- 238000013461 design Methods 0.000 claims abstract description 16
- 238000005516 engineering process Methods 0.000 claims abstract description 9
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 abstract description 10
- 230000006872 improvement Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 238000004880 explosion Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开一种未知控制方向的时变多智能体协同控制方法,包括步骤一、建立由N个跟随者和一个N+1领导者组成的一类控制方向未知的高阶线性时变多智能体系统模型,步骤二、针对智能体之间的相互通信关系,通过代数图论建立通讯拓扑结构,步骤三、利用努斯鲍姆函数完成对控制器的设计,步骤四、采用有界估计方法结合平滑函数的方法,再利用自适应动态面控制技术,结合步骤一中的系统模型构建获得自适应协同控制器算法;本发明采用自适应控制方法,选择合适的努斯鲍姆函数,并采用有界估计方法结合平滑函数的方法,实现了多智能体系统的一致性和稳定性,保证了封闭系统是半全局一致有界稳定的,所有误差信号都可以收敛到任意小的残差集。
Description
技术领域
本发明涉及多智能体系统的协同控制技术领域,尤其涉及一种未知控制方向的时变多智能体协同控制方法。
背景技术
多智能体系统是根据分布式人工智能发展而来,它是由多个相互作用具有通信拓扑的智能体所组成的计算系统,其中的每一个智能体均为一个计算实体,如机器人或软件程序,多智能体系统能够将具有某种关系的智能体联合起来,使它们通过信息交互实现群体协调运作,进而完成较为复杂的任务;
目前广泛应用于多智能体一致性控制研究中的自适应控制技术,其要求系统的非线性和不确定性必须满足一些假定的条件,采用反演控制方法克服了这一缺陷,但反演控制方法存在“微分爆炸”问题,使得控制器的设计变得复杂,此外,在一些实际工程中,很多系统往往存在未知的控制增益,常采用努斯鲍姆函数可以解决由未知控制方向引起的控制器设计问题,但其对于多智能体系统中存在的时变参数,它们的非零导数可能会让整个设计过程变得非常复杂,因此,本发明提出一种未知控制方向的时变多智能体协同控制方法以解决现有技术中存在的问题。
发明内容
针对上述问题,本发明的目的在于提出一种未知控制方向的时变多智能体协同控制方法,该未知控制方向的时变多智能体协同控制方法采用自适应控制方法,选择合适的努斯鲍姆函数,并采用有界估计方法结合平滑函数的方法,最终形成了一种自适应协同控制器,实现了多智能体系统的一致性和稳定性,保证了封闭系统是半全局一致有界稳定的,所有误差信号都可以收敛到任意小的残差集。
为实现本发明的目的,本发明通过以下技术方案实现:一种未知控制方向的时变多智能体协同控制方法,包括以下步骤:
步骤一、建立由N个跟随者和一个N+1领导者组成的一类控制方向未知的高阶线性时变多智能体系统模型;
步骤二、针对智能体之间的相互通信关系,通过代数图论建立通讯拓扑结构;
步骤三、利用努斯鲍姆函数完成对控制器的设计;
步骤四、采用有界估计方法结合平滑函数的方法,再利用自适应动态面控制技术,结合步骤一中的系统模型构建获得自适应协同控制器算法。
进一步改进在于:所述步骤一中跟随者标记为1~N,领导者标记为N+1,跟随者的动态特征用动态方程描述;建立的系统模型由下式表示
y=xi,1,(k=1,…,n-1)
进一步改进在于:所述步骤二中建立通讯拓扑结构具体为,先用一个有向图G描述N+1个多智能体之间的通信拓扑结构,包含节点集V={1,…,N+1}和边缘集边(j,i)∈E表示智能体i从智能体j获得信息,则智能体j被称为智能体i的邻居,结点i的邻居集表示为Πi={j|(j,i)∈E},从节点i1到节点ik的有向路径为(i1,i2),(i2,i3),…,(ik-1,ik)形成的边序列。
进一步改进在于:所述有向图G有关的邻接矩阵其中ai,j>0,当(j,i)∈E,其他情况下ai,j=0;定义拉普拉斯矩阵L=D-A,其中D=diag(d1,…,dn+1)为 的内度矩阵,假设领导者N+1没有邻居,运动独立于跟随者,则拉普拉斯矩阵表示为
进一步改进在于:所述步骤三中先令V(t)和Ki(t),(i=1,…,N)分别为光滑的正定函数和光滑函数,两者的初始值V(0)和Ki(0),i=1,…,N都定义在[0,tf]上,令 ki(t)为[0,T)上的一个光滑的努斯鲍姆函数,当下式成立
进一步改进在于:所述步骤四中先根据动态面技术将控制器算法设计分为n步,并在最后一步计算获得对每个跟随者的控制率ui,具体步骤如下
S1、设第一个误差面为
则si,1的导数表示为
其中
可知,导数满足
由杨氏不等式得
带入可得
可将上式变为
其中
对其求导,则导数满足下式
其中
则有下式
进一步可得
本发明的有益效果为:本发明利用自适应动态表面技术来克服反推中的“微分爆炸”问题,同时确保跟随者只需要其邻居代理的前两个状态,可以大大降低控制方案的计算量和代理之间的通信复杂度;
本发明通过引入一个努斯鲍姆函数,不再假设多智能体系统的控制增益的符号已知,即控制方向是未知的,扩大了本发明所设计控制器的使用范围;
采用结合平滑函数的边界估计方法处理多智能体系统中的时变参数,通过在线估计多智能体系统中时变参数的上界,避免了时变参数导数带来的控制器设计困难。
附图说明
图1为本发明实验系统的架构图。
图2为本发明四个跟随者利用本发明的控制器实现追踪一个领导者的追踪曲线图。
图3为本发明四个跟随者的控制输入信号图。
图4为本发明四个跟随者利用本发明的控制器显示追踪一个领导者的追踪误差图。
图5为本发明四个跟随者利用反演控制的控制器实现追踪一个领导者的追踪曲线及追踪误差图。
图6为本发明第一个努斯鲍姆函数曲线图。
图7为本发明第一个努斯鲍姆函数的参数曲线图。
图8为本发明第二个努斯鲍姆函数曲线图。
图9为本发明第二个努斯鲍姆函数的参数曲线图。
图10为本发明控制器的自适应律ηi,1,(i=1,2,3,4)图。
图11为本发明控制器的自适应律ηi,2,(i=1,2,3,4)图。
图12为本发明控制器的自适应律ηi,3,(i=1,2,3,4)图。
具体实施方式
为了加深对本发明的理解,下面将结合实施例对本发明做进一步详述,本实施例仅用于解释本发明,并不构成对本发明保护范围的限定。
根据图1-12所示,本实施例提供了一种未知控制方向的时变多智能体协同控制方法,包括以下步骤:
步骤一、建立由N个跟随者和一个N+1领导者组成的一类控制方向未知的高阶线性时变多智能体系统模型;
以五个由电机驱动的机械手组成的多智能体系统为例,实验系统的环境和架构分别为说明书附图2和说明书附图3所示,整个实验平台由四部分组成,即实时模拟器(RTS)、快速控制原型(RCP)、适配板和主机。
每个追随者的动态模型由下式描述
yi=xi,1,i=1,2,3,4
其中,xi,1,xi,2,xi,3分别代表第i个跟随者的位置、速度、电机电流,ui代表电机电压,Ji,Gi,Ki,1,Ki,2,Ki,3,Ki,4,Qi为正常数,Δ代表外界干扰。
假设1:领导者有一条通往每个跟随者的直接路径。
假设2:领导者的输出yN+1(t)对第j个跟随者时可用的,其中N+1∈Πj,同时xi,1,xi,2,fi,1(xi,1)对于第j个跟随者时可用的,其中i∈Πj。
假设3:对于时变参数gi,k(t),对于t≥0存在正常数gi,min,gi,max使得gi,min≤|gi,k(t)|≤gi,max,其中i=1,...,N,k=1,...,n。
步骤二、针对智能体之间的相互通信关系,通过代数图论建立通讯拓扑结构;
用一个有向图G来描述N+1个多智能体之间的通信拓扑结构,其中包含节点集V={1,...,N+1}和边缘集边(j,i)∈E表示智能体i可以从智能体j获得信息,但是反过来是不成立的。在这种情况下,智能体j被称为智能体i的邻居。节点i的邻居集被表示为Πi={j|(j,i)∈E},从节点i1到节点ik的有向路径为(i1,i2),(i2,i3),...,(ik-1,ik)形成的边序列。与有向图G有关的邻接矩阵其中ai,j>0,,若(j,i)∈E,其他情况下ai,j=0。在此处不允许存在自身边缘集,即ai,i=0。定义拉普拉斯矩阵L=D-A,其中D=diag(d1,...,dN+1)为的内度矩阵。假设领导者没有邻居,其运动独立于追随者,因此拉普拉斯矩阵表示为
步骤三、利用努斯鲍姆函数完成对控制器的设计;
为了处理不确定的控制方向,引入一个努斯鲍姆函数来克服不确定的控制方向带来的困难,努斯鲍姆函数定义如下:
令V(t)和κi(t),(i=1,...,N)分别为光滑的正定函数和光滑函数,它们的初值V(0)和κi(0),i=1,...,N都定义在[0,tf]上。令ki(t)为[0,T)上的一个光滑的努斯鲍姆函数。当下列不等式成立
步骤四、采用有界估计方法结合平滑函数的方法,再利用自适应动态面控制技术,结合步骤一中的系统模型构建获得自适应协同控制器算法。
根据动态面技术,控制器的设计分为三步,并在最后一步得到每个跟随者的空置率ui(i=1,2,3,4),设计步骤如下:
其中
由可知,式的导数满足下式
由杨氏不等式得
则有下式
带入前式可得
带入上式得
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (5)
1.一种未知控制方向的时变多智能体协同控制方法,其特征在于,包括以下步骤:
步骤一、建立由N个跟随者和一个N+1领导者组成的一类控制方向未知的高阶线性时变多智能体系统模型;
步骤二、针对智能体之间的相互通信关系,通过代数图论建立通讯拓扑结构;
步骤三、利用努斯鲍姆函数完成对控制器的设计;
步骤四、采用有界估计方法结合平滑函数的方法,再利用自适应动态面控制技术,结合步骤一中的系统模型构建获得自适应协同控制器算法;
其中,先根据动态面技术将控制器算法设计分为n步,并在最后一步计算获得对每个跟随者的控制率ui,具体步骤如下
S1、设第一个误差面为
则si,1的导数表示为
其中
可知,导数满足
由杨氏不等式得
带入可得
可将上式变为
其中
对其求导,则导数满足下式
其中
则有下式
进一步可得
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210342634.XA CN114609915B (zh) | 2022-04-02 | 2022-04-02 | 一种未知控制方向的时变多智能体协同控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210342634.XA CN114609915B (zh) | 2022-04-02 | 2022-04-02 | 一种未知控制方向的时变多智能体协同控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114609915A CN114609915A (zh) | 2022-06-10 |
CN114609915B true CN114609915B (zh) | 2023-01-31 |
Family
ID=81867529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210342634.XA Active CN114609915B (zh) | 2022-04-02 | 2022-04-02 | 一种未知控制方向的时变多智能体协同控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114609915B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068420A (zh) * | 2015-05-08 | 2015-11-18 | 南昌航空大学 | 一种区间约束的非仿射不确定系统自适应控制方法 |
CN107942685A (zh) * | 2017-12-28 | 2018-04-20 | 广州大学 | 海洋柔性立管系统的抗饱和边界控制方法及装置、存储介质、服务端 |
CN109143859A (zh) * | 2018-08-29 | 2019-01-04 | 首都师范大学 | 一种基于非线性输出反馈系统的自适应一致性控制方法 |
CN109345809A (zh) * | 2018-11-19 | 2019-02-15 | 南京邮电大学 | 太阳能无线采集系统的分布式优化方法 |
CN110262247A (zh) * | 2019-07-05 | 2019-09-20 | 青岛大学 | 多机器人系统的分布式命令滤波模糊控制方法 |
CN111766775A (zh) * | 2020-05-06 | 2020-10-13 | 东北电力大学 | 具有未知饱和pi回滞的非线性系统动态面隐逆控制器 |
CN111766899A (zh) * | 2020-08-11 | 2020-10-13 | 北京航空航天大学 | 一种基于干扰观测器的四旋翼无人机集群抗干扰编队控制方法 |
CN112415895A (zh) * | 2020-11-20 | 2021-02-26 | 南京邮电大学 | 一种多HFVs分布式攻角一致安全控制器 |
CN113485110A (zh) * | 2021-07-13 | 2021-10-08 | 北京理工大学 | 一种输出受限非线性系统分布式自适应最优协同控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7006881B1 (en) * | 1991-12-23 | 2006-02-28 | Steven Hoffberg | Media recording device with remote graphic user interface |
-
2022
- 2022-04-02 CN CN202210342634.XA patent/CN114609915B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068420A (zh) * | 2015-05-08 | 2015-11-18 | 南昌航空大学 | 一种区间约束的非仿射不确定系统自适应控制方法 |
CN107942685A (zh) * | 2017-12-28 | 2018-04-20 | 广州大学 | 海洋柔性立管系统的抗饱和边界控制方法及装置、存储介质、服务端 |
CN109143859A (zh) * | 2018-08-29 | 2019-01-04 | 首都师范大学 | 一种基于非线性输出反馈系统的自适应一致性控制方法 |
CN109345809A (zh) * | 2018-11-19 | 2019-02-15 | 南京邮电大学 | 太阳能无线采集系统的分布式优化方法 |
CN110262247A (zh) * | 2019-07-05 | 2019-09-20 | 青岛大学 | 多机器人系统的分布式命令滤波模糊控制方法 |
CN111766775A (zh) * | 2020-05-06 | 2020-10-13 | 东北电力大学 | 具有未知饱和pi回滞的非线性系统动态面隐逆控制器 |
CN111766899A (zh) * | 2020-08-11 | 2020-10-13 | 北京航空航天大学 | 一种基于干扰观测器的四旋翼无人机集群抗干扰编队控制方法 |
CN112415895A (zh) * | 2020-11-20 | 2021-02-26 | 南京邮电大学 | 一种多HFVs分布式攻角一致安全控制器 |
CN113485110A (zh) * | 2021-07-13 | 2021-10-08 | 北京理工大学 | 一种输出受限非线性系统分布式自适应最优协同控制方法 |
Non-Patent Citations (3)
Title |
---|
Ming Xiao ; Zhitao Liu ; Hongye Su.Distributed Adaptive Cooperative Control for a Class of Nonlinear Multi-Agent Systems with Input Saturation.《2020 15th IEEE Conference on Industrial Electronics and Applications (ICIEA)》.2020, * |
Output-Constrained Control of Nonaffine Multiagent Systems With Partially Unknown Control Directions;Bo Fan etal.;《IEEE Transactions on Automatic Control 》;20191231;第3936-3942页 * |
一类具有未知控制方向的不确定非线性系统自适应控制;杜佳璐等;《Proceedings of the 26th Chinese Control Conference》;20071231;第835-839页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114609915A (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109445447B (zh) | 一种多智能体编队跟踪控制方法及系统 | |
CN108803349B (zh) | 非线性多智能体系统的最优一致性控制方法及系统 | |
CN111531538B (zh) | 一种切换拓扑下的多机械臂系统一致性控制方法及装置 | |
Wu et al. | Distributed adaptive neural network consensus for a class of uncertain nonaffine nonlinear multi-agent systems | |
CN113472242B (zh) | 基于多智能体的抗干扰自适应模糊滑模协同控制方法 | |
CN112305918A (zh) | 超螺旋观测器下的多智能体系统滑模容错一致性控制算法 | |
CN112947086B (zh) | 一种无人机和无人车组成的异构多智能体系统编队控制中执行器故障的自适应补偿方法 | |
CN114237041A (zh) | 一种基于预设性能的空-地协同固定时间容错控制方法 | |
CN114371617A (zh) | 基于脉冲控制的具有切换拓扑结构的多智能体系统的分组一致性控制方法 | |
CN110209053A (zh) | 集群卫星系统的控制器设计方法及控制方法 | |
CN117055605A (zh) | 多无人机姿态控制方法及系统 | |
Wang et al. | Udwadia-Kalaba approach based distributed consensus control for multi-mobile robot systems with communication delays | |
CN114114904B (zh) | 一种有限时间和固定时间分布式事件触发一致性方法 | |
CN111638648A (zh) | 一种具有比例延迟复杂动态网络的分布式脉冲准同步方法 | |
CN114637278A (zh) | 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法 | |
CN114609915B (zh) | 一种未知控制方向的时变多智能体协同控制方法 | |
CN112198796A (zh) | 一种分布式前置时间状态观测器的设计方法 | |
CN116700300A (zh) | 一种多auv分布式集群的鲁棒自适应一致性控制方法 | |
CN116382313A (zh) | 一种考虑通信受限的auh协同编队控制方法 | |
CN116449703A (zh) | 一种有限时间框架下的auh编队协同控制方法 | |
CN114637301B (zh) | 基于最优仿射队形变换的多机器人动态避障装置及方法 | |
CN114200830B (zh) | 一种多智能体一致性强化学习控制方法 | |
CN112327622B (zh) | 一种中性浮力机器人一致性容错控制方法 | |
CN113359626B (zh) | 一种多机器人系统的有限时间分层控制的方法 | |
CN111216146B (zh) | 一种适用于网络化机器人系统的二部一致性量化控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |