CN114167728B - 带有死区约束的多智能体系统的自适应控制方法及装置 - Google Patents

带有死区约束的多智能体系统的自适应控制方法及装置 Download PDF

Info

Publication number
CN114167728B
CN114167728B CN202111494314.8A CN202111494314A CN114167728B CN 114167728 B CN114167728 B CN 114167728B CN 202111494314 A CN202111494314 A CN 202111494314A CN 114167728 B CN114167728 B CN 114167728B
Authority
CN
China
Prior art keywords
agent
dead zone
follower
representing
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111494314.8A
Other languages
English (en)
Other versions
CN114167728A (zh
Inventor
黄成杰
谢胜利
刘治
陈辞
谢侃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202111494314.8A priority Critical patent/CN114167728B/zh
Publication of CN114167728A publication Critical patent/CN114167728A/zh
Application granted granted Critical
Publication of CN114167728B publication Critical patent/CN114167728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提出一种带有死区约束的多智能体系统的自适应控制方法及装置,包括建立多智能体系统,包括跟随者智能体的系统模型、领导者智能体的系统模型和执行器。建立执行器的死区逆模型。建立多智能体系统的误差函数。设计多智能体系统的控制系统。将所设计的控制系统输出的控制信号输入到多智能体系统中,控制信号先经过执行器的死区逆模型转换再经过死区,消除死区约束的影响,同时将误差函数收敛趋向于零,使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出,让死区的影响可以忽略不计,保证了多智能体系统的稳定性和一致性。

Description

带有死区约束的多智能体系统的自适应控制方法及装置
技术领域
本发明涉及智能体控制领域,更具体地,涉及一种带有死区约束的多智能体系统的自适应控制方法及装置。
背景技术
多智能体系统是由一群具备一定感知、通信、计算和执行能力的智能体通过通信等方式关联成的一个网络系统,智能体指任何能通过传感器感知环境和通过执行器作用于环境的实体。近年来,工业自动化不断发展,系统的集成度、通信方式、互联方式等都在以复杂的趋势变化。因此,对于复杂系统的理论研究显得至关重要。多智能体的一致性控制问题是近年来控制科学领域中最受到关注的问题之一。一致性是指随着时间的增大,多智能体系统中的所有个体的状态都趋于一个相同的值。
现有一种非线性多智能体系统的最优一致性控制方法,先根据异构多智能体系统各个体动力学特性,建立参考行为模型,采用领导者—跟随者的控制模式,形成以参考行为模型为个体组成的多智能体系统;然后根据多智能体的网络拓扑结构,构建动态图型博弈全局误差动力学模型,定义多智能体局部性能指标函数,根据全局纳什均衡,可得贝尔曼最优方程;再在仅利用智能体局部信息条件下,采用基于值函数逼近的执行—评价执行网络框架的方式,在线迭代学习获得最优一致性协议,实现各参考模型行为的一致性。本发明相对现有技术,在保证最优控制性能下,解决复杂多智能体系统的一致性问题。
然而,上述方法忽略了多智能体系统中跟随者智能体受到的死区约束的干扰,不能保证多智能体系统的稳定性和一致性。
发明内容
本发明为补偿每个跟随者智能体受到的死区约束,解决多智能体系统一致性问题。
为解决上述技术问题,本发明的技术方案如下:
第一个方面,本发明提出一种带有死区约束的多智能体系统的自适应控制方法,包括:
建立多智能体系统,包括跟随者智能体的系统模型、领导者智能体的系统模型和执行器;
建立所述执行器的死区逆模型;
建立多智能体系统的误差函数,所述误差函数包括第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差,以及第i个跟随者智能体第k阶状态与虚拟控制器之间的误差;
设计多智能体系统的控制系统,将所设计的控制系统输出的控制信号输入到多智能体系统中,执行器接收控制信号,控制信号先经过执行器的死区逆模型转换再经过死区,消除死区约束的影响,同时将误差函数收敛趋向于零,使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出。
优选地,对于第i个跟随者智能体,建立如下的系统模型:
Figure GDA0003988802680000011
Figure GDA0003988802680000012
yi=xi,1
ui=DZ(vi)
其中,
Figure GDA0003988802680000021
表示第i个跟随者智能体第k阶状态的导数,k为系统状态变量的阶数;
Figure GDA0003988802680000022
表示第i个跟随者智能体第ni阶状态的导数,ni表示第i个跟随者智能体的系统阶数;
Figure GDA0003988802680000023
表示系统的状态变量;ψi,k(·)和
Figure GDA00039888026800000214
(·)为系统模型中未知的光滑函数;yi表示系统输出;ui表示控制输入。
优选地,对于领导者智能体,建立如下的系统模型:
Figure GDA0003988802680000024
y0=x0
其中,y0表示领导者智能体的输出;x0表示领导者智能体的状态,
Figure GDA00039888026800000215
表示领导者智能体状态的导数,f0表示已知的动态函数,t表示时间。
优选地,所述死区逆模型DI表示为:
Figure GDA0003988802680000025
其中,ui,d表示实际的控制输入;mi,l表示死区模型的左斜率,mi,r表示死区模型的右斜率;bi,l和bi,r表示死区逆模型的断点;ρi,l和ρi,r表示死区逆模型的有界函数,其公式如下所示:
Figure GDA0003988802680000026
Figure GDA0003988802680000027
其中,κ为可选取的常数参数。
优选地,建立基于神经网络的函数逼近器,用于处理多智能体系统控制过程中面临的非线性未知函数;所述基于神经网络的函数逼近器的定义如下:
Figure GDA0003988802680000028
其中,Fi,k(Z)为未知函数,
Figure GDA0003988802680000029
为理想的权重矩阵,φi,k为高斯型径向基函数,∈i,k(Z)为神经网络近似误差;
符号
Figure GDA00039888026800000210
和神经网络径向基函数Φi,k(Z)的定义如下:
Figure GDA00039888026800000211
Figure GDA00039888026800000212
其中,mi,k表示矩阵中k个含0个数,
Figure GDA00039888026800000216
表示矩阵中ni个含0个数。
优选地,所述第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差si,1表示为:
Figure GDA00039888026800000213
其中,aij≥0表示第i个跟随者智能体能够获取到第j个跟随者智能体的信息,即他们之间有通信拓扑;bi≥0表示第i个跟随者智能体能够获取到领导者智能体的信息;yj表示第j个跟随者智能体的输出。
优选地,第i个跟随者智能体的第k个虚拟控制器表示为:
Figure GDA0003988802680000031
其中,
Figure GDA0003988802680000032
Figure GDA00039888026800000315
ci,k,δi,k,δi,k+1,ri,k和li为设计的参数;Φi,ki,k)为神经网络的径向基函数向量,且χi,k=[xi,1,xi,2,...,xi,k,xj,1,xj,2,...,xj,k,y0]T
Figure GDA0003988802680000033
为多智能体系统的自适应参数;
Figure GDA0003988802680000034
为多智能体系统拓扑的入度矩阵;si,k为第i个智能体的第k阶状态与虚拟控制器之间的误差;αi,l-1为第l-1个虚拟控制器;ωi,k为设定函数,τi,k为调和函数;sgi,k(·)和fi,k(·)为一系列的光滑函数,其表示如下:
Figure GDA0003988802680000035
Figure GDA0003988802680000036
优选地,第i个跟随者智能体实际控制器表示为:
Figure GDA0003988802680000037
Figure GDA0003988802680000038
Figure GDA0003988802680000039
Figure GDA00039888026800000310
其中,
Figure GDA00039888026800000311
Figure GDA00039888026800000312
Figure GDA00039888026800000316
Figure GDA00039888026800000313
Figure GDA00039888026800000317
li
Figure GDA00039888026800000319
,Γi为设计的参数;
Figure GDA00039888026800000318
为神经网络的径向基函数向量;
Figure GDA0003988802680000041
为多智能体系统的自适应参数;
Figure GDA0003988802680000042
为设定输入参数矩阵;
Figure GDA0003988802680000044
为设定函数,
Figure GDA0003988802680000045
为调和函数,ρr(v)、ρl(v)、ρr(t)和ρl(v)为有界函数。
优选地,所述第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差si,1表示为:
Figure GDA0003988802680000043
其中,aij≥0表示第i个跟随者智能体能够获取到第j个跟随者智能体的信息,即他们之间有通信拓扑;bi≥0表示第i个跟随者智能体能够获取到领导者智能体的信息;yj表示第j个跟随者智能体的输出。
优选地,第i个跟随者智能体第k阶状态与虚拟控制器之间的误差si,k表示为:
si,k=xi,ki,k-1
其中,αi,k-1表示第i个跟随者智能体的第k-1个虚拟控制器。
第二个方面,本发明还提出一种带有死区约束的多智能体系统的自适应控制装置,应用于上述任一方案所述的带有死区约束的多智能体系统的自适应控制方法,包括:
多智能体系统,包括跟随者智能体的系统模型和领导者智能体的系统模型和执行器;
死区约束补偿模块,包括执行器的死区逆模型,用于补偿跟随者智能体受到的死区约束;
控制模块,包括跟随者智能体的虚拟控制器和实际控制器,用于控制跟随者智能体的输出能够跟踪领导者智能体的输出;
误差计算模块,用于计算多智能体系统中跟随者智能体第一阶状态与领导者智能体输出之间的误差,以及跟随者智能体第k阶状态与虚拟控制器之间的误差。
与现有技术相比,本发明技术方案的有益效果是:通过建立执行器的死区逆模型,补偿跟随者智能体受到的死区约束,使得控制信号先经过执行器的死区逆模型转换再经过死区约束,最终消除死区约束的干扰,让死区的影响可以忽略不计,保证了多智能体系统的稳定性和一致性。
附图说明
图1为带有死区约束的多智能体系统的自适应控制方法的流程图。
图2为执行器死区补偿机制的原理图。
图3为死区逆模型的仿真图。
图4为多智能体系统的拓扑图。
图5为领导者智能体以及四个跟随者智能体的输出轨迹图。
图6为四个跟随者智能体的第2阶状态轨迹曲线图。
图7为四个跟随者智能体的跟踪误差曲线图。
图8为带有死区约束的多智能体系统的自适应控制装置的原理图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
请参阅图1-图2,本实施例提出一种带有死区约束的多智能体系统的自适应控制方法,包括:
建立多智能体系统,包括跟随者智能体的系统模型和领导者智能体的系统模型。
在所述多智能体系统中建立其执行器的死区逆模型;
建立多智能体系统的误差函数,所述误差函数包括第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差,以及第i个跟随者智能体第k阶状态与虚拟控制器之间的误差。
设计多智能体系统的控制系统;
将所设计的控制系统输出的控制信号输入到多智能体系统中,执行器接收控制信号,控制信号先经过执行器的死区逆模型转换再经过死区,消除死区约束的影响。同时将误差函数收敛趋向于零,使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出。如图2所示,图2为执行器死区补偿机制的原理图,智能体是任何能通过传感器感知环境和通过执行器作用于环境的实体,在具体实施过程中,通过建立执行器的死区逆模型,补偿跟随者智能体受到的死区约束,使得控制信号先经过执行器的死区逆模型转换再经过死区约束,最终消除死区约束的干扰,让死区的影响可以忽略不计,将所设计的控制系统以及相应的自适应律输入到多智能体系统中,将误差函数收敛趋向于零,使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出,保证了多智能体系统的稳定性和一致性。
实施例2
本实施例提出一种带有死区约束的多智能体系统的自适应控制方法,包括:
建立多智能体系统,包括跟随者智能体的系统模型、领导者智能体的系统模型和执行器。
本实施例中,对于第i个跟随者智能体,建立如下的系统模型:
Figure GDA0003988802680000051
Figure GDA0003988802680000052
yi=xi,1
ui=DZ(vi)
其中,
Figure GDA0003988802680000053
表示第i个跟随者智能体第k阶状态的导数,k为系统状态变量的阶数;
Figure GDA0003988802680000054
表示第i个跟随者智能体第ni阶状态的导数,ni表示第i个跟随者智能体的系统阶数;
Figure GDA0003988802680000055
表示系统的状态变量;ψi,k(·)和
Figure GDA0003988802680000056
(·)为系统模型中未知的光滑函数;yi表示系统输出;ui表示控制输入。
本实施例中,对于领导者智能体,建立如下的系统模型:
Figure GDA0003988802680000057
y0=x0
其中,y0表示领导者智能体的输出;x0表示领导者智能体的状态,
Figure GDA0003988802680000058
表示领导者智能体状态的导数,f0表示已知的动态函数,t表示时间。
建立所述执行器的死区逆模型。
本实施例中,建立的死区逆模型DI表示为:
Figure GDA0003988802680000059
其中,ui,d表示实际的控制输入;mi,l表示死区模型的左斜率,mi,r表示死区模型的右斜率;bi,l和bi,r表示死区逆模型的断点;ρi,l和ρi,r表示死区逆模型的有界函数,其公式如下所示:
Figure GDA0003988802680000061
Figure GDA0003988802680000062
其中,κ为可选取的常数参数。
如图3所示,图3为死区逆模型的仿真图,从图3可以看出,构建的死区逆模型为理想的逆模型,因此本实施例的补偿方法能够有效解决死区执行器对系统的影响。
建立基于神经网络的的函数逼近器,用于处理系统控制过程中面临的非线性未知函数。
本实施例中,基于神经网络的的函数逼近器定义如下:
Figure GDA0003988802680000063
其中,Fi,k(Z)为未知函数,
Figure GDA0003988802680000064
为理想的权重矩阵,φi,k为高斯型径向基函数,∈i,k(Z)为神经网络近似误差;
符号
Figure GDA0003988802680000065
和神经网络径向基函数Φi,k(Z)的定义如下:
Figure GDA0003988802680000066
Figure GDA0003988802680000067
其中,mi,k表示矩阵中k个含0个数,
Figure GDA0003988802680000068
表示矩阵中ni个含0个数。
本实施例利用神经网络来处理系统机构的未知性,也将多智能体系统的类型扩展到非严格反馈的非线性系统,给许多现实非严格反馈的多智能体系统一致性提供了方法和理论依据。
建立多智能体系统的误差函数,所述误差函数包括第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差,以及第i个跟随者智能体第k阶状态与虚拟控制器之间的误差。
本实施例中,第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差si,1表示为:
Figure GDA0003988802680000069
其中,aij≥0表示第i个跟随者智能体能够获取到第j个跟随者智能体的信息,即他们之间有通信拓扑;bi≥0表示第i个跟随者智能体能够获取到领导者智能体的信息;yj表示第j个跟随者智能体的输出。
本实施例中,第i个跟随者智能体第k阶状态与虚拟控制器之间的误差si,k表示为:
si,k=xi,ki,k-1
其中,αi,k-1表示第i个跟随者智能体的第k-1个虚拟控制器。
设计多智能体系统的控制系统,所述控制系统包括跟随者智能体的虚拟控制器和实际控制器。本实施例设计的虚拟控制器能够保证每一步设计的跟随者智能体能够稳定运行,每一个误差能够收敛;实际控制器能够保证整个跟随者智能体系统和领导者智能体系统稳定。
本实施例中,跟随者智能体的第k个虚拟控制器表示为:
Figure GDA0003988802680000071
其中,
Figure GDA0003988802680000072
Figure GDA0003988802680000073
ci,k,δi,k,δi,k+1,ri,k和li为设计的参数;Φi,ki,k)为神经网络的径向基函数向量,且χi,k=[xi,1,xi,2,...,xi,k,xj,1,xj,2,...,xj,k,y0]T
Figure GDA0003988802680000074
为多智能体系统的自适应参数;
Figure GDA0003988802680000075
为多智能体系统拓扑的入度矩阵;si,k为第i个智能体的第k阶状态与虚拟控制器之间的误差;αi,l-1为第l-1个虚拟控制器;ωi,k为设定函数,τi,k为调和函数;sgi,k(·)和fi,k(·)为一系列的光滑函数,其表示如下:
Figure GDA0003988802680000076
Figure GDA0003988802680000077
本实施例分别列举了第i个跟随者智能体的第一个虚拟控制器和第二个虚拟控制器:
第i个跟随者智能体的第一个虚拟控制器表示为:
Figure GDA0003988802680000078
其中,
Figure GDA0003988802680000079
ci,1,δi,1,ri,1是设计参数,在设计过程中进行选择;Φi,1i,1)是神经网络的径向基函数向量,且χi,1=[xi,1,xj,1,y0]T
Figure GDA00039888026800000710
是系统的自适应参数;
Figure GDA00039888026800000711
为多智能体系统拓扑的入度矩阵;si,1为第i个智能体的第一阶状态与领导者智能体输出的误差。
第i个跟随者智能体的第二个虚拟控制器表示为:
Figure GDA00039888026800000712
其中,
Figure GDA00039888026800000713
Figure GDA0003988802680000081
ci,2,δi,2,δi,3,ri,2,li是设计参数,在设计过程中进行选择;Φi,2i,2)是神经网络的径向基函数向量,且χi,2=[xi,1,xi,2,xj,1,xj,2,y0]T
Figure GDA0003988802680000082
是系统的自适应参数;
Figure GDA0003988802680000083
为多智能体系统拓扑的入度矩阵;si,2为第i个智能体的第二阶状态与虚拟控制器之间的误差。
本实施例中,所述跟随者智能体实际控制器表示为:
Figure GDA0003988802680000084
Figure GDA0003988802680000085
Figure GDA0003988802680000086
Figure GDA0003988802680000087
其中,
Figure GDA0003988802680000088
Figure GDA0003988802680000089
Figure GDA00039888026800000810
Figure GDA00039888026800000811
Figure GDA00039888026800000817
li
Figure GDA00039888026800000820
,Γi为设计的参数;
Figure GDA00039888026800000813
为神经网络的径向基函数向量;
Figure GDA00039888026800000814
为多智能体系统的自适应参数;
Figure GDA00039888026800000815
为设定输入参数矩阵;
Figure GDA00039888026800000818
为设定函数,
Figure GDA00039888026800000819
为调和函数,ρr(v)、ρl(v)、ρr(t)和ρl(v)为有界函数。
本实施例通过建立一系列的控制器作用于多智能体系统,解决误差函数的收敛问题。更具体地说,误差函数中包含了多个误差函数,每个跟随者智能体和领导者智能体之间的误差趋于零或者在零附近的小区间,那么就等同于多智能体系统的共识跟踪得以实现。
本实施例针对待涉及的多智能系统,利用图论,构建相应的拓扑。如图4所示,图4为多智能体系统的拓扑图,在拓扑图中每一个节点相当于智能体,能个智能体能获取的彼此之间的信息是有限的。根据反推法的思想,将每个智能体系统切分成n个子系统,再依次为每个子系统设计相应的虚拟控制器,反推到最后一个子系统,能够设计出该智能体的实际控制器输入。将所设计的控制器以及自适应律输入到多智能体系统,系统中的每个跟随者智能体能够跟踪领导者智能体的运动轨迹。
本实施例对上述带有死区约束的多智能体系统的自适应控制方法进行仿真验证:
给定多智能体系统的数学模型:
Figure GDA00039888026800000816
Figure GDA0003988802680000091
仿真结果如图5-图7所示,图5为领导者智能体以及四个跟随者智能体的输出轨迹图,从图5可以看出,四个跟随者智能体能够跟踪上领导者智能体并实现同步;图6为四个跟随者智能体的第2阶状态轨迹曲线图;图7为四个跟随者智能体的跟踪误差曲线图,通过图7可以看出,在设计的控制算法下,多智能体的跟踪误差收敛,从而实现多智能体的同步。
实施例3
请参阅图8,本实施例提出一种带有死区约束的多智能体系统的自适应控制装置,应用于上述实施例提出的带有死区约束的多智能体系统的自适应控制方法,包括:多智能体系统、死区约束补偿模块、控制模块和误差计算模块。
所述多智能体系统包括跟随者智能体的系统模型、领导者智能体的系统模型和执行器。
所述死区约束补偿模块包括执行器的死区逆模型,用于补偿跟随者智能体受到的死区约束;
所述控制模块,包括跟随者智能体的虚拟控制器和实际控制器,用于控制跟随者智能体的输出能够跟踪领导者智能体的输出;虚拟控制器能够保证每一步设计的跟随者智能体能够稳定运行,每一个误差能够收敛;实际控制器能够保证整个跟随者智能体系统和领导者智能体系统稳定。
所述误差计算模块,用于计算多智能体系统中跟随者智能体第一阶状态与领导者智能体输出之间的误差,以及跟随者智能体第k阶状态与虚拟控制器之间的误差。
在具体实施过程中,控制模块输出的控制信号输入到多智能体系统中,执行器接收控制信号;控制信号先经过死区约束补偿模块中的执行器的死区逆模型,使得控制信号先经过执行器的死区逆模型转换再经过死区约束,最终消除死区约束的干扰,补偿跟随者智能体受到的死区约束,让死区的影响可以忽略不计,将误差计算模块中跟随者智能体第一阶状态与领导者智能体输出之间的误差,以及跟随者智能体第k阶状态与虚拟控制器之间的误差收敛趋向于零,使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出,保证了多智能体系统的稳定性和一致性。
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (9)

1.带有死区约束的多智能体系统的自适应控制方法,其特征在于,包括:
建立多智能体系统,包括跟随者智能体的系统模型、领导者智能体的系统模型和执行器;
建立所述执行器的死区逆模型;所述死区逆模型DI表示为:
Figure FDA0003988802670000011
其中,ui,d表示实际的控制输入;mi,l表示死区模型的左斜率,mi,r表示死区模型的右斜率;bi,l和bi,r表示死区逆模型的断点;ρi,l和ρi,r表示死区逆模型的有界函数,其公式如下所示:
Figure FDA0003988802670000012
Figure FDA0003988802670000013
其中,κ为可选取的常数参数;
建立多智能体系统的误差函数,所述误差函数包括第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差,以及第i个跟随者智能体第k阶状态与虚拟控制器之间的误差;
设计多智能体系统的控制系统;
将所设计的控制系统输出的控制信号输入到多智能体系统中,执行器接收控制信号,控制信号先经过执行器的死区逆模型转换再经过死区,消除死区约束的影响,同时将误差函数收敛趋向于零,使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出。
2.根据权利要求1所述的带有死区约束的多智能体系统的自适应控制方法,其特征在于,对于第i个跟随者智能体,建立如下的系统模型:
Figure FDA0003988802670000014
Figure FDA0003988802670000015
yi=xi,1
ui=DZ(vi)
其中,
Figure FDA0003988802670000016
表示第i个跟随者智能体第k阶状态的导数,k为系统状态变量的阶数;
Figure FDA0003988802670000017
表示第i个跟随者智能体第ni阶状态的导数,ni表示第i个跟随者智能体的系统阶数;
Figure FDA0003988802670000018
表示系统的状态变量;ψi,k(·)和
Figure FDA0003988802670000019
(·)为系统模型中未知的光滑函数;yi表示系统输出;ui表示控制输入。
3.根据权利要求1所述的带有死区约束的多智能体系统的自适应控制方法,其特征在于,对于领导者智能体,建立如下的系统模型:
Figure FDA00039888026700000110
y0=x 0
其中,y0表示领导者智能体的输出;x0表示领导者智能体的状态,
Figure FDA00039888026700000111
表示领导者智能体状态的导数,f0表示已知的动态函数,t表示时间。
4.根据权利要求1-3任一项所述的带有死区约束的多智能体系统的自适应控制方法,其特征在于,建立基于神经网络的函数逼近器,用于处理多智能体系统控制过程中面临的非线性未知函数;所述基于神经网络的函数逼近器的定义如下:
Figure FDA0003988802670000021
其中,Fi,k(Z)为未知函数,
Figure FDA0003988802670000022
为理想的权重矩阵,φi,k为高斯型径向基函数,∈i,k(Z)为神经网络近似误差;
符号
Figure FDA0003988802670000023
和神经网络径向基函数Φi,k()的定义如下:
Figure FDA0003988802670000024
Figure FDA0003988802670000025
其中,mi,k表示矩阵中k个含0个数,mi,ni表示矩阵中ni个含0个数。
5.根据权利要求4所述的带有死区约束的多智能体系统的自适应控制方法,其特征在于,所述控制系统包括虚拟控制器和实际控制器,第i个跟随者智能体的第k个虚拟控制器表示为:
Figure FDA0003988802670000026
其中,
Figure FDA0003988802670000027
Figure FDA0003988802670000028
ci,k,δi,k,δi,k+1,ri,k
Figure FDA0003988802670000029
为设计的参数;Φi,ki,k)为神经网络的径向基函数向量,且χi,k=[xi,1,xi,2,...,xi,k,xj,1,xj,2,...,xj,k,y0]T
Figure FDA00039888026700000210
为多智能体系统的自适应参数;
Figure FDA00039888026700000211
为多智能体系统拓扑的入度矩阵;si,k为第i个智能体的第k阶状态与虚拟控制器之间的误差;αi,l-1为第l-1个虚拟控制器;ωi,k为设定函数,τi,k为调和函数;sgi,k(·)和fi,k(·)为一系列的光滑函数,y0表示领导者智能体的输出,其表示如下:
Figure FDA00039888026700000212
Figure FDA00039888026700000213
6.根据权利要求5所述的带有死区约束的多智能体系统的自适应控制方法,其特征在于,第i个跟随者智能体实际控制器表示为:
Figure FDA0003988802670000031
Figure FDA0003988802670000032
Figure FDA0003988802670000033
Figure FDA0003988802670000034
其中,
Figure FDA0003988802670000035
Figure FDA0003988802670000036
Figure FDA0003988802670000037
Figure FDA0003988802670000038
Figure FDA0003988802670000039
Γi为设计的参数;
Figure FDA00039888026700000310
为神经网络的径向基函数向量;
Figure FDA00039888026700000311
为多智能体系统的自适应参数;
Figure FDA00039888026700000312
为设定输入参数矩阵;
Figure FDA00039888026700000313
为设定函数,
Figure FDA00039888026700000314
为调和函数,ρr(v)、ρl(v)、ρr(t)和ρl(v)为有界函数。
7.根据权利要求5所述的带有死区约束的多智能体系统的自适应控制方法,其特征在于,所述第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差si,1表示为:
Figure FDA00039888026700000315
其中,aij≥0表示第i个跟随者智能体能够获取到第j个跟随者智能体的信息,即他们之间有通信拓扑;bi≥0表示第i个跟随者智能体能够获取到领导者智能体的信息;yj表示第j个跟随者智能体的输出。
8.根据权利要求5所述的带有死区约束的多智能体系统的自适应控制方法,其特征在于,第i个跟随者智能体第k阶状态与虚拟控制器之间的误差si,k表示为:
si,k=xi,ki,k-1
其中,αi,k-1表示第i个跟随者智能体的第k-1个虚拟控制器。
9.带有死区约束的多智能体系统的自适应控制装置,应用于如权利要求1-8任一项所述的带有死区约束的多智能体系统的自适应控制方法,其特征在于,包括:
多智能体系统,包括跟随者智能体的系统模型和领导者智能体的系统模型和执行器;
死区约束补偿模块,包括执行器的死区逆模型,用于补偿跟随者智能体受到的死区约束;
控制模块,包括跟随者智能体的虚拟控制器和实际控制器,用于控制跟随者智能体的输出能够跟踪领导者智能体的输出;
误差计算模块,用于计算多智能体系统中跟随者智能体第一阶状态与领导者智能体输出之间的误差,以及跟随者智能体第k阶状态与虚拟控制器之间的误差。
CN202111494314.8A 2021-12-08 2021-12-08 带有死区约束的多智能体系统的自适应控制方法及装置 Active CN114167728B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111494314.8A CN114167728B (zh) 2021-12-08 2021-12-08 带有死区约束的多智能体系统的自适应控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111494314.8A CN114167728B (zh) 2021-12-08 2021-12-08 带有死区约束的多智能体系统的自适应控制方法及装置

Publications (2)

Publication Number Publication Date
CN114167728A CN114167728A (zh) 2022-03-11
CN114167728B true CN114167728B (zh) 2023-01-31

Family

ID=80484583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111494314.8A Active CN114167728B (zh) 2021-12-08 2021-12-08 带有死区约束的多智能体系统的自适应控制方法及装置

Country Status (1)

Country Link
CN (1) CN114167728B (zh)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4918148B2 (ja) * 2010-03-05 2012-04-18 本田技研工業株式会社 車両の運動制御装置
CN104614994B (zh) * 2015-02-11 2017-04-19 南京理工大学 一种含输入死区的非线性系统鲁棒自适应控制方法
CN105204343B (zh) * 2015-10-13 2018-05-15 淮阴工学院 具有输出约束和死区输入的纳米机电系统backstepping控制方法
CN106444368A (zh) * 2015-11-18 2017-02-22 南京航空航天大学 具有输入非线性的近空间飞行器预设性能姿态跟踪控制方法
CN106505909B (zh) * 2016-11-17 2018-09-18 闽江学院 一种超声波电机非线性死区补偿控制系统及方法
CN106773688A (zh) * 2016-12-13 2017-05-31 广东工业大学 一种直接自适应控制方法及装置
CN110456646B (zh) * 2019-08-23 2021-01-29 中国矿业大学 基于ekf的锚杆钻机钻臂摆角自适应滑模控制系统设计方法
CN110673472B (zh) * 2019-09-09 2022-06-28 南京理工大学 基于神经网络补偿死区反演误差的自适应鲁棒控制方法
CN110928185B (zh) * 2019-11-22 2022-07-05 广东工业大学 一种多智能体系统的量化控制方法
CN112947375B (zh) * 2021-02-09 2023-08-25 大连海事大学 一种考虑未知死区的复合自适应容错控制器设计方法
CN113741469A (zh) * 2021-09-09 2021-12-03 曲阜师范大学 一种用于机电系统含预定性能和死区输入约束的输出反馈轨迹跟踪控制方法

Also Published As

Publication number Publication date
CN114167728A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
Chen et al. Generalized Hamilton–Jacobi–Bellman formulation-based neural network control of affine nonlinear discrete-time systems
CN111580392B (zh) 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法
Atkeson et al. Robot trajectory learning through practice
Qi et al. Stable indirect adaptive control based on discrete-time T–S fuzzy model
Agarwal Combining neural and conventional paradigms for modelling, prediction and control
CN111897224B (zh) 基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法
Lian et al. Online inverse reinforcement learning for nonlinear systems with adversarial attacks
CN112405542B (zh) 基于脑启发多任务学习的肌肉骨骼机器人控制方法及系统
Kosmatopoulos Control of unknown nonlinear systems with efficient transient performance using concurrent exploitation and exploration
CN113276114B (zh) 一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法
CN114167728B (zh) 带有死区约束的多智能体系统的自适应控制方法及装置
Van Tran et al. Artificial chemical reaction optimization algorithm and neural network based adaptive control for robot manipulator
Chovan et al. Neural network architecture for process control based on the RTRL algorithm
Su et al. Developing the Automatic Control System Based on Neural Controller
Chowdhury A new approach to real‐time training of dynamic neural networks
CN110119085A (zh) 一种Manutec R3型工业机器人动态优化系统
JP2980421B2 (ja) ニューラルネット・モデルを用いた制御器
JPH07168605A (ja) システム同定装置
Deshpande et al. Data Efficient Behavior Cloning for Fine Manipulation via Continuity-based Corrective Labels
Que et al. Two-Time Scale Tracking Control of Flexible Robots With Primal-Dual Inverse Reinforcement Learning
Guo et al. ELSS-DZN and ELSS-IFDHGZN Algorithms Solving Future Quadratic Programming Applied to Robot Manipulator
Peng et al. Practical consensus tracking control for networked Euler–Lagrange systems based on UDE integrated with RBF neural network
Hwang Globally fuzzy model based adaptive variable structure control for a class of nonlinear time-varying systems
Parsi Closed-loop design strategies for robust and adaptive model predictive controllers
Wang et al. Adaptive fault-tolerant control for uncalibrated camera-robot system with multiple uncertainties

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant