CN114509948B - 一种高阶多智能体系统状态约束量化控制器的构建方法 - Google Patents

一种高阶多智能体系统状态约束量化控制器的构建方法 Download PDF

Info

Publication number
CN114509948B
CN114509948B CN202210154910.XA CN202210154910A CN114509948B CN 114509948 B CN114509948 B CN 114509948B CN 202210154910 A CN202210154910 A CN 202210154910A CN 114509948 B CN114509948 B CN 114509948B
Authority
CN
China
Prior art keywords
agent
agent system
hysteresis
order
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210154910.XA
Other languages
English (en)
Other versions
CN114509948A (zh
Inventor
祝国强
李昊齐
张秀宇
孙灵芳
王建国
李志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeast Electric Power University
Original Assignee
Northeast Dianli University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeast Dianli University filed Critical Northeast Dianli University
Priority to CN202210154910.XA priority Critical patent/CN114509948B/zh
Publication of CN114509948A publication Critical patent/CN114509948A/zh
Application granted granted Critical
Publication of CN114509948B publication Critical patent/CN114509948B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开高阶多智能体系统状态约束量化控制器的构建方法,包括以下步骤:构建构建高阶非线性多智能体系统模型,其中,所述高阶非线性多智能体系统含有输入迟滞和全状态约束;根据所述输入迟滞,构建迟滞非线性模型,基于所述迟滞非线性模型,构建相应的逆迟滞模型;基于所述高阶非线性多智能体系统模型,对高阶非线性多智能体系统的全部状态进行约束;将自适应控制方法和反步法相结合,基于所述逆迟滞模型,构建高阶多智能体系统状态约束量化控制器。本发明在高阶多智能体系统存在参数不确定和外部扰动的基础上,采用自适应一致控制方法,具有更好的跟踪性能,提高了控制器的鲁棒性,保证闭环系统内的所有信号半全局一致最终有界。

Description

一种高阶多智能体系统状态约束量化控制器的构建方法
技术领域
本发明涉及多智能体系统控制领域,特别是涉及一种高阶多智能体系统状态约束量化控制器的构建方法。
背景技术
智能体概念的产生来源于早期人们对人工智能领域的研究,由“智能体”来代替人类完成复杂危险的工作是其被提出的重要原因。很多物理实体如传感器、执行器、机器人、无人机等都可以看作是一个智能体,其中的每个个体都具有一定的自主能力,包括一定程度的自我运动控制、局部范围内的信息传感、处理和通信能力等。但是随着智能体理论的发展,人们发现单个智能体能完成的任务实在有限,便开始寻找能够解决单智能体系统缺点的方法,很快人们便从“群体行为”这一自然界中常见的现象中获得了灵感,典型的例子如编队迁徙的鸟群、结队巡游的鱼群、协同工作的蚁群、聚集而生的细菌群落等,其共同特征是一定数量的自主个体通过相互合作和自组织,在集体层面上呈现出有序的协同运动和行为。多智能体据此应运而生,通过将多个单智能体相结合使其协同工作的方式进而弥补单智能体在某些场景下的能力不足问题。
实际情况下,多智能体系统会更加复杂,其控制方法现如今大多关注于一、二阶系统,对于模型具有不确定项和外部干扰的高阶多智能体系统研究较少;多智能体系统的研究考虑迟滞非线性和状态受限的情况较少,而在现实环境内经常会遇到这类问题;智能体之间的大量数据交换可能会增加系统的通信负担。
因此,需要对多智能体系统迟滞非线性和状态受限进行约束量化,并且降低智能体之间的大量数据交换的通信负担。
发明内容
本发明的目的是提供一种高阶多智能体系统状态约束量化控制器的构建方法,以解决上述现有技术存在的问题,在高阶多智能体系统存在参数不确定和外部扰动的基础上,采用自适应一致控制方法,具有更好的跟踪性能,提高了控制器的鲁棒性,保证闭环系统内的所有信号半全局一致最终有界。
为实现上述目的,本发明提供了如下方案:本发明提供一种高阶多智能体系统状态约束量化控制器的构建方法,包括以下步骤:
构建高阶非线性多智能体系统模型,其中,所述高阶非线性多智能体系统含有输入迟滞和全状态约束;
根据所述输入迟滞,构建迟滞非线性模型,基于所述迟滞非线性模型,构建相应的逆迟滞模型;
基于所述高阶非线性多智能体系统模型,对高阶非线性多智能体系统的全部状态进行约束;
将自适应控制方法和反步法相结合,基于所述逆迟滞模型,构建高阶多智能体系统状态约束量化控制器。
可选地,所述高阶非线性多智能体系统模型表示为:
Figure BDA0003512041630000021
其中,i表示多智能体的个数;xi为第i个智能体的状态;
Figure BDA0003512041630000022
为对应状态的导数;yi为第i个智能体的输出;ui为第i个智能体的迟滞输入,B(·)为迟滞特性函数,vi为系统的实际输入;I为状态系数矩阵;Di为增益矩阵;
Figure BDA0003512041630000023
为未知非线性函数。
可选地,所述迟滞非线性模型为:
ui=B(vi)=Φi1vii2χi1,i=1,…,N,
其中,ui为第i个智能体的迟滞输入,Φj1与Φi2是具有相同符号的常数;χi1为第i个智能体的迟滞特性辅助变量,vi为输入信号。
可选地,所述逆迟滞模型为:
Figure BDA0003512041630000024
i=1,…,N,
其中,vi为输入信号,
Figure BDA0003512041630000027
为需要设计的控制信号,χi2为逆迟滞特性辅助变量,Φi1与Φi2是具有相同符号的常数,BI(·)为逆迟滞补偿函数。
可选地,对高阶非线性多智能体系统的全部状态进行约束时,采用BLF约束函数限制系统模型中的受限状态。
可选地,将自适应控制方法和反步法相结合,基于相应的逆迟滞模型,构建高阶多智能体系统状态约束量化控制器包括:
基于所述逆迟滞模型和量化器对所述高阶非线性多智能体系统模型进行改写;
对每个智能体的状态变量进行状态估计;
定义所述高阶非线性多智能体系统的第一个误差面;
定义所述高阶非线性多智能体系统的第二个误差面;
定义所述高阶非线性多智能体系统的第w个误差面;
当w=k时,计算自适应率
Figure BDA0003512041630000025
Figure BDA0003512041630000026
构建所述高阶多智能体系统状态约束量化控制器。
可选地,对每个所述智能体的状态变量进行状态估计时,采用高增益K滤波器,其中,所述高增益K滤波器为:
Figure BDA0003512041630000031
Figure BDA0003512041630000032
其中,φi,Φi
Figure BDA0003512041630000033
均为滤波器估计函数;En,q为坐标参数;Ψi为滤波器系数矩阵,Hi为滤波器参数矩阵,
Figure BDA0003512041630000034
为期望控制信号,j为第j个智能体。
可选地,所述第一个误差面为:
Figure BDA0003512041630000035
其中,zi=yi-yr为系统的跟踪误差;ηi表示第i个智能体与参考信号yr之间的关系;
Figure BDA0003512041630000036
为第i个和第j个智能体的相对输出。
可选地,所述第w个误差面ei,w为:
ei,w=ωi,m,wi,w-1,w=2,…,k,
其中,ωi,m,w为滤波器估计函数;αi,w-1为待设计的虚拟控制率。
可选地,当w=k时,计算自适应率
Figure BDA0003512041630000037
Figure BDA0003512041630000038
Figure BDA0003512041630000039
其中,ιi,k
Figure BDA00035120416300000310
均为调节函数;j表示与第i个智能体相邻的第j个智能体,记作j∈Ni
本发明公开了以下技术效果:
本发明提供的一种高阶多智能体系统状态约束量化控制器的构建方法,在模型参数不确定、存在未知外部扰动的基础上,考虑多智能体系统的输出反馈控制,充分考虑了多智能体系统的实际控制场景,使得发明所求控制率更加具有通用性;通过引入逆迟滞补偿模型,克服实际环境下系统可能存在的输入迟滞问题,并允许每个智能体具有各不相同的迟滞非线性,提高了系统的鲁棒性;采用BLF约束函数,用以限制多智能体系统具有的全状态约束,使得整个系统满足预设的性能指标;采用自适应量化控制方法,引入的量化器使得系统的通信负担大大降低,并保证状态跟踪误差满足预设要求,提高了误差系统的收敛速度和跟踪精度,最终保证了闭环系统所有信号半全局一致最终有界。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的高阶多智能体系统状态约束量化控制器的结构示意图;
图2为本发明实施例中多智能体系统的通信拓扑结构图,其中yr表示系统需要跟踪的参考信号,其中,“1”、“2”、“3”、“4”分别表示第1、2、3、4个智能体;
图3为本发明实施例中的跟踪轨迹示意图;
图4为本发明实施例中与使用纯自适应量化控制方法(PAQC)的跟踪轨迹对比示意图,其中,图(a)-(d)分别为第1-4个智能体的跟踪轨迹与使用PAQC的第1-4个智能体的跟踪轨迹对比示意图;
图5为本发明实施例中的跟踪误差示意图;
图6为本发明实施例中与使用纯自适应量化控制方法(PAQC)的跟踪误差对比示意图,其中,图(a)-(d)分别为第1-4个智能体的跟踪误差与使用PAQC的第1-4个智能体的跟踪误差对比示意图;
图7为本发明实施例中的邻居一致性误差示意图;
图8为本发明实施例中与使用纯自适应量化控制方法(PAQC)的邻居一致性误差对比示意图,其中,图(a)-(d)分别为第1-4个智能体的邻居一致性误差与使用PAQC的第1-4个智能体的邻居一致性误差对比示意图;
图9为本发明实施例中第二误差面的跟踪误差示意图;
图10为本发明实施例中与使用纯自适应量化控制方法(PAQC)的第二误差面的跟踪误差对比示意图,其中,图(a)-(d)分别为第1-4个智能体的第二误差面与使用PAQC的第1-4个智能体的第二误差面对比示意图;
图11为本发明实施例中的第一个智能体在经过逆迟滞补偿前后的输入信号示意图;
图12为本发明实施例中的第二个智能体在经过逆迟滞补偿前后的输入信号示意图;
图13为本发明实施例中的第三个智能体在经过逆迟滞补偿前后的输入信号示意图;
图14为本发明实施例中的第四个智能体在经过逆迟滞补偿前后的输入信号示意图;
图15为本发明实施例中的量化控制输入信号示意图;
图16为本发明实施例中高阶多智能体系统状态约束量化控制器的构建方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明提供一种高阶多智能体系统状态约束量化控制器的构建方法,如图1-16所示,包括以下步骤:
步骤1)针对带有输入迟滞和全状态约束的多智能体系统建模
本发明中带有输入迟滞和全状态约束的高阶非线性多智能体系统中,第i个智能体的数学模型如公式(1)所示:
Figure BDA0003512041630000051
其中,i=1,…,N表示多智能体的个数;t表示时间常数;xi=[xi,1,…,xi,n]T∈Rn为第i个智能体的状态,
Figure BDA0003512041630000056
为对应状态的导数,n表示系统阶数,R表示数域,假设对于每个智能体的状态,都有|xi|<ki,c,ki,c是一个已知正常数;yi∈R为第i个智能体的输出;ui∈R为第i个智能体的迟滞输入,是迟滞特性函数B(vi)的迟滞输出,vi为系统的实际输入;状态系数矩阵
Figure BDA0003512041630000052
且In-1为(n-1)×(n-1)的单位矩阵;增益矩阵Di=[0,…,0,di]T∈Rn,di=[di,m,…,di,0]T∈Rm+1为控制信号的未知增益,且有参数k=n-m>1,di,m≠0为未知常数;
Figure BDA0003512041630000053
为未知非线性函数,包含几种类型的不确定性,如未知时变参数、建模误差和外部扰动。
本发明考虑一组N个n阶非线性多智能体系统,假设N个智能体的拓扑结构可以用无向图
Figure BDA0003512041630000054
表示,每一个智能体都能看作是一个节点,则
Figure BDA0003512041630000055
由一组节点集
Figure BDA0003512041630000061
和一组边集
Figure BDA0003512041630000062
组成。(i,j)∈ε表示第i个智能体与第j个智能体可以获得相互的信息。第i个智能体的邻居集合可以表示为Ni={j|(j,i)∈ε},将能够表示第i个智能体邻居状态的邻接矩阵A定义为为如式(2)所示:
Figure BDA0003512041630000063
其中,aij为代表第i个智能体和第j个智能体之间关系的关系参数,若aij=1则表示第i个智能体与第j个智能体相邻并能获得其信息;此外AT=A,且第i个智能体的自身关系参数aii≠1。
将Laplacian矩阵L=[Lij]∈RN×N定义为如式(3)所示:
Figure BDA0003512041630000064
其中,lii是表示与第i个智能体相邻的所有智能体个数的邻居数量参数,lij为第i个智能体关系参数aij的负值。
假设1.将第i个智能体的邻居集合Ni定义为Ni={j|(j,i)∈ε},若j∈Ni,则表示第j个智能体的输出yj和输入uj可以被第i个智能体获得。
步骤2)根据多智能体系统的迟滞非线性,构造与之对应的逆迟滞模型
所用Bouc-Wen迟滞非线性模型如式(4)所示:
ui=B(vi)=Φi1vii2χi1,i=1,…,N, (4)
其中,Φi1与Φi2是具有相同符号的常数;χi1为第i个智能体的迟滞特性辅助变量,它随着输入vi和其导数
Figure BDA0003512041630000065
的变化速率而变化,若定义t0为初始时间,则它由如式(5)所示形式的一阶微分方程产生:
Figure BDA0003512041630000066
并且迟滞形状描述函数f(·,·)有如下形式
Figure BDA00035120416300000715
其中,sign(·)为符号函数;υi>|oi|,m≥1,并且υi和Oi分别是描述第i个智能体中迟滞的形状和振幅的参数;光滑度参数m的取值影响从初始斜率到渐近线斜率的过渡的光滑性。
根据公式(4)-(6)中所描述的迟滞非线性构造其相应的逆迟滞模型,使用逆迟滞补偿函数BI(·)以抵消输入迟滞对系统所造成的影响,具体构建步骤如下:
Figure BDA0003512041630000071
并且
Figure BDA0003512041630000072
其中,
Figure BDA00035120416300000716
是需要设计的期望控制信号,f(·,·)为迟滞形状描述函数,χi2为逆迟滞特性辅助变量。
因此,在经过逆迟滞模型BI(·)的补偿之后,能够将系统的迟滞输入信号ui转化为期望控制信号
Figure BDA0003512041630000073
Figure BDA0003512041630000074
步骤3)采用BLF约束函数限制系统模型中的受限状态
在本实施例中,屏障李雅普诺夫函数(BLF)是一个标量函数V(x),定义的系统
Figure BDA0003512041630000075
在一个开放的区域
Figure BDA0003512041630000076
(包含原点)是连续且正定的,并且对于
Figure BDA0003512041630000077
上的每一点都有连续的一阶偏导数;在x靠近
Figure BDA0003512041630000078
的边界时,V(x)→∞,并且沿着
Figure BDA0003512041630000079
的解
Figure BDA00035120416300000710
和一些正常数b满足
Figure BDA00035120416300000711
对于任意正常数ki,b,i=1,…,N,令
Figure BDA00035120416300000712
代表数域,开放区域
Figure BDA00035120416300000713
包含原点,并且ki,b>0是区域ki,b>0的边界,且有
Figure BDA00035120416300000714
基于以上理论,在本实施例中使用如式(9)所示的BLF函数
Figure BDA0003512041630000081
其中,log(·)表示自然对数;ei为多智能体系统的误差变量;可以看出BLF函数
Figure BDA0003512041630000087
是正定的,ki,b代表ei的限制,即为|ei|<ki,b。对于任意存在的正常数ki,b,有如式(10)所示的不等式形式:
Figure BDA0003512041630000082
任何时候|ei|<ki,b均成立。
步骤4)采用自适应量化控制,设计带有输入迟滞的多智能体系统状态约束量化控制器
控制器的设计主要包括如下步骤:
第一步:在每个智能体前加入量化器,并对使用了逆迟滞补偿和量化器后的系统模型进行转换,假定将具有如下扇形限制属性的量化器加入系统中
Figure BDA0003512041630000083
其中,0<λi<1,δi>0为已知常数。此类扇形限制属性存在于许多典型的量化器之中,现给出一种典型的对数量化器,如式(12)所示:
Figure BDA0003512041630000084
其中参数
Figure BDA0003512041630000085
满足公式(11)。
则根据公式(7)和公式(11),可将系统模型(1)改写为
Figure BDA0003512041630000086
其中,
Figure BDA00035120416300000919
表示引入量化器后第i个智能体的量化输入。
假设2.假设下列定义成立
Figure BDA0003512041630000091
其中,
Figure BDA0003512041630000092
为未知非负常数;p为已知正整数。
第二步:使用高增益K滤波器对每个智能体的状态进行估计,如式(15)-(20)所示:
Figure BDA0003512041630000093
Figure BDA0003512041630000094
Figure BDA0003512041630000095
Figure BDA0003512041630000096
Figure BDA0003512041630000097
Figure BDA0003512041630000098
其中,参数j∈Ni;r=0,...,m;φi,Φi
Figure BDA0003512041630000099
均为滤波器估计函数,
Figure BDA00035120416300000910
为对应滤波器估计函数的导数;坐标参数En,q表示数域
Figure BDA00035120416300000911
中的第q个坐标矢量;滤波器系数矩阵
Figure BDA00035120416300000912
滤波器参数矩阵
Figure BDA00035120416300000913
hi,ai≥1为设计参数。
Figure BDA00035120416300000914
可知,公式(19)和公式(20)的导数可以表示为
Figure BDA00035120416300000915
Figure BDA00035120416300000916
根据公式(13),定义如下形式的等式
Figure BDA00035120416300000917
Figure BDA00035120416300000918
Figure BDA0003512041630000101
其中,i=1,…,N;j∈Ni
Figure BDA0003512041630000102
为第i个和第j个智能体的相对状态;
Figure BDA0003512041630000103
为第一相对状态;
Figure BDA0003512041630000104
为第i个和第j个智能体的相对输出;xj,yj为与第i个智能体相邻的第j个智能体的状态与输出。
根据公式(24),公式(17)可以改写成
Figure BDA0003512041630000105
根据公式(13),
Figure BDA0003512041630000106
的导数为
Figure BDA0003512041630000107
其中,参数j∈Ni;Dj为第j个智能体的增益矩阵;
Figure BDA0003512041630000108
为第j个智能体的量化输入;
Figure BDA0003512041630000109
为第j个智能体的未知非线性函数。
分别令
Figure BDA00035120416300001010
Figure BDA00035120416300001011
为xi
Figure BDA00035120416300001012
的估计值,其表达式可以写为
Figure BDA00035120416300001013
Figure BDA00035120416300001014
定义
Figure BDA00035120416300001015
Figure BDA00035120416300001016
为引入的高增益K滤波器的估计误差,
Figure BDA00035120416300001017
Figure BDA00035120416300001018
的导数可以写为
Figure BDA00035120416300001019
Figure BDA00035120416300001020
利用转换参数ξi
Figure BDA00035120416300001021
将公式(30)和(31)进行如下形式的变换
Figure BDA00035120416300001022
Figure BDA00035120416300001023
其中滤波器反参数矩阵
Figure BDA0003512041630000111
进行变换后的公式(30)和(31)可以写为
Figure BDA0003512041630000112
Figure BDA0003512041630000113
其中,
Figure BDA0003512041630000114
为转换参数的导数;
Figure BDA0003512041630000115
为赫尔维兹阵。
将滤波误差设计成如式(36)所示的李雅普诺夫函数
Figure BDA0003512041630000116
选取适当的解参数矩阵
Figure BDA0003512041630000117
使其满足
Figure BDA0003512041630000118
其中参数k=n-m>1,In为单位矩阵。得到Vi,0的导数如式(37)所示:
Figure BDA0003512041630000119
其中,解上界参数
Figure BDA00035120416300001113
则yi
Figure BDA00035120416300001110
的导数可以表示为
Figure BDA00035120416300001111
Figure BDA00035120416300001112
其中,参数j∈Ni
Figure BDA0003512041630000121
为第j个智能体的未知非线性函数;
Figure BDA0003512041630000122
为滤波器估计函数;lii为Laplacian矩阵对角线值;滤波器估计矩阵分别表示为
Figure BDA0003512041630000123
第三步:引入符号ηi代表各智能体和参考信号之间的关系,着ηi=1,说明该智能体可以直接获得参考信号yr,否则ηi=0。令符号矩阵η=diag{η1,…,ηN},定义系统的跟踪误差zi和误差ei=[ei,1,ei,2,…,ei,k+1]T
zi=yi-yr, (39)
Figure BDA0003512041630000124
ei,w=ωi,m,wi,w-1,w=2,…,k, (41)
Figure BDA00035120416300001210
其中,αi,1,…,αi,k-1为虚拟控制率。除此之外,定义自适应函数γi,t和参数
Figure BDA0003512041630000125
Figure BDA0003512041630000126
Figure BDA0003512041630000127
Figure BDA0003512041630000128
其中,ci,w(w=1,…,k),βti,βρi,θti,θρi,θdi,θσij,ζi,1,ξi,2为正标量设计参数,
Figure BDA0003512041630000129
为需要设计的正定对称阵。
假设3.符号矩阵η=diag{η1,…,ηN}中至少有一个非零元素。
假设4.所有跟踪误差Zi,l=yi-yr,i=1,…,N都被预先定界。
第四步:求得第一个误差面ei,l的导数为
Figure BDA0003512041630000131
考虑以下李雅普诺夫函数:
Figure BDA0003512041630000132
其中,Vi,0为高增益K滤波器的滤波误差;ki,bw为正常数;在集合
Figure BDA00035120416300001311
中,Vi,1是连续的;自适应参数
Figure BDA0003512041630000133
分别是t,
Figure BDA0003512041630000134
di,dj的估计值,且有估计误差
Figure BDA0003512041630000135
ci,w(w=1,…,k),βti,βρi,θti,θρi,θdi,θσij,ζi,1,ζi,2为正标量设计参数,
Figure BDA0003512041630000136
为需要设计的正定对称阵。
根据公式(38)和(42),可以得到ei,2=ωi,m,2i,1
Figure BDA0003512041630000137
其中滤波器估计矩阵
Figure BDA0003512041630000138
除此之外,定义约束转换函数
Figure BDA0003512041630000139
w=1,…,k,参考信号转换函数
Figure BDA00035120416300001310
则Vi,1的导数满足式(49):
Figure BDA0003512041630000141
由杨氏不等式可知
Figure BDA0003512041630000142
Figure BDA0003512041630000143
根据ηi=0或1可知,因此可以得到如式(52)所示的不等式
Figure BDA0003512041630000144
其中,Ψ表示t≥0时,
Figure BDA0003512041630000145
的上限值,写作
Figure BDA0003512041630000146
将公式(50)-(52)代入(49),可以得到
Figure BDA0003512041630000147
其中未知增益估计值
Figure BDA0003512041630000148
Figure BDA0003512041630000149
的第一个元素;误差残项
Figure BDA00035120416300001410
虚拟控制率αi,1被设计为
Figure BDA00035120416300001411
其中虚拟辅助函数
Figure BDA00035120416300001412
Figure BDA0003512041630000151
Figure BDA0003512041630000152
定义ti,1
Figure BDA0003512041630000153
为自适应率
Figure BDA0003512041630000154
Figure BDA0003512041630000155
的调节函数,将其设计为
Figure BDA0003512041630000156
Figure BDA0003512041630000157
此外,设计自适应函数
Figure BDA0003512041630000158
Figure BDA0003512041630000159
其中,
Figure BDA00035120416300001510
表示自适应函数的导数。
将公式(54)-(59)代入(53),并给出
Figure BDA00035120416300001511
可以得到
Figure BDA00035120416300001512
其中余项函数fi,1,fi,2分别为
Figure BDA00035120416300001513
Figure BDA00035120416300001514
第五步:根据公式(42)第二个误差面ei,2的导数为
Figure BDA0003512041630000161
其中,αi,1可以用yi
Figure BDA0003512041630000162
表示,且控制率偏导辅助函数分别为
Figure BDA0003512041630000163
辅助变量
Figure BDA0003512041630000164
Xi,1
Figure BDA0003512041630000165
为控制率偏导辅助函数;滤波器偏导辅助函数分别为
Figure BDA0003512041630000166
考虑以下李雅普诺夫函数
Figure BDA0003512041630000167
由杨氏不等式可知:
Figure BDA0003512041630000168
Figure BDA0003512041630000169
Figure BDA00035120416300001610
根据公式(63),(65)-(67),Vi,2的导数为
Figure BDA0003512041630000171
虚拟控制率αi,2和调节函数li,2
Figure BDA0003512041630000172
分别被设计为
Figure BDA0003512041630000173
Figure BDA0003512041630000177
Figure BDA0003512041630000174
将公式(69)-(71)代入到(68)中,可以得到
Figure BDA0003512041630000175
第六步:第w(3≤w≤k)误差面ei,w为:
ei,w=ωi,m,wi,w-1,w=2,…,k,
其导数如式(73)所示:
Figure BDA0003512041630000176
其中,控制率偏导辅助函数
Figure BDA0003512041630000181
滤波器偏导辅助函数
Figure BDA0003512041630000182
考虑以下李雅普诺夫函数
Figure BDA0003512041630000183
其中,αi,q-1可以用yi
Figure BDA0003512041630000184
表示,且控制率偏导辅助函数分别为
Figure BDA0003512041630000185
Figure BDA0003512041630000186
j∈Ni
使用杨氏不等式求解,可以得到虚拟控制率αi,w和自适应调节函数li,w
Figure BDA0003512041630000187
为,如式(75)-(77)所示:
Figure BDA0003512041630000188
Figure BDA00035120416300001811
Figure BDA0003512041630000189
将(75)-(77)代入到Vi,w的导数中,可将其化简为:
Figure BDA00035120416300001810
当w=k时,自适应率
Figure BDA0003512041630000191
Figure BDA0003512041630000192
及其导数
Figure BDA0003512041630000193
即为
Figure BDA0003512041630000194
Figure BDA0003512041630000195
满足:
Figure BDA0003512041630000196
其中,控制率辅助变量
Figure BDA0003512041630000197
因BLF函数为
Figure BDA0003512041630000198
根据对数函数的性质可知,
Figure BDA0003512041630000199
Figure BDA00035120416300001910
第i个智能体的控制率
Figure BDA00035120416300001911
设计为如式(81)所示:
Figure BDA00035120416300001912
根据公式(11),
Figure BDA00035120416300001913
满足下列不等式
Figure BDA00035120416300001914
选取适当的设计参数ζi,2,使其满足不等式
Figure BDA00035120416300001915
根据杨氏不等式,有
Figure BDA00035120416300001916
此外,根据公式(81)和(83),公式(82)的后两项满足:
Figure BDA00035120416300001917
将公式(82)-(85)代入到公式(80)中,可将
Figure BDA0003512041630000201
改写为
Figure BDA0003512041630000202
下面进行状态约束量化控制器的稳定性分析
系统的滤波误差在公式(36)中已经给出,根据公式(40)和(41),可以将系统误差合并成如式(87)所示形式:
Figure BDA0003512041630000203
其中误差矩阵分别为
Figure BDA0003512041630000204
Figure BDA0003512041630000205
L+η为正定对称阵。
考虑以下李雅普诺夫函数
Figure BDA0003512041630000206
定理1.考虑具有输入迟滞的多智能体系统模型(1),逆迟滞模型(7)-(8),满足公式(11)的N个量化器,BLF约束函数(9),高增益K滤波器(15)-(18),自适应率(56),(59),(79),和实际控制率(81)。并且满足假设1-4,则通过选取适当的设计参数ci,w(w=1,…,k),βti,βρi,θti,θρi,θdi,θσij,ζi,1,ζi,2
Figure BDA0003512041630000207
确保所提出的自适应一致量化控制满足:(1)闭环系统中的所有信号都半全局一致最终有界;(2)跟踪误差zi将收敛到一个集合ε;(3)不会违反系统中的全状态约束。
证明:
给出
Figure BDA0003512041630000208
Figure BDA0003512041630000209
则V的时间导数为
Figure BDA00035120416300002010
其中,f为包含系统中未知非线性的残余项,其具体形式如式(90)所示
Figure BDA0003512041630000211
且正项集合Δi
Figure BDA0003512041630000212
根据公式(2)-(3)可知
Figure BDA0003512041630000213
因此可以得到
Figure BDA0003512041630000214
与公式(14)和(44)结合可以得到
Figure BDA0003512041630000215
因为p为正整数,因此有
Figure BDA0003512041630000216
根据公式(87),(94)可以表示为
Figure BDA0003512041630000217
通过合并公式(46)和(95),不等式(93)的右半部分有如下关系
Figure BDA0003512041630000218
根据公式(44),(90),(93),(96),有
Figure BDA0003512041630000221
根据公式(97),且知yr有界,有如下不等式成立
Figure BDA0003512041630000222
其中,
Figure BDA0003512041630000223
为参数πi的上界值,并且
Figure BDA0003512041630000224
的值只与ζi,1有关。
因此根据公式(10),公式(89)可以被缩写为
Figure BDA0003512041630000225
其中集合ε可以表示为
Figure BDA0003512041630000226
且有函数
Figure BDA0003512041630000227
根据公式(99),可以证明
Figure BDA0003512041630000228
此不等式表示信号zi,ei,w
Figure BDA0003512041630000229
ξi
Figure BDA00035120416300002212
i=1,…,N,w=1,…,k,j∈Ni,是有界的,并且整个闭环系统的所有信号都是半全局一致有界的。
此外,根据(101),可以证明
Figure BDA00035120416300002210
可以得到
Figure BDA00035120416300002211
明显地,可以证明
Figure BDA0003512041630000231
其中,e1=[e1,1,…,eN,1]T。根据公式(41),可以得到
Figure BDA0003512041630000232
其中z=[z1,…,zN]T。根据公式(40),可以得到
Figure BDA0003512041630000233
Figure BDA0003512041630000234
可得|xi,1|≤ki,c。同理可得系统剩余状态
Figure BDA0003512041630000235
证明了整个系统的状态约束没有被违反。
下面以带有输入迟滞和状态约束的二阶机械臂系统为例进行仿真分析,考虑一组由四个单杆机械臂组成的多智能体系统,其动态模型表达式为
Figure BDA0003512041630000236
其中,θi∈Rn为关节角度位移;Ii为机械臂的惯性矩阵;bi为离心力;mi为机械臂质量;g为重力加速度;τi为控制转矩;
Figure BDA0003512041630000237
为外部扰动。
根据公式(13)所给出的一般形式的多智能体模型,将公式(103)转化成与相同的形式
Figure BDA0003512041630000238
其中
Figure BDA0003512041630000239
Figure BDA00035120416300002310
Di=[0,di]T
Figure BDA00035120416300002311
需注意该模型中参数N=4,n=2,m=2,k=n-m=0。假设Ii,bi,mi,g,li
Figure BDA0003512041630000244
均为未知项,sign(di,0)己知。多智能体的通信拓扑结构如图2所示,其参数矩阵η=[0,1,0,0]T。此外,该系统的邻接矩阵A和Laplacian矩阵L被表示为
Figure BDA0003512041630000241
控制器结构如图1所示,每个智能体的具体物理参数如表1所示。
表1
Figure BDA0003512041630000242
迟滞非线性的参数分别设置为Φi,1=[1,1,3,1],Φi,2=[1,1,5,1]T,κi=[1,0.02,1,1]T以及Oi=[0.5,0.01,0.5,1]T;高增益K滤波器的参数设置为hi,1=[2,2,2,2]T,hi,2=[1,1,1,1]T。将量化器的参数设置为λi=[0.2,0.2,0.2,0.2]T,δi=[0.1,0.1,0.1,0.1]T;BLF函数的限制设置为|ki,b1|=[0.30.3,0.3,0.3]T,|ki,b2|=[0.5,0.5.0.5,0.5]T
将发明中控制器的设计参数设置为ai=[5,5,5,5]T,ci,1=ci,2=[8,8,8,8]T
Figure BDA0003512041630000243
以及ζi,1=ζi,2=[0.01,0.01,0.01,0.01]T
为了验证本发明设计的控制器有效性,引入一种使用纯自适应量化方法的控制(PAQC)与本发明所提出的方法进行跟踪性能的比较。
图3-图15为实验仿真结果图。图3展示了本发明提出控制方案的跟踪轨迹,图4展示了本发明的跟踪轨迹与使用PAQC方法的跟踪轨迹对比,可以清楚地看到相比使用PAQC方法,本发明使用的方法能够更好地跟踪参考信号yr。图5展示了所提方法的跟踪误差Zi,图6与PAQC的对比实验说明本发明提供的方法跟踪误差更小。图7为本发明阐述方法的邻居一致性误差ei,1,可以看到该误差范围一直处于给定约束[-ki,b1,ki,b1]内,即多智能体系统的全状态约束通过使用BLF函数没有被违反,并且本发明所提方法具有更好的收敛性和更小的误差。图8为本发明所提方法的第二误差面ei,2,与上图类似,每个智能体的误差都被限制在确定范围[-ki,b2,ki,b2]。图9-图12展示了四个智能体的控制输入信号在经过逆迟滞补偿前后的信号对比,其中
Figure BDA0003512041630000251
为期望控制信号,vi为经过逆迟滞补偿后的输入信号,ui表示实际控制输入,可以看出经过逆迟滞补偿之后的控制信号能够较好地抵消迟滞非线性对系统的影响。图13显示了多智能体系统的量化输入信号,可以发现经过量化器之后的控制输入能够较好地降低系统的通行负担。
为了更直观显示本发明的优点,选取稳定状态(5~30s)获得两种控制方法的最大跟踪误差(MVTE)和均方根值(RMSVTE)对比,如表2所示。
表2
Figure BDA0003512041630000252
Figure BDA0003512041630000261
本发明通过考虑参数不确定性、外部扰动、输入迟滞非线性、全状态约束,提出了一种自适应一致性量化控制器以解决多智能体的协同控制问题;应用BLF约束函数限制系统中的全状态约束,并通过建立相应的逆迟滞模型抵消多智能体系统的迟滞非线性,不仅克服了模型的不确定性,同时在每个智能体前引入量化器减轻了系统的通信负担;自适应与一致性控制方法相结合,提高了误差系统的收敛速度和跟踪精度。仿真结果验证了所提方法的有效性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种高阶多智能体系统状态约束量化控制器的构建方法,其特征在于,包括以下步骤:
构建高阶非线性多智能体系统模型,其中,所述高阶非线性多智能体系统含有输入迟滞和全状态约束;
根据所述输入迟滞,构建迟滞非线性模型,基于所述迟滞非线性模型,构建相应的逆迟滞模型;
基于所述高阶非线性多智能体系统模型,对高阶非线性多智能体系统的全部状态进行约束;
将自适应控制方法和反步法相结合,基于所述逆迟滞模型,构建高阶多智能体系统状态约束量化控制器;
构建高阶多智能体系统状态约束量化控制器包括:
将量化器加入高阶非线性多智能体系统中,基于所述逆迟滞模型和所述量化器对所述高阶非线性多智能体系统模型进行改写;
使用高增益K滤波器对每个智能体的状态进行估计;
引入符号ηi代表各所述智能体和参考信号之间的关系,着ηi=1,说明该所述智能体可以直接获得所述参考信号yr,否则ηi=0;
定义所述高阶非线性多智能体系统的第一个误差面;
定义所述高阶非线性多智能体系统的第二个误差面;
定义所述高阶非线性多智能体系统的第w个误差面;
当w=k时,计算自适应率
Figure FDA0003971482930000011
Figure FDA0003971482930000012
构建所述高阶多智能体系统状态约束量化控制器;
所述第w个误差面ei,w为:
ei,w=ωi,m,wi,w-1,w=2,…,k,
其中,ωi,m,w为滤波器估计函数;αi,w-1为待设计的虚拟控制率。
2.根据权利要求1所述的高阶多智能体系统状态约束量化控制器的构建方法,其特征在于,所述高阶非线性多智能体系统模型表示为:
Figure FDA0003971482930000021
其中,i表示多智能体的个数;xi为第i个智能体的状态;
Figure FDA0003971482930000022
为对应状态的导数;yi为第i个智能体的输出;ui为第i个智能体的迟滞输入,B(·)为迟滞特性函数,vi为系统的实际输入;I为状态系数矩阵;Di为增益矩阵;
Figure FDA0003971482930000023
为未知非线性函数。
3.根据权利要求1所述的高阶多智能体系统状态约束量化控制器的构建方法,其特征在于,所述迟滞非线性模型为:
ui=B(vi)=Φi1vii2χi1,i=1,…,N,
其中,ui为第i个智能体的迟滞输入,Φi1与Φi2是具有相同符号的常数;χi1为第i个智能体的迟滞特性辅助变量,vi为输入信号。
4.根据权利要求1或3所述的高阶多智能体系统状态约束量化控制器的构建方法,其特征在于,所述逆迟滞模型为:
Figure FDA0003971482930000024
其中,vi为输入信号,
Figure FDA0003971482930000031
为需要设计的控制信号,χi2为逆迟滞特性辅助变量,Φi1与Φi2是具有相同符号的常数,BI(·)为逆迟滞补偿函数。
5.根据权利要求1所述的高阶多智能体系统状态约束量化控制器的构建方法,其特征在于,对高阶非线性多智能体系统的全部状态进行约束时,采用BLF约束函数限制系统模型中的受限状态。
6.根据权利要求1所述的高阶多智能体系统状态约束量化控制器的构建方法,其特征在于,对每个所述智能体的状态变量进行状态估计时,采用所述高增益K滤波器,其中,所述高增益K滤波器为:
Figure FDA0003971482930000032
Figure FDA0003971482930000033
其中,φi,Φi
Figure FDA0003971482930000034
均为滤波器估计函数;En,q为坐标参数;Ψi为滤波器系数矩阵,Hi为滤波器参数矩阵,
Figure FDA0003971482930000035
为期望控制信号,j为第j个智能体。
7.根据权利要求1所述的高阶多智能体系统状态约束量化控制器的构建方法,其特征在于,所述第一个误差面为:
Figure FDA0003971482930000036
其中,zi=yi-yr为系统的跟踪误差;ηi表示第i个智能体与参考信号yr之间的关系;
Figure FDA0003971482930000037
为第i个和第j个智能体的相对输出。
8.根据权利要求1所述的高阶多智能体系统状态约束量化控制器的构建方法,其特征在于,当w=k时,计算自适应率
Figure FDA0003971482930000041
Figure FDA0003971482930000042
Figure FDA0003971482930000043
其中,ιi,k
Figure FDA0003971482930000044
均为调节函数;j表示与第i个智能体相邻的第j个智能体,记作j∈Ni
CN202210154910.XA 2022-02-21 2022-02-21 一种高阶多智能体系统状态约束量化控制器的构建方法 Active CN114509948B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210154910.XA CN114509948B (zh) 2022-02-21 2022-02-21 一种高阶多智能体系统状态约束量化控制器的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210154910.XA CN114509948B (zh) 2022-02-21 2022-02-21 一种高阶多智能体系统状态约束量化控制器的构建方法

Publications (2)

Publication Number Publication Date
CN114509948A CN114509948A (zh) 2022-05-17
CN114509948B true CN114509948B (zh) 2023-01-17

Family

ID=81551964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210154910.XA Active CN114509948B (zh) 2022-02-21 2022-02-21 一种高阶多智能体系统状态约束量化控制器的构建方法

Country Status (1)

Country Link
CN (1) CN114509948B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113031434A (zh) * 2021-02-03 2021-06-25 中国地质大学(武汉) 时滞多柔性摆臂系统分数阶自适应控制方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109351B (zh) * 2019-04-08 2021-05-18 广东工业大学 一种基于指定性能的多智能体一致性控制方法
CN110275435B (zh) * 2019-05-24 2022-07-05 广东工业大学 基于观测器的多单臂机械手输出一致自适应命令滤波控制方法
CN110543097B (zh) * 2019-08-06 2023-01-20 广东工业大学 一种基于模型参考自适应的压电陶瓷驱动器控制方法
CN110989347B (zh) * 2019-12-07 2022-04-08 天津大学 一种基于事件触发机制的网络化控制系统和控制方法
CN111103833B (zh) * 2019-12-20 2023-03-07 南京邮电大学 一种多化学反应罐反应液体积一致性控制器系统及设计方法
CN112558476B (zh) * 2020-12-04 2022-06-14 广东工业大学 基于攻击补偿的非线性多智体系统无领导者一致控制方法
CN113359445B (zh) * 2021-06-01 2022-11-11 上海工程技术大学 一种多智能体磁滞系统分布式输出反馈渐近一致控制方法
CN113671831B (zh) * 2021-08-12 2024-04-09 南京邮电大学 一种非线性互联系统的自适应跟踪控制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113031434A (zh) * 2021-02-03 2021-06-25 中国地质大学(武汉) 时滞多柔性摆臂系统分数阶自适应控制方法及装置

Also Published As

Publication number Publication date
CN114509948A (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
Sun et al. Adaptive decentralized neural network tracking control for uncertain interconnected nonlinear systems with input quantization and time delay
CN109445447B (zh) 一种多智能体编队跟踪控制方法及系统
CN113183154B (zh) 一种柔性关节机械臂的自适应反演控制方法
CN113900380B (zh) 一种异构集群系统鲁棒输出编队跟踪控制方法及系统
CN113359445B (zh) 一种多智能体磁滞系统分布式输出反馈渐近一致控制方法
CN110262247B (zh) 多机器人系统的分布式命令滤波模糊控制方法
CN112987567B (zh) 非线性系统的固定时间自适应神经网络滑模控制方法
CN107544256A (zh) 基于自适应反步法的水下机器人滑模控制方法
CN111496796B (zh) 基于指令滤波器的机械臂轨迹跟踪控制方法及装置
CN107168069B (zh) 一种受扰动和未知方向非线性系统的零误差跟踪控制方法
CN112305918A (zh) 超螺旋观测器下的多智能体系统滑模容错一致性控制算法
CN109116737A (zh) 基于观测器的多智能体系统故障上限评估以及容错一致性控制算法
Long et al. Game-based backstepping design for strict-feedback nonlinear multi-agent systems based on reinforcement learning
CN114851198A (zh) 一种多单连杆式机械臂的一致跟踪固定时间稳定控制方法
CN110362103B (zh) 分布式自主水下航行器姿态协同优化控制方法
Liu et al. Fixed‐time cooperative control for robotic manipulators with motion constraints using unified transformation function
CN113325717B (zh) 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质
CN109108964B (zh) 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法
CN114509948B (zh) 一种高阶多智能体系统状态约束量化控制器的构建方法
CN116755481A (zh) 一种基于神经网络的pid振动主动控制与可靠性分析方法
CN114200830B (zh) 一种多智能体一致性强化学习控制方法
CN114280930B (zh) 一种随机高阶线性多智能体系统控制协议的设计方法及系统
CN115356929A (zh) 执行器攻击奇异多智能体系统比例容许跟踪控制方法
CN114063438B (zh) 一种数据驱动的多智能体系统pid控制协议自学习方法
Li et al. Adaptive resilient containment control for nonlower triangular multiagent systems with time-varying delay and sensor faults

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant