CN115008456B - 一种柔性单链机械臂多智能体的跟踪控制方法和系统 - Google Patents

一种柔性单链机械臂多智能体的跟踪控制方法和系统 Download PDF

Info

Publication number
CN115008456B
CN115008456B CN202210670506.8A CN202210670506A CN115008456B CN 115008456 B CN115008456 B CN 115008456B CN 202210670506 A CN202210670506 A CN 202210670506A CN 115008456 B CN115008456 B CN 115008456B
Authority
CN
China
Prior art keywords
agent
representing
mechanical arm
flexible single
arm multi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210670506.8A
Other languages
English (en)
Other versions
CN115008456A (zh
Inventor
张纪峰
张言军
赵延龙
韩丽敏
牛奔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Academy of Mathematics and Systems Science of CAS
Shandong Normal University
Original Assignee
Beijing Institute of Technology BIT
Academy of Mathematics and Systems Science of CAS
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT, Academy of Mathematics and Systems Science of CAS, Shandong Normal University filed Critical Beijing Institute of Technology BIT
Priority to CN202210670506.8A priority Critical patent/CN115008456B/zh
Publication of CN115008456A publication Critical patent/CN115008456A/zh
Application granted granted Critical
Publication of CN115008456B publication Critical patent/CN115008456B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/161Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1661Programme controls characterised by programming, planning systems for manipulators characterised by task planning, object-oriented languages
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及一种柔性单链机械臂多智能体的跟踪控制方法和系统。本发明在确定柔性单链机械臂多智能体的动力学方程之后,对动力学方程进行变换,将动力学方程转换为五阶非严格反馈形式,接着,利用反步法和命令滤波技术,设计每一步的虚拟控制器后,引入相对阈值的事件触发策略设计自适应神经事件触发控制器,避免了数据冗余,大大地降低了网络带宽的压力,然后,基于自适应神经事件触发控制器对柔性单链机械臂多智能体进行控制,进而,能够避免无限快速的执行采样,降低通信信道的传输频率,节省系统的通信资源。

Description

一种柔性单链机械臂多智能体的跟踪控制方法和系统
技术领域
本发明涉及机械臂多智能体工程领域,特别是涉及一种柔性单链机械臂多智能体的跟踪控制方法和系统。
背景技术
由于工业以及农业领域的快速发展和对机械臂的广泛运用,柔性机械臂控制问题的研究引起了广泛的关注,研究者们逐渐提出了各种控制策略,使得研究得到了巨大的进展。此外,受自然界群集现象的启发,如大雁南飞、鱼游成群、蜜蜂成群等,多智能体的跟踪控制问题也引起了控制领域专家和学者极大的兴趣。通过对多智能体系统关于一致性跟踪控制问题的大量研究之后,成功提出了一些控制方法保证了跟随者的输出可以同步跟上领导者的输出。但是到目前为止,由于柔性机械臂多智能体系统的复杂性和本质上的非线性,使得其一致性跟踪控制问题的研究依旧是一个重要的研究课题。
现实中,机械臂多智能体系统的实际模型通常包含完全未知的非线性,这大大的增加了设计控制器的难度。目前,对机械臂的一个主流研究方向是利用坐标变换将机械臂系统转化为三角结构模型,从而应用反步法和智能估计技术相结合来设计有效的控制器确保理想的系统性能。然而,在反步迭代的过程中,由于对虚拟控制的重复求导有相当大的计算量,造成了“复杂性爆炸”的问题。基于此,现有技术针对这一问题有两种解决方案:动态面控制技术和命令滤波技术。但是动态面技术需要假设虚拟控制的导数边界信息已知,并通过一系列的公式推导再次证明其有界性,这在一定程度上是矛盾的。到目前为止,命令滤波技术还未充分应用于柔性机械臂多智能体系统,无法实现机械臂多智能体的有效控制。
另一方面,在传统的时间触发机制中,控制器的持续输出作用于系统,导致了计算机通信资源的浪费。
发明内容
为了克服上述现有技术存在的缺点,本发明提供了一种柔性单链机械臂多智能体的跟踪控制方法和系统。
为实现上述目的,本发明提供了如下方案:
一种柔性单链机械臂多智能体的跟踪控制方法,包括:
确定柔性单链机械臂多智能体的动力学方程;
将所述动力学方程转换为五阶非严格反馈形式,获得转换后的动力学方程;
根据转换后的动力学方程,采用反步法和命令滤波技术,设计每一步的虚拟控制器,并引入相对阈值的事件触发策略,得到柔性单链机械臂多智能体的自适应神经事件触发控制器;
基于所述自适应神经事件触发控制器对柔性单链机械臂多智能体进行控制。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的柔性单链机械臂多智能体的跟踪控制方法,在确定柔性单链机械臂多智能体的动力学方程之后,对动力学方程进行变换,将动力学方程转换为五阶非严格反馈形式,接着,利用反步法和命令滤波技术,设计每一步的虚拟控制器后,引入相对阈值的事件触发策略设计自适应神经事件触发控制器,避免了数据冗余,大大地降低了网络带宽的压力,然后,基于自适应神经事件触发控制器对柔性单链机械臂多智能体进行控制,进而,能够避免无限快速的执行采样,降低通信信道的传输频率,节省系统的通信资源。
对应于上述提供的柔性单链机械臂多智能体的跟踪控制方法,本发明还提供了以下实施硬件结构:
其中一种是柔性单链机械臂多智能体的跟踪控制系统,该系统包括:
动力学方程确定模块,用于确定柔性单链机械臂多智能体的动力学方程;
五阶非严格反馈形式转换模块,用于将所述动力学方程转换为五阶非严格反馈形式,获得转换后的动力学方程;
自适应神经事件触发控制器获取模块,用于根据转换后的动力学方程,采用反步法和命令滤波技术,设计每一步的虚拟控制器,并引入相对阈值的事件触发策略,得到柔性单链机械臂多智能体的自适应神经事件触发控制器;
控制模块,用于基于所述自适应神经事件触发控制器对柔性单链机械臂多智能体进行控制。
另一种是电子设备,该电子设备包括处理器和计算机可读存储介质;
所述处理器与所述计算机可读存储介质连接;所述计算机可读存储介质中存储有多条指令;所述指令用于实施上述提供的柔性单链机械臂多智能体的跟踪控制方法;所述处理器用于加载并执行所述计算机可读存储介质中存储的多条指令。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的柔性单链机械臂多智能体的跟踪控制方法的流程图;
图2为本发明实施例提供的多智能体的通信拓扑图;
图3为本发明实施例提供的三个跟随者和一个领导者的输出轨迹图;
图4为本发明实施例提供的三个跟随者的跟踪误差示意图;
图5为本发明实施例提供的三个控制输入示意图;
图6为本发明实施例提供的智能体1的状态变量x1,1、x1,2、x1,3、x1,4和x1,5轨迹示意图;
图7为本发明实施例提供的智能体2的状态变量x2,1、x2,2、x2,3、x2,4和x2,5轨迹示意图;
图8为本发明实施例提供的智能体3的状态变量x3,1、x3,2、x3,3、x3,4和x3,5轨迹示意图;
图9为本发明实施例提供的事件触发条件示意图;其中,图9的(a)部分为事件触发条件1的示意图,图9的(b)部分为事件触发条件2的示意图,图9的(c)部分为事件触发条件3的示意图;
图10为本发明提供的柔性单链机械臂多智能体的跟踪控制系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种柔性单链机械臂多智能体的跟踪控制方法和系统,能够避免无限快速的执行采样,降低通信信道的传输频率,节省系统的通信资源。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供的一种柔性单链机械臂多智能体的跟踪控制方法,包括:
步骤100:确定柔性单链机械臂多智能体的动力学方程。
步骤101:将动力学方程转换为五阶非严格反馈形式,获得转换后的动力学方程。
步骤102:根据转换后的动力学方程,采用反步法和命令滤波技术,设计每一步的虚拟控制器,并引入相对阈值的事件触发策略,得到柔性单链机械臂多智能体的自适应神经事件触发控制器。并且,为了减小由命令滤波引起的误差,在设计每一步的虚拟控制器的同时,进行坐标转换,并引入补偿信号。
步骤103:基于自适应神经事件触发控制器对柔性单链机械臂多智能体进行控制。
下面对柔性单链机械臂多智能体的跟踪控制方法的实现过程进行详细说明。
实施例一
将柔性单链机械臂多智能体系统的动态方程进行坐标变换得到了一个五阶非严格反馈形式,接着,应用引理2可以将非严格形式转换成严格形式后,应用反步法与命令滤波技术相结合,能够避免虚拟控制的反复求导问题,解决了原来传统的反步技术框架中固有的“复杂性爆炸”的问题。基于此,首先定义坐标变换,选择一个合适的李雅普诺夫函数,设计虚拟控制器,同时引入补偿信号减小由命令滤波引起的误差,其次,利用神经网络估计未知的非线性函数,进行五步自适应命令滤波事件触发控制器的设计得到最终的控制器,具体过程如下:
S1:初步工作和问题提出
S1.1基础图论
如图2所示的多智能体的通信拓扑图,有向拓扑图可以描述为G=(V,E),其中V=(v1,v2,...,vn)是一个有限的非空节点集,
Figure BDA0003693209190000031
代表边集。一条边可以描述为eji=(vj,vi)∈E,表示智能体i可以从智能体j得到信息,同时也表明智能体j是智能体i的邻居。因此,智能体i的邻域集可以表示为Ni={vj|(vj,vi)∈E}。当考虑边的权值时,有向图的邻接矩阵表示为A=[aij]∈RN×N,其中如果eji=(vj,vi)∈E,那么aij>0,否则aij=0。一般不考虑自环的情况,即aii=0。定义一个入度矩阵D=diag{d1,d2,...,dN}∈RN×N为一个对角矩阵,对于智能体i来说
Figure BDA0003693209190000032
然后有向图G的拉普拉斯矩阵可以表示为L=D-A,当只有一个节点的时候L=0。当考虑领导者时,通常使用增广图
Figure BDA0003693209190000033
来表示领导者和跟随者之间的通信拓扑。
Figure BDA0003693209190000034
表示基于图G的增广图,
Figure BDA0003693209190000035
Figure BDA0003693209190000036
分别表示增广图
Figure BDA0003693209190000037
的节点集和边集。
Figure BDA0003693209190000038
包括领导者和跟随者,
Figure BDA0003693209190000039
表示领导者和跟随者之间的通信关系。定义矩阵B=diag{bi}∈RN×N表示跟随者和领导者之间的关系,如果第i个智能体和领导者之间有权值,那么bi>0,否则bi=0。从领导智能体到任何跟随者智能体至少有一个有向路径,换句话说,有向图包含一个有向生成树。
S1.2柔性单链机械臂多智能体系统描述
一个非线性多智能体系统通常由N(N≥2)个跟随者(标记从1到N)和一个领导者(标记d)组成。用有向图G描述跟随者的通信拓扑结构。然后,第i个跟随者(i=1,2,…,N)的动力学方程考虑了单链杆柔性机械臂和基于非刚性关节的拉丝直流电机的组合,具体形式如下:
Figure BDA0003693209190000041
其中,J1代表电机转动惯性,J2代表连杆转动惯性,q1表示链接角位移,q2表示电机轴,r和L分别表示电枢电阻和电感。I表示电枢电流,K表示弹簧常数,Kt表示扭矩常数,u(v)表示电枢电压,g表示重力加速度,d表示连杆重心的位置,F1表示电机粘性摩擦常数,F2表示连杆粘性摩擦常数,Kb表示反电动势常数,M表示链接质量,N表示齿轮传动比。
然后,通过引入状态变量,xi,1=q1
Figure BDA0003693209190000042
xi,3=q2
Figure BDA0003693209190000043
xi,5=i,并定义KtK=J1J2NL,可以将公式(1)的动态方程转化为以下五阶非严格反馈形式:
Figure BDA0003693209190000044
其中,
Figure BDA0003693209190000045
Figure BDA0003693209190000046
Figure BDA0003693209190000047
xi=[xi,1,xi,2,…xi,5]T∈R5代表第i个智能体的整个状态变量。yi∈R和ui∈R分别是第i个跟随者的输出和控制输入。领导者的动态模型可以表示为:
Figure BDA0003693209190000048
其中,yd∈R是领导者的输出,fd(xd,t)是一个关于t的分段连续函数,并且满足关于xd的局部利普希茨条件t≥0。
本实施例的主要控制目标是为柔性机械臂多智能体系统设计一种事件触发自适应神经跟踪控制方案,使闭环系统中的所有信号都是有界的,并且跟随者能够同步跟上领导者,基于此需要采用多种引理和假设,下面对采用的赢了和假设进行详细说明。
假设1:(1)如果领导者作为根节点,则增广图
Figure BDA00036932091900000514
包含一个有向生成树。(2)第i个追随者只能接收其邻居的状态信息。
假设2:有一个连续函数f(·)和一个正常数Xd,对于所有的控制时间t≥t0,不等式|fd(xd,t)|≤f(xd)和|xd(t)|≤Xd成立。
假设3:第i个跟随者的一致跟踪误差定义为:
Figure BDA0003693209190000051
其中i=1,2,…,5,aij和bi已经在拓扑图论中定义。
由于公式(4)包含了权值参数,即aij和aij,因此误差λi,1会受到增广图
Figure BDA00036932091900000513
的拓扑结构的影响。此外,对于所有的智能体i,bi+di>0成立。
引理1:根据图论,L+B是非奇异的。
引理2:定义λ1=(λ1,12,1,…,λ5,1)T,y=(y1,y2,…,y5)Ty d=(yd,yd,…,yd)T,那么有:
||y-y d||≤||λ1||/σ(L+B) (5)
其中,σ(L+B)为L+B的最小奇异值。
引理3:对于对于
Figure BDA0003693209190000052
以下不等式成立:
Figure BDA0003693209190000053
其中,ρ为一个常数,ρ=0.2785。
引理4:定义命令滤波器如下:
Figure BDA0003693209190000054
对于所有的命令过滤器,ωn>0和
Figure BDA0003693209190000055
都是正的设计参数。此外,αi-1和ωi分别是命令滤波的输入和输出。ωi的初始值为αi-1(0),ωi,2(0)=0。
在许多实际的系统模型中,总是存在一些未知的非线性函数,这在很大程度上影响了控制器的设计。为了克服这一困难,本发明使用径向基函数神经网络来逼近这些未知的非线性函数,比如在此系统中,针对于未知的函数f(xd)等,使用径向基函数神经网络来逼近。对于定义在一个紧集Ωz∈Rs上的连续的非线性函数g(x):Rn→R,总是有一个径向基函数为:
Figure BDA0003693209190000056
其中,
Figure BDA0003693209190000057
表示输入向量,
Figure BDA0003693209190000058
表示权重向量,
Figure BDA0003693209190000059
表示基函数向量。基函数
Figure BDA00036932091900000510
选择以下高斯函数的形式:
Figure BDA00036932091900000511
其中,μi=[μi1,…,μiq]T和η分别表示高斯函数的中心和宽度。对于给定的精度ε>0,当节点数量足够大时,可以逼近未知的连续函数g(x)的形式如下:
Figure BDA00036932091900000512
其中,ε(x)表示逼近误差,且满足|ε(x)|≤ε*,θ*为最优权重向量,定义为:
Figure BDA0003693209190000061
引理5:假设
Figure BDA0003693209190000062
是径向基函数神经网络的基函数向量,其中
Figure BDA0003693209190000063
那么,对于任意正整数k≤q,以下不等式成立:
Figure BDA0003693209190000064
S2:设计自适应神经命令滤波事件触发控制器
通过以下坐标变换,得到5步自适应神经反步跟踪控制方案为:
Figure BDA0003693209190000065
其中,k=1,...,5,λi,k表示命令滤波器的跟踪误差,ri,k表示命令滤波器的补偿信号,ωi,k表示命令滤波器的输出,vi,k表示补偿信号的跟踪误差。
基于此,每一步的虚拟控制器设计过程如下:
第一步:根据公式(13),补偿信号的跟踪误差vi,1的导数为:
Figure BDA0003693209190000066
选择一个合适的李亚普诺夫函数Vi,1为:
Figure BDA0003693209190000067
其中,ηi,1为正的设计常数,
Figure BDA0003693209190000068
时逼近误差。根据公式(14),李亚普诺夫函数Vi,1的导数为:
Figure BDA0003693209190000069
通过假设2和引理3,对于任何给定的ti,1>0,可以得到:
Figure BDA0003693209190000071
因此,将(17)代入(16)可以得到以下不等式:
Figure BDA0003693209190000072
其中,
Figure BDA0003693209190000073
Vi=[xi T,xj T,xd T]T
因为
Figure BDA0003693209190000074
包含未知的函数f(xd),所以不能直接处理。因此,根据径向基函数神经网络的函数逼近能力,对于给定的精度
Figure BDA0003693209190000075
存在一个神经网络
Figure BDA0003693209190000076
和一个紧集Ωi,1满足:
Figure BDA0003693209190000077
此外,利用Young’s不等式得到:
Figure BDA0003693209190000078
其中,
Figure BDA0003693209190000079
ai,1为正设计参数。由公式(20)代入到(18)得到:
Figure BDA00036932091900000710
选择合适的虚拟控制信号αi,1和补偿信号
Figure BDA00036932091900000711
如下:
Figure BDA00036932091900000712
Figure BDA00036932091900000713
其中ci,1是一个正常数。将公式(22)-(23)代入公式(21)中,可以得到:
Figure BDA0003693209190000081
然后,设计一个合适的自适应定律
Figure BDA0003693209190000082
如下:
Figure BDA0003693209190000083
通过将公式(24)代入公式(25),有:
Figure BDA0003693209190000084
第二步:补偿信号的跟踪误差vi,2的导数为:
Figure BDA0003693209190000085
选择一个合适的李亚普诺夫函数Vi,2为:
Figure BDA0003693209190000086
其中,ηi,2为一个正的设计常数。根据公式(27),可知李亚普诺夫函数Vi,2的导数为:
Figure BDA0003693209190000091
因为
Figure BDA0003693209190000092
是未知的,所以不能直接处理。因此,根据径向基函数神经网络的函数逼近能力,对于给定的精度
Figure BDA0003693209190000093
存在一个神经网络
Figure BDA0003693209190000094
和一个紧集Ωi,2满足:
Figure BDA0003693209190000095
然后,通过公式(30),可以将公式(29)变换为:
Figure BDA0003693209190000096
通过使用Young’s不等式和引理5,可以得到:
Figure BDA0003693209190000097
Figure BDA0003693209190000098
其中,
Figure BDA0003693209190000099
ai,2为正设计参数。将公式(32)-(33)代入公式(31),可以得到:
Figure BDA0003693209190000101
选择合适的虚拟控制信号αi,2和补偿信号
Figure BDA0003693209190000102
如下:
Figure BDA0003693209190000103
Figure BDA0003693209190000104
其中,ci,2是一个正常数。将公式(35)-(36)代入公式(34)中,可以得到:
Figure BDA0003693209190000111
同时,设计一个合适的自适应定律
Figure BDA0003693209190000112
为:
Figure BDA0003693209190000113
通过将公式(38)代入公式(37),有:
Figure BDA0003693209190000114
第三步:补偿信号的跟踪误差vi,3的导数为:
Figure BDA0003693209190000121
选择一个合适的李亚普诺夫函数Vi,3为:
Figure BDA0003693209190000122
根据公式(40),可知Vi,3的导数是:
Figure BDA0003693209190000123
选择合适的虚拟控制信号αi,3和补偿信号
Figure BDA0003693209190000124
如下:
Figure BDA0003693209190000125
Figure BDA0003693209190000126
其中ci,3是一个正常数。将公式(43)-(44)代入公式(42)中,可以得到:
Figure BDA0003693209190000127
第四步:补偿信号的跟踪误差vi,4的导数为:
Figure BDA0003693209190000128
选择一个合适的李亚普诺夫函数Vi,4为:
Figure BDA0003693209190000131
其中,ηi,4为一个正设计常数。根据公式(46),可知Vi,4的导数是:
Figure BDA0003693209190000132
因为
Figure BDA0003693209190000133
是未知的,所以不能直接处理。因此,根据径向基函数神经网络的函数逼近能力,对于给定的精度
Figure BDA0003693209190000134
存在一个神经网络
Figure BDA0003693209190000135
和一个紧集Ωi,4满足:
Figure BDA0003693209190000136
然后,通过公式(49),可以将公式(48)变换为:
Figure BDA0003693209190000137
通过使用Young’s不等式和引理5,可以得到:
Figure BDA0003693209190000138
Figure BDA0003693209190000141
其中,
Figure BDA0003693209190000142
ai,4为正设计参数。将公式(51)-(52)代入公式(50),可以得到:
Figure BDA0003693209190000143
选择合适的虚拟控制信号αi,4和补偿信号
Figure BDA0003693209190000144
如下:
Figure BDA0003693209190000145
Figure BDA0003693209190000146
其中ci,4是一个正常数。将公式(54)-(55)代入公式(53)中,可以得到:
Figure BDA0003693209190000151
同时,设计一个合适的自适应定律
Figure BDA0003693209190000152
为:
Figure BDA0003693209190000153
通过将公式(57)代入公式(56),有:
Figure BDA0003693209190000161
第五步:补偿信号的跟踪误差vi,5的导数为:
Figure BDA0003693209190000162
选择一个合适的李亚普诺夫函数Vi,5为:
Figure BDA0003693209190000163
其中,ηi,5为一个正设计常数。根据(59),可知Vi,5的导数是:
Figure BDA0003693209190000164
因为
Figure BDA0003693209190000165
是未知的,所以不能直接处理。因此,根据径向基函数神经网络的函数逼近能力,对于给定的精度
Figure BDA0003693209190000166
存在一个神经网络
Figure BDA0003693209190000167
和一个紧集Ωi,5满足:
Figure BDA0003693209190000168
然后,令
Figure BDA0003693209190000169
通过公式(62),公式(61)可以转化为:
Figure BDA0003693209190000171
此外,利用Young’s不等式可以得到:
Figure BDA0003693209190000172
Figure BDA0003693209190000173
其中,
Figure BDA0003693209190000174
ai,5为正设计参数。将(64)-(65)代入(63),可以得到:
Figure BDA0003693209190000175
接下来,设计了具有相对阈值的事件触发控制策略如下:
Figure BDA0003693209190000176
Figure BDA0003693209190000177
Figure BDA0003693209190000178
其中,e(t)=wi(t)-ui(t)表示误差,tk、0<δ<1、m1>0、ε>0和
Figure BDA0003693209190000179
均为设计的正参数。通过上述策略,可以得到:
Figure BDA00036932091900001710
其中,h1(t)和h2(t)是时变参数,并且满足|h1(t)|≤1,|h2(t)|≤1。因此,可以得到
Figure BDA00036932091900001711
Figure BDA00036932091900001712
然后,将公式(67)-(70)代入公式(66),可以得到:
Figure BDA0003693209190000181
其中,
Figure BDA0003693209190000182
整合公式(72)和(71)可以转换为:
Figure BDA0003693209190000183
选择合适的虚拟控制信号αi,5和补偿信号
Figure BDA0003693209190000184
如下:
Figure BDA0003693209190000191
Figure BDA0003693209190000192
其中ci,5是一个正常数。将公式(74)-(75)代入(73)中,可以得到:
Figure BDA0003693209190000201
同时,设计一个合适的自适应定律
Figure BDA0003693209190000202
为:
Figure BDA0003693209190000211
通过将公式(77)代入公式(76),有:
Figure BDA0003693209190000212
根据以上的讨论,可以得到以下主要结果。考虑柔性机械臂多智能体系统[公式(2)]、领导者动力学方程[公式(3)],在基于假设1-3下假设可以得到虚拟控制律[公式(22)、(35)、(43)、(54)和(74)],自适应律[公式(25)、(38)、(57)和(77)],和事件触发机制[公式(67)-(69)]。所提出的控制策略保证了闭环系统中的所有信号都是一致有界的,跟踪误差可以收敛到原点的一个小邻域。根据Young’s不等式,可以得到:
Figure BDA0003693209190000213
把公式(79)代入到(78)中,可以得到:
Figure BDA0003693209190000214
然后,可以将公式(80)写成如下形式:
Figure BDA0003693209190000215
其中C=min{ci,ji,j,j=1,...,5,k=1,2,4,5},
Figure BDA0003693209190000216
通过在集合[0,t]上整合公式(81),有:
Figure BDA0003693209190000217
即:
Figure BDA0003693209190000218
这意味着
Figure BDA0003693209190000221
这证明了vi,1是有界的,vi,k,k=2,3,4,5也是有界的。
为了保证跟踪误差λi,k=vi,k+ri,k的有界性,还需要考虑ri,k的有界性。为了分析ri,k的有界性,根据公式(23)、(36)、(44)、(55)和(75),选择李雅普诺夫函数Vr为:
Figure BDA0003693209190000222
Vr的导数为:
Figure BDA0003693209190000223
已知命令滤波的输出与虚拟控制之间的关系满足||ωi,k+1i,k||≤ξi,k,其中ξi,k为已知常数。结合Young’s不等式,公式(86)可以写成:
Figure BDA0003693209190000224
然后,可以将公式(87)重写为以下形式:
Figure BDA0003693209190000225
其中
Figure BDA0003693209190000226
然后,可以得到:
Figure BDA0003693209190000227
通过上述分析,可以知道补偿信号ri,k也是有界的。然后,结合公式(84)和(89),跟踪误差λi,k有界。通过引理2,对于任意ε>0,通过设计适当的参数得到以下不等式:
Figure BDA0003693209190000231
然后,可以得到以下不等式:
Figure BDA0003693209190000232
基于以上分析,因为vi,k和ri,k分别是有界的,所以可以总结得出信号λi,k是有界的。因此,它表明了闭环系统中的所有信号都是有界的。
为了证明所涉及的控制器的有效性,进行如下仿真实验,柔性单链机械臂多智能体系统参数选择如下:
M=0.4Kg,g=10N/Kg,d=0.03m,F1=0.05Nms/rad,F2=1.5Nms/rad,J1=0.01Kgm2,
J2=0.5Kgm2,N=1,K=10,Kt=10Nm/A,Kb=0.1Nm/A,R=1.5Ω,L=2H。
Figure BDA0003693209190000233
B=[3 0 0],[d1d2 d3]=[0 1 2]。
在仿真实验中,本实施例选择合适的参数如下:
[c11 c12 c13 c14 c15]=[180 30 40 80 80],ηij=10,(i=1,…3;j=1,2,4,5),
[c21 c22 c23 c24 c25]=[230 30 40 80 80],σij=0.001,(i=1,…3;j=1,2,4,5),
[c31 c32 c33 c34 c35]=[180 33 37 80 80],aij=100,(i=1,…3;j=1,…5),
i2 ωi3 ωi4 ωi5]=[21 30 3 10](i=1,…,3),δ=0.5,
Figure BDA0003693209190000234
ε=1.2,T=50,m=0.07。
初始条件本实施例选择为:
x1(0)=x2(0)=0,其他的初始条件都为0。
仿真结果如图3-图9所示,具体如下:
图3表明根据一种柔性单链机械臂多智能体的跟踪控制方法所设计的自适应神经事件触发控制器能够保证跟随者的输出可以跟踪上领导者的输出。
图4表明采用本实施例提供的柔性单链机械臂多智能体的跟踪控制方法能够保证跟随者的输出和领导者的输出之间的误差可以尽可能的小。
图5表明根据柔性单链机械臂多智能体的跟踪控制方法所设计的自适应神经事件触发控制器能够保证控制输入的有界性。
图6给出了智能体1的状态变量x1,1,x1,2,x1,3,x1,4,x1,5轨迹波形图。图7给出了智能体2的状态变量x2,1,x2,2,x2,3,x2,4,x2,5轨迹波形图。图8给出了智能体3的状态变量x3,1,x3,2,x3,3,x3,4,x3,5轨迹波形图。图6-8表明根据柔性单链机械臂多智能体的跟踪控制方法所设计的自适应神经事件触发控制器能够保证闭环系统中的所有变量都是有界的。
其中,仿真时事件触发的次数以及时间间隔间的关系如图9的(a)部分至(c)部分所示。
本实施例提供的柔性单链机械臂多智能体的跟踪控制方法,有着明显的控制效果与优势。采用了命令滤波技术,引入了补偿信号,补偿了动态面技术中忽略的虚拟控制信号和实际控制信号之间的误差,解决了传统反步框架中存在的“复杂性爆炸”的问题。
本实施例不同于传统的时间触发控制,提出的关于一种柔性单链机械臂多智能体基于事件触发的命令滤波控制方法,采用了相对阈值策略,根据控制信号的大小调整阈值大小,只有满足触发条件时才会被触发,控制器的输出才能作用于系统,大大降低了带宽的压力,并减少了通信资源的浪费。利用反步法和径向基函数神经网络的逼近未知函数的能力,构造的自适应事件触发控制器保证了闭环系统内的所有信号有界,跟随者的输出能够同步跟踪上领导者的输出。
实施例二
该实施例提供了一种柔性单链机械臂多智能体基于事件触发的命令滤波的跟踪控制系统,如图10所示,该系统包括:
动力学方程确定模块10-1,用于确定柔性单链机械臂多智能体的动力学方程。
五阶非严格反馈形式转换模块10-2,用于将动力学方程转换为五阶非严格反馈形式,获得转换后的动力学方程。
自适应神经事件触发控制器获取模块10-3,用于根据转换后的动力学方程,采用反步法和命令滤波技术,设计每一步的虚拟控制器,并引入相对阈值的事件触发策略,得到柔性单链机械臂多智能体的自适应神经事件触发控制器。
控制模块10-4,用于基于自适应神经事件触发控制器对柔性单链机械臂多智能体进行控制。
需要说明的是,上述模块的具体工作方法采用实施例一中公开的方法实现,具体不再赘述。
实施例三
该实施例中提供了一种电子设备,该电子设备包括处理器和计算机可读存储介质。
处理器与计算机可读存储介质连接。计算机可读存储介质中存储有多条指令。指令用于实施上述提供的柔性单链机械臂多智能体的跟踪控制方法。处理器用于加载并执行计算机可读存储介质中存储的多条指令。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
计算机可读存储介质可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述实施一中提供的方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种柔性单链机械臂多智能体的跟踪控制方法,其特征在于,包括:
确定柔性单链机械臂多智能体的动力学方程;
将所述动力学方程转换为五阶非严格反馈形式,获得转换后的动力学方程;
根据转换后的动力学方程,采用反步法和命令滤波技术,设计每一步的虚拟控制器,并引入相对阈值的事件触发策略,得到柔性单链机械臂多智能体的自适应神经事件触发控制器;
基于所述自适应神经事件触发控制器对柔性单链机械臂多智能体进行控制;
所述命令滤波技术中采用的命令滤波器为:
Figure FDA0004005735500000011
其中,ωn>0,
Figure FDA0004005735500000012
ωn
Figure FDA0004005735500000013
均表示设计参数,αi-1表示命令滤波器的输入,ωi表示命令滤波器的输出,
Figure FDA0004005735500000014
表示命令滤波的输出变化率,
Figure FDA0004005735500000015
表示命令滤波的状态变化率,ωi,2表示命令滤波的中间状态。
2.根据权利要求1所述的柔性单链机械臂多智能体的跟踪控制方法,其特征在于,在设计每一步的虚拟控制器的同时,进行坐标转换,并引入补偿信号。
3.根据权利要求1所述的柔性单链机械臂多智能体的跟踪控制方法,其特征在于,所述动力学方程为:
Figure FDA0004005735500000016
其中,J1表示电机转动惯性,J2表示连杆转动惯性,q1表示链接角位移,q2表示电机轴,r表示电枢电阻,L表示电枢电感,I表示电枢电流,K表示弹簧常数,Kt表示扭矩常数,u(v)表示电枢电压,g表示重力加速度,d表示连杆重心的位置,F1表示电机粘性摩擦常数,F2表示连杆粘性摩擦常数,Kb表示反电动势常数,M表示链接质量,N表示齿轮传动比,
Figure FDA0004005735500000017
表示链接角速度,
Figure FDA0004005735500000018
表示链接角加速度,
Figure FDA0004005735500000019
表示连杆角速度,
Figure FDA00040057355000000110
表示连杆角加速度,
Figure FDA0004005735500000021
表示电流变化率。
4.根据权利要求3所述的柔性单链机械臂多智能体的跟踪控制方法,其特征在于,转换后的动力学方程为:
Figure FDA0004005735500000022
其中,xi,1=q1
Figure FDA0004005735500000023
xi,3=q2
Figure FDA0004005735500000024
xi,5=i;
Figure FDA0004005735500000025
Figure FDA0004005735500000026
Figure FDA0004005735500000027
xi=[xi,1,xi,2,…xi,5]T∈R5,表示第i个智能体的整体状态变量;
yi∈R表示第i个跟随者的输出,ui∈R表示第i个跟随者的控制输入,R为实数集。
5.根据权利要求1所述的柔性单链机械臂多智能体的跟踪控制方法,其特征在于,所述自适应神经事件触发控制器为:
Figure FDA0004005735500000028
其中,k=1,...,5,λi,k表示命令滤波器的跟踪误差,ri,k表示命令滤波器的补偿信号,ωi,k表示命令滤波器的输出,vi,k表示补偿信号的跟踪误差,xi,k表示状态变量。
6.一种柔性单链机械臂多智能体的跟踪控制系统,其特征在于,包括:
动力学方程确定模块,用于确定柔性单链机械臂多智能体的动力学方程;
五阶非严格反馈形式转换模块,用于将所述动力学方程转换为五阶非严格反馈形式,获得转换后的动力学方程;
自适应神经事件触发控制器获取模块,用于根据转换后的动力学方程,采用反步法和命令滤波技术,设计每一步的虚拟控制器,并引入相对阈值的事件触发策略,得到柔性单链机械臂多智能体的自适应神经事件触发控制器;
控制模块,用于基于所述自适应神经事件触发控制器对柔性单链机械臂多智能体进行控制;
所述命令滤波技术中采用的命令滤波器为:
Figure FDA0004005735500000031
其中,ωn>0,
Figure FDA0004005735500000032
ωn
Figure FDA0004005735500000033
均表示设计参数,αi-1表示命令滤波器的输入,ωi表示命令滤波器的输出,
Figure FDA0004005735500000034
表示命令滤波的输出变化率,
Figure FDA0004005735500000035
表示命令滤波的状态变化率,ωi,2表示命令滤波的中间状态。
7.一种电子设备,其特征在于,包括处理器和计算机可读存储介质;
所述处理器与所述计算机可读存储介质连接;所述计算机可读存储介质中存储有多条指令;所述指令用于实施如权利要求1-5任意一项所述的柔性单链机械臂多智能体的跟踪控制方法;所述处理器用于加载并执行所述计算机可读存储介质中存储的多条指令。
CN202210670506.8A 2022-06-14 2022-06-14 一种柔性单链机械臂多智能体的跟踪控制方法和系统 Active CN115008456B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210670506.8A CN115008456B (zh) 2022-06-14 2022-06-14 一种柔性单链机械臂多智能体的跟踪控制方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210670506.8A CN115008456B (zh) 2022-06-14 2022-06-14 一种柔性单链机械臂多智能体的跟踪控制方法和系统

Publications (2)

Publication Number Publication Date
CN115008456A CN115008456A (zh) 2022-09-06
CN115008456B true CN115008456B (zh) 2023-02-10

Family

ID=83075050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210670506.8A Active CN115008456B (zh) 2022-06-14 2022-06-14 一种柔性单链机械臂多智能体的跟踪控制方法和系统

Country Status (1)

Country Link
CN (1) CN115008456B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107662208A (zh) * 2017-08-24 2018-02-06 浙江工业大学 一种基于神经网络的柔性关节机械臂有限时间自适应反步控制方法
CN109465825A (zh) * 2018-11-09 2019-03-15 广东工业大学 机械臂柔性关节的rbf神经网络自适应动态面控制方法
CN110253572A (zh) * 2019-05-31 2019-09-20 广东工业大学 一种基于扰动观测器的输入饱和多单臂机械手的事件触发控制方法
CN110275436A (zh) * 2019-05-31 2019-09-24 广东工业大学 一种多单臂机械手的rbf神经网络自适应控制方法
CN110275435A (zh) * 2019-05-24 2019-09-24 广东工业大学 基于观测器的多单臂机械手输出一致自适应命令滤波控制方法
CN110936374A (zh) * 2019-10-18 2020-03-31 西安工程大学 一种柔性双关节机械臂命令滤波反步控制方法
CN112338912A (zh) * 2020-10-13 2021-02-09 山东师范大学 一种柔性单链机械臂的有限时间稳定控制方法及系统
CN113296398A (zh) * 2021-04-14 2021-08-24 山东师范大学 一种柔性单链机械臂基于事件触发的命令滤波控制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111136633B (zh) * 2020-01-13 2021-04-09 燕山大学 针对时变时延下柔性主-从机器人系统的全状态控制方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107662208A (zh) * 2017-08-24 2018-02-06 浙江工业大学 一种基于神经网络的柔性关节机械臂有限时间自适应反步控制方法
CN109465825A (zh) * 2018-11-09 2019-03-15 广东工业大学 机械臂柔性关节的rbf神经网络自适应动态面控制方法
CN110275435A (zh) * 2019-05-24 2019-09-24 广东工业大学 基于观测器的多单臂机械手输出一致自适应命令滤波控制方法
CN110253572A (zh) * 2019-05-31 2019-09-20 广东工业大学 一种基于扰动观测器的输入饱和多单臂机械手的事件触发控制方法
CN110275436A (zh) * 2019-05-31 2019-09-24 广东工业大学 一种多单臂机械手的rbf神经网络自适应控制方法
CN110936374A (zh) * 2019-10-18 2020-03-31 西安工程大学 一种柔性双关节机械臂命令滤波反步控制方法
CN112338912A (zh) * 2020-10-13 2021-02-09 山东师范大学 一种柔性单链机械臂的有限时间稳定控制方法及系统
CN113296398A (zh) * 2021-04-14 2021-08-24 山东师范大学 一种柔性单链机械臂基于事件触发的命令滤波控制方法

Also Published As

Publication number Publication date
CN115008456A (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
CN108646758B (zh) 一种多移动机器人预设性能编队控制器结构及设计方法
CN110275436B (zh) 一种多单臂机械手的rbf神经网络自适应控制方法
CN109683477B (zh) 一种随机多智能体系统有限时间控制器的设计方法及系统
Wang et al. Adaptive finite time coordinated consensus for high-order multi-agent systems: Adjustable fraction power feedback approach
CN110193833B (zh) 多机械臂系统的自适应有限时间命令滤波反步控制方法
CN110275435A (zh) 基于观测器的多单臂机械手输出一致自适应命令滤波控制方法
CN110262247B (zh) 多机器人系统的分布式命令滤波模糊控制方法
Xia et al. Optimal synchronization control of heterogeneous asymmetric input-constrained unknown nonlinear MASs via reinforcement learning
Li et al. Adaptive consensus of non-strict feedback switched multi-agent systems with input saturations
Wang et al. Command filter based globally stable adaptive neural control for cooperative path following of multiple underactuated autonomous underwater vehicles with partial knowledge of the reference speed
CN113110055B (zh) 时滞切换系统的自适应事件触发输出反馈控制方法及系统
Shang et al. Neural adaptive tracking control for a class of high-order non-strict feedback nonlinear multi-agent systems
CN114367980B (zh) 基于确定学习的封闭机器人速度补偿跟踪控制方法、存储介质及机器人
CN112769368A (zh) 基于分数阶滑模控制器的永磁直流电机控制方法及系统
CN115657482A (zh) 具有时变输入时滞的多单连杆机械臂协同控制方法及系统
CN113268083A (zh) 基于动态事件触发的多无人机系统编队跟踪控制方法
CN111338213B (zh) 一种基于事件触发机制的多水下航行器自适应模糊二部一致控制方法
CN113977572B (zh) 一种基于宽度径向基神经网络的机械臂阻抗学习控制方法
CN115008456B (zh) 一种柔性单链机械臂多智能体的跟踪控制方法和系统
Liu et al. Adaptive finite-time consensus tracking for nonstrict feedback nonlinear multi-agent systems with unknown control directions
Ren et al. Event-Based Predefined-Time Fuzzy Formation Control for Nonlinear Multi-Agent Systems with Unknown Disturbances
Liang et al. Distributed data-driven iterative learning point-to-point consensus tracking control for unknown nonlinear multi-agent systems
CN115963729A (zh) 一种机械臂预设时间自适应神经网络协同控制方法
CN113515066B (zh) 一种非线性多智能体系统动态事件触发控制方法
Nath et al. Design of neural network based sliding mode controller for a class of nonlinear system: an event-triggered framework

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant