CN104865829B - 多机器人系统分布式自适应神经网络连续跟踪控制方法 - Google Patents

多机器人系统分布式自适应神经网络连续跟踪控制方法 Download PDF

Info

Publication number
CN104865829B
CN104865829B CN201510137004.9A CN201510137004A CN104865829B CN 104865829 B CN104865829 B CN 104865829B CN 201510137004 A CN201510137004 A CN 201510137004A CN 104865829 B CN104865829 B CN 104865829B
Authority
CN
China
Prior art keywords
follower
represent
neutral net
formula
pilotage people
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510137004.9A
Other languages
English (en)
Other versions
CN104865829A (zh
Inventor
马广富
孙延超
李传江
陈亮名
刘萌萌
王俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Sichuan Harbin Industrial Robot and Intelligent Equipment Technology Research Institute Co.,Ltd.
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201510137004.9A priority Critical patent/CN104865829B/zh
Publication of CN104865829A publication Critical patent/CN104865829A/zh
Application granted granted Critical
Publication of CN104865829B publication Critical patent/CN104865829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Abstract

多机器人系统分布式自适应神经网络连续跟踪控制方法,属于机器人系统控制领域。现有的多机器人系统的协调跟踪控制方法使多机器人系统存在参数不确定性和外界干扰的问题。一种多机器人系统分布式自适应神经网络连续跟踪控制方法,首先,在仅有部分跟随者可以获得动态领航者状态信息的情况下,为使所有跟随者都可获得动态领航者的状态信息,在存在通讯时延的限制下设计分布式观测器。然后,考虑系统存在参数不确定性和外界干扰,利用两个神经网络设计的分布式自适应跟踪控制表达式进行控制,使逼近误差趋于零。此外,分布式自适应跟踪控制表达式的控制算法为连续控制,因此不会给系统带来抖振且具有更大的实际应用价值。最后,仿真实验验证了控制算法的有效性。

Description

多机器人系统分布式自适应神经网络连续跟踪控制方法
技术领域
本发明涉及一种多机器人系统分布式自适应神经网络连续跟踪控制方法。
背景技术
随着现代科技的迅猛发展,机器人技术在工业、医疗、农业、娱乐等多个领域得到了广泛应用。多机器人协调控制是指多个机器人在通讯网络的作用下,不断交互状态信息,从而形成有效的控制,最终使所有机器人达到规则有序的协同运动。多机器人协调控制是一门综合性的学科,它的发展得到了学术界和工业界的认可。多机器人协调控制具有高效率、高灵活性和高容错性的特点,能够完成单个机器人无法完成的工作任务。近年来,多机器人系统的分布式协调控制引发了广泛的关注,在许多领域(如:编队运动和紧急救灾等)呈现了广阔的应用前景。
多机器人系统模型的分类有:以往多机器人协调控制研究都是以线性积分器模型作为机器人的运动模型。然而,大多数的实际物理系统都具有本质非线性的特点,线性积分器模型的研究成果也就很难应用于工程实际。因而,以非线性模型为机器人运动模型的多机器人协调控制有着更实际的应用价值。Euler-Lagrange系统模型是一种二阶非线性模型,它可以用来表示许多实际系统的运动,如机器人、直升机和航天器等。因而,以Euler-Lagrange为系统模型的多机器人协调控制具有广阔的工业应用价值。许多学者对多Euler-Lagrange系统的协调控制问题进行了研究。
多机器人系统领航者个数的分类情况为:根据多机器人系统中领航者个数分类,多机器人协调控制问题分为无领航者的一致性控制问题、单领航者的跟踪控制问题和多领航者的包含控制问题。单领航者跟踪控制的目的是通过控制跟随机器人各个关节的驱动力矩,使得跟随机器人关节的位置、速度等状态变量跟踪给定的或是由领航者产生的目标轨迹。由于跟踪运动与实际需要更为符合,所以多机器人协调跟踪控制问题得到充分重视。
现有的多机器人协调跟踪控制问题的解决主要有两种方案:
第一种方案:
针对多机器人系统的协调跟踪控制问题,在三种限制条件下分别提出三种跟踪控制算法。全文以有向图作为机器人的通讯拓扑,并假设该网络拓扑存在一个有向生成树。第一种控制算法假设每个跟随者均可获得领航者的状态信息,通过控制器引入相关符号函数项使系统最终收敛,该控制算法虽然具有较好的鲁棒性,但其控制器中引入了非连续符号函数,给系统带来抖振。第二种控制算法假设只有部分跟随者可以获得领航者状态信息的条件下,同时考虑系统存在模型不确定性和外界干扰,通过设计分布式跟踪控制算法,使系统的全局跟踪误差有界。虽然第二种控制算法是分布式的,但其控制器中需要用到邻居的相对速度信息,加重了系统的通讯负担。第三种控制算法正是为了解决以上问题,在无需用到邻居相对速度信息的条件下,通过引入低通滤波器来实现系统的最终跟踪误差达到一致有界。
方案具体内容如下:
Euler-Lagrange模型:
相关辅助变量设计
首先分别定义跟踪误差向量ei(t)和滤波跟踪误差向量ri(t):
ei(t)=q0(t)-qi(t) (48)
第一种控制算法具体为:
明显该算法用到了符号函数sgn(),固会给系统带来抖振。
第二种控制算法具体为:
由于控制算法τi中用到了固需要相应测量设备获得邻居的相对速度信息,从而增大通讯负担。
第三种控制算法具体为:
该控制算法通过如式(55)所示的低通滤波器来避免第二种控制算法要求的相对速度信息。
方案的缺点描述如下:
第一种控制算法引入相关符号函数项设计的控制器使系统最终收敛,该控制算法虽然具有较好的鲁棒性,但其控制器中引入了非连续符号函数,这会给系统带来抖振,从而带来不利影响。虽然第二种控制算法是分布式的,但其需要用到邻居的相对速度信息,增加了系统通讯负担。第三种算法通过设计低通滤波器来实现系统最终跟踪误差达到一致有界,增加了系统的运算处理负担,实时性变差。且以上算法均未考虑系统通讯时延的影响。
第二种方案:
对于无领航者机器人的一致性控制问题和有领航者机器人的跟踪控制问题。首先针对无领航者一致性控制问题,在系统是否存在未知恒定通讯时延两种情况下分别设计控制算法,两种控制算法均基于参数线性化假设,最终均使系统所有智能体的状态趋于全局一致,即实现了各个智能体间的位置和速度差均渐近趋于零。对于存在领航者跟踪控制问题,通过假设该领航者时变轨迹信息是全局已知的,在一致性控制算法基础上,通过调整参数设计的跟踪控制算法同样使系统趋于全局稳定。
方案具体内容如下:
Euler-Lagrange模型
设计相关辅助变量
当α=1时,对应于跟踪控制问题;当α=0时,对应于一致性控制问题。
系统不存在通讯时延
设计如下形式的自适应跟踪控制算法
该算法设计时用到了参数线性化的假设,但无法处理系统存在非线性不确定性和外界干扰的情况。
系统存在恒定未知通讯时延
该算法设计同样用到了参数线性化的假设,因而无法处理系统存在非线性不确定性和外界干扰的情况。
方案的缺点描述如下:
以上两种控制算法均未考虑系统存在非线性不确定性和外界干扰的情况,因而鲁棒性较差。对于无领航者一致性控制算法具有一定应用缺陷,对于有领航者的跟踪控制算法要求领航者状态信息是全局已知这一条件过于苛刻,在实际情况下难以实现。
发明内容
本发明的目的是为了解决现有的多机器人系统的协调跟踪控制方法使多机器人系统存在参数不确定性和外界干扰的问题,而提出一种多机器人系统分布式自适应神经网络连续跟踪控制方法。
一种多机器人系统分布式自适应神经网络连续跟踪控制方法,所述控制方法通过以下步骤实现:
步骤一、多机器人协调控制系统中,根据Euler-Lagrange模型:和动态领航者辅助状态量v,建立第i个跟随者的时变轨迹公式:
qn+1=Fv;
式中:qi∈Rp表示跟随者广义坐标;Mi(qi)∈Rp×p表示对称正定的惯量矩阵;表示Coriolis力和向心力矩阵;Gi(qi)∈Rp表示重力约束矩阵;τi∈Rp表示作用在跟随者i上的广义控制力,ωi∈Rp表示外界干扰;v表示动态领航者辅助状态量;S∈Rm×m和F∈Rn×m为常值实数矩阵;
步骤二、在存在通讯时延的情况下设计分布式观测器,其控制公式为:使所有跟随者都能对领航者的状态信息进行估计,且能保证观测误差有界,即:令ηn+1=v,
式中:ηi∈Rm表示跟随者对领航者的状态的估计;t表示时间;τ表示跟随者与领航者间网络通讯的固定时延;di为正常数,满足表示与第i个跟随者相邻的机器人个数之和的倒数;由图论的知识,当i≠j且(υij)∈ε时,否则U0表示观测误差的上界;
步骤三、设计一组backstepping相关辅助变量,以对利用backstepping进行控制律的设计做准备:
所述backstepping相关辅助变量为:
qri=Fηi,qri表示跟随者对领航者的广义坐标的估计,
Z1i=qi-qri,表示跟随者的广义坐标与跟随者对领航者的广义坐标的估计的差值,
α1i表示中间计算过程起辅助作用的虚拟控制量;
并对辅助变量Z1i=qi-qri求导,得:
再设计并代入辅助变量中得:
式中:K1i为常值正定矩阵;
步骤四、对未知非线性项采用神经网络进行逼近,分为两步进行处理:
首先,将步骤三得到的带入步骤一所述的第i个跟随者的运动方程,得:其中,采用神经网络对未知非线性项进行逼近处理,那么fi表示为:跟随者i对fi的估计变量设计为:控制系统中仍存在神经网络逼近误差εi和外界干扰ωi,进一步表示为再采用RBF神经网络逼近符号函数的方法对fAi(Z2i)进行估计,对神经网络逼近误差εi和外界干扰ωi进行处理同时消除抖振对控制系统的影响:估计变量设计为
式中:φi表示神经元的激活函数;Wi表示最优神经网络权值矩阵;表示最优神经网络权值矩阵的估计;ki=ωMiMi,kAi≥ki,ωMi,εMi分别表示外界干扰ωi和神经网络逼近误差εi的上界值;hi表示由高斯基函数构成的径向基向量;
步骤五、至此,对步骤一所述第i个跟随者的时变轨迹设计分布式控制方法表达式:
使控制系统神经网络逼近误差εi趋于零,且以具有较好的鲁棒性;
式中:γ为正常数,表示;r1,r2都为正常数,表示;K2i为常值正定矩阵,表示。
本发明的有益效果为:
本发明设计分布式观测器,在存在通讯时延的限制下,使每个跟随者机器人都可以获得领航者机器人的状态信息,并使观测误差有界。
考虑系统存在非线性不确定性,通过神经网络进行逼近,从而使系统具有较好的鲁棒性。
对于神经网络逼近非线性不确定性所产生的逼近误差和外界干扰,考虑再次利用神经网络逼近符号函数的方法来抵消非线性不确定性逼近误差和外界干扰对系统的影响。
控制系统为连续控制系统,不存在抖振现象。
考虑系统存在通讯时延,这与实际情况更为符合。
仅有部分跟随者机器人可以获得领航者机器人的状态信息,设计的观测器和控制器均为分布式的。
附图说明
图1为本发明涉及的RBF神经网络结构;
图2为本发明实施例1涉及的机器人间通讯拓扑图;
图3为本发明实施例1涉及的各跟随者关节1跟踪领航者关节1的运动轨迹;图中,横坐标表示时间,纵坐标表示跟随者的广义坐标与跟随者对领航者的广义坐标的估计的差值;
图4为本发明实施例1涉及的各跟随者关节2跟踪领航者关节2的运动轨迹;图中,横坐标表示时间,纵坐标表示跟随者的广义坐标与跟随者对领航者的广义坐标的估计的差值;
图5为本发明的连续跟踪控制方法流程图。
具体实施方式
具体实施方式一:
结合图1和图5说明本实施方式的多机器人系统分布式自适应神经网络连续跟踪控制方法,首先,对本实施方式中应用到的相关技术进行介绍:
1、Euler-Lagrange模型:
依据Euler-Lagrange模型:
表示第i个跟随机器人的运动方程;其中qi∈Rp表示跟随者广义坐标,Mi(qi)∈Rp×p表示对称正定的惯量矩阵,表示Coriolis力和向心力矩阵,Gi(qi)∈Rp表示重力约束矩阵,τi∈Rp表示作用在跟随者i上的广义控制力,ωi∈Rp表示外界干扰。其中,Mi(qi),Gi(qi)均为未知量。
2、分布式跟踪控制:
跟踪控制是指多机器人系统中仅存在一个领航者的协调控制问题。该领航者可以是实际意义下的领队机器人,也可以是系统虚拟假定的目标轨迹。其他机器人被称为跟随者,每个跟随者通过整个系统组成的网络拓扑结构与其他跟随者或领航者进行通讯,进而形成有效的控制,最终实现对领航者目标轨迹的跟踪。分布式是指系统组成的网络通讯结构中,领航者信息仅仅能够被一部分跟随者获得,而不是全局已知的通讯方式。由于这种通讯方式与实际情况更为符合,所以得到了大量应用。
3、连续控制:
连续控制是指控制系统所设计的控制器函数具有连续性质,即不存在突变、奇点等情况。一般情况下,若是系统控制器中引入符号函数,则为不连续控制,因为符号函数存在数值突变的情况。非连续控制器会导致系统出现抖振,引入高频未建模动态,使控制系统的动态品质下降。
4、分布式观测器:
通过设计观测器可以使跟随者间接获得领航者状态信息。若对跟随者所设计的观测器,仅仅用到该跟随者邻居的状态信息,则该观测器称为分布式观测器。
5、Backstepping控制:
反步法(backstepping)是一类特殊的处理非线性系统的控制方法,它的设计思路是将复杂的非线性系统分解为多个不可约子系统,然后通过设计Lyapunov函数和虚拟控制量来稳定每个子系统,当得到整个系统的控制律时终止。反步控制方法有很快的收敛速度。
6、神经网络:
神经网络对函数具有良好的逼近能力,常被用于补偿系统中的非线性不确定和外界干扰。神经网络对系统中的未知非线性项fi进行补偿时,fi即可表示为:
式中,Wi表示最优神经网络权值矩阵,φi表示神经元的激活函数,θi表示神经网络逼近误差,且该神经网络逼近误差是有界的。神经元的激活函数有很多选择,如sigmoid函数、双曲正切函数以及高斯函数等。那么,对未知非线性项fi的估计为:
式中,为最优神经网络权值矩阵的估计。
如下以多输入单输出的3层RBF神经网络为例进行简单介绍,其结构如图1所示。
在RBF神经网络结构中,x=[x1,x2,…,xr]T为网络的r维输入向量,径向基向量为h=[h1,h2,…,hm]T,其中hj通常取为高斯基函数,即:
式中,cj为网络中第j个节点的中心向量,cj=[cj1,cj2,…,cjn]T;b=[b1,b2,…,bm]T为网络的基宽向量,bj>0为节点j的基宽值。如果已知网络的权值向量为w=[w1,w2,…,wm]T,则RBF神经网络的输出为:ym=w1h1+w2h2+…+wmhm (5)。
7、网络拓扑结构:
本文用有向图来表示多机器人系统间的信息交互。多机器人系统由n个跟随者(记为I={1,...,n})和1个动态领航者(记为n+1)组成。图G由顶点集υ={1,...,n,n+1},边集和邻接矩阵组成。顶点集υ中的任意一个元素υi代表第i个机器人。有向图的边(υi,υj)∈ε表示机器人j能够获取机器人i的信息,υi为υj的父节点,υj为υi的子节点,并记υi为υj的邻居。若有向图中除了一个节点(称为根节点)外,其余每个节点均有且仅有一个父节点,且存在根节点到其余任何节点的路径,则称该有向图为有向树。有向图的有向生成树为包含该有向图所有节点的有向树。如果有向图存在一个为有向生成树的子图,则称该有向图具有有向生成树。本文考虑n+1个机器人系统进行通讯的有向图G具有一个有向生成树。有向图G的邻接矩阵是一个(n+1)×(n+1)维的非负矩阵。当i≠j且(υij)∈ε时,否则并且对于所有j=1,...,n+1,有记A=[aij]∈Rn ×n,其中
8、稳定性理论:
Lyapunov稳定性理论:借助一个Lyapunov函数来直接对系统平衡状态的稳定性做出判断。从能量观点进行稳定性分析。如果一个系统被激励后,其存储的能量随着时间的推移逐渐衰减,达到平衡状态时,能量将是最小值,则这个平衡状态是渐进稳定的。反之,若系统不断地从外界吸收能量,储能越来越大,则这个平衡状态就是不稳定的。如果系统的储能既不增加,也不消耗,则这个平衡状态就是Lyapunov意义下的稳定。由于系统的复杂性和多样性,往往难以直观找到一个能量函数来描述系统的能量关系,于是Lyapunov定义一个正定的标量函数V,作为虚构的广义能量,根据的符号特征来判别系统的稳定性。对于一个给定的系统,若能够找到一个正定的标量函数V,而是负定的,则这个系统是渐进稳定的。这个V叫做Lyapunov函数,该方法被称为Lyapunov稳定性理论。
Barbalet引理:如果并且存在p∈[1,∞),使得f(t)∈Lp,那么当t→∞时,f(t)→0。
所述控制方法通过以下步骤实现:
步骤一、多机器人协调控制系统中,根据Euler-Lagrange模型:和动态领航者辅助状态量v,建立第i个跟随者的时变轨迹公式:
qn+1=Fv (7);
式中:qi∈Rp表示跟随者广义坐标;Mi(qi)∈Rp×p表示对称正定的惯量矩阵,为未知量;表示Coriolis力和向心力矩阵,为未知量;Gi(qi)∈Rp表示重力约束矩阵,为未知量;τi∈Rp表示作用在跟随者i上的广义控制力,ωi∈Rp表示外界干扰,所述外界干扰包括未建模动力学、干扰、噪声;v表示动态领航者辅助状态量;S∈Rm×m和F∈Rn×m为常值实数矩阵;
步骤二、在存在通讯时延的情况下设计分布式观测器,其控制公式为:
使所有跟随者都能对领航者的状态信息进行估计,且能保证观测误差有界,即:令ηn+1=v,
式中:ηi∈Rm表示跟随者对领航者的状态的估计;t表示时间;τ表示跟随者与领航者间网络通讯的固定时延;di为正常数,满足
表示与第i个跟随者相邻的机器人个数之和的倒数;由图论的知识,当i≠j且(υij)∈ε时,否则U0表示观测误差的上界,从而让所有跟随者都能获得领航者的状态信息;
步骤三、设计一组backstepping相关辅助变量,以对利用backstepping进行控制律的设计做准备:
所述backstepping相关辅助变量为:
qri=Fηi (10),
qri表示跟随者对领航者的广义坐标的估计,
Z1i=qi-qri (11),
表示跟随者的广义坐标与跟随者对领航者的广义坐标的估计的差值,
表示中间计算过程起辅助作用的虚拟控制量;
并对辅助变量Z1i=qi-qri求导,得:
再设计
并代入辅助变量中得:
式中:K1i表示常值正定矩阵;
步骤四、对未知非线性项采用神经网络进行逼近,分为两步进行处理:
首先,将步骤三得到的带入步骤一所述的第i个跟随者的运动方程,得:
其中,采用神经网络对未知非线性项进行逼近处理,那么fi表示为:
跟随者i对fi的估计变量设计为:
但是系统中仍存在神经网络逼近误差εi和外界干扰ωi,可表示为:
再采用RBF神经网络逼近符号函数的方法对fAi(Z2i)进行估计,同时消除抖振对控制系统的影响:估计变量设计为
式中:φi表示神经元的激活函数,如sigmoid函数、双曲正切函数以及高斯函数等;Wi表示最优神经网络权值矩阵;表示最优神经网络权值矩阵的估计;
ki=ωMiMi (23),
kAi≥ki (24),
ωMi,εMi分别表示外界干扰ωi和神经网络逼近误差εi的上界值;hi表示由高斯基函数构成的径向基向量;
步骤五、至此,对步骤一所述第i个跟随者的时变轨迹设计分布式控制方法表达式:
使控制系统神经网络逼近误差εi趋于零,且
以具有较好的鲁棒性;
式中:γ为正常数,是要调节的参数,即控制量;r1,r2都为正常数,是要调节的参数,即控制量;K2i为常值正定矩阵,是要调节的参数,即控制量。
具体实施方式二:
与具体实施方式一不同的是,本实施方式的多机器人系统分布式自适应神经网络连续跟踪控制方法,步骤一所述Euler-Lagrange模型满足反对称性和有界性:是反对称矩阵,给定任意向量xi∈Rp所述有界性是指存在正常数和k m ,使得其中Ip为p×p阶单位矩阵。
证明观测器有界
由于领航者为动态,所以根据领航者是时变速度公式和时变轨迹公式可得v为时变量,所以有v(t-τ)≠v(t)。因此,将时变速度公式(6)和时变轨迹公式(7)代入分布式观测器的控制公式(8)可以得到:
其中:
选取Lyapunov函数:
定义中立算子且知中立算子是稳定的,则Lyapunov函数写为:
对上式求导并将式(29)代入可得:
因此
在假设成立的条件下,最终得到ηi-v是一致有界的,即
证明逼近过程收敛
将分布式控制方法表达式代入分布式观测器的控制公式(8)得:
基于backstepping控制方法,定义第一个Lyapunov函数:
并对其求导得:
定义第二个Lyaponov函数:
对其求导得:
并将式(26.27.28)代入得:
于是有:
因此,
即:
因此V2i(t)≥0,那么对式两边积分有:
因此Z2i,Z1i∈L2,又由式因此Z2i,Z1i∈L2∩L,由Barbalet定理知:
由式知:
则:
即证明了在分布式控制方法表达式:的作用下,控制系统的逼近过程收敛,且全局跟踪误差有界。
实施例1:
根据具体实施方式二进行的实施例:由5个两自由度机械臂机器人系统构成的有向通讯网络,其中编号1到4为跟踪者,编号5为领航者,如图2所示。
每个跟随者的Euler-Lagrange动力学方程如下:
其中qi=col(qi1,qi2),
Ji1,Ji2,mi1,mi2,li1,li2分别代表转动惯量、质量和长度。
动态领航者的轨迹为:
其中,
领航者相应于式中的模型参数分别取为:
仿真参数取:
L=1m,m11=1.02kg,m12=1.12kg,m21=0.96kg,m22=1.15kg,m31=1.01kg,m32=1.07kg,m41=1.04kg,
m42=1.09kg,J11=0.21kgm2,J12=0.42kgm2,J21=0.23kgm2,J22=0.39kgm2,J31=0.19kgm2,
J32=0.40kgm2,J41=0.21kgm2,J42=0.41kgm2,li1=li2=L,i=1,...,4
系统相关状态或变量的初始参数取:
考虑系统通讯时延为τ=0.05s。
如式所示,逼近系统模型非线性不确定性的神经网络激活函数向量为:
φi(z)=[φi1(z),...,φi6(z)]T (65);
其中φij(z)是Guassian函数:
式中神经网络参数为:仿真中假设所有跟随者具有相同的神经网络激活函数,神经元激活函数的宽度均设为σij=2,初始神经网络权值矩阵设为零矩阵,即神经元激活函数的中心位置cij均匀分布在区域[-5,5]4×[-0.5,0.5]4内。
如式所示,对逼近误差和外界干扰的神经网络的激活函数为:
hi(z)=[hi1(z),...,hi6(z)]T (67);
其中hij(z)是Guassian函数:
式中z=[Z2i]∈R2,仿真中假设所有跟随者具有相同的神经网络激活函数,且神经元激活函数的宽度均设为σij=2,初始神经网络权值矩阵设为零矩阵,即神经元激活函数的中心位置cij均匀分布在区域[-5,5]1×[-0.5,0.5]1内。
控制器设计参数:
控制算法参数取K1i=10I2,K2i=20I2,i=1,...,4;γ=1,r1=20,r2=8。
仿真分析:
图3表示在分布式控制方法表达式:的作用下,各跟随者跟踪领航者的运动轨迹,图4位个跟随者关节2跟踪领航者关节2的运动轨迹。如图3和如图4所示得到的仿真结果表明:系统中的4个跟随者的运动最终均与领航者趋于一致。其中跟随者2,3,4与领航者5间的跟踪误差趋于0,但跟随者1在跟踪领航者5的过程中,出现了较大的超调,究其原因,可能是跟随者1与领航者5间的通讯距离较远,由于通讯时延的积累而导致其跟踪的实时性变差,仿真过程中,当通讯时延增大时,跟踪误差也逐渐增大,这与实际情况是相符合的。

Claims (2)

1.一种多机器人系统分布式自适应神经网络连续跟踪控制方法,其特征在于:所述控制方法通过以下步骤实现:
步骤一、多机器人协调控制系统中,根据Euler-Lagrange模型:和动态领航者辅助状态量v,建立第i个跟随者的时变轨迹公式:
v · = S v ,
qn+1=Fv;
式中:qi∈Rp表示跟随者广义坐标;Mi(qi)∈Rp×p表示对称正定的惯量矩阵;表示Coriolis力和向心力矩阵;Gi(qi)∈Rp表示重力约束矩阵;τi∈Rp表示作用在跟随者i上的广义控制力,ωi∈Rp表示外界干扰;v表示动态领航者辅助状态量;S∈Rm×m和F∈Rn×m为常值实数矩阵;
步骤二、在存在通讯时延的情况下设计分布式观测器,其控制公式为:使所有跟随者都能对领航者的状态信息进行估计,且能保证观测误差有界,即:令ηn+1=v,
式中:ηi∈Rm表示跟随者对领航者的状态的估计;t表示时间;τ表示跟随者与领航者间网络通讯的固定时延;di为正常数,满足表示与第i个跟随者相邻的机器人个数之和的倒数;由图论的知识,当i≠j且(υij)∈ε时,否则U0表示观测误差的上界;
步骤三、设计一组backstepping相关辅助变量,以对利用backstepping进行控制律的设计做准备:
所述backstepping相关辅助变量为:
qri=Fηi,qri表示跟随者对领航者的广义坐标的估计,
Z1i=qi-qri,表示跟随者的广义坐标与跟随者对领航者的广义坐标的估计的差值,
α1i表示中间计算过程起辅助作用的虚拟控制量;
并对辅助变量Z1i=qi-qri求导,得:
再设计并代入辅助变量中得:
Z · 2 i = q ·· i - α · 1 i ,
Z 2 i = q · i - α 1 i = q · i - ( q · r i - K 1 i Z 1 i ) ,
式中:K1i为常值正定矩阵;
步骤四、对未知非线性项采用神经网络进行逼近,分为两步进行处理:
首先,将步骤三得到的带入步骤一所述的第i个跟随者的运动方程,得:其中,采用神经网络对未知非线性项进行逼近处理,那么fi表示为:跟随者i对fi的估计变量设计为:控制系统中仍存在神经网络逼近误差εi和外界干扰ωi,进一步表示为再采用RBF神经网络逼近符号函数的方法对fAi(Z2i)进行估计,对神经网络逼近误差εi和外界干扰ωi进行处理,同时消除抖振对控制系统的影响:估计变量设计为
式中:φi表示神经元的激活函数;Wi表示最优神经网络权值矩阵;表示最优神经网络权值矩阵的估计;ki=ωMiMi,kAi≥ki,ωMiMi分别表示外界干扰ωi和神经网络逼近误差εi的上界值;hi表示由高斯基函数构成的径向基向量;
步骤五、至此,对步骤一所述第i个跟随者的时变轨迹设计分布式控制方法表达式:
W ^ · i = γφ i Z 2 i T ,
使控制系统神经网络逼近误差εi趋于零,且以具有较好的鲁棒性;
式中:γ为正常数;r1,r2都为正常数;K2i为常值正定矩阵。
2.根据权利要求1所述多机器人系统分布式自适应神经网络连续跟踪控制方法,其特征在于:步骤一所述Euler-Lagrange模型满足反对称性和有界性:是反对称矩阵,给定任意向量xi∈Rp所述有界性是指存在正常数和km,使得其中Ip为p×p阶单位矩阵。
CN201510137004.9A 2015-03-26 2015-03-26 多机器人系统分布式自适应神经网络连续跟踪控制方法 Active CN104865829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510137004.9A CN104865829B (zh) 2015-03-26 2015-03-26 多机器人系统分布式自适应神经网络连续跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510137004.9A CN104865829B (zh) 2015-03-26 2015-03-26 多机器人系统分布式自适应神经网络连续跟踪控制方法

Publications (2)

Publication Number Publication Date
CN104865829A CN104865829A (zh) 2015-08-26
CN104865829B true CN104865829B (zh) 2017-06-23

Family

ID=53911743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510137004.9A Active CN104865829B (zh) 2015-03-26 2015-03-26 多机器人系统分布式自适应神经网络连续跟踪控制方法

Country Status (1)

Country Link
CN (1) CN104865829B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068427B (zh) * 2015-08-31 2017-06-20 哈尔滨工业大学 一种多机器人系统有限时间鲁棒协同跟踪控制方法
CN105759633B (zh) * 2016-05-04 2018-05-18 华东交通大学 一种带强连通分支的多机器人系统可控包含控制方法
CN106406097B (zh) * 2016-11-08 2019-05-14 长春工业大学 多机械臂系统的分布式自适应协调控制方法
CN107894708A (zh) * 2017-04-24 2018-04-10 长春工业大学 一种环形耦合型多轴机器人系统的同步控制方法
CN109799811A (zh) * 2017-11-17 2019-05-24 北京航空航天大学 一种多轮式机器人系统的动态分布式控制方法
CN108181928B (zh) * 2017-12-29 2021-04-30 山东大学 一种海面溢油的多机器人编队溯源控制方法
CN108388123B (zh) * 2018-03-09 2020-10-30 迪比(重庆)智能科技研究院有限公司 多个仿人机器人在速度不可测下的自适应控制方法
CN108762091B (zh) * 2018-06-25 2021-06-22 东南大学 一种基于未知控制方向的自适应编队控制算法
CN108983612A (zh) * 2018-08-08 2018-12-11 华南理工大学 一种具有预设性能和连接保持的水下机器人编队控制方法
CN109100939B (zh) * 2018-09-19 2021-05-11 哈尔滨工程大学 考虑输入饱和的水面无人艇全状态约束轨迹跟踪控制方法
CN109240081B (zh) * 2018-11-21 2021-05-07 哈尔滨工程大学 考虑误差约束的海底地震检波飞行节点有限时间构型包含容错控制方法
CN109683477B (zh) * 2018-12-12 2020-11-27 中国地质大学(武汉) 一种随机多智能体系统有限时间控制器的设计方法及系统
CN110109363B (zh) * 2019-05-28 2022-10-21 重庆理工大学 一种轮式移动机器人编队的神经网络自适应控制方法
CN110095989B (zh) * 2019-05-29 2023-02-14 南京邮电大学 一种基于反步法的分布式多拉格朗日系统跟踪控制策略
CN110221542B (zh) * 2019-06-04 2021-09-17 西北工业大学 一种二阶非线性多智能体系统固定时间协同跟踪控制方法
CN110134018B (zh) * 2019-06-17 2022-01-18 哈尔滨工程大学 一种水下多足机器人系统的多足协同控制方法
CN110262247B (zh) * 2019-07-05 2022-06-17 青岛大学 多机器人系统的分布式命令滤波模糊控制方法
CN110497415B (zh) * 2019-09-05 2021-05-28 首都师范大学 一种基于干扰观测器的多机械臂系统的一致控制方法
CN111722625B (zh) * 2019-12-18 2021-09-21 北京交通大学 时变数量群体机器人接力目标跟踪系统的稳定性分析方法
CN111113417B (zh) * 2019-12-25 2021-10-29 广东省智能制造研究所 一种分布式多机器人协同运动控制方法及系统
CN111168680B (zh) * 2020-01-09 2022-11-15 中山大学 一种基于神经动力学方法的软体机器人控制方法
CN111413866B (zh) * 2020-03-06 2021-08-06 大连理工大学 一种考虑时延的航空发动机分布式控制律设计及验证方法
CN111846009B (zh) * 2020-08-03 2022-02-08 哈尔滨工程大学 一种水下多足仿生蟹机器人多足协同容错控制方法
CN112904726B (zh) * 2021-01-20 2022-11-18 哈尔滨工业大学 一种基于误差重构权重更新的神经网络反步控制方法
CN113759711B (zh) * 2021-07-09 2024-03-29 广东华中科技大学工业技术研究院 多欧拉-拉格朗日系统的独立分布式包含控制器设计方法
CN114019796B (zh) * 2021-10-27 2023-03-10 黄山学院 一种考虑输入约束的移动机器人固定时间跟踪控制方法
CN115877718B (zh) * 2023-02-23 2023-05-30 北京航空航天大学 数据驱动的异构导弹编队切换通信拓扑协同控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6611823B1 (en) * 2000-04-20 2003-08-26 Board Of Regents, The University Of Texas System Backlash compensation using neural network
CN101794153A (zh) * 2010-03-05 2010-08-04 北京化工大学 智能小车点镇定控制方法
CN101825903A (zh) * 2010-04-29 2010-09-08 哈尔滨工程大学 一种遥控水下机器人水面控制方法
CN103412488A (zh) * 2013-08-12 2013-11-27 北京航空航天大学 一种基于自适应神经网络的小型无人旋翼机高精度控制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101475826B1 (ko) * 2013-03-14 2014-12-30 인하대학교 산학협력단 백스테핑 기법을 이용한 선도 추종자 대형제어 장치, 방법 및 이동로봇

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6611823B1 (en) * 2000-04-20 2003-08-26 Board Of Regents, The University Of Texas System Backlash compensation using neural network
CN101794153A (zh) * 2010-03-05 2010-08-04 北京化工大学 智能小车点镇定控制方法
CN101825903A (zh) * 2010-04-29 2010-09-08 哈尔滨工程大学 一种遥控水下机器人水面控制方法
CN103412488A (zh) * 2013-08-12 2013-11-27 北京航空航天大学 一种基于自适应神经网络的小型无人旋翼机高精度控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
利用队列控制实现多机器人合作搬运;戴朝晖等;《Proceedings of the 27th Chinese Control Conference》;20080718;第346-350页 *

Also Published As

Publication number Publication date
CN104865829A (zh) 2015-08-26

Similar Documents

Publication Publication Date Title
CN104865829B (zh) 多机器人系统分布式自适应神经网络连续跟踪控制方法
CN108161934A (zh) 一种利用深度强化学习实现机器人多轴孔装配的方法
Wu et al. A novel adaptive steering torque control approach for human–machine cooperation autonomous vehicles
Lu et al. Learning driver-specific behavior for overtaking: A combined learning framework
Kang et al. Adaptive visual servoing with an uncalibrated camera using extreme learning machine and Q-leaning
CN109085749B (zh) 一种基于自适应模糊反演的非线性遥操作双边控制方法
CN105068546B (zh) 一种卫星编队相对轨道自适应神经网络构形包含控制方法
Pan et al. Data-driven vehicle modeling of longitudinal dynamics based on a multibody model and deep neural networks
Liu et al. Gradient-Based Differential $ k\text {WTA} $ Network With Application to Competitive Coordination of Multiple Robots
CN108227506A (zh) 一种基于自适应最优化方法的机器人导纳控制系统
CN114237041B (zh) 一种基于预设性能的空-地协同固定时间容错控制方法
CN106406097A (zh) 多机械臂系统的分布式自适应协调控制方法
CN115220472B (zh) 一种切换拓扑下空-地异构编队系统的容错控制方法
Wang et al. The formation control of multi-agent systems on a circle
Shoukat et al. Digital twin-driven virtual control technology of home-use robot: human-cyber-physical system
Zhou et al. Adaptive sliding mode control of manipulators based on fuzzy random vector function links for friction compensation
Cheng et al. Fixed-time formation tracking for heterogeneous multiagent systems under actuator faults and directed topologies
CN111273677B (zh) 基于强化学习技术的自主水下机器人速度和艏向控制方法
CN107450311A (zh) 逆模型建模方法及装置、以及自适应逆控制方法及装置
Yang et al. Artificial potential-based formation control with collision and obstacle avoidance for second-order multi-agent systems
Li et al. Observer-based multivariable fixed-time formation control of mobile robots
CN113885548B (zh) 一种多四旋翼无人机输出约束状态一致博弈控制器
Tang et al. Leader-following consensus control for multiple fixed-wing UAVs’ attitude system with time delays and external disturbances
Enjiao et al. Finite-time control of formation system for multiple flight vehicles subject to actuator saturation
Song et al. Adaptive dynamic event-triggered control for constrained modular reconfigurable robot

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Ma Guangfu

Inventor after: Sun Yanchao

Inventor after: Li Chuanjiang

Inventor after: Chen Liangming

Inventor after: Liu Mengmeng

Inventor after: Wang Jun

Inventor before: Chen Liangming

Inventor before: Sun Yanchao

Inventor before: Liu Mengmeng

Inventor before: Ma Guangfu

Inventor before: Wang Jun

Inventor before: Li Chuanjiang

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191213

Address after: 150001 No. 434, postal street, Nangang District, Heilongjiang, Harbin

Patentee after: Harbin Institute of Technology National University Science Park Development Co., Ltd.

Address before: 150001 Harbin, Nangang, West District, large straight street, No. 92

Patentee before: Harbin Institute of Technology

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200506

Address after: 610000 5 / F, building 4, Tianfu international financial center, No. 996, north section of Tianfu Avenue, Chengdu high tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu [40530-40543]

Patentee after: Chengdu Sichuan Harbin Industrial Robot and Intelligent Equipment Technology Research Institute Co.,Ltd.

Address before: 150001 No. 434, postal street, Nangang District, Heilongjiang, Harbin

Patentee before: Harbin Institute of Technology National University Science Park Development Co., Ltd.