CN114237247A - 基于预测的可变队形非完整移动机器人一致性控制方法 - Google Patents

基于预测的可变队形非完整移动机器人一致性控制方法 Download PDF

Info

Publication number
CN114237247A
CN114237247A CN202111548509.6A CN202111548509A CN114237247A CN 114237247 A CN114237247 A CN 114237247A CN 202111548509 A CN202111548509 A CN 202111548509A CN 114237247 A CN114237247 A CN 114237247A
Authority
CN
China
Prior art keywords
formation
time
generalized
input
robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111548509.6A
Other languages
English (en)
Inventor
肖涵臻
彭积广
许志超
杨洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202111548509.6A priority Critical patent/CN114237247A/zh
Publication of CN114237247A publication Critical patent/CN114237247A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0287Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
    • G05D1/0291Fleet control

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种基于预测的可变队形非完整移动机器人一致性控制方法,包括:在多机器人系统中,确定虚拟的领导者来领导其他所有的跟随者;建立非完整移动机器人的运动学模型;定义领导者‑跟随者时变一致性编队的控制对象;根据一致误差的定义,在笛卡尔坐标层面上,建立辅助一致编队机动轨迹子系统和编队跟踪子系统;用数学语言表达,建立优化编队模型神经动态优化分布式模型预测控制编队控制器。本发明解决了非完整移动机器人在信息变换拓扑下结构变化的时变一致性编队问题和系统物理的约束问题。

Description

基于预测的可变队形非完整移动机器人一致性控制方法
技术领域
本发明涉及机器人控制领域,具体涉及一种基于模型预测控制的可变队形非完整移动机器人一致性控制方法。
背景技术
目前,多个非完整移动机器人的有效和简单执行的一致性协议的方案仍然不够成熟。目前国内外研究是将路径规划系统和编队跟踪系统分别研究和计算,即无法将两个系统合二为一成一个系统来进行一致性编队处理,因此浪费了大量资源。由于Brockett理论,使得用可微和连续的纯状态反馈算法来控制非完整移动机器人的一致性形成非常困难。并且目前国内外普遍采用基于信号函数对角速度的变化,但是此方法不能处理直线,移动及角速度变化为零的状态。
传统时不变无拓扑多个机器人编队系统由于通信带宽和范围的限制,其无法实现多个机器人编队中,各个机器人间的通信和测量时刻的通畅和准确。在许多实际应用中,时不变编队系统,无法在复杂多变的地形结构处理复杂的任务,并且无法适应拓扑结构随时间变化来避免碰撞、聚集和沟通中断的期望编队状态。
在实际实施中,队形约束是需要考虑的重要因素之一。但是目前非完整多移动机器人队形的控制方法有很多;如:图论、非线性控制、滑模控制、鸽子启发法、自适应动态规划、群强化学习等。在这些控制方法中,要么忽略物理约束,要么只是隐式地考虑一些特定的约束,这样使得机器人编队系统容易因为疏忽系统约束而“崩溃”。
现有技术主要存在的缺点:
1.无法充分解决系统的约束;2.当前编队一致性协议执行效率低下及不够成熟;3.对于受限于非完整性约束的移动机器人,很多方法无法良好实现编队系统的直线运动;4.很多现有的技术无法适应拓扑变化,难以有效避免机器人发生碰撞和聚集。
发明内容
本发明的目的是提供一种基于模型预测控制的可变队形非完整移动机器人一致性控制方法,解决了非完整移动机器人在信息变换拓扑下结构变化的时变一致性编队问题和系统物理的约束问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于预测的可变队形非完整移动机器人一致性控制方法,包括:
在多机器人系统中,确定虚拟的领导者来领导其他所有的跟随者;建立非完整移动机器人的运动学模型;
定义领导者-跟随者时变一致性编队的控制对象;
根据一致误差的定义,在笛卡尔坐标层面上,建立辅助一致编队机动轨迹子系统和编队跟踪子系统;
用数学语言表达,建立优化编队模型神经动态优化分布式模型预测控制编队控制器,包括:
建立离散时间广义编队控制系统模型;考虑到神经动态优化分布式模型预测的分布式特性,对于每个机器人的代价函数,建立二次规划问题;执行广义投影神经网络最优化方法解决各个机器人的二次规划问题,把下一次时刻的输入增量来计算广义时变一致性编队系统最优化输入用于广义编队控制系统,从而优化了广义编队控制系统。
进一步地,所述非完整移动机器人的运动学模型,表示为:
Figure BDA0003416489690000021
其中,t表示t时刻,xi(t)=[pi(t),θi(t)]T表示为跟随者Ri的姿态向量,参数上标圆点表示该参数的一阶导数,下同;pi(t)=[xi(t),yi(t)]T和θi(t)表示Ri的位置和方位;vi(t)=[νi(t),ωi(t)]T表示输入的线速度和角速度的向量;
令uix(t)=νi(t)cos(θi(t)),uiy(t)=νi(t)sin(θi(t))和ui(t)=[uix(t),uiy(t)]T
进一步地,所述定义领导者-跟随者时变一致性编队的控制对象,包括:
对于每个机器人具有任意预定义的初始姿态状态,有如下极限方程即领导者-跟随者时变一致性编队:
Figure BDA0003416489690000022
其中,对于机器人Ri,其与领导者RL的期望相对位置坐标可表示为:pixy(t)=[xid(t),yid(t)]T;pL(t)=[xL(t),yL(t)]T表示为RL的位置;
考虑到每个机器人之间的通信限制,领导者的信息只能提供给少数的跟随者,则Ri的有向时变一致性误差表示为:
Figure BDA0003416489690000031
其中,
Figure BDA0003416489690000032
aij(t)和bi(t)为变换拓扑即多机器人系统变换队形后的相关权值系数;我们的目标是需要实现:
Figure BDA0003416489690000033
进一步地,所述辅助一致编队机动轨迹子系统构建如下:
对于机器人Ri,机动子系统的仿射模型可以记为:
Figure BDA0003416489690000034
其中:
Figure BDA0003416489690000035
和:
Figure BDA0003416489690000036
其中,δ为采样时间,k为第k时刻,
Figure BDA0003416489690000037
为机动子系统的输入,
Figure BDA0003416489690000038
进一步地,所述编队跟踪子系统构建如下:
对于机器人Ri(i=1,2,...,M),其辅助姿态状态和实际姿态状态可分别表示为
Figure BDA0003416489690000039
Figure BDA00034164896900000310
Figure BDA00034164896900000311
Figure BDA00034164896900000312
代表为辅助位置,
Figure BDA00034164896900000313
代表辅助方位,
Figure BDA00034164896900000314
代表辅助线速度,
Figure BDA00034164896900000315
代表辅助角速度;xi和yi代表实际位置,θi代表实际方位;k0为正常数,则编队跟踪误差子系统离散时间非线性仿射模型可表示为:
Figure BDA0003416489690000041
其中:
Figure BDA0003416489690000042
Figure BDA0003416489690000043
Figure BDA0003416489690000044
Figure BDA0003416489690000045
Figure BDA0003416489690000046
Figure BDA0003416489690000047
xie(k)和yie(k)为离散跟踪位置误差,θie(k)为离散跟踪方位,
Figure BDA0003416489690000048
为离散跟踪方位误差,
Figure BDA0003416489690000049
Figure BDA00034164896900000410
为离散辅助线速度和角速度;vi(k)=[νi(k),ωi(k)]T为离散输入线速度和角速度信号向量。
进一步地,所述建立离散时间广义编队控制系统模型,表示为:
Xi(k)=Fi(k)+Gi(k)Ui(k)
其中,
Figure BDA00034164896900000411
约束为:ΔUmin≤ΔUi(k)≤ΔUmax
Umin≤Ui(k)≤Umax
Xmin≤Xi(k)≤Xmax
其中,
Figure BDA00034164896900000412
为广义输入向量,参数上标T表示矩阵转置,Umin为最小广义输入向量,Umax为最大广义输入向量;ΔUi(k+1)=Ui(k+1)-Ui(k)为输入增量,ΔUmin为最小输入增量,ΔUmax为最大输入增量,
Figure BDA0003416489690000051
为广义状态误差向量,Xmin为最小广义状态误差,Xmax为最大广义状态误差。
进一步地,所述二次规划问题表示为:
Figure BDA0003416489690000052
其中:N为预测时域,Nu为控制时域,且N≥Nu≥0,N>1,qi和li为权重系数;Q和R是权重矩阵,都为单位矩阵;在离散情况下,MPC通过预测模型从k时刻开始,k+1|k代表根据已知k的时刻的状态预测到的k+1时刻的状态,同理,k+N|k表示根据已知k的时刻的状态预测到的k+N时刻的状态,k>0;
Figure BDA0003416489690000053
Figure BDA0003416489690000054
在预测时域和控制时域内定义跟踪状态和输入序列:
Figure BDA0003416489690000055
Figure BDA0003416489690000056
Figure BDA0003416489690000057
因此,最优问题可进一步转化为二次规划(QP)问题:
Figure BDA0003416489690000058
约束为:
Figure BDA0003416489690000059
其中,
Figure BDA00034164896900000510
Figure BDA0003416489690000061
Figure BDA0003416489690000062
I为单位矩阵,
Figure BDA0003416489690000063
Figure BDA0003416489690000064
是输入向量的最小、最大约束向量。
进一步地,所述执行广义投影神经网络最优化方法解决各个机器人的二次规划问题和把下一次时刻的输入增量来计算广义时变一致性编队系统最优化输入用于广义编队控制系统,包括:
由于QP问题的最优解,等价于得到一个向量,据以上分析可得到此向量:
Figure BDA0003416489690000065
其中,K^(·)代表为投影算子,
Figure BDA0003416489690000066
Figure BDA0003416489690000067
Figure BDA0003416489690000068
为最优解,τ是投影算子的输入向量,τj为向量τ的第j个元素,τ+、τ-为τ的下界和上界:τ-=li+=hi,γ为一个大于0可调整的参数;
Figure BDA00034164896900000611
Figure BDA00034164896900000612
两个连续可微向量值函数:
Figure BDA0003416489690000069
Figure BDA00034164896900000610
其中,矩阵的右上角+号代表此矩阵的伪逆。
与现有技术相比,本发明具有以下技术特点:
1.本发明可将辅助一致子系统和编队跟踪子系统结合成为一个广义分布式时变一致性编队系统,提高了控制器的利用率,使得控制系统执行效率变得更加高效,可解决系统的物理约束和无需忽略某些特定约束,进一步实现了和完善了编队一致性协议的高效和简单执行,适合不同种类的移动机器人。
2.由于神经动态优化分布式模型预测控制和广义投影神经网络作为编队系统的分析方法,此法减少了广义编队跟踪误差,优化了编队一致性形成过程,可良好实现编队系统的直线运动,可适应当拓扑发生变化时,机器人有效避免碰撞和聚集。
3.本发明的方案是以辅助一致机动子系统和编队跟踪子系统为基础所构建,能够进行严格的收敛性证明与稳定性分析,两个子系统合为一个系统使得编队系统运行高效,反应速度快,能适应于复杂地形环境的控制,极大提高了闭环控制系统可靠性。此外,本发明还具有“可提前设置拓扑变化”、“充分考虑系统相关约束”等方面的优势。
附图说明
图1为交换拓扑图;
图2为本发明控制方法的流程示意图。
具体实施方式
本发明构建了一种以辅助一致机动子系统(路径规划子系统)和编队跟踪子系统为构成的一致编队融合系统,并利用分布式模型预测控制(DMPC)方法来构建在预测时域内的带有系统约束的最优控制问题,对未来状态和一致性编队误差进行预测和广义投影神经网络(GPNN)进行模型最优化。所设计控制系统能处理基于拓扑变化下的广义分布式时变一致性编队系统,实现非完整移动机器人在拓扑变化下按预定的编队的形式进行运动。
在一些特定的目标跟踪、持续监控和运输等方面的实际应用方面,例如:外星球表面机器人探索运动,多移动机器人协同任务等,应用非完整移动机器人能够节省人力和财力,并具有独特的自身优势,这是单用人的力量所无法比拟的;并且一组通过移动信息来处理任务的非完整移动机器人比传统系统具有更多的优势,即它可以降低系统成本,提高鲁棒性和效率。
在大多数多机器人一致性编队控制中,成员只能在一定范围内接收或发送信息,为了描述在编队中交换的信息,应用了有向图G=(V,E,A),V=1,2,...,M是机器人节点集,
Figure BDA0003416489690000071
表示有向边集合,(i,j)∈E意味着机器人Ri可以接收到机器人Rj的信息,在t时刻时,如果(j,i)∈E,aij(t)>0;如果
Figure BDA0003416489690000072
或者i=j,aij(t)=0;A(t)表示由aij(t)构成的相关加权邻接矩阵。定义基于拓扑学建立多个非完整移动机器人(受非完整约束系统的移动机器人)的拓扑变化形式及多个机器人(包括虚拟领导机器人)之间的拓扑关系。图1为多跟随非完整移动机器人的变换队形拓扑变换,从而建立起机器人间的拓扑关系,此为通信层面上的设计。
本发明提供一种基于模型预测控制的可变队形非完整移动机器人一致性控制方法,包括以下步骤:
步骤1,在多机器人系统中,M个跟随移动机器人表示为Ri(i=1,2,...,M),RL作为一个虚拟的领导者来领导所有跟随者R1-RM;i和j来标记两个不同的跟随机器人,在笛卡尔坐标系中建立非完整移动机器人的运动学模型,运动学模型可以描述为:
Figure BDA0003416489690000081
其中,t表示t时刻,xi(t)=[pi(t),θi(t)]T表示为Ri的姿态向量,参数上标圆点表示该参数的一阶导数,下同;pi(t)=[xi(t),yi(t)]T和θi(t)表示Ri的位置和方位;vi(t)=[νi(t),ωi(t)]T表示输入的线速度和角速度的向量。
令uix(t)=νi(t)cos(θi(t)),uiy(t)=νi(t)sin(θi(t))和ui(t)=[uix(t),uiy(t)]T
步骤2,定义领导者-跟随者时变一致性编队(LFTVCF)的控制对象
对于每个机器人具有任意预定义的初始姿态状态,有如下极限方程即领导者-跟随者时变一致性编队:
Figure BDA0003416489690000082
其中,对于机器人Ri,其与领导者RL的期望相对位置坐标可表示为:pixy(t)=[xid(t),yid(t)]T,注意pixy(t)是时变的;pL(t)=[xL(t),yL(t)]T表示为RL的位置。
考虑到每个机器人之间的通信限制,领导者的信息只能提供给少数的跟随者,则Ri的有向时变一致性误差表示为:
Figure BDA0003416489690000091
其中,
Figure BDA0003416489690000092
aij(t)和bi(t)为变换拓扑即多机器人系统变换队形后的相关权值系数,从虚拟领导者获取的信息可以表示为一个时变权重矩阵B(t)=diag(b1(t),b2(t),...,bM(t)),如果t时刻,Ri可以访问RL的信息,则bi(t)=1,否则,bi(t)=0;我们的目标是需要实现:
Figure BDA0003416489690000093
步骤3,根据一致误差的定义,在笛卡尔坐标层面上,建立辅助一致编队机动轨迹子系统和编队跟踪子系统。
3.1辅助一致编队机动轨迹子系统构建如下:
对于机器人Ri,机动子系统的仿射模型可以记为:
Figure BDA0003416489690000094
其中:
Figure BDA0003416489690000095
和:
Figure BDA0003416489690000096
其中,δ为采样时间,k为第k时刻,
Figure BDA0003416489690000097
为机动子系统的输入,
Figure BDA0003416489690000098
在本发明中,开发辅助一致编队机动轨迹子系统构的目的是为引导机器人达到并保持期望的一致性提供参考路径。
3.2编队跟踪子系统构建如下:
对于机器人Ri(i=1,2,...,M),其辅助姿态状态和实际姿态状态可分别表示为
Figure BDA0003416489690000099
Figure BDA00034164896900000910
Figure BDA00034164896900000911
Figure BDA00034164896900000912
代表为辅助位置,
Figure BDA00034164896900000913
代表辅助方位,
Figure BDA0003416489690000101
代表辅助线速度,
Figure BDA0003416489690000102
代表辅助角速度;xi和yi代表实际位置,θi代表实际方位;k0为正常数,则编队跟踪误差子系统离散时间非线性仿射模型可表示为:
Figure BDA0003416489690000103
其中:
Figure BDA0003416489690000104
Figure BDA0003416489690000105
Figure BDA0003416489690000106
Figure BDA0003416489690000107
Figure BDA0003416489690000108
Figure BDA0003416489690000109
xie(k)和yie(k)为离散跟踪位置误差,θie(k)为离散跟踪方位,
Figure BDA00034164896900001010
为离散跟踪方位误差,
Figure BDA00034164896900001011
Figure BDA00034164896900001012
为离散辅助线速度和角速度;vi(k)=[νi(k),ωi(k)]T为离散输入线速度和角速度信号向量。
步骤4,用数学语言表达,建立优化编队模型神经动态优化分布式模型预测控制编队控制器。
4.1建立离散时间广义编队控制系统模型
Xi(k)=Fi(k)+Gi(k)Ui(k)
其中,
Figure BDA00034164896900001013
约束为:ΔUmin≤ΔUi(k)≤ΔUmax
Umin≤Ui(k)≤Umax
Xmin≤Xi(k)≤Xmax
其中,
Figure BDA0003416489690000111
为广义输入向量,参数上标T表示矩阵转置,Umin为最小广义输入向量,Umax为最大广义输入向量;ΔUi(k+1)=Ui(k+1)-Ui(k)为输入增量,ΔUmin为最小输入增量,ΔUmax为最大输入增量,
Figure BDA0003416489690000112
为广义状态误差向量,Xmin为最小广义状态误差,Xmax为最大广义状态误差。
4.2考虑到神经动态优化分布式模型预测的分布式特性,对于每个机器人i的代价函数,可得到二次规划问题为:
Figure BDA0003416489690000113
其中:N为预测时域,Nu为控制时域,且N≥Nu≥0,N>1,qi和li为权重系数,一般情况下设为1,让系统更易于调整。其中Q和R是权重矩阵,都为单位矩阵;Q=diag(q1,...,qN),R=diag(l1,...,lN-1);在离散情况下,MPC通过预测模型从k时刻开始,k+1|k代表根据已知k的时刻的状态预测到的k+1时刻的状态,同理,k+N|k表示根据已知k的时刻的状态预测到的k+N时刻的状态,k>0。
Figure BDA0003416489690000114
Figure BDA0003416489690000115
在预测时域和控制时域内定义跟踪状态和输入序列:
Figure BDA0003416489690000121
Figure BDA0003416489690000122
Figure BDA0003416489690000123
因此,最优问题可进一步转化为二次规划(QP)问题:
Figure BDA0003416489690000124
约束为:
Figure BDA0003416489690000125
其中,
Figure BDA0003416489690000126
Figure BDA0003416489690000127
Figure BDA0003416489690000128
I为单位矩阵,
Figure BDA0003416489690000129
这里的R代表实数域;
Figure BDA00034164896900001210
Figure BDA00034164896900001211
是输入向量的最小、最大约束向量。
4.3执行广义投影神经网络最优化方法解决各个机器人的二次规划问题和把下一次时刻的输入增量来计算广义时变一致性编队系统最优化输入用于广义编队控制系统,从而优化了广义编队控制系统。
由于QP问题的最优解,等价于得到一个向量,据以上分析可得到此向量:
Figure BDA00034164896900001212
其中,K^(·)代表为投影算子,
Figure BDA00034164896900001213
Figure BDA00034164896900001214
Figure BDA0003416489690000131
为最优解,τ是投影算子的输入向量,可设定为任意值,τj为向量τ的第j个元素,τ+、τ-为τ的下界和上界:τ-=li+=hi,γ为一个大于0可调整的参数;
Figure BDA0003416489690000137
Figure BDA0003416489690000138
两个连续可微向量值函数。
Figure BDA0003416489690000132
Figure BDA0003416489690000133
其中,矩阵的右上角+号代表此矩阵的伪逆。
最后,提出的系统的实际应用控制过程如下:
(1)最初,适当地设定时间k,选定预测和控制时域N和Nu,采样时间δ,权重矩阵R和Q,常数γ,设置所有非完整移动机器人R1-RM的初始状态和虚拟机器人RL的路径函数,定义时变的期望模式函数pixy(k)。设置非完整移动机器人之间的通信方式,采用分布式通信方式,根据各机器人的拓扑图设置,虚拟领导机器人的状态信息只能被设置的网络节点与其连接的跟随移动机器人所获取,同理,所有的跟随移动机器人的状态信息只能与它们各自在同一网络节点连接下的移动机器人交换状态信息。需要变换编队的形式时,调整对机器人形成的拓扑通信关系进行变换,让||(t):(0,+∞)→{1,2,...,NG}表示开关信号,
Figure BDA0003416489690000134
表示图的个数,||(t)表示该图在时间t的索引的值,在时间t的有向图可以表示为
Figure BDA0003416489690000135
当拓扑发生变化时,在A||(t)中的加权邻接aij(||(t))会根据新的信息传递方向而变化,从虚拟领导者获取的信息可以表示为一个时变权重矩阵B||(t)=diag(b1(||(t)),b2(||(t)),...,bM(||(t)))。如果t时刻,Ri可以访问RL的信息,则bi(||(t))=1,否则,bi(||(t))=0,从而建立了机器人之间的通信。
(2)对于每一个机器人Ri,构建具有切换拓扑的辅助一致机动子系统的仿射模型:
Figure BDA0003416489690000136
然后,利用
Figure BDA0003416489690000141
的变量变换,建立编队跟踪子系统
Figure BDA0003416489690000142
(3)将
Figure BDA0003416489690000143
Figure BDA0003416489690000144
两个子系统整合在一起,形成第i个离散时间广义编队控制系统Xi(k)=Fi(k)+Gi(k)Ui(k)。
(4)利用DMPC方法,在Xi(k)=Fi(k)+Gi(k)Ui(k)的基础上,构造约束QP问题
Figure BDA0003416489690000145
Figure BDA0003416489690000146
(5)采用GPNN优化方法求解所有的跟随移动机器人的QP问题,并取下一时刻的输入增量来计算最优输入ΔU* i(k)对于离散时间广义编队控制系统。
(6)输入ΔU* i(k)到所有的跟随移动机器人中,更新实际的状态xi(k+1)=[xi(k+1),yi(k+1),θi(k+1)]T,辅助坐标
Figure BDA0003416489690000147
和领导者的状态xL(k+1)=[xL(k+1),yL(k+1),θL(k+1)]T
(7)由此,领导虚拟机器人按照设置的路径函数进行轨迹运动,跟随移动机器人跟随领导虚拟机器人进行运动,形成编队运动;如果编队在运行中,k=k+1回到步骤(2)继续。
本发明融合了一致编队轨迹机动子系统和编队跟踪子系统,得到了可以使得非完整约束移动机器人群体实现一致编队的融合系统;在编队中的每个机器人仅利用来自邻居和自身的局部信息就能获得最优输入,避免有限通信带宽的限制;利用模型预测控制和广义投影神经网络方法实现分布式的方式实时、高效地解决全局最优问题;每个移动机器人建立自己的分布式一致性协议,可适应不同种类的移动机器人,实现广义一致性编队系统。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (8)

1.一种基于预测的可变队形非完整移动机器人一致性控制方法,其特征在于,包括:
在多机器人系统中,确定虚拟的领导者来领导其他所有的跟随者;建立非完整移动机器人的运动学模型;
定义领导者-跟随者时变一致性编队的控制对象;
根据一致误差的定义,在笛卡尔坐标层面上,建立辅助一致编队机动轨迹子系统和编队跟踪子系统;
用数学语言表达,建立优化编队模型神经动态优化分布式模型预测控制编队控制器,包括:
建立离散时间广义编队控制系统模型;考虑到神经动态优化分布式模型预测的分布式特性,对于每个机器人的代价函数,建立二次规划问题;执行广义投影神经网络最优化方法解决各个机器人的二次规划问题,把下一次时刻的输入增量来计算广义时变一致性编队系统最优化输入用于广义编队控制系统,从而优化了广义编队控制系统。
2.根据权利要求1所述的基于预测的可变队形非完整移动机器人一致性控制方法,其特征在于,所述非完整移动机器人的运动学模型,表示为:
Figure FDA0003416489680000011
其中,t表示t时刻,xi(t)=[pi(t),θi(t)]T表示为跟随者Ri的姿态向量,参数上标圆点表示该参数的一阶导数,下同;pi(t)=[xi(t),yi(t)]T和θi(t)表示Ri的位置和方位;vi(t)=[νi(t),ωi(t)]T表示输入的线速度和角速度的向量;
令uix(t)=νi(t)cos(θi(t)),uiy(t)=νi(t)sin(θi(t))和ui(t)=[uix(t),uiy(t)]T
3.根据权利要求1所述的基于预测的可变队形非完整移动机器人一致性控制方法,其特征在于,所述定义领导者-跟随者时变一致性编队的控制对象,包括:
对于每个机器人具有任意预定义的初始姿态状态,有如下极限方程即领导者-跟随者时变一致性编队:
Figure FDA0003416489680000021
其中,对于机器人Ri,其与领导者RL的期望相对位置坐标可表示为:pixy(t)=[xid(t),yid(t)]T;pL(t)=[xL(t),yL(t)]T表示为RL的位置;
考虑到每个机器人之间的通信限制,领导者的信息只能提供给少数的跟随者,则Ri的有向时变一致性误差表示为:
Figure FDA0003416489680000022
其中,
Figure FDA0003416489680000023
aij(t)和bi(t)为变换拓扑即多机器人系统变换队形后的相关权值系数;我们的目标是需要实现:
Figure FDA0003416489680000024
4.根据权利要求1所述的基于预测的可变队形非完整移动机器人一致性控制方法,其特征在于,所述辅助一致编队机动轨迹子系统构建如下:
对于机器人Ri,机动子系统的仿射模型可以记为:
Figure FDA0003416489680000025
其中:
Figure FDA0003416489680000026
和:
Figure FDA0003416489680000027
其中,δ为采样时间,k为第k时刻,
Figure FDA0003416489680000028
为机动子系统的输入,
Figure FDA0003416489680000029
5.根据权利要求1所述的基于预测的可变队形非完整移动机器人一致性控制方法,其特征在于,所述编队跟踪子系统构建如下:
对于机器人Ri(i=1,2,...,M),其辅助姿态状态和实际姿态状态可分别表示为
Figure FDA0003416489680000031
和xi=[xi,yii]T
Figure FDA0003416489680000032
Figure FDA0003416489680000033
代表为辅助位置,
Figure FDA0003416489680000034
代表辅助方位,
Figure FDA0003416489680000035
代表辅助线速度,
Figure FDA0003416489680000036
代表辅助角速度;xi和yi代表实际位置,θi代表实际方位;k0为正常数,则编队跟踪误差子系统离散时间非线性仿射模型可表示为:
Figure FDA0003416489680000037
其中:
Figure FDA0003416489680000038
Figure FDA0003416489680000039
Figure FDA00034164896800000310
Figure FDA00034164896800000311
Figure FDA00034164896800000312
Figure FDA00034164896800000313
xie(k)和yie(k)为离散跟踪位置误差,θie(k)为离散跟踪方位,
Figure FDA00034164896800000314
为离散跟踪方位误差,
Figure FDA00034164896800000315
Figure FDA00034164896800000316
为离散辅助线速度和角速度;vi(k)=[νi(k),ωi(k)]T为离散输入线速度和角速度信号向量。
6.根据权利要求1所述的基于预测的可变队形非完整移动机器人一致性控制方法,其特征在于,所述建立离散时间广义编队控制系统模型,表示为:
Xi(k)=Fi(k)+Gi(k)Ui(k)
其中,
Figure FDA00034164896800000317
约束为:ΔUmin≤ΔUi(k)≤ΔUmax
Umin≤Ui(k)≤Umax
Xmin≤Xi(k)≤Xmax
其中,
Figure FDA0003416489680000041
为广义输入向量,参数上标T表示矩阵转置,Umin为最小广义输入向量,Umax为最大广义输入向量;ΔUi(k+1)=Ui(k+1)-Ui(k)为输入增量,ΔUmin为最小输入增量,ΔUmax为最大输入增量,
Figure FDA0003416489680000042
为广义状态误差向量,Xmin为最小广义状态误差,Xmax为最大广义状态误差。
7.根据权利要求1所述的基于预测的可变队形非完整移动机器人一致性控制方法,其特征在于,所述二次规划问题表示为:
Figure FDA0003416489680000043
其中:N为预测时域,Nu为控制时域,且N≥Nu≥0,N>1,qi和li为权重系数;Q和R是权重矩阵,都为单位矩阵;在离散情况下,MPC通过预测模型从k时刻开始,k+1|k代表根据已知k的时刻的状态预测到的k+1时刻的状态,同理,k+N|k表示根据已知k的时刻的状态预测到的k+N时刻的状态,k>0;
Figure FDA0003416489680000044
Figure FDA0003416489680000045
在预测时域和控制时域内定义跟踪状态和输入序列:
Figure FDA0003416489680000046
Figure FDA0003416489680000047
Figure FDA0003416489680000051
因此,最优问题可进一步转化为二次规划(QP)问题:
Figure FDA0003416489680000052
约束为:
Figure FDA0003416489680000053
其中,
Figure FDA0003416489680000054
Figure FDA0003416489680000055
Figure FDA0003416489680000056
I为单位矩阵,
Figure FDA0003416489680000057
Figure FDA0003416489680000058
是输入向量的最小、最大约束向量。
8.根据权利要求1所述的基于预测的可变队形非完整移动机器人一致性控制方法,其特征在于,所述执行广义投影神经网络最优化方法解决各个机器人的二次规划问题和把下一次时刻的输入增量来计算广义时变一致性编队系统最优化输入用于广义编队控制系统,包括:
由于QP问题的最优解,等价于得到一个向量,据以上分析可得到此向量:
Figure FDA0003416489680000059
其中,K^(·)代表为投影算子,
Figure FDA00034164896800000510
Figure FDA00034164896800000511
Figure FDA00034164896800000512
为最优解,τ是投影算子的输入向量,τj为向量τ的第j个元素,τ+、τ-为τ的下界和上界:τ-=li+=hi,γ为一个大于0可调整的参数;
Figure FDA00034164896800000513
Figure FDA00034164896800000514
两个连续可微向量值函数:
Figure FDA0003416489680000061
Figure FDA0003416489680000062
其中,矩阵的右上角+号代表此矩阵的伪逆。
CN202111548509.6A 2021-12-17 2021-12-17 基于预测的可变队形非完整移动机器人一致性控制方法 Pending CN114237247A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111548509.6A CN114237247A (zh) 2021-12-17 2021-12-17 基于预测的可变队形非完整移动机器人一致性控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111548509.6A CN114237247A (zh) 2021-12-17 2021-12-17 基于预测的可变队形非完整移动机器人一致性控制方法

Publications (1)

Publication Number Publication Date
CN114237247A true CN114237247A (zh) 2022-03-25

Family

ID=80757759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111548509.6A Pending CN114237247A (zh) 2021-12-17 2021-12-17 基于预测的可变队形非完整移动机器人一致性控制方法

Country Status (1)

Country Link
CN (1) CN114237247A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114815856A (zh) * 2022-06-27 2022-07-29 中国人民解放军国防科技大学 非完整多智能体系统时变编队包含控制方法、装置和设备
CN115000994A (zh) * 2022-04-08 2022-09-02 贵州大学 一种多储能单元分组一致性功率分配方法
CN115826417A (zh) * 2023-02-20 2023-03-21 北京航空航天大学 基于拓扑重构的抗拒绝服务攻击的机器人编队控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111665848A (zh) * 2020-06-28 2020-09-15 北京航空航天大学 拓扑切换下无人机与无人车异构集群编队跟踪控制方法
CN113110495A (zh) * 2021-05-08 2021-07-13 广东省智能机器人研究院 一种考虑外部干扰下移动机器人的编队控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111665848A (zh) * 2020-06-28 2020-09-15 北京航空航天大学 拓扑切换下无人机与无人车异构集群编队跟踪控制方法
CN113110495A (zh) * 2021-05-08 2021-07-13 广东省智能机器人研究院 一种考虑外部干扰下移动机器人的编队控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HANZHENXIAO等: "Time-varying Nonholonomic Robot Consensus Formation Using Model Predictive Based Protocol With Switching Topology" *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115000994A (zh) * 2022-04-08 2022-09-02 贵州大学 一种多储能单元分组一致性功率分配方法
CN115000994B (zh) * 2022-04-08 2023-04-28 贵州大学 一种多储能单元分组一致性功率分配方法
CN114815856A (zh) * 2022-06-27 2022-07-29 中国人民解放军国防科技大学 非完整多智能体系统时变编队包含控制方法、装置和设备
CN114815856B (zh) * 2022-06-27 2022-09-20 中国人民解放军国防科技大学 非完整多智能体系统时变编队包含控制方法、装置和设备
CN115826417A (zh) * 2023-02-20 2023-03-21 北京航空航天大学 基于拓扑重构的抗拒绝服务攻击的机器人编队控制方法

Similar Documents

Publication Publication Date Title
CN114237247A (zh) 基于预测的可变队形非完整移动机器人一致性控制方法
Van Cuong et al. Adaptive trajectory tracking neural network control with robust compensator for robot manipulators
Ranjbar-Sahraei et al. A novel robust decentralized adaptive fuzzy control for swarm formation of multiagent systems
CN110597061A (zh) 一种多智能体完全分布式自抗扰时变编队控制方法
Xiao et al. Incremental updating multirobot formation using nonlinear model predictive control method with general projection neural network
Ebel et al. A comparative look at two formation control approaches based on optimization and algebraic graph theory
Xiao et al. Time-varying nonholonomic robot consensus formation using model predictive based protocol with switching topology
Xu et al. Two-layer distributed hybrid affine formation control of networked Euler–Lagrange systems
CN110658821A (zh) 一种多机器人抗干扰分组时变编队控制方法及系统
Liu et al. Distributed adaptive fuzzy control approach for prescribed-time containment of uncertain nonlinear multi-agent systems with unknown hysteresis
Tran et al. Switching formation strategy with the directed dynamic topology for collision avoidance of a multi‐robot system in uncertain environments
Wu et al. Finite-time fault-tolerant formation control for distributed multi-vehicle networks with bearing measurements
Simonetto et al. Constrained distributed algebraic connectivity maximization in robotic networks
Cenerini et al. Model Predictive Path Following Control without terminal constraints for holonomic mobile robots
CN110658811B (zh) 基于神经网络的受限移动机器人协同路径跟踪控制方法
CN114063652B (zh) 基于应力矩阵优化的多智能体系统仿射编队控制方法
Wang et al. Udwadia-Kalaba approach based distributed consensus control for multi-mobile robot systems with communication delays
Xiao et al. Integrated nonholonomic multi-robot consensus tracking formation using neural-network-optimized distributed model predictive control strategy
Nguyen et al. Formation control scheme with reinforcement learning strategy for a group of multiple surface vehicles
Li et al. A warm-started trajectory planner for fixed-wing unmanned aerial vehicle formation
Chung et al. Cooperative robot control and synchronization of Lagrangian systems
Ge et al. State-constrained bipartite tracking of interconnected robotic systems via hierarchical prescribed-performance control
Park et al. Formation reconfiguration control with collision avoidance of nonholonomic mobile robots
Ennen et al. Learning robust manipulation skills with guided policy search via generative motor reflexes
CN107807534B (zh) 一种多轮式机器人自适应协同控制算法及控制系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20220325