CN116736722A - 基于数据驱动的多机器人系统最优比例协同控制方法 - Google Patents
基于数据驱动的多机器人系统最优比例协同控制方法 Download PDFInfo
- Publication number
- CN116736722A CN116736722A CN202310852971.8A CN202310852971A CN116736722A CN 116736722 A CN116736722 A CN 116736722A CN 202310852971 A CN202310852971 A CN 202310852971A CN 116736722 A CN116736722 A CN 116736722A
- Authority
- CN
- China
- Prior art keywords
- robot
- network
- function
- control
- follows
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000013528 artificial neural network Methods 0.000 claims abstract description 12
- 230000003044 adaptive effect Effects 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 54
- 239000011159 matrix material Substances 0.000 claims description 32
- 238000013461 design Methods 0.000 claims description 8
- 230000011273 social behavior Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 5
- 239000003795 chemical substances by application Substances 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000012804 iterative process Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于数据驱动的多机器人系统最优比例协同控制方法,包括以下步骤:S1、建立由一般线性系统描述的多机器人动力学模型,并通过Bellman最优性原理构建了多机器人系统的最优比例一致性控制问题;S2、设计自适应动态规划算法用来计算基于广义策略迭代的离散时间Hamilton‑Jacobi‑Bellman方程的近似解;S3、搭建评价‑执行神经网络来分别拟合迭代控制律和性能指标;S4、将步骤S3设计的评价‑执行网络控制器部署到机器人群体中。本发明的方法针对由一般线性系统描述的多机器人系统,考虑了具有特定任务目标的最优控制情况,使用评价‑执行网络实现了在线最优协同控制,适用于多机器人系统的集群协同控制领域。
Description
技术领域
本发明属于多机器人系统的协同控制技术领域,具体涉及一种基于数据驱动的多机器人系统最优比例协同控制方法。
背景技术
近年来,多机器人系统的协同分布式控制因其广泛的应用而成为控制界的一个研究热点。多机器人协同控制是指通过设计控制算法实现多个机器人相互沟通,协同工作完成一项具体任务。然而在工程应用中,多机器人系统中的协同行为的实现不仅涉及到机器人的一致性,而且还涉及到协同控制过程中的能量消耗最小化。因此,如何找到多机器人系统的最优协同控制问题的有效解决方案是目前亟需解决的问题。
目前关于已有许多研究围绕多机器人系统的协同最优控制问题而展开,然而一方面,现有研究大都没有考虑具有不同任务的机器人的运动状态会收敛到一个取决于初始条件的平衡状态,而不是一个共同的值,这在实际应用中会收到极大限制。另一方面,现有的解决最优协同控制问题的方法都会导致计算维度过大难以求解,因此对于可以避免维度灾难的数据驱动控制算法的研究具有重大意义。
发明内容
本发明的目的在于克服现有技术的不足,提供一种考虑了具有特定任务目标的最优控制情况,使用评价-执行网络实现了在线最优协同控制,适用于多机器人系统的集群协同控制领域的基于数据驱动的多机器人系统最优比例协同控制方法。
本发明的目的是通过以下技术方案来实现的:基于数据驱动的多机器人系统最优比例协同控制方法,具体步骤如下:
S1、建立由一般线性系统描述的多机器人动力学模型,根据任务目标构建最优比例一致性问题;机器人的动力学模型如下:
xi(k+1)=Axi(k)+Biui(k),i=1,2,…,N (1)
其中xi(k)∈Rn是第i个机器人k时刻的系统状态量,n表示机器人系统状态维度,N表示机器人数量,是控制输入,mi表示控制输入维度,A∈Rn×n是系统矩阵,/>是输入矩阵;
将多机器人系统之间的通信网络抽象成一个有向图由一个顶点集一个边集/>以及一个加权邻接矩阵/>组成;其中临界元素非负aij≥0;当且仅当(vj,vi)∈ε时,aij>0代表机器人i能够接收到机器人j的信息;否则,aij=0;对于/>aii=0;节点vi的邻居集合表示为/>入度矩阵表示为对角矩阵/>然后通过/>获得拉普拉斯矩阵/>
多机器人系统的比例协同行为是指通过对每个机器人i设计相应的分布式控制律ui(k),使得所有的机器人能够按照预设的比例系数收敛到不同的状态并保持稳定,称比例协同行为得到了实现,该问题用下面的数学表示进行刻画:
其中αi为第i个机器人的协同比例值;
而后,针对每个机器人i,定义比例协同误差:
设为比例协同一致性误差向量,得到:
其中
根据公式(1)和(3),得到比例一致性误差∈i(k)的动力学方程为:
每个机器人i都需要最小化性能指标函数Vi(∈i(k),ui(k),u(j)(k)),u(j)(k)是机器人i的邻居机器人的控制输入集合;接下来将设计最优控制律以最小化性能指标函数,同时保证当k趋于无穷时,每个机器人的比例一致性误差∈i(k)→0;
规定每个机器人的局部性能指标函数为:
其中ci(∈i(k),ui(k),u(j)(k))是效用函数;γ∈(0,1]是折扣因子;记Vi(∈i(k),ui(k),u(j)(k))=Vi(∈i(k));
根据Bellman最优性原理,最优性能指标函数满足如下的离散时间Hamilton-Jacobi-Bellman方程:
最优控制律为:
将最优控制律代入公式(7)的HJB方程,得到:
S2、设计自适应动态规划算法用来计算基于广义策略迭代的离散时间Hamilton-Jacobi-Bellman方程的近似解;
S3、搭建评价-执行神经网络来分别拟合迭代控制律和性能指标,并根据梯度下降算法迭代更新网络权重;
S4、将步骤S3设计的评价-执行网络控制器部署到机器人群体中。
所述步骤S2具体实现方法为:定义一个综合考虑能量损失和系统控制过程误差的效用函数为:
其中Qii>0,Rii>0,Rij>0,均为正定对称的权重矩阵;
设和Vi p(∈(k))分别表示迭代控制律和迭代性能指标函数;其中,p表示迭代指标,k表示时间步长;记Vi p,q(∈i(k))作为子迭代性能指标函数,其中迭代索引q=0,1,2,...,Nj,其中Nj是预设的最大子迭代次数;
接下来设计自适应广义策略迭代算法的迭代过程如下:
S21、对于p=1,2,…控制律的更新规则如下:
S22、固定控制律第p步的迭代性能指标函数Vi p(∈(k))按照如下两个阶段计算:
S221、对于q=1,2,…,Nj:
其中,
S222、第p次子迭代的值函数为:
所述步骤S3具体实现方法为:机器人i的评价网络利用误差∈i,控制输入ui及其邻居的控制输入u(j)来作为网络的输入,输出是性能指标函数Vi的近似值,表示为:
其中Xci(k)是由∈i(k),ui(k),u(j)(k)组成的critic网络智能体i的输入向量,Yci是权重矩阵,wci是神经网络隐藏层和输出层的权重矩阵;φci(·)作为critic的激活函数,选取为:
然后,定义critic网络的误差函数:
进而,目标是最小化损失函数:
利用梯度下降原理,设计网络权值的参数在线更新规则如下:
其中,βc是网络学习率;
机器人i的执行网络利用误差∈i作为网络的输入;输出是控制律ui的近似值,表示为:
其中Xai(k)是由∈i(k)组成的actor网络机器人i的输入向量,Yai是权重矩阵,wai是神经网络隐藏层和输出层的权重矩阵,φai(·)作为actor的激活函数约束控制信号;
然后,定义actor网络的误差函数:
εai=Vi-Uc (21)
其中,Uc是代价函数,设Uc=0;进而,目标是最小化损失函数:
利用梯度下降原理,设计网络权值的参数在线更新规则如下:
其中,βa是网络学习率。
本发明的有益效果是:本发明首先建立多机器人动力学模型,并根据任务目标明确最优比例一致性问题,设计了自适应动态规划算法用来计算基于广义策略迭代的离散时间HJB方程的适当近似解,在此基础上搭建了评价-执行神经网络分别拟合迭代控制律和性能指标,并根据梯度下降算法迭代更新网络权重,实现了多机器人系统的数据驱动在线最优协同控制。本发明的方法针对由一般线性系统描述的多机器人系统,考虑了具体任务目标下对多机器人系统的最优协同控制,采用数据驱动的方法实现在线更新控制,不依赖系统具体模型,适用于多机器人系统的协同控制领域。
附图说明
图1为本发明的一种基于数据驱动的多机器人系统最优协同控制方法的流程图;
图2为本发明实施例中给定的多机器人系统的通信拓扑示意图;
图3为本发明实施例中将数据驱动的自适应动态规划控制算法部署到多机器人系统后呈现的最优比例一致协同行为示意图。
具体实施方式
下面结合附图进一步说明本发明的技术方案。
如图1所示,本发明的一种基于数据驱动的多机器人系统最优比例协同控制方法,具体步骤如下:
S1、建立由一般线性系统描述的多机器人动力学模型,根据任务目标构建最优比例一致性问题;机器人的动力学模型如下:
xi(k+1)=Axi(k)+Biui(k),i=1,2,…,N (1)
其中xi(k)∈Rn是第i个机器人k时刻的系统状态量,通常表示为机器人的空间位置坐标xi(k)=[Xi(k),Yi(k)]T,在无人物流行业内,将地面小车作为机器人,其空间位置坐标将由地面小车自身所携带的位置传感器及惯性测量单元等得到,用来描述地面小车机器人的空间位置坐标及在空间上的运动情况,完成对地面小车的定位、轨迹规划以及运动控制,进而实现多机器人系统在无人物流行业的集群送货,自主规划避障,高效物流运输。n表示机器人系统状态维度,N表示机器人数量,是控制输入,mi表示控制输入维度,A∈Rn×n是系统矩阵,/>是输入矩阵,其中系统矩阵和输入矩阵由研究对象的具体物理模型决定。
多机器人系统通信结结构如图2所示,每个机器人Agent具有发送或接受邻居信息的能力。将多机器人系统之间的通信网络抽象成一个有向图由一个顶点集一个边集/>以及一个加权邻接矩阵/>组成;其中临界元素非负aij≥0;当且仅当/>时,aij>0代表机器人i能够接收到机器人j的信息;否则,aij=0;对于/>aii=0;节点vi的邻居集合表示为/>入度矩阵表示为对角矩阵/>然后通过/>获得拉普拉斯矩阵/>
多机器人系统的比例协同行为是指通过对每个机器人i设计相应的分布式控制律ui(k),使得所有的机器人能够按照预设的比例系数收敛到不同的状态并保持稳定,称比例协同行为得到了实现,该问题用下面的数学表示进行刻画:
其中αi为第i个机器人的协同比例值;
而后,针对每个机器人i,定义比例协同误差:
设为比例协同一致性误差向量,得到:
其中
根据公式(1)和(3),得到比例一致性误差∈i(k)的动力学方程为:
每个机器人i都需要最小化性能指标函数Vi(∈i(k),ui(k),u(j)(k)),u(j)(k)是机器人i的邻居机器人的控制输入集合;接下来将设计最优控制律以最小化性能指标函数,同时保证当k趋于无穷时,每个机器人的比例一致性误差∈i(k)→0;
规定每个机器人的局部性能指标函数为:
其中ci(i(k),ui(k),u(j)(k))是效用函数;γ∈(0,1]是折扣因子;为了方便表示,记Vi(∈i(k),ui(k),u(j)(k))=Vi(∈i(k));
根据Bellman最优性原理,最优性能指标函数满足如下的离散时间Hamilton-Jacobi-Bellman(HJB)方程:
最优控制律为:
将最优控制律代入公式(7)的HJB方程,得到:
S2、设计自适应动态规划算法用来计算基于广义策略迭代的离散时间Hamilton-Jacobi-Bellman方程的近似解;具体实现方法为:定义一个综合考虑能量损失和系统控制过程误差的效用函数为:
其中Qii>0,Rii>0,Rij>0,均为正定对称的权重矩阵;
设和Vi p(∈(k))分别表示迭代控制律和迭代性能指标函数;其中,p表示迭代指标,k表示时间步长;为了方便算法设计,记Vi p,q(∈i(k))作为子迭代性能指标函数,其中迭代索引q=0,1,2,...,Nj,其中Nj是预设的最大子迭代次数;
接下来设计自适应广义策略迭代算法的迭代过程如下:
S21、对于p=1,2,…控制律的更新规则如下:
S22、固定控制律第p步的迭代性能指标函数Vi p(∈(k))按照如下两个阶段计算:
S221、对于q=1,2,…,Nj:
其中,
S222、第p次子迭代的值函数为:
S3、基于步骤S2中的自适应动态规划算法框架,搭建评价-执行神经网络来分别拟合迭代控制律和性能指标,并根据梯度下降算法迭代更新网络权重。
具体实现方法为:机器人i的评价网络利用误差∈i,控制输入ui及其邻居的控制输入u(j)来作为网络的输入,输出是性能指标函数Vi的近似值,表示为:
其中Xci(k)是由∈i(k),ui(k),u(j)(k)组成的critic网络智能体i的输入向量,Yci是权重矩阵,wci是神经网络隐藏层和输出层的权重矩阵;φci(·)作为critic的激活函数,选取为:
然后,定义critic网络的误差函数:
进而,目标是最小化损失函数:
利用梯度下降原理,设计网络权值的参数在线更新规则如下:
其中,βc是网络学习率;
机器人i的执行网络利用误差∈i作为网络的输入;输出是控制律ui的近似值,表示为:
其中Xai(k)是由∈i(k)组成的actor网络机器人i的输入向量,Yai是权重矩阵,wai是神经网络隐藏层和输出层的权重矩阵,φai(·)作为actor的激活函数约束控制信号;
然后,定义actor网络的误差函数:
εai=Vi-Uc (21)
其中,Uc是代价函数,设Uc=0;进而,目标是最小化损失函数:
利用梯度下降原理,设计网络权值的参数在线更新规则如下:
其中,βa是网络学习率。
S4、将步骤S3设计的评价-执行网络控制器部署到机器人群体中,可以在具体任务目标下实现多机器人系统的数据驱动在线最优协同控制,最终的效果如图3所示。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (3)
1.基于数据驱动的多机器人系统最优比例协同控制方法,其特征在于,具体步骤如下:
S1、建立由一般线性系统描述的多机器人动力学模型,根据任务目标构建最优比例一致性问题;机器人的动力学模型如下:
xi(k+1)=Axi(k)+Biui(k),i=1,2,,N (1)
其中xi(k)∈Rn是第i个机器人k时刻的系统状态量,n表示机器人系统状态维度,N表示机器人数量,ui(k)∈Rmi是控制输入,mi表示控制输入维度,A∈Rn×n是系统矩阵,Bi∈Rn×mi是输入矩阵;
将多机器人系统之间的通信网络抽象成一个有向图由一个顶点集一个边集/>以及一个加权邻接矩阵/>组成;其中临界元素非负aij≥0;当且仅当(vj,vi)∈时,aij>0代表机器人i能够接收到机器人j的信息;否则,aij=0;对于/>节点vi的邻居集合表示为/>入度矩阵表示为对角矩阵/>然后通过/>获得拉普拉斯矩阵/>
多机器人系统的比例协同行为是指通过对每个机器人i设计相应的分布式控制律ui(k),使得所有的机器人能够按照预设的比例系数收敛到不同的状态并保持稳定,称比例协同行为得到了实现,该问题用下面的数学表示进行刻画:
其中αi为第i个机器人的协同比例值;
而后,针对每个机器人i,定义比例协同误差:
设为比例协同一致性误差向量,得到:
其中
根据公式(1)和(3),得到比例一致性误差i(k)的动力学方程为:
每个机器人i都需要最小化性能指标函数Vi(i(k),ui(k),u(j)(k)),u(j)(k)是机器人i的邻居机器人的控制输入集合;接下来将设计最优控制律以最小化性能指标函数,同时保证当k趋于无穷时,每个机器人的比例一致性误差i(k)→0;
规定每个机器人的局部性能指标函数为:
其中ci(i(k),ui(k),u(j)(k))是效用函数;γ∈(0,1]是折扣因子;记Vi(i(k),ui(k),u(j)(k))=Vi(i(k));
根据Bellman最优性原理,最优性能指标函数满足如下的离散时间Hamilton-Jacobi-Bellman方程:
最优控制律为:
将最优控制律代入公式(7)的HJB方程,得到:
S2、设计自适应动态规划算法用来计算基于广义策略迭代的离散时间Hamilton-Jacobi-Bellman方程的近似解;
S3、搭建评价-执行神经网络来分别拟合迭代控制律和性能指标,并根据梯度下降算法迭代更新网络权重;
S4、将步骤S3设计的评价-执行网络控制器部署到机器人群体中。
2.根据权利要求1所述的基于数据驱动的多机器人系统最优比例协同控制方法,其特征在于,所述步骤S2具体实现方法为:定义一个综合考虑能量损失和系统控制过程误差的效用函数为:
其中Qii>0,Rii>0,Rij>0,均为正定对称的权重矩阵;
设和Vi p((k))分别表示迭代控制律和迭代性能指标函数;其中,p表示迭代指标,k表示时间步长;记Vi p,q(i(k))作为子迭代性能指标函数,其中迭代索引q=0,1,2,...,Nj,其中Nj是预设的最大子迭代次数;
接下来设计自适应广义策略迭代算法的迭代过程如下:
S21、对于p=1,2,控制律的更新规则如下:
S22、固定控制律第p步的迭代性能指标函数Vi p((k))按照如下两个阶段计算:
S221、对于q=1,2,,Nj:
其中,
S222、第p次子迭代的值函数为:
3.根据权利要求1所述的基于数据驱动的多机器人系统最优比例协同控制方法,其特征在于,所述步骤S3具体实现方法为:机器人i的评价网络利用误差i,控制输入ui及其邻居的控制输入u(j)来作为网络的输入,输出是性能指标函数Vi的近似值,表示为:
其中Xci(k)是由i(k),ui(k),u(j)(k)组成的critic网络智能体i的输入向量,Yci是权重矩阵,wci是神经网络隐藏层和输出层的权重矩阵;φci(·)作为critic的激活函数,选取为:
然后,定义critic网络的误差函数:
进而,目标是最小化损失函数:
利用梯度下降原理,设计网络权值的参数在线更新规则如下:
其中,βc是网络学习率;
机器人i的执行网络利用误差i作为网络的输入;输出是控制律ui的近似值,表示为:
其中Xai(k)是由i(k)组成的actor网络机器人i的输入向量,Yai是权重矩阵,wai是神经网络隐藏层和输出层的权重矩阵,φai(·)作为actor的激活函数约束控制信号;
然后,定义actor网络的误差函数:
εai=Vi-Uc (21)
其中,Uc是代价函数,设Uc=0;进而,目标是最小化损失函数:
利用梯度下降原理,设计网络权值的参数在线更新规则如下:
其中,βa是网络学习率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310852971.8A CN116736722A (zh) | 2023-07-12 | 2023-07-12 | 基于数据驱动的多机器人系统最优比例协同控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310852971.8A CN116736722A (zh) | 2023-07-12 | 2023-07-12 | 基于数据驱动的多机器人系统最优比例协同控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116736722A true CN116736722A (zh) | 2023-09-12 |
Family
ID=87906065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310852971.8A Pending CN116736722A (zh) | 2023-07-12 | 2023-07-12 | 基于数据驱动的多机器人系统最优比例协同控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116736722A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117111620A (zh) * | 2023-10-23 | 2023-11-24 | 山东省科学院海洋仪器仪表研究所 | 一种异构无人系统任务分配自主决策方法 |
-
2023
- 2023-07-12 CN CN202310852971.8A patent/CN116736722A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117111620A (zh) * | 2023-10-23 | 2023-11-24 | 山东省科学院海洋仪器仪表研究所 | 一种异构无人系统任务分配自主决策方法 |
CN117111620B (zh) * | 2023-10-23 | 2024-03-29 | 山东省科学院海洋仪器仪表研究所 | 一种异构无人系统任务分配自主决策方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Optimal control via neural networks: A convex approach | |
Fu et al. | Distributed formation navigation of constrained second-order multiagent systems with collision avoidance and connectivity maintenance | |
CN111531538B (zh) | 一种切换拓扑下的多机械臂系统一致性控制方法及装置 | |
Xiao et al. | Incremental updating multirobot formation using nonlinear model predictive control method with general projection neural network | |
Yang et al. | Event-triggered finite-time formation control for multiple unmanned aerial vehicles with input saturation | |
CN116736722A (zh) | 基于数据驱动的多机器人系统最优比例协同控制方法 | |
Qian et al. | Robust formation maneuvers through sliding mode for multi-agent systems with uncertainties | |
Lu et al. | On robust control of uncertain chaotic systems: a sliding-mode synthesis via chaotic optimization | |
Huang et al. | Multi-robot system task allocation mechanism for smart factory | |
CN112596395A (zh) | 一种多重信息约束下的多智能体一致性协同控制方法 | |
CN112558470A (zh) | 一种执行器饱和多智能体系统最优一致性控制方法和装置 | |
Cong et al. | Formation control for multiquadrotor aircraft: Connectivity preserving and collision avoidance | |
Cui et al. | Observer-based adaptive fuzzy formation control of nonlinear multi-agent systems with nonstrict-feedback form | |
Han et al. | A review of reinforcement learning methodologies on control systems for building energy | |
Cui et al. | Adaptive consensus tracking control of strict-feedback nonlinear multi-agent systems with unknown dynamic leader | |
Kumar et al. | A new hybrid force/position control approach for time-varying constrained reconfigurable manipulators | |
CN113885548A (zh) | 一种多四旋翼无人机输出约束状态一致博弈控制器 | |
Ji et al. | Adaptive fault‐tolerant optimized formation control for perturbed nonlinear multiagent systems | |
Tsai et al. | Adaptive RFWCMAC cooperative formation control for multiple ballbots incorporated with coupling dynamics | |
CN116974185A (zh) | 多智能体二分一致性的控制方法、装置、设备及存储介质 | |
Bai et al. | Hierarchical control of multi-agent systems using online reinforcement learning | |
Liu et al. | Data‐driven consensus control for a class of unknown nonlinear multiagent systems with time delays | |
CN115598970A (zh) | 具有非线性死区的多机器人模糊自适应角度编队控制方法 | |
CN114265315A (zh) | 异构线性集群系统时变输出编队跟踪控制方法及系统 | |
CN114721273A (zh) | 一种固定时间收敛零化神经网络的多智能体编队控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |