CN112506194B - 一种移动机器人集群分布式安全学习控制方法 - Google Patents
一种移动机器人集群分布式安全学习控制方法 Download PDFInfo
- Publication number
- CN112506194B CN112506194B CN202011401269.2A CN202011401269A CN112506194B CN 112506194 B CN112506194 B CN 112506194B CN 202011401269 A CN202011401269 A CN 202011401269A CN 112506194 B CN112506194 B CN 112506194B
- Authority
- CN
- China
- Prior art keywords
- mobile robot
- speed
- control
- cluster
- feasible region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000004888 barrier function Effects 0.000 claims abstract description 16
- 239000013643 reference control Substances 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 8
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000011664 signaling Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000007613 environmental effect Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
Abstract
本发明属于移动机器人分布式控制技术领域,更具体地,涉及一种移动机器人集群分布式安全学习控制方法。本发明通过贝叶斯学习对环境扰动进行建模,将学习到的模型结合到先验系统模型作为动力学约束;通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域;根据速度可行域设计控制屏障函数,构建并求解二次规划问题以最小校正上层控制器的参考控制量,以满足安全无碰约束。本发明能够在不确定外部扰动的情况下,考虑动力学约束,实现移动机器人集群自适应分布式安全控制的技术目标。
Description
技术领域
本发明属于移动机器人分布式控制技术领域,更具体地,涉及一种移动机器人集群分布式安全学习控制方法。
背景技术
得益于传感器、微处理器等技术的飞速发展,移动机器人技术在军用和民用领域发挥着日益重要的作用。相比于单移动机器人系统,移动机器人集群系统能以彼此协作的方式高效、可靠地完成大面积复杂动态区域的作业任务,在灾害、战场等恶劣环境中具有不可替代的优势,越来越广泛地应用在智慧农业、空中巡查、电力巡检、物流快递等民用领域。实际应用场景中存时变风场、不同地面摩擦等不确定的环境扰动,具备像生物群体一般适应环境变化、能够安全避免集群机间碰撞以及与外部物体的碰撞的群体自主导航能力,是移动机器人集群自主完成作业任务的重要前提。
在集群的分布式控制方式中,利用邻近无人机的信息交互,各无人机自主决策规划并计算其控制指令,采用分布式组织结构的集群无人系统具有更好的可扩展性、适应动态环境以及抗风险和故障的能力。由于机载感知与通信能力有限,无人机仅能获得局部环境信息以及通信范围内邻近个体的信息,如何利用各无人机的局部有限信息,如何通过邻近无人机之间的相互作用,根据场景信息动态重构集群的队形变化,并快速形成新的目标队形,是分布式编队导航中的技术难点问题。另一方面,在实际环境中应用时,要求无人机能在环境不确定情况下自适应于环境扰动,快速、准确、稳定地控制,在此过程中需考虑自适应效果保证机间和与障碍物的无碰安全。目前的研究针对障碍物场景的移动机器人集群控制提出了各有特色的方法,然而考虑自适应于环境不确定扰动,并利用邻域信息考虑动力学模型设计安全分布式控制器,仍面临诸多新的挑战,解决这一问题是提升移动机器人集群提升安全可靠导航能力的关键。
发明内容
本发明为克服上述现有技术中的至少一个缺陷,提供一种移动机器人集群分布式安全学习控制方法,实现了对移动机器人集群自适应、安全的分布式控制。
为解决上述技术问题,本发明采用的技术方案是:一种移动机器人集群分布式安全学习控制方法,包括以下步骤:
S1.构造移动机器人集群中单机的动力学仿射控制模型;
S2.对各移动机器人,基于高斯过程回归对环境不确定扰动进行建模,模型可对扰动进行预测并给出预测的置信度;
S3.对各移动机器人,通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域;
S4.根据速度可行域设计控制屏障函数,对各移动机器人,通过联合动力学模型与控制屏障函数构建带不等式约束的二次规划问题,对上层控制器输出的参考控制量进行最小校正,将系统的状态和控制约束在可行安全域内,得到优化控制量;
S5.对各移动机器人,执行优化后得到的控制量,应用于机器人与环境的交互中;
S6.在线收集系统与环境交互的状态和控制序列,更新高斯过程回归模型;
S7.重复步骤S2至步骤S6直至交互结束。
本发明通过贝叶斯学习对环境扰动进行建模,先验系统模型作为动力学约束;通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域;根据速度可行域设计控制屏障函数,并构建二次规划问题对上层控制器计算得到的参考控制量进行最小校正,以满足安全无碰约束,实现能够自适应于环境扰动的、并能够保证安全无碰的移动机器人集群分布式控制。同时,方法对上层控制器不做约束,可兼容现有集群控制算法,为其提供安全性保证。
进一步的,所述的步骤S1中,构造的移动机器人集群中单机的动力学仿射控制模型为:
进一步的,所述的S2中,对各移动机器人,通过在线收集的数据集作为训练集,高斯过程回归通过贝叶斯推理得到状态x*的下偏差d(x*)的均值μ(x*)和方差σ(x*);得到关于d(x*)的高置信区间:D(x*)={d|μ(x*)-cδσ(x*)≤d≤μ(x*)+cδσ(x*)},cδ>0是高斯分布中(1-δ)置信度对应的常数。
进一步的,所述的S3步骤中,借鉴最优互惠速度障碍法的速度可行域构造法,为各移动机器人构造速度可行域,将安全避障问题转化到速度域上来分析。
进一步的,所述的S3步骤具体包括:
假设当前移动机器人A和邻域内其他任一机器人O的位置为pA和pO,速度分别为vA和vO,分别视作半径为rA和rO的圆形;
进一步的,在所述的步骤S4中,对各移动机器人,记为A,基于可行速度域构造控制屏障函数h(x),函数刻画速度vA与速度可行域边界的距离;结合基于高斯过程学习的动力学模型和控制屏障函数,给定上层控制器计算得到的参考控制量u0,不等式约束的二次规划问题的具体公式为:
st.-Lgh(x)u-Lfh(x)-Lμh(x)+cσ|Lσh(x)|-κ(h(x))≤ε
umin≤u≤umax
式中,umin和umax分别是控制量上界与下界,正定矩阵R为控制量权重,ε为代表松弛变量,Kε是对应的系数,cσ是方差对应的系数,符号L代表李导数,κ是一个k-class类函数。
进一步的,所述的上层控制器可以兼容现成的多种控制算法,如比例-微分-积分控制器或模型预测控制器。
进一步的,所述的步骤S5中,对各移动机器人,执行优化后得到的控制量u*,移动机器人集群与环境进行交互。
进一步的,所述的步骤S6中,在线收集集群系统与环境交互的位置和速度以及对应的控制量,更新高斯过程回归模型。
与现有技术相比,有益效果是:本发明提供的一种移动机器人集群分布式安全学习控制方法,解决了不确定环境扰动下移动机器人集群分布式控制过程中,无法适应外部扰动、可能发生机间与障碍物之间碰撞的问题。本发明基于高斯过程通过在线收集交互数据及贝叶斯推理在高置信度下实现对环境的扰动进行在线估计和补偿,以建模系统与环境交互环节存在的不确定性,并保证模型局部李普希兹连续;通过邻域移动机器人与障碍物位置和速度信息构造当前移动机器人的速度可行域,通过联合动力学模型与控制屏障函数构建带不等式约束的二次规划问题对参考控制量进行最小校正,在高置信度下保证满足安全无碰约束,从而实现对移动机器人集群自适应、安全的分布式控制。
附图说明
图1是本发明方法的计算过程流程示意图。
具体实施方式
如图1所示,一种移动机器人集群分布式安全学习控制方法,包括以下步骤:
步骤1.本实例根据对移动机器人的先验知识和实际的任务场景,对各移动机器人的非线性仿射系统建模为:
步骤2.对各移动机器人,基于高斯过程回归对环境不确定扰动进行建模,模型可对扰动进行预测并给出预测的置信度。
对各移动机器人,通过在线收集的数据集作为训练集,高斯过程回归通过贝叶斯推理得到状态x*的下偏差d(x*)的均值μ(x*)和方差σ(x*);得到关于d(x*)的高置信区间:D(x*)={d|μ(x*)-cδσ(x*)≤d≤μ(x*)+cδσ(x*)},cδ>0是高斯分布中(1-δ)置信度对应的常数。
步骤3.对各移动机器人,通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域。
借鉴最优互惠速度障碍法的速度可行域构造法,为各移动机器人构造速度可行域,如图2所示。
假设当前移动机器人A和邻域内其他任一机器人O的位置为pA和pO,速度分别为vA和vO,分别视作半径为rA和rO的圆形;
步骤4.根据速度可行域设计控制屏障函数,对各移动机器人,通过联合动力学模型与控制屏障函数构建带不等式约束的二次规划问题,对上层控制器输出的参考控制量通过安全控制器进行最小校正,将系统的状态和控制约束在可行安全域内,得到优化控制量。
对各移动机器人,记为A,基于可行速度域构造控制屏障函数h(x),函数刻画速度vA与速度可行域边界的距离;如图2(b)所示结合基于高斯过程学习的动力学模型和控制屏障函数,给定上层控制器计算得到的参考控制量u0,不等式约束的二次规划问题的具体公式为:
st.-Lgh(x)u-Lfh(x)-Lμh(x)+cσ|Lσh(x)|-κ(h(x))≤ε
umin≤u≤umax
式中,umin和umax分别是控制量上界与下界,正定矩阵R为控制量权重,ε为代表松弛变量,Kε是对应的系数,cσ是方差对应的系数,符号L代表李导数,κ是一个k-class类函数。
步骤5.对各移动机器人,执行优化后得到的控制量u*,移动机器人集群与环境进行交互。
步骤6.在线收集系统与环境交互的状态和控制序列,更新高斯过程回归模型;
步骤7.重复步骤2至步骤6,直至完成集群控制任务或最大实验设定时长。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (8)
1.一种移动机器人集群分布式安全学习控制方法,其特征在于,包括以下步骤:
S1.构造移动机器人集群中单机的动力学仿射控制模型;
S2.对各移动机器人,基于高斯过程回归对环境不确定扰动进行建模,模型可对扰动进行预测并给出预测的置信度;
S3.对各移动机器人,通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域;
S4.根据速度可行域设计控制屏障函数,对各移动机器人,通过联合动力学模型与控制屏障函数构建带不等式约束的二次规划问题,对上层控制器输出的参考控制量进行最小校正,将系统的状态和控制约束在可行安全域内,得到优化控制量;
S5.对各移动机器人,执行优化后得到的控制量,应用于机器人与环境的交互中;
S6.在线收集系统与环境交互的状态和控制序列,更新高斯过程回归模型;
S7.重复步骤S2至步骤S6直至交互结束;
在所述的步骤S4中,对各移动机器人,记为A,基于可行速度域构造控制屏障函数h(x),函数刻画速度vA与速度可行域边界的距离;结合基于高斯过程学习的动力学模型和控制屏障函数,给定上层控制器计算得到的参考控制量u0,不等式约束的二次规划问题的具体公式为:
st.-Lgh(x)u-Lfh(x)-Lμh(x)+cσ|Lσh(x)|-κ(h(x))≤ε
umin≤u≤umax
4.根据权利要求3所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的S3步骤中,借鉴最优互惠速度障碍法的速度可行域构造法,为各移动机器人构造速度可行域,将安全避障问题转化到速度域上来分析。
5.根据权利要求4所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的S3步骤具体包括:
假设当前移动机器人A和邻域内其他任一机器人O的位置为pA和pO,速度分别为vA和vO,分别视作半径为rA和rO的圆形;
6.根据权利要求5所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的上层控制器为比例-微分-积分控制器、模型预测控制器。
7.根据权利要求5所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的步骤S5中,对各移动机器人,执行优化后得到的控制量u*,移动机器人集群与环境进行交互。
8.根据权利要求5所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的步骤S6中,在线收集集群系统与环境交互的位置和速度以及对应的控制量,更新高斯过程回归模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011401269.2A CN112506194B (zh) | 2020-12-03 | 2020-12-03 | 一种移动机器人集群分布式安全学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011401269.2A CN112506194B (zh) | 2020-12-03 | 2020-12-03 | 一种移动机器人集群分布式安全学习控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112506194A CN112506194A (zh) | 2021-03-16 |
CN112506194B true CN112506194B (zh) | 2022-03-29 |
Family
ID=74969800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011401269.2A Active CN112506194B (zh) | 2020-12-03 | 2020-12-03 | 一种移动机器人集群分布式安全学习控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112506194B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2024022942A (ja) * | 2022-08-08 | 2024-02-21 | 川崎重工業株式会社 | 制御装置 |
CN116048120B (zh) * | 2023-01-10 | 2024-04-16 | 中国建筑一局(集团)有限公司 | 一种未知动态环境下小型四旋翼无人机自主导航系统及方法 |
CN116540553B (zh) * | 2023-07-05 | 2023-08-25 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种基于强化学习的移动机器人安全运动方法 |
CN117687342A (zh) * | 2024-01-31 | 2024-03-12 | 中国科学技术大学 | 基于高斯过程非保守概率误差界的机器人安全控制方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2595135A1 (en) * | 2011-11-16 | 2013-05-22 | Volvo Car Corporation | Method and arrangement for collision avoidance |
CN105223956A (zh) * | 2015-11-09 | 2016-01-06 | 中山大学 | 一种全向移动机器人的动态避障方法 |
CN110825108A (zh) * | 2019-11-11 | 2020-02-21 | 浙江理工大学 | 一种在同一空域内多架跟踪无人机的协同防碰撞方法 |
CN110928189A (zh) * | 2019-12-10 | 2020-03-27 | 中山大学 | 一种基于强化学习和李雅普诺夫函数的鲁棒控制方法 |
CN111830959A (zh) * | 2019-03-26 | 2020-10-27 | 百度(美国)有限责任公司 | 用于操作自动驾驶车辆的方法、系统和机器可读介质 |
-
2020
- 2020-12-03 CN CN202011401269.2A patent/CN112506194B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2595135A1 (en) * | 2011-11-16 | 2013-05-22 | Volvo Car Corporation | Method and arrangement for collision avoidance |
CN105223956A (zh) * | 2015-11-09 | 2016-01-06 | 中山大学 | 一种全向移动机器人的动态避障方法 |
CN111830959A (zh) * | 2019-03-26 | 2020-10-27 | 百度(美国)有限责任公司 | 用于操作自动驾驶车辆的方法、系统和机器可读介质 |
CN110825108A (zh) * | 2019-11-11 | 2020-02-21 | 浙江理工大学 | 一种在同一空域内多架跟踪无人机的协同防碰撞方法 |
CN110928189A (zh) * | 2019-12-10 | 2020-03-27 | 中山大学 | 一种基于强化学习和李雅普诺夫函数的鲁棒控制方法 |
Non-Patent Citations (7)
Title |
---|
A Practical Leader–Follower Tracking Control Scheme for Multiple Nonholonomic Mobile Robots in Unknown Obstacle Environments;Yuanzhe Wang;《IEEE TRANSACTIONS ON CONTROL SYSTEMS TECHNOLOGY》;20190731;全文 * |
Decentralized Navigation of Multiple Agents Based on ORCA and Model Predictive Control;成慧;《2017 IEEE/RSJ International Conference on Intelligent Robots and Systems》;20170928;第2-3部分 * |
Distributed Formation Control Using Fuzzy Self-Tuning of Strictly Negative Imaginary Consensus Controllers in Aerial Robotics;Vu Phi Tran;《Transactions on Mechatronics》;20201110;全文 * |
Learning-Based Safety-Stability-Driven Control for Safety-Critical Systems under Model Uncertainties;成慧;《The 12th International Conference on Wireless Communications and Signal Processing》;20201023;第1113-1115页 * |
基于视觉的无人机地面目标自主跟踪系统;成慧;《人工智能》;20171231;全文 * |
基于速度障碍法的无人机避障与航迹恢复策略;张宏宏;《系统工程与电子技术》;20200831;全文 * |
基于预测窗的轮式移动机器人最优避障避碰算法;刘中常;《控制理论与应用》;20200531;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112506194A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112506194B (zh) | 一种移动机器人集群分布式安全学习控制方法 | |
Wang et al. | Autonomous navigation of UAVs in large-scale complex environments: A deep reinforcement learning approach | |
CN110928189B (zh) | 一种基于强化学习和李雅普诺夫函数的鲁棒控制方法 | |
CN112835333B (zh) | 一种基于深度强化学习多agv避障与路径规划方法及系统 | |
CN105189237B (zh) | 用于控制自动驾驶或部分自动驾驶的陆地车辆的设备 | |
Orozco-Rosas et al. | Mobile robot path planning using a QAPF learning algorithm for known and unknown environments | |
CN110162035B (zh) | 一种集群机器人在有障碍物场景中的协同运动方法 | |
McKinnon et al. | Learn fast, forget slow: Safe predictive learning control for systems with unknown and changing dynamics performing repetitive tasks | |
EP3800521B1 (en) | Deep learning based motion control of a vehicle | |
CN107479547A (zh) | 基于示教学习的决策树行为决策算法 | |
Pini et al. | Safe real-world autonomous driving by learning to predict and plan with a mixture of experts | |
Li et al. | A deep reinforcement learning based approach for autonomous overtaking | |
Guo et al. | Research on multi-sensor information fusion and intelligent optimization algorithm and related topics of mobile robots | |
Louati | Cloud-assisted collaborative estimation for next-generation automobile sensing | |
CN110926470B (zh) | 一种agv导航控制方法及系统 | |
CN111221318B (zh) | 一种基于模型预测控制算法的多机器人状态估计方法 | |
CN114200936B (zh) | 基于最优控制及宽度学习的agv实时路径规划方法 | |
CN114912693A (zh) | 一种基于多模态预测的自动驾驶汽车运动规划方法 | |
Schlichting et al. | LSTM-based spatial encoding: Explainable path planning for time-variant multi-agent systems | |
Wang et al. | Path Following Control for Unmanned Surface Vehicles: A Reinforcement Learning-Based Method With Experimental Validation | |
Li et al. | RDDRL: a recurrent deduction deep reinforcement learning model for multimodal vision-robot navigation | |
Wei et al. | Multi-sensor environmental perception and adaptive cruise control of intelligent vehicles using kalman filter | |
Piperigkos et al. | Cooperative Five Degrees Of Freedom Motion Estimation For A Swarm Of Autonomous Vehicles | |
Zhang et al. | Inverse Reinforcement Learning in Automatic Driving Decision | |
Zhang et al. | Generative-Model-Based Autonomous Intelligent Unmanned Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |