CN110703602A - 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 - Google Patents
一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 Download PDFInfo
- Publication number
- CN110703602A CN110703602A CN201911008034.4A CN201911008034A CN110703602A CN 110703602 A CN110703602 A CN 110703602A CN 201911008034 A CN201911008034 A CN 201911008034A CN 110703602 A CN110703602 A CN 110703602A
- Authority
- CN
- China
- Prior art keywords
- robot
- assembly
- control
- attitude
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,该方法针对装配总体和多个机器人形成的组合体,将存在干扰的姿态稳定控制问题建模为多机器人之间的博弈问题。利用辨识得到的转动惯量建立组合体的姿态动力学模型;利用干扰观测器观测得到外部干扰力矩,对姿态动力学模型进行改进;之后将上述姿态动力学模型写为状态相关形式。利用状态相关的组合体姿态动力学模型和各个机器人的性能指标函数建立微分博弈模型;之后通过优化性能指标函数得到HJ方程并求解,得到状态反馈控制策略表达式。由于直接将干扰观测器的观测结果添加至博弈模型中,得到的控制策略是严格意义的纳什均衡策略,且对建模不确定以及外部干扰等不确定因素有较好的抑制效果,具有一定的鲁棒性。
Description
技术领域
本发明涉及一种多机器人在轨装配姿态稳定控制方法,特别是一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法。
背景技术
在空间任务中,一些较大的任务载荷无法一次整体实现发射升空,往往需要通过多次分部件发射后在轨进行装配。装配中需要通过装配机器人进行装配体的姿态调整。通常的方式是通过集中式的控制解算并分配给多个机器人,但是这样的方法不具有最优性。
微分博弈的方法通过独立优化多个机器人各自的目标函数,分布式的得到各自的控制策略,实现装配体的姿态调整。文献“Game Theoretic Strategies for SpacecraftRendezvous and Motion Synchronization,AIAA GNCC,2012”公开了一种结合状态相关黎卡提方程的微分博弈控制方法。该方法将非线性模型表示为状态相关线性形式,结合线性二次型微分博弈的相关理论,得到控制策略。但该文献所述方法未考虑建模不确定以及外部干扰,不符合多机器人在轨装配易受到外部干扰的实际情况。文献“Robust output Nashstrategies based on sliding mode observation in a two-player differentialgame,Journal of the Franklin Institute,2012”公开了一种结合滑模观测器的二人微分博弈控制方法。该方法将控制分为两部分,一部分通过滑模观测器得到外部干扰的估计值进行补偿,另一部分通过线性二次型微分博弈得到标称模型的控制值,提高了系统的鲁棒性,较好地处理了干扰因素的影响。但由于该文献所述方法将控制分为两部分,所得到的控制策略并非严格意义的纳什均衡策略,也无法保证最优性;另外,该方法是针对线性模型,对于多机器人在轨装配这一非线性模型并不适用。
发明内容
为了克服在轨装配姿态稳定控制中受外部干扰的影响,本发明提供一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法。
该方法针对装配总体和多个机器人形成的组合体,将存在干扰的姿态稳定控制问题建模为多机器人之间的博弈问题。利用辨识得到的转动惯量建立组合体的姿态动力学模型;利用干扰观测器观测得到模型不确定和外部干扰力矩等的不确定动力学,对姿态动力学模型进行改进;之后将上述姿态动力学模型写为状态相关形式。利用状态相关的组合体姿态动力学模型和各个机器人的性能指标函数建立微分博弈模型;之后,通过优化性能指标函数得到HJ方程并求解,可得状态反馈控制策略表达式,可直接在线使用。由于直接将干扰观测器的观测结果添加至博弈模型中,得到的控制策略是严格意义的纳什均衡策略,且对建模不确定以及外部干扰等不确定因素有较好的抑制效果,具有一定的鲁棒性。
本发明的技术方案为:
所述一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,其特征在于:包括以下步骤:
步骤1:针对多机器人对在轨装配组合体进行姿态稳定控制的过程,利用公式
步骤2:根据控制量公式
计算各个机器人的控制量,其中N为机器人的个数,x=[σ,ω]T,σ为修正罗德里格斯参数,Rii和Rjj为设定的对称加权矩阵,Cj为机器人j本体坐标系到设定的参考坐标系的转换矩阵;Pi和Pj为对称正定矩阵,通过求解耦合的代数黎卡提方程
得到,其中Qi为设定的对称加权矩阵,
Rij为设定的对称加权矩阵;
步骤3:更新多机器人对在轨装配组合体进行姿态稳定控制这一过程的状态,之后返回步骤1进行下一周期的控制。
进一步的优选方案,所述一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,其特征在于:Qi=5I6,Rii=Rjj=Rij=0.01I3。
有益效果
本发明的有益效果是:设计鲁棒微分博弈控制器进行在轨装配的姿态稳定控制,利用干扰观测器对外部干扰等不确定性动力学进行估计,并将观测器的结果输入至博弈模型中,直接得到鲁棒的纳什均衡策略。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明姿态稳定控制方法原理框图。
图2是本发明方法的组合体姿态角变化图。
图3是本发明方法的组合体姿态角速度变化图。
图4是本发明方法的机器人1控制力矩变化图。
图5是本发明方法的机器人2控制力矩变化图。
图6是本发明方法的机器人3控制力矩变化图。
具体实施方式
本发明针对装配总体和多个机器人形成的组合体,将存在干扰的姿态稳定控制问题建模为多机器人之间的博弈问题。利用辨识得到的转动惯量建立组合体的姿态动力学模型;利用干扰观测器观测得到模型不确定和外部干扰力矩等的不确定动力学,对姿态动力学模型进行改进;之后将上述姿态动力学模型写为状态相关形式。利用状态相关的组合体姿态动力学模型和各个机器人的性能指标函数建立微分博弈模型;之后,通过优化性能指标函数得到HJ方程并求解,可得状态反馈控制策略表达式,可直接在线使用。
本发明中多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法的设计步骤为:
步骤一、控制系统模块划分。
图1为多机器人对装配体进行姿态稳定控制的原理框图。整个控制系统可以划分为:组合体姿态模型、干扰观测环节、控制环节、执行环节、干扰环节。
步骤二、组合体姿态动力学建模。
微分博弈模型由组合体动力学模型和个体性能指标函数组成。利用修正罗德里格斯参数σ∈R3来描述姿态,可得到姿态运动学模型为
组合体姿态运动受到的控制力矩一部分来自于机器人,一部分来自于干扰力矩,因此组合体的姿态动力学方程为
其中,N为机器人的个数;J∈R3×3为组合体的转动惯量矩阵;Cj∈R3×3为机器人j本体坐标系到设定的参考坐标系的转换矩阵;uj∈R3为机器人j本体坐标系下的控制力矩;d∈R3为外部干扰力矩,利用干扰观测器可得外部干扰的估计值为
联立(1)(2)式可得组合体的动力学模型
将(3)写作状态相关的形式可得
步骤三、干扰观测器设计。
将姿态动力学模型(2)写为线性形式可得
基于式(3)设计扩张系统
xa为解算得到的扩张状态,设z=ω-xa,则扩张系统和实际系统的差为
对于上述误差系统设计非线性观测器
根据式(7)和(5)可得外部干扰的估计值为
步骤四、鲁棒微分博弈控制器设计。
(1)微分博弈模型
组合体的微分博弈模型由组合体的动力学模型和性能指标函数得到。组合体的动力学模型如式(4)所示,各机器人的性能指标函数可以定义为
机器人期望通过独立优化各自的性能指标函数获得控制策略,以实现目标航天器的姿态稳定。则机器人的值函数为,
通过求解使性能指标函数最小的机器人反馈控制力矩,即满足
其中,Ψ(Ω)为可行控制策略集。
(2)控制律设计
式(10)的微分等价形式为
定义哈密尔顿函数为
对应地,可得对于其他任意机器人j的反馈控制策略为
将(16)和(17)代入(15)可得HJ方程为
但通过直接求解N个HJ方程的方式得到▽Vi *存在困难,因此,假设则
将(19)代入(18),并整理可得
通过求解上式可以得到对称正定矩阵Pi,代入(16)和(17)则得到状态反馈控制策略
状态反馈控制便于在线实施,适合工程应用。
基于上述设计结果,采用如下仿真场景,假设由三个机器人对位于地球静止轨道上的在轨装配组合体进行姿态稳定控制,其各自的本体坐标系到参考坐标系的转换矩阵分别为:
组合体的转动惯量矩阵为
干扰力矩为
组合体状态量的初值为x0=[0.03;-0.018;0.013;0;0;0],其中角度以修正罗德里格斯参数表示。机器人的单轴控制力矩最大为0.04N.m。干扰观测器的参数取k1=0.05;k2=26;k3=74;k4=155。控制器各项参数为Q1=Q2=Q3=5I6,R11=R12=R13=0.01I3,R21=R22=R23=0.01I3,R31=R32=R33=0.01I3。
具体实施流程为
步骤1、由式(9)得到干扰力矩的估计值;
步骤2、由式(22)计算控制量;
步骤3、在系统中更新状态;
步骤4、返回第二步。
仿真结果如图2-图6所示,仿真结果表明在存在干扰的情况下,该鲁棒微分博弈控制器能实现对装配组合体的姿态稳定,并对干扰有较好的抑制作用。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (2)
1.一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,其特征在于:包括以下步骤:
步骤1:针对多机器人对在轨装配组合体进行姿态稳定控制的过程,利用公式
步骤2:根据控制量公式
计算各个机器人的控制量,其中N为机器人的个数,x=[σ,ω]T,σ为修正罗德里格斯参数,Rii和Rjj为设定的对称加权矩阵,Cj为机器人j本体坐标系到设定的参考坐标系的转换矩阵;Pi和Pj为对称正定矩阵,通过求解耦合的代数黎卡提方程
得到,其中Qi为设定的对称加权矩阵,
Rij为设定的对称加权矩阵;
步骤3:更新多机器人对在轨装配组合体进行姿态稳定控制这一过程的状态,之后返回步骤1进行下一周期的控制。
2.根据权利要求1所述一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,其特征在于:Qi=5I6,Rii=Rjj=Rij=0.01I3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911008034.4A CN110703602B (zh) | 2019-10-22 | 2019-10-22 | 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911008034.4A CN110703602B (zh) | 2019-10-22 | 2019-10-22 | 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110703602A true CN110703602A (zh) | 2020-01-17 |
CN110703602B CN110703602B (zh) | 2022-07-26 |
Family
ID=69201321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911008034.4A Active CN110703602B (zh) | 2019-10-22 | 2019-10-22 | 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110703602B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112230552A (zh) * | 2020-10-30 | 2021-01-15 | 西北工业大学深圳研究院 | 针对离散时间多智能体博弈的抗干扰控制方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103199565A (zh) * | 2013-03-29 | 2013-07-10 | 华南理工大学 | 基于微分博弈理论的多区域自动发电控制协调方法 |
US8644426B1 (en) * | 2008-07-14 | 2014-02-04 | Marvell International Ltd. | Robust differential receiver for frequency modulated system |
CN106502260A (zh) * | 2016-12-01 | 2017-03-15 | 西北工业大学 | 空间绳系机器人抓捕挠性目标卫星后的姿态接管控制方法 |
CN107102548A (zh) * | 2017-05-12 | 2017-08-29 | 西北工业大学 | 一种空间失稳非合作目标的二次抓捕控制策略 |
CN107121961A (zh) * | 2017-05-25 | 2017-09-01 | 北京航空航天大学 | 一种基于迭代学习干扰观测器的航天器姿态容错控制方法 |
CN109933078A (zh) * | 2019-03-29 | 2019-06-25 | 西北工业大学 | 鲁棒微分博弈控制的多微卫星姿态接管失效航天器方法 |
CN110073301A (zh) * | 2017-08-02 | 2019-07-30 | 强力物联网投资组合2016有限公司 | 工业物联网中具有大数据集的数据收集环境下的检测方法和系统 |
CN110134137A (zh) * | 2019-06-18 | 2019-08-16 | 哈尔滨工业大学(深圳) | 基于扩张状态观测器的航天器姿态跟踪控制方法 |
-
2019
- 2019-10-22 CN CN201911008034.4A patent/CN110703602B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8644426B1 (en) * | 2008-07-14 | 2014-02-04 | Marvell International Ltd. | Robust differential receiver for frequency modulated system |
CN103199565A (zh) * | 2013-03-29 | 2013-07-10 | 华南理工大学 | 基于微分博弈理论的多区域自动发电控制协调方法 |
CN106502260A (zh) * | 2016-12-01 | 2017-03-15 | 西北工业大学 | 空间绳系机器人抓捕挠性目标卫星后的姿态接管控制方法 |
CN107102548A (zh) * | 2017-05-12 | 2017-08-29 | 西北工业大学 | 一种空间失稳非合作目标的二次抓捕控制策略 |
CN107121961A (zh) * | 2017-05-25 | 2017-09-01 | 北京航空航天大学 | 一种基于迭代学习干扰观测器的航天器姿态容错控制方法 |
CN110073301A (zh) * | 2017-08-02 | 2019-07-30 | 强力物联网投资组合2016有限公司 | 工业物联网中具有大数据集的数据收集环境下的检测方法和系统 |
CN109933078A (zh) * | 2019-03-29 | 2019-06-25 | 西北工业大学 | 鲁棒微分博弈控制的多微卫星姿态接管失效航天器方法 |
CN110134137A (zh) * | 2019-06-18 | 2019-08-16 | 哈尔滨工业大学(深圳) | 基于扩张状态观测器的航天器姿态跟踪控制方法 |
Non-Patent Citations (3)
Title |
---|
JINGLIANG SUN ET AL.: "Robust zero-sum differential Game for uncertain nonlinear systems via adaptive dynamic programming", 《PROCEEDINGS OR 2016 IEEE CHINESE GUIDANCE,NAVIGATION AND CONTROL CONFERENCE》 * |
孙景亮等: "基于自适应动态规划的导弹制导律研究综述", 《自动化学报》 * |
王泉德: "机器学习及其在多Agent对策学习中的应用研究", 《信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112230552A (zh) * | 2020-10-30 | 2021-01-15 | 西北工业大学深圳研究院 | 针对离散时间多智能体博弈的抗干扰控制方法 |
CN112230552B (zh) * | 2020-10-30 | 2022-05-13 | 西北工业大学深圳研究院 | 针对离散时间多智能体博弈的抗干扰控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110703602B (zh) | 2022-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kristiansen et al. | Spacecraft coordination control in 6DOF: Integrator backstepping vs passivity-based control | |
Bu et al. | Neural-approximation-based robust adaptive control of flexible air-breathing hypersonic vehicles with parametric uncertainties and control input constraints | |
Cong et al. | Distributed attitude synchronization of formation flying via consensus-based virtual structure | |
CN104589349B (zh) | 一种混合悬浮微重力环境下带有单关节机械臂的组合体自主控制方法 | |
Wong et al. | Adaptive tracking control using synthesized velocity from attitude measurements | |
CN107577145B (zh) | 编队飞行航天器反步滑模控制方法 | |
Jayakody et al. | Robust adaptive coordination controller for a spacecraft equipped with a robotic manipulator | |
Chang et al. | Decentralized coordinated attitude control for satellite formation flying via the state-dependent Riccati equation technique | |
CN112394645B (zh) | 一种航天器姿态跟踪的神经网络反步滑模控制方法和系统 | |
Liu et al. | Prescribed performance tracking control of a free-flying flexible-joint space robot with disturbances under input saturation | |
Lochan et al. | Robust tip trajectory synchronisation between assumed modes modelled two-link flexible manipulators using second-order PID terminal SMC | |
Park | Inverse optimal and robust nonlinear attitude control of rigid spacecraft | |
Bu et al. | Robust tracking control of hypersonic flight vehicles: a continuous model-free control approach | |
Hu et al. | Recursive decentralized control for robotic manipulators | |
Chai et al. | Linear quadratic differential game approach for attitude takeover control of failed spacecraft | |
Jia et al. | Vibration control of gyroelastic spacecraft using input shaping and angular momentum devices | |
De Stefano et al. | An energy-based approach for the multi-rate control of a manipulator on an actuated base | |
Bae et al. | Novel state estimation framework for humanoid robot | |
Vos et al. | Formation control of wheeled robots in the port-Hamiltonian framework | |
Khodaverdian et al. | Fault-tolerant model predictive sliding mode control with fixed-time attitude stabilization and vibration suppression of flexible spacecraft | |
Chen et al. | Sliding mode control of a class of underactuated system with non-integrable momentum | |
CN110703602B (zh) | 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 | |
Lang et al. | Non-cooperative differential game based output feedback control for spacecraft attitude regulation | |
Heydari et al. | Finite-horizon input-constrained nonlinear optimal control using single network adaptive critics | |
CN114167734A (zh) | 一种强耦合非线性系统高精度控制方法及控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |