CN110703602A - 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 - Google Patents

一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 Download PDF

Info

Publication number
CN110703602A
CN110703602A CN201911008034.4A CN201911008034A CN110703602A CN 110703602 A CN110703602 A CN 110703602A CN 201911008034 A CN201911008034 A CN 201911008034A CN 110703602 A CN110703602 A CN 110703602A
Authority
CN
China
Prior art keywords
robot
assembly
control
attitude
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911008034.4A
Other languages
English (en)
Other versions
CN110703602B (zh
Inventor
罗建军
柴源
王明明
韩楠
王嘉文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest University of Technology
Shenzhen Institute of Northwestern Polytechnical University
Original Assignee
Northwest University of Technology
Shenzhen Institute of Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest University of Technology, Shenzhen Institute of Northwestern Polytechnical University filed Critical Northwest University of Technology
Priority to CN201911008034.4A priority Critical patent/CN110703602B/zh
Publication of CN110703602A publication Critical patent/CN110703602A/zh
Application granted granted Critical
Publication of CN110703602B publication Critical patent/CN110703602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,该方法针对装配总体和多个机器人形成的组合体,将存在干扰的姿态稳定控制问题建模为多机器人之间的博弈问题。利用辨识得到的转动惯量建立组合体的姿态动力学模型;利用干扰观测器观测得到外部干扰力矩,对姿态动力学模型进行改进;之后将上述姿态动力学模型写为状态相关形式。利用状态相关的组合体姿态动力学模型和各个机器人的性能指标函数建立微分博弈模型;之后通过优化性能指标函数得到HJ方程并求解,得到状态反馈控制策略表达式。由于直接将干扰观测器的观测结果添加至博弈模型中,得到的控制策略是严格意义的纳什均衡策略,且对建模不确定以及外部干扰等不确定因素有较好的抑制效果,具有一定的鲁棒性。

Description

一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法
技术领域
本发明涉及一种多机器人在轨装配姿态稳定控制方法,特别是一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法。
背景技术
在空间任务中,一些较大的任务载荷无法一次整体实现发射升空,往往需要通过多次分部件发射后在轨进行装配。装配中需要通过装配机器人进行装配体的姿态调整。通常的方式是通过集中式的控制解算并分配给多个机器人,但是这样的方法不具有最优性。
微分博弈的方法通过独立优化多个机器人各自的目标函数,分布式的得到各自的控制策略,实现装配体的姿态调整。文献“Game Theoretic Strategies for SpacecraftRendezvous and Motion Synchronization,AIAA GNCC,2012”公开了一种结合状态相关黎卡提方程的微分博弈控制方法。该方法将非线性模型表示为状态相关线性形式,结合线性二次型微分博弈的相关理论,得到控制策略。但该文献所述方法未考虑建模不确定以及外部干扰,不符合多机器人在轨装配易受到外部干扰的实际情况。文献“Robust output Nashstrategies based on sliding mode observation in a two-player differentialgame,Journal of the Franklin Institute,2012”公开了一种结合滑模观测器的二人微分博弈控制方法。该方法将控制分为两部分,一部分通过滑模观测器得到外部干扰的估计值进行补偿,另一部分通过线性二次型微分博弈得到标称模型的控制值,提高了系统的鲁棒性,较好地处理了干扰因素的影响。但由于该文献所述方法将控制分为两部分,所得到的控制策略并非严格意义的纳什均衡策略,也无法保证最优性;另外,该方法是针对线性模型,对于多机器人在轨装配这一非线性模型并不适用。
发明内容
为了克服在轨装配姿态稳定控制中受外部干扰的影响,本发明提供一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法。
该方法针对装配总体和多个机器人形成的组合体,将存在干扰的姿态稳定控制问题建模为多机器人之间的博弈问题。利用辨识得到的转动惯量建立组合体的姿态动力学模型;利用干扰观测器观测得到模型不确定和外部干扰力矩等的不确定动力学,对姿态动力学模型进行改进;之后将上述姿态动力学模型写为状态相关形式。利用状态相关的组合体姿态动力学模型和各个机器人的性能指标函数建立微分博弈模型;之后,通过优化性能指标函数得到HJ方程并求解,可得状态反馈控制策略表达式,可直接在线使用。由于直接将干扰观测器的观测结果添加至博弈模型中,得到的控制策略是严格意义的纳什均衡策略,且对建模不确定以及外部干扰等不确定因素有较好的抑制效果,具有一定的鲁棒性。
本发明的技术方案为:
所述一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,其特征在于:包括以下步骤:
步骤1:针对多机器人对在轨装配组合体进行姿态稳定控制的过程,利用公式
Figure BDA0002243336750000021
对姿态稳定控制过程中的外部干扰进行估计,得到干扰估计值
Figure BDA0002243336750000022
其中k1为设定的比例系数,ω为在轨装配组合体的角速度,J为组合体的转动惯量矩阵;
步骤2:根据控制量公式
Figure BDA0002243336750000023
Figure BDA0002243336750000024
计算各个机器人的控制量,其中N为机器人的个数,x=[σ,ω]T,σ为修正罗德里格斯参数,Rii和Rjj为设定的对称加权矩阵,
Figure BDA0002243336750000025
Cj为机器人j本体坐标系到设定的参考坐标系的转换矩阵;Pi和Pj为对称正定矩阵,通过求解耦合的代数黎卡提方程
得到,其中Qi为设定的对称加权矩阵,
Figure BDA0002243336750000027
Figure BDA0002243336750000032
Rij为设定的对称加权矩阵;
步骤3:更新多机器人对在轨装配组合体进行姿态稳定控制这一过程的状态,之后返回步骤1进行下一周期的控制。
进一步的优选方案,所述一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,其特征在于:Qi=5I6,Rii=Rjj=Rij=0.01I3
有益效果
本发明的有益效果是:设计鲁棒微分博弈控制器进行在轨装配的姿态稳定控制,利用干扰观测器对外部干扰等不确定性动力学进行估计,并将观测器的结果输入至博弈模型中,直接得到鲁棒的纳什均衡策略。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明姿态稳定控制方法原理框图。
图2是本发明方法的组合体姿态角变化图。
图3是本发明方法的组合体姿态角速度变化图。
图4是本发明方法的机器人1控制力矩变化图。
图5是本发明方法的机器人2控制力矩变化图。
图6是本发明方法的机器人3控制力矩变化图。
具体实施方式
本发明针对装配总体和多个机器人形成的组合体,将存在干扰的姿态稳定控制问题建模为多机器人之间的博弈问题。利用辨识得到的转动惯量建立组合体的姿态动力学模型;利用干扰观测器观测得到模型不确定和外部干扰力矩等的不确定动力学,对姿态动力学模型进行改进;之后将上述姿态动力学模型写为状态相关形式。利用状态相关的组合体姿态动力学模型和各个机器人的性能指标函数建立微分博弈模型;之后,通过优化性能指标函数得到HJ方程并求解,可得状态反馈控制策略表达式,可直接在线使用。
本发明中多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法的设计步骤为:
步骤一、控制系统模块划分。
图1为多机器人对装配体进行姿态稳定控制的原理框图。整个控制系统可以划分为:组合体姿态模型、干扰观测环节、控制环节、执行环节、干扰环节。
步骤二、组合体姿态动力学建模。
微分博弈模型由组合体动力学模型和个体性能指标函数组成。利用修正罗德里格斯参数σ∈R3来描述姿态,可得到姿态运动学模型为
Figure BDA0002243336750000041
其中,ω∈R3为组合体的角速度,
Figure BDA0002243336750000042
右上角×表示反对称矩阵。
组合体姿态运动受到的控制力矩一部分来自于机器人,一部分来自于干扰力矩,因此组合体的姿态动力学方程为
Figure BDA0002243336750000043
其中,N为机器人的个数;J∈R3×3为组合体的转动惯量矩阵;Cj∈R3×3为机器人j本体坐标系到设定的参考坐标系的转换矩阵;uj∈R3为机器人j本体坐标系下的控制力矩;d∈R3为外部干扰力矩,利用干扰观测器可得外部干扰的估计值为
联立(1)(2)式可得组合体的动力学模型
其中,x=[σ,ω]T∈R6,且
Figure BDA0002243336750000046
将(3)写作状态相关的形式可得
Figure BDA0002243336750000051
其中,
Figure BDA0002243336750000052
步骤三、干扰观测器设计。
将姿态动力学模型(2)写为线性形式可得
Figure BDA0002243336750000053
其中,k1为设定的比例系数,
Figure BDA0002243336750000054
基于式(3)设计扩张系统
xa为解算得到的扩张状态,设z=ω-xa,则扩张系统和实际系统的差为
Figure BDA0002243336750000056
对于上述误差系统设计非线性观测器
Figure BDA0002243336750000057
其中,
Figure BDA0002243336750000058
为z的观测值,根据式(8)计算得到,[e]m/n=|e|m/n sgn(e),m<n,m、n、k2、k3、k4均为设定的正整数。可根据李亚普诺夫定理证明稳定性。
根据式(7)和(5)可得外部干扰的估计值为
Figure BDA0002243336750000059
步骤四、鲁棒微分博弈控制器设计。
(1)微分博弈模型
组合体的微分博弈模型由组合体的动力学模型和性能指标函数得到。组合体的动力学模型如式(4)所示,各机器人的性能指标函数可以定义为
Figure BDA00022433367500000510
其中,ui表示第i个机器人的控制策略(即控制力矩);
Figure BDA00022433367500000511
表示除了第i个机器人以外的其他机器人的控制策略;加权矩阵Qi(t)>0,Rij(t)>0均为与时间无关的对称矩阵。
机器人期望通过独立优化各自的性能指标函数获得控制策略,以实现目标航天器的姿态稳定。则机器人的值函数为,
通过求解使性能指标函数最小的机器人反馈控制力矩,即满足
Figure BDA0002243336750000062
其中,反馈控制策略
Figure BDA0002243336750000063
为纳什均衡解。因此机器人微分博弈问题可以描述为
其中,Ψ(Ω)为可行控制策略集。
(2)控制律设计
式(10)的微分等价形式为
Figure BDA0002243336750000065
其中
Figure BDA0002243336750000066
定义哈密尔顿函数为
Figure BDA0002243336750000067
则对于机器人i来说,相对ui最小化值函数
Figure BDA0002243336750000068
Figure BDA0002243336750000069
可以得到对应的反馈控制策略为
Figure BDA00022433367500000610
对应地,可得对于其他任意机器人j的反馈控制策略为
Figure BDA00022433367500000611
将(16)和(17)代入(15)可得HJ方程为
Figure BDA00022433367500000612
但通过直接求解N个HJ方程的方式得到▽Vi *存在困难,因此,假设
Figure BDA0002243336750000072
将(19)代入(18),并整理可得
Figure BDA0002243336750000073
定义
Figure BDA0002243336750000074
得到耦合的代数黎卡提方程
Figure BDA0002243336750000075
通过求解上式可以得到对称正定矩阵Pi,代入(16)和(17)则得到状态反馈控制策略
Figure BDA0002243336750000076
状态反馈控制便于在线实施,适合工程应用。
基于上述设计结果,采用如下仿真场景,假设由三个机器人对位于地球静止轨道上的在轨装配组合体进行姿态稳定控制,其各自的本体坐标系到参考坐标系的转换矩阵分别为:
组合体的转动惯量矩阵为
Figure BDA0002243336750000078
干扰力矩为
Figure BDA0002243336750000081
组合体状态量的初值为x0=[0.03;-0.018;0.013;0;0;0],其中角度以修正罗德里格斯参数表示。机器人的单轴控制力矩最大为0.04N.m。干扰观测器的参数取k1=0.05;k2=26;k3=74;k4=155。控制器各项参数为Q1=Q2=Q3=5I6,R11=R12=R13=0.01I3,R21=R22=R23=0.01I3,R31=R32=R33=0.01I3
具体实施流程为
步骤1、由式(9)得到干扰力矩的估计值;
步骤2、由式(22)计算控制量;
步骤3、在系统中更新状态;
步骤4、返回第二步。
仿真结果如图2-图6所示,仿真结果表明在存在干扰的情况下,该鲁棒微分博弈控制器能实现对装配组合体的姿态稳定,并对干扰有较好的抑制作用。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (2)

1.一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,其特征在于:包括以下步骤:
步骤1:针对多机器人对在轨装配组合体进行姿态稳定控制的过程,利用公式
对姿态稳定控制过程中的外部干扰进行估计,得到干扰估计值
Figure FDA0002243336740000012
其中k1为设定的比例系数,ω为在轨装配组合体的角速度,J为组合体的转动惯量矩阵;
步骤2:根据控制量公式
Figure FDA0002243336740000013
Figure FDA0002243336740000014
计算各个机器人的控制量,其中N为机器人的个数,x=[σ,ω]T,σ为修正罗德里格斯参数,Rii和Rjj为设定的对称加权矩阵,Cj为机器人j本体坐标系到设定的参考坐标系的转换矩阵;Pi和Pj为对称正定矩阵,通过求解耦合的代数黎卡提方程
Figure FDA0002243336740000016
得到,其中Qi为设定的对称加权矩阵,
Figure FDA0002243336740000017
Figure FDA0002243336740000018
Figure FDA0002243336740000019
Rij为设定的对称加权矩阵;
步骤3:更新多机器人对在轨装配组合体进行姿态稳定控制这一过程的状态,之后返回步骤1进行下一周期的控制。
2.根据权利要求1所述一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法,其特征在于:Qi=5I6,Rii=Rjj=Rij=0.01I3
CN201911008034.4A 2019-10-22 2019-10-22 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 Active CN110703602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911008034.4A CN110703602B (zh) 2019-10-22 2019-10-22 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911008034.4A CN110703602B (zh) 2019-10-22 2019-10-22 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法

Publications (2)

Publication Number Publication Date
CN110703602A true CN110703602A (zh) 2020-01-17
CN110703602B CN110703602B (zh) 2022-07-26

Family

ID=69201321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911008034.4A Active CN110703602B (zh) 2019-10-22 2019-10-22 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法

Country Status (1)

Country Link
CN (1) CN110703602B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112230552A (zh) * 2020-10-30 2021-01-15 西北工业大学深圳研究院 针对离散时间多智能体博弈的抗干扰控制方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103199565A (zh) * 2013-03-29 2013-07-10 华南理工大学 基于微分博弈理论的多区域自动发电控制协调方法
US8644426B1 (en) * 2008-07-14 2014-02-04 Marvell International Ltd. Robust differential receiver for frequency modulated system
CN106502260A (zh) * 2016-12-01 2017-03-15 西北工业大学 空间绳系机器人抓捕挠性目标卫星后的姿态接管控制方法
CN107102548A (zh) * 2017-05-12 2017-08-29 西北工业大学 一种空间失稳非合作目标的二次抓捕控制策略
CN107121961A (zh) * 2017-05-25 2017-09-01 北京航空航天大学 一种基于迭代学习干扰观测器的航天器姿态容错控制方法
CN109933078A (zh) * 2019-03-29 2019-06-25 西北工业大学 鲁棒微分博弈控制的多微卫星姿态接管失效航天器方法
CN110073301A (zh) * 2017-08-02 2019-07-30 强力物联网投资组合2016有限公司 工业物联网中具有大数据集的数据收集环境下的检测方法和系统
CN110134137A (zh) * 2019-06-18 2019-08-16 哈尔滨工业大学(深圳) 基于扩张状态观测器的航天器姿态跟踪控制方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8644426B1 (en) * 2008-07-14 2014-02-04 Marvell International Ltd. Robust differential receiver for frequency modulated system
CN103199565A (zh) * 2013-03-29 2013-07-10 华南理工大学 基于微分博弈理论的多区域自动发电控制协调方法
CN106502260A (zh) * 2016-12-01 2017-03-15 西北工业大学 空间绳系机器人抓捕挠性目标卫星后的姿态接管控制方法
CN107102548A (zh) * 2017-05-12 2017-08-29 西北工业大学 一种空间失稳非合作目标的二次抓捕控制策略
CN107121961A (zh) * 2017-05-25 2017-09-01 北京航空航天大学 一种基于迭代学习干扰观测器的航天器姿态容错控制方法
CN110073301A (zh) * 2017-08-02 2019-07-30 强力物联网投资组合2016有限公司 工业物联网中具有大数据集的数据收集环境下的检测方法和系统
CN109933078A (zh) * 2019-03-29 2019-06-25 西北工业大学 鲁棒微分博弈控制的多微卫星姿态接管失效航天器方法
CN110134137A (zh) * 2019-06-18 2019-08-16 哈尔滨工业大学(深圳) 基于扩张状态观测器的航天器姿态跟踪控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JINGLIANG SUN ET AL.: "Robust zero-sum differential Game for uncertain nonlinear systems via adaptive dynamic programming", 《PROCEEDINGS OR 2016 IEEE CHINESE GUIDANCE,NAVIGATION AND CONTROL CONFERENCE》 *
孙景亮等: "基于自适应动态规划的导弹制导律研究综述", 《自动化学报》 *
王泉德: "机器学习及其在多Agent对策学习中的应用研究", 《信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112230552A (zh) * 2020-10-30 2021-01-15 西北工业大学深圳研究院 针对离散时间多智能体博弈的抗干扰控制方法
CN112230552B (zh) * 2020-10-30 2022-05-13 西北工业大学深圳研究院 针对离散时间多智能体博弈的抗干扰控制方法

Also Published As

Publication number Publication date
CN110703602B (zh) 2022-07-26

Similar Documents

Publication Publication Date Title
Kristiansen et al. Spacecraft coordination control in 6DOF: Integrator backstepping vs passivity-based control
Bu et al. Neural-approximation-based robust adaptive control of flexible air-breathing hypersonic vehicles with parametric uncertainties and control input constraints
Cong et al. Distributed attitude synchronization of formation flying via consensus-based virtual structure
CN104589349B (zh) 一种混合悬浮微重力环境下带有单关节机械臂的组合体自主控制方法
Wong et al. Adaptive tracking control using synthesized velocity from attitude measurements
CN107577145B (zh) 编队飞行航天器反步滑模控制方法
Jayakody et al. Robust adaptive coordination controller for a spacecraft equipped with a robotic manipulator
Chang et al. Decentralized coordinated attitude control for satellite formation flying via the state-dependent Riccati equation technique
CN112394645B (zh) 一种航天器姿态跟踪的神经网络反步滑模控制方法和系统
Liu et al. Prescribed performance tracking control of a free-flying flexible-joint space robot with disturbances under input saturation
Lochan et al. Robust tip trajectory synchronisation between assumed modes modelled two-link flexible manipulators using second-order PID terminal SMC
Park Inverse optimal and robust nonlinear attitude control of rigid spacecraft
Bu et al. Robust tracking control of hypersonic flight vehicles: a continuous model-free control approach
Hu et al. Recursive decentralized control for robotic manipulators
Chai et al. Linear quadratic differential game approach for attitude takeover control of failed spacecraft
Jia et al. Vibration control of gyroelastic spacecraft using input shaping and angular momentum devices
De Stefano et al. An energy-based approach for the multi-rate control of a manipulator on an actuated base
Bae et al. Novel state estimation framework for humanoid robot
Vos et al. Formation control of wheeled robots in the port-Hamiltonian framework
Khodaverdian et al. Fault-tolerant model predictive sliding mode control with fixed-time attitude stabilization and vibration suppression of flexible spacecraft
Chen et al. Sliding mode control of a class of underactuated system with non-integrable momentum
CN110703602B (zh) 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法
Lang et al. Non-cooperative differential game based output feedback control for spacecraft attitude regulation
Heydari et al. Finite-horizon input-constrained nonlinear optimal control using single network adaptive critics
CN114167734A (zh) 一种强耦合非线性系统高精度控制方法及控制系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant