CN110703602A

CN110703602A - 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法

Info

Publication number: CN110703602A
Application number: CN201911008034.4A
Authority: CN
Inventors: 罗建军; 柴源; 王明明; 韩楠; 王嘉文
Original assignee: Northwest University of Technology; Shenzhen Institute of Northwestern Polytechnical University
Current assignee: Northwest University of Technology; Shenzhen Institute of Northwestern Polytechnical University
Priority date: 2019-10-22
Filing date: 2019-10-22
Publication date: 2020-01-17
Anticipated expiration: 2039-10-22
Also published as: CN110703602B

Abstract

本发明提供一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法，该方法针对装配总体和多个机器人形成的组合体，将存在干扰的姿态稳定控制问题建模为多机器人之间的博弈问题。利用辨识得到的转动惯量建立组合体的姿态动力学模型；利用干扰观测器观测得到外部干扰力矩，对姿态动力学模型进行改进；之后将上述姿态动力学模型写为状态相关形式。利用状态相关的组合体姿态动力学模型和各个机器人的性能指标函数建立微分博弈模型；之后通过优化性能指标函数得到HJ方程并求解，得到状态反馈控制策略表达式。由于直接将干扰观测器的观测结果添加至博弈模型中，得到的控制策略是严格意义的纳什均衡策略，且对建模不确定以及外部干扰等不确定因素有较好的抑制效果，具有一定的鲁棒性。

Description

一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法

技术领域

本发明涉及一种多机器人在轨装配姿态稳定控制方法，特别是一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法。

背景技术

在空间任务中，一些较大的任务载荷无法一次整体实现发射升空，往往需要通过多次分部件发射后在轨进行装配。装配中需要通过装配机器人进行装配体的姿态调整。通常的方式是通过集中式的控制解算并分配给多个机器人，但是这样的方法不具有最优性。

微分博弈的方法通过独立优化多个机器人各自的目标函数，分布式的得到各自的控制策略，实现装配体的姿态调整。文献“Game Theoretic Strategies for SpacecraftRendezvous and Motion Synchronization，AIAA GNCC,2012”公开了一种结合状态相关黎卡提方程的微分博弈控制方法。该方法将非线性模型表示为状态相关线性形式，结合线性二次型微分博弈的相关理论，得到控制策略。但该文献所述方法未考虑建模不确定以及外部干扰，不符合多机器人在轨装配易受到外部干扰的实际情况。文献“Robust output Nashstrategies based on sliding mode observation in a two-player differentialgame，Journal of the Franklin Institute,2012”公开了一种结合滑模观测器的二人微分博弈控制方法。该方法将控制分为两部分，一部分通过滑模观测器得到外部干扰的估计值进行补偿，另一部分通过线性二次型微分博弈得到标称模型的控制值，提高了系统的鲁棒性，较好地处理了干扰因素的影响。但由于该文献所述方法将控制分为两部分，所得到的控制策略并非严格意义的纳什均衡策略，也无法保证最优性；另外，该方法是针对线性模型，对于多机器人在轨装配这一非线性模型并不适用。

发明内容

为了克服在轨装配姿态稳定控制中受外部干扰的影响，本发明提供一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法。

该方法针对装配总体和多个机器人形成的组合体，将存在干扰的姿态稳定控制问题建模为多机器人之间的博弈问题。利用辨识得到的转动惯量建立组合体的姿态动力学模型；利用干扰观测器观测得到模型不确定和外部干扰力矩等的不确定动力学，对姿态动力学模型进行改进；之后将上述姿态动力学模型写为状态相关形式。利用状态相关的组合体姿态动力学模型和各个机器人的性能指标函数建立微分博弈模型；之后，通过优化性能指标函数得到HJ方程并求解，可得状态反馈控制策略表达式，可直接在线使用。由于直接将干扰观测器的观测结果添加至博弈模型中，得到的控制策略是严格意义的纳什均衡策略，且对建模不确定以及外部干扰等不确定因素有较好的抑制效果，具有一定的鲁棒性。

本发明的技术方案为：

所述一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法，其特征在于：包括以下步骤：

步骤1：针对多机器人对在轨装配组合体进行姿态稳定控制的过程，利用公式

对姿态稳定控制过程中的外部干扰进行估计，得到干扰估计值

其中k₁为设定的比例系数，ω为在轨装配组合体的角速度，J为组合体的转动惯量矩阵；

步骤2：根据控制量公式

计算各个机器人的控制量，其中N为机器人的个数，x＝[σ,ω]^T，σ为修正罗德里格斯参数，R_ii和R_jj为设定的对称加权矩阵，

C_j为机器人j本体坐标系到设定的参考坐标系的转换矩阵；P_i和P_j为对称正定矩阵，通过求解耦合的代数黎卡提方程

得到，其中Q_i为设定的对称加权矩阵，

R_ij为设定的对称加权矩阵；

步骤3：更新多机器人对在轨装配组合体进行姿态稳定控制这一过程的状态，之后返回步骤1进行下一周期的控制。

进一步的优选方案，所述一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法，其特征在于：Q_i＝5I₆，R_ii＝R_jj＝R_ij＝0.01I₃。

有益效果

本发明的有益效果是：设计鲁棒微分博弈控制器进行在轨装配的姿态稳定控制，利用干扰观测器对外部干扰等不确定性动力学进行估计，并将观测器的结果输入至博弈模型中，直接得到鲁棒的纳什均衡策略。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明姿态稳定控制方法原理框图。

图2是本发明方法的组合体姿态角变化图。

图3是本发明方法的组合体姿态角速度变化图。

图4是本发明方法的机器人1控制力矩变化图。

图5是本发明方法的机器人2控制力矩变化图。

图6是本发明方法的机器人3控制力矩变化图。

具体实施方式

本发明针对装配总体和多个机器人形成的组合体，将存在干扰的姿态稳定控制问题建模为多机器人之间的博弈问题。利用辨识得到的转动惯量建立组合体的姿态动力学模型；利用干扰观测器观测得到模型不确定和外部干扰力矩等的不确定动力学，对姿态动力学模型进行改进；之后将上述姿态动力学模型写为状态相关形式。利用状态相关的组合体姿态动力学模型和各个机器人的性能指标函数建立微分博弈模型；之后，通过优化性能指标函数得到HJ方程并求解，可得状态反馈控制策略表达式，可直接在线使用。

本发明中多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法的设计步骤为：

步骤一、控制系统模块划分。

图1为多机器人对装配体进行姿态稳定控制的原理框图。整个控制系统可以划分为：组合体姿态模型、干扰观测环节、控制环节、执行环节、干扰环节。

步骤二、组合体姿态动力学建模。

微分博弈模型由组合体动力学模型和个体性能指标函数组成。利用修正罗德里格斯参数σ∈R³来描述姿态，可得到姿态运动学模型为

其中，ω∈R³为组合体的角速度，

右上角×表示反对称矩阵。

组合体姿态运动受到的控制力矩一部分来自于机器人，一部分来自于干扰力矩，因此组合体的姿态动力学方程为

其中，N为机器人的个数；J∈R^3×3为组合体的转动惯量矩阵；C_j∈R^3×3为机器人j本体坐标系到设定的参考坐标系的转换矩阵；u_j∈R³为机器人j本体坐标系下的控制力矩；d∈R³为外部干扰力矩，利用干扰观测器可得外部干扰的估计值为

联立(1)(2)式可得组合体的动力学模型

其中，x＝[σ,ω]^T∈R⁶，且

将(3)写作状态相关的形式可得

其中，

步骤三、干扰观测器设计。

将姿态动力学模型(2)写为线性形式可得

其中，k₁为设定的比例系数，

基于式(3)设计扩张系统

x_a为解算得到的扩张状态，设z＝ω-x_a，则扩张系统和实际系统的差为

对于上述误差系统设计非线性观测器

其中，

为z的观测值，根据式(8)计算得到，[e]^m/n＝|e|^m/n sgn(e)，m＜n，m、n、k₂、k₃、k₄均为设定的正整数。可根据李亚普诺夫定理证明稳定性。

根据式(7)和(5)可得外部干扰的估计值为

步骤四、鲁棒微分博弈控制器设计。

(1)微分博弈模型

组合体的微分博弈模型由组合体的动力学模型和性能指标函数得到。组合体的动力学模型如式(4)所示，各机器人的性能指标函数可以定义为

其中，u_i表示第i个机器人的控制策略(即控制力矩)；

表示除了第i个机器人以外的其他机器人的控制策略；加权矩阵Q_i(t)＞0,R_ij(t)＞0均为与时间无关的对称矩阵。

机器人期望通过独立优化各自的性能指标函数获得控制策略，以实现目标航天器的姿态稳定。则机器人的值函数为，

通过求解使性能指标函数最小的机器人反馈控制力矩，即满足

其中，反馈控制策略

为纳什均衡解。因此机器人微分博弈问题可以描述为

其中，Ψ(Ω)为可行控制策略集。

(2)控制律设计

式(10)的微分等价形式为

其中

定义哈密尔顿函数为

则对于机器人i来说，相对u_i最小化值函数

即

可以得到对应的反馈控制策略为

对应地，可得对于其他任意机器人j的反馈控制策略为

将(16)和(17)代入(15)可得HJ方程为

但通过直接求解N个HJ方程的方式得到▽V_i ^*存在困难，因此，假设则

将(19)代入(18)，并整理可得

定义

得到耦合的代数黎卡提方程

通过求解上式可以得到对称正定矩阵P_i,代入(16)和(17)则得到状态反馈控制策略

状态反馈控制便于在线实施，适合工程应用。

基于上述设计结果，采用如下仿真场景，假设由三个机器人对位于地球静止轨道上的在轨装配组合体进行姿态稳定控制，其各自的本体坐标系到参考坐标系的转换矩阵分别为：

组合体的转动惯量矩阵为

干扰力矩为

组合体状态量的初值为x₀＝[0.03；-0.018；0.013；0；0；0]，其中角度以修正罗德里格斯参数表示。机器人的单轴控制力矩最大为0.04N.m。干扰观测器的参数取k₁＝0.05；k₂＝26；k₃＝74；k₄＝155。控制器各项参数为Q₁＝Q₂＝Q₃＝5I₆，R₁₁＝R₁₂＝R₁₃＝0.01I₃，R₂₁＝R₂₂＝R₂₃＝0.01I₃，R₃₁＝R₃₂＝R₃₃＝0.01I₃。

具体实施流程为

步骤1、由式(9)得到干扰力矩的估计值；

步骤2、由式(22)计算控制量；

步骤3、在系统中更新状态；

步骤4、返回第二步。

仿真结果如图2-图6所示，仿真结果表明在存在干扰的情况下，该鲁棒微分博弈控制器能实现对装配组合体的姿态稳定，并对干扰有较好的抑制作用。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。