CN114995132B - 一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质 - Google Patents

一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质 Download PDF

Info

Publication number
CN114995132B
CN114995132B CN202210582234.6A CN202210582234A CN114995132B CN 114995132 B CN114995132 B CN 114995132B CN 202210582234 A CN202210582234 A CN 202210582234A CN 114995132 B CN114995132 B CN 114995132B
Authority
CN
China
Prior art keywords
gaussian
model
arm
spacecraft
platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210582234.6A
Other languages
English (en)
Other versions
CN114995132A (zh
Inventor
岳程斐
曹喜滨
柳子然
陈雪芹
吴凡
魏承
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN202210582234.6A priority Critical patent/CN114995132B/zh
Publication of CN114995132A publication Critical patent/CN114995132A/zh
Application granted granted Critical
Publication of CN114995132B publication Critical patent/CN114995132B/zh
Priority to US18/143,795 priority patent/US20230381956A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • B25J9/1682Dual arm manipulator; Coordination of several manipulators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B64AIRCRAFT; AVIATION; COSMONAUTICS
    • B64GCOSMONAUTICS; VEHICLES OR EQUIPMENT THEREFOR
    • B64G4/00Tools specially adapted for use in space
    • B64G2004/005Robotic manipulator systems for use in space
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Abstract

本发明提出一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质。模型预测控制在处理多臂航天器这类具有多种约束的复杂非线性系统方面具有优良的性能,并且被广泛地应用于地面机器人、无人机、自动驾驶等实际场景中。因此本发明基于模型预测控制进行任务空间控制器设计。此外,为了增强其抗干扰能力,利用高斯混合过程训练数据量小、训练速度快的特点,建立干扰模型并在模型预测控制中进行补偿。最后设计了推力分配方法完成平台控制。本发明提出的方法设计方便直观,具有较强的实用性。

Description

一种基于高斯混合过程的多臂航天器模型预测控制方法、设 备和介质
技术领域
本发明属于在轨服务、航天器控制、模型预测控制技术领域,特别是涉及一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质。
背景技术
近年来,在轨服务技术得到了世界各国的广泛重视,中国、美国、欧空局、日本等主要航天机构开展了大量地面和空间试验,实现了卫星捕获、燃料加注、部件更换、空间碎片清理等多种类型的在轨服务任务。但是,航天器在轨服务任务都是在任务空间/笛卡尔空间描述,而传统控制器设计大多在关节空间进行表达,需要额外进行逆运动学的解算,直观性欠缺的同时,存在控制能力不匹配、计算量大等问题。因此,本发明基于模型预测控制(Model Predictive Control,MPC),提出了一种简便、直接、适用于处理多臂航天器高维非线性模型的任务空间控制器设计方法。
同时,在轨服务航天器航天器在地面进行实验和空间执行任务的过程中存在多种扰动,包括参数不确定性、空间环境力矩扰动、输入和量测噪声等,对在轨服务任务的性能影响明显。传统解决方法各有优劣:基于鲁棒性设计的方法需要假设总扰动存在上界;基于自适应、干扰观测器的方法能够在线估计扰动,但是对初值要求较高,初始时刻性能差;基于神经网络、模糊网络构造扰动模型的方法需要离线训练,初始性能较好但是对训练数据量有要求。考虑到在轨服务航天器的实际工作流程,利用高斯混合过程(the Mixture ofGaussian Processes,MGP)设计一种数据量需求小、训练速度快的离线扰动模型构造方法具有良好的应用前景。
最后,传统在轨服务航天器一般为自由漂浮模式,不对卫星平台进行控制,或者仅依赖飞轮进行平台姿态调节,机动能力较弱,工作范围较小,影响在轨服务的效率和性能。针对这一问题,本发明采用喷气推力器对航天器平台位姿进行调节,并设计了相应的推力器控制分配方法。
发明内容
本发明目的是针对现有多臂航天器控制方法的不足,提出了一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质。
本发明是通过以下技术方案实现的,本发明提出一种基于高斯混合过程的多臂航天器模型预测控制方法,具体包括:
建立多臂航天器动力学和运动学模型,作为MPC中的预测模型;
对于预测模型中的扰动项估计值
Figure BDA0003664439340000021
输入初始激励建立数据集,利用高斯混合过程训练得到多臂航天器的残差动力学作为扰动项的估计值;
根据实际驱动器输入饱和约束,构建模型预测控制器,实现多臂航天器机械臂末端和平台位姿对期望轨迹的跟踪,所述饱和包括关节电机饱和和平台推力器推力饱和;
所述平台推力器为开关控制模式,将MPC产生的平台连续控制指令分配为每个推力器的开机时间,得到最终的推力器驱动指令。
进一步地,对于拥有n条机械臂,每条臂拥有m个自由度,平台配置l个喷气推力器的多臂航天器,首先在关节空间对多臂航天器的动力学模型进行描述:
多臂航天器动力学模型表示为:
Figure BDA0003664439340000022
其中,M代表多臂航天器的惯性参数;C代表非线性项;d是扰动项;
Figure BDA0003664439340000023
代表平台位姿和关节角度信息,r0为6自由度平台位姿,q=[q1,…,qn]T为关节角度;
Figure BDA0003664439340000024
代表控制力和控制力矩,F0代表平台控制力/力矩,Fq代表关节力矩。
进一步地,根据机械臂末端与关节、平台状态的映射关系,利用DH参数法得到在轨服务航天器末端位姿的描述形式:
Figure BDA0003664439340000025
其中,齐次变换矩阵
Figure BDA0003664439340000026
通过DH参数θm,dm,amm进行定义:
Figure BDA0003664439340000027
最后,构建状态空间表达式:
Figure BDA0003664439340000028
其中,
Figure BDA0003664439340000029
代表平台和机械臂末端位姿,
Figure BDA00036644393400000210
代表扰动项的估计值;
设定采样时间Δt,将连续的状态空间表达式转化为离散时间模型,在当前k时刻测量值的基础上实现对未来k+N时刻系统状态的预测:
Figure BDA0003664439340000031
进一步地,记录得到p组数据集进行高斯混合过程训练,其中输入x包含多臂航天器位姿Q、速度
Figure BDA0003664439340000032
和控制量的增量Δu,输出y为实际角速度和名义模型计算角加速度的差值,即残差动力学,用于捕捉总扰动对系统的影响
Figure BDA0003664439340000033
高斯过程事先假设样本服从高斯分布:
y(x)~N(μ(x),k(x,x')) (6)
其中,μ(x)代表均值函数;k(x,x')代表协方差函数,表达式为:
Figure BDA0003664439340000034
其中,σn取0.3,σf,l为待求解的超参数,
Figure BDA0003664439340000035
采用优化最大似然估计的方法对协方差函数进行求解:
Figure BDA0003664439340000036
训练得到高斯过程的超参数之后,即可利用预测点的输入信息x*来求解对应的输出值y*;先确定样本和测试集的联合概率密度函数:
Figure BDA0003664439340000037
其中,
K**=k(x*,x*) (10)
K*=[k(x*,x1) k(x*,x2) … k(x*,xp)] (11)
Figure BDA0003664439340000038
利用贝叶斯推理,得到预测点的后验概率表达式:
y*|y(x)~N(K*K-1y,K**-K*K-1K* T) (13)
得到高斯过程的预测值:
Figure BDA0003664439340000041
进一步地,在所述多臂航天器高斯过程中利用局部高斯过程方法,所述局部高斯过程方法为:先根据高斯混合模型方法进行聚类,再针对每一个高斯分量进行回归,最后在预测时对局部预测值进行融合;
假设输入x服从M个高斯分量的混合分布,其概率密度分布函数为:
Figure BDA0003664439340000042
其中,πi为混合系数,代表样本来源于第i个高斯分量的概率;p(x|μii)代表由第i个高斯分量生成样本的概率;{μii}为高斯混合过程的超参数。
进一步地,在得到训练样本后,首先对模型参数进行初始化,然后通过期望最大化算法的E步骤和M步骤的不断迭代,更新模型参数,直到模型收敛;
其中,E步骤利用M步骤估计的参数{πiii}计算样本来自第i个高斯分量的后验概率ri
Figure BDA0003664439340000043
M步骤通过E步骤计算得出的训练样本的后验概率ri,通过极大化对数似然函数更新模型参数:
Figure BDA0003664439340000044
针对聚类得到的每一组高斯分量,利用高斯回归训练方法,得到对应的高斯过程模型以及预测点x*在M个局部高斯过程模型下的预测值y*i,再由聚类生成的预测点由第i个高斯分量生成的后验概率r*i加权融合计算最终的预测值y*
Figure BDA0003664439340000051
进一步地,构建如下形式的性能指标,以求解系统的控制输入:
Figure BDA0003664439340000052
其中,Qr,Qt分别代表控制误差和输入惩罚项的加权矩阵;
通过选择合适的控制器参数,所述参数包括Δt,N,Qr,Qt,求解上述优化控制问题,得到未来N个时刻的控制量U=[uk,uk+1,…,uk+N-1]T,仅将k时刻控制量uk作为系统输入。
进一步地,首先给出一般化的推力器安装矩阵,即卫星平台上安装有l个喷气推力器,各推力器安装位置分为[xTi,yTi,zTi]T,推力矢量与+x方向以及x-y平面夹角分为βi和γi,得到推力器推力和力矩在卫星平台本体系下的配置矩阵:
Figure BDA0003664439340000053
由此得到平台控制力和控制力矩与喷气推力器推力间的关系:
F0=CIBAT (21)
其中,CIB为平台本体系到惯性系的转换矩阵,T=[T1 T2 … Tl]T为喷气推力器推力;
对于求解得到的平台控制量F0,通过构造以下优化问题设计了推力分配算法,将控制量分配到每个推力器:
Figure BDA0003664439340000054
其中,Tlb,Tub代表推力器的推力饱和约束;
推力分配得到了每个推力器的连续推力,为了满足推力器的开-关控制模式,通过PWM方法将连续推力转换为开-关模式的开机时间:
Figure BDA0003664439340000061
其中,Ti *代表分配算法得到的连续推力,Ti o代表推力器的开机推力,Δt代表PWM频率;
最后,考虑推力器的最小开机时间Δtc,得到最终的推力器驱动指令:
Figure BDA0003664439340000062
本发明提出一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述一种基于高斯混合过程的多臂航天器模型预测控制方法的步骤。
本发明提出一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现所述一种基于高斯混合过程的多臂航天器模型预测控制方法的步骤。
本发明的有益效果为:
(1)本发明实现了在轨服务航天器任务空间的跟踪控制能力。在模型预测控制框架下,考虑实际运行环境中的多种干扰因素和执行器饱和约束,实现了多臂航天器机械臂末端和平台位姿对期望轨迹的跟踪,设计方法直观简便,适用于实际工程场景。
(2)对于预测模型中的扰动项,设计高斯过程进行估计补偿,改善存在多种干扰情况下模型预测控制性能的同时,降低离线训练对于数据量的要求。此外,在训练前利用高斯混合模型聚类以进一步加快训练速度,更具有实用性。
(3)考虑到在轨服务航天器执行任务过程中对机动性的要求,采用喷气推力器对平台位姿进行控制,并且考虑推力器饱和和死区特性,将MPC产生的连续控制指令分配为推力器的开机时间,实现航天器平台的灵活机动。
附图说明
图1是多臂航天器的示意图;图中,多臂航天器拥有n条机械臂,每条臂拥有m个自由度,平台配置l个喷气推力器,其中ΣB是平台本体系,ΣI是惯性系,Σen是第n条机械臂的末端坐标系。
图2是基于高斯混合过程和模型预测控制的多臂航天器任务空间控制方法的控制流程图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明针对现有多臂在轨服务航天器控制方法的不足,提出了一种基于高斯混合过程和模型预测控制(MGP-MPC)的多臂航天器任务空间控制方法。模型预测控制在处理多臂航天器这类具有多种约束的复杂非线性系统方面具有优良的性能,并且被广泛地应用于地面机器人、无人机、自动驾驶等实际场景中。因此本发明基于模型预测控制进行任务空间控制器设计。此外,为了增强其抗干扰能力,利用高斯混合过程训练数据量小、训练速度快的特点,建立干扰模型并在模型预测控制中进行补偿。最后设计了推力分配方法完成平台控制。本发明提出的方法设计方便直观,具有较强的实用性。
结合图1-图2,本发明提出一种基于高斯混合过程的多臂航天器模型预测控制方法,具体包括:
(1)建立多臂航天器动力学和运动学模型,作为MPC中的预测模型;
对于拥有n条机械臂,每条臂拥有m个自由度,平台配置l个喷气推力器的多臂航天器,首先在关节空间对多臂航天器的动力学模型进行描述:
多臂航天器动力学模型表示为:
Figure BDA0003664439340000071
其中,M代表多臂航天器的惯性参数;C代表非线性项;d是扰动项;
Figure BDA0003664439340000072
代表平台位姿和关节角度信息,r0为6自由度平台位姿,q=[q1,…,qn]T为关节角度;
Figure BDA0003664439340000073
代表控制力和控制力矩,F0代表平台控制力/力矩,Fq代表关节力矩。
根据机械臂末端与关节、平台状态的映射关系,利用改进的DH参数法得到多臂航天器末端位姿的描述形式:
Figure BDA0003664439340000074
其中,齐次变换矩阵
Figure BDA0003664439340000075
通过改进的DH参数θm,dm,amm进行定义:
Figure BDA0003664439340000081
最后,构建状态空间表达式:
Figure BDA0003664439340000082
其中,
Figure BDA0003664439340000083
代表平台和机械臂末端位姿,
Figure BDA0003664439340000084
代表扰动项的估计值;
设定采样时间Δt,将连续的状态空间表达式转化为离散时间模型,在当前k时刻测量值的基础上实现对未来k+N时刻系统状态的预测:
Figure BDA0003664439340000085
(2)对于预测模型中的扰动项估计值
Figure BDA0003664439340000086
输入初始激励建立数据集,利用高斯混合过程训练得到多臂航天器的残差动力学作为扰动项的估计值;
首先记录得到p组数据集进行高斯混合过程训练,其中输入x包含多臂航天器位姿Q、速度
Figure BDA0003664439340000087
和控制量的增量Δu,输出y为实际角速度和名义模型(即不含扰动项的)计算角加速度的差值,即残差动力学,用于捕捉总扰动对系统的影响
Figure BDA0003664439340000088
高斯过程事先假设样本服从高斯分布:
y(x)~N(μ(x),k(x,x')) (6)
其中,μ(x)代表均值函数;k(x,x')代表协方差函数,形式较多,一般取为高斯核函数,表达式为:
Figure BDA0003664439340000089
其中,σn一般取0.3,σf,l为待求解的超参数,
Figure BDA00036644393400000810
因此,高斯过程实际就是通过样本数据求解协方差函数中超参数的过程。本发明采用优化最大似然估计的方法对协方差函数进行求解:
Figure BDA0003664439340000091
训练得到高斯过程的超参数之后,即可利用预测点的输入信息x*来求解对应的输出值y*;先确定样本和测试集的联合概率密度函数:
Figure BDA0003664439340000092
其中,
K**=k(x*,x*) (10)
K*=[k(x*,x1) k(x*,x2) … k(x*,xp)] (11)
Figure BDA0003664439340000093
利用贝叶斯推理,得到预测点的后验概率表达式:
Figure BDA0003664439340000094
得到高斯过程的预测值:
Figure BDA0003664439340000095
在上述多臂航天器高斯过程的基础上,为了加快训练和预测速度,本发明在所述多臂航天器高斯过程中利用局部高斯过程方法,所述局部高斯过程方法为:先根据高斯混合模型方法进行聚类,再针对每一个高斯分量进行回归,最后在预测时对局部预测值进行融合;
假设输入x服从M个高斯分量的混合分布,其概率密度分布函数为:
Figure BDA0003664439340000096
其中,πi为混合系数,代表样本来源于第i个高斯分量的概率;p(x|μii)代表由第i个高斯分量生成样本的概率;{μii}为高斯混合过程的超参数。
EM(Expectation-Maximization,期望最大化算法)是一种学习混合模型的有效算法,在理论上等价于最大似然估计法,在得到训练样本后,首先对模型参数进行初始化,然后通过期望最大化算法的E步骤和M步骤的不断迭代,更新模型参数,直到模型收敛;
其中,E步骤利用M步骤估计的参数{πiii}计算样本来自第i个高斯分量的后验概率ri
Figure BDA0003664439340000101
M步骤通过E步骤计算得出的训练样本的后验概率ri,通过极大化对数似然函数更新模型参数:
Figure BDA0003664439340000102
针对聚类得到的每一组高斯分量,利用高斯回归训练方法,得到对应的高斯过程模型以及预测点x*在M个局部高斯过程模型下的预测值y*i,再由聚类生成的预测点由第i个高斯分量生成的后验概率r*i加权融合计算最终的预测值y*
Figure BDA0003664439340000103
(3)根据实际驱动器输入饱和约束,构建模型预测控制器,实现多臂航天器机械臂末端和平台位姿对期望轨迹的跟踪,所述饱和包括关节电机饱和和平台推力器推力饱和;
为了在实现在轨服务航天器任务空间轨迹跟踪的同时,尽可能减少能量消耗,构建如下形式的性能指标,以求解系统的控制输入:
Figure BDA0003664439340000104
其中,Qr,Qt分别代表控制误差和输入惩罚项的加权矩阵;
通过选择合适的控制器参数,所述参数包括Δt,N,Qr,Qt,求解上述优化控制问题,得到未来N个时刻的控制量U=[uk,uk+1,…,uk+N-1]T,仅将k时刻控制量uk作为系统输入。
(4)所述平台推力器为开关控制模式,将MPC产生的平台连续控制指令分配为每个推力器的开机时间,得到最终的推力器驱动指令。
首先给出一般化的推力器安装矩阵,即卫星平台上安装有l个喷气推力器,各推力器安装位置分为[xTi,yTi,zTi]T,推力矢量与+x方向以及x-y平面夹角分为βi和γi,得到推力器推力和力矩在卫星平台本体系下的配置矩阵:
Figure BDA0003664439340000111
由此得到平台控制力和控制力矩与喷气推力器推力间的关系:
F0=CIBAT (21)
其中,CIB为平台本体系到惯性系的转换矩阵,T=[T1 T2 … Tl]T为喷气推力器推力;
对于求解得到的平台控制量F0,通过构造以下优化问题设计了推力分配算法,将控制量分配到每个推力器:
Figure BDA0003664439340000112
其中,Tlb,Tub代表推力器的推力饱和约束;
推力分配得到了每个推力器的连续推力,为了满足推力器的开-关控制模式,通过PWM方法将连续推力转换为开-关模式的开机时间:
Figure BDA0003664439340000113
其中,Ti *代表分配算法得到的连续推力,Ti o代表推力器的开机推力,Δt代表PWM频率;
最后,考虑推力器的最小开机时间Δtc,得到最终的推力器驱动指令:
Figure BDA0003664439340000114
本发明提出一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述一种基于高斯混合过程的多臂航天器模型预测控制方法的步骤。
本发明提出一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现所述一种基于高斯混合过程的多臂航天器模型预测控制方法的步骤。
以上对本发明所提出的一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于高斯混合过程的多臂航天器模型预测控制方法,其特征在于,具体包括:
建立多臂航天器动力学和运动学模型,作为MPC中的预测模型;
对于预测模型中的扰动项估计值
Figure FDA0003664439330000017
输入初始激励建立数据集,利用高斯混合过程训练得到多臂航天器的残差动力学作为扰动项的估计值;
根据实际驱动器输入饱和约束,构建模型预测控制器,实现航天器机械臂末端和平台位姿对期望轨迹的跟踪,所述饱和包括关节电机饱和和平台推力器推力饱和;
所述平台推力器为开关控制模式,将MPC产生的平台连续控制指令分配为每个推力器的开机时间,得到最终的推力器驱动指令。
2.根据权利要求1所述的方法,其特征在于,对于拥有n条机械臂,每条臂拥有m个自由度,平台配置l个喷气推力器的多臂航天器,首先在关节空间对多臂航天器的动力学模型进行描述:
多臂航天器动力学模型表示为:
Figure FDA0003664439330000011
其中,M代表多臂航天器的惯性参数;C代表非线性项;d是扰动项;
Figure FDA0003664439330000012
代表平台位姿和关节角度信息,r0为6自由度平台位姿,q=[q1,…,qn]T为关节角度;
Figure FDA0003664439330000013
代表控制力和控制力矩,F0代表平台控制力/力矩,Fq代表关节力矩。
3.根据权利要求2所述的方法,其特征在于,根据机械臂末端与关节、平台状态的映射关系,利用DH参数法得到多臂航天器机械臂末端位姿的描述形式:
Figure FDA0003664439330000014
其中,齐次变换矩阵
Figure FDA0003664439330000015
通过DH参数θm,dm,amm进行定义:
Figure FDA0003664439330000016
最后,构建状态空间表达式:
Figure FDA0003664439330000021
其中,
Figure FDA0003664439330000022
代表平台和机械臂末端位姿,
Figure FDA0003664439330000023
代表扰动项的估计值;
设定采样时间Δt,将连续的状态空间表达式转化为离散时间模型,在当前k时刻测量值的基础上实现对未来k+N时刻系统状态的预测:
Figure FDA0003664439330000024
4.根据权利要求3所述的方法,其特征在于,记录得到p组数据集进行高斯混合过程训练,其中输入x包含多臂航天器位姿Q、速度
Figure FDA0003664439330000025
和控制量的增量Δu,输出y为实际角速度和名义模型计算角加速度的差值,即残差动力学,用于捕捉总扰动对系统的影响
Figure FDA0003664439330000026
高斯过程事先假设样本服从高斯分布:
y(x)~N(μ(x),k(x,x')) (6)
其中,μ(x)代表均值函数;k(x,x')代表协方差函数,表达式为:
Figure FDA0003664439330000027
其中,σn取0.3,σf,l为待求解的超参数,
Figure FDA0003664439330000028
采用优化最大似然估计的方法对协方差函数进行求解:
Figure FDA0003664439330000029
训练得到高斯过程的超参数之后,即可利用预测点的输入信息x*来求解对应的输出值y*;先确定样本和测试集的联合概率密度函数:
Figure FDA00036644393300000210
其中,
K**=k(x*,x*) (10)
K*=[k(x*,x1)k(x*,x2)…k(x*,xp)] (11)
Figure FDA0003664439330000031
利用贝叶斯推理,得到预测点的后验概率表达式:
Figure FDA0003664439330000035
得到高斯过程的预测值:
Figure FDA0003664439330000032
5.根据权利要求4所述的方法,其特征在于,在所述多臂航天器高斯过程中利用局部高斯过程方法,所述局部高斯过程方法为:先根据高斯混合模型方法进行聚类,再针对每一个高斯分量进行回归,最后在预测时对局部预测值进行融合;
假设输入x服从M个高斯分量的混合分布,其概率密度分布函数为:
Figure FDA0003664439330000033
其中,πi为混合系数,代表样本来源于第i个高斯分量的概率;p(x|μii)代表由第i个高斯分量生成样本的概率;{μii}为高斯混合过程的超参数。
6.根据权利要求5所述的方法,其特征在于,在得到训练样本后,首先对模型参数进行初始化,然后通过期望最大化算法的E步骤和M步骤的不断迭代,更新模型参数,直到模型收敛;
其中,E步骤利用M步骤估计的参数{πiii}计算样本来自第i个高斯分量的后验概率ri
Figure FDA0003664439330000034
M步骤通过E步骤计算得出的训练样本的后验概率ri,通过极大化对数似然函数更新模型参数:
Figure FDA0003664439330000041
针对聚类得到的每一组高斯分量,利用高斯回归训练方法,得到对应的高斯过程模型以及预测点x*在M个局部高斯过程模型下的预测值y*i,再由聚类生成的预测点由第i个高斯分量生成的后验概率r*i加权融合计算最终的预测值y*
Figure FDA0003664439330000042
7.根据权利要求6所述的方法,其特征在于,构建如下形式的性能指标,以求解系统的控制输入:
Figure FDA0003664439330000043
其中,Qr,Qt分别代表控制误差和输入惩罚项的加权矩阵;
通过选择合适的控制器参数,所述参数包括Δt,N,Qr,Qt,求解上述优化控制问题,得到未来N个时刻的控制量U=[uk,uk+1,…,uk+N-1]T,仅将k时刻控制量uk作为系统输入。
8.根据权利要求7所述的方法,其特征在于,首先给出一般化的推力器安装矩阵,即卫星平台上安装有l个喷气推力器,各推力器安装位置分为[xTi,yTi,zTi]T,推力矢量与+x方向以及x-y平面夹角分为βi和γi,得到推力器推力和力矩在卫星平台本体系下的配置矩阵:
Figure FDA0003664439330000051
由此得到平台控制力和控制力矩与喷气推力器推力间的关系:
F0=CIBAT (21)
其中,CIB为平台本体系到惯性系的转换矩阵,T=[T1 T2…Tl]T为喷气推力器推力;
对于求解得到的平台控制量F0,通过构造以下优化问题设计了推力分配算法,将控制量分配到每个推力器:
Figure FDA0003664439330000052
其中,Tlb,Tub代表推力器的推力饱和约束;
推力分配得到了每个推力器的连续推力,为了满足推力器的开-关控制模式,通过PWM方法将连续推力转换为开-关模式的开机时间:
Figure FDA0003664439330000053
其中,Ti *代表分配算法得到的连续推力,Ti o代表推力器的开机推力,Δt代表PWM频率;
最后,考虑推力器的最小开机时间Δtc,得到最终的推力器驱动指令:
Figure FDA0003664439330000054
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8任一项所述方法的步骤。
10.一种计算机可读存储介质,用于存储计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1-8任一项所述方法的步骤。
CN202210582234.6A 2022-05-26 2022-05-26 一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质 Active CN114995132B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210582234.6A CN114995132B (zh) 2022-05-26 2022-05-26 一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质
US18/143,795 US20230381956A1 (en) 2022-05-26 2023-05-05 Multi-arm Spacecraft Model Predictive Control Method Based on Mixture of Gaussian Processes, Equipment, and Medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210582234.6A CN114995132B (zh) 2022-05-26 2022-05-26 一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质

Publications (2)

Publication Number Publication Date
CN114995132A CN114995132A (zh) 2022-09-02
CN114995132B true CN114995132B (zh) 2023-01-17

Family

ID=83029135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210582234.6A Active CN114995132B (zh) 2022-05-26 2022-05-26 一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质

Country Status (2)

Country Link
US (1) US20230381956A1 (zh)
CN (1) CN114995132B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10987808B1 (en) * 2016-12-14 2021-04-27 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for providing a control solution for an actuator
CN116257797A (zh) * 2022-12-08 2023-06-13 江苏中路交通发展有限公司 一种基于高斯混合模型的机动车单次出行轨迹辨识方法
CN117086886B (zh) * 2023-10-18 2023-12-22 山东建筑大学 基于机理数据混合驱动的机器人动态误差预测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046378A (zh) * 2019-02-28 2019-07-23 昆明理工大学 一种基于进化多目标优化的选择性分层集成高斯过程回归软测量建模方法
CN112731813A (zh) * 2020-12-29 2021-04-30 西北工业大学 基于复合扰动观测器的航天器多源干扰随机模型预测控制方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11327449B2 (en) * 2020-05-29 2022-05-10 Mitsubishi Electric Research Laboratories, Inc. Nonlinear optimization for stochastic predictive vehicle control
CN112428278B (zh) * 2020-10-26 2022-11-15 北京理工大学 机械臂的控制方法、装置及人机协同模型的训练方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046378A (zh) * 2019-02-28 2019-07-23 昆明理工大学 一种基于进化多目标优化的选择性分层集成高斯过程回归软测量建模方法
CN112731813A (zh) * 2020-12-29 2021-04-30 西北工业大学 基于复合扰动观测器的航天器多源干扰随机模型预测控制方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Random Finite Set Theory and Centralized Control of Large Collaborative Swarms;Pingping Zhu;《JOURNAL OF GUIDANCE, CONTROL, AND DYNAMICS》;20201124;全文 *
Two Parallel Single-Gimbal Control Moment Gyros Actuated Spacecraft Attitude Maneuver;岳程斐;《IEEE TRANSACTIONS ON AEROSPACE AND ELECTRONIC SYSTEMS》;20200214;全文 *
基于高斯混合模型与主元分析的多模型切换方法;庞强等;《化工学报》;20130815(第08期);全文 *
基于高斯过程的机械臂逆动力学;胡小乔;《中国优秀硕博士论文全文数据库》;20210815;全文 *
编队构形保持模型预测控制方法研究;曹喜滨;《宇航学报》;20080731;全文 *

Also Published As

Publication number Publication date
US20230381956A1 (en) 2023-11-30
CN114995132A (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN114995132B (zh) 一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质
CN109343341B (zh) 一种基于深度强化学习的运载火箭垂直回收智能控制方法
CN102880052B (zh) 基于时标功能分解的高超声速飞行器执行器饱和控制方法
Han et al. Online policy iteration ADP-based attitude-tracking control for hypersonic vehicles
CN110850719B (zh) 一种基于强化学习的空间非合作目标参数自整定追踪方法
CN102866635B (zh) 基于等价模型的高超声速飞行器离散神经网络自适应控制方法
CN112965371B (zh) 基于固定时间观测器的水面无人艇轨迹快速跟踪控制方法
Guo et al. Finite-time deterministic learning command filtered control for hypersonic flight vehicle
Zhao et al. Concurrent learning adaptive finite-time control for spacecraft with inertia parameter identification under external disturbance
CN112379595A (zh) 非线性严格反馈切换系统复合干扰学习控制方法
CN113848887A (zh) 一种基于mlp方法的欠驱动无人艇轨迹跟踪控制方法
CN111338213B (zh) 一种基于事件触发机制的多水下航行器自适应模糊二部一致控制方法
Wang et al. Intelligent control of air-breathing hypersonic vehicles subject to path and angle-of-attack constraints
CN115509248A (zh) 一种基于序列凸优化和模型预测控制的卫星集群重构控制方法
Liu et al. Non‐linear adaptive tracking control for quadrotor aerial robots under uncertain dynamics
Xiong et al. Self-tuning sliding mode control for an uncertain coaxial octorotor UAV
CN111414011A (zh) 一种考虑执行机构故障的高超声速飞行器保性能容错控制方法
Peng et al. Model-based deep reinforcement learning for data-driven motion control of an under-actuated unmanned surface vehicle: Path following and trajectory tracking
CN114943168B (zh) 一种水上浮桥组合方法及系统
CN113954077B (zh) 带有能量优化的水下游动机械臂轨迹跟踪控制方法及装置
CN110376887B (zh) 基于时变滑模增益的飞行器离散滑模智能控制方法
Amrr et al. Time-energy efficient finite time attitude tracking control of spacecraft using disturbance observer
Haseltalab et al. Adaptive control for a class of partially unknown non-affine systems: Applied to autonomous surface vessels
Marais et al. Go with the flow: energy minimising periodic trajectories for UVMS
Sun et al. Incremental learning-based optimal design of BFN kernel for online spacecraft disturbance rejection control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant