CN116009594A

CN116009594A - 一种基于零和博弈的高超声速飞行器状态约束容错控制方法

Info

Publication number: CN116009594A
Application number: CN202310302104.7A
Authority: CN
Inventors: 任文静
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2023-03-27
Filing date: 2023-03-27
Publication date: 2023-04-25
Anticipated expiration: 2043-03-27
Also published as: CN116009594B

Abstract

本发明公开了一种基于零和博弈的高超声速飞行器状态约束容错控制方法，包括：建立含有质心偏移量的高超声速飞行器姿态动力学模型，引入时变高超声速飞行器状态安全约束函数，将高超声速飞行器受到的偏心力矩与执行器部分失效故障输入到容错控制框架中，设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略，得到容错安全控制器；引入零和博弈性能指标，将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈，优化补偿容错安全控制器，保障高超声速飞行器的安全。本发明高超声速飞行器状态约束容错控制方法在发生异常质心偏移时，仍能够安全完成飞行任务。

Description

一种基于零和博弈的高超声速飞行器状态约束容错控制方法

技术领域

本发明属于自动控制技术领域，具体地，涉及一种基于零和博弈的高超声速飞行器状态约束容错控制方法。

背景技术

随着航空航天技术的发展与进步，新型的航空航天技术相继出现。高超声速飞行器指的是一种集航空器、航天器和运载器于一体的新型飞行器，它集航空、航天的功能于一身，既能在大气层内作高超声速飞行，速度在马赫数5以上，又能穿过大气层进入轨道，具有较高的应用价值。因其超高速的飞行特性，使得高超声速飞行器的系统动力学模型具有多变量、强耦合、快时变、强非线性等特点，使得系统的容错性显得尤为重要。否则，因故障，尤其是结构的损伤故障，不仅仅会降低飞行器的系统性能，甚至直接导致飞行器的损毁，引发事故。故需要对故障进行分析，通过有效的容错控制方法，使得在极端情况下依然能够保持相当的操控性，最终安全返航。因此，如何增强飞行器控制系统有效处理系统故障的能力来提高系统的安全性能成为研究热点。

目前，关于高超声速飞行器容错控制方法主要集中以下几个方面：(1) 基于自适应神经网络估计技术来处理因执行器部分失效故障带来的控制性能下降，(2) 基于数据驱动的方法根据系统的实时状态来动态调节系统参数，完成容错控制；(3) 基于反步法技术的执行器故障补偿设计等。在以往的故障补偿设计过程中，通常情况下高超声速飞行器的系统转动能惯量矩阵是可逆的，不会造成系统控制特性的改变，但是上述算法无法支撑转动惯量矩阵参数的大幅度变化，以及质心偏移造成的转动惯量矩阵奇异现象，导致控制失败，同时，保障系统安全的状态约束控制，也需要系统状态预先位于状态约束边界之内，有较大的局限性，无法及时做出对系统状态的安全约束，难以形成有效的容错控制策略。因而，上述问题亟需设计新的策略来解决。

发明内容

为了克服现有技术中存在的不足，本发明针对含有未知质心偏移情况下的高超声速飞行器状态安全约束控制问题，提供了一种基于零和博弈的高超声速飞行器状态约束容错控制方法，该方法基于状态约束控制技术与零和博弈优化控制技术，保证飞行器在出现未知质心偏移故障时，仍能够具有相应的控制能力，保障高超声速飞行器安全飞行的状态约束能力，提高飞行器控制系统的容错性能。

为实现上述目的，本发明采用如下技术方案：一种基于零和博弈的高超声速飞行器状态约束容错控制方法，具体包括如下步骤：

步骤1：根据高超声速飞行器的未知质心偏移量及飞行环境，建立含有质心偏移量的高超声速飞行器姿态动力学模型；

步骤2：根据步骤1建立的高超声速飞行器姿态动力学模型，引入时变高超声速飞行器状态安全约束函数；

步骤3：基于步骤2建立的时变高超声速飞行器状态安全约束函数，采用范数界的方法，将高超声速飞行器受到的偏心力矩与执行器部分失效故障通过自适应控制的方法输入到容错控制框架中，建立基于反步法的容错安全控制框架，设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略，得到容错安全控制器，实现高超声速飞行器在故障下的有界稳定；

步骤4：引入零和博弈性能指标，将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈，通过自适应动态规划优化补偿容错安全控制器，优化容错安全控制框架，保障高超声速飞行器的安全。

进一步地，所述含有质心偏移量的高超声速飞行器姿态动力学模型的建立过程为：

，

其中，

为高超声速飞行器的飞行姿态角，

，

为高超声速飞行器飞行姿态角中的滚转角，

为高超声速飞行器飞行姿态角中的攻角，

为高超声速飞行器飞行姿态角中的侧滑角，

为姿态角速率，

，

为高超声速飞行器的滚转角速度，

为高超声速飞行器的俯仰角速度，

为高超声速飞行器的偏航角速度，

为姿态旋转矩阵，

，

为角速度旋转矩阵，

，

为未发生质心偏移时的高超声速飞行器姿态动力学模型的转动惯量，

为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量，

为未知的质心偏移量，

为高超声速飞行器质心的在机体坐标系上未知偏离量的三个分量，

为高超声速飞行器系统控制输入量，

为质心偏移对高超声速飞行器带来的偏心力矩，

为控制输入旋转矩阵，

，

分别为高超声速飞行器系统控制输入量

在机体坐标系上的三个分量，

为高超声速飞行器姿态动力学模型受到的外部有界干扰。

进一步地，所述高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量

表示为：

，

其中，

为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内并平行与高超声速飞行器的设计轴线方向偏移量，

，

为高超声速飞行器的质量；

为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在垂直于高超声速飞行器对称平面指向高超声速飞行器右方的偏移量，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内与

轴垂直并指向高超声速飞行器下方的偏移量，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的在

轴与

轴耦合的惯量积，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的在

轴与

轴耦合的惯量积，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的在

轴与

轴耦合的惯量积，

。

进一步地，所述时变高超声速飞行器状态安全约束函数

的建立过程为：

，

其中，

为时变高超声速飞行器的姿态状态约束边界。

进一步地，根据时变高超声速飞行器状态安全约束函数形成的高超声速飞行器的飞行姿态角的安全约束区域

为

，当高超声速飞行器未发生质心偏移时，扩大所述高超声速飞行器的飞行姿态角的安全约束区域至所述高超声速飞行器的整个飞行包线；当高超声速飞行器发生未知质心变动时，缩小所述高超声速飞行器的姿态状态约束边界，将所述高超声速飞行器的飞行姿态角约束在安全约束区域

内。

进一步地，步骤3包括如下子步骤：

步骤31：根据步骤2建立的时变高超声速飞行器状态安全约束函数，引入高超声速飞行器的姿态跟踪误差，包括：飞行姿态角

的跟踪误差

和姿态角速率

的跟踪误差

；

，

其中，

为引入时变高超声速飞行器状态安全约束函数，

为满足状态安全约束函数的期望姿态角指令，

，

为由飞行任务目标制定的期望姿态角度，

为由飞行任务目标制定的期望姿态角速率；

步骤32：将步骤31中的飞行姿态角跟踪误差

关于时间

求导，得：

，

其中，

为与高速飞行器姿态相关的时变参数，

，

为与高超声速飞行器姿态状态约束函数相关的时变参数，

，

为含有质心偏移量的高超声速飞行器姿态动力学模型的不确定分配矩阵，

为与高超声速飞行器期望姿态相关的时变函数，

，

为与高超声速飞行器姿态状态约束函数相关的时变函数，

；

步骤33：引入一阶滤波器

，将姿态角速率

转换成：

，

其中，

为一阶滤波器的输出，

为待设计的虚拟控制量，

，

为设计的状态反馈控制量，

为基于零和博弈设计的优化辅助控制量，

为关于

、

、

以及一阶滤波器输出

与虚待设计的虚拟控制量

之间的误差

的动态函数，

，

为与高超声速飞行器姿态动力学模型状态无关的时变动态函数，

，基于杨氏不等式，将

简化：

，

其中，

，

为姿态旋转矩阵

的下范数界，

为姿态旋转矩阵

的上范数界，

为第一未知的自适应参量，

，

为已知的动态函数；

步骤34：结合第一Lyapunov函数

和Backatepping法，进行带有状态约束的高超声速飞行器姿态角控制策略设计：

，

其中，

为设计的虚拟控制器增益，

为第一正数控制参数，

为第二正数控制参数，

为对

的估计误差，

为

的估计值，对

求导并结合步骤33中关于

简化的不等式，对第一Lyapunov函数

求导，实现高超声速飞行器在故障下的有界稳定：

，

其中，

为正定的参数；

步骤35：根据步骤31的高超声速飞行器的姿态跟踪误差，得出姿态角速率的跟踪误差的动态方程：

，其中，

为3×3的转动惯量矩阵，

，

为高超声速飞行器受到的偏心力矩部分失效故障，

为执行器的卡死故障；引入变换

，并结合自适应控制方法对动态方程中的不确定性进行参数化：

，

其中，

为三维列向量，

为3行6列的矩阵，

，对于任意给定的三维列向量

，变换

表示为：

，得出：

和

，将

结合自适应算法的少参数化方法，则映射

为：

，

其中，

为第二未知的自适应参量，

，

为未知常数，

为已知的基函数，

；

步骤36：根据带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略，结合Lyaounov稳定性理论，建立第二Lyapunov函数

，针对动态方程

设计如下容错安全控制器

：

，

其中，

为复合干扰量，

，

为容错安全控制器的增益，

均为正定控制参量，

为自适应量

的估计误差，

为自适应量

的估计值；

步骤37：结合设计的容错安全控制器

与第二Lyapunov函数，对

进行求导，实现高超声速飞行器在故障下的有界稳定：

，

其中，

为第一待定正常数，

，

为第二待定正常数，

，

为已知且有界的正函数，

，

为第三待定正常数。

进一步地，步骤4包括如下子步骤：

步骤41：将飞行姿态角

的跟踪误差

和姿态角速率

的跟踪误差

整合为优化仿射非线性形式，形成控制变量与系统扰动量的零和博弈；所述优化仿射非线性形式为：

，

其中，

为高超声速飞行器的飞行姿态的跟踪误差，

，

为高超声速飞行器姿态动力学模型矩阵，

，

为常系数矩阵，

，

为基于零和博弈的优化控制补偿器，

，

为控制变量，

为容错安全控制器，

为高超声速飞行器姿态动力学模型的扰动量，

，

为待定的正常数，

为近似函数；

步骤42：设计零和博弈目标函数，并通过哈密顿函数优化零和博弈目标函数，并基于达到纳什均衡时的最优容许控制得到最优控制对

；

所述零和博弈目标函数

为：

，

其中，

为正定惩罚项，

为第一正定矩阵，

为第二正定矩阵，调节

与

形成零和博弈权重；

所述哈密顿函数

，且哈密顿函数满足：

，其中，

为零和博弈目标函数

关于

的梯度；

所述

，

。

进一步地，步骤42中所述最优控制对

的求取过程为：

步骤421：通过基于自适应动态规划的零和博弈值迭代求解方法，设计基于神经网络的估计器：

，

其中，

为理想的神经网络权重，

，

为

的范数边界，

为神经网络的激活函数，

为神经网络的估计误差；

步骤422：将神经网络的估计器进行梯度信息化：

，并将最优控制对

转化为：

，

其中，

、

通过与梯度信息有关的HJB方程求得：

，

其中，

为神经网络激活函数的梯度，

为神经网络估计误差的梯度，

为正定矩阵，

，

为已知的正定矩阵，

，

，

为未知且待定的负定矩阵，

，

，

均为有界的正常数。

进一步地，步骤422中的

求取过程为：定义

为

的估计量，得

，其中，

为

的估计，得最优控制对

的估计：

，

结合最优控制对

的估计，构成如下的哈密顿函数误差：

，

并将哈密顿函数误差最小化：

，

得到

的更新率为：

，

其中，

为神经网络权重的学习率，

为第一待定且时变的增益，

，

为第三待定且时变的增益，

，

为第二待定且时变的增益，

，

和

分别为权重调节矩阵，

为设计的二次型矩阵，

为已知的分段函数，

，

。

与现有技术相比，本发明具有如下有益效果：本发明基于零和博弈的高超声速飞行器状态约束容错控制方法中，将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈，一方面能够在无故障时，减小对高超声速飞行器姿态动力学模型状态的约束，释放高超声速飞行器的性能，另一方面，在出现故障时，能够约束住高超声速飞行器的状态，使其为主安全约束边界内，同时借助于零和博弈，优化高超声速飞行器姿态动力学模型的容错控制能力，通过将高超声速飞行器状态约束在安全范围内，实现高超声速飞行器故障情况下的容错、安全控制，从而提高了高超声速飞行器模型运行的安全性与可靠性，控制算法结构稳定，由Backstepping融合零和博弈机制，通过神经网络寻优，结构清晰，易于实现。

附图说明

图1为本发明基于零和博弈的高超声速飞行器状态约束容错控制方法的框架图；

图2为含有未知质心偏移故障下的高超声速飞行器姿态跟踪响应曲线，其中，图2中的（a）为高超声速飞行器随时间变化的攻角跟踪曲线，图2中的（b）为高超声速飞行器随时间变化的俯仰角跟踪曲线，图2中的（c）为高超声速飞行器随时间变化的滚转角跟踪曲线。

实施方式

下面结合附图和实施例对本发明的技术方案作进一步地解释说明。

如图1为本发明基于零和博弈的高超声速飞行器状态约束容错控制方法的框架图，该基于零和博弈的高超声速飞行器状态约束容错控制方法，具体包括如下步骤：

步骤1：根据飞行器的未知质心偏移量及飞行环境，建立含有质心偏移量的高超声速飞行器姿态动力学模型，刻画未知质心偏移量对高超声速飞行器姿态运动特性的影响，有别于常规的高超声速飞行器运动学模型，未知的质心偏移在高超声速飞行器的姿态运动方面的影响主要体现在以下三个方面：1）高超声速飞行器姿态动力学模型状态惯量矩阵的改变；2）高超声速飞行器姿态动力学模型的强耦合不确定性；3）偏心力矩，三者同时出现。因此，基于高超声速飞行器的运动学及动力学知识，基于质心变动量对于飞行器姿态的影响，建立了涵盖上述三者影响的高超声速飞行器含质心变动的姿态运动学及动力学模型，揭示质心变动的对飞行器姿态运动的影响规律，具体地，含有质心偏移量的高超声速飞行器姿态动力学模型的建立过程为：

，

其中，

为高超声速飞行器的飞行姿态角，

，

为高超声速飞行器飞行姿态角中的滚转角，

为高超声速飞行器飞行姿态角中的攻角，

为高超声速飞行器飞行姿态角中的侧滑角，

为姿态角速率，

，

为高超声速飞行器的滚转角速度，

为高超声速飞行器的俯仰角速度，

为高超声速飞行器的偏航角速度，

为姿态旋转矩阵，

，

为角速度旋转矩阵，

，

为未知的质心偏移量，

为高超声速飞行器系统控制输入量，

为质心偏移对高超声速飞行器带来的偏心力矩，

为控制输入旋转矩阵，

，

分别为高超声速飞行器系统控制输入量

在机体坐标系上的三个分量，

为高超声速飞行器姿态动力学模型受到的外部有界干扰，

，

其中，

，

为高超声速飞行器的质量；

；

轴垂直并指向高超声速飞行器下方的偏移量，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的在

轴与

轴耦合的惯量积，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的在

轴与

轴耦合的惯量积，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的在

轴与

轴耦合的惯量积，

。

步骤2：根据步骤1建立的高超声速飞行器姿态动力学模型，对其影响特性的分析，引入时变高超声速飞行器状态安全约束函数，使得能够兼顾有无故障时高超声速飞行器的状态约束问题，保障高超声速飞行器的安全，在有故障时，约束系统状态至安全状态域中，无故障时，放宽对系统状态的约束，发挥高超声速飞行器的性能；具体地，时变高超声速飞行器状态安全约束函数

的建立过程为：

，

其中，

为时变高超声速飞行器的姿态状态约束边界。

上述时变高超声速飞行器状态安全约束函数

满足以下特性：

（1）

，

（2）

，

根据时变高超声速飞行器状态安全约束函数形成的高超声速飞行器的飞行姿态角的安全约束区域

为

，当面对高超声速飞行器的容错控制需求时，借助于上述特性：当高超声速飞行器未发生质心偏移时，扩大所述高超声速飞行器的飞行姿态角的安全约束区域至所述高超声速飞行器的整个飞行包线，释放飞行器的性能；当高超声速飞行器发生未知质心变动时，为保障飞行器的安全，缩小所述高超声速飞行器的姿态状态约束边界，将高超声速飞行器的飞行姿态角约束在安全约束区域

内。

步骤3：基于步骤2建立的时变高超声速飞行器状态安全约束函数，采用范数界的方法，将高超声速飞行器受到的偏心力矩与执行器部分失效故障通过自适应控制的方法输入到容错控制框架中，建立基于反步法的容错安全控制框架，设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略，得到容错安全控制器，实现高超声速飞行器在故障下的有界稳定；具体包括如下子步骤：

的跟踪误差

和姿态角速率

的跟踪误差

；

，

其中，

为引入时变高超声速飞行器状态安全约束函数，

为满足状态安全约束函数的期望姿态角指令，

，

为由飞行任务目标制定的期望姿态角度，

为由飞行任务目标制定的期望姿态角速率；

步骤32：将步骤31中的飞行姿态角跟踪误差

关于时间

求导，得：

，

其中，

为与高速飞行器姿态相关的时变参数，

，

为与高超声速飞行器姿态状态约束函数相关的时变参数，

，

为与高超声速飞行器期望姿态相关的时变函数，

，

为与高超声速飞行器姿态状态约束函数相关的时变函数，

；

步骤33：为解决Backstepping方法中的导数灾难问题，引入一阶滤波器

，将姿态角速率

转换成：

，

其中，

为一阶滤波器的输出，

为待设计的虚拟控制量，

，

为设计的状态反馈控制量，

为基于零和博弈设计的优化辅助控制量，

为关于

、

、

以及一阶滤波器输出

与虚待设计的虚拟控制量

之间的误差

的动态函数，

，

，基于杨氏不等式，将

简化：

，

其中，

，

为姿态旋转矩阵

的下范数界，

为姿态旋转矩阵

的上范数界，

为第一未知的自适应参量，通过

克服杨氏不等式放缩带来的控制量不连续问题，提高系统控制量的平滑性，

，

为已知的动态函数；

步骤34：结合第一Lyapunov函数

，

其中，

为设计的虚拟控制器增益，

为第一正数控制参数，

为第二正数控制参数，

为对

的估计误差，

为

的估计值，对

求导并结合步骤33中关于

简化的不等式，对第一Lyapunov函数

求导，实现高超声速飞行器在故障下的有界稳定：

，

其中，

为正定的参数；

，其中，

为3×3的转动惯量矩阵，

，

为高超声速飞行器受到的偏心力矩部分失效故障，

为执行器的卡死故障；为了采用反步法实现对姿态角速率的容错安全控制设计，引入变换

，由于异常质心变动造成的系统转动惯量矩阵存在不确定性，结合自适应控制方法对动态方程中的不确定性进行参数化：

，

其中，

为三维列向量，

为3行6列的矩阵，

，对于任意给定的三维列向量

，变换

表示为：

，得出：

和

，将

结合自适应算法的少参数化方法，则映射

为：

，

其中，

为第二未知的自适应参量，

，

为未知常数，

为已知的基函数，

；

，针对动态方程

设计如下容错安全控制器

：

，

其中，

为复合干扰量，由未知质心偏移量、执行器部分失效故障以及系统输入饱和约束构成，

，

为容错安全控制器的增益，

均为正定控制参量，控制量为

，

为设计的基于Backstepping 的状态反馈控制量，

为下一步设计的基于零和博弈的优化辅助补偿量，

为自适应量

的估计误差，

为自适应量

的估计值；

步骤37：结合设计的容错安全控制器

与第二Lyapunov函数，对

进行求导，实现高超声速飞行器在故障下的有界稳定：

，

其中，

为第一待定正常数，

，

为第二待定正常数，

，

为已知且有界的正函数，

，

为第三待定正常数。

步骤4：引入零和博弈性能指标，将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈，通过自适应动态规划优化补偿容错安全控制器，优化容错安全控制框架，实现飞行器在面对未知质心偏移量及执行器部分失效故障下的优化状态约束容错安全控制，保障飞行器的安全；具体包括如下子步骤：

步骤41：为了采用零和博弈理论使高超声速飞行器具有最优的控制性能，将飞行姿态角

的跟踪误差

和姿态角速率

的跟踪误差

，

其中，

为高超声速飞行器的飞行姿态的跟踪误差，

，

为高超声速飞行器姿态动力学模型矩阵，

，

为常系数矩阵，

，

为基于零和博弈的优化控制补偿器，

，

为控制变量，

为容错安全控制器，

为高超声速飞行器姿态动力学模型的扰动量，

，

为待定的正常数，

为近似函数，为了反应高超声速飞行器姿态动力学模型在满足状态约束中的优化控制目的，将高超声速飞行器的状态与约束边界的距离作为优化量，使其越大越好，即高超声速飞行器姿态动力学模型状态能够聚拢到约束域的中心区域，提高质心变动情况下的飞行器容错控制性能，故将该功能以零和博弈的方式展现出来，

具体为：

，

其中，当高超声速飞行器的姿态角距离安全边界满足阈值约束

时，

，表明此时的控制效果较好，无需进行优化补偿控制；当

时，表明高超声速飞行器的状态位于约束的安全区域内，但系统状态距离边界的距离太近了，需要进行优化补偿控制；当

时，表明此时高超声速飞行器的状态越过了约束边界，需要给予控制压制，使其重新返回到约束域中。

；

本发明中零和博弈目标函数

为：

，

其中，

为正定惩罚项，优化控制效果，

为第一正定矩阵，

为第二正定矩阵，调节

与

形成零和博弈权重，达到更好的控制效果；

所述哈密顿函数

，且哈密顿函数满足：

，其中，

为零和博弈目标函数

关于

的梯度；基于达到纳什均衡时的最优容许控制对

存在且唯一的假设，得：

，

。

具体地，最优控制对

的求取过程为：

步骤421：由于最优的控制对

无法直接获取，通过基于自适应动态规划的零和博弈值迭代求解方法，设计基于神经网络的估计器：

，

其中，

为理想的神经网络权重，

，

为

的范数边界，

为神经网络的激活函数，

为神经网络的估计误差；

步骤422：将神经网络的估计器进行梯度信息化：

，并将最优控制对

转化为：

，

首先，

、

通过与梯度信息有关的HJB方程求得：

，

其中，

为神经网络激活函数的梯度，

为神经网络估计误差的梯度，

为正定矩阵，

，

为已知的正定矩阵，

，

，

为未知且待定的负定矩阵，

，

，

均为有界的正常数。

其次，

求取过程为：定义

为

的估计量，得

，其中，

为

的估计，得最优控制对

的估计：

，

结合最优控制对

的估计，构成如下的哈密顿函数误差：

，

并将哈密顿函数误差最小化：

，

得到

的更新率为：

，

其中，

为神经网络权重的学习率，

为第一待定且时变的增益，

，

为第三待定且时变的增益，

，

为第二待定且时变的增益，

，

和

分别为权重调节矩阵，

为设计的二次型矩阵，

为已知的分段函数，

，

。在

的更新律中，第一项起到梯度下降的作用，减小哈密顿误差

；第二项为在学习过程中保证系统状态有界的附加项；第三项的设计用于整个系统的稳定性分析；此外，基于Lyapunov稳定性定理的设计过程保障了整个系统的稳定性。

本发明基于零和博弈的高超声速飞行器状态约束容错控制方法既能保证闭环系统中所有信号都有界，又能保证系统输出

以最优的方式跟踪参考信号

而不发生越界行为，及时出现了未知的质心偏移量，保障飞行器的安全。

实施例

本实施例将本发明基于零和博弈的高超声速飞行器状态约束容错控制方法进行仿真实验：

考虑带有质心偏移的高超声速飞行器姿态刚体模型为：

其中，

，高超声速飞行器姿态动力学模型受到外部干扰为

，高超声速飞行器的初始姿态角与姿态角速率为

，控制的参考指令为：当

，

；当

，

，

，

。当

时，高超声速飞行器的质心偏移量为

。

采用Matlab/Simulink仿真，在Matlab/Simulink中搭建飞行器系统模型及相应的质心变动模型，基于此，设计相应的自适应容错安全控制器，进而进行仿真验证。

按照上述设计的仿真条件对本发明基于零和博弈的高超声速飞行器状态约束容错控制方法进行仿真，可得受到质心未知量影响与安全状态约束的高超声速飞行器刚体姿态跟踪控制效果如图2所示，其中，图2中的（a）为高超声速飞行器随时间变化的攻角跟踪曲线，

表示攻角指令，

表示本发明状态约束容错控制的攻角跟踪曲线，

表示对照组攻角跟踪曲线；图2中的（b）为高超声速飞行器随时间变化的俯仰角跟踪曲线，

表示俯仰角指令，

表示本发明状态约束容错控制的俯仰角跟踪曲线，

表示对照组俯仰角跟踪曲线；图2中的（c）为高超声速飞行器随时间变化的滚转角跟踪曲线，

表示滚转角，

表示本发明状态约束容错控制的滚转角跟踪曲线，

表示对照组滚转角跟踪曲线。由相应的参考姿态指令

与实际的

跟踪效果可知，

分别与对应的

重合，即使在时间

时，出现了未知的质心偏移量，本发明所设计的约束容错控制方法仍然可以保持较好的姿态跟踪与保持效果；但从对照组

来看，当发生未知质心偏移后，产生了异常的偏心力矩，当系统状态不受约束时，使得偏心力矩的影响呈叠加态势，直至在22s时，对照组中容错控制失效。综上，在本发明基于零和博弈的高超声速飞行器状态约束容错控制方法下，飞行器实现了面对未知质心偏移量时，系统的容错安全优化控制。

以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，应视为本发明的保护范围。

Claims

1.一种基于零和博弈的高超声速飞行器状态约束容错控制方法，其特征在于，具体包括如下步骤：

2.根据权利要求1所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法，其特征在于，所述含有质心偏移量的高超声速飞行器姿态动力学模型的建立过程为：

，

其中，

为高超声速飞行器的飞行姿态角，

，

为高超声速飞行器飞行姿态角中的滚转角，

为高超声速飞行器飞行姿态角中的攻角，

为高超声速飞行器飞行姿态角中的侧滑角，

为姿态角速率，

，

为高超声速飞行器的滚转角速度，

为高超声速飞行器的俯仰角速度，

为高超声速飞行器的偏航角速度，

为姿态旋转矩阵，

，

为角速度旋转矩阵，

，

为未知的质心偏移量，

为高超声速飞行器系统控制输入量，

为质心偏移对高超声速飞行器带来的偏心力矩，

为控制输入旋转矩阵，

，

分别为高超声速飞行器系统控制输入量

在机体坐标系上的三个分量，

为高超声速飞行器姿态动力学模型受到的外部有界干扰。

3.根据权利要求2所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法，其特征在于，所述高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量

表示为：

，

其中，

，

为高超声速飞行器的质量；

；

轴垂直并指向高超声速飞行器下方的偏移量，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的在

轴与

轴耦合的惯量积，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的在

轴与

轴耦合的惯量积，

；

为高超声速飞行器姿态动力学模型发生质心偏移引起的在

轴与

轴耦合的惯量积，

。

4.根据权利要求2所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法，其特征在于，所述时变高超声速飞行器状态安全约束函数

的建立过程为：

，

其中，

为时变高超声速飞行器的姿态状态约束边界。

5.根据权利要求4所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法，其特征在于，根据时变高超声速飞行器状态安全约束函数形成的高超声速飞行器的飞行姿态角的安全约束区域

为

内。

6.根据权利要求4所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法，其特征在于，步骤3包括如下子步骤：

的跟踪误差

和姿态角速率

的跟踪误差

；

，

其中，

为引入时变高超声速飞行器状态安全约束函数，

为满足状态安全约束函数的期望姿态角指令，

，

为由飞行任务目标制定的期望姿态角度，

为由飞行任务目标制定的期望姿态角速率；

步骤32：将步骤31中的飞行姿态角跟踪误差

关于时间

求导，得：

，

其中，

为与高速飞行器姿态相关的时变参数，

，

为与高超声速飞行器姿态状态约束函数相关的时变参数，

，

为与高超声速飞行器期望姿态相关的时变函数，

，

为与高超声速飞行器姿态状态约束函数相关的时变函数，

；

步骤33：引入一阶滤波器

，将姿态角速率

转换成：

，

其中，

为一阶滤波器的输出，

为待设计的虚拟控制量，

，

为设计的状态反馈控制量，

为基于零和博弈设计的优化辅助控制量，

为关于

、

、

以及一阶滤波器输出

与虚待设计的虚拟控制量

之间的误差

的动态函数，

，

，基于杨氏不等式，将

简化：

，

其中，

，

为姿态旋转矩阵

的下范数界，

为姿态旋转矩阵

的上范数界，

为第一未知的自适应参量，

，

为已知的动态函数；

步骤34：结合第一Lyapunov函数

，

其中，

为设计的虚拟控制器增益，

为第一正数控制参数，

为第二正数控制参数，

为对

的估计误差，

为

的估计值，对

求导并结合步骤33中关于

简化的不等式，对第一Lyapunov函数

求导，实现高超声速飞行器在故障下的有界稳定：

，

其中，

为正定的参数；

，其中，

为3×3的转动惯量矩阵，

，

为高超声速飞行器受到的偏心力矩部分失效故障，

为执行器的卡死故障；引入变换

，

其中，

为三维列向量，

为3行6列的矩阵，

，对于任意给定的三维列向量

，变换

表示为：

，得出：

和

，将

结合自适应算法的少参数化方法，则映射

为：

，

其中，

为第二未知的自适应参量，

，

为未知常数，

为已知的基函数，

；

，针对动态方程

设计如下容错安全控制器

：

，

其中，

为复合干扰量，

，

为容错安全控制器的增益，

均为正定控制参量，

为自适应量

的估计误差，

为自适应量

的估计值；

步骤37：结合设计的容错安全控制器

与第二Lyapunov函数，对

进行求导，实现高超声速飞行器在故障下的有界稳定：

，

其中，

为第一待定正常数，

，

为第二待定正常数，

，

为已知且有界的正函数，

，

为第三待定正常数。

7.根据权利要求6所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法，其特征在于，步骤4包括如下子步骤：

步骤41：将飞行姿态角

的跟踪误差

和姿态角速率

的跟踪误差

，

其中，

为高超声速飞行器的飞行姿态的跟踪误差，

，

为高超声速飞行器姿态动力学模型矩阵，

，

为常系数矩阵，

，

为基于零和博弈的优化控制补偿器，

，

为控制变量，

为容错安全控制器，

为高超声速飞行器姿态动力学模型的扰动量，

，

为待定的正常数，

为近似函数；

；

所述零和博弈目标函数

为：

，

其中，

为正定惩罚项，

为第一正定矩阵，

为第二正定矩阵，调节

与

形成零和博弈权重；

所述哈密顿函数

，且哈密顿函数满足：

，其中，

为零和博弈目标函数

关于

的梯度；

所述

，

。

8.根据权利要求7所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法，其特征在于，步骤42中所述最优控制对

的求取过程为：

，

其中，

为理想的神经网络权重，

，

为

的范数边界，

为神经网络的激活函数，

为神经网络的估计误差；

步骤422：将神经网络的估计器进行梯度信息化：

，并将最优控制对

转化为：

，

其中，

、

通过与梯度信息有关的HJB方程求得：

，

其中，

为神经网络激活函数的梯度，

为神经网络估计误差的梯度，

为正定矩阵，

，

为已知的正定矩阵，

，

，

为未知且待定的负定矩阵，

，

，

均为有界的正常数。

9.根据权利要求8所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法，其特征在于，步骤422中的

求取过程为：定义

为

的估计量，得

，其中，

为

的估计，得最优控制对

的估计：

，

结合最优控制对

的估计，构成如下的哈密顿函数误差：

，

并将哈密顿函数误差最小化：

，

得到

的更新率为：

，

其中，

为神经网络权重的学习率，

为第一待定且时变的增益，

，

为第三待定且时变的增益，

，

为第二待定且时变的增益，

，

和

分别为权重调节矩阵，

为设计的二次型矩阵，

为已知的分段函数，

，

。