CN116009594A - 一种基于零和博弈的高超声速飞行器状态约束容错控制方法 - Google Patents

一种基于零和博弈的高超声速飞行器状态约束容错控制方法 Download PDF

Info

Publication number
CN116009594A
CN116009594A CN202310302104.7A CN202310302104A CN116009594A CN 116009594 A CN116009594 A CN 116009594A CN 202310302104 A CN202310302104 A CN 202310302104A CN 116009594 A CN116009594 A CN 116009594A
Authority
CN
China
Prior art keywords
hypersonic aircraft
attitude
fault
control
zero
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310302104.7A
Other languages
English (en)
Other versions
CN116009594B (zh
Inventor
任文静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202310302104.7A priority Critical patent/CN116009594B/zh
Publication of CN116009594A publication Critical patent/CN116009594A/zh
Application granted granted Critical
Publication of CN116009594B publication Critical patent/CN116009594B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于零和博弈的高超声速飞行器状态约束容错控制方法,包括:建立含有质心偏移量的高超声速飞行器姿态动力学模型,引入时变高超声速飞行器状态安全约束函数,将高超声速飞行器受到的偏心力矩与执行器部分失效故障输入到容错控制框架中,设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,得到容错安全控制器;引入零和博弈性能指标,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,优化补偿容错安全控制器,保障高超声速飞行器的安全。本发明高超声速飞行器状态约束容错控制方法在发生异常质心偏移时,仍能够安全完成飞行任务。

Description

一种基于零和博弈的高超声速飞行器状态约束容错控制方法
技术领域
本发明属于自动控制技术领域,具体地,涉及一种基于零和博弈的高超声速飞行器状态约束容错控制方法。
背景技术
随着航空航天技术的发展与进步,新型的航空航天技术相继出现。高超声速飞行器指的是一种集航空器、航天器和运载器于一体的新型飞行器,它集航空、航天的功能于一身,既能在大气层内作高超声速飞行,速度在马赫数5以上,又能穿过大气层进入轨道,具有较高的应用价值。因其超高速的飞行特性,使得高超声速飞行器的系统动力学模型具有多变量、强耦合、快时变、强非线性等特点,使得系统的容错性显得尤为重要。否则,因故障,尤其是结构的损伤故障,不仅仅会降低飞行器的系统性能,甚至直接导致飞行器的损毁,引发事故。故需要对故障进行分析,通过有效的容错控制方法,使得在极端情况下依然能够保持相当的操控性,最终安全返航。因此,如何增强飞行器控制系统有效处理系统故障的能力来提高系统的安全性能成为研究热点。
目前,关于高超声速飞行器容错控制方法主要集中以下几个方面:(1) 基于自适应神经网络估计技术来处理因执行器部分失效故障带来的控制性能下降,(2) 基于数据驱动的方法根据系统的实时状态来动态调节系统参数,完成容错控制;(3) 基于反步法技术的执行器故障补偿设计等。在以往的故障补偿设计过程中,通常情况下高超声速飞行器的系统转动能惯量矩阵是可逆的,不会造成系统控制特性的改变,但是上述算法无法支撑转动惯量矩阵参数的大幅度变化,以及质心偏移造成的转动惯量矩阵奇异现象,导致控制失败,同时,保障系统安全的状态约束控制,也需要系统状态预先位于状态约束边界之内,有较大的局限性,无法及时做出对系统状态的安全约束,难以形成有效的容错控制策略。因而,上述问题亟需设计新的策略来解决。
发明内容
为了克服现有技术中存在的不足,本发明针对含有未知质心偏移情况下的高超声速飞行器状态安全约束控制问题,提供了一种基于零和博弈的高超声速飞行器状态约束容错控制方法,该方法基于状态约束控制技术与零和博弈优化控制技术,保证飞行器在出现未知质心偏移故障时,仍能够具有相应的控制能力,保障高超声速飞行器安全飞行的状态约束能力,提高飞行器控制系统的容错性能。
为实现上述目的,本发明采用如下技术方案:一种基于零和博弈的高超声速飞行器状态约束容错控制方法,具体包括如下步骤:
步骤1:根据高超声速飞行器的未知质心偏移量及飞行环境,建立含有质心偏移量的高超声速飞行器姿态动力学模型;
步骤2:根据步骤1建立的高超声速飞行器姿态动力学模型,引入时变高超声速飞行器状态安全约束函数;
步骤3:基于步骤2建立的时变高超声速飞行器状态安全约束函数,采用范数界的方法,将高超声速飞行器受到的偏心力矩与执行器部分失效故障通过自适应控制的方法输入到容错控制框架中,建立基于反步法的容错安全控制框架,设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,得到容错安全控制器,实现高超声速飞行器在故障下的有界稳定;
步骤4:引入零和博弈性能指标,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,通过自适应动态规划优化补偿容错安全控制器,优化容错安全控制框架,保障高超声速飞行器的安全。
进一步地,所述含有质心偏移量的高超声速飞行器姿态动力学模型的建立过程为:
其中,为高超声速飞行器的飞行姿态角,为高超声速飞行器飞行姿态角中的滚转角,为高超声速飞行器飞行姿态角中的攻角,为高超声速飞行器飞行姿态角中的侧滑角,为姿态角速率,为高超声速飞行器的滚转角速度,为高超声速飞行器的俯仰角速度,为高超声速飞行器的偏航角速度,为姿态旋转矩阵,为角速度旋转矩阵,为未发生质心偏移时的高超声速飞行器姿态动力学模型的转动惯量,为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量,为未知的质心偏移量,为高超声速飞行器质心的在机体坐标系上未知偏离量的三个分量,为高超声速飞行器系统控制输入量,为质心偏移对高超声速飞行器带来的偏心力矩,为控制输入旋转矩阵,分别为高超声速飞行器系统控制输入量在机体坐标系上的三个分量,为高超声速飞行器姿态动力学模型受到的外部有界干扰。
进一步地,所述高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量表示为:
其中,为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内并平行与高超声速飞行器的设计轴线方向偏移量,为高超声速飞行器的质量;为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在垂直于高超声速飞行器对称平面指向高超声速飞行器右方的偏移量,为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内与轴垂直并指向高超声速飞行器下方的偏移量,为高超声速飞行器姿态动力学模型发生质心偏移引起的在轴与轴耦合的惯量积,为高超声速飞行器姿态动力学模型发生质心偏移引起的在轴与轴耦合的惯量积,为高超声速飞行器姿态动力学模型发生质心偏移引起的在轴与轴耦合的惯量积,
进一步地,所述时变高超声速飞行器状态安全约束函数的建立过程为:
其中,为时变高超声速飞行器的姿态状态约束边界。
进一步地,根据时变高超声速飞行器状态安全约束函数形成的高超声速飞行器的飞行姿态角的安全约束区域,当高超声速飞行器未发生质心偏移时,扩大所述高超声速飞行器的飞行姿态角的安全约束区域至所述高超声速飞行器的整个飞行包线;当高超声速飞行器发生未知质心变动时,缩小所述高超声速飞行器的姿态状态约束边界,将所述高超声速飞行器的飞行姿态角约束在安全约束区域内。
进一步地,步骤3包括如下子步骤:
步骤31:根据步骤2建立的时变高超声速飞行器状态安全约束函数,引入高超声速飞行器的姿态跟踪误差,包括:飞行姿态角的跟踪误差和姿态角速率的跟踪误差
其中,为引入时变高超声速飞行器状态安全约束函数,为满足状态安全约束函数的期望姿态角指令,为由飞行任务目标制定的期望姿态角度,为由飞行任务目标制定的期望姿态角速率;
步骤32:将步骤31中的飞行姿态角跟踪误差关于时间求导,得:
其中,为与高速飞行器姿态相关的时变参数,为与高超声速飞行器姿态状态约束函数相关的时变参数,为含有质心偏移量的高超声速飞行器姿态动力学模型的不确定分配矩阵,为与高超声速飞行器期望姿态相关的时变函数,为与高超声速飞行器姿态状态约束函数相关的时变函数,
步骤33:引入一阶滤波器,将姿态角速率转换成:
其中,为一阶滤波器的输出,为待设计的虚拟控制量,为设计的状态反馈控制量,为基于零和博弈设计的优化辅助控制量,为关于以及一阶滤波器输出与虚待设计的虚拟控制量之间的误差的动态函数,为与高超声速飞行器姿态动力学模型状态无关的时变动态函数,,基于杨氏不等式,将简化:
其中,为姿态旋转矩阵的下范数界,为姿态旋转矩阵的上范数界,为第一未知的自适应参量,为已知的动态函数;
步骤34:结合第一Lyapunov函数和Backatepping法,进行带有状态约束的高超声速飞行器姿态角控制策略设计:
其中,为设计的虚拟控制器增益,为第一正数控制参数,为第二正数控制参数,为对的估计误差,的估计值,对求导并结合步骤33中关于简化的不等式,对第一Lyapunov函数求导,实现高超声速飞行器在故障下的有界稳定:
其中,为正定的参数;
步骤35:根据步骤31的高超声速飞行器的姿态跟踪误差,得出姿态角速率的跟踪误差的动态方程:,其中,为3×3的转动惯量矩阵,为高超声速飞行器受到的偏心力矩部分失效故障,为执行器的卡死故障;引入变换,并结合自适应控制方法对动态方程中的不确定性进行参数化:
其中,为三维列向量,为3行6列的矩阵,,对于任意给定的三维列向量,变换表示为:,得出:,将结合自适应算法的少参数化方法,则映射为:
其中,为第二未知的自适应参量,为未知常数,为已知的基函数,
步骤36:根据带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,结合Lyaounov稳定性理论,建立第二Lyapunov函数,针对动态方程设计如下容错安全控制器
其中,为复合干扰量,为容错安全控制器的增益,均为正定控制参量,为自适应量的估计误差,为自适应量的估计值;
步骤37:结合设计的容错安全控制器与第二Lyapunov函数,对进行求导,实现高超声速飞行器在故障下的有界稳定:
其中,为第一待定正常数,为第二待定正常数,为已知且有界的正函数,为第三待定正常数。
进一步地,步骤4包括如下子步骤:
步骤41:将飞行姿态角的跟踪误差和姿态角速率的跟踪误差整合为优化仿射非线性形式,形成控制变量与系统扰动量的零和博弈;所述优化仿射非线性形式为:
其中,为高超声速飞行器的飞行姿态的跟踪误差,为高超声速飞行器姿态动力学模型矩阵,, 为常系数矩阵,为基于零和博弈的优化控制补偿器,为控制变量,为容错安全控制器,为高超声速飞行器姿态动力学模型的扰动量,为待定的正常数,为近似函数;
步骤42:设计零和博弈目标函数,并通过哈密顿函数优化零和博弈目标函数,并基于达到纳什均衡时的最优容许控制得到最优控制对
所述零和博弈目标函数为:
其中,为正定惩罚项,为第一正定矩阵,为第二正定矩阵,调节形成零和博弈权重;
所述哈密顿函数,且哈密顿函数满足:,其中,为零和博弈目标函数关于的梯度;
所述
进一步地,步骤42中所述最优控制对的求取过程为:
步骤421:通过基于自适应动态规划的零和博弈值迭代求解方法,设计基于神经网络的估计器:
其中,为理想的神经网络权重,的范数边界,为神经网络的激活函数,为神经网络的估计误差;
步骤422:将神经网络的估计器进行梯度信息化:,并将最优控制对转化为:
其中,通过与梯度信息有关的HJB方程求得:
其中,为神经网络激活函数的梯度,为神经网络估计误差的梯度,为正定矩阵,为已知的正定矩阵,为未知且待定的负定矩阵,均为有界的正常数。
进一步地,步骤422中的求取过程为:定义的估计量,得,其中,的估计,得最优控制对的估计:
结合最优控制对的估计,构成如下的哈密顿函数误差:
并将哈密顿函数误差最小化:
得到的更新率为:
其中,为神经网络权重的学习率,为第一待定且时变的增益,为第三待定且时变的增益,为第二待定且时变的增益,分别为权重调节矩阵,为设计的二次型矩阵,为已知的分段函数,
与现有技术相比,本发明具有如下有益效果:本发明基于零和博弈的高超声速飞行器状态约束容错控制方法中,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,一方面能够在无故障时,减小对高超声速飞行器姿态动力学模型状态的约束,释放高超声速飞行器的性能,另一方面,在出现故障时,能够约束住高超声速飞行器的状态,使其为主安全约束边界内,同时借助于零和博弈,优化高超声速飞行器姿态动力学模型的容错控制能力,通过将高超声速飞行器状态约束在安全范围内,实现高超声速飞行器故障情况下的容错、安全控制,从而提高了高超声速飞行器模型运行的安全性与可靠性,控制算法结构稳定,由Backstepping融合零和博弈机制,通过神经网络寻优,结构清晰,易于实现。
附图说明
图1为本发明基于零和博弈的高超声速飞行器状态约束容错控制方法的框架图;
图2为含有未知质心偏移故障下的高超声速飞行器姿态跟踪响应曲线,其中,图2中的(a)为高超声速飞行器随时间变化的攻角跟踪曲线,图2中的(b)为高超声速飞行器随时间变化的俯仰角跟踪曲线,图2中的(c)为高超声速飞行器随时间变化的滚转角跟踪曲线。
实施方式
下面结合附图和实施例对本发明的技术方案作进一步地解释说明。
如图1为本发明基于零和博弈的高超声速飞行器状态约束容错控制方法的框架图,该基于零和博弈的高超声速飞行器状态约束容错控制方法,具体包括如下步骤:
步骤1:根据飞行器的未知质心偏移量及飞行环境,建立含有质心偏移量的高超声速飞行器姿态动力学模型,刻画未知质心偏移量对高超声速飞行器姿态运动特性的影响,有别于常规的高超声速飞行器运动学模型,未知的质心偏移在高超声速飞行器的姿态运动方面的影响主要体现在以下三个方面:1)高超声速飞行器姿态动力学模型状态惯量矩阵的改变;2)高超声速飞行器姿态动力学模型的强耦合不确定性;3)偏心力矩,三者同时出现。因此,基于高超声速飞行器的运动学及动力学知识,基于质心变动量对于飞行器姿态的影响,建立了涵盖上述三者影响的高超声速飞行器含质心变动的姿态运动学及动力学模型,揭示质心变动的对飞行器姿态运动的影响规律,具体地,含有质心偏移量的高超声速飞行器姿态动力学模型的建立过程为:
其中,为高超声速飞行器的飞行姿态角,为高超声速飞行器飞行姿态角中的滚转角,为高超声速飞行器飞行姿态角中的攻角,为高超声速飞行器飞行姿态角中的侧滑角,为姿态角速率,为高超声速飞行器的滚转角速度,为高超声速飞行器的俯仰角速度,为高超声速飞行器的偏航角速度,为姿态旋转矩阵,为角速度旋转矩阵,为未发生质心偏移时的高超声速飞行器姿态动力学模型的转动惯量,为未知的质心偏移量,为高超声速飞行器质心的在机体坐标系上未知偏离量的三个分量,为高超声速飞行器系统控制输入量,为质心偏移对高超声速飞行器带来的偏心力矩,为控制输入旋转矩阵,分别为高超声速飞行器系统控制输入量在机体坐标系上的三个分量,为高超声速飞行器姿态动力学模型受到的外部有界干扰,为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量,
其中,为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内并平行与高超声速飞行器的设计轴线方向偏移量,为高超声速飞行器的质量;为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在垂直于高超声速飞行器对称平面指向高超声速飞行器右方的偏移量,为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内与轴垂直并指向高超声速飞行器下方的偏移量,为高超声速飞行器姿态动力学模型发生质心偏移引起的在轴与轴耦合的惯量积,为高超声速飞行器姿态动力学模型发生质心偏移引起的在轴与轴耦合的惯量积,为高超声速飞行器姿态动力学模型发生质心偏移引起的在轴与轴耦合的惯量积,
步骤2:根据步骤1建立的高超声速飞行器姿态动力学模型,对其影响特性的分析,引入时变高超声速飞行器状态安全约束函数,使得能够兼顾有无故障时高超声速飞行器的状态约束问题,保障高超声速飞行器的安全,在有故障时,约束系统状态至安全状态域中,无故障时,放宽对系统状态的约束,发挥高超声速飞行器的性能;具体地,时变高超声速飞行器状态安全约束函数的建立过程为:
其中,为时变高超声速飞行器的姿态状态约束边界。
上述时变高超声速飞行器状态安全约束函数满足以下特性:
(1)
(2)
根据时变高超声速飞行器状态安全约束函数形成的高超声速飞行器的飞行姿态角的安全约束区域,当面对高超声速飞行器的容错控制需求时,借助于上述特性:当高超声速飞行器未发生质心偏移时,扩大所述高超声速飞行器的飞行姿态角的安全约束区域至所述高超声速飞行器的整个飞行包线,释放飞行器的性能;当高超声速飞行器发生未知质心变动时,为保障飞行器的安全,缩小所述高超声速飞行器的姿态状态约束边界,将高超声速飞行器的飞行姿态角约束在安全约束区域内。
步骤3:基于步骤2建立的时变高超声速飞行器状态安全约束函数,采用范数界的方法,将高超声速飞行器受到的偏心力矩与执行器部分失效故障通过自适应控制的方法输入到容错控制框架中,建立基于反步法的容错安全控制框架,设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,得到容错安全控制器,实现高超声速飞行器在故障下的有界稳定;具体包括如下子步骤:
步骤31:根据步骤2建立的时变高超声速飞行器状态安全约束函数,引入高超声速飞行器的姿态跟踪误差,包括:飞行姿态角的跟踪误差和姿态角速率的跟踪误差
其中,为引入时变高超声速飞行器状态安全约束函数,为满足状态安全约束函数的期望姿态角指令,为由飞行任务目标制定的期望姿态角度,为由飞行任务目标制定的期望姿态角速率;
步骤32:将步骤31中的飞行姿态角跟踪误差关于时间求导,得:
其中,为与高速飞行器姿态相关的时变参数,为与高超声速飞行器姿态状态约束函数相关的时变参数,为含有质心偏移量的高超声速飞行器姿态动力学模型的不确定分配矩阵,为与高超声速飞行器期望姿态相关的时变函数,为与高超声速飞行器姿态状态约束函数相关的时变函数,
步骤33:为解决Backstepping方法中的导数灾难问题,引入一阶滤波器,将姿态角速率转换成:
其中,为一阶滤波器的输出,为待设计的虚拟控制量,为设计的状态反馈控制量,为基于零和博弈设计的优化辅助控制量,为关于以及一阶滤波器输出与虚待设计的虚拟控制量之间的误差的动态函数,为与高超声速飞行器姿态动力学模型状态无关的时变动态函数,,基于杨氏不等式,将简化:
其中,为姿态旋转矩阵的下范数界,为姿态旋转矩阵的上范数界,为第一未知的自适应参量,通过克服杨氏不等式放缩带来的控制量不连续问题,提高系统控制量的平滑性,为已知的动态函数;
步骤34:结合第一Lyapunov函数和Backatepping法,进行带有状态约束的高超声速飞行器姿态角控制策略设计:
其中,为设计的虚拟控制器增益,为第一正数控制参数,为第二正数控制参数,为对的估计误差,的估计值,对求导并结合步骤33中关于简化的不等式,对第一Lyapunov函数求导,实现高超声速飞行器在故障下的有界稳定:
其中,为正定的参数;
步骤35:根据步骤31的高超声速飞行器的姿态跟踪误差,得出姿态角速率的跟踪误差的动态方程:,其中,为3×3的转动惯量矩阵,为高超声速飞行器受到的偏心力矩部分失效故障,为执行器的卡死故障;为了采用反步法实现对姿态角速率的容错安全控制设计,引入变换,由于异常质心变动造成的系统转动惯量矩阵存在不确定性,结合自适应控制方法对动态方程中的不确定性进行参数化:
其中,为三维列向量,为3行6列的矩阵,,对于任意给定的三维列向量,变换表示为:,得出:,将结合自适应算法的少参数化方法,则映射为:
其中,为第二未知的自适应参量,为未知常数,为已知的基函数,
步骤36:根据带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,结合Lyaounov稳定性理论,建立第二Lyapunov函数,针对动态方程设计如下容错安全控制器
其中,为复合干扰量,由未知质心偏移量、执行器部分失效故障以及系统输入饱和约束构成,为容错安全控制器的增益,均为正定控制参量,控制量为为设计的基于Backstepping 的状态反馈控制量,为下一步设计的基于零和博弈的优化辅助补偿量,为自适应量的估计误差,为自适应量的估计值;
步骤37:结合设计的容错安全控制器与第二Lyapunov函数,对进行求导,实现高超声速飞行器在故障下的有界稳定:
其中,为第一待定正常数,为第二待定正常数,为已知且有界的正函数,为第三待定正常数。
步骤4:引入零和博弈性能指标,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,通过自适应动态规划优化补偿容错安全控制器,优化容错安全控制框架,实现飞行器在面对未知质心偏移量及执行器部分失效故障下的优化状态约束容错安全控制,保障飞行器的安全;具体包括如下子步骤:
步骤41:为了采用零和博弈理论使高超声速飞行器具有最优的控制性能,将飞行姿态角的跟踪误差和姿态角速率的跟踪误差整合为优化仿射非线性形式,形成控制变量与系统扰动量的零和博弈;所述优化仿射非线性形式为:
其中,为高超声速飞行器的飞行姿态的跟踪误差,为高超声速飞行器姿态动力学模型矩阵,, 为常系数矩阵,为基于零和博弈的优化控制补偿器,为控制变量,为容错安全控制器,为高超声速飞行器姿态动力学模型的扰动量,为待定的正常数,为近似函数,为了反应高超声速飞行器姿态动力学模型在满足状态约束中的优化控制目的,将高超声速飞行器的状态与约束边界的距离作为优化量,使其越大越好,即高超声速飞行器姿态动力学模型状态能够聚拢到约束域的中心区域,提高质心变动情况下的飞行器容错控制性能,故将该功能以零和博弈的方式展现出来,具体为:
其中,当高超声速飞行器的姿态角距离安全边界满足阈值约束时,,表明此时的控制效果较好,无需进行优化补偿控制;当时,表明高超声速飞行器的状态位于约束的安全区域内,但系统状态距离边界的距离太近了,需要进行优化补偿控制;当时,表明此时高超声速飞行器的状态越过了约束边界,需要给予控制压制,使其重新返回到约束域中。
步骤42:设计零和博弈目标函数,并通过哈密顿函数优化零和博弈目标函数,并基于达到纳什均衡时的最优容许控制得到最优控制对
本发明中零和博弈目标函数为:
其中,为正定惩罚项,优化控制效果,为第一正定矩阵,为第二正定矩阵,调节形成零和博弈权重,达到更好的控制效果;
所述哈密顿函数,且哈密顿函数满足:,其中,为零和博弈目标函数关于的梯度;基于达到纳什均衡时的最优容许控制对存在且唯一的假设,得:
具体地,最优控制对的求取过程为:
步骤421:由于最优的控制对无法直接获取,通过基于自适应动态规划的零和博弈值迭代求解方法,设计基于神经网络的估计器:
其中,为理想的神经网络权重,的范数边界,为神经网络的激活函数,为神经网络的估计误差;
步骤422:将神经网络的估计器进行梯度信息化:,并将最优控制对转化为:
首先,通过与梯度信息有关的HJB方程求得:
其中,为神经网络激活函数的梯度,为神经网络估计误差的梯度,为正定矩阵,为已知的正定矩阵,为未知且待定的负定矩阵,均为有界的正常数。
其次,求取过程为:定义的估计量,得,其中,的估计,得最优控制对的估计:
结合最优控制对的估计,构成如下的哈密顿函数误差:
并将哈密顿函数误差最小化:
得到的更新率为:
其中,为神经网络权重的学习率,为第一待定且时变的增益,为第三待定且时变的增益,为第二待定且时变的增益,分别为权重调节矩阵,为设计的二次型矩阵,为已知的分段函数,。在的更新律中,第一项起到梯度下降的作用,减小哈密顿误差;第二项为在学习过程中保证系统状态有界的附加项;第三项的设计用于整个系统的稳定性分析;此外,基于Lyapunov稳定性定理的设计过程保障了整个系统的稳定性。
本发明基于零和博弈的高超声速飞行器状态约束容错控制方法既能保证闭环系统中所有信号都有界,又能保证系统输出以最优的方式跟踪参考信号而不发生越界行为,及时出现了未知的质心偏移量,保障飞行器的安全。
实施例
本实施例将本发明基于零和博弈的高超声速飞行器状态约束容错控制方法进行仿真实验:
考虑带有质心偏移的高超声速飞行器姿态刚体模型为:
其中,,高超声速飞行器姿态动力学模型受到外部干扰为,高超声速飞行器的初始姿态角与姿态角速率为,控制的参考指令为:当;当。当时,高超声速飞行器的质心偏移量为
采用Matlab/Simulink仿真,在Matlab/Simulink中搭建飞行器系统模型及相应的质心变动模型,基于此,设计相应的自适应容错安全控制器,进而进行仿真验证。
按照上述设计的仿真条件对本发明基于零和博弈的高超声速飞行器状态约束容错控制方法进行仿真,可得受到质心未知量影响与安全状态约束的高超声速飞行器刚体姿态跟踪控制效果如图2所示,其中,图2中的(a)为高超声速飞行器随时间变化的攻角跟踪曲线,表示攻角指令,表示本发明状态约束容错控制的攻角跟踪曲线,表示对照组攻角跟踪曲线;图2中的(b)为高超声速飞行器随时间变化的俯仰角跟踪曲线,表示俯仰角指令,表示本发明状态约束容错控制的俯仰角跟踪曲线,表示对照组俯仰角跟踪曲线;图2中的(c)为高超声速飞行器随时间变化的滚转角跟踪曲线,表示滚转角,表示本发明状态约束容错控制的滚转角跟踪曲线,表示对照组滚转角跟踪曲线。由相应的参考姿态指令与实际的跟踪效果可知,分别与对应的重合,即使在时间时,出现了未知的质心偏移量,本发明所设计的约束容错控制方法仍然可以保持较好的姿态跟踪与保持效果;但从对照组来看,当发生未知质心偏移后,产生了异常的偏心力矩,当系统状态不受约束时,使得偏心力矩的影响呈叠加态势,直至在22s时,对照组中容错控制失效。综上,在本发明基于零和博弈的高超声速飞行器状态约束容错控制方法下,飞行器实现了面对未知质心偏移量时,系统的容错安全优化控制。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (9)

1.一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,具体包括如下步骤:
步骤1:根据高超声速飞行器的未知质心偏移量及飞行环境,建立含有质心偏移量的高超声速飞行器姿态动力学模型;
步骤2:根据步骤1建立的高超声速飞行器姿态动力学模型,引入时变高超声速飞行器状态安全约束函数;
步骤3:基于步骤2建立的时变高超声速飞行器状态安全约束函数,采用范数界的方法,将高超声速飞行器受到的偏心力矩与执行器部分失效故障通过自适应控制的方法输入到容错控制框架中,建立基于反步法的容错安全控制框架,设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,得到容错安全控制器,实现高超声速飞行器在故障下的有界稳定;
步骤4:引入零和博弈性能指标,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,通过自适应动态规划优化补偿容错安全控制器,优化容错安全控制框架,保障高超声速飞行器的安全。
2.根据权利要求1所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,所述含有质心偏移量的高超声速飞行器姿态动力学模型的建立过程为:
其中,为高超声速飞行器的飞行姿态角,为高超声速飞行器飞行姿态角中的滚转角,为高超声速飞行器飞行姿态角中的攻角,为高超声速飞行器飞行姿态角中的侧滑角,为姿态角速率,为高超声速飞行器的滚转角速度,为高超声速飞行器的俯仰角速度,为高超声速飞行器的偏航角速度,为姿态旋转矩阵,为角速度旋转矩阵,为未发生质心偏移时的高超声速飞行器姿态动力学模型的转动惯量,为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量,为未知的质心偏移量,为高超声速飞行器质心的在机体坐标系上未知偏离量的三个分量,为高超声速飞行器系统控制输入量,为质心偏移对高超声速飞行器带来的偏心力矩,为控制输入旋转矩阵,分别为高超声速飞行器系统控制输入量在机体坐标系上的三个分量,为高超声速飞行器姿态动力学模型受到的外部有界干扰。
3.根据权利要求2所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,所述高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量表示为:
其中,为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内并平行与高超声速飞行器的设计轴线方向偏移量,为高超声速飞行器的质量;为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在垂直于高超声速飞行器对称平面指向高超声速飞行器右方的偏移量,为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内与轴垂直并指向高超声速飞行器下方的偏移量,为高超声速飞行器姿态动力学模型发生质心偏移引起的在轴与轴耦合的惯量积,为高超声速飞行器姿态动力学模型发生质心偏移引起的在轴与轴耦合的惯量积,为高超声速飞行器姿态动力学模型发生质心偏移引起的在轴与轴耦合的惯量积,
4.根据权利要求2所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,所述时变高超声速飞行器状态安全约束函数的建立过程为:
其中,为时变高超声速飞行器的姿态状态约束边界。
5.根据权利要求4所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,根据时变高超声速飞行器状态安全约束函数形成的高超声速飞行器的飞行姿态角的安全约束区域,当高超声速飞行器未发生质心偏移时,扩大所述高超声速飞行器的飞行姿态角的安全约束区域至所述高超声速飞行器的整个飞行包线;当高超声速飞行器发生未知质心变动时,缩小所述高超声速飞行器的姿态状态约束边界,将所述高超声速飞行器的飞行姿态角约束在安全约束区域内。
6.根据权利要求4所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,步骤3包括如下子步骤:
步骤31:根据步骤2建立的时变高超声速飞行器状态安全约束函数,引入高超声速飞行器的姿态跟踪误差,包括:飞行姿态角的跟踪误差和姿态角速率的跟踪误差
其中,为引入时变高超声速飞行器状态安全约束函数,为满足状态安全约束函数的期望姿态角指令,为由飞行任务目标制定的期望姿态角度,为由飞行任务目标制定的期望姿态角速率;
步骤32:将步骤31中的飞行姿态角跟踪误差关于时间求导,得:
其中,为与高速飞行器姿态相关的时变参数,为与高超声速飞行器姿态状态约束函数相关的时变参数,为含有质心偏移量的高超声速飞行器姿态动力学模型的不确定分配矩阵,为与高超声速飞行器期望姿态相关的时变函数,为与高超声速飞行器姿态状态约束函数相关的时变函数,
步骤33:引入一阶滤波器,将姿态角速率转换成:
其中,为一阶滤波器的输出,为待设计的虚拟控制量,为设计的状态反馈控制量,为基于零和博弈设计的优化辅助控制量,为关于以及一阶滤波器输出与虚待设计的虚拟控制量之间的误差的动态函数,为与高超声速飞行器姿态动力学模型状态无关的时变动态函数,,基于杨氏不等式,将简化:
其中,为姿态旋转矩阵的下范数界,为姿态旋转矩阵的上范数界,为第一未知的自适应参量,为已知的动态函数;
步骤34:结合第一Lyapunov函数和Backatepping法,进行带有状态约束的高超声速飞行器姿态角控制策略设计:
其中,为设计的虚拟控制器增益,为第一正数控制参数,为第二正数控制参数,为对的估计误差,的估计值,对求导并结合步骤33中关于简化的不等式,对第一Lyapunov函数求导,实现高超声速飞行器在故障下的有界稳定:
其中,为正定的参数;
步骤35:根据步骤31的高超声速飞行器的姿态跟踪误差,得出姿态角速率的跟踪误差的动态方程:,其中,为3×3的转动惯量矩阵,为高超声速飞行器受到的偏心力矩部分失效故障,为执行器的卡死故障;引入变换,并结合自适应控制方法对动态方程中的不确定性进行参数化:
其中,为三维列向量,为3行6列的矩阵,,对于任意给定的三维列向量,变换表示为:,得出:,将结合自适应算法的少参数化方法,则映射为:
其中,为第二未知的自适应参量,为未知常数,为已知的基函数,
步骤36:根据带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,结合Lyaounov稳定性理论,建立第二Lyapunov函数,针对动态方程设计如下容错安全控制器
其中,为复合干扰量,为容错安全控制器的增益,均为正定控制参量,为自适应量的估计误差,为自适应量的估计值;
步骤37:结合设计的容错安全控制器与第二Lyapunov函数,对进行求导,实现高超声速飞行器在故障下的有界稳定:
其中,为第一待定正常数,为第二待定正常数,为已知且有界的正函数,为第三待定正常数。
7.根据权利要求6所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,步骤4包括如下子步骤:
步骤41:将飞行姿态角的跟踪误差和姿态角速率的跟踪误差整合为优化仿射非线性形式,形成控制变量与系统扰动量的零和博弈;所述优化仿射非线性形式为:
其中,为高超声速飞行器的飞行姿态的跟踪误差,为高超声速飞行器姿态动力学模型矩阵,, 为常系数矩阵,为基于零和博弈的优化控制补偿器,为控制变量,为容错安全控制器,为高超声速飞行器姿态动力学模型的扰动量,为待定的正常数,为近似函数;
步骤42:设计零和博弈目标函数,并通过哈密顿函数优化零和博弈目标函数,并基于达到纳什均衡时的最优容许控制得到最优控制对
所述零和博弈目标函数为:
其中,为正定惩罚项,为第一正定矩阵,为第二正定矩阵,调节形成零和博弈权重;
所述哈密顿函数,且哈密顿函数满足:,其中,为零和博弈目标函数关于的梯度;
所述
8.根据权利要求7所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,步骤42中所述最优控制对的求取过程为:
步骤421:通过基于自适应动态规划的零和博弈值迭代求解方法,设计基于神经网络的估计器:
其中,为理想的神经网络权重,的范数边界,为神经网络的激活函数,为神经网络的估计误差;
步骤422:将神经网络的估计器进行梯度信息化:,并将最优控制对转化为:
其中,通过与梯度信息有关的HJB方程求得:
其中,为神经网络激活函数的梯度,为神经网络估计误差的梯度,为正定矩阵,为已知的正定矩阵,为未知且待定的负定矩阵,均为有界的正常数。
9.根据权利要求8所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,步骤422中的求取过程为:定义的估计量,得,其中,的估计,得最优控制对的估计:
结合最优控制对的估计,构成如下的哈密顿函数误差:
并将哈密顿函数误差最小化:
得到的更新率为:
其中,为神经网络权重的学习率,为第一待定且时变的增益,为第三待定且时变的增益,为第二待定且时变的增益,分别为权重调节矩阵,为设计的二次型矩阵,为已知的分段函数,
CN202310302104.7A 2023-03-27 2023-03-27 一种基于零和博弈的高超声速飞行器状态约束容错控制方法 Active CN116009594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310302104.7A CN116009594B (zh) 2023-03-27 2023-03-27 一种基于零和博弈的高超声速飞行器状态约束容错控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310302104.7A CN116009594B (zh) 2023-03-27 2023-03-27 一种基于零和博弈的高超声速飞行器状态约束容错控制方法

Publications (2)

Publication Number Publication Date
CN116009594A true CN116009594A (zh) 2023-04-25
CN116009594B CN116009594B (zh) 2023-06-02

Family

ID=86027077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310302104.7A Active CN116009594B (zh) 2023-03-27 2023-03-27 一种基于零和博弈的高超声速飞行器状态约束容错控制方法

Country Status (1)

Country Link
CN (1) CN116009594B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117130277A (zh) * 2023-09-13 2023-11-28 中国矿业大学 基于安全强化学习的高超声速飞行器零和博弈方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120177135A1 (en) * 2010-06-04 2012-07-12 The Mathworks, Inc. Interactive control of multiple input multiple output control structures
CN107450324A (zh) * 2017-09-05 2017-12-08 西北工业大学 考虑攻角约束的高超声速飞行器自适应容错控制方法
US20180052453A1 (en) * 2016-08-16 2018-02-22 Fts Computertechnik Gmbh Fault-tolerant method and device for controlling an autonomous technical system through diversified trajectory planning
CN110376902A (zh) * 2019-08-19 2019-10-25 合肥工业大学 一种欠驱动机械系统伺服约束跟踪控制器的设计方法
US20200326672A1 (en) * 2019-01-10 2020-10-15 Dalian University Of Technology Interval error observer-based aircraft engine active fault tolerant control method
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法
CN113885548A (zh) * 2021-10-28 2022-01-04 南京邮电大学 一种多四旋翼无人机输出约束状态一致博弈控制器
CN114608583A (zh) * 2022-03-18 2022-06-10 北京航空航天大学 一种高超声速飞行器动态杆臂效应智能补偿方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120177135A1 (en) * 2010-06-04 2012-07-12 The Mathworks, Inc. Interactive control of multiple input multiple output control structures
US20180052453A1 (en) * 2016-08-16 2018-02-22 Fts Computertechnik Gmbh Fault-tolerant method and device for controlling an autonomous technical system through diversified trajectory planning
CN107450324A (zh) * 2017-09-05 2017-12-08 西北工业大学 考虑攻角约束的高超声速飞行器自适应容错控制方法
US20200326672A1 (en) * 2019-01-10 2020-10-15 Dalian University Of Technology Interval error observer-based aircraft engine active fault tolerant control method
CN110376902A (zh) * 2019-08-19 2019-10-25 合肥工业大学 一种欠驱动机械系统伺服约束跟踪控制器的设计方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法
CN113885548A (zh) * 2021-10-28 2022-01-04 南京邮电大学 一种多四旋翼无人机输出约束状态一致博弈控制器
CN114608583A (zh) * 2022-03-18 2022-06-10 北京航空航天大学 一种高超声速飞行器动态杆臂效应智能补偿方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
WENJING REN等: "Fault-tolerant Control of Linear Singularly Perturbed Systems with Applications to Hypersonic Vehicles", 《INTERNATIONAL FEDERATION OF AUTOMATIC CONTROL》, pages 268 - 273 *
YIZHENMENG等: "Adaptive fault-tolerant attitude tracking control of hypersonic vehicle subject to unexpected centroid-shift and state constraints", 《AEROSPACESCIENCEANDTECHNOLOGY》, pages 1 - 13 *
李广剑;何广军;吴亚晖;李兴格;: "无虚拟控制律的高超声速飞行器新型模糊控制", 航天控制, no. 04, pages 41 - 49 *
杨博等;: "盲目反卷积算法在高超流场星图复原中的应用", 红外与激光工程, no. 08, pages 2231 - 2237 *
高振刚;陈无畏;任春;曹宇;: "考虑作动器故障分级的汽车SASS与LKAS集成容错控制策略", 机械设计, no. 04, pages 116 - 124 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117130277A (zh) * 2023-09-13 2023-11-28 中国矿业大学 基于安全强化学习的高超声速飞行器零和博弈方法
CN117130277B (zh) * 2023-09-13 2024-05-10 中国矿业大学 基于安全强化学习的高超声速飞行器零和博弈方法

Also Published As

Publication number Publication date
CN116009594B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
Tang et al. An integral TSMC-based adaptive fault-tolerant control for quadrotor with external disturbances and parametric uncertainties
CN110347170B (zh) 可重复使用运载器再入段鲁棒容错制导控制系统及工作方法
Yogi et al. Adaptive integral sliding mode control using fully connected recurrent neural network for position and attitude control of quadrotor
CN109062042B (zh) 一种旋翼飞行器的有限时间航迹跟踪控制方法
Lai et al. Adaptive position/attitude tracking control of aerial robot with unknown inertial matrix based on a new robust neural identifier
CN108594837A (zh) 基于pd-smc和rise的无模型四旋翼无人机轨迹跟踪控制器及方法
CN109507890A (zh) 一种基于eso的无人机动态逆广义预测控制器
CN116009594B (zh) 一种基于零和博弈的高超声速飞行器状态约束容错控制方法
CN111290278B (zh) 一种基于预测滑模的高超声速飞行器鲁棒姿态控制方法
CN112660423A (zh) 一种视频卫星对运动目标的凝视跟踪控制方法及系统
Yan et al. Adaptive tracking flight control for unmanned autonomous helicopter with full state constraints and actuator faults
CN113128035A (zh) 民用飞机飞控传感器信号重构容错控制方法
Shen et al. Trajectory tracking active disturbance rejection control of the unmanned helicopter and its parameters tuning
CN108427428A (zh) 基于改进迭代算法的自适应滑模变结构航天器姿态控制方法
CN113777932B (zh) 一种基于Delta算子的四旋翼自适应滑模容错控制方法
CN103455035B (zh) 基于反步设计和非线性反馈的pd+姿态控制律设计方法
Chen et al. Decentralized h PID team formation tracking control of large-scale quadrotor UAVs under external disturbance and vortex coupling
CN117250867B (zh) 一种多模式垂直起降飞行器自愈控制方法
CN111439392A (zh) 一种航天器编队位置协同控制方法
CN104460678B (zh) 一种基于Sigmoid型非线性滑模函数的航天器姿态控制方法
CN112130584B (zh) 基于命令滤波的四旋翼飞行器有限时间自适应控制方法
Zou et al. Singularity-free backstepping controller for model helicopters
Guo et al. Design of a Fixed‐Wing UAV Controller Combined Fuzzy Adaptive Method and Sliding Mode Control
Ma et al. Finite-time trajectory tracking control of quadrotor UAV via adaptive RBF neural network with lumped uncertainties
Ning et al. BLS-based adaptive fault tolerant control for a class of space unmanned systems with time-varying state constraints and input nonlinearities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant