CN105372994A - 一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法 - Google Patents

一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法 Download PDF

Info

Publication number
CN105372994A
CN105372994A CN201510924681.5A CN201510924681A CN105372994A CN 105372994 A CN105372994 A CN 105372994A CN 201510924681 A CN201510924681 A CN 201510924681A CN 105372994 A CN105372994 A CN 105372994A
Authority
CN
China
Prior art keywords
moment
noise
pilot
vector
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510924681.5A
Other languages
English (en)
Other versions
CN105372994B (zh
Inventor
刘嘉
向锦武
张颖
孙阳
宋伟健
宋岩
周强
贾慧
赵志坚
肖楚琬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naval Aeronautical Engineering Institute of PLA
Original Assignee
Naval Aeronautical Engineering Institute of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naval Aeronautical Engineering Institute of PLA filed Critical Naval Aeronautical Engineering Institute of PLA
Priority to CN201510924681.5A priority Critical patent/CN105372994B/zh
Publication of CN105372994A publication Critical patent/CN105372994A/zh
Application granted granted Critical
Publication of CN105372994B publication Critical patent/CN105372994B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法,所述方法包括构建ROCM模型增广被控对象、确定ROCM模型指标函数和模型参数、计算飞行员最优控制增益、控制方程离散化,鲁棒自适应状态估计、未建模动态估计、修正飞行员最优控制增益,求解飞行员操纵向量。本发明结合人类记忆有限性特点和高度自适应特点,采用改进的操纵噪声和观测噪声模型,引入鲁棒自适应滤波理论,克服了传统飞行员模型缺点,可以体现人类的记忆有限性、未知环境适应性、操纵行为鲁棒性以及耦合操纵等特点。

Description

一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法
技术领域
本发明涉及一种在未知环境扰动下,飞行器动态特性发生变化时,描述飞行员操纵行为的方法。
背景技术
目前工程领域中飞机驾驶员模型包括McRuer模型、最优控制模型、驾驶员结构模型、神经网络模型等等。其中McRuer模型、驾驶员结构模型为单通道模型,进行耦合操纵描述需要采用解耦处理;神经网络模型面临着知识经验与在线学习矛盾,飞机动态特性发生变化时,可能引起原有映射结构破坏;最优控制模型(以下简称OCM)虽可以进行耦合操纵分析,但其以Kalman滤波器进行状态估计,没有体现人类在未知环境下的渐进适应过程;以给定信噪比,迭代求解噪声方差,相当于飞行员根据还未发生的未来评估噪声特性,这与飞行员的实际思维过程和驾驶行为存在一定矛盾,此外这一模型在飞机动态特性发生变化时无法应用,鲁棒性较差。因此,现有工程领域飞行员模型并不适用于分析未知环境扰动下,飞机动态特性发生变化时飞行员的耦合操纵行为。
综上,有必要提供一种创新且富进步性的飞机驾驶员(也称飞行员)行为描述方法,解决未知环境下,飞机动态特性发生变化时飞行员行为描述问题。
发明内容
本发明针对现有飞行员模型不足,结合人类记忆有限性特点和高度自适应特点,采用改进的操纵噪声和观测噪声模型,引入鲁棒自适应滤波理论,提出了基于鲁棒自适应最优控制的飞行员操纵行为描述方法。这一方法克服了传统飞行员模型缺点,可以体现人类的记忆有限性、未知环境适应性、操纵行为鲁棒性以及耦合操纵等特点。
本发明提供的基于鲁棒自适应最优控制的飞行员操纵行为描述方法,引入鲁棒自适应状态估计理论和改进噪声模型对传统OCM模型进行修正,发展一种描述未知环境下,具有鲁棒性的飞行员耦合操纵行为描述方法(以下简称ROCM)。具体包括如下步骤:
步骤一,构建ROCM模型增广被控对象;
步骤二,确定ROCM模型指标函数和模型参数;
步骤三,计算飞行员最优控制增益;
步骤四,控制方程离散化,鲁棒自适应状态估计;
步骤五,未建模动态估计;
步骤六,修正飞行员最优控制增益,求解飞行员操纵向量。
本发明的优点在于:
(1)反映了人类的记忆特点。本发明不再需要迭代计算求解操纵噪声和观测噪声。对于当前时刻的操纵噪声和观测噪声将其改进为只与过去一段时间的操纵历史有关;
(2)反映了人类的未知环境自适应特点。本发明采用自适应滤波理论描述人类估计过程可以描述飞行员在未知环境下的驾驶行为。
(3)反映了人类操纵行为鲁棒性。当飞机动态特性在一定范围内发生变化时,飞行员仍可以进行飞机操纵。
附图说明
图1为ROCM模型原理框图;
图2为本发明的基于鲁棒自适应最优控制的飞行员操纵行为描述方法流程图;
图3为实施例一ROCM模型与OCM模型驾驶杆操纵量;
图4为实施例一ROCM模型与OCM模型飞行姿态跟踪效果图;
图5为实施例一ROCM及OCM仿真幅频特性与飞行试验比较图;
图6为实施例一ROCM及OCM仿真相频特性与飞行试验比较图;
图7为实施例二,存在未建模动态和未知扰动时,ROCM及OCM飞行姿态跟踪效果图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
如图1所示,本发明首先提供一种自适应最优控制飞行员模型,简称ROCM模型,飞行器的操纵过程是一个人机交互的循环过程。飞行员不断根据飞行器响应进行判断并对飞行器加以操纵,这一操纵使飞行状态改变,进而形成人机闭环操纵,飞行员驾驶飞行器完成指定任务。图1虚框内所示即为本发明中自适应最优控制飞行员模型结构,具体包括鲁棒自适应状态估计模块、最优控制增益模块、神经动力延迟模块和有效操纵延迟模块。观测噪声反映了飞行员对仪表和飞行状态感知的误差,结合状态输出y在鲁棒自适应状态估计模块进行状态估计得到状态估计值鲁棒自适应状态估计模块反映了人类对外界判断和飞行状态的估计过程,这一过程带有自适应和鲁棒性特点;最优控制增益模块根据状态估计值计算理想飞行员指令uc,反映了人类操纵的最优行为属性;神经动力延迟模块反映了人的神经肌肉传导时间延迟,结合理想飞行员指令uc和操纵噪声vu得到神经肌动力迟后操纵量up,操纵噪声反映了人类驾驶行为和运动行为与大脑理想信号之间的差异;有效操纵延迟模块输出有效延迟后飞行员操纵量ud,反映了大脑接受信号、处理信息和反映过程等其它延迟时间。
根据所述的ROCM模型,本发明提供的一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法,如图2所示,具体步骤如下:
步骤一,构建形如下式的增广被控对象:
x · s = A s x s + B s u p + E s w y = C s x s + D s u p - - - ( 1 )
其中, A s = A BC d 0 A d , B s = B B d , E s = E 0 , Cs=[CDCd],Cs=[CDCd],Ds=D, x s = x x d . x为飞行器运动状态向量,xd为带有时间延迟的状态向量,xs为带有延迟的增广状态向量,为带有延迟的增广状态向量时间导数,Ad、Bd、Cd分别为带有时间延迟的系数矩阵。A、B、C、D分别为飞行器小扰动方程系数矩阵,E为外界扰动系数矩阵,w为外界扰动向量,up为神经肌动力迟后操纵量,y为输出状态向量。
飞行员实际观测向量yobs为:
yobs=Csxs+Dsup+vy(2)
其中,vy是与近期观测历史有关的观测噪声,近期观测历史可以依据人类短期记忆模式和认知规律选取,本发明暂取值5s。观测噪声采用高斯白噪声建模。第i个观测通道的噪声强度为:
V y i = πρ y i σ y i 2 f y i - - - ( 3 )
其中,是第i个观测通道感知分量信噪比,典型单轴跟踪任务通常取0.01,对应信噪比为-20dB,是第i个观测通道注意力分配系数。是第i个观测通道的观测噪声方差,假设各观测通道相互独立,则观测噪声协方差阵Vy为:
V y = d i a g ( V y i ) - - - ( 4 )
其中diag是对角阵构建符号。
本发明以近期观测历史tp内的观测量统计值为基础进行观测噪声方差计算。
σ y i 2 = var ( [ y i .1 , y i .2 , ... , y i . t p ] ) - - - ( 5 )
其中,var是方差求解计算符号,下标1,2,…,tp表示近期观测历史采样时间点,yi,tp表示在采样点tp的第i个观测通道的观测噪声的观测值。
步骤二,根据飞行任务,构建ROCM模型指标函数,确定ROCM模型参数。采用二次指标函数形式确定指标函数如下:
J p = E ∞ { y T Q y y + u p T r u u p + u · p T f u · p } - - - ( 6 )
其中,E表征了指标函数稳态期望值,Qy≥0,ru≥0,f≥0分别是指标函数的观测向量加权矩阵、操纵分配加权矩阵和操纵速率加权矩阵,它们反映了飞行员对信息观察、油门杆、驾驶杆、操纵速率等不同驾驶要素的重视程度。其中,f的选择依赖于给定的神经动力延迟常数矩阵Tn。假设各操纵通道独立,则Tn=diag(tni),其中tni为第i个操纵通道神经动力延迟时间常数。其它需要使用的ROCM模型参数还包括观测噪声信噪比、操纵噪声信噪比、有效延迟时间等,参数取值根据指标函数和飞行员生理参数确定。单通道ROCM模型参数如表1所示,多通道问题可参照单通道参数耦合选取。
表1ROCM模型参数
步骤三,计算飞行员最优控制增益。
可以通过最优控制理论得到控制关系为:
u · p * = - G p X ^ = - [ G n , G n 1 ] X ^ = - f - 1 ( B o ) T K X ^ - - - ( 7 )
其中,为飞行员最优控制操纵量,是X的估计值,X是带有控制速率的增广状态向量,表达式为X=[xxdup]T,Gp为飞行员最优控制反馈增益向量,Bo为带有控制速率的增广操纵系数矩阵,K是由下列Riccati方程确定的唯一解:
0=(Ao)TK+KAo+Qo-KBof-1(Bo)TK(8)
其中,Ao为带有控制速率的增广动力学系数矩阵,Qo为带有控制速率的增广加权矩阵,
Q o = ( C s ) T Q y C s ( C s ) T Q y D s ( D s ) T Q y C s ( D s ) T Q y D s + r u - - - ( 9 )
将XT=[xsup]T=[xxdup]T代入(7)式,则
u · p * = - G n x ^ s - G n 1 u p * - - - ( 10 )
其中Gn是调节器增益向量,Gn1的增益向量。令,
T n = G n 1 - 1 - - - ( 11 )
G n 1 - 1 G n = I p - - - ( 12 )
Ip即为飞行员最优控制增益。因此,(10)式可写为:
T n u · p * + I p x ^ s + u p * = 0 - - - ( 13 )
令理想状态飞行员操纵指令引入操纵噪声vu,则操纵向量状态方程如下:
u · p * = - T n - 1 u p * + T n - 1 u c + T n - 1 v u - - - ( 14 )
其中vu是强度为Vu的零均值高斯白噪声,也称操纵噪声。每个操纵通道i的操纵噪声强度为:
V u i = πf u i ρ u i σ u i 2 , i = 1 , 2 , ... n u - - - ( 15 )
其中是第i个操纵通道信噪比,典型跟踪任务取值0.003;是操纵注意分配系数,为常数;是操纵噪声方差,取近期操纵历史tp内的统计方差作为操纵噪声方差,则,
σ u i 2 = var ( [ u c i .1 , u c i .2 , ... , u c i . t p ] ) - - - ( 16 )
其中,下标1,2,…,tp表示近期历史采样时间点,uci表示第i个操纵通道理想飞行员指令。假设各通道独立,则当前时刻操纵噪声强度为,
V u = d i a g ( V u i ) - - - ( 17 )
步骤四,控制方程离散化及鲁棒自适应状态估计。
为求解(13)式微分方程,需要求得状态向量xs的估计值本发明采用时变噪声自适应滤波器进行状态估计,首先将方程(1)、方程(14)离散化如下:
u p * ( k ) = - Φ u u p * ( k - 1 ) + B u d i s u c ( k - 1 ) + E u d i s v u ( k - 1 ) - - - ( 19 )
其中H、Bdis、Ddis是状态转移矩阵,Edis是扰动向量离散系数矩阵,w是外界扰动向量,vy是观测噪声向量,Фu和Budis是操纵向量状态方程离散系数矩阵,Eudis是操纵噪声离散系数矩阵,vu是操纵噪声。公式中的k和k-1分别表示离散k时刻和k-1时刻。此时,引入时变噪声估值器如下:
q ^ ( k ) = q ^ ( k - 1 ) + d k - 1 Q ^ ( k - 1 ) D ( k ) ϵ ( k ) - - - ( 20 )
Q ^ ( k ) = Q ^ ( k - 1 ) + d k - 1 Q ^ ( k - 1 ) D ( k ) [ ϵ ( k ) ϵ T ( k ) - H ( k ) P ( k | k - 1 ) H T ( k ) - R ^ ( k - 1 ) ] D T ( k ) Q ^ ( k - 1 ) - - - ( 21 )
r ^ ( k ) = ( 1 - d k - 1 ) r ^ ( k - 1 ) + d k - 1 [ y o b s ( k ) - H ( k ) x s ( k | k - 1 ) - D d i s u p ( k ) ] - - - ( 22 )
R ^ ( k ) = ( 1 - d k - 1 ) R ^ ( k - 1 ) + d k - 1 { [ I - H ( k ) K ( k ) ] ϵ ( k ) ϵ T ( k ) × [ I - H ( k ) K ( k ) ] T + H ( k ) P ( k | k ) H T ( k ) } - - - ( 23 )
其中,是k时刻扰动噪声均值估计,是k-1时刻扰动噪声均值估计,是k时刻扰动噪声协方差估计,是k-1时刻扰动噪声协方差估计,ε(k)是k时刻新息,P(k|k)是纳入新息后,通过k及之前时刻预报的误差方差阵,P(k|k-1)是通过k-1及之前时刻预报的k时刻误差方差阵,是k-1时刻观察噪声协方差估计,是k时刻观察噪声协方差估计,是k时刻观察噪声均值估计,是k-1时刻观察噪声均值估计,yobs(k)是k时刻飞行员观测向量,是通过k-1及之前时刻对状态向量xs在k时刻的估计值,K(k)是k时刻滤波增益。dk-1是渐进遗忘系数,dk-1=(1-b)/(1-bk),它的数值随着仿真时刻k的变化而变化,其中,0<b<1,b为遗忘因子,D(k)是k时刻递推算子,表达式如下:
D ( k ) = E d i s T H T ( k ) &lsqb; H ( k ) P ( k | k - 1 ) H T ( k ) + R ( k - 1 ) &rsqb; - 1 - - - ( 24 )
引入改进的鲁棒自适应滤波器为:
&epsiv; ( k ) = y o b s ( k ) - H ( k ) x ^ s ( k | k - 1 ) - D d i s u p ( k ) - r ^ ( k - 1 ) - - - ( 27 )
K ( k ) = P ( k | k - 1 ) H T ( k ) &times; &lsqb; H ( k ) P ( k | k - 1 ) H T ( k ) + R ^ ( k - 1 ) &rsqb; - 1 - - - ( 28 )
P(k|k)=[In-K(k)H(k)]P(k|k-1)(29)
x ^ s ( k | k ) = x ^ s ( k | k - 1 ) + K ( k ) &epsiv; ( k ) - - - ( 30 )
其中,是纳入新息后,通过k-1及之前时刻估计值对状态向量在k-1时刻的估计值;是纳入新息后,通过k及之前时刻估计值对状态向量在k时刻的估计值;up(k-1)是k-1时刻飞行员操纵量;P(k-1|k-1)是通过k-1及之前时刻预报的k-1时刻误差方差阵,yobs(k)是k时刻观察向量真实值,In是n阶单位阵。
步骤五,未建模动态估计。可以假设所有未建模动态产生的动态响应等效于完全由系数矩阵和H产生,由此可以得到未建模动态估计。
&Delta; H ( k ) = y o b s ( k ) - D d i s u p ( k ) + v y ( k ) x ^ s ( k - 1 | k - 1 ) - H ( k - 1 ) - - - ( 32 )
由于飞行器动态特性可以假设为在有限区间内连续或间断变化,因此可以用k时刻估计的未建模动态估计和ΔH(k)进行k+1时刻最优控制增益计算。
步骤六,修正最优控制增益,求解飞行员操纵向量,人机系统时域仿真。在这一步中,需要根据未建模动态对被控对象进行修正,重新计算最优控制增益作为下一时刻操纵输入到被控飞行器。同时在这一步中根据之前求解得到的飞行员操纵向量可以进行人机系统闭环仿真,得到飞机动态响应。
综上,得到了未知环境扰动下、飞行器存在未建模动态时飞行员操纵行为描述方法,可用于飞行员操纵行为预测和人机系统动态仿真。
实施例
下面通过两则实施例说明本发明模型准确性及优越性。实施例一通过对比飞行试验数据证明了本发明在描述飞行员行为频域特性时的准确性。实施例二对比OCM模型证明了存在未建模动态和未知环境扰动下本发明的适用性。
(1)实施例一
在本实施例中分别采用ROCM模型和OCM模型,按照实际飞行试验条件,模拟飞行员操纵进行飞机俯仰姿态跟踪,对飞行试验进行仿真再现。首先得到人机闭环时域响应,而后将时域响应转化为频域特性并与试验数据比较,最终证明本发明模型准确性。实施过程简述如下。
试验飞行器俯仰轴传递函数为:
&theta; &delta; e s = 8 &CenterDot; 70 2 s 2 + 2 &times; 0.7 &times; 70 + 4900 &CenterDot; 5.5 ( s + 1.8 ) e - 0.04 s s &lsqb; s 2 + 2 &times; 0.7 &times; 6 + 36 &rsqb; - - - ( 33 )
其中,θ为飞行器俯仰姿态角,δes为驾驶杆操纵量,s是拉式变换复变量,e是指数表达式,跟踪任务指令采用白噪声建模,驱动指令函数为:
&theta; c w = 2 6.25 s 2 + 3.54 s + 1 - - - ( 34 )
其中w为白噪声,也称外界扰动噪声。
将俯仰轴传递函数转化为状态空间形式:
x &CenterDot; &theta; = A &theta; x &theta; + B &theta; &delta; e s &theta; = C &theta; x &theta; + D &theta; &delta; e s - - - ( 35 )
其中,xθ是俯仰姿态状态方程状态向量,是俯仰姿态状态方程状态向量时间导数,Aθ,Bθ,Cθ,Dθ分别是俯仰状态方程系数矩阵,θ是飞行器俯仰姿态角。将任务指令转化为状态空间形式:
x &CenterDot; c = A c x c + B c w &theta; c = C c x c + D c w - - - ( 36 )
其中,xc是指令状态方程状态向量,是指令状态方程状态向量时间导数,Ac,Bc,Cc,Dc分别是指令状态方程系数矩阵,w是白噪声,θc是俯仰指令姿态角。跟踪误差e:
e=θ-θc=Cθxθ+Dθδes-Ccxc+Dcw(37)
将(34-36)联立得到如下方程:
x &CenterDot; &theta; x &CenterDot; c = A &theta; 0 0 A c x &theta; x c + B &theta; 0 &delta; e s + 0 B c w y = C &theta; C c x &theta; x c + D &theta; &delta; e s - D c w - - - ( 38 )
经计算Dc=0,由此(38)式转化为标准状态方程如式(39)所示,即:
x &CenterDot; = A x + B &delta; + E w y = C x + D &delta; - - - ( 39 )
其中,x=[xθ,xc]T是标准状态方程状态向量,是标准状态方程状态向量时间导数,A、B、C、D分别为标准状态方程系数矩阵,A=diag(Aθ,Ac),B=diag(Bθ,0),C=diag(Cθ,Cc),D=Dθ,E是扰动系数矩阵,E=[0,Bc]T。得到标准状态方程后,引入延迟时间,可以将(39)式转化为方程(1)形式,进而可以采用本发明算法流程加以计算。
假设飞行员对飞行器姿态观察和操纵行为投入精力相同,则可取人机系统指标函数为:
J = E &infin; { e 2 + &delta; e s 2 + f &delta; &CenterDot; e s 2 } - - - ( 40 )
上式(40)中e为跟踪误差。由于本实施例是单通道任务,因此指标函数加权矩阵即为加权系数,得到ROCM模型指标函数加权系数分别为Qy=1,ru=1;按照参试飞行员生理条件选取相关参数,延迟时间为0.25s,神经动力时间延迟为0.08s,观测噪声信噪比和操纵噪声信噪比分别为-20dB和-25dB。故确定飞行员模型参数如下表2所示:
表2飞行员模型参数
而后,按附图2流程,进行人机闭环飞行仿真和飞行试验再现。经计算得到ROCM模型和OCM模型相关矩阵参数如表3所示。
表3飞行员模型计算结果
通过仿真,得到ROCM和OCM两种模型下的驾驶杆操纵位移δes和飞机俯仰角响应θ。附图3比较了两种模型在任务驱动函数下的驾驶杆操纵量,附图4比较了在任务指令下,ROCM模型和OCM模型的姿态跟踪效果,由图4可见,OCM跟踪误差明显大于ROCM模型。得到时域响应后,以δes为输入,θ为输出,按照采样间隔0.01s,采用频谱分析方法进行系统辨识,得到两种模型幅频和相频特性,与试验结果对比如图5~6所示。
由附图5可见,本文ROCM模型和OCM模型在幅频特性趋势上均与试验数据吻合,但在峰值响应频率上仍存在一定误差。由附图6可见,原始OCM模型在频率大于10rad/s后,相位误差明显增大,相比之下,本发明ROCM模型与试验数据更为吻合。综上,本发明模型仿真结果与试验是吻合的,可以认为本发明模型是正确的。同时,结果表明,相比于OCM模型,本发明ROCM模型更符合实际飞行员响应特性。
(2)实施例二
在本则实施例中,以实施例一为基础,引入未建模动态和未知环境扰动如下:
&theta; &delta; e s = 8 &CenterDot; 70 2 s 2 + 2 &times; ( 0.7 + &Delta; &xi; ) &times; 70 + 4900 &CenterDot; 5.5 ( s + 1.8 ) e ( - 0.04 + &Delta;&tau; D ) s s &lsqb; s 2 + 2 &times; ( 0.7 + &Delta; &xi; ) &times; 6 + 36 &rsqb;
&theta; d i s t u r b a n c e w = 2 6.25 s 2 + 3.54 s + 1
其中ΔτD、Δξ为未建模动态,它们表征了飞机系统延迟时间和短周期阻尼比变化情况。θdisturbance为未知扰动,采用白噪声建模。上述参数按表4取值,构建本实施例未建模动态和未知扰动。
表4未建模动态和未知扰动参数
按照本发明实施步骤,进行飞行员操纵预测和姿态跟踪,如果在未建模动态和未知扰动下,本发明依旧可以进行姿态跟踪,则证明了本发明具有鲁棒性和自适应特点。仿真比较存在未建模动态和未知扰动时,本发明ROCM模型和传统OCM模型姿态跟踪对比如图7所示。由图7显然可见,存在未建模动态和未知扰动时,本发明跟踪误差远小于传统OCM模型,可以进行飞行器姿态跟踪。因此本发明可以反映飞行员驾驶行为中的鲁棒性和环境自适应性。综上,本发明可用于分析未知环境扰动下,飞行器动态特性发生变化时飞行员的耦合操纵行为。

Claims (4)

1.一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法,其特征在于:
步骤一,构建ROCM模型增广被控对象;
x &CenterDot; s = A s x s + B s u p + E s w y = C s x s + D s u p - - - ( 1 )
其中, A s = A BC d 0 A d , B s = B B d , E s = E 0 , Cs=[CDCd],Cs=[CDCd],Ds=D, x s = x x d ; x为飞行器运动状态向量,xd为带有时间延迟的状态向量,xs为带有延迟的增广状态向量,为带有延迟的增广状态向量时间导数,Ad、Bd、Cd分别为带有时间延迟的系数矩阵;A、B、C、D分别为飞行器小扰动方程系数矩阵,E为外界扰动系数矩阵,w为外界扰动向量,up为神经肌动力迟后操纵量,y为输出状态向量;
步骤二,确定ROCM模型指标函数和模型参数;采用二次指标函数形式确定指标函数如下:
J p = E &infin; { y T Q y y + u p T r u u p + u &CenterDot; p T f u &CenterDot; p } - - - ( 6 )
其中,E表征了指标函数稳态期望值,Qy≥0,ru≥0,f≥0分别是指标函数的观测向量加权矩阵、操纵分配加权矩阵和操纵速率加权矩阵,f的选择依赖于给定的神经动力延迟常数矩阵Tn;假设各操纵通道独立,则Tn=diag(tni),其中tni为第i个操纵通道神经动力延迟时间常数;
步骤三,计算飞行员最优控制增益;
步骤四,控制方程离散化,鲁棒自适应状态估计;
步骤五,未建模动态估计;
假设所有未建模动态产生的动态响应等效于完全由系数矩阵和H产生,由此得到未建模动态估计:
&Delta; H ( k ) = y o b s ( k ) - D d i s u p ( k ) + v y ( k ) x ^ s ( k - 1 | k - 1 ) - H ( k - 1 )
由此用k时刻估计的未建模动态估计和ΔH(k)进行k+1时刻最优控制增益计算;
步骤六,修正飞行员最优控制增益,求解飞行员操纵向量。
2.根据权利要求1所述的一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法,其特征在于:步骤三具体为,
通过最优控制理论得到控制关系为:
u &CenterDot; p * = - G p X ^ = - &lsqb; G n , G n 1 &rsqb; X ^ = - f - 1 ( B o ) T K X ^ - - - ( 7 )
其中,为飞行员最优控制操纵量,是X的估计值,X是带有控制速率的增广状态向量,表达式为X=[xxdup]T,Gp为飞行员最优控制反馈增益向量,Bo为带有控制速率的增广操纵系数矩阵,K是由下列Riccati方程确定的唯一解:
0=(Ao)TK+KAo+Qo-KBof-1(Bo)TK(8)
其中,Ao为带有控制速率的增广动力学系数矩阵,Qo为带有控制速率的增广加权矩阵,
Q o = ( C s ) T Q y C s ( C s ) T Q y D s ( D s ) T Q y C s ( D s ) T Q y D s + r u - - - ( 9 )
将XT=[xsup]T=[xxdup]T代入(7)式,则,
u &CenterDot; p * = - G n x ^ s - G n 1 u p * - - - ( 10 )
其中Gn是调节器增益向量,Gn1的增益向量;令,
T n = G n 1 - 1 - - - ( 11 )
G n 1 - 1 G n = I p - - - ( 12 )
Ip即为飞行员最优控制增益;因此,(10)式写为:
T n u &CenterDot; p * + I p x ^ s + u p * = 0 - - - ( 13 )
令理想状态飞行员操纵指令引入操纵噪声vu,则操纵向量状态方程如下:
u &CenterDot; p * = - T n - 1 u p * + T n - 1 u c + T n - 1 v u - - - ( 14 )
其中vu是强度为Vu的零均值高斯白噪声,每个操纵通道i的操纵噪声强度为:
V u i = &pi;f u i &rho; u i &sigma; u i 2 , i = 1 , 2 , ... n u - - - ( 15 )
其中是第i个操纵通道信噪比;是操纵注意分配系数,为常数;是操纵噪声方差,取近期操纵历史tp内的统计方差作为操纵噪声方差,则,
&sigma; u i 2 = var ( &lsqb; u c i .1 , u c i .2 , ... , u c i . t p &rsqb; ) - - - ( 16 )
其中,下标1,2,…,tp表示近期历史采样时间点,uci表示第i个操纵通道理想飞行员指令;假设各通道独立,则当前时刻操纵噪声强度为,
V u = d i a g ( V u i ) - - - ( 17 ) .
3.根据权利要求1所述的一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法,其特征在于:步骤四中采用时变噪声自适应滤波器进行状态估计,首先将方程离散化得到:
u p * ( k ) = - &Phi; u u p * ( k - 1 ) + B u d i s u c ( k - 1 ) + E u d i s v u ( k - 1 ) - - - ( 19 )
其中H、Bdis、Ddis是状态转移矩阵,Edis是扰动向量离散系数矩阵,w是外界扰动向量,vy是观测噪声向量,Фu和Budis是操纵向量状态方程离散系数矩阵,Eudis是操纵噪声离散系数矩阵,vu是操纵噪声;公式中的k和k-1分别表示离散k时刻和k-1时刻;此时,引入时变噪声估值器如下:
q ^ ( k ) = q ^ ( k - 1 ) + d k - 1 Q ^ ( k - 1 ) D ( k ) &epsiv; ( k ) - - - ( 20 )
Q ^ ( k ) = Q ^ ( k - 1 ) + d k - 1 Q ^ ( k - 1 ) D ( k ) &lsqb; &epsiv; ( k ) &epsiv; T ( k ) - H ( k ) P ( k | k - 1 ) H T ( k ) - R ^ ( k - 1 ) &rsqb; D T ( k ) Q ^ ( k - 1 ) - - - ( 21 )
r ^ ( k ) = ( 1 - d k - 1 ) r ^ ( k - 1 ) + d k - 1 &lsqb; y o b s ( k ) - H ( k ) x s ( k | k - 1 ) - D d i s u p ( k ) &rsqb; - - - ( 22 )
R ^ ( k ) = ( 1 - d k - 1 ) R ^ ( k - 1 ) + d k - 1 { &lsqb; I - H ( k ) K ( k ) &rsqb; &epsiv; ( k ) &epsiv; T ( k ) &times; &lsqb; I - H ( k ) K ( k ) &rsqb; T + H ( k ) P ( k | k ) H T ( k ) } - - - ( 23 )
其中,是k时刻扰动噪声均值估计,是k-1时刻扰动噪声均值估计,是k时刻扰动噪声协方差估计,是k-1时刻扰动噪声协方差估计,ε(k)是k时刻新息,P(k|k)是纳入新息后,通过k及之前时刻预报的误差方差阵,P(k|k-1)是通过k-1及之前时刻预报的k时刻误差方差阵,是k-1时刻观察噪声协方差估计,是k时刻观察噪声协方差估计,是k时刻观察噪声均值估计,是k-1时刻观察噪声均值估计,yobs(k)是k时刻飞行员观测向量,是通过k-1及之前时刻对状态向量xs在k时刻的估计值,K(k)是k时刻滤波增益;dk-1是渐进遗忘系数,dk-1=(1-b)/(1-bk),其中,0<b<1,b为遗忘因子,D(k)是k时刻递推算子,表达式如下:
D ( k ) = E d i s T H T ( k ) &lsqb; H ( k ) P ( k | k - 1 ) H T ( k ) + R ( k - 1 ) &rsqb; - 1 - - - ( 24 )
引入改进的鲁棒自适应滤波器为:
&epsiv; ( k ) = y o b s ( k ) - H ( k ) x ^ s ( k | k - 1 ) - D d i s u p ( k ) - r ^ ( k - 1 ) - - - ( 27 )
K ( k ) = P ( k | k - 1 ) H T ( k ) &times; &lsqb; H ( k ) P ( k | k - 1 ) H T ( k ) + R ^ ( k - 1 ) &rsqb; - 1 - - - ( 28 )
P(k|k)=[In-K(k)H(k)]P(k|k-1)(29)
x ^ s ( k | k ) = x ^ s ( k | k - 1 ) + K ( k ) &epsiv; ( k ) - - - ( 30 )
其中,是纳入新息后,通过k-1及之前时刻估计值对状态向量在k-1时刻的估计值;是纳入新息后,通过k及之前时刻估计值对状态向量在k时刻的估计值;up(k-1)是k-1时刻飞行员操纵量;P(k-1|k-1)是通过k-1及之前时刻预报的k-1时刻误差方差阵,yobs(k)是k时刻观察向量真实值,In是n阶单位阵。
4.用于实现一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法的自适应最优控制飞行员模型,包括鲁棒自适应状态估计模块、最优控制增益模块、神经动力延迟模块和有效操纵延迟模块,鲁棒自适应状态估计模块结合观测噪声对输出状态向量y进行状态估计得到状态估计值输出到最优控制增益模块,最优控制增益模块根据状态估计值计算理想飞行员指令uc;神经动力延迟模块结合理想飞行员指令uc和操纵噪声vu得到神经肌动力迟后操纵量up,操纵噪声反映了人类驾驶行为和运动行为与大脑理想信号之间的差异;有效操纵延迟模块输出有效延迟后飞行员操纵量ud,参与飞行器操纵指令。
CN201510924681.5A 2015-12-10 2015-12-10 一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法 Active CN105372994B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510924681.5A CN105372994B (zh) 2015-12-10 2015-12-10 一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510924681.5A CN105372994B (zh) 2015-12-10 2015-12-10 一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法

Publications (2)

Publication Number Publication Date
CN105372994A true CN105372994A (zh) 2016-03-02
CN105372994B CN105372994B (zh) 2017-12-15

Family

ID=55375289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510924681.5A Active CN105372994B (zh) 2015-12-10 2015-12-10 一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法

Country Status (1)

Country Link
CN (1) CN105372994B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106444375A (zh) * 2016-09-20 2017-02-22 中国人民解放军海军航空工程学院 一种驾驶员最优控制模型加权系数计算方法
CN106647327A (zh) * 2016-11-22 2017-05-10 中国人民解放军海军航空工程学院 基于虚拟飞行经验的着舰指挥员纵向强制指令建模方法
CN106651090A (zh) * 2016-09-20 2017-05-10 中国人民解放军海军航空工程学院 一种归一化的人机系统飞行品质预测方法
CN108764303A (zh) * 2018-05-10 2018-11-06 电子科技大学 一种基于注意力机制的遥感图像自然语言生成方法
CN109033017A (zh) * 2018-05-25 2018-12-18 浙江工业大学 一种丢包环境下的车辆侧倾角与俯仰角估计方法
CN110488875A (zh) * 2019-09-02 2019-11-22 中国人民解放军海军航空大学 基于动态逆的无人机跟踪目标初始段航向误差修正方法
CN111429013A (zh) * 2020-03-30 2020-07-17 西北工业大学 基于注意力分配和个体状态的飞行员情境觉知评测方法
CN112486193A (zh) * 2020-11-19 2021-03-12 南京航空航天大学 一种基于自适应增广控制理论的飞翼无人机三轴全权限控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0462815B1 (en) * 1990-06-21 1996-09-25 Honeywell Inc. Receding horizon based adaptive control having means for minimizing operating costs
CN102998973A (zh) * 2012-11-28 2013-03-27 上海交通大学 一种非线性系统的多模型自适应控制器及控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0462815B1 (en) * 1990-06-21 1996-09-25 Honeywell Inc. Receding horizon based adaptive control having means for minimizing operating costs
CN102998973A (zh) * 2012-11-28 2013-03-27 上海交通大学 一种非线性系统的多模型自适应控制器及控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIANG YU,等: "Multi-objective robust airfoil optimization based on non-uniform rational B-spline(NURBS) representation", 《SCIENCE CHINA TECHNOLOGICAL SCIENCES》 *
谭文倩,屈香菊: "一种预测驾驶员操纵行为的建模方法", 《北京航空航天大学学报》 *
谷志峰,等: "具有状态参数约束的鲁棒自适应最优控制设计", 《控制与决策》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106444375A (zh) * 2016-09-20 2017-02-22 中国人民解放军海军航空工程学院 一种驾驶员最优控制模型加权系数计算方法
CN106651090A (zh) * 2016-09-20 2017-05-10 中国人民解放军海军航空工程学院 一种归一化的人机系统飞行品质预测方法
CN106647327A (zh) * 2016-11-22 2017-05-10 中国人民解放军海军航空工程学院 基于虚拟飞行经验的着舰指挥员纵向强制指令建模方法
CN106647327B (zh) * 2016-11-22 2019-05-07 中国人民解放军海军航空工程学院 基于虚拟飞行经验的着舰指挥员纵向强制指令建模方法
CN108764303A (zh) * 2018-05-10 2018-11-06 电子科技大学 一种基于注意力机制的遥感图像自然语言生成方法
CN109033017A (zh) * 2018-05-25 2018-12-18 浙江工业大学 一种丢包环境下的车辆侧倾角与俯仰角估计方法
CN109033017B (zh) * 2018-05-25 2022-05-13 浙江工业大学 一种丢包环境下的车辆侧倾角与俯仰角估计方法
CN110488875A (zh) * 2019-09-02 2019-11-22 中国人民解放军海军航空大学 基于动态逆的无人机跟踪目标初始段航向误差修正方法
CN111429013A (zh) * 2020-03-30 2020-07-17 西北工业大学 基于注意力分配和个体状态的飞行员情境觉知评测方法
CN111429013B (zh) * 2020-03-30 2023-05-02 西北工业大学 基于注意力分配和个体状态的飞行员情境觉知评测方法
CN112486193A (zh) * 2020-11-19 2021-03-12 南京航空航天大学 一种基于自适应增广控制理论的飞翼无人机三轴全权限控制方法
CN112486193B (zh) * 2020-11-19 2022-04-22 南京航空航天大学 一种基于自适应增广控制理论的飞翼无人机三轴全权限控制方法

Also Published As

Publication number Publication date
CN105372994B (zh) 2017-12-15

Similar Documents

Publication Publication Date Title
CN105372994A (zh) 一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法
CN104199295B (zh) 基于神经网络的机电伺服系统摩擦补偿和变结构控制方法
CN105404152B (zh) 一种模拟飞行员主观评价的飞行品质预测方法
CN104408744A (zh) 一种用于目标跟踪的强跟踪容积卡尔曼滤波方法
CN105487376B (zh) 一种基于数据驱动单网络结构的最优控制方法
CN103433924A (zh) 串联机器人高精度位置控制方法
CN105798930A (zh) 基于龙伯格状态观测器的柔性机械臂系统饱和补偿控制方法
Majeed et al. Aerodynamic parameter estimation using adaptive unscented Kalman filter
CN105425589B (zh) 提高航天器惯性参数辨识精度的输入信号设计方法
Alrifaee et al. Real-time trajectory optimization for autonomous vehicle racing using sequential linearization
CN110328668A (zh) 基于速度平滑确定性策略梯度的机械臂路径规划方法
CN106774379A (zh) 一种智能超螺旋强鲁棒姿态控制方法
CN104965412A (zh) 受控化发射平台的自适应鲁棒输出反馈控制方法
CN106647241B (zh) 一种新型的非线性pid控制器
CN103029851B (zh) 一种参数自整定伪速率调制器
CN106054606A (zh) 基于级联观测器的无模型控制方法
Hager et al. Adaptive Neural network control of a helicopter system with optimal observer and actor-critic design
CN106444375B (zh) 一种驾驶员最优控制模型加权系数计算方法
Suresh et al. Direct adaptive neural flight control system for an unstable unmanned aircraft
Bierling et al. Comparative analysis of mrac architectures in a unified framework
Wang et al. Repetitive tracking control of nonlinear systems using reinforcement fuzzy-neural adaptive iterative learning controller
Aschauer et al. Co-simulation of matlab and flightgear for identification and control of aircraft
CN106651090A (zh) 一种归一化的人机系统飞行品质预测方法
CN105824239A (zh) 带注视差异约束的平滑追踪眼动自适应跟踪控制器及方法
CN115562345A (zh) 一种基于深度强化学习的无人机侦测轨迹规划方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Liu Jia

Inventor after: Jia Hui

Inventor after: Zhao Zhijian

Inventor after: Xiao Chuwan

Inventor after: Xiang Jinwu

Inventor after: Zhang Ying

Inventor after: Shi Mingjian

Inventor after: Gui Jingling

Inventor after: Sun Yang

Inventor after: Song Weijian

Inventor after: Song Yan

Inventor after: Zhou Qiang

Inventor before: Liu Jia

Inventor before: Xiao Chuwan

Inventor before: Xiang Jinwu

Inventor before: Zhang Ying

Inventor before: Sun Yang

Inventor before: Song Weijian

Inventor before: Song Yan

Inventor before: Zhou Qiang

Inventor before: Jia Hui

Inventor before: Zhao Zhijian

GR01 Patent grant
GR01 Patent grant