CN106444375B - 一种驾驶员最优控制模型加权系数计算方法 - Google Patents

一种驾驶员最优控制模型加权系数计算方法 Download PDF

Info

Publication number
CN106444375B
CN106444375B CN201610832899.2A CN201610832899A CN106444375B CN 106444375 B CN106444375 B CN 106444375B CN 201610832899 A CN201610832899 A CN 201610832899A CN 106444375 B CN106444375 B CN 106444375B
Authority
CN
China
Prior art keywords
vector
noise
pilot
weighting coefficient
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610832899.2A
Other languages
English (en)
Other versions
CN106444375A (zh
Inventor
刘嘉
向锦武
张颖
宋岩
孙阳
贾慧
赵志坚
肖楚琬
刘湘
刘湘一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naval Aeronautical Engineering Institute of PLA
Original Assignee
Naval Aeronautical Engineering Institute of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naval Aeronautical Engineering Institute of PLA filed Critical Naval Aeronautical Engineering Institute of PLA
Priority to CN201610832899.2A priority Critical patent/CN106444375B/zh
Publication of CN106444375A publication Critical patent/CN106444375A/zh
Application granted granted Critical
Publication of CN106444375B publication Critical patent/CN106444375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种驾驶员最优控制模型加权系数计算方法,属于飞行器设计技术领域。所述方法实现步骤包括构建增广被控对象、构建飞行员最优控制模型指标函数、计算飞行员最优控制增益、求解观测噪声方差和操纵噪声方差、计算指标函数J、寻优计算直至找到令J取得最小值的加权系数。本发明提供了OCM模型加权系数选取的科学方法和规范化流程,可避免人为选择加权系数对模型指标函数带来干扰。依据本发明提供的加权系数计算方法,可以开展更为准确的飞行品质预测。

Description

一种驾驶员最优控制模型加权系数计算方法
技术领域
本发明属于飞行器设计技术领域,具体涉及一种基于飞行员注意力最优分配假设的驾驶员最优控制模型加权系数计算方法。
背景技术
利用飞机驾驶员模型开展模拟飞行员主观评价的飞行品质预测,一直是国内外学者努力追求目标。其中基于驾驶员最优控制模型(Optimal control pilot model,OCM模型)开展飞行品质预测是代表性方法之一。当前基于OCM模型开展飞行品质预测存在的主要问题之一,就是指标函数加权系数没有统一选取方法。目前大多由设计人员主观选取。由此带来了方法使用的随意性和飞行品质预测的显著差异。这无疑增加了方法推广使用困难。
发明内容
为了解决现有技术中存在的问题,本发明提供一种基于飞行员注意力最优分配假设的驾驶员最优控制模型加权系数计算方法,为OCM模型推广使用提供了更为科学的理论依据,可以为飞行品质预测和飞行器设计起到积极促进作用。所述加权系数计算方法遵循加权系数选择原则和指标函数计算原则。
所述的加权系数选择原则是指:飞行员可以最优的调节注意力分配使跟踪误差和体力负荷最小。即驾驶员最优控制模型应该最优的分配加权系数使跟踪误差和体力负荷最小。
所述的指标函数计算原则是指:驾驶员评分指标函数,应同时体现脑力负荷、体力负荷以及操纵效果。尽量排除加权系数变化和驱动函数设置影响。
基于上述两个原则,本发明提供的加权系数计算方法具体包括如下步骤:
第一步,构建增广被控对象。
第二步,根据飞行任务,构建飞行员最优控制模型指标函数,给定初始加权系数值。
第三步,计算飞行员最优控制增益。
第四步,求解观测噪声方差和操纵噪声方差,计算Kalman滤波增益。
第五步,计算指标函数J。
第六步:以指标函数J为目标函数,以加权系数为自变量,进行寻优计算,直至找到令J取得最小值的加权系数,求解结束。
本发明的优点在于:
(1)提供了OCM模型加权系数选取的科学方法和规范化流程,可避免人为选择加权系数对模型指标函数带来干扰。
(2)提供了加权系数的准确计算方法,可据此开展更为准确的飞行品质预测。
附图说明
图1为指标函数与加权系数关系示意图。
图2为算例飞行品质预测比较图。
图3为本发明提供的一种基于飞行员注意力最优分配假设的驾驶员最优控制模型加权系数计算方法流程图。
具体实施方式
下面结合附图和实施例对本发明进行详细说明。
本发明提供一种基于飞行员注意力最优分配假设的驾驶员最优控制模型加权系数计算方法,下面以单通道跟踪任务为例,结合图3,对本发明所述加权系数计算方法的步骤流程说明如下:
步骤一:构建形如下式的增广被控对象:
其中,xs是带有延迟的增广状态向量,为xs的一阶导数,As、Bs、Cs、Ds、Es是增广系数矩阵,up是飞行员操纵量,y是输出状态量,w是外界扰动向量。其中 Cs=[C DCd],Ds=D,x为飞机小扰动方程状态向量。xd是带有延迟的增广状态向量,Ad、Bd、Cd分别为时间延迟系数矩阵。A、B、C、D、E是飞机小扰动方程系数矩阵。
飞行员实际感知向量yobs为:
yobs=Csxs+Dsup+vy (2)
其中vy是与近期观测历史有关的感知噪声,采用高斯白噪声建模,也称观测噪声。观测噪声强度Vy其中ρy是感知噪声信噪比,典型单通道跟踪任务中感知噪声信噪比ρy通常为0.01,对应信噪比为-20dB,为观测噪声方差。
步骤二,根据飞行任务,构建驾驶员最优控制模型指标函数,设定初始加权系数值Qy和ru。采用二次指标函数构建驾驶员最优控制模型指标函数Jp如下:
其中,Qy是观察向量加权系数,ru是操纵向量加权系数,f是操纵速率加权系数,是up的一阶导数。它们反映了飞行员对信息观察、油门杆、驾驶杆、操纵速率等不同驾驶要素的重视程度。其中f的选择依赖于给定的神经动力延迟常数Tn。E是指标函数稳态期望值。本发明要解决的问题就是设法确定指标函数加权系数Qy和ru取值。
步骤三,计算飞行员最优控制增益。可以通过最优控制理论得到控制关系为:
其中,是飞行员最优操纵量,Gp是调节器增益向量,是状态向量X的估计值,K是由下列Riccati方程确定的唯一解:
0=(Ao)TK+KAo+Qo-KBof-1(Bo)TK (5)
其中,
将X=[xs up]T=[x xd up]T代入(4)式,则,
其中Gn增益向量,为xs的估计值,Gn1的增益向量。令,
则,
Ip即为飞行员最优控制增益。因此,(7)式可写为,
引入操纵噪声vu,则
其中vu是强度为Vu的零均值高斯白噪声。ρu是操纵噪声信噪比系数,是操纵噪声方差。
步骤四:循环迭代求解观测噪声方差和操纵噪声方差,计算Kalman滤波增益。
联立(1)和(11)式得到:
其中,为带有操纵量的增广状态向量X的一阶导数, w为外界扰动向量,vu为操纵噪声,vy为观测噪声,C1=[C DCd D]。
状态向量X的估计值可以由Kalman滤波得到,其中滤波增益矩阵F为:
F=Σ1(C1)T(Vy)-1 (13)
其中,Vy为观测噪声强度,估计误差矩阵Σ1是由下列Riccati方程确定的唯一解:
0=A1Σ11(A1)T+W11(C1)T(Vy)-1(C11 (14)
其中W1=diag(W,Vu),W为外界扰动强度,Vu为操纵噪声强度。带有状态估计的人机闭环状态方程为,
其中I1=[Ip,0],Cδ=[0 Cd 1],F为Kalman滤波增益矩阵,δ为飞机舵面偏转量。
协方差矩阵Xcov是下列Lyapunov方程的解:
其中,Qlyp=diag(W,Vy,Vu),Vy是观测噪声强度,Vu操纵噪声强度。
则,输出协方差矩阵:
其中,
由此得到观测噪声方差和操纵噪声方差分别为:
这样对于给定初始操纵噪声强度Vu和观测噪声强度Vy,可以分别得到一个并可以分别计算得到信噪比系数ρy和ρu,由此可以形成循环迭代计算,直到信噪比满足ρy=0.01和ρu=0.003为止。同时,迭代结束后可以得到Kalman滤波增益。
步骤五:计算指标函数J。
其中,Je=Ycov(1,1),Ju=Ycov(2,2),row_u=row_X-row_x-row_xd,row_X是向量X的行数,row_x是向量x的行数,row_xd是向量xd的行数。
步骤六:根据最优注意力分配假设计算加权系数。
根据加权系数选择原则和指标函数计算原则,飞行员可以最优的对注意力分配,使指标函数最小。由此,设定不同Qy和ru,可以通过共轭梯度法寻优计算直到指标函数J取得最小值。由此确定了OCM模型加权系数Qy和ru
本发明首先提出了飞行员最优分配注意力的假设,即飞行员可以最优的分配注意力,使指标函数最小。而加权系数Qy和ru就表征了飞行员对信息观察和驾驶杆操纵的注意力分配,因此可以用这种方法计算加权系数Qy和ru
下面提供两则实施例对本发明进行说明。实施例1用于加权系数选择原则进行说明。即存在一个最优加权系数组合Qy和ru使指标函数最小。实施例2通过飞行品质预测,说明本发明在飞行品质评估应用中的有益效果。
实施例1
以1993年美国空军飞行员Darcy Granley在Calspan Lear II型飞机上获取的试验数据为比照对象(见参考文献[1]:Craig R.Edkins,Human Pilot Response duringSingle and Multi-axis Tracking Tasks,AFFTC-TLR-93-41[R].California,Air ForceFlight Test Center,1993.),进行验证。飞机俯仰轴传递函数为:
式中:θ为飞机俯仰角响应;δes为驾驶杆偏移量;ξ为短周期阻尼比;τD为操纵延迟时间。根据ξ和τD取值构建4种研究对象如表1所示。
表1研究对象模态参数
飞行试验任务为俯仰姿态跟踪。姿态跟踪任务指令由白噪声建模得到,驱动函数为:
式中:θc为姿态目标指令;w为白噪声。在加权系数比值Qy/ru在[0,0.2]范围内,计算4种研究对象指标函数J如图1所示。可见,确实存在一个最优的注意力分配方案,可以使跟踪误差和体力负荷达到最小。
实施例2
验证的思路是,对人机闭环飞行品质评价飞行试验进行仿真再现,按本发明方法计算加权系数,而后进行飞行品质评估,如果获得的模拟飞行品质预测结果较传统OCM模型更为准确,则说明了本发明优越性。飞行品质试验待评价对象与实施例1相同。首先按步骤一将研究对象转换为增广矩阵形式。而后按步骤二,建立指标函数如下,这一指标函数包含了飞机响应、飞行员操纵量和操纵速率。
确定驾驶员模型参数如表2所示。其中观察向量加权系数Qy=7.2和操纵加权系数ru=32.5为参考文献[2](Craig R.Edkins.The Prediction of Pilot Opinion RatingsUsing Optimal and Sub-optimal Pilot Models[R].AD-A278629,1994.)应用OCM评分时的取值。
表2 OCM模型参数
而后,按照步骤三到步骤六,采用寻优算法,计算得到最优的注意力分配和指标函数结果如下表3所示。同时按下式计算飞行品质预测评分一并在表3中示出。
其中带宽均方误差幅值为Qy/ru为按本发明方法计算得到的观察加权系数与操纵加权系数比值,f是操纵速率加权系数、PRtest是飞行试验真实驾驶员评分、PRpre是按本发明加权系数计算得到的预测评分、OCM是原始参考文献按照原始加权系数得到的飞行品质预测评分:
表3最优的注意力分配和飞行品质预测结果
比较本文评分结果(图2中PRpre点)和原始OCM结果(图2中OCM点)如图2所示,按下式计算并比较研究对象1~4飞行品质预测回归模型剩余标准差:
计算得到本发明预测评分剩余标准差为0.5855,而原始OCM模型剩余标准差为1.2440。显然本发明方法获得评分精度更高。这证明了本发明加权系数计算方法的正确性,以及在飞行品质评估中的优越性。

Claims (1)

1.一种驾驶员最优控制模型加权系数计算方法,其特征在于:具体包括如下步骤,
第一步,构建增广被控对象;
第二步,根据飞行任务,构建飞行员最优控制模型指标函数,给定初始加权系数值;
第三步,计算飞行员最优控制增益;
第四步,求解观测噪声方差和操纵噪声方差,计算Kalman滤波增益;
第五步,计算指标函数J,其中,Je=Ycov(1,1),Ju=Ycov(2,2),row_u=row_X-row_x-row_xd,row_X是状态向量X的行数,row_x是向量x的行数,row_xd是向量xd的行数;
第六步:以指标函数J为目标函数,以加权系数为自变量,进行寻优计算,直至找到令J取得最小值的加权系数,求解结束;
所述的增广被控对象的形式如下:
其中,xs是带有延迟的增广状态向量,为xs的一阶导数,As、Bs、Cs、Ds、Es是增广系数矩阵,up是飞行员操纵量,y是输出状态量,w是外界扰动向量;其中 Cs=[C DCd],Ds=D,x为飞机小扰动方程状态向量;xd是带有延迟的增广状态向量,Ad、Bd、Cd分别为时间延迟系数矩阵;A、B、C、D、E是飞机小扰动方程系数矩阵;
飞行员实际感知向量yobs为:
yobs=Csxs+Dsup+vy (2)
其中vy是观测噪声,观测噪声强度Vyρy是观测噪声信噪比,为观测噪声方差;
第二步中采用二次指标函数构建驾驶员最优控制模型指标函数Jp如下:
其中,Qy是观察向量加权系数,ru是操纵向量加权系数,f是操纵速率加权系数,是up的一阶导数,f的选择依赖于给定的神经动力延迟常数Tn,E是指标函数稳态期望值;
第三步中所述的飞行员最优控制增益为:
其中,是飞行员最优操纵量,Gp是调节器增益向量,是状态向量X的估计值,K是由下列Riccati方程确定的唯一解:
0=(Ao)TK+KAo+Qo-KBof-1(Bo)TK (5)
其中,
将X=[xs up]T=[x xd up]T代入(4)式,则,
其中Gn增益向量,为xs的估计值,Gn1的增益向量;令,
则,
Ip即为飞行员最优控制增益,因此,(7)式写为,
引入操纵噪声vu,则,
其中vu是操纵噪声;
第四步具体为:
联立(1)和(11)式得到:
其中,为状态向量X的一阶导数, w为外界扰动向量,vu为操纵噪声,vy为观测噪声,C1=[C DCd D];
状态向量X的估计值由Kalman滤波得到,其中滤波增益矩阵F为:
F=Σ1(C1)T(Vy)-1 (13)
其中,Vy为观测噪声强度,估计误差矩阵Σ1是由下列Riccati方程确定的唯一解:
0=A1Σ11(A1)T+W11(C1)T(Vy)-1(C11 (14)
其中W1=diag(W,Vu),W为外界扰动强度,Vu为操纵噪声强度;带有状态估计的人机闭环状态方程为,
其中I1=[Ip,0],Cδ=[0Cd 1],F为Kalman滤波增益矩阵,δ为飞机舵面偏转量;
协方差矩阵Xcov是下列Lyapunov方程的解:
其中,Qlyp=diag(W,Vy,Vu),Vy是观测噪声强度,Vu操纵噪声强度;
则,输出协方差矩阵:
其中,
由此得到观测噪声方差和操纵噪声方差分别为:
CN201610832899.2A 2016-09-20 2016-09-20 一种驾驶员最优控制模型加权系数计算方法 Active CN106444375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610832899.2A CN106444375B (zh) 2016-09-20 2016-09-20 一种驾驶员最优控制模型加权系数计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610832899.2A CN106444375B (zh) 2016-09-20 2016-09-20 一种驾驶员最优控制模型加权系数计算方法

Publications (2)

Publication Number Publication Date
CN106444375A CN106444375A (zh) 2017-02-22
CN106444375B true CN106444375B (zh) 2019-04-26

Family

ID=58166283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610832899.2A Active CN106444375B (zh) 2016-09-20 2016-09-20 一种驾驶员最优控制模型加权系数计算方法

Country Status (1)

Country Link
CN (1) CN106444375B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109597306A (zh) * 2018-12-13 2019-04-09 济南大学 一种丢包网络控制系统的跟踪控制器设计方法
CN111429013B (zh) * 2020-03-30 2023-05-02 西北工业大学 基于注意力分配和个体状态的飞行员情境觉知评测方法
CN116126657A (zh) * 2021-11-12 2023-05-16 华为云计算技术有限公司 参数寻优方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7395251B2 (en) * 2005-07-01 2008-07-01 International Business Machines Corporation Neural networks for prediction and control
WO2014149044A1 (en) * 2013-03-20 2014-09-25 International Truck Intellectual Property Company, Llc Smart cruise control system
KR20150078539A (ko) * 2013-12-31 2015-07-08 광운대학교 산학협력단 Mobile OIS 제어를 위한 Fuzzy 예측 오차 보상 방법
CN105372994B (zh) * 2015-12-10 2017-12-15 中国人民解放军海军航空工程学院 一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法
CN105404152B (zh) * 2015-12-10 2017-12-15 中国人民解放军海军航空工程学院 一种模拟飞行员主观评价的飞行品质预测方法

Also Published As

Publication number Publication date
CN106444375A (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
CN111667513B (zh) 一种基于ddpg迁移学习的无人机机动目标跟踪方法
CN106444799B (zh) 基于模糊扩张状态观测器和自适应滑模的四旋翼无人机控制方法
CN108161934B (zh) 一种利用深度强化学习实现机器人多轴孔装配的方法
CN110806759B (zh) 一种基于深度强化学习的飞行器航线跟踪方法
CN106444375B (zh) 一种驾驶员最优控制模型加权系数计算方法
CN105404152B (zh) 一种模拟飞行员主观评价的飞行品质预测方法
CN105629734B (zh) 一种近空间飞行器的轨迹跟踪控制方法
CN106647271B (zh) 基于神经网络理论的非线性系统自适应比例积分控制方法
CN105607473B (zh) 小型无人直升机的姿态误差快速收敛自适应控制方法
CN104796111B (zh) 一种用于动态迟滞系统建模与补偿的非线性自适应滤波器
CN105372994B (zh) 一种基于鲁棒自适应最优控制的飞行员操纵行为描述方法
CN109459930B (zh) 一种基于pd结构和邻居滞后控制信号的协同控制方法
CN104197793B (zh) 一种导弹pid控制器参数自适应调节的方法
CN110687800A (zh) 一种数据驱动自适应抗干扰控制器结构及其估计方法
CN115033022A (zh) 面向移动平台基于专家经验的ddpg无人机降落方法
CN106651090B (zh) 一种归一化的人机系统飞行品质预测方法
CN109188907A (zh) 一种应用于稳定平台控制系统的遗传退火粒子群混合算法及其稳定平台控制系统
CN110083057A (zh) 基于水翼运动姿态的pid控制方法
CN108897315A (zh) 一种多机器人编队方法
CN114167734A (zh) 一种强耦合非线性系统高精度控制方法及控制系统
CN111931131B (zh) 一种行星探测器动力着陆段在线轨迹规划方法及系统
CN111531543B (zh) 基于生物启发式神经网络的机器人自适应阻抗控制方法
CN106647327A (zh) 基于虚拟飞行经验的着舰指挥员纵向强制指令建模方法
CN110554707A (zh) 一种飞行器姿态控制回路的q学习自动调参方法
Wang et al. Design of automatic carrier-landing controller based on compensating states and dynamic inversion

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant