CN113869379A - 一种基于数据驱动的航空器能量异常识别方法 - Google Patents

一种基于数据驱动的航空器能量异常识别方法 Download PDF

Info

Publication number
CN113869379A
CN113869379A CN202111079489.2A CN202111079489A CN113869379A CN 113869379 A CN113869379 A CN 113869379A CN 202111079489 A CN202111079489 A CN 202111079489A CN 113869379 A CN113869379 A CN 113869379A
Authority
CN
China
Prior art keywords
data
energy
aircraft
hyperplane
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111079489.2A
Other languages
English (en)
Inventor
蔡志鹏
曾维理
褚晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202111079489.2A priority Critical patent/CN113869379A/zh
Publication of CN113869379A publication Critical patent/CN113869379A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开一种基于数据驱动的航空器能量异常识别方法,首先,读取航空器轨迹相关数据,并对数据进行质量分析;其次,对航空器轨迹信息数据进行预处理,并分为训练集、测试集和验证集;然后,根据能量公式,将ENU坐标系下的数据转变能量数据,并根据时间数据和时间窗口长度生成以时间窗口为单位的数据;最后,使用单分类SVM构建能量异常检测模型,通过历史飞行数据对能量异常检测模型进行训练使其具有识别异常能量的能力。本发明提高识别模型的泛用性,并可获取不同终端空域中的相关统计数据,为管制员提供及时有效的辅助决策信息、为空域管理部门提供空域的运行状态分析以助于空域的规划。

Description

一种基于数据驱动的航空器能量异常识别方法
技术领域
本发明属于民航技术领域,具体涉及一种基于数据驱动的航空器能量异常识别方法。
背景技术
近十年来,我国的民航事业各个方面都在迅速增长着,无论是机场、航空公司还是旅客的选乘率都有明显提升。在民航业快速发展的背后,安全与效率的问题也随之而出,有限的空域资源、地面或机载导航设备精度、管制员的指挥能力等无法满足航班在大流量下的高效运行,因此为保障安全,部分交通繁忙的空域采取限流、改航、等待等方式来缓解空域内的交通流压力,从而容易导致航班延误、运行效率较低等问题的出现。为此,针对上述问题,本发明开发一套辅助管制员指挥管制区内航空器的系统,为管制员提供危险预警、辅助决策信息,提高管制员能力和空中交通流的运行效率和安全性。
航空器的能量管理与能量的态势感知是现阶段安全分析的两个重要的概念,许多航空器失控的事故以及事故征候的发生原因均为航空器没有做好实时的能量管理造成的,能量指标也可成为评估安全的客观指标。因此,我们将可能引起事故或事故征候的异常能量定义为航空器的能量指标或能量特征与其他绝大部分飞行行为有明显不同的航空器能量数据。目前,国内外对航空器异常行为检测也有一些研究航空器可以分为了四个主要的部分:1)基于距离的异常行为检测;2)基于分类的异常行为检测;3)基于重构的异常行为检测;4)基于统计的异常行为检测。
本发明通过对比不同的异常检测的方法,采用基于分类的检测方法,更好解决正常与异常航空器能量数据不平衡等问题。现阶段基于分类的异常检测方法,都采用单个数据点为检测目标,这将缺乏对检测点周围的数据的考量,从而使得模型很难平衡虚警率和漏警率以及忽略能量数据的事件相关性。本发明采用滑动窗口技术将原始的航空器飞行数据按照时间顺序重新组合生成时间窗口,计算不同窗口能量指标生成特征向量,通过对窗口内的数据进行综合的异常判断确定观测时间点是否存在能量异常。
发明内容
发明目的:针对动态时间规整方法存在的上述问题,本发明提出一种基于数据驱动的航空器能量异常识别方法,提高识别模型的泛用性,并可获取不同终端空域中的相关统计数据。
技术方案:本发明所述的一种数据驱动的航空器能量异常识别方法,包括以下步骤:
(1)读取航空器轨迹相关数据,并对数据进行质量分析;
(2)对航空器轨迹信息数据进行预处理,并分为训练集、测试集和验证集;
(3)根据能量公式,将ENU坐标系下的数据转变能量数据,并根据时间数据和时间窗口长度生成以时间窗口为单位的数据;
(4)使用单分类SVM构建能量异常检测模型,通过历史飞行数据对能量异常检测模型进行训练使其具有识别异常能量的能力。
进一步地,所述步骤(1)包括以下步骤:
(11)读取包括时间、二次雷达编号、航空器型号、航空器所处经度、航空器所处纬度、航空器所处高度、航空器速度和航空器角度的航空器轨迹相关数据;
(12)从数据是否存在重复值、缺失值、离群点三个方面对数据进行质量分析:对比飞机航迹信息数据集中的所有航迹点的所有属性,当两个航迹点之间的所有属性均相同时,则判断这两个航迹点为重复值;检查航迹点的属性值,当存在空值时,则该航迹信息为缺失值;离群点为明显偏离飞行轨迹的单个数据点,该点可能是由传感器异常或者数据传输异常造成的。
进一步地,所述步骤(2)包括以下步骤:
(21)对航空器轨迹信息数据集进行数据清洗:数据中存在的重复值采用删除法,剔除重复航迹信息的数据记录;数据中存在的缺失值采用删除法和插补法;
(22)对航空器轨迹信息数据集进行坐标变换,将地理坐标系转换成以地球质心为原点的ECEF坐标系;
(23)将ECEF坐标系转化为以机场基准点为原点的ENU坐标系,ENU坐标系ZUp轴方向为垂直于机场基准点所在的地球表面方向,XEast轴方向为正东方向,YNorth方向为正北方向;
(24)对轨迹进行插值、平滑以及外推,得到平滑、等长的数据:
Figure BDA0003263415980000031
(D2)i=ei-2ei+1+ei+2
(D3)i=(-ei-1+2ei-2ei+2+ei+3)
其中,P∈RN×M重建航迹,长度为N,数据维度为M,
Figure BDA0003263415980000032
表示原始轨迹,长度为K,数据维度为M,A∈RK×N表示一个对角采样矩阵,如果
Figure BDA0003263415980000033
中存在空缺值,矩阵A中对应的数值为0,
Figure BDA0003263415980000034
表示F范数,β12表示正则化参数,D2∈R(N-2)×N是表示航空器轨迹加速度的二阶差分矩阵,D3∈R(N-4)×N表示抑制拟合轨迹中的微小的高频波动,ei表示时刻为i=1,2,...,N的标准单位向量。
进一步地,所述步骤(3)包括以下步骤:
(31)选择能量指标,并将经过预处理后的数据通过能量计算公式转换成能量指标,将处理好的能量指标按照时间顺序生成以时间窗口为单位的数据;所述能量指标包括单位机械能、单位势能、单位动能、单位机械能误差、单位机械能率;
(32)生成以时间窗口为单位的航空器能量数据:
采用滑动窗口将原始的航空器飞行数据按照时间顺序重新组合生成时间窗口,计算不同窗口能量指标生成特征向量:
Figure BDA0003263415980000035
采用观测时刻点在中间的飞行数据序列{xt-k,...,xt,...,xt+k}来观测t时刻航空器飞行数据;每一个时间窗口作为一个分析单元,使用相对应的能量公式eqj计算每一个时刻点对应的能量指标
Figure BDA0003263415980000036
Ej代表该时间窗口内航空器第j个能量特征,
Figure BDA0003263415980000037
代表在时刻t航空器的第j个能量特征,计算不同的能量特征,构建第i个能量窗口的能量特征向量yi=[E1 i,E2 i,E3 i,...,EN i];对能量窗口内的能量特征向量进行特征缩放,使每个能量指标的均值和单位方差为零,使所有的能量指标能够进行同等比较、避免因为量纲或单位的原因限制模型性能。
进一步地,所述步骤(4)包括以下步骤:
(41)使用单分类SVM构建能量异常检测模型以提高模型和数据集的匹配度,定义训练数据集{x1,x2,...,xn}∈R,R是数据原本存在的特征空间,映射函数φ1将全部的训练集由特征空间R映射到特征空间F,分割超平面F1,松弛变量ζi,超平面截距ρ,超平面法向量w,允许的异常数据占全部数据的比值υ,拉格朗日乘数λ12,k(·)核函数,用于计算输入映射到高维空间能量特征的内积,SV为支持变量,该变量集合定义出分隔超平面;
(42)单分类支持向量机将全部的数据通过核函数投影到高维的特征空间中F,求解一个正常数据集距离原点最远的超平面F1;单分类SVM模型加入松弛变量ζi防止在训练过程中出现过拟合现象,设置参数υ允许少量的样本在分割超平面外;所述参数υ是匹配数据集与模型的变量,当参数υ较小,模型的灵敏度越低,容易将异常能量数据识别为正常;反之,模型的灵敏度越高,则容易将正常能量数据错误识别异常;
(43)能量异常检测模型计算出特征空间里,训练集数据的正常区域,输入测试集的数据若在分割超平面外即在正常区域外,则返回-1样本判定为异常,若在分割超平面内,则返回1样本判定为正常;
当数据在原本的特征空间R无法直接使用一个“线性”超平面分隔时,通过映射函数φ1将数据映射到更高维的特征空间F,通过调整样本在F中的距离和角度,构建一个在F中的分割超平面,yi=[E1 i,E2 i,E3 i,...,EN i]表示预处理完成的能量特征数据:
w·φ(y)-ρ=0
通过优化w和ρ的值,获得一个距离原点距离最远的平面,将问题转化成二次优化问题:
Figure BDA0003263415980000051
w·φ(yi)-ρ+ζi≥0,ζi≥0
通过拉格朗日乘法计算计算条件极值:
Figure BDA0003263415980000052
Figure BDA0003263415980000053
Figure BDA0003263415980000054
Figure BDA0003263415980000055
通过使用拉格朗日技术和点积计算的核函数,决策函数为:
Figure BDA0003263415980000056
Figure BDA0003263415980000057
Figure BDA0003263415980000058
时,样本数据在分隔超平面外,认为是异常数据;当
Figure BDA0003263415980000059
样本数据在分隔超平面上,认为是正常数据;当λ1=0是,样本数据在分隔超平面里;
根据分隔超平面上的支持向量对应的λ1重新设置截距ρ:
Figure BDA00032634159800000510
yj∈SV
再用sgn函数进行异常判断:
Figure BDA00032634159800000511
当返回值为+1时,则样本数据为正常数据;当返回值为-1时,则样本数据为异常数据。
进一步地,步骤(32)所述滑动窗口的大小为5。
进一步地,所述单分类支持向量机中映射的核函数为RBF径向基核函数。
有益效果:与现有技术相比,本发明的有益效果:1、本发明考虑飞行数据的时间相关性,精确的表征数据特征,提高识别模型的泛用性;针对数据集中主要以正常数据为主的不平衡问题,搭建了单分类SVM模型,通过训练集数据训练模型寻找最优的分隔超平面判断数据是否正常;2、本发明具备数据驱动特性,可从历史数据生成模型,为任意终端空域自动创建生成模型;并可获取不同终端空域中的相关统计数据,为管制员提供及时有效的辅助决策信息、为空域管理部门提供空域的运行状态分析以助于空域的规划。
附图说明
图1为本发明的流程图;
图2为坐标系示意图,其中(a)为地理坐标系;(b)为ECEF坐标系;(c)为ENU坐标系;
图3为时间窗口示意图,其中(a)为所示时间窗口包括时刻t和前后k个时刻点;(b)为实时分析的时间窗口划分,其与事后分析的不同点在于分析时刻点在最后的飞行数据来分析时刻航空器的飞行数据;
图4为计算分隔超平面示意图;
图5为核函数投影至超平面示意图;
图6为不同能量检测模型有效性对比图。
具体实施方式
下面结合附图对本发明做进一步详细说明。
本发明提出一种基于数据驱动的航空器能量异常识别方法,如图1所示,包括以下步骤:
步骤1:读取航空器轨迹相关数据,并对数据进行质量分析。具体步骤如下:
步骤1.1:读取航空器轨迹相关数据,包括时间、二次雷达编号、航空器型号、航空器所处经度、航空器所处纬度、航空器所处高度、航空器速度和航空器角度。
步骤1.2:将读取的数据进行质量分析,从数据是否存在重复值、缺失值、离群点三个方面进行分析。对比飞机航迹信息数据集中的所有航迹点的所有属性,当两个航迹点之间的所有属性均相同时,则判断这两个航迹点为重复值;检查航迹点的属性值,当存在空值时,则该航迹信息为缺失值;离群点为明显偏离飞行轨迹的单个数据点,该点可能是由传感器异常或者数据传输异常造成的。
步骤2:对航空器轨迹信息数据进行预处理,并分为训练集、测试集和验证集。具体步骤如下:
步骤2.1:对航空器轨迹信息数据集进行数据清洗。数据中存在的重复值采用删除法,剔除重复航迹信息的数据记录;数据中存在的缺失值采用删除法和插补法。当数据缺失属性大于85%时,删除该航迹点的信息数据,否则根据其他非缺失的变量,运用回归的方法对缺失值进行插补;数据中的离群点采用正则化算法进行替换,并使得飞行轨迹更加平滑。将清洗后的数据根据时间顺序重新排序,得到时间序列下的航空器轨迹信息数据。
步骤2.2:如图2所示,对航空器轨迹信息数据集进行坐标变换,将地理坐标系,如图2(a)转换成以地球质心为原点的ECEF坐标系,如图2(b),在将ECEF坐标系转换成以机场基准点原点的ENU坐标系,如图2(c)。
具体计算公式如下:
Figure BDA0003263415980000071
Figure BDA0003263415980000072
X=(N+h)×cosφ×cosλ (3)
Y=(N+h)×cosφ×sinλ (4)
Z=[N×(1-e2)+h]×sinφ (5)
式中,a表示地球的长半轴半径,取值为6378137m,b表示地球的短半轴半径,取值为6356752.3142m。e表示地球的离心率,N表示纬度为φ时的曲率半径,λ表示经度,单位为度,x,y,z为在ECEF坐标系对应的X,Y,Z轴的坐标值。
步骤2.3:将ECEF坐标系转化为以机场基准点为原点的ENU坐标系。ENU坐标系ZUp轴方向为垂直于机场基准点所在的地球表面方向,XEast轴方向为正东方向,YNorth方向为正北方向。转换公式具体如下:
xo,yo,zo=ECEF(φoo,ho) (6)
x,y,z=ECEF(φ,λ,h) (7)
XEast=-sinλo×(x-xo)-cosλo×(y-yo) (8)
YNorth=-cosλo×sinφo×(x-xo)-sinφo×sinλo×(y-yo)+cos(φo×(z-zo))(9)
ZUp=cosλo×cosφo×(x-xo)-sinφo×cosλo×(y-yo)+sin(φo×(z-zo)) (10)
式中λoo,ho表示机场基准点的纬度、经度、高度。xo,yo,zo表示在ECEF坐标系下的机场基准点坐标,ECEF(·)表示坐标转换为ECEF坐标系,XEast,YNorth,ZUp表示在ENU坐标系下的三维坐标。
步骤2.4:重建轨迹。本专利采用正则化算法对轨迹进行重建,使得轨迹更加平滑、更贴近于真实轨迹。
通过对式(25)求解(最小二乘法)优化问题对轨迹进行插值、平滑以及外推,得到平滑、等长的数据。
Figure BDA0003263415980000081
式中表示P∈RN×M重建航迹,长度为N,数据维度为M。
Figure BDA0003263415980000082
表示原始轨迹,长度为K,数据维度为M。A∈RK×N表示一个对角采样矩阵,如果
Figure BDA0003263415980000083
中存在空缺值,矩阵A中对应的数值为0。
Figure BDA0003263415980000084
表示F范数。β12表示正则化参数。D2∈R(N-2)×N是表示航空器轨迹加速度的二阶差分矩阵。D3∈R(N-4)×N表示抑制拟合轨迹中的微小的高频波动。式中ei表示时刻为i=1,2,...,N的标准单位向量。
(D2)i=ei-2ei+1+ei+2 (12)
(D3)i=(-ei-1+2ei-2ei+2+ei+3) (13)
步骤3:根据能量公式,将ENU坐标系下的数据转变能量数据,并根据时间数据和时间窗口长度生成以时间窗口为单位的数据。
步骤3.1:首先选择能量指标,并将步骤2处理完的数据通过能量计算公式转换成能量指标,将处理好的能量指标按照时间顺序生成以时间窗口为单位的数据。
能量指标的选择:
1)单位机械能(Specific Mechanical Energy,SME),即单位质量航空器包含机械能(势能与动能之和):
Figure BDA0003263415980000091
其中,m表示的是航空器质量,W表示的是航空器重量,h表示的是航空器的修正海压高度,v表示的是航空器的真空速,g表示当地的重力加速度。
单位机械能的物理含义是:如果在变速爬升中阻力与推力是平衡的,飞机的全部动能转换成势能所能达到的理论高度。如果没有飞机外力做功,则能量高度不会改变,如果阻力过大或者突发的外力做负功会导致单位机械能下降,所以其变化可以反映航空器的飞行状态,也可以作为航空器是否正常飞行的重要指标。
2)单位势能(SpecificPotentialEnergy,SPE),即单位质量航空器所包含的势能:
Figure BDA0003263415980000092
其中,m表示的是航空器质量,W表示的是航空器重量,h表示的是航空器的修正海压高度,g表示当地的重力加速度。
单位势能表征的是航空器的高度,对于进场航空器来说,由于本身飞行高度较低,高度的正常变化是航空器运行正常中的最重要的一环。
3)单位动能(SpecificKineticEnergy,SKE),即单位质量航空器所包含的动能:
Figure BDA0003263415980000093
其中,m表示的是航空器质量,W表示的是航空器重量,g表示当地的重力加速度。
单位动能表征的是航空器的速度与两倍的重力加速度的比值,对于进场航空器,单位动能过大容易冲出跑道,单位动能过低容易造成航空器跑道前着陆等不安全事件与事故症候。
4)单位机械能误差(Specific Mechanical Energy Error,SMEE),即单位质量的航空器机械能与典型进近的剖面对应的单位机械能的差值:
Figure BDA0003263415980000101
其中,SMEact是航空器在实际飞行过程中对应的单位机械能,SMEref是航空器在理论进近飞行剖面对应的单位机械能。
单位机械能误差直观的表示出航空器在实际飞行过程中航空器的机械能数据与预先设计好的进近着陆程序之间的差值,其提供了一个典型的对比数据来确定航空器是否异常。
5)单位机械能率(Specific Mechanical Energy Rate,SMER),即单位机械能随时间的变化率:
Figure BDA0003263415980000102
其中,d(·)表示的是求一阶导,t表示的是时间,h'表示的是修正海压高度的变化率,v'表示的是速度的变化率即加速度。
在外界环境稳定的条件下,单位机械能率正比于航空器外力做功的大小。所以对于处于最后进近阶段的航空器来说,油门处于慢车位置,单位机械能率仅与阻力有关。因此单位机械能率充分反映航空器受到阻力的变化趋势,这对航空器的异常能量检测和异常轨迹的实时预测提供了方法。
能量指标忽略了航空器本身的个体差异,如相同的机型,不同的油量或者客载等。在计算的过程中,没有使用航空器重量,仅需要对航空器进行相应机型分类的能量指标异常检测即可。因此能量指标的应用更加广泛、方便,所以发明采用能量指标作为航空器能量检测的重要特征。
步骤3.2:生成以时间窗口为单位的航空器能量数据。
航空器飞行过程中,不同阶段执行不同的飞行任务。因此对应到不同飞行阶段的飞行数据特征也不同,所以飞行数据特征具有较强的时间相关性。为了更好的检测和提取数据特征,本发明采用滑动窗口技术将原始的航空器飞行数据按照时间顺序重新组合生成时间窗口,计算不同窗口能量指标生成特征向量。
Figure BDA0003263415980000111
数据转化过程为:
Figure BDA0003263415980000112
针对事后分析,采用观测时刻点在中间的飞行数据序列{xt-k,...,xt,...,xt+k}来观测t时刻航空器飞行数据,如图3(a)所示时间窗口包括时刻t和前后k个时刻点。每一个时间窗口作为一个分析单元,每一个时间窗口作为一个分析单元,计算每一个时刻点对应的能量指标
Figure BDA0003263415980000113
Ej代表该时间窗口内航空器第j个能量特征,
Figure BDA0003263415980000114
代表在时刻t航空器的第j个能量特征,计算不同的能量特征,构建第i个能量窗口的能量特征向量yi=[E1 i,E2 i,E3 i,...,EN i]。我们可以从历史数据中得到一条完整的轨迹,对一个时刻点的分析就能参考前后的时刻点,基于一个短的时间周期的飞行数据来评估航空器在分析时刻点的能量状态,保证了航空器的数据的时间关联性。实时分析与事后分析的不同点在于分析时刻点在最后的飞行数据来分析时刻航空器的飞行数据,如图3(b),图中最左侧数据点对应的时刻为观测时刻点,时间窗口为该时刻后2k个时间点。计算得到不同时间窗口对应的能量特征向量,其中不同能量指标的量纲和单位不同且相差较大,例如单位机械能与单位机械能率的单位、量纲都不同。因此,为了使所有的能量指标能够进行同等比较、避免因为量纲或单位的原因限制模型性能,需要进行特征缩放,使每个能量指标的均值和单位方差为零。
步骤4:使用单分类SVM构建能量异常检测模型,通过历史飞行数据对能量异常检测模型进行训练使其具有识别异常能量的能力。
航空器运行异常检测可以简单看成是一个分类问题,将正常和异常进行分类,但不同于以往研究的是:航空数据集中正常数据集规模远大于异常数据集规模。针对正常与异常数据集极度不平衡的问题,本发明使用单分类向量机构建能量异常检测模型提高模型和数据集的匹配度,从而提高检测精度和效率。
步骤4.1:使用单分类SVM构建能量异常检测模型以提高模型和数据集的匹配度,定义训练数据集{x1,x2,...,xn}∈R,R是数据原本存在的特征空间,映射函数φ1将全部的训练集由特征空间R映射到特征空间F,分割超平面F1,松弛变量ζi,超平面截距ρ,超平面法向量w,允许的异常数据占全部数据的比值υ,拉格朗日乘数λ12,k(·)核函数,用于计算输入映射到高维空间能量特征的内积,yi=[E1 i,E2 i,E3 i,...,EN i]表示预处理完成的能量特征数据,SV为支持变量,该变量集合定义出分隔超平面。
步骤4.2:首先单分类支持向量机将全部的数据通过核函数投影到高维的空间中F,求解一个正常数据集距离原点最远的超平面F1,如图4所示。模型加入松弛变量ζi防止在训练过程中出现过拟合现象,设置参数υ允许少量的样本在分割超平面外,参数υ越大模型越灵敏但是包含的正常数据减少,υ过大容易错误将正常数据识别为异常。
步骤4.3:能量异常检测模型计算出特征空间里,训练集数据的正常区域,输入测试集的数据若在分割超平面外即在正常区域外,则返回-1样本判定为异常,若在分割超平面内,则返回1样本判定为正常。
当数据在原本的特征空间R无法直接使用一个“线性”超平面分隔时,我们可以通过映射函数φ1将数据映射到更高维的特征空间F,通过调整样本在F中的距离和角度,构建一个在F中的分割超平面,如图5。
超平面的公式表达为:
w·φ(y)-ρ=0 (20)
yi=[E1 i,E2 i,E3 i,...,EN i]表示预处理完成的能量特征数据,通过优化w和ρ的值,获得一个距离原点距离最远的平面,所以将问题转化成二次优化问题,式(21)中m=n-2k+1表示窗口个数:
Figure BDA0003263415980000131
w·φ(yi)-ρ+ζi≥0,ζi≥0 (21)
通过拉格朗日乘法计算计算条件极值:
Figure BDA0003263415980000132
Figure BDA0003263415980000133
Figure BDA0003263415980000134
Figure BDA0003263415980000135
通过使用拉格朗日技术和点积计算的核函数,决策函数变为(26)
Figure BDA0003263415980000136
由式(26)得出,当
Figure BDA0003263415980000137
时,样本数据在分隔超平面外,认为是异常数据;当
Figure BDA0003263415980000138
样本数据在分隔超平面上,认为是正常数据。当λ1=0是,样本数据在分隔超平面里。
根据分隔超平面上的支持向量对应的λ1重新设置截距(偏移量)ρ:
Figure BDA0003263415980000139
将(27)带入(26),再用sgn函数进行异常判断:
Figure BDA0003263415980000141
当(28)的返回值为+1时,则样本数据为正常数据;当(28)的返回值为-1时,则样本数据为异常数据。
步骤4.3:参数的设置及优化。
本发明充分考虑航空器实际运行中传感器传输数据导致的异常情况,例如空速管组件(ADM)会存在间歇性的不稳定导致空速不可靠,通过查询快速检查单空速不可靠连续五秒以上才会切换备用系统,另外滑动窗口维度过大会影响模型检测性能,导致模型数据漏警率增大。因此将滑动窗口的大小取为5。
在单分类SVM中,还需要定义参数υ和选定映射的核函数。RBF径向基核函数可以减少数值的计算困难、对数据的噪声有较强的抗干扰能力,所以本发明选择径向基核函数作为映射函数。参数υ是单分类SVM的松弛变量,参数υ较小,模型的灵敏度越低,容易将异常能量数据识别为正常。反之,模型的灵敏度越高,则容易将正常能量数据错误识别异常。本发明基于民航以安全第一的发展原则,在参数的选择上首先保证漏警率为0,再选择虚警率最小的参数。
根据已有的广州白云机场的ADS-B数据,筛选并分类以机场基准点为圆心半径50km、高度在6000m以下的离场航空器、进场航空器、飞越终端区的航空器等。数据包括航空器注册号、时间、经度、纬度、气压高度、速度、航向角。
由于ADS-B数据在传输的过程之中存在着缺失和重复,对于航空器数据中的缺失数据进行差值填补、对于重复数据直接删除。ADS-B中的航空器位置数据是基于地球坐标系,采用地球坐标系数据会增大公式复杂度并且不利于可视化展示。将地球坐标系中航空器位置转化为以地球质心为原点的ECEF坐标系,再将ECEF坐标系转化为以机场基准点为原点的ENU坐标系。ENU坐标系,ZUp轴正方向为垂直于机场基准点所在的地球表面方向,XEast轴方向为正东方向,YNorth方向为正北方向。采用正则化算法对轨迹进行重建,使得轨迹更加平滑、更贴近于真实轨迹。
生成以时间窗口为最小单位的能量数据。根据上述的能量公式带入计算每个时刻的能量数据。将轨迹序列X={Xi,i∈1,2,...,n}以时间窗口长度K为步长、按着时间顺序进行组合,得到数据组合{Xi,Xi+1,...,Xi+k-1},i∈1,2,...,n-k+1。
以起飞时第一个数据点或落地时最后一个数据点到跑到中心点的距离将轨迹与距离最近的跑道进行匹配。由于单分类支持向量机属于无监督算法,因此选取60%的航班数据作为训练集,20%的航班数据作为测试集,最后20%的航班数据作为验证集,并且向验证集及测试集各添加50条包含了异常能量的航班数据样本,该异常数据样本由空管人员进行标定获得。
在单分类SVM只需要确定参数υ和时间窗口长度K。本发明平衡传感器数据异常带来的数据短时间异常和时间窗口维度过大带来漏警率增大的弊端,并根据航空器飞行数据的异常快速简单单上切换备用系统的时间选择时间窗口长度5。参数υ与数据的质量相关,当训练样本数据噪声较大时,选择较大的υ过滤异常数据。反之,当训练样本数据噪声较小时,选择较小的υ避免降低模型识别正常数据的能力,导致模型实用性降低。但基于安全第一的基本思想,参数υ需先保证检测出测试集全部异常即漏警率为0,再考虑其他参数指标。最后经过验证集数据测试,模型性能指标均达到预先设置的阈值且为最优则确定模型参数,完成模型的训练。
以广州白云机场终端区为例,采用了2018年9月至2019年2月之间的飞行数据,总共包括65000条轨迹数据,其中55000条轨迹用来训练模型,10000条轨迹进行实验对比。本发明采用相同的训练集、测试集和验证集进行训练及参数选择。最终,以四条跑道模型检测指标AUC、虚警率、漏警率、精确率、召回率、F分数的均值绘制雷达图,如图6。从图6中可以看出本发明所使用单分类支持向量机在检测航空器能量异常上表现突出,其漏警率和虚警率都低于其他检测模型,并且AUC值、精确率、召回率、F分数均高于其他三个检测模型。因此,本发明所提的异常能量检测模型具备最优的检测性能。

Claims (7)

1.一种基于数据驱动的航空器能量异常识别方法,其特征在于,包括以下步骤:
(1)读取航空器轨迹相关数据,并对数据进行质量分析;
(2)对航空器轨迹信息数据进行预处理,并分为训练集、测试集和验证集;
(3)根据能量公式,将ENU坐标系下的数据转变能量数据,并根据时间数据和时间窗口长度生成以时间窗口为单位的数据;
(4)使用单分类SVM构建能量异常检测模型,通过历史飞行数据对能量异常检测模型进行训练使其具有识别异常能量的能力。
2.根据权利要求1所述的基于数据驱动的航空器能量异常识别方法,其特征在于,所述步骤(1)包括以下步骤:
(11)读取包括时间、二次雷达编号、航空器型号、航空器所处经度、航空器所处纬度、航空器所处高度、航空器速度和航空器角度的航空器轨迹相关数据;
(12)从数据是否存在重复值、缺失值、离群点三个方面对数据进行质量分析:对比飞机航迹信息数据集中的所有航迹点的所有属性,当两个航迹点之间的所有属性均相同时,则判断这两个航迹点为重复值;检查航迹点的属性值,当存在空值时,则该航迹信息为缺失值;离群点为明显偏离飞行轨迹的单个数据点,该点可能是由传感器异常或者数据传输异常造成的。
3.根据权利要求1所述的基于数据驱动的航空器能量异常识别方法,其特征在于,所述步骤(2)包括以下步骤:
(21)对航空器轨迹信息数据集进行数据清洗:数据中存在的重复值采用删除法,剔除重复航迹信息的数据记录;数据中存在的缺失值采用删除法和插补法;
(22)对航空器轨迹信息数据集进行坐标变换,将地理坐标系转换成以地球质心为原点的ECEF坐标系;
(23)将ECEF坐标系转化为以机场基准点为原点的ENU坐标系,ENU坐标系ZUp轴方向为垂直于机场基准点所在的地球表面方向,XEast轴方向为正东方向,YNorth方向为正北方向;
(24)对轨迹进行插值、平滑以及外推,得到平滑、等长的数据:
Figure FDA0003263415970000011
(D2)i=ei-2ei+1+ei+2
(D3)i=(-ei-1+2ei-2ei+2+ei+3)
其中,P∈RN×M重建航迹,长度为N,数据维度为M,
Figure FDA0003263415970000021
表示原始轨迹,长度为K,数据维度为M,A∈RK×N表示一个对角采样矩阵,如果
Figure FDA0003263415970000022
中存在空缺值,矩阵A中对应的数值为0,
Figure FDA0003263415970000023
表示F范数,β12表示正则化参数,D2∈R(N-2)×N是表示航空器轨迹加速度的二阶差分矩阵,D3∈R(N-4)×N表示抑制拟合轨迹中的微小的高频波动,ei表示时刻为i=1,2,...,N的标准单位向量。
4.根据权利要求1所述的基于数据驱动的航空器能量异常识别方法,其特征在于,所述步骤(3)包括以下步骤:
(31)选择能量指标,并将经过预处理后的数据通过能量计算公式转换成能量指标,将处理好的能量指标按照时间顺序生成以时间窗口为单位的数据;所述能量指标包括单位机械能、单位势能、单位动能、单位机械能误差、单位机械能率;
(32)生成以时间窗口为单位的航空器能量数据:
采用滑动窗口将原始的航空器飞行数据按照时间顺序重新组合生成时间窗口,计算不同窗口能量指标生成特征向量:
Figure FDA0003263415970000024
采用观测时刻点在中间的飞行数据序列{xt-k,...,xt,...,xt+k}来观测t时刻航空器飞行数据;每一个时间窗口作为一个分析单元,使用相对应的能量公式eqj计算每一个时刻点对应的能量指标
Figure FDA0003263415970000025
Ej代表该时间窗口内航空器第j个能量特征,
Figure FDA0003263415970000026
代表在时刻t航空器的第j个能量特征,计算不同的能量特征,构建第i个能量窗口的能量特征向量yi=[E1 i,E2 i,E3 i,...,EN i];对能量窗口内的能量特征向量进行特征缩放,使每个能量指标的均值和单位方差为零,使所有的能量指标能够进行同等比较、避免因为量纲或单位的原因限制模型性能。
5.根据权利要求1所述的基于数据驱动的航空器能量异常识别方法,其特征在于,所述步骤(4)包括以下步骤:
(41)使用单分类SVM构建能量异常检测模型以提高模型和数据集的匹配度,定义训练数据集{x1,x2,...,xn}∈R,R是数据原本存在的特征空间,映射函数φ1将全部的训练集由特征空间R映射到特征空间F,分割超平面F1,松弛变量ζi,超平面截距ρ,超平面法向量w,允许的异常数据占全部数据的比值υ,拉格朗日乘数λ12,k(·)核函数,用于计算输入映射到高维空间能量特征的内积,SV为支持变量,该变量集合定义出分隔超平面;
(42)单分类支持向量机将全部的数据通过核函数投影到高维的特征空间中F,求解一个正常数据集距离原点最远的超平面F1;单分类SVM模型加入松弛变量ζi防止在训练过程中出现过拟合现象,设置参数υ允许少量的样本在分割超平面外;所述参数υ是匹配数据集与模型的变量,当参数υ较小,模型的灵敏度越低,容易将异常能量数据识别为正常;反之,模型的灵敏度越高,则容易将正常能量数据错误识别异常;
(43)能量异常检测模型计算出特征空间里,训练集数据的正常区域,输入测试集的数据若在分割超平面外即在正常区域外,则返回-1样本判定为异常,若在分割超平面内,则返回1样本判定为正常;
当数据在原本的特征空间R无法直接使用一个“线性”超平面分隔时,通过映射函数φ1将数据映射到更高维的特征空间F,通过调整样本在F中的距离和角度,构建一个在F中的分割超平面,yi=[E1 i,E2 i,E3 i,...,EN i]表示预处理完成的能量特征数据:
w·φ(y)-ρ=0
通过优化w和ρ的值,获得一个距离原点距离最远的平面,将问题转化成二次优化问题:
Figure FDA0003263415970000041
w·φ(yi)-ρ+ζi≥0,ζi≥0
通过拉格朗日乘法计算计算条件极值:
Figure FDA0003263415970000042
Figure FDA0003263415970000043
Figure FDA0003263415970000044
Figure FDA0003263415970000045
通过使用拉格朗日技术和点积计算的核函数,决策函数为:
Figure FDA0003263415970000046
Figure FDA0003263415970000047
Figure FDA0003263415970000048
时,样本数据在分隔超平面外,认为是异常数据;当
Figure FDA0003263415970000049
样本数据在分隔超平面上,认为是正常数据;当λ1=0是,样本数据在分隔超平面里;
根据分隔超平面上的支持向量对应的λ1重新设置截距ρ:
Figure FDA00032634159700000410
yj∈SV
再用sgn函数进行异常判断:
Figure FDA00032634159700000411
当返回值为+1时,则样本数据为正常数据;当返回值为-1时,则样本数据为异常数据。
6.根据权利要求4所述的基于数据驱动的航空器能量异常识别方法,其特征在于,步骤(32)所述滑动窗口的大小为5。
7.根据权利要求5所述的基于数据驱动的航空器能量异常识别方法,其特征在于,所述单分类支持向量机中映射的核函数为RBF径向基核函数。
CN202111079489.2A 2021-09-15 2021-09-15 一种基于数据驱动的航空器能量异常识别方法 Pending CN113869379A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111079489.2A CN113869379A (zh) 2021-09-15 2021-09-15 一种基于数据驱动的航空器能量异常识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111079489.2A CN113869379A (zh) 2021-09-15 2021-09-15 一种基于数据驱动的航空器能量异常识别方法

Publications (1)

Publication Number Publication Date
CN113869379A true CN113869379A (zh) 2021-12-31

Family

ID=78995938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111079489.2A Pending CN113869379A (zh) 2021-09-15 2021-09-15 一种基于数据驱动的航空器能量异常识别方法

Country Status (1)

Country Link
CN (1) CN113869379A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114662625A (zh) * 2022-05-26 2022-06-24 成都飞机工业(集团)有限责任公司 一种飞行参数数据重构方法、装置、设备及介质
CN114692760A (zh) * 2022-03-30 2022-07-01 中国民航科学技术研究院 下降率估算模型构建、下降率估算方法、装置及电子设备
CN114756538A (zh) * 2022-04-21 2022-07-15 中国民用航空飞行学院 一种民航训练数据处理分析系统
CN115021996A (zh) * 2022-05-26 2022-09-06 云盾智慧安全科技有限公司 云安全中心的态势感知与动态重构方法、装置及存储介质
CN115240144A (zh) * 2022-09-21 2022-10-25 青岛宏大纺织机械有限责任公司 一种纺纱捻线智能识别瑕疵方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114692760A (zh) * 2022-03-30 2022-07-01 中国民航科学技术研究院 下降率估算模型构建、下降率估算方法、装置及电子设备
CN114692760B (zh) * 2022-03-30 2023-03-24 中国民航科学技术研究院 下降率估算模型构建、下降率估算方法、装置及电子设备
CN114756538A (zh) * 2022-04-21 2022-07-15 中国民用航空飞行学院 一种民航训练数据处理分析系统
CN114662625A (zh) * 2022-05-26 2022-06-24 成都飞机工业(集团)有限责任公司 一种飞行参数数据重构方法、装置、设备及介质
CN115021996A (zh) * 2022-05-26 2022-09-06 云盾智慧安全科技有限公司 云安全中心的态势感知与动态重构方法、装置及存储介质
CN115021996B (zh) * 2022-05-26 2023-11-21 云盾智慧安全科技有限公司 云安全中心的态势感知与动态重构方法、装置及存储介质
CN115240144A (zh) * 2022-09-21 2022-10-25 青岛宏大纺织机械有限责任公司 一种纺纱捻线智能识别瑕疵方法及系统
CN115240144B (zh) * 2022-09-21 2022-12-27 青岛宏大纺织机械有限责任公司 一种纺纱捻线智能识别瑕疵方法及系统

Similar Documents

Publication Publication Date Title
CN113869379A (zh) 一种基于数据驱动的航空器能量异常识别方法
CN108594788B (zh) 一种基于深度随机森林算法的飞机作动器故障检测与诊断方法
CN113486938B (zh) 基于多分支时间卷积网络的重着陆的分析方法和装置
CN105956790B (zh) 低空飞行态势安全性评估指标及其评估方法
KR102170632B1 (ko) 군집 시스템에서 실시간 이상 탐지 방법 및 장치
Ackley et al. A supervised learning approach for safety event precursor identification in commercial aviation
US11790767B2 (en) Method, apparatus, device and storage medium for pre-warning of aircraft flight threat evolution
CN113128342B (zh) 航迹数据预处理方法及空中目标识别方法
CN111680875A (zh) 基于概率基线模型的无人机状态风险模糊综合评价方法
CN115064009B (zh) 一种终端区无人机与有人机冲突风险等级划分方法
Zhao et al. Robust data-driven fault detection: An application to aircraft air data sensors
Tian et al. Research on flight phase division based on decision tree classifier
Li et al. A lightweight and explainable data-driven scheme for fault detection of aerospace sensors
CN113284369B (zh) 一种基于ads-b实测航路数据的预测方法
Wu et al. Aircraft flight regime recognition with deep temporal segmentation neural network
Hrastovec et al. Machine learning model for aircraft performances
Deng et al. Trajectory pattern identification for arrivals in vectored airspace
Zhang et al. UAV Trajectory Prediction Based on Flight State Recognition
Pan et al. A model of fuel consumption estimation and abnormality detection based on airplane flight data analysis
Dong et al. Deep neural networks-based air data sensors fault detection for aircraft
Arts et al. Trajectory Based Flight Phase Identification with Machine Learning for Digital Twins
CN115205582A (zh) 一种拟图智能化航空传感器故障检测与分类方法
You et al. Heavy landing detection and prediction based on qar data
Smyers et al. AVOIDDS: Aircraft Vision-based Intruder Detection Dataset and Simulator
Klaproth et al. Investigation of Mission Performance Sensitivities for Unmanned Aerial Vehicles Based on Parametric Similarity Assessment of Mission Requirements

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination