CN115797804A - 一种基于不平衡时序航空飞行数据的异常检测方法 - Google Patents
一种基于不平衡时序航空飞行数据的异常检测方法 Download PDFInfo
- Publication number
- CN115797804A CN115797804A CN202211459631.0A CN202211459631A CN115797804A CN 115797804 A CN115797804 A CN 115797804A CN 202211459631 A CN202211459631 A CN 202211459631A CN 115797804 A CN115797804 A CN 115797804A
- Authority
- CN
- China
- Prior art keywords
- data
- time sequence
- aviation flight
- flight data
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000005070 sampling Methods 0.000 claims abstract description 14
- 238000012952 Resampling Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 7
- 230000005856 abnormality Effects 0.000 claims description 6
- 230000007774 longterm Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 claims description 2
- 238000000354 decomposition reaction Methods 0.000 abstract 1
- 238000002474 experimental method Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 4
- 238000002679 ablation Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004821 distillation Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000000528 statistical test Methods 0.000 description 2
- 241000252203 Clupea harengus Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000019514 herring Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于不平衡时序航空飞行数据的异常检测方法,首先输入飞行测试采集的长时序数据,使用基于聚类的欧几里得距离的重采样方法CRD方法对长时间时序数据进行上采样;然后对处理后的时序数据使用时序数据转换为图像S2I方法进行时序数据到图像的转换;接下来将得到图像输入到训练网络中,训练时采用基于方差的损失函数VBL作为损失函数;最后实现对航空飞行数据的异常检测。本发明缓解了航空飞行数据不平衡的问题,提高了航空飞行数据异常检测效率,节约航空飞行数据异常检测成本。
Description
技术领域
本发明属于航空技术领域,具体涉及一种航空飞行数据的异常检测方法。
背景技术
高效且准确的飞行数据异常检测对保障航空安全有着至关重要的作用,航空安全不仅仅关乎财产损失问题,更与人身安全紧密联系。因此,试验和检测环节在飞机交付使用前必不可少,其中,航空飞行数据异常检测,即航空飞行传感器异常检测是十分重要的一环。然而,在航空飞行数据采样传感器定期校准的前提下难以保证所获得的航空飞行测试是有效的。这意味着我们很可能在耗费大量人力物力的情况下依旧很难得到有效的飞行测试。因此,如何基于现有飞行数据,分析数据异常,进而判断传感器异常状态是一个难题。
传感器异常是指传感器由于某些原因导致其性能降低至阈值以下,导致传感器的可靠性变差。而传感器的性能特征无法直接表征的,是隐含在航空飞行试验数据当中,其数据特点是时间序列长、数据不平衡和类间差异小。这就使得通过传统的异常检测方式很难得到准确的结果,所以本发明旨在设计一种更加稳定高效且足够准确的方法进行长时序不平衡航空飞行数据的异常检测。
目前主要的异常检测方法分为统计学方法、传统机器学习方法、基于自然语言处理的方法以及基于计算机视觉的方法四类。其中基于统计的检测方法是假设给定的数据集服从分布和概率模型,然后通过不一致性测试来测试需要验证的数据是否服从相应的模型。如Dietterich等人在文献“T.G.Dietterich,‘Approximate statistical tests forcomparing supervised classification learning algorithms,’Neural computation,vol.10,no.7,pp.1895–1923,1998.”提出的“近似统计测试方法”以及Goldstein等人在文献“M.Goldstein and A.Dengel,‘Histogram-based outlier score(hbos):A fastunsupervised anomaly detection algorithm,’KI-2012:poster and demo track,vol.9,2012.”提出的“基于直方图的异常检测分数”方法。而基于传统机器学习的方法是从数据中手动提取特征,然后输入网络进行学习预测。如Hosseinzadeh等人在文献“M.Hosseinzadeh,A.M.Rahmani,B.V o,M.Bidaki,M.Masdari,and M.Zangakani,‘Improving security using svm-based anomaly detection:issues and challenges,’Soft Computing,vol.25,no.4,pp.3195–3223,2021.”提出的“基于支持向量机的异常检测”方法。在之后出现的基于自然语言处理的方法主要考虑的是对存在时间序列的数据如何进行处理。如Park等人在文献“D.Park,Y.Hoshi,and C.C.Kemp,‘A multimodal anomalydetector for robot-assisted feeding using an lstm-based variationalautoencoder,’IEEE Robotics and Automation Letters,vol.3,no.3,pp.1544–1551,2018.”提出的“基于lstm的变分自编码器”的检测方法。而基于计算机视觉的方法主要考虑的是如何运用计算机视觉方法处理时序数据。如Deng等人在文献“H.Deng and X.Li,‘Anomaly detection via reverse distillation from one-class embedding,’inProceedings of the IEEE/CVF Conference on Computer Vision and PatternRecognition(CVPR),June 2022,pp.9737–9746.”提出的“反向蒸馏进行异常检测”的方法。
但是航空飞行数据具有时间序列长、数据不平衡等特点,而以上方法都没有缓解超长时间序列且数据不平衡的问题。
虽存在其他时序数据转换为图像的方法,如Wang等人在文献“Z.Wang andT.Oates,‘Imaging time-series to improve classification and imputation,’inTwenty-F ourth International Joint Conference on Artificial Intelligence,2015.”提出的马尔科夫转移场和Marwan等人在文献“N.Marwan,N.Wessel,U.Meyerfeldt,A.Schirdewan,and J.Kurths,‘Recurrence-plot-based measures of complexity andtheir application to heart-rate-variability data,’Physical review E,vol.66,no.2,p.026702,2002.”提出的递归图方法。但是,针对航空飞行数据,采用以上方法生成图像时,会导致图像像素过大。
发明内容
为了克服现有技术的不足,本发明提供了一种基于不平衡时序航空飞行数据的异常检测方法,首先输入飞行测试采集的长时序数据,使用基于聚类的欧几里得距离的重采样方法(Cluster-based Resampling approach using Euclidean Distance,CRD)方法对长时间时序数据进行上采样;然后对处理后的时序数据使用时序数据转换为图像(Series-to-Image,S2I)方法进行时序数据到图像的转换;接下来将得到图像输入到训练网络中,训练时采用基于方差的损失函数(Variance-Based Loss,VBL)作为损失函数;最后实现对航空飞行数据的异常检测。本发明缓解了航空飞行数据不平衡的问题,提高了航空飞行数据异常检测效率,节约航空飞行数据异常检测成本。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:输入飞行测试采集的长时序数据,采用基于聚类的欧氏距离重采样CRD方法对长时序数据进行上采样;即使用欧式距离判断两个样本间的距离;
欧式距离如下所示:
其中,X与Y表示两个样本,xi与yi表示两个样本的距离度量;
步骤2:将上采样处理后的时序数据采用S2I方法进行时序数据到图像的转换;即建立时间-值的坐标系,得到数据随时间变化的曲线图,直接反应图像的时间数据特征;
步骤3:将步骤2得到的图像化后的数据输入到深度神经网络模型中进行训练,训练时采用VBL作为损失函数;
VBL表示如下所示:
步骤4:采用训练好的网络进行航空飞行数据的异常检测。
优选地,所述深度神经网络为VGG-16或ResNet-34模型。
本发明的有益效果如下:
1、本发明提出的S2I方法不仅能直接反应数据的随时间变化特征,更可以控制横纵坐标值以达到生成图像大小问题,使网络模型训练更方便。
2、本发明可以充分利用计算机视觉在高级语义解析和全局语义覆盖的作用,有效利用计算机视觉中分类任务和异常检测方法。
3、本发明针对数据不平衡问题提出的VBL方法,通过概率分布表征模型的拟合度,使得检测效果更加优秀。该发明不仅可以应用与航空飞行数据,更可以应用其他工业领域,如汽车辅助驾驶,航空遥测等领域,具有良好的应用价值和应用前景。
附图说明
图1为本发明方法整体架构图。
图2为本发明方法流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
为克服超长时序数据问题,本发明结合项目需求及航空数据特点,与计算机视觉任务相结合,提出时序数据转换为图像(Series-to-Image,S2I)的方法。在本发明提出S2I方法之前,虽存在其他时序数据转换为图像的方法,但是,针对航空飞行数据,采用以上方法生成图像时,会导致图像像素过大。例如,本发明中使用的航空飞行数据单条数据长度约有300000个采集点,而使用上述方式转换为图像后会有300000*300000像素大小,难以运用在计算机视觉网络架构中。而本发明与以往的序列数据转换为图像不同,通过建立“时间-值”坐标系,直接从图像反应时序数据特征。使用本发明进行序列数据转换为图像时,水平坐标为时间,因此可以具体地将时间序列转换到图像的时间维度上。此外,本发明通过控制水平与垂直坐标范围控制图像生成大小,避免图像规格不统一或大小不合适等问题。
为缓解数据分布不平衡问题,本发明结合机器学习相关算法,提出基于聚类的欧几里得距离的重采样方法(Cluster-based Resampling approach using EuclideanDistance,CRD)和基于方差的损失函数(Variance-Based Loss,VBL)两种方式。其中,使用CRD方法对少数样本进行上采样;使用VBL以更好地拟合和稳定训练,检测飞行数据异常。整体架构如图1:
一种基于不平衡时序航空飞行数据的异常检测方法,包括如下步骤:
步骤1:输入飞行测试采集的长时序数据,采用基于聚类的欧氏距离重采样CRD方法对长时序数据进行上采样;即使用欧式距离判断两个样本间的距离,考虑到拥有更多样本的聚类已经具备了更多特征,在过采样时不保留更多信息,通过对决策边界附近的少数类样本进行过采样,提高网络拟合决策边界的能力;
欧式距离如下所示:
其中,X与Y表示两个样本,xi与yi表示两个样本的距离度量;
步骤2:将上采样处理后的时序数据采用S2I方法进行时序数据到图像的转换;即建立时间-值的坐标系,得到数据随时间变化的曲线图,直接反应图像的时间数据特征;
步骤3:将步骤2得到的图像化后的数据输入到VGG-16或ResNet-34模型中进行训练,训练时采用VBL作为损失函数;
VBL表示如下所示:
步骤4:对所有对比数据集(本发明外的其他三种数据集,如表2)均采用上述步骤得到结果后与相对应文献中实验结果进行比对,得出对比实验结果。。
具体实施例:
1、实验设置。
1)评估指标。采用基于分类中使用的各种评估指标,性能常反映在准确率、精确度、召回率以及F1分数上。如表1:
表1混淆矩阵
其中,AC指实际结果,PC指预测结果。准确率、精确度、召回率以及F1分数计算公式分别如下:
2)数据选择。本发明在项目航空飞行数据集上进行实验,该数据集包含两个类,即少数类(正类)和多数类(负类)。它由700个样本组成(350个训练样本和350个测试样本)。训练集中有310个负样本和40个正样本,测试集中有309个负样本和41个正样本。在所有样本中,最小、最大和平均样本长度分别为287、954,328、591和307、869。并且,选择Dau等人在文献“H.A.Dau,A.Bagnall,K.Kamgar,C.-C.M.Yeh,Y.Zhu,S.Gharghabi,C.A.Ratanamahatana,and E.Keogh,‘The ucr time series archive,’IEEE/CAA Journalof Automatica Sinica,vol.6,no.6,pp.1293–1305,2019.”中采用的三个数据集来验证我们方法的效率,包括Earthquakes、HandOutlines和Herring。
数据集对比如表2:
表2数据集对比
数据集 | 类型 | 长度 | 训练集 | 测试集 | 类别数量 |
Earthquakes | 传感器 | 512 | 322 | 139 | 2 |
HandOutLines | 图像 | 2709 | 1000 | 370 | 2 |
Herring | 图像 | 512 | 64 | 64 | 2 |
本发明 | 传感器 | 318693 | 350 | 350 | 2 |
3)细节方面。通过对比实验,本发明选取He等人在文献“K.He,X.Zhang,S.Ren,andJ.Sun,‘Deep residual learning for image recognition,’in Proceedings of theIEEE conference on computer vision and pattern recognition,2016,pp.770–778.”中提出的RestNet34作为本发明的主干网络。此外,本发明实验中设置相同的超参数,旨在保证对比实验的可靠性和实验准确性。
2、消融实验
消融实验旨在说明本发明所设计模块的有效性。本发明进行两方面的消融实验。其一是忽略上采样和重新加权,即不考虑CRD模块和VBL模块,验证不同参数对S2I的影响;其次是在我们提出的S2I模块的基础上,使用S2I+ResNet34充分探讨CRD和VBL对模型性能的提升。
1)S2I模块的作用。本发明在时序数据转换为图像时,考虑曲线的比例和类型,以及数据是否归一化。具体来说,我们使用Matplotlib中的pyplot函数设置图像中传感器曲线的宽度,宽度设置为{0.5、1.0、1.5、2.0、2.5}。曲线类型为直线或点。类似地,点大小对应于{0.5、1.0、1.5、2.0、2.5},点使用pyplot中的参数名称markersize。使用最小-最大归一化对数据进行归一化,该归一化将要归一化的每个特征点的值范围缩放到[0,1]。通过实验对比,考虑四个评估指标,本发明选取线宽为1.5且不归一化作为S2I的设置。通过实验,本发明验证当采用S2I模块进行数据处理时,在VGG-16和ResNet-34上都是可以进行图像化处理,并有较为准确的结果,即时序数据经S2I模块转换为图像后,是可以用在图像处理的网络中。
2)CRD和VBL的作用。我们采用ResNet34作为主干网络,在使用S2I对图像处理后,分别考虑有无CRD和VBL模块的影响,实验证明在加入CRD和VBL模块后,F1分数得到提升。
表3实验结果
表4 CRD和VBL模块
3、实验分析
对于极不平衡的数据集,精度无法有效评估模型拟合能力的质量。以我们的数据集为例,350个测试集样本包含309个负样本和41个正样本。不平衡比达到7.54:1。这意味着,当模型将所有样本预测到多数类中时,准确率为0.883。这是在不平衡数据集中对模型的不准确评估。F1评分考虑模型分类的精度和召回率,对模型的评价是公平有效的。而在没有CRD和VBL的情况下,主干具有更高的精度。但这种精度不能表示模型拟合的程度,因为它们的F1分数都较低。
实验验证S2I在将数据转换为图像方面的有效性。
此外,实验表明,CRD和VBL分别在精度和召回率方面发挥作用,两者的结合可以整体提高F1成绩。而且,对比实验证明,本发明提出的方法可以进一步结合不同的高级分类模型,用于各种不平衡的时序数据集。
本发明的主要创新点在于:
1.提出S2I的时序数据转换为图像数据的方法。通过建立“时间-值”的坐标系,将时间序列转换为图像,以横轴作为时间轴直接映射时序数据的时间关系。
2.提出CRD的上采样方法。使用基于聚类的上采样方法,对少数样本进行上采样,旨在平衡数据。
3.提出VBL的损失函数。采用VBL方法更好拟合和稳定训练,旨在检测航空飞行数据中的异常。
Claims (2)
1.一种基于不平衡时序航空飞行数据的异常检测方法,其特征在于,包括如下步骤:
步骤1:输入飞行测试采集的长时序数据,采用基于聚类的欧氏距离重采样CRD方法对长时序数据进行上采样;即使用欧式距离判断两个样本间的距离;
欧式距离如下所示:
其中,X与Y表示两个样本,xi与yi表示两个样本的距离度量;
步骤2:将上采样处理后的时序数据采用S2I方法进行时序数据到图像的转换;即建立时间-值的坐标系,得到数据随时间变化的曲线图,直接反应图像的时间数据特征;
步骤3:将步骤2得到的图像化后的数据输入到深度神经网络模型中进行训练,训练时采用VBL作为损失函数;
VBL表示如下所示:
步骤4:采用训练好的网络进行航空飞行数据的异常检测。
2.根据权利要求1所述的一种基于不平衡时序航空飞行数据的异常检测方法,其特征在于,所述深度神经网络为VGG-16或ResNet-34模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211459631.0A CN115797804A (zh) | 2022-11-17 | 2022-11-17 | 一种基于不平衡时序航空飞行数据的异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211459631.0A CN115797804A (zh) | 2022-11-17 | 2022-11-17 | 一种基于不平衡时序航空飞行数据的异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115797804A true CN115797804A (zh) | 2023-03-14 |
Family
ID=85439573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211459631.0A Pending CN115797804A (zh) | 2022-11-17 | 2022-11-17 | 一种基于不平衡时序航空飞行数据的异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115797804A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116204846A (zh) * | 2023-05-06 | 2023-06-02 | 云南星晟电力技术有限公司 | 一种基于可见图的配电网传感器数据异常快速定位方法 |
-
2022
- 2022-11-17 CN CN202211459631.0A patent/CN115797804A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116204846A (zh) * | 2023-05-06 | 2023-06-02 | 云南星晟电力技术有限公司 | 一种基于可见图的配电网传感器数据异常快速定位方法 |
CN116204846B (zh) * | 2023-05-06 | 2023-08-01 | 云南星晟电力技术有限公司 | 一种基于可见图的配电网传感器数据异常快速定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111368885B (zh) | 一种航空发动机气路故障诊断方法 | |
US8170379B2 (en) | Image processing apparatus and image retrieval method | |
CN111103139A (zh) | 基于grcmse与流形学习的滚动轴承故障诊断方法 | |
CN110738247B (zh) | 一种基于选择性稀疏采样的细粒度图像分类方法 | |
CN107563433B (zh) | 一种基于卷积神经网络的红外小目标检测方法 | |
CN106446895A (zh) | 一种基于深度卷积神经网络的车牌识别方法 | |
CN107830996B (zh) | 一种飞行器舵面系统故障诊断方法 | |
CN104504366A (zh) | 基于光流特征的笑脸识别系统及方法 | |
CN108333468B (zh) | 一种有源配电网下不良数据的识别方法及装置 | |
CN109029993A (zh) | 结合遗传算法优化参数和机器视觉的轴承故障检测算法 | |
CN113139594B (zh) | 一种机载图像无人机目标自适应检测方法 | |
CN106096517A (zh) | 一种基于低秩矩阵与特征脸的人脸识别方法 | |
CN115953666B (zh) | 一种基于改进Mask-RCNN的变电站现场进度识别方法 | |
CN117237902B (zh) | 基于深度学习的机器人物体识别系统 | |
CN114694178A (zh) | 基于Faster-RCNN算法的电力作业中安全帽监测方法及系统 | |
Adiwinata et al. | Fish species recognition with faster r-cnn inception-v2 using qut fish dataset | |
CN115797804A (zh) | 一种基于不平衡时序航空飞行数据的异常检测方法 | |
Zheng et al. | Benchmarking unsupervised anomaly detection and localization | |
Liu et al. | A novel deep framework for change detection of multi-source heterogeneous images | |
CN114974306A (zh) | 一种基于深度学习的变压器异常声纹检测识别方法和装置 | |
CN103942572A (zh) | 一种基于双向压缩数据空间维度缩减的面部表情特征提取方法和装置 | |
CN116977834B (zh) | 一种开放条件下分布内外图像识别方法 | |
Wangli et al. | Foxtail Millet ear detection approach based on YOLOv4 and adaptive anchor box adjustment | |
CN111985158A (zh) | 一种基于迁移学习的电液伺服阀故障诊断方法及系统 | |
CN116188445A (zh) | 一种产品表面缺陷的检测定位方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |