CN114997296A

CN114997296A - 一种基于gru-vae模型的无监督航迹异常检测方法及系统

Info

Publication number: CN114997296A
Application number: CN202210581914.6A
Authority: CN
Inventors: 张静; 李磊; 周明康; 王哲; 可珂; 莫有权; 王晓梅
Original assignee: Information Engineering University of PLA Strategic Support Force
Current assignee: Information Engineering University of PLA Strategic Support Force
Priority date: 2022-05-26
Filing date: 2022-05-26
Publication date: 2022-09-02

Abstract

本发明公开一种基于GRU‑VAE模型的无监督航迹异常检测方法及系统，该方法包括：使用预处理后得到的历史航迹数据集训练GRU‑VAE航迹数据异常检测模型，采用平均绝对距离度量方法计算重构损失并可视化分布情况，采用正态分布法确定重构损失阈值区间，将阈值参考范围百分比作为阈值区间的置信度；运用训练好的GRU‑VAE航迹数据异常检测模型对预处理后的实时航迹数据集进行检测，对重构损失超出阈值区间的异常航迹序列进行深入研判，实时报告运动目标的航迹态势信息。本发明的GRU‑VAE模型在训练中学习航迹数据时序特性的同时，实现对无标注的航迹数据的精确重构，通过检测实时航迹数据的重构误差发现异常目标航迹序列。

Description

一种基于GRU-VAE模型的无监督航迹异常检测方法及系统

技术领域

本发明涉及航迹数据处理技术领域，尤其涉及一种基于GRU-VAE模型的无监督航迹异常检测方法及系统。

背景技术

当前，我们可以通过获取大量的航迹数据，深入研究海空交通规律和行为模式，为航域监管、异常行为识别和港口设施建设提供有力信息保障。然而，基于实时航迹数据的目标异常检测技术是及时发现目标危险行为的重要手段。特别是在航路交织、情况复杂的特殊航域，及时发现目标行为异常乃至判别其异常类型，才能采取有针对性的干预办法，确保交通安全。与此同时，我国周边海空形势异常复杂，各国的防空识别区相互交错，敌方军机军舰闯入防空识别区甚至闯入领海领空抵近侦察的情况时有发生，因此基于实时的航迹数据发现运动目标的异常行为十分必要。

相关学者对基于航迹数据的航迹异常检测问题做了大量的深入研究。

(一)统计学方法过于依赖人工提取数据特征

基于传统的统计学方法，曹伟等[曹伟,刘亚帅,管志强.采用编码降维及DTW算法改进的船舶航迹聚类[J].现代防御技术,2019,47(05):151-156.]对DTW算法进行改进，运用编码降维的方法对数据进行预处理，有效保留了数据特征之间的时序相关性，提高了异常检测效率；刘亚帅等[刘亚帅,曹伟,管志强.基于网格化的船舶航迹异常检测算法[J].雷达与对抗,2019,39(01):19-23.]采用网格化特征重构的方法，将计算得到的航迹密度和阈值进行对比从而实现航迹的异常检测，但方法性能取决于依赖专家知识进行人工设定的阈值；王晓华等[王晓华,邹杰,李立,等.基于TBM双层融合架构的航路属性异常检测[J].电子学报,2017,45(03):577-583.]将马尔可夫模型与TBM框架结合，在时间序列上对数据特征进行指派融合，通过对比预测值和观测值的差异实现航迹数据的异常检测。传统的统计学方法在航迹数据的异常检测问题准确度高，但较为依赖人工提取数据特征，实时性不高，不利于在一线工作中推广。

(二)机器学习方法无法处理高维数据样本

基于海量的航迹数据，机器学习乃至深度学习方法在算力巨大提升的今天得到广泛应用。李楠[李楠,刘朋,靳辉辉.机动区航空器速度异常检测研究[J].计算机仿真,2019,36(01):45-50.]等运用支持向量机理论建立速度异常检测模型，及时找出速度异常的航空器；杜辰飞等[杜辰飞,曲建岭,孙文柱,et al.Flight Data Abnormity Detection MethodBased on Sparse Auto-encoder[J].计测技术,2015,000(002):11-14,61.]提出一种基于稀疏自编码器的异常检测方法，对样本分布进行重构，准确检测航迹数据异常；国外学者Kim[KIM J S,SCOTT C.Robust Kernel Density Estimation:IEEE InternationalConference on Acoustics[C],2008.]，Xiong L[XIONG L,PóCZOS B,SCHNEIDER J.GroupAnomaly Detection using Flexible Genre Models[J].Advances in NeuralInformation Processing Systems,2011.]和Zimek[ZIMEK A,SCHUBERT E,KRIEGEL H P.Asurvey on unsupervised outlier detection in high-dimensional numerical data[J].Statal Analysis&Data Mining,2012,5(5):363-387.]将聚类方法进行推广，通过计算异常序列到聚类点簇中心的距离，实现对异常点的检测。但以上方法只能同时检测运动目标的一到两个运动特征，然而航迹数据是具有多个运动特征的高维数据样本，因此在航迹数据异常检测问题上必须全面考虑所有航迹特征。

(三)基于深度神经网络的方法还有待进一步提升空间

Park[PARK D,HOSHI Y,KEMP C.A Multimodal Anomaly Detector for Robot-Assisted Feeding Using an LSTM-Based Variational Autoencoder[J].IEEE Roboticsand Automation Letters,2018,3(3):1544-1551.]等学者将长短时记忆网络(Long-ShortTerm Memory，LSTM)引入数据异常检测领域，构建一个深度神经网络并设置重构误差算法，深入挖掘时序数据的分布情况，灵敏判别了数据的异常变化；Niu,Z.[NIU Z,YU K,WUX.LSTM-Based VAE-GAN for Time-Series Anomaly Detection[J].Sensors,2020,20(13):3738.]等学者在长短期记忆网络的基础上，将生成对抗网络用于数据样本重构，对异常进行了快速检测，为飞参数据异常检测提供了全新思路；Yuan,Y等[YUAN Y,LIN L,HUOL,et al.Using An Attention-Based LSTM Encoder–Decoder Network for Near Real-Time Disturbance Detection[J].IEEE Journal of Selected Topics in AppliedEarth Observations and Remote Sensing,2020,13:1819-1832.]采用基于注意力机制的深度自编码器方法对数据进行有效重构，但针对时序数据异常检测还存在缺陷。以上方法采取了构建深度神经网络模型对数据特征自动提取，但针对航迹特征异常检测问题其性能待进一步提高。

(四)一线工作现状

实际工作中，我们需要面对的是没有异常先验信息标注的原始航迹数据，因此基于数据重构并且可深入挖掘航迹时序信息的无监督异常检测方法更贴合一线实际应用情况。

发明内容

本发明针对现有的航迹异常检测方法存在的过于依赖人工提取数据特征、无法处理高维数据样本等问题，提出一种基于GRU-VAE(Gate Recurrent Unit-VariationalAutoencoder，门控循环单元的变分自编码器)模型的无监督航迹异常检测方法及系统，引入GRU门控循环单元对VAE变分编码器模型进行改进，模型在训练中学习航迹数据时序特性的同时，实现对无标注的航迹数据的精确重构，通过检测实时航迹数据的重构误差发现异常目标航迹序列。

为了实现上述目的，本发明采用以下技术方案：

本发明一方面提出一种基于GRU-VAE模型的无监督航迹异常检测方法，包括：

步骤1：使用预处理后得到的历史航迹数据集训练GRU-VAE航迹数据异常检测模型，采用平均绝对距离度量方法计算重构损失并可视化分布情况，采用正态分布法确定重构损失阈值区间，将阈值参考范围百分比作为阈值区间的置信度；

步骤2：运用训练好的GRU-VAE航迹数据异常检测模型对预处理后的实时航迹数据集进行检测，对重构损失超出阈值区间的异常航迹序列进行深入研判，实时报告运动目标的航迹态势信息。

进一步地，按照如下方式进行航迹数据集预处理：

首先，遍历航迹数据集中的每一条航迹序列，计算每个航迹点向量的加速度和航向变化率；然后，对整个航迹数据集中每一条航迹序列的航迹点向量特征值进行最大最小值归一化处理；之后，将数据转换为深度神经网络模型可接收的格式。

进一步地，所述GRU-VAE航迹数据异常检测模型的搭建以VAE变分自编码器为基础，将VAE的编码器输入层和解码器输出层替换为GRU门控循环单元。

进一步地，按照下式计算航迹序列重构损失R_loss：

其中，W_R和W是重构航迹序列和原始航迹序列，

和w_i分别是在第i个时间戳上的重构和原始航迹点向量，k是航迹序列中的航迹点个数，j是航迹点向量中的特征个数。

进一步地，按照下式确定重构损失阈值区间和阈值区间的置信度：

式中

为重构误差的总体均数，S为标准差，u为界值，α是阈值区间的显著性水平；

将1-α作为阈值区间的置信度，1-α为阈值参考范围百分比。

本发明另一方面提出一种基于GRU-VAE模型的无监督航迹异常检测系统，包括：

模型训练模块，用于使用预处理后得到的历史航迹数据集训练GRU-VAE航迹数据异常检测模型，采用平均绝对距离度量方法计算重构损失并可视化分布情况，采用正态分布法确定重构损失阈值区间，将阈值参考范围百分比作为阈值区间的置信度；

异常检测模块，用于运用训练好的GRU-VAE航迹数据异常检测模型对预处理后的实时航迹数据集进行检测，对重构损失超出阈值区间的异常航迹序列进行深入研判，实时报告运动目标的航迹态势信息。

进一步地，按照如下方式进行航迹数据集预处理：

进一步地，按照下式计算航迹序列重构损失R_loss：

其中，W_R和W是重构航迹序列和原始航迹序列，

式中

将1-α作为阈值区间的置信度，1-α为阈值参考范围百分比。

与现有技术相比，本发明具有的有益效果：

(一)针对航迹数据特点，选用绝对平均距离作为重构损失计算方法，实验证明该法可有效提升模型性能；

(二)基于数理统计知识确定异常检测阈值。本发明将重构损失在任意置信度下的置信区间确定为阈值的上下限，克服了存在正常航迹数据集中极少量异常航迹序列对模型训练的影响；

(三)提出一种基于数据重构的GRU-VAE异常检测模型，以VAE变分自编码器为基础，将VAE的编码器输入层和解码器输出层替换为GRU门控循环单元，经实验证明在航迹异常检测上该模型性能得到提升，模型最高F1得分为86.36％，召回率达95％，比性能位居其次的LSTM-VAE方法分别高出2.28％和2.50％。

附图说明

图1为本发明实施例一种基于GRU-VAE模型的无监督航迹异常检测方法的流程图之一；

图2为本发明实施例一种基于GRU-VAE模型的无监督航迹异常检测方法的流程图之二；

图3为本发明实施例航迹数据集预处理流程图；

图4为本发明实施例GRU-VAE模型结构示意图；

图5为本发明实施例GRU结构示意图；

图6为本发明实施例正态曲线面积分布示意图；

图7为本发明实施例模型性能变化图；

图8为本发明实施例一种基于GRU-VAE模型的无监督航迹异常检测系统架构示意图。

具体实施方式

为更好的理解本发明，进行如下释义：

定义1航迹点向量及特征：

表示第i个航迹序列中的第j个定位点数据信息，本发明限定的

中的航迹点是指通过卫星、雷达等定位手段观测的定位数据等时间间隔采样得到的经度坐标(lng)、纬度坐标(lat)、速度(sog)、航向(cog)、加速度(a)和航向加速度(cog')等特征组成的点向量。其中，经度和纬度坐标是航迹点向量的位置属性特征，速度、航向、加速度和航向变化率是航迹点向量的运动属性特征。

定义2航迹序列：

是由多个航迹点向量

按时间先后排序形成的序列。由定义1，航迹点序列Wⁱ也可以表示为下式：

定义3航迹数据集：X＝{W¹，W²，...，Wⁿ}表示一组由n条航迹序列组成的集合。

定义4异常航迹点向量：位置属性特征或运动属性特征异常的航迹点向量。其中，位置属性异常是指实时航迹点向量显著偏离历史航迹序列点；运动属性异常是指速度、航向、加速度和航向变化率等运动特征变化超出航迹点向量历史范围。

定义5异常航迹序列：在航迹数据集中，存在异常航迹点向量的航迹序列称为异常航迹序列。

下面结合附图和具体的实施例对本发明做进一步的解释说明：

如图1所示，一种基于GRU-VAE模型的无监督航迹异常检测方法，包括：

步骤1：模型训练阶段，使用预处理后得到的历史航迹数据集训练GRU-VAE航迹数据异常检测模型，采用平均绝对距离度量方法计算重构损失并可视化分布情况，采用正态分布法确定重构损失阈值区间，将阈值参考范围百分比作为阈值区间的置信度；

步骤2：异常检测阶段，运用训练好的GRU-VAE航迹数据异常检测模型对预处理后的实时航迹数据集进行检测，对重构损失超出阈值区间的异常航迹序列进行深入研判，实时报告运动目标的航迹态势信息。

如图2所示，基于GRU-VAE模型的无监督航迹异常检测方法的工作流程分为模型训练和异常检测两个阶段。

在模型训练阶段，GRU-VAE航迹异常检测模型以历史航迹数据序列中的多维航迹点向量为输入，GRU门控循环单元作为输入层和输出层，将充分考虑到一段时间内的航迹数据特征，使整个模型精确学习到训练数据集的隐变量概率分布，提升航迹序列重构的准确性，最终模型输出航迹序列的重构误差。

在异常检测阶段，将测试数据集输入模型后，可视化模型输出重构误差，观察其是否超出设定的阈值范围，实现模型对异常目标航迹的检测。在整个工作流程中，训练数据集无需人工标注，模型采用无监督方式进行训练，允许训练数据中存在少量的异常航迹序列，适用于数据样本量类间不均衡的情况。

进一步地，按照如下方式进行航迹数据集预处理：

具体地，航迹数据集的预处理流程如图3所示，分为4步：首先，遍历航迹数据集中的每一条航迹序列，计算每个航迹点向量的加速度和航向变化率；然后，对整个航迹数据集中每一条航迹序列的航迹点向量特征值进行最大最小值归一化处理；之后，将数据转换为深度神经网络模型可接收的格式；最后，将数据输入模型进行训练或对该数据进行异常检测。

其中，计算每个航迹点向量的加速度和航向变化率既扩充了数据维度，又为深度神经网络模型的训练提供可建立有效映射的素材，为准确的航迹异常检测奠定基础。

在同一条航迹序列中，每个航迹点向量的加速度和航向变化率通过式(1)和式(2)进行计算。

其中，△t_i是第i+1个航迹点向量和第i个航迹点向量之间的时间间隔，sog_i和cog_i指航迹序列中第i个航迹点向量中的速度和航向特征值。

最大最小值归一化处理是指用线性函数的方式将航迹序列中各航迹点向量特征值转换到[0,1]的范围，计算公式如式(3)所示。

具体地，图4是GRU-VAE基本结构图，模型的主要功能是挖掘航迹数据的时序特性并以此进行数据重构。模型的搭建以VAE变分自编码器为基础，将VAE的编码器输入层和解码器输出层替换为GRU门控循环单元，充分发挥GRU对航迹数据时序特性挖掘能力的同时，避免循环神经网络在特征提取过程中的梯度消失问题，从而实现对数据特征的正确编码和解码，输出得到重构数据。

(a)VAE变分自编码器框架

VAE变分自编码器是一种无监督学习的深度神经网络模型，它基于反向传播算法和梯度下降最优化方法，利用输入数据本身作为监督指导神经网络尝试学习一个重构输出。如上图3所示，变分自编码器框架由1个编码器和1个解码器组成，其基本思想是经过编码器函数f_θ(z_k)的每一个航迹点向量X可用各航迹点向量特征值上的均值μ_Z和方差σ_Z表示输出的概率分布q_φ(z_k|x_k)，然后通过变分自编码器的变分推断过程，用一个近似分布p(z_k)来代替概率分布，并通过贝叶斯准则得到解码器输入p_θ(x_k|z_k)，最后经解码器g_θ(x_k)输出重构的航迹点向量X_R。

在变分推断的过程中，采用Kullback-Leibler(KL)散度函数来度量两个分布之间的相似性，模型的目标函数如式(4)所示：

Loss(θ,φ；x_k)＝-D_KL[q_φ(z_k|x_k)||p(z_k)]+E_q[lgp_θ(x_k|z_k)] (4)

其中，E_q是期望的自编码重建输出特征向量，D_KL是正则化项使得q_φ(z_k|x_k)向标准正态分布对标。为了解决神经网络反向梯度求解问题，中间采用了重参数化的操作，样本Z_k从分布N(0,1)中获取变量ε，通过图4所示的期望μ_z和方差σ_z计算得到，见式(5)。

z_k＝μ_zε+σ_z (5)

联立式(4)和式(5)，最终的目标函数如式(6)。

Loss(θ,φ；x_k)＝-D_KL[q_φ(z_k|x_k)||p(z_k)]+E_q[lgp_θ(x_k|μ_zε+σ_z)] (6)

2、GRU门控循环单元

GRU门控循环单元的主要功能是在模型数据重构的过程中捕捉一段时间内航迹数据的时序特性，学习正常数据的隐变量概率分布，提升数据重构的准确性。作为循环神经网络的一种变形单元，GRU门控循环单元解决了长期记忆和反向传播中的梯度消失或梯度爆炸问题，在达到相同模型性能的前提下其更易于计算，训练效率更高。图5为GRU结构图，它主要的功能由更新门和重置门实现，这些门结构决定了数据信息的输入、存储、遗忘和输出。

其中，图5中的h_*表示GRU某时刻状态，x_t为输入，σ和Tanh为非线性激活函数，W_*和b_*为对应门结构的权重和偏置，其余运算符号如图中所示。式(7)～(10)表示了GRU的运算实现过程。

z_t＝σ(W_z·[x_t,h_t-1]+b_z) (7)

r_t＝σ(W_r·[x_t,h_t-1]+b_r) (8)

更新门z_t控制从上一时刻状态h_t-1中保留的向量特征信息，以及从候选状态

中接受的向量特征信息，以确保数据的不断更新。重置门r_t控制候选状态

的计算是否依赖上一时刻状态h_t-1。由式(9)和式(10)可见，GRU使用更新门控制输入和遗忘的平衡。当z_t＝0时，当前状态h_t和上一状态h_t-1为非线性关系；当z_t＝1时，h_t和h_t-1为线性关系。

进一步地，航迹序列重构误差的计算采用计算平均绝对距离的方法，如式(11)所示。

其中，W_R和W是重构航迹序列和原始航迹序列，

进一步地，重构损失阈值范围的确定直接影响异常检测模型的性能。虽然参与训练的航迹数据集将作为正常航迹数据基准，但在实际应用中该数据集可能存在极少量的异常航迹序列影响阈值区间的设定，导致模型的漏警率偏高。因此，本方法运用正态分布法划定重构损失阈值范围，即在重构误差分布通过正态性检验的前提下，采用双侧参考值范围选取方法，将1-α作为该阈值区间的置信度，如图6所示。1-α为阈值参考范围百分比。

阈值区间越大，置信度越高，模型检测能力则越灵敏，阈值区间划定如式(12)所示。

式中

为重构误差的总体均数，S为标准差，u为界值可通过查标准正态分布表获得，α是阈值区间的显著性水平。

值得说明的是，本发明中讨论的异常航迹是指：(1)航迹序列中的航迹点向量在空间上偏离大多数航迹的；(2)航迹序列中的航迹点运动特征具有显著差异，如航向、速度、加速度等。

进一步地，通过实验证明了本方法的关键改进点在航迹异常检测领域上的优势，采用2012年12月在美国墨西哥湾航行的货船AIS数据作为实验数据集，本实验检测的航迹序列异常类型主要包括：(1)航迹点显著偏离原航迹；(2)训练航迹数据集中未出现的航迹点；(3)部分运动特征变化超出运动属性特征正常范围。运动属性特征正常范围如表1所示。

表1运动属性特征正常范围

将实验数据集划分为训练集和测试集，训练集中共有1000条航迹序列，均为正常航迹序列；测试集中共有450条航迹序列，其中包含50条异常航迹序列和400条正常航迹序列。

按照本方法运用训练数据集对模型进行训练，将测试数据集输入GRU-VAE模型进行异常检测实验，对应三种重构损失序列计算方法，分别记录不同置信度下的模型性能。

1、重构损失计算方法对模型性能的影响

采用相同的重构损失计算方法，对模型精度、召回率和F1得分分别求平均值，表2记录了在不同重构损失计算方法下的模型平均性能，采用平均绝对距离计算重构误差的模型平均精度、平均召回率和平均F1分数分别比采用欧氏距离的模型高出2.39％、1.00％和1.64％。可见，基于本实验数据集，采用平均绝对距离的模型平均性能最好。

表2不同的重构损失计算方法下的模型性能

2、重构损失置信度对模型性能的影响

图7是异常检测模型的精度、召回率和F1得分随阈值区间置信度的变化情况。如图所示，模型的精度和F1分数随阈值区间置信度的增大而增大，当置信度为99.99％时各模型F1分数达到最大，其中采用绝对平均距离计算重构误差的模型性能最好，F1得分达0.8636。综上可以得出结论，基于本实验数据的模型性能和重构损失置信度成正相关，重构损失的置信度越高，则模型性能越好。

3、与类似方法的比较

表3记录了本方法和现有基于数据重构的异常检测方法性能的对比情况。如下表所示，文献1[YUAN Y,LIN L,HUO L,et al.Using An Attention-Based LSTM Encoder–Decoder Network for Near Real-Time Disturbance Detection[J].IEEE Journal ofSelected Topics in Applied Earth Observations and Remote Sensing,2020,13:1819-1832.],2[董欣放,刘继新,张魏宁,等.基于深度自编码器的终端区异常航迹识别方法及其在航迹聚类中的应用(英文)[J].Transactions of Nanjing University ofAeronautics and Astronautics,2020,37(04):574-585.],3[MAYA S,UENO K,NISHIKAWAT.dLSTM:a new approach for anomaly detection using deep learning with delayedprediction[J].International Journal of Data Science and Analytics,2019,8(2):137-164.]分别提出了深度自编码器、深度长短时记忆网络方法以及将两者相结合的方法，但基于本航迹数据集的检测性能相对较差，模型的F1得分均未超过70％。文献4[PARK D,HOSHI Y,KEMP C.A Multimodal Anomaly Detector for Robot-Assisted Feeding Usingan LSTM-based Variational Autoencoder[J].IEEE Robotics and AutomationLetters,2017,PP(99).]和本发明方法采用了变分自编码器后，对模型性能提升明显，F1得分均在80％以上。本方法将GRU门控循环单元引入变分自编码器，使得本发明提出的GRU-VAE模型在精确率、召回率和模型F1分数上分别比文献4提出的LSTM-VAE模型高出2.08％、2.50％和2.28％。

表3基于数据重构的异常检测方法性能对比

本发明提出一种基于GRU-VAE模型的无监督航迹异常检测方法，针对航迹数据的时序特性和无异常先验信息标注问题，引入GRU门控循环单元对VAE变分编码器模型进行改进，模型在训练中学习航迹数据时序特性的同时，实现对无标注航迹数据的精确重构，通过检测实时航迹数据的重构损失发现异常航迹序列。实验结果表明，性能最好的模型F1得分高达86.36％，召回率高达95％。和现有相关研究成果相比，本方法在精确率、召回率和模型F1分数上比性能位居其次的LSTM-VAE方法分别高出2.08％、2.50％和2.28％。

在上述实施例的基础上，如图8所示，本发明另一方面提出一种基于GRU-VAE模型的无监督航迹异常检测系统，包括：

进一步地，按照如下方式进行航迹数据集预处理：

进一步地，按照下式计算航迹序列重构损失R_loss：

其中，W_R和W是重构航迹序列和原始航迹序列，

式中

将1-α作为阈值区间的置信度，1-α为阈值参考范围百分。

综上，本发明针对航迹数据特点，选用绝对平均距离作为重构损失计算方法，实验证明该法可有效提升模型性能；基于数理统计知识确定异常检测阈值。本发明将重构损失在任意置信度下的置信区间确定为阈值的上下限，克服了存在正常航迹数据集中极少量异常航迹序列对模型训练的影响；提出一种基于数据重构的GRU-VAE异常检测模型，以VAE变分自编码器为基础，将VAE的编码器输入层和解码器输出层替换为GRU门控循环单元，经实验证明在航迹异常检测上该模型性能得到提升，模型最高F1得分为86.36％，召回率达95％，比性能位居其次的LSTM-VAE方法分别高出2.28％和2.50％。

以上所示仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。