CN116992380A

CN116992380A - 卫星多维遥测序列异常检测模型构建方法及装置、异常检测方法及装置

Info

Publication number: CN116992380A
Application number: CN202310878232.6A
Authority: CN
Inventors: 庞景月; 朱晓龙
Original assignee: Chongqing Technology and Business University
Current assignee: Chongqing Technology and Business University
Priority date: 2023-07-18
Filing date: 2023-07-18
Publication date: 2023-11-03

Abstract

卫星多维遥测序列异常检测模型构建方法及装置、异常检测方法及装置，涉及数据处理及检测领域。针对现有技术中存在的，现有多维时间序列异常检测算法对遥测数据和控制命令之间复杂的交互和其依赖关系进行建模的能力并不出色的技术问题，本发明提供的技术方案为：卫星多维遥测序列异常检测模型构建方法，方法包括：采集遥测数据的步骤；将数据映射为时间相关性的隐变量的步骤；根据时间相关性的隐变量，得到重构输入数据的步骤；根据重构输入数据，得到空间相关性的隐变量的步骤；根据空间相关性的隐变量，得到遥测数据和重构数据之间的差异的步骤。本发明提供的卫星多维遥测序列异常检测方法，适合应用于航天器遥测序列异常检测的工作中。

Description

卫星多维遥测序列异常检测模型构建方法及装置、异常检测方法及装置

技术领域

涉及数据处理及检测领域，具体涉及航天器遥测序列异常检测。

背景技术

近年来，深度学习模型已成为多维遥测序列异常检测的热门方法。在这方面，Kyle等人提出了一种基于长短期记忆网络(LSTMs)的非参数动态阈值方法，用于检测航天器异常。该方法利用LSTM网络的记忆和序列建模能力，来捕捉遥测数据中的正常模式，并通过比较观测到的遥测数据与LSTM模型的预测输出来识别异常行为。然而，该方法主要设计用于建模时间依赖关系，忽略了空间特征之间的相关性。

为了解决这个问题，提出了结合Transformer的图学习(GTA)异常检测框架，该框架包括自动学习图结构、图卷积和使用基于Transformer的架构来建模多维遥测序列的时间依赖性。然而，当空间相关性复杂且非线性时，学习图结构不能很好地检测微妙的异常，并且无法有效地对空间特征之间的依赖关系进行建模。

另一种称为注意力时序卷积网络(ATCN)的方法专注于检测实体级别的异常。它利用时序卷积神经网络和动态图注意力技术来建模空间特征之间的依赖关系。然而，该方法缺乏显式的低维时间嵌入，并且对每个遥测实体建立模型也导致对涉及每个通道中微小异常的检测能力较弱。

另一种无监督方法称为InterFusion，它基于变分自编码器(VAE)和马尔可夫链蒙特卡罗(MCMC)。该方法通过学习稳健的多维时间序列表征对时间序列数据内部的正常模式进行建模。该方法对于连续数据类型具有较高准确性和鲁棒性。然而，在处理遥测数据和遥控指令等混合数据类型时，该方法不适合对空间特征之间的复杂的、非线性相关性进行建模。

对于在轨道上运行的卫星，遥测数据是按时间顺序采集的。复杂的系统设计对系统性能产生影响，使得遥测序列具有空间相关性的特点。空间和时间相关性的变化可能导致遥测参数异常。然而，先前的研究工作主要集中在对遥测数据的时间或空间关系进行建模，这限制了模型学习遥测数据模式和异常检测能力。

作为一个复杂系统，遥测指令通常具有复杂的长期依赖关系对遥测数据产生影响。其中，遥测指令通常是由0和1构成的二进制序列表示的远程控制指令，而遥测数据则是通过传感器收集到的系统状态和性能的连续反映。遥测数据的变化可能由特定的遥测指令引发或调节，并且指令和遥测序列数据之间的交互通常存在延迟。

因此，在设计遥测异常检测方法时，需要综合考虑时间依赖性、空间相关性以及指令与遥测序列之间的交互。一种潜在的方法是结合长短期记忆网络(LSTM)和图卷积神经网络(GCN)，利用LSTM网络来建模时间依赖关系，利用GCN网络来建模空间特征之间的关系。这种方法可以同时捕捉时间依赖关系和空间相关性，并且可以灵活地适应复杂系统中的不同类型的数据。

另一个方向是结合变分自编码器(VAE)和图注意力机制，以建立一个能够处理混合数据类型和检测复杂空间相关性的模型。VAE可以学习时间序列数据的低维表示，而图注意力机制可以动态地调整不同空间特征之间的关注度。

综上所述，对于遥测异常检测问题，在设计模型时需要综合考虑时间依赖性、空间相关性以及指令与遥测序列之间的交互。结合不同的深度学习技术，如LSTM、GCN、VAE和图注意力机制，可以构建更强大、准确且鲁棒的遥测异常检测模型。这些模型的发展将有助于提高卫星运行的可靠性和安全性，并促进航天器及其相关系统的性能优化。

然而，现有多维时间序列异常检测算法对遥测数据和控制命令之间复杂的交互和其依赖关系进行建模的能力并不出色。

发明内容

针对现有技术中存在的，现有多维时间序列异常检测算法对遥测数据和控制命令之间复杂的交互和其依赖关系进行建模的能力并不出色的技术问题，本发明提供的技术方案为：

卫星多维遥测序列异常检测模型构建方法，所述方法包括：

采集遥测数据的步骤；

将所述数据映射为时间相关性的隐变量的步骤；

根据所述时间相关性的隐变量，得到重构输入数据的步骤；

根据所述重构输入数据，得到空间相关性的隐变量的步骤；

根据所述空间相关性的隐变量，得到所述遥测数据和重构数据之间的差异的步骤。

进一步，提供一个优选实施方式，通过卷积网络映射所述时间相关性的隐变量。

进一步，提供一个优选实施方式，通过反卷积网络得到重构输入信息的步骤。

进一步，提供一个优选实施方式，通过反卷积网络将所述时间相关性的隐变量映射回原始数据空间，得到重构输入信息。

进一步，提供一个优选实施方式，通过GRU和注意力机制，得到空间相关性的隐变量。

基于同一发明构思，本发明还提供了卫星多维遥测序列异常检测模型构建装置，所述装置包括：

采集遥测数据的模块；

将所述数据映射为时间相关性的隐变量的模块；

根据所述时间相关性的隐变量，得到重构输入数据的模块；

根据所述重构输入数据，得到空间相关性的隐变量的模块；

根据所述空间相关性的隐变量，得到所述遥测数据和重构数据之间的差异的模块。

基于同一发明构思，本发明还提供了卫星多维遥测序列异常检测方法，所述方法包括：

采集被测遥测数据序列的步骤；

根据所述的卫星多维遥测序列异常检测模型构建方法，得到所述序列的遥测数据和重构数据之间的差异的步骤。

基于同一发明构思，本发明还提供了卫星多维遥测序列异常检测装置，所述装置包括：

采集被测遥测数据序列的模块；

根据所述的卫星多维遥测序列异常检测模型构建装置，得到所述序列的遥测数据和重构数据之间的差异的模块。

基于同一发明构思，本发明还提供了计算机储存介质，用于储存计算机程序，当所述程序被计算机读取时，所述计算机执行所述的方法。

基于同一发明构思，本发明还提供了计算机，包括处理器和储存介质，当所述处理器读取所述储存介质中储存的计算机程序时，所述计算机执行所述的方法。

与现有技术相比，本发明提供的技术方案的有益之处在于：

本发明提供的卫星多维遥测序列异常检测方法，具有两个随机隐变量的分层变分自编码器旨在用于对多维遥测序列的空间和时间相关性进行建模。

本发明提供的卫星多维遥测序列异常检测方法，集成了基于GRU神经网络的自注意力机制，以增强模型处理遥测数据对远程控制命令长期依赖关系的能力。

本发明提供的卫星多维遥测序列异常检测方法，适合应用于航天器遥测序列异常检测的工作中。

附图说明

图1为实施方式一提供的卫星多维遥测序列异常检测模型的结构示意图；

图2为实施方式七提供的卫星多维遥测序列异常检测方法的流程示意图；

图3为实施方式十一提到的实际异常序列与异常检测结果的对比示意图；

其中，(a)为实际异常序列，(b)为异常检测结果。

具体实施方式

为使本发明提供的技术方案的优点和有益之处体现得更清楚，现结合附图对本发明提供的技术方案进行进一步详细地描述：

实施方式一、结合图1说明本实施方式，本实施方式提供了卫星多维遥测序列异常检测模型构建方法，所述方法包括：

采集遥测数据的步骤；

将所述数据映射为时间相关性的隐变量的步骤；

根据所述时间相关性的隐变量，得到重构输入数据的步骤；

根据所述重构输入数据，得到空间相关性的隐变量的步骤；

具体的：

遥测数据x首先通过卷积网络进行处理，卷积层可以提取输入数据的局部特征，通过卷积和激活函数的组合，将x映射为一个隐藏表示z₁。

将z₁输入到反卷积网络，反卷积网络通过反向的卷积操作将隐藏表示z₁映射回原始数据空间，得到重构输入d。重构输入d是对输入数据x的近似重建。

将重构输入d作为输入传递到类SRNN网络。在SRNN网络通过使用门控循环单元(Gated Recurrent Unit，GRU)和注意力机制(Attention Mechanism)等技术来处理序列数据。

GRU(Gated Recurrent Unit)：GRU是一种门控循环单元，它能够捕捉序列数据中的长期依赖关系。GRU通过更新门和重置门来控制信息的传递和保留，以及决定当前时间步的隐藏状态。

注意力机制(Attention Mechanism)：注意力机制可以在序列数据中自适应地选择重要的信息。它通过计算不同时间步的权重，将重构输入d和先前的隐藏状态结合起来，以便在SRNN网络中聚焦于具有更高重要性的信息。

处理得到z₂：SRNN网络通过多个时间步骤的计算，结合GRU和注意力机制，逐步处理重构输入d并输出隐藏表示z₂。这样，z₂可以被用于后续的检测任务。

其中，

对原始数据X∈R^M×N，每一行xⁱ称为一个特征，每一列x_t称为一个观测值。

隐变量z₁＝g(x)∈R^m×w′，g是若干个一维卷积，m是特征数量，w'是卷积后窗口的长度。

d＝f(z₁)∈R^m×w，并且f是相应的一维反卷积层。

隐变量z₂∈R^m′×w，是在重构的d上沿特征维度压缩得到的嵌入表示，m'是压缩后的特征维数。

隐变量表示了输入数据的潜在特征或表示。

时间相关性的隐变量z₁；

空间相关性的隐变量z₂；

得到时间相关性的隐变量z₁和空间相关性的隐变量z₂之后，通过重构误差函数(L)去计算原始数据与重构数据之间的差异或损失，以达到最小或者说优化成最小。

其中，表示原始分布中的数据概率与近似分布之间的对数差的期望，p_θ表示Kullback-Leibler散度的概率分布，e表示生成网络(pnet)所需的重构输入，q_φ表示Kullback-Leibler散度的上近似分布。

模型是要通过训练达到更好的效果，通过重构误差函数(公式L)去计算原始数据与重构数据之间的差异或损失以达到最小或者说优化成最小。比如，有很多组权重，我不确定哪组适合我的模型，通过训练让模型自己找，找到适合的那组以便公式L的损失更小，也就是模型的效果更好。

在异常检测问题中，我们希望识别与正常模式不符的异常数据点。一种常见的方法是使用重构模型，该模型尝试从原始数据中生成近似的副本或重构，并通过比较原始数据与重构数据之间的差异来度量异常程度。

重构概率是指通过重构模型生成的数据点在模型中的概率分布。对于正常数据点，它们通常具有较高的重构概率，因为模型能够较好地重构这些数据点。而对于异常数据点，它们可能与正常模式差异较大，导致模型难以准确地重构它们，因此具有较低的重构概率。

生成网络(图中的pnet)是HVAE的一部分，它负责从潜在空间中生成样本。生成网络接收来自潜在变量空间的随机向量(通常服从标准正态分布)作为输入，通过一系列映射和变换操作，将其转换为与原始数据具有相似特征的生成样本。生成网络的目标是学习数据的分布，以便能够生成具有类似于训练数据的新样本。

变分后验网络(图中的qnet)也是HVAE的重要组成部分，它负责将输入数据映射到潜在空间中的分布。变分后验网络接收来自输入数据的样本作为输入，通过一系列映射和变换操作，将其转换为潜在变量的分布参数。变分后验网络的目标是学习数据在潜在空间中的分布，以便能够对给定的输入数据进行潜在变量的推断和重构。

生成网络和变分后验网络是相互关联的。在HVAE中，生成网络和变分后验网络是通过最小化变分推断中的KL散度来一起训练的。生成网络通过最小化重构误差(通常是重建样本与原始数据之间的误差)来学习生成样本的能力，而变分后验网络通过最小化KL散度来学习数据的潜在变量分布。这两个网络的训练是协同进行的，使得HVAE能够同时学习到生成样本和推断潜在变量的能力。

模型架构部分：

航天器的遥测序列表现出复杂的相互依赖性，包括时间相关性(例如周期性)和变量相关性(每个时间段实体的变量内的线性或非线性关系)。具有两个随机隐变量的分层变分自编码器可以对遥测序列正常模式进行建模。在此基础上，我们集成了基于GRU神经网络的自注意力机制，使得模型能够自适应地学习遥测数据中的重要特征，从而推导出表征空间和时间相关性的隐变量。模型架构如图1所示。具体来说，生成的模型(pnet)可以表述为:

p_θ(x,z₂,z₁)＝p_θ(x|z₂,z₁)p_θ(z₂|z₁)p_θ(z₁)；

通过联合训练随机隐变量，使z₁和z₂学习时间嵌入或空间特征嵌入。利用分层变分自编码器的层次结构将原始输入x转换为低维表示z(z₂|z₁层次结构)。

该层次结构的目的是使z₂能够结合z₁从而捕获学习到的时间信息，而不是独立学习空间特征嵌入。具体来说，对于时间嵌入层，z₁＝g(x)∈R^m×w′，g是若干个一维卷积，m是特征数量，w′是卷积后窗口的长度。定义d＝f(z₁)∈R^m×w并且f是相应的一维反卷积层。空间特征嵌入z₂∈R^m′×w是在重构的d上沿特征维度压缩得到的嵌入表示，m′是压缩后的特

征维数。使用变分自编码器VAE对d进行预训练，确保其在模型训练初期阶段的初始可重构性。如图1所示，变分后验(qnet)可以表示为:

q_φ(z₂,z₁|x)＝q_φ(z₂|z₁)q_φ(z₁|x)；

对于每个时刻t，将输入值d_t和c_t+1(在时刻t+1时GRU导出的确定性状态)传到一个反向循环GRU单元，生成隐变量c_t:

最后，为了很好地表征输入序列中的长期依赖关系，在每个时间t，c_t被用作自注意力机制的输入。由此，得到输入序列中不同位置的注意力权重:

a_t＝softmax(w₂ tanh(w₁c_t+b₁))；

其中w₁、w₂和b₁表示相应全连接层的权重和偏差。特别地，一维反卷积(用于导出d、e)层的参数在生成网络和变分后验网络之间共享，使得“重构输入”与所得到的时序信息能够被共享，从而改善了训练效果。

实施方式二、本实施方式是对实施方式一提供的卫星多维遥测序列异常检测模型构建方法的进一步限定，通过卷积网络映射所述时间相关性的隐变量。

实施方式三、本实施方式是对实施方式一提供的卫星多维遥测序列异常检测模型构建方法的进一步限定，通过反卷积网络得到重构输入信息的步骤。

实施方式四、本实施方式是对实施方式三提供的卫星多维遥测序列异常检测模型构建方法的进一步限定，通过反卷积网络将所述时间相关性的隐变量映射回原始数据空间，得到重构输入信息。

实施方式五、本实施方式是对实施方式一提供的卫星多维遥测序列异常检测模型构建方法的进一步限定，通过GRU和注意力机制，得到空间相关性的隐变量。

实施方式六、本实施方式提供了卫星多维遥测序列异常检测模型构建装置，所述装置包括：

采集遥测数据的模块；

将所述数据映射为时间相关性的隐变量的模块；

根据所述时间相关性的隐变量，得到重构输入数据的模块；

根据所述重构输入数据，得到空间相关性的隐变量的模块；

实施方式七、结合图2说明本实施方式，本实施方式提供了卫星多维遥测序列异常检测方法，所述方法包括：

采集被测遥测数据序列的步骤；

根据实施方式一提供的方法，得到所述序列的遥测数据和重构数据之间的差异的步骤。

具体的：

训练与推理的步骤：

通过SGVB算法优化证据下界(ELBO)，其中D_KL散度是Kullback-Leibler散度。数学公式如下所示:

引入重构输入d和e后，模型优化目标变为以下形式:

在线检测时，我们的目标是通过给定的一个滑动窗口{x_t-w+1，...，x_t}来检测时间戳x_t是否为异常，并计算重构概率这在异常检测中被广泛应用。该窗口中最后一个数据x_t的重构概率用作时刻t时的异常分数。

异常检测判断过程：

训练后的模型用于确定时间步x_t上的观测值是否异常，以计算重构概率作为其异常分数。具体而言，选择{x_t-w+1，...，x_t}作为滑动窗口，即x_t及其之前的w-1个连续观测值作为输入，用于检测时间刻t的异常。该滑动窗口的最后一个数据(x_t)的分数被用作异常分数，这可以加快对异常检测的响应。x_t的异常得分记为S_t，因此S_t＝log(p_θ(x_t|z_t-W+1：t))。实际中，异常很少是独立的，更常见的是连续的异常片段。因此，主要采用点调整方法(point-adjust approach)作为评价策略。具体来说，如果模型可以检测到遥测数据中异常片段的任意子集，即触发异常响应，那么认为该数据异常片段的所有观测都被正确检测到。同时，异常段之外的点照常处理。形式上，如果S_t高于预定义阈值，则观测值x_t被标记为异常，否则x_t为正常。图3描述了异常检测的判断示例。

实施方式八、本实施方式提供了卫星多维遥测序列异常检测装置，所述装置包括：

采集被测遥测数据序列的模块；

根据实施方式六提供的装置，得到所述序列的遥测数据和重构数据之间的差异的模块。

实施方式九、本实施方式提供了计算机储存介质，用于储存计算机程序，当所述程序被计算机读取时，所述计算机执行实施方式一至五或七提供的方法。

实施方式十、本实施方式提供了计算机，包括处理器和储存介质，当所述处理器读取所述储存介质中储存的计算机程序时，所述计算机执行实施方式一至五或七提供的方法。

实施方式十一、结合图3说明本实施方式，本实施方式是对实施方式七提供的方法提供一个验证的实施例，具体的：

表1参数配置

如表1所示，滑动窗口大小设置为100，特征嵌入M′设置为2。此外，使用dropout正则化策略来防止过拟合，dropout率为0.1。该模型应用Adam算法进行优化，学习率为1e^-3，批尺寸设置为256，训练迭代次数持续20个epoch。使用RELU作为除线性层以外的层的激活函数，并取训练集中最后30％的数据作为验证集。训练中采用提前停止策略来防止模型过拟合。

表2对比方法的性能

如表2所示，可以看出所设计的模型在SMAP数据集和MSL数据集上实现了0.9388和0.9281的最佳F1分数。具体而言，我们可以作出以下分析。

与其他基线(baselines)相比，所提出的方法显示出优越的性能，在SMAP数据集的差异为0.0132-0.0897，MSL数据集的差异为0.0026-0.0371。这使其在处理多维遥测数据异常检测方面具备足够的吸引力。然而，对于某些特殊数据集或异常，所提出的方法可能无法达到最佳性能。具体来说，当异常模式与正常模式非常相似或重叠时，算法可能难以准确地区分异常行为。当异常模式变化较小时，算法的有效性可能会受到限制。此外，如果训练数据中存在异常，则可能会发生过度拟合，这可能导致学习到的特征嵌入显著偏离正常嵌入。

以上通过几个具体实施方式对本发明提供的技术方案进行进一步详细地描述，是为了突出本发明提供的技术方案的优点和有益之处，不过以上所述的几个具体实施方式并不用于作为对本发明的限制，任何基于本发明的精神和原则范围内的，对本发明的合理修改和改进、实施方式的合理组合和等同替换等，均应当包含在本发明的保护范围之内。

Claims

1.卫星多维遥测序列异常检测模型构建方法，其特征在于，所述方法包括：

采集遥测数据的步骤；

将所述数据映射为时间相关性的隐变量的步骤；

根据所述时间相关性的隐变量，得到重构输入数据的步骤；

根据所述重构输入数据，得到空间相关性的隐变量的步骤；

2.根据权利要求1所述的卫星多维遥测序列异常检测模型构建方法，其特征在于，通过卷积网络映射所述时间相关性的隐变量。

3.根据权利要求1所述的卫星多维遥测序列异常检测模型构建方法，其特征在于，通过反卷积网络得到重构输入信息的步骤。

4.根据权利要求3所述的卫星多维遥测序列异常检测模型构建方法，其特征在于，通过反卷积网络将所述时间相关性的隐变量映射回原始数据空间，得到重构输入信息。

5.根据权利要求1所述的卫星多维遥测序列异常检测模型构建方法，其特征在于，通过GRU和注意力机制，得到空间相关性的隐变量。

6.卫星多维遥测序列异常检测模型构建装置，其特征在于，所述装置包括：

采集遥测数据的模块；

将所述数据映射为时间相关性的隐变量的模块；

根据所述时间相关性的隐变量，得到重构输入数据的模块；

根据所述重构输入数据，得到空间相关性的隐变量的模块；

7.卫星多维遥测序列异常检测方法，其特征在于，所述方法包括：

采集被测遥测数据序列的步骤；

根据权利要求1所述的方法，得到所述序列的遥测数据和重构数据之间的差异的步骤。

8.卫星多维遥测序列异常检测装置，其特征在于，所述装置包括：

采集被测遥测数据序列的模块；

根据权利要求6所述的装置，得到所述序列的遥测数据和重构数据之间的差异的模块。

9.计算机储存介质，用于储存计算机程序，其特征在于，当所述程序被计算机读取时，所述计算机执行权利要求1-5或7所述的方法。

10.计算机，包括处理器和储存介质，其特征在于，当所述处理器读取所述储存介质中储存的计算机程序时，所述计算机执行权利要求1-5或7所述的方法。