CN115409091A - 基于tdrae的无监督卫星异常检测方法、装置、设备及介质 - Google Patents
基于tdrae的无监督卫星异常检测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115409091A CN115409091A CN202210946484.3A CN202210946484A CN115409091A CN 115409091 A CN115409091 A CN 115409091A CN 202210946484 A CN202210946484 A CN 202210946484A CN 115409091 A CN115409091 A CN 115409091A
- Authority
- CN
- China
- Prior art keywords
- layer
- tdrae
- satellite
- telemetry data
- causal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000001514 detection method Methods 0.000 title claims abstract description 27
- 230000001364 causal effect Effects 0.000 claims abstract description 79
- 238000012549 training Methods 0.000 claims abstract description 63
- 238000011156 evaluation Methods 0.000 claims abstract description 29
- 238000012795 verification Methods 0.000 claims abstract description 14
- 238000013209 evaluation strategy Methods 0.000 claims abstract description 8
- 230000015654 memory Effects 0.000 claims description 29
- 230000005856 abnormality Effects 0.000 claims description 24
- 238000010606 normalization Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 8
- 238000010200 validation analysis Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 230000002779 inactivation Effects 0.000 claims description 6
- 238000013075 data extraction Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000017105 transposition Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000004088 simulation Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 5
- 238000010168 coupling process Methods 0.000 description 5
- 238000005859 coupling reaction Methods 0.000 description 5
- 230000010339 dilation Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000009849 deactivation Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Radio Relay Systems (AREA)
Abstract
本发明实施例公开了一种基于时域反卷积重建自编码器的无监督卫星异常检测方法、装置、设备及介质;该方法包括:利用由因果卷积层以及基于因果卷积层形成的先进膨胀因果卷积块ADCCB所组成的编码器和解码器构建时域反卷积重建自编码器TDRAE;从地面接收站所接收到的卫星遥测数据包中提取卫星遥测数据,并基于提取得到的卫星遥测数据生成训练集和验证集;根据设定的训练参数利用所述训练集和验证集训练TDRAE,并将训练完毕后的TDRAE在地面接收站进行本地部署;将获取到的准实时的卫星遥测数据输入至本地部署的训练完毕后的TDRAE,以获得预测结果;针对所述预测结果按照设定的评估策略进行评估,获得用于指征是否存在异常的评估结果。
Description
技术领域
本发明实施例涉及航天信号处理技术领域,尤其涉及一种基于时域反卷积重建自编码器(TDRAE,Temporal Deconvolutional Reconsturction AutoEncode)的无监督卫星异常检测方法、装置、设备及介质。
背景技术
对于航天器来说,以卫星为例,其各个分系统的结构十分复杂,并且需要长期在太空极端温度和强电磁辐射环境中运行,因此,通过对卫星进行实时或准实时的异常检测,可以及时的发现和定位故障,保障卫星在轨安全可靠的运行,也就是说,针对卫星进行异常检测是卫星健康管理中的重中之重。而遥测数据能够直观的反映卫星的在轨运行状态,因此,通过对遥测数据进行异常检测可以直观的判断卫星的运行状态。
目前,针对卫星异常检测的常规方案大多采用基于数据驱动的方法,除了在轨卫星,当卫星处于地面测试阶段,由于数据的多样性,需要对整颗卫星进行11个不同阶段的组装、集成和测试(AIT,Assembly,Integration,and Test)。在进行AIT过程中,每个阶段都需要对高速采集的5000多条卫星时序状态数据进行实时监控,AIT人员需要通过获得的数据来判断卫星的分系统或部件是否处于健康状态,并以健康度或异常度的概念向总设计师反馈,总设计师再对卫星进行设计调整与检查,因此可靠的高维耦合数据异常检测在卫星地面测试阶段也是十分重要的。
发明内容
有鉴于此,本发明实施例期望提供一种基于时域反卷积重建自编码器的无监督卫星异常检测方法、装置、设备及介质;能够提高异常数据的检测准确率以及用于进行数据处理的神经网络训练轻量化,使得能够在占用较少内存的情况下完成网络训练。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供了一种基于时域反卷积重建自编码器TDRAE的无监督卫星异常检测方法,所述方法包括:
利用由因果卷积层以及基于因果卷积层形成的先进膨胀因果卷积块ADCCB所组成的编码器和解码器构建时域反卷积重建自编码器TDRAE;
从地面接收站所接收到的卫星遥测数据包中提取卫星遥测数据,并基于提取得到的卫星遥测数据生成训练集和验证集;
根据设定的训练参数利用所述训练集和验证集训练所述TDRAE,并将训练完毕后的TDRAE在地面接收站进行本地部署;
将获取到的准实时的卫星遥测数据输入至本地部署的训练完毕后的TDRAE,以获得预测结果;
针对所述预测结果按照设定的评估策略进行评估,获得用于指征是否存在异常的评估结果。
第二方面,本发明实施例提供了一种基于时域反卷积重建自编码器TDRAE的无监督卫星异常检测装置,所述装置包括:构建部分、提取部分、生成部分、训练部分、输入部分和评估部分,其中,
所述构建部分,经配置为利用由因果卷积层以及基于因果卷积层形成的先进膨胀因果卷积块ADCCB所组成的编码器和解码器构建时域反卷积重建自编码器TDRAE;
所述提取部分,经配置为从地面接收站所接收到的卫星遥测数据包中提取卫星遥测数据;
所述生成部分,经配置为并基于提取得到的卫星遥测数据生成训练集和验证集;
所述训练部分,经配置为根据设定的训练参数利用所述训练集和验证集训练所述TDRAE,并将训练完毕后的TDRAE在地面接收站进行本地部署;
所述输入部分,经配置为将获取到的准实时的卫星遥测数据输入至本地部署的训练完毕后的TDRAE,以获得预测结果;
所述评估部分,经配置为针对所述预测结果按照设定的评估策略进行评估,获得用于指征是否存在异常的评估结果。
第三方面,本发明实施例提供了一种计算设备,所述计算设备包括:通信接口,存储器和处理器;各个组件通过总线系统耦合在一起;其中,
所述通信接口,用于在与其他外部网元之间进行收发信息过程中,信号的接收和发送;
所述存储器,用于存储能够在所述处理器上运行的计算机程序;
所述处理器,用于在运行所述计算机程序时,执行第一方面所述基于TDRAE的无监督卫星异常检测方法的步骤。
第四方面,本发明实施例提供了一种计算机存储介质,所述计算机存储介质存储有基于TDRAE的无监督卫星异常检测程序,所述基于TDRAE的无监督卫星异常检测程序被至少一个处理器执行时实现第一方面所述基于TDRAE的无监督卫星异常检测方法的步骤。
本发明实施例提供了一种基于时域反卷积重建自编码器的无监督卫星异常检测方法、装置、设备及介质;基于因果卷积层以及基于因果卷积层形成的先进膨胀因果卷积块ADCCB所组成的编码器和解码器构建时域反卷积重建自编码器TDRAE以对常规方案中的TCN模型进行改进,并在利用卫星遥测数据进行训练后对获取到的准实时的卫星遥测数据进行预测,最终将预测结果进行评估以指征是否存在异常;从而相较于常规的TCN模型提高异常数据的检测准确率,并且仍然具备TCN模型所具备的神经网络训练轻量化,使得能够在占用较少内存的情况下完成神经网络训练得优点。
附图说明
图1为本发明实施例提供的一种因果卷积过程示意图;
图2为本发明实施例提供的一种基于TDRAE的无监督卫星异常检测方法流程示意图;
图3为本发明实施例提供的一种先进膨胀因果卷积块ADCCB的结构示意图;
图4为本发明实施例提供的一种TDRAE结构示意图;
图5为本发明实施例提供的仿真实验中的训练过程示意图;
图6为本发明实施例提供的直方图与异常指数的核密度估计曲线示意图;
图7为本发明实施例提供的一种数据集分类示意图;
图8为本发明实施例提供的基于TDRAE的无监督卫星异常检测装置组成示意图;
图9为本发明实施例提供的一种计算设备硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
对于时序问题的建模,通常采用递归神经网络架构进行处理,比如常用的基于循环神经网络(RNN,Recurrent Neural Network)的结构及其相关变体的方法,经典的卷积神经网络(CNN,Convolutional Neural Network)模型由于卷积核的限制很少用于时序问题的处理。但是,针对基于经典的CNN模型进行适当修改所形成的时域卷积网络(TCN,Temporal Convolutional Networks)模型,由于其主要由具有因果关系的卷积(也可简称之为因果卷积)所组成,从而使得没有信息会泄漏到过去,TCN模型只会向前处理信息,并且不依赖来自之前时间的信息。如此就能够使得TCN不但具备CNN所具备的能够在GPU等并行处理器上进行高校的并行计算的优点,而且能够在占用较少的内存的情况下对TCN模型实现轻量化的训练。此外,还可以实现不同膨胀因子下的因果卷积堆叠。以卫星轨道异常检测场景为示例,如图1所示的因果卷积过程,设定膨胀因子Dilation=1,在图1中下半部分的虚线框所示出的输入张量(Input Tensor)部分,横轴代表了周期为T的时间序列(X1、X2、……、XT),纵轴代表了遥测数据编号,例如以J2000坐标系为例,纵轴分别表示卫星在X,Y,Z轴的位置position和速度velocity,也就是说,图1中输入张量的第一行第一列的元素表示J2000坐标系下卫星X轴坐标在X1时刻的遥测数据值。输入张量经过如图1中实线框所示的卷积滤波器(Convolutional Filters)的卷积核数filter number为4,核尺寸kernelsize为3的因果卷积后,就可以得到输出张量(Output Tensor)。在图1中上半部分虚线框所示的输出张量部分(Output Tensor),横轴仍然代表周期为T的时间序列(X1、X2、……、XT),但纵轴尺寸则变化为因果卷积的filter number。上述因果卷积过程示例同样也验证了TCN适合于时序数据问题。
基于以上阐述,本发明实施例期望利用TCN的因果卷积针对卫星高维耦合的遥测数据进行异常检测,提高异常数据的检测准确率以及神经网络训练轻量化,使得能够在占用较少内存的情况下完成神经网络训练。基于此,参见图2,其示出了本发明实施例提供的一种基于时域反卷积重建自编码器的无监督卫星异常检测方法,该方法包括:
S201:利用由因果卷积层以及基于因果卷积层形成的先进膨胀因果卷积块(ADCCB,Advanced Dilated Causal Convolutional Block)所组成的编码器(Encoder)和解码器(Decoder)构建时域反卷积重建自编码器(TDRAE,Temporal DeconvolutionalReconsturction AutoEncode);
S202:从地面接收站所接收到的卫星遥测数据包中提取卫星遥测数据,并基于提取得到的卫星遥测数据生成训练集和验证集;
S203:根据设定的训练参数利用所述训练集和验证集训练所述TDRAE,并将训练完毕后的TDRAE在地面接收站进行本地部署;
S204:将获取到的准实时的卫星遥测数据输入至本地部署的训练完毕后的TDRAE,以获得预测结果;
S205:针对所述预测结果按照设定的评估策略进行评估,获得用于指征是否存在异常的评估结果。
通过上述技术方案,本发明实施例基于因果卷积层以及基于因果卷积层形成的先进膨胀因果卷积块ADCCB所组成的编码器和解码器构建时域反卷积重建自编码器TDRAE以对常规方案中的TCN模型进行改进,并在利用卫星遥测数据进行训练后对获取到的准实时的卫星遥测数据进行预测,最终将预测结果进行评估以指征是否存在异常;从而相较于常规的TCN模型提高异常数据的检测准确率,并且仍然具备TCN模型所具备的神经网络训练轻量化,使得能够在占用较少内存的情况下完成神经网络训练的优点。
对于图2所示的技术方案,在一些示例中,所述利用由因果卷积层以及基于因果卷积层形成的ADCCB所组成的编码器和解码器构建TDRAE,包括:
利用所述因果卷积(Causal Convolution)层、批量标准化(BN,BatchNormalization)层、高斯误差线性单元(GeLU,Gaussian Error Linear Unit)层、空间随机失活(Spatial Dropout)层以及层标准化(LN,Layer Normalization)层构建所述先进膨胀因果卷积块ADCCB;
在输入(Input)层与最大池化(Max-pooling)层之间设置由因果卷积层和多个所述ADCCB组成的第一三明治架构,形成所述编码器;
在上采样(Up-sampling)层与输出(Output)层之间设置由因果卷积进行转置的因果转置卷积(Causal Transpose Convolution)层和多个所述ADCCB组成的第二三明治架构,形成所述解码器;
通过在所述编码器的最大池化层与所述解码器的上采样层之间设置本征向量层,以构建获得所述TDRAE。
对于上述实现方式,在一些示例中,如图3所示,所述ADCCB的结构包括:并联耦接的第一支路和第二支路;所述第一支路在由输入至输出的方向上依次包括:第一因果卷积(Causal Convolution)层、批量标准化(BN)层、第一高斯误差线性单元(GeLU)层、第一空间随机失活(Spatial Dropout)层、第二因果卷积(Causal Convolution)层、层标准化(LN)层、第二高斯误差线性单元(GeLU)层、第二空间随机失活(Spatial Dropout)层以及第三因果卷积(Causal Convolution)层;所述第二支路由输入至输出的方向上包括:第四因果卷积(Causal Convolution)层。
结合上述示例以及图3,详细来说,在图3所示出的因果卷积层的参数中,参数“n@s”表示输入的时间序列信息,可以理解地,当s=1时,即图3中的“n@1”表示输入的时间序列信息为“1”序列;参数“d”表示膨胀率(dilated rate),即卷积核kernel的间隔数量,详细来说,由于卷积核不连续,不是所有的信息参与了计算,因此容易导致信息连续性的损失,引起栅格效应,为了避免栅格效应,通常在叠加的膨胀率dilated rate中不能有大于1的公约数,举例来说,在三个因果卷积层的叠加结构中,三个层分别对应的膨胀率d不能存在大于1的公约数,比如可以为[1,2,4];而不能为[2,4,6]。
基于上述图3所示的ADCCB的结构组成以及因果卷积层,在一些示例中,所述编码器结构依次包括:输入层、第五因果卷积层、两个或两个以上ADCCB、第六因果卷积层和最大池化(Max-pooling)层;其中,两个或两个以上ADCCB对应的膨胀率依次增加。
在一些示例中,所述解码器的结构依次包括:上采样(Up-sampling)层、第一因果转置卷积层、两个或两个以上ADCCB、第二因果转置卷积层和输出(Output)层;其中,两个或两个以上ADCCB对应的膨胀率依次减少。
对于上述两个示例,参见图4所示的TDRAE结构,具体来说,在图4中,左侧虚线框示出了本发明实施例采用的编码器Encoder结构,在该编码器结构中,第五因果卷积层和第六因果卷积层的膨胀率d=1;ADCCB的数量为3个,膨胀率d依次为1,2,4。此外,在图4中,右侧虚线框示出了本发明实施例采用的解码器Decoder结构,在该解码器结构中,第一因果转置卷积层和第二因果转置卷积层的膨胀率d=1;ADCCB的数量为3个,膨胀率d依次为4,2,1。对于编码器Encoder与解码器Decoder,期间通过本征向量(Latent Vector)层进行连接,也就是说,如图4中的实线所示,Max-pooling层的输出与Up-sampling层的输入之间为LatentVector层,用于将Max-pooling层所输出数据中的本征向量作为Up-sampling层的输入数据。
对于图2所示的技术方案,在一些示例中,所述从地面接收站所接收到的卫星遥测数据包中提取卫星遥测数据,包括:
根据设定的数据提取与数据转换规则,从所述卫星遥测数据包解析得到原始卫星遥测数据;
对所述原始卫星遥测数据依次进行野值去除、数据补全、特征选取以及归一化的第一预处理过程,或者依次进行野值去除、数据补全以及归一化的第二预处理过程,得到能够适用于所述时域反卷积重建自编码器TDRAE的卫星遥测数据。
基于上述示例,在一些示例中,所述基于提取得到的卫星遥测数据生成训练集和验证集,包括:
针对所述适用于所述时域反卷积重建自编码器TDRAE的卫星遥测数据,通过滑动窗口的方式进行数据截断,以生成多个数据集;
将生成的数据集划分为训练集和验证集。
对于上述两个示例,详细来说,地面接收站在接收到卫星遥测数据包后,可以通过解析软件并根据软件中所设定的数据提取与数据转换规则进行数据提取,从而得到原始卫星遥测数据;可以理解地,原始卫星遥测数据具有高维耦合特性。接着,针对原始卫星遥测数据进行数据预处理,比如依次进行野值去除、数据补全、特征选取以及归一化,从而得到适用于本发明实施例所提出的时域反卷积重建自编码器TDRAE的卫星遥测数据;需要说明的是,预处理中的特征选择属于可选项目,并不是数据预处理过程所必须的处理手段。并且对于TDRAE来说,其输入层与输出层可以被设置为等效,即输入层的输入长度与输出层的输出长度相等。
对于图2所示的技术方案,在一些示例中,针对所述预测结果按照设定的评估策略进行评估,获得用于指征是否存在异常的评估结果,包括:
根据对于第i个样本的预测结果Ypred(i)以及第i个样本的原始输出结果Yorig(i),利用下式计算获得第i个样本的异常指数S(i):
S(i)=Scaler(N(N(Ypred(i)-Yorig(i),2),1))
其中,N(tensor,r)表示张量沿r轴的L2准则的函数,Scaler()表示(0,1)归一化函数;
将第i个样本的异常指数S(i)与设定的评估阈值进行比较,获得指征第i个样本是否存在异常的评估结果。
对于上述示例,具体来说,所述评估阈值可以通过异常指数的核密度估计曲线进行设置,在本发明实施例中,该阈值可以被设置为0.2。
基于前述技术方案,本发明实施例以某型号高光谱卫星的遥测数据为例进行仿真实验,并根据该遥测数据只做了包含22种遥测数据的数据集。在该仿真实验中,本发明实施例所提出的时域反卷积重建自编码器TDRAE是在Python 3.9下用Tensorflow-Keras 2.8.0实现的。运行环境为配备有16GB显存的RTX 3080Ti GPU的移动工作站;TDRAE模型的优化器为Adam;损失函数选择为均方误差(MSE,Mean Square Error);训练轮次为500,批量大小(batch size)为128。学习率为0.0001。基于上述仿真条件执行本发明实施例所提出的技术方案,其训练过程如图5所示,在图5中,横坐标表示训练轮次Epoch,纵坐标表示损失函数值Loss,实线表示训练集的损失,虚线表示验证集的损失,从图5可以看出,在训练至100轮次时,训练集的损失与验证集的损失均已收敛,表示本发明实施例所提出的TDRAE模型能够较为快速地完成训练过程。此外,对于用于确定阈值的直方图与异常指数的核密度估计曲线来说,如图6所示,在图6中,横坐标表示异常指数(Anomaly Score),纵坐标表示核密度(Density),从直方图与核密度估计曲线可以看出,用于指征是否存在异常的评估阈值优选为0.2。以通过图6所得到的评估阈值0.2为例,参见图7所示的数据集分类示意图,在图7中,横坐标表示样本(Sample S/N),样本总数为12000,纵坐标表示异常指数(Anomaly Score),点划线表示评估阈值0.2,也就是说,异常指数(Anomaly Score)超过该评估阈值(即在图7中处于点划线之上的点)则被确认为异常;从图7可以看出,本发明实施例所提出的TDRAE模型以及前述图6所示出的评估阈值0.2,能够对数据集中的异常样本进行划分,从而得到异常数据。
为了体现本发明实施例所提出的TDRAE模型的技术效果,本发明实施例将本发明实施例所提出的TDRAE模型(以下可称之为TDRAE)与目前常规方案中所采用的一些较为先进的模型通过仿真实验进行比较;比如在长短期记忆网络(LSTM,Long Short-TermMemory)的基础上引入双向(Bidirectional)传播机制和注意力(Attention)机制的BiLSTM-Attention模型、在门控循环单元(GRU,Gated Recurrent Unit)基础上引入注意力(Attention)机制的GRU-Attetntion模型、卷积自编码器(CAE,ConvolutionalAutoEncoder)模型以及经典的时域卷积网络(TCN,Temporal Convolutional Networks)模型。在比较过程中,除了训练轮次由500改为了100,各模型的仿真实验条件与前述仿真实验条件一致,该对比实验结果如表1所示。
表1
通过上表可以看出,如果分别以MSE、平均绝对误差(MAE,Mean Absolute Error)、均方对数误差(MSLE,Mean Squared Logarithmic Error)以及训练集和验证集的决定系数R2作为训练集和验证集的损失函数,那么当训练轮次到达100时,TDRAE的损失函数值表现最优,TCN模型次之。也就是说,对于诸如卫星遥测数据这类型的多维(Multivariate)耦合时序数据,BiLSTM-Attention模型、GRU-Attention模型以及CAE模型的训练效果明显不如TCN模型以及TDRAE,更加验证了因果卷积类型的模型更加适用于多维(Multivariate)耦合时序数据;其次,TCN的训练效果尽管相较于BiLSTM-Attention模型、GRU-Attention模型以及CAE模型更佳,但是仍劣于TDRAE。此外,仅关注决定系数R2,可以获知,当训练轮次到达100时,TDRAE的R2分别比BiLSTM-Attention模型,GRU-Attention模型,CAE模型以及TCN模型高出65%,65%,65%和3%,这说明TDRAE的输入张量对输出张量的解释程度更高,TDRAE具有最高的回归贡献的相对程度,因此TDRAE具有更好的回归器属性。
基于前述技术方案相同的发明构思,参见图8,其示出了本发明实施例提供的一种基于TDRAE的无监督卫星异常检测装置80,所述装置80包括:构建部分801、提取部分802、生成部分803、训练部分804、输入部分805和评估部分806,其中,
所述构建部分801,经配置为利用由因果卷积层以及基于因果卷积层形成的先进膨胀因果卷积块ADCCB所组成的编码器和解码器构建时域反卷积重建自编码器TDRAE;
所述提取部分802,经配置为从地面接收站所接收到的卫星遥测数据包中提取卫星遥测数据;
所述生成部分803,经配置为并基于提取得到的卫星遥测数据生成训练集和验证集;
所述训练部分804,经配置为根据设定的训练参数利用所述训练集和验证集训练所述TDRAE,并将训练完毕后的TDRAE在地面接收站进行本地部署;
所述输入部分805,经配置为将获取到的准实时的卫星遥测数据输入至本地部署的训练完毕后的TDRAE,以获得预测结果;
所述评估部分806,经配置为针对所述预测结果按照设定的评估策略进行评估,获得用于指征是否存在异常的评估结果。
在一些示例中,所述构建部分801,经配置为:
利用所述因果卷积层、批量标准化层、高斯误差线性单元层、空间随机失活层以及层标准化层构建所述ADCCB;
在输入层与最大池化层之间设置由因果卷积层和多个所述ADCCB组成的第一三明治架构,形成所述编码器;
在上采样层与输出层之间设置由因果卷积进行转置的因果转置卷积层和多个所述ADCCB组成的第二三明治架构,形成所述解码器;
通过在所述编码器的最大池化层与所述解码器的上采样层之间设置本征向量层,以构建获得所述TDRAE。
在上述示例中,所述ADCCB的结构包括:并联耦接的第一支路和第二支路;所述第一支路在由输入至输出的方向上依次包括:第一因果卷积层、批量标准化层、第一高斯误差线性单元层、第一空间随机失活层、第二因果卷积层、层标准化层、第二高斯误差线性单元层、第二空间随机失活层以及第三因果卷积层;所述第二支路由输入至输出的方向上包括:第四因果卷积层。
在上述示例中,所述编码器结构依次包括:输入层、第五因果卷积层、两个或两个以上ADCCB、第六因果卷积层和最大池化层;其中,所述编码器结构中的两个或两个以上ADCCB对应的膨胀率依次增加;
所述解码器结构依次包括:上采样层、第一因果转置卷积层、两个或两个以上ADCCB、第二因果转置卷积层和输出层;其中,所述解码器结构中两个或两个以上ADCCB对应的膨胀率依次减少。
在一些示例中,所述提取部分802,经配置为:
根据设定的数据提取与数据转换规则,从所述卫星遥测数据包解析得到原始卫星遥测数据;
对所述原始卫星遥测数据依次进行野值去除、数据补全、特征选取以及归一化的第一预处理过程,或者依次进行野值去除、数据补全以及归一化的第二预处理过程,得到能够适用于所述时域反卷积重建自编码器TDRAE的卫星遥测数据。
在一些示例中,所述生成部分803,经配置为:
针对所述适用于所述时域反卷积重建自编码器TDRAE的卫星遥测数据,通过滑动窗口的方式进行数据截断,以生成多个数据集;
将生成的数据集划分为训练集和验证集。
在一些示例中,所述评估部分806,经配置为:
根据对于第i个样本的预测结果Ypred(i)以及第i个样本的原始输出结果Yorig(i),利用下式计算获得第i个样本的异常指数S(i):
S(i)=Scaler(N(N(Ypred(i)-Yorig(i),2),1))
其中,N(tensor,r)表示张量沿r轴的L2准则的函数,Scaler()表示(0,1)归一化函数;
将第i个样本的异常指数S(i)与设定的评估阈值进行比较,获得指征第i个样本是否存在异常的评估结果。
可以理解地,在本实施例中,“部分”可以是部分电路、部分处理器、部分程序或软件等等,当然也可以是单元,还可以是模块也可以是非模块化的。
另外,在本实施例中的各组成部分可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
因此,本实施例提供了一种计算机存储介质,所述计算机存储介质存储有基于TDRAE的无监督卫星异常检测程序,所述基于TDRAE的无监督卫星异常检测程序被至少一个处理器执行时实现上述技术方案中所述基于TDRAE的无监督卫星异常检测方法步骤。
根据上述基于TDRAE的无监督卫星异常检测装置80以及计算机存储介质,参见图9,其示出了本发明实施例提供的一种能够实施上述基于TDRAE的无监督卫星异常检测装置80的计算设备90的具体硬件结构,该计算设备90可以为无线装置、移动或蜂窝电话(包含所谓的智能电话)、个人数字助理(PDA)、视频游戏控制台(包含视频显示器、移动视频游戏装置、移动视频会议单元)、膝上型计算机、桌上型计算机、电视机顶盒、平板计算装置、电子书阅读器、固定或移动媒体播放器,等。计算设备90包括:通信接口901,存储器902和处理器903;各个组件通过总线系统904耦合在一起。可理解,总线系统904用于实现这些组件之间的连接通信。总线系统904除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图9中将各种总线都标为总线系统904。其中,
所述通信接口901,用于在与其他外部网元之间进行收发信息过程中,信号的接收和发送;
所述存储器902,用于存储能够在所述处理器903上运行的计算机程序;
所述处理器903,用于在运行所述计算机程序时,执行上述技术方案中所述基于TDRAE的无监督卫星异常检测方法步骤。
可以理解,本发明实施例中的存储器902可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的系统和方法的存储器902旨在包括但不限于这些和任意其它适合类型的存储器。
而处理器903可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器903中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器903可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器902,处理器903读取存储器902中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
可以理解地,上述基于TDRAE的无监督卫星异常检测装置80以及计算设备90的示例性技术方案,与前述基于TDRAE的无监督卫星异常检测方法的技术方案属于同一构思,因此,上述对于基于TDRAE的无监督卫星异常检测装置80以及计算设备90的技术方案未详细描述的细节内容,均可以参见前述基于TDRAE的无监督卫星异常检测方法的技术方案的描述。本发明实施例对此不做赘述。
需要说明的是:本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种基于时域反卷积重建自编码器TDRAE的无监督卫星异常检测方法,其特征在于,所述方法包括:
利用由因果卷积层以及基于因果卷积层形成的先进膨胀因果卷积块ADCCB所组成的编码器和解码器构建时域反卷积重建自编码器TDRAE;
从地面接收站所接收到的卫星遥测数据包中提取卫星遥测数据,并基于提取得到的卫星遥测数据生成训练集和验证集;
根据设定的训练参数利用所述训练集和验证集训练所述TDRAE,并将训练完毕后的TDRAE在地面接收站进行本地部署;
将获取到的准实时的卫星遥测数据输入至本地部署的训练完毕后的TDRAE,以获得预测结果;
针对所述预测结果按照设定的评估策略进行评估,获得用于指征是否存在异常的评估结果。
2.根据权利要求1所述的方法,其特征在于,所述利用由因果卷积层以及基于因果卷积层形成的ADCCB所组成的编码器和解码器构建TDRAE,包括:
利用所述因果卷积层、批量标准化层、高斯误差线性单元层、空间随机失活层以及层标准化层构建所述ADCCB;
在输入层与最大池化层之间设置由因果卷积层和多个所述ADCCB组成的第一三明治架构,形成所述编码器;
在上采样层与输出层之间设置由因果卷积进行转置的因果转置卷积层和多个所述ADCCB组成的第二三明治架构,形成所述解码器;
通过在所述编码器的最大池化层与所述解码器的上采样层之间设置本征向量层,以构建获得所述TDRAE。
3.根据权利要求2所述的方法,其特征在于,所述ADCCB的结构包括:并联耦接的第一支路和第二支路;所述第一支路在由输入至输出的方向上依次包括:第一因果卷积层、批量标准化层、第一高斯误差线性单元层、第一空间随机失活层、第二因果卷积层、层标准化层、第二高斯误差线性单元层、第二空间随机失活层以及第三因果卷积层;所述第二支路由输入至输出的方向上包括:第四因果卷积层。
4.根据权利要求2所述的方法,其特征在于,所述编码器结构依次包括:输入层、第五因果卷积层、两个或两个以上ADCCB、第六因果卷积层和最大池化层;其中,所述编码器结构中的两个或两个以上ADCCB对应的膨胀率依次增加;
所述解码器结构依次包括:上采样层、第一因果转置卷积层、两个或两个以上ADCCB、第二因果转置卷积层和输出层;其中,所述解码器结构中两个或两个以上ADCCB对应的膨胀率依次减少。
5.根据权利要求1所述的方法,其特征在于,所述从地面接收站所接收到的卫星遥测数据包中提取卫星遥测数据,包括:
根据设定的数据提取与数据转换规则,从所述卫星遥测数据包解析得到原始卫星遥测数据;
对所述原始卫星遥测数据依次进行野值去除、数据补全、特征选取以及归一化的第一预处理过程,或者依次进行野值去除、数据补全以及归一化的第二预处理过程,得到能够适用于所述时域反卷积重建自编码器TDRAE的卫星遥测数据。
6.根据权利要求5所述的方法,其特征在于,所述基于提取得到的卫星遥测数据生成训练集和验证集,包括:
针对所述适用于所述时域反卷积重建自编码器TDRAE的卫星遥测数据,通过滑动窗口的方式进行数据截断,以生成多个数据集;
将生成的数据集划分为训练集和验证集。
7.根据权利要求1所述的方法,其特征在于,所述针对所述预测结果按照设定的评估策略进行评估,获得用于指征是否存在异常的评估结果,包括:
根据对于第i个样本的预测结果Ypred(i)以及第i个样本的原始输出结果Yorig(i),利用下式计算获得第i个样本的异常指数S(i):
S(i)=Scaler(N(N(Ypred(i)-Yorig(i),2),1))
其中,N(tensor,r)表示张量沿r轴的L2准则的函数,Scaler()表示(0,1)归一化函数;
将第i个样本的异常指数S(i)与设定的评估阈值进行比较,获得指征第i个样本是否存在异常的评估结果。
8.一种基于时域反卷积重建自编码器TDRAE的无监督卫星异常检测装置,其特征在于,所述装置包括:构建部分、提取部分、生成部分、训练部分、输入部分和评估部分,其中,
所述构建部分,经配置为利用由因果卷积层以及基于因果卷积层形成的先进膨胀因果卷积块ADCCB所组成的编码器和解码器构建时域反卷积重建自编码器TDRAE;
所述提取部分,经配置为从地面接收站所接收到的卫星遥测数据包中提取卫星遥测数据;
所述生成部分,经配置为并基于提取得到的卫星遥测数据生成训练集和验证集;
所述训练部分,经配置为根据设定的训练参数利用所述训练集和验证集训练所述TDRAE,并将训练完毕后的TDRAE在地面接收站进行本地部署;
所述输入部分,经配置为将获取到的准实时的卫星遥测数据输入至本地部署的训练完毕后的TDRAE,以获得预测结果;
所述评估部分,经配置为针对所述预测结果按照设定的评估策略进行评估,获得用于指征是否存在异常的评估结果。
9.一种计算设备,其特征在于,所述计算设备包括:通信接口,存储器和处理器;各个组件通过总线系统耦合在一起;其中,
所述通信接口,用于在与其他外部网元之间进行收发信息过程中,信号的接收和发送;
所述存储器,用于存储能够在所述处理器上运行的计算机程序;
所述处理器,用于在运行所述计算机程序时,执行权利要求1至7任一项所述基于TDRAE的无监督卫星异常检测方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有基于TDRAE的无监督卫星异常检测程序,所述基于TDRAE的无监督卫星异常检测程序被至少一个处理器执行时实现权利要求1至7任一项所述基于TDRAE的无监督卫星异常检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210946484.3A CN115409091A (zh) | 2022-08-08 | 2022-08-08 | 基于tdrae的无监督卫星异常检测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210946484.3A CN115409091A (zh) | 2022-08-08 | 2022-08-08 | 基于tdrae的无监督卫星异常检测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115409091A true CN115409091A (zh) | 2022-11-29 |
Family
ID=84159662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210946484.3A Pending CN115409091A (zh) | 2022-08-08 | 2022-08-08 | 基于tdrae的无监督卫星异常检测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115409091A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116232772A (zh) * | 2023-05-08 | 2023-06-06 | 中国人民解放军国防科技大学 | 基于集成学习的无监督的网络数据入侵检测方法 |
CN117272055A (zh) * | 2023-11-23 | 2023-12-22 | 国网山西省电力公司营销服务中心 | 一种基于滤波增强自编码器的电能表异常检测方法及装置 |
-
2022
- 2022-08-08 CN CN202210946484.3A patent/CN115409091A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116232772A (zh) * | 2023-05-08 | 2023-06-06 | 中国人民解放军国防科技大学 | 基于集成学习的无监督的网络数据入侵检测方法 |
CN116232772B (zh) * | 2023-05-08 | 2023-07-07 | 中国人民解放军国防科技大学 | 基于集成学习的无监督的网络数据入侵检测方法 |
CN117272055A (zh) * | 2023-11-23 | 2023-12-22 | 国网山西省电力公司营销服务中心 | 一种基于滤波增强自编码器的电能表异常检测方法及装置 |
CN117272055B (zh) * | 2023-11-23 | 2024-02-06 | 国网山西省电力公司营销服务中心 | 一种基于滤波增强自编码器的电能表异常检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115409091A (zh) | 基于tdrae的无监督卫星异常检测方法、装置、设备及介质 | |
US11403838B2 (en) | Image processing method, apparatus, equipment, and storage medium to obtain target image features | |
US11537898B2 (en) | Generative structure-property inverse computational co-design of materials | |
WO2021189844A1 (zh) | 多元kpi时间序列的检测方法、装置、设备及存储介质 | |
US9484016B2 (en) | Hybrid predictive model for enhancing prosodic expressiveness | |
US11755909B2 (en) | Method of and system for training machine learning algorithm to generate text summary | |
CN111080360B (zh) | 行为预测方法、模型训练方法、装置、服务器及存储介质 | |
CN111143563A (zh) | 基于bert与lstm及cnn融合的文本分类方法 | |
Li et al. | A domain adaptation model for early gear pitting fault diagnosis based on deep transfer learning network | |
CN109298258A (zh) | 结合rvm和dbn的变压器故障诊断方法及系统 | |
US12045961B2 (en) | Image denoising method and apparatus based on wavelet high-frequency channel synthesis | |
CN114048468A (zh) | 入侵检测的方法、入侵检测模型训练的方法、装置及介质 | |
Huang et al. | 1DCNN fault diagnosis based on cubic spline interpolation pooling | |
CN115115512B (zh) | 一种图像超分网络的训练方法及装置 | |
CN111027681B (zh) | 时序数据处理模型训练方法、数据处理方法、装置及存储介质 | |
CN116280094A (zh) | 一种基于Conv-Bi-LSTM模型的船舶升沉运动预测系统及预测方法 | |
Kalpana et al. | Multiple parametric fault diagnosis using computational intelligence techniques in linear filter circuit | |
CN115311530A (zh) | 一种基于深度卷积自编码器的流场特征提取方法 | |
Yu et al. | SKND-TSACNN: A novel time-scale adaptive CNN framework for fault diagnosis of rotating machinery | |
CN115238641A (zh) | 缺陷根因确定方法、装置和存储介质 | |
US20240160951A1 (en) | Control Simulation Method Based On Artificial Intelligence | |
Ma et al. | Prediction of remaining useful life of rolling bearings based on multiscale efficient channel attention CNN and bidirectional GRU | |
Liu et al. | An anomaly detection method based on double encoder–decoder generative adversarial networks | |
US11720750B1 (en) | Method for QA with multi-modal information | |
CN116011412A (zh) | 一种gis设备绝缘缺陷评价方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |