WO2021189904A1

WO2021189904A1 - 数据异常检测方法、装置、电子设备及存储介质

Info

Publication number: WO2021189904A1
Application number: PCT/CN2020/131984
Authority: WO
Inventors: 邓悦; 郑立颖; 徐亮
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-10-09
Filing date: 2020-11-27
Publication date: 2021-09-30
Also published as: CN112148577B; CN112148577A

Abstract

一种数据异常检测方法、装置、电子设备以及计算机可读存储介质，该方法包括：获取包含缺失数据的标准训练数据集及包括变分下限函数的异常检测模型框架；利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数；利用所述标准训练数据集对异常检测模型框架进行训练，得到异常检测模型；利用所述异常检测模型对所述待检测数据集进行检测并得到待检测数据的重构概率；若存在重构概率大于等于重构阈值的目标待检测数据，则确定所述目标待检测数据为异常数据。该方法可以提高关键性能指标（KPI）异常检测的效率和准确率。

Description

数据异常检测方法、装置、电子设备及存储介质

本申请要求于2020年10月9日提交中国专利局、申请号为CN202011074730.8、名称为“数据异常检测方法、装置、电子设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术，尤其涉及一种数据异常检测方法、装置、电子设备及计算机可读存储介质。

背景技术

KPI(关键性能指标)异常检测是智能运维领域中非常重要的部分。为了确保业务不中断，通常需要检测各种KPI(如应用程序的KPI、操作系统的KPI等)是否存在异常，从而确定系统的软件或硬件是否存在故障，并及时进行故障排除。

发明人意识到，现有技术中的KPI异常检测方法，由于训练完成的异常检测模型鲁棒性较低，模型稳定性交低，导致检测结果的存在不够准确的问题；同时，现有技术中的检测方法中会生成大量标签，占用计算机资源的同时降低了检测效率。

发明内容

本申请提供的一种数据异常检测方法，包括：

获取标准训练数据集，所述标准训练数据集包含异常检测数据和缺失数据；

获取预构建的异常检测模型框架，所述异常检测模型框架包括变分下限函数；

利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数；

利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型；

获取待检测数据集，利用所述异常检测模型对所述待检测数据集进行检测，得到所述待检测数据集中待检测数据的重构概率；

若存在重构概率大于等于重构阈值的目标待检测数据，则确定所述目标待检测数据为异常数据。

本申请还提供一种数据异常检测装置，所述装置包括：

数据处理模块，用于获取标准训练数据集，所述标准训练数据集包含异常检测数据和缺失数据；

模型获取模块，用于获取预构建的异常检测模型框架，所述异常检测模型框架包括变分下限函数；

函数调整模块，用于利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数；

模型训练模块，用于利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型；

重构概率获取模块，用于获取待检测数据集，利用所述异常检测模型对所述待检测数据集进行检测，得到所述待检测数据集中待检测数据的重构概率；

异常检测模块，用于若存在重构概率大于等于重构阈值的目标待检测数据，则确定所述目标待检测数据为异常数据。

本申请还提供一种电子设备，所述电子设备包括：

存储器，存储至少一个指令；及

处理器，执行所述存储器中存储的指令以实现如下步骤：

本申请还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个指令，所述至少一个指令被电子设备中的处理器执行以实现如下步骤：

附图说明

图1为本申请一实施例提供的数据异常检测方法的流程示意图；

图2为本申请一实施例提供的数据异常检测装置的功能模块图；

图3为本申请一实施例提供的实现所述数据异常检测方法的电子设备的结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例提供的数据异常检测方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之，所述数据异常检测方法可以由安装在终端设备或服务端设备的软件或硬件来执行，所述软件可以是区块链平台。所述服务端包括但不限于：单台服务器、服务器集群、云端服务器或云端服务器集群等。

参照图1所示，为本申请一实施例提供的数据异常检测方法的流程示意图。在本实施例中，所述数据异常检测方法包括：

S1、获取标准训练数据集，所述标准训练数据集包含异常检测数据和缺失数据。

本申请实施例中，所述标准训练数据集可以包含各种KPI(Key Performance Indicators，关键性能指标)的数值。

所述KPI是指对服务、系统等运维对象的监控指标(如延迟、吞吐量等)，具体的，标准训练数据集包含相同或不同的KPI按监控到的时间先后顺序排列而成的数值序列。

本申请实施例中，所述缺失数据为数值为0的数据，所述异常检测数据为KPI异常数据。

例如，标准训练数据集中有不同时间采集的CPU使用率，其中，部分时间的CPU使用率为0或部分时间CPU使用率异常；或者，标准训练数据集中有不同时间采集到的硬件资源消耗量，其中，部分时间的硬件资源消耗量为0或部分时间的硬件资源消耗量异常；或者，标准训练数据集中有不同时间采集到在线用户数量，其中，部分时间的在线用户数量为0或部分时间在线用户数量异常；或者，标准训练数据集中有不同时间采集到并发用户数，其中，部分时间的并发用户数为0或部分时间的并发用户数异常。

优选的，所述标准训练数据集可以存储于区块链中，则在具体实施时，直接从区块链的节点中获取所述标准训练数据集。

通过将标准训练数据集存储于区块链中，可以提高KPI数据的私密和安全性。

进一步的，在本申请一可选实施例中，所述获取标准训练数据集包括：

获取原始训练数据集；

将所述原始训练数据集中预设比例的数据设置为缺失数据；

通过预设的归一化公式对所述包括缺失数据的原始训练数据集进行归一化处理，得到归一化数据集；

将所述归一化数据集输入至预设的滑动窗口，得到所述标准训练数据集。

详细地，本申请实施例通过下述公式对所述原始训练数据集进行归一化处理：

其中，n为所述原始训练数据集中数据个数，x _i为所述原始训练数据集中第i个数据，y _i为所述归一化数据集中第i个数据，并且所述y _i∈[0,1]。

本申请实施例中，随机将λ比率的正常数据(即非0的KPI数据)设置为0，视为缺失数据，加强了模型训练的效果。

本申请实施例中，所述原始训练数据集为时间序列数据，将归一化数据集输入至所述滑动窗口，可以保证所述原始训练数据集的序列性，提高数据的可用性和一致性。

具体的，若所述滑动窗口的大小为W，则所述标准训练数据集中的数据为W个，即标准训练数据集中的数据为：x _W,…,x ₁。

本申请实施例中，对所述原始训练数据集进行归一化处理，可以标准化标准训练数据集中的数据，并且通过使用所述滑动窗口，保证了所述标准训练数据集中数据的时间序列性。

S2、获取预构建的异常检测模型框架，所述异常检测模型框架包括变分下限函数。

本申请实施例中，所述预先构建的异常检测模型框架可以为VAE(Variational Autoencoders，变分自编码器)异常检测模型框架。

具体的，VAE包括编码器、解码器及变分下限函数，所述编码器计算所述标准训练数据集中所述的隐变量分布参数(均值和方差)，并采样得到隐变量，所述解码器对所述隐变量进行恢复，得到输出结果，利用所述输出结果和所述变分下限函数可以对输入的KPI数据计算其重构概率，根据所述重构概率判断所述KPI数据是否异常。

S3、利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数。

具体的，所述利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数，包括：

基于所述缺失数据计算优化数值；

将所述优化数值添加至所述变分下限函数，得到所述优化变分下限函数。

进一步的，可通过以下方式基于所述缺失数据计算优化数值：

缺失系数

根据所述缺失数据数据得到的缺失系数计算优化数值β，具体的，

其中，所述x _w为所述标准训练数据集中第w个数据。

进一步地，所述优化变分下限函数为：

其中，所述W为所述标准训练数据集中的数据个数，x _w为所述标准训练数据集中第w个数据，所述a _w为第w个数据的缺失系数，当x _w为缺失数据时，a _w＝1，当x _w不为缺失数据时，a _w＝0，β为优化数值，且存在

所述z表示标准训练数据集中隐变量z。

其中，

进一步地，本申请实施例中，所述优化变分下限函数根据所述缺失数据进行调整，使得可以利用所述缺失数据对所述异常检测模型框架进行训练，增强了所述异常检测模型框架面对异常数据的稳定性，从而提高了模型的鲁棒性。

S4、利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型。

较佳地，所述S4包括：

步骤A：将所述标准训练数据集输入至所述异常检测模型框架进行计算，得到输出结果；

步骤B：根据所述输出结果计算所述优化变分下限函数的损失值；

步骤C：若所述损失值大于预设的损失阈值时，调整所述异常检测模型框架中的参数，返回步骤A，直到所述损失值小于等于所述损失阈值时，停止调整所述异常检测模型框架中的参数，得到所述异常检测模型。

进一步地，所述将所述标准训练数据集输入至所述异常检测模型框架进行计算，得到输出结果，包括：

利用所述异常检测模型框架中的编码器计算所述标准训练数据集中数据的隐变量分布参数；

对所述隐变量分布参数进行取样得到隐变量；

利用异常检测模型框架中的解码器及所述隐变量计算得到所述输出结果。

具体的，所述隐变量分布参数是所述标准训练数据集中所有数据的隐变量。

其中，本申请实施例中，利用下述公式计算得到所述隐变量：

z为所述隐变量，

μ(X),∑(X)为所述隐变量分布参数里的均值和方差，μ(x)为所述标准训练数据集的均值。

其中，本申请实施例中，利用下述公式计算得到所述输出结果：

p(x)＝∫p(x,z|θ)＝∫p(x|z；θ)p(z)dz

其中，p(x)为所述输出结果，z是隐变量空间Z中的点，p(z)为取到所述隐变量z的概率，θ是参数空间Θ中的点，所述参数空间的范围为预设范围。

p(x|z；θ)＝N(x|f(z；θ),σ ²*I)

其中，I表示单位矩阵，σ为超参数。f为将z,θ映射到x的函数，即f:X×Θ→X。

本申请实施例中，由于每次训练前所述缺失数据是随机选取的，因此可以重复利用所述标准训练数据集训练所述异常检测模型框架，提高了数据利用率。

S5、获取待检测数据集，利用所述异常检测模型对所述待检测数据集进行检测，得到所述待检测数据集中待检测数据的重构概率。

本申请实施例中，具体利用所述异常检测模型对所述待检测数据集进行检测时，对于所述待检测数据集中的每个待检测数据，异常检测模型中的解码器输出均值和方差参数。异常检测模型中的编码器利用解码器输出的均值和方差参数，计算从所述隐变量分布z产生与待检测数据接近的平均概率，所述平均概率用作异常分数，称为重构概率，所述重构概率用于评估待检测数据出现异常的可能性。

优选的，本申请一实施例中，所述利用所述异常检测模型对所述待检测数据集进行检测之前，所述方法还包括：

判断所述待检测数据集中是否存在缺失值；

若所述待检测数据集中存在缺失值，通过蒙特卡洛插补法填充所述待检测数据集中存在的缺失值。

具体的，蒙特卡洛插补法可以从现有技术中获取，此处不再赘述。本申请实施例中，待检测数据集中的缺失值会在所述异常检测模型中的编码器编码过程引起偏差，从而影响数据异常检测的结果，通过所述蒙特卡洛插补法对待检测数据集中的缺失值进行填充，可以提高数据异常检测的准确性。

S6、若存在重构概率大于等于重构阈值的目标待检测数据，则确定所述目标待检测数据为异常数据。

具体的，所述重构阈值为预设的。

本申请实施例中，将具有高重构概率的数据确定为异常数据。

可选的，在本申请实施例中，当确定待检测数据集中存在异常数据时，发送警告消息提醒，所述警告消息提醒包括异常数据点对应的运行时间。通过在警告消息提醒中包含异常数据点对应的运行时间，有利于提高运维的效率。

在本申请实施例中，确定重构概率小于所述重构阈值的待检测数据为正常数据。

可选的，在本申请实施例中，当确定待检测数据集中不存在异常数据时，持续监控，以及对本次的异常检测结果和检测时间进行记录。

本申请实施例根据所述标准训练数据集中的缺失数据对所述异常检测模型框架中的变分下限函数进行调整，可以优化变分下限函数，进而利用优化的变分下限函数对模型进行训练，可以得到鲁棒性更高的异常检测模型，有利于提高异常检测模型的稳定性，避免出现检测不准确的问题，进而有利于提高KPI异常检测时的准确率；同时，本申请实施例，根据优化变分下限函数得的异常检测模型进行检测，这一过程中不产生标签，降低了对标签的依赖性，避免了占用过多的计算机资源，提高了检测的效率。因此本申请提出的数据异常检测方法，可以提高KPI异常检测的效率和准确率。

如图2所示，是本申请一实施例提供的数据异常检测装置的功能模块图。

本申请所述数据异常检测装置100可以安装于电子设备中。根据实现的功能，所述数据异常检测装置100可以包括数据处理模块101、模型获取模块102、函数调整模块103、模型训练模块104、重构概率获取模块105及异常检测模块106。本申请所述模块也可以称之为单元，是指一种能够被电子设备处理器所执行，并且能够完成固定功能的一系列计算机程序段，其存储在电子设备的存储器中。

在本实施例中，关于各模块/单元的功能如下：

所述数据处理模块101，用于获取标准训练数据集，所述标准训练数据集包含异常检测数据和缺失数据。

进一步的，所述数据处理模块101具体用于：

获取原始训练数据集；

将所述原始训练数据集中预设比例的数据设置为缺失数据；

所述模型获取模块102，用于获取预构建的异常检测模型框架，所述异常检测模型框架包括变分下限函数。

所述函数调整模块103，用于利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数。

具体的，所述函数调整模块103具体用于：

基于所述缺失数据计算优化数值；

缺失系数

其中，所述x _w为所述标准训练数据集中第w个数据。

进一步地，所述优化变分下限函数为：

所述z表示标准训练数据集中隐变量z。

其中，

所述模型训练模块104，用于利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型。

较佳地，所述模型训练模块104包括：

第一计算单元，用于将所述标准训练数据集输入至所述异常检测模型框架进行计算，得到输出结果；

第二计算单元，用于根据所述输出结果计算所述优化变分下限函数的损失值；

模型获取调整单元，用于若所述损失值大于预设的损失阈值时，调整所述异常检测模型框架中的参数，出发第一计算单元将所述标准训练数据集输入至所述异常检测模型框架进行计算，得到输出结果，直到所述损失值小于等于所述损失阈值时，停止调整所述异常检测模型框架中的参数，得到所述异常检测模型。

进一步地，所述第一计算单元具体用于：

对所述隐变量分布参数进行取样得到隐变量；

z为所述隐变量，

p(x)＝∫p(x,z|θ)＝∫p(x|z；θ)p(z)dz

p(x|z；θ)＝N(x|f(z；θ),σ ²*I)

所述重构概率获取模块105，用于获取待检测数据集，利用所述异常检测模型对所述待检测数据集进行检测，得到所述待检测数据集中待检测数据的重构概率。

优选的，本申请一实施例中，所述装置还包括判断模块，所述判断模块用于：

利用所述异常检测模型对所述待检测数据集进行检测之前，判断所述待检测数据集中是否存在缺失值；

具体的，蒙特卡洛插补法可以从现有技术中获取，此处不再赘述。

本申请实施例中，待检测数据集中的缺失值会在所述异常检测模型中的编码器编码过程引起偏差，从而影响数据异常检测的结果，通过所述蒙特卡洛插补法对待检测数据集中的缺失值进行填充，可以提高数据异常检测的准确性，同时利用所述异常检测模型输出重构概率，极大地提升了数据异常检测的速率。

所述异常检测模块106，用于若存在重构概率大于等于重构阈值的目标待检测数据，则确定所述目标待检测数据为异常数据。

具体的，所述重构阈值为预设的。

本申请实施例根据所述标准训练数据集中的缺失数据对所述异常检测模型框架中的变分下限函数进行调整，可以优化变分下限函数，进而利用优化的变分下限函数对模型进行训练，可以得到鲁棒性更高的异常检测模型，有利于提高异常检测模型的稳定性，避免出现检测不准确的问题，进而有利于提高KPI异常检测检测时的准确率；同时，本申请实施例，根据优化变分下限函数得的异常检测模型进行检测，这一过程中不产生标签，降低了对标签的依赖性，避免了占用过多的计算机资源，提高了检测的效率。因此本申请提出的数据异常检测装置，可以提高KPI异常检测的效率和准确率。

如图3所示，是本申请一实施例提供的实现数据异常检测方法的电子设备的结构示意图。

所述电子设备1可以包括处理器10、存储器11和总线，还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序，如数据异常检测程序12。

其中，所述存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如：SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元，例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备，例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card，SMC)、安全数字(Secure Digital，SD)卡、闪存卡(Flash Card)等。进一步地，所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据，例如数据异常检测程序12的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

所述处理器10在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(Central Processing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit)，利用各种接口和线路连接整个电子设备的各个部件，通过运行或执行存储在所述存储器11内的程序或者模块(例如数据异常检测程序等)，以及调用存储在所述存储器11内的数据，以执行电子设备1的各种功能和处理数据。

所述总线可以是外设部件互连标准(peripheral component interconnect，简称PCI)总线或扩展工业标准结构(extended industry standard architecture，简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。

图3仅示出了具有部件的电子设备，本领域技术人员可以理解的是，图3示出的结构并不构成对所述电子设备1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

例如，尽管未示出，所述电子设备1还可以包括给各个部件供电的电源(比如电池)，优选地，电源可以通过电源管理装置与所述至少一个处理器10逻辑相连，从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

进一步地，所述电子设备1还可以包括网络接口，可选地，所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等)，通常用于在该电子设备1与其他电子设备之间建立通信连接。

可选地，该电子设备1还可以包括用户接口，用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard))，可选地，用户接口还可以是标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。

所述电子设备1中的所述存储器11存储的数据异常检测程序12是多个指令的组合，在所述处理器10中运行时，可以实现：

具体地，所述处理器10对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。

进一步地，所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个非易失性或易失性计算机可读取存储介质中。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)。

所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被处理器执行时实现如下步骤：

在本申请所提供的几个实施例中，应该理解到，所揭露的设备，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。

因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种数据异常检测方法，其中，所述方法包括：

获取标准训练数据集，所述标准训练数据集包含异常检测数据和缺失数据；

获取预构建的异常检测模型框架，所述异常检测模型框架包括变分下限函数；

利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数；

利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型；

获取待检测数据集，利用所述异常检测模型对所述待检测数据集进行检测，得到所述待检测数据集中待检测数据的重构概率；

若存在重构概率大于等于重构阈值的目标待检测数据，则确定所述目标待检测数据为异常数据。
如权利要求1所述的数据异常检测方法，其中，所述获取标准训练数据集，包括：

获取原始训练数据集；

将所述原始训练数据集中预设比例的数据设置为缺失数据；

通过预设的归一化公式对所述包括缺失数据的原始训练数据集进行归一化处理，得到归一化数据集；

将所述归一化数据集输入至预设的滑动窗口，得到所述标准训练数据集。
如权利要求1所述的数据异常检测方法，其中，所述利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数，包括：

基于所述缺失数据计算优化数值；

将所述优化数值添加至所述变分下限函数，得到所述优化变分下限函数。
如权利要求1至3中任一项所述的数据异常检测方法，其中，所述优化变分下限函数为：

其中，所述W为所述标准训练数据集中的数据个数，x _w为所述标准训练数据集中第w个数据，所述a _w为第w个数据的缺失系数，当x _w为缺失数据时，a _w＝1，当x _w不为缺失数据时，a _w＝0，β为优化数值，且存在
所述z表示标准训练数据集中隐变量z；

其中，
表示对x对应的隐变量z的分布计算期望，logp _θ(x|z)表示对p(x|z；θ)取对数，p _θ(x|z)意味着将隐变量z恢复成x,对应着解码器，p _θ(z)表示标准训练数据集下隐变量z的分布，logp _θ(z)表示对所述p _θ(z)取对数，logq _φ(z|x)表示对所述q _φ(z|x)取对数，q _φ(z|x)意味着在样本x下隐变量z的分布，对应于编码器部分。
如权利要求1所述的数据异常检测方法，其中，所述利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型，包括：

步骤A：将所述标准训练数据集输入至所述异常检测模型框架进行计算，得到输出结果；

步骤B：根据所述输出结果计算所述优化变分下限函数的损失值；

步骤C：若所述损失值大于预设的损失阈值时，调整所述异常检测模型框架中的参数，返回步骤A，直到所述损失值小于等于所述损失阈值时，停止调整所述异常检测模型框架中的参数，得到所述异常检测模型。
如权利要求5所述的数据异常检测方法，其中，所述将所述标准训练数据集输入至所述异常检测模型框架进行计算，得到输出结果，包括：

利用所述异常检测模型框架中的编码器计算所述标准训练数据集中数据的隐变量分布参数；

对所述隐变量分布参数进行取样得到隐变量；

利用异常检测模型框架中的解码器及所述隐变量计算得到所述输出结果。
如权利要求1所述的数据异常检测方法，其中，所述利用所述异常检测模型对所述待检测数据集进行检测之前，所述方法还包括：

判断所述待检测数据集中是否存在缺失值；

若所述待检测数据集中存在缺失值，通过蒙特卡洛插补法填充所述待检测数据集中存在的缺失值。
一种数据异常检测装置，其中，所述装置包括：

数据处理模块，用于获取标准训练数据集，所述标准训练数据集包含异常检测数据和缺失数据；

模型获取模块，用于获取预构建的异常检测模型框架，所述异常检测模型框架包括变分下限函数；

函数调整模块，用于利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数；

模型训练模块，用于利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型；

重构概率获取模块，用于获取待检测数据集，利用所述异常检测模型对所述待检测数据集进行检测，得到所述待检测数据集中待检测数据的重构概率；

异常检测模块，用于若存在重构概率大于等于重构阈值的目标待检测数据，则确定所述目标待检测数据为异常数据。
一种电子设备，其中，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如下步骤：

获取标准训练数据集，所述标准训练数据集包含异常检测数据和缺失数据；

获取预构建的异常检测模型框架，所述异常检测模型框架包括变分下限函数；

利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数；

利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型；

获取待检测数据集，利用所述异常检测模型对所述待检测数据集进行检测，得到所述待检测数据集中待检测数据的重构概率；

若存在重构概率大于等于重构阈值的目标待检测数据，则确定所述目标待检测数据为异常数据。
如权利要求9所述的电子设备，其中，所述获取标准训练数据集，包括：

获取原始训练数据集；

将所述原始训练数据集中预设比例的数据设置为缺失数据；

通过预设的归一化公式对所述包括缺失数据的原始训练数据集进行归一化处理，得到归一化数据集；

将所述归一化数据集输入至预设的滑动窗口，得到所述标准训练数据集。
如权利要求9所述的电子设备，其中，所述利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数，包括：

基于所述缺失数据计算优化数值；

将所述优化数值添加至所述变分下限函数，得到所述优化变分下限函数。
如权利要求9至11中任一项所述的电子设备，其中，所述优化变分下限函数为：

其中，所述W为所述标准训练数据集中的数据个数，x _w为所述标准训练数据集中第w个数据，所述a _w为第w个数据的缺失系数，当x _w为缺失数据时，a _w＝1，当x _w不为缺失数据时，a _w＝0，β为优化数值，且存在
所述z表示标准训练数据集中隐变量z；

其中，
表示对x对应的隐变量z的分布计算期望，logp _θ(x|z)表示对p(x|z；θ)取对数，p _θ(x|z)意味着将隐变量z恢复成x,对应着解码器，p _θ(z)表示标准训练数据集下隐变量z的分布，logp _θ(z)表示对所述p _θ(z)取对数，logq _φ(z|x)表示对所述q _φ(z|x)取对数，q _φ(z|x)意味着在样本x下隐变量z的分布，对应于编码器部分。
如权利要求9所述的电子设备，其中，所述利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型，包括：

步骤A：将所述标准训练数据集输入至所述异常检测模型框架进行计算，得到输出结果；

步骤B：根据所述输出结果计算所述优化变分下限函数的损失值；

步骤C：若所述损失值大于预设的损失阈值时，调整所述异常检测模型框架中的参数，返回步骤A，直到所述损失值小于等于所述损失阈值时，停止调整所述异常检测模型框架中的参数，得到所述异常检测模型。
如权利要求13所述的电子设备，其中，所述将所述标准训练数据集输入至所述异常检测模型框架进行计算，得到输出结果，包括：

利用所述异常检测模型框架中的编码器计算所述标准训练数据集中数据的隐变量分布参数；

对所述隐变量分布参数进行取样得到隐变量；

利用异常检测模型框架中的解码器及所述隐变量计算得到所述输出结果。
如权利要求9所述的电子设备，其中，所述利用所述异常检测模型对所述待检测数据集进行检测之前，所述指令被所述至少一个处理器执行时还实现如下步骤：

判断所述待检测数据集中是否存在缺失值；

若所述待检测数据集中存在缺失值，通过蒙特卡洛插补法填充所述待检测数据集中存在的缺失值。
一种计算机可读存储介质，存储有计算机程序，其中，所述计算机程序被处理器执行时实现如下步骤：

获取标准训练数据集，所述标准训练数据集包含异常检测数据和缺失数据；

获取预构建的异常检测模型框架，所述异常检测模型框架包括变分下限函数；

利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数；

利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型；

获取待检测数据集，利用所述异常检测模型对所述待检测数据集进行检测，得到所述待检测数据集中待检测数据的重构概率；

若存在重构概率大于等于重构阈值的目标待检测数据，则确定所述目标待检测数据为异常数据。
如权利要求16所述的计算机可读存储介质，其中，所述获取标准训练数据集，包括：

获取原始训练数据集；

将所述原始训练数据集中预设比例的数据设置为缺失数据；

通过预设的归一化公式对所述包括缺失数据的原始训练数据集进行归一化处理，得到归一化数据集；

将所述归一化数据集输入至预设的滑动窗口，得到所述标准训练数据集。
如权利要求16所述的计算机可读存储介质，其中，所述利用所述缺失数据对所述变分下限函数进行调整，得到优化变分下限函数，包括：

基于所述缺失数据计算优化数值；

将所述优化数值添加至所述变分下限函数，得到所述优化变分下限函数。
如权利要求16至18中任一项所述的计算机可读存储介质，其中，所述优化变分下限函数为：

其中，所述W为所述标准训练数据集中的数据个数，x _w为所述标准训练数据集中第w个数据，所述a _w为第w个数据的缺失系数，当x _w为缺失数据时，a _w＝1，当x _w不为缺失数据时，a _w＝0，β为优化数值，且存在
所述z表示标准训练数据集中隐变量z；

其中，
表示对x对应的隐变量z的分布计算期望，logp _θ(x|z)表示对p(x|z；θ)取对数，p _θ(x|z)意味着将隐变量z恢复成x,对应着解码器，p _θ(z)表示标准训练数据集下隐变量z的分布，logp _θ(z)表示对所述p _θ(z)取对数，logq _φ(z|x)表示对所述q _φ(z|x)取对数，q _φ(z|x)意味着在样本x下隐变量z的分布，对应于编码器部分。
如权利要求16所述的计算机可读存储介质，其中，所述利用所述标准训练数据集对包含所述优化变分下限函数的所述异常检测模型框架进行训练，得到异常检测模型，包括：

步骤A：将所述标准训练数据集输入至所述异常检测模型框架进行计算，得到输出结果；

步骤B：根据所述输出结果计算所述优化变分下限函数的损失值；

步骤C：若所述损失值大于预设的损失阈值时，调整所述异常检测模型框架中的参数，返回步骤A，直到所述损失值小于等于所述损失阈值时，停止调整所述异常检测模型框架中的参数，得到所述异常检测模型。