CN116662811B

CN116662811B - 一种工业设备的时序状态数据重构方法及相关装置

Info

Publication number: CN116662811B
Application number: CN202310700161.0A
Authority: CN
Inventors: 章军辉; 付宗杰; 顾煜帆; 董接莲; 陈明亮; 庄宝森; 陈大鹏
Original assignee: Wuxi Internet Of Things Innovation Center Co ltd
Current assignee: Wuxi Internet Of Things Innovation Center Co ltd
Priority date: 2023-06-13
Filing date: 2023-06-13
Publication date: 2024-02-06
Anticipated expiration: 2043-06-13
Also published as: CN116662811A

Abstract

本申请公开了一种工业设备的时序状态数据重构方法及相关装置，涉及工业设备异常检测技术领域，包括：构建Transformer模型；Transformer模型的编码器包括多层编码器单元，Transformer模型的解码器包括多层解码器单元；训练Transformer模型；提取工业设备的存疑数据，并根据存疑数据构建多元时间序列；对多元时间序列进行预处理，得到重构对象；通过训练好的Transformer模型处理重构对象，得到重构结果。该方法能够快速可靠的进行数据重构，有利于进一步基于重构数据进行工业设备异常检测，提升工业设备异常检测的效率。

Description

一种工业设备的时序状态数据重构方法及相关装置

技术领域

本申请涉及工业设备异常检测技术领域，特别涉及一种工业设备的时序状态数据重构方法；还涉及一种工业设备的时序状态数据重构装置、设备以及计算机可读存储介质。

背景技术

为了及时发现工业设备的潜在异常，排查隐性故障，提高生产效率，降低运维成本，在工业设备异常检测时，可以首先进行数据重构，进而根据重构结果来判断工业设备是否异常。数据重构的速度无疑关乎设备整体的异常检测速度。同时，数据重构的可靠性直接影响设备整体的异常检测可靠性。因此，提供一种能够快速可靠的数据重构方案已成为本领域技术人员亟待解决的技术问题。

发明内容

本申请的目的是提供一种工业设备的时序状态数据重构方法，能够快速可靠的重构工业时序数据，有利于工业设备异常检测。本申请的另一个目的是提供一种工业设备的时序状态数据重构装置、设备以及计算机可读存储介质，均具有上述技术效果。

为解决上述技术问题，本申请提供了一种工业设备的时序状态数据重构方法，包括：

构建Transformer模型；所述Transformer模型的编码器包括多层编码器单元，所述Transformer模型的解码器包括多层解码器单元；

训练所述Transformer模型；

提取工业设备的存疑数据，并根据所述存疑数据构建多元时间序列；

对所述多元时间序列进行预处理，得到重构对象；

通过训练好的所述Transformer模型处理所述重构对象，得到重构结果。

可选的，所述训练所述Transformer模型包括：

采用元学习算法训练所述Transformer模型。

可选的，所述采用元学习算法训练所述Transformer模型包括：

随机初始化所述Transformer模型的权重参数；

载入训练序列并对所述训练序列进行滑窗处理，得到多个窗口矩阵；

处理所述窗口矩阵，更新各个所述权重参数。

可选的，所述更新各个所述权重参数包括：

根据更新所述权重参数；φ表示所述权重参数，α表示元学习的步长，/>表示梯度算子，/>表示代价函数，f_φ表示网络模型，T表示所述窗口矩阵的个数。

可选的，对所述多元时间序列进行预处理，得到重构对象包括：

对所述多元时间序列进行滑窗处理，得到多个窗口矩阵；

对所述窗口矩阵进行PE编码，得到所述重构对象。

可选的，所述通过训练好的所述Transformer模型处理所述重构对象，得到重构结果包括：

通过所述Transformer模型的所述编码器与所述解码器处理所述重构对象，并对所述解码器的中间输出进行全连接处理与归一化处理得到所述重构结果；其中，通过所述编码器与所述解码器处理所述重构对象包括：进行注意力计算。

可选的，所述进行注意力计算包括：

构建不同的哈希函数，并利用所述哈希函数对query与key进行编码，得到哈希值，根据所述哈希值对query与key进行分桶，得到最优分桶方案；

根据所述最优分桶方案确定候选集；

计算查询数据与所述候选集中各数据的相似度，并返回最近的多个近邻；

在桶内对所述query与所述近邻进行点积计算，得到近似注意力。

为解决上述技术问题，本申请还提供了一种工业设备的时序状态数据重构装置，包括：

构建模块，用于构建Transformer模型；所述Transformer模型的编码器包括多层编码器单元，所述Transformer模型的解码器包括多层解码器单元；

训练模块，用于训练所述Transformer模型；

提取模块，用于提取工业设备的存疑数据，并根据所述存疑数据构建多元时间序列；

预处理模块，用于对所述多元时间序列进行预处理，得到重构对象；

重构模块，用于通过训练好的所述Transformer模型处理所述重构对象，得到重构结果。

为解决上述技术问题，本申请还提供了一种工业设备的时序状态数据重构设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上所述的工业设备的时序状态数据重构方法的步骤。

为解决上述技术问题，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的工业设备的时序状态数据重构方法的步骤。

本申请所提供的工业设备的时序状态数据重构方法，包括：构建Transformer模型；所述Transformer模型的编码器包括多层编码器单元，所述Transformer模型的解码器包括多层解码器单元；训练所述Transformer模型；提取工业设备的存疑数据，并根据所述存疑数据构建多元时间序列；对所述多元时间序列进行预处理，得到重构对象；通过训练好的所述Transformer模型处理所述重构对象，得到重构结果。

可见，本申请所提供的工业设备的时序状态数据重构方法，提取的是存疑数据不包含正常数据，并对基于存疑数据构建的多元时间序列进行数据重构，如此在数据重构过程中可以减少大量的不必要的计算，从而加快数据重构速度。另外，本申请构建并训练多层的Transformer模型，利用训练好的多层的Transformer模型进行数据重构，能够提高数据重构的可靠性，有利于进一步基于重构数据进行工业设备异常检测，提升工业设备异常检测的效率。

本申请所提供的工业设备的时序状态数据重构装置、设备以及计算机可读存储介质均具有上述技术效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对现有技术和实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例所提供的一种工业设备的时序状态数据重构方法的流程示意图；

图2为本申请实施例所提供的一种工业设备的时序状态数据重构实现框图；

图3为本申请实施例所提供的一种工业设备的时序状态数据重构装置的示意图；

图4为本申请实施例所提供的一种工业设备的时序状态数据重构设备的示意图。

具体实施方式

本申请的核心是提供一种工业设备的时序状态数据重构方法，能够快速可靠的重构工业时序数据，有利于工业设备异常检测。本申请的另一个核心是提供一种工业设备的时序状态数据重构装置、设备以及计算机可读存储介质，均具有上述技术效果。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参考图1，图1为本申请实施例所提供的一种工业设备的时序状态数据重构方法的流程示意图，参考图1所示，该方法包括：

S101：构建Transformer模型；所述Transformer模型的编码器包括多层编码器单元，所述Transformer模型的解码器包括多层解码器单元；

Transformer模型包括编码器与解码器。编码器包括多层级联的编码器单元，每层编码器单元的结构相同，参数不共享。前一层编码器单元的输出作为当前编码器单元的输入。解码器包括多层级联的解码器单元，每层解码器单元的结构相同，参数不共享。前一层解码器单元的输出作为当前解码器单元的输入。

S102：训练所述Transformer模型；

本步骤旨在训练Transformer模型，以便以训练好的Transformer模型作为重构模型进行数据重构。

其中，训练Transformer模型是利用正常数据构建的多元时间序列来训练Transformer模型，使Transformer模型学习到正常数据之间长短时依赖性与多特征相关性，从而通过数据重构，找出与正常数据偏离较大而无法被有效重构的异常事件。

另外，工业时序数据有限，为了能够利用有限的工业时序数据训练Transformer模型，在一些实施例中，所述训练所述Transformer模型包括：

采用元学习算法训练所述Transformer模型。

面对数据缺乏的场景，深度学习神经网络的学习能力与对新任务的快速泛化能力有效。而元学习(Model Agnostic Meta Learning，MAML)是利用模型在已有相关任务上的学习经验(元知识)来指导新任务的学习，从而使得模型能够在小样本条件下适应新任务。为了训练出合适的模型参数，使得模型在小样本情况下能够快速收敛，本实施例采用元学习算法对Transformer模型进行多任务训练，主要步骤包括：

Step1：随机初始化网络(编码器、解码器)的权重参数；

Step2：载入一段新的训练序列，并进行滑窗处理，得到T个窗口矩阵；

Step3：执行第i个任务，计算网络中各个参数的梯度其中/>为梯度算子，f_φ代表网络模型，φ代表某个模型参数，φ_i′代表执行任务i时参数φ的梯度变化，/>代表执行任务i时的代价函数，γ为学习率；

Step4：按照step3完成T个任务；

Step5：一轮结束后，更新各个参数其中α为元学习的步长；

Step6：当迭代截止条件满足时，结束Step2～Step5，完成训练，反之继续。

S103：提取工业设备的存疑数据，并根据所述存疑数据构建多元时间序列；

为了减少不必要的冗余计算，提高效率，本实施例对采集到的工业时序数据(例如温度数据、电流数据、电压数据等等)中可能异常的数据(即存疑数据)进行标识与提取，并对存疑数据进行归一化处理。基于提取的存疑数据构建多元时间序列。多元时间序列可表示为：X＝{x₁,x₂,...,x_t,...,x_T}^T，其中，T为时间序列长度，表示输入状态向量，包含M个特征或变量。

S104：对所述多元时间序列进行预处理，得到重构对象；

在一些实施例中，对所述多元时间序列进行预处理，得到重构对象包括：

对所述多元时间序列进行滑窗处理，得到多个窗口矩阵；

对所述窗口矩阵进行PE编码，得到所述重构对象。

为了提升Transformer模型的鲁棒能力，本实施例对多元时间序列进行滑窗处理，得到T个窗口矩阵：

式中，W_t＝{x_t-K+1,x_t-K,...,x_t}^T，t∈[1,T]，其中，W_t为K×M维的窗口矩阵，K为滑窗窗口长度。特殊地，对于W_t来说，当t＜K时，用x_t来填充。

由于滑窗处理会耗费大量的存储开销，且窗口长度越短所耗内存越大。对于实时流处理场景来说，滑窗处理会一定程度上影响在线实时检测效果，甚至会越来越滞后。另外，设备异常状态具有一定的持续性，因此可以根据异常检测的检测结果动态调整滑窗窗口长度K，以便能够较好地兼顾异常检测的实时性与Transformer模型的鲁棒性。

由于Transformer模型没有类似RNN的循环结构，无法捕捉输入序列的位置信息，为此本实施例采用PE(Positional Embedding，位置编码)编码对输入序列进行位置编码，使得Transformer模型能够提取时序位置信息。PE编码格式为：

式中，pos为时序位置，pos∈[1,K]，i∈[0,M-1]，表示向下取整运算。经PE编码后，得到位置矩阵P＝{P_pos,i}_K×M即重构对象。

S105：通过训练好的所述Transformer模型处理所述重构对象，得到重构结果。

在一些实施例中，所述通过训练好的所述Transformer模型处理所述重构对象，得到重构结果包括：

具体而言，结合图2所示，编码器包括L层级联的编码器单元，编码器单元的处理过程如下：

式中，LayerNorm(·)表示残差连接与层归一化操作，LSHAttention(·)表示增强型局部敏感哈希注意力，FFN(·)表示前馈神经网络，为编码器单元的中间输出，I₁为K×M维的编码器单元的输入矩阵，也是前一层的编码器单元的中间输出。特殊地，对于第一层编码器单元来说，/>其中，/>表示两个矩阵相同位置的元素相加。残差连接与层归一化操作旨在解决梯度消失与权重矩阵退化的问题。

解码器包括L层级联的解码器单元，解码器单元的处理过程如下：

式中，Mask(·)表示掩膜机制，d为解码器单元的中间输出，I₂为K×M维的解码器单元的输入矩阵，也是前一层的解码器单元的中间输出。特殊地，对于第一层解码器单元来说，其中，O_t-1表示在第t-1个时间步解码器的重构输出矩阵。Mask掩膜的作用主要是屏蔽掉无效的padding区域。

经过解码器处理后解码器的输出，送入全连接层、Softmax层，得到重构矩阵：

O_t＝Softmax{Linear(d)}；

式中，Linear{·}表示全连接处理，经过Softmax{·}归一化处理后概率最高的会被输出，O_t＝{o_t-K+1,o_t-K,...,o_t}^T表示在第t个时间步解码器的重构输出，其中

在一些实施例中，进行注意力计算包括：

根据所述最优分桶方案确定候选集；

具体而言，传统注意力机制需要计算Q与K之间的所有相关性，所得到的注意力分配矩阵非常稀疏。在注意力计算过程中，由于经过点积计算QK^T后，会使得不相关的特征向量相乘后的值很小，再经过Softmax函数处理，结果近似为0，即当前时间步与这些数据之间的时间依赖性完全可以忽略掉。也就是说，对于每个query，仅需关注离它“比较近”的几个key即可。为此，本实施例提出了一种增强型局部敏感哈希注意力机制，使相关度较高的数据落入同一个桶中去，从而在进行最近邻搜索时，仅需在一个桶或临近桶内进行搜索，可以有效降低多头自注意力的计算开销，极大地提升了计算效率。主要步骤包括：

步骤1：确定每张哈希表内哈希函数的个数N_hash-func、每个哈希函数分桶的个数N_hash-bucket，以及哈希函数中的设计参数(d₁，d₂，p₁，p₂)。其中，哈希函数需要满足以下条件：1、若d(x₁,x₂)≤d₁，则h(x₁)＝h(x₂)的概率至少为p₁；2、若d(x₁,x₂)≥d₂，则h(x₁)＝h(x₂)的概率至多为p₂。

步骤2：构造多个不同的哈希函数，以实现多维度分桶操作，即构造N_hash-func个哈希函数，分别对某query与key进行编码，得到N_hash-func对哈希值。若其中超过一定比例的哈希值是相同的，则将该query与key分到同一个桶中去；

步骤3：重复步骤2，完成多轮分桶任务，筛选出最优分桶方案；

步骤4：对最优分桶方案进行排序，使得注意力权重集中在对角线上，再进行块分割，划分出不同的批量，并完成并行处理；

步骤5：将待查询数据经过N_hash-func个哈希函数得到各个相应的桶号，再根据“与”、“或”逻辑对桶进行合并操作，获得最终的候选集；

步骤6：采用距离方法计算查询数据与候选集合中各数据之间的相似度，并返回最近的个近邻；

步骤7：最后在桶内执行点积计算，获得近似注意力。

重构得到重构结果后，可以计算重构误差，即计算原始输入与重构输出之间的偏差，并可以根据重构误差以及预先定义的计算方式，计算得到异常分数。通常异常分数与重构误差呈正相关。或者还可以直接以重构误差作为异常分数。异常分数越大，表明工业设备异常的可能性越大。当异常分数超出异常阈值时，可以判定工业设备异常，由此快速可靠的检测出工业设备的潜在异常。

综上所述，本申请所提供的工业设备的时序状态数据重构方法，提取的是存疑数据不包含正常数据，并对基于存疑数据构建的多元时间序列进行数据重构，如此在数据重构过程中可以减少大量的不必要的计算，从而加快数据重构速度。另外，本申请构建并训练多层的Transformer模型，利用训练好的多层的Transformer模型进行数据重构，能够提高数据重构的可靠性，有利于进一步基于重构数据进行工业设备异常检测，提升工业设备异常检测的效率。

本申请还提供了一种工业设备的时序状态数据重构装置，下文描述的该装置可以与上文描述的方法相互对应参照。请参考图3，图3为本申请实施例所提供的一种工业设备的时序状态数据重构装置的示意图，结合图3所示，该装置包括：

构建模块10，用于构建Transformer模型；所述Transformer模型的编码器包括多层编码器单元，所述Transformer模型的解码器包括多层解码器单元；

训练模块20，用于训练所述Transformer模型；

提取模块30，用于提取工业设备的存疑数据，并根据所述存疑数据构建多元时间序列；

预处理模块40，用于对所述多元时间序列进行预处理，得到重构对象；

重构模块50，用于通过训练好的所述Transformer模型处理所述重构对象，得到重构结果。

在上述实施例的基础上，作为一种具体的实施方式，训练模块20具体用于：

采用元学习算法训练所述Transformer模型。

在上述实施例的基础上，作为一种具体的实施方式，训练模块20包括：

初始化单元，用于随机初始化所述Transformer模型的权重参数；

第一滑窗处理单元，用于载入训练序列并对所述训练序列进行滑窗处理，得到多个窗口矩阵；

更新单元，用于处理所述窗口矩阵，更新各个所述权重参数。

在上述实施例的基础上，作为一种具体的实施方式，更新单元具体用于：

在上述实施例的基础上，作为一种具体的实施方式，预处理模块40包括：

第二滑窗处理单元，用于对所述多元时间序列进行滑窗处理，得到多个窗口矩阵；

编码单元，用于对所述窗口矩阵进行PE编码，得到所述重构对象。

在上述实施例的基础上，作为一种具体的实施方式，重构模块50具体用于：

根据所述最优分桶方案确定候选集；

本申请还提供了一种工业设备的时序状态数据重构设备，参考图4所示，该设备包括存储器1和处理器2。

存储器1，用于存储计算机程序；

处理器2，用于执行计算机程序实现如下的步骤：

构建Transformer模型；所述Transformer模型的编码器包括多层编码器单元，所述Transformer模型的解码器包括多层解码器单元；训练所述Transformer模型；提取工业设备的存疑数据，并根据所述存疑数据构建多元时间序列；对所述多元时间序列进行预处理，得到重构对象；通过训练好的所述Transformer模型处理所述重构对象，得到重构结果。

对于本申请所提供的设备的介绍请参照上述方法实施例，本申请在此不做赘述。

本申请还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时可实现如下的步骤：

该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

对于本申请所提供的计算机可读存储介质的介绍请参照上述方法实施例，本申请在此不做赘述。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备以及计算机可读存储介质而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的工业设备的时序状态数据重构方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围。

Claims

1.一种工业设备的时序状态数据重构方法，其特征在于，包括：

训练所述Transformer模型；

对所述多元时间序列进行预处理，得到重构对象；

通过训练好的所述Transformer模型处理所述重构对象，得到重构结果；

所述通过训练好的所述Transformer模型处理所述重构对象，得到重构结果包括：

通过所述Transformer模型的所述编码器与所述解码器处理所述重构对象，并对所述解码器的中间输出进行全连接处理与归一化处理得到所述重构结果；其中，通过所述编码器与所述解码器处理所述重构对象包括：进行注意力计算；

所述进行注意力计算包括：

根据所述最优分桶方案确定候选集；

2.根据权利要求1所述的工业设备的时序状态数据重构方法，其特征在于，所述训练所述Transformer模型包括：

采用元学习算法训练所述Transformer模型。

3.根据权利要求2所述的工业设备的时序状态数据重构方法，其特征在于，所述采用元学习算法训练所述Transformer模型包括：

随机初始化所述Transformer模型的权重参数；

处理所述窗口矩阵，更新各个所述权重参数。

4.根据权利要求3所述的工业设备的时序状态数据重构方法，其特征在于，所述更新各个所述权重参数包括：

5.根据权利要求1所述的工业设备的时序状态数据重构方法，其特征在于，对所述多元时间序列进行预处理，得到重构对象包括：

对所述多元时间序列进行滑窗处理，得到多个窗口矩阵；

对所述窗口矩阵进行PE编码，得到所述重构对象。

6.一种工业设备的时序状态数据重构装置，其特征在于，包括：

训练模块，用于训练所述Transformer模型；

重构模块，用于通过训练好的所述Transformer模型处理所述重构对象，得到重构结果；

重构模块具体用于：

所述进行注意力计算包括：

根据所述最优分桶方案确定候选集；

7.一种工业设备的时序状态数据重构设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至5任一项所述的工业设备的时序状态数据重构方法的步骤。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的工业设备的时序状态数据重构方法的步骤。