CN116034325A

CN116034325A - 检测异常数据点的系统、设备和方法

Info

Publication number: CN116034325A
Application number: CN202180056612.0A
Authority: CN
Inventors: 冯竞; 弗拉迪米尔·拉夫里克; 孟仰峤; 克里斯托弗·保利奇
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 2020-08-10
Filing date: 2021-07-29
Publication date: 2023-04-28
Also published as: WO2022033885A1; US20230267368A1; EP3955076A1; EP4150421A1

Abstract

公开了检测与工业环境(610)相关联的操作数据(U)中的至少一个异常数据点的系统、设备和方法。该方法包括将一个或多个异常检测模型(fi)迭代地应用于操作数据(U)的至少一个子集(S)，其中基于由被标记为正常的数据点组成的训练数据集(L)来训练异常检测模型(fi)；使用异常检测模型(fi)将该子集(S)中的子集‑数据点分类为正常数据点(N)和异常数据点(A)中的一者；至少利用正常数据点更新训练数据集；在阈值时间期满之后用更新的训练数据集重新训练异常检测模型(fi)，其中阈值时间基于对训练数据集的更新的次数；以及使用异常检测模型(f’i)检测操作数据(U)中的至少一个异常数据点。

Description

检测异常数据点的系统、设备和方法

技术领域

本发明涉及检测与工业环境相关联的操作数据中的异常数据点。

背景技术

异常检测通常需要被训练以检测工业资产的使用或操作方面的异常检测模型。例如，马达故障检测依赖于用故障特定特征训练的模型，该故障特定特征基于领域专家对来自马达变频器的测量操作数据的知识而生成。操作数据可以被测量为时间序列，其中来自特定传感器的数据来自例如以特定频率对马达变频器进行采样。在一些情况下，操作数据可以是分批存储和分析的时间序列数据。模型和阈值可能需要在每种操作条件的正常和故障情况下对马达数据进行训练。为了减少训练努力，可以使用人工智能技术。

现有的异常检测模型可能集中在检测将来具有大量可用于训练的正常数据(仅一个类别)的异常数据点。此外，现有的人工智能技术可以集中在将来对数据进行分类，而只有少数的多类训练数据可用。因此，人工智能技术可能需要具有大量预标记数据的训练数据集。然而，具有大量未标记的数据点和仅少数被标记为正常或异常的数据点的学习技术不能有效地检测异常或异常数据点。此外，对验证异常数据点检测的专家的依赖可能增加。

发明内容

因此，用于检测异常数据点的系统、设备和方法可以受益于改进。本发明的目的是有效地检测与工业环境相关联的操作数据中的异常数据点。尤其是，本发明的目的是能够检测大量未标记数据集中的异常数据点。

该目的通过检测与工业环境相关联的操作数据中的至少一个异常数据点的预测性维护系统、计算设备和方法来实现。

例如，检测与工业环境相关联的操作数据中的至少一个异常数据点的方法，其中该操作数据包括对应于工业资产在工业环境中的操作的历史数据和流数据，该方法包括将一个或多个异常检测模型应用于操作数据的至少一个子集，其中基于由标记为正常的数据点组成的训练数据集来训练异常检测模型；使用该异常检测模型将该子集中的子集-数据点分类为正常数据点和异常数据点中的一者；至少利用该正常数据点更新该训练数据集；在阈值时间期满之后用该更新的训练数据集来重新训练该异常检测模型，其中该阈值时间基于对该训练数据集的更新次数；以及使用该异常检测模型检测该工业环境中的该至少一个异常数据点。

在一个实施例中，检测与工业环境相关联的操作数据中的至少一个异常数据点的方法可以包括迭代地将一个或多个异常检测模型应用于该操作数据的至少一个子集，其中基于由标记为正常的数据点组成的训练数据集来训练该异常检测模型；使用该异常检测模型将该子集中的子集-数据点迭代地分类为正常数据点和异常数据点中的一者；至少利用被分类为正常的数据点迭代地更新训练数据集；迭代应用该异常模型、分类和数据集更新以用于该完整操作数据或直到达到阈值时间；在该阈值时间期满之后用该更新的训练数据集来重新训练该异常检测模型，其中该阈值时间基于对该训练数据集的更新次数；以及通过开始新的迭代，使用该异常检测模型来检测该工业环境中的至少一个异常数据点。因此，本发明包括异常检测模型的分类、更新和重新训练的迭代继续。

在另一个示例中，用于检测与工业环境相关联的操作数据中的至少一个异常数据点的计算设备，其中该操作数据包括对应于该工业环境中的工业资产的操作的历史数据和流数据，该设备包括处理单元；和可由该处理单元执行的异常模块，该异常模块包括计算机可读指令，当由该处理单元执行时，该异常模块被配置为执行在本文公开的方法中的一者中的步骤。

在又一个示例中，用于工业环境的预测性维护系统包括本文所公开的计算设备。

另一个示例包括计算机程序产品，该计算机程序产品包括计算机可读代码，当在处理器上执行该计算机可读代码时，该计算机可读代码执行本文的一种或多种方法的方法步骤中的任何一者。

本发明有利地结合了半监督学习和异常检测。因此，即使存在少量正常数据点和大量未知数据点，也可以检测异常数据点。此外，本发明提供了可以在在线学习流水线中执行的工作流。该工作流使得能够从未标记和标记的数据点连续学习并自动升级异常检测模型。因此，本发明具有为工业环境生成和维护鲁棒的异常检测模型和学习流水线的技术效果。

在更详细地描述所建议的惯例之前，应当理解，在本专利文件中提供了对某些词语和短语的各种定义，并且本领域的普通技术人员将理解，这些定义在许多(如果不是大多数)示例中适用于这些定义的词语和短语的先前以及未来使用。虽然一些术语可包括多种实施例，但所附权利要求书可明确地将这些术语限制于特定实施例。还应当理解，在建议的方法的上下文中解释的特征也可以通过适当地配置和调整系统而被建议的系统包括，反之亦然。

如本文所用，“工业环境”是指可半自动或全自动制造的设施。工业环境可以是自动化环境的一部分。例如，工业自动化环境、实验室自动化环境、建筑物自动化环境等。此外，根据本发明，自动化环境可以包括一个或多个工业自动化环境、实验室自动化环境、建筑物自动化环境的组合。

工业资产可以是包括物理设备和可用于配置和控制物理设备的数字模型的控制设备、传感器、致动器。例如，计算机数字控制(CNC)机器、工业生产设施中的自动化系统、马达、发电机等。工业资产也可以被称为信息物理系统，因为它包括信息物理设备。

本文使用的“操作数据”是与工业资产的操作和操作条件相关联的数据。可以从不同的源(例如，传感器、用户设备等)接收操作数据。传感器测量与资产相关联的操作参数。例如，传感器可以包括热成像设备、振动传感器、电流和电压传感器等。术语“操作参数”是指资产的一个或多个特性。因此，操作数据是与资产的操作相关联的操作参数的度量。例如，操作数据可以包括表示与工业资产(例如，工业环境中的马达或转子)相关联的振动、温度、电流、磁通量、速度、功率的数据点。

可以实时接收和分析操作数据。此类操作数据可以称为流数据。本文使用的“流数据”是指以时间序列接收的数据点。例如，流数据包括马达的振动传感器的时间序列传感器值。在另一个示例中，操作数据可作为批量被接收和存储。操作数据可以称为“历史数据”。例如，历史数据包括一个月内来自马达的振动传感器值。如在本文使用的，“异常检测模型”是指从用于工业资产和/或工业环境的基于物理学的模型和/或数据驱动的模型生成的一个或多个模型。例如，异常检测模型可以包括具有工业资产的本体数据的基于本体的模型、具有与基于条件的概率相关联的概率数据的预测模型。在一个实施例中，工业资产的本体数据用于基于本体模型中资产属性和它们之间相互依赖性来检测异常。在另一个实施例中，异常检测模型包括滑动窗口计算、傅立叶变换、应用低/高通滤波器、神经网络、决策树分析和在数字信号处理、机器学习和自动化工程领域中公知的其他技术。

基于该训练数据集来训练该异常检测模型。训练数据集最初包括标记为正常的数据点。因此，当异常检测模型被应用于操作数据的子集时，可以分类子集中的数据点。此外，子集中的数据点(子集-数据点)被分类为正常数据点或异常数据点。子集数据点的分类使得能够标记操作数据中未标记的数据点。该标记用于更新该训练数据集。例如，训练数据集仅用正常数据点更新。在另一个示例中，用异常数据点和正常数据点更新训练数据集。可以迭代地执行训练数据集的更新。当满足迭代阈值(即阈值时间)时，基于更新的训练数据集来重新训练异常检测模型。异常检测模型的重新训练加强了对子集-数据点执行的分类。因此，本发明有利地使异常检测模型的重新训练自动化，以检测操作数据中的至少一个异常数据点。

在一个实施例中，该方法可以包括从操作数据中去除该子集，并且使用重新训练的异常检测模型来检测不含该子集的剩余操作数据中至少一个异常数据点。该方法还可包括将异常检测模型应用于操作数据的新子集，并将新子集中的新数据点分类为正常数据点和异常数据点中的一者。另外，该方法可以包括更新训练数据集和重新训练经训练的异常检测模型，如上文所描述。

本发明有利地将操作数据分成子集，用于异常检测模型的有效和稳健的应用。因此，本发明可以在具有资源约束的计算设备上实现。例如，诸如边缘设备的工业计算设备可用于检测从工业环境中的工业资产接收的流数据中的异常数据点。在一个实施例中，阈值时间可以被选择针对实时生产设置中实现的计算效率，并且允许自动化工程师向异常检测模型提供输入。例如，自动化工程师可以提供关于子集中的数据点的数量或子集-数据点分类中的置信指数的输入。此外，将操作数据分成子集使得能够对异常数据点进行连续的无监督/半监督学习。因此，从一组小的已知正常数据点开始，本发明提供了一种对操作数据中的未知数据点进行分类和标记的方法。

该方法还可以包括在子集和新子集中填充包含异常数据点的异常数据集。可以在对新子集的子集中的数据点进行分类之后填充异常数据集。异常数据集的迭代填充使得能够连续学习和重新训练异常检测模型。该方法还可以包括用异常数据集更新训练数据集。因此，本发明有利地提供了一种不仅利用正常数据点(即一个类别)训练异常检测模型的方法。而且还提供正常和异常数据点(即多个类别)用于训练异常检测模型。随着越来越多的使用本发明，考虑到来自更新的训练数据集的增强学习，异常检测模型可以得到进一步的鲁棒性。

为了确保异常检测模型不需要相当大的重新训练，可以向训练数据集提供基于专家执行的动作的正常数据点。因此，该方法可以包括接收至少包括正常数据点的训练数据集，其中基于工程软件输入和类似工业环境的操作中的至少一者对正常数据点进行分类。工程软件输入可以通过在配置工业资产时监视自动化工程师的动作来提供。例如，自动化工程师可以为工业环境中的马达的振动传感器数据设置边界条件。落在边界条件内的数据点被自动分类为正常数据点。因此，本发明有利地无缝地结合专家输入而无需明确提示。另外，可能已经在工业资产的生命周期中更早地提供专家输入。在另一个示例中，类似工业环境可以包括具有类似操作条件的类似马达。将类似马达的操作数据中的正常数据点用作训练数据集。因此，本发明有利地使用现有的标记数据来训练异常检测模型。

在一个实施例中，类似工业环境可以是包括工业资产和工业环境的模拟模型的模拟工业环境。模拟的工业环境可以被配置为模拟工业资产的各种操作条件以生成至少包括正常数据点的训练数据集。

该方法可以包括基于包括正常数据点的训练数据集来训练异常检测模型。因此，本发明避免了异常检测模型的耗时的重新训练。此外，本发明设想了仅有限数量的正常数据点可用于检测操作数据中的异常数据点的情形。本文公开的方法步骤提供了一种检测异常数据点的机制，即使只有有限数量的正常数据点是已知的。

在一个实施例中，该方法可以包括基于工程软件输入和类似工业环境的操作中的至少一者来确定子集-数据点分类中的置信指数。该方法还可以包括：当不满足置信度阈值时，对子集-数据点进行重新分类；以及利用置信指数和重新分类的数据点来更新训练数据集。本发明提供了一种通过确定置信指数来验证子集-数据点或新数据点的分类的机制。例如，被分类为正常的数据点和由自动化工程师设置的边界条件内的数据点之间的差异可用于确定置信指数。因此，本发明不会使分类与训练数据集过度拟合。同时，置信度阈值用于确保分类基于训练数据集。此外，本发明限制了专家的人工干预。例如，可以为需要重新分类的数据点提供专家输入。

在一个实施例中，异常检测模型可被包含在异常检测流水线中。本文使用的“异常检测流水线”是指流水线内异常检测模型的迭代选择和实现。异常检测流水线因此被实现为训练、分类和重新训练的迭代工作流，其中用训练数据集来训练异常检测模型，其中基于正常数据点和异常数据点的分类来验证异常检测模型，并且其中基于更新的训练数据集来重新训练异常检测模型。本发明提出了连续检测工业资产的操作数据中的异常数据点的简化方法。此外，异常检测模型的选择确保选择最合适的模型来检测异常数据点。

该方法可以包括生成包含与工业环境相关联的异常检测模型的异常检测流水线，其中异常检测模型包括基于物理学的模型、数据驱动的模型及其组合。异常检测流水线可以通过根据偏差分数或异常分数或准确度分数选择异常检测模型来生成。该方法可以包括基于异常检测模型的属性确定异常检测模型的偏差分数。在一个实施例中，还基于训练数据集来确定偏差分数。该方法还可以包括基于偏差分数来选择异常检测流水线的至少一个异常检测模型。在一个实施例中，异常检测模型的输出被比较以选择一个模型或确定异常检测模型的组合是否导致鲁棒的集合。该异常检测流水线有利地包括一组鲁棒的异常检测模型和随后被更新和重新训练的训练数据集。

在本发明的实施例中，该方法可以包括使用异常检测流水线来检测操作数据中的一批异常数据点，其中检测该批异常数据点包括将异常检测流水线应用于该批的至少一个子集并对该批的所有子集进行迭代应用，其中基于由正常数据点组成的训练数据集来训练异常检测流水线；使用该异常检测流水线将该子集中的子集-数据点分类为正常数据点和异常数据点中的一者；至少用正常数据点扩大训练数据集；以及在该阈值时间期满之后用更新的训练数据集来重新训练异常检测流水线，其中阈值时间基于对训练数据集的更新次数。

本发明可用于有利地检测一批异常数据点。通过检测这一批，可以确定异常数据点的上下文。然后，可以将上下文更新到异常数据集，以使异常检测流水线中的模型的重新训练更加鲁棒。

本发明的系统、设备和方法具有减少工程工作和异常检测时间的技术效果。由于减少了标记操作数据的工作，因此实现了技术效果。除了减少标记工作之外，异常数据点的检测可以以较低的时间执行，以等待生产中检测到异常。使用具有正常数据点的训练数据集来检测子集中的异常数据点。因此，本发明适于在实时和新调试的工业环境中实现。

技术效果通过应用于可能是时间序列的操作数据的异常检测模型来实现。例如，异常检测模型可以是频率变换形成、时间序列统计，诸如均值、中值、标准偏差和窗口化。此外，用于重新训练异常检测模型的阈值时间确保了在实际生产设置中实现的计算效率，并允许自动化工程师给出输入。例如，自动化工程师可需要根据他们的经验区分正常工作状态和异常工作状态。对于工业环境中的多个工业资产，自动化工程师的有效性可能是有限的。而且，检测异常数据点可能是耗时的，并且需要大量的人力。在通用异常检测流水线的帮助下，分类模型的多数表决被自动执行。在半自动方法中，自动工程师可选地在分类的数据点的限定次数的迭代之后给出反馈，而分类仍可以在后台继续运行。此外，用正常数据点和异常数据点更新训练数据集和异常数据集避免了要求预分类数据集或特定类别的描述。此外，通过基于模型属性和偏差分数选择异常检测模型来生成异常检测流水线能够实现训练、验证和重新训练的流线型迭代工作流。

前文已经相当广泛地概述了本公开的技术特征，使得本领域技术人员可以更好地理解随后的详细描述。下文将描述形成权利要求的主题的本公开的附加特征和优点。本领域技术人员将理解，他们可以容易地使用所公开的概念和具体实施例作为修改或设计用于实现本公开的相同目的其他结构的基础。本领域技术人员还将认识到，此类等效构造并不会偏离本发明最广泛的公开范围。

附图说明

下面，使用附图中所示的实施例来描述本发明。

图1图示了根据本发明实施例的检测未标记操作数据中的异常数据点的方法的方法步骤；

图2图示了根据本发明实施例的检测时间序列操作数据中的异常数据点的方法的流程图；

图3图示了根据本发明实施例的迭代检测异常数据点的方法的流程图；

图4图示了根据本发明实施例的几种异常检测模型的多数表决；

图5图示了根据本发明实施例的检测与工业环境相关联的操作数据中的异常数据点的方法的方法步骤；以及

图6图示了根据本发明实施例的用于检测与工业环境相关联的操作数据中的异常数据点的预测性维护系统和计算设备。

具体实施方式

下文中，对用于实现本发明的实施例进行详细说明。参考附图描述各种实施例，其中相同的附图标记始终用于表示相同的元件。在以下描述中，出于解释的目的，阐述了许多具体细节以便提供对一个或多个实施例的透彻理解。显然，可以在没有这些具体细节的情况下实践此类实施例。

图1图示了根据本发明实施例的检测未标记操作数据U中的异常数据点的方法的方法步骤。操作数据U与工业环境相关联，并且可以基于工业环境中的工业资产的操作来生成。

方法在步骤102以第一次迭代i＝1开始，接收/确定参考正常数据集L。例如，参考正常数据集L可以作为类似工业环境中的类似工业资产的测量结果来接收。在另一个示例中，可以基于工业环境的模拟来生成参考正常数据集L。参考正常数据集L被用作异常检测模型的训练数据集。在下文中，训练数据集将被称为训练数据集L。

在步骤104，接收未标记的操作数据U。未标记的操作数据U可以按时间序列或作为可能不在连续时间序列中的批文件来接收。操作数据U是其中检测到异常数据点的数据集/数据流。

在步骤106，基于训练数据集L训练异常检测模型f_i。基于训练，异常检测模型被配置为将数据点分类为正常数据点。在步骤108，将异常检测模型f_i应用于训练数据集以验证分类为正常数据点。

在步骤110，从操作数据U中选择子集S。在步骤112，异常检测模型f_i被应用于子集S以生成被标记为正常数据点N或异常数据点A中的一者的分类数据点(标记_i)。在一个实施例中，分类的数据点标记_i以趋势1和0示出，其中1表示正常数据点，0表示异常数据点。

在步骤116，用在步骤112分类的正常数据点来扩大训练数据集。此外，在步骤118，生成具有在步骤112识别的异常数据点的异常数据集。在一个实施例中，步骤116和118可以统称为扩大训练数据集，并且由步骤114表示。除了扩大训练数据集之外，在步骤118，基于扩大的训练数据集来约束异常检测模型f_i。下一次迭代i+1的重新训练的异常检测模型被称为f_i+i。在一个实施例中，根据在迭代i和i+1中异常检测模型f_i和f_i+i的优化函数f_i’＝opt{f_i,f_i+1}的应用来生成受约束的异常检测模型f’_i。在步骤120，从操作数据U中去除子集S，并且用重新训练的异常检测模型f’_i重复步骤110-118。

图2图示了根据本发明实施例的检测时间序列操作数据U中的异常数据点的方法200的流程图。为了图2的目的，时间序列操作数据U和操作数据U可互换地使用。方法200被分成三个阶段210、220和230。在阶段210，执行监督学习。在阶段220，可以执行工业验证。在步骤230，执行无监督学习和强化学习。下面根据流程图描述阶段210-230。

在监督学习阶段210，异常检测模型被选择为异常检测流水线的一部分，并且其参数被初始化。例如，异常检测模型是孤立森林模型。在步骤212，通过模型类型＝1来指示孤立森林模型的选择。此外，在步骤212，计数器被初始化为cnt＝0。在步骤214，接收训练数据集L，并基于训练数据集L训练孤立森林模型。训练数据集L包括正常数据点N和异常数据点A。在步骤216，将正常数据点N合并到训练数据集L中。在一个实施例中，在步骤218将异常数据点A并入训练数据集中。

在验证阶段220，领域专家可以提供输入以验证正常数据点N和异常数据点A的分类。例如，在步骤222，自动化工程师可以提供地面真值以验证分类。在步骤224，异常检测流水线被迭代地应用于操作数据U。在步骤226，从操作数据U中选取子集S，并应用异常检测流水线。子集S根据时间顺序被选择。因此，时间序列操作数据U的最左边的块被选择。因此，最早的时间块是子集S并且被输入用于第一轮中的分类。

在无监督学习阶段230，异常检测流水线被应用于操作数据U的一系列子集。在预定的时间步骤中，用扩大的正常数据集来增强异常检测流水线。在步骤232，当异常检测流水线的应用完成分类时，从操作数据U中去除子集S。在步骤234，实时接收来自工业资产的时间序列操作数据。在步骤236，增加计数器cnt。在步骤238，检查计数器cnt以确认计数器cnt值是否小于阈值时间。另外，检查时序操作数据U是否不为空。如果任何检查是肯定的，则从操作数据U中选择新的子集，并且方法从步骤224继续。

阶段230也是增强阶段。通过扩大训练数据集L并重新训练异常检测流水线来执行增强。增强使得异常检测流水线变得鲁棒，并且通过重新训练扩展它的通用性。

方法200可按以下方式编码。

输入：数据：L作为训练数据集的参考正常数据集；数据：M待填充为异常数据集的空数据集；数据：U时间序列操作数据；阈值时间：t用以增强经训练的模型的约束；模型：f被选择作为异常检测流水线的一部分的模型。

输出：正常数据点和异常数据点的集合。其中每个集合包含：M检测到的异常，L扩大的正常数据集，以及f鲁棒的异常检测模型。

图3图示了根据本发明实施例的迭代检测异常数据点的方法300的流程图，其中t＝1。方法300图示了当接收到时间序列操作数据U时本发明的操作。方法300开始于步骤302，选择一类支持向量机(SVM)作为异常检测流水线的一部分。此外，在步骤302，初始化计数器cnt。

在步骤304，训练数据集L用于训练该一类SVM模型。在步骤306，异常检测流水线被应用于操作数据U，并将子集S中的数据点分类为正常数据点N和异常数据点A。在步骤308，领域专家可以验证分类。在步骤310，将正常数据点N合并到训练数据集中以生成扩大的训练数据L₁。在步骤312，将异常数据点A更新到异常数据集M。

在轮次320中重复上述步骤作为操作数据U的流。因此，在步骤322，操作数据U被流化，并且在步骤324选择新的子集。用扩大的训练数据集L₁来约束/增强异常检测流水线。步骤330和332是步骤310和312的重复。按上述进行其他轮次330。

可以重复方法300的步骤，直到操作数据U不再被流化或者工业资产操作被中断。例如，如果马达停止。当步骤完成时，结果将是扩大的训练数据集L₂和扩大的异常数据集M。此外，异常检测流水线将包括用于工业资产的鲁棒的模型。扩大的数据集L₂和M的附加使用可以包括对来自类似工业资产的操作数据进行聚类。

图4图示了当多个异常检测模型i＝l,...N在第i步可用时，用于在正常N和异常A数据集中标记未标记子集S的多数表决。仅当大多数模型指示未标记数据在时间区域440中异常时，才将数据标记为鲁棒的异常。在其他情况下，当三个异常检测模型中只有一者指示异常行为时，数据S在这些时间区域410-430被认为是正常的。如上文描述中所示，本发明的方法产生扩大的训练数据集L₂和扩大的异常数据集M。此外，异常检测流水线将包括用于工业资产的鲁棒模型。

在图4中，在曲线图上图示了由不同异常检测模型输出的异常数据点。410图示了由异常检测模型1检测到的异常数据点AD1。420图示了由异常检测模型2检测到的异常数据点AD2。430图示了由异常检测模型3检测到的异常数据点AD3。异常数据点AD1和AD2彼此重叠。然而，AD3不与AD1和AD2重叠。异常数据点AD1和AD2被识别为鲁棒的异常数据集，并且相应的异常检测模型1和2被识别为可以在异常检测流水线中的集合中使用的鲁棒模型。

图5图示了根据本发明实施例的检测与工业环境相关联的操作数据中的异常数据点的方法的步骤。

方法开始于步骤510，将一个或多个异常检测模型应用于操作数据的至少一个子集。基于训练数据集来训练异常检测模型。训练数据集最初包括标记为正常的数据点。因此，步骤510包括基于训练数据集训练异常检测模型。训练数据集可以提供有基于专家执行的动作的正常数据点。因此，步骤510可以包括接收至少包括正常数据点的训练数据集，其中基于工程软件输入和类似工业环境的操作中的至少一者对正常数据点进行分类。

当异常检测模型被应用于操作数据的子集时，子集中的数据点的分类是可能的。步骤520包括将子集-数据点分类为子集正常数据点或异常数据点。子集数据点的分类使得能够标记操作数据中未标记的数据点。

在一个实施例中，步骤520可以包括基于工程软件输入和类似工业环境的操作中的至少一者来确定子集-数据点分类中的置信指数。方法还可以包括：当不满足置信度阈值时，对子集数据点进行重新分类；以及利用置信指数和重新分类的数据点来更新训练数据集。本发明提供了一种通过确定置信指数来验证子集数据点或新数据点的分类的机制。例如，被分类为正常的数据点和由自动化工程师设置的边界条件内的数据点之间的差异可用于确定置信指数。此外，可以为需要重新分类的数据点提供专家输入。

标记为异常检测模型提供了新的训练数据。因此，步骤530包括至少用正常数据点更新训练数据集。步骤530还可以包括在子集和新子集中填充包含异常数据点的异常数据集。可以在对新子集的子集中的数据点进行分类之后填充异常数据集。可以迭代地执行训练数据集的更新。异常数据集的迭代填充使得能够连续学习和重新训练异常检测模型。

当满足迭代阈值(即阈值时间)时，基于更新的训练数据集重新训练异常检测模型。步骤540包括在阈值时间期满之后用更新的训练数据集重新训练异常检测模型。异常检测模型的重新训练加强了对子集数据点执行的分类。步骤550包括基于所约束的异常检测模型的应用来检测操作数据中的异常数据点。

图6图示了根据本发明实施例的预测维护系统600和用于检测与工业环境610相关联的操作数据中的异常数据点的计算设备620和620'。工业环境610包括多个工业资产612-618。工业资产可以包括马达612、转子614、传送带616和齿轮箱618。工业资产612至618可以配备有被配置为测量相应操作参数的传感器。

在一个实施例中，计算设备620位于工业环境610内。例如，计算设备620可以是边缘计算设备。边缘计算设备620可以是重量轻、成本低的设备，其从部署在工业环境610中的各种传感器收集数据，存储并缓冲所收集的数据(即，工业资产612-618的操作数据)，进行对所收集的数据的分析，并基于分析的结果执行动作(例如，发出控制命令)。在本发明中，由边缘计算设备620执行的分析是检测操作数据中的异常数据点。

在另一个实施例中，计算设备620'可以被托管在IOT平台650上。IOT平台650可包括云计算平台、雾/边缘计算平台或两者的组合。在一个实施例中，IOT平台650用作在其上实现计算设备620'的主机。IOT平台650包括通过通信网络分布和连接的分布式计算资源。

如本文所使用的，“云计算”是指包括可配置的计算物理和逻辑资源(例如，网络、服务器、存储器、应用、服务等)以及通过网络(例如，因特网)分发的数据的处理环境。云计算系统提供对可配置计算物理和逻辑资源的共享池的按需网络访问。网络例如是有线网络、无线网络、通信网络或由这些网络的任意组合形成的网络。

如本文所使用的，“雾计算”或边缘计算使得IOT平台能够更接近自动化环境来实现。雾/边缘计算将云计算扩展到属于自动化网络的设备的物理位置。它可以是被配置为执行IOT平台650的操作的多个边缘设备620的组合。

预测维护系统600包括计算设备620和620'、IOT平台650和数据库640。数据库640被配置为存储工业资产612-618的历史操作数据。历史操作数据是指从工业环境610中的传感器收集并存储在数据库640或计算设备620中的数据。此外，数据库640还可以包括与工业环境相关联的训练数据集。此外，数据库640可以被配置为存储与工业环境610和工业资产612-618相关联的模拟模型。

计算设备620和620'可以包括类似的硬件/软件模块以实现本发明。以下描述是关于边缘设备620的。边缘设备620包括处理单元622、被配置为接收用户输入并基于来自处理单元622的命令显示输出的显示器624，和通信地耦合到处理单元622的存储器630。尽管未在图6中示出，但是可以理解，边缘设备620还可以包括电源模块、通信接口等。处理单元622被配置为执行存储在存储器630中的模块。显示器624被配置为显示图形用户界面(GUI)626，以使自动化工程师/专家能够与边缘设备620交互。

存储器630包括异常模块635，其在被执行时使边缘设备620能够检测操作数据中的异常数据点。异常模块635包括训练模块632、标记模块634、更新模块636和重新训练模块638。

在操作中，边缘设备620经由通信接口从与工业资产612-618相关联的传感器接收操作数据。此外，边缘设备620提取存储在数据库640中的训练数据集。训练模块632被配置为训练从数据库640中的模拟模型生成的一个或多个异常检测模型。训练基于从数据库640提取的训练数据集。训练数据集包括基于类似工业环境的操作而被验证的正常数据点。

在一个实施例中，选择异常检测模型以形成异常检测流水线。异常检测流水线被实现为训练、分类和重新训练的隔离工作流。训练模块632可以被配置为基于为每个异常检测模型确定的偏差分数来生成包含异常检测模型的异常检测流水线。基于异常检测模型的属性来确定偏差分数，并且偏差分数指示每个异常检测模型的准确度。

标记模块634被配置为对操作数据的子集中的数据点进行分类。子集内的数据点被称为子集-数据点。使用异常检测模型将子集数据点分类为正常数据点或异常数据点。在一个实施例中，标记模块634还被配置为基于类似工业环境的模拟模型或操作来确定子集数据点分类中的置信指数。标记模块634可被配置为当不满足置信度阈值时分类子集数据点。例如，置信度阈值可以是自动化工程师可以使用GUI 626设置的预定值，以确保分类的质量不超出预定值。在另一个实施例中，自动化工程师可以重新分类不满足置信度阈值的数据点。

更新模块636被配置为利用子集中新分类的正常数据点来更新训练数据集。在一个实施例中，训练数据集也可以用置信指数和重新分类的数据点来更新。更新模块636被配置为填充包含子集中的异常数据点的异常数据集。在一个实施例中，训练数据集可以用异常数据集来更新。更新模块636被配置为基于对训练数据集执行的更新次数来确定阈值时间。

当阈值时间期满时，重新训练模块638被配置为用更新的训练数据集来重新训练异常检测模型。此外，重新训练模块638从操作数据中提取新的子集，并将重新训练的异常检测模型应用于操作数据的新子集。此后，标记模块634被配置为将新子集中的新数据点分类为正常数据点或异常数据点。基于分类，异常模块635被配置为迭代地检测操作数据中的异常数据点。在一个实施例中，异常模块635被配置为检测操作数据中的一批异常数据点。

本发明可以采取计算机程序产品的形式，计算机程序产品包括可从计算机可用或计算机可读介质访问的程序模块，计算机可用或计算机可读介质存储由一个或多个计算机、处理器或指令执行系统使用或与其结合使用的程序代码。为了本说明书的目的，计算机可用或计算机可读介质可以是能够包含、存储、通信、传播或传输由指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合使用的程序的任何装置。介质可以是电、磁、光、电磁、红外或半导体系统(或装置或设备)或传播介质，或者它们本身，因为信号载体并未被包括在物理计算机可读介质的定义中，物理计算机可读介质包括半导体或固态存储器、磁带、可移动计算机盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和诸如光盘只读存储器(CD-ROM)的光盘、光盘读/写以及DVD。用于实现本技术的每个方面的处理器和程序代码都可以是本领域技术人员已知的集中式或分布式(或它们的组合)。

Claims

1.一种检测与工业环境(610)相关联的操作数据(U)中的至少一个异常数据点的方法，其中所述操作数据(U)包括与所述工业环境(610)中的工业资产(612-618)的操作对应的历史数据和流数据，所述方法包括：

将一个或多个异常检测模型(fi)应用于所述操作数据(U)的至少一个子集(S)，其中基于由被标记为正常的数据点组成的训练数据集(L)来训练所述异常检测模型(fi)；

使用所述异常检测模型(fi)将所述子集(S)中的子集-数据点分类为正常数据点(N)和异常数据点(A)中的一者；

至少利用所述正常数据点来更新所述训练数据集；

在阈值时间期满之后用所更新的训练数据集重新训练所述异常检测模型(fi)，其中所述阈值时间基于对所述训练数据集的更新的次数；以及

使用所述异常检测模型(f’i)检测所述操作数据(U)中的所述至少一个异常数据点。

从所述操作数据(U)中移除所述子集；

使用重新训练的异常检测模型(fi)检测不含所述子集的剩余操作数据(U)中的所述至少一个异常数据点；

将所述重新训练的异常检测模型(fi)应用于所述操作数据(U)的新子集，并将所述新子集中的新数据点分类为所述正常数据点(N)和所述异常数据点(A)中的一者；以及

更新所述训练数据集并重新训练所述重新训练的异常检测模型(f’i)。

2.根据权利要求1中任一项所述的方法，还包括：在所述子集和所述新子集中填充包含所述异常数据点的异常数据集。

3.根据权利要求2所述的方法，还包括：用所述异常数据集更新所述训练数据集。

4.根据权利要求1所述的方法，还包括：接收至少包括所述正常数据点的所述训练数据集(L)，其中基于工程软件输入和类似工业环境的操作中的至少一者来分类所述正常数据点；以及基于包括所述正常数据点的所述训练数据集(L)来训练所述异常检测模型(fi)。

5.根据权利要求1所述的方法，还包括：基于工程软件输入和类似工业环境的操作中的至少一者来确定所述子集-数据点的分类中的置信指数；当不满足置信阈值时，对所述子集-数据点进行重新分类；以及用所述置信指数和所重新分类的数据点来更新所述训练数据集。

6.根据前述权利要求中任一项所述的方法，其中，所述一个或多个异常检测模型(fi)被包含在异常检测流水线(224，306，326)中，其中所述异常检测流水线(224，306，326)被实现为训练、分类和重新训练的迭代工作流，其中用所述训练数据集来训练所述异常检测模型(fi)，其中基于所述正常数据点和所述异常数据点的分类来验证所述异常检测模型(fi)，并且其中基于所更新的训练数据集来重新训练所述异常检测模型(fi)。

7.根据权利要求6所述的方法，还包括：生成包含与工业环境(610)相关联的异常检测模型(fi)的异常检测流水线(224，306，326)，其中所述异常检测模型(fi)包括基于物理的模型、数据驱动的模型及它们的组合；以及基于所述异常检测模型(fi)的属性来确定所述异常检测模型(fi)的偏差分数。

8.根据权利要求7所述的方法，其中，生成所述异常检测流水线(224，306，326)还包括：实现基于所述偏差分数为所述异常检测流水线(224，306，326)选择至少一个异常检测模型。

9.根据前述权利要求中任一项所述的方法，还包括：

使用所述异常检测流水线(224，306，326)检测所述操作数据(U)中的一批异常数据点，其中检测所述一批异常数据点包括：

将所述异常检测流水线(224，306，326)应用于所述一批的至少一个子集，其中基于由所述正常数据点组成的训练数据集来训练所述异常检测流水线(224，306，326)；

使用所述异常检测流水线(224，306，326)将子集中的所述子集-数据点分类为所述正常数据点和所述异常数据点中的一者；

至少用所述正常数据点扩大所述训练数据集；以及

在所述阈值时间期满之后用所更新的训练数据集来重新训练所述异常检测流水线(224，306，326)，其中所述阈值时间基于对所述训练数据集的更新的次数。

10.一种用于检测与工业环境(610)相关联的操作数据(U)中的至少一个异常数据点的计算设备(620，620')，其中所述操作数据(U)包括与所述工业环境(610)中的工业资产(612-618)的操作对应的历史数据和流数据，所述设备包括：

处理单元(622)；和

能够由所述处理单元执行的异常模块(635)，包括计算机可读指令，当由所述处理单元(622)执行所述计算机可读指令时，所述异常模块被配置为执行根据方法权利要求1-9中任一项中的步骤。

11.一种用于工业环境(610)的预测性维护系统(600)，所述系统包括根据权利要求10所述的计算设备。

12.一种计算机可读介质，其中存储有机器可读指令，所述指令在由处理器执行时使得所述处理器执行根据权利要求1-9中任一项的方法步骤。