CN114730390A

CN114730390A - 用于预测制造过程风险的系统和方法

Info

Publication number: CN114730390A
Application number: CN202080078255.3A
Authority: CN
Inventors: 莱拉·弗里德利; 亨里克·奥尔松; 西娜·科什菲特拉特帕卡扎德
Original assignee: Sirui Artificial Intelligence Co
Current assignee: Sirui Artificial Intelligence Co
Priority date: 2019-09-11
Filing date: 2020-09-10
Publication date: 2022-07-08
Also published as: WO2021050790A1; US20220260988A1; CA3154145A1; JP2022548227A; AU2020345874A1; KR20220062329A; EP4028963A4; EP4028963A1; MX2022002953A

Abstract

本公开提供了用于预测和检测系统的子系统中的异常的系统、方法和计算机程序产品。示例方法可以包括(a)确定指示出子系统的操作性能的第一多个标签。标签可以从下列各项获得：(i)子系统中的多个传感器和(ii)系统中不位于子系统中的多个传感器。方法还可以包括(b)使用根据第一多个标签的历史值接受训练的自编码器来处理第一多个标签的测量值，以生成第一多个标签的估计值；(c)确定测量值与估计值之间的差异是否满足阈值；以及(d)如果差异满足阈值，则传输指示出子系统预计会经历异常的警报。

Description

用于预测制造过程风险的系统和方法

交叉引用

本申请要求于2019年9月11日提交的美国临时专利申请号62/899,081的优先权，该申请通过引用而全文并入于此。

背景技术

制造者可以依靠定期和反应性维护的框架来管理其运营资产。这可能会导致延误生产带来的收入损失、关联于计划外维护行动的超额成本、资产寿命缩短、产品质量不佳，以及与现场暴露增加相关联的人员安全风险。

发明内容

本公开提供了用于预测和检测处理流水线的系统或子系统中的异常以提高处理流水线的可靠性的系统、方法和计算机程序产品。例如，处理流水线可以是包括钻井资产、精炼资产和管线资产(例如，泵、压缩机、热交换器和阀)的石油和天然气处理流水线。如本文所述的用于预测和检测异常的系统可以在一个或多个位置的一个或多个计算机上实现。计算机可以储存指令，这些指令在执行时致使计算机预测系统的子系统中的异常。

系统可以确定指示出子系统的操作性能的第一多个标签。第一多个标签可以包括来自子系统中的传感器的时间序列数据。第一多个标签可以附加地包括来自系统中不位于子系统中但仍然指示出子系统的操作性能的传感器的时间序列数据。例如，第一多个标签可以来自向子系统提供输入、从子系统接收输出或者以其他方式与子系统相关联的另一子系统。系统可以使用一种或多种机器学习方法来标识第一多个标签。例如，系统可以使用聚类算法从系统中的所有标签之中标识第一多个标签。确定第一多个标签可以被认为是特征选择操作。

系统可以使用自编码器处理第一多个标签的测量值。自编码器可以具有编码器，该编码器被配置用于根据测量值生成降维或压缩输出。自编码器可以附加地具有解码器，该解码器被配置用于根据降维或压缩输出生成第一多个标签的估计值。自编码器可以根据第一多个标签的历史值接受训练。

系统可以确定提供给自编码器的第一多个标签的测量值与自编码器生成的第一多个标签的估计值之间是否存在差异。如果测量值与估计值相同或相似，则系统可以确定子系统没有经历异常。另一方面，如果系统确定测量值与估计值之间的差异满足阈值，则系统可以确定子系统正在经历异常。系统可以传输指示出系统正在经历这样的异常的警报。

尽管许多制造实体依靠定期或反应性维护来管理运营资产，但上述系统可以通过使用来自数百到数千个传感器的数据以及标识该数据中的相关性来准确地预测故障并在处理流水线中的异常发生之前就检测到该异常。由于过程中的步骤可能是高度相互依赖的，因此由本文描述的系统标识的相关性可用于标识异常。此外，系统可以使用机器学习模型，所述机器学习模型可以根据新的故障事件接受重新训练，以随着时间的推移提高预测和检测准确度。最后，系统可以在资产、系统或子系统级别预测故障和检测异常，从而可以使用户能够对处理流水线快速执行预测性维护，以保持安全、延长资产寿命、生产更高质量的产品以及避免代价高昂的停机时间。

本公开可以附加地提供使用户(例如，运营经理或工程师)能够交互和查看上述系统的输出的应用和用户界面。应用和用户界面可以附加地使用户能够监控、控制处理流水线中的资产，以及对其执行预测性维护。

这些应用和用户界面可以提供端到端解决方案，用于对处理流水线中预测或检测到的异常进行优先排序、调查和响应。

在一方面，本公开提供了一种用于预测系统的子系统中的异常的方法。该方法可以包括确定指示出子系统的操作性能的第一多个标签。第一多个标签中的每个标签可以包括数据序列，并且第一多个标签可以从下列各项获得：(i)子系统中的多个传感器和(ii)系统中不位于子系统中的多个传感器。该方法还可以包括通过(1)生成第一多个标签的测量值的压缩表示以及(2)将测量值的压缩表示解码成第一多个标签的估计值，使用自编码器处理所述测量值，其中自编码器已根据第一多个标签的历史值训练过。该方法还可以包括确定测量值与估计值之间的差异是否满足阈值，以及如果差异满足阈值，则传输指示出子系统预计会经历异常的警报。

在一些实现中，(a)包括使用无监督学习算法处理来自系统中的传感器的数据以生成多个标签组，所述多个标签组包括指示出子系统的操作性能的第一多个标签。在一些实现中，第一多个标签中的每个标签与第一多个标签中的至少一个其他标签或与子系统的操作性能相关联。在一些实现中，无监督学习算法是聚类算法。聚类算法可以是K均值聚类算法、余弦相似度算法、拓扑数据分析算法或基于层次密度的带噪声应用空间聚类(hierarchical density-based spatial clustering of applications with noise，HDB-SCAN)。

在一些实现中，(a)离线执行。

在一些实现中，方法还包括，在(c)之前，对测量值和估计值中的每一个施加权重。

在一些实现中，方法还包括在系统的操作期间动态地调整阈值。

在一些实现中，方法还包括确定相应标签的测量值与相应标签的估计值之间的差异是否满足标签阈值，以及如果差异满足标签阈值则传输警报。

在一些实现中，自编码器是深度神经网络或1类支持向量机(support vectormachine，SVM)。

在一些实现中，历史数据包括在子系统中未发生故障的时间段内收集的数据序列。

在一些实现中，系统包括多个子系统。

在一些实现中，第一多个标签的测量值包括在预定回溯期期间收集的数据序列。在一些实现中，方法还包括动态地调整回溯期。

在一些实现中，方法还包括基于第一多个标签的测量值与第一多个标签的估计值之间的差异的大小为子系统生成风险评分。

在一些实现中，警报包括电子邮件或文本消息。在一些实现中，警报可以包括移动或web应用中的通知。在一些实现中，移动或web应用被配置用于使用户能够对子系统执行一个或多个纠正行动。

在一些实现中，方法还包括使用经过训练的机器学习算法来确定纠正子系统中的异常的行动。经过训练的机器学习算法可以已经根据历史人为行动和子系统的对应响应接受了训练。在一些实现中，方法还包括使用基于工程原理的基于规则的逻辑来确定纠正子系统中的异常的行动，以将标签测量中观察到的模式与子系统中的过程和设备的已知故障机制相关联。

在一些实现中，警报包括数值风险评分，所述数值风险评分指示出发生异常的可能性。数值风险评分可以至少部分地基于第一多个标签的测量值与第一多个标签的估计值之间的差异的大小。在一些实现中，警报包括数值风险评分，所述数值风险评分指示出发生异常的可能性。数值风险评分可以至少部分地基于差异超过阈值的程度。在一些实现中，警报包括第一多个标签中对警报贡献最大的标签的列表。

本公开的另一方面提供了一种包括机器可执行代码的非暂时性计算机可读介质，机器可执行代码在由一个或多个计算机处理器执行时实现上述或本文其他地方的任何方法。

本公开的另一方面提供了一种系统，该系统包括一个或多个计算机处理器和与其耦合的计算机存储器。计算机存储器包括机器可执行代码，其在由一个或多个计算机处理器执行时实现上述或本文其他地方的任何方法。

从以下详细描述中，本公开的其他方面和优点对于本领域技术人员将变得容易理解，其中仅示出和描述了本公开的说明性实施方式。如将意识到的，本公开能够有其他不同的实施方式，并且其若干细节能够在各种明显的方面进行修改，所有这些都不背离本公开。因此，附图和描述在本质上被认为是说明性的，而不是限制性的。

援引并入

本说明书中提到的所有出版物，专利和专利申请都以引用的方式并入本文，就如同每个单独的出版物，专利或专利申请被明确地并单独地指出通过引用并入一样。在通过引用并入的出版物和专利或专利申请与说明书中包含的公开内容相抵触的程度上，该说明书旨在取代和/或优先于任何此类矛盾的材料。

附图说明

在所附权利要求书中具体阐述了本发明的新颖特征。通过参考以下对其中利用到本发明原理的示例性实施方式加以阐述的详细描述和附图(也称为“示图”和“图”)，可以更好地理解本发明的特征和优点，在附图中：

图1示意性地图示了用于预测和检测异常的系统；

图2是用于预测子系统异常、生成异常警报、生成案例以跟踪异常调查以及下达工作订单以解决在调查期间标识的任何故障的示例过程的流程图；

图3是用于预测系统的子系统中的异常的示例过程的流程图；

图4至图18示出了可使用户能够调查警报以及生成和管理与此类警报相关联的案例和工作订单的应用的用户界面；

图19示意性地图示了可用于表示图4至图18中所描绘的应用中的处理流水线的模型；以及

图20示出了被编程或以其他方式配置用于实现本文提供的方法的计算机系统。

具体实施方式

虽然本文已经示出和描述了本发明的各个实施方式，但是对于本领域技术人员容易理解的是，这样的实施方式仅作为示例提供。在不脱离本发明的情况下，本领域技术人员可以想到许多变化、改变和替换。应当理解，可以采用对本文描述的本发明的实施方式的各种替代方案。

本文所使用的术语“资产”一般是指处理流水线中的单件设备(例如，阀)。

本文所使用的术语“系统”一般是指在制造过程中执行化学反应或物理操作的子系统的集合。系统之间的关系可以是线性的。

本文所使用的术语“子系统”一般是指资产的集合或较小子系统的集合，所述资产或子系统在过程中执行对材料进行的化学反应或物理操作。子系统之间的关系可以是线性的或分层的。

本文所使用的术语“平台”一般是指用于从海床之下勘探、开采和加工石油和天然气的大型海上结构。

本文所使用的术语“工厂”一般是指在其中进行工业制造过程的设施。

本文所使用的术语“标签”通常是指与对资产的测量(例如，压强、温度或流速)相关联的单个数据序列。

本文所使用的术语“聚类”一般是指与单个子系统相关联的一组相关的标签。

每当术语“至少”、“大于”或“大于或等于”在一系列两个或更多个数值中的第一个数值之前时，术语“至少”、“大于”或“大于或等于”适用于该系列数值中的每个数值。例如，大于或等于1、2或3等价于大于或等于1、大于或等于2，或者大于或等于3。

每当术语“不大于”、“小于”或“小于或等于”在一系列两个或更多个数值中的第一个数值之前时，术语“不大于”、“小于”或“小于或等于”适用于该系列数值中的每个数值。例如，小于或等于3、2或1等价于小于或等于3、小于或等于2，或者小于或等于1。

本公开提供了用于预测和检测处理流水线的系统或子系统中的异常以提高处理流水线的可靠性的系统、方法和计算机程序产品。如本文所述的示例系统可以确定指示出子系统的操作性能的第一多个标签。第一多个标签可以是来自子系统中的传感器和不在子系统中但仍然指示出子系统的操作性能的传感器的时间序列数据。例如，系统可以通过使用聚类算法来确定第一多个标签指示出子系统的操作性能。确定标签可以被认为是特征选择操作。

系统可以使用自编码器来处理第一多个标签的测量值。自编码器可以具有编码器和解码器，所述编码器被配置用于根据测量值生成降维或压缩输出，而所述解码器被配置用于生成第一多个标签的估计值。可以根据第一多个标签的历史值训练自编码器。

系统可以确定在提供给自编码器的第一多个标签的测量值与由自编码器生成的第一多个标签的估计值之间是否存在差异。如果测量值和估计值相同或相似，则系统可以确定子系统没有经历异常。另一方面，如果系统确定测量值与估计值之间的差异满足阈值，则系统可以确定子系统正在经历异常。该系统可以向一个或多个具有应用(例如，web应用、移动应用或专用软件程序)的计算设备传输指示出系统正在经历这样的异常的警报。该应用可以使用户(例如，工程师或运营经理)能够监控和调查警报，生成案例以跟踪警报上的行动项，以及生成工作订单以解决警报背后的故障。

图1示意性地图示了用于预测和检测异常的系统。该系统可以具有处理流水线100。处理流水线100可以位于制造设施中，例如，工厂中。备选地，处理流水线100可以分布在通过管道连接的不同位置处的资产之中。处理流水线100可被配置用于从一种或多种原材料生产一种或多种产品。处理流水线100可以实现成批处理、半成批处理或连续处理。成批处理可以是生产定量产品的过程。连续过程可以是在连续消耗原材料的同时生产不定量产品的过程。

处理流水线100可以是石油和天然气处理流水线。备选地，处理流水线100可以是化学或材料合成流水线(例如，用于合成油漆、肥料、纺织品、橡胶、钢或铝的流水线)、药物合成流水线，或者食品或饮料生产流水线。

处理流水线100可以具有系统111。系统111可以具有子系统112和子系统116。每个子系统可以具有资产，例如，单个组件或设备件(未示出)和传感器。石油和天然气处理流水线中的系统的示例是原油蒸馏装置。原油蒸馏装置可以包括焦化器、加氢裂化器、催化转化器、加氢处理器、重整器和脱硫器子系统，并且每个子系统可以具有资产。尽管处理流水线100被描绘为仅具有单个系统，但处理流水线100可以具有多个系统，每个系统具有多个子系统。

处理流水线100中的传感器可以是生成时间序列数据的传感器。传感器可以是温度计、压强计、流量计、加速度计、磁强计等。除了这样的时间序列数据之外，传感器可以生成元数据，例如，关于传感器在系统111或子系统112和166内的位置的数据。传感器能够以至少约0.1Hz、0.2Hz、0.3Hz、0.4Hz、0.5Hz、1Hz、5Hz、10Hz、100Hz、1000Hz、10000Hz、100000Hz或更高的速率收集数据。处理流水线100中的传感器可以将时间序列数据(在本公开中称为“标签”)传输到一个或多个实现异常预测和检测的计算设备。尽管处理流水线100被描绘为仅具有六个传感器，但其可以具有多达数万个传感器。

图1的系统可以具有训练子系统120。训练子系统120可被配置用于训练机器学习模型以预测和检测异常。

训练子系统120可以具有聚类模块122。聚类模块122可被配置用于训练和执行聚类算法以确定来自传感器113-115和117-119的指示出处理流水线100中的子系统的操作性能的标签组。每组标签可以与特定子系统的操作性能相关联。

聚类算法可以是层次聚类算法。层次聚类算法是这样的聚类算法：其基于对象与其他对象的接近程度进行对象的聚类。例如，层次聚类算法可以基于来自处理流水线100的标签的传感器与其他传感器以及与相关子系统的物理接近程度对该标签进行聚类。备选地，聚类算法可以是基于质心的聚类算法，例如，K均值聚类算法。K均值聚类算法可以将n个观测值划分为k个簇，其中每个观测值属于具有最接近均值的簇。该均值可以充当簇的原型。在来自处理流水线100的标签的上下文中，K均值聚类算法可以生成彼此相关的不同标签组。此后，每组标签可以基于关于特定子系统的先验知识(例如，关于子系统中的传感器的知识)而与该子系统相关联。备选地，聚类算法可以是基于分布的聚类算法，例如，高斯混合模型或期望最大化算法。聚类模块122可以实现的其他聚类算法的示例是余弦相似度算法、拓扑数据分析算法和基于层次密度的带噪声应用聚类(hierarchical density-basedclustering of applications with noise，HDB-SCAN)。

训练子系统120可以附加地具有自编码器训练模块124。自编码器训练模块124可以用于训练自编码器132。自编码器训练模块124可以根据指示出选定子系统的操作性能的标签历史值对自编码器132进行训练。历史标签可以是在子系统正常运行期间(例如，在子系统中没有发生故障的时间段内)收集的标签。根据正常标签训练自编码器132可以导致自编码器132具有表示“正常”特征的参数。虽然图1仅描绘了单个自编码器，但系统中的每个子系统可以具有其自己的自编码器，该自编码器可以根据指示出该特定子系统的操作性能的标签历史值来接受训练。

自编码器132可以具有编码器133，该编码器133对被确定为指示出处理流水线100中特定子系统的操作性能的第一多个标签的测量值进行编码。自编码器132还可以具有解码器134，该解码器134尝试重建测量值。给定代表训练数据的测量值，自编码器132可以生成与测量值相似或等效的估计值。然而，给定异常测量值，自编码器132可能产生不良的重建。

自编码器132可以是神经网络。一般来说，神经网络可以采用多层操作来从一个或多个输入预测一个或多个输出。神经网络可以包括位于输入层与输出层之间的一个或多个隐藏层。每层的输出可以用作另一层(例如，下一隐藏层或输出层)的输入。神经网络的每一层可以指定一个或多个要对该层的输入执行的变换操作。这样的变换操作可以称为神经元。特定神经元的输出可以是该神经元的输入的加权和，用偏差调整并乘以激活函数，例如，修正线性单元(rectified linear unit，ReLU)或sigmoid函数。训练神经网络可涉及向未经训练的神经网络提供输入以生成预测输出，将预测输出与期望输出进行比较，以及更新算法的权重和偏差以将预测输出与期望输出之间的差异纳入考虑。具体而言，可以使用代价函数来计算预测输出与期望输出之间的差异。通过计算代价函数相对于网络的权重和偏差的导数，可以在多次循环内迭代调整权重和偏差，以使代价函数最小化。当预测输出满足收敛条件时，例如，获得小计算代价量时，训练可以完成。

可以使用有监督或无监督学习过程来训练神经网络。在有监督学习中，对神经网络的训练输入进行标记。也就是说，训练输入具有已知的输出。相反，在无监督学习中，训练输入是未标记的。自编码器训练模块124可以实现无监督学习过程来训练自编码器132；自编码器132的输入不需要标记，原因在于自编码器132的期望输出仅仅是输入。

自编码器132可以是前馈神经网络，即，在神经元之间仅具有前向连接的神经网络。备选地，自编码器132可以是循环神经网络(recurrent neural network，“RNN”)。RNN可以具有循环连接，该循环连接可以编码时间序列数据中的依赖关系。RNN可以包括输入层，该输入层被配置用于接收一系列时间序列输入，例如，来自处理流水线100中的传感器的时间序列标签。RNN还可以包括一个或多个保持状态的隐藏循环层。在每个时间步，每个隐藏循环层可以计算该层的输出和下一状态。下一状态可取决于前一状态和当前输入。状态可以跨时间步保持，并且可以捕获输入系列中的依赖关系。这样的RNN可用于对处理流水线100的时间序列特征进行编码。

RNN的一个示例是长短期记忆网络(long short-term memory network，LSTM)，其可由LSTM单元构成。LSTM元可以由单元、输入门、输出门和遗忘门构成。单元可以负责保持跟踪输入系列中的元素之间的依赖关系。输入门可以控制新值流入单元的程度，遗忘门可以控制值保留在单元中的程度，并且输出门可以控制使用单元中的值来计算LSTM元的输出激活的程度。LSTM门的激活函数可以是逻辑函数。

推理子系统130可以在其接受训练之后实现自编码器132。如果提供给自编码器132的第一多个标签的测量值与由自编码器132生成的第一多个标签的估计值之间的差异超过阈值，则在与第一多个标签相关联的子系统中可能存在异常。在这样的情况下，系统可以向应用140传输警报，这将在下文更详细地描述。

推理子系统130可以实现其他类型的机器学习模型。例如，推理子系统130可以实施被配置用于下列各项的机器学习模型：(i)优化预测或检测异常的阈值；(ii)预测与异常相关联的故障模式；或(iii)确定纠正行动。机器学习模型可以使用有监督、半监督、无监督或强化学习过程进行训练。这样的机器学习模型的示例是回归算法、决策树、支持向量机、贝叶斯网络、神经网络(例如，前馈神经网络、CNN、RNN等)、聚类算法、强化学习算法等。

如上所述，图1的系统可以附加地包括应用140。应用140可以是移动应用或web应用。应用140可以在任何类型的计算设备上使用，例如，在台式或膝上型计算机、电子平板计算机、移动设备等上使用。用户(例如，工程师和运营经理)可以使用应用140来查看由推理子系统130生成的警报和预测故障模式，生成案例以跟踪对异常的调查，以及创建工作订单以解决警报背后的任何故障。将会参考随后的附图更详细地描述应用140。

图1的系统及其组件可以在一个或多个计算设备上实现。计算设备可以是服务器、台式或膝上型计算机、电子平板计算机、移动设备等。计算设备可以位于一个或多个位置。计算设备可以具有通用处理器、图形处理单元(GPU)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)等。计算设备可以附加地具有存储器，例如，动态或静态随机存取存储器、只读存储器、闪存、硬盘驱动器等。存储器可被配置用于储存指令，该指令在执行时致使计算设备实现训练子系统120、推理子系统130或应用140的功能。计算设备可以附加地具有网络通信设备。网络通信设备可以使计算设备能够通过网络相互通信以及与任何数目的用户设备(例如，运行应用140的用户设备)通信。例如，推理引擎130可以向运行应用140的用户设备传输警报、预测故障模式等。网络可以是有线或无线网络。例如，网络可以是光纤网络、以太网

网络、卫星网络、蜂窝网络、

网络、蓝牙

网络等。在其他实施方式中，计算设备可以是可通过互联网访问的若干分布式计算设备。这样的计算设备可以被认为是云计算设备。

图2是用于预测子系统异常、生成异常警报、生成案例以跟踪异常调查以及下达工作订单以解决在调查期间标识的任何故障的示例过程的流程图。该过程可以由一个或多个位置上的一个或多个计算机的系统以及一个或多个使用应用(例如，图1的应用140)的用户来执行。

首先，系统可以预测或检测子系统中的异常(210)。预测可以是定性预测、定量预测或两者。定性预测可以是在指定时间段内将会发生异常的预测。定量预测可以是数值风险评分，该数值风险评分指示出在指定时间段内将会发生异常的可能性。该预测可以附加地包括一种或多种与异常相关联的预测故障模式。将会参考图3更详细地描述操作210。

接下来，系统可以向任何数目的用户设备上的应用传输指示出子系统正在经历或将会经历异常的警报(220)。警报可以标识受影响的系统和子系统，并且包括定性或定量预测、预测故障模式，以及对预测或检测到的异常有贡献的标签。警报可以充当使用应用的用户进行进一步调查的基础。

最后，使用应用，用户可以分析警报以及创建和管理案例和工作订单以调查和解决异常(230)。

在一个示例中，用户可以将警报指派给经授权的审阅者。审阅者可以是工程师或运营经理。审阅者可以关于预测故障模式提供反馈。反馈可以是文本评论。备选地或附加地，审阅者可以拒绝或接受预测故障模式，或者从下拉菜单中选择一种或多种新的故障模式。如果用户不提供关于预测故障模式的反馈，则应用可以假定预测故障模式是正确的。当审阅者提供反馈时，系统可以自动创建案例，该案例随后跟踪针对警报采取的所有行动。

案例可以不同于警报。案例的目的可以是跟踪活动、跨用户协调以及实现协作。案例可以与警报具有一对一或一对多的关系。也就是说，在一些情况下，多个相关警报可以通过一个案例来解决。案例可以通过标记其他用户以及通过可供与案例相关联的所有用户编辑或查看的评论和上传的文件来实现协作。应用可以使用户能够对案例采取以下行动：(1)将案例和背后的警报指派给审阅者；(2)为案例添加评论；(3)标记另一用户；(4)提供关于预测故障模式的反馈；(5)创建相关联的工作订单；(5)了结或重新开立案例。

在提供关于预测故障模式的反馈之后，审阅者可以使用应用中的警报分析工具来调查警报，这将会参考随后的附图更详细地描述。简而言之，审阅者可以检查特定标签以标识警报的根本原因，例如，有缺陷的组件。审阅者可以记录关于其发现的评论，这可以成为案例历史的一部分。根据其调查的结果，审阅者可以创建工作订单。当工作订单完成时，应用可以自动了结警报和案例。

在操作230期间收集的数据可用于训练机器学习算法以预测针对检测到的异常的适当纠正行动。例如，特定的预测异常、引起预测异常的标签以及用户选择的相应故障模式可以充当用于训练有监督机器学习算法的标记数据。随着时间的推移，越来越多的训练数据被收集并整合到算法中，算法的性能可能会提高。

图3是用于预测系统的子系统中的异常的示例过程的流程图。图3的过程可以由一个或多个位置上的一个或多个计算机的系统执行。例如，图1的训练子系统120和推理子系统130可以执行图3的过程。

在第一操作中，系统可以确定指示出子系统的操作性能的第一多个标签(310)。第一多个标签中的标签可以是来自下列各项的时间序列数据：(i)子系统中的传感器和(ii)系统中不位于子系统中但仍然指示出子系统的操作性能的传感器。例如，标签可以来自向子系统提供输入、从子系统接收输出或以其他方式与子系统相关联的另一子系统。

系统可以使用一种或多种机器学习算法来确定指示出子系统的操作性能的标签。例如，系统可以使用聚类算法(例如，K均值聚类算法)处理系统中的所有标签，以生成不同的标签组，包括第一多个标签。每个不同组中的标签可以相互关联或与选择子系统的操作性能相关联。操作310可以被认为是特征选择操作。操作310可以离线执行，即，在处理流水线中实现系统之前。

在第二操作中，系统可以使用自编码器处理第一多个标签(即，被确定为指示出子系统的操作性能的标签)的测量值(320)。测量值可以限制在预定回溯期内。预定回溯期可以是至少约1秒、2秒、3秒、4秒、5秒、10秒、30秒、1分钟、5分钟、10分钟、30分钟、1小时、5小时、10小时、15小时、20小时、1天、5天、10天或更长时间。系统可以动态调整回溯期以优化异常预测的准确度。如果回溯期过长，则测量值可能包含无关数据。如果回溯期过短，则测量值可能缺少重要的上下文信息。系统可以使用本公开中描述的任何机器学习方法来优化回溯期。

自编码器可以具有编码器，该编码器被配置用于生成第一多个标签的测量值的降维或压缩输出。自编码器可以附加地具有解码器，该解码器被配置用于从降维或压缩输出生成第一多个标签的估计值。自编码器可以是深度神经网络，例如，前馈神经网络、卷积神经网络、循环神经网络等。可以根据第一多个标签的历史值来训练自编码器。在一些情况下，可以在子系统的正常操作期间，例如，在子系统没有经历异常的时间段期间收集历史值。根据正常的历史值训练自编码器可以使自编码器具有代表“正常”特征的参数。提供代表用于训练的历史值的测量值，自编码器可以生成与测量值相似或等效的估计值。然而，提供异常测量值，自编码器可能产生不良的估计。

在第三操作中，系统可以确定第一多个标签的测量值与第一多个标签的估计值之间的差异是否满足阈值(330)。如果系统确定差异不满足阈值，则可以表明子系统的操作性能是正常的，例如，子系统没有经历异常，子系统在正常参数内操作，或者子系统正在生产优质产品。另一方面，如果系统确定差异确实满足阈值，则可以表明子系统正在经历异常。

在一些情况下，系统可以在确定差异是否满足阈值之前对标签的测量值和估计值施加权重。系统可能由于一些标签与子系统的操作性能的相关性可能比其他标签更高而这样做。相比于与子系统的操作性能相关性较低的标签，系统可以对此类标签施加更大的权重。

系统可以在系统操作期间随着新数据变得可用和新异常发生而动态地调整阈值。例如，如果系统预测或检测到一个或多个被用户分类为误报的异常，则系统可以降低阈值。另一方面，如果系统未能预测或检测到异常，则系统可以提高阈值。系统可以使用本文描述的任何机器学习方法来优化阈值。

在第四操作中，如果差异满足阈值，则系统可以传输指示出系统正在经历异常的警报(340)。警报可以附加地包括数值风险评分。数值风险评分可以指示出预测异常的严重程度。数值风险评分可以至少部分地基于(i)第一多个标签的测量值与第一多个标签的估计值之间的差异幅度；或(ii)差异超过阈值的程度。警报可以附加地包括对警报有贡献的标签的列表、每个标签的贡献程度以及回溯窗口中的标签的值。警报可以附加地包括与该警报相关联的预测故障模式。例如，系统可以使用机器学习分类器或本文描述的任何其他机器学习方法来预测这样的故障模式。

警报可以是电子邮件或文本消息。备选地或附加地，警报可以是移动或web应用(例如，图1的应用140)中的通知。警报可以指定与警报相关联的定量风险评分、风险阈值、与警报相关联的系统和子系统，以及警报生成的日期和时间。如将会在随后的图中更详细描述的，应用可被配置用于使用户能够对警报进行调查。

在一些情况下，除了确定第一多个标签的测量值与第一多个标签的估计值之间的差异是否总体上满足阈值之外，系统还可以确定个别测量值与估计值之间的差异是否满足对应的标签的个别阈值，如果满足，则传输指示出此类情况的警报。这可以提醒用户注意可能尚未引起异常的不规则数据点。

用户界面

图4至图18示出了可以使用户能够调查警报以及生成和管理与此类警报相关联的案例和工作订单的应用的用户界面。

图4示出了应用的主屏幕。主屏幕可以显示与正在监控的处理流水线相关的关键性能指标(key performance indicator，“KPI”)。KPI可以包括选定时间段内开立的(例如，未解决)警报的总数、计划外子系统事件、相对于维护预算的维护支出，以及工厂正常运行时间。主屏幕可以在图表中作为时间的函数来显示开立的警报的总数、计划外子系统事件和工厂正常运行时间。

主屏幕可以附加地显示示出处理流水线中最高优先级警报的网格。网格中的每一行可对应于不同的警报。图1的推理子系统130可以通过执行图3的过程而生成警报以及将警报传输到应用。网格中的列可以示出每个警报的名称、来源子系统、定性风险评分(例如，低、中或高)、数值风险评分、生成日期和时间以及状态(例如，案例创建、案例开立等)。数值风险评分的范围可以从0至100，例如，100指示出异常的最高风险。数值风险评分可以用颜色编码，以指示出对应的异常的预测严重性。例如，最严重的异常可以具有红色风险评分，而不太严重的异常可以具有黄色风险评分。

主屏幕可以附加地显示堆叠条形图，该堆叠条形图示出处理流水线中引起最多警报的系统。每个条形中的警报可以用颜色编码，以显示每个定性风险类别(例如，低、中或高)中的条形的数目。堆叠条形图可被配置用于示出处理流水线中在最后一天、一周、一个月、三个月、六个月、一年或更长时间内引起最多警报的系统。

主屏幕可以附加地显示示出处理流水线中最高优先级案例的网格。网格中的每一行可对应于不同的案例。应用或用户可以响应于警报而生成案例。网格中的列可以示出每个案例的名称、来源子系统、优先级、状态(例如，审查中、已指派等)、受派者(例如，被指派解决案例的人)、创建日期，以及最后活动的日期。用户可以为案例分配优先级。备选地，应用可以基于多个因素自动为案例分配优先级。例如，应用可以考虑底层子系统对处理流水线的重要性、异常的严重性以及解决异常的估计费用和时间。

上述网格可以按字母顺序或数字顺序根据任何列排序。

主屏幕可以附加地具有导航栏，该导航栏可以允许用户导航到警报屏幕、案例屏幕、系统屏幕、分析屏幕和设置屏幕。

图5示出了警报屏幕。用户可以通过选择导航栏中的警报图标来打开警报屏幕。警报屏幕可以使用户能够搜索和过滤处理流水线中的警报。用户可以查看其自己的警报(例如，指派给用户的警报、用户协作的警报，或者其中提及用户的警报)或处理流水线中的所有警报。

警报屏幕可以具有概览窗口。概览窗口可以显示针对用户的或处理流水线中的警报总数。概览窗口可以附加地显示高、中和低风险警报的数目。

警报屏幕可以具有搜索栏。搜索栏可以使用户能够按关键字搜索警报。警报屏幕还可以具有过滤窗口。过滤窗口可以使用户能够过滤作为关键字搜索结果返回的警报。用户可以按状态(例如，开立、案例创建或了结)、触发日期、来源系统或子系统或者警报的定性风险类别来过滤警报。

警报屏幕可以显示满足搜索和过滤准则的警报的网格。网格中的每一行可对应于不同的警报。网格中的列可以示出每个警报的名称、来源子系统、定性风险评分(例如，低、中或高)、数值风险评分、生成日期和时间以及状态(例如，案例创建、开立等)。

图6示出了警报详情屏幕。警报详情屏幕可以显示有关特定警报的更详细信息。警报详情屏幕可以具有概览窗口，该概览窗口显示警报的名称、其来源子系统、其定性风险评分、其当前定量风险评分和随时间推移的定量风险评分、其被触发的日期以及其状态(例如，新的)。概览窗口可以附加地具有按钮，该按钮被配置用于在用户选择时生成案例或工作订单。

警报详情屏幕可以显示对警报有贡献的标签的网格。网格中的每一行可对应于不同的标签。网格中的列可以示出每个标签的名称(例如，温度、压强、振动等)、每个标签对警报的贡献程度以及当生成警报时每个标签的值。用户可以展开每个标签以展示出与标签相关联的数据质量警报和阈值警报。数据质量警报可以指示出来自与标签相关联的传感器的数据丢失或损坏。阈值警报可以指示出来自与标签相关联的传感器的数据值超过阈值。

警报详情屏幕可以附加地显示与警报相关联的最常见故障模式以帮助用户解决警报。

图7示出了案例屏幕。案例屏幕可以使用户能够搜索和过滤处理流水线中的案例。案例可以不同于警报，原因在于案例可以支持调查的协作和可追溯性，而警报可能只是通知的方法。此外，在一些情况下，警报与案例之间可能没有一一对应关系。例如，一个案例可以用于解决许多相关警报。

案例屏幕可以在形式上类似于警报屏幕。案例屏幕可以使用户能够搜索和过滤处理流水线中的案例。用户可以查看其自己的案例(例如，指派给用户的案例、用户开展协作的案例，或者其中提及用户的案例)或处理流水线中的所有案例。

案例屏幕可以具有搜索栏。搜索栏可以使用户能够按关键字搜索案例。案例屏幕还可以具有过滤窗口。过滤窗口可以使用户能够过滤作为关键字搜索结果返回的案例。用户可以按状态(例如，未指派、已指派、审查、了结)、创建日期、来源系统或子系统或者受派者来过滤案例。

案例屏幕可以显示满足搜索和过滤准则的案例的网格。网格中的每一行可对应于不同的案例。网格中的列可以示出每个案例的名称、来源子系统、状态、受派者以及对案例进行的最后一次活动的日期和内容(例如，指派了案例、添加了评论、上传了附件、更改了优先级等)。

图8示出了案例详情屏幕。案例详情屏幕可以为用户提供协作和调查工作空间以处理特定案例。

案例详情屏幕可以显示概览窗口。概览窗口可以示出案例的名称、与案例相关联的系统和子系统、对案例进行的最后一次活动的日期、案例的优先级(例如，当案例开立时由用户手动定义)、案例的状态(例如，警报开立、案例创建、工作订单创建、工作订单完成、案例了结)以及案例的协作者(例如，案例所有者以及案例提及到的或对案例做出评论的其他用户)。概览窗口还可以具有行动按钮，该行动按钮被配置用于使用户能够为案例创建工作订单、关闭案例或编辑案例的优先级。

案例详情屏幕可以附加地显示与案例相关联的行动的网格。网格中的每一行可对应于不同的行动。每行可以示出采取行动的协作者、行动概要、附件列表(例如，标记的示意图、与案例相关联的子系统的照片等)以及采取行动的时间。

案例详情屏幕可以附加地显示警报概要窗口。警报概要窗口可以示出对警报有贡献的前三个标签、可能因警报而面临风险的系统或子系统、警报的生成日期、警报的定量风险评分，以及通常与该类型的警报相关联的建议的故障模式的列表。建议的故障模式列表可被配置用于使用户能够接受或拒绝建议的故障模式，提供关于建议的故障模式的反馈，或者从下拉列表中添加新的故障模式。

图9示出了子系统详情屏幕的子系统分析选项卡。子系统详情屏幕可以为用户提供专注于处理流水线或设施内的单个子系统的功能。子系统详情屏幕可以显示子系统随时间推移的定量风险评分、历史警报、案例以及与系统相关联的工作订单。

子系统分析选项卡可以显示对子系统的定量风险评分有贡献的标签的网格。网格中的每一行可对应于不同的标签。网格中的列可以示出每个标签在选定时间段内对定量风险评分的最小、最大和平均贡献，以及标签的最新测量值。

子系统分析选项卡可以附加地显示图表，该图表示出前三个标签随时间推移对子系统的定量风险评分的贡献。与图表相邻的过滤窗口可以使用户能够选择图表中显示的标签。例如，用户可以指定要显示的标签以及显示它们的时间段。

图10示出了子系统详情屏幕的案例选项卡。尽管未描绘，但子系统详情屏幕可以附加地具有警报和工作订单选项卡。这些选项卡可以允许用户搜索、过滤和显示特定子系统的案例、警报和工作订单。这些选项卡可以类似于先前的屏幕，区别在于案例、警报和工作订单限于特定子系统。

图11示出了子系统详情屏幕的聚类选项卡。聚类选项卡可以显示已由系统例如通过执行参考图3描述的无监督聚类方法而标识为与子系统的定量风险评分相关的标签。

图12示出了子系统详情屏幕的子系统图选项卡。子系统图选项卡可以示出子系统的图。该图可以是静态的，例如，图像；或者其可以是动态的，例如，具有可遍历链接的交互式模型。

图13示出了应用的系统屏幕。系统屏幕可以为应用的用户提供处理流水线中所有系统的综合视图。系统屏幕可以包括在单独的行中显示每个系统的网格。网格中的列可以示出每个系统的定量风险评分、每个系统的活动警报数目、每个系统的开立案例数目，以及系统的位置。

系统屏幕中的概要窗口可以附加地示出具有警报的系统或子系统的数目。

图14示出了系统详情屏幕的子系统选项卡。子系统选项卡可以示出关于系统中的子系统的更详细信息，包括每个子系统的(i)定量风险评分、活动警报数目、开立案例数目以及针对子系统的最后一次活动(例如，警报创建、案例开立、警报了结、案例了结、工作订单创建等)。

图15示出了系统详情屏幕的子系统警报选项卡。子系统警报选项卡可以示出关于系统的各个子系统中的警报的更详细信息。

图16示出了系统详情屏幕的子系统案例选项卡。子系统案例选项卡可以示出关于与系统的各个子系统相关联的案例的更详细信息。

图17示出了系统详情屏幕的工作订单选项卡。工作订单选项卡可以示出关于与系统的各个子系统相关联的工作订单的更详细信息。

图18示出了应用的数据分析屏幕。数据分析屏幕可以为用户提供绘制应用实例范围内的任何度量或时间的功能，例如，标签、子系统定量风险评分、系统定量风险评分等。

图19示意性地图示了可用于表示应用中的处理流水线的模型。模型可以是各种材料、资产、过程、数据等的抽象表示。模型能够以分层方式布置。例如，多个过程步骤模型可以串联或并联布置以表示制造过程。作为另一示例，可以将资产模型组合在一起以表示子系统，并且可以将子系统模型组合在一起以表示系统。材料和数据模型可以分别表示过程步骤或制造过程模型的输入和输出。模型可以通过字段和函数定义。字段和函数的值可以指定模型所代表的特定材料、资产、过程和数据。

计算机系统

本公开提供了被编程用于实现本公开的方法的计算机系统。图20示出了计算机系统2001，该计算机系统2001被编程或以其他方式配置用于实现图1的系统。计算机系统2001可以是用户的电子设备或相对于电子设备位于远程的计算机系统。电子设备可以是移动电子设备。

计算机系统2001包括中央处理单元(CPU，在此也称为“处理器”和“计算机处理器”)2005，其可以是单核或多核处理器，也可以是多个处理器并行处理。计算机系统2001还包括存储器或存储器位置2010(例如，随机存取存储器、只读存储器、闪存)、电子存储单元2015(例如，硬盘)、用于与一个或多个其他系统通信的通信接口2020(例如，网络适配器)和外围设备2025，例如高速缓存、其他存储器、数据存储和/或电子显示适配器。存储器2010、存储单元2015、接口2020和外围设备2025通过诸如母板的通信总线(实线)与CPU 2005通信。存储单元2015可以是用于存储数据的数据存储单元(或数据仓库)。计算机系统2001可以在通信接口2020的帮助下可操作地耦合到计算机网络(“网络”)2030。网络2030可以是因特网、内联网和/或外联网、或正在与因特网通信的内部网和/或外部网。在一些情况下，网络2030是电信和/或数据网络。网络2030可以包括一个或多个计算机服务器，其可以实现分布式计算，例如云计算。在一些情况下，在计算机系统2001的帮助下，网络2030可以实现对等网络，其可以使耦合到计算机系统2001的设备能够充当客户端或服务器。

CPU 2005可以执行一系列机器可读指令，这些指令可以体现在程序或软件中。指令可以存储在存储器位置中，例如存储器2010。指令可以被引导到CPU 2005，CPU 2005可以随后编程或以其他方式配置CPU 2005以实现本公开的方法。CPU 2005执行的操作的示例可以包括获取、解码、执行和写回。

CPU 2005可以是电路的一部分，例如集成电路。系统2001的一个或多个其他组件可以包括在电路中。在一些情况下，该电路是专用集成电路(ASIC)。

存储单元2015可以存储文件，例如驱动程序、库和保存的程序。存储单元2015可以存储用户数据，例如用户偏好和用户程序。在一些情况下，计算机系统2001可以包括一个或多个位于计算机系统2001外部的附加数据存储单元，例如位于通过内联网或因特网与计算机系统2001通信的远程服务器上。

计算机系统2001可以通过网络2030与一个或多个远程计算机系统进行通信。例如，计算机系统2001可以与用户的远程计算机系统(例如，运行图1的应用140的用户设备)进行通信。远程计算机系统的示例包括个人计算机(例如便携式PC)、平板计算机或平板PC(例如

iPad、

Galaxy Tab)、电话、智能电话(例如

iPhone、支持Android的设备、

)或个人数字助理。用户可以通过网络2030访问计算机系统2001。

如本文所述的方法可以通过存储在计算机系统2001的电子存储位置上的机器(例如，计算机处理器)可执行代码来实现，例如存储在存储器2010或电子存储单元2015上。机器可执行或机器可读代码可以以软件的形式提供。在使用过程中，该代码可由处理器2005执行。在一些情况下，该代码可从存储单元2015中检索并存储在存储器2010中以供处理器2005随时访问。在一些情况下，可以排除电子存储单元2015，并且机器可执行指令被存储在存储器2010上。

代码可以被预编译和配置以与具有适于执行代码的处理器的机器一起使用，或者可以在运行时期间编译。代码可以以编程语言提供，可以选择该语言以使代码能够以预编译或编译后的方式执行。

在此提供的系统和方法的方面，例如计算机系统2001，可以体现在编程中。该技术的各个方面可以被认为是“产品”或“制品”，其通常以机器(或处理器)可执行代码和/或相关数据的形式存在于或包含在一种机器可读介质中。机器可执行代码可以存储在电子存储单元上，例如存储器(例如，只读存储器、随机存取存储器、闪存)或硬盘。“存储”类型的介质可以包括计算机、处理器等或其相关模块的任何或所有有形存储器，例如各种半导体存储器、磁带驱动器、磁盘驱动器等，其可以随时提供非暂时性存储进行软件编程。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。例如，这样的通信可以使软件能够从一个计算机或处理器加载到另一个计算机或处理器中，例如从管理服务器或主机计算机加载到应用服务器的计算机平台中。因此，可以承载软件元素的另一种类型的媒体包括光波、电波和电磁波，例如跨本地设备之间的物理接口、通过有线和光学陆线网络以及通过各种空中链路使用。承载这种波的物理元件，例如有线或无线链路、光链路等，也可以被认为是承载软件的介质。如本文所用，除非限于非暂时性、有形“存储”介质，诸如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。

因此，机器可读介质，例如计算机可执行代码，可以采用多种形式，包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘，诸如任何计算机等中的任何存储设备，诸如可用于实现图中所示的数据库等。易失性存储介质包括动态存储器，例如此类计算机平台的主存储器。有形传输介质包括同轴电缆；铜线和光纤，包括构成计算机系统内总线的电线。载波传输介质可以采用电信号或电磁信号，或者声波或光波的形式，例如在射频(RF)和红外(IR)数据通信期间产生的那些。因此，常见形式的计算机可读介质包括例如：软盘、软盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、打孔卡纸磁带、任何其他带有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒式磁带、传输数据或指令的载波、传输此类载体的电缆或链路，或任何其他计算机可以从中读取编程代码和/或数据的介质。许多这些形式的计算机可读介质可能涉及将一个或多个指令的一个或多个序列传送到处理器以供执行。

计算机系统2001可以包括电子显示器2035或与电子显示器2035通信，该电子显示器2035包括用户界面(UI)2040，用于提供例如参考图4至图18描述的应用。UI的示例包括但不限于图形用户界面(GUI)和基于网络的用户界面。

本公开的方法和系统可以通过一种或多种算法来实现。算法可以在由中央处理单元2005执行时通过软件来实现。该算法例如可以是实现用于预测系统的子系统中的异常的图3的过程的算法。

虽然已经在本文中示出和描述了本发明的优选实施方式，但是对于本领域技术人员而言容易理解的是，仅通过示例的方式提供了这样的实施方式。并非意图通过说明书中提供的特定示例来限制本发明。尽管已经参考前述说明书描述了本发明，但是本文中的实施方式的描述和图示并不意味着以限制性的意义来解释。在不脱离本发明的情况下，本领域技术人员现在将想到许多改变，更改和替代。此外，应理解，本发明的所有方面不限于本文所阐述的具体描述，构造或相对比例，其取决于各种条件和变量。应当理解，本文所述的本发明的实施方案的各种替代方案可以用于实施本发明。因此，可以预期的是，本发明也将涵盖任何这样的替代，修改，改变或等同形式。旨在由以下权利要求书限定本发明的范围，并且由此涵盖这些权利要求书范围内的方法和结构及其等同物。

Claims

1.一种用于预测系统的子系统中的异常的方法，包括：

(a)确定指示出所述子系统的操作性能的第一多个标签，其中所述第一多个标签中的每个标签包括数据序列，并且其中所述第一多个标签从下列各项获得：(i)所述子系统中的多个传感器和(ii)所述系统中不位于所述子系统中的多个传感器；

(b)通过(1)生成所述第一多个标签的测量值的压缩表示以及(2)将所述测量值的所述压缩表示解码成所述第一多个标签的估计值，使用自编码器处理所述测量值，其中所述自编码器已根据所述第一多个标签的历史值训练过；

(c)确定所述测量值与所述估计值之间的差异是否满足阈值；以及

(d)如果所述差异满足所述阈值，则传输指示出所述子系统预计会经历异常的警报。

2.根据权利要求1所述的方法，其中(a)包括使用无监督学习算法处理来自所述系统中的传感器的数据以生成多个标签组，所述多个标签组包括指示出所述子系统的所述操作性能的所述第一多个标签。

3.根据权利要求2所述的方法，其中所述第一多个标签中的每个标签与所述第一多个标签中的至少一个其他标签或与所述子系统的所述操作性能相关联。

4.根据权利要求2所述的方法，其中所述无监督学习算法是聚类算法。

5.根据权利要求4所述的方法，其中所述聚类算法是K均值聚类算法、余弦相似度算法、拓扑数据分析算法或基于层次密度的带噪声应用空间聚类(HDB-SCAN)。

6.根据权利要求1所述的方法，其中(a)离线执行。

7.根据权利要求1所述的方法，还包括，在(c)之前，对所述测量值和所述估计值中的每一个施加权重。

8.根据权利要求1所述的方法，还包括在所述系统的操作期间动态地调整所述阈值。

9.根据权利要求1所述的方法，还包括确定相应标签的所述测量值与所述相应标签的所述估计值之间的差异是否满足标签阈值，以及如果所述差异满足所述标签阈值则传输警报。

10.根据权利要求1所述的方法，其中所述自编码器是深度神经网络或支持向量机(SVM)。

11.根据权利要求1所述的方法，其中所述历史数据包括在所述子系统中未发生故障的时间段内收集的数据序列。

12.根据权利要求1所述的方法，其中所述系统包括多个子系统。

13.根据权利要求1所述的方法，其中所述第一多个标签的所述测量值包括在预定回溯期期间收集的数据序列。

14.根据权利要求13所述的方法，还包括动态地调整所述回溯期。

15.根据权利要求1所述的方法，还包括基于所述第一多个标签的所述测量值与所述第一多个标签的所述估计值之间的所述差异的大小为所述子系统生成风险评分。

16.根据权利要求1所述的方法，其中所述警报包括电子邮件或文本消息。

17.根据权利要求1所述的方法，其中所述警报包括移动或web应用中的通知。

18.根据权利要求17所述的方法，其中所述移动或web应用被配置用于使用户能够对所述子系统执行一个或多个纠正行动。

19.根据权利要求1所述的方法，还包括使用经过训练的机器学习算法来确定纠正所述子系统中的所述异常的行动，其中所述经过训练的机器学习算法已经根据历史人为行动和所述子系统的对应响应接受了训练。

20.根据权利要求1所述的方法，还包括使用基于工程原理的基于规则的逻辑来确定纠正所述子系统中的所述异常的行动，以将标签测量中观察到的模式与所述子系统中的过程和设备的已知故障机制相关联。

21.根据权利要求1所述的方法，其中所述警报包括数值风险评分，所述数值风险评分指示出发生所述异常的可能性，其中所述数值风险评分至少部分地基于所述第一多个标签的所述测量值与所述第一多个标签的所述估计值之间的差异的大小。

22.根据权利要求1所述的方法，其中所述警报包括数值风险评分，所述数值风险评分指示出发生所述异常的可能性，其中所述数值风险评分至少部分地基于所述差异超过所述阈值的程度。

23.根据权利要求1所述的方法，其中所述警报包括所述第一多个标签中对所述警报贡献最大的标签的列表。

24.一种系统，包括一个或多个计算机以及一个或多个储存指令的存储设备，所述指令在由所述一个或多个计算机执行时可操作以致使所述一个或多个计算机执行操作，包括：

(a)确定指示出系统的子系统的操作性能的第一多个标签，其中所述第一多个标签中的每个标签包括数据序列，并且其中所述第一多个标签从下列各项获得：(i)所述子系统中的多个传感器和(ii)所述系统中不位于所述子系统中的多个传感器；

25.一种或多种非暂时性计算机存储介质，其储存指令，所述指令在由一个或多个计算机执行时可操作以致使所述一个或多个计算机执行操作，包括：