CN115699037A

CN115699037A - 用非线性特性预测性能退化

Info

Publication number: CN115699037A
Application number: CN202180034879.XA
Authority: CN
Inventors: N·科尔德贾齐; M·O·萨柳
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2020-05-11
Filing date: 2021-05-05
Publication date: 2023-02-03
Also published as: US20210349772A1; IL296764A; KR20220154827A; DE112021002699T5; JP2023525959A; CA3175610A1; US11175973B1; WO2021229371A1; AU2021271205A1; AU2021271205B2; GB202218236D0; GB2610965A

Abstract

描述了用于预测具有非线性特性的逐渐性能退化的技术。该技术包括一种方法，该方法包括将新数据样本输入到故障预测模型，其中使用标记的历史数据集来训练该故障预测模型，其中相应的数据点与回顾窗口和预测时域相关联以创建相应的训练样本，其中相应的训练样本被聚类在多个集群中，并且其中多个集群各自与常态分数和异常分数相关联。该方法进一步包括基于将多个集群中的包括新数据样本的第一集群的第一异常分数与多个集群中的具有大于异常分数的常态分数的集群的平均异常分数进行比较，输出与新数据样本相关联的分类。

Description

用非线性特性预测性能退化

技术领域

本公开涉及预测建模，并且更具体地，涉及利用非线性特性对性能退化的预测。

背景技术

非线性性能退化可包括与一个或多个机械系统或元件的逐渐劣化相关的现象，其中逐渐劣化可能最终导致一个或多个机械系统或元件的故障或永久次优性能。与非线性性能退化相关的这种逐渐劣化可涉及任何类型的磨损(例如，通过基于组件与另一物质的相互作用而逐渐去除组件或使组件变形而弱化)、疲劳(例如，由周期性加载导致的弱化)、蠕变(例如，由持久机械应力导致的变形)和/或其他非线性现象。可由机械、化学、热或其它应力引起非线性性能退化。例如，磨损现象可包括磨蚀性磨损、侵蚀性磨损、腐蚀性磨损和其它类型的磨损。

然而，预测诸如磨损引起的劣化的非线性性能退化提出了许多挑战。其一，磨损是在延长的时间段上发展的逐渐故障。因此，正常和磨损状态之间的关系是非线性的，这使得线性模型(例如，自然贝叶斯、支持向量机(SVM)等)不适用。此外，在类似资产之间的磨损故障的进展是高度可变的(例如，一些资产在50天发生故障，而其他资产在6个月发生故障)，这取决于例如使用特性。作为一个示例，螺杆泵(progressing cavity pump，PCP)中的磨损相关性能劣化可取决于多种因素，例如，地表下地质地层类型、砂粒度和/或任何特定PCP的操作简档。因此，作为距故障的时间(time-to-failure)的函数的性能退化的水平可以在相同时间点基于各种操作因素在不同资产上变化。

预测非线性性能退化的另一个挑战涉及经历非线性性能退化(例如与磨损相关的性能劣化)的资产的正常和故障操作状态之间的不平衡。换句话说，训练数据集的大部分(例如，大于90％)包括正常性能，而非常少的数据表明错误性能。从不平衡的训练数据中进行准确预测是非常困难的。例如，在能够精细地调整和优化ANN中的大量参数的范围内，利用高度参数化的非线性方法(例如，人工神经网络(ANN))不是合理的解决方案，需要丰富的数据(具有两类的足够示例)。然而，在数据高度不平衡的情况下，异常状态中的示例的数量不足以有效地训练ANN。为了补救不平衡的数据的问题，可以采用过采样和/或欠采样方法，然而这些方法最终会使数据中的原始分布偏斜，从而使解决方案发生偏差(例如，由于假阳性指示增加而导致准确度降低)。

与准确预测非线性性能退化相关的另一挑战是，诸如与磨损相关的性能退化的非线性性能退化不一定是灾难性故障。再次回到PCP的示例，虽然磨损的PCP将由于转子叶片上的磨损而次优地工作，但其不一定停止工作。这使得“故障日期”对于操作者更换给定的性能退化水平的泵的决定是主观的(与灾难性的故障日期相对地)。这又使得数据标记是复杂的(例如，当实际上PCP继续以低于标准的性能工作时，确定何时将来自PCP的数据标记为失败)。

与现实应用中预测非线性性能退化相关联的又一挑战涉及正确地识别故障特征。这种挑战是双重的。首先，必须评估可用数据以识别故障特征。这可能涉及从不一定与非线性性能退化直接相关的数据推断信息。例如，很少资产倾向于被明确地装备以直接测量磨损的与磨损相关的性能劣化。再次回到PCP的示例，速度、生产率、扭矩和套管压力之间的相互作用可以是从中推断故障特征的唯一可用信息。其次，必须评估所识别的故障特征的排他性。换句话说，所识别的故障特征可以与两个或更多个现象相关，从而增加了假阳性。根据以上内容，可以看出，非线性性能退化提出了进一步的挑战：(i)从非线性性能退化的可用数据中识别故障特征，以及(ii)确定所识别的故障特征是否排他地(或主要地)代表非线性性能退化。

上述问题的组合使得难以解决非线性性能退化的预测建模的问题。因此，需要精确预测由于非线性现象引起的性能退化的技术。

发明内容

本发明的方面涉及一种计算机实现的方法，包括将新数据样本输入到故障预测模型。使用标记的历史数据集来训练故障预测模型。相应的数据点与回顾窗口和预测时域相关联，以创建相应的训练样本。将相应的训练样本聚类在多个集群中，并且多个集群各自与常态分数和异常分数相关联。该方法进一步包括基于将多个集群中的包括新数据样本的第一集群的第一异常分数与多个集群中的具有大于异常分数的常态分数的集群的平均异常分数进行比较，输出与新数据样本相关联的分类。

有利地，本发明可以优选地从不平衡的训练数据集精确地预测非线性性能退化。此外，常态分数和异常分数可以优选地有利地量化与分类相关联的异常程度。本发明的另一个优点是，优选地不依赖于ANN(其倾向于对不平衡的训练数据过度参数化)，也不依赖于不平衡的训练数据的过采样或欠采样技术(其倾向于偏移分类)。

根据优选实施例，本公开还包括其中回顾窗口限定要包括在每个相应训练样本中的顺序地在前的数据点的量。有利地，回顾窗口可以调节指示正常操作或异常操作的特征标记的大小。例如，更短的回顾窗口可能对各个数据点更敏感，而更长的回顾窗口可能对各个数据点较不敏感。

根据优选实施例，方法还包括，其中，预测时域定义了未来的预定义时间量，并且其中，未来的预定义时间量中的相应数据点的相应标签与相应的训练样本相关联。有利地，预测时域可以将由回顾窗口定义的各种特征标记与对应的未来结果联系起来。例如，更短的预测时域可以针对给定预测给出更短的警告(例如，在与磨损相关的故障之前一天)，而更长的预测时域可以针对给定预测给出更长的警告(例如，与磨损相关的故障一个月)。

根据优选实施例，该方法还包括其中使用K均值聚类来聚类相应训练样本。有利地，K均值聚类是一种有效且可扩展的聚类技术。

根据一个方面，提供了一种系统，包括：一个或多个处理器；以及存储程序指令的一个或多个计算机可读存储介质，该程序指令在由一个或多个处理器执行时被配置为使得一个或多个处理器执行一种方法，方法包括：将新数据样本输入到故障预测模型，其中，使用标记的历史数据集来训练故障预测模型，其中，相应的数据点与回顾窗口和预测时域相关联以创建相应的训练样本，其中，相应的训练样本被聚类在多个集群中，并且其中，多个集群各自与常态分数和异常分数相关联；以及基于将多个集群中的包含新数据样本的第一集群的第一异常分数与多个集群中具有大于异常分数的常态分数的集群的平均异常分数进行比较，输出与新数据样本相关联的分类。

根据一个方面，提供了一种计算机程序产品，包括一个或多个计算机可读存储介质，以及共同存储在一个或多个计算机可读存储介质上的程序指令，程序指令包括被配置为使得一个或多个处理器执行一种方法的指令，方法包括：将新数据样本输入到故障预测模型，其中使用标记的历史数据集来训练故障预测模型，其中，相应的数据点与回顾窗口和预测时域相关联以创建相应的训练样本，其中，相应的训练样本被聚类在多个集群中，并且其中，多个集群各自与常态分数和异常分数相关联；以及基于将多个集群中的包括新数据样本的第一集群的第一异常分数与多个集群中具有大于异常分数的常态分数的集群的平均异常分数进行比较，输出与所述新数据样本相关联的分类。

本公开的另外的方面涉及用于预测螺杆泵(PCP)的磨损相关劣化的计算机实现的方法，方法包括将PCP的新数据样本输入到被配置为预测PCP的磨损相关劣化的模型。使用标记的历史PCP数据集来训练模型。相应的数据点与回顾窗口和预测时域相关联，以创建相应的训练样本。将相应的训练样本聚类在多个集群中，并且多个集群各自与常态分数和异常分数相关联。该方法还包括基于将多个集群中的包括新数据样本的第一集群的第一异常分数与多个集群中具有大于异常分数的常态分数的集群的平均异常分数进行比较来输出与新数据样本相关联的分类，并且其中该分类指示PCP的磨损相关的劣化。

有利地，本公开的前述方面可优选地从PCP相关数据的不平衡训练数据集准确预测PCP中的磨损相关劣化的非线性性能退化。此外，常态分数和异常分数可以优选地有利地量化与分类相关联的异常程度。

本公开的另外的方面涉及用于预测螺杆泵(PCP)的磨损相关劣化的计算机实现的方法，方法包括通过执行与一个或多个PCP相关联的历史数据的二进制标记来生成标记的历史数据。该方法还包括通过将回顾窗口和预测时域应用于标记的历史数据的相应的数据点来生成多个训练数据样本。该方法还包括将多个训练数据样本聚类成多个集群。该方法还包括计算多个集群中的相应的集群的集群分数。该方法进一步包括将PCP的新数据样本分配给多个集群中的第一集群。该方法进一步包括基于与第一集群相关联的集群分数向新数据样本分配分类，其中该分类指示PCP的未来磨损相关的劣化的可能性。

有利地，本公开可优选地从PCP相关数据的不平衡训练数据集准确预测PCP中的磨损相关劣化的非线性性能退化。此外，集群分数可以优选地有利地量化与分类相关联的异常程度。

根据优选实施例，该方法还包括其中在已知的泵更换日期之前的预定时间段内将标记的历史数据标记为有故障的。有利地，本公开的该实施例提供了“正常”和“错误”数据之间的清晰的判定边界，而由于性能中的磨损相关劣化的非线性和渐进性质，这样的确定性的判定边界不一定另外存在。

根据优选实施例，该方法还包括其中历史数据包括泵速数据、泵扭矩数据、套管压力数据、生产率数据和与PCP相关的维护记录。有利地，这是PCP可用的数据。换句话说，通过使用此数据来预测PCP性能中与磨损相关的劣化，不需要额外的数据仪器。

根据优选实施例，该方法还包括其中计算相应集群的集群分数还包括计算第一集群的常态分数，其中常态分数是与第一集群中的正常状态相关联的训练数据样本的第一比例除以与多个训练数据样本中的正常状态相关联的训练数据样本的第二比例。计算集群分数还包括计算第一集群的异常分数，其中，异常分数是与第一集群中的劣化状态相关联的训练数据样本的第三比例除以与多个训练数据样本中的劣化状态相关联的训练数据样本的第四比例。有利地，计算常态分数和异常分数量化了预测分类的相对异常程度，从而向分类增加了准确度和上下文。

根据优选实施例，该方法还包括生成新数据样本的故障信号，其中故障信号包括在预定数量的先前数据点上的新样本的平均异常分数。有利地，故障信号表示给定数据样本的异常分数的后处理平滑，从而减少数据流的连续异常分数中的假阳性和/或噪声。

本公开的附加方面涉及被配置为执行上述方法的系统和计算机程序产品。本发明并不旨在说明本公开的每个实施例的每个方面、每个实现和/或每个实施例。

附图说明

现在将仅通过示例的方式并参考以下附图来描述本发明的优选实施例：

图1示出了根据本公开的一些实施例的示例计算环境的框图。

图2示出了根据本公开的一些实施例的示例故障预测模型的框图。

图3示出了根据本公开的一些实施例的用于预测具有非线性特性的性能退化的示例方法的流程图。

图4示出了根据本公开的一些实施例的用于训练故障预测模型的示例方法的流程图。

图5A示出了根据本公开的一些实施例的用于基于来自故障预测模型的输出生成结果的示例方法的流程图。

图5B示出了根据本公开的一些实施例的用于计算故障信号的示例方法的流程图。

图6A示出了根据本公开的一些实施例的作为距离故障的天数的函数的累积异常分数的曲线图的实验结果。

图6B示出了根据本公开的一些实施例的作为距离故障的天数的函数的故障标签(failure label)的强度的曲线图的实验结果。

图7示出了根据本公开的一些实施例的在故障之前的各个时段的混淆矩阵的实验结果。

图8示出了根据本公开的一些实施例的示例计算机的框图。

图9描绘了根据本公开的一些实施例的云计算环境。

图10描绘了根据本公开的一些实施例的抽象模型层。

本公开可修改为各种修改和替代形式，其细节在附图中以示例的方式示出并将详细描述。然而，可以理解，目的不是将本公开限制于所描述的特定实施例。相反，旨在涵盖落入本公开的精神和范围内的所有修改、等效物和替代物。

具体实施方式

本公开的实施例涉及预测建模，并且更具体地，涉及利用非线性特性预测性能退化。根据上述上下文可以更好地理解本公开的实施例，而不限于这些应用。

本公开的实施例涉及用于在非线性故障机制(例如，磨损、疲劳、蠕变等)的早期阶段期间检测资产性能的退化以预测资产的即将到来的故障并在资产故障之前推荐资产的预防性维护的技术。本公开的实施例利用半监督机器学习方法，该半监督机器学习方法摄取资产的历史数据作为输入，并且生成指示资产的未来故障或性能退化的可能性的异常分数、分类和/或故障信号作为输出。

在克服非线性现象的预测建模中的先前讨论的挑战时，本公开的实施例实现了诸如但不限于以下的特征：(i)区分正常数据和错误数据的非线性判定边界；(ii)计算上直接的实现(例如，尽管是非线性的，但是它不是如ANN的情况那样被过度参数化)；(iii)没有类别平衡(因此，数据中的原始分布不偏斜以及随后的解不偏移)；和/或(iv)可以容易地应用于任何类似资产族的全局解决方案。

现在参考附图，图1示出了根据本公开的一些实施例的示例计算环境100。计算环境100包括经由网络108通信地耦合到传感器数据记录系统104和端点应用106的故障预测系统102。故障预测系统102可被配置为从传感器数据记录系统104接收数据，并做出与相关的资产110的性能由于非线性现象而将来劣化相关的预测(例如，对PCP在将来时间间隔中的与磨损相关的性能劣化的预测)。故障预测系统102可以进一步被配置为与端点应用106交互。例如，故障预测系统102可以从端点应用106接收请求以检测来自传感器数据记录系统104的故障的任何指示。作为另一示例，故障预测系统102可以将从传感器数据记录系统104识别的关于潜在故障特征的更新推送到端点应用106。

传感器数据记录系统104可包括一个或多个数据获取系统，数据获取系统被配置为获取与资产110的功能直接或间接相关的数据。例如，在资产110是油井生产系统中的PCP的情况下，传感器数据记录系统104可以收集诸如但不限于速度、扭矩、套管压力和/或生产率的数据。作为另一个示例，在资产110是车辆的机械组件(例如，燃料泵、车轮轴承、汽缸盖垫片等)的情况下，传感器数据记录系统104可收集例如但不限于里程、速度、发动机错误代码等的数据。如从这两个非限制性示例可以看出的，传感器数据记录系统104不必收集与资产110直接相关联的数据。相反，在一些实施例中，传感器数据记录系统104收集与和资产110相关联的其它组件相关联的数据，但其中所收集的数据可能仍然可用于提供关于资产110的功能性的间接推断。在装备系统的特定组件用于收集数据以预测非线性性能退化可能在经济上不可行和/或在技术上不切实际的范围内，这可能是有益的。因此，在许多现实世界的应用中，对非线性性能退化的预测包括以下挑战：(i)从非线性性能退化的可用数据中识别故障特征，以及(ii)确定所识别的故障特征是否排他地(或主要地)代表非线性性能退化。

端点应用106可以是在诸如例如台式机、膝上型计算机、平板计算机、智能电话或其他端点设备的用户工作站上执行的应用。端点应用106可以提供用于用户与故障预测系统102交互的接口。例如，用户可请求基于来自传感器数据记录系统104的数据的对资产110的预测故障分析。作为另一示例，故障预测系统102可以基于与资产110相关联的并且从来自传感器数据记录系统104的数据检测到的故障特征，向端点应用106推送更新、通知或警告。此外，在一些实施例中，端点应用106提供用户可将已训练的故障预测系统102配置为接收流数据的机制，其中流数据可用于与用于训练故障预测系统102的资产110类似的资产(例如，油井操作员可将其自己的PCP数据流传输到先前对来自一个或多个其它PCP的类似PCP数据训练的故障预测系统102)。

在一些实施例中，可以在云计算架构中虚拟地提供故障预测系统102。在一些实施例中，故障预测系统102可以驻留在计算机中，诸如例如，大型机、计算节点、台式机、膝上型计算机、平板电脑或包括一个或多个处理器和一个或多个计算机可读存储介质的另一系统。

故障预测系统102可以包括数据仓库112、模型容器114和计算引擎116。数据仓库112可以包括聚集传感器数据118，其可以是从传感器数据记录系统104收集的数据并且可以包括一个或多个数据样本。

模型容器114可以包括数据准备/工程实用程序126，其可以对聚集的传感器数据118执行以至少部分地生成格式化的传感器数据120。例如，数据准备/工程实用程序126可被配置为在将聚集的传感器数据118转换成格式化的传感器数据120时移除离群值、校正数据格式化问题、解决空值等。在一些实施例中，格式化的传感器数据120可以例如包括应用于聚集的传感器数据118的回顾(look-back)窗口。

可将格式化的传感器数据120输入到故障预测模型124。在一些实施例中，格式化的传感器数据120和故障预测模型124被加载到计算引擎116的部署资源130中。在使用格式化的传感器数据120作为输入的故障预测模型124的执行之后，计算引擎116可以生成结果122并且将结果122存储在数据仓库112中。结果122可以包括例如异常分数、分类和/或故障信号。结果122可以指示由于非线性性能退化而导致的将来性能退化的可能性(例如，PCP中的与磨损相关的性能退化的可能性)。

计算引擎116可进一步包括预测服务128，其中预测服务128可被配置为从端点应用106接收请求或将通知推送至端点应用106。预测服务128可以协调故障预测系统102的功能。例如，在一些实施例中，预测服务128可以使得使用部署资源130针对聚集的传感器数据118执行数据准备/工程实用程序126，以便生成格式化的传感器数据120。继续上述示例，预测服务128可以进一步被配置为在部署资源130上部署故障预测模型124，并且使用格式化的传感器数据120作为输入以便生成结果122。预测服务128还可以被配置为将结果122发送到端点应用106。

现在转到图2，示出了根据本公开的一些实施例的故障预测模型124的框图。故障预测模型124可以包括例如训练模式200和部署模式228。在训练模式200中，故障预测模型124被训练成准确地预测非线性性能退化，例如由于磨损引起的故障或退化。在部署模式228中，故障预测模型124被配置为接收输入数据、格式化输入数据、以及做出与和数据相关的非线性现象有关的预测(例如，诸如对由于PCP中的磨损而导致的未来次优性能的预测)。

在训练模式200中，故障预测模型124可从与一个或多个资产110相关联的一个或多个传感器数据记录系统104接收历史数据202，其中，历史数据202被分成训练子集204-1和测试子集204-2。训练子集204-1可被配置为训练和验证故障预测模型124，并且测试子集204-2可被用于测试故障预测模型124，其中测试可被用于量化故障预测模型124的特性，诸如例如准确性、查准率、查全率等。

训练模式200还可以包括标记的历史数据206，其中标记的历史数据206可以从将历史故障记录(例如，指示PCP替换的维护记录)与传感器读数(例如，速度、扭矩、生产率、套管压力等)时间对准中导出。标记的历史数据206包括指示资产110的正常操作的指示正常状态的数据208-1和指示资产110的次优、劣化或故障性能(例如，PCP的磨损状态)的指示劣化状态的数据208-2。可由主题专家(SME)主观地作出、由统计测量(例如，在正常操作期间的平均值的一个标准偏差之外)客观地作出、从机器学习推断出或使用其它策略或技术来确定在指示正常状态的数据208-1与指示劣化状态的数据208-2之间的决策边界。如先前所论述，指示劣化状态的数据208-2不一定是与不工作的资产110相关联的数据。相反，指示劣化状态的数据208-2指示即使资产110能保持工作但资产110的次优性能。例如，在一些实施例中，如果资产110在第x天经历明显故障或以其它方式被替换，则可将来自第x天之前的预定周期的数据自动标记为指示劣化状态的数据208-2。

训练模式200还可以包括窗口化的(windowed)历史数据210。窗口化的历史数据210可包括回顾(look-back)窗口212和预测时域(prediction horizon)214。回顾窗口212可参考在当前数据点之前的多个数据点(例如，D_x)以包括在每个数据样本中。预测时域214可参考数据点的标签，即从当前数据点起的未来的多个数据点(例如，D_y)。回顾窗口212和预测时域214可以用于将训练子集204-1中的相应的数据点转换为相应的与正常状态相关联的数据样本216-1和相应的与劣化状态相关联的数据样本216-2(统称为数据样本216)。换句话说，故障预测模型124被训练成使用资产110的性能历史(等于回顾窗口212)来得出关于资产110的有关性能劣化水平的可能未来状态的结论。相应的数据样本216可包括数据点的向量、矩阵或张量，该数据点对于每个数据流对应于当前数据点和若干先前数据点(基于回顾窗口212)，并且相应的数据样本216还可以通过预测时域214与未来数据点的标签相关联(其中未来数据点的标签可以被添加到向量、矩阵或张量中的预定位置，或者以其他方式与向量、矩阵或张量相关联)。换句话说，可由预测时域214处的数据点识别与正常状态相关联的数据样本216-1，该数据点是指示正常状态的数据208-1。类似地，与劣化状态相关联的数据样本216-2可以是具有在预测时域214处被标记为指示劣化状态的数据208-2的数据点的那些数据样本。

例如，回顾窗口212可以是十天，并且预测时域214可以是二十天。在该场景中，对于来自训练子集204-1中的单个数据流的第一时间的数据点，数据点可被转换成包括前十个数据点的向量(例如，回顾窗口212)，并且该向量可与未来二十天的数据点的标签(例如，预测时域214，其中标签是指示正常状态的数据208-1或指示劣化状态的数据208-2)相关联。在该示例中，如果未来二十天的数据点的标签是指示劣化状态的数据208-2，则可认为当前数据点和前十个数据点的数据点向量是用于训练目的的预测故障特征。相反，如果未来二十天的数据点的标签是指示正常状态的数据208-1，则可假定当前数据点和前十个数据点的数据点向量为用于训练目的的预测正常特征。

如本领域技术人员将理解的，回顾窗口212和预测时域214可以是根据各种尺度的各种数字。例如，在一些实施例中，可以以秒、分钟、天、周、月等来测量回顾窗口212和预测时域214。在各种实施例中，回顾窗口212小于、大于或等于预测时域214。在一些实施例中，为管理效用和计算开销之间的折衷而确定回顾窗口212的大小。例如，相对更大的回顾窗口212提供了增加的信息，利用该信息来准确地检测故障特征，同时还需要额外的计算能力来实现。相反，相对更小的回顾窗口212提供了减少的信息，利用该信息来准确地检测故障特征，同时需要较少的计算能力来实现。在一些实施例中，基于故障特征确定预测时域214的大小。例如，如果资产110与从故障指示开始在数据中表明其自身的时间起的二十天窗口相关联，则预测时域214必须是二十天或更少(换句话说，大于二十天的预测时域214将导致增加的假阳性)。此外，在一些实施例中，回顾窗口212和预测时域214根本不需要以基于时间的增量来测量，而是可以简单地由多个先前或后续数据点来引用，其中数据点的间隔可以是基于非时间特性的。此外，尽管在上述示例中讨论的数据样本216是向量格式，但是在其他实施例中，可使用矩阵或张量来表示多维数据或多模态数据流。作为一个示例，对于与三个数据流相关联的资产110，数据样本216可以包括输入-输出数据对，其中输入部分包括由三个数据流中的每一个的相应的回顾窗212样本构成的三维张量，并且其中输出部分包括预测时域214处的未来性能的二进制指示符(例如，正常为0，故障为1)。

训练模式200还可以包括聚类数据218。聚类218可使用现在已知或以后开发的任何可测试聚类技术来对数据样本216进行聚类。换句话说，聚类的数据218可以包括多个集群220，其中每个集群包括至少一个数据样本216。值得注意的是，集群220的数量是可配置的，以便精确地拟合(而不过度拟合)数据样本216。

在一些实施例中，通过使用K均值聚类来确定集群220。有利地，K均值聚类是计算上高效的聚类技术，其可扩展到大的数据集。更一般地，根据本公开的一些实施例，所使用的聚类技术的类型、所使用的集群的数量以及所使用的集群的参数(例如，形状、大小等)都是可调整的参数，其可以根据需要被调节以改进故障预测模型124的性能。例如，具有足够数量的集群以采集各种正常操作简档和各种劣化操作简档可能是有益的。

聚类数据218还可以包括分配给集群220中的每一个集群的集群分数222。集群分数222可以包括常态分数224和异常分数226。在一些实施例中，可根据等式1来计算常态分数224：

等式1：

对于1<i<集群的数量

类似地，在一些实施例中，可以根据等式2计算异常分数226：

等式2：

对于1<i<集群的数量

关于等式1，

可指在集群220的给定集群C_i内与正常状态相关联的数据样本216-1的计数，而N_n可指在窗口化的历史数据210中与正常状态相关联的数据样本216-1的总计数。类似地，关于等式2，项

可指在集群220的给定集群C_i内与劣化状态相关联的数据样本216-2的计数，而N_f可指在窗口化的历史数据210中与劣化状态相关联的数据样本216的总计数。对于等式1和等式2两者，项

可指在集群220的给定集群C_i内的数据样本216的总计数，而N可指窗口化的历史数据206中的数据采样216的总计数。

换句话说，常态分数224可以是给定集群中的与正常状态相关联的数据样本216-1的比例除以整个窗口化的历史数据210中的与正常状态相关联的数据样本216-1的比例。类似地，异常分数226可以是给定集群中的与劣化状态相关联的数据样本216-2的比例除以整个窗口化的历史数据210中的与劣化状态相关联的数据样本216-2的比例。

在创建集群220和生成集群分数222之后，可认为故障预测模型124是训练过的。在一些实施例中，在使用训练子集204-1训练故障预测模型124之后，可以使用测试子集204-2和部署模式228来测试故障预测模型124。尽管将关于训练子集204-2讨论部署模式228，但是部署模式228的讨论同样适用于接收流式实时数据，以便预测与新数据相关联的未来非线性现象(例如，PCP中的与磨损相关的性能劣化)。

在部署模式228中，故障预测模型124可以将测试子集204-2格式化为窗口化的数据样本230。窗口化的数据样本230可类似于数据样本216，但没有正常状态或劣化状态的任何指示(在这种情况下，这是由故障预测模型124预测的信息，且因此在测试故障预测模型124的性能时对故障预测模型124隐藏)。因此，窗口化的数据样本230中的相应样本可包括来自测试子集204-2的数据点和根据回顾窗口212的先前数目的数据点。如前所述，这一系列数据可以根据测试子集204-2中的数据的复杂度、维度和形式以向量、矩阵或张量格式存储。在一些实施例中，窗口化的数据样本230与格式化的传感器数据120一致。

然后，窗口化的数据样本230中的相应样本可以与相应集群220相关联。然后，可以基于集群220中的相关联的集群，将分类232与每个窗口化的数据样本230相关联。例如，对于放置在具有大于异常分数226的常态分数224的相应的集群220内的相应窗口化的数据样本230，可认为该相应窗口化的数据样本230是正常的(例如，“0”分数)。相反，如果相应的窗口化的数据样本230被放置在具有大于常态分数224的异常分数226的相应的集群220中，则可认为相应的窗口化的数据样本240是异常的或预测未来故障(例如，“1”分数)。在一些实施例中，分类232包括将采集窗口化的数据样本230的集群220的异常分数226与具有大于异常分数226的常态分数224的所有集群220的平均异常分数进行比较。这样，采集窗口化的数据样本230的集群220的异常分数226可以与在其他被认为正常的集群220中看到的异常的基线水平进行比较。

故障预测模型124还可包括故障信号234。故障信号234可以被配置为通过获取异常分数的平均值或先前预定数量的数据点来平滑异常分数226或分类232。例如，可以根据等式3来计算故障信号234：

等式3：

在等式3中，项x可以指顺序地在前的数据点的预定数量，在这些数据点上确定给定窗口化的数据样本230的平均异常分数。在一些实施例中，x可以是根据故障预测模型124的设计考虑的可调参数。例如，相对更大的x可以降低故障预测模型124对指示故障的任何特定异常分数的敏感性(并且由此降低假阳性)，而相对更小的x可以增加故障预测模型124对指示故障的每个异常分数的敏感性(并且由此降低假阴性)。此外，在等式3中，术语AS_n可以指集群220中包括数据点n的集群的异常分数226，尽管在其他实施例中，也可以使用分类232。参照图5B更详细地讨论故障信号234。

现在参考图3，示出了根据本公开的一些实施例的用于利用故障预测模型124的示例方法300的流程图。可以由例如故障预测模型124、故障预测系统102、计算机、计算节点、处理器或硬件和/或软件的另一组合来实现方法300。

操作302包括训练故障预测模型124。训练故障预测模型124可涉及先前关于故障预测模型124的训练模式200所讨论的方面。将在下文中参考图4更详细地讨论操作302。

操作304包括将聚集的传感器数据118格式化成格式化的传感器数据120。在一些实施例中，格式化的传感器数据120与窗口化的数据样本230一致。操作304可以包括将回顾窗口212应用于聚集的传感器数据118中的相应数据点，以便生成格式化的传感器数据120。在一些实施例中，操作304还包括其它数据清理和/或数据格式化操作，诸如移除离群值、解析空值等。

操作306包括将格式化的传感器数据120输入到故障预测模型124。操作308包括基于来自故障预测模型124的输出生成结果122。在一些实施例中，结果122包括分类232(例如，正常的或指示未来故障)和/或故障信号234(例如，与未来故障的可能性相关的量化)。

操作310包括基于结果执行缓解动作。例如，缓解动作可涉及以通知、警告、报告或另一传输的形式将结果122发送到端点应用106。在一些实施例中，操作310包括触发与资产110的维护相关的调度事件，诸如替换、重建或以其他方式维护资产110。在一些实施例中，调度事件是基于结果122的。例如，高于阈值的故障信号234可以触发要在时间窗口内(例如，在预测时域214内)安排的维护事件。在一些实施例中，缓解动作可以与后勤动作有关，后勤动作例如订购任何必要的替换零件并将任何订购的替换零件发送到与资产110相关联的位置。

现在参考图4，示出了根据本公开的一些实施例的用于训练故障预测模型124的示例方法400的流程图。在一些实施例中，方法400是图3的操作302的子方法。在一些实施例中，可以例如由故障预测模型124、故障预测系统102、计算机、计算节点、处理器或硬件和/或软件的另一组合来实现方法400。

操作402包括将历史数据202聚集成训练子集204-1和测试子集204-2。操作404包括标记历史数据202以生成包括指示正常状态的数据208-1和指示劣化状态的数据208-2的标记的历史数据206。操作406包括通过将回顾窗口212和预测时域214应用于历史数据202中的相应数据点来生成与正常状态相关联的数据样本216-1和与劣化状态相关联的数据样本216-2。

操作408包括将数据样本216聚类成多个集群220。在一些实施例中，操作408利用K均值聚类。操作410包括计算与集群220中的每个集群相关联的集群分数222。集群分数222可包括集群220中的每个相应集群的相应常态分数224和相应异常分数226。

操作412包括调整故障预测模型124。调整故障预测模型124可包括例如，(i)通过改变指示正常状态的数据208-1和指示劣化状态的数据208-2的定义来修改标记的历史数据206；(ii)改变回顾窗口212的大小；(iii)改变预测时域214的大小；(iv)改变与集群220相关联的参数(例如，集群的数量、集群的形状、集群的大小等)；和/或其它模型调整技术和/或策略。在一些实施例中，基于测试子集204-2的结果来调整故障预测模型124。

操作414包括输出被训练的故障预测模型124。在一些实施例中，输出被训练的故障预测模型124包括将被训练的故障预测模型124存储在计算机可读存储介质中，诸如例如虚拟提供的模型容器114。

现在参考图5A，示出了根据本公开的一些实施例的用于基于来自故障预测模型124的输出生成结果的示例方法500的流程图。在一些实施例中，方法500是图3的操作308的子方法。在一些实施例中，可以例如由故障预测模型124、故障预测系统102、计算机、计算节点、处理器或硬件和/或软件的另一组合来实现方法500。

操作502包括将二进制分类结果232与先前输入到故障预测模型124的相应数据样本(例如，窗口化的数据样本230)相关联。在一些实施例中，分类232是“正常”(例如，0)或“异常”、“故障”或另一非正常指示符(例如，1)。分类232可以基于采集相应窗口化的数据样本230的集群220的常态分数224和异常分数226。更具体地，如果常态分数224大于异常分数226，则认为对应的窗口化的数据样本230是正常的。相反，如果异常分数226大于常态分数224，则认为对应的窗口化的数据样本230是异常的或以其他方式指示故障。

操作504包括针对相应的输入数据样本(例如，窗口化的数据样本230)生成故障信号234。故障信号234可以基于与窗口化的数据样本230相关联的常态分数224、异常分数226和/或分类232。在一些实施例中，故障信号234表示真正异常数据的更可靠的指示符(例如，其减少了假阳性)。在下文中参考图5B更详细地讨论故障信号234。

现在参考图5B，示出了根据本公开的一些实施例的用于生成故障信号234的示例方法510的流程图。在一些实施例中，方法510是图5A的操作504的子方法。在一些实施例中，可由例如故障预测模型124、故障预测系统102、计算机、计算节点、处理器或硬件和/或软件的另一组合来实现方法510。

操作512包括计算被排名为正常的集群220的平均异常分数。在正常操作期间计算平均异常分数可涉及对集群220中的每一集群的异常分数226求平均值，其中常态分数224大于异常分数226。这在其建立用作减少假阳性的基线异常水平的范围内是有益的。

操作514包括将输入的窗口化的数据样本230分配给与异常分数226和常态分数224相关联的集群220。如果指定集群的异常分数大于正常操作期间的平均异常分数(如操作512中所确定的)，则该数据样本被分类为处于故障模式(分类为1)，否则该数据样本被分类为处于正常模型(分类为0)。

操作516包括将故障信号234计算为该资产在预定时间段(例如，10天)或预定数量的窗口化的数据样本230上的二进制0或1分类结果的平均值。在一些实施例中，操作516可以利用等式3。

再次参考图1-5，本公开的各方面的一个特定应用涉及检测螺杆泵(PCP)中的转子的磨损引起的性能退化。PCP中的转子的磨损引起的性能退化是非线性现象，因此，本公开的方面非常适合于准确地预测PCP中的磨损引起的转子退化。

利用PCP的人工举升系统能够实现各种非热力油和气回收方法，例如利用砂的冷重油生产(CHOPS)。与其它人工举升系统(例如，电动潜水泵(ESP))相比，PCP能够以改进的举升成本、改进的维护成本、改进的应用灵活性以及降低的环境影响将油和沙的粘性混合物从地下储层举升到地面。

尽管PCP适用于处理重油中较高含砂量，但持续的砂摄入所导致的一个问题是磨损故障。磨蚀性磨损可指随着转子上的硬铬镀层磨损而泵性能的逐渐退化，并且其是PCP中最常见的故障类型。这种磨损可被限制在转子上的镀铬表面上或延伸到基底金属。在任一情况下，原始转子轮廓都改变。这种轮廓的改变会影响PCP的性能，因为改变了转子和定子之间的配合。硬铬镀层磨损到基底金属的剧烈磨损会永久地损坏转子中的弹性体，并且需要更换泵。

油井中的泵故障在损失生产时间方面是昂贵的。因此，预测泵磨损故障的能力通过在故障之前为PCP提供主动的、定期的维护而降低了这些成本。此外，对磨损早期泵性能退化的改进的认识可以帮助操作者在操作决策中做出适当的调整以延长运行寿命。

然而，由于与预测具有非线性特性的任何性能退化类似的原因，预测PCP中的故障是挑战性的。例如，故障机制是渐进的，这在将历史数据正确标记为“正常”或“异常”时引发问题，因为PCP可能在延长的时间段内保持以次优性能运行同时转子变得越来越磨损。另一个挑战涉及PCP可用的历史数据的不平衡集合(例如，比异常数据明显更多的正常数据)。又一挑战涉及随操作环境(例如，与具有较低含砂量的地质地层相比包括较高含砂量的地质地层)而变化的可变故障机制。因此，难以准确地预测PCP故障。尽管如此，本公开的各方面在PCP的预测监测领域中实现时，可以准确地预测由于磨损相关机制引起的PCP性能退化。

例如，再次回到图4的讨论，因为其涉及训练用于资产110(例如PCP)的故障预测模型124，操作402可以聚集传感器数据，例如泵速度、泵扭矩、套管压力和生产率。聚集的传感器数据可被分成训练子集204-1(例如，大约80％的数据)和测试子集204-2(例如，大约20％的数据)。操作404可以将历史数据标记为指示正常状态的数据208-1(训练子集204-1中的大约97％的不平衡数据)或指示劣化状态的数据208-2(训练子集204-1中的大约3％的不平衡数据)。在一些实施例中，指示劣化状态的数据208-2可以是在已知PCP更换日期(如从维护记录确定的)之前25天与3天之间的任何数据，而可认为在已知PCP更换日期之前25天之前的数据是指示正常状态的数据208-1。

操作406可以通过将回顾窗口212和预测时域214应用于相应的数据点来生成数据样本216。操作408可以使用K均值聚类来对数据样本216进行聚类，并且操作410可以分别根据等式1和等式2来计算常态分数224和异常分数226。操作412可以调整故障预测模型124，并且操作414可以输出被训练的故障预测模型124。

将测试子集204-2应用于PCP应用的经训练的故障预测模型124展示了本公开的各方面的效用。图6A示出了作为到已知泵更换日期的天数(x轴)的函数的累积异常分数226(y轴)的函数的曲线图的实验结果。可以看出，在故障前的25天与已知的泵更换日期之间趋势线急剧增加。因此，图6A示出了异常分数226可以用于成功地预测PCP故障。

图6B示出了指示作为到故障的天数(x轴)的函数的故障(y轴)的分类232的强度的曲线图的实验结果。可以看出，指示故障的分类232的强度在故障之前的大约25天与已知的泵更换日期之间显著地上升。因此，图6B证明了分类232可以成功地用于预测PCP故障。

值得注意的是，尽管没有提供与故障信号234相关的曲线图，但是对于本领域技术人员来说显而易见的是，故障信号234相对于图6A和6B中所示的结果表现出具有降低的噪声的类似预测能力。这是因为故障信号234代表平均分数，而图6A示出了累积分数，图6B示出了强度分数。

图7示出了在已知的泵更换日期之前的各个时间段针对如上所述的PCP故障预测模型124使用测试子集204-2的与混淆矩阵相关的实验结果。如图7所示，在故障之前30天700-1，正常(实际标签702-1)-正常(预测标签704-1)盒是0.76，故障-正常盒是0.38，正常-故障盒是0.24，并且故障-故障盒是0.62。在故障之前14天700-2，正常(实际标签702-2)-正常(预测标签704-2)盒是0.76，故障-正常盒是0.26，正常-故障盒是0.24，并且故障-故障盒是0.74。在故障之前5天700-3，正常(实际标签702-3)-正常(预测标签704-3)盒是0.76，故障-正常盒是0.12，正常-故障盒是0.24，并且故障-故障盒是0.88。

通常，图7示出了作为实际泵更换日期的接近的函数的改进预测性能。此外，图7示出了在故障之前5天700-3的大约88％，在故障之前14天700-2的大约75％，和在故障之前30天700-1的大约62％的召回率(例如，真阳性除以真阳性和假阴性的总和)。同时，本公开的方面实现了大约78％(在故障之前5天700-3)，76％(在故障之前14天700-2)，和72％(在故障之前30天700-1)的精确度(例如，真阳性除以真阳性和假阳性的总和)。因此，图7证明了本公开的各方面实现了用于预测由于转子磨损导致的PCP性能退化的鲁棒的故障预测模型124。

图8示出了根据本公开的一些实施例的示例计算机800的框图。在各种实施例中，计算机800可以执行图3-5中描述的任何或所有方法和/或实现在图1-2和/或6-7的任一个中讨论的功能。在一些实施例中，计算机800通过经由网络850从远程数据处理系统下载处理器可执行指令来接收与上述方法和功能相关的指令。在其他实施例中，计算机800向客户端机器提供用于上述方法和/或功能的指令，使得客户端机器基于由计算机800提供的指令来执行该方法或该方法的一部分。在一些实施例中，计算机800被并入(或类似于计算机800的功能被虚拟地提供到)图1的故障预测系统102、图1的故障预测模型124或本公开的另一方面。

计算机800包括存储器825、存储装置830、互连820(例如，总线)、一个或多个CPU805(在此也称为处理器)、I/O设备接口810、I/O设备812和网络接口815。

每个CPU 805取得并执行存储在存储器825或存储装置830中的编程指令。互连820用于在CPU 805、I/O设备接口810、存储器830、网络接口815和存储器825之间移动数据，例如编程指令。可以使用一个或多个总线来实现互连820。在各种实施例中，CPU 805可以是单个CPU、多个CPU、或具有多个处理核的单个CPU。在一些实施例中，CPU 805可以是数字信号处理器(DSP)。在一些实施例中，CPU 805包括一个或多个3D集成电路(3DIC)(例如，3D晶片级封装(3DWLP)、基于3D中介体的集成、3D堆叠IC(3D-SIC)、单片3D IC、3D异构集成、3D系统级封装(3DSiP)和/或封装上封装(PoP)CPU配置)。通常包括存储器825以表示随机存取存储器(例如，静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)或闪存)。通常包括存储器830以表示非易失性存储器，诸如硬盘驱动器、固态设备(SSD)、可移除存储卡、光学存储装置或闪存设备。在一个替换实施例中，可以由存储区域网络(SAN)设备、云、或经由I/O设备接口810连接到计算机800或经由网络接口815连接到网络850的其他设备来代替存储830。

在一些实施例中，存储器825存储指令860。然而，在各种实施例中，指令860部分地存储在存储器825中并且部分地存储在存储装置830中，或者它们全部地存储在存储器825中或者全部地存储在存储装置830中，或者它们经由网络接口815通过网络850被访问。

指令860可以是用于执行图3-5的方法的任何部分或全部和/或实现图1-2和/或6-7中讨论的功能的计算机可读和计算机可执行指令。在一些实施例中，指令860可以被称为非线性性能退化预测协议(或指令、机制等)或故障预测协议(或指令、机制等)。尽管指令860被示出在存储器825中，但是指令860可以包括跨多个计算机可读存储介质共同存储并且可由一个或多个CPU 805执行的程序指令。

在各种实施例中，I/O设备812包括能够呈现信息和接收输入的接口。例如，I/O设备812可以向与计算机800交互的用户呈现信息，并且从用户接收输入。

计算机800经由网络接口815连接到网络850。网络850可以包括物理、无线、蜂窝或不同的网络。

可以理解，尽管本公开包括关于云计算的详细描述，但是本文所陈述的教导的实现不限于云计算环境。相反，本发明的实施例能够结合现在已知或以后开发的任何其它类型的计算环境来实现。

云计算是一种服务递送模型，用于实现对可配置计算资源(例如，网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池的方便的按需网络访问，所述可配置计算资源可以以最小的管理努力或与服务的提供者的交互来快速供应和释放。该云模型可以包括至少五个特性、至少三个服务模型和至少四个部署模型。

特征如下：

按需自助：云消费者可以单方面地自动地根据需要提供计算能力，诸如服务器时间和网络存储，而不需要与服务的提供者进行人工交互。

广域网接入：能力在网络上可用，并且通过促进由异构的薄或厚客户端平台(例如，移动电话、膝上型计算机和PDA)使用的标准机制来访问。

资源池化：供应商的计算资源被集中以使用多租户模型来服务多个消费者，其中不同的物理和虚拟资源根据需求被动态地分配和重新分配。存在位置无关的意义，因为消费者通常不控制或不知道所提供的资源的确切位置，但是能够在较高抽象级别(例如国家、州或数据中心)指定位置。

快速弹性：在一些情况下，可以快速且弹性地提供快速向外扩展的能力和快速向内扩展的能力。对于消费者，可用于提供的能力通常看起来不受限制，并且可以在任何时间以任何数量购买。

测量服务：云系统通过利用在适合于服务类型(例如，存储、处理、带宽和活动用户账户)的某一抽象级别的计量能力来自动地控制和优化资源使用。可以监视、控制和报告资源使用，从而为所利用服务的提供者和消费者两者提供透明性。

服务模型如下：

软件即服务(SaaS)：提供给消费者的能力是使用在云基础设施上运行的提供者的应用。应用程序可通过诸如web浏览器(例如，基于web的电子邮件)等瘦客户机界面从各种客户机设备访问。消费者不管理或控制包括网络、服务器、操作系统、存储、或甚至个别应用能力的底层云基础结构，可能的例外是有限的用户专用应用配置设置。

平台即服务(PaaS)：提供给消费者的能力是将消费者创建或获取的应用部署到云基础设施上，该消费者创建或获取的应用是使用由提供商支持的编程语言和工具创建的。消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础设施，但具有对部署的应用和可能的应用托管环境配置的控制。

基础设施即服务(IaaS)：提供给消费者的能力是提供处理、存储、网络和消费者能够部署和运行任意软件的其它基本计算资源，所述软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施，但具有对操作系统、存储、部署的应用的控制，以及可能对选择的联网组件(例如，主机防火墙)的有限控制。

部署模型如下：

私有云：云基础设施仅为组织操作。它可以由组织或第三方管理，并且可以存在于场所内或场所外。

社区云：云基础设施由若干组织共享，并且支持具有共享关注(例如，任务、安全要求、策略和合规性考虑)的特定社区。它可以由组织或第三方管理，并且可以存在于场所内或场所外。

公有云：云基础设施可用于一般公众或大型工业群体，并且由销售云服务的组织拥有。

混合云：云基础设施是两个或更多云(私有、共同体或公共)的组合，所述云保持唯一实体，但是通过使数据和应用能够移植的标准化或私有技术(例如，用于云之间的负载平衡的云突发)绑定在一起。

云计算环境是面向服务的，其关注于无状态、低耦合、模块性和语义互操作性。在云计算的核心是包括互连节点的网络的基础设施。

现在参考图9，描绘了说明性云计算环境50。如图所示，云计算环境50包括云消费者使用的本地计算设备可以与其通信的一个或多个云计算节点10，所述本地计算设备例如个人数字助理(PDA)或蜂窝电话54A、台式计算机54B、膝上型计算机54C和/或汽车计算机系统54N。节点10可以彼此通信。它们可以被物理地或虚拟地分组(未示出)在一个或多个网络中，诸如如上文描述的私有云、社区云、公共云或混合云或其组合。这允许云计算环境50提供基础设施、平台和/或软件作为服务，云消费者不需要为其维护本地计算设备上的资源。可以理解，图9中所示的计算设备54A-N的类型仅旨在说明，并且计算节点10和云计算环境50可以在任何类型的网络和/或网络可寻址连接上(例如，使用web浏览器)与任何类型的计算机化设备通信。

现在参考图10，示出了由云计算环境50(图9)提供的一组功能抽象层。可预先理解，图10中所示的组件、层和功能仅旨在说明，并且本发明的实施例不限于此。如所描绘的，提供了以下层和相应的功能：

硬件和软件层60包括硬件和软件组件。硬件组件的示例包括：主机61；基于RISC(精简指令集计算机)架构的服务器62；服务器63；刀片服务器64；存储设备65；以及网络和网络组件66。在一些实施例中，软件组件包括网络应用服务器软件67和数据库软件68。

虚拟化层70提供抽象层，从该抽象层可以提供虚拟实体的以下示例：虚拟服务器71；虚拟存储器72；虚拟网络73，包括虚拟专用网络；虚拟应用和操作系统74；以及虚拟客户机75。

在一个示例中，管理层80可以提供以下描述的功能。资源供应81提供用于在云计算环境内执行任务的计算资源和其它资源的动态采购。计量和定价82提供了在云计算环境中利用资源时的成本跟踪，以及用于消耗这些资源的开帐单或发票。在一个示例中，这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证，以及为数据和其他资源提供保护。用户门户83为消费者和系统管理员提供对云计算环境的访问。服务级别管理84提供云计算资源分配和管理，使得满足所需的服务级别。服务水平协议(SLA)规划和履行85提供对云计算资源的预安排和采购，其中根据SLA预期未来需求。

工作负载层90提供了可以利用云计算环境的功能的示例。可以从该层提供的工作负载和功能的示例包括：绘图和导航91；软件开发和生命周期管理92；虚拟教室教育传送93；数据分析处理94；交易处理95；以及非线性性能退化预测96。

本发明的实施例可以是任何可能的技术细节集成水平的系统、方法和/或计算机程序产品。计算机程序产品可以包括其上具有计算机可读程序指令的计算机可读存储介质(或多个介质)，所述计算机可读程序指令用于使处理器执行本发明的各方面。

计算机可读存储介质可以是能够保留和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质可以是例如但不限于电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或前述的任何合适的组合。计算机可读存储介质的更具体示例的非穷举列表包括以下：便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式光盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、诸如上面记录有指令的打孔卡或凹槽中的凸起结构的机械编码装置，以及上述的任何适当组合。如本文所使用的计算机可读存储介质不应被解释为暂时性信号本身，诸如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如，通过光纤线缆的光脉冲)、或通过导线传输的电信号。

本文描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理设备，或者经由网络，例如因特网、局域网、广域网和/或无线网络，下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或网络接口从网络接收计算机可读程序指令，并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。

用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路的配置数据，或者以一种或多种编程语言(包括面向对象的编程语言，例如Smalltalk、C++等)和过程编程语言(例如“C”编程语言或类似的编程语言)的任何组合编写的源代码或目标代码。计算机可读程序指令可以完全在用户的计算机上执行，部分在用户的计算机上执行，作为独立的软件包执行，部分在用户的计算机上并且部分在远程计算机上执行，或者完全在远程计算机或服务器上执行。在后一种情况下，远程计算机可以通过任何类型的网络连接到用户的计算机，包括局域网(LAN)或广域网(WAN)，或者可以连接到外部计算机(例如，使用因特网服务提供商通过因特网)。在一些实施例中，为了执行本发明的各方面，包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以使电子电路个性化。

在此参考根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明的各方面。将理解，流程图和/或框图的每个框以及流程图和/或框图中的框的组合可以由计算机可读程序指令来实现。

这些计算机可读程序指令可以被提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器，使得经由计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图的一个或多个框中指定的功能/动作的装置。这些计算机可读程序指令还可以存储在计算机可读存储介质中，其可以引导计算机、可编程数据处理装置和/或其他设备以特定方式工作，使得其中存储有指令的计算机可读存储介质包括制品，该制品包括实现流程图和/或框图的一个或多个框中指定的功能/动作的方面的指令。

计算机可读程序指令还可以被加载到计算机、其他可编程数据处理装置或其他设备上，以使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤，以产生计算机实现的过程，使得在计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图的一个或多个框中指定的功能/动作。

附图中的流程图和框图示出了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。在这点上，流程图或框图中的每个框可以表示指令的模块、段或子集，其包括用于实现指定的逻辑功能的一个或多个可执行指令。在一些替代实施方案中，框中所注明的功能可不按图中所注明的次序发生。例如，连续示出的两个框实际上可以基本上同时执行，或者这些框有时可以以相反的顺序执行，这取决于所涉及的功能。还将注意，框图和/或流程图图示的每个框以及框图和/或流程图图示中的框的组合可以由执行指定功能或动作或执行专用硬件和计算机指令的组合的专用的基于硬件的系统来实现。

虽然可以理解，可以通过经由加载诸如CD、DVD等的存储介质而将处理软件(例如，存储在图8的指令860中的任何指令和/或被配置为执行关于图3-5描述的方法的任何部分和/或实现图1-2和/或6-7中讨论的功能的任何部分的任何软件)直接手动加载到客户端、服务器和代理计算机中来部署处理软件，但是也可以通过将处理软件发送到中央服务器或一组中央服务器而将处理软件自动或半自动地部署到计算机系统中。然后，将处理软件下载到将执行处理软件的客户端计算机中。或者，经由电子邮件直接发送处理软件到客户端系统。然后，通过执行将处理软件分离到目录中的一组程序指令，将处理软件分离到目录中或加载到目录中。另一种替换是将处理软件直接发送到客户端计算机硬盘驱动器上的目录。当存在代理服务器时，该过程将选择代理服务器代码，确定将代理服务器的代码放置在哪些计算机上，传送代理服务器代码，然后将代理服务器代码安装在代理计算机上。处理软件将被发送到代理服务器，然后它将被存储在代理服务器上。

本发明的实施例还可以作为与客户公司、非盈利组织、政府实体、内部组织结构等的服务约定的一部分来交付。这些实施例可以包括配置计算机系统以执行，以及部署实现本文描述的方法中的一些或全部的软件、硬件和web服务。这些实施例还可以包括分析客户端的操作、响应于分析创建推荐、构建实现推荐的子集的系统、将系统集成到现有过程和基础设施中、计量系统的使用、向系统的用户分配费用、以及开账单、开发票(例如，生成发票)、或者以其他方式接收对系统的使用的支付。

本文所使用的术语仅用于描述特定实施例的目的，且不旨在限制各种实施例。如本文所用，除非上下文另有明确指示外，单数形式“一”、“一个”和“该”旨在也包括复数形式。还将理解，术语“包括”和/或“包含”在本说明书中使用时，指定所陈述的特征、整数、步骤、操作、元件和/或组件的存在，但不排除一个或多个其它特征、整数、步骤、操作、元件、组件和/或其群组的存在或添加。在各种实施例的示例实施例的先前详细描述中，参考了附图(其中相同的标号表示相同的元件)，附图形成了本发明的一部分，并且其中通过图示示出了其中可以实践各种实施例的特定示例实施例。足够详细地描述这些实施例以使本领域技术人员能够实践这些实施例，但是也可以使用其他实施例，并且可以在不偏离各种实施例的范围的情况下做出逻辑、机械、电气和其他改变。在之前的描述中，阐述了许多具体细节以提供对各种实施例的透彻理解。但是，没有这些具体细节也可以实现各种实施例。在其它实例中，为了不使实施例模糊，没有详细示出公知的电路、结构和技术。

在本说明书中使用的词语“实施例”的不同实例不一定是指相同的实施例，但是它们可以是指相同的实施例。在此示出或描述的任何数据和数据结构仅是示例，并且在其他实施例中，可以使用不同的数据量、数据类型、字段的数量和类型、字段名、行的数量和类型、记录、条目或数据的组织。此外，任何数据都可以与逻辑组合，从而可以不需要单独的数据结构。因此，前面的详细描述不应被理解为限制性的。

已经出于说明的目的呈现了对本公开的各种实施例的描述，但是其并非旨在是穷举的或限于所公开的实施例。在不背离所描述的实施例的范围和精神的情况下，许多修改和变化对于本领域的普通技术人员将是显而易见的。选择本文所使用的术语以最好地解释实施例的原理、实际应用或对市场上存在的技术改进，或使本领域的其他普通技术人员能够理解本文所公开的实施例。

尽管已经根据具体实施例描述了本公开，但是可以预期，其改变和修改对于本领域技术人员将变得显而易见。因此，所附权利要求旨在被解释为覆盖落入本公开的真实精神和范围内的所有这样的变更和修改。

本公开中讨论的任何优点是示例优点，并且可以存在本公开的实施例，其实现所讨论的优点中的所有、一些优点或者不实现任何优点，同时保持在本公开的精神和范围内。

下文提供非限制性的实施例列表以说明本公开的一些方面。示例1是计算机实现的方法。将新数据样本输入到故障预测模型，其中，使用标记的历史数据集来训练故障预测模型，其中，相应的数据点与回顾窗口和预测时域相关联以创建相应的训练样本，其中，相应的训练样本被聚类在多个集群中，并且其中，多个集群各自与常态分数和异常分数相关联；以及基于将多个集群中的包括新数据样本的第一集群的第一异常分数与多个集群中的具有大于异常分数的常态分数的集群的平均异常分数进行比较而输出与新数据样本相关联的分类。

示例2包括示例1的方法，包括或排除可选特征。在该示例中，分类指示与新数据样本相关联的资产的与磨损相关的性能退化的可能性。

示例3包括示例1至2中任一项的方法，包括或排除可选特征。在该示例中，回顾窗口定义要包括在每个相应的训练样本中的顺序地在前的数据点的数量。

示例4包括示例1至3中任一项的方法，包括或排除可选特征。在该示例中，预测时域定义了未来的预定义时间量，并且其中，未来的预定义时间量的相应的数据点的相应的标签与相应的训练样本相关联。

示例5包括示例1至4中任一项的方法，包括或排除可选特征。在该示例中，使用K均值聚类来聚类相应的训练样本。

示例6包括示例1至5中任一项的方法，包括或排除可选特征。在该示例中，该方法由故障预测系统根据从远程数据处理系统下载到故障预测系统的软件来执行。可选地，方法还包括：计量软件的使用；以及基于计量使用来生成发票。

示例7是系统。该系统包括一个或多个处理器；以及存储程序指令的一个或多个计算机可读存储介质，程序指令在由一个或多个处理器执行时被配置为使得一个或多个处理器执行一种方法，方法包括：将新数据样本输入到故障预测模型，其中，使用标记的历史数据集来训练故障预测模型，其中，相应的数据点与回顾窗口和预测时域相关联以创建相应的训练样本，其中，相应的训练样本被聚类在多个集群中，并且其中，多个集群各自与常态分数和异常分数相关联；以及基于将多个集群中的包括新数据样本的第一集群的第一异常分数与多个集群中具有大于异常分数的常态分数的集群的平均异常分数进行比较，输出与新数据样本相关联的分类。

示例8包括示例7的系统，包括或排除可选特征。在该示例中，分类指示与新数据样本相关联的资产的与磨损相关的性能退化的可能性。

示例9包括示例7至8中任一项的系统，包括或排除可选特征。在该示例中，回顾窗口定义要包括在每个相应的训练样本中的顺序地在前的数据点的数量。

示例10包括示例7至9中的任一项的系统，包括或排除可选特征。在该示例中，预测时域定义未来的预定义时间量，并且其中，未来的预定义时间量的相应的数据点的相应的标签与相应的训练样本相关联。

示例11包括示例7至10中任一项的系统，包括或排除可选特征。在该示例中，使用K均值聚类来聚类相应的训练样本。

示例12是计算机程序产品。计算机程序产品包括一个或多个计算机可读存储介质，以及共同存储在一个或多个计算机可读存储介质上的程序指令，程序指令包括被配置为使一个或多个处理器执行方法的指令，方法包括将新数据样本输入到故障预测模型，其中，使用标记的历史数据集来训练故障预测模型，其中，相应的数据点与回顾窗口和预测时域相关联以创建相应的训练样本，其中，相应的训练样本被聚类在多个集群中，并且其中，多个集群各自与常态分数和异常分数相关联；以及基于将多个集群中的包括新数据样本的第一集群的第一异常分数与多个集群中具有大于异常分数的常态分数的集群的平均异常分数进行比较，输出与新数据样本相关联的分类。

示例13包括示例12的计算机程序产品，包括或排除可选特征。在该示例中，分类指示与新数据样本相关联的资产的与磨损相关的性能退化的可能性。

示例14包括示例12至13中的任一项的计算机程序产品，包括或排除可选特征。在该示例中，回顾窗口定义要包括在每个相应训练样本中的顺序地在前的数据点的数量。

示例15包括示例12至14中的任一项的计算机程序产品，包括或排除可选特征。在该示例中，预测时域定义未来的预定义时间量，并且其中，未来的预定义时间量的相应的数据点的相应的标签与相应的训练样本相关联。

示例16包括示例12至15中的任一项的计算机程序产品，包括或排除可选特征。在该示例中，使用K均值聚类来聚类相应的训练样本。

示例17是一种用于预测螺杆泵(PCP)的磨损相关劣化的计算机实现的方法，方法包括将PCP的新数据样本输入到被配置为预测PCP的磨损相关劣化的模型，其中，模型是使用标记的历史PCP数据集来训练的，其中，相应的数据点与回顾窗口和预测时域相关联以创建相应的训练样本，其中，相应的训练样本被聚类在多个集群中，并且其中，多个集群各自与常态分数和异常分数相关联；以及基于将多个集群中的包括新数据样本的第一集群的第一异常分数与多个集群中的具有大于异常分数的常态分数的集群的平均异常分数进行比较，输出与新数据样本相关联的分类，其中，分类指示PCP的与磨损相关的劣化。

示例18是一种用于预测螺杆泵(PCP)的磨损相关劣化的计算机实现的方法，该方法包括通过执行与一个或多个PCP相关联的历史数据的二进制标记来生成标记的历史数据；通过将回顾窗口和预测时域应用于标记的历史数据的相应的数据点来生成多个训练数据样本；将多个训练数据样本聚类成多个集群；计算多个集群中的相应集群的集群分数；将PCP的新数据样本分配给多个集群中的第一集群；以及基于与第一集群相关联的集群分数向新数据样本分配分类，其中该分类指示PCP的未来磨损相关的劣化的可能性。

示例19包括示例18的方法，包括或排除可选特征。在该示例中，在已知的泵更换日期之前的预定时间段内，将标记的历史数据标记为有故障的。

示例20包括示例18至19中任一项的方法，包括或排除可选特征。在该示例中，标记的历史数据包括泵速数据、泵扭矩数据、套管压力数据、生产率数据和维护记录。

示例21包括示例18至20中任一项的方法，包括或排除可选特征。在该示例中，计算相应的集群的集群分数还包括：计算第一集群的常态分数，其中，常态分数是与第一集群中的正常状态相关联的训练数据样本的第一比例除以与多个训练数据样本中的正常状态相关联的训练数据样本的第二比例；以及计算第一集群的异常分数，其中，异常分数是与第一集群中的劣化状态相关联的训练数据样本的第三比例除以与多个训练数据样本中的劣化状态相关联的训练数据样本的第四比例。可选地，分类是基于第一集群的常态分数或异常分数中的更大值的。

示例22包括示例18至21中任一项的方法，包括或排除可选特征。在该示例中，该方法包括生成新数据样本的故障信号，其中，故障信号包括新数据样本在预定数量的先前数据点上的平均异常分数。可选地，生成故障信号还包括：计算多个集群中具有大于异常分数的常态分数的集群的平均异常分数；对于预定数量的先前的数据点中的每一个，将一值与第一集群中的具有大于平均异常分数的异常分数的数据点相关联，并且将零值与第一集群中的具有小于平均异常分数的异常分数的数据点相关联；以及将故障信号计算为与预定数量的先前数据点中的每一个相关联的一值和零值的平均值。

Claims

1.一种计算机实现的方法，包括：

将新数据样本输入到故障预测模型，其中，使用标记的历史数据集来训练所述故障预测模型，其中，相应的数据点与回顾窗口和预测时域相关联以创建相应的训练样本，其中，所述相应的训练样本被聚类在多个集群中，并且其中，所述多个集群各自与常态分数和异常分数相关联；以及

基于将所述多个集群中的包括所述新数据样本的第一集群的第一异常分数与所述多个集群中的具有大于所述异常分数的所述常态分数的集群的平均异常分数进行比较，输出与所述新数据样本相关联的分类。

2.根据权利要求1所述的方法，其中，所述分类指示与所述新数据样本相关联的资产的与磨损相关的性能退化的可能性。

3.根据权利要求1所述的方法，其中，所述回顾窗口定义要包括在每个相应的训练样本中的顺序地先前的数据点的数量。

4.根据权利要求1所述的方法，其中，所述预测时域定义未来的预定义时间量，并且其中，所述未来的预定义时间量的相应的数据点的相应的标签与所述相应的训练样本相关联。

5.根据权利要求1所述的方法，其中，使用K均值聚类对所述相应的训练样本进行聚类。

6.根据权利要求1所述的方法，其中，所述方法由故障预测系统根据从远程数据处理系统下载到所述故障预测系统的软件来执行。

7.根据权利要求6所述的方法，其中，所述方法进一步包括：

计量所述软件的使用；以及

基于计量所述使用来生成发票。

8.根据权利要求1所述的方法，其中，所述方法用于预测螺杆泵(PCP)的磨损相关的劣化，其中，所述输入步骤包括将PCP的新数据样本输入到被配置为预测所述PCP的磨损相关的劣化的模型，其中，使用标记的历史PCP数据集来训练所述模型，并且其中，在所述输出步骤期间输出的所述分类指示所述PCP的与磨损相关的劣化。

9.根据权利要求8所述的方法，包括：

通过执行与一个或多个PCP相关联的历史数据的二进制标记来生成所标记的历史数据，其中，通过将回顾窗口和预测时域应用于所述标记的历史数据的相应的数据点来创建所述多个训练数据样本，其中，所述方法包括：

计算为所述多个集群中的相应的集群计算的集群分数，所述集群分数是所述常态分数和所述异常分数；

将PCP的所述新数据样本分配到所述多个集群中的第一集群；以及

基于与所述第一集群相关联的集群分数来向所述新数据样本分配分类。

10.根据权利要求9所述的方法，其中，所述标记的历史数据在已知的泵更换日期之前的预定时间段内被标记为有故障的。

11.根据权利要求9所述的方法，其中，所述标记的历史数据包括泵速数据、泵扭矩数据、套管压力数据、生产率数据和维护记录。

12.根据权利要求9所述的方法，其中，计算所述相应的集群的所述集群分数还包括：

计算所述第一集群的常态分数，其中，所述常态分数是所述第一集群中与正常状态相关联的训练数据样本的第一比例除以所述多个训练数据样本中与所述正常状态相关联的训练数据样本的第二比例；以及

计算所述第一集群的异常分数，其中，所述异常分数是所述第一集群中与劣化状态相关联的训练数据样本的第三比例除以所述多个训练数据样本中与所述劣化状态相关联的训练数据样本的第四比例。

13.根据权利要求12所述的方法，其中，所述分类是基于所述第一集群的所述常态分数或所述异常分数中的更大值的。

14.根据权利要求9所述的方法，所述方法还包括：

生成所述新数据样本的故障信号，其中，所述故障信号包括在预定数量的先前的数据点上所述新数据样本的平均异常分数。

15.根据权利要求14所述的方法，其中，生成所述故障信号还包括：

计算所述多个集群中具有大于异常分数的常态分数的集群的平均异常分数；

对于所述预定数量的先前的数据点中的每一个，将一值与所述第一集群中具有大于所述平均异常分数的异常分数的数据点相关联，并且将零值与所述第一集群中具有小于所述平均异常分数的异常分数的数据点相关联；以及

将所述故障信号计算为与所述预定数量的先前的数据点中的每一个相关联的所述一值和零值的平均值。

16.一种系统，包括：

一个或多个处理器；以及

一个或多个存储程序指令的计算机可读存储介质，所述程序指令在由所述一个或多个处理器执行时被配置为使得所述一个或多个处理器执行一种方法，所述方法包括：

17.根据权利要求16所述的系统，其中，所述分类指示与所述新数据样本相关联的资产的与磨损相关的性能退化的可能性。

18.根据权利要求16所述的系统，其中，所述回顾窗口定义要包括在每个相应的训练样本中的顺序地先前的数据点的数量。

19.根据权利要求16所述的系统，其中，所述预测时域定义未来的预定义时间量，并且其中，所述未来的预定义时间量的相应的数据点的相应标签与所述相应的训练样本相关联。

20.根据权利要求16所述的系统，其中，使用K均值聚类对所述相应的训练样本进行聚类。

21.一种计算机程序产品，包括一个或多个计算机可读存储介质以及共同存储在所述一个或多个计算机可读存储介质上的程序指令，所述程序指令包括被配置为使得一个或多个处理器执行一种方法的指令，所述方法包括：

22.根据权利要求21所述的计算机程序产品，其中，所述分类指示与所述新数据样本相关联的资产的磨损相关的性能退化的可能性。

23.根据权利要求21所述的计算机程序产品，其中，所述回顾窗口定义要包括在每个相应的训练样本中的顺序地先前的数据点的数量。

24.根据权利要求21所述的计算机程序产品，其中，所述预测时域定义未来的预定义时间量，并且其中，所述未来的预定义时间量的相应的数据点的相应标签与所述相应的训练样本相关联。

25.根据权利要求21所述的计算机程序产品，其中，使用K均值聚类对所述相应的训练样本进行聚类。

26.一种用于预测螺杆泵(PCP)的磨损相关的劣化的计算机实现的方法，所述方法包括：

将PCP的新数据样本输入到被配置为预测所述PCP的磨损相关的劣化的模型，其中，使用标记的历史PCP数据集来训练所述模型，其中，相应的数据点与回顾窗口和预测时域相关联以创建相应训练样本，其中，所述相应的训练样本被聚类在多个集群中，并且其中，所述多个集群各自与常态分数和异常分数相关联；以及

基于将所述多个集群中的包括所述新数据样本的第一集群的第一异常分数与所述多个集群中的具有大于所述异常分数的所述常态分数的集群的平均异常分数进行比较，输出与所述新数据样本相关联的分类，其中，所述分类指示所述PCP的所述磨损相关的劣化。

27.一种用于预测螺杆泵(PCP)的磨损相关劣化的计算机实现的方法，所述方法包括：

通过执行与一个或多个PCP相关联的历史数据的二进制标记来生成标记的历史数据；

通过将回顾窗口和预测时域应用于所述标记的历史数据的相应的数据点来生成多个训练数据样本；

将所述多个训练数据样本聚类成多个集群；

计算所述多个集群中的相应的集群的集群分数；

将PCP的新数据样本分配给所述多个集群中的第一集群；以及

基于与所述第一集群相关联的集群分数向所述新数据样本分配分类，其中，所述分类指示所述PCP的未来磨损相关的劣化的可能性。

28.根据权利要求27所述的方法，其中，所述标记的历史数据在已知的泵更换日期之前的预定时间段内被标记为有故障的。

29.根据权利要求27所述的方法，其中，所述标记的历史数据包括泵速数据、泵扭矩数据、套管压力数据、生产率数据和维护记录。

30.根据权利要求27所述的方法，其中，计算所述相应的集群的所述集群分数进一步包括：

31.根据权利要求30所述的方法，其中，所述分类是基于所述第一集群的所述常态分数或所述异常分数中的更大值的。

32.根据权利要求27所述的方法，所述方法进一步包括：

33.根据权利要求32所述的方法，其中，生成所述故障信号还包括：

34.一种计算机程序，包括程序代码装置，当所述程序在计算机上运行时，所述程序代码装置适于执行根据权利要求1至15和权利要求26至33中任一项所述的方法。