CN110874601A

CN110874601A - 识别设备运行状态的方法、状态识别模型训练方法及装置

Info

Publication number: CN110874601A
Application number: CN201810994762.6A
Authority: CN
Inventors: 袁敏
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2018-08-29
Filing date: 2018-08-29
Publication date: 2020-03-10
Anticipated expiration: 2038-08-29
Also published as: CN110874601B

Abstract

本说明书一个或多个实施例提供一种识别设备运行状态的方法、状态识别模型训练方法及装置，该识别设备运行状态的方法可以包括：根据目标设备的运行状态时序数据包含的拐点，将所述运行状态时序数据沿所述拐点划分为多个待识别子序列；生成待识别特征集合，所述待识别特征集合包括分别对应于各个待识别子序列的待识别特征；将所述待识别特征集合输入至状态识别模型，所述状态识别模型的训练样本集合包括分别对应于各个历史子序列的样本特征，其中所述历史子序列由历史运行状态时序数据基于所包含的拐点进行划分得到；根据所述状态识别模型的输出结果，确定所述目标设备的运行状态。

Description

识别设备运行状态的方法、状态识别模型训练方法及装置

技术领域

本说明书一个或多个实施例涉及数据处理技术领域，尤其涉及一种识别设备运行状态的方法、状态识别模型训练方法及装置。

背景技术

在工业领域，设备的运行状态属于生产过程中极为复杂的环节，同时也是对生产结果影响最大的环节。当然，除了工业领域之外，在基于设备运行实现相关功能的其他领域中，设备的运行状态同样至关重要。因此，需要通过对设备的运行状态进行监控，以确保识别出设备的运行状态是否为正常状态或异常状态。

发明内容

有鉴于此，本说明书一个或多个实施例提供一种识别设备运行状态的方法、状态识别模型训练方法及装置。

为实现上述目的，本说明书一个或多个实施例提供技术方案如下：

根据本说明书一个或多个实施例的第一方面，提出了一种识别设备运行状态的方法，包括：

根据目标设备的运行状态时序数据包含的拐点，将所述运行状态时序数据沿所述拐点划分为多个待识别子序列；

生成待识别特征集合，所述待识别特征集合包括分别对应于各个待识别子序列的待识别特征；

将所述待识别特征集合输入至状态识别模型，所述状态识别模型的训练样本集合包括分别对应于各个历史子序列的样本特征，其中所述历史子序列由历史运行状态时序数据基于所包含的拐点进行划分得到；

根据所述状态识别模型的输出结果，确定所述目标设备的运行状态。

根据本说明书一个或多个实施例的第二方面，提出了一种状态识别模型训练方法，包括：

根据设备的历史运行状态时序数据包含的拐点，将所述历史运行状态时序数据沿所述拐点划分为多个历史子序列；

生成训练样本集合，所述训练样本集合包括分别对应于各个历史子序列的样本特征；

对所述训练样本集合进行模型训练，得到状态识别模型。

根据本说明书一个或多个实施例的第三方面，提出了一种识别设备运行状态的装置，包括：

划分单元，根据目标设备的运行状态时序数据包含的拐点，将所述运行状态时序数据沿所述拐点划分为多个待识别子序列；

生成单元，生成待识别特征集合，所述待识别特征集合包括分别对应于各个待识别子序列的待识别特征；

输入单元，将所述待识别特征集合输入至状态识别模型，所述状态识别模型的训练样本集合包括分别对应于各个历史子序列的样本特征，其中所述历史子序列由历史运行状态时序数据基于所包含的拐点进行划分得到；

确定单元，根据所述状态识别模型的输出结果，确定所述目标设备的运行状态。

根据本说明书一个或多个实施例的第四方面，提出了一种状态识别模型训练装置，包括：

划分单元，根据设备的历史运行状态时序数据包含的拐点，将所述历史运行状态时序数据沿所述拐点划分为多个历史子序列；

生成单元，生成训练样本集合，所述训练样本集合包括分别对应于各个历史子序列的样本特征；

训练单元，对所述训练样本集合进行模型训练，得到状态识别模型。

附图说明

图1是一示例性实施例提供的一种状态识别系统的架构示意图。

图2是一示例性实施例提供的一种识别设备运行状态的方法的流程图。

图3是一示例性实施例提供的一种状态识别模型训练方法的流程图。

图4是一示例性实施例提供的一种训练状态识别模型的示意图。

图5是一示例性实施例提供的一种通过状态识别模型对目标设备的运行状态进行识别的示意图。

图6是一示例性实施例提供的一种设备的结构示意图。

图7是一示例性实施例提供的一种识别设备运行状态的装置的框图。

图8是一示例性实施例提供的另一种设备的结构示意图。

图9是一示例性实施例提供的一种状态识别模型训练装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。

需要说明的是：在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中，其方法所包括的步骤可以比本说明书所描述的更多或更少。此外，本说明书中所描述的单个步骤，在其他实施例中可能被分解为多个步骤进行描述；而本说明书中所描述的多个步骤，在其他实施例中也可能被合并为单个步骤进行描述。

在一实施例中，本说明书的状态识别方案可以应用于电子设备中，例如该电子设备可以包括手机、平板设备、笔记本电脑、PC、掌上电脑(PDAs，Personal DigitalAssistants)、可穿戴设备(如智能眼镜、智能手表等)等任意类型，本说明书并不对此进行限制。在运行过程中，该电子设备可以训练得到状态识别模型，并通过该状态识别模型对目标设备进行识别，以确定该目标设备所处的运行状态。

图1是一示例性实施例提供的一种状态识别系统的架构示意图。如图1所示，该系统可以包括目标设备11、传感器12、PC13、服务器14和网络15。

目标设备11为本说明书中需要被识别其运行状态的设备，比如该目标设备11可以为工业生产中的生产设备、主机集群中的主机设备等，本说明书并不对此进行限制。目标设备11上装配有传感器12，该传感器12可以为目标设备11原生携带或独立安装至目标设备11上，以采集该目标设备11用于表征其运行状态的时序数据，即下文所述的运行状态时序数据。

PC13为本说明书中可以使用的一种类型的设备。实际上，显然还可以使用诸如下述类型的设备：平板设备、笔记本电脑、掌上电脑(PDAs，Personal Digital Assistants)、可穿戴设备(如智能眼镜、智能手表等)等，本说明书一个或多个实施例并不对此进行限制。在运行过程中，该PC13上可以运行某一应用的客户端侧的程序，以实现为该应用的客户端，该客户端可以通过状态识别模型对目标设备11的运行状态时序数据进行处理，以识别出该目标设备11的运行状态。

服务器14可以为包含一独立主机的物理服务器，或者该服务器14可以为主机集群承载的虚拟服务器。在运行过程中，服务器14可以运行某一应用的服务器侧的程序，以实现为该应用的服务端，该服务端可以将历史数据作为训练样本而训练得到上述的状态识别模型，以供客户端对目标设备11的运行状态进行识别。

而对于PC13与服务器14之间进行交互的网络15，可以包括多种类型的有线或无线网络。在一实施例中，该网络15可以包括公共交换电话网络(Public Switched TelephoneNetwork，PSTN)和因特网。

图2是一示例性实施例提供的一种识别设备运行状态的方法的流程图。如图2所示，该方法应用于电子设备，可以包括以下步骤：

步骤202，根据目标设备的运行状态时序数据包含的拐点，将所述运行状态时序数据沿所述拐点划分为多个待识别子序列。

在一实施例中，运行过程中的目标设备在预设维度上的数据可以在一定程度上反馈出该目标设备的运行状态，比如该运行状态可以包括正常状态或异常状态、高效状态或低效状态等。其中，预设维度可以包括温度、湿度、压力、加速度等中的一个或多个，这取决于所面临的目标设备的类型、生产场景的差异等，本说明书并不对此进行限制。

在一实施例中，通过在上述预设维度上对运行过程中的目标设备实施连续的数据采集，譬如按照2秒一次进行周期性采集，可以在每一维度上分别得到按照采集时刻依次排列的一组数据，即上述的运行状态时序数据。

在一实施例中，通过将运行状态时序数据沿拐点(或称，变点)进行划分为若干待识别子序列，而非采用固定步长的时间窗口进行划分，使得对子序列的划分更加符合于该目标设备的实际运行状况，有助于提升对运行状态的识别准确度。其中，可以通过相关技术中的任意拐点探测或变点检测算法确定出上述拐点，比如CUSUM算法等，本说明书并不对此进行限制。

在一实施例中，每一待识别子序列中分别包含在若干时刻对目标设备采集到的参数值；其中，在对运行状态时序数据进行划分的过程中，可以确保得到的待识别子序列所包含的参数值的数量不小于预设阈值，以避免待识别子序列所包含的数据量过小而无法完整、准确地表达出目标设备的运行状态。该预设阈值的取值可以根据实际场景进行设置和调节，本说明书并不对此进行限制。

在一实施例中，运行状态时序数据可以经历一些预处理操作，比如数据清洗、数据转换、数据归一化等，本说明书并不对此进行限制。其中，当所述运行状态时序数据存在数据缺失时，可以对缺失数据进行填充；例如，可以采用前一相邻数据的取值；又例如，可以采用相邻数据的中心差值(前一相邻数据和后一相邻数据的均值)对缺失数据进行填充。

步骤204，生成待识别特征集合，所述待识别特征集合包括分别对应于各个待识别子序列的待识别特征。

在一实施例中，根据各个待识别子序列所包含的数据(参数值等)，可以生成相应的待识别特征，该待识别特征可以作为状态识别模型的输入特征，用于识别目标设备的运行状态。其中，该待识别特征的特征维度、特征类型等取决于状态识别模型在训练过程中采用的样本特征。

在一实施例中，当所述样本特征包括：对相应的历史子序列所包含的数据进行统计得到的统计特征时，所述待识别特征包括：对相应的待识别子序列所包含的数据进行统计得到的统计特征。例如，该统计特征可以包括以下至少之一：平均值、中位数、标准差等，本说明书并不对此进行限制。

在一实施例中，当所述样本特征包括：相应的历史子序列与其他历史子序列之间的时序关系时，所述待识别特征包括：相应的待识别子序列与其他待识别子序列之间的时序关系。例如，当样本特征中的时序关系为每一历史子序列对应的前一历史子序列时，待识别特征中的时序关系可以为每一待识别子序列对应的前一待识别子序列；又例如，当样本特征中的时序关系为每一历史子序列对应的后一历史子序列时，待识别特征中的时序关系可以为每一待识别子序列对应的后一待识别子序列。因此，当状态识别模型对目标设备在任一待识别子序列对应的时间段中所处的运行状态进行识别时，不仅参考该任一待识别子序列对应的待识别特征，还可以参考相邻或靠近的其他待识别子序列对应的待识别特征，以提升对运行状态的识别准确度；类似地，也可以在模型训练过程中，对状态识别模型进行更为充分的训练，同样有助于提升对运行状态的识别准确度。

在一实施例中，当所述样本特征包括：对相应的历史子序列所包含的数据进行定量递归分析(Recurrence Quantification Analysis，RQA)计算得到的统计属性参数特征时，所述待识别特征包括：对相应的待识别子序列所包含的数据进行定量递归分析计算得到的统计属性参数特征。例如，该统计属性参数特征(即RQA特征)可以包括以下至少之一：递归率、确定率、仙农熵、最长对角线因子、趋势等，本说明书并不对此进行限制。通过引入RQA特征，可以对运行状态时序数据的随机性、混沌性、周期性的特征指标进行量化，并使其参与到对状态识别模型的训练过程中，能够使得状态识别模型得到更为充分的训练，因而在基于状态识别模型对待识别特征进行处理后，有助于提升对目标设备的运行状态的识别准确度。

步骤206，将所述待识别特征集合输入至状态识别模型，所述状态识别模型的训练样本集合包括分别对应于各个历史子序列的样本特征，其中所述历史子序列由历史运行状态时序数据基于所包含的拐点进行划分得到。

在一实施例中，训练样本集合可以来源于目标设备或与该目标设备同类的其他设备在历史时刻产生的历史运行状态时序数据。通过对历史运行状态时序数据进行拐点探测，并基于探测到的拐点将其划分为若干历史子序列，从而可以针对各个历史子序列所包含的数据而生成相应的样本特征。

在一实施例中，所述样本特征可以被标记了对应的设备历史运行状态，以通过有监督训练的方式得到上述的状态识别模型。当历史运行状态时序数据来源于某一台或多台设备时，由于已知该设备在历史时刻的真实运行状态，因而可以对各个历史子序列或其对应的样本特征标记相应的设备历史运行状态，并据此实施对状态识别模型的有监督训练。当然，在其他实施例中，也可以不对样本特征标记对应的设备历史运行状态，从而通过无监督训练的方式得到上述的状态识别模型，本说明书并不对此进行限制。

步骤208，根据所述状态识别模型的输出结果，确定所述目标设备的运行状态。

在一实施例中，状态识别模型的输出结果可以包括：目标设备在各个待识别子序列对应的时间段中处于异常状态的概率(即异常概率)；那么，可以从该状态识别模型分别针对各个待识别子序列输出的异常概率中，确定出最大异常概率，从而当所述最大异常概率达到预设阈值时，确定所述目标设备的运行状态为异常状态，当所述最大异常概率未达到所述预设阈值时，确定所述目标设备的运行状态为正常状态。

在一实施例中，上述各个待识别子序列分别对应的异常概率可以为状态识别模型的中间处理数据，该状态识别模型可以在处理过程中选取上述的最大异常概率，并将其作为输出结果进行输出。因此，可以基于该输出结果与预设阈值之间的数值关系，确定目标设备的运行状态。

在一实施例中，上述各个待识别子序列分别对应的异常概率可以为状态识别模型的中间处理数据，该状态识别模型可以在处理过程中选取上述的最大异常概率，并将该最大异常概率与预设阈值进行比较，而基于该最大异常概率与预设阈值之间的数值关系，该状态识别模型的输出结果可以为目标设备的运行状态，如正常状态或异常状态。

图3是一示例性实施例提供的一种状态识别模型训练方法的流程图。如图3所示，该方法应用于电子设备，可以包括以下步骤：

步骤302，根据设备的历史运行状态时序数据包含的拐点，将所述历史运行状态时序数据沿所述拐点划分为多个历史子序列。

在一实施例中，当同一类型的不同设备在运行过程中的生产环境相同或相近、无需对不同设备进行区分时，训练样本集合可以来源于该类型的一台或多台设备在历史时刻产生的历史运行状态时序数据；相应地，训练得到的状态识别模型可以对该类型的任意设备进行状态识别。

在一实施例中，当同一类型的不同设备在运行过程中的生产环境差异较大、需要对不同设备进行区分时，训练样本集合应当来源于某一台设备在历史时刻产生的历史运行状态时序数据；相应地，训练得到的状态识别模型仅用于针对这台设备进行状态识别，即不同设备需要分别训练出一一对应的状态识别模型、不可相互替代。

在一实施例中，历史运行状态时序数据包括在预设维度上的、可以在一定程度上反馈出相关设备的运行状态的数据；其中，预设维度可以包括温度、湿度、压力、加速度等中的一个或多个，这取决于所面临的目标设备的类型、生产场景的差异等，本说明书并不对此进行限制。

在一实施例中，通过在上述预设维度上对运行过程中的设备实施连续的数据采集，譬如按照2秒一次进行周期性采集，可以在每一维度上分别得到按照采集时刻依次排列的一组数据，即上述的历史运行状态时序数据。在状态识别模型被应用于对目标设备进行状态识别时，需要对该目标设备进行采集得到运行状态时序数据，此时采用的采集周期可以与历史运行状态时序数据的采集周期相同；当然，在一些情况下上述的采集周期也可以不同，本说明书并不对此进行限制。

在一实施例中，通过对历史运行状态时序数据进行拐点探测，并基于探测到的拐点将其划分为若干历史子序列，从而可以针对各个历史子序列所包含的数据而生成相应的样本特征。由于沿拐点(或称，变点)划分得到相应的历史子序列，而非采用固定步长的时间窗口进行划分，使得对历史子序列的划分更加符合于相关设备(产生该历史运行状态时序数据的设备)的实际运行状况，可使状态识别模型得到充分训练，有助于提升对运行状态的识别准确度。其中，可以通过相关技术中的任意拐点探测或变点检测算法确定出上述拐点，比如CUSUM算法等，本说明书并不对此进行限制。

在一实施例中，每一历史子序列中分别包含在若干时刻对相关设备采集到的参数值；其中，在对历史运行状态时序数据进行划分的过程中，可以确保得到的历史子序列所包含的参数值的数量不小于预设阈值，以避免历史子序列所包含的数据量过小而无法完整、准确地表达出相关设备的运行状态。该预设阈值的取值可以根据实际场景进行设置和调节，本说明书并不对此进行限制。在状态识别模型被应用于对目标设备进行状态识别时，需要对该目标设备产生的运行状态时序数据进行划分，可以基于上述的预设阈值对划分得到的待识别子序列所包含的参数值的数量进行限制；当然，在一些情况下也可以采用其他阈值对待识别子序列所包含的参数值的数量进行限制，本说明书并不对此进行限制。

在一实施例中，历史运行状态时序数据可以经历一些预处理操作，比如数据清洗、数据转换、数据归一化等，本说明书并不对此进行限制。其中，当所述历史运行状态时序数据存在数据缺失时，可以对缺失数据进行填充；例如，可以采用前一相邻数据的取值；又例如，可以采用相邻数据的中心差值(前一相邻数据和后一相邻数据的均值)对缺失数据进行填充。

步骤304，生成训练样本集合，所述训练样本集合包括分别对应于各个历史子序列的样本特征。

在一实施例中，所述样本特征可以包括：对相应的历史子序列所包含的数据进行统计得到的统计特征，比如该统计特征可以包括以下至少之一：平均值、中位数、标准差等，本说明书并不对此进行限制。相应地，在训练得到的状态识别模型被用于对目标设备的运行状态进行识别时，向状态识别模型输入的待识别特征可以包括：对相应的待识别子序列所包含的数据进行统计得到的统计特征。

在一实施例中，所述样本特征可以包括：相应的历史子序列与其他历史子序列之间的时序关系，比如每一历史子序列对应的前一历史子序列或每一历史子序列对应的后一历史子序列等，本说明书并不对此进行限制。因此，在针对状态识别模型的训练过程中，不仅分别、单独参考每一历史子序列对应的样本特征，还可以同时参考相邻或靠近的其他历史子序列对应的样本特征，可以对状态识别模型进行更为充分的训练，有助于提升对运行状态的识别准确度。相应地，在训练得到的状态识别模型被用于对目标设备的运行状态进行识别时，向状态识别模型输入的待识别特征可以包括：相应的待识别子序列与其他待识别子序列之间的时序关系，比如每一待识别子序列对应的前一待识别子序列或者每一待识别子序列对应的后一待识别子序列等。

在一实施例中，所述样本特征可以包括：对相应的历史子序列所包含的数据进行定量递归分析计算得到的统计属性参数特征，比如该统计属性参数特征(即RQA特征)可以包括以下至少之一：递归率、确定率、仙农熵、最长对角线因子、趋势等，本说明书并不对此进行限制。通过引入RQA特征，可以对运行状态时序数据的随机性、混沌性、周期性的特征指标进行量化，并使其参与到对状态识别模型的训练过程中，能够使得状态识别模型得到更为充分的训练，因而在基于状态识别模型对待识别特征进行处理后，有助于提升对目标设备的运行状态的识别准确度。相应地，在训练得到的状态识别模型被用于对目标设备的运行状态进行识别时，向状态识别模型输入的待识别特征可以包括：对相应的待识别子序列所包含的数据进行定量递归分析计算得到的统计属性参数特征，例如上述的递归率、确定率、仙农熵、最长对角线因子、趋势等中的一个或多个，本说明书并不对此进行限制。

在一实施例中，待识别特征所包含的特征类型可以为样本特征所包含的特征类型的子集，即待识别特征与样本特征包含的特征类型可以相同，或者待识别特征包含的特征类型可以为样本特征包含的特征类型的一部分。

在一实施例中，所述样本特征可以被标记了对应的设备历史运行状态，以通过有监督训练的方式得到上述的状态识别模型。当历史运行状态时序数据来源于某一台或多台设备时，由于已知该设备在历史时刻的真实运行状态，因而可以准确地对各个历史子序列或其对应的样本特征标记相应的设备历史运行状态，并据此实施对状态识别模型的有监督训练。当然，在其他实施例中，也可以不对样本特征标记对应的设备历史运行状态，从而通过无监督训练的方式得到上述的状态识别模型，本说明书并不对此进行限制。

步骤306，对所述训练样本集合进行模型训练，得到状态识别模型。

在一实施例中，类似于如图2所示的实施例所述，所述状态识别模型用于：在目标设备的运行状态时序数据被基于所包含的拐点而划分为多个待识别子序列的情况下，将各个待识别子序列对应的待识别特征作为输入，以得到相应的输出结果，所述输出结果用于确定所述目标设备的运行状态。

其中，该输出结果可以包括：目标设备在各个待识别子序列对应的时间段中处于异常状态的概率(即异常概率)，或者各个待识别子序列分别对应的异常概率中的最大异常概率，或者目标设备的运行状态，此处不再一一赘述。

为了便于理解，下面以工业生产场景下的设备状态管理与控制过程为例，对本说明书的技术方案进行详细说明。在工业生产场景中，人员、设备(机器)、原料、方法、环境是五个影响生产效率与产品质量的主要因素，而设备是这五个因素中最复杂的一个环节，同时也是对生产结果影响最大的一个环节。而通过本说明书的状态识别方案，可以对设备在工业生产过程中的状态进行准确识别，以便于在设备出现异常时可以及时实施管理控制操作，避免影响生产效率或产品质量。

图4是一示例性实施例提供的一种训练状态识别模型的示意图。如图4所示，对状态识别模型的训练过程可以包括：

在步骤①中，获取历史数据，并针对该历史数据进行预处理，得到处理后历史数据。

在一实施例中，当同一类型(如品牌、型号、规格等相同)的不同设备之间所形成的生产环境相同或相近时，这些设备的运行状态一致或者具有极强的可参考性，因而可以将同一类型的一台或多台设备所产生的历史数据用于训练状态识别模型，该状态识别模型可以用于对该同一类型的任意设备的运行状态进行准确识别。

在另一实施例中，即便同一类型的不同设备之间，所形成的生产环境也差异巨大，使得这些设备的运行状态不一致或者几乎不具有可参考性，那么每台设备所产生的历史数据训练出的状态识别模型，仅能够用于针对该设备的运行状态进行准确识别，而无法对其他设备的运行状态进行准确识别。

在一实施例中，通过设备上原本携带或后期装配的传感器，可以对运行过程中的设备进行数据采集操作，比如该数据采集操作可以按照预设周期连续实施；那么，对于传感器采集到的每一维度的数据而言，可以按照被采集的时刻顺序依次排列，形成一组时序数据。每个传感器可以用于采集一个或多个维度的数据，各个维度的时序数据共同构成了上述的历史数据。

在一实施例中，针对历史数据的预处理可以包括数据清洗、数据集成、数据变换等，从而得到处理后历史数据。例如，数据清洗可以删除历史数据中的无关数据、重复数据，平滑噪声数据，填充缺失数据等。譬如，历史数据可能由于数据传输或数据存储过程中的一些情况而导致数据缺失，可以将缺失数据赋值为前一相邻数据的取值，或者将缺失数据赋值为后一相邻数据的取值，或者将缺失数据赋值为前一相邻数据和后一相邻数据的平均值(中心差值)等，本说明书并不对此进行限制。

在步骤②～④中，通过特征工程将处理后历史数据生成为训练样本集合，以用于训练状态识别模型，其中：

在步骤②中，基于拐点探测技术对处理后历史数据进行分割，得到多个历史子序列。

在一实施例中，各个维度的处理后历史数据可以在相同时刻被采集，比如当处理时历史数据涉及温度、湿度、压力等维度时，设备上的传感器可以分别对这些维度的参数值进行同步采集，即各个维度的数据的采集时刻相同，因而可以按照采集时刻将各个维度的处理后历史数据进行分组，即处理后历史数据的数据形式可以为(Ai,Bi,Ci)，其中Ai代表Ti时刻的温度值、Bi代表Ti时刻的湿度值、Ci代表Ti时刻的压力值。所以，可以选取某一维度，并基于该维度的处理后历史数据所形成的拐点，划分形成若干历史时间段，而落入同一历史时间段内的处理后历史数据(当某一处理后历史数据的采集时刻属于某一历史时间段时，判定该处理后历史数据落入该历史时间段)构成一历史子序列，据此可以将处理后历史数据划分为多个历史子序列。

在一实施例中，处理后历史数据可能包含一个或多个维度的时序数据，对于每一维度的时序数据的处理操作包括：基于上述的拐点探测技术确定出相应维度的时序数据的拐点，并基于拐点对该相应维度的时序数据进行划分，得到多个历史子序列。

在一实施例中，可以通过相关技术中任意类型的拐点探测技术确定出各个维度的时序数据的拐点，比如CUSUM算法等，本说明书并不对此进行限制。

在一实施例中，当时序数据出现拐点时，表明设备的运行状态发生了一定程度的转折性变化，因而通过将拐点前后的时序数据划分至不同的历史子序列，使得对于历史子序列的划分具有明显的物理意义，必然优于按照固定步长的时间窗口进行分割得到的子序列。

在一实施例中，可以设定一预设阈值，使得分割或划分得到的历史子序列的长度不小于该预设阈值，避免历史子序列的长度过小而无法明确表达出所包含的意义，防止影响后续的模型训练过程。其中，由于每一维度的历史数据为设备在该维度上的历史参数值，因而历史子序列同样包含了多个时序排列的历史参数值，而某一历史子序列所包含的历史参数值的个数即为该历史子序列的长度；例如，当某一历史子序列包含的历史参数值为(A1,B1,C1)、(A2,B2,C2)……(Ak,Bk,Ck)时，该历史子序列的长度为k。

在步骤③中，针对各个历史子序列分别构建相应的样本特征。

在一实施例中，可以针对各个历史子序列包含的处理后历史数据，构建传统的统计特征。例如，可以分别针对各个历史子序列包含的处理后历史数据进行统计分析，构建的统计特征可以包括平均值、中位数、标准差等，本说明书并不对此进行限制。又例如，统计特征可以包括：各个历史子序列对应的平均值、中位数、标准差等其他统计特征之间的时序关系，该时序关系与各个历史子序列之间的时序关系相同。

在一实施例中，可以针对各个历史子序列包含的处理后历史数据，生成相应的递归图(Recurrence Plot，RP)，以将随机的、混沌的或者周期的序列特征可视化；以及，进一步通过定量递归分析(Recurrence Quantification Analysis，RQA)将递归图的定性分析结果进行定量化，形成递归率(percentage recurrence)、确定率(percentagedeterminism)、仙农熵(entropy)、最长对角线因子(reciprocal of the longestdiagonal line segment，L max)以及趋势(trend)等RQA特征，以用于表达出各个子序列所包含的处理后历史数据的随机的、混沌的或者周期的特性，使得后续训练得到的状态识别模型能够对随机的、混沌的或者周期的数据特性进行识别分析，有助于提升对设备的运行状态的识别准确度。

在步骤④中，对构建的传统统计特征、RQA特征等样本特征进行打标，得到训练样本集合。

在一实施例中，由于已知历史数据对应的设备在历史上的真实运行状态，因而可以获知设备在各个历史子序列对应的历史时间段内的真实运行状态，并据此对各个历史子序列对应的样本特征进行打标，比如处于正常状态时标记为“0”、处于异常状态时标记为“1”。

在步骤⑤中，根据训练样本集合包含的训练样本，训练得到状态识别模型。

在一实施例中，通过有监督算法对训练样本集合所包含的训练样本进行训练，以得到状态识别模型。此处可以采用相关技术中任意类型的有监督算法，本说明书并不对此进行限制。

针对通过诸如图4所示实施例而训练得到的状态识别模型，图5是一示例性实施例提供的一种通过状态识别模型对目标设备的运行状态进行识别的示意图。如图5所示，通过状态识别模型对目标设备的运行状态进行识别的过程可以包括：

在步骤①中，获取待识别数据，并针对该待识别数据进行预处理，得到处理后待识别数据。

在一实施例中，通过目标设备上原本携带或后期装配的传感器，可以对运行过程中的目标设备进行数据采集操作，比如该数据采集操作可以按照预设周期连续实施；那么，对于传感器采集到的每一维度的数据而言，可以按照被采集的时刻顺序依次排列，形成一组时序数据。每个传感器可以用于采集一个或多个维度的数据，各个维度的时序数据共同构成了上述的待识别数据。该过程可以参考图4中对于历史数据的采集过程。

在一实施例中，针对待识别数据的预处理可以包括数据清洗、数据集成、数据变换等，从而得到处理后待识别数据。例如，数据清洗可以删除待识别数据中的无关数据、重复数据，平滑噪声数据，填充缺失数据等。譬如，待识别数据可能由于数据传输或数据存储过程中的一些情况而导致数据缺失，可以将缺失数据赋值为前一相邻数据的取值，或者将缺失数据赋值为后一相邻数据的取值，或者将缺失数据赋值为前一相邻数据和后一相邻数据的平均值(中心差值)等，本说明书并不对此进行限制。该过程可以参考图4中对于历史数据的预处理过程。

在步骤②～④中，通过特征工程将处理后待识别数据生成为待识别样本集合，以用于输入状态识别模型并识别目标设备的运行状态，其中：

在步骤②中，基于拐点探测技术对处理后待识别数据进行分割，得到多个待识别子序列。

在一实施例中，各个维度的处理后待识别数据可以在相同时刻被采集，比如当处理时待识别数据涉及温度、湿度、压力等维度时，设备上的传感器可以分别对这些维度的参数值进行同步采集，即各个维度的数据的采集时刻相同，因而可以按照采集时刻将各个维度的处理后待识别数据进行分组，即处理后待识别数据的数据形式可以为(Aj,Bj,Cj)，其中Aj代表Tj时刻的温度值、Bj代表Tj时刻的湿度值、Cj代表Tj时刻的压力值。所以，可以选取某一维度，并基于该维度的处理后待识别数据所形成的拐点，划分形成若干时间段，而落入同一时间段内的处理后待识别数据(当某一处理后待识别数据的采集时刻属于某一时间段时，判定该处理后待识别数据落入该时间段)构成一待识别子序列，据此可以将处理后待识别数据划分为多个待识别子序列。

在一实施例中，处理后待识别数据可能包含一个或多个维度的时序数据，对于每一维度的时序数据的处理操作包括：基于上述的拐点探测技术确定出相应维度的时序数据的拐点，并基于拐点对该相应维度的时序数据进行划分，得到多个待识别子序列。

在一实施例中，当时序数据出现拐点时，表明目标设备的运行状态发生了一定程度的转折性变化，因而通过将拐点前后的时序数据划分至不同的待识别子序列，使得对于待识别子序列的划分具有明显的物理意义，必然优于按照固定步长的时间窗口进行分割得到的子序列。

在一实施例中，可以设定一预设阈值，使得分割或划分得到的待识别子序列的长度不小于该预设阈值，避免历史子序列的长度过小而无法明确表达出所包含的意义，防止影响后续的模型训练过程。该预设阈值可以与图4所示实施例中对历史子序列进行长度限制的阈值相同。其中，由于每一维度的待识别数据为设备在该维度上的参数值，因而待识别子序列同样包含了多个时序排列的参数值，而某一待识别子序列所包含的参数值的个数即为该待识别子序列的长度；例如，当某一待识别子序列包含的参数值为(A1,B1,C1)、(A2,B2,C2)……(Am,Bm,Cm)时，该历史子序列的长度为m。

在步骤③中，针对各个待识别子序列分别构建相应的待识别特征。

在一实施例中，可以针对各个待识别子序列包含的处理后待识别数据，构建传统的统计特征。例如，可以分别针对各个待识别子序列包含的处理后待识别数据进行统计分析，构建的统计特征可以包括平均值、中位数、标准差等，本说明书并不对此进行限制。又例如，统计特征可以包括：各个待识别子序列对应的平均值、中位数、标准差等其他统计特征之间的时序关系，该时序关系与各个待识别子序列之间的时序关系相同。

在一实施例中，可以针对各个待识别子序列包含的处理后待识别数据，生成相应的递归图，以将随机的、混沌的或者周期的序列特征可视化；以及，进一步通过定量递归分析将递归图的定性分析结果进行定量化，形成递归率、确定率、仙农熵、最长对角线因子以及趋势等RQA特征，以用于表达出各个子序列所包含的处理后待识别数据的随机的、混沌的或者周期的特性，有助于提升对设备的运行状态的识别准确度。

在一实施例中，当图4所示实施例中的样本特征集合中包含某一类型的样本特征时，状态识别模型才能够对该类型的待识别特征进行有效分析，所以构建该类型的待识别特征才有意义，因而待识别特征的类型可以与样本特征的类型相同，或者待识别特征的类型可以为样本特征的类型的一部分。

在步骤④中，将待识别特征集合输入状态识别模型，得到目标设备在各时段的异常概率。

在一实施例中，根据输入的待识别特征集合，状态识别模型可以预测出目标设备在各个待识别子序列对应的时段中的异常概率，即目标设备在相应时段中处于异常状态的概率。例如，当处理后待识别数据被划分为n个待识别子序列时，状态识别模型可以分别输出各个子序列对应的异常概率p1、p2……pn。

在步骤⑤中，通过比较概率值，选取最大异常概率。

在一实施例中，通过将n个待识别子序列分别对应的异常概率p1、p2……pn进行概率值的比较，可以确定出概率值最大的最大异常概率px，即第x个待识别子序列对应的异常概率，以作为目标设备的异常概率。

在步骤⑥中，将最大异常概率与预警概率进行比较，以确定目标设备的运行状态。

在一实施例中，当最大异常概率大于或等于预警概率时，表明目标设备具有较大概率发生异常，因而可以判定目标设备处于异常状态；当最大异常概率小于预警概率时，表明目标设备具有较小概率发生异常，因而可以判定目标设备处于正常状态。

图6是一示例性实施例提供的一种设备的示意结构图。请参考图6，在硬件层面，该设备包括处理器602、内部总线604、网络接口606、内存608以及非易失性存储器610，当然还可能包括其他业务所需要的硬件。处理器602从非易失性存储器610中读取对应的计算机程序到内存608中然后运行，在逻辑层面上形成识别设备运行状态的装置。当然，除了软件实现方式之外，本说明书一个或多个实施例并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

请参考图7，在软件实施方式中，该识别设备运行状态的装置可以包括：

划分单元71，根据目标设备的运行状态时序数据包含的拐点，将所述运行状态时序数据沿所述拐点划分为多个待识别子序列；

生成单元72，生成待识别特征集合，所述待识别特征集合包括分别对应于各个待识别子序列的待识别特征；

输入单元73，将所述待识别特征集合输入至状态识别模型，所述状态识别模型的训练样本集合包括分别对应于各个历史子序列的样本特征，其中所述历史子序列由历史运行状态时序数据基于所包含的拐点进行划分得到；

确定单元74，根据所述状态识别模型的输出结果，确定所述目标设备的运行状态。

可选的，

所述样本特征包括：对相应的历史子序列所包含的数据进行统计得到的统计特征；

所述待识别特征包括：对相应的待识别子序列所包含的数据进行统计得到的统计特征。

可选的，所述统计特征包括以下至少之一：平均值、中位数、标准差。

可选的，

所述样本特征还包括：相应的历史子序列与其他历史子序列之间的时序关系；

所述待识别特征还包括：相应的待识别子序列与其他待识别子序列之间的时序关系。

可选的，

所述样本特征还包括：对相应的历史子序列所包含的数据进行定量递归分析计算得到的统计属性参数特征；

所述待识别特征还包括：对相应的待识别子序列所包含的数据进行定量递归分析计算得到的统计属性参数特征。

可选的，所述统计属性参数特征包括以下至少之一：递归率、确定率、仙农熵、最长对角线因子、趋势。

可选的，所述确定单元74具体用于：

从所述状态识别模型分别针对各个待识别子序列输出的异常概率中，确定最大异常概率；

当所述最大异常概率达到预设阈值时，确定所述目标设备的运行状态为异常状态；当所述最大异常概率未达到所述预设阈值时，确定所述目标设备的运行状态为正常状态。

可选的，还包括：

填充单元75，当所述运行状态时序数据存在数据缺失时，采用相邻数据的中心差值对缺失数据进行填充。

图8是一示例性实施例提供的一种设备的示意结构图。请参考图8，在硬件层面，该设备包括处理器802、内部总线804、网络接口806、内存808以及非易失性存储器810，当然还可能包括其他业务所需要的硬件。处理器802从非易失性存储器810中读取对应的计算机程序到内存808中然后运行，在逻辑层面上形成状态识别模型训练装置。当然，除了软件实现方式之外，本说明书一个或多个实施例并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

请参考图9，在软件实施方式中，该状态识别模型训练装置可以包括：

划分单元91，根据设备的历史运行状态时序数据包含的拐点，将所述历史运行状态时序数据沿所述拐点划分为多个历史子序列；

生成单元92，生成训练样本集合，所述训练样本集合包括分别对应于各个历史子序列的样本特征；

训练单元93，对所述训练样本集合进行模型训练，得到状态识别模型。

可选的，所述状态识别模型用于：在目标设备的运行状态时序数据被基于所包含的拐点而划分为多个待识别子序列的情况下，将各个待识别子序列对应的待识别特征作为输入，以得到相应的输出结果，所述输出结果用于确定所述目标设备的运行状态。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

在一个典型的配置中，计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

以上所述仅为本说明书一个或多个实施例的较佳实施例而已，并不用以限制本说明书一个或多个实施例，凡在本说明书一个或多个实施例的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书一个或多个实施例保护的范围之内。

Claims

1.一种识别设备运行状态的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求2所述的方法，其特征在于，所述统计特征包括以下至少之一：平均值、中位数、标准差。

4.根据权利要求2所述的方法，其特征在于，

5.根据权利要求2所述的方法，其特征在于，

6.根据权利要求5所述的方法，其特征在于，所述统计属性参数特征包括以下至少之一：递归率、确定率、仙农熵、最长对角线因子、趋势。

7.根据权利要求1所述的方法，其特征在于，所述根据所述状态识别模型的输出结果，确定所述目标设备的运行状态，包括：

8.根据权利要求1所述的方法，其特征在于，还包括：

当所述运行状态时序数据存在数据缺失时，采用相邻数据的中心差值对缺失数据进行填充。

9.根据权利要求1所述的方法，其特征在于，所述样本特征被标记了对应的设备历史运行状态。

10.一种状态识别模型训练方法，其特征在于，包括：

对所述训练样本集合进行模型训练，得到状态识别模型。

11.根据权利要求10所述的方法，其特征在于，所述状态识别模型用于：在目标设备的运行状态时序数据被基于所包含的拐点而划分为多个待识别子序列的情况下，将各个待识别子序列对应的待识别特征作为输入，以得到相应的输出结果，所述输出结果用于确定所述目标设备的运行状态。

12.根据权利要求10所述的方法，其特征在于，所述样本特征被标记了对应的设备历史运行状态。

13.一种识别设备运行状态的装置，其特征在于，包括：

14.根据权利要求13所述的装置，其特征在于，

15.根据权利要求14所述的装置，其特征在于，所述统计特征包括以下至少之一：平均值、中位数、标准差。

16.根据权利要求14所述的装置，其特征在于，

17.根据权利要求14所述的装置，其特征在于，

18.根据权利要求17所述的装置，其特征在于，所述统计属性参数特征包括以下至少之一：递归率、确定率、仙农熵、最长对角线因子、趋势。

19.根据权利要求13所述的装置，其特征在于，所述确定单元具体用于：

20.根据权利要求13所述的装置，其特征在于，还包括：

填充单元，当所述运行状态时序数据存在数据缺失时，采用相邻数据的中心差值对缺失数据进行填充。

21.根据权利要求13所述的装置，其特征在于，所述样本特征被标记了对应的设备历史运行状态。

22.一种状态识别模型训练装置，其特征在于，包括：

23.根据权利要求22所述的装置，其特征在于，所述状态识别模型用于：在目标设备的运行状态时序数据被基于所包含的拐点而划分为多个待识别子序列的情况下，将各个待识别子序列对应的待识别特征作为输入，以得到相应的输出结果，所述输出结果用于确定所述目标设备的运行状态。

24.根据权利要求22所述的装置，其特征在于，所述样本特征被标记了对应的设备历史运行状态。