CN113283502A

CN113283502A - 基于聚类的设备状态阈值确定方法和装置

Info

Publication number: CN113283502A
Application number: CN202110566161.7A
Authority: CN
Inventors: 张景逸
Original assignee: Ping An International Financial Leasing Co Ltd
Current assignee: Ping An International Financial Leasing Co Ltd
Priority date: 2021-05-24
Filing date: 2021-05-24
Publication date: 2021-08-20
Anticipated expiration: 2041-05-24
Also published as: CN113283502B

Abstract

本申请涉及机架运维的硬件监控领域，具体涉及一种设备状态阈值确定方法、装置、计算机设备和存储介质。所述方法获取待识别设备的历史运行状态数据；对历史运行状态数据进行聚类，并获取聚类所得的每个聚簇中的极值数据；根据极值数据对聚簇进行排列，获得聚簇队列；获取聚簇队列中聚簇对应的第一值差，根据第一值差确定待识别设备对应的设备状态阈值。本申请的设备状态阈值确定方法在确定设备对应的历史运行状态数据后，通过对历史运行状态数据进行聚类处理，从而将历史运行状态数据划分至不同状态，而后基于不同状态间聚簇对应的值差数据，识别设备状态阈值。即只需要通过历史数据即可计算出设备状态阈值，可以有效提高设备工作状态的判定效率。

Description

基于聚类的设备状态阈值确定方法和装置

技术领域

本申请涉及计算机技术领域，特别是涉及一种基于聚类的设备状态阈值确定方法和装置。

背景技术

随着计算机技术与传感技术的发展，出现了物联网(The Internet of Things，简称IOT)技术，即是指通过各种信息传感器、射频识别技术、全球定位系统、红外感应器、激光扫描器等各种装置与技术，实时采集任何需要监控、连接、互动的物体或过程，采集其声、光、热、电、力学、化学、生物、位置等各种需要的信息，通过各类可能的网络接入，实现物与物、物与人的泛在连接，实现对物品和过程的智能化感知、识别和管理。物联网是一个基于互联网、传统电信网等的信息承载体，它让所有能够被独立寻址的普通物理对象形成互联互通的网络。

目前，在物联网技术中，监控设备工作状态(停机、待机、开工)需求越来越强烈。而常见的解决方案是对知道设备的额定功率后，以此为判断依据，进行阈值判断。但针对未知的设备，或者数量很大的设备集群，则很难逐台设备收集功率参数，从而影响设备工作状态的判定效率。

发明内容

基于此，有必要针对上述技术问题，提供一种能提高设备工作状态的判定效率的基于聚类的设备状态阈值确定方法、装置、计算机设备和存储介质。

一种基于聚类的设备状态阈值确定方法，所述方法包括：

获取待识别设备的历史运行状态数据；

对所述历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据；

根据所述极值数据对所述聚簇进行排列，获得聚簇队列；

获取所述聚簇队列中聚簇对应的第一值差，根据所述第一值差确定所述待识别设备对应的设备状态阈值。

在其中一个实施例中，所述对所述历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据之前，还包括：

根据所述历史运行状态数据中的最大值与最小值，对所述历史运行状态数据进行归一标准化处理，获取归一化数据；

所述对所述历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据包括：

对所述归一化数据进行聚类，并获取聚类所得的每个聚簇中的极值数据。

在其中一个实施例中，所述对所述归一化数据进行聚类，并获取聚类所得的每个聚簇中的极值数据之前，还包括：

识别所述归一化数据中的异常值数据；

从所述归一化数据中剔除所述异常值数据；

所述对所述归一化数据进行聚类包括：

对剔除异常值数据后的所述归一化数据进行聚类。

在其中一个实施例中，所述根据所述极值数据对所述聚簇进行排列，获得聚簇队列包括：

根据所述极值数据对所述聚簇进行排列，获取初始聚簇队列；

计算所述初始聚簇队列内相邻聚簇间的第二值差；

根据所述第二值差对所述初始聚簇队列中的聚簇进行合并处理，获取合并结果；

根据合并结果，获取聚簇队列。

在其中一个实施例中，所述根据所述第二值差对所述初始聚簇队列中的聚簇进行合并处理，获取合并结果包括：

根据所述第二值差对所述初始聚簇队列中的聚簇进行合并处理，获取合并聚簇；

获取所述合并聚簇对应的变异系数；

根据所述变异系数以及预设变异系数阈值，识别所述合并聚簇中的异状态聚簇；

剔除所述合并聚簇中的异状态聚簇，获取合并结果。

在其中一个实施例中，所述剔除所述合并聚簇中的异状态聚簇，获取合并结果之后，还包括：

将所述合并结果作为历史运行状态数据，返回所述对所述历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据的步骤；

当根据所述第二值差无法对所述初始聚簇队列中的聚簇进行合并处理时，根据当前的初始聚簇队列更新所述合并结果；

所述根据合并结果，获取聚簇队列包括：

根据更新的所述合并结果，获取聚簇队列。

在其中一个实施例中，所述根据所述第一值差确定所述待识别设备对应的设备状态阈值之后，还包括：

根据所述设备状态阈值，识别所述待识别设备对应的实时设备状态。

一种基于聚类的设备状态阈值确定装置，所述装置包括：

数据获取模块，用于获取待识别设备的历史运行状态数据；

聚类处理模块，用于对所述历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据；

队列构建模块，用于根据所述极值数据对所述聚簇进行排列，获得聚簇队列；

状态阈值获取模块，用于获取所述聚簇队列中聚簇对应的第一值差，根据所述第一值差确定所述待识别设备对应的设备状态阈值。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取待识别设备的历史运行状态数据；

根据所述极值数据对所述聚簇进行排列，获得聚簇队列；

一种计算机存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取待识别设备的历史运行状态数据；

根据所述极值数据对所述聚簇进行排列，获得聚簇队列；

上述基于聚类的设备状态阈值确定方法、装置、计算机设备和存储介质，通过获取待识别设备的历史运行状态数据；对历史运行状态数据进行聚类，并获取聚类所得的每个聚簇中的极值数据；根据极值数据对聚簇进行排列，获得聚簇队列；获取聚簇队列中聚簇对应的第一值差，根据第一值差确定待识别设备对应的设备状态阈值。本申请的设备状态阈值确定方法在确定设备对应的历史运行状态数据后，通过对历史运行状态数据进行聚类处理，从而将历史运行状态数据划分至不同状态，而后基于不同状态间聚簇对应的值差数据，识别设备状态阈值。即只需要通过历史数据即可计算出设备状态阈值，可以有效提高设备工作状态的判定效率。

附图说明

图1为一个实施例中基于聚类的设备状态阈值确定方法的应用场景图；

图2为一个实施例中基于聚类的设备状态阈值确定方法的流程示意图；

图3为一个实施例中图2中步骤205的子流程示意图；

图4为一个实施例中图3中步骤306的子流程示意图；

图5为一个实施例中基于聚类的设备状态阈值确定装置的结构框图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的基于聚类的设备状态阈值确定方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与设备状态阈值确定服务器104进行通信。当终端102方的工作人员需要对物设备状态阈值确定时，可以通过网络向设备状态阈值确定服务器104发送待识别设备的历史运行状态数据。设备状态阈值确定服务器104首先获取待识别设备的历史运行状态数据；对历史运行状态数据进行聚类，并获取聚类所得的每个聚簇中的极值数据；根据极值数据对聚簇进行排列，获得聚簇队列；获取聚簇队列中聚簇对应的值差，根据值差确定待识别设备对应的设备状态阈值。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，设备状态阈值确定服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种基于聚类的设备状态阈值确定方法，以该方法应用于图1中的设备状态阈值确定服务器104为例进行说明，包括以下步骤：

步骤201，获取待识别设备的历史运行状态数据。

其中历史运行状态数据具体是指通过传感设备检测出的待识别设备在运行过程中的各类型运行数据。具体地，待识别设备在各种工作状态，如停机、待机、开工等状态下的历史运行状态数据都被包含在其中。历史运行状态数据具体是指特定时间内的历史运行状态数据，比如在待识别设备当前时间点向前的三个月内的所有运行数据，都将作为待识别设备的历史运行状态数据，对于一个工作状态，可能包含多个不同的历史运行状态数据。其中一个实施例中，历史运行状态数据具体是指电流值数据。此时，可以记录待识别设备在各种设备运行状态对应的运行时刻，具体可以通过电流检测传感设备来检测待识别设备在这些运行时刻对应的电流值，而后将其记录下来，当需要确定设备运行过程中的状态阈值时，则可将这些运行过程的电流值作为历史运行状态数据。而设备状态阈值则具体是指装备在不同状态之间切换的阈值，如设备停机的工作状态与设备待机的工作状态直接的电流阈值就是一种设备状态阈值。

具体地，在进行设备状态阈值确定时，可以基于待识别设备的历史运行状态数据来进行阈值划分，待识别设备在各种运行状态时，呈现不同的稳态特征。而这些稳态特征则可以从待识别设备的历史运行状态数据中提取获得。因此，在确定设备状态阈值时，首先需要获取待识别设备的历史运行状态数据。

步骤203，对历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据。

其中，极值数据具体包括每个聚簇中历史运行状态数据对应的最大值与最小值。具体地，对于相同的设备工作状态，其对应的历史运行状态数据也是类似的，因此可以通过聚类处理，来将相同设备工作状态下的历史运行状态数据聚合到一起，而计算每个聚簇的最大值与最小值则是为后续过程的阈值识别进行铺垫。

在其中一个实施例中，步骤S203具体包括，通过kmeans聚类来对历史运行状态数据进行聚类处理。kmeans聚类是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类，没有(或最小数目)聚类中心再发生变化，误差平方和局部最小。通过kmeans聚类可以有效对离散类型的数据进行聚类处理。

步骤205，根据极值数据对聚簇进行排列，获得聚簇队列。

步骤207，获取聚簇队列中聚簇对应的第一值差，根据第一值差确定待识别设备对应的设备状态阈值。

其中，聚簇对应的第一值差用于表征聚簇队列内相邻聚簇间极值的数值大小差距。值差的获取过程由聚簇队列的排列依据确定，而聚簇队列的排列依据具体包括了依照各个聚簇内的极大值数据，从小到大对聚簇进行排列；依照各个聚簇内的极大值数据，从大到小对聚簇进行排列；依照各个聚簇内的极小值数据，从小到大对聚簇进行排列；依照各个聚簇内的极小值数据，从大到小对聚簇进行排列四种情况。而值差获取过程，则是依据聚簇间的极值的大小差例如，对于根据聚簇极小值的从小到大顺序对聚簇进行排列的聚簇队列，第一值差由当前聚簇的最大值与聚簇队列中当前聚簇对应后一个聚簇的最小值确定。即将聚簇队列内按顺序排列的当前聚簇与顺序内下一聚簇之间最小的极值差，作为当前聚簇对应的第一值差。而根据第一值差确定待识别设备对应的设备状态阈值，具体可以为根据第一值差与第一值差对应的极值来计算待识别设备对应的设备状态阈值。如在其中一个实施例中，第一值差由当前聚簇的最大值与聚簇队列中当前聚簇对应后一个聚簇的最小值确定。此时，待识别设备对应的一个设备状态阈值的具体数值可以为当前聚簇的最大值加上第一值差的一半，或者是当前聚簇对应后一个聚簇的最小值减去第一值差的一半。即可以将当前聚簇与当前聚簇对应后一个聚簇的中间点，设置为待识别设备状态切换的识别点，其对应的数值则为待识别设备对应的设备状态阈值。

具体地，本方案主要通过在聚类后寻找聚类间最大间距的方式来寻找设备状态的阈值。例如，对于按照聚簇最小值从小到大的聚簇队列，在确定聚簇队列中每个聚簇的最大值与后一个聚簇的最小值之间的值差后，可以基于值差来查找状态阈值切换的间隙。特别的，对于有待机状态的设备(无待机状态设备无需寻找开工状态阈值)，当设备开始工作后，工作部件会将设备的电流分布带入另一个分布空间，且待机分布与开工分布有明显间隙。因此，可以通过本申请的设备状态阈值确定方法，来确定这些设备的待机状态与开工状态之间的电流阈值。

上述设备状态阈值确定方法，通过获取待识别设备的历史运行状态数据；对历史运行状态数据进行聚类，并获取聚类所得的每个聚簇中的极值数据；根据极值数据对聚簇进行排列，获得聚簇队列；获取聚簇队列中聚簇对应的第一值差，根据第一值差确定待识别设备对应的设备状态阈值。本申请的设备状态阈值确定方法在确定设备对应的历史运行状态数据后，通过对历史运行状态数据进行聚类处理，从而将历史运行状态数据划分至不同状态，而后基于不同状态间聚簇对应的值差数据，识别设备状态阈值。即只需要通过历史数据即可计算出设备状态阈值，可以有效提高设备工作状态的判定效率。同时，本申请基于无监督机器学习来获取设备状态阈值，只要有历史数据即可计算出设备状态阈值。

在其中一个实施例中，步骤203之前，还包括：根据历史运行状态数据中的最大值与最小值，对历史运行状态数据进行归一标准化处理，获取归一化数据。步骤203包括：对归一化数据进行聚类，并获取聚类所得的每个聚簇中的极值数据。

其中，归一标准化处理具体是指将历史运行状态数据按比例缩放，使之落入一个小的特定区间，目的在于：去除数据的单位限制，转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。在多指标评价体系中，由于个各评价指标的性质，通常具有不同的量纲和数量级。当各指标间的水平相差很大时，如果直接用原始指标值进行分析，就会突出数值较高的指标在综合分析中的作用，相对削弱值水平低指标的作用，因此，本实施例中为了保证结果的可靠性，对原始的历史运行状态数据进行归一标准化的处理。

在其中一个实施例中，根据对归一化数据进行聚类，并获取聚类所得的每个聚簇中的极值数据之前，还包括：识别归一化数据中的异常值数据；从归一化数据中剔除异常值数据；对归一化数据进行聚类包括：对剔除异常值数据后的归一化数据进行聚类。

具体地，在待识别设备的运行过程中，可能存在部分异常的运行数据，为了防止这些异常数据对于设备状态阈值识别过程的干扰，可以通过数据清洗来滤除这部分数据，从而提高阈值识别过程的识别准确率。在其中一个实施例中，具体可以通过分位数来进行状态阈值的识别，例如从归一化数据滤中除小于25％分位和75％分位的值，而后对剔除异常值数据后的归一化数据进行聚类。本实施例中，通过剔除异常数据后再进行聚类，可以提高聚类的准确率，

在其中一个实施例中，如图3所示，步骤205包括：

步骤302，根据极值数据对聚簇进行排列，获取初始聚簇队列。

步骤304，计算初始聚簇队列内相邻聚簇间的第二值差。

步骤306，根据第二值差对初始聚簇队列中的聚簇进行合并处理，获取合并结果。

步骤308，根据合并结果，获取聚簇队列。

其中根据极值数据对聚簇进行排列，获取初始聚簇队列，具体是指依照聚簇内数据极值的大小来对聚簇进行排列。例如，根据聚簇内的最小值，对所有聚簇进行排列，将最小值相对最小的聚簇，置于初始聚簇队列的最前面，而最小值相对更大的聚簇，置于初始聚簇队列的后面，得到初始的聚簇队列。各个聚簇间的第二值差则是指相邻两个聚簇直接的极值对应的第二值差，如对于按照最小值从小到大排列的初始聚簇队列，相邻聚簇间的第二值差当前聚簇的最大值与初始聚簇队列中当前聚簇对应后一个聚簇的最小值之差。根据第二值差对初始聚簇队列中的聚簇进行合并处理，则是根据第二值差，来确定两个聚簇间是否属于设备的统一运行状态，在判定时，具体可以计算聚簇i与聚簇i+1的第二值差是否小于聚簇i+1与聚簇i+2的第二值差，当小于时，说明聚簇i与聚簇i+1之间的间隙不明显，此时可以将聚簇i与聚簇i+1合并，获取相应的合并结果。在此处，合并结果为一个新的聚簇，本申请中的合并具体是指将聚类所得的聚簇组合为一个新的聚簇，这个新的聚簇包含原先合并前聚簇内的所有历史运行状态数据。

具体地，在对聚簇进行排列时，由于聚类可能会将部分相同状态的历史运行状态数据聚类到不同的聚簇内，因此，为了提高设备状态阈值确定的准确率，可以对聚类后得到的聚簇进行合并，而合并的依据为各个聚簇间的第二值差。本申请可以基于第一值差来查找待识别设备在运行时，设备状态切换的间隙。如在一个具体实施例中，对于有待机状态的设备(无待机状态设备无需寻找开工状态阈值)，当设备开始工作后，工作部件会将设备的电流分布带入另一个分布空间，且待机分布与开工分布有明显间隙，因此可以通过不同状态间的电流差距，来计算设备在待机状态与开工状态间状态切换对应的设备状态阈值。本实施例中，通过对聚簇进行合并处理，来将相同设备状态下的聚簇进行合并后再计算设备状态阈值，从而提高设备状态阈值计算的准确率。

在其中一个实施例中，如图4所示，步骤306包括：

步骤401，根据第二值差对初始聚簇队列中的聚簇进行合并处理，获取合并聚簇。

步骤403，获取合并聚簇对应的变异系数。

步骤405，根据变异系数以及预设变异系数阈值，识别合并聚簇中的异状态聚簇。

步骤407，剔除合并聚簇中的异状态聚簇，获取合并结果。

具体地，变异系数又称“离散系数”(coefficient of variation)，是概率分布离散程度的一个归一化量度，其定义为标准差与平均值之比，而本申请中，合并聚簇具体是一组离散形式的数组数据。因此可以先分别计算合并聚簇的标准差与平均值，而后基于标准差与平均值的计算结果，直接计算变异系数。变异系数只在平均值不为零时有定义，而且一般适用于平均值大于零的情况。变异系数也被称为标准离差率或单位风险。而预设变异系数阈值，则根据待识别设备的设备类型进行设置，根据对每一个设备类型的设备分别设置一个通用值，而无需精准调优。设备的待机状态只有最基本的微控制设备在工作，所以电流值的分布区间很小，而变异系数则能对分布空间离散度大小进行判断。只有当合并聚簇的变异系数小于预设变异系数阈值时，才会将其作为可合并的聚簇进行合并，否则将合并聚簇确定为异状态聚簇，即其中的聚簇属于不同设备，需要重新拆分为不同的两个聚簇。本实施例中，通过变异系数来辅助获取合并结果，可以保证所得的合并结果的有效性，从而提高设备状态阈值确定的准确性。

在其中一个实施例中，剔除合并聚簇中的异状态聚簇，获取合并结果之后，还包括：将合并结果作为历史运行状态数据，返回对历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据的步骤；当根据第二值差无法对初始聚簇队列中的聚簇进行合并处理时，根据当前的初始聚簇队列更新合并结果。步骤308包括：根据更新的合并结果，获取聚簇队列。

具体地，在一次合并完成后，可以将合并所得的结果作为历史运行状态数据，而后返回对历史运行状态数据进行聚类，并获取聚类所得的每个聚簇中的极值数据的步骤，从而对合并后的聚簇队列，再次进行合并。而当根据值差无法继续对初始聚簇队列中的聚簇进行合并处理，即最新的初始聚簇队列中的所有聚簇都无法再进行合并时，则迭代结束，此时最新的初始聚簇队列即为最终的合并结果。合并结果内的各个聚簇都分别与一个设备状态对应。本实施例中，通过迭代处理来对合并后的聚簇再次进行合并，可以有效提高设备状态阈值确定的准确性。

在其中一个实施例中，根据值差确定待识别设备对应的设备状态阈值之后，还包括：根据设备状态阈值，识别待识别设备对应的实时设备状态。

具体地，在通过本申请的设备状态阈值确定方法确定设备各个状态之间对应的设备状态阈值后，基于确定的设备状态阈值，来建立待识别设备对应的设备状态对应表。当需要对实时的设备状态进行识别时，可以基于实时的设备运行数据，基于设备状态对应表来进行实时的设备状态识别。本实施例中，基于确定设备状态阈值，来识别待识别设备对应的实时设备状态，可以有效地针对待识别设备进行逐台设备的状态收集处理。

应该理解的是，虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，提供了一种基于聚类的设备状态阈值确定装置，包括：

数据获取模块502，用于获取待识别设备的历史运行状态数据。

聚类处理模块504，用于对历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据。

队列构建模块506，用于根据极值数据对聚簇进行排列，获得聚簇队列。

状态阈值获取模块508，用于获取聚簇队列中聚簇对应的第一值差，根据第一值差确定待识别设备对应的设备状态阈值。

在其中一个实施例中，还包括归一化处理模块，用于：根据历史运行状态数据中的最大值与最小值，对历史运行状态数据进行归一标准化处理，获取归一化数据；聚类处理模块504具体用于：对归一化数据进行聚类，并获取聚类所得的每个聚簇中的极值数据。

在其中一个实施例中，归一化处理模块还用于：识别归一化数据中的异常值数据；从归一化数据中剔除异常值数据；对剔除异常值数据后的归一化数据进行聚类。

在其中一个实施例中，队列构建模块506具体用于：根据极值数据对聚簇进行排列，获取初始聚簇队列；计算初始聚簇队列内相邻聚簇间的第二值差；根据第二值差对初始聚簇队列中的聚簇进行合并处理，获取合并结果；根据合并结果，获取聚簇队列。

在其中一个实施例中，队列构建模块506还用于：根据第二值差对初始聚簇队列中的聚簇进行合并处理，获取合并聚簇；获取合并聚簇对应的变异系数；根据变异系数以及预设变异系数阈值，识别合并聚簇中的异状态聚簇；剔除合并聚簇中的异状态聚簇，获取合并结果。

在其中一个实施例中，队列构建模块506还用于：将合并结果作为历史运行状态数据，返回对历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据的步骤；当根据第二值差无法对初始聚簇队列中的聚簇进行合并处理时，根据当前的初始聚簇队列更新合并结果；根据更新的合并结果，获取聚簇队列。

在其中一个实施例中，还包括设备状态识别模块，用于：根据设备状态阈值，识别待识别设备对应的实时设备状态。

关于设备状态阈值确定装置的具体实施例可以参见上文中对于设备状态阈值确定方法中的实施例，在此不再赘述。上述设备状态阈值确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储设备状态阈值确定数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种设备状态阈值确定方法。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

获取待识别设备的历史运行状态数据。

对历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据。

根据极值数据对聚簇进行排列，获得聚簇队列。

获取聚簇队列中聚簇对应的第一值差，根据第一值差确定待识别设备对应的设备状态阈值。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据历史运行状态数据中的最大值与最小值，对历史运行状态数据进行归一标准化处理，获取归一化数据；对归一化数据进行聚类，并获取聚类所得的每个聚簇中的极值数据。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：识别归一化数据中的异常值数据；从归一化数据中剔除异常值数据；对归一化数据进行聚类包括：对剔除异常值数据后的归一化数据进行聚类。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据极值数据对聚簇进行排列，获取初始聚簇队列；计算初始聚簇队列内相邻聚簇间的第二值差；根据第二值差对初始聚簇队列中的聚簇进行合并处理，获取合并结果；根据合并结果，获取聚簇队列。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据第二值差对初始聚簇队列中的聚簇进行合并处理，获取合并聚簇；获取合并聚簇对应的变异系数；根据变异系数以及预设变异系数阈值，识别合并聚簇中的异状态聚簇；剔除合并聚簇中的异状态聚簇，获取合并结果。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据设备状态阈值，识别待识别设备对应的实时设备状态。

在一个实施例中，提供了一种计算机存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

获取待识别设备的历史运行状态数据。

根据极值数据对聚簇进行排列，获得聚簇队列。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据历史运行状态数据中的最大值与最小值，对历史运行状态数据进行归一标准化处理，获取归一化数据；对归一化数据进行聚类，并获取聚类所得的每个聚簇中的极值数据。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：识别归一化数据中的异常值数据；从归一化数据中剔除异常值数据；对归一化数据进行聚类包括：对剔除异常值数据后的归一化数据进行聚类。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据极值数据对聚簇进行排列，获取初始聚簇队列；计算初始聚簇队列内相邻聚簇间的第二值差；根据第二值差对初始聚簇队列中的聚簇进行合并处理，获取合并结果；根据合并结果，获取聚簇队列。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据第二值差对初始聚簇队列中的聚簇进行合并处理，获取合并聚簇；获取合并聚簇对应的变异系数；根据变异系数以及预设变异系数阈值，识别合并聚簇中的异状态聚簇；剔除合并聚簇中的异状态聚簇，获取合并结果。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据设备状态阈值，识别待识别设备对应的实时设备状态。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于聚类的设备状态阈值确定方法，所述方法包括：

获取待识别设备的历史运行状态数据；

根据所述极值数据对所述聚簇进行排列，获得聚簇队列；

2.根据权利要求1所述的方法，其特征在于，所述对所述历史运行状态数据进行聚类，获取聚类所得聚簇中的极值数据之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述归一化数据进行聚类，并获取聚类所得的每个聚簇中的极值数据之前，还包括：

识别所述归一化数据中的异常值数据；

从所述归一化数据中剔除所述异常值数据；

所述对所述归一化数据进行聚类包括：

对剔除异常值数据后的所述归一化数据进行聚类。

4.根据权利要求1所述的方法，其特征在于，所述根据所述极值数据对所述聚簇进行排列，获得聚簇队列包括：

计算所述初始聚簇队列内相邻聚簇间的第二值差；

根据所述合并结果，获取聚簇队列。

5.根据权利要求4所述的方法，其特征在于，所述根据所述第二值差对所述初始聚簇队列中的聚簇进行合并处理，获取合并结果包括：

获取所述合并聚簇对应的变异系数；

剔除所述合并聚簇中的异状态聚簇，获取合并结果。

6.根据权利要求5所述的方法，其特征在于，所述剔除所述合并聚簇中的异状态聚簇，获取合并结果之后，还包括：

所述根据合并结果，获取聚簇队列包括：

根据更新的所述合并结果，获取聚簇队列。

7.根据权利要求1所述的方法，其特征在于，所述根据所述第一值差确定所述待识别设备对应的设备状态阈值之后，还包括：

8.一种基于聚类的设备状态阈值确定装置，其特征在于，所述装置包括：

数据获取模块，用于获取待识别设备的历史运行状态数据；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。