发明内容
本申请实施例提供了一种设备工况预警方法及相关装置,用于提高对工业设备运行状态的预测准确度。
本申请实施例第一方面提供一种设备工况预警方法,包括:
获取设备历史一段时间内正常运行状态下多个测点的目标历史数据;
使用聚类算法对所述多个测点的目标历史数据进行运算以获得至少一个聚类中心,一个所述聚类中心对应所述多个测点在同一时刻的目标历史数据;
获取每一所述测点监测到的实时数据;
使用状态估计算法对所述多个测点的实时数据和所述至少一个聚类中心进行运算,以得到各个所述测点的预测数据;
对同一所述测点的实时数据和预测数据进行残差分析,以确定所述测点是否异常。
可选地,所述获取设备历史一段时间内正常运行状态下多个测点的目标历史数据包括:
获取设备历史一段时间内正常运行状态下多个测点的初始历史数据;
对所述初始历史数据进行过滤预处理,以得到所述目标历史数据。
可选地,所述对所述初始历史数据进行过滤预处理,以得到所述目标历史数据包括:
采用周期最值比较法、拉依达准则法和物理边界法中的一种或多种方法,对所述初始历史数据进行过滤预处理,以得到所述目标历史数据。
可选地,所述使用聚类算法对所述多个测点的目标历史数据进行运算以获得至少一个聚类中心包括:
使用高斯混合模型聚类算法对所述多个测点的目标历史数据进行运算以获得至少一个聚类中心,其中聚类中心的个数通过模型选择准则确定。
可选地,所述使用状态估计算法对所述多个测点的实时数据和所述至少一个聚类中心进行运算,以得到各个所述测点的预测数据包括:
分别对所述聚类中心和所述实时数据进行缩放处理;
使用状态估计算法对缩放处理后的聚类中心和缩放处理后的实时数据进行运算,以得到各个所述测点的预测数据。
可选地,所述使用状态估计算法对所述多个测点的实时数据和所述至少一个聚类中心进行运算,以得到各个所述测点的预测数据包括:
分别对所述聚类中心和所述实时数据进行缩放处理;
将缩放处理后的聚类中心构建成记忆矩阵;
使用非线性状态估计算法对所述记忆矩阵和缩放处理后的实时数据进行运算,以得到各个所述测点的预测数据。
可选地,所述对同一所述测点的实时数据和预测数据进行残差分析,以确定所述测点是否异常包括:
对各个所述测点的预测数据进行反缩放处理;
对同一所述测点的实时数据和反缩放处理后的预测数据进行残差分析。
可选地,所述记忆矩阵的表示如下:
其中,所述D用于表示记忆矩阵,所述X(m)用于表示第m个时刻的聚类中心,所述n用于表示测点的个数,所述xn(m)用于表示第m个时刻第n个测点监测到的目标历史数据。
可选地,所述状态估计算法为线性状态估计算法,例如,最小二乘法、极大似然法或卡尔曼滤波法。
可选地,所述模型选择准则为贝叶斯信息准则或赤池信息准则。
本申请实施例第二方面提供一种设备工况预警装置,包括:
获取单元,用于获取设备历史一段时间内正常运行状态下多个测点的目标历史数据;
处理单元,用于使用聚类算法对所述多个测点的目标历史数据进行运算以获得至少一个聚类中心,一个所述聚类中心对应所述多个测点在同一时刻的目标历史数据;
所述获取单元,用于获取每一所述测点监测到的实时数据;
所述处理单元,用于使用状态估计算法对所述多个测点的实时数据和所述至少一个聚类中心进行运算,以得到各个所述测点的预测数据;
所述处理单元,用于对同一所述测点的实时数据和预测数据进行残差分析,以确定所述测点是否异常。
本申请实施例第三方面提供一种设备工况预警装置,包括:
中央处理器,存储器以及输入输出接口;
所述存储器为短暂存储存储器或持久存储存储器;
所述中央处理器配置为与所述存储器通信,并执行所述存储器中的指令操作以执行第一方面或第一方面的任一具体实现方式所述的方法。
本申请实施例第四方面提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行第一方面或第一方面的任一具体实现方式所述的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例的设备工况预警方法,包括:在获取到设备多个测点的目标历史数据后,使用聚类算法对多个测点的目标历史数据进行运算以获得至少一个聚类中心;其中,目标历史数据应当是历史一段时间内,设备正常运行状态下多个测点所监测到的历史数据;一个聚类中心对应多个测点在同一时刻的目标历史数据;获取每一测点监测到的实时数据。可见,每一聚类中心具有代表性意义,即每一聚类中心能作为某一时刻的典型历史数据,代表设备正常运行状态下同一时刻各测点的目标历史数据,以有效提高数据的价值密度和后续的算法分析时效。此外,通过使用状态估计算法对多个测点的实时数据和至少一个聚类中心进行运算,以得到各个测点的预测数据后,对同一测点的实时数据和预测数据进行残差分析,则可以数据量化的形式准确判断出每一测点是否异常。本申请实施例的设备工况预警方法,通过结合使用聚类算法和状态估计算法,可以数据量化的形式判断出设备的各个测点是否出现异常,以提高对工业设备运行状态的预警准确度;而当设备出现异常时,残差分析结果可助于设备作业员排查出设备运行状况(即设备工况)异常的起因在于哪一测点,从而及时地对设备展开维护处理,以提高设备运营的安全和经济效果。
具体实施方式
本申请实施例提供了一种设备工况预警方法及相关装置,用于提高对工业设备运行状态的预测准确度。
需要说明的是,测点可以理解为安装在设备上的传感器,每一测点用以监测一种参数类型的数据,该参数类型具体可以包括温度、压力和流量中的一种或多种。
请参阅图1,本申请第一方面提供设备工况预警方法的一个实施例,包括:
101、获取设备多个测点的目标历史数据。
为使得每一聚类中心能作为某一时刻的典型历史数据,代表设备正常运行状态下同一时刻各测点的目标历史数据,以有效提高数据的价值密度和后续的算法分析时效,目标历史数据应当是历史一段时间内,正常运行状态下多个测点所监测到的历史数据。
实际应用中,因现场采集到的数据会受外界扰动、传感器自身问题、网络异常等影响引发数据质量问题,使得数值持续时间内数值不变、数据明显超出机组运行范围等现象,故需要对数据进行过滤预处理,以提高数据质量。在一具体实施例中,获取设备多个测点的目标历史数据包括:在获取设备历史一段时间内正常运行状态下多个测点的初始历史数据后,对初始历史数据进行过滤预处理,以得到目标历史数据。为保证各个聚类中心的采集同时性和代表性,初始历史数据应当是特定历史一段时间内,设备正常运行状态下各测点在同一时刻的监测数据,历史一段时间具体可以为:避开设备异常过程时间段、设备异常前一天至两天、设备异常后一天至两天、检修时间段、检修前一天至两天和检修后一天至两天中的时间段,采集频率依据样本量规模可设置为60秒至300秒。具体地,可以采用周期最值比较法、拉依达准则法和物理边界法中的一种或多种方法,对初始历史数据进行过滤预处理,以筛选得到目标历史数据,其中不满足留存条件的数据将被剔除过滤掉。
周期最值比较法:采用周期内最大值等于最小值的判据以剔除数值不变的异常值,表示如下:
if Max[Vn(t)]=Min[Vn(t)]t∈[tl,th]n=1,2,3,…n
delete Vn(t);
其中,Max[Vn(t)]为当前周期内的最大值;Min[Vn(t)]为当前周期内最小值;[tl,th]为时间周期范围;n为选取不同参数类型(参数类型也可以理解为维度)的参数,例如负荷、主蒸汽温度、流量等。
拉依达准则法也称为3sigma准则法:采用3sigma准则对数据进行可信度计算以剔除显著异常值,表示如下:
if|Vn(t)-AVG(tl,th)|>3×STD(tl,th)
deleteV(t);
其中,|V(t)-AVG(tl,th)|为当前值与周期内平均值之差;STD(tl,th)为当前周期内标准差。
物理边界法:采用物理边界方法对参数进行过滤,满足下式的数据留下:
Vl<Vn(t)<Vh;
其中,Vl和Vh分别为参数Vn(t)的两处边界。
102、使用聚类算法运算得至少一个聚类中心。
使用聚类算法对多个测点的目标历史数据进行运算以获得至少一个聚类中心,一个聚类中心对应多个测点在同一时刻的目标历史数据,聚类中心用于通过状态估计算法运算得各个测点的预测数据。
在一具体实施例中,使用聚类算法运算得至少一个聚类中心包括:使用高斯混合模型聚类算法对多个测点的目标历史数据进行运算以获得至少一个聚类中心,其中,高斯混合模型聚类算法选用了最大期望算法EM(EM,expectation maximization algorithm),聚类中心的个数通过模型选择准则确定。此外,还可以使用K-means聚类算法或其他聚类算法对多个测点的目标历史数据进行运算以获得至少一个聚类中心。因算法模型训练过程中,增加参数数量,会增大似然函数和模型精度,但也会导致过拟合现象,增加模型复杂度,故针对该问题,可引用模型选择准则确定参数数量,以有效防止模型精度过高造成的模型复杂度过高,所使用的模型选择准则可以为贝叶斯信息准则BIC(BIC,bayesianinformation criterion)或赤池信息准则AIC(AIC,akaike information criterion)。
当使用高斯混合模型聚类算法时,本申请实施例的高斯混合模型参数P(x)可表示为:
式中,π是混合系数(可以理解为权重系数),Nk(xk|μk,Σk)称为高斯混合模型中的第k个高斯分布概率密度函数分量,xk是在当前第k个高斯分布内的实际观察值(可理解为某一目标历史数据),μk和Σk分别为第k个高斯分布中的数据均值和方差,K为聚类中心的个数。
采用EM算法进行参数估计,其算法步骤为:
(1)指定π、μ、Σ的初始值,此三项初始值可随机指定或由K-means聚类算法确定。
(2)计算后验概率γ(Znk):
(3)求解μk的最大似然函数:
(4)求解Σk的最大似然函数:
(5)求解πk的最大似然函数:
πk=Nk/N,其中N为k个Nk的总和;
重复步骤(2)至(5),直至算法收敛,即确定参数P(x)。
其中,当使用BIC准则确定聚类中心的个数K时,BIC准则会引入与模型参数个数相关的惩罚项kln(n)以有效防止模型精度过高造成的模型复杂度过高,该惩罚项考虑了样本数量n,下式中BIC的值越小表示对应取用的K越优:
BIC=kln(n)-2ln(L);
式中,k为模型参数个数,k=4K(k与K正相关,数值四表示参数P(x)中存在π、μ、Σ和N四个参数),n为样本数量,L为目标历史数据的似然函数。
当使用AIC准则确定聚类中心的个数K时,同理,下式中AIC的值越小表示对应取用的K会越优:
AIC=2k-2ln(L);
式中,k为模型参数个数,k=4K,L为目标历史数据的似然函数。
103、获取每一测点监测到的实时数据。
通过各个测点获取设备的实时数据(也可理解为实时的观测数据),以用于估计出各个测点在不同时刻的预测数据。
104、使用状态估计算法运算得各个测点的预测数据。
使用状态估计算法对多个测点的实时数据和至少一个聚类中心进行运算,以得到各个测点的预测数据。使用的状态估计算法可以是线性状态估计算法,例如,最小二乘法、极大似然法和卡尔曼滤波法中的一种,但考虑到不同的状态估计算法对数据样本的适用性和广度不同,故优选地,使用非线性状态估计算法NSET(NSET,nonlinear state estimatetechnology)。实际应用中,对数据做缩放处理可避免离群数据对算法的干扰,以提升鲁棒性,本申请实施例中的缩放处理可以使用四分位距缩放法,对应地反缩放时使用四分位距反缩放法。
在一具体实施例中,使用状态估计算法运算得各个测点的预测数据包括:分别对由高斯混合模型聚类算法获得的聚类中心和实时数据进行四分位距缩放处理;将缩放处理后的聚类中心构建成记忆矩阵;使用非线性状态估计算法对记忆矩阵和缩放处理后的实时数据进行运算,以得到各个测点的预测数据。其中,需要选择m条能够覆盖全部参数类型的目标历史数据以构建成记忆矩阵D,因本申请实施例中一个聚类中心可以对应表示一条目标历史数据,故m也可理解为聚类中心的个数K,记忆矩阵D的表达式可如下:
式中,X(m)用于表示第m个时刻的聚类中心,n用于表示测点的个数,xn(m)用于表示第m个时刻第n个测点监测到的目标历史数据。
使用NSET算法运算得各个测点的预测数据,包括:
对于输入观测向量即多个测点检测到的实时数据Xobs,NSET算法会对应生成一个未知的权值向量W,以得到输出预测向量即多个测点的预测数据Xobs,W和Xobs的表达式可如下:
W=[ω1ω2…ωm]T,
Xest=D·W=ω1·X(1)+ω2·X(2)+…+ωm·X(m);
为了求解权重向量,模型的输入观测向量和输出预测向量之间的残差应该取最小:
minε=min(|Xobs-Xest|);
通过上述几个表述式,输出预测向量可表示为:
Xest=D·W=D·(DT·D)-1·(DT·Xobs)
而考虑到不同向量之间的相似度差异,最终得到的输出预测向量可表示为:
式中,
是一种非线性算子,用于替换一般矩阵运算中的乘号,可以用来衡量两个样本之间的相似程度,本申请实施例中的非线性算子可为欧几里得距离、城市距离和高斯算子中的一种。
105、对实时数据和预测数据进行残差分析。
对同一测点的实时数据和预测数据进行残差分析,分析结果可以残差大小表示,以确定测点是否异常;具体过程可以为:对于每一个测点可以根据实际物理意义(可以对应理解为参数类型,例如温度、压力或流量)和相关经验规定一个预设阈值,当某一测点的残差大小超过预设阈值时可判定该测点存在异常,即最终可以数据量化的形式准确地判断出设备的异常点在何处,以便设备作业员及时地对设备展开维护处理,提高设备运营的安全和经济效果。
在一具体实施例中,对实时数据和预测数据进行残差分析包括:对各个测点的预测数据进行四分位距反缩放处理;对同一测点的实时数据和反缩放处理后的预测数据进行残差分析,以确定测点是否异常。
关于上述步骤102和104,可理解为:在一具体实施例中,取由高斯混合模型聚类算法获得的聚类中心作为NSET算法中记忆矩阵D的数据来源,以得到各个测点的预测数据,从而准确地预测出设备运行状态及异常测点位置。其中,记忆矩阵D因具有样本少和代表性强的优点,在运算时计算量小,可以减小对计算机或计算系统的负荷,提高数据测算的速度和准确度。
以上对本申请的设备工况预警方法进行了实施例描述,下面将对本申请的设备工况预警装置进行实施例描述,请参阅图2,本申请第二方面提供设备工况预警装置的一个实施例,包括:
获取单元201,用于获取设备历史一段时间内正常运行状态下多个测点的目标历史数据;
处理单元202,用于使用聚类算法对多个测点的目标历史数据进行运算以获得至少一个聚类中心,一个聚类中心对应多个测点在同一时刻的目标历史数据;
获取单元201,用于获取每一测点监测到的实时数据;
处理单元202,用于使用状态估计算法对多个测点的实时数据和至少一个聚类中心进行运算,以得到各个测点的预测数据;
处理单元202,用于对同一测点的实时数据和预测数据进行残差分析,以确定测点是否异常。
本申请实施例中,设备工况预警装置中各单元所执行的操作与前述第一方面方法实施例或第一方面的任一具体实施例所描述的操作类似,此处不再赘述。
请参阅图3,本申请实施例的设备工况预警装置300可以包括一个或一个以上中央处理器CPU(CPU,central processing units)301和存储器305,该存储器305中存储有一个或一个以上的应用程序或数据。
其中,存储器305可以是易失性存储或持久存储。存储在存储器305的程序可以包括一个或一个以上模块,每个模块可以包括对设备工况预警装置中的一系列指令操作。更进一步地,中央处理器301可以设置为与存储器305通信,在设备工况预警装置300上执行存储器305中的一系列指令操作。
设备工况预警装置300还可以包括一个或一个以上电源302,一个或一个以上有线或无线网络接口303,一个或一个以上输入输出接口304,和/或,一个或一个以上操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等。
该中央处理器301可以执行前述第一方面方法实施例或第一方面的任一具体实施例所描述的操作,具体此处不再赘述。
可以理解的是,在本申请的各种实施例中,各步骤的序号的大小并不意味着执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,设备工况预警装置,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-only memory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。