发明内容
有鉴于此,本发明实施例提供一种设备阈值确定方法和系统,以解决现有技术中根据长时间的检修经验来估算设备阈值,确定的设备阈值精确性较低,适应性也较弱的问题。
为实现上述目的,本发明实施例提供如下技术方案:
一种设备阈值确定方法,包括:
获取设备的数据样本,所述设备来自同一总体;
判断所述数据样本是否服从正态分布,若服从,则确定所述数据样本的期望和标准差;
根据所述期望和标准差计算所述数据样本的显著性差异阈值,将所述显著性差异阈值作为所述设备的阈值。
其中,所述数据样本为经过绘制箱式图筛选去除极端值后的数据样本。
其中,所述判断所述数据样本是否服从正态分布包括:
根据所述数据样本绘制直方图;
根据所述直方图判断所述数据样本是否服从正态分布;
若服从,则对所述数据样本进行K-S检验,根据所述K-S检验结果判断所述数据样本是否服从正态分布;
若服从,则判定所述数据样本服从正态分布。
其中,所述对所述数据样本进行K-S检验,根据所述K-S检验结果判断所述数据样本是否服从正态分布包括:
假设所述数据样本为正态分布,建立假设分布函数;
根据所述数据样本建立经验分布函数;
计算所述假设分布函数和所述经验分布函数间的最大偏差量;
判断所述最大偏差量是否小于K-S检验的临界值,若是,则确定所述数据样本为正态分布。
其中,所述假设分布函数:
所述经验分布函数:
所述最大偏差量为:max{d1,d1,...di...,dn};
其中,di为第i个偏差量,
其中,μ为所述数据样本的期望,σ为所述数据样本的标准差,n为所述数据样本的容量,X(i)为所述样本数据的第i个次序统计量。
其中,所述K-S检验的临界值D(n,β)为通过K-S检验临界值表查询得到,其中,β为K-S检验的显著性水平。
其中,所述显著性差异阈值为T=μ+σu1-a和/或T=μ-σu1-a;
其中,μ为所述数据样本的期望,σ为所述数据样本的标准差,u服从标准正态分布,u1-a表示标准正态分布中小于1-a的概率,a为所述数据样本的显著性水平。
一种设备阈值确定系统,包括:获取模块、判断模块和计算模块;其中,
所述获取模块,用于获取设备的数据样本,所述设备来自同一总体;
所述判断模块,用于判断所述数据样本是否服从正态分布,若服从,则确定所述数据样本的期望和标准差;
所述计算模块,用于根据所述期望和标准差计算所述数据样本的显著性差异阈值,将所述显著性差异阈值作为所述设备的阈值。
其中,所述判断模块包括:绘制单元、第一判断单元、第二判断单元和判定单元;其中,
所述绘制单元,用于根据所述数据样本绘制直方图;
所述第一判断单元,用于根据所述直方图判断所述数据样本是否服从正态分布;
所述第二判断单元,用于当根据所述直方图判定所述数据样本服从正态分布时,对所述数据样本进行K-S检验,根据所述K-S检验结果判断所述数据样本是否服从正态分布;
所述判定单元,用于当根据所述K-S检验结果判定所述数据样本服从正态分布时,判定所述数据样本服从正态分布。
其中,所述第二判断单元包括:第一建立子单元、第二建立子单元、计算子单元和判断子单元;其中,
所述第一建立子单元,用于假设所述数据样本为正态分布,建立假设分布函数;
所述第二建立子单元,用于根据所述数据样本建立经验分布函数;
所述计算子单元,用于计算所述假设分布函数和所述经验分布函数间的最大偏差量;
所述判断子单元,用于判断所述最大偏差量是否小于K-S检验的临界值,若是,则确定所述数据样本为正态分布。
基于上述技术方案,本发明实施例提供的设备阈值确定方法,当需要确定设备的某项阈值时,获取自同一总体的各设备的数据样本,然后判断该数据样本是否服从正态分布,若该数据样本服从正态分布,则确定该数据样本的期望和标准差,并在确定该数据样本的期望和标准差后根据确定的期望和标准差,计算该数据样本的显著性差异阈值,将该显著性差异阈值作为设备的阈值。若获取的数据样本存在显著性差异,则说明设备在运行过程中发生了根本性状改变,因此,将计算得到的显著性差异阈值作为设备的阈值,将可以有效地将设备发生根本性改变的阈值找出,以便能够及时排除各设备的故障隐患,与根据长时间的检修经验来估算设备阈值相比,提高了设备阈值的精度和适应性。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供一种设备阈值确定方法的流程图,若获取的数据样本服从正态分布,则在确定获取的数据样本的期望和标准差后,根据确定的期望和标准差计算该数据样本的显著性差异阈值,将该显著性差异阈值作为设备的阈值,若获取的数据样本存在显著性差异,则说明设备在运行过程中发生了根本性状改变,因此,将计算得到的显著性差异阈值作为设备的阈值,将可以有效地将设备发生根本性改变的阈值找出,以便能够及时排除各设备的故障隐患,提高了设备阈值的精度和适应性,参照图1,该设备阈值确定方法可以包括:
步骤S100:获取设备的数据样本,所述设备来自同一总体;
同一总体是指根据研究目的而确定的同质观察单位的全体,来自同一总体的设备具有同质性和大量性,即来自同一总体的设备在某一方面具有共性,组成总体的设备不止一个。若获取数据样本的设备来自不同的总体,则将会影响到获取的数据样本的分布类型以及期望和标准差的真实性,从而影响计算得到的设备阈值的准确性和适应性。
可选的,获取的数据样本可以是经过绘制箱式图筛选去除极端值后的数据样本。即,用来计算设备阈值的数据样本,为在获取设备的原始数据,并根据该获取的原始数据绘制箱式图,根据该箱式图去除了极端值后,得到设备的数据样本。若用于计算设备阈值的数据样本,为经过制箱式图筛选去除极端值后数据样本,则可以使得到的设备阈值更加准确,具有更高的精确性。
步骤S110:判断所述数据样本是否服从正态分布;
若获取的数据样本存在某一方面的共性,且获取的数据样本的数据满足一定的数目,则获取的数据样本一般均将具有自己的概率分布类别,其中,常见的概率分分布类型有两点分布、二项分布和正态分布等
可选的,可以通过对获取的数据样本进行非参数检验,根据该非参数检验的检验结果来判断获取的数据样本是否服从正态分布,通过非参数检验结果来判断获取的数据样本是否服从正态分布的方法,可在一定程度上提高得到结果的精确性。
可选的,当通过对获取的数据样本进行非参数检验,根据该非参数检验的检验结果来判断获取的数据样本是否服从正态分布时,使用的非参数检验可以为K-S检验。
可选的,由于非参数检验过程计算较为复杂,对于一些明显不属于正态分布的数据进行非参数检验,可以在进行非参数检验前,先根据获取的数据样本绘制直方图,根据绘制的直方图对获取的数据样本进行是否服从正态分布的初步判断,在根据绘制的直方图初步判定获取的数据样本服从正态分布后,再进行非参数检验,若根据绘制的直方图初步判定获取的数据样本明显不服从正态分布,则不再对给获取的数据进行非参数检验,停止后续操作。
可选的,可以通过假设获取的数据样本为正态分布,建立假设分布函数,根据获取的数据样本建立经验分布函数,然后计算改建立的假设分布函数和该建立的经验分布函数间的最大偏差量,再判断该得到的最大偏差量是否小于K-S检验的临界值来进行K-S检验。若判定该得到的最大偏差量小于K-S检验的临界值,则可确定获取的数据样本为正态分布;反正,若判定该得到的最大偏差量小于K-S检验的临界值,则可确定获取的数据样本不为正态分布。其中,因为假设获取的数据样本为正态分布,因此,建立的假设分布函数正态分布的概率密度函数,即建立的假设分布函数满足正态分布。
可选的,建立的假设分布函数可以为:
其中,μ为获取的数据样本的期望,σ为获取的数据样本的标准差。
可选的,建立的分布函数可以为:
其中,n为获取的数据样本的容量,X(i)为获取的样本数据的第i个次序统计量。
其中,最大偏移量为:
max{d1,d1,...di...,dn};
其中,di为第i个偏差量。
可选的,第i个偏差量di的计算公式可以为:
可选的,K-S检验的临界值D(n,β)可以为通过K-S检验临界值表查询得到,其中,β为K-S检验的显著性水平。
步骤S120:若是,则确定所述数据样本的期望和标准差。
若判定获取的数据样本服从正态分布后,则确定该获取的数据样本的期望和标准差,根据该确定的期望和标准差进行后续操作。若判定获取的数据样本不服从正态分布,则停止操作。
步骤S130:根据所述期望和标准差计算所述数据样本的显著性差异阈值,将所述显著性差异阈值作为所述设备的阈值。
若获取的数据样本存在显著性差异,则说明设备在运行过程中发生了根本性状改变,因此,将计算得到的显著性差异阈值作为设备的阈值,将可以有效地将设备发生根本性改变的阈值找出,以便能够及时排除各设备的故障隐患,提高了设备阈值的精度和适应性。
可选的,显著性差异阈值T可以为:
T=μ+σu1-a;
和/或T=μ-σu1-a
若获取的数据样本的劣势表现为测量值减少,例如获取的数据样本为绝缘电阻时,则设置设备的阈值为μ-σu1-a,当该获取的数据样本中存在数值x小于显著性差异阈T=μ-σu1-a,即存在x<μ-σu1-a时,说明该获取的数据样本中存在显著性差异,设备在运行过程中发生了根本性状改变。
若获取的数据样本的劣势表现为测量值增加,例如获取的数据样本为介质损耗因素时,则设置设备的阈值为μ+σu1-a,当获取的数据样本中存在数值x大于显著性差异阈值T=μ+σu1-a,即存在x>μ+σu1-a时,说明获取的数据样本中存在显著性差异,设备在运行过程中发生了根本性状改变。
当需要设置阈值的设备的劣势表现为偏离初值时,例如获取的数据样本为套管电容时,则设置设备的阈值为μ-σu1-a和μ+σu1-a,当该获取的数据样本中存在数值x不小于μ+σu1-a或存在不大于μ-σu1-a,即存在时,说明该获取的数据样本中存在显著性差异,设备在运行过程中发生了根本性状改变。
其中,μ为获取的数据样本的期望,σ为获取的数据样本的标准差,u服从标准正态分布,即u~N(01),u1-a表示标准正态分布中数值小于1-a的概率,a为获取的数据样本的显著性水平。
可选的,获取的数据样本的显著性水平a可以参考GB/T4883对统计离群值的要求执行,GB/T4883将统计离群值定义为样本中的一个或几个观测值,如这几个观测值离开其他观测值较远,暗示它们可能来自于不同的总体。
可选的,a的取值可以为0.01,通过查询标准正态分布表,可以确定,当a的取值为0.01时,u1-a的取值为2.58。
基于上述技术方案,本发明实施例提供的设备阈值确定方法,当需要确定设备的某项阈值时,获取自同一总体的各设备的数据样本,然后判断该数据样本是否服从正态分布,若该数据样本服从正态分布,则确定该数据样本的期望和标准差,并在确定该数据样本的期望和标准差后根据确定的期望和标准差,计算该数据样本的显著性差异阈值,将该显著性差异阈值作为设备的阈值。若获取的数据样本存在显著性差异,则说明设备在运行过程中发生了根本性状改变,因此,将计算得到的显著性差异阈值作为设备的阈值,将可以有效地将设备发生根本性改变的阈值找出,以便能够及时排除各设备的故障隐患,与根据长时间的检修经验来估算设备阈值相比,提高了设备阈值的精度和适应性。
可选的,图2示出了本发明实施例提供的设备阈值确定方法中获取设备的数据样本的方法流程图,参照图2,该获取设备的数据样本的方法可以包括:
步骤S200:获取原始数据;
其中,获取的原始数据的设备来自同一总体。其中,原始数据是指,直接从设备上读取到的,未进行筛选排错处理的数据。
步骤S210:根据所述原始数据绘制箱式图;
箱线图是统计学中图表表示法的常用方法之一,可以相对直观的看出数据分布特点,通过箱式图每组数据均可呈现其最小值、最大值、平均水平。
步骤S220:根据所述箱式图去除所述原始数据中的极端值,得到设备的数据样本。
根据原始数据绘制箱式图后,若获取的原始数据中均在明显错误的数据,则该明显错误的数据将在该箱式图中作为极端值而展现出来,应该将获取的原始数据中的所有极端值均筛选去除,得到需要的设备数据样本,提高最终得到的设备阈值的精度。
可选的,图3示出了本发明实施例提供的设备阈值确定方法中判断获取的数据样本是否服从正态分布的方法流程图,参照图3,该判断获取的数据样本是否服从正态分布的方法可以包括:
步骤S300:根据所述数据样本绘制直方图;
直方图可以解析样本的规则性,比较直观地看出样本的分布状态,在绘制直方图时,应对资料进行分组,分组按组距相等的原则进行,最终形成以组距为底边、频数为高度的直方型矩形图,进而通过直方型矩形图来初步判断样本的分布情况。
步骤S310:根据所述直方图判断所述数据样本是否服从正态分布;
对于一些明显不属于正态分布的数据样本进行非参数检验,可以在进行非参数检验前,先根据获取的数据样本绘制直方图,根据绘制的直方图对获取的数据样本进行是否服从正态分布的初步判断,在根据绘制的直方图初步判定获取的数据样本服从正态分布后,再进行非参数检验,可省去对明显不属于正态分布的数据样本的复杂计算过程。
步骤S320:若根据所述直方图判定所述数据样本服从正态分布服从,则对所述数据样本进行K-S检验;
若根据绘制的直方图可初步判定获取的数据样本服从正态分布,则对所述数据样本进行非参数检验,具体的,该分参数检验可以为K-S检验;若根据绘制的直方图初步判定获取的数据样本明显不服从正态分布,则不再对给获取的数据进行非参数检验,停止后续操作。
步骤S330:根据所述K-S检验结果判断所述数据样本是否服从正态分布;
若根据K-S检验结果判断获取的数据样本是否服从正态分布,则说明根据直方图研究已经初步判断获取的数据样本负荷状态分布,由于通过直方图来判断获取的数据样本是否符合正态分布精确地较低,因此,需要通过直方图来判定获取的数据样本符合正态分布后,对获取的数据再通过非参数检验结果来判断是否服从正态分布,提高得到结果的精确性。
步骤S340:若根据所述K-S检验结果判定所述数据样本服从正态分布,则判定所述数据样本服从正态分布。
若根据K-S检验结果判定获取的数据样本服从正态分布,则可以判定获取的数据样本服从正态分布;反正,若根据K-S检验结果判定获取的数据样本不服从正态分布,则可以判定获取的数据样本不服从正态分布。
可选的,图4示出了本发明实施例提供的设备阈值确定方法中对数据样本进行K-S检验的方法流程图,根据K-S检验结果判断数据样本是否服从正态分布的方法流程图,参照图4,该对数据样本进行K-S检验,根据K-S检验结果判断数据样本是否服从正态分布可以包括:
步骤S400:假设所述数据样本为正态分布,建立假设分布函数;
其中,因为假设获取的数据样本为正态分布,因此,建立的假设分布函数正态分布的概率密度函数,即建立的假设分布函数满足正态分布。
可选的,建立的假设分布函数可以为:
其中,μ为获取的数据样本的期望,σ为获取的数据样本的标准差。
步骤S410:根据所述数据样本建立经验分布函数;
可选的,建立的分布函数可以为:
其中,n为获取的数据样本的容量,X(i)为获取的样本数据的第i个次序统计量。
步骤S420:计算所述假设分布函数和所述经验分布函数间的最大偏差量;
其中,最大偏移量为:
max{d1,d1,...di...,dn};
其中,di为第i个偏差量。
可选的,第i个偏差量di的计算公式可以为:
可选的,K-S检验的临界值D(n,β)可以为通过K-S检验临界值表查询得到,其中,β为K-S检验的显著性水平。
步骤S430:判断所述最大偏差量是否小于K-S检验的临界值;
可选的,K-S检验的临界值D(n,β)可以为通过K-S检验临界值表查询得到,其中,β为K-S检验的显著性水平。
可选的,K-S检验的显著性水平β可以取值为0.05。
步骤S440:若是,则确定所述数据样本服从正态分布。
若最大偏差量小于K-S检验的临界值,则说明获取的数据样本服从正态分布;反正,若最大偏差量大于或等于K-S检验的临界值,则说明获取的数据样本不服从正态分布。
本发明实施例提供的设备阈值确定方法,若获取的数据样本服从正态分布,则在确定获取的数据样本的期望和标准差后,根据确定的期望和标准差计算该数据样本的显著性差异阈值,将该显著性差异阈值作为设备的阈值,有效地将设备发生根本性改变的阈值找出,及时排除各设备的故障隐患,提高了设备阈值的精度和适应性。
下面对本发明实施例提供的设备阈值确定系统进行介绍,下文描述的设备阈值确定系统与上文描述的设备阈值确定方法可相互对应参照。
图5为本发明实施例提供的设备阈值确定系统的结构示意图,参照图5,该设备阈值确定系统可以包括:获取模块100、判断模块200和计算模块300;其中,
获取模块100,用于获取设备的数据样本,所述设备来自同一总体;
判断模块200,用于判断所述数据样本是否服从正态分布,若服从,则确定所述数据样本的期望和标准差;
计算模块300,用于根据所述期望和标准差计算所述数据样本的显著性差异阈值,将所述显著性差异阈值作为所述设备的阈值。
可选的,图6示出了发明实施例提供的设备阈值确定系统中判断模块200的结构示意图,参照图6,该判断模块200可以包括:绘制单元210、第一判断单元220、第二判断单元230和判定单元240;其中,
绘制单元210,用于根据所述数据样本绘制直方图;
第一判断单元220,用于根据所述直方图判断所述数据样本是否服从正态分布;
第二判断单元230,用于当根据所述直方图判定所述数据样本服从正态分布时,对所述数据样本进行K-S检验,根据所述K-S检验判断所述数据样本是否服从正态分布;
判定单元240,用于当根据所述K-S检验判定所述数据样本服从正态分布时,判定所述数据样本服从正态分布。
可选的,图7示出了发明实施例提供的设备阈值确定系统中第二判断单元230的结构示意图,参照图7,该第二判断单元230可以包括:第一建立子单元231、第二建立子单元232、计算子单元233和判断子单元234;其中,
第一建立子单元231,用于假设所述数据样本为正态分布,建立假设分布函数;
第二建立子单元232,用于根据所述数据样本建立经验分布函数;
计算子单元233,用于计算所述假设分布函数和所述经验分布函数间的最大偏差量;
判断子单元234,用于判断所述最大偏差量是否小于K-S检验的临界值,若是,则确定所述数据样本为正态分布。
本发明实施例提供的设备阈值确定系统,若获取的数据样本服从正态分布,则在确定获取的数据样本的期望和标准差后,根据确定的期望和标准差计算该数据样本的显著性差异阈值,将该显著性差异阈值作为设备的阈值,有效地将设备发生根本性改变的阈值找出,及时排除各设备的故障隐患,提高了设备阈值的精度和适应性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。