一种自动化检定流水线表位在线异常的检测方法及系统
技术领域
本发明涉及一种自动化检定流水线表位在线异常的检测方法及系统,属于电力设备检测技术领域。
背景技术
智能电表作为智能电网与泛在电力物联网的基础核心设备,是电力贸易公平性和电力大数据研究重要基础。截至2015年年底,我国已有3亿多电表入网运行,由于检定需求量大,目前我国主要采用自动化检定流水线对智能电表进行检定。
在自动化检定流水线的长期运行过程中,智能电表频繁接入表位,会导致表位机械压接端子出现形变;同时长期带电运行会加速机械压接端子表面材料的氧化速度,导致端子锈蚀。表位机械压接环节的形变与锈蚀将直接影响误差实验结果的可靠性,进而影响智能电表的检定质量。
目前,国家电网公司下属各省级计量中心普遍采用定期核查的方式对检定流水线表位进行检修,该方式无法及时发现表位故障,且依赖人工排查问题,其可靠性不足、人力成本高。
发明内容
为了上述问题,本发明提出了一种自动化检定流水线表位在线异常的检测方法及系统,能够对检定流水线表位进行在线异常检测,及时发现故障表位,为自动化检定流水线的运行维护工作提供指导。
本发明解决其技术问题采取的技术方案是:
一方面,本发明实施例提供的一种自动化检定流水线表位在线异常的检测方法,包括以下步骤:
1)确定特征指标:提取描述检定表位误差试验数据分布的特征指标,并形成异常检测方法中待处理的特征向量;
2)进行特征缩放:对提取的特征向量进行缩放;
3)计算异常因子数值:采用局部异常因子算法,对缩放后的特征向量进行分析处理,得到异常因子数值;
4)形成检测结果:采用格拉布斯准则对异常因子数值进行异常判定,得到检测结果。
作为本实施例一种可能的实现方式,所述特征指标包括最大值、最小值、期望、方差、偏度和峰度。
作为本实施例一种可能的实现方式,在进行特征缩放过程中,
采用Yeo-Johnson转换法对分布特征进行缩放,进行特征缩放转换公式为:
式中,y为待处理数据,λ为幂变换参数。
作为本实施例一种可能的实现方式,计算异常因子数值的具体过程为:
选取集合X中的样本点p,计算点p与其他数据点间的欧式距离,找出相距点p最近的k个点,形成点p的k邻域Nk(p);
对于给定点p,集合X中的任一点o距离点p的欧式距离记为d(p,o),距离点p第k近的点到点p间的距离记为dk(p),计算点p的第k可达距离reach_distk(p,o)为:
reach_distk(p,o)=ax{dk(o),d(p,o)} (2)
基于可达距离,计算点p的局部可达密度lrdk(p)为:
式中|Nk(p)|表示第k邻域包含的点的个数;
基于局部可达密度,计算点p的局部异常因子LOFk(p)为:
调整k邻域,k的取值范围为10≤k≤50,计算LOFk(p)最大值。
作为本实施例一种可能的实现方式,对异常因子数值进行异常判定的具体过程为:
将LOFk(p)以x=1为对称轴扩展为双侧分布;
以{LOF(p
1),LOF(p
2),LOF(p
3),…,LOF(p
n)}表示扩展后的LOF数值序列,将上述序列从小到大进行排列得到序列{x
1,x
2,x
3,…,x
n},计算该序列均值
和标准差S,然后取序列中的最大值x
n计算G值,G值计算公式如下:
将Gn与格拉布斯临界值G(α,n)进行比较,若Gn>G(α,n),则其标记为异常值,G(α,n)的大小与置信度α和样本数量n有关;
当检测出xn为异常值时,将其从原序列剔除,得到新序列{x1,x2,x3,…,xn-1},对新序列重复上述步骤,直至检测不到异常值为止。
另一方面,本发明实施例提供的一种自动化检定流水线表位在线异常的检测系统,包括:
特征指标确定模块,用于提取描述检定表位误差试验数据分布的特征指标,并形成异常检测方法中待处理的特征向量;
特征缩放模块,用于对提取的特征向量进行缩放;
异常因子数值计算模块,用于采用局部异常因子算法,对缩放后的特征向量进行分析处理,得到异常因子数值;
检测结果形成模块,用于采用格拉布斯准则对异常因子数值进行异常判定,得到检测结果。
作为本实施例一种可能的实现方式,所述特征指标包括最大值、最小值、期望、方差、偏度和峰度。
作为本实施例一种可能的实现方式,所述特征缩放模块采用Yeo-Johnson转换法对分布特征进行缩放,进行特征缩放转换公式为:
式中,y为待处理数据,λ为幂变换参数。
作为本实施例一种可能的实现方式,所述异常因子数值计算模块计算异常因子数值的具体过程为:
选取集合X中的样本点p,计算点p与其他数据点间的欧式距离,找出相距点p最近的k个点,形成点p的k邻域Nk(p);
对于给定点p,集合X中的任一点o距离点p的欧式距离记为d(p,o),距离点p第k近的点到点p间的距离记为dk(p),计算点p的第k可达距离reach_distk(p,o)为:
reach_distk(p,o)=ax{dk(o),d(p,o)} (2)
基于可达距离,计算点p的局部可达密度lrdk(p)为:
式中|Nk(p)|表示第k邻域包含的点的个数;
基于局部可达密度,计算点p的局部异常因子LOFk(p)为:
调整k邻域,k的取值范围为10≤k≤50,计算LOFk(p)最大值。
作为本实施例一种可能的实现方式,所述检测结果形成模块对异常因子数值进行异常判定的具体过程为:
将LOFk(p)以x=1为对称轴扩展为双侧分布;
以{LOF(p
1),LOF(p
2),LOF(p
3),…,LOF(p
n)}表示扩展后的LOF数值序列,将上述序列从小到大进行排列得到序列{x
1,x
2,x
3,…,x
n},计算该序列均值
和标准差S,然后取序列中的最大值x
n计算G值,G值计算公式如下:
将Gn与格拉布斯临界值G(α,n)进行比较,若Gn>G(α,n),则其标记为异常值,G(α,n)的大小与置信度α和样本数量n有关;
当检测出xn为异常值时,将其从原序列剔除,得到新序列{x1,x2,x3,…,xn-1},对新序列重复上述步骤,直至检测不到异常值为止。
本发明实施例的技术方案可以具有的有益效果如下:
本发明通过分析检定结果进行异常识别,能及时且准确地识别表位故障,有效提高检修效率,降低人地成本,降低不合格智能电表入网概率,确保电力贸易公平性和大数据研究准确性;无需对流水线进行停运检修,也不需要增加额外的硬件设备,减少了定期检修带来的人力、时间成本。
本发明采用数据驱动的特征分析检定表位误差实验结果的分布情况,通过分布情况的差异性反映表位检定性能的差异性,利用局部异常因子算法对样本数据进行分析,进一步判别出差异性较大的异常表位,可以查找出人工检定无法发现的潜在的性能退化问题,为自动化检定流水线检修工作提供指导,大大降低了异常表位带来的潜在风险。
附图说明:
图1是根据一示例性实施例示出的一种自动化检定流水线表位在线异常的检测方法的流程图;
图2是根据一示例性实施例示出的一种自动化检定流水线表位在线异常的检测系统的原理框图;
图3是利用本发明所述方法检测智能电表自动化检定流水线表位在线异常的流程图。
具体实施方式
下面结合附图与实施例对本发明做进一步说明:
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
图1是根据一示例性实施例示出的一种自动化检定流水线表位在线异常的检测方法的流程图。如图1所示,本发明实施例提供的一种自动化检定流水线表位在线异常的检测方法,包括以下步骤:
1)确定特征指标:提取描述检定表位误差试验数据分布的特征指标,并形成异常检测方法中待处理的特征向量;
2)进行特征缩放:对提取的特征向量进行缩放;
3)计算异常因子数值:采用局部异常因子算法,对缩放后的特征向量进行分析处理,得到异常因子数值;
4)形成检测结果:采用格拉布斯准则对异常因子数值进行异常判定,得到检测结果。
作为本实施例一种可能的实现方式,所述特征指标包括最大值、最小值、期望、方差、偏度和峰度。
作为本实施例一种可能的实现方式,在进行特征缩放过程中,
采用Yeo-Johnson转换法对分布特征进行缩放,进行特征缩放转换公式为:
式中,y为待处理数据,λ为幂变换参数。
作为本实施例一种可能的实现方式,计算异常因子数值的具体过程为:
选取集合X中的样本点p,计算点p与其他数据点间的欧式距离,找出相距点p最近的k个点,形成点p的k邻域Nk(p);
对于给定点p,集合X中的任一点o距离点p的欧式距离记为d(p,o),距离点p第k近的点到点p间的距离记为dk(p),计算点p的第k可达距离reach_distk(p,o)为:
reach_distk(p,o)=ax{dk(o),d(p,o)} (2)
基于可达距离,计算点p的局部可达密度lrdk(p)为:
式中|Nk(p)|表示第k邻域包含的点的个数;
基于局部可达密度,计算点p的局部异常因子LOFk(p)为:
调整k邻域,k的取值范围为10≤k≤50,计算LOFk(p)最大值。
作为本实施例一种可能的实现方式,对异常因子数值进行异常判定的具体过程为:
将LOFk(p)以x=1为对称轴扩展为双侧分布;
以{LOF(p
1),LOF(p
2),LOF(p
3),…,LOF(p
n)}表示扩展后的LOF数值序列,将上述序列从小到大进行排列得到序列{x
1,x
2,x
3,…,x
n},计算该序列均值
和标准差S,然后取序列中的最大值x
n计算G值,G值计算公式如下:
将Gn与格拉布斯临界值G(α,n)进行比较,若Gn>G(α,n),则其标记为异常值,G(α,n)的大小与置信度α和样本数量n有关;
当检测出xn为异常值时,将其从原序列剔除,得到新序列{x1,x2,x3,…,xn-1},对新序列重复上述步骤,直至检测不到异常值为止。
图2是根据一示例性实施例示出的一种自动化检定流水线表位在线异常的检测系统的原理框图。如图2所示,本发明实施例提供的一种自动化检定流水线表位在线异常的检测系统,包括:
特征指标确定模块,用于提取描述检定表位误差试验数据分布的特征指标,并形成异常检测方法中待处理的特征向量;
特征缩放模块,用于对提取的特征向量进行缩放;
异常因子数值计算模块,用于采用局部异常因子算法,对缩放后的特征向量进行分析处理,得到异常因子数值;
检测结果形成模块,用于采用格拉布斯准则对异常因子数值进行异常判定,得到检测结果。
作为本实施例一种可能的实现方式,所述特征指标包括最大值、最小值、期望、方差、偏度和峰度。
作为本实施例一种可能的实现方式,所述特征缩放模块采用Yeo-Johnson转换法对分布特征进行缩放,进行特征缩放转换公式为:
式中,y为待处理数据,λ为幂变换参数。
作为本实施例一种可能的实现方式,所述异常因子数值计算模块计算异常因子数值的具体过程为:
选取集合X中的样本点p,计算点p与其他数据点间的欧式距离,找出相距点p最近的k个点,形成点p的k邻域Nk(p);
对于给定点p,集合X中的任一点o距离点p的欧式距离记为d(p,o),距离点p第k近的点到点p间的距离记为dk(p),计算点p的第k可达距离reach_distk(p,o)为:
reach_distk(p,o)=ax{dk(o),d(p,o)} (2)
基于可达距离,计算点p的局部可达密度lrdk(p)为:
式中|Nk(p)|表示第k邻域包含的点的个数;
基于局部可达密度,计算点p的局部异常因子LOFk(p)为:
调整k邻域,k的取值范围为10≤k≤50,计算LOFk(p)最大值。
作为本实施例一种可能的实现方式,所述检测结果形成模块对异常因子数值进行异常判定的具体过程为:
将LOFk(p)以x=1为对称轴扩展为双侧分布;
以{LOF(p
1),LOF(p
2),LOF(p
3),…,LOF(p
n)}表示扩展后的LOF数值序列,将上述序列从小到大进行排列得到序列{x
1,x
2,x
3,…,x
n},计算该序列均值
和标准差S,然后取序列中的最大值x
n计算G值,G值计算公式如下:
将Gn与格拉布斯临界值G(α,n)进行比较,若Gn>G(α,n),则其标记为异常值,G(α,n)的大小与置信度α和样本数量n有关;
当检测出xn为异常值时,将其从原序列剔除,得到新序列{x1,x2,x3,…,xn-1},对新序列重复上述步骤,直至检测不到异常值为止。
图3是利用本发明所述方法检测智能电表自动化检定流水线表位在线异常的流程图。如图3示,选择某个批次的智能电表在某一检定单元中的误差试验数据,采用本发明提出的一种智能电表自动化检定流水线表位在线异常检测方法进行分析,具体实施步骤描述如下:
1)确定特征指标:
提取可以充分描述检定表位误差试验数据分布的特征指标,形成异常检测方法中待处理的特征向量。
所选取的检定单元中共有60个检定表位,即60个数据样本,每个样本包含6(指标)×10(试验项目数)=60个特征值,选取某一试验项目,其各项指标如表1所示;
表1
2)进行特征缩放:
对提取的特征向量进行缩放,以保留更多的特征信息,提高异常检测方法的预测性能。
采用Yeo-Johnson转换法对分布特征进行缩放,转换公式定义如下:
式中,y为待处理数据,λ为幂变换参数。该变换可以将数据拟合为近似正太分布,并使数据集合的均值为0,标准差为1。
对数据特征进行缩放,防止较大尺度的特征数据弱化其他特征数据的影响,使得特征向量相较于缩放前可以保留更多的特征信息,提高算法预测的准确性;
3)计算异常因子数值:
采用局部异常因子(Local Outlier Factor,LOF)算法,对缩放后的特征向量进行分析处理;
LOF算法是基于密度的异常检测算法,它并不直接判断数据样本是否是异常点,而是通过给出样本的异常因子数值,来体现样本的异常程度,具体计算步骤如下;
选取集合X中的样本点p,计算点p与其他数据点间的欧式距离,找出相距点p最近的k个点,形成点p的k邻域Nk(p);对于给定点p,集合X中的任一点o距离点p的欧式距离记为d(p,o),距离点p第k近的点到点p间的距离记为dk(p),计算点p的第k可达距离reach_distk(p,o)为:
reach_distk(p,o)=ax{dk(o),d(p,o)} (2)
基于可达距离,计算点p的局部可达密度lrdk(p)为:
式中|Nk(p)|表示第k邻域包含的点的个数。
基于局部可达密度,计算点p的局部异常因子LOFk(p)为:
调整k邻域,计算LOF最大值;
选取LOF算中参数k的取值范围为10≤k≤50,此范围为推荐值,可根据实际工程情况进行调整。计算取值范围内所有k值对应的LOF数值,选择其中的最大值作为表位的异常数值,更易突出检定表位数据分布的异常;
采用LOF算法分析经特征缩放处理的数据,得到该检定单元60个检定表位的异常因子数值,记为LOF数值,如表2所示;
表2
4)形成检测结果:
采用格拉布斯准则对LOF数值进行异常判定,得到检测结果;
对于任一检定单元数据集,大部分表位的分布特征应趋于一致,因此多数表位的LOF数值接近于1,对于少部分异常表位,其LOF数值大于1,LOF总体呈单侧分布。由于格拉布斯准则应用于单侧分布时会产生较多异常,因此需要扩展序列,将LOF以x=1为对称轴扩展为双侧分布。相比于拉伊达准则,格拉布斯准则更适合样本数量较少的数据,误判率较低;
以{LOF(p
1),LOF(p
2),LOF(p
3),…,LOF(p
n)}表示扩展后的LOF数值序列,根据格拉布斯准则,首先将上述序列从小到大进行排列得到序列{x
1,x
2,x
3,…,x
n},计算该序列均值
和标准差S,然后取序列中的最大值x
n计算G值,G值计算公式如下:
将Gn与格拉布斯临界值G(α,n)进行比较,若Gn>G(α,n),则其标记为异常值,G(α,n)的大小与置信度α和样本数量n有关。当检测出xn为异常值时,将其从原序列剔除,得到新序列{x1,x2,x3,…,xn-1},对新序列重复上述步骤,直至检测不到异常值;
应用格拉布斯准则对上述LOF数值进行判定,选取置信度α=0.05,判定结果如表3所示;
表3
由表3可知,该样本中最大的4个LOF数值被判定为异常值,其对应的4个检定表位均判定为异常表位,根据异常程度排序为14、15、41、28号。第五个样本值的G值小于格拉布斯临界值,因此该表位的状态判定为正常。将格拉布斯准则应用与其他表位,其结果均显示正常。
本发明提取可以充分描述检定表位误差试验数据分布的特征指标,形成异常检测方法中待处理的特征向量;对提取的特征向量进行缩放,以保留更多的特征信息,提高异常检测方法的预测性能;采用局部异常因子算法,对缩放后的特征向量进行分析处理,得到异常因子数值;采用格拉布斯准则对异常因子数值进行异常判定,形成检测结果。本发明公开的方法无需对流水线进行停运检修,也不需要增加额外的硬件设备,减少了定期检修带来的人力、时间成本;通过数据驱动的方式可以查找出人工检定无法发现的潜在的性能退化问题,为自动化检定流水线检修工作提供指导,大大降低了异常表位带来的潜在风险,对于降低不合格智能电表入网概率和确保电力贸易公平性有着重要意义。
以上所述只是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也被视作为本发明的保护范围。