CN109389145A - 基于计量大数据聚类模型的电能表生产厂商评价方法 - Google Patents
基于计量大数据聚类模型的电能表生产厂商评价方法 Download PDFInfo
- Publication number
- CN109389145A CN109389145A CN201810942973.5A CN201810942973A CN109389145A CN 109389145 A CN109389145 A CN 109389145A CN 201810942973 A CN201810942973 A CN 201810942973A CN 109389145 A CN109389145 A CN 109389145A
- Authority
- CN
- China
- Prior art keywords
- electric energy
- energy meter
- index
- quality
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 46
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 claims abstract description 59
- 239000011159 matrix material Substances 0.000 claims abstract description 41
- 238000005457 optimization Methods 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 13
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 13
- 238000013210 evaluation model Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 12
- 238000013441 quality evaluation Methods 0.000 claims description 11
- 238000012797 qualification Methods 0.000 claims description 8
- 238000012423 maintenance Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 5
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 5
- 238000009826 distribution Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 4
- 239000000654 additive Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000001303 quality assessment method Methods 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于计量大数据聚类模型的电能表生产厂商评价方法,包括步骤:获取电能表的原始数据,筛选电能表质量的评估指标;采用高斯混合模型聚类算法提取典型评估指标数据,获取聚类中心,形成电能表质量综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;分别计算电能表各项评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得电能表质量综合评估的评估矩阵;用夹角度量法对电能表的质量进行综合评估,按照从高至低的顺序将各个电能表供应商的质量进行优劣排序,获得评价结果。其可以为精准核算电能使用量和电能收入提供支撑。
Description
技术领域
本发明涉及电力系统领域,特别是涉及基于计量大数据聚类模型的电能表生产厂商评价 方法。
背景技术
随着电力市场改革的不断深入,电力营销越来越受到电力企业的重视。电能计量作为电 力营销的支撑环节,为精准核算电能使用量和电能收入提供了基础数据。电能表的质量好坏 对用电信息采集系统的数据质量、应用水平以及电力企业效益会产生直接的影响。因此,研 究电能表的综合质量评估模型和方法对提高电能表的数据质量和电力企业效益具有非常重要 的实际意义。
目前,综合评估电能计量设备质量和供应商的模型和方法还不多,这些模型和方法主要分 为三类:第一类方法是依据电能计量设备的某一个检测指标(如首检合格率)对电能表供应商 进行优劣排序;第二类方法是从不同角度提出多个电能表质量性能指标,并采用简单加权法 对指标进行综合和优劣排序,但由于不同指标对电能计量设备质量的影响程度不同(即没有考 虑不同指标对电能表质量的影响程度),从而造成该类方法的评估结果不准确;第三类方法采 用专家打分法、层次分析法(Analytic Hierarchy Process,AHP)等主观赋权法直接或间接地确 定各个指标的权重,考虑了不同指标对电能表质量的影响程度,但是限于专家的知识和经验 水平,其权重确定较为主观,从而可能导致电能表质量评估结果的差异较大。
为了及时准确地监控电能使用状态,大量的电能表安装在用户侧,终端定期将用户计量 和故障告警数据发送到用电信息采集系统。因为生产批次和安装区域不同,电能表的型号众 多、类型多样,所以电能表将产生海量的结构化和非结构化的计量和故障告警信息,传统的 数据处理方法已经很难胜任。此外,环境噪声、电磁干扰等非质量因素也可能造成电能表产 生坏数据、空数据等问题。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供基 于计量大数据聚类模型的电能表生产厂商评价方法,以达到对电能表质量作出科学、合理的 定量评价的目的。为此,本发明采取以下技术方案。
基于计量大数据聚类模型的电能表生产厂商评价方法,其特征在于,包括如下步骤:
1)获取每个批次和区域中电能表的原始数据,筛选获取衡量电能表质量的评估指标,评 估指标包括负荷采集合格率,电量数据采集率,无故障工作时间,考虑计量异常的严重异常 次数、一般异常次数、轻微异常次数,以及维修率;
2)采用高斯混合模型聚类算法提取电能表海量数据中的典型评估指标数据,获取聚类中 心,形成电能表质量综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;
3)分别计算电能表各项评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异 系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从 而获得电能表质量综合评估的评估矩阵;
4)根据评估矩阵,用夹角度量法对电能表的质量进行综合评估,按照从高至低的顺序将 各个电能表供应商的质量进行优劣排序,获得评价结果。
作为优选技术手段:采用7个衡量电能表质量的评估指标,分别为:负荷采集合格率α1, 电量数据采集率α2,无故障工作时间α3,考虑计量异常的严重异常次数α4、一般异常次数α5、 轻微异常次数α6,以及维修率α7:
式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时 间;Mi、mi、Ci和ci分别是第i个采样时间段内电能表负荷数据合格的个数、负荷数据总个 数、理论应采集的数据量和实际采集的数据量;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内 电能表发生严重、一般和轻微故障的次数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间 段;Trate和TF分别是电能表的额定运行时间和故障停运时间。
作为优选技术手段:在步骤2)高斯混合模型聚类算法中:
假设GMM由K个高斯分布混合而成,则每个高斯分布称作一个“组分”,这些“组分”线 性相加即为GMM的概率密度函数:
式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概 率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高 斯模型的方差;
电能表质量数据的GMM聚类算法流程为:
205)令l=0,随机选择初始化的ω(l),μ(l),Σ(l),求取第i个样本点xi属于第k类高斯模 型的初始化后验概率:
206)将第201)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:
式中:N为待聚类的数据点个数;
207)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第2)步;
208)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:
根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μk,Σk|xi)取得最大的那 类高斯模型中。
作为优选技术手段:在步骤2),决策矩阵为:
式中:dij表示第i个电能表供应商第j个指标的值,P为电能表供应商个数,Q为衡量供应商 的电能表质量的评价指标个数,在其中Q等于7;
效益型指标标准化处理方法为:
成本型指标标准化处理方法为:
式中:和分别表示所有P个电能表供应商中指标j的最小值和最大值;Ω1表 示效益型指标集合,其中Ω1={1,2,3};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。
作为优选技术手段:在步骤3)中,分别采用层次分析法、熵权法、相关系数法和变异 系数法计算电能表质量指标权重,接着用指标的组合优化模型计算组合权重,其中:
层次分析法为:设Q个指标为U={u1,u2,…,uQ},每次取两个指标ui和uj,按1~9的比 例用aij表示指标ui与uj对电能表质量的影响程度之比,数值越大表示ui相对于uj越重要; 这样即可获得一个电能表质量评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质: aij>0,aji=1/aij,(i=1,2,…,Q;j=1,2,…,Q);计算指标权重前首先对判断矩阵A进行一致性检验, 如果一致性检验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值 前后一致,判断矩阵A可用于求取指标权重;求取指标权重可以用列和求逆法,即:
将bj归一化,即可求得归一化后的指标权重为
式中:且
电能表质量指标的熵权为:
式中:κ表示常数κ=1/lnP,并且假定fij=0时,fijlnfij=0;且
计算皮尔逊相关系数权重时:假设d′x=(d′1x,d′2x,...,d′Px)T和d′y=(d′1y,d′2y,...,d′Py)T表示标准 化决策矩阵D′的两个列向量,则第x个指标和第y个指标之间的皮尔逊相关系数定义为
式中:和分别是向量d′x和d′y的平均值;基于皮尔逊相关系数的权重定义为
式中:且
计算变异系数法权重时:指标uj的变异系数定义为:
式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值;基于变异系数法的指标权重定义为:
式中:且
指标权重的组合优化模型为:
式中:表示待优化的第j个电能表质量指标的组合权重,表示采用第k种方法求解得到 的第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数;显然,越大,权重与最终的组合权重越贴近。
作为优选技术手段:在步骤4)用夹角度量法对电能表的质量进行综合评估,包括步骤:
405)形成P个待评估的供应商对应的Q个质量指标的评估矩阵
式中:
406)计算电能表质量评估中的理想点和负理想点,其分别为
式中:
407)分别计算每个供应商下的电能表质量指标与理想点、负理想点的夹角距离,即
式中:表示评估矩阵R的第i个行向量;
408)计算每个供应商下的电能表质量指标与理想点的夹角逼近程度,即
可以看出:第i个供应商生产的电能表质量越好,γi愈接近于1;反之,质量越差,γi越 接近于0;因此,可以根据γi取值的大小得到电能表质量的评估结果。
有益效果:本技术方案对采集到的原始数据进行清洗、填补以及聚类分析将有助于提高 电能表的数据质量,减少后续提出的电能表综合评估模型的存储规模和计算量。
附图说明
图1为本发明流程图;
图2为第1个供应商下电能表质量数据散点图及GMM聚类结果;
图3为第3个供应商下电能表质量数据散点图及GMM聚类结果;
图4为第12个供应商下电能表质量数据散点图及GMM聚类结果。
具体实施方式
为了更好地理解本发明的目的、技术方案以及技术效果,以下结合附图对本发明进行进 一步的讲解说明。
参考图1,图1所示为本实施例的基于计量大数据聚类模型的电能表生产厂商评价方法 流程图,包括如下步骤:
S10,获取电能表的原始数据,筛选7个衡量电能表质量的评估指标:负荷采集合格率, 电量数据采集率,无故障工作时间,考虑计量异常的严重异常次数、一般异常次数、轻微异 常次数,以及维修率;
在本实施例中:
电能表分为供应商、型号、批次和单个设备四个层次,而计量自动化系统中一般以单个 设备为单元存储数据。目前,在计量自动化系统中已采集的电能表质量数据包含有负荷采集 合格率α1,电量数据采集率α2,无故障工作时间α3,考虑计量异常的严重异常次数α4、一 般异常次数α5、轻微异常次数α6,以及维修率α7,其含义分别可以为:
式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时 间;Mi、mi、Ci和ci分别是第i个采样时间段内电能表负荷数据合格的个数、负荷数据总个 数、理论应采集的数据量和实际采集的数据量;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内 电能表发生严重、一般和轻微故障的次数;Nsamp,F是首次出现的采样时间 段;Trate和TF分别是电能表的额定运行时间和故障停运时间。
S20,采用大数据分析技术中的高斯混合模型聚类算法提取电能表海量数据中的典型指标 数据,获取聚类中心,形成电能表质量综合评估的决策矩阵,并对其分别按效益型和成本型 进行标准化处理;
在本实施例中:
每个供应商生产的电能表数量众多、型号复杂,因此从系统中导出的电能表数据无法直 接应用于对每个供应商的质量评估。为此,可以用大数据分析技术中的数据聚类方法,挖掘 各个供应商电能表质量的典型特征,从而实现对其质量的综合评估。
高斯混合模型(Gaussian Mixture Model,GMM)用高斯分布概率密度函数来描述数据,它 可以将一个大数据集分解为若干个符合高斯分布的模型。因此,高斯混合模型可用于数据聚 类,提取数据集中的典型特征。假设GMM由K个高斯分布混合而成,则每个高斯分布称作 一个“组分”,这些“组分”线性相加即为GMM的概率密度函数:
式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概 率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高 斯模型的方差。
电能表的质量受到多个独立因素的影响,且这些因素都不是决定性的。根据中心极限定 理,可认为同一批次的电能表质量的指标数据符合高斯分布。对于某一电能表供应商下的K 个批次的设备,可认为其质量的指标数据是K个高斯分布模型的叠加。因此,高斯混合模型 聚类算法适用于挖掘电能表质量的指标数据。在进行GMM聚类之前,首先需要估计各个高 斯分布模型的参数,这里采用期望最大化算法[进行估计。因此,电能表质量数据的GMM聚 类算法流程可以为:
201)令l=0,随机选择初始化的ω(l),μ(l),Σ(l),求取第i个样本点xi属于第k类高斯模 型的初始化后验概率:
202)将第1)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:
式中:N为待聚类的数据点个数。
203)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第2)步;
204)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:
根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μk,Σk|xi)取得最大的那 类高斯模型中。
当所有的样本点均按照上述步骤划分到各自所属的高斯模型后,GMM聚类完成并获得 了相应的聚类中心。GMM聚类算法舍弃了电能表质量评估原始指标数据中冗余和不重要的 信息,但保留了原始指标数据的重要数据和典型特征。因此,GMM聚类算法大大压缩了数 据的规模、减少了综合评估的计算量,却几乎不影响电能表质量综合评估的准确性。
设D为电能表质量评估问题的决策矩阵,D中的元素dij表示第i个电能表供应商第j个 指标的值。因为不同指标间的量纲不同,所以不能直接对各个指标的重要程度进行比较,需 要进行归一化处理。此外,电能表质量指标还分为效益型和成本型两类,效益型指标数值越 大代表质量越好,成本型指标数值越大代表质量越差。因此,在确定指标权重前首先要对D 进行归一化处理以得到归一化后的决策矩阵D′,其归一化处理公式可以为:
式中:和分别表示所有P个电能表供应商中指标j的最小值和最大值;Ω1表 示效益型指标集合,其中Ω1={1,2,3};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。
S30,分别计算电能表各项指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系 数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而 获得电能表质量综合评估的评估矩阵;
在本实施例中:
AHP法通过指标间两两比较重要程度,间接获得每个指标的权重,该方法属于一种主观 赋权法。设Q个指标为U={u1,u2,…,uQ}。每次取两个指标ui和uj,按1~9的比例用aij表 示指标ui与uj对电能表质量的影响程度之比,数值越大表示ui相对于uj越重要。这样即可获 得一个电能表质量评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质:aij>0,aji=1/aij, (i=1,2,…,Q;j=1,2,…,Q)。计算指标权重前首先对判断矩阵A进行一致性检验,如果一致性 检验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值前后一致, 判断矩阵A可用于求取指标权重。即可以为:
将bj归一化,即可求得归一化后的指标权重为
式中:且
在信息学中,熵用来表征系统的无序程度和数据的离差程度。指标的信息熵越大则其在 综合评估中提供的信息就越少,相应的权重也应该越小;反之,其信息熵越小,则权重应当 越大。因此,电能表质量指标uj的熵Hj可以定义为
式中:κ表示常数κ=1/lnP,并且假定fij=0时,fijlnfij=0。据此,第j个 电能表质量指标的熵权可以定义为
式中:且
在统计学中相关系数用于衡量两个变量之间的关联性,包括皮尔逊相关系数、斯皮尔曼 相关系数和肯德尔相关系数等,其中皮尔逊相关系数更适用于符合正态分布的数据[17],因此 本发明使用皮尔逊相关系数来计算指标间内在的相关程度。相关程度越大说明指标间信息的 重复性越大,相应指标的权重应越小;反之,相关程度越小,权重应越大。假设 d′x=(d′1x,d′2x,...,d′Px)T和d′y=(d′1y,d′2y,...,d′Py)T表示标准化决策矩阵D′的两个列向量,则第x个 指标和第y个指标之间的皮尔逊相关系数可以定义为:
式中:和分别是向量d′x和d′y的平均值。因此,基于相关系数法的权重可以定义为
式中:且
变异系数法是一种根据指标数据间的对比强度来确定指标权重的客观赋权法。某个指标 的变异程度越大,说明其相对于其它指标的对比强度越大,则在综合评估中对评估对象的重 要性越高,从而其权重也应越大;反之,变异程度越小,权重应越小。指标uj的变异系数可 以定义为:
式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值。因此,基于变异系数法的指标权重可以定义为
式中:且
虽然上述4种主、客观方法简单易行,但均存在一定的不足。主观赋权法仅依照专家的 经验,很容易导致主观偏好过强;客观赋权法仅凭借实际数据,但实际数据可能会出现一定 误差,从而可能导致评估结果不符合实际。为了充分考虑依据专家经验的主观打分,同时依 据数据本身的特征对权重进行修正,本发明基于权重隶属度最大,构建了电能表质量指标权 重的组合优化模型,即可以为
式中:表示待优化的第j个电能表质量指标的组合权重,表示采用第k种方法求解得到 的第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数。显然,越大,权重与最终的组合权重越贴近。
S40,根据评估矩阵,用夹角度量法对电能表的质量进行综合评估,按照从高至低的顺序 将各个电能表供应商的质量进行优劣排序,获得评价结果。
在本实施例中:
确定各个电能表质量指标的组合权重后,电能表的综合质量评估可以转化为一个多属性 决策问题。夹角度量法采用变量之间的夹角作为距离的测度,依据被评估对象与理想化目标 的逼近程度进行排序。因此,基于夹角度量法的电能表综合质量评估的流程可以为:
401)形成P个待评估的供应商对应的Q个质量指标的评估矩阵
R=(rij)P×Q
式中:
402)计算电能表质量评估中的理想点和负理想点,其分别为
式中:
403)分别计算每个供应商下的电能表质量指标与理想点、负理想点的夹角距离,即
式中:表示评估矩阵R的第i个行向量。
404)计算每个供应商下的电能表质量指标与理想点的夹角逼近程度,即
可以看出:第i个供应商生产的电能表质量越好,γi愈接近于1;反之,质量越差,γi越 接近于0。因此,可以根据γi取值的大小得到电能表质量的评估结果。
为了进一步理解本发明,以下采用国网浙江省电力公司宁波供电公司管辖的某地区的电 能表数据进行算例仿真,该原始数据集共有11565条数据,经过数据清洗之后可用数据为 11312条,共有17个待评估的电能表供应商,每个供应商下有若干设备批次,所有的设备批 次总数为58个。
将17个供应商及其58个批次的数据按顺序重新进行编号,以第1、3、12个供应商为例 分析GMM聚类算法的效果。第1个供应商下有2个批次,共142台电能表;第3个供应商 下有4个批次,共496台电能表,第12个供应商下有6个批次,共1514台电能表。每台电 能表都有7个指标,图2至图4分别展示了经归一化处理后的第1、3、12个供应商下电能表 各个质量指标的散点图和经GMM聚类后的聚类中心。
从图2可以看出,反映电能表质量的原始数据较多,不容易直接用于后续的质量评估。 然而,经过GMM算法分析后,第1个供应商下的142台电能表的质量数据符合2个多维高斯分布模型的叠加,故可将这142台电能表聚集成典型的2类,其聚类中心如图2的圆点所示。因此,可以用2台典型的电能表表征这142台电能表的质量特征。同理,从图3可以看 出,第3个供应商下的496台电能表的质量数据符合4个多维高斯分布模型的叠加,故可用 4台典型的电能表表征这496台电能表的质量特征;从图4可以看出,第12个供应商下的1514 台电能表的质量数据符合6个多维高斯分布模型的叠加,故可用6台典型的电能表表征这1514台电能表的质量特征。由此,海量电能表质量评估的原始数据得到了压缩,冗余和不重要的信息被舍弃,重要、典型的特征被保留,从而使得后续的指标权重优化和质量综合评估的计算量都大大降低。
对每个供应商下的电能表都进行GMM聚类分析,可以获得表征各个供应商的电能表质 量的典型电能表,然后将这些典型电能表相应的指标取平均值即可得到如表1所示的决策矩 阵D′。
表1标准化后的电能表质量决策矩阵
假定专家对指标的判断矩阵A为
经检验,A满足一致性要求,计算基于AHP法的权重,其结果如表2所示。此外,表2还分别给出了基于熵权法、相关系数法、变异系数法和组合优化模型的指标权重。从表2可以看出:客观权重对主观权重起到了一定的修正作用,按照专家经验,电能表的严重异常指标α4应占有较大的权重,但另外三种客观赋权法都对α4给出了较小的权重,这是因为原始数据中各个供应商的α4数值差异不大。因此,和其它指标相比,该指标难以辨别各个供应商的电能表质量优劣,故应当赋予较小的权重。
表2不同方法计算得到的指标权重
然后,基于得到的指标组合权重,形成电能表质量的评估矩阵R,进而采用夹角度量法 对电能表的质量进行综合评估,最后得到如表3所示的电能表质量综合评估的结果。
表3电能表质量综合评估结果
从表3可以看出:电能表质量最好的前9家供应商分别为:10、9、5、7、6、13、11、 16和4,其中第10个供应商在电能表质量综合评估中的评估值最高,第15个供应商的评估 值最低。从表1所示的电能表指标数据可以看出:第10个供应商的无故障工作时间、严重异 常次数这两个指标在所有供应商中数值最大,其余5项指标的数值大小都排在前三位,所以第10个供应商生产的电能表质量最好;虽然第15个供应商在电量数据采集率这个指标上取值较大,但其在剩下6个指标的取值均较小,尤其在无故障工作时间这个指标上,第15个供应商的取值很小,其值仅为0.0700,然而该指标的组合权重达到0.5575,重要程度远超其余所有指标。因此,将第15个供应商生产的电能表质量判定为最差是合理的。
Claims (6)
1.基于计量大数据聚类模型的电能表生产厂商评价方法,其特征在于,包括如下步骤:
1)获取每个批次和区域中电能表的原始数据,筛选获取衡量电能表质量的评估指标,评估指标包括负荷采集合格率,电量数据采集率,无故障工作时间,考虑计量异常的严重异常次数、一般异常次数、轻微异常次数,以及维修率;
2)采用高斯混合模型聚类算法提取电能表海量数据中的典型评估指标数据,获取聚类中心,形成电能表质量综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;
3)分别计算电能表各项评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得电能表质量综合评估的评估矩阵;
4)根据评估矩阵,用夹角度量法对电能表的质量进行综合评估,按照从高至低的顺序将各个电能表供应商的质量进行优劣排序,获得评价结果。
2.根据权利要求1所述的基于计量大数据聚类模型的电能表生产厂商评价方法,其特征在于,采用7个衡量电能表质量的评估指标,分别为:负荷采集合格率α1,电量数据采集率α2,无故障工作时间α3,考虑计量异常的严重异常次数α4、一般异常次数α5、轻微异常次数α6,以及维修率α7:
式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时间;Mi、mi、Ci和ci分别是第i个采样时间段内电能表负荷数据合格的个数、负荷数据总个数、理论应采集的数据量和实际采集的数据量;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内电能表发生严重、一般和轻微故障的次数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间段;Trate和TF分别是电能表的额定运行时间和故障停运时间。
3.根据权利要求1所述的基于计量大数据聚类模型的电能表生产厂商评价方法,其特征在于,在步骤2)高斯混合模型聚类算法中:
假设GMM由K个高斯分布混合而成,则每个高斯分布称作一个“组分”,这些“组分”线性相加即为GMM的概率密度函数:
式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高斯模型的方差;
电能表质量数据的GMM聚类算法流程为:
201)令l=0,随机选择初始化的ω(l),μ(l),Σ(l),求取第i个样本点xi属于第k类高斯模型的初始化后验概率:
202)将第201)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:
式中:N为待聚类的数据点个数;
203)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第2)步;
204)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:
根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μk,Σk|xi)取得最大的那类高斯模型中。
4.根据权利要求1所述的基于计量大数据聚类模型的电能表生产厂商评价方法,其特征在于,在步骤2),决策矩阵为:
式中:dij表示第i个电能表供应商第j个指标的值,P为电能表供应商个数,Q为衡量供应商的电能表质量的评价指标个数,在其中Q等于7;
效益型指标标准化处理方法为:
成本型指标标准化处理方法为:
式中:和分别表示所有P个电能表供应商中指标j的最小值和最大值;Ω1表示效益型指标集合,其中Ω1={1,2,3};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。
5.根据权利要求1的基于计量大数据聚类模型的电能表生产厂商评价方法,其特征在于,在步骤3)中,分别采用层次分析法、熵权法、相关系数法和变异系数法计算电能表质量指标权重,接着用指标的组合优化模型计算组合权重,其中:
层次分析法为:设Q个指标为U={u1,u2,…,uQ},每次取两个指标ui和uj,按1~9的比例用aij表示指标ui与uj对电能表质量的影响程度之比,数值越大表示ui相对于uj越重要;这样即可获得一个电能表质量评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质:aij>0,aji=1/aij,(i=1,2,…,Q;j=1,2,…,Q);计算指标权重前首先对判断矩阵A进行一致性检验,如果一致性检验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值前后一致,判断矩阵A可用于求取指标权重;求取指标权重可以用列和求逆法,即:
将bj归一化,即可求得归一化后的指标权重为
式中:且
电能表质量指标的熵权为:
式中:κ表示常数κ=1/lnP,并且假定fij=0时,fijlnfij=0;且
计算皮尔逊相关系数权重时:假设d′x=(d′1x,d′2x,...,d′Px)T和d′y=(d′1y,d′2y,...,d′Py)T表示标准化决策矩阵D′的两个列向量,则第x个指标和第y个指标之间的皮尔逊相关系数定义为
式中:和分别是向量d′x和d′y的平均值;基于皮尔逊相关系数的权重定义为
式中:且
计算变异系数法权重时:指标uj的变异系数定义为:
式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值;基于变异系数法的指标权重定义为:
式中:且
指标权重的组合优化模型为:
式中:表示待优化的第j个电能表质量指标的组合权重,表示采用第k种方法求解得到的第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数;显然,越大,权重与最终的组合权重越贴近。
6.根据权利要求1所述的基于计量大数据聚类模型的电能表生产厂商评价方法,其特征在于,在步骤4)用夹角度量法对电能表的质量进行综合评估,包括步骤:
401)形成P个待评估的供应商对应的Q个质量指标的评估矩阵
R=(rij)P×Q
式中:
402)计算电能表质量评估中的理想点和负理想点,其分别为
式中:
403)分别计算每个供应商下的电能表质量指标与理想点、负理想点的夹角距离,即
式中:ri=(ri1,ri2,...,riQ)表示评估矩阵R的第i个行向量;
404)计算每个供应商下的电能表质量指标与理想点的夹角逼近程度,即
可以看出:第i个供应商生产的电能表质量越好,γi愈接近于1;反之,质量越差,γi越接近于0;因此,可以根据γi取值的大小得到电能表质量的评估结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810942973.5A CN109389145B (zh) | 2018-08-17 | 2018-08-17 | 基于计量大数据聚类模型的电能表生产厂商评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810942973.5A CN109389145B (zh) | 2018-08-17 | 2018-08-17 | 基于计量大数据聚类模型的电能表生产厂商评价方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109389145A true CN109389145A (zh) | 2019-02-26 |
CN109389145B CN109389145B (zh) | 2023-10-10 |
Family
ID=65418423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810942973.5A Active CN109389145B (zh) | 2018-08-17 | 2018-08-17 | 基于计量大数据聚类模型的电能表生产厂商评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109389145B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080068A (zh) * | 2019-11-18 | 2020-04-28 | 中能瑞通(北京)科技有限公司 | 一种电能表运行状态评价方法和装置 |
CN111144701A (zh) * | 2019-12-04 | 2020-05-12 | 中国电子科技集团公司第三十研究所 | 一种分布式环境下etl作业调度资源分类评估的方法 |
CN111598387A (zh) * | 2020-04-08 | 2020-08-28 | 中国电力科学研究院有限公司 | 一种于多维度确定电能表质量的方法及系统 |
CN111949939A (zh) * | 2020-08-26 | 2020-11-17 | 北京航空航天大学 | 基于改进topsis和聚类分析的智能电表运行状态评价方法 |
CN112070311A (zh) * | 2020-09-10 | 2020-12-11 | 天津大学 | 基于相似日聚类和气象因子赋权的日前光功率预测方法 |
CN112415464A (zh) * | 2020-09-27 | 2021-02-26 | 国网浙江省电力有限公司 | 一种计量设备远程业务功能自动化评测质量分析方法 |
CN112465380A (zh) * | 2020-12-07 | 2021-03-09 | 神彩科技股份有限公司 | 基于危废数据的企业行为分析方法、装置、设备及介质 |
CN113391256A (zh) * | 2021-05-28 | 2021-09-14 | 国网河北省电力有限公司营销服务中心 | 一种现场作业终端的电能表计量故障分析方法及系统 |
CN113743452A (zh) * | 2021-07-21 | 2021-12-03 | 深圳供电局有限公司 | 电能质量评估方法及装置 |
CN114785663A (zh) * | 2022-01-28 | 2022-07-22 | 浙江华云信息科技有限公司 | 一种告警联动方法 |
CN115508770A (zh) * | 2022-11-22 | 2022-12-23 | 武汉格蓝若智能技术股份有限公司 | 一种基于kl-nb算法的电能表运行状态在线评估方法 |
CN118014441A (zh) * | 2024-04-08 | 2024-05-10 | 深圳市新奥尔康科技有限公司 | 一种用于模块化组装的usb连接器生产方法 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020129038A1 (en) * | 2000-12-18 | 2002-09-12 | Cunningham Scott Woodroofe | Gaussian mixture models in a data mining system |
US20030069868A1 (en) * | 2001-06-29 | 2003-04-10 | Vos Jules Jakob | Distributed decision processing system |
JP2011048612A (ja) * | 2009-08-27 | 2011-03-10 | Digitalcoast Inc | 階層分析法に基づく意思決定支援システム及びそのプログラム |
CN102542347A (zh) * | 2011-12-28 | 2012-07-04 | 东南大学 | 一种电能质量综合评估的方法 |
CN103235894A (zh) * | 2013-05-08 | 2013-08-07 | 华东理工大学 | 基于自适应优选模糊核聚类的石脑油属性聚类方法 |
CN104616215A (zh) * | 2015-03-05 | 2015-05-13 | 华北电力大学 | 一种火电厂能效综合评价方法 |
CN105117602A (zh) * | 2015-08-28 | 2015-12-02 | 国家电网公司 | 一种计量装置运行状态预警方法 |
CN105184672A (zh) * | 2015-08-31 | 2015-12-23 | 同济大学 | 一种针对三公调度发电计划的评估方法 |
CN105373963A (zh) * | 2015-09-14 | 2016-03-02 | 中国电力科学研究院 | 一种基于组合权重electre评价模型的发电计划评估方法 |
CN105656031A (zh) * | 2016-02-17 | 2016-06-08 | 中国农业大学 | 基于高斯混合分布特征的含风电电力系统安全风险评估方法 |
JP2016139243A (ja) * | 2015-01-27 | 2016-08-04 | 株式会社東芝 | 評価値算出システム、支援システム、評価値算出方法、及び評価値算出プログラム |
CN106651147A (zh) * | 2016-11-30 | 2017-05-10 | 佛山电力设计院有限公司 | 基于lcc的配电网综合效益评估指标的综合权重确定方法 |
CN107067173A (zh) * | 2017-04-13 | 2017-08-18 | 东北林业大学 | 基于局部保持投影分析的企业供应商分类方法 |
CN107480856A (zh) * | 2017-07-06 | 2017-12-15 | 浙江大学 | 基于改进逼近理想解排序法的售电公司电力客户评估方法 |
CN107482626A (zh) * | 2017-08-17 | 2017-12-15 | 广东电网有限责任公司惠州供电局 | 一种区域电网关键节点识别方法 |
-
2018
- 2018-08-17 CN CN201810942973.5A patent/CN109389145B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020129038A1 (en) * | 2000-12-18 | 2002-09-12 | Cunningham Scott Woodroofe | Gaussian mixture models in a data mining system |
US20030069868A1 (en) * | 2001-06-29 | 2003-04-10 | Vos Jules Jakob | Distributed decision processing system |
JP2011048612A (ja) * | 2009-08-27 | 2011-03-10 | Digitalcoast Inc | 階層分析法に基づく意思決定支援システム及びそのプログラム |
CN102542347A (zh) * | 2011-12-28 | 2012-07-04 | 东南大学 | 一种电能质量综合评估的方法 |
CN103235894A (zh) * | 2013-05-08 | 2013-08-07 | 华东理工大学 | 基于自适应优选模糊核聚类的石脑油属性聚类方法 |
JP2016139243A (ja) * | 2015-01-27 | 2016-08-04 | 株式会社東芝 | 評価値算出システム、支援システム、評価値算出方法、及び評価値算出プログラム |
CN104616215A (zh) * | 2015-03-05 | 2015-05-13 | 华北电力大学 | 一种火电厂能效综合评价方法 |
CN105117602A (zh) * | 2015-08-28 | 2015-12-02 | 国家电网公司 | 一种计量装置运行状态预警方法 |
CN105184672A (zh) * | 2015-08-31 | 2015-12-23 | 同济大学 | 一种针对三公调度发电计划的评估方法 |
CN105373963A (zh) * | 2015-09-14 | 2016-03-02 | 中国电力科学研究院 | 一种基于组合权重electre评价模型的发电计划评估方法 |
CN105656031A (zh) * | 2016-02-17 | 2016-06-08 | 中国农业大学 | 基于高斯混合分布特征的含风电电力系统安全风险评估方法 |
CN106651147A (zh) * | 2016-11-30 | 2017-05-10 | 佛山电力设计院有限公司 | 基于lcc的配电网综合效益评估指标的综合权重确定方法 |
CN107067173A (zh) * | 2017-04-13 | 2017-08-18 | 东北林业大学 | 基于局部保持投影分析的企业供应商分类方法 |
CN107480856A (zh) * | 2017-07-06 | 2017-12-15 | 浙江大学 | 基于改进逼近理想解排序法的售电公司电力客户评估方法 |
CN107482626A (zh) * | 2017-08-17 | 2017-12-15 | 广东电网有限责任公司惠州供电局 | 一种区域电网关键节点识别方法 |
Non-Patent Citations (2)
Title |
---|
张耀天: "基于层次分析法的自适应决策评价方法", 《 北京航空航天大学学报 》, vol. 42, no. 5, pages 1065 - 1070 * |
陶永峰等: "基于层次分析和灰色关联分析的评价模型在卷烟多点加工质量评价中的应用", 《中国烟草学报》, vol. 23, no. 1, pages 43 - 49 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080068A (zh) * | 2019-11-18 | 2020-04-28 | 中能瑞通(北京)科技有限公司 | 一种电能表运行状态评价方法和装置 |
CN111144701B (zh) * | 2019-12-04 | 2022-03-22 | 中国电子科技集团公司第三十研究所 | 一种分布式环境下etl作业调度资源分类评估的方法 |
CN111144701A (zh) * | 2019-12-04 | 2020-05-12 | 中国电子科技集团公司第三十研究所 | 一种分布式环境下etl作业调度资源分类评估的方法 |
CN111598387A (zh) * | 2020-04-08 | 2020-08-28 | 中国电力科学研究院有限公司 | 一种于多维度确定电能表质量的方法及系统 |
CN111949939A (zh) * | 2020-08-26 | 2020-11-17 | 北京航空航天大学 | 基于改进topsis和聚类分析的智能电表运行状态评价方法 |
CN112070311A (zh) * | 2020-09-10 | 2020-12-11 | 天津大学 | 基于相似日聚类和气象因子赋权的日前光功率预测方法 |
CN112415464A (zh) * | 2020-09-27 | 2021-02-26 | 国网浙江省电力有限公司 | 一种计量设备远程业务功能自动化评测质量分析方法 |
CN112465380A (zh) * | 2020-12-07 | 2021-03-09 | 神彩科技股份有限公司 | 基于危废数据的企业行为分析方法、装置、设备及介质 |
CN113391256A (zh) * | 2021-05-28 | 2021-09-14 | 国网河北省电力有限公司营销服务中心 | 一种现场作业终端的电能表计量故障分析方法及系统 |
CN113743452A (zh) * | 2021-07-21 | 2021-12-03 | 深圳供电局有限公司 | 电能质量评估方法及装置 |
CN113743452B (zh) * | 2021-07-21 | 2024-03-01 | 深圳供电局有限公司 | 电能质量评估方法及装置 |
CN114785663A (zh) * | 2022-01-28 | 2022-07-22 | 浙江华云信息科技有限公司 | 一种告警联动方法 |
CN114785663B (zh) * | 2022-01-28 | 2024-08-16 | 浙江华云信息科技有限公司 | 一种告警联动方法 |
CN115508770A (zh) * | 2022-11-22 | 2022-12-23 | 武汉格蓝若智能技术股份有限公司 | 一种基于kl-nb算法的电能表运行状态在线评估方法 |
CN118014441A (zh) * | 2024-04-08 | 2024-05-10 | 深圳市新奥尔康科技有限公司 | 一种用于模块化组装的usb连接器生产方法 |
CN118014441B (zh) * | 2024-04-08 | 2024-06-28 | 深圳市新奥尔康科技有限公司 | 一种用于模块化组装的usb连接器生产方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109389145B (zh) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109389145A (zh) | 基于计量大数据聚类模型的电能表生产厂商评价方法 | |
CN109409628B (zh) | 基于计量大数据聚类模型的采集终端生产厂商评价方法 | |
CN109389282A (zh) | 一种基于高斯混合模型的电能表生产厂商评价方法 | |
CN108520357B (zh) | 一种线损异常原因的判别方法、装置及服务器 | |
CN111950918B (zh) | 一种基于电力交易数据的市场风险评估方法 | |
CN105117602B (zh) | 一种计量装置运行状态预警方法 | |
Phillips et al. | Transition modeling and econometric convergence tests | |
CN109472003A (zh) | 一种应用于成本分析的多元线性回归算法 | |
CN109359796A (zh) | 一种基于多评估指标的电能表生产厂商评价方法 | |
CN111949939B (zh) | 基于改进topsis和聚类分析的智能电表运行状态评价方法 | |
CN116150897A (zh) | 一种基于数字孪生的机床主轴性能测评方法及系统 | |
Kong et al. | A remote estimation method of smart meter errors based on neural network filter and generalized damping recursive least square | |
CN109271319A (zh) | 一种基于面板数据分析的软件故障的预测方法 | |
CN109389280A (zh) | 基于多属性决策模型的电能表生产厂商评价方法 | |
CN113469571A (zh) | 数据质量评价方法、装置、计算机设备及可读存储介质 | |
CN109389281A (zh) | 一种基于高斯混合模型的采集终端生产厂商评价方法 | |
CN105303194A (zh) | 一种电网指标体系建立方法、装置以及计算设备 | |
CN116842684A (zh) | 电能表及其运行可靠性的评估方法、系统、电能表处理器 | |
Friginal et al. | Multi-criteria analysis of measures in benchmarking: Dependability benchmarking as a case study | |
CN114358605A (zh) | 配电网可靠性评估指标权重制定方法、设备及存储介质 | |
CN114153683A (zh) | 基于综合评价算法的网络化软件健康度评价方法 | |
CN113205274A (zh) | 一种施工质量定量化排名方法 | |
Chen et al. | Research on Network Security Risk Assessment Model Based on Grey Language Variables | |
CN111045951B (zh) | 基于无线电业务模型实现无线电应用软件质量测试效果分析处理的方法 | |
Simonetto | Using structural equation and item response models to assess relationship between latent traits |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |