CN109389281A - 一种基于高斯混合模型的采集终端生产厂商评价方法 - Google Patents
一种基于高斯混合模型的采集终端生产厂商评价方法 Download PDFInfo
- Publication number
- CN109389281A CN109389281A CN201810943550.5A CN201810943550A CN109389281A CN 109389281 A CN109389281 A CN 109389281A CN 201810943550 A CN201810943550 A CN 201810943550A CN 109389281 A CN109389281 A CN 109389281A
- Authority
- CN
- China
- Prior art keywords
- acquisition terminal
- index
- formula
- indicate
- acquisition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 32
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 49
- 239000011159 matrix material Substances 0.000 claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 238000005457 optimization Methods 0.000 claims abstract description 14
- 238000013210 evaluation model Methods 0.000 claims abstract description 10
- 238000012423 maintenance Methods 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 6
- 238000003672 processing method Methods 0.000 claims description 4
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 claims description 3
- 238000012797 qualification Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 abstract 1
- 238000009826 distribution Methods 0.000 description 6
- 239000000306 component Substances 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000001303 quality assessment method Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于高斯混合模型的采集终端生产厂商评价方法,包括步骤:获取采集终端的原始数据,筛选衡量采集终端的评估指标;采用高斯混合模型聚类算法提取典型评估指标数据,获取聚类中心,形成决策矩阵,并对其分别按效益型和成本型进行标准化处理;分别计算采集终端各项评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得采集终端综合评估的评估矩阵;用夹角度量法对采集终端的质量进行综合评估,按照从高至低的顺序将各个采集终端供应商的质量进行优劣排序,获得评价结果。其可以为用用电信息采集系统采集运维工作提供支撑。
Description
技术领域
本发明涉及电力系统领域,特别是涉及一种基于高斯混合模型的采集终端生产厂商评价 方法。
背景技术
自2011年国网开始大范围建设用电信息采集系统以来,用电信息采集系统越来越多得承 担了营销侧的计量业务工作,采集终端定时定期地采集电能表数据项,按要求将采集信息上 送系统,是用电信息采集系统的核心组成部分,其质量直接影响着用户用电信息的获取,针 对其故障导致的运维也浪费了大量的人力物力。
用电信息采集系统覆盖范围的逐步扩大,采集的对象和采集频率逐年提高,各类计量数 据和采集数据应用逐渐完善。以浙江的用电信息采集系统为例,用电信息采集每周数据增长 量近1TB,历年累积收集的数据十分丰厚,并且在2015年建立的采集运维模块收集了大量的 采集终端故障历史信息。但针对这些数据却缺少足够的数据挖掘手段,使数据金矿的价值难 以体现。目前浙电采集大数据分析平台已经具备初步的数据分析能力,能够通过大数据技术 分析计量装置运行数据,开展可靠性质量评估方法研究,进而提升公司计量精益化管理水平。
供电单位一般对采集终端的厂家运行质量评估停留在一些考核指标的基础上,以及针对 地市单位反映的批量性故障收集上,相对比较粗犷。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一 种基于高斯混合模型的采集终端生产厂商评价方法,以达到对采集终端质量作出科学、合理 的定量评价的目的。为此,本发明采取以下技术方案。
包括如下步骤:
1)获取每个批次和区域中采集终端的原始数据,确定衡量采集终端的8个评估指标:8 个评估指标分别为:负荷采集合格率α1,电量数据采集率α2,无故障工作时间α3,反映采集 异常的严重异常次数α4、一般异常次数α5、轻微异常次数α6,维修率α7和在线率α8:
式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采 样时间;Mi、mi、Ci、ci、bi和Bi分别是第i个采样时间段内采集终端负荷数据总个数、负荷数据合格的个数、理论应采集的数据量、实际采集的数据量、在线的采集终端个数和采集终端总个数;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内采集终端发生严重、一般和轻微故障的次数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间段;Trate和TF分别是采集终端的额 定运行时间和故障停运时间;
2)采用高斯混合模型聚类算法提取采集终端海量数据中的评估指标数据,获取聚类中心, 形成采集终端综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;
3)分别计算采集终端各项典型评估指标基于层次分析法、熵权法、皮尔逊相关系数法以 及变异系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权 处理从而获得采集终端综合评估的评估矩阵;
4)根据评估矩阵,用夹角度量法对采集终端的质量进行综合评估,按照从高至低的顺序 将各个采集终端供应商的质量进行优劣排序,获得评价结果。
作为优选技术手段:在步骤2)高斯混合模型聚类算法中:
假设GMM由K个高斯分布混合而成,则每个高斯分布称作一个“组分”,这些“组分”线 性相加即为GMM的概率密度函数:
式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概 率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高 斯模型的方差;
采集终端数据的GMM聚类算法流程为:
205)令l=0,随机选择初始化的ω(l),μ(l),Σ(l),求取第i个样本点xi属于第k类高斯模 型的初始化后验概率:
206)将第201)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:
式中:N为待聚类的数据点个数;
207)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第202)步;
208)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:
根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μk,Σk|xi)取得最大的那 类高斯模型中。
作为优选技术手段:在步骤2),决策矩阵为:
式中:dij表示第i个采集终端供应商第j个指标的值,P为采集终端供应商个数,Q为衡量供 应商的采集终端的评价指标个数,其中Q等于8;
效益型指标标准化处理方法为:
成本型指标标准化处理方法为:
式中:和分别表示所有P个采集终端供应商中指标j的最小值和最大值;Ω1表示效益型指标集合,其中Ω1={1,2,3,8};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。
作为优选技术手段:在步骤3)中,分别采用层次分析法、熵权法、相关系数法和变异 系数法计算采集终端指标权重,接着用指标的组合优化模型计算组合权重,其中:
层次分析法为:设Q个指标为U={u1,u2,…,uQ},每次取两个指标ui和uj,按1~9的比 例用aij表示指标ui与uj对采集终端的影响程度之比,数值越大表示ui相对于uj越重要;这 样即可获得一个采集终端评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质:aij>0,aji=1/aij,(i=1,2,…,Q;j=1,2,…,Q);计算指标权重前首先对判断矩阵A进行一致性检验,如果一 致性检验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值前后一 致,判断矩阵A可用于求取指标权重;求取指标权重可以用列和求逆法,即:
将bj归一化,即可求得归一化后的指标权重为
式中:且
采集终端指标的熵权为:
式中:κ表示常数κ=1/ln P,并且假定fij=0时,fijln fij=0;且
计算皮尔逊相关系数权重包括:假设d′x=(d′1x,d′2x,...,d′Px)T和d′y=(d′1y,d′2y,...,d′Py)T表示标 准化决策矩阵D′的两个列向量,则第x个指标和第y个指标之间的皮尔逊相关系数定义为
式中:和分别是向量d′x和d′y的平均值;基于皮尔逊相关系数的权重定义为
式中:且
计算变异系数法权重包括:指标uj的变异系数定义为:
式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值;基于变异系数法的指标权重定义为:
式中:且
指标权重的组合优化模型为:
式中:表示待优化的第j个采集终端指标的组合权重,表示采用第k种方法求解得到的 第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数;显然,越大,权重与最终的组合权重越贴近。
作为优选技术手段:在步骤4)用夹角度量法对采集终端的质量进行综合评估时,包括 步骤:
405)形成P个待评估的供应商对应的Q个质量指标的评估矩阵
R=(rij)P×Q
式中:
406)计算采集终端评估中的理想点和负理想点,其分别为
式中:
407)分别计算每个供应商下的采集终端指标与理想点、负理想点的夹角距离,即
式中:ri=(ri1,ri2,...,riQ)表示评估矩阵R的第i个行向量;
408)计算每个供应商下的采集终端指标与理想点的夹角逼近程度,即
可以看出:第i个供应商生产的采集终端越好,γi愈接近于1;反之,质量越差,γi越接 近于0;因此,可以根据γi取值的大小得到采集终端的评估结果。
有益效果:本技术方案及时利用其用采多年存储的大数据,建立可靠的质量评估指标体 系,对采集终端质量作出科学、合理的定量评价,以提供物资招标的信息支持。
附图说明
图1为本发明流程图;
具体实施方式
为了更好地理解本发明的目的、技术方案以及技术效果,以下结合附图对本发明进行进 一步的讲解说明。
参考图1,图1所示为本实施例的基于计量大数据聚类模型的采集终端生产厂商评价方 法流程图,包括如下步骤:
S10,获取采集终端的原始数据,筛选8个衡量采集终端的评估指标:负荷采集合格率, 电量数据采集率,无故障工作时间,反映采集异常的严重异常次数、一般异常次数、轻微异 常次数,维修率和在线率;
在本实施例中:
采集终端分为供应商、型号、批次和单个设备四个层次,而计量自动化系统中一般以单 个设备为单元存储数据。目前,在计量自动化系统中已采集的采集终端数据包含有负荷采集 合格率α1,电量数据采集率α2,无故障工作时间α3,反映采集异常的严重异常次数α4、一 般异常次数α5、轻微异常次数α6,维修率α7和在线率α8,其含义分别可以为:
式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时 间;Mi、mi、Ci、ci、bi和Bi分别是第i个采样时间段内采集终端负荷数据总个数、负荷数据 合格的个数、理论应采集的数据量、实际采集的数据量、在线的采集终端个数和采集终端总 个数;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内采集终端发生严重、一般和轻微故障的次 数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间段;Trate和TF分别是采集终端的额定运 行时间和故障停运时间。
S20,采用大数据分析技术中的高斯混合模型聚类算法提取采集终端海量数据中的典型指 标数据,获取聚类中心,形成采集终端综合评估的决策矩阵,并对其分别按效益型和成本型 进行标准化处理;
在本实施例中:
每个供应商生产的采集终端数量众多、型号复杂,因此从系统中导出的采集终端数据无 法直接应用于对每个供应商的质量评估。为此,可以用大数据分析技术中的数据聚类方法, 挖掘各个供应商采集终端的典型特征,从而实现对其质量的综合评估。
高斯混合模型(Gaussian Mixture Model,GMM)用高斯分布概率密度函数来描述数据,它 可以将一个大数据集分解为若干个符合高斯分布的模型。因此,高斯混合模型可用于数据聚 类,提取数据集中的典型特征。假设GMM由K个高斯分布混合而成,则每个高斯分布称作 一个“组分”,这些“组分”线性相加即为GMM的概率密度函数:
式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概 率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高 斯模型的方差。
采集终端的质量受到多个独立因素的影响,且这些因素都不是决定性的。根据中心极限 定理,可认为同一批次的采集终端的指标数据符合高斯分布。对于某一采集终端供应商下的 K个批次的设备,可认为其质量的指标数据是K个高斯分布模型的叠加。因此,高斯混合模 型聚类算法适用于挖掘采集终端的指标数据。在进行GMM聚类之前,首先需要估计各个高 斯分布模型的参数,这里采用期望最大化算法进行估计。因此,采集终端数据的GMM聚类 算法流程可以为:
201)令l=0,随机选择初始化的ω(l),μ(l),Σ(l),求取第i个样本点xi属于第k类高斯模 型的初始化后验概率:
202)将第201)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:
式中:N为待聚类的数据点个数。
203)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第202)步;
204)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:
根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μk,Σk|xi)取得最大的那 类高斯模型中。
当所有的样本点均按照上述步骤划分到各自所属的高斯模型后,GMM聚类完成并获得 了相应的聚类中心。GMM聚类算法舍弃了采集终端评估原始指标数据中冗余和不重要的信 息,但保留了原始指标数据的重要数据和典型特征。因此,GMM聚类算法大大压缩了数据 的规模、减少了综合评估的计算量,却几乎不影响采集终端综合评估的准确性。
设D为采集终端评估问题的决策矩阵,D中的元素dij表示第i个采集终端供应商第j个 指标的值。因为不同指标间的量纲不同,所以不能直接对各个指标的重要程度进行比较,需 要进行归一化处理。此外,采集终端指标还分为效益型和成本型两类,效益型指标数值越大 代表质量越好,成本型指标数值越大代表质量越差。因此,在确定指标权重前首先要对D进 行归一化处理以得到归一化后的决策矩阵D′,其归一化处理公式可以为:
式中:和分别表示所有P个采集终端供应商中指标j的最小值和最大值;Ω1表示效益型指标集合,其中Ω1={1,2,3,8};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。
S30,分别计算采集终端各项指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异 系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从 而获得采集终端综合评估的评估矩阵;
在本实施例中:
AHP法通过指标间两两比较重要程度,间接获得每个指标的权重,该方法属于一种主观 赋权法。设Q个指标为U={u1,u2,…,uQ}。每次取两个指标ui和uj,按1~9的比例用aij表 示指标ui与uj对采集终端的影响程度之比,数值越大表示ui相对于uj越重要。这样即可获得 一个采集终端评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质:aij>0,aji=1/aij,(i =1,2,…,Q;j=1,2,…,Q)。计算指标权重前首先对判断矩阵A进行一致性检验,如果一致性检 验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值前后一致,判 断矩阵A可用于求取指标权重。即可以为:
将bj归一化,即可求得归一化后的指标权重为
式中:且
在信息学中,熵用来表征系统的无序程度和数据的离差程度。指标的信息熵越大则其在 综合评估中提供的信息就越少,相应的权重也应该越小;反之,其信息熵越小,则权重应当 越大。因此,采集终端指标uj的熵Hj可以定义为
式中:κ表示常数κ=1/ln P,并且假定fij=0时,fijln fij=0。据此,第j个 采集终端指标的熵权可以定义为
式中:且
在统计学中相关系数用于衡量两个变量之间的关联性,包括皮尔逊相关系数、斯皮尔曼 相关系数和肯德尔相关系数等,其中皮尔逊相关系数更适用于符合正态分布的数据,因此本 发明使用皮尔逊相关系数来计算指标间内在的相关程度。相关程度越大说明指标间信息的重 复性越大,相应指标的权重应越小;反之,相关程度越小,权重应越大。假设d′x=(d′1x,d′2x,...,d′Px)T和dy′=(d′1y,d′2y,...,d′Py)T表示标准化决策矩阵D′的两个列向量,则第x个 指标和第y个指标之间的皮尔逊相关系数可以定义为:
式中:和分别是向量d′x和d′y的平均值。因此,基于相关系数法的权重可以定义为
式中:且
变异系数法是一种根据指标数据间的对比强度来确定指标权重的客观赋权法。某个指标 的变异程度越大,说明其相对于其它指标的对比强度越大,则在综合评估中对评估对象的重 要性越高,从而其权重也应越大;反之,变异程度越小,权重应越小。指标uj的变异系数可 以定义为:
式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值。因此,基于变异系数法的指标权重可以定义为
式中:且
虽然上述4种主、客观方法简单易行,但均存在一定的不足。主观赋权法仅依照专家的 经验,很容易导致主观偏好过强;客观赋权法仅凭借实际数据,但实际数据可能会出现一定 误差,从而可能导致评估结果不符合实际。为了充分考虑依据专家经验的主观打分,同时依 据数据本身的特征对权重进行修正,本发明基于权重隶属度最大,构建了采集终端指标权重 的组合优化模型,即可以为
式中:表示待优化的第j个采集终端指标的组合权重,表示采用第k种方法求解得到的 第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数。显然,越大,权重与最终的组合权重越贴近。
S40,根据评估矩阵,用夹角度量法对采集终端的质量进行综合评估,按照从高至低的顺 序将各个采集终端供应商的质量进行优劣排序,获得评价结果。
在本实施例中:
确定各个采集终端指标的组合权重后,采集终端的综合质量评估可以转化为一个多属性 决策问题。夹角度量法采用变量之间的夹角作为距离的测度,依据被评估对象与理想化目标 的逼近程度进行排序。因此,基于夹角度量法的采集终端综合质量评估的流程可以为:
401)形成P个待评估的供应商对应的Q个质量指标的评估矩阵
R=(rij)P×Q
式中:
402)计算采集终端评估中的理想点和负理想点,其分别为
式中:
403)分别计算每个供应商下的采集终端指标与理想点、负理想点的夹角距离,即
式中:ri=(ri1,ri2,...,riQ)表示评估矩阵R的第i个行向量。
404)计算每个供应商下的采集终端指标与理想点的夹角逼近程度,即
可以看出:第i个供应商生产的采集终端越好,γi愈接近于1;反之,质量越差,γi越接 近于0。因此,可以根据γi取值的大小得到采集终端的评估结果。
为了进一步理解本发明,以下采用国网浙江省电力公司宁波供电公司管辖的某地区的采 集终端数据进行算例仿真,该原始数据集共有11565条数据,经过数据清洗之后可用数据为 11312条,共有17个待评估的采集终端供应商,每个供应商下有若干设备批次,所有的设备 批次总数为58个。
将17个供应商及其58个批次的数据按顺序重新进行编号,以第1、3、12个供应商为例 分析GMM聚类算法的效果。第1个供应商下有2个批次,共142台采集终端;第3个供应 商下有4个批次,共496台采集终端,第12个供应商下有6个批次,共1514台采集终端。 每台采集终端都有8个指标。
对每个供应商下的采集终端都进行GMM聚类分析,可以获得表征各个供应商的采集终 端的典型采集终端,然后将这些典型采集终端相应的指标取平均值即可得到如表1所示的决 策矩阵D′。
表1标准化后的采集终端决策矩阵
表2分别给出了基于AHP、基于熵权法、相关系数法、变异系数法和组合优化模型的指 标权重。从表2可以看出:客观权重对主观权重起到了一定的修正作用,按照专家经验,采 集终端的严重异常指标α4应占有较大的权重,但另外三种客观赋权法都对α4给出了较小的权 重,这是因为原始数据中各个供应商的α4数值差异不大。因此,和其它指标相比,该指标难 以辨别各个供应商的采集终端优劣,故应当赋予较小的权重。
表2不同方法计算得到的指标权重
然后,基于得到的指标组合权重,形成采集终端的评估矩阵R,进而采用夹角度量法对 采集终端的质量进行综合评估,最后得到如表3所示的采集终端综合评估的结果。
表3采集终端综合评估结果
从表3可以看出:采集终端最好的前9家采集终端供应商分别为:10、9、6、5、7、13、4、11和16,其中第10个供应商在采集终端综合评估中的评估值最高,第8个供应商的评估值最低。
Claims (5)
1.一种基于高斯混合模型的采集终端生产厂商评价方法,其特征在于,包括如下步骤:
1)获取每个批次和区域中采集终端的原始数据,确定衡量采集终端的8个评估指标:8个评估指标分别为:负荷采集合格率α1,电量数据采集率α2,无故障工作时间α3,反映采集异常的严重异常次数α4、一般异常次数α5、轻微异常次数α6,维修率α7和在线率α8:
式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时间;Mi、mi、Ci、ci、bi和Bi分别是第i个采样时间段内采集终端负荷数据总个数、负荷数据合格的个数、理论应采集的数据量、实际采集的数据量、在线的采集终端个数和采集终端总个数;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内采集终端发生严重、一般和轻微故障的次数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间段;Trate和TF分别是采集终端的额定运行时间和故障停运时间;
2)采用高斯混合模型聚类算法提取采集终端海量数据中的评估指标数据,获取聚类中心,形成采集终端综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;
3)分别计算采集终端各项典型评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得采集终端综合评估的评估矩阵;
4)根据评估矩阵,用夹角度量法对采集终端的质量进行综合评估,按照从高至低的顺序将各个采集终端供应商的质量进行优劣排序,获得评价结果。
2.根据权利要求1的一种基于高斯混合模型的采集终端生产厂商评价方法,其特征在于,在步骤2)高斯混合模型聚类算法中:
假设GMM由K个高斯分布混合而成,则每个高斯分布称作一个“组分”,这些“组分”线性相加即为GMM的概率密度函数:
式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高斯模型的方差;
采集终端数据的GMM聚类算法流程为:
201)令l=0,随机选择初始化的ω(l),μ(l),Σ(l),求取第i个样本点xi属于第k类高斯模型的初始化后验概率:
202)将第201)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:
式中:N为待聚类的数据点个数;
203)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第202)步;
204)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:
根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μk,Σk|xi)取得最大的那类高斯模型中。
3.根据权利要求1的一种基于高斯混合模型的采集终端生产厂商评价方法,其特征在于,在步骤2),决策矩阵为:
式中:dij表示第i个采集终端供应商第j个指标的值,P为采集终端供应商个数,Q为衡量供应商的采集终端的评价指标个数,其中Q等于8;
效益型指标标准化处理方法为:
成本型指标标准化处理方法为:
式中:和分别表示所有P个采集终端供应商中指标j的最小值和最大值;Ω1表示效益型指标集合,其中Ω1={1,2,3,8};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。
4.根据权利要求1所述的一种基于高斯混合模型的采集终端生产厂商评价方法,其特征在于,在步骤3)中,分别采用层次分析法、熵权法、相关系数法和变异系数法计算采集终端指标权重,接着用指标的组合优化模型计算组合权重,其中:
层次分析法为:设Q个指标为U={u1,u2,…,uQ},每次取两个指标ui和uj,按1~9的比例用aij表示指标ui与uj对采集终端的影响程度之比,数值越大表示ui相对于uj越重要;这样即可获得一个采集终端评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质:aij>0,aji=1/aij,(i=1,2,…,Q;j=1,2,…,Q);计算指标权重前首先对判断矩阵A进行一致性检验,如果一致性检验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值前后一致,判断矩阵A可用于求取指标权重;求取指标权重可以用列和求逆法,即:
将bj归一化,即可求得归一化后的指标权重为
式中:且
采集终端指标的熵权为:
式中:κ表示常数κ=1/lnP,并且假定fij=0时,fijlnfij=0;且
计算皮尔逊相关系数权重包括:假设d′x=(d′1x,d′2x,...,d′Px)T和d′y=(d′1y,d′2y,...,d′Py)T表示标准化决策矩阵D′的两个列向量,则第x个指标和第y个指标之间的皮尔逊相关系数定义为
式中:和分别是向量d′x和d′y的平均值;基于皮尔逊相关系数的权重定义为
式中:且
计算变异系数法权重包括:指标uj的变异系数定义为:
式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值;基于变异系数法的指标权重定义为:
式中:且
指标权重的组合优化模型为:
式中:表示待优化的第j个采集终端指标的组合权重,表示采用第k种方法求解得到的第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数;显然,越大,权重与最终的组合权重越贴近。
5.根据权利要求1的一种基于高斯混合模型的采集终端生产厂商评价方法,其特征在于,在步骤4)用夹角度量法对采集终端的质量进行综合评估时,包括步骤:
401)形成P个待评估的供应商对应的Q个质量指标的评估矩阵
R=(rij)P×Q
式中:
402)计算采集终端评估中的理想点和负理想点,其分别为
式中:
403)分别计算每个供应商下的采集终端指标与理想点、负理想点的夹角距离,即
式中:ri=(ri1,ri2,...,riQ)表示评估矩阵R的第i个行向量;
404)计算每个供应商下的采集终端指标与理想点的夹角逼近程度,即
可以看出:第i个供应商生产的采集终端越好,γi愈接近于1;反之,质量越差,γi越接近于0;因此,可以根据γi取值的大小得到采集终端的评估结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810943550.5A CN109389281A (zh) | 2018-08-17 | 2018-08-17 | 一种基于高斯混合模型的采集终端生产厂商评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810943550.5A CN109389281A (zh) | 2018-08-17 | 2018-08-17 | 一种基于高斯混合模型的采集终端生产厂商评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109389281A true CN109389281A (zh) | 2019-02-26 |
Family
ID=65417601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810943550.5A Withdrawn CN109389281A (zh) | 2018-08-17 | 2018-08-17 | 一种基于高斯混合模型的采集终端生产厂商评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109389281A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898954A (zh) * | 2020-07-31 | 2020-11-06 | 沙师弟(重庆)网络科技有限公司 | 一种基于改进高斯混合模型聚类的车辆匹配方法 |
CN112348296A (zh) * | 2019-08-07 | 2021-02-09 | 中移信息技术有限公司 | 电信数据获取方法、装置、设备及存储介质 |
-
2018
- 2018-08-17 CN CN201810943550.5A patent/CN109389281A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112348296A (zh) * | 2019-08-07 | 2021-02-09 | 中移信息技术有限公司 | 电信数据获取方法、装置、设备及存储介质 |
CN112348296B (zh) * | 2019-08-07 | 2023-12-22 | 中移信息技术有限公司 | 电信数据获取方法、装置、设备及存储介质 |
CN111898954A (zh) * | 2020-07-31 | 2020-11-06 | 沙师弟(重庆)网络科技有限公司 | 一种基于改进高斯混合模型聚类的车辆匹配方法 |
CN111898954B (zh) * | 2020-07-31 | 2024-01-12 | 沙师弟(重庆)网络科技有限公司 | 一种基于改进高斯混合模型聚类的车辆匹配方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409628A (zh) | 基于计量大数据聚类模型的采集终端生产厂商评价方法 | |
Sun et al. | Using Bayesian deep learning to capture uncertainty for residential net load forecasting | |
CN108520357B (zh) | 一种线损异常原因的判别方法、装置及服务器 | |
CN109389145B (zh) | 基于计量大数据聚类模型的电能表生产厂商评价方法 | |
CN109389282A (zh) | 一种基于高斯混合模型的电能表生产厂商评价方法 | |
CN102467684A (zh) | 基于改进雷达图的综合性能评估系统和方法 | |
CN107832927B (zh) | 基于灰色关联分析法的10kV线路线变关系评价方法 | |
Ma et al. | Topology identification of distribution networks using a split-EM based data-driven approach | |
CN111949939B (zh) | 基于改进topsis和聚类分析的智能电表运行状态评价方法 | |
CN113792939B (zh) | 基于混合威布尔分布的电能表可靠性预测方法及装置 | |
Kong et al. | A remote estimation method of smart meter errors based on neural network filter and generalized damping recursive least square | |
CN110046797A (zh) | 基于critic和理想点法的计量设备运行质量评估方法 | |
Chen et al. | Data-driven robust state estimation through off-line learning and on-line matching | |
CN113406558A (zh) | 基于线性回归的电表失准检测方法、装置及电子设备 | |
CN115759393A (zh) | 基于集成学习的累积负荷基线预测方法 | |
CN109389281A (zh) | 一种基于高斯混合模型的采集终端生产厂商评价方法 | |
CN109409629B (zh) | 基于多属性决策模型的采集终端生产厂商评价方法 | |
CN101976222A (zh) | 一种基于框架的实时嵌入式软件可测试性测量方法 | |
CN105303194A (zh) | 一种电网指标体系建立方法、装置以及计算设备 | |
CN102468997A (zh) | 一种多维网络安全指标体系稳定性评估方法 | |
CN115146715A (zh) | 用电安全隐患诊断方法、装置、设备及存储介质 | |
CN115598459A (zh) | 一种配电网10kV馈线故障停电预测方法 | |
CN107491576B (zh) | 基于性能退化数据的导弹部件可靠性分析方法 | |
CN112116238A (zh) | 一种基于指标权重体系设计的满意度评估方法 | |
Gao et al. | Software Quality Evaluation Model based on Multiple Linear Regression and Fuzzy Comprehensive Evaluation Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190226 |