CN107463532A - 一种电力统计数据的质量分析方法 - Google Patents
一种电力统计数据的质量分析方法 Download PDFInfo
- Publication number
- CN107463532A CN107463532A CN201710511968.4A CN201710511968A CN107463532A CN 107463532 A CN107463532 A CN 107463532A CN 201710511968 A CN201710511968 A CN 201710511968A CN 107463532 A CN107463532 A CN 107463532A
- Authority
- CN
- China
- Prior art keywords
- analysis
- data
- quality
- electric power
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 189
- 238000011002 quantification Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 42
- 238000000034 method Methods 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 8
- 238000007405 data analysis Methods 0.000 claims description 4
- 238000000205 computational method Methods 0.000 claims description 2
- 238000007689 inspection Methods 0.000 claims description 2
- 230000001737 promoting effect Effects 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims 1
- 235000013399 edible fruits Nutrition 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 6
- 239000000463 material Substances 0.000 abstract description 5
- 230000008878 coupling Effects 0.000 abstract description 2
- 238000010168 coupling process Methods 0.000 abstract description 2
- 238000005859 coupling reaction Methods 0.000 abstract description 2
- 238000012216 screening Methods 0.000 abstract description 2
- 230000000007 visual effect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 6
- 230000007547 defect Effects 0.000 description 4
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 230000005611 electricity Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000003869 coulometry Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种电力统计数据的质量分析方法,本发明建立了一个质量分析模型,该质量分析模型结合电力统计指标的物理意义对分析指标构建精确的分析规则,再对每个分析指标进行加权,然后通过统计量化数据在每个分析指标上的状态,进而得出电力统计数据的质量状况。从而使得较为抽象的电网数据质量分析转化为直观易懂的指数化分析结果,实现分析数据的定性与定量的结合。本发明能够快速进行数据的筛选和处理,解决目前依靠人工检索问题数据,进行人工分析处理,花费大量的人力、物力,而且工作效率还不高的问题。
Description
技术领域
本发明涉及一种电力统计数据的质量分析方法。
背景技术
数据质量分析是数据质量管理的重要组成部分,承担着发现数据问题的重任,是改善数据质量的驱动力和风向标。数据质量是一个多维的概念,每一个维度代表一个审视数据质量的角度,数据质量分析是以需求为导向的,同样的数据在不同的应用背景下的接受度是不同的。在本项目中数据质量包含四个维度,即提升营销出账率、提升台区线损可监测数及合理率、降低现场消缺工作量,降低新装、改造表计故障、档案、互联关系的出错量。
在数据质量管理的所有环节中,数据质量分析是提高数据质量的基础和必要前提,它能对应用系统的整体或部分数据的质量状况给出一个合理的描述和评价,从而可以帮助数据用户了解应用系统的数据质量水平,及时发现数据质量问题,并采取相应的处理过程来修复数据质量问题,提高数据质量。
在电力系统中,数据质量问题也越来越收到研究者的关注,随着电网信息化、数字化进程的快速发展,电力部门形成了一个庞大的统计数据体系,此统计数据起着反映电网的运行状态、为电网扩展和规划提供依据等重要作用。而统计数据质量问题日益显现并日渐突出,这些数据质量问题主要表现为数据不正确、数据不一致、数据不完整等方面,急需一套方案对统计数据质量进行有效管理。
目前依靠人工检索问题数据,进行人工分析处理,花费大量的人力、物力,而且工作效率还不高。
发明内容
本发明的目的是提供一种电力统计数据的质量分析方法,本发明通过建立质量分析模型,进行数据质量分析,能够快速进行数据的筛选和处理,用以解决目前依靠人工检索问题数据,进行人工分析处理,花费大量的人力、物力,而且工作效率还不高的问题。
为实现上述目的,本发明的方案是:一种电力统计数据的质量分析方法,所述的数据质量分析方法首先建立一个电力统计数据的质量分析模型,所述的质量分析模型对分析指标构建精确的分析规则,再对每个分析指标进行加权,然后通过统计量化数据在每个分析指标上的状态,进而得出电力统计数据的质量状况;
所述的数据质量分析方法具体包括:
(1)进行数据预处理,选择进行质量分析的统计数据对象,并根据用户的实际需求,选取分析指标;
(2)根据选取的分析指标,设计各个分析指标对应的数据质量分析规则,构成分析规则集;
(3)确定各分析规则对应的权重和期望值;
(4)根据分析规则集中的每条分析规则,对所选定的数据对象进行检测分析,计算所述数据对象基于各分析规则的最终评价得分结果;
(5)根据所述的权重、期望值和评价得分结果,分别计算出数据质量的综合分析值SA、总体期望值SE和相对差值SR,其中,SA反映了统计数据的真实数据质量状况,SE反映了对统计数据质量的总体期望值,而SR反映的是统计数据相对于其期望值SE的数据质量状况;
(6)根据步骤(5)的结果即可分析得到电力统计数据的质量状况。
进一步地,根据本发明所述的电力统计数据的质量分析方法,若SA∈(98,100]则评定该分析数据对象的数据质量水平为“优”,若SA∈(95,98]则评定该分析数据对象的数据质量水平为“良”,若SA∈(85,95]则评定该分析数据对象的数据质量水平为“中”,若SA∈(0,85]则评定该分析数据对象的数据质量水平为“差”。
进一步地,根据本发明所述的电力统计数据的质量分析方法,所述的步骤(4)中,若SR>0,则其数值越大,说明数据质量比预期的越好;若SR<0,则其数值越大,说明数据质量比预期的越差。
进一步地,根据本发明所述的电力统计数据的质量分析方法,所述的步骤(4)中,综合分析值SA、总体期望值SE和相对差值SR的计算方法分别为:
SR=SA-SE
进一步地,根据本发明所述的电力统计数据的质量分析方法,所述的权重的计算采用层次分析方法,具体为:
(1)建立阶梯层次结构;
(2)根据递阶层次结构构造判断矩阵;
(3)计算权重向量;
(4)检验判断矩阵的一致性。
进一步地,根据本发明所述的电力统计数据的质量分析方法,所述的阶梯层次结构从高到低依次为:目标层,准则层和措施层,所述的目标层包括问题的预定目标,准则层包括影响目标实现的准则,措施层包括促使目标实现的措施。
进一步地,根据本发明所述的电力统计数据的质量分析方法,所述的判断矩阵为:每一个具有向下隶属关系的准则作为判断矩阵的第一个元素,隶属于它的各个元素依次排列在其后的第一行和第一列,每一个准则及它所支配的因素都得到一个判断矩阵。
进一步地,根据本发明所述的电力统计数据的质量分析方法,判断矩阵的一致性检验方法为:
(1)计算一致性指标n表示判断矩阵的阶数,λmax表示判断矩阵的特征向量的最大值;
(2)查表确定相应的平均随机一致性指标;
(3)计算一致性比例CR,即
(4)当CR<0.1时,认为判断矩阵的一致性是可以接受的,CR>0.1时,认为判断矩阵不符合一致性要求,需要对该判断矩阵进行重新修正。
进一步地,根据本发明所述的电力统计数据的质量分析方法,所述的数据分析指标包括正确性、完整性、准确性、有效性和一致性。
进一步地,根据本发明所述的电力统计数据的质量分析方法,所述的质量分析模型M为:M=<D,I,R,W,E,S>;
其中,D表示需要进行数据质量分析的统计数据对象;
I表示统计数据对象D上需要进行分析的指标集合,记为I={I1,I2,…I|I|},其中Ii(i=1,2,…|I|),表示第i个分析指标;
R表示与分析指标相对应的分析规则的集合,记为R={Ri,r},(1≤r≤|R|),Ri,r表示分析指标Ii的第r个分析规则;
W表示赋予分析规则R的权重集合,记为W={Wt,ω},对于分析规则Rr(Ii)(1≤r≤|R|)而言,即为Wr,w=Ww(Rr(Ii));Wt,ω表示对第t个分析规则的权重记为ω;
E表示对分析规则R给出的期望值,即进行数据质量分析前对该分析规则所期望的结果,介于0到100之间的实数,记为E={Er,e},(1≤e≤|E|),针对分析规则Rr(Ii)而言,即为Er,e=Ee(Rr(Ii));Er,e表示对第r个分析规则的期望值记为e。
S表示数据对象基于分析规则进行数据质量分析的最终评价得分结果,介于0到100之间的实数,记为S={Sr,e},(1≤s≤|S|),针对分析规则Rr(Ii)而言,即为Sr,s=Ss(Rr(Ii))。
本发明达到的有益效果:本发明通过建立一个电力统计数据的质量分析模型对分析指标构建精确的分析规则,再对每个分析指标进行加权,然后通过统计量化数据在每个分析指标上的状态,进而得出电力统计数据的质量状况,大大节省了人力物力,并提到了工作效率。
附图说明
图1是本发明数据质量分析方法的流程图;
图2是本发明的递阶层次结构图。
具体实施方式
下面结合附图和具体的实施例对本发明作进一步详细的说明。
本发明的数据质量分析方法建立了一个电力统计数据的质量分析模型,该质量分析模型结合电力统计指标的物理意义对分析指标构建精确的分析规则,再对每个分析指标进行加权,然后通过统计量化数据在每个分析指标上的状态,进而得出电力统计数据的质量状况。从而使得较为抽象的电网数据质量分析转化为直观易懂的指数化分析结果,实现分析数据的定性与定量的结合。
本发明建立的数据质量分析模型M为:M=<D,I,R,W,E,S>。其中:
D表示需要进行数据质量分析的统计数据对象;
I表示统计数据对象D上需要进行分析的指标集合,记为I={I1,I2,…I|I|},其中Ii(i=1,2,…|I|),表示第i个分析指标;
R表示与分析指标相对应的分析规则的集合,记为R={Ri,r},(1≤r≤|R|),Ri,r表示分析指标Ii的第r个分析规则;
W表示赋予分析规则R的权重集合,记为W={Wt,ω},对于分析规则Rr(Ii)(1≤r≤|R|)而言,即为Wr,w=Ww(Rr(Ii));
E表示对分析规则R给出的期望值,即进行数据质量分析前对该分析规则所期望的结果,介于0到100之间的实数,记为E={Er,e},(1≤e≤|E|),针对分析规则Rr(Ii)而言,即为Er,e=Ee(Rr(Ii));
S表示数据对象基于分析规则进行数据质量分析的最终评价得分结果,介于0到100之间的实数,记为S={Sr,e},(1≤s≤|S|),针对分析规则Rr(Ii)而言,即为Sr,s=Ss(Rr(Ii))。
如图1所示,本发明电力统计数据的质量分析方法的具体过程为:
1,选择进行质量分析的统计数据对象
在进行数据质量分析时,首先要提出数据质量分析的需求,确定哪些数据对象是用户感兴趣的,本实施例选择选择用电信息采集系统的数据作为质量分析对象。
2,选取数据分析指标
数据分析指标包括正确性、完整性、准确性、有效性和一致性,根据用户的实际需求,可选择需要的分析指标。
本实施例对选择的数据质量分析对象,从提高采集数据出账应用率、提升台区线损可监测率及合理率、降低现场消缺工作量,降低新装台区表计出错率四个方面进行详细介绍。
a.提升出账应用率:包括事实符合性和输入正确性两个方面,主要用于描述数据是否与其对应的客观实体的特征相一致。针对总量统计数据的准确性分析,主要在纵向时间维度开展,根据统计指标与其相关联指标变动趋势的偏离程度加以评判。针对个体或分类统计数据的准确性分析,则主要在横向空间维度开展,对数据的统计分布形态加以一致性检验,或者利用重复调查或随机实验方法对事先假定的误差参数进行估计。
b.提升台区线损可监测率和合理率:对于台区线损可监测率和合理率的提升,选取完整性和唯一性进行分析,对于数据的完整性分析,即描述数据是否存在缺失记录或缺失字段,对于数据的唯一性分析,即描述数据是否存在重复的记录。
c.降低现场消缺工作量:对于现场消缺工作量的降低,主要是对数据的准确性分析,即描述属性值的精度是否符合要求。
d.降低新装台区表计出错率:主要选择了有效性的分析,包括格式有效性和数值有效性两个方面。任何字段的数据都应该符合特定的数据格式以及值域范围,例如:发电量数据是正数;线损率应该在0到1之间。
3,设计分析规则
根据选择的分析指标,设计各个指标对应的数据质量分析规则。一般而言,同一个分析指标可以通过多条分析规则进行分析。
例如:出账电量分析指标I1设计两条分析规则{R1(I1),R2(I1)},两条分析规则的具体内容为:
1)R1(I1)季节性规则:居民用户夏季与非夏季平均用电量波动率超过78%,在夏季对居民用户阈值提高到1.78倍。
2)R2(I1)用户分类和容量不同制定电量规则:非居民用户,本月抄表电量小于2000度,上月采用采集数据出账且环比波动率小于50%的,本月采用出账电量。
4,确定分析指标的权值及期望
由于不同的电力统计数据集对数据质量有各自不同的要求,因此对分析规则的期望和权重也各不相同,分析指标赋予的权值越大,说明该指标与数据质量水平的关联度越大,反之,则越小。
本实施例采用基于层次分析法对各分析指标的权重进行分析与计算,将定量分析与定性分析相结合,利用较少的定量信息使权重的确定过程数学化,能简单有效地给出每个分析指标的权重。综合考虑各分析指标之间的关系,组成系统的递阶层次结构,再根据各分析指标的相对重要性,构建判断矩阵,然后将判断矩阵的特征向量进行归一化处理求得各分析指标的权重;由于判断矩阵是依据主观判断确定标度值的,为防止片面性、主观性导致的错误,需要对其进行一致性检验。
5,计算分析规则得分
根据分析规则Ri集中的每条分析规则,对所选定的数据对象进行检测分析,计算所述数据对象基于各分析规则的最终评价得分结果。
然后,根据前面所得到权重W、期望值E和评价得分结果S,分别计算出数据质量的综合分析值SA、总体期望值SE和相对差值SR:
其中:SA反映了统计数据的真实数据质量状况;SE反映了对统计数据质量的总体期望值;而SR反映的是统计数据相对于其期望值SE的数据质量状况。
本实施例中,若SA∈(98,100]则评定该分析数据对象的数据质量水平为“优”,若SA∈(95,98]则评定该分析数据对象的数据质量水平为“良”,若SA∈(85,95]则评定该分析数据对象的数据质量水平为“中”,若SA∈(0,85]则评定该分析数据对象的数据质量水平为“差”。
若SR符号为正,则其数值越大,说明数据质量比预期的更好;若SR符号为负,则其数值越大,说明数据质量比预期的更差。
本实施例步骤4中,确定各分析指标权重的具体过程为:
步骤一:建立递阶层次结构
递阶层次结构包括三个层次,即:目标层(最高层)、准则层(中间层)和措施层(最低层),其中,目标层指问题的预定目标;准则层指影响目标实现的准则;措施层指促使目标实现的措施。
首先,确定目标层,即明确决策的目标,作为目标层的元素,目标层只有一个元素。然后,找出影响目标实现的准则,作为目标层下的准则层因素。最后分析为了解决决策问题(实现决策目标),在上述准则下,有哪些最终解决方案(措施),并将它们作为措施层因素,放在递阶层次结构的最下面(最低层)。
本实施例中,电力系统统计数据的决策目标是“合理分析数据质量,提高数据质量整体水平”。为了实现这一目标,需要考虑的主要准则有五个,即正确性、完整性、唯一性、准确性、有效性。本实施例只考虑这些准则,然后将各个层次的因素按其上下关系摆放好位置,并将它们之间的关系用连线连接起来,这样构成的递阶层次结构如图2。
步骤二:构造判断矩阵并赋值
根据递阶层次结构构造判断矩阵,其方法是:每一个具有向下隶属关系的元素(被称作准则)作为判断矩阵的第一个元素(位于左上角),隶属于它的各个元素依次排列在其后的第一行和第一列。
对判断矩阵进行赋值时,针对判断矩阵的准则,对两个元素两两比较,判断哪个重要,重要多少,对重要性程度按1~9进行赋值,如表1。
表1
设填写后的判断矩阵为A=(ajk)n×n,判断矩阵具有如下性质:
(1)ajk>0;
(2)ajk=1/akj;
(3)ajk=1。
根据上面性质,判断矩阵具有对称性,因此在填写时,通常先填写ajk=1部分,然后再仅需判断及填写上三角形或下三角形的n(n-1)/2个元素就可以了。
根据步骤一的决策目标,本实施例构造的判断矩阵如下:
步骤三:计算权向量
由于每个准则都支配下一层若干因素,这样对于每一个准则及它所支配的因素都可以得到一个判断矩阵。本实施例采用幂法1求判断矩阵A的最大特征值及其对应的特征向量如下:
本实施例利用matlab对矩阵A进行行向量平均值标准化得:
可求得权重向量:
并用matlab求得判断矩阵A的最大特征值λmax=5.0988。
步骤四:一致性检验
一致性检验的步骤如下:
1,计算一致性指标CI
其中,n表示判断矩阵的阶数。
2,查表确定相应的平均随机一致性指标RI
据判断矩阵不同阶数查表2,得到平均随机一致性指标。例如,对于n=5阶的判断矩阵,查表得到RI=1.12。
表2平均随机一致性指标
矩阵阶数 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
RI | 0 | 0 | 0.52 | 0.80 | 1.12 | 1.26 | 1.36 | 1.41 |
矩阵阶数 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
RI | 1.46 | 1.49 | 1.52 | 1.54 | 1.56 | 1.58 | 1.59 |
3,计算一致性比例CR,并进行判断
当CR<0.1时,认为判断矩阵的一致性是可以接受的,CR>0.1时,认为判断矩阵不符合一致性要求,需要对该判断矩阵进行重新修正。
本实施例计算得到:
由此可得出CR=0.0206<0.1,符合一致性要求。
本发明通过建立一个电力统计数据的质量分析模型对分析指标构建精确的分析规则,再对每个分析指标进行加权,然后通过统计量化数据在每个分析指标上的状态,进而得出电力统计数据的质量状况,大大节省了人力物力,并提到了工作效率。
Claims (10)
1.一种电力统计数据的质量分析方法,其特征在于:所述的数据质量分析方法首先建立一个电力统计数据的质量分析模型,所述的质量分析模型对分析指标构建精确的分析规则,再对每个分析指标进行加权,然后通过统计量化数据在每个分析指标上的状态,进而得出电力统计数据的质量状况;
所述的数据质量分析方法具体包括:
(1)进行数据预处理,选择进行质量分析的统计数据对象,并根据用户的实际需求,选取分析指标;
(2)根据选取的分析指标,设计各个分析指标对应的数据质量分析规则,构成分析规则集;
(3)确定各分析规则对应的权重和期望值;
(4)根据分析规则集中的每条分析规则,对所选定的数据对象进行检测分析,计算所述数据对象基于各分析规则的最终评价得分结果;
(5)根据所述的权重、期望值和评价得分结果,分别计算出数据质量的综合分析值SA、总体期望值SE和相对差值SR,其中,SA反映了统计数据的真实数据质量状况,SE反映了对统计数据质量的总体期望值,而SR反映的是统计数据相对于其期望值SE的数据质量状况;
(6)根据步骤(5)的结果即可分析得到电力统计数据的质量状况。
2.根据权利要求1所述的电力统计数据的质量分析方法,其特征在于,若SA∈(98,100]则评定该分析数据对象的数据质量水平为“优”,若SA∈(95,98]则评定该分析数据对象的数据质量水平为“良”,若SA∈(85,95]则评定该分析数据对象的数据质量水平为“中”,若SA∈(0,85]则评定该分析数据对象的数据质量水平为“差”。
3.根据权利要求1所述的电力统计数据的质量分析方法,其特征在于,所述的步骤(4)中,若SR>0,则其数值越大,说明数据质量比预期的越好;若SR<0,则其数值越大,说明数据质量比预期的越差。
4.根据权利要求1所述的电力统计数据的质量分析方法,其特征在于,所述的步骤(4)中,综合分析值SA、总体期望值SE和相对差值SR的计算方法分别为:
SR=SA-SE。
5.根据权利要求1所述的电力统计数据的质量分析方法,其特征在于,所述的权重的计算采用层次分析方法,具体为:
(1)建立阶梯层次结构;
(2)根据递阶层次结构构造判断矩阵;
(3)计算权重向量;
(4)检验判断矩阵的一致性。
6.根据权利要求5所述的电力统计数据的质量分析方法,其特征在于,所述的阶梯层次结构从高到低依次为:目标层,准则层和措施层,所述的目标层包括问题的预定目标,准则层包括影响目标实现的准则,措施层包括促使目标实现的措施。
7.根据权利要求5所述的电力统计数据的质量分析方法,其特征在于,所述的判断矩阵为:每一个具有向下隶属关系的准则作为判断矩阵的第一个元素,隶属于它的各个元素依次排列在其后的第一行和第一列,每一个准则及它所支配的因素都得到一个判断矩阵。
8.根据权利要求5所述的电力统计数据的质量分析方法,其特征在于,判断矩阵的一致性检验方法为:
(1)计算一致性指标n表示判断矩阵的阶数,λmax表示判断矩阵的特征向量的最大值;
(2)查表确定相应的平均随机一致性指标;
(3)计算一致性比例CR,即
(4)当CR<0.1时,认为判断矩阵的一致性是可以接受的,CR>0.1时,认为判断矩阵不符合一致性要求,需要对该判断矩阵进行重新修正。
9.根据权利要求1所述的电力统计数据的质量分析方法,其特征在于,所述的数据分析指标包括正确性、完整性、准确性、有效性和一致性。
10.根据权利要求1所述的电力统计数据的质量分析方法,其特征在于,所述的质量分析模型M为:M=<D,I,R,W,E,S>;
其中,D表示需要进行数据质量分析的统计数据对象;
I表示统计数据对象D上需要进行分析的指标集合,记为I={I1,I2,…I|I|},其中Ii(i=1,2,…|I|),表示第i个分析指标;
R表示与分析指标相对应的分析规则的集合,记为R={Ri,r},(1≤r≤|R|),Ri,r表示分析指标Ii的第r个分析规则;
W表示赋予分析规则R的权重集合,记为W={Wt,ω},Wt,ω表示对第t个分析规则的权重记为ω,对于分析规则Rr(Ii)(1≤r≤|R|)而言,即为Wr,w=Ww(Rr(Ii));
E表示对分析规则R给出的期望值,即进行数据质量分析前对该分析规则所期望的结果,介于0到100之间的实数,记为E={Er,e},(1≤e≤|E|),Er,e表示对第r个分析规则的期望值记为e,针对分析规则Rr(Ii)而言,即为Er,e=Ee(Rr(Ii));
S表示数据对象基于分析规则进行数据质量分析的最终评价得分结果,介于0到100之间的实数,记为S={Sr,e},(1≤s≤|S|),针对分析规则Rr(Ii)而言,即为Sr,s=Ss(Rr(Ii))。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710511968.4A CN107463532A (zh) | 2017-06-28 | 2017-06-28 | 一种电力统计数据的质量分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710511968.4A CN107463532A (zh) | 2017-06-28 | 2017-06-28 | 一种电力统计数据的质量分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107463532A true CN107463532A (zh) | 2017-12-12 |
Family
ID=60546483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710511968.4A Pending CN107463532A (zh) | 2017-06-28 | 2017-06-28 | 一种电力统计数据的质量分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107463532A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829750A (zh) * | 2018-05-24 | 2018-11-16 | 国信优易数据有限公司 | 一种数据质量确定系统以及方法 |
CN110033201A (zh) * | 2019-04-22 | 2019-07-19 | 浙江中烟工业有限责任公司 | 一种烟草工业批次全过程数据质量评价和改进的方法和装置 |
CN110737640A (zh) * | 2019-10-12 | 2020-01-31 | 齐鲁工业大学 | 一种基于分布式系统的数据质量提高方法及系统 |
CN113376469A (zh) * | 2021-06-29 | 2021-09-10 | 四川大学 | 一种电能质量扰动数据的分析方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902882A (zh) * | 2012-09-14 | 2013-01-30 | 安徽南瑞继远软件有限公司 | 一种信息系统运行质量的评价方法 |
CN103247008A (zh) * | 2013-05-07 | 2013-08-14 | 国家电网公司 | 一种电力统计指标数据的质量评估方法 |
CN103646189A (zh) * | 2013-12-26 | 2014-03-19 | 刘淑艳 | 一种微生物能力验证结果综合评价方法 |
CN104134160A (zh) * | 2014-08-13 | 2014-11-05 | 国网上海市电力公司 | 一种基于cream模型的电力系统人因可靠性评价方法 |
CN106295911A (zh) * | 2016-08-30 | 2017-01-04 | 东方电子股份有限公司 | 一种基于层析分析法的电网支路参数评价方法 |
-
2017
- 2017-06-28 CN CN201710511968.4A patent/CN107463532A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902882A (zh) * | 2012-09-14 | 2013-01-30 | 安徽南瑞继远软件有限公司 | 一种信息系统运行质量的评价方法 |
CN103247008A (zh) * | 2013-05-07 | 2013-08-14 | 国家电网公司 | 一种电力统计指标数据的质量评估方法 |
CN103646189A (zh) * | 2013-12-26 | 2014-03-19 | 刘淑艳 | 一种微生物能力验证结果综合评价方法 |
CN104134160A (zh) * | 2014-08-13 | 2014-11-05 | 国网上海市电力公司 | 一种基于cream模型的电力系统人因可靠性评价方法 |
CN106295911A (zh) * | 2016-08-30 | 2017-01-04 | 东方电子股份有限公司 | 一种基于层析分析法的电网支路参数评价方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829750A (zh) * | 2018-05-24 | 2018-11-16 | 国信优易数据有限公司 | 一种数据质量确定系统以及方法 |
CN110033201A (zh) * | 2019-04-22 | 2019-07-19 | 浙江中烟工业有限责任公司 | 一种烟草工业批次全过程数据质量评价和改进的方法和装置 |
CN110737640A (zh) * | 2019-10-12 | 2020-01-31 | 齐鲁工业大学 | 一种基于分布式系统的数据质量提高方法及系统 |
CN113376469A (zh) * | 2021-06-29 | 2021-09-10 | 四川大学 | 一种电能质量扰动数据的分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107463532A (zh) | 一种电力统计数据的质量分析方法 | |
CN102467684B (zh) | 基于改进雷达图的综合性能评估系统和方法 | |
CN107909282A (zh) | 一种电子政务服务效能评价系统和方法 | |
CN106447212A (zh) | 一种基于ahp的智能电表软件质量评价方法 | |
CN109711707B (zh) | 一种船舶动力装置综合状态评估方法 | |
CN111126865B (zh) | 一种基于科技大数据的技术成熟度判断方法和系统 | |
CN114444910A (zh) | 一种面向电力物联网的边缘网络系统健康度评估方法 | |
CN115545514A (zh) | 基于健康度评估的配电融合设备差异化运维方法及装置 | |
CN109165824A (zh) | 一种针对关键流程的评估方法及系统 | |
CN103198208B (zh) | 一种适用于小子样情形的权重确定方法 | |
CN108665090B (zh) | 基于主成分分析与Verhulst模型的城市电网饱和负荷预测方法 | |
CN111832854A (zh) | 汽车研发质量管理体系的成熟度量化评价方法、系统及可读介质 | |
CN108108834A (zh) | 一种直升机关重件磨损率预测方法 | |
CN115099699A (zh) | 一种基于mabac综合算法的海岸侵蚀强度评价方法 | |
CN107526710A (zh) | 一种基于蒙特卡罗算法的场地适宜性层次分析方法 | |
WO2022133889A1 (zh) | 基于设备监理的电站设备质量数据处理方法及装置 | |
CN114266485A (zh) | 电力信息通信数据质量检测模型的构建方法及构建系统 | |
CN113610383A (zh) | 大气复合污染观测数据的质量及共享效果评价方法与系统 | |
CN113726558A (zh) | 基于随机森林算法的网络设备流量预测系统 | |
CN113129188A (zh) | 一种基于人工智能大数据的省级教育教学评估系统 | |
CN103780461B (zh) | 综合考虑主客观权重的Web业务服务质量QoS的测量方法 | |
CN207232961U (zh) | 一种可实时对水雨情数据进行检验的系统 | |
CN111026661A (zh) | 一种软件易用性全面测试方法及系统 | |
CN113065755B (zh) | 一种中低压熔断器型号选择方法、装置、设备和介质 | |
CN108710980A (zh) | 航天型号产品合同履行绩效的评价方法、装置和实现装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171212 |