CN111506624A - 一种电力缺失数据辨识方法和相关装置 - Google Patents
一种电力缺失数据辨识方法和相关装置 Download PDFInfo
- Publication number
- CN111506624A CN111506624A CN202010299471.2A CN202010299471A CN111506624A CN 111506624 A CN111506624 A CN 111506624A CN 202010299471 A CN202010299471 A CN 202010299471A CN 111506624 A CN111506624 A CN 111506624A
- Authority
- CN
- China
- Prior art keywords
- voltage
- value
- data
- clustering
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000002159 abnormal effect Effects 0.000 claims abstract description 28
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000007621 cluster analysis Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 9
- 230000001960 triggered effect Effects 0.000 claims description 3
- 238000011161 development Methods 0.000 abstract description 5
- 238000010219 correlation analysis Methods 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 8
- 238000003064 k means clustering Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/219—Managing data history or versioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Public Health (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Fuzzy Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本申请公开了一种电力缺失数据辨识方法和相关装置,通过对电压确实位置的历史电压数据进行聚类分析,得到聚类集合,再利用电压数据关联属性进行多维度相关性分析,取各历史电压数据中属性综合加权值最大的数据作为电压确实位置的替代值,然后基于核聚类分析法对替代值进行异常点判断,从而确定最终填补至电压缺失位置的替代值,提高了缺失数据填补的准确性,解决了现有的因电网数据缺失,导致电网数据质量降低,为智能电网的信息化发展带来不便的技术问题。
Description
技术领域
本申请涉及电力系统数据分析技术领域,尤其涉及一种电力缺失数据辨识方法和相关装置。
背景技术
随着电网的飞速发展,建立信息化、自动化、互动化,以特高压为骨干网架、各级电网协调发展的智能电网已势在必行。然而,在实际的智能电网建设过程中,各个变电站的数据在提取和传输时,会产生海量的杂乱无章的数据,其数量级别是呈指数增长的,例如,电压数据的采集,在数据传输和使用过程中,有相当一部分数据因为人为因素或客观因素发生了缺失,降低了电网数据的质量,对电网的信息化建设带来了很大的不便,因此,为提高电网数据的质量,保障数据的完整性,为电网的信息化发展提供更好的便利性,有必要针对电网数据的缺失问题做出可靠的处理方案。
发明内容
本申请提供了一种电力缺失数据辨识方法和相关装置,用于解决现有的因电网数据缺失,导致电网数据质量降低,为智能电网的信息化发展带来不便的技术问题。
有鉴于此,本申请第一方面提供了一种电力缺失数据辨识方法,包括:
S1、获取电压缺失位置所处时段对应的历史电压数据;
S2、对所述历史电压数据进行聚类分析,得到若干个聚类集合;
S3、基于所述若干个聚类集合,采用属性综合权值法从所述若干个聚类集合筛选出属性综合加权值最大的个体作为所述电压缺失位置的替代值;
S4、基于核聚类分析法对所述替代值所在的聚类集合计算异常点;
S5、判断所述异常点是否为所述替代值,若是,则将所述替代值从所述聚类集合中去除,重新计算新的替代值,返回步骤S4,否则,将所述替代值填补至所述电压缺失位置。
可选地,还包括:
S6、检测是否所有电压缺失位置均已填补完成,若否,则返回步骤S1继续进行下一电压缺失位置的填补。
可选地,所述对所述历史电压数据进行聚类分析,得到若干个聚类集合,包括:
根据所述历史电压数据确定所述电压缺失位置填补的电压范围;
从所述电压范围中随机选取k个电压值作为初始聚类中心,得到k个初始聚类中心;
根据所述k个初始聚类中心的均值,计算所述历史电压数据每个个体到所述k个初始聚类中心的距离;
基于预置距离计算公式对每个个体进行聚类划分,得到若干中间集合;
根据所述若干中间集合,取各中间集合中所有个体的全维度算术平均值作为所述各中间集合的新聚类中心;
根据所述新聚类中心对所述历史电压数据进行中心聚类,得到若干个聚类集合。
可选地,所述基于所述若干个聚类集合,采用属性综合权值法从所述若干个聚类集合筛选出属性综合加权值最大的个体作为所述电压缺失位置的替代值,包括:
基于皮尔逊相关系数计算各预置电压关联属性间的互相关系数,将所述互相关系数大于系数阈值的所述预置电压关联属性存入互相关集合中;
计算所述互相关集合中所有电压关联属性的误差期望值;
若所述误差期望值大于强相关阈值,则将对应的所述电压关联属性存入强相关属性集合;
对所述强相关属性集合中的各属性采用熵权法确立各属性间的权重;
基于强相关系数和各属性间的权重,计算各所述聚类集合中每个个体的属性综合加权值,将所述属性综合加权值最大的个体作为所述电压缺失位置的替代值。
本申请第二方面提供了一种电力缺失数据辨识装置,包括:
获取单元,用于获取电压缺失位置所处时段对应的历史电压数据;
聚类单元,用于对所述历史电压数据进行聚类分析,得到若干个聚类集合;
加权单元,用于基于所述若干个聚类集合,采用属性综合权值法从所述若干个聚类集合筛选出属性综合加权值最大的个体作为所述电压缺失位置的替代值;
异常点计算单元,用于基于核聚类分析法对所述替代值所在的聚类集合计算异常点;
第一判断单元,用于判断所述异常点是否为所述替代值,若是,则将所述替代值从所述聚类集合中去除,重新计算新的替代值,触发所述异常点计算单元,否则,将所述替代值填补至所述电压缺失位置。
可选地,还包括第二判断单元;
所述第二判断单元,用于检测是否所有电压缺失位置均已填补完成,若否,则触发所述获取单元继续进行下一电压缺失位置的填补。
可选地,所述聚类单元具体用于:
根据所述历史电压数据确定所述电压缺失位置填补的电压范围;
从所述电压范围中随机选取k个电压值作为初始聚类中心,得到k个初始聚类中心;
根据所述k个初始聚类中心的均值,计算所述历史电压数据每个个体到所述k个初始聚类中心的距离;
基于预置距离计算公式对每个个体进行聚类划分,得到若干中间集合;
根据所述若干中间集合,取各中间集合中所有个体的全维度算术平均值作为所述各中间集合的新聚类中心;
根据所述新聚类中心对所述历史电压数据进行中心聚类,得到若干个聚类集合。
可选地,所述加权单元具体用于:
基于皮尔逊相关系数计算各预置电压关联属性间的互相关系数,将所述互相关系数大于系数阈值的所述预置电压关联属性存入互相关集合中;
计算所述互相关集合中所有电压关联属性的误差期望值;
若所述误差期望值大于强相关阈值,则将对应的所述电压关联属性存入强相关属性集合;
对所述强相关属性集合中的各属性采用熵权法确立各属性间的权重;
基于强相关系数和各属性间的权重,计算各所述聚类集合中每个个体的属性综合加权值,将所述属性综合加权值最大的个体作为所述电压缺失位置的替代值。
本申请第三方面提供了一种电力缺失数据辨识设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的电力缺失数据辨识方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面任一种所述的电力缺失数据辨识方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中提供了一种电力缺失数据辨识方法,包括:S1、获取电压缺失位置所处时段对应的历史电压数据;S2、对历史电压数据进行聚类分析,得到若干个聚类集合;S3、基于若干个聚类集合,采用属性综合权值法从若干个聚类集合筛选出属性综合加权值最大的个体作为电压缺失位置的替代值;S4、基于核聚类分析法对替代值所在的聚类集合计算异常点;S5、判断异常点是否为所述替代值,若是,则将替代值从聚类集合中去除,重新计算新的替代值,返回步骤S4,否则,将替代值填补至电压缺失位置。
本申请提供的电力缺失数据辨识方法,通过对电压确实位置的历史电压数据进行聚类分析,得到聚类集合,再利用电压数据关联属性进行多维度相关性分析,取各历史电压数据中属性综合加权值最大的数据作为电压确实位置的替代值,然后基于核聚类分析法对替代值进行异常点判断,从而确定最终填补至电压缺失位置的替代值,提高了缺失数据填补的准确性,解决了现有的因电网数据缺失,导致电网数据质量降低,为智能电网的信息化发展带来不便的技术问题。
附图说明
图1为本申请实施例中提供的一种电力缺失数据辨识方法的一个流程示意图;
图2为本申请实施例中提供的一种电力缺失数据辨识方法的另一个流程示意图;
图3为本申请实施例中提供的多维度相关性填补流程示意图;
图4为本申请实施例中的提供的一种电力缺失数据辨识装置的一个结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应理解的是,本申请的电力缺失数据辨识方法可不仅限于本申请实施例中的电压缺失数据辨识,本领域技术人员在本申请实施例的基础上,可以根据实际需求应用到电流缺失数据辨识等其他方面的电力缺失数据辨识场景。
为了便于理解,请参阅图1,本申请提供了一种电力缺失数据辨识方法的一个实施例,包括:
步骤101、获取电压缺失位置所处时段对应的历史电压数据。
需要说明的是,电力系统中的电压数据是按时段划分的,若获取的电压数据中,存在某个时段的的电压数据缺失,则可以获取该时段对应的历史历史电压数据,得到历史电压数据集合。
步骤102、对历史电压数据进行聚类分析,得到若干个聚类集合。
需要说明的是,为了找到电压缺失位置的数据的相似数据集合,需要对电压确实位置对应的时段的历史电压数据进行聚类分析,得到若干个聚类划分的聚类集合。
步骤103、基于若干个聚类集合,采用属性综合权值法从若干个聚类集合筛选出属性综合加权值最大的个体作为电压缺失位置的替代值。
需要说明的是,在对数据进行聚类之后,得到各数据对应的聚类集合,传统的缺失数据填补方法大多使用某个距离作为数据对象之间相似度的判断,但是并未考虑缺失数据的多维度属性对填补结果的影响,易产生较大的误差,因此,本申请实施例中,对于得到的聚类集合,采用属性综合权值法计算聚类集合中各个体数据的属性综合加权值,以属性综合加权值最大的个体数据作为电压确实位置的替代值,可以避免数据多维度关联属性带来的误差问题,从而提高缺失值填补的准确性。
步骤104、基于核聚类分析法对替代值所在的聚类集合计算异常点。
需要说明的是,数据校验的目的是为了找出聚类集合中的异常点,现有的异常点检测的方法较多,基于统计的方法通常难以获悉数据的分布,在处理高维数据时难以有好的效果,基于邻近度的方法采用的是距离的度量辅助全局阈值,通常难以考虑密度的变化,而基于密度的方法,在密度分布不均匀的时候,存在低密度模式问题。本申请实施例中采用基于聚类的方法计算异常点,在时间和空间复杂度都较低,且适用于大规模数据集,效率较高。在得到电压缺失位置的替代值之后,对替代值所在的聚类集合进行异常点检测。
步骤105、判断异常点是否为替代值,若是,则将替代值从聚类集合中去除,重新计算新的替代值,返回步骤104,否则,将替代值填补至电压缺失位置。
需要说明的是,步骤104的计算结果为该替代值为聚类集合的异常点,则需要将替代值从聚类集合中去除,重新进行新的替代值计算,直到确认得到的替代值不是聚类集合的异常点。若步骤104的计算结果为该替代值不是聚类集合的异常点,则将该替代值填补至对应的电压缺失位置。
本申请实施例提供的电力缺失数据辨识方法,通过对电压确实位置的历史电压数据进行聚类分析,得到聚类集合,再利用电压数据关联属性进行多维度相关性分析,取各历史电压数据中属性综合加权值最大的数据作为电压确实位置的替代值,然后基于核聚类分析法对替代值进行异常点判断,从而确定最终填补至电压缺失位置的替代值,提高了缺失数据填补的准确性,解决了现有的因电网数据缺失,导致电网数据质量降低,为智能电网的信息化发展带来不便的技术问题。
为了便于理解,请参阅图2和图3,本申请提供了一种电力缺失数据辨识方法的另一实施例,包括:
步骤201、获取电压缺失位置所处时段对应的历史电压数据。
需要说明的是,电压缺失位置可能是多个,相应地,在填补一个电压缺失位置之后,可以继续检测是否所有电压缺失位置是否已经填补完成,若是则结果流程,否则,继续进行下一电压缺失位置的填补流程。
步骤202、对历史电压数据进行k均值聚类分析,得到若干个聚类集合。
需要说明的是,对历史电压数据进行k均值聚类分析的具体步骤可以是根据历史电压数据确定电压缺失位置填补的电压范围,并从确定的电压范围内随机选取k个电压值作为初始聚类中心,即C={C1,C2,...,Ck}。计算k个初始聚类中心的均值,然后计算历史电压数据中每个个体到k个聚类中心的距离,采用以下公式计算得到的最小距离对每个个体进行重新划分,得到聚类结果:
其中,uj为每个个体的位置信息。
根据得到的聚类结果,取各划分中所有元素的全维度算术平均值作为均值,重新计算各变化中心的聚类均值,的都新的聚类中心,按照新的聚类中心重新进行聚类,得到最终的k均值聚类划分结果,即若干个聚类集合。
步骤203、基于皮尔逊相关系数计算各预置电压关联属性间的互相关系数,将互相关系数大于系数阈值的预置电压关联属性存入互相关集合中。
需要说明的是,电压数据对应着多个维度的属性,如电流、功率等,这些关联属性对电压缺失数据的填补结果有着较大的影响,因此,电压缺失数据的多维度属性不可忽视。本申请实施例中,基于皮尔逊相关系数计算各预置电压关联属性间的互相关系数,选择互相关系数大于系数阈值α的关联属性存入互相关集合HG中。
步骤204、计算互相关集合中所有电压关联属性的误差期望值。
需要说明的是,进一步计算互相关集合HG中所有关联属性的误差期望EXPError(Xk,Yk):
其中,Xk和Yk为两种关联属性,Cov(Xk,Yk)为Xk,Yk的协方差,Var[Xk]为Xk的方差,Var[Yk]为Yk的方差。
步骤205、若误差期望值大于强相关阈值,则将对应的电压关联属性存入强相关属性集合。
需要说明的是,设β为强相关阈值,则若EXPError(Xk,Yk)>β,则Xk和Yk为强相关属性,将Xk和Yk为保留到强相关属性集合QX中。
步骤206、对强相关属性集合中的各属性采用熵权法确立各属性间的权重。
需要说明的是,对强相关属性集合QX中的各关联属性采用熵权法确立其属性间的权重,得到权重向量:
W=[w1,w2,...,wm]
其中,1~m为第1~m个强关联属性。
步骤207、基于强相关系数和各属性间的权重,计算各聚类集合中每个个体的属性综合加权值,将属性综合加权值最大的个体作为电压缺失位置的替代值。
需要说明的是,据强相关系数得到的属性综合加权值SX为:
SX=w1S1+w2S1+...+wmSm
其中,S1,...,Sm为强相关系数。
对聚类集合内的个体按照属性综合加权值从大到小排序,选择SX值最大的作为电压缺失值的替代。
步骤208、基于核聚类分析法对替代值所在的聚类集合计算异常点。
步骤209、判断异常点是否为替代值,若是,则将替代值从聚类集合中去除,返回计算替代值的步骤重新计算新的替代值,返回步骤S08,否则,将替代值填补至电压缺失位置。
需要说明的是,本申请实施例中引入核函数,传统K均值聚类中定义的欧式距离公式也将通过核函数而变化,核函数用于反应数据间的相似度时,可用于距离函数。假设k是欧式空间的核函数,ψ是k的映射,k在空间X上定义的距离为:
因此可以得到x,x'之间的相似度量。
其中,dist表示核距离,即ρk(x,x')。
异常点通常为偏离期望的离群点,因此,如果填补的替代值为离群点,则很可能填补结果会不准确,因此需要通过计算SSE函数,若SSE函数的计算结果小于预设阈值,则该替代值不是异常点,可以作为缺失填补值,否则,该替代值视为异常点,需要重新进行新的替代值计算,直到找到不是异常点的替代值。
步骤210、检测是否所有电压缺失位置均已填补完成,若否,则返回步骤201继续进行下一电压缺失位置的填补。
为了便于理解,请参阅图4,本申请中提供了一种电力缺失数据辨识装置,包括:
获取单元,用于获取电压缺失位置所处时段对应的历史电压数据;
聚类单元,用于对历史电压数据进行聚类分析,得到若干个聚类集合;
加权单元,用于基于若干个聚类集合,采用属性综合权值法从若干个聚类集合筛选出属性综合加权值最大的个体作为电压缺失位置的替代值;
异常点计算单元,用于基于核聚类分析法对替代值所在的聚类集合计算异常点;
第一判断单元,用于判断异常点是否为替代值,若是,则将替代值从聚类集合中去除,重新计算新的替代值,触发异常点计算单元,否则,将替代值填补至电压缺失位置。
进一步地,还包括第二判断单元;
第二判断单元,用于检测是否所有电压缺失位置均已填补完成,若否,则触发获取单元继续进行下一电压缺失位置的填补。
进一步地,聚类单元具体用于:
根据历史电压数据确定电压缺失位置填补的电压范围;
从电压范围中随机选取k个电压值作为初始聚类中心,得到k个初始聚类中心;
根据k个初始聚类中心的均值,计算历史电压数据每个个体到k个初始聚类中心的距离;
基于预置距离计算公式对每个个体进行聚类划分,得到若干中间集合;
根据若干中间集合,取各中间集合中所有个体的全维度算术平均值作为各中间集合的新聚类中心;
根据新聚类中心对历史电压数据进行中心聚类,得到若干个聚类集合。
进一步地,加权单元具体用于:
基于皮尔逊相关系数计算各预置电压关联属性间的互相关系数,将互相关系数大于系数阈值的预置电压关联属性存入互相关集合中;
计算互相关集合中所有电压关联属性的误差期望值;
若误差期望值大于强相关阈值,则将对应的电压关联属性存入强相关属性集合;
对强相关属性集合中的各属性采用熵权法确立各属性间的权重;
基于强相关系数和各属性间的权重,计算各聚类集合中每个个体的属性综合加权值,将属性综合加权值最大的个体作为电压缺失位置的替代值。
本申请中提供了一种电力缺失数据辨识设备的实施例,设备包括处理器以及存储器:
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行前述的电力缺失数据辨识方法实施例中的任一种电力缺失数据辨识方法。
本申请中提供了一种计算机可读存储介质的实施例,计算机可读存储介质用于存储程序代码,所述程序代码用于执行前述的电力缺失数据辨识方法实施例中的任一种电力缺失数据辨识方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机系统(可以是个人计算机,服务器,或者网络系统等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种电力缺失数据辨识方法,其特征在于,包括:
S1、获取电压缺失位置所处时段对应的历史电压数据;
S2、对所述历史电压数据进行聚类分析,得到若干个聚类集合;
S3、基于所述若干个聚类集合,采用属性综合权值法从所述若干个聚类集合筛选出属性综合加权值最大的个体作为所述电压缺失位置的替代值;
S4、基于核聚类分析法对所述替代值所在的聚类集合计算异常点;
S5、判断所述异常点是否为所述替代值,若是,则将所述替代值从所述聚类集合中去除,重新计算新的替代值,返回步骤S4,否则,将所述替代值填补至所述电压缺失位置。
2.根据权利要求1所述的电力缺失数据辨识方法,其特征在于,还包括:
S6、检测是否所有电压缺失位置均已填补完成,若否,则返回步骤S1继续进行下一电压缺失位置的填补。
3.根据权利要求2所述的电力缺失数据辨识方法,其特征在于,所述对所述历史电压数据进行聚类分析,得到若干个聚类集合,包括:
根据所述历史电压数据确定所述电压缺失位置填补的电压范围;
从所述电压范围中随机选取k个电压值作为初始聚类中心,得到k个初始聚类中心;
根据所述k个初始聚类中心的均值,计算所述历史电压数据每个个体到所述k个初始聚类中心的距离;
基于预置距离计算公式对每个个体进行聚类划分,得到若干中间集合;
根据所述若干中间集合,取各中间集合中所有个体的全维度算术平均值作为所述各中间集合的新聚类中心;
根据所述新聚类中心对所述历史电压数据进行中心聚类,得到若干个聚类集合。
4.根据权利要求3所述的电力缺失数据辨识方法,其特征在于,所述基于所述若干个聚类集合,采用属性综合权值法从所述若干个聚类集合筛选出属性综合加权值最大的个体作为所述电压缺失位置的替代值,包括:
基于皮尔逊相关系数计算各预置电压关联属性间的互相关系数,将所述互相关系数大于系数阈值的所述预置电压关联属性存入互相关集合中;
计算所述互相关集合中所有电压关联属性的误差期望值;
若所述误差期望值大于强相关阈值,则将对应的所述电压关联属性存入强相关属性集合;
对所述强相关属性集合中的各属性采用熵权法确立各属性间的权重;
基于强相关系数和各属性间的权重,计算各所述聚类集合中每个个体的属性综合加权值,将所述属性综合加权值最大的个体作为所述电压缺失位置的替代值。
5.一种电力缺失数据辨识装置,其特征在于,包括:
获取单元,用于获取电压缺失位置所处时段对应的历史电压数据;
聚类单元,用于对所述历史电压数据进行聚类分析,得到若干个聚类集合;
加权单元,用于基于所述若干个聚类集合,采用属性综合权值法从所述若干个聚类集合筛选出属性综合加权值最大的个体作为所述电压缺失位置的替代值;
异常点计算单元,用于基于核聚类分析法对所述替代值所在的聚类集合计算异常点;
第一判断单元,用于判断所述异常点是否为所述替代值,若是,则将所述替代值从所述聚类集合中去除,重新计算新的替代值,触发所述异常点计算单元,否则,将所述替代值填补至所述电压缺失位置。
6.根据权利要求5所述的电力缺失数据辨识装置,其特征在于,还包括第二判断单元;
所述第二判断单元,用于检测是否所有电压缺失位置均已填补完成,若否,则触发所述获取单元继续进行下一电压缺失位置的填补。
7.根据权利要求6所述的电力缺失数据辨识装置,其特征在于,所述聚类单元具体用于:
根据所述历史电压数据确定所述电压缺失位置填补的电压范围;
从所述电压范围中随机选取k个电压值作为初始聚类中心,得到k个初始聚类中心;
根据所述k个初始聚类中心的均值,计算所述历史电压数据每个个体到所述k个初始聚类中心的距离;
基于预置距离计算公式对每个个体进行聚类划分,得到若干中间集合;
根据所述若干中间集合,取各中间集合中所有个体的全维度算术平均值作为所述各中间集合的新聚类中心;
根据所述新聚类中心对所述历史电压数据进行中心聚类,得到若干个聚类集合。
8.根据权利要求7所述的电力缺失数据辨识装置,其特征在于,所述加权单元具体用于:
基于皮尔逊相关系数计算各预置电压关联属性间的互相关系数,将所述互相关系数大于系数阈值的所述预置电压关联属性存入互相关集合中;
计算所述互相关集合中所有电压关联属性的误差期望值;
若所述误差期望值大于强相关阈值,则将对应的所述电压关联属性存入强相关属性集合;
对所述强相关属性集合中的各属性采用熵权法确立各属性间的权重;
基于强相关系数和各属性间的权重,计算各所述聚类集合中每个个体的属性综合加权值,将所述属性综合加权值最大的个体作为所述电压缺失位置的替代值。
9.一种电力缺失数据辨识设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的电力缺失数据辨识方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的电力缺失数据辨识方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010299471.2A CN111506624B (zh) | 2020-04-16 | 2020-04-16 | 一种电力缺失数据辨识方法和相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010299471.2A CN111506624B (zh) | 2020-04-16 | 2020-04-16 | 一种电力缺失数据辨识方法和相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111506624A true CN111506624A (zh) | 2020-08-07 |
CN111506624B CN111506624B (zh) | 2023-05-23 |
Family
ID=71876161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010299471.2A Active CN111506624B (zh) | 2020-04-16 | 2020-04-16 | 一种电力缺失数据辨识方法和相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111506624B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114065878A (zh) * | 2022-01-17 | 2022-02-18 | 国网山东省电力公司泰安供电公司 | 一种基于多参量物联融合技术的电量缺失值填补方法 |
CN116908533A (zh) * | 2023-09-14 | 2023-10-20 | 安徽融兆智能有限公司 | 一种具有计量功能的电力用户用电信息采集设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664990A (zh) * | 2018-03-29 | 2018-10-16 | 清华大学 | 综合熵方法和密度聚类方法的窃电检测方法及装置 |
CN109145957A (zh) * | 2018-07-26 | 2019-01-04 | 国网浙江省电力有限公司温州供电公司 | 基于大数据的配电网异常指标的识别与处理方法及装置 |
CN109816017A (zh) * | 2019-01-24 | 2019-05-28 | 电子科技大学 | 基于模糊聚类和拉格朗日插值的电网缺失数据填补方法 |
CN110599060A (zh) * | 2019-09-20 | 2019-12-20 | 南方电网科学研究院有限责任公司 | 配电网运行效率确定方法、装置及设备 |
-
2020
- 2020-04-16 CN CN202010299471.2A patent/CN111506624B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664990A (zh) * | 2018-03-29 | 2018-10-16 | 清华大学 | 综合熵方法和密度聚类方法的窃电检测方法及装置 |
CN109145957A (zh) * | 2018-07-26 | 2019-01-04 | 国网浙江省电力有限公司温州供电公司 | 基于大数据的配电网异常指标的识别与处理方法及装置 |
CN109816017A (zh) * | 2019-01-24 | 2019-05-28 | 电子科技大学 | 基于模糊聚类和拉格朗日插值的电网缺失数据填补方法 |
CN110599060A (zh) * | 2019-09-20 | 2019-12-20 | 南方电网科学研究院有限责任公司 | 配电网运行效率确定方法、装置及设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114065878A (zh) * | 2022-01-17 | 2022-02-18 | 国网山东省电力公司泰安供电公司 | 一种基于多参量物联融合技术的电量缺失值填补方法 |
CN116908533A (zh) * | 2023-09-14 | 2023-10-20 | 安徽融兆智能有限公司 | 一种具有计量功能的电力用户用电信息采集设备 |
CN116908533B (zh) * | 2023-09-14 | 2023-12-08 | 安徽融兆智能有限公司 | 一种具有计量功能的电力用户用电信息采集设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111506624B (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107194430B (zh) | 一种样本筛选方法及装置,电子设备 | |
EP3590287B1 (en) | Generating wireless network access point models using clustering techniques | |
CN105488539B (zh) | 分类模型的生成方法及装置、系统容量的预估方法及装置 | |
WO2019169704A1 (zh) | 一种数据分类方法、装置、设备及计算机可读存储介质 | |
CN111612041A (zh) | 异常用户识别方法及装置、存储介质、电子设备 | |
CN109934301B (zh) | 一种电力负荷聚类分析方法、装置和设备 | |
CN112800231B (zh) | 电力数据校验方法、装置、计算机设备和存储介质 | |
CN110874381B (zh) | 一种基于空间密度聚类的用户侧负荷数据异常值识别方法 | |
Gao et al. | James–Stein shrinkage to improve k-means cluster analysis | |
CN111506624A (zh) | 一种电力缺失数据辨识方法和相关装置 | |
CN109829494A (zh) | 一种基于加权相似性度量的聚类集成方法 | |
Salam Patrous et al. | Evaluating prediction accuracy for collaborative filtering algorithms in recommender systems | |
CN110796159A (zh) | 基于k-means算法的电力数据分类方法及系统 | |
CN113125903A (zh) | 线损异常检测方法、装置、设备及计算机可读存储介质 | |
CN110147493B (zh) | 活跃因子的确定方法、装置、计算机设备及存储介质 | |
CN111898637A (zh) | 一种基于ReliefF-DDC特征选择算法 | |
CN110895706A (zh) | 一种目标聚类数的获取方法、装置及计算机系统 | |
CN114462538A (zh) | 基于kmeans的电网异常设备检测方法及装置 | |
CN108363740B (zh) | Ip地址的分析方法、装置、存储介质及终端 | |
CN110580483A (zh) | 一种室内外用户区分方法及装置 | |
CN111476438A (zh) | 一种用户用电量预测方法、系统以及设备 | |
CN111144424A (zh) | 一种基于聚类算法的人员特征检分析方法 | |
CN108133234B (zh) | 基于稀疏子集选择算法的社区检测方法、装置及设备 | |
CN115664814A (zh) | 网络入侵检测方法、装置、电子设备及存储介质 | |
CN111401392B (zh) | 聚类集成方法及装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |