CN114065878A - 一种基于多参量物联融合技术的电量缺失值填补方法 - Google Patents

一种基于多参量物联融合技术的电量缺失值填补方法 Download PDF

Info

Publication number
CN114065878A
CN114065878A CN202210046321.XA CN202210046321A CN114065878A CN 114065878 A CN114065878 A CN 114065878A CN 202210046321 A CN202210046321 A CN 202210046321A CN 114065878 A CN114065878 A CN 114065878A
Authority
CN
China
Prior art keywords
data
known attribute
electric quantity
attribute data
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210046321.XA
Other languages
English (en)
Inventor
梁作宾
袁飞
王庆
张寒
叶俊
程岳雷
谢雨濛
毕晓凤
李喆
王圣军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202210046321.XA priority Critical patent/CN114065878A/zh
Publication of CN114065878A publication Critical patent/CN114065878A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于多参量物联融合技术的电量缺失值填补方法,涉及电力计量技术领域,包括以下步骤:搭建多参量物联融合框架,收集与电量相关的已知属性数据;获取电量数据;对数据进行降噪处理,然后计算各已知属性数据与电量数据的相关系数值,筛选出相关系数值大于阈值的已知属性数据进行后续步骤,其余已知属性数据不参与后续步骤;对各已知属性数据分别进行聚类分析,得到各已知属性数据的相似场景集合;计算各已知属性数据的权值;计算相似度,结合权值计算综合相似度;寻找综合相似度最高的时间段,选用该时间段的电量数据进行缺失值填补;充分利用电量相关属性数据,提高缺失值填补的准确性。

Description

一种基于多参量物联融合技术的电量缺失值填补方法
技术领域
本发明属于电力计量技术领域,具体涉及一种基于多参量物联融合技术的电量缺失值填补方法。
背景技术
随着电力信息采集系统和高级量测体系(advanced metering infrastructure,简称AMI)的广泛应用,电量数据的智能采集已经实现全覆盖。然而实际应用中,电量数据在采集过程中难免存在频次、精度的缺乏问题,导致数据存在部分缺失值,干扰数据分析的过程,影响模型最终的识别效果。因此,如何有效填补配网侧用户数据缺失值成为一大难题。
目前常见的电量缺失值填补方法是采用默认值、均值或众数来填补缺失值,但这种方法填补的缺失值不够准确,填补误差较大,人为的增加了数据的噪声,填补效果不理想,急需一种合理有效的方法实现电量缺失值的精确填补,满足数据分析和数据应用的需要。
有鉴于此,本发明提供一种基于多参量物联融合技术的电量缺失值填补方法,以解决现有技术存在的缺陷,是非常有必要的。
发明内容
针对现有技术存在的不足,本发明提供一种基于多参量物联融合技术的电量缺失值填补方法,充分利用电量相关属性数据,选取相似度最高的电量数据进行缺失值填补,减小填补误差,提高缺失值填补的准确性。
为实现上述目的,本发明给出以下技术方案:
一种基于多参量物联融合技术的电量缺失值填补方法,包括以下步骤:
S1:搭建多参量物联融合框架,收集与电量相关的已知属性数据;
S2:获取电量数据;
S3:分别对已知属性数据和电量数据进行降噪处理,然后计算各已知属性数据与电量数据的相关系数值,筛选出相关系数值大于阈值的已知属性数据进行后续步骤,其余已知属性数据不参与后续步骤;
S4:对筛选出的各已知属性数据分别进行聚类分析,得到各已知属性数据的相似场景集合;
S5:计算各已知属性数据的权值;
S6:在相似场景中,计算电量缺失时间段的已知属性数据与其他日期相同时间段的已知属性数据之间的相似度,结合权值计算综合相似度;
S7:寻找综合相似度最高的时间段,选用该时间段的电量数据进行缺失值填补。
作为优选,所述步骤S1中搭建多参量物联融合框架包括以下步骤:
搭建感知层,将各类终端数据进行统一标准化接入,进行各类信息的全景、广域采集;
搭建网络层,利用现有的基础网络设施构建接入网、骨干网、业务网和支撑网,对来自感知层的信息进行接入和传输;
搭建平台层,基于云平台算法和计算资源,全面整合能源控制参量、能源运行数据、能源使用数据,将网络层传输的数据通过统一的数据中心进行实时处理;
搭建应用层,在应用层中完成相关的高级应用建设。
搭建多参量物联融合框架方便进行已知属性数据的收集。
作为优选,所述步骤S3中进行降噪处理时选用经验模态分解算法,包括以下步骤:
采用经验模态分解算法对数据变量进行分解,得到若干个模态分量和一个剩余分量;
计算数据变量与其各个模态分量之间的相关系数值,选取相关系数值大于界限值的模态分量;
将选出的各模态分量与剩余分量相加得到去除噪声的数据变量。
作为优选,所述步骤S3中计算各已知属性与电量数据的相关系数值时采用斯皮尔曼等级相关系数计算法,计算过程如下:
降噪处理过的已知属性数据与电量数据进行斯皮尔曼等级相关系数计算,计算表达式为:
Figure DEST_PATH_IMAGE001
其中,xi为已知属性数据,y为电量数据;
Figure 60189DEST_PATH_IMAGE002
为降噪处理后已知属性数据与电量数据的斯皮尔曼等级相关系数值,
Figure DEST_PATH_IMAGE003
的取值范围为[0,1],k为数据容量,因此已知属性数据和电量数据为(xi1,y1),(xi2,y2),…,(xik,yk),将xi与y之间不同时刻数据从高到低排列,依次得到等级1,2,…,k,即(xt,yt)变为(xit',yt'),等级之差At=xit'-yt'。
作为优选,所述步骤S3中的阈值大小为0.3,筛选出相关系数值大于0.3的已知属性数据进行后续步骤,其余已知属性数据不参与后续步骤;相关系数值小于0.3表示两者之间为弱相关或者极弱相关。
作为优选,所述步骤S4包括以下步骤:
导入已知属性数据并对数据进行归一化处理;
采用Canopy聚类算法对已知属性数据分别进行粗聚类运算,得到各已知属性的最佳聚类数目Li,i=1,2,…m,其中m为已知属性种类个数;
得到最佳聚类数目Li后,通过经遗传算法改进的K-means算法得到第i个已知属性的聚类结果,最终得到m个不同属性的簇类集
Figure 789110DEST_PATH_IMAGE004
,i=1,2,…m,每一个簇类为一个相似场景。
作为优选,通过经遗传算法改进的K-means算法得到第i个已知属性的聚类结果实现过程如下:
步骤1:进行遗传算法初始化参数设置,设置最大迭代数、种群大小、交叉概率、变异概率、迭代阈值,将每个个体大小设置为Li
步骤2:使簇类数据间差异尽可能小,设置目标函数如下:
Figure 867925DEST_PATH_IMAGE005
其中gi为各个聚类中心,x为样本数据;
构造适应度函数为:
Figure DEST_PATH_IMAGE006
步骤3:每个个体随机从数据中选取Li个数据,并对每个个体进行编码;
步骤4:对每个个体进行K-means操作,计算每个个体的适应度;
步骤5:判断是否满足终止条件,若满足终止条件则输出聚类结果,无法满足终止条件则进入步骤6;
步骤6:对每个个体进行选择、交叉和变异,然后重新回到步骤4。
作为优选,所述步骤S5中权值的计算过程如下:
采用G1法计算各已知属性的权重值并进行归一化处理得到W1=[w11,w12,…w1m],使得
Figure 303585DEST_PATH_IMAGE007
,其中m表示已知属性种类个数;
采用熵权法计算各已知属性的权重值进行归一化处理得到W1=[w21,w22,…w2m],使得
Figure DEST_PATH_IMAGE008
,其中m表示已知属性种类个数;
将已知属性与电量数据的相关系数值进行归一化处理得到W1=[w31,w32,…w3m],使得
Figure 75232DEST_PATH_IMAGE009
,其中m表示已知属性种类个数;
采用三标度层次分析法计算W1,W2,W3的权重值分别为
Figure DEST_PATH_IMAGE010
Figure 25871DEST_PATH_IMAGE011
Figure DEST_PATH_IMAGE012
,最终得到已知属性的权值为:
Figure 908376DEST_PATH_IMAGE013
,其中i=1,2,…m。
作为优选,所述步骤S6包括以下步骤:
设一共有R个日期其中有T个日期有电量缺失值,寻找第K个电量缺失日期tK所对应的多个相似场景,其中K=1,2,…,T;在每个相似场景中,计算tK电量缺失时间段已知属性数据与其余日期相同时间段已知属性数据之间的动态时间弯曲距离
Figure 260860DEST_PATH_IMAGE014
,其中j=1,2,…,R-1,i=1,2,…,m,其中j表示除tK外的日期,i表示各已知属性,共计m个已知属性;若时间段不与tK在同一簇类下,则
Figure 203408DEST_PATH_IMAGE014
记为无穷大;
根据动态时间弯曲距离计算相似度
Figure 641343DEST_PATH_IMAGE015
,计算公式如下:
Figure DEST_PATH_IMAGE016
结合权值计算综合相似度
Figure 999643DEST_PATH_IMAGE017
,计算公式如下:
Figure DEST_PATH_IMAGE018
本发明的有益效果在于,采用经验模态分解对已知属性数据和电量数据进行降噪处理,并采用斯皮尔曼等级相关系数计算各已知属性数据与电量数据之间的相关系数值,筛选出与电量数据相关性较大的已知属性数据;采用Canopy聚类算法得到最佳聚类数,并通过经遗传算法改进的K-means算法对每一种已知属性中的数据分别进行聚类分析从而找出相似场景,在相似场景中采用动态时间弯曲距离来计算缺失时刻数据与历史数据的相似程度,并结合权值计算得到综合相似度最高的时间段,用综合相似度最高时间段的电量数据对电量缺失值进行填补;充分利用多个电量相关属性数据和电量历史数据,选取相似度最高的数据进行缺失值填补,减小填补误差,进一步提高电量缺失值填补的准确性,满足数据分析和数据应用的需要。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一种基于多参量物联融合技术的电量缺失值填补方法的流程图。
图2是图1中步骤S3的流程图。
图3是图1中步骤S4的流程图。
图4是图1中步骤S5的流程图。
图5是图1中步骤S6的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
如图1至图5所示,本发明实施例提供一种基于多参量物联融合技术的电量缺失值填补方法,包括以下步骤:
S1:搭建多参量物联融合框架,收集与电量相关的已知属性数据;
其中搭建多参量物联融合框架包括以下步骤:
搭建感知层,将各类终端数据进行统一标准化接入,进行各类信息的全景、广域采集;
搭建网络层,利用现有的基础网络设施构建接入网、骨干网、业务网和支撑网,对来自感知层的信息进行接入和传输;
搭建平台层,基于云平台算法和计算资源,全面整合能源控制参量、能源运行数据、能源使用数据,将网络层传输的数据通过统一的数据中心进行实时处理;
搭建应用层,在应用层中完成相关的高级应用建设。
搭建多参量物联融合框架方便进行已知属性数据的收集。
S2:获取电量数据。
S3:分别对已知属性数据和电量数据进行降噪处理,降噪处理方法选用经验模态分解算法,包括以下步骤:
采用经验模态分解算法对数据变量进行分解,得到若干个模态分量和一个剩余分量;
采用Pearson相关系数算法计算数据变量与其各个模态分量之间的相关系数值,选取相关系数值大于界限值的模态分量,界限值为0.3;
将选出的各模态分量与剩余分量相加得到去除噪声的数据变量;
然后计算各已知属性与电量数据的相关系数值,采用斯皮尔曼等级相关系数计算法,计算表达式为:
Figure 409896DEST_PATH_IMAGE001
其中,xi为已知属性数据,y为电量数据;
Figure 523345DEST_PATH_IMAGE002
为降噪处理后已知属性数据与电量数据的斯皮尔曼等级相关系数值,
Figure 448576DEST_PATH_IMAGE003
的取值范围为[0,1],k为数据容量,因此已知属性数据和电量数据为(xi1,y1),(xi2,y2),…,(xik,yk),将xi与y之间不同时刻数据从高到低排列,依次得到等级1,2,…,k,即(xt,yt)变为(xit',yt'),等级之差At=xit'-yt';
筛选出相关系数值大于阈值的已知属性数据进行后续步骤,其余已知属性数据不参与后续步骤,其中阈值大小为0.3,筛选出相关系数值大于0.3的已知属性m个进行后续步骤,其余已知属性数据不参与后续步骤;相关系数值小于0.3表示两者之间为弱相关或者极弱相关。
S4:对筛选出的各已知属性数据分别进行聚类分析,得到各已知属性数据的相似场景集合,具体包括以下步骤:
导入已知属性数据并对数据进行归一化处理;
采用Canopy聚类算法对已知属性数据分别进行粗聚类运算,得到各已知属性的最佳聚类数目Li,i=1,2,…m,其中m为已知属性种类个数;
得到最佳聚类数目Li后,通过经遗传算法改进的K-means算法得到第i个已知属性的聚类结果,最终得到m个不同属性的簇类集
Figure 610567DEST_PATH_IMAGE004
,i=1,2,…m,每一个簇类为一个相似场景;
通过经遗传算法改进的K-means算法得到第i个已知属性的聚类结果实现过程如下:
步骤1:进行遗传算法初始化参数设置,设置最大迭代数、种群大小、交叉概率、变异概率、迭代阈值,将每个个体大小设置为Li
步骤2:使簇类数据间差异尽可能小,设置目标函数如下:
Figure 672064DEST_PATH_IMAGE005
其中gi为各个聚类中心,x为样本数据;
构造适应度函数为:
Figure 956415DEST_PATH_IMAGE006
步骤3:每个个体随机从数据中选取Li个数据,并对每个个体进行编码;
步骤4:对每个个体进行K-means操作,计算每个个体的适应度;
步骤5:判断是否满足终止条件,若满足终止条件则输出聚类结果,无法满足终止条件则进入步骤6;
步骤6:对每个个体进行选择、交叉和变异,然后重新回到步骤4。
S5:计算各已知属性数据的权值,具体计算过程如下:
采用G1法计算各已知属性的权重值并进行归一化处理得到W1=[w11,w12,…w1m],使得
Figure 368942DEST_PATH_IMAGE007
,其中m表示已知属性种类个数;
采用熵权法计算各已知属性的权重值进行归一化处理得到W1=[w21,w22,…w2m],使得
Figure 396940DEST_PATH_IMAGE008
,其中m表示已知属性种类个数;
将已知属性与电量数据的相关系数值进行归一化处理得到W1=[w31,w32,…w3m],使得
Figure 578523DEST_PATH_IMAGE009
,其中m表示已知属性种类个数;
用三标度(1,0.5,0)两两对比三种计算权重的方法,建立一级指标的优先评断矩阵F:
Figure 768196DEST_PATH_IMAGE019
矩阵中元素fpq表示影响计算权重方法up与uq的相互关系,其中fpq判断规则如下:
Figure 668019DEST_PATH_IMAGE020
将评判矩阵转换为模糊一致性判断矩阵R,计算过程如下:
Figure 234129DEST_PATH_IMAGE021
Figure 535798DEST_PATH_IMAGE022
Figure 896372DEST_PATH_IMAGE023
对模糊一致性判断矩阵R进行一致性校验,即当∀p,q,η∈I(I={1,2,3})且p≠q≠η时,如果有
Figure 221174DEST_PATH_IMAGE024
,则矩阵R满足一致性;如果R不满足一致性,则将R转换成一致性矩阵R′;
Figure 590976DEST_PATH_IMAGE025
;对一致性矩阵R或R′用和行归一法求得权重向量w,即:
Figure 481571DEST_PATH_IMAGE026
;采用三标度层次分析法计算W1,W2,W3的权重值分别为
Figure 278626DEST_PATH_IMAGE010
Figure 887462DEST_PATH_IMAGE027
Figure 60954DEST_PATH_IMAGE012
;最终得到已知属性的权值为:
Figure 71635DEST_PATH_IMAGE013
,其中i=1,2,m。
S6:在相似场景中,计算电量缺失时间段的已知属性数据与其他日期相同时间段的已知属性数据之间的相似度,结合权值计算综合相似度,具体包括以下步骤:
设一共有R个日期其中有T个日期有电量缺失值,寻找第K个电量缺失日期tK所对应的多个相似场景,其中K=1,2,…,T;在每个相似场景中,计算tK电量缺失时间段已知属性数据与其余日期相同时间段已知属性数据之间的动态时间弯曲距离
Figure 39591DEST_PATH_IMAGE014
,其中j=1,2,…,R-1,i=1,2,…,m,其中j表示除tK外的日期,i表示各已知属性,共计m个已知属性;若时间段不与tK在同一簇类下,则
Figure 135723DEST_PATH_IMAGE014
记为无穷大;
根据动态时间弯曲距离计算相似度
Figure 847327DEST_PATH_IMAGE015
,计算公式如下:
Figure 712515DEST_PATH_IMAGE016
结合权值计算综合相似度
Figure 851373DEST_PATH_IMAGE017
,计算公式如下:
Figure 360765DEST_PATH_IMAGE018
S7:寻找综合相似度最高的时间段,选用该时间段的电量数据进行缺失值填补。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种基于多参量物联融合技术的电量缺失值填补方法,其特征在于,包括以下步骤:
S1:搭建多参量物联融合框架,收集与电量相关的已知属性数据;
S2:获取电量数据;
S3:分别对已知属性数据和电量数据进行降噪处理,然后计算各已知属性数据与电量数据的相关系数值,筛选出相关系数值大于阈值的已知属性数据进行后续步骤,其余已知属性数据不参与后续步骤;
S4:对筛选出的各已知属性数据分别进行聚类分析,得到各已知属性数据的相似场景集合;
S5:计算各已知属性数据的权值;
S6:在相似场景中,计算电量缺失时间段的已知属性数据与其他日期相同时间段的已知属性数据之间的相似度,结合权值计算综合相似度;
S7:寻找综合相似度最高的时间段,选用该时间段的电量数据进行缺失值填补。
2.根据权利要求1所述的一种基于多参量物联融合技术的电量缺失值填补方法,其特征在于,所述步骤S1中搭建多参量物联融合框架包括以下步骤:
搭建感知层,将各类终端数据进行统一标准化接入,进行各类信息的全景、广域采集;
搭建网络层,利用现有的基础网络设施构建接入网、骨干网、业务网和支撑网,对来自感知层的信息进行接入和传输;
搭建平台层,基于云平台算法和计算资源,全面整合能源控制参量、能源运行数据、能源使用数据,将网络层传输的数据通过统一的数据中心进行实时处理;
搭建应用层,在应用层中完成相关的高级应用建设。
3.根据权利要求2所述的一种基于多参量物联融合技术的电量缺失值填补方法,其特征在于,所述步骤S3中进行降噪处理时选用经验模态分解算法,包括以下步骤:
采用经验模态分解算法对数据变量进行分解,得到若干个模态分量和一个剩余分量;
计算数据变量与其各个模态分量之间的相关系数值,选取相关系数值大于界限值的模态分量;
将选出的各模态分量与剩余分量相加得到去除噪声的数据变量。
4.根据权利要求3所述的一种基于多参量物联融合技术的电量缺失值填补方法,其特征在于,所述步骤S3中计算各已知属性与电量数据的相关系数值时采用斯皮尔曼等级相关系数计算法,计算过程如下:
降噪处理过的已知属性数据与电量数据进行斯皮尔曼等级相关系数计算,计算表达式为:
Figure 253552DEST_PATH_IMAGE001
其中,xi为已知属性数据,y为电量数据;
Figure 170692DEST_PATH_IMAGE002
为降噪处理后已知属性数据与电量数据的斯皮尔曼等级相关系数值,
Figure 950429DEST_PATH_IMAGE003
的取值范围为[0,1],k为数据容量,因此已知属性数据和电量数据为(xi1,y1),(xi2,y2),…,(xik,yk),将xi与y之间不同时刻数据从高到低排列,依次得到等级1,2,…,k,即(xt,yt)变为(xit',yt'),等级之差At=xit'- yt'。
5.根据权利要求4所述的一种基于多参量物联融合技术的电量缺失值填补方法,其特征在于,所述步骤S3中的阈值大小为0.3,筛选出相关系数值大于0.3的已知属性数据进行后续步骤,其余已知属性数据不参与后续步骤。
6.根据权利要求5所述的一种基于多参量物联融合技术的电量缺失值填补方法,其特征在于,所述步骤S4包括以下步骤:
导入已知属性数据并对数据进行归一化处理;
采用Canopy聚类算法对已知属性数据分别进行粗聚类运算,得到各已知属性的最佳聚类数目Li,i=1,2,…m,其中m为已知属性种类个数;
得到最佳聚类数目Li后,通过经遗传算法改进的K-means算法得到第i个已知属性的聚类结果,最终得到m个不同属性的簇类集
Figure 345639DEST_PATH_IMAGE004
,i=1,2,…m,每一个簇类为一个相似场景。
7.根据权利要求6所述的一种基于多参量物联融合技术的电量缺失值填补方法,其特征在于,通过经遗传算法改进的K-means算法得到第i个已知属性的聚类结果实现过程如下:
步骤1:进行遗传算法初始化参数设置,设置最大迭代数、种群大小、交叉概率、变异概率、迭代阈值,将每个个体大小设置为Li
步骤2:使簇类数据间差异尽可能小,设置目标函数如下:
Figure 160011DEST_PATH_IMAGE005
其中gi为各个聚类中心,x为样本数据;
构造适应度函数为:
Figure 982473DEST_PATH_IMAGE006
步骤3:每个个体随机从数据中选取Li个数据,并对每个个体进行编码;
步骤4:对每个个体进行K-means操作,计算每个个体的适应度;
步骤5:判断是否满足终止条件,若满足终止条件则输出聚类结果,无法满足终止条件则进入步骤6;
步骤6:对每个个体进行选择、交叉和变异,然后重新回到步骤4。
8.根据权利要求7所述的一种基于多参量物联融合技术的电量缺失值填补方法,其特征在于,所述步骤S5中权值的计算过程如下:
采用G1法计算各已知属性的权重值并进行归一化处理得到W1=[w11,w12,…w1m],使得
Figure 249507DEST_PATH_IMAGE007
,其中m表示已知属性种类个数;
采用熵权法计算各已知属性的权重值进行归一化处理得到W1=[w21,w22,…w2m],使得
Figure 386090DEST_PATH_IMAGE008
,其中m表示已知属性种类个数;
将已知属性与电量数据的相关系数值进行归一化处理得到W1=[w31,w32,…w3m],使得
Figure 54969DEST_PATH_IMAGE009
,其中m表示已知属性种类个数;
采用三标度层次分析法计算W1,W2,W3的权重值分别为
Figure 48332DEST_PATH_IMAGE010
Figure 802662DEST_PATH_IMAGE011
Figure 539674DEST_PATH_IMAGE012
,最终得到已知属性的权值为:
Figure 63059DEST_PATH_IMAGE013
,其中i=1,2,…m。
9.根据权利要求8所述的一种基于多参量物联融合技术的电量缺失值填补方法,其特征在于,所述步骤S6包括以下步骤:
根据动态时间弯曲距离计算相似度
Figure 492903DEST_PATH_IMAGE014
,计算公式如下:
Figure 734529DEST_PATH_IMAGE015
结合权值计算综合相似度
Figure 9652DEST_PATH_IMAGE016
,计算公式如下:
Figure 653123DEST_PATH_IMAGE017
CN202210046321.XA 2022-01-17 2022-01-17 一种基于多参量物联融合技术的电量缺失值填补方法 Pending CN114065878A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210046321.XA CN114065878A (zh) 2022-01-17 2022-01-17 一种基于多参量物联融合技术的电量缺失值填补方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210046321.XA CN114065878A (zh) 2022-01-17 2022-01-17 一种基于多参量物联融合技术的电量缺失值填补方法

Publications (1)

Publication Number Publication Date
CN114065878A true CN114065878A (zh) 2022-02-18

Family

ID=80231433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210046321.XA Pending CN114065878A (zh) 2022-01-17 2022-01-17 一种基于多参量物联融合技术的电量缺失值填补方法

Country Status (1)

Country Link
CN (1) CN114065878A (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247933A (zh) * 2017-05-27 2017-10-13 北京理工大学 一种烟雾环境中fmcw激光定距系统差频信号提取方法
CN111027775A (zh) * 2019-12-12 2020-04-17 中国长江三峡集团有限公司 基于长短期记忆网络的梯级水电站发电量预测方法
CN111309718A (zh) * 2020-02-19 2020-06-19 南方电网科学研究院有限责任公司 一种配网电压数据缺失填补方法及装置
CN111368259A (zh) * 2020-03-09 2020-07-03 南方电网科学研究院有限责任公司 一种配网电压数据缺失填补方法及相关装置
CN111506624A (zh) * 2020-04-16 2020-08-07 南方电网科学研究院有限责任公司 一种电力缺失数据辨识方法和相关装置
CN111507412A (zh) * 2020-04-20 2020-08-07 南京工程学院 一种基于历史数据辅助场景分析的电压缺失值填补方法
CN111563077A (zh) * 2020-05-12 2020-08-21 国网山东省电力公司泰安供电公司 一种电网电压数据缺失填补方法、系统、终端及存储介质
CN112070121A (zh) * 2020-08-12 2020-12-11 国网黑龙江省电力有限公司哈尔滨供电公司 一种基于变分自编码器的智能电表数据填补方法
CN112687349A (zh) * 2020-12-25 2021-04-20 广东海洋大学 一种降低辛烷值损失模型的构建方法
CN112801197A (zh) * 2021-02-05 2021-05-14 广东工业大学 一种基于用户数据分布的K-means方法
CN112907064A (zh) * 2021-02-08 2021-06-04 国网安徽省电力有限公司蚌埠供电公司 基于自适应窗的电量预测方法、装置、存储介质及终端
CN113657937A (zh) * 2021-08-17 2021-11-16 江南大学 基于eemd-cnn+sae-rfr混合算法的日前电价预测方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247933A (zh) * 2017-05-27 2017-10-13 北京理工大学 一种烟雾环境中fmcw激光定距系统差频信号提取方法
CN111027775A (zh) * 2019-12-12 2020-04-17 中国长江三峡集团有限公司 基于长短期记忆网络的梯级水电站发电量预测方法
CN111309718A (zh) * 2020-02-19 2020-06-19 南方电网科学研究院有限责任公司 一种配网电压数据缺失填补方法及装置
CN111368259A (zh) * 2020-03-09 2020-07-03 南方电网科学研究院有限责任公司 一种配网电压数据缺失填补方法及相关装置
CN111506624A (zh) * 2020-04-16 2020-08-07 南方电网科学研究院有限责任公司 一种电力缺失数据辨识方法和相关装置
CN111507412A (zh) * 2020-04-20 2020-08-07 南京工程学院 一种基于历史数据辅助场景分析的电压缺失值填补方法
CN111563077A (zh) * 2020-05-12 2020-08-21 国网山东省电力公司泰安供电公司 一种电网电压数据缺失填补方法、系统、终端及存储介质
CN112070121A (zh) * 2020-08-12 2020-12-11 国网黑龙江省电力有限公司哈尔滨供电公司 一种基于变分自编码器的智能电表数据填补方法
CN112687349A (zh) * 2020-12-25 2021-04-20 广东海洋大学 一种降低辛烷值损失模型的构建方法
CN112801197A (zh) * 2021-02-05 2021-05-14 广东工业大学 一种基于用户数据分布的K-means方法
CN112907064A (zh) * 2021-02-08 2021-06-04 国网安徽省电力有限公司蚌埠供电公司 基于自适应窗的电量预测方法、装置、存储介质及终端
CN113657937A (zh) * 2021-08-17 2021-11-16 江南大学 基于eemd-cnn+sae-rfr混合算法的日前电价预测方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
张毅等: "基于遗传算法的改进K-mean 遥感影像分类算法研究", 《企业技术开发》 *
张毅等: "基于遗传算法的改进K-mean 遥感影像分类算法研究", 《企业技术开发》, vol. 29, no. 13, 31 July 2010 (2010-07-31), pages 3 *
沈利兵等: "基于三标度层次分析法的路网脆弱性影响因素研究", 《广西师范大学学报:自然科学版》 *
沈利兵等: "基于三标度层次分析法的路网脆弱性影响因素研究", 《广西师范大学学报:自然科学版》, vol. 31, no. 4, 31 December 2013 (2013-12-31), pages 2 *
符林: "《基于科学发展观的经济评价研究及应用》", 29 February 2012, pages: 67 - 71 *
胡小建等: "基于Canopy和k-means算法的订单分批优化", 《合肥工业大学学报(自然科学版)》 *
胡小建等: "基于Canopy和k-means算法的订单分批优化", 《合肥工业大学学报(自然科学版)》, vol. 40, no. 3, 31 March 2017 (2017-03-31), pages 1 - 3 *
陆川等编著: "《智慧城市 "电子信息+"视角下的总体规划与实践》", 30 April 2018, 成都:电子科技大学出版社, pages: 77 - 78 *

Similar Documents

Publication Publication Date Title
CN109376772B (zh) 一种基于神经网络模型的电力负荷组合预测方法
CN111753893A (zh) 一种基于聚类和深度学习的风电机组功率集群预测方法
CN109492748B (zh) 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法
CN111860977A (zh) 短期负荷的概率预测方法和概率预测装置
CN112381137A (zh) 新能源电力系统可靠性评估方法、装置、设备及存储介质
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN112834927A (zh) 锂电池剩余寿命预测方法、系统、设备及介质
CN112287018A (zh) 一种台风灾害下10kV杆塔受损风险评估方法及系统
CN113792754A (zh) 一种先除异后修复的换流变dga在线监测数据处理方法
CN117078048B (zh) 基于数字孪生的智慧城市资源管理方法及系统
CN117272850B (zh) 配电网安全运行调度弹性空间分析方法
CN115099511A (zh) 基于优化copula的光伏功率概率估计方法及系统
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN115983477A (zh) 基于K-means聚类与卷积神经网络模型的负荷预测方法
CN117408394B (zh) 电力系统的碳排放因子预测方法、装置及电子设备
CN116561569A (zh) 一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法
CN114065878A (zh) 一种基于多参量物联融合技术的电量缺失值填补方法
CN104200106A (zh) 广义负荷建模中基于季节性的纵向时间轴聚类方法
CN109670227A (zh) 一种基于大数据的仿真数学模型参数对的估量方法
CN117131947B (zh) 架空输电线路故障预测方法、装置、设备及存储介质
CN113034062B (zh) 灾害评估方法及系统
Ma et al. Short-Term Household Load Forecasting Based on Attention Mechanism and CNN-ICPSO-LSTM.
CN118114831A (zh) 一种不确定环境下聚合商随机投标决策方法及系统
CN115270610A (zh) 一种辅助终端采集策略优化方法
CN115907293A (zh) 基于时间概率分布的分布式光伏电能质量评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220218

RJ01 Rejection of invention patent application after publication