CN111507412B - 一种基于历史数据辅助场景分析的电压缺失值填补方法 - Google Patents

一种基于历史数据辅助场景分析的电压缺失值填补方法 Download PDF

Info

Publication number
CN111507412B
CN111507412B CN202010311551.5A CN202010311551A CN111507412B CN 111507412 B CN111507412 B CN 111507412B CN 202010311551 A CN202010311551 A CN 202010311551A CN 111507412 B CN111507412 B CN 111507412B
Authority
CN
China
Prior art keywords
attribute
data
date
missing
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010311551.5A
Other languages
English (en)
Other versions
CN111507412A (zh
Inventor
陈光宇
叶永康
郝思鹏
吕干云
李干
黄良灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute of Technology
Original Assignee
Nanjing Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute of Technology filed Critical Nanjing Institute of Technology
Priority to CN202010311551.5A priority Critical patent/CN111507412B/zh
Publication of CN111507412A publication Critical patent/CN111507412A/zh
Application granted granted Critical
Publication of CN111507412B publication Critical patent/CN111507412B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于历史数据辅助场景分析的电压缺失值填补方法,包括:S1、获取电网的历史数据;S2、通过波动互相关分析算法计算各已知属性数据与缺失属性数据的波动互相关系数;S3、筛选出波动互相性较大的属性数据;S4、计算组合权值;S5、对缺失日期进行场景分析并在电网的历史数据中寻找相似场景;S6、在相似场景中通过动态时间弯曲距离来衡量其余属性在缺失时间段内数据的相似度;S7、结合组合权值计算综合相似度;S8、寻找出综合相似度最高的日期,并用该日期同一时刻的数据结合横向数据进行缺失属性数据的填补。本发明能够充分利用电压相关属性的历史数据进行电压缺失值的填补,提高了电压填补值的准确性。

Description

一种基于历史数据辅助场景分析的电压缺失值填补方法
技术领域
本发明涉及一种基于历史数据辅助场景分析的电压缺失值填补方法,属于电力系统电压辨识技术。
背景技术
随着电网的不断发展电网规模逐年增加,在调控领域,数据的准确性和完整性对电网控制尤为重要,但随着采集数据量成指数级的增长,因人工录入、采集装置故障导致的电压数据缺失问题时有发生,因此需要对缺失数据进行辨识或补全,传统最大期望值(Expectation Maximization Algorithm,EM)算法、K邻近算法(K Nearest Neighbors,KNN)算法等方法都提供了解决思路,但是由于较少利用历史数据作为分析依据,填补效果并不理想。近年来,世界各国掀起了大数据的研究热潮,大数据技术为智能电网的发展注入了新鲜血液,并取得了较好的效果,为此我们提出了一种基于历史数据辅助场景分析的电压缺失值填补方法,进一步提高电压缺失值的填补精度,满足电网发展需求。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种基于历史数据辅助场景分析的电压缺失值填补方法,以提高填补数据的精度,满足电网发展需求。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于历史数据辅助场景分析的电压缺失值填补方法,包括如下步骤:
S1、获取电网的历史数据,进入步骤S2;
S2、通过波动互相关分析算法计算相同时间各已知属性数据与缺失属性数据的波动互相关系数,进入步骤S3;
S3、若某已知属性数据与该缺失属性数据的波动互相关系数超过比较阈值,则保留该已知属性数据,进入步骤S4;否则,舍弃该已知属性数据;
S4、将保留下的M个已知属性数据对应的属性称为Know属性,将缺失属性数据对应的属性称为Unknow属性,分别计算各Know属性与Unknow属性的组合权值;
S5、对含Unknow属性的日期进行场景分析,并在电网的历史数据中寻找H个最相似场景的日期;将含Unknow属性的日期称为缺失日期,将寻找到的H个最相似场景的日期称为H个相似日期;
S6、先确定缺失属性数据在缺失日期中的时间段,再对每一个相似日期的相同时间段,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度;
S7、结合各Know属性与Unknow属性的组合权值,计算各相似日期的Unknow属性综合相似度;
S8、寻找出Unknow属性综合相似度最高的日期,并用该日期同一时刻的数据结合横向数据进行缺失属性数据的填补。
本发明从电网的历史数据出发,充分利用电网中各属性数据之间存在的相关性,选取具有较强相关性的属性数据作为缺失属性数据填补的参考依据,并计算组合权值来进一步量化属性件的关联程度,确保对强相关的属性数据的利用度更高,同时通过动态时间完全距离来衡量各属性在缺失时刻的数据与历史数据的相似程度,并配合组合权值,找出与缺失时刻最相似时刻的数据来替代缺失时刻的数据。本发明充分利用了缺失属性数据与其他属性数据之间的相关性来解决缺失属性数据的填补问题,提高了缺失属性数据的填补的准确性。
具体的,在步骤S1中,电网的历史数据来源于电压数据检测、母线平衡度检测、约束预处理、比例异常检测、初始潮流精度检测等,对电网的历史数据需要进行预处理,挑选出疑似的误数据,并判断是否可以进行后续优化计算。
具体的,所述步骤S2中,波动互相关系数的计算过程如下:
S21、对于两个等长的时间序列xi和yi,其中i=1,2,…,N;
S22、计算xi、yi与平均值的差之和:
Figure BDA0002457810760000021
Figure BDA0002457810760000022
其中:l表示采样长度,Δx(l)、Δy(l)分别表示xi和yi在采样长度l下与平均值的差之和,
Figure BDA0002457810760000023
Figure BDA0002457810760000024
分别表示xi和yi的平均值;
S23、计算分别代表xi、yi自相关性的前向差分:
Δx(l,l0)=x(l0+l)-x(l0),l0=1,2,…,N-l
Δy(l,l0)=y(l0+l)-y(l0),l0=1,2,…,N-l
其中:l=1,2,…,N-1,对于每一个取样时间段l都有l0=N-l个差值,Δx(l,l0)、Δy(l,l0)分别表示xi和yi的自相关性的前向差分;
S24、计算xi、yi的协方差:
Figure BDA0002457810760000031
Figure BDA0002457810760000032
Figure BDA0002457810760000033
其中:Covxy(l)表示xi和yi的协方差,
Figure BDA0002457810760000034
表示·的平均;
S25、计算xi、yi的波动互相关系数:若xi、yi存在一定的关联性时,则Covxy(l)满足幂律分布
Figure BDA0002457810760000035
其中:hxy表示xi和yi相关程度,即波动相关系数,通过拟合幂律分布得到波动相关系数hxy;当hxy=0时,表示xi和yi不相关;当hxy>0时,表示xi和yi正相关;当hxy<0时,表示xi和yi负相关;hxy值越大表示xi和yi的相关程度越高。
考虑到属性数据较多,为避免相关性较低的属性数据影响缺失属性数据填补结果,因此设定波动互相关系数的比较阈值,若已知属性数据与缺失属性数据的波动互相关系数低于比较阈值,则认为该已知属性数据参考价值较低或无参考价值并舍弃;经比较阈值判定后,剩余M个属性数据,对应的属性称为M个Know属性,对这M个Know属性从1至M进行编号。属性数据与缺失属性数据的相关性不同,因此参考价值不同、利用价值不同,需要设定缺失属性的组合权值来确保历史数据充分且合理的利用。
具体的,波动互相关系数越大,则认为已知属性数据与缺失属性数据的相关性越强,则该已知属性数据的在进行缺失属性数据填补时应具有更高的参考价值,因此应具有更高的权值;所述步骤S4中,Know属性j与Unknow属性的组合权值wj通过下式计算:
Figure BDA0002457810760000041
Figure BDA0002457810760000042
其中:M表示Know属性的数量(也即保留下的已知属性数据对应的属性的数量),j=1,2,…,M,cj表示Know属性j与Unknow属性的波动相关系数(也即Know属性j对应的已知属性数据与Unknow属性对应的未知属性数据的波动相关系数)。
具体的,所述步骤S5中,含Unknow属性的日期进行场景分析,包括如下步骤:
S51、根据日负荷情况对电网的历史数据进行场景分类;输入含Unknow属性的日期并分析日负荷情况;考虑到历史数据体量巨大,价值密度低,如果遍历历史数据则效率低下,收效甚微;因此进行日负荷情况分析,即对场景进行判断,归类到工作日、一般休息日和特殊节假日;
S52、判断该日期的场景是否为休息日:若是休息日,则认定该日期的场景为工作日,进入步骤S54;否则进入步骤S53;
S53、判断该日期的场景是否为特殊节假日:若是特殊节假日,则认定该日期的场景为特殊节假日,进入步骤S54;否则认定该日期的场景为一般休息日,进入步骤S54;
S54、在电网的历史数据中寻找H个最相似场景的日期,即寻找H个休息日、特殊节假日或一般休息日。
对特殊节假日的说明:类似元旦、春节、清明节、劳动节、端午节、中秋节、国庆节等其他国家规定法定节假日为特殊节假日。
具体的,所述步骤S6中,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度,包括如下步骤:
S61、由于动态时间弯曲距离是用于衡量两个时间序列的相似程度,而我们缺失的是某一时刻的数据,设缺失属性数据发生的时刻为tn时刻,在tn时刻向后选取n个时间点(即tn+1,tn+2,…,t2n),在tn时刻向前选取n个时间点(即tn-1,tn-2,…,t0),最后形成缺失属性数据在缺失日期中的时间段(t0,t2n),包含t0,t1,t2,…,t2n共2n+1个时间点;设经过比较阈值判断筛选后保留下的M个Know属性记为A1,A2,…,AM,Unknow属性记为A0
S62、Know属性A1,A2,…,AM在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据分别记为D(1,h),D(2,h),…D(M,h)
Figure BDA0002457810760000051
d(j,h,g)表示Know属性j在第h个相似日期中的tg时刻的属性数据,j=1,2,…,M,h=1,2,…,H,g=0,1,2,…,2n;
S63、通过动态时间弯曲距离来衡量Know属性Aj在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,h)与在缺失日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,p)的相似度S(j,h),p表示缺失日期。
具体的,所述步骤S7中,各相似日期的Unknow属性综合相似度通过下式计算:
Figure BDA0002457810760000052
其中:Ch表示Unknow属性在第h个相似日期中的综合相似度。
具体的,将每天同一个时间点的某一属性的历史数据为该属性的一个纵向历史数据截面,横向历史数据是对同一时间的数据根据属性划分;本案的缺失属性数据填补策略充分利用了纵向历史数据,考虑到缺失属性数据不仅与纵向历史数据有关联,同时也与横向历史数据有关联,因此将两类数据结合而得到的缺失属性数据填补值将更加接近真实值;所述步骤S8中,寻找出Unknow属性综合相似度最高的日期后,提取Unknow属性在该日期tn时刻的数据T1作为纵向填补数据;同时,对Unknow属性采用曲线的线性拟合找出该日期tn时刻的数据T2作为横向填补数据,求解出缺失属性数据的最终填补值为:
T=α×T1+β×T2
α+β=1
其中:tn时刻为缺失属性数据发生时刻,α为T1的权重,β为T2的权重。
有益效果:本发明提供的基于历史数据辅助场景分析的电压缺失值填补方法,能够充分利用电网的历史数据,提高缺失属性数据填补的准确性;本发明通过波动互相关分析算法建立起属性之间的联系,并引入组合权值对相关程度进行量化,通过动态时间弯曲距离来衡量缺失时刻数据与历史数据的相似程度,最终选取最相似时刻的数据来替代缺失数据,完成缺失数据的填补。
附图说明
图1为本发明的流程示意图;
图2为波动互相关算法的流程示意图;
图3为场景分析过程的流程示意图;
图4为相似度计算的流程示意图;
图5为综合相似度计算的流程示意图;
图6为缺失值填补流程示意图;
图7为不同算法填补准确度比较图;
图8为本发明提出算法填补结果和真实值的比对图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
如图1~6所示为基于历史数据辅助场景分析的电压缺失值填补方法,包括如下步骤:
S1、获取电网的历史数据,进入步骤S2。
S2、通过波动互相关分析算法计算相同时间各已知属性数据与缺失属性数据的波动互相关系数,进入步骤S3。
如图2所示,波动互相关系数的计算过程如下:
S21、对于两个等长的时间序列xi和yi,其中i=1,2,…,N;
S22、计算xi、yi与平均值的差之和:
Figure BDA0002457810760000061
Figure BDA0002457810760000062
其中:l表示采样长度,Δx(l)、Δy(l)分别表示xi和yi在采样长度l下与平均值的差之和,
Figure BDA0002457810760000063
Figure BDA0002457810760000064
分别表示xi和yi的平均值;
S23、计算分别代表xi、yi自相关性的前向差分:
Δx(l,l0)=x(l0+l)-x(l0),l0=1,2,…,N-l
Δy(l,l0)=y(l0+l)-y(l0),l0=1,2,…,N-l
其中:l=1,2,…,N-1,对于每一个取样时间段l都有l0=N-l个差值,Δx(l,l0)、Δy(l,l0)分别表示xi和yi的自相关性的前向差分;
S24、计算xi、yi的协方差:
Figure BDA0002457810760000071
Figure BDA0002457810760000072
Figure BDA0002457810760000073
其中:Covxy(l)表示xi和yi的协方差,
Figure BDA0002457810760000074
表示·的平均;
S25、计算xi、yi的波动互相关系数:若xi、yi存在一定的关联性时,则Covxy(l)满足幂律分布
Figure BDA0002457810760000075
其中:hxy表示xi和yi相关程度,即波动相关系数,通过拟合幂律分布得到波动相关系数hxy;当hxy=0时,表示xi和yi不相关;当hxy>0时,表示xi和yi正相关;当hxy<0时,表示xi和yi负相关;hxy值越大表示xi和yi的相关程度越高。
S3、若某已知属性数据与该缺失属性数据的波动互相关系数超过比较阈值,则保留该已知属性数据,进入步骤S4;否则,舍弃该已知属性数据。
考虑到属性数据较多,为避免相关性较低的属性数据影响缺失属性数据填补结果,因此设定波动互相关系数的比较阈值,若已知属性数据与缺失属性数据的波动互相关系数低于比较阈值,则认为该已知属性数据参考价值较低或无参考价值并舍弃;经比较阈值判定后,剩余M个属性数据,对应的属性称为M个Know属性,对这M个Know属性从1至M进行编号。
S4、将保留下的M个已知属性数据对应的属性称为Know属性,将缺失属性数据对应的属性称为Unknow属性,分别计算各Know属性与Unknow属性的组合权值。
Know属性j与Unknow属性的组合权值wj通过下式计算:
Figure BDA0002457810760000081
Figure BDA0002457810760000082
其中:M表示Know属性的数量(也即保留下的已知属性数据对应的属性的数量),j=1,2,…,M,cj表示Know属性j与Unknow属性的波动相关系数(也即Know属性j对应的已知属性数据与Unknow属性对应的未知属性数据的波动相关系数)。
S5、对含Unknow属性的日期进行场景分析,并在电网的历史数据中寻找H个最相似场景的日期;将含Unknow属性的日期称为缺失日期,将寻找到的H个最相似场景的日期称为H个相似日期。
如图3所示,场景分析包括如下步骤:
S51、根据日负荷情况对电网的历史数据进行场景分类;输入含Unknow属性的日期并分析日负荷情况;考虑到历史数据体量巨大,价值密度低,如果遍历历史数据则效率低下,收效甚微;因此进行日负荷情况分析,即对场景进行判断,归类到工作日、一般休息日和特殊节假日;
S52、判断该日期的场景是否为休息日:若是休息日,则认定该日期的场景为工作日,进入步骤S54;否则进入步骤S53;
S53、判断该日期的场景是否为特殊节假日:若是特殊节假日,则认定该日期的场景为特殊节假日,进入步骤S54;否则认定该日期的场景为一般休息日,进入步骤S54;
S54、在电网的历史数据中寻找H个最相似场景的日期,即寻找H个休息日、特殊节假日或一般休息日。
说明:周一至周五或其他因节假日调休的日期为工作日;普通周六周日为一般休息日;类似元旦、春节、清明节、劳动节、端午节、中秋节、国庆节等其他国家规定法定节假日为特殊节假日。
S6、先确定缺失属性数据在缺失日期中的时间段,再对每一个相似日期的相同时间段,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度。
如图4所示,相似度计算包括如下步骤:
S61、由于动态时间弯曲距离是用于衡量两个时间序列的相似程度,而我们缺失的是某一时刻的数据,设缺失属性数据发生的时刻为tn时刻,在tn时刻向后选取n个时间点(即tn+1,tn+2,…,t2n),在tn时刻向前选取n个时间点(即tn-1,tn-2,…,t0),最后形成缺失属性数据在缺失日期中的时间段(t0,t2n),包含t0,t1,t2,…,t2n共2n+1个时间点;设经过比较阈值判断筛选后保留下的M个Know属性记为A1,A2,…,AM,Unknow属性记为A0
S62、Know属性A1,A2,…,AM在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据分别记为D(1,h),D(2,h),…D(M,h)
Figure BDA0002457810760000091
d(jhg)表示Know属性j在第h个相似日期中的tg时刻的属性数据,j=1,2,…,M,h=1,2,…,H,g=0,1,2,…,2n;
S63、通过动态时间弯曲距离来衡量Know属性Aj在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,h)与在缺失日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,p)的相似度S(j,h),p表示缺失日期。
S7、结合各Know属性与Unknow属性的组合权值,计算各相似日期的Unknow属性综合相似度。
如图5所示,各相似日期的Unknow属性综合相似度通过下式计算:
Figure BDA0002457810760000092
其中:Ch表示Unknow属性在第h个相似日期中的综合相似度。
S8、寻找出Unknow属性综合相似度最高的日期,并用该日期同一时刻的数据结合横向数据进行缺失属性数据的填补。
如图6所示,利用横向和纵向数据进行缺失数据的填补流程包括如下步骤:
S81、输入电网数据;
S82、将电网数据进行数据类型划分,历史纵向数据形成历史纵向数据库,历史横向数据形成历史横向数据库;
S83、对于历史纵向数据库,寻找出Unknow属性综合相似度最高的日期后,提取Unknow属性在该日期tn时刻的数据T1作为纵向填补数据,同时选取合适的权重比α;
S84、对于横向历史数据库,对Unknow属性采用曲线的线性拟合找出该日期tn时刻的数据T2作为横向填补数据,同时选取合适的权重比β;
S85、求解出缺失属性数据的最终填补值为:
T=α×T1+β×T2
α+β=1
其中:tn时刻为缺失属性数据发生时刻,α为T1的权重,β为T2的权重。
将本发明应用到某区域电网电压值缺失情况的填补分析中,选取真实电网近1年半的历史数据作为历史数据集,采样周期为5分钟,数据填补对象为10kV母线的电压缺失值,对电压缺失数据相关属性计算波动互相关系数,最终得到的相关属性为:{无功负荷,有功负荷,电流值}。为了体现本发明提出算法的优势,选取传统最大期望值(ExpectationMaximization Algorithm,EM)算法和K邻近算法(K Nearest Neighbors,KNN)进行对比分析。
为了充分检测本发明提出方法的有效性,采用随机删除策略,删除数据集中的1%、5%、10%、15%、20%、25%、30%的数据。在不同电压缺失度的情况下采用填补准确度来评价填补结果,填补准确度的评价方法如下:
Figure BDA0002457810760000101
其中:nr为估计值正确的个数,n为电压缺失值的个数。为保证实验结果的可靠性,对不同电压缺失率情况下做5次计算,5次计算的平均值作为最终实验结果。实验结果如图7所示,可以看出本发明提出方法的填补正确率明显好于传统算法。为进一步展示本发明提出方法的效果,以缺失率为15%的情况为例进行分析。图8给出了连续27组电压数据在某一缺失情况下的比对分析,从图中结果可以明显看出,本发明提出的方法所绘制的曲线和真实值曲线具有较好的贴合度,填补结果接近真实值,填补效果较好。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:包括如下步骤:
S1、获取电网的历史数据,进入步骤S2;
S2、通过波动互相关分析算法计算相同时间各已知属性数据与缺失属性数据的波动互相关系数,进入步骤S3;
S3、若某已知属性数据与该缺失属性数据的波动互相关系数超过比较阈值,则保留该已知属性数据,进入步骤S4;否则,舍弃该已知属性数据;
S4、将保留下的M个已知属性数据对应的属性称为Know属性,将缺失属性数据对应的属性称为Unknow属性,分别计算各Know属性与Unknow属性的组合权值;
S5、对含Unknow属性的日期进行场景分析,并在电网的历史数据中寻找H个最相似场景的日期;将含Unknow属性的日期称为缺失日期,将寻找到的H个最相似场景的日期称为H个相似日期;
S6、先确定缺失属性数据在缺失日期中的时间段,再对每一个相似日期的相同时间段,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度;
S7、结合各Know属性与Unknow属性的组合权值,计算各相似日期的Unknow属性综合相似度;
S8、寻找出Unknow属性综合相似度最高的日期,并用该日期同一时刻的数据结合横向数据进行缺失属性数据的填补。
2.根据权利要求1所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S2中,波动互相关系数的计算过程如下:
S21、对于两个等长的时间序列xi和yi,其中i=1,2,…,N;
S22、计算xi、yi与平均值的差之和:
Figure FDA0002819851490000011
Figure FDA0002819851490000012
其中:l表示采样长度,Δx(l)、Δy(l)分别表示xi和yi在采样长度l下与平均值的差之和,
Figure FDA0002819851490000021
Figure FDA0002819851490000022
分别表示xi和yi的平均值;
S23、计算分别代表xi、yi自相关性的前向差分:
Δx(l,l0)=x(l0+l)-x(l0),l0=1,2,…,N-l
Δy(l,l0)=y(l0+l)-y(l0),l0=1,2,…,N-l
其中:l=1,2,…,N-1,对于每一个取样时间段l都有l0=N-l个差值,Δx(l,l0)、Δy(l,l0)分别表示xi和yi的自相关性的前向差分;
S24、计算xi、yi的协方差:
Figure FDA0002819851490000023
Figure FDA0002819851490000024
Figure FDA0002819851490000025
其中:Covxy(l)表示xi和yi的协方差,
Figure FDA0002819851490000026
表示·的平均;
S25、计算xi、yi的波动互相关系数:若xi、yi存在一定的关联性时,则Covxy(l)满足幂律分布
Figure FDA0002819851490000027
其中:hxy表示xi和yi相关程度,即波动互相关系数,通过拟合幂律分布得到波动互相关系数hxy;当hxy=0时,表示xi和yi不相关;当hxy>0时,表示xi和yi正相关;当hxy<0时,表示xi和yi负相关;hxy值越大表示xi和yi的相关程度越高。
3.根据权利要求2所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S4中,Know属性j与Unknow属性的组合权值wj通过下式计算:
Figure FDA0002819851490000028
Figure FDA0002819851490000029
其中:M表示Know属性的数量j=1,2,…,M,cj表示Know属性j与Unknow属性的波动互相关系数。
4.根据权利要求1所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S5中,含Unknow属性的日期进行场景分析,包括如下步骤:
S51、根据日负荷情况对电网的历史数据进行场景分类;输入含Unknow属性的日期并分析日负荷情况;
S52、判断该日期的场景是否为休息日:若不是休息日,则认定该日期的场景为工作日,进入步骤S54;否则进入步骤S53;
S53、判断该日期的场景是否为特殊节假日:若是特殊节假日,则认定该日期的场景为特殊节假日,进入步骤S54;否则认定该日期的场景为一般休息日,进入步骤S54;
S54、在电网的历史数据中寻找H个最相似场景的日期,即寻找H个休息日、特殊节假日或一般休息日。
5.根据权利要求3所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S6中,通过动态时间弯曲距离来衡量缺失日期的各Know属性数据与各相似日期的各Know属性数据的相似度,包括如下步骤:
S61、设缺失属性数据发生的时刻为tn时刻,在tn时刻向后选取n个时间点,在tn时刻向前选取n个时间点,最后形成缺失属性数据在缺失日期中的时间段(t0,t2n),包含t0,t1,t2,…,t2n共2n+1个时间点;设经过比较阈值判断筛选后保留下的M个Know属性记为A1,A2,…,AM,Unknow属性记为A0
S62、Know属性A1,A2,…,AM在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据分别记为D(1,h),D(2,h),…D(M,h)
Figure FDA0002819851490000031
d(j,h,g)表示Know属性j在第h个相似日期中的tg时刻的属性数据,j=1,2,…,M,h=1,2,…,H,g=0,1,2,…,2n;
S63、通过动态时间弯曲距离来衡量Know属性Aj在第h个相似日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,h)与在缺失日期中的第t0,t1,t2,…,t2n时刻的属性数据D(j,p)的相似度S(j,h),p表示缺失日期。
6.根据权利要求5所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:所述步骤S7中,各相似日期的Unknow属性综合相似度通过下式计算:
Figure FDA0002819851490000041
其中:Ch表示Unknow属性在第h个相似日期中的综合相似度。
7.根据权利要求1所述的基于历史数据辅助场景分析的电压缺失值填补方法,其特征在于:将每天同一个时间点的某一属性的历史数据为该属性的一个纵向历史数据截面,横向历史数据是对同一时间的数据根据属性划分;所述步骤S8中,寻找出Unknow属性综合相似度最高的日期后,提取Unknow属性在该日期tn时刻的数据T1作为纵向填补数据;同时,对Unknow属性采用曲线的线性拟合找出该日期tn时刻的数据T2作为横向填补数据,求解出缺失属性数据的最终填补值为:
T=α×T1+β×T2
α+β=1
其中:tn时刻为缺失属性数据发生时刻,α为T1的权重,β为T2的权重。
CN202010311551.5A 2020-04-20 2020-04-20 一种基于历史数据辅助场景分析的电压缺失值填补方法 Active CN111507412B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010311551.5A CN111507412B (zh) 2020-04-20 2020-04-20 一种基于历史数据辅助场景分析的电压缺失值填补方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010311551.5A CN111507412B (zh) 2020-04-20 2020-04-20 一种基于历史数据辅助场景分析的电压缺失值填补方法

Publications (2)

Publication Number Publication Date
CN111507412A CN111507412A (zh) 2020-08-07
CN111507412B true CN111507412B (zh) 2021-02-19

Family

ID=71871170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010311551.5A Active CN111507412B (zh) 2020-04-20 2020-04-20 一种基于历史数据辅助场景分析的电压缺失值填补方法

Country Status (1)

Country Link
CN (1) CN111507412B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077357B (zh) * 2021-03-29 2023-11-28 国网湖南省电力有限公司 电力时序数据异常检测方法及其填补方法
CN113177598B (zh) * 2021-05-06 2023-05-02 国网福建省电力有限公司 一种差错电量追补方法及终端
CN113568898A (zh) * 2021-07-30 2021-10-29 浙江华云信息科技有限公司 电力数据漏点补全方法、装置、设备及可读存储介质
CN113761023A (zh) * 2021-08-24 2021-12-07 国网甘肃省电力公司 一种基于改进广义神经网络的光伏发电短期功率预测方法
CN114065878A (zh) * 2022-01-17 2022-02-18 国网山东省电力公司泰安供电公司 一种基于多参量物联融合技术的电量缺失值填补方法
CN114611396B (zh) * 2022-03-15 2023-03-24 国网安徽省电力有限公司蚌埠供电公司 一种基于大数据分析线损的方法
CN116683452B (zh) * 2023-08-03 2023-11-10 国网山东省电力公司营销服务中心(计量中心) 一种日清缺失电量的修复方法及系统
CN117390502A (zh) * 2023-12-13 2024-01-12 国网江苏省电力有限公司苏州供电分公司 一种基于ResIOFNN网络的电压数据缺失值填补方法及系统
CN117932246A (zh) * 2024-03-21 2024-04-26 广东鹰视能效科技有限公司 一种电量数据重算方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018025019A1 (en) * 2016-08-01 2018-02-08 Liverpool John Moores University Analysing energy/utility usage
CN107808105A (zh) * 2017-10-18 2018-03-16 南京邮电大学 一种智能电网中基于预测的虚假数据检测方法
CN109002937A (zh) * 2018-09-07 2018-12-14 深圳供电局有限公司 电网负荷预测方法、装置、计算机设备和存储介质
CN109816017A (zh) * 2019-01-24 2019-05-28 电子科技大学 基于模糊聚类和拉格朗日插值的电网缺失数据填补方法
CN110276412A (zh) * 2019-06-28 2019-09-24 中煤科工集团重庆研究院有限公司 一种瓦斯监控数据无序填补方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9652828B1 (en) * 2015-12-29 2017-05-16 Motorola Solutions, Inc. Method and apparatus for imaging a scene
US10628252B2 (en) * 2017-11-17 2020-04-21 Google Llc Real-time anomaly detection and correlation of time-series data
US11775873B2 (en) * 2018-06-11 2023-10-03 Oracle International Corporation Missing value imputation technique to facilitate prognostic analysis of time-series sensor data
CN109472404A (zh) * 2018-10-31 2019-03-15 山东大学 一种电力负荷短期预测方法、模型、装置及系统
CN110781449B (zh) * 2019-11-05 2022-11-25 国网冀北电力有限公司智能配电网中心 用于台区线损计算的用户数据缺失的估计方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018025019A1 (en) * 2016-08-01 2018-02-08 Liverpool John Moores University Analysing energy/utility usage
CN107808105A (zh) * 2017-10-18 2018-03-16 南京邮电大学 一种智能电网中基于预测的虚假数据检测方法
CN109002937A (zh) * 2018-09-07 2018-12-14 深圳供电局有限公司 电网负荷预测方法、装置、计算机设备和存储介质
CN109816017A (zh) * 2019-01-24 2019-05-28 电子科技大学 基于模糊聚类和拉格朗日插值的电网缺失数据填补方法
CN110276412A (zh) * 2019-06-28 2019-09-24 中煤科工集团重庆研究院有限公司 一种瓦斯监控数据无序填补方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Collection of historical weather data: issues with missing values;Fadoua Rafii等;《SCA "19: Proceedings of the 4th International Conference on Smart City Applications》;20191004;1-8 *
水资源消耗预测的异常值检测及缺失数据填补方法;张峰等;《统计与决策》;20180831;13-17 *

Also Published As

Publication number Publication date
CN111507412A (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
CN111507412B (zh) 一种基于历史数据辅助场景分析的电压缺失值填补方法
CN106055918B (zh) 一种电力系统负荷数据的辨识及修正方法
CN111080032A (zh) 一种基于Transformer结构的负荷预测方法
CN115276006A (zh) 一种用于电力集成系统的负荷预测的方法及系统
CN105374209B (zh) 一种城市区域路网运行状态特征信息提取方法
CN106600037B (zh) 一种基于主成分分析的多参量辅助负荷预测方法
CN110555989B (zh) 一种基于Xgboost算法的交通量预测方法
CN112258251B (zh) 基于灰色关联的电动汽车换电需求的集成学习预测方法及系统
CN115099500B (zh) 基于权重修正和drsn-lstm模型的水位预测方法
CN113705931B (zh) 一种利用k最邻近法预测径流要素的方法
CN111210170A (zh) 基于90%用电分布特征指标的环保管控监测及评价方法
CN113255986A (zh) 一种基于气象信息和深度学习算法的多步日径流预报方法
CN112305441A (zh) 一种集成式聚类下的动力电池健康状态评估方法
CN116578870A (zh) 一种基于波动互相关分析的配网电压异常数据填补方法
CN115330130A (zh) 基于改进ahp-critic的农业园区综合能源系统评估方法
CN108830405B (zh) 基于多指标动态匹配的实时电力负荷预测系统及其方法
CN113779113A (zh) 基于雨洪时空过程相似性挖掘的洪水动态预估方法及系统
CN110457374B (zh) 一种识别时段典型暴雨过程的方法
CN112200209A (zh) 一种基于日差分用电量的贫困用户识别方法
CN113468821B (zh) 一种基于决策回归算法的坡面产流产沙阈值确定方法
CN112712213A (zh) 一种集中空调住宅深度迁移学习能耗预测方法及系统
CN116843368B (zh) 基于arma模型的营销数据处理方法
CN114266003B (zh) 一种基于碳收支平衡分析的高原湖泊区域碳中和计算方法
CN113673551B (zh) 一种电力计量不良数据辨识方法及系统
CN117114105B (zh) 基于科研大数据信息的目标对象推荐方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant