CN115374091A - 一种分布式新能源出力数据质量提升方法和系统 - Google Patents

一种分布式新能源出力数据质量提升方法和系统 Download PDF

Info

Publication number
CN115374091A
CN115374091A CN202110552624.4A CN202110552624A CN115374091A CN 115374091 A CN115374091 A CN 115374091A CN 202110552624 A CN202110552624 A CN 202110552624A CN 115374091 A CN115374091 A CN 115374091A
Authority
CN
China
Prior art keywords
sequence
output
data
output time
new energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110552624.4A
Other languages
English (en)
Inventor
梁志峰
曹敏
张凯峰
毕文俊
李智
周昶
孙檬檬
夏俊荣
许晓慧
华光辉
孔爱良
胡哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Southeast University
China Electric Power Research Institute Co Ltd CEPRI
State Grid Anhui Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Southeast University
China Electric Power Research Institute Co Ltd CEPRI
State Grid Anhui Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Southeast University, China Electric Power Research Institute Co Ltd CEPRI, State Grid Anhui Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202110552624.4A priority Critical patent/CN115374091A/zh
Publication of CN115374091A publication Critical patent/CN115374091A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种分布式新能源出力数据质量提升方法和系统,包括:获取分布式新能源当前站点待质量提升的出力时间序列和所述出力时间序列对应的相关变量值;基于所述出力时间序列对应的相关变量值,利用预先建立的BP神经网络模型进行预测得到出力预测序列;对所述待质量提升的出力时间序列中,与所述出力预测序列存在差异的数据进行修订;其中,所述BP神经网络模型是按季节划分的历史正常出力数据序列及具有时空相关性的相关变量训练得到;本发明针对分布式新能源出力数据中的数据异常、数据缺失等问题进行检测、剔除和修复,能够有效实现出力数据质量提升。

Description

一种分布式新能源出力数据质量提升方法和系统
技术领域
本发明属于电力系统数据处理领域,尤其是涉及一种分布式新能源出力数据质量提升方 法和系统。
背景技术
为了满足对能源和环保的双向需求,分布式新能源发电近年来快速发展。与集中式新能 源相比,分布式新能源接入中低压电网,地域分散,受设备、人员等原因的限制,出力数据 质量较差,存在数据异常、数据缺失等问题,对出力数据监测分析工作的开展提出了挑战。 因此,在对出力数据进行挖掘与深入分析之前应对采集到的数据进行数据质量提升,获取准 确、完整、满足分析需求的数据,以支持后续高级的数据挖掘应用。
目前针对分布式新能源出力数据的数据质量提升,在异常数据检测方面多采用相似日聚 类或基于统计分析的方法,在数据修复方面多采用插值或利用气象数据完成修复。以上方法 仅考虑了数据在时间尺度上的关联性,忽略了空间尺度,同时在进行异常检测检测或缺失修 复时往往只采用一种方法,未能根据数据特点有针对性地采取不同措施。
发明内容
为克服上述现有技术的不足,本发明提出一种分布式新能源出力数据质量提升方法,包 括:
获取分布式新能源当前站点待质量提升的出力时间序列和所述出力时间序列对应的相关 变量值;
基于所述出力时间序列对应的相关变量值,利用预先建立的BP神经网络模型进行预测得 到出力预测序列;
对所述待质量提升的出力时间序列中,与所述出力预测序列存在差异的数据进行修订;
其中,所述BP神经网络模型是按季节划分的历史正常出力数据序列及具有时空相关性的 相关变量训练得到。
优选的,所述BP神经网络模型的构建,包括:
基于相同季节,同一新能源站点的历史正常出力数据的相关变量值作为BP神经网络的输 入数据,和历史正常出力数据的相关变量对应的历史正常出力数据序列作为BP神经网络的输 出数据,采用网格搜索法训练并获取BP神经网络模型。
优选的,所述历史正常出力数据的相关变量的获取,包括:
基于历史上正常出力数据和对应的正常资源数据,计算所述出力数据与对应的正常资源 数据中所有变量之间的Pearson相关系数;
分别判断所述出力数据与正常资源数据中各变量间的Pearson相关系数是否大于出力数 据的相关度阈值,如果是则所述资源数据的变量为相关变量的待选值;
从相关变量的待选值选择一个或多个变量作为历史正常出力数据的相关变量。
优选的,所述相关变量,包括:与新能源出力相关性大于相关度阙值的资源数据;其中 资源数据包括:总辐射、直射辐射、散射辐射、环境温度、相对湿度、气压、风速和风向。
优选的,所述对所述待质量提升的出力时间序列中,与所述出力预测序列存在差异的数 据进行修订,包括:
将所述待质量提升的出力时间序列减去出力预测序列得到残差序列;
利用3σ准则判别所述残差序列中的异常值,并剔除所述出力时间序列的异常值;
基于剔除异常值后的所述出力时间序列,寻找每一个缺失段的相邻有值点;
计算所述每一个缺失段的相邻有值点的时间差;并根据所述时间差的长度选择相应的修 补方法对于所述缺失段进行修复。
优选的,所述根据所述时间差的长度选择相应的修补方法对所述缺失段进行修复,包括:
判断所述时间差的长度与预设数值的关系;
对于时间差的长度小于等于预设数值的所有缺失段,基于时间尺度采用三次样条插值法 进行修补;
对于时间差的长度大于预设数值的所有缺失段,基于空间尺度采用附近站点归纳法进行 修补。
优选的,所述基于空间尺度采用附近站点归纳法进行修补,包括:
获取待质量提升的出力时间序列对应的当前站点预设空间尺度范围内的所有相邻分布式 新能源站点,并对所有所述相邻分布式新能源站点的出力时间序列进行归一化处理;
基于归一化处理后的所有所述相邻分布式新能源站点的出力时间序列,分别计算当前站 点与各相邻分布式新能源站点间出力时间序列的Pearson相关系数;
基于当前站点与各相邻分布式新能源站点间出力时间序列的Pearson相关系数确定所述 相邻分布式新能源站点是否为参照站点;
当参照站点为一个时,采用Pearson相关系数对所述待质量提升的出力时间序列的所有 缺失段进行修复;
当参照站点大于一个时,采用最小二乘法对所述待质量提升的出力时间序列的所有缺失 段进行修复。
优选的,所述采用Pearson相关系数对所述待质量提升的出力时间序列的所有缺失段进 行修复,包括:
获取当前站点的出力时间序列,将未缺失段的时间序列点按照时间排列组成第一序列, 并计算所述第一序列的均值和标准差;
基于参照站点的出力时间序列,组成与所述第一序列的时间一一对应的第二序列,并计 算所述第二序列的均值和标准差;
根据所述第一序列和所述第二序列计算第一序列和第二序列间的Pearson相关系数;
将所述第一序列和第二序列的均值、标准差以及所述第一序列和第二序列间的Pearson 相关系数带入数据修复模型,计算得到缺失段的对应时刻的修复的出力时间序列;
基于所述缺失段的对应时刻的修复的出力时间序列中的数值修复所有缺失段的出力时间 序列。
优选的,所述数据修复模型的计算式如下:
Figure BDA0003075794380000031
其中,yrepair表示缺失段的对应时刻的修复的出力时间序列,μoe表示第一序列的均值, σoe表示第一序列的标准差,robject_refer表示第一序列和第二序列的Pearson相关系数,yrefer表示缺失段的对应时刻的参照站点的出力时间序列,μre表示第二序列的均值,σre表示第 二序列的标准差。
优选的,所述采用最小二乘法对待质量提升的出力时间序列的所有缺失段的当前站点的 修复序列进行修复,包括:
根据当前站点和各个参照站点的正常历史出力时间序列,通过最小二乘法求解所述当前 站点和各个参照站点的正常历史出力之间回归方程的系数;
基于所述回归方程的系数以及与待质量提升的出力时间序列的时间一一对应的各个参照 站点的正常历史出力时间序列,采用回归方程模型计算对应时间当前站点的出力修复序列;
利用所述对应时间当前站点的修复序列的值对所述待质量提升的出力时间序列的所有缺 失段进行修复。
优选的,所述回归方程模型的计算式如下:
Y=α01YC12YC2+...+αtYCt
其中,α0,α1,...,αt为回归方程的系数,YC1,YC2,...,YCt表示各个参照站点的 出力时间序列的正常历史出力数据,Y表示当前站点的正常历史出力时间序列的出力数据,t 为参照站点的数量。
基于同一发明构思,本发明还提供了一种分布式新能源出力数据质量提升系统,包括: 获取模块、预测模块和修复模块;
所述获取模块,用于获取分布式新能源当前站点待质量提升的出力时间序列和所述出力 时间序列对应的相关变量值;
所述预测模块,用于基于所述出力时间序列对应的相关变量值,利用预先建立的BP神经 网络模型进行预测得到出力预测序列;
所述修复模块,用于对所述待质量提升的出力时间序列中,与所述出力预测序列存在差 异的数据进行修订;
其中,所述BP神经网络模型是按季节划分的历史正常出力数据序列及具有时空相关性的 相关变量训练得到。
与最接近的现有技术相比,本发明具有的有益效果如下:
1、本发明实现了一种分布式新能源出力数据质量提升方法和系统,包括:获取分布式新 能源当前站点待质量提升的出力时间序列和所述出力时间序列对应的相关变量值;基于所述 出力时间序列对应的相关变量值,利用预先建立的BP神经网络模型进行预测得到出力预测 序列;对所述待质量提升的出力时间序列中,与所述出力预测序列存在差异的数据进行修订; 其中,所述BP神经网络模型是按季节划分的历史正常出力数据序列及具有时空相关性的相 关变量训练得到;本发明针对分布式新能源出力数据中的数据异常、数据缺失问题进行检测 剔除和修复,能够有效实现出力数据质量提升;
2、本发明考虑了出力数据与资源数据相关关系的季节性波动,同时利用了数据在时间尺 度和空间尺度上的相关性,在数据缺失时间长短不一和参照数据量大小不同的情况下,有针 对性的采用了不同的修复方法,相比其他分布式新能源出力数据质量提升方法,本发明提出 的方法能够获得更高质量的数据,同时更高效地实现数据质量提升。
附图说明
图1为本发明提供的一种分布式新能源出力数据质量提升方法流程示意图;
图2为本发明实施例中方法的流程示意图;
图3为本发明提供的一种分布式新能源出力数据质量提升系统基础结构示意图;
图4为本发明提供的一种分布式新能源出力数据质量提升系统详细结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行 进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本 发明。
实施例1:
下面结合附图及具体实施例对本发明的应用原理作进一步描述。
如图1所示,一种分布式新能源出力数据质量提升方法,包括:
S1:获取分布式新能源当前站点待质量提升的出力时间序列和所述出力时间序列对应的 相关变量值;
S2:基于所述出力时间序列对应的相关变量值,利用预先建立的BP神经网络模型进行预 测得到出力预测序列;
S3:对所述待质量提升的出力时间序列中,与所述出力预测序列存在差异的数据进行修 订;
其中,所述BP神经网络模型是按季节划分的历史正常出力数据序列及具有时空相关性的 相关变量训练得到。
本发明提出了一种分布式新能源出力数据质量提升方法,如图2所示,包括以下步骤:
其中,S1:具体包括:步骤1到步骤5;
步骤1、获取分布式新能源站点A的发电资源数据,发电资源数据包括站点基础信息、 资源数据和出力数据,其中站点基础信息包括站点名称和站点的经纬度,资源数据包括:总 辐射、直射辐射、散射辐射、环境温度、相对湿度、气压、风速和风向等,以上变量称为资 源变量;
步骤2、将步骤1中的出力数据和资源数据按照季节划分为四个部分,划分方法为:3月、 4月、5月的数据划为春季数据,6月、7月、8月的数据划为夏季数据,9月、10月、11月 的数据划为秋季数据,12月、次年1月、次年2月的数据划为冬季数据;
步骤3、分别对春、夏、秋、冬四个季节的数据执行步骤4至步骤13;
步骤4、基于历史上对应季节的正常出力数据和正常资源数据,计算出力Y与资源变量X 中所有变量之间的Pearson相关系数,其中X={X1,X2,...,Xn}表示所有资源变量的集合,X1, X2,...,Xn表示各个资源变量,n为资源变量的个数,则计算公式如下:
Figure BDA0003075794380000051
其中
Figure BDA0003075794380000061
表示变量Xi与变量Y之间的Pearson相关系数,cov(Xi,Y)表示变量Xi和变量Y 的协方差,
Figure BDA0003075794380000062
和σY分别表示变量Xi和变量Y的标准差,
Figure BDA0003075794380000063
和μY分别表示变量Xi和变量Y的均值,E((XiX)(Y-μY))表示(XiX)(Y-μY)的期望;
步骤5、选取出力Y的相关变量(相关变量为一个或多个),将相关变量的集合记为R={R1,R2,...Rm},其中1≤m≤n,R1,R2,...,Rm表示各个相关变量,m为相关变量的个 数,且满足
Figure BDA0003075794380000064
相关变量的判别条件为:与出力Y之间的Pearson相关系数大于0.3;
S2具体包括:步骤6到步骤7;
步骤6、利用误差反向传播神经网络(BP神经网络)来描述出力Y与其相关变量R之间 的相关关系,搭建以R为输入、Y为输出的BP神经网络,利用Y和R历史上对应季节的正常数据训练BP神经网络,采用网格搜索法选择模型的最优参数;
步骤7、待提升数据质量的出力序列yobject共有N个时间序列点,记为yobject=[y1,y2,...,yN], 其对应时刻的相关变量序列记为
Figure RE-GDA0003259658410000065
其中sab表示第a个相关变量的第b 个时间序列点,1≤a≤m,1≤b≤N,将相关变量序列sobject输入步骤6训练好的BP神经网络, 得到出力预测序列
Figure RE-GDA0003259658410000066
计算出力实测序列yobject与预测序列
Figure RE-GDA0003259658410000067
的差值绝 对值,得到残差序列
Figure RE-GDA0003259658410000068
S3具体包括:步骤8到步骤13;
步骤8、计算残差序列的均值μ和标准差σ,利用3σ准则判别残差序列中的异常值,即 设定阈值上限Upbound=μ+3σ,阈值下线Lowbound=μ-3σ,残差序列e中超出阈值上线或低于阈值下线的时间序列点即为异常值,对应时刻的yobject中的时间序列点即为异常值,将异常 值剔除;
步骤9、剔除异常值后检测出力序列yobject中的数据缺失情况,找到每一个缺失段(或点) 的两个相邻有值点,计算这两点的时间差Δt,利用三次样条插值法对yobject内所有Δt≤1h的缺 失段(或点)进行修复;
步骤10、对于缺失段(或点)相邻两有值点时间差Δt>1h的情况,搜索站点A附近9km 以内的其他分布式新能源站点,称为邻近站点,将邻近站点的集合记为Β={B1,B2,...,Bk}, 其中k∈Z+,B1,B2,...,Bk表示各个邻近站点,k为邻近站点的个数,基于归一化后的 历史对应季节的正常数据,计算站点A与其所有邻近站点关于出力Y的Pearson相关系数, 相关系数大于0.8的邻近站点作为站点A的参照站点,若参照站点只有一个,则进入步骤11, 若参照站点有多个,则进入步骤12;
步骤11、此时站点A仅有一个参照站点,记为Crefer,Crefer∈B,将参照站点Crefer的出力 序列记为
Figure BDA0003075794380000071
该序列与站点A出力序列yobject的时刻一一对应,设yobject中所 有处于Δt>1h缺失段(或点)内的时间序列点共有v个,则yobject中未缺失的时间序列点有 u=N-v个,将未缺失的时间序列点按照时间排列组成新的序列yobject_exist=[z1,z2,...,zu],则 yrefer中与其时间一一对应的序列为
Figure BDA0003075794380000072
计算yobject_exist的均值μoe和标准差 σoe,计算yrefer_exist的均值μre和标准差σre,计算yobject_exist和yrefer_exist的Pearson相关系数 robject_refer,建立从参照站点出力时间序列yrefer到站点A出力修复序列yrepair的数据修复模型:
Figure BDA0003075794380000073
yobject的v个缺失时间序列点,用对应时刻出力修复序列yrepair的值完成修复;
步骤12、此时站点A有多个参照站点,将参照站点的集合记为C={C1,C2,...,Ct},其中 t∈Z+,t≤k,C1,C2,...,Ct表示各个参照站点,t为邻近站点的个数,且满足
Figure BDA0003075794380000074
将各个参照站点的出力用YC1,YC2,...,YCt表示,建立站点A的出力Y与其参照站点出力 之间的回归模型:
Y=α01YC12YC2+...+αtYCt
其中α0,α1,...,αt为回归模型系数,利用站点A及其参照站点的历史对应季节的正常出力数据,通过最小二乘法求解回归模型系数;
步骤13、将参照站点的出力序列记为
Figure BDA0003075794380000075
该序列与站点A出力序列 yobject的时刻一一对应,其中
Figure BDA0003075794380000076
表示第p个参照站点的第q个时间序列点,1≤p≤t,1≤q≤N, 将参照站点的出力序列yrefer代入步骤13建立的回归模型,得到站点A的出力修复序列
Figure BDA0003075794380000077
站点A的所有Δt>1h的缺失段(或点),用对应时刻出力修复序列yrepair的值完成修复。
本实施例考虑了出力数据与资源数据相关关系的季节性波动,同时利用了数据在时间尺 度和空间尺度上的相关性,在数据缺失时间长短不一和参照数据量大小不同的情况下,有针 对性的采用了不同的修复方法,相比其他分布式新能源出力数据质量提升方法,针对分布式 新能源出力数据中的数据异常、数据缺失问题进行检测剔除和修复,能够获得更高质量的数 据,并能够有效实现出力数据质量提升。
实施例2:
基于同一发明构思,本发明还提供了一种分布式新能源出力数据质量提升系统,如图3 所示,包括:获取模块、预测模块和修复模块;
所述获取模块,用于获取分布式新能源当前站点待质量提升的出力时间序列和所述出力 时间序列对应的相关变量值;
所述预测模块,用于基于所述出力时间序列对应的相关变量值,利用预先建立的BP神经 网络模型进行预测得到出力预测序列;
所述修复模块,用于对所述待质量提升的出力时间序列中,与所述出力预测序列存在差 异的数据进行修订;
其中,所述BP神经网络模型是按季节划分的历史正常出力数据序列及具有时空相关性的 相关变量训练得到。
具体的,包括如图4所示;
所述BP神经网络模型的构建,包括:
基于相同季节,同一新能源站点的历史正常出力数据的相关变量值作为BP神经网络的 输入数据,和历史正常出力数据的相关变量对应的历史正常出力数据序列作为BP神经网络 的输出数据,采用网格搜索法训练并获取BP神经网络模型。
所述历史正常出力数据的相关变量的获取,包括:
基于历史上正常出力数据和对应的正常资源数据,计算所述出力数据与对应的正常资源 数据中所有变量之间的Pearson相关系数;
分别判断所述出力数据与正常资源数据中各变量间的Pearson相关系数是否大于出力数 据的相关度阈值,如果是则所述资源数据的变量为相关变量的待选值;
从相关变量的待选值选择一个或多个变量作为历史正常出力数据的相关变量。
所述相关变量,包括:与新能源出力相关性大于相关度阙值的资源数据;其中资源数据 包括:总辐射、直射辐射、散射辐射、环境温度、相对湿度、气压、风速和风向。
所述修复模块,包括:残差序列子模块、剔除异常值子模块、寻找有值点子模块和修复 子模块;
其中残差序列子模块,用于将所述待质量提升的出力时间序列减去出力预测序列得到残 差序列;
其中剔除异常值子模块,用于利用3σ准则判别所述残差序列中的异常值,并剔除所述出 力时间序列的异常值;
其中寻找有值点子模块,用于基于剔除异常值后的所述出力时间序列,寻找每一个缺失 段的相邻有值点;
其中修复子模块,用于计算所述每一个缺失段的相邻有值点的时间差;并根据所述时间 差的长度选择相应的修补方法对于所述缺失段进行修复。
所述修复子模块,包括:计算判断单元、时间修补单元和空间修补单元;
其中计算判断单元,用于判断所述时间差的长度与预设数值的关系;
其中时间修补单元,用于对于时间差的长度小于等于预设数值的所有缺失段,基于时间 尺度采用三次样条插值法进行修补;
其中空间修补单元,用于对于时间差的长度大于预设数值的所有缺失段,基于空间尺度 采用附近站点归纳法进行修补。
所述空间修补单元,包括:归一化子单元、当前站点子单元、参照站点子单元,判断第 一子单元和判断第二子单元;
其中归一化子单元,用于对于时间差大于预设数值的所有缺失,获取待质量提升的出力 时间序列对应的当前站点预设空间尺度范围内的所有相邻分布式新能源站点,并对所有所述 相邻分布式新能源站点的出力时间序列进行归一化处理;
其中当前站点子单元,用于基于归一化处理后的所有所述相邻分布式新能源站点的出力 时间序列,分别计算当前站点与各相邻分布式新能源站点间出力时间序列的Pearson相关系 数;
其中参照站点子单元,用于基于当前站点与各相邻分布式新能源站点间出力时间序列的 Pearson相关系数确定所述相邻分布式新能源站点是否为参照站点;
其中判断第一子单元,用于当参照站点为一个时,采用Pearson相关系数对所述待质量 提升的出力时间序列的所有缺失段进行修复;
其中判断第二子单元,用于当参照站点大于一个时,采用最小二乘法对所述待质量提升 的出力时间序列的所有缺失段进行修复。
所述判断第一子单元,包括:计算第一序列、计算第二序列,计算相关系数、计算修复 序列和修复出力序列;
其中计算第一序列,用于获取当前站点的出力时间序列,将未缺失段的时间序列点按照 时间排列组成第一序列,并计算所述第一序列的均值和标准差;
其中计算第二序列,用于基于参照站点的出力时间序列,组成与所述第一序列的时间一 一对应的第二序列,并计算所述第二序列的均值和标准差;
其中计算相关系数,用于根据所述第一序列和所述第二序列计算第一序列和第二序列间 的Pearson相关系数;
其中计算修复序列,用于将所述第一序列和第二序列的均值、标准差以及所述第一序列 和第二序列间的Pearson相关系数带入数据修复模型,计算得到缺失段的对应时刻的修复的 出力时间序列;
其中修复出力序列,用于基于所述缺失段的对应时刻的修复的出力时间序列中的数值修 复所有缺失段的出力时间序列。
所述数据修复模型的计算式如下:
Figure BDA0003075794380000101
其中,yrepair表示缺失段的对应时刻的修复的出力时间序列,μoe表示第一序列的均值, σoe表示第一序列的标准差,robject_refer表示第一序列和第二序列的Pearson相关系数,yrefer表示缺失段的对应时刻的参照站点的出力时间序列,μre表示第二序列的均值,σre表示第 二序列的标准差。
所述判断第二子单元,包括:求解方程的系数、计算出力修复序列和出力缺失修复;
其中求解方程的系数,用于根据当前站点和各个参照站点的正常历史出力时间序列,通 过最小二乘法求解所述当前站点和各个参照站点的正常历史出力之间回归方程的系数;
其中计算出力修复序列,用于基于所述回归方程的系数以及与待质量提升的出力时间序 列的时间一一对应的各个参照站点的正常历史出力时间序列,采用回归方程模型计算对应时 间当前站点的出力修复序列;
其中出力缺失修复,用于利用所述对应时间当前站点的修复序列的值对所述待质量提升 的出力时间序列的所有缺失段进行修复。
所述回归方程模型的计算式如下:
Y=α01YC12YC2+...+αtYCt
其中,α0,α1,...,αt为回归方程的系数,YC1,YC2,...,YCt表示各个参照站点的出力时间序列的正常历史出力数据,Y表示当前站点的正常历史出力时间序列的出力数据,t为参 照站点的数量。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/ 或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/ 或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令 到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个 机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程 图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工 作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制 造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指 定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或 其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编 程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多 个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用于说明本发明的技术方案而非对其保护范围的限制, 尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:本领域 技术人员阅读本发明后依然可对发明的具体实施方式进行种种变更、修改或者等同替换,但 这些变更、修改或者等同替换,均在发明待批的权利要求保护范围之内。

Claims (12)

1.一种分布式新能源出力数据质量提升方法,其特征在于,包括:
获取分布式新能源当前站点待质量提升的出力时间序列和所述出力时间序列对应的相关变量值;
基于所述出力时间序列对应的相关变量值,利用预先建立的BP神经网络模型进行预测得到出力预测序列;
对所述待质量提升的出力时间序列中,与所述出力预测序列存在差异的数据进行修订;
其中,所述BP神经网络模型是按季节划分的历史正常出力数据序列及具有时空相关性的相关变量训练得到。
2.根据权利要求1所述的方法,其特征在于,所述BP神经网络模型的构建,包括:
基于相同季节,同一新能源站点的历史正常出力数据的相关变量值作为BP神经网络的输入数据,和历史正常出力数据的相关变量对应的历史正常出力数据序列作为BP神经网络的输出数据,采用网格搜索法训练并获取BP神经网络模型。
3.根据权利要求2所述的方法,其特征在于,所述历史正常出力数据的相关变量的获取,包括:
基于历史上正常出力数据和对应的正常资源数据,计算所述出力数据与对应的正常资源数据中所有变量之间的Pearson相关系数;
分别判断所述出力数据与正常资源数据中各变量间的Pearson相关系数是否大于出力数据的相关度阈值,如果是则所述资源数据的变量为相关变量的待选值;
从相关变量的待选值选择一个或多个变量作为历史正常出力数据的相关变量。
4.根据权利要求3所述的方法,其特征在于,所述相关变量,包括:与新能源出力相关性大于相关度阙值的资源数据;其中资源数据包括:总辐射、直射辐射、散射辐射、环境温度、相对湿度、气压、风速和风向。
5.根据权力要求1所述的方法,其特征在于,所述对所述待质量提升的出力时间序列中,与所述出力预测序列存在差异的数据进行修订,包括:
将所述待质量提升的出力时间序列减去出力预测序列得到残差序列;
利用3σ准则判别所述残差序列中的异常值,并剔除所述出力时间序列的异常值;
基于剔除异常值后的所述出力时间序列,寻找每一个缺失段的相邻有值点;
计算所述每一个缺失段的相邻有值点的时间差,并根据所述时间差的长度选择相应的修补方法对于所述缺失段进行修复。
6.根据权力要求5所述的方法,其特征在于,所述根据所述时间差的长度选择相应的修补方法对所述缺失段进行修复,包括:
判断所述时间差的长度与预设数值的关系;
对于时间差的长度小于等于预设数值的所有缺失段,基于时间尺度采用三次样条插值法进行修补;
对于时间差的长度大于预设数值的所有缺失段,基于空间尺度采用附近站点归纳法进行修补。
7.根据权利要求3所述的方法,其特征在于,所述基于空间尺度采用附近站点归纳法进行修补,包括:
获取待质量提升的出力时间序列对应的当前站点预设空间尺度范围内的所有相邻分布式新能源站点,并对所有所述相邻分布式新能源站点的出力时间序列进行归一化处理;
基于归一化处理后的所有所述相邻分布式新能源站点的出力时间序列,分别计算当前站点与各相邻分布式新能源站点间出力时间序列的Pearson相关系数;
基于当前站点与各相邻分布式新能源站点间出力时间序列的Pearson相关系数确定所述相邻分布式新能源站点是否为参照站点;
当参照站点为一个时,采用Pearson相关系数对所述待质量提升的出力时间序列的所有缺失段进行修复;
当参照站点大于一个时,采用最小二乘法对所述待质量提升的出力时间序列的所有缺失段进行修复。
8.根据权利要求7所述的方法,其特征在于,所述采用Pearson相关系数对所述待质量提升的出力时间序列的所有缺失段进行修复,包括:
获取当前站点的出力时间序列,将未缺失段的时间序列点按照时间排列组成第一序列,并计算所述第一序列的均值和标准差;
基于参照站点的出力时间序列,组成与所述第一序列的时间一一对应的第二序列,并计算所述第二序列的均值和标准差;
根据所述第一序列和所述第二序列计算第一序列和第二序列间的Pearson相关系数;
将所述第一序列和第二序列的均值、标准差以及所述第一序列和第二序列间的Pearson相关系数带入数据修复模型,计算得到缺失段的对应时刻的修复的出力时间序列;
基于所述缺失段的对应时刻的修复的出力时间序列中的数值修复所有缺失段的出力时间序列。
9.根据权利要求8所述的方法,其特征在于,
所述数据修复模型的计算式如下:
Figure FDA0003075794370000031
其中,yrepair表示缺失段的对应时刻的修复的出力时间序列,μoe表示第一序列的均值,σoe表示第一序列的标准差,robject_refer表示第一序列和第二序列的Pearson相关系数,yrefer表示缺失段的对应时刻的参照站点的出力时间序列,μre表示第二序列的均值,σre表示第二序列的标准差。
10.根据权利要求7所述的方法,其特征在于,所述采用最小二乘法对待质量提升的出力时间序列的所有缺失段的当前站点的修复序列进行修复,包括:
根据当前站点和各个参照站点的正常历史出力时间序列,通过最小二乘法求解所述当前站点和各个参照站点的正常历史出力之间回归方程的系数;
基于所述回归方程的系数以及与待质量提升的出力时间序列的时间一一对应的各个参照站点的正常历史出力时间序列,采用回归方程模型计算对应时间当前站点的出力修复序列;
利用所述对应时间当前站点的修复序列的值对所述待质量提升的出力时间序列的所有缺失段进行修复。
11.根据权利要求10所述的方法,其特征在于,
所述回归方程模型的计算式如下:
Y=α01YC12YC2+...+αtYCt
其中,α0,α1,...,αt为回归方程的系数,YC1,YC2,...,YCt表示各个参照站点的出力时间序列的正常历史出力数据,Y表示当前站点的正常历史出力时间序列的出力数据,t为参照站点的数量。
12.一种分布式新能源出力数据质量提升系统,其特征在于,包括:获取模块、预测模块和修复模块;
所述获取模块,用于获取分布式新能源当前站点待质量提升的出力时间序列和所述出力时间序列对应的相关变量值;
所述预测模块,用于基于所述出力时间序列对应的相关变量值,利用预先建立的BP神经网络模型进行预测得到出力预测序列;
所述修复模块,用于对所述待质量提升的出力时间序列中,与所述出力预测序列存在差异的数据进行修订;
其中,所述BP神经网络模型是按季节划分的历史正常出力数据序列及具有时空相关性的相关变量训练得到。
CN202110552624.4A 2021-05-20 2021-05-20 一种分布式新能源出力数据质量提升方法和系统 Pending CN115374091A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110552624.4A CN115374091A (zh) 2021-05-20 2021-05-20 一种分布式新能源出力数据质量提升方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110552624.4A CN115374091A (zh) 2021-05-20 2021-05-20 一种分布式新能源出力数据质量提升方法和系统

Publications (1)

Publication Number Publication Date
CN115374091A true CN115374091A (zh) 2022-11-22

Family

ID=84058336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110552624.4A Pending CN115374091A (zh) 2021-05-20 2021-05-20 一种分布式新能源出力数据质量提升方法和系统

Country Status (1)

Country Link
CN (1) CN115374091A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116049341A (zh) * 2023-03-08 2023-05-02 北京七兆科技有限公司 一种水文数据标准化方法、装置、设备及存储介质
CN116777305A (zh) * 2023-08-18 2023-09-19 河北思极科技有限公司 电力数据质量提升方法、装置、电子设备及存储介质
CN117609706A (zh) * 2023-10-20 2024-02-27 北京师范大学 一种碳水通量数据插补的方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116049341A (zh) * 2023-03-08 2023-05-02 北京七兆科技有限公司 一种水文数据标准化方法、装置、设备及存储介质
CN116049341B (zh) * 2023-03-08 2023-08-15 北京七兆科技有限公司 一种水文数据标准化方法、装置、设备及存储介质
CN116777305A (zh) * 2023-08-18 2023-09-19 河北思极科技有限公司 电力数据质量提升方法、装置、电子设备及存储介质
CN116777305B (zh) * 2023-08-18 2023-11-10 河北思极科技有限公司 电力数据质量提升方法、装置、电子设备及存储介质
CN117609706A (zh) * 2023-10-20 2024-02-27 北京师范大学 一种碳水通量数据插补的方法
CN117609706B (zh) * 2023-10-20 2024-06-04 北京师范大学 一种碳水通量数据插补的方法

Similar Documents

Publication Publication Date Title
CN115374091A (zh) 一种分布式新能源出力数据质量提升方法和系统
CN111337768B (zh) 变压器油中溶解气体的深度并行故障诊断方法及系统
CN110929918B (zh) 一种基于CNN和LightGBM的10kV馈线故障预测方法
CN109242049B (zh) 基于卷积神经网络的给水管网多点漏损定位方法及其装置
CN109376960A (zh) 基于lstm神经网络的电网负荷预测方法
CN106874483A (zh) 一种基于大数据技术的图形化的数据质量评测的装置及方法
CN102521080A (zh) 电力用户用电信息采集系统的计算机数据修复方法
CN114819374B (zh) 区域新能源超短期功率预测方法及系统
CN111625399A (zh) 一种计量数据恢复方法及系统
CN108510072A (zh) 一种基于混沌神经网络的河道流量监测数据质量控制方法
CN112415326B (zh) 一种基于模糊聚类算法的配电网故障区段辨识方法
CN104574221B (zh) 一种基于损失电量特征参数的光伏电站运行状态辨识方法
CN115908051A (zh) 一种电力系统储能容量确定方法
CN103778306B (zh) 一种基于ei和逐步消减法的传感器优化布设方法
CN116703368A (zh) 基于数据挖掘的同期线损智能闭环监测方法
CN117290666A (zh) 一种光伏异常功率数据清洗方法
CN116757321A (zh) 太阳直接辐射量预测方法、系统、设备及存储介质
CN111177127A (zh) 一种基于bp神经网络的光伏电站出力数据修复方法
CN114281846B (zh) 一种基于机器学习的新能源发电预测方法
CN105699043B (zh) 一种提高风洞传感器测量稳定性和精准度的方法
CN105405068A (zh) 电力数据的检测方法及装置
CN117318024B (zh) 基于cnn神经网络的光伏发电功率预测管理方法及系统
CN118532303A (zh) 基于前向-前向传播的风电机组运行状态评估方法及系统
CN113723502B (zh) 一种基于电流波形的风力发电机组变频器网侧异常识别方法及系统
CN118246695B (zh) 一种光伏新能源运维调度系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination