CN116860738A - 虚拟电厂基线数据的数据补足方法及系统 - Google Patents
虚拟电厂基线数据的数据补足方法及系统 Download PDFInfo
- Publication number
- CN116860738A CN116860738A CN202310924197.7A CN202310924197A CN116860738A CN 116860738 A CN116860738 A CN 116860738A CN 202310924197 A CN202310924197 A CN 202310924197A CN 116860738 A CN116860738 A CN 116860738A
- Authority
- CN
- China
- Prior art keywords
- data
- missing
- baseline
- supplementing
- complement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 230000000295 complement effect Effects 0.000 title claims abstract description 50
- 230000004044 response Effects 0.000 claims abstract description 64
- 230000005611 electricity Effects 0.000 claims abstract description 51
- 230000001502 supplementing effect Effects 0.000 claims abstract description 33
- 238000013527 convolutional neural network Methods 0.000 claims description 31
- 238000012549 training Methods 0.000 claims description 20
- 230000002159 abnormal effect Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012886 linear function Methods 0.000 claims description 3
- 230000009469 supplementation Effects 0.000 claims 2
- 239000013589 supplement Substances 0.000 claims 1
- 238000005070 sampling Methods 0.000 abstract description 30
- 230000006870 function Effects 0.000 description 17
- 230000004913 activation Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000004154 complement system Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Water Supply & Treatment (AREA)
- Quality & Reliability (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Probability & Statistics with Applications (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及工业大数据技术领域,具体涉及一种虚拟电厂基线数据的数据补足方法及系统;该方法包括如下步骤:S1:对缺失的数据类型进行判断并分类;S2:若为工作日响应基线用电负荷数据缺失,则采用第一补足方法对缺失数据补足;S3:若为周六日或法定节假日响应基线用电负荷数据缺失,则采用第二补足方法对缺失数据补足;S4:若是实时响应基线用电负荷数据缺失,则采用第三补足方法对缺失数据补足。根据用电负荷特点将所有的用电日区分为工作日、周六日、法定节假日和实时用电,对缺失数据的类型进行判断,根据判断的缺失数据类型采用对应不同用电负荷特点的补足方法,同时对工作日采样点预测数据进行二次修正,有效提升数据补足的准确率。
Description
技术领域
本发明涉及工业大数据技术领域,具体涉及一种虚拟电厂基线数据的数据补足方法及系统。
背景技术
虚拟电厂是一种电源协调管理系统,可以通过先进的信息通信技术和协调控制技术,将分布式电源、可控负荷和储能系统合理地聚合在一起,形成可供电网利用的强大电源,并能够直观的判断出缺失的用电负荷数据,并能够快速的做出相应的补足操作其中,为了计算每个参与者在需求响应事件期间实现的负荷减少量,以确定应给予每个参与者的奖励,需要估计用户的基线数据。
在计算用户基线时,用于基线计算的数据由于采集、传输等原因,会存在数据缺失的情况,因此,需要对缺失的数据补足才能用于基线的计算;现有技术中具有对缺失数据补足的技术方案,例如,中国发明专利(CN110058971A)公开了一种风电场SCADA数据缺失的智能修复方法,包括以下步骤:对于待修复机组数据a,选出相应的多列辅助修复机组数据B;选择辅助修复机组数据B中与a相关性最大的多列辅助修复机组数据C;判断待修复机组数据a和所述多列辅助修复机组数据C的方差差异,若超过设定阈值则对a和C进行标准化;对C进行基线补偿;对于以上步骤得到的辅助修复机组数据C,选择C中与待修复机组数据a平均绝对误差最小的多列机组数据D;对上述多列机组数据D进行组编筛选,得到最接近均值的多列机组数据D′;对多列机组数据D′进行中值滤波;对多列机组数据D′求每个时刻的均值。上述方案可以高效准确地对缺失数据进行智能修复。
但是,上述方案在对缺失数据补足时,没有对缺失数据的基线类型进行判断,致使当对于计算不同基线的数据缺失时,采用同一种方法对不同类型的基线缺失数据进行数据补足,会造成最终基线计算精度较低;同时,在采用预测模型对工作日缺失数据进行预测时,没有考虑工作日缺失数据可能只缺失某几个点,因此,缺少二次验证的过程导致预测精度不高。
发明内容
本发明的目的在于提供一种虚拟电厂基线数据的数据补足方法及系统,以解决现有技术中的问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种虚拟电厂基线数据的数据补足方法及系统,包括如下步骤:
S1:对缺失的数据类型进行判断并分类;
S2:若为工作日响应基线用电负荷数据缺失,则采用第一补足方法对缺失数据补足;
S3:若为周六日或法定节假日响应基线用电负荷数据缺失,则采用第二补足方法对缺失数据补足;
S4:若是实时响应基线用电负荷数据缺失,则采用第三补足方法对缺失数据补足。
作为本发明的一种优选方案,缺失的所述数据类型包括:工作日响应基线用电负荷数据缺失、周六日非国家法定节假日响应基线用电负荷数据缺失、法定节假日响应基线用电负荷数据缺失、实时响应基线用电负荷数据缺失。
作为本发明的一种优选方案,在步骤S2中,所述第一补足方法为采用卷积神经网络模型对所述缺失数据进行预测,进而进行数据补足;
优选地,所述卷积神经网络模型为一维卷积神经网络模型;
优选地,所述第一补足方法具体包括如下步骤:
步骤S201、获取所述卷积神经网络模型的训练集;
其中,采用公开的澳大利亚新南威尔士州的工作日的电力负荷数据作为训练集,用于对所述卷积神经网络模型训练;
值得强调的是,本发明在用所述电力负荷数据时,选择每天的电力负荷数据的不同时刻的八个点的数据作为当天的电力负荷数据组成训练集;
具体地,在将采用公开的澳大利亚新南威尔士州的工作日电力负荷数据作为训练集之前,需要对所述电力负荷数据进行预处理;
所述预处理包括:对所述电力负荷数据进行数据清洗过滤异常数据以及对所述电力负荷数据进行归一化;
具体地,所述异常数据为明显超出正常用电负荷值的数据;
值得强调地,将某一时刻异常数据清洗后,将该时刻前一时刻用电负荷值与该时刻后一时刻的用电负荷值取平均操作作为该时刻异常数据的替代值;
所述归一化公式处理采用线性函数,具体公式为:
其中,x为原始数据,
xmax为原始数据最大值,
xmin为原始数据最小值,
xnorm为归一化后的数据。
S202、建立所述卷积神经网络模型;
其中,所述卷积神经网络由输入层、卷积层、激活层、池化层、输出层组成;
其中,所述输入层用于对输入数据进行平均化和归一化处理,所述输入层的数学描述为:
{X,Y}={xi,yi}N
式中,X,Y表示输入样本数据,N表示输入样本的数目,xi表示输入样本数据X中第i个输入数据,yi表示xi在输入样本数据Y所对应的样本标签;
所述卷积层有两个重要的操作,分别为局部关联和窗口滑动;所述卷积层使用多个卷积核对输入数据或者上层中被提取特征的局部区域进行卷积运算,所述卷积核通过卷积运算提取出更深层次的深度信息;
具体地,所述卷积运算的运算过程描述为:
式中,yl表示第l层的输出向量,cl-1表示第l-1层中的第c个通道,wi,c l表示第l层的卷积核参数权重矩阵,i表示第l层中的第i个通道,c表示第l-1层的第c个通道,*表示卷积运算,xi l-1表示第l-1层的第i个通道的输出向量x,bi l表示第l层的第i个通道的偏置项b;
所述激活层用于对所述卷积层的输出的特征向量进行线性变换,将卷积层的中低维空间中非线性可分的特征空间通过激活函数转换后,在激活层的高位空间内增强其特征线性可分的能力;
所述池化层位于多个卷积层中部,用于对数据进行压缩,降低预测结果的过度拟合;
所述全连接层用于将特征结果提纯,用来增强特征的非线性表达能力。
S203、采用所述训练集训练所述卷积神经网络模型;
其中,所述训练集包括n+1个工作日的用电负荷数据,其中,前n天的数据作为所述卷积神经网络模型的输入,所述n+1天的用电负荷数据作为模型的输出,对所述卷积神经网络模型训练;
更近一步地,所述每个工作日的用电负荷数据是由八个点的数据组成的数据向量,另外,所述n为≥30的正整数;
S204、将缺失日前n个工作日的用电负荷数据作为所述卷积神经网络模型的输入数据,输入至所述卷积神经网络模型中,输出初步预测结果;
具体地,所述预测结果为缺失日当天的八个采样点的数据,由此可得到缺失数据的初步预测结果;
S205、计算缺失日的预测值与对应的实际值的偏差,然后修正所述初步预测结果,从而得到缺失采样点的最终预测值;
实际上,经过上述步骤的模型的预测,已经能够获得较为准确的预测数据,本发明为了进一步提高预测的精度,利用了实际采样值进一步对预测值修正的步骤。
由上述介绍可知,在计算响应日相应基线时,采集当天的八个采样点的数据计算当天的负荷数据,然后获得从响应日前1天向前选择5天的工作日的负荷数据的算术平均负荷作为响应基线;而一般地,较少会出现大范围的数据缺失,因此,本发明着重考虑缺少2个采样点的数据的情况;
可计算实际采样点的采样值与对应的采样点的预测值的误差,然后对六个采样点的误差计算算数平均误差,根据所述获得的算数平均误差以及缺失点的初步预测值,计算得到缺失点的最终预测值。
S206、采用所述缺失点的最终预测值实现缺失点的数据补足,进而补足工作日缺失数据。
作为本发明的一种优选方案,在所述S3中,所述第二补足方法具体包括如下步骤:
步骤S301、获取前n个周六日和法定节假日的用电负荷数据;
更进一步地,n为5、10、20中的一种S302、根据前n个周六日和法定节假日的用电负荷数据,算出其算数平均值作为周六日和节假日中的缺失日补足值。
作为本发明的一种优选方案,在所述S4中,所述第三补足方法具体包括如下步骤:
步骤S401、根据实时响应中缺失的响应时段的前m天的该缺失时刻的用电负荷数据进行数据拟合;
在步骤S401中,将实时响应中缺失的响应时段设为t,则获取前m天的t时刻用电负荷数据;
步骤S402、对m个数据拟合,确定拟合公式;
具体地,所述拟合公式为一次函数、幂函数、二次函数等中的一种,根据所述一次函数、幂函数、二次函数的相关系数确定拟合公式。
S403、根据所述拟合公式计算得到补足数据,并作为实时响应中缺失的响应时段t补足值。
根据本发明的另一方面,提供一种虚拟电厂基线数据的数据补足系统,使用如上述所示的一种虚拟电厂基线数据的数据补足方法,包括如下模块
缺失数据类型判断模块,用于对于缺失的数据类型进行判断分类;
工作日响应基线用电负荷数据补足模块,与所述缺失数据类型判断模块连接,用于采用第一补足方法,对工作日响应基线缺失数据补足;
周六日或是法定节假日响应基线用电负荷数据补足模块,与所述缺失数据类型判断模块连接,用于采用第二补足方法,对周六日或法定节假日响应基线缺失数据补足;
实时响应基线用电负荷数据补足模块,与所述缺失数据类型判断模块连接,用于采用第三补足方法,对实时响应基线缺失数据补足。
本发明与现有技术相比较具有如下有益效果:
本发明根据用电负荷特点将所有的用电日区分为工作日、周六日、法定节假日和实时用电,并对缺失数据的类型进行判断,根据判断的缺失数据类型采用对应不同用电负荷特点的补足方法,能够有效提升数据补足的准确率;
同时,本发明在通过预测模型对工作日缺失数据进行预测时,首先通过卷积神经网络对缺失日的八个采样点的数据进行预测,更为重要的是,针对工作日缺失的某两个点数据,采取剩余六个采样点的实际值与预测值进行修正,从而使得采样点的预测值更加贴近实际值,从而提升数据补足的准确率。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明提供实施例一的数据补足方法流程图。
图2为本发明提供实施例二的数据补足系统的模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面首先结合附图对本申请所涉及的概念进行说明。在此需要指出的是,以下对各个概念的说明,仅为了使本申请的内容更加容易理解,并不表示对本申请保护范围的限定;同时,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
实施例一
如图1所示,本发明提供了一种虚拟电厂基线数据的数据补足方法,包括如下步骤:
步骤S1:对缺失的数据类型进行判断并分类。
具体地,所述缺失的数据类型包括:工作日响应基线用电负荷数据缺失、周六日响应基线用电负荷数据缺失、法定节假日响应基线用电负荷数据缺失、实时响应基线用电负荷数据缺失。
步骤S2:若为工作日响应基线用电负荷数据缺失,则采用第一补足方法对缺失数据补足。
实际上,发明人通过多年研究发现,对于某区域用电负荷来说,工作日的用电负荷波动较为平稳,因此,可基于历史数据对缺失的工作日响应基线数据进行补足操作。
示例性地,一般地,在计算工作日响应基线时,从响应日前1天向前选择5天的算术平均负荷作为响应基线,不包括周六日和响应日;然而,在计算过程中,由于采集装置或数据传输的影响,某些日期或时间的用电负荷会缺失,此时,需要对缺失日的历史用电负荷数据进行补足。
更进一步地,在步骤S2中,所述第一补足方法为采用卷积神经网络模型对所述缺失数据进行预测,进而进行数据补足;
更近一步地,本实施例中对时序的用电负荷数据进行预测,所以,所述卷积神经网络模型为一维卷积神经网络模型;
更近一步地,所述第一补足方法具体包括如下步骤:
步骤S201、获取所述卷积神经网络模型的训练集;
在本实施例中,采用公开的澳大利亚新南威尔士州的工作日的电力负荷数据作为训练集,用于对所述卷积神经网络模型训练;
值得强调的是,本实施例在用所述电力负荷数据时,选择每天的电力负荷数据的不同时刻的八个点的数据作为当天的电力负荷数据组成训练集;
具体地,在将采用公开的澳大利亚新南威尔士州的工作日电力负荷数据作为训练集之前,需要对所述电力负荷数据进行预处理;
所述预处理包括:对所述电力负荷数据进行数据清洗过滤异常数据以及对所述电力负荷数据进行归一化;
具体地,所述异常数据为明显超出正常用电负荷值的数据;比如说,在某一时刻的用电负荷值比上一时刻的用电负荷值增大了几百倍,那么该值大概率是由于采集、传输等产生误差造成的,而,该类异常值的存在对后续的数据计算产生极大的影响,造成计算结果的失真,因此,需要对该类异常数据进行清洗操作
值得强调地,将某一时刻异常数据清洗后,将该时刻前一时刻用电负荷值与该时刻后一时刻的用电负荷值取平均操作作为该时刻异常数据的替代值;
所述归一化公式处理采用线性函数,具体公式为:
其中,x为原始数据,
xmax为原始数据最大值,
xmin为原始数据最小值,
xnorm为归一化后的数据。
S202、建立所述卷积神经网络模型;
其中,所述卷积神经网络由输入层、卷积层、激活层、池化层、输出层组成;
其中,所述输入层用于对输入数据进行平均化和归一化处理,所述输入层的数学描述为:
{X,Y}={xi,yi}N
式中,X,Y均表示输入样本数据,N表示输入样本的数目,xi表示输入数据X中第i个输入数据,yi表示xi在样本数据Y所对应的样本标签;
所述卷积层有两个重要的操作,分别为局部关联和窗口滑动;所述卷积层使用多个卷积核对输入数据或者上层中被提取特征的局部区域进行卷积运算,所述卷积核通过卷积运算提取出更深层次的深度信息;
具体地,所述卷积运算的运算过程描述为:
式中,yl表示第l层的输出向量,cl-1表示第l-1层中的第c个通道,wi,c l表示第l层的卷积核参数权重矩阵,i表示第l层中的第i个通道,c表示第l-1层的第c个通道,*表示卷积运算,xi l-1表示第l-1层的第i个通道的输出向量x,bi l表示第l层的第i个通道的偏置项b;
所述激活层用于对所述卷积层的输出的特征向量进行线性变换,将卷积层的中低维空间中非线性可分的特征空间通过激活函数转换后,在激活层的高位空间内增强其特征线性可分的能力;
所述池化层位于多个卷积层中部,用于对数据进行压缩,降低预测结果的过度拟合;
所述全连接层用于将特征结果提纯,用来增强特征的非线性表达能力。
S203、采用所述训练集训练所述卷积神经网络模型;
其中,所述训练集包括n+1个工作日的用电负荷数据,其中,前n天的数据作为所述卷积神经网络模型的输入,所述n+1天的用电负荷数据作为模型的输出,对所述卷积神经网络模型训练;
更近一步地,所述每个工作日的用电负荷数据是由八个点的数据组成的数据向量,另外,所述n为≥30的正整数;
S204、将缺失日前n个工作日的用电负荷数据作为所述卷积神经网络模型的输入数据,输入至所述卷积神经网络模型中,输出初步预测结果;
具体地,所述预测结果为缺失日当天的八个采样点的数据,由此可得到缺失数据的初步预测结果;
S205、计算缺失日的预测值与对应的实际值的偏差,然后修正所述初步预测结果,从而得到缺失采样点的最终预测值;
实际上,经过上述步骤的模型的预测,已经能够获得较为准确的预测数据,本实施例为了进一步提高预测的精度,利用了实际采样值进一步对预测值修正的步骤。
由上述介绍可知,在计算响应日相应基线时,采集当天的八个采样点的数据计算当天的负荷数据,然后获得从响应日前1天向前选择5天的工作日的负荷数据的算术平均负荷作为响应基线;而一般地,较少会出现大范围的数据缺失,因此,本实施例着重考虑缺少2个采样点的数据的情况;
可计算实际采样点的采样值与对应的采样点的预测值的误差,然后对六个采样点的误差计算算数平均误差,根据所述获得的算数平均误差以及缺失点的初步预测值,计算得到缺失点的最终预测值。
示例性地,若缺失日当天采样了a1-a8共8个采样点,实际发现a5、a7采样点数据缺失,则存在6个实际采样点;而通过所述步骤1的模型预测,得到了b1-b8的八个采样点的预测值;则计算a1采样点与b1预测点的误差为0.02,a2采样点与b2预测点的误差为-0.03,a3采样点与b3预测点的误差为0.06,a4采样点与b4预测点的误差为0.01,a6采样点与b6预测点的误差为-0.02,a8采样点与b8预测点的误差为0.02,然后计算所述六个误差的算数平均误差0.01,根据所述算数平均误差e以及缺失点的初步预测值,即可得到缺失点的最终预测值;
具体地,所述缺失点的最终预测值=缺失点的初步预测值×(1+e);
其中,e为所述算数平均误差;
S206、采用所述缺失点的最终预测值实现缺失点的数据补足,进而补足工作日缺失数据。
步骤S3:若为周六日或法定节假日响应基线用电负荷数据缺失,则采用第二补足方法对缺失数据补足。
具体地,因周六日或法定节假日人们外出或企业搞活动等,造成用电负荷区别较大,趋势性不明显,因此,采取前n个周六日和法定节假日负荷的加权平均作为缺失日基线负荷的补足值。
值得强调地,本实施例中周六日的含义不包括因调休造成周六日为工作日的情况。
在步骤S3中,第二补足方法具体包括如下步骤:
步骤S301、获取前n个周六日和法定节假日的用电负荷数据更进一步地,n为5、10、20中的一种。
步骤S302、根据前n个周六日和法定节假日的用电负荷数据,算出其算数平均值作为周六日和节假日中的缺失日补足值。
步骤S4:若是实时响应基线用电负荷数据缺失,则采用第三补足方法对缺失数据补足。
在步骤S4中,第三补足方法具体包括如下步骤:
步骤S401、根据实时响应中缺失的响应时段的前m天的该缺失时刻的用电负荷数据进行数据拟合。在步骤S401中,将实时响应中缺失的响应时段设为t,则获取前m天的t时刻用电负荷数据;
示例性地,以m为3为例;若4号上午8点的时刻数据缺失,则获取1-3号上午8点的用电负荷数据;用于对4号上午8点的响应数据进行补足;
步骤S402、对m个数据拟合,确定拟合公式;
具体地,所述拟合公式为一次函数、幂函数、二次函数等中的一种,根据所述一次函数、幂函数、二次函数的相关系数确定拟合公式。
更进一步地,可通过excel拟合确定出拟合公式;
步骤S403、根据拟合公式计算得到补足数据,并作为实时响应中缺失的响应时段t补足值。
本发明根据用电负荷特点将所有的用电日区分为工作日、周六日、法定节假日和实时用电,并对缺失数据的类型进行判断,根据判断的缺失数据类型采用对应不同用电负荷特点的补足方法,能够有效提升数据补足的准确率。
实施例二
一种虚拟电厂基线数据的数据补足系统,使用如上述的一种虚拟电厂基线数据的数据补足方法,包括如下模块
缺失数据类型判断模块,用于对于缺失的数据类型进行判断分类;
工作日响应基线用电负荷数据补足模块,与所述缺失数据类型判断模块连接,用于采用第一补足方法,对工作日响应基线缺失数据补足;
周六日或是法定节假日响应基线用电负荷数据补足模块,与所述缺失数据类型判断模块连接,用于采用第二补足方法,对周六日或法定节假日响应基线缺失数据补足;
实时响应基线用电负荷数据补足模块,与所述缺失数据类型判断模块连接,用于采用第三补足方法,对实时响应基线缺失数据补足。
实施例三
本实施例包括一种计算机可读存储介质,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行实施例一的一种虚拟电厂基线数据的数据补足方法。
本领域技术人员应明白,本文的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本文可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或可以用于存储期望的信息并且可以被计算机访问的任何其他的介质等。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本文是参照根据本文实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是,本申请所用术语仅为了描述特定实施例,而非限制本申请范围。如本申请说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。术语“包括”、“包含”或其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法或设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或是还包括为这种过程、方法或设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或设备中还存在另外的相同要素。
还需说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”等应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
以上所述的实施例及/或实施方式,仅是用以说明实现本发明技术的较佳实施例及/或实施方式,并非对本发明技术的实施方式作任何形式上的限制,任何本领域技术人员,在不脱离本发明内容所公开的技术手段的范围,当可作些许的更动或修改为其它等效的实施例,但仍应视为与本发明实质相同的技术或实施例。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。以上所述仅是本申请的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以作出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其他场合的,均应视为本申请的保护范围。
Claims (10)
1.一种虚拟电厂基线数据的数据补足方法,其特征在于,包括如下步骤:
S1:对缺失的数据类型进行判断并分类;
S2:若为工作日响应基线用电负荷数据缺失,则采用第一补足方法对缺失数据补足;
S3:若为周六日或法定节假日响应基线用电负荷数据缺失,则采用第二补足方法对缺失数据补足;
S4:若是实时响应基线用电负荷数据缺失,则采用第三补足方法对缺失数据补足。
2.根据权利要求1所述的虚拟电厂基线数据的数据补足方法,其特征在于,缺失的所述数据类型包括:工作日响应基线用电负荷数据缺失、周六日非国家法定节假日响应基线用电负荷数据缺失、法定节假日响应基线用电负荷数据缺失、实时响应基线用电负荷数据缺失。
3.根据权利要求2所述的虚拟电厂基线数据的数据补足方法,其特征在于,所述第一补足方法为采用卷积神经网络模型对所述缺失数据进行预测,进而进行数据补足;在所述S2中,所述第一补足方法具体包括如下步骤:
步骤S201、获取所述卷积神经网络模型的训练集;
S202、建立所述卷积神经网络模型;
S203、采用所述训练集训练所述卷积神经网络模型;
S204、将缺失日前n个工作日的用电负荷数据作为所述卷积神经网络模型的输入数据,输入至所述卷积神经网络模型中,输出初步预测结果;
S205、计算缺失日的预测值与对应的实际值的偏差,然后修正所述初步预测结果,从而得到缺失点的最终预测值;
S206、采用所述缺失点的最终预测值实现缺失点的数据补足,进而补足工作日缺失数据。
4.根据权利要求2所述的虚拟电厂基线数据的数据补足方法,其特征在于,在所述S3中,所述第二补足方法具体包括如下步骤:
步骤S301、获取前n个周六日和法定节假日的用电负荷数据;
步骤S302、根据前n个周六日和法定节假日的用电负荷数据,算出其算数平均值作为周六日和节假日中的缺失日补足值。
5.根据权利要求2所述的虚拟电厂基线数据的数据补足方法,其特征在于,在所述S4中,所述第三补足方法具体包括如下步骤:
步骤S401、根据实时响应中缺失的响应时段的前m天的该缺失时刻的用电负荷数据进行数据拟合;
步骤S402、对m个数据拟合,确定拟合公式;
步骤S403、根据拟合公式计算得到补足数据,并作为实时响应中缺失的响应时段t补足值。
6.根据权利要求3所述的虚拟电厂基线数据的数据补足方法,其特征在于,在所述S201中,所述工作日用电负荷历史数据的获取方式为:对工作日历史数据进行数据清洗过滤异常数据,并对清洗后的工作日历史数据进行归一化处理,并将归一化后的数据储存作为训练所述第一补足方法的数据基础;
所述异常数据为明显超出正常用电负荷值的数据;将某一时刻异常数据清洗后,将该时刻前一时刻用电负荷值与该时刻后一时刻的用电负荷值取平均操作作为该时刻异常数据的替代值。
7.根据权利要求4所述的虚拟电厂基线数据的数据补足方法,其特征在于,在所述S301-所述S303中,n为5、10、20中的一种。
8.根据权利要求6所述的虚拟电厂基线数据的数据补足方法,其特征在于,
所述归一化处理采用线性函数,具体公式为:
其中,x为原始数据,
xmax为原始数据最大值,
xmin为原始数据最小值,
xnorm为归一化后的数据。
9.根据权利要求5所述的虚拟电厂基线数据的数据补足方法,其特征在于,在所述S401中,将实时响应中缺失的响应时段设为t,则获取前m天的t时刻用电负荷数据。
10.一种虚拟电厂基线数据的数据补足系统,使用如权利要求1-9任一项所述的一种虚拟电厂基线数据的数据补足方法,其特征在于,包括如下模块:
缺失数据类型判断模块,用于对于缺失的数据类型进行判断分类;
工作日响应基线用电负荷数据补足模块,与所述缺失数据类型判断模块连接,用于采用第一补足方法,对工作日响应基线缺失数据补足;
周六日或是法定节假日响应基线用电负荷数据补足模块,与所述缺失数据类型判断模块连接,用于采用第二补足方法,对周六日或法定节假日响应基线缺失数据补足;
实时响应基线用电负荷数据补足模块,与所述缺失数据类型判断模块连接,用于采用第三补足方法,对实时响应基线缺失数据补足。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310924197.7A CN116860738A (zh) | 2023-07-26 | 2023-07-26 | 虚拟电厂基线数据的数据补足方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310924197.7A CN116860738A (zh) | 2023-07-26 | 2023-07-26 | 虚拟电厂基线数据的数据补足方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116860738A true CN116860738A (zh) | 2023-10-10 |
Family
ID=88226806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310924197.7A Pending CN116860738A (zh) | 2023-07-26 | 2023-07-26 | 虚拟电厂基线数据的数据补足方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116860738A (zh) |
-
2023
- 2023-07-26 CN CN202310924197.7A patent/CN116860738A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111105065A (zh) | 一种基于机器学习的农村供水系统及供水方法 | |
CN107220353A (zh) | 一种智能客服机器人满意度自动评价方法及系统 | |
CN105740975A (zh) | 一种基于数据关联关系的设备缺陷评估与预测方法 | |
CN110807550A (zh) | 基于神经网络的配变重过载识别预警方法及终端设备 | |
CN109118012A (zh) | 一种工业动态多维度能耗成本预测方法、系统、存储介质和终端 | |
CN109840633B (zh) | 光伏输出功率预测方法、系统和存储介质 | |
CN109615124B (zh) | 一种基于深度学习的scada主站负荷预测方法 | |
CN111008726B (zh) | 一种电力负荷预测中类图片转换方法 | |
CN116307291B (zh) | 一种基于小波分解的分布式光伏发电预测方法及预测终端 | |
CN116227637A (zh) | 一种面向有源配电网的精细化负荷预测方法和系统 | |
CN114792156A (zh) | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 | |
CN112308270A (zh) | 一种长期用电负荷预测方法、装置及计算机实现系统 | |
CN114330934A (zh) | 一种模型参数自适应的gru新能源短期发电功率预测方法 | |
CN114936681A (zh) | 一种基于深度学习的碳排放预测方法 | |
CN112787878B (zh) | 一种网络指标的预测方法及电子设备 | |
CN115759365A (zh) | 光伏发电功率的预测方法及相关设备 | |
CN115081597A (zh) | 一种基于机器学习的以电核碳方法、系统、设备和介质 | |
CN111985695A (zh) | 城市综合体用电量预测方法、装置、电子设备及存储介质 | |
CN115238854A (zh) | 一种基于tcn-lstm-am的短期负荷预测方法 | |
CN111624874B (zh) | 用于城市污水处理的泵站集群智能化预测方法及系统、存储介质 | |
CN107134790A (zh) | 一种基于大数据的配电网无功优化控制序列确定方法 | |
CN113151842A (zh) | 风光互补电解水制氢的转化效率的确定方法和确定装置 | |
CN116860738A (zh) | 虚拟电厂基线数据的数据补足方法及系统 | |
CN111080037A (zh) | 一种基于深度神经网络的短期电力负荷预测方法及装置 | |
CN113487062A (zh) | 一种基于周期自动编码器的电力负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |