CN115409258A - 一种混合深度学习短期辐照度预测方法 - Google Patents

一种混合深度学习短期辐照度预测方法 Download PDF

Info

Publication number
CN115409258A
CN115409258A CN202211027097.6A CN202211027097A CN115409258A CN 115409258 A CN115409258 A CN 115409258A CN 202211027097 A CN202211027097 A CN 202211027097A CN 115409258 A CN115409258 A CN 115409258A
Authority
CN
China
Prior art keywords
irradiance
data
information
input
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211027097.6A
Other languages
English (en)
Inventor
谢利萍
童俊龙
张晗津
张侃健
魏海坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202211027097.6A priority Critical patent/CN115409258A/zh
Publication of CN115409258A publication Critical patent/CN115409258A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/22The renewable source being solar energy
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Power Engineering (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种混合深度学习短期辐照度预测方法,属于光伏发电技术领域。预测方法包括:S1,训练数据获取,获取目标地区历史辐照度数据及其对应的气象数据;S2,数据预处理,包括气象信息特征编码以及数据归一化;S3,利用分解算法获取辐照度子序列;S4,获取当前参数下的编码解码器模型在历史时刻的辐照度预测误差,此过程中不更新模型;将获取的预测误差与原始数据进行信息融合,基于当前时刻的监督信息更新模型;S5,预测,将辐照度子序列和气象数据输入误差补偿框架,利用误差补偿机制,在预测辐照度的同时降低预测误差。本发明结合了数据平稳分解、深度学习模型、误差补偿,从数据处理、模型优化、误差处理三个角度提升辐照度预测精度。

Description

一种混合深度学习短期辐照度预测方法
技术领域
本发明涉及一种混合深度学习短期辐照度预测方法技术,属于光伏发电技术领域。
背景技术
太阳能资源是最有前景的可再生能源,国际可再生能源机构的一项调查显示,截至2020年,全球电力生产的29%来自可再生能源,其中可再生能源发电部分太阳能占比26.77%,并逐年上升。然而,由于辐照度的不确定性和间歇性,光伏发电呈现相当的不稳定性,这增加了光伏发电的并网以及调度难度,制约了太阳能资源的广泛应用。
目前已经有多种基于深度学习的辐照度预测方法,如利用LSTM和CNN等模型进行辐照度预测。一些学者致力于RNN模型和CNN模型的混合预测方法研究,如LSTM-CNN组合预测模型。然而,CNN模型更善于提取空间特征,对时间依赖性特征的提取能力有限;RNN模型能够保持时序依赖,但难以处理长输入序列。上述特点表示基于RNN和CNN的深度学习模型难以兼顾长序列输入和长期依赖,模型有待改进。此外,由于辐照度具有非线性和非平稳性,单一的深度学习模型难以准确预测辐照度的变化。深度学习预测方法通过融合数据端和误差端的模型仍存在提升空间。
发明内容
技术问题:
本发明要解决的技术问题是:由于辐照度具有非线性和非平稳性,单一深度学习预测模型难以取得令人满意的预测效果;此外,现有的基于RNN和CNN的深度学习模型难以兼顾长序列输入和长期依赖,从而导致预测模型难以充分利用历史信息进行辐照度预测,使得预测步长变大后模型精度难以保证;最后,机器学习模型预测辐照度是对真实分布的逼近,而机器学习模型在逼近过程中难免会产生误差,这种误差在该机器学习模型下难以消除,从而导致预测结果中仍然存在可以被预测的成分。
为解决上述技术问题,本发明提供了一种混合深度学习短期辐照度预测方法,该方法从数据处理、模型优化、误差处理三个角度融合模型。通过多模型融合提升预测效果。
技术方案:
本发明提供了一种混合深度学习短期辐照度预测方法,该方法包括如下步骤:
S1,训练数据获取,获取目标地区历史辐照度数据及其对应的气象数据,并根据预测任务制作监督数据集;
S2,数据预处理,包括气象信息特征编码以及数据归一化,具体包含以下内容:
S3,辐照度序列分解,利用自适应噪声完备集合经验模态分解(CEEMDAN)算法将辐照度序列分解为若干子序列,使得分解后子序列的非平稳性和非线性降低;
S4,基于误差补偿框架更新编码解码器模型;
S5,预测,将历史数据输入步骤S4中的误差补偿框架以及训练得到的机器学习模型,预测未来多步的太阳辐照度。
进一步地,所述步骤S1包括以下内容:
(1.1)获取目标地区历史辐照度数据及其对应的气象数据(包括但不限于温度,湿度,气压,风速等);
(1.2)若历史数据某一片段缺失或者不合法,则利用前后相邻数据的均值代替,确保数据的连续性和真实性,以保证训练数据的质量;
(1.3)匹配监督信息以制作监督数据集,通过读取当前时段t0~tN的辐照度作为监督信息,匹配历史辐照度与对应的气象信息作为输入信息,制作监督数据集。
进一步地,所述步骤S2具体包含以下内容:
(2.1)对辐照度对应的气象信息进行编码,利用one-hot编码方式对天气类型进行编码,对数值型的信息采用数值本身作为编码值;
(2.2)为保证训练过程中模型梯度变化合理,需要对输入数据进行归一化操作,归一化公式入下:
Figure BDA0003816207950000021
其中,a表示数据集中的特征,a′表示归一化后的特征值,amax和amin分别表示历史数据中该特征的最大值和最小值。
进一步地,所述步骤S3中的信号分解算法详细步骤如下:
(3.1)输入的辐照度序列I(t)加入不同的高斯白噪声得多种含噪声的序列:Ii(t)=I(t)+ε·wi(t),i=1,…,K,其中ε为噪声的标准差,wi(t)为不同的白噪声,K加入不同噪声数量;
(3.2)第1个分解模态IMF1可以表示为:
Figure BDA0003816207950000022
其中
Figure BDA0003816207950000023
表示加入第i个噪声的序列的经验模态分解值,Ej(·)表示经验模态分解算子产生的第j个分量;
(3.3)计算残差rk(t)=rk-1(t)-IMFk(t);其中初试条件r0(t)=I(t);
(3.4)其余模态
Figure BDA0003816207950000031
进一步地,步骤S4中的误差补偿框架特点如下:
(4.1)该框架是一个端到端的太阳辐照度预测框架;在输入历史辐照度和历史气象数据后,该框架能够自动运行并输出多步长的预测结果,同时在该框架内部自动实现误差信息的利用,无需其他操作;
(4.2)误差获取阶段,该框架仅利用编码解码模型获取误差信息,此过程不更新模型参数;误差补偿阶段利用误差信息动态更新模型;
(4.3)该框架在不改变编码解码器模型结构的前提下,能够有效降低辐照度预测误差。
进一步地,误差补偿框架的详细步骤如下:
(1)滑动窗口获取子序列:
该框架首先接收T-2K到T-1时刻的数据作为输入,并从T-2K时刻开始,按滑动窗口形式划分为K个子序列,滑动步长为1;
得到K个子序列分别为{(IT-2k,…,IT-K-1),…,(It-K+1,…,It),…,(IT-K-1,…,IT-2)},其中It表示t时刻的太阳辐照度;
(2)滚动获取误差信息:
对于子序列(It-K,…,It-1),其对应的外界气象信息为(Mt-K,…,Mt-1),在当前参数下的编码解码器模型的输入为{(It-K,…,It-1),(Mt-K,…,Mt-1)},其预测值为
Figure BDA0003816207950000032
其对应的监督信息可以表示为(It,…,It+N),其中N表示预测的步长;根据预测值和监督信息可以得到模型在当前时刻的预测误差Et=[et,…,et+N];
循环输入上述K个子序列,并通过监督信息获取当前参数下的编码解码器模型在当前时刻的预测误差;该循环过程可以得到误差序列(ET-K,…,ET-1);
并且,此过程不更新模型参数;
(3)信息融合:
此阶段将误差序列(ET-K,…,ET-1)与历史辐照度与气象数据进行融合,得到新的特征输入{(ET-K,…,ET-1),(IT-K,…,IT-1),(MT-K,…,MT-1)},其监督信息为(IT,…,IT+N);
信息融合后的输入特征增加了当前模型对历史上对应时刻的预测误差信息,该信息由模型内部预测机制决定,将该信息反馈至编码解码器模型;
(4)更新模型:
利用步骤(3)的输入特征和监督信息更新模型参数。
进一步地,步骤S4中的编码解码器的结构如下:
训练编码解码器模型,利用读取当前时段t0~tN的辐照度作为监督信息,以及t0时刻之前的历史辐照度和气象信息作为输入数据,训练编码解码器模型;进一步地,S4中所述编码解码器包括以下内容:
编码器由时间卷积网络(TCN)和长短期记忆网络(LSTM)的级联结构组成,由TCN负责获取长序列输入并保持时序依赖关系,压缩后的短序列经过LSTM保持时序依赖;编码器结构首先通过若干层TCN接收长序列输入(层数取决于输入序列的长度),其次TCN提取的特征序列压缩输出到LSTM,最终LSTM的输出作为编码器的编码输出;
解码器由长短期记忆网络LSTM和多层感知机MLP的串联结构组成,串联长度由预测步长决定;并通过损失函数平衡多步输出的性能;解码器首先接收编码器的输出,由LSTM负责解码,解码后输出到MLP,其中MLP用于与输出维度匹配。
进一步地,编码解码器的特点如下:
1)编码器由TCN和LSTM级联构成;TCN接收长序列输入,多层提取特征后得到输出序列,截取序列后段作为LSTM的输入;
2)解码器由LSTM和MLP级联构成;LSTM接收编码器状态,MLP用于LSTM输出的维度匹配;
3)TCN的每一层由TCN残差块构成,TCN残差块包含一个串联模块和残差连接;该串联模块由两组相同的空洞因果卷积层,权重归一化层,ReLu激活单元以及丢弃层构成;
4)通过设计损失函数,平衡多步长输出的预测性能,其中损失函数设计如下:
Figure BDA0003816207950000041
其中K表示预测的步长数,lossi表示第i个步长的输出损失,αi表示lossi的权重,w表示模型的参数,β表示正则化系数。
进一步地,编码解码器中TCN和LSTM包含:
1、时间卷积操作可以通过下式表述:
Figure BDA0003816207950000042
其中*表示卷积操作,d表示空洞系数,χ表示输入序列,s表示序列的一个元素,f表示卷积核,k表示卷积核的大小,s-d·i表示空洞卷积选择的元素;
2、TCN残差块:
O1=dropout(ReLU(Norm(F(s)))),
O2=dropout(ReLU(Norm(O1))),
Otcn=s+O2
其中Norm表示权重归一化,ReLU表示激活函数,dropout表示丢弃层;Otcn表示TCN残差块的输出,即TCN每一层的输出;
3、LSTM神经网络模型包括:
遗忘门ft
ft=sigmoid(Wifxt+bif+Whfht-1+bhf),
输入门it
it=sigmoid(Wiixt+bii+Whiht-1+bhi),
激活函数gt
gt=tanh(Wiixt+bii+Whiht-1+bhi),
输出门ot
ot=sigmoid(Wioxt+bio+Whoht-1+bho),
当前时刻对应记忆单元的状态ct
Figure BDA0003816207950000051
LSTM单元输出状态ht
Figure BDA0003816207950000052
其中Wif和bif分别表示遗忘门外部输入的权重矩阵和偏置矩阵,Whf和bhf分别表示遗忘门隐藏状态输入的权重矩阵和偏置矩阵,Wii和bii分别表示输入门外部输入的权重矩阵和偏置矩阵,Whi和bhi分别表示输入门隐藏状态输入的权重矩阵和偏置矩阵,Wio和bio分别表示输出门外部输入的权重矩阵和偏置矩阵,Who和bho分别表示输出门隐藏状态输入的权重矩阵和偏置矩阵,ft、it以及ot分别为遗忘门、输入门和输出门在时刻t的输出,ht为时刻t的隐藏状态。
有益效果:
本发明中的信号分解部分能够有效降低辐照度序列的非线性和非平稳性,从而有效提升辐照度序列中可预测成分。
本发明中的编码器部分,利用TCN具备长感受野的特点以获取长序列输入,经过TCN输出后截取短序列输入LSTM,使得LSTM在短序列输入的情况下获取到更长的历史信息;编码器具备长序列输入和保持时间特征时序依赖性的能力,更适用于时间序列的特征提取;解码器结构能够保证模型依次输出多个预测步长,并且通过损失函数平衡多步长输出的预测性能。在仅依赖历史信息的前提下,本发明的编码解码器结构能够获得高精度的辐照度预测效果。
本发明的误差补偿框架能够在不改变机器学习模型结构的前提下,通过利用当前参数下的模型对历史临近时刻的预测误差作为额外的输入特征,有效降低辐照度预测误差;此外,本发明中的误差补偿框架是一个通用的范式,该框架可以用于不同类型的机器学习预测模型,对不同的机器学习预测模型,均能有效利用误差信息,依据误差信息动态更新模型;此外,该框架仅通过一个端到端的结构同时完成辐照度预测和误差补偿。
附图说明
图1为本发明的辐照度预测流程的示意图;
图2为本发明的信号分解算法流程图;
图3为本发明的编码解码器的结构图;
图4为本发明的编码解码器内部TCN的示意图;
图5为本发明的编码解码器内部LSTM的示意图。
具体实施方式
为了更清楚地说明本发明中的技术方案,以下结合附图对本发明进行描述。所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例1
参考图1,一种基于编码解码器的深度学习多步长辐照度预测方法,包括下述步骤:
S1,训练数据获取,获取目标地区历史辐照度数据及其对应的气象数据并制作监督数据集,进一步地,S1包括以下内容:
(1.1)获取目标地区历史辐照度数据及其对应的气象数据,本实施例中选取温度T,湿度H,气压P,风速W等作为气象数据;
(1.2)若历史数据某一片段缺失或者不合法,则利用前后相邻数据的均值代替,确保数据的连续性和真实性,以保证训练数据的质量;
(1.3)匹配监督信息以制作监督数据集,通过读取当前时段t0~tN的辐照度x0~xN作为多步长预测的监督信息,匹配历史辐照度与对应的气象信息作为输入信息,制作监督数据集;例如:选取当前时刻的前24个时刻作为历史信息输入模型,预测未来6个时刻的辐照度,则数据集可以表示为([x-24,T-24,W-24,P-24,H-24,…,x-1,T-1,W-1,P-1,H-1];[x0,…,x5]),其中[x0,…,x5]为监督信息,[x-t,T-t,W-t,P-t,H-t]表示当前时刻之前t个时刻的辐照度和气象信息。
S2,数据预处理,包括气象信息特征编码以及数据归一化,具体包含以下内容:
(2.1)对辐照度对应的气象信息进行编码,利用one-hot编码方式对天气类型进行编码,对数值型的信息采用数值本身作为编码值;
(2.2)为保证训练过程中模型梯度变化合理,需要对输入数据进行归一化操作,归一化公式入下:
Figure BDA0003816207950000071
其中a表示数据集中的特征,a′表示归一化后的特征值,amax和amin分别表示历史数据中该特征的最大值和最小值;本实施例中需要归一化的特征为历史辐照度信息和历史气象信息,其中历史气象信息包括温度,湿度,风速和气压。
S3,辐照度序列分解:
利用自适应噪声完备集合经验模态分解(CEEMDAN)算法将辐照度序列分解为若干子序列,使得分解后子序列的非平稳性和非线性降低。
S4,基于误差补偿框架更新编码解码器模型,误差补偿框架示意图见附图1,其内容包括:
(4.1)获取当前参数对应的编码解码器模型在时刻T-K到T-1的辐照度预测误差,此过程中不更新模型;其中每个时刻的预测误差均使用该时刻之前的K个时刻的数据作为模型输入而获得;
(4.2)将时刻T-K到T-1的预测误差序列与外界气象数据序列进行信息融合,并用于更新模型;
S5,预测,将历史数据输入步骤S4中的误差补偿框架以及训练得到的编码解码器模型,预测未来多步的太阳辐照度。
进一步地,所述步骤S3中的信号分解算法流程图见附图2,其算法步骤如下:
(3.1)输入的辐照度序列I(t)加入不同的高斯白噪声得多种含噪声的序列:Ii(t)=I(t)+ε·wi(t),i=1,…,K,其中ε为噪声的标准差,wi(t)为不同的白噪声,K加入不同噪声数量;
(3.2)第1个分解模态IMF1可以表示为:
Figure BDA0003816207950000072
其中
Figure BDA0003816207950000073
表示加入第i个噪声的序列的经验模态分解值,Ej(·)表示经验模态分解算子产生的第j个分量;
(3.3)计算残差rk(t)=rk-1(t)-IMFk(t);其中初试条件r0(t)=I(t);
(3.4)其余模态
Figure BDA0003816207950000074
进一步地,所述步骤S4中的误差补偿框架特点如下:
(4.1)该框架是一个端到端的太阳辐照度预测框架;在输入历史辐照度和历史气象数据后,该框架能够自动运行并输出多步长的预测结果,同时在该框架内部自动实现误差信息的利用,无需其他操作;
(4.2)误差获取阶段,该框架仅利用编码解码器模型获取误差信息,此过程不更新模型参数;误差补偿阶段利用误差信息动态更新模型;
(4.3)该框架在不改变编码解码器模型结构的前提下,能够有效降低辐照度预测误差。
进一步地,在本实施例中,所述步骤S1中数据集制作方式如下:
本实施例选取时刻t的前24个时刻的辐照度历史信息以及气象数据的历史信息作为模型的输入,预测未来6个时刻的辐照度,则预测模型数据集的输入数据可以表示为如下形式,{(It-24,…,It-1),(Tt-24,…,Tt-1),(Wt-24,…,Wt-1),(Pt-24,…,Pt-1),(Ht-24,…,Ht-1)},数据集的的监督信息可以表示为(I0,…,I5),其中[It-m,Tt-m,Wt-m,Pt-m,Ht-m]表示时刻t的前m个时刻的辐照度和气象信息;
此外,为满足误差补偿框架的工作机制,数据集中需要加入误差信息;对于当前时刻T,其误差信息来源于S4的误差补偿框架;其他时刻表示误差获取阶段,此过程中缺乏误差信息,为了保证模型输入形式一致,本实施例引入为零的误差序列;实际效果等同于,在误差获取过程中忽略编码解码器模型的补偿功能。
进一步地,所述步骤S4中的误差补偿框架的详细步骤如下:
(1)滑动窗口获取子序列:
该框架首先接收T-48到T-1时刻的数据作为输入,并从T-48时刻开始,按滑动窗口形式划分为24个子序列,滑动步长为1;
得到24个子序列分别为{(IT-48,…,IT-25),…,(It-23,…,It),…,(IT-25,…,IT-2)},其中It表示t时刻的太阳辐照度;
(2)滚动获取误差信息:
对于子序列(It-24,…,It-1),其对应的外界气象信息为(Mt-24,…,Mt-1),本实施例中外界气象信息M包括温度T,湿度H,气压P和风速W,可以表示为(Tt-24,…,Tt-1),(Wt-24,…,Wt-1),(Pt-24,…,Pt-1),(Ht-24,…,Ht-1);
在当前参数下的编码解码器模型的输入为{(It-24,…,It-1),(Mt-24,…,Mt-1)},其输出为预测值
Figure BDA0003816207950000081
其对应的监督信息可以表示为(It,…,It+5),其中N表示预测的步长;根据预测值和监督信息可以得到模型在当前时刻的预测误差Et=[et,…,et+5];
循环输入上述24个子序列,并通过监督信息获取当前参数下的编码解码器模型在当前时刻的预测误差;该循环过程可以得到误差序列(ET-24,…,ET-1);
并且,此过程不更新编码解码器的模型参数;
(3)信息融合:
此阶段将误差序列(ET-24,…,ET-1)与历史辐照度与气象数据进行融合,得到新的特征输入{(ET-24,…,ET-1),(IT-24,…,IT-1),(MT-24,…,MT-1)},其监督信息为(IT,…,IT+5);
信息融合后的输入特征增加了当前模型对历史上对应时刻的预测误差信息,该信息由模型内部预测机制决定,将该信息反馈至编码解码器模型;
(4)更新模型:
利用步骤(3)的输入特征和监督信息更新编码解码器模型参数。
进一步地,编码解码器模型结构如下:
编码器由时间卷积网络(TCN)和长短期记忆网络(LSTM)的级联结构组成,由TC块负责获取长序列输入并保持时序依赖关系,压缩后的短序列经过LSTM保持时序依赖关系;编码器结构首先通过若干层TCN接收长序列输入(层数取决于输入序列的长度),其次TCN提取的特征序列压缩输出到LSTM(这里LSTM仅选择TCN层的部分输出作为输入),最终LSTM的输出作为编码器的编码输出;
解码器由长短期记忆网络LSTM和多层感知机MLP的串联结构组成,串联长度由预测步长决定;并通过损失函数平衡多步输出的性能;解码器首先接收编码器的输出,由LSTM负责解码,解码后输出到MLP,其中MLP用于与输出维度匹配。
进一步地,所述步骤S4中编码解码器见附图3,其特点如下:
1)编码器由TCN和LSTM级联构成;TCN接收长序列输入,多层提取特征后得到输出序列,截取序列后段作为LSTM的输入;
2)解码器由LSTM和MLP级联构成;LSTM接收编码器状态,MLP用于LSTM输出的维度匹配;
3)如图4所示,TCN残差块由两个串联模块以及残差连接构成;其中每个串联模块包含空洞因果卷积层,权重归一化层,ReLu激活单元以及丢弃层;
4)通过设计损失函数,平衡多步长输出的预测性能,其中损失函数设计如下:
Figure BDA0003816207950000091
其中K表示预测的步长数,lossi表示第i个步长的输出损失,αi表示lossi的权重,w表示模型的参数,β表示正则化系数;在本实施例中将不同时刻的输出视为同等重要,因此权重系数αi取值相同。
进一步地,所述步骤S4中TCN和LSTM结构如图5,具体包含:
1、时间卷积操作可以通过下式表述:
Figure BDA0003816207950000092
其中*表示卷积操作,d表示空洞系数,χ表示输入序列,s表示序列的一个元素,f表示卷积核,k表示卷积核的大小,s-d·i表示空洞卷积选择的元素;
2、TCN残差块:
O1=dropout(ReLU(Norm(F(s)))),
O2=dropout(ReLU(Norm(O1))),
Otcn=s+O2
其中Norm表示权重归一化,ReLU表示激活函数,dropout表示丢弃层;Otcn表示TCN残差块的输出,即TCN每一层的输出;
3、LSTM神经网络模型包括:
遗忘门,用于丢弃不重要的信息;在忘记阶段遗忘门的输出ft由sigmoid激活函数计算,由激活函数的输出值决定是否丢弃前一个时刻的信息,遗忘门的计算公式如下:
ft=sigmoid(Wifxt+bif+Whfht-1+bhf),
输入门和激活函数共同完成记忆选择,二者进行矩阵乘法决定哪些值保存到当前状态;
输入门it的计算公式如下:
it=sigmoid(Wiixt+bii+Whiht-1+bhi),
激活函数gt的计算公式如下:
gt=tanh(Wiixt+bii+Whiht-1+bhi),
当前时刻对应记忆单元的状态ct由输入门和遗忘门共同决定,遗忘门与上一时刻状态的矩阵乘法表示丢弃某些不需要的信息,输入门和激活函数的矩阵乘法表示保存重要信息,其计算公式如下:
Figure BDA0003816207950000101
输出门ot
ot=sigmoid(Wioxt+bio+Whoht-1+bho),
输出门决定当前时刻记忆单元状态的输出值,由此得到LSTM单元的输出状态ht,其计算公式如下所示:
Figure BDA0003816207950000102
其中Wif和bif分别表示遗忘门外部输入的权重矩阵和偏置矩阵,Whf和bhf分别表示遗忘门隐藏状态输入的权重矩阵和偏置矩阵,Wii和bii分别表示输入门外部输入的权重矩阵和偏置矩阵,Whi和bhi分别表示输入门隐藏状态输入的权重矩阵和偏置矩阵,Wio和bio分别表示输出门外部输入的权重矩阵和偏置矩阵,Who和bho分别表示输出门隐藏状态输入的权重矩阵和偏置矩阵,ft、it以及ot分别为遗忘门、输入门和输出门在时刻t的输出,ht为时刻t的隐藏状态。

Claims (9)

1.一种混合深度学习短期辐照度预测方法,其特征在于,包括如下步骤:
S1,训练数据获取,获取目标地区历史辐照度数据及其对应的气象数据,并根据预测任务制作监督数据集;
S2,数据预处理,包括气象信息特征编码以及数据归一化;
S3,辐照度序列分解,利用自适应噪声完备集合经验模态分解CEEMDAN算法将辐照度序列分解为若干子序列,使得分解后子序列的非平稳性和非线性降低;
S4,基于误差补偿框架更新编码解码器模型;
S5,预测,将历史数据输入步骤S4中的误差补偿框架以及训练得到的机器学习模型,预测未来多步的太阳辐照度。
2.根据权利要求1所述的预测方法,其特征在于,所述步骤S1包括以下内容:
(1.1)获取目标地区历史辐照度数据及其对应的气象数据,包括但不限于温度,湿度,气压,风速;
(1.2)若历史数据某一片段缺失或者不合法,则利用前后相邻数据的均值代替,确保数据的连续性和真实性,以保证训练数据的质量;
(1.3)匹配监督信息以制作监督数据集,通过读取当前时段t0~tN的辐照度作为监督信息,匹配历史辐照度与对应的气象信息作为输入信息,制作监督数据集。
3.根据权利要求1所述的预测方法,其特征在于,所述步骤S2具体包含以下内容:
(2.1)对辐照度对应的气象信息进行编码,利用one-hot编码方式对天气类型进行编码,对数值型的信息采用数值本身作为编码值;
(2.2)为保证训练过程中模型梯度变化合理,对输入数据进行归一化操作,归一化公式入下:
Figure FDA0003816207940000011
其中,a表示数据集中的特征,a′表示归一化后的特征值,amax和amin分别表示历史数据中该特征的最大值和最小值。
4.根据权利要求1所述的预测方法,其特征在于,所述步骤S3中的信号分解算法详细步骤如下:
(3.1)输入的辐照度序列I(t)加入不同的高斯白噪声得多种含噪声的序列:Ii(t)=I(t)+ε·wi(t),i=1,...,K,其中ε为噪声的标准差,wi(t)为不同的白噪声,K加入不同噪声数量;
(3.2)第1个分解模态IMF1表示为:
Figure FDA0003816207940000012
其中
Figure FDA0003816207940000013
表示加入第i个噪声的序列的经验模态分解值,Ej(·)表示经验模态分解算子产生的第j个分量;
(3.3)计算残差rk(t)=rk-1(t)-IMFk(t);其中初试条件r0(t)=I(t);
(3.4)其余模态
Figure FDA0003816207940000021
5.根据权利要求1所述的预测方法,其特征在于,步骤S4中的误差补偿框架特点如下:
(4.1)该框架是一个端到端的太阳辐照度预测框架;在输入历史辐照度和历史气象数据后,该框架能够自动运行并输出多步长的预测结果,同时在该框架内部自动实现误差信息的利用,无需其他操作;
(4.2)误差获取阶段,该框架仅利用编码解码模型获取误差信息,此过程不更新模型参数;误差补偿阶段利用误差信息动态更新模型;
(4.3)该框架在不改变编码解码器模型结构的前提下,能够有效降低辐照度预测误差。
6.根据权利要求5所述的预测方法,其特征在于,误差补偿框架的详细步骤如下:
(1)滑动窗口获取子序列:
该框架首先接收T-2K到T-1时刻的数据作为输入,并从T-2K时刻开始,按滑动窗口形式划分为K个子序列,滑动步长为1;
得到K个子序列分别为{(IT-2k,...,IT-K-1),...,(It-K+1,...,It),...,(IT-K-1,...,IT-2)},其中It表示t时刻的太阳辐照度;
(2)滚动获取误差信息:
对于子序列(It-K,...,It-1),其对应的外界气象信息为(Mt-K,...,Mt-1),在当前参数下的编码解码器模型的输入为{(It-K,...,It-1),(Mt-K,...,Mt-1)},其预测值为
Figure FDA0003816207940000022
其对应的监督信息表示为(It,...,It+N),其中N表示预测的步长;根据预测值和监督信息得到模型在当前时刻的预测误差Et=[et,...,et+N];
循环输入上述K个子序列,并通过监督信息获取当前参数下的编码解码器模型在当前时刻的预测误差;该循环过程得到误差序列(ET-K,...,ET-1);
并且,此过程不更新模型参数;
(3)信息融合:
此阶段将误差序列(ET-K,...,ET-1)与历史辐照度与气象数据进行融合,得到新的特征输入{(ET-K,...,ET-1),(IT-K,...,IT-1),(MT-K,...,MT-1)},其监督信息为(IT,...,IT+N);
信息融合后的输入特征增加了当前模型对历史上对应时刻的预测误差信息,该信息由模型内部预测机制决定,将该信息反馈至编码解码器模型;
(4)更新模型:
利用步骤(3)的输入特征和监督信息更新模型参数。
7.根据权利要求1所述的预测方法,其特征在于,步骤S4中的编码解码器的结构如下:
训练编码解码器模型,利用读取当前时段t0~tN的辐照度作为监督信息,以及t0时刻之前的历史辐照度和气象信息作为输入数据,训练编码解码器模型;进一步地,S4中所述编码解码器包括以下内容:
编码器由时间卷积网络TCN和长短期记忆网络LSTM的级联结构组成,由TCN负责获取长序列输入并保持时序依赖关系,压缩后的短序列经过LSTM保持时序依赖;编码器结构首先通过若干层TCN接收长序列输入,其中层数取决于输入序列的长度,其次TCN的提取的特征序列压缩输出到LSTM,最终LSTM的输出作为编码器的编码输出;
解码器由级联的长短期记忆网络LSTM和多层感知机MLP的串联结构组成,串联长度由预测步长决定;并通过损失函数平衡多步输出的性能;解码器首先接收编码器的输出,由LSTM负责解码,解码后输出到MLP,其中MLP用于与输出维度匹配。
8.根据权利要求7所述的预测方法,其特征在于,编码解码器的特点如下:
1)编码器由TCN和LSTM级联构成;TCN接收长序列输入,多层提取特征后得到输出序列,截取序列后段作为LSTM的输入;
2)解码器的LSTM和MLP级联构成;LSTM接收编码器状态,MLP用于LSTM输出的维度匹配;
3)TCN的每一层由TCN残差块构成,TCN残差块包含一个串联模块和残差连接;该串联模块由两组相同的空洞因果卷积层,权重归一化层,ReLu激活单元以及丢弃层构成;
4)通过设计损失函数,平衡多步长输出的预测性能,其中损失函数设计如下:
Figure FDA0003816207940000031
其中K表示预测的步长数,lossi表示第i个步长的输出损失,αi表示lossi的权重,w表示模型的参数,β表示正则化系数。
9.根据权利要求7所述的预测方法,其特征在于,编码解码器中TCN和LSTM包含:
1、时间卷积操作通过下式表述:
Figure FDA0003816207940000032
其中*表示卷积操作,d表示空洞系数,χ表示输入序列,s表示序列的一个元素,f表示卷积核,k表示卷积核的大小,s-d·i表示空洞卷积选择的元素;
2、TCN残差块:
O1=dropout(ReLU(Norm(F(s)))),
O2=dropout(ReLU(Norm(O1))),
Otcn=s+O2
其中Norm表示权重归一化,ReLU表示激活函数,dropout表示丢弃层;Otcn表示TCN残差块的输出,即TCN每一层的输出;
3、LSTM包括:
遗忘门ft
ft=sigmoid(Wifxt+bif+Whfht-1+bhf),
输入门it
it=sigmoid(Wiixt+bii+Whiht-1+bhi),
激活函数gt
gt=tanh(Wiixt+bii+Whiht-1+bhi),
输出门ot
ot=sigmoid(Wioxt+bio+Whoht-1+bho),
当前时刻对应记忆单元的状态ct
Figure FDA0003816207940000041
LSTM单元输出状态ht
Figure FDA0003816207940000042
其中Wif和bif分别表示遗忘门外部输入的权重矩阵和偏置矩阵,Whf和bhf分别表示遗忘门隐藏状态输入的权重矩阵和偏置矩阵,Wii和bii分别表示输入门外部输入的权重矩阵和偏置矩阵,Whi和bhi分别表示输入门隐藏状态输入的权重矩阵和偏置矩阵,Wio和bio分别表示输出门外部输入的权重矩阵和偏置矩阵,Who和bho分别表示输出门隐藏状态输入的权重矩阵和偏置矩阵,ft、it以及ot分别为遗忘门、输入门和输出门在时刻t的输出,ht为时刻t的隐藏状态。
CN202211027097.6A 2022-08-25 2022-08-25 一种混合深度学习短期辐照度预测方法 Pending CN115409258A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211027097.6A CN115409258A (zh) 2022-08-25 2022-08-25 一种混合深度学习短期辐照度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211027097.6A CN115409258A (zh) 2022-08-25 2022-08-25 一种混合深度学习短期辐照度预测方法

Publications (1)

Publication Number Publication Date
CN115409258A true CN115409258A (zh) 2022-11-29

Family

ID=84161274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211027097.6A Pending CN115409258A (zh) 2022-08-25 2022-08-25 一种混合深度学习短期辐照度预测方法

Country Status (1)

Country Link
CN (1) CN115409258A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115865129A (zh) * 2022-12-01 2023-03-28 电子科技大学 一种基于去噪自编码器的窄带干扰智能消除方法
CN116167465A (zh) * 2023-04-23 2023-05-26 杭州经纬信息技术股份有限公司 基于多变量时间序列集成学习的太阳辐照度预测方法
CN117151303A (zh) * 2023-09-12 2023-12-01 河海大学 一种基于混合模型的超短期太阳辐照度预测方法及系统
CN117151303B (zh) * 2023-09-12 2024-05-31 河海大学 一种基于混合模型的超短期太阳辐照度预测方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115865129A (zh) * 2022-12-01 2023-03-28 电子科技大学 一种基于去噪自编码器的窄带干扰智能消除方法
CN115865129B (zh) * 2022-12-01 2024-03-29 电子科技大学 一种基于去噪自编码器的窄带干扰智能消除方法
CN116167465A (zh) * 2023-04-23 2023-05-26 杭州经纬信息技术股份有限公司 基于多变量时间序列集成学习的太阳辐照度预测方法
CN117151303A (zh) * 2023-09-12 2023-12-01 河海大学 一种基于混合模型的超短期太阳辐照度预测方法及系统
CN117151303B (zh) * 2023-09-12 2024-05-31 河海大学 一种基于混合模型的超短期太阳辐照度预测方法及系统

Similar Documents

Publication Publication Date Title
Zhang et al. Long short-term memory network based on neighborhood gates for processing complex causality in wind speed prediction
CN111008728B (zh) 一种用于分布式光伏发电系统短期出力的预测方法
CN115409258A (zh) 一种混合深度学习短期辐照度预测方法
CN110222901A (zh) 一种基于深度学习的Bi-LSTM的电负荷预测方法
CN114781744A (zh) 基于编码解码器的深度学习多步长辐照度预测方法
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN111832825A (zh) 融合长短期记忆网络和极限学习机的风电预测方法及系统
CN111461463A (zh) 一种基于tcn-bp的短期负荷预测方法、系统及设备
CN113128113A (zh) 一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法
Tong et al. Hourly solar irradiance forecasting based on encoder–decoder model using series decomposition and dynamic error compensation
Paramasivan Deep learning based recurrent neural networks to enhance the performance of wind energy forecasting: A review.
CN116090602A (zh) 一种用电负荷预测方法及系统
CN112508286A (zh) 一种基于Kmeans-BiLSTM-DMD模型的短期负荷预测方法
CN114330934A (zh) 一种模型参数自适应的gru新能源短期发电功率预测方法
CN115828768A (zh) 一种数据驱动的配电网无功功率预测方法
CN117691591A (zh) 一种深度学习多模型的电动汽车充电站短期负荷预测方法
Zhou et al. Short-term wind power prediction based on EMD-LSTM
CN116885699A (zh) 基于双重注意力机制的电力负荷预测方法
CN109447843B (zh) 一种光伏出力预测方法及装置
Naoui et al. Integrating iot devices and deep learning for renewable energy in big data system
CN116502774A (zh) 一种基于时间序列分解和勒让德投影的时间序列预测方法
CN116703644A (zh) 一种基于Attention-RNN的短期电力负荷预测方法
CN115759343A (zh) 一种基于e-lstm的用户电量预测方法和装置
CN115293406A (zh) 基于CatBoost和Radam-LSTM的光伏发电功率预测方法
Xu et al. NWP feature selection and GCN-based ultra-short-term wind farm cluster power forecasting method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination