CN116451060A - 一种新能源出力方式提取方法及装置 - Google Patents

一种新能源出力方式提取方法及装置 Download PDF

Info

Publication number
CN116451060A
CN116451060A CN202310440544.9A CN202310440544A CN116451060A CN 116451060 A CN116451060 A CN 116451060A CN 202310440544 A CN202310440544 A CN 202310440544A CN 116451060 A CN116451060 A CN 116451060A
Authority
CN
China
Prior art keywords
initial
decomposer
frequency domain
time sequence
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310440544.9A
Other languages
English (en)
Inventor
彭虹桥
左郑敏
余浩
孙辉
龚贤夫
荆冰洁
罗澍忻
彭穗
陈鸿琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202310440544.9A priority Critical patent/CN116451060A/zh
Publication of CN116451060A publication Critical patent/CN116451060A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2131Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/2163Partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Probability & Statistics with Applications (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种新能源出力方式提取方法及装置,包括:将实时获取的新能源出力的出力数据作为训练好的编码器和训练好的时域频域分解器的输入,得到出力表征数据;其中,根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,并根据带权重损失函数对初始的编码器和初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器;将出力表征数据进行聚类,得到聚类中心对应的新能源出力方式,将新能源出力方式作为典型方式,对电网进行控制;能够克服新能源出力的高不确定性和时序多变性,能够有效提取新能源出力特征,进而能够提高对电网控制的准确性。

Description

一种新能源出力方式提取方法及装置
技术领域
本发明涉及新能源出力提取的技术领域,尤其涉及一种新能源出力方式提取方法及装置。
背景技术
现有技术常采用启发式方法或者基于聚类对新能源典型出力方式进行刻画。采用启发式方法对新能源典型出力进行刻画,包括使用2年数据范围内的17个时段来捕捉风电、光伏和负荷的变化:每个季节用包含4个时段的一天表示,另一个时段是夏季高峰期;通过选择少量时段来表示一年,从一年中选择若干典型周等。采用基于聚类算法来提取新能源典型出力曲线,包括使用负荷持续曲线和风电持续曲线来形成特征向量,使用k-means来进行聚类以考虑空间相关性。
新能源出力具有一定的随机性、波动性等特征,同时又具有一定的季节变化规律和日内变化规律,对新能源出力进行场景分析并提取典型出力方式,能够为评估电网规划的合理性和运行方案的可行性提出科学指导。然而,新能源出力的高不确定性和时序多变性导致目前仍缺少能够有效提取典型出力方式的方法。
因此,基于经验判断的启发式算法,难以准确表征典型时期,无法应对复杂多变的新能源出力方式;并且,对新能源典型出力进行处理的聚类方法,由于新能源出力的高随机性和波动性,未能有效提取新能源出力特征,使后续聚类算法准确性下降。
发明内容
本发明的目的是针对上述现有技术的不足,提出一种新能源出力方式提取方法及装置,能够克服新能源出力的高不确定性和时序多变性,从而能够提高对电网控制的准确性。
第一方面,本发明提供了一种新能源出力方式提取方法,包括:
将实时获取的新能源出力的出力数据作为训练好的编码器和训练好的时域频域分解器的输入,得到出力表征数据;其中,根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,并根据带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器;
将所述出力表征数据进行聚类,得到聚类中心对应的新能源出力方式,将所述新能源出力方式作为典型方式,对电网进行控制。
本发明采用时域频域分解器对新能源出力的出力数据进行处理,得到的出力表征数据能够有效表征新能源出力在时域和频域上的特征,并根据正样本对和负样本对进行训练,能够减少离线训练产生的额外存储空间的要求的同时,提高编码器和时域频域分解器的泛化能力,从而提高提取新能源出力特征的准确度,能够适应新能源出力根据季节变化而变化的自然规律,进而能够提高对电网控制的准确性。
进一步,所述根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,包括:
构建基于循环神经网络的初始的编码器和基于时序的初始的时域频域分解器;其中,所述初始的时域频域分解器包含初始的时序趋势表征分解器和初始的时序周期表征分解器。
本发明采用基于循环神经网络的编码器能够适应新能源出力根据季节变化而变化的自然规律,采用基于时序的时域频域分解器能够提取时域和频域的特征,基于循环神经网络的编码器结合基于时序的时域频域分解器,能够克服新能源出力的高不确定性和时序多变性,从而提高提取新能源出力特征的准确度,进而能够提高对电网控制的准确性。
进一步,所述初始的时域频域分解器包含初始的时序趋势表征分解器和初始的时序周期表征分解器,具体为:
基于卷积核大小为k的一维卷积层,将构建的自回归趋势分解器作为所述初始的时序趋势表征分解器,以使提取高维空间特征的趋势,并根据离散傅里叶变换组件、可学习傅里叶层和离散傅里叶逆变换组件,构建所述初始的时序周期表征分解器,以使提取所述高维空间特征在频域上的周期特征;其中,k为正整数。
进一步,所述根据离散傅里叶变换组件、可学习傅里叶层和离散傅里叶逆变换组件,构建初始的时序趋势表征分解器,以使提取所述高维空间特征在频域上的周期特征,包括:
根据离散傅里叶变换组件,将所述高维空间特征映射到频域上,得到第一频域表征,根据可学习傅里叶层,将所述第一频域表征进行线性变换,得到第二频域表征,并根据离散傅里叶逆变换组件,将所述第二频域表征映射到时域上,得到周期表征。
进一步,所述根据带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器,包括:
根据所述初始的编码器,将所述历史时序数据映射为高维空间特征,并根据所述高维空间特征,建立所述初始的时域频域分解器的带权重损失函数;
根据所述带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器。
进一步,所述根据所述高维空间特征,建立所述初始的时域频域分解器的带权重损失函数,包括:
根据所述高维空间特征,建立所述初始的时序趋势表征分解器的时域对比损失函数和所述初始的时序趋势表征分解器的频域损失函数;
根据所述时域对比损失函数和所述频域损失函数,建立整体的带权重损失函数,以使对所述初始的编码器和初始的时序趋势表征分解器和初始的时序周期表征分解器进行参数更新。
本发明采用对新能源出力的历史时序数据在时域和频域进行特征提取,并将提取的时域和频域的特征用于模型的参数更新,从而能够自适应新能源出力的历史时序数据进行电网规划,能够准确表征典型时期的特征,从而提高提取新能源出力方式的泛化能力,具有更强的适用性。
进一步,所述根据所述高维空间特征,建立所述初始的时序趋势表征分解器的时域对比损失函数和所述初始的时序趋势表征分解器的频域损失函数,包括:
根据所述高维空间特征,从所述初始的时序趋势表征分解器得到第一频域表征的幅值和相位;
根据所述第一频域表征的幅值和相位分别对应的幅值对比损失函数和相位对比损失函数,构建频域损失函数。
本发明采用由频域表征的幅值和相位来表示频域对比损失函数,能够根据新能源出力的出力数据在频域上的特征,建立损失函数,从而能够有效利用提取的新能源出力的时序特征和周期特征,能够克服新能源出力的高不确定性和时序多变性,从而提高提取新能源出力特征的准确度。
再进一步,所述根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,包括:对初始历史时序数据进行增强,得到的增强历史时序数据,并根据所述增强历史时序数据,建立正样本对和负样本对,以使对所述初始的编码器进行对比训练,具体为:
将同一样本批次中的同一时间戳的增强历史时序数据和对应的初始的历史时序数据作为正样本对,将其余样本定义为负样本对;
将所述正样本对和所述负样本对作为历史时序数据,将所述历史时序数据作为所述初始的编码器的输入,以使对所述初始的编码器进行对比训练。
本发明采用对初始历史时序数据进行增强,能够模拟新能源出力的随机性和波动性,根据增强历史时序数据,将生成的正样本对和负样本对用于模型的对比训练,能够提高模型对具有随机性和波动性的新能源出力的出力数据的泛化能力,从而提取新能源出力特征的准确度。
再进一步,所述对初始历史时序数据进行增强,得到的增强历史时序数据,包括:
根据对第一正态分布进行随机抽样的第一单一随机标量,对所述初始历史时序数据进行缩放,得到增强历史时序数据;或者,
根据对第二正态分布进行随机抽样的第二单一随机标量,对所述初始历史时序数据进行平移,得到增强历史时序数据;或者,
根据对第三正态分布进行随机抽样的高斯噪声,对所述初始历史时序数据的每一个时间步长进行加噪,得到增强历史时序数据。
第二方面,本发明提供了一种新能源出力方式提取装置,包括:
出力表征提取单元,用于将实时获取的新能源出力的出力数据作为训练好的编码器和训练好的时域频域分解器的输入,得到出力表征数据;其中,根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,并根据带权重损失函数对初始的编码器和初始的时域频域分解器的参数进行更新,得到训练好的编码器和时域频域分解器;
聚类单元,用于将所述出力表征数据进行聚类,得到聚类中心对应的新能源出力方式,将所述新能源出力方式作为典型方式,对电网进行控制。
附图说明
图1是本发明实施例提供的新能源出力方式提取方法的流程示意图;
图2是本发明实施例提供的基于LSTM的编码器的结构示意图;
图3是本发明实施例提供的新能源典型出力方式提取的框架示意图;
图4是本发明实施例提供的新能源出力方式提取装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明实施例提供的新能源出力方式提取方法的流程示意图,包括步骤S11~S12,具体为:
步骤S11、将实时获取的新能源出力的出力数据作为训练好的编码器和训练好的时域频域分解器的输入,得到出力表征数据;其中,根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,并根据带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器。
根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,包括:对初始历史时序数据进行增强,得到的增强历史时序数据,并根据所述增强历史时序数据,建立正样本对和负样本对,以使对所述初始的编码器进行对比训练,具体为:将同一样本批次中的同一时间戳的增强历史时序数据和对应的初始的历史时序数据作为正样本对,将其余样本定义为负样本对;将所述正样本对和所述负样本对作为历史时序数据,将所述历史时序数据作为所述初始的编码器的输入,以使对所述初始的编码器进行对比训练。
本发明采用对初始历史时序数据进行增强,能够模拟新能源出力的随机性和波动性,根据增强历史时序数据,将生成的正样本对和负样本对用于模型的对比训练,能够提高模型对具有随机性和波动性的新能源出力的出力数据的泛化能力,从而提取新能源出力特征的准确度。
对初始历史时序数据进行增强,得到的增强历史时序数据,包括:根据对第一正态分布进行随机抽样的第一单一随机标量,对所述初始历史时序数据进行缩放,得到增强历史时序数据;或者,根据对第二正态分布进行随机抽样的第二单一随机标量,对所述初始历史时序数据进行平移,得到增强历史时序数据;或者,根据对第三正态分布进行随机抽样的高斯噪声,对所述初始历史时序数据的每一个时间步长进行加噪,得到增强历史时序数据。
优选地,第一正态分布、第二正态分布与第三正态分布相同,均为
值得说明的是,在第一正态分布、第二正态分布与第三正态分布相同的情况下,对初始历史时序数据进行缩放时,根据一个单一的随机标量值ε进行缩放,该标量值通过从正态分布中抽样得到经过缩放数据增强后,时间序列的时间戳表示为对初始历史时序数据进行位移时,根据一个单一的随机标量值ε进行平移,该标量值通过从正态分布中抽样得到/>经过移位数据增强后,时间序列的时间戳表示为/>对初始历史时序数据进行加噪时,对于时间序列的每一个时间步长加入随机高斯噪声/>经过加噪数据增强后,时间序列的时间戳表示为
基于新能源的初始历史时序数据,根据预设的输入时间步长构建数据集。并随机采样一种数据增强方法对初始历史时序数据进行操作,得到对应的增强历史时序数据。将初始历史时序数据与同一时间戳的增强历史时序数据定义为正样本对,而与同样本批次中的其他样本定义为负样本对,根据正样本对和负样本对对包含初始的编码器模型和初始的时域频域分解器进行对比训练;其中,所述初始的时域频域分解器包含初始的时序趋势表征分解器和初始的时序周期表征分解器。
具体地,构建基于循环神经网络的初始的编码器和基于时序的初始的时域频域分解器;其中,所述初始的时域频域分解器包含初始的时序趋势表征分解器和初始的时序周期表征分解器。
优选地,构建基于长短期记忆循环神经网络(Long Short Term MemoryRecurrent Neural Network,LSTM)的初始的编码器。
参见图2,是本发明实施例提供的基于LSTM的编码器的结构示意图。编码器在每个时间步长有三个输入(x(t),h(t―1),c(t―1))和两个输出(h(t),c(t)),其中,x(t)表示输入,c(t)表示LSTM存储的长期状态,h(t)为隐变量。LSTM的输入输出关系可表示为:
其中,Wxi、Wxf、Wxo、Wxg是与x相关的权重矩阵;Whi、Whf、Who、Whg是与h相关的权重矩阵;bi、bf、bo、bg是相应的偏置项;表示矩阵内的元素对应相乘,也即哈达玛积。LSTM通过三个门——遗忘门、输入门和输出门来对其状态进行调控从而实现对长时间跨度的时间序列的学习。对于每一个时间戳,LSTM通过遗忘门去除冗余信息,通过输入门控制输入信息量并通过输出门将必要信息输出。
基于构建的编码器,可以将训练时输入的历史时序数据或者测试时输入的实时的出力数据映射到高维空间上,得到对应的高维空间特征。
示例性地,将输入映射成高维空间特征/>其中,d表示高维表征维度,T为正整数的步长。
基于卷积核大小为k的一维卷积层,将构建的自回归趋势分解器作为所述初始的时序趋势表征分解器,以使提取高维空间特征的趋势,并根据离散傅里叶变换组件、可学习傅里叶层和离散傅里叶逆变换组件,构建所述初始的时序周期表征分解器,以使提取所述高维空间特征在频域上的周期特征;其中,k为正整数。
示例性地,基于卷积核大小为k的一维卷积层,构建自回归趋势分解器来提取高维空间特征V中的趋势分量VT=fT(V),其中,是维度为dT的趋势表征。
优选地,时域对比损失函数可以表示为:
其中,其中qi和ki分别是将初始历史时序数据和对应的增强历史时序数据经编码得到高维空间特征后,将最后一个时间戳经过一个全连接层变换得到的。τ表示超参数温度变量,N表示正样本对的数量,K表示负样本对的数量。
本发明采用基于循环神经网络的编码器能够适应新能源出力根据季节变化而变化的自然规律,采用基于时序的时域频域分解器能够提取时域和频域的特征,基于循环神经网络的编码器结合基于时序的时域频域分解器,能够克服新能源出力的高不确定性和时序多变性,从而提高提取新能源出力特征的准确度,进而能够提高对电网控制的准确性。
根据离散傅里叶变换组件、可学习傅里叶层和离散傅里叶逆变换组件,构建初始的时序趋势表征分解器,以使提取所述高维空间特征在频域上的周期特征,包括:根据离散傅里叶变换组件,将所述高维空间特征映射到频域上,得到第一频域表征,根据可学习傅里叶层,将所述第一频域表征进行线性变换,得到第二频域表征,并根据离散傅里叶逆变换组件,将所述第二频域表征映射到时域上,得到周期表征。
可以理解的是,时序周期分解器由离散傅里叶变换组件可学习傅里叶层和离散傅里叶逆变换组件/>组成。首先,离散傅里叶变换组件将编码器输出的高维空间特征映射到频域,得到第一频域表征,可以表示为/>其中,F是频率的数量,d是输入维度。接着,可学习傅里叶层对每一个频率下的第一频域表征进行线性变换,其输入维度为d,输出维度为周期表征维度dS的第二频域表征。最后,离散傅里叶逆变换组件将第二频域表征映射回时域,得到周期表征/> 其中,dS为周期表征维度,T为正整数的步长。
优选地,根据时序周期分解器得到周期表征的过程可以表示为:
其中,和/>均是可学习傅里叶层的参数,fS(·)为周期分解器模型。
根据带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器,包括:根据所述初始的编码器,将所述历史时序数据映射为高维空间特征,并根据所述高维空间特征,建立所述初始的时域频域分解器的带权重损失函数;根据所述带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器。
其中,根据所述高维空间特征,建立所述初始的时域频域分解器的带权重损失函数,包括:根据所述高维空间特征,建立所述初始的时序趋势表征分解器的时域对比损失函数和所述初始的时序趋势表征分解器的频域损失函数;根据所述时域对比损失函数和所述频域损失函数,建立整体的带权重损失函数,以使对所述初始的编码器和初始的时序趋势表征分解器和初始的时序周期表征分解器进行参数更新。
本发明采用对新能源出力的历史时序数据在时域和频域进行特征提取,并将提取的时域和频域的特征用于模型的参数更新,从而能够自适应新能源出力的历史时序数据进行电网规划,能够准确表征典型时期的特征,从而提高提取新能源出力方式的泛化能力,具有更强的适用性。
根据所述高维空间特征,建立所述初始的时序趋势表征分解器的时域对比损失函数和所述初始的时序趋势表征分解器的频域损失函数,包括:根据所述高维空间特征,从所述初始的时序趋势表征分解器得到第一频域表征的幅值和相位;根据所述第一频域表征的幅值和相位分别对应的幅值对比损失函数和相位对比损失函数,构建频域损失函数。
优选地,第一频域表征的幅值和相位可以分别表示为:
其中,和/>分别对应第一频域表征的虚部和实部。
优选地,幅值对比损失函数和相位对比损失函数可以分别表示为:
其中,表示第j个初始历史时序数据的第i个第一频率表征分量,/>为对应的增强历史时序数据表征。
优选地,频域对比损失可以构建为幅值对比损失/>与相位对比损失/>之和,可以表示为:
优选地,根据时域对比损失与频域对比损失,构建整体的带权重损失函数可以表示为:
其中,α作为超参数权重用于平衡时域和频域的对比损失。
本发明采用由频域表征的幅值和相位来表示频域对比损失函数,能够根据新能源出力的出力数据在频域上的特征,建立损失函数,从而能够有效利用提取的新能源出力的时序特征和周期特征,能够克服新能源出力的高不确定性和时序多变性,从而提高提取新能源出力特征的准确度。
步骤S12、将所述出力表征数据进行聚类,得到聚类中心对应的新能源出力方式,将所述新能源出力方式作为典型方式,对电网进行控制。
具体地,基于构建的对比损失,利用梯度下降更新模型后,可以将新能源的历史时序数据表示为N个时间步长为T的样本表征,将样本表征的最后一个时间戳作为该历史时序数据对应的最终的出力表征数据,可以表示为其中,N为正整数,T为正整数的步长,d是输入维度,VT和VS分别为出力表征数据和对应的周期表征。
优选地,利用k-means++算法对获取的表征进行聚类。
值得说明的是,k-means++算法的核心思想是使初始表征聚类中心之间的距离尽可能远,包括步骤S121~S124,具体为:
步骤S121、设定聚类数为L。
步骤S122、随机选取一个表征向量作为第一个聚类中心
步骤S123、对于剩余的L―1个聚类中心,重复以下步骤S231-S232,直至所有的聚类中心全部产生。
步骤S231、对于每一个表征向量V′i,计算它到所有已选出聚类中心的距离的最小值/>
步骤S232、将d1,d2,…,dn归一化,通过随机模拟以概率S选取对应的表征向量V′i作为新的聚类中心。其中,S的表达式为:
因此,d值较大的表征向量有更高的概率被选为新的聚类中心。
步骤S124、依次选取所有L个聚类中心后通过标准k-means算法对表征向量进行聚类,得到的聚类中心即为新能源典型出力方式。
值得说明的是,表征向量从多条出力表征数据中选取,将得到表征向量进行处理,并根据实时采集的新能源的出力数据对模型进行微调,以保证模型可以学习到最新的时序表征,从而更好地提取新能源典型出力方式,为后续电网规划提供数据支持。
示例性地,根据每次对实时采集的新能源的出力数据经过训练好的编码器和训练好的时域频域分解器输出后,将得到的出力表征数据进行聚类,将得到的处理表征数据和对应的出力数据作为到历史时序数据的一部分进行在线的对比训练,对模型进行微调。
本发明采用时域频域分解器对新能源出力的出力数据进行处理,得到的出力表征数据能够有效表征新能源出力在时域和频域上的特征,并根据聚类算法能够对新能源的典型出力方式进行快速、准确辨识,能够充分考虑新能源出力方式随时间变化的实际情况,通过在线采集数据进行低计算复杂度模型更新,保证方法的实时有效性,从而提高提取新能源出力特征的准确度,能够适应新能源出力根据季节变化而变化的自然规律,进而能够提高对电网控制的准确性,能够为评估电网规划的合理性和运行方案的可行性提出科学指导。
参见图3,是本发明实施例提供的新能源典型出力方式提取的框架示意图。在训练时,对初始历史时序数据进行增强,构建正、负样本对,得到新能源出力的历史时序数据;然后基于循环神经网络,构建编码器将历史时序数据映射到高维空间,并将所述高维空间特征分别作为时序趋势分解器以及时序周期分解器的输入,根据分别对应的时、频域对比损失,建立整体的损失函数对编码器、时序趋势分解器以及时序周期分解器进行参数更新,得到训练好的模型;在测试时或者直接使用时,将实时采集的新能源的出力数据作为训练好的模型的输入,得到新能源的出力表征数据,并对出力表征数据采用kmeans++聚类,以聚类中心所对应的新能源出力方式作为典型方式,以使对电网进行控制。
参见图4,是本发明实施例提供的新能源出力方式提取装置的结构示意图,包括:出力表征提取单元41和聚类单元42,具体为:
出力表征提取单元41,用于将实时获取的新能源出力的出力数据作为训练好的编码器和训练好的时域频域分解器的输入,得到出力表征数据;其中,根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,并根据带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器。
具体地,构建基于循环神经网络的初始的编码器和基于时序的初始的时域频域分解器;其中,所述初始的时域频域分解器包含初始的时序趋势表征分解器和初始的时序周期表征分解器。基于卷积核大小为k的一维卷积层,将构建的自回归趋势分解器作为所述初始的时序趋势表征分解器,以使提取高维空间特征的趋势,并根据离散傅里叶变换组件、可学习傅里叶层和离散傅里叶逆变换组件,构建所述初始的时序周期表征分解器,以使提取所述高维空间特征在频域上的周期特征;其中,k为正整数。
本发明采用基于循环神经网络的编码器能够适应新能源出力根据季节变化而变化的自然规律,采用基于时序的时域频域分解器能够提取时域和频域的特征,基于循环神经网络的编码器结合基于时序的时域频域分解器,能够克服新能源出力的高不确定性和时序多变性,从而提高提取新能源出力特征的准确度,进而能够提高对电网控制的准确性,为评估电网规划的合理性和运行方案的可行性提出科学指导。
根据离散傅里叶变换组件、可学习傅里叶层和离散傅里叶逆变换组件,构建初始的时序趋势表征分解器,以使提取所述高维空间特征在频域上的周期特征,包括:根据离散傅里叶变换组件,将所述高维空间特征映射到频域上,得到第一频域表征,根据可学习傅里叶层,将所述第一频域表征进行线性变换,得到第二频域表征,并根据离散傅里叶逆变换组件,将所述第二频域表征映射到时域上,得到周期表征。
根据带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器,包括:根据所述初始的编码器,将所述历史时序数据映射为高维空间特征,并根据所述高维空间特征,建立所述初始的时域频域分解器的带权重损失函数;根据所述带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器。
其中,根据所述高维空间特征,建立所述初始的时域频域分解器的带权重损失函数,包括:根据所述高维空间特征,建立所述初始的时序趋势表征分解器的时域对比损失函数和所述初始的时序趋势表征分解器的频域损失函数;根据所述时域对比损失函数和所述频域损失函数,建立整体的带权重损失函数,以使对所述初始的编码器和初始的时序趋势表征分解器和初始的时序周期表征分解器进行参数更新。
本发明采用对新能源出力的历史时序数据在时域和频域进行特征提取,并将提取的时域和频域的特征用于模型的参数更新,从而能够自适应新能源出力的历史时序数据进行电网规划,能够准确表征典型时期的特征,从而提高提取新能源出力方式的泛化能力,具有更强的适用性。
根据所述高维空间特征,建立所述初始的时序趋势表征分解器的时域对比损失函数和所述初始的时序趋势表征分解器的频域损失函数,包括:根据所述高维空间特征,从所述初始的时序趋势表征分解器得到第一频域表征的幅值和相位;根据所述第一频域表征的幅值和相位分别对应的幅值对比损失函数和相位对比损失函数,构建频域损失函数。
本发明采用由频域表征的幅值和相位来表示频域对比损失函数,能够根据新能源出力的出力数据在频域上的特征,建立损失函数,从而能够有效利用提取的新能源出力的时序特征和周期特征,能够克服新能源出力的高不确定性和时序多变性,从而提高提取新能源出力特征的准确度。
根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,包括:对初始历史时序数据进行增强,得到的增强历史时序数据,并根据所述增强历史时序数据,建立正样本对和负样本对,以使对所述初始的编码器进行对比训练,具体为:将同一样本批次中的同一时间戳的增强历史时序数据和对应的初始的历史时序数据作为正样本对,将其余样本定义为负样本对;将所述正样本对和所述负样本对作为历史时序数据,将所述历史时序数据作为所述初始的编码器的输入,以使对所述初始的编码器进行对比训练。
本发明采用对初始历史时序数据进行增强,能够模拟新能源出力的随机性和波动性,根据增强历史时序数据,将生成的正样本对和负样本对用于模型的对比训练,能够提高模型对具有随机性和波动性的新能源出力的出力数据的泛化能力,从而提取新能源出力特征的准确度。
对初始历史时序数据进行增强,得到的增强历史时序数据,包括:根据对第一正态分布进行随机抽样的第一单一随机标量,对所述初始历史时序数据进行缩放,得到增强历史时序数据;或者,根据对第二正态分布进行随机抽样的第二单一随机标量,对所述初始历史时序数据进行平移,得到增强历史时序数据;或者,根据对第三正态分布进行随机抽样的高斯噪声,对所述初始历史时序数据的每一个时间步长进行加噪,得到增强历史时序数据。
值得说明的是,出力表征提取单元41主要是在训练时,根据划分的正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,并根据带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器;在测试或者使用时,根据实时获取的新能源出力的出力数据作为训练好的编码器和训练好的时域频域分解器的输入,得到出力表征数据,并将获取到的出力表征数据传输给聚类单元42进行聚类。
聚类单元42,用于将所述出力表征数据进行聚类,得到聚类中心对应的新能源出力方式,将所述新能源出力方式作为典型方式,对电网进行控制。
值得说明的是,聚类单元42接收出力表征提取单元41传输的出力表征数据,根据出力表征数据进行聚类,得到聚类中心对应的新能源出力方式,将所述新能源出力方式作为典型方式,对电网进行控制。
值得说明的是,将程序写入出力表征提取单元41和聚类单元42当中,利用实时采集的新能源的出力数据和对应的新能源出力方式对模型进行微调,即进行在线训练,能够保证模型可以学习到最新的时序表征,从而更好地提取新能源典型出力方式,为后续电网规划提供数据支持。
本发明采用时域频域分解器对新能源出力的出力数据进行处理,得到的出力表征数据能够有效表征新能源出力在时域和频域上的特征,并根据正样本对和负样本对进行训练,能够减少离线训练产生的额外存储空间的要求的同时,提高编码器和时域频域分解器的泛化能力,从而提高提取新能源出力特征的准确度,能够适应新能源出力根据季节变化而变化的自然规律,进而能够提高对电网控制的准确性,为评估电网规划的合理性和运行方案的可行性提出科学指导。
本领域内的技术人员应明白,本申请的实施例还可提供包括计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种新能源出力方式提取方法,其特征在于,包括:
将实时获取的新能源出力的出力数据作为训练好的编码器和训练好的时域频域分解器的输入,得到出力表征数据;其中,根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,并根据带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器;
将所述出力表征数据进行聚类,得到聚类中心对应的新能源出力方式,将所述新能源出力方式作为典型方式,对电网进行控制。
2.如权利要求1所述的新能源出力方式提取方法,其特征在于,所述根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,包括:
构建基于循环神经网络的初始的编码器和基于时序的初始的时域频域分解器;其中,所述初始的时域频域分解器包含初始的时序趋势表征分解器和初始的时序周期表征分解器。
3.如权利要求2所述的新能源出力方式提取方法,其特征在于,所述初始的时域频域分解器包含初始的时序趋势表征分解器和初始的时序周期表征分解器,具体为:
基于卷积核大小为k的一维卷积层,将构建的自回归趋势分解器作为所述初始的时序趋势表征分解器,以使提取高维空间特征的趋势,并根据离散傅里叶变换组件、可学习傅里叶层和离散傅里叶逆变换组件,构建所述初始的时序周期表征分解器,以使提取所述高维空间特征在频域上的周期特征;其中,k为正整数。
4.如权利要求3所述的新能源出力方式提取方法,其特征在于,所述根据离散傅里叶变换组件、可学习傅里叶层和离散傅里叶逆变换组件,构建初始的时序趋势表征分解器,以使提取所述高维空间特征在频域上的周期特征,包括:
根据离散傅里叶变换组件,将所述高维空间特征映射到频域上,得到第一频域表征,根据可学习傅里叶层,将所述第一频域表征进行线性变换,得到第二频域表征,并根据离散傅里叶逆变换组件,将所述第二频域表征映射到时域上,得到周期表征。
5.如权利要求1所述的新能源出力方式提取方法,其特征在于,所述根据带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器,包括:
根据所述初始的编码器,将所述历史时序数据映射为高维空间特征,并根据所述高维空间特征,建立所述初始的时域频域分解器的带权重损失函数;
根据所述带权重损失函数对所述初始的编码器和所述初始的时域频域分解器的参数进行更新,得到训练好的编码器和训练好的时域频域分解器。
6.如权利要求5所述的新能源出力方式提取方法,其特征在于,所述根据所述高维空间特征,建立所述初始的时域频域分解器的带权重损失函数,包括:
根据所述高维空间特征,建立所述初始的时序趋势表征分解器的时域对比损失函数和所述初始的时序趋势表征分解器的频域损失函数;
根据所述时域对比损失函数和所述频域损失函数,建立整体的带权重损失函数,以使对所述初始的编码器和初始的时序趋势表征分解器和初始的时序周期表征分解器进行参数更新。
7.如权利要求6所述的新能源出力方式提取方法,其特征在于,所述根据所述高维空间特征,建立所述初始的时序趋势表征分解器的时域对比损失函数和所述初始的时序趋势表征分解器的频域损失函数,包括:
根据所述高维空间特征,从所述初始的时序趋势表征分解器得到第一频域表征的幅值和相位;
根据所述第一频域表征的幅值和相位分别对应的幅值对比损失函数和相位对比损失函数,构建频域损失函数。
8.如权利要求1所述的新能源出力方式提取方法,其特征在于,所述根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,包括:对初始历史时序数据进行增强,得到的增强历史时序数据,并根据所述增强历史时序数据,建立正样本对和负样本对,以使对所述初始的编码器进行对比训练,具体为:
将同一样本批次中的同一时间戳的增强历史时序数据和对应的初始的历史时序数据作为正样本对,将其余样本定义为负样本对;
将所述正样本对和所述负样本对作为历史时序数据,将所述历史时序数据作为所述初始的编码器的输入,以使对所述初始的编码器进行对比训练。
9.如权利要求8所述的新能源出力方式提取方法,其特征在于,所述对初始历史时序数据进行增强,得到的增强历史时序数据,包括:
根据对第一正态分布进行随机抽样的第一单一随机标量,对所述初始历史时序数据进行缩放,得到增强历史时序数据;或者,
根据对第二正态分布进行随机抽样的第二单一随机标量,对所述初始历史时序数据进行平移,得到增强历史时序数据;或者,
根据对第三正态分布进行随机抽样的高斯噪声,对所述初始历史时序数据的每一个时间步长进行加噪,得到增强历史时序数据。
10.一种新能源出力方式提取装置,其特征在于,包括:
出力表征提取单元,用于将实时获取的新能源出力的出力数据作为训练好的编码器和训练好的时域频域分解器的输入,得到出力表征数据;其中,根据包含正样本对和负样本对的历史时序数据,对初始的编码器和初始的时域频域分解器进行对比训练,并根据带权重损失函数对初始的编码器和初始的时域频域分解器的参数进行更新,得到训练好的编码器和时域频域分解器;
聚类单元,用于将所述出力表征数据进行聚类,得到聚类中心对应的新能源出力方式,将所述新能源出力方式作为典型方式,对电网进行控制。
CN202310440544.9A 2023-04-23 2023-04-23 一种新能源出力方式提取方法及装置 Pending CN116451060A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310440544.9A CN116451060A (zh) 2023-04-23 2023-04-23 一种新能源出力方式提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310440544.9A CN116451060A (zh) 2023-04-23 2023-04-23 一种新能源出力方式提取方法及装置

Publications (1)

Publication Number Publication Date
CN116451060A true CN116451060A (zh) 2023-07-18

Family

ID=87125337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310440544.9A Pending CN116451060A (zh) 2023-04-23 2023-04-23 一种新能源出力方式提取方法及装置

Country Status (1)

Country Link
CN (1) CN116451060A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056709A (zh) * 2023-10-11 2023-11-14 腾讯科技(深圳)有限公司 时序预测模型的训练方法、装置和存储介质及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056709A (zh) * 2023-10-11 2023-11-14 腾讯科技(深圳)有限公司 时序预测模型的训练方法、装置和存储介质及电子设备

Similar Documents

Publication Publication Date Title
Han et al. Enhanced deep networks for short-term and medium-term load forecasting
Bao et al. Correntropy-based evolving fuzzy neural system
KR20190005217A (ko) 신경망을 이용한 주파수 기반 오디오 분석
CN108229718A (zh) 一种信息预测方法及装置
Wan et al. Day-ahead prediction of wind speed with deep feature learning
Yu et al. Error correction method based on data transformational GM (1, 1) and application on tax forecasting
CN108229659A (zh) 基于深度学习的钢琴单键音识别方法
Tanaka et al. Reservoir computing with diverse timescales for prediction of multiscale dynamics
CN116451060A (zh) 一种新能源出力方式提取方法及装置
Von Krannichfeldt et al. Online ensemble approach for probabilistic wind power forecasting
CN114626585A (zh) 一种基于生成对抗网络的城市轨道交通短时客流预测方法
Wu et al. Numerical solutions of wavelet neural networks for fractional differential equations
Joshi et al. Improving classification accuracy using ensemble learning technique (using different decision trees)
Yucheng et al. Incremental learning method of least squares support vector machine
Yang et al. Recursive least mean p-power extreme learning machine
Zhou et al. A two-stage method for ultra-short-term pv power forecasting based on data-driven
Waheeb et al. Forecasting the behavior of gas furnace multivariate time series using ridge polynomial based neural network models
CN116628442A (zh) 一种基于人工神经网络的地下水储量变化空间降尺度方法
Fernandes et al. Enhanced deep hierarchal GRU & BILSTM using data augmentation and spatial features for tamil emotional speech recognition
CN115392594A (zh) 一种基于神经网络和特征筛选的用电负荷模型训练方法
CN106899295A (zh) 一种随机量化信号解码方法及系统
Chen et al. A new adaptive multiple modelling approach for non-linear and non-stationary systems
Dudukcu et al. Comprehensive comparison of lstm variations for the prediction of chaotic time series
Timoshenkova et al. About Influence of Weight Initialization Algorithms on Accuracy of the Forecast with LSTM-net for Harmonic Signals
Bolos et al. Adjusting the errors of the GM (1, 2) grey model in the financial data series using an adaptive fuzzy controller

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination