CN114723147A - 基于改进的小波变换与神经网络的新能源功率预测方法 - Google Patents

基于改进的小波变换与神经网络的新能源功率预测方法 Download PDF

Info

Publication number
CN114723147A
CN114723147A CN202210387225.1A CN202210387225A CN114723147A CN 114723147 A CN114723147 A CN 114723147A CN 202210387225 A CN202210387225 A CN 202210387225A CN 114723147 A CN114723147 A CN 114723147A
Authority
CN
China
Prior art keywords
target
meteorological data
initial
meteorological
data samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210387225.1A
Other languages
English (en)
Inventor
陈元峰
马溪原
姚森敬
李鹏
张子昊
程凯
周悦
陈炎森
周长城
李卓环
包涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Power Grid Digital Grid Research Institute Co Ltd
Original Assignee
Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Power Grid Digital Grid Research Institute Co Ltd filed Critical Southern Power Grid Digital Grid Research Institute Co Ltd
Priority to CN202210387225.1A priority Critical patent/CN114723147A/zh
Publication of CN114723147A publication Critical patent/CN114723147A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/148Wavelet transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)

Abstract

本申请涉及一种基于改进的小波变换与神经网络的新能源功率预测方法。所述方法包括:获取多组气象数据样本和历史发电功率,确定每种变量类型下的气象数值样本与历史发电功率之间的相关度,得到与每个相关度阈值对应的初始变量类型,根据初始变量类型对应的第一训练精度,确定出目标阈值和目标变量类型,对多组气象数据样本进行聚类处理,得到每组气象数据样本所属的第一目标类别,对历史发电功率进行小波分解,采用目标气象样本和每个信号频率下的功率信号样本对多种初始功率预测模型进行训练,确定出与每种第一目标类别对应的功率预测模型。采用本方法能够遍历多个相关度阈值,对多种初始功率预测模型集成学习,从而提高功率预测模型的准确率。

Description

基于改进的小波变换与神经网络的新能源功率预测方法
技术领域
本申请涉及新能源发电技术领域,特别是涉及一种基于改进的小波变换与神经网络的新能源功率预测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
新能源发电技术是一种将太阳能光伏、风能、沼气、地热或潮汐等新能源转化为电能的技术。然而经大量研究发现,采用风能或太阳能光伏等新能源进行发电时容易受气象因素影响,从而导致新能源的发电功率存在随机性、波动性的变化。因此,为了保障新能源电力系统的能源安全供应,急需针对新能源发电功率开展高精度预测。
传统技术中,可以通过获取历史气象数据和历史功率数据,采用历史气象数据和历史功率数据对神经网络模型进行训练。将实时的气象数据输入至训练后的神经网络模型,以生成未来时间下新能源发电的预测功率数据。但是,随着新能源功率的预测精度的进一步提高,目前亟需一种准确率更高的新能源功率的预测方法。
发明内容
基于此,有必要针对上述技术问题,提供一种准确率高的基于改进的小波变换与神经网络的新能源功率预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种基于改进的小波变换与神经网络的新能源功率预测方法。
所述方法包括:
获取多组气象数据样本,以及与每组所述气象数据样本对应的历史发电功率,每组所述气象数据样本中包括多种变量类型下的气象数值样本;
确定多组所述气象数据样本中,每种所述变量类型下的多个气象数值样本与多个所述历史发电功率之间的相关度;
根据所述相关度和多个相关度阈值,从多种所述变量类型下确定出与每个所述相关度阈值对应的初始变量类型,根据所述初始变量类型对应的第一训练精度,从多个所述相关度阈值中确定出目标阈值,以及与所述目标阈值对应的目标变量类型,所述第一训练精度是采用所述初始变量类型下的气象数值样本对初始功率预测模型进行训练得到的;
对多组所述气象数据样本进行聚类处理,得到每组所述气象数据样本所属的第一目标类别;
对于每种所述第一目标类别下的所述气象数据样本,执行以下处理:
对与每组所述气象数据样本对应的所述历史发电功率进行小波分解处理,得到多个信号频率下的功率信号样本;
采用每组所述气象数据样本中所述目标变量类型下的目标气象样本和每个所述信号频率下的所述功率信号样本对多种所述初始功率预测模型进行训练,从训练后的多种所述初始功率预测模型中,确定出与每种所述第一目标类别下的所述气象数据样本对应的功率预测模型,所述功率预测模型后续用于生成与所述第一目标类别下的气象数据对应的发电功率。
在其中一个实施例中,所述采用每组所述气象数据样本中所述目标变量类型下的目标气象样本和每个所述信号频率下的所述功率信号样本对多种所述初始功率预测模型进行训练,从训练后的多种所述初始功率预测模型中,确定出与每种所述第一目标类别下的所述气象数据样本对应的功率预测模型,包括:
采用每组所述气象数据样本中的所述目标气象样本和每个所述信号频率下的所述功率信号样本对每种所述初始功率预测模型进行训练,得到每种所述初始功率预测模型生成的与每个所述信号频率对应的目标功率信号;
根据所述目标功率信号,生成每种所述初始功率预测模型对应的第二训练精度;
根据所述第二训练精度,从训练后的多种所述初始功率预测模型中确定出与每种第一所述目标类别下的所述气象数据样本对应的所述功率预测模型。
在其中一个实施例中,所述根据所述初始变量类型对应的第一训练精度,从多个所述相关度阈值中确定出目标阈值,以及与所述目标阈值对应的目标变量类型,包括:
采用每个所述相关度阈值对应的初始变量类型下的气象数值样本对所述初始功率预测模型进行训练,得到与每个所述相关度阈值对应的初始变量类型下的所述气象数值样本对应的初始功率预测模型的第一训练精度;
根据所述第一训练精度,从多个所述相关度阈值中确定出所述目标阈值,将所述目标阈值对应的初始变量类型作为所述目标变量类型。
在其中一个实施例中,所述对多组所述气象数据样本进行聚类处理,得到每组所述气象数据样本所属的第一目标类别,包括:
确定每组所述气象数据样本对应的初始聚类特征;
对所述初始聚类特征进行归一化处理,得到每组所述气象数据样本对应的目标聚类特征;
根据所述目标聚类特征与每个类别对应的类别特征,确定每组所述气象数据样本所属的所述第一目标类别。
在其中一个实施例中,所述根据所述目标聚类特征与每个类别对应的类别特征,确定每组所述气象数据样本所属的所述第一目标类别,包括:
采用多个初始聚类数量分别对多组所述气象数据样本进行聚类处理,得到每个所述初始聚类数量下的所述气象数据样本的初始类别;
根据两两气象数据样本之间目标聚类特征的差异度,生成与所述初始聚类数量对应的评价参数;
根据所述评价参数,从多个所述初始聚类数量确定出目标聚类数量,将所述目标聚类数量下所述气象数据样本对应的所述初始类别作为所述第一目标类别。
在其中一个实施例中,在所述功率预测模型的应用阶段,所述方法还包括:
获取待预测气象数据,所述待预测气象数据中包括多种变量类型下的气象数值;
对所述待预测气象数据和多组所述气象数据样本进行聚类处理,确定所述待预测气象数据所属的第二目标类别;
从多种所述变量类型下的气象数值中,确定出与所述目标阈值对应的所述目标变量类型下的气象数值,将所述目标变量类型下的所述气象数值输入至与所述第二目标类别对应的功率预测模型,得到发电功率。
第二方面,本申请还提供了一种基于改进的小波变换与神经网络的新能源功率预测装置。所述装置包括:
数据样本获取模块,用于获取多组气象数据样本,以及与每组所述气象数据样本对应的历史发电功率,每组所述气象数据样本中包括多种变量类型下的气象数值样本;
相关度确定模块,用于确定多组所述气象数据样本中,每种所述变量类型下的多个气象数值样本与多个所述历史发电功率之间的相关度;
变量类型确定模块,用于根据所述相关度和多个相关度阈值,从多种所述变量类型下确定出与每个所述相关度阈值对应的初始变量类型,根据所述初始变量类型对应的第一训练精度,从多个所述相关度阈值中确定出目标阈值,以及与所述目标阈值对应的目标变量类型,所述第一训练精度是采用所述初始变量类型下的气象数值样本对初始功率预测模型进行训练得到的;
第一类别确定模块,用于对多组所述气象数据样本进行聚类处理,得到每组所述气象数据样本所属的第一目标类别;
小波分解模块,用于对于每种所述第一目标类别下的气象数据样本,执行以下处理:对与每组所述气象数据样本对应的所述历史发电功率进行小波分解处理,得到多个信号频率下的功率信号样本;
模型训练模块,用于采用每组所述气象数据样本中所述目标变量类型下的目标气象样本和每个所述信号频率下的所述功率信号样本对多种所述初始功率预测模型进行训练,从训练后的多种所述初始功率预测模型中,确定出与每种所述第一目标类别下的所述气象数据样本对应的功率预测模型,所述功率预测模型后续用于生成与所述第一目标类别下的气象数据对应的发电功率。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项实施例所述的基于改进的小波变换与神经网络的新能源功率预测方法。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一项实施例所述的基于改进的小波变换与神经网络的新能源功率预测方法。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面任一项实施例所述的基于改进的小波变换与神经网络的新能源功率预测方法。
上述基于改进的小波变换与神经网络的新能源功率预测方法、装置、计算机设备、存储介质和计算机程序产品,通过获取多组气象数据样本,以及与每组气象数据样本对应的历史发电功率,确定多组气象数据样本中,每种变量类型下的多个气象数值样本与多个历史发电功率之间的相关度,根据相关度和多个相关度阈值,从多种变量类型下确定出与每个相关度阈值对应的初始变量类型,根据初始变量类型对应的第一训练精度,从多个相关度阈值中确定出目标阈值,以及与目标阈值对应的目标变量类型,对多组气象数据样本进行聚类处理,得到每组气象数据样本所属的第一目标类别,对于每种第一目标类别下的气象数据样本,执行以下处理:对与每组气象数据样本对应的历史发电功率进行小波分解处理,得到多个信号频率下的功率信号样本;采用每组气象数据样本中目标变量类型下的目标气象样本和每个信号频率下的功率信号样本对多种初始功率预测模型进行训练,从训练后的多种初始功率预测模型中,确定出与每种第一目标类别下的气象数据样本对应的功率预测模型,能够遍历多个相关度阈值,获取与每个相关度阈值对应的初始变量类型,采用初始变量类型下的气象数值样本对初始功率检测模型进行训练,根据训练得到的第一训练精度从多个相关度阈值中确定出目标阈值,以提高模型输入数据的准确率,从而提高功率预测模型的准确率。同时,采用本申请提供的基于改进的小波变换与神经网络的新能源功率预测方法,能够针对每种第一目标类别下的气象数据样本分别采用目标变量类型下的目标气象样本对多种初始功率预测模型进行训练,对多种初始功率预测模型进行集成学习,将预测精度最高的初始功率预测模型作为功率预测模型,以提高功率预测模型的预测精度。
附图说明
图1为一个实施例中基于改进的小波变换与神经网络的新能源功率预测方法的流程示意图;
图2为一个实施例中功率预测模型的确定步骤的流程示意图;
图3为一个实施例中聚类特征生成步骤的流程示意图;
图4为一个实施例中第一目标类别确定步骤的流程示意图;
图4a为一个实施例中第一聚类评价参数确定步骤的示意图;
图4b为一个实施例中第二聚类评价参数确定步骤的示意图;
图5为一个实施例中发电功率生成步骤的流程示意图;
图6为另一个实施例中基于改进的小波变换与神经网络的新能源功率预测方法的流程示意图;
图7为一个实施例中基于改进的小波变换与神经网络的新能源功率预测装置的结构框图;
图8为一个实施例中计算机设备的内部结构图;
图9为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种基于改进的小波变换与神经网络的新能源功率预测方法,该方法应用于计算机设备中,该计算机设备可以是服务器,也可以是终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本实施例中,该方法包括以下步骤:
步骤S102,获取多组气象数据样本,以及与每组气象数据样本对应的历史发电功率。
其中,气象数据样本可以用于表征曾经在目标采集区域下采集到的历史气象数据。一个示例中,一组气象数据样本可以包括一个采集周期内多个采集时刻下得到的气象数值样本。其中,采集周期可以但不仅限于为一天,一周或一个月等时间周期中的任一种。
每组气象数据样本中可以包括多种变量类型下的气象数值样本。气象数值样本的变量类型可以但不仅限于包括风速类型、辐照度类型、温度类型、湿度类型和气压类型等类型中的任一种。气象数值样本可以但不仅限于为风速类型下的风速样本、辐照度类型下的辐照度样本、温度类型下的温度样本、湿度类型下的湿度样本和气压类型下的气压样本等数据样本中的任一种或多种。
历史发电功率可以用于表征曾经在目标区域下采集到的新能源发电功率。一个示例中,历史发电功率可以是对风电场的风力发电功率进行预测得到的。另一个示例中,历史发电功率可以是对光伏电站的太阳能发电功率进行预测得到的。历史发电功率与气象数值样本的采集时刻具有对应关系,例如,针对目标区域,在一个采集时刻下得到的多个气象数值样本对应一个历史发电功率。
具体地,计算机设备响应于功率预测模型的训练请求,获取多组气象数据样本,以及与每组气象数据样本对应的历史发电功率。其中,功率预测模型的训练请求可以是用户手动触发的,例如用户在界面上点击相应的模型训练按键,触发功率预测模型的训练请求;也可以是计算机设备自动触发的,例如计算机设备检测到存在气象数据样本时,自动触发功率预测模型的训练请求。一个示例中,一组气象数据样本中可以包括同一天内T1时刻采集到的第一温度样本、第一湿度样本、第一气压样本和第一辐照度样本,T2时刻采集到的第二温度样本、第二湿度样本、第二气压样本和第二辐照度样本,以及T3时刻采集到的第三温度样本、第三湿度样本、第三气压样本和第三辐照度样本。与该组气象数据样本对应的发电功率可以包括T1时刻对应的第一历史发电功率,T2时刻对应的第二历史发电功率以及T3时刻对应的第三历史发电功率。
步骤S104,确定多组气象数据样本中,每种变量类型下的多个气象数值样本与多个历史发电功率之间的相关度。
具体地,计算机设备分别获取多组气象数据样本中,与每种变量类型对应的多个气象数值样本。对每种变量类型下的多个气象数值样本与多个气象数值样本对应的历史发电功率进行运算处理,得到每种变量类型下的气象数值样本与历史发电功率之间的相关度。一个示例中,计算机设备获取了两组气象数据样本,以及与每组气象数据样本对应的历史发电功率。每组气象数据样本中包括风速类型下的风速样本和温度类型下的温度样本。对两组气象数据样本中的风速样本和每组气象数据样本对应的历史发电功率进行运算处理,得到风速类型下的风速样本与历史发电功率之间的第一相关度。对两组气象数据样本中的温度样本和每组气象数据样本对应的历史发电功率进行运算处理,得到温度类型下的温度样本与历史发电功率之间的第二相关度。
步骤S106,根据相关度和多个相关度阈值,从多种变量类型下确定出与每个相关度阈值对应的初始变量类型,根据初始变量类型对应的第一训练精度,从多个相关度阈值中确定出目标阈值。
其中,第一训练精度可以用于表征采用多组气象数据样本中初始变量类型下的气象数值样本作为输入数据对初始功率预测模型进行训练后,得到的初始功率预测模型的预测精度。
具体地,计算机设备中预先存储了多个相关度阈值和阈值确定逻辑。分别采用每个相关度阈值对多种变量类型下的气象数值样本对应的相关度进行判断,将相关度大于相关度阈值的变量类型作为与相关度阈值对应的初始变量类型,得到与每个相关度阈值对应的初始变量类型。对与每个相关度阈值对应的初始变量类型,都执行以下操作:采用多组气象数据样本中,与相关度阈值对应的初始变量类型下的气象数值样本作为输入数据,对初始功率预测模型进行训练,得到与相关度阈值对应的初始变量类型下的气象数值样本对应的第一训练精度。将第一训练精度符合阈值确定逻辑的相关度阈值作为目标阈值,将与目标阈值对应的初始变量类型作为目标变量类型。其中,阈值确定逻辑可以是将第一训练精度与精度阈值比较,将第一训练精度大于精度阈值的相关度阈值作为目标阈值;也可以是将多个相关度阈值对应的第一训练精度进行比较,将最大的第一训练精度对应的相关度阈值作为目标阈值。一个示例中,计算机设备得到的湿度类型下的湿度样本与发电功率之间的相关度为0.5,温度类型下的温度样本与发电功率之间的相关度为0.7,辐照度类型下的辐照度样本与发电功率之间的相关度为0.9。将相关度最高的辐照度类型作为目标变量类型。后续采用每组气象数据样本中辐照度类型下的辐照度样本作为训练输入数据,对未训练的初始功率预测模型进行训练。
步骤S108,对多组气象数据样本进行聚类处理,得到每组气象数据样本所属的第一目标类别。
具体地,计算机设备中预先存储有聚类逻辑。采用聚类逻辑对多组气象数据样本进行聚类处理,得到每组气象数据样本所属的第一目标类别。其中,聚类逻辑可以是基于相似日的无监督聚类逻辑,如随机选取若干组气象数据样本作为聚类中心,获取其余组气象数据样本与每个聚类中心之间的距离,将距离小于距离阈值的一组气象数据样本与聚类中心作为同一类别的数据;也可以是将气象数据样本的数值高于第一类别阈值的若干组气象数据样本作为同一类别的数据,将气象数据样本的数值低于第二类别阈值的若干组气象数据样本作为另一类别的数据。一个示例中,当计算机设备获取的气象数据样本为风速样本时,聚类逻辑可以采用风速相似日的无监督聚类逻辑。当计算机设备获取的气象数据样本为辐照度样本时,聚类逻辑可以采用辐照度相似日的无监督聚类逻辑。
步骤S110,采用目标气象样本和每个信号频率下的功率信号样本对多种初始功率预测模型进行训练,得到与每种第一目标类别对应的功率预测模型。
其中,目标气象样本可以用于表征第一目标类别下每组气象数据样本中,目标变量类型下的气象数值样本。一个示例中,计算机设备确定的目标变量类型为风速类型,将每组气象数据样本中风速类型下的气象数值样本作为目标气象样本。
初始功率预测模型可以但不仅限于包括BP神经网络模型(Back Propagation,反向传播模型)、LSTM模型(Long Short-Term Memory,长短期记忆网络模型)、BLSTM模型(Bi-directional Long Short-Term Memory,双向长短期记忆网络模型)、SVM模型(SupportVector Machine支持向量机模型)、GRU模型(Gate Recurrent Unit,门循环单元模型)、MLP模型(Multilayer Perceptron,多层感知机模型)、RF模型(Random Forest,随机森林模型)等模型中的至少一种。
具体地,计算机设备中预先部署了多种未训练的初始功率预测模型。对于每种第一目标类别下的气象数据样本都执行以下操作:对与每组气象数据样本对应的发电功率进行小波分解处理,得到多个信号频率下的功率信号样本。每一层分解的结果是上次分解得到的低频信号再分解成低频和高频两个部分,一个示例中,计算机设备对发电功率进行N层小波分解后发电功率X被分解为:X=D1+D2+...+DN+AN,其中D1,D2,...,DN分别为第一层、第二层到等N层分解得到的高频信号,AN为第N层分解得到的低频信号。
将目标类别下的每组气象数据样本中目标变量类型下的目标气象样本作为训练输入数据,将与每组气象数据样本对应的每个信号频率下的功率小信号样本作为训练标签。计算机设备将目标气象样本输入至每种未训练的初始功率预测模型,得到每种训练后的初始功率预测模型生成的预测发电功率。采用损失函数计算发电功率和每种初始功率预测模型生成的预测发电功率之间的损失值。向损失值变小的方向调整初始功率模型的模型参数,直至满足训练停止条件,得到与目标类别下的气象数据样本对应的多种初始功率预测模型。根据每种初始功率预测模型的预测精度,从训练后的多种初始功率预测模型中确定出与目标类别下的气象数据样本对应的功率预测模型。其中,训练停止条件可以是训练迭代次数达到预设次数,或者损失值达到预设值等中的任一种。
一个示例中,计算机设备中部署的初始功率预测模型包括BP神经网络模型,LSTM模型和SVM模型。在聚类处理后得到了A类别下的多组气象数据样本a和B类别下的多组气象数据样本b。对A类别下的多组气象数据样本a,执行以下操作:将多组气象数据样本a中目标变量类型下的目标气象样本分别输入至BP神经网络模型,LSTM模型和SVM模型,得到BP神经网络模型生成的第一预测发电功率,LSTM模型生成的第二预测发电功率和SVM模型生成的第三预测发电功率。采用BP神经网络模型中的损失函数计算第一预测发电功率和目标气象样本对应的发电功率之间的损失值,向损失值变小的方向调整BP神经网络模型的第一模型参数,直至满足训练停止条件,得到训练后的BP神经网络模型对应的第一预测精度0.8。重复上述模型训练操作,得到训练后的LSTM模型对应的第二预测精度0.6,以及训练后的SVM模型对应的第三预测精度0.7。比较第一预测精度、第二预测精度和第三预测精度,将预测精度最高的BP神经网络模型作为与A类别下的多组气象数据样本a对应的功率预测模型。对B类别下的多组气象数据样本b,重复执行上述操作,将多组气象数据样本b中目标变量类型下的目标气象样本分别输入至BP神经网络模型,LSTM模型和SVM模型,得到采用多组气象数据样本b中目标变量类型下的目标气象样本训练得到的BP神经网络模型对应的第四预测发电功率0.55,LSTM模型对应的第五预测发电功率0.7和SVM模型对应的第六预测发电功率0.63。比较第四预测精度、第五预测精度和第六预测精度,将预测精度最高的LSTM模型作为与B类别下的多组气象数据样本b对应的功率预测模型。
上述基于改进的小波变换与神经网络的新能源功率预测方法中,通过获取多组气象数据样本,以及与每组气象数据样本对应的历史发电功率,确定多组气象数据样本中,每种变量类型下的多个气象数值样本与多个历史发电功率之间的相关度,得到与每个所述相关度阈值对应的初始变量类型,根据所述初始变量类型对应的第一训练精度,从多个所述相关度阈值中确定出目标阈值,以及与所述目标阈值对应的目标变量类型,对多组气象数据样本进行聚类处理,得到每组气象数据样本所属的目标类别,对于每种第一目标类别下的气象数据样本,采用气象数据样本中目标变量类型下的目标气象样本和每个信号频率下的功率信号样本对多种初始功率预测模型进行训练,从训练后的多种初始功率预测模型中确定出与每种第一目标类别对应的功率预测模型,能够遍历多个相关度阈值,获取与每个相关度阈值对应的初始变量类型,采用初始变量类型下的气象数值样本对初始功率检测模型进行训练,根据训练得到的第一训练精度从多个相关度阈值中确定出目标阈值,以提高模型输入数据的准确率,从而提高功率预测模型的准确率。同时,采用本实施例中提供的基于改进的小波变换与神经网络的新能源功率预测方法,能够针对每种目标类别下的气象数据样本分别采用目标变量类型下的目标气象样本对多种初始功率预测模型进行训练,对多种初始功率预测模型进行集成学习,将预测精度最高的初始功率预测模型作为功率预测模型,以提高功率预测模型的预测精度。
在一个实施例中,如图2所示,步骤S110,采用目标气象样本和每个信号频率下的功率信号样本对多种初始功率预测模型进行训练,得到与每种第一目标类别对应的功率预测模型,包括:
步骤S202,采用目标气象样本和功率信号样本对每种初始功率预测模型进行训练,得到每种初始功率预测模型生成的目标功率信号。
步骤S204,根据目标功率信号,生成每种初始功率预测模型对应的第二训练精度。
具体地,计算机设备中预先部署了多种未训练的初始功率预测模型。对于每种第一目标类别下的气象数据样本,都执行以下处理:将每组气象数据样本中的目标气象样本作为训练输入数据,将与每组气象数据样本对应的每个信号频率下的功率信号样本作为与训练输入数据对应的训练标签,对每种初始功率预测模型进行训练,得到每种初始功率预测模型输出的每个信号频率下的目标功率信号。对多个信号频率下的目标功率信号进行小波重构处理,得到与气象数值样本对应的预测发电功率。对预测发电功率和与每组气象数据样本对应的发电功率进行运算处理,得到与目标类别下的气象数据样本对应的每种初始功率预测模型的第二训练精度。
步骤S206,根据第二训练精度,从训练后的多种初始功率预测模型中确定出与每种第一目标类别对应的功率预测模型。
具体地,计算机设备中预先存储有功率预测模型条件。对于每种第一目标类别下的气象数据样本,都执行以下处理:根据每种初始功率预测模型的第二训练精度,将符合功率预测模型条件的训练后的初始功率预测模型作为与目标类别下的气象数据样本对应的功率预测模型。重复上述操作,得到与每种目标类别下的气象数据样本对应的功率预测模型。其中,功率预测模型条件可以为确定第一训练精度超过预设模型精度阈值,也可以为对每种初始功率预测模型的第一训练精度进行比较,确定最高的第一训练精度。
本实施例中,通过对多种初始功率预测模型进行训练,根据训练后初始功率预测模型对应的第二训练精度,从已训练的多种初始功率预测模型中确定出与每种第一目标类别下的气象数据样本对应的功率预测模型,能够实现对多种初始功率预测模型的集成学习,避免采用单一初始功率预测模型进行训练时存在的预测误差,以使得提高功率预测模型的准确率。
在一个实施例中,步骤S106,根据相关度和多个相关度阈值,从多种变量类型下确定出与每个相关度阈值对应的初始变量类型,根据初始变量类型对应的第一训练精度,从多个相关度阈值中确定出目标阈值,包括:采用每个初始变量类型下的气象数值样本对初始功率预测模型进行训练,得到与每个初始变量类型下的气象数值样本对应的初始功率预测模型的第一训练精度;根据第一训练精度,从多个相关度阈值中确定出目标阈值。
具体地,计算机设备对每个相关度阈值对应的初始变量类型下的气象数值样本,都执行以下处理:将每种第一目标类别下的多组气象数据样本中,初始变量类型下的气象数值样本作为训练输入数据,将与每组气象数据样本对应的历史发电功率作为训练标签,对多种未训练的初始功率预测模型进行训练,得到与每种第一目标类别下的多组气象数据样本中,初始变量类型下的气象数值样本对应的初始功率预测模型的第一训练精度。对每个相关度阈值对应的第一训练精度进行比较,从多个相关度阈值中确定出第一训练精度最高的相关度阈值,将第一训练精度最高的相关度阈值作为与目标类别下的气象数据样本对应的目标阈值,将目标阈值对应的初始变量类型作为与目标类别下的气象数据样本对应的目标变量类型。具体的第一训练精度的生成方式可以参照上述实施例中提供的第二训练精度的生成步骤实现,具体的初始功率预测模型的训练方式可以参照上述实施例中提供的初始功率预测模型的训练步骤实现,在此不做具体阐述。
本实施例中,通过设置多个相关度阈值,从多种变量类型下确定出与每个相关度阈值对应的初始变量类型,采用每个初始变量类型下的气象数值样本对初始功率模型进行训练,根据模型的第一训练精度,从多个初始变量类型中确定与每种第一目标类别下的气象数据样本对应的目标变量类型,能够进一步提高训练输入数据与目标类别之间的相关性,以使得提高功率预测模型的准确率。
在一个实施例中,如图3所示,步骤S108,对多组气象数据样本进行聚类处理,得到每组气象数据样本所属的第一目标类别,包括:
步骤S302,确定每组气象数据样本对应的初始聚类特征。
具体地,计算机设备可以采用以下公式对每组气象数据样本中多种变量类型下的气象数值样本进行处理,生成与每组气象数据样本对应的初始聚类特征:
a=(as1,as2,…,asH,asmax,asmin,asmean,asstd)
其中,a是初始聚类特征,as1,as2,…,asH为每组气象数据样本中各个采集时刻下得到的气象数值样本,asmax为每组气象数据样本中最大的气象数值样本,asmin为每组气象数据样本中最小的气象数值样本,asmean为每组气象数据样本中气象数值样本均值,asstd为每组气象数据样本中气象数值样本标准差。一个示例中,可以采用风速样本生成初始聚类特征。
另一个示例中,可以采用辐照度样本生成初始聚类特征。辐照度相似日的无监督聚类逻辑为了把全年辐照度特性相似日子分成若干类,需要选取能反映辐照度日特性的物理量,如辐照度在一天当中的变化趋势(日平均辐照度样本)、幅值(即与每组辐照度样本对应的一天当中各个采集时刻下的辐照度数值样本、日最大辐照度样本、日最小辐照度样本)、波动性(日辐照度标准差样本)等。采用上述公式对选取的物理量进行处理,得到与每组辐照度样本对应的初始聚类特征。该初始聚类特征构造既考虑了辐照度在每日的变化趋势,也考虑了辐照度的大小幅度,能够提高后续对气象数据样本进行聚类的准确率。
步骤S304,对初始聚类特征进行归一化处理,得到每组气象数据样本对应的目标聚类特征。
步骤S306,根据目标聚类特征与每个类别对应的类别特征,确定每组气象数据样本所属的第一目标类别。
其中,类别特征可以用于表征类别中多组气象数据样本对应的聚类中心的目标聚类特征。
具体地,由于初始聚类特征中包括多种变量类型下的气象数值样本,因此需要对初始聚类特征进行归一化处理,以消除不同物理量之间由于量纲差异对聚类结果造成的影响。计算机设备可以采用最大最小归一化的方式对初始聚类特征进行归一化处理,得到每组气象数据样本对应的目标聚类特征。对每组气象数据样本对应的目标聚类特征以及每个类别对应的类别特征进行运算处理,得到目标聚类特征与每个类别特征之间的类别差异度。将类别差异度小于类别阈值的类别作为该组气象数据样本所属的第一目标类别。
一个示例中,可以参照以下公式对初始聚类特征进行归一化处理,得到目标聚类特征:
Figure BDA0003595370310000131
其中,bji’为目标聚类特征中第j个物理量中的第i个采样值,bji为初始聚类特征中第j个物理量中的第i个采样值;bjmin为初始聚类特征中第j个物理量的最小值;bjmax为初始聚类特征中第j个物理量的最大值。
本实施例中,通过确定每组气象数据样本对应的初始聚类特征,对初始聚类特征进行归一化处理,得到每组气象数据样本对应的目标聚类特征,根据目标聚类特征确定每组气象数据样本所属的目标类别,能够提高聚类的准确率,从而提高针对不同类别下的气象数据样本对应的功率预测模型的准确率。
在一个实施例中,如图4所示,步骤S306,根据目标聚类特征与每个类别对应的类别特征,确定每组气象数据样本所属的第一目标类别,包括:
步骤S402,获取多个初始聚类数量下的气象数据样本的初始类别。
具体地,计算机设备中存储有多个初始聚类数量,分别采用每个初始聚类数量对归一化处理后的气象数据样本进行聚类处理。获取与每个初始聚类结果对应的初始聚类中心,对初始聚类中心的目标聚类特征和除初始聚类中心之外的多组气象数据样本进行运算处理,确定与初始聚类中心属于同一类别的气象数据样本,得到与每个初始聚类数量对应的气象数据样本的初始类别。
步骤S404,根据两两气象数据样本之间目标聚类特征的差异度,生成与每个初始聚类数量对应的评价参数。
步骤S406。根据评价参数,从多个初始聚类数量确定出目标聚类数量,将目标聚类数量下气象数据样本对应的初始类别作为第一目标类别。
具体地,计算机设备对初始聚类结果中同一类别下的多组气象数据样本的目标聚类特征和初始聚类中心对应的目标聚类特征进行运算处理,得到与每个初始聚类数量对应的第一聚类评价参数。对初始聚类结果中属于同一类别的多组气象数据样本的目标聚类特征进行运算处理,确定与初始聚类结果对应的簇内距离。对初始聚类结果中属于不同类别的多组气象数据样本的目标聚类特征进行运算处理,确定与初始聚类结果对应的簇间距离。对簇内距离和簇间距离进行运算处理,确定与每个初始聚类数量对应的第二聚类评价参数。根据第一聚类评价参数和第二聚类评价参数,从多个初始聚类数量中确定出目标聚类数量。获取与目标聚类数量对应的聚类结果,得到与每组气象数据样本所属的第一目标类别。
一个示例中,计算机设备可以随机选取与初始聚类数量对应的若干组气象数据样本作为初始聚类中心,将初始聚类中心的目标聚类特征作为中心聚类特征。对每个初始聚类中心的中心聚类特征与每组气象数据样本的目标聚类特征进行运算处理,确定与初始距离中心之间距离小于聚类阈值的若干组气象数据样本,得到与每个初始聚类中心属于同一类别的气象数据样本,得到此处聚类后的第一聚类结果。重复上述操作对此处聚类后的第一聚类结果再次进行聚类,直至第一聚类结果中的聚类中心不再变化为止,得到最终的初始聚类结果。另一个示例中,计算机设备也可以多次随机初始化中心点,然后选择运行结果最好的一个聚类结果作为与初始聚类数据对应的初始聚类结果。
另一个示例中,计算机设备可以采用k-means(一种无监督聚类方法)进行聚类,按照肘部法则(Elbow Method)确定聚类数量。k-means聚类方法是以最小化样本与质点平方误差作为目标函数,将每个簇的质点与簇内样本点的平方距离误差和称为畸变程度,将畸变程度作为第一聚类评价参数。因此,对于一个簇,它的畸变程度越低,代表簇内成员越紧密,畸变程度越高,代表簇内结构越松散。畸变程度会随着类别的增加而降低,进而可以采用畸变程度判断聚类的类别数量。但对于有一定区分度的数据,在达到某个临界点时畸变程度会得到极大改善,之后缓慢下降,这个临界点就可以考虑为聚类性能较好的点。
可以参照以下公式获取与初始聚类结果对应的畸变程度:
Figure BDA0003595370310000151
其中,Ci是第i个类别,p是Ci的气象数据样本,mi是Ci的聚类中心,SSE可以表示所有气象数据样本的聚类误差即畸变程度,k为聚类数量。
另一个示例中,由于对于一个聚类任务,希望得到的簇中,簇内尽量紧密,簇间尽量远离,因此计算机设备可以将轮廓系数作为第二聚类评价参数。
可以参照以下公式获取轮廓系数:
Figure BDA0003595370310000152
其中,a(i)=average(i向量到所有它属于的簇中其它点的距离,即i向量对应的簇内距离),b(i)=min(i向量到某一不包含它的簇内的所有点的平均距离,即i向量对应的簇间距离)。S(i)为轮廓系数,取值在[-1,1]之间。轮廓系数越大,聚类越合理。即S(i)接近1,则说明样本i聚类合理;S(i)接近-1,则说明样本i更应该分类到另外的簇;若S(i)近似为0,则说明样本i在两个簇的边界上。对所有样本的S(i)进行运算处理,将得到的S(i)的均值作为当前聚类结果的轮廓系数,将较大的轮廓系数对应的聚类数量作为目标聚类数量。
一个示例中,以云南某光伏电站数据为例,进行相似日聚类预测:
计算机设备获取的训练集数据包括:地点:某个光伏电站;时间:2020/7/1 8:00:00-2021/8/77:45:00;400天数据,每天8点起报,每次3天数据,只取第一天的预报数据作为训练输入数据;每一测试时间步长:15min;数据量:115200条数据。
计算机设备获取的测试集数据包括:地点:某个光伏电站;时间:2021/8/58:00:00-2021/12/15 7:45:00;130天数据。每天8点起报,每次3天数据,只取第一天的预报数据作为测试数据;每一测试时间步长:15min;数据量:12480条数据。
计算机设备采用肘部法则对多种簇的个数(即初始聚类数量)进行处理,确定与每种簇的个数对应的簇内离差平方和之和(即第一聚类评价参数),如图4a所示。获取与每种簇的个数对应的轮廓系数(即第二聚类评价参数),如图4b所示,其中圆圈内的点为簇的个数为3时对应的轮廓系数。根据簇内离差平方和之和以及轮廓系数确定出最佳的簇的个数为3(即目标聚类数量)。采用目标聚类数量对云南某光伏电站四百天采集到的气象数据样本进行聚类处理,将125天采集到的多组气象数据样本归属于第一类别;将167天采集到的多组气象数据样本归属于第二类别;将108天采集到的多组气象数据样本归属于第三类别。
本实施例中,通过获取多个初始聚类数量下的气象数据样本的初始类别,根据两两气象数据样本之间目标聚类特征的差异度,生成与每个初始聚类数量对应的评价参数,根据评价参数,从多个初始聚类数量确定出目标聚类数量,将目标聚类数量下气象数据样本对应的初始类别作为第一目标类别,能够进一步提高第一目标类别的准确率。
在一个实施例中,步骤S104,确定多组气象数据样本中,每种变量类型下的多个气象数值样本与多个历史发电功率之间的相关度,包括:通过以下公式得到每种变量类型下的多个气象数值样本与多个历史发电功率之间的相关度:
Figure BDA0003595370310000161
其中,R为相关度,k为变量类型下的气象数值样本对应的采集时刻,n为多组气象数据样本中变量类型下的气象数值样本的数量,Tk为采集时刻为k的气象数值样本;
Figure BDA0003595370310000162
为多组气象数据样本中变量类型下的气象数值样本的均值,Pk为采集时刻为k的气象数值样本对应的历史发电功率;
Figure BDA0003595370310000163
为与多组气象数据样本中变量类型下的气象数值样本对应的历史发电功率均值。
本实施例中,提供的相关度确定公式,区别于传统的相关度确定方法,将与历史发电功率之间的相关度数值更高(即趋近于1),以及与历史发电功率之间的相关度数值更低(即趋近于-1)的变量类型都作为与历史发电功率之间相关度较高的变量类型,从而能够提高后续根据相关度确定目标变量类型的准确率,以使得提高功率预测模型的准确率。
在一个实施例中,如图5所示,在功率预测模型的应用阶段,基于改进的小波变换与神经网络的新能源功率预测方法还包括:
步骤S502,获取待预测气象数据。
步骤S504,确定待预测气象数据所属的第二目标类别。
步骤S506,从多种变量类型下的气象数值中,确定出与目标阈值对应的目标变量类型下的气象数值,将目标变量类型下的气象数值输入至与第二目标类别对应的功率预测模型,得到发电功率。
其中,待预测气象数据中包括多种变量类型下的气象数值。
具体地,计算机设备响应于发电功率的预测请求,获取待预测气象数据。对待预测气象数据和多组气象数据样本进行聚类处理得到待预测气象数据所属的第二目标类别。从多种变量类型下的气象数值中,确定出与目标阈值对应的目标变量类型下的气象数值。获取与待预测气象数据所属的第二目标类别对应的功率预测模型,将目标变量类型下的气象数值输入至与第二目标类别对应的功率预测模型,得到发电功率。
本实施例中,通过获取待预测气象数据,确定待预测气象数据所属的第二目标类别,将目标变量类型下的气象数值输入至与第二目标类别对应的功率预测模型,能够提高发电功率预测的准确率。
在一个实施例中,如图6所示,提供了一种基于改进的小波变换与神经网络的新能源功率预测方法,包括:
步骤S602,获取多组气象数据样本,以及与每组气象数据样本对应的历史发电功率,确定多组气象数据样本中,每种变量类型下的多个气象数值样本与多个历史发电功率之间的相关度。
具体地,计算机设备获取多组气象数据样本,以及与每组气象数据样本对应的发电功率。对每种变量类型下的多个气象数值样本与多个气象数值样本对应的发电功率进行运算处理,得到每种变量类型下的气象数值样本与发电功率之间的相关度。具体的相关度计算方法可以参照上述实施例中提供的方法实现,在此不做具体阐述。
步骤S604,根据相关度和多个相关度阈值,从多种变量类型下确定出与每个相关度阈值对应的初始变量类型。
步骤S606,采用每个初始变量类型下的气象数值样本对初始功率预测模型进行训练,根据与每个初始变量类型下的气象数值样本对应的初始功率预测模型的第一训练精度,确定目标阈值。
具体地,计算机设备将相关度分别与每个相关度阈值进行比较,将大于相关度阈值的变量类型作为与相关度阈值对应的初始变量类型。将每个初始变量类型下的气象数值样本作为训练输入数据,将与气象数值样本对应的发电功率作为训练标签对初始功率预测模型进行训练。将与每个初始变量类型下的气象数值样本对应的初始功率预测模型的第一训练精度最高的相关度阈值作为目标阈值,将目标阈值对应的初始变量类型作为目标变量类型。具体的目标阈值的确定方法可以参照上述实施例中提供的方法实现,在此不做具体阐述。
步骤S608,确定每组气象数据样本对应的初始聚类特征,对初始聚类特征进行归一化处理,得到每组气象数据样本对应的目标聚类特征,根据目标聚类特征与每个类别对应的类别特征,确定每组气象数据样本所属的第一目标类别。
具体地,计算机设备对每组气象数据样本中多种变量类型下的气象数值样本进行处理,生成与每组气象数据样本对应的初始聚类特征。采用最大最小归一化的方式对初始聚类特征进行归一化处理,得到每组气象数据样本对应的目标聚类特征。根据多组气象数据样本的目标聚类特征与每个类别对应的类别特征,确定每组气象数据样本所属的目标类别。具体的目标类别确定方法可以参照上述实施例中提供的方法实现,在此不做具体阐述。
步骤S610,对历史发电功率进行小波分解处理,得到多个信号频率下的功率信号样本,采用目标气象样本和功率信号样本对多种初始功率预测模型进行训练,从训练后的多种初始功率预测模型中确定出与第一目标类别对应的功率预测模型。
具体地,计算机设备对于每种目标类别下的气象数据样本都执行以下操作:对与每组气象数据样本对应的发电功率进行小波分解处理,得到多个信号频率下的功率信号样本。采用目标气象样本和每个信号频率下的功率信号样本对每种初始功率预测模型都执行以下操作:将目标气象样本作为训练输入数据,将每个信号频率下的功率信号样本作为训练标签,对多个未训练的初始功率预测模型进行训练,得到与每个信号频率对应的已训练的初始功率预测模型。对多个已训练的初始功率预测模型输出的每个信号频率下的预测功率信号进行小波重构处理,得到与初始功率预测模型对应的第一功率预测模型。获取每种初始功率预测模型对应的第一功率预测模型的第二训练精度,对多个第一功率预测模型的第二训练精度进行比较,确定出功率预测模型。具体的功率预测模型的确定方法可以参照上述实施例中提供的方法实现,在此不做具体阐述。
一个示例中,以基于小波变换与BP神经网络的光伏电站短期功率预测为例,对功率预测模型的生成步骤进行说明:获取实测光伏电站历史发电功率数据和对应时刻的气象数据样本;将历史发电功率数据进行小波分解,得到多个信号频率下的功率信号D1,D2...DN和AN;利用多个BP神经网络对D1,D2...DN和AN分别进行训练,其中BP神经网络训练函数可以自选。将多组气象数据样本中目标变量类型下的气象数值样本不重复地分为k份,利用k-1份作训练集,另一份作验证集。将训练集中的数据以及对应的多个信号频率下的功率信号D1,D2...DN和AN输入未训练的初始功率预测模型进行训练,使得训练后的初始功率预测模型输出为D1,D2...DN和AN目标值。利用验证集中的数据作为输入数据,得到训练后的初始功率预测模型输出的预测功率信号D1,D2...DN和AN。然后对预测功率信号进行小波重构,得到对历史发电功率数据的预测结果。采用不同的验证集重复上述操作,对初始功率预测模型进行交叉验证,即采用训练集对初始功率预测模型进行训练,采用测试集对训练后的初始功率预测模型进行测试,保存初始功率预测模型的评估指标。重复上述操作k次,直至每份气象数值样本均存在作为测试集对训练后的初始功率预测模型进行测试的情况。计算k组测试指标的平均值作为模型精度的估计,并作为当前k折交叉验证下模型的性能指标。计算k值取不同参数情况下的性能指标,选取性能指标最高的参数作为当前模型参数。通常情况下,训练集的子集数量k一般取10;当原训练集较小时,k可以大一点,这样训练集占整体比例就不至于太小,但训练的模型个数也随之增多;原训练集较大时,k可以小一点。
一个示例中,计算机设备将气象数值样本分为十份,第一次迭代训练中,取最后一份作为测试集,获取此时的初始功率预测模型的测试指标E1。第二次迭代训练中,取倒数第二份作为测试集,获取此时的初始功率预测模型的测试指标E2。第三次迭代训练中,取倒数第三份作为测试集,获取此时的初始功率预测模型的测试指标E3。重复上述操作,直至第十次迭代训练中,取第一份作为测试集,获取此时的初始功率预测模型的测试指标E10。
可以采用以下公式得到训练集的子集数量k取10的情况下,初始功率预测模型的性能指标:
Figure BDA0003595370310000191
其中,E为初始功率预测模型的性能指标,i为迭代训练的次数,Ei为第i次迭代训练得到的初始功率预测模型的测试指标。
本实施例中,通过获取多组气象数据样本,以及与每组气象数据样本对应的历史发电功率,确定多组气象数据样本中,每种变量类型下的多个气象数值样本与多个历史发电功率之间的相关度,根据相关度从多种变量类型下确定出目标变量类型,对多组气象数据样本进行聚类处理,得到每组气象数据样本所属的第一目标类别,对于每种第一目标类别下的气象数据样本,采用气象数据样本中目标变量类型下的目标气象样本和每个信号频率下的功率信号样本对每种初始功率预测模型进行训练,得到与每种第一目标类别对应的功率预测模型,能够遍历多个相关度阈值,对多种初始功率预测模型进行集成学习,以提高选取的模型训练数据的准确率,并且针对每种目标类别下的气象数据样本分别训练初始功率预测模型,从而提高功率预测模型的准确率。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的基于改进的小波变换与神经网络的新能源功率预测方法的基于改进的小波变换与神经网络的新能源功率预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个基于改进的小波变换与神经网络的新能源功率预测装置实施例中的具体限定可以参见上文中对于基于改进的小波变换与神经网络的新能源功率预测方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种基于改进的小波变换与神经网络的新能源功率预测装置700,包括:数据样本获取模块702、相关度确定模块704、变量类型确定模块706、第一类别确定模块708、小波分解模块710和模型训练模块712,其中:
数据样本获取模块702,用于获取多组气象数据样本,以及与每组气象数据样本对应的历史发电功率,每组气象数据样本中包括多种变量类型下的气象数值样本。
相关度确定模块704,用于确定多组气象数据样本中,每种变量类型下的多个气象数值样本与多个历史发电功率之间的相关度。
变量类型确定模块706,用于根据相关度和多个相关度阈值,从多种变量类型下确定出与每个相关度阈值对应的初始变量类型,根据初始变量类型对应的第一训练精度,从多个相关度阈值中确定出目标阈值,以及与目标阈值对应的目标变量类型,第一训练精度是采用初始变量类型下的气象数值样本对初始功率预测模型进行训练得到的。
第一类别确定模块708,用于对多组气象数据样本进行聚类处理,得到每组气象数据样本所属的第一目标类别。
小波分解模块710,用于对于每种第一目标类别下的气象数据样本,执行以下处理:对与每组气象数据样本对应的历史发电功率进行小波分解处理,得到多个信号频率下的功率信号样本。
模型训练模块712,用于采用每组气象数据样本中目标变量类型下的目标气象样本和每个信号频率下的功率信号样本对多种初始功率预测模型进行训练,从训练后的多种初始功率预测模型中确定出与每种第一目标类别对应的功率预测模型,功率预测模型后续用于生成与第一目标类别下的气象数据对应的发电功率。
在一个实施例中,模型训练模块712包括;信号生成单元,用于采用每组气象数据样本中的目标气象样本和每个信号频率下的功率信号样本对每种初始功率预测模型进行训练,得到每种初始功率预测模型生成的与每个信号频率对应的目标功率信号;精度生成单元,用于根据目标功率信号,生成每种初始功率预测模型对应的第二训练精度;模型确定单元,用于根据第二训练精度,从训练后的多种初始功率预测模型中确定出与每种第一目标类别下的气象数据样本对应的功率预测模型。
在一个实施例中,变量类型确定模块806,包括:第一精度获取单元,用于采用每个相关度阈值对应的初始变量类型下的气象数值样本对初始功率预测模型进行训练,得到与每个相关度阈值对应的初始变量类型下的气象数值样本对应的初始功率预测模型的第一训练精度;类型确定单元,用于根据第一训练精度,从多个相关度阈值中确定出目标阈值,将目标阈值对应的初始变量类型作为目标变量类型。
在一个实施例中,第一类别确定模块808,包括:初始特征确定单元,用于确定每组气象数据样本对应的初始聚类特征;目标特征确定单元,用于对初始聚类特征进行归一化处理,得到每组气象数据样本对应的目标聚类特征;目标类别确定单元,用于根据目标聚类特征与每个类别对应的类别特征,确定每组气象数据样本所属的第一目标类别。
在一个实施例中,目标类别确定单元包括:初始类别确定子单元,用于采用多个初始聚类数量分别对多组气象数据样本进行聚类处理,得到每个初始聚类数量下的气象数据样本的初始类别;评价参数生成子单元,用于根据两两气象数据样本之间目标聚类特征的差异度,生成与初始聚类数量对应的评价参数;聚类数量确定子单元,用于根据评价参数,从多个初始聚类数量确定出目标聚类数量,将目标聚类数量下气象数据样本对应的初始类别作为第一目标类别。
在一个实施例中,在功率预测模型的应用阶段,基于改进的小波变换与神经网络的新能源功率预测装置700还包括:数据获取模块,用于获取待预测气象数据,待预测气象数据中包括多种变量类型下的气象数值;第二类别确定模块,用于对待预测气象数据和多组气象数据样本进行聚类处理,确定待预测气象数据所属的第二目标类别;功率生成模块,用于从多种变量类型下的气象数值中,确定出与目标阈值对应的目标变量类型下的气象数值,将目标变量类型下的气象数值输入至与第二目标类别对应的功率预测模型,得到发电功率。
上述基于改进的小波变换与神经网络的新能源功率预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储初始功率预测模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于改进的小波变换与神经网络的新能源功率预测方法。
在一个实施例中,提供了另一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种基于改进的小波变换与神经网络的新能源功率预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8和图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于改进的小波变换与神经网络的新能源功率预测方法,其特征在于,所述方法包括:
获取多组气象数据样本,以及与每组所述气象数据样本对应的历史发电功率,每组所述气象数据样本中包括多种变量类型下的气象数值样本;
确定多组所述气象数据样本中,每种所述变量类型下的多个气象数值样本与多个所述历史发电功率之间的相关度;
根据所述相关度和多个相关度阈值,从多种所述变量类型下确定出与每个所述相关度阈值对应的初始变量类型,根据所述初始变量类型对应的第一训练精度,从多个所述相关度阈值中确定出目标阈值,以及与所述目标阈值对应的目标变量类型,所述第一训练精度是采用所述初始变量类型下的气象数值样本对初始功率预测模型进行训练得到的;
对多组所述气象数据样本进行聚类处理,得到每组所述气象数据样本所属的第一目标类别;
对于每种所述第一目标类别下的所述气象数据样本,执行以下处理:
对与每组所述气象数据样本对应的所述历史发电功率进行小波分解处理,得到多个信号频率下的功率信号样本;
采用每组所述气象数据样本中所述目标变量类型下的目标气象样本和每个所述信号频率下的所述功率信号样本对多种所述初始功率预测模型进行训练,从训练后的多种所述初始功率预测模型中,确定出与每种所述第一目标类别下的所述气象数据样本对应的功率预测模型,所述功率预测模型后续用于生成与所述第一目标类别下的气象数据对应的发电功率。
2.根据权利要求1所述的方法,其特征在于,所述采用每组所述气象数据样本中所述目标变量类型下的目标气象样本和每个所述信号频率下的所述功率信号样本对多种所述初始功率预测模型进行训练,从训练后的多种所述初始功率预测模型中,确定出与每种所述第一目标类别下的所述气象数据样本对应的功率预测模型,包括:
采用每组所述气象数据样本中的所述目标气象样本和每个所述信号频率下的所述功率信号样本对每种所述初始功率预测模型进行训练,得到每种所述初始功率预测模型生成的与每个所述信号频率对应的目标功率信号;
根据所述目标功率信号,生成每种所述初始功率预测模型对应的第二训练精度;
根据所述第二训练精度,从训练后的多种所述初始功率预测模型中确定出与每种所述第一目标类别下的所述气象数据样本对应的所述功率预测模型。
3.根据权利要求1所述的方法,其特征在于,所述根据所述初始变量类型对应的第一训练精度,从多个所述相关度阈值中确定出目标阈值,以及与所述目标阈值对应的目标变量类型,包括:
采用每个所述相关度阈值对应的初始变量类型下的气象数值样本对所述初始功率预测模型进行训练,得到与每个所述相关度阈值对应的初始变量类型下的所述气象数值样本对应的初始功率预测模型的第一训练精度;
根据所述第一训练精度,从多个所述相关度阈值中确定出所述目标阈值,将所述目标阈值对应的初始变量类型作为所述目标变量类型。
4.根据权利要求1所述的方法,其特征在于,所述对多组所述气象数据样本进行聚类处理,得到每组所述气象数据样本所属的第一目标类别,包括:
确定每组所述气象数据样本对应的初始聚类特征;
对所述初始聚类特征进行归一化处理,得到每组所述气象数据样本对应的目标聚类特征;
根据所述目标聚类特征与每个类别对应的类别特征,确定每组所述气象数据样本所属的所述第一目标类别。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标聚类特征与每个类别对应的类别特征,确定每组所述气象数据样本所属的所述第一目标类别,包括:
采用多个初始聚类数量分别对多组所述气象数据样本进行聚类处理,得到每个所述初始聚类数量下的所述气象数据样本的初始类别;
根据两两气象数据样本之间目标聚类特征的差异度,生成与所述初始聚类数量对应的评价参数;
根据所述评价参数,从多个所述初始聚类数量确定出目标聚类数量,将所述目标聚类数量下所述气象数据样本对应的所述初始类别作为所述第一目标类别。
6.根据权利要求1至5中任一项所述的方法,其特征在于,在所述功率预测模型的应用阶段,所述方法还包括:
获取待预测气象数据,所述待预测气象数据中包括多种变量类型下的气象数值;
对所述待预测气象数据和多组所述气象数据样本进行聚类处理,确定所述待预测气象数据所属的第二目标类别;
从多种所述变量类型下的气象数值中,确定出与所述目标阈值对应的所述目标变量类型下的气象数值,将所述目标变量类型下的所述气象数值输入至与所述第二目标类别对应的功率预测模型,得到发电功率。
7.一种基于改进的小波变换与神经网络的新能源功率预测装置,其特征在于,所述装置包括:
数据样本获取模块,用于获取多组气象数据样本,以及与每组所述气象数据样本对应的历史发电功率,每组所述气象数据样本中包括多种变量类型下的气象数值样本;
相关度确定模块,用于确定多组所述气象数据样本中,每种所述变量类型下的多个气象数值样本与多个所述历史发电功率之间的相关度;
变量类型确定模块,用于根据所述相关度和多个相关度阈值,从多种所述变量类型下确定出与每个所述相关度阈值对应的初始变量类型,根据所述初始变量类型对应的第一训练精度,从多个所述相关度阈值中确定出目标阈值,以及与所述目标阈值对应的目标变量类型,所述第一训练精度是采用所述初始变量类型下的气象数值样本对初始功率预测模型进行训练得到的;
第一类别确定模块,用于对多组所述气象数据样本进行聚类处理,得到每组所述气象数据样本所属的第一目标类别;
小波分解模块,用于对于每种所述第一目标类别下的气象数据样本,执行以下处理:对与每组所述气象数据样本对应的所述历史发电功率进行小波分解处理,得到多个信号频率下的功率信号样本;
模型训练模块,用于采用每组所述气象数据样本中所述目标变量类型下的目标气象样本和每个所述信号频率下的所述功率信号样本对多种所述初始功率预测模型进行训练,从训练后的多种所述初始功率预测模型中,确定出与每种所述第一目标类别下的所述气象数据样本对应的功率预测模型,所述功率预测模型后续用于生成与所述第一目标类别下的气象数据对应的发电功率。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202210387225.1A 2022-04-14 2022-04-14 基于改进的小波变换与神经网络的新能源功率预测方法 Pending CN114723147A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210387225.1A CN114723147A (zh) 2022-04-14 2022-04-14 基于改进的小波变换与神经网络的新能源功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210387225.1A CN114723147A (zh) 2022-04-14 2022-04-14 基于改进的小波变换与神经网络的新能源功率预测方法

Publications (1)

Publication Number Publication Date
CN114723147A true CN114723147A (zh) 2022-07-08

Family

ID=82243228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210387225.1A Pending CN114723147A (zh) 2022-04-14 2022-04-14 基于改进的小波变换与神经网络的新能源功率预测方法

Country Status (1)

Country Link
CN (1) CN114723147A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115051416A (zh) * 2022-08-16 2022-09-13 阿里巴巴(中国)有限公司 数据处理方法、发电方法、装置和云设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115051416A (zh) * 2022-08-16 2022-09-13 阿里巴巴(中国)有限公司 数据处理方法、发电方法、装置和云设备

Similar Documents

Publication Publication Date Title
CN110610280B (zh) 一种电力负荷短期预测方法、模型、装置及系统
Huang et al. Solar radiation prediction using different machine learning algorithms and implications for extreme climate events
Yang et al. Combined wireless network intrusion detection model based on deep learning
Yang et al. A time‐series water level forecasting model based on imputation and variable selection method
CN111008726B (zh) 一种电力负荷预测中类图片转换方法
CN114330935B (zh) 基于多种结合策略集成学习的新能源功率预测方法和系统
Afrasiabi et al. Deep learning architecture for direct probability density prediction of small‐scale solar generation
Li et al. A novel combined prediction model for monthly mean precipitation with error correction strategy
CN113505537A (zh) 楼宇能耗检测方法、装置、计算机设备和存储介质
Zhang et al. Load Prediction Based on Hybrid Model of VMD‐mRMR‐BPNN‐LSSVM
CN112330078A (zh) 用电量预测方法、装置、计算机设备和存储介质
Zheng et al. Recognition method of voltage sag causes based on two‐dimensional transform and deep learning hybrid model
CN114723147A (zh) 基于改进的小波变换与神经网络的新能源功率预测方法
Ziwen et al. A Multi‐Granularity Density Peak Clustering Algorithm Based on Variational Mode Decomposition
CN117458480A (zh) 基于改进lof的光伏发电功率短期预测方法及系统
CN110830939B (zh) 基于改进的cpn-wlan指纹定位数据库的定位方法
Khan et al. Forecasting renewable energy for environmental resilience through computational intelligence
CN113723712B (zh) 风电功率预测方法、系统、设备及介质
Hu et al. Grain yield predict based on GRA-AdaBoost-SVR model
Yang et al. An improved spatial upscaling method for producing day‐ahead power forecasts for wind farm clusters
CN115526430A (zh) 多距离聚类与信息聚合的负荷区间预测方法、系统及介质
CN113723835B (zh) 火电厂用水评估方法和终端设备
CN115271274B (zh) 电力系统短期日负荷预测方法及相关设备
CN117408382A (zh) 一种光伏功率预测方法、系统、设备及存储介质
Mahajan GT-DTW: Bridging Graph Theory and Dynamic Time Warping for Complex Time Series Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination