CN114881343A - 基于特征选择的电力系统短期负荷预测方法及装置 - Google Patents

基于特征选择的电力系统短期负荷预测方法及装置 Download PDF

Info

Publication number
CN114881343A
CN114881343A CN202210551151.0A CN202210551151A CN114881343A CN 114881343 A CN114881343 A CN 114881343A CN 202210551151 A CN202210551151 A CN 202210551151A CN 114881343 A CN114881343 A CN 114881343A
Authority
CN
China
Prior art keywords
feature
training
short
subset
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210551151.0A
Other languages
English (en)
Other versions
CN114881343B (zh
Inventor
耿华
江博臻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202210551151.0A priority Critical patent/CN114881343B/zh
Publication of CN114881343A publication Critical patent/CN114881343A/zh
Application granted granted Critical
Publication of CN114881343B publication Critical patent/CN114881343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于特征选择的电力系统短期负荷预测方法及装置,其中,方法包括:获取电力系统的候选特征集;基于预先搭建的神经网络前馈长短期记忆网络对候选特征集进行特征选择,得到最优特征子集;将最优特征子集输入预先训练的目标短期负荷预测模型,得到电力系统的短期负荷,其中,目标短期负荷预测模型由电力系统的最优训练特征子集和对应的目标负荷训练得到,从而充分考虑到候选特征的相关性、冗余性和交互性,提高了短期负荷预测的精度。由此,解决了相关技术中难以分析特征之间的交互作用、冗余权重降低模型的收敛速度以及当特征空间较大时,运行代价过大等问题。

Description

基于特征选择的电力系统短期负荷预测方法及装置
技术领域
本申请涉及电力系统负荷预测技术领域,特别涉及一种基于特征选择的电力系统短期负荷预测方法及装置。
背景技术
短期负荷预测(Short-term Load Forecasting,STLF)在电力系统运行中起着至关重要的作用,其性能将影响电力系统运行的安全性和经济性。特别是随着电力市场的开放和智能电网的普及,时序负荷表现出更多的非线性和非平稳性。因此,近年来,对STLF精度和可靠性提出了更高要求,这也激发了许多这方面的研究工作。
STLF的现有工作主要集中在短期负荷预测模型(Short-term Load ForecastingModel,SLFM)上,如多元线性回归模型、基于神经网络的模型、混合模型等。然而,设计高精度的短期负荷预测模型通常是一项复杂而困难的任务。另一个更容易实现的选项是特征选择。特征选择是选择相关特征子集用于模型训练及预测的过程。然而,它通常由用户的经验或试错来进行。另一方面,当候选特征空间较大时,特征选择是STLF中关键的一步。通过去除无效的特征并减少特征空间,使得SLFM的训练速度更快,复杂度降低,从而提高SLFM的性能。
特征选择方法可以根据它们与候选特征的交互方式分为过滤式方法和包裹式方法。过滤式方法分析特征和目标之间的相关性和冗余性,对特征进行评分和排序。换句话说,过滤式方法独立于SLFM。因此,它们具有相对较低的计算成本和较好的效率。到目前为止,已经提出了几个排名的方法,如皮尔逊相关系数(Pearson correlation coefficient,PCC)、斯皮尔曼相关系数(Spearmancorrelation coefficient,SCC)、主成分分析(Principal Component Analysis,PCA)、最大信息系数(Maximal InformationCoefficient,MIC)、互信息(Mutual Information,MI)和相关特征(Relief)。PCC、SCC和PCA是线性特征分析技术,而Veaux等人指出,在非线性情况下,仅使用线性相关特征会影响模型性能。同时,选择的高相关特征可能存在多重共线性问题,导致统计SLFM中的系统性分析错误。由于学习到的冗余权重,基于人工神经网络(Artificial Neural Network,ANN)的SLFM的预测性能受到影响较小,但会降低模型的收敛速度。MIC、Relief和MI是非线性特征分析技术。然而,MIC和MI会忽略输入的冗余信息。同时,上述方法难以分析特征之间的交互作用。
包裹式方法搜索原始特征空间以枚举大量特征子集。包裹式方法中使用的典型搜索算法包括顺序选择算法和启发式搜索算法,如遗传算法、蚁群优化等。然后,包裹式方法使用预测性能作为最佳特征子集的优度度量。因此,包裹式方法可以选择最优子集。然而,包裹式方法受到SLFM时间复杂度的限制,当特征空间较大时,运行代价可能会非常大。
近年来,随着人工智能的兴起,大量基于人工神经网络的方法被应用于STLF。然而,很少有论文将人工神经网络应用于特征选择。长短时记忆网络(Long Short Termnetworks,LSTM)是递归神经网络(Recurrent Neural Networks,RNN)的一种变体,它是为时序建模而设计的,对时间序列和非线性数据有很强的处理能力。因此,LSTM可以深入挖掘候选特征和负荷之间的关系。
发明内容
本申请提供一种基于特征选择的电力系统短期负荷预测方法、装置、电子设备及存储介质,以解决相关技术中难以分析特征之间的交互作用、冗余权重降低模型的收敛速度以及当特征空间较大时,运行代价过大等问题。
本申请第一方面实施例提供一种基于特征选择的电力系统短期负荷预测方法,包括以下步骤:获取电力系统的候选特征集;基于预先搭建的神经网络前馈长短期记忆网络对所述候选特征集进行特征选择,得到最优特征子集;将所述最优特征子集输入预先训练的目标短期负荷预测模型,得到所述电力系统的短期负荷,其中,所述目标短期负荷预测模型由所述电力系统的最优训练特征子集和对应的目标负荷训练得到。
可选地,在本申请的一个实施例中,在将所述最优特征子集输入预先训练的目标短期负荷预测模型之前,还包括:利用训练候选特征集和目标负荷对预先构建的神经网络前馈长短期记忆网络进行训练,得到训练结果;根据所述训练结果和特征选择方法在所述训练候选特征集中选择所述最优训练特征子集;利用所述最优训练特征子集和所述目标负荷训练预先构建的多个短期负荷预测模型,通过比较测试误差确定出所述目标短期负荷预测模型。
可选地,在本申请的一个实施例中,所述利用训练候选特征集和目标负荷对预先构建的神经网络前馈长短期记忆网络进行训练,得到训练结果,包括:通过误差沿时间反向传播算法利用所述训练候选特征集和所述目标负荷对所述神经网络前馈长短期记忆网络进行多次训练;将训练后的测试误差最小的神经网络前馈长短期记忆网络的输出取绝对值,将所述绝对值的每一行按从大到小排列得到所述特征重要性矩阵以及相应的位置重要性矩阵。
可选地,在本申请的一个实施例中,所述根据所述训练结果和特征选择方法在所述训练候选特征集中选择所述最优训练特征子集,包括:对所述特征重要性矩阵进行划分得到重要样本特征信息,计算所述特征重要性矩阵中两样本特征信息的差异得到样本差异集合,通过所述样本差异集合确定差异最大的候选特征;根据所述位置重要性矩阵统计特征频次计数,根据预设的频次阈值百分比和所述差异最大的候选特征计算多个频率阈值,将所述多个频率阈值与所述特征频次计数进行比较,得到所述训练候选特征集的子集合,利用所述训练候选特征集的子集合和所述目标负荷训练所述神经网络前馈长短期记忆网络,通过比较测试误差在所述训练候选特征集的子集合中确定出所述最优训练特征子集。
可选地,在本申请的一个实施例中,所述对所述特征重要性矩阵进行划分得到重要样本特征信息,计算所述特征重要性矩阵中两样本特征信息的差异得到样本差异集合,通过所述样本差异集合确定差异最大的候选特征,包括:将所述特征重要性矩阵按列分为重要样本和不重要样本,根据所述重要样本得到所述重要样本特征信息;遍历所述特征重要性矩阵的每一列,计算两样本特征信息差异得到所述样本差异集合;根据所述样本差异集合绘制样本差异曲线,找到所述样本差异曲线最大点对应的横坐标作为所述差异最大的候选特征。
可选地,在本申请的一个实施例中,所述根据所述位置重要性矩阵统计特征频次计数,根据预设的频次阈值百分比和所述差异最大的候选特征计算多个频率阈值,将所述多个频率阈值与所述特征频次计数进行比较,得到所述训练候选特征集的子集合,利用所述训练候选特征集的子集合和所述目标负荷训练所述神经网络前馈长短期记忆网络,通过比较测试误差在所述训练候选特征集的子集合中确定出所述最优训练特征子集,包括:设置用于生成候选特征子集的频次阈值百分比集合和计算所述重要样本特征信息中的每个特征频率的特征频次计数集合;根据所述位置重要性矩阵统计特征频率和更新所述特征频次计数集合;结合所述差异最大的候选特征、所述频次阈值百分比集合计算所述频次阈值百分比集合中每个频次阈值百分比的频率阈值;将所述频率阈值和所述特征频次计数集合中的特征频率进行比较,根据比较结果确定所述训练候选特征集的子集合;通过误差沿时间反向传播算法利用所述训练候选特征集的子集合和所述目标负荷对所述神经网络前馈长短期记忆网络进行多次训练,将训练后的测试误差最小的神经网络前馈长短期记忆网络对应的训练候选特征集的子集合作为所述训练候选特征的最优训练特征子集。
可选地,在本申请的一个实施例中,在利用所述最优训练特征子集和所述目标负荷训练预先构建的多个短期负荷预测模型之前,包括:分别基于全连接神经网络、卷积神经网络和长短时记忆网络构建所述多个短期负荷预测模型。
本申请第二方面实施例提供一种基于特征选择的电力系统短期负荷预测装置,包括:获取模块,用于获取电力系统的候选特征集;第一选择模块,用于基于预先搭建的神经网络前馈长短期记忆网络对所述候选特征集进行特征选择,得到最优特征子集;输入模块,用于将所述最优特征子集输入预先训练的目标短期负荷预测模型,得到所述电力系统的短期负荷,其中,所述目标短期负荷预测模型由所述电力系统的最优训练特征子集和对应的目标负荷训练得到。
可选地,在本申请的一个实施例中,在将所述最优特征子集输入预先训练的目标短期负荷预测模型之前,还包括:训练模块,用于利用训练候选特征集和目标负荷对预先构建的神经网络前馈长短期记忆网络进行训练,得到训练结果;第二选择模块,用于根据所述训练结果和特征选择方法在所述训练候选特征集中选择所述最优训练特征子集;确定模块,用于利用所述最优训练特征子集和所述目标负荷训练预先构建的多个短期负荷预测模型,通过比较测试误差确定出所述目标短期负荷预测模型。
可选地,在本申请的一个实施例中,所述训练模块包括:拟合单元,用于通过误差沿时间反向传播算法利用所述训练候选特征集和所述目标负荷对所述神经网络前馈长短期记忆网络进行多次训练;排列单元,用于将训练后的测试误差最小的神经网络前馈长短期记忆网络的输出取绝对值,将所述绝对值的每一行按从大到小排列得到所述特征重要性矩阵以及相应的位置重要性矩阵。
可选地,在本申请的一个实施例中,所述第二选择模块包括:第一计算单元,用于对所述特征重要性矩阵进行划分得到重要样本特征信息,计算所述特征重要性矩阵中两样本特征信息的差异得到样本差异集合,通过所述样本差异集合确定差异最大的候选特征;第二计算单元,用于根据所述位置重要性矩阵统计特征频次计数,根据预设的频次阈值百分比和所述差异最大的候选特征计算多个频率阈值,将所述多个频率阈值与所述特征频次计数进行比较,得到所述训练候选特征集的子集合,利用所述训练候选特征集的子集合和所述目标负荷训练所述神经网络前馈长短期记忆网络,通过比较测试误差在所述训练候选特征集的子集合中确定出所述最优训练特征子集。
可选地,在本申请的一个实施例中,所述第一计算单元进一步用于,将所述特征重要性矩阵按列分为重要样本和不重要样本,根据所述重要样本得到所述重要样本特征信息;遍历所述特征重要性矩阵的每一列,计算两样本特征信息差异得到所述样本差异集合;根据所述样本差异集合绘制样本差异曲线,找到所述样本差异曲线最大点对应的横坐标作为所述差异最大的候选特征。
可选地,在本申请的一个实施例中,所述第二计算单元进一步用于,设置用于生成候选特征子集的频次阈值百分比集合和计算所述重要样本特征信息中的每个特征频率的特征频次计数集合;根据所述位置重要性矩阵统计特征频率和更新所述特征频次计数集合;结合所述差异最大的候选特征、所述频次阈值百分比集合计算所述频次阈值百分比集合中每个频次阈值百分比的频率阈值;将所述频率阈值和所述特征频次计数集合中的特征频率进行比较,根据比较结果确定所述训练候选特征集的子集合;通过误差沿时间反向传播算法利用所述训练候选特征集的子集合和所述目标负荷对所述神经网络前馈长短期记忆网络进行多次训练,将训练后的测试误差最小的神经网络前馈长短期记忆网络对应的训练候选特征集的子集合作为所述训练候选特征的最优训练特征子集。
可选地,在本申请的一个实施例中,包括:构建模块,用于利用所述最优训练特征子集和所述目标负荷训练预先构建的多个短期负荷预测模型之前,分别基于全连接神经网络、卷积神经网络和长短时记忆网络构建所述多个短期负荷预测模型。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以执行如上述实施例所述的基于特征选择的电力系统短期负荷预测方法。
本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以执行如上述实施例所述的基于特征选择的电力系统短期负荷预测方法。
由此,本申请实施例具有以下有益效果:
本申请实施例通过获取电力系统的候选特征集;基于预先搭建的神经网络前馈长短期记忆网络对候选特征集进行特征选择,得到最优特征子集;将最优特征子集输入预先训练的目标短期负荷预测模型,得到电力系统的短期负荷,其中,目标短期负荷预测模型由电力系统的最优训练特征子集和对应的目标负荷训练得到,从而充分考虑到候选特征的相关性、冗余性和交互性,提高了短期负荷预测的精度。由此,解决了相关技术中难以分析特征之间的交互作用、冗余权重降低模型的收敛速度以及当特征空间较大时,运行代价过大等问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种基于特征选择的电力系统短期负荷预测方法的流程图;
图2为根据本申请的一个实施例提供的一种F-LSTM的分解结构示意图;
图3为根据本申请的一个实施例提供的一种F-LSTM训练阶段流程示意图;
图4为根据本申请的一个实施例提供的一种过滤式阶段流程示意图;
图5为根据本申请的一个实施例提供的一种包裹式阶段流程示意图;
图6为根据本申请的一个实施例提供的一种短期负荷预测阶段流程示意图;
图7为根据本申请的一个实施例提供的一种于特征选择的电力系统短期负荷预测方法的执行逻辑示意图;
图8为根据本申请的一个实施例提供的一种FIM的分布直方图;
图9为根据本申请的一个实施例提供的一种TD曲线示意图;
图10为根据本申请的一个实施例提供的一种IMS的分布直方图;
图11为根据本申请的一个实施例提供的一种特征频次直方图;
图12为根据本申请的一个实施例提供的一种特征相关性热力图;
图13为根据本申请的一个实施例提供的一种最优子集和候选特征的二维平面投影示意图;
图14为根据本申请实施例的基于特征选择的电力系统短期负荷预测装置的示例图;
图15为申请实施例提供的电子设备的结构示意图。
附图标记说明:获取模块-100、第一选择模块-200、输入模块-300、存储器-1501、处理器-1502、通信接口-1503。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于特征选择的电力系统短期负荷预测方法、装置、电子设备及存储介质。针对上述背景技术中提到的问题,本申请提供了一种基于特征选择的电力系统短期负荷预测方法,在该方法中,本申请实施例通过获取电力系统的候选特征集;基于预先搭建的神经网络前馈长短期记忆网络对候选特征集进行特征选择,得到最优特征子集;将最优特征子集输入预先训练的目标短期负荷预测模型,得到电力系统的短期负荷,其中,目标短期负荷预测模型由电力系统的最优训练特征子集和对应的目标负荷训练得到,从而充分考虑到候选特征的相关性、冗余性和交互性,提高了短期负荷预测的精度。由此,解决了相关技术中难以分析特征之间的交互作用、冗余权重降低模型的收敛速度以及当特征空间较大时,运行代价过大等问题。
具体而言,图1为本申请实施例所提供的一种基于特征选择的电力系统短期负荷预测方法的流程图。
如图1所示,该基于特征选择的电力系统短期负荷预测方法包括以下步骤:
在步骤S101中,获取电力系统的候选特征集。
可以理解的是,为了电力系统短期负荷预测,首先需要从官方公开数据、相关企业或网络资源等途径获取大量电力系统数据,进一步地,本领域技术人员可对所获取的数据进行数据预处理,如对缺失值进行填补或删除、处理离群数据等,并将处理后的数据作为电力系统短期负荷预测的输入数据。
在步骤S102中,基于预先搭建的神经网络前馈长短期记忆网络对候选特征集进行特征选择,得到最优特征子集。
在步骤S103中,将最优特征子集输入预先训练的目标短期负荷预测模型,得到电力系统的短期负荷,其中,目标短期负荷预测模型由电力系统的最优训练特征子集和对应的目标负荷训练得到。
需要说明的是,为了增强LSTM输出与输入之间的相关性并定位输入,本申请的实施例预先搭建一个神经网络前馈长短期记忆网络进行特征选择。具体地,通过在LSTM中增加一个前馈通道,提出了神经网络前馈长短期记忆网络,即F-LSTM,其结构如图2所示。F-LSTM包含三个输入,分别为上一时刻的细胞状态ct-1,此时的输入xt,上一时刻隐藏状态ht-1和xt的点积,其中ct-1,ht-1∈Rm,xt∈Rn,内部构成包括遗忘门、输入门、细胞状态更新及输出门,计算过程如式(1)所示。
Figure BDA0003650772620000071
其中,c′t=tanh(wc[(ht-1·xt),xt]T+bc),ot=σ(wo[(ht-1·xt),xt]T+bo),wf,wi,wo,wc∈Rm×(m+n)分别为遗忘门、输入门、输出门以及细胞状态的权重矩阵,bf,bi,bo,bc∈Rm分别为其相应的偏置项,
Figure BDA0003650772620000072
为激活函数。
为了结合数据集中特征重要性,并考虑相关性、冗余信息、交互作用以及无用特征信息,进一步改善数据的质量,进而提高算法的预测精度和鲁棒性,本申请的实施例基于预先搭建的神经网络前馈长短期记忆网络对特征集进行特征选择,为STLF选择候选特征的最优子集Sopt
具体地,在本申请的一个实施例中,在将最优特征子集输入预先训练的目标短期负荷预测模型之前,还包括:利用训练候选特征集和目标负荷对预先构建的神经网络前馈长短期记忆网络进行训练,如图3所示。F-LSTM将针对所有候选输入数据进行训练,得到训练结果,并根据训练结果和特征选择方法获取特征重要性矩阵,以在训练候选特征集中选择最优训练特征子集;利用最优训练特征子集和目标负荷训练预先构建的多个短期负荷预测模型,通过比较测试误差确定出目标短期负荷预测模型。
需要说明的是,训练过程中,短期负荷预测模型模型的输入数据包括候选输入集S={x1,x2,…,xn}∈Rnum×n和目标负荷y∈Rnum,其中n是候选特征的个数,num是采样数。
可选地,在本申请的一个实施例中,利用训练候选特征集和目标负荷对预先构建的神经网络前馈长短期记忆网络进行训练,得到训练结果,包括:通过误差沿时间反向传播算法利用训练候选特征集和目标负荷对神经网络前馈长短期记忆网络进行多次训练;将训练后的测试误差最小的神经网络前馈长短期记忆网络的输出取绝对值,将绝对值的每一行按从大到小排列得到特征重要性矩阵以及相应的位置重要性矩阵。
具体地,本申请的实施例通过将F-LSTM和全连接(FullyConnected,FC)网络结构构成短期负荷预测模型。将候选输入集S和目标负荷y分为训练集和测试集,通过误差沿时间反向传播算法利用训练集对模型进行多次训练,并利用测试集评估模型。每次都可以设置不同的随机种子来初始化模型权重矩阵,其中,测试误差最小的SLFM被认为是充分考虑候选特征之间的相关性、冗余性和交互作用的最优模型。继而,收集对应的F-LSTM输出,并取绝对值。然后将F-LSTM输出中的每一行均从大到小排序,将排序后的矩阵定义为特征重要性矩阵FIM,相应的特征位置变化矩阵定义为位置重要性矩阵PIM,即F-LSTM训练阶段的输出为上述FIM和PIM。
可选地,在本申请的一个实施例中,根据训练结果和特征选择方法在训练候选特征集中选择最优训练特征子集,包括:对特征重要性矩阵进行划分得到重要样本特征信息,计算特征重要性矩阵中两样本特征信息的差异得到样本差异集合,通过样本差异集合确定差异最大的候选特征;根据位置重要性矩阵统计特征频次计数,根据预设的频次阈值百分比和差异最大的候选特征计算多个频率阈值,将多个频率阈值与特征频次计数进行比较,得到训练候选特征集的子集合,利用训练候选特征集的子集合和目标负荷训练神经网络前馈长短期记忆网络,通过比较测试误差在训练候选特征集的子集合中确定出最优训练特征子集。
在上述F-LSTM阶段,通过对所有候选输入进行训练,获得特征重要性矩阵后,进一步地,本申请的实施例对特征重要性矩阵进行划分得到重要样本特征信息,以确定差异最大的候选特征。
可选地,在本申请的一个实施例中,对特征重要性矩阵进行划分得到重要样本特征信息,计算特征重要性矩阵中两样本特征信息的差异得到样本差异集合,通过样本差异集合确定差异最大的候选特征,包括:将特征重要性矩阵按列分为重要样本和不重要样本,根据重要样本得到重要样本特征信息;遍历特征重要性矩阵的每一列,计算两样本特征信息差异得到样本差异集合;根据样本差异集合绘制样本差异曲线,找到样本差异曲线最大点对应的横坐标作为差异最大的候选特征。
具体地,上述过程即为过滤式阶段,该阶段从F-LSTM训练阶段的输出开始,如图4所示。过滤式阶段对FIM最大化相关性,最小化冗余性,最大化交互作用,如下所述:
第一步:两样本差异Td用于衡量两样本特征信息差异,初始化为空集。计数器i设置为1。
第二步:FIM中的前i列和后(n-i)列将构成重要样本IMS和不重要样本,i从1到(n-1)进行遍历,计算TD={td1,…,tdn-1}
第三步:绘制TD曲线,找到曲线最大点对应的横坐标TDI,它代表两个样本特征信息之间的差异最大。因此,在考虑相关性、冗余性和交互的情况下,得到了包含足够特征信息的IMS。
可选地,在本申请的一个实施例中,根据位置重要性矩阵统计特征频次计数,根据预设的频次阈值百分比和差异最大的候选特征计算多个频率阈值,将多个频率阈值与特征频次计数进行比较,得到训练候选特征集的子集合,利用训练候选特征集的子集合和目标负荷训练神经网络前馈长短期记忆网络,通过比较测试误差在训练候选特征集的子集合中确定出最优训练特征子集,包括:设置用于生成候选特征子集的频次阈值百分比集合和计算重要样本特征信息中的每个特征频率的特征频次计数集合;根据位置重要性矩阵统计特征频率和更新特征频次计数集合;结合差异最大的候选特征、频次阈值百分比集合计算频次阈值百分比集合中每个频次阈值百分比的频率阈值;将频率阈值和特征频次计数集合中的特征频率进行比较,根据比较结果确定训练候选特征集的子集合;通过误差沿时间反向传播算法利用训练候选特征集的子集合和目标负荷对神经网络前馈长短期记忆网络进行多次训练,将训练后的测试误差最小的神经网络前馈长短期记忆网络对应的训练候选特征集的子集合作为训练候选特征的最优训练特征子集。
在获取过滤式阶段的输出TDI和IMS后,本申请实施例根据基于LSTM的SLFM的测试误差选择最佳子集,即为包裹式阶段。该阶段从F-LSTM训练阶段和过滤式阶段的输出开始,如图5所示,具体步骤如下所述:
第一步:设置几个不同的频次阈值百分比Pt,它是用来生成候选特征的几个子集,被写为Pt={pt1,pt2,...,ptn}。其中t是子集的数量,Pt是所提方法的可调参数,应根据问题进行微调。
第二步:计数器i设置为1。同时,特征频次计数Freq用于计算IMS中的每个特征频率并初始化如下所示:Freq={freq1,freq2,...,freqn}=0。
第三步:根据PMI统计特征频率和更新Freq。
第四步:对于Pt中的pti,都存在一个频率阈值
Figure BDA0003650772620000101
第五步:对于Thi,比较freqj和Thi,以生成候选特征Si的子集,其如下所示:Si={xj|freqj>Thi,freqj∈Freq}。
第六步:Si和y将被分为训练集和测试集,通过误差沿时间反向传播算法利用训练集对模型进行多次训练,并利用测试集评估模型。每次都可以设置不同的随机种子来初始化模型权重矩阵。测试误差最小的LSTM短期负荷预测模型是最好的预测器。因此,相应的子集Sopt是最优的,其也是包裹式阶段的输出。
可选地,在本申请的一个实施例中,在利用最优训练特征子集和目标负荷训练预先构建的多个短期负荷预测模型之前,包括:分别基于全连接神经网络、卷积神经网络和长短时记忆网络构建多个短期负荷预测模型。
需要说明的是,在包裹式阶段输出最优训练特征子集后,本申请的实施例利用测试误差进行负荷预测模型性能评价,比较多种基于ANN的SLFM在不同参数下性能,并返回最优的SLFMopt,即短期负荷预测阶段。
该阶段从F-LSTM包裹式阶段的输出开始,如图6所示,具体执行步骤如下所述:
第一步:输入数据,包括Sopt、y。
第二步:构建基于全连接神经网络(FC)、卷积神经网络(Convolutional NeuralNetworks,CNN)和LSTM的SLFMs,其中可以调整模型的内部结构参数。
第三步:Si和y将被送入模型中,分别对不同的模型进行多次训练。每次设置不同的随机种子来初始化模型权重矩阵,测试集误差最小的预测模型是最优的SLFM,并将最优子集Sopt和最优的SLFM作为短期负荷预测方法最终的输出。
下面通过一个具体实施例对本申请的一种基于特征选择的电力系统短期负荷预测方法进行详细说明。
图7为一种基于特征选择的电力系统短期负荷预测方法的执行逻辑示意图。
首先,本具体实施例中的数据集由两部分组成:负荷数据由ENTOS-E提供,候选特征由Dark Sky提供,数据集收集由David Friederich完成。负荷数据记录了瑞士2015年至2017年的每小时实际负荷,特征记录了每小时温度数据、瑞士许多城市观测到的天气质量地图数据,以及包括年、月、日、小时和假日在内的日期数据。进行以天为单位进行特征选择实验,即取每日的平均负荷。共有864个平均负荷数据和52个特征类别,包括温度、8个城市的天气质量地图和日期。同时,由于数据有助于表征时序负荷的相似性,因此不将日期数据添加到特征选择模型中,供选择的候选特征的实际数量是32。每个候选特征名称由城市缩写、下划线和角标记组成。角标记t、1、2、3分别代表温度、好天气、正常天气和坏天气。数据集的前854个是训练集,其余是测试集。本申请的实施例使用三种测量方法来评定短期负荷预测模型性能:均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)。
其次,在F-LSTM训练阶段,本申请的实施例绘制FIM的分布直方图如图8所示。可以看出,F-LSTM可以显著区分特征的重要性。如果fimi,j∈FIM很小,即意味着ith∈[1,num],F-LSTM第jth∈[1,n]输出对负荷几乎没有影响,因此,相应的第jth输入特征功能不那么重要。
再次,在过滤式阶段,本申请的实施例对FIM进行两样本t检验,然后绘制TD曲线,如图9所示。当TDI=11时,IMS和UIMS两个样本之间的特征信息差异最大。IMS的直方图如图10所示。可以看出,大量代表着弱相关性、强冗余和弱交互的无用特征信息被消除。
之后,包裹式阶段结果:在包裹式阶段,基于LSTM的短期负荷预测模型测试误差被用作中最佳特征子集的优度度量,如表1所示。基于LSTM的SLFM的结构见表2。当pti为90%时,LSTM预测模型的性能最好。因此,包裹式阶段将选择与pti等于90%所对应的特征。绘制特征频次直方图,如图11所示。其清楚地显示了如何通过pti选择特征子集。
表1 基于LSTM的短期负荷预测模型性能对比
Figure BDA0003650772620000111
表2基于LSTM的SLFM的结构
Figure BDA0003650772620000121
为了进一步验证HFLM可以最大化相关性、最小化冗余和最大化交互,使用PCC和MIC分析候选特征、FIM和负荷之间的相关性,如图12所示。图12中的子图(a)、(b)分别是负荷和候选特征之间的PCC和MIC。图12中的子图(c)、(d)分别是负荷和FIM之间的PCC和MIC。图12中的子图(e)是候选特征中的PCC。图12中的子图(f)是FIM和候选特征之间的PCC。特征已按特征频率排序,即高频负荷特征在水平轴上排名较高。
从相关性的角度来看,所提的方法选择与负荷高度相关的特征,如图12中的子图(a)、(b)所示。从冗余的角度来看,尽管图12中的子图(a)、(b)中显示了一些候选特征的高度相关性,但它们没有被选择。可以发现,与负荷高度相关的未选择特征是与排名靠前的特征高度相关的特征。换言之,HFLM可以忽略特征的冗余性。从交互的角度来看,图12的子图(a)、(b)中选择了与负荷的相关性较低一些候选特征。但它们相应的FIM与负荷有很强的相关性,如图12中的子图(c)、(d)所示。这意味着该特征和其他特征之间的交互将对负荷产生重大影响。因此,HFLM不仅可以考虑单个特征的影响,还可以考虑候选特征组合产生的影响。
为了显示候选特征和最优子集之间的相似性和差异性,使用PCA将它们映射到二维平面,如图13所示。可以发现,它们在二维平面上的空间分布变化不大,这意味着最优子集可以代表候选特征的信息,并且忽略无用信息。
将得到的最优子集输入到模型中,将FC、CNN和LSTM构成的SLFMs在的性能进行比较,选择出最优的短期负荷预测模型,同时为了验证最优子集的有效性,比较了上述模型在特征选择前后的性能,如表3所示,其结构如表4所示,所提的短期负荷预测方法最终选择pti等于90%所对应的特征子集及参数个数为3777的基于CNN的短期负荷预测模型。可以发现,HFSM提高了基于人工神经网络(ANN)的SLFMs的性能并降低了模型的复杂性,这证明所提的特征选择方法可以选择合适的特征子集。其次,该方法会降低一些预测模型的性能。由于当基于ANN的SLFMs过于复杂或简单时,会出现过拟合或欠拟合,导致性能不佳。第三,所提方法选择的子集在不同的基于ANN的SLFMs中表现良好。因此,所提方法具有良好的泛化性能,所选子集可以用于多种基于ANN的SLFMs中。此外,基于ANN的SLFMs已应用于公用事业,其性能优于传统的基于回归的SLFMs。因此,所提出的特征选择方法可以为基于ANN的SLFMs提供更多有价值的特征,降低复杂性,并且基于此特征选择方法,进一步选择出性能更好的短期负荷预测模型,从而满足对于更高预测精度和可靠性的要求。
表3 负荷预测模型性能对比
Figure BDA0003650772620000131
Figure BDA0003650772620000141
表4FC、CNN和LSTM SLFM的结构
Figure BDA0003650772620000142
可以理解的是,在本申请的实施例中,首先提出了一个新的神经网络F-LSTM,作为连接候选特征和负荷的桥梁。然后基于F-LSTM,进一步提出了一种整体特征选择方法,用于为短期负荷预测选择候选特征的最佳子集。最后基于此最优子集,比较不同的基于ANN的短期负荷预测模型的性能,从而选择出最优的短期负荷预测模型,然后利用最优子集和最优的短期负荷预测模型来进行短期负荷预测。整体特征选择方法考虑到候选特征的相关性、冗余性和交互性,过滤式和包裹式方法相结合,有效提高了短期负荷预测的精度,并通过瑞士电力市场的实际负荷进行有力验证。
根据本申请实施例提出的基于特征选择的电力系统短期负荷预测方法,首先基于LSTM提出了一种神经网络前馈长短期记忆网络,基于F-LSTM提出了一种整体特征选择方法,然后利用该方法选择出候选特征中的最优子集进行短期负荷预测。HFSM综合考虑特征之间的相关性、冗余性和交互作用,分析特征的重要性。同时,本申请实施例通过F-LSTM和两样本t检验来测量所有特征之间的相关性、交互作用和冗余性。此外,将选择出来的最优子集和目标负荷送入基于ANN的SLFMs中训练,比较模型的预测性能来选择最优的SLFM。最后利用最优子集和最优的SLFM进行短期负荷预测,从而有效提高了短期负荷预测的精度。
其次参照附图描述根据本申请实施例提出的基于特征选择的电力系统短期负荷预测装置。
图14是本申请实施例的基于特征选择的电力系统短期负荷预测装置的方框示意图。
如图14所示,该基于特征选择的电力系统短期负荷预测装置10包括:获取模块100、第一选择模块200以及输入模块300。
其中,获取模块100,用于获取电力系统的候选特征集;第一选择模块200,用于基于预先搭建的神经网络前馈长短期记忆网络对候选特征集进行特征选择,得到最优特征子集;输入模块300,用于将最优特征子集输入预先训练的目标短期负荷预测模型,得到电力系统的短期负荷,其中,目标短期负荷预测模型由电力系统的最优训练特征子集和对应的目标负荷训练得到。
可选地,在本申请的一个实施例中,在将最优特征子集输入预先训练的目标短期负荷预测模型之前,还包括:训练模块,用于利用训练候选特征集和目标负荷对预先构建的神经网络前馈长短期记忆网络进行训练,得到训练结果;第二选择模块,用于根据训练结果和特征选择方法在训练候选特征集中选择最优训练特征子集;确定模块,用于利用最优训练特征子集和目标负荷训练预先构建的多个短期负荷预测模型,通过比较测试误差确定出目标短期负荷预测模型。
可选地,在本申请的一个实施例中,训练模块包括:拟合单元,用于通过误差沿时间反向传播算法利用训练候选特征集和目标负荷对神经网络前馈长短期记忆网络进行多次训练;排列单元,用于将训练后的测试误差最小的神经网络前馈长短期记忆网络的输出取绝对值,将绝对值的每一行按从大到小排列得到特征重要性矩阵以及相应的位置重要性矩阵。
可选地,在本申请的一个实施例中,第二选择模块包括:第一计算单元,用于对特征重要性矩阵进行划分得到重要样本特征信息,计算特征重要性矩阵中两样本特征信息的差异得到样本差异集合,通过样本差异集合确定差异最大的候选特征;第二计算单元,用于根据位置重要性矩阵统计特征频次计数,根据预设的频次阈值百分比和差异最大的候选特征计算多个频率阈值,将多个频率阈值与特征频次计数进行比较,得到训练候选特征集的子集合,利用训练候选特征集的子集合和目标负荷训练神经网络前馈长短期记忆网络,通过比较测试误差在训练候选特征集的子集合中确定出最优训练特征子集。
可选地,在本申请的一个实施例中,第一计算单元进一步用于,将特征重要性矩阵按列分为重要样本和不重要样本,根据重要样本得到重要样本特征信息;遍历特征重要性矩阵的每一列,计算两样本特征信息差异得到样本差异集合;根据样本差异集合绘制样本差异曲线,找到样本差异曲线最大点对应的横坐标作为差异最大的候选特征。
可选地,在本申请的一个实施例中,第二计算单元进一步用于,设置用于生成候选特征子集的频次阈值百分比集合和计算重要样本特征信息中的每个特征频率的特征频次计数集合;根据位置重要性矩阵统计特征频率和更新特征频次计数集合;结合差异最大的候选特征、频次阈值百分比集合计算频次阈值百分比集合中每个频次阈值百分比的频率阈值;将频率阈值和特征频次计数集合中的特征频率进行比较,根据比较结果确定训练候选特征集的子集合;通过误差沿时间反向传播算法利用训练候选特征集的子集合和目标负荷对神经网络前馈长短期记忆网络进行多次训练,将训练后的测试误差最小的神经网络前馈长短期记忆网络对应的训练候选特征集的子集合作为训练候选特征的最优训练特征子集。
可选地,在本申请的一个实施例中,包括:构建模块,用于利用最优训练特征子集和目标负荷训练预先构建的多个短期负荷预测模型之前,分别基于全连接神经网络、卷积神经网络和长短时记忆网络构建多个短期负荷预测模型。
需要说明的是,前述对基于特征选择的电力系统短期负荷预测方法实施例的解释说明也适用于该实施例的基于特征选择的电力系统短期负荷预测装置,此处不再赘述。
根据本申请实施例提出的基于特征选择的电力系统短期负荷预测装置,通过获取电力系统的候选特征集;基于预先搭建的神经网络前馈长短期记忆网络对候选特征集进行特征选择,得到最优特征子集;将最优特征子集输入预先训练的目标短期负荷预测模型,得到电力系统的短期负荷,其中,目标短期负荷预测模型由电力系统的最优训练特征子集和对应的目标负荷训练得到,从而充分考虑到候选特征的相关性、冗余性和交互性,提高了短期负荷预测的精度。
图15为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器1501、处理器1502及存储在存储器1501上并可在处理器1502上运行的计算机程序。
处理器1502执行程序时实现上述实施例中提供的基于特征选择的电力系统短期负荷预测方法。
进一步地,电子设备还包括:
通信接口1503,用于存储器1501和处理器1502之间的通信。
存储器1501,用于存放可在处理器1502上运行的计算机程序。
存储器1501可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器1501、处理器1502和通信接口1503独立实现,则通信接口1503、存储器1501和处理器1502可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图15中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器1501、处理器1502及通信接口1503,集成在一块芯片上实现,则存储器1501、处理器1502及通信接口1503可以通过内部接口完成相互间的通信。
处理器1502可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上的基于特征选择的电力系统短期负荷预测方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

Claims (16)

1.一种基于特征选择的电力系统短期负荷预测方法,其特征在于,包括以下步骤:
获取电力系统的候选特征集;
基于预先搭建的神经网络前馈长短期记忆网络对所述候选特征集进行特征选择,得到最优特征子集;
将所述最优特征子集输入预先训练的目标短期负荷预测模型,得到所述电力系统的短期负荷,其中,所述目标短期负荷预测模型由所述电力系统的最优训练特征子集和对应的目标负荷训练得到。
2.根据权利要求1所述的方法,其特征在于,在将所述最优特征子集输入预先训练的目标短期负荷预测模型之前,还包括:
利用训练候选特征集和目标负荷对预先构建的神经网络前馈长短期记忆网络进行训练,得到训练结果;
根据所述训练结果和特征选择方法在所述训练候选特征集中选择所述最优训练特征子集;
利用所述最优训练特征子集和所述目标负荷训练预先构建的多个短期负荷预测模型,通过比较测试误差确定出所述目标短期负荷预测模型。
3.根据权利要求2所述的方法,其特征在于,所述利用训练候选特征集和目标负荷对预先构建的神经网络前馈长短期记忆网络进行训练,得到训练结果,包括:
通过误差沿时间反向传播算法利用所述训练候选特征集和所述目标负荷对所述神经网络前馈长短期记忆网络进行多次训练;
将训练后的测试误差最小的神经网络前馈长短期记忆网络的输出取绝对值,将所述绝对值的每一行按从大到小排列得到所述特征重要性矩阵以及相应的位置重要性矩阵。
4.根据权利要求3所述的方法,其特征在于,所述根据所述训练结果和特征选择方法在所述训练候选特征集中选择所述最优训练特征子集,包括:
对所述特征重要性矩阵进行划分得到重要样本特征信息,计算所述特征重要性矩阵中两样本特征信息的差异得到样本差异集合,通过所述样本差异集合确定差异最大的候选特征;
根据所述位置重要性矩阵统计特征频次计数,根据预设的频次阈值百分比和所述差异最大的候选特征计算多个频率阈值,将所述多个频率阈值与所述特征频次计数进行比较,得到所述训练候选特征集的子集合,利用所述训练候选特征集的子集合和所述目标负荷训练所述神经网络前馈长短期记忆网络,通过比较测试误差在所述训练候选特征集的子集合中确定出所述最优训练特征子集。
5.根据权利要求4所述的方法,其特征在于,所述对所述特征重要性矩阵进行划分得到重要样本特征信息,计算所述特征重要性矩阵中两样本特征信息的差异得到样本差异集合,通过所述样本差异集合确定差异最大的候选特征,包括:
将所述特征重要性矩阵按列分为重要样本和不重要样本,根据所述重要样本得到所述重要样本特征信息;
遍历所述特征重要性矩阵的每一列,计算两样本特征信息差异得到所述样本差异集合;
根据所述样本差异集合绘制样本差异曲线,找到所述样本差异曲线最大点对应的横坐标作为所述差异最大的候选特征。
6.根据权利要求5所述的方法,其特征在于,所述根据所述位置重要性矩阵统计特征频次计数,根据预设的频次阈值百分比和所述差异最大的候选特征计算多个频率阈值,将所述多个频率阈值与所述特征频次计数进行比较,得到所述训练候选特征集的子集合,利用所述训练候选特征集的子集合和所述目标负荷训练所述神经网络前馈长短期记忆网络,通过比较测试误差在所述训练候选特征集的子集合中确定出所述最优训练特征子集,包括:
设置用于生成候选特征子集的频次阈值百分比集合和计算所述重要样本特征信息中的每个特征频率的特征频次计数集合;
根据所述位置重要性矩阵统计特征频率和更新所述特征频次计数集合;
结合所述差异最大的候选特征、所述频次阈值百分比集合计算所述频次阈值百分比集合中每个频次阈值百分比的频率阈值;
将所述频率阈值和所述特征频次计数集合中的特征频率进行比较,根据比较结果确定所述训练候选特征集的子集合;
通过误差沿时间反向传播算法利用所述训练候选特征集的子集合和所述目标负荷对所述神经网络前馈长短期记忆网络进行多次训练,将训练后的测试误差最小的神经网络前馈长短期记忆网络对应的训练候选特征集的子集合作为所述训练候选特征的最优训练特征子集。
7.根据权利要求1所述的方法,其特征在于,在利用所述最优训练特征子集和所述目标负荷训练预先构建的多个短期负荷预测模型之前,包括:
分别基于全连接神经网络、卷积神经网络和长短时记忆网络构建所述多个短期负荷预测模型。
8.一种基于特征选择的电力系统短期负荷预测装置,其特征在于,包括:
获取模块,用于获取电力系统的候选特征集;
第一选择模块,用于基于预先搭建的神经网络前馈长短期记忆网络对所述候选特征集进行特征选择,得到最优特征子集;
输入模块,用于将所述最优特征子集输入预先训练的目标短期负荷预测模型,得到所述电力系统的短期负荷,其中,所述目标短期负荷预测模型由所述电力系统的最优训练特征子集和对应的目标负荷训练得到。
9.根据权利要求8所述的装置,其特征在于,在将所述最优特征子集输入预先训练的目标短期负荷预测模型之前,还包括:
训练模块,用于利用训练候选特征集和目标负荷对预先构建的神经网络前馈长短期记忆网络进行训练,得到训练结果;
第二选择模块,用于根据所述训练结果和特征选择方法在所述训练候选特征集中选择所述最优训练特征子集;
确定模块,用于利用所述最优训练特征子集和所述目标负荷训练预先构建的多个短期负荷预测模型,通过比较测试误差确定出所述目标短期负荷预测模型。
10.根据权利要求9所述的装置,其特征在于,所述训练模块包括:
拟合单元,用于通过误差沿时间反向传播算法利用所述训练候选特征集和所述目标负荷对所述神经网络前馈长短期记忆网络进行多次训练;
排列单元,用于将训练后的测试误差最小的神经网络前馈长短期记忆网络的输出取绝对值,将所述绝对值的每一行按从大到小排列得到所述特征重要性矩阵以及相应的位置重要性矩阵。
11.根据权利要求10所述的装置,其特征在于,所述第二选择模块包括:
第一计算单元,用于对所述特征重要性矩阵进行划分得到重要样本特征信息,计算所述特征重要性矩阵中两样本特征信息的差异得到样本差异集合,通过所述样本差异集合确定差异最大的候选特征;
第二计算单元,用于根据所述位置重要性矩阵统计特征频次计数,根据预设的频次阈值百分比和所述差异最大的候选特征计算多个频率阈值,将所述多个频率阈值与所述特征频次计数进行比较,得到所述训练候选特征集的子集合,利用所述训练候选特征集的子集合和所述目标负荷训练所述神经网络前馈长短期记忆网络,通过比较测试误差在所述训练候选特征集的子集合中确定出所述最优训练特征子集。
12.根据权利要求11所述的装置,其特征在于,所述第一计算单元进一步用于,
将所述特征重要性矩阵按列分为重要样本和不重要样本,根据所述重要样本得到所述重要样本特征信息;
遍历所述特征重要性矩阵的每一列,计算两样本特征信息差异得到所述样本差异集合;
根据所述样本差异集合绘制样本差异曲线,找到所述样本差异曲线最大点对应的横坐标作为所述差异最大的候选特征。
13.根据权利要求12所述的装置,其特征在于,所述第二计算单元进一步用于,
设置用于生成候选特征子集的频次阈值百分比集合和计算所述重要样本特征信息中的每个特征频率的特征频次计数集合;
根据所述位置重要性矩阵统计特征频率和更新所述特征频次计数集合;
结合所述差异最大的候选特征、所述频次阈值百分比集合计算所述频次阈值百分比集合中每个频次阈值百分比的频率阈值;
将所述频率阈值和所述特征频次计数集合中的特征频率进行比较,根据比较结果确定所述训练候选特征集的子集合;
通过误差沿时间反向传播算法利用所述训练候选特征集的子集合和所述目标负荷对所述神经网络前馈长短期记忆网络进行多次训练,将训练后的测试误差最小的神经网络前馈长短期记忆网络对应的训练候选特征集的子集合作为所述训练候选特征的最优训练特征子集。
14.根据权利要求8所述的装置,其特征在于,包括:
构建模块,用于利用所述最优训练特征子集和所述目标负荷训练预先构建的多个短期负荷预测模型之前,分别基于全连接神经网络、卷积神经网络和长短时记忆网络构建所述多个短期负荷预测模型。
15.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-7任一项所述的基于特征选择的电力系统短期负荷预测方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7任一项所述的基于特征选择的电力系统短期负荷预测方法。
CN202210551151.0A 2022-05-18 2022-05-18 基于特征选择的电力系统短期负荷预测方法及装置 Active CN114881343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210551151.0A CN114881343B (zh) 2022-05-18 2022-05-18 基于特征选择的电力系统短期负荷预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210551151.0A CN114881343B (zh) 2022-05-18 2022-05-18 基于特征选择的电力系统短期负荷预测方法及装置

Publications (2)

Publication Number Publication Date
CN114881343A true CN114881343A (zh) 2022-08-09
CN114881343B CN114881343B (zh) 2023-11-14

Family

ID=82676746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210551151.0A Active CN114881343B (zh) 2022-05-18 2022-05-18 基于特征选择的电力系统短期负荷预测方法及装置

Country Status (1)

Country Link
CN (1) CN114881343B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115392594A (zh) * 2022-10-27 2022-11-25 南方电网数字电网研究院有限公司 一种基于神经网络和特征筛选的用电负荷模型训练方法
CN116484201A (zh) * 2023-04-28 2023-07-25 中国长江三峡集团有限公司 新能源电网负载预测方法、装置及电子设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967542A (zh) * 2017-12-21 2018-04-27 国网浙江省电力公司丽水供电公司 一种基于长短期记忆网络的售电量预测方法
CN108830487A (zh) * 2018-06-21 2018-11-16 王芊霖 基于长短时神经网络的电力负荷预测方法
CN109344990A (zh) * 2018-08-02 2019-02-15 中国电力科学研究院有限公司 一种基于dfs和svm特征选择的短期负荷预测方法及系统
CN110188919A (zh) * 2019-04-22 2019-08-30 武汉大学 一种基于长短期记忆网络的负荷预测方法
CN110852496A (zh) * 2019-10-29 2020-02-28 同济大学 一种基于lstm循环神经网络的天然气负荷预测方法
CN110909941A (zh) * 2019-11-26 2020-03-24 广州供电局有限公司 基于lstm神经网络的电力负荷预测方法、装置及系统
CN111311001A (zh) * 2020-02-17 2020-06-19 合肥工业大学 基于DBSCAN算法和特征选择的Bi-LSTM网络短期负荷预测方法
CN111931989A (zh) * 2020-07-10 2020-11-13 国网浙江省电力有限公司绍兴供电公司 基于深度学习神经网络的电力系统短期负荷预测方法
CN111985719A (zh) * 2020-08-27 2020-11-24 华中科技大学 一种基于改进的长短期记忆网络的电力负荷预测方法
CN112348168A (zh) * 2020-10-27 2021-02-09 国网四川省电力公司经济技术研究院 考虑数据缺失和特征冗余的超短期负荷预测方法及系统
CN113158572A (zh) * 2021-04-27 2021-07-23 上海交通大学 一种短期负荷的预测方法及装置
CN114169645A (zh) * 2021-12-31 2022-03-11 中国南方电网有限责任公司 一种智能电网短期负荷预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093285A (zh) * 2013-01-22 2013-05-08 清华大学 基于人工神经网络的短期负荷预测方法
CN109886498B (zh) * 2019-03-01 2022-03-22 北京邮电大学 一种基于特征选择的emd-gru短期电力负荷预测方法
CN110516831A (zh) * 2019-06-18 2019-11-29 国网(北京)节能设计研究院有限公司 一种基于mwoa算法优化svm的短期负荷预测方法
CN114444660A (zh) * 2022-01-24 2022-05-06 南京电力设计研究院有限公司 基于注意力机制和lstm的短期电力负荷预测方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967542A (zh) * 2017-12-21 2018-04-27 国网浙江省电力公司丽水供电公司 一种基于长短期记忆网络的售电量预测方法
CN108830487A (zh) * 2018-06-21 2018-11-16 王芊霖 基于长短时神经网络的电力负荷预测方法
CN109344990A (zh) * 2018-08-02 2019-02-15 中国电力科学研究院有限公司 一种基于dfs和svm特征选择的短期负荷预测方法及系统
CN110188919A (zh) * 2019-04-22 2019-08-30 武汉大学 一种基于长短期记忆网络的负荷预测方法
CN110852496A (zh) * 2019-10-29 2020-02-28 同济大学 一种基于lstm循环神经网络的天然气负荷预测方法
CN110909941A (zh) * 2019-11-26 2020-03-24 广州供电局有限公司 基于lstm神经网络的电力负荷预测方法、装置及系统
CN111311001A (zh) * 2020-02-17 2020-06-19 合肥工业大学 基于DBSCAN算法和特征选择的Bi-LSTM网络短期负荷预测方法
CN111931989A (zh) * 2020-07-10 2020-11-13 国网浙江省电力有限公司绍兴供电公司 基于深度学习神经网络的电力系统短期负荷预测方法
CN111985719A (zh) * 2020-08-27 2020-11-24 华中科技大学 一种基于改进的长短期记忆网络的电力负荷预测方法
CN112348168A (zh) * 2020-10-27 2021-02-09 国网四川省电力公司经济技术研究院 考虑数据缺失和特征冗余的超短期负荷预测方法及系统
CN113158572A (zh) * 2021-04-27 2021-07-23 上海交通大学 一种短期负荷的预测方法及装置
CN114169645A (zh) * 2021-12-31 2022-03-11 中国南方电网有限责任公司 一种智能电网短期负荷预测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115392594A (zh) * 2022-10-27 2022-11-25 南方电网数字电网研究院有限公司 一种基于神经网络和特征筛选的用电负荷模型训练方法
CN116484201A (zh) * 2023-04-28 2023-07-25 中国长江三峡集团有限公司 新能源电网负载预测方法、装置及电子设备
CN116484201B (zh) * 2023-04-28 2024-05-17 中国长江三峡集团有限公司 新能源电网负载预测方法、装置及电子设备

Also Published As

Publication number Publication date
CN114881343B (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
JP6969637B2 (ja) 因果関係分析方法および電子デバイス
US20150254554A1 (en) Information processing device and learning method
CN114881343B (zh) 基于特征选择的电力系统短期负荷预测方法及装置
CN110147367B (zh) 一种温度缺失数据填补方法、系统及电子设备
CN112598248A (zh) 负荷预测方法、装置、计算机设备和存储介质
Bai et al. A forecasting method of forest pests based on the rough set and PSO-BP neural network
CN114298323A (zh) 生成机器学习样本的组合特征的方法及系统
CN109636212B (zh) 作业实际运行时间的预测方法
CN112181659B (zh) 云仿真内存资源预测模型构建方法与内存资源预测方法
CN116450486A (zh) 多元异构计算系统内节点的建模方法、装置、设备及介质
CN113946983A (zh) 产品可靠性薄弱环节评估方法、装置和计算机设备
Velasco et al. Rainfall forecasting using support vector regression machines
CN116306030A (zh) 考虑预测误差和波动分布的新能源预测动态场景生成方法
Mlakar et al. Ensemble weather forecast post-processing with a flexible probabilistic neural network approach
CN116186507A (zh) 一种特征子集的选取方法、装置及存储介质
CN114784795A (zh) 风电功率预测方法、装置、电子设备及存储介质
CN112859034B (zh) 自然环境雷达回波幅度模型分类方法和装置
CN115204501A (zh) 企业评估方法、装置、计算机设备和存储介质
CN115310355A (zh) 考虑多能耦合的综合能源系统多元负荷预测方法及系统
CN115473219A (zh) 负荷预测方法、装置、计算机设备和存储介质
CN111949530B (zh) 测试结果的预测方法、装置、计算机设备及存储介质
CN111026661B (zh) 一种软件易用性全面测试方法及系统
CN114282657A (zh) 一种市场数据长期预测模型训练方法、装置、设备及存储介质
Jiang et al. Srgm decision model considering cost-reliability
JP2020161044A (ja) データ管理システム、データ管理方法、およびデータ管理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant