CN112508224B - 微电网多模型负荷预测自适应选择方法、系统及存储介质 - Google Patents

微电网多模型负荷预测自适应选择方法、系统及存储介质 Download PDF

Info

Publication number
CN112508224B
CN112508224B CN202011102291.7A CN202011102291A CN112508224B CN 112508224 B CN112508224 B CN 112508224B CN 202011102291 A CN202011102291 A CN 202011102291A CN 112508224 B CN112508224 B CN 112508224B
Authority
CN
China
Prior art keywords
classifier
sub
model
training
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011102291.7A
Other languages
English (en)
Other versions
CN112508224A (zh
Inventor
吕振华
李强
李群
黄强
孙蓉
汪成根
韩华春
唐伟佳
吴盛军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Jiangsu Electric Power Co Ltd, Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202011102291.7A priority Critical patent/CN112508224B/zh
Publication of CN112508224A publication Critical patent/CN112508224A/zh
Application granted granted Critical
Publication of CN112508224B publication Critical patent/CN112508224B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明公开了一种微电网多模型负荷预测自适应选择方法、系统及存储介质,本发明的方法基于单一SVM、ANN和KNN模型,采用Adaboost方法,对于单一模型,选取不同数目的子分类器进行自适应增强,即通过对训练数据设置权值,并对各个子分类器设置训练权重的方法,及时对训练样本的分布进行调整,使得模型的训练更多地关注到预测错误率较高的时刻点,进一步提高原有模型的预测精度,从而验证本发明所提自适应增强预测方法的准确性和实用性,提高电网运行调度的经济性和稳定性。

Description

微电网多模型负荷预测自适应选择方法、系统及存储介质
技术领域
本发明属于微电网负荷预测和经济调度技术领域,具体来说,涉及一种多模型负荷预测自适应选择方法。
背景技术
近年来,电力需求增速超过一次能源消费增速,电能替代是全球终端能源利用的基本趋势。2018年,中国总用电量较上年增长8.4%,并网风电发电量增长20.1%,预计2035-2040年中国一次能源消费结构将以煤炭、油气和新能源为主。负荷预测是电力系统规划、运行和调度不可或缺的组成部分,负荷预测的准确性与电网规划运行的科学合理性存在密不可分的关系。提高负荷预测的精度,可以在保证用户能够得到安全、可靠电能供应的同时,提高电网运行调度的经济性和稳定性。
已有研究进行短期负荷预测的时候,采用的往往是单一预测模型或者数个单一模型的简单加权混合,并且选取了数量较多、质量较高的模型训练数据,未考虑到数据质量较差情况下的模型精度提升问题。
发明内容
技术问题:本发明所要解决的技术问题是:提供一种微电网负荷预测自适应选择方法,提高原有模型的预测精度,提高电网运行调度的经济性和稳定性。
本发明的工作原理是:本发明提供一种微电网多模型负荷预测自适应选择方法,基于单一支持向量机SVM(Support Vector Machine)、人工神经网络ANN(ArtificialNeural Network)和K近邻KNN(K-Nearest Neighbors) 模型,采用Adaboost方法,对于单一模型,选取不同数目的子分类器进行自适应增强,即通过对训练数据设置权值,并对各个子分类器设置训练权重的方法,及时对训练样本的分布进行调整,使得模型的训练更多地关注到预测错误率较高的时刻点,进一步提高原有模型的预测精度。
技术方案:一种微电网多模型负荷预测自适应选择方法,包括以下步骤:
步骤10)获取样本数据参数,建立模型训练数据集;
步骤20)根据步骤10)建立的模型训练数据集,设置并初始化训练数据的权重分布;
步骤30)建立负荷预测弱分类器模型,所述负荷预测弱分类器模型包括多项机器学习模型;
步骤40)根据步骤30)建立的弱分类器模型,分别设置子分类器数目和子分类器权重;
步骤50)根据步骤20)设置的数据权重分布,使用所述数据权重分布下的样本数据训练子分类器;
步骤60)根据步骤40)设置的子分类器权重和步骤50)子分类器模型训练时的回归误差率,采用加权归一法更新步骤50)中的数据权重分布;
步骤70)根据步骤50)的训练结果和步骤40)设置的子分类器权重,更新子分类器权重;
步骤80)选取另一子分类器,重复步骤40)~70);
步骤90)根据步骤70)和步骤80)所得各子分类器及其权重,计算加权负荷预测结果。
进一步的,本发明中,所述步骤10)中,所获取的样本数据参数为负荷参数或发电参数,将样本数据参数代入下式建立模型训练数据集:
T={(x1,y1),(x2,y2),...,(xN,yN)} (1)
式中x1,x2,...,xN为输入负荷数据,y1,y2,...,yN为输出负荷数据,N为样本数据组数。
进一步的,本发明中,所述步骤20)的具体流程为:
步骤201)设置训练样本数据权重Di,i∈N;
步骤202)初始化训练样本数据的权重分布:
进一步的,本发明中,所述步骤30)中,所述多项机器学习模型包括 SVM模型、ANN模型和KNN模型,上述3个分类器模型均为单一模型;
所述ANN模型采用基于误差反向传播算法和梯度下降理论的三层神经网络模型,损失函数采用平方误差函数;
所述KNN模型采用用户给定示例和用户自定义距离度量的方法,利用 Distance规则度量目标样本和训练样本之间的距离,并采用Brute算法搜寻目标样本近邻,最后使用近邻点进行加权平均来计算最终预测值;
所述SVM模型如下式:
Figure GDA0003736621980000031
Figure GDA0003736621980000032
式中,xi为输入数据,yi为输出数据,g(x)为回归函数,w、b分别为超平面向量参数一和超平面向量参数二,
Figure GDA0003736621980000033
为非线性映射,ε为损失函数,ζ为表征预测值与真实值的距离超过损失值ε的松弛变量一,ζ*为表征预测值与真实值的距离小于损失值ε的松弛变量二,C为平衡变量,||w||表示计算向量w的范数,s.t.表示约束条件。
进一步的,本发明中,所述步骤40)中,根据步骤30)建立的弱分类器模型,分别设置子分类器wj数目M,{wj|j∈M},并设置子分类器权重αj来描述弱单一分类器在最终自适应增强的分类器中的权重。
进一步的,本发明中,所述步骤50)中,基于步骤20)设置的数据权重分布,使用该权重分布下的样本数据训练子分类器wj
进一步的,本发明中,所述步骤60)中,为了使得分类器wj+1能够更多地关注到分类器wj预测错误的数据点,对训练样本权重分布进行更新,样本权重更新公式如下:
Figure GDA0003736621980000041
式中,
Figure GDA0003736621980000042
为第j个分类器训练时第i个样本数据的权重,
Figure GDA0003736621980000043
为第j个分类器在第i个样本数据处的回归误差率,αj为第j个分类器的权重。
进一步的,本发明中,所述步骤70)中,根据步骤50)的训练结果和步骤40)设置的子分类器权重,根据下式更新子分类器权重:
Figure GDA0003736621980000044
式中,δj为第j个分类器的回归误差率,αj为第j个分类器的权重。
进一步的,本发明中,所述步骤80)中,选取另一子分类器,重复步骤40)~70);
进一步的,本发明中,所述步骤90)中,根据步骤70)和步骤80)所得各子分类器及其权重,计算加权负荷预测结果W:
Figure GDA0003736621980000051
式中,M为子分类器数目,wj(x)为第j个分类器,αj为第j个分类器的权重。
一种微电网多模型负荷预测自适应选择系统,包括以下程序模块:
样本数据获取模块:获取样本数据参数,建立模型训练数据集;
设置并初始化训练数据的权重模块:根据建立的模型训练数据集,设置并初始化训练数据的权重分布;
建立负荷预测弱分类器模型模块:所述负荷预测弱分类器模型包括多项机器学习模型;
设置子分类器数目模块:根据建立的弱分类器模型,分别设置子分类器数目和子分类器权重;
训练子分类器模块:根据设置并初始化训练数据的权重模块设置的数据权重分布,使用所述数据权重分布下的样本数据训练子分类器;
更新数据权重分布模块:根据设置子分类器数目模块设置的子分类器权重和子分类器模型训练时的回归误差率,采用加权归一法更新训练子分类器模块中的数据权重分布;
更新子分类器权重模块:根据训练子分类器模块的训练结果和步骤设置子分类器数目模块设置的子分类器权重,更新子分类器权重;
迭代模块:选取另一子分类器,重复运行设置子分类器数目模块、训练子分类器模块、更新数据权重分布模块和更新子分类器权重模块;
负荷预测结果输出模块:根据更新子分类器权重模块和迭代模块所得各子分类器及其权重,计算加权负荷预测结果。
一种微电网多模型负荷预测自适应选择系统的存储介质,存储以下程序模块:
样本数据获取模块:获取样本数据参数,建立模型训练数据集;
设置并初始化训练数据的权重模块:根据建立的模型训练数据集,设置并初始化训练数据的权重分布;
建立负荷预测弱分类器模型模块:所述负荷预测弱分类器模型包括多项机器学习模型;
设置子分类器数目模块:根据建立的弱分类器模型,分别设置子分类器数目和子分类器权重;
训练子分类器模块:根据设置并初始化训练数据的权重模块设置的数据权重分布,使用所述数据权重分布下的样本数据训练子分类器;
更新数据权重分布模块:根据设置子分类器数目模块设置的子分类器权重和子分类器模型训练时的回归误差率,采用加权归一法更新训练子分类器模块中的数据权重分布;
更新子分类器权重模块:根据训练子分类器模块的训练结果和步骤设置子分类器数目模块设置的子分类器权重,更新子分类器权重;
迭代模块:选取另一子分类器,重复运行设置子分类器数目模块、训练子分类器模块、更新数据权重分布模块和更新子分类器权重模块;
负荷预测结果输出模块:根据更新子分类器权重模块和迭代模块所得各子分类器及其权重,计算加权负荷预测结果。
本发明所达到的有益效果:传统的短期负荷预测采用的往往是单一预测模型或者数个单一模型的简单加权混合,并且选取了数量较多、质量较高的模型训练数据,未考虑到数据质量较差情况下的模型精度提升问题。本发明基于单一SVM、ANN和KNN模型,采用Adaboost方法,对于单一模型,选取不同数目的子分类器进行自适应增强,即通过对训练数据设置权值,并对各个子分类器设置训练权重的方法,及时对训练样本的分布进行调整,使得模型的训练更多地关注到预测错误率较高的时刻点,进一步提高原有模型的预测精度,从而验证本发明所提自适应增强预测方法的准确性和实用性,提高电网运行调度的经济性和稳定性。
附图说明
图1为本发明微电网多模型负荷预测自适应选择方法的实施例1的流程图;
图2为本发明实施例1中Adaboost自适应选择方法的流程图;
图3为本发明实施例1中居民工作日负荷预测结果;
图4为本发明实施例1中居民周末负荷预测结果。
图5为本发明实施例1中风力发电预测结果曲线。
具体实施方式
下面结合附图,对本发明实施例的技术方案做进一步的说明。
实施例1
如图1所示,本发明方法的实施例,Adaboost自适应选择方法的流程如图2所示。该方法包括以下步骤:
步骤10)获取样本数据参数,建立模型训练数据集;
步骤20)基于步骤10)建立的模型训练数据集,设置并初始化训练数据的权重分布;
步骤30)基于ANN、KNN和SVM机器学习模型原理,建立负荷预测弱分类器模型;
步骤40)基于步骤30)建立的弱分类器模型,分别设置子分类器数目和子分类器权重;
子分类器数目初始设置时,根据弱分类器模型的预测特性设置,可以任意设置,进行预测训练之后,可以根据预测精度人为地调整,例如预测精度低时,增加子一定的分类器数目,增加数目后再重新训练,如果预测精度提升,则采用该数目,如果预测精度降低,则减少数目的增加量,直至满足使用者的精度要求。一般情况下,子分类器数目越多,精度越高。子分类器数目需要使用者去测试、去选择,实施例中选取的是常用的子分类器数量,本发明的方法中,使用者选定子分类器数目后,可以提升预测性能,子分类器初始权重也是由使用者设置,可以设置为子分类器数目的倒数。
弱分类器模型包括SVM模型、ANN模型、KNN模型,所述三种弱分类器模型分别设置一定数量的子分类器,子分类器的模型和弱分类器模型相同。
步骤50)基于步骤20)设置的数据权重分布,使用该权重分布下的样本数据训练子分类器;
步骤60)基于步骤40)设置的子分类器权重和步骤50)子分类器模型训练时的回归误差率,采用加权归一法更新步骤50)中的数据权重分布;
步骤70)基于步骤50)的训练结果和步骤40)设置的子分类器权重,更新子分类器权重;
步骤80)选取另一子分类器,重复步骤40)~70);
步骤90)基于步骤70)和步骤80)所得各子分类器及其权重,计算加权负荷预测结果。
作为优选方案,所述步骤10)中,所获取的样本数据参数为负荷参数或发电参数,将样本数据参数代入下式建立模型训练数据集:
T={(x1,y1),(x2,y2),…,(xN,yN)} (1)
式中x为输入负荷数据,y为输出负荷数据,N为样本数据组数。
作为优选方案,所述步骤20)的具体流程为:
步骤201)设置训练样本数据权重Di,i∈N。
步骤202)初始化训练样本数据的权重分布:
作为优选方案,所述步骤30)中,基于机器学习模型原理,建立的负荷预测弱分类器模型有SVM模型、ANN模型和KNN模型。其中,ANN 模型采用基于误差反向传播算法和梯度下降理论的三层神经网络模型,损失函数采用平方误差函数。KNN模型采用用户给定示例和用户自定义距离度量的方法,基于Distance规则,度量目标样本和训练样本之间的距离,并采用Brute算法搜寻目标样本近邻,最后使用近邻点进行加权平均来计算最终预测值。SVM模型如下式:
Figure GDA0003736621980000091
Figure GDA0003736621980000092
式中,x为输入数据,y为输出数据,g(x)为回归函数,w、b为超平面向量参数,
Figure GDA0003736621980000093
为非线性映射,ε为损失函数,ζ为表征预测值与真实值的距离超过损失值ε的松弛变量一,ζ*为表征预测值与真实值的距离小于损失值ε的松弛变量二,C为平衡变量,||w||表示计算向量w的范数,s.t.表示约束条件。
作为优选方案,所述步骤40)中,基于步骤30)建立的弱分类器模型,分别设置子分类器wj数目M,{wj|j∈M},并设置子分类器权重αj来描述弱单一分类器在最终自适应增强的分类器中的权重。
作为优选方案,所述步骤50)中,基于步骤20)设置的数据权重分布,使用该权重分布下的样本数据训练子分类器wj
作为优选方案,所述步骤60)中,为了使得分类器wj+1能够更多地关注到分类器wj预测错误的数据点,对训练样本权重分布进行更新。样本权重更新公式如下:
Figure GDA0003736621980000101
式中,
Figure GDA0003736621980000102
为第j个分类器训练时第i个样本数据的权重,
Figure GDA0003736621980000103
为第j个分类器在第i个样本数据处的回归误差率,αj为第j个分类器的权重。
作为优选方案,所述步骤70)中,基于步骤50)的训练结果和步骤40) 设置的子分类器权重,根据下式更新子分类器权重:
Figure GDA0003736621980000104
式中,δj为第j个分类器的回归误差率,αj为第j个分类器的权重。
作为优选方案,所述步骤80)中,选取另一子分类器,重复步骤40) ~70);
作为优选方案,所述步骤90)中,基于步骤70)和步骤80)所得各子分类器及其权重,计算加权负荷预测结果:
Figure GDA0003736621980000111
式中,M为子分类器数目,wj为第j个分类器,αj为第j个分类器的权重。
所获取的样本数据参数为负荷参数或发电参数,将样本数据参数代入下式建立模型训练数据集:
T={(x1,y1),(x2,y2),...,(xN,yN)} (1)
式中x1,x2,...,xN为输入负荷数据,y1,y2,...,yN为输出负荷数据,N为样本数据组数;
负荷参数分为工作日负荷和周末负荷,负荷参数每隔半个小时采集一次,发电参数每隔3分钟采集一次;
具体地,在步骤10)中,
本实施例采集了某地区A参与用电家庭条件评估项目的27名居民用户一年的用电负荷数据和地区B风电场的发电机出力数据。居民负荷数据起止时间为2012年11月24日0点至2013年11月23日23点30分,负荷数据每隔半个小时采集一次,每日负荷数据包括48个时刻点。由于半小时内的居民负荷数据较小,仅为0.3kWh左右,为了尽可能提高预测精度,本实施例将27名居民用户在同一时刻的用电负荷数据相加得到一个集体用电负荷数据集。将该数据集作为模型历史训练数据集。风力发电数据起止时间为2018年3月1日0点至2018年3月6日23点57分。风电数据每隔3 分钟采集一次,每日风电数据包括480个时刻点。由于该风电场每日12点后的风力发电数据缺失度较大,数据质量较差,在实施例中仅选取了每日前240个时刻点的数据用于预测分析。
在步骤30)中,本实施例首先采用SVM、ANN和KNN的单一模型进行分场景预测。其中,居民负荷预测场景细分为工作日负荷和周末负荷。 SVM模型核函数选取径向基核函数。ANN模型为3层神经网络,隐藏层神经元数目设置为10,激励函数采用修正过的线性单位函数,权重调整采用随梯度下降算法,最大迭代次数上限设置为10000次。KNN模型最近邻 K设置为5,采用Distance规则确定近邻样本的权重。
在步骤90)中,
为了进一步提高预测准确性,本实施例采用Adaboost算法对单一模型进行自适应增强,子分类器数目(num_estimators)设置为10和30两种情况进行对比。单一模型时,num_estimators=0。最后,使用增强后的预测模型对数据进行预测。图3展示了居民工作日负荷预测结果,图中的蓝色曲线代表了预测点的真实值的分布情况,红色曲线为预测值的分布情况。表1 展示了居民工作日负荷预测在预测错误率和均方根误差RMSE方面的表现。图4展示了居民周末负荷预测结果,表2展示了居民周末负荷预测在预测错误率和均方根误差方面的表现。图5展示了风力发电预测结果曲线,表3展示了风力发电预测在预测错误率和均方根误差方面的表现。
表1居民工作日负荷预测数据分析
Figure GDA0003736621980000121
Figure GDA0003736621980000131
表2居民工作日负荷预测数据分析
Figure GDA0003736621980000132
表3居民工作日负荷预测数据分析
Figure GDA0003736621980000133
Figure GDA0003736621980000141
由图3和表1可知,单一模型预测结果中,SVM模型的预测错误率最低。对单一预测模型进行自适应增强后,子分类器数目的增加导致了模型预测错误率的降低。当子分类器数目为30时,SVM增强模型表现最好,预测错误率降低约3%,RMSE降低约4.4%,预测结果与真实值的偏差进一步降低,Adaboost算法有效性得到证明。
由图4和表2可知,单一模型预测结果中,SVM模型的预测错误率依旧最低。对单一预测模型进行自适应增强后,模型预测错误率普遍降低,证明预测结果确实得到了优化,这是希望看到的。但居民周末负荷的预测错误率比工作日负荷预测要高,原因可能是居民周末用电负荷随机性强、波动性高,预测难度相对工作日而言较高。
不同于居民负荷预测场景,风力发电场景下的随机性更强。本实施例选取了质量较差的风电数据,仅包含6天的数据。在此场景,采用Adaboost 算法对单一预测模型进行增强,结果显示预测准确度的提升比居民负荷场景更高。由图5和表3可知,自适应增强后的模型预测错误率得到降低,其中,增强SVM模型预测准确度提高约12%,RMSE降低约18.5%。结果证明了Adaboost自适应增强算法在数据质量较差的情况下,能够获得更高的准确度提升。
一种微电网多模型负荷预测自适应选择系统,包括以下程序模块:
样本数据获取模块:获取样本数据参数,建立模型训练数据集;
设置并初始化训练数据的权重模块:根据建立的模型训练数据集,设置并初始化训练数据的权重分布;
建立负荷预测弱分类器模型模块:所述负荷预测弱分类器模型包括多项机器学习模型;
设置子分类器数目模块:根据建立的弱分类器模型,分别设置子分类器数目和子分类器权重;
训练子分类器模块:根据设置并初始化训练数据的权重模块设置的数据权重分布,使用所述数据权重分布下的样本数据训练子分类器;
更新数据权重分布模块:根据设置子分类器数目模块设置的子分类器权重和子分类器模型训练时的回归误差率,采用加权归一法更新训练子分类器模块中的数据权重分布;
更新子分类器权重模块:根据训练子分类器模块的训练结果和步骤设置子分类器数目模块设置的子分类器权重,更新子分类器权重;
迭代模块:选取另一子分类器,重复运行设置子分类器数目模块、训练子分类器模块、更新数据权重分布模块和更新子分类器权重模块;
负荷预测结果输出模块:根据更新子分类器权重模块和迭代模块所得各子分类器及其权重,计算加权负荷预测结果。
一种微电网多模型负荷预测自适应选择系统的存储介质,存储以下程序模块:
样本数据获取模块:获取样本数据参数,建立模型训练数据集;
设置并初始化训练数据的权重模块:根据建立的模型训练数据集,设置并初始化训练数据的权重分布;
建立负荷预测弱分类器模型模块:所述负荷预测弱分类器模型包括多项机器学习模型;
设置子分类器数目模块:根据建立的弱分类器模型,分别设置子分类器数目和子分类器权重;
训练子分类器模块:根据设置并初始化训练数据的权重模块设置的数据权重分布,使用所述数据权重分布下的样本数据训练子分类器;
更新数据权重分布模块:根据设置子分类器数目模块设置的子分类器权重和子分类器模型训练时的回归误差率,采用加权归一法更新训练子分类器模块中的数据权重分布;
更新子分类器权重模块:根据训练子分类器模块的训练结果和步骤设置子分类器数目模块设置的子分类器权重,更新子分类器权重;
迭代模块:选取另一子分类器,重复运行设置子分类器数目模块、训练子分类器模块、更新数据权重分布模块和更新子分类器权重模块;
负荷预测结果输出模块:根据更新子分类器权重模块和迭代模块所得各子分类器及其权重,计算加权负荷预测结果。
本发明实施例的方法,针对微网中通过量测设备获得的数据质量较差时的情况,基于单一SVM、ANN和KNN模型,采用Adaboost方法,对于单一模型,选取不同数目的子分类器进行自适应增强,即通过对训练数据设置权值,并对各个子分类器设置训练权重的方法,及时对训练样本的分布进行调整,使得模型的训练更多地关注到预测错误率较高的时刻点,进一步提高原有模型的预测精度。
以上显示和描述了本发明的基本原理、主要特征和优点。本领域的技术人员应该了解,本发明不受上述具体实施例的限制,上述具体实施例和说明书中的描述只是为了进一步说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护的范围由权利要求书及其等效物界定。

Claims (7)

1.一种微电网多模型负荷预测自适应选择方法,其特征在于,包括以下步骤:
步骤10)获取样本数据参数,建立模型训练数据集;
所获取的样本数据参数为负荷参数或发电参数,将样本数据参数代入下式建立模型训练数据集:
T={(x1,y1),(x2,y2),...,(xN,yN)} (1)
式中x1,x2,...,xN为输入负荷数据,y1,y2,...,yN为输出负荷数据,N为样本数据组数;负荷参数包括工作日负荷和周末负荷,负荷参数每隔半个小时采集一次,发电参数每隔3分钟采集一次;
步骤20)根据步骤10)建立的模型训练数据集,设置并初始化训练数据的权重分布;
步骤30)建立负荷预测弱分类器模型,所述负荷预测弱分类器模型包括多项机器学习模型;
所述多项机器学习模型包括SVM模型、ANN模型和KNN模型,上述3个分类器模型均为单一模型;
所述ANN模型采用基于误差反向传播算法和梯度下降理论的三层神经网络模型,损失函数采用平方误差函数;
所述KNN模型采用用户给定示例和用户自定义距离度量的方法,利用Distance规则度量目标样本和训练样本之间的距离,并采用Brute算法搜寻目标样本近邻,最后使用近邻点进行加权平均来计算最终预测值;
所述SVM模型如下式:
Figure FDA0003767207060000011
Figure FDA0003767207060000021
式中,xi为输入数据,yi为输出数据,g(x)为回归函数,w、b分别为超平面向量参数一和超平面向量参数二,
Figure FDA0003767207060000022
为非线性映射,ε为损失函数,ζ为表征预测值与真实值的距离超过损失值ε的松弛变量一,ζ*为表征预测值与真实值的距离小于损失值ε的松弛变量二,C为平衡变量,||w||表示计算向量w的范数,s.t.表示约束条件;
步骤40)根据步骤30)建立的弱分类器模型,分别设置子分类器数目和子分类器权重;
步骤50)根据步骤20)设置的数据权重分布,使用所述数据权重分布下的样本数据训练子分类器;
步骤60)根据步骤40)设置的子分类器权重和步骤50)子分类器模型训练时的回归误差率,采用加权归一法更新步骤50)中的数据权重分布;
为使得分类器wj+1能够更多地关注到分类器wj预测错误的数据点,对训练样本权重分布进行更新,样本权重更新公式如下:
Figure FDA0003767207060000023
式中,Di j为第j个分类器训练时第i个样本数据的权重,
Figure FDA0003767207060000024
为第j个分类器在第i个样本数据处的回归误差率,αj为第j个分类器的权重;
步骤70)根据步骤50)的训练结果和步骤40)设置的子分类器权重,更新子分类器权重;
根据步骤50)的训练结果和步骤40)设置的子分类器权重,根据下式更新子分类器权重:
Figure FDA0003767207060000031
式中,δj为第j个分类器的回归误差率,αj为第j个分类器的权重;
步骤80)选取另一子分类器,重复步骤40)~70);
步骤90)根据步骤70)和步骤80)所得各子分类器及其权重,计算加权负荷预测结果。
2.根据权利要求1所述的一种微电网多模型负荷预测自适应选择方法,其特征在于:所述步骤20)的具体流程为:
步骤201)设置训练样本数据权重Di,i∈N;
步骤202)初始化训练样本数据的权重分布。
3.根据权利要求1所述的一种微电网多模型负荷预测自适应选择方法,其特征在于:所述步骤40)中,根据步骤30)建立的弱分类器模型,分别设置子分类器wj数目M,{wj|j∈M},并设置子分类器权重αj来描述弱单一分类器在最终自适应增强的分类器中的权重。
4.根据权利要求1所述的一种微电网多模型负荷预测自适应选择方法,其特征在于:所述步骤50)中,基于步骤20)设置的数据权重分布,使用该权重分布下的样本数据训练子分类器wj
5.根据权利要求1所述的一种微电网多模型负荷预测自适应选择方法,其特征在于:所述步骤90)中,根据步骤70)和步骤80)所得各子分类器及其权重,计算加权负荷预测结果W:
Figure FDA0003767207060000032
式中,M为子分类器数目,wj(x)为第j个分类器,αj为第j个分类器的权重。
6.一种微电网多模型负荷预测自适应选择系统,其特征在于,包括以下程序模块:
样本数据获取模块:获取样本数据参数,建立模型训练数据集;
所获取的样本数据参数为负荷参数或发电参数,将样本数据参数代入下式建立模型训练数据集:
T={(x1,y1),(x2,y2),...,(xN,yN)} (1)
式中x1,x2,...,xN为输入负荷数据,y1,y2,...,yN为输出负荷数据,N为样本数据组数;负荷参数包括工作日负荷和周末负荷,负荷参数每隔半个小时采集一次,发电参数每隔3分钟采集一次;
设置并初始化训练数据的权重模块:根据建立的模型训练数据集,设置并初始化训练数据的权重分布;
建立负荷预测弱分类器模型模块:所述负荷预测弱分类器模型包括多项机器学习模型;
所述多项机器学习模型包括SVM模型、ANN模型和KNN模型,上述3个分类器模型均为单一模型;
所述ANN模型采用基于误差反向传播算法和梯度下降理论的三层神经网络模型,损失函数采用平方误差函数;
所述KNN模型采用用户给定示例和用户自定义距离度量的方法,利用Distance规则度量目标样本和训练样本之间的距离,并采用Brute算法搜寻目标样本近邻,最后使用近邻点进行加权平均来计算最终预测值;
所述SVM模型如下式:
Figure FDA0003767207060000051
Figure FDA0003767207060000052
式中,xi为输入数据,yi为输出数据,g(x)为回归函数,w、b分别为超平面向量参数一和超平面向量参数二,
Figure FDA0003767207060000053
为非线性映射,ε为损失函数,ζ为表征预测值与真实值的距离超过损失值ε的松弛变量一,ζ*为表征预测值与真实值的距离小于损失值ε的松弛变量二,C为平衡变量,||w||表示计算向量w的范数,s.t.表示约束条件;
设置子分类器数目模块:根据建立的弱分类器模型,分别设置子分类器数目和子分类器权重;
训练子分类器模块:根据设置并初始化训练数据的权重模块设置的数据权重分布,使用所述数据权重分布下的样本数据训练子分类器;
更新数据权重分布模块:根据设置子分类器数目模块设置的子分类器权重和子分类器模型训练时的回归误差率,采用加权归一法更新训练子分类器模块中的数据权重分布;
为使得分类器wj+1能够更多地关注到分类器wj预测错误的数据点,对训练样本权重分布进行更新,样本权重更新公式如下:
Figure FDA0003767207060000054
式中,Di j为第j个分类器训练时第i个样本数据的权重,
Figure FDA0003767207060000055
为第j个分类器在第i个样本数据处的回归误差率,αj为第j个分类器的权重;
更新子分类器权重模块:根据训练子分类器模块的训练结果和设置子分类器数目模块设置的子分类器权重,更新子分类器权重;
根据训练子分类器模块的训练结果和设置子分类器数目模块设置的子分类器权重,根据下式更新子分类器权重:
Figure FDA0003767207060000061
式中,δj为第j个分类器的回归误差率,αj为第j个分类器的权重;
迭代模块:选取另一子分类器,重复运行设置子分类器数目模块、训练子分类器模块、更新数据权重分布模块和更新子分类器权重模块;
负荷预测结果输出模块:根据更新子分类器权重模块和迭代模块所得各子分类器及其权重,计算加权负荷预测结果。
7.一种微电网多模型负荷预测自适应选择系统的存储介质,其特征在于,存储以下程序模块:
样本数据获取模块:获取样本数据参数,建立模型训练数据集;
所获取的样本数据参数为负荷参数或发电参数,将样本数据参数代入下式建立模型训练数据集:
T={(x1,y1),(x2,y2),...,(xN,yN)} (1)
式中x1,x2,...,xN为输入负荷数据,y1,y2,...,yN为输出负荷数据,N为样本数据组数;负荷参数包括工作日负荷和周末负荷,负荷参数每隔半个小时采集一次,发电参数每隔3分钟采集一次;
设置并初始化训练数据的权重模块:根据建立的模型训练数据集,设置并初始化训练数据的权重分布;
建立负荷预测弱分类器模型模块:所述负荷预测弱分类器模型包括多项机器学习模型;
所述多项机器学习模型包括SVM模型、ANN模型和KNN模型,上述3个分类器模型均为单一模型;
所述ANN模型采用基于误差反向传播算法和梯度下降理论的三层神经网络模型,损失函数采用平方误差函数;
所述KNN模型采用用户给定示例和用户自定义距离度量的方法,利用Distance规则度量目标样本和训练样本之间的距离,并采用Brute算法搜寻目标样本近邻,最后使用近邻点进行加权平均来计算最终预测值;
所述SVM模型如下式:
Figure FDA0003767207060000071
Figure FDA0003767207060000072
式中,xi为输入数据,yi为输出数据,g(x)为回归函数,w、b分别为超平面向量参数一和超平面向量参数二,
Figure FDA0003767207060000073
为非线性映射,ε为损失函数,ζ为表征预测值与真实值的距离超过损失值ε的松弛变量一,ζ*为表征预测值与真实值的距离小于损失值ε的松弛变量二,C为平衡变量,||w||表示计算向量w的范数,s.t.表示约束条件;
设置子分类器数目模块:根据建立的弱分类器模型,分别设置子分类器数目和子分类器权重;
训练子分类器模块:根据设置并初始化训练数据的权重模块设置的数据权重分布,使用所述数据权重分布下的样本数据训练子分类器;
更新数据权重分布模块:根据设置子分类器数目模块设置的子分类器权重和子分类器模型训练时的回归误差率,采用加权归一法更新训练子分类器模块中的数据权重分布;
为使得分类器wj+1能够更多地关注到分类器wj预测错误的数据点,对训练样本权重分布进行更新,样本权重更新公式如下:
Figure FDA0003767207060000081
式中,Di j为第j个分类器训练时第i个样本数据的权重,
Figure FDA0003767207060000082
为第j个分类器在第i个样本数据处的回归误差率,αj为第j个分类器的权重;
更新子分类器权重模块:根据训练子分类器模块的训练结果和设置子分类器数目模块设置的子分类器权重,更新子分类器权重;
根据训练子分类器模块的训练结果和设置子分类器数目模块设置的子分类器权重,根据下式更新子分类器权重:
Figure FDA0003767207060000083
式中,δj为第j个分类器的回归误差率,αj为第j个分类器的权重;
迭代模块:选取另一子分类器,重复运行设置子分类器数目模块、训练子分类器模块、更新数据权重分布模块和更新子分类器权重模块;
负荷预测结果输出模块:根据更新子分类器权重模块和迭代模块所得各子分类器及其权重,计算加权负荷预测结果。
CN202011102291.7A 2020-10-15 2020-10-15 微电网多模型负荷预测自适应选择方法、系统及存储介质 Active CN112508224B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011102291.7A CN112508224B (zh) 2020-10-15 2020-10-15 微电网多模型负荷预测自适应选择方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011102291.7A CN112508224B (zh) 2020-10-15 2020-10-15 微电网多模型负荷预测自适应选择方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN112508224A CN112508224A (zh) 2021-03-16
CN112508224B true CN112508224B (zh) 2022-09-06

Family

ID=74953850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011102291.7A Active CN112508224B (zh) 2020-10-15 2020-10-15 微电网多模型负荷预测自适应选择方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN112508224B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116979531B (zh) * 2023-09-25 2023-12-12 山西京能售电有限责任公司 一种新型能源数据监控方法以及监控辅助电力市场的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110707763A (zh) * 2019-10-17 2020-01-17 南京理工大学 一种基于集成学习的交直流配电网负荷预测方法
CN111563615A (zh) * 2020-04-17 2020-08-21 国网天津市电力公司 一种基于特征分析与组合学习的负荷预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110707763A (zh) * 2019-10-17 2020-01-17 南京理工大学 一种基于集成学习的交直流配电网负荷预测方法
CN111563615A (zh) * 2020-04-17 2020-08-21 国网天津市电力公司 一种基于特征分析与组合学习的负荷预测方法

Also Published As

Publication number Publication date
CN112508224A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
Amjady et al. Short-term load forecast of microgrids by a new bilevel prediction strategy
CN108306303B (zh) 一种考虑负荷增长和新能源出力随机的电压稳定评估方法
CN109165774A (zh) 一种短期光伏功率预测方法
CN110766200A (zh) 一种基于K-means均值聚类的风电机组发电功率预测方法
CN110443417A (zh) 基于小波变换的多模型集成负荷预测方法
CN111260116A (zh) 一种基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法
CN110866633B (zh) 一种基于svr支持向量回归的微电网超短期负荷预测方法
CN113783224A (zh) 一种考虑多种分布式能源运行的配电网双层优化规划方法
CN109657884A (zh) 电网供电优化方法、装置、设备和计算机可读存储介质
CN110895773A (zh) 一种基于广义需求侧资源的dbn电网负荷预测方法及装置
CN106980910A (zh) 中长期电力负荷测算系统及方法
CN110298494A (zh) 一种基于分段聚类及组合优化的风电功率预测方法
CN109214546A (zh) 一种基于改进的hs-narx神经网络的电力短期负荷预测方法
CN112952807A (zh) 考虑风电不确定性与需求响应的多目标优化调度方法
CN112508224B (zh) 微电网多模型负荷预测自适应选择方法、系统及存储介质
CN115545333A (zh) 一种多负荷日类型配电网负荷曲线预测方法
CN116826710A (zh) 基于负荷预测的削峰策略推荐方法、装置及存储介质
CN116681152A (zh) 基于SOM-BP神经网络改进Prophet模型的短期负荷预测方法
CN116993205A (zh) 一种面向城市综合能源系统日内运行的调节能力评估方法
CN110852370A (zh) 基于聚类算法的大工业用户细分方法
CN111404193A (zh) 一种基于数据驱动的微电网随机鲁棒优化调度方法
CN116128154A (zh) 一种农业园区综合能源系统的能源优化配置方法及装置
CN110059871A (zh) 光伏发电功率预测方法
CN109767037A (zh) 一种夏季日最大负荷的预测方法
CN115034293A (zh) 基于改进双尺度谱聚类算法的配电网动态重构方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant