CN116316599A

CN116316599A - 一种智能用电负荷预测方法

Info

Publication number: CN116316599A
Application number: CN202310319434.7A
Authority: CN
Inventors: 程涛; 潮铸; 黄安平; 周娟; 曾荣均; 王健华; 陈君德; 萧嘉荣; 李启亮; 沙斌; 何祥针; 左剑; 陈卉灿; 唐旭辰; 禹霁晅; 刘维维; 邓仁毅; 梁伟豪
Original assignee: Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd
Current assignee: Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date: 2023-03-28
Filing date: 2023-03-28
Publication date: 2023-06-23

Abstract

本申请涉及负荷预测技术领域，公开了一种智能用电负荷预测方法，包括以下步骤：获取目标地区用电负荷预测所需的数据集；预处理负荷与时间、气候数据集，选择特征性强的数据用于模型训练与测试；划分目标地区，对各区域历史用电负荷数据进行异常处理用于负荷预测；获取基于MPSO算法优化的多层随机森林算法模型，将训练数据集输入强化学习后的模型中进行训练与测试，得到用电负荷预测模型；对用电负荷预测模型预测性能进行评估，将划区域处理后的历史用电负荷数据输入负荷预测模型进行用电负荷预测，输出预测结果。该智能用电负荷预测方法，构建一种三层随机森林算法模型，提高预测的数据源精准度，提高模型负荷预测的准确性。

Description

一种智能用电负荷预测方法

技术领域

本申请涉及负荷预测技术领域，具体为一种智能用电负荷预测方法。

背景技术

随着经济的不断发展，人民生活水平越来越高，电是保障社会高质量发展的重要能源，当下可再生能源发电的开发与并网运行增加了电力系统的复杂性，对电力系统进行精准的短期负荷预测可以保障电网安全稳定运行，优化电网的经济调度，节约能源，使日常生活更加舒适。

对于短期用电负荷预测方法一般有两类，传统预测方法与智能预测方法，传统预测方法主要包括趋势外推法、回归分析法、时间序列法与灰色模型法，该类方法主要通过数据的相关性与时序性进行预测，原理比较简单并且容易实现，但是预测精度较低，存在局限性。随着人工智能技术的不断突破，各种用于负荷预测的智能算法得以发展，包括人工神经网络、小波分析法、模糊理论、支持向量机、决策树理论、随机森林算法等，智能预测法对数据与模型的分析处理能力强，可以提高负荷预测的精度。

然而，当下影响新型电力系统电力负荷的因素很多，各种分布式电源接入电网、新能源发电并网运行都增加了电力负荷预测的复杂度，无论采用传统方法进行预测还是采用智能预测方法进行预测都会存在预测精度较低的问题。

发明内容

针对现有技术的不足，本申请提供了一种智能用电负荷预测方法，解决了采用传统方法进行预测或者采用智能预测方法进行预测都会存在预测精度较低的问题。

为实现上述目的，本申请提供如下技术方案：一种智能用电负荷预测方法，包括以下步骤：

获取目标地区用电负荷预测所需的数据集；

预处理负荷与时间、气候数据集，选择特征性强的数据用于模型训练与测试；

划分目标地区，对各区域历史用电负荷数据进行异常处理用于负荷预测；

获取基于MPSO算法优化的多层随机森林算法模型，将训练数据集输入强化学习后的模型中进行训练与测试，得到用电负荷预测模型；

对用电负荷预测模型预测性能进行评估，将划区域处理后的历史用电负荷数据输入负荷预测模型进行用电负荷预测，输出预测结果。

优选的，所述预处理负荷与时间、气候数据集包括：

对获取的目标地区用电负荷预测所需的数据集进行数据清洗、数据转换、特征分析、特征选择等步骤，采用样条插值、线性插值或者均值法来对目标地区历史用电负荷数据、时间数据、气候数据异常值进行修正，填补缺失值，并对应历史用电负荷数据与气候数据来删除异常数据，得到特征性强的训练数据集。

优选的，所述预处理负荷与时间、气候数据集还包括：

根据用户类别的不同，对不同类别用户所在的区域进行划分，将目标地区划分为住宅区、商业区、工业区三大区域，划分后各区域内历史用电负荷数据差异性较小，将同区域用电负荷数据进行模拟对比来排查出异常数据，采用样条插值、线性插值或者均值法修正异常数据得到更为精准的目标地区历史用电负荷数据集用于负荷预测。

优选的，基于残差学习的方法将三层随机森林进行结合，构建一种多层随机森林算法模型；

所述多层随机森林算法模型的决策树棵数n_tree＝n，每棵树的分裂特征数为m，模型分为三个阶段，第一阶段将初始训练样本中的数据输入第一层随机森林进行训练，输出结果的同时得到训练残差y′；将y′代入初始样本集组成新的特征集输入生成的第二层随机森林进行第二阶段训练；同样的，将第二阶段所得训练残差y"代入初始样本集组成新的特征集输入生成的第三层随机森林进行第三阶段训练，将三层随机森林模型的输出依次叠加得到最终预测结果。

优选的，基于构建的多层随机森林算法模型，采用MPSO算法对模型进行参数优化训练，参数包括决策树棵数n_tree与分裂特征数m，将n_tree和m与MPSO算法中粒子属性对应，将随机森林模型训练所得袋外误差作为适应度值，在迭代过程中增加变异扰动项来不断优化模型参数，获得最优解。

优选的，采用MPSO算法对多层随机森林模型进行参数优化训练包括：

初始化粒子属性，设定粒子群规模、迭代次数、变异扰动项权重等参数；

将随机森林模型的袋外数据误差作为适应度函数来控制粒子群迭代过程中的适应度值，计算公式：

其中e(i)为第i棵决策树的袋外数据误差，N为袋外数据集，n为袋外数据集样本个数；

将当前迭代次数下粒子适应度值与全局最优值进行对比来更新粒子运动方向与速度，在满足迭代次数与收敛精度时输出参数最优解，更新公式：

其中

为上一次迭代过程中粒子个体最优值，/>

为全局最优值；

基于所得最优粒子，对粒子进行变异，粒子更新公式：

其中K为柯西扰动项分布系数，rand()为[0,1]内的随机函数；

达到最大迭代次数后输出最优粒子属性值。

优选的，多层随机森林算法模型通过对参数进行强化学习，得到全局最优参数值n_best和m_best；

根据n_best和m_best生成随机森林模型，将第一阶段训练残差y′代入初始样本集组成新的特征集输入生成的第二层随机森林进行第二阶段训练；将第二阶段训练残差y"代入初始样本集组成新的特征集输入生成的第三层随机森林进行第三阶段训练，将三层随机森林模型的输出依次叠加得到最终预测结果。

优选的，获取基于MPSO算法优化的多层随机森林算法模型，对模型进行训练得到用电负荷预测模型；

所述训练数据集包括历史用电负荷数据、时间因素与气候因素数据；

按照70％:30％划分为训练集与测试集；

将所述训练数据集中时间因素与气候因素数据输入基于MPSO算法优化的多层随机森林模型中进行用电负荷预测，得到用电负荷预测值；

将历史用电负荷数据与用电负荷预测值进行对比处理，设定误差最小阈值，当历史用电负荷数据与用电负荷预测值之间的均方误差接近所设阈值时，得到训练结果，根据训练结果中用电负荷数据与日期、气象数据之间的映射关系，得到用电负荷预测模型。

优选的，将测试数据集输入所得用电负荷预测模型进行测试，通过预测结果与历史用电负荷数据之间的均方误差和相对误差来对用电负荷预测模型进行评估，将划区域处理后的历史用电负荷数据输入训练好并且通过测试的用电负荷预测模型中进行用电负荷预测，输出预测结果。

本申请提供了一种智能用电负荷预测方法，具备以下有益效果：

与现有短期用电负荷预测方法相比，本申请结合多种智能算法，在双层随机森林模型的基础上基于残差学习的方法，构建一种三层随机森林算法模型，将模型三个阶段的输出结果叠加得到最终预测结果，可以提高随机森林算法模型的预测精度，并将变异粒子群算法结合多层随机森林算法，对模型参数进行优化训练，获取基于MPSO算法优化的多层随机森林算法模型进行用电负荷预测，该方法具有更高的预测精度和更稳定的预测性能。在输入数据方面进行创新处理，由于目标地区不同区域的历史用电负荷数据差距较大，为更加精准的确定历史用电负荷数据集中的异常值，根据用户类别的不同，对目标地区不同类别用户所在的区域划分为住宅区、商业区、工业区三大区域，划分后各区域内历史用电负荷数据差异性较小，将同区域用电负荷数据进行模拟对比来排查出异常数据进行处理，将处理后的历史用电负荷数据用于负荷预测可以使用于预测的数据源精准度更高，大大提高模型负荷预测的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本申请实施例一种智能用电负荷预测方法的流程示意图。

图2为本申请实施例一种智能用电负荷预测方法应用过程图。

图3为本申请实施例一种智能用电负荷预测方法所采用的负荷预测模型训练示意图。

图4为本申请实施例一种智能用电负荷预测方法所采用的模型强化学习参数优化训练示意图。

图5为本申请实施例提供的一种城市用电负荷预测装置结构图。

图6为本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

为使得本申请的申请目的、特征、优点能够更加的明显和易懂，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本申请一部分实施例，而非全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在本申请的描述中，需要理解的是，术语“上”、“下”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。

下面结合附图1-附图4并通过具体实施方式来进一步说明本申请的技术方案。

请参阅图1，本申请提供一种技术方案：根据附图1至附图4，对本申请提供的一种智能用电负荷预测方法进行说明。所述一种智能电网短期负荷预测方法，包括以下步骤：

获取目标地区用电负荷预测所需的数据集；

预处理负荷与气候数据集，选择特征性强的数据用于模型训练与测试；

获取基于MPSO算法优化的多层随机森林算法模型，将训练数据集输入强化学习后的模型中进行训练与测试，得到电力负荷预测模型。

将划区域处理后的历史用电负荷数据输入负荷预测模型进行用电负荷预测，输出预测结果。

本实施例提供一种智能用电负荷预测方法，与现有短期用电负荷预测方法相比，本申请结合多种智能算法，基于残差学习的方法将三层随机森林进行结合，在多层随机森林模型的基础上，采用MPSO算法对多层随机森林模型进行参数优化训练，通过强化学习，获取基于MPSO算法优化的多层随机森林算法模型进行用电负荷预测，该方法具有更高的预测精度和更稳定的预测性能，并将目标区域划分后再根据各区域进行异常数据处理所得的历史用电负荷数据集用于预测将更精准，使最终预测结果误差更小。

需要说明的是，在本实施例中所述一种智能电网短期负荷预测方法，如图1所示，具体包括以下步骤：

步骤1：获取目标地区用电负荷预测所需的数据集，从终端采集到的负荷数据集，由于电力系统的复杂性，所采集到的数据往往波动性很大并且呈现很强的非线性，对采集的数据集进行预处理，包括数据清洗与转换、特征分析与选取。

对终端采集到的负荷数据集先进行数据清洗，检测数据一致性，处理数据集中的无效值与缺失值。

对于无效值可以采用估算，整例删除，变量删除和成对删除等方法进行处理，对于存在一定偏差的数据，进行一致性检测，根据数据的合理取值范围和相互关系来判断偏差值是否超出数据集正常范围，然后再进行处理。

对于缺失值，包括直接缺失的数据和残缺数据，直接缺失的数据可以采用删数据、自动填补以及手动填补等方法进行处理，残缺数据主要是一些应该有的信息缺失，将这一类数据过滤出来并补全数据信息。

由于数据类型的不同，对采集的数据进行归一化处理，不同类型数据需要进行转换，转换后的数据有利于进行算法分析。

数据类型有整数类型、浮点数类型、字符类型等，将其中的非数值型进行类型转换，统一转换为数值型，同类别的数据有助于后续智能算法运算。数据转换时由于数据的精度不相同，低精度的数据类型可以转换为高精度的数据类型，同样高精度数据也可以转换成低精度数据，对损失的数据要进行处理，转换后的数据还要进行归一化处理，使得相同数据不同特征性之间可以进行比较分析。

对终端采集数据进行特征分析，数据集所包含的特征属性极多，但有些特征属性与负荷预测无关，分析其中与目标地区用电负荷数据属性相关性强的，有利于进行用电负荷预测。

对终端采集数据进行特征选取，气候与日期是影响目标地区用电负荷的重要因素之一，在采集的数据集中选取与目标地区用电负荷数据属性相关性强的数据，包括降雨量、温度、湿度、风速、光照、气压、月份日期、周数等特征数据，可以采用过滤法、信息增益法等方法进行数据集的特征选取。

步骤2：对历史用电负荷数据与气候数据集进行处理，将特征性强的数据用于负荷预测模型的训练与测试。

本实施例中获取了目标地区前三年内的历史负荷数据集，所采集的历史负荷数据均是每隔15分钟采集一个样本点，对目标地区历史用电负荷数据与气候数据集进行处理，所获取数据集过于庞大，对数据集进行处理的计算量较大，先对数据集进行归一处理，计算公式：

其中P为历史负荷输入数据，P′为归一化处理后的负荷输入数据，P_min为历史负荷输入数据中的最小值，P_max为历史负荷输入数据中的最大值。

采用样条插值、线性插值或者均值法来对目标地区历史用电负荷数据异常值进行修正，填补缺失值，并对应历史用电负荷数据与气候数据来删除异常数据。

气候数据集包括降雨量、温度、湿度、风速、风向、光照、气压、辐射等数据，对于温度数据，以天为单位获取日最高温度、日最低温度以及平均温度，采用公式(1)进行归一化处理，其他种类数据选取相对值。将气候数据集进行处理，采用样条插值、线性插值或者均值法来对气候数据异常值进行修正，填补缺失值。

将处理后的气候数据集以天为单位进行组合，所得气候组合特征数据集包括以上任意两大特征的和、差、积、商，并且增加组合特征数据集与它均值的差值、中位数的差值，得到气候数据特征全集。

特征数据集还包括时间数据，由于工作日与节假日以及各种不同季度的负荷数据会有区别，时间数据是影响目标地区负荷预测的重要特征数据，对月份日期、周数等特征数据进行处理，采用样条插值、线性插值或者均值法来对目标地区时间数据集异常值进行修正，填补缺失值。

步骤3：将目标地区进行划分，分为住宅区、商业区、工业区三大区域，对各区域内历史用电负荷数据进行异常处理，将处理后的历史用电负荷数据用于负荷预测。

从目标地区终端采集的历史用电负荷数据集中包括许多异常值、缺失值，通过均值法与二维插值法进行异常值的修正与缺失值的填补，将处理后的历史负荷数据集用于负荷预测所得的预测结果不够精准。

由于目标地区电网用户的多样性，会存在不同种类用户用电负荷不同的现象，一般来讲个人用户的用电需求量会比企业、工厂等用户的小，所造成的用电负荷差距会很大，对终端采集的数据用均值等方法进行异常处理后进行用电预测显然会造成误差。

具体而言，由于目标地区不同区域的用电需求不同，造成历史用电负荷数据会有一定差距，例如目标地区前三年中个人用户的用电负荷数据与工业区用户相比会出现差距极大的数据，若以此来判断该数据为异常值并靠均值法与插值法进行异常数据的处理，会导致用于预测的数据集不够精准。

为更加精准的确定历史用电负荷数据集中的异常值，对目标地区进行划分，根据用户类别的不同，对不同类别用户所在的区域进行划分，划分后各区域内历史用电负荷数据差异性较小，将同区域用电负荷数据进行模拟对比来排查出异常数据。

将目标地区进行划分，分为住宅区、商业区、工业区三大区域，不同区域的用电需求量有明显差距，所造成的用电负荷数据差别较大，基于差异性较小的负荷数据来确定各区域历史负荷预测数据。

对住宅区、商业区、工业区三大区域内的历史用电负荷数据设定一个阈值，来进行后续的负荷数据划分，取同区域内若干用户的历史用电负荷数据进行对比，将各区域内历史用电负荷数据的中位值做为划分负荷数据的门限值。

根据各区域所设定的门限值来获取目标地区住宅区、商业区、工业区三大区域内的历史用电负荷数据，划分好的历史用电负荷数据存在少量分错区域的数据。工业区可能出现少量数值极低的异常值被划分入住宅区，住宅区可能存在少量数值极高的异常值被划分入工业区，类似地，商业区也可能存在少量异常值被划分入其他区域。

针对这一现象，将历史用电负荷数据与时间数据相对应，通过排查往年同期用电负荷数据来与各区域划分负荷数据的门限值对比，来判断该数据是否分错区域，经过处理的各区域历史用电负荷数据分错区域的概率极大下降。

将划分区域后的各区域历史用电负荷数据进行处理，采用样条插值、线性插值或者均值法来对目标地区各区域内的历史用电负荷数据异常值进行修正，填补缺失值，并对应历史用电负荷数据与气候数据来删除异常数据，将划区域处理后的历史用电负荷数据用于模型负荷预测。

划分区域处理后的历史用电负荷数据更加精准，由于目标地区不同区域的用电需求量不同，导致用电负荷存在差距，少数区域之间差距较大，单纯对目标地区用电负荷数据进行异常处理，会使一些各区域内的正常数据被异常处理，整体数据变得不够精准。划分区域后，再对各区域内进行负荷数据的异常处理，可以使用于预测的数据源精准度更高，大大提高模型负荷预测的准确性。

步骤4：在单层随机森林算法模型的基础上构建一种多层随机森林算法模型来使模型的负荷预测结果更准确。

随机森林是机器学习算法中一种采取有放回抽样策略的集成分类算法，其泛化能力强且预测精度高，随机森林算法模型采用众多决策树作为分类器，可表示为：

H(m,p_x),x＝1,2,…n

其中p_x为独立分布的随机变量，m为输入变量。

随机森林算法模型在众多决策树分类器的基础上通过Baggi ng算法生成训练样本集，各决策树作为元分类器组合为集成分类器，所有分类器通过多数投票或者求解算数平均值来决定最终输出结果。

随机森林算法基本步骤：首先对样本以有放回抽样的方式进行随机抽样来构成训练集，每次未抽到的剩余样本组成袋外数据集，袋外误差即为在袋外数据集上错误分类的样本数占验证集总样本数的比例；再对特征属性进行随机抽样，将抽取出的特征用于决策树上分类节点的划分，并生成决策树；最后通过多棵树预测值取平均数来得到最终预测结果。

一般的单层随机森林算法通过Baggi ng抽样可以生成n个互不相关的训练集，此时决策树棵数n_tree为n，每颗决策树随机选取m个分裂特征数构成每个节点的分裂特征集，选择分裂特征集中所含最优特征信息量的特征进行分裂，生成多棵决策树组成随机森林模型进行预测。

单层随机森林算法模型虽然具有很强的随机性，通过各决策树进行投票取均值来得到最终结果，但是由于特征变量的复杂性，单层随机森林算法模型不能完全读取样本中的有效信息，导致最终预测结果的精度有待提高，多层随机森林算法模型可以有效解决这一问题。

多层随机森林算法模型继承了单层随机森林算法的优点，并且可以深度读取样本有效信息，分析特征变量。单层随机森林算法模型经过训练后会留下训练残差y′，y′中含有许多有效信息，将训练残差y′结合初始训练集Y组成新的训练样本集Y*对随机森林模型进行训练，所得的多层随机森林模型预测结果会更加精准。

具体而言，多层随机森林算法模型基于残差学习的方法将三层随机森林进行结合，模型分为三个阶段。第一阶段将初始训练样本中的数据输入第一层随机森林进行训练，输出结果的同时得到训练残差y′，y′中含有许多有效信息，将y′代入初始样本集组成新的特征集输入生成的第二层随机森林进行第二阶段训练；同样的，将第二阶段训练残差y"代入初始样本集组成新的特征集输入生成的第三层随机森林进行第三阶段训练，将三层随机森林模型的输出依次叠加得到最终预测结果。

本实施例中多层随机森林算法模型数学原理概述如下，其边缘函数表达式为：

K(M,N)＝fg(H(m,p_x)＝N)-maxfg(H(m,p_x)＝j)

其中f(x)为取平均值函数，g(x)为指示函数，M为输入数据，j为其中一种特征属性。

多层随机森林算法模型的泛化误差表达式为：

P_e＝P_m,n(K(M,N)＜0)

其中P_m,n为输入数据M的分类错误率函数。

多层随机森林算法模型的泛化误差最大值可表示为：

其中ρ为随机森林决策树平均系数，d为决策树平均强度。

本实施例中多层随机森林算法模型的泛化误差最大值与决策树平均系数以及平均强度相关，通过表达式可以看出当

越小且d越大时模型的泛化性能越好，为提高模型的预测精度可以通过减小决策树的平均系数增加平均强度来实现。

多层随机森林算法基本步骤：首先从初始样本集中采用Bagging抽样的方法进行n_tree次采样，生成n_tree棵决策树；随机选取m个特征作为决策树中节点的分类特征值，选择最佳特征属性进行分裂；n_tree棵决策树作为第一层随机森林，将初始训练样本中的数据输入第一层随机森林进行训练，输出第一层预测结果以及训练残差y′；以同样的方式生成n′_tree棵决策树作为第二层随机森林，将y′代入初始样本集组成新的特征集输入生成的第二层随机森林进行第二阶段训练，输出第二层预测结果以及训练残差y"；同样的，生成n″_tree棵决策树作为第三层随机森林，将y"代入初始样本集组成新的特征集输入生成的第三层随机森林进行第三阶段训练，将三层模型输出结果依次叠加得到最终输出结果。

步骤5：采用MPSO算法对多层随机森林模型进行参数优化训练，获取基于MPSO算法优化的多层随机森林算法模型。

优化机器学习模型参数的传统方法包括交叉验证、梯度下降等，优化效果不佳，目前使用群体智能算法进行模型参数优化较多。群体智能算法通过模仿生物群体运动过程，可以将模型参数与群体属性对应进行分析，对比传统参数优化方法，群体智能算法原理简单，在参数训练中效率更高，优化效果更佳。

粒子群算法对于机器学习模型参数优化训练上具有精度高且收敛快等优势，粒子群算法可以通过学习因子与权重控制来进行参数调优，将单个粒子信息与全局信息综合考虑，全面控制参数优化训练过程。

随机森林模型中的超参数包括：决策树棵数、每棵决策树的深度以及分支节点的样本数、属性特征集、样本选择等，在随机森林算法模型的过程中每棵决策树分裂节点的样本数和每颗决策树的深度由样本集控制，这两个参数对于模型分类整体影响较小。

随机森林算法模型中决策树棵数与属性特征集影响整个随机森林模型的建立，比起其他参数对于随机森林模型分类整体影响较大，粒子群参数优化训练主要对于决策树棵树与属性特征集。

多层随机森林模型预测精度高、收敛速度快且误差较小，模型中决策树棵数n_tree与每棵树的分裂特征数m决定随机森林模型的性能，n_tree与m一般根据训练集数据特点由经验进行选取，会导致随机森林模型的预测结果无法到达最优，在随机森林的训练过程中，合理的参数选择能够有效提高模型分类精准度与模型稳定性。采用变异MPSO算法对多层随机森林模型中的n_tree与m进行优化处理，得到最优参数。

粒子群算法在运行过程中可能出现个体粒子适应度值过高的现象，会导致粒子运动无法跳出最优粒子局部运动范围，从而陷入粒子局部最优，使参数优化效果不佳。MPSO算法在粒子迭代过程中引入变异干扰项，来促使粒子在运动过程中跳出局部最优的运动范围，得到全局最优参数值。

MPSO算法基本步骤：初始化粒子属性，设定粒子群规模、迭代次数、变异扰动项权重、粒子运动空间上限M_d以及下限N_d、粒子的速度v_min和v_max、加速常数c₁与c₂、收敛精度等参数；

选取适应度函数来计算每个粒子的适应度值；

其中

为上一次迭代过程中粒子个体最优值，/>

为全局最优值；

计算粒子更新后的适应值，与之前粒子适应值进行比较，来决定是否用此时粒子的个体极值与粒子群全局极值替换之前的对应值；

基于所得最优粒子，对粒子进行变异，粒子更新公式：

其中K为柯西扰动项分布系数，rand()为[0,1]内的随机函数；

判断是否达到最大迭代次数或者是否满足收敛精度，达到停止条件后输出最优粒子属性值。

将多层随机森林模型中决策树棵数和分裂特征数与粒子群算法中粒子属性对应，并将随机森林模型训练所得袋外误差作为适应度值,在迭代过程中不断优化模型参数，获得最优解，并对其进行柯西变异，在达到最大迭代次数后输出全局最优参数值n_best和m_best。

根据最优参数值n_best和m_best即可生成第一层随机森林模型进行训练，并且得到训练残差y′，将训练残差带入初始样本集组成新的数据集并作为第二层随机森林模型的训练集，按照n′_best和m′_best可再生成第二层随机森林模型进行训练，将y"代入初始样本集组成新的特征集作为第三层随机森林的训练集，按照n″_best和m″_best可再生成第三层随机森林模型进行训练，将三层随机森林模型的输出依次叠加得到最终预测结果。

采用MPSO算法对多层随机森林模型进行参数优化训练步骤：

将多层随机森林模型中决策树棵数和分裂特征数与粒子群算法中粒子属性对应，初始化随机森林与粒子群相关参数，包括粒子属性、粒子群规模、迭代次数、变异扰动项权重、收敛精度等，设置多层随机森林模型中决策树棵数n_tree与分裂特征数m的初值与范围；

结合随机森林模型，计算模型分类平均精准度，将决策树棵数n_tree与分裂特征数m代入随机森林模型，将随机森林模型的袋外数据误差作为适应度函数来控制粒子群迭代过程中的适应度值，计算公式：

比较当前迭代次数下粒子适应度值与已知全局下粒子最优值，若当前粒子不满足最优值情况，则再次进行迭代，根据公式(2)与(3)对粒子进行运动方向与运动速度的更新；

将当前迭代中适应度值最高的粒子作为个体最优粒子，根据公式(4)对粒子进行变异处理，加入变异扰动项，保存处理后的当前最优粒子速度以及方向值；

达到最大迭代次数时输出最佳参数值，得到最优的决策树棵数n_best和分裂特征数m_best；

从初始样本集中采用Baggi ng抽样的方法进行n_best次采样，生成n_best棵决策树，随机选取m_best个特征组成分裂特征集，每棵决策树选择最优特征进行分裂形成随机森林模型，每棵决策树预测结果取平均值输出基于MPSO算法优化的随机森林模型预测结果。

步骤6：对MPSO算法优化的多层随机森林模型进行训练得到用电负荷预测模型。

训练数据集包括异常处理后的历史用电负荷数据、完备的气候特征全集、目标地区时间数据集，将预处理好的训练数据集输入基于MPSO算法优化的多层随机森林模型进行训练学习，在达到预设好条件时停止模型迭代训练过程，大量的训练过程可以使模型的预测结果更加精准，根据训练结果可以分析出模型输入的训练数据与输出的预测结果之间的对应关系，继而得到特征数据集包括气候数据和时间数据与历史用电负荷之间的映射关系，根据训练结果中历史用电负荷数据与日期、气象数据之间的映射关系，得到用电负荷预测模型。

输入基于MPSO算法优化的多层随机森林模型的训练数据集中，历史用电负荷数据采用公式(1)对数据集进行归一处理，再采用样条插值、线性插值或者均值法来对目标地区历史用电负荷数据异常值进行修正，填补缺失值，并对应历史用电负荷数据与气候数据来删除异常数据；气候数据集采用样条插值、线性插值或者均值法来对异常值进行修正之后，将气候数据集以天为单位进行组合，所得气候组合特征数据集包括以上任意两大特征的和、差、积、商，并且增加组合特征数据集与它均值的差值、中位数的差值，得到气候数据特征全集；时间数据处理包括对月份日期、周数等特征数据进行处理，采用样条插值、线性插值或者均值法来对目标地区时间数据集异常值进行修正，填补缺失值。多层随机森林算法模型可以结合残差学习的方法充分读取样本中的有效信息，提高预测精度，MPSO算法可以对多层随机森林模型进行参数优化训练，提高模型预测准确度和稳定性。

具体而言，将训练数据集输入基于MPSO算法优化的多层随机森林模型进行训练步骤如下：

获得预处理的训练数据，对模型参数进行初始化处理，以气候数据、时间数据作为历史用电负荷数据的特征数据集，气候数据特征值包括降雨量、温度、湿度、风速、风向、光照、气压、辐射，时间数据特征值包括月份日期、周数，以特征数据集建立模型预测初始样本集x_t{x₁,x₂,x₃…x_n}，其中输入数据x为影响微电网用电负荷的特征量。

从初始样本集x_t中采用Baggi ng抽样的方法进行n_tree次采样，抽出n_tree个互不相关的训练集x_t′，生成n_tree棵决策树，随机选取m个特征作为决策树中节点的分类特征值，选择最佳特征属性进行分裂，n_tree棵决策树作为第一层随机森林；

采用MPSO算法对第一层随机森林模型中的参数进行优化训练，将多层随机森林模型中决策树棵数和分裂特征数与粒子群算法中粒子属性对应，初始化随机森林与粒子群相关参数，设置多层随机森林模型中决策树棵数n_tree与分裂特征数m的初值与范围；将随机森林模型的袋外数据误差作为适应度函数来控制粒子群迭代过程中的适应度值，采用公式(5)进行计算；比较当前迭代次数下粒子适应度值与已知全局下粒子最优值，若当前粒子不满足最优值情况，则再次进行迭代，根据公式(2)与(3)对粒子进行运动方向与运动速度的更新；将当前迭代中适应度值最高的粒子作为个体最优粒子，根据公式(4)对粒子进行变异处理，加入变异扰动项，保存处理后的当前最优粒子速度以及方向值；达到最大迭代次数时输出最佳参数值，得到最优的决策树棵数n_best和分裂特征数m_best；

基于MPSO算法优选出的第一层随机森林中的参数，采用Baggi ng抽样的方法进行n_best次采样，抽出n_best个互不相关的训练集，生成n_best棵决策树，随机选取m_best个特征作为决策树中节点的分类特征值，计算每个特征的信息量，选择最佳特征属性进行分裂；

n_best棵决策树作为第一层随机森林进行训练，输出预测结果，将n_best棵决策树的预测值取平均值得到第一层随机森林模型的输出结果y₁；

第一层随机森林模型输出结果的同时得到训练残差y′，将训练残差y′结合初始训练集组成新的训练样本集对随机森林模型进行训练，新的样本集包含第一层随机森林模型未能识别的有效信息，以气候数据和时间数据以及第一层模型训练残差作为新的样本集

其中输入数据x为影响微电网用电负荷的特征量，而y′为第一层随机森林训练得到的残差值。

采用MPSO算法对第二层随机森林模型中的参数进行优化训练，根据同样的方法得到第二层随机森林最优的决策树棵数n′_best和分裂特征数m′_best，基于MPSO算法优选出的第二层随机森林中的参数，从新样本集

中采用Bagging抽样的方法进行n′_best次采样，抽出n′_best个互不相关的训练集x″_t，生成n′_best棵决策树，随机选取m′_best个特征作为决策树中节点的分类特征值，计算每个特征的信息量，选择最佳特征属性进行分裂。

n′_best棵决策树作为第二层随机森林进行训练，输出预测结果，将n′_best棵决策树的预测值取平均值得到第二层随机森林模型的输出结果y₂；

得到第二层随机森林模型的训练残差y"，y"中仍然含有一定的有效信息未被读取，将训练残差y"结合初始训练集x_t组成新的训练样本集

对随机森林模型进行训练，新的样本集包含第二层随机森林模型未能识别的有效信息，以气候数据和时间数据以及第二层模型训练残差作为新的样本集/>

其中输入数据x为影响微电网用电负荷的特征量，y"为第二层随机森林训练得到的残差值。

采用MPSO算法对第三层随机森林模型中的参数进行优化训练，根据同样的方法得到第三层随机森林最优的决策树棵数n″_best和分裂特征数m″_best，基于MPSO算法优选出的第三层随机森林中的参数，从新样本集

中采用Bagging抽样的方法进行n″_best次采样，抽出n″_best个互不相关的训练集x_t″′，生成n″_best棵决策树，随机选取m″_best个特征作为决策树中节点的分类特征值，计算每个特征的信息量，选择最佳特征属性进行分裂。

将历史用电负荷数据与用电负荷预测输出结果进行对比处理，设定误差最小阈值，当历史用电负荷数据与用电负荷预测输出结果之间的均方误差接近所设阈值时，得到训练结果。根据训练结果中用电负荷数据与时间、气候数据之间的映射关系，得到用电负荷预测模型。

历史用电负荷数据与用电负荷预测输出结果之间的差异程度可以由均方误差来表示，将模型每次训练输出的用电负荷预测结果与历史用电负荷进行对比分析，当均方误差越小时，模型的预测结果与历史用电负荷数据差异性越小，此时的模型预测结果精度更高，历史用电负荷数据与模型用电负荷预测结果之间的均方误差MSE的计算公式可表示为：

其中y_i是历史用电负荷数据，y_r是模型输出的用电负荷预测值，设定误差最小阈值，当历史用电负荷数据与用电负荷预测输出结果之间的均方误差接近所设阈值时，得到训练结果，通过分析模型预测结果与历史用电负荷数据，根据训练结果中历史用电负荷数据与时间、气候数据之间的映射关系，得到用电负荷预测模型。

步骤7：将测试数据集输入所得用电负荷预测模型进行预测，为保证模型预测精度，通过预测数据与历史用电负荷数据之间的均方误差和相对误差来对用电负荷预测模型进行评估，再将划区域处理后的历史用电负荷数据输入用电负荷预测模型进行用电负荷预测，输出预测结果。

在本实施例中，为保证最终得到的用电负荷预测模型的准确度，采用均方误差和相对误差来对模型进行性能评估。获得预处理的训练数据，对模型参数进行初始化处理，以气候数据、时间数据作为历史用电负荷数据的特征数据集，以特征数据集建立模型预测初始样本集x_t{x₁,x₂,x₃…x_n}，其中输入数据x为影响目标地区用电负荷的特征量，按照70％:30％划分为训练集与测试集，获取测试数据集。

将测试数据集中的气候数据、时间数据输入用电负荷预测模型中进行测试，输出预测结果。用电负荷预测模型可以反应用电负荷数据与时间、气候数据之间的映射关系，将测试数据集输入用电负荷预测模型中，模型按照步骤6所示方法进行预测，可以输出精准的用电负荷预测结果。

通过预测数据与历史用电负荷数据之间的均方误差来对用电负荷预测模型进行评估，将测试数据集中的历史用电负荷数据和模型预测结果输入公式(6)中进行计算，得到测试数据集中历史用电负荷数据与模型预测结果之间的均方误差MSE。

MSE可以表示模型预测结果与历史用电负荷之间的差异，通过两者之间的均方误差来评估用电负荷模型的预测精度，可以看出当均方误差较小时，模型的预测结果与历史用电负荷数据差异性越小，用电负荷预测模型的预测结果准确性更高，模型训练的更好。

用电负荷预测模型的性能评价指标很多，除了根据预测数据与历史用电负荷数据之间的均方误差来对用电负荷预测模型进行评估之前，为保证用电负荷预测模型的准确度，通过预测数据与历史用电负荷数据之间的相对误差来对用电负荷预测模型进行评估。

预测数据与历史用电负荷数据之间的相对误差可以表示出模型的预测精度，根据模型预测结果与历史用电负荷数据来计算出模型的相对误差，计算公式可以表示为：

其中y_i是历史用电负荷数据，y_r是模型输出的用电负荷预测值，n为测试数据集样本数。

通过预测数据与历史用电负荷数据之间的相对误差可以得到模型的预测精度，可以看出当η越小时，模型的预测结果精度越高，根据预测精度可以对所得用电负荷预测模型进行直观评估，判断模型预测结果是否准确。

将步骤3中划分区域处理后的历史用电负荷数据输入训练好并且通过测试的用电负荷预测模型中进行用电负荷预测，输出预测结果。

综上所述，本申请结合多种智能算法，在双层随机森林模型的基础上基于残差学习的方法，构建一种三层随机森林算法模型，将模型三个阶段的输出结果叠加得到最终预测结果，可以提高随机森林算法模型的预测精度，并将变异粒子群算法结合多层随机森林算法，对模型参数进行优化训练，获取基于MPSO算法优化的多层随机森林算法模型进行用电负荷预测，该方法具有更高的预测精度和更稳定的预测性能。在输入数据方面进行创新处理，由于目标地区不同区域的历史用电负荷数据差距较大，为更加精准的确定历史用电负荷数据集中的异常值，根据用户类别的不同，对目标地区不同类别用户所在的区域划分为住宅区、商业区、工业区三大区域，划分后各区域内历史用电负荷数据差异性较小，将同区域用电负荷数据进行模拟对比来排查出异常数据进行处理，将处理后的历史用电负荷数据用于负荷预测可以使用于预测的数据源精准度更高，大大提高模型负荷预测的准确性。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本申请的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本申请的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本申请的范围由所附权利要求及其等同物限定。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种智能用电负荷预测方法，其特征在于，包括以下步骤：

获取目标地区用电负荷预测所需的数据集；

2.根据权利要求1所述的一种智能用电负荷预测方法，其特征在于，所述预处理负荷与时间、气候数据集包括：

3.根据权利要求2所述的一种智能用电负荷预测方法，其特征在于，所述预处理负荷与时间、气候数据集还包括：

4.根据权利要求1所述的一种智能用电负荷预测方法，其特征在于，基于残差学习的方法将三层随机森林进行结合，构建一种多层随机森林算法模型；

5.根据权利要求4所述的一种用电负荷预测方法，其特征在于，基于构建的多层随机森林算法模型，采用MPSO算法对模型进行参数优化训练，参数包括决策树棵数n_tree与分裂特征数m，将n_tree和m与MPSO算法中粒子属性对应，将随机森林模型训练所得袋外误差作为适应度值，在迭代过程中增加变异扰动项来不断优化模型参数，获得最优解。

6.根据权利要求5所述的一种用电负荷预测方法，其特征在于，采用MPSO算法对多层随机森林模型进行参数优化训练包括：

其中

为上一次迭代过程中粒子个体最优值，/>

为全局最优值；

基于所得最优粒子，对粒子进行变异，粒子更新公式：

其中K为柯西扰动项分布系数，rand()为[0,1]内的随机函数；

达到最大迭代次数后输出最优粒子属性值。

7.根据权利要求6所述的一种用电负荷预测方法，其特征在于，多层随机森林算法模型通过对参数进行强化学习，得到全局最优参数值n_best和m_best；

8.根据权利要求7所述的一种用电负荷预测方法，其特征在于，获取基于MPSO算法优化的多层随机森林算法模型，对模型进行训练得到用电负荷预测模型；

按照70％:30％划分为训练集与测试集；

9.根据权利要求8所述的一种用电负荷预测方法，其特征在于，将测试数据集输入所得用电负荷预测模型进行测试，通过预测结果与历史用电负荷数据之间的均方误差和相对误差来对用电负荷预测模型进行评估，将划区域处理后的历史用电负荷数据输入训练好并且通过测试的用电负荷预测模型中进行用电负荷预测，输出预测结果。