CN108694470B

CN108694470B - 一种基于人工智能的数据预测方法及装置

Info

Publication number: CN108694470B
Application number: CN201810602426.2A
Authority: CN
Inventors: 孔祥玉; 李闯; 孔令桐; 郑锋
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2018-06-12
Filing date: 2018-06-12
Publication date: 2022-02-22
Anticipated expiration: 2038-06-12
Also published as: CN108694470A

Abstract

本发明公开了一种基于人工智能的数据预测方法及装置，方法包括：对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集；运用最小冗余度最大相关性标准从原始输入特征集中提取各分量的最佳输入特征集；根据各分量的频率选择预测模型的核函数，建立粒子群算法‑参数寻优的最小二乘支持向量机负荷预测模型；采用粒子群算法‑参数寻优的最小二乘支持向量机负荷预测模型对每个分量分别进行负荷预测，加权叠加所有分量的预测值得到最终的预测结果。装置包括：基于经验模态分解数据分解单元、数据预处理单元、基于最小冗余度最大相关性标准提取单元、最佳指标库单元、基于粒子群算法‑参数寻优的最小二乘支持向量机负荷预测单元、以及加权叠加单元。

Description

一种基于人工智能的数据预测方法及装置

技术领域

本发明涉及数据挖掘技术领域，尤其涉及一种基于人工智能的数据预测方法及装置，本发明基于历史数据时间序列对目标变量的变化趋势进行快速精确的预测。

背景技术

数据预测是指基于大数据对事物发展趋势进行预先的估计。高效精确的数据预测是正确决策的依据和保证，许多行业和领域都会涉及预测问题，例如：预测某股票的未来价格，预测电力负荷变化趋势，预测某商品的未来销量以及行业趋势预测等。

目前常用的单一预测方法可分为两类：传统预测方法和智能预测方法。其中，传统预测方法包括回归分析法、自回归滑动平均模型、灰色模型等。智能预测方法包括人工神经网络、支持向量机和模糊逻辑等。

随着数据收集和数据存储技术的快速进步使得各组织机构可以大量获取各类数据，这为从不同维度预测某一行业或专业的变化趋势提供了数据支持。然而预测目标多维度化意味着预测环境的复杂化，采用单一的智能预测方法难以应对复杂环境给预测精度和效率带来的挑战，综合多种数据处理与智能预测的组合方法可以取得较好的预测精度和效率。

发明内容

本发明的目的在于提高数据预测的精度和效率，提供一种基于人工智能的数据预测方法及装置，为实现上述目的，本发明采用以下技术方案：

一种基于人工智能的数据预测方法，所述方法包括以下步骤：

利用经验模态分解将原始负荷时间序列分解成本征模函数分量和残差分量；

对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集；

运用最小冗余度最大相关性标准从原始输入特征集中提取各分量的最佳输入特征集；

根据各分量的频率选择预测模型的核函数，建立粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型；

采用粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型对每个分量分别进行负荷预测，加权叠加所有分量的预测值得到最终的预测结果。

进一步地，所述对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集的步骤具体为：

获取影响原始负荷时间序列变化的m个因素的数据；从各影响因素数据中取出对应原始负荷时间序列的n个数据元素，形成特征列向量；

组合所述各影响因素特征数据，形成矩阵F_n×m；数据归一化处理组合后的所述数据矩阵；

取矩阵的每一列为一个特征即可获得所述原始特征集F_m＝{x₁，x₂…x_m}，其中x_m为特征。

其中，所述方法将数据处理方法与智能预测方法相结合，减少了预测模型的输入特征数量，从而提高预测的效率，同时可充分考虑不同外部敏感因素的影响，提高了预测精度。

另一实施例，一种基于人工智能的电力负荷预测装置，所述装置包括：

数据加工单元，用于异常数据点的辨识和修正；

基于经验模态分解数据分解单元，用于分解预测目标的原始负荷时间序列；

数据预处理单元，用于处理各影响因素特征数据，获得所述原始特征集；

基于最小冗余度最大相关性标准提取单元，用于从所述原始特征集中提取最佳特征集

最佳指标库单元，用于存放所述最佳特征集，作为下次预测参考；

基于粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型预测单元，用于对所述各分量进行预测；

加权叠加单元，用于叠加各分量负荷预测值得到最终预测结果。

本发明提供的技术方案的有益效果是：

1、本发明通过EMD(经验模态分解)将历史数据时间序列分解为IMF(本征模函数)分量和残差分量，然后用mRMR(最小冗余度最大相关性标准)从历史数据和影响因素数据中提取最优特征集作为预测模型的输入特征；

2、本发明利用PSO-LSSVM(粒子群算法-参数寻优的最小二乘支持向量机)模型对每个分量进行预测，再通过加权叠加所有分量的预测值得到最终的预测结果；

3、本发明将数据处理方法与智能预测方法相结合，减少了预测模型的输入特征数量，从而提高预测的效率，同时可充分考虑不同外部敏感因素的影响，提高了预测精度。

附图说明

图1为本发明提供的一种基于人工智能的电力负荷预测方法的流程图；

图2为本发明提供的EMD分解原始负荷时间序列示意图；

图3为本发明提供的对各分量进行数据预处理形成各分量的原始输入特征集的流程图；

图4为本发明提供的利用mRMR提取输入特征进行负荷预测的流程图；

图5为本发明提供的各分量的输入特征数量不同时的预测误差示意图；

图6为本发明提供的负荷预测结果示意图；

图7为本发明提供的不同方法负荷预测结果对比图。

图8为本发明提供的一种基于人工智能的数据预测装置的结构框图；

图9为本发明提供的数据加工单元的结构框图；

图10为本发明提供的数据预处理单元的结构框图；

图11为本发明提供的基于mRMR提取最佳特征单元的结构框图；

图12为本发明提供的分量imf5中特征mRMR值的降序排列图；

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面对本发明实施方式作进一步地详细描述。

当前，组合预测方式可分为将多个单一预测模型的预测结果进行加权组合，以及将数据处理方法与智能预测方法相结合两类。本发明实施例将数据处理方法与智能预测方法相结合，减少了预测模型的输入特征数量，从而提高预测的效率，同时可充分考虑不同外部敏感因素的影响，提高了预测精度。

如图1所示，本实施例提供的一种基于人工智能的电力负荷预测方法，该方法包括：

S11：获取原始负荷时间序列；

S12：利用EMD将原始负荷时间序列分解成本征模函数(IMF)分量和残差分量；

S13：对各分量进行数据预处理形成各分量的原始输入特征集；

S14：运用mRMR从原始输入特征集中提取各分量的最佳输入特征集；

S15：根据各分量的频率选择预测模型的核函数，建立PSO-LSSVM负荷预测模型；

S16：采用PSO-LSSVM负荷预测模型对每个分量分别进行负荷预测，加权叠加所有分量的预测值得到最终的预测结果。

其中，该步骤S11中的原始负荷时间序列主要是通过数据采集与监视控制系统(SCADA)或高级量测体系(AMI)获得的。在电力系统中，SCADA系统应用最为广泛，技术发展也最为成熟，它在远动系统中占重要地位，可以对现场的运行设备进行监视和控制，以实现数据采集、设备控制、测量、参数调节以及各类信号报警等各项功能，在现今的变电站综合自动化建设中起了相当重要的作用。

其中，步骤S12，本实施例以我国某地电网2017年4月1日至6月30日2184h负荷时间序列的实际数据作为实验数据集输入EMD模型，通过EMD对原始负荷序列进行分解，如图2所示；

EMD分解原始负荷时间序列具体包括：电力系统的原始负荷时间序列本身具有随机性，加之市场环境下复杂的负荷影响因素致使负荷序列更加不稳定，运用EMD进行负荷分解可获得更具规律性的分量，在对各分量分别建立预测模型，可提高预测精度。

电力负荷可视为由若干个本征模函数(IMF)组成的一个时间序列。由IMF的定义知：IMF的每一个振动周期，只有一个振动模式，没有其他复杂的奇波。然而大多数所有要分析的数据都不是本征模函数，在任意时间点上，数据可能包含多个波动模式。

利用EMD分解负荷时间序列需基于假设^[1]：

(1)待分解的复杂信号是由简单的IMF组成；

(2)组成原始复杂信号的每一个IMF分量相互独立。

基于上述分析，对给定的原始负荷时间序列进行分解的具体步骤如下：

(1)找出原始负荷时间序列x(t)中所有局部极大值和局部极小值，并通过三次样条函数分别拟合x(t)的上包络线e_up(t)和下包络线e_low(t)；

(2)计算上包络线e_up(t)和下包络线e_low(t)的平均值m₁(t)；

(3)计算原始负荷时间序列x(t)和包络线均值m₁(t)的差值h₁(t)；

h₁(t)＝x(t)-m₁(t) (2)

(4)如果差值h₁(t)满足IMF条件，那么差值h₁(t)就是求得的第一个IMF分量，它包含原始序列中最短的周期分量；否则将差值h₁(t)视为原始负荷时间序列，重复步骤(1)～步骤(3)，直到第k次迭代后的差值

满足IMF条件^[2](该条件为本领域技术人员所公知，本发明实施例对此不做赘述)成为第一个IMF分量，记为：

通过限定标准差SD来判断筛选过程是否停止，以此判断差值

是否为IMF分量：

式中，

就是

的上下包络线的平均值，标准差SD的取值一般为0.2～0.3之间^[3]；

(5)从原始负荷时间序列x(t)中分离出第一个IMF分量imf₁(t)，即可得到x(t)的剩余分量r₁(t)；

r₁(t)＝x(t)-imf₁(t) (5)

(6)将剩余分量r₁(t)作为新的原始负荷时间序列，重复步骤(1)～步骤(5)，直到剩余分量的幅值比预设值小或残余分量变为单调函数或常数为止，即可得到x(t)的所有IMF分量和剩余分量，该过程可以表示为：

其中，r_n(t)为单调函数，模态数目n取决于原始负荷时间序列。

(7)则原始负荷时间序列x(t)可由IMF分量和剩余分量描述为：

经步骤(1)～(7)可将原始负荷时间序列分解为不同频率的子序列即IMF和残差r。

所述步骤S13，对各分量进行数据预处理形成各分量的原始输入特征集，具体步骤如图3所示包括：

S21：获取影响原始负荷时间序列变化的m个因素的数据；

S22：从各影响因素数据中取出对应原始负荷时间序列的n个数据元素，形成特征列向量；

S23：组合所述各影响因素特征数据，形成矩阵F_n×m；

S24：数据归一化处理组合后的所述数据矩阵；

S25：取矩阵的每一列为一个特征即可获得所述原始特征集F_m＝{x₁，x₂…x_m}，其中x_m为特征。

所述步骤S21，具体包括：影响原始负荷时间序列变化的因素有天气(温度，湿度，光照强度，风速)、需求侧管理(电价)、日类型以及近期负荷变化规律等；

所述天气因素的数据获取可以通过天气预报系统事先预知；

所述需求侧管理的数据可以通过电网相关部门获取；

为了便于数据处理可将所述日类型数据化(使用1和0分别表示节假日和非节假日，1～12依次表示一月至12月，1～7依次表示周一至周日，1～24依次表示一天中1至24小时)；

所述近期负荷变化规律，遵循预测中“近小远大”的原则^[4]，即物理量未来的变化趋势更多地取决于历史时段中近期的发展规律，远期的历史数据与未来发展趋势的相关性较弱。本实施例考虑待预测时刻前一周的历史负荷数据时间序列作为影响因素特征。

所述步骤S22，本实施例以我国某地电网2017年4月1日至6月30日2184h负荷时间序列的实际数据作为实验数据集，每隔一小时取一个数据点，2184h负荷时间序列就有2184个数据元素，各影响因素数据就取负荷时间序列对应的2184(所述n＝2184)个数据元素，以每个影响因素数据作为一个列向量，则m个因素构成m个特征列向量。

所述步骤S23，具体包括：将形成的m个因素构成的m个特征列向量组合为矩阵F_n×m。

所述步骤S24，具体包括：根据公式(8)去除m个因素数据的不同量纲，并将其映射到0～1范围内；

式中，T为单个预测样本数据，Tn为数据样本的归一化参数，T＇为样本数据的白化参数；

所述白化，一般为数据归一化前的重要一步，白化的原因是因为自然数据相邻元素之间有较大的相关性，通过白化可以降低数据的冗余性，使得数据更容易收敛。

所述步骤S25，具体包括：经所述步骤S24，形成归一化后的F_n×m矩阵，取矩阵的每一列为一个特征向量即可获得原始特征集合F_m＝{x₁，x₂…x_m}，其中x_m为特征向量。

所述步骤S14，S15，S16，如图4所示具体步骤包括：

S31：采用增量搜索法从所述F_m中提取满足公式(9)的特征，形成候选特征集J；

所述公式(9)表示为：

其中，I(x_i,y)指特征x_i和目标变量y之间的互信息；n指特征个数；I(x_j,x_i)为互信息。

其中，

其中，p(x_i)、p(y)和p(x_i,y)分别为随机变量x_i、y的边缘概率密度函数和联合概率密度函数。变量x_i和变量y相关性越大，互信息的值I(x_i,y)越大；两个变量相互独立时，互信息值为零，意味着两个变量之间不存在相互依赖关系。

S32：计算J中每个特征的mRMR值大小，并进行降序排列；

S33：依次选出J中mRMR值较大的特征，将其输入到PSO-LSSVM预测模型；

S34：根据公式(10)，建立输入特征的数量与预测误差E的关系函数；

所述公式(10)表示为：

其中，y_i为历史数据时间序列第i时刻的实际值；imf_i′和imf_i分别为各分量第i时刻的预测值和实际值；n指预测的时刻点数。

S35：依次选取各分量的所述预测误差最小时对应的特征数量，形成各分量的所述最佳输入特征集Q；

S36：将所述各分量的最佳输入特征集Q₁,Q₂…Q_n分别输入所述PSO-LSSVM预测模型；

S37：得到所述各分量的预测结果Y₁,Y₂…Y_n；

S38：加权叠加各分量预测值得到最终预测结果

其中，ω_i为权重，ω_i∈(0,1)。

所述步骤S31，由于预测模型的输入特征会很大程度上影响短期负荷预测的准确性和效率，从原始数据中获得适当的影响负荷分量的特征因素，是进行负荷预测的一个关键步骤，最小冗余度最大相关性(mRMR)标准是使用互信息来测量两个变量之间依赖关系的方法，不仅考虑特征和目标变量之间的相关信息，而且获取特征之间的冗余信息；

由于mRMR的目标是从给定的特征集合中找出与目标变量有最大相关性且相互之间具有最小冗余度的特征，可使用增量搜索法搜索特征；

所述增量搜索法^[5]搜索特征具体包括：假设已经从特征集合F_m中选取的n-1个特征共同构成特征集J_n-1，则根据增量搜索方法从集合{F_m-J_n-1}中选择第n个特征可用公式(9)表示，根据式(9)依次从特征集合F_m剩余的特征中搜索mRMR值最大的特征，最终得到的特征子集J即为候选特征集。

所述步骤S32，具体包括：在分别计算J中每个特征的mRMR值大小，并进行降序排列时，以分量imf5的候选特征集J为例，选取16个(由图5可看出：当imf5的输入特征数量为11个时，对应的预测误差最小；当超过11个后，预测误差会增大，因此没有必要列举过多的特征)特征进行mRMR值的降序排列，如图6所示；

所述图6中L_t-n(n＝1,2,3,…)为待预测时刻前第n个小时对应的负荷特征；由于待预测时刻对应的日类型可提前预知，对应的温度可提前预测，则T_t为待预测时刻温度，Holiday_t为待预测时刻是否为节假日，Month_t为待预测时刻对应的月份，Weekday_t为待预测时刻对应的星期，Hour_t为待预测时刻对应的小时；

所述计算mRMR值大小，具体包括：基于mRMR方法，最大相关性标准可通过特征x_i和目标变量y之间的互信息的平均值表示为^[6]：

其中，x_i指各分量的影响因素；y指各分量；特征集J指特征x_i的集合：包含日类型特征信息数据(月，周，小时，节假日)，天气特征信息数据(温度，湿度，光照强度，风速)，需求侧管理信息数据(电价，激励措施)等；|J|指特征集J中的特征的数量；D指特征集J中各特征x_i与目标变量y之间互信息的均值；I(x_i,y)指特征x_i和目标变量y之间的互信息。

所述互信息^[7]是两个或多个随机变量之间交集部分的信息，在负荷预测中，互信息法用于捕获输入变量和目标变量之间的线性和非线性依赖程度，如果它们是独立的，互信息值为零；如果他们是依赖的，互信息值则对应于关系强度的正值。I(x_i,y)可由下式求取：

其中，p(x_i)、p(y)和p(x_i,y)分别为随机变量x_i、y的边缘概率分布和联合概率分布；变量x_i和变量y相关性越大，互信息的值I(x_i,y)越大；两个变量相互独立时，互信息值为零，意味着两个变量之间不存在相互依赖关系。

由于通过最大相关性标准^[8]选择的特征可能具有一定的冗余度，而冗余特征并不能提高预测模型的精度，反而会降低精度并且会增加计算量；因此，在特征选择过程中，还需计算特征间的冗余度，最小冗余度需要每个特征x_i之间的依赖关系达到最小，可由下式表示：

其中，I(x_i,x_j)为互信息，具体表达式参见上述计算公式，在此不做赘述。

则mRMR的值可由式(11)和式(13)表示为式(14)，其单位：比特(bit)为信息量的度量单位；

maxψ(D,R),ψ＝D-R (14)

其中，D为相关性；R为冗余度。公式(14)用于求取ψ的最大值。

所述步骤S33和S34，具体包括：由于J中特征x_i的mRMR值大小不等，mRMR值较小的特征所包含的特征信息并不充分，若将该特征输入预测模型，会降低预测精度，因此需要从J中挑选出一定数量的特征，作为最佳特征集；考虑输入特征的数量对模型的预测精度和效率均有影响，本发明实施例选取各分量的绝对误差和实际负荷的比值的平均值，即公式(10)，作为评判各分量输入特征的数量对其预测效果影响的依据。

如图6从左至右依次选出J中特征，输入到PSO-LSSVM预测模型^[9]，在根据公式(10)，建立输入特征的数量与预测误差的关系函数，如图5所示。

所述PSO-LSSVM预测模型，具有泛化性能强和非线性拟合精度高的优势，在负荷预测研究中得到广泛应用。由于正则化参数和核函数参数在LSSVM建模中起着重要作用，可采用PSO算法^[10]选择合适的参数，以降低负荷数据非线性、非平稳性对预测结果的影响。

由所述图2可看出：imf1～imf2分量的频率明显较高，而imf3～imf6和残差r分量的频率相对较低。由于对不同频率的分量选择恰当的模型的核函数，可提高预测精度，所以建立LSSVM预测模型时，imf1～imf2分量可选择有较好的局部自适应能力且学习能力较强的径向基核函数；imf3～imf6和残差r分量可选择适用于对低频信号进行建模的线性核函数。

所述LSSVM的核心思想是：通过一个非线性函数

将样本数据从一个原始特征空间映射到一个高维的特征空间；

建立该模型具体包括：设给定训练集为{x_i,y_i}，其中x_i∈R^m是模态分解后的输入样本

数据，y_i∈R是相对应的输出数据。对这些样本点进行非线性回归估计时，LSSVM的

负荷预测线性回归函数可以表示为：

其中，w表示高维特征空间的权值向量；b表示偏差。

当使用LSSVM来解决回归优化问题时，优化目标函数中的损失函数就是误差的二次项，约束条件是等式约束，其优化问题可由下式表示为：

其中，J(w,e)是损失函数；e_i是样本误差项；γ是正则化参数；

为了求解上述优化问题，引入Lagrange函数：

式中，α_i为拉格朗日因子，根据Karush-Kuhn-Tucker条件，可以得到：

消去变量w和e_i，优化问题可转化为如下线性方程：

式中，

是满足Mercer条件的核函数；α＝[α₁,α₂,...,α_l]^T；

所述式(19)为线性方程组，可通过最小二乘法求出α_i和b，则LSSVM的非线性负荷模型可表示为：

所述步骤S35，具体包括：依据图5依次选取各分量的E值最小时对应的特征数量，形成各个IMF分量和残差分量的最佳输入特征集Q，如下表所示；

由上表知：分量imf1～imf3和r的负荷时间序列变化规律主要受历史负荷影响，而分量imf4～imf6与日类型、温度和历史负荷关系紧密。

所述步骤S36、S37和S38，具体包括：所述最佳输入特征Q₁,Q2…Q_n确定后，通过PSO-LSSVM负荷预测模型先对各分量分别进行预测，得到所述各分量的预测结果Y₁,Y₂…Y_n；根据上述公式(10)计算所述各分量的预测误差E₁,E₂…E_n；然后在根据公式

为所述各分量分配权重ω₁,ω₂…ω_n；加权叠加各分量预测值得到最终预测结果

各分量的预测结果和加权叠加后最终预测结果如图6所示。

为了证明本发明提出的方法可行，选择了BP神经网络、LSSVM和PSO-LSSVM预测模型进行预测效果的对比。为了保证客观性，实验结果均为执行50次实验得到的平均值。图7为各个方法的预测结果对比分析图；

由所述图7可知，本发明方法拟合精度最好。

为了进一步证明本法的可行性，用上述三种方法和本方法对另外一组数据(某地2017年7月14日至20日连续一周的负荷)进行分别预测。各方法的预测误差比较，如下表所示；

由上表知：本方法比其他3种方法的预测误差明显要小；

本方法的平均绝对百分误差的总平均值为2.0944％，比BP神经网络的4.1957％、LSSVM的3.2515％、PSO-LSSVM的2.9037％都小。

如图8所示，本实施例还提供了一种基于人工智能的电力负荷预测装置，其具体包括：

S41：数据加工单元，用于异常数据点的辨识和修正；

S42：基于EMD数据分解单元，用于分解预测目标的原始负荷时间序列；

S43：数据预处理单元，用于处理各影响因素特征数据，获得所述原始特征集F_m；

S44：基于mRMR提取最佳特征单元，用于从所述F_m中提取最佳特征集Q；

S45：最佳指标库单元，用于存放所述最佳特征集Q，作为下次预测参考；

S46：基于PSO-LSSVM模型预测单元，用于对所述各分量进行预测；

S47：加权叠加单元，用于叠加各分量负荷预测值得到最终预测结果。

所述步骤S41，具体包括：如图9所示；

S51：数据获取模块，用于从数据库中获取所述预测目标的原始负荷时间序列和所述m个影响因素的特征数据；

S52：异常数据点的辨识模块，用于从获取的数据中辨识出异常数据，可采用双向比较法来进行异常数据点的辨识，具体包括：

(1)选取所获取的m个影响因素的时间序列特征数据，根据需要选取θ值；

(2)按照公式(21)，分别计算t时刻各影响因素的时间序列特征数据的平均值，得到阀值α(t)；

(3)根据公式(22)和(23)判断t时刻各影响因素的时间序列特征数据是否异常，分别记录正常数据和异常数据；

所述公式(21)表示为：

所述公式(22)表示为：|L(i,t)-L(i,t-1)|≥θ*α(t)；

所述公式(23)表示为：

式(21)、(22)和(23)中L(i，t)为第i月t时刻对应的数据值(i＝1,2,…,n)；阈值α(t)为t时刻各影响因素的时间序列特征数据的平均值；θ为人为规定的参数，通过调整θ值的大小可以改变辨识与修正的程度，θ值越大，修正的程度越低；

S53：异常数据点的修正模块，用于修正辨识出的所述异常数据，具体包括：

(4)将异常数据按照公式(24)进行修正，作为判断下一时刻数据的基准值；

所述公式(24)表示为：

其中L(j，t)是经判断后t时刻的正常数据，k为t时刻正常数据的个数；

(5)重复步骤(2)～(4)直至所有数据修复完成。

所述步骤S42，具体程序执行过程包括：

[loaddata,～,～]＝xlsread('data.xls')；％读取Excel文件中的特征数据

Load_col＝6；％原始负荷时间序列所在的列的位置

t＝0:1:(30+60)*24；％本实施例以某地区2017年4月1日至6月30日3个月的数据为原始负荷时间序列，一天取24个点，连续90天的负荷数据共2184个数据点

Load_y＝loaddata(1:2184,Load_col)'；％读取原始负荷时间序列

imf＝emd(Load_y)；％EMD分解原始负荷时间序列

my_emd_visu(Load_y,t,imf)％EMD专用画图函数，如图2所示

所述步骤S43，具体包括：如图10所示；

S61：数据组合模块，用于组合所述各影响因素特征数据，形成矩阵F_n×m，具体程序执行过程包括；

x＝[Calendar,Weather,Price,Load]；％组合日类型、天气、电价以及待预测前一周历史负荷数据

S62：数据归一化模块，根据公式(8)消除不同因素的量纲和限制数据范围，以便于数据处理，具体程序执行过程包括；

[x_scale,ps1]＝mapminmax(x',0,1)；

[y_scale,ps2]＝mapminmax(Load_y,0,1)；％将其映射到0～1范围内。

S63：原始特征集输出模块，用于提取并输出所述原始特征集F_m，具体包括：

经所述数据归一化，形成归一化后的F_n×m矩阵，取矩阵的每一列为一个特征向量即可获得原始特征集合F_m＝{x₁，x₂…x_m}，其中x_m为特征向量。

所述步骤S44，具体包括：如图11所示；

S71：增量搜索模块，用于提取所述候选特征集J，具体包括：

假设已经从特征集合F_m中选取的n-1个特征共同构成特征集J_n-1，则根据增量搜索方法从集合{F_m-J_n-1}中选择第n个特征可用公式(9)表示，根据式(9)依次从特征集合F_m剩余的特征中搜索mRMR值最大的特征，最终得到的特征子集J即为候选特征集；

S72：mRMR值排序模块，根据公式(14)计算所述J中每个特征的mRMR值大小，并进行降序排列，如图12所示；

S73：PSO-LSSVM预测模块，用于预测从所述J中依次选出的特征；

S74：建立关系函数模块，用于建立输入特征的数量与预测误差E的关系函数；

如图12从左至右依次选出J中特征，输入到PSO-LSSVM预测模型，在根据公式(10)，建立输入特征的数量与预测误差的关系函数，如图5所示；

S75：最佳输入特征集输出模块，用于选取所述各分量的预测误差E最小时对应的特征数量，形成各分量的最佳输入特征集Q，具体包括：

依据图11依次选取各分量的E值最小时对应的特征数量，形成各个IMF分量和残差分量的最佳输入特征集Q。

所述步骤S45，具体包括：

将负荷预测的每一天的最佳特征集Q导入最佳指标库，防止数据收集装置出现故障导致数据中断，若数据中断发生最佳指标库中根据相似日匹配最佳特征集。

所述步骤S46和S47，具体包括：

将所述各分量的最佳输入特征集Q₁,Q2…Q_n分别输入所述PSO-LSSVM预测模型；

得到所述各分量的预测结果Y₁,Y₂…Y_n；

根据上述公式(10)计算所述各分量的预测误差E₁,E₂…E_n；

根据公式

为所述各分量分配权重ω₁,ω₂…ω_n；

加权叠加各分量预测值得到最终预测结果

上述的一种基于人工智能的电力负荷预测装置，将电力负荷预测任务分配到每个单元执行，每个单元在细化到具体的任务模块，依次执行，完成了本发明将数据处理方法EMD、特征提取方法mRMR和预测模型PSO-LSSVM组合进行电力负荷预测的任务。本发明可减少预测模型的输入特征数量，从而提高预测的效率，同时可充分考虑不同外部敏感因素的影响，提高预测精度。

参考文献

[1]Niu D,Dai S.A.Short-term load forecasting model with a modifiedparticle swarm optimization algorithm and least squares support vectormachine based on the denoising method of empirical mode decomposition andgrey relational analysis[J].Energies,2017,10.

[2]X Qiu,P N Suganthan and G A J Amaratunga,Electricity load demandtime series forecasting with empirical mode decomposition based random vectorfunctional link network[J].IEEE International Conference on Systems,2016,1394-1399.

[3]杨茂，陈郁林.基于EMD分解和集对分析的风电功率实时预测[J].电工技术学报，2016，31(21):86-93.

YANG Mao，CHEN Yulin.Real-time wind power forecasting based on EMDdecomposition and set pair analysis[J].Transactions of China ElectrotechnicalSociety，2016，31(21):86-93.

[4]康重庆，夏清，刘梅.电力系统负荷预测[M].北京：中国电力出版社，2017.KANGChongqing,XIA Qing,LIU Mei.Power system load forecast[M].Beijing:ChinaElectric Power Press,2017.

[5]Peng H,Long F,Ding C.Feature selection based on mutualinformationcriteria of max-dependency,max-relevance,and min-redundancy[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,2005,27(8):1226-1238.

[6]李扬，顾雪平.基于改进最大相关最小冗余判据的暂态稳定评估特征选择[J].中国电机工程学报，2013，33(34)：179-186+27.

LI Yang,GU Xueping.Transient stability evaluation feature Selectionbased on improved maximum dependent minimum redundancy criterion[J].ChineseJournal of Electrical Engineering,2013,33(34):179-186+27.Electric PowerSystems and Automation,2017，29(7)：7-12.

[7]Keqiang Dong,LinanLong,Hong Zhang,You Gao.The mutualinformationbased minimum spanning tree to detectand evaluate dependenciesbetween aero-engine gas path system variables[J].Physica A:StatisticalMechanics and its Applications,2018,506.

[8]王琦，关添升，秦本双.基于MRMR的ORELM的短期风速预测[J].可再生能源，2018，36(01)：85-90.

WANG Qi,GUAN Tiansheng,QIN Benshuang.Short-term wind speed predictionbased on MRMR ORELM[J].Renewable Energy,2018,36(01):85-90.

[9]马小津，朱博，等.基于改进PSO-LSSVM的短期电力负荷预测[J].控制理论与应用，2016，35(3)：5-9,+11.

MA Xiaojin,ZHU Bo,et al.Short-term power load forecasting based onimproved PSO-LSSVM[J].Control Theory and Applications,2016,35(3):5-9,+11.

[10]张永峰，崔凯.应用共识PSO协同Trust-Tech方法的短期负荷预测[J].电力系统及其自动化学报.2017，29(7)：7-12.

ZHANG Yongfeng,CUI Kai.Short-term load forecasting using consensusPSO and Trust-Tech method[J].Journal ofElectric Power Systems and Automation,2017，29(7)：7-12.

本发明实施例对各器件的型号除做特殊说明的以外，其他器件的型号不做限制，只要能完成上述功能的器件均可。

本领域技术人员可以理解附图只是一个优选实施例的示意图，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。