CN116169670A

CN116169670A - 一种基于改进神经网络的短期非居民负荷预测方法及系统

Info

Publication number: CN116169670A
Application number: CN202310178542.7A
Authority: CN
Inventors: 李志立; 张伟; 杨东东; 张卫宁; 王盼星; 王彩霞; 杨文杰; 康兆年; 刘瑞华; 孟庆昌; 李瑞静
Original assignee: Puyang Power Supply Co of State Grid Henan Electric Power Co Ltd
Current assignee: Puyang Power Supply Co of State Grid Henan Electric Power Co Ltd
Priority date: 2023-02-27
Filing date: 2023-02-27
Publication date: 2023-05-26

Abstract

本发明涉及一种基于改进神经网络的短期非居民负荷预测方法及系统，包括如下步骤：采用随机森林算法与箱线图对原始数据集进行缺失值和异常值检测、填充，并对数据进行归一化处理；对原始负荷数据集中特征进行皮尔逊相关性分析；对原始负荷序列进行小波变换；改进小波神经网络的神经元激活函数与参数更新方式；对短期非居民负荷进行区间预测，进一步建立短期负荷预测系统；本发明采用区间预测的方法，相比传统点预测方法可提供更加可靠的信息，有助于调度部门制定发电计划，避免供电不足造成非居民负荷用户不必要的经济损失，本发明具有较高的经济性与可靠性。

Description

一种基于改进神经网络的短期非居民负荷预测方法及系统

技术领域

本发明属于负荷预测技术领域，具体涉及一种基于改进神经网络的短期非居民负荷预测方法及系统。

背景技术

电力作为国民经济的重要支撑产业，与人民群众的日常生活和工业生产等方方面息息相关，平稳持续且经济的高质量电力是科技发展、经济腾达与社会稳定的必要前提。因此，电力系统安全可靠的供电和电网经济良好规律运行的重要性不言而喻，需要制定合理周全的发电计划和电力调度方案为其保驾护航，而计划与方案的制定又依赖于准确的电力负荷预测。电力系统的稳定运行要求发电量与负荷变化维持实时动态平衡，然而负荷波动的随机性较强、非线性特征明显，且影响因素多元化，因此需要深入探究负荷的变化规律，提高负荷预测的精度，才能合理的制定电力生产计划，达到降低电力生产成本，维持电力资源供需平衡的效果。

近年来，伴随着深度学习的兴起，人工神经网络算法领域不断取得新的突破，出现了许多更优越的网络结构和训练算法。国内外关于负荷预测的研究以确定性点预测居多，由于负荷类别及性质呈多样化发展，不确定性逐渐增加，负荷的确定性预测结果中隐藏的风险也不容忽视。而对负荷进行概率预测，可以提供某一置信度下负荷预测值的波动区间或负荷预测值的概率密度分布，相较于点预测可以得到更多的信息，从而揭示未来负荷可能出现的不确定性风险，进一步根据预测结果分布或预测区间，可将其用于发电规划、供电规划、概率价格预测、设备故障预测以及可再生能源的集成等多个领域，对提升电网可靠性和运营效益具有重大的现实意义。

发明内容

不确定性负荷变化波动较大，导致点预测稳定性、可靠性变低，为解决该问题，本发明提出一种基于改进神经网络的短期非居民负荷区间预测方法及系统。首先，对获取的数据进行预处理、对特征进行相关性分析；其次，对小波神经网络的激活函数及参数更新方法进行改进；在此基础上，进一步建立短期非居民负荷区间预测系统，提升整体的一体化性能。

本发明采用的技术方案为：一种基于改进神经网络的短期非居民负荷预测方法及系统，包括如下步骤：

S1：对原始数据集进行缺失值和异常值检测、填充，并对数据进行归一化处理；

S2：对原始负荷数据集中特征进行相关性分析；

S3：对原始负荷序列进行小波变换；

S4：改进小波神经网络的神经元激活函数与参数更新方式；

S5：实现短期非居民负荷区间预测，建立短期负荷预测系统。

具体的，所述步骤S1：对原始数据集进行缺失值和异常值检测、填充，并对数据进行归一化处理。该部分具体包括：

(1)采用随机森林算法对原始数据集进行缺失值填充。对于一个m行n列的数据集(n表示特征个数，m表示特征序列长度)，其中特征i含缺失值，将缺失值所在行其他特征数据作为预测输入数据，缺失值作为待预测对象，其他n-1个特征不含缺失值所在行的数据作为训练集x_train，i中未缺失数据作为y_train，随后对模型进行训练并对缺失值进行回归预测；

(2)利用箱线图对异常数据进行检测并采用随机森林算法填充。首先，用箱线图原理对原始数据进行异常值检测，随后将异常值视为缺失值，最后采用随机森林算法对缺失值填充。箱线图判断为异常值的条件为：

式中，x_a表示异常值；Q₁、Q₃分别表示箱线图的上四分位数和下四分位数；IQR表示四分位间距，即IQR＝Q₁-Q₃；

(3)数据归一化处理。原始数据集中各时序数据量纲不同、数值差别较大，若直接用于模型训练，会使模型学习非线性特征的能力变弱，需要对数据进行归一化处理至[0,1]区间。采用最大最小标准化对数据进行归一化，计算公式为：

式中：x_i(k)为特征i的第k个样本的原始值，x_i,max、x_i,min分别为特征i中最小值和最大值，x_i′(k)为归一化值。

具体的，所述步骤S2：对原始负荷数据集中特征进行相关性分析。皮尔逊相关系数在欧几里得距离上做了改进，提供了对于变量取值范围不同情况下的处理方法，是一种有效的判断向量相似度的方式。

对于两个序列X和Y的皮尔逊相关性系数计算公式为：

式中：n为序列长度，x_i和y_i分别为序列X和Y的第i个变量，

和/>

分别为序列X和Y的平均值。

具体的，所述步骤S3：对原始负荷序列进行小波变换。考虑到负荷的波动性较大，利用小波分析将负荷序列变换为不同平滑的子序列，然后按照各自尺度进行研究，小波变换系数计算公式为：

式中，W(·)为小波函数；v_t表示t时刻的负荷值；T表示序列长度；

是关于分辨率等级R和位置S的系数，该系数由观测数的T/2R决定，其中T需被2R整除。

随后采用父小波提取序列低频部分、母小波提取序列高频部分，并选择正交函数作为小波函数，可得到粗糙集{A₁,A₂,…,A_R*}和精确集{D₁,D₂,…,D_R*}，两个集合通过下列公式求得：

式中，

分别为父、母小波函数各自的对应系数，由公式(4)计算求得；

ψ_RS(t)分别表示父小波函数和母小波函数，计算公式为：

最终，负荷序列可以变换为：v_t＝D₁+…+D_R*+A_R*。

具体的，所述步骤S4：改进小波神经网络神经元激活函数与参数更新方式。

(1)神经元激活函数的改进。

将Morlet小波作为小波神经网络(WaveletNeural Network,WNN)隐藏层神经元的激活函数。相比于Mexican hat小波，Morlet小波可以更好地模拟负荷非均匀时间序列的高频分量，相比传统激活函数具有更高的泛化能力。为了提高性能，其中除了隐藏层神经元与输出神经元相连接外，部分输入神经元也直接连接到输出神经元，即WNN的输出由输入和经过隐藏层神经元输出的序列组成。假设x_i表示输入序列，y表示目标序列，隐藏层中的激活函数可以表示为：

式中，L为隐藏层神经元个数；a_i、b_i分别表示尺度因子和时移因子；τ_ai,bi(x_j)表示对τ(x)进行尺度时移变换；τ(x)为Morlet小波函数，函数定义为：

最终网络的输出为：

式中，w_i为第i个隐藏层神经元与输出神经元之间的权重系数；u_j表示第j个输入神经元与输出神经元之间的权重系数。

(2)参数更新方法的改进。

神经网络常采用梯度下降法对网络参数进行更新，考虑在参数更新时梯度下降法会陷入局部最优，因此采用极限学习机(Extreme Learning Machine,ELM)对WNN的参数进行更新。根据公式(12)，WNN待更新的参数个数为3L+n，即参数Z＝{w₁,…,w_L；a₁,…,a_L；b₁,…,b_L；u₁,…,u_n}。利用ELM对WNN参数进行更新，随机选择尺度因子、时移因子、输入神经元和隐藏层神经元之间的权重系数，而输入神经元和输出神经元、隐藏层神经元与输出神经元之间的权重系数通过简单的矩阵计算和变换得到。假设WNN有n个输入、m个输出，输入-输出对可以表示为

N表示网络输入-输出对的个数，其中x_i＝[x_i1,x_i2,…,x_in]，t_i＝[t_i1,t_i2,…,t_im](i＝1,2,…,N)。则网络方程为：

式中，w_i＝[w_i1,w_i2,…,w_im]^T表示第i个隐藏层神经元与输出神经元之间的权重参数；u_i＝[u_i1,u_i2,…,u_im]^T为第i个神经元与输出神经元之间的权重参数；F_i(x_j)为激活函数，表示第j个输入神经元经过第i个隐藏层神经元后的输出，其中a_i、b_i通过ELM随机取值。

将公式(13)写成矩阵形式：

FW+UX＝T (14)

式中，各个矩阵具体形式为：

对公式(14)进行矩阵变换，可以进一步化简为：

Hβ＝T (20)

式中，H和β形式为：

公式(20)中，β为待学习更新的参数变量，两边左乘H的逆矩阵即可得到参数矩阵的更新公式：

β＝H^-1T (22)

传统梯度下降法更新参数需要多次迭代计算，计算成本较高，而矩阵运算相对简单，在计算效率方面，利用ELM进行网络参数更新具有显著的优势。

具体的，所述步骤S5具体为：实现短期非居民负荷区间预测，建立短期负荷预测系统。

(1)标签值由预测输出值和预测误差值组成，即：

t_i＝R(x_i)+E(x_i) (23)

式中，R(x_i)表示回归预测模型的输出值；E(x_i)为正态分布的误差噪声，均值为0，方差为

方差取决于输入序列x_i。通过WNN后的预测值为/>

表示对预测值R(x_i)的参数估计，则预测误差为：

在置信水平100(1-δ)％下t_i的预测区间可以表示为

其中

分别为预测区间的上下限，定义为：

式中，

为表示衡量模型不确定性的方差，z_1-δ2表示标准正态分布的临界值，取决于期望的置信水平。

最终的概率计算公式为：

(2)随后采用Bootstrapping对预测系统的不确定性方差

进行分析计算，主要利用有限的样本数据经多次重复抽样，重新建立起足以代表系统样本分布的新样本，与一般参数估计的方法相比更简单、可靠性更高。具体步骤为：

1)通过WNN得到预测序列

2)计算误差：

并对误差进行标准化：/>

3)用

替换/>

得到新的标签值/>

随后组成新的输入-输出对/>

4)利用新的输入输出对再次对模型进行训练，得到第q次的预测值：

5)重复步骤2)到步骤4)，一共重复数据B次，每次网络均会更新参数并对负荷进行预测，随后计算出WNN的平均输出值：

最后可以求出系统不确定性的方差：

(3)区间预测效果评估

用区间覆盖率(Prediction Interval Coverage Probability,PICP)对区间预测模型的可靠性进行评价，计算公式为：

式中，

为逻辑值，当观测值落在预测区间内时取1，否则取0。当预测模型可靠性高的时候，PICP趋于置信水平100(1-δ)％。

(4)短期负荷预测系统建立。基于上述理论分析，搭建负荷预测系统软硬件平台。主要结构包括：数据采集层，数据挖掘层，集成层、系统应用层，用户层。

1)数据采集层主要负责整合系统访问的所有电力负荷数据，包括非居民用电数据、当地气象数据、环境数据等，将数据统一存放到数据库中，软件系统通过网络经过数据连接层访问数据库；

2)数据挖掘层以数据挖掘作为核心技术对所有的负荷数据相关特征进行分析和深度挖掘，并构建预测模型从而为接下来的预测提供数据支持；

3)集成层主要将硬件、软件系统进行结合，实现软硬件一体化；

4)系统应用层主要负责利用预测模型对负荷进行预测，为用户与负责人提供更加直观的表达。

5)用户层主要分为系统负责人员与客户两大类，他们是该系统的主要参与者与应用者。

本发明的有益效果：本发明针对为了克服不确定性负荷变化带来的点预测稳定性、可靠性低的缺点，提出一种基于改进神经网络的短期非居民负荷区间预测方法及系统，提供更加可靠的预测方法，进一步建立负荷预测系统，提升整体的一体化性能。相比于传统点预测方法，区间预测可提供更多隐藏的价值信息，电网调度中心利用预测系统对非居民负荷进行实时预测及监控，可以合理安排调度计划，避免供电不足造成工业生产部门、银行、医院、商场等大型用电负荷对象不必要的损失，具有较高的经济性与可靠性。

附图说明

图1为本发明的预测实现流程图；

图2为本发明一改进三层结构的WNN网络结构；

图3为本发明的负荷预测系统简图；

图4为本发明的未对异常值处理前数据归一化箱线图；

图5为本发明的对异常值处理后数据归一化箱线图；

图6为本发明的数据集特征皮尔逊相关性热力图；

图7为本发明的所提方法在置信水平为95％下的区间预测结果；

图8为本发明的所提方法在置信水平为90％下的区间预测结果。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围，以下结合实施例具体说明。

本发明包括如下步骤：

根据流程图1，具体的，所述步骤S1中，获取负荷数据后，对数据集进行缺失值和异常值检测、填充，并对数据进行归一化处理。该部分具体包括：

(3)数据归一化处理。原始数据集中各时序数据量纲不同、数值差别较大，若直接用于模型训练，会使模型学习非线性特征的能力变弱，需要对数据进行归一化处理至[0,1]区间。采用最大最标准化进行归一化，计算公式为：

根据流程图1，具体的，所述步骤S2：对原始负荷数据集中特征进行相关性分析。皮尔逊相关系数在欧几里得距离上做了改进，提供了对于变量取值范围不同情况下的处理方法，是一种有效的判断向量相似度的方式。

对于两个序列X和Y的皮尔逊相关性系数计算公式为：

式中：n为序列长度，x_i和y_i分别为序列X和Y的第i个变量，x和y分别为序列X和Y的平均值。P的取值范围为[-1,1]，P越趋近于0，两个向量的相关性越低，越趋近于-1则成负相关，趋近于1成正相关。当|P|∈[0.8,1.0]，两个向量呈极度相关；当|P|∈[0.6,0.8]，两个向量呈强相关性；当|P|∈[0.4,0.6]，两个向量呈中等相关；当|P|∈[0.2,0.4]，两个向量呈弱相关性；当|P|∈[0,0.2]，两个向量呈极弱或不相关。

根据流程图1，具体的，所述步骤S3：对原始负荷序列进行小波变换。考虑到负荷的波动性较大，利用小波分析将负荷序列划分为不同平滑的子序列，然后按照各自尺度进行研究，小波变换系数计算公式为：

采用父小波提取序列低频部分、母小波提取序列高频部分，并选择正交函数作为小波函数，随后可得到粗糙集{A₁,A₂,…,A_R*}和精确集{D₁,D₂,…,D_R*}，两个集合通过下列公式求得：

式中，

ψ_RS(t)分别表示父小波函数和母小波函数，计算公式为：

最终，负荷序列可以变换为：v_t＝D₁+…+D_R*+A_R*。

根据图2神经网络结构，具体的，所述步骤S4：改进小波神经网络神经元激活函数与参数更新方式。

(1)神经元激活函数的改进。

WNN常采用Mexican hat小波作为激活函数，相比于Mexican hat小波，Morlet小波可以更好地模拟负荷非均匀时间序列的高频分量，且相比传统激活函数具有更高的泛化能力，因此将Morlet小波作为小波神经网络隐藏层神经元的激活函数。为了提高性能，其中除了隐藏层神经元与输出神经元相连接外，部分输入神经元也直接连接到输出神经元，即WNN的输出由输入和经过隐藏层神经元输出的序列组成。附图1给出了一个三层WNN结构，其中x_i表示输入序列，y表示目标序列，隐藏层中的激活函数可以表示为：

式中，L为隐藏层神经元个数；a_i、b_i分别表示尺度因子和时移因子；

表示对τ(x)进行尺度时移变换；τ(x)为Morlet小波函数，函数定义为：

最终网络的输出为：

(2)参数更新方法的改进。

式中，w_i＝[w_i1,w_i2,…,w_im]^T表示第i个隐藏层神经元与输出神经元之间的权重参数；u_i＝[u_i1,u_i2,…,u_im]^T为第i个神经元与输出神经元之间的权重参数；F_i(x_j)为激活函数，表示第j个输入神经元经过第i个隐藏层神经元后的输出，其中a_i、b_i通过ELM随机赋值。

将上式写成矩阵形式：

FW+UX＝T

式中，各个矩阵具体形式为：

/>

进一步对原公式进行矩阵变换，可以简化为：

Hβ＝T

式中，H和β形式为：

其中，β为待学习更新的参数变量，两边左乘H的逆矩阵即可得到参数矩阵的更新公式：

β＝H^-1T

根据图1、3，具体的，所述步骤S5具体为：实现短期非居民负荷区间预测，建立短期负荷预测系统。

(1)标签值由回归预测模型的输出值和预测误差值组成，即：

t_i＝R(x_i)+E(x_i)

方差取决于输入序列x_i。通过WNN后的预测值为/>

表示对真实值R(x_i)的预测，则预测误差为：

/>

在置信水平100(1-δ)％下t_i的预测区间可以表示为

其中

分别为预测区间的上下限，定义为：

式中，

为表示考虑在输入-输出对下模型不确定性的方差，z_1-δ2表示标准正态分布的临界值，取决于期望的置信水平。

最终的概率计算公式为：

(2)随后采用Bootstrapping对预测系统的不确定性方差

1)通过WNN得到预测序列

2)计算误差：

并对误差进行标准化：/>

3)用

替换/>

得到新的标签值/>

随后组成新的输入-输出对

4)利用新的输入输出对再次预测，得到第q次的预测值：

最后可以求出系统不确定性的方差：

(3)区间预测效果评估

式中，

(4)短期负荷预测系统建立。基于上述理论分析，搭建负荷预测系统软硬件平台。主要结构包括：数据采集层，数据挖掘层，集成层、系统应用层，用户层，附图3给出了结构简图。

1)数据采集层主要负责整合系统访问的所有电力负荷数据，包括非居民用电数据、当地气象数据、环境数据等，将数据统一存放到数据库中，软件系统通过网络经过数据连接层访问数据库，进一步可基于python编程对数据进行预处理等操作。

2)数据挖掘层以数据挖掘作为核心技术对所有的负荷数据相关特征进行分析和深度挖掘，该层基于python语言、pytorch深度学习框架，可对特征进行相关性分析并筛选、进一步提取和构造新的特征，为构建预测模型提供数据支撑；

3)集成层主要将数据采集设备、服务器、显示器等硬件设备、pycharm等软件系统进行结合，实现软硬件一体化；

4)系统应用层主要通过python语言、pytorch框架、pycharm编译软件等搭建负荷预测模型，并负责利用模型对非居民负荷进行短期预测，为用户与负责人提供更加直观的表达。

5)用户层主要分为系统负责人员与客户两大类，他们是该系统的主要参与者与应用者，该部分根据相关人员需求，在上位机上编程对算法进行改进，可进一步提高负荷预测的可靠性与精确性。

以下对本发明的有效性进行验证：

实验数据来源于我国某地区2018—2019年实际总负荷及相应的天气数据来进行算法验证，数据时间间隔为1h，总共17520个数据点，数据特征包括负荷(Load)、最高温度(Tmax)、最低温度(Tmin)、平均温度(Tmean)、相对湿度(Hmean)、降雨量(Rain)这6个特征。将全年的数据集按照9:1划分为训练集和验证集，即训练集含15768个数据，验证集含有1752个数据点。

通过对原始数据集进行缺失值、异常值检测，得到不良数据个数如表1所示，采用随机森林算法对上述缺失值进行填充，随后将异常值视为缺失值，利用随机随机森林算法进行填充，修正前后归一化箱线图如附图4、附图5所示。

表1不良数据个数

按照预测流程图，对上述特征进行特征相关性分析，相关性计算结果如附图6所示，其中Tmax、Tmin、Tmean与Load的相关性分别为0.43、0.46、0.46，属于中等相关，而Hmean与Load的相关性只有0.08，属于极弱相关或不相关，因此选取Tmax、Tmin、Tmean作为输入数据进行预测模型训练。

按照预测流程图，经过负荷序列小波变换后对WNN网络进行参数更新，随后进行负荷区间预测。为了验证所提方法的性能，设置两个对照实验进行对比分析。

(1)将Bootstrapping+WNN、小波变换+Bootstrapping+WNN、小波变换+Bootstrapping+遗传算法更新参数+WNN三种对比方法与所提方法进行比较，验证其有效性。所提方法在置信水平为95％、90％时对未来两天负荷变化情况的区间预测结果如附图7、8所示，经过计算，三个对比方法分别在90％置信水平和95％置信水平下的PICP值如表2所示。

表2对比方法及评价指标值

从表2可以看出，两种置信水平下，对比方法1的PICP值均比对比方法2的小，说明小波变换对负荷序列进行处理后用于网络训练可提升其区间预测水平，而所提方法在置信水平90％和95％下的PICP值均大于其他三种对比方法，说明采用ELM更新网络参数比随机梯度下降法以及智能算法更新参数后，网络的区间预测效果更好，同时也说明了所提方法的有效性。

(2)为了进一步对比本发明方法的优势，将所提方法与反向传播神经网络(BP)、径向基网络(RBF)进行对比分析，三种对比方法均采用小波变换对负荷序列进行处理、均采用ELM对网络参数进行更新、均采用Bootstrapping方法更新两类数据集，两种置信水平下各方法计算的PICP值如表3所示。

表3对比方法及评价指标值

从表3可以看出，在两个置信水平下，WNN计算出的PICP值更大，具体的，在90％的置信水平下，相比于BP和RBF，WNN计算出的PICP值分别高2.98％和2.8％，在95％的置信水平下，WNN计算出的PICP值分别高1.79％和1.01％，说明相比于BP和RBF，WNN在区间预测方面具有更好的预测准确度，验证了所提方法具有较高的区间预测性能。

通过上述两组实验分析，结果表明：

1)对负荷序列进行小波变换后用于网络训练能够提升区间预测准确度；

2)相比于梯度下降法与智能算法对网络参数进行更新，采用ELM网络对WNN网络参数进行更新可进一步提高区间预测准确度；

3)WNN网络具有比传统网络更高的区间预测准确度。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的得同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims

1.一种基于改进神经网络的短期非居民负荷预测方法及系统，其特征在于，包括如下步骤：

S2：对原始负荷数据集中特征进行相关性分析；

S3：对原始负荷序列进行小波变换；

S4：改进小波神经网络的神经元激活函数与参数更新方式；

2.根据权利要求1所述的一种基于改进神经网络的短期非居民负荷预测方法及系统，其特征在于，步骤S1、S2中，考虑到数据收集过程中出现不良操作或者设备异常，使得原始数据中存在缺失值和异常值，需要对原始数据集进行缺失值和异常值检测、填充，并对数据进行归一化处理，随后对原始负荷数据集中特征进行相关性分析，具体实施步骤为：

(1)采用随机森林算法对原始数据集进行缺失值填充；对于一个m行n列的数据集(n表示特征个数，m表示特征序列长度)，其中特征i含缺失值，将缺失值所在行其他特征数据作为预测输入数据，缺失值作为待预测对象，其他n-1个特征不含缺失值所在行的数据作为训练集x_train，i中未缺失数据作为y_train，随后对模型进行训练并对缺失值进行回归预测；

(2)利用箱线图对异常数据进行检测并采用随机森林算法填充；首先，用箱线图原理对原始数据进行异常值检测，随后将异常值视为缺失值，最后采用随机森林算法对缺失值填充；箱线图判断为异常值的条件为：

(3)数据归一化处理；原始数据集中各时序数据量纲不同、数值差别较大，若直接用于模型训练，会使模型学习非线性特征的能力变弱，需要对数据进行归一化处理至[0,1]区间；采用最大最小标准化对数据进行归一化，计算公式为：

式中：x_i(k)为特征i的第k个样本的原始值，x_i,max、x_i,min分别为特征i中最小值和最大值，x_i′(k)为归一化值；

(4)对原始负荷数据集中特征进行相关性分析；皮尔逊相关系数在欧几里得距离上做了改进，提供了对于变量取值范围不同情况下的处理方法，是一种有效的判断向量相似度的方式；

对于两个序列X和Y的皮尔逊相关性系数计算公式为：

/>

式中：n为序列长度，x_i和y_i分别为序列X和Y的第i个变量，

和/>

分别为序列X和Y的平均值。

3.根据权利要求1所述的一种基于改进神经网络的短期非居民负荷预测方法及系统，其特征在于，所述步骤S3中，对原始负荷序列进行小波变换；考虑到负荷的波动性较大，利用小波分析将负荷序列变换为不同平滑的子序列，然后按照各自尺度进行研究，小波变换系数计算公式为：

是关于分辨率等级R和位置S的系数，该系数由观测数的T/2R决定，其中T需被2R整除；

式中，

分别为父、母小波函数各自的对应系数，由公式(4)计算求得；/>

ψ_RS(t)分别表示父小波函数和母小波函数，计算公式为：

最终，负荷序列可以变换为：v_t＝D₁+…+D_R*+A_R*。

4.根据权利要求1所述的一种基于改进神经网络的短期非居民负荷预测方法及系统，其特征在于，所述步骤S4中，对神经元激活函数进行改进；将Morlet小波作为小波神经网络(Wavelet Neural Network,WNN)隐藏层神经元的激活函数；相比于Mexican hat小波，Morlet小波可以更好地模拟负荷非均匀时间序列的高频分量，相比传统激活函数具有更高的泛化能力；为了提高性能，其中除了隐藏层神经元与输出神经元相连接外，部分输入神经元也直接连接到输出神经元，即WNN的输出由输入和经过隐藏层神经元输出的序列组成；假设x_i表示输入序列，y表示输出序列，隐藏层中的激活函数可以表示为：

表示对τ(x)进行尺度时移变换；τ(x)为Morlet小波函数，函数定义为：/>

最终网络的输出为：

5.根据权利要求1和4所述的一种基于改进神经网络的短期非居民负荷预测方法及系统，其特征在于，所述步骤S4中，进一步对神经网络参数更新方式进行改进；神经网络常采用梯度下降法对网络参数进行更新，考虑在参数更新时梯度下降法会陷入局部最优，因此采用极限学习机(Extreme Learning Machine,ELM)对WNN的参数进行更新；根据公式(12)，WNN待更新的参数个数为3L+n，即参数Z＝{w₁,…,w_L；a₁,…,a_L；b₁,…,b_L；u₁,…,u_n}；利用ELM对WNN参数进行更新，随机选择尺度因子、时移因子、输入神经元和隐藏层神经元之间的权重系数，而输入神经元和输出神经元、隐藏层神经元与输出神经元之间的权重系数通过简单的矩阵计算和变换得到；假设WNN有n个输入、m个输出，输入-输出对可以表示为

N表示网络输入-输出对的个数，其中x_i＝[x_i1,x_i2,…,x_in]，t_i＝[t_i1,t_i2,…,t_im](i＝1,2,…,N)；则网络方程为：

式中，w_i＝[w_i1,w_i2,…,w_im]^T表示第i个隐藏层神经元与输出神经元之间的权重参数；u_i＝[u_i1,u_i2,…,u_im]^T为第i个神经元与输出神经元之间的权重参数；F_i(x_j)为激活函数，表示第j个输入神经元经过第i个隐藏层神经元后的输出，其中a_i、b_i通过ELM随机取值；

将公式(13)写成矩阵形式：

FW+UX＝T(14)

式中，各个矩阵具体形式为：