CN116169670A - 一种基于改进神经网络的短期非居民负荷预测方法及系统 - Google Patents
一种基于改进神经网络的短期非居民负荷预测方法及系统 Download PDFInfo
- Publication number
- CN116169670A CN116169670A CN202310178542.7A CN202310178542A CN116169670A CN 116169670 A CN116169670 A CN 116169670A CN 202310178542 A CN202310178542 A CN 202310178542A CN 116169670 A CN116169670 A CN 116169670A
- Authority
- CN
- China
- Prior art keywords
- data
- load
- value
- prediction
- wavelet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 30
- 210000002569 neuron Anatomy 0.000 claims abstract description 38
- 230000009466 transformation Effects 0.000 claims abstract description 20
- 230000004913 activation Effects 0.000 claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 230000002159 abnormal effect Effects 0.000 claims abstract description 17
- 238000010586 diagram Methods 0.000 claims abstract description 16
- 238000007637 random forest analysis Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 46
- 210000004205 output neuron Anatomy 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 23
- 239000011159 matrix material Substances 0.000 claims description 21
- 210000002364 input neuron Anatomy 0.000 claims description 15
- 108090000672 Annexin A5 Proteins 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 238000011478 gradient descent method Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 10
- 238000007418 data mining Methods 0.000 claims description 9
- 230000010354 integration Effects 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 9
- 238000010219 correlation analysis Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 claims description 3
- 238000013450 outlier detection Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 238000011160 research Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 238000013480 data collection Methods 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000010248 power generation Methods 0.000 abstract description 2
- 238000010220 Pearson correlation analysis Methods 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 235000009413 Ratibida columnifera Nutrition 0.000 description 3
- 241000510442 Ratibida peduncularis Species 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/061—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Neurology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Power Engineering (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于改进神经网络的短期非居民负荷预测方法及系统,包括如下步骤:采用随机森林算法与箱线图对原始数据集进行缺失值和异常值检测、填充,并对数据进行归一化处理;对原始负荷数据集中特征进行皮尔逊相关性分析;对原始负荷序列进行小波变换;改进小波神经网络的神经元激活函数与参数更新方式;对短期非居民负荷进行区间预测,进一步建立短期负荷预测系统;本发明采用区间预测的方法,相比传统点预测方法可提供更加可靠的信息,有助于调度部门制定发电计划,避免供电不足造成非居民负荷用户不必要的经济损失,本发明具有较高的经济性与可靠性。
Description
技术领域
本发明属于负荷预测技术领域,具体涉及一种基于改进神经网络的短期非居民负荷预测方法及系统。
背景技术
电力作为国民经济的重要支撑产业,与人民群众的日常生活和工业生产等方方面息息相关,平稳持续且经济的高质量电力是科技发展、经济腾达与社会稳定的必要前提。因此,电力系统安全可靠的供电和电网经济良好规律运行的重要性不言而喻,需要制定合理周全的发电计划和电力调度方案为其保驾护航,而计划与方案的制定又依赖于准确的电力负荷预测。电力系统的稳定运行要求发电量与负荷变化维持实时动态平衡,然而负荷波动的随机性较强、非线性特征明显,且影响因素多元化,因此需要深入探究负荷的变化规律,提高负荷预测的精度,才能合理的制定电力生产计划,达到降低电力生产成本,维持电力资源供需平衡的效果。
近年来,伴随着深度学习的兴起,人工神经网络算法领域不断取得新的突破,出现了许多更优越的网络结构和训练算法。国内外关于负荷预测的研究以确定性点预测居多,由于负荷类别及性质呈多样化发展,不确定性逐渐增加,负荷的确定性预测结果中隐藏的风险也不容忽视。而对负荷进行概率预测,可以提供某一置信度下负荷预测值的波动区间或负荷预测值的概率密度分布,相较于点预测可以得到更多的信息,从而揭示未来负荷可能出现的不确定性风险,进一步根据预测结果分布或预测区间,可将其用于发电规划、供电规划、概率价格预测、设备故障预测以及可再生能源的集成等多个领域,对提升电网可靠性和运营效益具有重大的现实意义。
发明内容
不确定性负荷变化波动较大,导致点预测稳定性、可靠性变低,为解决该问题,本发明提出一种基于改进神经网络的短期非居民负荷区间预测方法及系统。首先,对获取的数据进行预处理、对特征进行相关性分析;其次,对小波神经网络的激活函数及参数更新方法进行改进;在此基础上,进一步建立短期非居民负荷区间预测系统,提升整体的一体化性能。
本发明采用的技术方案为:一种基于改进神经网络的短期非居民负荷预测方法及系统,包括如下步骤:
S1:对原始数据集进行缺失值和异常值检测、填充,并对数据进行归一化处理;
S2:对原始负荷数据集中特征进行相关性分析;
S3:对原始负荷序列进行小波变换;
S4:改进小波神经网络的神经元激活函数与参数更新方式;
S5:实现短期非居民负荷区间预测,建立短期负荷预测系统。
具体的,所述步骤S1:对原始数据集进行缺失值和异常值检测、填充,并对数据进行归一化处理。该部分具体包括:
(1)采用随机森林算法对原始数据集进行缺失值填充。对于一个m行n列的数据集(n表示特征个数,m表示特征序列长度),其中特征i含缺失值,将缺失值所在行其他特征数据作为预测输入数据,缺失值作为待预测对象,其他n-1个特征不含缺失值所在行的数据作为训练集x_train,i中未缺失数据作为y_train,随后对模型进行训练并对缺失值进行回归预测;
(2)利用箱线图对异常数据进行检测并采用随机森林算法填充。首先,用箱线图原理对原始数据进行异常值检测,随后将异常值视为缺失值,最后采用随机森林算法对缺失值填充。箱线图判断为异常值的条件为:
式中,xa表示异常值;Q1、Q3分别表示箱线图的上四分位数和下四分位数;IQR表示四分位间距,即IQR=Q1-Q3;
(3)数据归一化处理。原始数据集中各时序数据量纲不同、数值差别较大,若直接用于模型训练,会使模型学习非线性特征的能力变弱,需要对数据进行归一化处理至[0,1]区间。采用最大最小标准化对数据进行归一化,计算公式为:
式中:xi(k)为特征i的第k个样本的原始值,xi,max、xi,min分别为特征i中最小值和最大值,xi′(k)为归一化值。
具体的,所述步骤S2:对原始负荷数据集中特征进行相关性分析。皮尔逊相关系数在欧几里得距离上做了改进,提供了对于变量取值范围不同情况下的处理方法,是一种有效的判断向量相似度的方式。
对于两个序列X和Y的皮尔逊相关性系数计算公式为:
具体的,所述步骤S3:对原始负荷序列进行小波变换。考虑到负荷的波动性较大,利用小波分析将负荷序列变换为不同平滑的子序列,然后按照各自尺度进行研究,小波变换系数计算公式为:
随后采用父小波提取序列低频部分、母小波提取序列高频部分,并选择正交函数作为小波函数,可得到粗糙集{A1,A2,…,AR*}和精确集{D1,D2,…,DR*},两个集合通过下列公式求得:
最终,负荷序列可以变换为:vt=D1+…+DR*+AR*。
具体的,所述步骤S4:改进小波神经网络神经元激活函数与参数更新方式。
(1)神经元激活函数的改进。
将Morlet小波作为小波神经网络(WaveletNeural Network,WNN)隐藏层神经元的激活函数。相比于Mexican hat小波,Morlet小波可以更好地模拟负荷非均匀时间序列的高频分量,相比传统激活函数具有更高的泛化能力。为了提高性能,其中除了隐藏层神经元与输出神经元相连接外,部分输入神经元也直接连接到输出神经元,即WNN的输出由输入和经过隐藏层神经元输出的序列组成。假设xi表示输入序列,y表示目标序列,隐藏层中的激活函数可以表示为:
式中,L为隐藏层神经元个数;ai、bi分别表示尺度因子和时移因子;τai,bi(xj)表示对τ(x)进行尺度时移变换;τ(x)为Morlet小波函数,函数定义为:
最终网络的输出为:
式中,wi为第i个隐藏层神经元与输出神经元之间的权重系数;uj表示第j个输入神经元与输出神经元之间的权重系数。
(2)参数更新方法的改进。
神经网络常采用梯度下降法对网络参数进行更新,考虑在参数更新时梯度下降法会陷入局部最优,因此采用极限学习机(Extreme Learning Machine,ELM)对WNN的参数进行更新。根据公式(12),WNN待更新的参数个数为3L+n,即参数Z={w1,…,wL;a1,…,aL;b1,…,bL;u1,…,un}。利用ELM对WNN参数进行更新,随机选择尺度因子、时移因子、输入神经元和隐藏层神经元之间的权重系数,而输入神经元和输出神经元、隐藏层神经元与输出神经元之间的权重系数通过简单的矩阵计算和变换得到。假设WNN有n个输入、m个输出,输入-输出对可以表示为N表示网络输入-输出对的个数,其中xi=[xi1,xi2,…,xin],ti=[ti1,ti2,…,tim](i=1,2,…,N)。则网络方程为:
式中,wi=[wi1,wi2,…,wim]T表示第i个隐藏层神经元与输出神经元之间的权重参数;ui=[ui1,ui2,…,uim]T为第i个神经元与输出神经元之间的权重参数;Fi(xj)为激活函数,表示第j个输入神经元经过第i个隐藏层神经元后的输出,其中ai、bi通过ELM随机取值。
将公式(13)写成矩阵形式:
FW+UX=T (14)
式中,各个矩阵具体形式为:
对公式(14)进行矩阵变换,可以进一步化简为:
Hβ=T (20)
式中,H和β形式为:
公式(20)中,β为待学习更新的参数变量,两边左乘H的逆矩阵即可得到参数矩阵的更新公式:
β=H-1T (22)
传统梯度下降法更新参数需要多次迭代计算,计算成本较高,而矩阵运算相对简单,在计算效率方面,利用ELM进行网络参数更新具有显著的优势。
具体的,所述步骤S5具体为:实现短期非居民负荷区间预测,建立短期负荷预测系统。
(1)标签值由预测输出值和预测误差值组成,即:
ti=R(xi)+E(xi) (23)
最终的概率计算公式为:
(2)随后采用Bootstrapping对预测系统的不确定性方差进行分析计算,主要利用有限的样本数据经多次重复抽样,重新建立起足以代表系统样本分布的新样本,与一般参数估计的方法相比更简单、可靠性更高。具体步骤为:
5)重复步骤2)到步骤4),一共重复数据B次,每次网络均会更新参数并对负荷进行预测,随后计算出WNN的平均输出值:
最后可以求出系统不确定性的方差:
(3)区间预测效果评估
用区间覆盖率(Prediction Interval Coverage Probability,PICP)对区间预测模型的可靠性进行评价,计算公式为:
(4)短期负荷预测系统建立。基于上述理论分析,搭建负荷预测系统软硬件平台。主要结构包括:数据采集层,数据挖掘层,集成层、系统应用层,用户层。
1)数据采集层主要负责整合系统访问的所有电力负荷数据,包括非居民用电数据、当地气象数据、环境数据等,将数据统一存放到数据库中,软件系统通过网络经过数据连接层访问数据库;
2)数据挖掘层以数据挖掘作为核心技术对所有的负荷数据相关特征进行分析和深度挖掘,并构建预测模型从而为接下来的预测提供数据支持;
3)集成层主要将硬件、软件系统进行结合,实现软硬件一体化;
4)系统应用层主要负责利用预测模型对负荷进行预测,为用户与负责人提供更加直观的表达。
5)用户层主要分为系统负责人员与客户两大类,他们是该系统的主要参与者与应用者。
本发明的有益效果:本发明针对为了克服不确定性负荷变化带来的点预测稳定性、可靠性低的缺点,提出一种基于改进神经网络的短期非居民负荷区间预测方法及系统,提供更加可靠的预测方法,进一步建立负荷预测系统,提升整体的一体化性能。相比于传统点预测方法,区间预测可提供更多隐藏的价值信息,电网调度中心利用预测系统对非居民负荷进行实时预测及监控,可以合理安排调度计划,避免供电不足造成工业生产部门、银行、医院、商场等大型用电负荷对象不必要的损失,具有较高的经济性与可靠性。
附图说明
图1为本发明的预测实现流程图;
图2为本发明一改进三层结构的WNN网络结构;
图3为本发明的负荷预测系统简图;
图4为本发明的未对异常值处理前数据归一化箱线图;
图5为本发明的对异常值处理后数据归一化箱线图;
图6为本发明的数据集特征皮尔逊相关性热力图;
图7为本发明的所提方法在置信水平为95%下的区间预测结果;
图8为本发明的所提方法在置信水平为90%下的区间预测结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围,以下结合实施例具体说明。
本发明包括如下步骤:
根据流程图1,具体的,所述步骤S1中,获取负荷数据后,对数据集进行缺失值和异常值检测、填充,并对数据进行归一化处理。该部分具体包括:
(1)采用随机森林算法对原始数据集进行缺失值填充。对于一个m行n列的数据集(n表示特征个数,m表示特征序列长度),其中特征i含缺失值,将缺失值所在行其他特征数据作为预测输入数据,缺失值作为待预测对象,其他n-1个特征不含缺失值所在行的数据作为训练集x_train,i中未缺失数据作为y_train,随后对模型进行训练并对缺失值进行回归预测;
(2)利用箱线图对异常数据进行检测并采用随机森林算法填充。首先,用箱线图原理对原始数据进行异常值检测,随后将异常值视为缺失值,最后采用随机森林算法对缺失值填充。箱线图判断为异常值的条件为:
式中,xa表示异常值;Q1、Q3分别表示箱线图的上四分位数和下四分位数;IQR表示四分位间距,即IQR=Q1-Q3;
(3)数据归一化处理。原始数据集中各时序数据量纲不同、数值差别较大,若直接用于模型训练,会使模型学习非线性特征的能力变弱,需要对数据进行归一化处理至[0,1]区间。采用最大最标准化进行归一化,计算公式为:
式中:xi(k)为特征i的第k个样本的原始值,xi,max、xi,min分别为特征i中最小值和最大值,xi′(k)为归一化值。
根据流程图1,具体的,所述步骤S2:对原始负荷数据集中特征进行相关性分析。皮尔逊相关系数在欧几里得距离上做了改进,提供了对于变量取值范围不同情况下的处理方法,是一种有效的判断向量相似度的方式。
对于两个序列X和Y的皮尔逊相关性系数计算公式为:
式中:n为序列长度,xi和yi分别为序列X和Y的第i个变量,x和y分别为序列X和Y的平均值。P的取值范围为[-1,1],P越趋近于0,两个向量的相关性越低,越趋近于-1则成负相关,趋近于1成正相关。当|P|∈[0.8,1.0],两个向量呈极度相关;当|P|∈[0.6,0.8],两个向量呈强相关性;当|P|∈[0.4,0.6],两个向量呈中等相关;当|P|∈[0.2,0.4],两个向量呈弱相关性;当|P|∈[0,0.2],两个向量呈极弱或不相关。
根据流程图1,具体的,所述步骤S3:对原始负荷序列进行小波变换。考虑到负荷的波动性较大,利用小波分析将负荷序列划分为不同平滑的子序列,然后按照各自尺度进行研究,小波变换系数计算公式为:
采用父小波提取序列低频部分、母小波提取序列高频部分,并选择正交函数作为小波函数,随后可得到粗糙集{A1,A2,…,AR*}和精确集{D1,D2,…,DR*},两个集合通过下列公式求得:
最终,负荷序列可以变换为:vt=D1+…+DR*+AR*。
根据图2神经网络结构,具体的,所述步骤S4:改进小波神经网络神经元激活函数与参数更新方式。
(1)神经元激活函数的改进。
WNN常采用Mexican hat小波作为激活函数,相比于Mexican hat小波,Morlet小波可以更好地模拟负荷非均匀时间序列的高频分量,且相比传统激活函数具有更高的泛化能力,因此将Morlet小波作为小波神经网络隐藏层神经元的激活函数。为了提高性能,其中除了隐藏层神经元与输出神经元相连接外,部分输入神经元也直接连接到输出神经元,即WNN的输出由输入和经过隐藏层神经元输出的序列组成。附图1给出了一个三层WNN结构,其中xi表示输入序列,y表示目标序列,隐藏层中的激活函数可以表示为:
最终网络的输出为:
式中,wi为第i个隐藏层神经元与输出神经元之间的权重系数;uj表示第j个输入神经元与输出神经元之间的权重系数。
(2)参数更新方法的改进。
神经网络常采用梯度下降法对网络参数进行更新,考虑在参数更新时梯度下降法会陷入局部最优,因此采用极限学习机(Extreme Learning Machine,ELM)对WNN的参数进行更新。根据公式(12),WNN待更新的参数个数为3L+n,即参数Z={w1,…,wL;a1,…,aL;b1,…,bL;u1,…,un}。利用ELM对WNN参数进行更新,随机选择尺度因子、时移因子、输入神经元和隐藏层神经元之间的权重系数,而输入神经元和输出神经元、隐藏层神经元与输出神经元之间的权重系数通过简单的矩阵计算和变换得到。假设WNN有n个输入、m个输出,输入-输出对可以表示为N表示网络输入-输出对的个数,其中xi=[xi1,xi2,…,xin],ti=[ti1,ti2,…,tim](i=1,2,…,N)。则网络方程为:
式中,wi=[wi1,wi2,…,wim]T表示第i个隐藏层神经元与输出神经元之间的权重参数;ui=[ui1,ui2,…,uim]T为第i个神经元与输出神经元之间的权重参数;Fi(xj)为激活函数,表示第j个输入神经元经过第i个隐藏层神经元后的输出,其中ai、bi通过ELM随机赋值。
将上式写成矩阵形式:
FW+UX=T
式中,各个矩阵具体形式为:
进一步对原公式进行矩阵变换,可以简化为:
Hβ=T
式中,H和β形式为:
其中,β为待学习更新的参数变量,两边左乘H的逆矩阵即可得到参数矩阵的更新公式:
β=H-1T
传统梯度下降法更新参数需要多次迭代计算,计算成本较高,而矩阵运算相对简单,在计算效率方面,利用ELM进行网络参数更新具有显著的优势。
根据图1、3,具体的,所述步骤S5具体为:实现短期非居民负荷区间预测,建立短期负荷预测系统。
(1)标签值由回归预测模型的输出值和预测误差值组成,即:
ti=R(xi)+E(xi)
最终的概率计算公式为:
(2)随后采用Bootstrapping对预测系统的不确定性方差进行分析计算,主要利用有限的样本数据经多次重复抽样,重新建立起足以代表系统样本分布的新样本,与一般参数估计的方法相比更简单、可靠性更高。具体步骤为:
5)重复步骤2)到步骤4),一共重复数据B次,每次网络均会更新参数并对负荷进行预测,随后计算出WNN的平均输出值:
最后可以求出系统不确定性的方差:
(3)区间预测效果评估
用区间覆盖率(Prediction Interval Coverage Probability,PICP)对区间预测模型的可靠性进行评价,计算公式为:
(4)短期负荷预测系统建立。基于上述理论分析,搭建负荷预测系统软硬件平台。主要结构包括:数据采集层,数据挖掘层,集成层、系统应用层,用户层,附图3给出了结构简图。
1)数据采集层主要负责整合系统访问的所有电力负荷数据,包括非居民用电数据、当地气象数据、环境数据等,将数据统一存放到数据库中,软件系统通过网络经过数据连接层访问数据库,进一步可基于python编程对数据进行预处理等操作。
2)数据挖掘层以数据挖掘作为核心技术对所有的负荷数据相关特征进行分析和深度挖掘,该层基于python语言、pytorch深度学习框架,可对特征进行相关性分析并筛选、进一步提取和构造新的特征,为构建预测模型提供数据支撑;
3)集成层主要将数据采集设备、服务器、显示器等硬件设备、pycharm等软件系统进行结合,实现软硬件一体化;
4)系统应用层主要通过python语言、pytorch框架、pycharm编译软件等搭建负荷预测模型,并负责利用模型对非居民负荷进行短期预测,为用户与负责人提供更加直观的表达。
5)用户层主要分为系统负责人员与客户两大类,他们是该系统的主要参与者与应用者,该部分根据相关人员需求,在上位机上编程对算法进行改进,可进一步提高负荷预测的可靠性与精确性。
以下对本发明的有效性进行验证:
实验数据来源于我国某地区2018—2019年实际总负荷及相应的天气数据来进行算法验证,数据时间间隔为1h,总共17520个数据点,数据特征包括负荷(Load)、最高温度(Tmax)、最低温度(Tmin)、平均温度(Tmean)、相对湿度(Hmean)、降雨量(Rain)这6个特征。将全年的数据集按照9:1划分为训练集和验证集,即训练集含15768个数据,验证集含有1752个数据点。
通过对原始数据集进行缺失值、异常值检测,得到不良数据个数如表1所示,采用随机森林算法对上述缺失值进行填充,随后将异常值视为缺失值,利用随机随机森林算法进行填充,修正前后归一化箱线图如附图4、附图5所示。
表1不良数据个数
按照预测流程图,对上述特征进行特征相关性分析,相关性计算结果如附图6所示,其中Tmax、Tmin、Tmean与Load的相关性分别为0.43、0.46、0.46,属于中等相关,而Hmean与Load的相关性只有0.08,属于极弱相关或不相关,因此选取Tmax、Tmin、Tmean作为输入数据进行预测模型训练。
按照预测流程图,经过负荷序列小波变换后对WNN网络进行参数更新,随后进行负荷区间预测。为了验证所提方法的性能,设置两个对照实验进行对比分析。
(1)将Bootstrapping+WNN、小波变换+Bootstrapping+WNN、小波变换+Bootstrapping+遗传算法更新参数+WNN三种对比方法与所提方法进行比较,验证其有效性。所提方法在置信水平为95%、90%时对未来两天负荷变化情况的区间预测结果如附图7、8所示,经过计算,三个对比方法分别在90%置信水平和95%置信水平下的PICP值如表2所示。
表2对比方法及评价指标值
从表2可以看出,两种置信水平下,对比方法1的PICP值均比对比方法2的小,说明小波变换对负荷序列进行处理后用于网络训练可提升其区间预测水平,而所提方法在置信水平90%和95%下的PICP值均大于其他三种对比方法,说明采用ELM更新网络参数比随机梯度下降法以及智能算法更新参数后,网络的区间预测效果更好,同时也说明了所提方法的有效性。
(2)为了进一步对比本发明方法的优势,将所提方法与反向传播神经网络(BP)、径向基网络(RBF)进行对比分析,三种对比方法均采用小波变换对负荷序列进行处理、均采用ELM对网络参数进行更新、均采用Bootstrapping方法更新两类数据集,两种置信水平下各方法计算的PICP值如表3所示。
表3对比方法及评价指标值
从表3可以看出,在两个置信水平下,WNN计算出的PICP值更大,具体的,在90%的置信水平下,相比于BP和RBF,WNN计算出的PICP值分别高2.98%和2.8%,在95%的置信水平下,WNN计算出的PICP值分别高1.79%和1.01%,说明相比于BP和RBF,WNN在区间预测方面具有更好的预测准确度,验证了所提方法具有较高的区间预测性能。
通过上述两组实验分析,结果表明:
1)对负荷序列进行小波变换后用于网络训练能够提升区间预测准确度;
2)相比于梯度下降法与智能算法对网络参数进行更新,采用ELM网络对WNN网络参数进行更新可进一步提高区间预测准确度;
3)WNN网络具有比传统网络更高的区间预测准确度。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的得同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (7)
1.一种基于改进神经网络的短期非居民负荷预测方法及系统,其特征在于,包括如下步骤:
S1:对原始数据集进行缺失值和异常值检测、填充,并对数据进行归一化处理;
S2:对原始负荷数据集中特征进行相关性分析;
S3:对原始负荷序列进行小波变换;
S4:改进小波神经网络的神经元激活函数与参数更新方式;
S5:实现短期非居民负荷区间预测,建立短期负荷预测系统。
2.根据权利要求1所述的一种基于改进神经网络的短期非居民负荷预测方法及系统,其特征在于,步骤S1、S2中,考虑到数据收集过程中出现不良操作或者设备异常,使得原始数据中存在缺失值和异常值,需要对原始数据集进行缺失值和异常值检测、填充,并对数据进行归一化处理,随后对原始负荷数据集中特征进行相关性分析,具体实施步骤为:
(1)采用随机森林算法对原始数据集进行缺失值填充;对于一个m行n列的数据集(n表示特征个数,m表示特征序列长度),其中特征i含缺失值,将缺失值所在行其他特征数据作为预测输入数据,缺失值作为待预测对象,其他n-1个特征不含缺失值所在行的数据作为训练集x_train,i中未缺失数据作为y_train,随后对模型进行训练并对缺失值进行回归预测;
(2)利用箱线图对异常数据进行检测并采用随机森林算法填充;首先,用箱线图原理对原始数据进行异常值检测,随后将异常值视为缺失值,最后采用随机森林算法对缺失值填充;箱线图判断为异常值的条件为:
式中,xa表示异常值;Q1、Q3分别表示箱线图的上四分位数和下四分位数;IQR表示四分位间距,即IQR=Q1-Q3;
(3)数据归一化处理;原始数据集中各时序数据量纲不同、数值差别较大,若直接用于模型训练,会使模型学习非线性特征的能力变弱,需要对数据进行归一化处理至[0,1]区间;采用最大最小标准化对数据进行归一化,计算公式为:
式中:xi(k)为特征i的第k个样本的原始值,xi,max、xi,min分别为特征i中最小值和最大值,xi′(k)为归一化值;
(4)对原始负荷数据集中特征进行相关性分析;皮尔逊相关系数在欧几里得距离上做了改进,提供了对于变量取值范围不同情况下的处理方法,是一种有效的判断向量相似度的方式;
对于两个序列X和Y的皮尔逊相关性系数计算公式为:
3.根据权利要求1所述的一种基于改进神经网络的短期非居民负荷预测方法及系统,其特征在于,所述步骤S3中,对原始负荷序列进行小波变换;考虑到负荷的波动性较大,利用小波分析将负荷序列变换为不同平滑的子序列,然后按照各自尺度进行研究,小波变换系数计算公式为:
随后采用父小波提取序列低频部分、母小波提取序列高频部分,并选择正交函数作为小波函数,可得到粗糙集{A1,A2,…,AR*}和精确集{D1,D2,…,DR*},两个集合通过下列公式求得:
最终,负荷序列可以变换为:vt=D1+…+DR*+AR*。
4.根据权利要求1所述的一种基于改进神经网络的短期非居民负荷预测方法及系统,其特征在于,所述步骤S4中,对神经元激活函数进行改进;将Morlet小波作为小波神经网络(Wavelet Neural Network,WNN)隐藏层神经元的激活函数;相比于Mexican hat小波,Morlet小波可以更好地模拟负荷非均匀时间序列的高频分量,相比传统激活函数具有更高的泛化能力;为了提高性能,其中除了隐藏层神经元与输出神经元相连接外,部分输入神经元也直接连接到输出神经元,即WNN的输出由输入和经过隐藏层神经元输出的序列组成;假设xi表示输入序列,y表示输出序列,隐藏层中的激活函数可以表示为:
最终网络的输出为:
式中,wi为第i个隐藏层神经元与输出神经元之间的权重系数;uj表示第j个输入神经元与输出神经元之间的权重系数。
5.根据权利要求1和4所述的一种基于改进神经网络的短期非居民负荷预测方法及系统,其特征在于,所述步骤S4中,进一步对神经网络参数更新方式进行改进;神经网络常采用梯度下降法对网络参数进行更新,考虑在参数更新时梯度下降法会陷入局部最优,因此采用极限学习机(Extreme Learning Machine,ELM)对WNN的参数进行更新;根据公式(12),WNN待更新的参数个数为3L+n,即参数Z={w1,…,wL;a1,…,aL;b1,…,bL;u1,…,un};利用ELM对WNN参数进行更新,随机选择尺度因子、时移因子、输入神经元和隐藏层神经元之间的权重系数,而输入神经元和输出神经元、隐藏层神经元与输出神经元之间的权重系数通过简单的矩阵计算和变换得到;假设WNN有n个输入、m个输出,输入-输出对可以表示为N表示网络输入-输出对的个数,其中xi=[xi1,xi2,…,xin],ti=[ti1,ti2,…,tim](i=1,2,…,N);则网络方程为:
式中,wi=[wi1,wi2,…,wim]T表示第i个隐藏层神经元与输出神经元之间的权重参数;ui=[ui1,ui2,…,uim]T为第i个神经元与输出神经元之间的权重参数;Fi(xj)为激活函数,表示第j个输入神经元经过第i个隐藏层神经元后的输出,其中ai、bi通过ELM随机取值;
将公式(13)写成矩阵形式:
FW+UX=T(14)
式中,各个矩阵具体形式为:
对公式(14)进行矩阵变换,可以进一步化简为:
Hβ=T(20)
式中,H和β形式为:
公式(20)中,β为待学习更新的参数变量,两边左乘H的逆矩阵即可得到参数矩阵的更新公式:
β=H-1T (22)
传统梯度下降法更新参数需要多次迭代计算,计算成本较高,而矩阵运算相对简单,在计算效率方面,利用ELM进行网络参数更新具有显著的优势。
6.根据权利要求1所述的一种基于改进神经网络的短期非居民负荷预测方法及系统,其特征在于,所述步骤S5具体为:实现短期非居民负荷区间预测;包括一下几个方面:
(1)标签值预测输出值和预测误差值组成,即:
ti=R(xi)+E(xi) (23)
最终的概率计算公式为:
(2)随后采用Bootstrapping对预测系统的不确定性方差进行分析计算,主要利用有限的样本数据经多次重复抽样,重新建立起足以代表系统样本分布的新样本,与一般参数估计的方法相比更简单、可靠性更高;具体步骤为:
5)重复步骤2)到步骤4),一共重复数据B次,每次网络均会更新参数并对负荷进行预测,随后计算出WNN的平均输出值:
最后可以求出系统不确定性的方差:
(3)区间预测效果评估
用区间覆盖率(Prediction Interval Coverage Probability,PICP)对区间预测模型的可靠性进行评价,计算公式为:
7.根据权利要求1到6所述的一种基于改进神经网络的短期非居民负荷预测方法及系统,其特征在于,所述步骤S5具体为:建立短期负荷预测系统平台;
基于理论分析,建立负荷预测系统软硬件平台;主要结构包括:数据采集层,数据挖掘层,集成层、系统应用层,用户层;
1)数据采集层主要负责整合系统访问的所有电力负荷数据,包括非居民用电数据、当地气象数据、环境数据等,将数据统一存放到数据库中,软件系统通过网络经过数据连接层访问数据库;
2)数据挖掘层以数据挖掘作为核心技术对所有的负荷数据相关特征进行分析和深度挖掘,并构建预测模型从而为接下来的预测提供数据支持;
3)集成层主要将硬件、软件系统进行结合,实现软硬件一体化;
4)系统应用层主要负责利用预测模型对负荷进行预测,为用户与负责人提供更加直观的表达;
5)用户层主要分为系统负责人员与客户两大类,他们是该系统的主要参与者与应用者。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310178542.7A CN116169670A (zh) | 2023-02-27 | 2023-02-27 | 一种基于改进神经网络的短期非居民负荷预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310178542.7A CN116169670A (zh) | 2023-02-27 | 2023-02-27 | 一种基于改进神经网络的短期非居民负荷预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116169670A true CN116169670A (zh) | 2023-05-26 |
Family
ID=86421719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310178542.7A Withdrawn CN116169670A (zh) | 2023-02-27 | 2023-02-27 | 一种基于改进神经网络的短期非居民负荷预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116169670A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349798A (zh) * | 2023-12-05 | 2024-01-05 | 西南石油大学 | 一种基于非均衡回归的机械钻速预测方法及系统 |
CN117435870A (zh) * | 2023-12-21 | 2024-01-23 | 国网天津市电力公司营销服务中心 | 一种负荷数据实时填充方法、系统、设备和介质 |
-
2023
- 2023-02-27 CN CN202310178542.7A patent/CN116169670A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349798A (zh) * | 2023-12-05 | 2024-01-05 | 西南石油大学 | 一种基于非均衡回归的机械钻速预测方法及系统 |
CN117349798B (zh) * | 2023-12-05 | 2024-02-23 | 西南石油大学 | 一种基于非均衡回归的机械钻速预测方法及系统 |
CN117435870A (zh) * | 2023-12-21 | 2024-01-23 | 国网天津市电力公司营销服务中心 | 一种负荷数据实时填充方法、系统、设备和介质 |
CN117435870B (zh) * | 2023-12-21 | 2024-03-29 | 国网天津市电力公司营销服务中心 | 一种负荷数据实时填充方法、系统、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113962364B (zh) | 一种基于深度学习的多因素用电负荷预测方法 | |
Tian et al. | Multi-step short-term wind speed prediction based on integrated multi-model fusion | |
Dong et al. | Short-term load forecasting in smart grid: A combined CNN and K-means clustering approach | |
CN109242223B (zh) | 城市公共建筑火灾风险的量子支持向量机评估与预测方法 | |
CN116169670A (zh) | 一种基于改进神经网络的短期非居民负荷预测方法及系统 | |
CN109583635B (zh) | 一种面向运行可靠性的短期负荷预测建模方法 | |
CN111027775A (zh) | 基于长短期记忆网络的梯级水电站发电量预测方法 | |
Ye et al. | Combined approach for short-term wind power forecasting based on wave division and Seq2Seq model using deep learning | |
CN112100911B (zh) | 一种基于深度bilstm的太阳辐射预测方法 | |
CN112163689A (zh) | 基于深度Attention-LSTM的短期负荷分位点概率预测方法 | |
CN113158572A (zh) | 一种短期负荷的预测方法及装置 | |
CN112613542B (zh) | 一种基于双向lstm的企业除污设备负荷辨识方法 | |
CN111222689A (zh) | 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置 | |
CN115358437A (zh) | 基于卷积神经网络的供电负荷预测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN117114184A (zh) | 一种城市碳排放影响因素特征提取与中长期预测方法及装置 | |
CN113326966A (zh) | 基于ceemd-lstm的综合能源系统多元负荷预测方法 | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
CN115995810A (zh) | 一种考虑气象波动自适应匹配的风电功率预测方法及系统 | |
CN115409369A (zh) | 基于机理和数据混合驱动的综合能源系统可靠性评估方法 | |
CN114862032A (zh) | 一种基于XGBoost-LSTM的电网负荷预测方法及装置 | |
Qu et al. | Research on short‐term output power forecast model of wind farm based on neural network combination algorithm | |
Zhai et al. | Combining PSO-SVR and Random Forest Based Feature Selection for Day-ahead Peak Load Forecasting. | |
CN111950696A (zh) | 一种基于降维和改进神经网络的短期电力负荷预测方法 | |
Zhang | Short‐Term Power Load Forecasting Based on SAPSO‐CNN‐LSTM Model considering Autocorrelated Errors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230526 |