CN116937559A - 基于循环神经网络和张量分解的电力系统负荷预测系统和方法 - Google Patents
基于循环神经网络和张量分解的电力系统负荷预测系统和方法 Download PDFInfo
- Publication number
- CN116937559A CN116937559A CN202310903077.9A CN202310903077A CN116937559A CN 116937559 A CN116937559 A CN 116937559A CN 202310903077 A CN202310903077 A CN 202310903077A CN 116937559 A CN116937559 A CN 116937559A
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- algorithm
- power system
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 29
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 22
- 125000004122 cyclic group Chemical group 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 title claims description 72
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims abstract description 48
- 238000004140 cleaning Methods 0.000 claims abstract description 7
- 230000033228 biological regulation Effects 0.000 claims abstract description 4
- 230000005611 electricity Effects 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 31
- 238000010606 normalization Methods 0.000 claims description 20
- 238000005457 optimization Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 11
- 230000015654 memory Effects 0.000 claims description 10
- 238000003064 k means clustering Methods 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 4
- 230000008014 freezing Effects 0.000 claims description 4
- 238000007710 freezing Methods 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 230000000717 retained effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 239000006185 dispersion Substances 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 230000006403 short-term memory Effects 0.000 claims description 2
- 239000000523 sample Substances 0.000 description 16
- 210000004027 cell Anatomy 0.000 description 11
- 230000008901 benefit Effects 0.000 description 9
- 238000011161 development Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 210000002370 ICC Anatomy 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010988 intraclass correlation coefficient Methods 0.000 description 4
- 229940050561 matrix product Drugs 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013102 re-test Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 101100458287 Saguinus oedipus MSPE gene Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Power Engineering (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于循环神经网络和张量分解的电力系统负荷预测系统,适用于电网负荷的短期预测系统。通过数据清洗得到删除异常值之后的数据集。通过选择合适的基本时间窗口,将记录的时间序列数据划分为若干个时间片,并用多个时间片拼接为二维张量。采用奇异值阈值算法(SVT)对缺失的数据进行插补,其中利用交替迭代的方式求得了插补矩阵的最优解,该矩阵作为补全后的样本数据。然后,使用动态时序规整(DTW)计算不同用电序列间的距离矩阵,将相似性高的时间序列作为一类数据,针对每一类数据,通过有监督的改进LSTM算法进行负荷预测。本发明可以更好地应对电力供需的不平衡问题,有效辅助新型电力系统安全经济运行,提高电力系统的稳定性和可靠性。
Description
技术领域
本发明涉及电力系统负荷预测的技术领域,更具体地,涉及一种基于循环神经网络和张量分解的电力系统负荷预测。
背景技术
当前,全球能源需求不断增加,导致温室气体排放量显著上升,加剧了全球气候变暖问题,环境保护和可持续发展的重要性日益受到国际社会的广泛关注。为解决这一挑战,推动经济社会的可持续发展,各国纷纷将绿色低碳能源转型作为重要发展战略目标。
在此背景下,随着电能替代和电气化水平的不断提高,电力负荷作为新型电力系统的关键组成部分正朝着多元化方向发展。与此同时,电力市场改革的深入推进引入了需求响应、共享经济、负荷聚合商、虚拟电厂等新技术和新角色,使得电力负荷呈现出更加复杂多变的新特性和新形态。因此,电力系统负荷预测作为基础支撑工作对于未来新型电力系统的规划、运行、控制和调度具有至关重要的意义。
近年来,随着智能量测设备的广泛部署和通信水平的迅速提升,电网公司的用电信息采集系统、SG186营销系统以及各类信息平台积累了海量的多源异构数据,包括电力负荷数据、档案信息数据、气象数据、地理信息数据等。这为人工智能、大数据分析等前沿技术在电力系统负荷预测领域的应用提供了重要的数据基础。同时,人工智能和大数据分析等数字化技术快速发展,在自然语言处理、计算机视觉等领域取得了丰富成果,并在互联网、交通、金融、医疗等行业得到了显著应用效果。这为电力系统负荷预测研究提供了新的手段和关键技术支持。
然而,随着电力系统的快速发展和不断演变,特别是新型电力系统的建设,大量分布式新能源、电动汽车等新元素将被引入,电力系统负荷呈现出更加灵活多变的特点。此外,随着需求侧管理的普及,涌现出产消者、负荷聚合商等新角色,用户与电网之间的互动变得更加积极主动。因此,在面对多种复杂的负荷影响因素时,传统的负荷预测方法难以准确建模新型电力系统的负荷模式。
为了应对这一挑战,我们的专利将基于循环神经网络和张量分解提出一种创新的负荷预测方法,以适应新型电力系统背景下的复杂负荷情况。这种方法将综合考虑多个因素,包括分布式新能源的波动性、电动汽车充电需求的变化以及产消者和负荷聚合商的行为特征等。通过使用循环神经网络和张量分解的结合,我们可以更好地捕捉负荷的时序特征和空间关系,提高负荷预测的准确性和鲁棒性。
我们的负荷预测方法将为新型电力系统的规划、运行和控制提供重要支持。它能够帮助电力系统管理者更好地预测负荷需求,合理安排发电资源和优化能源调度,从而实现电力系统的高效运行和可持续发展。同时,通过准确预测负荷情况,我们可以更好地应对电力供需的不平衡问题,提高电力系统的稳定性和可靠性。总之,我们的专利将为新型电力系统负荷预测领域的发展提供一种创新且实用的解决方案。
发明内容
为了克服目前技术的缺陷与不足,本发明公开了一种基于循环神经网络和张量分解的电力系统负荷预测,通过获取电力系统用电数据,在完成了数据清洗、数据处理之后,再建立模型样本数据,并通过动态时序规整(DTW)计算不同用电序列间的距离矩阵,采用无监督学习改进的K-Means算法对客户用电数据进行聚类,通过无监督聚类完成电力系统用户分类与异常用电行为识别。本发明能有效完成电力系统日用电负荷短期预测,提高了电力系统用电负荷预测的准确性。
为了解决上述问题,本发明所采用的技术方案如下:
一种基于循环神经网络和张量分解的电力系统负荷预测系统,包括时间序列数据获取模块、数据处理模块、数据插补模块、数据预测模块、输出模块。
所述时间序列数据获取模块,通过国家电网的电量表和计量表等几个表格的关联,获取了电力系统用户的各自1000天的时间序列数据。其中包括综合倍率和日冻结示数两个字段的数据,将两个数据相乘最终得到了日用电量数据。并将用户日用电数据信息输入数据处理模块。
所述数据处理模块,对获取的日用电量数据中的异常值进行处理,用空字段代替异常值。对单一维度的时间序列,按时间窗口大小进行划分,然后再将数据合并,构成含缺失值的二维张量数据样本,并将该样本输入数据插补模块。
所述数据插补模块,对所获取的低秩的数据矩阵,即含缺失值的电力系统日用电量历史数据进行缺失值插补,构建不含缺失值的完整的数据集,该数据集作为训练样本输入数据预测模块。
所述数据预测模块,包括基于长短期记忆人工神经网络(LSTM)的预测和DTW动态计算用电序列数据距离矩阵,先对输入的电力系统客户用电量历史数据进行分类,基于不同的类别分别采用改进LSTM模型进行日用电量预测。
一种基于循环神经网络和张量分解的电力系统负荷预测方法,所述方法包括以下步骤:
S1,获取国家电网电力检测设备所测的电力系统用电数据,包括用户档案数据、日冻结电能示值、用户实时功率、用户日电量等时间序列数据;
S2,对获取的日用电量数据进行清洗,剔除含缺失值的样本,筛选均值,方差较小的样本,采用3σ原则处理离群数据样本,并进行数据归一化、非线性化。对单一维度的时间序列,按时间顺序进行拼接,得到含缺失值的二维张量。
S3,利用奇异值阈值算法(SVT)对表示每个用户日用电量数据的二维张量进行缺失数据的插补,从而获得完整的二维张量数据。
S4,利用DTW动态时序规整计算不同用电序列数据间距离矩阵,基于该矩阵使用K-Means进行聚类,对每一个类别的数据通过改进的长短期记忆人工神经网络LSTM对电力系统电负荷进行预测。
进一步,S2中数据处理和清洗工作包括剔除含缺失值的样本,筛选均值,方差较小的样本,处理离群数据样本,并进行数据归一化。
S2.1,采用3σ原则进行离群值的处理:首先数据需要服从正态分布。在3σ原则下,样本数据值的大小如果不在μ±3σ范围内,那么可以将其视为异常值。其公式如下,其中X为服从正态分布的观测值,μ为分布的平均值,而σ为标准差:
P(μ-3σ≤X≤μ+3σ)≈0.99730020393674
S2.2,为将原始数据进行线性变换,使结果映射到[0,1]的范围,实现对原始数据的等比缩放,采用min-max归一化。其公式如下:
进一步,S3中模型采用了奇异值阈值算法(SVT)对表示每个用户日用电量数据的二维张量进行缺失数据的插补。
S3.1,假设原始数据矩阵是低秩的,但是矩阵中含有很多未知的元素。从一个含有缺失元素的矩阵中恢复出一个元素完整的低秩阵,这就是是低秩矩阵填充问题。
S3.2,奇异值阈值算法(SVT)流程如下:
S3.2.1,求解正则化的最优化问题:
s.t.Ω(X)=PΩ(M)
其中Ω为观测样本下标的集合,X为优化变量,M为真实的未知矩阵,投影算子PΩ:
S3.2.2,构造最优化问题的拉格朗日函数:
强对偶成立,且拉格朗日函数的鞍点是原函数与对偶问题的最优解,即
其迭代解为:
进一步,S4中模型采用了基于DTW动态时序规整以及K-Means聚类和改进门控机制的LSTM算法。
S4.1,LSTM算法在针对不同类别的数据进行预测时,适用性不强且速度慢,因此我们采用基于相似性度量方式即动态时间规整方法(DTW)来处理时序数据,然后通过K-Means对不同时间序列进行聚类,基于不同类别分别训练改进LSTM模型。
S4.2,动态时间规整算法(Dynamic Time Warping,DTW),是一种衡量两个长度不同的时间序列的相似度的方法。把未知量延长或收缩,直到与参考模板的长度一致,在这一过程中,未知序列会产生歪曲或弯折,以便其特征量与标准模式对应。DTW算法的步骤如下:
S4.2.1,计算两个序列各个点之间的距离矩阵;
S4.2.2,寻找一条路径,它从矩阵左上角延伸至右下角,并且要满足该路径上的元素和是最小的;
矩阵从左上角到右下角的路径长度有以下几点性质:
(1)当前的路径长度=前一步的路径长度+当前元素的大小;
(2)路径上的某个元素(i,j),它的前一个元素只可能为以下三者之一:
a.左边的相邻元素(i,j-1)
b.上面的相邻元素(i-1,j)
c.左上方的相邻元素(i-1,j-1)
假设矩阵为M,从矩阵左上角(1,1)到任一点(i,j)的最短路径长度为Lmin(i,j)。那么可以用递归算法求最短路径长度:
起始条件:
Lmin(1,1)=M(1,1)
递推规则:
Lmin(i,j)=min{Lmin(i,j-1),Lmin(i-1,j),Lmin(i-1,j-1)}+M(i,j)
S4.3,K-means聚类算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值),然后再迭代的进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的迭代次数。
传统的K-Means聚类算法原理简单、收敛速度快、聚类效果较优、算法的可解释性较强,这也是它的长处所在,但其缺点也比较明显,比如对初始聚类中心敏感,选择不同的聚类中心往往会导致不同的聚类结果和不同的准确率,如果随机选取初始聚类中心,可能会让算法变得不稳定,有可能陷入局部最优的情况。
针对上述问题,我们使用二分K-Means算法作为优化,算法步骤如下:
S4.3.1,将所有点作为一个簇;
S4.3.2,将该簇一分为二;
S4.3.3,选择能最大限度降低聚类代价函数(也就是误差平方和SSE)的簇划分为两个簇;
S4.3.4,重复S4.3.3直到簇的数目等于给定的数目k为止。
S4.4,长短期记忆网络(LSTM)被提出用于解决循环神经网络在面对长序列数据容易遭遇梯度弥散使得模型只具备短期记忆的问题,其其核心在于提出了门机制:遗忘门-输入门-输出门以及细胞状态,类似于RNN的链式结构,重复板块具有不同的结构。算法流程如下:
S4.4.1,确定应被丢弃或保留的信息,由“遗忘门”的sigmoid层的输出决定,输出为0代表完全拒绝信息传播,1代表信息完全保持信息量流过;
S4.4.2,使用包含sigmoid层的输入门决定哪些新信息该被加入到细胞状态;肯定了哪些新信息要加入后,须要将新信息转换成可以加入到细胞状态的形式并使用tanh函数产生一个新的候选向量,之后更新细胞状态;
S4.4.3,基于细胞状态保存的内容来肯定输出什么内容,使用sigmoid激活函数肯定哪一个部分的内容须要输出,而后再使用tanh激活函数对细胞状态的内容进行处理,将这两部分相乘就获得了最终的输出。
S4.4.4改进的LSTM
为了解决传统的LSTM串行计算速度过慢的问题,提出了SRU(Simple RecurrentUnits),实现了隐藏层维度并行计算,具有计算少、参数少、训练快、测试快的优点。其结构如下:
ft=σ(Wfxt+vf⊙ct-1+bf)
ct=ft⊙ct-1+(1-ft)⊙(Wxt)
rt=σ(Wrxt+vr⊙ct-1+br)
ht=rt⊙ct+(1-rt)⊙xt
1.为了减轻递归的程度,它的两个门控单元,遗忘门和重置门,不再依赖于上一时刻的隐藏状态ht-1,而是依赖于上一时刻的中间状态ct-1。
2.为了减少计算量,用Hadamard乘积来代替矩阵乘积。
3.正因为ht-1的计算不再依赖于前一时刻的计算,这样就可以实现并行化处理,因此SRU训练速度要比LSTM快。
本发明的有益效果:
1、针对电网数据的多个行业,本发明采用无监督学习分类方法K-Means,对不同用电情况客户群体的时间序列数据进行聚类,根据该类别划分,对于新输入的数据只需选取对应类别的模型即可进行预测,相比于其他电力系统负荷短期预测系统,不存在复杂的数据业务逻辑处理,在系统设计以及实现方式上来讲,这类系统中显得特别的简单实用。
2、电力系统产生大量电力数据,而对于电力系统用电核查所需成本较高,投入人力较多,排查周期较长,无法高频开展,所以用电监测和分析无法做到全时度、全覆盖,而且常常会出现数据缺失和异常的现象。本模型采用奇异值阈值算法(SVT)对剔除了异常值数据的样本进行插补,该方法能正确并高效地处理部分数据缺失、数据误差、损坏等问题,恢复并利用不完整的、带有损毁的数据,适用性更强。
3、本发明使用了长短期记忆网络(LSTM),作为RNN的一个优秀的变种模型,它改善了RNN中存在的长期依赖问题。具体体现为LSTM善于利用历史信息,可以长期记忆重要信息,并且记忆可以随着输入进行动态调整。相对于隐马尔科夫模型(HMM)和时间递归神经网络等序列学习方法,对于间隙长度的相对不敏感性是LSTM的一个优势。作为非线性模型,LSTM可作为复杂的非线性单元用于构造更大型深度神经网络。
4、传统的LSTM模型采用串行计算,在并行处理上存在劣势,这种方式在遇到时间跨度大,网络层数多的情况下,计算量巨大,执行效率低下。本发明采用基于LSTM的加速算法SRU,通过改造门控单元的依赖状态、将Hadamard乘积替换矩阵乘积并用skipconnection结构实现隐藏层维度的并行计算,使得模型训练速度快,获取新数据后,更新模型方便。
附图说明
图1是本方法中整体框架流程示意图;
图2是本方法中具体实施方案流程示意图;
图3是本方法中获取电力系统客户用电数据示意图;
图4是本方法中数据预处理示意图;
图5是本方法中DTW序列数据S-P对应关系图;
图6是本方法中DTW路径规整示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
实施例1:一种基于循环神经网络和张量分解的电力系统负荷预测系统,包括时间序列数据获取模块、数据处理模块、数据插补模块、数据预测模块、输出模块。
所述时间序列数据获取模块,通过国家电网的电量表和计量表等几个表格的关联,获取了电力系统用户的各自1000天的时间序列数据。其中包括综合倍率和日冻结示数两个字段的数据,将两个数据相乘最终得到了日用电量数据。并将用户日用电数据信息输入数据处理模块。
所述数据处理模块,对获取的日用电量数据中的异常值进行处理,用空字段代替异常值。对单一维度的时间序列,按时间窗口大小进行划分,然后再将数据合并,构成含缺失值的二维张量数据样本,并将该样本输入数据插补模块。
所述数据插补模块,对所获取的低秩的数据矩阵,即含缺失值的电力系统日用电量历史数据进行缺失值插补,构建不含缺失值的完整的数据集,该数据集作为训练样本输入数据预测模块。
所述数据预测模块,包括基于长短期记忆人工神经网络(LSTM)的预测和DTW动态计算用电序列数据距离矩阵,先对输入的电力系统客户用电量历史数据进行分类,基于不同的类别分别采用改进LSTM模型进行日用电量预测。
构建电力系统负荷预测模型,需要收集与有关行业用电客户日常用电数据和异常用电数据相关数据信息,主要包括以下两类数据,分别为档案数据、实时运行数据。构建一种基于循环神经网络和张量分解的电力系统负荷预测系统,包括行业用电时间序列数据获取、数据预处理、数据插补、数据预测、预测结果分析;
为了更好的理解本发明的技术方案,下面结合附图对具体的实施方案进行详细地描述。
S1,数据获取。所述时间序列数据获取模块,通过国家电网的电量表和计量表数据之间的关联关系,获取电力系统用户1000天的时间序列数据。其中包括综合倍率和日冻结示数两个字段的数据,将两个数据相乘最终得到了日用电量数据。并将用户日用电数据信息输入数据清洗模块;
S2,数据处理。对获取的日用电量数据进行异常值操作,用空字段代替异常值。对单一维度的时间序列,按时间窗口大小进行划分,然后再将数据合并,构成含缺失值的二维张量数据样本输出数据插补模块;
S3,数据插补。数据插补模块是对所获取的低秩的数据矩阵,即含缺失值的电力系统日用电量历史数据进行缺失值插补,构建不含缺失值的完整的数据集,该数据集作为训练样本输入数据预测模块;
S4,模型优化。模型优化是在传统K-Means、LSTM算法的基础之上,分析其改进后的算法的优缺点,最终确定一种改进的算法进行测试,因此,本方法利用基于相似性度量方式即动态时间规整方法(DTW)来处理时序数据,然后通过K-Means对不同时间序列进行聚类,基于不同类别分别训练改进LSTM模型。
S5,预测准确率研判。预测准确率研判结果分析基于各个用户的日用电负荷预测曲线,对其数值与真实值的差异进行比较,MSPE小于0.15时,预测的准确精度为高精度,该值越小,精度越高,则表示经过模型预测,可以得到更符合真实情况的用户用电特征。
实施例2:本发明所提出的一种基于循环神经网络和张量分解的电力系统负荷预测方法,包括如下步骤:
S1,对获取到的客户用电数据,首先进行数据清洗,包括一致性检验、缺失值处理、无效值处理以及数据归一化;然后对样本添加噪声构建样本数据集,如图4;
1)一致性检验,即检查数据表中各字段与数据源是否存在一一对应关系,检查字段的合法性,检查数据表处理后的结果是否具有唯一性。ICC组内相关系数可用于研究评价一致性,评价信度,测量复测信度(重测信度)等。相对于Kappa系数,ICC组内相关系数的适用范围更广,适用于定量或者定类数据,而且可针对双样本或者多样本进行分析一致性。但ICC的分析相对较为复杂,通常需要从三个方面进行分析并且选择最优的ICC模型,分别是模型选择、计算类型和度量标准。
2)缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。对于电网数据,可能因为计量点的数据收集或者数据保存失败,导致数据缺失问题。关于缺失值处理的方法,包括:删除、插补、不处理缺失值。
3)无效值或者异常值是指那些在数据集中存在的不合理的值,数据集中的异常值可能是由于传感器故障、人工录入错误或异常事件导致。这些异常值在某些场景下会导致结论的错误(如线性回归模型、K均值聚类等)。针对异常值的检测,包括简单统计分析、3σ原则、箱线图等;异常值处理方法包括删除、视为缺失值、平均值修正、盖帽法、分箱法、回归插补、多重插补以及不处理。
4)数据的归一化就是将数据值按照某种数学方法进行处理,将其限制在制定的区间内。通常聚类分类算法中,使用归一化可以避免较大初值的指标相比于较小初值指标其所占权重过大的问题。由于用户用电曲线数据在用电期间随时间序列变化较为稳定,且总体曲线峰值与谷值相差较大,因此本方法中使用Z-score归一化方法对负荷数据进行数据归一化处理。
在负荷数据归一化中,假设负荷数据序列L=(l1,l2,…,lk)。利用负荷数据序列的标准差以及其均值来完成归一化操作。
式中:μ为负荷数据的均值;σ为负荷数据的标准差,lk'分别为k条负荷数据序列归一化之后的结果。
5)为了使分类模型对于模型输入具有更高的抗噪声能力,提高其泛化能力与鲁棒性,在输入模型之前需对数据进行添加噪声处理,即添加干扰曲线样本。
S2,对剔除了异常值数据的样本进行插补;
该方法基于奇异值域值算法(SVT),将低秩补全这个NP-hard问题转换为凸优化,对最优化问题正则化并使用交替迭代方法求解,对剔除了异常值的样本补全,构建不含缺失值的完整的数据集。
构造低秩矩阵优化问题。若数据矩阵具有一些特殊的性质,可以利用这些特殊的性质将使得矩阵补全,形式为优化问题如下:
s.t.PΩ(X)=PΩ(M)
式中;Ω——观测样本下标的集合,X——优化变量,M——为真实的未知矩阵,PΩ——投影算子。
对(1)中式子进行松弛,转换为凸优化问题,如下:
s.t. Xi,j=Mi,j,(i,j)∈Ω
其中||X||*是矩阵M的核范数表示奇异值的和,SVT算法先将最优化问题正则化为:
s.t.Ω2(X)=PΩ(M)
SVT算法使用交替迭代方法求解优化问题:
式中:Dτ(W)——奇异值阈值软阈值操作类似,操作(1)表示对输入矩阵X进行奇异值分解(Singular Value Decomposition,SVD),得到U,S和V,其中U和V是正交矩阵,S是奇异值矩阵;操作(2)表示对奇异值矩阵S中的每个奇异值进行阈值处理,将小于阈值的奇异值置零,保留大于等于阈值的奇异值;操作(3)表示恢复低秩矩阵,由此交替迭代操作(1)-(3)。
S3,对该方法中的模型进行优化,使其具有更优的分类效果和效率;
长短期记忆网络(LSTM)是RNN的一个优秀的变种模型,继承了大部分RNN模型的特性,在序列建模问题上有一定优势,具有长时记忆功能,但其适用性不强且速度慢,本发明利用基于相似性度量方式即动态时间规整方法(DTW)来处理时序数据,然后通过K-Means对不同时间序列进行聚类,基于不同类别分别训练改进LSTM模型。具体步骤如下:
S3.1,通过国家电网的电量表和计量表等几个表格的关联,获取了不同用户的各自1000天的时间序列数据,考虑对问题简化,采用基于相似性度量方式即动态时间规整方法(DTW)来处理时序数据,然后通过K-Means对不同时间序列进行聚类,基于不同类别分别训练改进LSTM模型。
S3.2,利用相似性度量DTW,结合K-Means进行聚类,降低数据的复杂性。
S3.2.1,该方法中的分类模型基于改进的K-Means聚类算法,传统的K-Means聚类算法具有算法原理简单、收敛速度快、聚类效果较优、算法的可解释性较强等优点,但其对初始选取的K比较敏感,对于K选取不合适时,容易进入局部最小值,得不到全局最优解,且由于每一次迭代过程之中都会产生新的聚类中心,因而时间开销较大。针对以上问题,本发明中利用二分K-Means算法对其进行优化,该算法包括如下步骤:
1)把所有数据初始化为一个簇,将这个簇分为两个簇;
2)选择满足条件的可以分解的簇。选择条件需综合考虑簇的元素个数以及聚类代价(误差平方和SSE),误差平方和的公式如下所示,其中w(i)表示权重值,y*表示该簇所有点的平均值:
3)使用K-Means算法将可分裂的簇分为两簇;
4)一直重复(2),(3),直到满足迭代结束条件。
针对电力用户用电数据体量大、分布广的特性,利用改进的二分K-Means自聚类算法建立局部数据模型,对传统聚类算法进行修正,克服了传统K-Means算法对异常数据敏感和初始聚类中心的随机性问题,提高了算法的有效性和高效性,增强了聚类精确度。
5)将预处理后的数据输入优化后的模型中,通过用户用电数据特征对用户进行行业分类与异常检查;
S3.2.2,由于客户用电数据在相同时间序列相同时刻不尽相似,但其整体上具有高度相似性,所以在本方法中,采用动态时间规整(DTW)作为异常识别模型的相似性度量方式,如图5所示为DTW序列数据S-P对应关系图。
时间规整函数W(n)在一定条件限制下描述测试样本与参考样本的对应关系,根据对应关系求解两样本匹配过程距离累计最小的路径。给定两个时间序列数据S=(s1,s2,s3…sm)和P=(p1,p2,p3…pn),数据序列长度为m和n,为了将两个数据进行比较,需要建立m×n的距离矩阵网格,用于存储样本元素间的距离,网格中坐标为(i,j)的元素对应si,pj的距离,其中i≤m,j≤n。之后便根据对应关系在约束条件下寻求累计最小距离路径,路径遍历的坐标对应于两列数据最佳匹配点。该过程用R表示为路径规整,R中的第k个点表示为Rk=(i,j)k,i和j表示序列数据中值的对应下标,R需要满足“三个原则”:
1)边界性:出发点R1=(1,1),终点Pk=(m,n)。两点的顺序无法倒置,即必然从左下角出发右上角结束。
2)连续性:路径中的某个元素为Rk=(i,j)k,则下一个元素必为下列三个元素之一,即当前匹配点只能与自己相邻点匹配,保证序列数据每个点在路径规整过程中被遍历:a)右边的相邻元素(i+1,j);b)上面的相邻元素(i,i+1);c)对角线的相邻元素(i+1,j+1)。
3)单调性:当前路径元素大小=上一步路径元素大小+当前路径元素大小,要求路径规整过程必然随着时间的单调性进行。
动态时间规整方法的距离累计值计算公式如下:
D(i,j)=Dist(i,j)+min{D(i-1,j),D(i,j-1),D(i-1,j-1)}
公式中D(i,j)表示规整路径当前矩阵格点距离累计值,Dist(i,j)代表两时间序列数据下标为i,j的对应数据点之间的距离。例如给定两列序列数据P=[2,4,6,5,8,4,3,1,0,0]以及S=[0,1,4,3,5,7,5,3,2,1]。如图6所示为DTW路径规整图。距离矩阵展示出序列数据S-P的距离,计算可得:
通过DTW对序列数据之间的距离进行规整优化,能有效提高模型分类与异常检查的准确性。
S3.3,针对不同类别分别训练改进LSTM模型,获取到新的数据利用针对性的LSTM去做预测。LSTM模型具体算法流程如下:
S3.3.1,确定应被丢弃或保留的信息,由“遗忘门”的sigmoid层的输出决定,输出为0代表完全拒绝信息传播,1代表信息完全保持信息量流过;
S3.3.2,使用包含sigmoid层的输入门决定哪些新信息该被加入到细胞状态;肯定了哪些新信息要加入后,须要将新信息转换成可以加入到细胞状态的形式并使用tanh函数产生一个新的候选向量,之后更新细胞状态;
S3.3.3,基于细胞状态保存的内容来肯定输出什么内容,使用sigmoid激活函数肯定哪一个部分的内容须要输出,而后再使用tanh激活函数对细胞状态的内容进行处理,将这两部分相乘就获得了最终的输出。
S3.4,对于LSTM本发明使用SRU门结构,加快训练速度。
SRU算法主要是将运算操作最多的去除时间上的依赖关系,并进行并行化处理,模型分为两部分:轻递归单元和高速公路网络单元。
1)轻递归单元。主要表现在两处:①为了减轻递归的程度,它的两个门控单元,遗忘门和重置门,不再依赖于上一时刻的隐藏状态ht-1,而是依赖于上一时刻的中间状态ct-1;②为了减少计算量,用Hadamard乘积来代替矩阵乘积。(可以看到系数矩阵U已经全部都抛弃,采用系数向量V)计算表达式如下:
ft=σ(Wfxt+vf⊙ct-1+bf)
ct=ft⊙ct-1+(1-ft)⊙(Wxt)
其中ft表示遗忘门,ct表示计算单元,符号⊙为逐元素乘法,Wf、W均表示权重矩阵,xt为时间输入序列,bf为偏置项。
SRU取消了ht-1在各个门里的计算,用ct-1来代替,然后用Hadamard乘积取代了一部分的矩阵乘积。
2)高速公路网络单元。计算公式如下:
rt=σ(Wrxt+vr⊙ct-1+br)
ht=rt⊙ct+(1-rt)⊙xt
其中rt为重置门,ht为隐藏门,SRU采用skipconnection结构,优化梯度传播。在测试时,由于Wf,Wr,W都是已经学习完的参数向量,就可以在测试的初始时间步计算一次Wfxt,Wrxt,Wxt,之后在每个时间步的推断中,只需要计算Hadamard乘积。
S4,预测准确率研判。
包括基于长短期记忆人工神经网络(LSTM)的预测和DTW动态计算用电序列数据距离矩阵,先对输入的客户用电量历史数据进行分类,基于不同的类别分别采用改进LSTM模型进行日用电量预测。
上述分析说明,本发明所提出的一种基于循环神经网络和张量分解的电力系统负荷预测方法,解决了电力系统内高耗能用户分类及用电异常检查等技术问题,实现异常用户用电的有效检测与识别,具有运算效率高,预测精度高强,能充分捕捉用户用电电力特征等优点,从而有效辅助新型电力系统安全经济运行、供需平衡以及削峰填谷,具有一定的参考价值和实际经济效益。
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。
Claims (5)
1.一种基于循环神经网络和张量分解的电力系统负荷预测系统,其特征在于,所述预测系统包括时间序列数据获取模块、数据处理模块、数据插补模块、数据预测模块、输出模块;
所述时间序列数据获取模块,通过国家电网的电量表和计量表等几个表格的关联,获取了电力系统用户的各自1000天的时间序列数据,其中包括综合倍率和日冻结示数两个字段的数据,将两个数据相乘最终得到了日用电量数据,并将用户日用电数据信息输入数据处理模块;
所述数据处理模块,对获取的日用电量数据中的异常值进行处理,用空字段代替异常值,对单一维度的时间序列,按时间窗口大小进行划分,然后再将数据合并,构成含缺失值的二维张量数据样本,并将该样本输入数据插补模块;
所述数据插补模块,对所获取的低秩的数据矩阵,即含缺失值的电力系统日用电量历史数据进行缺失值插补,构建不含缺失值的完整的数据集,该数据集作为训练样本输入数据预测模块,
所述数据预测模块,包括基于长短期记忆人工神经网络(LSTM)的预测和DTW动态计算用电序列数据距离矩阵,先对输入的电力系统客户用电量历史数据进行分类,基于不同的类别分别采用改进LSTM模型进行日用电量预测。
2.一种基于循环神经网络和张量分解的电力系统负荷预测方法,其特征在于,采用基于循环神经网络和张量分解的电力系统负荷预测系统,所述方法包括以下步骤:
S1,获取国家电网电力检测设备所测的电力系统用电数据,包括用户档案数据、日冻结电能示值、用户实时功率、用户日电量等时间序列数据;
S2,对获取的日用电量数据进行清洗,剔除含缺失值的样本,筛选均值,方差较小的样本,采用3σ原则处理离群数据样本,并进行数据归一化、非线性化,对单一维度的时间序列,按时间顺序进行拼接,得到含缺失值的二维张量;
S3,利用奇异值阈值算法(SVT)对表示每个用户日用电量数据的二维张量进行缺失数据的插补,从而获得完整的二维张量数据;
S4,利用DTW动态时序规整计算不同用电序列数据间距离矩阵,基于该矩阵使用K-Means进行聚类,对每一个类别的数据通过改进的长短期记忆人工神经网络LSTM对电力系统电负荷进行预测。
3.根据权利要求2所述的基于循环神经网络和张量分解的电力系统负荷预测方法,其特征在于,S2中数据处理和清洗工作包括剔除含缺失值的样本,筛选均值,方差较小的样本,处理离群数据样本,并进行数据归一化,具体如下:
S2.1,采用3σ原则进行离群值的处理:首先数据需要服从正态分布,在3σ原则下,样本数据值的大小如果不在μ±3σ范围内,将其视为异常值,其公式如下,其中X为服从正态分布的观测值,μ为分布的平均值,而σ为标准差:
S2.2,为将原始数据进行线性变换,使结果映射到[0,1]的范围,实现对原始数据的等比缩放,采用min-max归一化,其公式如下:
4.根据权利要求2所述的基于循环神经网络和张量分解的电力系统负荷预测方法,其特征在于,S3中模型采用了奇异值阈值算法(SVT)对表示每个用户日用电量数据的二维张量进行缺失数据的插补,具体如下:
S3.1,假设原始数据矩阵是低秩的,但是矩阵中含有很多未知的元素,从一个含有缺失元素的矩阵中恢复出一个元素完整的低秩阵,这就是是低秩矩阵填充问题,
S3.2,奇异值阈值算法(SVT)流程如下:
S3.2.1,求解正则化的最优化问题:
s.t.Ω(X)=PΩ(M)
其中,τ>0,Ω为观测样本下标的集合,为优化变量,M为真实的未知矩阵,表示将优化问题进行凸松弛之后再正则化之后的结果,当τ→+∞时,上述最优化问题的最优解收敛到凸优化的最优解,投影算子PΩ由下列公式表示:
S3.2.2,构造最优化问题的拉格朗日函数:
其中,拉格朗日乘子对于某些λ>0,Dλ是λ的邻近算子,此无约束问题的解的特征可以由不动点方程来表示,将SVT算法重新定义为一种拉格朗日乘子算法将使我们能够将SVT算法扩展到其他涉及凸约束下核形式最小化的问题,
若强对偶成立,且拉格朗日函数的鞍点为优化问题的原函数与对偶问题的最优解即如果(X*,Y*)是拉格朗日函数的一个中点,则有:
拉格朗日算法是通过迭代解决鞍点问题,其迭代解为:
其中{δk}k≥1是正步长的序列,Yk为迭代的中间矩阵,k表示迭代进行的次数,PΩ(M-Xk)是消失在外的矩阵跨度上的正交投影且PΩ(M-Xk)等于(M-Xk)ij。
5.根据权利要求2所述的基于循环神经网络和张量分解的电力系统负荷预测方法,其特征在于,S4中模型采用了基于DTW动态时序规整以及K-Means聚类和改进门控机制的LSTM算法,具体如下:
S4.1,采用基于相似性度量方式即动态时间规整方法(DTW)来处理时序数据,然后通过K-Means对不同时间序列进行聚类,基于不同类别分别训练改进LSTM模型,
S4.2,动态时间规整算法(Dynamic Time Warping,DTW),是一种衡量两个长度不同的时间序列的相似度的方法,把未知量延长或收缩,直到与参考模板的长度一致,在这一过程中,未知序列会产生歪曲或弯折,以便其特征量与标准模式对应,DTW算法的步骤如下:
S4.2.1,计算两个序列各个点之间的距离矩阵;
S4.2.2,寻找一条路径,它从矩阵左上角延伸至右下角,并且要满足该路径上的元素和是最小的;
矩阵从左上角到右下角的路径长度有以下几点性质:
(1)当前的路径长度=前一步的路径长度+当前元素的大小;
(2)路径上的某个元素(i,j),它的前一个元素只可能为以下三者之一:
a.左边的相邻元素(i,j-1)
b.上面的相邻元素(i-1,j)
c.左上方的相邻元素(i-1,j-1)
假设矩阵为M,从矩阵左上角(1,1)到任一点(i,j)的最短路径长度为Lmin(i,j),那么可以用递归算法求最短路径长度:
起始条件:
Lmin(1,1)=M(1,1)
递推规则:
Lmin(i,j)=min{Lmin(i,j-1),Lmin(i-1,j),Lmin(i-1,j-1)}+M(i,j)
S4.3,K-means聚类算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值),然后再迭代的进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的迭代次数;
使用二分K-Means算法作为优化,算法步骤如下:
S4.3.1,将所有点作为一个簇;
S4.3.2,将该簇一分为二;
S4.3.3,选择能最大限度降低聚类代价函数(也就是误差平方和SSE)的簇划分为两个簇;
S4.3.4,重复S4.3.3直到簇的数目等于给定的数目k为止,
S4.4,长短期记忆网络(LSTM)被提出用于解决循环神经网络在面对长序列数据容易遭遇梯度弥散使得模型只具备短期记忆的问题,其其核心在于提出了门机制:遗忘门-输入门-输出门以及细胞状态,类似于RNN的链式结构,重复板块具有不同的结构,算法流程如下:
S4.4.1,确定应被丢弃或保留的信息,由“遗忘门”的sigmoid层的输出决定,输出为0代表完全拒绝信息传播,1代表信息完全保持信息量流过;
S4.4.2,使用包含sigmoid层的输入门决定哪些新信息该被加入到细胞状态;肯定了哪些新信息要加入后,须要将新信息转换成可以加入到细胞状态的形式并使用tanh函数产生一个新的候选向量,之后更新细胞状态;
S4.4.3,基于细胞状态保存的内容来肯定输出什么内容,使用sigmoid激活函数肯定哪一个部分的内容须要输出,而后再使用tanh激活函数对细胞状态的内容进行处理,将这两部分相乘就获得了最终的输出,
S4.4.4改进的LSTM
提出了SRU(Simple Recurrent Units),其结构如下:
ft=σ(Wfxt+vf⊙ct-1+bf)
ct=ft⊙ct-1+(1-ft)⊙(Wxt)
rt=σ(Wrxt+vr⊙ct-1+br)
ht=rt⊙ct+(1-rt)⊙xt。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310903077.9A CN116937559A (zh) | 2023-07-21 | 2023-07-21 | 基于循环神经网络和张量分解的电力系统负荷预测系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310903077.9A CN116937559A (zh) | 2023-07-21 | 2023-07-21 | 基于循环神经网络和张量分解的电力系统负荷预测系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116937559A true CN116937559A (zh) | 2023-10-24 |
Family
ID=88385815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310903077.9A Pending CN116937559A (zh) | 2023-07-21 | 2023-07-21 | 基于循环神经网络和张量分解的电力系统负荷预测系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116937559A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117849302A (zh) * | 2024-03-08 | 2024-04-09 | 深圳市朗石科学仪器有限公司 | 一种多参数水质在线监测方法 |
CN118555149A (zh) * | 2024-07-30 | 2024-08-27 | 大数据安全工程研究中心(贵州)有限公司 | 一种基于人工智能的异常行为安全分析方法 |
CN118630767A (zh) * | 2024-08-08 | 2024-09-10 | 江苏智格高科技有限公司 | 智慧能源单元的负荷柔性调节方法、装置及系统 |
-
2023
- 2023-07-21 CN CN202310903077.9A patent/CN116937559A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117849302A (zh) * | 2024-03-08 | 2024-04-09 | 深圳市朗石科学仪器有限公司 | 一种多参数水质在线监测方法 |
CN118555149A (zh) * | 2024-07-30 | 2024-08-27 | 大数据安全工程研究中心(贵州)有限公司 | 一种基于人工智能的异常行为安全分析方法 |
CN118630767A (zh) * | 2024-08-08 | 2024-09-10 | 江苏智格高科技有限公司 | 智慧能源单元的负荷柔性调节方法、装置及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116937559A (zh) | 基于循环神经网络和张量分解的电力系统负荷预测系统和方法 | |
CN110990461A (zh) | 大数据分析模型算法选型方法、装置、电子设备及介质 | |
CN109214599B (zh) | 一种对复杂网络进行链路预测的方法 | |
CN112529282A (zh) | 基于时空图卷积神经网络的风电场集群短期功率预测方法 | |
US20150254554A1 (en) | Information processing device and learning method | |
CN112734128B (zh) | 一种基于优化rbf的7日电力负荷峰值预测方法 | |
CN111079931A (zh) | 一种基于图神经网络的状态空间概率性多时间序列预测方法 | |
CN112633421A (zh) | 一种用户异常用电行为检测方法及装置 | |
Eskandarnia et al. | An embedded deep-clustering-based load profiling framework | |
CN114861788A (zh) | 一种基于dbscan聚类的负荷异常检测方法及系统 | |
CN112418482A (zh) | 一种基于时间序列聚类的云计算能耗预测方法 | |
CN111832825A (zh) | 融合长短期记忆网络和极限学习机的风电预测方法及系统 | |
CN115965160B (zh) | 一种数据中心能耗预测方法、装置、存储介质及电子设备 | |
CN114118269A (zh) | 基于典型业务场景下的能源大数据聚合分析方法 | |
Bidoki et al. | Comparison of several clustering methods in the case of electrical load curves classification | |
CN117175588A (zh) | 基于时空相关性的用电负荷预测方法及装置 | |
CN113449920A (zh) | 一种风电功率预测方法、系统及计算机可读介质 | |
CN115564155A (zh) | 一种分散式风电机组功率预测方法及相关设备 | |
CN117154704A (zh) | 一种基于多尺度时空图注意力卷积网络的光伏功率预测方法 | |
CN117688362A (zh) | 基于多元数据特征增强的光伏功率区间预测方法及装置 | |
CN116706888A (zh) | 基于联邦学习的智能电网负荷预测方法 | |
CN114676887A (zh) | 一种基于图卷积stg-lstm的河流水质预测方法 | |
CN111008584B (zh) | 一种模糊自组织神经网络的电能质量量测缺失修复方法 | |
CN112308338A (zh) | 电力数据处理方法及装置 | |
Chakri et al. | Time-Series Neural Network Predictions Using LSTM for Clustering and Forecasting GPS Data of Bird Immigration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |