CN113743650A - 电力负荷预测方法、装置、设备与存储介质 - Google Patents
电力负荷预测方法、装置、设备与存储介质 Download PDFInfo
- Publication number
- CN113743650A CN113743650A CN202110889443.0A CN202110889443A CN113743650A CN 113743650 A CN113743650 A CN 113743650A CN 202110889443 A CN202110889443 A CN 202110889443A CN 113743650 A CN113743650 A CN 113743650A
- Authority
- CN
- China
- Prior art keywords
- data
- power load
- characteristic
- load
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000013598 vector Substances 0.000 claims abstract description 87
- 238000013528 artificial neural network Methods 0.000 claims abstract description 20
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 230000007246 mechanism Effects 0.000 claims abstract description 11
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 23
- 238000001914 filtration Methods 0.000 claims description 16
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000011176 pooling Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Power Engineering (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电力负荷预测方法、装置、设备以及计算机可读存储介质,所述方法通过将预设时间段的非结构化数据输入卷积神经网络中后用Transformer编码器模型进行特征赋权,能够给予重要特征更多的权重,并采用引入attention机制的双向LSTM对结构化数据进行特征提取,能够从众多信息中选择出对当前任务目标更关键的信息,最后采用特征向量拼接的方式将第一特征向量和第二特征向量拼接输入到全连接神经网络中来预测电力负荷,有效提高了电力负荷预测结果的准确性。
Description
技术领域
本发明涉及电力技术领域,尤其涉及一种电力负荷预测方法、装置、设备与存储介质。
背景技术
随着我国经济进入新的阶段,节约能源成为电力行业的发展方向,对于电力负荷的预测和精准把控是保障系统正常稳定运行的重要步骤,也能辅助用电系统的用电指定计划。
传统的电力负荷预测采用时间序列ARIMA的方式进行电力负荷预测,虽能在一定程度上预测电力负荷的趋势,但无法很好表达天气因素、气压等多因素对电力负荷的影响。据统计,影响电力负荷的因素高达32种,即有32维的数据。因此,传统的方法无法已经无法满足数据拟合。
随着机器学习的发展,支持向量机算法的出现可以解决多维度特征拟合、非线性、局部最小值等问题,但是支持向量机仅对小样本拟合较好,在大样本条件下,特征量较多的数据则会出现过拟合现象。而前馈神经网络虽能拟合多维数据,但其缺少对时间序列的数据相关性的考虑,需要人工构造时序特征,这样会导致预测不精确。
发明内容
本发明的目的是提供一种电力负荷预测方法、装置与存储介质,以解决现有技术对电力负荷预测不精准的问题。
本发明第一方面提供一种电力负荷预测方法,包括:
采集到的预设时间段的电力负荷数据进行预处理,得到第一特征数据和第二特征数据;其中,所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的,所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的;
将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取,得到第一一特征向量,并将所述第一一特征向量输入到预先训练的Transformer编码器模型中,得到第一特征向量;
将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中,得到第二特征向量;其中,所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型;
将所述第一特征向量和所述第二特征向量进行拼接,得到拼接特征向量,并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测,得到电力负荷预测结果。
作为上述方案的改进,所述对采集到的预设时间段的电力负荷数据进行预处理,得到第一特征数据和第二特征数据,具体包括:
对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理,并根据数据类型,将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据;
对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据;
对所述第二结构化负荷数据进行降维处理,得到第二特征数据。
作为上述方案的改进,所述对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理,并根据数据类型,将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据,具体包括:
将所述预设时间段的电力负荷数据整理成数据表,其中,所述数据表的每一列用于存放影响因素名称和相关联的数据;
遍历所述数据表的每一列,查找并删除数据缺失率大于第一预设缺失率的所在列、查找并删除与前一列影响因素名称相同的所在列、查找并填充数据缺失率小于第二预设缺失率的所在列、查找并删除存在异常数据的所在行,得到过滤填充后的数据表;
将过滤填充后的数据表中的数据进行标准化和归一化处理,并根据数据类型,将过滤填充后的数据表中的数据分为第二结构化负荷数据和第二非结构化负荷数据。
作为上述方案的改进,所述对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据,具体为:
采用One-hot编码、BOW模型、TF-IDF算法或N-Gram模型对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据。
本发明第二方面提供一种电力负荷预测装置,包括:
数据预处理模块,对采集到的预设时间段的电力负荷数据进行预处理,得到第一特征数据和第二特征数据;其中,所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的,所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的;
第一特征向量获取模块,用于将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取,得到第一一特征向量,并将所述第一一特征向量输入到预先训练的Transformer编码器模型中,得到第一特征向量;
第二特征向量获取模块,用于将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中,得到第二特征向量;其中,所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型;
预测结果获取模块,用于将所述第一特征向量和所述第二特征向量进行拼接,得到拼接特征向量,并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测,得到电力负荷预测结果。
作为上述方案的改进,所述数据预处理模块,具体包括:
过滤填充处理单元,用于对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理,并根据数据类型,将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据;
第一特征数据获取单元,用于对所述第二非结构化负荷数据进行降维处理,得到第一特征数据;
第二特征数据获取单元,用于对所述第二结构化负荷数据进行向量化处理,得到第二特征数据。
作为上述方案的改进,所述过滤填充处理单元,具体用于:
对将所述预设时间段的电力负荷数据整理成数据表,其中,所述数据表的每一列用于存放影响因素名称和相关联的数据;
遍历所述数据表的每一列,查找并删除数据缺失率大于第一预设缺失率的所在列、查找并删除与前一列影响因素名称相同的所在列、查找并填充数据缺失率小于第二预设缺失率的所在列、查找并删除存在异常数据的所在行,得到过滤填充后的数据表;
将过滤填充后的数据表中的数据进行标准化和归一化处理,并根据数据类型,将过滤填充后的数据表中的数据分为第二结构化负荷数据和第二非结构化负荷数据。
作为上述方案的改进,所述第一特征数据获取单元,具体用于:
采用One-hot编码、BOW模型、TF-IDF算法或N-Gram模型对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据。
本发明第三方面提供一种电力负荷预测设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述的电力负荷预测方法。
本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述的电力负荷预测方法。
与现有技术相比,本发明提供的电力负荷预测方法的有益效果在于:本发明提供的电力负荷预测方法包括对预设时间段的第一非结构化负荷数据预处理得到第一特征数据,对所述预设时间段的第一结构化负荷数据预处理得到第二特征数据,并将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取,得到第一一特征向量,并将所述第一一特征向量输入到预先训练的Transformer编码器模型中,得到第一特征向量;将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中,得到第二特征向量;将所述第一特征向量和所述第二特征向量进行拼接,得到拼接特征向量,并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测,得到预设时间段的电力负荷预测结果,其通过将预设时间段的非结构化数据输入卷积神经网络中后用Transformer编码器模型进行特征赋权,能够给予重要特征更多的权重,并采用引入attention机制的双向LSTM对结构化数据进行特征提取,能够从众多信息中选择出对当前任务目标更关键的信息,最后采用特征向量拼接的方式将第一特征向量和第二特征向量拼接输入到全连接神经网络中来预测电力负荷,有效提高了电力负荷预测结果的准确性。相应地,本发明还提供一种电力负荷预测装置、设备及计算机可读存储介质。
附图说明
图1是本发明提供的电力负荷预测方法的一种实施例的流程示意图;
图2是本发明实施例提供的电力负荷预测方法的详细预测流程框图。
图3是本发明提供的电力负荷预测装置的一种实施例的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明提供的电力负荷预测方法的一个实施例的流程示意图。
本发明实施例提供的电力负荷预测方法,包括步骤S11到步骤S14:
步骤S11,对采集到的预设时间段的电力负荷数据进行预处理,得到第一特征数据和第二特征数据;其中,所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的,所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的;
步骤S12,将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取,得到第一一特征向量,并将所述第一一特征向量输入到预先训练的Transformer编码器模型中,得到第一特征向量;
步骤S13,将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中,得到第二特征向量;其中,所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型;
步骤S14,将所述第一特征向量和所述第二特征向量进行拼接,得到拼接特征向量,并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测,得到电力负荷预测结果。
具体的,预设时间段的电力负荷数据分为第一非结构化负荷数据和第一结构化负荷数据。所述预先时间段可以为待预测日的前1天,或者前m天到前1天。
具体的,所述第一特征数据为向量编码的形式,由于第一非结构化负荷数据为非结构数据,网络模型不能直接提取特征,需要将非结构化的数据预处理(预处理过程包括了向量化处理),从而得到向量形式的第一特征数据。
在具体实施时,可以预先构建卷积神经网络、Transformer编码器模型、LSTM-Attention网络模型和全连接神经网络并对其进行训练,具体可以通过获取历史电力负荷数据,将历史电力负荷数据分为训练集、验证集、测试集(该测试集即为所述预设时间段的电力负荷数据);其中,所述训练集和所述验证集用于训练Transformer编码器模型、LSTM-Attention网络模型和全连接神经网络并使得模型收敛,并得到训练后的Transformer编码器模型、LSTM-Attention网络模型和全连接神经网络应用于测试集对待预测日的电力负荷进行预测。
可以理解的是,卷积神经网络采用卷积的形式能够提取不同类型数据的潜在特征,但其在提取特征后并不能很好地记住哪些特征是重要的,因此,本发明实施例在通过对非结构化负荷数据预处理后得到的第一特征数据输入到卷积神经网络进行特征提取后进一步输入到Transformer编码器模型中,能够使得最终提取到的第一特征向量既自带时间属性,又增强了不同特征向量之间的相关性,并给予重要特征更多的权重,得到一组带有自注意力机制的特征向量。
具体的,卷积神经网络对第一特征数据的提取过程为:先对向量形式的第一特征数据进行卷积操作,卷积步长设为2,采用3*3的卷积层进行卷积操作,卷积完成后,对其进行池化操作,池化过程采用最大池化,得到第一一特征向量。
可以理解的是,对于结构化的负荷数据,其预处理得到的第二特征数据输入到LSTM-Attention网络模型中,由于双向LSTM引入了注意力机制,能够解决信息超载的问题,将计算资源分配给对当前任务目标更关键的信息,从而能够提取出更具有代表性的特性向量。
具体的,所述第一特征向量和所述第二特征向量在相应的模型中处理得到加权后的数据,对所述第一特征向量和所述第二特征向量进行拼接,从而获取数据的重要性加权的特征向量矩阵,即拼接特征向量,将拼接特征向量输入到全连接神经网络进行预测,即得到电力负荷预测结果。
具体的,所述全连接神经网络具体为前馈神经网络,其由输入层、隐含层、输出层组成,其中前馈神经网络的中间神经元的激活函数采用RELU函数,最后一层的函数去掉激活函数,就可以输出回归值,即电力负荷的预测结果。
本发明提供的电力负荷预测方法包括对预设时间段的第一非结构化负荷数据预处理得到第一特征数据,对所述预设时间段的第一结构化负荷数据预处理得到第二特征数据,并将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取,得到第一一特征向量,并将所述第一一特征向量输入到预先训练的Transformer编码器模型中,得到第一特征向量;将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中,得到第二特征向量;将所述第一特征向量和所述第二特征向量进行拼接,得到拼接特征向量,并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测,得到预设时间段的电力负荷预测结果,其通过将预设时间段的非结构化数据输入卷积神经网络中后用Transformer编码器模型进行特征赋权,能够给予重要特征更多的权重,并采用引入attention机制的双向LSTM对结构化数据进行特征提取,能够从众多信息中选择出对当前任务目标更关键的信息,最后采用特征向量拼接的方式将第一特征向量和第二特征向量拼接输入到全连接神经网络中来预测电力负荷,有效提高了电力负荷预测结果的准确性。
示例性的,参见图2,图2示出了本发明实施例提供的电力负荷预测方法的详细预测流程框图。在一种实施方式中,所述步骤S11“对采集到的预设时间段的电力负荷数据进行预处理,得到第一特征数据和第二特征数据”,具体包括:
对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理,并根据数据类型,将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据;
对所述第二非结构化负荷数据进行降维处理,得到第一特征数据;
对所述第二结构化负荷数据进行向量化处理,得到第二特征数据。
在本发明实施例中,为了能够最大限度地从原始符合数据中提取特征以供算法和模型使用,需要对历史电力负荷数据(包括预设时间段的电力负荷数据)中过滤、填充、标准化和归一化处理。同时,由于电力负荷数据包括了多个影响因素对应的数据,如,时间(小时、天)、天气因素、温度、电力负荷等,而在这些数据中,存在着如“时间”、“电力负荷”等的第一结构化负荷数据,也存在着“天气因素”等这种文本的第一非结构化负荷数据,因此,需要将这两类型的负荷数据分别处理,针对第二结构化负荷数据进行降维处理,对第二非结构化负荷数据进行向量化处理,并便于后续输入到对应的模型中提取特征。
进一步的,在一种实施方式中,所述对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理,并根据数据类型,将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据,具体包括:
将所述预设时间段的电力负荷数据整理成数据表,其中,所述数据表的每一列用于存放影响因素名称和相关联的数据;
遍历所述数据表的每一列,查找并删除数据缺失率大于第一预设缺失率的所在列、查找并删除与前一列影响因素名称相同的所在列、查找并填充数据缺失率小于第二预设缺失率的所在列、查找并删除存在异常数据的所在行,得到过滤填充后的数据表;
将过滤填充后的数据表中的数据进行标准化和归一化处理,并根据数据类型,将过滤填充后的数据表中的数据分为第二结构化负荷数据和第二非结构化负荷数据。
具体的,所述第一预设缺失率为0.5,所述第二预设缺失率为0.2。对于某一列影响因素相关联的数据缺失率较大时,则该列数据对整体预测不会产生很大影响,因此,需要将这列过滤掉。而对于某一列影响因素相关联的数据缺失率比较小时,则该列数据对于整体预测有一定影响,因此,需要对数据进行填充。示例性的,可以采用临近插值法进行填充。
在对数据填充后,需要进一步过滤异常值,过滤规则可以采用3倍标准差原则,即,整体平均数+-整体标准差*用户设置的标准差倍数(默认为3)。具体的,当在某一列影响因素相关联的数据中有一个数据与该列其他数据相差明显较大时,则判定该数据为异常数据,并删除该异常数据所在行。
在一种实施方式中,所述对所述第二非结构化负荷数据进行向量化处理,得到第二特征数据,具体为:
采用One-hot编码、BOW模型、TF-IDF算法或N-Gram模型对所述第二非结构化负荷数据进行向量化处理,得到第二特征数据。
在本发明实施例中,对于非结构的数据,需要将其向量化,均可输入到网络模型中提取特征。
参见图3,图3是本发明提供的电力负荷预测装置的一个实施例结构框图。
本发明实施例提供的电力负荷预测装置10,包括:
数据预处理模块11,对采集到的预设时间段的电力负荷数据进行预处理,得到第一特征数据和第二特征数据;其中,所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的,所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的;
第一特征向量获取模块12,用于将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取,得到第一一特征向量,并将所述第一一特征向量输入到预先训练的Transformer编码器模型中,得到第一特征向量;
第二特征向量获取模块13,用于将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中,得到第二特征向量;其中,所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型;
预测结果获取模块14,用于将所述第一特征向量和所述第二特征向量进行拼接,得到拼接特征向量,并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测,得到电力负荷预测结果。
在一种实施方式中,所述数据预处理模块11,具体包括:
过滤填充处理单元,用于对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理,并根据数据类型,将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据;
第一特征数据获取单元,用于对所述第二非结构化负荷数据进行降维处理,得到第一特征数据;
第二特征数据获取单元,用于对所述第二结构化负荷数据进行向量化处理,得到第二特征数据。
在一种实施方式中,所述过滤填充处理单元,具体用于:
对将所述预设时间段的电力负荷数据整理成数据表,其中,所述数据表的每一列用于存放影响因素名称和相关联的数据;
遍历所述数据表的每一列,查找并删除数据缺失率大于第一预设缺失率的所在列、查找并删除与前一列影响因素名称相同的所在列、查找并填充数据缺失率小于第二预设缺失率的所在列、查找并删除存在异常数据的所在行,得到过滤填充后的数据表;
将过滤填充后的数据表中的数据进行标准化和归一化处理,并根据数据类型,将过滤填充后的数据表中的数据分为第二结构化负荷数据和第二非结构化负荷数据。
在一种实施方式中,所述第一特征数据获取单元,具体用于:
采用One-hot编码、BOW模型、TF-IDF算法或N-Gram模型对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据。
需要说明的是,本发明实施例提供的电力负荷预测装置,其用于执行所述电力负荷预测方法的全部流程和示意图,两者的原理和作用效果一一对应,这里不再作过多的赘述。
其中,所述电力负荷预测装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
相应地,本发明实施例还提供了一种电力负荷预测设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述实施例提供的电力负荷预测方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述实施例提供的电力负荷预测方法。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电力负荷预测装置中的执行过程。例如,所述计算机程序可以被分割成如图3所示的电力负荷预测装置的功能模块。
所述电力负荷预测设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述电力负荷预测装置可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述示意图仅仅是电力负荷预测装置的示例,并不构成对电力负荷预测装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电力负荷预测装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述电力负荷预测装置的控制中心,利用各种接口和线路连接整个电力负荷预测装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述电力负荷预测装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种电力负荷预测方法,其特征在于,包括:
对采集到的预设时间段的电力负荷数据进行预处理,得到第一特征数据和第二特征数据;其中,所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的,所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的;
将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取,得到第一一特征向量,并将所述第一一特征向量输入到预先训练的Transformer编码器模型中,得到第一特征向量;
将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中,得到第二特征向量;其中,所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型;
将所述第一特征向量和所述第二特征向量进行拼接,得到拼接特征向量,并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测,得到电力负荷预测结果。
2.如权利要求1所述的电力负荷预测方法,其特征在于,所述对采集到的预设时间段的电力负荷数据进行预处理,得到第一特征数据和第二特征数据,具体包括:
对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理,并根据数据类型,将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据;
对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据;
对所述第二结构化负荷数据进行降维处理,得到第二特征数据。
3.如权利要求2所述的电力负荷预测方法,其特征在于,所述对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理,并根据数据类型,将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据,具体包括:
将所述预设时间段的电力负荷数据整理成数据表,其中,所述数据表的每一列用于存放影响因素名称和相关联的数据;
遍历所述数据表的每一列,查找并删除数据缺失率大于第一预设缺失率的所在列、查找并删除与前一列影响因素名称相同的所在列、查找并填充数据缺失率小于第二预设缺失率的所在列、查找并删除存在异常数据的所在行,得到过滤填充后的数据表;
将过滤填充后的数据表中的数据进行标准化和归一化处理,并根据数据类型,将过滤填充后的数据表中的数据分为第二结构化负荷数据和第二非结构化负荷数据。
4.如权利要求2所述的电力负荷预测方法,其特征在于,所述对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据,具体为:
采用One-hot编码、BOW模型、TF-IDF算法或N-Gram模型对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据。
5.一种电力负荷预测装置,其特征在于,包括:
数据预处理模块,对采集到的预设时间段的电力负荷数据进行预处理,得到第一特征数据和第二特征数据;其中,所述第一特征数据是对预设时间段的第一结构化负荷数据预处理得到的,所述第二特征数据是对预设时间段的第一非结构化负荷数据预处理得到的;
第一特征向量获取模块,用于将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取,得到第一一特征向量,并将所述第一一特征向量输入到预先训练的Transformer编码器模型中,得到第一特征向量;
第二特征向量获取模块,用于将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中,得到第二特征向量;其中,所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型;
预测结果获取模块,用于将所述第一特征向量和所述第二特征向量进行拼接,得到拼接特征向量,并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测,得到电力负荷预测结果。
6.如权利要求5所述的电力负荷预测装置,其特征在于,所述数据预处理模块,具体包括:
过滤填充处理单元,用于对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理,并根据数据类型,将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据;
第一特征数据获取单元,用于对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据;
第二特征数据获取单元,用于对所述第二结构化负荷数据进行降维处理,得到第二特征数据。
7.如权利要求6所述的电力负荷预测装置,其特征在于,所述过滤填充处理单元,具体用于:
对将所述预设时间段的电力负荷数据整理成数据表,其中,所述数据表的每一列用于存放影响因素名称和相关联的数据;
遍历所述数据表的每一列,查找并删除数据缺失率大于第一预设缺失率的所在列、查找并删除与前一列影响因素名称相同的所在列、查找并填充数据缺失率小于第二预设缺失率的所在列、查找并删除存在异常数据的所在行,得到过滤填充后的数据表;
将过滤填充后的数据表中的数据进行标准化和归一化处理,并根据数据类型,将过滤填充后的数据表中的数据分为第二结构化负荷数据和第二非结构化负荷数据。
8.如权利要求6所述的电力负荷预测装置,其特征在于,所述第一特征数据获取单元,具体用于:
采用One-hot编码、BOW模型、TF-IDF算法或N-Gram模型对所述第二非结构化负荷数据进行向量化处理,得到第一特征数据。
9.一种电力负荷预测设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4中任意一项所述的电力负荷预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至4中任意一项所述的电力负荷预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110889443.0A CN113743650B (zh) | 2021-08-04 | 2021-08-04 | 电力负荷预测方法、装置、设备与存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110889443.0A CN113743650B (zh) | 2021-08-04 | 2021-08-04 | 电力负荷预测方法、装置、设备与存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113743650A true CN113743650A (zh) | 2021-12-03 |
CN113743650B CN113743650B (zh) | 2022-12-06 |
Family
ID=78730023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110889443.0A Active CN113743650B (zh) | 2021-08-04 | 2021-08-04 | 电力负荷预测方法、装置、设备与存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113743650B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114401135A (zh) * | 2022-01-14 | 2022-04-26 | 国网河北省电力有限公司电力科学研究院 | 基于LSTM-Attention用户和实体行为分析技术的内部威胁检测方法 |
CN115481788A (zh) * | 2022-08-31 | 2022-12-16 | 北京建筑大学 | 相变储能系统负荷预测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197773A (zh) * | 2017-12-08 | 2018-06-22 | 囯网河北省电力有限公司电力科学研究院 | 电力负荷预测方法、电力负荷预测装置及终端设备 |
CN111695731A (zh) * | 2020-06-09 | 2020-09-22 | 中国电力科学研究院有限公司 | 基于多源数据和混合神经网络的负荷预测方法、系统及设备 |
CN112215442A (zh) * | 2020-11-27 | 2021-01-12 | 中国电力科学研究院有限公司 | 电力系统短期负荷预测方法、系统、设备及介质 |
CN113158685A (zh) * | 2021-04-23 | 2021-07-23 | 平安科技(深圳)有限公司 | 文本的语义预测方法、装置、计算机设备和存储介质 |
CN113158572A (zh) * | 2021-04-27 | 2021-07-23 | 上海交通大学 | 一种短期负荷的预测方法及装置 |
-
2021
- 2021-08-04 CN CN202110889443.0A patent/CN113743650B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197773A (zh) * | 2017-12-08 | 2018-06-22 | 囯网河北省电力有限公司电力科学研究院 | 电力负荷预测方法、电力负荷预测装置及终端设备 |
CN111695731A (zh) * | 2020-06-09 | 2020-09-22 | 中国电力科学研究院有限公司 | 基于多源数据和混合神经网络的负荷预测方法、系统及设备 |
CN112215442A (zh) * | 2020-11-27 | 2021-01-12 | 中国电力科学研究院有限公司 | 电力系统短期负荷预测方法、系统、设备及介质 |
CN113158685A (zh) * | 2021-04-23 | 2021-07-23 | 平安科技(深圳)有限公司 | 文本的语义预测方法、装置、计算机设备和存储介质 |
CN113158572A (zh) * | 2021-04-27 | 2021-07-23 | 上海交通大学 | 一种短期负荷的预测方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114401135A (zh) * | 2022-01-14 | 2022-04-26 | 国网河北省电力有限公司电力科学研究院 | 基于LSTM-Attention用户和实体行为分析技术的内部威胁检测方法 |
CN115481788A (zh) * | 2022-08-31 | 2022-12-16 | 北京建筑大学 | 相变储能系统负荷预测方法及系统 |
CN115481788B (zh) * | 2022-08-31 | 2023-08-25 | 北京建筑大学 | 相变储能系统负荷预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113743650B (zh) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287961B (zh) | 中文分词方法、电子装置及可读存储介质 | |
CN113743650B (zh) | 电力负荷预测方法、装置、设备与存储介质 | |
US11372388B2 (en) | Locking error alarm device and method | |
CN112466314A (zh) | 情感语音数据转换方法、装置、计算机设备及存储介质 | |
CN109616093A (zh) | 端对端语音合成方法、装置、设备及存储介质 | |
CN111984414B (zh) | 一种数据处理的方法、系统、设备及可读存储介质 | |
CN113516275A (zh) | 一种配电网超短期负荷预测方法、装置及终端设备 | |
CN112084752A (zh) | 基于自然语言的语句标注方法、装置、设备及存储介质 | |
CN111178196B (zh) | 一种细胞分类的方法、装置及设备 | |
CN116684330A (zh) | 基于人工智能的流量预测方法、装置、设备及存储介质 | |
CN111625858B (zh) | 一种垂直领域下的智能化多模态数据脱敏方法和装置 | |
CN113657936A (zh) | 电力负荷预测方法及终端 | |
CN113220828A (zh) | 意图识别模型处理方法、装置、计算机设备及存储介质 | |
CN110532448B (zh) | 基于神经网络的文档分类方法、装置、设备及存储介质 | |
CN116777646A (zh) | 基于人工智能的风险识别方法、装置、设备及存储介质 | |
CN115470900A (zh) | 一种神经网络模型的剪枝方法、装置及设备 | |
CN115062769A (zh) | 基于知识蒸馏的模型训练方法、装置、设备及存储介质 | |
CN114462679A (zh) | 基于深度学习的网络流量预测方法、装置、设备及介质 | |
CN112489687A (zh) | 一种基于序列卷积的语音情感识别方法及装置 | |
CN113469237A (zh) | 用户意图识别方法、装置、电子设备及存储介质 | |
CN110210518B (zh) | 提取降维特征的方法和装置 | |
CN111782812A (zh) | K-Means文本聚类方法、装置及终端设备 | |
CN111882046A (zh) | 多媒体数据的识别方法、装置、设备及计算机存储介质 | |
CN111160969A (zh) | 一种电力价格预测方法及装置 | |
CN117971399B (zh) | 容器数量调节方法、智能计算云操作系统以及计算平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |