CN113807605A - 电力消耗预测模型训练方法、预测方法及装置 - Google Patents
电力消耗预测模型训练方法、预测方法及装置 Download PDFInfo
- Publication number
- CN113807605A CN113807605A CN202111173854.6A CN202111173854A CN113807605A CN 113807605 A CN113807605 A CN 113807605A CN 202111173854 A CN202111173854 A CN 202111173854A CN 113807605 A CN113807605 A CN 113807605A
- Authority
- CN
- China
- Prior art keywords
- power consumption
- data
- training
- consumption data
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000012549 training Methods 0.000 title claims abstract description 75
- 238000012360 testing method Methods 0.000 claims abstract description 30
- 238000010183 spectrum analysis Methods 0.000 claims abstract description 29
- 238000010200 validation analysis Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 238000012795 verification Methods 0.000 claims abstract description 11
- 238000013528 artificial neural network Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 16
- 238000013136 deep learning model Methods 0.000 claims description 15
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 14
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000013461 design Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 10
- 239000011159 matrix material Substances 0.000 description 14
- 238000000354 decomposition reaction Methods 0.000 description 12
- 230000015654 memory Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000010248 power generation Methods 0.000 description 5
- 230000006403 short-term memory Effects 0.000 description 5
- 238000012733 comparative method Methods 0.000 description 4
- 230000005611 electricity Effects 0.000 description 4
- 230000007787 long-term memory Effects 0.000 description 4
- MWUXSHHQAYIFBG-UHFFFAOYSA-N Nitric oxide Chemical compound O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 3
- 239000003245 coal Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 238000003916 acid precipitation Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Educational Administration (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种本发明提供了一种电力消耗预测模型训练方法、预测方法及装置。涉及计算机技术领域。该训练方法包括:采集多个用电主体的电力消耗数据;对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列;基于所述多个子序列确定训练集、验证集以及测试集;基于所述训练集、所述验证集以及所述测试集,对初始电力消耗预测模型进行训练,得到训练好的电力消耗预测模型进行训练。本发明使用奇异谱分析处理不稳定的原始数据,从而将不稳定的原始数据变得特征明显而更易于预测。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种电力消耗预测模型训练方法、预测方法及装置。
背景技术
火力发电至今仍是一种主要的发电方式,这种发电方式会浪费大量的不可再生的资源。在中国,发电厂每年消耗5000万吨的煤炭,燃烧使用的煤炭需要上亿年的形成时间,且不是取之不尽用之不竭的。在给发电的汽轮机冷却时需要使用大量水资源,一座1000MW的火力发电厂每日的耗水量约为十万吨。为了确保日常用电,火力发电厂还会产生多余的电能,剩余不能得到充分利用的电力则会被浪费。中国是一个人口大国,资源的浪费不容忽视。另外,火力发电还会造成严重的环境污染。发电燃烧的煤炭造成大量的碳排放和粉尘污染,粉尘与二氧化硫、氧化氮等有害气体结合会进一步危害环境和人类身体健康,造成雾霾及酸雨等自然灾害。
目前的电力消耗预测模型还存在预测精度较低、泛化性差、预测滞后等问题。但是为了实现可持续发展,我们急需一种准确的预测方法去保证充足的电力供应的同时可以做到节约资源。在预测电力消耗方面的主要问题是多种机器学习和深度学习模型在不规则波动和明显突变的数据预测中不具有很高的准确性。此外,数据收集过程中的误差将影响最终的预测结果。众所周知,家庭用电量数据受许多因素影响。在收集数据的过程中,时间抖动和噪声会影响数据的完整性和真实性,这些干扰因素都在一定程度上影响预测的准确性。家庭结构,居民的生活习惯和其他因素会影响家庭电力的通电时间和峰值。
通过观察原始数据,可以发现家庭消耗数据的间歇性和波动性。不灵活的模型很难很好地捕获和预测突变。消除造成影响的噪声和准确预测波动及突变较大的数据是当前研究中的两个最重要的问题。
发明内容
本申请实施例的目的在于提供一种电力消耗预测模型训练方法、预测方法及装置,用以缓解现有技术存在的噪声和波动的影响。
第一方面,本发明提供一种电力消耗预测模型训练方法,包括:
采集多个用电主体的电力消耗数据,所述电力消耗数据为按照时间顺序记录的各个时段数据;
对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
基于所述多个子序列确定训练集、验证集以及测试集;
基于所述训练集、所述验证集以及所述测试集,对初始电力消耗预测模型进行训练,得到训练好的电力消耗预测模型进行训练。
在可选的实施方式中,所述基于所述多个子序列确定训练集、验证集以及测试集,包括:
基于预设的滑动时间窗将所述多个子序列从单维的时间序列数据拓展成多维数据;
将所述多维数据划分为82%训练集、5%验证集和13%测试集。
在可选的实施方式中,电力消耗预测模型为单通道LSTM深度学习模型,所述单通道LSTM深度学习模型包括四个并行任务模块,每个任务模块对应一个子序列;
每个所述任务模块由一个LSTM神经网络层和一个全连接层组成;
所述电力消耗预测模型的损失函数为MSE,并以最小化平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE指标和最优化确定系数R2指标为目标进行设计和优化。
在可选的实施方式中,MAE基于如下公式确定:
RMSE基于如下公式确定:
MAPE基于如下公式确定:
R2基于如下公式确定:
在可选的实施方式中,所述对所述电力消耗数据进行预处理,包括:
对所述电力消耗数据放缩成平均值为0,标准差为1的预处理后的电力消耗数据。
第二方面,本发明提供一种电力消耗预测方法,包括:
采集待预测用电主体的电力消耗数据,所述电力消耗数据为按照时间顺序记录的各个时段数据;
对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
基于训练好的电力消耗预测模型进行训练以及多个子序列,对于所述待预测用电主体的用电情况进行预测。
第三方面,本发明提供一种电力消耗预测模型训练装置,包括:
采集模块,用于采集多个用电主体的电力消耗数据,所述电力消耗数据为按照时间顺序记录的各个时段数据;
分析模块,用于对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
确定模块,用于基于所述多个子序列确定训练集、验证集以及测试集;
训练模块,用于基于所述训练集、所述验证集以及所述测试集,对初始电力消耗预测模型进行训练,得到训练好的电力消耗预测模型进行训练。
在可选的实施方式中,所述确定模块具体用于:
基于预设的滑动时间窗将所述多个子序列从单维的时间序列数据拓展成多维数据;
将所述多维数据划分为82%训练集、5%验证集和13%测试集。
在可选的实施方式中,电力消耗预测模型为单通道LSTM深度学习模型,所述单通道LSTM深度学习模型包括四个并行任务模块,每个任务模块对应一个子序列;
每个所述任务模块由一个LSTM神经网络层和一个全连接层组成;
所述电力消耗预测模型的损失函数为MSE,并以最小化平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE指标和最优化确定系数R2指标为目标进行设计和优化。
在可选的实施方式中,MAE基于如下公式确定:
RMSE基于如下公式确定:
MAPE基于如下公式确定:
R2基于如下公式确定:
在可选的实施方式中,所述分析模块具体用于:
对所述电力消耗数据放缩成平均值为0,标准差为1的预处理后的电力消耗数据。
第四方面,本发明提供一种电力消耗预测装置,包括:
采集模块,用于采集待预测用电主体的电力消耗数据,所述电力消耗数据为按照时间顺序记录的各个时段数据;
分析模块,用于对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
预测模块,用于基于训练好的电力消耗预测模型进行训练以及多个子序列,对于所述待预测用电主体的用电情况进行预测。
第五方面,本发明提供一种电子设备,包括:处理装置以及存储装置;
所述存储装置上存储有计算机程序,所述计算机程序在被所述处理器运行时执行如前述实施方式任一项所述的方法,以用于相机标定和/或电力消耗预测模型训练。
第六方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述前述实施方式任一项所述的方法的步骤。
本发明提供了一种电力消耗预测模型训练方法、预测方法及装置。通过采集多个用电主体的电力消耗数据,所述电力消耗数据为按照时间顺序记录的各个时段数据;对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;基于所述多个子序列确定训练集、验证集以及测试集;基于所述训练集、所述验证集以及所述测试集,对初始电力消耗预测模型进行训练,得到训练好的电力消耗预测模型进行训练。提高预测精度,并对原始数据进行准确的特征提取,在利用大量历史数据进行预测时,具有显著优势。为了更加准确的提取数据的特征,去除不必要的噪声,本发明使用奇异谱分析处理不稳定的原始数据,从而将不稳定的原始数据变得特征明显而更易于预测。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是一种用于实现本发明实施例的电力消耗预测模型训练方法的示例电子设备;
图2是根据本发明实施例的一种电力消耗预测模型训练方法的流程图;
图3是根据本发明实施例提供的信号示例图;
图4是根据本发明实施例提供的整体算法框架图;
图5是根据本发明实施例提供的LSTM深度学习模型结构图;
图6是根据本发明实施例提供的准确率示意图;
图7是根据本发明实施提供的可视化后的实验结果示意图;
图8是根据本发明实施例的一种电力消耗预测方法的流程示意图;
图9是根据本发明实施例的一种电力消耗预测模型训练装置的流结构图;
图10是根据本发明实施例的一种电力消耗预测装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
首先,参照图1来描述用于实现本发明实施例的电力消耗预测模型训练方法的示例电子设备100。
如图1所示,电子设备100包括一个或多个处理设备102、一个或多个存储装置104、输入装置106以及输出装置108,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,电子设备也可以具有其他组件和结构。
处理设备102可以是中央处理单元(CPU)、图形处理单元(GPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制电子设备100中的其它组件以执行期望的功能。
存储装置104可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理设备102可以运行程序指令,以实现下文的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在计算机可读存储介质中还可以存储各种应用程序和各种数据,例如应用程序使用和/或产生的各种数据等。
输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
输出装置108可以向外部(例如,用户)输出各种信息(例如,图像或声音),并且可以包括显示器、扬声器等中的一个或多个。
示例性地,用于实现根据本发明实施例的电力消耗预测模型训练方法的示例电子设备可以被实现为诸如智能手机、平板电脑等移动终端上。
下面将结合具体的实施例对电力消耗预测模型训练方法进行详细的介绍。
图2为本发明实施例提供的一种电力消耗预测模型训练方法流程示意图,如图2所示,该方法可以包括如下步骤:
S210,采集多个用电主体的电力消耗数据,电力消耗数据为按照时间顺序记录的各个时段数据;
可以按采集点采集5个不同的家庭的电力消耗数据,依次按时间顺序记录各时段数据。例如,可以设置5分钟为一步,分别按1、2、4、6个步长分别生成单维时间序列数据,去除无效数据,然后对生成的时间序列放缩成平均值为0,标准差为1的数据。该采集点可以指用电主体。
S220,对电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
该预处理可以包括处理缺失值、数据标准化以及嵌入多维等等。
其中,处理缺失值可以用相邻的值填充缺失值,也就是说,假设相邻时间段的电能消耗值相近。
数据标准化指的就把所有电能消耗值x,转化1到-1区间内的某个值。也就是将电力消耗数据放缩成平均值为0,标准差为1的预处理后的电力消耗数据。
可以基于Min-max标准化方法对电力消耗数据转化为1到-1区间内的某个值x*。该Min为样本数据的最小值,Max为样本数据的最大值。该转换公式为:
从原始数列中(电力消耗数据)找出所有值的最大值和最小值,然后让每一个数列中的值(x),按照上面公式进行转换,因为x-min一定小于max-min,且分子分母都一定大于0,所以转化后的值会在1到-1之间。
嵌入多维是因为后面的奇异谱分析需要矩阵输入。比如,原始数据为:X=x1,x2,…xN。
可以将上述线性的数据转化为矩阵数据。例如可以将原始数据转化为:
可以通过将把原始数据进行重新来实现。其中,ψ为预设值,例如可以为4。β为原始序列的长度-4。所以这个矩阵会有4行。奇异谱分析之后会生成4个子序列。
将标准化后的单维时间序列数据通过奇异谱分析分解成噪声含量不同的子序列,每个子序列长度与原序列相同,每个子序列代表不同的特征。
在信号学科中,有很多不同的方法去分解一个信号。也就是单维数据。分解的目的是将一个复杂信号,分解为多个噪声。所谓噪声就是mean为0,波动在一定范围内的子信号。一般意义上我们认为LSTM非常擅长于预测一般噪声信号。所以只需要预测被分解后的原始信号。而原始信号在被剥离噪声后也会变的平滑,会比较容易被预测。
如图3所示,最上面的原始信号被分解成四个子信号(例如,设置了ψ为4)。然后我们用LSTM去预测每个子信号,预测完再把预测值加起来,作为原始信号的预测值。这样比直接把LSTM用在原始信号上效果好。对于分解方法有很多,例如传统的小波分解还可以为奇异谱分解,其中奇异谱分解为效果最好的分解方法。每个子序列代表了平滑后的原始数列和多个噪声序列。
例如,参见图4所示,通过奇异谱分解可以将原始信号A分解为U、Σ以及VT。其中,U有4列,Sigma(Σ)有4个值,V有四行。每个各取一个(列记为U,值记为λ,行记为VT)组成下一步输入。继续参见图4,得到的数据为“λ1、U1、V1 T”、“λ2、U2、V2 T”、“λ2、U2、V2 T”以及“λi、Ui、V1 T”等等。
继续参见图4,可以将上述过程得到的数据根据矩阵乘法1*5的矩阵乘上4*1的矩阵,变成4*5(或者5*4)的矩阵。但这里的5只是举例。实际情况会很大,该5对应原始序列的长度-4。
最后需要重构回去形成子序列。
所以这里接分解步。首先计算迟滞序列Xi在Um上的投影:
其中,X(例如,公式(b)所示的矩阵)为L×K的矩阵,N为原始时间序列的序列长度,首先需要选择合适的窗口长度L将原始时间序列进行滞后排列得到轨迹矩阵,通常情况下取L<N/2,令K=N-L+1,则可以得到X。L为j的最大值,Xi表示轨迹矩阵X的第i列,j用于标识行,αi m是Xi所反映的时间演变型在原序列的xi+1,xi+2,xi+L时段的权重,称为时间主成分(TPC)。由αi m构成的矩阵实际上就是没有归一化的右矩阵,即
首先计算轨迹矩阵的协方差矩阵:
S=XXT 公式(d)
接下来对S进行特征值分解得到特征值λ1>λ2>…>λL≥0和对应的特征向量U1,U2,…,UL,此时U=[U1,U2,…,UL],对λ开方得到为原序列的奇异谱。可以有:
接下来就可以通过时间经验正交函数和时间主成分来进行重建,具体重构过程如下:
这样,所有重构序列的和应当等于原序列,即
S230,基于多个子序列确定训练集、验证集以及测试集;
可以基于预设的滑动时间窗将多个子序列从单维的时间序列数据拓展成多维数据;将多维数据划分为82%训练集、5%验证集和13%测试集。
可以使用滑动时间窗的方法将子序列从单维的时间序列数据拓展成多维数据,滑动时间窗长度可以设置为8。可以使用前八个点的数据预测第九个点的电力消耗情况,将单维样本数据拓展成为多维样本数据。基于这样的预测方式,将原来的单维时间序列样本数据拓展成为多维样本数据,即每个预测目标值与它对应历史数据的集合。
S240,基于训练集、验证集以及测试集,对初始电力消耗预测模型进行训练,得到训练好的电力消耗预测模型进行训练。
如图4和图5所示,该电力消耗预测模型为单通道LSTM深度学习模型,单通道LSTM深度学习模型包括四个并行任务模块,每个任务模块对应一个子序列;
如图4所示,每个任务模块由一个LSTM神经网络层和一个全连接层组成;
该电力消耗预测模型的损失函数为MSE,并以最小化平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE指标和最优化确定系数R2指标为目标进行设计和优化。
其中,MAE基于如下公式(一)确定:
RMSE基于如下公式(二)确定:
MAPE基于如下公式(三)确定:
R2基于如下公式(四)确定:
上述评价指标可用于量化预测效果,并评估这些预测方法的准确性和能力。
表1-4比较了多种现有方法的实验预测结果,以进一步证明本发明在家庭电力消耗时间序列预测中的优越性。使用相同的评估指标,计算和比较预测每个家庭用电变量的不同方法的预测误差和拟合效果。不同的家庭结构有着不同的用电习惯,因此对预测方法的泛用性提出了挑战。
与本发明进行比较的方法包括传统的机器学习模型,包括决策树(Decision-Tree)、随机森林(Random-Forest)、多层感知机(MLP)和支持向量机回归(SVR),用于时间序列预测的先进方法LSTM神经网络和扩展的LSTM模型,包括嵌套的LSTM(NLSTM)。表格中还将本发明提出的方法与结合LSTM和数据处理方法(即经验小波变换(EWT)、经验模态分解(EMD)、变分模态分解(VMD)、平稳小波变换(SWT))的混合模型进行比较。EWT、EMD、VMD、SWT的实现目的是分解出原始时间序列的高频与低频部分,这四种方法的分解效果各有不用。但是结果表明,本发明所提出的方法预测效果更加精准,不存在时滞的问题,泛化能力和鲁棒性强。
表1本发明和比较方法的预测性能。(5分钟)
表2本发明和比较方法的预测性能。(10分钟)
表3本发明和比较方法的预测性能。(20分钟)
表4本发明和比较方法的预测性能。(30分钟)
图6展示了各个模型的预测准确率,用R2进行了评估。图7展示了基于单通道的SSA-PLSTM神经网络模型的家庭电力消耗时间序列预测方法的仿真结果,从上至下分别为家庭1在5、10、20、30分钟的预测结果。图中所示,所述SSA-LSTM输出作为本申请的预测结果,所述real data输出为真实值或预期值,其余结果为不同的比较方法。本申请的预测结果最接近于期望输出,比其他方法更准确,与表1-4中的结果相符。
首先,家庭电力消耗时间序列通过奇异谱分析分解为具有不同特征的子序列。原始的家庭电力消耗数据集包含许多频繁且剧烈的波动。如果不进行数据预处理,仅通过单一的深度学习模型无法很好地学习和预测这些波动。奇异谱分析(SSA)是一种在时间序列预测中成功实现的数据处理方法,擅长处理非线性非平稳数据。因此,为了更加准确的提取数据的特征,去除不必要的噪声,本发明使用奇异谱分析处理不稳定的原始数据,从而将不稳定的原始数据变得特征明显而更易于预测。
其次,将奇异谱分析分解得到的数据子序列输入一个单通道的PLSTM深度学习模型。该单通道PLSTM深度学习模型包含四个并行模块,每个模块对应一个特征子序列。该深度学习模型由四个平行的长短期记忆神经网络(PLSTM)层和四个全连接(dense)层组成。每个子序列在平行层输出后进行连接和融合,以并行学习和预测家庭电力消耗情况。
平行的长短期记忆神经网络(PLSTM)是一种最适合对奇异谱分析结果进行预测的LSTM模型,PLSTM模型能通过在历史数据中存储额外信息来提高预测性能。
PLSTM深度学习神经网络可以对提取出来的特征子序列进行批处理。另外LSTM的子元素结构使得模型可以很好的处理具有长期依赖的数据。这种结构总体上提高了原始LSTM神经网络结构的鲁棒性,并且可以提高最终的预测效果。因此,PLSTM在具有此类特征的长期时间序列预测的应用中更具优势。
本发明的基于单通道的奇异谱分析平行长短期记忆神经网络模型的家庭电力消耗时间序列预测方法,将经过奇异谱分析处理后的子序列分别并行地放入长短期记忆(LSTM)神经网络进行训练,集成的多个LSTM神经网络的PLSTM神经网络结构可以更准确的预测具有不同特征的子序列,从而大大提高了最终预测的准确性;所提出的发明优于现有的多种预测家庭电力消耗的模型,该深度学习模型预测了五个不同家庭在不同时间步长下的电力消耗状况,并在多种情景下的评价指标都优于多个单一模型和组合模型。可以有效的应用于资源节约和环境保护中对电力消耗数据的预测,并且能够有效解决目前电力消耗预测模型中存在的预测精度较低、泛化性差、预测滞后等问题。
由于电力消耗数据是在不断增加的,所以如何提高已经训练好的模型的适应能力也是本领域技术人员迫切需要解决的技术问题。在一些实施例中,可以在基于所述多个子序列确定训练集、验证集、测试集以及预留数据集;该预留数据集可以包括第一训练子集、第一验证子集以及第一测试子集;在具体实现时,可以周期性的确定周期内的电力消耗数据,将该周期内的电力消耗数据按照时间顺序记录的各个时段数据;对周期内的电力消耗数据进行预处理,并将预处理后的周期内的电力消耗数据通过奇异谱分析分成噪声含量不同的多个周期内的子序列,每个周期内的子序列长度与电力消耗数据的长度相同;基于周期内的多个子序列确定第二训练子集、第二验证子集以及第二测试子集;将上述第二训练子集、第二验证子集以及第二测试子集分别与第一训练子集、第一验证子集以及第一测试子集进行合并,得到新的数据集合,使用该新的数据集合对已经训练好的电力消耗预测模型进行优化。其中,数据的划分比例可以为82:5:13。在一些实施例中,还可以基于周期内的多个子序列确定第三训练子集、第三验证子集以及第三测试子集,基于该第三训练子集、第三验证子集以及第三测试子集更新预留数据集,其中,更新预留数据集的形式可以包括替换或者增加等等。例如,可以按照采集时间,替换掉采集时间较早的数据集。
图8位本发明实施例提供的一种电力消耗预测方法流程示意图。如图7所示,该方法包括:
S810,采集待预测用电主体的电力消耗数据,电力消耗数据为按照时间顺序记录的各个时段数据;
S820,对电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
其中,在本发明实施例提供,该步骤S810以及S820与前述方法中的S210和S220对应可以相关参照理解。该待预测用电主体可以为一个也可以为多个。
S830,基于训练好的电力消耗预测模型进行训练以及多个子序列,对于待预测用电主体的用电情况进行预测。
在本发明实施例中该训练好的电力消耗预测模型可以采用前述图2所示的实施例中训练得到的电力消耗预测模型,此处不再赘述。
本发明的基于单通道的奇异谱分析平行长短期记忆神经网络模型的家庭电力消耗时间序列预测方法,将经过奇异谱分析处理后的子序列分别并行地放入长短期记忆(LSTM)神经网络进行预测,集成的多个LSTM神经网络的PLSTM神经网络结构可以更准确的预测具有不同特征的子序列,从而大大提高了最终预测的准确性。
图9位本发明实施例提供的一种电力消耗预测模型训练装置结构示意图。该装置包括:
采集模块901,用于采集多个用电主体的电力消耗数据,电力消耗数据为按照时间顺序记录的各个时段数据;
分析模块902,用于对电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
确定模块903,用于基于多个子序列确定训练集、验证集以及测试集;
训练模块904,用于基于训练集、验证集以及测试集,对初始电力消耗预测模型进行训练,得到训练好的电力消耗预测模型进行训练。
在一些实施例中,确定模块903具体用于:
基于预设的滑动时间窗将多个子序列从单维的时间序列数据拓展成多维数据;
将多维数据划分为82%训练集、5%验证集和13%测试集。
在一些实施例中,电力消耗预测模型为单通道LSTM深度学习模型,单通道LSTM深度学习模型包括四个并行任务模块,每个任务模块对应一个子序列;
每个任务模块由一个LSTM神经网络层和一个全连接层组成;
电力消耗预测模型的损失函数为MSE,并以最小化平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE指标和最优化确定系数R2指标为目标进行设计和优化。
在一些实施例中,MAE基于如上公式(一)确定。
RMSE基于如上公式(二)确定。
MAPE基于如上公式(三)确定。
R2基于如上公式(四)确定。
在一些实施例中,分析模块902具体用于:对电力消耗数据放缩成平均值为0,标准差为1的预处理后的电力消耗数据。
图10位本发明实施例提供的一种电力消耗预测装置结构示意图。如图10所示,该装置包括:
采集模块1001,用于采集待预测用电主体的电力消耗数据,电力消耗数据为按照时间顺序记录的各个时段数据;
分析模块1002,用于对电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
预测模块1003,用于基于训练好的电力消耗预测模型进行训练以及多个子序列,对于待预测用电主体的用电情况进行预测。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
进一步的,本实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述前述方法实施例所提供的方法的步骤。
本发明实施例所提供的方法、装置及系统的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种电力消耗预测模型训练方法,其特征在于,包括:
采集多个用电主体的电力消耗数据,所述电力消耗数据为按照时间顺序记录的各个时段数据;
对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
基于所述多个子序列确定训练集、验证集以及测试集;
基于所述训练集、所述验证集以及所述测试集,对初始电力消耗预测模型进行训练,得到训练好的电力消耗预测模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述基于所述多个子序列确定训练集、验证集以及测试集,包括:
基于预设的滑动时间窗将所述多个子序列从单维的时间序列数据拓展成多维数据;
将所述多维数据划分为82%训练集、5%验证集和13%测试集。
3.根据权利要求1所述的方法,其特征在于,电力消耗预测模型为单通道LSTM深度学习模型,所述单通道LSTM深度学习模型包括四个并行任务模块,每个任务模块对应一个子序列;
每个所述任务模块由一个LSTM神经网络层和一个全连接层组成;
所述电力消耗预测模型的损失函数为MSE,并以最小化平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE指标和最优化确定系数R2指标为目标进行设计和优化。
5.根据权利要求1所述的方法,其特征在于,所述对所述电力消耗数据进行预处理,包括:
对所述电力消耗数据放缩成平均值为0,标准差为1的预处理后的电力消耗数据。
6.一种电力消耗预测方法,其特征在于,包括:
采集待预测用电主体的电力消耗数据,所述电力消耗数据为按照时间顺序记录的各个时段数据;
对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
基于训练好的电力消耗预测模型进行训练以及多个子序列,对于所述待预测用电主体的用电情况进行预测。
7.一种电力消耗预测模型训练装置,其特征在于,包括:
采集模块,用于采集多个用电主体的电力消耗数据,所述电力消耗数据为按照时间顺序记录的各个时段数据;
分析模块,用于对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
确定模块,用于基于所述多个子序列确定训练集、验证集以及测试集;
训练模块,用于基于所述训练集、所述验证集以及所述测试集,对初始电力消耗预测模型进行训练,得到训练好的电力消耗预测模型进行训练。
8.一种电力消耗预测装置,其特征在于,包括:
采集模块,用于采集待预测用电主体的电力消耗数据,所述电力消耗数据为按照时间顺序记录的各个时段数据;
分析模块,用于对所述电力消耗数据进行预处理,并将预处理后的电力消耗数据通过奇异谱分析分成噪声含量不同的多个子序列,每个子序列长度与电力消耗数据的长度相同;
预测模块,用于基于训练好的电力消耗预测模型进行训练以及多个子序列,对于所述待预测用电主体的用电情况进行预测。
9.一种电子设备,其特征在于,包括:处理装置以及存储装置;
所述存储装置上存储有计算机程序,所述计算机程序在被所述处理器运行时执行如权利要求1至6任一项所述的方法,以用于相机标定和/或电力消耗预测模型训练。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至6任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111173854.6A CN113807605A (zh) | 2021-10-09 | 2021-10-09 | 电力消耗预测模型训练方法、预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111173854.6A CN113807605A (zh) | 2021-10-09 | 2021-10-09 | 电力消耗预测模型训练方法、预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113807605A true CN113807605A (zh) | 2021-12-17 |
Family
ID=78897407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111173854.6A Pending CN113807605A (zh) | 2021-10-09 | 2021-10-09 | 电力消耗预测模型训练方法、预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113807605A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114742369A (zh) * | 2022-03-21 | 2022-07-12 | 电子科技大学 | 掺杂钴酸锂材料的循环性能的评估方法、系统以及计算机设备 |
-
2021
- 2021-10-09 CN CN202111173854.6A patent/CN113807605A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114742369A (zh) * | 2022-03-21 | 2022-07-12 | 电子科技大学 | 掺杂钴酸锂材料的循环性能的评估方法、系统以及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Theory-guided deep-learning for electrical load forecasting (TgDLF) via ensemble long short-term memory | |
Ma et al. | A hybrid attention-based deep learning approach for wind power prediction | |
Fan et al. | Development of prediction models for next-day building energy consumption and peak power demand using data mining techniques | |
Li et al. | A wind power forecasting method based on optimized decomposition prediction and error correction | |
CN110570030A (zh) | 基于深度学习的风电集群功率区间预测的方法及系统 | |
Amalou et al. | Multivariate time series prediction by RNN architectures for energy consumption forecasting | |
Shao et al. | Hybrid model for short-term wind power forecasting based on singular spectrum analysis and a temporal convolutional attention network with an adaptive receptive field | |
CN116644970A (zh) | 一种基于vmd分解和叠层深度学习的光伏功率预测方法 | |
CN114022311A (zh) | 基于时序条件生成对抗网络的综合能源系统数据补偿方法 | |
CN115238854A (zh) | 一种基于tcn-lstm-am的短期负荷预测方法 | |
Wang et al. | Ensemble probabilistic wind power forecasting with multi-scale features | |
CN113807605A (zh) | 电力消耗预测模型训练方法、预测方法及装置 | |
Wang et al. | High and low frequency wind power prediction based on Transformer and BiGRU-Attention | |
Zheng et al. | A temporal convolutional recurrent autoencoder based framework for compressing time series data | |
CN116338322A (zh) | 一种电网线路阻抗预测方法及系统 | |
Shi et al. | WGformer: A Weibull-Gaussian Informer based model for wind speed prediction | |
Li et al. | Comparison and application potential analysis of autoencoder-based electricity pattern mining algorithms for large-scale demand response | |
CN114154684A (zh) | 基于数据挖掘和多核支持向量机的短期光伏功率预测方法 | |
Liang et al. | Synthesis of realistic load data: adversarial networks for learning and generating residential load patterns | |
CN112529268A (zh) | 一种基于流形学习的中短期负荷预测方法及装置 | |
Kavakci et al. | Time Series Prediction of Solar Power Generation Using Trend Decomposition | |
Susai | Analyzing Energy Efficiency in Neural Networks | |
Liu et al. | A chaotic time series combined prediction model for improving trend lagging | |
Cao et al. | A STAM-LSTM model for wind power prediction with feature selection | |
Ouyang et al. | Constructing Spatial Relationship and Temporal Relationship Oriented Composite Fuzzy Cognitive Maps for Multivariate Time Series Forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |