CN115130788B - 基于大数据分析的用电预测系统 - Google Patents

基于大数据分析的用电预测系统 Download PDF

Info

Publication number
CN115130788B
CN115130788B CN202211038578.7A CN202211038578A CN115130788B CN 115130788 B CN115130788 B CN 115130788B CN 202211038578 A CN202211038578 A CN 202211038578A CN 115130788 B CN115130788 B CN 115130788B
Authority
CN
China
Prior art keywords
data
piece
electricity
data set
power utilization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211038578.7A
Other languages
English (en)
Other versions
CN115130788A (zh
Inventor
郭宏
王延青
薛文明
吴睿
张平丽
戴中臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Haoyue Electronic Technology Co ltd
Original Assignee
Jiangsu Haoyue Electronic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Haoyue Electronic Technology Co ltd filed Critical Jiangsu Haoyue Electronic Technology Co ltd
Priority to CN202211038578.7A priority Critical patent/CN115130788B/zh
Publication of CN115130788A publication Critical patent/CN115130788A/zh
Application granted granted Critical
Publication of CN115130788B publication Critical patent/CN115130788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Power Engineering (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及数据处理领域,具体涉及基于大数据分析的用电预测系统,该系统包括:获取用电数据及数据集,获取用电数据的特征向量,根据用电数据的特征向量之间的相似度计算每个数据集的筛选概率,根据筛选概率与概率阈值确定最终数据集,根据最终数据集中的用点数据构建约束损失函数,根据约束损失函数、均方差损失函数及最终数据集获取综合损失函数,根据综合损失函数构建神经网络,根据所有数据集对神经网络训练,根据当前段用电数据利用训练好的神经网络进行用电数据预测得到用电预测数据,本发明的系统能提高神经网络的训练精度,进而保证神经网络的预测出准确的用电数据,进而为后续用电调度及监控提供参考。

Description

基于大数据分析的用电预测系统
技术领域
本发明涉及数据处理技术领域,具体涉及基于大数据分析的用电预测系统。
背景技术
随着社会经济的发展、城镇化程度的推进和人民生活水平的挺高,电能使用量也随之提高,为了更好地进行用电管理,需对用电量进行分析,发现其中的规律,预测出未来的用电量,便于更好的用电调度和异常监控。
现有技术利用各用电设备的用历史用电量序列训练神经网络来实现个用电器材的用电量的估计,即以一段用电量序列作为训练数据,以其下一时刻的实际用电量作为预测用电量的验证数据,来完成网络训练。但是由于会存在前后两个时刻用电量发生改变,造成利用前一时刻的数据来预测下一时刻数据时,下一时刻的数据作为验证数据会存在标签噪声,当验证数据中包含噪声时,就会造成通过该训练数据和验证数据训练出的神经网络不够准确,然而去除噪声数据后,则又会影响训数据集量,进而也会导致训练出的神经网络不够准确,即利用训练好的神经网络预测的下一时刻的预测用电量并不准确,从而影响后续用电的调度和监控。
因此,需要提供一种基于大数据分析的用电预测系统,予以解决上述问题。
发明内容
本发明提供基于大数据分析的用电预测系统,以解决现有的问题。
本发明的基于大数据分析的用电预测系统采用如下技术方案:该系统包括:
数据采集模块,用于获取用电数据并对其进行分段,将相邻段用电数据的前一段数据作为输入数据、后一段数据作为验证数据,将相邻段用电数据的验证数据和输入数据作为一个数据集;
特征提取模块,用于获取每段用电数据对应的各设备用电数据的频谱数据,根据每段用电数据的频谱数据、每段用电数据与其对应的各设备用电数据的相关性获取每段用电数据的特征及特征向量;
数据集筛选模块,用于获取数据集中两段用电数据的特征向量之间的相似度并记为噪声描述值,根据噪声描述值及每两段相邻输入数据的特征向量之间的相似度计算数据集的筛选概率,根据筛选概率与概率阈值确定噪声小的最终数据集;
函数构建模块,用于将最终数据集中每段用电数据划分为若干段子数据段,根据子数据段的用电数据获取每段用电数据的极差,将极差作为该段用电数据的区间宽度值,根据所有最终数据集中的每段用电数据对应的区间宽度值构建约束损失函数;
综合函数构建模块,用于根据每个数据集中用电数据获取均方差损失函数,根据约束损失函数、均方差损失函数及最终数据集对应的噪声描述值获取综合损失函数;
网络预测模块,用于根据综合损失函数构建神经网络,根据所有的数据集对神经网络进行训练,根据当前段用电数据利用训练好的神经网络进行用电数据预测得到用电预测数据。
进一步的,对用电数据进行分段,包括:
以一天作为一个用电周期;
根据用电周期对用电数据进行分段得到多段用电数据,即每段用电数据为一个用电周期对应的用电数据。
进一步的,获取每段用电数据对应的各设备用电数据的频谱数据,包括:
获取每段用电数据中各个设备的设备用电数据;
对各设备用电数据进行傅里叶变换得到各设备用电数据的频谱数据。
进一步的,根据每段用电数据的频谱数据、每段用电数据与其对应的各设备用电数据的相关性获取每段用电数据的特征及特征向量,包括:
根据每段用电数据对应的各设备用电数据的频谱数据获取频谱数据的频率的均值及方差,将频率的均值及方差作为各设备用电数据的特征;
根据每段用电数据与其对应的各设备用电数据之间的相关性获取各设备用电数据的相关系数;
根据各设备用电数据的特征及各设备用电数据的相关系数构建每段用电数据的特征向量。
进一步的,根据噪声描述值及每两段相邻输入数据的特征向量之间的相似度计算数据集的筛选概率,包括:
获取数据集中两段用电数据的特征向量之间的第一余弦相似度,第一余弦相似度即为噪声描述值;
获取该数据集中输入数据与相邻数据集中输入数据之间的第二余弦相似度;
将噪声描述值与第二余弦相似度的乘积记为该数据集的筛选概率。
进一步的,根据所有最终数据集中的每段用电数据对应的区间宽度值构建约束损失函数,包括:
将下式(1)作为约束损失函数:
Figure DEST_PATH_IMAGE001
(1)
其中,
Figure DEST_PATH_IMAGE002
表示第
Figure DEST_PATH_IMAGE003
个最终数据集中输入数据的第
Figure DEST_PATH_IMAGE004
个子数据段的参考权重;
Figure DEST_PATH_IMAGE005
表示第
Figure 467297DEST_PATH_IMAGE003
个最终数据集中验证数据的第
Figure 40229DEST_PATH_IMAGE004
个子数据段的取值宽度;
Figure DEST_PATH_IMAGE006
表示第
Figure 288808DEST_PATH_IMAGE003
个最终数据集中输入数据输入网络时对应的输出数据的第
Figure 605389DEST_PATH_IMAGE004
个子数据段的取值宽度;
Figure DEST_PATH_IMAGE007
表示所有最终数据集的输入数据的个数,
Figure DEST_PATH_IMAGE008
表示验证数据划分为子数据段的段个数;
Figure DEST_PATH_IMAGE009
表示约束损失函数。
进一步的,计算最终数据集中输入数据的子数据段与验证数据对应的子数据段之间的余弦相似度,将该余弦相似度作为该数据集的输入数据的子数据段的参考权重。
进一步的,根据约束损失函数、均方差损失函数及最终数据集对应的噪声描述值获取综合损失函数,包括:
将下式(2)作为综合损失函数:
Figure DEST_PATH_IMAGE010
(2)
其中,
Figure DEST_PATH_IMAGE011
表示第
Figure 934608DEST_PATH_IMAGE003
个最终数据集中输入数据对应的噪声描述值,
Figure DEST_PATH_IMAGE012
表示均方差损失函数;
Figure 350546DEST_PATH_IMAGE009
表示约束损失函数,
Figure DEST_PATH_IMAGE013
表示第
Figure 86421DEST_PATH_IMAGE003
个最终数据集对应的综合损失函数。
本发明的有益效果是:本发明的基于大数据分析的用电预测系统,通过对训练神经网络的数据集进行分析得到各数据集的噪声情况,并挑选出噪声小的最终数据集,实现了对数据集进行降噪处理,提高利用数据集训练神经网络时的精度,根据最终数据集中的用电数据特征构建约束损失函数来辅助监督网络训练,根据标签噪声的噪声描述值并结合约束损失函数、均方差损失函数得到最终损失函数,该过程实现了利用数据集中的噪声数据和其他数据共同构建最终损失函数,充分利用了数据集,然后利用最终损失函数构建得到一个准确的神经网络,根据所有数据集对神经网进行训练,根据训练好的神经网络实现对用电量的准确预测,因此,该系统不仅充分利用所有的数据集同时还能避免数据噪声的干扰,保证预测的用电数据的准确性,进而为后续用电进行监控和调度提供参考。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于大数据分析的用电预测系统的实施例总体步骤的流程图;
图2为本发明的基于大数据分析的用电预测系统S2中获取每段用电数据的特征及特征向量的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的基于大数据分析的用电预测系统的实施例,如图1所示,该系统包括:数据采集模块、特征提取模块、数据集筛选模块、函数构建模块、综合函数构建模块及网络预测模块,其中,数据采集模块用于获取用电数据并对其进行分段,将相邻段用电数据的前一段数据作为输入数据、后一段数据作为验证数据,将相邻段用电数据的验证数据和输入数据作为一个数据集;特征提取模块用于获取每段用电数据对应的各设备用电数据的频谱数据,根据每段用电数据的频谱数据、每段用电数据与其对应的各设备用电数据的相关性获取每段用电数据的特征及特征向量;数据集筛选模块用于获取数据集中两段用电数据的特征向量之间的相似度并记为噪声描述值,根据噪声描述值及每两段相邻输入数据的特征向量之间的相似度计算数据集的筛选概率,根据筛选概率与概率阈值确定噪声小的最终数据集;函数构建模块用于将最终数据集中每段用电数据划分为若干段子数据段,根据子数据段的用电数据获取每段用电数据的极差,将极差作为该段用电数据的区间宽度值,根据所有最终数据集中的每段用电数据对应的区间宽度值构建约束损失函数;综合函数构建模块用于根据每个数据集中用电数据获取均方差损失函数,根据约束损失函数、均方差损失函数及最终数据集对应的噪声描述值获取综合损失函数;网络预测模块用于根据综合损失函数构建神经网络,根据所有的数据集对神经网络进行训练,根据当前段用电数据利用训练好的神经网络进行用电数据预测得到用电预测数据。
S1、数据采集模块用于获取用电数据并对其进行分段,将相邻段用电数据的前一段数据作为输入数据、后一段数据作为验证数据,将相邻段用电数据的验证数据和输入数据作为一个数据集。
具体的,获取园区总电路的电表数据中用电数据序列,并将该用电数据序列共享到至云空间中,在各用电设备的用电支路上的空气开关处放置电量采集仪器,并将该仪器采集到各用电设备的用电数据共享到云空间上,通过下载云空间数据来获取园区内的用电数据,用电数据即为用电量;以一天作为一个用电周期;根据用电周期对用电数据进行分段得到多段用电数据,即每段用电数据为一个用电周期对应的用电数据,每个相邻段用电数据的验证数据和输入数据作为一个数据集得到多个数据集,例如,采集了3月份的用电数据,将用电数据以天为单位划分成若干个数据段,即{3.1号用电数据段,3.2用电数据段,…,3.31用电数据段},将相邻的两个用电数据段中前一时段的用电数据段作为输入数据,将后一时段的用电数据段作为验证数据,即3.1号用电数据段作为神经网络训练时的输入数据,3.2号用电序列数据段作为神经网络训练时的验证数据,且3.1号用电数据段和3.2号用电序列数据段作为训练网络的一个数据集,3.2号用电数据段作为神经网络训练时的输入数据时,则3.3号用电数据段作为神经网络训练时的验证数据,并将3.2号用电数据段和3.3号用电数据段作为训练网络的另一个数据集,依此类推就构建出训练网络的多个数据集。
S2、特征提取模块用于获取每段用电数据对应的各设备用电数据的频谱数据,根据每段用电数据的频谱数据、每段用电数据与其对应的各设备用电数据的相关性获取每段用电数据的特征及特征向量。
具体的,如图2所示,S21、获取每段用电数据中各个设备的设备用电数据;S22、对各设备用电数据进行傅里叶变换得到各设备用电数据的频谱数据;S23、根据每段用电数据对应的各设备用电数据的频谱数据获取频谱数据的频率的均值及方差,其中,频率的均值及方差用来描述各设备用电数据的特征;S24、根据每段用电数据与其对应的各设备用电数据的之间的相关性获取各设备用电数据的相关系数;S25、根据各设备用电数据的特征及各设备用电数据的相关系数构建每段用电数据的特征向量。
S3、数据集筛选模块用于获取数据集中两段用电数据的特征向量之间的相似度并记为噪声描述值,根据噪声描述值及每两段相邻输入数据的特征向量之间的相似度计算数据集的筛选概率,根据筛选概率与概率阈值确定噪声小的最终数据集。
具体的,分析各个数据集中输入数据和验证数据的用电量的相似性,只有输入数据和验证数据的用电量相似时说明验证数据中的噪声较小,则将该数据集作为神经网络的数据集,利用噪声较小数据集对神经网络训练,则训练好的神经网络的预测的用电数据的准确性才能更高,反之,则说明数据集中的验证数据的噪声较大,神经网络的预测的用电数据的准确性较小,故先获取数据集中两段用电数据的特征向量之间的第一余弦相似度,第一余弦相似度即为噪声描述值;获取该数据集中输入数据与相邻数据集中输入数据之间的余弦相似度;为了提高神经网络训练结果的准确性,需降低数据集中标签噪声的干扰,故将噪声描述值与第二余弦相似度的乘积记为该数据集的筛选概率,设定筛选概率的概率阈值为0.8,则筛选概率大于0.8对应的数据集即为最终数据集。
需要说明的是,由于S1步骤中说明相邻段用电数据的前一段数据作为输入数据、后一段数据作为验证数据,将相邻段用电数据的验证数据和输入数据作为一个数据集数据,故数据集中两段用电数据的特征向量之间的第一余弦相似度即表示了输入数据与验证数据的特征向量之间的相似度,当相似度越大时,说明输入数据和验证数据之间的用电量相近,即说明相邻两段用电数据之间的用电量相近,即预测准确性高,
因此,本实施例利用筛选模块主要是为了筛选出数据集中的噪声小的数据集,即找出来电行为相近的输入数据和标签数据,即找出数据集中标签数据的噪声小数据集。
S4、函数构建模块将最终数据集中每段用电数据划分为若干段子数据段,根据子数据段的用电数据获取每段用电数据的极差,将极差作为该段用电数据的区间宽度值,根据所有最终数据集中的每段用电数据对应的区间宽度值构建约束损失函数。
具体的,为了防止噪声造成预测偏差较大,可以利用最终数据集中的标签数据确定最终数据集中各数据片段的约束区间范围,即分别将每个最终数据集中的输入数据和验证数据进行分段,其中,由于输入数据为一个用电周期的用电数据,故分段原则为设定时间段,如10分钟为一个时间段,将每个最终数据集中的输入数据和验证数据分别划分为多个10分钟的时间段。
其中,利用筛选模块主要是为了筛选出数据集中的噪声小的数据集,即最终数据集,然后利用最终数据集对数据集中与最终数据集中的相似的数据集进行网络损失约束,以得到约束损失函数,即根据子数据段的用电数据获取每段用电数据的极差,将极差作为该段用电数据的区间宽度值,根据所有最终数据集中的每段用电数据对应的区间宽度值构建约束损失函数,具体的,将下式(1)作为约束损失函数:
Figure DEST_PATH_IMAGE014
(1)
其中,
Figure 878796DEST_PATH_IMAGE002
表示第
Figure 78833DEST_PATH_IMAGE003
个最终数据集中输入数据的第
Figure 993569DEST_PATH_IMAGE004
个子数据段的参考权重,参考权重越大,则说明各最终数据集中验证数据的第q个子数据段对该最终数据集的第j个输入数据第q个子数据段的参考程度越大,各最终数据集中验证数据的第q个子数据段的区间宽度值与该最终数据集的第j个输入数据第q个子数据段的区间宽度值相近;
Figure DEST_PATH_IMAGE015
表示第
Figure 951160DEST_PATH_IMAGE003
个最终数据集中验证数据的第
Figure 609544DEST_PATH_IMAGE004
个子数据段的取值宽度;
Figure 805033DEST_PATH_IMAGE006
表示第
Figure 31615DEST_PATH_IMAGE003
个最终数据集中输入数据输入网络时对应的输出数据的第
Figure 194612DEST_PATH_IMAGE004
个子数据段的取值宽度;
Figure 141839DEST_PATH_IMAGE007
表示所有最终数据集的输入数据的个数,
Figure 316468DEST_PATH_IMAGE008
表示验证数据的划分为子数据段的个数;
Figure 573006DEST_PATH_IMAGE009
表示约束损失函数,其中,计算最终数据集中输入数据的子数据段与验证数据对应的子数据段之间的余弦相似度,将该余弦相似度作为该数据集的输入数据的子数据段的参考权重;
需要说明的是,本实施例为了便于理解,以第j个最终数据集中的标签数据的第q个片段说明,先获取第j个最终数据集中的标签数据的第q个片段,计算第j个最终数据集中的输入数据的第q个片段与第j个最终数据集中的标签数据的第q个片段之间的余弦相似度,以该余弦相似度作为第j个最终数据集中输入数据的第q个子数据段的参考权重,类比该方式得到各最终数据集中输入数据的各片段的参考权重。
S5、综合函数构建模块用于根据每个数据集中用电数据获取均方差损失函数,根据约束损失函数、均方差损失函数及最终数据集对应的噪声描述值获取综合损失函数。
具体的,将下式(2)作为综合损失函数:
Figure DEST_PATH_IMAGE016
(2)
其中,
Figure 918841DEST_PATH_IMAGE011
表示第
Figure DEST_PATH_IMAGE017
个最终数据集中输入数据对应的噪声描述值,
Figure 466497DEST_PATH_IMAGE012
表示均方差损失函数;
Figure 620266DEST_PATH_IMAGE009
表示约束损失函数,
Figure 188651DEST_PATH_IMAGE013
表示第
Figure 811393DEST_PATH_IMAGE003
个最终数据集对应的综合损失函数;
需要说明的是,当数据集的原有标签数据的噪声较小时,该用数据集的原有标签信息值是值得信任,因而,对于该数据集的均方差损失函数的权重占比较大,则对于约束损失函数的权重占比较小,反之,数据集的原有标签信息值不值得信任时,则对于该数据集的均方差损失函数的权重占比较小,对于约束损失函数权重占比较大。
S6、利用网络预测模块先根据综合损失函数构建神经网络,根据所有的数据集对神经网络进行训练,其中,将所有数据集中的输入数据作为神经网络的输入,所有数据集中的验证数据作为神经网络的输出对神经网络进行训练,根据当前段用电数据利用训练好的神经网络进行用电数据预测得到用电预测数据。
具体的,神经网络为DNN网络,该神经网络为Encoder-Decoder网络,其中,将所有数据集中的输入数据作为神经网络的输入,所有数据集中的验证数据作为神经网络的输出对神经网络进行训练得到训练好的神经网络,然后将当前段用电数据输入训练好的神经网络进行用电数据预测得到用电预测数据,进而为后续用电的调度和监控提供参考。
综上所述,本发明提供基于大数据分析的用电预测系统,通过对训练神经网络的数据集进行分析得到各数据集的噪声情况,并挑选出噪声小的最终数据集,实现了对数据集进行降噪处理,提高利用数据集训练神经网络时的精度,根据最终数据集中的用电数据特征构建约束损失函数来辅助监督网络训练,根据标签噪声的噪声描述值并结合约束损失函数、均方差损失函数得到最终损失函数,该过程实现了利用数据集中的噪声数据和其他数据共同构建最终损失函数,充分利用了数据集,然后利用最终损失函数构建得到一个准确的神经网络,根据所有数据集对神经网进行训练,根据训练好的神经网络实现对用电量的准确预测,因此,该系统不仅充分利用所有的数据集同时还能避免数据噪声的干扰,保证预测的用电数据的准确性,进而为后续用电进行监控和调度提供参考。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.基于大数据分析的用电预测系统,其特征在于,该系统包括:
数据采集模块,用于获取用电数据并对其进行分段,将相邻段用电数据的前一段数据作为输入数据、后一段数据作为验证数据,将相邻段用电数据的验证数据和输入数据作为一个数据集,对用电数据进行分段,包括:以一天作为一个用电周期;根据用电周期对用电数据进行分段得到多段用电数据,即每段用电数据为一个用电周期对应的用电数据;
特征提取模块,用于获取每段用电数据对应的各设备用电数据的频谱数据,根据每段用电数据的频谱数据、每段用电数据与其对应的各设备用电数据的相关性获取每段用电数据的特征及特征向量;
数据集筛选模块,用于获取数据集中两段用电数据的特征向量之间的相似度并记为噪声描述值,根据噪声描述值及每两段相邻输入数据的特征向量之间的相似度计算数据集的筛选概率,根据筛选概率与概率阈值确定噪声小的最终数据集,计算数据集的筛选概率包括:获取数据集中两段用电数据的特征向量之间的第一余弦相似度,第一余弦相似度即为噪声描述值;获取该数据集中输入数据与相邻数据集中输入数据之间的第二余弦相似度;将噪声描述值与第二余弦相似度的乘积记为该数据集的筛选概率;
函数构建模块,用于将最终数据集中每段用电数据划分为若干段子数据段,根据子数据段的用电数据获取每段用电数据的极差,将极差作为该段用电数据的区间宽度值,根据所有最终数据集中的每段用电数据对应的区间宽度值构建约束损失函数,将下式(1)作为约束损失函数:
Figure 448162DEST_PATH_IMAGE001
(1)
其中,
Figure 896461DEST_PATH_IMAGE002
表示第
Figure 82723DEST_PATH_IMAGE003
个最终数据集中输入数据的第
Figure 274670DEST_PATH_IMAGE004
个子数据段的参考权重;
Figure 243370DEST_PATH_IMAGE005
表示第
Figure 596990DEST_PATH_IMAGE003
个最终数据集中验证数据的第
Figure 270548DEST_PATH_IMAGE004
个子数据段的取值宽度;
Figure 607DEST_PATH_IMAGE006
表示第
Figure 325278DEST_PATH_IMAGE003
个最终数据集中输入 数据输入网络时对应的输出数据的第
Figure 849800DEST_PATH_IMAGE004
个子数据段的取值宽度;
Figure 10654DEST_PATH_IMAGE007
表示所有最终数据集的 输入数据的个数,
Figure 170502DEST_PATH_IMAGE008
表示验证数据划分为子数据段的段个数;
Figure 490625DEST_PATH_IMAGE009
表示约束损失函数;
综合函数构建模块,用于根据每个数据集中用电数据获取均方差损失函数,根据约束损失函数、均方差损失函数及最终数据集对应的噪声描述值获取综合损失函数,将下式(2)作为综合损失函数:
Figure 326994DEST_PATH_IMAGE010
(2)
其中,
Figure 489991DEST_PATH_IMAGE011
表示第
Figure 296273DEST_PATH_IMAGE003
个最终数据集中输入数据对应的噪声描述值,
Figure 346269DEST_PATH_IMAGE012
表示均方差损失函数;
Figure 372780DEST_PATH_IMAGE009
表示约束损失函数,
Figure 367281DEST_PATH_IMAGE013
表示第
Figure 977254DEST_PATH_IMAGE003
个最终数据集对应的综合损失函数;
网络预测模块,用于根据综合损失函数构建神经网络,根据所有的数据集对神经网络进行训练,根据当前段用电数据利用训练好的神经网络进行用电数据预测得到用电预测数据。
2.根据权利要求1所述的基于大数据分析的用电预测系统,其特征在于,获取每段用电数据对应的各设备用电数据的频谱数据,包括:
获取每段用电数据中各个设备的设备用电数据;
对各设备用电数据进行傅里叶变换得到各设备用电数据的频谱数据。
3.根据权利要求1所述的基于大数据分析的用电预测系统,其特征在于,根据每段用电数据的频谱数据、每段用电数据与其对应的各设备用电数据的相关性获取每段用电数据的特征及特征向量,包括:
根据每段用电数据对应的各设备用电数据的频谱数据获取频谱数据的频率的均值及方差,将频率的均值及方差作为各设备用电数据的特征;
根据每段用电数据与其对应的各设备用电数据之间的相关性获取各设备用电数据的相关系数;
根据各设备用电数据的特征及各设备用电数据的相关系数构建每段用电数据的特征向量。
4.根据权利要求1所述的基于大数据分析的用电预测系统,其特征在于,计算最终数据集中输入数据的子数据段与验证数据对应的子数据段之间的余弦相似度,将该余弦相似度作为该数据集的输入数据的子数据段的参考权重。
CN202211038578.7A 2022-08-29 2022-08-29 基于大数据分析的用电预测系统 Active CN115130788B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211038578.7A CN115130788B (zh) 2022-08-29 2022-08-29 基于大数据分析的用电预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211038578.7A CN115130788B (zh) 2022-08-29 2022-08-29 基于大数据分析的用电预测系统

Publications (2)

Publication Number Publication Date
CN115130788A CN115130788A (zh) 2022-09-30
CN115130788B true CN115130788B (zh) 2022-11-22

Family

ID=83387151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211038578.7A Active CN115130788B (zh) 2022-08-29 2022-08-29 基于大数据分析的用电预测系统

Country Status (1)

Country Link
CN (1) CN115130788B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117576829B (zh) * 2024-01-15 2024-03-29 贵州诺派赛玛智能科技有限公司 一种城市供水收费服务交互结算系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180033466A (ko) * 2015-05-29 2018-04-03 워터스 테크놀로지스 코포레이션 질량 스펙트럼 데이터의 프로세싱을 위한 기법
CN108573323B (zh) * 2018-03-19 2020-10-16 国网浙江省电力有限公司嘉兴供电公司 能源互联网用户用电量预测方法、系统、设备及存储介质
CN108510006B (zh) * 2018-04-08 2020-06-09 重庆邮电大学 一种基于数据挖掘的企业用电量分析与预测方法
CN111275571B (zh) * 2020-01-14 2020-12-11 河海大学 考虑微气象与用户模式的居民负荷概率预测深度学习方法
CN113284001B (zh) * 2021-04-08 2023-01-20 南方电网数字电网研究院有限公司 用电量预测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN115130788A (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
CN110610280B (zh) 一种电力负荷短期预测方法、模型、装置及系统
Yang et al. Probabilistic short-term wind power forecast using componential sparse Bayesian learning
CN113554466B (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN111680841B (zh) 基于主成分分析的短期负荷预测方法、系统及终端设备
CN103747477A (zh) 网络流量分析与预测方法和装置
CN103268519A (zh) 基于改进Lyapunov指数的电力系统短期负荷预测方法及装置
CN115130788B (zh) 基于大数据分析的用电预测系统
CN105373855A (zh) 一种用于特殊天气和特殊日期的电力系统日负荷预测方法
El Bakali et al. Data-Based Solar Radiation Forecasting with Pre-Processing Using Variational Mode Decomposition
CN116470491A (zh) 基于copula函数的光伏功率概率预测方法及系统
Brusokas et al. HeatFlex: Machine learning based data-driven flexibility prediction for individual heat pumps
CN115374908A (zh) 适用于配网柔性互联实时控制的短期负荷预测方法和系统
CN114492923A (zh) 一种长时间尺度功率预测方法
CN111091223A (zh) 一种基于物联网智能感知技术的配变短期负荷预测方法
CN117713083A (zh) 一种基于数据管理平台的电力系统短期电力负荷预测系统及方法
Li et al. The research of urban rail transit sectional passenger flow prediction method
Maalej et al. Sensor data augmentation strategy for load forecasting in smart grid context
CN115730740A (zh) 一种台区级电力短期负荷预测方法及系统
CN115169731A (zh) 一种智慧校园能耗预测方法、装置、设备及介质
CN115222018A (zh) 非侵入式负荷分解方法及装置
CN115018212A (zh) 发电用水量预测分析方法、系统及云平台
CN111368257B (zh) 煤改电负荷特性的分析预测方法及装置
Mougeot et al. Forecasting intra day load curves using sparse functional regression
Dai et al. Research on CNN-BiLSTM Power Load Forecasting Based on VMD Algorithm
Jiang GMM Clustering Based on WOA Optimization and Space‐Time Coupled Urban Rail Traffic Flow Prediction by CEEMD‐SE‐BiGRU‐AM

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant