CN114202231A - 日用电数据缺失的补全方法、装置、电子设备及存储介质 - Google Patents
日用电数据缺失的补全方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114202231A CN114202231A CN202111570276.XA CN202111570276A CN114202231A CN 114202231 A CN114202231 A CN 114202231A CN 202111570276 A CN202111570276 A CN 202111570276A CN 114202231 A CN114202231 A CN 114202231A
- Authority
- CN
- China
- Prior art keywords
- time period
- data
- electricity
- consumption data
- hour
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/82—Energy audits or management systems therefor
Abstract
本申请提供一种日用电数据缺失的补全方法、装置、电子设备及存储介质。包括:获取预设时间段内的离线用电数据;根据离线用电数据对应的时间点对预设时间段进行分段,获得至少一个子时间段;根据子时间段对应的离线用电数据获得子时间段内平均每小时的平均用电数据;获取小时时间段对应的历史用电数据;将平均用电数据和历史用电数据输入预先训练好的数据补全模型,获得数据补全模型输出的每个小时时间段的用电数据;根据每个小时时间段的用电数据确定补全的数据。本申请通过近似日回归算法构建的数据补全模型对缺失用电数据进行补全,实现对每小时用电数据的实时监测,提高对缺失用电数据补全的精度。
Description
技术领域
本申请涉及电力数据处理技术领域,具体而言,涉及一种日用电数据缺失的补全方法、装置、电子设备及存储介质。
背景技术
目前,电表和能源管理平台通过智能网关连接,因为智能网关的网络条件不稳定、线路施工复杂、机房停电等等情况,对电表的采集成功率普遍在90%左右,存在对部分电表数据漏采或少采的情况。
随着社会的发展和科技的创新,用电数据尤其是日电数据对电力企业及其它行业的重要性也日益提高。现阶段通过离线人工抄表的方式将日用电量补全到能源管理平台中,但因为人工抄表的客观原因,一天只会对离线的设备抄1次或几次数据,然后将抄回来的日电量按小时简单平均之后得到每小时的用电数据。该方法只是补全了缺失的用电数据,但得到的用电数据并不准确,无法满足企业对于每个时刻用电量精准监测的需求。
发明内容
本申请实施例的目的在于提供一种日用电数据缺失的补全方法、装置、电子设备及存储介质,用以解决现有技术中对缺失用电数据进行补全时准确性较低的技术问题。
第一方面,本申请实施例提供一种日用电数据缺失的补全方法,包括:
获取预设时间段内的离线用电数据;
根据所述离线用电数据对应的时间点对所述预设时间段进行分段,获得至少一个子时间段;其中,每个所述子时间段包括至少一个小时时间段;
根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据;
获取所述小时时间段对应的历史用电数据;其中,所述历史用电数据包括所述小时时间段对应的前一天的用电数据、所述小时时间段对应的前一月的用电数据、所述小时时间段对应的前一年的用电数据、所述小时时间段的前一小时时间段的用电数据和所述小时时间段之前的历史平均用电数据;
将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据;其中,所述数据补全模型为通过近似日回归算法构建获得;
根据每个所述小时时间段的用电数据确定补全的用电数据。
本申请实施例中,通过近似日回归算法构建的数据补全模型计算每个子时间段的每个小时时间段的用电数据,完成对缺失用电数据的补全,提高了对缺失用电数据补全的精度和质量,可以实现对每小时用电数据的实时监测,减少实际用电数据和补全的用电数据之间的差距。
进一步地,所述根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据,包括:
获取所述子时间段中起始时间点对应的第一起始用电数据和结束时间点对应的第一结束用电数据;
根据所述第一起始用电数据、所述第一结束用电数据和所述子时间段的时间间隔计算所述子时间段内平均每小时的平均用电数据。
本申请实施例中,对一天采集到的离线用电数据进行分段,计算每一个子时间段内每个小时的平均用电数据,对后续预测每小时的具体用电数据提供真实可靠的数据基础。
进一步地,所述将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据,包括:
根据Q=α*Qd+β*Qm+γ*Qy+δ*Qh+ε*Qavg+μ*Qg计算所述每个所述小时时间段的用电数据;
其中,所述Q为所述每个所述小时时间段的用电数据,Qd为所述小时时间段对应的前一天的用电数据,Qm所述小时时间段对应的前一月的用电数据,Qy所述小时时间段对应的前一年的用电数据,Qh为所述小时时间段的前一小时时间段的用电数,Qavg为所述子时间段内平均每小时的平均用电数据,Qg为所述小时时间段之前的历史平均用电数据,α、β、γ、δ、ε和μ为所述数据补全模型的参数对应的系数。
本申请实施例中,将每个小时时间段的平均用电数据和历史用电数据值输入数据补全模型,通过近似日回归算法对缺失的每个小时时间段的用电数据进行预测,提高了对缺失用电数据还原的精度。
进一步地,所述根据每个所述小时时间段的用电数据确定补全的用电数据,包括:
根据平均算法计算每个所述小时时间段在每个预设时间间隔的用电数据,获得第一用电数据;
根据所述第一用电数据和每个所述预设时间间隔的第二起始用电数据获得补全的用电数据。
本申请实施例中,通过对每个小时时间段的用电数据计算平均值,可以获得补全的用电数据,从而实现对用电数据的实时监控,满足对于每个时刻用电量精准监测的需求。
进一步地,所述方法,还包括:
获取多个训练样本数据;其中,所述训练样本包括所述训练样本对应的训练时间段的实际用电数据、所述训练时间段对应的前一天的用电数据、所述训练时间段对应的前一月的用电数据、所述训练时间段对应的前一年的用电数据、所述训练时间段的前一小时时间段的用电数据、所述训练时间段对应的平均用电数据和所述训练时间段之前的历史平均用电数据;
将所述训练时间段对应的前一天的用电数据、所述训练时间段对应的前一月的用电数据、所述训练时间段对应的前一年的用电数据、所述训练时间段的前一小时时间段的用电数据、所述训练时间段对应的平均用电数据和所述训练时间段之前的历史平均用电数据输入到第一待训练模型中,获得所述第一待训练模型输出的第一预测用电数据;其中,所述第一待训练模型为当前最优模型;根据所述实际用电数据和所述第一预测用电数据获得第一偏差值;
将所述训练时间段对应的前一天的用电数据、所述训练时间段对应的前一月的用电数据、所述训练时间段对应的前一年的用电数据、所述训练时间段的前一小时时间段的用电数据、所述训练时间段对应的平均用电数据和所述训练时间段之前的历史平均用电数据输入到第二待训练模型中,获得所述第二待训练模型输出的第二预测用电数据;其中,所述第二待训练模型为对所述当前最优模型中的参数进行重新随机生成获得的模型;
根据所述实际用电数据和所述第二预测用电数据获得第二偏差值;
根据所述第一偏差值和所述第二偏差值从所述当前最优模型和所述第二待训练模型中确定新的当前最优模型。
在本申请实施例中,通过对数据补全模型进行持续训练,将历史真实用电数据与通过数据补全模型计算得到的用电数据进行对比,不断优化训练模型,使得通过数据补全模型获得的补全用电数据更科学、合理和贴近实际用电数据。
进一步地,所述根据所述第一偏差值和所述第二偏差值从所述当前最优模型和所述第二待训练模型中确定新的当前最优模型,包括:
判断训练次数是否满足预设次数;
若所述训练次数满足所述预设次数,则将所述当前最优模型作为所述数据补全模型;
若所述训练次数不满足所述预设次数,则对所述新的当前最优模型的参数进行再次随机生成,获得新的第二待训练模型,直至所述训练次数满足所述预设次数为止。
本申请实施例中,通过判断实际训练次数是否满足预设次数,确定是否完成本次对模型的训练,从而找出在预设次数下的当前最优的数据补全模型。
进一步地,所述获取预设时间段内的离线用电数据,包括:获取通过红外抄表机和/或人工抄表采集的所述离线用电数据。
本申请实施例,获取红外抄表机和/或人工抄表采集离线的用电数据,为后续计算缺失的用电数据提供参考数据。
第二方面,本申请实施例提供一种日用电数据缺失的补全装置,包括:
第一获取模块,用于获取预设时间段内的离线用电数据;
分段模块,用于根据所述离线用电数据对应的时间点对所述预设时间段进行分段,获得至少一个子时间段;其中,每个所述子时间段包括至少一个小时时间段;
计算模块,用于根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据;
第二获取模块,用于获取所述小时时间段对应的历史用电数据;其中,所述历史用电数据包括所述小时时间段对应的前一天的用电数据、所述小时时间段对应的前一月的用电数据、所述小时时间段对应的前一年的用电数据、所述小时时间段的前一小时时间段的用电数据和所述小时时间段之前的历史平均用电数据;
第三获取模块,用于将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据;其中,所述数据补全模型为通过近似日回归算法构建获得;
确定模块,用于根据每个所述小时时间段的用电数据确定补全的数据。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面的方法。
第四方面,本申请实施例提供一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一方面的方法。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种日用电数据缺失的补全方法流程示意图;
图2为本申请实施例提供的数据补全模型的训练方法流程示意图;
图3为本申请实施例提供的日用电数据缺失的补全装置结构示意图;
图4为本申请实施例提供的电子设备实体结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
图1为本申请实施例提供的一种日用电数据缺失的补全方法流程示意图,如图1所示,该方法可以应用于终端设备(也可以称为电子设备)以及服务器;其中终端设备具体可以为智能手机、平板电脑、计算机、个人数字助理(Personal Digital Assitant,PDA)等;服务器具体可以为应用服务器,也可以为Web服务器。该方法包括:
步骤101:获取预设时间段内的离线用电数据。
其中,预设时间段为电表的用电数据出现漏采或少采的日期对应的时间段,离线用电数据为对存在数据漏采或少采的电表进行抄表获得的一个或多个数据,例如,电表A缺失12月1号的用电数据,则预设时间段即为12月1号的0:00点到24:00点。
步骤102:根据所述离线用电数据对应的时间点对所述预设时间段进行分段,获得至少一个子时间段;其中,每个所述子时间段包括至少一个小时时间段。
其中,子时间段为根据抄表的时间对一天24个小时进行分段,形成的时间段;一个小时时间段为每一个子时间段中对应的每一个小时的时间段。例如:子时间段为2021年12月1日的10:00-16:00,那么该子时间段对应的小时时间段分别为:10:00-11:00、11:00-12:00、12:00-13:00、13:00-14:00、14:00-15:00和15:00-16:00。应当说明的是,本申请实施例将一天中最后采集到的用电数据作为当天24:00点的用电数据,在具体的实施本领域技术人员可以根据实际情况进行合适的调整,本申请实施例对此不作具体限定。
在具体实施过程中,根据分段处理逻辑对抄表得到的离线用电数据进行分段。例如:若当天只抄回一个离线数据A,则将离线数据A作为当天24:00点的实际用电数据,将前一天24点到当天24点作为一个时间段,其中前一天24:00点即为当天的0:00点。
若当天抄回4个离线用电数据,包括:离线数据B、离线数据C、离线数据D和离线数据E,离线数据B、C、D和E分别对应8:00点、12:00点、18:00点和24:00点,则分成4个子时间段:0:00-8:00、8:00-12:00、12:00-18:00和18:00-24:00。
步骤103:根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据。
其中,子时间段内平均每小时的平均用电数据可以表征每个子时间段的用电数据集中的趋势以及在每个子时间段用电量的平均水平。
步骤104:获取所述小时时间段对应的历史用电数据;其中,所述历史用电数据包括所述小时时间段对应的前一天的用电数据、所述小时时间段对应的前一月的用电数据、所述小时时间段对应的前一年的用电数据、所述小时时间段的前一小时时间段的用电数据和所述小时时间段之前的历史平均用电数据。
其中,若电表为新表或电表中存在历史数据的丢失,则可用每个子时间段内平均每小时的平均用电数据代替具体丢失的历史数据。
在具体实施过程中,例如要计算2021年10月2号、0:00-4:00子时间段中0:00-1:00小时时间段的用电数据,则先获取2021年10月1号的0:00-1:00小时时间段对应的用电数据、2021年9月2号的0:00-1:00小时时间段对应的用电数据、2020年9月2号的0:00-1:00小时时间段对应的用电数据、2021年10月1号的23:00-24:00小时时间段对应的用电数据和2021年10月1号的0:00-1:00小时时间段之前的历史平均用电数据作为历史用电数据。
步骤105:将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据;其中,所述数据补全模型为通过近似日回归算法构建获得。
其中,近似日回归算法为通过小时时间段对应的前一天的用电数据、小时时间段对应的前一月的用电数据、小时时间段对应的前一年的用电数据、小时时间段的前一小时时间段的用电数据、小时时间段的平均用电数据和小时时间段之前的历史平均用电数据来对每个小时时间段的用电数据进行回归预测。基于近似日回归算法构建数据补全模型,数据补全模型通过历史用电数据和平均用电数据的特性来预测缺失的用电数据。
在具体实施过程中,将每个小时时间段对应的前一天的用电数据、小时时间段对应的前一月的用电数据、小时时间段对应的前一年的用电数据、小时时间段的前一小时时间段的用电数据、小时时间段的平均用电数据和小时时间段之前的历史平均用电数据输入数据补全模型中,通过数据补全模型计算后输出每个小时时间段的用电数据。步骤106:根据每个所述小时时间段的用电数据确定补全的数据。
在具体实施过程中,将一天分为288个点,每5分钟记录一次用电数据。通过对每个小时时间段的用电数据求平均值获得每五分钟的用电数据,完成对288个用电数据的补全,为企业进行精确的能耗分析、能耗对比、负荷预测、能源调度和能源计划提供数据基础。
在上述实施例的基础上,所述根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据,包括:
获取所述子时间段中起始时间点对应的第一起始用电数据和结束时间点对应的第一结束用电数据;
根据所述第一起始用电数据、所述第一结束用电数据和所述子时间段的时间间隔计算所述子时间段内平均每小时的平均用电数据。
在具体实施过程中,通过子时间段的结束用电数据减去起始用电数据获得子时间段的总用电数据,再将总用电数据除以子时间段的时间间隔,可以获得平均用电数据。
在上述实施例的基础上,所述将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据,包括:
根据Q=α*Qd+β*Qm+γ*Qy+δ*Qh+ε*Qavg+μ*Qg计算所述每个所述小时时间段的用电数据;
其中,所述Q为所述每个所述小时时间段的用电数据,Qd为所述小时时间段对应的前一天的用电数据,Qm所述小时时间段对应的前一月的用电数据,Qy所述小时时间段对应的前一年的用电数据,Qh为所述小时时间段的前一小时时间段的用电数,Qavg为所述子时间段内平均每小时的平均用电数据,Qg为所述小时时间段之前的历史平均用电数据,α、β、γ、δ、ε和μ为所述数据补全模型的参数对应的系数。
其中,α、β、γ、δ、ε和μ的默认取值范围为0.01-1.00。
在具体实施过程中,根据Q=α*Qd+β*Qm+γ*Qy+δ*Qh+ε*Qavg+μ*Qg计算每个小时时间段的用电数据。例如,计算2021年10月2号、0:00-5:00子时间段中0:00-1:00小时时间段的用电数据,其中,0:00点对应的用电数据为125KWh,5:00点对应的用电数据为175KWh,则0:00-4:00子时间段的平均用电数据为10KWh。
获取历史数据:2021年10月1号的0:00-1:00小时时间段对应的用电数据10KWh、2021年9月2号的0:00-1:00小时时间段对应的用电数据15KWh、2020年9月2号的0:00-1:00小时时间段对应的用电数据为20KWh、2021年10月1号的23:00-24:00小时时间段对应的用电数据为8KWh、2021年10月1号的0:00-1:00小时时间段之前的历史平均用电数据为9KWh。
对α、β、γ、δ、ε和μ分别赋值为0.5、0.1、0.03、0.01、0.2和0.4,则0-1小时时间段的用电数据:Q1=α*Qd+β*Qm+γ*Qy+δ*Qh+ε*Qavg+μ*Qg=0.5*10+0.1*15+0.03*20+0.01*8+0.2*10+0.4*9=12.78KWh。
在上述实施例的基础上,所述根据每个所述小时时间段的用电数据确定补全的用电数据,包括:
根据平均算法计算每个所述小时时间段在每个预设时间间隔的用电数据,获得第一用电数据;
根据所述第一用电数据和每个所述预设时间间隔的第二起始用电数据获得补全的用电数据。
其中,预设时间间隔为五分钟,第一用电数据为在每个小时时间段实际使用的用电数据,第二起始用电数据为每个小时时间段的起始用电数据。
例如,5:00-6:00小时时间段的第一用电数据为12KWh,5:00点对应的用电数据为120KWh,则每五分钟的用电数据为1KWh,其中,1KWh为第一用电数据,120KWh为第二起始用电数据,则6:05分的用电数据为121KWh,6:15分的用电数据为122KWh,以此类推补全日缺失的用电数据。
在上述实施例的基础上,图2为本申请实施例提供的数据补全模型的训练方法流程示意图,如图2所示,数据补全模型的训练步骤如下:
步骤201:获取多个训练样本数据,预设训练次数为N。
其中,所述训练样本包括所述训练样本对应的训练时间段的实际用电数据、所述训练时间段对应的前一天的用电数据、所述训练时间段对应的前一月的用电数据、所述训练时间段对应的前一年的用电数据、所述训练时间段的前一小时时间段的用电数据、所述训练时间段对应的平均用电数据和所述训练时间段之前的历史平均用电数据。
步骤202:根据第一待训练模型计算第一预测用电数据。
将训练时间段对应的前一天的用电数据、训练时间段对应的前一月的用电数据、训练时间段对应的前一年的用电数据、训练时间段的前一小时时间段的用电数据、训练时间段对应的平均用电数据和训练时间段之前的历史平均用电数据输入到第一待训练模型中,获得第一待训练模型输出的第一预测用电数据,根据第一待训练模型的α、β、γ、δ、ε和μ计算第一预测用电数据。其中,所述第一待训练模型为当前最优模型,第一待训练模型参数对应的系数已知。
步骤203:计算第一预测用电数据与实际用电数据的偏差,获得第一偏差值。
其中,第一偏差值为第一预测用电数据与实际用电数据差值的绝对值。
步骤204:根据第二待训练模型计算第二预测用电数据。
将训练时间段对应的前一天的用电数据、训练时间段对应的前一月的用电数据、训练时间段对应的前一年的用电数据、训练时间段的前一小时时间段的用电数据、训练时间段对应的平均用电数据和训练时间段之前的历史平均用电数据输入到第二待训练模型中,根据随机生成的α、β、γ、δ、ε和μ计算第二预测用电数据。其中,所述第二待训练模型为对当前最优模型中的参数进行重新随机生成获得的模型。
步骤205:计算第二预测用电数据与实际用电数据的偏差,获得第二偏差值。
其中,第二偏差值为第二预测用电数据与实际用电数据差值的绝对值。
步骤206:确定当前最优的数据补全模型。
根据所述第一偏差值和所述第二偏差值从所述当前最优模型和所述第二待训练模型中确定新的当前最优模型,具体步骤为:
首先,判断第一偏差值是否大于第二偏差值,若第一偏差值大于第二偏差值,则将第二待训练模型作为当前最优的数据补全模型;若第一偏差值小于或等于第二偏差值,则第一待训练模型仍为当前最优的数据补全模型。
其次,再判断训练次数是否满足预设次数N,若训练次数满足所述预设次数N,则将当前最优模型作为所述数据补全模型;若训练次数不满足所述预设次数N,则对新的当前最优模型的参数进行再次随机生成,获得新的第二待训练模型,直至训练次数满足预设次数为止。
其中,预设次数为预先设置的具体训练次数。在具体实施过程中,当实际训练次数达到预设次数时,将当前最优模型作为本次训练中优化得到的数据补全模型;当实际训练次数未达到预设次数时,继续对模型进行训练直至实际训练次数达到预设次数为止。应当说明的是,在本次训练中获得的最优模型是对训练模型训练预设次数时得到的相对最优模型。
在上述实施例的基础上,所述获取预设时间段内的离线用电数据,包括:
获取通过红外抄表机和/或人工抄表采集的所述离线用电数据。
其中,红外抄表机可以分为近红外抄表机和远红外抄表机。红外抄表机由单片机、电源电路、串行通信接口、显示电路、键盘设置电路、存储器等组成,能够在那些不适合或不方便架设电缆线及电磁干扰较强的工作环境,来实现单相电度表的抄表系统,完成电度表用电量的抄写、设置表底数、电度表校准等工作;人工抄表为人工抄表员对电表的示数进行抄录,此抄表方式的效率较低。
图3为本申请实施例提供的日用电数据缺失的补全装置300结构示意图,该装置可以是电子设备上的模块、程序段或代码。应理解,该装置与上述图1方法实施例对应,能够执行图1方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括:第一获取模块301、分段模块302、计算模块303、第二获取模块304、第三获取模块305和确定模块306,其中:
第一获取模块301,用于获取预设时间段内的离线用电数据;
分段模块302,用于根据所述离线用电数据对应的时间点对所述预设时间段进行分段,获得至少一个子时间段;其中,每个所述子时间段包括至少一个小时时间段;
计算模块303,用于根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据;
第二获取模块304,用于获取所述小时时间段对应的历史用电数据;其中,所述历史用电数据包括所述小时时间段对应的前一天的用电数据、所述小时时间段对应的前一月的用电数据、所述小时时间段对应的前一年的用电数据、所述小时时间段的前一小时时间段的用电数据和所述小时时间段之前的历史平均用电数据;
第三获取模块305,用于将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据;其中,所述数据补全模型为通过近似日回归算法构建获得;
确定模块306,用于根据每个所述小时时间段的用电数据确定补全的数据。
在上述实施例的基础上,计算模块303具体用于:
获取所述子时间段中起始时间点对应的第一起始用电数据和结束时间点对应的第一结束用电数据;
根据所述第一起始用电数据、所述第一结束用电数据和所述子时间段的时间间隔计算所述子时间段内平均每小时的平均用电数据。
在上述实施例的基础上,第三获取模块305具体用于:
根据Q=α*Qd+β*Qm+γ*Qy+δ*Qh+ε*Qavg+μ*Qg计算所述每个所述小时时间段的用电数据;
其中,所述Q为所述每个所述小时时间段的用电数据,Qd为所述小时时间段对应的前一天的用电数据,Qm所述小时时间段对应的前一月的用电数据,Qy所述小时时间段对应的前一年的用电数据,Qh为所述小时时间段的前一小时时间段的用电数,Qavg为所述子时间段内平均每小时的平均用电数据,Qg为所述小时时间段之前的历史平均用电数据,α、β、γ、δ、ε和μ为所述数据补全模型的参数对应的系数。
在上述实施例的基础上,确定模块306具体用于:
根据平均算法计算每个所述小时时间段在每个预设时间间隔的用电数据,获得第一用电数据;
根据所述第一用电数据和每个所述预设时间间隔的第二起始用电数据获得补全的用电数据。
在上述实施例的基础上,该装置还包括训练模块,用于:
判断训练次数是否满足预设次数;
若所述训练次数满足所述预设次数,则将所述当前最优模型作为所述数据补全模型;
若所述训练次数不满足所述预设次数,则对所述新的当前最优模型的参数进行再次随机生成,获得新的第二待训练模型,直至所述训练次数满足所述预设次数为止。
在上述实施例的基础上,训练模块具体用于:
判断训练次数是否满足预设次数;
若所述训练次数满足所述预设次数,则将所述当前最优模型作为所述数据补全模型;
若所述训练次数不满足所述预设次数,则对所述新的当前最优模型的参数进行再次随机生成,获得新的第二待训练模型,直至所述训练次数满足所述预设次数为止。
在上述实施例的基础上,第一获取模块具体用于:
获取通过红外抄表机和/或人工抄表采集的所述离线用电数据。
综上所述,本申请实施例中,通过近似日回归算法构建的数据补全模型计算每个子时间段的每个小时时间段的用电数据,完成对缺失用电数据的补全,提高了对缺失用电数据补全的精度和质量,可以实现对每小时用电数据的实时监测,减少实际用电数据和补全的用电数据之间的差距。
图4为本申请实施例提供的电子设备实体结构示意图,如图4所示,所述电子设备,包括:处理器(processor)401、存储器(memory)402和总线403;其中:
所述处理器401和存储器402通过所述总线403完成相互间的通信;
所述处理器401用于调用所述存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取预设时间段内的离线用电数据;根据所述离线用电数据对应的时间点对所述预设时间段进行分段,获得至少一个子时间段;其中,每个所述子时间段包括至少一个小时时间段;根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据;获取所述小时时间段对应的历史用电数据;其中,所述历史用电数据包括所述小时时间段对应的前一天的用电数据、所述小时时间段对应的前一月的用电数据、所述小时时间段对应的前一年的用电数据、所述小时时间段的前一小时时间段的用电数据和所述小时时间段之前的历史平均用电数据;将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据;其中,所述数据补全模型为通过近似日回归算法构建获得;根据每个所述小时时间段的用电数据确定补全的数据。
处理器401可以是一种集成电路芯片,具有信号处理能力。上述处理器401可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器402可以包括但不限于随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)等。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取预设时间段内的离线用电数据;根据所述离线用电数据对应的时间点对所述预设时间段进行分段,获得至少一个子时间段;其中,每个所述子时间段包括至少一个小时时间段;根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据;获取所述小时时间段对应的历史用电数据;其中,所述历史用电数据包括所述小时时间段对应的前一天的用电数据、所述小时时间段对应的前一月的用电数据、所述小时时间段对应的前一年的用电数据、所述小时时间段的前一小时时间段的用电数据和所述小时时间段之前的历史平均用电数据;将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据;其中,所述数据补全模型为通过近似日回归算法构建获得;根据每个所述小时时间段的用电数据确定补全的数据。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取预设时间段内的离线用电数据;根据所述离线用电数据对应的时间点对所述预设时间段进行分段,获得至少一个子时间段;其中,每个所述子时间段包括至少一个小时时间段;根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据;获取所述小时时间段对应的历史用电数据;其中,所述历史用电数据包括所述小时时间段对应的前一天的用电数据、所述小时时间段对应的前一月的用电数据、所述小时时间段对应的前一年的用电数据、所述小时时间段的前一小时时间段的用电数据和所述小时时间段之前的历史平均用电数据;将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据;其中,所述数据补全模型为通过近似日回归算法构建获得;根据每个所述小时时间段的用电数据确定补全的数据。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种日用电数据缺失的补全方法,其特征在于,包括:
获取预设时间段内的离线用电数据;
根据所述离线用电数据对应的时间点对所述预设时间段进行分段,获得至少一个子时间段;其中,每个所述子时间段包括至少一个小时时间段;
根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据;
获取所述小时时间段对应的历史用电数据;其中,所述历史用电数据包括所述小时时间段对应的前一天的用电数据、所述小时时间段对应的前一月的用电数据、所述小时时间段对应的前一年的用电数据、所述小时时间段的前一小时时间段的用电数据和所述小时时间段之前的历史平均用电数据;
将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据;其中,所述数据补全模型为通过近似日回归算法构建获得;
根据每个所述小时时间段的用电数据确定补全的数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据,包括:
获取所述子时间段中起始时间点对应的第一起始用电数据和结束时间点对应的第一结束用电数据;
根据所述第一起始用电数据、所述第一结束用电数据和所述子时间段的时间间隔计算所述子时间段内平均每小时的平均用电数据。
3.根据权利要求1所述的方法,其特征在于,所述将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据,包括:
根据Q=α*Qd+β*Qm+γ*Qy+δ*Qh+ε*Qavg+μ*Qg计算所述每个所述小时时间段的用电数据;
其中,所述Q为所述每个所述小时时间段的用电数据,Qd为所述小时时间段对应的前一天的用电数据,Qm所述小时时间段对应的前一月的用电数据,Qy所述小时时间段对应的前一年的用电数据,Qh为所述小时时间段的前一小时时间段的用电数,Qavg为所述子时间段内平均每小时的平均用电数据,Qg为所述小时时间段之前的历史平均用电数据,α、β、γ、δ、ε和μ为所述数据补全模型的参数对应的系数。
4.根据权利要求1所述的方法,其特征在于,所述根据每个所述小时时间段的用电数据确定补全的用电数据,包括:
根据平均算法计算每个所述小时时间段在每个预设时间间隔的用电数据,获得第一用电数据;
根据所述第一用电数据和每个所述预设时间间隔的第二起始用电数据获得补全的用电数据。
5.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
获取多个训练样本数据;其中,所述训练样本包括所述训练样本对应的训练时间段的实际用电数据、所述训练时间段对应的前一天的用电数据、所述训练时间段对应的前一月的用电数据、所述训练时间段对应的前一年的用电数据、所述训练时间段的前一小时时间段的用电数据、所述训练时间段对应的平均用电数据和所述训练时间段之前的历史平均用电数据;
将所述训练时间段对应的前一天的用电数据、所述训练时间段对应的前一月的用电数据、所述训练时间段对应的前一年的用电数据、所述训练时间段的前一小时时间段的用电数据、所述训练时间段对应的平均用电数据和所述训练时间段之前的历史平均用电数据输入到第一待训练模型中,获得所述第一待训练模型输出的第一预测用电数据;其中,所述第一待训练模型为当前最优模型;
根据所述实际用电数据和所述第一预测用电数据获得第一偏差值;
将所述训练时间段对应的前一天的用电数据、所述训练时间段对应的前一月的用电数据、所述训练时间段对应的前一年的用电数据、所述训练时间段的前一小时时间段的用电数据、所述训练时间段对应的平均用电数据和所述训练时间段之前的历史平均用电数据输入到第二待训练模型中,获得所述第二待训练模型输出的第二预测用电数据;其中,所述第二待训练模型为对所述当前最优模型中的参数进行重新随机生成获得的模型;
根据所述实际用电数据和所述第二预测用电数据获得第二偏差值;
根据所述第一偏差值和所述第二偏差值从所述当前最优模型和所述第二待训练模型中确定新的当前最优模型。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一偏差值和所述第二偏差值从所述当前最优模型和所述第二待训练模型中确定新的当前最优模型,包括:
判断训练次数是否满足预设次数;
若所述训练次数满足所述预设次数,则将所述当前最优模型作为所述数据补全模型;
若所述训练次数不满足所述预设次数,则对所述新的当前最优模型的参数进行再次随机生成,获得新的第二待训练模型,直至所述训练次数满足所述预设次数为止。
7.根据权利要求1所述的方法,其特征在于,所述获取预设时间段内的离线用电数据,包括:
获取通过红外抄表机和/或人工抄表采集的所述离线用电数据。
8.一种日用电数据缺失的补全装置,其特征在于,包括:
第一获取模块,用于获取预设时间段内的离线用电数据;
分段模块,用于根据所述离线用电数据对应的时间点对所述预设时间段进行分段,获得至少一个子时间段;其中,每个所述子时间段包括至少一个小时时间段;
计算模块,用于根据所述子时间段对应的离线用电数据获得所述子时间段内平均每小时的平均用电数据;
第二获取模块,用于获取所述小时时间段对应的历史用电数据;其中,所述历史用电数据包括所述小时时间段对应的前一天的用电数据、所述小时时间段对应的前一月的用电数据、所述小时时间段对应的前一年的用电数据、所述小时时间段的前一小时时间段的用电数据和所述小时时间段之前的历史平均用电数据;
第三获取模块,用于将所述平均用电数据和所述历史用电数据输入预先训练好的数据补全模型,获得所述数据补全模型输出的每个所述小时时间段的用电数据;其中,所述数据补全模型为通过近似日回归算法构建获得;
确定模块,用于根据每个所述小时时间段的用电数据确定补全的数据。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的方法。
10.一种存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111570276.XA CN114202231A (zh) | 2021-12-21 | 2021-12-21 | 日用电数据缺失的补全方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111570276.XA CN114202231A (zh) | 2021-12-21 | 2021-12-21 | 日用电数据缺失的补全方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114202231A true CN114202231A (zh) | 2022-03-18 |
Family
ID=80655694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111570276.XA Pending CN114202231A (zh) | 2021-12-21 | 2021-12-21 | 日用电数据缺失的补全方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114202231A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115329907A (zh) * | 2022-10-14 | 2022-11-11 | 杭州致成电子科技有限公司 | 基于dbscan聚类的电负荷补全方法和系统 |
-
2021
- 2021-12-21 CN CN202111570276.XA patent/CN114202231A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115329907A (zh) * | 2022-10-14 | 2022-11-11 | 杭州致成电子科技有限公司 | 基于dbscan聚类的电负荷补全方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Energy clearing price prediction and confidence interval estimation with cascaded neural networks | |
Huang et al. | Demand response for industrial micro-grid considering photovoltaic power uncertainty and battery operational cost | |
Salas et al. | Benchmarking a scalable approximate dynamic programming algorithm for stochastic control of grid-level energy storage | |
US9129231B2 (en) | Real time energy consumption analysis and reporting | |
US20190115753A1 (en) | Method for automatic cloud control of energy storage systems | |
JP2014124065A (ja) | 電力需要予測装置、プログラム | |
CN111210056A (zh) | 电价方案确定方法、装置、计算机设备和存储介质 | |
Peng et al. | Risk-limiting unit commitment in smart grid with intelligent periphery | |
Karim et al. | Electricity load forecasting in UTP using moving averages and exponential smoothing techniques | |
CN112070301A (zh) | 一种用户用电量调整方法、系统及设备 | |
JP3360520B2 (ja) | 日負荷曲線予測方法 | |
CN116632838B (zh) | 应用于发电企业的电能供给分析的方法及装置 | |
Khani et al. | An online-calibrated time series based model for day-ahead natural gas demand forecasting | |
Yao et al. | A novel category-specific pricing strategy for demand response in microgrids | |
CN114202231A (zh) | 日用电数据缺失的补全方法、装置、电子设备及存储介质 | |
CN112907064A (zh) | 基于自适应窗的电量预测方法、装置、存储介质及终端 | |
Sheshadri | Electrical load forecasting using time series analysis | |
CN111210260A (zh) | 电价数据处理方法、装置、计算机设备和存储介质 | |
CN111008727A (zh) | 一种配电台区负荷预测方法及装置 | |
Yu et al. | A model integrating ARIMA and ANN with seasonal and periodic characteristics for forecasting electricity load dynamics in a state | |
Wen et al. | A dual energy benchmarking methodology for energy-efficient production planning and operation of discrete manufacturing systems using data mining techniques | |
CN111144634A (zh) | 一种电力价格预测的方法以及装置 | |
Kamel et al. | Short term load forecast using Burg autoregressive technique | |
JP2001288782A (ja) | 配水量予測システム | |
Suryanarayana et al. | EV charging site day-ahead load prediction in a synthetic environment for RL based grid-informed charging |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |