CN111898829B - 一种基于稀疏异常感知的边缘设备下的电量预测方法 - Google Patents

一种基于稀疏异常感知的边缘设备下的电量预测方法 Download PDF

Info

Publication number
CN111898829B
CN111898829B CN202010772041.8A CN202010772041A CN111898829B CN 111898829 B CN111898829 B CN 111898829B CN 202010772041 A CN202010772041 A CN 202010772041A CN 111898829 B CN111898829 B CN 111898829B
Authority
CN
China
Prior art keywords
sparse
training
data
abnormal
exception
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010772041.8A
Other languages
English (en)
Other versions
CN111898829A (zh
Inventor
杨骏
蒋屹新
许爱东
文红
张宇南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China South Power Grid International Co ltd
University of Electronic Science and Technology of China
Original Assignee
China South Power Grid International Co ltd
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China South Power Grid International Co ltd, University of Electronic Science and Technology of China filed Critical China South Power Grid International Co ltd
Priority to CN202010772041.8A priority Critical patent/CN111898829B/zh
Publication of CN111898829A publication Critical patent/CN111898829A/zh
Application granted granted Critical
Publication of CN111898829B publication Critical patent/CN111898829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于稀疏异常感知的边缘设备下的电量预测方法,包括以下步骤:S1:边缘设备对K个目标建筑采集电量数据;S2:在边缘设备端采用稀疏异常感知方法对异常数据进行稀疏异常标记;S3:计算稀疏异常丢弃概率并得到总训练集;S4:利用机器学习回归算法和五折交叉验证训练模型,每折交叉验证时利用稀疏异常丢弃概率随机丢弃异常数据,不参与训练;S5:利用机器学习模型对待预测数据进行电量预测,并对模型预测输出乘以稀疏异常丢弃概率得到最终预测。本发明缓解了基于均方误差损失的机器学习回归模型对异常数据较敏感的问题;同时,减少了训练数据量,提升了模型训练速度,并引入了随机性,提升了模型的预测精度和泛化能力。

Description

一种基于稀疏异常感知的边缘设备下的电量预测方法
技术领域
本发明涉及能源领域的电量预测,尤其涉及一种基于稀疏异常感知的边缘设备下的电量预测方法。
背景技术
能源问题与人类的发展息息相关。而随着时代的发展和科技的进步,电力能源已经成为人类社会生活中不可或缺的能源之一,是现代社会能源领域中的最重要组成部分,社会发展和科技进步的同时,对电力能源的需求量与日俱增。用电量预测作为电力系统运行、优化、控制的基础,在当今能源系统快速发展的环境下,正面临着新的挑战。
近年来,随着机器学习技术与深度学习技术的高速发展,大量机器学习技术与深度学习技术被应用于电量预测中,取得了良好的效果。但机器学习技术和深度学习技术十分依赖数据,采集大量合理有效的数据是成功进行电量预测的关键。但真实环境下,由于网络延迟、设备故障等原因,采集到的数据存在大量的无效数据、异常数据,合理处理异常数据亦是提升预测效果的关键。尤其是边缘计算技术的提出,使得在近终端部署边缘设备,为计算资源受限的终端提供了计算资源支持,由于边缘设备近终端,可以提供实时的算法,这使得机器学习技术与深度学习技术可以进行终端的实时电量精准预测。
另外,在机器学习模型中,用电量预测对应回归问题,回归问题常采用均方误差作为机器学习算法的损失函数,使用均方误差作为损失函数有许多优点,包括快速求解,解空间为凸,合理刻画误差等。而其最大的缺点就是容易受异常值影响,针对这一缺点,国内外学者做出了许多改进,多数是针对损失函数本身,直接使用Huber损失函数等。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于稀疏异常感知的边缘设备下的电量预测方法,缓解了基于均方误差损失的机器学习回归模型对异常数据较敏感的问题;同时,减少了训练数据量,提升了模型训练速度,并引入了随机性,提升了模型的预测精度和泛化能力。
本发明的目的是通过以下技术方案来实现的:一种基于稀疏异常感知的边缘设备下的电量预测方法,包括以下步骤:
S1.边缘设备对K个目标建筑采集电量数据,得到K个基本训练数据集;
S2.采用稀疏异常感知方法对异常数据进行稀疏异常标记;
S3.计算稀疏异常丢弃概率并得到总训练集;
S4.利用机器学习回归算法和五折交叉验证训练模型,每折交叉验证时利用稀疏异常丢弃概率随机丢弃异常数据,不参与训练;
S5.利用机器学习模型对待预测数据进行电量预测,并对模型预测输出乘以稀疏异常丢弃概率得到最终预测。
具体的,所述的步骤S1包括:
S101.采集K个目标建筑的c个基本信息特征bi=[bi1 bi2 … bic],i=1,2,…,K;
S102.从start时刻开始,到start+T时间段内,每隔t时刻采集目标建筑的用电量数据yi=[yi,start yi,start+t yi,start+2t … yi,start+T]T,i=1,2,…,K,及目标建筑所在地区的天气数据wi=[wi,start wi,start+t wi,start+2t … wi,start+T]T,i=1,2,…,K,包括温度等;
S103.合并目标建筑基本信息特征bi与对应天气数据wi以及目标值用电量数据yi,得到K个基本训练数据集:
Figure GDA0002885721100000021
具体的,所述步骤S2采用稀疏异常感知方法对异常数据进行稀疏异常标记,包括:
S201.对K个基本训练数据集,分别对每个基本训练数据集Xi的目标值yi求取均值和方差:
Figure GDA0002885721100000022
Figure GDA0002885721100000023
S202.对K个基本训练数据集进行稀疏异常标记,具体地,设
Figure GDA0002885721100000024
表示任意某个时刻,exception_start表示稀疏异常开始时刻,exception_end表示稀疏异常结束时刻,exception_window表示最大允许连续异常时间窗口,exception_window是一个超参数,分别对每个基本训练数据集Xi,i=1,2,...,K进行稀疏异常标记,标记方式为:
(1)若对
Figure GDA0002885721100000025
有yi,exception_time=0,且exception_end-exception_start>exception_window,则将对应数据标记为1,其余数据标记为0;
(2)若对
Figure GDA0002885721100000031
有yi,exception_time=identity,identity为任意值,且exception_end-exception_start>exception_window,则将对应数据标记为1,其余数据标记为0;
(3)若对
Figure GDA0002885721100000032
有|yi,exception_timei|>ασi,α≥3,且exception_end-exception_start>exception_window,则将对应数据标记为1,其余数据标记为0;
最终得到K个稀疏异常标记ei=[ei,start ei,start+t … ei,start+T]T,i=1,2,...K,其中每个元素属于0或1,是一个稀疏向量。
具体的,所述步骤S3包括:
S301.分别对每个基本训练数据集Xi,计算异常比例zi及丢弃概率pi,其中,sample越小,则丢弃概率越大:
Figure GDA0002885721100000033
Figure GDA0002885721100000034
S302.计算总体丢弃概率P:
Figure GDA0002885721100000035
S303.合并K个基本训练数据集为1个总训练集,合并时仍按时间排序,同一时刻,合并K个基本训练数据集该时刻的数据,再进行下一时刻的合并,得到总训练集X,总体稀疏异常标记E,总体目标值Y为:
Figure GDA0002885721100000041
具体的,所述步骤S4包括:
S401.选取训练评价指标;
S402.使用标准五折交叉验证方法,将总训练集X五等分为Xcv1,Xcv2,Xcv3,Xcv4,Xcv5,对应地,将总体稀疏异常标记E五等分为Ecv1,Ecv2,Ecv3,Ecv4,Ecv5,将总体目标值Y五等分为Ycv1,Ycv2,Ycv3,Ycv4,Ycv5
Figure GDA0002885721100000042
得到五组交叉验证训练集:
Figure GDA0002885721100000043
Figure GDA0002885721100000044
Figure GDA0002885721100000045
Figure GDA0002885721100000046
Figure GDA0002885721100000047
同时,对于每组交叉验证训练集,以对应方式组织Etrain,Evalid,Ytrain,Yvalid
S403.选用机器学习回归算法;
S404.进行交叉验证训练,每折交叉验证训练前,对训练集train和验证集valid中分别生成两组随机数:train_r,与训练集train对应的Etrain具有相同的维度;valid_r,与验证集valid对应的Evalid具有相同的维度。随机数的值在0到1之间,在交叉验证训练前,将
Figure GDA0002885721100000052
对应的样本丢弃,不参与本次交叉验证训练的训练和验证。交叉验证训练完成后,得到5个回归模型:Modeli,i=1,2...5;
具体地,所述步骤S5包括:
S501.利用5个回归模型对待预测数据生成5个预测predictioni,i=1,2,...5,使用模型平均融合,并将融合结果乘以总体丢弃概率得到最终预测:
Figure GDA0002885721100000051
优选地,所述步骤S1中,所述目标建筑为一整栋建筑、建筑中的某一楼层或建筑下的某一住宅,所述目标建筑的c个基本信息特征包括建筑面积、楼层和用途等特征中至少两种的组合;在目标建筑为一整栋建筑时,这里的楼层指的是建筑的总楼层数;在目标建筑为建筑中的某一楼层或建筑下的某一住宅时,这里的楼层是指所在的楼层。
优选地,所述步骤S1中,目标建筑所在地区的天气数据包括但不限于室外温度,室内温度,湿度,风速等;
优选地,所述步骤S4中,所述训练评价指标包括但不限于RMSE,RMSLE。
优选地,所述步骤S4中,选用的机器学习回归算法包括但不限于线性回归算法、梯度提升树算法(GBDT)和XGBOOST算法。
本发明的有益效果是:(1)本发明利用稀疏异常感知的方法和基于drop out思想(以一定概率丢弃稀疏异常样本,不参与训练,并在预测阶段,将融合结果乘以总体丢弃概率得到最终预测)的方式,缓解了基于均方误差损失的机器学习回归模型对异常数据较敏感的问题。(2)本发明在训练期间以一定概率丢弃异常样本,减少了训练数据量,提升了模型训练速度,使算法更易在边缘设备运行。(3)本发明通过引入丢弃概率引入了随机性和噪声,提升了模型的预测精度和泛化能力。
附图说明
图1为本发明的方法流程图;
图2为本发明中第一种情况的稀疏异常示意图;
图3为本发明中第二种情况的稀疏异常示意图;
图4为本发明中第三种情况的稀疏异常示意图;
图5为本发明中的基于稀疏异常感知与基于drop out思想的五折交叉验证训练方式与普通五折交叉验证训练方式的训练时间对比图;
图6为本发明中的基于稀疏异常感知与基于drop out思想的五折交叉验证训练方式与普通五折交叉验证训练方式生成的模型的预测精度对比图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种基于稀疏异常感知的边缘设备下的电量预测方法,包括以下步骤:
S1.边缘设备对K个建筑采集电量数据,得到K个基本训练数据集;
S2.采用稀疏异常感知方法对异常数据进行稀疏异常标记;
S3.计算稀疏异常丢弃概率并得到总训练集;
S4.利用机器学习回归算法和五折交叉验证训练模型,每折交叉验证时利用稀疏异常丢弃概率随机丢弃异常数据,不参与训练;
S5.利用机器学习模型对待预测数据进行电量预测,并对模型预测输出乘以稀疏异常丢弃概率得到最终预测。
具体的,所述的步骤S1包括:
S101.采集K个目标建筑的c个基本信息特征bi=[bi1 bi2 … bic],i=1,2,…,K;
S102.从start时刻开始,到start+T时间段内,每隔t时刻采集目标建筑的用电量数据yi=[yi,start yi,start+t yi,start+2t … yi,start+T]T,i=1,2,…,K,及目标建筑所在地区的天气数据wi=[wi,start wi,start+t wi,start+2t … wi,start+T]T,i=1,2,…,K,包括温度等;
S103.合并目标建筑基本信息特征bi与对应天气数据wi以及目标值用电量数据yi,得到K个基本训练数据集:
Figure GDA0002885721100000061
具体的,所述步骤S2采用稀疏异常感知方法对异常数据进行稀疏异常标记,包括:
S201.对K个基本训练数据集,分别对每个基本训练数据集Xi的目标值yi求取均值和方差:
Figure GDA0002885721100000062
Figure GDA0002885721100000071
S202.对K个基本训练数据集进行稀疏异常标记,具体地,设
Figure GDA0002885721100000076
表示任意某个时刻,exception_start表示稀疏异常开始时刻,exception_end表示稀疏异常结束时刻,exception_window表示最大允许连续异常时间窗口,exception_window是一个超参数,分别对每个基本训练数据集Xi,i=1,2,...,K进行稀疏异常标记,标记方式为:
(1)如图2所示,若对
Figure GDA0002885721100000072
有yi,exception_time=0,且exception_end-exception_start>exception_window,则将对应数据标记为1,其余数据标记为0;
(2)如图3所示,若对
Figure GDA0002885721100000073
有yi,exception_time=identity,identity为任意值,且exception_end-exception_start>exception_window,则将对应数据标记为1,其余数据标记为0;
(3)如图4所示,若对
Figure GDA0002885721100000074
有|yi,exception_timei|>ασi,α≥3,且exception_end-exception_start>exception_window,则将对应数据标记为1,其余数据标记为0;
最终得到K个稀疏异常标记ei=[ei,start ei,start+t … ei,start+T]T,i=1,2,...K,其中每个元素属于0或1,是一个稀疏向量。
具体的,所述步骤S3包括:
S301.分别对每个基本训练数据集Xi,计算异常比例zi及丢弃概率pi,其中,sample越小,则丢弃概率越大:
Figure GDA0002885721100000075
Figure GDA0002885721100000081
S302.计算总体丢弃概率P:
Figure GDA0002885721100000082
S303.合并K个基本训练数据集为1个总训练集,合并时仍按时间排序,同一时刻,合并K个基本训练数据集该时刻的数据,再进行下一时刻的合并,得到总训练集X,总体稀疏异常标记E,总体目标值Y为:
Figure GDA0002885721100000083
具体的,所述步骤S4包括:
S401.选取训练评价指标;
S402.使用标准五折交叉验证方法,将总训练集X五等分为Xcv1,Xcv2,Xcv3,Xcv4,Xcv5,对应地,将总体稀疏异常标记E五等分为Ecv1,Ecv2,Ecv3,Ecv4,Ecv5,将总体目标值Y五等分为Ycv1,Ycv2,Ycv3,Ycv4,Ycv5
Figure GDA0002885721100000084
得到五组交叉验证训练集:
Figure GDA0002885721100000091
Figure GDA0002885721100000092
Figure GDA0002885721100000093
Figure GDA0002885721100000094
Figure GDA0002885721100000095
同时,对于每组交叉验证训练集,以对应方式组织Etrain,Evalid,Ytrain,Yvalid
S403.选用机器学习回归算法;
S404.进行交叉验证训练,每折交叉验证训练前,对训练集train和验证集valid中分别生成两组随机数:train_r,与训练集train对应的Etrain具有相同的维度;valid_r,与验证集valid对应的Evalid具有相同的维度。随机数的值在0到1之间,在交叉验证训练前,将
Figure GDA0002885721100000097
对应的样本丢弃,不参与本次交叉验证训练的训练和验证。交叉验证训练完成后,得到5个回归模型:Modeli,i=1,2...5;
具体地,所述步骤S5包括:
S501.利用5个回归模型对待预测数据生成5个预测predictioni,i=1,2,...5,使用模型平均融合,并将融合结果乘以总体丢弃概率得到最终预测:
Figure GDA0002885721100000096
所述步骤S101中,所述目标建筑为一整栋建筑、建筑中的某一楼层或建筑下的某一住宅,所述目标建筑的c个基本信息特征包括建筑面积、建筑物启用时间、楼层和用途等特征中两种以上的组合;在目标建筑为一整栋建筑时,这里的楼层指的是建筑的总楼层数;在目标建筑为建筑中的某一楼层或建筑下的某一住宅时,这里的楼层是指其所在的楼层;在本申请的实施例中,所述用途是指使用建筑物主要活动用途特征,如教育、办公、住宿、娱乐等;在一些实施例中,目标建筑的基本特征信息还可以包括建筑物启用时间;
所述步骤S102中,目标建筑所在地区的天气数据包括但不限于室外温度,室内温度,湿度,风速等;在本申请的实施例中,使用空气摄氏温度;云层覆盖范围;降雨量;海平面气压;风速;风向;
所述步骤S202中,参数α≥3;在本申请的实施例中,设α=3。
所述步骤S301中,参数sample≤0.001;在本申请的实施例中,设sample=0.001。
所述步骤S401中,所述训练评价指标包括但不限于RMSE,RMSLE。在本申请的实施例中,选取的训练评价指标是RMSLE:
Figure GDA0002885721100000101
机器学习模型选取的损失函数是RMSE:
Figure GDA0002885721100000102
为使模型采取的损失函数与训练评价指标等价,在开始训练前,对目标值执行取对数操作,其中i=1,2,...K:
yi=log(yi+1)=[log(yi,start+1) log(yi,start+t+1) log(yi,start+2t+1) … log(yi,start+T+1)]T
所述步骤S403中,选用的机器学习回归算法包括但不限于线性回归算法、梯度提升树(GBDT)和XGBOOST算法;在本申请的实施例中,选取XGBOOST算法。
为验证本发明的基于稀疏异常感知和基于drop out思想的边缘设备下的电量预测方法与传统的预测方法的差异性,分别利用三种训练方式进行对比实验:
(a)按本发明所述步骤完成训练及预测;
(b)按本发明所述步骤组织数据,但在所述步骤S404中,不采取丢弃策略;所述步骤S501中,不采取乘以总体丢弃概率策略;即普通的训练方式;
(c)按本发明所述步骤完成训练及预测,但在所述步骤S302中,直接令总体丢弃概率P=1;即在步骤S404中,直接丢弃全部异常数据;在步骤S501中,不采取乘以总体丢弃概率策略。
实验结果如图5,图6所示,具体地:
1)(a)(c)训练方式的收敛速度和训练误差都明显优于(b)训练方式;(b)训练方式使用全部数据进行训练,约迭代1300次才趋近收敛,且训练误差较高;(a)训练方式采取随机丢弃策略,约迭代800次就已经收敛,且训练误差明显低于(b)方式;(c)训练方式采取丢弃所有异常样本策略,因为训练样本更少,约迭代700次就已经收敛,速度上优于(a)方式,且训练误差相似;
2)(a)方式采取乘以总体丢弃概率策略,拥有最佳的预测误差;(b)方式无论是训练还是预测,误差都很高;(c)方式总体丢弃概率为1,未引入随机性,预测误差要稍微高于(a)方式。
综上,本发明利用边缘设备采集大量的电量数据,利用稀疏异常感知的方法对数据进行稀疏异常标记,生成稀疏异常感标签,并计算总体丢弃概率。使用五折交叉验证及drop out思想和机器学习回归算法进行训练,利用总体丢弃概率实现随机性,得到模型,再利用模型对待预测数据进行预测,并乘以总体丢弃概率生成最终预测。具有收敛速度快,预测误差低等优势。
以上所述是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应该看作是对其他实施例的排除,而可用于其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (10)

1.一种基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于:包括以下步骤:
S1.对K个目标建筑采集电量数据,得到K个基本训练数据集;
S2.采用稀疏异常感知方法对异常数据进行稀疏异常标记;
S3.计算稀疏异常丢弃概率并得到总训练集;
S4.利用机器学习回归算法和五折交叉验证训练模型,每折交叉验证时利用稀疏异常丢弃概率随机丢弃异常数据,不参与训练;
S5.利用机器学习模型对待预测数据进行电量预测,并对模型预测输出乘以稀疏异常丢弃概率得到最终预测。
2.根据权利要求1所述的基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于:所述步骤S1包括以下子步骤:
S101.采集K个目标建筑的c个基本信息特征bi=[bi1 bi2…bic],i=1,2,…,K;
S102.从start时刻开始,到start+T时间段内,每隔t时刻采集目标建筑的用电量数据yi=[yi,start yi,start+t yi,start+2t…yi,start+T]T,i=1,2,…,K,及目标建筑所在地区的天气数据wi=[wi,start wi,start+t wi,start+2t…wi,start+T]T,i=1,2,…,K;
S103.合并目标建筑基本信息特征bi与对应天气数据wi以及目标值用电量数据yi,得到K个基本训练数据集:
Figure FDA0002885721090000011
3.根据权利要求1所述的基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于:所述的步骤S2包括以下子步骤:
S201.对K个基本训练数据集,分别对每个基本训练数据集Xi的目标值yi求取均值μi和方差σi
Figure FDA0002885721090000012
Figure FDA0002885721090000013
其中,i=1,2,...,K;
S202.对K个基本训练数据集进行稀疏异常标记,具体地,设
Figure FDA0002885721090000026
表示任意某个时刻,exception_start表示稀疏异常开始时刻,exception_end表示稀疏异常结束时刻,exception_window表示最大允许连续异常时间窗口,exception_window是一个超参数,分别对每个基本训练数据集Xi,i=1,2,...,K进行稀疏异常标记,标记方式为:
(1)若对
Figure FDA0002885721090000021
有yi,exception_time=0,且exception_end-exception_start>exception_window,则将对应数据标记为1,其余数据标记为0;
(2)若对
Figure FDA0002885721090000022
有yi,exception_time=identity,identity为任意值,且exception_end-exception_start>exception_window,则将对应数据标记为1,其余数据标记为0;
(3)若对
Figure FDA0002885721090000023
|yi,exception_timei|>ασi,α≥3,且
exception_end-exception_start>exception_window,则将对应数据标记为1,其余数据标记为0;
最终得到K个稀疏异常标记ei=[ei,start ei,start+t…ei,start+T]T,i=1,2,...K,其中每个元素属于0或1,是一个稀疏向量。
4.根据权利要求1所述的基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于:所述步骤S3包括以下子步骤:
S301.分别对每个基本训练数据集Xi,计算异常比例zi及丢弃概率pi,其中,sample越小,则丢弃概率越大:
Figure FDA0002885721090000024
Figure FDA0002885721090000025
S302.计算总体丢弃概率P:
Figure FDA0002885721090000031
S303.合并K个基本训练数据集为1个总训练集,合并时仍按时间排序,同一时刻,合并K个基本训练数据集该时刻的数据,再进行下一时刻的合并,得到总训练集X,总体稀疏异常标记E,总体目标值Y为:
Figure FDA0002885721090000032
5.根据权利要求1所述的基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于:所述步骤S4包括以下子步骤:
S401.选取训练评价指标;
S402.使用标准五折交叉验证方法,将总训练集X五等分为Xcv1,Xcv2,Xcv3,Xcv4,Xcv5,对应地,将总体稀疏异常标记E五等分为Ecv1,Ecv2,Ecv3,Ecv4,Ecv5,将总体目标值Y五等分为Ycv1,Ycv2,Ycv3,Ycv4,Ycv5
Figure FDA0002885721090000033
得到五组交叉验证训练集:
Figure FDA0002885721090000041
Figure FDA0002885721090000042
Figure FDA0002885721090000043
Figure FDA0002885721090000044
Figure FDA0002885721090000045
同时,对于每组交叉验证训练集,以对应方式组织Etrain,Evalid,Ytrain,Yvalid
S403.选用机器学习回归算法;
S404.进行交叉验证训练,每折交叉验证训练前,对训练集train和验证集valid中分别生成两组随机数:train_r,与训练集train对应的Etrain具有相同的维度;valid_r,与验证集valid对应的Evalid具有相同的维度;随机数的值在0到1之间,在交叉验证训练前,将train_r<P×Etrain,valid_r<P×Evalid对应的样本丢弃,不参与本次交叉验证训练的训练和验证;
交叉验证训练完成后,得到5个回归模型:Modeli,i=1,2...5。
6.根据权利 要求1所述的一种基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于:所述的步骤S5包括:
利用5个回归模型对待预测数据生成5个预测predictioni,i=1,2,...5,使用模型平均融合,并将融合结果乘以总体丢弃概率得到最终预测:
Figure FDA0002885721090000046
7.根据权利 要求2所述的一种基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于:所述目标建筑为一整栋建筑、建筑中的某一楼层或建筑下的某一住宅,所述目标建筑的c个基本信息特征包括建筑面积、建筑物启用时间、楼层和用途中两种以上的组合。
8.根据权利要求2所述的基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于:所述天气数据包括但不限于室外温度,室内温度,湿度和风速。
9.根据权利 要求5所述的一种基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于所述训练评价指标包括但不限于RMSE和RMSLE。
10.根据权利 要求1所述的一种基于稀疏异常感知的边缘设备下的电量预测方法,其特征在于:所述步骤S4中,选用的机器学习回归算法包括但不限于线性回归算法、梯度提升树算法和XGBOOST算法。
CN202010772041.8A 2020-08-04 2020-08-04 一种基于稀疏异常感知的边缘设备下的电量预测方法 Active CN111898829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010772041.8A CN111898829B (zh) 2020-08-04 2020-08-04 一种基于稀疏异常感知的边缘设备下的电量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010772041.8A CN111898829B (zh) 2020-08-04 2020-08-04 一种基于稀疏异常感知的边缘设备下的电量预测方法

Publications (2)

Publication Number Publication Date
CN111898829A CN111898829A (zh) 2020-11-06
CN111898829B true CN111898829B (zh) 2021-03-19

Family

ID=73184023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010772041.8A Active CN111898829B (zh) 2020-08-04 2020-08-04 一种基于稀疏异常感知的边缘设备下的电量预测方法

Country Status (1)

Country Link
CN (1) CN111898829B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114239743B (zh) * 2021-12-22 2023-12-15 电子科技大学 一种基于稀疏时间序列数据的天气事件发生时间预测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319962B (zh) * 2018-01-29 2021-11-23 安徽大学 一种基于卷积神经网络的刀具磨损监测方法
CN108805331A (zh) * 2018-05-04 2018-11-13 北京国电通网络技术有限公司 一种用电量预测方法
CN110991657A (zh) * 2019-11-22 2020-04-10 深圳市魔数智擎人工智能有限公司 一种基于机器学习的异常样本检测方法

Also Published As

Publication number Publication date
CN111898829A (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
CN109324291B (zh) 一种针对质子交换膜燃料电池寿命预测的预测方法
Yang et al. A new method to develop typical weather years in different climates for building energy use studies
CN103336867B (zh) 质子交换膜燃料电池模型优化处理方法
CN108399470B (zh) 一种基于多示例遗传神经网络的室内pm2.5预测方法
CN106991504A (zh) 基于分项计量时间序列的建筑能耗预测方法、系统及建筑物
CN103106544A (zh) 一种基于t-s型模糊神经网络的光伏发电预测系统
CN108510147B (zh) 一种基于残差波动模型的电能质量综合评价方法
CN111695736A (zh) 一种基于多模型融合的光伏发电短期功率预测方法
CN111898829B (zh) 一种基于稀疏异常感知的边缘设备下的电量预测方法
CN114065646B (zh) 基于混合优化算法的能耗预测方法、云计算平台及系统
CN112906757A (zh) 模型训练方法、光功率预测方法、装置、设备及存储介质
CN115310727B (zh) 一种基于迁移学习的建筑冷热电负荷预测方法及系统
CN105159085A (zh) 空调所属建筑物二阶等效热参数模型的实时参数辨识方法
CN107292439A (zh) 一种基于时变混合Copula函数的短期风速预测的方法与装置
CN113591215A (zh) 基于不确定性的异常卫星组件布局检测方法
CN114897241A (zh) 一种基于数字孪生的楼宇能效智能化监管预测方法
CN116611702A (zh) 一种面向楼宇综合能源管理的集成学习光伏发电预测方法
CN107036880A (zh) 轨道交通电子单板加速寿命试验方法
CN112199850B (zh) 一种基于过程特征的系统弹性分布规律研究方法
Qiu et al. A balance-of-plant vanadium redox battery system model
CN117634737A (zh) 光伏发电预测模型构建方法、光伏供能调控方法和设备
CN117057230A (zh) 质子交换膜燃料电池老化性能预测方法、装置及电子设备
CN115879378B (zh) 一种电芯的膨胀力预测模型的训练方法及装置
Aruta et al. Machine learning to predict building energy performance in different climates
Kapetanakis et al. Selection of input variables for a thermal load prediction model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant