CN107992968B - 基于集成时间序列分析技术的电能表计量误差预测方法 - Google Patents

基于集成时间序列分析技术的电能表计量误差预测方法 Download PDF

Info

Publication number
CN107992968B
CN107992968B CN201711221864.6A CN201711221864A CN107992968B CN 107992968 B CN107992968 B CN 107992968B CN 201711221864 A CN201711221864 A CN 201711221864A CN 107992968 B CN107992968 B CN 107992968B
Authority
CN
China
Prior art keywords
data
electric energy
energy meter
model
metering error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711221864.6A
Other languages
English (en)
Other versions
CN107992968A (zh
Inventor
贾兴林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Sihan Technology Co ltd
Original Assignee
Chengdu Sihan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Sihan Technology Co ltd filed Critical Chengdu Sihan Technology Co ltd
Priority to CN201711221864.6A priority Critical patent/CN107992968B/zh
Publication of CN107992968A publication Critical patent/CN107992968A/zh
Application granted granted Critical
Publication of CN107992968B publication Critical patent/CN107992968B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R35/00Testing or calibrating of apparatus covered by the other groups of this subclass
    • G01R35/04Testing or calibrating of apparatus covered by the other groups of this subclass of instruments for measuring time integral of power or current
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于集成时间序列分析技术的电能表计量误差预测方法,包括:对计量误差及相关数据进行数据异常处理和数据概括;将处理后的计量误差数据依据时间特性划分为多份数据集;构建时间序列模型ARIMA和神经网络模型,并进行训练评估;集成所述时间序列模型ARIMA和神经网络模型,从而获得最终预测结果。本发明提供的于集成时间序列分析技术的电能表计量误差预测方法,较传统时间序列分析方法有了更强的预测能力;将时间序列模型与神经网络模型一起组成基模型,能够有效利用多个单模型的特点,提升预测能力和准确性。

Description

基于集成时间序列分析技术的电能表计量误差预测方法
技术领域
本发明涉及电能表计量领域,具体涉及一种基于集成时间序列分析技术的电能表计量误差预测方法。
背景技术
随着国民经济的不断发展和人们生活水平的不断提高,每年的用电量也在稳步增长。电能表计量的准确性与电力企业、用户的经济利益直接相关,长期以来电力运营单位对电能表计量误差的研究主要集中在事后的维修,电能表计量误差影响因素的分析等方面。而由于数据和分析技术的限制,对电能表计量误差的预测方面工作还较少。申请号为201610593828.1的发明专利申请公开了一种基于ITD和时间序列分析的计量误差计算方法,其误差预测的方式为:
1)通过本征时间尺度分解(ITD)法将原计量误差时间序列数据分解成若干分量;
2)针对各个分量序列进行单序列的时间序列建模(ARMA\ARIMA)和预测;
3)最后将预测结果进行叠加获得电能表计量误差的未来预测值。
这种方法依据计量误差数据本身的信号特征,对其进行分解和时间序列分析,虽然能够在一定程度上对计量误差进行预测,但仍然存在几方面的不足:
1)主要利用的是数据本身的时频特征,没有加入外部影响特征的数据,模型缺少对影响计量误差的因素(及间接因素)的表达。
2)经典的时间序列分析方法(如ARIMA)对数据本身统计特性要求较为严格,建模过程繁琐。
3)单个预测模型对复杂的计量误差时序数据建模和预测能力较弱。
发明内容
针对现有技术的不足,本发明的主要目的在于:提出一种以时间序列分析和神经网络为基模型的集成学习方法,基于电能表监控设备采集的海量计量数据,以及外部社会经济活动数据为基础,实现对电能表计量误差的预测。
为实现前述目的,本发明公开了一种基于集成时间序列分析技术的电能表计量误差预测方法,包括以下步骤:
S1.对已采集的原始计量误差数据进行数据异常处理和数据概括,获得第i个电能表的计量误差数据序列为{ei,1,ei,2,…,ei,t},ei,t是第i个电能表在第t天的平均计量误差值;
S2.将处理后的计量误差数据依据时间特性划分为多份数据集,所述多份数据集包括训练集和测试集;
S3.构建时间序列预测模型ARIMA,使用所述训练集对所述ARIMA模型进行训练,获得最优时间序列模型,并使用所述最优时间序列模型预测未来h天的计量误差结果
Figure GDA0002988983860000021
Figure GDA0002988983860000022
表示第t+h天的计量误差值;
S4.结合电能表相关数据作为输入特征构建神经网络模型Nnet,预测未来h天的计量误差结果
Figure GDA0002988983860000023
Figure GDA0002988983860000024
表示第t+h天的计量误差值;
S5.根据所述预测结果和所述测试集,分别计算ARIMA模型和Nnet模型的均方根误差RMSEi,arima和RMSEi,nnet
S6.对所述ARIMA模型和所述Nnet模型进行集成学习,采用堆叠学习方法对预测结果进行加权,权重计算公式为:
Figure GDA0002988983860000025
其中,
Figure GDA0002988983860000026
最终,集成模型的预测结果为:
Figure GDA0002988983860000027
优选地,所述对原始计量误差数据进行数据异常处理包括采用时序数据异常检测算法对计量误差原始数据的异常值进行检测并处理,方法如下:
若ei,t,j(j∈{1,2,…,n})满足如下公式,
Figure GDA0002988983860000031
则判断ei,t,j为异常数据,并将其从数据集中删除;
若ei,t,k(k∈{1,2,…,n})满足如下公式,
Figure GDA0002988983860000032
则判断ei,t,k为异常数据,并将其从数据集中删除;
式中ei,t,k、ei,t,j表示第i个电能表在第t天中,第k/j个计量误差数据。
优选地,所述数据概况包括对计量误差数据采用如下公式按天进行均值化处理:
Figure GDA0002988983860000033
其中,ei,t是第i个电能表在第t天的平均计量误差值;ni,t是第i个电能表的第t天采集的有效计量误差数量;ei,t,k是第i个电能表在第t天的第k个计量误差数据。
优选地,所述数据集采用以下方法划分:
若第i个电能表的计量误差数据序列为{ei,1,ei,2,…,ei,t},验证的次数为nfolds,每次验证需要预测给定训练序列后h天的走势,训练集均从第1天开始,则训练集的长度分别为
Ltrain={t-nfolds×h,t-(nfolds-1)×h,…,t-h},(nfolds∈N,nfolds≥2);
则,训练集DTrain,lt={ei,1,ei,1,…,ei,lt},对应测试集DTest,lt,h={ei,lt+1,ei,lt+2,…,ei,lt+h},其中,lt∈Ltrain
优选地,步骤S4中所述电能表相关数据包括:法定节假日数据、工作日数据、周末数据。
优选地,所述步骤S3具体包括:
S31.在DTrain,lt数据集上构建ARIMA模型:
Figure GDA0002988983860000041
式中,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为差分次数,
Figure GDA0002988983860000042
表示的是对ei,t进行d阶差分处理后的计量误差数据,
Figure GDA0002988983860000043
是自回归部分需要求解的参数,θ12,…,θq是移动平均部分需要求解的参数;
S32.生成p,q的候选集合{p1,…,pi,…,pm}、{q1,…,qk,…,qh},且qi,qk∈{0,1,…};d的候选集为dj∈{0,1,2};
S33.采用grid搜索方法对p,d,q的每一个参数候选值进行遍历,对每一对(pi,dj,qk)得到ARIMA(pi,dj,qk)模型,求解参数
Figure GDA0002988983860000044
和θ12,…,θq
S34.计算ARIMA(pi,dj,qk)的AIC值,计算公式如下:
Figure GDA0002988983860000045
式中,
Figure GDA0002988983860000046
为该模型的残差平方和,即:
Figure GDA0002988983860000047
d为时间序列的样本数量,pi与qk分别为AR和MA的阶数;
S35.比较AIC(i,j,k)的取值,选择min(AIC(i,j,k))对应的模型作为最优时间序列模型,记为BestArimai,lt
S36.利用BestArimai,lt模型预测接下来h天的计量误差结果,记为:
Figure GDA0002988983860000048
predi,lt,h表示第i个电能表,在lt天后的h天中每天的计量误差值。
优选地,所述步骤S4具体包括:
S41.构建单隐藏层神经网络模型;
S42.采用BP算法求解神经网络参数;
S43.激活函数采用sigmoid函数,即
Figure GDA0002988983860000051
S44.采用单步长递归预测的方法,预测第i个电能表在未来h天的计量误差:
A.采用Nneti,lt预测第lt+1天的计量误差值得到
Figure GDA0002988983860000052
B.将
Figure GDA0002988983860000053
作为第lt+1天的计量误差估计值,用于生成预测lt+2天的特征,并预测
Figure GDA0002988983860000054
重复以上A、B两步,直到完全得到h天的所有预测结果
Figure GDA0002988983860000055
优选地,根据测试集数据DTest,lt,h,第i个电能表的ARIMA模型的均方根误差RMSEi,arima为:
Figure GDA0002988983860000056
式中,nfolds为验证的次数,h为每次预测的时间间隔,
Figure GDA0002988983860000057
为每次计量误差预测值,ei,lt+j为实际计量误差值,lt∈Ltrain
优选地,根据测试集数据DTest,lt,h,第i个电能表的Nnet模型的均方根误差RMSEi,nnet为:
Figure GDA0002988983860000058
其中,nfolds为验证的次数,h为每次预测的时间间隔,
Figure GDA0002988983860000059
为每次计量误差预测值,ei,lt+j为实际计量误差值,lt∈Ltrain
优选地,求解参数
Figure GDA00029889838600000510
和θ12,…,θq的方法包括近似极大似然估计法、自回归逼近法。
与现有技术相比,本发明的优点在于:本发明公开的一种基于集成时间序列分析技术的电能表计量误差预测方法,在海量数据的基础上,通过对电能表计量误差时序数据构建集成学习模型,预测电能表计量误差的未来趋势。其采用误差时序数据的时频特征、外部解释特征相结合的方式构建神经网络预测模型,较传统时间序列分析方法有了更强的预测能力;将时间序列模型与神经网络模型一起组成基模型,能够有效利用多个单模型的特点,提升预测能力和准确性;并且解决了计量误差时序数据建模中涉及的ARIMA自动定参的问题。
附图说明
图1是本发明一典型实施例公开的一种神经网络模型的网络结构拓扑图。
具体实施方式
鉴于现有技术中的不足,本案发明人经长期研究和大量实践,得以提出本发明的技术方案。如下将对该技术方案、其实施过程及原理等作进一步的解释说明。
本发明提出的基于集成时间序列分析技术的电能表计量误差预测方法,主要包括:
1、对计量误差及相关数据预处理,包括时序异常数据识别及处理、数据概括等方式;
2、对计量误差数据序列构建时间序列模型ARIMA:采用GridSearch(网格搜索)法搜索ARIMA方法参数,并结合AIC(赤池信息准则)确定最优模型,实现时间序列分析模型自动定参,最后使用最优模型进行未来几天的计量误差预测;
3、构建神经网络模型,在进行输入特征设计时,不仅考虑误差数据本身的特征,还引入了外部解释特征(如环境、电量等),并使用月份、节假日、误差短期趋势等特征对电量、环境进行间接的刻画;采用单步长递归预测的方法,对未来几天的计量误差进行预测;
4、集成时间序列分析模型和神经网络模型,获取最终预测结果。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。本发明实施例将通过数据处理、基模型构建、模型集成预测三个方面,对本发明技术方案进行阐述,具体如下:
一、数据处理
1.数据来源
为实现对电能表计量误差的预测,除需要对计量误差数据本身进行采集外,还需要电能表的运行负荷(如电流、功率)、环境等信息。而运行负荷与区域内的社会经济活动有密切关联,但对社会经济活动的预测本身存在较大的不确定性,因此通过月份、节假日等因素间接刻画这些因素的影响。因此,数据主要包括以下两方面。
1)来自国家电网的电能表的基本信息,以及传感器采集的计量误差、微气象数据等。
2)来自相关部门的法定节假日、经济数据等。
2.数据预处理
通过电能表状态监控传感器采集的海量传感器数据,这部分数据中存在大量的异常值、数据粒度较小(15分钟/次)等情况。数据处理环节,主要针对采集的原始数据进行数据清洗工作,以满足后续预测建模需要。
1)数据异常处理
采用时序数据异常检测算法对计量误差原始数据的异常值进行检测并处理。
Figure GDA0002988983860000071
Figure GDA0002988983860000072
公式1、2中ei,t,k、ei,t,j表示第i个电能表在第t天中,第k/j个计量误差数据。
若ei,t,j满足公式1,则ei,t,j异常数据;若ei,t,k满足公式2,说明ei,t,k(k∈{1,2,…,n})全部为某个恒定值,则全部判断为异常数据。对所有异常数据均从数据集中予以剔除。
2)数据概括
原始传感器采集的数据频率为15分钟/次,也就是计量误差数据的时间粒度是15分钟。根据实际的应用需求,以及后续数据融合的需要,对计量误差数据按天进行均值化处理,公式如下。
Figure GDA0002988983860000073
其中,ei,t是第i个电能表在第t天的平均计量误差值;ni,t是第i个电能表的第t天采集的有效计量误差数量;ei,t,k是第i个电能表在第t天的第k个观测值。
二、基模型构建
构建基模型主要包括:模型评估数据集生成、ARIMA时间序列模型和神经网络模型构建等过程。
1、模型评估数据集生成
现有技术中对模型的测试和验证常用的方法包括K折-交叉验证(K-foldCross-validation)、留一法验证(Leave-One-Out)等,这些方法的主要思想是采用随机分割的方式将数据划分成独立的训练集和测试集,在训练集上进行模型的训练,然后在测试集(或样本)上评估模型的效果。
由于计量误差数据属于时间序列数据,存在先后特性,采用通常的随机生成的方式进行数据划分会改变数据的这种特性。因此,本发明实施例采用如下方法生成多份数据集,完成对模型的训练和评估,以保证模型测试结果的可靠性。
若第i个电能表的计量误差数据序列为{ei,1,ei,2,…,ei,t},验证的次数为nfolds,每次验证需要预测给定训练序列后h天的走势,训练集均从第1天开始,则:
√训练集的长度分别为:
Ltrain={t-nfolds×h,t-(nfolds-1)×h,…,t-h}(nfolds∈N,nfolds≥2)
√数据集的构成如下:
训练集为:DTrain,lt={ei,1,ei,1,…,ei,lt},对应测试集为:DTest,lt,h={ei,lt+1,ei,lt+2,…,ei,lt+h}。其中,lt∈Ltrain
2、构建ARIMA时间序列模型
在每份验证数据集上构建时间模型,即分别要进行nfolds次的以下建模和测试评估过程。
在DTrain,lt数据集上构建ARIMA模型ARIMA(p,d,q),AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为差分次数,对应方程表达为:
Figure GDA0002988983860000091
其中,
Figure GDA0002988983860000092
表示的是对ei,t进行d阶差分处理后的计量误差数据,
Figure GDA0002988983860000093
是自回归部分需要求解的参数,θ12,…,θq是移动平均部分需要求解的参数。
经典的ARIMA(p,d,q)建模过程是:首先,指定模型参数q,d,q∈{0,1,…},然后利用最小二乘法等方法求解具体的
Figure GDA0002988983860000094
Δ和θ12,…,θq参数值。
其中,对p,d,q的设计往往依赖于建模人员的个人经验指定,不利于实现自动化建模。本发明实施例公开的技术方案针对该问题采用以下方式进行解决。
1)生成p,q的候选集合{p1,…,pi,…,pm}、{q1,…,qk,…,qh},且qi,qk∈{0,1,…};d的候选集为dj∈{0,1,2}。
2)采用GridSearch搜索方法对p,d,q的每一个参数候选值进行遍历,对每一对(pi,dj,qk)得到ARIMA(pi,dj,qk)模型,可用近似极大似然估计、自回归逼近法等方法求解参数
Figure GDA0002988983860000095
和θ12,…,θq。计算ARIMA(pi,dj,qk)的AIC值,计算公式如下:
Figure GDA0002988983860000096
其中
Figure GDA0002988983860000097
为该模型的残差平方和,即:
Figure GDA0002988983860000098
d为时间序列的样本数量,pi与qk分别为AR和MA的阶数。
3)比较AIC(i,j,k)的取值,选择min(AIC(i,j,k))的模型作为最优的时间序列模型,记为BestArimai,lt
4)对模型进行评估
利用BestArimai,lt模型预测接下来h天的计量误差结果,记为:
Figure GDA0002988983860000099
predi,lt,h表示第i个电能表,在lt天后的h天中每天的计量误差值;对应的真实值为DTest,lt,h。则最终第i个电能表的ARIMA模型的RMSE(均方根误差)指标计算如下:
Figure GDA0002988983860000101
其中,nfolds为验证的次数,h为每次预测的时间间隔,
Figure GDA0002988983860000102
为每次计量误差预测值,ei,lt+j为实际计量误差值,lt∈Ltrain
3、构建神经网络模型
神经网络模型是一种有监督的机器学习模型,主要将影响电能表计量误差的当前数据(特征)作为输入,预测电能表的下一天计量误差。
1)特征设计
特征设计主要用于构建监督式神经网络的输入数据,根据计量误差数据的实际特点,主要采用下列特征(若需要预测第t+1天的平均误差水平):
√是否国庆假期:第t+1天是否属于法定的国庆假期,记为f1
√是否春节假期:第t+1天是否属于春节假期,记为f2
√是否其它法定节假日:第t+1天是否属于其它法定节假日,记为f3
√是否周末:第t+1天是否属于周末,记为f4
√Lag特征:电能表计量误差之前p天的计量误差序列,记为ei,t-1,ei,t-2,...,ei,t-p
2)构建神经网络模型
在每份验证数据集上构建模型,即分别要进行nfolds次的以下建模和测试评估过程。
在DTrain,lt计量误差序列上生成以上特征,并作为输入构建神经网络模型,构建单隐藏层神经网络模型:
√在电能表计量误差预测应用中,将p设置为7。
√激活函数采用sigmoid,即
Figure GDA0002988983860000103
√输出为:第i个电能表的下一天计量误差数据。
网络结构拓扑图如1所示,wm,n表示节点m、n之间的权重系数,an表示隐藏层网络节点。
3)神经网络模型求解
神经网络参数求解算法采用BP算法,得到神经网络模型为Nneti,lt
4)对未来的预测
要预测第i个电能表在未来h天的计量误差,采用单步长递归预测的方法,即:
√采用Nneti,lt模型预测第lt+1天的计量误差值得到
Figure GDA0002988983860000111
√将
Figure GDA0002988983860000112
作为第lt+1天的计量误差估计值,用于生成预测lt+2天的特征,并预测
Figure GDA0002988983860000113
√重复以上两步,直到完全得到h天的所有预测结果
Figure GDA0002988983860000114
5)对模型进行评估
同ARIMA模型评估方法一致,采用公式6计算神经网络模型的均方根误差结果,得到评估值记为RMSEi,nnet
三、模型集成预测
采用堆叠(Stack)集成的方式对模型进行集成,即:通过根据模型在测试数据集上的表现对模型预测的结果进行加权。
1.加权方式
在构建基模型的过程中,已计算出ARIMA和神经网络模型的RMSE指标分别为RMSEi,arima、RMSEi,nnet向量表达为
Figure GDA0002988983860000115
RMSE越大,模型效果越差,模型在最终预测结果中权重应越小,因此采用如下公式生成权重:
Figure GDA0002988983860000116
2.集成模型生成及预测
若电能表计量误差序列为{ei,1,ei,2,…,ei,t},采用ARIMA模型、神经网络模型预测未来h天的误差走势结果分别为
Figure GDA0002988983860000121
则集成模型的预测结果表达为:
Figure GDA0002988983860000122
本发明公开的基于集成时间序列分析技术的电能表计量误差预测方法,通过对电能表计量误差时序数据构建集成学习模型,来预测电能表计量误差的未来趋势。本发明技术方案采用误差时序数据的时频特征、外部解释特征相结合的方式构建神经网络预测模型,较传统时间序列分析方法有了更强的预测能力;通过构建时间序列模型,并与神经网络模型一起组成基模型,通过Stack学习(基模型线性加权)的方式对基模型的结果进行集成学习,生成最终的预测结果,提高了预测准确率;最后,本发明技术方案还对计量误差时序数据建模中涉及的数据概括及预处理、模型验证数据集生成、ARIMA自动定参等问题给出了解决方案。
应当理解,上述实施例仅为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。

Claims (10)

1.基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,包括以下步骤:
S1.对已采集的原始计量误差数据进行数据异常处理和数据概括,获得概况处理后第i个电能表的计量误差数据序列为{ei,1,ei,2,…,ei,t},ei,t是第i个电能表在第t天的平均计量误差值;
S2.将处理后的计量误差数据依据时间特性划分为多份数据集,所述多份数据集包括训练集和测试集;
S3.构建时间序列预测模型ARIMA,使用所述训练集对所述ARIMA模型进行训练,获得最优时间序列模型,并使用所述最优时间序列模型预测未来h天的计量误差结果
Figure FDA0002988983850000011
Figure FDA0002988983850000012
表示第i个电能表第t+h天的计量误差值;
S4.结合电能表相关数据作为输入特征构建神经网络模型Nnet,预测未来h天的计量误差结果
Figure FDA0002988983850000013
Figure FDA0002988983850000014
表示第i个电能表第t+h天的计量误差值;
S5.根据所述预测结果和所述测试集,分别计算ARIMA模型和Nnet模型的均方根误差RMSEi,arima和RMSEi,nnet
S6.对所述ARIMA模型和所述Nnet模型进行集成学习,采用堆叠学习方法对预测结果进行加权,权重计算公式为:
Figure FDA0002988983850000015
其中,
Figure FDA0002988983850000016
最终,集成模型的预测结果为:
Figure FDA0002988983850000017
2.根据权利要求1所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,所述对原始计量误差数据进行数据异常处理包括采用时序数据异常检测算法对计量误差原始数据的异常值进行检测并处理,方法如下:
若ei,t,j(j∈{1,2,…,n})满足如下公式,
Figure FDA0002988983850000018
则判断ei,t,j为异常数据,并将其从数据集中删除;
若ei,t,k(k∈{1,2,…,n})满足如下公式:
Figure FDA0002988983850000021
则判断ei,t,k为异常数据,并将其从数据集中删除;
式中ei,t,k、ei,t,j表示第i个电能表在第t天中,第k或第j个计量误差数据,n为计量误差数量。
3.根据权利要求1所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,所述数据概况包括对计量误差数据采用如下公式按天进行均值化处理:
Figure FDA0002988983850000022
其中,ei,t是第i个电能表在第t天的平均计量误差值;ni,t是第i个电能表的第t天采集的有效计量误差数量;ei,t,k是第i个电能表在第t天的第k个计量误差数据。
4.根据权利要求1所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,所述数据集采用以下方法划分:
若第i个电能表的计量误差数据序列为{ei,1,ei,2,…,ei,t},验证的次数为nfolds,每次验证需要预测给定训练序列后h天的走势,训练集均从第1天开始,则训练集的长度分别为
Ltrain={t-nfolds×h,t-(nfolds-1)×h,…,t-h},(nfolds∈N,nfolds≥2)
则,训练集DTrain,lt={ei,1,ei,1,…,ei,lt},对应测试集DTest,lt,h={ei,lt+1,ei,lt+2,…,ei,lt+h},其中,lt∈Ltrain
5.根据权利要求1所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,步骤S4中所述电能表相关数据包括:法定节假日数据、工作日数据、周末数据。
6.根据权利要求4所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,所述步骤S3具体包括:
S31.在DTrain,lt数据集上构建ARIMA模型:
Figure FDA0002988983850000031
式中,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为差分次数,
Figure FDA0002988983850000032
表示的是对ei,t进行d阶差分处理后的计量误差数据,
Figure FDA0002988983850000033
是自回归部分需要求解的参数,θ12,…,θq是移动平均部分需要求解的参数;
S32.生成p,q的候选集合{p1,…,pi,…,pm}、{q1,…,qk,…,qh},且qi,qk∈{0,1,…,N},N为整数;d的候选集为dj∈{0,1,2};
S33.采用grid搜索方法对p,d,q的每一个参数候选值进行遍历,对每一对(pi,dj,qk)得到ARIMA(pi,dj,qk)模型,求解参数
Figure FDA0002988983850000034
和θ12,…,θq
S34.计算ARIMA(pi,dj,qk)的AIC值,计算公式如下:
Figure FDA0002988983850000035
式中,
Figure FDA0002988983850000036
为该模型的残差平方和,即:
Figure FDA0002988983850000037
d为时间序列的样本数量,pi与qk分别为AR和MA的阶数;
S35.比较AIC(i,j,k)的取值,选择min(AIC(i,j,k))对应的模型作为最优时间序列模型,记为BestArimai,lt
S36.利用BestArimai,lt模型预测接下来h天的计量误差结果,记为:
Figure FDA0002988983850000038
predi,lt,h表示第i个电能表在lt天后的h天中每天的计量误差值。
7.根据权利要求4所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,所述步骤S4具体包括:
S41.构建单隐藏层神经网络模型;
S42.采用BP算法求解神经网络参数;
S43.激活函数采用sigmoid函数,即
Figure FDA0002988983850000041
S44.采用单步长递归预测的方法,预测第i个电能表在未来h天的计量误差:
A.采用Nneti,lt预测第lt+1天的计量误差值得到
Figure FDA0002988983850000042
B.将
Figure FDA0002988983850000043
作为第lt+1天的计量误差估计值,用于生成预测lt+2天的特征,并预测
Figure FDA0002988983850000044
重复以上A、B两步,直到完全得到h天的所有预测结果
Figure FDA0002988983850000045
8.根据权利要求6所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,根据测试集数据DTest,lt,h,第i个电能表的ARIMA模型的均方根误差RMSEi,arima为:
Figure FDA0002988983850000046
式中,nfolds为验证的次数,h为每次预测的时间间隔,
Figure FDA0002988983850000047
为每次计量误差预测值,ei,lt+j为实际计量误差值,lt∈Ltrain
9.根据权利要求7所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,根据测试集数据DTest,lt,h,第i个电能表的Nnet模型的均方根误差RMSEi,nnet为:
Figure FDA0002988983850000048
其中,nfolds为验证的次数,h为每次预测的时间间隔,
Figure FDA0002988983850000049
为每次计量误差预测值,ei,lt+j为实际计量误差值,lt∈Ltrain
10.根据权利要求5所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于:求解参数
Figure FDA00029889838500000410
和θ12,…,θq的方法包括近似极大似然估计法、自回归逼近法。
CN201711221864.6A 2017-11-29 2017-11-29 基于集成时间序列分析技术的电能表计量误差预测方法 Active CN107992968B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711221864.6A CN107992968B (zh) 2017-11-29 2017-11-29 基于集成时间序列分析技术的电能表计量误差预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711221864.6A CN107992968B (zh) 2017-11-29 2017-11-29 基于集成时间序列分析技术的电能表计量误差预测方法

Publications (2)

Publication Number Publication Date
CN107992968A CN107992968A (zh) 2018-05-04
CN107992968B true CN107992968B (zh) 2021-12-24

Family

ID=62033973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711221864.6A Active CN107992968B (zh) 2017-11-29 2017-11-29 基于集成时间序列分析技术的电能表计量误差预测方法

Country Status (1)

Country Link
CN (1) CN107992968B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109061544B (zh) * 2018-08-23 2020-11-06 广东工业大学 一种电能计量误差估计方法
CN109298375B (zh) * 2018-10-31 2022-04-15 中国电力科学研究院有限公司 一种用于更换标准电能表组内标准电能表的方法及系统
CN109597014A (zh) * 2018-11-30 2019-04-09 国网上海市电力公司 一种基于人工智能技术的电能表误差诊断方法
CN111310964B (zh) * 2018-12-12 2024-04-26 长春理工大学 一种负荷预测方法及装置
CN111310960A (zh) * 2018-12-12 2020-06-19 华北电力大学扬中智能电气研究中心 一种能源消耗预测方法及装置
CN110059845B (zh) * 2019-02-01 2023-01-24 国网浙江省电力有限公司温州供电公司 基于时序演化基因模型的计量装置时钟误差趋势预测方法
CN111476392A (zh) * 2019-12-05 2020-07-31 国网浙江省电力有限公司温州供电公司 基于社会感知的计量装置时钟误差趋势预测方法
CN111103565B (zh) * 2019-12-11 2022-03-01 国网天津市电力公司电力科学研究院 一种基于智能电能表计量误差分析的数据变换方法及系统
CN111651444B (zh) * 2020-05-25 2023-04-18 成都千嘉科技股份有限公司 一种自适应时间序列数据预测方法
CN113722300A (zh) * 2021-07-16 2021-11-30 国网浙江省电力有限公司营销服务中心 基于用电特征的电能表运行误差计算数据清洗系统及方法
CN117131926A (zh) * 2023-10-24 2023-11-28 山东计保电气有限公司 一种基于数据存储的电能计量误差分析方法
CN117239740B (zh) * 2023-11-14 2024-01-23 北京国科恒通数字能源技术有限公司 一种虚拟电厂系统的优化配置与灵活性提升方法及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000134165A (ja) * 1998-10-28 2000-05-12 Freeman Engineering Kk 都市雑音解析装置
CN102270309B (zh) * 2011-07-27 2013-05-01 华北电力大学 一种基于集成学习的短期电力负荷预测方法
CN102495389B (zh) * 2011-12-23 2014-09-24 安徽节源节能科技有限公司 电工测量仪器模型校准方法及系统
JP6017901B2 (ja) * 2012-09-14 2016-11-02 ラピスセミコンダクタ株式会社 半導体装置および計測装置
CN105184674B (zh) * 2015-09-07 2018-12-18 杭州凯达电力建设有限公司 一种电能计量误差预测方法及设备
CN105354663B (zh) * 2015-10-20 2020-01-31 杭州电力设备制造有限公司 基于时间序列相似度的电力互感器误差分析方法及系统
US9747790B1 (en) * 2016-02-12 2017-08-29 King Fahd University Of Petroleum And Minerals Method, device, and computer-readable medium for correcting at least one error in readings of electricity meters
CN106203732A (zh) * 2016-07-26 2016-12-07 国网重庆市电力公司 基于itd和时间序列分析的计量误差计算方法
CN106291439A (zh) * 2016-07-26 2017-01-04 国网重庆市电力公司 用于电能误差分解的时频分析方法
CN106338708B (zh) * 2016-08-30 2020-04-24 中国电力科学研究院 结合深度学习与递归神经网络的电能计量误差分析方法

Also Published As

Publication number Publication date
CN107992968A (zh) 2018-05-04

Similar Documents

Publication Publication Date Title
CN107992968B (zh) 基于集成时间序列分析技术的电能表计量误差预测方法
Sun et al. Using Bayesian deep learning to capture uncertainty for residential net load forecasting
JP6129028B2 (ja) 建物動力設備のエネルギー消費量予測方法
CN102013148B (zh) 多信息融合火灾探测方法
CN111310981B (zh) 一种基于时间序列的水库水位趋势预测方法
CN109726865A (zh) 基于emd-qrf的用户负荷概率密度预测方法、装置和存储介质
CN108830417B (zh) 一种基于arma和回归分析的生活能源消费预测方法及系统
CN111275255A (zh) 一种混凝土坝变形监测预报模型的构建方法
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
CN109358608A (zh) 一种基于集成学习的变压器状态风险评估方法及装置
El Maghraoui et al. Smart energy management system: A comparative study of energy consumption prediction algorithms for a hotel building
Lao et al. The optimized multivariate grey prediction model based on dynamic background value and its application
CN111652403A (zh) 一种基于反馈修正的工作平台任务工作量预测方法
Sallehuddin et al. Hybrid grey relational artificial neural network and auto regressive integrated moving average model for forecasting time-series data
Heng et al. A hybrid forecasting model based on empirical mode decomposition and the cuckoo search algorithm: a case study for power load
Singh et al. Machine learning-based time series models for effective co2 emission prediction in india
CN111105148B (zh) 离职概率评估方法、装置及计算机可读存储介质
Lu et al. A data envelopment analysis model for building energy efficiency benchmarking
Sinitsyna et al. Some practical aspects of electric power consumption time series analysis
Wati et al. Autoregressive Integrated Moving Average (ARIMA) Model for Forecasting Indonsesian Crude Oil Price
Panda et al. Machine learning using exploratory analysis to predict taxi fare
Grillone et al. Use of generalised additive models to assess energy efficiency savings in buildings using smart metering data
Gata et al. The Feasibility of Credit Using C4. 5 Algorithm Based on Particle Swarm Optimization Prediction
CN108830029A (zh) 一种台风数据的质量评估与修复方法
Ananth et al. An Enhanced Ensemble of Long Short-Term Memory and Vector AutoRegression for Energy Consumption Forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant