CN110969238A - 一种校准用电数据的方法及装置 - Google Patents

一种校准用电数据的方法及装置 Download PDF

Info

Publication number
CN110969238A
CN110969238A CN201911413184.3A CN201911413184A CN110969238A CN 110969238 A CN110969238 A CN 110969238A CN 201911413184 A CN201911413184 A CN 201911413184A CN 110969238 A CN110969238 A CN 110969238A
Authority
CN
China
Prior art keywords
consumption data
power consumption
value
day
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911413184.3A
Other languages
English (en)
Inventor
方潜生
张红艳
谢陈磊
杨亚龙
张毅
任守明
张振亚
李善寿
李杨
蒋婷婷
朱徐来
张睿
王萍
李雪飞
杨先锋
盛锦壮
袁翠艳
钟永祥
王浩杰
朱俊超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Jianzhu University
Original Assignee
Anhui Jianzhu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Jianzhu University filed Critical Anhui Jianzhu University
Priority to CN201911413184.3A priority Critical patent/CN110969238A/zh
Publication of CN110969238A publication Critical patent/CN110969238A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种校准用电数据的方法及装置,所述方法包括:构建用电数据集,将用电数据集分成两部分,一部分为训练样本,另一部分为测试样本;对训练样本和测试样本分别进行归一化处理;对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型;将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试;选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,对初始漂移值进行优化处理得到最优漂移值,将测试样本的用电数据减去最优漂移值得到校准的用电数据;本发明的优点在于:能够对用电数据校准。

Description

一种校准用电数据的方法及装置
技术领域
本发明涉及建筑环境中数据校准领域,更具体涉及一种校准用电数据的方法及装置。
背景技术
数据校准是指在建筑用电设备物联网环境下,对系统获取的数据进行分析处理,获得精准的数据。准确的数据是建筑安全、节能运行的基础;错误的数据导致高能耗,甚至影响运行安全;建筑数据来自于散布在建筑各个角落的传感器、执行器,检查、校核这些数据的人工成本非常高。数据校准能够解决上述提到的问题,而且能够给建筑运行过程中在数据方面提供准确的依据,具有提供精确数据、增加数据的可靠性等功能。由于建筑智能建筑的崛起,精准的用电数据能够反映建筑的运行情况,长时间的使用错误的数据,会让建筑运行受到局限性,造成一定的不必要的损失。
随着科技水平的发展对精准的数据要求越来越严格,建立数据校准模型是获取建筑运行过程中精准数据的关键,其中如何通过原始数据来得到更为精准数据是数据校准的关键。
中国专利公开号CN209516736U,公开了一种配电化终端,包括:用于获取目标用户的用电数据,并对用电数据进行转发的配电装置、用于对用电数据进行汇总,得到集成数据的间隔装置以及用于根据集成数据对目标用户进行用电管理的监控装置;其中,监控装置与M个间隔装置通信连接,每个间隔装置与N个配电装置通信连接;M≥2,N≥2。通过本申请所提供的配电化终端,可以获取更多目标用户的用电数据,并对更多目标用户的用电数据进行监控,所以,通过该申请所提供的配电化终端,可以大幅度减少主站所需设置的数量,从而可以有效缓减IP和网口等资源紧张的问题,进而可以大大减少工作人员对主站的维护压力。但是该申请只是对用电数据进行监控,不能对用电数据进行校准。
发明内容
本发明所要解决的技术问题在于如何提供一种校准用电数据的方法及装置,以对用电数据进行校准。
本发明通过以下技术手段实现解决上述技术问题的:一种校准用电数据的方法,所述方法包括:
步骤一:采集用电数据并进行去噪以后构建用电数据集,将用电数据集分成两部分,一部分为训练样本,另一部分为测试样本;
步骤二:对训练样本和测试样本分别进行归一化处理,获取归一化后的训练样本以及归一化后的测试样本;
步骤三:对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型;
步骤四:将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试,得到预测结果,将预测结果进行反归一化处理得到反归一化处理后的用电数据;
步骤五:选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,对初始漂移值进行优化处理得到最优漂移值,将测试样本的用电数据减去最优漂移值得到校准的用电数据。
本发明通过遗传算法对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型,然后将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试,得到预测结果,根据预测值和真实值来获取初始漂移值,卡尔曼滤波器跟踪和校准漂移值,进而来校准用电数据。
作为本发明进一步改进的方案,所述步骤一包括:
步骤101:采集初始用电数据,找出初始用电数据所有的极大值点和所有的极小值点,然后采用三次插值的方法将获得的这些极大值点连接起来形成上包络线,极小值点连接起来形成下包络线,则所有的初始用电数据都位于上包络线和下包络线之间;
步骤102:利用公式h1=x(k)–m1计算本征模态函数条件判断结果值,判断本征模态函数条件判断结果值是否满足本征模态函数的条件,如满足,则将h1作为本征模态函数分量,其中,x(k)为初始用电数据序列,m1为上包络线和下包络线之间数据的平均值序列,h1为本征模态函数条件判断结果值;
步骤103:若本征模态函数条件判断结果值不满足本征模态函数的条件,将h1作为初始用电数据,返回执行步骤101至步骤102,直到满足本征模态函数的条件;
步骤104:上述步骤得到第一个本征模态函数分量,利用公式r1=x(k)-C1从初始用电数据序列x(k)中将第一个本征模态函数分量分离出来,其中,C1为第一个本征模态函数分量,r1为第一个本征模态函数分量对应的用电数据;将r1作为初始用电数据返回执行步骤101至步骤103,得到第n个本征模态函数分量Cn,经过n次返回执行步骤101至步骤103,得到n个本征模态函数分量;当得到的分量不再满足本征模态函数的条件时,循环结束,此时,初始用电数据序列x(k)分解为
Figure BDA0002350506510000021
其中Ci为第i个本征模态函数分量,rn为第n个本征模态函数分量对应的用电数据;
步骤105:去掉分解的初始用电数据序列x(k)中几项高频信号进行EMD去噪得到重构用电数据序列,根据重构用电数据序列的时间序列选取每一天对应的最高温度、最低温度、节假日以及去噪后前两天和去噪后前一天的用电数据作为自变量,选取去噪当天的用电数据作为因变量,将自变量和因变量组合构成用电数据集elec(k),将用电数据集elec(k)一部分作为训练样本elec_train,另一部分作为测试样本elec_test。
作为本发明进一步改进的方案,所述步骤二中,训练样本为:
Figure BDA0002350506510000031
其中,elec_train为训练样本,i是训练样本的用电数据时间索引,表示第i天,ai表示去噪当天获取的第i天用电数据;bi表示第i天对应是否为节假日,若是则bi为1,若不是则bi为0;ei表示第i天对应的最高温度;fi表示第i天对应的最低温度;li表示去噪前两天获取的第i天用电数据;oi表示去噪前一天获取的第i天用电数据;
利用公式
Figure BDA0002350506510000032
对训练样本进行归一化处理,其中,I为训练样本的第I列且I=1,2...6,xI为训练样本第I列的数据值,xImax为训练样本第I列中最大的数值,xImin为训练样本第I列中最小的数值。
作为本发明进一步改进的方案,所述步骤二中,
测试样本为:
Figure BDA0002350506510000033
其中,elec_test为测试样本,j是测试样本的用电数据时间索引,表示第j天,aj表示去噪当天获取的第j天用电数据;bj表示第j天对应是否为节假日,若是则bj为1,若不是则bj为0;ej表示第j天对应的最高温度;fj表示第j天对应的最低温度;lj表示去噪前两天获取的第j天用电数据;oj表示去噪前一天获取的第j天用电数据;
利用公式
Figure BDA0002350506510000034
对测试样本进行归一化处理,其中,J为测试样本的第J列且J=1,2...6,xJ为测试样本第J列的数据值,xJmax为测试样本第J列中最大的数值,xJmin为测试样本第J列中最小的数值。
作为本发明进一步改进的方案,所述步骤三包括:
步骤301:遗传算法初始化支持向量机的参数,参数包括种群最大数量、种群最大进化代数、交叉概率p、变异概率s、惩罚因子c的限定范围以及核函数参数g的限定范围;
步骤302:对惩罚因子c以及核函数参数g进行二进制编码并初始化种群;
步骤303:利用公式
Figure BDA0002350506510000041
计算种群的适应度,其中,MSE为种群的适应度值,n为训练样本数,yi为真实的第i个训练样本的用电数据值;f(xi)为预测的第i个训练样本的用电数据值,且
Figure BDA0002350506510000042
其中,αi与αi *均为支持向量机的初始系数,且
Figure BDA0002350506510000043
||xf-xi||为二范数距离,xf表示特征集的特征向量,xi表示待预测的第i个训练样本;
步骤304:随机选择遗传个体;
步骤305:根据交叉概率p进行遗传个体交叉操作;
步骤306:根据变异概率s进行遗传个体变异操作;
步骤307:返回执行步骤303至步骤306,直至达到预设的迭代次数,输出最优的惩罚因子c以及最优的核函数参数g;
步骤308:将最优的惩罚因子c以及最优的核函数参数g进行解码;
步骤309:将解码后的最优的惩罚因子c以及最优的核函数参数g作为支持向量机的输入参数,获取遗传算法优化的支持向量机模型。
作为本发明进一步改进的方案,所述步骤五包括:
步骤501:选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,利用公式d(k|k-1)=d(k-1|k-1)预测当前时刻的下一时刻的漂移值,其中,d(k|k-1)为由当前时刻对下一时刻预测的漂移值,d(k-1|k-1)为当前时刻漂移值,k-1为当前时刻,k为下一时刻;
步骤502:根据预设的初始协方差利用公式p(k|k-1)=p(k-1|k-1)+Q预测下一时刻的协方差,其中,p(k|k-1)为由当前时刻对下一时刻预测的协方差,p(k-1|k-1)为初始协方差,Q为过程噪声的协方差;
步骤503:利用公式Kg(k)=p(k|k-1)HT(HP(k|k-1)HT+R)-1获取卡尔曼增益值,其中,H是测量系统的参数,R为测量噪声协方差,Kg(k)为K时刻的卡尔曼增益值,HT为测量系统的参数的转置矩阵;
步骤504:利用公式P(k|k)=[I1-Kg(k)H]p(k|k-1)获取K时刻最优协方差,利用公式z(k)=Hd(k|k-1)+R获取K时刻的测量值,利用公式d(k|k)=d(k|k-1)+Kg(k)(z(k)-Hd(k|k-1)获取K时刻最优漂移值,其中,I1为单位矩阵,P(k|k)为K时刻最优协方差,z(k)为K时刻的测量值,d(k|k)为K时刻最优漂移值;
步骤505:将K时刻最优漂移值作为当前时刻漂移值,将K时刻最优协方差作为初始协方差,返回执行步骤501至步骤504,直到达到预设的迭代次数,输出最优漂移值,将测试样本的用电数据减去漂移值得到校准的用电数据。
本发明还提供一种校准用电数据的装置,所述装置包括:
样本获取模块,用于采集用电数据并进行去噪以后构建用电数据集,将用电数据集分成两部分,一部分为训练样本,另一部分为测试样本;
归一化模块,用于对训练样本和测试样本分别进行归一化处理,获取归一化后的训练样本以及归一化后的测试样本;
模型获取模块,用于对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型;
预测模块,用于将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试,得到预测结果,将预测结果进行反归一化处理得到反归一化处理后的用电数据;
校准模块,用于选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,对初始漂移值进行优化处理得到最优漂移值,将测试样本的用电数据减去最优漂移值得到校准的用电数据。
作为本发明进一步改进的方案,所述样本获取模块还用于:
步骤101:采集初始用电数据,找出初始用电数据所有的极大值点和所有的极小值点,然后采用三次插值的方法将获得的这些极大值点连接起来形成上包络线,极小值点连接起来形成下包络线,则所有的初始用电数据都位于上包络线和下包络线之间;
步骤102:利用公式h1=x(k)–m1计算本征模态函数条件判断结果值,判断本征模态函数条件判断结果值是否满足本征模态函数的条件,如满足,则将h1作为本征模态函数分量,其中,x(k)为初始用电数据序列,m1为上包络线和下包络线之间数据的平均值序列,h1为本征模态函数条件判断结果值;
步骤103:若本征模态函数条件判断结果值不满足本征模态函数的条件,将h1作为初始用电数据,返回执行步骤101至步骤102,直到满足本征模态函数的条件;
步骤104:上述步骤得到第一个本征模态函数分量,利用公式r1=x(k)-C1从初始用电数据序列x(k)中将第一个本征模态函数分量分离出来,其中,C1为第一个本征模态函数分量,r1为第一个本征模态函数分量对应的用电数据;将r1作为初始用电数据返回执行步骤101至步骤103,得到第n个本征模态函数分量Cn,经过n次返回执行步骤101至步骤103,得到n个本征模态函数分量;当得到的分量不再满足本征模态函数的条件时,循环结束,此时,初始用电数据序列x(k)分解为
Figure BDA0002350506510000061
其中Ci为第i个本征模态函数分量,rn为第n个本征模态函数分量对应的用电数据;
步骤105:去掉分解的初始用电数据序列x(k)中几项高频信号进行EMD去噪得到重构用电数据序列,根据重构用电数据序列的时间序列选取每一天对应的最高温度、最低温度、节假日以及去噪后前两天和去噪后前一天的用电数据作为自变量,选取去噪当天的用电数据作为因变量,将自变量和因变量组合构成用电数据集elec(k),将用电数据集elec(k)一部分作为训练样本elec_train,另一部分作为测试样本elec_test。
作为本发明进一步改进的方案,所述归一化模块还用于:训练样本为:
Figure BDA0002350506510000062
其中,elec_train为训练样本,i是训练样本的用电数据时间索引,表示第i天,ai表示去噪当天获取的第i天用电数据;bi表示第i天对应是否为节假日,若是则bi为1,若不是则bi为0;ei表示第i天对应的最高温度;fi表示第i天对应的最低温度;li表示去噪前两天获取的第i天用电数据;oi表示去噪前一天获取的第i天用电数据;
利用公式
Figure BDA0002350506510000063
对训练样本进行归一化处理,其中,I为训练样本的第I列且I=1,2...6,xI为训练样本第I列的数据值,xImax为训练样本第I列中最大的数值,xImin为训练样本第I列中最小的数值。
作为本发明进一步改进的方案,所述归一化模块还用于:
测试样本为:
Figure BDA0002350506510000071
其中,elec_test为测试样本,j是测试样本的用电数据时间索引,表示第j天,aj表示去噪当天获取的第j天用电数据;bj表示第j天对应是否为节假日,若是则bj为1,若不是则bj为0;ej表示第j天对应的最高温度;fj表示第j天对应的最低温度;lj表示去噪前两天获取的第j天用电数据;oj表示去噪前一天获取的第j天用电数据;
利用公式
Figure BDA0002350506510000072
对测试样本进行归一化处理,其中,J为测试样本的第J列且J=1,2...6,xJ为测试样本第J列的数据值,xJmax为测试样本第J列中最大的数值,xJmin为测试样本第J列中最小的数值。
作为本发明进一步改进的方案,所述模型获取模块还用于:
步骤301:遗传算法初始化支持向量机的参数,参数包括种群最大数量、种群最大进化代数、交叉概率p、变异概率s、惩罚因子c的限定范围以及核函数参数g的限定范围;
步骤302:对惩罚因子c以及核函数参数g进行二进制编码并初始化种群;
步骤303:利用公式
Figure BDA0002350506510000073
计算种群的适应度,其中,MSE为种群的适应度值,n为训练样本数,yi为真实的第i个训练样本的用电数据值;f(xi)为预测的第i个训练样本的用电数据值,且
Figure BDA0002350506510000074
其中,αi与αi *均为支持向量机的初始系数,且
Figure BDA0002350506510000075
||xf-xi||为二范数距离,xf表示特征集的特征向量,xi表示待预测的第i个训练样本;
步骤304:随机选择遗传个体;
步骤305:根据交叉概率p进行遗传个体交叉操作;
步骤306:根据变异概率s进行遗传个体变异操作;
步骤307:返回执行步骤303至步骤306,直至达到预设的迭代次数,输出最优的惩罚因子c以及最优的核函数参数g;
步骤308:将最优的惩罚因子c以及最优的核函数参数g进行解码;
步骤309:将解码后的最优的惩罚因子c以及最优的核函数参数g作为支持向量机的输入参数,获取遗传算法优化的支持向量机模型。
作为本发明进一步改进的方案,所述校准模块还用于:
步骤501:选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,利用公式d(k|k-1)=d(k-1|k-1)预测当前时刻的下一时刻的漂移值,其中,d(k|k-1)为由当前时刻对下一时刻预测的漂移值,d(k-1|k-1)为当前时刻漂移值,k-1为当前时刻,k为下一时刻;
步骤502:根据预设的初始协方差利用公式p(k|k-1)=p(k-1|k-1)+Q预测下一时刻的协方差,其中,p(k|k-1)为由当前时刻对下一时刻预测的协方差,p(k-1|k-1)为初始协方差,Q为过程噪声的协方差;
步骤503:利用公式Kg(k)=p(k|k-1)HT(HP(k|k-1)HT+R)-1获取卡尔曼增益值,其中,H是测量系统的参数,R为测量噪声协方差,Kg(k)为K时刻的卡尔曼增益值,HT为测量系统的参数的转置矩阵;
步骤504:利用公式P(k|k)=[I1-Kg(k)H]p(k|k-1)获取K时刻最优协方差,利用公式z(k)=Hd(k|k-1)+R获取K时刻的测量值,利用公式d(k|k)=d(k|k-1)+Kg(k)(z(k)-Hd(k|k-1)获取K时刻最优漂移值,其中,I1为单位矩阵,P(k|k)为K时刻最优协方差,z(k)为K时刻的测量值,d(k|k)为K时刻最优漂移值;
步骤505:将K时刻最优漂移值作为当前时刻漂移值,将K时刻最优协方差作为初始协方差,返回执行步骤501至步骤504,直到达到预设的迭代次数,输出最优漂移值,将测试样本的用电数据减去漂移值得到校准的用电数据。
本发明的优点在于:通过遗传算法对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型,然后将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试,得到预测结果,根据预测值和真实值来获取初始漂移值,卡尔曼滤波器跟踪和校准漂移值,进而来校准用电数据。
附图说明
图1为本发明实施例所公开的一种校准用电数据的方法的流程图;
图2为本发明实施例所公开的一种校准用电数据的方法的详细流程图;
图3为本发明实施例所公开的一种校准用电数据的方法中的EMD去噪前后对比图;
图4为本发明实施例所公开的一种校准用电数据的方法中训练样本去噪后的数据与预测结果的对比图;
图5为本发明实施例所公开的一种校准用电数据的方法的测试样本去噪后的数据与预测结果的对比图;
图6为本发明实施例所公开的一种校准用电数据的方法的预测结果与实际值的误差分析图;
图7为本发明实施例所公开的一种校准用电数据的方法的卡尔曼滤波器算法流程图;
图8为本发明实施例所公开的一种校准用电数据的方法的追踪漂移图;
图9为本发明实施例所公开的一种校准用电数据的方法的用电数据校准前后对比图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1和图2所示,一种校准用电数据的方法,所述方法包括:
步骤S1:采集用电数据并进行去噪以后构建用电数据集,将用电数据集分成两部分,一部分为训练样本,另一部分为测试样本;需要说明的是,本发明从NB-IOT智能设备云平台获取用户的用电数据,选取2019年4月3日到2019年9月30日六个月的用电数据。步骤S1具体处理过程如下:
步骤101:采集初始用电数据,找出初始用电数据所有的极大值点和所有的极小值点,然后采用三次插值的方法将获得的这些极大值点连接起来形成上包络线,极小值点连接起来形成下包络线,则所有的初始用电数据都位于上包络线和下包络线之间;
步骤102:利用公式h1=x(k)–m1计算本征模态函数条件判断结果值,判断本征模态函数条件判断结果值是否满足本征模态函数的条件,如满足,则将h1作为本征模态函数分量,其中,x(k)为初始用电数据序列,m1为上包络线和下包络线之间数据的平均值序列,h1为本征模态函数条件判断结果值;需要说明的是,EMD去噪方法中定义本征模态函数是一类具有瞬时频率的信号,同时它在每一个时刻频率是唯一的。一个本征模态函数需要满足两个条件,函数在整个时间范围内,局部极值点和过零点的数目必须相等,或最多相差一个;在任意时刻点,局部最大值的包络(上包络线)和局部最小值的包络(下包络线)平均值必须为零。如图3所示,为EMD去噪对比图,去噪前用电数据的波形图毛刺多,去噪后用电数据的波形相对平滑,数据稳定性相对较高。
步骤103:若本征模态函数条件判断结果值不满足本征模态函数的条件,将h1作为初始用电数据,返回执行步骤101至步骤102,直到满足本征模态函数的条件;
步骤104:上述步骤得到第一个本征模态函数分量,利用公式r1=x(k)-C1从初始用电数据序列x(k)中将第一个本征模态函数分量分离出来,其中,C1为第一个本征模态函数分量,r1为第一个本征模态函数分量对应的用电数据;将r1作为初始用电数据返回执行步骤101至步骤103,得到第n个本征模态函数分量Cn,经过n次返回执行步骤101至步骤103,得到n个本征模态函数分量,且有
Figure BDA0002350506510000101
当得到的分量不再满足本征模态函数的条件时,循环结束,此时,初始用电数据序列x(k)分解为
Figure BDA0002350506510000102
其中Ci为第i个本征模态函数分量,rn为第n个本征模态函数分量对应的用电数据;
步骤105:去掉分解的初始用电数据序列x(k)中几项高频信号进行EMD去噪得到重构用电数据序列,根据重构用电数据序列的时间序列选取每一天对应的最高温度、最低温度、节假日以及去噪后前两天和去噪后前一天的用电数据作为自变量,选取去噪当天的用电数据作为因变量,将自变量和因变量组合构成用电数据集elec(k),将用电数据集elec(k)一部分作为训练样本elec_train,另一部分作为测试样本elec_test。
步骤S2:对训练样本和测试样本分别进行归一化处理,获取归一化后的训练样本以及归一化后的测试样本;具体过程如下:本实施例中,将用电数据集elec(k)分为训练样本elec_train(前四个半月的数据)和测试样本elec_test(后一个半月的数据)
测试样本为:
Figure BDA0002350506510000103
其中,elec_test为测试样本,j是测试样本的用电数据时间索引,表示第j天,aj表示去噪当天获取的第j天用电数据;bj表示第j天对应是否为节假日,若是则bj为1,若不是则bj为0;ej表示第j天对应的最高温度;fj表示第j天对应的最低温度;lj表示去噪前两天获取的第j天用电数据;oj表示去噪前一天获取的第j天用电数据;
本实施例中,
Figure BDA0002350506510000111
利用公式
Figure BDA0002350506510000112
对测试样本进行归一化处理,其中,J为测试样本的第J列且J=1,2...6,xJ为测试样本第J列的数据值,xJmax为测试样本第J列中最大的数值,xJmin为测试样本第J列中最小的数值。
训练样本为:
Figure BDA0002350506510000113
其中,elec_train为训练样本,i是训练样本的用电数据时间索引,表示第i天,ai表示去噪当天获取的第i天用电数据;bi表示第i天对应是否为节假日,若是则bi为1,若不是则bi为0;ei表示第i天对应的最高温度;fi表示第i天对应的最低温度;li表示去噪前两天获取的第i天用电数据;oi表示去噪前一天获取的第i天用电数据;
本实施例中,
Figure BDA0002350506510000114
利用公式
Figure BDA0002350506510000115
对训练样本进行归一化处理,其中,I为训练样本的第I列且I=1,2...6,xI为训练样本第I列的数据值,xImax为训练样本第I列中最大的数值,xImin为训练样本第I列中最小的数值。
步骤S3:对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型;具体过程为:遗传算法优化的基本思想是对随机产生的初始种群,按照适应度函数值对种群进行优良种的选择,淘汰适应度小的种群,形成新一代种群,并对新一代种群根据交叉率进行个体的交叉,以产生带有优良信息的新个体,根据变异率进行个体的变异,以便在种群老化的时候产生新的个体,避免个体的早熟,然后对新一代种群进行适应度计算,直至最优适应度,这时也就找到了最优的惩罚因子c和核函数参数g。
步骤301:遗传算法初始化支持向量机的参数,参数包括种群最大数量、种群最大进化代数、交叉概率p、变异概率s、惩罚因子c的限定范围以及核函数参数g的限定范围;本实施例中,设置最大进化代数为200、种群最大数量为20、交叉概率p为0.7、变异概率s为0.01、惩罚因子c的限定范围0至100、核函数参数g的限定范围为0至1000;
步骤302:对惩罚因子c以及核函数参数g进行二进制编码并初始化种群;
步骤303:利用公式
Figure BDA0002350506510000121
计算种群的适应度,其中,MSE为种群的适应度值,n为训练样本数,yi为真实的第i个训练样本的用电数据值;f(xi)为预测的第i个训练样本的用电数据值,且
Figure BDA0002350506510000122
其中,αi与αi *均为支持向量机的初始系数,且
Figure BDA0002350506510000123
||xf-xi||为二范数距离,xf表示特征集的特征向量,xi表示待预测的第i个训练样本;
步骤304:随机选择遗传个体;
步骤305:根据交叉概率p进行遗传个体交叉操作;
步骤306:根据变异概率s进行遗传个体变异操作;
步骤307:返回执行步骤303至步骤306,直至达到预设的迭代次数,输出最优的惩罚因子c以及最优的核函数参数g;
步骤308:将最优的惩罚因子c以及最优的核函数参数g进行解码;本实施例中解码结果为c为18.79和g为0.17。
步骤309:将解码后的最优的惩罚因子c以及最优的核函数参数g作为支持向量机的输入参数,获取遗传算法优化的支持向量机模型。
步骤S4:将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试,得到预测结果,将预测结果进行反归一化处理得到反归一化处理后的用电数据;反归一化处理即为归一化处理过程的反向求解过程,基于前文已经叙述归一化处理过程,这里对反归一化不做赘述。如图4所示,为训练样本去噪后的数据与预测结果的对比图,图中,去噪后的数据为原始数据,用圆圈表示,预测结果用三角形表示,预测结果与原始数据相差较小,说明本发明的模型预测效果好。同理,图5为测试样本去噪后的数据与预测结果的对比图,去噪后的数据为原始数据,用圆圈表示,预测结果用三角形表示,预测结果与原始数据相差较小,说明本发明的模型预测效果好。图6给出了预测结果与实际值的误差分析图,图中显示误差范围较小,说明本发明提供的模型预测效果好。
步骤S5:选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,对初始漂移值进行优化处理得到最优漂移值,将测试样本的用电数据减去最优漂移值得到校准的用电数据,如图7所示卡尔曼滤波器算法流程图,图中公式属于以下步骤涉及的公式的变形,因此图中公式不做解释,本领域技术人员很容易根据流程图了解本算法原理,具体过程为:
步骤501:选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,利用公式d(k|k-1)=d(k-1|k-1)预测当前时刻的下一时刻的漂移值,其中,d(k|k-1)为由当前时刻对下一时刻预测的漂移值,d(k-1|k-1)为当前时刻漂移值,k-1为当前时刻,k为下一时刻;
步骤502:根据预设的初始协方差利用公式p(k|k-1)=p(k-1|k-1)+Q预测下一时刻的协方差,其中,p(k|k-1)为由当前时刻对下一时刻预测的协方差,p(k-1|k-1)为初始协方差,Q为过程噪声的协方差;
步骤503:利用公式Kg(k)=p(k|k-1)HT(HP(k|k-1)HT+R)-1获取卡尔曼增益值,其中,H是测量系统的参数,R为测量噪声协方差,Kg(k)为K时刻的卡尔曼增益值,HT为测量系统的参数的转置矩阵;
步骤504:利用公式P(k|k)=[I1-Kg(k)H]p(k|k-1)获取K时刻最优协方差,利用公式z(k)=Hd(k|k-1)+R获取K时刻的测量值,利用公式d(k|k)=d(k|k-1)+Kg(k)(z(k)-Hd(k|k-1)获取K时刻最优漂移值,其中,I1为单位矩阵,P(k|k)为K时刻最优协方差,z(k)为K时刻的测量值,d(k|k)为K时刻最优漂移值;
步骤505:将K时刻最优漂移值作为当前时刻漂移值,将K时刻最优协方差作为初始协方差,返回执行步骤501至步骤504,直到达到预设的迭代次数,输出最优漂移值,将测试样本的用电数据减去漂移值得到校准的用电数据。如图8给出了追踪漂移图,图中真实值与估计值接近,说明采用步骤S5的方法跟踪漂移值,误差小,效果显著。如图9所示为用电数据校准前后对比图,可见校准后的用电数据了滤除了噪声干扰,数据更加更够反应用户用电的真实水平,且去漂移后数据与原始数据误差小,用电数据校准较为准确,不会偏离真实值。
本发明提供的一种校准用电数据的方法,通过遗传算法对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型,然后将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试,得到预测结果,根据预测值和真实值来获取初始漂移值,卡尔曼滤波器跟踪和校准漂移值,进而来校准用电数据。对于数据的去噪,采用EMD去噪,EMD分解相较于小波分解等无需选择合适的基函数,可以从自身获得基函数,将非线性、飞平稳的信号分解我线性、平稳的频率由高到低多个本征模态函数变量。与传统的支持向量机相比较该方法能够提高预测的准确性。可根据温度、节假日等特征值对未来时段的用电量进行准确的预测。卡尔曼滤波的基本方程是时间域内的递推形式,对于漂移值的计算,不需要进行大量数据的存储,并且一旦观测到新的数据,随即产生新的漂移值,实现简单、方便。
实施例2
与本发明实施例1相对应的,本发明实施例2还提供一种校准用电数据的装置,所述装置包括:
样本获取模块,用于采集用电数据并进行去噪以后构建用电数据集,将用电数据集分成两部分,一部分为训练样本,另一部分为测试样本;
归一化模块,用于对训练样本和测试样本分别进行归一化处理,获取归一化后的训练样本以及归一化后的测试样本;
模型获取模块,用于对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型;
预测模块,用于将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试,得到预测结果,将预测结果进行反归一化处理得到反归一化处理后的用电数据;
校准模块,用于选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,对初始漂移值进行优化处理得到最优漂移值,将测试样本的用电数据减去最优漂移值得到校准的用电数据。
作为本发明进一步改进的方案,所述样本获取模块还用于:
步骤101:采集初始用电数据,找出初始用电数据所有的极大值点和所有的极小值点,然后采用三次插值的方法将获得的这些极大值点连接起来形成上包络线,极小值点连接起来形成下包络线,则所有的初始用电数据都位于上包络线和下包络线之间;
步骤102:利用公式h1=x(k)–m1计算本征模态函数条件判断结果值,判断本征模态函数条件判断结果值是否满足本征模态函数的条件,如满足,则将h1作为本征模态函数分量,其中,x(k)为初始用电数据序列,m1为上包络线和下包络线之间数据的平均值序列,h1为本征模态函数条件判断结果值;
步骤103:若本征模态函数条件判断结果值不满足本征模态函数的条件,将h1作为初始用电数据,返回执行步骤101至步骤102,直到满足本征模态函数的条件;
步骤104:将上述步骤得到第一个本征模态函数分量,利用公式r1=x(k)-C1从初始用电数据序列x(k)中将第一个本征模态函数分量分离出来,其中,C1为第一个本征模态函数分量,r1为第一个本征模态函数分量对应的用电数据;将r1作为初始用电数据返回执行步骤101至步骤103,得到第n个本征模态函数分量Cn,经过n次返回执行步骤101至步骤103,得到n个本征模态函数分量;当得到的分量不再满足本征模态函数的条件时,循环结束,此时,初始用电数据序列x(k)分解为
Figure BDA0002350506510000151
其中Ci为第i个本征模态函数分量,rn为第n个本征模态函数分量对应的用电数据;
步骤105:去掉分解的初始用电数据序列x(k)中几项高频信号进行EMD去噪得到重构用电数据序列,根据重构用电数据序列的时间序列选取每一天对应的最高温度、最低温度、节假日以及去噪后前两天和去噪后前一天的用电数据作为自变量,选取去噪当天的用电数据作为因变量,将自变量和因变量组合构成用电数据集elec(k),将用电数据集elec(k)一部分作为训练样本elec_train,另一部分作为测试样本elec_test。
作为本发明进一步改进的方案,所述归一化模块还用于:训练样本为:
Figure BDA0002350506510000152
其中,elec_train为训练样本,i是训练样本的用电数据时间索引,表示第i天,ai表示去噪当天获取的第i天用电数据;bi表示第i天对应是否为节假日,若是则bi为1,若不是则bi为0;ei表示第i天对应的最高温度;fi表示第i天对应的最低温度;li表示去噪前两天获取的第i天用电数据;oi表示去噪前一天获取的第i天用电数据;
利用公式
Figure BDA0002350506510000153
对训练样本进行归一化处理,其中,I为训练样本的第I列且I=1,2...6,xI为训练样本第I列的数据值,xImax为训练样本第I列中最大的数值,xImin为训练样本第I列中最小的数值。
作为本发明进一步改进的方案,所述归一化模块还用于:
测试样本为:
Figure BDA0002350506510000165
elec_test={a1b1e1f1l1o1
其中,elec_test为测试样本,j是测试样本的用电数据时间索引,表示第j天,aj表示去噪当天获取的第j天用电数据;bj表示第j天对应是否为节假日,若是则bj为1,若不是则bj为0;ej表示第j天对应的最高温度;fj表示第j天对应的最低温度;lj表示去噪前两天获取的第j天用电数据;oj表示去噪前一天获取的第j天用电数据;
利用公式
Figure BDA0002350506510000161
对测试样本进行归一化处理,其中,J为测试样本的第J列且J=1,2...6,xJ为测试样本第J列的数据值,xJmax为测试样本第J列中最大的数值,xJmin为测试样本第J列中最小的数值。
作为本发明进一步改进的方案,所述模型获取模块还用于:
步骤301:遗传算法初始化支持向量机的参数,参数包括种群最大数量、种群最大进化代数、交叉概率p、变异概率s、惩罚因子c的限定范围以及核函数参数g的限定范围;
步骤302:对惩罚因子c以及核函数参数g进行二进制编码并初始化种群;
步骤303:利用公式
Figure BDA0002350506510000162
计算种群的适应度,其中,MSE为种群的适应度值,n为训练样本数,yi为真实的第i个训练样本的用电数据值;f(xi)为预测的第i个训练样本的用电数据值,且
Figure BDA0002350506510000163
其中,αi与αi *均为支持向量机的初始系数,且
Figure BDA0002350506510000164
||xf-xi||为二范数距离,xf表示特征集的特征向量,xi表示待预测的第i个训练样本;
步骤304:随机选择遗传个体;
步骤305:根据交叉概率p进行遗传个体交叉操作;
步骤306:根据变异概率s进行遗传个体变异操作;
步骤307:返回执行步骤303至步骤306,直至达到预设的迭代次数,输出最优的惩罚因子c以及最优的核函数参数g;
步骤308:将最优的惩罚因子c以及最优的核函数参数g进行解码;
步骤309:将解码后的最优的惩罚因子c以及最优的核函数参数g作为支持向量机的输入参数,获取遗传算法优化的支持向量机模型。
作为本发明进一步改进的方案,所述校准模块还用于:
步骤501:选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,利用公式d(k|k-1)=d(k-1|k-1)预测当前时刻的下一时刻的漂移值,其中,d(k|k-1)为由当前时刻对下一时刻预测的漂移值,d(k-1|k-1)为当前时刻漂移值,k-1为当前时刻,k为下一时刻;
步骤502:根据预设的初始协方差利用公式p(k|k-1)=p(k-1|k-1)+Q预测下一时刻的协方差,其中,p(k|k-1)为由当前时刻对下一时刻预测的协方差,p(k-1|k-1)为初始协方差,Q为过程噪声的协方差;
步骤503:利用公式Kg(k)=p(k|k-1)HT(HP(k|k-1)HT+R)-1获取卡尔曼增益值,其中,H是测量系统的参数,R为测量噪声协方差,Kg(k)为K时刻的卡尔曼增益值,HT为测量系统的参数的转置矩阵;
步骤504:利用公式P(k|k)=[I1-Kg(k)H]p(k|k-1)获取K时刻最优协方差,利用公式z(k)=Hd(k|k-1)+R获取K时刻的测量值,利用公式d(k|k)=d(k|k-1)+Kg(k)(z(k)-Hd(k|k-1)获取K时刻最优漂移值,其中,I1为单位矩阵,P(k|k)为K时刻最优协方差,z(k)为K时刻的测量值,d(k|k)为K时刻最优漂移值;
步骤505:将K时刻最优漂移值作为当前时刻漂移值,将K时刻最优协方差作为初始协方差,返回执行步骤501至步骤504,直到达到预设的迭代次数,输出最优漂移值,将测试样本的用电数据减去漂移值得到校准的用电数据。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种校准用电数据的方法,其特征在于,所述方法包括:
步骤一:采集用电数据并进行去噪以后构建用电数据集,将用电数据集分成两部分,一部分为训练样本,另一部分为测试样本;
步骤二:对训练样本和测试样本分别进行归一化处理,获取归一化后的训练样本以及归一化后的测试样本;
步骤三:对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型;
步骤四:将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试,得到预测结果,将预测结果进行反归一化处理得到反归一化处理后的用电数据;
步骤五:选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,对初始漂移值进行优化处理得到最优漂移值,将测试样本的用电数据减去最优漂移值得到校准的用电数据。
2.根据权利要求1所述的一种校准用电数据的方法,其特征在于,所述步骤一包括:
步骤101:采集初始用电数据,找出初始用电数据所有的极大值点和所有的极小值点,然后采用三次插值的方法将获得的这些极大值点连接起来形成上包络线,极小值点连接起来形成下包络线,则所有的初始用电数据都位于上包络线和下包络线之间;
步骤102:利用公式h1=x(k)–m1计算本征模态函数条件判断结果值,判断本征模态函数条件判断结果值是否满足本征模态函数的条件,如满足,则将h1作为本征模态函数分量,其中,x(k)为初始用电数据序列,m1为上包络线和下包络线之间数据的平均值序列,h1为本征模态函数条件判断结果值;
步骤103:若本征模态函数条件判断结果值不满足本征模态函数的条件,将h1作为初始用电数据,返回执行步骤101至步骤102,直到满足本征模态函数的条件;
步骤104:上述步骤得到第一个本征模态函数分量,利用公式r1=x(k)-C1从初始用电数据序列x(k)中将第一个本征模态函数分量分离出来,其中,C1为第一个本征模态函数分量,r1为第一个本征模态函数分量对应的用电数据;将r1作为初始用电数据返回执行步骤101至步骤103,得到第n个本征模态函数分量Cn,经过n次返回执行步骤101至步骤103,得到n个本征模态函数分量;当得到的分量不再满足本征模态函数的条件时,循环结束,此时,初始用电数据序列x(k)分解为
Figure FDA0002350506500000011
其中Ci为第i个本征模态函数分量,rn为第n个本征模态函数分量对应的用电数据;
步骤105:去掉分解的初始用电数据序列x(k)中几项高频信号进行EMD去噪得到重构用电数据序列,根据重构用电数据序列的时间序列选取每一天对应的最高温度、最低温度、节假日以及去噪后前两天和去噪后前一天的用电数据作为自变量,选取去噪当天的用电数据作为因变量,将自变量和因变量组合构成用电数据集elec(k),将用电数据集elec(k)一部分作为训练样本elec_train,另一部分作为测试样本elec_test。
3.根据权利要求2所述的一种校准用电数据的方法,其特征在于,所述步骤二中,训练样本为:
Figure FDA0002350506500000021
其中,elec_train为训练样本,i是训练样本的用电数据时间索引,表示第i天,ai表示去噪当天获取的第i天用电数据;bi表示第i天对应是否为节假日,若是则bi为1,若不是则bi为0;ei表示第i天对应的最高温度;fi表示第i天对应的最低温度;li表示去噪前两天获取的第i天用电数据;oi表示去噪前一天获取的第i天用电数据;
利用公式
Figure FDA0002350506500000022
对训练样本进行归一化处理,其中,I为训练样本的第I列且I=1,2...6,xI为训练样本第I列的数据值,xImax为训练样本第I列中最大的数值,xImin为训练样本第I列中最小的数值。
4.根据权利要求3所述的一种校准用电数据的方法,其特征在于,所述步骤二中,
测试样本为:
Figure FDA0002350506500000023
其中,elec_test为测试样本,j是测试样本的用电数据时间索引,表示第j天,aj表示去噪当天获取的第j天用电数据;bj表示第j天对应是否为节假日,若是则bj为1,若不是则bj为0;ej表示第j天对应的最高温度;fj表示第j天对应的最低温度;lj表示去噪前两天获取的第j天用电数据;oj表示去噪前一天获取的第j天用电数据;
利用公式
Figure FDA0002350506500000024
对测试样本进行归一化处理,其中,J为测试样本的第J列且J=1,2...6,xJ为测试样本第J列的数据值,xJmax为测试样本第J列中最大的数值,xJmin为测试样本第J列中最小的数值。
5.根据权利要求1所述的一种校准用电数据的方法,其特征在于,所述步骤三包括:
步骤301:遗传算法初始化支持向量机的参数,参数包括种群最大数量、种群最大进化代数、交叉概率p、变异概率s、惩罚因子c的限定范围以及核函数参数g的限定范围;
步骤302:对惩罚因子c以及核函数参数g进行二进制编码并初始化种群;
步骤303:利用公式
Figure FDA0002350506500000031
计算种群的适应度,其中,MSE为种群的适应度值,n为训练样本数,yi为真实的第i个训练样本的用电数据值;f(xi)为预测的第i个训练样本的用电数据值,且
Figure FDA0002350506500000032
其中,αi与αi *均为支持向量机的初始系数,且
Figure FDA0002350506500000033
||xf-xi||为二范数距离,xf表示特征集的特征向量,xi表示待预测的第i个训练样本;
步骤304:随机选择遗传个体;
步骤305:根据交叉概率p进行遗传个体交叉操作;
步骤306:根据变异概率s进行遗传个体变异操作;
步骤307:返回执行步骤303至步骤306,直至达到预设的迭代次数,输出最优的惩罚因子c以及最优的核函数参数g;
步骤308:将最优的惩罚因子c以及最优的核函数参数g进行解码;
步骤309:将解码后的最优的惩罚因子c以及最优的核函数参数g作为支持向量机的输入参数,获取遗传算法优化的支持向量机模型。
6.根据权利要求1所述的一种校准用电数据的方法,其特征在于,所述步骤五包括:
步骤501:选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,利用公式d(k|k-1)=d(k-1|k-1)预测当前时刻的下一时刻的漂移值,其中,d(k|k-1)为由当前时刻对下一时刻预测的漂移值,d(k-1|k-1)为当前时刻漂移值,k-1为当前时刻,k为下一时刻;
步骤502:根据预设的初始协方差利用公式p(k|k-1)=p(k-1|k-1)+Q预测下一时刻的协方差,其中,p(k|k-1)为由当前时刻对下一时刻预测的协方差,p(k-1|k-1)为初始协方差,Q为过程噪声的协方差;
步骤503:利用公式Kg(k)=p(k|k-1)HT(HP(k|k-1)HT+R)-1获取卡尔曼增益值,其中,H是测量系统的参数,R为测量噪声协方差,Kg(k)为K时刻的卡尔曼增益值,HT为测量系统的参数的转置矩阵;
步骤504:利用公式P(k|k)=[I1-Kg(k)H]p(k|k-1)获取K时刻最优协方差,利用公式z(k)=Hd(k|k-1)+R获取K时刻的测量值,利用公式d(k|k)=d(k|k-1)+Kg(k)(z(k)-Hd(k|k-1)获取K时刻最优漂移值,其中,I1为单位矩阵,P(k|k)为K时刻最优协方差,z(k)为K时刻的测量值,d(k|k)为K时刻最优漂移值;
步骤505:将K时刻最优漂移值作为当前时刻漂移值,将K时刻最优协方差作为初始协方差,返回执行步骤501至步骤504,直到达到预设的迭代次数,输出最优漂移值,将测试样本的用电数据减去漂移值得到校准的用电数据。
7.一种校准用电数据的装置,其特征在于,所述装置包括:
样本获取模块,用于采集用电数据并进行去噪以后构建用电数据集,将用电数据集分成两部分,一部分为训练样本,另一部分为测试样本;
归一化模块,用于对训练样本和测试样本分别进行归一化处理,获取归一化后的训练样本以及归一化后的测试样本;
模型获取模块,用于对归一化后的训练样本输入到支持向量机中进行训练,得到遗传算法优化的支持向量机模型;
预测模块,用于将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试,得到预测结果,将预测结果进行反归一化处理得到反归一化处理后的用电数据;
校准模块,用于选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入,对初始漂移值进行优化处理得到最优漂移值,将测试样本的用电数据减去最优漂移值得到校准的用电数据。
8.根据权利要求7所述的一种校准用电数据的装置,其特征在于,所述样本获取模块还用于:
步骤101:采集初始用电数据,找出初始用电数据所有的极大值点和所有的极小值点,然后采用三次插值的方法将获得的这些极大值点连接起来形成上包络线,极小值点连接起来形成下包络线,则所有的初始用电数据都位于上包络线和下包络线之间;
步骤102:利用公式h1=x(k)–m1计算本征模态函数条件判断结果值,判断本征模态函数条件判断结果值是否满足本征模态函数的条件,如满足,则将h1作为本征模态函数分量,其中,x(k)为初始用电数据序列,m1为上包络线和下包络线之间数据的平均值序列,h1为本征模态函数条件判断结果值;
步骤103:若本征模态函数条件判断结果值不满足本征模态函数的条件,将h1作为初始用电数据,返回执行步骤101至步骤102,直到满足本征模态函数的条件;
步骤104:上述步骤得到第一个本征模态函数分量,利用公式r1=x(k)-C1从初始用电数据序列x(k)中将第一个本征模态函数分量分离出来,其中,C1为第一个本征模态函数分量,r1为第一个本征模态函数分量对应的用电数据;将r1作为初始用电数据返回执行步骤101至步骤103,得到第n个本征模态函数分量Cn,经过n次返回执行步骤101至步骤103,得到n个本征模态函数分量;当得到的分量不再满足本征模态函数的条件时,循环结束,此时,初始用电数据序列x(k)分解为
Figure FDA0002350506500000051
其中Ci为第i个本征模态函数分量,rn为第n个本征模态函数分量对应的用电数据;
步骤105:去掉分解的初始用电数据序列x(k)中几项高频信号进行EMD去噪得到重构用电数据序列,根据重构用电数据序列的时间序列选取每一天对应的最高温度、最低温度、节假日以及去噪后前两天和去噪后前一天的用电数据作为自变量,选取去噪当天的用电数据作为因变量,将自变量和因变量组合构成用电数据集elec(k),将用电数据集elec(k)一部分作为训练样本elec_train,另一部分作为测试样本elec_test。
9.根据权利要求8所述的一种校准用电数据的装置,其特征在于,所述归一化模块还用于:训练样本为:
Figure FDA0002350506500000052
其中,elec_train为训练样本,i是训练样本的用电数据时间索引,表示第i天,ai表示去噪当天获取的第i天用电数据;bi表示第i天对应是否为节假日,若是则bi为1,若不是则bi为0;ei表示第i天对应的最高温度;fi表示第i天对应的最低温度;li表示去噪前两天获取的第i天用电数据;oi表示去噪前一天获取的第i天用电数据;
利用公式
Figure FDA0002350506500000061
对训练样本进行归一化处理,其中,I为训练样本的第I列且I=1,2...6,xI为训练样本第I列的数据值,xImax为训练样本第I列中最大的数值,xImin为训练样本第I列中最小的数值。
10.根据权利要求9所述的一种校准用电数据的装置,其特征在于,所述归一化模块还用于:
测试样本为:
Figure FDA0002350506500000062
其中,elec_test为测试样本,j是测试样本的用电数据时间索引,表示第j天,aj表示去噪当天获取的第j天用电数据;bj表示第j天对应是否为节假日,若是则bj为1,若不是则bj为0;ej表示第j天对应的最高温度;fj表示第j天对应的最低温度;lj表示去噪前两天获取的第j天用电数据;oj表示去噪前一天获取的第j天用电数据;
利用公式
Figure FDA0002350506500000063
对测试样本进行归一化处理,其中,J为测试样本的第J列且J=1,2...6,xJ为测试样本第J列的数据值,xJmax为测试样本第J列中最大的数值,xJmin为测试样本第J列中最小的数值。
CN201911413184.3A 2019-12-31 2019-12-31 一种校准用电数据的方法及装置 Pending CN110969238A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911413184.3A CN110969238A (zh) 2019-12-31 2019-12-31 一种校准用电数据的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911413184.3A CN110969238A (zh) 2019-12-31 2019-12-31 一种校准用电数据的方法及装置

Publications (1)

Publication Number Publication Date
CN110969238A true CN110969238A (zh) 2020-04-07

Family

ID=70037852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911413184.3A Pending CN110969238A (zh) 2019-12-31 2019-12-31 一种校准用电数据的方法及装置

Country Status (1)

Country Link
CN (1) CN110969238A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070229A (zh) * 2020-10-19 2020-12-11 中国农业科学院农业信息研究所 一种基于遗传算法的农业气象监测数据处理方法及系统
CN113672608A (zh) * 2021-08-25 2021-11-19 东北大学 基于自适应约简阈值的物联网感知数据约简系统及方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100036782A1 (en) * 2006-09-22 2010-02-11 Koninklijke Philips Electronics N. V. Methods for feature selection using classifier ensemble based genetic algorithms
CN102736000A (zh) * 2012-07-06 2012-10-17 桂林电子科技大学 电力电容器在线检测方法及装置
CN104502288A (zh) * 2014-11-26 2015-04-08 西安科技大学 利用可见光近红外光谱技术的土壤铅含量测量方法
CN103441498B (zh) * 2013-09-13 2015-06-24 国家电网公司 一种基于用电特征数据进行用电调整的方法
CN105373855A (zh) * 2015-11-19 2016-03-02 国网河南省电力公司电力科学研究院 一种用于特殊天气和特殊日期的电力系统日负荷预测方法
CN105956709A (zh) * 2016-05-12 2016-09-21 大连海事大学 一种基于gui的模块化支持向量机潮汐预测方法
CN108509722A (zh) * 2018-04-02 2018-09-07 西北工业大学 基于支持向量机的飞机敏感性权衡优化方法
CN109661348A (zh) * 2016-08-22 2019-04-19 挪威科技大学 结冰控制系统
CN109993088A (zh) * 2019-03-22 2019-07-09 江南大学 一种无线传感网络数据漂移盲校准方法
CN110601374A (zh) * 2019-10-21 2019-12-20 国网电子商务有限公司 一种用电管理系统及用电数据监测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100036782A1 (en) * 2006-09-22 2010-02-11 Koninklijke Philips Electronics N. V. Methods for feature selection using classifier ensemble based genetic algorithms
CN102736000A (zh) * 2012-07-06 2012-10-17 桂林电子科技大学 电力电容器在线检测方法及装置
CN103441498B (zh) * 2013-09-13 2015-06-24 国家电网公司 一种基于用电特征数据进行用电调整的方法
CN104502288A (zh) * 2014-11-26 2015-04-08 西安科技大学 利用可见光近红外光谱技术的土壤铅含量测量方法
CN105373855A (zh) * 2015-11-19 2016-03-02 国网河南省电力公司电力科学研究院 一种用于特殊天气和特殊日期的电力系统日负荷预测方法
CN105956709A (zh) * 2016-05-12 2016-09-21 大连海事大学 一种基于gui的模块化支持向量机潮汐预测方法
CN109661348A (zh) * 2016-08-22 2019-04-19 挪威科技大学 结冰控制系统
CN108509722A (zh) * 2018-04-02 2018-09-07 西北工业大学 基于支持向量机的飞机敏感性权衡优化方法
CN109993088A (zh) * 2019-03-22 2019-07-09 江南大学 一种无线传感网络数据漂移盲校准方法
CN110601374A (zh) * 2019-10-21 2019-12-20 国网电子商务有限公司 一种用电管理系统及用电数据监测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
沈渊彬 等: "基于卡尔曼滤波 - SVR 时刻峰值的短期负荷预测", 《电气开关》 *
王红军: "《基于知识的机电系统故障诊断与预测技术》", 31 January 2014, 《中国财富出版社》 *
第二十八届中国电网调度运行会技术委员会编: "《第二十八届中国电网调度运行会议论文选集》", 31 October 2003 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070229A (zh) * 2020-10-19 2020-12-11 中国农业科学院农业信息研究所 一种基于遗传算法的农业气象监测数据处理方法及系统
CN113672608A (zh) * 2021-08-25 2021-11-19 东北大学 基于自适应约简阈值的物联网感知数据约简系统及方法
CN113672608B (zh) * 2021-08-25 2023-07-25 东北大学 基于自适应约简阈值的物联网感知数据约简系统及方法

Similar Documents

Publication Publication Date Title
CN111310981B (zh) 一种基于时间序列的水库水位趋势预测方法
Kachour et al. First‐order rounded integer‐valued autoregressive (RINAR (1)) process
CN110969238A (zh) 一种校准用电数据的方法及装置
CN111008726A (zh) 一种电力负荷预测中类图片转换方法
CN116346639A (zh) 一种网络流量预测方法、系统、介质、设备及终端
CN117078048A (zh) 基于数字孪生的智慧城市资源管理方法及系统
CN114004162A (zh) 一种多工况场景下的冶炼负荷谐波发射水平的建模方法
CN109447512B (zh) 基于均匀设计的大电网可靠性评估方法
CN112580844A (zh) 气象数据处理方法、装置、设备及计算机可读存储介质
CN114648060A (zh) 基于机器学习的故障信号规范化处理及分类方法
CN114564345A (zh) 一种服务器异常检测方法、装置、设备及存储介质
CN112949944A (zh) 一种基于时空特征的地下水位智能预测方法及系统
CN111476411B (zh) 一种光伏电站发电量计算方法及服务器
KR20210097613A (ko) 수요관리 자원 최적화를 위한 전력사용량 예측 시스템
CN115713044B (zh) 一种多工况切换下的机电设备剩余寿命分析方法和装置
CN115130788B (zh) 基于大数据分析的用电预测系统
CN117079005A (zh) 一种光缆故障监测方法、系统、装置及可读存储介质
CN113887119A (zh) 一种基于sarima-lstm的河流水质预测方法
CN116470491A (zh) 基于copula函数的光伏功率概率预测方法及系统
CN115878960A (zh) 考虑出力变化趋势的风电功率预测误差多区间分析方法和系统
CN108132399B (zh) 一种提高数字化变电站电能质量分析精度的简化插值方法
US20220243347A1 (en) Determination method and determination apparatus for conversion efficiency of hydrogen production by wind-solar hybrid electrolysis of water
CN115169089A (zh) 基于核密度估计和copula的风电功率概率预测方法和装置
CN114968992A (zh) 数据识别清洗及补偿方法、装置、电子设备及存储介质
CN114358581A (zh) 性能指标的异常阈值确定方法和装置、设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200407

RJ01 Rejection of invention patent application after publication