CN110969238A

CN110969238A - 一种校准用电数据的方法及装置

Info

Publication number: CN110969238A
Application number: CN201911413184.3A
Authority: CN
Inventors: 方潜生; 张红艳; 谢陈磊; 杨亚龙; 张毅; 任守明; 张振亚; 李善寿; 李杨; 蒋婷婷; 朱徐来; 张睿; 王萍; 李雪飞; 杨先锋; 盛锦壮; 袁翠艳; 钟永祥; 王浩杰; 朱俊超
Original assignee: Anhui Jianzhu University
Current assignee: Anhui Jianzhu University
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2020-04-07

Abstract

本发明公开了一种校准用电数据的方法及装置，所述方法包括：构建用电数据集，将用电数据集分成两部分，一部分为训练样本，另一部分为测试样本；对训练样本和测试样本分别进行归一化处理；对归一化后的训练样本输入到支持向量机中进行训练，得到遗传算法优化的支持向量机模型；将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试；选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入，对初始漂移值进行优化处理得到最优漂移值，将测试样本的用电数据减去最优漂移值得到校准的用电数据；本发明的优点在于：能够对用电数据校准。

Description

一种校准用电数据的方法及装置

技术领域

本发明涉及建筑环境中数据校准领域，更具体涉及一种校准用电数据的方法及装置。

背景技术

数据校准是指在建筑用电设备物联网环境下，对系统获取的数据进行分析处理，获得精准的数据。准确的数据是建筑安全、节能运行的基础；错误的数据导致高能耗，甚至影响运行安全；建筑数据来自于散布在建筑各个角落的传感器、执行器，检查、校核这些数据的人工成本非常高。数据校准能够解决上述提到的问题，而且能够给建筑运行过程中在数据方面提供准确的依据，具有提供精确数据、增加数据的可靠性等功能。由于建筑智能建筑的崛起，精准的用电数据能够反映建筑的运行情况，长时间的使用错误的数据，会让建筑运行受到局限性，造成一定的不必要的损失。

随着科技水平的发展对精准的数据要求越来越严格，建立数据校准模型是获取建筑运行过程中精准数据的关键，其中如何通过原始数据来得到更为精准数据是数据校准的关键。

中国专利公开号CN209516736U，公开了一种配电化终端，包括：用于获取目标用户的用电数据，并对用电数据进行转发的配电装置、用于对用电数据进行汇总，得到集成数据的间隔装置以及用于根据集成数据对目标用户进行用电管理的监控装置；其中，监控装置与M个间隔装置通信连接，每个间隔装置与N个配电装置通信连接；M≥2，N≥2。通过本申请所提供的配电化终端，可以获取更多目标用户的用电数据，并对更多目标用户的用电数据进行监控，所以，通过该申请所提供的配电化终端，可以大幅度减少主站所需设置的数量，从而可以有效缓减IP和网口等资源紧张的问题，进而可以大大减少工作人员对主站的维护压力。但是该申请只是对用电数据进行监控，不能对用电数据进行校准。

发明内容

本发明所要解决的技术问题在于如何提供一种校准用电数据的方法及装置，以对用电数据进行校准。

本发明通过以下技术手段实现解决上述技术问题的：一种校准用电数据的方法，所述方法包括：

步骤一：采集用电数据并进行去噪以后构建用电数据集，将用电数据集分成两部分，一部分为训练样本，另一部分为测试样本；

步骤二：对训练样本和测试样本分别进行归一化处理，获取归一化后的训练样本以及归一化后的测试样本；

步骤三：对归一化后的训练样本输入到支持向量机中进行训练，得到遗传算法优化的支持向量机模型；

步骤四：将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试，得到预测结果，将预测结果进行反归一化处理得到反归一化处理后的用电数据；

步骤五：选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入，对初始漂移值进行优化处理得到最优漂移值，将测试样本的用电数据减去最优漂移值得到校准的用电数据。

本发明通过遗传算法对归一化后的训练样本输入到支持向量机中进行训练，得到遗传算法优化的支持向量机模型，然后将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试，得到预测结果，根据预测值和真实值来获取初始漂移值，卡尔曼滤波器跟踪和校准漂移值，进而来校准用电数据。

作为本发明进一步改进的方案，所述步骤一包括：

步骤101：采集初始用电数据，找出初始用电数据所有的极大值点和所有的极小值点，然后采用三次插值的方法将获得的这些极大值点连接起来形成上包络线，极小值点连接起来形成下包络线，则所有的初始用电数据都位于上包络线和下包络线之间；

步骤102：利用公式h₁＝x(k)–m₁计算本征模态函数条件判断结果值，判断本征模态函数条件判断结果值是否满足本征模态函数的条件，如满足，则将h₁作为本征模态函数分量，其中，x(k)为初始用电数据序列，m₁为上包络线和下包络线之间数据的平均值序列，h₁为本征模态函数条件判断结果值；

步骤103：若本征模态函数条件判断结果值不满足本征模态函数的条件，将h₁作为初始用电数据，返回执行步骤101至步骤102，直到满足本征模态函数的条件；

步骤104：上述步骤得到第一个本征模态函数分量，利用公式r₁＝x(k)-C₁从初始用电数据序列x(k)中将第一个本征模态函数分量分离出来，其中，C₁为第一个本征模态函数分量，r₁为第一个本征模态函数分量对应的用电数据；将r₁作为初始用电数据返回执行步骤101至步骤103，得到第n个本征模态函数分量C_n，经过n次返回执行步骤101至步骤103，得到n个本征模态函数分量；当得到的分量不再满足本征模态函数的条件时，循环结束，此时，初始用电数据序列x(k)分解为

其中C_i为第i个本征模态函数分量，r_n为第n个本征模态函数分量对应的用电数据；

步骤105：去掉分解的初始用电数据序列x(k)中几项高频信号进行EMD去噪得到重构用电数据序列，根据重构用电数据序列的时间序列选取每一天对应的最高温度、最低温度、节假日以及去噪后前两天和去噪后前一天的用电数据作为自变量，选取去噪当天的用电数据作为因变量，将自变量和因变量组合构成用电数据集elec(k)，将用电数据集elec(k)一部分作为训练样本elec_train，另一部分作为测试样本elec_test。

作为本发明进一步改进的方案，所述步骤二中，训练样本为：

其中，elec_train为训练样本，i是训练样本的用电数据时间索引，表示第i天，a_i表示去噪当天获取的第i天用电数据；b_i表示第i天对应是否为节假日，若是则b_i为1，若不是则b_i为0；e_i表示第i天对应的最高温度；f_i表示第i天对应的最低温度；l_i表示去噪前两天获取的第i天用电数据；o_i表示去噪前一天获取的第i天用电数据；

利用公式

对训练样本进行归一化处理，其中，I为训练样本的第I列且I＝1,2...6，x_I为训练样本第I列的数据值，x_Imax为训练样本第I列中最大的数值，x_Imin为训练样本第I列中最小的数值。

作为本发明进一步改进的方案，所述步骤二中，

测试样本为：

其中，elec_test为测试样本，j是测试样本的用电数据时间索引，表示第j天，a_j表示去噪当天获取的第j天用电数据；b_j表示第j天对应是否为节假日，若是则b_j为1，若不是则b_j为0；e_j表示第j天对应的最高温度；f_j表示第j天对应的最低温度；l_j表示去噪前两天获取的第j天用电数据；o_j表示去噪前一天获取的第j天用电数据；

利用公式

对测试样本进行归一化处理，其中，J为测试样本的第J列且J＝1,2...6，x_J为测试样本第J列的数据值，x_Jmax为测试样本第J列中最大的数值，x_Jmin为测试样本第J列中最小的数值。

作为本发明进一步改进的方案，所述步骤三包括：

步骤301：遗传算法初始化支持向量机的参数，参数包括种群最大数量、种群最大进化代数、交叉概率p、变异概率s、惩罚因子c的限定范围以及核函数参数g的限定范围；

步骤302：对惩罚因子c以及核函数参数g进行二进制编码并初始化种群；

步骤303：利用公式

计算种群的适应度，其中，MSE为种群的适应度值，n为训练样本数，y_i为真实的第i个训练样本的用电数据值；f(x_i)为预测的第i个训练样本的用电数据值，且

其中，α_i与α_i ^*均为支持向量机的初始系数，且

||x_f-x_i||为二范数距离，x_f表示特征集的特征向量，x_i表示待预测的第i个训练样本；

步骤304：随机选择遗传个体；

步骤305：根据交叉概率p进行遗传个体交叉操作；

步骤306：根据变异概率s进行遗传个体变异操作；

步骤307：返回执行步骤303至步骤306，直至达到预设的迭代次数，输出最优的惩罚因子c以及最优的核函数参数g；

步骤308：将最优的惩罚因子c以及最优的核函数参数g进行解码；

步骤309：将解码后的最优的惩罚因子c以及最优的核函数参数g作为支持向量机的输入参数，获取遗传算法优化的支持向量机模型。

作为本发明进一步改进的方案，所述步骤五包括：

步骤501：选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入，利用公式d(k|k-1)＝d(k-1|k-1)预测当前时刻的下一时刻的漂移值，其中，d(k|k-1)为由当前时刻对下一时刻预测的漂移值，d(k-1|k-1)为当前时刻漂移值，k-1为当前时刻，k为下一时刻；

步骤502：根据预设的初始协方差利用公式p(k|k-1)＝p(k-1|k-1)+Q预测下一时刻的协方差，其中，p(k|k-1)为由当前时刻对下一时刻预测的协方差，p(k-1|k-1)为初始协方差，Q为过程噪声的协方差；

步骤503：利用公式Kg(k)＝p(k|k-1)H^T(HP(k|k-1)H^T+R)^-1获取卡尔曼增益值，其中，H是测量系统的参数，R为测量噪声协方差，Kg(k)为K时刻的卡尔曼增益值，H^T为测量系统的参数的转置矩阵；

步骤505：将K时刻最优漂移值作为当前时刻漂移值，将K时刻最优协方差作为初始协方差，返回执行步骤501至步骤504，直到达到预设的迭代次数，输出最优漂移值，将测试样本的用电数据减去漂移值得到校准的用电数据。

本发明还提供一种校准用电数据的装置，所述装置包括：

样本获取模块，用于采集用电数据并进行去噪以后构建用电数据集，将用电数据集分成两部分，一部分为训练样本，另一部分为测试样本；

归一化模块，用于对训练样本和测试样本分别进行归一化处理，获取归一化后的训练样本以及归一化后的测试样本；

模型获取模块，用于对归一化后的训练样本输入到支持向量机中进行训练，得到遗传算法优化的支持向量机模型；

预测模块，用于将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试，得到预测结果，将预测结果进行反归一化处理得到反归一化处理后的用电数据；

校准模块，用于选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入，对初始漂移值进行优化处理得到最优漂移值，将测试样本的用电数据减去最优漂移值得到校准的用电数据。

作为本发明进一步改进的方案，所述样本获取模块还用于：

作为本发明进一步改进的方案，所述归一化模块还用于：训练样本为：

利用公式

作为本发明进一步改进的方案，所述归一化模块还用于：

测试样本为：

利用公式

作为本发明进一步改进的方案，所述模型获取模块还用于：

步骤303：利用公式

其中，α_i与α_i ^*均为支持向量机的初始系数，且

步骤304：随机选择遗传个体；

步骤305：根据交叉概率p进行遗传个体交叉操作；

步骤306：根据变异概率s进行遗传个体变异操作；

作为本发明进一步改进的方案，所述校准模块还用于：

本发明的优点在于：通过遗传算法对归一化后的训练样本输入到支持向量机中进行训练，得到遗传算法优化的支持向量机模型，然后将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试，得到预测结果，根据预测值和真实值来获取初始漂移值，卡尔曼滤波器跟踪和校准漂移值，进而来校准用电数据。

附图说明

图1为本发明实施例所公开的一种校准用电数据的方法的流程图；

图2为本发明实施例所公开的一种校准用电数据的方法的详细流程图；

图3为本发明实施例所公开的一种校准用电数据的方法中的EMD去噪前后对比图；

图4为本发明实施例所公开的一种校准用电数据的方法中训练样本去噪后的数据与预测结果的对比图；

图5为本发明实施例所公开的一种校准用电数据的方法的测试样本去噪后的数据与预测结果的对比图；

图6为本发明实施例所公开的一种校准用电数据的方法的预测结果与实际值的误差分析图；

图7为本发明实施例所公开的一种校准用电数据的方法的卡尔曼滤波器算法流程图；

图8为本发明实施例所公开的一种校准用电数据的方法的追踪漂移图；

图9为本发明实施例所公开的一种校准用电数据的方法的用电数据校准前后对比图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

如图1和图2所示，一种校准用电数据的方法，所述方法包括：

步骤S1：采集用电数据并进行去噪以后构建用电数据集，将用电数据集分成两部分，一部分为训练样本，另一部分为测试样本；需要说明的是，本发明从NB-IOT智能设备云平台获取用户的用电数据，选取2019年4月3日到2019年9月30日六个月的用电数据。步骤S1具体处理过程如下：

步骤102：利用公式h₁＝x(k)–m₁计算本征模态函数条件判断结果值，判断本征模态函数条件判断结果值是否满足本征模态函数的条件，如满足，则将h₁作为本征模态函数分量，其中，x(k)为初始用电数据序列，m₁为上包络线和下包络线之间数据的平均值序列，h₁为本征模态函数条件判断结果值；需要说明的是，EMD去噪方法中定义本征模态函数是一类具有瞬时频率的信号，同时它在每一个时刻频率是唯一的。一个本征模态函数需要满足两个条件，函数在整个时间范围内，局部极值点和过零点的数目必须相等，或最多相差一个；在任意时刻点，局部最大值的包络(上包络线)和局部最小值的包络(下包络线)平均值必须为零。如图3所示，为EMD去噪对比图，去噪前用电数据的波形图毛刺多，去噪后用电数据的波形相对平滑，数据稳定性相对较高。

步骤104：上述步骤得到第一个本征模态函数分量，利用公式r₁＝x(k)-C₁从初始用电数据序列x(k)中将第一个本征模态函数分量分离出来，其中，C₁为第一个本征模态函数分量，r₁为第一个本征模态函数分量对应的用电数据；将r₁作为初始用电数据返回执行步骤101至步骤103，得到第n个本征模态函数分量C_n，经过n次返回执行步骤101至步骤103，得到n个本征模态函数分量,且有

当得到的分量不再满足本征模态函数的条件时，循环结束，此时，初始用电数据序列x(k)分解为

步骤S2：对训练样本和测试样本分别进行归一化处理，获取归一化后的训练样本以及归一化后的测试样本；具体过程如下：本实施例中，将用电数据集elec(k)分为训练样本elec_train(前四个半月的数据)和测试样本elec_test(后一个半月的数据)

测试样本为：

本实施例中，

利用公式

训练样本为：

本实施例中，

利用公式

步骤S3：对归一化后的训练样本输入到支持向量机中进行训练，得到遗传算法优化的支持向量机模型；具体过程为：遗传算法优化的基本思想是对随机产生的初始种群，按照适应度函数值对种群进行优良种的选择，淘汰适应度小的种群，形成新一代种群，并对新一代种群根据交叉率进行个体的交叉，以产生带有优良信息的新个体，根据变异率进行个体的变异，以便在种群老化的时候产生新的个体，避免个体的早熟，然后对新一代种群进行适应度计算，直至最优适应度，这时也就找到了最优的惩罚因子c和核函数参数g。

步骤301：遗传算法初始化支持向量机的参数，参数包括种群最大数量、种群最大进化代数、交叉概率p、变异概率s、惩罚因子c的限定范围以及核函数参数g的限定范围；本实施例中，设置最大进化代数为200、种群最大数量为20、交叉概率p为0.7、变异概率s为0.01、惩罚因子c的限定范围0至100、核函数参数g的限定范围为0至1000；

步骤303：利用公式

其中，α_i与α_i ^*均为支持向量机的初始系数，且

步骤304：随机选择遗传个体；

步骤305：根据交叉概率p进行遗传个体交叉操作；

步骤306：根据变异概率s进行遗传个体变异操作；

步骤308：将最优的惩罚因子c以及最优的核函数参数g进行解码；本实施例中解码结果为c为18.79和g为0.17。

步骤S4：将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试，得到预测结果，将预测结果进行反归一化处理得到反归一化处理后的用电数据；反归一化处理即为归一化处理过程的反向求解过程，基于前文已经叙述归一化处理过程，这里对反归一化不做赘述。如图4所示，为训练样本去噪后的数据与预测结果的对比图，图中，去噪后的数据为原始数据，用圆圈表示，预测结果用三角形表示，预测结果与原始数据相差较小，说明本发明的模型预测效果好。同理，图5为测试样本去噪后的数据与预测结果的对比图，去噪后的数据为原始数据，用圆圈表示，预测结果用三角形表示，预测结果与原始数据相差较小，说明本发明的模型预测效果好。图6给出了预测结果与实际值的误差分析图，图中显示误差范围较小，说明本发明提供的模型预测效果好。

步骤S5：选取一组测试样本的用电数据和反归一化处理后的用电数据的差值作为卡尔曼滤波器的输入，对初始漂移值进行优化处理得到最优漂移值，将测试样本的用电数据减去最优漂移值得到校准的用电数据，如图7所示卡尔曼滤波器算法流程图，图中公式属于以下步骤涉及的公式的变形，因此图中公式不做解释，本领域技术人员很容易根据流程图了解本算法原理，具体过程为：

步骤505：将K时刻最优漂移值作为当前时刻漂移值，将K时刻最优协方差作为初始协方差，返回执行步骤501至步骤504，直到达到预设的迭代次数，输出最优漂移值，将测试样本的用电数据减去漂移值得到校准的用电数据。如图8给出了追踪漂移图，图中真实值与估计值接近，说明采用步骤S5的方法跟踪漂移值，误差小，效果显著。如图9所示为用电数据校准前后对比图，可见校准后的用电数据了滤除了噪声干扰，数据更加更够反应用户用电的真实水平，且去漂移后数据与原始数据误差小，用电数据校准较为准确，不会偏离真实值。

本发明提供的一种校准用电数据的方法，通过遗传算法对归一化后的训练样本输入到支持向量机中进行训练，得到遗传算法优化的支持向量机模型，然后将归一化后的测试样本的用电数据输入遗传算法优化的支持向量机模型中进行测试，得到预测结果，根据预测值和真实值来获取初始漂移值，卡尔曼滤波器跟踪和校准漂移值，进而来校准用电数据。对于数据的去噪，采用EMD去噪，EMD分解相较于小波分解等无需选择合适的基函数，可以从自身获得基函数，将非线性、飞平稳的信号分解我线性、平稳的频率由高到低多个本征模态函数变量。与传统的支持向量机相比较该方法能够提高预测的准确性。可根据温度、节假日等特征值对未来时段的用电量进行准确的预测。卡尔曼滤波的基本方程是时间域内的递推形式，对于漂移值的计算，不需要进行大量数据的存储，并且一旦观测到新的数据，随即产生新的漂移值，实现简单、方便。

实施例2

与本发明实施例1相对应的，本发明实施例2还提供一种校准用电数据的装置，所述装置包括：

作为本发明进一步改进的方案，所述样本获取模块还用于：

步骤104：将上述步骤得到第一个本征模态函数分量，利用公式r₁＝x(k)-C₁从初始用电数据序列x(k)中将第一个本征模态函数分量分离出来，其中，C₁为第一个本征模态函数分量，r₁为第一个本征模态函数分量对应的用电数据；将r₁作为初始用电数据返回执行步骤101至步骤103，得到第n个本征模态函数分量C_n，经过n次返回执行步骤101至步骤103，得到n个本征模态函数分量；当得到的分量不再满足本征模态函数的条件时，循环结束，此时，初始用电数据序列x(k)分解为

利用公式

作为本发明进一步改进的方案，所述归一化模块还用于：

测试样本为：

elec_test＝{a₁b₁e₁f₁l₁o₁；

利用公式

作为本发明进一步改进的方案，所述模型获取模块还用于：

步骤303：利用公式

其中，α_i与α_i ^*均为支持向量机的初始系数，且

步骤304：随机选择遗传个体；

步骤305：根据交叉概率p进行遗传个体交叉操作；

步骤306：根据变异概率s进行遗传个体变异操作；

作为本发明进一步改进的方案，所述校准模块还用于：

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。