CN116894156A

CN116894156A - 基于mcmc算法的电力采集终端数据预处理方法

Info

Publication number: CN116894156A
Application number: CN202311152328.0A
Authority: CN
Inventors: 周德勤; 于海群; 张瑞
Original assignee: Beijing Yupont Electric Power Technology Co ltd
Current assignee: Beijing Yupont Electric Power Technology Co ltd
Priority date: 2023-09-08
Filing date: 2023-09-08
Publication date: 2023-10-17
Anticipated expiration: 2043-09-08
Also published as: CN116894156B

Abstract

本发明提供一种基于MCMC算法的电力采集终端数据预处理方法，属于电力采集数据领域，包括步骤S1：对电能表标识、数据日期、相线电压、电能示数进行获取，得到用户电力信息；步骤S2：对用户电力信息进行备份，得到备份数据；步骤S3：检查备份数据中的电能示数是否存在空值；若存在空值，则对空值电能示数进行数据恢复处理；若不存在空值，则对备份数据进行信息分类处理；步骤S4：对用户电力信息进行分类，得到用户分类结果；步骤S5：基于用户分类结果，计算电费，得到电费数值；步骤S6：基于备份数据和用户分类结果，预测用户用电量变化趋势。解决了当前现有的电力采集终端对用户电力信息处理方式单一、准确度相对较低、计算效率较低的问题。

Description

基于MCMC算法的电力采集终端数据预处理方法

技术领域

本发明涉及电力数据预处理技术领域，尤其涉及基于MCMC算法的电力采集终端数据预处理方法。

背景技术

随着电力系统的发展，电力大数据在电力系统中的应用越来越广泛，而且对电力系统的战略性部署有着重要的决策支撑，所以稳定、准确的电力数据尤为重要。使用用电信息采集系统在采集用户电能表的电能表示数信息时，由于设备故障、电网波动以及管理等原因，出现电能表示数为空的异常数据，该部分异常数据会严重影响电网电量统计的准确性。

同时，各类采集终端采集的数据多，后续的分类、筛选、处理复杂，给使用人员带来了很大的维护压力，在修复数据方面，当前普遍采用计算电能表示数月均值、日均值的方法来处理数据，由于该方法实现方式单一，所以处理后的数据准确度相对较低；即使采集终端成功将数据修复，采集终端也无法对修复后的数据进行下一步处理，导致了大量计算机资源的浪费，加大了人工成本。

发明内容

针对上述问题，本发明的目的可以通过以下技术方案实现：基于MCMC算法的电力采集终端数据预处理方法，所述方法包括以下步骤：

步骤S1：对电能表标识、数据日期、相线电压、电能示数进行获取，得到用户电力信息；

步骤S2：对用户电力信息进行备份，得到备份数据；

步骤S3：检查备份数据中的电能示数是否存在空值；若存在空值，则标记出现空值的电能表标识，并对空值电能示数进行数据恢复处理；

若不存在空值，则对备份数据进行信息分类处理，进入步骤S4；

步骤S4：对用户电力信息进行分类，得到用户分类结果；

步骤S5：基于用户分类结果，计算电费，得到电费数值；

步骤S6：基于备份数据和用户分类结果，预测用户用电量变化趋势。

进一步地，所述步骤S3中，对数据恢复处理的步骤具体如下：

步骤S31：将空值电能表的数据日期，定义为空值数据日期，记作t₀；将空值电能表的电能表示数，定义为待补充参数，记作U₀；

步骤S32：将空值电能表的前一天数据日期，定义为前数据日期，记作t_-1；将空值电能表的前一天电能表示数，定义为前参数，记作U_t-1；将空值电能表的后一天数据日期，定义为后数据日期，记作t₊₁；将空值电能表的后一天电能表示数，定义为后参数，记作U_t+1；

步骤S32：读取数据库中空值电能表的近3年历史数据信息，包括电能表标识、历史数据日期、历史电能表示数，作为基础数据，记作S₀；

步骤S33：利用M-H抽样算法从S₀中抽取近3年内的6组数据，作为样本数据，记作S₁；

步骤S34：利用曲线生成函数为S₁中的每一组数据建立二维坐标系，并生成曲线；

步骤S35：利用极限求值函数，计算每组生成曲线上相邻两点的极限值；若相邻两点的极限值相等，说明数据连续性高；若相邻两点的极限值不相等，说明数据连续性低；

步骤S36：利用朴素贝叶斯分类器对S₁进行数据分类，并为S₁分配数据处理标签；

步骤S37：根据t_-1和U_t-1、t₊₁和U_t+1和样本数据标签，将样本数据分别输入蒙特卡洛算法模块和EM算法模块中，查看输出结果；蒙特卡洛算法输出值，记作S_MC；EM算法输出值，记作S_EM；

步骤S38：计算S_MC和S_EM的平均值，记作S^、，将S^、填入U₀，作为空值电能表的电能表示数。

进一步地，所述步骤S4中，对用户信息分类步骤如下：

步骤S41：提取用户电力信息中的电能表标识和相线电压；相线电压包括线电压和相电压；

步骤S42：为每一个用户电力信息，建立“线电压和相电压”关于“电能表标识”的映射，记作m；

步骤S43：根据相电压和线电压，筛出映射并标记m；

步骤S44：根据m上的标记，对用户电力信息进行分类；得到用户分类结果。

进一步地，所述步骤S5中，基于用户分类结果得到用户类型，计算电费；

用户类型包括：普通用户、小型企业、小型工业、大型企业、大型工业；

不同类型的用户电费计算方式不同，具体表现为：

“普通用户、小型企业、小型工业”设置有阶段标准和累计用电量要求，电费按月计算；

“大型企业、大型工业”没有设置阶段标准和累计用电量要求，电费按年计算。

进一步地，“普通用户、小型企业、小型工业”电费计算如下：

第一、第二、第三阶段分别设置有“用电范围峰值”和“阶段峰值”；

若用户当月的用电量不超过‘第一“用电范围峰值”’，则按“第一阶段价格”收费；

超过‘第一“用电范围峰值”’，累计用电量不超过‘第一“阶段峰值”’，超过‘第一“用电范围峰值”’的部分按“第二阶段价格”收费；剩余部分按“第一阶段价格”收费；

第二、第三阶段收费标准与上述第一阶段收费标准相同；

“大型企业、大型工业”电费计算如下：

大型企业和大型工业，电费每年按“规定的电费标准”收费。

进一步地，所述小型企业包括：农副企业Ⅰ、畜牧企业Ⅱ、渔鲜企业Ⅲ；

所述小型工业包括：木材工业Ⅰ、器件制造工业Ⅱ、食品工业Ⅲ；

所述大型企业包括：通讯企业Ⅰ、服务企业Ⅱ、金融企业Ⅲ。

进一步地，所述步骤S6中，预测用户用电量变化趋势的步骤如下：

步骤S61：基于步骤S4的用户分类结果，利用M-H抽样算法随机抽取一组用户电力信息，记作F；

步骤S62：读取F中的电能表标识，记作N_f；读取F中最近一次数据时间T_f；读取F中T_f对应的电能表示数，记作U_f；

步骤S62：根据T_f和N_f，读取数据库中N_f近3年的历史电能表示数，记作U_f ^、；

步骤S63：读取Uf^、中处于第一阶段、第二阶段、第三阶段的次数，分别记作A₁、A₂、A₃；

步骤S64：计算U_f ^、处于第一阶段、第二阶段、第三阶段的概率，记作P（A₁）^、、P（A₂）^、、P（A₃）^、；

步骤S65：根据T_f和N_f，读取数据库中，月份相差为+1和-1的6组数据，记作U_f ^、、；

步骤S66：利用步骤S63～步骤S65的方法；计算U_f ^、、中月份相差为-1的3组电能表示数在第一阶段、第二阶段、第三阶段的概率，记作P（B₁）^、、、P（B₂）^、、、P（B₃）^、、；

步骤S67：计算U_f ^、、中月份相差为+1的3组“电能表示数”处于第一阶段、第二阶段、第三阶段的概率，记作P（B₁|A₁）^、、、P（B₂|A₂）^、、、P（B₃|A₃）^、、；

步骤S68：利用贝叶斯公式，分别求出N_f的历史在第一阶段、第二阶段、第三阶段的稳定概率，记作P（A₁|B₁）、P（A₂|B₂）、P（A₃|B₃）；

步骤S69：根据P（A₁|B₁）、P（A₂|B₂）、P（A₃|B₃）生成状态转移矩阵；

步骤S610：读取T_f中的月份信息，记作m_f；

步骤S611：根据m_f、N_f和状态转移矩阵，把N_f中m_f月所有的电能表示数带入MCMC算法迭代模块得到输出结果，记作U_f ^、；

步骤S612：对U_f ^、进行分析；预测用户用电趋势。

进一步地，所述步骤S612中，对U_f ^、的分析过程如下：

（U_f ^、－U_f）＜0，说明用户本月用电量可能增加；

（U_f ^、－U_f）＞0，说明用户本月用电量可能增加；

在（U_f ^、－U_f）＞0的前提下，若（U_f ^、－U_f）＜210，说明用户本月用电量将进入第一阶段；

若210＜（U_f ^、－U_f）＜400，说明用户本月用电量将进入第二阶段；

若（U_f ^、－U_f）＞400，说明用户本月用电量将进入第三阶段。

与现有技术相比，本发明的有益效果是：

1.本发明基于采集空值电能表的当前信息和空值电能表的历史数据；通过MCMC算法实现对空值的修复；使得空值修复的修复准确性高，修复成本较低，复用性高；能够及时对漏缺数据进行填补，提高数据可用性。

2.本发明还根据修复好的空值和原有的非空值数据计算用户应缴电费；解放人力，避免上述空值修复中，过多计算机资源的浪费。

3.本发明还能结合用户当前用电信息及用户历史用电信息，对用户未来的用电趋势进行预测；为供电方的调整供电决策提供参考。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明数据处理流程图；

图2为本发明中空值电能表示数修复流程图；

图3为本发明中MCMC算法流程图。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1，一种基于MCMC算法的电力采集终端数据预处理方法，所述包括如下步骤：

步骤1：通过电力采集终端获取用户电力信息；用户电力信息包括：电能表标识、数据日期、相线电压、电能表示数；

需要说明的是，电力采集终端包括数据采集设备（采集器、集中器）和数据存储设备（数据库）；

所述步骤1中，所采集的用户电力信息，各字段分别表示的含义如下：

电能表标识：待采集电能表的名称，与用户的身份信息对应；

数据日期：用户电力信息的时间，包括年、月、日；

相线电压：待采集电能表上的相电压和线电压；

电能表示数：待采集电能表对应的读数；

步骤2：对获取的用户电力信息进行备份，得到备份数据，记作BD；

步骤3：通过检查BD中的电能表示数是否存在空值；如果不存在空值，则对BD进行信息分类处理，进入步骤4；如果存在空值，则标记出现空值的电能表标识，根据被标记的电能表标识找到电能表出故障的用户，通知电工当天修理；并对空值电能表的电能表示数进行数据恢复处理。

请参阅图2，所述步骤3中，数据恢复处理的过程如下：

步骤31：将电能表出现空值的数据日期，定义为空值数据日期，记作t₀；将空值电能表的电能表示数，定义为待补充参数，记作U₀；

步骤32：根据被标记的电能表标识读取数据库中的历史数据；将空值电能表的前一天数据日期，定义为前数据日期，记作t_-1；将空值电能表的前一天电能表示数，定义为前参数，记作U_t-1；将空值电能表的后一天数据日期，定义为后数据日期，记作t₊₁；将空值电能表的后一天电能表示数，定义为后参数，记作U_t+1；

步骤32：根据被标记的电能表标识读取数据库中空值电能表的近3年全部历史数据信息，包括电能表标识、历史数据日期、历史电能表示数，作为数据恢复处理的基础数据，记作S₀；

步骤33：利用M-H抽样算法从S₀中随机抽取近3年内的6组数据（每组数据必须是连续的28条数据），作为样本数据，记作S₁；M-H抽样算法的抽样条件设置：历史数据日期与空值数据日期的差必须为12的整数倍，余数的绝对值必须在0～2之间；

步骤34：利用曲线生成函数为S₁中的每一组数据建立二维坐标系，并生成曲线；曲线生成函数的坐标轴设置：横坐标为历史数据日期，纵坐标为历史电能表示数；

步骤35：利用极限求值函数计算每组生成曲线上相邻两点的极限值，比较相邻两点的极限值是否相等；若相等，则说明数据连续性高；若不相等，则说明数据连续性低；

步骤36：请参阅表1（数据样例特征表），基于表1利用朴素贝叶斯分类器对S₁进行数据分类，并为S₁分配数据处理标签(蒙特卡洛算法标签和EM算法标签)；

需要说明的是，朴素贝叶斯分类器是根据指定结论，对样本进行取样的装置；结合本发明，指定结论为数据样例特征表（表1），样本为S₁；

步骤37：根据样本数据标签，将样本数据(电能表标识、历史数据日期、电能表示数)分别输入蒙特卡洛算法模块和EM算法模块中，查看输出结果；

需要说明的是，蒙特卡洛算法是基于稳态计算的算法，结合本发明，即连续性的样本数据，坐标轴上相邻两点的左右极限和斜率相同；蒙特卡洛算法模块根据S₁每组中的历史数据日期和历史电能表示数，求得6组“历史数据日期”关于“历史电能表示数”的函数f（x）^、，比较6组函数f（x）^、中“历史数据日期”的系数，选择系数相同且出现次数最多的f（x）^、，作为参照函数，记作f（x）^、、；蒙特卡洛算法模块根据t₀、t_-1、t₊₁，求得空值电能表f（x）^、、的历史积分，记作△γ；蒙特卡洛算法模块利用定积分的逆运算，把t₊₁带入b中；把t_-1带入a中；把f（x）^、、带入f（x）中，计算空值电能表示数的算术中值，记作U₀ ^、，计算U₀ ^、、U_-1、U₊₁三者的平均值作为蒙特卡洛输出值，记作S_MC；

EM算法是最大期望算法，结合本发明，即EM算法模块先计算S₁中每组数据的平均值，将最大的平均值作为EM算法输出值，记作S_EM；

步骤38：计算和S_MC的S_EM平均值，记作S^、，将S^、填入U₀，作为空值电能表的电能表示数。

步骤4：请参阅表2（用户分类表），基于表2对用户电力信息进行分类；

所述用户电力信息分类过程如下：

步骤41：提取用户电力信息中的电能表标识和相线电压；相线电压包括线电压和相电压；

步骤42：为每一个用户电力信息，建立“线电压和相电压”关于“电能表标识”的映射，记作m；

步骤43：根据相电压和线电压，筛出映射并标记m；

找出m中只有线电压的映射，表示普通用户，标记作m₁；

找出m中有线电压和1号相电压的映射，表示农副企业Ⅰ，标记作m₂₁；

找出m中有线电压和2号相电压的映射，表示畜牧企业Ⅱ，标记作m₂₂；

找出m中有线电压和3号相电压的映射，表示渔鲜企业Ⅲ，标记作m₂₃；

找出m中有1号相电压和2号相电压的映射，表示木材工业Ⅰ，标记作m₂₄；

找出m中有1号相电压和3号相电压的映射，表示器件制造工业Ⅱ，标记作m₂₅；

找出m中有2号相电压和3号相电压的映射，表示食品工业Ⅲ，标记作m₂₆；

找出m中有线电压和1号相电压、2号相电压的映射，表示通讯企业Ⅰ，标记作m₃₁；

找出m中有线电压和1号相电压、3号相电压的映射，表示服务企业Ⅱ，标记作m₃₂；

找出m中有线电压和2号相电压/3号相电压的映射，表示金融企业Ⅲ，标记作m₃₃；

找出m中1号相电压、2号相电压、3号相电压的映射，标记作m₃，表示大型工业；

需要说明的是，相电压和线电压为国家既定标准，但不同地区的“相电压和线电压组合”所代表的用户类型不同；本发明所展示的根据相线电压对用户进行分类的标准（用户分类表）不代表最终结果，具体的用户分类标准由地方政府和供电局共同决定；

步骤44：根据步骤43映射的标记，对用户电力信息进行分类；

需要说明的是，步骤44不同用户类型的分类方法相同；此处以“普通家庭”为例，说明用户分类过程：

步骤441：提取所有标记为m₁的映射；

步骤442：根据映射得到电能表标识；

步骤443：根据电能表标识，在BD中获得数据时间和电能表示数；

步骤444：根据电能表标识，在数据库中读取用户身份；

步骤445：请参阅表4，根据电能表标识、数据时间、电能表示数、用户身份建立“普通家庭”用户表；

需要说明的是，表4中的数据仅为样例数据展示，无现实参考意义；

步骤5：基于步骤4对用户电力信息的分类，请参阅表3（收费标准），进行用户应缴电费计算，计算完成后，得到电费数值，进入步骤6，所述用户应缴电费计算过程如下：

需要说明的是，所述小型企业包括：农副企业Ⅰ、畜牧企业Ⅱ、渔鲜企业Ⅲ；

所述大型企业包括：通讯企业Ⅰ、服务企业Ⅱ、金融企业Ⅲ；

其中普通用户，小型企业，小型工业按月缴费，大型企业和大型工业有按月缴费和按年缴费两种方式；

普通用户，小型企业，小型工业按月缴费的计算流程相同，下面以“普通用户”为例进行说明，普通用户一个月的用电量记作V，累计用电量记作Va；

第一阶段是每月每个用户的使用电量不超过210度，总累计电量不超过2520度；在这个阶段，电费按照规定的价格收费；

第二阶段是每月每个用户的使用电量在210和400度之间，总电量不累计超过4800度；在这个阶段，在现行电价基础上，每度加价0.05元；

第三阶段是每月每个用户的使用电量在400度以上，累计电量在4800以上。在这个阶段，在现行电价基础上，每度加价0.3元；

Ⅰ、用户的使用电量不超过210度；总累计电量不超过2520度，电费按“0.7度/元”的价格收费，应缴电费为07*V；若总累计电量超过2520度不超过4800度，累计超过2520度的部分按“0.75度/元”收费；剩余部分按“0.7度/元”收费，应缴电费为：0.75*（Va－2520）＋0.7*（V－Va＋2520）；若总累计电量超过4800度，累计超过4800度的部分按“1.05度/元”收费，剩余部分按“0.7度/元”收费，应缴电费为：1.05*（Va－4800）＋0.7*（V－Va＋4800）；

需要说明的是，V表示用户一个月的用电量，Va表示用户累计用电量；

Ⅱ、用户的使用电量在210和400度之间；总电量不累计超过2520度，超过210度的电费按“0.75度/元”的价格收费，剩下的收147元（210*0.7＝147），应缴电费为：0.75*（V－210）＋147；若总累计电量超过2520度不超过4800度，累计超过2520度的部分按“0.75度/元”收费，剩余部分按“总电量不累计超过2520度”的标准收费，应缴电费为：0.75*（Va－2520）＋0.75*（V－Va＋2310）＋147；若总累计电量超过4800度，累计超过4800度的部分按“1.05度/元”收费，剩余部分按“总累计电量超过2520度不超过4800度”的标准收费，应缴电费为：1.05*（Va－4800）＋0.75*（V－Va＋4590）＋147；

Ⅲ、用户的使用电量在400度以上；总电量不累计超过2520度，超过400度的电费按“1.05度/元”的价格收费，剩下的收289.5元【（（210*0.7）＋0.75*（400－210））＝289.5】，应缴电费为：1.05*（V－400）＋289.5；若总累计电量超过2520度不超过4800度，累计超过2520度的部分按“0.75度/元”收费，剩余部分按“总电量不累计超过2520度”的标准收费；若应缴电费为：0.75*（Va－2520）＋,1.05*（V－Va＋2120）＋289.5；若总累计电量超过4800度，累计超过4800度的部分按“1.05度/元”收费，剩余部分按“总累计电量超过2520度不超过4800度”的标准收费，应缴电费为：1.05*（Va－4800）＋1.05*（V－Va＋4400）＋289.5；

大型企业和大型工业，按年缴纳电费，没有阶段标准和累计用电量要求，大型企业应缴电费为：1.32*V；大型工业应缴电费为：1.22*V；

需要说明的是，本发明所展示的收费标准类表不代表最终结果，具体的收费标准由地方政府和供电局共同决定；

步骤6：把步骤5生成的电费账单保存在数据库中，基于步骤2中的备份数据BD和步骤4的用户分类结果，进行用户用电趋势预测；

需要说明的是，所述用户用电趋势预测，不同类型的用户的预测方式相同，此处以“普通用户”为例，说明用户用电趋势预测过程：

步骤61：基于步骤4的用户分类结果，利用M-H抽样算法（详细见步骤33）抽取电能表标识标记作m₁的一组用户电力信息，记作F；

步骤62：读取F中最近一次数据时间T_f；

步骤63：根据T_f，读取F中的电能表标识，记作N_f；读取F中T_f对应的电能表示数，记作U_f；

步骤64：读取T_f中的月份信息，记作m_f，根据m_f和N_f，在数据库中读取近3年与T_f月份相同的3组电能表示数，记作U_f ^、；

步骤65：基于表3，读取U_f中处于第一阶段、第二阶段、第三阶段所有数的次数，分别记作A₁、A₂、A₃；读取范围：每月的1号～28号；

步骤66：分别计算3组电能表示数处于第一阶段的概率，记作P（A₁），P（A₁）＝A₁/28；处于第二阶段的概率，记作P（A₂），P（A₂）＝A₂/28；处于第三阶段的概率，记作P（A₃），P（A₃）＝A₃/28；

需要说明的是，步骤64收集次数和步骤65计算出现概率，将每个月天数设置为28，目的是避免闰年的干扰；

步骤67：计算3组电能表在第一阶段、第二阶段、第三阶段的概率的平均值，记作P（A₁）^、、P（A₂）^、、P（A₃）^、；

步骤68：根据T_f中的月份信息和N_f，读取数据库中月份相差为+1和-1的6组数据，记作U_f ^、、；

步骤69：根据U_f ^、、利用步骤64～步骤66的方法；计算月份相差为-1的3组电能表示数在第一阶段、第二阶段、第三阶段的概率的平均值，记作P（B₁）^、、、P（B₂）^、、、P（B₃）^、、；计算月份相差为+1的3组电能表示数在第一阶段、第二阶段、第三阶段的概率的平均值，记作P（B₁|A₁）^、、、P（B₂|A₂）^、、、P（B₃|A₃）^、、；

步骤610：利用贝叶斯公式，分别求出N_f的历史在第一阶段、第二阶段、第三阶段的稳定概率，记作P（A1|B1）、P（A2|B2）、P（A3|B3）；

步骤611：根据P（A₁|B₁）、P（A₂|B₂）、P（A₃|B₃）生成状态转移矩阵；

步骤612：请参阅图3，根据m_f、N_f和状态转移矩阵，把N_f中m_f月所有的电能表示数，带入MCMC算法迭代模块，进行数据迭代。

需要说明的是，MCMC算法，是利用历史数据得到稳态数据，再对目标进行数据迭代的数学估测算法，在本发明中MCMC算法用于预测用户后续电压变化；

步骤613：查看MCMC算法迭代模块的输出结果，记作U_f ^、；

若（U_f ^、－U_f）＜0，说明用户本月用电量可能减少；

若0＜（U_f ^、－U_f），说明用户本月用电量可能增加；

若0＜（U_f ^、－U_f），且（U_f ^、－U_f）＜210，说明用户本月用电量将进入第一阶段；

若0＜（U_f ^、－U_f），且210＜（U_f ^、－U_f）＜400，说明用户本月用电量将进入第二阶段；

若0＜（U_f ^、－U_f），且400＜（U_f ^、－U_f），说明用户本月用电量将进入第三阶段。

表1数据样例特征表

表2用户分类表

线电压	1号相电压	2号相电压	3号相电压	供电类型	用户类型
						220V				单相电	普通家庭
220V	380V			二相电	农副企业Ⅰ
						220V		380V		二相电	畜牧企业Ⅱ
220V			380V	二相电	渔鲜企业Ⅲ
							380V	380V		二相电	木材工业Ⅰ
	380V		380V	二相电	器件制造工业Ⅱ
								380V	380V	二相电	食品工业Ⅲ
220V	380V	380V		三相电	通讯企业Ⅰ
						220V	380V		380V	三相电	服务企业Ⅱ
220V		380V	380V	三相电	金融企业Ⅲ
							380V	380V	380V	三相电	大型工业

表3收费标准

表4“普通家庭”用户表

上述公式均是去量纲取其数值计算，公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式，公式中的预设参数由本领域的技术人员根据实际情况进行设置，如存在权重系数和比例系数，其设置的大小是为了将各个参数进行量化得到的一个具体的数值，便于后续比较，关于权重系数和比例系数的大小，只要不影响参数与量化后数值的比例关系即可。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节，也不限制该发明仅为的具体实施方式。显然，根据本说明书的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种基于MCMC算法的电力采集终端数据预处理方法，其特征在于，包括如下步骤；

步骤S2：对用户电力信息进行备份，得到备份数据；

步骤S4：对用户电力信息进行分类，得到用户分类结果；

步骤S5：基于用户分类结果，计算电费，得到电费数值；

2.根据权利要求1所述的一种基于MCMC算法的电力采集终端数据预处理方法，其特征在于，所述步骤S3中，对数据恢复处理的步骤具体如下：

3.根据权利要求1所述的一种基于MCMC算法的电力采集终端数据预处理方法，其特征在于，所述步骤S4中，对用户信息分类步骤如下：

步骤S43：根据相电压和线电压，筛出映射并标记m；

4.根据权利要求1所述的一种基于MCMC算法的电力采集终端数据预处理方法，其特征在于，所述步骤S5中，基于用户分类结果得到用户类型，计算电费；

不同类型的用户电费计算方式不同，具体表现为：

5.根据权利要求4所述的一种基于MCMC算法的电力采集终端数据预处理方法，其特征在于，“普通用户、小型企业、小型工业”电费计算如下：

第二、第三阶段收费标准与上述第一阶段收费标准相同；

“大型企业、大型工业”电费计算如下：

6.根据权利要求4所述的一种基于MCMC算法的电力采集终端数据预处理方法，其特征在于，所述小型企业包括：农副企业Ⅰ、畜牧企业Ⅱ、渔鲜企业Ⅲ；

7.根据权利要求1所述的一种基于MCMC算法的电力采集终端数据预处理方法，其特征在于，所述步骤S6中，预测用户用电量变化趋势的步骤如下：

步骤S63：读取U_f ^、中处于第一阶段、第二阶段、第三阶段的次数，分别记作A₁、A₂、A₃；

步骤S610：读取T_f中的月份信息，记作m_f；

步骤S612：对U_f ^、进行分析；预测用户用电趋势。

8.根据权利要求7所述的一种基于MCMC算法的电力采集终端数据预处理方法，其特征在于，所述步骤S612中，对U_f ^、的分析过程如下：

（U_f ^、－U_f）＜0，说明用户本月用电量增加；

（U_f ^、－U_f）＞0，说明用户本月用电量增加；