CN116894156A - 基于mcmc算法的电力采集终端数据预处理方法 - Google Patents
基于mcmc算法的电力采集终端数据预处理方法 Download PDFInfo
- Publication number
- CN116894156A CN116894156A CN202311152328.0A CN202311152328A CN116894156A CN 116894156 A CN116894156 A CN 116894156A CN 202311152328 A CN202311152328 A CN 202311152328A CN 116894156 A CN116894156 A CN 116894156A
- Authority
- CN
- China
- Prior art keywords
- electric energy
- data
- user
- energy meter
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 50
- 238000007781 pre-processing Methods 0.000 title claims abstract description 15
- 230000005611 electricity Effects 0.000 claims abstract description 83
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000011084 recovery Methods 0.000 claims abstract description 8
- 230000008859 change Effects 0.000 claims abstract description 5
- 238000013507 mapping Methods 0.000 claims description 27
- 238000005070 sampling Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims description 6
- 241000251468 Actinopterygii Species 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 5
- 244000144972 livestock Species 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 239000002023 wood Substances 0.000 claims description 4
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 claims description 3
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 2
- 230000010365 information processing Effects 0.000 abstract 1
- 230000008439 repair process Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/252—Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于MCMC算法的电力采集终端数据预处理方法,属于电力采集数据领域,包括步骤S1:对电能表标识、数据日期、相线电压、电能示数进行获取,得到用户电力信息;步骤S2:对用户电力信息进行备份,得到备份数据;步骤S3:检查备份数据中的电能示数是否存在空值;若存在空值,则对空值电能示数进行数据恢复处理;若不存在空值,则对备份数据进行信息分类处理;步骤S4:对用户电力信息进行分类,得到用户分类结果;步骤S5:基于用户分类结果,计算电费,得到电费数值;步骤S6:基于备份数据和用户分类结果,预测用户用电量变化趋势。解决了当前现有的电力采集终端对用户电力信息处理方式单一、准确度相对较低、计算效率较低的问题。
Description
技术领域
本发明涉及电力数据预处理技术领域,尤其涉及基于MCMC算法的电力采集终端数据预处理方法。
背景技术
随着电力系统的发展,电力大数据在电力系统中的应用越来越广泛,而且对电力系统的战略性部署有着重要的决策支撑,所以稳定、准确的电力数据尤为重要。使用用电信息采集系统在采集用户电能表的电能表示数信息时,由于设备故障、电网波动以及管理等原因,出现电能表示数为空的异常数据,该部分异常数据会严重影响电网电量统计的准确性。
同时,各类采集终端采集的数据多,后续的分类、筛选、处理复杂,给使用人员带来了很大的维护压力,在修复数据方面,当前普遍采用计算电能表示数月均值、日均值的方法来处理数据,由于该方法实现方式单一,所以处理后的数据准确度相对较低;即使采集终端成功将数据修复,采集终端也无法对修复后的数据进行下一步处理,导致了大量计算机资源的浪费,加大了人工成本。
发明内容
针对上述问题,本发明的目的可以通过以下技术方案实现:基于MCMC算法的电力采集终端数据预处理方法,所述方法包括以下步骤:
步骤S1:对电能表标识、数据日期、相线电压、电能示数进行获取,得到用户电力信息;
步骤S2:对用户电力信息进行备份,得到备份数据;
步骤S3:检查备份数据中的电能示数是否存在空值;若存在空值,则标记出现空值的电能表标识,并对空值电能示数进行数据恢复处理;
若不存在空值,则对备份数据进行信息分类处理,进入步骤S4;
步骤S4:对用户电力信息进行分类,得到用户分类结果;
步骤S5:基于用户分类结果,计算电费,得到电费数值;
步骤S6:基于备份数据和用户分类结果,预测用户用电量变化趋势。
进一步地,所述步骤S3中,对数据恢复处理的步骤具体如下:
步骤S31:将空值电能表的数据日期,定义为空值数据日期,记作t0;将空值电能表的电能表示数,定义为待补充参数,记作U0;
步骤S32:将空值电能表的前一天数据日期,定义为前数据日期,记作t-1;将空值电能表的前一天电能表示数,定义为前参数,记作Ut-1;将空值电能表的后一天数据日期,定义为后数据日期,记作t+1;将空值电能表的后一天电能表示数,定义为后参数,记作Ut+1;
步骤S32:读取数据库中空值电能表的近3年历史数据信息,包括电能表标识、历史数据日期、历史电能表示数,作为基础数据,记作S0;
步骤S33:利用M-H抽样算法从S0中抽取近3年内的6组数据,作为样本数据,记作S1;
步骤S34:利用曲线生成函数为S1中的每一组数据建立二维坐标系,并生成曲线;
步骤S35:利用极限求值函数,计算每组生成曲线上相邻两点的极限值;若相邻两点的极限值相等,说明数据连续性高;若相邻两点的极限值不相等,说明数据连续性低;
步骤S36:利用朴素贝叶斯分类器对S1进行数据分类,并为S1分配数据处理标签;
步骤S37:根据t-1和Ut-1、t+1和Ut+1和样本数据标签,将样本数据分别输入蒙特卡洛算法模块和EM算法模块中,查看输出结果;蒙特卡洛算法输出值,记作SMC;EM算法输出值,记作SEM;
步骤S38:计算SMC和SEM的平均值,记作S、,将S、填入U0,作为空值电能表的电能表示数。
进一步地,所述步骤S4中,对用户信息分类步骤如下:
步骤S41:提取用户电力信息中的电能表标识和相线电压;相线电压包括线电压和相电压;
步骤S42:为每一个用户电力信息,建立“线电压和相电压”关于“电能表标识”的映射,记作m;
步骤S43:根据相电压和线电压,筛出映射并标记m;
步骤S44:根据m上的标记,对用户电力信息进行分类;得到用户分类结果。
进一步地,所述步骤S5中,基于用户分类结果得到用户类型,计算电费;
用户类型包括:普通用户、小型企业、小型工业、大型企业、大型工业;
不同类型的用户电费计算方式不同,具体表现为:
“普通用户、小型企业、小型工业”设置有阶段标准和累计用电量要求,电费按月计算;
“大型企业、大型工业”没有设置阶段标准和累计用电量要求,电费按年计算。
进一步地,“普通用户、小型企业、小型工业”电费计算如下:
第一、第二、第三阶段分别设置有“用电范围峰值”和“阶段峰值”;
若用户当月的用电量不超过‘第一“用电范围峰值”’,则按“第一阶段价格”收费;
超过‘第一“用电范围峰值”’,累计用电量不超过‘第一“阶段峰值”’,超过‘第一“用电范围峰值”’的部分按“第二阶段价格”收费;剩余部分按“第一阶段价格”收费;
第二、第三阶段收费标准与上述第一阶段收费标准相同;
“大型企业、大型工业”电费计算如下:
大型企业和大型工业,电费每年按“规定的电费标准”收费。
进一步地,所述小型企业包括:农副企业Ⅰ、畜牧企业Ⅱ、渔鲜企业Ⅲ;
所述小型工业包括:木材工业Ⅰ、器件制造工业Ⅱ、食品工业Ⅲ;
所述大型企业包括:通讯企业Ⅰ、服务企业Ⅱ、金融企业Ⅲ。
进一步地,所述步骤S6中,预测用户用电量变化趋势的步骤如下:
步骤S61:基于步骤S4的用户分类结果,利用M-H抽样算法随机抽取一组用户电力信息,记作F;
步骤S62:读取F中的电能表标识,记作Nf;读取F中最近一次数据时间Tf;读取F中Tf对应的电能表示数,记作Uf;
步骤S62:根据Tf和Nf,读取数据库中Nf近3年的历史电能表示数,记作Uf 、;
步骤S63:读取Uf、中处于第一阶段、第二阶段、第三阶段的次数,分别记作A1、A2、A3;
步骤S64:计算Uf 、处于第一阶段、第二阶段、第三阶段的概率,记作P(A1)、、P(A2)、、P(A3)、;
步骤S65:根据Tf和Nf,读取数据库中,月份相差为+1和-1的6组数据,记作Uf 、、;
步骤S66:利用步骤S63~步骤S65的方法;计算Uf 、、中月份相差为-1的3组电能表示数在第一阶段、第二阶段、第三阶段的概率,记作P(B1)、、、P(B2)、、、P(B3)、、;
步骤S67:计算Uf 、、中月份相差为+1的3组“电能表示数”处于第一阶段、第二阶段、第三阶段的概率,记作P(B1|A1)、、、P(B2|A2)、、、P(B3|A3)、、;
步骤S68:利用贝叶斯公式,分别求出Nf的历史在第一阶段、第二阶段、第三阶段的稳定概率,记作P(A1|B1)、P(A2|B2)、P(A3|B3);
步骤S69:根据P(A1|B1)、P(A2|B2)、P(A3|B3)生成状态转移矩阵;
步骤S610:读取Tf中的月份信息,记作mf;
步骤S611:根据mf、Nf和状态转移矩阵,把Nf中mf月所有的电能表示数带入MCMC算法迭代模块得到输出结果,记作Uf 、;
步骤S612:对Uf 、进行分析;预测用户用电趋势。
进一步地,所述步骤S612中,对Uf 、的分析过程如下:
(Uf 、-Uf)<0,说明用户本月用电量可能增加;
(Uf 、-Uf)>0,说明用户本月用电量可能增加;
在(Uf 、-Uf)>0的前提下,若(Uf 、-Uf)<210,说明用户本月用电量将进入第一阶段;
若210<(Uf 、-Uf)<400,说明用户本月用电量将进入第二阶段;
若(Uf 、-Uf)>400,说明用户本月用电量将进入第三阶段。
与现有技术相比,本发明的有益效果是:
1.本发明基于采集空值电能表的当前信息和空值电能表的历史数据;通过MCMC算法实现对空值的修复;使得空值修复的修复准确性高,修复成本较低,复用性高;能够及时对漏缺数据进行填补,提高数据可用性。
2.本发明还根据修复好的空值和原有的非空值数据计算用户应缴电费;解放人力,避免上述空值修复中,过多计算机资源的浪费。
3.本发明还能结合用户当前用电信息及用户历史用电信息,对用户未来的用电趋势进行预测;为供电方的调整供电决策提供参考。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明数据处理流程图;
图2为本发明中空值电能表示数修复流程图;
图3为本发明中MCMC算法流程图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,一种基于MCMC算法的电力采集终端数据预处理方法,所述包括如下步骤:
步骤1:通过电力采集终端获取用户电力信息;用户电力信息包括:电能表标识、数据日期、相线电压、电能表示数;
需要说明的是,电力采集终端包括数据采集设备(采集器、集中器)和数据存储设备(数据库);
所述步骤1中,所采集的用户电力信息,各字段分别表示的含义如下:
电能表标识:待采集电能表的名称,与用户的身份信息对应;
数据日期:用户电力信息的时间,包括年、月、日;
相线电压:待采集电能表上的相电压和线电压;
电能表示数:待采集电能表对应的读数;
步骤2:对获取的用户电力信息进行备份,得到备份数据,记作BD;
步骤3:通过检查BD中的电能表示数是否存在空值;如果不存在空值,则对BD进行信息分类处理,进入步骤4;如果存在空值,则标记出现空值的电能表标识,根据被标记的电能表标识找到电能表出故障的用户,通知电工当天修理;并对空值电能表的电能表示数进行数据恢复处理。
请参阅图2,所述步骤3中,数据恢复处理的过程如下:
步骤31:将电能表出现空值的数据日期,定义为空值数据日期,记作t0;将空值电能表的电能表示数,定义为待补充参数,记作U0;
步骤32:根据被标记的电能表标识读取数据库中的历史数据;将空值电能表的前一天数据日期,定义为前数据日期,记作t-1;将空值电能表的前一天电能表示数,定义为前参数,记作Ut-1;将空值电能表的后一天数据日期,定义为后数据日期,记作t+1;将空值电能表的后一天电能表示数,定义为后参数,记作Ut+1;
步骤32:根据被标记的电能表标识读取数据库中空值电能表的近3年全部历史数据信息,包括电能表标识、历史数据日期、历史电能表示数,作为数据恢复处理的基础数据,记作S0;
步骤33:利用M-H抽样算法从S0中随机抽取近3年内的6组数据(每组数据必须是连续的28条数据),作为样本数据,记作S1;M-H抽样算法的抽样条件设置:历史数据日期与空值数据日期的差必须为12的整数倍,余数的绝对值必须在0~2之间;
步骤34:利用曲线生成函数为S1中的每一组数据建立二维坐标系,并生成曲线;曲线生成函数的坐标轴设置:横坐标为历史数据日期,纵坐标为历史电能表示数;
步骤35:利用极限求值函数计算每组生成曲线上相邻两点的极限值,比较相邻两点的极限值是否相等;若相等,则说明数据连续性高;若不相等,则说明数据连续性低;
步骤36:请参阅表1(数据样例特征表),基于表1利用朴素贝叶斯分类器对S1进行数据分类,并为S1分配数据处理标签(蒙特卡洛算法标签和EM算法标签);
需要说明的是,朴素贝叶斯分类器是根据指定结论,对样本进行取样的装置;结合本发明,指定结论为数据样例特征表(表1),样本为S1;
步骤37:根据样本数据标签,将样本数据(电能表标识、历史数据日期、电能表示数)分别输入蒙特卡洛算法模块和EM算法模块中,查看输出结果;
需要说明的是,蒙特卡洛算法是基于稳态计算的算法,结合本发明,即连续性的样本数据,坐标轴上相邻两点的左右极限和斜率相同;蒙特卡洛算法模块根据S1每组中的历史数据日期和历史电能表示数,求得6组“历史数据日期”关于“历史电能表示数”的函数f(x)、,比较6组函数f(x)、中“历史数据日期”的系数,选择系数相同且出现次数最多的f(x)、,作为参照函数,记作f(x)、、;蒙特卡洛算法模块根据t0、t-1、t+1,求得空值电能表f(x)、、的历史积分,记作△γ;蒙特卡洛算法模块利用定积分的逆运算,把t+1带入b中;把t-1带入a中;把f(x)、、带入f(x)中,计算空值电能表示数的算术中值,记作U0 、,计算U0 、、U-1、U+1三者的平均值作为蒙特卡洛输出值,记作SMC;
EM算法是最大期望算法,结合本发明,即EM算法模块先计算S1中每组数据的平均值,将最大的平均值作为EM算法输出值,记作SEM;
步骤38:计算和SMC的SEM平均值,记作S、,将S、填入U0,作为空值电能表的电能表示数。
步骤4:请参阅表2(用户分类表),基于表2对用户电力信息进行分类;
所述用户电力信息分类过程如下:
步骤41:提取用户电力信息中的电能表标识和相线电压;相线电压包括线电压和相电压;
步骤42:为每一个用户电力信息,建立“线电压和相电压”关于“电能表标识”的映射,记作m;
步骤43:根据相电压和线电压,筛出映射并标记m;
找出m中只有线电压的映射,表示普通用户,标记作m1;
找出m中有线电压和1号相电压的映射,表示农副企业Ⅰ,标记作m21;
找出m中有线电压和2号相电压的映射,表示畜牧企业Ⅱ,标记作m22;
找出m中有线电压和3号相电压的映射,表示渔鲜企业Ⅲ,标记作m23;
找出m中有1号相电压和2号相电压的映射,表示木材工业Ⅰ,标记作m24;
找出m中有1号相电压和3号相电压的映射,表示器件制造工业Ⅱ,标记作m25;
找出m中有2号相电压和3号相电压的映射,表示食品工业Ⅲ,标记作m26;
找出m中有线电压和1号相电压、2号相电压的映射,表示通讯企业Ⅰ,标记作m31;
找出m中有线电压和1号相电压、3号相电压的映射,表示服务企业Ⅱ,标记作m32;
找出m中有线电压和2号相电压/3号相电压的映射,表示金融企业Ⅲ,标记作m33;
找出m中1号相电压、2号相电压、3号相电压的映射,标记作m3,表示大型工业;
需要说明的是,相电压和线电压为国家既定标准,但不同地区的“相电压和线电压组合”所代表的用户类型不同;本发明所展示的根据相线电压对用户进行分类的标准(用户分类表)不代表最终结果,具体的用户分类标准由地方政府和供电局共同决定;
步骤44:根据步骤43映射的标记,对用户电力信息进行分类;
需要说明的是,步骤44不同用户类型的分类方法相同;此处以“普通家庭”为例,说明用户分类过程:
步骤441:提取所有标记为m1的映射;
步骤442:根据映射得到电能表标识;
步骤443:根据电能表标识,在BD中获得数据时间和电能表示数;
步骤444:根据电能表标识,在数据库中读取用户身份;
步骤445:请参阅表4,根据电能表标识、数据时间、电能表示数、用户身份建立“普通家庭”用户表;
需要说明的是,表4中的数据仅为样例数据展示,无现实参考意义;
步骤5:基于步骤4对用户电力信息的分类,请参阅表3(收费标准),进行用户应缴电费计算,计算完成后,得到电费数值,进入步骤6,所述用户应缴电费计算过程如下:
需要说明的是,所述小型企业包括:农副企业Ⅰ、畜牧企业Ⅱ、渔鲜企业Ⅲ;
所述小型工业包括:木材工业Ⅰ、器件制造工业Ⅱ、食品工业Ⅲ;
所述大型企业包括:通讯企业Ⅰ、服务企业Ⅱ、金融企业Ⅲ;
其中普通用户,小型企业,小型工业按月缴费,大型企业和大型工业有按月缴费和按年缴费两种方式;
普通用户,小型企业,小型工业按月缴费的计算流程相同,下面以“普通用户”为例进行说明,普通用户一个月的用电量记作V,累计用电量记作Va;
第一阶段是每月每个用户的使用电量不超过210度,总累计电量不超过2520度;在这个阶段,电费按照规定的价格收费;
第二阶段是每月每个用户的使用电量在210和400度之间,总电量不累计超过4800度;在这个阶段,在现行电价基础上,每度加价0.05元;
第三阶段是每月每个用户的使用电量在400度以上,累计电量在4800以上。在这个阶段,在现行电价基础上,每度加价0.3元;
Ⅰ、用户的使用电量不超过210度;总累计电量不超过2520度,电费按“0.7度/元”的价格收费,应缴电费为07*V;若总累计电量超过2520度不超过4800度,累计超过2520度的部分按“0.75度/元”收费;剩余部分按“0.7度/元”收费,应缴电费为:0.75*(Va-2520)+0.7*(V-Va+2520);若总累计电量超过4800度,累计超过4800度的部分按“1.05度/元”收费,剩余部分按“0.7度/元”收费,应缴电费为:1.05*(Va-4800)+0.7*(V-Va+4800);
需要说明的是,V表示用户一个月的用电量,Va表示用户累计用电量;
Ⅱ、用户的使用电量在210和400度之间;总电量不累计超过2520度,超过210度的电费按“0.75度/元”的价格收费,剩下的收147元(210*0.7=147),应缴电费为:0.75*(V-210)+147;若总累计电量超过2520度不超过4800度,累计超过2520度的部分按“0.75度/元”收费,剩余部分按“总电量不累计超过2520度”的标准收费,应缴电费为:0.75*(Va-2520)+0.75*(V-Va+2310)+147;若总累计电量超过4800度,累计超过4800度的部分按“1.05度/元”收费,剩余部分按“总累计电量超过2520度不超过4800度”的标准收费,应缴电费为:1.05*(Va-4800)+0.75*(V-Va+4590)+147;
Ⅲ、用户的使用电量在400度以上;总电量不累计超过2520度,超过400度的电费按“1.05度/元”的价格收费,剩下的收289.5元【((210*0.7)+0.75*(400-210))=289.5】,应缴电费为:1.05*(V-400)+289.5;若总累计电量超过2520度不超过4800度,累计超过2520度的部分按“0.75度/元”收费,剩余部分按“总电量不累计超过2520度”的标准收费;若应缴电费为:0.75*(Va-2520)+,1.05*(V-Va+2120)+289.5;若总累计电量超过4800度,累计超过4800度的部分按“1.05度/元”收费,剩余部分按“总累计电量超过2520度不超过4800度”的标准收费,应缴电费为:1.05*(Va-4800)+1.05*(V-Va+4400)+289.5;
大型企业和大型工业,按年缴纳电费,没有阶段标准和累计用电量要求,大型企业应缴电费为:1.32*V;大型工业应缴电费为:1.22*V;
需要说明的是,本发明所展示的收费标准类表不代表最终结果,具体的收费标准由地方政府和供电局共同决定;
步骤6:把步骤5生成的电费账单保存在数据库中,基于步骤2中的备份数据BD和步骤4的用户分类结果,进行用户用电趋势预测;
需要说明的是,所述用户用电趋势预测,不同类型的用户的预测方式相同,此处以“普通用户”为例,说明用户用电趋势预测过程:
步骤61:基于步骤4的用户分类结果,利用M-H抽样算法(详细见步骤33)抽取电能表标识标记作m1的一组用户电力信息,记作F;
步骤62:读取F中最近一次数据时间Tf;
步骤63:根据Tf,读取F中的电能表标识,记作Nf;读取F中Tf对应的电能表示数,记作Uf;
步骤64:读取Tf中的月份信息,记作mf,根据mf和Nf,在数据库中读取近3年与Tf月份相同的3组电能表示数,记作Uf 、;
步骤65:基于表3,读取Uf中处于第一阶段、第二阶段、第三阶段所有数的次数,分别记作A1、A2、A3;读取范围:每月的1号~28号;
步骤66:分别计算3组电能表示数处于第一阶段的概率,记作P(A1),P(A1)=A1/28;处于第二阶段的概率,记作P(A2),P(A2)=A2/28;处于第三阶段的概率,记作P(A3),P(A3)=A3/28;
需要说明的是,步骤64收集次数和步骤65计算出现概率,将每个月天数设置为28,目的是避免闰年的干扰;
步骤67:计算3组电能表在第一阶段、第二阶段、第三阶段的概率的平均值,记作P(A1)、、P(A2)、、P(A3)、;
步骤68:根据Tf中的月份信息和Nf,读取数据库中月份相差为+1和-1的6组数据,记作Uf 、、;
步骤69:根据Uf 、、利用步骤64~步骤66的方法;计算月份相差为-1的3组电能表示数在第一阶段、第二阶段、第三阶段的概率的平均值,记作P(B1)、、、P(B2)、、、P(B3)、、;计算月份相差为+1的3组电能表示数在第一阶段、第二阶段、第三阶段的概率的平均值,记作P(B1|A1)、、、P(B2|A2)、、、P(B3|A3)、、;
步骤610:利用贝叶斯公式,分别求出Nf的历史在第一阶段、第二阶段、第三阶段的稳定概率,记作P(A1|B1)、P(A2|B2)、P(A3|B3);
步骤611:根据P(A1|B1)、P(A2|B2)、P(A3|B3)生成状态转移矩阵;
步骤612:请参阅图3,根据mf、Nf和状态转移矩阵,把Nf中mf月所有的电能表示数,带入MCMC算法迭代模块,进行数据迭代。
需要说明的是,MCMC算法,是利用历史数据得到稳态数据,再对目标进行数据迭代的数学估测算法,在本发明中MCMC算法用于预测用户后续电压变化;
步骤613:查看MCMC算法迭代模块的输出结果,记作Uf 、;
若(Uf 、-Uf)<0,说明用户本月用电量可能减少;
若0<(Uf 、-Uf),说明用户本月用电量可能增加;
若0<(Uf 、-Uf),且(Uf 、-Uf)<210,说明用户本月用电量将进入第一阶段;
若0<(Uf 、-Uf),且210<(Uf 、-Uf)<400,说明用户本月用电量将进入第二阶段;
若0<(Uf 、-Uf),且400<(Uf 、-Uf),说明用户本月用电量将进入第三阶段。
表1数据样例特征表
表2用户分类表
线电压 | 1号相电压 | 2号相电压 | 3号相电压 | 供电类型 | 用户类型 |
220V | 单相电 | 普通家庭 | |||
220V | 380V | 二相电 | 农副企业Ⅰ | ||
220V | 380V | 二相电 | 畜牧企业Ⅱ | ||
220V | 380V | 二相电 | 渔鲜企业Ⅲ | ||
380V | 380V | 二相电 | 木材工业Ⅰ | ||
380V | 380V | 二相电 | 器件制造工业Ⅱ | ||
380V | 380V | 二相电 | 食品工业Ⅲ | ||
220V | 380V | 380V | 三相电 | 通讯企业Ⅰ | |
220V | 380V | 380V | 三相电 | 服务企业Ⅱ | |
220V | 380V | 380V | 三相电 | 金融企业Ⅲ | |
380V | 380V | 380V | 三相电 | 大型工业 |
表3收费标准
表4“普通家庭”用户表
上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数由本领域的技术人员根据实际情况进行设置,如存在权重系数和比例系数,其设置的大小是为了将各个参数进行量化得到的一个具体的数值,便于后续比较,关于权重系数和比例系数的大小,只要不影响参数与量化后数值的比例关系即可。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (8)
1.一种基于MCMC算法的电力采集终端数据预处理方法,其特征在于,包括如下步骤;
步骤S1:对电能表标识、数据日期、相线电压、电能示数进行获取,得到用户电力信息;
步骤S2:对用户电力信息进行备份,得到备份数据;
步骤S3:检查备份数据中的电能示数是否存在空值;若存在空值,则标记出现空值的电能表标识,并对空值电能示数进行数据恢复处理;
若不存在空值,则对备份数据进行信息分类处理,进入步骤S4;
步骤S4:对用户电力信息进行分类,得到用户分类结果;
步骤S5:基于用户分类结果,计算电费,得到电费数值;
步骤S6:基于备份数据和用户分类结果,预测用户用电量变化趋势。
2.根据权利要求1所述的一种基于MCMC算法的电力采集终端数据预处理方法,其特征在于,所述步骤S3中,对数据恢复处理的步骤具体如下:
步骤S31:将空值电能表的数据日期,定义为空值数据日期,记作t0;将空值电能表的电能表示数,定义为待补充参数,记作U0;
步骤S32:将空值电能表的前一天数据日期,定义为前数据日期,记作t-1;将空值电能表的前一天电能表示数,定义为前参数,记作Ut-1;将空值电能表的后一天数据日期,定义为后数据日期,记作t+1;将空值电能表的后一天电能表示数,定义为后参数,记作Ut+1;
步骤S32:读取数据库中空值电能表的近3年历史数据信息,包括电能表标识、历史数据日期、历史电能表示数,作为基础数据,记作S0;
步骤S33:利用M-H抽样算法从S0中抽取近3年内的6组数据,作为样本数据,记作S1;
步骤S34:利用曲线生成函数为S1中的每一组数据建立二维坐标系,并生成曲线;
步骤S35:利用极限求值函数,计算每组生成曲线上相邻两点的极限值;若相邻两点的极限值相等,说明数据连续性高;若相邻两点的极限值不相等,说明数据连续性低;
步骤S36:利用朴素贝叶斯分类器对S1进行数据分类,并为S1分配数据处理标签;
步骤S37:根据t-1和Ut-1、t+1和Ut+1和样本数据标签,将样本数据分别输入蒙特卡洛算法模块和EM算法模块中,查看输出结果;蒙特卡洛算法输出值,记作SMC;EM算法输出值,记作SEM;
步骤S38:计算SMC和SEM的平均值,记作S、,将S、填入U0,作为空值电能表的电能表示数。
3.根据权利要求1所述的一种基于MCMC算法的电力采集终端数据预处理方法,其特征在于,所述步骤S4中,对用户信息分类步骤如下:
步骤S41:提取用户电力信息中的电能表标识和相线电压;相线电压包括线电压和相电压;
步骤S42:为每一个用户电力信息,建立“线电压和相电压”关于“电能表标识”的映射,记作m;
步骤S43:根据相电压和线电压,筛出映射并标记m;
步骤S44:根据m上的标记,对用户电力信息进行分类;得到用户分类结果。
4.根据权利要求1所述的一种基于MCMC算法的电力采集终端数据预处理方法,其特征在于,所述步骤S5中,基于用户分类结果得到用户类型,计算电费;
用户类型包括:普通用户、小型企业、小型工业、大型企业、大型工业;
不同类型的用户电费计算方式不同,具体表现为:
“普通用户、小型企业、小型工业”设置有阶段标准和累计用电量要求,电费按月计算;
“大型企业、大型工业”没有设置阶段标准和累计用电量要求,电费按年计算。
5.根据权利要求4所述的一种基于MCMC算法的电力采集终端数据预处理方法,其特征在于,“普通用户、小型企业、小型工业”电费计算如下:
第一、第二、第三阶段分别设置有“用电范围峰值”和“阶段峰值”;
若用户当月的用电量不超过‘第一“用电范围峰值”’,则按“第一阶段价格”收费;
超过‘第一“用电范围峰值”’,累计用电量不超过‘第一“阶段峰值”’,超过‘第一“用电范围峰值”’的部分按“第二阶段价格”收费;剩余部分按“第一阶段价格”收费;
第二、第三阶段收费标准与上述第一阶段收费标准相同;
“大型企业、大型工业”电费计算如下:
大型企业和大型工业,电费每年按“规定的电费标准”收费。
6.根据权利要求4所述的一种基于MCMC算法的电力采集终端数据预处理方法,其特征在于,所述小型企业包括:农副企业Ⅰ、畜牧企业Ⅱ、渔鲜企业Ⅲ;
所述小型工业包括:木材工业Ⅰ、器件制造工业Ⅱ、食品工业Ⅲ;
所述大型企业包括:通讯企业Ⅰ、服务企业Ⅱ、金融企业Ⅲ。
7.根据权利要求1所述的一种基于MCMC算法的电力采集终端数据预处理方法,其特征在于,所述步骤S6中,预测用户用电量变化趋势的步骤如下:
步骤S61:基于步骤S4的用户分类结果,利用M-H抽样算法随机抽取一组用户电力信息,记作F;
步骤S62:读取F中的电能表标识,记作Nf;读取F中最近一次数据时间Tf;读取F中Tf对应的电能表示数,记作Uf;
步骤S62:根据Tf和Nf,读取数据库中Nf近3年的历史电能表示数,记作Uf 、;
步骤S63:读取Uf 、中处于第一阶段、第二阶段、第三阶段的次数,分别记作A1、A2、A3;
步骤S64:计算Uf 、处于第一阶段、第二阶段、第三阶段的概率,记作P(A1)、、P(A2)、、P(A3)、;
步骤S65:根据Tf和Nf,读取数据库中,月份相差为+1和-1的6组数据,记作Uf 、、;
步骤S66:利用步骤S63~步骤S65的方法;计算Uf 、、中月份相差为-1的3组电能表示数在第一阶段、第二阶段、第三阶段的概率,记作P(B1)、、、P(B2)、、、P(B3)、、;
步骤S67:计算Uf 、、中月份相差为+1的3组“电能表示数”处于第一阶段、第二阶段、第三阶段的概率,记作P(B1|A1)、、、P(B2|A2)、、、P(B3|A3)、、;
步骤S68:利用贝叶斯公式,分别求出Nf的历史在第一阶段、第二阶段、第三阶段的稳定概率,记作P(A1|B1)、P(A2|B2)、P(A3|B3);
步骤S69:根据P(A1|B1)、P(A2|B2)、P(A3|B3)生成状态转移矩阵;
步骤S610:读取Tf中的月份信息,记作mf;
步骤S611:根据mf、Nf和状态转移矩阵,把Nf中mf月所有的电能表示数带入MCMC算法迭代模块得到输出结果,记作Uf 、;
步骤S612:对Uf 、进行分析;预测用户用电趋势。
8.根据权利要求7所述的一种基于MCMC算法的电力采集终端数据预处理方法,其特征在于,所述步骤S612中,对Uf 、的分析过程如下:
(Uf 、-Uf)<0,说明用户本月用电量增加;
(Uf 、-Uf)>0,说明用户本月用电量增加;
在(Uf 、-Uf)>0的前提下,若(Uf 、-Uf)<210,说明用户本月用电量将进入第一阶段;
若210<(Uf 、-Uf)<400,说明用户本月用电量将进入第二阶段;
若(Uf 、-Uf)>400,说明用户本月用电量将进入第三阶段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311152328.0A CN116894156B (zh) | 2023-09-08 | 2023-09-08 | 基于mcmc算法的电力采集终端数据预处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311152328.0A CN116894156B (zh) | 2023-09-08 | 2023-09-08 | 基于mcmc算法的电力采集终端数据预处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116894156A true CN116894156A (zh) | 2023-10-17 |
CN116894156B CN116894156B (zh) | 2023-12-26 |
Family
ID=88311044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311152328.0A Active CN116894156B (zh) | 2023-09-08 | 2023-09-08 | 基于mcmc算法的电力采集终端数据预处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116894156B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117970009A (zh) * | 2024-03-28 | 2024-05-03 | 北京煜邦电力技术股份有限公司 | 填谷电路的电力采集终端及电能表 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN204166328U (zh) * | 2014-10-28 | 2015-02-18 | 天津大学 | 办公用能的预测和报警控制系统 |
CN104483843A (zh) * | 2014-10-28 | 2015-04-01 | 天津大学 | 办公用能的预测方法 |
CN105891574A (zh) * | 2016-04-11 | 2016-08-24 | 国网山东省电力公司济宁供电公司 | 一种应用于电力用户端的阶梯电价计费系统及其方法 |
CN107368543A (zh) * | 2017-06-28 | 2017-11-21 | 国网辽宁省电力有限公司 | 一种基于mcmc算法的电力采集数据修复方法 |
CN110442941A (zh) * | 2019-07-25 | 2019-11-12 | 桂林电子科技大学 | 一种基于改进粒子滤波与过程噪声多特征融合算法的电池状态跟踪与rul预测方法 |
KR102268012B1 (ko) * | 2020-09-15 | 2021-06-23 | 주식회사 그리드위즈 | 전력 계산 장치 및 전력 계산 방법 |
CN114970939A (zh) * | 2022-03-14 | 2022-08-30 | 长沙理工大学 | 一种工业企业用电需求短期智能预测方法 |
CN115809942A (zh) * | 2023-02-06 | 2023-03-17 | 四川智源能诚售电有限公司 | 用电量数据预测方法、装置及存储介质 |
-
2023
- 2023-09-08 CN CN202311152328.0A patent/CN116894156B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN204166328U (zh) * | 2014-10-28 | 2015-02-18 | 天津大学 | 办公用能的预测和报警控制系统 |
CN104483843A (zh) * | 2014-10-28 | 2015-04-01 | 天津大学 | 办公用能的预测方法 |
CN105891574A (zh) * | 2016-04-11 | 2016-08-24 | 国网山东省电力公司济宁供电公司 | 一种应用于电力用户端的阶梯电价计费系统及其方法 |
CN107368543A (zh) * | 2017-06-28 | 2017-11-21 | 国网辽宁省电力有限公司 | 一种基于mcmc算法的电力采集数据修复方法 |
CN110442941A (zh) * | 2019-07-25 | 2019-11-12 | 桂林电子科技大学 | 一种基于改进粒子滤波与过程噪声多特征融合算法的电池状态跟踪与rul预测方法 |
KR102268012B1 (ko) * | 2020-09-15 | 2021-06-23 | 주식회사 그리드위즈 | 전력 계산 장치 및 전력 계산 방법 |
CN114970939A (zh) * | 2022-03-14 | 2022-08-30 | 长沙理工大学 | 一种工业企业用电需求短期智能预测方法 |
CN115809942A (zh) * | 2023-02-06 | 2023-03-17 | 四川智源能诚售电有限公司 | 用电量数据预测方法、装置及存储介质 |
Non-Patent Citations (4)
Title |
---|
FELIPE L.C. DA SILVA等: "A bottom-up bayesian extension for long term electricity consumption forecasting", 《ENERGY》 * |
冯照飞: "基于蒙特卡罗仿真的家庭居民用电负荷研究", 中国优秀硕士论文电子期刊网 * |
刘大贵等: "马尔科夫修正的组合模型在新疆风电中长期可用电量预测中的应用", 电网技术, no. 09 * |
李卫国等: "基于MCMC模拟的相关系数平稳序列模型及其应用", 系统仿真学报, no. 14 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117970009A (zh) * | 2024-03-28 | 2024-05-03 | 北京煜邦电力技术股份有限公司 | 填谷电路的电力采集终端及电能表 |
CN117970009B (zh) * | 2024-03-28 | 2024-05-28 | 北京煜邦电力技术股份有限公司 | 填谷电路的电力采集终端及电能表 |
Also Published As
Publication number | Publication date |
---|---|
CN116894156B (zh) | 2023-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110659273B (zh) | 分布式大数据采集平台的数据异常监控及修复方法 | |
CN116894156B (zh) | 基于mcmc算法的电力采集终端数据预处理方法 | |
CN111612326A (zh) | 一种配变供电可靠性的综合评估方法 | |
CN111369286B (zh) | 一种电力现货市场中机组上抬费用的计算方法及装置 | |
CN108362958A (zh) | 一种采集故障点自动诊断和修补方法 | |
CN113837444A (zh) | 一种虚拟电厂参与多重市场的交易出清优化方法 | |
CN112650785A (zh) | 一种计量异常数据识别方法和系统 | |
CN115293257A (zh) | 一种针对异常用电用户的检测方法及系统 | |
CN106600146A (zh) | 一种电费回收风险评价方法和装置 | |
CN112508260B (zh) | 基于对比学习的配电变压器中长期负荷预测方法及装置 | |
CN111127186A (zh) | 一种基于大数据技术的客户信用等级评价体系的使用方法 | |
CN114676931B (zh) | 一种基于数据中台技术的电量预测系统 | |
CN112611997B (zh) | 一种台区关口表挂接关系在线校验方法和系统 | |
CN113806899B (zh) | 一种配电网拓扑关系的识别方法、装置及移动终端 | |
Bassi et al. | Deliverables 1-2-3a: Model-Free Voltage Calculations and Operating Envelopes | |
CN111915451B (zh) | 台区日功率曲线计算方法 | |
CN105203838B (zh) | 一种电量采集系统 | |
Mabuggwe et al. | Design and development of an intelligent tool for retail electric provider plan selection | |
CN114024302B (zh) | 用于评价台区的方法及装置 | |
Masdzarif et al. | An efficient method for estimating energy losses in distribution's feeder | |
CN116596640B (zh) | 电力零售电费套餐的推荐方法、系统、设备及存储介质 | |
CN115207947B (zh) | 电网节点储能配置方法、装置、计算机设备和存储介质 | |
CN112598414B (zh) | 一种电力营销计费方法及电力营销计费引擎 | |
CN116797073A (zh) | 一种基于全寿命经营周期评分的充电桩迁改决策方法 | |
CN116976696A (zh) | 用于模拟工商业光储系统运行情况的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |