CN112686473A - 一种基于分类算法的用电量预测方法及预测系统 - Google Patents
一种基于分类算法的用电量预测方法及预测系统 Download PDFInfo
- Publication number
- CN112686473A CN112686473A CN202110090391.0A CN202110090391A CN112686473A CN 112686473 A CN112686473 A CN 112686473A CN 202110090391 A CN202110090391 A CN 202110090391A CN 112686473 A CN112686473 A CN 112686473A
- Authority
- CN
- China
- Prior art keywords
- data
- client
- enterprise
- classification
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000007635 classification algorithm Methods 0.000 title claims abstract description 15
- 230000005611 electricity Effects 0.000 claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000007781 pre-processing Methods 0.000 claims abstract description 32
- 238000012216 screening Methods 0.000 claims abstract description 6
- 230000029305 taxis Effects 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000008030 elimination Effects 0.000 claims description 6
- 238000003379 elimination reaction Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 6
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000005612 types of electricity Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于分类算法的用电量预测方法及系统,其方法包括以下步骤:1.采集第二客户端的企业用户的用电历史数据与第一客户端的企业税务数据;2.对采集的数据进行预处理;3.对预处理的用电历史数据进行分类;4.通过加密样本筛选出第一客户端与第二客户端的共同用户;5.将共同用户的分类数据与相对应的企业税务数据进行加密模型训练以得到每一类分类的电量预测模型;6.采集最新用电数据与企业税务数据,输入至相对应的预测模型进行预测。本发明在一定程度上解决了传统电量预测模型学习精度与预测准度下降的问题,预测效率高,预测精度高,实用性强,具有较好的适应性及可靠性。
Description
技术领域
本发明属于电力信息预测技术领域,尤其涉及一种基于分类算法的用电量预测方法及预测系统。
背景技术
电力大数据产生在电力生产和使用过程中,电力大数据本身蕴藏着巨大的商业价值和社会价值,挖掘电力大数据价值面临巨大机遇。如何从电力大数据中获得准确的客户用电量预测是电力公司一直关心的问题,准确的电量预测是指导电力部门安排运行计划和保障售电公司盈利能力的关键基础。电力公司可以通过分析客户用电数据,制定科学合理的决策,满足各类用户群体的需求,实现高效快捷的运营体系,提升营销服务质量。
目前常用电量预测方法包括灰色预测法、电量产出效益法、电力弹性系数法和回归分析法等。传统的用电量预测方法无法通过多方数据集联合建模,存在电量预测准确率低的现象,难以取得理想的效果,同时也不能充分满足电力大数据的隐私性与安全性需求。
虽然一些训练用电预测模型可以保护数据隐私,但是由于电力客户实行不同的营销策略和提供差异化服务,使得电力数据呈现出分布密度不均匀、数据彼此之间差异过大的特点,这很大程度影响了机器学习算法的性能,进而导致模型精度损失。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供一种基于分类算法的用电量预测方法,对这些数据差异大的电力数据在数据不可见的前提下先进行分类,再对各分类的数据和其他行业的数据进行加密模型训练,这样会提高本地电力数据训练梯度,进而优化加密模型训练的模型精度,使加密模型预测的准度与效率大大提升。
对于不同的行业,需要缴纳的税目不同,对应的税率也有所区别,由此可以根据企业税务情况判断企业的性质。由于企业的性质与用电量存在密切的关联,在训练模型时考虑企业性质的因素能大大提高企业用电量预测模型的准确率。企业各项税务反映了一段时间内企业的运营状况,是预测企业用电量的重要依据,因此本发明使用了企业税务信息来作为电量预测的一种依据。
本发明采用如下的技术方案:
一种基于分类算法的用电量预测方法,其特征在于,所述电量预测模型的实现方法包括以下步骤:
步骤1:采集第二客户端企业用户的用电历史数据以及时间上相对应的第一客户端的税务历史数据;
步骤2:对步骤1所采集的用电数据进行数据预处理,所述预处理步骤包括数据无效值的剔除以及缺失值的填补,再将数据进行集成;
步骤3:对步骤2预处理过的用电数据进行数据分类,并输出p类分类结果;
步骤4:通过加密样本对齐以筛选第一客户端与第二客户端的共同用户;
步骤5:采用步骤4所得共同用户中第二客户端的每一类分类数据以及共同用户中第一客户端里相对应的企业税务数据进行加密模型训练,得到每一类分类的电量预测模型;
步骤6:采集最新的电力用户用电数据以及与之时间上相对应的企业税务数据,经步骤2-3的数据处理后,将每类分类数据中除季度用电量的其他数据输入至步骤5所得的相对应的模型中进行电量预测。
步骤1中,第一客户端上储存企业用户的税务数据,第二客户端上储存企业用户的用电数据;两客户端通过加密算法,实现与中央服务器的数据交互与模型训练。
步骤1中,所采集到的用电历史数据包括用电企业代码、电压等级、有功功率、无功功率、最大负荷、最大负荷利用小时、平均日负荷和季度用电量;
所采集到的企业税务数据包括企业代码、增值税、增值税税率、企业所得税、企业营业税税率、企业营业税。
步骤2中,对于缺失值填补,将初始数据集中的属性分为数值型和非数值型来分别处理;如果缺失值是数值型,则将该缺失值填补为其所在类别中数据的平均值;如果缺失值为非数值型,则将该缺失值填补为其所在类别中数据出现频率最高的值。
步骤3中的数据分类方法包括以下步骤:
步骤301:随机选取P个数据样本作为初始分类中心点;
步骤302:分别计算其余数据样本到各个分类中心的欧式距离:
并根据其余数据与各分类中心的欧式距离,赋予每个分类中心距离其最近的数据;其中ni代表第i个类的样本个数;xij代表第i个类中的第j个样本;mi代表第i个类的分类中心;
步骤303:重新计算每个分类中所有数据的平均值,作为新的分类中心:
其中ni代表分类中数据的个数;
步骤304:对步骤303的计算结果与前一次的P个分类中心进行比较,如果分类中心发生了变化,则返回步骤302,如果没有发生变化,则停止分类过程。
步骤301中P值个数根据样本系数进行选择,选择最大样本系数s(i)所对应的P值:
其中,i表示每个分类中的每个样本点,a(i)表示样本点i到同一分类其他样本点的平均距离,b(i)表示样本点i到其他分类中所有样本点平均距离的最小值。
步骤4通过加密样本对齐以筛选第一客户端与第二客户端的用电企业共有用户,包括以下步骤:
步骤401:第二客户端通过RSA算法生成公有密钥和私有密钥,并将公钥发送给第一客户端;
步骤402:第一客户端将本地用电企业ID信息进行一次哈希运算与公钥加密,加密过程中产生随机噪声,并将加密的用电企业ID发送给第二客户端;
步骤403:第二客户端在接收到加密后的用电企业ID信息后,使用解密算法对其解密,但由于含有随机噪声和第一客户端的哈希函数,第二客户端无法得知第一用户端用电企业的ID;第二客户端根据解密结果对本地企业ID加入新的哈希函数,并将对第一客户端用电企业ID解密的结果与本地企业ID的加密结果发送回第一客户端;
步骤404:第一客户端针对第二客户端发来的结果中包含的本地用电企业ID信息进行消噪处理,然后对其再进行一次哈希,此时第一客户端和第二客户端的企业ID信息加密函数具有相同的形式,通过求交得到两客户端共同的用电企业ID信息。
步骤5中得到对于每一分类的预测模型的步骤包括:
步骤501:中央服务器将公钥分发给第一客户端和第二客户端,用以对训练过程中需要交换的数据进行加密;
步骤502:第一客户端和第二客户端之间以加密形式交互用于计算模型梯度的中间结果,模型梯度的计算公式,即针对每一分类的目标函数为:
其中,ΘA表示第一客户端的本地模型参数,ΘB表示第二客户端的本地模型参数,表示第一客户端通过步骤2所得到的每一分类相对应的企业税务数据,表示第二客户端通过步骤3所得到的每一分类结果,yi表示第二客户端的季度用电量即标签数据,λ表示正则化参数;
步骤503:第一客户端和第二客户端分别基于加密的梯度值进行计算,同时第二客户端根据标签数据计算损失,并把损失结果汇总给中央服务器,所述损失的损失函数为:
步骤504:中央服务器通过步骤503汇总的损失结果计算总梯度并将其解密;
步骤505:中央服务器将解密后的梯度分别发给第一客户端和第二客户端,各个本地客户端根据所接收到的梯度更新本地模型参数;
步骤506:反复执行所述步骤501-505,迭代次数达到预设次数之后输出模型。
本发明还公开了一种基于分类算法的用电量预测系统,包括数据采集模块、数据预处理模块、数据分类模块、加密样本对齐模块、加密模型训练模块以及用电量预测模块,其特征在于:
数据采集模块采集企业用户的用电历史数据以及时间上相对应的税务历史数据;所述用电历史数据包括用电企业代码、电压等级、有功功率、无功功率、最大负荷、最大负荷利用小时、平均日负荷和季度用电量;所述企业税务数据包括企业代码、增值税、增值税税率、企业所得税、企业营业税税率、企业营业税;
数据预处理模块对所采集的用电数据进行数据预处理,所述预处理步骤包括数据无效值的剔除以及缺失值的填补,再将数据进行集成;
数据分类模块将企业用户的用电数据进行数据分类,输出p类分类结果;
加密样本对齐模块通过加密样本对齐以筛选企业用电用户以及税务用户的共同用户;
加密模型训练模块将所得共同用户中企业用户的每一类用电分类数据以及共同用户中相对应的企业税务数据进行加密模型训练,得到每一类分类的电量预测模型;
用电量预测模块经数据采集模块实时采集企业用户的用电信息以及税务信息,数据预处理模块、数据分类模块以及加密样本对齐模块处理后,将所得信息输入所述加密模型训练模块生成的相对应的电量预测模型中,实现企业用电量预测。
数据采集模块调用数据预处理模块,数据预处理模块调用数据分类模块,数据分类模块调用加密样本对齐模块,加密样本对齐模块调用加密模型训练模块;
用电量预测模块调用所述数据采集模块、数据预处理模块、数据分类模块、加密样本对齐模块并使用加密模型训练模块的结果以实现用电量预测。
本发明的有益效果在于,与现有技术相比,本发明充分利用了分类技术和加密模型的优势,成功提出了一种应用于电力预测的分类加密模型的实现方法,为后续在保护数据隐私的前提下实现电量精准预测提供了技术支撑。电力数据分布密度不均匀、数据量庞杂,如何从复杂的电力数据中实现对客户用电量的精准预测是本发明的一大特色;本发明在一定程度上解决了传统电量预测模型学习精度与预测准度下降的问题,预测效率高,预测精度高,实用性强,具有较好的适应性及可靠性。
附图说明
图1为本发明一种基于分类算法的用电量预测方法的流程图;
图2为本发明一种基于分类算法的用电量预测系统结构图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
本专利基于分类算法,训练加密模型模型,然后将训练好的模型应用于电力预测,实现对大规模客户用电量的高准确率定位和预测。图1是本发明技术方案的整体流程图。一种基于分类算法的用电量预测方法包括下列步骤:
步骤1:采集第二客户端企业用户的用电历史数据以及时间上相对应的企业税务数据;首先收集江苏省电力公司近五年的企业用电数据。所采集到的用电历史数据包括用电企业代码、电压等级、有功功率、无功功率、最大负荷、最大负荷利用小时、平均日负荷和季度用电量;企业税务数据来自江苏某地方税务局,包括企业代码、增值税、增值税税率、企业所得税、企业营业税税率、企业营业税。第一客户端上储存企业用户的税务数据,第二客户端上储存企业用户的用电数据;两客户端通过加密算法,实现与中央服务器的数据交互与模型训练。
步骤2:对步骤1所采集的用电数据进行数据预处理,所述预处理步骤包括数据无效值的剔除以及缺失值的填补,再将数据进行集成;对于缺失值填补,将初始数据集中的属性分为数值型和非数值型来分别处理;如果缺失值是数值型,则将该缺失值填补为其所在类别中数据的平均值;如果缺失值为非数值型,则将该缺失值填补为其所在类别中数据出现频率最高的值。
步骤3:对步骤2预处理过的数据进行数据分类,并输出p类分类结果;数据分类方法包括以下步骤:
步骤301:随机选取P个数据样本作为初始分类中心点;
步骤302:分别计算其余数据样本到各个分类中心的欧式距离:
并根据其余数据与各分类中心的欧式距离,赋予每个分类中心距离其最近的数据;其中ni代表第i个类的样本个数;xij代表第i个类中的第j个样本;mi代表第i个类的分类中心;
步骤303:重新计算每个分类中所有数据的平均值,作为新的分类中心:
其中ni代表分类中数据的个数;
步骤304:对步骤303的计算结果与前一次的p个分类中心进行比较,如果分类中心发生了变化,则返回步骤302,如果没有发生变化,则停止分类过程。
步骤301中P值个数根据样本系数进行选择,选择最大样本系数s(i)所对应的n值:
其中,i表示每个分类中的每个样本点,a(i)表示样本点i到同一分类其他样本点的平均距离,b(i)表示样本点i到其他分类中所有样本点平均距离的最小值。
步骤4通过加密样本对齐以筛选第一客户端与第二客户端的用电企业共有用户,包括以下步骤:
步骤401:第二客户端通过RSA算法生成公有密钥和私有密钥,并将公钥发送给第一客户端;
步骤402:第一客户端将本地用电企业ID信息进行一次哈希运算与公钥加密,加密过程中产生随机噪声,并将加密的用电企业ID发送给第二客户端;
步骤403:第二客户端在接收到加密后的用电企业ID信息后,使用解密算法对其解密,但由于含有随机噪声和第一客户端的哈希函数,第二客户端无法得知第一用户端用电企业的ID;第二客户端根据解密结果对本地企业ID加入新的哈希函数,并将对第一客户端用电企业ID解密的结果与本地企业ID的加密结果发送回第一客户端;
步骤404:第一客户端针对第二客户端发来的结果中包含的本地用电企业ID信息进行消噪处理,然后对其再进行一次哈希,此时第一客户端和第二客户端的企业ID信息加密函数具有相同的形式,通过求交得到两客户端共同的用电企业ID信息
所述步骤5中通过加密模型训练得到对于每一分类的预测模型的步骤包括:
步骤501:中央服务器将公钥分发给第一客户端和第二客户端,用以对训练过程中需要交换的数据进行加密;
步骤502:第一客户端和第二客户端之间以加密形式交互用于计算模型梯度的中间结果,模型梯度的计算公式,即针对每一分类的目标函数为:
其中,ΘA表示第一客户端的本地模型参数,ΘB表示第二客户端的本地模型参数,表示第一客户端通过步骤2所得到的每一分类相对应的企业税务数据,表示第二客户端通过步骤3所得到的每一分类结果,yi表示第二客户端的季度用电量即标签数据,λ表示正则化参数;
步骤503:第一客户端和第二客户端分别基于加密的梯度值进行计算,同时第二客户端根据标签数据计算损失,并把损失结果汇总给中央服务器,所述损失的损失函数为:
步骤504:中央服务器通过步骤503汇总的损失结果计算总梯度并将其解密。
步骤505:中央服务器将解密后的梯度分别发给第一客户端和第二客户端,各个本地客户端根据所接收到的梯度更新本地模型参数。
步骤506:反复执行所述步骤501-505,迭代次数达到预设次数之后输出模型。
步骤6:采集最新的电力用户用电数据以及与之时间上相对应的企业税务数据,经步骤2-3的数据处理步骤后,输入至步骤5所得的模型中进行电量预测。
本发明还公开了一个如图2所示的一种基于分类算法的用电量预测系统,包括数据采集模块、数据预处理模块、数据分类模块、加密样本对齐模块、加密模型训练模块以及用电量预测模块。
数据采集模块采集企业用户的用电历史数据以及时间上相对应的税务历史数据;用电历史数据包括用电企业代码、电压等级、有功功率、无功功率、最大负荷、最大负荷利用小时、平均日负荷和季度用电量;企业税务数据包括企业代码、增值税、增值税税率、企业所得税、企业营业税税率、企业营业税;
数据预处理模块对所采集的用电数据进行数据预处理,预处理步骤包括数据无效值的剔除以及缺失值的填补,再将数据进行集成;
数据分类模块将企业用户的用电数据进行数据分类,输出P类分类结果;
加密样本对齐模块通过加密样本对齐以筛选企业用电用户以及税务用户的共同用户;
加密模型训练模块将所得共同用户中企业用户的每一类用电分类数据以及共同用户中相对应的企业税务数据进行加密模型训练,得到每一类分类的电量预测模型;
用电量预测模块经数据采集模块实时采集企业用户的用电信息以及税务信息,数据预处理模块、数据分类模块以及加密样本对齐模块处理后,将所得信息输入所述加密模型训练模块生成的相对应的电量预测模型中,实现企业用电量预测。
数据采集模块调用数据预处理模块,数据预处理模块调用数据分类模块,数据分类模块调用加密样本对齐模块,加密样本对齐模块调用加密模型训练模块;
用电量预测模块调用所述数据采集模块、数据预处理模块、数据分类模块、加密样本对齐模块并使用加密模型训练模块的结果以实现用电量预测。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (10)
1.一种基于分类算法的用电量预测方法,其特征在于,所述电量预测模型的实现方法包括以下步骤:
步骤1:采集第二客户端企业用户的用电历史数据以及时间上相对应的第一客户端的税务历史数据;
步骤2:对步骤1所采集的用电数据进行数据预处理,所述预处理步骤包括数据无效值的剔除以及缺失值的填补,再将数据进行集成;
步骤3:对步骤2预处理过的用电数据进行数据分类,并输出p类分类结果;
步骤4:通过加密样本对齐以筛选第一客户端与第二客户端的共同用户;
步骤5:采用步骤4所得共同用户中第二客户端的每一类分类数据以及共同用户中第一客户端里相对应的企业税务数据进行加密模型训练,得到每一类分类的电量预测模型;
步骤6:采集最新的电力用户用电数据以及与之时间上相对应的企业税务数据,经步骤2-3的数据处理后,将每类分类数据中除季度用电量的其他数据输入至步骤5所得的相对应的模型中进行电量预测。
2.根据权利要求1所述的用电量预测方法,其特征在于:
所述步骤1中,所述第一客户端上储存企业用户的税务数据,所述第二客户端上储存企业用户的用电数据;两客户端通过加密算法,实现与中央服务器的数据交互与模型训练。
3.根据权利要求1所述的用电量预测方法,其特征在于:
所述步骤1中,所采集到的用电历史数据包括用电企业代码、电压等级、有功功率、无功功率、最大负荷、最大负荷利用小时、平均日负荷和季度用电量;
所采集到的企业税务数据包括企业代码、增值税、增值税税率、企业所得税、企业营业税税率、企业营业税。
4.根据权利要求1或3所述的用电量预测方法,其特征在于:
所述步骤2中,对于缺失值填补,将初始数据集中的属性分为数值型和非数值型来分别处理;如果缺失值是数值型,则将该缺失值填补为其所在类别中数据的平均值;如果缺失值为非数值型,则将该缺失值填补为其所在类别中数据出现频率最高的值。
5.根据权利要求1所述的用电量预测方法,其特征在于:
所述步骤3中的数据分类方法包括以下步骤:
步骤301:随机选取P个数据样本作为初始分类中心点;
步骤302:分别计算其余数据样本到各个分类中心的欧式距离:
并根据其余数据与各分类中心的欧式距离,赋予每个分类中心距离其最近的数据;其中ni代表第i个类的样本个数;xij代表第i个类中的第j个样本;mi代表第i个类的分类中心;
步骤303:重新计算每个分类中所有数据的平均值,作为新的分类中心:
其中ni代表分类中数据的个数;
步骤304:对步骤303的计算结果与前一次的P个分类中心进行比较,如果分类中心发生了变化,则返回步骤302,如果没有发生变化,则停止分类过程。
7.根据权利要求1或3所述的用电量预测方法,其特征在于:
所述步骤4通过加密样本对齐以筛选第一客户端与第二客户端的用电企业共有用户,包括以下步骤:
步骤401:第二客户端通过RSA算法生成公有密钥和私有密钥,并将公钥发送给第一客户端;
步骤402:第一客户端将本地用电企业ID信息进行一次哈希运算与公钥加密,加密过程中产生随机噪声,并将加密的用电企业ID发送给第二客户端;
步骤403:第二客户端在接收到加密后的用电企业ID信息后,使用解密算法对其解密,但由于含有随机噪声和第一客户端的哈希函数,第二客户端无法得知第一用户端用电企业的ID;第二客户端根据解密结果对本地企业ID加入新的哈希函数,并将对第一客户端用电企业ID解密的结果与本地企业ID的加密结果发送回第一客户端;
步骤404:第一客户端针对第二客户端发来的结果中包含的本地用电企业ID信息进行消噪处理,然后对其再进行一次哈希,此时第一客户端和第二客户端的企业ID信息加密函数具有相同的形式,通过求交得到两客户端共同的用电企业ID信息。
8.根据权利要求7所述的用电量预测方法,其特征在于:
所述步骤5中得到对于每一分类的预测模型的步骤包括:
步骤501:中央服务器将公钥分发给第一客户端和第二客户端,用以对训练过程中需要交换的数据进行加密;
步骤502:第一客户端和第二客户端之间以加密形式交互用于计算模型梯度的中间结果,模型梯度的计算公式,即针对每一分类的目标函数为:
其中,ΘA表示第一客户端的本地模型参数,ΘB表示第二客户端的本地模型参数,表示第一客户端通过步骤2所得到的每一分类相对应的企业税务数据,表示第二客户端通过步骤3所得到的每一分类结果,yi表示第二客户端的季度用电量即标签数据,λ表示正则化参数;
步骤503:第一客户端和第二客户端分别基于加密的梯度值进行计算,同时第二客户端根据标签数据计算损失,并把损失结果汇总给中央服务器,所述损失的损失函数为:
步骤504:中央服务器通过步骤503汇总的损失结果计算总梯度并将其解密;
步骤505:中央服务器将解密后的梯度分别发给第一客户端和第二客户端,各个本地客户端根据所接收到的梯度更新本地模型参数;
步骤506:反复执行所述步骤501-505,迭代次数达到预设次数之后输出模型。
9.一种利用权利要求1-8任一一项权利要求所述的基于分类算法的用电量预测系统,包括数据采集模块、数据预处理模块、数据分类模块、加密样本对齐模块、加密模型训练模块以及用电量预测模块,其特征在于:
所述数据采集模块采集企业用户的用电历史数据以及时间上相对应的税务历史数据;所述用电历史数据包括用电企业代码、电压等级、有功功率、无功功率、最大负荷、最大负荷利用小时、平均日负荷和季度用电量;所述企业税务数据包括企业代码、增值税、增值税税率、企业所得税、企业营业税税率、企业营业税;
所述数据预处理模块对所采集的用电数据进行数据预处理,所述预处理步骤包括数据无效值的剔除以及缺失值的填补,再将数据进行集成;
所述数据分类模块将企业用户的用电数据进行数据分类,输出P类分类结果;
所述加密样本对齐模块通过加密样本对齐以筛选企业用电用户以及税务用户的共同用户;
所述加密模型训练模块将所得共同用户中企业用户的每一类用电分类数据以及共同用户中相对应的企业税务数据进行加密模型训练,得到每一类分类的电量预测模型;
所述用电量预测模块经数据采集模块实时采集企业用户的用电信息以及税务信息,数据预处理模块、数据分类模块以及加密样本对齐模块处理后,将所得信息输入所述加密模型训练模块生成的相对应的电量预测模型中,实现企业用电量预测。
10.根据权利要求9所述的一种基于分类算法的用电量预测系统,其特征在于:
所述数据采集模块调用数据预处理模块,数据预处理模块调用数据分类模块,数据分类模块调用加密样本对齐模块,加密样本对齐模块调用加密模型训练模块;
所述用电量预测模块调用所述数据采集模块、数据预处理模块、数据分类模块、加密样本对齐模块并使用加密模型训练模块的结果以实现用电量预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110090391.0A CN112686473B (zh) | 2021-01-22 | 2021-01-22 | 一种基于分类算法的用电量预测方法及预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110090391.0A CN112686473B (zh) | 2021-01-22 | 2021-01-22 | 一种基于分类算法的用电量预测方法及预测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112686473A true CN112686473A (zh) | 2021-04-20 |
CN112686473B CN112686473B (zh) | 2023-12-08 |
Family
ID=75458966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110090391.0A Active CN112686473B (zh) | 2021-01-22 | 2021-01-22 | 一种基于分类算法的用电量预测方法及预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112686473B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298422A (zh) * | 2021-06-16 | 2021-08-24 | 福建亿力优能电力科技有限公司 | 一种基于用电数据的污染源企业违规生产监控方法 |
CN114039767A (zh) * | 2021-11-05 | 2022-02-11 | 美林数据技术股份有限公司 | 一种基于隐私计算的税电联合分析方法 |
CN116780536A (zh) * | 2023-08-23 | 2023-09-19 | 山东未来互联科技有限公司 | 基于机器学习的能耗预测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110782369A (zh) * | 2019-10-29 | 2020-02-11 | 青海格尔木鲁能新能源有限公司 | 确定多能互补新能源发电系统运营风险的方法及评估系统 |
CN111476438A (zh) * | 2020-05-18 | 2020-07-31 | 南方电网科学研究院有限责任公司 | 一种用户用电量预测方法、系统以及设备 |
US10797639B1 (en) * | 2011-07-25 | 2020-10-06 | Clean Power Research, L.L.C. | System and method for performing power utility remote consumer energy auditing with the aid of a digital computer |
WO2021004551A1 (zh) * | 2019-09-26 | 2021-01-14 | 深圳前海微众银行股份有限公司 | 纵向联邦学习系统优化方法、装置、设备及可读存储介质 |
-
2021
- 2021-01-22 CN CN202110090391.0A patent/CN112686473B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10797639B1 (en) * | 2011-07-25 | 2020-10-06 | Clean Power Research, L.L.C. | System and method for performing power utility remote consumer energy auditing with the aid of a digital computer |
WO2021004551A1 (zh) * | 2019-09-26 | 2021-01-14 | 深圳前海微众银行股份有限公司 | 纵向联邦学习系统优化方法、装置、设备及可读存储介质 |
CN110782369A (zh) * | 2019-10-29 | 2020-02-11 | 青海格尔木鲁能新能源有限公司 | 确定多能互补新能源发电系统运营风险的方法及评估系统 |
CN111476438A (zh) * | 2020-05-18 | 2020-07-31 | 南方电网科学研究院有限责任公司 | 一种用户用电量预测方法、系统以及设备 |
Non-Patent Citations (1)
Title |
---|
胡殿刚;李韶瑜;楼俏;王琼;程淼海;王国军;李国辉;: "ELM算法在用户用电行为分析中的应用", 计算机系统应用, no. 08 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298422A (zh) * | 2021-06-16 | 2021-08-24 | 福建亿力优能电力科技有限公司 | 一种基于用电数据的污染源企业违规生产监控方法 |
CN114039767A (zh) * | 2021-11-05 | 2022-02-11 | 美林数据技术股份有限公司 | 一种基于隐私计算的税电联合分析方法 |
CN116780536A (zh) * | 2023-08-23 | 2023-09-19 | 山东未来互联科技有限公司 | 基于机器学习的能耗预测方法及系统 |
CN116780536B (zh) * | 2023-08-23 | 2024-02-02 | 山东未来互联科技有限公司 | 基于机器学习的能耗预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112686473B (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Electricity consumer characteristics identification: A federated learning approach | |
CN112686473B (zh) | 一种基于分类算法的用电量预测方法及预测系统 | |
CN107220732B (zh) | 一种基于梯度提升树的停电投诉风险预测方法 | |
Bernard et al. | Products and productivity | |
CN112070125A (zh) | 一种基于孤立森林学习的不平衡数据集的预测方法 | |
CN102982077B (zh) | 用户数据处理方法及装置 | |
CN106649890A (zh) | 数据存储方法和装置 | |
Zhao et al. | Analysis of users’ electricity consumption behavior based on ensemble clustering | |
CN114078050A (zh) | 贷款逾期预测方法、装置、电子设备及计算机可读介质 | |
US8326723B2 (en) | Risk and reward assessment mechanism | |
CN112862585A (zh) | 基于LightGBM决策树算法的个贷类不良资产风险评级方法 | |
Zhang et al. | Precision marketing method of e-commerce platform based on clustering algorithm | |
Zheng et al. | Anomalous telecom customer behavior detection and clustering analysis based on ISP’s operating data | |
CN114331719A (zh) | 一种基于大数据的交易风控指标智能分析系统 | |
CN112950359A (zh) | 一种用户识别方法和装置 | |
CN107590747A (zh) | 基于综合能源大数据分析的电网资产周转率计算方法 | |
CN115330531B (zh) | 一种基于用电变动周期的企业风险预测方法 | |
CN110879893A (zh) | 基于区块链和云计算的物流供应链大数据处理系统 | |
CN116611911A (zh) | 基于支持向量机的信用风险预测方法及装置 | |
CN115687788A (zh) | 一种智能化商机推荐方法和系统 | |
CN114154682A (zh) | 一种客户贷款收益率等级预测方法及系统 | |
CN111951099A (zh) | 一种信用卡发卡模型及其运用方法 | |
Huang | Rural E-Commerce Investment and Financing Model Based on Blockchain and Data Mining | |
CN112819520A (zh) | 一种运营商客户生命周期计算方法及系统 | |
CN117408531B (zh) | 一种大数据智能匹配的客户信息管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |