CN107578277A - 用于电力营销的出租房客户定位方法 - Google Patents

用于电力营销的出租房客户定位方法 Download PDF

Info

Publication number
CN107578277A
CN107578277A CN201710736117.XA CN201710736117A CN107578277A CN 107578277 A CN107578277 A CN 107578277A CN 201710736117 A CN201710736117 A CN 201710736117A CN 107578277 A CN107578277 A CN 107578277A
Authority
CN
China
Prior art keywords
client
last year
model
ratio
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710736117.XA
Other languages
English (en)
Other versions
CN107578277B (zh
Inventor
王庆娟
张维
吕诗宁
欧阳柳
丁麒
徐家宁
俞佳莉
陈齐瑞
沈然
骆云江
叶珺歆
赵融融
张池
张一池
程清
吴越人
徐千
张梁
许海霄
李海峰
陈楚楚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Electric Power Co Ltd
Electric Power Research Institute of State Grid Zhejiang Electric Power Co Ltd
Shaoxing Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
State Grid Zhejiang Electric Power Co Ltd
Electric Power Research Institute of State Grid Zhejiang Electric Power Co Ltd
Shaoxing Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Electric Power Co Ltd, Electric Power Research Institute of State Grid Zhejiang Electric Power Co Ltd, Shaoxing Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Electric Power Co Ltd
Priority to CN201710736117.XA priority Critical patent/CN107578277B/zh
Publication of CN107578277A publication Critical patent/CN107578277A/zh
Application granted granted Critical
Publication of CN107578277B publication Critical patent/CN107578277B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

用于电力营销的出租房客户定位方法,涉及出租房客户定位方法。目前,精准定位出租房客户,并配合服务策略规范其用电行为,实现精准营销,刻不容缓。本发明包括以下步骤:1)指标初选;2)指标分析,包括连续变量分析和离散变量分析;3)指标确定;4)出租房客户预测模型构建;5)根据确定的出租房客户预测模型,进行出租房预测结果输出,定位出租房客户。本技术方案首先对出租房客户进行特征分析,从基础信息、交费行为、用电特征三大维度出发,提炼出多个影响出租房客户分析的指标作为预测指标集,通过C5.0决策树算法构建出租房用户预测模型,准确定位出租房用户,实现精准营销,规范出租房客户用电行为,提高电费回收效率、降低安全隐患。

Description

用于电力营销的出租房客户定位方法
技术领域
本发明涉及一种出租房客户定位方法,尤其涉及用于电力营销的出租房客户定位方法。
背景技术
据国家有关部门统计数据显示,我国现有出租房已超亿户。如何对庞大的出租房进行管理,一直是社会关注的热点与难点,而出租房客户用电安全隐患大、电费回收难等问题是长期困扰公司营销工作的痛点。近期,部分地区政府已实施“租售同权”,出租房客户数量将持续攀升,对社会治安、企业服务成本、房东个人征信等带来更大压力。因此,精准定位出租房客户,并配合服务策略规范其用电行为,实现精准营销,刻不容缓。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供用于电力营销的出租房客户定位方法,以达到准确判别出租房客户的目的。为此,本发明采取以下技术方案。
用于电力营销的出租房客户定位方法,包括以下步骤:
1)指标初选,根据出租房业务调研结果,获取建模所需目标数据群,并对获取的数据进行数据的预处理,初步选取建模指标;
从基础信息、交费行为、用电特征三个维度提炼出8个指标进行模型构建,分别为城乡类别、年用电量、过年期间电量占比、清明节假期电量占比、端午节假期电量占比、4-5月份谷电量占比、设定时间内不同收款部门数及近一年支付宝交费次数;其中城乡类别为:城镇、农村;过年期间电量占比为:过年期间用电量/全年用电量*100%;清明节假期电量占比为:清明假期用电量/4月用电量*100%;端午节假期用电量占比:端午假期用电量/5月用电量*100%;
2)指标分析,包括连续变量分析和离散变量分析;
201)连续变量分析:将出租户和普通用户的年用电量、过年期间电量占比、清明节假期电量占比、端午节假期电量占比、4-5月份谷电量占比这5个连续变量的均值进行分析,得到出租户与普通用户对应指标的差别程度;
202)离散变量分析:对出租户和普通用户的近一年不同收款部门数这一指标进行分析,其中,租户各收款部门变化次数客户数占比=各收款部门变化次数客户数/出租房总数*100%,普通用户各收款部门变化次数客户数占比=各收款部门变化次数客户数/普通用户总数*100%;得到出租户与普通用户对应指标的差别程度;
3)指标确定
根据指标分析结果对初选指标进行调整,选择出租户与普通用户差别程度大于设定值的对应指标为确定指标,确定最终建模指标;
4)出租房客户预测模型构建
401)根据确定的建模指标,随机筛选样本集中70%作为训练集,30%作为测试集构建出租房客户预测模型;
402)生成规则集,利用C5.0决策树算法,对训练集进行训练和学习生成出租房客户预测模型规则集并获得各指标对模型的影响程度及预测混淆矩阵;
403)根据训练集模型预测结果,将模型应用到测试集上进行模型测试,判断训练集和测试集的预测效果否达到了理想效果,若是,则确定该模型为出租房客户预测模型,否则,返回步骤1)重新调整数据和指标并进行模型的构建;
5)根据确定的出租房客户预测模型,进行出租房预测结果输出,定位出租房客户。
本项目基于电力公司营销业务系统、用电信息采集系统中的明细数据,结合95598工单,一体化缴费平台数据,首先对出租房客户进行特征分析,从基础信息、交费行为、用电特征三大维度出发,提炼出多个影响出租房客户分析的指标作为预测指标集,通过C5.0决策树算法构建出租房用户预测模型,准确定位出租房用户,实现精准营销,规范出租房客户用电行为,提高电费回收效率、降低安全隐患。
作为对上述技术方案的进一步完善和补充,本发明还包括以下附加技术特征。
进一步的,步骤401)中C5.0决策树算法通过最大信息增益率来选择属性进行节点拆分;第一次拆分确定的样本子集随后再次拆分,通常根据另一个字段进行拆分,这一过程重复进行直到样本子集不能再被拆分为止;最后,重新检验最低层次的拆分,那些对模型值没有显著贡献的样本子集被剔除或者修剪;信息增益率计算规则如下:
设T为数据集,类别集合为{C1,C2,…,Ck},选择一个属性V把T分为多个子集。
设V有互不重合的n个取值{v1,v2,…,vn},则T被分为n个子集T1,T2,…,Tn,这里Ti中的所有实例的取值均为vi
令:|T|为数据集的T例子数,|Ti|为v=vi的例子数,|Cj|=freq(Cj,T)为Cj的例子数,|Cjv|是V=vi例子中具有Cj类别的例子数。
则有:
(1)类别Cj的发生率:
P(Cj)=|Cj|/|T|=freq(Cj,T)/|T|
(2)属性V=vi的发生概率:
P(vi)=|Ti|/|T|
(3)属性V=vi的例子中,具有类别Cj的条件概率:
P(Cj|vi)=|Cjv|/|Ti|
(4)类别的信息熵
(5)类别的条件熵
按照属性V把集合T分割,分割后的类别条件熵为:
(6)信息增益,即互信息
I(C,V)=H(C)-H(C|V)=info(T)-infov(T)=gain(V)
(7)属性V的信息熵
(8)信息增益率
进一步的,在步骤401)中,生成的规则集包括:第一规则、第二规则、第三规则、第四规则;
第一规则:判断是否近一年总用电量>0.61万kw.h、近一年总用电量<=6.8万kw.h、近一年不同收款部门数>1、过年期间电量占比>0.1%、过年期间电量占比<=0.4%、城乡类别是城镇,若均是,则认为是出租房客户;
第二规则:判断是否近一年总用电量<=0.03万kw.h、过年期间电量占比<=0.1%、城乡类别=城镇,若均是,则认为是出租房客户;
第三规则:判断是否近一年总用电量>6.88万kw.h、近一年不同收款部门数>1、城乡类别=城镇,若均是,则认为是出租房客户;
第四规则:判断是否近一年总用电量>0.61万kw.h、近一年不同收款部门数>1、过年期间电量占比>0.8%、清明假期电量占比<=0.1%、城乡类别=城镇,若均是,则认为是出租房客户。
有益效果:本技术方案基于电力公司营销业务系统、用电信息采集系统中的明细数据,结合95598工单,一体化缴费平台数据,首先对出租房客户进行特征分析,从基础信息、交费行为、用电特征三大维度出发,提炼出多个影响出租房客户分析的指标作为预测指标集,通过C5.0决策树算法构建出租房用户预测模型,准确定位出租房用户,实现精准营销,规范出租房客户用电行为,提高电费回收效率、降低安全隐患。
附图说明
图1是本发明流程图。
图2是不同收款部门个数客户占比对比图。
图3是变量重要性结果图。
具体实施方式
以下结合说明书附图对本发明的技术方案做进一步的详细说明。如图1所示,本发明包括以下步骤:
1)指标初选
从基础信息、交费行为、用电特征三个维度提炼出8个指标进行模型构建,分别为城乡类别、年用电量、过年期间电量占比、清明节假期电量占比、端午节假期电量占比、4-5月份谷电量占比、设定时间内不同收款部门数及近一年支付宝交费次数;其中城乡类别为:城镇、农村;过年期间电量占比为:过年期间用电量/全年用电量*100%;清明节假期电量占比为:清明假期用电量/4月用电量*100%;端午节假期用电量占比:端午假期用电量/5月用电量*100%;
2)指标分析,包括连续变量分析和离散变量分析
201)连续变量分析:将出租户和普通用户的年用电量、过年期间电量占比、清明节假期电量占比、端午节假期电量占比、4-5月份谷电量占比这5个连续变量的均值进行分析,得到出租户与普通用户对应指标的差别程度;
202)离散变量分析:对出租户和普通用户的近一年不同收款部门数这一指标进行分析,其中,租户各收款部门变化次数客户数占比=各收款部门变化次数客户数/出租房总数*100%,普通用户各收款部门变化次数客户数占比=各收款部门变化次数客户数/普通用户总数*100%;得到出租户与普通用户对应指标的差别程度;
3)指标确定
根据指标分析结果,选择出租户与普通用户差别程度大的对应指标为确定指标;
4)出租房客户预测模型构建
401)根据确定指标,利用C5.0决策树算法,随机筛选样本集中70%作为训练集,30%作为测试集构建出租房客户预测模型,生成规则集,并获得指标对模型的影响程度;
402)根据样本集结果分析,判断训练集和测试集的预测正确率是否都达到了90%以上,若是,则确定该模型为出租房客户预测模型,否则,返回步骤401重新在规则集中选择新的模型。
5)根据确定的出租房客户预测模型,进行出租房预测结果输出,定位出租房客户。
具体实施方式如下:
1模型影响因素分析及变量确定
基于实地考察、业务专家访谈以及资料查询,结合电力公司现有用户用电数据信息情况[2],以浙江省绍兴袍江地区12000户用电客户为研究对象,包括2000户租户和10000户普通用户,分析出租户与普通用户的差异,其中,普通用户包括租户和非租户。结合实际情况,考虑到出租房客户可能在用电行为、交费方式等方面与非出租房客户会存在一定的差异性,如由于出租房客户的群租性,其用电量较非出租房客户可能会偏高;出租房客户在过年期间及节假日,用电量较平时用电量可能会出现偏少现象;出租房客户晚上用电量可能比白天用电量多,即谷电量占比可能会偏高。经过分析,最终从基础信息、交费行为、用电特征三个维度提炼出租房用户特征,模型影响变量如表1所示:
表1模型影响变量表
1.1指标解释
经过多次调整,最终从基础信息、交费行为、用电特征三个维度提炼出8个指标进行模型构建,分别为城乡类别、年用电量、过年期间电量占比、清明节假期电量占比、端午节假期电量占比、4-5月份谷电量占比、近一年不同收款部门数、近一年支付宝交费次数。
城乡类别:城镇、农村;
年用电量:2016年8月-2017年7月近一年的用电量(单位:万kw.h);
过年期间电量占比:过年期间用电量/全年用电量*100%;
清明节假期电量占比:清明假期用电量/4月用电量*100%;
端午节假期用电量占比:端午假期用电量/5月用电量*100%;
4-5月份谷电量占比:4-5月份谷电量/4-5月份用电总量*100%,考虑到天气影响因素,所以选择了4月份和5月份非空调使用季节进行谷电量分析;
近一年不同收款部门数:2016年8月-2017年7月近一年不同收款部门数,由于出租房客户的流动性,交费方式会具有多样性,所以收款单位较普通用户可能也会偏多;
近一年支付宝交费次数:2016年8月-2017年7月近一年支付宝交费次数。
1.2指标分析
连续变量分析
对于出租户和普通用户年用电量、过年期间电量占比、清明节假期电量占比、端午节假期电量占比、4-5月份谷电量占比这5个连续变量的均值进行分析。
表2租户与普通用户连续变量均值对比表
通过对以上指标进行分析发现,(1)出租户的近一年平均用电量较高,是普通用户的1.65倍;(2)出租房客户在过年期间、清明节、端午节假期用电量占比均远低于普通用户的用电占比;(3)租户与普通用户在4-5月份谷电用电量占相差不大,在建模的时候可能也并没有重要影响。
离散变量分析
对出租户和普通用户的近一年不同收款部门数这一指标进行分析,租户和普通用户不同收款部门个数客户数占比如下表:
表3租户与普通用户不同收款部门个数客户占比对比表
其中,租户各收款部门变化次数客户数占比=各收款部门变化次数客户数/出租房总数*100%,普通用户各收款部门变化次数客户数占比=各收款部门变化次数客户数/普通用户总数*100%。
通过对近一年不同收款部门数这一指标进行分析发现,67.47%的普通客户一年内收款部门没有发生,而租户收款部门一年内没有发生变化的比例为30.47%,租户和普通用户各收款部门种类客户数占比如图2所示。
2出租房客户预测模型构建
2.1模型技术原理说明
在有监督学习的二分类模型中,决策树模型可读性好,效率高,特别是在数据量不大的情况下,往往也能获得较高的准确度,且利用C5.0决策树算法、Logistic逻辑回归算法和神经网络算法分别对样本进行分类预测,通过对比发现利用Logistic逻辑回归算法和神经网络算法构建的出租房预测模型准确率和命中率均低于C5.0决策树模型的预测准确率和命中率,因此本项目采用C5.0决策树算法构建出租房客户预测模型。
C5.0决策树算法通过最大信息增益率来选择属性进行节点拆分。第一次拆分确定的样本子集随后再次拆分,通常根据另一个字段进行拆分,这一过程重复进行直到样本子集不能再被拆分为止。最后,重新检验最低层次的拆分,那些对模型值没有显著贡献的样本子集被剔除或者修剪。信息增益率计算规则如下:
设T为数据集,类别集合为{C1,C2,…,Ck},选择一个属性V把T分为多个子集。
设V有互不重合的n个取值{v1,v2,…,vn},则T被分为n个子集T1,T2,…,Tn,这里Ti中的所有实例的取值均为vi
令:|T|为数据集的T例子数,|Ti|为v=vi的例子数,|Cj|=freq(Cj,T)为Cj的例子数,|Cjv|是V=vi例子中具有Cj类别的例子数。
则有:
(1)类别Cj的发生率:
P(Cj)=|Cj|/|T|=freq(Cj,T)/|T| 式(1)
(2)属性V=vi的发生概率:
P(vi)=|Ti|/|T| 式(2)
(3)属性V=vi的例子中,具有类别Cj的条件概率:
P(Cj|vi)=|Cjv|/|Ti| 式(3)
(4)类别的信息熵
(5)类别的条件熵
按照属性V把集合T分割,分割后的类别条件熵为:
(6)信息增益,即互信息
I(C,V)=H(C)-H(C|V)=info(T)-infov(T)=gain(V)
式(6)
(7)属性V的信息熵
(8)信息增益率
最大信息增益率是属性选择及样本分区的准则,通过最大信息增益率来选择属性进行节点拆分,过程重复进行直到样本子集不能再被拆分为止。最后,重新检验最低层次的拆分,那些对模型值没有显著贡献的样本子集被剔除或者修剪。
2.2模型建立及验证
本次建模利用C5.0决策树算法,将绍兴袍江的12000户用户作为样本集,随机筛选样本集中70%作为训练集,30%作为测试集构建出租房客户预测模型。
2.2.1模型规则输出结果
2.2.2变量重要性输出结果
如图3所示,城乡类别、近一年不同收款部门数、过年期间电量占比、年总电量4个指标对模型影响较大,结合规则集可知,年总用电量较高、过年期间用电量占比较小且一年内收款部门变化较多的城镇用户为出租房客户的可能性较大。
2.2.3样本集结果分析
由样本集输出结果可知,对训练集和测试集的预测正确率都达到了90%以上,预测准确率已经比较理想。
训练集预测结果
表4训练集预测混淆矩阵表
其中,行值为实际值,列值为预测值,由混淆矩阵可以得出,训练集实际为出租房客户的数量为1007户,其中正确预测为出租房客户的户数为594户,错误预测为普通用户的户数为413户,训练集具体正确预测率、命中率和覆盖率如下表:
表5训练集预测准确率、命中率和覆盖率表
测试集预测结果
表6测试集预测混淆矩阵
其中,行值为实际值,列值为预测值,由混淆矩阵可以得出,测试集实际为出租房客户的数量为502户,其中正确预测为出租户的户数为274户,错误预测为出租户的户数为228户,测试集具体正确预测率、命中率和覆盖率如下表:
表7测试集预测准确率、命中率和覆盖率表
总结
研究表明,出租房客户预测模型的准确率达到了90%以上,预测效果较好,所选取的指标城乡类别、近一年不同收款部门数、过年期间电量占比以及年总用电量对出租房客户预测模型影响较大。下一步,计划对模型做进一步的优化工作,根据模型结果进一步完善变量指标及模型参数,保留城乡类别、近一年不同收款部门数、过年期间电量占比以及年总用电量4个变量,同时考虑增加用电量波动、过年期间是否有空窗期以及房屋类型(如回迁房、酒店式公寓、学区房等)等变量,以提高模型的准确率和命中率,在模型优化的基础上,适时扩大活动运营的范围,采用多种营销方式,提高应用成效。同时,结合出租户用户实际情况生成特征标签,利用衍生标签信息,为其他主题场景的精准营销活动做支撑。
以上图1所示的用于电力营销的出租房客户定位方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。

Claims (3)

1.用于电力营销的出租房客户定位方法,其特征在于包括以下步骤:
1)指标初选,根据出租房业务调研结果,获取建模所需目标数据群,并对获取的数据进行数据的预处理,初步选取建模指标;
从基础信息、交费行为、用电特征三个维度提炼出8个指标进行模型构建,分别为城乡类别、年用电量、过年期间电量占比、清明节假期电量占比、端午节假期电量占比、4-5月份谷电量占比、设定时间内不同收款部门数及近一年支付宝交费次数;其中城乡类别为:城镇、农村;过年期间电量占比为:过年期间用电量/全年用电量*100%;清明节假期电量占比为:清明假期用电量/4月用电量*100%;端午节假期用电量占比:端午假期用电量/5月用电量*100%;
2)指标分析,包括连续变量分析和离散变量分析;
201)连续变量分析:将出租户和普通用户的年用电量、过年期间电量占比、清明节假期电量占比、端午节假期电量占比、4-5月份谷电量占比这5个连续变量的均值进行分析,得到出租户与普通用户对应指标的差别程度;
202)离散变量分析:对出租户和普通用户的近一年不同收款部门数这一指标进行分析,其中,租户各收款部门变化次数客户数占比=各收款部门变化次数客户数/出租房总数*100%,普通用户各收款部门变化次数客户数占比=各收款部门变化次数客户数/普通用户总数*100%;得到出租户与普通用户对应指标的差别程度;
3)指标确定
根据指标分析结果对初选指标进行调整,选择出租户与普通用户差别程度大于设定值的对应指标为确定指标,确定最终建模指标;
4)出租房客户预测模型构建
401)根据确定的建模指标,随机筛选样本集中70%作为训练集,30%作为测试集构建出租房客户预测模型;
402)生成规则集,利用C5.0决策树算法,对训练集进行训练和学习生成出租房客户预测模型规则集并获得各指标对模型的影响程度及预测混淆矩阵;
403)根据训练集模型预测结果,将模型应用到测试集上进行模型测试,判断训练集和测试集的预测效果否达到了理想效果,若是,则确定该模型为出租房客户预测模型,否则,返回步骤1)重新调整数据和指标并进行模型的构建;
5)根据确定的出租房客户预测模型,进行出租房预测结果输出,定位出租房客户。
2.根据权利要求1所述的用于电力营销的出租房客户定位方法,其特征在于:步骤401)中C5.0决策树算法通过最大信息增益率来选择属性进行节点拆分;第一次拆分确定的样本子集随后再次拆分,通常根据另一个字段进行拆分,这一过程重复进行直到样本子集不能再被拆分为止;最后,重新检验最低层次的拆分,那些对模型值没有显著贡献的样本子集被剔除或者修剪。信息增益率计算规则如下:
设T为数据集,类别集合为{C1,C2,…,Ck},选择一个属性V把T分为多个子集。
设V有互不重合的n个取值{v1,v2,…,vn},则T被分为n个子集T1,T2,…,Tn,这里Ti中的所有实例的取值均为vi
令:|T|为数据集的T例子数,|Ti|为v=vi的例子数,|Cj|=freq(Cj,T)为Cj的例子数,|Cjv|是V=vi例子中具有Cj类别的例子数。
则有:
(1)类别Cj的发生率:
P(Cj)=|Cj|/|T|=freq(Cj,T)/|T|
(2)属性V=vi的发生概率:
P(vi)=|Ti|/|T|
(3)属性V=vi的例子中,具有类别Cj的条件概率:
P(Cj|vi)=|Cjv|/|Ti|
(4)类别的信息熵
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>H</mi> <mrow> <mo>(</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <msub> <mi>&amp;Sigma;</mi> <mi>j</mi> </msub> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>log</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <msub> <mi>C</mi> <mi>j</mi> </msub> <mo>)</mo> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <msub> <mi>&amp;Sigma;</mi> <mi>j</mi> </msub> <mfrac> <mrow> <mi>f</mi> <mi>r</mi> <mi>e</mi> <mi>q</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>T</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>|</mo> <mi>T</mi> <mo>|</mo> </mrow> </mfrac> <mo>&amp;times;</mo> <msub> <mi>log</mi> <mn>2</mn> </msub> <mo>{</mo> <mfrac> <mrow> <mi>f</mi> <mi>r</mi> <mi>e</mi> <mi>q</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>T</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>|</mo> <mi>T</mi> <mo>|</mo> </mrow> </mfrac> <mo>}</mo> <mo>=</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>inf</mi> <mi>o</mi> <mrow> <mo>(</mo> <mi>T</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced>
(5)类别的条件熵
按照属性V把集合T分割,分割后的类别条件熵为:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>H</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>|</mo> <mi>V</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <mi>&amp;Sigma;</mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mi>&amp;Sigma;</mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>log</mi> <mn>2</mn> </msub> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mi>j</mi> </msub> <mo>|</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <mfrac> <mrow> <mo>|</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>T</mi> <mo>|</mo> </mrow> </mfrac> <mo>&amp;times;</mo> <mi>inf</mi> <mi>o</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>inf</mi> <mi>o</mi> <mi>v</mi> <mrow> <mo>(</mo> <mi>T</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced>
(6)信息增益,即互信息
I(C,V)=H(C)-H(C|V)=info(T)-infov(T)=gain(V)
(7)属性V的信息熵
<mrow> <mi>H</mi> <mrow> <mo>(</mo> <mi>V</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <msub> <mi>&amp;Sigma;</mi> <mi>i</mi> </msub> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>log</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <mfrac> <mrow> <mo>|</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>T</mi> <mo>|</mo> </mrow> </mfrac> <mo>&amp;times;</mo> <msub> <mi>log</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>T</mi> <mo>|</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>=</mo> <mi>s</mi> <mi>p</mi> <mi>l</mi> <mi>i</mi> <mi>t</mi> <mo>_</mo> <mi>inf</mi> <mi>o</mi> <mrow> <mo>(</mo> <mi>V</mi> <mo>)</mo> </mrow> </mrow>
(8)信息增益率
<mrow> <msub> <mi>gain</mi> <mrow> <mi>r</mi> <mi>a</mi> <mi>t</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <mi>I</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>,</mo> <mi>V</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>H</mi> <mrow> <mo>(</mo> <mi>V</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>=</mo> <mi>g</mi> <mi> </mi> <mi>a</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <mi>V</mi> <mo>)</mo> </mrow> <mo>/</mo> <mi>s</mi> <mi>p</mi> <mi>l</mi> <mi>i</mi> <mi>t</mi> <mi> </mi> <mi>inf</mi> <mi>o</mi> <mrow> <mo>(</mo> <mi>V</mi> <mo>)</mo> </mrow> <mo>.</mo> </mrow>
3.根据权利要求2所述的用于电力营销的出租房客户定位方法,其特征在于:在步骤401)中,生成的规则集包括:第一规则、第二规则、第三规则、第四规则;
第一规则:判断是否近一年总用电量>0.61万kw.h、近一年总用电量<=6.8万kw.h、近一年不同收款部门数>1、过年期间电量占比>0.1%、过年期间电量占比<=0.4%、城乡类别是城镇,若均是,则认为是出租房客户;
第二规则:判断是否近一年总用电量<=0.03万kw.h、过年期间电量占比<=0.1%、城乡类别=城镇,若均是,则认为是出租房客户;
第三规则:判断是否近一年总用电量>6.88万kw.h、近一年不同收款部门数>1、城乡类别=城镇,若均是,则认为是出租房客户;
第四规则为:判断是否近一年总用电量>0.61万kw.h、近一年不同收款部门数>1、过年期间电量占比>0.8%、清明假期电量占比<=0.1%、城乡类别=城镇,若均是,则认为是出租房客户。
CN201710736117.XA 2017-08-24 2017-08-24 用于电力营销的出租房客户定位方法 Active CN107578277B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710736117.XA CN107578277B (zh) 2017-08-24 2017-08-24 用于电力营销的出租房客户定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710736117.XA CN107578277B (zh) 2017-08-24 2017-08-24 用于电力营销的出租房客户定位方法

Publications (2)

Publication Number Publication Date
CN107578277A true CN107578277A (zh) 2018-01-12
CN107578277B CN107578277B (zh) 2021-04-09

Family

ID=61034893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710736117.XA Active CN107578277B (zh) 2017-08-24 2017-08-24 用于电力营销的出租房客户定位方法

Country Status (1)

Country Link
CN (1) CN107578277B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830649A (zh) * 2018-06-05 2018-11-16 国网浙江省电力有限公司 用于电力营销的产权变更用电客户定位方法
CN109934615A (zh) * 2019-01-22 2019-06-25 中信银行股份有限公司 基于深度稀疏网络的产品营销方法
CN111126714A (zh) * 2019-12-31 2020-05-08 青梧桐有限责任公司 基于长租公寓租房场景下的退租预测系统及方法
CN111401431A (zh) * 2020-03-12 2020-07-10 成都小步创想慧联科技有限公司 群租房识别方法及系统及存储介质
CN112215494A (zh) * 2020-10-13 2021-01-12 广东电网有限责任公司 一种居民用电的房屋租赁识别方法及系统
CN112215420A (zh) * 2020-10-13 2021-01-12 广东电网有限责任公司 一种居民用电的客户过户识别方法及系统
CN113553499A (zh) * 2021-06-22 2021-10-26 杭州摸象大数据科技有限公司 一种基于营销裂变的作弊探测方法、系统和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160314481A1 (en) * 2015-04-22 2016-10-27 Electronics And Telecommunications Research Institute Method and apparatus for automated electricity demand response based on online trading of demand side resources
CN106651424A (zh) * 2016-09-28 2017-05-10 国网山东省电力公司电力科学研究院 基于大数据技术的电力用户画像建立与分析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160314481A1 (en) * 2015-04-22 2016-10-27 Electronics And Telecommunications Research Institute Method and apparatus for automated electricity demand response based on online trading of demand side resources
CN106651424A (zh) * 2016-09-28 2017-05-10 国网山东省电力公司电力科学研究院 基于大数据技术的电力用户画像建立与分析方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830649A (zh) * 2018-06-05 2018-11-16 国网浙江省电力有限公司 用于电力营销的产权变更用电客户定位方法
CN109934615A (zh) * 2019-01-22 2019-06-25 中信银行股份有限公司 基于深度稀疏网络的产品营销方法
CN109934615B (zh) * 2019-01-22 2021-07-13 中信银行股份有限公司 基于深度稀疏网络的产品营销方法
CN111126714A (zh) * 2019-12-31 2020-05-08 青梧桐有限责任公司 基于长租公寓租房场景下的退租预测系统及方法
CN111401431A (zh) * 2020-03-12 2020-07-10 成都小步创想慧联科技有限公司 群租房识别方法及系统及存储介质
CN112215494A (zh) * 2020-10-13 2021-01-12 广东电网有限责任公司 一种居民用电的房屋租赁识别方法及系统
CN112215420A (zh) * 2020-10-13 2021-01-12 广东电网有限责任公司 一种居民用电的客户过户识别方法及系统
CN112215420B (zh) * 2020-10-13 2023-05-16 广东电网有限责任公司 一种居民用电的客户过户识别方法及系统
CN113553499A (zh) * 2021-06-22 2021-10-26 杭州摸象大数据科技有限公司 一种基于营销裂变的作弊探测方法、系统和电子设备

Also Published As

Publication number Publication date
CN107578277B (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
CN107578277B (zh) 用于电力营销的出租房客户定位方法
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
Babel et al. A multivariate econometric approach for domestic water demand modeling: an application to Kathmandu, Nepal
Straka et al. Predicting popularity of electric vehicle charging infrastructure in urban context
Bourassa et al. Do housing submarkets really matter?
Nizar et al. Load profiling and data mining techniques in electricity deregulated market
Bhattacharjee et al. Spatial interactions in hedonic pricing models: the urban housing market of Aveiro, Portugal
US8255392B2 (en) Real time data collection system and method
CN107133652A (zh) 基于K‑means聚类算法的用电客户价值评估方法及系统
CN111144468A (zh) 电力用户信息标签化方法和装置、电子设备以及存储介质
CN101398919A (zh) 利用模式分析的电力需求信息分析系统及其方法
CN109359868A (zh) 一种电网用户画像的构建方法及系统
Chen et al. Forecasting housing prices under different market segmentation assumptions
CN108345908A (zh) 电网数据的分类方法、分类设备及存储介质
Brown et al. Getting real with energy data: Using the buildings performance database to support data-driven analyses and decision-making
CN114169933A (zh) 基于多维数据的门店智能选址推荐方法及系统
CN110807546A (zh) 社区网格人口变化预警方法及系统
CN116662860A (zh) 一种基于能源大数据的用户画像与分类方法
CN107977764A (zh) 索引文件的生成、配送员信息的查询方法、装置和服务器
CN115809280A (zh) 一种群租房识别及迭代识别方法
Toussaint Evaluation of clustering techniques for generating household energy consumption patterns in a developing country
CN113688870A (zh) 一种采用混合算法的基于用户用电行为的群租房识别方法
Neo et al. Spatial analysis of public residential housing's electricity consumption in relation to urban landscape and building characteristics: A case study in Singapore
Nepal et al. A Hybrid Model of Clustering and Neural Network Using Weather Conditions for Energy Management in Buildings
Mountain et al. What is the relationship between household wealth and rooftop solar in Australia?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: The eight district of Hangzhou city in Zhejiang province 310014 Huadian Zhaohui under No. 1 Lane

Patentee after: STATE GRID ZHEJIANG ELECTRIC POWER COMPANY LIMITED ELECTRIC POWER Research Institute

Patentee after: STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd.

Patentee after: STATE GRID ZHEJIANG ELECTRIC POWER CO., LTD. SHAOXING POWER SUPPLY Co.

Address before: The eight district of Hangzhou city in Zhejiang province 310014 Huadian Zhaohui under No. 1 Lane

Patentee before: ELECTRIC POWER RESEARCH INSTITUTE OF STATE GRID ZHEJIANG ELECTRIC POWER Co.

Patentee before: STATE GRID ZHEJIANG ELECTRIC POWER Co.

Patentee before: SHAOXING POWER SUPPLY COMPANY OF STATE GRID ZHEJIANG ELECTRIC POWER Co.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220608

Address after: 311100 Building 5, 138 Yunlian Road, Yuhang District, Hangzhou City, Zhejiang Province

Patentee after: Marketing service center of State Grid Zhejiang Electric Power Co.,Ltd.

Patentee after: STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd.

Patentee after: STATE GRID ZHEJIANG ELECTRIC POWER CO., LTD. SHAOXING POWER SUPPLY Co.

Address before: The eight district of Hangzhou city in Zhejiang province 310014 Huadian Zhaohui under No. 1 Lane

Patentee before: STATE GRID ZHEJIANG ELECTRIC POWER COMPANY LIMITED ELECTRIC POWER Research Institute

Patentee before: STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd.

Patentee before: STATE GRID ZHEJIANG ELECTRIC POWER CO., LTD. SHAOXING POWER SUPPLY Co.