CN111626614A - 一种基于电费回收的用户分类方法 - Google Patents
一种基于电费回收的用户分类方法 Download PDFInfo
- Publication number
- CN111626614A CN111626614A CN202010462048.XA CN202010462048A CN111626614A CN 111626614 A CN111626614 A CN 111626614A CN 202010462048 A CN202010462048 A CN 202010462048A CN 111626614 A CN111626614 A CN 111626614A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- payment
- clustering
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000011084 recovery Methods 0.000 title claims abstract description 16
- 239000013598 vector Substances 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000012216 screening Methods 0.000 claims abstract description 6
- 230000009467 reduction Effects 0.000 claims abstract description 5
- 230000005611 electricity Effects 0.000 claims description 13
- 238000004064 recycling Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 238000004891 communication Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于电费回收的用户分类方法,包括以下步骤:S1、从电力系统数据库中提取用户基础数据及缴费相关数据,形成用户分类原始数据,并对原始数据进行数据预处理;S2、采用数据降维方法从预处理后的原始数据中筛选用户缴费的特征指标,得到每个用户的缴费特征向量;S3、基于用户的缴费特征向量并采用聚类分析算法对用户进行聚类,实现用户群体的分类。本发明实现用户群体的分类,有助于供电企业对不同类别的用户群体实施开展针对性的缴费推广方式,以此有效提高居民缴费率。
Description
技术领域
本发明涉及电力用户特征识别,尤其涉及一种基于电费回收的用户分类方法。
背景技术
电费回收是电力营销管理的最终环节,也是供电企业经营效益体现的最关键一步。电费回收虽然过程复杂,涉及面广,但通过对电费各类指标的正确分析,供电企业仍能准确把握电费回收情况,明确电费风险。因此,对电费回收指标的展示和分析越来越引起供电企业的重视。
虽然随着智能电网建设的不断深入,实现了用电信息采集的“全覆盖、全采集、全费控”,电费回收防控逐渐从人工抄控向智能费控转变。但目前电力公司过多聚焦于电费回收率,缺乏针对客户的定性分析,在电费回收管理中,针对电费回收风向没有做到有效的分析管控,无法精准识别风险高的用户。
发明内容
本发明提出了一种基于电费回收的用户分类方法,基于电力系统数据分析用户用电特征,对用电市场中用户群体进行科学分类,有助于各地区找准自身用户的用电市场需求定位,把握用电市场未来发展方向,明确公司未来电力营销运营推广重点方向。
为了达到上述目的,本发明提出了一种基于电费回收的用户分类方法,包括以下步骤:
S1、从电力系统数据库中提取用户基础数据及缴费相关数据,形成用户分类原始数据,并对原始数据进行数据预处理;
S2、采用数据降维方法从预处理后的原始数据中筛选用户缴费的特征指标,得到每个用户的缴费特征向量;
S3、基于用户的缴费特征向量并采用聚类分析算法对用户进行聚类,实现用户群体的分类。
优选地,所述的用户基础数据包括用户类型、户名、用户行业、所属站点、时间信息。
优选地,所述的用户缴费行为数据包括缴费渠道、缴费金额、缴费周期、欠费次数、违约用电次数、用户实名制认证情况、电子账单开通情况。
优选地,所述的原始数据预处理包括以下步骤:
删除原始数据中的无关数据、重复数据、平滑噪声数据;
采用数据标准化处理将原始数据集中的各个数据变换到均值为0、方差为1的范围内。
优选地,所述的用户缴费的特征指标包括:线上缴费习惯、缴费行为习惯以及沟通便捷性,所述的线上缴费习惯包括线上缴费渠道开通情况、线上缴费渠道使用情况、电子账单开通情况;所述的缴费行为习惯包括违约用电次数、欠费次数、月平均电费、电费回收周期;所述的沟通便捷性包括用户实名制认证情况。
优选地,采用聚类分析算法对用户进行聚类,具体包括以下步骤:
a、任意选取k个用户作为初始中心,每个用户代表一个聚类中心;
b、分别计算每个用户与每个聚类中心的欧式距离,并按照距离最近原则将每个用户归类到距离它们最近的聚类中心所对应的类,形成k个簇;
其中,基于用户缴费特征向量计算每个用户与每个聚类中心的欧式距离;
c、将每个簇中所有用户所对应的均值作为该类别的聚类中心,计算目标函数的值;
d、判断聚类中心和目标函数的值是否发生改变,若改变,则重复步骤a-c,若不变,则输出聚类结果;
e、计算聚类结果的均方误差,选择均方误差较小的k值为最终的聚类值,最终得到k类用户群。
本发明具有以下优点:
本发明从用户缴费相关数据进行深入分析,筛选出用户缴费的特征指标,并通过聚类识别算法实现用户群体的分类,实现供电企业对不同类别的用户群体实施开展针对性的缴费推广方式,以此有效提升智能缴费渠道的推广成功率,提高居民线上缴费率。同时解决当前客户特征识别不全面,智能缴费推广针对性不强等问题,推动公司向主动创新型现代营销服务模式转变。
附图说明
图1为本发明实施例提供的一种基于电费回收的用户分类方法的流程示意图;
图2为本发明实施例提供的采用聚类分析算法得到的用户群体分类的示意图。
具体实施方式
以下结合附图和具体实施例对本发明提出的一种基于电费回收的用户分类方法作进一步详细说明。根据下面说明和权利要求书,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比率,仅用以方便、明晰地辅助说明本发明实施例的目的。
如图1所示,本发明提出了一种基于电费回收的用户分类方法,包括以下步骤:
S1、从电力系统数据库中提取用户基础数据及缴费相关数据,形成用户分类的原始数据,并对原始数据进行数据预处理;
具体地,从电力系统数据库中获取用户缴费行为数据,并从用户缴费行为数据中抽取用户的基础数据及用户缴费相关数据,所述的用户基础数据包括用户类型(低压居民、低压非居)、户名、用户行业、所属站点、年月等信息,所述的用户缴费相关数据包括缴费渠道(分为线上、线下)、缴费金额、缴费周期(收到电费通知后的缴费响应速度)、欠费次数、违约用电次数(了解用户电费风险特征)、用户实名制认证情况、电子账单开通情况(高质量用户特征)等;有效的整合用户基础数据及缴费相关数据,形成用户分类原始数据;
通过数据预处理方式,删除原始数据中的无关数据、重复数据、平滑噪声数据;由于原始数据中各个缴费相关的数据范围不同,容易对特征指标的筛选结果产生影响,因此采用数据标准化处理,将原始数据集中的各个数据变换到均值为0、方差为1的范围内;
S2、采用数据降维方法从预处理后的原始数据中筛选用户缴费的特征指标,得到每个用户的缴费特征向量;
采用python sklean库,decomposition.PCA函数进行原始数据维数压缩,尽可能低降低原始数据的维数(复杂度),从而最终筛选出用户缴费的特征指标,得到每个用户的缴费特征向量;
优选地,采用数据降维方法最终筛选出的用户缴费的特征指标包括:线上缴费习惯、缴费行为习惯以及沟通便捷性,所述的线上缴费习惯包括线上缴费渠道开通情况、线上缴费渠道使用情况、电子账单开通情况;所述的缴费行为习惯包括违约用电次数、欠费次数、月平均电费、电费回收周期;所述的沟通便捷性包括用户实名制认证情况。
S3、基于用户的缴费特征向量并采用聚类分析算法对用户进行聚类,实现用户群体的分类;
采用聚类分析算法对用户进行聚类,具体包括以下步骤:
a、任意选取k个用户作为初始中心,每个用户代表一个聚类中心;
其中,需设定k为不同的值进行循环计算;
b、分别计算每个用户与每个聚类中心的欧式距离,并按照距离最近原则将每个用户归类到距离它们最近的聚类中心所对应的类,形成k个簇;
其中,基于用户缴费特征向量计算每个用户与每个聚类中心的欧式距离;
c、将每个簇中所有用户所对应的均值作为该类别的聚类中心,计算目标函数的值;
d、判断聚类中心和目标函数的值是否发生改变,若改变,则重复步骤a-c,若不变,则输出聚类结果;
e、计算聚类结果的均方误差,确定聚类k值,最终得到k类用户群;
其中,选择均方误差较小的k值为最终的聚类值。
如图2所示,采用聚类分析算法将用户群体划分为四个聚类类别。同一个类别中的用户用户缴费特征集相似,不同类别之间的用户缴费特征集相异。通过分析各个聚类类别中的用户特征,可以针对性的对各个类别中的用户群体提供相应的智能缴费渠道推广策略,从而提升电费回收效率。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
Claims (5)
1.一种基于电费回收的用户分类方法,其特征在于,包括以下步骤:
S1、从电力系统数据库中提取用户基础数据及缴费相关数据,形成用户分类原始数据,并对原始数据进行数据预处理;
S2、采用数据降维方法从预处理后的原始数据中筛选用户缴费的特征指标,得到每个用户的缴费特征向量;
S3、基于用户的缴费特征向量并采用聚类分析算法对用户进行聚类,实现用户群体的分类。
2.如权利要求1所述的一种基于电费回收的用户分类方法,其特征在于,所述的用户基础数据包括用户类型、户名、用户行业、所属站点、时间信息。
3.如权利要求1所述的一种基于电费回收的用户分类方法,其特征在于,所述的用户缴费行为数据包括缴费渠道、缴费金额、缴费周期、欠费次数、违约用电次数、用户实名制认证情况、电子账单开通情况。
4.如权利要求1所述的一种基于电费回收的用户分类方法,其特征在于,所述的原始数据预处理包括以下步骤:
删除原始数据中的无关数据、重复数据、平滑噪声数据;
采用数据标准化处理将原始数据集中的各个数据变换到均值为0、方差为1的范围内。
5.如权利要求1所述的一种基于电费回收的用户分类方法,其特征在于,采用聚类分析算法对用户进行聚类,具体包括以下步骤:
a、任意选取k个用户作为初始中心,每个用户代表一个聚类中心;
b、分别计算每个用户与每个聚类中心的欧式距离,并按照距离最近原则将每个用户归类到距离它们最近的聚类中心所对应的类,形成k个簇;
其中,基于用户缴费特征向量计算每个用户与每个聚类中心的欧式距离;
c、将每个簇中所有用户所对应的均值作为该类别的聚类中心,计算目标函数的值;
d、判断聚类中心和目标函数的值是否发生改变,若改变,则重复步骤a-c,若不变,则输出聚类结果;
e、计算聚类结果的均方误差,选择均方误差较小的k值为最终的聚类值,最终得到k类用户群。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010462048.XA CN111626614A (zh) | 2020-05-27 | 2020-05-27 | 一种基于电费回收的用户分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010462048.XA CN111626614A (zh) | 2020-05-27 | 2020-05-27 | 一种基于电费回收的用户分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111626614A true CN111626614A (zh) | 2020-09-04 |
Family
ID=72271213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010462048.XA Pending CN111626614A (zh) | 2020-05-27 | 2020-05-27 | 一种基于电费回收的用户分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111626614A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112184481A (zh) * | 2020-09-22 | 2021-01-05 | 北京来也网络科技有限公司 | 结合rpa和ai的智能电网欠费处理方法和装置 |
CN112258067A (zh) * | 2020-10-30 | 2021-01-22 | 国网上海市电力公司 | 基于高斯混合模型聚类算法的低压用户缴费行为分类方法 |
CN112381295A (zh) * | 2020-11-13 | 2021-02-19 | 深圳供电局有限公司 | 一种基于用电行为偏好的居民用电提醒方法及系统 |
CN113449793A (zh) * | 2021-06-28 | 2021-09-28 | 国网北京市电力公司 | 用电状态的确定方法及装置 |
WO2024007094A1 (zh) * | 2022-07-04 | 2024-01-11 | 嘉兴尚坤科技有限公司 | 一种基于聚类算法和tsvm模型的用户生活缴费分析方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260815A (zh) * | 2015-09-18 | 2016-01-20 | 国网辽宁省电力有限公司鞍山供电公司 | 基于大数据的电力系统缴费渠道评价方法 |
CN106650763A (zh) * | 2016-07-05 | 2017-05-10 | 国网内蒙古东部电力有限公司电力科学研究院 | 一种电力缴费渠道分析的指标选择、权值优化与渠道规划的计算方法 |
CN107767293A (zh) * | 2017-09-20 | 2018-03-06 | 国网浙江省电力公司电力科学研究院 | 一种基于改进AP和K‑means聚类的电力大用户细分方法 |
WO2018059015A1 (zh) * | 2016-09-29 | 2018-04-05 | 深圳大学 | 一种基于交易数据的客户分类方法及其系统 |
CN111199493A (zh) * | 2018-11-19 | 2020-05-26 | 国家电网有限公司客户服务中心 | 一种基于客户缴费信息及征信信息的欠费风险识别方法 |
-
2020
- 2020-05-27 CN CN202010462048.XA patent/CN111626614A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260815A (zh) * | 2015-09-18 | 2016-01-20 | 国网辽宁省电力有限公司鞍山供电公司 | 基于大数据的电力系统缴费渠道评价方法 |
CN106650763A (zh) * | 2016-07-05 | 2017-05-10 | 国网内蒙古东部电力有限公司电力科学研究院 | 一种电力缴费渠道分析的指标选择、权值优化与渠道规划的计算方法 |
WO2018059015A1 (zh) * | 2016-09-29 | 2018-04-05 | 深圳大学 | 一种基于交易数据的客户分类方法及其系统 |
CN107767293A (zh) * | 2017-09-20 | 2018-03-06 | 国网浙江省电力公司电力科学研究院 | 一种基于改进AP和K‑means聚类的电力大用户细分方法 |
CN111199493A (zh) * | 2018-11-19 | 2020-05-26 | 国家电网有限公司客户服务中心 | 一种基于客户缴费信息及征信信息的欠费风险识别方法 |
Non-Patent Citations (1)
Title |
---|
刘晓?: "基于电力缴费行为细分的服务提升研究", 《中国科技信息》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112184481A (zh) * | 2020-09-22 | 2021-01-05 | 北京来也网络科技有限公司 | 结合rpa和ai的智能电网欠费处理方法和装置 |
CN112184481B (zh) * | 2020-09-22 | 2024-02-23 | 北京来也网络科技有限公司 | 结合rpa和ai的智能电网欠费处理方法和装置 |
CN112258067A (zh) * | 2020-10-30 | 2021-01-22 | 国网上海市电力公司 | 基于高斯混合模型聚类算法的低压用户缴费行为分类方法 |
CN112381295A (zh) * | 2020-11-13 | 2021-02-19 | 深圳供电局有限公司 | 一种基于用电行为偏好的居民用电提醒方法及系统 |
CN113449793A (zh) * | 2021-06-28 | 2021-09-28 | 国网北京市电力公司 | 用电状态的确定方法及装置 |
WO2024007094A1 (zh) * | 2022-07-04 | 2024-01-11 | 嘉兴尚坤科技有限公司 | 一种基于聚类算法和tsvm模型的用户生活缴费分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111626614A (zh) | 一种基于电费回收的用户分类方法 | |
CN110781332A (zh) | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 | |
CN111160401A (zh) | 一种基于均值漂移和XGBoost的异常用电判别方法 | |
CN110930198A (zh) | 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备 | |
CN110610121B (zh) | 基于曲线聚类的小时级源荷功率异常数据辨识与修复方法 | |
Gajowniczek et al. | Electricity peak demand classification with artificial neural networks | |
CN112184489A (zh) | 一种电力用户分群管理系统及方法 | |
CN112819299A (zh) | 一种基于中心优化的差分K-means负荷聚类方法 | |
CN114611738A (zh) | 一种基于用户用电行为分析的负荷预测方法 | |
CN108154311A (zh) | 基于随机森林和决策树的优质客户识别方法及装置 | |
CN115907822A (zh) | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 | |
Kojury-Naftchali et al. | Identifying susceptible consumers for demand response and energy efficiency policies by time-series analysis and supplementary approaches | |
CN112686491A (zh) | 一种基于用电行为的企业电力数据分析方法 | |
CN115130811A (zh) | 电力用户画像的建立方法、装置及电子设备 | |
CN114022205A (zh) | 基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统 | |
CN112258067A (zh) | 基于高斯混合模型聚类算法的低压用户缴费行为分类方法 | |
Chen et al. | A power line loss analysis method based on boost clustering | |
CN111324790A (zh) | 基于支持向量机分类的负荷类型识别方法 | |
CN111861587A (zh) | 一种基于隐马尔可夫模型和向前算法的居民用电行为分析的系统及方法 | |
CN114841832A (zh) | 一种基于用电负荷二次聚类的电力用户画像标签建立方法 | |
CN114048200A (zh) | 一种计及缺失数据补齐的用户用电行为分析方法 | |
CN113902485A (zh) | 一种专变电力用户行业识别方法、装置及设备 | |
CN112215420A (zh) | 一种居民用电的客户过户识别方法及系统 | |
Liu et al. | Inventory Management of Automobile After-sales Parts Based on Data Mining | |
Davarzani et al. | Study of missing meter data impact on domestic load profiles clustering and characterization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200904 |