CN111626614A - 一种基于电费回收的用户分类方法 - Google Patents

一种基于电费回收的用户分类方法 Download PDF

Info

Publication number
CN111626614A
CN111626614A CN202010462048.XA CN202010462048A CN111626614A CN 111626614 A CN111626614 A CN 111626614A CN 202010462048 A CN202010462048 A CN 202010462048A CN 111626614 A CN111626614 A CN 111626614A
Authority
CN
China
Prior art keywords
user
data
payment
clustering
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010462048.XA
Other languages
English (en)
Inventor
赵炜
蒋勇斌
曹晶晶
周丹
陈姣姣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Shanghai Electric Power Co Ltd
Original Assignee
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Shanghai Electric Power Co Ltd filed Critical State Grid Shanghai Electric Power Co Ltd
Priority to CN202010462048.XA priority Critical patent/CN111626614A/zh
Publication of CN111626614A publication Critical patent/CN111626614A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于电费回收的用户分类方法,包括以下步骤:S1、从电力系统数据库中提取用户基础数据及缴费相关数据,形成用户分类原始数据,并对原始数据进行数据预处理;S2、采用数据降维方法从预处理后的原始数据中筛选用户缴费的特征指标,得到每个用户的缴费特征向量;S3、基于用户的缴费特征向量并采用聚类分析算法对用户进行聚类,实现用户群体的分类。本发明实现用户群体的分类,有助于供电企业对不同类别的用户群体实施开展针对性的缴费推广方式,以此有效提高居民缴费率。

Description

一种基于电费回收的用户分类方法
技术领域
本发明涉及电力用户特征识别,尤其涉及一种基于电费回收的用户分类方法。
背景技术
电费回收是电力营销管理的最终环节,也是供电企业经营效益体现的最关键一步。电费回收虽然过程复杂,涉及面广,但通过对电费各类指标的正确分析,供电企业仍能准确把握电费回收情况,明确电费风险。因此,对电费回收指标的展示和分析越来越引起供电企业的重视。
虽然随着智能电网建设的不断深入,实现了用电信息采集的“全覆盖、全采集、全费控”,电费回收防控逐渐从人工抄控向智能费控转变。但目前电力公司过多聚焦于电费回收率,缺乏针对客户的定性分析,在电费回收管理中,针对电费回收风向没有做到有效的分析管控,无法精准识别风险高的用户。
发明内容
本发明提出了一种基于电费回收的用户分类方法,基于电力系统数据分析用户用电特征,对用电市场中用户群体进行科学分类,有助于各地区找准自身用户的用电市场需求定位,把握用电市场未来发展方向,明确公司未来电力营销运营推广重点方向。
为了达到上述目的,本发明提出了一种基于电费回收的用户分类方法,包括以下步骤:
S1、从电力系统数据库中提取用户基础数据及缴费相关数据,形成用户分类原始数据,并对原始数据进行数据预处理;
S2、采用数据降维方法从预处理后的原始数据中筛选用户缴费的特征指标,得到每个用户的缴费特征向量;
S3、基于用户的缴费特征向量并采用聚类分析算法对用户进行聚类,实现用户群体的分类。
优选地,所述的用户基础数据包括用户类型、户名、用户行业、所属站点、时间信息。
优选地,所述的用户缴费行为数据包括缴费渠道、缴费金额、缴费周期、欠费次数、违约用电次数、用户实名制认证情况、电子账单开通情况。
优选地,所述的原始数据预处理包括以下步骤:
删除原始数据中的无关数据、重复数据、平滑噪声数据;
采用数据标准化处理将原始数据集中的各个数据变换到均值为0、方差为1的范围内。
优选地,所述的用户缴费的特征指标包括:线上缴费习惯、缴费行为习惯以及沟通便捷性,所述的线上缴费习惯包括线上缴费渠道开通情况、线上缴费渠道使用情况、电子账单开通情况;所述的缴费行为习惯包括违约用电次数、欠费次数、月平均电费、电费回收周期;所述的沟通便捷性包括用户实名制认证情况。
优选地,采用聚类分析算法对用户进行聚类,具体包括以下步骤:
a、任意选取k个用户作为初始中心,每个用户代表一个聚类中心;
b、分别计算每个用户与每个聚类中心的欧式距离,并按照距离最近原则将每个用户归类到距离它们最近的聚类中心所对应的类,形成k个簇;
其中,基于用户缴费特征向量计算每个用户与每个聚类中心的欧式距离;
c、将每个簇中所有用户所对应的均值作为该类别的聚类中心,计算目标函数的值;
d、判断聚类中心和目标函数的值是否发生改变,若改变,则重复步骤a-c,若不变,则输出聚类结果;
e、计算聚类结果的均方误差,选择均方误差较小的k值为最终的聚类值,最终得到k类用户群。
本发明具有以下优点:
本发明从用户缴费相关数据进行深入分析,筛选出用户缴费的特征指标,并通过聚类识别算法实现用户群体的分类,实现供电企业对不同类别的用户群体实施开展针对性的缴费推广方式,以此有效提升智能缴费渠道的推广成功率,提高居民线上缴费率。同时解决当前客户特征识别不全面,智能缴费推广针对性不强等问题,推动公司向主动创新型现代营销服务模式转变。
附图说明
图1为本发明实施例提供的一种基于电费回收的用户分类方法的流程示意图;
图2为本发明实施例提供的采用聚类分析算法得到的用户群体分类的示意图。
具体实施方式
以下结合附图和具体实施例对本发明提出的一种基于电费回收的用户分类方法作进一步详细说明。根据下面说明和权利要求书,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比率,仅用以方便、明晰地辅助说明本发明实施例的目的。
如图1所示,本发明提出了一种基于电费回收的用户分类方法,包括以下步骤:
S1、从电力系统数据库中提取用户基础数据及缴费相关数据,形成用户分类的原始数据,并对原始数据进行数据预处理;
具体地,从电力系统数据库中获取用户缴费行为数据,并从用户缴费行为数据中抽取用户的基础数据及用户缴费相关数据,所述的用户基础数据包括用户类型(低压居民、低压非居)、户名、用户行业、所属站点、年月等信息,所述的用户缴费相关数据包括缴费渠道(分为线上、线下)、缴费金额、缴费周期(收到电费通知后的缴费响应速度)、欠费次数、违约用电次数(了解用户电费风险特征)、用户实名制认证情况、电子账单开通情况(高质量用户特征)等;有效的整合用户基础数据及缴费相关数据,形成用户分类原始数据;
通过数据预处理方式,删除原始数据中的无关数据、重复数据、平滑噪声数据;由于原始数据中各个缴费相关的数据范围不同,容易对特征指标的筛选结果产生影响,因此采用数据标准化处理,将原始数据集中的各个数据变换到均值为0、方差为1的范围内;
S2、采用数据降维方法从预处理后的原始数据中筛选用户缴费的特征指标,得到每个用户的缴费特征向量;
采用python sklean库,decomposition.PCA函数进行原始数据维数压缩,尽可能低降低原始数据的维数(复杂度),从而最终筛选出用户缴费的特征指标,得到每个用户的缴费特征向量;
优选地,采用数据降维方法最终筛选出的用户缴费的特征指标包括:线上缴费习惯、缴费行为习惯以及沟通便捷性,所述的线上缴费习惯包括线上缴费渠道开通情况、线上缴费渠道使用情况、电子账单开通情况;所述的缴费行为习惯包括违约用电次数、欠费次数、月平均电费、电费回收周期;所述的沟通便捷性包括用户实名制认证情况。
S3、基于用户的缴费特征向量并采用聚类分析算法对用户进行聚类,实现用户群体的分类;
采用聚类分析算法对用户进行聚类,具体包括以下步骤:
a、任意选取k个用户作为初始中心,每个用户代表一个聚类中心;
其中,需设定k为不同的值进行循环计算;
b、分别计算每个用户与每个聚类中心的欧式距离,并按照距离最近原则将每个用户归类到距离它们最近的聚类中心所对应的类,形成k个簇;
其中,基于用户缴费特征向量计算每个用户与每个聚类中心的欧式距离;
c、将每个簇中所有用户所对应的均值作为该类别的聚类中心,计算目标函数的值;
d、判断聚类中心和目标函数的值是否发生改变,若改变,则重复步骤a-c,若不变,则输出聚类结果;
e、计算聚类结果的均方误差,确定聚类k值,最终得到k类用户群;
其中,选择均方误差较小的k值为最终的聚类值。
如图2所示,采用聚类分析算法将用户群体划分为四个聚类类别。同一个类别中的用户用户缴费特征集相似,不同类别之间的用户缴费特征集相异。通过分析各个聚类类别中的用户特征,可以针对性的对各个类别中的用户群体提供相应的智能缴费渠道推广策略,从而提升电费回收效率。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (5)

1.一种基于电费回收的用户分类方法,其特征在于,包括以下步骤:
S1、从电力系统数据库中提取用户基础数据及缴费相关数据,形成用户分类原始数据,并对原始数据进行数据预处理;
S2、采用数据降维方法从预处理后的原始数据中筛选用户缴费的特征指标,得到每个用户的缴费特征向量;
S3、基于用户的缴费特征向量并采用聚类分析算法对用户进行聚类,实现用户群体的分类。
2.如权利要求1所述的一种基于电费回收的用户分类方法,其特征在于,所述的用户基础数据包括用户类型、户名、用户行业、所属站点、时间信息。
3.如权利要求1所述的一种基于电费回收的用户分类方法,其特征在于,所述的用户缴费行为数据包括缴费渠道、缴费金额、缴费周期、欠费次数、违约用电次数、用户实名制认证情况、电子账单开通情况。
4.如权利要求1所述的一种基于电费回收的用户分类方法,其特征在于,所述的原始数据预处理包括以下步骤:
删除原始数据中的无关数据、重复数据、平滑噪声数据;
采用数据标准化处理将原始数据集中的各个数据变换到均值为0、方差为1的范围内。
5.如权利要求1所述的一种基于电费回收的用户分类方法,其特征在于,采用聚类分析算法对用户进行聚类,具体包括以下步骤:
a、任意选取k个用户作为初始中心,每个用户代表一个聚类中心;
b、分别计算每个用户与每个聚类中心的欧式距离,并按照距离最近原则将每个用户归类到距离它们最近的聚类中心所对应的类,形成k个簇;
其中,基于用户缴费特征向量计算每个用户与每个聚类中心的欧式距离;
c、将每个簇中所有用户所对应的均值作为该类别的聚类中心,计算目标函数的值;
d、判断聚类中心和目标函数的值是否发生改变,若改变,则重复步骤a-c,若不变,则输出聚类结果;
e、计算聚类结果的均方误差,选择均方误差较小的k值为最终的聚类值,最终得到k类用户群。
CN202010462048.XA 2020-05-27 2020-05-27 一种基于电费回收的用户分类方法 Pending CN111626614A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010462048.XA CN111626614A (zh) 2020-05-27 2020-05-27 一种基于电费回收的用户分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010462048.XA CN111626614A (zh) 2020-05-27 2020-05-27 一种基于电费回收的用户分类方法

Publications (1)

Publication Number Publication Date
CN111626614A true CN111626614A (zh) 2020-09-04

Family

ID=72271213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010462048.XA Pending CN111626614A (zh) 2020-05-27 2020-05-27 一种基于电费回收的用户分类方法

Country Status (1)

Country Link
CN (1) CN111626614A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112184481A (zh) * 2020-09-22 2021-01-05 北京来也网络科技有限公司 结合rpa和ai的智能电网欠费处理方法和装置
CN112258067A (zh) * 2020-10-30 2021-01-22 国网上海市电力公司 基于高斯混合模型聚类算法的低压用户缴费行为分类方法
CN112381295A (zh) * 2020-11-13 2021-02-19 深圳供电局有限公司 一种基于用电行为偏好的居民用电提醒方法及系统
CN113449793A (zh) * 2021-06-28 2021-09-28 国网北京市电力公司 用电状态的确定方法及装置
WO2024007094A1 (zh) * 2022-07-04 2024-01-11 嘉兴尚坤科技有限公司 一种基于聚类算法和tsvm模型的用户生活缴费分析方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260815A (zh) * 2015-09-18 2016-01-20 国网辽宁省电力有限公司鞍山供电公司 基于大数据的电力系统缴费渠道评价方法
CN106650763A (zh) * 2016-07-05 2017-05-10 国网内蒙古东部电力有限公司电力科学研究院 一种电力缴费渠道分析的指标选择、权值优化与渠道规划的计算方法
CN107767293A (zh) * 2017-09-20 2018-03-06 国网浙江省电力公司电力科学研究院 一种基于改进AP和K‑means聚类的电力大用户细分方法
WO2018059015A1 (zh) * 2016-09-29 2018-04-05 深圳大学 一种基于交易数据的客户分类方法及其系统
CN111199493A (zh) * 2018-11-19 2020-05-26 国家电网有限公司客户服务中心 一种基于客户缴费信息及征信信息的欠费风险识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260815A (zh) * 2015-09-18 2016-01-20 国网辽宁省电力有限公司鞍山供电公司 基于大数据的电力系统缴费渠道评价方法
CN106650763A (zh) * 2016-07-05 2017-05-10 国网内蒙古东部电力有限公司电力科学研究院 一种电力缴费渠道分析的指标选择、权值优化与渠道规划的计算方法
WO2018059015A1 (zh) * 2016-09-29 2018-04-05 深圳大学 一种基于交易数据的客户分类方法及其系统
CN107767293A (zh) * 2017-09-20 2018-03-06 国网浙江省电力公司电力科学研究院 一种基于改进AP和K‑means聚类的电力大用户细分方法
CN111199493A (zh) * 2018-11-19 2020-05-26 国家电网有限公司客户服务中心 一种基于客户缴费信息及征信信息的欠费风险识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘晓?: "基于电力缴费行为细分的服务提升研究", 《中国科技信息》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112184481A (zh) * 2020-09-22 2021-01-05 北京来也网络科技有限公司 结合rpa和ai的智能电网欠费处理方法和装置
CN112184481B (zh) * 2020-09-22 2024-02-23 北京来也网络科技有限公司 结合rpa和ai的智能电网欠费处理方法和装置
CN112258067A (zh) * 2020-10-30 2021-01-22 国网上海市电力公司 基于高斯混合模型聚类算法的低压用户缴费行为分类方法
CN112381295A (zh) * 2020-11-13 2021-02-19 深圳供电局有限公司 一种基于用电行为偏好的居民用电提醒方法及系统
CN113449793A (zh) * 2021-06-28 2021-09-28 国网北京市电力公司 用电状态的确定方法及装置
WO2024007094A1 (zh) * 2022-07-04 2024-01-11 嘉兴尚坤科技有限公司 一种基于聚类算法和tsvm模型的用户生活缴费分析方法

Similar Documents

Publication Publication Date Title
CN111626614A (zh) 一种基于电费回收的用户分类方法
CN110781332A (zh) 基于复合聚类算法的电力居民用户日负荷曲线聚类方法
CN111160401A (zh) 一种基于均值漂移和XGBoost的异常用电判别方法
CN110930198A (zh) 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备
CN110610121B (zh) 基于曲线聚类的小时级源荷功率异常数据辨识与修复方法
Gajowniczek et al. Electricity peak demand classification with artificial neural networks
CN112184489A (zh) 一种电力用户分群管理系统及方法
CN112819299A (zh) 一种基于中心优化的差分K-means负荷聚类方法
CN114611738A (zh) 一种基于用户用电行为分析的负荷预测方法
CN108154311A (zh) 基于随机森林和决策树的优质客户识别方法及装置
CN115907822A (zh) 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法
Kojury-Naftchali et al. Identifying susceptible consumers for demand response and energy efficiency policies by time-series analysis and supplementary approaches
CN112686491A (zh) 一种基于用电行为的企业电力数据分析方法
CN115130811A (zh) 电力用户画像的建立方法、装置及电子设备
CN114022205A (zh) 基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统
CN112258067A (zh) 基于高斯混合模型聚类算法的低压用户缴费行为分类方法
Chen et al. A power line loss analysis method based on boost clustering
CN111324790A (zh) 基于支持向量机分类的负荷类型识别方法
CN111861587A (zh) 一种基于隐马尔可夫模型和向前算法的居民用电行为分析的系统及方法
CN114841832A (zh) 一种基于用电负荷二次聚类的电力用户画像标签建立方法
CN114048200A (zh) 一种计及缺失数据补齐的用户用电行为分析方法
CN113902485A (zh) 一种专变电力用户行业识别方法、装置及设备
CN112215420A (zh) 一种居民用电的客户过户识别方法及系统
Liu et al. Inventory Management of Automobile After-sales Parts Based on Data Mining
Davarzani et al. Study of missing meter data impact on domestic load profiles clustering and characterization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200904