CN109598446A - 一种基于机器学习算法的电费回收风险预警系统 - Google Patents

一种基于机器学习算法的电费回收风险预警系统 Download PDF

Info

Publication number
CN109598446A
CN109598446A CN201811499597.3A CN201811499597A CN109598446A CN 109598446 A CN109598446 A CN 109598446A CN 201811499597 A CN201811499597 A CN 201811499597A CN 109598446 A CN109598446 A CN 109598446A
Authority
CN
China
Prior art keywords
risk
data
module
tariff recovery
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811499597.3A
Other languages
English (en)
Inventor
葛安同
陈玉琴
黄睿
张云
李铁香
谢晓慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangzhou Power Supply Co of Jiangsu Electric Power Co
Original Assignee
Yangzhou Power Supply Co of Jiangsu Electric Power Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangzhou Power Supply Co of Jiangsu Electric Power Co filed Critical Yangzhou Power Supply Co of Jiangsu Electric Power Co
Priority to CN201811499597.3A priority Critical patent/CN109598446A/zh
Publication of CN109598446A publication Critical patent/CN109598446A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于机器学习算法的电费回收风险预警系统。涉及电力技术领域,尤其涉及一种基于机器学习算法的电费回收风险预警系统。提供了一种运用用户电费回收风险模型对用户风险进行评价,针对电费回收风险较高的用户采取单独催缴电费的配套措施,提升电费回收率和及时率的基于机器学习算法的电费回收风险预警系统。包括数据获取模块、数据处理模块、模型构建及评价模块和客户风险分级模块,所述数据获取模块用于获取静态数据和动态数据;所述客户风险分级模块用于计算用户的风险概率或风险等级。本发明提升了电费回收率和及时率、减轻催费负担、降低电费回收风险,有效规避欠费风险,有利于供电企业的平稳发展。

Description

一种基于机器学习算法的电费回收风险预警系统
技术领域
本发明涉及电力技术领域,尤其涉及一种基于机器学习算法的电费回收风险预警系统。
背景技术
电费回收是供电企业盈利的直接方式,是企业生存和发展的根本,在国内经济下行的环境下,用户拖欠电费的现象频繁发生,对供电企业的电费回收工作造成极大的风险。
高压用户每月用电量较大,产生电费较多,结算方式也各不相同。目前针对欠费用户,没有有效的事前电费回收风险预警技术。欠费发生后催交,回收效率较低,且风险已经发生,如因企业经营不善、人为拖欠等因素导致电费无法按时保量回收,会造成国有资产的流失。
发明内容
本发明针对以上问题,提供了一种运用用户电费回收风险模型对用户风险进行评价,针对电费回收风险较高的用户采取单独催缴电费的配套措施,提升电费回收率和及时率的基于机器学习算法的电费回收风险预警系统。
本发明的技术方案是:包括数据获取模块、数据处理模块、模型构建及评价模块和客户风险分级模块,
所述数据获取模块用于获取静态数据和动态数据;
所述数据处理模块用于对数据进行加工、包括数据预处理模块和特征工程模块;
所述模型构建及评价模块用于构建电费回收风险模型,模型输出结果为用户的电费回收风险概率或风险等级;
所述客户风险分级模块用于计算用户的风险概率或风险等级。
所述静态数据包括用户身份数据,所述动态数据包括用户缴费行为数据和经营信用数据。
所述数据预处理模块用于对原始数据进行数据预处理,包括数据清洗、缺失值离群值处理、数据集成、数据变换和数据规约。
所述特征工程模块包括多表聚合、特征加工、数据归一化、数据编码、特征选择、特征降维和标签标注。
所述模型构建及评价模块采用机器学习分类模型或聚类模型,通过对数据的训练和学习,构建电费回收风险模型;
机器学习分类模型包括逻辑回归、决策树、支持向量机以及神经网络模型;
聚类模型包括k-means算法、系统聚类。
还包括风险分级电费回收模块,所述风险分级电费回收模块用于根据用户风险等级或信用评分,对不同风险的用户采取差异化的电费回收策略。
本发明通过分析用户的历史缴费数据,研究用电客户的缴费行为,建立多维度的用户画像。运用机器学习算法模型对用户特征数据进行训练、学习,形成用户电费回收风险模型,用以预测用户的欠费概率,形成用户风险分级或用电信用评分。
本发明提升了电费回收率和及时率、减轻催费负担、降低电费回收风险,有效规避欠费风险,有利于供电企业的平稳发展。
附图说明
图1是本发明的结构框图。
具体实施方式
本发明如图1所示,包括数据获取模块、数据处理模块、模型构建及评价模块和客户风险分级模块,
所述数据获取模块用于获取静态数据和动态数据;
所述数据处理模块用于对数据进行加工、包括数据预处理模块和特征工程模块;
所述模型构建及评价模块用于构建电费回收风险模型,模型输出结果为用户的电费回收风险概率或风险等级;
所述客户风险分级模块用于计算用户的风险概率或风险等级。
所述静态数据包括用户身份数据,所述动态数据包括用户缴费行为数据和经营信用数据。
所述数据预处理模块用于对原始数据进行数据预处理,包括数据清洗、缺失值离群值处理、数据集成、数据变换和数据规约。
所述特征工程模块包括多表聚合、特征加工、数据归一化、数据编码、特征选择、特征降维和标签标注。
多表聚合:对经预处理的数据,进行多表聚合,形成一个用户账号对应多个特征维度的数据表。
特征加工:特征包括静态特征、用电行为特征、高压用户经营状况和银行信用状况特征等几个方面。
静态特征:包括但不限于缴费方式、供电单位、运行容量、行业分类等;
行为特征:包括但不限于电费总额、分月或累加逾期次数、天数等;
用户经营状况和银行信用特征:包括但不限于用户信贷情况、经营财报数据等。
数据归一化:对数值型变量特征进行数据归一化处理。
数据编码:对名义变量特征采用离散化处理,便于计算机进行计算。
特征选择:采用信息值、信息增益等方式衡量特征重要性。
特征降维:若特征维度较高,可以采用主成分分析等方法降低维度,增加算法学习效率。
标签标注:针对用户的用电行为,根据经验对用户进行风险标注。
所述模型构建及评价模块采用机器学习分类模型或聚类模型,通过对数据的训练和学习,构建电费回收风险模型;
机器学习分类模型包括逻辑回归、决策树、支持向量机以及神经网络模型;
聚类模型包括k-means算法、系统聚类。
还包括风险分级电费回收模块,所述风险分级电费回收模块用于根据用户风险等级或信用评分,对不同风险的用户采取差异化的电费回收策略。
一种基于机器学习算法的电费回收风险预警方法的优选实例如下:
(1)数据预处理模块
缴费记录数据清洗(去电费异常、重复项,纠正缴费日期异常项);
数据集成(月多笔电费累加);
缺失值丢弃、填0、null类处理;
统一字段格式、日期格式;
用户缴费表和用户信息表聚合,增加用户画像维度。
(2)特征工程模块
数据清洗(去电费异常、重复项,纠正缴费日期异常项);
数据集成(月多笔电费累加);
缺失值丢弃、填0、null类处理;
统一字段格式、日期格式;
用户缴费表和用户信息表聚合,增加用户画像维度;
标签标注:为电费逾期5天以上的用户做风险标注;
数据编码:对名义变量特征采用独热编码,便于计算机进行计算。
独热编码方法:例如“缴费方式”这个特征有“坐收”和“特约委托”两种取值编码后,坐收:1 0 特约委托:0 1
特征加工:加工产生了包括最近6/3/1个月逾期次数/预期总天数、近6/3/1个月逾期天数在各范围的次数、电费总额、缴费方式、供电单位、运行容量、用电类别、定价策略类型、基本电费计算方式、功率因数考核方式等多个特征(具体见表一)。
特征选择:采用信息值IV衡量特征重要性,IV>0.3的特征可以入模型。
(3)模型构建及评价模块
采用逻辑回归模型。逻辑回归模型表达式:
概率P(Y=1|X=x)为用户的电费回收风险概率。X∈Rn为含有n个特征的输入,ω∈Rn为权重向量参数。
经过模型训练,得到模型参数情况如下:
表一 模型特征及对应的权重参数该模型在4041个用户验证数据中,预测准确率达到99%。能够很好的达到将用户电费回收风险等级分类的目的。
(4)客户风险分级模块根据模型表达式计算各用户的风险概率。用户风险可以有以下两种表现形式:
1.风险等级。根据风险概率大小按照一定的阈值进行用户风险等级分类,如可以分为高风险、中风险、低风险三个不同级别的风险类型。
2.信用分值。根据风险概率设计用户信用评分卡,将风险概率转换为信用值,风险越高的用户信用分值越低,方便用户风险刻画。具体方法如下:
①计算逾期与非逾期的概率比
②分值刻度:信用分值分值Score=β01*Odds,参数β0β1的计算基于两个初始设定:某概率比下的分值(Odds,Score0)和概率比翻倍后的分值(2Odds,Score1)。将两个点代入分值函数即可求出参数β0β1
③信用分值计算,根据中的分值函数,计算用户的信用分值。

Claims (6)

1.一种基于机器学习算法的电费回收风险预警系统,其特征在于,包括数据获取模块、数据处理模块、模型构建及评价模块和客户风险分级模块,
所述数据获取模块用于获取静态数据和动态数据;
所述数据处理模块用于对数据进行加工、包括数据预处理模块和特征工程模块;
所述模型构建及评价模块用于构建电费回收风险模型,模型输出结果为用户的电费回收风险概率或风险等级;
所述客户风险分级模块用于计算用户的风险概率或风险等级。
2.根据权利要求1所述的一种基于机器学习算法的电费回收风险预警系统,其特征在于,所述静态数据包括用户身份数据,所述动态数据包括用户缴费行为数据和经营信用数据。
3.根据权利要求1所述的一种基于机器学习算法的电费回收风险预警系统,其特征在于,所述数据预处理模块用于对原始数据进行数据预处理,包括数据清洗、缺失值离群值处理、数据集成、数据变换和数据规约。
4.根据权利要求1所述的一种基于机器学习算法的电费回收风险预警系统,其特征在于,所述特征工程模块包括多表聚合、特征加工、数据归一化、数据编码、特征选择、特征降维和标签标注。
5.根据权利要求1所述的一种基于机器学习算法的电费回收风险预警系统,其特征在于,所述模型构建及评价模块采用机器学习分类模型或聚类模型,通过对数据的训练和学习,构建电费回收风险模型;
机器学习分类模型包括逻辑回归、决策树、支持向量机以及神经网络模型;
聚类模型包括k-means算法、系统聚类。
6.根据权利要求1所述的一种基于机器学习算法的电费回收风险预警系统,其特征在于,还包括风险分级电费回收模块,所述风险分级电费回收模块用于根据用户风险等级或信用评分,对不同风险的用户采取差异化的电费回收策略。
CN201811499597.3A 2018-12-09 2018-12-09 一种基于机器学习算法的电费回收风险预警系统 Pending CN109598446A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811499597.3A CN109598446A (zh) 2018-12-09 2018-12-09 一种基于机器学习算法的电费回收风险预警系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811499597.3A CN109598446A (zh) 2018-12-09 2018-12-09 一种基于机器学习算法的电费回收风险预警系统

Publications (1)

Publication Number Publication Date
CN109598446A true CN109598446A (zh) 2019-04-09

Family

ID=65961464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811499597.3A Pending CN109598446A (zh) 2018-12-09 2018-12-09 一种基于机器学习算法的电费回收风险预警系统

Country Status (1)

Country Link
CN (1) CN109598446A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458387A (zh) * 2019-06-27 2019-11-15 广东电网有限责任公司信息中心 一种基于机器学习技术的智能电网信息管理方法及系统
CN110826621A (zh) * 2019-11-01 2020-02-21 北京芯盾时代科技有限公司 一种风险事件处理方法及装置
CN111080005A (zh) * 2019-12-12 2020-04-28 华中科技大学 一种基于支持向量机的治安风险预警方法及系统
CN111198907A (zh) * 2019-12-24 2020-05-26 深圳供电局有限公司 潜在欠费用户识别方法、装置、计算机设备和存储介质
CN111639883A (zh) * 2020-06-15 2020-09-08 江苏电力信息技术有限公司 一种基于机器学习的电费回收风险预测方法
CN112990611A (zh) * 2021-05-12 2021-06-18 江苏电力信息技术有限公司 一种基于多头注意力网络的电费回收风险预测方法
CN114154835A (zh) * 2021-11-29 2022-03-08 海南电网有限责任公司信息通信分公司 一种用电客户缴费怠慢度评估方法
CN114511058A (zh) * 2022-01-27 2022-05-17 国网江苏省电力有限公司泰州供电分公司 一种用于电力用户画像的负荷元件构建方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760937A (zh) * 2016-03-18 2016-07-13 广州铭诚计算机科技有限公司 一种基于大数据的电网用户电费回收模型构建方法
CN106600146A (zh) * 2016-12-15 2017-04-26 北京中电普华信息技术有限公司 一种电费回收风险评价方法和装置
CN107895245A (zh) * 2017-12-26 2018-04-10 国网宁夏电力有限公司银川供电公司 一种基于用户画像的电费回收风险评估方法
CN108154430A (zh) * 2017-12-28 2018-06-12 上海氪信信息技术有限公司 一种基于机器学习和大数据技术的信用评分构建方法
US20180276291A1 (en) * 2017-03-27 2018-09-27 Alibaba Group Holding Limited Method and device for constructing scoring model and evaluating user credit

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760937A (zh) * 2016-03-18 2016-07-13 广州铭诚计算机科技有限公司 一种基于大数据的电网用户电费回收模型构建方法
CN106600146A (zh) * 2016-12-15 2017-04-26 北京中电普华信息技术有限公司 一种电费回收风险评价方法和装置
US20180276291A1 (en) * 2017-03-27 2018-09-27 Alibaba Group Holding Limited Method and device for constructing scoring model and evaluating user credit
CN107895245A (zh) * 2017-12-26 2018-04-10 国网宁夏电力有限公司银川供电公司 一种基于用户画像的电费回收风险评估方法
CN108154430A (zh) * 2017-12-28 2018-06-12 上海氪信信息技术有限公司 一种基于机器学习和大数据技术的信用评分构建方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458387A (zh) * 2019-06-27 2019-11-15 广东电网有限责任公司信息中心 一种基于机器学习技术的智能电网信息管理方法及系统
CN110826621A (zh) * 2019-11-01 2020-02-21 北京芯盾时代科技有限公司 一种风险事件处理方法及装置
CN111080005A (zh) * 2019-12-12 2020-04-28 华中科技大学 一种基于支持向量机的治安风险预警方法及系统
CN111080005B (zh) * 2019-12-12 2022-05-17 华中科技大学 一种基于支持向量机的治安风险预警方法及系统
CN111198907A (zh) * 2019-12-24 2020-05-26 深圳供电局有限公司 潜在欠费用户识别方法、装置、计算机设备和存储介质
CN111639883A (zh) * 2020-06-15 2020-09-08 江苏电力信息技术有限公司 一种基于机器学习的电费回收风险预测方法
CN112990611A (zh) * 2021-05-12 2021-06-18 江苏电力信息技术有限公司 一种基于多头注意力网络的电费回收风险预测方法
CN114154835A (zh) * 2021-11-29 2022-03-08 海南电网有限责任公司信息通信分公司 一种用电客户缴费怠慢度评估方法
CN114511058A (zh) * 2022-01-27 2022-05-17 国网江苏省电力有限公司泰州供电分公司 一种用于电力用户画像的负荷元件构建方法及装置
CN114511058B (zh) * 2022-01-27 2023-06-02 国网江苏省电力有限公司泰州供电分公司 一种用于电力用户画像的负荷元件构建方法及装置

Similar Documents

Publication Publication Date Title
CN109598446A (zh) 一种基于机器学习算法的电费回收风险预警系统
Greaves et al. Using the bitcoin transaction graph to predict the price of bitcoin
Sen et al. An Investigation of the Structural Characteristics of the Indian IT Sector and the Capital Goods Sector: An Application of the R Programming in Time Series Decomposition and Forecasting
CN109063945B (zh) 一种基于价值评估体系的售电公司360度客户画像构建方法
Shao et al. A new electricity price prediction strategy using mutual information-based SVM-RFE classification
CN107145966A (zh) 基于逻辑回归概率分析优化模型的反窃电分析预警方法
CN111724039B (zh) 一种向电力用户推荐客服人员的推荐方法
CN108389069A (zh) 基于随机森林和逻辑回归的优质客户识别方法及装置
Hsu RETRACTED: Using a back propagation network combined with grey clustering to forecast policyholder decision to purchase investment-inked insurance
Liu et al. Forecasting the occurrence of extreme electricity prices using a multivariate logistic regression model
CN106600146A (zh) 一种电费回收风险评价方法和装置
Cao et al. Bond rating using support vector machine
Lei et al. Research on supply chain financial risk prevention based on machine learning
Merello et al. Ensemble application of transfer learning and sample weighting for stock market prediction
Jisma et al. Risk-Calibrated conventional-renewable generation mix using master-slave portfolio approach guided by flexible investor preferencing
Jorgenson et al. Progress on measuring the industry origins of the japan-us productivity gap
CN113506173A (zh) 一种信用风险评估方法及其相关设备
Chandra et al. Support vector machine and wavelet neural network hybrid: application to bankruptcy prediction in banks
CN111626331A (zh) 一种自动化行业分类装置及其工作方法
Joaqui-Barandica et al. How do climate and macroeconomic factors affect the profitability of the energy sector?
Kim Text mining-based approach for forecasting spare parts demand of KX tanks
Alborz et al. Using Genetic Algorithm in optimizing decision trees for credit scoring of banks customers
Meyer et al. Macroeconomic Modelling of the Global Economy-Energy-Environment Nexus-an Overview of Recent Advancements of the Dynamic Simulation Model GINFORS
Yang et al. SVR mathematical model and methods for sale prediction
Foster-McGregor et al. The ADB-ADBI Innovation and Structural Transformation Database: A Guide

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190409

RJ01 Rejection of invention patent application after publication