CN111126776A - 一种基于逻辑回归算法的电费风险防控模型构建方法 - Google Patents
一种基于逻辑回归算法的电费风险防控模型构建方法 Download PDFInfo
- Publication number
- CN111126776A CN111126776A CN201911177990.5A CN201911177990A CN111126776A CN 111126776 A CN111126776 A CN 111126776A CN 201911177990 A CN201911177990 A CN 201911177990A CN 111126776 A CN111126776 A CN 111126776A
- Authority
- CN
- China
- Prior art keywords
- risk
- index
- value
- electric charge
- credit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002265 prevention Effects 0.000 title claims abstract description 43
- 238000007477 logistic regression Methods 0.000 title claims abstract description 33
- 230000005611 electricity Effects 0.000 title claims description 60
- 238000010276 construction Methods 0.000 title claims description 7
- 238000011156 evaluation Methods 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 38
- 230000006399 behavior Effects 0.000 claims abstract description 27
- 238000011084 recovery Methods 0.000 claims abstract description 13
- 230000002159 abnormal effect Effects 0.000 claims description 33
- 230000008859 change Effects 0.000 claims description 33
- 238000011835 investigation Methods 0.000 claims description 30
- 238000013461 design Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 18
- 238000007726 management method Methods 0.000 claims description 15
- 238000009826 distribution Methods 0.000 claims description 14
- 238000004519 manufacturing process Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 230000007423 decrease Effects 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000010485 coping Effects 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000013210 evaluation model Methods 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000010972 statistical evaluation Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 6
- 238000012502 risk assessment Methods 0.000 abstract description 6
- 238000007418 data mining Methods 0.000 abstract description 4
- 238000012423 maintenance Methods 0.000 abstract description 2
- 238000012544 monitoring process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于逻辑回归算法的电费风险防控模型构建方法,属于电力运营技术领域。现有技术不能够对优劣客户进行科学客观的评价方法,进而无法对客户行为提出有效的鼓励或惩罚举措,无法针对性的实行“一户一策”,不利于供电企业权益的维护。本发明提供一种基于客户用电直接行为与关联行为等数据,采用数据挖掘算法,计算输出事实风险客户与潜在风险客户,并分别给予风险评估,进而便于供电企业主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效,便于实行“一户一策”,利于供电企业权益的维护,方案切实可行,便于编程实现。
Description
技术领域
本发明涉及一种基于逻辑回归算法的电费风险防控模型构建方法,属于电力运营技术领域。
背景技术
近年来社会经济发展趋缓,电力公司电费回收压力日益增加,电费回收风险防控难度不断加大;缺乏一种能够对优劣客户进行科学客观的评价方法,进而无法对客户行为提出有效的鼓励或惩罚举措,无法针对性的实行“一户一策”,不利于供电企业权益的维护。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种基于客户用电直接行为与关联行为等数据,采用数据挖掘算法,计算输出事实风险客户与潜在风险客户,并分别给予风险评估,进而便于供电企业主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效,便于实行“一户一策”,利于供电企业权益维护的基于逻辑回归算法的电费风险防控模型构建方法。
为实现上述目的,本发明的技术方案为:
一种基于逻辑回归算法的电费风险防控模型构建方法,具体包括以下步骤:
第一步,数据采集
通过营销系统及95598业务支持系统,收集客户基本属性、交费行为、用电行为、业务变更等信息数据;利用业务人员调研、基层访谈和其他外部系统等方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件等外部信息数据;
第二步,数据检验
获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;
第三步,数据处理
数据处理主要包括对缺失值、离群值、异常值等记录进行清洗处理以及相关衍生变量的生成过程,具体顺序为:缺失值、离群值、异常值处理到衍生变量生成;
第四步,模型构建
电费风险防控模型是对客户能否按时、足额缴纳电费的评估,主要从客户信用、用电趋势、行业景气指数和突发事件四个维度考虑;
客户信用维度主要从信用评价得分和信用变化趋势两方面设计指标;
用电趋势维度围绕用电量、容量、交费方式三方面来设计指标;
行业景气指数维度考虑行业景气度与行业景气度变化趋势指标;
突发事件维度考察当前发生的社会重大事件;
指标设计具体包括指标名称、计算规则、考察期和评价规则的设计;
以客户信用、用电趋势和行业景气度三个维度下的指标为基础,利用逻辑回归算法对客户未来是否逾期交费进行评估预测;
由于电力客户数量庞大,客户基本信息、用电趋势数据量非常大,因此电费风险防控模型优先考虑简单并且并行处理速度较快的算法;
同时考虑到要将逾期交费风险划分等级,因此电费风险防控模型优先考虑输出结果易于解释的,且容易划分等级的算法;
为此基于上述两点并结合以往历史经验,对细分用电类别市场的逾期交费风险评估,优先采用逻辑回归logistic算法;
第五步,模型输出
基于逻辑回归算法构建的电费风险防控模型,实现对高压高风险用户的命中率和覆盖率、低压非居高风险用户的命中率和覆盖率及低压居民高风险用户统计评估。
本发明提供一种基于客户用电直接行为与关联行为等数据,采用数据挖掘算法,计算输出事实风险客户与潜在风险客户,并分别给予风险评估,进而便于供电企业主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效,便于实行“一户一策”,利于供电企业权益的维护,方案切实可行,便于编程实现。
作为优选技术措施:
所述第一步,数据信息具体如下:
基本属性数据:客户户号、户名、客户分类、用电类别、行业分类、容量、催费短信是否订阅;
交费行为数据:电费发行日、实收日期、应收电费、交费截止日、违约金起算日、实收电费、交费方式;
用电行为数据:违约用电历史记录、不法窃电历史记录、用电量历史记录、信用评价历史记录;
关联信息数据:第三方信用信息、行业前景评价、生产经营状况、突发事件。
作为优选技术措施:
所述第二步,
(1)客户户号ID的唯一性检验:建模训练基础数据集中,每个客户为一条观测数据,因此每个户号ID变量应该仅出现一次,否则需要核查原因,调整数据;
(2)范围和取值检验:建模训练数据集中使用的每个变量都应该来自一个定义清晰、具有已知的或预期取值范围的字段;连续变量的值应该在一定的预期范围内,而名义变量应取维表中的值;
(3)缺失值检验:识别建模训练数据集中每个字段的缺失值及其来源是完整性检验中的基本步骤;缺失值的产生可能是失误的结果,也可能是因为制定的字段没有被定义;
(4)异常值、离群值检验:异常值是指明显偏离数据集的观测值,如过大、过小、负值数据;异常值可能是由于记录错误引起的,也可能是真实数据;因此要检验异常值出现的原因,并相应的处理异常值;离群值被定义为某个变量平均值正负3个标准差以外的数值。
作为优选技术措施:
所述第三步,
(1)离群值、异常值的处理方法
当出现以上情况时,离群值可用3个标准差的最大值或最小值替换,将离群值调整为距离最近的正常值;异常值要检验异常值出现的原因,并相应的处理异常值;如果离群值或异常值没有业务含义,可直接剔除离群值或异常值或用空值NULL来替代离群值或异常值;
(2)缺失值的处理方法
将缺失值调整为某个固定值;如均值、中间值或一个指定的常数或将缺失值调整为一个服从正态分布的随机值;
(3)按户进行数据整合
对于一个客户一笔应收电费存在多个电费、罚金记录的,按客户编号按应收电费标识汇总合并;对于一个客户一笔应收电费存在多个实收日的,保留该应收电费最后一次实收日;
(4)相关衍生变量的生成
衍生变量是服务模型建设的变量,基于数理分析中心数据处理模块的变量计算功能生成与电费风险防控主题相关的各衍生变量。
作为优选技术措施:
所述步骤四,
客户信用指标设计
信用风险是客户未能履行约定义务而造成经济损失的风险;信用越高则欠费风险概率越低,反之则越高;客户信用是电费风险评估模型的首要指标,客户信用指标具体包括客户信用评价得分和客户信用变化趋势;
指标考察期与评价规则设计:客户信用评价得分指标是对信用历史表现情况的综合评价,欠费风险概率预测对本期信用评价结果最为敏感,故该指标的考察期设置为本期即当前月份;信用变化趋势指标通过增长、平稳、波动和下降来考察客户近六个月信用评价得分的变化情况,并分别赋值为1,0,-1和-2。
作为优选技术措施:
所述步骤四,
用电趋势指标设计
用电趋势是客户在用电行为方面的趋势动向;用电平稳或者趋好则欠费风险概率越低,反之则越高;用电趋势是影响电费风险评估的重要指标,用电趋势主要包括现金交费次数占比、用电量变化趋势、容量变化趋势等指标;
指标考察期与评价规则设计:考察期较短可能受到偶然因素或生产周期的影响,较长则时效性不足,综合来看,现金交费次数占比、用电量变化趋势和容量变化趋势指标的考察期设置为6个月是比较合适的;现金交费次数占比为0到100%之间的比例值,用电量变化趋势和容量变化趋势则通过增长、平稳、波动和下降来考察客户近六个月的生产经营状况,并分别赋值为1,0,-1和-2。
作为优选技术措施:
所述步骤四,
行业景气指数和突发事件指标设计
行业景气度是反映行业经济状况的综合指数,目前,国务院发展研究中心行业景气监测平台的重点行业景气变动数据只发布到2015年11月,时效性不足;采购经理指数(PMI)由各省、市统计局月度发布,可反映制造业和服务业的整体增长或衰退,已成为监测经济运行状况的先导指标,且数据获取较容易,故可用采购经理指数(PMI)来代替行业景气度;突发事件是指突然发生的可能会对台区、行业或客户群的用电造成重大影响的社会事件,如果发生,需直接提升欠费风险等级;
指标考察期与评价规则设计:行业景气度和突发事件均具有时效性,考察期设置为本期即当前月份,行业景气度变化趋势考察期设置为近6个月;采购经理指数PMI高于50,表明该行业经济状态趋于上升或改善,欠费风险概率越低;反之,采购经理指数PMI低于50,表明该行业经济状况处于下降或恶化,欠费风险概率越高。
作为优选技术措施:
所述第四步,
逻辑回归logistic算法适用于二值响应变量(0,1),模型假设y服从二项分布,假设p为客户存在电费风险的概率,逻辑回归模型如下:
其中p为y的条件均值,即给定一系列指标X的值时y=1的概率,即客户存在电费逾期交费风险的概率;
作为优选技术措施:
所述第五步,
计算输出事实风险客户与潜在风险客户,并分别给予“高风险”、“中风险”、“低风险”三级电费风险识别标签,推送到营销业务系统中,支撑开展电费风险防控闭环管理工作机制及差异化欠缴催收措施研究工作,从而主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效。
与现有技术相比,本发明具有以下有益效果:
(1)本发明在数据采集方面,主要包括客户基本属性、交费行为、用电行为、业务变更等信息数据,结合了定性、定量分析,主观、客观分析,可以很好地反映用户不同维度之间的互补共协作用。
(2)本发明利用逻辑回归算法构建模型,基于数据本质对用户风险防控进行预测,需要训练集(如,未逾期客户和逾期客户的训练样本),并且训练集无偏差,能用来预测整体,更具有说服力。
(3)本发明基于逻辑回归算法构建的风险防控模型在应用方面,适用于对未来事件发生概率的预测,或未知样本分类的预测。
附图说明
图1为本发明客户信用指标设计图;
图2为本发明用电趋势指标设计图;
图3为本发明行业景气指数和突发事件指标设计图;
图4为本发明模型构建示意图;
图5为应用本发明输出的客户风险等级分布图;
图6为本发明低压非居客户实施差异化催费策略。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
如图1-4所示,一种基于逻辑回归算法的电费风险防控模型构建方法,具体包括以下步骤:
第一步,数据采集
通过营销系统及95598业务支持系统,收集客户基本属性、交费行为、用电行为、业务变更等信息数据;利用业务人员调研、基层访谈和其他外部系统等方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件等外部信息数据;
第二步,数据检验
获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;
第三步,数据处理
数据处理主要包括对缺失值、离群值、异常值等记录进行清洗处理以及相关衍生变量的生成过程,具体顺序为:缺失值、离群值、异常值处理到衍生变量生成;
第四步,模型构建
电费风险防控模型是对客户能否按时、足额缴纳电费的评估,主要从客户信用、用电趋势、行业景气指数和突发事件四个维度考虑;
客户信用维度主要从信用评价得分和信用变化趋势两方面设计指标;
用电趋势维度围绕用电量、容量、交费方式三方面来设计指标;
行业景气指数维度考虑行业景气度与行业景气度变化趋势指标;
突发事件维度考察当前发生的社会重大事件;
指标设计具体包括指标名称、计算规则、考察期和评价规则的设计;
以客户信用、用电趋势和行业景气度三个维度下的指标为基础,利用逻辑回归算法对客户未来是否逾期交费进行评估预测;
由于电力客户数量庞大,客户基本信息、用电趋势数据量非常大,因此电费风险防控模型优先考虑简单并且并行处理速度较快的算法;
同时考虑到要将逾期交费风险划分等级,因此电费风险防控模型优先考虑输出结果易于解释的,且容易划分等级的算法;
为此基于上述两点并结合以往历史经验,对细分用电类别市场的逾期交费风险评估,优先采用逻辑回归logistic算法;
第五步,模型输出
基于逻辑回归算法构建的电费风险防控模型,实现对高压高风险用户的命中率和覆盖率、低压非居高风险用户的命中率和覆盖率及低压居民高风险用户统计评估。
本发明提供一种基于客户用电直接行为与关联行为等数据,采用数据挖掘算法,计算输出事实风险客户与潜在风险客户,并分别给予风险评估,进而便于供电企业主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效,便于实行“一户一策”,利于供电企业权益的维护,方案切实可行,便于编程实现。
本发明收据信息的一种具体实施例:
数据信息具体如下:
基本属性数据:客户户号、户名、客户分类、用电类别、行业分类、容量、催费短信是否订阅;
交费行为数据:电费发行日、实收日期、应收电费、交费截止日、违约金起算日、实收电费、交费方式;
用电行为数据:违约用电历史记录、不法窃电历史记录、用电量历史记录、信用评价历史记录;
关联信息数据:第三方信用信息、行业前景评价、生产经营状况、突发事件。
本发明数据检验的一种具体实施例:
(1)客户户号ID的唯一性检验:建模训练基础数据集中,每个客户为一条观测数据,因此每个户号ID变量应该仅出现一次,否则需要核查原因,调整数据;
(2)范围和取值检验:建模训练数据集中使用的每个变量都应该来自一个定义清晰、具有已知的或预期取值范围的字段;连续变量的值应该在一定的预期范围内,而名义变量应取维表中的值;
(3)缺失值检验:识别建模训练数据集中每个字段的缺失值及其来源是完整性检验中的基本步骤;缺失值的产生可能是失误的结果,也可能是因为制定的字段没有被定义;
(4)异常值、离群值检验:异常值是指明显偏离数据集的观测值,如过大、过小、负值数据;异常值可能是由于记录错误引起的,也可能是真实数据;因此要检验异常值出现的原因,并相应的处理异常值;离群值被定义为某个变量平均值正负3个标准差以外的数值。
本发明数据处理的一种具体实施例:
(1)离群值、异常值的处理方法
当出现以上情况时,离群值可用3个标准差的最大值或最小值替换,将离群值调整为距离最近的正常值;异常值要检验异常值出现的原因,并相应的处理异常值;如果离群值或异常值没有业务含义,可直接剔除离群值或异常值或用空值NULL来替代离群值或异常值;
(2)缺失值的处理方法
将缺失值调整为某个固定值;如均值、中间值或一个指定的常数或将缺失值调整为一个服从正态分布的随机值;
(3)按户进行数据整合
对于一个客户一笔应收电费存在多个电费、罚金记录的,按客户编号按应收电费标识汇总合并;对于一个客户一笔应收电费存在多个实收日的,保留该应收电费最后一次实收日;
(4)相关衍生变量的生成
衍生变量是服务模型建设的变量,基于数理分析中心数据处理模块的变量计算功能生成与电费风险防控主题相关的各衍生变量。
本发明指标设计的一种具体实施例:
客户信用指标设计
信用风险是客户未能履行约定义务而造成经济损失的风险;信用越高则欠费风险概率越低,反之则越高;客户信用是电费风险评估模型的首要指标,客户信用指标具体包括客户信用评价得分和客户信用变化趋势;
指标考察期与评价规则设计:客户信用评价得分指标是对信用历史表现情况的综合评价,欠费风险概率预测对本期信用评价结果最为敏感,故该指标的考察期设置为本期即当前月份;信用变化趋势指标通过增长、平稳、波动和下降来考察客户近六个月信用评价得分的变化情况,并分别赋值为1,0,-1和-2。
用电趋势指标设计
用电趋势是客户在用电行为方面的趋势动向;用电平稳或者趋好则欠费风险概率越低,反之则越高;用电趋势是影响电费风险评估的重要指标,用电趋势主要包括现金交费次数占比、用电量变化趋势、容量变化趋势等指标;
指标考察期与评价规则设计:考察期较短可能受到偶然因素或生产周期的影响,较长则时效性不足,综合来看,现金交费次数占比、用电量变化趋势和容量变化趋势指标的考察期设置为6个月是比较合适的;现金交费次数占比为0到100%之间的比例值,用电量变化趋势和容量变化趋势则通过增长、平稳、波动和下降来考察客户近六个月的生产经营状况,并分别赋值为1,0,-1和-2。
行业景气指数和突发事件指标设计
行业景气度是反映行业经济状况的综合指数,目前,国务院发展研究中心行业景气监测平台的重点行业景气变动数据只发布到2015年11月,时效性不足;采购经理指数(PMI)由各省、市统计局月度发布,可反映制造业和服务业的整体增长或衰退,已成为监测经济运行状况的先导指标,且数据获取较容易,故可用采购经理指数(PMI)来代替行业景气度;突发事件是指突然发生的可能会对台区、行业或客户群的用电造成重大影响的社会事件,如果发生,需直接提升欠费风险等级;
指标考察期与评价规则设计:行业景气度和突发事件均具有时效性,考察期设置为本期即当前月份,行业景气度变化趋势考察期设置为近6个月;采购经理指数PMI高于50,表明该行业经济状态趋于上升或改善,欠费风险概率越低;反之,采购经理指数PMI低于50,表明该行业经济状况处于下降或恶化,欠费风险概率越高。
本发明逻辑回归算法的一种具体实施例:
逻辑回归logistic算法适用于二值响应变量(0,1),模型假设y服从二项分布,假设p为客户存在电费风险的概率,逻辑回归模型如下:
其中p为y的条件均值,即给定一系列指标X的值时y=1的概率,即客户存在电费逾期交费风险的概率;
本发明输出标签的一种具体实施例:
计算输出事实风险客户与潜在风险客户,并分别给予“高风险”、“中风险”、“低风险”三级电费风险识别标签,推送到营销业务系统中,支撑开展电费风险防控闭环管理工作机制及差异化欠缴催收措施研究工作,从而主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效。
如图5所示,应用本发明输出的客户风险等级具体实施例:原始数据中不同信用等级在不同风险等级上的客户数分布。
潜在高风险客户中,90%以上数量的客户为D级信用客户;潜在低风险客户中,90%以上数量的客户为A或B级客户,且A级以上客户占绝大部分;可见风险越高,信用等级越低,风险越低,信用等级越高。
如图6所示,应用本发明一种具体实施例:
因电力公司电费回收压力日益增加,电费回收风险防控难度不断加大的原因,本发明的应用场景为:构建业务策略库、开发实用化功能应用模块、开发建设大客户风险防控平台、优化电费催收工作流程,但是该发明的应用远不局限于以上四种应用场景。
(1)构建业务策略库:梳理高低压用户的风险防控应对措施,构建业务策略库,形成风险防控措施的知识库,指导风险防控措施执行。
(2)开发实用化功能应用模块:以营销业务应用系统为载体,结合主题标签库和业务策略库,开发实用化功能应用模块。
(3)开发建设大客户风险防控平台:针对高压客户以“电费风险等级”为主要维度,结合客户信用等级、逾期交费次数、行业分类等标签组合,确定高压重点防控的客户群体,通过风险闭环管理,实现“一户一策”。
(4)优化电费催收工作流程:针对低压非居客户以“客户信用等级”为主要维度,结合客户的风险等级、用电类别和行业分类等标签组合,确定低压重点防控的客户群体,从用电告知书的内容、电费通知的时间、催费通知频度等对不同群体实施“一类一策”。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,具体包括以下步骤:
第一步,数据采集
收集客户基本属性、交费行为、用电行为、业务变更信息数据;利用业务人员调研、基层访谈和其他外部系统方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件外部信息数据;
第二步,数据检验
获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;
第三步,数据处理
数据处理主要包括对缺失值、离群值、异常值记录进行清洗处理以及相关衍生变量的生成过程,具体顺序为:缺失值、离群值、异常值处理到衍生变量生成;
第四步,模型构建
电费风险防控模型是对客户能否按时、足额缴纳电费的评估,主要从客户信用、用电趋势、行业景气指数和突发事件四个维度考虑;
客户信用维度主要从信用评价得分和信用变化趋势两方面设计指标;
用电趋势维度围绕用电量、容量、交费方式三方面来设计指标;
行业景气指数维度考虑行业景气度与行业景气度变化趋势指标;
突发事件维度考察当前发生的社会重大事件;
指标设计具体包括指标名称、计算规则、考察期和评价规则的设计;
以客户信用、用电趋势和行业景气度三个维度下的指标为基础,利用逻辑回归算法对客户未来是否逾期交费进行评估预测;
第五步,模型输出
基于逻辑回归算法构建的电费风险防控模型,实现对高压高风险用户的命中率和覆盖率、低压非居高风险用户的命中率和覆盖率及低压居民高风险用户统计评估。
2.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第一步,数据信息具体如下:
基本属性数据:客户户号、户名、客户分类、用电类别、行业分类、容量、催费短信是否订阅;
交费行为数据:电费发行日、实收日期、应收电费、交费截止日、违约金起算日、实收电费、交费方式;
用电行为数据:违约用电历史记录、不法窃电历史记录、用电量历史记录、信用评价历史记录;
关联信息数据:第三方信用信息、行业前景评价、生产经营状况、突发事件。
3.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第二步,
(1)客户户号ID的唯一性检验:建模训练基础数据集中,每个客户为一条观测数据,因此每个户号ID变量应该仅出现一次,否则需要核查原因,调整数据;
(2)范围和取值检验:建模训练数据集中使用的每个变量都应该来自一个定义清晰、具有已知的或预期取值范围的字段;连续变量的值应该在一定的预期范围内,而名义变量应取维表中的值;
(3)缺失值检验:识别建模训练数据集中每个字段的缺失值及其来源是完整性检验中的基本步骤;缺失值的产生可能是失误的结果,也可能是因为制定的字段没有被定义;
(4)异常值、离群值检验:异常值是指明显偏离数据集的观测值,如过大、过小、负值数据;异常值可能是由于记录错误引起的,也可能是真实数据;因此要检验异常值出现的原因,并相应的处理异常值;离群值被定义为某个变量平均值正负3个标准差以外的数值。
4.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第三步,
(1)离群值、异常值的处理方法
当出现以上情况时,离群值可用3个标准差的最大值或最小值替换,将离群值调整为距离最近的正常值;异常值要检验异常值出现的原因,并相应的处理异常值;如果离群值或异常值没有业务含义,可直接剔除离群值或异常值或用空值NULL来替代离群值或异常值;
(2)缺失值的处理方法
将缺失值调整为某个固定值;如均值、中间值或一个指定的常数或将缺失值调整为一个服从正态分布的随机值;
(3)按户进行数据整合
对于一个客户一笔应收电费存在多个电费、罚金记录的,按客户编号按应收电费标识汇总合并;对于一个客户一笔应收电费存在多个实收日的,保留该应收电费最后一次实收日;
(4)相关衍生变量的生成
衍生变量是服务模型建设的变量,基于数理分析中心数据处理模块的变量计算功能生成与电费风险防控主题相关的各衍生变量。
5.如权利要求1-4任一所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述步骤四,
客户信用指标设计
信用风险是客户未能履行约定义务而造成经济损失的风险;信用越高则欠费风险概率越低,反之则越高;客户信用是电费风险评估模型的首要指标,客户信用指标具体包括客户信用评价得分和客户信用变化趋势;
指标考察期与评价规则设计:客户信用评价得分指标是对信用历史表现情况的综合评价,欠费风险概率预测对本期信用评价结果最为敏感,故该指标的考察期设置为本期即当前月份;信用变化趋势指标通过增长、平稳、波动和下降来考察客户近六个月信用评价得分的变化情况,并分别赋值为1,0,-1和-2。
6.如权利要求5所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述步骤四,
用电趋势指标设计
用电趋势是客户在用电行为方面的趋势动向;用电平稳或者趋好则欠费风险概率越低,反之则越高;用电趋势是影响电费风险评估的重要指标,用电趋势主要包括现金交费次数占比、用电量变化趋势、容量变化趋势指标;
指标考察期与评价规则设计:考察期较短可能受到偶然因素或生产周期的影响,较长则时效性不足,综合来看,现金交费次数占比、用电量变化趋势和容量变化趋势指标的考察期设置为6个月是比较合适的;现金交费次数占比为0到100%之间的比例值,用电量变化趋势和容量变化趋势则通过增长、平稳、波动和下降来考察客户近六个月的生产经营状况,并分别赋值为1,0,-1和-2。
7.如权利要求6所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述步骤四,
行业景气指数和突发事件指标设计
用采购经理指数来代替行业景气度;突发事件是指突然发生的可能会对台区、行业或客户群的用电造成重大影响的社会事件,如果发生,需直接提升欠费风险等级;
指标考察期与评价规则设计:行业景气度和突发事件均具有时效性,考察期设置为本期即当前月份,行业景气度变化趋势考察期设置为近6个月;采购经理指数PMI高于50,表明该行业经济状态趋于上升或改善,欠费风险概率越低;反之,采购经理指数PMI低于50,表明该行业经济状况处于下降或恶化,欠费风险概率越高。
9.如权利要求8所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第五步,
计算输出事实风险客户与潜在风险客户,并分别给予“高风险”、“中风险”、“低风险”三级电费风险识别标签,推送到营销业务系统中,支撑开展电费风险防控闭环管理工作机制及差异化欠缴催收措施研究工作,从而主动应对电费回收风险。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911177990.5A CN111126776A (zh) | 2019-11-26 | 2019-11-26 | 一种基于逻辑回归算法的电费风险防控模型构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911177990.5A CN111126776A (zh) | 2019-11-26 | 2019-11-26 | 一种基于逻辑回归算法的电费风险防控模型构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111126776A true CN111126776A (zh) | 2020-05-08 |
Family
ID=70496776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911177990.5A Pending CN111126776A (zh) | 2019-11-26 | 2019-11-26 | 一种基于逻辑回归算法的电费风险防控模型构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111126776A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178690A (zh) * | 2019-12-11 | 2020-05-19 | 国网重庆市电力公司北碚供电分公司 | 基于风控评分卡模型的用电客户窃电风险评估方法 |
CN111639883A (zh) * | 2020-06-15 | 2020-09-08 | 江苏电力信息技术有限公司 | 一种基于机器学习的电费回收风险预测方法 |
CN111882833A (zh) * | 2020-07-21 | 2020-11-03 | 华润电力唐山丰润有限公司 | 基于离群参数的设备故障预警方法、装置、设备及介质 |
CN112488421A (zh) * | 2020-12-15 | 2021-03-12 | 国网雄安金融科技集团有限公司 | 一种电费应收账款的跟踪预测方法及装置 |
CN112541662A (zh) * | 2020-12-02 | 2021-03-23 | 国网安徽省电力有限公司 | 一种电费回收风险的预测方法及系统 |
CN112634023A (zh) * | 2020-12-28 | 2021-04-09 | 四川新网银行股份有限公司 | 一种用于群体性风险监测的早期预警系统及方法 |
CN113487448A (zh) * | 2021-05-31 | 2021-10-08 | 国网上海市电力公司 | 一种基于电力大数据的电力信用标签化方法及系统 |
CN113590677A (zh) * | 2021-07-14 | 2021-11-02 | 上海淇玥信息技术有限公司 | 一种数据处理方法、装置和电子设备 |
CN113610409A (zh) * | 2021-08-12 | 2021-11-05 | 北京中电普华信息技术有限公司 | 一种电费回收风险预警方法及装置 |
CN113743816A (zh) * | 2021-09-13 | 2021-12-03 | 一汽出行科技有限公司 | 车辆租赁的风险控制方法、装置、计算机设备及存储介质 |
CN115496304A (zh) * | 2022-11-16 | 2022-12-20 | 国网江苏省电力有限公司营销服务中心 | 一种代理购电量预测算法的立体综合评价方法及系统 |
CN116645014A (zh) * | 2023-07-27 | 2023-08-25 | 湖南华菱电子商务有限公司 | 一种基于人工智能的供应商供应数据模型构建方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105139150A (zh) * | 2015-09-25 | 2015-12-09 | 国网山东省电力公司枣庄供电公司 | 一种交费大数据的用户电费风险评估系统 |
CN105760937A (zh) * | 2016-03-18 | 2016-07-13 | 广州铭诚计算机科技有限公司 | 一种基于大数据的电网用户电费回收模型构建方法 |
CN106251049A (zh) * | 2016-07-25 | 2016-12-21 | 国网浙江省电力公司宁波供电公司 | 一种大数据的电费风险模型构建方法 |
CN106600455A (zh) * | 2016-11-25 | 2017-04-26 | 国网河南省电力公司电力科学研究院 | 一种基于逻辑回归的电费敏感度评估方法 |
CN106780140A (zh) * | 2016-12-15 | 2017-05-31 | 国网浙江省电力公司 | 基于大数据的电力信用评价方法 |
CN106920110A (zh) * | 2017-02-23 | 2017-07-04 | 国网安徽省电力公司合肥供电公司 | 一种电力客户信用和欠费风险的评价方法 |
-
2019
- 2019-11-26 CN CN201911177990.5A patent/CN111126776A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105139150A (zh) * | 2015-09-25 | 2015-12-09 | 国网山东省电力公司枣庄供电公司 | 一种交费大数据的用户电费风险评估系统 |
CN105760937A (zh) * | 2016-03-18 | 2016-07-13 | 广州铭诚计算机科技有限公司 | 一种基于大数据的电网用户电费回收模型构建方法 |
CN106251049A (zh) * | 2016-07-25 | 2016-12-21 | 国网浙江省电力公司宁波供电公司 | 一种大数据的电费风险模型构建方法 |
CN106600455A (zh) * | 2016-11-25 | 2017-04-26 | 国网河南省电力公司电力科学研究院 | 一种基于逻辑回归的电费敏感度评估方法 |
CN106780140A (zh) * | 2016-12-15 | 2017-05-31 | 国网浙江省电力公司 | 基于大数据的电力信用评价方法 |
CN106920110A (zh) * | 2017-02-23 | 2017-07-04 | 国网安徽省电力公司合肥供电公司 | 一种电力客户信用和欠费风险的评价方法 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178690A (zh) * | 2019-12-11 | 2020-05-19 | 国网重庆市电力公司北碚供电分公司 | 基于风控评分卡模型的用电客户窃电风险评估方法 |
CN111639883A (zh) * | 2020-06-15 | 2020-09-08 | 江苏电力信息技术有限公司 | 一种基于机器学习的电费回收风险预测方法 |
CN111882833A (zh) * | 2020-07-21 | 2020-11-03 | 华润电力唐山丰润有限公司 | 基于离群参数的设备故障预警方法、装置、设备及介质 |
CN112541662A (zh) * | 2020-12-02 | 2021-03-23 | 国网安徽省电力有限公司 | 一种电费回收风险的预测方法及系统 |
CN112541662B (zh) * | 2020-12-02 | 2024-01-12 | 国网安徽省电力有限公司 | 一种电费回收风险的预测方法及系统 |
CN112488421A (zh) * | 2020-12-15 | 2021-03-12 | 国网雄安金融科技集团有限公司 | 一种电费应收账款的跟踪预测方法及装置 |
CN112488421B (zh) * | 2020-12-15 | 2023-04-28 | 国网雄安金融科技集团有限公司 | 一种电费应收账款的跟踪预测方法及装置 |
CN112634023B (zh) * | 2020-12-28 | 2022-09-09 | 四川新网银行股份有限公司 | 一种用于群体性风险监测的早期预警系统及方法 |
CN112634023A (zh) * | 2020-12-28 | 2021-04-09 | 四川新网银行股份有限公司 | 一种用于群体性风险监测的早期预警系统及方法 |
CN113487448A (zh) * | 2021-05-31 | 2021-10-08 | 国网上海市电力公司 | 一种基于电力大数据的电力信用标签化方法及系统 |
CN113590677A (zh) * | 2021-07-14 | 2021-11-02 | 上海淇玥信息技术有限公司 | 一种数据处理方法、装置和电子设备 |
CN113610409A (zh) * | 2021-08-12 | 2021-11-05 | 北京中电普华信息技术有限公司 | 一种电费回收风险预警方法及装置 |
CN113743816A (zh) * | 2021-09-13 | 2021-12-03 | 一汽出行科技有限公司 | 车辆租赁的风险控制方法、装置、计算机设备及存储介质 |
CN115496304A (zh) * | 2022-11-16 | 2022-12-20 | 国网江苏省电力有限公司营销服务中心 | 一种代理购电量预测算法的立体综合评价方法及系统 |
CN116645014A (zh) * | 2023-07-27 | 2023-08-25 | 湖南华菱电子商务有限公司 | 一种基于人工智能的供应商供应数据模型构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126776A (zh) | 一种基于逻辑回归算法的电费风险防控模型构建方法 | |
US11398000B2 (en) | Methods and systems for machine-learning for prediction of grid carbon emissions | |
CN106651424B (zh) | 基于大数据技术的电力用户画像建立与分析方法 | |
CN106780140B (zh) | 基于大数据的电力信用评价方法 | |
CN111754116B (zh) | 一种基于标签画像技术的信用评估方法及装置 | |
Ping | Data mining and XBRL integration in management accounting information based on artificial intelligence | |
CN111353792A (zh) | 一种可视化展现与数据分析的客户画像系统 | |
CN116681187B (zh) | 一种基于企业经营数据的企业碳配额预测方法 | |
CN112116256A (zh) | 一种数据资产管理方法 | |
CN113434575B (zh) | 基于数据仓库的数据归因处理方法、装置及存储介质 | |
CN116681450B (zh) | 一种支撑智能催费的客户信用评价方法及系统 | |
CN108304990B (zh) | 一种停电敏感预判方法和系统 | |
Andrejovská et al. | TAX GAP AS A TOOL FOR MEASURING VAT EVASION IN THE EU COUNTRIES. | |
CN112766814A (zh) | 一种信用风险压力测试模型的训练方法、装置及设备 | |
Ayertey et al. | The impact of increase in block pricing on electricity demand responsiveness: Evidence from Ghana | |
Xie et al. | A big data technique for internet financial risk control | |
Zhang et al. | Two-stage characteristic recognition of demand side resource for load aggregator based on bias-SVD matrix factorization and Bayesian inference | |
CN110826931A (zh) | 一种用户侧分布式储能经济性评估系统 | |
Zhang et al. | Recycling channel selection and financing strategy for capital-constrained retailers in a two-period, closed-loop supply chain | |
CN115601124A (zh) | 一种基于区块链的贷后司法管理系统 | |
Han et al. | Optimal operations of energy storage systems in multi‐application scenarios of grid ancillary services based on electricity price forecasting | |
CN112633628A (zh) | 碳约束条件下煤电ccus改造项目经济可行性评估方法及系统 | |
Zhu et al. | Internal control, cloud accounting platform and administrative management: A case study ofchina's quzhou investment bureau | |
Hu et al. | Evaluation on Arrear Electricity Charges Based on Multi-attribute Group Decision Making Considering User Payment and Abnormal Electricity Consumption | |
CN113723775B (zh) | 一种基于电力大数据的企业及行业运营风险的评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200508 |