CN108304990A - 一种停电敏感预判方法和系统 - Google Patents
一种停电敏感预判方法和系统 Download PDFInfo
- Publication number
- CN108304990A CN108304990A CN201711444284.3A CN201711444284A CN108304990A CN 108304990 A CN108304990 A CN 108304990A CN 201711444284 A CN201711444284 A CN 201711444284A CN 108304990 A CN108304990 A CN 108304990A
- Authority
- CN
- China
- Prior art keywords
- user
- power failure
- user group
- power
- sensitive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013145 classification model Methods 0.000 claims abstract description 29
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 238000013480 data collection Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 71
- 230000005611 electricity Effects 0.000 claims description 21
- 230000035945 sensitivity Effects 0.000 claims description 16
- 230000003542 behavioural effect Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000012916 structural analysis Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000002262 irrigation Effects 0.000 description 2
- 238000003973 irrigation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- General Engineering & Computer Science (AREA)
- Water Supply & Treatment (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种停电敏感预判方法。该方法包括:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。通过管理规则和半监督分类模型可以准确判别对停电状况的敏感的用户,从而可以在停电发生时,为采取不同的安抚和引导策略提供参考,减少客户来电风险,树立了电力公司良好的社会形象。
Description
技术领域
本发明涉及电力行业客户管理技术领域,尤其涉及一种停电敏感预判方法和系统。
背景技术
随着社会经济的快速发展,现阶段企业和居民对供电可靠性的要求越来越高,但停电事件还时有发生,电网企业承担了用户连续稳定用电,以及供电安全管理的义务。一旦停电敏感用户发生停电,该类用户会对停电事件产生供电服务不满意的反应,将会影响电网的企业社会形象。
在停电发生时,准确地判别用户对停电事件的敏感程度,为应急响应及差异化服务提供指导依据,提升电网的服务质量,提高用户对电网服务的满意度,就有必要挖掘对停电敏感的用户,合理的安排停电计划。但是,营销系统中并没用统一标识停电敏感用户。于是,为了解决实际业务过程中存在的该问题,就需要对停电敏感进行业务建模与数据挖掘。
发明内容
本发明提供了一种停电敏感预判方法及系统,该方法及系统可以准确地判别对停电状况的敏感的用户。
为实现上述设计,本发明采用以下技术方案:
一方面,提供了一种停电敏感预判方法,包括:
获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;
将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;
根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;
采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。
其中,所述根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,包括:
判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户,其中,所述重要客户为带有停电敏感标签的用户,所述重点关注客户为具有高敏感度停电时段的用户,所述特殊行业客户为对电能质量要求高的用户;
若是,则所述用户属于特殊用户群体;
若否,则所述用户属于非特殊用户群体。
其中,所述采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户,包括:
将所述非特殊用户群体分为训练集用户群体和测试集用户群体;
采用类别标记法对所述训练集用户群体中的用户进行类别标记;
对类别标记后的所述训练集用户群体进行特征选择;
确定特征选择后训练集用户群体的模型变量;
根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型;
通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
其中,所述采用类别标记法对所述训练集用户群体中的用户进行类别标记,包括:
判断所述训练集用户群体中的每一个用户是否为重要客户、部分重点关注客户、部分不能停电客户、近两天内拨打计划停电信息相关热线超过2次的客户、有与计划停电相关投诉工单的客户或历史停电事件发生后存在拨打供电局电话投诉行为的客户;
若是,则对所述用户数据进行标记。
其中,所述对类别标记后的所述训练集用户群体进行特征选择,具体为:
根据历史拨打电话行为特征、停电事件特征和/或用电性质对类别标记后的所述训练集用户群体进行特征选择。
其中,所述对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型,包括:
Step1:按照所述类别标记法对训练集用户群体中的用户进行标记后,得到了有标记样本集S并记作Seeds集,无标记样本集U;
Step2:输入有标记样本集S集分别到初始分类器H1、H2、H3;
Step3:利用S训练H1、H2、H3;
Step4:针对若满足H1(xi)=H2(xi)、H2(xi)=H3(xi)或H1(xi)=H3(xi)(其中H1(xi)、H2(xi)、H3(xi)分别表示分类器H1、H2、H3对无标记样本xi的标记结果),那么便将无标记样本xi及其对应的类别标记H2(xi)添加到S,得到新训练集S;
Step5:继续利用新的S训练H1、H2、H3;
Step6:返回Step4,直到H1、H2、H3不再变化时,得到最终的有标记样本集记作St,执行Step6;
Step7:利用St训练H1、H2、H3中分类效果最好的一个分类器,得到的效果最好的一个分类器即停电敏感模型。
其中,所述获取用户用电相关信息,包括:
确定用户的群体范围;
确定获取用户用电相关信息的时间窗;
确定预判周期,根据所述预判周期确定用于预判的特征数据集;
确定建立用户历史停电情况表所需的原始数据字段;
根据所述群体范围、时间窗、预判周期、特征数据集和原始数据字段建立用户用电相关信息。
其中,所述将所述用户历史停电情况表输入到分析计算平台进行预处理,包括:
根据所述原始字段构造分析计算平台所需的变量;
对所述用户历史停电情况表中所述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值;
消除筛选后的数据的时间序列属性,获得筛选后的数据的具体数值;
对所述具体数值进行区间规范化。
其中,所述对所述具体数值进行区间规范化的公式为:
其中,normalization为特征原始值规范处理结果,initial为特征原始值,min
为该特征的最小值,max为该特征的最大值。
另一方面,提供了一种停电敏感预判系统,包括:
建立单元,用于获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;
预处理单元,用于将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;
划分单元,用于根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;
选出单元,用于采用半监督分类模型从所述非特殊用户群体中选出停电敏感用户。
本发明的有益效果为:本发明的一种停电敏感预判方法,包括:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。通过管理规则和半监督分类模型可以准确判别对停电状况的敏感的用户,从而可以在停电发生时,为采取不同的安抚和引导策略提供参考,减少客户来电风险,树立了电力公司良好的社会形象。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
图1是本发明具体实施方式中提供的一种停电敏感预判方法的第一实施例的方法流程图。
图2是本发明具体实施方式中提供的一种停电敏感预判方法的第二实施例的方法流程图。
图3是本发明具体实施方式中提供的一种停电敏感预判系统的结构方框图。
具体实施方式
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,其是本发明具体实施方式中提供的一种停电敏感预判方法的第一实施例的方法流程图。如图所示,该方法包括:
步骤S101:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表。
从电网客服数据库管理系统中获取用户用电相关信息,其中,用户用电相关信息包括:用户档案信息、客服工单信息、停电通知记录信息、工单用户关联信息和停电事件信息等,根据这些信息建立用户历史停电情况表。
获取用户用电相关信息,包括如下步骤:
1.确定用电用户的群体范围;例如:用电用户的群体为广东电网用户群体、湖南电网用户群体等。
2.确定获取用户用电相关信息的时间窗,即获取用于预判的用户用电相关信息的时间窗;该时间窗可以根据不同的需求设置不同的长度,例如:可以将时间窗设为12个月,从2017年1月—2017年12月。其中,2017年12月的用户数据为已知类别标识的数据,构造训练数据集目标变量;2017年1月—2017年11月的数据已知行为特征数据,构造训练数据集的特征变量。
3.确定预判周期,根据所述预判周期确定用于预判的特征数据集;可以根据不同的需求设置不同长度的预判周期,例如:可以将预判周期设为未来的1个月,为2018年1月。构造用于预判的特征数据集的时间窗为12个月,即2017年1月—2017年12月,则2017年1月—2017年12月内的特征数据即为用于预判的特征数据集。
4.确定建立用户历史停电情况表所需的原始数据字段;其中,原始数据字段包括用户编号、业务类别代码、停电通知记录标识、停电客户明细标识、客服工作单标识、客户诉求标识、来电内容、接通时间、挂机时间、停电实际开始时间、停电实际结束时间等。
5.根据所述群体范围、时间窗、预判周期、特征数据集和原始数据字段建立用户用电相关信息。
步骤S102:将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集。
将所述用户历史停电情况表输入到分析计算平台进行预处理,包括以下步骤:
1.根据所述原始字段构造分析计算平台所需的变量;如下表1所示。
选取总用电用户样本数量为1118092。
表1分析计算平台所需的变量
2.对所述用户历史停电情况表中所述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值。
检查用户历史停电情况表,对表中上述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值,输出数据质量良好的用户历史停电情况表。
3.消除筛选后的数据的时间序列属性,获得筛选后的数据的具体数值。
4.对所述具体数值进行区间规范化。
对3中获得的具体数据进行区间规范化,具体的的公式为:
其中,normalization为特征原始值规范处理结果,initial为特征原始值,min
为该特征的最小值,max为该特征的最大值。
步骤S103:根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户。
管理规则具体为:
1.根据“客户分群标志”识别,判断用户是否为重要客户或重点关注客户;
2.根据“用电类别代码”识别用户的用电类别识别,判断用户是否为特殊行业客户;
3.将重要客户、重点关注客户和特殊行业客户划分为特殊用户群体,其他用户属于非特殊用户群体,并将特殊用户群体定义为停电高敏感用户,在下一个预判周期(如:下一个月或接下来三个月)内标记为“停电高敏感”,直接输入“停电高敏感”标签。
其中,重要客户是在业务上本身就带有停电敏感的标签的用电用户;重点关注客户是具有高敏感度停电时段的用电用户,如:党政机关客户,其工作日的敏感度高于休息日;特殊行业客户是对于电能质量异常高,同时在进行工业生产阶段,具有较高的停电敏感度的用电用户,例如:精密电子加工业客户,渔业养殖、排灌、冷库和茶叶用电客户。
步骤S104:采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。
采用半监督分类模型从非特殊用户群体中找出的停电敏感用户包括停电高敏感用户和停电低敏感用户。
采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户,包括以下步骤:
1.将所述非特殊用户群体分为训练集用户群体和测试集用户群体;
2.采用类别标记法对所述训练集用户群体中的用户进行类别标记。判断所述训练集用户群体中的每一个用户是否为重要客户、部分重点关注客户、部分不能停电客户、近两天内拨打计划停电信息相关热线超过2次的客户、有与计划停电相关投诉工单的客户或历史停电事件发生后存在拨打供电局电话投诉行为的客户;若是,则对所述用户数据进行标记;否则不进行标记。
3.对类别标记后的所述训练集用户群体进行特征选择。
根据历史拨打电话行为特征、停电事件特征和/或用电性质对类别标记后的所述训练集用户群体进行特征选择。其中,历史拨打电话行为特征是指用户过去对于停电事件产生反应行为,包括拨打次数、拨打时长、拨打时间间隔三大类型;停电事件特征是指停电事件发生对用户用电的影响,包括停电时长、停电次数两大类型;用电性质是用户本身的用电属性,包括重要等级、用电类别与行业分类三大类型。
4.确定特征选择后训练集用户群体的模型变量。
通过检验指标相关性,可知指标之间存在指标冗余现象,根据指标相关性去除模型冗余指标。表2、表3和表4为相关系数矩阵。
表2相关系数矩阵(一)
表3相关系数矩阵(二)
表4相关系数矩阵(三)
从以上相关系数矩阵来看,指标之间存在高度相关,因此,需要剔除一些高度相关指标,精简模型输入参数,从而获得最终的模型变量,具体如表5所示。
表5最终的模型变量
指标值 | 指标说明 |
SJ_AVG_MIN_1M | 近一月升级平均拨打时长 |
SJ_AVG_MIN_3M | 近三月月升级平均拨打时长 |
SJ_AVG_MIN_12M | 近一年升级平均拨打时长 |
SJ_TIMES_1M | 近一月升级拨打次数 |
CALL_AVG_MIN_1M | 近一月平均拨打间隔时长 |
SJ_TIMES_3M | 近三月升级拨打次数 |
CALL_AVG_MIN_3M | 近三月平均拨打间隔时长 |
SJ_TIMES_12M | 近一年升级拨打次数 |
CALL_CF_TMS_1M | 近一月重复拨打次数 |
CALL_AVG_MIN_12M | 近一年平均拨打间隔时长 |
CALL_CF_TMS_3M | 近三月重复拨打次数 |
CALL_CF_TMS_12M | 近一年重复拨打次数 |
CALL_NUM_1M | 近一月拨打次数 |
CALL_NUM_12M | 近一年拨打次数 |
CALL_NUM_3M | 近三月拨打次数 |
CALL_AVG_12M | 近一年平均拨打时长 |
CALL_AVG_3M | 近三月平均拨打时长 |
CALL_AVG_1M | 近一月平均拨打时长 |
5.根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型。具体为:
Step1:按照所述类别标记法对训练集用户群体中的用户进行标记后,得到了有标记样本集S并记作Seeds集,无标记样本集U;
Step2:输入有标记样本集S集分别到初始分类器H1、H2、H3;
Step3:利用S训练H1、H2、H3;
Step4:针对若满足H1(xi)=H2(xi)、H2(xi)=H3(xi)或H1(xi)=H3(xi)(其中H1(xi)、H2(xi)、H3(xi)分别表示分类器H1、H2、H3对无标记样本xi的标记结果),那么便将无标记样本xi及其对应的类别标记H2(xi)添加到S,得到新训练集S;
Step5:继续利用新的S训练H1、H2、H3;
Step6:返回Step4,直到H1、H2、H3不再变化时,得到最终的有标记样本集记作St,执行Step6;
Step7:利用St训练H1、H2、H3中分类效果最好的一个分类器,得到的效果最好的一个分类器即停电敏感模型。
7.通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
在训练集用户群体中运行停电敏感模型找出其中的停电敏感用户,输出“停电敏感”标签。
最终综合以上步骤,得到关于投诉风险的预测结果如下表6所示。
表6投诉风险的预测结果
投诉倾向类别 | 停电高敏感 | 停电低敏感 | 停电不敏感 |
用户数量 | 1080 | 3106 | 1113906 |
在使用本发明的方法预测停电风险投诉之前,只能依靠人工查阅用户资料来判断的方法,每个用户大致要花两分钟左右的时间,使用本发明方法之后,可以批量导入数据分析用户停电敏感度,极大的提高了分析效率。
综上所述,本发明的一种停电敏感预判方法,包括:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。通过管理规则和半监督分类模型可以准确判别对停电状况的敏感的用户,从而可以在停电发生时,为采取不同的安抚和引导策略提供参考,减少客户来电风险,树立了电力公司良好的社会形象。
请参考图2,其是本发明具体实施方式中提供的一种停电敏感预判方法的第二实施例的方法流程图。如图所示,该方法包括:
步骤S201:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表。
步骤S202:将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集。
步骤S203:判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户。
根据管理规则判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户。若是,执行步骤S204;若否,执行步骤S205。
其中,所述重要客户为带有停电敏感标签的用户,所述重点关注客户为具有高敏感度停电时段的用户,所述特殊行业客户为对电能质量要求高的用户。重点关注客户包括:医院、数据中心、党政机关、重要政府领导住宅;特殊行业客户包括:精密电子加工业客户、渔业养殖、排灌、冷库、茶叶用电客户。
步骤S204:所述用户属于特殊用户群体,将所述特殊用户群体确定为停电高敏感用户。
步骤S205:所述用户属于非特殊用户群体。
非特殊用户群体为特殊用户群体以外的用电用户群体。
步骤S206:将所述非特殊用户群体分为训练集用户群体和测试集用户群体。
步骤S207:采用类别标记法对所述训练集用户群体中的用户进行类别标记。
步骤S208:对类别标记后的所述训练集用户群体进行特征选择。
步骤S209:确定特征选择后训练集用户群体的模型变量。
步骤S210:根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型。
步骤S211:通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
综上所述,本发明实施例可以在发生停电的情况下,准确地判别用户对停电状况的敏感程度,且极大的提高了分析效率,为及时采取不同的安抚和引导策略提供参考,有效提高用户满意度,减少客户来电风险,树立了电力公司良好的社会形象。
以下为本方案一种停电敏感预判系统的实施例,一种停电敏感预判系统的实施例基于一种停电敏感预判方法的实施例实现,在一种停电敏感预判系统的实施例中未尽的描述,请参考一种停电敏感预判方法的实施例。
请参考图3,其是本发明具体实施方式中提供的一种停电敏感预判系统的结构方框图。如图所示,该系统包括:
建立单元310,用于获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表。
获取用户用电相关信息,包括:
1.确定用户的群体范围;
2.确定获取用户用电相关信息的时间窗;
3.确定预判周期,根据所述预判周期确定用于预判的特征数据集;
4.确定建立用户历史停电情况表所需的原始数据字段;
5.根据所述群体范围、时间窗、预判周期、特征数据集和原始数据字段建立用户用电相关信息。
预处理单元320,用于将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集。
将所述用户历史停电情况表输入到分析计算平台进行预处理,包括:
1.根据所述原始字段构造分析计算平台所需的变量。
2.对所述用户历史停电情况表中所述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值。
3.消除筛选后的数据的时间序列属性,获得筛选后的数据的具体数值。
4.对所述具体数值进行区间规范化。
对所述具体数值进行区间规范化的公式为:
其中,normalization为特征原始值规范处理结果,initial为特征原始值,min
为该特征的最小值,max为该特征的最大值。
划分单元330,用于根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户。
根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,包括:
判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户,其中,所述重要客户为带有停电敏感标签的用户,所述重点关注客户为具有高敏感度停电时段的用户,所述特殊行业客户为对电能质量要求高的用户;
若是,则所述用户属于特殊用户群体;
若否,则所述用户属于非特殊用户群体。
选出单元340,用于采用半监督分类模型从所述非特殊用户群体中选出停电敏感用户。
采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户,包括:
1.将所述非特殊用户群体分为训练集用户群体和测试集用户群体。
2.采用类别标记法对所述训练集用户群体中的用户进行类别标记。
判断所述训练集用户群体中的每一个用户是否为重要客户、部分重点关注客户、部分不能停电客户、近两天内拨打计划停电信息相关热线超过2次的客户、有与计划停电相关投诉工单的客户或历史停电事件发生后存在拨打供电局电话投诉行为的客户;若是,则对所述用户数据进行标记。
3.对类别标记后的所述训练集用户群体进行特征选择。
根据历史拨打电话行为特征、停电事件特征和/或用电性质对类别标记后的所述训练集用户群体进行特征选择。
4.确定特征选择后训练集用户群体的模型变量。
5.根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型。
Step1:按照所述类别标记法对训练集用户群体中的用户进行标记后,得到了有标记样本集S并记作Seeds集,无标记样本集U;
Step2:输入有标记样本集S集分别到初始分类器H1、H2、H3;
Step3:利用S训练H1、H2、H3;
Step4:针对若满足H1(xi)=H2(xi)、H2(xi)=H3(xi)或H1(xi)=H3(xi)(其中H1(xi)、H2(xi)、H3(xi)分别表示分类器H1、H2、H3对无标记样本xi的标记结果),那么便将无标记样本xi及其对应的类别标记H2(xi)添加到S,得到新训练集S;
Step5:继续利用新的S训练H1、H2、H3;
Step6:返回Step4,直到H1、H2、H3不再变化时,得到最终的有标记样本集记作St,执行Step6;
Step7:利用St训练H1、H2、H3中分类效果最好的一个分类器,得到的效果最好的一个分类器即停电敏感模型。
6.通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
综上所述,各单元模块协同工作,建立单元310,用于获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;预处理单元320,用于将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;划分单元330,用于根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;选出单元340,用于采用半监督分类模型从所述非特殊用户群体中选出停电敏感用户。通过管理规则和半监督分类模型可以准确判别对停电状况的敏感的用户,从而可以在停电发生时,为采取不同的安抚和引导策略提供参考,减少客户来电风险,树立了电力公司良好的社会形象。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。
Claims (10)
1.一种停电敏感预判方法,其特征在于,包括:
获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;
将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;
根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;
采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。
2.根据权利要求1所述的停电敏感预判方法,其特征在于,所述根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,包括:
判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户,其中,所述重要客户为带有停电敏感标签的用户,所述重点关注客户为具有高敏感度停电时段的用户,所述特殊行业客户为对电能质量要求高的用户;
若是,则所述用户属于特殊用户群体;
若否,则所述用户属于非特殊用户群体。
3.根据权利要求1所述的停电敏感预判方法,其特征在于,所述采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户,包括:
将所述非特殊用户群体分为训练集用户群体和测试集用户群体;
采用类别标记法对所述训练集用户群体中的用户进行类别标记;
对类别标记后的所述训练集用户群体进行特征选择;
确定特征选择后训练集用户群体的模型变量;
根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型;
通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
4.根据权利要求3所述的停电敏感预判方法,其特征在于,所述采用类别标记法对所述训练集用户群体中的用户进行类别标记,包括:
判断所述训练集用户群体中的每一个用户是否为重要客户、部分重点关注客户、部分不能停电客户、近两天内拨打计划停电信息相关热线超过2次的客户、有与计划停电相关投诉工单的客户或历史停电事件发生后存在拨打供电局电话投诉行为的客户;
若是,则对所述用户数据进行标记。
5.根据权利要求3所述的停电敏感预判方法,其特征在于,所述对类别标记后的所述训练集用户群体进行特征选择,具体为:
根据历史拨打电话行为特征、停电事件特征和/或用电性质对类别标记后的所述训练集用户群体进行特征选择。
6.根据权利要求3所述的停电敏感预判方法,其特征在于,所述根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型,包括:
Step1:按照所述类别标记法对训练集用户群体中的用户进行标记后,得到了有标记样本集S并记作Seeds集,无标记样本集U;
Step2:输入有标记样本集S集分别到初始分类器H1、H2、H3;
Step3:利用S训练H1、H2、H3;
Step4:针对若满足H1(xi)=H2(xi)、H2(xi)=H3(xi)或H1(xi)=H3(xi)(其中H1(xi)、H2(xi)、H3(xi)分别表示分类器H1、H2、H3对无标记样本xi的标记结果),那么便将无标记样本xi及其对应的类别标记H2(xi)添加到S,得到新训练集S;
Step5:继续利用新的S训练H1、H2、H3;
Step6:返回Step4,直到H1、H2、H3不再变化时,得到最终的有标记样本集记作St,执行Step6;
Step7:利用St训练H1、H2、H3中分类效果最好的一个分类器,得到的效果最好的一个分类器即停电敏感模型。
7.根据权利要求1所述的停电敏感预判方法,其特征在于,所述获取用户用电相关信息,包括:
确定用电用户的群体范围;
确定获取用户用电相关信息的时间窗;
确定预判周期,根据所述预判周期确定用于预判的特征数据集;
确定建立用户历史停电情况表所需的原始数据字段;
根据所述群体范围、时间窗、预判周期、特征数据集和原始数据字段建立用户用电相关信息。
8.根据权利要求7所述的停电敏感预判方法,其特征在于,所述将所述用户历史停电情况表输入到分析计算平台进行预处理,包括:
根据所述原始字段构造分析计算平台所需的变量;
对所述用户历史停电情况表中所述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值;
消除筛选后的数据的时间序列属性,获得筛选后的数据的具体数值;
对所述具体数值进行区间规范化。
9.根据权利要求8所述的停电敏感预判方法,其特征在于,所述对所述具体数值进行区间规范化的公式为:
其中,normalization为特征原始值规范处理结果,initial为特征原始值,min为该特征的最小值,max为该特征的最大值。
10.一种停电敏感预判系统,其特征在于,包括:
建立单元,用于获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;
预处理单元,用于将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;
划分单元,用于根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;
选出单元,用于采用半监督分类模型从所述非特殊用户群体中选出停电敏感用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711444284.3A CN108304990B (zh) | 2017-12-27 | 2017-12-27 | 一种停电敏感预判方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711444284.3A CN108304990B (zh) | 2017-12-27 | 2017-12-27 | 一种停电敏感预判方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108304990A true CN108304990A (zh) | 2018-07-20 |
CN108304990B CN108304990B (zh) | 2021-10-19 |
Family
ID=62867814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711444284.3A Active CN108304990B (zh) | 2017-12-27 | 2017-12-27 | 一种停电敏感预判方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108304990B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934469A (zh) * | 2019-02-25 | 2019-06-25 | 国网河南省电力公司电力科学研究院 | 基于异源交叉回归分析的停电敏感度预警方法及装置 |
CN110598933A (zh) * | 2019-09-16 | 2019-12-20 | 广东电网有限责任公司 | 一种停电敏感用户管理方法、系统及相关组件 |
CN112418633A (zh) * | 2020-11-17 | 2021-02-26 | 国网冀北电力有限公司计量中心 | 一种基于典型相关分析的停电敏感性相关因素分析方法 |
CN117913830A (zh) * | 2024-03-20 | 2024-04-19 | 中国电建集团昆明勘测设计研究院有限公司 | 一种抽水蓄能电站的资源调度方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364187A (zh) * | 2017-12-20 | 2018-08-03 | 国网冀北电力有限公司承德供电公司 | 一种基于停电敏感特性的停电敏感用户确定方法和系统 |
-
2017
- 2017-12-27 CN CN201711444284.3A patent/CN108304990B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364187A (zh) * | 2017-12-20 | 2018-08-03 | 国网冀北电力有限公司承德供电公司 | 一种基于停电敏感特性的停电敏感用户确定方法和系统 |
Non-Patent Citations (2)
Title |
---|
严宇平等: ""基于数据挖掘技术的客户停电敏感度研究与应用"", 《新技术新工艺》 * |
孙二冬: ""基于半监督学习的客户流失预测及其在物流企业中的应用研究"", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934469A (zh) * | 2019-02-25 | 2019-06-25 | 国网河南省电力公司电力科学研究院 | 基于异源交叉回归分析的停电敏感度预警方法及装置 |
CN110598933A (zh) * | 2019-09-16 | 2019-12-20 | 广东电网有限责任公司 | 一种停电敏感用户管理方法、系统及相关组件 |
CN112418633A (zh) * | 2020-11-17 | 2021-02-26 | 国网冀北电力有限公司计量中心 | 一种基于典型相关分析的停电敏感性相关因素分析方法 |
CN117913830A (zh) * | 2024-03-20 | 2024-04-19 | 中国电建集团昆明勘测设计研究院有限公司 | 一种抽水蓄能电站的资源调度方法和系统 |
CN117913830B (zh) * | 2024-03-20 | 2024-06-04 | 中国电建集团昆明勘测设计研究院有限公司 | 一种抽水蓄能电站的资源调度方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108304990B (zh) | 2021-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304990A (zh) | 一种停电敏感预判方法和系统 | |
CN107818133B (zh) | 一种基于大数据的居民区网络能力分析方法及系统 | |
US10318894B2 (en) | Conformance authority reconciliation | |
CN107908631A (zh) | 数据处理方法、装置、存储介质和计算机设备 | |
CN110020777A (zh) | 一种电力客户业务工单处理系统和方法 | |
CN110266510B (zh) | 网络控制策略生成方法及装置、网络控制方法、存储介质 | |
CN109523276A (zh) | 用户投诉的预警监控方法及装置 | |
CN111539563A (zh) | 一种用能安全状态预测方法、装置、服务器及存储介质 | |
CN104599338A (zh) | 一种基于云计算的考勤管理系统 | |
CN113064936B (zh) | 一种用户画像方法及其系统、存储介质 | |
CA2648611C (en) | Data management system | |
CN114119111A (zh) | 基于大数据的电力交易用户管理方法、装置、设备及介质 | |
CN110909129B (zh) | 异常投诉事件的识别方法及装置 | |
CN110428513A (zh) | 考勤处理方法、装置、电子设备及存储介质 | |
WO2019080424A1 (zh) | 客户迁徙方法、系统、计算机设备及存储介质 | |
CN110689219A (zh) | 基于大数据的用户行为评价展示方法、装置、设备及介质 | |
CN115617670A (zh) | 软件测试管理方法、存储介质及系统 | |
CN109491970A (zh) | 面向云存储的不良图片检测方法、装置及存储介质 | |
CN114721945A (zh) | 基于图数据库的分配方法及其装置、电子设备及存储介质 | |
CN115696247A (zh) | 异常通信模式识别方法、装置、终端设备以及存储介质 | |
CN106600129A (zh) | 一种电网规划方法和系统 | |
CN106771811B (zh) | 一种电力营销错接线排查方法与装置 | |
CN114155038B (zh) | 受疫情影响用户识别方法 | |
CN116566737B (zh) | 基于SaaS平台的权限配置方法、装置及相关设备 | |
CN108764625A (zh) | 财务分析装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |