CN106934493B - 一种电力客户价值评估模型的构建方法 - Google Patents

一种电力客户价值评估模型的构建方法 Download PDF

Info

Publication number
CN106934493B
CN106934493B CN201710110596.4A CN201710110596A CN106934493B CN 106934493 B CN106934493 B CN 106934493B CN 201710110596 A CN201710110596 A CN 201710110596A CN 106934493 B CN106934493 B CN 106934493B
Authority
CN
China
Prior art keywords
decision tree
constructing
value
user
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710110596.4A
Other languages
English (en)
Other versions
CN106934493A (zh
Inventor
付薇薇
黄彪
谢永红
张德政
刘靓钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN201710110596.4A priority Critical patent/CN106934493B/zh
Publication of CN106934493A publication Critical patent/CN106934493A/zh
Application granted granted Critical
Publication of CN106934493B publication Critical patent/CN106934493B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种电力客户价值评估模型的构建方法,能够提高客户等级划分的差异性。所述方法包括:确定评价客户当前价值和客户潜在价值的指标体系;根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型。本发明适用于电力系统技术领域。

Description

一种电力客户价值评估模型的构建方法
技术领域
本发明涉及电力系统技术领域,特别是指一种电力客户价值评估模型的构建方法。
背景技术
近年来,电力客户价值评价是供电企业实施差异化服务、实现利益最大化的基础。随着基于大数据挖掘的技术与行业经验逐步地被供电企业吸收利用,供电企业纷纷对现有的营销系统进行深度应用,以系统庞大的客户行为数据为基础,通过数据挖掘方法等方式对客户进行价值评估,所述数据挖掘方法包括神经网络、支持向量机、层次聚类、主成分分析法等。数据挖掘的方法在给客户价值分类时准确度较高,但是不能精准的区分客户等级划分的差异性。
发明内容
本发明要解决的技术问题是提供一种电力客户价值评估模型的构建方法,以解决现有技术所存在的不能精准的区分客户等级划分的差异性的问题。
为解决上述技术问题,本发明实施例提供一种电力客户价值评估模型的构建方法,包括:
确定评价客户当前价值和客户潜在价值的指标体系;
根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;
根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;
根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型。
进一步地,所述评价客户当前价值和潜在价值的指标体系包括:评价客户当前价值的指标体系和评价客户潜在价值的指标体系;
其中,所述评价客户当前价值的指标体系包括:电压等级、当前未拆除变压器容量、高耗能标识、电源数量、最近一年年度电费、当前负荷等级、本年有电费去年无电费中的一种或多种指标;
所述评价客户潜在价值的指标体系包括:电费趋势、最近一年年违约使用电费、最近一年年违约次数、去年年度电费、三方协议签署、连续两年均没有电费中的一种或多种指标。
进一步地,所述电费趋势表示为:
Figure BDA0001234255840000021
进一步地,在构建用户当前价值决策树预测模型之前,所述方法还包括:
对得到的用于构建用户当前价值决策树预测模型的样本集进行预处理,其中,所述预处理包括:填补缺漏的数据值、平滑噪声数据、识别或更替异常值。
进一步地,所述用于构建用户当前价值决策树预测模型的样本集包括:训练集;
所述根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型包括:
S11,根据训练集中的数据,计算评价客户当前价值的指标体系中每个指标的GINI系数,选择GINI系数最小的指标作为决策树的根节点;
S12,若分裂指标是离散型数据,则按照连续型指标的分割阈值,将训练集分成两个子集;
S13,对决策树的根节点的分裂指标对应的两个子集,采用与S11相同的方法递归地建立根节点的子节点,如此循环下去,直至全部子节点中的样本属于同类或没有可以选作分裂指标的指标为止;
S14,对决策树进行减枝操作。
进一步地,所述S12还包括:
若分裂指标是连续型数据,则按照分割后得到的最小GINI系数,将训练集分成两个子集。
进一步地,所述对决策树进行减枝操作包括:
对于某个连续型指标Ac,假设在决策树的某个节点上的训练集S的样本数量为total,对当前节点上的所有样本,由小到大对连续型指标Ac的具体数值进行排序,得到指标值序列{A1c,A2c,...Atotalc};
在指标值序列中生成total-1个分割点,第i(0<i<total)个分割点的取值设置为:Vi=(Aic+A(i+1)c)/2,利用Vi,将当前节点上的训练集划分为S1={s|s∈S,Ac(S)≤Vi}和S2={s|s∈S,Ac(S)≤Vi}两个子集,Ac(S)为样本s在指标Ac上的取值;
计算total-1个分割点的GINI系数,选择GINI系数最小点作为分割点来分割训练集S。
进一步地,在根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型之后,所述方法还包括:
根据构建的用户当前价值决策树预测模型,预测用户的当前价值等级分类结果,基于用户的当前价值等级分类结果,给客户分级别评定客户价值分值;
根据构建的用户潜在价值决策树预测模型,预测用户的潜在价值等级分类结果,基于用户的潜在价值等级分类结果,给客户分级别评定客户价值分值。
进一步地,所述给客户分级别评定客户价值分值包括:
S21,利用向量规范化法,生成规范化决策矩阵Y=(yij)m×n,其中,
Figure BDA0001234255840000031
xij为第i个方案在第j个指标下的指标值,M={1,2,...m}为方案的下标集,N={1,2,...n}为指标的下标集;
S22,生成加权规范化决策矩阵Z=(zij)m×n,其中,zij=ωjyij,i∈M,j∈N,ωj表示第j个指标的权重;
S23,确定正理想解A+和负理想解A-
A+=(z1 +,z2 +...,zn +);A-=(z1 -,z2 -...,zn -)
其中,zj +=maxzij,j∈T1;zj +=minzij,j∈T2
zj -=maxzij,j∈T1;zj -=minzij,j∈T2
其中,T1表示效益型指标,T2表示成本型指标;
S24,评估各方案分别与正负理想解的Euclid距离d+和d-:
Figure BDA0001234255840000041
S25,计算各方案与正理想解的相对贴近度:
Figure BDA0001234255840000042
S26,按照Ci +的值降序排列。
进一步地,在S21之前,所述方法还包括:
对评价客户当前价值和客户潜在价值的指标体系中的指标数据进行归一化处理,使所有指标数据统一在一个量级。
本发明的上述技术方案的有益效果如下:
上述方案中,通过确定评价客户当前价值和客户潜在价值的指标体系;根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型。这样,根据构建的用户当前价值决策树预测模型,预测用户的当前价值等级分类结果;根据构建的用户潜在价值决策树预测模型,预测用户的潜在价值等级分类结果,从而提高客户等级划分的差异性。
附图说明
图1为本发明实施例提供的电力客户价值评估模型的构建方法的流程示意图;
图2为本发明实施例提供的用户当前价值决策树预测模型示意图;
图3为本发明实施例提供的用户潜在价值决策树预测模型示意图;
图4为本发明实施例提供的混合决策树预测模型和TOPSIS算法的客户评分结果示意图;
图5为本发明实施例提供的电力客户价值评估模型的构建方法的详细流程示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的不能精准的区分客户等级划分的差异性的问题,提供一种电力客户价值评估模型的构建方法。
实施例一
参看图1所示,本发明实施例提供的电力客户价值评估模型的构建方法,包括:
S101,确定评价客户当前价值和客户潜在价值的指标体系;
S102,根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;
S103,根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;
S104,根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型。
本发明实施例所述的电力客户价值评估模型的构建方法,通过确定评价客户当前价值和客户潜在价值的指标体系;根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型。这样,根据构建的用户当前价值决策树预测模型,预测用户的当前价值等级分类结果;根据构建的用户潜在价值决策树预测模型,预测用户的潜在价值等级分类结果,从而提高客户等级划分的差异性。
本实施例中,将从客户当前价值和客户潜在价值2方面构建评价客户当前价值和客户潜在价值的指标体系,所述评价客户当前价值和潜在价值的指标体系包括:评价客户当前价值的指标体系和评价客户潜在价值的指标体系。
本实施例中,评价客户当前价值时,考虑到客户电压等级和当前未拆除变压器容量都对用电量有线性同比增加的影响,而客户电费对当前价值有直接影响,电量一般与电费成正比,所以只分析电费指标;所述评价客户当前价值的指标体系包括:电压等级、当前未拆除变压器容量、高耗能标识、电源数量、最近一年年度电费、当前负荷等级、本年有电费去年无电费中的一种或多种指标。
本实施例中,在评价客户潜在价值时,根据价值划分理论,将可能为供电公司带来潜在可能收入或是可能损失的指标:电费趋势、最近一年年违约使用电费、最近一年年违约次数、去年年度电费、三方协议签署、连续两年均没有电费作为客户潜在价值评价的指标;也就说,所述评价客户潜在价值的指标体系包括:电费趋势、最近一年年违约使用电费、最近一年年违约次数、去年年度电费、三方协议签署、连续两年均没有电费中的一种或多种指标。
本实施例中,所述电费趋势表示为:
Figure BDA0001234255840000061
本实施例中,所述根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据包括:
根据不同的指标体系(评价客户当前价值的指标体系和评价客户潜在价值的指标体系)从营销系统中抽取不同的客户数据。
本实施例中,为了方法的可实现性,人工标注以数据量多和标注结果简化为特点,以求能快速巨量的获取专家标注结果,用以学习内部规律。因此本实施例在标注时不同于普通人工标注打出高低分的方式,而是基于专家标注的客户价值的优、良、中、差等级代替打高低分的方式,生成用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集。
本实施例中,接着对用于构建用户当前价值决策树预测模型的样本集的数据和用于构建用户潜在价值决策树预测模型的样本集中的数据进行预处理,以及解决不一致问题,其中,所述预处理包括:填补缺漏的数据值、平滑噪声数据、识别或更替异常值;具体的,将字段空缺、数据错误的指标从指标库中删除;缺漏的数据值、噪声数据、异常值用数据中位数值代替;遇到有些指标时间周期不适用情况,以平均数补足。
本实施例中,根据不同的指标体系(评价客户当前价值的指标体系和评价客户潜在价值的指标体系)从营销系统中抽取最近一年的数据(2015年6月到2016年6月),去年的数据(2014年6月到2015年6月),如表1和表2所示。
表1客户当前价值各项指标的数据描述
Figure BDA0001234255840000071
表2客户潜在价值各项指标的数据描述
Figure BDA0001234255840000081
本实施例中,从抽取的数据中发现与分析目标无关数据、空数据或NA值(因为有的用户没有用电记录却没有注销账户),并将空值整条删除且NA值替换成0。
本实施例中,将预处理后的两套数据按照价值等级分为4类,分别是优、良、中、差,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集,每套样本集都包括:测试集和训练集。以用于构建用户当前价值决策树预测模型的样本集为例,根据不同的价值等级分类以行向量为单位分层随机抽取3/4的数据作为训练集,剩下1/4数据去除价值等级指标作为测试集。
以这种方法,实验得到:当前价值和潜在价值都有1575条数据的训练集和525条数据的测试集,并且两种价值模型的训练集与测试集各不相同。
本实施例中,构建用户当前价值决策树预测模型和构建用户潜在价值决策树预测模型的方法类似,因此,以构建用户当前价值决策树预测模型为例进行说明,为了构建用户当前价值决策树预测模型,需计算评价客户当前价值的指标体系中所有指标的基尼(GINI)系数,根据指标的连续性和GINI系数选取合适的分割阈值,将训练集分成两个子集,对分割后的两个子集继续用上一步的方法取分割阈值划分指标,直到所有的样本都有一个分类结果,所述构建用户当前价值决策树预测模型的具体步骤可以包括:
步骤1、根据用于构建用户当前价值决策树预测模型的训练集(在步骤1、2、3、4中,简称训练集)中的数据,对评价客户当前价值的指标体系中的每一个指标,利用分类回归树(Classification And Regression Tree,CART)算法计算该指标上不同分割方法的GINI系数,选择GINI系数最小的指标作为分裂的根节点。然后比较所有候选指标上最小划分的GINI系数,拥有最小划分的GINI系数的指标成为根节点。
GINI系数的生成方法:
(1)训练集的GINI系数为:gini(T)=1-∑pj 2,其中,pj是分类j会出现在T中的概率,T是指在这种节点分配下的指标集。
(2)若T被划分为T1、T2,那么本次分类的GINI系数为:
Figure BDA0001234255840000091
其中S是T样本的数量,|S1|,|S2|分别是T1,T2中样本的个数;
步骤2、若分裂指标是离散型数据,如三方协议的签署情况,则按照连续型指标的分割阈值,将训练集分成两个子集;
若分裂指标是连续型数据,则按照分割后得到的最小GINI系数,将训练集分成两个子集。
步骤3、对决策树的根节点的分裂指标对应的两个子集,采用与步骤1相同的方法递归地建立根节点的子节点,如此循环下去,直至全部子节点中的样本属于同类或没有可以选作分裂指标的指标为止;
步骤4、对决策树进行减枝操作。对于某个连续型指标Ac,假设在某个节点上的样本集S的样本数量为total,CART算法将对该连续型指标作如下处理:
(1)对当前节点上的所有样本,由小到大对连续型指标Ac的具体数值排序,得到指标值序列{A1c,A2c,...Atotalc};
(2)在指标值序列中生成total-1个分割点,第i(0<i<total)个分割点的取值设置为:Vi=(Aic+A(i+1)c)/2,Vi可以将节点上的样本集划分为S1={s|s∈S,Ac(S)≤Vi}和S2={s|s∈S,Ac(S)≤Vi}两个子集,Ac(S)为样本s在指标Ac上的取值;
(3)计算total-1个分割点的GINI系数,依旧选择GINI系数最小点作为分割点来来分割训练集S。
在前述电力客户价值评估模型的构建方法的具体实施方式中,进一步地,所述对决策树进行减枝操作包括:
对于某个连续型指标Ac,假设在决策树的某个节点上的训练集S的样本数量为total,对当前节点上的所有样本,由小到大对连续型指标Ac的具体数值进行排序,得到指标值序列{A1c,A2c,...Atotalc};
在指标值序列中生成total-1个分割点,第i(0<i<total)个分割点的取值设置为:Vi=(Aic+A(i+1)c)/2,利用Vi,将当前节点上的训练集划分为S1={s|s∈S,Ac(S)≤Vi}和S2={s|s∈S,Ac(S)≤Vi}两个子集,Ac(S)为样本s在指标Ac上的取值;
计算total-1个分割点的GINI系数,选择GINI系数最小点作为分割点来分割训练集S。
本实施例中,构建得到的用户当前价值决策树预测模型和用户潜在价值决策树预测模型分别如图2和图3所示。将相应的测试集数据输入训练好的预测模型中,得到测试集每个客户向量的价值等级分类结果。测试集数据输入用户当前价值决策树预测模型和用户潜在价值决策树预测模型后生成的结果与真实结果对比,得到预测价值等级与实际专家标注价值等级的混淆矩阵,如表3所示,表3的左部分是用户当前价值决策树预测模型性能评价混淆矩阵表,表3的右部分是用户潜在价值决策树预测模型性能评价混淆矩阵表,可以看到各按照当前价值和潜在价值的不同等级抽取的共525个客户的用户当前价值预测正确率为96.00%,潜在价值预测准确率为94.10%,混淆矩阵的结果显示,构建的用户当前价值决策树预测模型和用户潜在价值决策树预测模型,能较为准确的模仿专家思路预测价值等级。
表3混淆矩阵表
Figure BDA0001234255840000111
将电力客户数据输入训练好的预测模型中,能够得到这些客户价值等级的预测结果,如表4所示。
表4客户价值等级预测结果
当前价值 8680 3246 1003 1397
潜在价值 5711 3061 3598 1956
实施例二
参看图5所示,本发明实施例提供的电力客户价值评估模型的构建方法,包括:
S101,确定评价客户当前价值和客户潜在价值的指标体系;
S102,根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;
S103,根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;
S104,根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型;
S105,根据构建的用户当前价值决策树预测模型,预测用户的当前价值等级分类结果,基于用户的当前价值等级分类结果,给客户分级别评定客户价值分值;根据构建的用户潜在价值决策树预测模型,预测用户的潜在价值等级分类结果,基于用户的潜在价值等级分类结果,给客户分级别评定客户价值分值。
本实施例中,为了保留用户当前价值决策树预测模型和用户潜在价值决策树预测模型的等级预测结果,将客户按照优、良、中、差四个等级分开评分,这样既保证了等级的有效性,同时完成客户价值的进一步评分。
本实施例中,可以采用逼近理想解排序法(TOPSIS)方法给客户分级别评定客户价值分值,TOPSIS借助离正负理想解的距离来对评价的对象进行评价。正理想解是虚拟的最优解,其各个指标均为对象中的最优值;负理想解是虚拟的最差解,其各个指标值都达到对象中的最差值。如果评判对象离最优解最近同时又最远离最差解,则为最好;否则为最差。
本实施例中,用户的指标数据有的量级很大不利于折算最终得分,因此在采用TOPSIS方法给客户分级别评定客户价值分值之前,需对指标数据进行归一化,将所有指标数据统一在一个量级。数值型指标可以直接套用归一化公式预处理;离散性指标,例如,三方协议签署,由于只有两个值0、1不需要预处理;字符型指标,例如,当前负荷等级,需转换成对应的数值1、2、3之后进行归一化处理;并利用公式:yi=(xi-xmin)/(xmax-xmin)对专家标注客户等级的标签做归一化处理,免去量级的影响,其中,xi、yi分别表示处理前后的指标项,xmin表示该项指标的最小值,xmax表示该项指标的最大值。
本实施例中,TOPSIS打分使用的权重由业务专家给出:例如,电压等级的权重为2;当前未拆除变压器容量的权重为3;电源数量的权重为2;年度电量的权重为8;最近一年年度电费的权重为8;当前负荷等级的权重为2;电费趋势的权重为4;电量趋势的权重为4;最近一年年违约使用电费的权重为-3;去年年度电费的权重为5;三方协议签署的权重为4。
TOPSIS可以根据指标的权重,相关性给客户打分,实现客户价值的进一步评估。将没有专家标记的剩余客户数据预处理后,分别输入用户当前价值决策树预测模型和用户潜在价值决策树预测模型,得到客户价值等级的优、良、中、差分类,以客户当前价值为例,对不同等级的客户:
设多指标决策问题的方案集为A={A1,A2,...Am},指标集为F={f1,f2,...fn},决策矩阵X=(xij)m×n,其中xij为第i个方案在第j个指标下的指标值,i∈M,j∈N,M={1,2,...m}为方案的下标集,N={1,2,...n}为指标的下标集,规定xij≥0,指标的权向量为ω=(ω12,...ωn),权向量ω中的元素是专家给出的权重经过归一化后得到的,权向量ω满足
Figure BDA0001234255840000131
本实施例中,m等于2,n等于13,分别对应当前价值、潜在价值和13项三级指标。
本实施例中,采用TOPSIS方法给客户分级别评定客户价值分值的具体步骤可以包括:
步骤一:用向量规范化法,生成规范化决策矩阵Y=(yij)m×n,其中,
Figure BDA0001234255840000132
xij为第i个方案在第j个指标下的指标值,M={1,2,...m}为方案的下标集,N={1,2,...n}为指标的下标集;
步骤二:生成加权规范化决策矩阵Z=(zij)m×n,其中,zij=ωjyij,i∈M,j∈N,ωj表示第j个指标的权重;权重ωj由专家给出;
步骤三:确定正理想解A+和负理想解A-
A+=(z1 +,z2 +...,zn +);A-=(z1 -,z2 -...,zn -)
其中,zj +=maxzij,j∈T1;zj +=minzij,j∈T2;zj -=maxzij,j∈T1;zj -=minzij,j∈T2
其中,T1代表效益型指标,就是指标值越大越好,T2代表成本型指标,就是指标值越小越好;
步骤四:评估各方案分别与正负理想解的欧式距离(Euclid)d+和d-
Figure BDA0001234255840000133
步骤五:计算各方案与正理想解的相对贴近度:
Figure BDA0001234255840000134
步骤六:按照Ci +的降序排列,Ci +越大其对应的方案越优,排序越靠前,由此得出方案的优劣次序。
本实施例中,对剩余14327名客户价值的最终评分如图4所示。
本发明提出的基于决策树算法和TOPSIS的电力客户价值模型的构建方法,用专家人工打分数据作为学习样本,依据CART构建决策树分类模型,混合TOPSIS方法给客户评定分值,侧重于客户价值的分值细分,进一步提高了客户等级划分的差异性。
本实施例为电力行业的电力客户价值评估模型提出了一种新的思路和方法,考虑客户当前价值和客户潜在价值的指标体系,设计决策树和TOPSIS的结合方式得到客户价值评分,决策树算法能从主观评分中提取一般方法,保留了专家赋权重的优越性,TOPSIS既能对各方案进行整体评判,又能反映各方案内部各因素对评价结果的影响,对用户当前价值决策树预测模型和用户潜在价值决策树预测模型预测分类后的客户数据进一步细化评分,克服了数据挖掘在客户价值评价方面不能精准的给客户价值评分并区分客户等级的差异性的问题,是一种合理有效的评价方法。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种电力客户价值评估模型的构建方法,其特征在于,包括:
确定评价客户当前价值和客户潜在价值的指标体系;其中,所述评价客户当前价值的指标体系包括:电压等级、当前未拆除变压器容量、高耗能标识、电源数量、最近一年年度电费、当前负荷等级、本年有电费去年无电费中的一种或多种指标;所述评价客户潜在价值的指标体系包括:电费趋势、最近一年年违约使用电费、最近一年年违约次数、去年年度电费、三方协议签署、连续两年均没有电费中的一种或多种指标;
根据确定的评价客户当前价值和客户潜在价值的指标体系,获取客户数据;
根据获取的客户数据,对客户当前价值与潜在价值进行分级标注,得到用于构建用户当前价值决策树预测模型的样本集和用于构建用户潜在价值决策树预测模型的样本集;
根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型;
在根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型,根据得到的用于构建用户潜在价值决策树预测模型的样本集,构建用户潜在价值决策树预测模型之后,所述方法还包括:
根据构建的用户当前价值决策树预测模型,预测用户的当前价值等级分类结果,基于用户的当前价值等级分类结果,给客户分级别评定客户价值分值;
根据构建的用户潜在价值决策树预测模型,预测用户的潜在价值等级分类结果,基于用户的潜在价值等级分类结果,给客户分级别评定客户价值分值;
所述给客户分级别评定客户价值分值包括:
利用向量规范化法,生成规范化决策矩阵Y=(yij)m×n,其中,
Figure FDA0002916925320000011
xij为第i个方案在第j个指标下的指标值,M={1,2,...m}为方案的下标集,N={1,2,...n}为指标的下标集;
生成加权规范化决策矩阵Z=(zij)m×n,其中,zij=ωjyij,i∈M,j∈N,ωj表示第j个指标的权重;
确定正理想解A+和负理想解A-
A+=(z1 +,z2 +...,zn +);A-=(z1 -,z2 -...,zn -)
其中,zj +=maxzij,j∈T1;zj +=minzij,j∈T2
zj -=maxzij,j∈T1;zj -=minzij,j∈T2
其中,T1表示效益型指标,T2表示成本型指标;
评估各方案分别与正负理想解的Euclid距离d+和d-:
Figure FDA0002916925320000021
计算各方案与正理想解的相对贴近度:
Figure FDA0002916925320000022
按照Ci +的值降序排列。
2.根据权利要求1所述的电力客户价值评估模型的构建方法,其特征在于,所述电费趋势表示为:
Figure FDA0002916925320000023
3.根据权利要求1所述的电力客户价值评估模型的构建方法,其特征在于,在构建用户当前价值决策树预测模型之前,所述方法还包括:
对得到的用于构建用户当前价值决策树预测模型的样本集进行预处理,其中,所述预处理包括:填补缺漏的数据值、平滑噪声数据、识别或更替异常值。
4.根据权利要求1所述的电力客户价值评估模型的构建方法,其特征在于,所述用于构建用户当前价值决策树预测模型的样本集包括:训练集;
所述根据得到的用于构建用户当前价值决策树预测模型的样本集,构建用户当前价值决策树预测模型包括:
S11,根据训练集中的数据,计算评价客户当前价值的指标体系中每个指标的GINI系数,选择GINI系数最小的指标作为决策树的根节点;
S12,若分裂指标是离散型数据,则按照连续型指标的分割阈值,将训练集分成两个子集;
S13,对决策树的根节点的分裂指标对应的两个子集,采用与S11相同的方法递归地建立根节点的子节点,如此循环下去,直至全部子节点中的样本属于同类或没有可以选作分裂指标的指标为止;
S14,对决策树进行减枝操作。
5.根据权利要求4所述的电力客户价值评估模型的构建方法,其特征在于,所述S12还包括:
若分裂指标是连续型数据,则按照分割后得到的最小GINI系数,将训练集分成两个子集。
6.根据权利要求4所述的电力客户价值评估模型的构建方法,其特征在于,所述对决策树进行减枝操作包括:
对于某个连续型指标Ac,假设在决策树的某个节点上的训练集S的样本数量为total,对当前节点上的所有样本,由小到大对连续型指标Ac的具体数值进行排序,得到指标值序列{A1c,A2c,...Atotalc};
在指标值序列中生成total-1个分割点,第i个分割点的取值设置为:Vi=(Aic+A(i+1)c)/2,其中,0<i<total,利用Vi,将当前节点上的训练集划分为S1={s|s∈S,Ac(S)≤Vi}和S2={s|s∈S,Ac(S)≤Vi}两个子集,Ac(S)为样本s在指标Ac上的取值;
计算total-1个分割点的GINI系数,选择GINI系数最小点作为分割点来分割训练集S。
7.根据权利要求1所述的电力客户价值评估模型的构建方法,其特征在于,在S21之前,所述方法还包括:
对评价客户当前价值和客户潜在价值的指标体系中的指标数据进行归一化处理,使所有指标数据统一在一个量级。
CN201710110596.4A 2017-02-28 2017-02-28 一种电力客户价值评估模型的构建方法 Active CN106934493B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710110596.4A CN106934493B (zh) 2017-02-28 2017-02-28 一种电力客户价值评估模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710110596.4A CN106934493B (zh) 2017-02-28 2017-02-28 一种电力客户价值评估模型的构建方法

Publications (2)

Publication Number Publication Date
CN106934493A CN106934493A (zh) 2017-07-07
CN106934493B true CN106934493B (zh) 2021-04-02

Family

ID=59423199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710110596.4A Active CN106934493B (zh) 2017-02-28 2017-02-28 一种电力客户价值评估模型的构建方法

Country Status (1)

Country Link
CN (1) CN106934493B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609700A (zh) * 2017-09-08 2018-01-19 欧若纳信息科技(苏州)有限公司 一种基于机器学习的客户价值模型优化方法
CN108256923A (zh) * 2018-01-30 2018-07-06 长安大学 一种基于车辆通行特征的etc客户细分方法
CN108664605B (zh) * 2018-05-09 2021-03-09 北京三快在线科技有限公司 一种模型评估方法及系统
CN108829750A (zh) * 2018-05-24 2018-11-16 国信优易数据有限公司 一种数据质量确定系统以及方法
CN108764705A (zh) * 2018-05-24 2018-11-06 国信优易数据有限公司 一种数据质量评估平台以及方法
CN109086290A (zh) * 2018-06-08 2018-12-25 广东万丈金数信息技术股份有限公司 基于多源数据决策树的注册信息真实性判断方法及系统
CN108846583A (zh) * 2018-06-21 2018-11-20 中国联合网络通信集团有限公司 宽带网络投资效益的评估方法及装置
CN110766428A (zh) * 2018-07-25 2020-02-07 国信优易数据有限公司 一种数据价值评估系统以及方法
CN108830663B (zh) * 2018-08-30 2020-10-23 国网河北省电力有限公司沧州供电分公司 电力客户价值评价方法、系统及终端设备
CN109815978A (zh) * 2018-12-18 2019-05-28 全球能源互联网研究院有限公司 样本分级标注及模型训练方法、装置及电子设备
CN110147448A (zh) * 2019-04-29 2019-08-20 上海欣方智能系统有限公司 短信诈骗分类方法及系统
CN113837578B (zh) * 2021-09-15 2024-02-06 江苏兴力工程管理有限公司 一种电力监理企业网格化监督管理评价方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620692A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 一种移动通信业务的客户流失分析方法
CN102136123A (zh) * 2011-03-15 2011-07-27 中国工商银行股份有限公司 一种银行目标客户识别系统
CN102324068A (zh) * 2011-08-31 2012-01-18 广东省电力调度中心 电力二次设备风险评估方法及其系统
CN103150696A (zh) * 2011-12-06 2013-06-12 中兴通讯股份有限公司 选择目标增值业务潜在客户的方法及装置
EP2688015A1 (en) * 2012-07-20 2014-01-22 Tata Consultancy Services Limited Method and system for adaptive forecast of energy resources
CN104933505A (zh) * 2015-04-22 2015-09-23 国家电网公司 一种基于模糊评估的智能配电网群决策评价方法
CN105046402A (zh) * 2015-06-23 2015-11-11 国家电网公司 一种应用于智能变电站二次设备的状态评估方法
CN108306285A (zh) * 2018-01-08 2018-07-20 厦门大学 基于topsis法的含分布式电源的主动配电网可靠性评估方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620692A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 一种移动通信业务的客户流失分析方法
CN102136123A (zh) * 2011-03-15 2011-07-27 中国工商银行股份有限公司 一种银行目标客户识别系统
CN102324068A (zh) * 2011-08-31 2012-01-18 广东省电力调度中心 电力二次设备风险评估方法及其系统
CN103150696A (zh) * 2011-12-06 2013-06-12 中兴通讯股份有限公司 选择目标增值业务潜在客户的方法及装置
EP2688015A1 (en) * 2012-07-20 2014-01-22 Tata Consultancy Services Limited Method and system for adaptive forecast of energy resources
CN104933505A (zh) * 2015-04-22 2015-09-23 国家电网公司 一种基于模糊评估的智能配电网群决策评价方法
CN105046402A (zh) * 2015-06-23 2015-11-11 国家电网公司 一种应用于智能变电站二次设备的状态评估方法
CN108306285A (zh) * 2018-01-08 2018-07-20 厦门大学 基于topsis法的含分布式电源的主动配电网可靠性评估方法

Also Published As

Publication number Publication date
CN106934493A (zh) 2017-07-07

Similar Documents

Publication Publication Date Title
CN106934493B (zh) 一种电力客户价值评估模型的构建方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN106055661B (zh) 基于多Markov链模型的多兴趣资源推荐方法
CN110717654B (zh) 基于用户评论的产品质量评价方法和系统
CN110555101A (zh) 一种客服知识库更新方法、装置、设备及存储介质
CN113111924A (zh) 电力客户分类方法及装置
CN111104972A (zh) 基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法
Berlanga et al. Multiobjective evolutionary induction of subgroup discovery fuzzy rules: a case study in marketing
CN113283795B (zh) 基于二分类模型的数据处理方法及装置、介质、设备
Singh et al. Sentiment analysis of Twitter data using TF-IDF and machine learning techniques
CN109299263A (zh) 文本分类方法、电子设备及计算机程序产品
CN111612519A (zh) 一种识别金融产品潜在客户的方法、装置及存储介质
CN112884570A (zh) 一种模型安全性的确定方法、装置和设备
CN113327047B (zh) 基于模糊综合模型的电力营销服务渠道决策方法及系统
CN107909090A (zh) 基于测度学习半监督的钢琴乐谱难度识别方法
CN112508363A (zh) 基于深度学习的电力信息系统状态分析方法及装置
CN110990662A (zh) 一种基于引文网络与科研合作网络的领域专家遴选方法
CN113571198B (zh) 转化率预测方法、装置、设备及存储介质
CN113537313B (zh) 一种基于wgan训练收敛的不平衡数据集分析方法
CN114330291A (zh) 基于双重注意力机制的文本推荐系统
Silva et al. Classifying feature models maintainability based on machine learning algorithms
CN112396507A (zh) 基于阴影划分的集成svm个人信用评估方法
CN108733824B (zh) 考虑专家知识的交互式主题建模方法及装置
Richard et al. An Automated Clustering Process for Helping Practitioners to Identify Similar EV Charging Patterns across Multiple Temporal Granularities.
Sameki et al. BUOCA: budget-optimized crowd worker allocation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant