CN111724039B - 一种向电力用户推荐客服人员的推荐方法 - Google Patents
一种向电力用户推荐客服人员的推荐方法 Download PDFInfo
- Publication number
- CN111724039B CN111724039B CN202010454812.9A CN202010454812A CN111724039B CN 111724039 B CN111724039 B CN 111724039B CN 202010454812 A CN202010454812 A CN 202010454812A CN 111724039 B CN111724039 B CN 111724039B
- Authority
- CN
- China
- Prior art keywords
- user
- index
- score
- label
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims abstract description 28
- 238000005516 engineering process Methods 0.000 claims abstract description 18
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000003064 k means clustering Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 claims description 2
- 230000006872 improvement Effects 0.000 claims description 2
- 230000005611 electricity Effects 0.000 abstract description 9
- 238000007418 data mining Methods 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 101100368725 Bacillus subtilis (strain 168) tagF gene Proteins 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种向电力用户推荐客服人员的推荐方法,属于数据挖掘中推荐技术领域。该方法合理利用用户的用电,交费信息构建电力用户画像,采用聚类技术将相似用户进行聚类,SVD++矩阵分解技术来缓解评分数据稀疏性,通过计算用户画像向量与客服属性特征向量间的相似度来建立起用户与客服间的关联性,最终从服务质量和合适度上向用户推荐客服人员。本发明通过向用户合理化推荐客服人员,来提高服务质量和服务效率。
Description
技术领域
本发明涉及一种向电力用户推荐客服人员的推荐方法,属于数据挖掘中推荐技术领域。
背景技术
国家电网电力客服中心面向千家万户,社会影响力大,是为电力用户提供服务的主要窗口。客服中心的服务质量,服务水平对于加快电网企业的创新发展有着重要的价值。
因电力行业咨询业务的复杂性,目前国网客服中心服务方式仍以电话咨询为主要服务方式,其在南京,天津设南(北)分中心,服务全国27省(市)电力客户,全国电力客户的话务咨询业务会自动转接到南或北中心,并自动分配客服人员进行服务,但随着电网的不断发展,客服中心的话务量不断增多,出现了服务质量不高,服务效率低,优质用户流失等问题。而问题出现的主要原因包括两个方面:
客户与客服人员未进行合理化分配:面对庞大的电话接入量,不同的类型客户有不同的业务需求。对于普通的居民,业务需求基本包括简单的电量电费查询,报修等,这对于客服人员的业务能力要求不高。但是对于一个企业用户,业务需求不再仅限于用电查询,咨询内容将更复杂众多,如供电方案设计,后期维护等信息咨询。面对企业级用户,需要服务级别更高,经验更丰富的客服人员为其服务。同时,不同地区的电力公司服务标准不同,用户的需求也不同,所以,需要为用户分配了解其地区业务的客服人员进行服务,从而提供更有针对性的解决措施。
未充分利用用户的用电信息数据:目前国网客服中心仍偏向于向所有用户提供普遍化服务,对于不同客户的需求提供的服务针对性不强,导致优质客户存在一定的流失风险。而客服中心积累了大量的电力用户信息数据,但是这些信息数据未能有效利用,来定位不同客户的需求,挖掘用户潜在价值,并加强对优质客户的重视。
综上陈述,如何高效利用积累的用户信息数据,定位不同用户需求,并智能化提供客服人员进行服务是目前客服中心需要关注的问题。而推荐技术在过滤有价值信息,提供精准化服务等方面有着广泛应用。因此为了缓解上述问题,将推荐技术应用于电力客服推荐中,通过合理化推荐客服人员,来提高服务质量。并基于客服推荐应用场景,提出一种基于用户画像技术和SVD++融合推荐方法。
发明内容
为了缓解因国网的不断发展,用户覆盖范围逐渐扩大,客服中心在处理报修、供电等业务咨询需求增加而出现的运行效率低,服务质量下降,服务存在普遍性等问题。本发明提供一种向电力用户推荐客服人员的推荐方法,通过向用户合理化推荐客服人员,来提高服务质量和服务效率。该方法合理利用用户的用电,交费信息构建电力用户画像,采用聚类技术将相似用户进行聚类,SVD++矩阵分解技术来缓解评分数据稀疏性,通过计算用户画像向量与客服属性特征向量间的相似度来建立起用户与客服间的关联性,最终从服务质量和合适度上向用户推荐客服人员。
本发明为解决其技术问题采用如下技术方案:
一种向电力用户推荐客服人员的推荐方法,其特征在于包括如下步骤:
(1)利用电力用户的用电,交费信息,采用数学统计分析方法对电力用户进行画像构建,最终生成一个电力用户画像标签向量;
(2)利用构建的电力用户画像向量,通过k-means聚类技术将相似用户进行聚类;
(3)将目标用户所在聚类中所有用户构成的矩阵R利用SVD++技术进行矩阵分解,采用随机梯度下降法进行迭代学习不断更新用户项目隐含特征参数,利用学习到参数对未评分项进行评分rui(初评分),构成填充后的评分矩阵R';
(4)基于评分矩阵R',使用Person相关相似度计算方法计算用户之间的相似度;
(5)采用欧式距离计算用户画像向量与客服属性特征向量之间的相似度;
(6)SVD++算法获得的评分rui(初评分)作为初始评分,融入用户-客服相似度改进的基于邻域的评分pre(u,i)作为修正评分,最终评分取两者平均值进行推荐。
步骤(1)中所述采用的数学统计分析方法进行画像构建具体步骤如下:
(1.1)用户画像构建:从电力用户基本属性即人口统计学领域,电力行业领域以及商业社交领域三个维度对电力用户进行建模,用一个三元组来表示电力用户画像,分别代表用户基本属性标签,电力行业领域标签和商业社交领域标签
PowerUser=<e-label,f-label,s-label>
其中e-label表示用户基本属性标签,f-1abel表示电力行业领域标签,s-label表示商业社交领域标签,PowerUser表示构建的电力用户画像标签向量;
(1.2)用户画像生成:选择m个指标对用户的经济价值进行评分,n个用户构成一个m维的矩阵向量:
其中:Y1为第1个用户指标向量,Y2为第二个用户指标向量,Yn为第n个用户指标向量;Y1(1)表示第1个用户第1个指标;Y1(2)表示第1个用户第2个指标;Y1(m)表示第1个用户第m个指标;Y2(1)表示第2个用户第1个指标;Y2(2)表示第2个用户第2个指标;Y2(m)表示第2个用户第m个指标;Yn(1)表示第n个用户第1个指标;Yn(2)表示第n个用户第2个指标;Yn(m)表示第n个用户第m个指标;
选取每个评估指标的最大值构成向量Y0
Y0=[Y0(1),Y0(2),...Y0(m)]T
计算每个指标与该指标对应最大值的差值,并构建矩阵Y0i(k)
Δ0i(k)=|Y0(k)-Yi(k)|,i=1,2,...,n;k=1,2,...m
其中:Δ0i(k)为每个指标与该指标对应最大值差值,Y0(k)为指标最大值,Yi(k)为每个指标;Y01(1)表示第一个用户第一个指标差值,Y01(2)表示第一个用户第二个指标差值,Y01(m)表示第一个用户第m个指标差值,Y02(1)表示第二个用户第一个指标差值,Y02(2)表示第二个用户第二个指标差值,Y02(m)表示第二个用户第m指标差值,Y0n(1)表示第n个用户第一个指标差值,Y0n(2)表示第n个用户第二个指标差值,Y0n(m)表示第n个用户第m个指标差值;
确定关系系数
其中Δmin=min{Δ0i(k)},Δmax=max{Δ0i(k)},i=1,2,...n;k=1,2,...,m
并构建关系系数矩阵
其中β01(1)表示第一个用户第一个指标关系系数,β01(2)第一个用户第二个指标关系系数,β01(m)表示第一个用户第m个指标关系系数,β02(1)第2个用户第1个指标关系系数,β02(2)第2个用户第2个指标关系系数,β02(m)第2个用户第m个指标关系系数,β0n(1)第n个用户第1个指标关系系数,β0n(2)第n个用户第2个指标关系系数,β0n(m)第n个用户第m个指标关系系数;
确定灰色关联度:
其中ωk代表每个指标的权重,V0i为灰色关联度,本申请计算过程中设置各指标权重值相等。
所述步骤(2)中采用k-means聚类技术对用户画像标签向量进行聚类,具体步骤如下:
(2.1)从n条标签向量中随机选择k个对象作为聚类中心m1,m2,......,mk,其中:m1表示第1个聚类中心,m2表示第2个聚类中心,mk表示第k个聚类中心;
(2.2)利用下式计算每个电力用户画像标签向量PowerUser到聚类中心mk的距离,并将其分到距离最近的聚类中心
其中:PowerUseri1表示第i个电力用户画像标签向量第1个指标,mj1表示聚类中心,PowerUseri表示第i个电力用户画像标签向量,d()表示标签向量与聚类中心的距离,mi表示第i个聚类中心;
(2.3)重新计算每个新集群中对象的均值作为新的集群中心
(2.4)重复步骤(2.2)和步骤(2.3),直到准则函数E收敛,返回簇中心m1,m2,......mk
其中PowerUserij表示第i个聚类中第j个用户,Ni表示当前聚类中用户的数量。
所述步骤(3)中采用SVD++矩阵分解技术对用户构成的评分矩阵进行分解,具体步骤如下:
其中μ表示项目的评分均值,bu表示用户u对项目的评分均值,bi表示每个项目被用户评分的平均值,Pu为用户潜在特征因子,qi为项目潜特征因子,N(u)为用户u评价过的所有项目,yj为隐式反馈项,T表示转置;
(3.2)计算误差eui,SSE
其中:eui预测评分与实际评分的误差,SSE为误差平方和;
(3.3)按照公式进行迭代
bu←bu+η(eui-λbu)
puk←puk+η(euiqki-λpuk)
qki←qki+η(euipuk-λqki)
其中η为学习率,puk为用户隐含特征向量,qki为项目隐含特征向量,yjk为隐含特征因子,N(u)为用户u评价过的项目集合,R(u)为被评价过的项目,λ为正则化参数;
(3.4)重复上述步骤直到误差趋于稳定停止迭代。
步骤(6)具体过程如下:
(6.1)融入用户-客服相似度改进的基于邻域的评分pre(u,i)
其中pre(u,i)表示用户u对项目i的评分预测,S(u,k)是和用户u的k个近邻用户,N(i)表示对项目i评过分的所有用户,Rvi是用户v对项目i的评分,分别是用户u,v评分均值,Sim-score(u,v)表示计算得到的用户间的相似度,Sim(u,i)表示计算得到的用户与客服间的相似度,ω代表融合权重;
(6.2)SVD++算法获得的评分rui
(6.3)评分均值
其中r表示最终用户对客服的打分值。
本发明的有益效果如下:
1.本发明提出的推荐方法首先通过聚类技术对电力用户画像标签向量进行聚类,将相似用户聚到一起,并基于用户所属聚类中进行推荐;其次,通过计算用户画像标签向量与客服属性特征向量之间的相似度来建立起用户与客服之间的联系,并改进传统评分预测方法,融入用户与客服人员的相似度指标。最终从服务质量上和服务合适度上两方面对客服人员进行推荐,缓解了电力用户数据量大和经典推荐技术未考虑用户与客服关联性问题。
2.通过SVD++矩阵分解技术进行初评分,再利用融合了用户-客服相似度基于邻域的评分预测方法进行评分修整,最终基于两方面均值进行推荐,缓解了用户-客服评分数据稀疏性问题。
附图说明
图1为具体实施例中向电力用户推荐客服人员的推荐方法总体思路图。
图2为具体实施例中电力用户画像与客服推荐之间的关系图。
图3为具体实施例中电力用户画像建模指标图。
图4为具体实施例中电力用户画像建模图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
图1给出了本发明提供的向电力用户推荐客服人员的推荐方法的总体思路,它介绍本发明的主要工作流程,具体实施如下:
电力用户画像构建:在推荐之前通过分析用户的基本信息和用电,交费信息来挖掘用户的经济,负荷,信用和社会价值。
如图2为电力用户画像与客服推荐之间的关系图,通过用户编号,类型,地区等静态属性(人口统计学属性)和用户的用电行为(年用电量,用电增长率...),交费行为(欠费次数,违约用/窃电次数)等动态属性构建电力用户画像,依据用户用电,交费行为数据,分析测算各类用户的不同角度的价值评分(包括经济,负荷,信用,社会等价值),对于价值评分高的用户,在提供咨询服务时,可将信誉良好,服务级别高的客服推荐给他,同时客服人员可以为同一地区或者地区相近的用户提供咨询服务。总之,通过用户画像的建立,可以挖掘用户与用户之间的联系,将所属同一地区,需求相似,价值等级相似的用户聚集到一起,并提供针对性服务,同时可以挖掘用户与客服之间的联系,将与用户所属地区相近,等级相似(用户价值等级,客服的服务等。
如图3为电力用户画像建模指标图,在构建电力用户画像过程中,通过注册获取用户的基本属性信息,并通过用户的用电行为,交费行为获取用户用电数据,欠费数据,违约等数据。通过分析电力领域用户数据的特征,以电力用户基本属性,电力行业领域属性和商业社交属性为指标,挖掘用户当前价值和潜在价值来建立起电力用户画像。人口统计学属性(静态属性)主要包括用户编号,用户类型,合同容量,所属地区等;动态属性根据电力行业领域属性特征包括用户的用电行为属性和交费行为属性,用电行为属性包括:年用电量,年用电量增长率,产能利用率,违约用电次数,违约窃电次数,交费行为包括逾期交费率,欠费停电次数,平均回款时长,平均逾期时长等;社交属性包括电力用户重要性等级,行业类型,以及用户对客服的评价等级。
如图4为电力用户画像建模图,从电力用户基本属性即人口统计学领域,电力行业领域以及商业社交领域三个维度对电力用户进行建模:
PowerUser=<e-label,f-label,s-label>
用一个三元组来表示电力用户画像,分别代表用户基本属性标签,电力行业领域标签和商业社交领域标签。PowerUser代表所要构成的电力用户画像标签向量,e-label代表用户人口统计学静态属性标签模块,该模块标签可直接通过用户的注册信息,登记信息直接获取。在f-label所代表的的电力行业领域标签模块中,使用tag2=f(attribute2)关系来表示该模型。其中tag2代表目前电力领域所要挖掘的用户经济,负荷,忠诚,信用价值等级。同时tag2由图3中所述的行业领域属性来决定,通过对属性值进行建模分析,来对各类价值进行评级。s-label代表商业及社交领域标签模块中,同样使用tag3=f(arribute3)关系来表示该模型,tag3表示社会,行业价值等级,其等级的高低同样受到图3中所述的商业社交属性来决定。
电力用户画像聚类:从电力用户的行为特性以及客服推荐的这一应用场景出发,提出了一种新的利用电力用户画像进行聚类划分的方法,该方法通过构建的用户画像向量作为电力用户的特征维度,并采用k-means聚类技术进行聚类。
SVD++矩阵分解:将目标用户所在聚类中所有用户构成的评分矩阵R利用SVD++技术进行矩阵分解,采用随机梯度下降法进行迭代学习不断更新用户项目隐含特征参数,利用学习到参数对未评分项进行评分rui(SVD++获得初评分),构成新矩阵R'。
其中:rui表示SVD++获得的评分,μ表示项目的评分均值,bu表示用户u对项目的评分均值,bi表示每个项目被用户评分的平均值,Pu为用户潜在特征因子,qi为项目潜特征因子,N(u)为用户u评价过的所有项目,yj为隐式反馈项,T表示转置。
基于用户评分矩阵用户相似度计算:基于评分矩阵R′,使用Person(皮尔逊)相关相似度计算方法计算用户之间的相似度。
其中Rui表示用户u对项目i的评分,Rvi表示用户v对项目i的评分,i是所有项目的集合,表示用户u打分平均值,表示用户u打分平均值,Iuv表示u,v共同打分项目,CorrSim()表示·皮尔逊相似度。基于用户画像向量-客服特征向量相似度计算:采用EucSim(欧式距离)计算用户画像向量与客服属性特征向量之间的相似度。
其中d(x,y)示两向量之间的距离,xi和yi分别表示x,y向量第i个特征,EucSim()表示欧式聚类相似度计算方法。
评分预测模块:SVD++算法获得的评分rui作为初始评分,融入用户-客服相似度改进的基于邻域的评分pre(u,i)作为修正评分,最终评分取两者平均值进行推荐。
Claims (4)
1.一种向电力用户推荐客服人员的推荐方法,其特征在于,包括如下步骤:
(1)利用电力用户的用电,交费信息,采用数学统计分析方法对电力用户进行画像构建,最终生成一个电力用户画像标签向量;所述步骤(1)中采用的数学统计分析方法进行画像构建具体步骤如下:
(1.1)用户画像构建:从电力用户基本属性即人口统计学领域,电力行业领域以及商业社交领域三个维度对电力用户进行建模,用一个三元组来表示电力用户画像,分别代表用户基本属性标签,电力行业领域标签和商业社交领域标签
PowerUser=<e-label,f-label,s-label>
其中e-label表示用户基本属性标签,f-1abel表示电力行业领域标签,s-label表示商业社交领域标签,PowerUser表示构建的电力用户画像标签向量;
(1.2)用户画像生成:选择m个指标对用户的经济价值进行评分,n个用户构成一个m维的矩阵向量:
其中:Y1为第1个用户指标向量,Y2为第二个用户指标向量,Yn为第n个用户指标向量;Y1(1)表示第1个用户第1个指标;Y1(2)表示第1个用户第2个指标;Y1(m)表示第1个用户第m个指标;Y2(1)表示第2个用户第1个指标;Y2(2)表示第2个用户第2个指标;Y2(m)表示第2个用户第m个指标;Yn(1)表示第n个用户第1个指标;Yn(2)表示第n个用户第2个指标;Yn(m)表示第n个用户第m个指标;
选取每个评估指标的最大值构成向量Y0
Y0=[Y0(1),Y0(2),...Y0(m)]T
计算每个指标与该指标对应最大值的差值,并构建矩阵Y0i(k)
Δ0i(k)=|Y0(k)-Yi(k)|,i=1,2,...,n;k=1,2,...m
其中:Δ0i(k)为每个指标与该指标对应最大值差值,Y0(k)为指标最大值,Yi(k)为每个指标;Y01(1)表示第一个用户第一个指标差值,Y01(2)表示第一个用户第二个指标差值,Y01(m)表示第一个用户第m个指标差值,Y02(1)表示第二个用户第一个指标差值,Y02(2)表示第二个用户第二个指标差值,Y02(m)表示第二个用户第m指标差值,Y0n(1)表示第n个用户第一个指标差值,Y0n(2)表示第n个用户第二个指标差值,Y0n(m)表示第n个用户第m个指标差值;
确定关系系数
其中Δmin=min{Δ0i(k)},Δmax=max{Δ0i(k)},i=1,2,...n;k=1,2,...,m
并构建关系系数矩阵
其中β01(1)表示第一个用户第一个指标关系系数,β01(2)第一个用户第二个指标关系系数,β01(m)表示第一个用户第m个指标关系系数,β02(1)第2个用户第1个指标关系系数,β02(2)第2个用户第2个指标关系系数,β02(m)第2个用户第m个指标关系系数,β0n(1)第n个用户第1个指标关系系数,β0n(2)第n个用户第2个指标关系系数,β0n(m)第n个用户第m个指标关系系数;
确定灰色关联度:
其中ωk代表每个指标的权重,V0i为灰色关联度
(2)利用构建的电力用户画像向量,通过k-means聚类技术将相似用户进行聚类;
(3)将目标用户所在聚类中所有用户构成的矩阵R利用SVD++技术进行矩阵分解,采用随机梯度下降法进行迭代学习不断更新用户项目隐含特征参数,利用学习到参数对未评分项进行评分rui,构成填充后的评分矩阵R';
(4)基于评分矩阵R',使用Person相关相似度计算方法计算用户之间的相似度;
(5)采用欧式距离计算用户画像向量与客服属性特征向量之间的相似度;
(6)SVD++算法获得的评分rui作为初始评分,融入用户-客服相似度改进的基于邻域的评分pre(u,i)作为修正评分,最终评分取两者平均值进行推荐。
2.根据权利要求1所述的一种向电力用户推荐客服人员的推荐方法,其特征在于,所述步骤(2)中采用k-means聚类技术对用户画像标签向量进行聚类,具体步骤如下:
(2.1)从n条标签向量中随机选择k个对象作为聚类中心m1,m2,......,mk,其中:m1表示第1个聚类中心,m2表示第2个聚类中心,mk表示第k个聚类中心;
(2.2)利用下式计算每个电力用户画像标签向量PowerUser到聚类中心mk的距离,并将其分到距离最近的聚类中心
其中:PowerUseri1表示第i个电力用户画像标签向量第1个指标,mj1表示聚类中心,PowerUseri表示第i个电力用户画像标签向量,d()表示标签向量与聚类中心的距离,mi表示第i个聚类中心;
(2.3)重新计算每个新集群中对象的均值作为新的集群中心
(2.4)重复步骤(2.2)和步骤(2.3),直到准则函数E收敛,返回簇中心m1,m2,......mk
其中PowerUserij表示第i个聚类中第j个用户,Ni表示当前聚类中用户的数量。
3.根据权利要求1所述的一种向电力用户推荐客服人员的推荐方法,其特征在于,所述步骤(3)中采用SVD++矩阵分解技术对用户构成的矩阵进行分解,具体步骤如下:
其中μ表示项目的评分均值,bu表示用户u对项目的评分均值,bi表示每个项目被用户评分的平均值,Pu为用户潜在特征因子,qi为项目潜特征因子,N(u)为用户u评价过的所有项目,yj为隐式反馈项,T表示转置;
(3.2)计算误差eui,SSE
其中:eui预测评分与实际评分的误差,SSE为误差平方和;
(3.3)按照公式进行迭代
bu←bu+η(eui-λbu)
puk←puk+η(euiqki-λpuk)
qki←qki+η(euipuk-λqki)
其中η为学习率,puk为用户隐含特征向量,qki为项目隐含特征向量,yjk为隐含特征因子,N(u)为用户u评价过的项目集合,R(u)为被评价过的项目,λ为正则化参数;
(3.4)重复上述步骤直到误差趋于稳定停止迭代。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010454812.9A CN111724039B (zh) | 2020-05-26 | 2020-05-26 | 一种向电力用户推荐客服人员的推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010454812.9A CN111724039B (zh) | 2020-05-26 | 2020-05-26 | 一种向电力用户推荐客服人员的推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111724039A CN111724039A (zh) | 2020-09-29 |
CN111724039B true CN111724039B (zh) | 2022-08-19 |
Family
ID=72565035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010454812.9A Active CN111724039B (zh) | 2020-05-26 | 2020-05-26 | 一种向电力用户推荐客服人员的推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111724039B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215655B (zh) * | 2020-10-13 | 2023-04-28 | 广东电网有限责任公司 | 一种客户画像的标签管理方法及系统 |
CN112765208A (zh) * | 2021-01-12 | 2021-05-07 | 云南电网有限责任公司电力科学研究院 | 输电线路巡维任务的调度方法、系统、设备和存储介质 |
CN112967102A (zh) * | 2021-02-04 | 2021-06-15 | 江苏警官学院 | 以物流数据建立客户画像的方法 |
CN112581044B (zh) * | 2021-02-25 | 2021-05-14 | 壹药网耀方科技(上海)股份有限公司 | 一种基于多维空间投影的个性化客服匹配系统 |
CN114255070A (zh) * | 2021-12-03 | 2022-03-29 | 广东电网有限责任公司广州供电局 | 一种基于多维关联细粒度的电力营销信息化客户画像模型 |
CN116257681B (zh) * | 2022-12-21 | 2023-10-13 | 中国民航科学技术研究院 | 一种基于画像技术的民用航空事件调查员推荐方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846106A (zh) * | 2017-01-16 | 2017-06-13 | 南京师范大学 | 一种图构建框架下的矩阵分解推荐方法 |
CN109740064A (zh) * | 2019-01-18 | 2019-05-10 | 北京化工大学 | 一种融合矩阵分解和挖掘用户项目信息的cf推荐方法 |
CN111160859A (zh) * | 2019-12-26 | 2020-05-15 | 淮阴工学院 | 一种基于svd++和协同过滤的人力资源岗位推荐方法 |
-
2020
- 2020-05-26 CN CN202010454812.9A patent/CN111724039B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846106A (zh) * | 2017-01-16 | 2017-06-13 | 南京师范大学 | 一种图构建框架下的矩阵分解推荐方法 |
CN109740064A (zh) * | 2019-01-18 | 2019-05-10 | 北京化工大学 | 一种融合矩阵分解和挖掘用户项目信息的cf推荐方法 |
CN111160859A (zh) * | 2019-12-26 | 2020-05-15 | 淮阴工学院 | 一种基于svd++和协同过滤的人力资源岗位推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111724039A (zh) | 2020-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111724039B (zh) | 一种向电力用户推荐客服人员的推荐方法 | |
CN110738435A (zh) | 一种配电网项目投资决策评价方法 | |
CN109063945A (zh) | 一种基于价值评估体系的售电公司360度客户画像构建方法 | |
Wang et al. | Smart Meter Data Analytics | |
CN108596467B (zh) | 一种适于售电公司的市场运营模拟交易仿真系统 | |
Miraftabzadeh et al. | K-means and alternative clustering methods in modern power systems | |
CN106202480A (zh) | 一种基于K‑means和LDA双向验证的网络行为习惯聚类方法 | |
Raghavendra et al. | Artificial humming bird with data science enabled stability prediction model for smart grids | |
CN111178957B (zh) | 一种用电客户电量突增预警的方法 | |
Panapakidis et al. | Implementation of modified versions of the K-means algorithm in power load curves profiling | |
CN117391247A (zh) | 一种基于深度学习的企业风险等级预测方法及系统 | |
Elahe et al. | Review of load data analytics using deep learning in smart grids: Open load datasets, methodologies, and application challenges | |
CN110766438A (zh) | 一种通过人工智能对电网用户的用户行为进行分析的方法 | |
Feng et al. | Saturated load forecasting based on clustering and logistic iterative regression | |
Guan et al. | Customer load forecasting method based on the industry electricity consumption behavior portrait | |
Zhang et al. | Data augmentation strategy for small sample short‐term load forecasting of distribution transformer | |
CN115860694A (zh) | 一种基于即时消息技术的业扩流程管控方法及系统 | |
CN118411195A (zh) | 一种基于大数据售电量信息计划管理系统 | |
CN117035837B (zh) | 一种电力用户购电需求预测及零售合同定制方法 | |
Thangavel et al. | Forecasting energy demand using conditional random field and convolution neural network | |
Liu et al. | A clustering-based feature enhancement method for short-term natural gas consumption forecasting | |
CN114372835B (zh) | 综合能源服务潜力客户识别方法、系统及计算机设备 | |
Du et al. | Research on Personalized Book Recommendation Based on Improved Similarity Calculation and Data Filling Collaborative Filtering Algorithm | |
Bao et al. | An analysis method for residential electricity consumption behavior based on UMAP-CRITIC feature optimization and SSA-assisted clustering | |
Xiaoman et al. | Analysis of power large user segmentation based on affinity propagation and K-means algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |