CN111026863A - 客户行为预测方法、装置、设备及介质 - Google Patents

客户行为预测方法、装置、设备及介质 Download PDF

Info

Publication number
CN111026863A
CN111026863A CN201811173182.7A CN201811173182A CN111026863A CN 111026863 A CN111026863 A CN 111026863A CN 201811173182 A CN201811173182 A CN 201811173182A CN 111026863 A CN111026863 A CN 111026863A
Authority
CN
China
Prior art keywords
sample
client
customer
decision tree
experience information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811173182.7A
Other languages
English (en)
Inventor
董云龙
刘毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Hebei Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Hebei Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Hebei Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811173182.7A priority Critical patent/CN111026863A/zh
Publication of CN111026863A publication Critical patent/CN111026863A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Abstract

本发明实施例提供一种客户行为预测方法、装置、设备及介质,所述的方法包括:从模板中获取样本客户的属性和所述样本客户对应的经验信息,所述经验信息是工作人员在维护所述样本客户时的经验信息;若所述样本客户的属性或者所述样本客户对应的经验信息属于模糊信息,则基于模糊决策树算法,对所述样本客户的属性和所述样本客户对应的经验信息进行处理,得到第一决策树;根据所述第一决策树,预测目标客户的行为,所述样本客户和所述目标客户分别是通信运营商的客户。通过本发明实施例,实现了自动化、智能化为工作人员提供客户保有和流失预测数据,辅助工作人员有针对性地开展客户保有工作,降低客户流失的风险。

Description

客户行为预测方法、装置、设备及介质
技术领域
本发明涉及通信技术领域,尤其涉及一种客户行为预测方法、装置、设备及介质。
背景技术
当前通信运营商之间竞争日趋激烈,客户流失率不断上升。在通信市场占有率已达饱和的情况下,发展新客户的成本要远高于老客户维系成本,因此做好存量客户保有、降低客户流失率是重中之重。为了减少老客户流失,需要提前预测到客户的离网倾向,并有针对性地主动采取客户关怀,及时挽留客户。
现有方法大都是通过建立客户保有系统以及核心客户保有等专题,这些方法依赖用户预先设定的一些指标范围,如:新入网客户数、离网客户数、在网客户通信行为变化、预存款变化、合约活动协议期变化等等,从而筛选出超过指标范围的高流失风险客户,推送给客户经理进行客户保有。但是该方法过于依赖指标范围的设定,并且需要客户经理主动去挖掘潜在的高流失风险客户,对于客户经理的主动性要求比较高,无法实现自动化、智能化预测高流失风险客户。
发明内容
本发明实施例提供了一种客户行为预测方法、装置、设备及介质,能够实现自动化、智能化为客户经理提供客户保有和流失预测数据。
第一方面,本发明实施例提供了一种客户行为预测方法,包括:
从模板中获取样本客户的属性和所述样本客户对应的经验信息,所述经验信息是工作人员在维护所述样本客户时的经验信息;
若所述样本客户的属性或者所述样本客户对应的经验信息属于模糊信息,则基于模糊决策树算法,对所述样本客户的属性和所述样本客户对应的经验信息进行处理,得到第一决策树;
根据所述第一决策树,预测目标客户的行为,所述样本客户和所述目标客户分别是通信运营商的客户。
第二方面,本发明实施例提供了一种客户行为预测装置,包括:
获取模块,用于从模板中获取样本客户的属性和所述样本客户对应的经验信息,所述经验信息是工作人员在维护所述样本客户时的经验信息;
处理模块,用于当所述样本客户的属性或者所述样本客户对应的经验信息属于模糊信息时,基于模糊决策树算法,对所述样本客户的属性和所述样本客户对应的经验信息进行处理,得到第一决策树;
第一预测模块,用于根据所述第一决策树,预测目标客户的行为,所述样本客户和所述目标客户分别是通信运营商的客户。
本发明实施例提供了一种计算设备,包括:处理器、存储器以及存储在所述存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
本发明实施例提供的客户行为预测方法、装置、设备及介质,由于样本客户的属性和对应的经验信息为文字性描述,无法实现完全数字化和精确描述。因此,基于模糊决策树算法,处理模糊的属性和经验信息,以构建第一决策树,利用第一决策树预测目标客户的行为,实现了对客户属性和经验信息的深度挖掘。而且通过本发明实施例来预测客户行为,不需要设定指标范围,也不需要工作人员主动去挖掘潜在的高流失风险客户,实现了自动化、智能化为工作人员提供客户保有和流失预测数据,辅助工作人员有针对性地开展客户保有工作,降低客户流失的风险。另外,通过模板,可以减少自然语言的处理难度,不仅可以更加方便获取样本客户的属性和经验信息,还可以使得获取的属性和经验信息更加全面,为构建决策树打下了基础。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例的一种客户行为预测方法的流程示意图;
图2示出了本发明实施例的一种模糊决策树的结构示意图;
图3示出了本发明实施例的一种客户行为预测装置的结构示意图;
图4示出了本发明实施例的一种计算设备的示例性硬件架构的结构图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
图1示出了本发明实施例的一种客户行为预测方法的流程示意图。该方法包括:S101至S103。
S101,从模板中获取样本客户的属性和样本客户对应的经验信息,经验信息是工作人员在维护样本客户时的经验信息。
作为一个示例,预先录入样本客户的信息和样本客户对应的经验信息。经验信息是工作人员在维护样本客户时的经验信息,比如,工作人员是维护客户关系的客户经理。客户的信息包括客户的基本情况,客户属性以及客户行为信息。比如,客户属性包括:年龄、性别、入网网龄、地域和职业等。通过录入客户的信息,可以建立客户与客户经理之间的联系,也可以建立客户经理之间的相似关系,为后面开展知识挖掘奠定基础。客户经理的经验信息主要是客户经理维系客户过程中积累下来的知识经验。
为了提高知识挖掘准确性,可以建立模板,由客户经理按照模板填写经验,录入系统供后面的知识挖掘使用。模板内容包括:时间、地点、客户经理对具有什么样特征的客户群实施了什么保有手段、效果如何、以及具有什么特征的客户易于流失。使用模板的好处是减少自然语言的处理难度,设定经验的描述方式和范围,便于进行相应算法实现。然后,客户经理录入的每条经验都会呈现,可以随时修正自己的经验,并且添加关键词,便于知识挖掘的实现。通过此部分的知识积累,获得了客户信息以及经验信息。
S102,若样本客户的属性或者样本客户对应的经验信息属于模糊信息,则基于模糊决策树算法,对样本客户的属性和样本客户对应的经验信息进行处理,得到第一决策树。
需要说明的是,模糊信息是由模糊现象所获得的不精确的、非定量的信息。模糊信息并非不可靠的信息。在客观的世界,存在大量的模糊现象,如"两个人相像","好看不好看",其界线是模糊的,人的经验也是模糊的东西。模糊性问题1965年美国扎德(L.A.Zadeh)首先提出的。用模糊数学的方法处理模糊信息,通过抽象、概括、综合和推理,可以从中得到具有一定精度的结论。
如果样本客户对应的经验信息存在模糊性的时候,就引入了模糊决策树算法。
1、设A,Ai(i=1,2,…,m)∈F(U),{Ai|i=1,2,…,m}为A的一个模糊分割,称H(A),
Figure BDA0001823058100000051
M(Ai)表示在A的背景下分割{Ai|i=1,2,…,m}的模糊信息熵。
2、A,Ai,B,Bj∈F(U),其中i=1,2,...,m;j=1,2,...,k。{Ai|i=1,2,…,m}是A的模糊分割,{Bj|j=1,2,…,m}是B的模糊分割。
Figure BDA0001823058100000052
H(A|B)是在已知模糊集合B的条件下A的模糊条件熵。
3、给定一个语言术语T和一个语言变量A=(T1,...,Tk),A在T上的模糊分割的分类不确定性定义为:
Figure BDA0001823058100000053
其中ω(Tt|T)表示相应权重。
模糊决策树算法的过程就是在根节点处计算每个属性的模糊分割所导致的分类不确定性G,选择产生的分类不确定性最小的属性作为根节点,将根节点根据此属性语义值的个数分割展开,依次递归,直到分类完成,从而实现构建模糊决策树。
S103,根据第一决策树,预测目标客户的行为,样本客户和目标客户分别是通信运营商的客户。
作为一个示例,将目标客户的属性输入到第一决策树中,第一决策树输出预测出的目标客户的行为。
在预测出目标客户的行为之后,将目标客户的预测结果推送给负责维护该目标客户的工作人员,工作人员可以根据实际情况,选择个性化或差异化的方案采取客户维系工作。
另外,本发明实施例能够根据后续执行结果进行再学习、再跟踪,持续完善预测精准度,为企业做好客户保有、降低客户流失率、提高企业收入和满意度提供决策支持。
根据本发明实施例的客户行为预测方法,由于样本客户的属性和对应的经验信息为文字性描述,无法实现完全数字化和精确描述。因此,基于模糊决策树算法,处理模糊的属性和经验信息,以构建第一决策树,利用第一决策树预测目标客户的行为,实现了对客户属性和经验信息的深度挖掘。而且通过本发明实施例来预测客户行为,不需要设定指标范围,也不需要工作人员主动去挖掘潜在的高流失风险客户,实现了自动化、智能化为工作人员提供客户保有和流失预测数据,更准确地预测到客户离网倾向,辅助工作人员有针对性地开展客户保有工作,降低客户流失的风险。另外,通过模板,可以减少自然语言的处理难度,不仅可以更加方便获取样本客户的属性和经验信息,还可以使得获取的属性和经验信息更加全面,为构建决策树打下了基础。
在本发明一个实施例中,S102包括:
基于模糊决策树算法,根据样本客户的属性和样本客户对应的经验信息,计算出多个模糊集合、每个模糊集合的隶属度、至少一个经验结论和每个经验结论的隶属度;根据多个模糊集合的隶属度和至少一个经验结论的隶属度,构建模糊决策树,作为第一决策树。
由于工作人员的经验信息多为文字性描述,无法实现完全数字化和精确描述,为了度量这种模糊性,本文引入模糊集合概念。
作为一个示例,在给定论域U上的模糊集合A,U中的每一个元素u对A的隶属程度,都可以在区间[0,1]中取不同的实数值来描述。0表示完全不属于,1表示完全属于关系。0.1,0.2…0.9则分别表示归属程度的高低。模糊集合的特征函数就称为隶属函数,记作μA(u),表示u隶属于模糊子集A的程度,称之为u对A的隶属度。
如果定义客户年龄的论域,年轻Y和年老Q为两个模糊集合。
Figure BDA0001823058100000061
Figure BDA0001823058100000062
基于年轻Y和年老Q两个模糊集合,得到μY(30)=0.5,μQ(55)=0.5,表示30岁的客户属于年轻客户的隶属度是0.5,55岁的客户是年老客户的隶属度是0.5。
在模糊集合A中,人们通常按照隶属程度的高低,取一定域值λ进行截割。设给定模糊集合A,对任意实数λ∈[0,1],称普通集合Aλ={u|u∈U,μA(u)≥λ}为A的λ水平截集。通过水平截集,可以实现模糊集合向普通集合的转化。如根据上面的两个集合Y,Q,设λ=0.5,则Y0.5=[0,30],Q0.5=[55,200],表示隶属度是0.5的年轻客户的集合是0-30岁,隶属度是0.5的年老客户的集合是55-200岁。
比如,客户的属性和客户经理的经验信息如表1所示,其中客户网龄和年龄的单位分别是年。
表1
Figure BDA0001823058100000071
在表1中,客户经理的经验是客户网龄较短,客户网龄在[0,1]之间的隶属度为0.7,而且年龄比较小,年龄在[18,30]的隶属度为0.7,经验结论为停机保号的隶属度为0.5,其次是经验结论为携号转网的隶属度为0.4。基于表1中第三行的数据,可以构建如图2所示的模糊决策树。从该模糊决策树中可以看出:
如果客户网龄在[0,1]的范围内、以及客户年龄在[0,18]的范围内,则客户携号转网的置信度S=0.72,即预测该客户会携号转网的准确率为0.72。
如果客户网龄在[1,2]的范围内、以及客户年龄在[0,18]的范围内,则客户停机保号的置信度S=0.58,即预测该客户会停机保号的准确率为0.58。
如果客户网龄在[1,2]的范围内、以及客户年龄在[18,30]的范围内,则客户携号转网的置信度S=0.64,即预测该客户会携号转网的准确率为0.64。
如果客户网龄在[2,100]的范围内,则客户停机保号的置信度S=0.56,即预测该客户会停机保号的准确率为0.56。
其中,对于模糊规则if A then B的置信度S可以采用如下的公式计算:
S(A,B)=M(A∩B)/M(A)=∑u∈Umin(μA(u),μB(u))/∑u∈UμA(u)。
在得到模糊决策树后,利用该模糊决策树可以预测目标客户的行为,根据准确率大小排序,推送给客户经理参考。
比如,客户经理有三个待预测的客户,分别是目标客户A、目标客户B和目标客户C。利用该模糊决策树,预测目标客户A会携号转网,该预测结果的准确率为0.64;预测目标客户B会携号转网,该预测结果的准确率为0.72;预测目标客户C会停机保号,该预测结果的准确率为0.58。按照预测结果的准确率对目标客户进行排序,得到如下的排序:目标客户B、目标客户A和目标客户C。从该排序可以看出:对目标客户B预测的准确率最高,目标客户B发生携号转网的概率最大。按照该排序,将这三个目标客户的预测结果推送给客户经理,以便于客户经理对这三个目标客户展开保有工作。
在本发明一个实施例中,客户行为预测方法还包括:
根据工作人员之间的相似度,确定具有相似关系的工作人员;对于具有相似关系的工作人员中的第一工作人员和第二工作人员,将第一工作人员的经验信息推荐给第二工作人员。
作为一个示例,推荐给第二工作人员的经验信息是取得工作成果的经验信息。比如,推荐给第二工作人员的经验信息是成功保住高流失风险客户的经验信息。
作为一个示例,推荐给第二工作人员的经验信息是未取得工作成果的经验教训信息。比如,推荐给第二工作人员的经验信息是遭到客户投诉或差评的经验教训信息。
作为一个示例,先确定具有相似关系的两个工作人员,再确定具有相似关系的两个以上的工作人员。比如,如果确定工作人员D和工作人员E之间具有相似关系,确定工作人员E和工作人员F之间具有相似关系,则可以确定工作人员D、工作人员E和工作人员F之间具有相似关系。
根据本发明实施例的客户行为预测方法,由于具有相似关系的工作人员之间的客户具有一定的共性,通过将具有相似关系的工作人员的经验信息进行互推,工作人员根据客户以往的使用习惯、行为特征等给出一对一个性化的客户挽留方案。工作人员之间可以相互学习好的工作经验,或者规避差的工作经验,从而可以提高工作人员的工作效率。
在本发明一个实施例中,客户行为预测方法还包括:
根据工作人员的属性,计算工作人员之间的欧几里得距离;根据欧几里得距离,计算工作人员之间的相似度。
需要说明的是,在根据工作人员之间的相似度,确定具有相似关系的工作人员之前,根据工作人员的属性,计算工作人员之间的欧几里得距离。
对于工作人员的属性是单属性,而且工作人员的属性不属于模糊信息,比如,属性是:是否参加过促销活动,可以根据欧几里得距离,计算工作人员之间的相似度。
假设x,y是n维空间的两个点,它们之间的欧几里得距离是d,其中,
Figure BDA0001823058100000091
根据x和y之间的欧几里得距离计算这两个点之间的相似度为sim(x,y),其中,
Figure BDA0001823058100000092
相似度在0到1之间,距离越近,相似度越大。
在本发明一个实施例中,客户行为预测方法还包括:
根据工作人员的属性、工作人员维护的样本客户的属性、工作人员维护的样本客户的属性权重、工作人员的属性权重、以及工作人员在相似度计算中的权重,计算工作人员之间的相似度。
作为一个示例,对于属性是连续值或者模糊值的,可以通过模糊集合理论进行计算。通过将属性转化为数值进行相似度计算,最后加权,计算出工作人员之间的相似度。属性是连续值指的是属性的值连续分布,比如,客户一个月使用的总流量,客户使用的总流量可以是任一个数值。属性是模糊值指的是属性无法实现完全数字化和精确描述,比如属性是年轻、中年和老年。
比如,两个客户经理,分别是客户经理A和客户经理B,客户经理A和客户经理B分别有M个客户,设每个客户都有P个属性,客户经理有R个属性,客户的属性权重为W,工作人员的属性权重为w,客户经理在相似度计算中的权重为λ,则两个客户经理之间的相似度为sim(A,B),
Figure BDA0001823058100000101
其中RiB代表客户经理B的第i个属性,PijB代表客户经理B的第i个客户的第j个属性。如果客户经理A和客户经理B的客户数不一样,随机抽样挑选出数目一致的客户。为将优秀客户经理的经验进行推广,找到相似客户经理后,可以根据客户经理维系效果的好坏,将经验排序后进行推荐,而维系效果可以作为系统内部客户经理信息的一部分。
在本发明一个实施例中,客户行为预测方法还包括:
若样本客户的属性和样本客户对应的经验信息分别不属于模糊信息,则根据样本客户的属性,计算样本客户属性的信息增益;根据样本客户属性的信息增益和样本客户对应的经验信息,构建第二决策树;根据第二决策树,预测目标客户的行为。
作为一个示例,通过ID3算法构建第二决策树。
设E=F1×F2...×Fn是n维有穷向量空间,其中Fi是有穷离散符号集,E中的元素e={V1,V2,...,Vn}成为实例,其中Vi∈Fi,i=1,2,...,n。
1、设客户的属性的值为θ,根据该属性值θ将实例E分为两个子集,其中PE={Vi≥θ,Vi∈Fi},NE={Vi<θ,Vi∈Fi},称PE为实例的正例集,NE为实例的反例集。假设向量空间E的正例集PE和反例集NE的大小分别为p和n,一颗决策树对一个实例作出正确类别判断的信息量为
Figure BDA0001823058100000102
2、如果以属性A具有m个值{v1,v2,...,vm},它将E分成r个子集{E1,E2,...,Er},假设Ei中含有pi个正例和ni个反例,子集Ei所需的期望信息是I(pi,ni),定义以属性A为根节点的所需期望熵为:
Figure BDA0001823058100000103
3、以属性A为根节点的信息增益为Gain(A)=I(p,n)-E(A)。ID3算法计算每个属性的信息增益,选择具有最高信息增益的属性作为根节点,对根节点的各个不同属性值生成子节点,再递归上述过程,最终实现一颗决策树。
ID3算法的基本原理是基于两类分类问题,可以非常容易地将该算法扩展到多个类别。假使样本集S共有C类样本,每类样本数为pi,(i=1,2,...,c),若以属性A作为决策树的根,A具有V个值,V={V1,V2,...,Vc},它将E分成V个子集{E1,E2,...,Ev},Ei中含有j类样本的个数为pij,j=1,2,...,c,那么子集Ei的信息熵是:
Figure BDA0001823058100000111
以A为根分类的信息熵为E(A),
Figure BDA0001823058100000112
选择属性A使E(A)最小,信息增益Gain(A)将最大。
通过引入信息论中的信息增益概念,作为对实体选择的重要特征的度量,以信息增益最大的特征产生决策树节点,由该节点不同取值建立树形分支,然后对各分支递归使用该方法建立决策树的节点和分支,直到将所有实例分类。
在本发明一个实施例中,S101包括:
基于自然语言处理算法,从模板中获取样本客户的属性和样本客户对应的经验信息。
需要说明的是,为实现系统自动化处理分析,需要利用自然语言处理算法,分析出客户经理经验中的关键词以及关键词对应指标值,提取出来,进行模糊决策树算法实现,而此时本系统中提供的模板和要求填写的关键词,可以有效降低自然语言中关键信息的提取难度。常用的自然语言处理算法有词频-逆文本频率指数(Term Frequency–InverseDocument Frequency,TF-IDF)算法、朴素贝叶斯分类和文本聚类等等。
图3示出了本发明实施例的一种客户行为预测装置的结构示意图。该装置300包括:获取模块301、处理模块302和第一预测模块303。
获取模块301,用于从模板中获取样本客户的属性和所述样本客户对应的经验信息,所述经验信息是工作人员在维护所述样本客户时的经验信息。
处理模块302,用于当所述样本客户的属性或者所述样本客户对应的经验信息属于模糊信息时,基于模糊决策树算法,对所述样本客户的属性和所述样本客户对应的经验信息进行处理,得到第一决策树。
第一预测模块303,用于根据所述第一决策树,预测目标客户的行为,所述样本客户和所述目标客户分别是通信运营商的客户。
在本发明的一个实施例中,处理模块302用于,
基于模糊决策树算法,根据所述样本客户的属性和所述样本客户对应的经验信息,计算出多个模糊集合、每个模糊集合的隶属度、至少一个经验结论和每个经验结论的隶属度;根据所述多个模糊集合的隶属度和所述至少一个经验结论的隶属度,构建模糊决策树,作为所述第一决策树。
在本发明的一个实施例中,客户行为预测装置300还包括:
确定模块,用于根据工作人员之间的相似度,确定具有相似关系的工作人员;
推荐模块,用于对于具有相似关系的工作人员中的第一工作人员和第二工作人员,将所述第一工作人员的经验信息推荐给所述第二工作人员。
在本发明的一个实施例中,客户行为预测装置300还包括:
第一计算模块,用于根据工作人员的属性,计算工作人员之间的欧几里得距离;根据所述欧几里得距离,计算所述工作人员之间的相似度。
在本发明的一个实施例中,客户行为预测装置300还包括:
根据工作人员的属性、工作人员维护的所述样本客户的属性、工作人员维护的所述样本客户的属性权重、工作人员的属性权重、以及工作人员在相似度计算中的权重,计算工作人员之间的相似度。
在本发明的一个实施例中,还包括:第二计算模块、构建模块和第二预测模块。
第二计算模块,用于若所述样本客户的属性和所述样本客户对应的经验信息分别不属于模糊信息,则根据所述样本客户的属性,计算所述样本客户属性的信息增益。
构建模块,用于根据所述样本客户属性的信息增益和所述样本客户对应的经验信息,构建第二决策树。
第二预测模块,用于根据所述第二决策树,预测目标客户的行为。
在本发明的一个实施例中,获取模块301用于,
基于自然语言处理算法,从所述模板中获取所述样本客户的属性和所述样本客户对应的经验信息。
图4示出了本发明实施例的一种计算设备的示例性硬件架构的结构图。如图4所示,计算设备400包括输入设备401、输入接口402、处理器403、存储器404、输出接口405、以及输出设备406。
其中,输入接口402、处理器403、存储器404、以及输出接口405通过总线410相互连接,输入设备401和输出设备406分别通过输入接口402和输出接口405与总线410连接,进而与计算设备400的其他组件连接。
具体地,输入设备401接收来自外部的输入信息,并通过输入接口402将输入信息传送到处理器403;处理器403基于存储器404中存储的计算机程序指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器404中,然后通过输出接口405将输出信息传送到输出设备406;输出设备406将输出信息输出到计算设备400的外部供用户使用。
当计算机程序指令被处理器403执行时实现如上述的方法中的各步骤。
处理器403可以是一个或多个中央处理器(英文:Central Processing Unit,CPU)。在处理器403是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
存储器404可以是但不限于随机存储存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM),可擦除可编程只读存储器(Erasable ProgrammableRead Only Memory,EPROM)、光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、硬盘等中的一种或多种。存储器404用于存储程序代码。
可以理解的是,在本申请实施例中,图3提供的任一模块或全部模块的功能可以用图4所示的处理器403实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机程序指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机程序指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机程序指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本说明书的各个部分均采用递进的方式进行描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点介绍的都是与其他实施例不同之处。尤其,对于装置和系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例部分的说明即可。

Claims (10)

1.一种客户行为预测方法,其特征在于,包括:
从模板中获取样本客户的属性和所述样本客户对应的经验信息,所述经验信息是工作人员在维护所述样本客户时的经验信息;
若所述样本客户的属性或者所述样本客户对应的经验信息属于模糊信息,则基于模糊决策树算法,对所述样本客户的属性和所述样本客户对应的经验信息进行处理,得到第一决策树;
根据所述第一决策树,预测目标客户的行为,所述样本客户和所述目标客户分别是通信运营商的客户。
2.根据权利要求1所述的方法,其特征在于,所述基于模糊决策树算法,对所述样本客户的属性和所述样本客户对应的经验信息进行处理,得到第一决策树,包括:
基于模糊决策树算法,根据所述样本客户的属性和所述样本客户对应的经验信息,计算出多个模糊集合、每个模糊集合的隶属度、至少一个经验结论和每个经验结论的隶属度;
根据所述多个模糊集合的隶属度和所述至少一个经验结论的隶属度,构建模糊决策树,作为所述第一决策树。
3.根据权利要求1所述的方法,其特征在于,还包括:
根据工作人员之间的相似度,确定具有相似关系的工作人员;
对于具有相似关系的工作人员中的第一工作人员和第二工作人员,将所述第一工作人员的经验信息推荐给所述第二工作人员。
4.根据权利要求3所述的方法,其特征在于,还包括:
根据工作人员的属性,计算工作人员之间的欧几里得距离;
根据所述欧几里得距离,计算所述工作人员之间的相似度。
5.根据权利要求3所述的方法,其特征在于,还包括:
根据工作人员的属性、工作人员维护的所述样本客户的属性、工作人员维护的所述样本客户的属性权重、工作人员的属性权重、以及工作人员在相似度计算中的权重,计算工作人员之间的相似度。
6.根据权利要求1所述的方法,其特征在于,还包括:
若所述样本客户的属性和所述样本客户对应的经验信息分别不属于模糊信息,则根据所述样本客户的属性,计算所述样本客户属性的信息增益;
根据所述样本客户属性的信息增益和所述样本客户对应的经验信息,构建第二决策树;
根据所述第二决策树,预测目标客户的行为。
7.根据权利要求1所述的方法,其特征在于,所述从模板中获取样本客户的属性和所述样本客户对应的经验信息,包括:
基于自然语言处理算法,从所述模板中获取所述样本客户的属性和所述样本客户对应的经验信息。
8.一种客户行为预测装置,其特征在于,包括:
获取模块,用于从模板中获取样本客户的属性和所述样本客户对应的经验信息,所述经验信息是工作人员在维护所述样本客户时的经验信息;
处理模块,用于当所述样本客户的属性或者所述样本客户对应的经验信息属于模糊信息时,基于模糊决策树算法,对所述样本客户的属性和所述样本客户对应的经验信息进行处理,得到第一决策树;
第一预测模块,用于根据所述第一决策树,预测目标客户的行为,所述样本客户和所述目标客户分别是通信运营商的客户。
9.一种计算设备,其特征在于,包括:处理器、存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN201811173182.7A 2018-10-09 2018-10-09 客户行为预测方法、装置、设备及介质 Pending CN111026863A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811173182.7A CN111026863A (zh) 2018-10-09 2018-10-09 客户行为预测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811173182.7A CN111026863A (zh) 2018-10-09 2018-10-09 客户行为预测方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN111026863A true CN111026863A (zh) 2020-04-17

Family

ID=70190650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811173182.7A Pending CN111026863A (zh) 2018-10-09 2018-10-09 客户行为预测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111026863A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113543117A (zh) * 2020-04-22 2021-10-22 中国移动通信集团重庆有限公司 携号转网用户的预测方法、装置及计算设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005078240A (ja) * 2003-08-29 2005-03-24 Mamoru Tanaka データマイニングによる知識抽出法
CN102567807A (zh) * 2010-12-23 2012-07-11 上海亚太计算机信息系统有限公司 加油卡客户流失预测方法
US20150081469A1 (en) * 2013-09-17 2015-03-19 International Business Machines Corporation Assisting buying decisions using customer behavior analysis
CN104915898A (zh) * 2015-06-26 2015-09-16 南京易司拓电力科技股份有限公司 一种电压质量原因分析的方法和装置
CN105786983A (zh) * 2016-02-15 2016-07-20 云南电网有限责任公司 一种基于学习地图与协同过滤的员工个性化学习推荐方法
CN106202886A (zh) * 2016-06-29 2016-12-07 中国铁路总公司 基于模糊粗糙集与决策树的轨道电路红光带故障定位方法
CN107832581A (zh) * 2017-12-15 2018-03-23 百度在线网络技术(北京)有限公司 状态预测方法和装置
CN108121795A (zh) * 2017-12-20 2018-06-05 北京奇虎科技有限公司 用户行为预测方法及装置
WO2018107488A1 (zh) * 2016-12-16 2018-06-21 深圳大学 基于提升直觉模糊树的目标跟踪方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005078240A (ja) * 2003-08-29 2005-03-24 Mamoru Tanaka データマイニングによる知識抽出法
CN102567807A (zh) * 2010-12-23 2012-07-11 上海亚太计算机信息系统有限公司 加油卡客户流失预测方法
US20150081469A1 (en) * 2013-09-17 2015-03-19 International Business Machines Corporation Assisting buying decisions using customer behavior analysis
CN104915898A (zh) * 2015-06-26 2015-09-16 南京易司拓电力科技股份有限公司 一种电压质量原因分析的方法和装置
CN105786983A (zh) * 2016-02-15 2016-07-20 云南电网有限责任公司 一种基于学习地图与协同过滤的员工个性化学习推荐方法
CN106202886A (zh) * 2016-06-29 2016-12-07 中国铁路总公司 基于模糊粗糙集与决策树的轨道电路红光带故障定位方法
WO2018107488A1 (zh) * 2016-12-16 2018-06-21 深圳大学 基于提升直觉模糊树的目标跟踪方法及装置
CN107832581A (zh) * 2017-12-15 2018-03-23 百度在线网络技术(北京)有限公司 状态预测方法和装置
CN108121795A (zh) * 2017-12-20 2018-06-05 北京奇虎科技有限公司 用户行为预测方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113543117A (zh) * 2020-04-22 2021-10-22 中国移动通信集团重庆有限公司 携号转网用户的预测方法、装置及计算设备
CN113543117B (zh) * 2020-04-22 2022-10-04 中国移动通信集团重庆有限公司 携号转网用户的预测方法、装置及计算设备

Similar Documents

Publication Publication Date Title
US11301884B2 (en) Seed population diffusion method, device, information delivery system and storage medium
WO2015192667A1 (zh) 推荐广告的方法及广告推荐服务器
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
Tran et al. Hashtag recommendation approach based on content and user characteristics
CN107451832B (zh) 推送信息的方法和装置
CN110390408B (zh) 交易对象预测方法和装置
JP2018511116A (ja) 端末にプッシュされるデータコンテンツを選択するための方法およびデバイス
CN108665148B (zh) 一种电子资源质量评价方法、装置和存储介质
CN107247798B (zh) 构建搜索词库的方法和装置
CN112818230B (zh) 内容推荐方法、装置、电子设备和存储介质
CN110866767A (zh) 电信用户满意度的预测方法、装置、设备及介质
CN111695084A (zh) 模型生成方法、信用评分生成方法、装置、设备及存储介质
CN111179055A (zh) 授信额度调整方法、装置和电子设备
CN111753151B (zh) 一种基于互联网用户行为的服务推荐方法
CN111582394B (zh) 一种群体评估方法、装置、设备及介质
CN111026863A (zh) 客户行为预测方法、装置、设备及介质
CN115858815A (zh) 确定映射信息的方法、广告推荐方法、装置、设备及介质
CN112231299B (zh) 一种特征库动态调整的方法和装置
CN110766488A (zh) 一种自动确定主题场景的方法和装置
CN114756764A (zh) 基于企业的内容信息流推荐方法、装置、电子设备及存储介质
CN116610853A (zh) 搜索推荐方法、搜索推荐系统、计算机设备及存储介质
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN114528378A (zh) 文本分类方法、装置、电子设备及存储介质
CN113868481A (zh) 组件获取方法、装置及电子设备和存储介质
CN114969494A (zh) 有效行为确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination