CN111985577A - 基于人工智能的客户价值标注方法、装置、设备及介质 - Google Patents

基于人工智能的客户价值标注方法、装置、设备及介质 Download PDF

Info

Publication number
CN111985577A
CN111985577A CN202010910523.5A CN202010910523A CN111985577A CN 111985577 A CN111985577 A CN 111985577A CN 202010910523 A CN202010910523 A CN 202010910523A CN 111985577 A CN111985577 A CN 111985577A
Authority
CN
China
Prior art keywords
customer
client
behavior data
value
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010910523.5A
Other languages
English (en)
Inventor
刘晓轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN202010910523.5A priority Critical patent/CN111985577A/zh
Publication of CN111985577A publication Critical patent/CN111985577A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,公开一种基于人工智能的客户价值标注方法、装置、设备及介质,该基于人工智能的客户价值标注方法包括定时采集每一客户对应的购买行为数据;对每一所述客户对应的购买行为数据进行异常值和缺失值处理,获取有效行为数据;基于所述有效行为数据进行统计,获取所述客户对应的包含至少一个统计特征的目标样本数据;采用kmeans聚类算法对所述目标样本数据进行聚类分析,得到至少一个聚类簇,所述聚类簇用于指示客户类别一致的客户群体;对所述聚类簇进行特征分析,以对每一所述聚类簇对应的客户群体进行客户价值标注。该方法可有效解决有监督学习时需要运营人员根据经验手动对客户进行价值标注的问题。

Description

基于人工智能的客户价值标注方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的客户价值标注方法、装置、设备及介质。
背景技术
数据分类是机器学习应用场景之一,机器学习实现分类又分为监督学习与无监督学习。有监督学习是使用已知数据与数据所属类型的关系使用机器学习算法分析数据与类型的规律,从而实现对未知的数据进行分类,因此需要预先对数据所属类别进标注。
当前,对于客户价值分析模型的学习,一般是由运营人员来分析客户数据进行分类或使用固定的规则来对客户标记分类,细粒度较粗,效率较低且灵活度不强。
发明内容
本发明实施例提供一种基于人工智能的客户价值标注方法、装置、设备及介质,以解决当前针对客户价值分析模型的客户价值标注,细粒度较粗,效率较低且灵活度不强问题。
一种基于人工智能的客户价值标注方法,包括:
定时采集每一客户对应的购买行为数据;
对每一所述客户对应的购买行为数据进行异常值和缺失值处理,获取有效行为数据;
基于所述有效行为数据进行统计,获取所述客户对应的包含至少一个统计特征的目标样本数据;
采用kmeans聚类算法对所述目标样本数据进行聚类分析,得到至少一个聚类簇,所述聚类簇用于指示客户类别一致的客户群体;
对所述聚类簇进行特征分析,以对每一所述聚类簇对应的客户群体进行客户价值标注。
一种客户价值标注装置,包括:
数据采集模块,用于定时采集每一客户对应的购买行为数据;
数据处理模块,用于对每一所述客户对应的购买行为数据进行异常值和缺失值处理,获取有效行为数据;
数据统计模块,用于基于所述有效行为数据进行统计,获取所述客户对应的包含至少一个统计特征的目标样本数据;
聚类模块,用于采用kmeans聚类算法对所述目标样本数据进行聚类分析,得到至少一个聚类簇,所述聚类簇用于指示客户类别一致的客户群体;
客户价值标注模块,用于对所述聚类簇进行特征分析,以对每一所述聚类簇对应的客户群体进行客户价值标注。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于人工智能的客户价值标注方法的步骤。
一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于人工智能的客户价值标注方法的步骤。
上述基于人工智能的客户价值标注方法、装置、设备及介质中,通过获取定时采集每一客户对应的购买行为数据,以对每一客户对应的购买行为数据进行异常值和缺失值处理,以排除干扰因素,获取有效行为数据。然后,基于有效行为数据进行统计,获取客户对应的包含至少一个统计特征的目标样本数据,再采用kmeans聚类算法对目标样本数据进行聚类分析,得到至少一个聚类簇,以通过无监督学习方式对客户价值进行分析标注,可而解决有监督学习时需要运营人员根据经验手动对客户进行价值标注的问题。最后,对聚类簇进行特征分析,以对每一聚类簇对应的客户群体进行类别实例化,实现客户价值的自动标注。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于人工智能的客户价值标注方法的一应用环境示意图;
图2是本发明一实施例中基于人工智能的客户价值标注方法的一流程图;
图3是图2中步骤S202的一具体流程图;
图4是图2中步骤S204的一具体流程图;
图5是图4中步骤S401的一具体流程图;
图6是本发明一实施例中基于人工智能的客户价值标注方法的一流程图;
图7是本发明一实施例中基于人工智能的客户价值标注方法的一流程图;
图8是本发明一实施例中基于人工智能的客户价值标注方法的一流程图;
图9是本发明一实施例中客户价值标注装置的一示意图;
图10是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于人工智能的客户价值标注方法可应用在如图1的应用环境中,其中,计算机设备通过网络与服务器进行通信。计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器来实现。
在一实施例中,如图2所示,提供一种基于人工智能的客户价值标注方法,以该方法应用在图1中的监控平台为例进行说明,包括如下步骤:
S201:定时采集每一客户对应的购买行为数据。
具体地,用户可按照实际需求设置定时采集客户购买行为数据的时间,以使服务器在当前系统时间为定时分析时间时,自动采集每一客户从当前时间起至客户首次注册时间这一客户关系长度内的所有购买行为数据,以动态更新每一客户的客户类别。
可以理解地,该购买行为数据的采集也可根据实际需要,由用户手动启动程序,此处不做限定。
S202:对每一客户对应的购买行为数据进行异常值和缺失值处理,获取有效行为数据。
其中,购买行为数据包括但不限于购买产品类型、购买数量、购买成功、购买金额、购买时间中的一个或多个。具体地,为了提高后续统计分析的准确率和效率,故需要每一所述客户对应的购买行为数据进行异常值和缺失值处理,以排除干扰因素,获取有效行为数据。
S203:基于有效行为数据进行统计,获取客户对应的包含至少一个统计特征的目标样本数据。
本实施例中,统计特征即指用于客户价值分析所需的特征维度,该统计特征包括但不限于客户关系长度(即客户注册之日至数据采样结束日期的时间间隔,单位:天)、产品购买频率、产品购买金额、产品购买类型数量以及采样结束日期前客户最后一次购买产品的日期与数据采样结束日期的时间间隔(单位:天)。可以理解地,该采样结束日期即为用户预先指定的定时分析时间。
S204:采用kmeans聚类算法对目标样本数据进行聚类分析,得到至少一个聚类簇,聚类簇用于指示客户类别一致的客户群体。
其中,kmeans聚类算法也称k均值聚类算法,是集简单和经典于一身的基于距离的聚类算法。它采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为类簇是由距离靠近的对象组成的,因此把得到紧凑且独立的聚类簇作为最终目标。
可以理解地,通过采用kmeans聚类算法对目标样本数据进行聚类分析,以通过无监督学习方式对客户价值进行分析标注,可而解决有监督学习时需要运营人员根据经验手动对客户进行价值标注的问题。
S205:对聚类簇进行特征分析,以对每一聚类簇对应的客户群体进行客户价值标注。
本实施例中,通过对每一聚类簇对应的统计特征进行分析,以按照关键特征(如购买金额、购买频率)对所述聚类簇进行排序,确定该聚类簇的客户类别,即关键特征对应的特征值越大,客户价值越高。该客户类别按照客户价值从大到小包括重点客户、重要发展客户、重要维持客户和普通客户。
进一步地,本实施例中还可调用雷达图绘制模块将每一客户类别在不同维度的值连接起来,以绘制雷达图,从而直观分析每一聚类簇的所属的客户类别(即重点客户、重要发展客户、重要维持客户和普通客户)。
本实施例中,通过获取定时采集每一客户对应的购买行为数据,以对每一客户对应的购买行为数据进行异常值和缺失值处理,以排除干扰因素,获取有效行为数据。然后,基于有效行为数据进行统计,获取客户对应的包含至少一个统计特征的目标样本数据,再采用kmeans聚类算法对目标样本数据进行聚类分析,得到至少一个聚类簇,以通过无监督学习方式对客户价值进行分析标注,可而解决有监督学习时需要运营人员根据经验手动对客户进行价值标注的问题。最后,对聚类簇进行特征分析,以对每一聚类簇对应的客户群体进行类别实例化,实现客户价值的自动标注,且可为客户喜好分析模型提供数据来源。
在一实施例中,如图3所示,步骤S202中,即对每一客户对应的购买行为数据进行异常值和缺失值处理,获取有效行为数据,具体包括如下步骤:
S301:判断购买行为数据中是否存在缺失值,若购买行为数据不存在缺失值,则购买行为数据作为中间行为数据。
其中,中间行为数据是指不存在缺失值的购买行为数据。缺失值是指购买行为数据中由于部分信息暂时无法获取,致使一部分属性值空缺,或者部分信息由于一些人为因素而丢失或者,部分有些对象的某个或某些属性是不可用的或者由于获取某些信息的代价太大,从而未获取数据等原因所造成的信息的缺失。例如,购买行为数据中,购买产品类型字段对应的值为空或者不完全,则购买产品类型字段对应的值为缺失值。具体地,服务端对获取到的每一购买行为数据进行判断,确定每一购买行为数据是否完整即是否存在缺失值。
具体地,服务端判断出购买行为数据不存在缺失值,即购买行为数据中每一字段的数据为完整数据,则将该购买行为数据作为目标样本数据。通过将不存在缺失值的购买行为数据作为目标样本数据,使得目标样本数据为完整的数据。
S302:若购买行为数据存在缺失值,则获取缺失值对应的缺失字段。
其中,缺失字段是指购买行为数据中存在缺失值对应的字段。具体地,服务端判断出购买行为数据中存在缺失值,则获取购买行为数据中每一缺失值对应的缺失字段,通过确定缺失值对应的缺失字段,以便后续确定是否需要对缺失值进行填充处理。
S303:若缺失字段为必要字段,则对缺失字段进行缺失值填充处理,获取中间行为数据。
其中,必要字段是指客户价值分析所需的数据字段。通过确定该字段是否为必要字段,即确定该字段对应的缺失值是否为统计分析所需的数据。若该字段为必要字段,则对该缺失值进行填充处理,即采用默认值对缺失值进行填充处理,例如购买金额,若用户为新注册用户,并无实际购买行为,则购买金额值缺失,默认填充0,以保证客户价值分析的全面性,不因数据缺失而无法执行价值分析程序。
S304:若缺失字段为非必要字段,则不对缺失字段进行处理,将购买行为数据作为中间行为数据。
具体地,若该缺失字段字段为非必要字段,即确定该字段对应的缺失值不是客户价值分析所需的数据,则无需对缺失值进行处理,直接将购买行为数据作为中间行为数据,以加快对购买行为数据进行预处理的效率。
S305:判断中间行为数据是否存在异常值,若中间行为数据存在异常值,则对中间行为数据进行异常值处理,去除购买行为无效的数据,获取有效行为数据。
其中,异常值是指中间行为数据中的购买行为异常的数据,例如购买失败、取消购买、扣款失败。
本实施例中,对中间行为数据进行异常值处理具体包括:识别中间行为数据中是否存在异常值,若为异常值,则将该中间行为数据进行异常值处理,即对于取消购买的,则认为本次购买行为是无效的,可标记为无效,故该次购买行为在后续进行统计时不参与计算,即购买次数、购买金额和购买数量均不参与记录;对于购买失败和扣款失败的,由于该购买行为是由于外界因素导致的,并不是客户主观导致,认为本次购买行为是有效的,可标记为有效,故该次购买行为在后续进行统计时需要参与计算,即购买次数、购买金额和购买数量均参与记录。
在一实施例中,如图4所示,步骤S204中,即采用kmeans聚类算法对目标样本数据进行聚类分析,得到至少一个聚类簇,具体包括如下步骤:
S401:初始化聚类簇数量,并按照预设质心选取策略选取初始质心;聚类簇数量用于指示初始质心的数量。
S402:计算每一聚类簇的初始质心与目标样本数据之间的距离,将距离初始质心最近的目标样本数据聚集在同一聚类簇中。
S403:更新每一聚类簇的质心,计算每一聚类簇的当前质心与目标样本数据之间的距离,将距离初始质心最近的目标样本数据聚集在同一聚类簇中,直到聚类簇对应的更新后的质心与更新前的质心之间的距离小于预设距离。
其中,k即为聚类簇的数量,即客户类别数量,本实施例中K值设定为4,可根据实际需要设置,此处不做限定。通过按照预设质心选取策略,以选取合适的k质心作为每一聚类簇的初始质心。再通过欧氏距离或余弦相似度算法计算每一聚类簇的初始质心与所述目标样本数据之间的距离,将距离所述初始质心最近的目标样本数据聚集在同一聚类簇中,不断迭代聚类,直到聚类簇对应的更新后的质心与更新前的质心之间的距离小于预设距离(根据经验设定的算法收敛条件),以得到至少一个聚类簇。
本实施例中,通过采用kmeans聚类算法对对目标样本数据进行聚类分析,得到至少一个聚类簇,以通过无监督学习方式对客户价值进行分析标注,可而解决有监督学习时需要运营人员根据经验手动对客户进行价值标注的问题。
在一实施例中,如图5所示,步骤S401中,即按照预设质心选取策略选取初始质心,具体包括如下步骤:
S501:随机选取一目标样本数据作为一个初始质心。
S502:计算每一目标样本数据与初始质心间的距离,得到最短距离。
S503:按照质心选取概率计算公式,对最短距离进行计算,得到质心选取概率;质心选取概率用于描述每一目标样本数据作为下一质心的概率。
S504:基于质心选取概率,计算每一目标样本数据的概率累加和。
S505:基于概率累加和,采用轮盘提取算法对目标样本数据进行选取,得到下一初始质心,继续执行计算每一目标样本数据与初始质心间的距离,得到最短距离的步骤,直到初始质心的数量达到聚类簇数量。
具体地,通过先随机选取一个质心作为初始质心,然后再计算每一目标样本数据x与该初始质心间的距离,得到最短距离Z(x),按照质心选取概率计算公式即
Figure BDA0002663086030000071
得到质心选取概率,基于所述质心选取概率,通过对p(x)进行累加以计算每一目标样本数据的概率累加和sum(x),采用轮盘提取算法对目标样本数据进行选取即随机选取0~1之间的随机数,该随机数落在哪一目标样本数据对应的数值区间,则将该目标样本数据作为下一个聚类簇的初始质心。
示例性地,若P(X)={0.2,0.355,0.056,0.09},则sum(x)={0.2,0.2+0.355,0.2+0.355+0.056,0.2+0.355+0.056+0.09},有样本数据X1-X4的数值区间依次为[0,0.2)、[0.2,0.555)、[0.555,0.611)、[0.611,0.701)。采用random函数随机生成一随机数,如0.58,则其落在目标样本数据X3对应的数值区间内,则将目标样本数据X3选取为下一个聚类簇的初始质心,之后迭代执行步骤S502-步骤S505,直至选取K个初始质心。
本实施例中,由于传统的kmeans聚类算法是随机选取K个初始质心,再进行后续的聚类步骤,但由于初始质心的选取具有随机性,使得kmeans聚类算法的聚类效率低,故本实施例中通过先随机选取一个初始质心,然后根据质心选取概率和轮盘提取算法,以选取到N个初始质心,可保证N个初始质心相互之间的距离尽可能的远,从而保证算法结果的准确率和效率。
在一实施例中,如图6所示,步骤S205之后,该基于人工智能的客户价值标注方法还包括如下步骤:
S601:定时检测每一客户对应的当前客户类别,当前客户类别指示客户在当前定时检测点下的客户类别。本实施例中的客户类别按照客户价值从大到小包括重点客户、重要发展客户、重要维持客户和普通客户等。
其中,定时检测点是预先设定的用于检测的每一客户对应的客户类别的检测时间点,例如每月的15日。
S602:根据客户的当前客户类别以及原始客户类别,检测客户类别的变化;原始客户类别指示客户在上一定时检测点下的客户类别。
其中,原始客户类别表示该客户在上一定时检测点下的客户类别,例如定时检测时间点为每月的15日,则当前客户类别为当月的15日(例如6月15日)所检测的的客户类别,而原始客户类别即指上个月的15日(即7月15日)所检测的客户类别。
S603:若当前客户类别的变化为等级下降,则将客户类别变化为等级下降的客户作为目标客户。
具体地,通过定时检测每一客户的当前客户类别,并与上一客户类别进行对比,若该当前客户类别与上一次分析确定到的客户类别相比的变化为等级下降,将该客户作为目标客户,以便对该类目标客户执行对应的处理策略,以提升其客户价值。
S604:分析目标客户的购买行为数据,确定目标客户的喜好数据。
S605:根据喜好数据,为目标客户推荐对应的产品。
作为一示例,若客户的类别下降,则可与促销系统对接,以个性化推荐与营销,即分析目标客户的购买行为数据,如产品类型、购买金额,确定所述目标客户的喜好(即统计分析该目标客户一般喜欢购买什么类型的产品、购买价值区间等),再根据目标客户的喜好,为目标客户推荐对应的产品。
进一步地,该推荐方式包括但不限于短信模式、客户端网络信息推送模式或者外呼模式,此处不作限定。
本实施例中,通过对客户类别的变化进行监控,以便对客户类别的等级提升或等级下降执行相关处理,提升客户价值。
在一实施例中,如图7所示,步骤S602之后,该基于人工智能的客户价值标注方法还包括如下步骤:
S701:若当前客户类别的变化为等级提升,则将客户类别的变化为提升的客户作为目标客户,并将目标客户加入外呼名单中。
S702:基于外呼名单,调用外呼模块进行过外呼。
本实施例中,若当前客户类别的变化为等级提升,则可调研该目标客户的客户的客户类别变化的原因,从而收集目标客户反馈的有效调研信息,便于进一步分析客户的购买习惯。
在一实施例中,如图8所示,步骤S702中,即基于外呼名单,调用外呼模块进行过外呼,具体包括如下步骤:
S801:获取外呼名单中每一目标客户对应的客户职业和客户所属区域。
其中,客户所属区域是指客户所在城市的区域属性,如北方或南方。可理解地,客户职业和客户所属区域可从客户信息库中提取得到。
S802:根据客户职业和客户所属区域,确定每一目标客户对应的待呼叫时间。
S803:基于每一目标客户对应的待呼叫时间,分别对目标客户进行外呼。
本实施例中,由于客户职业和客户所属区域不同,其对应的呼叫时间不同,服务器根据目标客户对应的客户职业和客户所属区域,确定每一目标客户对应的待呼叫时间,即先通过客户职业确定第一空闲时间,再根据客户所属区域确定第二空闲时间,取第一空闲时间和第二空闲时间的交集作为目标客户对应的待呼叫时间,以便服务器根据每一客户的待呼叫时间从外呼名单中选取N个目标客户进行外呼进行自动外呼。例如,若客户的职业为教师,一般在中午会有闲余时间接听电话,则上午11:00-上午12:00为接通率较高时间。再根据客户的现居地确定当地上下班时间,如北方城市在夏天的上下班时间分别为上午上班时间8:00-11:30,下午上班时间14:00-17:30;冬天时,一般为上午上班时间8:30-12:00,下午上班时间13:30-15:00。而南方城市一般为上午上班时间9:00-12:00,下午上班时间14:00-18:00。若某客户的客户职业为教师,且其所在城市为南方城市,当前季节为夏天,则按照预设规则可排除上下班时间,即可根据客户职业确定第一空闲时间为上午11:30-下午12:30,再根据客户所属区域确定第二空闲时间即上午12:00-下午14:00,取第一空闲时间和第二空闲时间的交集即上午12:00-下午12:30即为目标客户对应的待呼叫时间,即外呼模块可在该区间内对目标客户进行自动外呼,以提高外呼接通率,降低外呼成本。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种客户价值标注装置,该客户价值标注装置与上述实施例中基于人工智能的客户价值标注方法一一对应。如图8所示,该客户价值标注装置包括数据采集模块10、数据处理模块20、数据统计模块30、聚类模块40和客户价值标注模块50。各功能模块详细说明如下:
数据采集模块10,用于定时采集每一客户对应的购买行为数据。
数据处理模块20,用于对每一客户对应的购买行为数据进行异常值和缺失值处理,获取有效行为数据。
数据统计模块30,用于基于有效行为数据进行统计,获取客户对应的包含至少一个统计特征的目标样本数据。
聚类模块40,用于采用kmeans聚类算法对目标样本数据进行聚类分析,得到至少一个聚类簇,聚类簇用于指示客户类别一致的客户群体。
客户价值标注模块50,用于对聚类簇进行特征分析,以对每一聚类簇对应的客户群体进行客户价值标注。
数据处理模块包括第一判断单元、第一处理单元、第二处理单元、第三处理单元和第二判断单元。
第一判断单元,用于判断购买行为数据中是否存在缺失值,若购买行为数据不存在缺失值,则购买行为数据作为中间行为数据。
第一处理单元,用于若购买行为数据存在缺失值,则获取缺失值对应的缺失字段。
第二处理单元,用于若缺失字段为必要字段,则对缺失字段进行进行缺失值填充处理,获取中间行为数据。
第三处理单元,用于若缺失字段为非必要字段,则不对缺失字段进行处理,将购买行为数据作为中间行为数据。
第二判断单元,用于判断中间行为数据是否存在异常值,若中间行为数据存在异常值,则对中间行为数据进行异常值处理,去除购买行为无效的数据,获取有效行为数据。
具体地,聚类模块包括初始化单元、聚类单元和质心更新迭代单元。
初始化单元,用于初始化聚类簇数量,并按照预设质心选取策略选取初始质心;聚类簇数量用于指示初始质心的数量。
聚类单元,用于计算每一聚类簇的初始质心与目标样本数据之间的距离,将距离初始质心最近的目标样本数据聚集在同一聚类簇中。
质心更新迭代单元,用于更新每一聚类簇的质心,计算每一聚类簇的当前质心与目标样本数据之间的距离,将距离初始质心最近的目标样本数据聚集在同一聚类簇中,直到聚类簇对应的更新后的质心与更新前的质心之间的距离小于预设距离。
具体地,初始化单元包括初始质心选取子单元、最短距离计算子单元、质心选取子单元、概率累加和计算子单元和质心迭代选取子单元。
初始质心选取子单元,用于随机选取一目标样本数据作为一个初始质心。
最短距离计算子单元,用于计算每一目标样本数据与初始质心间的距离,得到最短距离。
质心选取子单元,用于按照质心选取概率计算公式,对最短距离进行计算,得到质心选取概率;质心选取概率用于描述每一目标样本数据作为下一质心的概率。
概率累加和计算子单元,用于基于质心选取概率,计算每一目标样本数据的概率累加和。
质心迭代选取子单元,用于基于概率累加和,采用轮盘提取算法对目标样本数据进行选取,得到下一初始质心,继续执行计算每一目标样本数据与初始质心间的距离,得到最短距离的步骤,直到初始质心的数量达到聚类簇数量。
具体地,该客户价值标注装置还包括客户类别定时检测模块、类别变化检测模块、目标客户确定模块、目标客户喜好确定模块和产品推荐模块。
客户类别定时检测模块,用于定时检测每一客户对应的当前客户类别,当前客户类别指示客户在当前定时检测点下的客户类别。
类别变化检测模块,用于根据客户的当前客户类别以及原始客户类别,检测客户类别的变化;原始客户类别指示客户在上一定时检测点下的客户类别。
第一目标客户确定模块,用于若当前客户类别的变化为等级下降,则将客户类别变化为等级下降的客户作为目标客户。
目标客户喜好确定模块,用于分析目标客户的购买行为数据,确定目标客户的喜好数据。
产品推荐模块,用于根据喜好数据,为目标客户推荐对应的产品。
具体地,该客户价值标注装置还包括第二目标客户确定模块和自动外呼模块。
第二目标客户确定模块,用于若当前客户类别的变化为等级提升,则将客户类别变化为等级提升的客户作为目标客户,并将目标客户加入外呼名单中。
自动外呼模块,用于基于外呼名单,调用外呼模块进行过外呼。
具体地,该客户价值标注装置还包括客户数据获取单元、待呼叫时间确定单元和外呼单元。
客户数据获取单元,用于获取外呼名单中每一目标客户对应的客户职业和客户所属区域。
待呼叫时间确定单元,用于根据客户职业和客户所属区域,确定每一目标客户对应的待呼叫时间。
外呼单元,用于基于每一目标客户对应的待呼叫时间,分别对目标客户进行外呼。
关于客户价值标注装置的具体限定可以参见上文中对于基于人工智能的客户价值标注方法的限定,在此不再赘述。上述客户价值标注装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括计算机存储介质、内存储器。该计算机存储介质存储有操作系统、计算机程序和数据库。该内存储器为计算机存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储执行基于人工智能的客户价值标注方法过程中生成或获取的数据,如客户类别。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的客户价值标注方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中的基于人工智能的客户价值标注方法的步骤,例如图2所示的步骤S201-S205。或者,处理器执行计算机程序时实现客户价值标注装置这一实施例中的各模块/单元的功能,例如图9所示的各模块/单元的功能,为避免重复,这里不再赘述。
在一实施例中,提供一计算机存储介质,该计算机存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中用户帐号解锁方法的步骤,例如图2所示的步骤S201-S205,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述客户价值标注装置这一实施例中的各模块/单元的功能,例如图9所示的各模块/单元的功能,为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能的客户价值标注方法,其特征在于,包括:
定时采集每一客户对应的购买行为数据;
对每一所述客户对应的购买行为数据进行异常值和缺失值处理,获取有效行为数据;
基于所述有效行为数据进行统计,获取所述客户对应的包含至少一个统计特征的目标样本数据;
采用kmeans聚类算法对所述目标样本数据进行聚类分析,得到至少一个聚类簇,所述聚类簇用于指示客户类别一致的客户群体;
对所述聚类簇进行特征分析,以对每一所述聚类簇对应的客户群体进行客户价值标注。
2.如权利要求1所述基于人工智能的客户价值标注方法,其特征在于,所述对每一所述客户对应的购买行为数据进行异常值和缺失值处理,获取有效行为数据,包括:
判断所述购买行为数据中是否存在缺失值,若所述购买行为数据不存在缺失值,则将所述购买行为数据作为有效行为数据;
若所述购买行为数据存在缺失值,则获取所述缺失值对应的缺失字段;
若所述缺失字段为必要字段,则对所述缺失字段进行缺失值填充处理,获取中间行为数据;
若所述缺失字段为非必要字段,则不对所述缺失字段进行处理,将所述购买行为数据作为中间行为数据;
判断所述中间行为数据是否存在异常值,若所述中间行为数据存在异常值,则对所述中间行为数据进行异常值处理,去除购买行为无效的数据,获取有效行为数据。
3.如权利要求1所述基于人工智能的客户价值标注方法,其特征在于,所述采用kmeans聚类算法对所述目标样本数据进行聚类分析,得到至少一个聚类簇,包括;
初始化聚类簇数量,并按照预设质心选取策略选取初始质心;所述聚类簇数量用于指示初始质心的数量;
计算每一聚类簇的初始质心与所述目标样本数据之间的距离,将距离所述初始质心最近的目标样本数据聚集在同一聚类簇中;
更新每一所述聚类簇的质心,计算每一聚类簇的当前质心与所述目标样本数据之间的距离,将距离所述初始质心最近的所述目标样本数据聚集在同一聚类簇中,直到所述聚类簇对应的更新后的质心与更新前的质心之间的距离小于预设距离。
4.如权利要求3所述基于人工智能的客户价值标注方法,其特征在于,所述按照预设质心选取策略选取初始质心,包括:
随机选取一目标样本数据作为一个初始质心;
计算每一目标样本数据与所述初始质心间的距离,得到最短距离;
按照质心选取概率计算公式,对所述最短距离进行计算,得到质心选取概率;所述质心选取概率用于描述每一所述目标样本数据作为下一质心的概率;
基于所述质心选取概率,计算每一所述目标样本数据的概率累加和;
基于所述概率累加和,采用轮盘提取算法对所述目标样本数据进行选取,得到下一初始质心,继续执行所述计算每一所述目标样本数据与所述初始质心间的距离,得到最短距离的步骤,直到所述初始质心的数量达到所述聚类簇数量。
5.如权利要求1所述基于人工智能的客户价值标注方法,其特征在于,在所述对所述聚类簇进行特征分析,以对每一所述聚类簇对应的客户群体进行客户价值标注之后,所述基于人工智能的客户价值标注方法还包括:
定时检测每一客户对应的当前客户类别,所述当前客户类别用于指示所述客户在当前定时检测点下的客户类别;
根据所述客户的当前客户类别以及原始客户类别,检测客户类别的变化;所述原始客户类别指示所述客户在上一定时检测点下的客户类别;
若所述客户类别的变化为等级下降,则将所述客户类别的变化为等级下降的客户作为目标客户;
分析所述目标客户的购买行为数据,确定所述目标客户的喜好数据;
根据所述喜好数据,为所述目标客户推荐对应的产品。
6.如权利要求1所述基于人工智能的客户价值标注方法,其特征在于,在所述根据所述客户的当前客户类别以及原始客户类别,检测客户类别的变化之后,所述基于人工智能的客户价值标注方法还包括:
若所述客户类别的变化为等级提升,则将所述客户类别的变化为等级提升的客户作为目标客户,并将所述目标客户加入外呼名单中;
基于所述外呼名单,调用外呼模块进行过外呼。
7.如权利要求6所述基于人工智能的客户价值标注方法,其特征在于,所述基于所述外呼名单,调用外呼模块进行过外呼,包括:
获取所述外呼名单中每一目标客户对应的客户职业和客户所属区域;
根据所述客户职业和所述客户所属区域,确定每一所述目标客户对应的待呼叫时间;
基于每一目标客户对应的待呼叫时间,分别对所述目标客户进行外呼。
8.一种客户价值标注装置,其特征在于,包括:
数据采集模块,用于定时采集每一客户对应的购买行为数据;
数据处理模块,用于对每一所述客户对应的购买行为数据进行异常值和缺失值处理,获取有效行为数据;
数据统计模块,用于基于所述有效行为数据进行统计,获取所述客户对应的包含至少一个统计特征的目标样本数据;
聚类模块,用于采用kmeans聚类算法对所述目标样本数据进行聚类分析,得到至少一个聚类簇,所述聚类簇用于指示客户类别一致的客户群体;
客户价值标注模块,用于对所述聚类簇进行特征分析,以对每一所述聚类簇对应的客户群体进行客户价值标注。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于人工智能的客户价值标注方法的步骤。
10.一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于人工智能的客户价值标注方法的步骤。
CN202010910523.5A 2020-09-02 2020-09-02 基于人工智能的客户价值标注方法、装置、设备及介质 Pending CN111985577A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010910523.5A CN111985577A (zh) 2020-09-02 2020-09-02 基于人工智能的客户价值标注方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010910523.5A CN111985577A (zh) 2020-09-02 2020-09-02 基于人工智能的客户价值标注方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN111985577A true CN111985577A (zh) 2020-11-24

Family

ID=73447341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010910523.5A Pending CN111985577A (zh) 2020-09-02 2020-09-02 基于人工智能的客户价值标注方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111985577A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112560947A (zh) * 2020-12-14 2021-03-26 国网青海省电力公司 基于能源供需结构分析的聚类方法及装置
CN113077015A (zh) * 2021-04-29 2021-07-06 平安科技(深圳)有限公司 样本选择方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112560947A (zh) * 2020-12-14 2021-03-26 国网青海省电力公司 基于能源供需结构分析的聚类方法及装置
CN113077015A (zh) * 2021-04-29 2021-07-06 平安科技(深圳)有限公司 样本选择方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
WO2020062702A1 (zh) 短信发送的方法、装置、计算机设备和存储介质
CN110991875A (zh) 一种平台用户质量评估系统
CN110336838B (zh) 账号异常检测方法、装置、终端及存储介质
CN110544109A (zh) 用户画像生成方法、装置、计算机设备和存储介质
CN114496264B (zh) 基于多维数据的健康指数分析方法、装置、设备及介质
CN112131277B (zh) 基于大数据的医疗数据异常分析方法、装置和计算机设备
CN106919957A (zh) 处理数据的方法及装置
CN111985577A (zh) 基于人工智能的客户价值标注方法、装置、设备及介质
CN111435357B (zh) 加油站客户流失预测方法、装置、电子设备及存储介质
CN107622326A (zh) 用户分类、可用资源预测方法、装置及设备
CN108921587B (zh) 一种数据处理方法、装置及服务器
CN112463859B (zh) 基于大数据和业务分析的用户数据处理方法及服务器
CN110764902A (zh) 基于ai的虚拟资源分配方法、装置、计算机设备及存储介质
CN110472114A (zh) 异常数据预警方法、装置、计算机设备及存储介质
CN111400126A (zh) 网络服务异常数据检测方法、装置、设备和介质
CN106998336B (zh) 渠道中的用户检测方法和装置
CN112990386A (zh) 用户价值聚类方法、装置、计算机设备和存储介质
CN111476371B (zh) 对服务方面临的特定风险进行评估的方法及装置
CN113420018A (zh) 用户行为数据分析方法、装置、设备及存储介质
CN114495137B (zh) 票据异常检测模型生成方法与票据异常检测方法
CN115879819A (zh) 企业信用评估方法及装置
CN111489207A (zh) 基于区块链系统的评价信息写入方法、装置及硬件设备
CN111047336A (zh) 用户标签推送、用户标签展示方法、装置和计算机设备
CN114625975B (zh) 一种基于知识图谱的客户行为分析系统
CN108629506A (zh) 风控模型的建模方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination