CN113627997A - 数据处理方法、装置、电子设备及存储介质 - Google Patents

数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113627997A
CN113627997A CN202111097012.7A CN202111097012A CN113627997A CN 113627997 A CN113627997 A CN 113627997A CN 202111097012 A CN202111097012 A CN 202111097012A CN 113627997 A CN113627997 A CN 113627997A
Authority
CN
China
Prior art keywords
customer
product
probability
similarity
purchasing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111097012.7A
Other languages
English (en)
Inventor
余峰嵘
曹雷
黄泽坚
张和平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202111097012.7A priority Critical patent/CN113627997A/zh
Publication of CN113627997A publication Critical patent/CN113627997A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及人工智能技术,提供一种数据处理方法、装置、电子设备及存储介质,该方法包括:根据客户信息提取客户特征,并对所述客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率;根据所述客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过所述相似度矩阵获得所述客户对应的购买产品概率;根据所述客户对应的所述产品续购概率、所述购买产品概率以及所述流失概率,获取向所述客户进行产品推荐的推荐方案。本申请实施例的技术方案从多个方位对客户的客户信息进行分析,得到对客户信息分析的更精确的参考数据,可用于对客户进行产品推荐。

Description

数据处理方法、装置、电子设备及存储介质
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
随着保险、理财等产品种类与功能的暴增,客户对产品的选择多依赖与专业产品经理的推荐,但是专业产品经理在进行产品推荐时,主观性较强,容易受产品经理对客户信息收集的程度与经营经验所影响,导致无法对客户定制个性化的经营方案,有可能导致客户不满或客户流失。
针对上述问题,一部分人提出使用机器学习对客户金融业务领域中的数据进行分析,获得与客户相关的数据,从而根据分析结果为客户定制个性化的方案,但目前的机器学习方案大多为单对单的解决单个问题,如,针对客户续保问题,则通过对客户与“续保”相关信息获得客户续保分析数据,又比如对于客户推荐产品问题,则通过机器学习对客户与“客户可能购买”相关数据进行分析,得到客户推荐商品信息等,以上方案,均为对单个问题提出的机器学习方案,因此只能得到为解决单个问题提出的机器学习方案,而没有针对一个客户从购买、续买、推荐等方面上进行全方位的数据分析方法,不能实现基于机器学习得到的能为客户提供一套完整、个性化经营方案的精准参考数据。
发明内容
为解决上述技术问题,本申请的实施例提供了一种数据处理方法及装置、电子设备、计算机可读存储介质,从多个方位对客户信息数据进行分析处理,获得向客户进行产品推荐的参考数据。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种数据处理方法,包括:根据客户信息提取客户特征,并对所述客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,所述客户信息包括所述客户的属性信息和持有产品信息;根据所述客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过所述相似度矩阵获得所述客户对应的购买产品概率;根据所述客户对应的所述产品续购概率、所述购买产品概率以及所述流失概率,获取向所述客户进行产品推荐的推荐方案。
在一实施例中,所述根据客户信息提取客户特征,并对所述客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,包括:
根据客户信息提取续购特征,并获取所述续购特征对应的续购衍生特征;
将所述续购特征和所述续购衍生特征进行特征分裂处理,得到多个续购预测树,根据所述多个续购预测树获得所述客户对应的产品续购概率。
在一实施例中,所述将所述续购特征和所述续购衍生特征进行特征分裂处理,得到多个续购预测树,根据所述多个续购预测树获得所述客户对应的产品续购概率,包括:
对所述续购特征和所述续购衍生特征进行串行分类处理,每次分类时拟合前次分类的残差,得到多个续购预测树;
获取每个续购预测树的预测分数,累加所有续购预测树的预测分数获得所述客户对应的产品续购概率。
在一实施例中,所述根据客户信息提取客户特征,并对所述客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,包括:
根据客户信息提取流失特征,并获取所述流失特征对应的流失衍生特征;
将所述流失特征和所述流失衍生特征进行特征分裂处理,得到多个流失预测树,根据所述多个流失预测树获得所述客户对应的流失概率。
在一实施例中,在所述根据所述客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过所述相似度矩阵获得所述客户对应的购买产品概率之前,所述方法还包括:
以客户标识为主键、不同客户对应的客户信息为特征构建第一宽表,通过所述第一宽表获取不同客户之间的客户信息相似度;
以客户标识为主键、产品为特征构建第二宽表,根据所述第二宽表获取所述不同客户之间的购买产品相似度。
在一实施例中,所述根据所述客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过所述相似度矩阵获得所述客户对应的购买产品概率,包括:
根据不同客户之间的客户信息相似度构建客户信息相似度矩阵,并根据所述不同客户之间的购买产品相似度构建购买产品相似度矩阵;
将分别经过协同过滤处理后的客户信息相似度矩阵以及购买产品相似度矩阵进行分类预测处理,得到所述客户对不同产品的购买产品概率。
在一实施例中,所述根据所述客户对应的所述产品续购概率、所述购买产品概率以及所述流失概率,获取向所述客户进行产品推荐的推荐方案,包括:
若所述客户对应的产品续购概率位于第一阈值范围内,则获取所述客户对应的第一产品推荐方案,所述第一产品推荐方案包括根据所述客户对不同产品的购买产品概率所得到的推荐产品;
若所述客户对应的产品续购概率位于第二阈值范围,则判断所述客户对应的流失概率是否位于第三阈值范围内;
若所述流失概率位于第三阈值范围内,则获取所述客户对应的第二产品推荐方案,所述第二产品推荐方案包括根据所述客户对除已持有产品以外的其他产品的购买产品概率所得到的推荐产品。
根据本申请实施例的一个方面,提供了一种数据处理装置,包括:产品续购概率和流失概率获取模块,配置为根据客户信息提取客户特征,并对所述客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,所述客户信息包括所述客户的属性信息和持有产品信息;购买产品概率获取模块,配置为根据所述客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过所述相似度矩阵获得所述客户对应的购买产品概率;推荐方案获取模块,配置为根据所述客户对应的所述产品续购概率、所述购买产品概率以及所述流失概率,获取向所述客户进行产品推荐的推荐方案。
根据本申请实施例的一个方面,提供了一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个计算机程序,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述电子设备实现如上所述的数据处理方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如上所述的数据处理方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的数据处理方法。
在本申请的实施例所提供的技术方案中,通过对客户信息中提取的客户特征进行处理得到客户对应的产品续购概率和流失概率,同时根据客户与其它客户之间的客户信息相似度和购买产品相似度获取购买产品概率,通过对客户信息从多方位进行数据分析,获得对客户购买行为分析的更精确的参考数据,从而可通过该参考数据提升为客户进行产品推荐的科学性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本申请涉及的一种实施环境的示意图;
图2是本申请的一示例性实施例示出的数据处理方法的流程图;
图3是图2所示实施例中的步骤S210在一示例性实施例中的流程图;
图4是图3所示实施例中的步骤S330在一示例性实施例中的流程图;
图5是图2所示实施例中的步骤S210在另一示例性实施例中的流程图;
图6是本申请的另一示例性实施例示出的数据处理方法的流程图;
图7是图2所示实施例中的步骤S230在一示例性实施例中的流程图;
图8是图2所示实施例中的步骤S250在一示例性实施例中的流程图;
图9是本申请的一示例性实施例示出的数据处理装置的结构示意图;
图10示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
还需要说明的是:在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificia lIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提出的数据处理方法及装置、电子设备、存储介质涉及人工智能技术以及机器学习技术,以下将对这些实施例进行详细说明。
首先请参阅图1,图1是本申请涉及的一种实施环境的示意图。该实施环境包括终端100和服务器端200,终端100和服务器端200之间通过有线或者无线网络进行通信。终端100用于采集客户信息,客户信息包括客户的属性信息和持有产品信息;同时将采集到的客户信息输入至服务器端200,服务器端200对客户信息进行数据处理,得到每个客户对应的产品续购概率、流失概率、购买产品概率,然后数据处理的结果发送至终端100,可通过终端100自带的显示模块可视化展示数据结果。
示例性的,终端100在接收到多个客户的客户信息后,将客户信息发送至服务器端200,服务器端200对客户信息进行数据处理,如对客户A的客户信息进行数据处理:根据客户信息提取客户特征,并对客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,然后根据客户A与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过相似度矩阵获得客户对应的购买产品概率。
其中,终端100可以是智能手机、平板、笔记本电脑、计算机等任意能够实现数据可视化的电子设备,本处不进行限制。服务器端200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,其中多个服务器可组成一区块链,而服务器为区块链上的节点,服务器端200还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(ContentDelivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器,本处也不对此进行限制。
图2是根据一示例性实施例示出一种数据处理方法的流程图。如图2所示,在一示例性实施例中,该方法可以包括步骤S210至步骤S250,详细介绍如下:
步骤S210:根据客户信息提取客户特征,并对客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率。
本实施例中客户信息包括客户的属性信息和持有产品信息。
该属性信息包括客户的类型,如私人客户或者对公客户,对公客户对应的属性信息还包括例如企业客户性质、企业属性、企业客户所属行业、企业客户所属地域、对公客户合作类信息(如该对公客户合作年限、客户购买渠道等)等等;私人信息对应的属性信息还可以包括客户的年龄、性别、职业、家庭情况等。
客户的持有产品信息为与客户关联的虚拟物品信息,如客户关联的保单、理财等等虚拟物品信息,持有产品信息包括例如客户购买的产品、客户持有的产品种类、客户持有数量等。
本实施例中,首先获取客户信息,然后对客户信息进行特征提取,并对客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率。
由于许多产品很多是有时效性,如保险或是其他诸如理财等产品,产品续购概率用于存量客户经营,如对于保险类产品,当客户的保险产品到期后有续保这个业务动作,获得产品续购概率用于预测客户续保的概率是多少,当客户续保的概率越大意味着这个客户很有可能继续购买这款产品,当客户的续保概率越小意味着这个客户可能不再购买这个产品;流失概率是用于预测客户在未来一个时间观察期内的流失概率,如一个客户A持有产品并且该持有产品到期,同时不持有其他未到期的产品,那么计算该客户A的流失概率,用流失概率示意该客户与商家有不继续合作(流失)的概率。
需要说明的是,根据需要得到概率不同,从客户信息中提取不同的特征,当需要得到产品续购概率时,在客户信息中提取续购特征,然后对续购特征进行数据处理获得产品续购概率;当需要得到流失概率时,在客户信息中提取流失特征,然后对流失特征进行数据处理获得流失概率。
步骤S230:根据客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过相似度矩阵获得客户对应的购买产品概率。
本实施例中,首先获得各客户之间的客户信息相似度和购买产品相似度,如客户A与其他客户之间的客户信息相似度,以及该客户A与其他客户之间的购买产品相似度,然后将客户A对应的与其他客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,再通过对两个相似度矩阵进行预测分析,获得该客户A购买其他产品的购买产品概率,如计算得到客户A对a产品的购买产品概率为86%、购买b产品的购买产品概率为21%,则证明该客户A购买a产品的概率较大,购买b产品的概率较小。
步骤S250:根据客户对应的产品续购概率、购买产品概率以及流失概率,获取向客户进行产品推荐的推荐方案。
本步骤中,结合上述步骤中得到的客户对应的产品续购概率、购买产品概率以及流失概率,提供对该客户的个性化经营建议;如当一个客户产品续购概率较大的时候,则向客户继续推荐该客户已持有的产品,还可根据该客户对不同产品的购买产品概率,选取概率较大的产品,向客户进行产品推荐,以及当该客户流失概率较大时,则可以结合现有的流失客户跟进策略,对该客户进行跟进,如为该客户提供更适应性、更优惠的推荐方案以提高客户继续合作的概率。
本实施例中提供一种数据处理方法,通过对客户信息进行处理,得到客户对应的产品续购概率、购买产品概率以及流失概率,通过该从购买、续买、推荐等方面上进行全方位的数据分析方法得到的分析结果,可以给到客户经理对不同客户的经营建议,确定在为客户提供推荐方案的过程中,哪些客户是需要去跟进的,哪些客户的风险点在哪里,哪些客户可能要流失掉,该数据处理方法能为每个客户制定个性化产品推荐方案提供更加科学的数据建议,从而增加客户体验以及客户粘性,同时降低客户的流失概率。
图3是图2所示实施例中步骤S210在一示例性实施例中的流程图。如图3所示,在一示例性实施例中,该根据客户信息提取客户特征,并对客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率的过程可以包括步骤S310至步骤S330,详细介绍如下:
步骤S310:根据客户信息提取续购特征,并获取续购特征对应的续购衍生特征。
本实施中,可在每个客户中提取其对应客户信息中的客户属性信息,例如企业客户性质、企业客户所属行业、企业客户所属地域等;客户持有产品信息,例如客户购买的产品、客户持有的产品数量、客户持有的保单数量等;客户合作类信息,例如客户合作年限、客户购买渠道等;通过选取以上信息提取不同客户的续购特征,当然可以是选取客户信息中其他与续购相关类型的信息进行客户续购特征的提取。
本实施例中客户信息的续购提取过程可视为对客户信息数据的降维处理,具体可通过主成分分析、线性判别分析等方法达到:如先将客户信息数据进行标准化处理,然后构建标准化处理后的客户信息数据的协方差矩阵,然后通过计算协方差矩阵的特征值和相应的特征向量,在得到特征向量后,本步骤中还根据特征值的大小将特征向量形成续购特征空间,具体地,通过特征向量构成多维映射矩阵,根据映射矩阵可将映射矩阵对应的客户信息数据转换为多维度的续购特征。
在获得不同客户的续购特征后,可先对客户的续购特征进行数据预处理,如对一个客户的续购特征进行数据清洗,或对续购特征中的数据进行探索分析后对缺失数据异常数据进行修正填充等操作,为后续获取产品续购概率提供基础。
在客户的产品续购概率预测中,为增加产品续购概率的准确性,还可增加多种类别变量的续购衍生特征,例如不同客户的三级行业分类、客户所属的地区、该客户购买的三级产品等;本步骤中通过类别特征组合衍生更多特征,例如通过企业客户地域加上企业客户行业加上企业客户购买的产品生成新的特征。
本实施例中以特征组合的方式获取续购衍生特征为例,对客户信息中的企业客户地域进行衍生特征的获取,与企业客户地域相关的有相同地域的企业、该地域企业所在行业、该地域企业所购买的产品等相关类别的数据,那么将企业客户地域数据与和企业客户地域数据相关类别数据(相同地域的企业、该地域企业所在行业、该地域企业所购买的产品等相关类别的数据)进行数据相乘或相除或分箱等处理,即可得到该企业客户地域类别数据的衍生特征。当然还可以通过对一个类别的数据增加新的特征维度,生成更多衍生特征数据,如对企业购买的三级产品这一类别数据生成衍生特征,增加企业购买的三级产品的其他维度特征(可以是产品的类别,产品的数量等等),交叉生成数据,然后得到企业购买的三级产品相关的续购衍生特征。当然,在其他方式中,还可通过特征扩展、合成特征、特征交叉等方式获取续购特征的续购衍生特征。
步骤S330:将续购特征和续购衍生特征进行特征分裂处理,得到多个续购预测树,根据多个续购预测树获得客户对应的产品续购概率。
本实施例中,将上述得到的续购特则以及续购衍生特征进行特征分裂处理,在特征分裂的过程中,会成长成多个续购预测树,通过该特征续购预测树获得客户对应的产品续购概率。
本实施例中,通过提取客户信息中的续购特征,并根据续购特征获取其对应的续购衍生特征,再通过续购特征以及续购衍生特征预测不同客户的产品续购概率,提高对客户产品续购概率预测的准确性。
图4是图3所示实施例中步骤S330在一示例性实施例中的流程图。如图4所示,在一示例性实施例中,该将续购特征和续购衍生特征进行特征分裂处理,得到多个续购预测树,根据多个续购预测树获得客户对应的产品续购概率的过程可以包括步骤S410至步骤S430,详细介绍如下:
步骤S410:对续购特征和续购衍生特征进行串行分类处理,每次分类时拟合前次分类的残差,得到多个续购预测树。
本实施例中可预先构建一个产品续购概率模型,获取训练集中大量客户信息数据样本通过集成学习算法对产品续购概率模型进行训练,如特征筛选、参数调优、效果评估,最终得到能用于预测产品续购概率的模型,具体地,将续购特征和续购衍生特征按种类进行分类,分类时采用串行方式,即层层叠加,如按照地区分类,得到多个地区类别,再对多个地区类别中的数据进行分类,每个地区类别中可按公司分类,得到不同地区中的公司类别,再对公司类别的中的数据进行分类……如此层层分类下去,相当于特征分裂生成一棵续购预测树,每生长一次的过程则为一个新的学习过程,去拟合上次预测的残差,最终得到多个续购预测树。
步骤S430:获取每个续购预测树的预测分数,累加所有续购预测树的预测分数获得客户对应的产品续购概率。
本实施例中,为每一个续购预测树进行分数预测,多颗树累加起来便是该续购特征和续购衍生特征对应客户的产品续购概率。
本实施例中,通过对不同客户对应的续购特征和续购衍生特征进行处理,得到不同客户对应的续购预测树,通过该续购预测树获取不同客户对应的产品续购概率,用于预测客户对已持有产品续购的概率,为对客户制定个性化产品推荐方案提供数据支撑。
图5是图2所示实施例中步骤S210在一示例性实施例中的流程图。如图5所示,在一示例性实施例中,该根据客户信息提取客户特征,并对客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率的过程可以包括步骤S510至步骤S530,详细介绍如下:
步骤S510:根据客户信息提取流失特征,并获取流失特征对应的流失衍生特征。
本实施例中,可参考上述步骤S310中的方法,通过对客户信息数据的降维处理提取客户信息中与流失相关类型的信息进行客户流失特征的提取,如从客户信息中提取客户已持有产品时间,持有产品种类,持有产品数量等形成客户流失特征,同样地,对流失特征进行预处理,然后通过特征扩展、合成特征、特征交叉等方式,根据流失特征衍生对应客户的持有产品类特征、客户基本信息特征、客户合作年限及理赔等类型的信息形成该流失特征对应的流失衍生特征。
步骤S530:将流失特征和流失衍生特征进行特征分裂处理,得到多个流失预测树,根据多个流失预测树获得客户对应的流失概率。
本实施例中可参考步骤S330,将流失特征和流失衍生特征进行特征分裂处理,得到多个流失预测树,其具体获取流失预测树的过程还可参考上述步骤S410,将流失特征和流失衍生特征进行串行分类处理,每次分类时拟合前次分类的残差,得到多个流失预测树,然后获取每个流失预测树的预测分数,累加所有流失预测树的预测分数获得客户对应的流失概率。
本实施例中,通过提取客户信息中的流失特征,并根据流失特征获取其对应的流失衍生特征,提高对客户产品续购概率预测的准确性,同时通过对不同客户对应的续购特征和续购衍生特征进行处理,得到用于预测不同客户流失概率的流失预测树,用于预测客户对流失概率,为对客户制定个性化产品推荐方案提供数据支撑。
图6是根据另一示例性实施例示出一种数据处理方法的流程图。图6中所示实施例中可实施于步骤S230之前,如图6所示,在一示例性实施例中,该方法可以包括步骤S610至步骤S630,详细介绍如下:
步骤S610;以客户标识为主键、不同客户对应的客户信息为特征构建第一宽表,通过第一宽表获取不同客户之间的客户信息相似度。
本实施例中,根据客户信息,构建以客户标识为主键,不同客户对应的客户信息为特征的第一宽表,如可根据客户名称为主键,客户属性信息(行业类别、省份、城市、注册资金、成立年限、经营状态等)为特征构建第一宽表,当然也可以是其他的客户进行为特征构建第一宽表,此处不做限制。
获取该第一宽表中任意两个客户之间的客户信息相似度,通过第一宽表中对任意两个客户标识对应的客户信息之间计算欧式距离(欧几里得度量),形成以欧式距离为结果的客户信息相似度,当然,还可以设定第一推荐阈值,当客户之间的欧式距离超过设定的阈值,则认为两个客户的信息相似度高,标记为可互推两个客户已购买过的产品。
本步骤中,以客户标识为主键,客户属性为刻度,获取两个不同客户标识对应客户属性之间的欧式距离,欧几里得度量指在m维空间中两个点之间的真实距离,通过各维度特征的绝对数值体现,如计算客户A与客户B之间的相似度,则通过欧几里得度量计算客户A的客户属性评分和客户B的客户属性评分,得到的客户A的客户属性(行业类别、省份、城市、注册资金)分别为:2、3、2、2;客户A的客户属性(行业类别、省份、城市、注册资金)分别为:4、4、5、6,则证明两个客户的相似度低,不标记两个客户之间可互推产品,如果得到的评分相似度高,则标记为可互推两个客户已购买过的产品。
步骤S630:以客户标识为主键、产品为特征构建第二宽表,根据第二宽表获取不同客户之间的购买产品相似度。
本实施例中,购买产品相似度可以包括客户购买行为相似度以及客户被购买产品相似度,客户购买行为相似度为两个客户之间,对于所有产品(客户购买过的以及客户没有购买过的产品)之间的购买行为或购买倾向相似度,客户被购买产品相似度为两个客户之间已经购买过的产品之间的购买行为或购买倾向相似度。
根据客户信息,构建以客户标识为主键,全量产品为特征(特征值:客户购买过该产品为1,否则为0)的购买行为宽表,根据购买行为宽表获取任意两个客户之间的客户购买行为相似度,如通过计算购买行为宽表中的任意两个客户标识对应的全量产品的杰卡德相似度获得客户购买行为相似度,并通过设定第二推荐阈值,当两个客户之间的杰卡德相似度超过设定的阈值,则向两个客户互推以购买过的产品。
本步骤中,以客户标识为主键,构建全量产品的特征值矩阵,如计算客户A和客户B之间的计算杰卡德相似度,客户A对于购买过的产品特征值记为1,没有购买过的产品特征值记为0,形成客户A的全量产品特征值矩阵,同时构建客户B的全量产品特征值矩阵,然后计算:客户A和客户B都是1的维度的个数p、客户A是1而客户B是0的维度的个数q、客户A是0而客户B是1的维度的个数r、客户A和客户B都是0的维度的个数s;则客户A和客户B的杰卡德相似系数可以表示为:
Figure BDA0003268044240000121
本实施例中,根据客户信息,构建以客户为主键,客户购买过的产品为特征的被购买产品宽表,参考上述提出的计算客户购买行为相似度的方法,根据被购买产品宽表计算任意两个客户标识对应的客户购买过的产品之间的杰卡德相似度作为对应客户的客户被购买产品相似度,并通过设定第三推荐阈值,即两个客户之间的客户被购买产品相似度超过设定的阈值,则向两个客户互推两个客户已经购买过的产品。
本实施例中,通过构建宽表,获取任意两个客户之间的客户信息相似度以及购买产品相似度,通过以上数据处理可得到客户倾向性较高的产品,从而根据相似度结果能向相似度高的两个客户之间互推产品,提高客户对推荐产品的接收度。
图7是图2所示实施例中步骤S230在一示例性实施例中的流程图。如图7所示,在一示例性实施例中,该根据客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过相似度矩阵获得客户对应的购买产品概率的过程可以包括步骤S710至步骤S730,详细介绍如下:
步骤S710:根据不同客户之间的客户信息相似度构建客户信息相似度矩阵,并根据不同客户之间的购买产品相似度构建购买产品相似度矩阵。
本实施例中,根据不同客户之间的客户信息相似度构建客户信息相似度矩阵,并根据不同客户之间的购买产品相似度构建购买产品相似度矩阵,如已获取客户A与客户B、客户C等的客户信息相似度,那么整理客户A与其他客户之间的客户信息相似度构建客户信息相似度矩阵。
步骤S730:将分别经过协同过滤处理后的客户信息相似度矩阵以及购买产品相似度矩阵进行分类预测处理,得到客户对不同产品的购买产品概率。
本实施例中,将客户信息相似度矩阵以及购买产品相似度矩阵分别经过协同过滤处理,然后构建购买产品概率预测模型,对该产品概率预测模型进行训练,最终得到用于预测每个客户对不同产品的购买产品概率,具体可参考步骤S410-S430中的方法,将分别经过协同过滤处理后的客户信息相似度矩阵以及购买产品相似度矩阵进行串行分类处理,每次分类时拟合前次分类的残差,得到多个购买产品预测树,为每一个购买产品预测树进行分数预测,多颗树累加起来便是该客户对不同产品的购买产品概率。
本实施例中,针对客户信息相似度、购买产品相似度标记可能向客户推荐的产品,但推荐的产品较多、精准率不够高且无法得知产品推荐给客户的优先级的问题,提出处理客户信息相似度、购买产品相似度的方法,通过获取客户信息相似度矩阵以及购买产品相似度矩阵并对该矩阵进行处理以及预测,获取每个客户对待推荐产品的购买概率,提高每个客户的购买产品概率的准确性。
图8是图2所示实施例中步骤S250在一示例性实施例中的流程图。如图8所示,在一示例性实施例中,该根据客户对应的产品续购概率、购买产品概率以及流失概率,获取向客户进行产品推荐的推荐方案的过程可以包括步骤S810至步骤S850,详细介绍如下:
步骤S810:若客户对应的产品续购概率位于第一阈值范围内,则获取客户对应的第一产品推荐方案。
本实施例中,当客户对应的产品续购概率位于第一阈值范围内,则获取客户对应的第一产品推荐方案,该第一产品推荐方案包括根据客户对不同产品的购买产品概率所得到的推荐产品,该第一阈值范围内可以为产品续购概率大于某一数值,如大于70%,即该客户该产品续购概率较高,可获取该客户已购买的产品以获取该客户对应购买产品概率较大的产品形成为这个客户进行产品推荐的第一产品推荐方案。
步骤S830:若客户对应的产品续购概率位于第二阈值范围,则判断客户对应的流失概率是否位于第三阈值范围内。
本实施例中,当一个客户对应的产品续购概率位于第二阈值范围内时,如该客户的产品续购概率小于70%且大于50%,即该客户该产品续购概率证明该客户有一定产品续购风险,或是该客户的产品续购概率小于50%,即该客续购概率很低,可能不会续;从而判断该客户对应的流失概率数据,是否该客户对应的流失概率位于第三阈值范围内,该第三阈值范围可以是小于30%,则证明该客户可能不会续购已持有的产品,但会购买其他产品。
需要说明的是,以上第一阈值范围、第二阈值范围、第三阈值范围的具体数据仅仅用于示例,还可以是其他数值,此处不做具体限制,其本实施例中的第一阈值范围内的整体数值需大于第二阈值范围内的所有数值,且从该第三阈值范围内的数值需能得到该客户的流失概率较低这一结果。
步骤S850:若流失概率位于第三阈值范围内,则获取客户对应的第二产品推荐方案。
当该客户的流失概率位于第三阈值范围内时,则获取客户对应的第二产品推荐方案,第二产品推荐方案包括根据客户对除已持有产品以外的其他产品的购买产品概率所得到的推荐产品,通过步骤S830可知,当客户对应的产品续购概率位于第二阈值范围,且该客户对应的流失概率位于第三阈值范围内,证明该客户可能不会续购已持有的产品,但会购买其他产品,因此,根据该客户对除该客户已持有产品以外的其他产品的购买产品概率,选取购买产品概率较高的产品,形成对该客户的第二产品推荐方案。
本实施例中,结合该客户对应的产品续购概率、购买产品概率以及流失概率,提供对该客户的个性化经营建议;具体地:如当客户的产品续购概率大于70%(位于第一阈值范围内),该客户该产品续购概率较高,可以根据该客户的续购,同时进一步结合该客户对应的购买产品概率推荐其他产品;或当客户产品续购概率大于40%且小于70%时(位于第二阈值范围内),该客户有一定产品续购风险,可以根据经验判断了解客户需求,提供相应的客户跟进方案,从而减小该客户的续购风险;或当客户续购概率小于40%(位于第二阈值范围内),而客户的流失概率<50%(位于第二阈值范围内),该客户可能不会续购已持有的产品但会购买其他产品,则进一步结合客户购买产品概率推荐其他产品;或当客户流失概率>=50%,该客户可能流失,可以根据现有的对待流失客户的处理方案,对该客户进行跟进,如提供更优惠、更适应的产品,减小客户的流失概率等。
在一具体方案中,第一个客户A曾经购买过某款产品a,马上要到期了,通过本方法得到客户A针对该产品的产品续购概率为95%,这意味着这个客户A有很大的可能性会继续购买这个产品,从业务角度,希望可以进一步给客户推荐其他适配产品,因此根据客户购买产品概率计算这个客户a可能适合购买的其他产品,为客户做进一步推荐。
第二个客户B曾经购买的某款产品b,马上要到期了,得到客户B针对这个产品续购概率为10%,这意味着这个客户B基本不大可能继续再购买产品,通过三种概率结合应用的业务策略规则,进一步判断这个可能的流失概率,当流失概率大于50%以上,意味着这个客户很可能不再跟进行相关合作,需要通过一定的营销策略对客户进行挽留,当流失概率小于50%意味着这个可能只是不想再购买A产品,但是有其他产品需求,则通过客户购买产品概率获取该客户B的其他可能的适配产品,根据适配产品的客户购买产品概率,按概率大小为优先级对这个客户B推荐其他适配产品。
本实施例中,通过客户对应的产品续购概率、购买产品概率以及流失概率,获取对该客户更科学、适宜的产品推荐方案,从而达到提高客户粘性的效果。
图9是根据一示例性实施例示出的一种数据处理装置的结构示意图。如图9所示,在一示例性实施例中,该数据处理装置包括:
产品续购概率和流失概率获取模块910,配置为根据客户信息提取客户特征,并对客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,客户信息包括客户的属性信息和持有产品信息;
购买产品概率获取模块930,配置为根据客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过相似度矩阵获得客户对应的购买产品概率;
推荐方案获取模块950,配置为根据客户对应的产品续购概率、购买产品概率以及流失概率,获取向客户进行产品推荐的推荐方案。
本实施例中,通过上述结构的数据处理装置,能对客户信息进行数据处理,通过对客户信息进行数据处理得到客户对应的产品续购概率、购买产品概率以及流失概率,以此为每个客户制定个性化产品推荐方案提供科学数据建议,给到客户经理对不同客户的经营建议,确定在为客户提供推荐方案的过程中,哪些客户是需要去跟进的,哪些客户的风险点在哪里,哪些客户可能要流失掉,从而增加客户体验以及客户粘性,同时降低客户的流失概率。
在一实施例中,产品续购概率和流失概率获取模块910包括:
续购特征及续购衍生特征获取单元,配置为根据客户信息提取续购特征,并获取续购特征对应的续购衍生特征;
产品续购概率获取单元,配置为将续购特征和续购衍生特征进行特征分裂处理,得到多个续购预测树,根据多个续购预测树获得客户对应的产品续购概率。
在一实施例中,产品续购概率获取单元包括:
续购预测树获取板块,配置为对续购特征和续购衍生特征进行串行分类处理,每次分类时拟合前次分类的残差,得到多个续购预测树;
产品续购概率获取板块,配置为获取每个续购预测树的预测分数,累加所有续购预测树的预测分数获得客户对应的产品续购概率。
在一实施例中,产品续购概率和流失概率获取模块910包括:
流失特征及流失衍生特征获取单元,配置为根据客户信息提取流失特征,并获取流失特征对应的流失衍生特征;
流失概率获取单元,配置为将流失特征和流失衍生特征进行特征分裂处理,得到多个流失预测树,根据多个流失预测树获得客户对应的流失概率。
在一实施例中,该装置还包括:
客户信息相似度获取模块,配置为以客户标识为主键、不同客户对应的客户信息为特征构建第一宽表,通过第一宽表获取不同客户之间的客户信息相似度;
购买产品相似度获取模块,配置为以客户标识为主键、产品为特征构建第二宽表,根据第二宽表获取不同客户之间的购买产品相似度。
在一实施例中,购买产品概率获取模块930包括:
相似度矩阵构建单元,配置为根据不同客户之间的客户信息相似度构建客户信息相似度矩阵,并根据不同客户之间的购买产品相似度构建购买产品相似度矩阵;
购买产品概率获取单元,配置为将分别经过协同过滤处理后的客户信息相似度矩阵以及购买产品相似度矩阵进行分类预测处理,得到客户对不同产品的购买产品概率。
在一实施例中,推荐方案获取模块950包括:
第一推荐产品单元,配置为若客户对应的产品续购概率位于第一阈值范围内,则获取客户对应的第一产品推荐方案,第一产品推荐方案包括根据客户对不同产品的购买产品概率所得到的推荐产品。
流失概率判断单元,配置为若客户对应的产品续购概率位于第二阈值范围,则判断客户对应的流失概率是否位于第三阈值范围内。
第二推荐产品获取单元,配置为若流失概率位于第三阈值范围内,则获取客户对应的第二产品推荐方案,第二产品推荐方案包括根据客户对除已持有产品以外的其他产品的购买产品概率所得到的推荐产品。
本实施例中还提出一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个计算机程序,当一个或多个计算机程序被所述一个或多个处理器执行时,使得电子设备实现如上述实施例描述的数据处理方法。
图10示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图10示出的电子设备的计算机系统1600仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图10所示,计算机系统1600包括中央处理单元(Centra lProcessing Unit,CPU)1601,其可以根据存储在只读存储器(Read-Only Memory,ROM)1602中的程序或者从储存部分1608加载到随机访问存储器(Random Access Memory,RAM)1603中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM 1603中,还存储有系统操作所需的各种程序和数据。CPU 1601、ROM 1602以及RAM 1603通过总线1604彼此相连。输入/输出(Input/Output,I/O)接口1605也连接至总线1604。
以下部件连接至I/O接口1605:包括键盘、鼠标等的输入部分1606;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crysta lDisplay,LCD)等以及扬声器等的输出部分1607;包括硬盘等的储存部分1608;以及包括诸如LAN(Loca lAreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1609。通信部分1609经由诸如因特网的网络执行通信处理。驱动器1610也根据需要连接至I/O接口1605。可拆卸介质1611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1610上,以便于从其上读出的计算机程序根据需要被安装入储存部分1608。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1609从网络上被下载和安装,和/或从可拆卸介质1611被安装。在该计算机程序被中央处理单元(CPU)1601执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable ProgrammableRead Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(CompactDisc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前的数据处理方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的数据处理方法。
上述内容,仅为本申请的较佳示例性实施例,并非用于限制本申请的实施方案,本领域普通技术人员根据本申请的主要构思和精神,可以十分方便地进行相应的变通或修改,故本申请的保护范围应以权利要求书所要求的保护范围为准。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
根据客户信息提取客户特征,并对所述客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,所述客户信息包括所述客户的属性信息和持有产品信息;
根据所述客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过所述相似度矩阵获得所述客户对应的购买产品概率;
根据所述客户对应的所述产品续购概率、所述购买产品概率以及所述流失概率,获取向所述客户进行产品推荐的推荐方案。
2.根据权利要求1所述的方法,其特征在于,所述根据客户信息提取客户特征,并对所述客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,包括:
根据客户信息提取续购特征,并获取所述续购特征对应的续购衍生特征;
将所述续购特征和所述续购衍生特征进行特征分裂处理,得到多个续购预测树,根据所述多个续购预测树获得所述客户对应的产品续购概率。
3.根据权利要求2所述的方法,其特征在于,所述将所述续购特征和所述续购衍生特征进行特征分裂处理,得到多个续购预测树,根据所述多个续购预测树获得所述客户对应的产品续购概率,包括:
对所述续购特征和所述续购衍生特征进行串行分类处理,每次分类时拟合前次分类的残差,得到多个续购预测树;
获取每个续购预测树的预测分数,累加所有续购预测树的预测分数获得所述客户对应的产品续购概率。
4.根据权利要求1所述的方法,其特征在于,所述根据客户信息提取客户特征,并对所述客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,包括:
根据客户信息提取流失特征,并获取所述流失特征对应的流失衍生特征;
将所述流失特征和所述流失衍生特征进行特征分裂处理,得到多个流失预测树,根据所述多个流失预测树获得所述客户对应的流失概率。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过所述相似度矩阵获得所述客户对应的购买产品概率之前,所述方法还包括:
以客户标识为主键、不同客户对应的客户信息为特征构建第一宽表,通过所述第一宽表获取不同客户之间的客户信息相似度;
以客户标识为主键、产品为特征构建第二宽表,根据所述第二宽表获取所述不同客户之间的购买产品相似度。
6.根据权利要求1所述的方法,其特征在于,所述根据所述客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过所述相似度矩阵获得所述客户对应的购买产品概率,包括:
根据不同客户之间的客户信息相似度构建客户信息相似度矩阵,并根据所述不同客户之间的购买产品相似度构建购买产品相似度矩阵;
将分别经过协同过滤处理后的客户信息相似度矩阵以及购买产品相似度矩阵进行分类预测处理,得到所述客户对不同产品的购买产品概率。
7.根据权利要求1所述的方法,其特征在于,所述根据所述客户对应的所述产品续购概率、所述购买产品概率以及所述流失概率,获取向所述客户进行产品推荐的推荐方案,包括:
若所述客户对应的产品续购概率位于第一阈值范围内,则获取所述客户对应的第一产品推荐方案,所述第一产品推荐方案包括根据所述客户对不同产品的购买产品概率所得到的推荐产品;
若所述客户对应的产品续购概率位于第二阈值范围,则判断所述客户对应的流失概率是否位于第三阈值范围内;
若所述流失概率位于第三阈值范围内,则获取所述客户对应的第二产品推荐方案,所述第二产品推荐方案包括根据所述客户对除已持有产品以外的其他产品的购买产品概率所得到的推荐产品。
8.一种数据处理装置,其特征在于,包括:
产品续购概率和流失概率获取模块,配置为根据客户信息提取客户特征,并对所述客户特征进行特征分裂处理,得到客户对应的产品续购概率和流失概率,所述客户信息包括所述客户的属性信息和持有产品信息;
购买产品概率获取模块,配置为根据所述客户与其它客户之间的客户信息相似度和购买产品相似度分别构建相似度矩阵,通过所述相似度矩阵获得所述客户对应的购买产品概率;
推荐方案获取模块,配置为根据所述客户对应的所述产品续购概率、所述购买产品概率以及所述流失概率,获取向所述客户进行产品推荐的推荐方案。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个计算机程序,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求1-7中的任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1-7中的任一项所述的方法。
CN202111097012.7A 2021-09-17 2021-09-17 数据处理方法、装置、电子设备及存储介质 Pending CN113627997A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111097012.7A CN113627997A (zh) 2021-09-17 2021-09-17 数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111097012.7A CN113627997A (zh) 2021-09-17 2021-09-17 数据处理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113627997A true CN113627997A (zh) 2021-11-09

Family

ID=78390464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111097012.7A Pending CN113627997A (zh) 2021-09-17 2021-09-17 数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113627997A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139898A (zh) * 2021-11-22 2022-03-04 泰康保险集团股份有限公司 一种线索数据分发方法、装置、设备及存储介质
CN114549071A (zh) * 2022-02-18 2022-05-27 上海钧正网络科技有限公司 一种营销策略的确定方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139898A (zh) * 2021-11-22 2022-03-04 泰康保险集团股份有限公司 一种线索数据分发方法、装置、设备及存储介质
CN114549071A (zh) * 2022-02-18 2022-05-27 上海钧正网络科技有限公司 一种营销策略的确定方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN108648074B (zh) 基于支持向量机的贷款评估方法、装置及设备
CN110070391B (zh) 数据处理方法、装置、计算机可读介质及电子设备
US8489502B2 (en) Methods and systems for multi-credit reporting agency data modeling
CN111340246A (zh) 用于企业智能决策分析的处理方法、装置和计算机设备
CN106447066A (zh) 一种大数据的特征提取方法和装置
US11562262B2 (en) Model variable candidate generation device and method
CN109636482B (zh) 基于相似度模型的数据处理方法及系统
CN110738527A (zh) 一种特征重要性排序方法、装置、设备和存储介质
CN113742492B (zh) 保险方案生成方法、装置、电子设备及存储介质
CN112990386B (zh) 用户价值聚类方法、装置、计算机设备和存储介质
CN113627997A (zh) 数据处理方法、装置、电子设备及存储介质
CN113283795B (zh) 基于二分类模型的数据处理方法及装置、介质、设备
CN110866832A (zh) 一种风险控制方法、系统、存储介质及计算设备
CN114997916A (zh) 潜在用户的预测方法、系统、电子设备和存储介质
CN114493686A (zh) 一种运营内容生成推送方法及装置
CN117495482A (zh) 一种基于用户画像的二手手机销售推荐方法及系统
CN112950359A (zh) 一种用户识别方法和装置
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
CN116821759A (zh) 类别标签的识别预测方法、装置和处理器及电子设备
CN115545799A (zh) 信息技术服务质量评估方法、装置、设备及介质
EP3493082A1 (en) A method of exploring databases of time-stamped data in order to discover dependencies between the data and predict future trends
CN115034762A (zh) 一种岗位推荐方法、装置、存储介质、电子设备及产品
CN114897607A (zh) 产品资源的数据处理方法及装置、电子设备、存储介质
CN112818215A (zh) 产品数据的处理方法、装置、设备及存储介质
EP3073432A1 (en) Country specific revenue estimation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination