WO2018223719A1

WO2018223719A1 - 用户投保行为预测的方法、装置、计算设备及介质

Info

Publication number: WO2018223719A1
Application number: PCT/CN2018/074884
Authority: WO
Inventors: 刘永凡
Original assignee: 平安科技（深圳）有限公司
Priority date: 2017-06-09
Filing date: 2018-01-31
Publication date: 2018-12-13
Also published as: CN107689008A

Abstract

本方案提供了一种用户投保行为预测的方法、装置、计算设备及介质，适用于互联网技术领域，该方法包括：从用户属性库中获取样本用户的特征数据；对特征数据进行预处理，去除噪声数据，得到预处理数据；根据预处理数据，建立学习模型；基于该学习模型，对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品；将该第一类型用户推送给第二类型用户，以使第二类型用户将该第一类型用户确定为目标保险产品的目标用户。本方案实现了对用户感兴趣的保险产品的准确预测，提高对用户投保行为的预测效率和准确率，以及智能预测水平，同时使保险业务人员能够及时了解购买保险产品概率高的潜在用户，提高保险产品的销售成功率和效率。

Description

用户投保行为预测的方法、装置、计算设备及介质

本申请要求于2017年06月09日提交中国专利局、申请号为201710434568.8、发明名称为“一种用户投保行为预测的方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请属于互联网技术领域，尤其涉及一种用户投保行为预测的方法、装置、计算设备及介质。

背景技术

目前，保险业务人员在开发客户时，往往需要经过与客户进行深入沟通，或者通过查阅客户购买保险的历史记录，才能了解到客户的投保需求或者投保意愿，并在此基础上进一步通过人工分析，确定客户可能感兴趣的保险产品，这种方式导致工作效率低且准确率不高，并且对于陌生客户则无法进行有针对性的保险产品的推荐，导致保险产品的成交量无法有效提高。

技术问题

有鉴于此，本申请实施例提供了一种用户投保行为预测的方法、装置、计算设备及介质，以解决现有技术中通过保险业务人员主观地分析用户可能感兴趣的保险产品，导致对用户投保行为预测效率和准确率低的问题。

技术解决方案

本申请实施例的第一方面提供了一种用户投保行为预测的方法，包括：

从用户属性库中获取样本用户的特征数据，其中，所述特征数据包括所述样本用户的行为类型和所述行为类型对应的行为次数，所述行为类型包括订购产品类型和访问网站类型；

对所述特征数据进行预处理，去除噪声数据，得到预处理数据；

根据所述预处理数据，建立学习模型，所述学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，所述第一类型用户为保险客户；

基于所述学习模型，对待预测的所述第一类型用户进行行为预测，得到该第一类型用户的目标保险产品；

将该第一类型用户推送给第二类型用户，以使所述第二类型用户将该第一类型用户确定为所述目标保险产品的目标用户，所述第二类型用户为保险业务人员。

本申请实施例的第二方面提供了一种用户投保行为预测的装置，包括：

获取模块，用于从用户属性库中获取样本用户的特征数据，其中，特征数据包括样本用户的行为类型和该行为类型对应的行为次数，行为类型包括订购产品类型和访问网站类型；

预处理模块，用于对获取模块获取的特征数据进行预处理，去除噪声数据，得到预处理数据；

建模模块，用于根据预处理模块得到的预处理数据，建立学习模型，其中，该学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，第一类型用户为保险客户；

预测模块，用于基于建模模块建立的学习模型，对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品；

推送模块，用于将该第一类型用户推送给第二类型用户，以使第二类型用户将该第一类型用户确定为目标保险产品的目标用户，其中，第二类型用户为保险业务人员。

本申请实施例的第三方面提供了一种用户投保行为预测的计算设备，包括存储器以及处理器，所述存储器中存储有可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如第一方面所述的用户投保行为预测的方法的步骤。

本申请实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如第一方面所述的用户投保行为预测的方法的步骤。

有益效果

本申请实施例中，通过从用户属性库中获取样本用户的特征数据，对该特征数据进行去噪处理后得到预处理数据，并根据该预处理数据建立学习模型，基于该学习模型实现对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品，通过建立学习模型的方式能够自动且准确地找到用户行为与保险产品之间的关系，从而实现对第一类型用户感兴趣的保险产品的准确预测，提高对用户投保行为的预测效率和准确率，以及智能预测水平，同时将该第一类型用户推送给第二类型用户，使得第二类型用户能够及时了解购买保险产品概率高的潜在用户，从而进行有针对性的持续跟踪，提高保险产品的销售成功率和效率。

附图说明

图1是本申请实施例一提供的一种用户投保行为预测的方法的实现流程示意图；

图2是本申请实施例二提供的一种用户投保行为预测的方法的实现流程示意图；

图3是本申请实施例二提供的一种用户投保行为预测的方法中将基础数据同步到用户属性库的流程示意图；

图4是本申请实施例三提供的一种用户投保行为预测的装置的示意图；

图5是本申请实施例四提供的一种用户投保行为预测的装置的示意图；

图6是本申请实施例五提供的一种用户投保行为预测的计算设备的示意图。

本发明的实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

为了说明本申请所述的技术方案，下面通过具体实施例来进行说明。

实施例一：

图1是本申请实施例一提供的一种用户投保行为预测的方法的流程图，本申请实施例的执行主体为计算设备，其具体可以是服务器等，图1示例的一种用户投保行为预测的方法具体可以包括步骤S101至步骤S104，详述如下：

S101：从用户属性库中获取样本用户的特征数据，其中，特征数据包括样本用户的行为类型和该行为类型对应的行为次数，行为类型包括订购产品类型和访问网站类型。

具体地，用户属性库可以是大数据平台，用户属性库包含样本用户的特征数据，该特征数据包括样本用户的行为类型和每种行为类型对应的行为次数，行为类型可以包括订购产品类型和访问网站类型。

样本用户可以是通过各种行为接口进行行为动作的用户，其中，行为接口包括但不限于网站、智能终端的应用(Application，APP)，以及实体柜台或者合作公司这样的实体渠道，以上行为接口所分别对应的行为动作包括用户对网站进行访问、通过APP进行操作，以及通过实体渠道办理业务。

每个样本用户的特征数据可以以特征信息表的形式存在，特征信息表可以采用二维数组表示，该二维数组的第一维用于标识样本用户的行为类型，该二维数组的第二维用于标识每个行为类型对应的行为次数。

样本用户的行为类型具体可以包括样本用户订购具体产品的产品类型，该产品类型可以是样本用户通过网络购买的产品类型，例如旅游产品，以及机票等交通运输产品等，该产品类型还可以是样本用户通过实体渠道购买的保险产品等。

样本用户的行为类型还可以包括样本用户访问网站的网站类型，该网站类型可以是购物类网站、新闻时事类网站等。

S102：对样本用户的特征数据进行预处理，去除噪声数据，得到预处理数据。

具体地，对步骤S101得到的特征数据进行预处理，根据特征数据中样本用户的不同行为类型对应的业务进行差异化处理，清除作弊、刷单、误操作等噪声数据，得到去噪后的预处理数据。

由于样本用户的特征数据是在样本用户的各种网络行为或实体渠道行为过程中产生的，可能存在大量的噪声数据，具体可以通过常用的数据挖掘算法，例如聚类算法过滤掉特征数据中的噪声，从而使得后续对特征数据的分析和建模能够更加精确。

S103：根据预处理数据，建立学习模型，该学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，第一类型用户为保险客户。

具体地，根据步骤S102得到的预处理数据进行建模，采用模型训练算法建立学习模型，例如通过大数据hadoop学习算法建立用户的行为与具有购买意向的保险产品之间的学习模型，该学习模型用于将保险客户的行为与数据库中预设的保险产品进行匹配。

保险客户为具有购买保险意向的潜在客户和已经购买过保险的现有客户。数据库可以是保险管理系统的保险产品数据库，在该数据库中预存了各种保险产品的产品信息，包括保险类型、保险名称、保额数据信息、参保对象、保险范围、以及收益等。

S104：基于学习模型，对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品。

具体地，基于步骤S103建立的学习模型，对某一个具体的待预测的保险客户进行行为预测，即将待预测的保险客户的行为类型输入该学习模型，通过该学习模型的计算和分析，得到该待预测的保险客户感兴趣的目标保险产品。

目标保险产品可以通过网络推送或者其他推送方式被推荐给待预测的保险客户。例如，当保险客户发生购买旅游产品的行为，或者发生购买火车票、机票等交通运输产品的行为时，根据学习模型可以得到与该保险客户的行为相匹配的目标保险产品，例如旅游安全险、航空延误险等，并且将这些目标保险产品推送给待预测的保险客户。

S105：将待预测的第一类型用户推送给第二类型用户，以使第二类型用户将该第一类型用户确定为目标保险产品的目标用户，第二类型用户为保险业务人员。

具体地，将待预测的保险客户的用户信息推送给保险业务人员，该用户信息可以包括保险客户的姓名、联系方式、可能感兴趣的保险产品等，保险业务人员可以将该保险客户确定为购买目标保险产品的目标用户，对该保险用户进行有针对性的持续跟踪，使得保险业务人员不再盲目的选择目标用户，从而提高保险产品的销售成功率和效率。

本实施例中，通过从用户属性库中获取样本用户的特征数据，对该特征数据进行去噪处理后得到预处理数据，并根据该预处理数据建立学习模型，基于该学习模型实现对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品，通过建立学习模型的方式能够自动且准确地找到用户行为与保险产品之间的关系，从而实现对第一类型用户感兴趣的保险产品的准确预测，提高对用户投保行为的预测效率和准确率，以及智能预测水平，同时将该第一类型用户推送给第二类型用户，使得第二类型用户能够及时了解购买保险产品概率高的潜在用户，从而进行有针对性的持续跟踪，提高保险产品的销售成功率和效率。

实施例二：

图2是本申请实施例二提供的一种用户投保行为预测的方法的流程图，本申请实施例的执行主体为计算设备，其具体可以是服务器等，图2示例的一种用户投保行为预测的方法具体可以包括步骤S201至步骤S210，详述如下：

S201：定期将样本用户的基础数据同步到用户属性库，其中，样本用户的基础数据包括网络访问数据和保险管理系统中的保单数据，网络访问数据包括产品订购信息和网站访问信息。

具体地，定期获取样本用户的基础数据，并将该基础数据同步到用户属性库的过程如图3所示，其具体可以通过步骤S2011至步骤S2019完成，详细说明如下：

S2011：获取样本用户的基础数据。

样本用户可以是通过各种行为接口进行行为动作的用户。不同行为动作的样本用户对应不同的基础数据。

其中，对网站进行访问、通过APP进行操作的样本用户，其基础数据包括网络访问数据，网络访问数据可以通过对样本用户的网站浏览记录、网络操作记录等进行分析，得到网站访问信息，该网站访问信息具体可以包括访问内容的类型、所关注或者购买的产品信息，以及访问次数等。

通过实体渠道办理业务的样本用户，其基础数据包括保险管理系统中的保单数据，保单数据可以包括购买保险产品的用户信息，具体购买的保险产品信息，购买时间等。

S2012：判断导入汇总时间段内基础数据的数据游标是否执行完成，若未执行完成，则继续执行步骤S2013，否则执行步骤S2014。

具体地，导入汇总时间段是指定期将样本用户的基础数据同步到用户属性库的定期时间段，例如该时间段可以是每10分钟，或者每30分钟等。当用户通过各种行为接口进行频繁的行为动作时，该时间段可以设置相对较短的时间长度，当用户的行为动作不是很频繁时，该时间段可以是设置相对较长的时间长度。导入汇总时间段的具体时长可以根据实际应用的需要进行设置，此处不做限制。

游标充当指针的作用，是一种能从包括多条数据记录的结果集中每次提取一条记录的机制。这里，基础数据的数据游标是指在步骤S2011得到的样本用户的基础数据的集合中，每次提取一条基础数据。若数据游标执行完成，则说明步骤S2011得到的样本用户的基础数据已经插入到临时表中，流程跳转到步骤S2014；若数据游标未执行完成，则继续执行步骤S2013，提取下一条待同步的基础数据进行插入临时表的操作。

S2013：将获取到的基础数据插入到临时表中，并返回步骤S2012。

具体地，将数据游标当前指向的基础数据插入到临时表中，并返回步骤S2012，继续通过数据游标对基础数据的集合中的下一条待同步的基础数据进行处理。

S2014：判断对基础数据进行分析用的分析游标是否执行完成，若未执行完成，则继续执行步骤S2015，否则该同步流程处理完成，则流程跳转到步骤S2019。

具体地，当导入汇总时间段内基础数据的数据游标执行完成时，需要同步到用户属性库中的基础数据已经全部插入到临时表中，在该临时表中通过分析游标每次提取该临时表中的一条基础数据进行同步流程处理。若分析游标执行完成，则同步流程处理完成，流程跳转到步骤S2019；若分析游标未执行完成，则继续执行步骤S2015，提取下一条待同步的基础数据进行同步处理。

S2015：对基础数据进行分析和汇总操作，得到待同步数据和对应的数据记录表。

具体地，若临时表中对基础数据进行分析用的分析游标未执行完成，则对分析游标当前指向的基础数据进行分析和汇总操作，得到同步数据和对应的数据记录表。

可以理解的是，根据基础数据的特征，该待同步数据可以包括样本用户的访问记录数据、业务特征数据，常用链接数据等，并且每种数据类型的数据均可以通过数据记录表的方式进行保存，一种数据类型的数据保存至一份数据记录表中。

S2016：在当前的用户属性库中，判断待同步数据对应的数据记录表中是否已经存在待同步数据的记录，若已经存在则执行步骤S2018，否则执行步骤S2017。

具体地，用户属性库可以是大数据平台，在当前的用户属性库的数据记录表中，对每个待同步数据只记录该类型数据的最新值，因此需判断待同步数据对应的数据记录表中是否已经存在该待同步数据的记录，若已经存在则执行步骤S2018，否则执行步骤S2017。

S2017：将待同步的数据插入到指定的数据记录表中，并跳转到步骤S2019。

具体地，若待同步数据对应的数据记录表中尚不存在该待同步数据的记录，则将该待同步的数据插入到对应的数据记录表中。完成插入操作后流程跳转到步骤S2019。

S2018：将待同步的数据更新到对应的数据记录表中的对应记录中。

具体地，若待同步数据对应的数据记录表中已经存在该待同步数据的记录，则将该待同步数据更新到已经存在的对应记录中。

S2019：流程结束。

S202：对样本用户的基础数据进行聚类分析，得到样本用户的特征数据。

具体地，将步骤S201同步到用户属性库中的样本用户的基础数据进行聚类分析，得到样本用户的特征数据，其中，特征数据包括样本用户的行为类型和该行为类型对应的行为次数，行为类型包括订购产品类型和访问网站类型。

聚类分析可以通过计算不同基础数据单元之间的接近程度进行分析，该接近程度可以用距离指标表示，即距离指标越小表示对应的两个基础数据单元的数据越具有相似性。计算距离指标的方法有很多，按照数据性质的不同，可以选用不同的距离指标算法，如欧氏距离(Euclidean distance)、切比雪夫距离(Chebychev distance)、卡方距离(Chi-Square measure distance)等。

通过聚类分析后得到的样本用户的特征数据可以以特征信息表的形式存在，特征信息表可以采用二维数组表示，该二维数组的第一维用于标识样本用户的行为类型，该二维数组的第二维用于标识每个行为类型对应的行为次数。样本用户的行为类型具体可以包括样本用户订购具体产品的产品类型，以及样本用户访问网站的网站类型。

S203：从用户属性库中获取样本用户的特征数据。

具体地，根据步骤S201至步骤S202定期将样本用户的基础数据同步到用户属性库，并对样本用户的基础数据进行聚类分析，得到样本用户的特征数据之后，从用户属性库中获取这些样本用户的特征数据。

S204：对样本用户的特征数据进行预处理，去除噪声数据，得到预处理数据。

具体地，对步骤S203得到的特征数据进行预处理，去除噪声数据，得到预处理数据。

本步骤与实施例一中的步骤S102采用完全相同的处理过程，并得到相同的处理结果，此处不再赘述。

S205：从预处理数据中选择训练样本数据和测试样本数据。

具体地，从步骤S204得到的预处理数据中，按照第一预设比例选择预处理数据作为训练样本数据，按照第二预设比例选择预处理数据作为测试样本数据。

例如，第一预设比例可以设置为80％，第二预设比例可以设置为20％，即将80％的预处理数据作为训练样本数据，将剩下20％的预处理数据作为测试样本数据。可以理解的是，第一预设比例和第二预设比例可以根据实际应用的需要进行合理设置，此处不做限制。

S206：在预设的训练周期内根据训练样本数据，训练样本用户的行为与数据库中预设的保险产品之间的关联模型。

预设的训练周期可以依据样本用户的行为特征进行设置，并且该训练周期可以根据关联模型的训练结果进行调整。

不同投保业务，其对应的样本用户行为特征不同，根据样本用户的行为特征确定对应的投保业务，由投保业务决定训练周期的长短。根据关联模型的训练结果对训练周期进行调整，具体可以根据多次实验来确定。

合适的训练周期能够有效提升关联模型的准确度，由于样本用户在近期的行为更加能反映出接下来可能的行为动作，因此训练周期的设置还需要考虑时间衰减因素的影响。

具体地，在预设的训练周期内根据步骤S205确定的训练样本数据，采用协同过滤(Collaborative Filtering，CF)算法，训练样本用户的行为与数据库中预设的保险产品之间的关联模型。

协同过滤算法包括基于用户的协同过滤(User CollaborationFilter，UserCF)算法和基于产品的协同过滤(ItemCollaborationFilter，ItemCF)算法。在训练关联模型时可以采用UserCF算法，或者采用ItemCF算法，还可以同时采用UserCF和ItemCF算法。

可以理解的是，协同过滤算法中的用户即样本用户，产品即数据库中预设的保险产品。在本申请实施例中，数据库即保险管理系统的保险产品数据库，在该数据库中预存了各种保险产品的产品信息，包括保险类型、保险名称、保额数据信息、参保对象、保险范围、以及收益等。

当样本用户的数量较小时，可以直接采用UserCF算法建立关联模型，UserCF算法核心思想是当用户A需要个性化推荐时，可以先找到和用户A有相似兴趣的其他用户，然后把这些其他用户已经购买的保险产品或者感兴趣的保险产品与用户A进行关联匹配。

在查找和用户A有相似兴趣的其他用户时，可以通过计算两个用户之间的兴趣相似度的方法进行查找，例如，给定样本用户u和样本用户v，可以通过相似度算法，例如对数似然估计(Log Likelihood Estimate)算法，计算样本用户u和样本用户v之间的兴趣相似度。

具体可以通过公式(1)计算样本用户u对保险产品的感兴趣程度。

其中，p(u,i)表示样本用户u对保险产品i的感兴趣程度，S(u,K)表示和样本用户u的兴趣最接近的K个样本用户，N(i)表示对保险产品i有过购买行为的样本用户的集合，w _uv表示样本用户u和样本用户v之间的兴趣相似度，r _vi表示样本用户v对保险产品i的感兴趣程度。

当采用ItemCF算法建立关联模型时，由于ItemCF算法的核心思想是给用户推荐和该用户感兴趣的产品类似的其他产品，因此可以通过分析样本用户的行为，计算不同保险产品之间的相似度，并且通过相似度矩阵的形式保存数据中预设的保险产品之间的相似度，根据该相似度矩阵和样本用户的历史行为分析与该样本用户的行为相关联的保险产品。

具体可以通过公式(2)计算样本用户u对保险产品j的感兴趣程度。

其中，p(u,j)表示样本用户u对保险产品j的感兴趣程度，M(u)表示样本用户u感兴趣的保险产品集合，T(i,K)表示和保险产品i最相似的K个保险产品集合，j∈T(i,K)，w _ji表示保险产品j和保险产品i之间的相似度，r _ui表示样本用户u对保险产品i的感兴趣程度。

根据上述公式(1)或公式(2)计算出的样本用户u对不同保险产品的感兴趣程度，从其中选取感兴趣程度超过兴趣阈值的保险产品，建立样本用户u的行为与选取出的这些保险产品之间的关联关系，进而得到样本用户的行为与数据库中预设的保险产品之间的关联模型。

进一步地，在预设的训练周期内根据训练样本数据，训练样本用户的行为与数据库中预设的保险产品之间的关联模型还可以通过如下步骤S2061至步骤S2063实现，详细说明如下：

S2061：在预设的训练周期内根据训练样本数据，对样本用户的网络行为进行分析，确定网络行为对应的关联产品。

具体地，在预设的训练周期内根据步骤S205确定的训练样本数据，采用基于上述公式(1)的UserCF算法或者公式(2)的ItemCF算法，确定样本用户感兴趣的保险产品，并结合样本用户的行为类型和该行为类型对应的行为次数进行归纳和分析，确定样本用户的网络行为对应的关联产品。

例如，通过对样本用户所访问的网站类型信息进行分析，确定样本用户在训练周期内搜索却没有购买的保险产品，同时，结合样本用户对该保险产品的搜索次数，分析样本用户对该保险产品的感兴趣的程度，并将感兴趣程度达到兴趣阈值的保险产品确定为该网络搜索行为对应的关联产品。

S2062：对样本用户的网络行为和网络行为对应的关联产品进行加权训练，得到样本用户的行为与数据库中预设的保险产品之间的关联模型。

具体地，对网络行为和其对应的关联产品进行加权计算，根据训练样本数据中的网络行为以及每个网络行为对应的关联产品的出现频次，确定网络行为的权重参数以及该网络行为对应的关联产品的权重值，出现频次高的网络行为或者关联产品，其对应的权重值就大，反之出现频次低的网络行为或者关联产品，其对应的权重值就小。通过对训练样本数据中每种网络行为及其对应的关联产品进行加权计算，根据计算得到的综合权重值，将综合权重值超过预设权重阈值的网络行为及其对应的关联产品提取出来，建立网络行为与关联产品之间的关联模型，即样本用户的行为与数据库中预设的保险产品之间的关联模型。

S207：使用测试样本数据对关联模型进行测试。

具体地，根据步骤S205确定的测试样本数据，将该测试样本数据带入步骤S206确定的关联模型中进行测试，验证关联模型的准确率是否达到预设的测试要求。

S208：若测试结果满足预设的测试要求，则将关联模型作为学习模型，该学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，第一类型用户为保险客户。

具体地，若步骤S207的测试结果满足预设的测试要求，则将步骤S206确定的关联模型作为学习模型，该学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配。

第一类型用户为保险客户，即具有购买保险意向的潜在客户和已经购买过保险的现有客户。数据库具体为保险管理系统的保险产品数据库，在该数据库中预存了各种保险产品的产品信息，包括保险类型、保险名称、保额数据信息、参保对象、保险范围、以及收益等。

预设的测试要求可以根据实际应用的需要进行设置，此处不做限制。例如，测试要求可以设置为使用测试样本数据对关联模型进行测试的测试结果的正确率达到90％。

若步骤S207的测试结果不满足预设的测试要求，则继续对关联模型进行训练和测试，直到满足预设的测试要求为止。

需要说明的是，训练样本数据和测试样本数据均是与保险业务结合的数据，其通过用户的电话号码或者身份证号码等标识信息进行数据关联，从而保证用户的一致性。

S209：基于学习模型，对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品。

具体地，基于步骤S208确定的学习模型，对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品。

本步骤与实施例一中的步骤S104采用完全相同的处理过程，并得到相同的处理结果，此处不再赘述。

S210：将待预测的第一类型用户推送给第二类型用户，以使第二类型用户将该第一类型用户确定为目标保险产品的目标用户，第二类型用户为保险业务人员。

具体地，本步骤与实施例一中的步骤S105采用完全相同的处理过程，并得到相同的处理结果，此处不再赘述。

本实施例中，首先，通过定期将样本用户的基础数据同步到用户属性库，并对样本用户的基础数据进行聚类分析，得到样本用户的特征数据，然后从用户属性库中获取样本用户的特征数据，对该特征数据进行去噪处理后得到预处理数据。通过在用户属性库这种大数据平台上对特征数据进行大数据分析，去噪等，得到具有针对性的预处理数据，从而保证后续对特征数据的分析和建模能够更加精确，提高预测准率。然后，从预处理数据中选择训练样本数据和测试样本数据，并在预设的训练周期内根据训练样本数据，采用基于用户的协同过滤算法或者基于产品的协同过滤算法，训练样本用户的行为与数据库中预设的保险产品之间的关联模型，并使用测试样本数据对关联模型进行测试，若测试结果满足预设的测试要求，则将关联模型作为学习模型，并基于该学习模型实现对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品，通过利用CF算法建立学习模型的方式能够自动且准确地找到用户行为与保险产品之间的关系，从而实现对第一类型用户感兴趣的保险产品的准确预测，提高对用户投保行为的预测效率和准确率，以及智能预测水平，同时将该第一类型用户推送给第二类型用户，使得第二类型用户能够及时了解购买保险产品概率高的潜在用户，从而进行有针对性的持续跟踪，提高保险产品的销售成功率和效率。

实施例三：

图4是本申请实施例三提供的一种用户投保行为预测的装置的结构示意图，为了便于说明，仅示出了与本申请实施例相关的部分。图4示例的一种用户投保行为预测的装置可以是前述实施例一提供的用户投保行为预测的方法的执行主体。图4示例的一种用户投保行为预测的装置包括：获取模块31、预处理模块32、建模模块33、预测模块34和推送模块35，各功能模块详细说明如下：

获取模块31，用于从用户属性库中获取样本用户的特征数据，其中，特征数据包括样本用户的行为类型和该行为类型对应的行为次数，行为类型包括订购产品类型和访问网站类型；

预处理模块32，用于对获取模块31获取的特征数据进行预处理，去除噪声数据，得到预处理数据；

建模模块33，用于根据预处理模块32得到的预处理数据，建立学习模型，其中，该学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，第一类型用户为保险客户；

预测模块34，用于基于建模模块33建立的学习模型，对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品；

推送模块35，用于将该第一类型用户推送给第二类型用户，以使第二类型用户将该第一类型用户确定为目标保险产品的目标用户，其中，第二类型用户为保险业务人员。

本实施例提供的一种用户投保行为预测的装置中各模块实现各自功能的过程，具体可参考前述图1所示实施例的描述，此处不再赘述。

从上述图4示例的一种用户投保行为预测的装置可知，本实施例中，通过从用户属性库中获取样本用户的特征数据，对该特征数据进行去噪处理后得到预处理数据，并根据该预处理数据建立学习模型，基于该学习模型实现对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品，通过建立学习模型的方式能够自动且准确地找到用户行为与保险产品之间的关系，从而实现对第一类型用户感兴趣的保险产品的准确预测，提高对用户投保行为的预测效率和准确率，以及智能预测水平，同时将该第一类型用户推送给第二类型用户，使得第二类型用户能够及时了解购买保险产品概率高的潜在用户，从而进行有针对性的持续跟踪，提高保险产品的销售成功率和效率。

实施例四：

图5是本申请实施例四提供的一种用户投保行为预测的装置的结构示意图，为了便于说明，仅示出了与本申请实施例相关的部分。图5示例的一种用户投保行为预测的装置可以是前述实施例二提供的用户投保行为预测的方法的执行主体。图5示例的一种用户投保行为预测的装置包括：获取模块41、预处理模块42、建模模块43、预测模块44和推送模块45，各功能模块详细说明如下：

获取模块41，用于从用户属性库中获取样本用户的特征数据，其中，特征数据包括样本用户的行为类型和该行为类型对应的行为次数，行为类型包括订购产品类型和访问网站类型；

预处理模块42，用于对获取模块41获取的特征数据进行预处理，去除噪声数据，得到预处理数据；

建模模块43，用于根据预处理模块42得到的预处理数据，建立学习模型，其中，该学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，第一类型用户为保险客户；

预测模块44，用于基于建模模块43建立的学习模型，对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品；

推送模块45，用于将该第一类型用户推送给第二类型用户，以使第二类型用户将该第一类型用户确定为目标保险产品的目标用户，其中，第二类型用户为保险业务人员。

进一步地，该装置还包括：

同步模块46，用于定期将样本用户的基础数据同步到用户属性库，其中，基础数据包括网络访问数据和保险管理系统中的保单数据，网络访问数据包括产品订购信息和网站访问信息；

聚类模块47，用于对用户属性库中的基础数据进行聚类分析，得到样本用户的特征数据。

进一步地，建模模块43包括：

选择子模块431，用于从预处理模块42得到的预处理数据中选择训练样本数据和测试样本数据；

训练子模块432，用于在预设的训练周期内根据选择子模块431确定的训练样本数据，训练样本用户的行为与数据库中预设的保险产品之间的关联模型；

测试子模块433，用于使用选择子模块431确定的测试样本数据对训练子模块432确定的关联模型进行测试；

判断子模块434，用于若测试子模块433得到的测试结果满足预设的测试要求，则将训练子模块432确定的关联模型作为学习模型。

进一步地，训练子模块432还用于：

在预设的训练周期内根据选择子模块431确定的训练样本数据，采用协同过滤算法训练样本用户的行为与数据库中预设的保险产品之间的关联模型。

进一步地，训练子模块434还用于：

在预设的训练周期内根据选择子模块431确定的训练样本数据，对样本用户的网络行为进行分析，确定网络行为对应的关联产品；

对网络行为和关联产品进行加权训练，得到样本用户的行为与数据库中预设的保险产品之间的关联模型。

本实施例提供的一种用户投保行为预测的装置中各模块实现各自功能的过程，具体可参考前述图2所示实施例的描述，此处不再赘述。

从上述图5示例的一种用户投保行为预测的装置可知，本实施例中，首先，通过定期将样本用户的基础数据同步到用户属性库，并对样本用户的基础数据进行聚类分析，得到样本用户的特征数据，然后从用户属性库中获取样本用户的特征数据，对该特征数据进行去噪处理后得到预处理数据。通过在用户属性库这种大数据平台上对特征数据进行大数据分析，去噪等，得到具有针对性的预处理数据，从而保证后续对特征数据的分析和建模能够更加精确，提高预测准率。然后，从预处理数据中选择训练样本数据和测试样本数据，并在预设的训练周期内根据训练样本数据，采用基于用户的协同过滤算法或者基于产品的协同过滤算法，训练样本用户的行为与数据库中预设的保险产品之间的关联模型，并使用测试样本数据对关联模型进行测试，若测试结果满足预设的测试要求，则将关联模型作为学习模型，并基于该学习模型实现对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品，通过利用CF算法建立学习模型的方式能够自动且准确地找到用户行为与保险产品之间的关系，从而实现对第一类型用户感兴趣的保险产品的准确预测，提高对用户投保行为的预测效率和准确率，以及智能预测水平，同时将该第一类型用户推送给第二类型用户，使得第二类型用户能够及时了解购买保险产品概率高的潜在用户，从而进行有针对性的持续跟踪，提高保险产品的销售成功率和效率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

实施例五：

图6是本申请实施例五提供的用户投保行为预测的计算设备的示意图。如图6所示，该实施例的计算设备6包括：处理器60以及存储器61，所述存储器61中存储有可在所述处理器60上运行的计算机可读指令62，例如用户投保行为预测的程序。所述处理器60执行所述计算机可读指令62时实现上述各个用户投保行为预测的方法实施例中的步骤，例如图1所示的步骤S101至S105。或者，所述处理器60执行所述计算机可读指令62时实现上述各用户投保行为预测的装置实施例中各模块/单元的功能，例如图4所示模块31至35的功能。

示例性的，所述计算机可读指令62可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器61中，并由所述处理器60执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段，该指令段用于描述所述计算机可读指令62在所述计算设备6中的执行过程。

所述计算设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算设备可包括，但不仅限于，处理器60以及存储器61。本领域技术人员可以理解，图6仅仅是用户投保行为预测的计算设备6的示例，并不构成对用户投保行为预测的计算设备6的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述计算设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器60可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器61可以是所述计算设备6的内部存储单元，例如所述计算设备6的硬盘或内存。所述存储器61也可以是所述计算设备6的外部存储设备，例如所述计算设备6上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器61还可以既包括所述计算设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机可读指令以及所述计算设备所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种用户投保行为预测的方法，其特征在于，包括：

从用户属性库中获取样本用户的特征数据，其中，所述特征数据包括所述样本用户的行为类型和所述行为类型对应的行为次数，所述行为类型包括订购产品类型和访问网站类型；

对所述特征数据进行预处理，去除噪声数据，得到预处理数据；

根据所述预处理数据，建立学习模型，其中，所述学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，所述第一类型用户为保险客户；

基于所述学习模型，对待预测的所述第一类型用户进行行为预测，得到该第一类型用户的目标保险产品；

将该第一类型用户推送给第二类型用户，以使所述第二类型用户将该第一类型用户确定为所述目标保险产品的目标用户，其中，所述第二类型用户为保险业务人员。
如权利要求1所述的用户投保行为预测的方法，其特征在于，所述从用户属性库中获取样本用户的特征数据之前，所述方法还包括：

定期将所述样本用户的基础数据同步到所述用户属性库，其中，所述基础数据包括网络访问数据和保险管理系统中的保单数据，所述网络访问数据包括产品订购信息和网站访问信息；

对所述基础数据进行聚类分析，得到所述样本用户的特征数据。
如权利要求1或2所述的用户投保行为预测的方法，其特征在于，所述根据所述预处理数据，建立学习模型包括：

从所述预处理数据中选择训练样本数据和测试样本数据；

在预设的训练周期内根据所述训练样本数据，训练所述样本用户的行为与数据库中预设的保险产品之间的关联模型；

使用所述测试样本数据对所述关联模型进行测试；

若测试结果满足预设的测试要求，则将所述关联模型作为所述学习模型。
如权利要求3所述的用户投保行为预测的方法，其特征在于，所述在预设的训练周期内根据所述训练样本数据，训练所述样本用户的行为与数据库中预设的保险产品之间的关联模型包括：

在预设的训练周期内根据所述训练样本数据，采用协同过滤算法训练所述关联模型。
如权利要求3所述的用户投保行为预测的方法，其特征在于，所述在预设的训练周期内根据所述训练样本数据，训练所述样本用户的行为与数据库中预设的保险产品之间的关联模型还包括：

在所述训练周期内根据所述训练样本数据，对所述样本用户的网络行为进行分析，确定所述网络行为对应的关联产品；

对所述网络行为和所述关联产品进行加权训练，得到所述关联模型。
一种用户投保行为预测的装置，其特征在于，包括：

获取模块，用于从用户属性库中获取样本用户的特征数据，其中，特征数据包括样本用户的行为类型和该行为类型对应的行为次数，行为类型包括订购产品类型和访问网站类型；

预处理模块，用于对获取模块获取的特征数据进行预处理，去除噪声数据，得到预处理数据；

建模模块，用于根据预处理模块得到的预处理数据，建立学习模型，其中，该学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，第一类型用户为保险客户；

预测模块，用于基于建模模块建立的学习模型，对待预测的第一类型用户进行行为预测，得到该第一类型用户的目标保险产品；

推送模块，用于将该第一类型用户推送给第二类型用户，以使第二类型用户将该第一类型用户确定为目标保险产品的目标用户，其中，第二类型用户为保险业务人员。
根据权利要求6所述的用户投保行为预测的装置，其特征在于，还包括：

同步模块，用于定期将样本用户的基础数据同步到用户属性库，其中，基础数据包括网络访问数据和保险管理系统中的保单数据，网络访问数据包括产品订购信息和网站访问信息；

聚类模块，用于对用户属性库中的基础数据进行聚类分析，得到样本用户的特征数据。
根据权利要求6或7所述的用户投保行为预测的装置，其特征在于，所述建模模块包括：

选择子模块，用于从预处理模块得到的预处理数据中选择训练样本数据和测试样本数据；

训练子模块，用于在预设的训练周期内根据选择子模块确定的训练样本数据，训练样本用户的行为与数据库中预设的保险产品之间的关联模型；

测试子模块，用于使用选择子模块确定的测试样本数据对训练子模块确定的关联模型进行测试；

判断子模块，用于若测试子模块得到的测试结果满足预设的测试要求，则将训练子模块确定的关联模型作为学习模型。
根据权利要求8所述的用户投保行为预测的装置，其特征在于，所述训练子模块还用于：

在预设的训练周期内根据选择子模块确定的训练样本数据，采用协同过滤算法训练样本用户的行为与数据库中预设的保险产品之间的关联模型。
根据权利要求8所述的用户投保行为预测的装置，其特征在于，训练子模块还用于：

在预设的训练周期内根据选择子模块确定的训练样本数据，对样本用户的网络行为进行分析，确定网络行为对应的关联产品；

对网络行为和关联产品进行加权训练，得到样本用户的行为与数据库中预设的保险产品之间的关联模型。
一种用户投保行为预测的计算设备，其特征在于，包括存储器以及处理器，所述存储器中存储有可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

从用户属性库中获取样本用户的特征数据，其中，所述特征数据包括所述样本用户的行为类型和所述行为类型对应的行为次数，所述行为类型包括订购产品类型和访问网站类型；

对所述特征数据进行预处理，去除噪声数据，得到预处理数据；

根据所述预处理数据，建立学习模型，其中，所述学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，所述第一类型用户为保险客户；

基于所述学习模型，对待预测的所述第一类型用户进行行为预测，得到该第一类型用户的目标保险产品；

将该第一类型用户推送给第二类型用户，以使所述第二类型用户将该第一类型用户确定为所述目标保险产品的目标用户，其中，所述第二类型用户为保险业务人员。
根据权利要求11所述的计算设备，其特征在于，所述处理器执行所述计算机可读指令时还实现如下步骤：

定期将所述样本用户的基础数据同步到所述用户属性库，其中，所述基础数据包括网络访问数据和保险管理系统中的保单数据，所述网络访问数据包括产品订购信息和网站访问信息；

对所述基础数据进行聚类分析，得到所述样本用户的特征数据。
根据权利要求11或12所述的计算设备，其特征在于，所述根据所述预处理数据，建立学习模型包括：

从所述预处理数据中选择训练样本数据和测试样本数据；

在预设的训练周期内根据所述训练样本数据，训练所述样本用户的行为与数据库中预设的保险产品之间的关联模型；

使用所述测试样本数据对所述关联模型进行测试；

若测试结果满足预设的测试要求，则将所述关联模型作为所述学习模型。
根据权利要求13所述的计算设备，其特征在于，所述在预设的训练周期内根据所述训练样本数据，训练所述样本用户的行为与数据库中预设的保险产品之间的关联模型包括：

在预设的训练周期内根据所述训练样本数据，采用协同过滤算法训练所述关联模型。
根据权利要求13所述的计算设备，其特征在于，所述在预设的训练周期内根据所述训练样本数据，训练所述样本用户的行为与数据库中预设的保险产品之间的关联模型还包括：

在所述训练周期内根据所述训练样本数据，对所述样本用户的网络行为进行分析，确定所述网络行为对应的关联产品；

对所述网络行为和所述关联产品进行加权训练，得到所述关联模型。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，其特征在于，所述计算机可读指令被至少一个处理器执行时实现如下步骤：

从用户属性库中获取样本用户的特征数据，其中，所述特征数据包括所述样本用户的行为类型和所述行为类型对应的行为次数，所述行为类型包括订购产品类型和访问网站类型；

对所述特征数据进行预处理，去除噪声数据，得到预处理数据；

根据所述预处理数据，建立学习模型，其中，所述学习模型用于将第一类型用户的行为与数据库中预设的保险产品进行匹配，所述第一类型用户为保险客户；

基于所述学习模型，对待预测的所述第一类型用户进行行为预测，得到该第一类型用户的目标保险产品；

将该第一类型用户推送给第二类型用户，以使所述第二类型用户将该第一类型用户确定为所述目标保险产品的目标用户，其中，所述第二类型用户为保险业务人员。
根据权利要求16所述的计算机可读存储介质，其特征在于，所述计算机可读指令被至少一个处理器执行时还实现如下步骤：

定期将所述样本用户的基础数据同步到所述用户属性库，其中，所述基础数据包括网络访问数据和保险管理系统中的保单数据，所述网络访问数据包括产品订购信息和网站访问信息；

对所述基础数据进行聚类分析，得到所述样本用户的特征数据。
根据权利要求16或17所述的计算机可读存储介质，其特征在于，所述根据所述预处理数据，建立学习模型包括：

从所述预处理数据中选择训练样本数据和测试样本数据；

在预设的训练周期内根据所述训练样本数据，训练所述样本用户的行为与数据库中预设的保险产品之间的关联模型；

使用所述测试样本数据对所述关联模型进行测试；

若测试结果满足预设的测试要求，则将所述关联模型作为所述学习模型。
根据权利要求18所述的计算机可读存储介质，其特征在于，所述在预设的训练周期内根据所述训练样本数据，训练所述样本用户的行为与数据库中预设的保险产品之间的关联模型包括：

在预设的训练周期内根据所述训练样本数据，采用协同过滤算法训练所述关联模型。
根据权利要求18所述的计算机可读存储介质，其特征在于，所述在预设的训练周期内根据所述训练样本数据，训练所述样本用户的行为与数据库中预设的保险产品之间的关联模型还包括：

在所述训练周期内根据所述训练样本数据，对所述样本用户的网络行为进行分析，确定所述网络行为对应的关联产品；

对所述网络行为和所述关联产品进行加权训练，得到所述关联模型。