CN110619545B

CN110619545B - 基于大数据的车险数据推送方法、系统、设备及存储介质

Info

Publication number: CN110619545B
Application number: CN201910841553.2A
Authority: CN
Inventors: 许强
Original assignee: Ping An Property and Casualty Insurance Company of China Ltd
Current assignee: Ping An Property and Casualty Insurance Company of China Ltd
Priority date: 2019-09-06
Filing date: 2019-09-06
Publication date: 2023-07-21
Anticipated expiration: 2039-09-06
Also published as: CN110619545A

Abstract

本发明实施例提供一种基于大数据的车险数据推送方法，获取目标客户的个人数据及车辆数据；根据个人数据和车辆数据构建与目标客户对应的目标车险业务逻辑信息；根据个人数据及车辆数据获取目标客户的基本信息标签数据、车辆信息标签数据及车险信息标签数据；将上述标签数据数据输入到随机森林模型中，并输出特征组合；将特征组合输入到预测模型中，并输出每个车险险别的预测评分值；基于目标车险业务逻辑信息和每个车险险别的预测评分值，从多个车险险别中选择一个或多个目标车险险别；将一个或多个目标车险险别推送至客户端。本发明实施例提供基于大数据的车险数据推送系统、设备及存储介质。本发明实施例的车险数据推送的准确度较高。

Description

基于大数据的车险数据推送方法、系统、设备及存储介质

技术领域

本发明实施例涉及大数据领域，尤其涉及一种基于大数据的车险数据推送方法、系统、计算机设备及计算机可读存储介质。

背景技术

随着保险意识的提高，越来越多的车主在购买机动车辆以后，会为该机动车辆投保，购买车险，以保障车辆事故中受害人的正当权益。

目前，车险销售公司多采用协同过滤算法、基于内容算法、基于模型算法、混合算法等推荐算法向广大车主推荐一种或多种车险。但是，对于车主而言，上述车险数据推送方法并没有针对车主的实际情况进行相关的推荐，往往会出现向车主推荐的车险信息并不是车主感兴趣或者需要的，导致车主获取车险信息的体验不佳。对于车险销售公司而言，车险信息投放的精准度低，不利于车险业务的推广。

因此，如何有效地向车主推荐其感兴趣或者需要的车险信息是目前行业急迫要解决的问题。

发明内容

有鉴于此，本发明实施例提供了一种基于大数据的车险数据推送方法、系统、计算机设备及计算机可读存储介质，用于解决现有采用多种混合算法向车主推送车险数据的方法，没有考虑到车主的实际情况而可能会向车主推送车主不感兴趣或不需要的车险数据，进而导致车险数据推送的精准度较低的问题。

本发明实施例是通过下述技术方案来解决上述技术问题：

一种基于大数据的车险数据推送方法，包括：

接收客户端提供的目标客户的个人数据；

根据所述个人数据向至少一个数据库发送查询请求，所述查询请求用于查询所述目标客户的关联车辆的车辆数据；

接收所述至少一个数据库返回的车辆数据；

对所述个人数据和所述车辆数据进行数据处理，生成与所述目标客户对应的目标车险业务逻辑信息，所述目标车险业务逻辑信息表示各候选车险险别之间的关联关系以及各候选车险险别状态值；

将所述个人数据及所述车辆数据与预设的标签进行匹配，以得到所述目标客户的基本信息标签数据、车辆信息标签数据及车险信息标签数据；

将所述基本信息标签数据、所述车辆信息标签数据及所述车险信息标签数据输入到随机森林模型中，以通过所述随机森林模型输出特征组合；

将所述特征组合输入到预测模型中，以通过所述预测模型获取每个车险险别的预测评分值；

基于所述目标车险业务逻辑信息和每个车险险别的预测评分值，从多个车险险别中选择一个或多个目标车险险别；

将一个或多个所述目标车险险别推送至所述客户端。

进一步地，还包括随机森林模型的训练步骤：

从预先配置的客户信息数据库中进行m轮有放回取样操作，以得到m个样本数据训练集，其中，每个样本数据集中包括多个样本客户的多个样本原始数据；

基于所述m个样本数据训练集构建随机森林模型，所述随机森林模型包括m棵CART决策树；

其中，每棵所述CART决策树根据对应的样本数据训练集训练得到。

进一步地，对所述个人数据和所述车辆数据进行数据处理，生成与所述目标客户对应的目标车险业务逻辑信息，所述目标车险业务逻辑信息表示各候选车险险别之间的关联关系以及各候选车险险别状态值的步骤，包括：

根据所述个人数据和所述车辆数据配置多个候选车险险别；

根据所述多个候选车险险别获取相应的预设车险业务逻辑信息；

根据所述多个候选车险险别及预设车险业务逻辑信息，生成与所述目标客户对应的目标车险业务逻辑信息；所述目标车险业务逻辑信息表示各候选车险险别之间的关联关系以及各候选车险险别状态值。

进一步地，基于所述目标车险业务逻辑信息和每个车险险别的预测评分值，从多个车险险别中选择一个或多个目标车险险别的步骤，包括：

判断所述多个车险险别的预测评分值是否大于预设阈值；

将预测评分值大于预设阈值的车险险别定义为目标车险险别；

将一个或多个所述目标车险险别与所述目标车险业务逻辑信息进行关联操作，以确定每个目标车险险别的优先级别。

进一步地，将一个或多个所述目标车险险别推送至所述客户端的步骤，包括：

获取所述目标客户在每棵所述CART决策树的路径信息，所述CART决策树包括多个节点，所述多个节点分别对应多个特征值；

根据所述路径信息上每个节点对应的特征值获取一个或多个目标特征值；

根据所述一个或多个目标特征值从客户信息数据库中获取第一客户集合，所述第一客户集合包含多个第一客户；

基于一个或多个所述目标车险险别，从第一客户集合中获取多个第二客户集合，所述第二客户集合包含多个第二客户，并计算每个第二客户集合中第二客户数量在第一客户集合中第一客户数量的占比；

根据所述占比确定每个目标车险险别的话术等级；

根据所述话术等级匹配对应的话术模板，并根据一个或多个所述目标车险险别及话术模板生成对应的提示页面，所述提示页面为根据所述一个或多个目标车险险别和与所述一个或多个目标车险险别对应的推荐理由定义的页面数据；

将所述提示页面推送至所述客户端。

为了实现上述目的，本发明实施例还提供一种基于大数据的车险数据推送系统，包括：

第一接收模块，用于接收所述客户端提供的目标客户的个人数据；

查询模块，用于根据所述个人数据向至少一个数据库发送查询请求，所述查询请求用于查询所述目标客户的关联车辆的车辆数据；

第二接收模块，用于接收所述至少一个数据库返回的车辆数据；

配置模块，用于对所述个人数据和所述车辆数据进行数据处理，生成与所述目标客户对应的目标车险业务逻辑信息，所述目标车险业务逻辑信息表示各候选车险险别之间的关联关系以及各候选车险险别状态值；

匹配模块，用于将所述个人数据及所述车辆数据与预设的标签进行匹配，以得到所述目标客户的基本信息标签数据、车辆信息标签数据及车险信息标签数据；

输入模块，用于将所述基本信息标签数据、所述车辆信息标签数据及所述车险信息标签数据输入到随机森林模型中，以通过所述随机森林模型输出特征组合；

输出模块，用于将所述特征组合输入到预测模型中，以通过所述预测模型获取每个车险险别的预测评分值；

选择模块，用于基于所述目标车险业务逻辑信息和每个车险险别的预测评分值，从多个车险险别中选择一个或多个目标车险险别；

推送模块，用于将一个或多个所述目标车险险别推送至所述客户端。

进一步地，所述配置模块，还用于：

根据所述个人数据和所述车辆数据配置多个候选车险险别；

进一步地，所述选择模块，还用于：

判断所述多个车险险别的预测评分值是否大于预设阈值；

为了实现上述目的，本发明实施例还提供一种计算机设备，所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上所述基于大数据的车险数据推送方法的步骤。

为了实现上述目的，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行如上所述的基于大数据的车险数据推送方法的步骤。

本发明实施例提供的基于大数据的车险数据推送方法、系统、计算机设备及计算机可读存储介质，本发明实施例基于多个维度的标签数据以及根据每个客户构建相应的目标车险业务逻辑信息向目标客户推送目标客户感兴趣或需要的车险险别，车险数据推送的精准度较高，进而能够有效提高车险的成交率。

以下结合附图和具体实施例对本发明进行详细描述，但不作为对本发明的限定。

附图说明

图1为本发明实施例一之基于大数据的车险数据推送方法的步骤流程图；

图2为图1中步骤S106的具体流程示意图；

图3为本发明实施例一中随机森林模型的训练流程示意图；

图4为图1中步骤S114的具体流程示意图；

图5为图1中步骤S116的具体流程示意图；

图6为本发明基于大数据的车险数据推送系统之实施例二的程序模块示意图；

图7为本发明计算机设备之实施例三的硬件结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

实施例一

请参阅图1，示出了本发明实施例之基于大数据的车险数据推送方法的步骤流程图。可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备为执行主体进行示例性描述，具体如下：

步骤S100，接收客户端提供的目标客户的个人数据。

具体的，所述个人数据包括：性别、年龄、身份证号、家庭住址、职业、收入范围等数据。

步骤S102，根据所述个人数据向至少一个数据库发送查询请求，所述查询请求用于查询所述目标客户的关联车辆的车辆数据。

步骤S104，接收所述至少一个数据库返回的车辆数据。

步骤S106，对所述个人数据和所述车辆数据进行数据处理，生成与所述目标客户对应的目标车险业务逻辑信息，所述目标车险业务逻辑信息用于表示各候选车险险别之间的关联关系以及各候选车险险别状态值。

示例性的，请参阅图2，步骤S106还可以进一步包括：

步骤S106A，根据所述个人数据和所述车辆数据配置多个候选车险险别。

具体的，所述多个候选车险险别可以包括交强险、商业险主险不计免赔、附加险、附加险不计免赔等等。

步骤S106B，根据所述多个候选车险险别获取相应的预设车险业务逻辑信息。

具体的，所述预设车险业务逻辑信息以树结构的形式进行表示，所述树结构包括多个层级，每个层级包括至少一个树节点，每个所述树节点具有对应的车险险别。

示例性的，以“商业险”为例，商业险包括主险，主险不计免赔、附加险、附加险不计免赔等。所述预设车险业务逻辑信息以“A”型树结构的形式进行表示，该“A”型树结构包括三个层级，该“A”型树结构的顶部向底部进行层级划分，三个层级分别为第一层、第二层及第三层。第一层包括两个树节点，该两个树节点中的左子节点对应的车险险别为交强险，右子节点对应的车险险别为商业险；第二层包括一个与第一层的右子节点相连接的树节点，该树节点对应的车险险别为主险；第三层包括两个树节点，该两个树节点分别与上一层的树节点相连接；该两个树节点中的左子节点对应的车险险别为主险不计免赔，右子节点对应的车险险别为附加险。

所述预设车险业务逻辑信息表示上述车险险别购买时需要满足其业务逻辑，如：主险不计免赔需在购买主险后购买，附加险需在购买其主险后购买等。

步骤S106C，根据所述多个候选车险险别及预设车险业务逻辑信息，生成与所述目标客户对应的目标车险业务逻辑信息；所述目标车险业务逻辑信息表示各候选车险险别之间的关联关系以及各候选车险险别状态值。

其中，所述候选车险险别状态值用于表示所述候选车险险别是否已经被所述目标客户购买。所述候选车险险别状态值为对应各个候选车险险别的二进制数值。以“主险不计免赔”为例，假设所述目标客户没有购买“主险不计免赔”，则所述“主险不计免赔”对应的数据状态值为“0”；假设所述目标客户已经购买“主险不计免赔”，则所述“主险不计免赔”对应的数据状态值为“1”。

步骤S108，将所述个人数据及所述车辆数据与预设的标签进行匹配，以得到所述目标客户的基本信息标签数据、车辆信息标签数据及车险信息标签数据。

具体的，所述基本信息标签数据包括：性别、年龄、身份证号、家庭住址、婚姻状态、职业、收入范围等；所述车辆信息标签数据包括：车辆行驶地域、驾龄、车贷、驾驶记录、车辆出入位置区域、车龄、车价、轴距、排气量、车座等；所述车险信息标签数据包括：车险购买信息、车险续保信息、车险出险信息、车险理赔信息等。

步骤S110，将所述基本信息标签数据、所述车辆信息标签数据及所述车险信息标签数据输入到随机森林模型中，以通过所述随机森林模型输出特征组合。

在本步骤中，所述随机森林(RF，Random Forest)模型为经过大数据训练后的随机森林模型。

在步骤S100之前，本发明实施例还包括随机森林模型基于大数据进行训练的步骤，具体如下，请参阅图3：

步骤S200，从预先配置的客户信息数据库中进行m轮有放回取样操作，以得到m个样本数据训练集，其中，每个样本数据集中包括多个样本客户的多个样本原始数据。

具体的，使用Bootstraping方法从客户信息数据库中随机有放回地抽取n个训练样本，并进行m轮取样，以得到m个样本数据训练集，每个样本数据集中包含多个样本客户的多个维度的多个样本原始数据。

步骤S202，基于所述m个样本数据训练集构建随机森林模型，所述随机森林模型包括m棵CART决策树；其中，每棵所述CART决策树根据对应的样本数据训练集训练得到。

示例性的，每棵所述CART决策树包括多个节点，每个节点与一特征信息相对应。

在每棵CART决策树模型的训练过程中，对每棵CART决策树的每个节点的切分规则是先从所有特征中随机地选择X个特征信息，然后在从这X个特征信息中选择最优的切分点再做左右子树的划分。每棵CART决策树节点不断进行切分，直至所有样本原始数据都属于同一个分类为止。

进一步的，所述CART决策树模型是基于基尼(GINI)系数来选择特征信息的；其中，基尼系数的选择的标准是每个子节点达到最高的纯度，即落在子节点中的所有样本原始数据都属于同一个分类，此时基尼系数最小，纯度最高，不确定度最小。

基尼系数的计算公式为：Gini(p)＝2p(1-p)；其中，p表示样本属于某一分类的概率。

对于特征信息选取，需要选择最小的分裂后的基尼指数。也可以用基尼指数增益值作为决策树选择特征的依据。

公式如下：ΔGini(p)＝Gini(p₂)-Gini(p₁)；在CART决策树选择特征信息时，应该选择基尼指数增益值最大的特征信息，作为特征节点的分裂条件。

随机森林中的每棵CART决策树都是通过不断遍历这棵树的特征信息子集的所有可能的分割点，寻找基尼系数最小的特征信息的分割点，进行分裂，直至所有样本原始数据都属于同一个分类为止。

步骤S112，将所述特征组合输入到预测模型中，以通过所述预测模型获取每个车险险别的预测评分值。

示例性的，所述预测模型可以为FM(Factorization Machine，因子分解机)模型、DNN(深度神经网络)模型、LR(Logistic Regression，逻辑回归)模型或者其他模型。

示例性的，以LR模型为例，将所述随机森林模型输出的特征组合输入至LR模型中，通过所述LR模型输出每个车险险别的预测评分值。

步骤S114，基于所述目标车险业务逻辑信息和每个车险险别的预测评分值，从多个车险险别中选择一个或多个目标车险险别。

在示例性的一实施例中，请参阅图4，步骤S114还可以进一步包括：

步骤S114A，判断所述多个车险险别的预测评分值是否大于预设阈值；

步骤S114B，将预测评分值大于预设阈值的车险险别定义为目标车险险别；

步骤S114C，将一个或多个所述目标车险险别与所述目标车险业务逻辑信息进行关联操作，以确定每个目标车险险别的优先级别。

具体的，假设目标车险险别包括“附加险”及“附加险不计免赔”，将“附加险”及“附加险不计免赔”与所述目标车险业务逻辑信息进行关联，发现“附加险”状态值为“0”，“附加险不计免赔”状态值为“0”，且根据“附加险”及“附加险不计免赔”之间的关联关系，确定“附加险”的优先级别先于“附加险不计免赔”。

步骤S116，将一个或多个所述目标车险险别推送至所述客户端。

在示例性的另一实施例中，请参阅图5，步骤S116还可以进一步包括：

步骤S116A，获取所述目标客户在每棵所述CART决策树的路径信息，所述CART决策树包括多个节点，所述多个节点分别对应多个特征值。

具体的，从所述随机森林模型中的每棵所述CART决策树获取所述目标客户的路径信息，从每个路径信息获取每个节点对应的特征值。

步骤S116B，根据所述路径信息上每个节点对应的特征值获取一个或多个目标特征值。

具体的，从这些节点的特征值中筛选出出现频次较多的一个或多个特征值，将出现频次较多的一个或多个特征值定义为一个或多个目标特征值。

步骤S116C，根据所述一个或多个目标特征值从客户信息数据库中获取第一客户集合，所述第一客户集合包含多个第一客户。

具体的，第一客户集合中的每个第一客户至少包含了所述一个或多个目标特征值中的任一个目标特征值。

步骤S116D，基于一个或多个所述目标车险险别，从第一客户集合中获取多个第二客户集合，所述第二客户集合包含多个第二客户，并计算每个第二客户集合中第二客户数量在第一客户集合中第一客户数量的占比。

示例性的，假设多个目标车险险别包括主险、主险不计免赔、附加险；则可以从第一客户集合中获取三个第二客户集合，假设三个第二客户集合分别为A集合、B集合、C集合，则A集合的第二客户均购买了主险，B集合的第二客户均购买了主险不计免赔，C集合的第二客户均购买了附加险。假设第一客户集合中的第一客户总人数为5000人，A集合的第二客户总人数为4950人，则A集合在第一客户集合中的占比为：4950/5000＝0.99。

步骤S116E，根据所述占比确定每个目标车险险别的话术等级。

示例性的，本发明实施例可以预设有多个话术等级，如4个话术等级：

第一话术等级，定义第一话术等级为0.76～1.0等级区间。

第二话术等级，定义第二话术等级为0.51～0.75等级区间。

第三话术等级，定义第三话术等级为0.26～0.50等级区间。

第四话术等级，定义第四话术等级为0～0.25等级区间。

每个话术等级对应的等级区间可由人工根据经验来自行设置。

步骤S116F，根据所述话术等级匹配对应的话术模板，并根据一个或多个所述目标车险险别及话术模板生成对应的提示页面，所述提示页面为根据所述一个或多个目标车险险别和与所述一个或多个目标车险险别对应的推荐理由定义的页面数据。

示例性的，所述话术模板包括第一话术模板、第二话术模板、第三话术模板和第四话术模板。其中，第一话术等级对应第一话术模板；第二话术等级对应第二话术模板；第三话术等级对应第三话术模板；第四话术等级对应第四话术模板。

步骤S116G，将所述提示页面推送至所述客户端。

实施例二

请继续参阅图6，示出了本发明基于大数据的车险数据推送系统的程序模块示意图。在本实施例中，基于大数据的车险数据推送系统20可以包括或被分割成一个或多个程序模块，一个或者多个程序模块被存储于存储介质中，并由一个或多个处理器所执行，以完成本发明，并可实现上述基于大数据的车险数据推送方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序本身更适合于描述基于大数据的车险数据推送系统20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能：

第一接收模块200，用于接收所述客户端提供的目标客户的个人数据。

查询模块202，用于根据所述个人数据向至少一个数据库发送查询请求，所述查询请求用于查询所述目标客户的关联车辆的车辆数据。

第二接收模块204，用于接收所述至少一个数据库返回的车辆数据。

配置模块206，用于对所述个人数据和所述车辆数据进行数据处理，生成与所述目标客户对应的目标车险业务逻辑信息，所述目标车险业务逻辑信息表示各候选车险险别之间的关联关系以及各候选车险险别状态值。

进一步地，配置模块206还用于：

根据所述个人数据和所述车辆数据配置多个候选车险险别；

匹配模块208，用于将所述个人数据及所述车辆数据与预设的标签进行匹配，以得到所述目标客户的基本信息标签数据、车辆信息标签数据及车险信息标签数据。

输入模块210，用于将所述基本信息标签数据、所述车辆信息标签数据及所述车险信息标签数据输入到随机森林模型中，以通过所述随机森林模型输出特征组合。

输出模块212，用于将所述特征组合输入到预测模型中，以通过所述预测模型获取每个车险险别的预测评分值。

选择模块214，用于基于所述目标车险业务逻辑信息和每个车险险别的预测评分值，从多个车险险别中选择一个或多个目标车险险别。

进一步地，选择模块214还用于：

判断所述多个车险险别的预测评分值是否大于预设阈值；

推送模块216，用于将一个或多个所述目标车险险别推送至所述客户端。

实施例三

参阅图7，是本发明实施例三之计算机设备的硬件架构示意图。本实施例中，所述计算机设备2是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图7所示，所述计算机设备2至少包括，但不限于，可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及基于大数据的车险数据推送系统20。其中：

本实施例中，存储器21至少包括一种类型的计算机可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器21可以是计算机设备2的内部存储单元，例如该计算机设备2的硬盘或内存。在另一些实施例中，存储器21也可以是计算机设备2的外部存储设备，例如该计算机设备2上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中，存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件，例如实施例二的基于大数据的车险数据推送系统20的程序代码等。此外，存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器22在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中，处理器22用于运行存储器21中存储的程序代码或者处理数据，例如运行基于大数据的车险数据推送系统20，以实现实施例一的基于大数据的车险数据推送方法。

所述网络接口23可包括无线网络接口或有线网络接口，该网络接口23通常用于在所述计算机设备2与其他电子装置之间建立通信连接。例如，所述网络接口23用于通过网络将所述计算机设备2与外部终端相连，在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，GSM)、宽带码分多址(WidebandCode Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

需要指出的是，图7仅示出了具有部件20-23的计算机设备2，但是应理解的是，并不要求实施所有示出的部件，可以替代的实施更多或者更少的部件。

在本实施例中，存储于存储器21中的所述基于大数据的车险数据推送系统20还可以被分割为一个或者多个程序模块，所述一个或者多个程序模块被存储于存储器21中，并由一个或多个处理器(本实施例为处理器22)所执行，以完成本发明。

例如，图6示出了所述实现基于大数据的车险数据推送系统20实施例二的程序模块示意图，该实施例中，所述基于大数据的车险数据推送系统20可以被划分为第一接收模块200、查询模块202、第二接收模块204、配置模块206、匹配模块208、输入模块210、选择模块214及推送模块216。其中，本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序更适合于描述所述基于大数据的车险数据推送系统20在所述计算机设备2中的执行过程。所述程序模块200-216的具体功能在实施例二中已有详细描述，在此不再赘述。

实施例四

本实施例还提供一种计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储基于大数据的车险数据推送系统20，被处理器执行时实现实施例一的基于大数据的车险数据推送方法。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于大数据的车险数据推送方法，其特征在于，包括：

接收客户端提供的目标客户的个人数据；

接收所述至少一个数据库返回的车辆数据；

将所述基本信息标签数据、所述车辆信息标签数据及所述车险信息标签数据输入到随机森林模型中，以通过所述随机森林模型输出特征组合，随机森林模型包括m棵CART决策树；

将一个或多个所述目标车险险别推送至所述客户端；

其中，对所述个人数据和所述车辆数据进行数据处理，生成与所述目标客户对应的目标车险业务逻辑信息的步骤，包括：

根据所述个人数据和所述车辆数据配置多个候选车险险别；

根据所述多个候选车险险别及预设车险业务逻辑信息，生成与所述目标客户对应的目标车险业务逻辑信息；所述目标车险业务逻辑信息表示各候选车险险别之间的关联关系以及各候选车险险别状态值；

其中，将一个或多个所述目标车险险别推送至所述客户端的步骤，包括：

根据所述占比确定每个目标车险险别的话术等级；

将所述提示页面推送至所述客户端；

其中，所述预测模型包括FM模型、DNN模型或LR模型。

2.根据权利要求1所述的基于大数据的车险数据推送方法，其特征在于，还包括随机森林模型的训练步骤：

基于所述m个样本数据训练集构建随机森林模型，所述随机森林模型包括m棵CART决策树；其中，每棵所述CART决策树根据对应的样本数据训练集训练得到。

3.根据权利要求1所述的基于大数据的车险数据推送方法，其特征在于，基于所述目标车险业务逻辑信息和每个车险险别的预测评分值，从多个车险险别中选择一个或多个目标车险险别的步骤，包括：

判断所述多个车险险别的预测评分值是否大于预设阈值；

4.一种基于大数据的车险数据推送系统，其特征在于，包括：

第一接收模块，用于接收客户端提供的目标客户的个人数据；

输入模块，用于将所述基本信息标签数据、所述车辆信息标签数据及所述车险信息标签数据输入到随机森林模型中，以通过所述随机森林模型输出特征组合，随机森林模型包括m棵CART决策树；

推送模块，用于将一个或多个所述目标车险险别推送至所述客户端；

其中，所述配置模块还用于：

根据所述个人数据和所述车辆数据配置多个候选车险险别；

其中，所述推送模块还用于：

根据所述占比确定每个目标车险险别的话术等级；

将所述提示页面推送至所述客户端；

其中，所述预测模型包括FM模型、DNN模型或LR模型。

5.根据权利要求4所述的基于大数据的车险数据推送系统，其特征在于，所述选择模块，还用于：

判断所述多个车险险别的预测评分值是否大于预设阈值；

6.一种计算机设备，所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征于，所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述的基于大数据的车险数据推送方法的步骤。

7.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行如权利要求1至3中任一项所述的基于大数据的车险数据推送方法的步骤。