CN113254510A

CN113254510A - 业务风险客群的识别方法、装置、设备及存储介质

Info

Publication number: CN113254510A
Application number: CN202110762845.4A
Authority: CN
Inventors: 王遥; 朱旭音; 张霖; 赵天骄; 贾素苇
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-07-06
Filing date: 2021-07-06
Publication date: 2021-08-13
Anticipated expiration: 2041-07-06
Also published as: CN113254510B; WO2023279696A1

Abstract

本发明涉及人工智能领域，提供一种业务风险客群的识别方法、装置、设备及存储介质，用于提高基于海量客群的业务风险客群识别的准确性。业务风险客群的识别方法包括：通过经验分类因子对待处理客群的客户信息进行客群分类得到经验分类客群；调用与业务变量对应的决策树规则细分客群模型对待处理客群的客户信息进行业务风险客群预测得到决策树分类客群；将经验分类客群和决策树分类客群进行合并，得到初始业务风险客群；调用目标预测模型对业务风险分类客群信息进行业务风险预测，得到业务风险预测值；通过业务风险预测值对初始业务风险客群进行筛选得到目标业务风险客群。此外，本发明还涉及区块链技术，待处理客群的客户信息可存储于区块链中。

Description

业务风险客群的识别方法、装置、设备及存储介质

技术领域

本发明涉及人工智能的智能决策领域，尤其涉及一种业务风险客群的识别方法、装置、设备及存储介质。

背景技术

基于业务风险可控的经营原则，需要对高业务风险客户进行识别，并针对性地进行干预。目前的高风险客群识别方法一般是基于整体客群进行建模，得到客群识别模型，再根据客群识别模型对整体客群进行业务判断，并定义业务判断的预测值高于某一阈值，或业务判断的预测值排序头部的客群为目标客户（即高风险客群）。

上述高风险客群识别方法中，往往很难在客群覆盖率提升的前提下，不降低高风险客群识别的准确度，因此，导致了基于海量客群的业务风险客群识别的准确性低。

发明内容

本发明提供一种业务风险客群的识别方法、装置、设备及存储介质，用于提高基于海量客群的业务风险客群识别的准确性。

本发明第一方面提供了一种业务风险客群的识别方法，包括：

获取待处理客群的客户信息、业务变量和经验分类因子，通过所述经验分类因子，对所述待处理客群的客户信息进行客群分类，得到经验分类客群；

调用与所述业务变量对应的决策树规则细分客群模型，对所述待处理客群的客户信息进行业务风险客群预测，得到决策树分类客群；

将所述经验分类客群和所述决策树分类客群进行合并，得到初始业务风险客群；

获取所述初始业务风险客群的业务风险客群信息，调用与所述初始业务风险客群对应的目标预测模型，对所述业务风险分类客群信息进行业务风险预测，得到业务风险预测值；

通过所述业务风险预测值，对所述初始业务风险客群进行筛选，得到目标业务风险客群。

可选的，在本发明第一方面的第一种实现方式中，所述获取待处理客群的客户信息、业务变量和经验分类因子，通过所述经验分类因子，对所述待处理客群的客户信息进行客群分类，得到经验分类客群之前，还包括：

获取样本变量，创建与所述样本变量对应的决策树规则细分客群模型，所述决策树规则细分客群模型为决策树回归模型或决策树分类模型；

通过所述决策树规则细分客群模型获取多个待处理业务风险客群，并构建每个待处理业务风险客群对应的目标预测模型。

可选的，在本发明第一方面的第二种实现方式中，所述获取样本变量，创建与所述样本变量对应的决策树规则细分客群模型，包括：

获取历史客户群体的客户信息样本集和样本变量，构建与所述样本变量相关的业务变量，得到多个相关业务变量；

根据所述多个相关业务变量和所述样本变量构建多个决策树模型，并计算每个决策树模型的客群叶子节点的训练均值提升度，所述客群叶子节点包括决策路径；

通过所述训练均值提升度对所述决策路径进行筛选，得到历史客户群体的维度分类规则；

通过所述历史客户群体的维度分类规则构建所述多个决策树模型的决策树规则细分客群模型。

可选的，在本发明第一方面的第三种实现方式中，所述通过所述决策树规则细分客群模型获取多个待处理业务风险客群，并构建每个待处理业务风险客群对应的目标预测模型，包括：

获取待分类客户的客户信息样本、目标变量和业务分类因子，通过所述业务分类因子、所述决策树规则细分客群模型和所述客户信息样本，对所述待分类客户进行业务风险客群分类，得到多个待处理业务风险客群；

通过所述目标变量，构建每个待处理业务风险客群对应的多个初始预测模型，所述初始预测模型为回归预测模型或分类预测模型；

对每个待处理业务风险客群对应的多个初始预测模型分别进行预测评估，得到评估值；

按照所述评估值的大小，对每个待处理业务风险客群对应的多个初始预测模型进行降序排列，并将排列第一的初始预测模型确定为每个待处理业务风险客群对应的目标预测模型。

可选的，在本发明第一方面的第四种实现方式中，所述调用与所述业务变量对应的决策树规则细分客群模型，对所述待处理客群的客户信息进行业务风险客群预测，得到决策树分类客群，包括：

获取与所述业务变量对应的目标维度，所述目标维度为所述业务变量对应的一维度变量、二维度变量和三维度变量中的任意一个；

调用与所述目标维度对应的决策树规则细分客群模型，基于预设维度分类规则，对所述待处理客群的客户信息进行均值提升度计算和阈值对比分析，得到分析结果；

根据所述分析结果对所述待处理客群进行分类，得到决策树分类客群。

可选的，在本发明第一方面的第五种实现方式中，所述获取所述初始业务风险客群的业务风险客群信息，调用与所述初始业务风险客群对应的目标预测模型，对所述业务风险分类客群信息进行业务风险预测，得到业务风险预测值，包括：

获取所述初始业务风险客群的业务风险客群信息和客群类型，通过所述客群类型遍历预置的预测模型结构树，得到与所述初始业务风险客群对应的目标预测模型，以及所述目标预测模型的接口调用地址；

通过所述接口调用地址调用所述目标预测模型，对所述业务风险客群信息进行基于业务风险的回归处理或分类处理，得到业务风险预测值。

可选的，在本发明第一方面的第六种实现方式中，所述通过所述业务风险预测值，对所述初始业务风险客群进行筛选，得到目标业务风险客群，包括：

按照所述业务风险预测值从大到小的顺序，对所述初始业务风险客群中的客户进行排序，得到候选业务风险客群序列；

基于预设比例，对所述候选业务风险客群序列进行依序选取，得到目标业务风险客群。

本发明第二方面提供了一种业务风险客群的识别装置，包括：

分类模块，用于获取待处理客群的客户信息、业务变量和经验分类因子，通过所述经验分类因子，对所述待处理客群的客户信息进行客群分类，得到经验分类客群；

第一预测模块，用于调用与所述业务变量对应的决策树规则细分客群模型，对所述待处理客群的客户信息进行业务风险客群预测，得到决策树分类客群；

合并模块，用于将所述经验分类客群和所述决策树分类客群进行合并，得到初始业务风险客群；

第二预测模块，用于获取所述初始业务风险客群的业务风险客群信息，调用与所述初始业务风险客群对应的目标预测模型，对所述业务风险分类客群信息进行业务风险预测，得到业务风险预测值；

筛选模块，用于通过所述业务风险预测值，对所述初始业务风险客群进行筛选，得到目标业务风险客群。

可选的，在本发明第二方面的第一种实现方式中，所述业务风险客群的识别装置，还包括：

第一创建模块，用于获取样本变量，创建与所述样本变量对应的决策树规则细分客群模型，所述决策树规则细分客群模型为决策树回归模型或决策树分类模型；

第二创建模块，用于通过所述决策树规则细分客群模型获取多个待处理业务风险客群，并构建每个待处理业务风险客群对应的目标预测模型。

可选的，在本发明第二方面的第二种实现方式中，所述第一创建模块具体用于：

可选的，在本发明第二方面的第三种实现方式中，所述第二创建模块具体用于：

可选的，在本发明第二方面的第四种实现方式中，所述第一预测模块具体用于：

可选的，在本发明第二方面的第五种实现方式中，所述第二预测模块具体用于：

可选的，在本发明第二方面的第六种实现方式中，所述筛选模块具体用于：

本发明第三方面提供了一种业务风险客群的识别设备，包括：存储器和至少一个处理器，所述存储器中存储有指令；所述至少一个处理器调用所述存储器中的所述指令，以使得所述业务风险客群的识别设备执行上述的业务风险客群的识别方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的业务风险客群的识别方法。

本发明提供的技术方案中，获取待处理客群的客户信息、业务变量和经验分类因子，通过所述经验分类因子，对所述待处理客群的客户信息进行客群分类，得到经验分类客群；调用与所述业务变量对应的决策树规则细分客群模型，对所述待处理客群的客户信息进行业务风险客群预测，得到决策树分类客群；将所述经验分类客群和所述决策树分类客群进行合并，得到初始业务风险客群；获取所述初始业务风险客群的业务风险客群信息，调用与所述初始业务风险客群对应的目标预测模型，对所述业务风险分类客群信息进行业务风险预测，得到业务风险预测值；通过所述业务风险预测值，对所述初始业务风险客群进行筛选，得到目标业务风险客群。本发明实施例中，通过对待处理客群进行多样性的客群分类，保障了目标业务风险客群的覆盖率，通过目标预测模型找到群体内部业务风险更高的客户，保证了目标预测模型对于目标业务风险客群抓取的准确度，通过经验分类因子和决策树规则细分客群模型对待处理客群的客户信息进行客群分类，提高了初始业务风险客群的准确性，实现了在客群覆盖率提升的前提下，保证了高风险客群（即目标业务风险客群）识别的准确度，从而提高了基于海量客群的业务风险客群识别的准确性。

附图说明

图1为本发明实施例中业务风险客群的识别方法的一个实施例示意图；

图2为本发明实施例中业务风险客群的识别方法的另一个实施例示意图；

图3为本发明实施例中业务风险客群的识别装置的一个实施例示意图；

图4为本发明实施例中业务风险客群的识别装置的另一个实施例示意图；

图5为本发明实施例中业务风险客群的识别设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种业务风险客群的识别方法、装置、设备及存储介质，提高了基于海量客群的业务风险客群识别的准确性。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等（如果存在）是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中业务风险客群的识别方法的一个实施例包括：

101、获取待处理客群的客户信息、业务变量和经验分类因子，通过经验分类因子，对待处理客群的客户信息进行客群分类，得到经验分类客群。

可以理解的是，本发明的执行主体可以为业务风险客群的识别装置，还可以是终端或者服务器，具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

其中，经验分类客群的数量包括一个或一个以上。业务变量包括标称型数据的变量和数值型数据的变量，例如：以业务为保险理赔为例说明，业务变量为是否出险（标称型数据的变量），业务变量为实际赔付金额（数值型数据的变量）。经验分类因子为根据业务常识判断业务风险客户的风险因子，经验分类因子用于根据风险因子确定某一取值范围内容对应的客户拥有较高业务风险，例如：以业务为汽车责任保险为例说明，经验分类因子为驾驶人的年龄、性别、历史出险记录等，又以业务为车损险为例说明，经验分类因子为汽车的车龄、车型和出厂日期等。

服务器获得客户授权后，提取或抓取待处理客群的客户信息，待处理客群的客户信息包括客户的个人信息、业务信息，以及经验分类因子对应的信息；通过预置的标签提取算法，对待处理客群的客户信息进行标签信息提取，得到待处理客群标签信息；通过经验分类因子对待处理客群标签信息进行分类，得到分类标签信息，将分类标签信息对应的待处理客群确定为经验分类客群，以实现通过经验分类因子，对待处理客群的客户信息的客群分类。

102、调用与业务变量对应的决策树规则细分客群模型，对待处理客群的客户信息进行业务风险客群预测，得到决策树分类客群。

其中，业务风险客群分类后的决策树分类客群包括有业务风险客群和无业务风险客群，有业务风险客群包括潜在业务风险客群、低业务风险客群、中业务风险客群和高业务风险客群。决策树规则细分客群模型利用分叉时的目标为均方误差减少的原理，将待处理客群划分为业务变量取值最为接近的几个子集，再识别子集中业务变量的均值显著高于总体业务变量的均值的群体，标记为坏客户的细分客群（即决策树分类客群）。

当业务变量为称型数据的变量时，服务器调用与业务变量对应的决策树规则细分客群模型，该决策树规则细分客群模型为决策树分类模型，基于预设维度分类规则，对待处理客群的客户信息进行业务风险客群分类，得到决策树分类客群；当业务变量为数值型数据的变量时，服务器调用与业务变量对应的决策树规则细分客群模型，该决策树规则细分客群模型为决策树回归模型，基于预设维度分类规则，对待处理客群的客户信息进行业务变量回归，得到业务变量值，将业务变量值与预设的业务风险阈值条件进对比，并将业务变量值符合业务风险阈值条件的待处理客群划分为业务风险阈值条件对应的业务风险群体，计算业务风险群体的业务变量值的均值，得到群体子集均值，并计算所有待处理客群的业务变量值的均值，得到综合均值，将群体子集均值大于综合均值的业务风险群体确定为决策树分类客群；或者，服务器通过对待处理客群的客户信息进行均值提升度计算和阈值对比分析，得到分析结果，根据分析结果对所述待处理客群进行分类，得到决策树分类客群。

103、将经验分类客群和决策树分类客群进行合并，得到初始业务风险客群。

服务器将经验分类客群和决策树分类客群进行合并为一个集合，从而得到初始业务风险客群，即初始业务风险客群保留了原始的经验分类客群和原始的决策树分类客群；或者，服务器将经验分类客群和决策树分类客群进行对比分析和分类，得到同类客群和异类客群，同类客群为经验分类客群和决策树分类客群中相同的客群，异类客群为经验分类客群和决策树分类客群中不相同的客群，将同类客群进行去重融合，得到融合后的客群，将融合后的客群和异类客群合并为一个集合，得到初始业务风险客群。

104、获取初始业务风险客群的业务风险客群信息，调用与初始业务风险客群对应的目标预测模型，对业务风险分类客群信息进行业务风险预测，得到业务风险预测值。

服务器获取初始业务风险客群的业务风险客群类型，通过预先创建的业务风险客群类型与目标预测模型之间的对应关系，检索得到与初始业务风险客群对应的目标预测模型；获取目标预测模型的运算因子，以及初始业务风险客群的业务风险客群信息，该运算因子为基于业务变量和业务需求而构建的业务风险预测指标，该业务风险客群信息为分类后的客群的客户信息；通过预置的接口调用地址调用目标预测模型，基于运算因子，对业务风险分类客群信息进行基于业务风险的回归处理或分类处理，得到业务风险预测值。

105、通过业务风险预测值，对初始业务风险客群进行筛选，得到目标业务风险客群。

当业务风险预测值为业务变量对应的为业务风险的数值数据时，服务器按照业务风险预测值从大到小的顺序，对初始业务风险客群中的客户进行排序，得到候选业务风险客群序列，获取预设业务风险范围值，根据业务风险范围值和业务风险预测值，对预候选业务风险客群序列进行客群划分，得到目标业务风险客群；当业务风险预测值为各等级业务风险的概率值时，将业务风险预测值与预设阈值进行对比，将初始业务风险客群中业务风险预测值大于预设阈值的客户确定为待候选客群，按照业务风险预测值的大小，对待候选客群进行倒序排序，得到候选业务风险客群序列，并按照预设比例，对候选业务风险客群序列进行依序选取，得到目标业务风险客群。或者服务器按照业务风险预测值从大到小的顺序，对初始业务风险客群中的客户进行排序，得到候选业务风险客群序列；基于预设比例，对候选业务风险客群序列进行依序选取，得到目标业务风险客群。

本发明实施例中，通过对待处理客群进行多样性的客群分类，保障了目标业务风险客群的覆盖率，通过目标预测模型找到群体内部业务风险更高的客户，保证了目标预测模型对于目标业务风险客群抓取的准确度，通过经验分类因子和决策树规则细分客群模型对待处理客群的客户信息进行客群分类，提高了初始业务风险客群的准确性，实现了在客群覆盖率提升的前提下，保证了高风险客群（即目标业务风险客群）识别的准确度，从而提高了基于海量客群的业务风险客群识别的准确性。

请参阅图2，本发明实施例中业务风险客群的识别方法的另一个实施例包括：

201、获取样本变量，创建与样本变量对应的决策树规则细分客群模型，决策树规则细分客群模型为决策树回归模型或决策树分类模型。

具体地，服务器获取历史客户群体的客户信息样本集和样本变量，构建与样本变量相关的业务变量，得到多个相关业务变量；根据多个相关业务变量和样本变量构建多个决策树模型，并计算每个决策树模型的客群叶子节点的训练均值提升度，客群叶子节点包括决策路径；通过训练均值提升度对决策路径进行筛选，得到历史客户群体的维度分类规则；通过历史客户群体的维度分类规则构建多个决策树模型的决策树规则细分客群模型。

服务器获得用户授权后，提取或抓取历史客户群体的客户信息样本集和样本变量，构建与样本变量相关的业务变量，得到多个相关业务变量，并将多个相关业务变量整合为变量清单；遍历变量清单中的多个相关业务变量，得到遍历后的每个相关业务变量，根据遍历后的每个相关业务变量和样本变量，构建客户信息样本集和历史客户群体的决策树模型，得到多个决策树模型，一个决策树模型对应一个相关业务变量，每个决策树模型包括初始客群叶子客户节点和初始客群叶子客户节点对应的决策路径，初始客群叶子客户节点包括历史客户群体和对应的客户信息样本，决策路径包括变量和阈值，其中，如果业务目标在于尽量找到样本变量（如：保单赔付金额）比较高的客群，而不介意该规则的覆盖度较低的情况时，可以在模型参数的选择上适当调低叶子节点最少样本数（min_samples_leaf）的取值。

服务器计算每个决策树模型客群中初始客群叶子节点的训练均值提升度，训练均值提升度用于指示衡量每个初始客群叶子节点内历史客户群体的样本变量均值高于样本总体样本变量值的程度，例如：以样本变量均值为平均赔付金额为例说明，训练均值提升度用于衡量每个初始客群叶子节点内客群的平均赔付金额高于样本总体（即样本总体样本变量值）的程度，可以理解为相较于总体业务风险，该初始客群叶子节点内客群的业务风险偏离程度（与总体无差别：训练均值提升度=1，较总体更高：训练均值提升度>1，较总体更低：训练均值提升度<1）。具体地，服务器在每个决策树模型内部，计算决策树模型最终分裂出的叶子节点内样本变量的均值，记为node_mean，并使用node_mean除以样本总体样本变量的均值，得到训练均值提升度。

服务器根据训练均值提升度确定多个决策树模型的目标客群叶子客户节点，并将目标客群叶子客户节点的决策路径确定为历史客户群体的维度分类规则，历史客户群体的维度分类规则中的维度包括一维度、二维度或三维度，例如：以历史客户群体的维度分类规则中的维度为一维度为例说明，假设至多N个决策树模型（即多个决策树模型）最终生成M个叶子节点（即多个初始客群叶子节点），挑选M个叶子节点中训练均值提升度指标（node_mean_lift）较高的叶子节点（假设K个，即目标客群叶子节点）及其对应的决策路径（decision path）（决策路径包括对应的变量和阈值），作为坏客户单维度细分客群的划分标准（即历史客户群体的一维度分类规则），其中，较高训练均值提升度指标应该依据业务目标和样本覆盖度综合考虑，同理，可以可得历史客户群体的二维度分类规则，以及历史客户群体的三维度分类规则，使用K组规则生成K组平行的细分客群样本，其中，覆盖度较高的样本可以单独研究，覆盖度较低的样本可以聚集起来，综合研究其特性。

服务器根据历史客户群体的维度分类规则，对多个决策树模型进行剪枝，得到决策树规则细分客群模型，决策树规则细分客群模型为决策树回归模型或决策树分类模型。

对决策树规则细分客群模型进行试验效果评估，发现决策树规则细分客群模型能够更有针对性地区分出高业务风险的客户群体，例如，以某一财险产品历史两年的承保客户为例，我们使用决策树规则细分客群模型进行建模测试，取得了更加精准的结果，如果圈定7%的高业务风险客群，决策树规则细分客群模型能够圈出比总体人群真实赔付金额高出1.5倍以上，且出险率高出1.2陪以上的坏客群（即业务风险客群），相对单一维度的业务风险客群的经验分群，7%的头部人群的赔付金额和出险率的提升仅分别在0.5倍和0.4倍左右的水平，可以看到决策树规则细分客群模型有着高效抓取业务风险客群的能力。

202、通过决策树规则细分客群模型获取多个待处理业务风险客群，并构建每个待处理业务风险客群对应的目标预测模型。

具体地，服务器获取待分类客户的客户信息样本、目标变量和业务分类因子，通过业务分类因子、决策树规则细分客群模型和客户信息样本，对待分类客户进行业务风险客群分类，得到多个待处理业务风险客群；通过目标变量，构建每个待处理业务风险客群对应的多个初始预测模型，初始预测模型为回归预测模型或分类预测模型；对每个待处理业务风险客群对应的多个初始预测模型分别进行预测评估，得到评估值；按照评估值的大小，对每个待处理业务风险客群对应的多个初始预测模型进行降序排列，并将排列第一的初始预测模型确定为每个待处理业务风险客群对应的目标预测模型。

其中，目标变量包括标称型数据的变量和数值型数据的变量，例如：以业务为保险理赔为例说明，业务变量为是否出险（标称型数据的变量），业务变量为实际赔付金额（数值型数据的变量）。业务分类因子为根据业务常识判断业务风险客户的风险因子，业务分类因子用于根据风险因子确定某一取值范围内容对应的客户拥有较高业务风险，例如：以业务为汽车责任保险为例说明，业务分类因子为驾驶人的年龄、性别、历史出险记录等，又以业务为车损险为例说明，业务分类因子为汽车的车龄、车型和出厂日期等。

服务器获得客户授权后，提取或抓取待分类客户的客户信息（即客户信息样本），待分类客户的客户信息样本包括经过人工标注客群类别的客户群体的客户信息，获取待分类客户的客户信息样本的标签信息，通过业务分类因子，对标签信息进行分类得到分类后的标签信息，将分类后的标签信息对应的待分类客户确定为经验分类的客群；并通过与目标变量对应的决策树规则细分客群模型，对待分类客户的客户信息样本进行业务风险客群分类，得到决策树分类的客群；服务器可将经验分类的客群和决策树分类的客群进行合并，得到多个待处理业务风险客群；或者服务器可通过将经验分类的客群和决策树分类的客群进行对比分析，得到相同客群和差异客群，调用预置的支持向量机（support vectormachine，SVM）分类模型，对差异客群的客户信息样本进行业务风险客群分类，得到目标客群，将相同客群和目标客群进行合并，得到多个待处理业务风险客群；

服务器根据目标变量构建每个待处理业务风险客群对应的多个初始预测模型的执行过程包括：当目标变量为标称型数据的变量时，构建每个待处理业务风险客群对应的多个分类预测模型，并对多个分类预测模型进行训练优化，得到初始预测模型，分类预测模型用于对待处理业务风险客群进行业务风险程度分类；当目标变量为数值型数据的变量时，构建每个待处理业务风险客群对应的多个归回预测模型，并对多个回归预测模型进行训练优化，得到初始预测模型，归回预测模型用于对待处理业务风险客群进行业务风险值的回归处理，基于业务对模型可解释性的考虑，回归预测模型可以使用广义线性回归、决策树回归等解释性较强的模型，而在一些营销场景或对模型结果可解释性要求不强的业务端，也可以考虑使用复杂的机器学习模型；

通过相同的目标变量，对每个待处理业务风险客群对应的多个初始预测模型分别进行预测，得到每个待处理业务风险客群中每个初始预测模型对应的目标预测值，将目标预测值倒序首端预设比例（如：首端预设比例为top5%）对应的客群，确定为待分析客群；获取真实分类客群，通过待分析客群与真实分类客群，计算每个初始预测模型的评估值，对评估值进行降序排列，并将评估值排列第一的初始预测模型确定为每个待处理业务风险客群对应的目标预测模型。

经过试验分析：与整体人群建模后预测的高业务风险top5%客户相比，按细分客群内单独建模（即目标预测模型）预测的高业务风险Top5%的客户风险程度更高；细分客群建模预测（即目标预测模型）的高业务风险top5%客户的真实赔付金额均值（即目标变量）与整体模型预测的高（即目标预测模型）风险Top5%客户相比升高约40%；细分客群建模预测（即目标预测模型）的高业务风险top5%客户的平均出险次数（即目标变量）与整体模型相比提升了约20%。分群后再单独对每一个圈出的坏客户（即待处理业务风险客群）进行建模（即目标预测模型），相当于对每个群体（即待处理业务风险客群）内部进行深入刻画，利用目标预测模型能力找到群体内部业务风险更高的客户，保证了目标预测模型对于坏客户（即待处理业务风险客群）抓取的准确度。

通过划分业务风险客群所使用到的变量和对应的切割阈值可以由决策树规则细分客群模型明确输出，有别于复杂模型对于一个业务风险客户的预测结果很难使得前端业务员理解，是的决策树规则细分客群模型输出的规则比较直观；实现了细分业务风险客群所用到的变量可拓展，结合了前端业务知识，挑选出比较重要的变量进行拓展，有效结合了技术和业务经验的能力；能够灵活确定细分业务风险客群划分的标准；以及通过分群后再单独对即待处理业务风险客群进行建模（即目标预测模型），相当于对每个待处理业务风险客群内部进行深入刻画，利用目标预测模型能力找到群体内部业务风险更高的客户，保证了目标预测模型对于待处理业务风险客群抓取的准确度，从而提高了基于海量客群的业务风险客群识别的准确性。

203、获取待处理客群的客户信息、业务变量和经验分类因子，通过经验分类因子，对待处理客群的客户信息进行客群分类，得到经验分类客群。

该步骤203的执行过程与上述步骤101的执行过程类似，在此不再赘述。

204、调用与业务变量对应的决策树规则细分客群模型，对待处理客群的客户信息进行业务风险客群预测，得到决策树分类客群。

具体地，服务器获取与业务变量对应的目标维度，目标维度为业务变量对应的一维度变量、二维度变量和三维度变量中的任意一个；调用与目标维度对应的决策树规则细分客群模型，基于预设维度分类规则，对待处理客群的客户信息进行均值提升度计算和阈值对比分析，得到分析结果；根据分析结果对待处理客群进行分类，得到决策树分类客群。

服务器获取与业务变量对应的目标维度，该目标维度包括业务变量的一维度变量、二维度变量和三维度变量中的任意一个，创建目标维度的结构化查询语言；通过结构化查询语言，对预置数据库中的决策树模型进行查询，得到对应的决策树规则细分客群模型和模型调用地址；通过模型调用地址调用决策树规则细分客群模型，基于预设维度分类规则，计算决策树规则细分客群模型中各客群叶子节点中待处理客群的客户信息的目标变量均值提升度，并计算所有客群叶子节点中待处理客群的客户信息的综合均值提升度，判断目标变量均值提升度是否大于综合均值提升度，得到分析结果，若分析结果为是，则将对应的客群叶子节点中的待处理客群确定为待分类客群，将待分类客群的目标变量均值提升度与预设的提升度指标标准进行对比，并将目标变量均值提升度符合提升度指标标准的待分类客群分类为提升度指标标准对应的风险群体，从而得到决策树分类客群，其中，提升度指标标准包括潜在业务风险的提升度指标标准、低业务风险客群的提升度指标标准、中业务风险客群的提升度指标标准和高业务风险客群的提升度指标标准，例如：中风险客户的提升度指标标准为2，高风险客户的提升度指标标准为3。

205、将经验分类客群和决策树分类客群进行合并，得到初始业务风险客群。

该步骤205的执行过程与上述步骤103的执行过程类似，在此不再赘述。

206、获取初始业务风险客群的业务风险客群信息，调用与初始业务风险客群对应的目标预测模型，对业务风险分类客群信息进行业务风险预测，得到业务风险预测值。

具体地，服务器获取初始业务风险客群的业务风险客群信息和客群类型，通过客群类型遍历预置的预测模型结构树，得到与初始业务风险客群对应的目标预测模型，以及目标预测模型的接口调用地址；通过接口调用地址调用目标预测模型，对业务风险客群信息进行基于业务风险的回归处理或分类处理，得到业务风险预测值。

服务器获取初始业务风险客群的业务风险客群信息，该业务风险客群信息包括初始业务风险客群的客户信息以及客户信息的分类标签信息，调用预置的标签提取算法，对分类标签信息进行分类类型提取，得到客群类型；创建客群类型的索引，通过索引遍历预置的预测模型结构树，从而得到对应的目标预测模型以及目标预测模型的接口调用地址；获取业务风险预测指标，通过接口调用地址调用目标预测模型，基于业务风险预测指标，对业务风险客群信息进行基于业务风险的回归处理或分类处理，得到业务风险预测值，其中，当目标预测模型进行基于业务风险的回归处理时，业务风险预测值为业务变量对应的为业务风险的数值数据，例如：以业务变量为实际赔付金额为例说明，则业务风险预测值为处于业务风险的实际赔付金额数据，当目标预测模型进行基于业务风险的分类处理时，业务风险预测值为各等级业务风险的概率值。

207、通过业务风险预测值，对初始业务风险客群进行筛选，得到目标业务风险客群。

具体地，服务器按照业务风险预测值从大到小的顺序，对初始业务风险客群中的客户进行排序，得到候选业务风险客群序列；基于预设比例，对候选业务风险客群序列进行依序选取，得到目标业务风险客群。

服务器按照业务风险预测值的大小，对初始业务风险客群进行倒序排序，得到候选业务风险客群序列；获取业务风险预测值的数据类型；若数据类型为业务变量对应的为业务风险的数值数据，则获取预设业务风险范围值，根据业务风险范围值和业务风险预测值，对预候选业务风险客群序列进行客群划分，得到业务风险范围值对应候选业务风险客群，基于预设比例，对业务风险范围值对应候选业务风险客群进行依序读取，得到目标业务风险客群；若数据类型为各等级业务风险的概率值，则选取候选业务风险客群序列中业务风险预测值大于预设阈值的客户，得到选取的客群，基于预设比例，对选取的客群进行依序选取，得到目标业务风险客群。

本发明实施例中，通过创建具有高效抓取业务风险客群的能力的决策树规则细分客群模型，以及能够找到群体内部业务风险更高的客户的目标预测模型，保证了对目标业务风险客群抓取的准确度；通过对待处理客群进行多样性的客群分类，保障了目标业务风险客群的覆盖率，通过目标预测模型找到群体内部业务风险更高的客户，保证了目标预测模型对于目标业务风险客群抓取的准确度，通过经验分类因子和决策树规则细分客群模型对待处理客群的客户信息进行客群分类，提高了初始业务风险客群的准确性，实现了在客群覆盖率提升的前提下，保证了高风险客群（即目标业务风险客群）识别的准确度，从而提高了基于海量客群的业务风险客群识别的准确性。

上面对本发明实施例中业务风险客群的识别方法进行了描述，下面对本发明实施例中业务风险客群的识别装置进行描述，请参阅图3，本发明实施例中业务风险客群的识别装置一个实施例包括：

分类模块301，用于获取待处理客群的客户信息、业务变量和经验分类因子，通过经验分类因子，对待处理客群的客户信息进行客群分类，得到经验分类客群；

第一预测模块302，用于调用与业务变量对应的决策树规则细分客群模型，对待处理客群的客户信息进行业务风险客群预测，得到决策树分类客群；

合并模块303，用于将经验分类客群和决策树分类客群进行合并，得到初始业务风险客群；

第二预测模块304，用于获取初始业务风险客群的业务风险客群信息，调用与初始业务风险客群对应的目标预测模型，对业务风险分类客群信息进行业务风险预测，得到业务风险预测值；

筛选模块305，用于通过业务风险预测值，对初始业务风险客群进行筛选，得到目标业务风险客群。

上述业务风险客群的识别装置中各个模块的功能实现与上述业务风险客群的识别方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

请参阅图4，本发明实施例中业务风险客群的识别装置的另一个实施例包括：

第一创建模块306，用于获取样本变量，创建与样本变量对应的决策树规则细分客群模型，决策树规则细分客群模型为决策树回归模型或决策树分类模型；

第二创建模块307，用于通过决策树规则细分客群模型获取多个待处理业务风险客群，并构建每个待处理业务风险客群对应的目标预测模型；

可选的，第一创建模块306还可以具体用于：

获取历史客户群体的客户信息样本集和样本变量，构建与样本变量相关的业务变量，得到多个相关业务变量；根据多个相关业务变量和样本变量构建多个决策树模型，并计算每个决策树模型的客群叶子节点的训练均值提升度，客群叶子节点包括决策路径；通过训练均值提升度对决策路径进行筛选，得到历史客户群体的维度分类规则；通过历史客户群体的维度分类规则构建多个决策树模型的决策树规则细分客群模型。

可选的，第二创建模块307还可以具体用于：

获取待分类客户的客户信息样本、目标变量和业务分类因子，通过业务分类因子、决策树规则细分客群模型和客户信息样本，对待分类客户进行业务风险客群分类，得到多个待处理业务风险客群；通过目标变量，构建每个待处理业务风险客群对应的多个初始预测模型，初始预测模型为回归预测模型或分类预测模型；对每个待处理业务风险客群对应的多个初始预测模型分别进行预测评估，得到评估值；按照评估值的大小，对每个待处理业务风险客群对应的多个初始预测模型进行降序排列，并将排列第一的初始预测模型确定为每个待处理业务风险客群对应的目标预测模型。

可选的，第一预测模块302还可以具体用于：

获取与业务变量对应的目标维度，目标维度为业务变量对应的一维度变量、二维度变量和三维度变量中的任意一个；调用与目标维度对应的决策树规则细分客群模型，基于预设维度分类规则，对待处理客群的客户信息进行均值提升度计算和阈值对比分析，得到分析结果；根据分析结果对待处理客群进行分类，得到决策树分类客群。

可选的，第二预测模块304还可以具体用于：

获取初始业务风险客群的业务风险客群信息和客群类型，通过客群类型遍历预置的预测模型结构树，得到与初始业务风险客群对应的目标预测模型，以及目标预测模型的接口调用地址；通过接口调用地址调用目标预测模型，对业务风险客群信息进行基于业务风险的回归处理或分类处理，得到业务风险预测值。

可选的，筛选模块305还可以具体用于：

按照业务风险预测值从大到小的顺序，对初始业务风险客群中的客户进行排序，得到候选业务风险客群序列；基于预设比例，对候选业务风险客群序列进行依序选取，得到目标业务风险客群。

上述业务风险客群的识别装置中各模块和各单元的功能实现与上述业务风险客群的识别方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

上面图3和图4从模块化功能实体的角度对本发明实施例中的业务风险客群的识别装置进行详细描述，下面从硬件处理的角度对本发明实施例中业务风险客群的识别设备进行详细描述。

图5是本发明实施例提供的一种业务风险客群的识别设备的结构示意图，该业务风险客群的识别设备500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器（central processing units，CPU）510（例如，一个或一个以上处理器）和存储器520，一个或一个以上存储应用程序533或数据532的存储介质530（例如一个或一个以上海量存储设备）。其中，存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块（图示没标出），每个模块可以包括对业务风险客群的识别设备500中的一系列指令操作。更进一步地，处理器510可以设置为与存储介质530通信，在业务风险客群的识别设备500上执行存储介质530中的一系列指令操作。

业务风险客群的识别设备500还可以包括一个或一个以上电源540，一个或一个以上有线或无线网络接口550，一个或一个以上输入输出接口560，和/或，一个或一个以上操作系统531，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图5示出的业务风险客群的识别设备结构并不构成对业务风险客群的识别设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本申请还提供一种业务风险客群的识别设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述业务风险客群的识别设备执行上述业务风险客群的识别方法中的步骤。本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，计算机可读存储介质中存储有指令，当指令在计算机上运行时，使得计算机执行业务风险客群的识别方法的步骤。

进一步地，计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（read-only memory，ROM）、随机存取存储器（random access memory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

以上，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种业务风险客群的识别方法，其特征在于，所述业务风险客群的识别方法包括：

2.根据权利要求1所述的业务风险客群的识别方法，其特征在于，所述获取待处理客群的客户信息、业务变量和经验分类因子，通过所述经验分类因子，对所述待处理客群的客户信息进行客群分类，得到经验分类客群之前，还包括：

3.根据权利要求2所述的业务风险客群的识别方法，其特征在于，所述获取样本变量，创建与所述样本变量对应的决策树规则细分客群模型，包括：

4.根据权利要求2所述的业务风险客群的识别方法，其特征在于，所述通过所述决策树规则细分客群模型获取多个待处理业务风险客群，并构建每个待处理业务风险客群对应的目标预测模型，包括：

5.根据权利要求1所述的业务风险客群的识别方法，其特征在于，所述调用与所述业务变量对应的决策树规则细分客群模型，对所述待处理客群的客户信息进行业务风险客群预测，得到决策树分类客群，包括：

6.根据权利要求1所述的业务风险客群的识别方法，其特征在于，所述获取所述初始业务风险客群的业务风险客群信息，调用与所述初始业务风险客群对应的目标预测模型，对所述业务风险分类客群信息进行业务风险预测，得到业务风险预测值，包括：

7.根据权利要求1-6中任一项所述的业务风险客群的识别方法，其特征在于，所述通过所述业务风险预测值，对所述初始业务风险客群进行筛选，得到目标业务风险客群，包括：

8.一种业务风险客群的识别装置，其特征在于，所述业务风险客群的识别装置包括：

9.一种业务风险客群的识别设备，其特征在于，所述业务风险客群的识别设备包括：存储器和至少一个处理器，所述存储器中存储有指令；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述业务风险客群的识别设备执行如权利要求1-7中任意一项所述的业务风险客群的识别方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，所述指令被处理器执行时实现如权利要求1-7中任一项所述业务风险客群的识别方法。