WO2019041439A1

WO2019041439A1 - 核保难度预测的方法、装置、计算机设备及存储介质

Info

Publication number: WO2019041439A1
Application number: PCT/CN2017/104654
Authority: WO
Inventors: 马向东; 高雪; 丁杰; 李斌; 陈杰; 邵正铂; 张捷
Original assignee: 平安科技（深圳）有限公司
Priority date: 2017-08-28
Filing date: 2017-09-29
Publication date: 2019-03-07
Also published as: CN107633323A

Abstract

一种核保难度预测的方法，包括：获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；确定与每个目标因素对应的参数值；对所述参数值进行归一化处理得到标准参数值；将各个目标因素对应的标准参数值按照预设的规则组合为目标向量；将目标向量作为训练好的核保难度预测模型的输入，获取输出的与投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。

Description

核保难度预测的方法、装置、计算机设备及存储介质

本申请要求于2017年8月28日提交中国专利局、申请号为2017107520246、发明名称为“核保难度预测的方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机处理领域，特别是涉及一种核保难度预测的方法、装置、计算机设备及存储介质。

背景技术

随着保险业务的发展，越来越多的人开始进行投保，保险公司在收到用户的投保申请后，需要对投保单进行核保，由于核保需要相关的专业知识，为了提高工作效率，分配核保任务时是根据核保难度进行分配的，比如，将核保难度高的投保单分配给高级专业人员进行处理，核保难度低的分配给初级专业人员进行处理。因此，如何准确地计算投保单的核保难度显得非常重要。

传统的核保难度的计算是根据固定规则人为计算的，不够灵活，而且计算结果往往也不贴近实际，导致后续分配核保任务时不能够准确分配。

发明内容

根据本申请的各种实施例，提供一种核保难度预测的方法、装置、计算机设备及存储介质。

一种核保难度预测的方法，包括：

获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；

确定与每个目标因素对应的参数值；

对所述参数值进行归一化处理得到标准参数值；

将各个目标因素对应的标准参数值按照预设的规则组合为目标向量；及

将所述目标向量作为训练好的核保难度预测模型的输入，获取输出的与所述投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。

一种核保难度预测的装置，包括：

第一提取模块，用于获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；

参数值确定模块，用于确定与每个目标因素对应的参数值；

第一处理模块，用于对所述参数值进行归一化处理得到标准参数值；

第一组合模块，用于将各个目标因素对应的标准参数值按照预设的规则组合为目标向量；及

预测模块，用于将所述目标向量作为训练好的核保难度预测模型的输入，获取输出的与所述投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。

一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行以下步骤：

确定与每个目标因素对应的参数值；

对所述参数值进行归一化处理得到标准参数值；

一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

确定与每个目标因素对应的参数值；

对所述参数值进行归一化处理得到标准参数值；

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为一个实施例中计算机设备的内部结构示意图；

图2为一个实施例中核保难度预测的方法流程图；

图3为一个实施例中建立核保难度预测模型的方法流程图；

图4为一个实施例中从数据库中获取历史投保单，确定训练样本集的方法流程图；

图5为另一个实施例中建立核保难度预测模型的方法流程图；

图6为一个实施例中核保难度预测的装置的结构框图；

图7为另一个实施例中核保难度预测的装置的结构框图；

图8为又一个实施例中核保难度预测的装置的结构框图；

图9为再一个实施例中核保难度预测的装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1为一个实施例中计算机设备的内部结构示意图。该计算机设备可以是终端，也可以是服务器，其中，终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。参照图1，该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中，该计算机设备的非易失性存储介质可存储操作系统和计算机可读指令，该计算机可读指令被执行时，可使得处理器执行一种核保难度预测的方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该内存储器中可储存有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行一种核保难度预测的方法。计算机设备的网络接口用于进行网络通信，如发送分配的任务等。本领域技术人员可以理解，图1中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

如图2所示，在一个实施例中，提出了一种核保难度预测的方法，以该方法应用于图1中的计算机设备为例进行说明，具体包括以下步骤：

步骤202，获取待计算核保难度的投保单，提取投保单中影响核保难度的目标因素。

具体地，在接收到用户的投保单后，需要对用户的投保单进行核保，只有核保通过的投保单才允许进行投保。不同的投保单所对应的核保难度往往不同，核保的难度是与投保单中包含的投保人数、被保人年龄、性别、保额、投保单位等很多因素相关的。由于核保需要具有相应的专业技能，为了提高工作效率，需要将核保任务分配给合适的工作人员处理，比如将核保难度高的投保单分配给高级专业人员进行处理，核保难度低的分配给初级专业人员进行处理。所以如何准确计算投保单的核保难度对于后续的工作效率有很大影响。在一个实施例中，在获取到待计算核保难度的投保单后，根据自定义的规则提取投保单中所有影响核保难度的目标因素，便于后续根据提取的目标因素预测核保难度值。

步骤204，确定与每个目标因素对应的参数值。

具体地，在获取到投保单中影响核保难度的目标因素后，需要确定与每个目标因素对应的参数值，其中，参数值是指计算机能够处理的数字表示。由于在后续计算处理时计算机能够处理的只能是相应的数字表示，所以获取到目标因素后，需要根据每个目标因素对应的转化规则，将目标因素转换为对应的数字表示。比如，性别可以采用0和1来表示，投保单位则可以采用16位的数字来表示，保额可以直接采用相应的保额数字表示。预先定义各个目标因素所对应的转化规则，确定参数值的过程就是将各个目标因素转换为数字的过程。

步骤206，对参数值进行归一化处理得到标准参数值。

具体地，标准参数值是指采用统一标准处理后得到的数值。归一化的目的就是使所有的数值采用统一标准进行投影得到标准参数值，且经过归一化处理后，便于后续的计算。在一个实施例中，归一化处理是指将各个参数值投影到0-1之间，具体归一化的方法可以自定义，比如，可以采用sigmoid函数将各个参数值投影到0-1之间。在另一实施例中，为了避免参数值中出现负数，归一化的处理可以分为两步，首先，获取参数值中的最大值和最小值，将所有的参数值同时减去最小值，这样就将所有的参数值都转换为了大于或等于0的数值，然后将转换后的参数值同时除以一个目标数值，以便将所有的数值都转换为0-1之间的数值，所以目标数值要大于或等于转换后的参数值中的最大值。在一个实施例中，将转换后的参数值中的最大值作为目标数值，转换后的最大值＝转换前的最大值-转换前的最小值。通过该归一化的方式可以将所有的参数值都转换为0-1之间的数值，大大简化了后续的训练计算。举个例子，假设获取到的参数值有1000，10，20，-10，其中的最大值为1000，最小值为-10。为了避免负数，首先，同时减去一个最小值-10，相应的参数值变为：1010，20，30，0。然后再除以1010(最大值-最小值)，相应的参数值就转换为了1，20/1010，30/1010，0。

步骤207，将各个目标因素对应的标准参数值按照预设的规则组合为目标向量。

具体地，在确定了目标因素对应的标准参数值后，按照预设的组合顺序，将目标因素对应的标准参数值组合为目标向量。每个目标因素对应的标准参数值为目标向量中的一个分量。预先设置目标因素的组合顺序，比如，假设投保单中包含的目标因素有6个，分别为A1，A2，A3，A4，A5和A6，假设预先设置向量的组合顺序为[A4，A3，A6，A1，A2，A5]，那么在确定了目标因素对应的标准参数值后，将对应的标准参数值按照预设的组合顺序进行组合得到目标向量。

步骤208，将目标向量作为训练好的核保难度预测模型的输入，获取输出的与投保单对应的核保难度值，核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。

其中，将目标因素对应的标准参数值组合为目标向量后，将该目标向量作为训练好的核保难度预测模型的输入向量，然后获取输出的与投保单对应的核保难度值。其中，核保难度预测模型是通过将大量的历史投保单作为训练样本，采用BP神经网络模型进行训练得到的。BP(Back Propagation)神经网络是一种按误差逆传播算法训练的多层前馈网络，其能够学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。将历史投保单作为训练样本，提取历史投保单中影响核保难度的影响因素，计算得到影响因素对应的标准参数值，将各个影响因素对应的标准参数值按照预设的规则进行组合，组合为输入向量，将该输入向量作为BP神经网络模型的输入样本，将相应的核保难度值作为期望的输出样本进行训练，得到核保难度预测模型。然后将得到的目标向量作为训练好的核保难度预测模型的输入，便可根据训练好的核保难度预测模型计算得到与投保单对应的核保难度值。

上述核保难度预测的方法，通过获取待计算核保难度的投保单，提取投保单中影响核保难度的目标因素，确定与每个目标因素对应的参数值，对参数值进行归一化处理得到标准参数值，将各个目标因素对应的标准参数值按照预设的规则组合为目标向量，将目标向量作为训练好的核保难度预测模型的输入向量，获取输出的与所述投保单对应的核保难度值，其中，核保难度预测模型是采用BP神经网络模型进行训练得到的。上述投保单的核保难度值是通过采用基于BP神经网络模型训练得到的核保难度预测模型进行计算得到的，不再依赖于人为计算，而是基于大量的历史投保单进行预测计算，不但提高了计算的准确性，而且省时省力，有利于后续根据核保难度值进行相应的核保任务分配。

在采用核保难度预测模型进行预测之前，首先需要建立核保难度预测模型。如图3所示，在一个实施例中，建立核保难度预测模型的步骤包括：

步骤210，从数据库中获取历史投保单，确定训练样本集。

具体地，历史投保单是指之前已经核保过的投保单，由于这些投保单之前已经进行了核保，即其相应的核保难度值已经进行了确定，所以可以将这些已经确定过核保难度值的历史投保单作为模型训练的样本，构造训练样本集。便于后续根据训练样本集中的训练样本对模型进行训练。在一个实施例中，为了使建立的核保难度预测模型更准确，获取到历史投保单后，还需要对历史投保单进行筛选，因为有些投保单具有的参考价值很小，所以可以不考虑这部分投保单。比如，可以根据历史投保单对应的日期进行筛选，由于历史投保单的年份越久对现在的核保难度的预测的参考价值越小，所以可以将年份较久的投保单去掉，比如，只选择距今十年之内的投保单作为训练样本。

步骤212，提取训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值。

具体地，投保单中影响核保难度的影响因素包括投保单位，保额，保费，人数、被保险人年龄、性别、赔付金额、赔付率等，确定了作为样本的历史投保单集后，提取每个历史投保单中影响核保难度值的影响因素，并获取与该历史投保单对应的核保难度值，将提取的历史投保单中影响核保难度值的影响因素和该历史投保单对应的核保难度值进行对应存储，便于后续将其作为训练数据对模型进行训练。

步骤214，确定与每个影响因素对应的参数值，对参数值进行归一化处理得到标准参数值。

具体地，获取每个历史投保单中影响核保难度值的影响因素后，首先，获取与每个影响因素对应的转化规则，将每个影响因素按照对应的转化规则转换为参数值，其中，参数值是指计算机可以处理的数字表示形式。然后为了对参数值统一标准，对得到的参数值进行归一化，得到标准参数值。在一个实施例中，归一化处理是指将各个参数值投影到0-1之间，具体归一化的方法可以自定义，比如，可以采用sigmoid函数将各个参数值投影到0-1之间。在另一实施例中，为了避免参数值中出现负数，归一化的处理可以分为两步，首先，获取参数值中的最大值和最小值，将所有的参数值同时减去最小值，这样就将所有的参数值都转换为了大于或等于0的数值，然后将转换后的参数值同时除以一个目标数值，以便将所有的数值都转换为0-1之间的数值，所以目标数值要大于或等于转换后的参数值中的最大值。

步骤215，将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量。

具体地，在计算得到每个影响因素对应的标准参数值后，按照预设的组合规则将影响因素对应的标准参数值组合为输入向量，便于后续将该输入向量作为模型的输入样本进行训练。比如，假设历史投保单中包含的影响因素有6个，分别为A1，A2，A3，A4，A5和A6，假设预先设置向量的组合顺序为[A4，A3，A6，A1，A2，A5]，那么在确定了影响因素对应的标准参数值后，将对应的标准参数值按照预设的组合顺序进行组合得到目标向量。

步骤216，将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，对BP神经网络模型进行训练得到核保难度预测模型。

具体地，将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，构造训练数据集。将训练数据集中的输入样本和对应的期望的输出样本作为BP神经网络模型的训练数据，然后对BP神经网络模型进行训练得到核保难度预测模型。其中，BP神经网络的学习规则使用的是最速下降法，通过反向传播来不断调整网络的各连接权值，使网络的误差平方和最小。BP神经网络模型的拓扑结构包括输入层、隐含层和输出层。训练得到核保难度预测模型的过程就是确定输入层与隐含层的连接权值、隐含层与输出层的连接权值的过程。具体的过程如下：1)将网络结构进行初始化，即给各连接权值分别赋值，比如，可以从一个区间(-1，1)内随机选取数值进行赋值，设定误差函数，给定计算精度值和最大学习次数；2)随机选择一个输入样本及对应的期望的输出样本，然后将输入样本作为初始模型的输入，计算隐含层各神经元的输入和输出，并计算得到相应的实际输出值；3)根据期望输出和实际输出值，计算误差函数对输出层的各神经元的偏导数；4)根据各神经元的偏导数和隐含层各神经元的输出来修正连接权值。5)利用隐含层各神经元的偏导数和输入层各神经元的输入修正连接权值。6)计算全局误差。7)判断误差是否满足要求，当误差达到了预设精度或学习次数大于设定的最大次数，则结束。否则，选取下一个学习样本及对应的期望输出，返回到第3)步，进入到下一轮学习。

如图4所示，在一个实施例中，从数据库中获取历史投保单，确定训练样本集的步骤210包括：

步骤210A，从数据库中获取历史投保单，获取历史投保单所对应的投保年份。

具体地，历史投保单是指已经确定过核保难度值的投保单，数据库中存储有历史投保单，所以可以从数据库中提取历史投保单，同时获取每个历史投保单所对应的投保年份(即对应的投保日期)，便于后续根据投保年份进行有效历史投保单的筛选。

步骤210B，根据投保年份将历史投保单进行分类。

具体地，获取到历史投保单所对应的投保年份后，根据投保年份进行分类，可以将不同年份的分别作为一类，也可以将多个年份的划分为一类。比如，可以将2000年之前的作为一类，2000-2005之间的作为一类，将2005-2010之间的作为一类，将2010-2015之间的作为一类，2015年以后的作为一类。

步骤210C，对每一类历史投保单进行筛选得到有效历史投保单。

具体地，为了使得建立的模型更精确，那么相应的对模型进行训练的样本需要筛选的越准确。为了使得样本挑选的更有参考价值，需要根据年份从每一类历史投保单中筛选出参考价值比较大的历史投保单。在一个实施例中，首先，根据投保年份确定筛选的比例，比如，距今投保年限越久，相应的挑选比例可以设置的越小，比如，如果是十年前的可以只提取60％的历史投保单作为有效历史投保单，如果是五年前到十年前之间的，可以提取80％的历史投保单作为有效投保单，如果是三年前到五年前之间的，可以提取90％的历史投保单作为有效投保单，如果是距今三年内的，那么就可以提取95％的历史投保单作为有效投保单。具体筛选的方式可以自定义，比如，可以将每一类历史投保单按照对应的核保难度值从小到大进行排序，然后剔除过大或过小的核保难度值对应历史投保单。

步骤210D，将每一类有效历史投保单进行聚类，得到训练样本集。

具体地，挑选出每一类有效历史投保单后，将各个类的有效投保单进行聚类，得到训练样本集，其中，聚类是指将每一类有效历史投保单组合在一起，构成一个有效历史投保单集合即训练样本集。后续采用训练样本集中的历史投保单基于BP神经网络模型进行训练得到核保难度预测模型。

如图5所示，在一个实施例中，建立核保难度预测模型的步骤还包括：

步骤218，获取检测样本集。

具体地，检测样本集用于衡量训练得到的核保难度预测模型的准确度，为了能够对训练得到的核保难度预测模型进行更准确的验证，在采用训练样本进行训练得到核保难度预测模型之后，进一步对训练得到的核保难度模型进行检测，检测该模型针对于检测样本是否达到了相应的要求，检测合格后，将确定合格的模型作为训练好的核保难度预测模型。训练样本集和检测样本集都是历史投保单组成的集合。通过检测样本校验过的核保难度预测模型能够更准确对投保单的核保难度值进行预测。在一个实施例中，获取到历史投保单后，将其中的一部分作为训练样本集，另外一部分作为检测样本集。比如，80％的历史投保单作为训练样本集，将剩下的20％作为相应的检测样本集。

步骤220，将检测样本集中的输入样本作为训练得到的核保难度预测模型的输入，获取相应的输出值。

具体地，首先，获取检测样本集中每个历史投保单对应的影响核保难度的影响因素，将影响因素按照预设的转化规则转换得到与影响因素对应的参数值，然后对参数值进行归一化处理得到标准参数值，之后，将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量，将该输入向量作为训练得到的核保难度预测模型的输入样本，获取输出的预测得到的输出值。后续通过根据实际输出值和相应的期望输出值计算相应的误差范围。

步骤222，判断输出值与标准输出值的误差是否在预设的范围内，若是，则进入步骤224，如否，则进入步骤225。

其中，标准输出值是指期望的输出值，即历史投保单对应的实际的核保难度值。通过核保难度预测模型预测得到的核保难度值和实际的核保难度值之间的误差来衡量该训练得到的核保难度预测模型是否符合要求。在一个实施例中，采用绝对偏差的均值来衡量是否符合标准，具体地，绝对偏差的均值的计算公式如下：

其中，N代表检测样本集中样本的数量，p_i是指历史投保单对应的实际的核保难度值，

是指预测得到的历史投保单对应的核保难度值。在另一个实施例中，还需要考虑绝对偏差的方差，具体计算公式如下：

首先，计算得到偏差的均值，均值越小说明偏移程度越小，在均值相当的情况下，方差越低说明评估的误差越小。可以预先设置均值和方差的权重，一般均值的权重比较大，方差的权重相对比较小。在计算得到均值和方差后，加权求和计算得到误差值，误差值与可信度成反相关。预先设置最大误差阈值，当计算得到的误差大于最大误差阈值时，说明该模型不可靠，需要重新进行训练，如果不大于最大误差阈值，说明该模型比较可靠，可以用来预测新的投保单的核保难度值。

步骤224，将训练得到的核保难度预测模型所对应的连接权值作为训练好的核保难度预测模型的连接权值。

具体地，连接权值包括输入层和隐含层之间的连接权值以及隐含层与输出层之间的连接权值。BP神经网络模型的学习方式是通过在外界输入样本的刺激下不断改变网络的连接权值。确定核保难度预测模型的过程就是确定最终连接权值的过程。所以如果计算得到的误差在预设范围内，就可以将训练得到的核保难度预测模型作为训练好的核保难度预测模型。

步骤225，更改连接权值采用训练样本重新训练核保难度预测模型，并重复执行步骤218-222。

具体地，如果计算得到的误差不在预设范围内，说明目前训练得到的核保难度预测模型不符合要求，需要重新改变连接权值进行训练，训练完成后，再采用同样的方式进行检测，直到检测合格。在另一个实施例中，为了不断提高核保难度预测模型的精确度，建立知识库，首先，将训练样本集加入知识库中，采用知识库中的样本进行训练得到模型后，利用模型对投保单进行预测后，将相应的数据保存到知识库中，从而进一步丰富知识库，之后利用知识库中数据再重新训练建立新的模型，通过实时更新知识库和模型有利于建立更加精确的核保难度预测模型。

在一个实施例中，所述方法还包括：根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级；根据所述职能等级将所述投保单进行分配。

在本实施例中，在确定了投保单的核保难度值后，就可以根据预先设置的职能等级与核保难度值的对应关系确定相应的职能等级，继而根据确定的职能等级进行相应的分配。其中，职能等级是根据核保人员的业务技能水平来划分的，业务技能水平高的能够处理核保难度高的核保任务，业务技能水平低的处理核保难度低的核保任务，根据职能等级进行分配，有利于提高相应的工作效率。

如图6所示，在一个实施例中，提出了一种核保难度预测的装置，该装置包括：

第一提取模块602，用于获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；

参数值确定模块604，用于确定与每个目标因素对应的参数值；

第一处理模块606，用于对所述参数值进行归一化处理得到标准参数值；

第一组合模块607，用于将各个目标因素对应的标准参数值按照预设的规则组合为目标向量；

预测模块608，用于将所述目标向量作为训练好的核保难度预测模型的输入，获取输出的与所述投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。

如图7所示，在一个实施例中，上述核保难度预测的装置还包括：

样本集确定模块610，用于从数据库中获取历史投保单，确定训练样本集；

第二提取模块612，用于提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值；

第二处理模块614，用于确定与每个影响因素对应的参数值，对所述参数值进行归一化处理得到标准参数值；

第二组合模块615，用于将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量；

训练模块616，用于将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，采用BP神经网络模型进行训练得到核保难度预测模型。

在一个实施例中，所述确定模块还用于从知识库中获取历史投保单，获取历史投保单所对应的投保年份；根据投保年份将历史投保单进行分类；对每一类历史投保单进行筛选得到有效历史投保单；将每一类有效历史投保单进行聚类，得到训练样本集。

如图8所示，在一个实施例中，上述核保难度预测的装置还包括：

获取模块618，获取检测样本集；

输出模块619，用于将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入，获取相应的输出值；

判断模块620，用于判断所述输出值与所述标准输出值的误差是否在预设的范围内，若是，则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。

如图9所示，在一个实施例中，上述核保难度预测的装置还包括：

分配模块609，用于根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级，根据所述职能等级将所述投保单进行分配。

上述核保难度预测的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。其中，网络接口可以是以太网卡或无线网卡等。上述各模块可以硬件形式内嵌于或独立于服务器中的处理器中，也可以以软件形式存储于服务器中的存储器中，以便于处理器调用执行以上各个模块对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。

上述核保难度预测的装置可以实现为一种计算机可读指令的形式，计算机可读指令可以在如图1所示的计算机设备上运行。

本申请实施例提出了一种计算机设备，计算机设备的内部结构可对应于如图1所示的结构，即该计算机设备既可以是服务器也可以是终端，其包括一系列存储于存储器上的计算机可读指令，当该计算机可读指令被处理器执行时，可以实现本申请各实施例提出的控制承保处理的方法。在一个实施例中，计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现以下步骤：获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；确定与每个目标因素对应的参数值；对所述参数值进行归一化处理得到标准参数值；将各个目标因素对应的标准参数值按照预设的规则组合为目标向量；将所述目标向量作为训练好的核保难度预测模型的输入，获取输出的与所述投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。

在一个实施例中，计算机可读指令使得处理器在执行获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素的之前，还执行以下步骤：从数据库中获取历史投保单，确定训练样本集；提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值；确定与每个影响因素对应的参数值，对所述参数值进行归一化处理得到标准参数值；将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量；将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，采用BP神经网络模型进行训练得到核保难度预测模型。

在一个实施例中，所述从数据库中获取历史投保单，确定训练样本集包括：从数据库中获取历史投保单，获取历史投保单所对应的投保年份；根据投保年份将历史投保单进行分类；对每一类历史投保单进行筛选得到有效历史投保单；将每一类有效历史投保单进行聚类，得到训练样本集。

在一个实施例中，计算机可读指令使得处理器在执行将所述历史投保单中影响核保难度的因素所对应的标准参数值作为样本输入向量，将相应的核保难度值作为样本期望的输出值，采用BP神经网络模型进行训练得到核保难度预测模型之后，还执行以下步骤：获取检测样本集；将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入，获取相应的输出值；判断所述输出值与所述标准输出值的误差是否在预设的范围内；若是，则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。

在一个实施例中，计算机可读指令可使得处理器执行以下步骤：根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级；根据所述职能等级将所述投保单进行分配。

一种计算机可读存储介质，其上存储有计算机可读指令，该程序被处理器执行时实现以下步骤：获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；确定与每个目标因素对应的参数值；对所述参数值进行归一化处理得到标准参数值；将各个目标因素对应的标准参数值按照预设的规则组合为目标向量；将所述目标向量作为训练好的核保难度预测模型的输入，获取输出的与所述投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。

在一个实施例中，计算机可读指令使得处理器执行获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素的之前，还执行以下步骤：从数据库中获取历史投保单，确定训练样本集；提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值；确定与每个影响因素对应的参数值，对所述参数值进行归一化处理得到标准参数值；将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量；将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，采用BP神经网络模型进行训练得到核保难度预测模型。

在一个实施例中，所述从数据库中获取历史投保单，确定训练样本集包括：

从数据库中获取历史投保单，获取历史投保单所对应的投保年份；根据投保年份将历史投保单进行分类；对每一类历史投保单进行筛选得到有效历史投保单；将每一类有效历史投保单进行聚类，得到训练样本集。

在一个实施例中，计算机可读指令使得处理器执行将所述历史投保单中影响核保难度的因素所对应的标准参数值作为样本输入向量，将相应的核保难度值作为样本期望的输出值，采用BP神经网络模型进行训练得到核保难度预测模型之后，还执行以下步骤：获取检测样本集；将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入，获取相应的输出值；判断所述输出值与所述标准输出值的误差是否在预设的范围内；若是，则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。

在一个实施例中，计算机可读指令可使得处理器还用于执行以下步骤：根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级；根据所述职能等级将所述投保单进行分配。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种核保难度预测的方法，包括：

获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；

确定与每个所述目标因素对应的参数值；

对所述参数值进行归一化处理得到标准参数值；

将各个所述目标因素对应的所述标准参数值按照预设的规则组合为目标向量；及

将所述目标向量作为训练好的核保难度预测模型的输入，获取输出的与所述投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
根据权利要求1所述的方法，其特征在于，在所述获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素之前还包括：

从数据库中获取历史投保单，确定训练样本集；

提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值；

确定与每个所述影响因素对应的参数值，对所述参数值进行归一化处理得到标准参数值；

将每个所述历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量；

将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，对BP神经网络模型进行训练得到核保难度预测模型。
根据权利要求2所述的方法，其特征在于，所述从数据库中获取历史投保单，确定训练样本集包括：

从数据库中获取历史投保单，获取所述历史投保单所对应的投保年份；

根据所述投保年份将历史投保单进行分类；

对每一类历史投保单进行筛选得到有效历史投保单；

将每一类有效历史投保单进行聚类，得到训练样本集。
根据权利要求2所述的方法，其特征在于，在所述将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，采用BP神经网络模型进行训练得到核保难度预测模型之后还包括：

获取检测样本集；

将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入，获取相应的输出值；

判断所述输出值与所述标准输出值的误差是否在预设的范围内；

若是，则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级；

根据所述职能等级将所述投保单进行分配。
一种核保难度预测的装置，包括：

第一提取模块，用于获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；

参数值确定模块，用于确定与每个所述目标因素对应的参数值；

第一处理模块，用于对所述参数值进行归一化处理得到标准参数值；

第一组合模块，用于将各个所述目标因素对应的所述标准参数值按照预设的规则组合为目标向量；及

预测模块，用于将所述目标向量作为训练好的核保难度预测模型的输入，获取输出的与所述投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
根据权利要求6所述的装置，其特征在于，所述装置还包括：

样本集确定模块，用于从数据库中获取历史投保单，确定训练样本集；

第二提取模块，用于提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值；

第二处理模块，用于确定与每个所述影响因素对应的参数值，对所述参数值进行归一化处理得到标准参数值；

第二组合模块，用于将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量；

训练模块，用于将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，对BP神经网络模型进行训练得到核保难度预测模型。
根据权利要求7所述的装置，其特征在于，所述确定模块还用于从数据库中获取历史投保单，获取所述历史投保单所对应的投保年份，根据所述投保年份将历史投保单进行分类，对每一类历史投保单进行筛选得到有效历史投保单，将每一类有效历史投保单进行聚类，得到训练样本集。
根据权利要求7所述的装置，其特征在于，所述装置还包括：

获取模块，获取检测样本集；

输出模块，用于将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入，获取相应的输出值；

判断模块，用于判断所述输出值与所述标准输出值的误差是否在预设的范围内，若是，则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。
根据权利要求6所述的装置，其特征在于，所述装置还包括：

分配模块，用于根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级，根据所述职能等级将所述投保单进行分配。
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行以下步骤：

获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；

确定与每个目标因素对应的参数值；

对所述参数值进行归一化处理得到标准参数值；

将各个目标因素对应的标准参数值按照预设的规则组合为目标向量；及

将所述目标向量作为训练好的核保难度预测模型的输入，获取输出的与所述投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
根据权利要求11所述的计算机设备，其特征在于，所述在所述获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素之前，所述计算机可读指令还使得处理器执行以下步骤：

从数据库中获取历史投保单，确定训练样本集；

提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值；

确定与每个所述影响因素对应的参数值，对所述参数值进行归一化处理得到标准参数值；

将每个所述历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量；

将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，对BP神经网络模型进行训练得到核保难度预测模型。
根据权利要求12所述的计算机设备，其特征在于，所述从数据库中获取历史投保单，确定训练样本集包括：

从数据库中获取历史投保单，获取所述历史投保单所对应的投保年份；

根据所述投保年份将历史投保单进行分类；

对每一类历史投保单进行筛选得到有效历史投保单；

将每一类有效历史投保单进行聚类，得到训练样本集。
根据权利要求12所述的计算机设备，其特征在于，在所述将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，采用BP神经网络模型进行训练得到核保难度预测模型之后，所述计算机可读指令还使得处理器执行以下步骤：

获取检测样本集；

将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入，获取相应的输出值；

判断所述输出值与所述标准输出值的误差是否在预设的范围内；

若是，则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。
根据权利要求11所述的计算机设备，其特征在于，所述计算机可读指令还使得处理器执行以下步骤：

根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级；

根据所述职能等级将所述投保单进行分配。
一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素；

确定与每个目标因素对应的参数值；

对所述参数值进行归一化处理得到标准参数值；

将各个目标因素对应的标准参数值按照预设的规则组合为目标向量；及

将所述目标向量作为训练好的核保难度预测模型的输入，获取输出的与所述投保单对应的核保难度值，所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
根据权利要求16所述的存储介质，其特征在于，所述在所述获取待计算核保难度的投保单，提取所述投保单中影响核保难度的目标因素之前，所述计算机可读指令还使得处理器执行以下步骤：

从数据库中获取历史投保单，确定训练样本集；

提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值；

确定与每个所述影响因素对应的参数值，对所述参数值进行归一化处理得到标准参数值；

将每个所述历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量；

将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，对BP神经网络模型进行训练得到核保难度预测模型。
根据权利要求17所述的存储介质，其特征在于，所述从数据库中获取历史投保单，确定训练样本集包括：

从数据库中获取历史投保单，获取所述历史投保单所对应的投保年份；

根据所述投保年份将历史投保单进行分类；

对每一类历史投保单进行筛选得到有效历史投保单；

将每一类有效历史投保单进行聚类，得到训练样本集。
根据权利要求17所述的存储介质，其特征在于，在所述将每个历史投保单对应的输入向量作为输入样本，将相应的核保难度值作为期望的输出样本，采用BP神经网络模型进行训练得到核保难度预测模型之后，所述计算机可读指令还使得处理器执行以下步骤：

获取检测样本集；

将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入，获取相应的输出值；

判断所述输出值与所述标准输出值的误差是否在预设的范围内；

若是，则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。
根据权利要求16所述的存储介质，其特征在于，所述计算机可读指令还使得处理器执行以下步骤：

根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级；

根据所述职能等级将所述投保单进行分配。