WO2019041439A1 - 核保难度预测的方法、装置、计算机设备及存储介质 - Google Patents

核保难度预测的方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2019041439A1
WO2019041439A1 PCT/CN2017/104654 CN2017104654W WO2019041439A1 WO 2019041439 A1 WO2019041439 A1 WO 2019041439A1 CN 2017104654 W CN2017104654 W CN 2017104654W WO 2019041439 A1 WO2019041439 A1 WO 2019041439A1
Authority
WO
WIPO (PCT)
Prior art keywords
difficulty
underwriting
insurance policy
value
historical
Prior art date
Application number
PCT/CN2017/104654
Other languages
English (en)
French (fr)
Inventor
马向东
高雪
丁杰
李斌
陈杰
邵正铂
张捷
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2019041439A1 publication Critical patent/WO2019041439A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Definitions

  • the present application relates to the field of computer processing, and in particular, to a method, device, computer device and storage medium for predicting the difficulty of underwriting.
  • the insurance company needs to underwrite the insurance policy. Because the insurance requires relevant professional knowledge, in order to improve work efficiency, When the underwriting task is assigned, it is allocated according to the difficulty of the underwriting. For example, the insurance policy with high insurance coverage is assigned to the senior professional for processing, and the low-density insurance is assigned to the junior professional for processing. Therefore, how to accurately calculate the difficulty of underwriting the insurance policy is very important.
  • a method, apparatus, computer device, and storage medium for predicting the difficulty of the underwriting are provided.
  • a method for predicting the difficulty of underwriting includes:
  • the underwriting difficulty prediction model is based on a historical insurance policy using a BP neural network model Trained.
  • a first extraction module configured to acquire a policy for calculating the difficulty of the underwriting, and extract a target factor in the insurance policy that affects the difficulty of the underwriting;
  • a parameter value determining module for determining a parameter value corresponding to each target factor
  • a first processing module configured to normalize the parameter value to obtain a standard parameter value
  • One or more non-transitory readable storage mediums storing computer readable instructions, when executed by one or more processors, cause the one or more processors to perform the following steps:
  • the underwriting difficulty prediction model is based on a historical insurance policy using a BP neural network model Trained.
  • FIG. 1 is a schematic diagram showing the internal structure of a computer device in an embodiment
  • FIG. 3 is a flow chart of a method for establishing a verification model for a nuclear insurance difficulty in an embodiment
  • FIG. 4 is a diagram of obtaining a historical insurance policy from a database and determining a training sample set in an embodiment.
  • FIG. 6 is a structural block diagram of an apparatus for predicting a difficulty in checking an embodiment
  • FIG. 8 is a structural block diagram of an apparatus for predicting the difficulty of the underwriting in still another embodiment
  • FIG. 9 is a structural block diagram of an apparatus for predicting the difficulty of the underwriting in still another embodiment.
  • a method for predicting the difficulty of the underwriting is proposed.
  • the method is applied to the computer device in FIG. 1 as an example, and specifically includes the following steps:
  • Step 202 Obtain an insurance policy for calculating the difficulty of underwriting, and extract a target factor in the insurance policy that affects the difficulty of underwriting.
  • the insurance policy of the user needs to be underwritten, and only the insurance policy passed by the underwriting is allowed to be insured.
  • the difficulty of underwriting for different insurance policies is often different.
  • the difficulty of underwriting is related to many factors such as the number of insurance applicants, the age of the insured, the gender, the amount of insurance, and the insurance unit. Since the underwriting needs to have the corresponding professional skills, in order to improve the work efficiency, it is necessary to assign the underwriting task to the appropriate staff, for example, assigning the insurance policy with high insurance coverage to senior professionals for processing, and the underwriting is difficult. Assigned to junior professionals for processing. Therefore, how to accurately calculate the insured difficulty of the insurance policy has a great impact on the subsequent work efficiency.
  • all target factors affecting the difficulty of the underwriting in the insurance policy are extracted according to the customized rule, so that the underwriting difficulty value is predicted according to the extracted target factors.
  • Step 204 determining parameter values corresponding to each target factor.
  • the parameter value refers to a digital representation that the computer can process. Since the computer can only process the corresponding digital representation during the subsequent calculation processing, after the target factor is acquired, the target factor needs to be converted into a corresponding digital representation according to the conversion rule corresponding to each target factor. For example, gender can be represented by 0 and 1, and the insured unit can be represented by a 16-digit number. The insured amount can be directly expressed by the corresponding insured number.
  • the conversion rules corresponding to each target factor are defined in advance, and the process of determining the parameter values is a process of converting each target factor into a number.
  • step 206 the parameter values are normalized to obtain standard parameter values.
  • the standard parameter value refers to a value obtained by processing using a unified standard.
  • the purpose of normalization is to make all the values are projected using a unified standard to obtain standard parameter values, and after normalization, it is convenient for subsequent calculations.
  • the normalization process refers to projecting each parameter value between 0-1, and the specific normalization method can be customized. For example, a sigmoid function can be used. The number is projected between 0-1 values.
  • the normalization process can be divided into two steps. First, the maximum value and the minimum value of the parameter values are obtained, and all the parameter values are simultaneously subtracted from the minimum value.
  • all parameter values can be converted to values between 0-1, which greatly simplifies subsequent training calculations. For example, suppose the obtained parameter values are 1000, 10, 20, -10, where the maximum value is 1000 and the minimum value is -10. To avoid negative numbers, first, subtract a minimum of -10, and the corresponding parameter value becomes: 1010, 20, 30, 0. Then divide by 1010 (maximum-minimum) and the corresponding parameter value is converted to 1,20/1010,30/1010,0.
  • Step 207 Combine the standard parameter values corresponding to the respective target factors into a target vector according to a preset rule.
  • the standard parameter values corresponding to the target factors are combined into the target vector according to a preset combination order.
  • the standard parameter value corresponding to each target factor is a component in the target vector.
  • Step 208 using the target vector as the input of the trained underwriting difficulty prediction model, and obtaining the output of the underwriting difficulty value corresponding to the insurance policy.
  • the underwriting difficulty prediction model is based on the historical insurance policy using the BP neural network model for training. .
  • the target vector After combining the standard parameter values corresponding to the target factors into the target vector, the target vector is used as the input vector of the trained underwriting difficulty prediction model, and then the output of the underwriting guarantee difficulty value corresponding to the insurance policy is obtained.
  • the underwriting prediction model is based on a large number of historical insurance policies.
  • the samples were trained and trained using the BP neural network model.
  • BP (Back Propagation) neural network is a multi-layer feedforward network trained by error inverse propagation algorithm, which can learn and store a large number of input-output mode mapping relationships without revealing the mathematical equations describing this mapping relationship in advance. .
  • the input vector is used as the input sample of the BP neural network model, and the corresponding underwriting difficulty value is trained as the expected output sample to obtain the underwriting difficulty prediction model. Then, the obtained target vector is used as the input of the trained underwriting difficulty prediction model, and the underwriting difficulty value corresponding to the insurance policy can be calculated according to the trained underwriting difficulty prediction model.
  • the method for predicting the difficulty of the above-mentioned underwriting is obtained by acquiring the insurance policy for calculating the difficulty of the underwriting, extracting the target factors affecting the difficulty of underwriting in the insurance policy, determining the parameter values corresponding to each target factor, and normalizing the parameter values. Obtaining standard parameter values, combining the standard parameter values corresponding to each target factor into a target vector according to a preset rule, using the target vector as an input vector of the trained underwriting difficulty prediction model, and obtaining an output corresponding to the insurance policy
  • the above-mentioned insurance policy's underwriting difficulty value is calculated by using the under-nuclear difficulty prediction model based on BP neural network model training, and is no longer dependent on artificial calculation, but based on a large number of historical insurance policies for predictive calculation, not only improve The accuracy of the calculation, and save time and effort, is conducive to the subsequent assignment of the corresponding underwriting tasks according to the difficulty value of the underwriting.
  • the steps of establishing a verification difficulty prediction model include:
  • Step 210 Obtain a historical insurance policy from the database to determine a training sample set.
  • Step 212 Extract the influencing factors affecting the underwriting difficulty corresponding to each historical insurance policy in the training sample set and the corresponding underwriting difficulty value.
  • the influencing factors affecting the difficulty of underwriting in the insurance policy include the insured unit, the insured amount, the premium, the number of people, the insured's age, gender, the amount of compensation, the loss ratio, etc., after determining the historical insurance policy set as a sample, extracting The influencing factors affecting the difficulty value of the underwriting in each historical insurance policy, and obtaining the underwriting difficulty value corresponding to the historical insurance policy, and the influencing factors affecting the difficulty value of the underwriting in the extracted historical insurance policy correspond to the historical insurance policy
  • the value of the underwriting difficulty is stored correspondingly, so that it can be used as training data to train the model.
  • Step 214 determining parameter values corresponding to each influencing factor, and normalizing the parameter values to obtain standard parameter values.
  • the maximum value and the minimum value of the parameter values are obtained, and all the parameter values are simultaneously subtracted from the minimum value. This converts all parameter values to values greater than or equal to 0, and then divides the converted parameter values by a target value to convert all values to values between 0-1. Therefore, the target value is greater than or equal to the maximum value of the converted parameter values.
  • Step 215 Combine the standard parameter values corresponding to each influencing factor in each historical insurance policy into an input vector according to a preset rule.
  • the standard parameter values corresponding to the influencing factors are combined into an input vector according to a preset combination rule, so that the input vector is used as an input sample of the model for training.
  • a preset combination rule For example, suppose that there are six influencing factors included in the historical policy, namely A1, A2, A3, A4, A5 and A6, assuming that the combination order of the pre-set vectors is [A4, A3, A6, A1, A2, A5]
  • the corresponding standard parameter values are combined according to a preset combination order to obtain a target vector.
  • step 216 the input vector corresponding to each historical insurance policy is taken as an input sample, and the corresponding underwriting difficulty value is used as a desired output sample, and the BP neural network model is trained to obtain a nuclear insurance difficulty prediction model.
  • the input data corresponding to each historical application form is taken as an input sample, and the corresponding underwriting difficulty value is used as a desired output sample to construct a training data set.
  • the input samples in the training data set and the corresponding expected output samples are used as the training data of the BP neural network model, and then the BP neural network model is trained to obtain the underwriting difficulty prediction model.
  • the learning rule of BP neural network uses the steepest descent method, and continuously adjusts the connection weights of the network through backpropagation to minimize the sum of squared errors of the network.
  • the topology of the BP neural network model includes an input layer, an implicit layer, and an output layer.
  • the process of training to obtain the verification model of the underwriting difficulty is the process of determining the connection weight of the input layer and the hidden layer, and the connection weight of the hidden layer and the output layer.
  • the specific process is as follows: 1) Initialize the network structure, that is, assign values to each connection weight. For example, you can randomly assign values from a range (-1, 1) to assign values, set the error function, and give the calculation accuracy. Value and maximum number of learning; 2) randomly select an input sample and corresponding expected output samples, then use the input sample as the input of the initial model, calculate the input and output of each neuron in the hidden layer, and calculate the corresponding actual output.
  • the historical insured is obtained from the database
  • the step 210 of determining the training sample set includes:
  • Step 210A Obtain a historical insurance policy from the database, and obtain a year of insurance corresponding to the historical insurance policy.
  • the historical insurance policy refers to the insurance policy that has determined the difficulty value of the underwriting, and the historical insurance policy is stored in the database, so the historical insurance policy can be extracted from the database, and the insurance year corresponding to each historical insurance policy is obtained at the same time ( That is, the corresponding insured date), which facilitates subsequent screening of valid historical insurance policies according to the year of insured.
  • the different years may be classified as one class, or multiple years may be classified into one class. For example, you can use 2000 as a category, 2000-2005 as a category, and 2005-2010 as a category, between 2010-2015 as a category, and as a category after 2015. class.
  • each type of historical insurance policy is screened to obtain a valid historical insurance policy.
  • the proportion of screening is determined according to the year of insured. For example, the longer the insured period is, the smaller the corresponding selection ratio can be set. For example, if it is ten years ago, only 60% of historical insurance can be extracted. As an effective historical insurance policy, if it is between five years ago and ten years ago, 80% of the historical insurance policy can be extracted as a valid insurance policy. If it is between three years ago and five years ago, 90% can be extracted.
  • the historical insurance policy is a valid insurance policy. If it is within three years, you can withdraw 95% of the historical insurance policy as a valid insurance policy.
  • the specific screening method can be customized. For example, each type of historical insurance policy can be sorted according to the corresponding underwriting difficulty value from small to large, and then the excessively large or Too small a guarantee difficulty value corresponds to the historical insurance policy.
  • step 210D each type of valid historical insurance policy is clustered to obtain a training sample set.
  • the step of establishing a verification difficulty prediction model further includes:
  • Step 218 Acquire a test sample set.
  • the test sample set is used to measure the accuracy of the training under-precision difficulty prediction model, in order to be able to more accurately verify the trained under-precision difficulty prediction model, and use the training sample to train to obtain the under-precision difficulty prediction model.
  • the under-nuclear difficulty model obtained by the training is further tested, and the model is tested for whether the detected sample meets the corresponding requirements.
  • the qualified model is determined as the trained under-precision difficulty prediction model.
  • Both the training sample set and the test sample set are a collection of historical insured forms.
  • the under-counter-prepared difficulty prediction model verified by the test sample can more accurately predict the underwriting difficulty value of the insurance policy.
  • the historical insurance policy after the historical insurance policy is acquired, a part of it is taken as a training sample set, and another part is used as a test sample set. For example, 80% of the historical insurance policy is used as the training sample set, and the remaining 20% is taken as the corresponding test sample set.
  • Step 220 The input samples in the test sample set are used as input of the trained under-precision difficulty prediction model, and the corresponding output values are obtained.
  • the influencing factors corresponding to the insured difficulty corresponding to each historical insurance policy in the test sample set are obtained, and the influencing factors are converted according to the preset conversion rules to obtain the parameter values corresponding to the influencing factors, and then the parameter values are normalized.
  • the standard parameter values are obtained after the processing, and then the standard parameter values corresponding to each influencing factor in each historical insurance policy are combined into an input vector according to a preset rule, and the input vector is used as an input sample of the underwriting prediction model for training. , get the output value of the predicted output. Subsequent calculation of the corresponding error range is based on the actual output value and the corresponding desired output value.
  • Step 222 Determine whether the error between the output value and the standard output value is within a preset range. If yes, proceed to step 224. If no, proceed to step 225.
  • Step 224 The connection weight corresponding to the trained undertone difficulty prediction model is used as the connection weight of the trained underwriting difficulty prediction model.
  • the corresponding data is saved in the knowledge base, thereby further enriching the knowledge base, and then re-training the data in the knowledge base to establish a new model, and realizing the more accurate underwriting by updating the knowledge base and the model in real time. Difficulty prediction model.
  • the determining module 620 is configured to determine whether the error of the output value and the standard output value is within a preset range, and if yes, use the trained undercore difficulty prediction model as a trained core Guarantee the difficulty prediction model.
  • the embodiment of the present application provides a computer device.
  • the internal structure of the computer device may correspond to the structure shown in FIG. 1. That is, the computer device may be a server or a terminal, and includes a series of computers stored in the memory.
  • the readable instructions when the computer readable instructions are executed by the processor, may implement the method of controlling the underwriting process proposed by the embodiments of the present application.
  • the computer readable instructions may cause the processor to perform the step of: obtaining a functional level corresponding to the underwriting difficulty value according to a relationship between a preset underwriting difficulty value and a functional level; The rating assigns the insured.
  • a computer readable storage medium having computer readable instructions stored thereon, the program being executed by the processor to obtain the following steps: obtaining a policy for calculating the difficulty of the underwriting, and extracting a target of the insurance policy that affects the difficulty of underwriting a parameter; determining a parameter value corresponding to each target factor; normalizing the parameter value to obtain a standard parameter value; and combining standard parameter values corresponding to each target factor according to a preset rule as a target vector;
  • the target vector is used as an input of the trained underwriting difficulty prediction model, and obtains an output of the underwriting difficulty value corresponding to the insurance policy, and the underwriting difficulty prediction
  • the model is based on the historical insured policy trained using the BP neural network model.
  • the computer readable instructions may cause the processor to further perform the step of: obtaining a functional level corresponding to the underwriting difficulty value according to a relationship between a preset underwriting difficulty value and a functional level;
  • the functional level assigns the insurance policy.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

一种核保难度预测的方法,包括:获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;确定与每个目标因素对应的参数值;对所述参数值进行归一化处理得到标准参数值;将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;将目标向量作为训练好的核保难度预测模型的输入,获取输出的与投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。

Description

核保难度预测的方法、装置、计算机设备及存储介质
本申请要求于2017年8月28日提交中国专利局、申请号为2017107520246、发明名称为“核保难度预测的方法、装置、计算机设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及计算机处理领域,特别是涉及一种核保难度预测的方法、装置、计算机设备及存储介质。
背景技术
随着保险业务的发展,越来越多的人开始进行投保,保险公司在收到用户的投保申请后,需要对投保单进行核保,由于核保需要相关的专业知识,为了提高工作效率,分配核保任务时是根据核保难度进行分配的,比如,将核保难度高的投保单分配给高级专业人员进行处理,核保难度低的分配给初级专业人员进行处理。因此,如何准确地计算投保单的核保难度显得非常重要。
传统的核保难度的计算是根据固定规则人为计算的,不够灵活,而且计算结果往往也不贴近实际,导致后续分配核保任务时不能够准确分配。
发明内容
根据本申请的各种实施例,提供一种核保难度预测的方法、装置、计算机设备及存储介质。
一种核保难度预测的方法,包括:
获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标 因素;
确定与每个目标因素对应的参数值;
对所述参数值进行归一化处理得到标准参数值;
将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;及
将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
一种核保难度预测的装置,包括:
第一提取模块,用于获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;
参数值确定模块,用于确定与每个目标因素对应的参数值;
第一处理模块,用于对所述参数值进行归一化处理得到标准参数值;
第一组合模块,用于将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;及
预测模块,用于将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:
获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;
确定与每个目标因素对应的参数值;
对所述参数值进行归一化处理得到标准参数值;
将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;及
将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
一个或多个存储有计算机可读指令的非易失性可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行以下步骤:
获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;
确定与每个目标因素对应的参数值;
对所述参数值进行归一化处理得到标准参数值;
将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;及
将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中计算机设备的内部结构示意图;
图2为一个实施例中核保难度预测的方法流程图;
图3为一个实施例中建立核保难度预测模型的方法流程图;
图4为一个实施例中从数据库中获取历史投保单,确定训练样本集的方 法流程图;
图5为另一个实施例中建立核保难度预测模型的方法流程图;
图6为一个实施例中核保难度预测的装置的结构框图;
图7为另一个实施例中核保难度预测的装置的结构框图;
图8为又一个实施例中核保难度预测的装置的结构框图;
图9为再一个实施例中核保难度预测的装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中计算机设备的内部结构示意图。该计算机设备可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。参照图1,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中,该计算机设备的非易失性存储介质可存储操作系统和计算机可读指令,该计算机可读指令被执行时,可使得处理器执行一种核保难度预测的方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该内存储器中可储存有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种核保难度预测的方法。计算机设备的网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
如图2所示,在一个实施例中,提出了一种核保难度预测的方法,以该 方法应用于图1中的计算机设备为例进行说明,具体包括以下步骤:
步骤202,获取待计算核保难度的投保单,提取投保单中影响核保难度的目标因素。
具体地,在接收到用户的投保单后,需要对用户的投保单进行核保,只有核保通过的投保单才允许进行投保。不同的投保单所对应的核保难度往往不同,核保的难度是与投保单中包含的投保人数、被保人年龄、性别、保额、投保单位等很多因素相关的。由于核保需要具有相应的专业技能,为了提高工作效率,需要将核保任务分配给合适的工作人员处理,比如将核保难度高的投保单分配给高级专业人员进行处理,核保难度低的分配给初级专业人员进行处理。所以如何准确计算投保单的核保难度对于后续的工作效率有很大影响。在一个实施例中,在获取到待计算核保难度的投保单后,根据自定义的规则提取投保单中所有影响核保难度的目标因素,便于后续根据提取的目标因素预测核保难度值。
步骤204,确定与每个目标因素对应的参数值。
具体地,在获取到投保单中影响核保难度的目标因素后,需要确定与每个目标因素对应的参数值,其中,参数值是指计算机能够处理的数字表示。由于在后续计算处理时计算机能够处理的只能是相应的数字表示,所以获取到目标因素后,需要根据每个目标因素对应的转化规则,将目标因素转换为对应的数字表示。比如,性别可以采用0和1来表示,投保单位则可以采用16位的数字来表示,保额可以直接采用相应的保额数字表示。预先定义各个目标因素所对应的转化规则,确定参数值的过程就是将各个目标因素转换为数字的过程。
步骤206,对参数值进行归一化处理得到标准参数值。
具体地,标准参数值是指采用统一标准处理后得到的数值。归一化的目的就是使所有的数值采用统一标准进行投影得到标准参数值,且经过归一化处理后,便于后续的计算。在一个实施例中,归一化处理是指将各个参数值投影到0-1之间,具体归一化的方法可以自定义,比如,可以采用sigmoid函 数将各个参数值投影到0-1之间。在另一实施例中,为了避免参数值中出现负数,归一化的处理可以分为两步,首先,获取参数值中的最大值和最小值,将所有的参数值同时减去最小值,这样就将所有的参数值都转换为了大于或等于0的数值,然后将转换后的参数值同时除以一个目标数值,以便将所有的数值都转换为0-1之间的数值,所以目标数值要大于或等于转换后的参数值中的最大值。在一个实施例中,将转换后的参数值中的最大值作为目标数值,转换后的最大值=转换前的最大值-转换前的最小值。通过该归一化的方式可以将所有的参数值都转换为0-1之间的数值,大大简化了后续的训练计算。举个例子,假设获取到的参数值有1000,10,20,-10,其中的最大值为1000,最小值为-10。为了避免负数,首先,同时减去一个最小值-10,相应的参数值变为:1010,20,30,0。然后再除以1010(最大值-最小值),相应的参数值就转换为了1,20/1010,30/1010,0。
步骤207,将各个目标因素对应的标准参数值按照预设的规则组合为目标向量。
具体地,在确定了目标因素对应的标准参数值后,按照预设的组合顺序,将目标因素对应的标准参数值组合为目标向量。每个目标因素对应的标准参数值为目标向量中的一个分量。预先设置目标因素的组合顺序,比如,假设投保单中包含的目标因素有6个,分别为A1,A2,A3,A4,A5和A6,假设预先设置向量的组合顺序为[A4,A3,A6,A1,A2,A5],那么在确定了目标因素对应的标准参数值后,将对应的标准参数值按照预设的组合顺序进行组合得到目标向量。
步骤208,将目标向量作为训练好的核保难度预测模型的输入,获取输出的与投保单对应的核保难度值,核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
其中,将目标因素对应的标准参数值组合为目标向量后,将该目标向量作为训练好的核保难度预测模型的输入向量,然后获取输出的与投保单对应的核保难度值。其中,核保难度预测模型是通过将大量的历史投保单作为训 练样本,采用BP神经网络模型进行训练得到的。BP(Back Propagation)神经网络是一种按误差逆传播算法训练的多层前馈网络,其能够学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。将历史投保单作为训练样本,提取历史投保单中影响核保难度的影响因素,计算得到影响因素对应的标准参数值,将各个影响因素对应的标准参数值按照预设的规则进行组合,组合为输入向量,将该输入向量作为BP神经网络模型的输入样本,将相应的核保难度值作为期望的输出样本进行训练,得到核保难度预测模型。然后将得到的目标向量作为训练好的核保难度预测模型的输入,便可根据训练好的核保难度预测模型计算得到与投保单对应的核保难度值。
上述核保难度预测的方法,通过获取待计算核保难度的投保单,提取投保单中影响核保难度的目标因素,确定与每个目标因素对应的参数值,对参数值进行归一化处理得到标准参数值,将各个目标因素对应的标准参数值按照预设的规则组合为目标向量,将目标向量作为训练好的核保难度预测模型的输入向量,获取输出的与所述投保单对应的核保难度值,其中,核保难度预测模型是采用BP神经网络模型进行训练得到的。上述投保单的核保难度值是通过采用基于BP神经网络模型训练得到的核保难度预测模型进行计算得到的,不再依赖于人为计算,而是基于大量的历史投保单进行预测计算,不但提高了计算的准确性,而且省时省力,有利于后续根据核保难度值进行相应的核保任务分配。
在采用核保难度预测模型进行预测之前,首先需要建立核保难度预测模型。如图3所示,在一个实施例中,建立核保难度预测模型的步骤包括:
步骤210,从数据库中获取历史投保单,确定训练样本集。
具体地,历史投保单是指之前已经核保过的投保单,由于这些投保单之前已经进行了核保,即其相应的核保难度值已经进行了确定,所以可以将这些已经确定过核保难度值的历史投保单作为模型训练的样本,构造训练样本 集。便于后续根据训练样本集中的训练样本对模型进行训练。在一个实施例中,为了使建立的核保难度预测模型更准确,获取到历史投保单后,还需要对历史投保单进行筛选,因为有些投保单具有的参考价值很小,所以可以不考虑这部分投保单。比如,可以根据历史投保单对应的日期进行筛选,由于历史投保单的年份越久对现在的核保难度的预测的参考价值越小,所以可以将年份较久的投保单去掉,比如,只选择距今十年之内的投保单作为训练样本。
步骤212,提取训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值。
具体地,投保单中影响核保难度的影响因素包括投保单位,保额,保费,人数、被保险人年龄、性别、赔付金额、赔付率等,确定了作为样本的历史投保单集后,提取每个历史投保单中影响核保难度值的影响因素,并获取与该历史投保单对应的核保难度值,将提取的历史投保单中影响核保难度值的影响因素和该历史投保单对应的核保难度值进行对应存储,便于后续将其作为训练数据对模型进行训练。
步骤214,确定与每个影响因素对应的参数值,对参数值进行归一化处理得到标准参数值。
具体地,获取每个历史投保单中影响核保难度值的影响因素后,首先,获取与每个影响因素对应的转化规则,将每个影响因素按照对应的转化规则转换为参数值,其中,参数值是指计算机可以处理的数字表示形式。然后为了对参数值统一标准,对得到的参数值进行归一化,得到标准参数值。在一个实施例中,归一化处理是指将各个参数值投影到0-1之间,具体归一化的方法可以自定义,比如,可以采用sigmoid函数将各个参数值投影到0-1之间。在另一实施例中,为了避免参数值中出现负数,归一化的处理可以分为两步,首先,获取参数值中的最大值和最小值,将所有的参数值同时减去最小值,这样就将所有的参数值都转换为了大于或等于0的数值,然后将转换后的参数值同时除以一个目标数值,以便将所有的数值都转换为0-1之间的数值, 所以目标数值要大于或等于转换后的参数值中的最大值。
步骤215,将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量。
具体地,在计算得到每个影响因素对应的标准参数值后,按照预设的组合规则将影响因素对应的标准参数值组合为输入向量,便于后续将该输入向量作为模型的输入样本进行训练。比如,假设历史投保单中包含的影响因素有6个,分别为A1,A2,A3,A4,A5和A6,假设预先设置向量的组合顺序为[A4,A3,A6,A1,A2,A5],那么在确定了影响因素对应的标准参数值后,将对应的标准参数值按照预设的组合顺序进行组合得到目标向量。
步骤216,将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,对BP神经网络模型进行训练得到核保难度预测模型。
具体地,将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,构造训练数据集。将训练数据集中的输入样本和对应的期望的输出样本作为BP神经网络模型的训练数据,然后对BP神经网络模型进行训练得到核保难度预测模型。其中,BP神经网络的学习规则使用的是最速下降法,通过反向传播来不断调整网络的各连接权值,使网络的误差平方和最小。BP神经网络模型的拓扑结构包括输入层、隐含层和输出层。训练得到核保难度预测模型的过程就是确定输入层与隐含层的连接权值、隐含层与输出层的连接权值的过程。具体的过程如下:1)将网络结构进行初始化,即给各连接权值分别赋值,比如,可以从一个区间(-1,1)内随机选取数值进行赋值,设定误差函数,给定计算精度值和最大学习次数;2)随机选择一个输入样本及对应的期望的输出样本,然后将输入样本作为初始模型的输入,计算隐含层各神经元的输入和输出,并计算得到相应的实际输出值;3)根据期望输出和实际输出值,计算误差函数对输出层的各神经元的偏导数;4)根据各神经元的偏导数和隐含层各神经元的输出来修正连接权值。5)利用隐含层各神经元的偏导数和输入层各神经元的输入修正连接权值。6)计算全局 误差。7)判断误差是否满足要求,当误差达到了预设精度或学习次数大于设定的最大次数,则结束。否则,选取下一个学习样本及对应的期望输出,返回到第3)步,进入到下一轮学习。
如图4所示,在一个实施例中,从数据库中获取历史投保单,确定训练样本集的步骤210包括:
步骤210A,从数据库中获取历史投保单,获取历史投保单所对应的投保年份。
具体地,历史投保单是指已经确定过核保难度值的投保单,数据库中存储有历史投保单,所以可以从数据库中提取历史投保单,同时获取每个历史投保单所对应的投保年份(即对应的投保日期),便于后续根据投保年份进行有效历史投保单的筛选。
步骤210B,根据投保年份将历史投保单进行分类。
具体地,获取到历史投保单所对应的投保年份后,根据投保年份进行分类,可以将不同年份的分别作为一类,也可以将多个年份的划分为一类。比如,可以将2000年之前的作为一类,2000-2005之间的作为一类,将2005-2010之间的作为一类,将2010-2015之间的作为一类,2015年以后的作为一类。
步骤210C,对每一类历史投保单进行筛选得到有效历史投保单。
具体地,为了使得建立的模型更精确,那么相应的对模型进行训练的样本需要筛选的越准确。为了使得样本挑选的更有参考价值,需要根据年份从每一类历史投保单中筛选出参考价值比较大的历史投保单。在一个实施例中,首先,根据投保年份确定筛选的比例,比如,距今投保年限越久,相应的挑选比例可以设置的越小,比如,如果是十年前的可以只提取60%的历史投保单作为有效历史投保单,如果是五年前到十年前之间的,可以提取80%的历史投保单作为有效投保单,如果是三年前到五年前之间的,可以提取90%的历史投保单作为有效投保单,如果是距今三年内的,那么就可以提取95%的历史投保单作为有效投保单。具体筛选的方式可以自定义,比如,可以将每一类历史投保单按照对应的核保难度值从小到大进行排序,然后剔除过大或 过小的核保难度值对应历史投保单。
步骤210D,将每一类有效历史投保单进行聚类,得到训练样本集。
具体地,挑选出每一类有效历史投保单后,将各个类的有效投保单进行聚类,得到训练样本集,其中,聚类是指将每一类有效历史投保单组合在一起,构成一个有效历史投保单集合即训练样本集。后续采用训练样本集中的历史投保单基于BP神经网络模型进行训练得到核保难度预测模型。
如图5所示,在一个实施例中,建立核保难度预测模型的步骤还包括:
步骤218,获取检测样本集。
具体地,检测样本集用于衡量训练得到的核保难度预测模型的准确度,为了能够对训练得到的核保难度预测模型进行更准确的验证,在采用训练样本进行训练得到核保难度预测模型之后,进一步对训练得到的核保难度模型进行检测,检测该模型针对于检测样本是否达到了相应的要求,检测合格后,将确定合格的模型作为训练好的核保难度预测模型。训练样本集和检测样本集都是历史投保单组成的集合。通过检测样本校验过的核保难度预测模型能够更准确对投保单的核保难度值进行预测。在一个实施例中,获取到历史投保单后,将其中的一部分作为训练样本集,另外一部分作为检测样本集。比如,80%的历史投保单作为训练样本集,将剩下的20%作为相应的检测样本集。
步骤220,将检测样本集中的输入样本作为训练得到的核保难度预测模型的输入,获取相应的输出值。
具体地,首先,获取检测样本集中每个历史投保单对应的影响核保难度的影响因素,将影响因素按照预设的转化规则转换得到与影响因素对应的参数值,然后对参数值进行归一化处理得到标准参数值,之后,将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量,将该输入向量作为训练得到的核保难度预测模型的输入样本,获取输出的预测得到的输出值。后续通过根据实际输出值和相应的期望输出值计算相应的误差范围。
步骤222,判断输出值与标准输出值的误差是否在预设的范围内,若是,则进入步骤224,如否,则进入步骤225。
其中,标准输出值是指期望的输出值,即历史投保单对应的实际的核保难度值。通过核保难度预测模型预测得到的核保难度值和实际的核保难度值之间的误差来衡量该训练得到的核保难度预测模型是否符合要求。在一个实施例中,采用绝对偏差的均值来衡量是否符合标准,具体地,绝对偏差的均值的计算公式如下:
Figure PCTCN2017104654-appb-000001
其中,N代表检测样本集中样本的数量,pi是指历史投保单对应的实际的核保难度值,
Figure PCTCN2017104654-appb-000002
是指预测得到的历史投保单对应的核保难度值。在另一个实施例中,还需要考虑绝对偏差的方差,具体计算公式如下:
Figure PCTCN2017104654-appb-000003
首先,计算得到偏差的均值,均值越小说明偏移程度越小,在均值相当的情况下,方差越低说明评估的误差越小。可以预先设置均值和方差的权重,一般均值的权重比较大,方差的权重相对比较小。在计算得到均值和方差后,加权求和计算得到误差值,误差值与可信度成反相关。预先设置最大误差阈值,当计算得到的误差大于最大误差阈值时,说明该模型不可靠,需要重新进行训练,如果不大于最大误差阈值,说明该模型比较可靠,可以用来预测新的投保单的核保难度值。
步骤224,将训练得到的核保难度预测模型所对应的连接权值作为训练好的核保难度预测模型的连接权值。
具体地,连接权值包括输入层和隐含层之间的连接权值以及隐含层与输出层之间的连接权值。BP神经网络模型的学习方式是通过在外界输入样本的刺激下不断改变网络的连接权值。确定核保难度预测模型的过程就是确定最终连接权值的过程。所以如果计算得到的误差在预设范围内,就可以将训练 得到的核保难度预测模型作为训练好的核保难度预测模型。
步骤225,更改连接权值采用训练样本重新训练核保难度预测模型,并重复执行步骤218-222。
具体地,如果计算得到的误差不在预设范围内,说明目前训练得到的核保难度预测模型不符合要求,需要重新改变连接权值进行训练,训练完成后,再采用同样的方式进行检测,直到检测合格。在另一个实施例中,为了不断提高核保难度预测模型的精确度,建立知识库,首先,将训练样本集加入知识库中,采用知识库中的样本进行训练得到模型后,利用模型对投保单进行预测后,将相应的数据保存到知识库中,从而进一步丰富知识库,之后利用知识库中数据再重新训练建立新的模型,通过实时更新知识库和模型有利于建立更加精确的核保难度预测模型。
在一个实施例中,所述方法还包括:根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级;根据所述职能等级将所述投保单进行分配。
在本实施例中,在确定了投保单的核保难度值后,就可以根据预先设置的职能等级与核保难度值的对应关系确定相应的职能等级,继而根据确定的职能等级进行相应的分配。其中,职能等级是根据核保人员的业务技能水平来划分的,业务技能水平高的能够处理核保难度高的核保任务,业务技能水平低的处理核保难度低的核保任务,根据职能等级进行分配,有利于提高相应的工作效率。
如图6所示,在一个实施例中,提出了一种核保难度预测的装置,该装置包括:
第一提取模块602,用于获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;
参数值确定模块604,用于确定与每个目标因素对应的参数值;
第一处理模块606,用于对所述参数值进行归一化处理得到标准参数值;
第一组合模块607,用于将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;
预测模块608,用于将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
如图7所示,在一个实施例中,上述核保难度预测的装置还包括:
样本集确定模块610,用于从数据库中获取历史投保单,确定训练样本集;
第二提取模块612,用于提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值;
第二处理模块614,用于确定与每个影响因素对应的参数值,对所述参数值进行归一化处理得到标准参数值;
第二组合模块615,用于将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量;
训练模块616,用于将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,采用BP神经网络模型进行训练得到核保难度预测模型。
在一个实施例中,所述确定模块还用于从知识库中获取历史投保单,获取历史投保单所对应的投保年份;根据投保年份将历史投保单进行分类;对每一类历史投保单进行筛选得到有效历史投保单;将每一类有效历史投保单进行聚类,得到训练样本集。
如图8所示,在一个实施例中,上述核保难度预测的装置还包括:
获取模块618,获取检测样本集;
输出模块619,用于将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入,获取相应的输出值;
判断模块620,用于判断所述输出值与所述标准输出值的误差是否在预设的范围内,若是,则将所述训练得到的核保难度预测模型作为训练好的核 保难度预测模型。
如图9所示,在一个实施例中,上述核保难度预测的装置还包括:
分配模块609,用于根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级,根据所述职能等级将所述投保单进行分配。
上述核保难度预测的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。其中,网络接口可以是以太网卡或无线网卡等。上述各模块可以硬件形式内嵌于或独立于服务器中的处理器中,也可以以软件形式存储于服务器中的存储器中,以便于处理器调用执行以上各个模块对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。
上述核保难度预测的装置可以实现为一种计算机可读指令的形式,计算机可读指令可以在如图1所示的计算机设备上运行。
本申请实施例提出了一种计算机设备,计算机设备的内部结构可对应于如图1所示的结构,即该计算机设备既可以是服务器也可以是终端,其包括一系列存储于存储器上的计算机可读指令,当该计算机可读指令被处理器执行时,可以实现本申请各实施例提出的控制承保处理的方法。在一个实施例中,计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现以下步骤:获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;确定与每个目标因素对应的参数值;对所述参数值进行归一化处理得到标准参数值;将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
在一个实施例中,计算机可读指令使得处理器在执行获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素的之前,还执行以下步骤:从数据库中获取历史投保单,确定训练样本集;提取所述训练样本 集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值;确定与每个影响因素对应的参数值,对所述参数值进行归一化处理得到标准参数值;将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量;将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,采用BP神经网络模型进行训练得到核保难度预测模型。
在一个实施例中,所述从数据库中获取历史投保单,确定训练样本集包括:从数据库中获取历史投保单,获取历史投保单所对应的投保年份;根据投保年份将历史投保单进行分类;对每一类历史投保单进行筛选得到有效历史投保单;将每一类有效历史投保单进行聚类,得到训练样本集。
在一个实施例中,计算机可读指令使得处理器在执行将所述历史投保单中影响核保难度的因素所对应的标准参数值作为样本输入向量,将相应的核保难度值作为样本期望的输出值,采用BP神经网络模型进行训练得到核保难度预测模型之后,还执行以下步骤:获取检测样本集;将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入,获取相应的输出值;判断所述输出值与所述标准输出值的误差是否在预设的范围内;若是,则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。
在一个实施例中,计算机可读指令可使得处理器执行以下步骤:根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级;根据所述职能等级将所述投保单进行分配。
一种计算机可读存储介质,其上存储有计算机可读指令,该程序被处理器执行时实现以下步骤:获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;确定与每个目标因素对应的参数值;对所述参数值进行归一化处理得到标准参数值;将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测 模型是基于历史投保单采用BP神经网络模型进行训练得到的。
在一个实施例中,计算机可读指令使得处理器执行获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素的之前,还执行以下步骤:从数据库中获取历史投保单,确定训练样本集;提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值;确定与每个影响因素对应的参数值,对所述参数值进行归一化处理得到标准参数值;将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量;将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,采用BP神经网络模型进行训练得到核保难度预测模型。
在一个实施例中,所述从数据库中获取历史投保单,确定训练样本集包括:
从数据库中获取历史投保单,获取历史投保单所对应的投保年份;根据投保年份将历史投保单进行分类;对每一类历史投保单进行筛选得到有效历史投保单;将每一类有效历史投保单进行聚类,得到训练样本集。
在一个实施例中,计算机可读指令使得处理器执行将所述历史投保单中影响核保难度的因素所对应的标准参数值作为样本输入向量,将相应的核保难度值作为样本期望的输出值,采用BP神经网络模型进行训练得到核保难度预测模型之后,还执行以下步骤:获取检测样本集;将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入,获取相应的输出值;判断所述输出值与所述标准输出值的误差是否在预设的范围内;若是,则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。
在一个实施例中,计算机可读指令可使得处理器还用于执行以下步骤:根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级;根据所述职能等级将所述投保单进行分配。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指 令可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (20)

  1. 一种核保难度预测的方法,包括:
    获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;
    确定与每个所述目标因素对应的参数值;
    对所述参数值进行归一化处理得到标准参数值;
    将各个所述目标因素对应的所述标准参数值按照预设的规则组合为目标向量;及
    将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
  2. 根据权利要求1所述的方法,其特征在于,在所述获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素之前还包括:
    从数据库中获取历史投保单,确定训练样本集;
    提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值;
    确定与每个所述影响因素对应的参数值,对所述参数值进行归一化处理得到标准参数值;
    将每个所述历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量;
    将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,对BP神经网络模型进行训练得到核保难度预测模型。
  3. 根据权利要求2所述的方法,其特征在于,所述从数据库中获取历史投保单,确定训练样本集包括:
    从数据库中获取历史投保单,获取所述历史投保单所对应的投保年份;
    根据所述投保年份将历史投保单进行分类;
    对每一类历史投保单进行筛选得到有效历史投保单;
    将每一类有效历史投保单进行聚类,得到训练样本集。
  4. 根据权利要求2所述的方法,其特征在于,在所述将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,采用BP神经网络模型进行训练得到核保难度预测模型之后还包括:
    获取检测样本集;
    将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入,获取相应的输出值;
    判断所述输出值与所述标准输出值的误差是否在预设的范围内;
    若是,则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。
  5. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级;
    根据所述职能等级将所述投保单进行分配。
  6. 一种核保难度预测的装置,包括:
    第一提取模块,用于获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;
    参数值确定模块,用于确定与每个所述目标因素对应的参数值;
    第一处理模块,用于对所述参数值进行归一化处理得到标准参数值;
    第一组合模块,用于将各个所述目标因素对应的所述标准参数值按照预设的规则组合为目标向量;及
    预测模块,用于将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
  7. 根据权利要求6所述的装置,其特征在于,所述装置还包括:
    样本集确定模块,用于从数据库中获取历史投保单,确定训练样本集;
    第二提取模块,用于提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值;
    第二处理模块,用于确定与每个所述影响因素对应的参数值,对所述参数值进行归一化处理得到标准参数值;
    第二组合模块,用于将每个历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量;
    训练模块,用于将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,对BP神经网络模型进行训练得到核保难度预测模型。
  8. 根据权利要求7所述的装置,其特征在于,所述确定模块还用于从数据库中获取历史投保单,获取所述历史投保单所对应的投保年份,根据所述投保年份将历史投保单进行分类,对每一类历史投保单进行筛选得到有效历史投保单,将每一类有效历史投保单进行聚类,得到训练样本集。
  9. 根据权利要求7所述的装置,其特征在于,所述装置还包括:
    获取模块,获取检测样本集;
    输出模块,用于将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入,获取相应的输出值;
    判断模块,用于判断所述输出值与所述标准输出值的误差是否在预设的范围内,若是,则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。
  10. 根据权利要求6所述的装置,其特征在于,所述装置还包括:
    分配模块,用于根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级,根据所述职能等级将所述投保单进行分配。
  11. 一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:
    获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;
    确定与每个目标因素对应的参数值;
    对所述参数值进行归一化处理得到标准参数值;
    将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;及
    将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
  12. 根据权利要求11所述的计算机设备,其特征在于,所述在所述获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素之前,所述计算机可读指令还使得处理器执行以下步骤:
    从数据库中获取历史投保单,确定训练样本集;
    提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值;
    确定与每个所述影响因素对应的参数值,对所述参数值进行归一化处理得到标准参数值;
    将每个所述历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量;
    将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,对BP神经网络模型进行训练得到核保难度预测模型。
  13. 根据权利要求12所述的计算机设备,其特征在于,所述从数据库中获取历史投保单,确定训练样本集包括:
    从数据库中获取历史投保单,获取所述历史投保单所对应的投保年份;
    根据所述投保年份将历史投保单进行分类;
    对每一类历史投保单进行筛选得到有效历史投保单;
    将每一类有效历史投保单进行聚类,得到训练样本集。
  14. 根据权利要求12所述的计算机设备,其特征在于,在所述将每个历 史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,采用BP神经网络模型进行训练得到核保难度预测模型之后,所述计算机可读指令还使得处理器执行以下步骤:
    获取检测样本集;
    将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入,获取相应的输出值;
    判断所述输出值与所述标准输出值的误差是否在预设的范围内;
    若是,则将所述训练得到的核保难度预测模型作为训练好的核保难度预测模型。
  15. 根据权利要求11所述的计算机设备,其特征在于,所述计算机可读指令还使得处理器执行以下步骤:
    根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级;
    根据所述职能等级将所述投保单进行分配。
  16. 一个或多个存储有计算机可读指令的非易失性可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行以下步骤:
    获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素;
    确定与每个目标因素对应的参数值;
    对所述参数值进行归一化处理得到标准参数值;
    将各个目标因素对应的标准参数值按照预设的规则组合为目标向量;及
    将所述目标向量作为训练好的核保难度预测模型的输入,获取输出的与所述投保单对应的核保难度值,所述核保难度预测模型是基于历史投保单采用BP神经网络模型进行训练得到的。
  17. 根据权利要求16所述的存储介质,其特征在于,所述在所述获取待计算核保难度的投保单,提取所述投保单中影响核保难度的目标因素之前,所述计算机可读指令还使得处理器执行以下步骤:
    从数据库中获取历史投保单,确定训练样本集;
    提取所述训练样本集中每个历史投保单对应的影响核保难度的影响因素以及相应的核保难度值;
    确定与每个所述影响因素对应的参数值,对所述参数值进行归一化处理得到标准参数值;
    将每个所述历史投保单中各个影响因素对应的标准参数值按照预设的规则组合为输入向量;
    将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,对BP神经网络模型进行训练得到核保难度预测模型。
  18. 根据权利要求17所述的存储介质,其特征在于,所述从数据库中获取历史投保单,确定训练样本集包括:
    从数据库中获取历史投保单,获取所述历史投保单所对应的投保年份;
    根据所述投保年份将历史投保单进行分类;
    对每一类历史投保单进行筛选得到有效历史投保单;
    将每一类有效历史投保单进行聚类,得到训练样本集。
  19. 根据权利要求17所述的存储介质,其特征在于,在所述将每个历史投保单对应的输入向量作为输入样本,将相应的核保难度值作为期望的输出样本,采用BP神经网络模型进行训练得到核保难度预测模型之后,所述计算机可读指令还使得处理器执行以下步骤:
    获取检测样本集;
    将所述检测样本集中的输入样本作为所述训练得到的核保难度预测模型的输入,获取相应的输出值;
    判断所述输出值与所述标准输出值的误差是否在预设的范围内;
    若是,则将所述训练得到的核保难度预测模型作为训练好的核保难度预 测模型。
  20. 根据权利要求16所述的存储介质,其特征在于,所述计算机可读指令还使得处理器执行以下步骤:
    根据预设的核保难度值与职能等级之间的关系获取与所述核保难度值对应的职能等级;
    根据所述职能等级将所述投保单进行分配。
PCT/CN2017/104654 2017-08-28 2017-09-29 核保难度预测的方法、装置、计算机设备及存储介质 WO2019041439A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710752024.6 2017-08-28
CN201710752024.6A CN107633323A (zh) 2017-08-28 2017-08-28 核保难度预测的方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
WO2019041439A1 true WO2019041439A1 (zh) 2019-03-07

Family

ID=61101664

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/104654 WO2019041439A1 (zh) 2017-08-28 2017-09-29 核保难度预测的方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN107633323A (zh)
WO (1) WO2019041439A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109542923B (zh) * 2018-05-28 2023-06-16 深圳平安医疗健康科技服务有限公司 核保方法、装置、计算机设备和存储介质
CN109522400B (zh) * 2018-05-28 2023-07-07 深圳平安医疗健康科技服务有限公司 核保方法、装置、计算机设备和存储介质
CN109377388B (zh) * 2018-09-13 2023-08-18 深圳平安医疗健康科技服务有限公司 医保投保方法、装置、计算机设备和存储介质
CN110968341B (zh) * 2018-09-30 2024-01-19 上海汽车集团股份有限公司 一种设置空调参数的方法和装置
CN109636227A (zh) * 2018-12-21 2019-04-16 拉扎斯网络科技(上海)有限公司 任务分配方法、装置、电子设备及计算机可读存储介质
CN109935338A (zh) * 2019-03-07 2019-06-25 平安科技(深圳)有限公司 基于机器学习的数据预测处理方法、装置和计算机设备
CN110222925B (zh) * 2019-04-24 2022-04-08 深圳证券交易所 绩效量化考核方法、装置及计算机可读存储介质
CN110084438A (zh) * 2019-05-09 2019-08-02 上汽安吉物流股份有限公司 订单的预测方法及装置、物流系统以及计算机可读介质
CN110880149A (zh) * 2019-11-29 2020-03-13 上海商汤智能科技有限公司 信息处理方法及装置、电子设备和存储介质
CN111461897A (zh) * 2020-02-28 2020-07-28 上海商汤智能科技有限公司 一种获取核保结果的方法及相关装置
CN111666709B (zh) * 2020-04-26 2022-11-04 中国石油天然气股份有限公司 输气管道的管输参数调整方法及装置
CN111626870B (zh) * 2020-05-25 2023-07-21 泰康保险集团股份有限公司 清洁体检件的核保数据处理方法、装置及设备
CN111784303B (zh) * 2020-07-06 2023-08-22 泰康保险集团股份有限公司 核保信息处理方法、装置、计算机存储介质及电子设备
CN112184301A (zh) * 2020-09-25 2021-01-05 杭州安恒信息技术股份有限公司 一种数据预测方法、装置、设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040220839A1 (en) * 2003-04-30 2004-11-04 Ge Financial Assurance Holdings, Inc. System and process for dominance classification for insurance underwriting suitable for use by an automated system
US20060047540A1 (en) * 2004-09-01 2006-03-02 Hutten Bruce V System and method for underwriting
CN102436629A (zh) * 2011-05-18 2012-05-02 深圳市航天星网通讯有限公司 基于obd技术为汽车提供车险核保方法
CN103456163A (zh) * 2012-06-04 2013-12-18 北京市市政工程设计研究总院 城市快速路互通立交通行能力和运行状态判别方法与系统
CN106682743A (zh) * 2016-12-15 2017-05-17 南京南瑞信息通信科技有限公司 一种电力通信现场运维工单调度管理方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820870A (zh) * 2015-04-30 2015-08-05 中国矿业大学 一种胶结充填材料力学性能预测方法
CN105373849A (zh) * 2015-10-22 2016-03-02 华北电力大学(保定) 光伏电池组件温度的分步预测方法
CN105259331B (zh) * 2015-11-06 2017-06-30 三峡大学 一种节理岩体单轴强度预测方法
CN106934720B (zh) * 2017-01-24 2021-11-16 久隆财产保险有限公司 基于物联网的设备保险智能定价方法与系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040220839A1 (en) * 2003-04-30 2004-11-04 Ge Financial Assurance Holdings, Inc. System and process for dominance classification for insurance underwriting suitable for use by an automated system
US20060047540A1 (en) * 2004-09-01 2006-03-02 Hutten Bruce V System and method for underwriting
CN102436629A (zh) * 2011-05-18 2012-05-02 深圳市航天星网通讯有限公司 基于obd技术为汽车提供车险核保方法
CN103456163A (zh) * 2012-06-04 2013-12-18 北京市市政工程设计研究总院 城市快速路互通立交通行能力和运行状态判别方法与系统
CN106682743A (zh) * 2016-12-15 2017-05-17 南京南瑞信息通信科技有限公司 一种电力通信现场运维工单调度管理方法及系统

Also Published As

Publication number Publication date
CN107633323A (zh) 2018-01-26

Similar Documents

Publication Publication Date Title
WO2019041439A1 (zh) 核保难度预测的方法、装置、计算机设备及存储介质
CN110674880B (zh) 用于知识蒸馏的网络训练方法、装置、介质与电子设备
US20230325724A1 (en) Updating attribute data structures to indicate trends in attribute data provided to automated modelling systems
CN109583332B (zh) 人脸识别方法、人脸识别系统、介质及电子设备
CN104346372B (zh) 用于评估预测模型的方法和装置
CN109447461B (zh) 用户信用评估方法及装置、电子设备、存储介质
CN109492858B (zh) 基于机器学习的员工绩效预测方法及装置、设备、介质
US20190180379A1 (en) Life insurance system with fully automated underwriting process for real-time underwriting and risk adjustment, and corresponding method thereof
WO2018112783A1 (zh) 图像识别方法及装置
TW201947463A (zh) 模型測試的方法及裝置
CN109376766B (zh) 一种画像预测分类方法、装置及设备
JP7140410B2 (ja) 予測システム、予測方法および予測プログラム
KR102038237B1 (ko) 신용점수 모델 훈련 방법,신용 점수 계산 방법,장치 및 서버
CN111340226B (zh) 一种量化神经网络模型的训练及测试方法、装置及设备
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
CN113379059B (zh) 用于量子数据分类的模型训练方法以及量子数据分类方法
CN108228684A (zh) 聚类模型的训练方法、装置、电子设备和计算机存储介质
CN111797320A (zh) 数据处理方法、装置、设备及存储介质
CN111179055B (zh) 授信额度调整方法、装置和电子设备
CN111181757B (zh) 信息安全风险预测方法、装置以及计算设备、存储介质
CN114118570A (zh) 业务数据预测方法及装置、电子设备和存储介质
CN113762401A (zh) 自适应分类任务阈值调整方法、装置、设备及存储介质
CN115546218B (zh) 置信度阈值确定方法和装置、电子设备和存储介质
CN115330142B (zh) 联合能力模型的训练方法、能力需求匹配方法和装置
CN116415839B (zh) 一种基于可解释机器学习的众包任务分配方法及系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17923213

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 23/09/2020)

122 Ep: pct application non-entry in european phase

Ref document number: 17923213

Country of ref document: EP

Kind code of ref document: A1