CN106408423A - 用于风险评估的方法、系统及构建风险评估系统的方法 - Google Patents
用于风险评估的方法、系统及构建风险评估系统的方法 Download PDFInfo
- Publication number
- CN106408423A CN106408423A CN201611066880.8A CN201611066880A CN106408423A CN 106408423 A CN106408423 A CN 106408423A CN 201611066880 A CN201611066880 A CN 201611066880A CN 106408423 A CN106408423 A CN 106408423A
- Authority
- CN
- China
- Prior art keywords
- scorecard
- weight
- model
- sample
- scorecard model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开一种用于风险评估的方法、系统及构建风险评估系统的方法。该方法包括:基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重;根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数;利用所述绝对分数计算所述目标对象出现预定事件的相对分数。通过多个评分卡模型进行风险评分,避免了单一的评分卡模型造成的风险评估不精准的问题,提高了风险评估的精准度。
Description
技术领域
本发明涉及计算机科学技术领域,具体而言,涉及一种用于风险评估的方法、系统及构建风险评估系统的方法。
背景技术
随着社会经济的不断发展,人们越来越意识到保险的重要性。保险是指投保人根据合同约定,向保险人支付保险费,保险人对于合同约定的可能发生的风险所造成的损失承担赔偿保险金的行为。因此,保险人对于保险业务的风险评估极为重要。
现有技术中的核保核赔等保险业务审核及风险控制,通常是利用既往经验,通过设定包括地区、人群、客户年龄、保险金额、保险费等维度的组合判断标准与规则,进行日常投保、理赔业务的自动审核和人工审核的筛选。
因此,需要一种新的用于风险评估的方法、系统及构建风险评估系统的方法。
在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种用于用于风险评估的方法、系统及构建风险评估系统的方法,能够通过多个评分卡模型进行风险评分,提高了风险评估的精准度。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的一方面,提供一种用于风险评估的方法,所述方法包括:
基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重;
根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数;
利用所述绝对分数计算所述目标对象出现预定事件的相对分数。
在本发明的一种示例性实施例中,所述基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重,包括:
重复执行以下操作,直到构建的多个评分卡模型的组合模型的AUC系数满足预设条件:
根据所述大数据样本的权重,通过logistic算法构建当前权重对应的评分卡模型;
根据所述评分卡模型计算每个样本出现预定事件的概率;
根据所述概率以及所述每个样本出现预定事件的实际值,更新所述大数据样本的权重,并获取所述评分卡模型对应的评分卡权重。
在本发明的一种示例性实施例中,所述方法还包括:预设所述大数据样本的初始权重。
在本发明的一种示例性实施例中,所述获取所述评分卡模型的评分卡权重,包括:
根据所述每个样本出现预定事件的概率获取每个样本出现预定事件的预测值;
根据所述预测值以及所述每个样本出现预定事件的实际值,计算所述评分卡模型的错误率;
根据所述评分卡模型的错误率获取所述评分卡模型的评分卡权重。
在本发明的一种示例性实施例中,所述根据所述评分卡模型的错误率获取所述评分卡模型的评分卡权重,包括:
通过以下公式获取所述评分卡模型的评分卡权重:
其中,αm表示第m个评分卡模型的评分卡权重,εm表示第m个评分卡模型的错误率,m为大于或者等于1的整数。
在本发明的一种示例性实施例中,所述预设条件包括:所述多个评分卡模型的组合模型的AUC系数,与下一次更新所述大数据样本的权重构建的评分卡模型所组成的多个评分卡模型的组合模型的AUC系数的差值在预设范围之内。
在本发明的一种示例性实施例中,所述根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数,包括:
通过以下公式计算所述目标对象出现预定事件的绝对分数:
其中,Sm,j表示目标对象出现预定事件的绝对分数,αm表示第m个评分卡模型的评分卡权重,Pm,j表示目标对象在第m个评分卡出现预定事件的概率。
在本发明的一种示例性实施例中,所述利用所述绝对分数计算所述目标对象出现预定事件的的相对分数,还包括:
在预设的映射表中查找所述绝对分数,获取所述绝对分数对应的所述目标对象出现预定事件的的相对分数。
根据本发明的另一方面,提供一种用于构建风险评估系统的方法,所述方法包括:
重复执行以下操作,直到构建的多个评分卡模型的组合模型的AUC系数满足预设条件,利用所述多个评分卡模型的组合模型构建风险评估系统:
根据所述大数据样本的权重,通过logistic算法构建当前权重对应的评分卡模型;
根据所述评分卡模型计算每个样本出现预定事件的概率;
根据所述概率以及所述每个样本出现预定事件的实际值,更新所述大数据样本的权重,并获取所述评分卡模型对应的评分卡权重。
在本发明的一种示例性实施例中,所述方法还包括:预设所述大数据样本的初始权重。
在本发明的一种示例性实施例中,所述获取所述评分卡模型的评分卡权重,包括:
根据所述预测值以及所述每个样本出现预定事件的实际值,计算所述评分卡模型的错误率;
根据所述评分卡模型的错误率获取所述评分卡模型的评分卡权重。
在本发明的一种示例性实施例中,所述根据所述评分卡模型的错误率获取所述评分卡模型的评分卡权重,包括:
通过以下公式获取所述评分卡模型的评分卡权重:
其中,αm表示第m个评分卡模型的评分卡权重,εm表示第m个评分卡模型的错误率,m为大于或者等于1的整数。
在本发明的一种示例性实施例中,所述预设条件包括:所述多个评分卡模型的组合模型的AUC系数,与下一次更新所述大数据样本的权重构建的评分卡模型所组成的多个评分卡模型的组合模型的AUC系数的差值在预设范围之内。
根据本发明的另一方面,提供一种用于风险评估的系统,所述系统包括:
构建模块,用于基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重;
第一计算模块,用于根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数;
第二计算模块,用于利用所述绝对分数计算所述目标对象出现预定事件的相对分数。
在本发明的一种示例性实施例中,所述构建模块,配置为用于重复执行以下操作,直到构建的多个评分卡模型的组合模型的AUC系数满足预设条件:
根据所述大数据样本的权重,通过logistic算法构建当前权重对应的评分卡模型;
根据所述评分卡模型计算每个样本出现预定事件的概率;
根据所述概率以及所述每个样本出现预定事件的实际值,更新所述大数据样本的权重,并获取所述评分卡模型对应的评分卡权重。
本发明实施例中,基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重;根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数;利用所述绝对分数计算所述目标对象出现预定事件的相对分数。通过多个评分卡模型进行风险评分,避免了单一的评分卡模型造成的风险评估不精准的问题,提高了风险评估的精准度。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。
图1是根据一示例性实施例示出的用于风险评估的方法的流程图。
图2是根据一示例性实施例示出的ROC曲线的示意图。
图3是根据一示例性实施例示出的用于构建风险评估系统的方法的流程图。
图4是根据一示例性实施例示出的一种用于风险评估的系统的结构图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
需要说明的是,现有技术的技术方案中,在风险评估的精准程度和对经验数据的深度挖掘方面仍有较大的改善空间,而且评分系统在模型构建的过程中如果样本信息量很少,造成风险评估不精准。
图1是根据一示例性实施例示出的用于风险评估的方法的流程图。
如图1所示,在S102中,基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重。
需要说明的是,本发明实施例中提供的用于风险评估的方法可以用于多种场景,例如:对保险业务进行风险评估,对信用进行信用评估,对安全系数进行评估,对电话接通情况进行评估等。本发明实施例中以对保险业务进行风险评估为例,则预定事件可以为出险,出现概率可以为出险概率。
根据示例实施例,可以重复执行以下操作,直到构建的多个评分卡模型CARD的组合模型的AUC系数满足预设条件,获取多个评分卡模型CARD。
需要说明的是,重复执行一次S1021-S1023,就是一次循环迭代。根据示例实施例,需要为所有大数据样本预设初始权重,例如,大数据样本的总数为N,实际没有出险的样本的个数为a,实际出险的样本个数为b为例,预设实际不会出险的样本的初始权重为1,实际出险的样本的初始权重设置为a/b。从而使实际出险和实际不出险的总体权重相等。
S1021、根据大数据样本的权重,通过logistic算法构建当前权重对应的评分卡模型。
需要说明的是,可以通过logistic利用极大似然估计得到当前大数据样本的权重对应的评分卡模型,例如,在SAS里可以通过proc logistic过程步得到。
评分卡模型给出了各维度因素的估计值,例如,以保险业务的出险概率为例,评分卡模型可以表示维度因素(如,性别和婚姻状况)的估计值,如表1所示,为本发明实施例提供的一种评分卡模型。
维度因素 | 观测值 | 估计值 |
截距 | 0 | |
性别 | 男 | 1 |
性别 | 女 | 0 |
婚姻状况 | 已婚 | 1 |
婚姻状况 | 未婚 | 0 |
表1
需要说明的是,表1所示的评分卡模型中的观测值是指样本的每个维度因素的实际值,可以通过样本直接得到。
对于每个样本,通过评分卡模型,可以查找其各维度因素的观测值对应的估计值。
S1022、根据该评分卡模型计算每个样本出现预定事件的概率。
可以通过如下公式计算每个样本出险预定事件的概率。
Pm,j表示根据第m个评分卡模型得到的第j个样本的出险概率,βm0为第m个评分卡模型的截距(intercept),xi,j(i=0,1,2…)为第j个样本的第i个维度因素对应的观测值,βm,i(i=0,1,2…)为第j个样本的第m个评分卡中第i个维度因素对应的估计值。
例如,以表1的评分卡模型为例,假设样本的性别为男,而且未婚,则出险概率计算为
这里β0对应截距取值为0,由于第1个维度因素x1对应的取值为男,表1中β1对应的取值为1,由于第2个维度因素x2对应的取值为未婚,表1中β2对应的取值为0。
S1023、根据上述概率以及每个样本出现预定事件的实际值,更新大数据样本的权重,并获取上述评分卡模型对应的评分卡权重。
当计算出每个评分卡模型的出险概率后,根据每个样本出现预定事件的概率获取每个样本出现预定事件的预测值。
评分卡模型可以看作一个分类器,传统的2分类模型(譬如决策树),得出的预测结果是样本是否会出现预定事件(也就是结果只有0或1两种情况)。本发明实施例中,通过logistic算法构建的每个评分卡模型出现预定事件的概率位于0至1之间。此时,通过设定概率阈值,将计算出的概率大于该阈值的样本,预测会出现预定事件。将计算出的概率小于或者等于该阈值的样本,预测不会出现预定事件。
例如,本发明上述实施例中,由于实际没有出险的样本的个数为a,实际出险的样本个数为b,预设实际不会出险的样本的初始权重为1,实际出险的样本的初始权重设置为a/b。从而使实际出险和实际不出险的总体权重都为a,因此可以选取预设概率阈值为0.5。
进一步的,将计算出的每个样本的出险概率与0.5比较,大于0.5的样本为预测为会出险的样本,设置预测值为1。小于或者等于0.5的样本为预测不会出险的样本,设置预测值为0。
对应设置每个样本是否出险的实际值(对于实际出险的样本,设置实际值为1,对于实际没有出险的样本,设置实际值为0)。
根据每个样本的预测值以及实际值,更新样本的权重可以包括多种方式,本发明实施例中示例性提供一种方式。
根据每个样本的预测值以及实际值,计算该评分卡模型的错误率,根据该评分卡模型的错误率获取所述评分卡模型的评分卡权重。
计算评分卡模型的错误率可以通过如下公式:
εm表示第m个评分卡模型的错误率,yj为第j个样本的实际值,为第j个样本的第m个评分卡模型的预测值,ωm,j表示第j个样本的第m个评分卡模型对应的权重,N表示样本的总数。
进一步的,通过以下公式获取该评分卡模型的评分卡权重:
其中,αm表示第m个评分卡模型的评分卡权重,εm表示第m个评分卡模型的错误率,m为大于或者等于1的整数。
更进一步的,可以根据如下公式更新样本的权重。
其中,
ωm+1,j表示第j个样本更新的权重,αm表示第m个评分卡模型的评分卡权重。如果第j个样本的第m个评分卡模型的预测值与该样本的实际值相同,则ym(Xj)等于1。如果第j个样本的第m个评分卡模型的预测值与该样本的实际值不相同,则ym(Xj)等于-1。通过公式(4)可以增加训练错误的样本权重,减少训练正确的样本权重,从而加快了获取样本的多个评分卡模型的速率。
yj为第j个样本的实际值,为第j个样本的第m个评分卡模型获取的预测值,ωm,j表示第j个样本的第m个评分卡模型对应的权重,N表示样本的总数。
需要说明的是,根据概率以及每个样本出现预定事件的实际值,获取该评分卡模型对应的评分卡权重的方法请参见上文,此处不再赘述。
通过重复执行S1021-S1023,获取到多个评分卡模型,以及每个评分卡模型对应的评分卡权重。当构建的多个评分卡模型的组合模型的AUC系数满足预设条件,跳出上述循环迭代。
该预设条件包括:上述多个评分卡模型的组合模型的AUC系数,与下一次更新上述大数据样本的权重构建的评分卡模型所组成的多个评分卡模型的组合模型的AUC系数的差值在预设范围之内。例如,该预设条件可以用以下公式表示:
AUCm+1<=AUCm+Z (6)
Z表示预设范围,本发明实施提供一个经验值0.005。
需要说明的是,获取上述多个评分卡模型的组合模型的AUC系数可以有多种方式,本发明实施例示例性提供一种方式。
计算每个样本在每个评分卡模型的出险概率以及每个评分卡模型对应的评分卡权重后,计算每个样本在多个评分卡模型的绝对分数,将所有样本(N个)的绝对分数取值从小到大分100等份,取每一份的最大值作为一个阈值(相当于每百分位数设定为一个阈值,共设定100个阈值),将大于这个阈值而又实际出险的预设样本占所有出险样本的比值设为Y轴取值,将大于这个阈值而又实际没有出险的预定样本占所有未出险样本的比值设为X轴取值,得到当前阈值对应的点,这样形成了100个点,这些点依次连起来就形成了ROC(Receiver Operating Characteristic)曲线。
图2是根据一示例性实施例示出的ROC曲线的示意图,ROC的主要分析工具是一个画在二维平面上的曲线——ROC curve。平面的横坐标是false positive rate(FPR),纵坐标是true positive rate(TPR)。对某个分类器而言,我们可以根据其在测试样本上的表现得到一个TPR和FPR点对。这样,此分类器就可以映射成ROC平面上的一个点。调整这个分类器分类时候使用的阈值,我们就可以得到一个经过(0,0),(1,1)的曲线,这就是此分类器的ROC曲线。
AUC系数就是处于ROC curve下方的那部分面积的大小。通常,AUC的值介于0.5到1.0之间,模型具有越大的AUC系数代表了模型的好坏样本的区分度越好,模型的精准程度越高。
当构建的多个评分卡模型的组合模型的AUC系数满足预设条件,这多个评分卡模型为构建风险评估系统的多个评分卡模型。
在S104中,根据上述多个评分卡模型以及每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数。
根据示例实施例,可以通过以下公式计算所述目标对象出现预定事件的绝对分数:
其中,Sm,j表示目标对象出现预定事件的绝对分数,αm表示第m个评分卡模型的评分卡权重,Pm,j表示目标对象在第m个评分卡出现预定事件的概率。
在S106中,利用上述绝对分数计算目标对象出现预定事件的相对分数。
根据示例实施例,在预设的映射表中查找所述该绝对分数,获取所述该绝对分数对应的所述该目标对象出现预定事件的的相对分数。例如,通过将S102中的N个样本的绝对分数划分为连续的100个区间,每一所述区间对应一个相对值分数,因此将可以将绝对分数转换为相对分数。例如,将1000万个样本的绝对分数划分为100个连续的区间,每个区间10万个数据,将这1000万个样本的绝对分数按照大小划分到这100个区间内,如,绝对分数最低的10万个数据划分到第1个区间,这个区间内绝对分数的最大值为0.5,则当目标对象的绝对分数小于或者等于0.5时,对应的相对分数为1。
但本发明不限于此,例如,将大量样本的绝对分数划分为连续的10个或50个或1000个区间,每一区间对应一个相对分数,因此可以进行其他精度的评分,本示例实施方式中对此不做特殊限定。
本发明实施例中,基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重;根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数;利用所述绝对分数计算所述目标对象出现预定事件的相对分数。通过多个评分卡模型进行风险评分,避免了单一的评分卡模型造成的风险评估不精准的问题,提高了风险评估的精准度。
图3是根据一示例性实施例示出的用于构建风险评估系统的方法的流程图,包括:
重复执行以下操作,直到构建的多个评分卡模型的组合模型的AUC系数满足预设条件,利用所述多个评分卡模型的组合模型构建风险评估系统:
S302、根据大数据样本的权重,通过logistic算法构建当前权重对应的评分卡模型;
根据示例实施例,预设大数据样本的初始权重。
S304、根据所述评分卡模型计算每个样本出现预定事件的概率;
S306、根据所述概率以及所述每个样本出现预定事件的实际值,更新所述大数据样本的权重,并获取所述评分卡模型对应的评分卡权重。
根据示例实施例,根据所述预测值以及所述每个样本出现预定事件的实际值,计算所述评分卡模型的错误率,根据所述评分卡模型的错误率获取所述评分卡模型的评分卡权重。
根据示例实施例,通过以下公式获取所述评分卡模型的评分卡权重:
其中,αm表示第m个评分卡模型的评分卡权重,εm表示第m个评分卡模型的错误率,m为大于或者等于1的整数。
所述预设条件包括:所述多个评分卡模型的组合模型的AUC系数,与下一次更新所述大数据样本的权重构建的评分卡模型所组成的多个评分卡模型的组合模型的AUC系数的差值在预设范围之内。
本发明实施例中,利用多个评分卡模型构建风险评估系统,避免了单一的评分卡模型造成的风险评估不精准的问题,提高了风险评估的精准度。
下述为本发明系统实施例,可以用于执行本发明方法实施例。在下文对系统的描述中,与前述方法相同的部分,将不再赘述。
图4是根据一示例性实施例示出的一种用于风险评估的系统的结构图。
如图4所示,该系统40包括:
构建模块410,用于基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重;
第一计算模块420,用于根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数;
第二计算模块430,用于利用所述绝对分数计算所述目标对象出现预定事件的相对分数。
根据示例实施例,所述构建模块410,配置为用于重复执行以下操作,直到构建的多个评分卡模型的组合模型的AUC系数满足预设条件:
根据所述大数据样本的权重,通过logistic算法构建当前权重对应的评分卡模型;
根据所述评分卡模型计算每个样本出现预定事件的概率;
根据所述概率以及所述每个样本出现预定事件的实际值,更新所述大数据样本的权重,并获取所述评分卡模型对应的评分卡权重。
本发明实施例中,基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重;根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数;利用所述绝对分数计算所述目标对象出现预定事件的相对分数。通过多个评分卡模型进行风险评分,避免了单一的评分卡模型造成的风险评估不精准的问题,提高了风险评估的精准度。
以上具体地示出和描述了本发明的示例性实施例。应可理解的是,本发明不限于这里描述的详细结构、设置方式或实现方法;相反,本发明意图涵盖包含所附权利要求的精神和范围内的各种修改和等效设置。
Claims (15)
1.一种用于风险评估的方法,其特征在于,所述方法包括:
基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重;
根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数;
利用所述绝对分数计算所述目标对象出现预定事件的相对分数。
2.如权利要求1所述的方法,其特征在于,所述基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重,包括:
重复执行以下操作,直到构建的多个评分卡模型的组合模型的AUC系数满足预设条件:
根据所述大数据样本的权重,通过logistic算法构建当前权重对应的评分卡模型;
根据所述评分卡模型计算每个样本出现预定事件的概率;
根据所述概率以及所述每个样本出现预定事件的实际值,更新所述大数据样本的权重,并获取所述评分卡模型对应的评分卡权重。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:预设所述大数据样本的初始权重。
4.如权利要求3所述的方法,其特征在于,所述获取所述评分卡模型的评分卡权重,包括:
根据所述每个样本出现预定事件的概率获取每个样本出现预定事件的预测值;
根据所述预测值以及所述每个样本出现预定事件的实际值,计算所述评分卡模型的错误率;
根据所述评分卡模型的错误率获取所述评分卡模型的评分卡权重。
5.如权利要求4所述的方法,其特征在于,所述根据所述评分卡模型的错误率获取所述评分卡模型的评分卡权重,包括:
通过以下公式获取所述评分卡模型的评分卡权重:
其中,αm表示第m个评分卡模型的评分卡权重,εm表示第m个评分卡模型的错误率,m为大于或者等于1的整数。
6.如权利要求2所述的方法,其特征在于,所述预设条件包括:所述多个评分卡模型的组合模型的AUC系数,与下一次更新所述大数据样本的权重构建的评分卡模型所组成的多个评分卡模型的组合模型的AUC系数的差值在预设范围之内。
7.如权利要求1所述的方法,其特征在于,所述根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数,包括:
通过以下公式计算所述目标对象出现预定事件的绝对分数:
其中,Sm,j表示目标对象出现预定事件的绝对分数,αm表示第m个评分卡模型的评分卡权重,Pm,j表示目标对象在第m个评分卡出现预定事件的概率。
8.如权利要求1所述的方法,其特征在于,所述利用所述绝对分数计算所述目标对象出现预定事件的的相对分数,还包括:
在预设的映射表中查找所述绝对分数,获取所述绝对分数对应的所述目标对象出现预定事件的的相对分数。
9.一种用于构建风险评估系统的方法,其特征在于,所述方法包括:
重复执行以下操作,直到构建的多个评分卡模型的组合模型的AUC系数满足预设条件,利用所述多个评分卡模型的组合模型构建风险评估系统:
根据大数据样本的权重,通过logistic算法构建当前权重对应的评分卡模型;
根据所述评分卡模型计算每个样本出现预定事件的概率;
根据所述概率以及所述每个样本出现预定事件的实际值,更新所述大数据样本的权重,并获取所述评分卡模型对应的评分卡权重。
10.如权利要求9所述的方法,其特征在于,所述方法还包括:预设所述大数据样本的初始权重。
11.如权利要求10所述的方法,其特征在于,所述获取所述评分卡模型的评分卡权重,包括:
根据所述每个样本出现预定事件的概率获取每个样本出现预定事件的预测值;
根据所述预测值以及所述每个样本出现预定事件的实际值,计算所述评分卡模型的错误率;
根据所述评分卡模型的错误率获取所述评分卡模型的评分卡权重。
12.如权利要求11所述的方法,其特征在于,所述根据所述评分卡模型的错误率获取所述评分卡模型的评分卡权重,包括:
通过以下公式获取所述评分卡模型的评分卡权重:
其中,αm表示第m个评分卡模型的评分卡权重,εm表示第m个评分卡模型的错误率,m为大于或者等于1的整数。
13.如权利要求9所述的方法,其特征在于,所述预设条件包括:所述多个评分卡模型的组合模型的AUC系数,与下一次更新所述大数据样本的权重构建的评分卡模型所组成的多个评分卡模型的组合模型的AUC系数的差值在预设范围之内。
14.一种用于风险评估的系统,其特征在于,所述系统包括:
构建模块,用于基于大数据样本构建多个评分卡模型,并获取每个评分卡模型对应的评分卡权重;
第一计算模块,用于根据所述多个评分卡模型以及所述每个评分卡模型的评分卡权重,计算目标对象出现预定事件的绝对分数;
第二计算模块,用于利用所述绝对分数计算所述目标对象出现预定事件的相对分数。
15.如权利要求14所述的系统,其特征在于,所述构建模块,配置为用于重复执行以下操作,直到构建的多个评分卡模型的组合模型的AUC系数满足预设条件:
根据所述大数据样本的权重,通过logistic算法构建当前权重对应的评分卡模型;
根据所述评分卡模型计算每个样本出现预定事件的概率;
根据所述概率以及所述每个样本出现预定事件的实际值,更新所述大数据样本的权重,并获取所述评分卡模型对应的评分卡权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611066880.8A CN106408423A (zh) | 2016-11-25 | 2016-11-25 | 用于风险评估的方法、系统及构建风险评估系统的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611066880.8A CN106408423A (zh) | 2016-11-25 | 2016-11-25 | 用于风险评估的方法、系统及构建风险评估系统的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106408423A true CN106408423A (zh) | 2017-02-15 |
Family
ID=58083555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611066880.8A Pending CN106408423A (zh) | 2016-11-25 | 2016-11-25 | 用于风险评估的方法、系统及构建风险评估系统的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106408423A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203945A (zh) * | 2017-06-12 | 2017-09-26 | 清华大学苏州汽车研究院(吴江) | 车险分级评估方法及装置 |
CN107239882A (zh) * | 2017-05-10 | 2017-10-10 | 平安科技(深圳)有限公司 | 风险评估方法、装置、计算机设备及存储介质 |
CN107392479A (zh) * | 2017-07-27 | 2017-11-24 | 国网河南省电力公司电力科学研究院 | 基于逻辑回归模型的电力客户停电敏感度评分卡实施方法 |
CN107657381A (zh) * | 2017-09-27 | 2018-02-02 | 北京龙德时代技术服务有限公司 | 民爆物品安全风险评估系统 |
CN107977804A (zh) * | 2018-01-02 | 2018-05-01 | 南京信息工程大学 | 一种保兑仓业务风险评估方法 |
CN108366045A (zh) * | 2018-01-02 | 2018-08-03 | 北京奇艺世纪科技有限公司 | 一种风控评分卡的设置方法和装置 |
CN109255518A (zh) * | 2018-08-01 | 2019-01-22 | 阿里巴巴集团控股有限公司 | 数据使用风险评估方法、装置和系统 |
CN109409641A (zh) * | 2018-09-03 | 2019-03-01 | 平安科技(深圳)有限公司 | 风险评价方法、装置、计算机设备和存储介质 |
CN109886803A (zh) * | 2019-02-14 | 2019-06-14 | 成都路行通信息技术有限公司 | 一种贷后风险分析模型、方法和模型构建方法 |
CN110009225A (zh) * | 2019-04-03 | 2019-07-12 | 平安科技(深圳)有限公司 | 风险评估系统构建方法、装置、计算机设备和存储介质 |
CN110675267A (zh) * | 2018-07-03 | 2020-01-10 | 北京嘀嘀无限科技发展有限公司 | 一种根据实时路况进行车险预警的方法及系统 |
CN112561320A (zh) * | 2020-12-14 | 2021-03-26 | 中国建设银行股份有限公司 | 机构风险预测模型的训练方法、机构风险预测方法和装置 |
CN112634064A (zh) * | 2020-12-02 | 2021-04-09 | 北京健康之家科技有限公司 | 理赔智能审核方法及装置、系统、存储介质 |
CN112766649A (zh) * | 2020-12-31 | 2021-05-07 | 平安科技(深圳)有限公司 | 基于多评分卡融合的目标对象评价方法及其相关设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239034A (zh) * | 2014-08-19 | 2014-12-24 | 北京奇虎科技有限公司 | 智能电子设备的场合识别方法和信息通知方法及其装置 |
-
2016
- 2016-11-25 CN CN201611066880.8A patent/CN106408423A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239034A (zh) * | 2014-08-19 | 2014-12-24 | 北京奇虎科技有限公司 | 智能电子设备的场合识别方法和信息通知方法及其装置 |
Non-Patent Citations (4)
Title |
---|
周小超: "我国农村中小银行信用评估模型的评价与构建", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》 * |
彭州: "基于数据挖掘的个人信用评分系统的分析与设计", 《中国优秀博硕士学位论文全文数据库(硕士)社会科学I辑(经济政治与法律)》 * |
彭建刚 等: "有序多分类logistic模型在违约概率测算中的应用", 《财经理论与实践(双月刊)》 * |
王梦佳: "基于Logistic回归模型的P2P网贷平台借款人信用风险评估", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018205371A1 (zh) * | 2017-05-10 | 2018-11-15 | 平安科技(深圳)有限公司 | 风险评估方法、装置、服务器和存储介质 |
CN107239882A (zh) * | 2017-05-10 | 2017-10-10 | 平安科技(深圳)有限公司 | 风险评估方法、装置、计算机设备及存储介质 |
CN107203945A (zh) * | 2017-06-12 | 2017-09-26 | 清华大学苏州汽车研究院(吴江) | 车险分级评估方法及装置 |
CN107392479A (zh) * | 2017-07-27 | 2017-11-24 | 国网河南省电力公司电力科学研究院 | 基于逻辑回归模型的电力客户停电敏感度评分卡实施方法 |
CN107657381A (zh) * | 2017-09-27 | 2018-02-02 | 北京龙德时代技术服务有限公司 | 民爆物品安全风险评估系统 |
CN108366045A (zh) * | 2018-01-02 | 2018-08-03 | 北京奇艺世纪科技有限公司 | 一种风控评分卡的设置方法和装置 |
CN107977804A (zh) * | 2018-01-02 | 2018-05-01 | 南京信息工程大学 | 一种保兑仓业务风险评估方法 |
CN107977804B (zh) * | 2018-01-02 | 2020-10-27 | 南京信息工程大学 | 一种保兑仓业务风险评估方法 |
CN108366045B (zh) * | 2018-01-02 | 2020-09-01 | 北京奇艺世纪科技有限公司 | 一种风控评分卡的设置方法和装置 |
CN110675267A (zh) * | 2018-07-03 | 2020-01-10 | 北京嘀嘀无限科技发展有限公司 | 一种根据实时路况进行车险预警的方法及系统 |
CN109255518A (zh) * | 2018-08-01 | 2019-01-22 | 阿里巴巴集团控股有限公司 | 数据使用风险评估方法、装置和系统 |
CN109409641A (zh) * | 2018-09-03 | 2019-03-01 | 平安科技(深圳)有限公司 | 风险评价方法、装置、计算机设备和存储介质 |
CN109886803A (zh) * | 2019-02-14 | 2019-06-14 | 成都路行通信息技术有限公司 | 一种贷后风险分析模型、方法和模型构建方法 |
CN110009225A (zh) * | 2019-04-03 | 2019-07-12 | 平安科技(深圳)有限公司 | 风险评估系统构建方法、装置、计算机设备和存储介质 |
CN110009225B (zh) * | 2019-04-03 | 2023-10-31 | 平安科技(深圳)有限公司 | 风险评估系统构建方法、装置、计算机设备和存储介质 |
CN112634064A (zh) * | 2020-12-02 | 2021-04-09 | 北京健康之家科技有限公司 | 理赔智能审核方法及装置、系统、存储介质 |
CN112561320A (zh) * | 2020-12-14 | 2021-03-26 | 中国建设银行股份有限公司 | 机构风险预测模型的训练方法、机构风险预测方法和装置 |
CN112766649A (zh) * | 2020-12-31 | 2021-05-07 | 平安科技(深圳)有限公司 | 基于多评分卡融合的目标对象评价方法及其相关设备 |
CN112766649B (zh) * | 2020-12-31 | 2022-03-15 | 平安科技(深圳)有限公司 | 基于多评分卡融合的目标对象评价方法及其相关设备 |
WO2022142001A1 (zh) * | 2020-12-31 | 2022-07-07 | 平安科技(深圳)有限公司 | 基于多评分卡融合的目标对象评价方法及其相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106408423A (zh) | 用于风险评估的方法、系统及构建风险评估系统的方法 | |
CN105279691A (zh) | 基于随机森林模型的金融交易检测方法和设备 | |
CN106677763B (zh) | 一种基于动态集成建模的油井动液面预测方法 | |
CN108346293B (zh) | 一种实时交通流短时预测方法 | |
CA3209845A1 (en) | Optimizing neural networks for risk assessment | |
CN108446711A (zh) | 一种基于迁移学习的软件缺陷预测方法 | |
CN106875270A (zh) | 一种构建及验证信用评分方程的方法和系统设计 | |
CN108052387B (zh) | 一种移动云计算中的资源分配预测方法及系统 | |
CN103810101A (zh) | 一种软件缺陷预测方法和软件缺陷预测系统 | |
CN107798426A (zh) | 基于原子分解和交互式模糊满意度的风功率区间预测方法 | |
KR20210017342A (ko) | 과거 데이터에 기초한 시계열 예측 방법 및 장치 | |
CN107092751B (zh) | 基于Bootstrap的变权重模型组合预测方法 | |
CN110689183A (zh) | 一种集群光伏功率概率预测方法、系统、介质及电子设备 | |
CN110633859A (zh) | 一种两阶段分解集成的水文序列预测方法 | |
CN104239598A (zh) | 一种面向动态系统模型验证的多元数据分析方法 | |
CN108830405B (zh) | 基于多指标动态匹配的实时电力负荷预测系统及其方法 | |
CN109063750A (zh) | 基于cnn和svm决策融合的sar目标分类方法 | |
CN114819107B (zh) | 基于深度学习的混合数据同化方法 | |
CN116739742A (zh) | 信贷风控模型的监控方法、装置、设备及存储介质 | |
CN106018325A (zh) | 一种评价汽油性质建模预测结果可信程度的方法 | |
Zhukov et al. | A stochastic dynamics model for shaping stock indexes using self-organization processes, memory and oscillations | |
WO2022222230A1 (zh) | 基于机器学习的指标预测方法、装置、设备及存储介质 | |
CN113222255B (zh) | 一种合同履约表现量化及短期违约预测的方法及装置 | |
CN110147614B (zh) | 一种基于评分差异Stacking多模型集成学习的工程安全评价方法 | |
Shin et al. | Weighted penalty model for content balancing in CATs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170215 |
|
RJ01 | Rejection of invention patent application after publication |