CN106570753A - 对违约风险进行控制的方法及服务器 - Google Patents
对违约风险进行控制的方法及服务器 Download PDFInfo
- Publication number
- CN106570753A CN106570753A CN201510646178.8A CN201510646178A CN106570753A CN 106570753 A CN106570753 A CN 106570753A CN 201510646178 A CN201510646178 A CN 201510646178A CN 106570753 A CN106570753 A CN 106570753A
- Authority
- CN
- China
- Prior art keywords
- feature
- default
- value
- screening
- risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012216 screening Methods 0.000 claims abstract description 179
- 238000004458 analytical method Methods 0.000 claims abstract description 24
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims abstract description 7
- 230000011218 segmentation Effects 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 18
- 238000013507 mapping Methods 0.000 claims description 9
- 241001269238 Data Species 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 7
- 238000012502 risk assessment Methods 0.000 claims description 5
- 238000013075 data extraction Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种对违约风险进行控制的方法及服务器,所述方法包括:按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;从初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算筛选样本数据中每一个预设特征所分别对应的权重占比值和风险关系值;从预设特征中提取出风险关系值大于预设阈值的筛选特征,并根据筛选特征,拟合出每个筛选特征分别对应的权重系数;根据待评估用户对应的每个筛选特征的权重系数和权重占比值,基于预先设定的基础分和预设计算公式,计算得到待评估用户对应的违约风险分数;具有根据用户对应的多个数据特征,对该用户的违约风险进行综合控制的有益效果。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种对违约风险进行控制的方法及服务器。
背景技术
随着互联网技术的不断发展进步和电子化、信息化等网络化进程的不断发展,传统的银行业务、借贷业务等金融领域也逐步向电子化发展;通过获取网络数据对用户的违约风险进行评估,也变得日益便捷。
目前,对用户的违约风险进行评分并预估违约风险大小时,主要是通过下述方式来实现:根据该用户在中国人民银行的征信数据,来识别该用户是否存在不良信用记录;若识别出该用户存在不良信用记录,则确定该用户有较高的违约风险。这种仅仅根据用户的征信数据来进行判断的单一判断方式并不全面,使得现有的对用户违约风险进行判断的准确率不高。
发明内容
鉴于此,有必要提供一种对违约风险进行控制的方法及服务器,用以根据用户对应的多个数据特征,对该用户的违约风险进行综合控制。
本发明公开了一种对违约风险进行控制的方法,包括以下步骤:
按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;
从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值;
从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数;
根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数。
优选地,所述从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值,包括:
根据预设特征,对所述初选样本数据进行筛选,提取出符合所述预设特征的筛选样本数据;
按照所述预设特征中特征类型与数值分段跨度的映射关系,对所述筛选样本数据中值为连续数的所述预设特征进行值的区间分段,得到对应的分段区间;
按照预设分析规则,计算分段后每一个所述分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,得到对应的所述权重占比值;
基于得到的所述权重占比值,计算分段后所述预设特征中每一个分段区间所分别对应的区间风险关系值;
将计算得到的每个分段区间对应的所述区间风险关系值相加,得到每一个所述预设特征所分别对应的总的所述风险关系值。
优选地,所述按照预设分析规则,计算分段后每一个所述分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,得到对应的所述权重占比值,包括:
为所述筛选数据中值为非连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;同时,为所述筛选数据中值为连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;
基于生成的所述违约风险评价表,计算分段后每一个所述分段区间对应的违约用户对正常用户的占比P1,以及总体中违约用户对正常用户的占比P2;
计算占比P1和占比P2之间的差异值,得到对应的所述权重占比值。
优选地,所述从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数,包括:
将所述风险关系值大于预设阈值的预设特征筛选出来,得到对应的所述筛选特征;
将每个所述筛选特征分别作为变量,按照预设拟合公式对所述筛选特征进行拟合,计算出每个所述筛选特征分别对应的权重系数。
优选地,所述根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数,包括:
根据违约用户比例,设定所述基础分;
根据待评估用户对应的每个所述筛选特征的所述权重系数和权重占比值,按照所述预设计算公式,计算每个所述筛选特征所分别对应的特征权重分数,得到对应的特征权重分数;
计算所述基础分与所有所述特征权重分数的和,并将计算得到的和作为所述待评估用户对应的违约风险分数。
对应于以上所公开的一种对违约风险进行控制的方法,本发明还公开了一种对违约风险进行控制的服务器,包括:
数据提取模块,用于按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;
参数计算模块,用于从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值;
系数拟合模块,用于从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数;
分数计算模块,用于根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数。
优选地,所述参数计算模块包括:
提取单元,用于根据预设特征,对所述初选样本数据进行筛选,提取出符合所述预设特征的筛选样本数据;
分段单元,用于按照所述预设特征中特征类型与数值分段跨度的映射关系,对所述筛选样本数据中值为连续数的所述预设特征进行值的区间分段,得到对应的分段区间;
参数计算单元,用于:
按照预设分析规则,计算分段后每一个所述分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,得到对应的所述权重占比值;基于得到的所述权重占比值,计算分段后所述预设特征中每一个分段区间所分别对应的区间风险关系值;
参数求和单元,用于将计算得到的每个分段区间对应的所述区间风险关系值相加,得到每一个所述预设特征所分别对应的总的所述风险关系值。
优选地,所述计算单元还用于:
为所述筛选数据中值为非连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;同时,为所述筛选数据中值为连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;
基于生成的所述违约风险评价表,计算分段后每一个所述分段区间对应的违约用户对正常用户的占比P1,以及总体中违约用户对正常用户的占比P2;
计算占比P1和占比P2之间的差异值,得到对应的所述权重占比值。
优选地,所述系数拟合模块包括:
筛选单元,用于将所述风险关系值大于预设阈值的预设特征筛选出来,得到对应的所述筛选特征;
拟合单元,用于将每个所述筛选特征分别作为变量,按照预设拟合公式对所述筛选特征进行拟合,计算出每个所述筛选特征分别对应的权重系数。
优选地,所述分数计算模块包括:
设定单元,用于根据违约用户比例,预先设定所述基础分;
分数计算单元,用于根据待评估用户对应的每个所述筛选特征的所述权重系数和权重占比值,按照所述预设计算公式,计算每个所述筛选特征所分别对应的特征权重分数,得到对应的特征权重分数;
分数求和单元,用于计算所述基础分与所有所述特征权重分数的和,并将计算得到的和作为所述待评估用户对应的违约风险分数。
本发明对违约风险进行控制的方法及服务器可以达到如下有益效果:
通过按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值;从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数;根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数;具有根据用户对应的多个数据特征,对该用户的违约风险进行综合控制的有益效果,提高了违约风险控制的准确性;同时,也提供了一个对违约风险进行控制的评分模型,提高了违约风险控制的智能性和便捷性。
附图说明
图1是本发明对违约风险进行控制的方法中一实施方式的流程示意图;
图2是本发明对违约风险进行控制的方法中图1所述实施例中步骤S20的一实施方式的流程示意图;
图3是本发明对违约风险进行控制的方法中图1所述实施例中步骤S30的一实施方式的流程示意图;
图4是本发明对违约风险进行控制的方法中图1所述实施例中步骤S40的一实施方式的流程示意图;
图5是本发明对违约风险进行控制的服务器中一实施方式的框图;
图6是本发明对违约风险进行控制的服务器中图5所述实施例中参数计算模块70的一实施方式的框图;
图7是本发明对违约风险进行控制的服务器中图5所述实施例中系数拟合模块80的一实施方式的框图;
图8是本发明对违约风险进行控制的服务器中图5所述实施例中分数计算模块90的一实施方式的框图。
本发明实施例目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下结合说明书附图及具体实施例进一步说明本发明的技术方案。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明对违约风险进行控制的方法及服务器可以应用在任何需要对待评估用户对应的违约风险进行控制的任一应用场景中,包括但不限于:
判断新贷款申请的违约风险,根据违约风险评分结果决定批准还是拒绝该申请;对审批通过的贷款账户进行覆盖整个贷款周期的管理;信用额度、利率水平以及保险保费设定的参考等。
以下实施例将不对上述内容进行赘述。
本发明提供了一种对违约风险进行控制的方法,用以根据用户对应的多个数据特征,对该用户的违约风险进行综合评分;如图1所示,本发明对违约风险进行控制的方法可以实施为如下描述的步骤S10-S40:
步骤S10、按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;
本发明实施例中,评分服务器所按照的预设提取规则可以理解为:按照违约用户样本数占总用户样本数的比例,例如,设置违约用户样本数占总用户样本数的比例为一预设比例值,评分服务器按照上述预设值,提取出预设数量的违约用户对应的初选样本数据,同时,提取出对应数量的未违约用户对应的初选样本数据。
本发明实施例中,评分服务器从多个业务服务器中提取的初选样本数据包括但不限于:银行服务器上对应的用户数据、社交网站上对应的用户数据、电商购物网站上对应的用户数据以及网络实名借贷服务网站上对应的用户数据等等。所描述的用户数据包括但不限于:用户姓名、用户性别、用户职业、用户年收入、用户个人财产状况如车、房、存款、投资等。
步骤S20、从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值;
评分服务器提取到对应的初选样本数据后,在针对提取出的上述初选样本数据,从中筛选出符合预设特征的样本数据,即得到本发明实施例所描述的筛选样本数据。
所描述的预设特征包括但不限于:申请数据,比如:性别、年龄、籍贯、地域、职业、工作单位、年收入、教育经历、婚姻状况等;人行信息,比如:信用卡额度使用率、最近半年内每月贷款应还款比率、首张信用卡账龄等;社交信息,比如:网络年龄、微博数目、微博关注数目、微博粉丝数、活跃时间段、网络省份、终端类型、最近微博信息等;内部数据,比如:是否有房、是否有车、存款额等。
筛选出符合预设特征的筛选样本数据后,按照预先设定的分析规则,计算上述筛选样本数据中每一个预设特征(比如性别、存款额等)所分别对应的权重占比值和风险关系值。其中,本发明实施例中,所描述的权重占比值可以理解为:每一个预设特征中,违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值;其中,正常用户即未违约用户。所描述的风险关系值可以理解为:每个预设特征作为自变量,待评分用户对应的违约风险作为目标变量,则上述风险关系值可以用来衡量自变量对目标变量的影响程度。
步骤S30、从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数;
评分服务器计算得出上述筛选样本数据中每一个预设特征所分别对应的风险关系值值后,将计算得到的每一个风险关系值与预先设定的预设阈值进行比较,获取大于预设阈值的风险关系值所对应的上述预设特征,并将所述风险关系值大于预设阈值所对应的预设特征提取出来,即得到所描述的筛选特征。
得到对应的筛选特征后,评分服务器将上述每一个筛选特征分别作为变量,进行预设拟合公式的拟合,并计算出上述每一个筛选特征所分别对应的权重系数。
步骤S40、根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数。
根据步骤S10中评分服务器提取用户对应的初选样本数据时所采用的违约客户对应的预设比例值,设定违约风险对应的基础分。设定完基础分后,根据待评估用户对应的每个筛选特征的权重系数和权重占比值,按照预设计算公式,计算得到该待评估用户对应的违约风险分数。其中,所述预设计算公式以上述基础分以及每个筛选特征的权重系数和权重占比值作为参数,按照一定运算规则进行计算。
本发明实施例中,上述预设计算公式包括但不限于如下具体的计算方式:比如,按照如下预设计算公式计算得出待评估用户的违约风险分数N:
N=(-1)*(20/lg(2))*Beta*WOE);其中,Beta为上述权重系数,WOE为权重占比值。
本发明对违约风险进行控制的方法通过按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值;从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数;根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数;具有根据用户对应的多个数据特征,对该用户的违约风险进行综合评分的有益效果,提高了违约风险评估的准确性;同时,也提供了一个对违约风险进行控制的评分模型,提高了违约风险评估的智能性和便捷性。
基于图1所述实施例的描述,本发明对违约风险进行控制的方法中,评分服务器可以通过图2所描述的实施方式,来计算筛选样本数据中每个预设特征所分别对应的权重占比值和风险关系值。
如图2所示,图1所述实施例中,“步骤S20、从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值”,可以实施为如下描述的步骤S201-S205:
步骤S201、根据预设特征,对所述初选样本数据进行筛选,提取出符合所述预设特征的筛选样本数据;
本发明实施例中,评分服务器根据预设特征(比如性别、年龄等),对上述初选样本数据进行筛选,提取出符合上述预设特征的筛选样本数据;比如,提取出年龄特征为0-60岁、性别不限等对应的筛选样本数据。
步骤S202、按照所述预设特征中特征类型与数值分段跨度的映射关系,对所述筛选样本数据中值为连续数的所述预设特征进行值的区间分段,得到对应的分段区间;
由于筛选出的符合预设特征的筛选样本数据中包括值为连续数的特征类型(比如年龄、存款额),也可能包括值为非连续数据的特征类型(比如性别),因此,评分服务器按照预设特征中特征类型与数值分段跨度的映射关系,对筛选样本数据中值为连续数的所述预设特征进行值的区间分段,得到对应的分段区间。比如,针对年龄这一预设特征所对应的数值分段为20岁,则0-20岁、21-40岁、41-60岁等分别属于不同的数值分段。在对值为连续数的预设特征进行值的区间分段后,优选地,将值为连续数的预设特征的各个筛选样本数据与对应的分段区间建立对应的映射关系。
步骤S203、按照预设分析规则,计算分段后每一个所述分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,得到对应的所述权重占比值;
对上述筛选样本数据中值为连续数的所述预设特征进行值的区间分段后,按照预先设定的分析规则,针对分段后得到的每一个分段区间,分别计算各分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,从而得到每一个分段区间分别对应的权重占比值。
优选地,评分服务器为所述筛选数据中值为非连续数的每一个所述预设特征(比如性别)对应的所有筛选数据,生成对应的样本数据违约风险评价表;同时,为所述筛选数据中值为连续数的每一个所述预设特征(比如年龄、存款额)对应的所有筛选数据,生成对应的样本数据违约风险评价表。
由于生成的上述违约风险评价表中包含了违约用户数及正常用户数,以及各预设特征所分别对应的数值等数据,因此,可以基于生成的所述违约风险评价表,计算分段后每一个所述分段区间对应的违约用户对正常用户的占比P1,以及总体中违约用户对正常用户的占比P2;进而,计算占比P1和占比P2之间的差异值,得到对应的所述权重占比值。
步骤S204、基于得到的所述权重占比值,计算分段后所述预设特征中每一个分段区间所分别对应的区间风险关系值;
计算得到对应的权重占比值后,基于上述生成的样本数据违约风险评价表,计算出每一个区间分段对应的违约客户数占总违约数目的比例pb、每一个区间分段对应的未违约客户数占总未违约数目的比例pg;进而根据计算得到的比例pb、比例pg以及权重占比值WOE,计算分段后所述预设特征中每一个分段区间所分别对应的区间风险关系值。
比如,根据预设的风险关系公式,计算区间风险关系值iv为:
iv=WOE*(pb-pg);从而计算得出每一个区间分段对应的区间风险关系值。
步骤S205、将计算得到的每个分段区间对应的所述区间风险关系值相加,得到每一个所述预设特征所分别对应的总的所述风险关系值。
计算得到的每个分段区间对应的区间风险关系值iv后,对每一个所述预设特征所分别对应的所有iv进行求和计算,得到每一个所述预设特征所分别对应的总的所述风险关系值IV。
本发明实施例通过根据预设特征,对所述初选样本数据进行筛选,提取出符合所述预设特征的筛选样本数据;按照所述预设特征中特征类型与数值分段跨度的映射关系,对所述筛选样本数据中值为连续数的所述预设特征进行值的区间分段,得到对应的分段区间;按照预设分析规则,计算分段后每一个所述分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,得到对应的所述权重占比值;基于得到的所述权重占比值,计算分段后所述预设特征中每一个分段区间所分别对应的区间风险关系值;将计算得到的每个分段区间对应的所述区间风险关系值相加,得到每一个所述预设特征所分别对应的总的所述风险关系值;具有便捷、准确地获取预设特征对应的参数值的有益效果。
基于图1、图2所述实施例的描述,本发明对违约风险进行控制的方法中,评分服务器可以通过图3所描述的实施方式,来拟合出每个所述筛选特征分别对应的权重系数。
如图3所示,图1所述实施例中,“步骤S30、从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数”,可以实施为如下描述的步骤S301-S302:
步骤S301、将所述风险关系值大于预设阈值的预设特征筛选出来,得到对应的所述筛选特征;
本发明实施例中,基于上述实施例所描述的评分服务器所生成的样本数据违约风险评价表,分析每一个预设特征所对应的风险关系值,将风险关系值大于预设阈值的预设特征筛选出来,得到对应的筛选特征。
步骤S302、将每个所述筛选特征分别作为变量,按照预设拟合公式对所述筛选特征进行拟合,计算出每个所述筛选特征分别对应的权重系数。
将每个所述筛选特征分别作为变量,进行预设拟合公式的拟合并计算出每个变量的权重系数,即上述每个筛选特征所分别对应的权重系数。
例如,在一个具体的应用场景中,假设函数关系式Y=aX+b中,X代表预设筛选特征所对应的变量,Y代表所述预设筛选特征所对应的违约风险值,则可以把X、Y放到预设的软件模型中(比如SAS软件模型里),利用SAS软件模型拟合一个方程,算出a和b的值,则a值即是变量X的权重系数,也就是说,a值即是预设筛选特征所对应的权重系数Beta。通过上述方式,即可计算出每个所述筛选特征分别对应的权重系数。
本发明实施例通过将所述风险关系值大于预设阈值的预设特征筛选出来,得到对应的所述筛选特征;将每个所述筛选特征分别作为变量,按照预设拟合公式对所述筛选特征进行拟合,计算出每个所述筛选特征分别对应的权重系数;提高了筛选特征对应的权重系数的计算的便捷性和准确性。
基于图1、图2及图3所述实施例的描述,本发明对违约风险进行控制的方法中,评分服务器可以通过图4所描述的实施方式,来计算得到所述待评估用户对应的违约风险分数。
如图4所示,图1所述实施例中,“步骤S40、根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数”,可以实施为如下描述的步骤S401-S403:
步骤S401、根据违约用户比例,设定所述基础分;
本发明实施例中,评分服务器根据提取初选样本数据时所采用的违约客户比例,即违约用户与正常用户之间的比例值,预先设定对应的基础分。
比如,在一个具体的应用场景中,违约用户与正常用户之间的比例值是1:10,则可以定义基础分是200分,并且可以定义20分是用户的好坏比翻番的分数,则当违约用户与正常用户之间的比例值是1:20时,基础分则变为220分。
步骤S402、根据待评估用户对应的每个所述筛选特征的所述权重系数和权重占比值,按照所述预设计算公式,计算每个所述筛选特征所分别对应的特征权重分数,得到对应的特征权重分数;
根据待评估用户对应的各个筛选特征的权重系数Beta、待评估用户对应的各个筛选特征对应的权重占比WOE,并按照预设违约分数的计算公式,计算出待评估用户对应的各个筛选特征所分别对应的特征权重分数。
例如,在一具体的应用场景中,用于计算各个筛选特征所分别对应的特征权重分数n所对应的具体公式为:
n=(-1)*(20/lg(2))*Beta*WOE;
则根据上述预设计算公式,计算得到各个筛选特征所分别对应的特征权重分数n。
步骤S403、计算所述基础分与所有所述特征权重分数的和,并将计算得到的和作为所述待评估用户对应的违约风险分数。
得到各个筛选特征所分别对应的特征权重分数n后,将所有筛选特征分别对应的特征权重分数n与上述基础分进行相加,将上述各数值相加的结果作为待评估用户对应的违约风险分数。
本发明实施例通过根据违约用户比例,预先设定所述基础分;根据待评估用户对应的每个所述筛选特征的所述权重系数和权重占比值,按照所述预设计算公式,计算每个所述筛选特征所分别对应的特征权重分数,得到对应的特征权重分数;计算所述基础分与所有所述特征权重分数的和,并将计算得到的和作为所述待评估用户对应的违约风险分数;提高了待评估用户违约风险分数的准确性。
对应于图1、图2、图3和图4所述实施例所描述的一种对违约风险进行控制的方法,本发明还提供了一种对违约风险进行控制的服务器,如图5所示,本发明对违约风险进行控制的服务器包括:数据提取模块60、参数计算模块70、系数拟合模块80以及分数计算模块90;其中:
所述数据提取模块60,用于按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;
所述参数计算模块70,用于从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值;
优选地,如图6所示,所述参数计算模块70包括:提取单元701、分段单元702、参数计算单元703以及参数求和单元704,其中:
所述提取单元701,用于根据预设特征,对所述初选样本数据进行筛选,提取出符合所述预设特征的筛选样本数据;
所述分段单元702,用于按照所述预设特征中特征类型与数值分段跨度的映射关系,对所述筛选样本数据中值为连续数的所述预设特征进行值的区间分段,得到对应的分段区间;
所述参数计算单元703,用于:
按照预设分析规则,计算分段后每一个所述分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,得到对应的所述权重占比值;基于得到的所述权重占比值,计算分段后所述预设特征中每一个分段区间所分别对应的区间风险关系值;
所述参数求和单元704,用于将计算得到的每个分段区间对应的所述区间风险关系值相加,得到每一个所述预设特征所分别对应的总的所述风险关系值。
优选地,所述所述参数计算单元703还用于:
为所述筛选数据中值为非连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;同时,为所述筛选数据中值为连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;
基于生成的所述违约风险评价表,计算分段后每一个所述分段区间对应的违约用户对正常用户的占比P1,以及总体中违约用户对正常用户的占比P2;
计算占比P1和占比P2之间的差异值,得到对应的所述权重占比值。
所述系数拟合模块80,用于从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数;
优选地,如图7所示,所述系数拟合模块80包括:
筛选单元801,用于将所述风险关系值大于预设阈值的预设特征筛选出来,得到对应的所述筛选特征;
拟合单元802,用于将每个所述筛选特征分别作为变量,按照预设拟合公式对所述筛选特征进行拟合,计算出每个所述筛选特征分别对应的权重系数。
所述分数计算模块90,用于根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数。
优选地,如图8所示,所述分数计算模块90包括:
设定单元901,用于根据违约用户比例,预先设定所述基础分;
分数计算单元902,用于根据待评估用户对应的每个所述筛选特征的所述权重系数和权重占比值,按照所述预设计算公式,计算每个所述筛选特征所分别对应的特征权重分数,得到对应的特征权重分数;
分数求和单元903,用于计算所述基础分与所有所述特征权重分数的和,并将计算得到的和作为所述待评估用户对应的违约风险分数。
本发明对违约风险进行控制的服务器通过按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值;从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数;根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数;具有根据用户对应的多个数据特征,对该用户的违约风险进行综合评分的有益效果,提高了违约风险评估的准确性;同时,也提供了一个对违约风险进行控制的评分模型,提高了违约风险评估的智能性和便捷性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制其专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种对违约风险进行控制的方法,其特征在于,包括以下步骤:
按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;
从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值;
从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数;
根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数。
2.如权利要求1所述的方法,其特征在于,所述从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值,包括:
根据预设特征,对所述初选样本数据进行筛选,提取出符合所述预设特征的筛选样本数据;
按照所述预设特征中特征类型与数值分段跨度的映射关系,对所述筛选样本数据中值为连续数的所述预设特征进行值的区间分段,得到对应的分段区间;
按照预设分析规则,计算分段后每一个所述分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,得到对应的所述权重占比值;
基于得到的所述权重占比值,计算分段后所述预设特征中每一个分段区间所分别对应的区间风险关系值;
将计算得到的每个分段区间对应的所述区间风险关系值相加,得到每一个所述预设特征所分别对应的总的所述风险关系值。
3.如权利要求2所述的方法,其特征在于,所述按照预设分析规则,计算分段后每一个所述分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,得到对应的所述权重占比值,包括:
为所述筛选数据中值为非连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;同时,为所述筛选数据中值为连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;
基于生成的所述违约风险评价表,计算分段后每一个所述分段区间对应的违约用户对正常用户的占比P1,以及总体中违约用户对正常用户的占比P2;
计算占比P1和占比P2之间的差异值,得到对应的所述权重占比值。
4.如权利要求1所述的方法,其特征在于,所述从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数,包括:
将所述风险关系值大于预设阈值的预设特征筛选出来,得到对应的所述筛选特征;
将每个所述筛选特征分别作为变量,按照预设拟合公式对所述筛选特征进行拟合,计算出每个所述筛选特征分别对应的权重系数。
5.如权利要求1至4任一项所述的方法,其特征在于,所述根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数,包括:
根据违约用户比例,设定所述基础分;
根据待评估用户对应的每个所述筛选特征的所述权重系数和权重占比值,按照所述预设计算公式,计算每个所述筛选特征所分别对应的特征权重分数,得到对应的特征权重分数;
计算所述基础分与所有所述特征权重分数的和,并将计算得到的和作为所述待评估用户对应的违约风险分数。
6.一种对违约风险进行控制的服务器,其特征在于,包括:
数据提取模块,用于按照预设提取规则,从多个业务服务器中提取出预设数量用户对应的初选样本数据;
参数计算模块,用于从所述初选样本数据中筛选出符合预设特征的筛选样本数据,按照预设分析规则,计算所述筛选样本数据中每一个所述预设特征所分别对应的权重占比值和风险关系值;
系数拟合模块,用于从所述预设特征中提取出所述风险关系值大于预设阈值的筛选特征,并根据所述筛选特征,拟合出每个所述筛选特征分别对应的权重系数;
分数计算模块,用于根据待评估用户对应的每个所述筛选特征的所述权重系数和所述权重占比值,基于预先设定的基础分和预设计算公式,计算得到所述待评估用户对应的违约风险分数。
7.如权利要求6所述的服务器,其特征在于,所述参数计算模块包括:
提取单元,用于根据预设特征,对所述初选样本数据进行筛选,提取出符合所述预设特征的筛选样本数据;
分段单元,用于按照所述预设特征中特征类型与数值分段跨度的映射关系,对所述筛选样本数据中值为连续数的所述预设特征进行值的区间分段,得到对应的分段区间;
参数计算单元,用于:
按照预设分析规则,计算分段后每一个所述分段区间对应的违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异值,得到对应的所述权重占比值;基于得到的所述权重占比值,计算分段后所述预设特征中每一个分段区间所分别对应的区间风险关系值;
参数求和单元,用于将计算得到的每个分段区间对应的所述区间风险关系值相加,得到每一个所述预设特征所分别对应的总的所述风险关系值。
8.如权利要求7所述的服务器,其特征在于,所述参数计算单元还用于:
为所述筛选数据中值为非连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;同时,为所述筛选数据中值为连续数的每一个所述预设特征对应的所有筛选数据,生成对应的样本数据违约风险评价表;
基于生成的所述违约风险评价表,计算分段后每一个所述分段区间对应的违约用户对正常用户的占比P1,以及总体中违约用户对正常用户的占比P2;
计算占比P1和占比P2之间的差异值,得到对应的所述权重占比值。
9.如权利要求6所述的服务器,其特征在于,所述系数拟合模块包括:
筛选单元,用于将所述风险关系值大于预设阈值的预设特征筛选出来,得到对应的所述筛选特征;
拟合单元,用于将每个所述筛选特征分别作为变量,按照预设拟合公式对所述筛选特征进行拟合,计算出每个所述筛选特征分别对应的权重系数。
10.如权利要求6至9任一项所述的服务器,其特征在于,所述分数计算模块包括:
设定单元,用于根据违约用户比例,预先设定所述基础分;
分数计算单元,用于根据待评估用户对应的每个所述筛选特征的所述权重系数和权重占比值,按照所述预设计算公式,计算每个所述筛选特征所分别对应的特征权重分数,得到对应的特征权重分数;
分数求和单元,用于计算所述基础分与所有所述特征权重分数的和,并将计算得到的和作为所述待评估用户对应的违约风险分数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510646178.8A CN106570753A (zh) | 2015-10-08 | 2015-10-08 | 对违约风险进行控制的方法及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510646178.8A CN106570753A (zh) | 2015-10-08 | 2015-10-08 | 对违约风险进行控制的方法及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106570753A true CN106570753A (zh) | 2017-04-19 |
Family
ID=58506540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510646178.8A Pending CN106570753A (zh) | 2015-10-08 | 2015-10-08 | 对违约风险进行控制的方法及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106570753A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239882A (zh) * | 2017-05-10 | 2017-10-10 | 平安科技(深圳)有限公司 | 风险评估方法、装置、计算机设备及存储介质 |
WO2019080425A1 (zh) * | 2017-10-26 | 2019-05-02 | 平安科技(深圳)有限公司 | 客户评分方法、系统、计算机设备及存储介质 |
CN110363390A (zh) * | 2019-06-18 | 2019-10-22 | 中国平安人寿保险股份有限公司 | 基于大数据的风险预测方法、系统、设备及存储介质 |
CN110490720A (zh) * | 2019-07-08 | 2019-11-22 | 深圳壹账通智能科技有限公司 | 财务数据分析预警方法、装置、计算机设备和存储介质 |
CN112017063A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 基于综合风险评分的资源分配方法、装置及电子设备 |
CN112016791A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 资源分配方法、装置及电子设备 |
CN112016796A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 综合风险评分请求处理方法、装置及电子设备 |
-
2015
- 2015-10-08 CN CN201510646178.8A patent/CN106570753A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239882A (zh) * | 2017-05-10 | 2017-10-10 | 平安科技(深圳)有限公司 | 风险评估方法、装置、计算机设备及存储介质 |
WO2018205371A1 (zh) * | 2017-05-10 | 2018-11-15 | 平安科技(深圳)有限公司 | 风险评估方法、装置、服务器和存储介质 |
WO2019080425A1 (zh) * | 2017-10-26 | 2019-05-02 | 平安科技(深圳)有限公司 | 客户评分方法、系统、计算机设备及存储介质 |
CN110363390A (zh) * | 2019-06-18 | 2019-10-22 | 中国平安人寿保险股份有限公司 | 基于大数据的风险预测方法、系统、设备及存储介质 |
CN110490720A (zh) * | 2019-07-08 | 2019-11-22 | 深圳壹账通智能科技有限公司 | 财务数据分析预警方法、装置、计算机设备和存储介质 |
CN112017063A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 基于综合风险评分的资源分配方法、装置及电子设备 |
CN112016791A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 资源分配方法、装置及电子设备 |
CN112016796A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 综合风险评分请求处理方法、装置及电子设备 |
CN112016796B (zh) * | 2020-07-15 | 2024-03-01 | 北京淇瑀信息科技有限公司 | 综合风险评分请求处理方法、装置及电子设备 |
CN112017063B (zh) * | 2020-07-15 | 2024-04-26 | 北京淇瑀信息科技有限公司 | 基于综合风险评分的资源分配方法、装置及电子设备 |
CN112016791B (zh) * | 2020-07-15 | 2024-04-26 | 北京淇瑀信息科技有限公司 | 资源分配方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106570753A (zh) | 对违约风险进行控制的方法及服务器 | |
CN108416664A (zh) | 基于消费信贷场景的风险评估方法及系统实现 | |
CN108053310A (zh) | 信用风险评分方法、装置、计算机设备及存储介质 | |
CN111143339B (zh) | 一种业务资源的分配方法、装置、设备及存储介质 | |
CN107403326A (zh) | 一种基于电信数据的保险欺诈识别方法及装置 | |
CN116342259A (zh) | 一种用户信用自动评级方法、装置、电子设备及介质 | |
CN108256691A (zh) | 还款概率预测模型构建方法及装置 | |
CN106600455A (zh) | 一种基于逻辑回归的电费敏感度评估方法 | |
CN106651570A (zh) | 一种贷款实时审批系统和方法 | |
CN106296389A (zh) | 一种用户信用度的评估方法及装置 | |
CN108198067A (zh) | 贷款额度自动评定系统及贷款额度自动评定方法 | |
CN112102073A (zh) | 信贷风险控制方法及系统、电子设备及可读存储介质 | |
CN103605714B (zh) | 网站异常数据的识别方法及装置 | |
CN107644098A (zh) | 一种欺诈行为识别方法、装置、设备及存储介质 | |
CN110930218B (zh) | 一种识别欺诈客户的方法、装置及电子设备 | |
Woods et al. | Towards integrating insurance data into information security investment decision making | |
CN111709826A (zh) | 目标信息确定方法和装置 | |
CN106651368A (zh) | 防刷单的支付方式的控制方法及控制系统 | |
CN110796539A (zh) | 一种征信评估方法及装置 | |
CN112419030B (zh) | 财务舞弊风险评估的方法、系统及设备 | |
CN112907356A (zh) | 逾期催收方法、装置、系统及计算机可读存储介质 | |
CN110197426B (zh) | 一种信用评分模型的建立方法、装置及可读存储介质 | |
CN108197795A (zh) | 恶意团体账户识别方法、装置、终端及存储介质 | |
CN107590737A (zh) | 个人信用评分以及信用额度测算方法 | |
CN112734247A (zh) | 担保授信自动审批的方法、系统、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170419 |