CN116977064A - 一种基于损失函数的风控模型构建方法、系统及装置 - Google Patents
一种基于损失函数的风控模型构建方法、系统及装置 Download PDFInfo
- Publication number
- CN116977064A CN116977064A CN202311079729.8A CN202311079729A CN116977064A CN 116977064 A CN116977064 A CN 116977064A CN 202311079729 A CN202311079729 A CN 202311079729A CN 116977064 A CN116977064 A CN 116977064A
- Authority
- CN
- China
- Prior art keywords
- model
- credit
- wind control
- score
- loss function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims description 15
- 230000007704 transition Effects 0.000 claims abstract description 117
- 238000000034 method Methods 0.000 claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 51
- 238000011156 evaluation Methods 0.000 claims abstract description 31
- 238000013507 mapping Methods 0.000 claims abstract description 17
- 230000006870 function Effects 0.000 claims description 144
- 230000004580 weight loss Effects 0.000 claims description 34
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 6
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于损失函数的风控模型构建方法、系统及装置,用于提高信贷风控的准确性和模型的稳定性。本申请方法包括:获取若干用户的信贷信息和第一信贷评分,第一信贷评分为现有模型中对应用户的风控评分;确定用户的原标签特征,对原标签特征进行映射得到映射标签特征;根据第一信贷评分与映射标签特征确定特殊标签特征,特殊标签特征包含原标签特征信息与第一信贷评分信息;根据信贷信息、特殊标签特征以及初始模型的模型预测分确定目标损失函数,目标损失函数包括交叉熵损失和现有模型分跃迁损失;基于信贷信息、特殊标签特征以及目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型;对风控模型进行指标评价。
Description
技术领域
本申请涉及风控技术领域,尤其涉及一种基于损失函数的风控模型构建方法、系统及装置。
背景技术
信贷风控作为银行业务流程中控制风险的重要组成部分,越来越多的使用大数据、机器学习模型等AI算法生成信贷风控模型,通过信贷风控模型输出的风控评分对信贷用户进行风险控制。
即在风险控制策略中,信贷风控模型对用户的打分被看作用户授信额度的重要参考依据,模型打分越高的用户违约风险越高,相应的策略部门会给予较低的授信额度,以降低用户发生违约可能带来的损失。
受到大数据和现代金融科技的影响,信贷风控模型存在版本更新或更换。而在不同版本信贷风控模型中,可能由于模型训练过程不同或模型分版本区分度不同,造成同一用户的模型打分可能会存在较大差距,用户评分产生跃迁现象。例如,用户评分由旧模型的高分段跃迁到新模型的低分段,从而使得用户从风险较高的分段跃迁到风险较低的分段。但是,当用户由于从高风险分段跃迁到低风险分段,因此获得较高的授信额度时,有可能该用户会给银行等金融机构带来较大的违约损失,影响信贷风控的准确性和信贷风控模型的稳定性。
发明内容
本申请提供了一种基于损失函数的风控模型构建方法、系统及装置,用于提高信贷风控的准确性和信贷风控模型的稳定性。
本申请第一方面提供了一种基于损失函数的风控模型构建方法,包括:
获取若干用户的信贷信息和第一信贷评分,所述第一信贷评分为现有模型中对应所述用户的风控评分;
确定所述用户的原标签特征,对所述原标签特征进行映射得到映射标签特征;
根据所述第一信贷评分与所述映射标签特征确定特殊标签特征,所述特殊标签特征包含所述原标签特征信息与所述第一信贷评分信息;
根据所述信贷信息、所述特殊标签特征以及初始模型的模型预测分确定目标损失函数,所述目标损失函数包括交叉熵损失和现有模型分跃迁损失;
基于所述信贷信息、所述特殊标签特征以及所述目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型;
对所述风控模型进行指标评价。
可选地,所述基于所述信贷信息、所述特殊标签特征以及初始模型的模型预测分确定目标损失函数包括:
将所述信贷信息和所述特殊标签特征输入初始模型,根据所述信贷信息计算模型预测分,并对所述特殊标签特征进行还原,确定第一信贷评分;
根据所述模型预测分和所述第一信贷评分计算现有模型分跃迁损失,并计算权重损失函数,所述权重损失函数包括交叉熵损失和所述现有模型分跃迁损失;
对所述权重损失函数所包括的现有模型分跃迁损失的正则项系数进行修改操作,确定目标损失函数。
可选地,所述根据所述模型预测分和所述第一信贷评分计算现有模型分跃迁损失包括:
根据目标公式计算现有模型分跃迁损失,所述目标公式如下:
h=(p-S_old)2
其中,h为现有模型分跃迁损失,p为模型预测分,S_old为现有模型的第一信贷评分。
可选地,所述风控模型为基于LightGBM算法的分析模型;
所述计算权重损失函数包括:
根据交叉熵损失和所述现有模型分跃迁损失确定权重损失函数,并基于如下公式计算权重损失函数返回值:
2*(p-S_old)*p*(1-p) 公式一;
2*p*(1-p)*(p*(1-p+(1-2*p)*(p-S_old))) 公式二;
其中,公式一为损失函数一阶导数,公式二为损失函数二阶导数。
可选地,在所述根据所述模型预测分和所述第一信贷评分确定现有模型分跃迁损失之前,所述方法还包括:
计算所述模型预测分和所述第一信贷评分的均值差,根据所述均值差对所述第一信贷评分进行模型分平移,得到平移后的第一信贷评分;
所述根据所述模型预测分和所述第一信贷评分确定现有模型分跃迁损失包括:
根据所述模型预测分和所述平移后的第一信贷评分确定现有模型分跃迁损失。
可选地,所述对所述权重损失函数所包括的现有模型分跃迁损失的正则项系数进行修改操作包括:
通过第一方式或第二方式或第三方式修改所述现有模型分跃迁损失的正则项系数,以使得对不同用户赋予不同损失权重;
其中,第一方式为正则项系数×S_old;
第二方式为正则项系数×(-log(1-S_old)),所述S_old为现有模型的第一信贷评分;
第三方式为根据所述第一信贷评分对所述用户进行正态分布,并修改正则项系数以使得只对所述第一信贷评分大于μ+1.5σ的用户计算现有模型分跃迁损失,其中所述μ为预设均值,所述σ为预设标准差。
可选地,在所述对所述风控模型进行指标评价之前,所述方法还包括:
根据所述第一信贷评分从低到高采用KS分箱算法对所述用户进行分箱操作,将其划分为若干个现有模型分箱;
所述对所述风控模型进行指标评价包括:
确定用户的第二信贷评分,根据第二信贷评分从低到高采用KS分箱算法对用户进行分箱操作,将其划分为若干个风控模型分箱,所述第二信贷评分为将用户的信贷信息输入所述风控模型输出的风控评分;
计算所述现有模型分箱中后a箱的用户跃迁到所述风控模型分箱的第一分箱和第二分箱的比例;
根据所述比例对所述风控模型进行指标评价。
可选地,在所述基于所述信贷信息、所述特殊标签特征以及所述目标损失函数对初始模型进行优化更新和迭代训练之前,在所述根据所述第一信贷评分从低到高采用KS分箱算法对所述用户进行分箱操作,将其划分为若干个现有模型分箱之后,所述方法还包括:
对所述现有模型分箱前m个分箱中原标签特征为好人标签的用户提升第一权重;
对所述现有模型分箱后n个分箱中原标签特征为坏人标签的用户提升第二权重,所述原标签特征包括好人标签和坏人标签。
本申请第二方面提供了一种基于损失函数的风控模型构建系统,包括:
获取单元,用于获取若干用户的信贷信息和第一信贷评分,所述第一信贷评分为现有模型中对应所述用户的风控评分;
映射单元,用于确定所述用户的原标签特征,对所述原标签特征进行映射得到映射标签特征;
第一确定单元,用于根据所述第一信贷评分与所述映射标签特征确定特殊标签特征,所述特殊标签特征包含所述原标签特征信息与所述第一信贷评分信息;
第二确定单元,用于根据所述信贷信息、所述特殊标签特征以及初始模型的模型预测分确定目标损失函数,所述目标损失函数包括交叉熵损失和现有模型分跃迁损失;
训练单元,用于基于所述信贷信息、所述特殊标签特征以及所述目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型;
评价单元,用于对所述风控模型进行指标评价。
可选地,所述第二确定单元具体用于将所述信贷信息和所述特殊标签特征输入初始模型,根据所述信贷信息计算模型预测分,并对所述特殊标签特征进行还原,确定第一信贷评分;
根据所述模型预测分和所述第一信贷评分计算现有模型分跃迁损失,并计算权重损失函数,所述权重损失函数包括交叉熵损失和所述现有模型分跃迁损失;
对所述权重损失函数所包括的现有模型分跃迁损失的正则项系数进行修改操作,确定目标损失函数。
可选地,所述第二确定单元具体用于根据目标公式计算现有模型分跃迁损失,所述目标公式如下:
h=(p-S_old)2
其中,h为现有模型分跃迁损失,p为模型预测分,S_old为现有模型的第一信贷评分。
可选地,所述风控模型为基于LightGBM算法的分析模型;
所述第二确定单元具体用于根据交叉熵损失和所述现有模型分跃迁损失确定权重损失函数,并基于如下公式计算权重损失函数返回值:
2*(p-S_old)*p*(1-p) 公式一;
2*p*(1-p)*(p*(1-p+(1-2*p)*(p-S_old))) 公式二;
其中,公式一为损失函数一阶导数,公式二为损失函数二阶导数。
可选地,所述系统还包括:
平移单元,用于计算所述模型预测分和所述第一信贷评分的均值差,根据所述均值差对所述第一信贷评分进行模型分平移,得到平移后的第一信贷评分;
所述第二确定单元具体用于根据所述模型预测分和所述平移后的第一信贷评分确定现有模型分跃迁损失。
可选地,所述第二确定单元具体用于通过第一方式或第二方式或第三方式修改所述现有模型分跃迁损失的正则项系数,以使得对不同用户赋予不同损失权重;
其中,第一方式为正则项系数×S_old;
第二方式为正则项系数×(-log(1-S_old)),所述S_old为现有模型的第一信贷评分;
第三方式为根据所述第一信贷评分对所述用户进行正态分布,并修改正则项系数以使得只对所述第一信贷评分大于μ+1.5σ的用户计算现有模型分跃迁损失,其中所述μ为预设均值,所述σ为预设标准差。
可选地,所述系统还包括:
分箱单元,用于根据所述第一信贷评分从低到高采用KS分箱算法对所述用户进行分箱操作,将其划分为若干个现有模型分箱;
所述评价单元具体用于确定用户的第二信贷评分,根据第二信贷评分从低到高采用KS分箱算法对用户进行分箱操作,将其划分为若干个风控模型分箱,所述第二信贷评分为将用户的信贷信息输入所述风控模型输出的风控评分;
计算所述现有模型分箱中后a箱的用户跃迁到所述风控模型分箱的第一分箱和第二分箱的比例;
根据所述比例对所述风控模型进行指标评价。
可选地,所述系统还包括:
权重单元,用于对所述现有模型分箱前m个分箱中原标签特征为好人标签的用户提升第一权重;
对所述现有模型分箱后n个分箱中原标签特征为坏人标签的用户提升第二权重,所述原标签特征包括好人标签和坏人标签。
本申请第三方面提供了一种基于损失函数的风控模型构建装置,所述装置包括:
处理器、存储器、输入输出单元以及总线;
所述处理器与所述存储器、所述输入输出单元以及所述总线相连;
所述存储器保存有程序,所述处理器调用所述程序以执行第一方面以及第一方面中任一项可选的基于损失函数的风控模型构建方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上保存有程序,所述程序在计算机上执行时执行第一方面以及第一方面中任一项可选的基于损失函数的风控模型构建方法。
从以上技术方案可以看出,本申请具有以下优点:
本申请方法首先获取若干用户的信贷信息和现有模型中用户的第一信贷评分,确定用户的原标签特征,并对原标签特征进行映射得到映射标签特征;再根据第一信贷评分与映射标签特征确定特殊标签特征。然后根据信贷信息、特殊标签特征以及初始模型的模型预测分确定目标损失函数,该目标损失函数包括交叉熵损失和现有模型分跃迁损失;最后基于信贷信息、特殊标签特征以及目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型,并对该风控模型进行指标评价。
因此,本方案在新版本的风控模型训练过程中,对模型的损失函数进行了设计,在原有交叉熵损失上引入现有模型分跃迁损失,该现有模型分跃迁损失用来表示新风控模型和现有模型之间的信贷评分差异。从而,在模型训练过程中,通过采用包括该现有模型分跃迁损失的目标损失函数,使模型训练向降低新版本风控模型和现有模型分差的方向迭代,以使得在风控模型更新或版本更换时,降低用户风控评分发生跃迁的可能性,提高信贷风控的准确性和风控模型的稳定性。
附图说明
为了更清楚地说明本申请中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的基于损失函数的风控模型构建方法一个实施例流程示意图;
图2为本申请提供的基于损失函数的风控模型构建方法另一个实施例流程示意图;
图3为本申请提供的基于损失函数的风控模型构建系统一个实施例结构示意图;
图4为本申请提供的基于损失函数的风控模型构建系统另一个实施例结构示意图;
图5为本申请提供的基于损失函数的风控模型构建装置一个实施例结构示意图。
具体实施方式
本申请提供了一种基于损失函数的风控模型构建方法、系统及装置,用于提高信贷风控的准确性和信贷风控模型的稳定性。
需要说明的是,本申请提供的基于损失函数的风控模型构建方法,可以应用于终端,还可以应用于服务器上,例如终端可以是智能手机或电脑、平板电脑、智能电视、智能手表、便携计算机终端也可以是台式计算机等固定终端。为方便阐述,本申请中以终端为执行主体进行举例说明。
请参阅图1,图1为本申请提供的基于损失函数的风控模型构建方法的一个实施例,该方法包括:
101、获取若干用户的信贷信息和第一信贷评分,该第一信贷评分为现有模型中对应用户的风控评分;
首先,终端可基于大数据获取若干个用户的信贷信息,构建用户数据集。其中,该信贷信息为用户关于信贷的相关信息。例如该信贷信息可为用户的征信数据和用户基本信息。其中,该征信数据可包括用户的历史信贷申请信息,用户申请的信贷金融产品,用户征信行为数据、银行卡/信用卡数据、往期贷款信息、信贷逾期信息等。该用户基本数据可包括用户的身份证号、姓名、性别、职业等。在获取到用户的信贷信息后,将这些用户的信贷信息输入信贷风控的现有模型中,并输出其对应的风控评分,以分别确定用户的第一信贷评分。
或者,终端可直接继承并获取该现有模型中含有的若干用户的信贷信息和第一信贷评分,从而可根据若干用户的信贷信息和第一信贷评分构建用户数据集,以使得使用该用户数据集作为信贷风控模型的训练集和测试集。
或者,终端还可通过其他方式获取用户的信贷信息和第一信贷评分,具体此处不做限定。
102、确定用户的原标签特征,对原标签特征进行映射得到映射标签特征;
终端从信贷信息中提取并确定用户的原标签特征。该原标签特征可用于表征用户信贷的好/坏类型,例如可将该原标签特征区分为两类,包括好人标签和坏人标签,或包括好用户标签和坏用户标签,或好账户标签和坏用户标签等,或者也可根据实际情况自行设定标签类别,此处不做限定。
此外,原标签特征可直接通过文字分类,也可将其与数字符号进行对应,例如,现有模型中可将用户的原标签特征区分为好人标签和坏人标签,使用数字0和数字1进行表征,数字0代表好人标签,数字1代表坏人标签。
从而,在确定用户的原标签特征之后,终端对原标签特征进行映射得到映射标签特征。具体地,在构建新的风控模型过程中,将原标签特征中的数字0映射为-1,则对应的-1代表好人标签,将原标签特征中的数字1保持不变,则对应的1依旧代表坏人标签。例如,若用户数据集中存在大量用户,前五个5用户在现有模型中的原标签特征为[0,1,0,0,1],则根据上述规则对其进行映射后得到的映射标签特征为[-1,1,-1,-1,1]。或者,本申请也可直接继承现有模型中用户的原标签特征,具体此处不做限定。
103、根据第一信贷评分与映射标签特征确定特殊标签特征,特殊标签特征包含原标签特征信息与第一信贷评分信息;
终端获取用户的第一信贷评分后,将映射好的映射标签特征与第一信贷评分相结合,以确定特殊标签特征。具体地,可将映射标签特征与第一信贷评分相乘,得到特殊标签特征。例如,根据前述,若前5个用户的映射标签特征为[-1,1,-1,-1,1],而根据现有模型确定该5个用户的第一信贷评分为[0.21,0.23,0.12,0.28,0.14],则两者相乘后,得到的特殊标签特征为[-0.21,0.23,-0.12,-0.28,0.14]。其中,该特殊标签特征中包含用户的原标签特征信息和第一信贷评分信息。
104、根据信贷信息、特殊标签特征以及初始模型的模型预测分确定目标损失函数,目标损失函数包括交叉熵损失和现有模型分跃迁损失;
终端根据上述的信贷信息、特殊标签特征及模型预测分对初始模型的损失函数进行设计,确定目标损失函数。
具体地,该初始模型的损失函数主要使用交叉熵损失函数,为了减少在使用新版的风控模型时用户的风控评分发生跃迁的现象。跃迁即用户从原本现有模型中输出的较高的第一信贷评分跃迁到新的风控模型中输出的较低的第二信贷评分,或从现有模型中输出的较低的第一信贷评分跃迁到新风控模型中的较高的第二信贷评分。本申请在原有交叉熵损失的基础上加入现有模型分跃迁损失,从而构造目标损失函数。该现有模型分跃迁损失用来表示同一用户在新的风控模型和现有模型之间的信贷评分差异,从而在终端基于目标损失函数对初始模型的不断训练、学习过程中,可使模型训练向降低新版的风控模型和现有模型之间的分差的方向迭代,以提高模型稳定性。
其中,该现有模型分跃迁损失根据新版模型和上版模型的模型分之间的差距确定。具体地,在模型训练过程中,该现有模型分跃迁损失根据现有模型输出的第一信贷评分和该初始模型的模型预测分之间的差距确定。其中,该模型预测分具体通过将用户数据集中用户的信贷信息和特殊标签特征输入预先构建好的初始模型进行训练后确定。
105、基于信贷信息、特殊标签特征以及目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型;
在确定目标损失函数后,终端使用用户数据集中包含的若干个不同用户的信贷信息和特殊标签特征对预先构建好的初始模型进行不断训练。具体地,根据目标损失函数和模型预测分对初始模型进行优化更新,并循环迭代上述步骤训练,直至目标损失函数达到收敛或目标损失函数达到最小值,得到训练好的风控模型。
106、对风控模型进行指标评价。
终端将风控模型训练好后,对该风控模型进行相应的指标评价。例如,该指标评价可包括模型稳定性指标、用户评分跃迁指标等。以使得当相应的指标达到预设评价值时,确认风控模型的可靠性和稳定性,或当该指标低于预设评价指标时,对该风控模型进行再训练等。本实施例中,还可对风控模型的其他指标进行评价,此处不做具体限定。
本申请实施例中,同时关注现有模型和新训练好的风控模型。首先通过获取若干个用户的信贷信息及相应的第一风控评分、原标签特征等数据。在新版本的风控模型训练过程中,对初始模型的损失函数进行设计,在原使用的交叉熵损失函数上引入现有模型分跃迁损失,通过现有模型分跃迁损失来表示新风控模型和现有模型之间的信贷评分差异。从而,在模型训练过程中,通过采用包括该现有模型分跃迁损失的目标损失函数,可使模型训练向降低新版本风控模型和现有模型分差的方向迭代,最后对训练好的风控模型进行指标评价。可使得在风控模型更新或版本更换时,降低用户风控评分发生跃迁的可能性,提高信贷风控的准确性和风控模型的稳定性。
为使本申请提供的基于损失函数的风控模型构建方法更加的明显易懂,下面对本申请提供的基于损失函数的风控模型构建方法进行详细说明:
请参阅图2,图2为本申请提供的基于损失函数的风控模型构建方法另一个实施例,该方法包括:
201、获取若干用户的信贷信息和第一信贷评分,该第一信贷评分为现有模型中对应用户的风控评分;
202、确定用户的原标签特征,对原标签特征进行映射得到映射标签特征;
203、根据第一信贷评分与映射标签特征确定特殊标签特征,该特殊标签特征包含原标签特征信息与第一信贷评分信息;
本实施例中的步骤201-203与前述图1所示实施例中的步骤101-103类似,此处不再赘述。
204、将信贷信息和特殊标签特征输入初始模型,根据该信贷信息计算模型预测分,并对特殊标签特征进行还原,确定第一信贷评分;
初始模型的输入包括信贷信息和特殊标签特征,初始模型基于输入的信贷信息进行训练,计算用户的模型预测分,并在确定特殊标签特征后,根据特殊标签特征的计算过程对其进行反向还原,以确定其对应的原标签特征和第一信贷评分。例如,若特殊标签特征为[-0.21,0.23,-0.12,-0.28,0.14],根据-1对应0,1对应1的原映射过程,则该标签特征还原为原标签特征[0,1,0,0,1],特殊标签特征取绝对值,还原的第一信贷评分为[0.21,0.23,0.12,0.28,0.14]。
205、计算模型预测分和第一信贷评分的均值差,并根据均值差对第一信贷评分进行模型分平移,得到平移后的第一信贷评分;
可选地,由于模型输出的信贷评分整体分布存在差异,不同版本模型输出的信贷评分也会存在一定的差距,在计算现有模型分跃迁损失时可能会出现较大差距。因此,为了减小差距,减轻现有模型分跃迁损失受到的影响。本实施例中,终端计算模型预测分和现有模型输出的第一信贷评分的均值差。具体地,经由损失函数对模型训练过程输出的模型预测分和标签特征,再根据前述还原出的第一信贷评分和原标签特征,可分别计算第一信贷评分和模型预测分各自的均值,再计算两者的均值差。在确定均值差之后,根据均值差对第一信贷评分进行模型分平移,得到平移后的第一信贷评分。具体地,第一信贷评分减去均值差得到平移后的第一信贷评分。进一步地,平移后的第一信贷评分的范围可设置为0到1,例如若平移后的第一信贷评分小于0,则可将该第一信贷评分设置为0,若平移后的第一信贷评分大于1,则将该第一信贷评分设置为1,此外,也可根据实际情况进行0~1范围内的平移,此处不做具体限定。此处不做限定。
206、根据模型预测分和平移后的第一信贷评分计算现有模型分跃迁损失,并计算权重损失函数,该权重损失函数包括交叉熵损失和现有模型分跃迁损失;
本实施例中,终端可直接根据模型预测分和第一信贷评分计算现有模型分跃迁损失。也可根据模型预测分和经由步骤205对第一信贷评分进行平移后得到的第一信贷评分计算现有模型分跃迁损失。
具体地,该现有模型分跃迁损失为表示模型预测分和第一信贷评分差值的损失。该现有模型分跃迁损失根据目标公式计算得出,该目标公式如下:
h=(p-S_old)2
其中,h为现有模型分跃迁损失,p为模型预测分,S_old为现有模型的第一信贷评分。
在确定现有模型分跃迁损失之后,计算初始模型所使用的权重损失函数,该权重损失函数包括交叉熵损失和现有模型分跃迁损失。即本申请初始模型在训练时所使用的损失函数包含两个部分,一个为分类模型中所使用经典的交叉熵损失函数,一个为本申请为了降低新旧版模型的模型分差异所设定的现有模型分跃迁损失。
此外,本实施例中,风控模型采用基于LightGBM算法的分析模型进行训练,训练时,在根据上述所描述的交叉熵损失和现有模型分跃迁损失确定权重损失函数后,基于如下公式计算权重损失函数返回值:
2*(p-S_old)*p*(1-p) 公式一;
2*p*(1-p)*(p*(1-p+(1-2*p)*(p-S_old))) 公式二;
其中,公式一为损失函数一阶导数,公式二为损失函数二阶导数。具体训练时,在lgb模型中该模型预测分p为y的函数,p=1/(1+exp(-y)),在模型训练时损失函数进行二阶泰勒展开,同时使用公式一和公式二的一阶导数和二阶导数。因此训练过程中权重损失函数返回值为一阶导数和二阶导数,根据该返回值确定模型预测分和用户的标签特征。
207、根据第一信贷评分从低到高采用KS分箱算法对用户进行分箱操作,将其划分为若干个现有模型分箱;
可选地,在获取用户的信贷信息和第一信贷评分之前,或在风控模型的初始模型构建之前,可预先定义风控模型的评价指标,其中该评价指标可包括模型稳定性和模型分排序型等,此处不做限定。然后,在本实施例中,根据用户在现有模型中输出的第一信贷评分按照从低到高的方式采用KS分箱算法对用户进行分箱操作,将不同评分范围的用户划分到若干个现有模型分箱中。例如,若存在100个用户,则可根据第一信贷评分从低到高将100个用户划分为10个分箱,每个分箱内包括10个用户。进一步地,也可按照其他方式对用户进行分箱,例如同时根据用户的标签特征和第一信贷评分对用户进行分箱等,具体此处不做限定。
208、对权重损失函数所包括的现有模型分跃迁损失的正则项系数进行修改操作,确定目标损失函数;
本实施例中,在根据现有模型分跃迁损失和交叉熵损失确定权重损失函数后,可根据以下三种方式对该权重损失函数中的现有模型分跃迁损失的正则项系数进行修改操作,得到目标损失函数,以使得对不同用户赋予不同权重。
其中,第一方式为正则项系数×S_old;第二方式为正则项系数×(-log(1-S_old)),S_old为现有模型的第一信贷评分;第三方式为根据第一信贷评分对用户进行正态分布,并修改正则项系数以使得只对第一信贷评分大于μ+1.5σ的用户计算现有模型分跃迁损失,其中μ为预设均值,σ为预设标准差。该预设均值和预设标准差可根据用户数据集中的用户数量和第一信贷评分范围确定,此处不做具体限定。
进一步地,可具体通过上述三种方式修改目标损失函数中的现有模型分跃迁损失的权重。若将该现有模型分跃迁损失认做为目标损失函数中的正则项系数,则上述三种方式分别是:方式一为现有模型分跃迁损失×S_old;方式二为现有模型分跃迁损失×(-log(1-S_old));方式三为在根据信贷评分对所述用户进行正态分布后,修改目标损失函数中的正则项系数以使得只对所述信贷评分大于μ+1.5σ的用户计算现有模型分跃迁损失。
本实施例中,通过上述方式,可对目标损失函数的现有模型分跃迁损失的比重进行修改,从而在训练过程中可对不同用户赋予不同权重。
209、对现有模型分箱前m个分箱中原标签特征为好人标签的用户提升第一权重;对现有模型分箱后n个分箱中原标签特征为坏人标签的用户提升第二权重,原标签特征包括好人标签和坏人标签;
可选地,由于LightGBM算法模型支持设置样本权重,在根据第一信贷评分从低到高采用KS分箱算法对用户进行分箱,并将其划分为若干个现有模型分箱之后,终端可对现有模型分箱中前m个分箱中原标签特征为好人标签的用户提升第一权重,对后n个分箱中原标签特征为坏人标签的用户提升第二权重,以使得在模型训练过程中,模型更关注这两部分用户的预测结果,提高风控模型的预测准确性。需要说明的是,该数量m、数量n、第一权重和第二权重的具体数值可根据实际情况自行限定,此处不做具体限定。
210、基于信贷信息、特殊标签特征以及目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型;
本实施例中的步骤210与前述图1所示实施例中的步骤类似,具体此处不做赘述。
211、确定用户的第二信贷评分,根据第二信贷评分从低到高采用KS分箱算法对用户进行分箱操作,将其划分为若干个风控模型分箱,该第二信贷评分为将用户的信贷信息输入风控模型输出的风控评分;
可选地,终端将用户的信贷信息输入训练后的风控模型中,输出用户风控评分和用户标签,根据该用户风控评分确定第二信贷评分。然后,根据该第二信贷评分从低到高采用KS分箱算法对用户进行分箱操作,将其划分为若干个风控模型分箱。其中,该风控模型分箱的箱数可与现有模型分箱的箱数相同。
212、计算现有模型分箱中后a箱的用户跃迁到风控模型分箱的第一分箱和第二分箱的比例,根据比例对风控模型进行指标评价。
可选地,终端根据第一信贷评分和第二信贷评分对用户进行分箱,以两种分箱结果对用户进行分组,再根据预先设定的跃迁指标对风控模型的稳定性进行指标评价。具体地,计算现有模型分箱中后a箱的用户跃迁到风控模型分箱第一箱的第一跃迁用户数量,计算该第一跃迁用户数量占该风控模型分箱第一箱内的第一总用户数量的第一占比,确定第一比例,计算现有模型分箱中后a箱的用户跃迁到风控模型分箱第二箱的第二跃迁用户数量,计算该第二跃迁用户数量占该风控模型分箱第二箱内的第二总用户数量的第二占比,确定第二比例,并根据上述第一比例和第二比例对风控模型进行指标评价。当第一比例和/或第二比例低于或等于相应的预设比例时,该风控模型稳定性较高。进一步地,当第一比例和第二比例高于相应的预设比例,确定该风控模型稳定性较差时,可对该风控模型进行进一步训练,提高稳定性。例如,设定跃迁指标的第一预设比例为5%,若第一比例不大于第一预设比例,即当现有模型分箱中后3箱的用户跃迁到风控模型分箱第一箱的第一跃迁用户数量为X1,风控模型分箱中第一箱的第一总用户数量为Y1,则计算第一占比为X1/Y1*100%,得到第一比例,若第一比例不大于5%,则认为该风控模型稳定性较高。或设定跃迁指标的第二预设比例为10%,若第二比例不大于第二预设比例,即当现有模型分箱中后3箱的用户跃迁到风控模型分箱第二箱的第二跃迁数量为X2,风控模型分箱中第二箱的第二总用户数量为Y2,则计算第二占比为X2/Y2*100%,得到第二比例,若第二比例不大于10%,则确定该风控模型稳定性较高。反之,当设定跃迁指标的第一预设比例为5%,当根据第一占比计算得到的第一比例大于5%,或设定跃迁指标的第二预设比例为10%,当根据第二占比计算得到的第二比例大于10%,则确定该风控模型稳定性较差。
需要注意的是,该跃迁指标可在初始模型训练之前进行设定,例如可在获取用户的信贷信息之前进行设定,也可在模型训练完成,得到风控模型后再进行设定,此处不做限定。
本申请实施例通过对初始模型的损失函数进行设计,在原有使用的交叉熵损失函数上引入现有模型分跃迁损失,通过现有模型分跃迁损失来表示新风控模型和现有模型之间的信贷评分差异,使模型训练向降低新版本风控模型和现有模型分差的方向迭代。此外,还针对不同用户赋予不同权重,在损失函数的正则项系数上进行改进,对部分用户的损失赋予不同权重,以及在确定现有模型分箱后,提高处于风险较低分箱且用户标签为好人标签的用户、处于风险较高分箱且用户标签为坏人标签的用户的权重,使得在模型训练过程中更加重视这部分用户,提高模型训练的有效性,使模型训练向降低新版风控模型和现有模型之间的分差的方向迭代,以提高模型稳定性。
上述对本申请提供的基于损失函数的风控模型构建方法进行了说明,下面对本申请提供的基于损失函数的风控模型构建系统进行说明:
请参阅图3,图3为本申请提供的基于损失函数的风控模型构建系统一个实施例,该系统包括:
获取单元301,用于获取若干用户的信贷信息和第一信贷评分,第一信贷评分为现有模型中对应用户的风控评分;
映射单元302,用于确定用户的原标签特征,对原标签特征进行映射得到映射标签特征;
第一确定单元303,用于根据第一信贷评分与映射标签特征确定特殊标签特征,特殊标签特征包含原标签特征信息与第一信贷评分信息;
第二确定单元304,用于根据信贷信息、特殊标签特征以及初始模型的模型预测分确定目标损失函数,目标损失函数包括交叉熵损失和现有模型分跃迁损失;
训练单元305,用于基于信贷信息、特殊标签特征以及目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型;
评价单元306,用于对风控模型进行指标评价。
本实施例系统中,各单元所执行的功能与前述图1所示方法实施例中的步骤对应,具体此处不再赘述。
本申请实施例系统同时关注现有模型和新版风控模型。首先获取若干个用户的信贷信息及相应的第一风控评分、原标签特征等数据。在新版本的风控模型训练过程中,对初始模型的损失函数进行设计,在原使用的交叉熵损失函数上引入现有模型分跃迁损失,通过现有模型分跃迁损失来表示新风控模型和现有模型之间的信贷评分差异。从而,在模型训练过程中,通过采用包括该现有模型分跃迁损失的目标损失函数,可使模型训练向降低新版本风控模型和现有模型分差的方向迭代,最后对训练好的风控模型进行指标评价。可使得在风控模型更新或版本更换时,降低用户风控评分发生跃迁的可能性,提高信贷风控的准确性和风控模型的稳定性。
下面对本申请提供的基于损失函数的风控模型构建系统进行详细说明,请参阅图4,图4为本申请提供的基于损失函数的风控模型构建系统另一个实施例,该系统包括:
获取单元401,用于获取若干用户的信贷信息和第一信贷评分,第一信贷评分为现有模型中对应用户的风控评分;
映射单元402,用于确定用户的原标签特征,对原标签特征进行映射得到映射标签特征;
第一确定单元403,用于根据第一信贷评分与映射标签特征确定特殊标签特征,特殊标签特征包含原标签特征信息与第一信贷评分信息;
第二确定单元404,用于根据信贷信息、特殊标签特征以及初始模型的模型预测分确定目标损失函数,目标损失函数包括交叉熵损失和现有模型分跃迁损失;
训练单元408,用于基于信贷信息、特殊标签特征以及目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型;
评价单元409,用于对风控模型进行指标评价。
可选地,第二确定单元404具体用于将所述信贷信息和所述特殊标签特征输入初始模型,根据所述信贷信息计算模型预测分,并对所述特殊标签特征进行还原,确定第一信贷评分;
根据模型预测分和第一信贷评分计算现有模型分跃迁损失,并计算权重损失函数,该权重损失函数包括交叉熵损失和现有模型分跃迁损失;
对权重损失函数所包括的现有模型分跃迁损失的正则项系数进行修改操作,确定目标损失函数。
可选地,第二确定单元404具体用于根据目标公式计算现有模型分跃迁损失,目标公式如下:
h=(p-S_old)2
其中,h为现有模型分跃迁损失,p为模型预测分,S_old为现有模型的第一信贷评分。
可选地,风控模型为基于LightGBM算法的分析模型;
第二确定单元404具体用于根据交叉熵损失和所述现有模型分跃迁损失确定权重损失函数,并基于如下公式计算权重损失函数返回值:
2*(p-S_old)*p*(1-p) 公式一;
2*p*(1-p)*(p*(1-p+(1-2*p)*(p-S_old))) 公式二;
其中,公式一为损失函数一阶导数,公式二为损失函数二阶导数。
可选地,系统还包括:
平移单元407,用于计算模型预测分和第一信贷评分的均值差,根据均值差对第一信贷评分进行模型分平移,得到平移后的第一信贷评分;
第二确定单元404具体用于根据模型预测分和平移后的第一信贷评分确定现有模型分跃迁损失。
可选地,第二确定单元404具体用于通过第一方式或第二方式或第三方式修改现有模型分跃迁损失的正则项系数,以使得对不同用户赋予不同损失权重;
其中,第一方式为正则项系数×S_old;
第二方式为正则项系数×(-log(1-S_old)),S_old为现有模型的第一信贷评分;
第三方式为根据第一信贷评分对用户进行正态分布,并修改正则项系数以使得只对第一信贷评分大于μ+1.5σ的用户计算现有模型分跃迁损失,其中μ为预设均值,σ为预设标准差。
可选地,系统还包括:
分箱单元405,用于根据第一信贷评分从低到高采用KS分箱算法对用户进行分箱操作,将其划分为若干个现有模型分箱;
评价单元409具体用于确定用户的第二信贷评分,根据第二信贷评分从低到高采用KS分箱算法对用户进行分箱操作,将其划分为若干个风控模型分箱,第二信贷评分为将用户的信贷信息输入风控模型输出的风控评分;
计算现有模型分箱中后a箱的用户跃迁到风控模型分箱的第一分箱和第二分箱的比例;
根据比例对风控模型进行指标评价。
可选地,系统还包括:
权重单元406,用于对现有模型分箱前m个分箱中原标签特征为好人标签的用户提升第一权重;
对现有模型分箱后n个分箱中原标签特征为坏人标签的用户提升第二权重,原标签特征包括好人标签和坏人标签。
本实施例系统中,各单元所执行的功能与前述图2所示方法实施例中的步骤对应,具体此处不再赘述。
本申请实施例系统通过对初始模型的损失函数进行设计,在原有使用的交叉熵损失函数上引入现有模型分跃迁损失,通过现有模型分跃迁损失来表示新风控模型和现有模型之间的信贷评分差异,使模型训练向降低新版本风控模型和现有模型分差的方向迭代。此外,还针对不同用户赋予不同权重,在损失函数的正则项系数上进行改进,对部分用户的损失赋予不同权重,以及在确定现有模型分箱后,提高处于风险较低分箱且用户标签为好人标签的用户、处于风险较高分箱且用户标签为坏人标签的用户的权重,使得在模型训练过程中更加重视这部分用户,提高模型训练的有效性,使模型训练向降低新版风控模型和现有模型之间的分差的方向迭代,以提高模型稳定性。
本申请还提供了一种基于损失函数的风控模型构建装置,请参阅图5,图5为本申请提供的基于损失函数的风控模型构建装置一个实施例,该装置包括:
处理器501、存储器502、输入输出单元503、总线504;
处理器501与存储器502、输入输出单元503以及总线504相连;
存储器502保存有程序,处理器501调用程序以执行如上任一基于损失函数的风控模型构建方法。
本申请还涉及一种计算机可读存储介质,计算机可读存储介质上保存有程序,当程序在计算机上运行时,使得计算机执行如上任一基于损失函数的风控模型构建方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-only memory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (10)
1.一种基于损失函数的风控模型构建方法,其特征在于,所述方法包括:
获取若干用户的信贷信息和第一信贷评分,所述第一信贷评分为现有模型中对应所述用户的风控评分;
确定所述用户的原标签特征,对所述原标签特征进行映射得到映射标签特征;
根据所述第一信贷评分与所述映射标签特征确定特殊标签特征,所述特殊标签特征包含所述原标签特征信息与所述第一信贷评分信息;
根据所述信贷信息、所述特殊标签特征以及初始模型的模型预测分确定目标损失函数,所述目标损失函数包括交叉熵损失和现有模型分跃迁损失;
基于所述信贷信息、所述特殊标签特征以及所述目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型;
对所述风控模型进行指标评价。
2.根据权利要求1所述的风控模型构建方法,其特征在于,所述基于所述信贷信息、所述特殊标签特征以及初始模型的模型预测分确定目标损失函数包括:
将所述信贷信息和所述特殊标签特征输入初始模型,根据所述信贷信息计算模型预测分,并对所述特殊标签特征进行还原,确定第一信贷评分;
根据所述模型预测分和所述第一信贷评分计算现有模型分跃迁损失,并计算权重损失函数,所述权重损失函数包括交叉熵损失和所述现有模型分跃迁损失;
对所述权重损失函数所包括的现有模型分跃迁损失的正则项系数进行修改操作,确定目标损失函数。
3.根据权利要求2所述的风控模型构建方法,其特征在于,所述根据所述模型预测分和所述第一信贷评分计算现有模型分跃迁损失包括:
根据目标公式计算现有模型分跃迁损失,所述目标公式如下:
h=(p-S_old)2
其中,h为现有模型分跃迁损失,p为模型预测分,S_old为现有模型的第一信贷评分。
4.根据权利要求3所述的风控模型构建方法,其特征在于,所述风控模型为基于LightGBM算法的分析模型;
所述计算权重损失函数包括:
根据交叉熵损失和所述现有模型分跃迁损失确定权重损失函数,并基于如下公式计算权重损失函数返回值:
2*(p-S_old)*p*(1-p) 公式一;
2*p*(1-p)*(p*(1-p+(1-2*p)*(p-S_old))) 公式二;
其中,公式一为损失函数一阶导数,公式二为损失函数二阶导数。
5.根据权利要求2所述的风控模型构建方法,其特征在于,在所述根据所述模型预测分和所述第一信贷评分确定现有模型分跃迁损失之前,所述方法还包括:
计算所述模型预测分和所述第一信贷评分的均值差,根据所述均值差对所述第一信贷评分进行模型分平移,得到平移后的第一信贷评分;
所述根据所述模型预测分和所述第一信贷评分确定现有模型分跃迁损失包括:
根据所述模型预测分和所述平移后的第一信贷评分确定现有模型分跃迁损失。
6.根据权利要求2所述的风控模型构建方法,其特征在于,所述对所述权重损失函数所包括的现有模型分跃迁损失的正则项系数进行修改操作包括:
通过第一方式或第二方式或第三方式修改所述现有模型分跃迁损失的正则项系数,以使得对不同用户赋予不同损失权重;
其中,第一方式为正则项系数×S_old;
第二方式为正则项系数×(-log(1-S_old)),所述S_old为现有模型的第一信贷评分;
第三方式为根据所述第一信贷评分对所述用户进行正态分布,并修改正则项系数以使得只对所述第一信贷评分大于μ+1.5σ的用户计算现有模型分跃迁损失,其中所述μ为预设均值,所述σ为预设标准差。
7.根据权利要求1至6中任一项所述的风控模型构建方法,其特征在于,在所述对所述风控模型进行指标评价之前,所述方法还包括:
根据所述第一信贷评分从低到高采用KS分箱算法对所述用户进行分箱操作,将其划分为若干个现有模型分箱;
所述对所述风控模型进行指标评价包括:
确定用户的第二信贷评分,根据第二信贷评分从低到高采用KS分箱算法对用户进行分箱操作,将其划分为若干个风控模型分箱,所述第二信贷评分为将用户的信贷信息输入所述风控模型输出的风控评分;
计算所述现有模型分箱中后a箱的用户跃迁到所述风控模型分箱的第一分箱和第二分箱的比例;
根据所述比例对所述风控模型进行指标评价。
8.根据权利要求7所述的风控模型构建方法,其特征在于,在所述基于所述信贷信息、所述特殊标签特征以及所述目标损失函数对初始模型进行优化更新和迭代训练之前,在所述根据所述第一信贷评分从低到高采用KS分箱算法对所述用户进行分箱操作,将其划分为若干个现有模型分箱之后,所述方法还包括:
对所述现有模型分箱前m个分箱中原标签特征为好人标签的用户提升第一权重;
对所述现有模型分箱后n个分箱中原标签特征为坏人标签的用户提升第二权重,所述原标签特征包括好人标签和坏人标签。
9.一种基于损失函数的风控模型构建系统,其特征在于,所述系统包括:
获取单元,用于获取若干用户的信贷信息和第一信贷评分,所述第一信贷评分为现有模型中对应所述用户的风控评分;
映射单元,用于确定所述用户的原标签特征,对所述原标签特征进行映射得到映射标签特征;
第一确定单元,用于根据所述第一信贷评分与所述映射标签特征确定特殊标签特征,所述特殊标签特征包含所述原标签特征信息与所述第一信贷评分信息;
第二确定单元,用于根据所述信贷信息、所述特殊标签特征以及初始模型的模型预测分确定目标损失函数,所述目标损失函数包括交叉熵损失和现有模型分跃迁损失;
训练单元,用于基于所述信贷信息、所述特殊标签特征以及所述目标损失函数对初始模型进行优化更新和迭代训练,得到训练后的风控模型;
评价单元,用于对所述风控模型进行指标评价。
10.一种基于损失函数的风控模型构建装置,其特征在于,所述装置包括:
处理器、存储器、输入输出单元以及总线;
所述处理器与所述存储器、所述输入输出单元以及所述总线相连;
所述存储器保存有程序,所述处理器调用所述程序以执行如权利要求1至8中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311079729.8A CN116977064A (zh) | 2023-08-25 | 2023-08-25 | 一种基于损失函数的风控模型构建方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311079729.8A CN116977064A (zh) | 2023-08-25 | 2023-08-25 | 一种基于损失函数的风控模型构建方法、系统及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116977064A true CN116977064A (zh) | 2023-10-31 |
Family
ID=88476720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311079729.8A Pending CN116977064A (zh) | 2023-08-25 | 2023-08-25 | 一种基于损失函数的风控模型构建方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116977064A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117408805A (zh) * | 2023-12-15 | 2024-01-16 | 杭银消费金融股份有限公司 | 一种基于稳定性建模的信贷风控方法与系统 |
-
2023
- 2023-08-25 CN CN202311079729.8A patent/CN116977064A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117408805A (zh) * | 2023-12-15 | 2024-01-16 | 杭银消费金融股份有限公司 | 一种基于稳定性建模的信贷风控方法与系统 |
CN117408805B (zh) * | 2023-12-15 | 2024-03-22 | 杭银消费金融股份有限公司 | 一种基于稳定性建模的信贷风控方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108171260B (zh) | 一种图片识别方法及系统 | |
CN110704730B (zh) | 基于大数据的产品数据推送方法、系统及计算机设备 | |
CN107122327B (zh) | 一种利用训练数据训练模型的方法和训练系统 | |
CN112418292B (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN112270547A (zh) | 基于特征构造的金融风险评估方法、装置和电子设备 | |
CN112561082B (zh) | 生成模型的方法、装置、设备以及存储介质 | |
CN109636482B (zh) | 基于相似度模型的数据处理方法及系统 | |
CN113435509A (zh) | 基于元学习的小样本场景分类识别方法及系统 | |
CN116977064A (zh) | 一种基于损失函数的风控模型构建方法、系统及装置 | |
CN111461862B (zh) | 为业务数据确定目标特征的方法及装置 | |
CN109447129A (zh) | 一种多模式情绪识别方法、装置及计算机可读存储介质 | |
CN113807940A (zh) | 信息处理和欺诈行为识别方法、装置、设备及存储介质 | |
CN113177700A (zh) | 一种风险评估方法、系统、电子设备及存储介质 | |
CN113987236A (zh) | 基于图卷积网络的视觉检索模型的无监督训练方法和装置 | |
CN113807469A (zh) | 一种多能源用户价值预测方法、装置、存储介质和设备 | |
CN112819024A (zh) | 模型处理方法、用户数据处理方法及装置、计算机设备 | |
CN116089584A (zh) | 事件抽取的方法、装置、电子设备和介质 | |
CN116310563A (zh) | 一种贵金属库存的管理方法及系统 | |
CN115713386A (zh) | 一种多源信息融合的商品推荐方法及系统 | |
CN111143533A (zh) | 一种基于用户行为数据的客服方法及系统 | |
CN111967973A (zh) | 银行客户数据处理方法及装置 | |
CN117114705A (zh) | 一种基于持续学习的电商欺诈识别方法与系统 | |
CN116738983A (zh) | 模型进行金融领域任务处理的词嵌入方法、装置、设备 | |
CN114882273B (zh) | 应用于狭小空间的视觉识别方法、装置、设备和存储介质 | |
CN113807541B (zh) | 决策系统的公平性修复方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |