CN114742644A - 训练多场景风控系统、预测业务对象风险的方法和装置 - Google Patents
训练多场景风控系统、预测业务对象风险的方法和装置 Download PDFInfo
- Publication number
- CN114742644A CN114742644A CN202210510560.6A CN202210510560A CN114742644A CN 114742644 A CN114742644 A CN 114742644A CN 202210510560 A CN202210510560 A CN 202210510560A CN 114742644 A CN114742644 A CN 114742644A
- Authority
- CN
- China
- Prior art keywords
- scene
- risk
- service
- scenes
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Traffic Control Systems (AREA)
Abstract
本说明书实施例提供一种训练多场景风控系统、预测业务对象风险的方法和装置,预测业务对象风险的方法包括:获取目标业务对象的个体特征和场景特征;将所述个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;将所述场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;以各成员水平为权重对所述N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。能够降低对敏感数据的需求且能够准确预测业务对象风险。
Description
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及训练多场景风控系统、利用多场景风控系统预测业务对象风险的方法和装置。
背景技术
在各种业务领域,常常需要进行风险控制,也就是说,需要评估业务对象的风险等级,例如,业务对象的风险等级越低表明该业务对象的风险越低,上述风险可以但不限于包括违约风险,对于评估结果为风险等级较低的业务对象提供业务,而对于评估结果为风险等级较高的业务对象不提供业务。为了保证风险控制的准确性,需要在不同的业务场景下,均能够准确评估业务对象的风险等级。
以大数据、人工智能为代表的新技术的发展为现有风险控制相关问题的解决提供了很好的契机。然而,由于业务场景的复杂性及业务数据的敏感性,一方面无法获取足量数据用于人工智能算法和大数据分析,另一方面单一的模型无法适应多变复杂的业务场景,使得基于大数据、人工智能等技术的智能风控体系一度陷入瓶颈。
因此,希望能有改进的方案,能够降低对敏感数据的需求且能够准确预测业务对象风险。
发明内容
本说明书一个或多个实施例描述了一种训练多场景风控系统、利用多场景风控系统预测业务对象风险的方法和装置,能够降低对敏感数据的需求且能够准确预测业务对象风险。
第一方面,提供了一种训练多场景风控系统的方法,所述多场景风控系统包括N个场景模型和场景融合器;方法包括:
获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签;
利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分;
获取第二业务样本集,其中任意的第二业务样本具有风险标签;
将所述第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分;
将所述第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平;
以各成员水平为权重,对所述N个风险评分加权求和,得到综合评分;
基于所述综合评分与所述第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。
在一种可能的实施方式中,所述第一业务样本集中的样本数量小于所述第二业务样本集。
在一种可能的实施方式中,所述利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,包括:
根据所述第一业务样本的场景标签,确定其适用的第一场景;
将所述第一业务样本的个体特征输入所述第一场景对应的第一场景模型,根据模型输出和所述第一业务样本的风险标签,训练所述第一场景模型。
在一种可能的实施方式中,所述通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平,包括:
所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
进一步地,所述场景融合器为基于隐含狄利克雷分布(latent Dirichletallocation,LDA)模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
第二方面,提供了一种利用多场景风控系统预测业务对象风险的方法,所述多场景风控系统包括N个场景模型和场景融合器;方法包括:
获取目标业务对象的个体特征和场景特征;
将所述个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;
将所述场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;
以各成员水平为权重对所述N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。
在一种可能的实施方式中,所述通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平,包括:
所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
进一步地,所述场景融合器为基于隐含狄利克雷分布LDA模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
在一种可能的实施方式中,所述N个场景均属于信贷业务领域;所述目标业务对象属于信贷业务中的借款方;所述个体特征包括所述借款方的工商数据;所述场景特征包括如下至少一项:
所述借款方的历史贷款业务的金额、历史贷款业务的利率、历史贷款业务对应的信贷产品类型。
第三方面,提供了一种训练多场景风控系统的装置,所述多场景风控系统包括N个场景模型和场景融合器;装置包括:
第一获取单元,用于获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签;
第一训练单元,用于利用所述第一获取单元获取的第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分;
第二获取单元,用于获取第二业务样本集,其中任意的第二业务样本具有风险标签;
第一评分单元,用于将所述第二获取单元获取的第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分;
融合单元,用于将所述第二获取单元获取的第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平;
第二评分单元,用于以所述融合单元得到的各成员水平为权重,对所述第一评分单元得到的N个风险评分加权求和,得到综合评分;
第二训练单元,用于基于所述第二评分单元得到的综合评分与所述第二获取单元获取的第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。
第四方面,提供了一种利用多场景风控系统预测业务对象风险的装置,所述多场景风控系统包括N个场景模型和场景融合器;装置包括:
获取单元,用于获取目标业务对象的个体特征和场景特征;
第一评分单元,用于将所述获取单元获取的个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;
融合单元,用于将所述获取单元获取的场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;
第二评分单元,用于以所述融合单元得到的各成员水平为权重对所述第一评分单元得到的N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。
第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面的方法。
第六方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面或第二方面的方法。
通过本说明书实施例提供的训练多场景风控系统的方法和装置,首先获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签;然后利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分;接着获取第二业务样本集,其中任意的第二业务样本具有风险标签;再将所述第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分;再将所述第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平;再以各成员水平为权重,对所述N个风险评分加权求和,得到综合评分;最后基于所述综合评分与所述第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。由上可见,本说明书实施例,多场景风控系统包括适用于N个场景的N个场景模型和场景融合器,在训练多场景风控系统时,用到了第一业务样本和第二业务样本,其中第一业务样本具有场景标签,第二业务样本不具有场景标签,场景标签属于敏感数据,在缺失敏感数据时,通过模糊聚类的方式由场景融合器为未知场景选择合适的场景模型进行风险预测以达到较佳的风险管理效果,场景自适应的能力充分体现了智能风控的优势,大大节约了人力成本和计算成本,能够降低对敏感数据的需求且能够准确预测业务对象风险。
通过本说明书实施例提供的利用多场景风控系统预测业务对象风险的方法和装置,首先获取目标业务对象的个体特征和场景特征;然后将所述个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;接着将所述场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;最后以各成员水平为权重对所述N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。由上可见,本说明书实施例,多场景风控系统包括适用于N个场景的N个场景模型和场景融合器,在预测业务对象风险时,通过模糊聚类的方式由场景融合器为未知场景选择合适的场景模型进行风险预测以达到较佳的风险管理效果,场景自适应的能力充分体现了智能风控系统的优势,大大节约了人力成本和计算成本,能够降低对敏感数据的需求且能够准确预测业务对象风险。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例的实施场景示意图;
图2为本说明书披露的另一个实施例的实施场景示意图;
图3示出根据一个实施例的训练多场景风控系统的方法流程图;
图4示出根据一个实施例的利用多场景风控系统预测业务对象风险的方法流程图;
图5示出根据一个实施例的训练多场景风控系统的装置的示意性框图;
图6示出根据一个实施例的利用多场景风控系统预测业务对象风险的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的实施场景示意图。该实施场景涉及利用多场景风控系统预测业务对象风险,所述多场景风控系统包括N个场景模型和场景融合器。参照图1,中大企业信贷模型、小微企业信贷模型、…、中长期信贷模型和短期信贷模型为N个场景模型,N个场景模型分别适用于N个场景。如果已知业务对象的场景为N个场景中的第一场景,则将业务对象的个体特征输入第一场景的场景模型就可以得到该业务对象的风险评分,该风险评分可以指示出业务对象的风险等级。本说明书实施例,主要针对业务对象的场景未知的情况,提出风险预测的解决方案,其中,该业务对象的场景可以与前述N个场景中的任一场景均不完全一致,可以称之为新场景。
本说明书实施例,将业务对象的个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分,将业务对象的场景特征输入场景融合器,通过模糊聚类的方式得到该业务对象分别属于所述N个场景的各成员水平,以各成员水平为权重对所述N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。举例来说,N个风险评分分别为F1、F2、…、FN,N个成员水平即N个权重分别为a1、a2、…、aN,则加权求和得到综合风险评分的过程为F1×a1+F2×a2+…+FN×aN。
本说明书实施例属于智能风控,由于不必针对新场景进行定制化建模,因此可以有效降低风控成本。
智能风控:综合运用大数据、人工智能或云计算等先进的技术手段,以数据驱动风险管理,达到风险管理流程的智能化转型,提升风控自动化程度,在有效降低风险事件发生概率和损失的前提下,降低风控成本,扩展服务的覆盖人群。
模糊聚类:亦称软聚类,数据点可能归属于不止一个聚类中,并且这些聚类与数据点通过一个成员水平联系起来。成员水平显示了数据点与某一聚类之间的联系有多强。模糊聚类就是计算这些成员水平,按照成员水平来决定数据点属于哪一个或哪些聚类的过程。
本说明书实施例可以应用于信贷业务领域,用于预测业务对象是否具有信贷风险。
信贷风险:是指商业银行等机构在信贷业务经营过程中,由于受到各种内外部不确定因素的影响,资产蒙受经济损失的可能性。
本说明书实施例还可以应用于其他业务领域,用于预测业务对象是否具有违约风险。例如,共享单车业务领域,用于预测业务对象是否具有指定地点归还车辆的风险。
图2为本说明书披露的另一个实施例的实施场景示意图。该实施场景涉及利用多场景风控系统预测业务对象风险,图2主要体现了图1中的场景融合器的结构。参照图2,将业务对象的场景特征输入场景融合器,场景融合器会为该业务对象分配每一个场景模型的权重以达到较佳的预测效果。例如,场景融合器为场景模型1分配的权重为0.3,场景融合器为场景模型2分配的权重为0.2,为另一个场景模型分配的权重为0.5。
图3示出根据一个实施例的训练多场景风控系统的方法流程图,所述多场景风控系统包括N个场景模型和场景融合器,该实施例可以基于图1和图2所示的实施场景。如图3所示,该实施例中训练多场景风控系统的方法包括以下步骤:步骤31,获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签;步骤32,利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分;步骤33,获取第二业务样本集,其中任意的第二业务样本具有风险标签;步骤34,将所述第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分;步骤35,将所述第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平;步骤36,以各成员水平为权重,对所述N个风险评分加权求和,得到综合评分;步骤37,基于所述综合评分与所述第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。下面描述以上各个步骤的具体执行方式。
首先在步骤31,获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签。可以理解的是,风险标签用于指示业务对象的风险等级,例如,业务对象是否具有风险。
其中,由于业务数据的敏感性,常常难以获得样本的场景标签,因此第一业务样本集通常包含的样本数量较少。
然后在步骤32,利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分。可以理解的是,业务对象的个体特征是能够用于反映该业务对象的风险评分的特征,而不能够反映出该业务对象的场景。
在一个示例中,所述利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,包括:
根据所述第一业务样本的场景标签,确定其适用的第一场景;
将所述第一业务样本的个体特征输入所述第一场景对应的第一场景模型,根据模型输出和所述第一业务样本的风险标签,训练所述第一场景模型。
该示例中,采取有监督学习的方式训练场景模型。可以理解的是,由于第一业务样本具有对应的业务对象所属场景的场景标签,因此可以将第一业务样本集划分为多个样本子集,每个样本子集中的业务样本具有相同的场景标签,从而利用一个样本子集中的业务样本训练相应场景的场景模型。
接着在步骤33,获取第二业务样本集,其中任意的第二业务样本具有风险标签。可以理解的是,该第二业务样本不具有场景标签。
其中,由于业务数据的敏感性,常常难以获得样本的场景标签,因此第二业务样本集通常包含的样本数量较多。
在一个示例中,所述第一业务样本集中的样本数量小于所述第二业务样本集。
再在步骤34,将所述第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分。可以理解的是,每个场景模型得到一个风险评分,由于第二业务样本不具有场景标签,因此无法选择适用的场景模型,上述风险评分并不能够准确反映第二业务样本对应的业务对象的风险等级。
本说明书实施例,所述N个场景模型的输入是相同的,均为第二业务样本的个体特征。
再在步骤35,将所述第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平。可以理解的是,该第二业务样本可以属于所述N个场景中的不止一个场景。
在一个示例中,所述通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平,包括:
所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
进一步地,所述场景融合器为基于隐含狄利克雷分布(latent Dirichletallocation,LDA)模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
再在步骤36,以各成员水平为权重,对所述N个风险评分加权求和,得到综合评分。可以理解的是,综合评分既与成员水平有关,也与风险评分有关,也就是说,场景融合器的准确性与场景模型的准确性都会影响到综合评分的准确性。
最后在步骤37,基于所述综合评分与所述第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。可以理解的是,该联合训练基于的第二业务样本具有风险标签,但不具有场景标签,因此属于一种无监督学习的方式。
本说明书实施例,场景模型训练了两次,第一次训练为仅针对场景模型的有监督学习的方式,其利用的第一业务样本可以仅具有个体特征而不具有场景特征;第二次训练为针对N个场景模型和场景融合器的无监督学习的方式,其利用的第二业务样本需要既具有个体特征也具有场景特征。
在一个示例中,所述N个场景均属于信贷业务领域;所述业务对象属于信贷业务中的借款方;所述个体特征包括所述借款方的工商数据;所述场景特征包括如下至少一项:
所述借款方的历史贷款业务的金额、历史贷款业务的利率、历史贷款业务对应的信贷产品类型。
通过本说明书实施例提供的训练多场景风控系统的方法,首先获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签;然后利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分;接着获取第二业务样本集,其中任意的第二业务样本具有风险标签;再将所述第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分;再将所述第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平;再以各成员水平为权重,对所述N个风险评分加权求和,得到综合评分;最后基于所述综合评分与所述第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。由上可见,本说明书实施例,多场景风控系统包括适用于N个场景的N个场景模型和场景融合器,在训练多场景风控系统时,用到了第一业务样本和第二业务样本,其中第一业务样本具有场景标签,第二业务样本不具有场景标签,场景标签属于敏感数据,在缺失敏感数据时,通过模糊聚类的方式由场景融合器为未知场景选择合适的场景模型进行风险预测以达到较佳的风险管理效果,场景自适应的能力充分体现了智能风控的优势,大大节约了人力成本和计算成本,能够降低对敏感数据的需求且能够准确预测业务对象风险。
图4示出根据一个实施例的利用多场景风控系统预测业务对象风险的方法流程图,所述多场景风控系统包括N个场景模型和场景融合器,该实施例可以基于图1和图2所示的实施场景,以及图3训练后得到的多场景风控系统。如图4所示,该实施例中利用多场景风控系统预测业务对象风险的方法包括以下步骤:步骤41,获取目标业务对象的个体特征和场景特征;步骤42,将所述个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;步骤43,将所述场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;步骤44,以各成员水平为权重对所述N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。下面描述以上各个步骤的具体执行方式。
首先在步骤41,获取目标业务对象的个体特征和场景特征。可以理解的是,在不同的场景下,目标业务对象具有不同的场景特征,该目标业务对象的场景未知。
在一个示例中,所述N个场景均属于信贷业务领域;所述目标业务对象属于信贷业务中的借款方;所述个体特征包括所述借款方的工商数据;所述场景特征包括如下至少一项:
所述借款方的历史贷款业务的金额、历史贷款业务的利率、历史贷款业务对应的信贷产品类型。
然后在步骤42,将所述个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分。可以理解的是,N个场景模型的输入是相同的,均为所述个体特征,每个场景模型输出一个风险评分。
接着在步骤43,将所述场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平。可以理解的是,该目标业务对象可以属于所述N个场景中的不止一个场景。
在一个示例中,所述通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平,包括:
所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
进一步地,所述场景融合器为基于隐含狄利克雷分布LDA模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
最后在步骤44,以各成员水平为权重对所述N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。可以理解的是,该综合风险评分更能够准确反映目标业务对象的风险等级。
通过本说明书实施例提供的利用多场景风控系统预测业务对象风险的方法,首先获取目标业务对象的个体特征和场景特征;然后将所述个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;接着将所述场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;最后以各成员水平为权重对所述N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。由上可见,本说明书实施例,多场景风控系统包括适用于N个场景的N个场景模型和场景融合器,在预测业务对象风险时,通过模糊聚类的方式由场景融合器为未知场景选择合适的场景模型进行风险预测以达到较佳的风险管理效果,场景自适应的能力充分体现了智能风控系统的优势,大大节约了人力成本和计算成本,能够降低对敏感数据的需求且能够准确预测业务对象风险。
根据另一方面的实施例,还提供一种训练多场景风控系统的装置,所述多场景风控系统包括N个场景模型和场景融合器,该装置用于执行本说明书实施例提供的训练多场景风控系统的方法。图5示出根据一个实施例的训练多场景风控系统的装置的示意性框图。
如图5所示,该装置500包括:
第一获取单元51,用于获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签;
第一训练单元52,用于利用所述第一获取单元51获取的第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分;
第二获取单元53,用于获取第二业务样本集,其中任意的第二业务样本具有风险标签;
第一评分单元54,用于将所述第二获取单元53获取的第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分;
融合单元55,用于将所述第二获取单元53获取的第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平;
第二评分单元56,用于以所述融合单元55得到的各成员水平为权重,对所述第一评分单元54得到的N个风险评分加权求和,得到综合评分;
第二训练单元57,用于基于所述第二评分单元56得到的综合评分与所述第二获取单元53获取的第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。
可选地,作为一个实施例,所述第一业务样本集中的样本数量小于所述第二业务样本集。
可选地,作为一个实施例,所述第一训练单元52包括:
确定子单元,用于根据所述第一业务样本的场景标签,确定其适用的第一场景;
训练子单元,用于将所述第一业务样本的个体特征输入所述确定子单元确定的第一场景对应的第一场景模型,根据模型输出和所述第一业务样本的风险标签,训练所述第一场景模型。
可选地,作为一个实施例,所述融合单元55,具体用于所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
进一步地,所述场景融合器为基于隐含狄利克雷分布LDA模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
通过本说明书实施例提供的训练多场景风控系统的装置,首先第一获取单元51获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签;然后第一训练单元52利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分;接着第二获取单元53获取第二业务样本集,其中任意的第二业务样本具有风险标签;第一评分单元54再将所述第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分;融合单元55再将所述第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平;第二评分单元56再以各成员水平为权重,对所述N个风险评分加权求和,得到综合评分;最后第二训练单元57基于所述综合评分与所述第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。由上可见,本说明书实施例,多场景风控系统包括适用于N个场景的N个场景模型和场景融合器,在训练多场景风控系统时,用到了第一业务样本和第二业务样本,其中第一业务样本具有场景标签,第二业务样本不具有场景标签,场景标签属于敏感数据,在缺失敏感数据时,通过模糊聚类的方式由场景融合器为未知场景选择合适的场景模型进行风险预测以达到较佳的风险管理效果,场景自适应的能力充分体现了智能风控的优势,大大节约了人力成本和计算成本,能够降低对敏感数据的需求且能够准确预测业务对象风险。
根据另一方面的实施例,还提供一种利用多场景风控系统预测业务对象风险的装置,所述多场景风控系统包括N个场景模型和场景融合器,该装置用于执行本说明书实施例提供的利用多场景风控系统预测业务对象风险的方法。图6示出根据一个实施例的利用多场景风控系统预测业务对象风险的装置的示意性框图。如图6所示,该装置600包括:
获取单元61,用于获取目标业务对象的个体特征和场景特征;
第一评分单元62,用于将所述获取单元61获取的个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;
融合单元63,用于将所述获取单元61获取的场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;
第二评分单元64,用于以所述融合单元63得到的各成员水平为权重对所述第一评分单元62得到的N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。
可选地,作为一个实施例,所述融合单元63,具体用于所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
进一步地,所述场景融合器为基于隐含狄利克雷分布LDA模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
可选地,作为一个实施例,所述N个场景均属于信贷业务领域;所述目标业务对象属于信贷业务中的借款方;所述个体特征包括所述借款方的工商数据;所述场景特征包括如下至少一项:
所述借款方的历史贷款业务的金额、历史贷款业务的利率、历史贷款业务对应的信贷产品类型。
通过本说明书实施例提供的利用多场景风控系统预测业务对象风险的装置,首先获取单元61获取目标业务对象的个体特征和场景特征;然后第一评分单元62将所述个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;接着融合单元63将所述场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;最后第二评分单元64以各成员水平为权重对所述N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。由上可见,本说明书实施例,多场景风控系统包括适用于N个场景的N个场景模型和场景融合器,在预测业务对象风险时,通过模糊聚类的方式由场景融合器为未知场景选择合适的场景模型进行风险预测以达到较佳的风险管理效果,场景自适应的能力充分体现了智能风控系统的优势,大大节约了人力成本和计算成本,能够降低对敏感数据的需求且能够准确预测业务对象风险。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3或图4所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3或图4所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (20)
1.一种训练多场景风控系统的方法,所述多场景风控系统包括N个场景模型和场景融合器;所述方法包括:
获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签;
利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分;
获取第二业务样本集,其中任意的第二业务样本具有风险标签;
将所述第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分;
将所述第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平;
以各成员水平为权重,对所述N个风险评分加权求和,得到综合评分;
基于所述综合评分与所述第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。
2.如权利要求1所述的方法,其中,所述第一业务样本集中的样本数量小于所述第二业务样本集。
3.如权利要求1所述的方法,其中,所述利用所述第一业务样本集,训练分别适用于N个场景的N个场景模型,包括:
根据所述第一业务样本的场景标签,确定其适用的第一场景;
将所述第一业务样本的个体特征输入所述第一场景对应的第一场景模型,根据模型输出和所述第一业务样本的风险标签,训练所述第一场景模型。
4.如权利要求1所述的方法,其中,所述通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平,包括:
所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
5.如权利要求4所述的方法,其中,所述场景融合器为基于隐含狄利克雷分布LDA模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
6.一种利用多场景风控系统预测业务对象风险的方法,所述多场景风控系统包括N个场景模型和场景融合器;所述方法包括:
获取目标业务对象的个体特征和场景特征;
将所述个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;
将所述场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;
以各成员水平为权重对所述N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。
7.如权利要求6所述的方法,其中,所述通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平,包括:
所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
8.如权利要求7所述的方法,其中,所述场景融合器为基于隐含狄利克雷分布LDA模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
9.如权利要求6所述的方法,其中,所述N个场景均属于信贷业务领域;所述目标业务对象属于信贷业务中的借款方;所述个体特征包括所述借款方的工商数据;所述场景特征包括如下至少一项:
所述借款方的历史贷款业务的金额、历史贷款业务的利率、历史贷款业务对应的信贷产品类型。
10.一种训练多场景风控系统的装置,所述多场景风控系统包括N个场景模型和场景融合器;所述装置包括:
第一获取单元,用于获取第一业务样本集,其中任意的第一业务样本具有对应的业务对象所属场景的场景标签,以及该业务对象的风险标签;
第一训练单元,用于利用所述第一获取单元获取的第一业务样本集,训练分别适用于N个场景的N个场景模型,各场景模型用于根据业务对象的个体特征输出该业务对象的风险评分;
第二获取单元,用于获取第二业务样本集,其中任意的第二业务样本具有风险标签;
第一评分单元,用于将所述第二获取单元获取的第二业务样本的个体特征分别输入所述N个场景模型,得到N个风险评分;
融合单元,用于将所述第二获取单元获取的第二业务样本的场景特征输入场景融合器,通过所述场景融合器输出该第二业务样本分别属于所述N个场景的各成员水平;
第二评分单元,用于以所述融合单元得到的各成员水平为权重,对所述第一评分单元得到的N个风险评分加权求和,得到综合评分;
第二训练单元,用于基于所述第二评分单元得到的综合评分与所述第二获取单元获取的第二业务样本的风险标签,联合训练所述N个场景模型和所述场景融合器。
11.如权利要求10所述的装置,其中,所述第一业务样本集中的样本数量小于所述第二业务样本集。
12.如权利要求10所述的装置,其中,所述第一训练单元包括:
确定子单元,用于根据所述第一业务样本的场景标签,确定其适用的第一场景;
训练子单元,用于将所述第一业务样本的个体特征输入所述确定子单元确定的第一场景对应的第一场景模型,根据模型输出和所述第一业务样本的风险标签,训练所述第一场景模型。
13.如权利要求10所述的装置,其中,所述融合单元,具体用于所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
14.如权利要求13所述的装置,其中,所述场景融合器为基于隐含狄利克雷分布LDA模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
15.一种利用多场景风控系统预测业务对象风险的装置,所述多场景风控系统包括N个场景模型和场景融合器;所述装置包括:
获取单元,用于获取目标业务对象的个体特征和场景特征;
第一评分单元,用于将所述获取单元获取的个体特征输入分别适用于N个场景的所述N个场景模型,得到N个风险评分;
融合单元,用于将所述获取单元获取的场景特征输入所述场景融合器,通过所述场景融合器输出所述目标业务对象分别属于所述N个场景的各成员水平;
第二评分单元,用于以所述融合单元得到的各成员水平为权重对所述第一评分单元得到的N个风险评分进行加权求和,得到该目标业务对象的综合风险评分。
16.如权利要求15所述的装置,其中,所述融合单元,具体用于所述场景融合器基于所述场景特征计算N个场景满足的预设分布的分布参数,根据所述分布参数,确定所述各成员水平。
17.如权利要求16所述的装置,其中,所述场景融合器为基于隐含狄利克雷分布LDA模型的主题模型,所述N个场景对应于N个主题,所述预设分布为狄利克雷分布。
18.如权利要求15所述的装置,其中,所述N个场景均属于信贷业务领域;所述目标业务对象属于信贷业务中的借款方;所述个体特征包括所述借款方的工商数据;所述场景特征包括如下至少一项:
所述借款方的历史贷款业务的金额、历史贷款业务的利率、历史贷款业务对应的信贷产品类型。
19.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。
20.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项的所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210510560.6A CN114742644A (zh) | 2022-05-11 | 2022-05-11 | 训练多场景风控系统、预测业务对象风险的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210510560.6A CN114742644A (zh) | 2022-05-11 | 2022-05-11 | 训练多场景风控系统、预测业务对象风险的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114742644A true CN114742644A (zh) | 2022-07-12 |
Family
ID=82286110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210510560.6A Pending CN114742644A (zh) | 2022-05-11 | 2022-05-11 | 训练多场景风控系统、预测业务对象风险的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114742644A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110458393A (zh) * | 2019-07-05 | 2019-11-15 | 阿里巴巴集团控股有限公司 | 一种风险识别方案的确定方法、装置及电子设备 |
-
2022
- 2022-05-11 CN CN202210510560.6A patent/CN114742644A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110458393A (zh) * | 2019-07-05 | 2019-11-15 | 阿里巴巴集团控股有限公司 | 一种风险识别方案的确定方法、装置及电子设备 |
CN110458393B (zh) * | 2019-07-05 | 2023-07-18 | 创新先进技术有限公司 | 一种风险识别方案的确定方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20070260563A1 (en) | Method to continuously diagnose and model changes of real-valued streaming variables | |
CN111369299B (zh) | 识别的方法、装置、设备及计算机可读存储介质 | |
US20170364825A1 (en) | Adaptive augmented decision engine | |
CN114139637B (zh) | 多智能体信息融合方法、装置、电子设备及可读存储介质 | |
CN114355793B (zh) | 用于车辆仿真评测的自动驾驶规划模型的训练方法及装置 | |
CN114261400A (zh) | 一种自动驾驶决策方法、装置、设备和存储介质 | |
CN113449012A (zh) | 基于大数据预测的互联网服务挖掘方法及大数据预测系统 | |
CN113449011A (zh) | 基于大数据预测的信息推送更新方法及大数据预测系统 | |
CN112819024B (zh) | 模型处理方法、用户数据处理方法及装置、计算机设备 | |
CN112766402A (zh) | 算法选择方法、装置和电子设备 | |
CN111159241B (zh) | 一种点击转化预估方法及装置 | |
CN114742644A (zh) | 训练多场景风控系统、预测业务对象风险的方法和装置 | |
CN118195756A (zh) | 用于资源分配的数据分析方法及电子设备 | |
US11455531B2 (en) | Trustworthy predictions using deep neural networks based on adversarial calibration | |
Singh et al. | A feature extraction and time warping based neural expansion architecture for cloud resource usage forecasting | |
CN116362894A (zh) | 多目标学习方法、装置、电子设备及计算机可读存储介质 | |
CN115600818A (zh) | 多维评分方法、装置、电子设备和存储介质 | |
KR102413588B1 (ko) | 학습 데이터에 따른 객체 인식 모델 추천 방법, 시스템 및 컴퓨터 프로그램 | |
US20220414504A1 (en) | Identifying traits of partitioned group from imbalanced dataset | |
CN115130003A (zh) | 模型处理方法、装置、设备及存储介质 | |
CN114443970A (zh) | 基于人工智能和大数据的数字化内容推送方法及ai系统 | |
CN114627085A (zh) | 目标图像的识别方法和装置、存储介质及电子设备 | |
CN113344071A (zh) | 一种基于深度策略梯度的入侵检测算法 | |
CN112288123B (zh) | 资源属性的预测方法和系统、训练方法及相关设备 | |
US20240185369A1 (en) | Biasing machine learning model outputs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |