CN112200488B - 针对业务对象的风险识别模型训练方法及装置 - Google Patents
针对业务对象的风险识别模型训练方法及装置 Download PDFInfo
- Publication number
- CN112200488B CN112200488B CN202011176715.4A CN202011176715A CN112200488B CN 112200488 B CN112200488 B CN 112200488B CN 202011176715 A CN202011176715 A CN 202011176715A CN 112200488 B CN112200488 B CN 112200488B
- Authority
- CN
- China
- Prior art keywords
- sample
- transaction
- scoring
- risk
- transaction event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Accounting & Taxation (AREA)
- Computer Security & Cryptography (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Finance (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例提供一种针对业务对象的风险识别模型训练方法及装置,在训练方法中,获取当前批次的样本集,其中包括具有正例或负例标签的多个样本。其中,具有正例标签的样本为正例样本,其对应于正常业务对象,具有负例标签的样本为负例样本,其对应于风险业务对象。将各样本输入风险识别模型,以预测各样本的打分。根据样本集中各正例样本的打分以及预定义的打扰率,确定对应于当前批次的样本集的、用于划分高低分段的分位点。根据各样本的打分以及分位点,计算第一预测损失。根据各样本的打分以及各自的正例或负例标签,计算第二预测损失。基于第一预测损失与所述第二预测损失的融合结果,调整风险识别模型的参数。
Description
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种针对业务对象的风险识别模型训练方法及装置。
背景技术
在风险控制领域,为了避免给用户带来经济损失,通常需要基于预先训练的风险识别模型,对业务对象(包括用户或事件)进行风险识别,并基于风险识别结果进行风险控制。
传统技术中,针对上述风险识别模型,通常以全局数据的预测准确率为优化目标,来对其进行训练。然而,基于通过该方法训练的风险识别模型,通常并不能有效提升针对业务对象的风险识别的召回率。也即不能满足风险控制领域的业务需求。
因此,需要提供一种更有效的风险识别模型的训练方法,以便能够提升针对业务对象的风险识别的召回率。
发明内容
本说明书一个或多个实施例描述了一种针对业务对象的风险识别模型训练方法及装置,可以大大提升针对业务对象的风险识别的召回率。
第一方面,提供了一种针对业务对象的风险识别模型训练方法,包括:
获取当前批次的样本集,其中包括具有正例或负例标签的多个样本;其中,具有正例标签的样本为正例样本,其对应于正常业务对象;具有负例标签的样本为负例样本,其对应于风险业务对象;
将所述各样本输入风险识别模型,以预测所述各样本的打分,所述打分表示对应样本为负例样本的概率;
根据所述样本集中各正例样本的打分以及预定义的打扰率,确定对应于当前批次的样本集的、用于划分高低分段的分位点;所述打扰率表示分布在高分段的正例样本的占比;
根据所述各样本的打分以及所述分位点,计算第一预测损失,使得所述第一预测损失反相关于至少部分负例样本的打分与所述分位点的差值;
根据所述各样本的打分以及各自的正例或负例标签,计算第二预测损失;
基于所述第一预测损失与所述第二预测损失的融合结果,调整所述风险识别模型的参数。
第二方面,提供了一种针对业务对象的风险识别模型训练装置,包括:
获取单元,用于获取当前批次的样本集,其中包括具有正例或负例标签的多个样本;其中,具有正例标签的样本为正例样本,其对应于正常业务对象;具有负例标签的样本为负例样本,其对应于风险业务对象;
输入单元,用于将所述各样本输入风险识别模型,以预测所述各样本的打分,所述打分表示对应样本为负例样本的概率;
确定单元,用于根据所述样本集中各正例样本的打分以及预定义的打扰率,确定对应于当前批次的样本集的、用于划分高低分段的分位点;所述打扰率表示分布在高分段的正例样本的占比;
计算单元,用于根据所述各样本的打分以及所述分位点,计算第一预测损失,使得所述第一预测损失反相关于至少部分负例样本的打分与所述分位点的差值;
所述计算单元,还用于根据所述各样本的打分以及各自的正例或负例标签,计算第二预测损失;
调整单元,用于基于所述第一预测损失与所述第二预测损失的融合结果,调整所述风险识别模型的参数。
第三方面,提供了一种提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
本说明书一个或多个实施例提供的针对业务对象的风险识别模型训练方法及装置,可以基于第一预测损失与第二预测损失的融合结果,调整风险识别模型的参数。由于第一预测损失基于各样本的打分以及用于划分高低分段的分位点确定,从而本方案可以从各样本的打分高低角度出发,训练风险识别模型,由此,可以大大提升针对业务对象的风险识别的召回率。
附图说明
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书提供的样本的打分分布示意图;
图2为本说明书提供的针对业务对象的风险识别模型训练方法示意图;
图3本说明书一个实施例提供的针对业务对象的风险识别模型训练方法流程图;
图4为本说明书提供的近似符号函数示意图;
图5为本说明书提供的针对事件的风险识别模型训练方法流程图;
图6为本说明书一个实施例提供的针对业务对象的风险识别模型训练装置示意图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
在描述本说明书实施例提供的方案之前,先对本方案的发明构思作以下说明。
如前所述,在风险控制领域,基于传统的训练方法所训练得到的风险识别模型,通常不能有效提升针对业务对象的风险识别的召回率。本申请的发明人经研究发现,通过在模型训练过程中,提高在一定打扰下的负例样本的召回率,可以有效提升针对业务对象的风险识别的召回率。
为了提高在一定打扰下的负例样本的召回率,本申请的发明人首先研究了在风险识别模型训练过程中,针对一个批次(batch)的样本集中的样本,模型针对其的打分情况。这里的一个批次的样本集是指在模型的多次迭代训练中,其中的一次迭代所使用的样本集。一般而言,一个批次的样本集可以包括具有正例或负例标签的多个样本。其中,具有正例标签的样本为正例样本,其对应于正常业务对象(如,正常用户或者正常事件)。具有负例标签的样本为负例样本,其对应于风险业务对象(如,风险用户或者风险事件)。
在一个例子中,在风险识别模型为二分类模型,且模型针对样本的打分指示该样本为负例样本的概率的情况下,一个批次的样本集中各样本的打分分布可以如图1所示。从图1可以看出,在将样本的打分分为高低两个分段的情况下,正例样本的打分分布在低分段,而负例样本的打分分布在高分段。
再回到上述优化目标:提高在一定打扰下负例样本的召回率。应理解,该优化目标同时包括两方面内容:第一,存在一定打扰;第二,提高负例样本的召回率。关于第一方面,由于负例样本的打分一般分布在高分段,因此,这里的“打扰”是指高分段同时分布有正例样本。进一步的,“一定打扰”可以理解为是高分段分布有一定数目的正例样本。通常情况下,该一定数目的正例样本可以基于预定义的打扰率确定。这里的打扰率表示分布在高分段的正例样本的占比。比如,可以将预定义的打扰率与正例样本的总数目的乘积向上取整后作为上述一定数目。关于第二方面,可以较多关注全部负例样本;或者,也可以只关注分布在高分段的正例样本和负例样本。
应理解,基于上述解决思路,就可以实现提升在一定打扰下负例样本的召回率。需要说明的是,在将该解决思路与传统的模型训练方法结合到一起之后,就可以得到本申请的如下发明构思:
具体地,获取当前批次的样本集,其中包括具有正例或负例标签的多个样本。其中,具有正例标签的样本为正例样本,其对应于正常业务对象,具有负例标签的样本为负例样本,其对应于风险业务对象。将各样本输入风险识别模型,以预测各样本的打分,该打分表示对应样本为负例样本的概率。根据样本集中各正例样本的打分以及预定义的打扰率,确定对应于当前批次的样本集的、用于划分高低分段的分位点。该打扰率表示分布在高分段的正例样本的占比。根据各样本的打分以及分位点,计算第一预测损失,使得第一预测损失反相关于至少部分负例样本的打分与分位点的差值。根据各样本的打分以及各自的正例或负例标签,计算第二预测损失。基于第一预测损失与第二预测损失的融合结果,调整风险识别模型的参数。
以上就是本说明书提供的发明构思,基于该发明构思就可以得到本方案。以下对本方案进行详细阐述。
图2为本说明书提供的针对业务对象的风险识别模型训练方法示意图。图2中,当前批次的样本集可以包括正例样本和负例样本。具体地,可以将该正例样本和负例样本输入前次迭代训练的风险识别模型,输出正例样本和负例样本的打分。基于正例样本的打分以及预定义的打扰率,确定用于划分高低分段的分位点。之后,可以基于该分位点以及正例样本和负例样本的打分,计算第一预测损失。以及,可以基于正例样本和负例样本的打分以及正例或负例标签可以计算第二预测损失。最后,可以基于第一预测损失和第二预测损失的融合结果,调整前次迭代训练的风险识别模型的参数,得到当前次迭代训练的风险识别模型,以供下次迭代使用。
为便于理解,先对上述方法的实际应用场景进行介绍。
在一个示例性场景中,上述业务对象可以为交易事件(或交易行为)。用于训练风险识别模型的样本可以与交易事件相对应,其可以包括交易方、交易时间、交易金额、交易网络环境、交易商品信息等特征数据。
在另一实例性场景中,上述业务对象可以为用户,用于训练风险识别模型的样本可以与用户相对应,其可以包括年龄、职业、性别、薪资以及历史行为习惯等特征数据。
需要理解,以上场景仅作为示例,实际上,上述业务对象还可以包括访问事件等其他业务事件等。总的来说,上述风险识别模型可以为二分类模型。
图3本说明书一个实施例提供的针对业务对象的风险识别模型训练方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置。如图3所示,所述方法具体可以包括:
步骤302,获取当前批次的样本集。
该当前批次的样本集可以是指在模型的多次迭代训练中,其中的一次迭代所使用的样本集。其中包括具有正例或负例标签的多个样本。其中,具有正例标签的样本为正例样本,其对应于正常业务对象。这里的正常业务对象例如可以为正常用户或者正常事件等。具有负例标签的样本为负例样本,其对应于风险业务对象。这里的风险业务对象例如可以为风险用户或者风险事件等。
在一个具体例子中,上述正例标签例如可以为0,负例标签例如可以为1。
步骤304,将样本集中的各样本输入风险识别模型,以预测各样本的打分。
这里的打分表示对应样本为负例样本的概率。
在一个例子中,这里的风险识别模型可以为二分类模型,其可以采用深度学习模型实现。
此外,应理解,在上述一个示例性场景中,各样本的打分可以表示对应样本为风险交易的概率。而在上述另一个示例性场景中,各样本的打分表示对应样本为风险用户的概率。
步骤306,根据样本集中各正例样本的打分以及预定义的打扰率,确定对应于当前批次的样本集的、用于划分高低分段的分位点。
这里的预定义的打扰率表示分布在高分段的正例样本的占比。应理解,基于该打扰率以及正例样本的总数目,就可以确定出上述发明构思所述的一定数目的正例样本。
上述确定分位点的步骤具体可以包括:将各正例样本的打分按照由高到低进行排序。计算各正例样本的总数目与预定义的打扰率的乘积,基于计算的乘积确定分布在高分段的正例样本的第一数目。对于排序后的打分,将排序靠前的第一数目个打分中最后一个打分作为分位点。
在一个实现方式中,可以基于如下公式计算上述第一数目:
C'=INT(dis·C)(公式1)
其中,dis为预定义的打扰率,C为正例样本的总数目,C’为分布在高分段的正例样本的第一数目,也即上述一定数目,INT()为取整函数。
在一个例子中,假设正例样本的总数目为6个,且该6个正例样本的打分分别如下:0.11、0.33、0.55、0.22、0.12和0.77,那么在将该6个打分按照由高到低进行排序后分别为:0.77、0.55、0.33、0.22、0.12和0.11。再假设预定义的打扰率为0.1,那么INT(0.1*6)=1,则0.77为分位点。也即,上述6个打分中0.77属于高分段,其它5个打分属于低分段。
步骤308,根据各样本的打分以及分位点,计算第一预测损失,使得第一预测损失反相关于至少部分负例样本的打分与分位点的差值。
在一种实现方式中,上述计算第一预测损失可以包括:将全部负例样本的打分与分位点进行求差,得到多个差值。根据多个差值,计算第一预测损失。
在一个例子中,上述根据多个差值,计算第一预测损失具体可以包括:将多个差值分别输入近似符号函数,得到多个输出。这里的近似符号函数用于拟合符号函数,且近似符号函数在整个定义域具有导数。对多个输出进行求和,并将求和结果的相反数作为第一预测损失。
在其它例子中,上述拟合符号函数也可以替换为函数值与自变量的取值成正比的其它函数,只要求该函数在整个定义域具有导数即可。
在一个例子中,上述近似符号函数可以如图4所示。图4中,当近似符号函数的自变量x∈[-ε,ε]时,其对应函数值在-1到1之间,且此时该函数具有较大导数。当x<-ε时,其对应函数值取值接近于-1,且此时该函数的导数接近于0。当x>ε时,其对应函数值取值接近于1,且此时该函数的导数也接近于0。也即,该近似符号函数在整个定义域具有导数,且函数值正相关于自变量的取值。
具体地,该例子中计算第一预测损失的步骤具体可以表示为如下公式:
其中,loss1为第一预测损失,n为负例样本的个数,Si为第i个负例样本的打分,1≤i≤n。St为分位点。Fstep()为近似符号函数。
从上述公式2可以看出,第一预测损失反相关于近似符号函数的函数值。由于近似符号函数的函数值正相关于自变量的取值,也即正相关于全部负例样本的打分与分位点的差值,由此可以得出:第一预测损失反相关于全部负例样本的打分与分位点的差值。
应理解,在模型训练过程中,如果以最小化第一预测损失为目标,来训练模型。那么就需要最大化各负例样本的打分与分位点的差值。由此就实现了上述发明构思所述的关注全部负例样本。此外,在上述第一种实现方式中,上述至少部分负例样本为全部负例样本。
在另一种实现方式中,上述计算第一预测损失可以包括:根据对应打分与分位点的差值大于预定阈值的至少部分负例样本(以下简称高分段负例样本)各自对应的差值以及各自的负例标签,计算第一数值。根据对应打分与分位点的差值大于预定阈值的至少部分正例样本(以下简称高分段正例样本)各自对应的差值以及各自的正例标签,计算第二数值。将第二数值与第一数值的差值作为第一预测损失。
在一个例子中,上述计算第一数值具体可以包括:将高分段负例样本各自对应的差值与各自的负例标签进行相乘,得到若干第一乘积。将若干第一乘积分别输入第一近似符号函数,得到若干第一输出。对若干第一输出进行求和,得到第一数值。此外,上述计算第二数值具体可以包括:将高分段正例样本各自对应的差值与各自的正例标签的相反值进行相乘,得到若干第二乘积。将若干第二乘积分别输入第二近似符号函数,得到若干第二输出。对若干第二输出进行求和,得到第二数值。
上述第一近似符号函数和第二近似符号函数与上述一种实现方式中所述的近似符号函数相同,具体可参见图4所示。
在其它例子中,上述第一近似符号函数和第二近似符号函数也可以替换为函数值与自变量的取值成正比的其它函数,只要求该函数在整个定义域具有导数即可。
具体地,该例子中计算第一预测损失的步骤可以表示为如下公式:
其中,loss1为第一预测损失,N1为高分段正例样本的数目,Sp为第p个高分段正例样本的打分,1≤p≤N1。St为分位点。Fstep2()为第二近似符号函数。target为正例或负例标签。在一个例子中,正例标签可以取值为0,负例标签可以取值为1。N2为高分段负例样本的数目,Sq为第q个高分段负例样本的打分,1≤q≤N2。St为分位点。Fstep1()为第一近似符号函数。
对于上述公式3中的mask,其取值可以如下:如果Sp或Sq≥St,那么其取值为1,否则取值为0。
需要说明的是,根据公式3中mask的取值可以看出,第一预测损失只与高分段正例样本的打分与分位点的差值以及高分段负例样本的打分与分位点的差值相关。以下进行详细分析:
从上述公式3可以看出,第一预测损失正相关于第二近似符号函数的函数值,且反相关于第一近似符号函数的函数值。
其中,对于第一预测损失正相关于第二近似符号函数的函数值的结论,由于第二近似符号函数的函数值正相关于自变量的取值,也即正相关于高分段正例样本的打分与分位点的差值,由此可以得出:第一预测损失正相关于高分段正例样本的打分与分位点的差值。其次,对于第一预测损失反相关于第一近似符号函数的函数值的结论,由于第一近似符号函数的函数值正相关于自变量的取值,也即正相关于高分段负例样本的打分与分位点的差值,由此可以得出:第一预测损失反相关于高分段负例样本的打分与分位点的差值。
可见,在上述两种实现方式中,第一预测损失反相关于至少部分负例样本的打分与分位点的差值。
此外,对于上述另一种实现方式,在模型训练过程中,如果以最小化第一预测损失为目标,来训练模型。那么就需要最小化高分段正例样本的打分与分位点的差值,且最大化高分段负例样本的打分与分位点的差值。由此就实现了上述发明构思所述的只关注分布在高分段的正例样本和负例样本。
综合以上,该两种实现方式的共同目标是:最大化至少部分负例样本的打分与分位点的差值。这里的至少部分负例样本可以为全部负例样本(对应与上述一种实现方式),也可以是对应打分与分位点的差值大于预定阈值的、高分段负例样本(对应于上述另一种实现方式)。
步骤310,根据各样本的打分以及各自的正例或负例标签,计算第二预测损失。
在一种实现方式中,在风险识别模型为二分类模型时,可以通过计算各样本的打分以及各自的正例或负例标签之间的交叉熵,并将计算得到的交叉熵作为第二预测损失。
在一个例子中,可以基于如下公式计算第二预测损失:
其中,loss2为第二预测损失,N为当前批次的样本集中各样本的数目,Sj为第j个样本的打分,1≤j≤N,target为正例或负例标签。
步骤312,基于第一预测损失与第二预测损失的融合结果,调整风险识别模型的参数。
具体地,可以对第一预测损失和第二预测损失进行加权求和,得到加权求和结果。以最小化加权求和结果为目标,调整风险识别模型的参数。
在一个例子中,可以基于如下公式进行加权求和:
Loss=α·loss1+(1-α)·loss2 (公式5)
其中,L为加权求和结果,loss1为第一预测损失,loss2为第二预测损失,α在0到1之间取值。
应理解,在实际应用当中,上述步骤302-步骤312是迭代多次执行的,直至满足迭代停止条件,如,迭代次数达到预定次数等。
综上,本说明书实施例提供的针对业务对象的风险识别模型,可以基于第一预测损失与第二预测损失的融合结果,调整风险识别模型的参数。由于第一预测损失基于各样本的打分以及用于划分高低分段的分位点确定,从而本方案可以从各样本的打分高低角度出发,训练风险识别模型,由此,可以大大提升针对业务对象的风险识别的召回率。
以下以业务对象为事件,对本说明书实施例提供的方法进行说明。
图5为本说明书提供的针对事件的风险识别模型训练方法流程图。如图5所示,该方法具体可以包括如下步骤:
步骤502,获取当前批次的样本事件集。
该当前批次的样本事件集可以是指在模型的多次迭代训练中,其中的一次迭代所使用的样本事件集。其中包括具有正例或负例标签的多个样本事件。其中,具有正例标签的样本事件可以为正常事件。具有负例标签的样本事件可以为风险事件。
在一个具体例子中,上述正例标签例如可以为0,负例标签例如可以为1。
步骤504,将各样本事件输入风险识别模型,以预测各样本事件的打分。
该打分表示对应样本事件为风险事件(比如,风险交易)的概率。
步骤506,根据样本事件集中各正常事件的打分以及预定义的打扰率,确定对应于当前批次的样本集的、用于划分高低分段的分位点。
该打扰率表示分布在高分段的正常事件的占比。
步骤508,根据各样本事件的打分以及分位点,计算第一预测损失,使得第一预测损失反相关于至少部分风险事件的打分与分位点的差值。
步骤510,根据各样本事件的打分以及各自的正例或负例标签,计算第二预测损失。
步骤512,基于第一预测损失与第二预测损失的融合结果,调整风险识别模型的参数。
具体地,可以对第一预测损失和第二预测损失进行加权求和,得到加权求和结果。以最小化加权求和结果为目标,调整风险识别模型的参数。
总上,通过本说明书实施例提供的针对事件的风险识别模型训练方法,可以大大提升针对业务对象的风险识别的召回率。
与上述针对业务对象的风险识别模型训练方法对应地,本说明书一个实施例还提供的一种针对业务对象的风险识别模型训练装置,如图6所示,该装置可以包括:
获取单元602,用于获取当前批次的样本集,其中包括具有正例或负例标签的多个样本。其中,具有正例标签的样本为正例样本,其对应于正常业务对象。具有负例标签的样本为负例样本,其对应于风险业务对象。
上述业务对象可以包括用户或事件等。
输入单元604,用于将各样本输入风险识别模型,以预测各样本的打分,该打分表示对应样本为负例样本的概率。
确定单元606,用于根据样本集中各正例样本的打分以及预定义的打扰率,确定对应于当前批次的样本集的、用于划分高低分段的分位点。该打扰率表示分布在高分段的正例样本的占比。
确定单元606具体用于:
将各正例样本的打分按照由高到低进行排序。
计算各正例样本的总数目与预定义的打扰率的乘积,基于计算的乘积确定分布在高分段的正例样本的第一数目。
对于排序后的打分,将排序靠前的第一数目个打分中最后一个打分作为分位点。
计算单元608,用于根据各样本的打分以及分位点,计算第一预测损失,使得第一预测损失反相关于至少部分负例样本的打分与分位点的差值。
计算单元608,还用于根据各样本的打分以及各自的正例或负例标签,计算第二预测损失。
调整单元610,用于基于第一预测损失与第二预测损失的融合结果,调整风险识别模型的参数。
调整单元610具体用于:
对第一预测损失和第二预测损失进行加权求和,得到加权求和结果。
以最小化加权求和结果为目标,调整风险识别模型的参数。
可选地,上述至少部分负例样本为全部负例样本,计算单元608具体用于:
将全部负例样本的打分与分位点进行求差,得到多个差值。
根据多个差值,计算第一预测损失。
计算单元608还具体用于:
将多个差值分别输入近似符号函数,得到多个输出。该近似符号函数用于拟合符号函数,且近似符号函数在整个定义域具有导数。
对多个输出进行求和,并将求和结果的相反数作为第一预测损失。
可选地,上述至少部分负例样本为对应打分与分位点的差值大于预定阈值的负例样本。计算单元608具体用于:
根据至少部分负例样本各自对应的差值以及各自的负例标签,计算第一数值。
根据对应打分与分位点的差值大于预定阈值的至少部分正例样本各自对应的差值以及各自的正例标签,计算第二数值。
将第二数值与第一数值的差值作为第一预测损失。
计算单元608还具体用于:
将至少部分负例样本各自对应的差值与各自的负例标签进行相乘,得到若干第一乘积。将若干第一乘积分别输入第一近似符号函数,得到若干第一输出。对若干第一输出进行求和,得到第一数值。以及
将至少部分正例样本各自对应的差值与各自的正例标签的相反值进行相乘,得到若干第二乘积。将若干第二乘积分别输入第二近似符号函数,得到若干第二输出。对若干第二输出进行求和,得到第二数值。
上述第一近似符号函数或第二近似符号函数用于拟合符号函数,且其在整个定义域具有导数。
本说明书上述实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本说明书一个实施例提供的装置的具体工作过程,在此不复赘述。
本说明书一个实施例提供的针对业务对象的分别识别模型训练装置,可以大大提升针对业务对象的风险识别的召回率。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3或图5所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3或图5所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
结合本说明书公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于服务器中。当然,处理器和存储介质也可以作为分立组件存在于服务器中。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述的具体实施方式,对本说明书的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的具体实施方式而已,并不用于限定本说明书的保护范围,凡在本说明书的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的保护范围之内。
Claims (14)
1.一种针对交易事件的风险识别模型训练方法,包括:
获取当前批次的样本交易事件集,其中包括具有正例或负例标签的多个样本交易事件;其中,具有正例标签的样本交易事件为正常交易事件;具有负例标签的样本交易事件为风险交易事件;所述样本交易事件包括,交易方、交易时间、交易金额、交易网络环境以及交易商品信息;
将所述各样本交易事件输入风险识别模型,以预测所述各样本交易事件的打分,所述打分表示对应样本交易事件为风险交易事件的概率;
将所述样本交易事件集中各正常交易事件的打分按照从高到低进行排序;计算所述各正常交易事件的总数目与预定义的打扰率的乘积,基于计算的乘积确定分布在高分段的正常交易事件的第一数目;对于排序后的打分,将排序靠前的所述第一数目个打分中最后一个打分作为对应于所述样本交易事件集的、用于划分高低分段的分位点;所述打扰率表示分布在高分段的正常交易事件的占比;
根据所述各样本交易事件的打分以及所述分位点,计算第一预测损失,使得所述第一预测损失反相关于至少部分风险交易事件的打分与所述分位点的差值;
根据所述各样本交易事件的打分以及各自的正例或负例标签,计算第二预测损失;
基于所述第一预测损失与所述第二预测损失的融合结果,调整所述风险识别模型的参数。
2.根据权利要求1所述的方法,所述至少部分风险交易事件为全部风险交易事件;所述根据所述各样本交易事件的打分以及所述分位点,计算第一预测损失,包括:
将所述全部风险交易事件的打分与所述分位点进行求差,得到多个差值;
根据所述多个差值,计算第一预测损失。
3.根据权利要求2所述的方法,所述根据所述多个差值,计算第一预测损失,包括:
将所述多个差值分别输入近似符号函数,得到多个输出;所述近似符号函数用于拟合符号函数,且所述近似符号函数在整个定义域具有导数;
对所述多个输出进行求和,并将求和结果的相反数作为所述第一预测损失。
4.根据权利要求1所述的方法,所述至少部分风险交易事件为对应打分与所述分位点的差值大于预定阈值的风险交易事件;所述根据所述各样本交易事件的打分以及所述分位点,计算第一预测损失,包括:
根据所述至少部分风险交易事件各自对应的差值以及各自的负例标签,计算第一数值;
根据对应打分与所述分位点的差值大于预定阈值的至少部分正常交易事件各自对应的差值以及各自的正例标签,计算第二数值;
将所述第二数值与所述第一数值的差值作为所述第一预测损失。
5.根据权利要求4所述的方法,所述根据所述至少部分风险交易事件各自对应的差值以及各自的负例标签,计算第一数值,包括:
将所述至少部分风险交易事件各自对应的差值与各自的负例标签进行相乘,得到若干第一乘积;将所述若干第一乘积分别输入第一近似符号函数,得到若干第一输出;对所述若干第一输出进行求和,得到所述第一数值;
所述根据对应打分与所述分位点的差值大于预定阈值的至少部分正常交易事件各自对应的差值以及各自的正例标签,计算第二数值,包括:
将所述至少部分正常交易事件各自对应的差值与各自的正例标签的相反值进行相乘,得到若干第二乘积;将所述若干第二乘积分别输入第二近似符号函数,得到若干第二输出;对所述若干第二输出进行求和,得到所述第二数值;
所述第一近似符号函数或所述第二近似符号函数用于拟合符号函数,且其在整个定义域具有导数。
6.根据权利要求1所述的方法,所述基于所述第一预测损失与所述第二预测损失的融合结果,调整所述风险识别模型的参数,包括:
对所述第一预测损失和第二预测损失进行加权求和,得到加权求和结果;
以最小化所述加权求和结果为目标,调整所述风险识别模型的参数。
7.一种针对交易事件的风险识别模型训练装置,包括:
获取单元,用于获取当前批次的样本交易事件集,其中包括具有正例或负例标签的多个样本交易事件;其中,具有正例标签的样本交易事件为正常交易事件;具有负例标签的样本交易事件为风险交易事件;所述样本交易事件包括,交易方、交易时间、交易金额、交易网络环境以及交易商品信息;
输入单元,用于将所述各样本交易事件输入风险识别模型,以预测所述各样本交易事件的打分,所述打分表示对应样本交易事件为风险交易事件的概率;
确定单元,用于将所述样本交易事件集中各正常交易事件的打分按照从高到低进行排序;计算所述各正常交易事件的总数目与预定义的打扰率的乘积,基于计算的乘积确定分布在高分段的正常交易事件的第一数目;对于排序后的打分,将排序靠前的所述第一数目个打分中最后一个打分作为对应于所述样本交易事件集的、用于划分高低分段的分位点;所述打扰率表示分布在高分段的正常交易事件的占比;
计算单元,用于根据所述各样本交易事件的打分以及所述分位点,计算第一预测损失,使得所述第一预测损失反相关于至少部分风险交易事件的打分与所述分位点的差值;
所述计算单元,还用于根据所述各样本交易事件的打分以及各自的正例或负例标签,计算第二预测损失;
调整单元,用于基于所述第一预测损失与所述第二预测损失的融合结果,调整所述风险识别模型的参数。
8.根据权利要求7所述的装置,所述至少部分风险交易事件为全部风险交易事件;所述计算单元具体用于:
将所述全部风险交易事件的打分与所述分位点进行求差,得到多个差值;
根据所述多个差值,计算第一预测损失。
9.根据权利要求8所述的装置,所述计算单元还具体用于:
将所述多个差值分别输入近似符号函数,得到多个输出;所述近似符号函数用于拟合符号函数,且所述近似符号函数在整个定义域具有导数;
对所述多个输出进行求和,并将求和结果的相反数作为所述第一预测损失。
10.根据权利要求7所述的装置,所述至少部分风险交易事件为对应打分与所述分位点的差值大于预定阈值的风险交易事件;所述计算单元具体用于:
根据所述至少部分风险交易事件各自对应的差值以及各自的负例标签,计算第一数值;
根据对应打分与所述分位点的差值大于预定阈值的至少部分正常交易事件各自对应的差值以及各自的正例标签,计算第二数值;
将所述第二数值与所述第一数值的差值作为所述第一预测损失。
11.根据权利要求10所述的装置,所述计算单元还具体用于:
将所述至少部分风险交易事件各自对应的差值与各自的负例标签进行相乘,得到若干第一乘积;将所述若干第一乘积分别输入第一近似符号函数,得到若干第一输出;对所述若干第一输出进行求和,得到所述第一数值;
所述根据对应打分与所述分位点的差值大于预定阈值的至少部分正常交易事件各自对应的差值以及各自的正例标签,计算第二数值,包括:
将所述至少部分正常交易事件各自对应的差值与各自的正例标签的相反值进行相乘,得到若干第二乘积;将所述若干第二乘积分别输入第二近似符号函数,得到若干第二输出;对所述若干第二输出进行求和,得到所述第二数值;
所述第一近似符号函数或所述第二近似符号函数用于拟合符号函数,且其在整个定义域具有导数。
12.根据权利要求7所述的装置,所述调整单元具体用于:
对所述第一预测损失和第二预测损失进行加权求和,得到加权求和结果;
以最小化所述加权求和结果为目标,调整所述风险识别模型的参数。
13.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-6中任一项所述的方法。
14.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011176715.4A CN112200488B (zh) | 2020-10-28 | 2020-10-28 | 针对业务对象的风险识别模型训练方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011176715.4A CN112200488B (zh) | 2020-10-28 | 2020-10-28 | 针对业务对象的风险识别模型训练方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112200488A CN112200488A (zh) | 2021-01-08 |
CN112200488B true CN112200488B (zh) | 2023-07-25 |
Family
ID=74011843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011176715.4A Active CN112200488B (zh) | 2020-10-28 | 2020-10-28 | 针对业务对象的风险识别模型训练方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112200488B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113222480B (zh) * | 2021-06-11 | 2023-05-12 | 支付宝(杭州)信息技术有限公司 | 对抗样本生成模型的训练方法及装置 |
CN114819695A (zh) * | 2022-05-11 | 2022-07-29 | 蚂蚁区块链科技(上海)有限公司 | 训练风控模型的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015137970A1 (en) * | 2014-03-14 | 2015-09-17 | Mun Johnathan | Qualitative and quantitative modeling of enterprise risk management and risk registers |
CN108053120A (zh) * | 2017-12-15 | 2018-05-18 | 阿里巴巴集团控股有限公司 | 一种模型整合方法及装置 |
CN111461862A (zh) * | 2020-03-27 | 2020-07-28 | 支付宝(杭州)信息技术有限公司 | 为业务数据确定目标特征的方法及装置 |
CN111612606A (zh) * | 2020-04-11 | 2020-09-01 | 交通银行股份有限公司上海市分行 | 一种商户欺诈风险监控系统及数据挖掘方法 |
CN111768285A (zh) * | 2019-04-01 | 2020-10-13 | 杭州金智塔科技有限公司 | 信贷风控模型构建系统、方法、风控系统及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11238528B2 (en) * | 2016-12-22 | 2022-02-01 | American Express Travel Related Services Company, Inc. | Systems and methods for custom ranking objectives for machine learning models applicable to fraud and credit risk assessments |
-
2020
- 2020-10-28 CN CN202011176715.4A patent/CN112200488B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015137970A1 (en) * | 2014-03-14 | 2015-09-17 | Mun Johnathan | Qualitative and quantitative modeling of enterprise risk management and risk registers |
CN108053120A (zh) * | 2017-12-15 | 2018-05-18 | 阿里巴巴集团控股有限公司 | 一种模型整合方法及装置 |
CN111768285A (zh) * | 2019-04-01 | 2020-10-13 | 杭州金智塔科技有限公司 | 信贷风控模型构建系统、方法、风控系统及存储介质 |
CN111461862A (zh) * | 2020-03-27 | 2020-07-28 | 支付宝(杭州)信息技术有限公司 | 为业务数据确定目标特征的方法及装置 |
CN111612606A (zh) * | 2020-04-11 | 2020-09-01 | 交通银行股份有限公司上海市分行 | 一种商户欺诈风险监控系统及数据挖掘方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112200488A (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021232839B2 (en) | Updating Attribute Data Structures to Indicate Trends in Attribute Data Provided to Automated Modelling Systems | |
Matsubara et al. | Stock price prediction by deep neural generative model of news articles | |
CN111080123A (zh) | 用户风险评估方法及装置、电子设备、存储介质 | |
CN113692594A (zh) | 通过强化学习的公平性改进 | |
CN113537630B (zh) | 业务预测模型的训练方法及装置 | |
Ta et al. | Prediction and portfolio optimization in quantitative trading using machine learning techniques | |
CN105069483B (zh) | 一种对分类数据集进行测试的方法 | |
Badagián et al. | Time series segmentation procedures to detect, locate and estimate change-points | |
CN112200488B (zh) | 针对业务对象的风险识别模型训练方法及装置 | |
Yang et al. | A pattern fusion model for multi-step-ahead CPU load prediction | |
Bidyuk et al. | Methods for forecasting nonlinear non-stationary processes in machine learning | |
Rath et al. | Modern approach for loan sanctioning in banks using machine learning | |
Mokheleli et al. | Machine learning approach for credit score predictions | |
CN111325344A (zh) | 评估模型解释工具的方法和装置 | |
US20210319269A1 (en) | Apparatus for determining a classifier for identifying objects in an image, an apparatus for identifying objects in an image and corresponding methods | |
WO2022084261A1 (en) | A computer-implemented method for deriving a data processing and inference pipeline | |
CN110796379B (zh) | 业务渠道的风险评估方法、装置、设备及存储介质 | |
Kumagai et al. | Learning non-linear dynamics of decision boundaries for maintaining classification performance | |
JP7276483B2 (ja) | 学習装置、分類装置、学習方法及び学習プログラム | |
Harmon et al. | Dynamic prediction length for time series with sequence to sequence networks | |
CN117764200A (zh) | 多目标任务的机器学习模型训练方法、设备、介质和程序产品 | |
Petelin et al. | Financial modeling using Gaussian process models | |
CN111340356A (zh) | 评估模型解释工具的方法和装置 | |
Chao et al. | Improving boosting methods with a stable loss function handling outliers | |
CN116578400A (zh) | 多任务数据处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |