CN117575611A - 一种风险识别的方法、装置、存储介质及电子设备 - Google Patents

一种风险识别的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN117575611A
CN117575611A CN202311636825.8A CN202311636825A CN117575611A CN 117575611 A CN117575611 A CN 117575611A CN 202311636825 A CN202311636825 A CN 202311636825A CN 117575611 A CN117575611 A CN 117575611A
Authority
CN
China
Prior art keywords
risk
model
type
determining
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311636825.8A
Other languages
English (en)
Inventor
许小龙
张天翼
王维强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202311636825.8A priority Critical patent/CN117575611A/zh
Publication of CN117575611A publication Critical patent/CN117575611A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Computer Security & Cryptography (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本说明书公开了一种风险识别的方法、装置、存储介质和电子设备,包括:从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,确定各待识别类型对应的配置信息。在预先训练的风险识别模型中,确定各待识别类型对应的各目标参数。根据配置信息,调整各目标参数,确定目标识别模型。确定待识别用户的信息,将信息输入目标识别模型,确定待识别用户的风险识别结果。根据风险识别结果,对待识别用户进行风险控制。通过当前场景下的各待识别类型的配置信息,对风险识别模型中各待识别类型对应的模型参数进行调整,并使用目标识别模型对待识别用户进行风险识别,可以控制模型输出的风险类型,灵活地适用于各种业务场景下的风险识别。

Description

一种风险识别的方法、装置、存储介质及电子设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种风险识别的方法、装置、存储介质及电子设备。
背景技术
随着信息科技以及人工智能的发展,出现越来越多的为用户执行业务提供支持的服务提供方,比如提供交易平台的服务提供方。同时,隐私数据受到了大众的关注。
目前,用户在使用服务提供方提供的功能执行业务的过程中,可能出现违规行为。故服务提供方需要基于用户执行业务过程中的业务数据,对用户进行风险识别,以确定用户是否存在风险。例如,对于使用服务提供方提供的交易平台进行物品交易时,用户需要上传用户个人信息以及所进行交易的物品信息。但是,用户上传的信息中可能会存在风险,故交易平台的服务提供方需要对用户上传的信息进行风险识别,确定该用户是否存在风险。
并且,服务提供方在对用户进行风险识别时,一般需要收集用户的相关信息,并根据信息,对用户进行风险识别。而信息可以有很多种模态,比如文本、图像以及结构化等多种模态的信息。因此,如何基于多模态数据对用户进行风险识别是一个非常重要的问题。
基于此,本说明书提供了一种风险识别的方法。
发明内容
本说明书提供一种风险识别的方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供一种风险识别的方法,包括:
从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定所述各待识别类型对应的配置信息;
在预先训练的风险识别模型中,确定所述各待识别类型对应的各模型参数,作为各目标参数;其中,所述风险识别模型用于识别所有风险类型,所述风险识别模型中包括所述所有风险类型对应的模型参数;
根据所述配置信息,调整所述各目标参数,确定目标识别模型;
确定待识别用户的信息,并将所述信息输入所述目标识别模型,确定所述待识别用户的风险识别结果;
根据所述风险识别结果,对所述待识别用户进行风险控制。
可选地,在预先训练的风险识别模型中,确定所述各待识别类型对应的各模型参数,作为各目标参数,具体包括:
针对每一个风险类型,确定历史上标注为该风险类型的用户的信息,并作为测试信息;
将所述测试信息输入预先训练的风险识别模型,确定识别结果;
根据所述识别结果,采用积分梯度算法,确定在所述风险识别模型中该风险类型对应的模型参数;
确定各风险类型与所述风险识别模型中各模型参数之间的对应关系;
根据各对应关系,确定所述风险识别模型中所述各待识别类型对应的各模型参数,作为各目标参数。
可选地,所述配置信息包括所述各待识别类型对应的指定参数值;
根据所述配置信息,调整所述各目标参数,确定目标识别模型,具体包括:
针对每一个待识别类型,确定所述配置信息中该待识别类型对应的指定参数值;
将该待识别类型对应的目标参数的参数值调整为该待识别类型对应的指定参数值;
将调整后的风险识别模型作为目标识别模型。
可选地,根据所述风险识别结果,对所述待识别用户进行风险控制,具体包括:
根据所述风险识别结果,采用积分梯度算法,确定在所述风险识别模型中所述风险识别结果对应的模型参数;
判断确定出的模型参数对应的风险类型与所述风险识别结果是否一致;
若是,根据所述风险识别结果,对所述待识别用户进行风险控制;
若否,确定所述风险识别结果不准确。
可选地,预先训练风险识别模型,具体包括:
确定历史上用户的信息作为训练样本,以及将历史上所述用户对应的风险类型作为所述训练样本对应的标注;
根据所述训练样本以及所述标注,对待训练的风险识别模型进行训练,以使所述待训练的风险识别模型中的各模型参数学习各风险类型对应的风险的特征。
可选地,所述待训练的风险识别模型包括前馈神经网络以及识别层,所述前馈神经网络包括第一网络层、中间网络层以及第二网络层,所述中间网络层包括所述各风险类型对应的各模型参数;
根据所述训练样本以及所述标注,对待训练的风险识别模型进行训练,具体包括:
将所述训练样本输入待训练的风险识别模型的前馈神经网络的第一网络层,确定第一特征;
将所述第一特征输入所述待训练的风险识别模型的前馈神经网络的中间网络层,以通过所述中间网络层中的各模型参数学习各风险类型对应的风险特征,确定所述中间网络层输出的第二特征;
将所述第二特征输入所述待训练的风险识别模型的前馈神经网络的第二网络层,确定第三特征;
将所述第三特征输入所述待训练的风险识别模型的识别层,确定所述训练样本对应的识别结果;
以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
可选地,所述信息至少包括文本、图像以及结构化中的两种模态的信息;
根据所述训练样本以及所述标注,对待训练的风险识别模型进行训练,具体包括:
确定所述训练样本中包括的各模态类型;
针对每一个模态类型,确定在所述训练样本中该模态类型对应的信息的特征;
将确定出的各特征进行融合,并将融合后的特征输入待训练的风险识别模型,确定所述训练样本对应的识别结果;
以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
本说明书提供了一种风险识别的装置,包括:
第一确定模块,用于从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定所述各待识别类型对应的配置信息;
第二确定模块,用于在预先训练的风险识别模型中,确定所述各待识别类型对应的各模型参数,作为各目标参数;其中,所述风险识别模型用于识别所有风险类型,所述风险识别模型中包括所述所有风险类型对应的模型参数;
调整模块,用于根据所述配置信息,调整所述各目标参数,确定目标识别模型;
识别模块,用于确定待识别用户的信息,并将所述信息输入所述目标识别模型,确定所述待识别用户的风险识别结果;
风控模块,用于根据所述风险识别结果,对所述待识别用户进行风险控制。
可选地,所述第二确定模块,具体用于针对每一个风险类型,确定历史上标注为该风险类型的用户的信息,并作为测试信息;将所述测试信息输入预先训练的风险识别模型,确定识别结果;根据所述识别结果,采用积分梯度算法,确定在所述风险识别模型中该风险类型对应的模型参数;确定各风险类型与所述风险识别模型中各模型参数之间的对应关系;根据各对应关系,确定所述风险识别模型中所述各待识别类型对应的各模型参数,作为各目标参数。
可选地,所述配置信息包括所述各待识别类型对应的指定参数值;
所述调整模块具体用于,针对每一个待识别类型,确定所述配置信息中该待识别类型对应的指定参数值;将该待识别类型对应的目标参数的参数值调整为该待识别类型对应的指定参数值;将调整后的风险识别模型作为目标识别模型。
可选地,所述风控模块具体用于,根据所述风险识别结果,采用积分梯度算法,确定在所述风险识别模型中所述风险识别结果对应的模型参数;判断确定出的模型参数对应的风险类型与所述风险识别结果是否一致;若是,根据所述风险识别结果,对所述待识别用户进行风险控制;若否,确定所述风险识别结果不准确。
可选地,所述装置还包括:
训练模块,用于确定历史上用户的信息作为训练样本,以及将历史上所述用户对应的风险类型作为所述训练样本对应的标注;根据所述训练样本以及所述标注,对待训练的风险识别模型进行训练,以使所述待训练的风险识别模型中的各模型参数学习各风险类型对应的风险的特征。
可选地,所述待训练的风险识别模型包括前馈神经网络以及识别层,所述前馈神经网络包括第一网络层、中间网络层以及第二网络层,所述中间网络层包括所述各风险类型对应的各模型参数;
所述训练模块具体用于,将所述训练样本输入待训练的风险识别模型的前馈神经网络的第一网络层,确定第一特征;将所述第一特征输入所述待训练的风险识别模型的前馈神经网络的中间网络层,以通过所述中间网络层中的各模型参数学习各风险类型对应的风险特征,确定所述中间网络层输出的第二特征;将所述第二特征输入所述待训练的风险识别模型的前馈神经网络的第二网络层,确定第三特征;将所述第三特征输入所述待训练的风险识别模型的识别层,确定所述训练样本对应的识别结果;以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
可选地,所述信息至少包括文本、图像以及结构化中的两种模态的信息;
所述训练模块具体用于,确定所述训练样本中包括的各模态类型;针对每一个模态类型,确定在所述训练样本中该模态类型对应的信息的特征;将确定出的各特征进行融合,并将融合后的特征输入待训练的风险识别模型,确定所述训练样本对应的识别结果;以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述风险识别的方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述风险识别的方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
本说明书提供的风险识别的方法中,从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定各待识别类型对应的配置信息。再在预先训练的风险识别模型中,确定各待识别类型对应的各模型参数,作为各目标参数。根据配置信息,调整各目标参数,确定目标识别模型。之后,确定待识别用户的信息,并将信息输入目标识别模型,确定待识别用户的风险识别结果。再根据风险识别结果,对待识别用户进行风险控制。
从上述方法中可以看出,本方法中可以先从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定各待识别类型对应的配置信息。再在预先训练的风险识别模型中,确定各待识别类型对应的各模型参数,作为各目标参数。根据配置信息,调整各目标参数,确定目标识别模型。使得目标识别模型中至少包括各待识别类型对应的模型参数,后续可以更好地识别在当前业务场景下待识别用户的风险类型,并且,加快对待识别用户风险识别的速度,节省时间成本。之后。确定待识别用户的信息,并将信息输入目标识别模型,确定待识别用户的风险识别结果。再根据风险识别结果,对待识别用户进行风险控制。通过当前场景下的各待识别类型的配置信息,对风险识别模型中各待识别类型对应的模型参数进行调整,得到目标识别模型,并使用目标识别模型对当前业务场景下的待识别用户进行风险识别,可以有效地控制模型输出的风险类型,灵活地适用于各种业务场景下的风险识别。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附
图中:
图1为本说明书中提供的一种风险识别的方法的流程示意图;
图2为本说明书中提供的一种风险识别模型的结构示意图;
图3为本说明书中提供的一种风险识别的装置的示意图;
图4为本说明书中提供的对应于图1的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
本说明书的实施例提供了一种风险识别的方法、装置、存储介质及电子设备,以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种风险识别的方法的流程示意图,具体包括以下步骤:
S100:从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定所述各待识别类型对应的配置信息。
在本说明书中,用于风险识别的设备可以从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定各待识别类型对应的配置信息。其中,上述用于风险识别的设备可以为服务器,或能够执行本说明书方案的诸如手机、个人计算机(Personal Computer,PC)等设备。为了方便说明,下面以服务器为执行主体进行说明。
在本说明书中,用户在使用服务提供方提供的功能执行业务的过程中,可能出现违规行为。故服务提供方需要基于用户执行业务过程中的业务数据,对用户进行风险识别,以确定用户是否存在风险。但是,对于不同的业务场景,服务提供方需要识别用户存在的风险的类型不同,也就是服务提供方所需识别的风险的类型不同。比如,对于使用服务提供方提供的交易平台售卖物品的用户,用户需要上传用户个人信息以及所进行交易的物品信息,服务提供方需要基于用户上传的信息,识别用户是否存在造假、内容不合规等类型的风险。但是,对于使用服务提供方提供的支付工具进行支付的用户,服务提供方需要基于用户在支付时产生的支付数据,识别用户进行的支付事件存在何种类型的风险。服务提供方对支付事件所需识别的风险类型与上述对用户上传的信息所需识别的风险类型不同。
基于此,服务器可以从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定各待识别类型对应的配置信息,其中,所有风险类型为任意业务场景下所有可能存在的风险对应的风险类型,具体是哪种或者哪几种风险类型,本说明书不做具体限定。当然,所有风险类型也可以为预先设置的风险类型。上述当前业务场景具体是何种业务场景与用户执行的业务有关,不同业务场景所需识别的风险类型不同,业务场景所需识别的风险类型可以为所有风险类型,也可以为所有风险类型中的部分风险类型,也就是待识别风险类型可以为所有风险类型,也可以为所有风险类型中的部分风险类型,本说明书不做具体限定。
在本说明书中,当用户在服务提供方提供的交易平台上售卖物品时,用户需要上传个人信息以及物品信息,该业务场景可以用户使用交易平台售卖物品的场景,该业务场景所需识别的风险与用户上传的信息相关,该风险类型可以为内容造假、内容不合规等。当用户使用服务提供方提供的支付工具进行交易时,该业务场景可以用户交易场景,该业务场景所需识别的风险与用户进行交易时产生的交易数据相关,该风险类型可以为交易可能存在的各种类型的风险。故不同的业务场景对应不同的待识别类型的风险。当然,每一个业务场景所需识别的风险类型可以由风控人员预先设置的,服务器可以直接确定当前业务场景所需识别的各风险类型,并作为各待识别类型。另外,当前业务场景所需识别的风险类型可以由风控人员进行确定,故服务器还可以响应于风控人员的风险识别请求,从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型。
上述各待识别类型对应的配置信息可以为预先设置的,该配置信息包括各待识别类型的重要程度,该重要程度表征各待识别类型中哪一个或者哪几个风险类型是当前业务场景所需识别的风险类型中比较关注的风险类型。各待识别类型对应的配置信息还可以包括各待识别类型对应的指定参数值,每一个待识别类型对应一个指定参数值,指定参数值与待识别类型的重要程度有关,待识别类型的重要程度越大,该待识别类型对应的指定参数值越大。反之,待识别类型的重要程度越小,该待识别类型对应的指定参数值越小。上述指定参数值可以为模型参数的值,该模型参数可以为权重,故指定参数值可以为模型参数中的权重值。故待识别类型的重要程度越大,该待识别类型对应的权重值越大。反之,待识别类型的重要程度越小,该待识别类型对应的权重值越小。
S102:在预先训练的风险识别模型中,确定所述各待识别类型对应的各模型参数,作为各目标参数;其中,所述风险识别模型用于识别所有风险类型,所述风险识别模型中包括所述所有风险类型对应的模型参数。
服务器可以在预先训练的风险识别模型中,确定各待识别类型对应的各模型参数,作为各目标参数,其中,风险识别模型为服务器预先训练的风险识别模型,该风险识别模型用于识别所有风险类型,并且,风险识别模型中包括所有风险类型对应的模型参数。在风险识别模型中,每一种风险类型对应一个模型参数,但,一个模型参数可以对应于至少一个风险类型。模型参数用于表征风险类型对应的风险的特征,也就是对于某一风险类型来说,该风险类型对应的模型参数用于表征该风险类型对应的风险的特征。并且,该模型参数对该风险类型的风险的特征的敏感度比较大,也就是一旦识别到该风险类型对应的风险的特征,该风险类型对应的模型参数变化比较大,从而对风险识别模型输出的识别结果的影响比较大。
由于风险识别模型用于识别所有风险类型,故训练风险识别模型的训练样本对应的标注至少包括所有风险类型,并且,在风险识别模型的模型参数中,存在所有风险类型对应的模型参数。另外,待识别类型为所有风险类型中至少部分风险类型,故在风险识别模型的模型参数中,也存在各待识别类型对应的模型参数。比如一共有5种风险类型,风险识别模型可以用于识别5种风险类型,待识别类型为5种风险类型中的3种风险类型,故从风险识别模型的模型参数中,确定3种风险类型对应的模型参数。但是,经过训练样本以及标注进行训练后的风险识别模型中,具体的风险识别模型中的哪个模型参数对应哪一种或者哪几种风险类型是不确定的。
基于此,服务器可以针对每一个风险类型,确定历史上标注为该风险类型的用户的信息,并作为测试信息,将测试信息输入预先训练的风险识别模型,确定识别结果。再根据识别结果,采用积分梯度算法,确定在风险识别模型中该风险类型对应的模型参数。之后,确定各风险类型与风险识别模型中各模型参数之间的对应关系。再根据各对应关系,确定风险识别模型中各待识别类型对应的各模型参数,作为各目标参数。其中,每一个测试信息为历史上标记为每一种风险类型对应的用户的信息,该风险类型为风险识别模型中各模型参数对应的风险类型,也是上述所有风险类型。上述对应关系为所有风险类型(即各风险类型)与风险识别模型中各模型参数之间的对应关系,一个风险类型对应一个模型参数,一个模型参数至少对应一个风险类型。该用户的信息可以包括用户的个人信息、物品的信息、交易信息等,该用户的个人信息可以包括用户的性别、年龄、省份、用户的人脸图像以及用户的营业执照等信息,物品的信息可以包括物品的图像、名称、类型以及发货地等信息,交易信息可以包括交易物品、交易双方的个人信息以及交易金额等。该用户的信息为服务器预先收集的信息,不同的业务场景下收集到的用户的信息可以相同,也可以不同。
上述积分梯度算法用于基于模型输出结果以及模型标注,确定模型中哪一个模型参数对该模型输出结果的贡献度最大,即哪一个模型参数对该模型输出结果的影响最大。通过采用积分梯度算法,可以获知该风险识别模型中哪一个模型参数,对风险识别模型得到该风险类型(即识别结果)的贡献度最大,并将贡献度最大的模型参数作为该风险类型对应的模型参数,并作为目标模型参数。
另外,上述在根据识别结果,采用积分梯度算法,确定在风险识别模型中该风险类型对应的模型参数时,为了更加准确地确定出在风险识别模型中该风险类型对应的模型参数,服务器还可以根据识别结果,采用积分梯度算法,确定在风险识别模型中该风险类型对应的模型参数为第一模型参数。同时,确定历史上标注为无风险的用户的信息,并作为标准信息。将标准信息输入风险识别模型,确定输出结果。再根据输出结果,采用积分梯度算法,确定在风险识别模型中无风险对应的模型参数为第二模型参数。当第一模型参数与第二模型参数不一致时,说明第一模型参数与第二模型参数分别对应不同的风险类型,即第一模型参数对应该风险类型,而第二模型参数对应无风险,故服务器可以确定第一模型参数为该风险类型对应的模型参数,并作为目标参数。当第一模型参数与第二模型参数一致时,说明第一模型参数与第二模型参数对应相同的风险类型,即该风险类型与无风险均对应相同的模型参数,故服务器确定出的该风险类型对应的模型参数(即第一模型参数)不准确,需要按照上述步骤重新确定该风险类型对应的模型参数。
另外,服务器还可以根据识别结果,采用积分梯度算法,确定在风险识别模型中该风险类型对应的模型参数为第一模型参数。将第一模型参数的权重值调整到目标数值。再确定历史上标注为无风险的用户的信息,并作为标准信息。将标准信息输入调整后的风险识别模型,确定输出结果。当输出结果为该风险类型时,说明第一模型参数对应该风险类型,故服务器可以确定第一模型参数为该风险类型对应的模型参数,并作为目标参数。当输出结果不为该风险类型时,说明第一模型参数不对应该风险类型,故服务器确定出的该风险类型对应的模型参数(即第一模型参数)不准确,需要按照上述步骤重新确定该风险类型对应的模型参数。其中,目标数值为预先设置的数值。
S104:根据所述配置信息,调整所述各目标参数,确定目标识别模型。
服务器可以根据配置信息,调整各目标参数,确定目标识别模型。其中,配置信息可以包括各待识别类型对应的指定参数值。该指定参数值可以为模型参数中的权重值。
具体的,服务器可以针对每一个待识别类型,确定配置信息中该待识别类型对应的指定参数值,并将该待识别类型对应的目标参数的参数值调整为该待识别类型对应的指定参数值。将调整后的风险识别模型作为目标识别模型。其中,调整后的风险识别模型中各目标参数对应的参数值均为配置信息中的指定参数值。指定参数值为预先设置的数值。
另外,由于预先训练的风险识别模型中的模型参数对应的风险类型可能比待识别类型多,故为了节省时间成本,快速地确定用户的风险识别结果,服务器除了根据配置信息,调整各目标参数之外,还将风险识别模型中除各目标参数外的其他风险类型对应的模型参数删除,确定目标识别模型。该目标识别模型中只包括各待识别类型对应的调整后的模型参数,不包括其他风险类型对应的模型参数。
S106:确定待识别用户的信息,并将所述信息输入所述目标识别模型,确定所述待识别用户的风险识别结果。
S108:根据所述风险识别结果,对所述待识别用户进行风险控制。
服务器可以确定待识别用户的信息,并将信息输入目标识别模型,确定待识别用户的风险识别结果。之后,服务器可以根据风险识别结果,对待识别用户进行风险控制。其中,风险识别结果为各待识别类型以及无风险中的一种。在根据风险识别结果,对待识别用户进行风险控制时,服务器可以根据风险识别结果,确定对待识别用户进行风险控制的策略,并采用策略,对待识别用户进行风险控制。服务器可以为每一个待识别类型预先设置对应的风险控制的策略。
从上述方法中可以看出,服务器可以先从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定各待识别类型对应的配置信息。之后,在预先训练的风险识别模型中,确定各待识别类型对应的各模型参数,作为各目标参数,再根据配置信息,调整各目标参数,确定目标识别模型。使得目标识别模型中至少包括各待识别类型对应的模型参数,后续可以更好地识别在当前业务场景下待识别用户的风险类型,并且,加快对待识别用户风险识别的速度,节省时间成本。之后,确定待识别用户的信息,并将信息输入目标识别模型,确定待识别用户的风险识别结果。再根据风险识别结果,对待识别用户进行风险控制。通过当前场景下的各待识别类型的配置信息,对风险识别模型中各待识别类型对应的模型参数进行调整,得到目标识别模型,并使用目标识别模型对当前业务场景下的待识别用户进行风险识别,可以有效地控制模型输出的风险类型,灵活地适用于各种业务场景下的风险识别。
在上述步骤S102在预先训练的风险识别模型中,确定各待识别类型对应的各模型参数,作为各目标参数时,服务器可以针对预先训练的风险识别模型中每一个风险类型对应的模型参数,将该模型参数的权重值调整为目标数值。确定历史上标注为无风险的用户的信息,并作为标准信息。将标准信息输入调整后的风险识别模型,确定输出结果。将输出结果对应的风险类型作为该模型参数对应的风险类型。确定各风险类型与风险识别模型中各模型参数之间的对应关系。再根据各对应关系,确定各待识别类型对应的各模型参数,作为各目标参数。其中,各风险类型为所有风险类型。
另外,为了更加准确地确定出在风险识别模型中各模型参数对应的风险类型,上述将输出结果对应的风险类型作为该模型参数对应的风险类型时,根据输出结果,采用积分梯度算法,确定在调整后的风险识别模型中输出结果对应的模型参数,并作为标准模型参数。当标准模型参数为该模型参数时,将输出结果对应的风险类型作为该模型参数对应的风险类型。但,当标准模型参数不为该模型参数时,说明该模型参数对输出结果的贡献度不大,即该模型参数对输出结果的影响不大,故服务器不可以将输出结果对应的风险类型作为该模型参数对应的风险类型,需要重新确定该模型参数对应的风险类型。
在本说明书中,为了保证风险识别模型输出的风险识别结果的准确性,从而保证业务场景中待识别用户的安全,服务器可以通过确定风险识别结果对应的模型参数,来判断风险识别结果是否准确,当确定出的模型参数对应的风险类型与风险识别结果一致时,说明风险识别结果准确,当确定出的模型参数对应的风险类型与风险识别结果不一致时,说明风险识别结果不准确。基于此,在上述步骤S108中,服务器可以根据风险识别结果,采用积分梯度算法,确定在风险识别模型中风险识别结果对应的模型参数,判断确定出的模型参数对应的风险类型与风险识别结果是否一致。若是,根据风险识别结果,对待识别用户进行风险控制。若否,确定风险识别结果不准确。其中,当风险识别结果不准确时,服务器可以重新基于待识别用户的信息,确定待识别用户的风险识别结果。当然,服务器还可以将待识别用户的信息发送给风控人员或者其他风险识别体系,对待识别用户进行风险识别,确定待识别用户的风险识别结果。
另外,服务器通过确定风险识别结果对应的模型参数,除了可以判断风险识别结果是否准确之外,还可以对风险识别结果进行解释,也就是通过确定风险识别结果在风险识别模型中对应的模型参数,从而可以获知是风险识别模型中哪一个模型参数对风险识别结果的影响最大,增加了风险识别模型的可解释性。
在本说明书中,服务器可以预先训练风险识别模型,服务器可以确定历史上用户的信息作为训练样本,以及将历史上用户对应的风险类型作为训练样本对应的标注。根据训练样本以及标注,对待训练的风险识别模型进行训练,以使待训练的风险识别模型中的各模型参数学习各风险类型对应的风险的特征。其中,待训练的风险识别模型中各模型参数所需学习的风险类型可以为预先设置的,也可以为根据训练样本对应的风险类型确定的。各模型参数至少学习训练样本对应的各风险类型(即训练样本的标注)。历史上用户的信息可以为历史上任意业务场景下用户的信息,故历史上用户对应的风险类型也可以为任意业务场景下用户对应的风险类型,该风险类型可以为风控人员预先进行标记的,还可以为其他任意风控体系识别到的风险类型,本说明书不做具体限定。上述待训练的风险识别模型中的各模型参数学习各风险类型对应的风险的特征,也就是可以用待训练的风险识别模型中的各模型参数表征各风险类型对应的风险的特征。对于某一风险类型来说,在待训练的风险识别模型中,该风险类型对应的模型参数用于表征该风险类型对应的风险的特征。并且,该模型参数对该风险类型的风险的特征的敏感度比较大,也就是一旦待训练的风险识别模型识别到该风险类型对应的风险的特征,该风险类型对应的模型参数变化比较大,从而对风险识别模型输出的识别结果的影响比较大。
具体的,服务器可以确定历史上用户的信息作为训练样本,以及将历史上用户对应的风险类型作为训练样本对应的标注。将训练样本输入待训练的风险识别模型,确定识别结果,以识别结果与标注之间的差异最小为目标,对待训练的风险识别模型进行训练,以使待训练的风险识别模型中的各模型参数学习各风险类型对应的风险的特征。
在本说明书中,待训练的风险识别模型可以包括前馈神经网络以及识别层,前馈神经网络包括第一网络层、中间网络层以及第二网络层,中间网络层包括若干知识神经元,各知识神经元可以用来表征各风险类型对应的风险的特征,故各知识神经元为各风险类型对应的各模型参数,中间网络层包括各风险类型(即所有风险类型)对应的各模型参数。基于此,在根据训练样本以及所述标注,对待训练的风险识别模型进行训练时,服务器可以将训练样本输入待训练的风险识别模型的前馈神经网络的第一网络层,确定第一特征。再将第一特征输入待训练的风险识别模型的前馈神经网络的中间网络层,以通过中间网络层中的各模型参数(即各知识神经元)学习各风险类型对应的风险特征,确定中间网络层输出的第二特征。将第二特征输入待训练的风险识别模型的前馈神经网络的第二网络层,确定第三特征。之后,将第三特征输入待训练的风险识别模型的识别层,确定训练样本对应的识别结果。再以识别结果与标注之间的差异最小为目标,对待训练的风险识别模型进行训练。其中,前馈神经网络包括三个网络层,分别为第一网络层、中间网络层以及第二网络层,在对待训练的风险识别模型时,服务器是基于训练样本以及训练样本对应的标注分别对前馈神经网络中的三个网络层分别进行训练,即可以先训练第二网络层,第二网络层训练完成后固定第二网络层的参数,再训练中间网络层,中间网络层训练完成后固定中间网络层的参数。再训练第一网络层,第一网络层训练完成后固定第一网络层的参数。
上述将训练样本输入待训练的风险识别模型的前馈神经网络的第一网络层,确定第一特征时,服务器可以先将训练样本输入待训练的风险识别模型的特征提取层,确定训练样本对应的特征,再将训练样本的特征输入待训练的风险识别模型的前馈神经网络的第一网络层,确定第一特征。
在本说明书中,用户的信息可以包括多种模态的信息,信息至少包括文本、图像以及结构化中的两种模态的信息,用户的信息中文本模态的信息可以包括用户的性别、年龄、省份以及聊天记录等文本信息,用户的信息中图像模态的信息可以包括用户的人脸图像、用户的营业执照、物品的图像等图像信息,用户的信息中结构化模态的信息可以包括物品的名称、类型、发货地、交易设备标识以及交易金额等结构化信息。用户的信息中不同模态的信息对应不同的特征,故在上述根据训练样本以及标注,对待训练的风险识别模型进行训练时,服务器可以确定训练样本中包括的各模态类型,针对每一个模态类型,确定在训练样本中该模态类型对应的信息的特征,将确定出的各特征进行融合,并将融合后的特征输入待训练的风险识别模型,确定训练样本对应的识别结果。以识别结果与标注之间的差异最小为目标,对待训练的风险识别模型进行训练。
其中,在确定在训练样本中该模态类型对应的信息的特征时,服务器可以确定该模态类型对应的特征提取层,并将该模态类型对应的信息输入确定出的特征提取层,确定该模态类型对应的信息的特征。不同模态类型的信息对应不同的特征提取层,文本模态的信息可以输入自然语言模型中确定文本特征,图像模态的信息可以输入卷积神经网络模型中确定图像特征,结构化模态的信息可以输入表格模型中确定结构化特征。上述自然语言模型、卷积神经网络模型以及表格模型可以为预先训练的模型,也可以为任意已有的模型,本说明书不做具体限定。另外,上述不同模态类型对应的特征提取层也可以为待训练的风险识别模型中的网络层,可以与待训练的风险识别模型一起进行训练的网络层。故待训练的风险识别模型可以包括各模态类型对应的特征提取层,文本模态类型对应文本特征提取层,图像模态类型对应图像特征提取层,结构化模态类型对应结构化特征提取层。上述在将确定出的各特征进行融合时,服务器可以将确定出的各特征输入融合层,将各特征进行自注意力加权融合,得到融合后的特征。故待训练的风险识别模型中还可以包括融合层。
基于此,上述步骤S106中待识别用户的信息也可以为多模态的信息,故在上述步骤S106中将信息输入所述目标识别模型,确定待识别用户的风险识别结果时,服务器可以确定待识别用户的信息中包括的各模态类型,针对每一个模态类型,确定在待识别用户的信息中该模态类型对应的信息的特征,将确定出的各特征进行融合,并将融合后的特征输入风险识别模型,确定训待识别用户的风险识别结果。其中,在确定在待识别用户的信息中该模态类型对应的信息的特征时,服务器可以确定该模态类型对应的特征提取层,并将该模态类型对应的信息输入确定出的特征提取层,确定该模态类型对应的信息的特征。在将确定出的各特征进行融合时,服务器可以将确定出的各特征输入融合层,将各特征进行自注意力加权融合,得到融合后的特征。
在本说明书中,用户的信息可以包括文本、图像以及结构化三种模态的信息,风险识别模型可以包括各模态类型对应的特征提取层(即文本特征提取层、图像特征提取层以及结构化特征提取层)、融合层、前馈神经网络以及识别层,前馈神经网络包括第一网络层、中间网络层以及第二网络层,中间网络层包括若干知识神经元,目标识别模型与风险识别模型的结构一致,只是二者的知识神经元的个数或者模型参数值不一致,如图2所示,图2为本说明书中提供的一种风险识别模型的结构示意图。在将信息输入所述目标识别模型,确定待识别用户的风险识别结果时,服务器可以确定待识别用户的信息中包括的各模态类型(即文本、图像以及结构化三种模态类型),将在待识别用户的信息中文本模态类型对应的信息输入文本特征提取层,确定文本特征。将在待识别用户的信息中图像模态类型对应的信息输入图像特征提取层,确定图像特征。将在待识别用户的信息中结构化模态类型对应的信息输入结构化特征提取层,确定结构化特征。再将文本特征、图像特征以及结构化特征输入融合层,确定融合后的特征。将融合后的特征输入前馈神经网络的第一网络层,确定第一特征。再将第一特征输入中间网络层,确定第二特征。将第二特征输入以及第二网络层,确定第三特征,将第三特征输入识别层,确定待识别用户的风险识别结果。训练样本对应的识别结果
以上为本说明书的一个或多个实施例提供的风险识别的方法,基于同样的思路,本说明书还提供了相应的风险识别的装置,如图3所示。
图3为本说明书中提供的一种风险识别的装置示意图,具体包括:
第一确定模块200,用于从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定所述各待识别类型对应的配置信息;
第二确定模块202,用于在预先训练的风险识别模型中,确定所述各待识别类型对应的各模型参数,作为各目标参数;其中,所述风险识别模型用于识别所有风险类型,所述风险识别模型中包括所述所有风险类型对应的模型参数;
调整模块204,用于根据所述配置信息,调整所述各目标参数,确定目标识别模型;
识别模块206,用于确定待识别用户的信息,并将所述信息输入所述目标识别模型,确定所述待识别用户的风险识别结果;
风控模块208,用于根据所述风险识别结果,对所述待识别用户进行风险控制。
可选地,所述第二确定模块202具体用于,针对每一个风险类型,确定历史上标注为该风险类型的用户的信息,并作为测试信息;将所述测试信息输入预先训练的风险识别模型,确定识别结果;根据所述识别结果,采用积分梯度算法,确定在所述风险识别模型中该风险类型对应的模型参数;确定各风险类型与所述风险识别模型中各模型参数之间的对应关系;根据各对应关系,确定所述风险识别模型中所述各待识别类型对应的各模型参数,作为各目标参数。
可选地,所述配置信息包括所述各待识别类型对应的指定参数值;
所述调整模块204具体用于,针对每一个待识别类型,确定所述配置信息中该待识别类型对应的指定参数值;将该待识别类型对应的目标参数的参数值调整为该待识别类型对应的指定参数值;将调整后的风险识别模型作为目标识别模型。
可选地,所述风控模块208具体用于,根据所述风险识别结果,采用积分梯度算法,确定在所述风险识别模型中所述风险识别结果对应的模型参数;判断确定出的模型参数对应的风险类型与所述风险识别结果是否一致;若是,根据所述风险识别结果,对所述待识别用户进行风险控制;若否,确定所述风险识别结果不准确。
可选地,所述装置还包括:
训练模块210,用于确定历史上用户的信息作为训练样本,以及将历史上所述用户对应的风险类型作为所述训练样本对应的标注;根据所述训练样本以及所述标注,对待训练的风险识别模型进行训练,以使所述待训练的风险识别模型中的各模型参数学习各风险类型对应的风险的特征。
可选地,所述待训练的风险识别模型包括前馈神经网络以及识别层,所述前馈神经网络包括第一网络层、中间网络层以及第二网络层,所述中间网络层包括所述各风险类型对应的各模型参数;
所述训练模块210具体用于,将所述训练样本输入待训练的风险识别模型的前馈神经网络的第一网络层,确定第一特征;将所述第一特征输入所述待训练的风险识别模型的前馈神经网络的中间网络层,以通过所述中间网络层中的各模型参数学习各风险类型对应的风险特征,确定所述中间网络层输出的第二特征;将所述第二特征输入所述待训练的风险识别模型的前馈神经网络的第二网络层,确定第三特征;将所述第三特征输入所述待训练的风险识别模型的识别层,确定所述训练样本对应的识别结果;以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
可选地,所述信息至少包括文本、图像以及结构化中的两种模态的信息;
所述训练模块210具体用于,确定所述训练样本中包括的各模态类型;针对每一个模态类型,确定在所述训练样本中该模态类型对应的信息的特征;将确定出的各特征进行融合,并将融合后的特征输入待训练的风险识别模型,确定所述训练样本对应的识别结果;以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1所示的风险识别的方法。
本说明书还提供了图4所示的电子设备的示意图。如图4所述,图4为本说明书中提供的对应于图1的电子设备示意图,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所示的风险识别的方法。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (16)

1.一种风险识别的方法,包括:
从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定所述各待识别类型对应的配置信息;
在预先训练的风险识别模型中,确定所述各待识别类型对应的各模型参数,作为各目标参数;其中,所述风险识别模型用于识别所有风险类型,所述风险识别模型中包括所述所有风险类型对应的模型参数;
根据所述配置信息,调整所述各目标参数,确定目标识别模型;
确定待识别用户的信息,并将所述信息输入所述目标识别模型,确定所述待识别用户的风险识别结果;
根据所述风险识别结果,对所述待识别用户进行风险控制。
2.如权利要求1所述的方法,在预先训练的风险识别模型中,确定所述各待识别类型对应的各模型参数,作为各目标参数,具体包括:
针对每一个风险类型,确定历史上标注为该风险类型的用户的信息,并作为测试信息;
将所述测试信息输入预先训练的风险识别模型,确定识别结果;
根据所述识别结果,采用积分梯度算法,确定在所述风险识别模型中该风险类型对应的模型参数;
确定各风险类型与所述风险识别模型中各模型参数之间的对应关系;
根据各对应关系,确定所述风险识别模型中所述各待识别类型对应的各模型参数,作为各目标参数。
3.如权利要求1所述的方法,所述配置信息包括所述各待识别类型对应的指定参数值;
根据所述配置信息,调整所述各目标参数,确定目标识别模型,具体包括:
针对每一个待识别类型,确定所述配置信息中该待识别类型对应的指定参数值;
将该待识别类型对应的目标参数的参数值调整为该待识别类型对应的指定参数值;
将调整后的风险识别模型作为目标识别模型。
4.如权利要求1所述的方法,根据所述风险识别结果,对所述待识别用户进行风险控制,具体包括:
根据所述风险识别结果,采用积分梯度算法,确定在所述风险识别模型中所述风险识别结果对应的模型参数;
判断确定出的模型参数对应的风险类型与所述风险识别结果是否一致;
若是,根据所述风险识别结果,对所述待识别用户进行风险控制;
若否,确定所述风险识别结果不准确。
5.如权利要求1所述的方法,预先训练风险识别模型,具体包括:
确定历史上用户的信息作为训练样本,以及将历史上所述用户对应的风险类型作为所述训练样本对应的标注;
根据所述训练样本以及所述标注,对待训练的风险识别模型进行训练,以使所述待训练的风险识别模型中的各模型参数学习各风险类型对应的风险的特征。
6.如权利要求5所述的方法,所述待训练的风险识别模型包括前馈神经网络以及识别层,所述前馈神经网络包括第一网络层、中间网络层以及第二网络层,所述中间网络层包括所述各风险类型对应的各模型参数;
根据所述训练样本以及所述标注,对待训练的风险识别模型进行训练,具体包括:
将所述训练样本输入待训练的风险识别模型的前馈神经网络的第一网络层,确定第一特征;
将所述第一特征输入所述待训练的风险识别模型的前馈神经网络的中间网络层,以通过所述中间网络层中的各模型参数学习各风险类型对应的风险特征,确定所述中间网络层输出的第二特征;
将所述第二特征输入所述待训练的风险识别模型的前馈神经网络的第二网络层,确定第三特征;
将所述第三特征输入所述待训练的风险识别模型的识别层,确定所述训练样本对应的识别结果;
以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
7.如权利要求5所述的方法,所述信息至少包括文本、图像以及结构化中的两种模态的信息;
根据所述训练样本以及所述标注,对待训练的风险识别模型进行训练,具体包括:
确定所述训练样本中包括的各模态类型;
针对每一个模态类型,确定在所述训练样本中该模态类型对应的信息的特征;
将确定出的各特征进行融合,并将融合后的特征输入待训练的风险识别模型,确定所述训练样本对应的识别结果;
以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
8.一种风险识别的装置,包括:
第一确定模块,用于从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,并确定所述各待识别类型对应的配置信息;
第二确定模块,用于在预先训练的风险识别模型中,确定所述各待识别类型对应的各模型参数,作为各目标参数;其中,所述风险识别模型用于识别所有风险类型,所述风险识别模型中包括所述所有风险类型对应的模型参数;
调整模块,用于根据所述配置信息,调整所述各目标参数,确定目标识别模型;
识别模块,用于确定待识别用户的信息,并将所述信息输入所述目标识别模型,确定所述待识别用户的风险识别结果;
风控模块,用于根据所述风险识别结果,对所述待识别用户进行风险控制。
9.如权利要求8所述的装置,所述第二确定模块具体用于,针对每一个风险类型,确定历史上标注为该风险类型的用户的信息,并作为测试信息;将所述测试信息输入预先训练的风险识别模型,确定识别结果;根据所述识别结果,采用积分梯度算法,确定在所述风险识别模型中该风险类型对应的模型参数;确定各风险类型与所述风险识别模型中各模型参数之间的对应关系;根据各对应关系,确定所述风险识别模型中所述各待识别类型对应的各模型参数,作为各目标参数。
10.如权利要求8所述的装置,所述配置信息包括所述各待识别类型对应的指定参数值;
所述调整模块具体用于,针对每一个待识别类型,确定所述配置信息中该待识别类型对应的指定参数值;将该待识别类型对应的目标参数的参数值调整为该待识别类型对应的指定参数值;将调整后的风险识别模型作为目标识别模型。
11.如权利要求8所述的装置,所述风控模块具体用于,根据所述风险识别结果,采用积分梯度算法,确定在所述风险识别模型中所述风险识别结果对应的模型参数;判断确定出的模型参数对应的风险类型与所述风险识别结果是否一致;若是,根据所述风险识别结果,对所述待识别用户进行风险控制;若否,确定所述风险识别结果不准确。
12.如权利要求8所述的装置,所述装置还包括:
训练模块,用于确定历史上用户的信息作为训练样本,以及将历史上所述用户对应的风险类型作为所述训练样本对应的标注;根据所述训练样本以及所述标注,对待训练的风险识别模型进行训练,以使所述待训练的风险识别模型中的各模型参数学习各风险类型对应的风险的特征。
13.如权利要求12所述的装置,所述待训练的风险识别模型包括前馈神经网络以及识别层,所述前馈神经网络包括第一网络层、中间网络层以及第二网络层,所述中间网络层包括所述各风险类型对应的各模型参数;
所述训练模块具体用于,将所述训练样本输入待训练的风险识别模型的前馈神经网络的第一网络层,确定第一特征;将所述第一特征输入所述待训练的风险识别模型的前馈神经网络的中间网络层,以通过所述中间网络层中的各模型参数学习各风险类型对应的风险特征,确定所述中间网络层输出的第二特征;将所述第二特征输入所述待训练的风险识别模型的前馈神经网络的第二网络层,确定第三特征;将所述第三特征输入所述待训练的风险识别模型的识别层,确定所述训练样本对应的识别结果;以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
14.如权利要求12所述的装置,所述信息至少包括文本、图像以及结构化中的两种模态的信息;
所述训练模块具体用于,确定所述训练样本中包括的各模态类型;针对每一个模态类型,确定在所述训练样本中该模态类型对应的信息的特征;将确定出的各特征进行融合,并将融合后的特征输入待训练的风险识别模型,确定所述训练样本对应的识别结果;以所述识别结果与所述标注之间的差异最小为目标,对所述待训练的风险识别模型进行训练。
15.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
16.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。
CN202311636825.8A 2023-11-30 2023-11-30 一种风险识别的方法、装置、存储介质及电子设备 Pending CN117575611A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311636825.8A CN117575611A (zh) 2023-11-30 2023-11-30 一种风险识别的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311636825.8A CN117575611A (zh) 2023-11-30 2023-11-30 一种风险识别的方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN117575611A true CN117575611A (zh) 2024-02-20

Family

ID=89893686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311636825.8A Pending CN117575611A (zh) 2023-11-30 2023-11-30 一种风险识别的方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN117575611A (zh)

Similar Documents

Publication Publication Date Title
CN115618964B (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN115238826B (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN115712866B (zh) 数据处理方法、装置及设备
CN116152933A (zh) 一种异常检测模型的训练方法、装置、设备及存储介质
CN115828162A (zh) 一种分类模型训练的方法、装置、存储介质及电子设备
CN116578877B (zh) 一种模型训练及二次优化打标的风险识别的方法及装置
CN116186330B (zh) 一种基于多模态学习的视频去重方法及装置
CN117093862A (zh) 一种模型训练的方法、装置、电子设备及存储介质
CN115545353A (zh) 一种业务风控的方法、装置、存储介质及电子设备
CN117575611A (zh) 一种风险识别的方法、装置、存储介质及电子设备
CN116340852B (zh) 一种模型训练、业务风控的方法及装置
CN117237744B (zh) 一种图像分类模型的训练方法、装置、介质及电子设备
CN115017915B (zh) 一种模型训练、任务执行的方法及装置
CN116401541A (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN117454247A (zh) 一种模型的训练方法、装置、存储介质及电子设备
CN116151466A (zh) 一种企业风险预警模型的训练方法、装置、介质及设备
CN116822936A (zh) 一种业务风控的方法、装置、存储介质及电子设备
CN116843466A (zh) 一种风险识别模型训练方法、装置、存储介质及电子设备
CN115470501A (zh) 一种数据保护方法、装置、存储介质及电子设备
CN118194974A (zh) 一种模型训练、业务风控方法、装置、存储介质及设备
CN117743824A (zh) 一种模型训练、业务执行方法、装置、存储介质及设备
CN117952229A (zh) 一种模型训练方法、业务风控方法、装置以及存储介质
CN117591217A (zh) 一种信息展示方法、装置、设备及存储介质
CN117592998A (zh) 一种风控的方法、装置、存储介质及电子设备
CN117079274A (zh) 一种识别模型的训练方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination