CN112330035A - 风险预测模型的训练方法及装置 - Google Patents

风险预测模型的训练方法及装置 Download PDF

Info

Publication number
CN112330035A
CN112330035A CN202011248288.6A CN202011248288A CN112330035A CN 112330035 A CN112330035 A CN 112330035A CN 202011248288 A CN202011248288 A CN 202011248288A CN 112330035 A CN112330035 A CN 112330035A
Authority
CN
China
Prior art keywords
risk
identity authentication
sub
target
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011248288.6A
Other languages
English (en)
Inventor
金璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202011248288.6A priority Critical patent/CN112330035A/zh
Publication of CN112330035A publication Critical patent/CN112330035A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本说明书实施例提供了一种风险预测模型的训练方法及装置。训练模型所采用的样本特征涵盖了身份认证过程经历的链路中的多个环节的信息,该信息综合了用户、行为、终端、账号等多个方面。由此,根据该样本特征训练得到的风险预测模型对身份认证的风险的预测结果也更加准确、更加有效。

Description

风险预测模型的训练方法及装置
技术领域
本说明书实施例涉及数据安全技术领域,具体地,涉及风险预测模型的训练方法及装置、风险识别方法及装置。
背景技术
目前市面上的设备具有多种功能,并且在用户的生活中越来越重要。例如,提供便捷的网络支付的智能手机、帮助办公的个人电脑等等。同时,采用设备执行的一些业务可能存在较大的风险。特别是在采用设备与服务器之间进行交互的方式执行身份认证的场景中,若该设备所执行的身份认证风险较高(例如,该风险较高的身份认证可以是以对服务器进行攻击为手段执行的),则将对该服务器运行的安全性带来较大的隐患,进而增加与该服务器交互的其他设备的安全隐患。
可见,如何对身份认证的风险进行鉴别,成为亟待解决的问题。
发明内容
本说明书实施例提供了风险预测模型的训练方法及装置、风险识别方法及装置,可以有效地对身份认证的风险进行鉴别。
根据第一方面,提供了一种风险预测模型的训练方法,包括:
获取历史身份认证对应的历史数据;
根据该历史数据,确定训练样本的样本特征,并确定该训练样本的风险标签;其中,所述样本特征包括:执行该历史身份认证采用的身份特征、该历史身份认证执行过程中所采用设备的设备特征、所使用账号的账号特征、以及该历史身份认证执行过程中涉及行为的行为特征;
将所述样本特征输入风险预测模型,得到预测结果;根据所述预测结果和所述风险标签,训练所述风险预测模型。
在一个实施例中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;
将所述样本特征输入风险预测模型,得到预测结果,包括:
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果;
根据所述预测结果和所述风险标签,训练所述风险预测模型,包括:
根据各子预测结果与该训练样本的风险标签,训练所述风险预测模型。
在一个实施例中,所述设备特征包括以下中的至少一种:执行该历史身份认证所采用的设备的型号、所述设备的参数、所述设备中安装的各客户端信息;所述多个子模型包括:用于预测设备风险的第一子模型;
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果,包括:
将所述设备特征输入所述第一子模型,得到所述第一子模型输出的第一子预测结果,所述第一子预测结果示出所述设备的机型为风险机型的概率、所述设备的参数是伪造参数的概率、所述设备中安装有非法客户端的概率中的至少一种。
在一个实施例中,所述账号特征包括以下中的至少一种:所述账号的属性信息、所述账号的历史使用信息;所述多个子模型包括:用于预测账号风险的第二子模型;
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果,包括:
将所述账号特征输入所述第二子模型,得到所述第二子模型输出的第二子预测结果,所述第二子预测结果示出所述账号是非法账号的概率、所述账号是沉睡账号的概率中的至少一种。
在一个实施例中,所述行为特征包括以下中的至少一种:触发所述历史身份认证的用户的行为信息、执行所述历史身份认证的客户端的行为信息;所述多个子模型包括:用于预测行为风险的第三子模型;
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果,包括:
将所述行为特征输入所述第三子模型,得到所述第三子模型输出的第三子预测结果,所述第三子预测结果示出所述用户的行为是非法行为的概率、所述客户端的行为是非法行为的概率中的至少一种。
在一个实施例中,所述身份特征包括以下中的至少一种:执行该历史身份认证时采集的面部数据、声纹数据、指纹数据、指静脉数据、虹膜数据、文本数据;所述多个子模型包括:用于预测身份风险的第四子模型;
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果,包括:
将所述身份特征输入所述第四子模型,得到所述第四子模型输出的第四子预测结果,所述第四子预测结果示出所述身份特征包含的数据是非法数据的概率。
在一个实施例中,确定该训练样本的风险标签,包括:
确定该训练样本针对所述多个风险类型的多个子标签;
根据各子标签,确定该训练样本的风险标签;
根据所述预测结果和所述风险标签,训练所述风险预测模型,包括:
针对每个子模型,以该子模型输出的子预测结果与该子预测结果对应的子标签的差异最小化为训练目标,训练该子模型。
在一个实施例中,确定该训练样本的风险标签,包括:
根据执行该历史身份认证时采取的历史策略,确定该训练样本的风险标签;
根据所述预测结果和所述风险标签,训练所述风险预测模型,包括:
根据所述预测结果,得到该历史身份认证的执行策略;
以所述执行策略与所述风险标签的差异最小化为训练目标,训练所述风险预测模型。
根据第二方面,提供了一种风险识别方法,包括:
获取待评估的目标身份认证的目标数据;所述目标数据包括,执行该目标身份认证采用的身份特征、该目标身份认证过程中采用的设备特征、账号特征、以及该目标身份认证执行过程中涉及行为的行为特征;
将所述目标数据输入预先训练的风险预测模型,得到该目标身份认证的预测结果;
根据所述预测结果,确定该目标身份认证的风险评分;
根据所述风险评分,得到该目标身份认证的风险识别结果。
在一个实施例中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;
将所述目标数据输入预先训练的风险预测模型,得到该目标身份认证的预测结果,包括:
将所述目标数据分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果。
在一个实施例中,根据所述预测结果,确定该目标身份认证的风险评分,包括:
根据所述预测结果,在各历史身份认证中,确定出与该目标身份认证的相似度大于第一阈值的各历史身份认证;
根据确定出的各历史身份认证在历史上的执行结果,确定该目标身份认证的风险评分。
在一个实施例中,确定该目标身份认证的风险评分,包括:
判断所述预测结果是否满足预设的高风险第一判断条件;
若是,则生成校验指令,发送至触发所述目标身份认证的设备;
根据所述设备返回的校验数据,确定该目标身份认证的风险评分。
在一个实施例中,所述方法还包括:
若所述预测结果不满足预设的高风险第一判断条件,则确定该目标身份认证与所述高风险第一判断条件中限定的高风险身份认证的相似度是否大于第二阈值;
若是,则根据所述预测结果,在各历史身份认证中,确定出与该目标身份认证的相似度大于预设的第三阈值的历史身份认证的数量;
根据所述数量,确定该目标身份认证的风险评分。
在一个实施例中,所述风险识别结果包括:高风险身份认证、低风险身份认证之一;
根据所述风险评分,得到该目标身份认证的风险识别结果,包括:
判断该目标身份认证的风险评分是否满足预设的高风险第二判断条件;
若是,确定该目标身份认证是高风险身份认证;
若否,则确定历史上的预设时间段内触发的各高风险身份认证,作为基准认证;在该目标身份认证与任一基准认证的相似度均不大于预设的第四阈值的条件下,确定该目标身份认证是低风险身份认证。
在一个实施例中,得到该目标身份认证的风险识别结果之后,所述方法还包括:
若该目标身份认证是高风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第一策略;
若该目标身份认证是低风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第二策略;所述第一策略的安全性高于所述第二策略。
根据第三方面,提供了一种风险预测模型的训练装置,所述装置包括:
历史数据获取单元,配置为获取历史身份认证对应的历史数据;
训练样本确定单元,配置为根据该历史数据,确定训练样本的样本特征,并确定该训练样本的风险标签;其中,所述样本特征包括:执行该历史身份认证采用的身份特征、该历史身份认证执行过程中所采用设备的设备特征、所使用账号的账号特征、以及该历史身份认证执行过程中涉及行为的行为特征;
训练单元,配置为将所述样本特征输入风险预测模型,得到预测结果;根据所述预测结果和所述风险标签,训练所述风险预测模型。
在一个实施例中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;所述训练单元包括:子预测结果确定模块和训练模块;
所述子预测结果确定模块配置为:将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果;
所述训练模块配置为:根据各子预测结果与该训练样本的风险标签,训练所述风险预测模型。
在一个实施例中,所述设备特征包括以下中的至少一种:执行该历史身份认证所采用的设备的型号、所述设备的参数、所述设备中安装的各客户端信息;所述多个子模型包括:用于预测设备风险的第一子模型;
所述子预测结果确定模块配置为:将所述设备特征输入所述第一子模型,得到所述第一子模型输出的第一子预测结果,所述第一子预测结果示出所述设备的机型为风险机型的概率、所述设备的参数是伪造参数的概率、所述设备中安装有非法客户端的概率中的至少一种。
在一个实施例中,所述账号特征包括以下中的至少一种:所述账号的属性信息、所述账号的历史使用信息;所述多个子模型包括:用于预测账号风险的第二子模型;
所述子预测结果确定模块配置为:将所述账号特征输入所述第二子模型,得到所述第二子模型输出的第二子预测结果,所述第二子预测结果示出所述账号是非法账号的概率、所述账号是沉睡账号的概率中的至少一种。
在一个实施例中,所述行为特征包括以下中的至少一种:触发所述历史身份认证的用户的行为信息、执行所述历史身份认证的客户端的行为信息;所述多个子模型包括:用于预测行为风险的第三子模型;
所述子预测结果确定模块配置为:将所述行为特征输入所述第三子模型,得到所述第三子模型输出的第三子预测结果,所述第三子预测结果示出所述用户的行为是非法行为的概率、所述客户端的行为是非法行为的概率中的至少一种。
在一个实施例中,所述身份特征包括以下中的至少一种:执行该历史身份认证时采集的面部数据、声纹数据、指纹数据、指静脉数据、虹膜数据、文本数据;所述多个子模型包括:用于预测身份风险的第四子模型;
所述子预测结果确定模块配置为:将所述身份特征输入所述第四子模型,得到所述第四子模型输出的第四子预测结果,所述第四子预测结果示出所述身份特征包含的数据是非法数据的概率。
在一个实施例中,训练样本确定单元配置为:确定该训练样本针对所述多个风险类型的多个子标签;根据各子标签,确定该训练样本的风险标签;
训练单元配置为:针对每个子模型,以该子模型输出的子预测结果与该子预测结果对应的子标签的差异最小化为训练目标,训练该子模型。
在一个实施例中,训练样本确定单元配置为:根据执行该历史身份认证时采取的历史策略,确定该训练样本的风险标签;
训练单元配置为:根据所述预测结果,得到该历史身份认证的执行策略;以所述执行策略与所述风险标签的差异最小化为训练目标,训练所述风险预测模型
根据第四方面,提供了一种风险识别装置,所述装置包括:
目标数据获取单元,配置为获取待评估的目标身份认证的目标数据;所述目标数据示出执行该目标身份认证采用的身份特征、该目标身份认证过程中采用的设备特征、账号特征、以及该目标身份认证执行过程中涉及行为的行为特征;
预测结果确定单元,配置为将所述目标数据输入预先训练的风险预测模型,得到该目标身份认证的预测结果;
风险评分确定单元,配置为根据所述预测结果,确定该目标身份认证的风险评分;
风险识别结果确定单元,配置为根据所述风险评分,得到该目标身份认证的风险识别结果。
在一个实施例中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;
预测结果确定单元配置为:将所述目标特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果。
在一个实施例中,风险评分确定单元包括:历史身份认证确定模块和风险评分确定模块;
所述历史身份认证确定模块,配置为根据所述预测结果,在各历史身份认证中,确定出与该目标身份认证的相似度大于第一阈值的各历史身份认证;
所述风险评分确定模块,配置为根据确定出的各历史身份认证在历史上的执行结果,确定该目标身份认证的风险评分。
在一个实施例中,风险评分确定单元包括:判断模块和风险评分确定模块;
所述判断模块,配置为判断所述预测结果是否满足预设的高风险第一判断条件;
风险评分确定模块,配置为在所述预测结果满足预设的高风险第一判断条件时,则生成校验指令,发送至触发所述目标身份认证的设备;根据所述设备返回的校验数据,确定该目标身份认证的风险评分。
在一个实施例中,所述风险评分确定模块还配置为:在所述预测结果不满足预设的高风险第一判断条件时,确定该目标身份认证与所述高风险第一判断条件中限定的高风险身份认证的相似度是否大于第二阈值;若是,则根据所述预测结果,在各历史身份认证中,确定出与该目标身份认证的相似度大于预设的第三阈值的历史身份认证的数量;根据所述数量,确定该目标身份认证的风险评分。
在一个实施例中,所述风险识别结果包括:高风险身份认证、低风险身份认证之一;
所述风险识别结果确定单元配置为:判断该目标身份认证的风险评分是否满足预设的高风险第二判断条件;若是,确定该目标身份认证是高风险身份认证;若否,则确定历史上的预设时间段内触发的各高风险身份认证,作为基准认证;在该目标身份认证与任一基准认证的相似度均不大于预设的第四阈值的条件下,确定该目标身份认证是低风险身份认证。
在一个实施例中,所述装置还包括:
策略确定单元,配置为若该目标身份认证是高风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第一策略;若该目标身份认证是低风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第二策略;所述第一策略的安全性高于所述第二策略。
根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面和第二方面的方法。
根据第六方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面和第二方面的方法。
根据本说明书一个实施例提供的方法和装置,训练模型所采用的样本特征涵盖了身份认证过程经历的链路中的多个环节的信息,该信息综合了用户、行为、终端、账号等多个方面。由此,根据该样本特征训练得到的风险预测模型对身份认证的风险的预测结果也更加准确、更加有效。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出根据一个实施例的客户端与服务器在身份认证过程中的交互示意图;
图2示出根据一个实施例的风险预测模型的训练过程;
图3示出根据一个实施例的风险预测模型的训练流程图;
图4示出根据一个实施例的多个设备与服务器之间的交互示意图;
图5示出根据一个实施例的风险预测模型基于样本特征得到预测结果的示意图;
图6示出根据一个实施例的风险识别过程;
图7示出根据一个实施例的采用风险预测模型和决策引擎进行风险识别的示意图;
图8示出根据一个实施例的决策引擎基于预测结果得到风险识别结果的示意图;
图9a示出根据一个实施例的基于风险评分确定目标身份认证是否是高风险身份认证的过程;
图9b示出根据另一个实施例的基于风险评分确定目标身份认证是否是高风险身份认证的过程;
图10示出根据一个实施例的风险预测模型的训练装置的示意性框图;
图11示出根据一个实施例的风险识别装置的示意性框图;
图12示出根据一个实施例的对应于图2和/或图6的电子设备示意图。
具体实施方式
下面结合附图和实施例对本说明书作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本说明书中的实施例及实施例中的特征可以相互组合。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
为便于说明,现就身份认证过程经历的链路中的各环节进行说明。
本说明书中的身份认证可以是针对用户的身份真实性进行的认证,该认证的结果可以用于表征该认证行为和/或该认证行为对应的操作是否是由该用户本人执行的。例如,本说明书中的过程应用于用户通过某支付客户端进行支付的场景时,该认证行为可以是用户刷指纹的行为,该认证行为对应的操作可以是该用户点击“确认支付”的行为。即,本说明书中的身份认证过程中所鉴别的对象可以是具有动态属性的某一“动作”,以确定该“动作”是否可信。
此外,本说明书中的过程的适用场景不仅仅局限于前述的针对用户的行为(例如,认证行为、认证行为对应的操作)进行认证的场景,还可以应用于对用户的身份、业务执行过程中采用的交互媒介(例如,业务执行过程中采用的设备、账号、网络等)的合法性进行的认证的场景。例如,本说明书中的过程应用于用户在某支付平台进行注册的过程中时,本说明书中的过程可以用于对用户的身份是否非法(风险较高)、用户所采用的交互媒介是否非法(风险较高)、用户与交互媒介之间的对应关系是否非法(风险较高)等进行识别。即,本说明书中的身份认证过程中所鉴别的对象可以是具有静态属性的某一“事物”和/或某一“对应关系”,以确定该“事物”和/或“对应关系”是否可信。
进一步地,本说明书中的身份认证还能够根据前述的“动作”、“事物”、“对应关系”中的至少一种得到的结果,间接的反映出身份认证过程中用户的主观意图。
示例性的,在如图1所示的场景中,身份认证的过程可以是:首先由客户端生成身份认证请求,并将身份认证请求发送至服务器。其中,客户端可以具有软件形式,并部署在身份认证执行过程中采用的设备中。服务器接收到来自于客户端的身份认证请求之后,针对该身份认证请求所对应的身份认证的风险进行识别,并生成风险识别结果。之后,服务器根据该风险识别结果,确定针对该身份认证请求和/或该身份认证请求对应的业务的执行策略,使得该客户端和/或该服务器针对该身份认证根据该执行策略进行后续的步骤。
本说明书对安装有所述客户端的设备不做具体限制,该设备可以是手机、平板电脑、个人电脑、笔记本电脑、掌上电脑(Personal Digital Assistant,PDA)、可穿戴设备(例如,智能眼镜、智能手表)、ATM机、智能安防系统、智能家居等等。
进一步地,本说明书中的服务器是指网络中能对其它设备提供服务的计算机系统。服务器服务的对象通常称为设备或客户端,服务器与设备之间可以通过有线或者无线的方式通信连接。服务器的实现方式是多种多样的,可以是单台的计算机设备,也可以是多台计算机设备的组合(例如集群服务器,云服务器等)。服务器在一些应用场景中也可以被称为服务端,云端等。
本说明书对前述的身份认证请求的生成过程不做具体限制,在一个可选的实施例中,该身份认证请求可以是根据用户针对所述客户端所属的设备的操作触发的,例如,用户点击“确认支付”的行为可以触发该身份认证请求。此外,该身份认证请求可以是由客户端和/或客户端所属的设备自行触发的,例如,在用户到达某一指定区域(可以是地理、空间中的区域,例如某办公楼)之后,该用户所持的设备中运行的某客户端自动发送身份认证请求至服务器,以实现该用户上班自动打卡的目的。
身份认证的过程通常涉及对信息真实性的判断。若一身份认证的信息是虚假信息,则该身份认证所带来的风险通常是较高的。此外,若一身份认证的信息反映出用户执行该身份认证对应的操作具有主观上的恶意,则该身份认证所带来的风险通常也较高。
其中,所述风险可以是对该身份认证对应的各业务方造成的风险。例如,一不法分子盗用他人在支付平台的账号进行非法支付的场景中,该不法分子需通过身份认证才能够完成该笔非法支付,则该身份认证对的各业务方可以包括:该账号的合法持有者、该支付平台、为该非法支付出资的银行中的至少一种。可见,对任一业务方造成的不利影响均可以视为本说明书中的风险。
可见,如何在身份认证的环节有效的识别出风险,成为亟待解决的问题。
为便于说明,以下将从“模型训练”、“风险识别”、“执行策略的制定”等几个方面,对本说明书中的身份认证过程涉及的几个环节进行说明。需要说明的是,身份认证过程涉及的几个环节未必均发生在身份认证的过程中,例如,“模型训练”的环节可以发生在进行身份认证之前。
一、模型训练。
本说明书中对身份认证涉及的风险识别过程有赖于风险预测模型。则在针对风险识别过程的进行说明之前,首先针对风险预测模型的训练过程进行说明。
本说明书提供一种风险预测模型的训练过程,如图2所示,该过程可以包括以下步骤中的一个或多个。
S200:获取历史身份认证对应的历史数据。
本说明书将模型训练之前的各时刻称为历史时刻。在历史时刻中确定出风险类型、风险程度(可以通过风险分值表征)、执行策略中的至少一种的各身份认证,可以作为本说明书中的历史身份认证。
需要说明的是,本说明书对历史身份认证的风险的表征形式不做具体限制,例如,该风险可以以分值、向量、图形、表格等形式进行表征。
进一步地,本说明书对如何确定历史身份认证的风险不做具体限制,例如,可以根据实际采集到的数据,确定该历史身份认证在历史中的执行结果,根据该执行结果确定该历史身份认证的风险。例如,采集到的数据表明一历史身份认证执行完成之后,有用户针对该历史身份认证执行了撤销、报警等操作(该操作可以作为该历史身份认证的执行结果),则表明该历史身份认证是高风险身份认证。
此外,可以根据预设的业务目标,确定该历史身份认证在历史中的执行结果。则采用的业务目标不同的情况下,针对一历史身份认证得到的执行结果可能不同。
为得到足够的训练样本,本步骤可以针对若干个历史身份认证获取历史数据。以下,以各历史身份认证之一为例,进行说明。进一步地,针对某一身份认证,该身份认证的历史数据可以根据同一终端采集的数据得到的,也可以是若干个终端采集到的数据得到。
如图3所示,本说明书中的历史数据至少包括以下至少一种:身份数据、设备数据、账号数据、行为数据。其中,身份数据用于表征该历史身份认证执行过程中所采用的身份特征(例如,触发该历史身份认证的用户的身份特征);设备数据用于表征该历史身份认证执行过程中所采用设备的设备特征;账号数据用于表征该历史身份认证执行过程中所使用账号(例如,支付时所采用的支付平台账号、银行账号中的至少一种)的账号特征;行为数据用于表征该历史身份认证执行过程中涉及行为(例如,用户的行为、该历史身份涉及的客户端的行为中的至少一种)的行为特征。
S202:根据该历史数据,确定训练样本的样本特征,并确定该训练样本的风险标签。其中,所述样本特征包括:执行该历史身份认证采用的身份特征、该历史身份认证执行过程中所采用设备的设备特征、所使用账号的账号特征、以及该历史身份认证执行过程中涉及行为的行为特征。
在得到历史数据的基础上,本步骤根据该历史数据得到训练样本的样本特征。可见,本说明书中的样本特征至少涉及身份、设备、账号、行为等若干个方面,即样本特征涵盖了身份认证过程经历的链路(例如,该链路可以是“用户-设备-客户端-账号”)中的多个环节的信息,使得该样本特征更具综合性,对该历史身份认证涉及的各种因素的表征也更加契合实际。
在本说明书一个可选的实施例中,样本特征可以以向量的形式予以表征,则各方面的特征可以与该样本特征的维度一一对应。此外,本说明书中的风险标签可以根据前述的历史身份认证在历史中的执行结果,通过打标的方式得到。在本说明书一个可选的实施例中,该打标可以是人工进行打标,也可以是采用人工智能的手段进行的打标。
本说明书中确定样本特征和确定风险标签的执行次序不分先后。
S204:将所述样本特征输入风险预测模型,得到预测结果。
本说明书中的风险预测模型具备根据输入的数据,对身份认证可能造成的风险进行预测能力。
本说明书对该风险预测模型的具体形式不做限制,例如,该风险预测模型可以是人工神经网络(Artificial Neural Network,ANN)模型、极端梯度提升(eXtreme GradientBoosting,XGBoost)模型等。
进一步地,在本说明书一个可选的实施例中,风险预测模型输出的预测结果可以是用于对身份认证对应的风险进行定性的结果,也可以是对身份认证对应的风险进行定量的结果。
S206:根据所述预测结果和所述风险标签,训练所述风险预测模型。
由前述内容可知,本说明书中的模型训练过程采用有监督的训练方式。风险标签能够表征该风险标签所属的训练样本在实际场景中所对应的真实的执行结果,本说明书中的模型训练过程旨在减少模型输出预测结果与该真实结果之间的差异。
该模型训练的过程可以是采用梯度反向传播的迭代式的训练过程,在如图3所示的实施例中,每次迭代都会根据本次迭代得到的预测结果调整风险预测模型的至少部分参数,直至风险预测模型收敛。
其中,风险预测模型收敛的条件可以是:更新的风险预测模型参数满足预设训练要求、风险预测模型输出的预测结果与真实结果(可以是所述训练样本的风险标签和/或预设的测试集的标签)之间的差异小于预设的差异阈值、迭代的次数达到预设次数中的至少一种。
至此,得到训练后的、具有较好的预测能力的风险预测模型,该风险预测模型可以线上部署,以实现风险预测的目的。
需要说明的是,本说明书对风险预测模型实际的部署位置不做具体限制。示例性的,设备与服务之间的交互场景如图4所示,服务器与n个设备通信,图1所示的客户端可以安装在图4中的设备1至设备n任意一个中。
在本说明书一个可选的实施例中,风险预测模型部署在服务器中,模型训练的过程中,由与该服务器通信的各个设备(例如,前述安装有所述客户端的设备)和/或该服务器获取模型训练过程所需的各历史数据。模型训练的过程由该服务器执行。线上预测时,由该服务器采用该风险预测模型得到预测结果。
在本说明书另一个可选的实施例中,风险预测模型部署在服务器中,模型训练的过程中,由与该服务器通信的各个设备(例如,前述安装有所述客户端的设备)和/或该服务器获取模型训练过程所需的各历史数据。模型训练的过程由该服务器执行,得到训练后的风险预测模型之后,服务器将该训练后的风险预测模型的至少部分参数发送至所述设备。线上预测时,由该设备采用该风险预测模型得到预测结果。
此外,在本说明书的再一个可选的实施例中,风险预测模型的训练过程可以由设备执行。
为便于说明,下文以风险预测模型部署在服务器中为例。
由前述内容可知,本说明书中的风险预测模型具备对综合性较强、从不不同维度对身份认证的风险进行表征的数据(例如前述的样本特征)进行处理的能力。为实现风险预测模型的数据处理能力,可以对风险预测模型的构成进行设计。
在本说明书一个可选的实施例中,风险预测模型可以是单个整体模型,例如通过深度神经网络DNN实现。在将样本特征输入该模型后,模型通过各网络层对各方面的特征(身份特征,设备特征,账号特征,行为特征)进行全面综合处理,基于综合处理后的抽象特征,得出预测结果。
在本说明书另一个可选的实施例中,如图5所示,风险预测模型可以包括若干个子模型,各子模型所预测的风险的类型不同。其中,风险类型的划分可以根据实际的场景确定,本说明书结合身份认证过程经历的链路中的多个环节,根据各环节的特征,对身份认证过程中可能面临的风险进行划分,得到若干个风险类型。该若干个风险类型可以包括:设备风险、账号风险、行为风险以及身份风险。子模型可以包括:用于预测设备风险的第一子模型,用于预测账号风险的第二子模型,用于预测行为风险的第三子模型,用于预测身份风险的第四子模型。
以下,针对构成所述风险预测模型的至少部分子模型的训练过程进行分别地说明:
(1)第一子模型。
由前述内容可知,第一子模型可以用于针对设备风险进行预测。其中,设备风险用于表征由身份认证对应的设备引起的风险。所述身份认证过程对应的设备可以包括:身份认证过程所采用的设备(例如,在用户刷指纹时采用的具有指纹采集功能的终端)、对应于该身份认证的业务执行过程所采用的设备(例如,对所述身份认证过程中产生的数据进行转发的基站)中的至少一种。
可以理解的是,应用于实际场景中的设备多种多样,终端的性能、使用情况一定程度的对该设备对应的身份认证过程所面临的风险造成影响。例如,一设备的机型较为陈旧、低端,则该设备的各传感装置(例如摄像头、指纹采集装置)也较为陈旧,由该设备采集到的用于身份识别的数据的可信性也较低,该设备所引起的风险也相对的较大。
此外,在不法分子通过身份认证实施非法行为的场景中,由于非法行为也将消耗一定的资源,不法分子通常不会采用较为先进、高端的设备实施非法行为。
此外,本说明书中的第一子模型不仅仅用于根据设备的机型预测由设备引起的风险,第一子模型还可以用于根据采集到的设备的参数、设备中安装的应用程序,进行风险预测。
具体地,采用第一子模型进行设备风险预测的过程可以是:将所述设备特征输入所述第一子模型,得到所述第一子模型输出的第一子预测结果。所述第一子预测结果示出身份认证执行过程中所采用的设备引起的风险。所述第一子预测结果用于确定所述风险预测模型输出的预测结果。
可见,通过本说明书中的第一子模型,能够从设备的维度较为有效的对风险进行预测。
为能够实现第一子模型从设备的维度对风险进行具有综合性的预测,在本说明书一个可选的实施例中,如图5所示,第一子模型可以包括:风险机型确定模块、伪造参数确定模块、非法客户端确定模块中的至少一种。
其中,所述风险机型确定模块用于确定所述设备的机型为风险机型的概率。所述伪造参数确定模块用于确定所述设备的参数是伪造参数的概率。所述非法客户端确定模块用于确定所述设备中安装有非法客户端的概率。
此时,可以对风险机型确定模块、伪造参数确定模块、非法客户端确定模块中的至少一种输出的结果进行处理,得到第一子模型输出的第一子预测结果。例如,第一子预测结果可以包括若干维度,所述第一子预测结果的各个维度与第一子模型的各个模块的输出结果一一对应。则可以通过对第一子模型的各个模块的输出结果进行拼接的方式,得到第一子预测结果。
则,采用第一子模型得到的第一子预测结果可以示出所述设备的机型为风险机型的概率、所述设备的参数是伪造参数的概率、所述设备中安装有非法客户端的概率中的至少一种。
(2)第二子模型。
第二子模型可以用于针对账号风险进行预测。其中,账号风险用于表征由身份认证过程对应的账号引起的风险。所述身份认证过程对应的账号可以包括:用户对应于输出身份认证的结果的执行主体的账号(例如,用户通过某支付平台进行支付时,该支付平台负责身份认证并输出身份认证的结果,此时,该账号可以是该用户在该支付平台注册的平台账号)、该身份认证所属的业务的执行主体的账号(例如,用户通过某支付平台采用与该支付平台绑定的银行账号进行支付时,将本次支付对应的金额划归至收款方的执行主体是该银行,此时,该账号可以是该用户对应于该银行的银行账号)中的至少一种。
针对平台账号,由于支付平台对平台账号进行管理所采用的机制是综合了多方面因素制定的,各平台账号在使用过程中可能面临的风险难以一概而论。进一步地,平台账号可能面临的风险还受到用户对该平台账号的使用情况的影响。
此外,针对银行账号,由于银行直接对银行账号进行管理,各个银行对银行进行管理的策略不尽相同,同一银行针对不同银行账号的管理策略也不尽相同,使得银行账号在使用过程中所面临的风险也较为复杂。
本说明书采用第二子模型,根据身份认证过程中涉及的账号的情况,对由账号引起的风险进行预测。
具体地,采用第二子模型进行账号风险预测的过程可以是:将所述账号特征输入所述第二子模型,得到所述第二子模型输出的第二子预测结果,所述第二子预测结果示出身份认证执行过程中涉及的账号(例如,前述的平台账号、银行账号等)引起的风险。所述第二子预测结果用于确定所述风险预测模型输出的预测结果。
其中,账号特征可以是账号的属性信息、所述账号的历史使用信息中的至少一种。账号的属性信息可以是账号的号码、注册日期、账号等级、账号权限等。账号的历史使用信息可以是账号在历史中的登录频率、交易频率、累计交易金额等。
可见,通过本说明书中的第二子模型,能够从账号的维度较为有效的对风险进行预测。
为能够实现第二子模型从账号的维度对风险进行具有综合性的预测,在本说明书一个可选的实施例中,如图5所示,第二子模型可以包括:非法账号确定模块、沉睡账号确定模块中的至少一种。
其中,所述非法账号确定模块用于确定所述账号为非法账号的概率。所述沉睡账号确定模块用于确定所述账号是沉睡账号的概率。本说明书中的非法账号的含义可以根据实际的业务需求确定,例如,可以将扫号、小号、接码账号中的至少一种,确定为非法账号。沉睡账号可以是活跃度低于预设的活跃度阈值(可以根据实际的业务需求确定)的账号。
此时,可以对非法账号确定模块、沉睡账号确定模块中的至少一种输出的结果进行处理,得到第二子模型输出的第二子预测结果。例如,第二子预测结果可以包括若干维度,所述第二子预测结果的各个维度与第二子模型的各个模块的输出结果一一对应。则可以通过对第二子模型的各个模块的输出结果进行拼接的方式,得到第二子预测结果。
则,采用第二子模型得到的第二子预测结果可以示出所述账号是非法账号的概率、所述账号是活跃账号的概率中的至少一种。
(3)第三子模型。
第三子模型可以用于针对行为风险进行预测。其中,行为风险用于表征身份认证执行过程中涉及的行为引起的风险。所述身份认证执行过程中涉及的行为可以包括:触发该身份认证的用户的行为、用户触发该身份认证所对应的业务的行为、执行该身份认证所采用客户端的行为、该身份认证对应的业务所采用的客户端的行为中的至少一种。
在实际场景中,某些行为是由用户自行实施的,例如用户为获取更新后的验证码手动点击刷新支付页面的行为,在该例子中用户的“刷新”的行为针对的是身份认证的过程本身。
可见,无论是用户的行为还是客户端的行为,无论是用户授意的行为还是用户无意识的行为,都有可能引起一定程度的风险。本说明书采用第三子模型对由行为引起的风险进行预测。
具体地,采用第三子模型进行行为风险预测的过程可以是:将所述行为特征输入所述第三子模型,得到所述第三子模型输出的第三子预测结果。所述第三子预测结果示出身份认证执行过程中涉及的行为引起的风险。所述第三子预测结果用于确定所述风险预测模型输出的预测结果。
可见,通过本说明书中的第三子模型,能够从行为的维度较为有效的对风险进行预测。
为能够实现第三子模型从行为的维度对风险进行具有综合性的预测,在本说明书一个可选的实施例中,如图5所示,第三子模型可以包括:用户行为确定模块、客户端行为确定模块、意图确定模块中的至少一种。
其中,所述用户行为确定模块用于确定用户的行为是非法行为的概率。所述客户端行为确定模块用于确定客户端的行为是非法行为的概率。意图确定模块用于确定用户的意图是恶意意图的概率。
此时,可以对用户行为确定模块、客户端行为确定模块中的至少一种输出的结果进行处理,得到第三子模型输出的第三子预测结果。例如,第三子预测结果可以包括若干维度,所述第三子预测结果的各个维度与第三子模型的各个模块的输出结果一一对应。则可以通过对第三子模型的各个模块的输出结果进行拼接的方式,得到第三子预测结果。
则,采用第三子模型得到的第三子预测结果可以示出所述用户行为的行为是非法行为的概率、所述客户端的行为是非法行为的概率中的至少一种。
(4)第四子模型。
第四子模型可以用于针对身份风险进行预测。其中,身份风险用于表征由采集到的用户的身份数据引起的风险。所述身份数据包括:采集到的用户的面部数据、声纹数据、指纹数据、指静脉数据、虹膜数据、用户输入的文本数据中的至少一种。
随着仿真技术、数据处理技术(例如图像处理技术)的发展,身份认证以及身份认证对应的业务的安全性受到严峻的挑战。不法分子为实施不法行为,通常会采取一定的措施攻击用于身份认证的模型。
例如,不法分子采用诸如PS(Photo Shop)图像处理软件生成虚假的人脸图像作为面部数据,试图通过人脸识别的身份认证;再例如,不法分子可以采用非法应用程序生成虚假的指纹数据,并将该虚假的指纹数据通过设备中与指纹采集装置对应的数据接口发送至设备的控制系统,再由控制系统将该虚假的指纹数据发送至用于身份认证的应用程序,使得用于身份认证的应用程序有可能基于该虚假的指纹数据做出错误的认证结果。
为能够从身份数据的维度对风险进行预测,本说明书采用第四子模型进行设备风险预测的过程可以是:将所述身份特征输入所述第四子模型,得到所述第四子模型输出的第四子预测结果。所述第四子预测结果示出身份认证执行过程中所采用的身份数据引起的风险。所述第四子预测结果用于确定所述风险预测模型输出的预测结果。
可见,通过本说明书中的第四子模型,能够从身份的维度较为有效的对风险进行预测。
为能够实现第四子模型从设备的维度对风险进行具有综合性的预测,在本说明书一个可选的实施例中,如图5所示,第四子模型可以包括:图像处理痕迹确定模块、水印确定模块、虚假面部数据确定模块、虚假声纹数据确定模型、虚假指纹数据确定模型、虚假指静脉数据确定模型、虚假虹膜数据确定模型、虚假文本数据确定模型、无感活体检测模块中的至少一种。
可以对第四子模型的各个模块中的至少一种输出的结果进行处理,得到第四子模型输出的第四子预测结果。例如,第四子预测结果可以包括若干维度,所述第四子预测结果的各个维度与第四子模型的各个模块的输出结果一一对应。则可以通过对第四子模型的各个模块的输出结果进行拼接的方式,得到第四子预测结果。
则,采用第四子模型得到的第四子预测结果可以示出所述身份数据是非法数据的概率。
需要说明的是,本说明书对模型、子模型输出的结果的形式以及输出的结果的表征方式不做具体限制。例如,在本说明中各子模型、模块输出的结果为“概率”时,该通过“概率”表征的结果可以是定量的结果。此外,在对该输出的“概率”进行处理之后,还可以得到用于定性的结果,例如,一设备的机型为风险机型的概率为95%时,可以直接判定该设备为风险机型,作为针对该设备的定性的结果。
由前述内容可知,在本说明书一个可选的实施例中,风险预测模型为实现从多个维度对风险进行预测,风险预测模型可以包括若干个子模型。由于各子模型输出的子结果表征风险的维度不同,则在设置训练模型所采用的训练样本的风险标签时,可以针对每个维度分别设置对应于该维度的子标签,然后根据各子标签得到该训练样本的风险标签。
在本说明书一个可选地的实施例中,风险标签可以包括多个维度,风险标签的各个维度与风险预测模型的各个子模型一一对应。
由于风险预测模型的每个子模型还可以包括若干个模块,则可以从更加细化的粒度设置训练样本的风险标签。在本说明书一个可选的实施例中,风险标签可以包括多个维度,风险标签的各个维度与风险预测模型的各个模块一一对应。
进一步地,随着技术发展,风险的形式、不法分子对风险预测模型的攻击方式也会随着时间发生变化,则可以针对风险预测模型周期性的实施本说明书中模型训练过程,使得该风险预测模型的风险预测能力能够与时俱进。
通过前述的模型训练步骤,即可得到预测结果更加准确、更加有效的风险预测模型。该风险预测模型可以在线上应用于风险识别过程。现就采用该风险预测模型进行的风险识别过程进行说明。
二、风险识别。
在得到所述风险预测模型的基础上,本说明书提供一种风险识别过程,如图6所示,该过程可以包括以下步骤中的一个或多个。
S600:获取待评估的目标身份认证的目标数据;所述目标数据示出执行该目标身份认证采用的身份特征、该目标身份认证过程中采用的设备特征、账号特征、以及该目标身份认证执行过程中涉及行为的行为特征。
在本说明书中的风险识别过程可以由服务器执行,则本步骤中,服务器可以从设备(例如终端设备)处获取目标数据。
由于实际场景中与服务器交互的设备的数量可能不唯一,同一设备发送的用于指示服务器对目标身份认证进行处理的处理请求也可能不唯一,则可以针对每一个目标身份认证分别实施本说明书中的风险识别过程。
S602:将所述目标数据输入预先训练的风险预测模型,得到该目标身份认证的预测结果。
在本说明书一个可选的实施例中,如图7所示,可以将目标数据直接输入风险识别模型,使得风险识别模型根据目标数据输出预测结果。
在本说明书另一个可选的实施例中,可以针对目标数据进行特征构建,得到基于该目标数据的设备特征、账号特征、身份特征以及行为特征。然后,将得到的各特征输入风险识别模型。
S604:根据所述预测结果,确定该目标身份认证的风险评分。
由前述内容可知,在本说明书一个可选的实施例中,风险预测模型可以包括若干个子模型,每个子模型也可以包括若干个模块,则根据各个子模型/模块的输出结果得到的预测结果可以从不同的维度对该身份认证的风险进行表征。
而根据预测结果得到的风险评分可以是对预测结果的各个维度的整合/综合。风险评分的具体形式、表征方式可以根据实际的场景确定。例如,风险评分可以为分别针对设备风险的维度、账号风险的维度、行为风险的维度以及身份风险的维度的分值/向量。
在一个可选的实施例中,由于后续步骤根据风险评分确定风险识别结果所需的数据的形式与预测结果的数据形式相同,则可以直接将风险预测模型输出的预测结果作为风险评分。
在另一个可选的实施例中,风险评分是在预测结果的基础之上,结合其他因素(例如前述的目标数据)得到的。在该实施例中,如图7所示,为获得契合实际的风险评分,可以采用决策引擎对预测结果以及对风险识别结果造成影响的其他因素进行综合性的处理,以得到风险评分。其中,决策引擎可以部署于所述服务器中。
S606:根据所述风险评分,得到该目标身份认证的风险识别结果。
风险识别结果的划分方式可以根据实际的业务需求确定,例如,可以预先的确定风险识别结果包括:高风险身份认证、低风险身份认证。则可以根据风险评分确定出该目标身份认证是高风险身份认证还是低风险身份认证。
根据风险评分确定风险识别结果的方式可以根据实际的业务需求确定。例如,在某些实施例中,可以根据风险评分直接确定出目标身份认证是高风险身份认证还是低风险身份认证。而在其他的实施例中,还可以综合风险评分以及其他因素,得到风险识别结果。
在一个可选的实施例中,风险识别结果也是由所述决策引擎得出的,下文将以该实施示出的情形示例性的加以说明。但并不排除在本说明书其他的可选实施例中,风险识别结果是除所述决策引擎以外的其他部件得到的情形。
由前述内容可知,风险评分对风险识别结果起到至关重要的作用,现就如下几种确定风险评分的方式进行说明。
(1)根据历史身份认证的执行结果确定风险评分。
由于目标身份认证实际将引起的实际风险的预测难度较大,即使提高预测的准确性、预测的精度,预测的结果也难免与实际风险之间存在一定的偏差。但是,实际风险只有在该身份认证完成之后,或者该身份认证对应的业务执行完成之后,甚至完成该身份认证之后相当长的一段时间才能够获知。
由此,可以在得到的针对风险的预测结果的基础之上,结合历史身份认证的执行结果,确定该预测结果对应的目标身份认证的风险评分,以在后续步骤中,根据综合性、合理性相较于预测结果更强的风险评分,得出针对该目标身份认证的风险识别结果。
具体地,根据历史身份认证的执行结果确定风险评分的过程可以是:在各历史身份认证中,根据该目标身份认证的目标数据、该目标身份认证的预测结果中的至少一种,确定出与该目标身份认证的相似度大于第一阈值(预设值)的各历史身份认证。根据确定出的各历史身份认证在历史上的执行结果,确定该目标身份认证的风险评分。
由于历史身份认证在历史中的执行结果已知,则可以以历史身份认证作为参照,确定该目标身份认证的风险评分。若一历史身份认证与该目标身份认证的相似度大于第一阈值,表明该历史身份认证对该目标身份认证的参考价值较大。
风险评分表征出的风险程度与该历史身份认证的执行结果的实际风险正相关。例如,对与该目标身份认证的相似度大于第一阈值的各历史身份认证的执行结果取平均,若该平均结果表明该历史身份认证在历史中执行时所带来的风险较高,则确定出的该目标身份认证的风险评分所表征出的该目标身份认证的风险也较高。
在本说明书一个可选的实施例中,用于确定风险评分的决策引擎包括:第一模型。可以将目标身份认证的目标数据、该目标身份认证的预测结果中的至少一种,以及各历史身份认证的目标数据、各历史身份认证的预测结果中的至少一种,输入所述第一模型,得到所述第一模型输出的与该目标身份认证的相似度大于第一阈值的各历史身份认证的执行结果,如图8所示。
其中,相似度的确定方式可以根据实际的需求得到,在本说明书一个可选的实施例中,目标数据、预测结果均可以以向量的形式表征,此时,与历史身份认证的相似度可以是:该目标身份认证的目标数据与历史身份认证的目标数据之间的余弦相似度、该目标身份认证的预测结果与历史身份认证的实际风险之间的余弦相似度中的至少一种。
此外,在本说明书其他可选的实施例中,还可以采用欧氏距离确定目标身份认证与历史身份认证之间的相似度。
(2)根据预测结果的各个维度之间的匹配度,确定该目标身份认证的风险评分。
在本说明书一个可选的实施例中,可以针对该目标身份认证,将该目标身份认证的预测结果中的表征设备风险的数据和表征身份风险的数据进行处理,得到第一匹配度。然后,根据第一匹配度,确定该目标身份认证的风险评分。所述第一匹配度与该目标身份认证的风险评分表征的风险负相关。
例如,若一设备风险的数据表明该设备较为陈旧,该身份风险的数据表明用于本次目标身份认证的面部图像的质量较高,而陈旧的设备是难以采集到高质量的面部图像数据的,可见该设备风险的数据与该身份风险的数据不匹配,则得到的该目标身份认证的风险评分表明该目标身份认证的风险较高。
在本说明书一个可选的实施例中,可以针对该目标身份认证,将该目标身份认证的预测结果中的表征设备风险的数据与表征行为风险的数据进行处理,得到第二匹配度。然后,根据第二匹配度,确定该目标身份认证的风险评分。所述第二匹配度与该目标身份认证的风险评分表征的风险负相关。
在本说明书一个可选的实施例中,如图8所示,用于确定风险评分的决策引擎可以包括:用于生成第一匹配度和/或第二匹配度的第二模型。可以将所述预测结果输入所述第二模型,得到所述第二模型输出的第一匹配度和/或第二匹配度。
本说明书对确定匹配度的方式不做具体限制,现有的确定匹配度的算法在不违背本说明书的技术主旨的条件下,均可以应用于本说明书中的确定匹配度的过程。
(3)根据触发所述目标身份认证的设备返回的校验数据,确定该目标身份认证的风险评分。
由前述内容可知,通过本说明书中的风险预测模型得到的预测结果对身份认证的风险具备较为综合的表征能力,则可以在得到预测结果之后,根据该预测结果对该身份认证的风险进行初步的判断。此后,再根据该初步判断结果进行更进一步的判断。
在本说明书一个可选的实施例中,可以判断所述预测结果是否满足预设的高风险第一判断条件,若判断结果为是,则生成校验指令,发送至触发所述目标身份认证的设备,并根据所述设备返回的校验数据确定该目标身份认证的风险评分。若判断结果为否,则直接根据该判断结果生成该目标身份认证的风险评分,且此时生成的该目标身份认证的风险评分表明该目标身份认证的风险较低。
示例性的,在预测结果包括设备、账号、身份、行为四个维度时,高风险第一判断条件可以包括若干个子条件,子条件与预测结果的维度一一对应。若预测结果的任一维度满足高风险第一判断条件在该维度的子条件,表明该目标身份认证至少在该维度的风险较高,该目标身份认证是高风险身份认证的可能性较大。则可以根据所述设备返回的校验数据,对该可能性进行验证。
例如,校验指令可以是指令所述设备重新生成目标数据的指令,则返回的校验数据可以是重新生成的目标数据。
若所述设备返回的校验数据符合预设的安全性判断条件,则根据该校验数据得到的风险评分表明该目标身份认证的风险较低;若所述设备返回的校验数据不符合预设的安全性判断条件,则根据该校验数据得到的风险评分表明该目标身份认证的风险较高。
由前述内容可知,高风险第一判断条件至少能够用于对已知类型的风险进行判断,其中已知类型的风险包括:设备风险、账号风险、身份风险、行为风险。然而,实际的身份认证过程、执行身份认证对应的业务的过程还可能面临诸多不可知类型的风险。特别是在科技飞速发展的当今社会,新的攻击方式、新的非法业务层出不穷,若对该新的、未知的风险无法采取有效的应对措施,将有可能带来较为严重的后果。
由此,本说明书还提供了一种针对新的、未知的风险进行识别的过程。具体地,该过程可以是在所述预测结果不满足预设的高风险第一判断条件下,根据该目标身份认证的目标数据、该目标身份认证的预测结果中的至少一种,确定该目标身份认证与所述高风险第一判断条件中限定的高风险身份认证的相似度是否大于第二阈值(预设值)。
若判断结果为是,表明虽然该目标身份认证不是已知类型的风险,但该目标身份认证与已知类型的风险也较为相似,该目标身份认证的风险较大,很有可能对应于未知类型的风险。则可以在各历史身份认证中,确定出与该目标身份认证的相似度大于预设的第三阈值的历史身份认证的数量。
若该数量大于预设的数量阈值,表明历史中经常发生与该目标身份认证相似的身份认证,存在未知的团伙攻击的可能性较大,此时确定出的该目标身份认证的风险评分表明该目标身份认证的风险较高,该目标身份认证是高风险身份认证的可能性较大。
若该数量不大于预设的数量阈值,表明该目标身份认证是偶发现象,不具备未知的风险的可能性较大,此时确定出的该目标身份认证的风险评分表明该目标身份认证的风险较低,该目标身份认证是高风险身份认证的可能性较低。
可见,本说明书中的过程能够通过校验指令以及基于该校验指令返回的校验数据,通过端上动态攻防探测的方式确定目标身份认证的风险评分。
在本说明书一个可选的实施例中,如图8所示,基于高风险第一判断条件进行的判断由所述决策引擎的第三模型执行。则可以将目标身份认证的目标数据、该目标身份认证的预测结果中的至少一种输入第三模型,得到第三模型输出的基于高风险第一判断条件的判断结果。
(4)根据专家经验,确定该目标身份认证的风险评分。
在本说明书一个可选的实施例中,预测结果包含若干个维度,该预测结果无论在数据结构方面还是在表征的信息方面,均具有一定的复杂性。则可以结合预设的专家经验数据库,确定该预测结果对应的风险评分。
本说明书中的专家经验数据库可以包括若干个专家经验数据对。专家经验数据对包括作为“键”的基准结果和作为“值”的评分方式。则可以根据预测结果在专家经验数据库中查找与该预测结果匹配的基准结果,以确定出与该匹配的基准结果对应的评分方式。之后,根据该预测结果,采用确定出的评分方式,得到该预测结果的风险评分。
评分方式可以是基于历史上的身份认证得到的。例如,评分方式可以是算法,则将预测结果输入该算法中,即可得到风险评分。再例如,评分方式可以是人工评分,则在确定出评分方式是人工评分之后,可以转接至人工评分系统,以根据人工评分系统的输出得到风险评分。
在本说明书一个可选的实施例中,如图8所示,基于专家经验确定评分方式的过程可以由所述决策引擎的第四模型执行。则可以将预测结果输入第四模型,得到第四模型输出的评分方式。
本说明书对上述的风险评分确定方式的使用形式不做限制。可以针对以下风险评分确定方式择其一确定风险评分;也可以将几种风险评分确定方式进行综合,以确定风险评分。例如,在如图8所示的实施例中,决策引擎包括第一模型至第四模型,此时仅采用第一模型的输出确定风险评分。
此外,本说明书中的过程确定风险评分的方式不局限于前述的四种。在本说明书一个可选的实施例中,可以通过基于可信图的方式确定风险评分。所述可信图包括:表征交互媒介和/或执行主体的节点、以及表征交互媒介之间的关系的边,则可以通过可信图中表征的节点之间的关系进行人机关联构建,以确定目标身份认证的风险评分。
至此,得到了该目标身份认证的风险评分,该风险评分可以在后续步骤中,用于确定该目标身份认证的风险识别结果。
具体地,如图9a所示,在本说明书一个可选的实施例中,根据风险评分确定该目标身份认证的风险识别结果的过程可以是:判断该目标身份认证的风险评分是否满足预设的高风险第二判断条件;若是,表明该目标身份认证的风险较高,确定该目标身份认证是高风险身份认证;若否,表明该目标身份认证的风险较低,确定该目标身份认证是低风险身份认证。
其中,高风险第二判断条件可以根据预设的业务目标确定。例如,第二判断条件可以是针对风险评分的各个维度的阈值的集合。
然而,在实际场景中,还可能存在不满足高风险第二判断条件的目标身份认识实际上是高风险身份认证的情况,为避免发生针对高风险身份认证的漏判,在本说明书一个可选的实施例中,如图9b所示,在确定出该目标身份认证的风险评分不满足预设的高风险第二判断条件时,确定历史上的预设时间段内触发的各高风险身份认证,作为基准认证。针对每个基准认证,根据该目标身份认证的目标数据,确定该目标身份认证与该基准认证之间的相似度。其中,预设时间段可以根据实际的需求确定,例如,预设时间段可以是过去的一个月或过去的一年。
若该目标身份认证与该基准认证之间的相似度得到的结果为:该目标身份认证与任一基准认证的相似度均不大于预设的第四阈值,表明该目标身份认证与历史中的高风险身份认证均差异较大,从该目标身份认证的原始数据的角度也无法确定该目标身份认证是高风险身份认证,则可以确定该目标身份认证是低风险身份认证。
由于目标数据未经过处理或经处理的程度较低,该目标数据中保留了该目标身份认证最原始的信息,在确定出目标身份认证不满足预设的高风险第二判断条件的情况下,基于该目标身份认证的目标数据对该目标身份认证进行再次的风险识别,有利于避免发生漏判的现象。
三、执行策略的制定。
本说明书对执行策略的具体形式不做限制,执行策略以及执行策略的具体执行方式可以根据实际的场景确定。需要说明的是,若按照安全性的高低对各执行策略进行划分,则本说明书的执行策略至少包括:安全性较高的第一执行策略和安全性较低的第二执行策略。
若该目标身份认证是高风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第一执行策略;若该目标身份认证是低风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第二执行策略;所述第一执行策略的安全性高于所述第二执行策略。
在某些情况下,执行安全性较高的执行策略有可能会消耗较多的资源(例如,网络资源、设备的数据处理资源、服务器的数据处理资源、时间资源等),针对风险较低的身份认证采取资源消耗较少的第二执行策略,有利于减小资源的消耗,并使得该低风险身份认证能够快速的得到放行,以减少对用户的打扰,改善用户体验。
本说明书针对身份认证的执行策略制定可以由前述的决策引擎执行。
综上,本说明书中的风险识别过程、执行策略制定过程主要由风险预测模型和决策引擎执行。在本说明书一个可选的实施例中,风险预测模型和决策引擎可以均部署于服务器中,以实现服务器对风险识别过程和执行策略制定过程的统一管理。
例如,在用户通过设备进行刷脸支付的场景中,设备采集该用户的面部数据,并根据该面部数据以及其他数据(例如,设备数据、账号数据和行为数据)确定目标数据,并将目标数据发送至服务器。服务器根据该目标数据,采用部署于服务器中的风险预测模型和决策引擎进行风险识别和执行策略制定。
若针对该面部数据对应的身份认证制定的执行策略是第一执行策略(此时,该身份认证的风险较高),则服务器根据该第一执行策略向所述设备发送第一指令。所述设备根据该第一指令提示用户刷脸不足以完成本次支付,并指示用户输入对应于该支付平台的支付密码。
若针对该面部数据对应的身份认证制定的执行策略是第二执行策略(此时,该身份认证的风险较低),则服务器根据该第二执行策略直接对该刷脸支付放行,并向所述设备发送第二指令。所述设备根据该第二指令提示用户本次支付已经完成。
在本说明书另一个可选的实施例中,风险预测模型可以部署在所述设备中,决策引擎可以部署于服务器中,使得设备至少在风险识别的过程中分担一定的数据处理压力,减少服务器的资源消耗,提高风险识别过程和执行策略制定过程整体的效率。
例如,在用户通过设备进行刷脸支付的场景中,设备采集该用户的面部数据,并根据该面部数据以及其他数据(例如,设备数据、账号数据和行为数据)确定目标数据。然后设备采用风险预测模型根据该目标数据生成预测结果,将预测结果发送至服务器。服务器采用决策引擎根据该预测结果生成针对该刷脸支付的执行策略。
由前述内容可知,在本说明书一个可选的实施例中,采用风险预测模型进行风险预测是风险识别过程必不可少的环节,但风险预测模型得到的预测结果未必是风险识别过程输出的最终结果。即,在该可选的实施例中,需进一步得到风险识别过程的最终结果——风险评分。则在该可选的实施例中,前述的“模型训练”过程可以根据风险评分确定风险标签。该风险评分可以是采用所述决策引擎得到的。
根据风险评分确定风险标签,并根据该风险标签训练模型的过程具体可以是:确定该历史身份认证的风险评分(该风险评分可以通过人工标注的方式得到),作为该训练样本的风险标签。将该历史身份认证对应的训练样本的样本特征输入所述风险预测模型,得到所述风险预测模型输出的预测结果。根据所述预测结果得到待定评分(例如,可以将所述预测结果输入所述决策引擎,得到所述决策引擎输出的待定评分)。以所述待定评分和所述风险评分之间的差异最小化为训练目标,训练风险预测模型。
此外,在本说明书另一个可选的实施例中,在风险识别的步骤之后还需针对该身份认证制定相应的执行策略。则在该可选的实施例中,前述的“模型训练”过程可以根据执行策略确定风险标签。该执行策略可以是采用所述决策引擎得到的。
根据执行策略确定风险标签,并根据该风险标签训练模型的过程具体可以是:确定该历史身份认证的执行策略(该执行策略可以通过人工标注的方式得到),作为该训练样本的风险标签。将该历史身份认证对应的训练样本的样本特征输入所述风险预测模型,得到所述风险预测模型输出的预测结果。根据所述预测结果得到待定评分(例如,可以将所述预测结果输入所述决策引擎,得到所述决策引擎输出的待定评分)。根据所述待定评分得到待定策略(例如,可以将所述待定评分输入所述决策引擎,得到所述决策引擎输出的待定策略)。以所述待定策略和所述风险标签之间的差异最小化为训练目标,训练风险预测模型。
进一步地,如前所述,本说明中采用的决策引擎也可以包括若干个模型。则本说明书在训练模型的过程中还可以针对风险预测模型和决策引擎进行共同的训练。
具体地,在本说明书一个可选的实施例中,针对风险预测模型和决策引擎进行共同的训练的过程可以是:将样本特征输入所述风险预测模型,得到所述风险预测模型输出的预测结果。将所述预测结果输入所述决策引擎,得到所述决策引擎输出的待定评分。以所述待定评分与所述风险标签之间的差异最小化为训练目标,调整所述风险预测模型与所述决策引擎的至少部分参数,得到训练后的风险预测模型和训练后的决策引擎。
在本说明书另一个可选的实施例中,针对风险预测模型和决策引擎进行共同的训练的过程可以是:将样本特征输入所述风险预测模型,得到所述风险预测模型输出的预测结果。将所述预测结果输入所述决策引擎,得到所述决策引擎输出的待定决策。以所述待定策略和所述风险标签之间的差异最小化为训练目标,调整所述风险预测模型与所述决策引擎的至少部分参数,得到训练后的风险预测模型和训练后的决策引擎。
基于同样的思路,本说明书实施例还提供了对应于图2所示过程的风险预测模型的训练装置,该风险预测模型的训练装置如图10所示。
图10为本说明书实施例提供的风险预测模型的训练装置的结构示意图,该风险预测模型的训练装置可以包括以下单元和/或模块中的一个或多个:
历史数据获取单元100,配置为获取历史身份认证对应的历史数据;
训练样本确定单元102,配置为根据该历史数据,确定训练样本的样本特征,并确定该训练样本的风险标签;其中,所述样本特征包括:执行该历史身份认证采用的身份特征、该历史身份认证执行过程中所采用设备的设备特征、所使用账号的账号特征、以及该历史身份认证执行过程中涉及行为的行为特征;
训练单元104,配置为将所述样本特征输入风险预测模型,得到预测结果;根据所述预测结果和所述风险标签,训练所述风险预测模型。
在一个可选地实施例中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;所述训练单元104包括:子预测结果确定模块1040和训练模块1042;
所述子预测结果确定模块1040配置为:将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果;
所述训练模块1042配置为:根据各子预测结果与该训练样本的风险标签,训练所述风险预测模型。
在一个可选地实施例中,所述设备特征包括以下中的至少一种:执行该历史身份认证所采用的设备的型号、所述设备的参数、所述设备中安装的各客户端信息;所述多个子模型包括:用于预测设备风险的第一子模型;
所述子预测结果确定模块1040配置为:将所述设备特征输入所述第一子模型,得到所述第一子模型输出的第一子预测结果,所述第一子预测结果示出所述设备的机型为风险机型的概率、所述设备的参数是伪造参数的概率、所述设备中安装有非法客户端的概率中的至少一种。
在一个可选地实施例中,所述账号特征包括以下中的至少一种:所述账号的属性信息、所述账号的历史使用信息;所述多个子模型包括:用于预测账号风险的第二子模型;
所述子预测结果确定模块1040配置为:将所述账号特征输入所述第二子模型,得到所述第二子模型输出的第二子预测结果,所述第二子预测结果示出所述账号是非法账号的概率、所述账号是沉睡账号的概率中的至少一种。
在一个可选地实施例中,所述行为特征包括以下中的至少一种:触发所述历史身份认证的用户的行为信息、执行所述历史身份认证的客户端的行为信息;所述多个子模型包括:用于预测行为风险的第三子模型;
所述子预测结果确定模块1040配置为:将所述行为特征输入所述第三子模型,得到所述第三子模型输出的第三子预测结果,所述第三子预测结果示出所述用户的行为是非法行为的概率、所述客户端的行为是非法行为的概率中的至少一种。
在一个可选地实施例中,所述身份特征包括以下中的至少一种:执行该历史身份认证时采集的面部数据、声纹数据、指纹数据、指静脉数据、虹膜数据、文本数据;所述多个子模型包括:用于预测身份风险的第四子模型;
所述子预测结果确定模块1040配置为:将所述身份特征输入所述第四子模型,得到所述第四子模型输出的第四子预测结果,所述第四子预测结果示出所述身份特征包含的数据是非法数据的概率。
在一个可选地实施例中,训练样本确定单元配置为:确定该训练样本针对所述多个风险类型的多个子标签;根据各子标签,确定该训练样本的风险标签;
训练单元104配置为:针对每个子模型,以该子模型输出的子预测结果与该子预测结果对应的子标签的差异最小化为训练目标,训练该子模型。
在一个实施例中,训练样本确定单元102配置为:根据执行该历史身份认证时采取的历史策略,确定该训练样本的风险标签;
训练单元104配置为:根据所述预测结果,得到该历史身份认证的执行策略;以所述执行策略与所述风险标签的差异最小化为训练目标,训练所述风险预测模型
基于同样的思路,本说明书实施例还提供了对应于图6所示过程的风险识别装置,该风险识别装置如图11所示。
图11为本说明书实施例提供的风险识别装置的结构示意图,该风险识别装置可以包括以下单元和/或模块中的一个或多个:
目标数据获取单元110,配置为获取待评估的目标身份认证的目标数据;所述目标数据示出执行该目标身份认证采用的身份特征、该目标身份认证过程中采用的设备特征、账号特征、以及该目标身份认证执行过程中涉及行为的行为特征;
预测结果确定单元112,配置为将所述目标数据输入预先训练的风险预测模型,得到该目标身份认证的预测结果;
风险评分确定单元114,配置为根据所述预测结果,确定该目标身份认证的风险评分;
风险识别结果确定单元116,配置为根据所述风险评分,得到该目标身份认证的风险识别结果。
在一个可选地实施例中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;
预测结果确定单元112配置为:将所述目标特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果。
在一个可选地实施例中,风险评分确定单元114包括:历史身份认证确定模块1140和风险评分确定模块1144;
所述历史身份认证确定模块1140,配置为在各历史身份认证中,确定出与该目标身份认证的相似度大于第一阈值的各历史身份认证;
所述风险评分确定模块1144,配置为根据确定出的各历史身份认证在历史上的执行结果,确定该目标身份认证的风险评分。
在一个可选地实施例中,风险评分确定单元114包括:判断模块1142和风险评分确定模块1144;
所述判断模块1142,配置为判断所述预测结果是否满足预设的高风险第一判断条件;
风险评分确定模块1144,配置为在所述预测结果满足预设的高风险第一判断条件时,则生成校验指令,发送至触发所述目标身份认证的设备;根据所述设备返回的校验数据,确定该目标身份认证的风险评分。
在一个可选地实施例中,所述风险评分确定模块1144还配置为:在所述预测结果不满足预设的高风险第一判断条件时,确定该目标身份认证与所述高风险第一判断条件中限定的高风险身份认证的相似度是否大于第二阈值;若是,则根据所述预测结果,在各历史身份认证中,确定出与该目标身份认证的相似度大于预设的第三阈值的历史身份认证的数量;根据所述数量,确定该目标身份认证的风险评分。
在一个可选地实施例中,所述风险识别结果包括:高风险身份认证、低风险身份认证之一;
所述风险识别结果确定单元116配置为:判断该目标身份认证的风险评分是否满足预设的高风险第二判断条件;若是,确定该目标身份认证是高风险身份认证;若否,则确定历史上的预设时间段内触发的各高风险身份认证,作为基准认证;在该目标身份认证与任一基准认证的相似度均不大于预设的第四阈值的条件下,确定该目标身份认证是低风险身份认证。
在一个可选地实施例中,所述装置还包括:
策略确定单元118,配置为若该目标身份认证是高风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第一策略;若该目标身份认证是低风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第二策略;所述第一策略的安全性高于所述第二策略。
本说明书实施例还提供了第一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图2提供的风险预测模型的训练过程,和/或计算机程序可用于执行上述图6提供的风险识别过程。
本说明书实施例还提供了第二种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图6提供的订单分配的过程。
本说明书实施例还提出了图12所示的电子设备的示意结构图。如图12,在硬件层面,该电子设备可以包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述任一个风险预测模型的训练过程和/或风险识别过程。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件异或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。其中,软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (32)

1.一种风险预测模型的训练方法,包括:
获取历史身份认证对应的历史数据;
根据该历史数据,确定训练样本的样本特征,并确定该训练样本的风险标签;其中,所述样本特征包括:执行该历史身份认证采用的身份特征、该历史身份认证执行过程中所采用设备的设备特征、所使用账号的账号特征、以及该历史身份认证执行过程中涉及行为的行为特征;
将所述样本特征输入风险预测模型,得到预测结果;根据所述预测结果和所述风险标签,训练所述风险预测模型。
2.根据权利要求1所述的方法,其中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;
将所述样本特征输入风险预测模型,得到预测结果,包括:
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果;
根据所述预测结果和所述风险标签,训练所述风险预测模型,包括:
根据各子预测结果与该训练样本的风险标签,训练所述风险预测模型。
3.根据权利要求2所述的方法,其中,所述设备特征包括以下中的至少一种:执行该历史身份认证所采用的设备的型号、所述设备的参数、所述设备中安装的各客户端信息;所述多个子模型包括:用于预测设备风险的第一子模型;
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果,包括:
将所述设备特征输入所述第一子模型,得到所述第一子模型输出的第一子预测结果,所述第一子预测结果示出所述设备的机型为风险机型的概率、所述设备的参数是伪造参数的概率、所述设备中安装有非法客户端的概率中的至少一种。
4.根据权利要求2所述的方法,其中,所述账号特征包括以下中的至少一种:所述账号的属性信息、所述账号的历史使用信息;所述多个子模型包括:用于预测账号风险的第二子模型;
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果,包括:
将所述账号特征输入所述第二子模型,得到所述第二子模型输出的第二子预测结果,所述第二子预测结果示出所述账号是非法账号的概率、所述账号是沉睡账号的概率中的至少一种。
5.根据权利要求2所述的方法,其中,所述行为特征包括以下中的至少一种:触发所述历史身份认证的用户的行为信息、执行所述历史身份认证的客户端的行为信息;所述多个子模型包括:用于预测行为风险的第三子模型;
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果,包括:
将所述行为特征输入所述第三子模型,得到所述第三子模型输出的第三子预测结果,所述第三子预测结果示出所述用户的行为是非法行为的概率、所述客户端的行为是非法行为的概率中的至少一种。
6.根据权利要求2所述的方法,其中,所述身份特征包括以下中的至少一种:执行该历史身份认证时采集的面部数据、声纹数据、指纹数据、指静脉数据、虹膜数据、文本数据;所述多个子模型包括:用于预测身份风险的第四子模型;
将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果,包括:
将所述身份特征输入所述第四子模型,得到所述第四子模型输出的第四子预测结果,所述第四子预测结果示出所述身份特征包含的数据是非法数据的概率。
7.根据权利要求2至6任一所述的方法,其中,确定该训练样本的风险标签,包括:
确定该训练样本针对所述多个风险类型的多个子标签;
根据各子标签,确定该训练样本的风险标签;
根据所述预测结果和所述风险标签,训练所述风险预测模型,包括:
针对每个子模型,以该子模型输出的子预测结果与该子预测结果对应的子标签的差异最小化为训练目标,训练该子模型。
8.根据权利要求1至6任一所述的方法,其中,确定该训练样本的风险标签,包括:
根据执行该历史身份认证时采取的历史策略,确定该训练样本的风险标签;
根据所述预测结果和所述风险标签,训练所述风险预测模型,包括:
根据所述预测结果,得到该历史身份认证的执行策略;
以所述执行策略与所述风险标签的差异最小化为训练目标,训练所述风险预测模型。
9.一种风险识别方法,包括:
获取待评估的目标身份认证的目标数据;所述目标数据包括,执行该目标身份认证采用的身份特征、该目标身份认证过程中采用的设备特征、账号特征、以及该目标身份认证执行过程中涉及行为的行为特征;
将所述目标数据输入预先训练的风险预测模型,得到该目标身份认证的预测结果;
根据所述预测结果,确定该目标身份认证的风险评分;
根据所述风险评分,得到该目标身份认证的风险识别结果。
10.根据权利要求9所述的方法,其中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;
将所述目标数据输入预先训练的风险预测模型,得到该目标身份认证的预测结果,包括:
将所述目标数据分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果。
11.根据权利要求9所述的方法,其中,根据所述预测结果,确定该目标身份认证的风险评分,包括:
根据所述预测结果,在各历史身份认证中,确定出与该目标身份认证的相似度大于第一阈值的各历史身份认证;
根据确定出的各历史身份认证在历史上的执行结果,确定该目标身份认证的风险评分。
12.根据权利要求9所述的方法,其中,确定该目标身份认证的风险评分,包括:
判断所述预测结果是否满足预设的高风险第一判断条件;
若是,则生成校验指令,发送至触发所述目标身份认证的设备;
根据所述设备返回的校验数据,确定该目标身份认证的风险评分。
13.根据权利要求12所述的方法,其中,所述方法还包括:
若所述预测结果不满足预设的高风险第一判断条件,则确定该目标身份认证与所述高风险第一判断条件中限定的高风险身份认证的相似度是否大于第二阈值;
若是,则根据所述预测结果,在各历史身份认证中,确定出与该目标身份认证的相似度大于预设的第三阈值的历史身份认证的数量;
根据所述数量,确定该目标身份认证的风险评分。
14.根据权利要求9至13任一所述的方法,其中,所述风险识别结果包括:高风险身份认证、低风险身份认证之一;
根据所述风险评分,得到该目标身份认证的风险识别结果,包括:
判断该目标身份认证的风险评分是否满足预设的高风险第二判断条件;
若是,确定该目标身份认证是高风险身份认证;
若否,则确定历史上的预设时间段内触发的各高风险身份认证,作为基准认证;在该目标身份认证与任一基准认证的相似度均不大于预设的第四阈值的条件下,确定该目标身份认证是低风险身份认证。
15.根据权利要求9至13任一所述的方法,其中,得到该目标身份认证的风险识别结果之后,所述方法还包括:
若该目标身份认证是高风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第一策略;
若该目标身份认证是低风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第二策略;所述第一策略的安全性高于所述第二策略。
16.一种风险预测模型的训练装置,所述装置包括:
历史数据获取单元,配置为获取历史身份认证对应的历史数据;
训练样本确定单元,配置为根据该历史数据,确定训练样本的样本特征,并确定该训练样本的风险标签;其中,所述样本特征包括:执行该历史身份认证采用的身份特征、该历史身份认证执行过程中所采用设备的设备特征、所使用账号的账号特征、以及该历史身份认证执行过程中涉及行为的行为特征;
训练单元,配置为将所述样本特征输入风险预测模型,得到预测结果;根据所述预测结果和所述风险标签,训练所述风险预测模型。
17.根据权利要求16所述的装置,其中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;所述训练单元包括:子预测结果确定模块和训练模块;
所述子预测结果确定模块配置为:将所述样本特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果;
所述训练模块配置为:根据各子预测结果与该训练样本的风险标签,训练所述风险预测模型。
18.根据权利要求17所述的装置,其中,所述设备特征包括以下中的至少一种:执行该历史身份认证所采用的设备的型号、所述设备的参数、所述设备中安装的各客户端信息;所述多个子模型包括:用于预测设备风险的第一子模型;
所述子预测结果确定模块配置为:将所述设备特征输入所述第一子模型,得到所述第一子模型输出的第一子预测结果,所述第一子预测结果示出所述设备的机型为风险机型的概率、所述设备的参数是伪造参数的概率、所述设备中安装有非法客户端的概率中的至少一种。
19.根据权利要求17所述的装置,其中,所述账号特征包括以下中的至少一种:所述账号的属性信息、所述账号的历史使用信息;所述多个子模型包括:用于预测账号风险的第二子模型;
所述子预测结果确定模块配置为:将所述账号特征输入所述第二子模型,得到所述第二子模型输出的第二子预测结果,所述第二子预测结果示出所述账号是非法账号的概率、所述账号是沉睡账号的概率中的至少一种。
20.根据权利要求17所述的装置,其中,所述行为特征包括以下中的至少一种:触发所述历史身份认证的用户的行为信息、执行所述历史身份认证的客户端的行为信息;所述多个子模型包括:用于预测行为风险的第三子模型;
所述子预测结果确定模块配置为:将所述行为特征输入所述第三子模型,得到所述第三子模型输出的第三子预测结果,所述第三子预测结果示出所述用户的行为是非法行为的概率、所述客户端的行为是非法行为的概率中的至少一种。
21.根据权利要求17所述的装置,其中,所述身份特征包括以下中的至少一种:执行该历史身份认证时采集的面部数据、声纹数据、指纹数据、指静脉数据、虹膜数据、文本数据;所述多个子模型包括:用于预测身份风险的第四子模型;
所述子预测结果确定模块配置为:将所述身份特征输入所述第四子模型,得到所述第四子模型输出的第四子预测结果,所述第四子预测结果示出所述身份特征包含的数据是非法数据的概率。
22.根据权利要求17至21所述的装置,其中,训练样本确定单元配置为:确定该训练样本针对所述多个风险类型的多个子标签;根据各子标签,确定该训练样本的风险标签;
训练单元配置为:针对每个子模型,以该子模型输出的子预测结果与该子预测结果对应的子标签的差异最小化为训练目标,训练该子模型。
23.根据权利要求16至21所述的装置,其中,训练样本确定单元配置为:根据执行该历史身份认证时采取的历史策略,确定该训练样本的风险标签;
训练单元配置为:根据所述预测结果,得到该历史身份认证的执行策略;以所述执行策略与所述风险标签的差异最小化为训练目标,训练所述风险预测模型。
24.一种风险识别装置,所述装置包括:
目标数据获取单元,配置为获取待评估的目标身份认证的目标数据;所述目标数据包括,执行该目标身份认证采用的身份特征、该目标身份认证过程中采用的设备特征、账号特征、以及该目标身份认证执行过程中涉及行为的行为特征;
预测结果确定单元,配置为将所述目标数据输入预先训练的风险预测模型,得到该目标身份认证的预测结果;
风险评分确定单元,配置为根据所述预测结果,确定该目标身份认证的风险评分;
风险识别结果确定单元,配置为根据所述风险评分,得到该目标身份认证的风险识别结果。
25.根据权利要求24所述的装置,其中,所述风险预测模型包括,分别针对多个风险类型进行风险预测的多个子模型;所述多个风险类型包括:设备风险、账号风险、行为风险以及身份风险;
预测结果确定单元配置为:将所述目标特征分别输入所述多个子模型,得到对应于所述多个风险类型的多个子预测结果。
26.根据权利要求24所述的装置,其中,风险评分确定单元包括:历史身份认证确定模块和风险评分确定模块;
所述历史身份认证确定模块,配置为根据所述预测结果,在各历史身份认证中,确定出与该目标身份认证的相似度大于第一阈值的各历史身份认证;
所述风险评分确定模块,配置为根据确定出的各历史身份认证在历史上的执行结果,确定该目标身份认证的风险评分。
27.根据权利要求24所述的装置,其中,风险评分确定单元包括:判断模块和风险评分确定模块;
所述判断模块,配置为判断所述预测结果是否满足预设的高风险第一判断条件;
风险评分确定模块,配置为在所述预测结果满足预设的高风险第一判断条件时,则生成校验指令,发送至触发所述目标身份认证的设备;根据所述设备返回的校验数据,确定该目标身份认证的风险评分。
28.根据权利要求27所述的装置,其中,所述风险评分确定模块还配置为:在所述预测结果不满足预设的高风险第一判断条件时,确定该目标身份认证与所述高风险第一判断条件中限定的高风险身份认证的相似度是否大于第二阈值;若是,则根据所述预测结果,在各历史身份认证中,确定出与该目标身份认证的相似度大于预设的第三阈值的历史身份认证的数量;根据所述数量,确定该目标身份认证的风险评分。
29.根据权利要求24至28所述的装置,其中,所述风险识别结果包括:高风险身份认证、低风险身份认证之一;
所述风险识别结果确定单元配置为:判断该目标身份认证的风险评分是否满足预设的高风险第二判断条件;若是,确定该目标身份认证是高风险身份认证;若否,则确定历史上的预设时间段内触发的各高风险身份认证,作为基准认证;在该目标身份认证与任一基准认证的相似度均不大于预设的第四阈值的条件下,确定该目标身份认证是低风险身份认证。
30.根据权利要求24至28所述的装置,其中,所述装置还包括:
策略确定单元,配置为若该目标身份认证是高风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第一策略;若该目标身份认证是低风险身份认证,则确定执行该目标身份认证时将采用的执行策略是第二策略;所述第一策略的安全性高于所述第二策略。
31.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-15中任一项的所述的方法。
32.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-15中任一项所述的方法。
CN202011248288.6A 2020-11-10 2020-11-10 风险预测模型的训练方法及装置 Pending CN112330035A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011248288.6A CN112330035A (zh) 2020-11-10 2020-11-10 风险预测模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011248288.6A CN112330035A (zh) 2020-11-10 2020-11-10 风险预测模型的训练方法及装置

Publications (1)

Publication Number Publication Date
CN112330035A true CN112330035A (zh) 2021-02-05

Family

ID=74318994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011248288.6A Pending CN112330035A (zh) 2020-11-10 2020-11-10 风险预测模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN112330035A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559996A (zh) * 2021-02-23 2021-03-26 北京安泰伟奥信息技术有限公司 一种动态认证的风险检测方法及其系统
CN112784219A (zh) * 2021-02-08 2021-05-11 北京淇瑀信息科技有限公司 基于app指数的用户风险预测方法、装置及电子设备
CN112989318A (zh) * 2021-05-12 2021-06-18 北京安泰伟奥信息技术有限公司 一种认证的检测方法及其系统
CN114880637A (zh) * 2022-07-07 2022-08-09 深圳竹云科技股份有限公司 账户风险的验证方法、装置、计算机设备和存储介质
CN116340852A (zh) * 2023-05-30 2023-06-27 支付宝(杭州)信息技术有限公司 一种模型训练、业务风控的方法及装置
CN116866086A (zh) * 2023-09-01 2023-10-10 华能信息技术有限公司 一种基于水印添加的数据安全控制方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741065A (zh) * 2019-01-28 2019-05-10 广州虎牙信息科技有限公司 一种支付风险识别方法、装置、设备及存储介质
CN110378698A (zh) * 2019-07-24 2019-10-25 中国工商银行股份有限公司 交易风险识别方法、装置和计算机系统
CN110706090A (zh) * 2019-08-26 2020-01-17 阿里巴巴集团控股有限公司 信用欺诈识别方法及装置、电子设备、存储介质
CN111291900A (zh) * 2020-03-05 2020-06-16 支付宝(杭州)信息技术有限公司 训练风险识别模型的方法及装置
CN111401914A (zh) * 2020-04-02 2020-07-10 支付宝(杭州)信息技术有限公司 风险评估模型的训练、风险评估方法及装置
CN111489175A (zh) * 2020-04-08 2020-08-04 支付宝(杭州)信息技术有限公司 在线身份认证方法、装置、系统及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741065A (zh) * 2019-01-28 2019-05-10 广州虎牙信息科技有限公司 一种支付风险识别方法、装置、设备及存储介质
CN110378698A (zh) * 2019-07-24 2019-10-25 中国工商银行股份有限公司 交易风险识别方法、装置和计算机系统
CN110706090A (zh) * 2019-08-26 2020-01-17 阿里巴巴集团控股有限公司 信用欺诈识别方法及装置、电子设备、存储介质
CN111291900A (zh) * 2020-03-05 2020-06-16 支付宝(杭州)信息技术有限公司 训练风险识别模型的方法及装置
CN111401914A (zh) * 2020-04-02 2020-07-10 支付宝(杭州)信息技术有限公司 风险评估模型的训练、风险评估方法及装置
CN111489175A (zh) * 2020-04-08 2020-08-04 支付宝(杭州)信息技术有限公司 在线身份认证方法、装置、系统及存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112784219A (zh) * 2021-02-08 2021-05-11 北京淇瑀信息科技有限公司 基于app指数的用户风险预测方法、装置及电子设备
CN112784219B (zh) * 2021-02-08 2023-12-22 北京淇瑀信息科技有限公司 基于app指数的用户风险预测方法、装置及电子设备
CN112559996A (zh) * 2021-02-23 2021-03-26 北京安泰伟奥信息技术有限公司 一种动态认证的风险检测方法及其系统
CN112559996B (zh) * 2021-02-23 2021-05-28 北京安泰伟奥信息技术有限公司 一种动态认证的风险检测方法及其系统
CN112989318A (zh) * 2021-05-12 2021-06-18 北京安泰伟奥信息技术有限公司 一种认证的检测方法及其系统
CN114880637A (zh) * 2022-07-07 2022-08-09 深圳竹云科技股份有限公司 账户风险的验证方法、装置、计算机设备和存储介质
CN114880637B (zh) * 2022-07-07 2022-09-20 深圳竹云科技股份有限公司 账户风险的验证方法、装置、计算机设备和存储介质
CN116340852A (zh) * 2023-05-30 2023-06-27 支付宝(杭州)信息技术有限公司 一种模型训练、业务风控的方法及装置
CN116340852B (zh) * 2023-05-30 2023-09-15 支付宝(杭州)信息技术有限公司 一种模型训练、业务风控的方法及装置
CN116866086A (zh) * 2023-09-01 2023-10-10 华能信息技术有限公司 一种基于水印添加的数据安全控制方法及系统
CN116866086B (zh) * 2023-09-01 2024-01-30 华能信息技术有限公司 一种基于水印添加的数据安全控制方法及系统

Similar Documents

Publication Publication Date Title
CN112330035A (zh) 风险预测模型的训练方法及装置
EP3719678B1 (en) Identity verification method and apparatus
US10600055B2 (en) Authentication and interaction tracking system and method
KR102038851B1 (ko) 신원들을 검증하기 위한 방법 및 시스템
US11048956B2 (en) Intelligent gallery management for biometrics
CN110362999B (zh) 用于检测账户使用异常的方法及装置
TWI751422B (zh) 核身產品推送及核身方法和系統
US11115406B2 (en) System for security analysis and authentication
US11321449B2 (en) System for security analysis and authentication across downstream applications
CN114090985A (zh) 区块链中用户操作权限的设置方法、装置和电子设备
US20230027253A1 (en) Method for confirming the identity of a user in a browsing session of an online service
CN113170021A (zh) 用于至少一个用户与自动类型和人工类型的至少一个操作员之间的远程交互的方法和系统
CN114694227A (zh) 一种基于人脸识别技术的身份认证持续优化方法
CN108876386B (zh) 对象认证方法和装置、基于对象认证的交易方法和装置
CN110648048A (zh) 小程序签约事件处理方法、装置、服务器及可读存储介质
CN113409051B (zh) 针对目标业务的风险识别方法及装置
Nakanishi et al. Advancing the state-of-the-art in transportation security identification and verification technologies: Biometric and multibiometric systems
US11212277B1 (en) System and method for securing, perfecting and accelerating biometric identification via holographic environmental data
Karatzouni Non-intrusive continuous user authentication for mobile devices
CN110120964B (zh) 用户行为监控方法和装置以及计算设备
CN118314517A (zh) 枪械存取管理方法、装置、枪械存取管理柜及存储介质
WO2023111662A1 (en) Biometric identification via holographic environmental data
CN117786765A (zh) 基于区块链的数字身份溯源方法及系统
CN115471232A (zh) 风险分析方法及装置
CN116033428A (zh) 一种电信异常用户的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210205

RJ01 Rejection of invention patent application after publication