CN110991905A - 风险模型训练方法以及装置 - Google Patents

风险模型训练方法以及装置 Download PDF

Info

Publication number
CN110991905A
CN110991905A CN201911236044.3A CN201911236044A CN110991905A CN 110991905 A CN110991905 A CN 110991905A CN 201911236044 A CN201911236044 A CN 201911236044A CN 110991905 A CN110991905 A CN 110991905A
Authority
CN
China
Prior art keywords
model
risk
training
aggregation
risk model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911236044.3A
Other languages
English (en)
Other versions
CN110991905B (zh
Inventor
傅欣艺
张天翼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911236044.3A priority Critical patent/CN110991905B/zh
Publication of CN110991905A publication Critical patent/CN110991905A/zh
Application granted granted Critical
Publication of CN110991905B publication Critical patent/CN110991905B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本说明书实施例提供风险模型训练方法以及装置,其中所述风险模型训练方法包括:接收服务端下发风险标签库;根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;将所述模型更新参数上传至所述服务端;接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。

Description

风险模型训练方法以及装置
技术领域
本说明书实施例涉及机器学习技术领域,特别涉及两种风险模型训练方法。本说明书一个或者多个实施例同时涉及两种风险模型训练装置,两种计算设备,以及两种计算机可读存储介质。
背景技术
随着互联网技术的发展,在互联网上开展的业务越来越多元化,然而这些业务在互联网上发展和广泛应用的过程中,产生了大量安全风险,比如盗用登录风险、虚假注册风险、恶意设备风险、盗用交易风险等。这些安全风险的存在不仅影响业务的稳定发展,也影响用户的参与体验,破坏用户的信任度,还有可能会导致用户隐私、经济、名誉等方面出现损失。
然而欲避免这些安全风险造成的损害,需要具备对这些安全风险进行风险识别的能力,进而针对不同的安全风险施行相应的风险防控措施,实际应用中,通常通过目标风险模型对用户行为数据进行风险预测,以预测结果来表明用户行为数据的风险程度,因此目标风险模型的准确性至关重要,而目标风险模型的准确性很大程度上取决于模型训练时选取训练样本的细粒度,即用户历史行为数据的细粒度,但是越是细粒度的用户历史行为数据,传输到服务端的产生的传输压力,以及存储压力和分析压力也越大,同时越是细粒度的用户历史行为数据对用户的隐私暴露的越多,因此需要提供更快速或者更可靠的方案对目标风险模型进行训练。
发明内容
有鉴于此,本说明书实施例提供了两种风险模型训练方法。本说明书一个或者多个实施例同时涉及两种风险模型训练装置,两种计算设备,以及两种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种风险模型训练方法,包括:
接收服务端下发的风险标签库;
根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;
通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;
将所述模型更新参数上传至所述服务端;
接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
可选的,所述接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型步骤执行之后,还包括:
接收所述服务端下发的迭代风险标签;
根据所述风险标签库与所述迭代风险标签,对迭代用户历史行为数据以及所述用户历史行为数据进行打标生成迭代训练样本,将所述迭代风险标签更新至所述风险标签库中,将所述迭代用户历史行为数据更新至所述用户历史行为数据中;
通过所述迭代训练样本对前一次接收到的聚合风险模型进行模型训练,获得前一次接收到的聚合风险模型的模型迭代参数;
将所述模型迭代参数上传至所述服务端;
接收所述服务端根据所述模型迭代参数进行聚合确定的聚合风险模型;
判断是否存在所述服务端下发的聚合风险模型对应的收敛标签;
若否,返回执行接收所述服务端下发的迭代风险标签步骤。
可选的,若所述判断是否存在所述服务端下发的聚合风险模型对应的收敛标签的判断结果为是,执行如下操作:
将所述聚合风险模型作为目标风险模型,并将采集到的用户行为数据输入所述目标风险模型进行风险预测;
将所述目标风险模型输出的预测结果上传至所述服务端。
可选的,所述接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型步骤执行之后,还包括:
判断是否存在所述服务端下发的聚合风险模型对应的收敛标签;
若是,将所述聚合风险模型作为目标风险模型,并将采集到的用户行为数据输入所述目标风险模型进行风险预测;
将所述目标风险模型输出的预测结果上传至所述服务端。
可选的,所述根据所述风险标签库,对用户历史行为数据进行打标生成训练样本,包括:
将所述用户历史行为数据中的用户报案数据,按照所述风险标签库进行打标;
将所述用户历史行为数据中的非用户报案数据作为非风险数据进行打标,将打标后的非用户报案数据以及打标后的用户报案数据作为所述训练样本。
根据本说明书实施例的第二方面,提供了一种风险模型训练装置,包括:
接收标签库模块,被配置为接收服务端下发的风险标签库;
生成样本模块,被配置为根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;
模型训练模块,被配置为通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;
上传模型参数模块,被配置为将所述模型更新参数上传至所述服务端;
接收模型模块,被配置为接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
根据本说明书实施例的第三方面,提供了另一种风险模型训练方法,包括:
向多个针对训练风险模型进行模型训练的终端下发风险标签库;
接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;
将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型;
将所述聚合风险模型下发至所述各个终端。
可选的,所述将所述聚合风险模型下发至所述各个终端步骤执行之后,还包括:
向所述各个终端下发迭代风险标签;
接收所述各个终端针对前一次下发的聚合风险模型进行模型训练后上传的模型迭代参数;
将所述模型迭代参数聚合为聚合模型迭代参数,并根据所述聚合模型迭代参数对所述前一次下发的聚合风险模型进行更新;
判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件;
若否,向所述各个终端下发对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型,并返回执行所述向所述各个终端下发迭代风险标签步骤。
可选的,若所述判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件的判断结果为是,执行如下操作:
针对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型添加对应的收敛标签;
将对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型下发至所述各个终端;
接收所述各个终端中任一终端通过对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型对采集到的用户行为数据进行风险预测的预测结果;
根据所述预测结果,确定针对所述任一终端进行风险防控施行的风险防控措施。
可选的,所述将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型步骤执行之后,并所述将所述聚合风险模型下发至所述各个终端步骤执行之前,还包括:
判断所述聚合风险模型是否满足收敛条件;
若是,针对所述聚合风险模型添加对应的收敛标签。
可选的,所述将所述聚合风险模型下发至所述各个终端步骤执行之后,还包括:
接收所述各个终端中任一终端通过所述聚合风险模型对采集到的用户行为数据进行风险预测的预测结果;
根据所述预测结果,确定针对所述任一终端进行风险防控施行的风险防控措施。
可选的,所述用户报案数据,包括:用户交易报案数据;
相应的,所述风险标签库采用如下方式进行创建:
根据针对所述用户交易报案数据的审理结果对所述用户交易报案数据进行打标;
根据已打标的用户交易报案数据中包含的交易标识、设备标识以及标签标识,生成所述风险标签库。
可选的,所述将所述模型更新参数聚合为聚合模型参数,包括:
将所述模型更新参数加权后进行求和,获得所述聚合模型参数。
可选的,所述将所述模型更新参数聚合为聚合模型参数,包括:
分别计算所述各个终端中参与所述模型训练的训练样本的数量与所述训练样本的数量之和的比值;
将所述各个终端的比值与对应的模型更新参数的乘积之和,作为聚合模型参数。
根据本说明书实施例的第四方面,提供了另一种风险模型训练装置,包括:
下发标签库模块,被配置为向多个针对训练风险模型进行模型训练的终端下发风险标签库;
接收参数模块,被配置为接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;
更新模型模块,被配置为将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型;
下发模型模块,被配置为将所述聚合风险模型下发至所述各个终端。
根据本说明书实施例的第五方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
接收服务端下发的风险标签库;
根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;
通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;
将所述模型更新参数上传至所述服务端;
接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
根据本说明书实施例的第六方面,提供了另一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
向多个针对训练风险模型进行模型训练的终端下发风险标签库;
接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;
将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型;
将所述聚合风险模型下发至所述各个终端。
根据本说明书实施例的第七方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现一种所述风险模型训练方法的步骤。
根据本说明书实施例的第八方面,提供了另一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现另一种所述风险模型训练方法的步骤。
本说明书提供一种风险模型训练方法,包括:接收服务端下发的风险标签库;根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;将所述模型更新参数上传至所述服务端;接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
本说明书一个实施例实现了,通过服务端下发创建的风险标签库对用户历史行为数据进行打标生成训练样本,并利用终端的计算能力,在用户历史行为数据不上传到服务端的基础上,协同大量终端通过生成的训练样本共同训练一个训练风险模型,既保护了用户的数据隐私,也减少了将用户行为数据上传到服务端的传输压力,以及服务端的存储压力。
本说明书提供另一种风险模型训练方法,包括:向多个针对训练风险模型进行模型训练的终端下发风险标签库;接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型;将所述聚合风险模型下发至所述各个终端。
本说明书另一个实施例实现了,通过服务端向多个终端下发创建的风险标签库,将各个终端针对训练风险模型进行模型训练后上传的模型更新参数聚合为聚合模型参数,根据聚合模型参数更新训练风险模型,并将更新后获得的聚合风险模型下发至各个终端,实现了为终端提供针对用户历史行为数据进行打标的风险标签库,在用户历史行为数据不上传到服务端的基础上,协助大量终端共同训练一个训练风险模型,既保护了用户的数据隐私,也减少了将用户行为数据上传到服务端的传输压力,以及服务端的存储压力。
附图说明
图1是本说明书一个实施例提供的一种风险模型训练方法的流程图;
图2是本说明书一个实施例提供的一种应用于智能手机的风险模型训练方法的处理流程图;
图3是本说明书一个实施例提供的一种风险模型训练装置的结构示意图;
图4是本说明书一个实施例提供的另一种风险模型训练方法的流程图;
图5是本说明书一个实施例提供的另一种应用于云端的风险模型训练方法的处理流程图;
图6是本说明书一个实施例提供的另一种风险模型训练装置的结构示意图;
图7是本说明书一个实施例提供的一种计算设备的结构框图;
图8是本说明书一个实施例提供的另一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
风险识别:是指风险管理的第一步,也是风险管理的基础。只有在正确识别出自身所面临的风险的基础上,人们才能够主动选择适当有效的方法进行的处理。
差分隐私:是密码学中的一种手段,旨在提供一种当从统计数据库查询时,最大化数据查询的准确性,同时最大限度减少识别其记录的机会。
在本说明书中,提供了两种风险模型训练方法,本说明书一个或者多个实施例同时涉及两种风险模型训练装置,两种计算设备,以及两种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
本说明书提供的一种风险模型训练方法实施例如下:
图1示出了根据本说明书一个实施例提供的一种风险模型训练方法的流程图,包括步骤S102至步骤S110。
步骤S102,接收服务端下发的风险标签库。
本实施例的执行主体是终端,本说明书提供的另一个方法实施例的执行主体是服务端,本说明书通过终端和服务端配合对风险模型以迭代的方式进行模型训练,其中,风险模型是指已经完成模型训练的模型,通过次风险模型可以在线进行风险预测,并获得风险预测的预测结果。
具体的,作为执行主体的终端包括但不限于智能手机、电脑、PAD等用户终端。
所述服务端,包括云端服务端以及普通服务端,其与终端或与运行在终端的应用程序相配合,用于实现应用程序的主要业务逻辑。
所述风险标签库,用以对数据进行打标,生成进行模型训练的训练样本,具体的,可以是根据对用户报案数据的审理结果构建标签库,其中,用户报案数据,是指安装在终端的应用程序的用户账户出现交易盗用、账户密码被窜改、账户在其他设备登录等安全风险的情况下,用户针对这些风险进行报案,而应用程序的服务端根据用户的报案请求,获取用户报案请求相关的用户报案数据,且对用户报案数据进行审理,进而确定用户报案情况是否属实,并确定后续对案件的处理情况;
相应的,审理结果是对用户报案数据进行审理的审理结果,具体的,可以通过用户报案数据中的设备标识、地址信息、互联网协议地址等关键信息对案件进行审理,而审理结果可以针对不同的案件类型有不同的审理结果,以交易盗用识别为例,审理结果包括盗用交易、非盗用交易等。
以交易盗用的审理为例,用户A在其智能手机上安装的应用程序的账户中发现两笔交易order01和order02,这两笔交易不是在用户A本人的操作下产生的,用户A对这两笔交易并不知情,因此针对这两笔交易分别发起交易盗用报案请求,服务端在接收到这两笔交易的交易盗用报案请求之后,获取这两笔交易的用户交易报案数据,并对这些用户交易报案数据进行审理,审理时发现order01这笔交易对应的地址信息不是用户A的常用地址信息,则将对order01交易案件的审理结果确定为交易盗用,而order02交易的相关数据没有异常,则将对order02交易案件的审理结果确定为非交易盗用;
用户A的交易标识为order01对应的设备标识为dev29,针对order01的审理结果为交易盗用,将交易盗用以1标识,其交易标识为order02对应的设备标识为dev29,针对order02的审理结果为非交易盗用,将非交易盗用以0标识,而用户B的交易标识为order03对应的设备标识为dev55,针对order03的审理结果为交易盗用,将交易盗用以1标识,用户B的交易标识为order02对应的设备标识为dev55,针对order02的审理结果为非交易盗用,将非交易盗用以0标识,根据以上对交易数据的审理结果创建的风险标签库具体如下表1所示:
交易标识 设备标识 标签标识
order01 dev29 1
order02 dev29 0
order03 dev55 1
order04 dev55 0
表1
实际应用中,服务端根据对用户报案数据进行审理的审理结果确定的标签以及用户报案数据中的关键信息构建风险标签库之后,将风险标签库按照风险标签库中的设备标识下发至对应的各个终端,各个终端接收从服务端下发的风险标签库。
以上述用户A进行交易所在的终端为例,根据表1所示的风险标签库,此终端的设备标识为dev29,则此终端接收的从服务端下发的风险标签库如下表2所示:
交易标识 设备标识 标签标识
order01 dev29 1
order02 dev29 0
表2
以上述用户B进行交易所在的终端为例,根据表1所示的风险标签库,此终端的设备标识为dev55,则此终端接收的从服务端下发的风险标签库如下表3所示:
交易标识 设备标识 标签标识
order03 dev55 1
order04 dev55 0
表3
步骤S104,根据所述风险标签库,对用户历史行为数据进行打标生成训练样本。
实际应用中,所述风险标签库中可以包含标签标识以及用户报案数据中的关键信息,比如包含上述表1中的交易标识、设备标识以及标签标识。
所述用户历史行为数据,可以是用户在终端或在终端上运行的应用程序中进行各种操作产生的数据,具体的,这些数据可以是交易数据、登录数据、改密数据、查看数据、消息数据等。
本说明书实施例提供的一种可选实施方式中,所述根据所述风险标签库,对用户历史行为数据进行打标生成训练样本,具体采用如下方式实现:
将所述用户历史行为数据中的用户报案数据,按照所述风险标签库进行打标;
将所述用户历史行为数据中的非用户报案数据作为非风险数据进行打标,将打标后的非用户报案数据以及打标后的用户报案数据作为所述训练样本。
实际应用中,用户历史行为数据中除包含与上述用户报案数据之外,还包含用户未报案的数据,即非用户报案数据,针对用户报案数据,可以根据风险标签库中的标签标识与用户报案数据中字段的对应关系进行打标,并将用户历史行为数据中的非用户报案数据,则可以直接作为非风险数据进行打标,并将这些打标后的数据作为训练样本。
具体的,以交易盗用识别为例,用户历史行为数据包括用户在每笔交易之前通过在应用程序上点击控件、点击屏幕像素点等生成的行为数据。
以上述用户A所在的终端dev29为例,用户报案数据为order01以及order02的交易报案数据,根据表2所示的风险标签库,将用户A的用户历史行为数据中的与交易标识为order01相关的行为数据作为风险数据打标为1,与交易标识为order02相关的行为数据作为非风险数据的打标为0,并将用户A的用户历史行为数据中的非用户报案数据作为非风险数据打标为0,将上述打标后的用户报案数据以及非用户报案数据作为终端dev29上进行模型训练的训练样本。
本说明书实施例,通过根据风险标签库对用户历史行为数据中的用户报案数据以及用户未报案数据进行打标的方式生成训练样本,实现了对用户历史行为数据的快速打标,提高了生成训练样本的效率,并为模型训练提供了丰富的训练样本。
步骤S106,通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数。
所述训练风险模型,为服务端下发的风险模型的初始风险模型,终端通过上述步骤S104中生成的训练样本对此训练风险模型进行模型训练。
所述模型更新参数,是指对训练风险模型进行模型训练后,从训练风险模型中提取出的模型更新参数。
实际应用中,服务端将训练风险模型下发到各个终端,并分别在各个终端通过上述训练样本对此训练风险模型进行模型训练,进而获得此训练风险模型的模型更新参数,具体的,此训练风险模型可以是深度学习模型,对训练风险模型进行模型训练时可以采用随机梯度下降算法对此训练风险模型进行优化。
步骤S108,将所述模型更新参数上传至所述服务端。
具体实施时,各个终端将对训练风险模型进行模型训练获得的模型更新参数上传至服务端,以便服务端对各个终端上传的模型更新参数进行聚合。
而服务端如何对各个终端上传的模型更新参数进行聚合,可参见本说明书提供的另一个方法实施例中步骤S406中的详情。
步骤S110,接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
具体实施时,各个终端将模型更新参数上传至服务端之后,服务端将各个模型更新参数进行聚合获得聚合模型参数,并进一步通过聚合模型参数对训练风险模型进行更新确定聚合风险模型,并将此聚合风险模型下发至各个终端,而各个终端接收此从服务端下发的聚合风险模型。
实际应用中,在终端只进行一次模型训练,通常得不到收敛的聚合风险模型,因此需要在终端进行多次模型训练,本说明书实施例提供的一种可选实施方式中,所述接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型步骤执行之后,还包括:
1)接收所述服务端下发的迭代风险标签。
所述迭代风险标签,是指从前一次下发风险标签到这一次下发风险标签之间更新的风险标签,即相邻两次下发风险标签的时间区间之内对服务端的风险标签库的更新。
实际应用中,所述迭代风险标签,可以是根据迭代用户报案数据,即从前一次下发风险标签到这一次下发风险标签之间新增的用户报案数据的审理结果更新的。
具体实施时,通过不断对新增用户报案数据进行审理,对风险标签库进行更新,并将对风险标签库更新的迭代风险标签下发至终端,保持了服务端和终端风险标签的同步,也为下述步骤2)中对迭代历史行为数据进行打标提供了标签基础,而具体如何从服务端下发风险标签,并如何对用户报案数据进行审理与上述步骤S102类似,在此不再赘述。
2)根据所述风险标签库与所述迭代风险标签,对迭代用户历史行为数据以及所述用户历史行为数据进行打标生成迭代训练样本,将所述迭代风险标签更新至所述风险标签库中,将所述迭代用户历史行为数据更新至所述用户历史行为数据中。
所述迭代用户历史行为数据,是指从前一次用户历史行为数据进行打标之后新增的用户历史行为数据,实际应用中,由于前一次对用户历史行为数据打标之时,存在有些用户历史行为数据或许是风险数据,当用户没有及时发现并报案,因此这些是风险数据的用户历史行为数据在前一次被打标之时,仍是作为非风险数据被打标的,因此不断以风险标签库以及迭代风险标签,对迭代用户历史行为数据以及用户历史行为数据进行打标,提高了打标的准确性,并进一步提高了迭代训练样本的准确性。
所述迭代训练样本,是指通过对数据进行打标的方式生成的此次对接收到的聚合风险模型进行模型训练的样本数据。
而将所述迭代风险标签更新至所述风险标签库中,将所述迭代用户历史行为数据更新至所述用户历史行为数据中,保障了每次迭代数据的完整性。
3)通过所述迭代训练样本对前一次接收到的聚合风险模型进行模型训练,获得前一次接收到的聚合风险模型的模型迭代参数。
所述模型迭代参数,是指此轮迭代对聚合风险模型进行模型训练生成的模型参数。
具体实施时,采用随机梯度下降算法对聚合风险模型进行模型训练,此聚合风险模型在t+1轮的模型迭代参数的更新过程如下所示:
Figure BDA0002304900140000171
其中,r是学习率,gk是针对第k个终端上所有迭代训练样本计算的梯度均值,wt是模型参数在第t轮迭代时的模型迭代参数,
Figure BDA0002304900140000172
是第k个终端的在t+1轮的模型迭代参数。
4)将所述模型迭代参数上传至所述服务端。
具体实施时,各个终端将聚合风险模型进行模型训练获得的模型迭代参数上传至服务端,以便服务端对各个终端上传的模型迭代参数进行聚合。
5)接收所述服务端根据所述模型迭代参数进行聚合确定的聚合风险模型。
具体实施时,各个终端将模型迭代参数上传至服务端之后,服务端将各个终端模型迭代参数进行聚合获得聚合模型迭代参数,并进一步通过聚合模型迭代参数对原聚合风险模型进行更新确定更新后的聚合风险模型,并将此更新后的聚合风险模型下发至各个终端,而各个终端接收此从服务端下发的更新后的聚合风险模型。
6)判断是否存在所述服务端下发的聚合风险模型对应的收敛标签。
a)若是,表明从服务端下发的聚合风险模型已经收敛,可以在终端通过此聚合风险模型进行模型训练,本说明书实施例提供的一种可选实施方式中,将所述聚合风险模型作为目标风险模型,并将采集到的用户行为数据输入所述目标风险模型进行风险预测;
将所述目标风险模型输出的预测结果上传至所述服务端。
所述收敛标签,是指服务端在聚合风险模型已经满足收敛条件的情况下,针对聚合风险模型添加的收敛标签,表明此聚合风险模型已经收敛,而服务端在此聚合风险模型存在收敛标签的情况下,下发此聚合风险模型时,也将此聚合风险模型对应的收敛标签下发至各个终端。
实际应用中,判断是否存在所述服务端下发的聚合风险模型对应的收敛标签的判断结果为是,表明次聚合风险模型以及收敛,则停止对此聚合风险模型进行模型训练,将此聚合风险模型作为目标风险模型,对用户行为数据进风险预测。
以交易盗用识别为例,在终端将聚合风险模型作为为目标风险模型之后,会将终端上采集到的用户的每笔交易的相关数据通过目标风险模型进行风险预测,并得到预测结果,此预测结果可以通过百分比或者分数值表示,若某笔交易的预测结果超过风险阈值,则认为这笔交易存在交易风险,并针对这笔交易施行相应的风险防控措施,具体的,风险防控措施可以是短信校验、交易失败或者冻结账户等。
本说明书实施例,在判断是否存在所述服务端下发的聚合风险模型对应的收敛标签的判断结果为是的情况下,将此聚合风险模型作为目标风险模型,对采集到的用户行为数据输入目标风险模型进行风险预测,并将目标风险模型输出的预测结果上传至服务端,实现了在终端分别对各自终端采集到的用户行为数据进行风险预测,避免了将用户行为数据上传服务端的传输压力,也避免了因获取用户行为数据而造成对用户隐私的侵犯,还减少了在服务端对用户行为数据进行风险预测的压力。
b)若否,表明聚合风险模型没有收敛,还需要对返回执行步骤1)。
具体实施时,终端通过判断是否存在聚合风险模型对应的收敛标签,判断服务端下发的聚合风险模型是否已经收敛,若否,表明此聚合风险模型没有收敛,需要继续对服务端下发的聚合风险模型进行模型训练,因此返回执行步骤1),对接收到的聚合风险模型进行下一轮的模型训练,并在服务端下一次下发的聚合风险模型没有存在对应的收敛标签的情况下,循环执行步骤1)至步骤6),直至接收到的聚合风险模型存在对应的收敛标签,可作为目标风险模型在终端对用户行为数据进行风险预测。
以智能手机(终端)和云端(服务端)配合以迭代的方式对风险模型进行模型训练为例,对风险模型进行模型训练的过程进行说明,具体的,第一次迭代过程为:云端根据用户报案数据dataA的审理结果创建了风险标签库taglib1,云端将此风险标签库taglib1下发至多个智能手机,智能手机mobile1接收到此风险标签库taglib1之后,根据此风险标签库taglib1对智能手机mobile1上安装的应用程序的用户历史行为数据hdataA进行打标生成训练样本S1,并通过S1对云端下发的训练风险模型model1进行模型训练,训练风险模型model1为云端下发至各个智能手机的初始风险模型,将训练风险模型model1的模型参数w0更新为模型更新参数
Figure BDA0002304900140000201
其中,
Figure BDA0002304900140000202
(其中,r是学习率,g1是针对智能手机mobile1上所有训练样本计算的梯度均值),并将此模型更新参数
Figure BDA0002304900140000203
上传至云端;
云端接收智能手机mobile1上传的模型更新参数
Figure BDA0002304900140000204
此外还接收其他智能手机上传的模型更新参数
Figure BDA0002304900140000205
(k表示第k个智能手机),将这些各个智能手机上传的模型更新参数聚合为聚合模型参数
Figure BDA0002304900140000206
(N是参与对训练风险模型model1进行模型训练的所有训练样本的数量;nk是第k个智能手机上参与对训练风险模型model1进行模型训练的训练样本的数量),云端根据聚合模型参数w1对训练风险模型model1进行更新,更新后获得聚合风险模型model2,并将此聚合风险模型model2下发至各个智能手机,执行下述第二次迭代;
第二次迭代过程为:云端根据迭代用户报案数据dataB的审理结果获得了更新的迭代风险标签taglib2,云端将此迭代风险标签taglib2下发至多个智能手机,智能手机mobile1接收到此迭代风险标签taglib2之后,根据上一次迭代下发至智能手机mobile1的风险标签库taglib1以及这一次迭代下发至智能手机mobile1的迭代风险标签tablib2,对智能手机mobile1上安装的应用程序上的迭代用户历史行为数据hdataB以及上一次迭代存在于mobile1的用户历史行为数据hdataA进行打标生成迭代训练样本S2,并将迭代风险标签tablib2更新至风险标签库tablib1,且将迭代用户历史行为数据hdataB更新至用户历史行为数据hdataA,然后,智能手机mobile1通过迭代训练样本S2对云端下发的聚合风险模型model2进行模型训练,将聚合风险模型model2的模型参数w1更新为模型迭代参数
Figure BDA0002304900140000211
其中,
Figure BDA0002304900140000212
(其中,r是学习率,g2是针对智能手机mobile1上所有训练样本计算的梯度均值),并将此模型迭代参数
Figure BDA0002304900140000213
上传至云端;
云端接收智能手机mobile1上传的模型迭代参数
Figure BDA0002304900140000214
此外还接收其他智能手机上传的模型迭代参数
Figure BDA0002304900140000215
(k表示第k个智能手机),将这些各个智能手机上传的模型迭代参数聚合为聚合模型迭代参数
Figure BDA0002304900140000216
Figure BDA0002304900140000217
(N是参与对聚合风险模型model2进行模型训练的所有训练样本的数量;nk是第k个智能手机上参与对聚合风险模型model2进行模型训练的训练样本的数量),云端根据聚合模型迭代参数w2对聚合风险模型model2进行更新,更新后获得聚合风险模型model3,接下来云端会判断获得的聚合风险模型model3是否满足收敛条件;在不满足收敛条件的情况下,将此聚合风险模型model3下发至各个智能手机,智能手机mobile1判断是否存在云端下发的针对此聚合风险模型model3的收敛标签;在不存在收敛标签的情况下,执行下述第三次迭代;
第三次迭代过程为:云端根据迭代用户报案数据dataC的审理结果获得了更新的迭代风险标签taglib3,云端将此迭代风险标签taglib3下发至多个智能手机,智能手机mobile1接收到此迭代风险标签taglib3之后,根据风险标签库taglib1以及这一次迭代下发至智能手机mobile1的迭代风险标签tablib3,对智能手机mobile1上安装的应用程序上的迭代用户历史行为数据hdataC以及上一次迭代存在于mobile1的用户历史行为数据hdataA进行打标生成迭代训练样本S3,并将迭代风险标签tablib3更新至风险标签库tablib1,且将迭代用户历史行为数据hdataC更新至用户历史行为数据hdataA,然后,智能手机mobile1通过迭代训练样本S3对云端下发的聚合风险模型model3进行模型训练,将聚合风险模型model3的模型参数w2更新为模型迭代参数
Figure BDA0002304900140000221
其中,
Figure BDA0002304900140000222
(其中,r是学习率,g3是针对智能手机mobile1上所有训练样本计算的梯度均值),并将此模型迭代参数
Figure BDA0002304900140000223
上传至云端;
云端接收智能手机mobile1上传的模型迭代参数
Figure BDA0002304900140000224
此外还接收其他智能手机上传的模型迭代参数
Figure BDA0002304900140000225
(k表示第k个智能手机),将这些各个智能手机上传的模型迭代参数聚合为聚合模型迭代参数
Figure BDA0002304900140000226
Figure BDA0002304900140000227
(N是参与对聚合风险模型model3进行模型训练的所有训练样本的数量;nk是第k个智能手机上参与对聚合风险模型model3进行模型训练的训练样本的数量),云端根据聚合模型迭代参数w3对聚合风险模型model3进行更新,更新后获得聚合风险模型model4,接下来云端会判断获得的聚合风险模型model4是否满足收敛条件;在聚合风险模型model4满足收敛条件的情况下,云端针对聚合风险模型model4添加收敛标签,将此聚合风险模型model4下发至各个智能手机,则智能手机mobile1判断对是否存在云端下发的针对此聚合风险模型model4的收敛标签的判断结果为是,表明聚合风险模型model4已经收敛,将次聚合风险模型作为目标风险模型,对采集到的用户行为数据进行风险预测,并将风险预测的预测结果上传至云端,云端根据此预测结果,确定对智能手机mobile1上安装的应用程序施行的风险防控措施;
假设聚合风险模型model4不满足收敛条件,将此聚合风险模型model4下发至各个智能手机,则智能手机mobile1判断对是否存在云端下发的针对此聚合风险模型model4的收敛标签的判断结果为否,执行第四次迭代,而第四次迭代,包括之后可能存在的第五次迭代,……到第N次迭代的具体实现方式,与上述三次迭代的方式类似,在此不做赘述。
本说明书实施例,通过判断是否存在服务端下发的聚合风险模型对应的收敛标签,决定是否需要继续对服务端下发的聚合风险模型进行模型训练,在需要继续进行模型训练的情况下,在终端多次进行模型训练,直至存在服务端下发的聚合风险模型对应的收敛标签,实现了终端和服务端的配合,并在终端进行模型训练,使大量终端分别进行模型训练,避免了在服务端进行模型训练对服务端带来的压力。
本说明书实施例提供的一种可选实施方式中,所述接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型步骤执行之后,还包括:
判断是否存在所述服务端下发的聚合风险模型对应的收敛标签;
若是,将所述聚合风险模型作为目标风险模型,并将采集到的用户行为数据输入所述目标风险模型进行风险预测;
将所述目标风险模型输出的预测结果上传至所述服务端。
实际应用中,在第一次接收到服务端根据所述模型更新参数进行聚合确定的聚合风险模型之后,判断此聚合风险模型是否满足收敛条件,若是,表明此聚合风险模型已经收敛,则服务端针对此聚合风险模型添加对应的收敛标签,并将此聚合风险模型下发至各个终端,终端接收到聚合风险模型后,判断是否存在所述服务端下发的聚合风险模型对应的收敛标签,若是,表明此聚合风险模型已经收敛,不再对此聚合风险模型进行模型训练,将此聚合风险模型作为目标风险模型对采集到的用户行为数据进风险预测。
若否,表明此聚合风险模型没有收敛,则可以循环执行上述步骤1)至步骤6)以迭代的方式对从服务端接收到的聚合风险进行模型训练,直至聚合风险模型满足收敛条件为止。
本说明书实施例,通过服务端下发到各个终端的已经收敛的聚合风险模型,运用终端的计算能力对用户行为数据进行风险预测,既减少了将用户行为数据上传服务端的传输压力,也避免了因获取用户行为数据而造成对用户隐私的侵犯,还减少了在服务端对用户行为数据进行风险预测的压力。
下述结合附图2,以本说明书提供的风险模型训练方法在智能手机的应用为例,对所述风险模型训练方法进行进一步说明。其中,图2示出了本说明书一个实施例提供的一种应用于智能手机的风险模型训练方法的处理流程图,具体步骤包括步骤S202至步骤S228。
步骤S202,接收云端下发风险标签库。
步骤S204,将所述用户历史行为数据中的用户报案数据,按照所述风险标签库进行打标。
步骤S206,将所述用户历史行为数据中的非用户报案数据作为非风险数据进行打标,将打标后的非用户报案数据以及上述打标后的用户报案数据作为训练样本。
步骤S208,通过所述训练样本对所述云端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数。
步骤S210,将所述模型更新参数上传至所述云端。
步骤S212,接收所述云端根据所述模型更新参数进行聚合确定的聚合风险模型。
步骤S214,接收所述云端下发的迭代风险标签。
步骤S216,根据所述风险标签库与所述迭代风险标签,对迭代用户历史行为数据以及所述用户历史行为数据进行打标生成迭代训练样本,将所述迭代风险标签更新至所述风险标签库中,将所述迭代用户历史行为数据更新至所述用户历史行为数据中。
步骤S218,通过所述迭代训练样本对前一次接收到的聚合风险模型进行模型训练,获得前一次接收到的聚合风险模型的模型迭代参数。
步骤S220,将所述模型迭代参数上传至所述云端。
步骤S222,接收所述云端根据所述模型迭代参数进行聚合确定的聚合风险模型。
步骤S224,判断是否存在所述云端下发的聚合风险模型对应的收敛标签。
若是,执行下述步骤S226;
若否,返回执行上述步骤S214。
步骤S226,将所述聚合风险模型作为目标风险模型,并将采集到的用户行为数据输入所述目标风险模型进行风险预测。
步骤S228,将所述目标风险模型输出的预测结果上传至所述云端。
综上所述,本说明书一个实施例实现了,通过云端下发创建的风险标签库对用户历史行为数据生成训练样本,并利用智能手机的计算能力,在用户历史行为数据不上传到云端的基础上,协同大量智能手机通过生成的训练样本共同训练一个训练风险模型,既保护了用户的数据隐私,也减少了将用户行为数据上传到云端的传输压力以及存储压力。
本说明书提供的一种风险模型训练装置实施例如下:
与上述方法实施例相对应,本说明书还提供了风险模型训练装置实施例,图3示出了本说明书一个实施例提供的一种风险模型训练装置的结构示意图。
如图3所示,该装置包括:
接收标签库模块302,被配置为接收服务端下发的风险标签库;
生成样本模块304,被配置为根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;
模型训练模块306,被配置为通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;
上传模型参数模块308,被配置为将所述模型更新参数上传至所述服务端;
接收模型模块310,被配置为接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
可选的,所述风险模型训练装置,还包括:
接收迭代标签库模块,被配置为接收所述服务端下发的迭代风险标签;
生成迭代样本模块,被配置为根据所述风险标签库与所述迭代风险标签,对迭代用户历史行为数据以及所述用户历史行为数据进行打标生成迭代训练样本,将所述迭代风险标签更新至所述风险标签库中,将所述迭代用户历史行为数据更新至所述用户历史行为数据中;
第二模型训练模块,被配置为通过所述迭代训练样本对前一次接收到的聚合风险模型进行模型训练,获得前一次接收到的聚合风险模型的模型迭代参数;
上传迭代参数模块,被配置为将所述模型迭代参数上传至所述服务端;
第二接收模块,被配置为接收所述服务端根据所述模型迭代参数进行聚合确定的聚合风险模型;
第一判断标签模块,被配置为判断是否存在所述服务端下发的聚合风险模型对应的收敛标签;
若否,返回运行所述接收迭代标签库模块。
可选的,若所述第一判断标签模块输出的判断结果为是,运行如下模块:
第一预测模块,被配置为将所述聚合风险模型作为目标风险模型,并将采集到的用户行为数据输入所述目标风险模型进行风险预测;
第一结果上传模块,被配置为将所述目标风险模型输出的预测结果上传至所述服务端。
可选的,所述风险模型训练装置,还包括:
第二判断标签模块,被配置为判断是否存在所述服务端下发的聚合风险模型对应的收敛标签;
若是,运行第二预测模块,所述第二预测模块,被配置为将所述聚合风险模型作为目标风险模型,并将采集到的用户行为数据输入所述目标风险模型进行风险预测;
第二结果上传模块,被配置为将所述目标风险模型输出的预测结果上传至所述服务端。
可选的,所述生成样本模块304,包括:
打标报案数据子模块,被配置为将所述用户历史行为数据中的用户报案数据,按照所述风险标签库进行打标;
打标未报案数据子模块,被配置为将所述用户历史行为数据中的非用户报案数据作为非风险数据进行打标,将打标后的非用户报案数据以及打标后的用户报案数据作为所述训练样本。
上述为本实施例的一种风险模型训练装置的示意性方案。需要说明的是,该风险模型训练装置的技术方案与上述的风险模型训练方法的技术方案属于同一构思,风险模型训练装置的技术方案未详细描述的细节内容,均可以参见上述风险模型训练方法的技术方案的描述。
图4示出了根据本说明书一个实施例提供的另一种风险模型训练方法的流程图,包括步骤S402至步骤S408。
步骤S402,向多个针对训练风险模型进行模型训练的终端下发风险标签库。
本实施例的执行主体是服务端,与上述说明书一个实施例的执行主体终端相配合对目标风险模型以迭代的方式进行模型训练。
实际应用中,服务端通过对用户报案数据进行审理,获得审理结果,并根据审理结果创建风险标签库,具体如上述表1所示,并根据此风险标签库中的设备标识,将风险标签库下发至多个终端,用于对各个终端的用户历史行为数据进行打标,在各个终端生成对训练风险模型进行模型训练的训练样本。
可选的,所述用户报案数据,包括:用户交易报案数据;
相应的,所述风险标签库采用如下方式进行创建:
根据针对所述用户交易报案数据的审理结果对所述用户交易报案数据进行打标;
根据已打标的用户交易报案数据中包含的交易标识、设备标识以及标签标识,生成所述风险标签库。
具体实施时,根据用户交易报案数据的审理结果对用户交易报案数据进行打标,而针对用户交易报案数据的标签标识可以有两种,一种为盗用交易,可以以1表示,另一种为非盗用交易,可以以0表示;
将已打标的用户交易报案数据中包含的交易标识、设备标识以及标签标识生成风险标签库,具体如上述表1所示,在此不再赘述。
本说明书实施例,在服务端根据对用户交易报案数据进行审理的审理结果对用户交易报案数据进行打标,并进一步根据打标的标签标识创建风险标签库,以便后续根据风险标签库对用户历史行为数据进行打标,生成训练样本,既可以保证创建的风险标签库的准确性,还可以在每一次对风险模型进行迭代模型训练时,通过不断增加的用户报案数据,更新风险标签,进而保证根据风险标签打标的训练样本不断被更新和扩充。
步骤S404,接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数。
具体实施时,服务端将创建的风险标签库下发至各个终端,各个终端根据风险标签库对用户历史行为数据进行打标,生成针对训练风险模型进行模型训练的训练样本,然后各个终端通过训练样本对训练风险模型进行模型训练,将模型训练获得的模型更新参数上传至服务端,服务端接收从各个终端上传的模型更新参数。
步骤S406,将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型。
具体实施时,由于各个终端上传的是模型更新参数,而不是用户历史行为数据,在一定程度上保护了用户的数据隐私,但是仍有一些研究表明,可以根据模型参数反推出输入数据,然而服务端只需要对模型更新参数聚合后的聚合模型参数,而不需要知道具体的模型更新参数,因此可以引入差分隐私技术进一步保护用户的数据隐私。
实际应用中,将模型更新参数聚合的方式是多种多样的,本说明书实施例提供的一种可选实施方式中,所述将所述模型更新参数聚合为聚合模型参数,具体采用如下方式实现:
将所述模型更新参数加权后进行求和,获得所述聚合模型参数。
具体实施时,可以将各个终端上传的模型更新参数可以参照训练样本的数量的不同对各个模型更新参数附加不同的权重,再将加权后的各个模型更新参数进行求和,获得聚合模型参数;此外还有其他对模型更新参数加权的方式,在此不做限制。
本说明书实施例,通过将模型更新参数加权求和的方式,将各个终端对训练风险模型进行模型训练的模型更新参数聚合为聚合模型参数,为聚合风险模型提供了模型参数。
进一步,本说明书实施例提供的一种可选实施方式中,所述将所述模型更新参数聚合为聚合模型参数,具体采用如下方式实现:
分别计算所述各个终端中参与所述模型训练的训练样本的数量与所述训练样本的数量之和的比值;
将所述各个终端的比值与对应的模型更新参数的乘积之和,作为聚合模型参数。
实际应用中,由于在终端上参与模型训练的训练样本的数量越多,对服务端的聚合风险模型的贡献越大,因此可以分别计算各个终端中参与模型训练的训练样本的数量,与本轮所有参与模型训的训练样本的数量之和的比值,将这些比值作为其对应训练风险模型的模型更新参数的权重,计算这些比值与其对应的训练风险模型的模型更新参数的乘积,并将这些乘积之和作为聚合模型参数。
本说明书实施例,通过将各个终端中参与所述模型训练的训练样本的数量与所述训练样本的数量之和的比值与其对应的模型更新参数的乘积之和作为聚合模型参数,提高了聚合模型参数的准确性。
本说明书实施例提供的一种可选实施方式中,所述将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型步骤执行之后,并所述将所述聚合风险模型下发至所述各个终端步骤执行之前,还包括:
判断所述聚合风险模型是否满足收敛条件;
若是,针对所述聚合风险模型添加对应的收敛标签。
所述收敛条件包括:聚合风险模型的损失函数的值小于预设误差值、聚合模型参数与训练风险模型的模型参数的变化小于变化阈值等,在此不做限制。
若所述聚合风险模型满足收敛条件,表明此聚合风险模型已经收敛,不必再对此聚合风险模型进行模型训练,则针对此聚合风险模型添加对应的收敛标签,以便终端接收到服务端下发的此聚合风险模型后,可以将此聚合风险模型作为目标风险模型,具体的,目标风险模型用于在终端对采集到的用户行为数据进行风险预测。
本说明书实施例,在获得聚合风险模型后,判断此聚合风险模型是否满足收敛条件,若是,表明此聚合风险模型已经收敛,并针对此聚合风险模型添加对应的收敛标签,以此标签向接收此聚合风险模型的终端表明不再需要对聚合风险模型进行模型训练,也表明此聚合风险模型可以作为目标风险模型对采集到的用户行为数据进行风险预测。
步骤S408,将所述聚合风险模型下发至所述终端。
实际应用中,服务端将聚合风险模型下发至各个终端,终端需要对接收到的聚合风险模型持续进行模型训练,即模型迭代,本说明书实施例提供的一种可选实施方式中,所述将所述聚合风险模型下发至所述各个终端步骤执行之后,还包括:
1)向所述各个终端下发迭代风险标签。
具体实施时,将聚合风险模型下发至各个终端后,接着向终端下发迭代风险标签,实际应用中,此迭代风险标签可以是根据是前一次下发风险标签到这一次下发风险标签之间新增的用户报案数据的审理结果更新的风险标签,即迭代风险标签,表明即将对聚合风险模型进行新一轮的模型训练。
2)接收所述各个终端针对前一次下发的聚合风险模型进行模型训练后上传的模型迭代参数。
具体的,此上传的模型迭代参数在终端的更新过程在上述实施例中已经记述,在此不再赘述。
3)将所述模型迭代参数聚合为聚合模型迭代参数,并根据所述聚合模型迭代参数对所述前一次下发的聚合风险模型进行更新。
具体的,将模型迭代参数聚合为聚合模型参数可通过如下公式计算获得:
Figure BDA0002304900140000321
其中,k是参与模型训练的终端数量,N是参与模型训练的所有训练样本的数量;nk是第k个终端上参与模型训练的训练样本的数量,
Figure BDA0002304900140000322
是第k个终端在t+1轮模型训练的模型迭代参数。
4)判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件;
若否,表明此聚合风险模型没有收敛,向所述各个终端下发对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型,并返回执行步骤1)。
所述收敛条件包括下述至少一项:聚合风险模型的损失函数的值小于预设误差值、聚合模型迭代参数与前一次聚合的聚合模型迭代参数的变化小于变化阈值、对聚合风险模型的迭代次数超过预设迭代次数,在此不做限制。
具体实施时,判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件的判断结果为否,则表明此聚合风险模型没有收敛,还需要继续向终端下发聚合风险模型,并对下发的聚合风险模型在终端进行模型训练,则返回执行步骤1)对下发的聚合风险模型进行下一轮的模型训练。并在下一次确定的聚合风险模型没有满足收敛条件的情况下,循环执行步骤1)至步骤6)直至获得的聚合收敛模型满足收敛条件。
本说明书实施例,通过判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件,决定是否需要终端继续对获得的聚合风险模型进行模型训练,在需要继续进行模型训练的情况下,下发更新的迭代风险标签,并对各个终端上传的模型迭代参数进行聚合,以配合终端多次进行模型训练,直至在服务端获得的聚合风险模型满足收敛条件,并使服务端对大量终端分别进行模型训练上传的模型迭代参数聚合为聚合模型迭代参数,且通过此聚合模型迭代参数更新聚合风险模型,实现了服务端和终端配合对风险模型进行迭代。
此外,本说明书实施例提供的一种可选实施方式中,若所述判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件的判断结果为是,执行如下操作:
针对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型添加对应的收敛标签;
将对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型下发至所述各个终端;
接收所述各个终端中任一终端通过对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型对采集到的用户行为数据进行风险预测的预测结果;
根据所述预测结果,确定针对所述任一终端进行风险防控施行的风险防控措施。
实际应用中,判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件的判断结果为是,表明此聚合风险模型已经收敛,不需要在对此聚合风险模型进行模型训练,则针对此聚合风险模型添加收敛标签,以便接收此聚合风险模型的各个终端可以通过判断是否存在此聚合风险模型对应的收敛标签,决定是否将此聚合风险模型作为目标风险模型,对用户行为数据进风险预测。
在针对获得的聚合风险模型添加收敛标签后,服务端将此聚合风险模型下发至各个终端,任一终端在接收到聚合风险模型后,会判断是否存在此聚合风险模型对应的收敛标签,若是,通过此聚合风险模型对采集到的用户行为数据进行风险预测,并将风险预测的预测结果上传至服务端,服务端在接收到任一终端上传的预测结果之后,会根据预测结果,确定针对这一终端进行风险防控的风险防控措施。
具体的,预测结果可以是百分比或者分数值,将预测结果按照百分比或者分数值划分不同的预测区间,针对不同的预测区间分别对应不同的风险防控措施;此外,还可以将不同预测结果对应不同的风险等级,不同的风险等级对应不同的风险防控措施,在此不做限制。
本说明书实施例,通过判断确定前一次下发的聚合风险模型进行更新后获得的聚合风险模型满足收敛条件后,针对此风险聚合模型添加对应的收敛标签,并将添加收敛标签的风险聚合模型下发至各个终端,而终端在判断存在服务端下发的风险聚合模型对应的收敛标签后,则可通过此风险聚合模型分别对各自采集到的用户行为数据进行风险预测,而服务端接收风险预测的预测结果,并针对预测结果确定进行风险防控施行的风险防控措施,实现了在终端进行风险预测,在服务端施行进行风险防控措施,避免了将用户行为数据上传服务端的传输压力,也避免了因获取用户行为数据而造成对用户隐私的侵犯,还减少了在服务端对用户行为数据进行风险预测的压力。
在上述步骤S406中获得的聚合风险模型满足收敛条件的基础上,本说明书实施例提供的一种可选实施方式中,所述将所述聚合风险模型下发至所述各个终端步骤执行之后,还包括:
接收所述各个终端中任一终端通过所述聚合风险模型对采集到的用户行为数据进行风险预测的预测结果;
根据所述预测结果,确定针对所述任一终端进行风险防控施行的风险防控措施。
具体实施时,在上述步骤S406中获得聚合风险模型满足收敛条件的基础上,将此聚合收敛模型下发至各个终端,各个终端通过下发的聚合收敛模型对采集到的用户行为数据进行风险预测,并风险预测的预测结果上传至服务端,服务端根据预测结果,确定对终端施行的风险防控措施,其具体实现与上述实施例的具体实现类似,参照上述实施例即可,在此不再赘述。
本说明书实施例,实现了在终端对采集到的用户行为数据进行风险预测,在服务端根据各个终端中任一终端进行风险预测的预测结果确定进行风险防控施行的风险防控措施,避免了将用户行为数据上传服务端的传输压力,也避免了因获取用户行为数据而造成对用户隐私的侵犯,还减少了在服务端对用户行为数据进行风险预测的压力。
下述结合附图5,以本说明书提供的另一种风险模型训练方法在云端的应用为例,对所述风险模型训练方法进行进一步说明。其中,图5示出了本说明书一个实施例提供的另一种应用于云端的风险模型训练方法的处理流程图,具体步骤包括步骤S502至步骤S524。
步骤S502,向多个针对训练风险模型进行模型训练的智能手机下发风险标签库。
具体的,所述风险标签库,可以是根据用户报案数据的审理结果创建的。
步骤S504,接收各个智能手机针对所述训练风险模型进行模型训练后上传的模型更新参数。
步骤S506,将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型。
步骤S508,将所述聚合风险模型下发至所述各个智能手机。
步骤S510,向所述各个智能手机下发迭代风险标签。
具体的,迭代风险标签,可以是根据迭代用户报案数据的审理结果更新的。
步骤S512,接收所述各个智能手机针对前一次下发的聚合风险模型进行模型训练后上传的模型迭代参数。
步骤S514,将所述模型迭代参数聚合为聚合模型迭代参数,并根据所述聚合模型迭代参数对所述前一次下发的聚合风险模型进行更新。
步骤S516,判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件;
若是,执行下述步骤S518;
若否,返回执行上述步骤S510。
步骤S518,针对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型添加对应的收敛标签。
步骤S520,将对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型下发至所述各个智能手机。
步骤S522,接收所述各个智能手机中任一智能手机通过对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型对采集到的用户行为数据进行风险预测的预测结果。
步骤S524,根据所述预测结果,确定针对所述任一智能手机进行风险防控施行的风险防控措施。
综上所述,本说明书另一个实施例实现了,通过云端向多个智能手机下发风险标签库,将各个智能手机针对训练风险模型进行模型训练后上传的模型更新参数聚合为聚合模型参数,根据聚合模型参数更新训练风险模型,并将更新后获得的聚合风险模型下发至各个智能手机,实现了为智能手机提供针对用户历史行为数据进行打标的风险标签库,在用户历史行为数据不上传到云端的基础上,协助大量智能手机共同训练一个训练风险模型,既保护了用户的数据隐私,也减少了将用户行为数据上传到云端的传输压力,以及云端的存储压力。
本说明书提供的另一种风险模型训练装置实施例如下:
与上述方法实施例相对应,本说明书还提供了风险模型训练装置实施例,图6示出了本说明书一个实施例提供的另一种风险模型训练装置的结构示意图。如图6所示,该装置包括:
下发标签库模块602,被配置为向多个针对训练风险模型进行模型训练的终端下发风险标签库;
接收参数模块604,被配置为接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;
更新模型模块606,被配置为将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型;
下发模型模块608,被配置为将所述聚合风险模型下发至所述各个终端。
可选的,所述风险模型训练装置,还包括:
下发迭代标签模块,被配置为向所述各个终端下发迭代风险标签;
接收迭代参数模块,被配置为接收所述各个终端针对前一次下发的聚合风险模型进行模型训练后上传的模型迭代参数;
第二模型更新模块,被配置为将所述模型迭代参数聚合为聚合模型迭代参数,并根据所述聚合模型迭代参数对所述前一次下发的聚合风险模型进行更新;
第一判断条件模块,被配置为判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件;
若否,运行第二下发模型模块,所述第二下发模型模块,被配置为向所述各个终端下发对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型,并返回执行所述向所述各个终端下发迭代风险标签步骤。
可选的,若所述第一判断条件模块输出的判断结果为是,运行如下模块:
第一添加标签模块,被配置为针对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型添加对应的收敛标签;
第三下发模型模块,被配置为将对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型下发至所述各个终端;
第一接收结果模块,被配置为接收所述各个终端中任一终端通过对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型对采集到的用户行为数据进行风险预测的预测结果;
第一确定措施模块,被配置为根据所述预测结果,确定针对所述任一终端进行风险防控施行的风险防控措施。
可选的,所述风险模型训练装置,还包括:
第二判断条件模块,被配置为判断所述聚合风险模型是否满足收敛条件;
若是,运行第二添加标签模块,所述第二添加标签模块,被配置为针对所述聚合风险模型添加对应的收敛标签。
可选的,所述风险模型训练装置,还包括:
第二接收结果模块,被配置为接收所述各个终端中任一终端通过所述聚合风险模型对采集到的用户行为数据进行风险预测的预测结果;
第二确定措施模块,被配置为根据所述预测结果,确定针对所述任一终端进行风险防控施行的风险防控措施。
可选的,所述用户报案数据,包括:用户交易报案数据;
相应的,所述风险标签库通过运行如下子模块进行创建:
打标子模块,被配置为根据针对所述用户交易报案数据的审理结果对所述用户交易报案数据进行打标;
生成标签库子模块,被配置为根据已打标的用户交易报案数据中包含的交易标识、设备标识以及标签标识,生成所述风险标签库。
可选的,所述更新模型模块606,还被配置为将所述模型更新参数加权后进行求和,获得所述聚合模型参数。
可选的,所述更新模型模块606,还被配置为分别计算所述各个终端中参与所述模型训练的训练样本的数量与所述训练样本的数量之和的比值;将所述各个终端的比值与对应的模型更新参数的乘积之和,作为聚合模型参数。
上述为本实施例的另一种风险模型训练装置的示意性方案。需要说明的是,该风险模型训练装置的技术方案与上述的风险模型训练方法的技术方案属于同一构思,风险模型训练装置的技术方案未详细描述的细节内容,均可以参见上述风险模型训练方法的技术方案的描述。
本说明书提供的一种计算设备实施例如下:
图7示出了根据本说明书一个实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
本说明书提供一种计算设备,包括存储器710、处理器720及存储在存储器上并可在处理器上运行的计算机指令,所述处理器720用于执行如下计算机可执行指令:
接收服务端下发的风险标签库;
根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;
通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;
将所述模型更新参数上传至所述服务端;
接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的一种风险模型训练方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述一种风险模型训练方法的技术方案的描述。
本说明书提供的另一种计算设备实施例如下:
图8示出了根据本说明书一个实施例提供的另一种计算设备800的结构框图。该计算设备800的部件包括但不限于存储器810和处理器820。处理器820与存储器810通过总线830相连接,数据库850用于保存数据。
计算设备800还包括接入设备840,接入设备840使得计算设备800能够经由一个或多个网络860通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备840可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备800的上述部件以及图8中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图8所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备800可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备800还可以是移动式或静止式的服务器。
本说明书提供另一种计算设备,包括存储器810、处理器820及存储在存储器上并可在处理器上运行的计算机指令,所述处理器820用于执行如下计算机可执行指令:
向多个针对训练风险模型进行模型训练的终端下发风险标签库;
接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;
将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型;
将所述聚合风险模型下发至所述各个终端。
上述为本实施例的另一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的另一种风险模型训练方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述另一种风险模型训练方法的技术方案的描述。
本说明书提供的一种计算机可读存储介质实施例如下:
本说明书提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
接收服务端下发的风险标签库;
根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;
通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;
将所述模型更新参数上传至所述服务端;
接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的一种风险模型训练方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述一种风险模型训练方法的技术方案的描述。
本说明书提供的另一种计算机可读存储介质实施例如下:
本说明书提供另一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
向多个针对训练风险模型进行模型训练的终端下发风险标签库;
接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;
将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型;
将所述聚合风险模型下发至所述各个终端。
上述为本实施例的另一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的另一种风险模型训练方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述另一种风险模型训练方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (19)

1.一种风险模型训练方法,包括:
接收服务端下发的风险标签库;
根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;
通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;
将所述模型更新参数上传至所述服务端;
接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
2.根据权利要求1所述的风险模型训练方法,所述接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型步骤执行之后,还包括:
接收所述服务端下发的迭代风险标签;
根据所述风险标签库与所述迭代风险标签,对迭代用户历史行为数据以及所述用户历史行为数据进行打标生成迭代训练样本,将所述迭代风险标签更新至所述风险标签库中,将所述迭代用户历史行为数据更新至所述用户历史行为数据中;
通过所述迭代训练样本对前一次接收到的聚合风险模型进行模型训练,获得前一次接收到的聚合风险模型的模型迭代参数;
将所述模型迭代参数上传至所述服务端;
接收所述服务端根据所述模型迭代参数进行聚合确定的聚合风险模型;
判断是否存在所述服务端下发的聚合风险模型对应的收敛标签;
若否,返回执行接收所述服务端下发的迭代风险标签步骤。
3.根据权利要求2所述的风险模型训练方法,若所述判断是否存在所述服务端下发的聚合风险模型对应的收敛标签的判断结果为是,执行如下操作:
将所述聚合风险模型作为目标风险模型,并将采集到的用户行为数据输入所述目标风险模型进行风险预测;
将所述目标风险模型输出的预测结果上传至所述服务端。
4.根据权利要求1所述的风险模型训练方法,所述接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型步骤执行之后,还包括:
判断是否存在所述服务端下发的聚合风险模型对应的收敛标签;
若是,将所述聚合风险模型作为目标风险模型,并将采集到的用户行为数据输入所述目标风险模型进行风险预测;
将所述目标风险模型输出的预测结果上传至所述服务端。
5.根据权利要求1所述的风险模型训练方法,所述根据所述风险标签库,对用户历史行为数据进行打标生成训练样本,包括:
将所述用户历史行为数据中的用户报案数据,按照所述风险标签库进行打标;
将所述用户历史行为数据中的非用户报案数据作为非风险数据进行打标,将打标后的非用户报案数据以及打标后的用户报案数据作为所述训练样本。
6.一种风险模型训练装置,包括:
接收标签库模块,被配置为接收服务端下发的风险标签库;
生成样本模块,被配置为根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;
模型训练模块,被配置为通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;
上传模型参数模块,被配置为将所述模型更新参数上传至所述服务端;
接收模型模块,被配置为接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
7.一种风险模型训练方法,包括:
向多个针对训练风险模型进行模型训练的终端下发风险标签库;
接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;
将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型;
将所述聚合风险模型下发至所述各个终端。
8.根据权利要求7所述的风险模型训练方法,所述将所述聚合风险模型下发至所述各个终端步骤执行之后,还包括:
向所述各个终端下发迭代风险标签;
接收所述各个终端针对前一次下发的聚合风险模型进行模型训练后上传的模型迭代参数;
将所述模型迭代参数聚合为聚合模型迭代参数,并根据所述聚合模型迭代参数对所述前一次下发的聚合风险模型进行更新;
判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件;
若否,向所述各个终端下发对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型,并返回执行所述向所述各个终端下发迭代风险标签步骤。
9.根据权利要求8所述的风险模型训练方法,若所述判断对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型是否满足收敛条件的判断结果为是,执行如下操作:
针对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型添加对应的收敛标签;
将对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型下发至所述各个终端;
接收所述各个终端中任一终端通过对所述前一次下发的聚合风险模型进行更新后获得的聚合风险模型对采集到的用户行为数据进行风险预测的预测结果;
根据所述预测结果,确定针对所述任一终端进行风险防控施行的风险防控措施。
10.根据权利要求7所述的风险模型训练方法,所述将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型步骤执行之后,并所述将所述聚合风险模型下发至所述各个终端步骤执行之前,还包括:
判断所述聚合风险模型是否满足收敛条件;
若是,针对所述聚合风险模型添加对应的收敛标签。
11.根据权利要求10所述的风险模型训练方法,所述将所述聚合风险模型下发至所述各个终端步骤执行之后,还包括:
接收所述各个终端中任一终端通过所述聚合风险模型对采集到的用户行为数据进行风险预测的预测结果;
根据所述预测结果,确定针对所述任一终端进行风险防控施行的风险防控措施。
12.根据权利要求7所述的风险模型训练方法,所述用户报案数据,包括:用户交易报案数据;
相应的,所述风险标签库采用如下方式进行创建:
根据针对用户交易报案数据的审理结果对所述用户交易报案数据进行打标;
根据已打标的用户交易报案数据中包含的交易标识、设备标识以及标签标识,生成所述风险标签库。
13.根据权利要求7所述的风险模型训练方法,所述将所述模型更新参数聚合为聚合模型参数,包括:
将所述模型更新参数加权后进行求和,获得所述聚合模型参数。
14.根据权利要求7所述的风险模型训练方法,所述将所述模型更新参数聚合为聚合模型参数,包括:
分别计算所述各个终端中参与所述模型训练的训练样本的数量与所述训练样本的数量之和的比值;
将所述各个终端的比值与对应的模型更新参数的乘积之和,作为聚合模型参数。
15.一种风险模型训练装置,包括:
下发标签库模块,被配置为向多个针对训练风险模型进行模型训练的终端下发风险标签库;
接收参数模块,被配置为接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;
更新模型模块,被配置为将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,获得聚合风险模型;
下发模型模块,被配置为将所述聚合风险模型下发至所述各个终端。
16.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
接收服务端下发的风险标签库;
根据所述风险标签库,对用户历史行为数据进行打标生成训练样本;
通过所述训练样本对所述服务端下发的训练风险模型进行模型训练,获得所述训练风险模型的模型更新参数;
将所述模型更新参数上传至所述服务端;
接收所述服务端根据所述模型更新参数进行聚合确定的聚合风险模型。
17.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
向多个针对训练风险模型进行模型训练的终端下发风险标签库;
接收各个终端针对所述训练风险模型进行模型训练后上传的模型更新参数;
将所述模型更新参数聚合为聚合模型参数,并根据所述聚合模型参数对所述训练风险模型进行更新,更新后获得聚合风险模型;
将所述聚合风险模型下发至所述各个终端。
18.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求1至5任意一项所述风险模型训练方法的步骤。
19.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求7至14任意一项所述风险模型训练方法的步骤。
CN201911236044.3A 2019-12-05 2019-12-05 风险模型训练方法以及装置 Active CN110991905B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911236044.3A CN110991905B (zh) 2019-12-05 2019-12-05 风险模型训练方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911236044.3A CN110991905B (zh) 2019-12-05 2019-12-05 风险模型训练方法以及装置

Publications (2)

Publication Number Publication Date
CN110991905A true CN110991905A (zh) 2020-04-10
CN110991905B CN110991905B (zh) 2022-05-13

Family

ID=70090445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911236044.3A Active CN110991905B (zh) 2019-12-05 2019-12-05 风险模型训练方法以及装置

Country Status (1)

Country Link
CN (1) CN110991905B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111553488A (zh) * 2020-07-10 2020-08-18 支付宝(杭州)信息技术有限公司 一种针对用户行为的风险识别模型训练方法及系统
CN111986804A (zh) * 2020-08-31 2020-11-24 平安医疗健康管理股份有限公司 基于体温数据进行模型训练的方法、装置和计算机设备
CN112115975A (zh) * 2020-08-18 2020-12-22 山东信通电子股份有限公司 一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备
CN112182592A (zh) * 2020-12-01 2021-01-05 蚂蚁智信(杭州)信息技术有限公司 规则集的安全性的确定和处理方法、装置
CN112784219A (zh) * 2021-02-08 2021-05-11 北京淇瑀信息科技有限公司 基于app指数的用户风险预测方法、装置及电子设备
CN112906903A (zh) * 2021-01-11 2021-06-04 北京源堡科技有限公司 网络安全风险预测方法、装置、存储介质及计算机设备
CN113837638A (zh) * 2021-09-29 2021-12-24 支付宝(杭州)信息技术有限公司 话术确定方法、装置及设备
CN113836566A (zh) * 2021-11-26 2021-12-24 腾讯科技(深圳)有限公司 基于区块链系统的模型处理方法及装置、设备、介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108418825A (zh) * 2018-03-16 2018-08-17 阿里巴巴集团控股有限公司 风险模型训练、垃圾账号检测方法、装置以及设备
US20180285773A1 (en) * 2017-03-31 2018-10-04 Intuit Inc. Composite machine-learning system for label prediction and training data collection
CN109242499A (zh) * 2018-09-19 2019-01-18 中国银行股份有限公司 一种交易风险预测的处理方法、装置及系统
US20190258715A1 (en) * 2018-02-20 2019-08-22 Pearson Education, Inc. Systems and methods for automated machine learning model training for a custom authored prompt
CN110298185A (zh) * 2019-06-28 2019-10-01 北京金山安全软件有限公司 一种模型训练方法、装置、电子设备及存储介质
CN110399742A (zh) * 2019-07-29 2019-11-01 深圳前海微众银行股份有限公司 一种联邦迁移学习模型的训练、预测方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180285773A1 (en) * 2017-03-31 2018-10-04 Intuit Inc. Composite machine-learning system for label prediction and training data collection
US20190258715A1 (en) * 2018-02-20 2019-08-22 Pearson Education, Inc. Systems and methods for automated machine learning model training for a custom authored prompt
CN108418825A (zh) * 2018-03-16 2018-08-17 阿里巴巴集团控股有限公司 风险模型训练、垃圾账号检测方法、装置以及设备
CN109242499A (zh) * 2018-09-19 2019-01-18 中国银行股份有限公司 一种交易风险预测的处理方法、装置及系统
CN110298185A (zh) * 2019-06-28 2019-10-01 北京金山安全软件有限公司 一种模型训练方法、装置、电子设备及存储介质
CN110399742A (zh) * 2019-07-29 2019-11-01 深圳前海微众银行股份有限公司 一种联邦迁移学习模型的训练、预测方法及装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111553488A (zh) * 2020-07-10 2020-08-18 支付宝(杭州)信息技术有限公司 一种针对用户行为的风险识别模型训练方法及系统
CN111553488B (zh) * 2020-07-10 2020-10-20 支付宝(杭州)信息技术有限公司 一种针对用户行为的风险识别模型训练方法及系统
CN112115975A (zh) * 2020-08-18 2020-12-22 山东信通电子股份有限公司 一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备
CN112115975B (zh) * 2020-08-18 2024-04-12 山东信通电子股份有限公司 一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备
CN111986804A (zh) * 2020-08-31 2020-11-24 平安医疗健康管理股份有限公司 基于体温数据进行模型训练的方法、装置和计算机设备
CN112182592A (zh) * 2020-12-01 2021-01-05 蚂蚁智信(杭州)信息技术有限公司 规则集的安全性的确定和处理方法、装置
CN112906903A (zh) * 2021-01-11 2021-06-04 北京源堡科技有限公司 网络安全风险预测方法、装置、存储介质及计算机设备
CN112906903B (zh) * 2021-01-11 2024-02-09 北京源堡科技有限公司 网络安全风险预测方法、装置、存储介质及计算机设备
CN112784219B (zh) * 2021-02-08 2023-12-22 北京淇瑀信息科技有限公司 基于app指数的用户风险预测方法、装置及电子设备
CN112784219A (zh) * 2021-02-08 2021-05-11 北京淇瑀信息科技有限公司 基于app指数的用户风险预测方法、装置及电子设备
CN113837638A (zh) * 2021-09-29 2021-12-24 支付宝(杭州)信息技术有限公司 话术确定方法、装置及设备
CN113837638B (zh) * 2021-09-29 2024-04-26 支付宝(杭州)信息技术有限公司 话术确定方法、装置及设备
CN113836566A (zh) * 2021-11-26 2021-12-24 腾讯科技(深圳)有限公司 基于区块链系统的模型处理方法及装置、设备、介质
CN113836566B (zh) * 2021-11-26 2022-03-29 腾讯科技(深圳)有限公司 基于区块链系统的模型处理方法及装置、设备、介质

Also Published As

Publication number Publication date
CN110991905B (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN110991905B (zh) 风险模型训练方法以及装置
Nikravesh et al. Mobile network traffic prediction using MLP, MLPWD, and SVM
CN109922032B (zh) 用于确定登录账户的风险的方法、装置、设备及存储介质
Li et al. Intrusion detection system using Online Sequence Extreme Learning Machine (OS-ELM) in advanced metering infrastructure of smart grid
US20210374617A1 (en) Methods and systems for horizontal federated learning using non-iid data
CN110796399B (zh) 基于区块链的资源分配方法以及装置
CN112785086A (zh) 信贷逾期风险预测方法及装置
CN116647411B (zh) 游戏平台网络安全的监测预警方法
CN112039702B (zh) 基于联邦学习和相互学习的模型参数训练方法及装置
KR102086936B1 (ko) 사용자 데이터 공유 방법 및 디바이스
CN113934983A (zh) 一种特征变量的分析方法、装置、计算机设备及存储介质
Han et al. Data valuation for vertical federated learning: An information-theoretic approach
Liu et al. AGRM: attention-based graph representation model for telecom fraud detection
CN112926984B (zh) 基于区块链安全大数据的信息预测方法及区块链服务系统
Krundyshev et al. The security risk analysis methodology for smart network environments
CN113792892A (zh) 联邦学习建模优化方法、设备、可读存储介质及程序产品
CN110796450B (zh) 可信关系处理方法以及装置
CN112529102B (zh) 特征拓展方法、设备、介质及计算机程序产品
CN115859187A (zh) 对象识别方法、装置、电子设备及存储介质
Ageyev et al. Traffic Abnormality Detection ML-based Method for IoT
CN109063721A (zh) 一种行为特征数据提取的方法及装置
CN113946758B (zh) 一种数据识别方法、装置、设备及可读存储介质
Christian et al. Network Traffic Prediction Of Mobile Backhaul Capacity Using Time Series Forecasting
CN117077816B (zh) 联邦模型的训练方法及系统
Jiao et al. Semi-Supervised Malware Traffic Classification Via Consistency Regularization and Pseudo-Labeling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40026950

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant