CN116011815A - 一种模型训练的方法、装置、电子设备及存储介质 - Google Patents
一种模型训练的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116011815A CN116011815A CN202211740294.2A CN202211740294A CN116011815A CN 116011815 A CN116011815 A CN 116011815A CN 202211740294 A CN202211740294 A CN 202211740294A CN 116011815 A CN116011815 A CN 116011815A
- Authority
- CN
- China
- Prior art keywords
- wind control
- training
- model
- user
- edge node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书公开了一种模型训练的方法、装置、电子设备及存储介质,可以提高风控的准确性,保护隐私数据,边缘节点可以获取训练样本,其中,不同边缘节点属于不同业务提供方,而后,可以根据训练样本对本地的风控模型进行训练,得到对风控模型更新的梯度信息,并将更新的梯度信息上传到中心服务器,以使中心服务器根据该边缘节点上传的梯度信息以及其他边缘节点上传的梯度信息,对中心服务器本地的风控模型进行模型参数更新,得到更新后的参数并返回给边缘节点,最后,根据接收到的中心服务器发送的更新后的参数,对边缘节点本地的风控模型进行更新,其中,边缘节点本地的风控模型在训练完成后可以用于对边缘节点所属业务提供方下的用户进行风控。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及一种模型训练的方法、装置、电子设备及存储介质。
背景技术
为了保护用户的信息安全以及避免为用户提供业务的业务提供方的损失,业务提供方可以对用户进行风控。
在实际应用中,业务提供方可以根据用户历史上所执行的业务是否存在风险的情况,来训练风控模型,从而通过训练后的风控模型对用户进行风控。但是,业务提供方通常只能通过自身的训练样本来训练风控模型,这种方式存在训练样本少以及训练样本的类别较少的问题,致使通过这种方式训练出的风控模型无法有效地对用户进行业务风控。
发明内容
本说明书提供一种模型训练的方法、装置、电子设备及存储介质,以提高对用户进行风控的准确性,并且,可以提高数据的安全性。
本说明书采用下述技术方案:
本说明书提供一种模型训练的方法,包括:
边缘节点获取训练样本,其中,不同边缘节点所获取到的训练样本不完全相同;
根据所述训练样本对部署在所述边缘节点本地的风控模型进行训练,得到对所述风控模型训练所产生的梯度信息;
将所述梯度信息上传到中心服务器,以使所述中心服务器根据所述边缘节点上传的所述梯度信息以及其他边缘节点上传的梯度信息,对所述中心服务器本地部署的风控模型进行模型参数更新,得到更新后参数,并将所述更新后参数返回给各边缘节点,所述中心服务器和各边缘节点各自部署的风控模型不完全相同;
接收所述中心服务器发送的所述更新后参数;
从所述更新后参数中筛选出所述边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对所述边缘节点本地的风控模型进行更新,所述预设网络层为所述中心服务器和各边缘节点部署的各风控模型中的公共网络层,所述边缘节点本地的风控模型在训练完成后用于对所述边缘节点所属业务提供方下的用户进行业务风控。
可选地,获取训练样本,具体包括:
获取各用户的历史业务记录以及用户相关信息,所述用户相关信息包括用户标识信息、用户设备信息、用户历史行为信息以及历史核验信息;
针对每个用户,根据该用户的历史业务记录,确定该用户的用户标签,所述用户标签用于表示用户的历史上执行的业务是否存在风险;
根据所述各用户的用户相关信息以及用户标签,构建训练样本。
可选地,所述用户设备信息包括用户登录环境信息以及用户设备型号,所述历史核验信息用于表示用户历史上进行身份核验的情况。
可选地,根据所述训练样本对部署在所述边缘节点本地的风控模型进行训练,包括:
确定所述训练样本中的样本数据的数据维度数量;
判断所述数据维度数量是否低于预设维度数;
若是,对所述样本数据进行补充,以使补充后的样本数据的数据维度数量达到所述预设维度数;
根据所述补充后的样本数据,对部署在所述边缘节点本地的风控模型进行训练。
可选地,还包括:
接收用户的业务请求;
根据所述业务请求,确定所述用户的用户相关信息;
将所述用户相关信息输入到训练后的风控模型中,得到所述用户的风险预测结果;
根据所述风险预测结果,对所述用户请求的业务进行业务风控。
本说明书提供一种模型训练的方法,包括:
中心服务器获取各边缘节点上传的梯度信息,其中,不同边缘节点属于不同业务提供方,针对每个边缘节点,该边缘节点上传的梯度信息是通过该边缘节点所属业务提供方下的训练样本对所述边缘节点内部署的风控模型进行训练得到的;
将所述各边缘节点上传的梯度进行聚合,得到聚合后的梯度,并根据聚合后的梯度,对中心服务器本地部署的模型进行模型参数更新,得到更新后的参数;
将更新后的参数下发到各边缘节点,以进行迭代训练,针对每个边缘节点,该边缘节点部署的风控模型在训练完成后用于对该边缘节点所属的业务提供方下的用户进行风控。
可选地,还包括:
根据训练完成后的风控模型,构建用户风险评估接口,所述用户风险评估接口用于新增业务提供方接入后对所述新增业务提供方下的用户进行风控。
本说明书提供一种模型训练的方法,包括:
中心服务器获取各边缘节点上传的梯度信息,其中,针对每个边缘节点,该边缘节点上传的梯度信息是通过该边缘节点下的训练样本对部署在该边缘节点内的风控模型进行训练得到的,不同边缘节点所获取到的训练样本不完全相同;
将所述各边缘节点上传的梯度信息进行聚合,得到聚合后的梯度信息,并根据聚合后的梯度信息,对所述中心服务器本地部署的风控模型进行模型参数更新,得到更新后参数;
将所述更新后参数下发给边缘节点,以使边缘节点在接收到所述更新后参数后,从所述更新后参数中筛选出边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对边缘节点本地的风控模型进行更新,针对每个边缘节点,该边缘节点部署的风控模型在训练完成后用于对该边缘节点所属的业务提供方下的用户进行业务风控。
本说明书提供一种模型训练的装置,包括:
获取模型,用于获取训练样本,其中,不同边缘节点所获取到的训练样本不完全相同;
训练模块,用于根据所述训练样本对部署在所述装置本地的风控模型进行训练,得到对所述风控模型训练所产生的梯度信息;
上传模块,用于将所述梯度信息上传到中心服务器,以使所述中心服务器根据所述装置上传的所述梯度信息以及其他边缘节点上传的梯度信息,对所述中心服务器本地部署的风控模型进行模型参数更新,得到更新后参数,并将所述更新后参数返回给各边缘节点,所述中心服务器和各边缘节点各自部署的风控模型不完全相同;
接收模块,用于接收所述中心服务器发送的所述更新后参数;
更新模块,用于从所述更新后参数中筛选出所述装置本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对所述装置本地的风控模型进行更新,所述预设网络层为所述中心服务器和各边缘节点部署的各风控模型中的公共网络层,所述边缘节点本地的风控模型在训练完成后用于对所述边缘节点所属业务提供方下的用户进行业务风控。
本说明书提供一种模型训练的装置,包括:
获取模块,用于获取各边缘节点上传的梯度信息,其中,不同边缘节点属于不同业务提供方,针对每个边缘节点,该边缘节点上传的梯度信息是通过该边缘节点所属业务提供方下的训练样本对部署在该边缘节点内的风控模型进行训练得到的,不同业务提供方提供的业务不完全相同;
聚合模块,用于将所述各边缘节点上传的梯度信息进行聚合,得到聚合后的梯度信息,并根据聚合后的梯度信息,对所述装置本地部署的风控模型进行模型参数更新,得到更新后参数;
下发模块,用于将所述更新后参数下发给边缘节点,以使边缘节点在接收到所述更新后参数后,从所述更新后参数中筛选出边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对边缘节点本地的风控模型进行更新,针对每个边缘节点,该边缘节点部署的风控模型在训练完成后用于对该边缘节点所属的业务提供方下的用户进行业务风控。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练的方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练的方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书中提供的模型训练的方法中,边缘节点获取训练样本,其中不同边缘节点所获取到的训练样本不完全相同,而后,可以根据训练样本对本地的风控模型进行训练,得到对风控模型更新的梯度信息,并将更新的梯度信息上传到中心服务器,以使中心服务器根据该边缘节点上传的梯度信息以及其他边缘节点上传的梯度信息,对中心服务器本地部署的风控模型进行模型参数更新,得到更新后的参数,并返回给边缘节点,最后,边缘节点可以接收中心服务器发送的更新后的参数,从更新后参数中筛选出边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对边缘节点本地的风控模型进行更新,其中,边缘节点本地的风控模型在训练完成后用于对边缘节点所属业务提供方下的用户进行风控。
从上述内容中可以看出,本说明书中提供的模型训练的方法,每个业务提供方可以对应一个边缘节点,该边缘节点可以通过基于该业务提供方下用户的风险情况构建出的训练样本,来训练风控模型,从而得到更新的梯度信息,中心服务器可以聚合各边缘节点上传的更新的梯度信息,得到聚合后的梯度信息,从而根据聚合后的梯度信息,来更新中心服务器侧的风控模型,而后,中心服务器侧可以将更新后的模型参数下发给各边缘节点,以进行迭代训练。因此,本申请可以通过聚合不同业务提供方训练的风控模型的梯度信息的方式,使得最终训练完成的风控模型可以学习到所有业务提供方下训练样本的特性,从而提到对用户风控的准确性。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中一种模型训练的方法的流程示意图;
图2为本说明书提供的一种中心服务器与各边缘节点之间交互进行模型训练的结构示意图的示意图;
图3为本说明书中一种模型训练的方法的流程示意图;
图4为本说明书提供的一种模型训练的装置示意图;
图5为本说明书提供的一种模型训练的装置示意图;
图6为本说明书提供的一种对应于图1或图3的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中一种模型训练的方法的流程示意图,具体包括以下步骤:
S100:边缘节点获取训练样本,其中,不同边缘节点所获取到的训练样本不完全相同。
S102:根据所述训练样本对部署在所述边缘节点本地的风控模型进行训练,得到对所述风控模型训练所产生的梯度信息。
在风控中,往往存在多种业务提供方需要对用户进行风控,而不同业务提供方之间向用户提供的业务可以是不同的。例如,网商银行可以向用户提供贷款业务、互联网平台可以向用户提供先用后付业务,保险公司可以向用户提供保险业务。不同的业务提供方之间的用户可能存在交叉,也可能会存在不同的用户,他们可以通过风控模型来对用户进行风控,但是,往往他们只能通过自身业务所获得的训练样本来对风控模型进行训练。在本说明书中,希望通过联邦学习的方式,能够让不同业务提供方的风控模型学习到其他业务提供方下训练样本的特性,从而提高风控准确性。
基于此,边缘节点可以获取训练样本,不同边缘节点所获取到的训练样本不完全相同,其中,该训练样本是基于该边缘节点所属业务提供方下用户的风险情况构建出的,不同边缘节点属于不同业务提供方。也就是说,每个业务提供方拥有该业务提供方对应的边缘节点,边缘节点中可以部署有本地的风控模型,业务提供方可以根据本地的训练样本对该风控模型进行训练,得到对该风控模型更新的梯度信息。这里提到的边缘节点可以是指服务器、大型的服务平台等,具体边缘节点的形式不进行限定。
在实际应用中,边缘节点在构建训练样本时,可以获取所属业务提供方下各用户的历史业务记录以及用户相关信息,其中,该历史业务记录可以记录用户在该业务提供方下执行历史业务的状况,例如,假设该业务提供方为保险公司,该用户在该业务提供方的历史业务记录可以表示该用户历史上购买的保险是否存在骗保行为,再例如,若该业务提供方为网商银行,则用户在该业务提供方的历史业务记录可以表示该用户历史上在贷款后是否存在逾期行为。
从而,边缘节点可以针对每个用户,根据该用户的历史业务记录,确定该用户的用户标签,其中,该用户标签可以用于表示用户的历史上执行的业务是否存在风险,而后,可以根据各用户的用户相关信息以及用户标签,构建训练样本。
上述提到的用户相关信息可以存在有多种。例如,用户标识信息,用户设备信息、用户的历史行为信息以及历史核验信息等,用户登录环境信息以及用户设备型号,历史核验信息用于表示用户历史上进行身份核验的情况。用户登录环境信息可以表示用户登录的环境相关信息,如,用户是在安卓端登录还是在ios端登录。
S104:将所述梯度信息上传到中心服务器,以使所述中心服务器根据所述边缘节点上传的所述梯度信息以及其他边缘节点上传的梯度信息,对所述中心服务器本地部署的风控模型进行模型参数更新,得到更新后参数,并将所述更新后参数返回给各边缘节点,所述中心服务器和各边缘节点各自部署的风控模型不完全相同。
边缘节点确定出梯度信息后,可以将该梯度信息上传给中心服务器,中心服务器还可以收到其他边缘节点(即,其他业务提供方的边缘节点上传的更新的梯度信息)发送的梯度信息,因此,中心服务器可以根据该边缘节点上传的梯度信息以及其他边缘节点上传的梯度信息,对中心服务器本地部署的风控模型进行模型参数更新,得到更新后的参数,并返回给边缘节点。
也就是说,中心服务器可以将该边缘节点上传的更新的梯度信息以及其他边缘节点上5传的梯度信息进行聚合(例如,取平均,或者加权平均等),得到聚合后的梯度信息,从
而根据聚合后的梯度信息,中心服务器本地部署的风控模型进行模型参数更新。
其中,中心服务器接收到的梯度信息可以是由边缘节点进行加密后得到的,中心服务器可以解密得到梯度信息,再对接收到的梯度信息进行融合。
S106:接收所述中心服务器发送的更新后的参数。
0S108:从所述更新后参数中筛选出所述边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对所述边缘节点本地的风控模型进行更新,所述预设网络层为所述中心服务器和各边缘节点部署的各风控模型中的公共网络层,所述边缘节点本地的风控模型在训练完成后用于对所述边缘节点所属业务提供方下的用户进行业务风控。
在接收到中心服务器发送的更新后的参数,边缘节点可以对本地的风控模型进行更5新。中心服务器与边缘节点之间的结构可以如图2所示。
图2为本说明书提供的一种中心服务器与各边缘节点之间交互进行模型训练的结构示意图的示意图。
其中,该边缘节点本地的风控模型在训练完成后可以用于对边缘节点所属业务提供方下的用户进行风控。
0由于各边缘节点之间所构建出的风控模型的具体网络结构不一定完全相同,因此,可
以在边缘节点根据更新后的参数对本地的边缘节点进行更新时,可以筛选出预设网络层所需的参数,并根据筛选出的模型参数,对该边缘节点本地的风控模型进行更新,其中,该预设网络层为中心服务器和各边缘节点部署的各风控模型中的公共网络层。具体预设网络层为哪些网络层可根据实际情况而定。
5例如,该预设网络层可以为风控模型中的特征提取层,之所以各边缘节点之间的特征
提取层的网络结构可以相同,是为了使得各边缘节点之间的风控模型的特征提取层可以学习到其他边缘节点的训练样本的特性。
由于特征提取层可以是相同的,因此,训练样本的特征维度需要统一,而由于不同边
缘节点之间的具体业务可以是不同的,可能存在边缘节点拥有其独有的特征维度,那么需0要对其他边缘节点的样本数据进行维度补全。
所以,边缘节点可以确定训练样本中的样本数据的数据维度数量;判断数据维度数量是否低于预设维度数;若是,对该样本数据进行补充,以使补充后的样本数据的数据维度数量达到预设维度数;而后,边缘节点可以根据补充后的样本数据,对部署在边缘节点本地的风控模型进行训练。这里提到的预设维度是可以进行预先设定。
5具体的,边缘节点所属业务提供方在通过该风控模型对用户进行风控时,可以在接收到用户的业务请求后,确定用户的用户相关信息,并将用户相关信息输入到训练后的风控模型中,得到针对该用户的风险预测结果,进而,可以根据针对该用户的风险预测结果,对该用户请求的业务进行业务风控,例如,根据该风险预测结果,确定是否为该用户执行该用户所发送的业务请求所对应的业务。
上述是站在边缘节点的角度来说明本说明书的模型训练的方法,下面,将站在中心服务器的角度,来说明本说明书中的模型训练的方法,如图3所示。
图3为本说明书中一种模型训练的方法的流程示意图,具体包括以下步骤:
S300:中心服务器获取各边缘节点上传的梯度信息,其中,针对每个边缘节点,该边缘节点上传的梯度信息是通过该边缘节点下的训练样本对部署在该边缘节点内的风控模型进行训练得到的,不同边缘节点所获取到的训练样本不完全相同。
S302:将所述各边缘节点上传的梯度信息进行聚合,得到聚合后的梯度信息,并根据聚合后的梯度信息,对所述中心服务器本地部署的风控模型进行模型参数更新,得到更新后参数。
S304:将所述更新后参数下发给边缘节点,以使边缘节点在接收到所述更新后参数后,从所述更新后参数中筛选出边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对边缘节点本地的风控模型进行更新,针对每个边缘节点,该边缘节点部署的风控模型在训练完成后用于对该边缘节点所属的业务提供方下的用户进行业务风控。
与上述站在边缘节点的角度的说明类似,中心服务器可以接收边缘节点上传的梯度信息,其中,不同边缘节点属于不同业务提供方,针对每个边缘节点,该边缘节点上传的梯度信息是通过该边缘节点所属业务提供方下的训练样本对该边缘节点内部署的风控模型进行训练得到的。
而后,中心服务器可以将各边缘节点上传的梯度进行聚合,得到聚合后的梯度,并根据聚合后的梯度,对中心服务器本地部署的模型进行模型参数更新,得到更新后的参数,最后,将更新后的参数下发到各边缘节点,边缘节点可以根据接收到的更新后参数,对本地的模型进行更新。边缘节点可以从更新后参数中筛选出边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对边缘节点本地的风控模型进行更新。
针对每个边缘节点,该边缘节点部署的风控模型在训练完成后用于对该边缘节点所属的业务提供方下的用户进行风控。
需要说明的是,上述过程是迭代的,即,边缘节点得到更新后参数,进行模型更新后,可以继续对更新后的模型进行训练,得到新一次的梯度信息,再将梯度信息上传到中心服务器,中心服务器可以再次进行梯度信息的聚合,即,和模型的迭代训练类似,边缘节点与中心服务器对风控模型进行训练的过程也是迭代的。
还需说明的是,在中心服务器或者边缘节点,训练完成后的风控模型可以用于构建用户风险评估接口,该用户风险评估接口可以用于新增的业务提供方或者原有的业务提供方自身新增的业务接入后对用户进行风控,也就是说,中心服务器或者边缘节点可以通过接口的方式将训练完成后的风控模型封装成一项可以对外提供的服务。
当存在新增的业务提供方时,为了新增的业务提供方数据的安全性,新增的业务提供方可以仅提供用户标识信息(如身份信息等标识),通过该用户风险评估接口对用户的风险进行评估。
还需说明的是,由于不同边缘节点的训练样本之间存在差异,那么在将不同边缘节点的梯度信息聚合后更新出的模型不一定效果会很好,那么在通过聚合后的梯度信息对风控模型进行更新后,可以通过预先确定出的验证样本集,对更新后的风控模型进行验证,也就是说,该验证样本集可以为标注有标签的训练样本,通过验证样本集可以确定出更新后的风控模型的准确率,并且,上一次对该风控模型进行更新后的准确率也可以被中心服务器存储,若本次确定出的准确率大于上一次的准确率,则可以将更新后的参数下发给各边缘节点。
并且,可以确定出本次的准确率相比于上一次的准确率增大的幅度,并根据该幅度,确定出更新比例,并从更新后的模型参数中确定出符合该更新比例的部分模型参数,下发给各边缘节点。也就是说,若是本次的准确率相比于上一次的准确率增大的幅度越小,则更新比例越低。
另外,若是本次确定出的准确率不大于上一次的准确率,则可以通过中心服务器本地的验证样本集,对风控模型进行一次训练后,再将更新后的参数下发给各边缘节点。
从上述内容中可以看出,本说明书中提供的模型训练的方法,每个业务提供方可以对应一个边缘节点,该边缘节点可以通过基于该业务提供方下用户的风险情况构建出的训练样本,来训练风控模型,从而得到更新的梯度信息,中心服务器可以聚合各边缘节点上传的更新的梯度信息,得到聚合后的梯度信息,从而根据聚合后的梯度信息,来更新中心服务器侧的风控模型,而后,中心服务器侧可以将更新后的模型参数下发给各边缘节点,以进行迭代训练。因此,本发明可以通过聚合不同业务提供方训练的风控模型的梯度信息的方式,使得最终训练完成的风控模型可以学习到所有业务提供方下训练样本的特性,从而提到对用户风控的准确性。
以上为本说明书的一个或多个实施例提供的模型训练的方法,基于同样的思路,本说明书还提供了模型训练的装置,如图4、图5所示。
图4为本说明书提供的一种模型训练的装置示意图,具体包括:
获取模型401,用于获取训练样本,其中,不同边缘节点所获取到的训练样本不完全相同;
训练模块402,用于根据所述训练样本对部署在所述装置本地的风控模型进行训练,得到对所述风控模型训练所产生的梯度信息;
上传模块403,用于将所述梯度信息上传到中心服务器,以使所述中心服务器根据所述装置上传的所述梯度信息以及其他边缘节点上传的梯度信息,对所述中心服务器本地部署的风控模型进行模型参数更新,得到更新后参数,并将所述更新后参数返回给各边缘节点,所述中心服务器和各边缘节点各自部署的风控模型不完全相同;
接收模块404,用于接收所述中心服务器发送的所述更新后参数;
更新模块405,用于从所述更新后参数中筛选出所述装置本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对所述装置本地的风控模型进行更新,所述预设网络层为所述中心服务器和各边缘节点部署的各风控模型中的公共网络层,所述边缘节点本地的风控模型在训练完成后用于对所述边缘节点所属业务提供方下的用户进行业务风控。
可选地,所述获取模型401具体用于,获取各用户的历史业务记录以及用户相关信息,所述用户相关信息包括用户标识信息、用户设备信息、用户历史行为信息以及历史核验信息;针对每个用户,根据该用户的历史业务记录,确定该用户的用户标签,所述用户标签用于表示用户的历史上执行的业务是否存在风险;根据所述各用户的用户相关信息以及用户标签,构建训练样本。
可选地,所述用户设备信息包括用户登录环境信息以及用户设备型号,所述历史核验信息用于表示用户历史上进行身份核验的情况。
可选地,所述训练模块402具体用于,确定所述训练样本中的样本数据的数据维度数量;判断所述数据维度数量是否低于预设维度数;若是,对所述样本数据进行补充,以使补充后的样本数据的数据维度数量达到所述预设维度数;根据所述补充后的样本数据,对部署在所述边缘节点本地的风控模型进行训练。
可选地,所述装置还包括:
执行模块406,用于接收用户的业务请求;根据所述业务请求,确定所述用户的用户相关信息;将所述用户相关信息输入到训练后的风控模型中,得到所述用户的风险预测结果;根据所述风险预测结果,对所述用户请求的业务进行业务风控。
图5为本说明书提供的一种模型训练的装置示意图,具体包括:
获取模块501,用于获取各边缘节点上传的梯度信息,其中,不同边缘节点属于不同业务提供方,针对每个边缘节点,该边缘节点上传的梯度信息是通过该边缘节点所属业务提供方下的训练样本对部署在该边缘节点内的风控模型进行训练得到的,不同业务提供方提供的业务不完全相同;
聚合模块502,用于将所述各边缘节点上传的梯度信息进行聚合,得到聚合后的梯度信息,并根据聚合后的梯度信息,对所述装置本地部署的风控模型进行模型参数更新,得到更新后参数;
下发模块503,用于将所述更新后参数下发给边缘节点,以使边缘节点在接收到所述更新后参数后,从所述更新后参数中筛选出边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对边缘节点本地的风控模型进行更新,针对每个边缘节点,该边缘节点部署的风控模型在训练完成后用于对该边缘节点所属的业务提供方下的用户进行业务风控。
说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述模型训练的方法。
本说明书还提供了图6所示的电子设备的示意结构图。如图6所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述数据查询的方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理节点来执行任务。在分布式计算环境中,程序模块可以位于包括存储节点在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (10)
1.一种模型训练的方法,包括:
边缘节点获取训练样本,其中,不同边缘节点所获取到的训练样本不完全相同;
根据所述训练样本对部署在所述边缘节点本地的风控模型进行训练,得到对所述风控模型训练所产生的梯度信息;
将所述梯度信息上传到中心服务器,以使所述中心服务器根据所述边缘节点上传的所述梯度信息以及其他边缘节点上传的梯度信息,对所述中心服务器本地部署的风控模型进行模型参数更新,得到更新后参数,并将所述更新后参数返回给各边缘节点,所述中心服务器和各边缘节点各自部署的风控模型不完全相同;
接收所述中心服务器发送的所述更新后参数;
从所述更新后参数中筛选出所述边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对所述边缘节点本地的风控模型进行更新,所述预设网络层为所述中心服务器和各边缘节点部署的各风控模型中的公共网络层,所述边缘节点本地的风控模型在训练完成后用于对所述边缘节点所属业务提供方下的用户进行业务风控。
2.如权利要求1所述的方法,获取训练样本,具体包括:
获取各用户的历史业务记录以及用户相关信息,所述用户相关信息包括用户标识信息、用户设备信息、用户历史行为信息以及历史核验信息;
针对每个用户,根据该用户的历史业务记录,确定该用户的用户标签,所述用户标签用于表示用户的历史上执行的业务是否存在风险;
根据所述各用户的用户相关信息以及用户标签,构建训练样本。
3.如权利要求2所述的方法,所述用户设备信息包括用户登录环境信息以及用户设备型号,所述历史核验信息用于表示用户历史上进行身份核验的情况。
4.如权利要求1所述的方法,根据所述训练样本对部署在所述边缘节点本地的风控模型进行训练,包括:
确定所述训练样本中的样本数据的数据维度数量;
判断所述数据维度数量是否低于预设维度数;
若是,对所述样本数据进行补充,以使补充后的样本数据的数据维度数量达到所述预设维度数;
根据所述补充后的样本数据,对部署在所述边缘节点本地的风控模型进行训练。
5.如权利要求1所述的方法,还包括:
接收用户的业务请求;
根据所述业务请求,确定所述用户的用户相关信息;
将所述用户相关信息输入到训练后的风控模型中,得到所述用户的风险预测结果;
根据所述风险预测结果,对所述用户请求的业务进行业务风控。
6.一种模型训练的方法,包括:
中心服务器获取各边缘节点上传的梯度信息,其中,针对每个边缘节点,该边缘节点上传的梯度信息是通过该边缘节点下的训练样本对部署在该边缘节点内的风控模型进行训练得到的,不同边缘节点所获取到的训练样本不完全相同;
将所述各边缘节点上传的梯度信息进行聚合,得到聚合后的梯度信息,并根据聚合后的梯度信息,对所述中心服务器本地部署的风控模型进行模型参数更新,得到更新后参数;
将所述更新后参数下发给边缘节点,以使边缘节点在接收到所述更新后参数后,从所述更新后参数中筛选出边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对边缘节点本地的风控模型进行更新,针对每个边缘节点,该边缘节点部署的风控模型在训练完成后用于对该边缘节点所属的业务提供方下的用户进行业务风控。
7.一种模型训练的装置,包括:
获取模型,用于获取训练样本,其中,不同边缘节点所获取到的训练样本不完全相同;
训练模块,用于根据所述训练样本对部署在所述装置本地的风控模型进行训练,得到对所述风控模型训练所产生的梯度信息;
上传模块,用于将所述梯度信息上传到中心服务器,以使所述中心服务器根据所述装置上传的所述梯度信息以及其他边缘节点上传的梯度信息,对所述中心服务器本地部署的风控模型进行模型参数更新,得到更新后参数,并将所述更新后参数返回给各边缘节点,所述中心服务器和各边缘节点各自部署的风控模型不完全相同;
接收模块,用于接收所述中心服务器发送的所述更新后参数;
更新模块,用于从所述更新后参数中筛选出所述装置本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对所述装置本地的风控模型进行更新,所述预设网络层为所述中心服务器和各边缘节点部署的各风控模型中的公共网络层,所述边缘节点本地的风控模型在训练完成后用于对所述边缘节点所属业务提供方下的用户进行业务风控。
8.一种模型训练的装置,包括:
获取模块,用于获取各边缘节点上传的梯度信息,其中,不同边缘节点属于不同业务提供方,针对每个边缘节点,该边缘节点上传的梯度信息是通过该边缘节点所属业务提供方下的训练样本对部署在该边缘节点内的风控模型进行训练得到的,不同业务提供方提供的业务不完全相同;
聚合模块,用于将所述各边缘节点上传的梯度信息进行聚合,得到聚合后的梯度信息,并根据聚合后的梯度信息,对所述装置本地部署的风控模型进行模型参数更新,得到更新后参数;
下发模块,用于将所述更新后参数下发给边缘节点,以使边缘节点在接收到所述更新后参数后,从所述更新后参数中筛选出边缘节点本地的风控模型中预设网络层所需的参数,并根据筛选出的模型参数,对边缘节点本地的风控模型进行更新,针对每个边缘节点,该边缘节点部署的风控模型在训练完成后用于对该边缘节点所属的业务提供方下的用户进行业务风控。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~6任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211740294.2A CN116011815A (zh) | 2022-12-30 | 2022-12-30 | 一种模型训练的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211740294.2A CN116011815A (zh) | 2022-12-30 | 2022-12-30 | 一种模型训练的方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116011815A true CN116011815A (zh) | 2023-04-25 |
Family
ID=86022709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211740294.2A Pending CN116011815A (zh) | 2022-12-30 | 2022-12-30 | 一种模型训练的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116011815A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116644802A (zh) * | 2023-07-19 | 2023-08-25 | 支付宝(杭州)信息技术有限公司 | 模型训练方法及装置 |
CN117010485A (zh) * | 2023-10-08 | 2023-11-07 | 之江实验室 | 边缘场景下的分布式模型训练系统及梯度规约方法 |
CN117194992A (zh) * | 2023-11-01 | 2023-12-08 | 支付宝(杭州)信息技术有限公司 | 一种模型训练、任务执行方法、装置、存储介质及设备 |
-
2022
- 2022-12-30 CN CN202211740294.2A patent/CN116011815A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116644802A (zh) * | 2023-07-19 | 2023-08-25 | 支付宝(杭州)信息技术有限公司 | 模型训练方法及装置 |
CN117010485A (zh) * | 2023-10-08 | 2023-11-07 | 之江实验室 | 边缘场景下的分布式模型训练系统及梯度规约方法 |
CN117010485B (zh) * | 2023-10-08 | 2024-01-26 | 之江实验室 | 边缘场景下的分布式模型训练系统及梯度规约方法 |
CN117194992A (zh) * | 2023-11-01 | 2023-12-08 | 支付宝(杭州)信息技术有限公司 | 一种模型训练、任务执行方法、装置、存储介质及设备 |
CN117194992B (zh) * | 2023-11-01 | 2024-04-19 | 支付宝(杭州)信息技术有限公司 | 一种模型训练、任务执行方法、装置、存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116011815A (zh) | 一种模型训练的方法、装置、电子设备及存储介质 | |
CN110503435B (zh) | 基于区块链的交易预警方法、装置及设备 | |
CN115238826B (zh) | 一种模型训练的方法、装置、存储介质及电子设备 | |
CN116167670A (zh) | 模型、业务处理方法、装置及设备 | |
CN115563584B (zh) | 一种模型训练方法、装置、存储介质及电子设备 | |
CN116188023A (zh) | 一种风险识别模型训练的方法、装置、存储介质及设备 | |
CN115545353A (zh) | 一种业务风控的方法、装置、存储介质及电子设备 | |
CN110502551A (zh) | 数据读写方法、系统及架构组件 | |
CN116109008B (zh) | 一种业务执行的方法、装置、存储介质及电子设备 | |
CN115545938B (zh) | 一种执行风险识别业务的方法、装置、存储介质及设备 | |
CN115828171B (zh) | 一种端云协同执行业务的方法、装置、介质及设备 | |
CN116340852B (zh) | 一种模型训练、业务风控的方法及装置 | |
CN116934338A (zh) | 风险识别方法及装置 | |
CN115730233B (zh) | 一种数据处理方法、装置、可读存储介质以及电子设备 | |
CN115795342B (zh) | 一种业务场景分类的方法、装置、存储介质及电子设备 | |
CN117348999B (zh) | 一种业务执行系统及业务执行方法 | |
CN115470501A (zh) | 一种数据保护方法、装置、存储介质及电子设备 | |
CN116582475A (zh) | 信用服务的测试处理方法及装置 | |
CN116822936A (zh) | 一种业务风控的方法、装置、存储介质及电子设备 | |
CN116957330A (zh) | 一种模型训练、业务风控方法、装置、设备及存储介质 | |
CN116384506A (zh) | 一种模型训练的方法、装置、存储介质及电子设备 | |
CN116401652A (zh) | 一种验证方式的推荐方法、装置、设备及可读存储介质 | |
CN116842570A (zh) | 一种模型训练的方法以及业务风控的方法及装置 | |
CN117575611A (zh) | 一种风险识别的方法、装置、存储介质及电子设备 | |
CN116957587A (zh) | 一种风险识别的方法、装置、存储介质以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |