CN111428883A - 基于向后法的联邦建模方法、设备和可读存储介质 - Google Patents

基于向后法的联邦建模方法、设备和可读存储介质 Download PDF

Info

Publication number
CN111428883A
CN111428883A CN202010241596.XA CN202010241596A CN111428883A CN 111428883 A CN111428883 A CN 111428883A CN 202010241596 A CN202010241596 A CN 202010241596A CN 111428883 A CN111428883 A CN 111428883A
Authority
CN
China
Prior art keywords
model
round
feature
target
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010241596.XA
Other languages
English (en)
Inventor
吴玙
范涛
马国强
魏文斌
谭明超
郑会钿
陈天健
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010241596.XA priority Critical patent/CN111428883A/zh
Publication of CN111428883A publication Critical patent/CN111428883A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种基于向后法的联邦建模方法、设备和可读存储介质,所述基于向后法的联邦建模方法包括:获取待训练完全模型,并接收与所述第一设备协调关联的第三设备反馈的标签方特征数据集合,以确定所述标签方特征数据集合对应的各待剔除标签特征,进而基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。本申请解决了纵向联邦建模效率低且效果差的技术问题。

Description

基于向后法的联邦建模方法、设备和可读存储介质
技术领域
本申请涉及金融科技(Fintech)的机器学习技术领域,尤其涉及一种基于向后法的联邦建模方法、设备和可读存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
随着互联网科技金融的不断发展,联邦学习的应用也越来越广泛,在纵向联邦学习场景中,参与联邦学习的标签提供方和特征提供方均会提供训练特征,并基于这些训练特征通过进行联邦学习来对本地模型进行训练更新,但是,在这些训练特征中,通常会存在对本地模型的训练帮助较少的非显著特征,所以,这些非显著特征在增加了进行纵向联邦学习时的计算量的同时,却对纵向联邦学习的贡献极小,进而降低了纵向联邦学习时的计算效率和计算效果,进而导致了纵向联邦学习的模型建模效率低且效果差,所以,现有技术中存在纵向联邦建模效率低且效果差的技术问题。
发明内容
本申请的主要目的在于提供一种基于向后法的联邦建模方法、设备和可读存储介质,旨在解决现有技术中纵向联邦建模效率低且效果差的技术问题。
为实现上述目的,本申请提供一种基于向后法的联邦建模方法,所述基于向后法的联邦建模方法应用于第一设备,所述基于向后法的联邦建模方法包括:
获取待训练完全模型,并接收与所述第一设备协调关联的第三设备反馈的标签方特征数据集合,以确定所述标签方特征数据集合对应的各待剔除标签特征;
基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
为实现上述目的,本申请还提供一种基于向后法的联邦建模方法,所述基于向后法的联邦建模方法应用于第二设备,所述基于向后法的联邦建模方法包括:
获取待训练完全模型,并接收与所述第二设备协调关联的第三设备反馈的数据方特征数据集合,以确定所述数据方特征数据集合对应的各待剔除数据特征;
基于各所述待剔除数据特征,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
为实现上述目的,本申请还提供一种基于向后法的联邦建模方法,所述基于向后法的联邦建模方法应用于第三设备,所述基于向后法的联邦建模方法包括:
接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
确定待训练待剔除模型变量集合,并基于所述特征编码集合和所述待训练待剔除模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待剔除标签特征,并基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待剔除数据特征,并基于各所述待剔除数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
接收所述第一设备反馈的模型损失值集合,并基于预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
本申请还提供一种基于向后法的联邦建模装置,所述基于向后法的联邦建模装置为虚拟装置,且所述基于向后法的联邦建模装置应用于第一设备,所述基于向后法的联邦建模装置包括:
确定模块,用于获取待训练完全模型,并接收与所述第一设备协调关联的第三设备反馈的标签方特征数据集合,以确定所述标签方特征数据集合对应的各待剔除标签特征;
循环模块,用于基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
可选地,所述循环模块包括:
迭代训练子模块,用于基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合;
协调交互子模块,用于基于所述第一轮待选取模型集合,通过与所述第三设备进行协调交互,确定所述第一轮循环目标特征,并在所述第一轮待选取模型集合中确定所述第一轮循环目标特征对应的第一轮循环目标模型;
第一判定子模块,用于确定所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足所述预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型;
第二判定子模块,用于若所述第一轮循环目标模型不满足所述预设循环结束条件,则通过与所述第二设备进行纵向联邦建模,对所述第一循环目标模型执行所述预设循环训练流程,以对所述第一循环目标模型进行循环更新,直至循环更新后的所述第一循环目标模型满足所述预设循环结束条件,获得所述目标建模模型。
可选地,所述迭代训练子模块包括:
第一迭代训练单元,用于基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型满足预设迭代结束条件,获得一个或者多个第一轮循环数据方模型,其中,所述第二设备用于基于获取的数据方初始训练模型,与所述第一设备进行纵向联邦建模,其中,所述数据方初始训练模型由所述第二设备在所述待训练完全模型中剔除所述待剔除数据特征而获得;
剔除单元,用于在所述待训练完全模型中剔除所述待剔除标签特征,获得标签方初始训练模型;
第二迭代训练单元,用于通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环标签方模型。
可选地,所述协调交互子模块包括:
发送单元,用于获取所述第一轮待选取模型集合对应的模型损失值集合,并将所述模型损失值集合发送至所述第三设备,以供所述第三设备基于所述模型损失值集合和预设模型选择策略,确定第一轮循环目标特征编码,并将所述第一轮循环目标特征编码反馈至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标模型;
接收单元,用于接收所述第三设备反馈的所述第一轮循环目标特征编码,并基于所述循环剔除特征编码,确定所述第一轮循环目标特征。
可选地,所述第一迭代训练单元包括:
迭代训练子单元,用于对所述标签方初始训练模型进迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得第一模型输出值;
获取子单元,用于获取所述标签方初始训练模型对应的第一模型参数向量和所述标签方初始训练模型中各所述待剔除标签特征对应的第一标签特征表示矩阵;
第一计算子单元,用于基于所述第一模型参数向量和所述第一标签特征表示矩阵,计算第一中间辅助参数变量;
接收子单元,用于接收所述第二设备发送的第二中间辅助参数变量,其中,所述第二中间辅助参数变量由所述第二设备基于获取的第二模型参数向量和第一数据特征表示矩阵计算获得,其中,所述第一数据特征表示矩阵对应第二设备持有的所述待训练完全模型中的各所述待剔除数据特征;
第二计算单元,用于基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述第一模型输出值,计算第一中间参数;
联邦子单元,用于基于所述第一中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型。
可选地,所述联邦子单元还可用于执行以下步骤:
将所述第一中间参数发送至所述第二设备,以供所述第二设备基于所述第一数据特征表示矩阵和所述第一中间参数,计算第一特征提供方梯度,并将所述第一特征提供方梯度发送至所述第三设备;
基于所述第一中间参数和所述第一标签特征表示矩阵,计算第一标签提供方梯度,并将所述第一标签提供方梯度发送至所述第三设备,以供所述第三设备基于所述第一特征提供方梯度和所述第一标签提供方梯度计算第一联邦梯度,并将所述第一联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备对所述待训练完全模型进行更新,获得所述第一轮循环标签方模型;
接收所述第三设备反馈的所述第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件;
若更新后的所述初始训练模型满足所述预设迭代结束条件,则将更新后的所述初始训练模型作为所述第一轮循环标签方模型;
若更新后的所述初始训练模型不满足所述预设迭代结束条件,则基于所述第一标签特征表示矩阵,重新与所述第二设备进行纵向联邦建模,以对所述标签方初始训练模型进行迭代训练更新,直至所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型。
可选地,所述第二迭代训练单元包括:
第二迭代训练子单元,用于基于各所述待剔除标签特征,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型达到预设迭代次数,获得第二模型输出值;
第二获取子单元,用于获取所述待训练完全模型对应的第三模型参数向量和各所述待剔除标签特征对应的第二标签特征表示矩阵;
第三计算子单元,用于基于所述第三模型参数向量和所述二标签特征表示矩阵,计算第三中间辅助参数变量;
第二接收子单元,用于接收所述第二设备发送的第四中间辅助参数变量,其中,所述第四中间辅助参数变量由所述第二设备基于获取的第四模型参数向量和所述第二数据特征表示矩阵计算获得,其中,所述第二数据特征表示矩阵对应所述数据方初始训练模型中的各所述待剔除数据特征;
第四计算子单元,用于基于所述第三中间辅助参数变量、所述第四中间辅助参数变量和所述第二模型输出值,计算第二中间参数;
第二联邦子单元,用于基于所述第二中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第二联邦梯度,并基于所述第二联邦梯度,对所述待训练完全模型进行更新,直至更新后的所述待训练完全模型满足所述预设迭代结束条件,获得所述第一轮循环数据方模型。
为实现上述目的,本申请还提供一种基于向后法的联邦建模装置,所述基于向后法的联邦建模装置为虚拟装置,且所述基于向后法的联邦建模装置应用于第二设备,所述基于向后法的联邦建模装置包括:
确定模块,用于获取待训练完全模型,并接收与所述第二设备协调关联的第三设备反馈的数据方特征数据集合,以确定所述数据方特征数据集合对应的各待剔除数据特征;
循环训练模块,用于基于各所述待剔除数据特征,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
可选地,所述循环训练模块包括:
迭代训练子模块,用于基于各所述待剔除数据特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合,以协助所述第一设备获取所述第一轮待选取模型集合对应的模型损失值集合,并将所述模型损失值集合发送至所述第三设备;
第一确定子模块,用于接收所述第三设备基于所述模型损失值集合反馈的第一轮循环目标特征编码,并确定所述第一轮循环目标特征编码对应的所述第一轮循环目标特征;
第二确定子模块,用于在所述第一轮待选取模型集合中确定所述第一轮循环目标特征对应的第一轮循环目标模型;
第一判定子模块,用于确定所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足所述预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型;
第二判定子模块,用于若所述第一轮循环目标模型不满足所述预设循环结束条件,则通过与所述第一设备进行纵向联邦建模,对所述第一循环目标模型执行所述预设循环训练流程,以对所述第一循环目标模型进行循环更新,直至循环更新后的所述第一循环目标模型满足所述预设循环结束条件,获得所述目标建模模型。
为实现上述目的,本申请还提供一种基于向后法的联邦建模装置,所述基于向后法的联邦建模装置为虚拟装置,且所述基于向后法的联邦建模装置应用于第三设备,所述基于向后法的联邦建模装置包括:
第一生成模块,用于接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
第二生成模块,用于确定待训练待剔除模型变量集合,并基于所述特征编码集合和所述待训练待剔除模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待剔除标签特征,并基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待剔除数据特征,并基于各所述待剔除数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
模型选择模块,用于接收所述第一设备反馈的模型损失值集合,并基于预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
可选地,所述模型选择模块包括:
第三计算子模块,用于基于所述预设模型选择策略,计算所述模型损失值集合对应的标准值计算结果;
选取子模块,用于基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值。
本申请还提供一种基于向后法的联邦建模设备,所述基于向后法的联邦建模设备为实体设备,所述基于向后法的联邦建模设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述基于向后法的联邦建模方法的程序,所述基于向后法的联邦建模方法的程序被处理器执行时可实现如上述的基于向后法的联邦建模方法的步骤。
本申请还提供一种可读存储介质,所述可读存储介质上存储有实现基于向后法的联邦建模方法的程序,所述基于向后法的联邦建模方法的程序被处理器执行时实现如上述的基于向后法的联邦建模方法的步骤。
本申请通过获取待训练完全模型,并接收与所述第一设备协调关联的第三设备反馈的标签方特征数据集合,以确定所述标签方特征数据集合对应的各待剔除标签特征,进而基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。也即,本申请实现了在模型中剔除对模型贡献度低的特征,并对模型进行循环训练,以获取训练效果好的模型的目的,进而提高了联邦建模时的模型建模效果,且由于各所述待剔除标签特征是在所述预设循环训练流程中逐步进行剔除的,进而每一次剔除的待剔除标签特征均为对模型贡献度最低的特征,进而在进行循环训练之后,避免了模型中同时存在多个对模型贡献度低的特征,减少了建模时基于贡献度低的特征进行计算的计算量,进而提高了联邦建模时的模型建模效率,所以,解决了纵向联邦建模效率低且效果差的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请基于向后法的联邦建模方法第一实施例的流程示意图;
图2为本申请基于向后法的联邦建模方法中当第一轮循环标签方模型为泊松回归模型时,计算所述第一联邦梯度的流程示意图;
图3为本申请基于向后法的联邦建模方法第二实施例的流程示意图;
图4为本申请基于向后法的联邦建模方法第三实施例的流程示意图;
图5为本申请实施例方案涉及的硬件运行环境的设备结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种基于向后法的联邦建模方法,参照图1,在本申请基于向后法的联邦建模方法的第一实施例中,基于向后法的联邦建模方法应用于第一设备,所述基于向后法的联邦建模方法包括:
步骤S10,获取待训练完全模型,并接收与所述第一设备协调关联的第三设备反馈的标签方特征数据集合,以确定所述标签方特征数据集合对应的各待剔除标签特征;
在本实施例中,需要说明的是,在获取待训练完全模型之前,所述第一设备需要与所述第一设备联邦关联的第二设备进行样本对齐,获得公共样本ID,其中,所述第一设备和所述第二设备将基于所述公共样本ID对应的样本进行纵向联邦建模,其中,所述公共样本ID为所述第一设备和所述第二设备的公共样本的标识,所述标识包括字符串,编码,例如用户手机号、用户身份证号等。
另外地,需要说明的是,所述第一设备为标签提供方,也即,在进行纵向联邦建模时,所述第一设备提供的样本是带有样本标签的,其中,所述样本标签为所述样本的标识,例如,当样本标签为负一时,则标识所述样本数据对应的用户为非优质客户,当样本标签为正一时,则标识所述样本数据对应的用户为优质客户等,所述第二设备为特征提供方,也即,在进行纵向联邦时,所述第一设备提供的样本是不带有样本标签的,所述第一设备和所述第二设备均为进行纵向联邦建模的联邦参与方,所述第三设备为进行纵向联邦的协调方,所述协调方用于协调所述第一设备和所述第二设备进行纵向联邦建模,例如,进行模型选择和优化梯度等,所述待训练完全模型为所述第一设备和所述第二设备进行联邦建模而获得的,其中,所述联邦建模包括纵向联邦建模和横向联邦建模,所述待训练完全模型包括一个或者多个待剔除模型变量,且每一所述待剔除模型变量对应一训练特征,所述训练特征包括所述第一设备持有的待剔除标签特征和所述第二设备持有的待剔除数据特征,例如,假设所述待训练完全模型为线性模型,对应的表达式为Y=β01X12X2+…+βnXn,其中,(β1,β2,…,βn)中的元素即为各所述待剔除模型变量,对应地,(X1,X2,…,Xn)中的元素即为各所述训练特征,所述标签方特征数据集合包括标签方特征编码集合和待剔除模型变量集合,其中,所述待剔除模型变量集合包括一个或者多个所述待剔除模型变量,所述标签方特征编码集合包括一个或者多个标签方特征编码,其中,所述标签方特征编码为各所述待剔除标签特征的标识。
进一步地,在执行步骤S10之前,将预设模型训练参数发送至与所述第一设备协调关联的第三设备,其中,所述预设模型训练参数包括特征数量和样本数量,以供所述第三设备基于所述预设模型训练参数中的特征数量,生成所述标签方特征编码集合,进一步地,获取所有在所述待训练完全模型中的待剔除模型变量,获得待剔除模型变量集合,进而基于所述标签方特征数据集合和所述待剔除模型变量集合,生成所述标签方特征数据集合,其中,所述标签方特征数据集合可使用表的形式进行存储,另外地,所述第三设备将基于所述第二设备发送的特征提供方模型训练参数,生成所述特征提供方模型训练参数对应的数据方特征数据集合,其中,所述特征提供方模型训练参数包括特征数量,所述数据方特征数据集合包括所述待剔除模型变量集合和待剔除数据特征编码集合,其中,所述待剔除数据特征编码集合包括一个或者多个待剔除数据特征编码,所述数据方特征编码为所述待剔除数据特征的标识,进而所述第三设备将所述标签方特征数据集合反馈至所述第一设备,并将所述数据方特征数据集合反馈至所述第二设备,以供所述第二设备与所述第一设备进行纵向联邦建模。
获取待训练完全模型,并接收与所述第一设备协调关联的第三设备反馈的标签方特征数据集合,以确定所述标签方特征数据集合对应的各待剔除标签特征,具体地,获取待训练完全模型,并接收所述第三设备反馈的所述标签方特征数据集合,并获取所述标签方特征数据集合中的标签方特征编码集合,进而将标签方特征编码集合中的各标签方特征编码赋予各所述待剔除标签特征,以确定所述标签方特征数据集合对应的各待剔除标签特征,其中,所述标签方特征编码与所述待剔除标签特征一一对应。
步骤S20,基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
在本实施例中,需要说明的是,所述预设循环训练流程包括一轮或者多轮循环,且在进行每一轮循环时,均需分别从所述待训练完全模型中剔除一个训练特征和对应的待剔除模型变量,其中,所述训练特征包括待剔除标签特征和待剔除数据特征,各所述待剔除标签特征包括进行所述循环训练的第一轮循环对应的各第一轮循环剔除标签特征,各所述待剔除数据特征包括进行所述循环训练的第一轮循环对应的各第一轮循环剔除数据特征。
另外地,需要说明的是,所述目标建模模型中至少包括一个由所述第一设备提供的待剔除标签特征和一个由所述第二设备提供的待剔除数据特征。
基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型,具体地,针对于每一所述第一轮循环剔除标签特征,均执行以下步骤:
将所述待剔除标签特征作为第一轮循环剔除标签特征,进而在所述待训练完全模型中剔除所述第一轮循环剔除标签特征和所述第一轮循环剔除标签特征对应的待剔除模型变量,并对所述待训练完全模型进行初始化,获得标签方初始训练模型,进而将除所述第一轮循环剔除标签特征之外的各所述待剔除标签特征作为第一标签方输入特征集合,并基于所述第一标签方输入特征集合,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环标签方模型,其中,所述第二设备用于提供第一数据方输入特征集合,以进行纵向联邦建模,其中,所述第一数据方输入特征集合为各所述待剔除数据特征的集合,进而针对于每一所述第一轮循环剔除数据特征,均执行以下步骤:
将各所述待剔除标签特征作为第二标签方输入特征集合,并基于所述第二标签方输入特征集合,通过与所述第二设备进行纵向联邦建模,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型满足预设迭代结束条件,获得第一轮循环数据方模型,其中,所述第二设备用于提供获取的第二数据方输入特征集合,以进行纵向联邦建模,其中,所述第二数据方输入特征集合包括除所述第一轮循环剔除数据特征之外的各所述待剔除数据特征,其中,所述第一轮循环剔除数据特征为各所述待剔除数据特征之一,且在进行纵向联邦建模之前,所述第二设备已在己方持有的待训练完全模型中剔除了所述第一轮循环剔除数据特征和所述第一轮循环剔除数据特征对应的待剔除模型变量,获得数据方初始训练模型,并基于所述数据方初始训练模型,与所述第一设备进行纵向联邦,进而在获得各所述第一轮循环标签方模型和各所述第一轮循环数据方模型之后,则通过与所述第三设备进行交互,在各所述第一轮循环标签方模型和各所述第一轮循环数据方模型选取第一轮循环目标模型,则所述第一轮循环目标模型对应的剔除特征即为符合预设贡献度标准的第一轮循环目标特征,其中,所述剔除特征为各所述待剔除标签特征之一或者各所述待剔除数据特征之一,进而判断所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型,若所述第一轮循环目标模型不满足预设循环结束条件,则对所述第一轮循环目标模型进行所述预设循环训练流程的第二轮循环,直至通过进行所述预设循环训练流程获得的循环目标模型满足预设循环结束条件,获得所述目标建模模型,其中,所述循环目标模型包括进行所述预设循环训练流程的各轮循环获得的目标模型,所述循环目标模型包括所述第一轮循环目标模型,其中,所述预设循环结束条件包括本轮循环获得的循环目标模型对应的AIC(Akaike information criterion,赤池信息准则)值大于上一轮循环获得的循环目标模型对应的AIC值、本轮循环获得的循环目标模型对应的BIC(Bayesian InformationCriterion,贝叶斯信息准则)值大于上一轮循环获得的循环目标模型对应的BIC值和本轮循环中最小P(p-value,假定值)值大于预设P值阀值等。
另外地,在获得所述目标建模模型之后,还可基于步骤S10至步骤S30,重复进行所述目标建模模型的建立,直至所述目标建模模型不再更新或者循环训练次数达到预设最大循环训练次数,则获得最优目标建模模型。
其中,所述循环目标特征包括第一轮循环目标特征,
所述基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型的步骤包括:
步骤S21,基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合;
在本实施例中,基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合,具体地,分别在所述待训练完全模型中剔除各所述待剔除标签特征,获得各所述待剔除标签特征对应的标签方初始训练模型,进而基于各所述标签方初始训练模型和所述待训练完全模型,与所述第二设备进行纵向联邦建模,获得第一轮待选取模型集合,其中,所述第二设备用于在进行纵向联邦建模时提供获取的各数据方初始训练模型和所述待训练完全模型,其中,所述数据方初始训练模型由所述第二设备在所述待训练完全模型中剔除一所述待剔除数据特征而获得,且所述第一轮待选取模型集合中每一第一轮待选取模型均由所述第一设备提供一所述标签方初始训练模型和所述第二设备提供一所述待训练完全模型进行纵向联邦建模而获得,或者由所述第一设备提供一所述待训练完全模型和所述第二设备提供一所述数据方初始训练模型进行纵向联邦建模而获得。
其中,需要说明的是,所述目标建模模型包括风控模型,其中,所述风控模型为用于评估用户贷款风险的机器学习模型,例如,假设所述第一设备属于银行A,则各所述待剔除标签特征为银行A中各目标用户的标签方用户特征,其中,所述标签方用户特征包括年龄、性别、存款数额、A银行贷款记录、信用评分等,各所述第一目标用户是带有样本标签的,其中,所述样本标签为银行A对各所述目标用户的标识,例如,可设定当样本标签为正时,则表明目标用户为低风险用户,当样本标签为负时,则表明目标用户为高风险用户等,且所述第二设备属于银行B,则各所述待剔除数据特征为银行B中各所述目标用户的数据方用户特征,其中,所述数据方用户特征包括年龄、性别、B银行贷款记录等,进而基于各所述待剔除标签特征和各所述待剔除数据特征,A银行与B银行进行纵向联邦建模,并执行所述预设循环训练流程,剔除所述待训练完全模型中对模型贡献度低的特征,即可获得所述风控模型,进而若各所述目标用户中的用户A的信息发生改变时,则需要重新对用户A进行用户贷款风险评估,具体地,将用户A对应的样本数据输入所述风控模型,对用户A进行用户贷款风险评估,获得贷款风险评分,其中,所述贷款风险评分为用户贷款风险的标识,例如,可设定当用户当贷款风险评分高于80分时,则判定用户贷款风险低,当用户贷款风险评分低于60分时,则判定用户贷款风险高等,其中,由于所述风控模型是基于进行纵向联邦建模和执行所述预设循环训练流程而获得的,进而所述风控模型中不存在对模型贡献度低的特征,也即,所述风控模型为基于对模型贡献度高的特征进行纵向联邦建模而获得的,进而提高了风控模型的建模效果和建模效率,进而使得风控模型对各所述目标用户的贷款风险评估更准确,也即,提高了风控模型的贷款风险评估准确率。
其中,所述第二设备在与所述第一设备进行纵向联邦建模时,提供一个或者多个待剔除数据特征,所述第一轮待选取模型集合包括一个或者多个第一轮循环数据方模型和一个或者多个第一轮循环标签方模型,所述第二设备持有所述待训练完全模型,
所述基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合的步骤包括:
针对于每一所述待剔除数据特征,均执行以下步骤:
步骤S211,基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型满足预设迭代结束条件,获得一个或者多个第一轮循环数据方模型,其中,所述第二设备用于基于获取的数据方初始训练模型,与所述第一设备进行纵向联邦建模,其中,所述数据方初始训练模型由所述第二设备在所述待训练完全模型中剔除所述待剔除数据特征而获得;
在本实施例中,需要说明的是,在迭代训练结束后,所述第一设备和所述第二设备得到的模型均为所述第一轮循环数据方模型。
基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型满足预设迭代结束条件,获得一个或者多个第一轮循环数据方模型,其中,所述第二设备用于基于获取的数据方初始训练模型,与所述第一设备进行纵向联邦建模,其中,所述数据方初始训练模型由所述第二设备在所述待训练完全模型中剔除所述待剔除数据特征而获得,具体地,针对于所述第二设备剔除的每一所述待剔除数据特征,均执行以下步骤:
获取各所述待剔除标签特征对应的第一标签特征表示矩阵,其中,所述第一标签特征表示矩阵用于存储各所述待剔除标签特征对应的标签方样本数据编码,其中,所述第一标签特征表示矩阵的每一列对应一所述待剔除标签特征,所述第一标签特征表示矩阵的每一行对应一标签方样本,其中,一所述标签方样本包括一个或者多个标签方样本数据,所述标签方样本数据编码为所述标签方样本数据的标识,进而将所述第一标签特征表示矩阵输入待训练完全模型,对所述待训练完全模型进行迭代训练,直至满足预设迭代次数,则与所述第二设备进行纵向联邦,计算第一联邦梯度,并基于所述第一联邦梯度,更新所述待训练完全模型,并判断更新后的所述待训练完全模型是否满足预设迭代结束条件,若更新后的所述待训练完全模型满足预设迭代结束条件,则将更新后的所述待训练完全模型作为所述第一轮循环数据方模型,若更新后的所述待训练完全模型不满足预设迭代结束条件,则继续进行与所述第二设备的联邦建模,以更新所述待训练完全模型,直至所述待训练完全模型满足预设迭代结束条件,获得所述第一轮循环数据方模型,其中,在进行纵向联邦建模时,所述第二设备通过与所述第一设备进行纵向联邦,对数据方初始训练模型进行迭代训练更新,其中,所述数据方初始训练模型由所述第二设备在所述待训练完全模型中剔除所述待剔除数据特征和所述待剔除数据特征对应的待剔除模型变量而获得,且所述数据方初始训练模型对应的第一数据特征表示矩阵为所述数据方初始训练模型的输入,其中,所述第一数据特征表示矩阵用于存储各所述待剔除数据特征对应的数据方样本数据编码,其中,所述第一数据特征表示矩阵的每一列对应一所述待剔除数据特征,所述第一数据特征表示矩阵的每一行对应一数据方样本,其中,一所述数据方样本包括一个或者多个数据方样本数据,所述数据方样本数据编码为所述数据方样本数据的标识。
所述基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型满足预设迭代结束条件,获得一个或者多个第一轮循环数据方模型,其中,所述第二设备用于基于获取的数据方初始训练模型,与所述第一设备进行纵向联邦建模,其中,所述数据方初始训练模型由所述第二设备在所述待训练完全模型中剔除所述待剔除数据特征而获得的步骤包括:
步骤A10,基于各所述待剔除标签特征,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型达到预设迭代次数,获得第二模型输出值;
在本实施例中,具体地,将各所述待剔除标签特征对应的第二标签特征表示矩阵对应的样本数据输入所述待训练完全模型,对所述待训练完全模型进行预设迭代次数的训练,获得所述待训练完全模型的第二模型输出值,其中,所述第二模型输出值可用矩阵进行表示。
步骤A20,获取所述待训练完全模型对应的第三模型参数向量和各所述待剔除标签特征对应的第二标签特征表示矩阵;
在本实施例中,需要说明的是,所述第三模型参数向量由所述待训练完全模型中的各待剔除模型变量组成,所述第二标签特征表示矩阵的每一列均对应一所述待剔除标签特征,所述第二标签特征表示矩阵的每一行均对应一样本。
步骤A30,基于所述第三模型参数向量和所述二标签特征表示矩阵,计算第三中间辅助参数变量;
在本实施例中,需要说明的是,所述第三中间辅助参数变量为所述第三模型参数向量和所述二标签特征表示矩阵的乘积。
步骤A40,接收所述第二设备发送的第四中间辅助参数变量,其中,所述第四中间辅助参数变量由所述第二设备基于获取的第四模型参数向量和所述第二数据特征表示矩阵计算获得,其中,所述第二数据特征表示矩阵对应所述数据方初始训练模型中的各所述待剔除数据特征;
在本实施例中,需要说明的是,所述第四中间辅助参数变量为所述第四模型参数向量和所述第二数据特征表示矩阵的乘积。
步骤A50,基于所述第三中间辅助参数变量、所述第四中间辅助参数变量和所述第二模型输出值,计算第二中间参数;
在本实施例中,基于所述第三中间辅助参数变量、所述第四中间辅助参数变量和所述第二模型输出值,计算第二中间参数,具体地,将所述第三中间辅助参数变量、所述第四中间辅助参数变量和所述第二模型输出值输入预设中间参数计算公式,获得所述第二中间参数。
步骤A60,基于所述第二中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第二联邦梯度,并基于所述第二联邦梯度,对所述待训练完全模型进行更新,直至更新后的所述待训练完全模型满足所述预设迭代结束条件,获得所述第一轮循环数据方模型。
在本实施例中,基于所述第二中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第二联邦梯度,并基于所述第二联邦梯度,对所述待训练完全模型进行更新,直至更新后的所述待训练完全模型满足所述预设迭代结束条件,获得所述第一轮循环数据方模型,具体地,计算所述第二中间参数和所述第二标签特征表示矩阵的乘积,获得第二标签提供方梯度,并将所述第二标签提供方梯度发送至第三设备,将所述第二中间参数发送至所述第二设备,以供所述第二设备计算所述第二中间参数所述第二数据特征表示矩阵的乘积,获得第二特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备,以供所述第三设备基于所述第二标签提供方梯度和所述第二特征提供方梯度,通过预设联邦规则计算第二联邦梯度,其中,所述预设联邦规则包括求和、求求平均等,进而将所述第二联邦梯度分别发送至所述第一设备和所述第二设备,以供所述第二设备获取第一轮循环数据方模型,进一步地,所述第一设备接收所述第二联邦梯度,并基于所述第二联邦梯度,更新所述待训练完全模型,直至所述待训练完全模型满足预设迭代结束条件,获得第一轮循环数据方模型。
针对于每一所述待剔除标签特征均执行以下步骤:
步骤S212,在所述待训练完全模型中剔除所述待剔除标签特征,获得标签方初始训练模型;
在本实施例中,在所述待训练完全模型中剔除所述待剔除标签特征,获得标签方初始训练模型,具体地,在所述待训练完全模型中剔除所述待剔除标签特征和所述待剔除标签特征对应的待剔除模型变量,并对所述待训练完全模型进行初始化,获得标签方初始训练模型。
步骤S213,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环标签方模型。
在本实施例中,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环标签方模型,具体地,将所述标签方初始训练模型中的其他各待剔除标签特征对应的第一标签特征表示矩阵对应的样本数据输入所述标签方初始训练模型,以对所述初始训练模型进行迭代训练,直至所述初始训练模型满足预设迭代次数,则与所述第二设备进行纵向联邦,以计算第二联邦梯度,并基于所述第二联邦梯度对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足预设迭代结束条件,若更新后的所述标签方初始训练模型满足预设迭代结束条件,则将更新后的所述标签方初始训练模型作为所述第一轮循环标签方模型,若更新后的所述标签方初始训练模型不满足预设迭代结束条件,则继续进行对所述标签方初始训练模型的迭代训练和与所述第二设备的纵向联邦,直至所述标签方初始训练模型满足所述预设迭代结束条件,其中,需要说明的是,在所述标签方初始训练模型的整个训练过程中,均需要进行对所述标签方初始训练模型是否满足预设迭代训练结束条件的判断。
其中,所述通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练进行迭代训练,直至所述初始训练满足预设迭代结束条件,获得第一轮循环标签方模型的步骤包括:
步骤B10,对所述标签方初始训练模型进迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得第一模型输出值;
在本实施例中,对所述标签方初始训练模型进迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得第一模型输出值,具体地,将所述标签特征表示矩阵对应的样本数据输入所述标签方初始训练模型,对所述标签方初始训练模型进行预设迭代次数的训练,获得所述标签方初始训练模型的第一模型输出值,其中,所述第一模型输出值可用矩阵进行表示。
步骤B20,基于所述第一模型参数向量和所述第一标签特征表示矩阵,计算第一中间辅助参数变量;
在本实施例中,需要说明的是,所述第一中间辅助参数变量为所述第一模型参数向量和所述第一标签特征表示矩阵的乘积。
步骤B30,接收所述第二设备发送的第二中间辅助参数变量,其中,所述第二中间辅助参数变量由所述第二设备基于获取的第二模型参数向量和第一数据特征表示矩阵计算获得,其中,所述第一数据特征表示矩阵对应第二设备持有的所述待训练完全模型中的各所述待剔除数据特征;
在本实施例中,需要说明的是,所述第二中间辅助参数变量为所述第二模型参数向量和所述第一数据特征表示矩阵的乘积,其中,所述第二模型参数向量为所述待训练完全模型中的各模型变量组成的向量,所述第一数据特征表示矩阵为各所述待剔除数据特征对应的特征表示矩阵,所述第一数据特征表示矩阵的每一列对应一所述待剔除数据特征,所述第一数据特征表示矩阵的每一行对应一样本数据。
步骤B40,基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述第一模型输出值,计算第一中间参数;
在本实施例中,基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述第一模型输出值,计算第一中间参数,具体地,将所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述第一模型输出值代入预设中间参数计算公式,获得所述第一中间参数。
步骤B50,基于所述第一中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型。
在本实施例中,基于所述第一中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型,具体地,基于所述第一中间参数与所述第一标签特征表示矩阵计算第一标签提供方梯度,并将所述第一标签提供方梯度发送至所述第三设备,将所述第一中间参数发送至所述第二设备,以供所述第二设备基于所述第一中间参数计和第一数据特征表示矩阵计算第一特征提供方梯度,以将所述第一特征提供方梯度发送至所述第三设备,以供所述第三设备基于所述第一标签提供方梯度和所述第一特征提供方梯度,通过预设联邦规则计算联邦梯度,并将所述联邦梯度分别发送至所述第一设备和第二设备,以供所述第二设备获取第一轮循环标签方模型,进而接收所述第三设备反馈的第一联邦梯度,并基于所述第一联邦梯度,对所述初始训练模型进行更新,并判断更新后的所述初始训练模型是否满足预设迭代结束条件,若更新后的所述初始训练模型满足预设迭代结束条件,则将更新后的所述初始训练模型作为所述第一轮循环标签方模型,若更新后的所述初始训练模型不满足预设迭代结束条件,则继续进行对所述初始训练模型的迭代训练和与所述第二设备的纵向联邦,直至所述初始训练模型满足所述预设迭代结束条件,其中,所述预设联邦规则包括求平均、求和等。
其中,所述基于所述第一中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型的步骤包括:
步骤B51,将所述第一中间参数发送至所述第二设备,以供所述第二设备基于所述第一数据特征表示矩阵和所述第一中间参数,计算第一特征提供方梯度,并将所述第一特征提供方梯度发送至所述第三设备;
在本实施例中,需要说明的是,所述第一特征提供方梯度为所述数据特征表示矩阵和所述第一中间参数的乘积。
步骤B52,基于所述第一中间参数和所述第一标签特征表示矩阵,计算第一标签提供方梯度,并将所述第一标签提供方梯度发送至所述第三设备,以供所述第三设备基于所述第一特征提供方梯度和所述第一标签提供方梯度计算第一联邦梯度,并将所述第一联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备对所述待训练完全模型进行更新,获得所述第一轮循环标签方模型;
在本实施例中,需要说明的是,所述第一设备和所述第二设备持有相同的第一轮循环标签方模型,所述第一标签提供方梯度为所述第一中间参数和所述第一标签特征表示矩阵的乘积。
步骤B53,接收所述第三设备反馈的所述第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件;
在本实施例中,接收所述第三设备反馈的所述第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件,具体地,接收所述第三设备反馈的所述第一联邦梯度,更新所述初始训练模型中的各待剔除模型变量,并判断更新后的所述初始训练模型是否满足所述预设迭代结束条件,如图2所示为当所述第一轮循环标签方模型为泊松回归模型时,计算所述第一联邦梯度的流程示意图,其中,标签提供方A为所述第一设备,特征提供方B为所述第二设备,微众C为所述第三设备,wxA和exp(wxA)均为所述第一中间辅助参数变量,wxB和exp(wxB)均为所述第二中间辅助参数变量,y为所述第一模型输出值,d为所述第一中间参数,由第一设备发送至第三设备的gB为所述第一标签提供方梯度,由第二设备发送至第三设备的gA为所述第一特征提供方梯度,由所述第三设备发送至所述第一设备的gB为所述第一联邦梯度,由所述第三设备发送至所述第二设备的gA为所述第一联邦梯度,[]为加密符号,表示符号内的数据被加密了。
步骤B54,接收所述第三设备反馈的所述第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件;
步骤B55,若更新后的所述初始训练模型满足所述预设迭代结束条件,则将更新后的所述初始训练模型作为所述第一轮循环标签方模型;
步骤B56,若更新后的所述初始训练模型不满足所述预设迭代结束条件,则基于所述第一标签特征表示矩阵,重新与所述第二设备进行纵向联邦建模,以对所述标签方初始训练模型进行迭代训练更新,直至所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型。
在本实施例中,具体地,若更新后的所述待训练完全模型不满足所述预设迭代结束条件,则基于所述标签特征表示矩阵,则继续与所述第二设备进行纵向联邦建模,对所述初始训练模型进行迭代训练更新,以更新所述初始训练模型中的各待剔除模型变量,直至更新后的所述初始训练模型满足所述预设迭代结束条件,则将更新后的所述初始训练模型作为所述第一轮循环标签方模型。
步骤S22,基于所述第一轮待选取模型集合,通过与所述第三设备进行协调交互,确定所述第一轮循环目标特征,并在所述第一轮待选取模型集合中确定所述第一轮循环目标特征对应的第一轮循环目标模型;
在本实施例中,基于所述第一轮待选取模型集合,通过与所述第三设备进行协调交互,确定所述第一轮循环目标特征,并在所述第一轮待选取模型集合中确定所述第一轮循环目标特征对应的第一轮循环目标模型,具体地,将所述第一轮待选取模型集合对应的模型损失值集合发送至所述第三设备,以供所述第三设备基于预设模型选择策略,在所述模型损失值集合中确定目标模型损失值,并将所述目标模型损失值对应的第一轮循环目标特征编码发送至所述第一设备和所述第二设备,以供所述第二设备确定第一轮循环目标模型,进而所述第一设备接收所述第一轮循环目标特征编码,其中,所述第一轮循环目标特征编码为第一轮循环目标特征的标识,进而基于所述第一轮循环目标特征编码,确定在各所述剔除特征中确定第一轮循环目标特征,并将所述第一轮循环目标特征对应的第一轮待选取模型作为所述第一轮循环目标模型。
其中,所述基于所述待选取模型集合,通过与所述第三设备进行协调交互,确定所述第一轮循环目标特征的步骤包括:
步骤S221,获取所述第一轮待选取模型集合对应的模型损失值集合,并将所述模型损失值集合发送至所述第三设备,以供所述第三设备基于所述模型损失值集合和预设模型选择策略,确定第一轮循环目标特征编码,并将所述第一轮循环目标特征编码反馈至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标模型;
在本实施例中,所述模型损失值集合包括一个或者多个模型损失值,所述模型损失值为所述模型对应的损失函数值。
具体地,获取所述第一轮待选取模型集合中各第一待选取模型对应的模型损失值,并将各所述模型损失值发送至所述第三设备,以供所述第三设备基于预设模型选择策略,计算各所述模型损失值对应的模型标准值,并将最小的模型标准值对应的模型损失值作为目标模型损失值,并将所述目标模型损失值对应的第一轮循环目标特征编码反馈至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标模型,其中,所述第一轮循环目标特征编码为所述第一轮循环目标特征的标识,所述第一轮循环目标特征编码为所述第一轮循环目标模型对应的从所述待训练完全模型中剔除的待剔除标签特征或者待剔除数据特征,其中,所述模型标准值包括AIC值、BIC值和P值等。
步骤S222,接收所述第三设备反馈的所述第一轮循环目标特征编码,并基于所述循环剔除特征编码,确定所述第一轮循环目标特征。
在本实施例中,接收所述第三设备反馈的所述第一轮循环目标特征编码,并基于所述循环剔除特征编码,在预设数据库中查询所述第一轮循环目标特征。
步骤S23,确定所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足所述预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型;
在本实施例中,具体地,确定所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足所述预设循环结束条件,则结束所述预设循环训练流程,并将所述待训练完全模型作为所述目标建模模型。
步骤S24,若所述第一轮循环目标模型不满足所述预设循环结束条件,则通过与所述第二设备进行纵向联邦建模,对所述第一循环目标模型执行所述预设循环训练流程,以对所述第一循环目标模型进行循环更新,直至循环更新后的所述第一循环目标模型满足所述预设循环结束条件,获得所述目标建模模型。
在本实施例中,具体地,若所述第一轮循环目标模型不满足所述预设循环结束条件,则通过与所述第二设备进行纵向联邦建模,对所述第一循环目标模型执行所述预设循环训练流程的下一轮循环训练,以在除所述第一循环目标特征之外的各所述待剔除标签特征中或者各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征以对所述第一循环目标模型进行循环更新,直至循环更新后的所述第一循环目标模型满足所述预设循环结束条件,获得所述目标建模模型。
本实施例通过获取待训练完全模型,并接收与所述第一设备协调关联的第三设备反馈的标签方特征数据集合,以确定所述标签方特征数据集合对应的各待剔除标签特征,进而基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。也即,本实施例实现了在模型中剔除对模型贡献度低的特征,并对模型进行循环训练,以获取训练效果好的模型的目的,进而提高了联邦建模时的模型建模效果,且由于各所述待剔除标签特征是在所述预设循环训练流程中逐步进行剔除的,进而每一次剔除的待剔除标签特征均为对模型贡献度最低的特征,进而在进行循环训练之后,避免了模型中同时存在多个对模型贡献度低的特征,减少了建模时基于贡献度低的特征进行计算的计算量,进而提高了联邦建模时的模型建模效率,所以,解决了纵向联邦建模效率低且效果差的技术问题。
进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,所述基于向后法的联邦建模方法应用于第二设备,所述基于向后法的联邦建模方法包括:
步骤C10,获取待训练完全模型,并接收与所述第二设备协调关联的第三设备反馈的数据方特征数据集合,以确定所述数据方特征数据集合对应的各待剔除数据特征;
在本实施例中,获取待训练完全模型,并接收与所述第二设备协调关联的第三设备反馈的数据方特征数据集合,以确定所述数据方特征数据集合对应的各待剔除数据特征,具体地,获取待训练完全模型,并接收所述第三设备反馈的所述数据方特征数据集合,并获取所述数据方特征数据集合中的数据方特征编码集合,进而将数据方特征编码集合中的各数据方特征编码和获取的各待剔除数据特征进行一一对应,以确定所述数据方特征数据集合对应的各待剔除数据特征,其中,所述数据方特征数据集合包括数据方特征编码集合所述数据方特征编码集合和所述待训练待剔除模型变量集合,且所述第一和所述第二设备在进行纵向联邦之前,持有相同的所述待训练待剔除模型变量集合。
步骤C20,基于各所述待剔除数据特征,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
在本实施例中,基于各所述待剔除数据特征,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型,具体地,针对于每一所述第一轮循环剔除数据特征,均执行以下步骤:
将所述待剔除数据特征作为所述第一轮循环剔除数据特征,进而在所述待训练完全模型中剔除所述第一轮循环剔除数据特征和所述第一轮循环剔除数据特征对应的待剔除模型变量,并对所述待训练完全模型进行初始化,获得数据方初始训练模型,进而将除所述第一轮循环剔除数据特征之外的各所述待剔除数据特征作为第一数据方输入特征集合,并基于所述第一数据方输入特征集合对应的样本,通过与所述第一设备进行纵向联邦建模,对所述数据方初始训练模型进行迭代训练,直至所述数据方初始训练模型满足预设迭代结束条件,获得第一轮循环数据方模型,其中,所述第一设备用于基于获取的第一标签方输入特征集合,与所述第二设备进行纵向联邦建模,所述为第一标签方输入特征集合为各所述待剔除标签特征的集合,进而针对于每一所述待剔除标签特征,均执行以下步骤:
将各所述待剔除数据特征作为第二数据方输入特征集合,并基于所述第二数据方输入特征集合,通过与所述第二设备进行纵向联邦建模,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型满足预设迭代结束条件,获得第一轮循环标签方模型,其中,所述第一设备提供了第二标签方输入特征集合以进行纵向联邦建模,所述第二标签方输入特征集合包括除所述第一轮循环剔除标签特征之外的各所述待剔除标签特征,其中,所述第一轮循环剔除标签特征为各所述待剔除标签特征之一,且在进行纵向联邦建模之前,所述第一设备已在己方持有的待训练完全模型中剔除所述第一轮循环剔除标签特征和所述第一轮循环剔除标签特征对应的待剔除模型变量,获得标签方初始训练模型,并基于所述标签方初始训练模型,与所述第二设备进行纵向联邦建模,进而所述第一设备在获得各所述第一轮循环标签方模型和各所述第一轮循环数据方模型之后,则通过与所述第三设备进行交互,以供所述第三设备确定各所述第一轮循环标签方模型和各所述第一轮循环数据方模型对应的第一循环目标特征编码,并将所述第一轮循环目标特征编码发送至所述第二设备,以供所述第二设备确定第一轮循环目标模型,其中,所述第一轮循环目标模型对应的剔除特征即为符合预设贡献度标准的第一轮循环目标特征,其中,所述剔除特征为各所述待剔除标签特征之一或者各所述待剔除数据特征之一,进而判断所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型,若所述第一轮循环目标模型不满足预设循环结束条件,则对所述第一轮循环目标模型进行所述预设循环训练流程的第二轮循环,直至通过执行所述预设循环训练流程获得的循环目标模型满足预设循环结束条件,获得所述目标建模模型,其中,所述循环目标模型包括进行所述循环训练的各轮循环获得的目标模型,所述循环目标模型包括所述第一轮循环目标模型,其中,所述预设循环结束条件包括本轮循环获得的循环目标模型对应的AIC(Akaike information criterion,赤池信息准则)值大于上一轮循环获得的循环目标模型对应的AIC值、本轮循环获得的循环目标模型对应的BIC(Bayesian Information Criterion,贝叶斯信息准则)值大于上一轮循环获得的循环目标模型对应的BIC值和本轮循环中最小P(p-value,假定值)值大于预设P值阀值等。
其中,所述循环目标特征包括第一轮循环目标特征,
所述基于各所述待剔除数据特征,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型的步骤包括:
步骤C21,基于各所述待剔除数据特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合,以协助所述第一设备获取所述第一轮待选取模型集合对应的模型损失值集合,并将所述模型损失值集合发送至所述第三设备;
在本实施例中,基于各所述待剔除数据特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合,以协助所述第一设备获取所述第一轮待选取模型集合对应的模型损失值集合,并将所述模型损失值集合发送至所述第三设备,具体地,分别在所述待训练完全模型中剔除各所述待剔除数据特征,获得各所述待剔除数据特征对应的数据方初始训练模型,进而基于各所述数据方初始训练模型和所述待训练完全模型,与所述第一设备进行纵向联邦建模,协助所述第一设备获得第一轮待选取模型集合,并将所述第一轮待选取模型集合对应的模型损失值集合发送至所述第三设备,其中,所述第一设备用于在进行纵向联邦建模时提供获取的各标签方初始训练模型和所述待训练完全模型,其中,所述标签方初始训练模型由所述第一设备在所述待训练完全模型中剔除一所述待剔除标签特征而获得,且所述第一轮待选取模型集合中每一第一轮待选取模型均由所述第一设备提供一所述标签方初始训练模型和所述第二设备提供一所述待训练完全模型进行纵向联邦建模而获得,或者由所述第一设备提供一所述待训练完全模型和所述第二设备提供一所述数据方初始训练模型进行纵向联邦建模而获得。
步骤C22,接收所述第三设备基于所述模型损失值集合反馈的第一轮循环目标特征编码,并确定所述第一轮循环目标特征编码对应的所述第一轮循环目标特征;
在本实施例中,需要说明的是,所述模型损失值集合为所述第三设备基于预设模型选择策略确定的,所述第一轮循环目标特征编码为所述第一轮循环目标特征的标识。
步骤C23,在所述第一轮待选取模型集合中确定所述第一轮循环目标特征对应的第一轮循环目标模型;
在本实施例中,需要说明的是,所述第一轮循环目标特征为从所述待训练完全模型中剔除的待剔除数据特征或者待剔除标签特征。
步骤C24,确定所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足所述预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型;
步骤C25,若所述第一轮循环目标模型不满足所述预设循环结束条件,则通过与所述第一设备进行纵向联邦建模,对所述第一循环目标模型执行所述预设循环训练流程,以对所述第一循环目标模型进行循环更新,直至循环更新后的所述第一循环目标模型满足所述预设循环结束条件,获得所述目标建模模型。
在本实施例中,需要说明的是,每进行所述预设循环训练流程的一轮循环训练,均会生成一个循环目标模型,其中,所述循环目标模型包括第一轮循环目标模型。
本实施例通过获取待训练完全模型,并接收与所述第二设备协调关联的第三设备反馈的数据方特征数据集合,以确定所述数据方特征数据集合对应的各待剔除数据特征,进而基于各所述待剔除数据特征,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。也即,本实施例提供了一种通过与所述第一设备进行纵向联邦建模,协助所述第一设备实现了在模型中剔除对模型贡献度低的特征,并对模型进行循环训练,以获取训练效果好的模型的目的,进而提高了联邦建模时的模型建模效果,且由于各所述待剔除标签特征是在所述预设循环训练流程中逐步进行剔除的,进而每一次剔除的待剔除标签特征均为对模型贡献度最低的特征,进而在进行循环训练之后,避免了模型中同时存在多个对模型贡献度低的特征,减少了建模时基于贡献度低的特征进行计算的计算量,进而提高了联邦建模时的模型建模效率,所以,为解决纵向联邦建模效率低且效果差的技术问题奠定了基础。
进一步地,参照图4,基于本申请中第一实施例和第二实施例,在本申请的另一实施例中,所述基于向后法的联邦建模方法应用于第三设备,所述基于向后法的联邦建模方法包括:
步骤D10,接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
在本实施例中,所述模型训练参数包括特征数量和样本数量。
接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合,具体地,接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数中的特征数量,生成特征编码集合,例如,假设所述特征数量为k,则生成的特征编码集合为(1,2,3,…,k)。
步骤D20,确定待训练待剔除模型变量集合,并基于所述特征编码集合和所述待训练待剔除模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
在本实施例中,需要说明的是,所述待训练待剔除模型变量集合包括一个或者多个待训练模型变量,所述待训练模型变量为不在模型中的需要进行训练更新的模型参数,所述第一模型训练数据包括待训练待剔除模型变量集合和属于第一设备的第一特征编码集合,所述第一特征编码集合包括一个或者多个第一特征编码,所述第一特征编码为所述第一设备中各待加入标签特征的标识,所述第二模型训练数据包括待训练待剔除模型变量集合和属于第二设备的第二特征编码集合,所述第二特征编码集合包括一个或者多个第二特征编码,所述第二特征编码为所述第二设备中各待加入数据特征的标识。
确定待训练待剔除模型变量集合,并基于所述特征编码集合和所述待训练待剔除模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合,具体地,确定待训练待剔除模型变量集合,并基于所述特征编码集合和所述待训练待剔除模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备和所述第二设备同时在所述待训练待剔除模型变量集合中选取目标训练变量加入预设基础模型,获得初始训练模型,进而所述第一设备基于所述第一特征编码集合选取多个待加入标签特征分别加入所述初始训练模型,通过与所述第二设备进行纵向联邦建模,计算模型损失值集合,其中,在进行纵向联邦建模时,所述第二设备将基于所述第二特征编码集合选取多个待加入数据特征分别加入所述初始训练模型。
步骤D30,接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
在本实施例中,需要说明的时,所述预设模型选择策略包括适用于所有参数模型的第一类型模型选择策略和适用于线性模型的第二类型模型选择策略。
接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型,具体地,接收所述第一设备反馈的模型损失值集合,并基于预设模型选择策略,计算所述模型损失值集合中各元素对应的标准值,获得标准值计算结果,基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值,基于所述模型标准值对应的目标特征编码更新并存储所述第一模型训练数据和所述第二模型训练数据,并将更新后的所述第一模型训练数据发送至所述第一设备,将更新后的所述第二模型训练数据发送至第二设备,以供所述第一设备基于更新后的所述第一模型训练数据确定第一轮循环目标模型,所述第二设备基于更新后的所述第二模型训练数据确定第一轮循环目标模型,进而所述第一设备和所述第二设备将基于所述第一轮循环目标模型继续进行循环训练,获得循环目标模型,直至所述循环目标模型达到预设循环结束条件,将所述循环目标模型作为所述目标建模模型,其中,所述循环目标模型包括第一循环模型。
其中,所述通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值的步骤包括:
步骤D31,基于所述预设模型选择策略,计算所述模型损失值集合对应的标准值计算结果;
在本实施例中,需要说明的是,所述第一类型模型选择策略包括AIC和BIC,所述标准值计算结果包括一个或者多个模型标准值,当所述预设模型选择策略为AIC时,对应的所述模型标准值为AIC值,当所述预设模型选择策略为BIC时,对应的所述模型标准值为BIC值,所述第二类型模型选择策略包括p-value,当所述预设模型选择策略为p-value时,对应的所述模型标准值为P值。
步骤D32,基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值。
在本实施例中,基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值,具体地,在所述标准值计算结果中选取最小模型标准值,并将所述最小模型标准值对应的模型损失值作为所述目标模型损失值。
本实施例通过接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合,进而确定待训练待剔除模型变量集合,并基于所述特征编码集合和所述待训练待剔除模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合,进而接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。也即,本实施例提供了一种通过协调所述第一设备和所述第二设备进行纵向联邦建模和协助第一设备确定循环目标模型,协助所述第一设备和所述第二设备对所述初始训练进行循环训练的方法,也即,通过计算联邦梯度协调所述第一设备和所述第二设备进行纵向联邦建模,通过选取目标模型损失值协助第一设备确定循环目标模型,进而协助了所述第一设备和所述第二设备对所述初始训练模型进行循环训练,获得所述目标建模模型,所以,为解决纵向联邦建模效率低且效果差的技术问题奠定了基础。
参照图5,图5是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
如图5所示,该基于向后法的联邦建模设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该基于向后法的联邦建模设备还可以包括矩形用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图5中示出的基于向后法的联邦建模设备结构并不构成对基于向后法的联邦建模设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图5所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及基于向后法的联邦建模程序。操作系统是管理和控制基于向后法的联邦建模设备硬件和软件资源的程序,支持基于向后法的联邦建模程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与基于向后法的联邦建模系统中其它硬件和软件之间通信。
在图5所示的基于向后法的联邦建模设备中,处理器1001用于执行存储器1005中存储的基于向后法的联邦建模程序,实现上述任一项所述的基于向后法的联邦建模方法的步骤。
本申请基于向后法的联邦建模设备具体实施方式与上述基于向后法的联邦建模方法各实施例基本相同,在此不再赘述。
本申请实施例提供一种基于向后法的联邦建模装置,所述基于向后法的联邦建模装置应用于第一设备,所述基于向后法的联邦建模装置包括:
确定模块,用于获取待训练完全模型,并接收与所述第一设备协调关联的第三设备反馈的标签方特征数据集合,以确定所述标签方特征数据集合对应的各待剔除标签特征;
循环模块,用于基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
可选地,所述循环模块包括:
迭代训练子模块,用于基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合;
协调交互子模块,用于基于所述第一轮待选取模型集合,通过与所述第三设备进行协调交互,确定所述第一轮循环目标特征,并在所述第一轮待选取模型集合中确定所述第一轮循环目标特征对应的第一轮循环目标模型;
第一判定子模块,用于确定所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足所述预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型;
第二判定子模块,用于若所述第一轮循环目标模型不满足所述预设循环结束条件,则通过与所述第二设备进行纵向联邦建模,对所述第一循环目标模型执行所述预设循环训练流程,以对所述第一循环目标模型进行循环更新,直至循环更新后的所述第一循环目标模型满足所述预设循环结束条件,获得所述目标建模模型。
可选地,所述迭代训练子模块包括:
第一迭代训练单元,用于基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型满足预设迭代结束条件,获得一个或者多个第一轮循环数据方模型,其中,所述第二设备用于基于获取的数据方初始训练模型,与所述第一设备进行纵向联邦建模,其中,所述数据方初始训练模型由所述第二设备在所述待训练完全模型中剔除所述待剔除数据特征而获得;
剔除单元,用于在所述待训练完全模型中剔除所述待剔除标签特征,获得标签方初始训练模型;
第二迭代训练单元,用于通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环标签方模型。
可选地,所述协调交互子模块包括:
发送单元,用于获取所述第一轮待选取模型集合对应的模型损失值集合,并将所述模型损失值集合发送至所述第三设备,以供所述第三设备基于所述模型损失值集合和预设模型选择策略,确定第一轮循环目标特征编码,并将所述第一轮循环目标特征编码反馈至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标模型;
接收单元,用于接收所述第三设备反馈的所述第一轮循环目标特征编码,并基于所述循环剔除特征编码,确定所述第一轮循环目标特征。
可选地,所述第一迭代训练单元包括:
迭代训练子单元,用于对所述标签方初始训练模型进迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得第一模型输出值;
获取子单元,用于获取所述标签方初始训练模型对应的第一模型参数向量和所述标签方初始训练模型中各所述待剔除标签特征对应的第一标签特征表示矩阵;
第一计算子单元,用于基于所述第一模型参数向量和所述第一标签特征表示矩阵,计算第一中间辅助参数变量;
接收子单元,用于接收所述第二设备发送的第二中间辅助参数变量,其中,所述第二中间辅助参数变量由所述第二设备基于获取的第二模型参数向量和第一数据特征表示矩阵计算获得,其中,所述第一数据特征表示矩阵对应第二设备持有的所述待训练完全模型中的各所述待剔除数据特征;
第二计算单元,用于基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述第一模型输出值,计算第一中间参数;
联邦子单元,用于基于所述第一中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型。
可选地,所述联邦子单元还可用于执行以下步骤:
将所述第一中间参数发送至所述第二设备,以供所述第二设备基于所述第一数据特征表示矩阵和所述第一中间参数,计算第一特征提供方梯度,并将所述第一特征提供方梯度发送至所述第三设备;
基于所述第一中间参数和所述第一标签特征表示矩阵,计算第一标签提供方梯度,并将所述第一标签提供方梯度发送至所述第三设备,以供所述第三设备基于所述第一特征提供方梯度和所述第一标签提供方梯度计算第一联邦梯度,并将所述第一联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备对所述待训练完全模型进行更新,获得所述第一轮循环标签方模型;
接收所述第三设备反馈的所述第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件;
若更新后的所述初始训练模型满足所述预设迭代结束条件,则将更新后的所述初始训练模型作为所述第一轮循环标签方模型;
若更新后的所述初始训练模型不满足所述预设迭代结束条件,则基于所述第一标签特征表示矩阵,重新与所述第二设备进行纵向联邦建模,以对所述标签方初始训练模型进行迭代训练更新,直至所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型。
可选地,所述第二迭代训练单元包括:
第二迭代训练子单元,用于基于各所述待剔除标签特征,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型达到预设迭代次数,获得第二模型输出值;
第二获取子单元,用于获取所述待训练完全模型对应的第三模型参数向量和各所述待剔除标签特征对应的第二标签特征表示矩阵;
第三计算子单元,用于基于所述第三模型参数向量和所述二标签特征表示矩阵,计算第三中间辅助参数变量;
第二接收子单元,用于接收所述第二设备发送的第四中间辅助参数变量,其中,所述第四中间辅助参数变量由所述第二设备基于获取的第四模型参数向量和所述第二数据特征表示矩阵计算获得,其中,所述第二数据特征表示矩阵对应所述数据方初始训练模型中的各所述待剔除数据特征;
第四计算子单元,用于基于所述第三中间辅助参数变量、所述第四中间辅助参数变量和所述第二模型输出值,计算第二中间参数;
第二联邦子单元,用于基于所述第二中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第二联邦梯度,并基于所述第二联邦梯度,对所述待训练完全模型进行更新,直至更新后的所述待训练完全模型满足所述预设迭代结束条件,获得所述第一轮循环数据方模型。
本申请基于向后法的联邦建模装置的具体实施方式与上述基于向后法的联邦建模方法各实施例基本相同,在此不再赘述。
为实现上述目的,本申请实施例还提供一种基于向后法的联邦建模装置,所述基于向后法的联邦建模方法应用于第二设备,所述基于向后法的联邦建模装置包括:
确定模块,用于获取待训练完全模型,并接收与所述第二设备协调关联的第三设备反馈的数据方特征数据集合,以确定所述数据方特征数据集合对应的各待剔除数据特征;
循环训练模块,用于基于各所述待剔除数据特征,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
可选地,所述循环训练模块包括:
迭代训练子模块,用于基于各所述待剔除数据特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合,以协助所述第一设备获取所述第一轮待选取模型集合对应的模型损失值集合,并将所述模型损失值集合发送至所述第三设备;
第一确定子模块,用于接收所述第三设备基于所述模型损失值集合反馈的第一轮循环目标特征编码,并确定所述第一轮循环目标特征编码对应的所述第一轮循环目标特征;
第二确定子模块,用于在所述第一轮待选取模型集合中确定所述第一轮循环目标特征对应的第一轮循环目标模型;
第一判定子模块,用于确定所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足所述预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型;
第二判定子模块,用于若所述第一轮循环目标模型不满足所述预设循环结束条件,则通过与所述第一设备进行纵向联邦建模,对所述第一循环目标模型执行所述预设循环训练流程,以对所述第一循环目标模型进行循环更新,直至循环更新后的所述第一循环目标模型满足所述预设循环结束条件,获得所述目标建模模型。
本申请基于向后法的联邦建模装置的具体实施方式与上述基于向后法的联邦建模方法各实施例基本相同,在此不再赘述。
为实现上述目的,本申请实施例还提供一种基于向后法的联邦建模装置,所述基于向后法的联邦建模方法应用于第三设备,所述基于向后法的联邦建模装置包括:
第一生成模块,用于接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
第二生成模块,用于确定待训练待剔除模型变量集合,并基于所述特征编码集合和所述待训练待剔除模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待剔除标签特征,并基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待剔除数据特征,并基于各所述待剔除数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
模型选择模块,用于接收所述第一设备反馈的模型损失值集合,并基于预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
可选地,所述模型选择模块包括:
第三计算子模块,用于基于所述预设模型选择策略,计算所述模型损失值集合对应的标准值计算结果;
选取子模块,用于基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值。
本申请基于向后法的联邦建模装置的具体实施方式与上述基于向后法的联邦建模方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于向后法的联邦建模方法的步骤。
本申请可读存储介质具体实施方式与上述基于向后法的联邦建模方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (13)

1.一种基于向后法的联邦建模方法,其特征在于,所述基于向后法的联邦建模方法应用于第一设备,所述基于向后法的联邦建模方法包括:
获取待训练完全模型,并接收与所述第一设备协调关联的第三设备反馈的标签方特征数据集合,以确定所述标签方特征数据集合对应的各待剔除标签特征;
基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
2.如权利要求1所述基于向后法的联邦建模方法,其特征在于,所述循环目标特征包括第一轮循环目标特征,
所述基于各所述待剔除标签特征,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除标签特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型的步骤包括:
基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合;
基于所述第一轮待选取模型集合,通过与所述第三设备进行协调交互,确定所述第一轮循环目标特征,并在所述第一轮待选取模型集合中确定所述第一轮循环目标特征对应的第一轮循环目标模型;
确定所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足所述预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型;
若所述第一轮循环目标模型不满足所述预设循环结束条件,则通过与所述第二设备进行纵向联邦建模,对所述第一循环目标模型执行所述预设循环训练流程,以对所述第一循环目标模型进行循环更新,直至循环更新后的所述第一循环目标模型满足所述预设循环结束条件,获得所述目标建模模型。
3.如权利要求2所述基于向后法的联邦建模方法,其特征在于,所述第二设备在与所述第一设备进行纵向联邦建模时,提供一个或者多个待剔除数据特征,所述第一轮待选取模型集合包括一个或者多个第一轮循环数据方模型和一个或者多个第一轮循环标签方模型,所述第二设备持有所述待训练完全模型,
所述基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合的步骤包括:
针对于每一所述待剔除数据特征,均执行以下步骤:
基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型满足预设迭代结束条件,获得一个或者多个第一轮循环数据方模型,其中,所述第二设备用于基于获取的数据方初始训练模型,与所述第一设备进行纵向联邦建模,其中,所述数据方初始训练模型由所述第二设备在所述待训练完全模型中剔除所述待剔除数据特征而获得;
针对于每一所述待剔除标签特征均执行以下步骤:
在所述待训练完全模型中剔除所述待剔除标签特征,获得标签方初始训练模型;
通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环标签方模型。
4.如权利要求2所述基于向后法的联邦建模方法,其特征在于,所述基于所述待选取模型集合,通过与所述第三设备进行协调交互,确定所述第一轮循环目标特征的步骤包括:
获取所述第一轮待选取模型集合对应的模型损失值集合,并将所述模型损失值集合发送至所述第三设备,以供所述第三设备基于所述模型损失值集合和预设模型选择策略,确定第一轮循环目标特征编码,并将所述第一轮循环目标特征编码反馈至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标模型;
接收所述第三设备反馈的所述第一轮循环目标特征编码,并基于所述循环剔除特征编码,确定所述第一轮循环目标特征。
5.如权利要求3所述基于向后法的联邦建模方法,其特征在于,所述通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练进行迭代训练,直至所述初始训练满足预设迭代结束条件,获得第一轮循环标签方模型的步骤包括:
对所述标签方初始训练模型进迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得第一模型输出值;
获取所述标签方初始训练模型对应的第一模型参数向量和所述标签方初始训练模型中各所述待剔除标签特征对应的第一标签特征表示矩阵;
基于所述第一模型参数向量和所述第一标签特征表示矩阵,计算第一中间辅助参数变量;
接收所述第二设备发送的第二中间辅助参数变量,其中,所述第二中间辅助参数变量由所述第二设备基于获取的第二模型参数向量和第一数据特征表示矩阵计算获得,其中,所述第一数据特征表示矩阵对应第二设备持有的所述待训练完全模型中的各所述待剔除数据特征;
基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述第一模型输出值,计算第一中间参数;
基于所述第一中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型。
6.如权利要求5所述基于向后法的联邦建模方法,其特征在于,所述基于所述第一中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型的步骤包括:
将所述第一中间参数发送至所述第二设备,以供所述第二设备基于所述第一数据特征表示矩阵和所述第一中间参数,计算第一特征提供方梯度,并将所述第一特征提供方梯度发送至所述第三设备;
基于所述第一中间参数和所述第一标签特征表示矩阵,计算第一标签提供方梯度,并将所述第一标签提供方梯度发送至所述第三设备,以供所述第三设备基于所述第一特征提供方梯度和所述第一标签提供方梯度计算第一联邦梯度,并将所述第一联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备对所述待训练完全模型进行更新,获得所述第一轮循环标签方模型;
接收所述第三设备反馈的所述第一联邦梯度,并基于所述第一联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件;
若更新后的所述初始训练模型满足所述预设迭代结束条件,则将更新后的所述初始训练模型作为所述第一轮循环标签方模型;
若更新后的所述初始训练模型不满足所述预设迭代结束条件,则基于所述第一标签特征表示矩阵,重新与所述第二设备进行纵向联邦建模,以对所述标签方初始训练模型进行迭代训练更新,直至所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环标签方模型。
7.如权利要求3所述基于向后法的联邦建模方法,其特征在于,所述基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型满足预设迭代结束条件,获得一个或者多个第一轮循环数据方模型,其中,所述第二设备用于基于获取的数据方初始训练模型,与所述第一设备进行纵向联邦建模,其中,所述数据方初始训练模型由所述第二设备在所述待训练完全模型中剔除所述待剔除数据特征而获得的步骤包括:
基于各所述待剔除标签特征,对所述待训练完全模型进行迭代训练,直至所述待训练完全模型达到预设迭代次数,获得第二模型输出值;
获取所述待训练完全模型对应的第三模型参数向量和各所述待剔除标签特征对应的第二标签特征表示矩阵;
基于所述第三模型参数向量和所述二标签特征表示矩阵,计算第三中间辅助参数变量;
接收所述第二设备发送的第四中间辅助参数变量,其中,所述第四中间辅助参数变量由所述第二设备基于获取的第四模型参数向量和所述第二数据特征表示矩阵计算获得,其中,所述第二数据特征表示矩阵对应所述数据方初始训练模型中的各所述待剔除数据特征;
基于所述第三中间辅助参数变量、所述第四中间辅助参数变量和所述第二模型输出值,计算第二中间参数;
基于所述第二中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取第二联邦梯度,并基于所述第二联邦梯度,对所述待训练完全模型进行更新,直至更新后的所述待训练完全模型满足所述预设迭代结束条件,获得所述第一轮循环数据方模型。
8.一种基于向后法的联邦建模方法,其特征在于,所述基于向后法的联邦建模方法应用于第二设备,所述基于向后法的联邦建模方法包括:
获取待训练完全模型,并接收与所述第二设备协调关联的第三设备反馈的数据方特征数据集合,以确定所述数据方特征数据集合对应的各待剔除数据特征;
基于各所述待剔除数据特征,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型。
9.如权利要求8所述基于向后法的联邦建模方法,其特征在于,所述循环目标特征包括第一轮循环目标特征,
所述基于各所述待剔除数据特征,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,对各所述待训练完全模型执行预设循环训练流程,以在各所述待剔除数据特征中选取符合预设贡献度标准的各循环目标特征,并在所述待训练完全模型中剔除各所述循环目标特征,获得目标建模模型的步骤包括:
基于各所述待剔除数据特征,通过与所述第二设备进行纵向联邦建模,分别对所述待训练完全模型进行迭代训练更新,获得第一轮待选取模型集合,以协助所述第一设备获取所述第一轮待选取模型集合对应的模型损失值集合,并将所述模型损失值集合发送至所述第三设备;
接收所述第三设备基于所述模型损失值集合反馈的第一轮循环目标特征编码,并确定所述第一轮循环目标特征编码对应的所述第一轮循环目标特征;
在所述第一轮待选取模型集合中确定所述第一轮循环目标特征对应的第一轮循环目标模型;
确定所述第一轮循环目标模型是否满足预设循环结束条件,若所述第一轮循环目标模型满足所述预设循环结束条件,则将所述待训练完全模型作为所述目标建模模型;
若所述第一轮循环目标模型不满足所述预设循环结束条件,则通过与所述第一设备进行纵向联邦建模,对所述第一循环目标模型执行所述预设循环训练流程,以对所述第一循环目标模型进行循环更新,直至循环更新后的所述第一循环目标模型满足所述预设循环结束条件,获得所述目标建模模型。
10.一种基于向后法的联邦建模方法,其特征在于,所述基于向后法的联邦建模方法应用于第三设备,所述基于向后法的联邦建模方法包括:
接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
确定待训练待剔除模型变量集合,并基于所述特征编码集合和所述待训练待剔除模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待剔除标签特征,并基于各所述待剔除标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待剔除数据特征,并基于各所述待剔除数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
接收所述第一设备反馈的模型损失值集合,并基于预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
11.如权利要求10所述基于向后法的联邦建模方法,其特征在于,所述基于预设模型选择策略,在所述模型损失值集合中选取目标模型损失值的步骤包括:
基于所述预设模型选择策略,计算所述模型损失值集合对应的标准值计算结果;
基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值。
12.一种基于向后法的联邦建模设备,其特征在于,所述基于向后法的联邦建模设备包括:存储器、处理器以及存储在存储器上的用于实现所述基于向后法的联邦建模方法的程序,
所述存储器用于存储实现基于向后法的联邦建模方法的程序;
所述处理器用于执行实现所述基于向后法的联邦建模方法的程序,以实现如权利要求1至7或者8至9或者10至11中任一项所述基于向后法的联邦建模方法的步骤。
13.一种可读存储介质,其特征在于,所述可读存储介质上存储有实现基于向后法的联邦建模方法的程序,所述实现基于向后法的联邦建模方法的程序被处理器执行以实现如权利要求1至7或者8至9或者10至11中任一项所述基于向后法的联邦建模方法的步骤。
CN202010241596.XA 2020-03-30 2020-03-30 基于向后法的联邦建模方法、设备和可读存储介质 Pending CN111428883A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010241596.XA CN111428883A (zh) 2020-03-30 2020-03-30 基于向后法的联邦建模方法、设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010241596.XA CN111428883A (zh) 2020-03-30 2020-03-30 基于向后法的联邦建模方法、设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN111428883A true CN111428883A (zh) 2020-07-17

Family

ID=71550089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010241596.XA Pending CN111428883A (zh) 2020-03-30 2020-03-30 基于向后法的联邦建模方法、设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN111428883A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112328617A (zh) * 2020-11-19 2021-02-05 杭州趣链科技有限公司 纵向联邦学习的学习模式参数更新方法和电子装置
CN112508199A (zh) * 2020-11-30 2021-03-16 同盾控股有限公司 针对跨特征联邦学习的特征选择方法、装置及相关设备
CN112700012A (zh) * 2020-12-30 2021-04-23 深圳前海微众银行股份有限公司 联邦特征选择方法、装置、设备及存储介质
CN112784994A (zh) * 2020-12-31 2021-05-11 浙江大学 基于区块链的联邦学习数据参与方贡献值计算和激励方法
CN112926747A (zh) * 2021-03-25 2021-06-08 支付宝(杭州)信息技术有限公司 优化业务模型的方法及装置
CN115169576A (zh) * 2022-06-24 2022-10-11 上海富数科技有限公司广州分公司 基于联邦学习的模型训练方法、装置及电子设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112328617A (zh) * 2020-11-19 2021-02-05 杭州趣链科技有限公司 纵向联邦学习的学习模式参数更新方法和电子装置
CN112508199A (zh) * 2020-11-30 2021-03-16 同盾控股有限公司 针对跨特征联邦学习的特征选择方法、装置及相关设备
CN112700012A (zh) * 2020-12-30 2021-04-23 深圳前海微众银行股份有限公司 联邦特征选择方法、装置、设备及存储介质
CN112784994A (zh) * 2020-12-31 2021-05-11 浙江大学 基于区块链的联邦学习数据参与方贡献值计算和激励方法
CN112784994B (zh) * 2020-12-31 2023-03-03 浙江大学 基于区块链的联邦学习数据参与方贡献值计算和激励方法
CN112926747A (zh) * 2021-03-25 2021-06-08 支付宝(杭州)信息技术有限公司 优化业务模型的方法及装置
CN115169576A (zh) * 2022-06-24 2022-10-11 上海富数科技有限公司广州分公司 基于联邦学习的模型训练方法、装置及电子设备
CN115169576B (zh) * 2022-06-24 2024-02-09 上海富数科技有限公司 基于联邦学习的模型训练方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN111428883A (zh) 基于向后法的联邦建模方法、设备和可读存储介质
CN110782042B (zh) 横向联邦和纵向联邦联合方法、装置、设备及介质
CN110428058B (zh) 联邦学习模型训练方法、装置、终端设备及存储介质
CN111259222B (zh) 物品推荐方法、系统、电子设备及存储介质
CN111428884A (zh) 基于向前法的联邦建模方法、设备和可读存储介质
CN110366734A (zh) 优化神经网络架构
CN111325353A (zh) 训练数据集的贡献度计算方法、装置、设备及存储介质
CN107563417A (zh) 一种深度学习人工智能模型建立方法及系统
CN113095512A (zh) 联邦学习建模优化方法、设备、介质及计算机程序产品
WO2021139462A1 (zh) 逐步模型选择方法、设备及可读存储介质
CN108805611A (zh) 广告筛选方法及装置
CN111898767A (zh) 数据处理方法、装置、设备及介质
CN111898768A (zh) 数据处理方法、装置、设备及介质
CN111241746B (zh) 向前模型选择方法、设备和可读存储介质
CN113688986A (zh) 纵向联邦预测优化方法、设备、介质及计算机程序产品
CN111210022B (zh) 向后模型选择方法、设备及可读存储介质
CN111475628A (zh) 会话数据处理方法、装置、计算机设备和存储介质
CN110532448B (zh) 基于神经网络的文档分类方法、装置、设备及存储介质
CN113378067B (zh) 基于用户挖掘的消息推荐方法、设备、介质
CN113626022A (zh) 物模型创建方法、装置、存储介质及电子设备
CN111445030A (zh) 基于逐步回归法的联邦建模方法、设备和可读存储介质
Wang et al. Inverse reinforcement learning with graph neural networks for iot resource allocation
CN111598640A (zh) 一种信息处理方法及装置、存储介质
CN110502715B (zh) 点击概率的预测方法及装置
CN113793298A (zh) 肺结节检测模型构建优化方法、设备、存储介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination