CN111428884A - 基于向前法的联邦建模方法、设备和可读存储介质 - Google Patents

基于向前法的联邦建模方法、设备和可读存储介质 Download PDF

Info

Publication number
CN111428884A
CN111428884A CN202010241597.4A CN202010241597A CN111428884A CN 111428884 A CN111428884 A CN 111428884A CN 202010241597 A CN202010241597 A CN 202010241597A CN 111428884 A CN111428884 A CN 111428884A
Authority
CN
China
Prior art keywords
model
round
training
label
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010241597.4A
Other languages
English (en)
Inventor
吴玙
范涛
马国强
魏文斌
谭明超
郑会钿
陈天健
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010241597.4A priority Critical patent/CN111428884A/zh
Publication of CN111428884A publication Critical patent/CN111428884A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于向前法的联邦建模方法、设备和可读存储介质,所述基于向前法的联邦建模方法包括:接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合,并确定所述标签方特征数据集合对应的各待加入标签特征,进而获取基础训练模型,并分别将各所述待加入标签特征加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型,进而通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型预设预设循环训练流程,获得目标建模模型。本申请解决了纵向联邦建模效率低且效果差的技术问题。

Description

基于向前法的联邦建模方法、设备和可读存储介质
技术领域
本申请涉及金融科技(Fintech)的机器学习技术领域,尤其涉及一种基于向前法的联邦建模方法、设备和可读存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
随着互联网科技金融的不断发展,联邦学习的应用也越来越广泛,在纵向联邦学习场景中,参与联邦学习的标签提供方和特征提供方均会提供训练特征,并基于这些训练特征通过进行联邦学习来对本地模型进行训练更新,但是,在这些训练特征中,通常会存在对本地模型的训练帮助较少的非显著特征,所以,这些非显著特征在增加了进行纵向联邦学习时的计算量的同时,却对纵向联邦学习的贡献极小,进而降低了纵向联邦学习时的计算效率和计算效果,进而导致了纵向联邦学习的模型建模效率低且效果差,所以,现有技术中存在纵向联邦建模效率低且效果差的技术问题。
发明内容
本申请的主要目的在于提供一种基于向前法的联邦建模方法、设备和可读存储介质,旨在解决现有技术中纵向联邦建模效率低且效果差的技术问题。
为实现上述目的,本申请提供一种基于向前法的联邦建模方法,所述基于向前法的联邦建模方法应用于第一设备,所述基于向前法的联邦建模方法包括:
接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合,并确定所述标签方特征数据集合对应的各待加入标签特征;
获取基础训练模型,并分别将各所述待加入标签特征加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型;
通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型;
基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
为实现上述目的,本申请还提供一种基于向前法的联邦建模方法,所述基于向前法的联邦建模方法应用于第二设备,所述基于向前法的联邦建模方法包括:
接收与所述第二设备协调关联的第三设备发送的数据方特征数据集合,并确定所述数据方特征数据集合对应的各待加入数据特征;
获取基础训练模型,将各所述待加入数据特征分别加入所述基础训练模型,获得各所述待加入数据特征对应的数据方初始训练模型;
通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,分别对各所述数据方初始训练模型进行预设循环训练流程的第一轮循环训练,以协助所述第一设备计算模型损失值结果,并将所述模型损失值结果发送至所述第三设备;
接收所述第三设备基于所述模型损失值结果反馈的目标特征编码,并基于所述目标特征编码,确定对应的第一轮循环目标模型;
基于所述预设循环训练流程,通过与所述第一设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
为实现上述目的,本申请还提供一种基于向前法的联邦建模方法,所述基于向前法的联邦建模方法应用于第三设备,所述基于向前法的联邦建模方法包括:
接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
确定待训练模型变量集合,并基于所述特征编码集合和所述待训练模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
本申请还提供一种基于向前法的联邦建模装置,所述基于向前法的联邦建模装置为虚拟装置,且所述基于向前法的联邦建模装置应用于第一设备,所述基于向前法的联邦建模装置包括:
确定模块,用于接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合,并确定所述标签方特征数据集合对应的各待加入标签特征;
加入模块,用于获取基础训练模型,并分别将各所述待加入标签特征加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型;
第一循环训练模块,用于通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型;
循环训练模块,用于基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
可选地,所述第一循环训练模块包括:
确定子模块,用于确定所述标签方初始训练模型中的所述待加入标签特征,并获取所述待加入标签特征对应的标签特征表示矩阵;
第一联邦子模块,用于基于所述标签特征表示矩阵,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,其中,所述第二设备用于基于获取所述待加入标签特征对应的数据特征表示矩阵,与所述第一设备进行纵向联邦建模;
协调交互子模块,用于在获取各所述标签方初始训练模型对应的所述第一轮循环待选取模型之后,基于各所述第一轮循环待选取模型,通过与所述第三设备进行协调交互,在各所述待加入标签特征中确定所述第一轮循环目标标签特征,并将所述第一轮循环目标标签特征对应的所述第一轮循环待选取模型作为所述第一轮循环目标模型。
可选地,所述第一联邦子模块包括:
迭代训练单元,用于基于所述标签特征表示矩阵,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得模型输出值;
第一计算单元,用于获取所述标签方初始训练模型对应的第一模型参数向量,并基于所述第一模型参数向量和所述标签特征表示矩阵,计算第一中间辅助参数变量;
接收单元,用于接收所述第二设备发送的第二中间辅助参数变量,其中,所述第二中间辅助参数变量由所述第二设备基于获取的第二模型参数向量和数据特征表示矩阵计算获得;
第二计算单元,用于基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述模型输出值,计算中间参数;
更新单元,用于基于所述中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型达到所述迭代结束条件,获得所述第一轮循环待选取模型。
可选地,所述更新单元包括:
第一计算子单元,用于将所述中间参数发送至所述第二设备,以供所述第二设备基于所述数据特征表示矩阵和所述中间参数,计算特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备;
第二计算子单元,用于基于所述中间参数和所述标签特征表示矩阵,计算标签提供方梯度,并将所述标签提供方梯度发送至所述第三设备,以供所述第三设备基于所述特征提供方梯度和所述标签提供方梯度计算联邦梯度,并将所述联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备基于所述联邦梯度对所述数据方初始训练模型进行更新,获得所述第一轮循环待选取模型;
更新子单元,用于若更新后的所述标签方初始训练模型满足所述预设迭代结束条件,则将更新后的所述标签方初始训练模型作为所述第一轮循环待选取模型;
第一判断子单元,若更新后的所述标签方初始训练模型满足所述预设迭代结束条件,则将更新后的所述标签方初始训练模型作为所述第一轮循环待选取模型;
第二判断子单元,用于若更新后的所述标签方初始训练模型不满足所述预设迭代结束条件,则基于所述标签特征表示矩阵,重新与所述第二设备进行纵向联邦建模,以对所述标签方初始训练模型进行训练更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环待选取模型。
可选地,所述协调交互子模块包括:
发送单元,用于获取各所述第一轮循环待选取模型对应的模型损失值,并将各所述模型损失值集合发送至所述第三设备,以供所述第三设备基于预设模型选择策略,在各所述模型损失值中确定目标模型损失值,并将所述目标模型损失值对应的第一循环目标特征编码发送至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标标签特征;
确定单元,用于接收所述第三设备发送的所述第一轮循环目标标签特征编码,并基于所述第一轮循环目标标签特征编码,各所述待加入标签特征中确定所述第一轮循环目标标签特征。
可选地,所述循环训练模块包括:
第二联邦子模块,用于基于各所述第二轮循环标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述第一轮循环目标模型进行所述第二轮循环训练,获得第二轮循环待选取模型集合,其中,所述第二设备用于基于各所述第二轮循环数据特征,与所述第一设备进行纵向联邦建模;
协调交互子模块,用于通过与所述第三设备进行协调交互,在所述第二轮循环待选取模型集合中确定第二轮循环目标模型,并确定所述第二轮循环目标模型是否满足所述预设循环结束条件;
第一判定子模块,用于若所述第二轮循环目标模型满足所述预设循环结束条件,则将所述第一轮循环目标模型作为所述目标建模模型;
第二判定子模块,用于若所述第二轮循环目标模型不满足所述预设循环结束条件,则基于所述预设循环训练流程,对所述第二轮循环目标模型进行循环训练,直至所述第二轮循环目标模型满足预设循环训练结束条件,获得所述目标建模模型。
可选地,所述第二联邦子模块包括:
第一联邦单元,用于将所述第二轮循环标签特征加入所述第一轮循环目标模型,并通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮标签方待选取模型;
第二联邦单元,用于接收所述第二设备发送的辅助参数变量,并基于所述辅助参数变量,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮数据方待选取模型,其中,所述辅助参数变量由所述第二设备基于所述第二轮循环数据特征计算获得。
为实现上述目的,本申请还提供一种基于向前法的联邦建模装置,所述基于向前法的联邦建模装置为虚拟装置,且所述基于向前法的联邦建模装置应用于第二设备,所述基于向前法的联邦建模装置包括:
接收模块,用于接收与所述第二设备协调关联的第三设备发送的数据方特征数据集合,并确定所述数据方特征数据集合对应的各待加入数据特征;
加入模块,用于获取基础训练模型,将各所述待加入数据特征分别加入所述基础训练模型,获得各所述待加入数据特征对应的数据方初始训练模型;
联邦模块,用于通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,分别对各所述数据方初始训练模型进行预设循环训练流程的第一轮循环训练,以协助所述第一设备计算模型损失值结果,并将所述模型损失值结果发送至所述第三设备;
确定模块,用于接收所述第三设备基于所述模型损失值结果反馈的目标特征编码,并基于所述目标特征编码,确定对应的第一轮循环目标模型;
循环模块,用于基于所述预设循环训练流程,通过与所述第一设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
可选地,所述联邦模块包括:
迭代训练子模块,用于基于所述待加入数据特征,对所述数据方初始训练模型进行迭代训练,直至所述数据方初始训练模型达到预设迭代次数,则获取所述数据方初始训练模型对应的模型参数向量,并基于所述模型参数向量和所述待加入数据特征对应的数据特征表示矩阵,计算辅助中间参数变量,并将所述辅助中间参数变量发送至所述第一设备,以供所述第一设备基于所述辅助中间参数变量计算中间参数和标签提供方梯度,并将所述中间参数发送至所述第二设备,将所述标签提供方梯度发送至所述第三设备;
联邦子模块,用于接收所述第一设备反馈的所述中间参数,并基于所述中间参数计算特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备,以供所述第三设备基于所述标签提供方梯度和所述特征提供方梯度计算联邦梯度,并将所述联邦梯度发送至所述第一设备,以供所述第一设备基于所述联邦梯度,对己方持有的标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,并将所述第一轮待循环模型对应的所述模型损失值发送至所述第三设备。
为实现上述目的,本申请还提供一种基于向前法的联邦建模装置,所述基于向前法的联邦建模装置为虚拟装置,且所述基于向前法的联邦建模装置应用于第三设备,所述基于向前法的联邦建模装置包括:
第一生成模块,用于接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
第二生成模块,用于确定待训练模型变量集合,并基于所述特征编码集合和所述待训练模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
模型选择模块,用于接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
可选地,所述模型选择模块包括:
计算子模块,用于基于所述预设模型选择策略,计算所述模型损失值集合对应的标准值计算结果;
选取子模块,用于基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值。
本申请还提供一种基于向前法的联邦建模设备,所述基于向前法的联邦建模设备为实体设备,所述基于向前法的联邦建模设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述基于向前法的联邦建模方法的程序,所述基于向前法的联邦建模方法的程序被处理器执行时可实现如上述的基于向前法的联邦建模方法的步骤。
本申请还提供一种可读存储介质,所述可读存储介质上存储有实现基于向前法的联邦建模方法的程序,所述基于向前法的联邦建模方法的程序被处理器执行时实现如上述的基于向前法的联邦建模方法的步骤。
本申请通过接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合,并确定所述标签方特征数据集合对应的各待加入标签特征,进而获取基础训练模型,并分别将各所述待加入标签特征加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型,进而通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型,进而基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。也即,本申请在接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合后,即可进行所述标签方特征数据集合对应的各待加入标签特征的确定,进而进行所述基础训练模型的获取,并将各所述待加入标签特征分别加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型,进而通过与所述第二设备进行纵向联邦建模,对所述初始训练模型进行预设循环训练流程的各轮循环训练,其中,各轮循环训练包括所述第一轮循环训练,以在各所述待加入标签特征中循环选取对所述初始训练模型贡献大的待加入标签特征加入所述初始训练模型,获得所述目标建模模型。也即,本申请实现了循环选取对模型贡献度高的特征加入模型进行训练,以获取训练效果好的模型的目的,进而提高了联邦建模时的模型建模效果,且由于加入模型的待加入标签特征是在所述预设循环训练流程的各轮循环训练中逐步选取并加入模型的,进而在将一所述待加入标签特征加入模型之前,模型中已经存在的特征始终是对模型贡献度高的特征,进而避免了模型中同时存在多个对模型贡献度低的特征的情况发生,进而减小了联邦建模时的计算量,提高了联邦建模时的模型建模效率,所以,解决了纵向联邦建模效率低且效果差的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请基于向前法的联邦建模方法第一实施例的流程示意图;
图2为本申请基于向前法的联邦建模方法中当所述第一轮循环待选取模型为泊松回归模型时,计算所述联邦梯度的流程示意图;
图3为本申请基于向前法的联邦建模方法第二实施例的流程示意图;
图4为本申请基于向前法的联邦建模方法第三实施例的流程示意图;
图5为本申请实施例方案涉及的硬件运行环境的设备结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种基于向前法的联邦建模方法,参照图1,在本申请基于向前法的联邦建模方法的第一实施例中,基于向前法的联邦建模方法应用于第一设备,所述基于向前法的联邦建模方法包括:
步骤S10,接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合,并确定所述标签方特征数据集合对应的各待加入标签特征;
在本实施例中,需要说明的是,所述第一设备为标签提供方,也即,在进行纵向联邦建模时,所述第一设备提供的样本数据是带有样本标签的,其中,所述样本标签为所述样本数据的标识,例如,当样本数据乘以负一时,则标识所述样本数据对应的用户为非优质客户,当样本数据乘以正一时,则标识所述样本数据对应的用户为优质客户等,与所述第一设备联邦关联的第二设备为特征提供方,也即,在进行纵向联邦建模时,所述第一设备提供的样本数据是不带有样本标签的,所述第一设备和所述第二设备均为进行纵向联邦建模的联邦参与方,所述第三设备为进行纵向联邦建模的联邦协调方,所述协调方用于协调所述第一设备和所述第二设备进行纵向联邦建模,例如,进行模型选择和优化梯度等,在进行纵向联邦建模之前,所述第一设备、所述第二设备和所述第三设备三方均持有基础训练模型,所述基础训练模型为空模型或者为常数均值模型,其中,所述常数均值模型为只带有截距项的模型。
另外地,在执行所述步骤S10之前,所述第一设备将预设模型训练参数发送至所述第三设备,以供所述第三设备基于所述预设模型训练参数中的特征数量和样本数量,生成所述第一特征编码集合,其中,所述第一特征编码集合中可用表的形式进行存储,所述第一特征编码集合包括一个或者多个特征编码,其中,所述特征编码为所述待加入标签特征的标识,进一步地,获取所有不在所述基础训练模型中的待训练模型变量集合,其中,所述待训练模型变量集合中各元素可使用表的形式进行存储,所述待训练模型变量集合包括一个或者多个目标模型变量,其中,所述目标模型变量为基于所述基础训练模型进行训练的模型参数,且一所述目标模型变量对应一待加入特征,其中,所述待加入特征包括属于所述第一设备的待加入标签特征和属于所述第二设备的待加入数据特征,进而生成所述第一特征编码集合和待训练模型变量集合共同对应的标签方特征数据集合,相同地,所述第三设备将基于所述第二设备发送的特征提供方模型训练参数,生成所述特征提供方模型训练参数对应的数据方特征数据集合,其中,所述特征提供方模型训练参数包括特征数量,进一步地,所述第三设备将所述标签方特征数据集合反馈至所述第一设备,将所述数据方特征数据集合反馈至所述第二设备,以供所述第二设备进行纵向联邦建模。
接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合,并确定所述标签方特征数据集合对应的各待加入标签特征,具体地,接收所述标签方特征数据集合,并获取所述标签方特征数据集合中的第一特征编码集合,进一步地,从预设标签提供方数据库中提取用于进行所述纵向联邦建模的各建模特征,进而将所述第一特征编码集合中各特征编码分别赋予各所述建模特征,获得各所述建模特征对应的待加入标签特征。
步骤S20,获取基础训练模型,并分别将各所述待加入标签特征加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型;
在本实施例中,获取基础训练模型,并分别将各所述待加入标签特征加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型,具体地,获取基础训练模型,并在所述标签方特征数据集合中的待训练模型变量集合中确定各所述待加入标签特征对应的目标模型变量,进而分别将各所述待加入标签特征加入所述基础训练模型,并分别对各所述基础训练模型进行初始化,以分别将各所述待加入标签特征对应的目标模型变量加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型,其中,一所述标签方初始训练模型包括一所述待加入标签特征和一所述目标模型变量,例如,假设所述基础训练模型为常数均值模型,则所述基础训练模型的表达式为Y=β0,若所述标签方初始训练模型为线性回归模型,各所述加入标签特征分别为X1,X2,…,Xn,进而对应的各所述目标模型变量分别为β1,β2,…,βn,则各所述标签方初始训练模型对应的表达式分别为Y=β01X1,Y=β02X2,…,Y=β0nXn
步骤S30,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型。
在本实施例中,通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型,具体地,对于每一所述标签方初始训练模型,均执行以下步骤:
通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至达到训练结束条件,其中,所述训练结束条件包括达到最大迭代次数和损失函数收敛等,获得所述签方初始训练模型对应的第一轮循环待选取模型,其中,所述第二设备用于基于获取的数据方初始训练模型,与所述第一设备进行纵向联邦建模,其中,一所述数据方初始训练模型包括一所述待加入数据特征和所述待加入数据特征对应的目标模型变量,进而在每一所述第一轮循环待选取模型中,均包括一个由所述第一设备提供的待加入标签特征和一个由所述第二设备提供的待加入数据特征,其中,所述待加入数据特征由所述第二设备基于所述数据方特征数据集合中的第二特征编码集合对获取的用于进行纵向联邦的建模特征赋予特征编码而获得,在获得各所述第一轮循环待选取模型之后,获取各所述第一轮循环待选取模型对应的模型损失值,其中,所述模型损失值为所述第一轮循环待选取模型对应的损失函数值,进而将各所述模型损失值发送至所述第三设备,以供所述第三设备基于预设的模型选择策略,计算各所述模型损失值对应的模型标准值,其中,所述模型标准值包括AIC(Akaike information criterion,赤池信息准则)值、BIC(Bayesian Information Criterion,贝叶斯信息准则)值和P(p-value,假定值)值等,其中,AIC值对应的预设模型选择策略为AIC,BIC值对应的预设模型选择策略为BIC,P值对应的预设模型选择策略为p-value,需要说明的是,当所述模型选择策略为AIC或者BIC时,所述基础训练模型通常为空模型,当所述模型选择策略为p-value时,所述基础训练模型通常为常数均值模型,进而基于各所述模型标准值,在各所述模型损失值中选取目标模型损失值,进而第三设备所述目标模型损失值对应的第一轮循环目标模型标识发送至所述第一设备和所述第二设备,以供所述第二设备基于所述第一轮循环目标模型标识,在各所述第一轮循环待选取模型中确定第一轮循环目标模型,进一步地,所述第一设备接收所述第一轮循环目标模型标识,并基于所述第一轮循环目标模型标识,在各所述第一轮循环待选取模型中选取第一轮循环目标模型,其中,需要说明的是,在进行所述第一轮循环训练时,对于每一个所述第一轮循环待选取模型,所述第一设备和所述第二设备均至少提供一个特征,并通过进行纵向联邦建模构建所述第一轮循环待选取模型。
其中,所述第二设备在与所述第一设备进行纵向联邦建模时,提供一个或者多个待加入数据特征,
所述通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型的步骤包括:
对于每一所述标签方初始训练模型,均执行以下步骤:
步骤S31,确定所述标签方初始训练模型中的所述待加入标签特征,并获取所述待加入标签特征对应的标签特征表示矩阵;
在本实施例中,需要说明的是,所述标签特征表示矩阵用于存储所述待加入标签特征对应的样本数据编码,其中,所述标签特征表示矩阵的每一列对应一所述待加入标签特征,所述标签特征表示矩阵的每一行对应一样本,其中,一所述样本包括一个或者多个样本数据,所述样本数据编码为所述样本数据的标识。
步骤S32,基于所述标签特征表示矩阵,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,其中,所述第二设备用于基于获取所述待加入标签特征对应的数据特征表示矩阵,与所述第一设备进行纵向联邦建模;
在本实施例中,基于所述标签特征表示矩阵,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,其中,所述第二设备用于基于获取所述待加入标签特征对应的数据特征表示矩阵,与所述第一设备进行纵向联邦建模,具体地,将所述标签特征表示矩阵输入所述标签方初始训练模型,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代次数,则与所述第二设备进行纵向联邦,计算联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件,若更新后的所述标签方初始训练模型满足所述预设迭代结束条件,则将更新后的所述标签方初始训练模型作为所述第一轮循环待选取模型,若更新后的所述标签方初始训练模型不满足所述预设迭代结束条件,则继续对所述标签方初始训练模型进行迭代训练,并与所述第二设备进行纵向联邦,计算所述联邦梯度,以对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件。
其中,所述基于所述标签特征表示矩阵,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,其中,所述第二设备用于基于获取所述待加入标签特征对应的数据特征表示矩阵,与所述第一设备进行纵向联邦建模的步骤包括:
步骤S321,基于所述标签特征表示矩阵,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得模型输出值;
在本实施例中,基于所述标签特征表示矩阵,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得模型输出值,具体地,将所述标签特征表示矩阵输入所述标签方初始训练模型,对所述标签方初始训练模型进行预设迭代次数的训练,获得所述标签方初始训练模型的模型输出值,其中,所述模型输出值可用模型输出矩阵进行表示,且所述模型输出矩阵中的每一输出值与所述标签特征表示矩阵中的每一样本数据相对应。
步骤S322,获取所述标签方初始训练模型对应的第一模型参数向量,并基于所述第一模型参数向量和所述标签特征表示矩阵,计算第一中间辅助参数变量;
在本实施例中,获取所述标签方初始训练模型对应的第一模型参数向量,并基于所述第一模型参数向量和所述标签特征表示矩阵,计算第一中间辅助参数变量,具体地,当所述初始训练模型的迭代次数达到所述预设迭代次数时,获取所述标签方初始训练模型对应的第一模型参数向量,计算所述第一模型参数向量和所述标签特征表示矩阵的乘积,并将所述乘积作为所述第一中间辅助参数变量,其中,所述初始训练模型每进行一次训练,均会向所述初始训练模型加入所述待加入标签特征对应的一个或者多个样本数据,其中,所述第一模型参数向量为所述标签方初始训练模型的模型变量组成的向量,例如,假设模型的表达式为Y=β01X12X2,则所述第一模型参数向量为(β0,β1,β3)。
步骤S323,接收所述第二设备发送的第二中间辅助参数变量,其中,所述第二中间辅助参数变量由所述第二设备基于获取的第二模型参数向量和数据特征表示矩阵计算获得;
在本实施例中,需要说明的是,所述第二中间辅助参数变量为所述第二模型参数向量和所述数据特征表示矩阵的乘积,所述第二模型参数向量为数据方初始训练模型中的模型变量组成的向量,所述数据特征表示矩阵用于存储所述待加入数据特征对应的数据方样本数据编码,其中,所述数据特征表示矩阵的每一列对应一所述待加入数据特征,所述数据特征表示矩阵的每一行对应一数据方样本,其中,一所述数据方样本包括一个或者多个数据方样本数据,所述数据方样本数据编码为所述数据方样本数据的标识。
步骤S324,基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述模型输出值,计算中间参数;
在本实施例中,基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述模型输出值,计算中间参数,具体地,将所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述模型输出值输入预设中间参数计算公式,计算中间参数。
步骤S325,基于所述中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型达到所述迭代结束条件,获得所述第一轮循环待选取模型。
在本实施例中,基于所述中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型达到所述迭代结束条件,获得所述第一轮循环待选取模型,具体地,计算所述中间参数和所述标签特征表示矩阵的乘积,获得标签提供方梯度,并将所述标签提供方梯度发送至所述第三设备,将所述中间参数发送至所述第二设备,以供所述第二设备计算所述中间参数和所述数据特征表示矩阵的乘积,获得特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备,以供所述第三设备基于预设联邦规则,计算所述标签提供方梯度和所述特征提供方梯度共同对应的联邦梯度,其中,所述预设联邦规则包括求和、求平均等,进而将所述联邦梯度分别反馈至所述第一设备和所述第二设备,以供所述第二设备基于所述联邦梯度获取第一轮循环待选取模型,进一步地,所述第一设备接收所述联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行训练更新,并判断训练更新后的所述标签方初始训练模型是否达到预设迭代训练结束条件,若所述标签方初始训练模型达到所述预设迭代训练结束条件,则将所述标签方初始训练模型作为所述第一轮循环待选取模型,若所述标签方初始训练模型未达到所述预设迭代训练结束条件,则继续通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型达到所述预设迭代训练结束条件,且所述第一设备、第二设备和第三设备之间交互时,发送的数据均可进行加密发送,其中,进行加密的算法包括同态加密算法等,如图2所示为当所述第一轮循环待选取模型为泊松回归模型时,计算所述联邦梯度的流程示意图,其中,标签提供方A为所述第一设备,特征提供方B为所述第二设备,微众C为所述第三设备,wxA和exp(wxA)均为所述第二中间辅助参数变量,wxB和exp(wxB)均为所述第二中间辅助参数变量,y为所述模型输出值,d为所述中间参数,由第一设备发送至第三设备的gB为所述标签提供方梯度,由第二设备发送至第三设备的gA为所述特征提供方梯度,由所述第三设备发送至所述第一设备的gB为所述联邦梯度,由所述第三设备发送至所述第二设备的gA为所述联邦梯度,[]为加密符号,表示符号内的数据被加密了。
其中,所述第二设备持有数据方初始训练模型,
所述基于所述中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型达到所述迭代结束条件,获得所述第一轮循环待选取模型的步骤包括:
步骤A10,将所述中间参数发送至所述第二设备,以供所述第二设备基于所述数据特征表示矩阵和所述中间参数,计算特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备;
在本实施例中,需要说明的是,所述特征提供方梯度为所述数据特征表示矩阵和所述中间参数的乘积。
步骤A20,基于所述中间参数和所述标签特征表示矩阵,计算标签提供方梯度,并将所述标签提供方梯度发送至所述第三设备,以供所述第三设备基于所述特征提供方梯度和所述标签提供方梯度计算联邦梯度,并将所述联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备基于所述联邦梯度对所述数据方初始训练模型进行更新,获得所述第一轮循环待选取模型;
在本实施例中,基于所述中间参数和所述标签特征表示矩阵,计算标签提供方梯度,并将所述标签提供方梯度发送至所述第三设备,以供所述第三设备基于所述特征提供方梯度和所述标签提供方梯度计算联邦梯度,并将所述联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备基于所述联邦梯度对所述数据方初始训练模型进行更新,获得所述第一轮循环待选取模型,具体地,计算所述中间参数和所述标签特征表示矩阵的乘积,获得所述标签提供方梯度,并将所述标签提供方梯度发送至所述第三设备,以供所述第三设备基于预设联邦规则,其中,所述预设联邦规则包括求和和求平均等,计算所述特征提供方梯度和所述标签提供方梯度共同对应的联邦梯度,并将所述联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备基于所述联邦梯度对所述数据方初始训练模型进行更新,获得所述第一轮循环待选取模型。
步骤A30,接收所述第三设备反馈的所述联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件;
在本实施例中,接收所述第三设备反馈的所述联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件,具体地,接收所述第三设备反馈的所述联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型中的模型变量进行训练更新,并判断更新后的所述初始训练模型是否满足所述预设迭代结束条件,其中,所述迭代结束条件包括达到最大迭代次数、损失函数收敛等。
步骤A40,若更新后的所述标签方初始训练模型满足所述预设迭代结束条件,则将更新后的所述标签方初始训练模型作为所述第一轮循环待选取模型;
在本实施例中,需要说明的是,若更新后的所述标签方初始训练模型满足所述预设迭代结束条件,则将更新后的所述标签方初始训练模型作为所述第一轮循环待选取模型,具体地,若更新后的所述标签方初始训练模型满足所述预设迭代结束条件,则停止对所述标签方初始训练模型的迭代训练,并将迭代训练结束时获得的所述标签方初始训练模型作为所述第一轮循环待选取模型。
步骤A50,若更新后的所述标签方初始训练模型不满足所述预设迭代结束条件,则基于所述标签特征表示矩阵,重新与所述第二设备进行纵向联邦建模,以对所述标签方初始训练模型进行训练更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环待选取模型。
步骤S33,在获取各所述标签方初始训练模型对应的所述第一轮循环待选取模型之后,基于各所述第一轮循环待选取模型,通过与所述第三设备进行协调交互,在各所述待加入标签特征中确定所述第一轮循环目标标签特征,并将所述第一轮循环目标标签特征对应的所述第一轮循环待选取模型作为所述第一轮循环目标模型。
在本实施例中,需要说明的是,所述第一轮循环目标模型标识包括第一轮循环目标标签特征编码。
在获取各所述标签方初始训练模型对应的所述第一轮循环待选取模型之后,基于各所述第一轮循环待选取模型,通过与所述第三设备进行协调交互,在各所述待加入标签特征中确定所述第一轮循环目标标签特征,并将所述第一轮循环目标标签特征对应的所述第一轮循环待选取模型作为所述第一轮循环目标模型,具体地,在获取各所述标签方初始训练模型对应的所述第一轮循环待选取模型之后,将各所述第一轮循环待选取模型对应的模型损失值集合发送至所述第三设备,以供所述第三设备基于预设模型选择策略,在所述模型损失值集合中确定目标模型损失值,并将所述目标模型损失值对应的第一轮循环目标标签特征编码发送至所述第一设备和所述第二设备,以供所述第二设备基于所述第一轮循环目标标签特征编码,确定第一轮循环目标模型,进一步地,接收所述第三设备发送的第一轮循环目标标签特征编码,并基于所述第一轮循环目标标签特征编码,确定所述第一轮循环目标标签特征,其中,所述第一轮循环目标标签特征编码为所述第一轮循环目标标签特征的标识,进而将所述第一轮循环目标标签特征对应的所述第一轮循环待选取模型作为所述第一轮循环目标模型。
其中,所述基于各所述第一轮循环待选取模型,通过与所述第三设备进行协调交互,在各所述待加入标签特征中确定所述第一轮循环目标标签特征的步骤包括:
步骤S331,获取各所述第一轮循环待选取模型对应的模型损失值,并将各所述模型损失值集合发送至所述第三设备,以供所述第三设备基于预设模型选择策略,在各所述模型损失值中确定目标模型损失值,并将所述目标模型损失值对应的第一循环目标特征编码发送至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标标签特征;
在本实施例中,获取各所述第一轮循环待选取模型对应的模型损失值,并将各所述模型损失值集合发送至所述第三设备,以供所述第三设备基于预设模型选择策略,在各所述模型损失值中确定目标模型损失值,并将所述目标模型损失值对应的第一循环目标特征编码发送至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标标签特征,具体地,获取各所述第一轮循环待选取模型对应的模型损失值,并将各所述模型损失值集合发送至所述第三设备,以供所述第三设备基于预设模型选择策略,计算各所述模型所述值对应的模型标准值,并在各所述模型标准值中确定最小模型标准值,并将所述最小模型标准值对有的模型损失值作为所述目标模型损失值,并将所述目标模型损失值对应的第一循环目标特征编码发送至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标标签特征。
步骤S332,接收所述第三设备发送的所述第一轮循环目标标签特征编码,并基于所述第一轮循环目标标签特征编码,各所述待加入标签特征中确定所述第一轮循环目标标签特征。
在本实施例中,需要说明的是,所述第一轮循环目标标签特征编码为所述第一特征编码集合中所述第一轮循环目标标签特征的标识,所述第一轮循环目标标签特征为所述第一轮循环目标模型对应的所述待加入标签特征。
步骤S40,基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
在本实施例中,基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型,具体地,将各待加入标签特征中除所述第一轮循环目标模型对应的第一轮循环目标标签特征之外其他待加入标签特征作为第二轮循环标签特征,并基于各所述第二轮循环标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述第一轮循环模型进行迭代训练,直至所述第一轮循环目标模型达到预设迭代结束条件,其中,所述第二设备用于基于获取的各第二轮循环数据特征,与所述第一设备进行纵向联邦建模,其中,各所述第二轮循环数据特征为各所述待加入数据特征中除所述第一轮循环目标模型对应的第一轮循环目标数据特征之外其他待加入数据特征,其中,所述第一轮循环目标数据特征为在进行所述第一轮循环训练加入所述第一轮循环目标模型中的符合所述预设贡献度标准的待加入数据特征,进而获得各所述第二轮循环标签特征和所述第二设备在进行纵向联邦建模时提供的各第二轮循环数据特征分别对应的第二轮循环待选取模型,进而通过与所述第三设备进行协调交互,确定第二轮循环目标模型,并判断所述第二轮循环目标模型是否达到预设循环结束条件,若所述第二轮循环目标模型达到预设循环结束条件,则将所述第一轮循环目标模型作为所述目标建模模型,若所述第二轮循环目标模型未达到预设循环结束条件,基于所述第二轮循环目标模型,继续进行所述预设循环训练流程的下一轮循环训练,获得循环目标模型,直至所述循环目标模型达到预设循环结束条件,获得目标建模模型,其中,所述循环目标模型为在进行每一轮的循环训练时选取的目标模型,例如,第一轮循环目标模型、第二轮循环目标模型等,且除第一轮的循环训练之外,对于其他循环目标模型,均由所述第一设备或者所述第二设备提供一个特征在上一轮循环训练获得的循环目标模型的基础上进行构建,其中,所述预设循环结束条件包括本轮循环获得的循环目标模型对应的AIC值大于上一轮循环获得的循环目标模型对应的AIC值、本轮循环获得的循环目标模型对应的BIC值大于上一轮循环获得的循环目标模型对应的BIC值和本轮循环中最小P值大于预设P值阀值等。
其中,需要说明的是,所述目标建模模型包括风控模型,其中,所述风控模型为用于评估用户贷款风险的机器学习模型,例如,假设所述第一设备属于银行A,则各所述待加入标签特征为银行A中各目标用户的标签方用户特征,其中,所述标签方用户特征包括年龄、性别、存款数额、A银行贷款记录、信用评分等,各所述第一目标用户是带有样本标签的,其中,所述样本标签为银行A对各所述目标用户的标识,例如,可设定当样本标签为正时,则表明目标用户为低风险用户,当样本标签为负时,则表明目标用户为高风险用户等,且所述第二设备属于银行B,则各所述待加入数据特征为银行B中各所述目标用户的数据方用户特征,其中,所述数据方用户特征包括年龄、性别、B银行贷款记录等,进而基于各所述待加入标签特征和各所述待加入数据特征,A银行与B银行进行纵向联邦建模,并执行所述预设循环训练流程,即可获得所述风控模型,进而若各所述目标用户中的用户A的信息发生改变时,则需要重新对用户A进行用户贷款风险评估,具体地,将用户A对应的样本数据输入所述风控模型,对用户A进行用户贷款风险评估,获得贷款风险评分,其中,所述贷款风险评分为用户贷款风险的标识,例如,可设定当用户当贷款风险评分高于80分时,则判定用户贷款风险低,当用户贷款风险评分低于60分时,则判定用户贷款风险高等,其中,由于所述风控模型是基于进行纵向联邦建模和执行所述预设循环训练流程而获得的,进而所述风控模型为基于对模型贡献度高的特征进行纵向联邦建模而获得的,进而提高了风控模型的建模效果和建模效率,进而使得风控模型对各所述目标用户的贷款风险评估更准确,也即,提高了风控模型的贷款风险评估准确率。
所述预设循环训练流程包括第二轮循环训练,且在进行所述第二轮循环训练时,所述第一设备提供一个或者多个第二轮循环标签特征,所述第二设备提供一个或者多个第二轮循环数据特征,
所述基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型的步骤包括:
步骤S41,基于各所述第二轮循环标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述第一轮循环目标模型进行所述第二轮循环训练,获得第二轮循环待选取模型集合,其中,所述第二设备用于基于各所述第二轮循环数据特征,与所述第一设备进行纵向联邦建模;
在本实施例中,基于各所述第二轮循环标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述第一轮循环目标模型进行所述第二轮循环训练,获得第二轮循环待选取模型集合,其中,所述第二设备用于基于各所述第二轮循环数据特征,与所述第一设备进行纵向联邦建模,具体地,分别将各所述第二轮循环标签特征加入所述第一轮循环目标模型,获得各所述第二轮循环标签特征对应第二轮标签方初始训练模型,基于各所述第二轮标签方初始训练模型和所述第一轮循环目标模型,与所述第二设备进行纵向联邦建模,其中,所述第二设备用于在进行纵向联邦建模时,提供各所述第二轮循环数据特征对应第二轮数据方初始训练模型和第一轮循环目标模型,进而获得第二轮循环待选取模型集合,其中,所述第二轮循环待选取模型集合包括一个或者多个第二轮循环待选取模型,其中,每一所述第二轮循环待选取模型基于所述第一设备提供的一个所述第二轮标签方初始训练模型和所述第二设备提供的一个所述第一轮循环目标模型进行纵向联邦而获得,或者由所述第一设备提供的一个所述第一轮循环目标模型和所述第二设备提供的一个所述第二轮数据方初始训练模型进行纵向联邦而获得。
其中,各所述第二轮循环待选取模型包括一个或者多个第二轮标签方待选取模型和第二轮数据方待选取模型,
所述基于各所述第二轮循环标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述第一轮循环目标模型进行所述第二轮循环训练,获得第二轮循环待选取模型集合,其中,所述第二设备用于基于各所述第二轮循环数据特征,与所述第一设备进行纵向联邦建模的步骤包括:
步骤S411,对于每一所述第二轮循环标签特征均执行以下步骤:
将所述第二轮循环标签特征加入所述第一轮循环目标模型,并通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮标签方待选取模型;
在本实施例中,将所述第二轮循环标签特征加入所述第一轮循环目标模型,并通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮标签方待选取模型,具体地,将所述第二轮循环标签特征加入所述第一轮循环目标模型,并通过与所述第二设备进行纵向联邦建模,与所述第三设备进行交互,对所述第一轮循环目标模型进行迭代训练,计算第二轮联邦梯度,并基于所述第二轮联邦梯度,对所述第一轮循环目标模型进行更新,直至更新后的所述第一轮循环目标模型满足预设迭代结束条件,获得所述第二轮标签方待选取模型,其中,在进行纵向联邦建模时,所述第一设备提供用于加入了所述第二轮循环标签特征的所述第一轮循环目标模型,所述第二设备提供所述第一轮循环目标模型。
步骤S412,对于每一所述第二轮循环数据特征均执行以下步骤:
接收所述第二设备发送的辅助参数变量,并基于所述辅助参数变量,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮数据方待选取模型,其中,所述辅助参数变量由所述第二设备基于所述第二轮循环数据特征计算获得。
在本实施例中,接收所述第二设备发送的辅助参数变量,并基于所述辅助参数变量,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮数据方待选取模型,其中,所述辅助参数变量由所述第二设备基于所述第二轮循环数据特征计算获得,具体地,接收所述第二设备发送的辅助参数变量,并基于所述辅助参数变量,计算第二轮循环中间参数,并基于所述第二轮循环中间参数和第一设备中的第一轮循环目标标签特征对应的特征表示矩阵,计算第二轮标签提供方梯度,并将所述第二轮标签提供方梯度发送至所述第三设备,并将所述第二轮循环中间参数发送至所述第二设备,以供所述第二设备计算所述第一轮循环目标数据特征对应的特征表示矩阵和所述第二轮循环中间参数的乘积,获得第二轮特征提供方梯度,并将所述第二轮特征提供方梯度发送至所述第三设备,以供所述第三设备基于所述第二轮标签提供方梯度和所述第二轮特征提供方梯度计算第二轮联邦梯度,并将所述第二轮联邦特征分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备基于所述第二轮联邦梯度,对所述第一轮循环目标模型进行更新,直至更新所述第一轮循环目标模型达到预设迭代结束条件,获得第二轮数据方待选取模型,其中,所述进行纵向联邦建模时,所述第一设备通过一个所述第一轮循环目标模型,所述第二设备提供了一个加入了所述第二轮循环数据特征的所述第一轮循环目标模型。
步骤S42,通过与所述第三设备进行协调交互,在所述第二轮循环待选取模型集合中确定第二轮循环目标模型,并确定所述第二轮循环目标模型是否满足所述预设循环结束条件;
在本实施例中,通过与所述第三设备进行协调交互,在所述第二轮循环待选取模型集合中确定第二轮循环目标模型,并确定所述第二轮循环目标模型是否满足所述预设循环结束条件,具体地,将所述第二轮循环待选取模型集合对应的第二轮模型损失值集合发送至所述第三设备,以供所述第三设备基于预设模型选择策略,确定所述第二轮模型损失值集合中的第二轮目标模型损失值,并将所述第二轮目标模型损失值对应的第二轮循环目标特征编码发送至所述第一设备和所述第二设备,以供所述第二设备确定所述第二轮循环目标模型,进而接收所述第三设备发送的所述第二轮循环目标特征编码,并基于所述第二轮循环目标特征编码,确定所述第二轮循环目标模型。
步骤S43,若所述第二轮循环目标模型满足所述预设循环结束条件,则将所述第一轮循环目标模型作为所述目标建模模型;
在本实施例中,若所述第二轮循环目标模型满足所述预设循环结束条件,则将所述第一轮循环目标模型作为所述目标建模模型,具体地,若所述第二轮循环目标模型满足所述预设循环结束条件,则跳出所述预设循环训练流程,并将所述第一轮循环目标模型作为所述目标建模模型。
步骤S44,若所述第二轮循环目标模型不满足所述预设循环结束条件,则基于所述预设循环训练流程,对所述第二轮循环目标模型进行循环训练,直至所述第二轮循环目标模型满足预设循环训练结束条件,获得所述目标建模模型。
在本实施例中,需要说明的是,所述预设循环训练流程包括一轮或者多个循环训练,当在某一轮循环训练时达到了所述预设循环结束条件,则将该轮的上一轮获得循环目标模型作为所述目标建模模型。
本实施例通过接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合,并确定所述标签方特征数据集合对应的各待加入标签特征,进而获取基础训练模型,并分别将各所述待加入标签特征加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型,进而通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型,进而基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。也即,本实施例在接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合后,即可进行所述标签方特征数据集合对应的各待加入标签特征的确定,进而进行所述基础训练模型的获取,并将各所述待加入标签特征分别加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型,进而通过与所述第二设备进行纵向联邦建模,对所述初始训练模型进行预设循环训练流程的各轮循环训练,其中,各轮循环训练包括所述第一轮循环训练,以在各所述待加入标签特征中循环选取对所述初始训练模型贡献大的待加入标签特征加入所述初始训练模型,获得所述目标建模模型。也即,本实施例实现了循环选取对模型贡献度高的特征加入模型进行训练,以获取训练效果好的模型的目的,进而提高了联邦建模时的模型建模效果,且由于加入模型的待加入标签特征是在所述预设循环训练流程的各轮循环训练中逐步选取并加入模型的,进而在将一所述待加入标签特征加入模型之前,模型中已经存在的特征始终是对模型贡献度高的特征,进而避免了模型中同时存在多个对模型贡献度低的特征的情况发生,进而减小了联邦建模时的计算量,提高了联邦建模时的模型建模效率,所以,解决了纵向联邦建模效率低且效果差的技术问题。
进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,所述基于向前法的联邦建模方法应用于第二设备,所述基于向前法的联邦建模方法包括:
步骤B10,接收与所述第二设备协调关联的第三设备发送的数据方特征数据集合,并确定所述数据方特征数据集合对应的各待加入数据特征;
在本实施例中,所述数据方特征数据集合包括特征编码集合和待训练模型变量集合。
接收与所述第二设备协调关联的第三设备发送的数据方特征数据集合,并确定所述数据方特征数据集合对应的各待加入数据特征,具体地,接收所述数据方特征数据集合,并获取所述数据方特征数据集合中的特征编码集合,进一步地,从预设特征提供方数据库中提取用于进行所述纵向联邦建模的各建模特征,进而将所述特征编码集合中各特征编码分别赋予各所述建模特征,获得各所述建模特征对应的待加入数据特征。
步骤B20,获取基础训练模型,将各所述待加入数据特征分别加入所述基础训练模型,获得各所述待加入数据特征对应的数据方初始训练模型;
在本实施例中,获取基础训练模型,将各所述待加入数据特征分别加入所述基础训练模型,获得各所述待加入数据特征对应的数据方初始训练模型,具体地,获取基础训练模型,并在所述数据方特征数据集合中的待训练模型变量集合中确定各所述待加入数据特征对应的目标模型变量,分别将各所述待加入数据特征加入所述基础训练模型,并分别对各所述基础训练模型进行初始化,以分别将各所述待加入数据特征对应的目标模型变量加入所述基础训练模型,获得各所述待加入数据特征对应的数据方初始训练模型,其中,一所述数据方初始训练模型包括一所述待加入数据特征和一所述目标模型变量。
步骤B30,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,分别对各所述数据方初始训练模型进行预设循环训练流程的第一轮循环训练,以协助所述第一设备计算模型损失值结果,并将所述模型损失值结果发送至所述第三设备;
在本实施例中,通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,分别对各所述数据方初始训练模型进行预设循环训练流程的第一轮循环训练,以协助所述第一设备计算模型损失值结果,并将所述模型损失值结果发送至所述第三设备,具体地,针对于每一所述数据方初始训练模型,均执行以下步骤:
获取所述数据方初始训练模型对应的待加入数据特征的特征表示矩阵,并基于所述特征表示矩阵,与所述第一设备进行纵向联邦建模,对所述数据方初始训练模型进行迭代训练,以协助所述第一设备计算联邦梯度,以供所述第一设备基于所述联邦梯度,对所述数据方初始训练模型,直至所述数据方初始训练模型达到预设迭代结束条件,获得各所述数据方初始训练模型对应的第一轮循环待选取模型,进而所述第一设备在获得各所述第一轮循环待选取模型之后,获取各所述第一轮循环待选取模型共同对应的模型损失值结果,并将所述模型损失值结果发送至所述第三设备,以供所述第三设备基于预设模型选择策略,确定所述模型损失值结果对应的目标特征编码。
步骤B40,接收所述第三设备基于所述模型损失值结果反馈的目标特征编码,并基于所述目标特征编码,确定对应的第一轮循环目标模型;
在本实施例中,需要说明的是,所述目标特征编码为第一轮循环目标数据特征的标识,所述第一轮循环目标数据特征为所述第一轮循环目标模型中的待加入数据特征。
步骤B50,基于所述预设循环训练流程,通过与所述第一设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
在本实施例中,基于所述预设循环训练流程,通过与所述第一设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型,具体地,基于所述第一轮循环目标模型,通过与所述第一设备进行纵向联邦建模,进行所述预设循环训练流程的下一轮循环训练,获得第二轮循环目标模型,并判断所述第二轮循环目标模型是否达到预设循环结束条件,若所述第二轮循环目标模型达到预设循环结束条件,则将所述第一轮循环目标模型作为所述目标建模模型,若所述第二轮循环目标模型未达到预设循环结束条件,则继续进行预设循环训练流程的下一轮循环训练,获得循环目标模型,直至所述循环目标模型达到预设循环结束条件,获得目标建模模型,其中,所述循环目标模型包括第一轮循环目标模型和第二循环目标模型。
其中,所述模型损失值集合包括一个或者多个模型损失值,
所述通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,分别对各所述数据方初始训练模型进行预设循环训练流程的第一轮循环训练,以协助所述第一设备计算模型损失值结果,并将所述模型损失值结果发送至所述第三设备的步骤包括:
步骤B51,对于每一所述待加入数据特征均执行以下步骤:
基于所述待加入数据特征,对所述数据方初始训练模型进行迭代训练,直至所述数据方初始训练模型达到预设迭代次数,则获取所述数据方初始训练模型对应的模型参数向量,并基于所述模型参数向量和所述待加入数据特征对应的数据特征表示矩阵,计算辅助中间参数变量,并将所述辅助中间参数变量发送至所述第一设备,以供所述第一设备基于所述辅助中间参数变量计算中间参数和标签提供方梯度,并将所述中间参数发送至所述第二设备,将所述标签提供方梯度发送至所述第三设备;
在本实施例中,具体地,获取所述数据方初始训练模型对应的模型参数向量,并计算所述模型参数向量和所述待加入数据特征对应的数据特征表示矩阵的乘积,获得所述辅助中间参数变量,并将所述辅助中间参数变量发送至所述第一设备,以供所述第一设备基于所述辅助中间参数变量计算中间参数,进而基于所述中间参数和所述第一设备己方持有的待加入标签特征对应的标签特征表示矩阵计算标签提供方梯度,并将所述中间参数发送至所述第二设备,将所述标签提供方梯度发送至所述第三设备。
步骤B52,接收所述第一设备反馈的所述中间参数,并基于所述中间参数计算特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备,以供所述第三设备基于所述标签提供方梯度和所述特征提供方梯度计算联邦梯度,并将所述联邦梯度发送至所述第一设备,以供所述第一设备基于所述联邦梯度,对己方持有的标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,并将所述第一轮待循环模型对应的所述模型损失值发送至所述第三设备。
在本实施例中,具体地,接收所述第一设备反馈的所述中间参数,并计算所述中间参数和所述数据特征表示矩阵的乘积,获得所述特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备,以供所述第三设备基于预设联邦规则,计算所述标签提供方梯度和所述特征提供方梯度共同对应的联邦梯度,并将所述联邦梯度发送至所述第一设备,以供所述第一设备基于所述联邦梯度,对己方持有的标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,并将所述第一轮待循环模型对应的模型损失值发送至所述第三设备。
本实施例通过接收与所述第二设备协调关联的第三设备发送的数据方特征数据集合,并确定所述数据方特征数据集合对应的各待加入数据特征,进而获取基础训练模型,将各所述待加入数据特征分别加入所述基础训练模型,获得各所述待加入数据特征对应的数据方初始训练模型,进而通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,分别对各所述数据方初始训练模型进行预设循环训练流程的第一轮循环训练,以协助所述第一设备计算模型损失值结果,并将所述模型损失值结果发送至所述第三设备,进而接收所述第三设备基于所述模型损失值结果反馈的目标特征编码,并基于所述目标特征编码,确定对应的第一轮循环目标模型,进而基于所述预设循环训练流程,通过与所述第一设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。也即,本实施例提供了一种协助所述第一设备获取目标建模模型的方法,也即通过与所述第一设备进行纵向联邦建模,对所述数据初始训练模型进行循环训练,进而协助所述第一设备对所述标签方初始训练模型进行循环训练,获得所述目标建模模型,进而实现了协助第一设备循环选取对模型贡献度高的特征加入模型进行训练,以获取训练效果好的模型的目的,进而提高了联邦建模时的模型建模效果,且由于加入模型的待加入标签特征是在所述预设循环训练流程的各轮循环训练中逐步选取并加入模型的,进而实现了在将一所述待加入标签特征加入模型之前,模型中已经存在的特征始终是对模型贡献度高的特征,进而避免了模型中同时存在多个对模型贡献度低的特征的情况发生,进而减小了联邦建模时的计算量,提高了联邦建模时的模型建模效率,所以,为解决了纵向联邦建模效率低且效果差的技术问题奠定了基础。
进一步地,参照图4,基于本申请中第一实施例和第二实施例,在本申请的另一实施例中,所述基于向前法的联邦建模方法应用于第三设备,所述基于向前法的联邦建模方法包括:
步骤C10,接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
在本实施例中,所述模型训练参数包括特征数量和样本数量。
接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合,具体地,接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数中的特征数量,生成特征编码集合,例如,假设所述特征数量为k,则生成的特征编码集合为(1,2,3,…,k)。
步骤C20,确定待训练模型变量集合,并基于所述特征编码集合和所述待训练模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
在本实施例中,需要说明的是,所述待训练模型变量集合包括一个或者多个待训练模型变量,所述待训练模型变量为不在模型中的需要进行训练更新的模型参数,所述第一模型训练数据包括待训练模型变量集合和属于第一设备的第一特征编码集合,所述第一特征编码集合包括一个或者多个第一特征编码,所述第一特征编码为所述第一设备中各待加入标签特征的标识,所述第二模型训练数据包括待训练模型变量集合和属于第二设备的第二特征编码集合,所述第二特征编码集合包括一个或者多个第二特征编码,所述第二特征编码为所述第二设备中各待加入数据特征的标识。
确定待训练模型变量集合,并基于所述特征编码集合和所述待训练模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合,具体地,确定定待训练模型变量集合,并基于所述特征编码集合和所述待训练模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备和所述第二设备同时在所述待训练模型变量集合中选取目标训练变量加入基础训练模型,获得初始训练模型,进而所述第一设备基于所述第一特征编码集合选取多个待加入标签特征分别加入所述初始训练模型,通过与所述第二设备进行纵向联邦建模,计算模型损失值集合,其中,在进行纵向联邦建模时,所述第二设备将基于所述第二特征编码集合选取多个待加入数据特征分别加入所述初始训练模型。
步骤C30,接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
在本实施例中,需要说明的时,所述预设模型选择策略包括适用于所有参数模型的第一类型模型选择策略和适用于线性模型的第二类型模型选择策略。
接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型,具体地,接收所述第一设备反馈的模型损失值集合,并基于预设模型选择策略,计算所述模型损失值集合中各元素对应的标准值,获得标准值计算结果,基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值,基于所述模型标准值对应的目标特征编码更新并存储所述第一模型训练数据和所述第二模型训练数据,并将更新后的所述第一模型训练数据发送至所述第一设备,将更新后的所述第二模型训练数据发送至第二设备,以供所述第一设备基于更新后的所述第一模型训练数据确定第一轮循环目标模型,所述第二设备基于更新后的所述第二模型训练数据确定第一轮循环目标模型,进而所述第一设备和所述第二设备将基于所述第一轮循环目标模型继续进行循环训练,获得循环目标模型,直至所述循环目标模型达到预设循环结束条件,将所述循环目标模型作为所述目标建模模型,其中,所述循环目标模型包括第一循环模型模型。
其中,所述通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值的步骤包括:
步骤C31,基于所述预设模型选择策略,计算所述模型损失值集合对应的标准值计算结果;
在本实施例中,需要说明的是,所述第一类型模型选择策略包括AIC和BIC,所述标准值计算结果包括一个或者多个模型标准值,当所述预设模型选择策略为AIC时,对应的所述模型标准值为AIC值,当所述预设模型选择策略为BIC时,对应的所述模型标准值为BIC值,所述第二类型模型选择策略包括p-value,当所述预设模型选择策略为p-value时,对应的所述模型标准值为P值。
步骤C32,基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值。
在本实施例中,基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值,具体地,在所述标准值计算结果中选取最小模型标准值,并将所述最小模型标准值对应的模型损失值作为所述目标模型损失值。
本实施例通过接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合,进而确定待训练模型变量集合,并基于所述特征编码集合和所述待训练模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合,进而接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。也即,本实施例提供了一种通过协调所述第一设备和所述第二设备进行纵向联邦建模和协助第一设备确定循环目标模型,协助所述第一设备和所述第二设备对所述初始训练进行循环训练的方法,也即,通过计算联邦梯度协调所述第一设备和所述第二设备进行纵向联邦建模,通过选取目标模型损失值协助第一设备确定循环目标模型,进而协助了所述第一设备和所述第二设备对所述初始训练模型进行循环训练,获得所述目标建模模型,所以,为解决纵向联邦建模效率低且效果差的技术问题奠定了基础。
参照图5,图5是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
如图5所示,该基于向前法的联邦建模设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该基于向前法的联邦建模设备还可以包括矩形用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图5中示出的基于向前法的联邦建模设备结构并不构成对基于向前法的联邦建模设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图5所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及基于向前法的联邦建模程序。操作系统是管理和控制基于向前法的联邦建模设备硬件和软件资源的程序,支持基于向前法的联邦建模程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与基于向前法的联邦建模系统中其它硬件和软件之间通信。
在图5所示的基于向前法的联邦建模设备中,处理器1001用于执行存储器1005中存储的基于向前法的联邦建模程序,实现上述任一项所述的基于向前法的联邦建模方法的步骤。
本申请基于向前法的联邦建模设备具体实施方式与上述基于向前法的联邦建模方法各实施例基本相同,在此不再赘述。
本申请实施例提供一种基于向前法的联邦建模装置,所述基于向前法的联邦建模装置应用于第一设备,所述基于向前法的联邦建模装置包括:
确定模块,用于接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合,并确定所述标签方特征数据集合对应的各待加入标签特征;
加入模块,用于获取基础训练模型,并分别将各所述待加入标签特征加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型;
第一循环训练模块,用于通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型;
循环训练模块,用于基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
可选地,所述第一循环训练模块包括:
确定子模块,用于确定所述标签方初始训练模型中的所述待加入标签特征,并获取所述待加入标签特征对应的标签特征表示矩阵;
第一联邦子模块,用于基于所述标签特征表示矩阵,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,其中,所述第二设备用于基于获取所述待加入标签特征对应的数据特征表示矩阵,与所述第一设备进行纵向联邦建模;
协调交互子模块,用于在获取各所述标签方初始训练模型对应的所述第一轮循环待选取模型之后,基于各所述第一轮循环待选取模型,通过与所述第三设备进行协调交互,在各所述待加入标签特征中确定所述第一轮循环目标标签特征,并将所述第一轮循环目标标签特征对应的所述第一轮循环待选取模型作为所述第一轮循环目标模型。
可选地,所述第一联邦子模块包括:
迭代训练单元,用于基于所述标签特征表示矩阵,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得模型输出值;
第一计算单元,用于获取所述标签方初始训练模型对应的第一模型参数向量,并基于所述第一模型参数向量和所述标签特征表示矩阵,计算第一中间辅助参数变量;
接收单元,用于接收所述第二设备发送的第二中间辅助参数变量,其中,所述第二中间辅助参数变量由所述第二设备基于获取的第二模型参数向量和数据特征表示矩阵计算获得;
第二计算单元,用于基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述模型输出值,计算中间参数;
更新单元,用于基于所述中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型达到所述迭代结束条件,获得所述第一轮循环待选取模型。
可选地,所述更新单元包括:
第一计算子单元,用于将所述中间参数发送至所述第二设备,以供所述第二设备基于所述数据特征表示矩阵和所述中间参数,计算特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备;
第二计算子单元,用于基于所述中间参数和所述标签特征表示矩阵,计算标签提供方梯度,并将所述标签提供方梯度发送至所述第三设备,以供所述第三设备基于所述特征提供方梯度和所述标签提供方梯度计算联邦梯度,并将所述联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备基于所述联邦梯度对所述数据方初始训练模型进行更新,获得所述第一轮循环待选取模型;
更新子单元,用于若更新后的所述标签方初始训练模型满足所述预设迭代结束条件,则将更新后的所述标签方初始训练模型作为所述第一轮循环待选取模型;
第一判断子单元,若更新后的所述标签方初始训练模型满足所述预设迭代结束条件,则将更新后的所述标签方初始训练模型作为所述第一轮循环待选取模型;
第二判断子单元,用于若更新后的所述标签方初始训练模型不满足所述预设迭代结束条件,则基于所述标签特征表示矩阵,重新与所述第二设备进行纵向联邦建模,以对所述标签方初始训练模型进行训练更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环待选取模型。
可选地,所述协调交互子模块包括:
发送单元,用于获取各所述第一轮循环待选取模型对应的模型损失值,并将各所述模型损失值集合发送至所述第三设备,以供所述第三设备基于预设模型选择策略,在各所述模型损失值中确定目标模型损失值,并将所述目标模型损失值对应的第一循环目标特征编码发送至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标标签特征;
确定单元,用于接收所述第三设备发送的所述第一轮循环目标标签特征编码,并基于所述第一轮循环目标标签特征编码,各所述待加入标签特征中确定所述第一轮循环目标标签特征。
可选地,所述循环训练模块包括:
第二联邦子模块,用于基于各所述第二轮循环标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述第一轮循环目标模型进行所述第二轮循环训练,获得第二轮循环待选取模型集合,其中,所述第二设备用于基于各所述第二轮循环数据特征,与所述第一设备进行纵向联邦建模;
协调交互子模块,用于通过与所述第三设备进行协调交互,在所述第二轮循环待选取模型集合中确定第二轮循环目标模型,并确定所述第二轮循环目标模型是否满足所述预设循环结束条件;
第一判定子模块,用于若所述第二轮循环目标模型满足所述预设循环结束条件,则将所述第一轮循环目标模型作为所述目标建模模型;
第二判定子模块,用于若所述第二轮循环目标模型不满足所述预设循环结束条件,则基于所述预设循环训练流程,对所述第二轮循环目标模型进行循环训练,直至所述第二轮循环目标模型满足预设循环训练结束条件,获得所述目标建模模型。
可选地,所述第二联邦子模块包括:
第一联邦单元,用于将所述第二轮循环标签特征加入所述第一轮循环目标模型,并通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮标签方待选取模型;
第二联邦单元,用于接收所述第二设备发送的辅助参数变量,并基于所述辅助参数变量,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮数据方待选取模型,其中,所述辅助参数变量由所述第二设备基于所述第二轮循环数据特征计算获得。
本申请基于向前法的联邦建模装置的具体实施方式与上述基于向前法的联邦建模方法各实施例基本相同,在此不再赘述。
为实现上述目的,本申请实施例还提供一种基于向前法的联邦建模装置,所述基于向前法的联邦建模方法应用于第二设备,所述基于向前法的联邦建模装置包括:
接收模块,用于接收与所述第二设备协调关联的第三设备发送的数据方特征数据集合,并确定所述数据方特征数据集合对应的各待加入数据特征;
加入模块,用于获取基础训练模型,将各所述待加入数据特征分别加入所述基础训练模型,获得各所述待加入数据特征对应的数据方初始训练模型;
联邦模块,用于通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,分别对各所述数据方初始训练模型进行预设循环训练流程的第一轮循环训练,以协助所述第一设备计算模型损失值结果,并将所述模型损失值结果发送至所述第三设备;
确定模块,用于接收所述第三设备基于所述模型损失值结果反馈的目标特征编码,并基于所述目标特征编码,确定对应的第一轮循环目标模型;
循环模块,用于基于所述预设循环训练流程,通过与所述第一设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
可选地,所述联邦模块包括:
迭代训练子模块,用于基于所述待加入数据特征,对所述数据方初始训练模型进行迭代训练,直至所述数据方初始训练模型达到预设迭代次数,则获取所述数据方初始训练模型对应的模型参数向量,并基于所述模型参数向量和所述待加入数据特征对应的数据特征表示矩阵,计算辅助中间参数变量,并将所述辅助中间参数变量发送至所述第一设备,以供所述第一设备基于所述辅助中间参数变量计算中间参数和标签提供方梯度,并将所述中间参数发送至所述第二设备,将所述标签提供方梯度发送至所述第三设备;
联邦子模块,用于接收所述第一设备反馈的所述中间参数,并基于所述中间参数计算特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备,以供所述第三设备基于所述标签提供方梯度和所述特征提供方梯度计算联邦梯度,并将所述联邦梯度发送至所述第一设备,以供所述第一设备基于所述联邦梯度,对己方持有的标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,并将所述第一轮待循环模型对应的所述模型损失值发送至所述第三设备。
本申请基于向前法的联邦建模装置的具体实施方式与上述基于向前法的联邦建模方法各实施例基本相同,在此不再赘述。
为实现上述目的,本申请实施例还提供一种基于向前法的联邦建模装置,所述基于向前法的联邦建模方法应用于第三设备,所述基于向前法的联邦建模装置包括:
第一生成模块,用于接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
第二生成模块,用于确定待训练模型变量集合,并基于所述特征编码集合和所述待训练模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
模型选择模块,用于接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
可选地,所述模型选择模块包括:
计算子模块,用于基于所述预设模型选择策略,计算所述模型损失值集合对应的标准值计算结果;
选取子模块,用于基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值。
本申请基于向前法的联邦建模装置的具体实施方式与上述基于向前法的联邦建模方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于向前法的联邦建模方法的步骤。
本申请可读存储介质具体实施方式与上述基于向前法的联邦建模方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (13)

1.一种基于向前法的联邦建模方法,其特征在于,所述基于向前法的联邦建模方法应用于第一设备,所述基于向前法的联邦建模方法包括:
接收与所述第一设备协调关联的第三设备发送的标签方特征数据集合,并确定所述标签方特征数据集合对应的各待加入标签特征;
获取基础训练模型,并分别将各所述待加入标签特征加入所述基础训练模型,获得各所述待加入标签特征对应的标签方初始训练模型;
通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型;
基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
2.如权利要求1所述基于向前法的联邦建模方法,其特征在于,所述第二设备在与所述第一设备进行纵向联邦建模时,提供一个或者多个待加入数据特征,
所述通过与所述第一设备联邦关联的第二设备进行纵向联邦建模,分别对各所述标签方初始训练模型进行预设循环训练流程的第一轮循环训练,以在各所述待加入标签特征中选取符合预设贡献度标准的第一轮循环目标标签特征加入所述标签方初始训练模型,获得第一轮循环目标模型的步骤包括:
对于每一所述标签方初始训练模型,均执行以下步骤:
确定所述标签方初始训练模型中的所述待加入标签特征,并获取所述待加入标签特征对应的标签特征表示矩阵;
基于所述标签特征表示矩阵,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,其中,所述第二设备用于基于获取所述待加入标签特征对应的数据特征表示矩阵,与所述第一设备进行纵向联邦建模;
在获取各所述标签方初始训练模型对应的所述第一轮循环待选取模型之后,基于各所述第一轮循环待选取模型,通过与所述第三设备进行协调交互,在各所述待加入标签特征中确定所述第一轮循环目标标签特征,并将所述第一轮循环目标标签特征对应的所述第一轮循环待选取模型作为所述第一轮循环目标模型。
3.如权利要求2所述基于向前法的联邦建模方法,其特征在于,所述基于所述标签特征表示矩阵,通过与所述第二设备进行纵向联邦建模,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,其中,所述第二设备用于基于获取所述待加入标签特征对应的数据特征表示矩阵,与所述第一设备进行纵向联邦建模的步骤包括:
基于所述标签特征表示矩阵,对所述标签方初始训练模型进行迭代训练,直至所述标签方初始训练模型满足预设迭代次数,获得模型输出值;
获取所述标签方初始训练模型对应的第一模型参数向量,并基于所述第一模型参数向量和所述标签特征表示矩阵,计算第一中间辅助参数变量;
接收所述第二设备发送的第二中间辅助参数变量,其中,所述第二中间辅助参数变量由所述第二设备基于获取的第二模型参数向量和数据特征表示矩阵计算获得;
基于所述第一中间辅助参数变量、所述第二中间辅助参数变量和所述模型输出值,计算中间参数;
基于所述中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型达到所述迭代结束条件,获得所述第一轮循环待选取模型。
4.如权利要求3所述基于向前法的联邦建模方法,其特征在于,所述第二设备持有数据方初始训练模型,
所述基于所述中间参数,通过分别与所述第二设备和所述第三设备进行交互,获取联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型达到所述迭代结束条件,获得所述第一轮循环待选取模型的步骤包括:
将所述中间参数发送至所述第二设备,以供所述第二设备基于所述数据特征表示矩阵和所述中间参数,计算特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备;
基于所述中间参数和所述标签特征表示矩阵,计算标签提供方梯度,并将所述标签提供方梯度发送至所述第三设备,以供所述第三设备基于所述特征提供方梯度和所述标签提供方梯度计算联邦梯度,并将所述联邦梯度反馈至所述第一设备和所述第二设备,以供所述第二设备基于所述联邦梯度对所述数据方初始训练模型进行更新,获得所述第一轮循环待选取模型;
接收所述第三设备反馈的所述联邦梯度,并基于所述联邦梯度,对所述标签方初始训练模型进行更新,并判断更新后的所述标签方初始训练模型是否满足所述预设迭代结束条件;
若更新后的所述标签方初始训练模型满足所述预设迭代结束条件,则将更新后的所述标签方初始训练模型作为所述第一轮循环待选取模型;
若更新后的所述标签方初始训练模型不满足所述预设迭代结束条件,则基于所述标签特征表示矩阵,重新与所述第二设备进行纵向联邦建模,以对所述标签方初始训练模型进行训练更新,直至更新后的所述标签方初始训练模型满足所述预设迭代结束条件,获得所述第一轮循环待选取模型。
5.如权利要求2所述基于向前法的联邦建模方法,其特征在于,所述基于各所述第一轮循环待选取模型,通过与所述第三设备进行协调交互,在各所述待加入标签特征中确定所述第一轮循环目标标签特征的步骤包括:
获取各所述第一轮循环待选取模型对应的模型损失值,并将各所述模型损失值集合发送至所述第三设备,以供所述第三设备基于预设模型选择策略,在各所述模型损失值中确定目标模型损失值,并将所述目标模型损失值对应的第一循环目标特征编码发送至所述第一设备和所述第二设备,以供所述第二设备确定所述第一轮循环目标标签特征;
接收所述第三设备发送的所述第一轮循环目标标签特征编码,并基于所述第一轮循环目标标签特征编码,各所述待加入标签特征中确定所述第一轮循环目标标签特征。
6.如权利要求1所述基于向前法的联邦建模方法,其特征在于,所述预设循环训练流程包括第二轮循环训练,且在进行所述第二轮循环训练时,所述第一设备提供一个或者多个第二轮循环标签特征,所述第二设备提供一个或者多个第二轮循环数据特征,
所述基于所述预设循环训练流程,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型的步骤包括:
基于各所述第二轮循环标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述第一轮循环目标模型进行所述第二轮循环训练,获得第二轮循环待选取模型集合,其中,所述第二设备用于基于各所述第二轮循环数据特征,与所述第一设备进行纵向联邦建模;
通过与所述第三设备进行协调交互,在所述第二轮循环待选取模型集合中确定第二轮循环目标模型,并确定所述第二轮循环目标模型是否满足所述预设循环结束条件;
若所述第二轮循环目标模型满足所述预设循环结束条件,则将所述第一轮循环目标模型作为所述目标建模模型;
若所述第二轮循环目标模型不满足所述预设循环结束条件,则基于所述预设循环训练流程,对所述第二轮循环目标模型进行循环训练,直至所述第二轮循环目标模型满足预设循环训练结束条件,获得所述目标建模模型。
7.如权利要求6所述基于向前法的联邦建模方法,其特征在于,各所述第二轮循环待选取模型包括一个或者多个第二轮标签方待选取模型和第二轮数据方待选取模型,
所述基于各所述第二轮循环标签特征,通过与所述第二设备进行纵向联邦建模,分别对所述第一轮循环目标模型进行所述第二轮循环训练,获得第二轮循环待选取模型集合,其中,所述第二设备用于基于各所述第二轮循环数据特征,与所述第一设备进行纵向联邦建模的步骤包括:
对于每一所述第二轮循环标签特征均执行以下步骤:
将所述第二轮循环标签特征加入所述第一轮循环目标模型,并通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮标签方待选取模型;
对于每一所述第二轮循环数据特征均执行以下步骤:
接收所述第二设备发送的辅助参数变量,并基于所述辅助参数变量,通过与所述第二设备进行纵向联邦建模,对所述第一轮循环目标模型进行迭代训练,获得第二轮数据方待选取模型,其中,所述辅助参数变量由所述第二设备基于所述第二轮循环数据特征计算获得。
8.一种基于向前法的联邦建模方法,其特征在于,所述基于向前法的联邦建模方法应用于第二设备,所述基于向前法的联邦建模方法包括:
接收与所述第二设备协调关联的第三设备发送的数据方特征数据集合,并确定所述数据方特征数据集合对应的各待加入数据特征;
获取基础训练模型,将各所述待加入数据特征分别加入所述基础训练模型,获得各所述待加入数据特征对应的数据方初始训练模型;
通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,分别对各所述数据方初始训练模型进行预设循环训练流程的第一轮循环训练,以协助所述第一设备计算模型损失值结果,并将所述模型损失值结果发送至所述第三设备;
接收所述第三设备基于所述模型损失值结果反馈的目标特征编码,并基于所述目标特征编码,确定对应的第一轮循环目标模型;
基于所述预设循环训练流程,通过与所述第一设备进行纵向联邦建模,对所述第一轮循环目标模型进行循环训练,直至所述第一轮循环目标模型满足预设循环训练结束条件,获得目标建模模型。
9.如权利要求8所述基于向前法的联邦建模方法,其特征在于,所述模型损失值集合包括一个或者多个模型损失值,
所述通过与所述第二设备联邦关联的第一设备进行纵向联邦建模,分别对各所述数据方初始训练模型进行预设循环训练流程的第一轮循环训练,以协助所述第一设备计算模型损失值结果,并将所述模型损失值结果发送至所述第三设备的步骤包括:
对于每一所述待加入数据特征均执行以下步骤:
基于所述待加入数据特征,对所述数据方初始训练模型进行迭代训练,直至所述数据方初始训练模型达到预设迭代次数,则获取所述数据方初始训练模型对应的模型参数向量,并基于所述模型参数向量和所述待加入数据特征对应的数据特征表示矩阵,计算辅助中间参数变量,并将所述辅助中间参数变量发送至所述第一设备,以供所述第一设备基于所述辅助中间参数变量计算中间参数和标签提供方梯度,并将所述中间参数发送至所述第二设备,将所述标签提供方梯度发送至所述第三设备;
接收所述第一设备反馈的所述中间参数,并基于所述中间参数计算特征提供方梯度,并将所述特征提供方梯度发送至所述第三设备,以供所述第三设备基于所述标签提供方梯度和所述特征提供方梯度计算联邦梯度,并将所述联邦梯度发送至所述第一设备,以供所述第一设备基于所述联邦梯度,对己方持有的标签方初始训练模型进行更新,直至更新后的所述标签方初始训练模型满足预设迭代结束条件,获得第一轮循环待选取模型,并将所述第一轮待循环模型对应的所述模型损失值发送至所述第三设备。
10.一种基于向前法的联邦建模方法,其特征在于,所述基于向前法的联邦建模方法应用于第三设备,所述基于向前法的联邦建模方法包括:
接收与所述第三设备协调关联的第一设备和第二设备分别发送的模型训练参数,并基于所述模型训练参数,生成特征编码集合;
确定待训练模型变量集合,并基于所述特征编码集合和所述待训练模型变量集合生成第一模型训练数据和第二模型训练数据,并将所述第一模型训练数据发送至所述第一设备,将所述第二模型训练数据发送至所述第二设备,以供所述第一设备基于所述第一模型训练数据确定各待加入标签特征,并基于各所述待加入标签特征,通过与所述第二设备进行纵向联邦建模,获取模型损失值集合,并将所述模型损失值集合发送至所述第三设备,其中,所述第二设备用于基于所述第二模型训练数据,确定所述第二模型训练对应的各待加入数据特征,并基于各所述待加入数据特征,与所述第一设备进行纵向联邦建模,以协助所述第一设备获取所述模型损失值集合;
接收所述第一设备反馈的模型损失值集合,并通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值,并将所述目标模型损失对应的目标特征编码分别发送至所述第一设备和所述第二设备,以供所述第一设备和所述第二设备确定目标建模模型。
11.如权利要求10所述基于向前法的联邦建模方法,其特征在于,所述通过预设模型选择策略,在所述模型损失值集合中选取目标模型损失值的步骤包括:
基于所述预设模型选择策略,计算所述模型损失值集合对应的标准值计算结果;
基于所述标准值计算结果,在所述模型损失值集合中选取目标模型损失值。
12.一种基于向前法的联邦建模设备,其特征在于,所述基于向前法的联邦建模设备包括:存储器、处理器以及存储在存储器上的用于实现所述基于向前法的联邦建模方法的程序,
所述存储器用于存储实现基于向前法的联邦建模方法的程序;
所述处理器用于执行实现所述基于向前法的联邦建模方法的程序,以实现如权利要求1至7或8至9或10至11中任一项所述基于向前法的联邦建模方法的步骤。
13.一种可读存储介质,其特征在于,所述可读存储介质上存储有实现基于向前法的联邦建模方法的程序,所述实现基于向前法的联邦建模方法的程序被处理器执行以实现如权利要求1至7或8至9或10至11中任一项所述基于向前法的联邦建模方法的步骤。
CN202010241597.4A 2020-03-30 2020-03-30 基于向前法的联邦建模方法、设备和可读存储介质 Pending CN111428884A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010241597.4A CN111428884A (zh) 2020-03-30 2020-03-30 基于向前法的联邦建模方法、设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010241597.4A CN111428884A (zh) 2020-03-30 2020-03-30 基于向前法的联邦建模方法、设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN111428884A true CN111428884A (zh) 2020-07-17

Family

ID=71550076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010241597.4A Pending CN111428884A (zh) 2020-03-30 2020-03-30 基于向前法的联邦建模方法、设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN111428884A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112508199A (zh) * 2020-11-30 2021-03-16 同盾控股有限公司 针对跨特征联邦学习的特征选择方法、装置及相关设备
CN112784994A (zh) * 2020-12-31 2021-05-11 浙江大学 基于区块链的联邦学习数据参与方贡献值计算和激励方法
CN112818369A (zh) * 2021-02-10 2021-05-18 中国银联股份有限公司 一种联合建模方法及装置
CN112949866A (zh) * 2021-03-25 2021-06-11 深圳前海微众银行股份有限公司 泊松回归模型的训练方法、装置、电子设备及存储介质
CN113723621A (zh) * 2021-04-19 2021-11-30 京东数字科技控股股份有限公司 一种纵向联邦学习建模方法、装置、设备及计算机介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112508199A (zh) * 2020-11-30 2021-03-16 同盾控股有限公司 针对跨特征联邦学习的特征选择方法、装置及相关设备
CN112784994A (zh) * 2020-12-31 2021-05-11 浙江大学 基于区块链的联邦学习数据参与方贡献值计算和激励方法
CN112784994B (zh) * 2020-12-31 2023-03-03 浙江大学 基于区块链的联邦学习数据参与方贡献值计算和激励方法
CN112818369A (zh) * 2021-02-10 2021-05-18 中国银联股份有限公司 一种联合建模方法及装置
CN112818369B (zh) * 2021-02-10 2024-03-29 中国银联股份有限公司 一种联合建模方法及装置
CN112949866A (zh) * 2021-03-25 2021-06-11 深圳前海微众银行股份有限公司 泊松回归模型的训练方法、装置、电子设备及存储介质
CN113723621A (zh) * 2021-04-19 2021-11-30 京东数字科技控股股份有限公司 一种纵向联邦学习建模方法、装置、设备及计算机介质
CN113723621B (zh) * 2021-04-19 2024-02-06 京东科技控股股份有限公司 一种纵向联邦学习建模方法、装置、设备及计算机介质

Similar Documents

Publication Publication Date Title
CN111428884A (zh) 基于向前法的联邦建模方法、设备和可读存储介质
CN113516255B (zh) 联邦学习建模优化方法、设备、可读存储介质及程序产品
WO2021083276A1 (zh) 横向联邦和纵向联邦联合方法、装置、设备及介质
CN111428883A (zh) 基于向后法的联邦建模方法、设备和可读存储介质
CN111325353A (zh) 训练数据集的贡献度计算方法、装置、设备及存储介质
WO2021139462A1 (zh) 逐步模型选择方法、设备及可读存储介质
CN111860868A (zh) 训练样本构建方法、装置、设备及计算机可读存储介质
CN113627085A (zh) 横向联邦学习建模优化方法、设备、介质及程序产品
CN111553744A (zh) 联邦产品推荐方法、装置、设备及计算机存储介质
CN111898768A (zh) 数据处理方法、装置、设备及介质
CN107807841B (zh) 服务器模拟方法、装置、设备及可读存储介质
CN111241746B (zh) 向前模型选择方法、设备和可读存储介质
CN108805611A (zh) 广告筛选方法及装置
CN112926073A (zh) 联邦学习建模优化方法、设备、介质及计算机程序产品
CN112785144A (zh) 基于联邦学习的模型构建方法、设备及存储介质
CN111737920B (zh) 基于循环神经网络的数据处理方法、设备及介质
CN114258548A (zh) 用于为工程方案的完成提供推荐的方法和装置
CN111210022B (zh) 向后模型选择方法、设备及可读存储介质
CN111475628A (zh) 会话数据处理方法、装置、计算机设备和存储介质
CN113505896A (zh) 纵向联邦学习建模优化方法、设备、介质及程序产品
CN111737921A (zh) 基于循环神经网络的数据处理方法、设备及介质
CN111382349B (zh) 信息推荐方法、装置、计算机设备和存储介质
CN111445030A (zh) 基于逐步回归法的联邦建模方法、设备和可读存储介质
CN114491342B (zh) 个性化模型的训练方法、信息显示方法及设备
CN115129481B (zh) 一种计算资源分配方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination