CN112381236A - 联邦迁移学习的数据处理方法、装置、设备及存储介质 - Google Patents

联邦迁移学习的数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112381236A
CN112381236A CN202011393430.6A CN202011393430A CN112381236A CN 112381236 A CN112381236 A CN 112381236A CN 202011393430 A CN202011393430 A CN 202011393430A CN 112381236 A CN112381236 A CN 112381236A
Authority
CN
China
Prior art keywords
model
sample
feature extraction
feature
participant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011393430.6A
Other languages
English (en)
Inventor
康焱
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202011393430.6A priority Critical patent/CN112381236A/zh
Publication of CN112381236A publication Critical patent/CN112381236A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种联邦迁移学习的数据处理方法、装置、设备及存储介质,其中,方法包括:通过第一样本、第二样本以及多个特征提取模型,确定各个第一特征提取模型;基于所述第一样本、第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;基于所述第二样本、第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型。本发明能够通过联邦迁移学习得到兼顾模型迁移和模型可解释的目标模型,通过目标特征提取模型对样本的知识进行迁移,实现了基于不同参与方的样本数据联邦构建模型,减少训练后的模型达到目标性能的时间耗费,提升计算机算力资源的利用率。

Description

联邦迁移学习的数据处理方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种联邦迁移学习的数据处理方法、装置、设备及存储介质。
背景技术
机器学习在大量标记的数据上进行监督式训练可以获得很好的性能和效果,然而大型的标记数据集在数量和应用领域方面均有限,且手动标记足量的训练数据往往需要高昂的代价。针对这一问题,通常采用迁移学习方法解决,即训练一个鉴别器用于调整迁移学习网络的参数,使得参数调整后的迁移学习网络下,源领域的数据与目标领域的数据间的分布偏移减小,从而迁移学习网络应用目标领域完成目标任务时有较佳的效果。
但是,深度学习模型的缺乏可解释性使其在要求模型可解释性的应用中(比如,金融风险控制)很难被用于迁移学习,而复杂度低的深度学习模型从原始数据中学习到可迁移知识的能力较弱,因此其迁移能力不强。这就产生了一个矛盾,迁移能力强的深度学习模型缺乏可解释性,可解释性强的深度学习模型迁移能力不强,导致深度学习模型无法兼顾可解释性以及迁移能力。同时,目前不同的用户数据存储在不同数据持有方或者参与方的服务器上,出于对用户数据的隐私保护,不同服务器之间不能直接进行用户数据的交互,即各服务器之间不能共享各自的用户数据以进行联合建模,进而导致各服务器只能基于少量的用户数据进行建模,致使需要训练更长时间才能使得训练后的模型达到目标性能,进而导致计算机需要耗费大量资源算力,致使计算机算力资源的利用率低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种联邦迁移学习的数据处理方法、装置、设备及存储介质,旨在解决深度学习模型无法兼顾可解释性以及迁移能力,以及不同参与方之间不能直接进行时序数据的交互而导致计算机算力资源的利用率低的技术问题。
为实现上述目的,本发明提供一种联邦迁移学习的数据处理方法,所述联邦迁移学习的数据处理方法包括以下步骤:
通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型;
基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;
基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型。
进一步地,所述通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型的步骤包括:
通过第一参与方基于预设业务需求对第一样本的特征进行分组,以获得预设数量的第一样本特征组,并基于预设业务需求对第二样本的特征进行分组,以获得预设数量的第二样本特征组;
通过第一参与方通过预设数量的特征提取模型获取各个第一样本特征组对应的第一特征表征,以及各个第二样本特征组对应的第二特征表征;
通过第一参与方基于第一特征表征以及其对应的领域区分模型,确定多个第一领域区分损失值,基于各个第一领域区分损失值以及对应的特征提取模型,确定各个第三特征提取模型;
通过第一参与方基于第二特征表征以及其对应的领域区分模型,确定多个第二领域区分损失值,基于各个第二领域区分损失值以及对应的第三特征提取模型,确定各个第一特征提取模型。
进一步地,所述通过第一参与方通过预设数量的特征提取模型获取各个第一样本特征组对应的第一特征表征,以及各个第二样本特征组对应的第二特征表征的步骤包括:
通过第一参与方将各个第一样本特征组输入对应预设数量的特征提取模型,以获得第一特征表征,将各个第二样本特征组输入对应预设数量的特征提取模型,以获得第二特征表征。
进一步地,所述通过第一参与方基于第一特征表征以及其对应的领域区分模型,确定多个第一领域区分损失值,基于各个第一领域区分损失值以及对应的特征提取模型,确定各个第三特征提取模型的步骤包括:
通过第一参与方将各个第一特征表征输入对应的领域区分模型,以获得各个第一特征表征对应第一领域区分损失值;
通过第一参与方基于各个第一领域区分损失值确定更新后的各个领域区分模型,并基于各个第一领域区分损失值通过领域对抗学习,更新对应的特征提取模型,以获得各个第三特征提取模型。
进一步地,所述通过第一参与方基于第二特征表征以及其对应的领域区分模型,确定多个第二领域区分损失值,基于各个第二领域区分损失值以及对应的第三特征提取模型,确定各个第一特征提取模型的步骤包括:
通过第一参与方将各个第二特征表征输入对应的更新后的领域区分模型,以获得各个第二特征表征对应的第二领域区分损失值;
通过第一参与方基于各个第二领域区分损失值确定目标领域区分模型,并基于各个第二领域区分损失值通过领域对抗学习,更新对应的第三特征提取模型,以获得各个第一特征提取模型。
进一步地,所述基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型的步骤包括:
通过第二参与方获取第二参与方中所述第三样本,通过第一参与方获取第一样本对应的第一特征表征;
基于第一特征表征及第三样本,通过纵向联邦学习算法,计算待训练预测模型的第一预测损失值,分别基于所述第一预测损失值更新待训练预测模型以及各个第一特征提取模型,以获得训练后的预测模型以及各个第二特征提取模型。
进一步地,所述基于第一特征表征及第三样本,通过纵向联邦学习算法,计算待训练预测模型的第一预测损失值,分别基于所述第一预测损失值更新待训练预测模型以及各个第一特征提取模型,以获得训练后的预测模型以及各个第二特征提取模型的步骤包括:
基于第一特征表征及第三样本对应的第一特征表征集,通过纵向联邦学习算法对所述待训练预测模型进行模型训练,以获得第一预测损失值;
基于所述第一预测损失值,通过纵向联邦学习算法,更新所述待训练预测模型,以获得训练后的预测模型;
基于所述第一预测损失值更,通过纵向联邦学习算法,新各个第一特征提取模型,以获得第二特征提取模型。
进一步地,所述基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型的步骤包括:
通过第三参与方获取第三参与方中的第四样本,通过第一参与方获取第二样本对应的第二特征表征;
基于第二特征表征以及第四样本,通过纵向联邦学习算法,计算训练后的预测模型的第二预测损失值,分别基于所述第二预测损失值更新训练后的预测模型以及各个第二特征提取模型,以获得目标预测模型以及各个目标特征提取模型。
进一步地,所述基于第二特征表征以及第四样本,通过纵向联邦学习算法,计算训练后的预测模型的第二预测损失值,分别基于所述第二预测损失值更新训练后的预测模型以及各个第二特征提取模型,以获得目标预测模型以及各个目标特征提取模型的步骤包括:
基于第二特征表征以及第四样本对应的特征表征集,通过纵向联邦学习算法对训练后的预测模型进行模型训练,以获得第二预测损失值;
基于所述第二预测损失值,通过纵向联邦学习算法,更新训练后的待训练预测模型,以获得目标预测模型;
基于所述第二预测损失值,通过纵向联邦学习算法,更新各个第二特征提取模型,以获得目标特征提取模型。
进一步地,所述目标预测模型为欺诈评分预测模型;所述第一业务场景包括用户的信用评分场景,所述第二业务场景包括用户的欺诈评分场景,所述第一样本包括为第一参与方中的信用评分数据,第二样本为第一参与方中的欺诈评分数据,第三样本为第二参与方中的信用评分数据,第四样本为第三参与方中的欺诈评分数据;
所述基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型的步骤包括:
根据第一参与方中的信用评分数据、第二参与方中的信用评分数据、待训练预测模型以及第一特征提取模型,确定训练后的欺诈评分预测模型以及各个第二特征提取模型;
所述基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型的步骤包括:
根据第一参与方中的欺诈评分数据、第三参与方中的欺诈评分数据、训练后的欺诈评分预测模型以及第二特征提取模型,确定欺诈评分预测模型以及各个目标特征提取模型。
进一步地,所述基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型的步骤之后,还包括:
获取第一参与方中第一待预测样本对应的待预测特征表征,其中,第一参与方基于预设业务需求对第一待预测样本的特征进行分组,以获得待预测样本特征组,并基于目标特征提取模型获取各个待预测样本特征组对应的待预测特征表征,第一待预测样本为第二业务场景对应的样本;
获取第三参与方中第二待预测样本,第二待预测样本为第二业务场景样本;
基于各个待预测特征表征以及第二待预测样本对应的特征表征集,通过纵向联邦学习算法计算目标预测模型的预测结果。
此外,为实现上述目的,本发明还提供一种联邦迁移学习的数据处理装置,所述联邦迁移学习的数据处理装置包括:
第一模型确定模块,用于通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型;
第二模型确定模块,用于基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;
目标模型确定模块,用于基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型。
此外,为实现上述目的,本发明还提供一种联邦迁移学习的数据处理设备,所述联邦迁移学习的数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的联邦迁移学习的数据处理程序,所述联邦迁移学习的数据处理程序被所述处理器执行时实现前述的联邦迁移学习的数据处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有联邦迁移学习的数据处理程序,所述联邦迁移学习的数据处理程序被处理器执行时实现前述的联邦迁移学习的数据处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机程序产品,所述计算机程序产品执行时实现前述的联邦迁移学习的数据处理方法的步骤。
本发明通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型;接着基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;而后基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型,通过对待训练预测模型以及第一特征提取模型进行两轮训练,实现了通过联邦学习利用第一参与方所拥有的丰富的特征和第二参与方所拥有的类别标签以及第三参与方所拥有的类别标签,联合建立性能优良的目标预测模型,能够通过联邦迁移学习得到兼顾模型迁移和模型可解释的目标模型,通过目标特征提取模型对样本的知识进行迁移,通过可解释的目标预测模型进行预测,能够解释每个特征组对预测结果的贡献,从而达到了兼顾模型迁移和模型可解释的目的,由于基于不同参与方的样本数据联邦构建模型,提升了对待预测样本进行欺诈评分等预测的准确性。同时,实现了基于不同参与方的样本数据联邦构建模型,克服了现有技术中大量耗费计算机算力资源的缺陷,减少训练后的模型达到目标性能的时间耗费,提升计算机算力资源的利用率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境中联邦迁移学习的数据处理设备的结构示意图;
图2为本发明联邦迁移学习的数据处理方法第一实施例的流程示意图;
图3为本发明联邦迁移学习的数据处理方法中第一业务场景的样本示意图;
图4为本发明联邦迁移学习的数据处理方法中第二业务场景的样本示意图;
图5为本发明联邦迁移学习的数据处理方法中联邦迁移学习的训练过程示意图;
图6为本发明联邦迁移学习的数据处理方法中预测过程示意图;
图7为本发明联邦迁移学习的数据处理一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境中联邦迁移学习的数据处理设备的结构示意图。
本发明实施例联邦迁移学习的数据处理设备可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该联邦迁移学习的数据处理设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,联邦迁移学习的数据处理设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。当然,联邦迁移学习的数据处理设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对联邦迁移学习的数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及联邦迁移学习的数据处理程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的联邦迁移学习的数据处理程序。
在本实施例中,联邦迁移学习的数据处理设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的联邦迁移学习的数据处理程序,其中,处理器1001调用存储器1005中存储的联邦迁移学习的数据处理程序时,并执行以下各个实施例中联邦迁移学习的数据处理方法的步骤。
本发明还提供一种联邦迁移学习的数据处理方法,参照图2,图2为本发明联邦迁移学习的数据处理方法第一实施例的流程示意图。
步骤S101,通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型;
本实施例中,第一业务场景与第二业务场景为两个业务相似但不同的业务场景,第一业务场景对应的样本与第二业务场景对应的样本具有相同的特征空间。例如,第一业务场景为信用评分和欺诈评分,第二业务场景为欺诈评分。
本实施例的联邦迁移学习的数据处理方法中,至少包括三个参与方,例如参与方A(第一参与方)、参与方B(第二参与方)和参与方C(第三参与方)。参与方A和参与方B在第一业务场景s上有大量的重叠样本。参与方A和参与方C在第二业务场景t有一定数量的重叠样本。
其中,第一样本为第一参与方中第一业务场景对应的样本,即第一样本对应的数据为第一业务场景的数据;第二样本为第一参与方中第二业务场景对应的样本,即第二样本对应的数据为第二业务场景的数据;第三样本为第二参与方中第一业务场景对应的样本,即第三样本对应的数据为第一业务场景的数据;第四样本为第三参与方中第二业务场景对应的样本,即第四样本对应的数据为第二业务场景的数据。第一样本与第三样本分别为参与方A和参与方B在第一业务场景的重叠样本,第一样本与第四样本分别为参与方A和参与方C在第二业务场景的重叠样本,其中,第一样本中样本的数量(远)大于第二样本中样本的数量。
第一样本对应的数据、第二样本对应的数据、第三样本对应的数据以及第四样本对应的数据均可以为表格数据,在表格数据中,每一列代表一个特征(比如年龄,性别,工作,薪水等);每一行代表一个样本(比如某一个金融产品的用户)。
参与方A给不同业务场景的样本提供不同领域标签(或业务标签),即第一样本中的各个样本与第二样本中的各个样本具有不同的领域标签,第一样本中的各个样本具有相同的领域标签,第二样本中的各个样本具有相同的领域标签,例如,第一样本中各个样本的领域标签均为1,第二样本中各个样本的领域标签均为0。参与方B在第一业务场景s上的每一个重叠样本拥有一个类别标签,即第三样本中的各个样本均具有一个类别标签;参与方C在业务场景t上的少量重叠样本拥有一个类别标签,即第四样本中的各个样本均具有一个类别标签。
本实施例中,在进行联邦迁移学习时,通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型。具体地,先通过各个特征提取模型确定第一样本对应的多个第一特征表征以及第二样本对应的多个第二特征表征,由于第一样本中的样本以及第二样本中的样本均具有领域标签,因此,分别将各个第一特征表征输入对应的领域区分模型进行模型训练,得到更新后的领域区分模型以及多个第一领域区分损失值,并根据第一领域区分损失值更新对应的特征提取模型得到第三特征提取模型,其中,每一个第一特征表征输入对应一个领域区分模型,其中,每一个第一特征表征输入对应一个特征提取模型。
而后,将第二特征表征输入对应的更新后的领域区分模型进行模型训练,确定目标领域区分模型以及多个第二领域区分损失值,并根据第二领域区分损失值更新对应的第三特征提取模型得到第一特征提取模型。
步骤S102,基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;
在本实施例中,在确定各个第一特征提取模型之后,获取第二参与方中第一业务场景对应的第三样本,该第三样本为第二参与方的样本中第一样本对应的重叠样本,该第三样本属于第一业务场景,并根据第一样本、第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型,具体地,通过待训练预测模型,确定第一特征表征及第三样本对应的第一预测损失值,即通过待训练预测模型对第一样本对应的第一特征表征及第三样本进行模型训练得到第一预测损失值,并根据第一预测损失值更新待训练预测模型以及各个第一特征提取模型,以获得训练后的预测模型以及各个第二特征提取模型。
步骤S103,基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型。
本实施例中,在得到训练后的预测模型以及各个第二特征提取模型之后,获取第三参与方中第二业务场景对应的第四样本,该第四样本为第三参与方的样本中第二样本对应的重叠样本,该第四样本属于第二业务场景。
而后,根据第二样本、第四样本、训练后的预测模型以及各个第二特征提取模型,确定目标预测模型以及各个目标特征提取模型,具体地,通过训练后的预测模型,确定第二特征表征及第四样本对应的第二预测损失值,即通过训练后的预测模型对第二特征表征及第四样本进行模型训练,以获得第二预测损失值,并根据第二预测损失值更新训练后的预测模型以及各个第二特征提取模型,以获得目标预测模型以及各个目标特征提取模型。
其中,其待训练预测模型为具有可解释性的机器学习模型,例如,待训练预测模型为线性回归模型或者逻辑回归模型等。
参照图3,图3中,参与方A为第一参与方、参与方B为第二参与方,参与方A和参与方B在第一业务场景s上有大量的重叠样本。Fi A,s为第一样本对应的第一样本特征组,fj B,s为第三样本对应的单体特征。
参照图4,图4中,参与方A为第一参与方、参与方C为第三参与方,参与方A和参与方C在第二业务场景t上有大量的重叠样本。Fi A,t为第二样本对应的第二样本特征组,fj C,t为第四样本对应的单体特征。
优选地,目标预测模型为欺诈评分预测模型;所述第一业务场景包括用户的信用评分场景,所述第二业务场景包括用户的欺诈评分场景,所述第一样本包括为第一参与方中的信用评分数据,第二样本为第一参与方中的欺诈评分数据,第三样本为第二参与方中的信用评分数据,第四样本为第三参与方中的欺诈评分数据。
步骤S102包括:根据第一参与方中的信用评分数据、第二参与方中的信用评分数据、待训练预测模型以及第一特征提取模型,确定训练后的欺诈评分预测模型以及各个第二特征提取模型;
步骤S103包括:根据第一参与方中的欺诈评分数据、第三参与方中的欺诈评分数据、训练后的欺诈评分预测模型以及第二特征提取模型,确定欺诈评分预测模型以及各个目标特征提取模型。
其中,信用评分数据包括用户的年龄、性别、工作、薪水、学历、存款信息、固定资产信息、贷款信息、提前还款记录、逾期还款记录等;欺诈评分数据包括用户的年龄、性别、工作、薪水、学历、存款信息、固定资产信息、贷款信息、提前还款记录、逾期还款记录、预还款信息、预贷款信息等。
具体地,根据第一参与方中的信用评分数据、第二参与方中的信用评分数据输入待训练预测模型进行联邦训练,根据训练结果更新待训练预测模型以及第一特征提取模型,得到训练后的欺诈评分预测模型以及各个第二特征提取模型;而后根据第一参与方中的欺诈评分数据、第三参与方中的欺诈评分数据对训练后的欺诈评分预测模型进行联邦训练,根据训练结果更新训练后的欺诈评分预测模型以及第二特征提取模型,得到欺诈评分预测模型以及各个目标特征提取模型,进而,后续可通过目标特征提取模型提取待预测样本(包括第一参与方的第一待预测样本以及第三参与方中的第二待预测样本)的特征,并通过欺诈评分预测模型进行联邦预测,以得到第二待预测样本所对应的预测结果即欺诈评分。
本实施例提出的联邦迁移学习的数据处理方法,通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型;接着基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;而后基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型,通过对待训练预测模型以及第一特征提取模型进行两轮训练,实现了通过联邦学习利用第一参与方所拥有的丰富的特征和第二参与方所拥有的类别标签以及第三参与方所拥有的类别标签,联合建立性能优良的目标预测模型,能够通过联邦迁移学习得到兼顾模型迁移和模型可解释的目标模型,通过目标特征提取模型对样本的知识进行迁移,通过可解释的目标预测模型进行预测,能够解释每个特征组对预测结果的贡献,从而达到了兼顾模型迁移和模型可解释的目的,由于基于不同参与方的样本数据联邦构建模型,提升了对待预测样本进行欺诈评分等预测的准确性。同时,实现了基于不同参与方的样本数据联邦构建模型,克服了现有技术中大量耗费计算机算力资源的缺陷,减少训练后的模型达到目标性能的时间耗费,提升计算机算力资源的利用率。
基于第一实施例,提出本发明联邦迁移学习的数据处理方法的第二实施例,在本实施例中,步骤S101包括:
步骤S201,通过第一参与方基于预设业务需求对第一样本的特征进行分组,以获得预设数量的第一样本特征组,并基于预设业务需求对第二样本的特征进行分组,以获得预设数量的第二样本特征组
步骤S202,通过第一参与方通过预设数量的特征提取模型获取各个第一样本特征组对应的第一特征表征,以及各个第二样本特征组对应的第二特征表征;
步骤S203,通过第一参与方基于第一特征表征以及其对应的领域区分模型,确定多个第一领域区分损失值,基于各个第一领域区分损失值以及对应的特征提取模型,确定各个第三特征提取模型;
步骤S204,通过第一参与方基于第二特征表征以及其对应的领域区分模型,确定多个第二领域区分损失值,基于各个第二领域区分损失值以及对应的第三特征提取模型,确定各个第一特征提取模型。
本实施例中,为使第一特征表征的数量与第二特征表征的数量相同,针对第一业务场景以及第二业务场景,先确定第一业务场景与第二业务场景之间完全相同的部分特征作为预设业务需求,而后第一参与方基于预设业务需求对第一样本的特征进行分组,以获得第一样本对应的第一样本特征组,并基于预设业务需求对第二样本的特征进行分组,以获得第二样本对应的第二样本特征组。通过第一参与方将第一样本特征组依次输入对应的特征提取模型,以获得第一特征表征,将第二样本特征组依次输入对应的特征提取模型,以获得第二特征表征。
进一步地,在一实施例中,步骤S202包括:
通过第一参与方将各个第一样本特征组输入对应预设数量的特征提取模型,以获得第一特征表征,将各个第二样本特征组输入对应预设数量的特征提取模型,以获得第二特征表征。
具体的,第一参与方可将第一样本特征组、第二样本特征组以及特征提取模型进行分别编号,以根据编号实现第一样本特征组、第二样本特征组与特征提取模型的一一对应,即第一样本特征组(或第二样本特征组)中的每一个样本特征组分别对应一个特征提取模型,而后第一参与方将第一样本特征组中的各个样本特征组分别输入对应的特征提取模型,得到多个第一特征表征,第一参与方将第二样本特征组中的各个样本特征组分别输入对应的特征提取模型,得到多个第二特征表征。
而后,通过第一参与方基于第一特征表征以及领域区分模型,确定多个第一领域区分损失值,基于第一领域区分损失值以及特征提取模型,确定第三特征提取模型。其中,第一特征表征与领域区分模型一一对应,即第一样本特征组(或第二样本特征组)中的每一个样本特征组分别对应一个领域区分模型,第一参与方将各个第一特征表征输入对应的领域区分模型进行模型训练,以获得各个第一特征表征对应的第一领域区分损失值,并基于各个第一领域区分损失值更新对应的特征提取模型,以获得第三特征提取模型,同时,基于各个第一领域区分损失值更新对应的领域区分模型,以获得更新后的领域区分模型。
最后,通过第一参与方基于第二特征表征以及更新后的领域区分模型,确定多个第二领域区分损失值,基于第二领域区分损失值以及第三特征提取模型确定第一特征提取模型。具体地,第一参与方将各个第二特征表征输入对应的更新后的领域区分模型进行模型训练,以获得各个第二特征表征对应的第二领域区分损失值,并基于各个第二领域区分损失值更新对应的第三特征提取模型,以获得第一特征提取模型,同时基于各个第二领域区分损失值更新对应的更新后的领域区分模型,得到目标领域区分模型。
本实施例提出的联邦迁移学习的数据处理方法,通过第一参与方基于预设业务需求对第一样本的特征进行分组,以获得预设数量的第一样本特征组,并基于预设业务需求对第二样本的特征进行分组,以获得预设数量的第二样本特征组;接着通过第一参与方通过预设数量的特征提取模型获取各个第一样本特征组对应的第一特征表征,以及各个第二样本特征组对应的第二特征表征;而后通过第一参与方基于第一特征表征以及其对应的领域区分模型,确定多个第一领域区分损失值,基于各个第一领域区分损失值以及对应的特征提取模型,确定各个第三特征提取模型;最后通过第一参与方基于第二特征表征以及其对应的领域区分模型,确定多个第二领域区分损失值,基于各个第二领域区分损失值以及对应的第三特征提取模型,确定各个第一特征提取模型,实现了对领域区分模型以及特征提取模型的更新,提高模型训练的准确性。
基于第二实施例,提出本发明联邦迁移学习的数据处理方法的第三实施例,在本实施例中,步骤S203包括:
步骤S301,通过第一参与方将各个第一特征表征输入对应的领域区分模型,以获得各个第一特征表征对应第一领域区分损失值;
步骤S302,通过第一参与方基于各个第一领域区分损失值确定更新后的各个领域区分模型,并基于各个第一领域区分损失值通过领域对抗学习,更新对应的特征提取模型,以获得各个第三特征提取模型。
本实施例中,在获取到第一特征表征时,第一参与方将各个第一特征表征输入对应的领域区分模型进行模型训练,以获得各个第一特征表征对应的第一领域区分损失值,即第一参与方将第一特征表征分别输入对应的领域区分模型,得到各个第一特征表征对应的第一预测领域标签,并分别根据第一预测领域标签以及各个第一特征表征对应的领域标签计算各个第一特征表征对应的第一领域区分损失值。
而后,基于各个第一领域区分损失值通过领域对抗学习,更新对应的特征提取模型,以获得第三征提取模型,根据各个第一领域区分损失值更新对应的领域区分模型以获得更新后的领域区分模型。
进一步地,在一实施例中,步骤S204包括:
步骤S303,通过第一参与方将各个第二特征表征输入对应的更新后的领域区分模型,以获得各个第二特征表征对应的第二领域区分损失值;
步骤S304,通过第一参与方基于各个第二领域区分损失值确定目标领域区分模型,并基于各个第二领域区分损失值通过领域对抗学习,更新对应的第三特征提取模型,以获得各个第一特征提取模型。
本实施例中,将各个第二特征表征依次输入对应的更新后的领域区分模型进行模型训练,以获得各个第二特征表征对应的第二领域区分损失值,即将第二特征表征分别输入对应的更新后的领域区分模型,得到各个第二特征表征对应的第二预测领域标签,并分别根据第二预测领域标签以及各个第二特征表征对应的领域标签计算各个第二特征表征对应的第二领域区分损失值。
而后,基于各个第二领域区分损失值通过领域对抗学习,更新对应的第三特征提取模型,以获得第一特征提取模型,并根据各个第二领域区分损失值更新对应的更新后的领域区分模型以获得目标领域区分模型,在后续模型训练的迭代训练过程中时,将该目标领域区分模型作为领域区分模型。
需要说明的是,可预先设置领域区分模型的训练次数即预设训练次数,在获得目标领域区分模型时,更新该领域区分模型对应的训练次数,即将训练次数加1得到新的训练次数,若更新后的训练次数达到该预设训练次数,则当前的特征提取模型训练结束;若更新后的训练次数未达到该预设训练次数,则将目标领域区分模型作为领域区分模型,将第一特征提取模型作为特征提取模型,并返回执行步骤S301。
参照图5,图5中,通过第一样本特征组中的特征组F1 A,s以及第二样本特征组中的特征组F1 A,t训练得到目标特征模型R0,……通过第一样本特征组中的特征组Fn A,s以及第二样本特征组中的特征组Fn A,t训练得到更新后的特征模型Rn-1,D0……D2为领域区分模型,Ld,0……Ld,3为领域区分损失值。
本实施例提出的联邦迁移学习的数据处理方法,通过第一参与方将各个第一特征表征输入对应的领域区分模型,以获得各个第一特征表征对应第一领域区分损失值;接着通过第一参与方基于各个第一领域区分损失值确定更新后的各个领域区分模型,并基于各个第一领域区分损失值通过领域对抗学习,更新对应的特征提取模型,以获得各个第三特征提取模型,实现了对领域区分模型以及特征提取模型的更新,进一步提高模型训练的准确性。
基于第一实施例,提出本发明联邦迁移学习的数据处理方法的第四实施例,在本实施例中,步骤S102包括:
步骤S401,通过第二参与方获取第二参与方中所述第三样本,通过第一参与方获取第一样本对应的第一特征表征;
步骤S402,基于第一特征表征及第三样本,通过纵向联邦学习算法,计算待训练预测模型的第一预测损失值,分别基于所述第一预测损失值更新待训练预测模型以及各个第一特征提取模型,以获得训练后的预测模型以及各个第二特征提取模型。
本实施例中,在获取到第一特征提取模型时,先通过第二参与方获取第二参与方中第三样本,并通过第一参与方获取第一样本对应的第一特征表征。其中,第三样本不需要对特征进行分组,第三样本中的每个样本特征为单体特征。
而后,基于第一特征表征及第三样本,通过纵向联邦学习算法,计算待训练预测模型的第一预测损失值,即基于纵向联邦学习通过待训练预测模型,确定第一特征表征及第三样本对应的第一预测损失值,分别基于所述第一预测损失值更新待训练预测模型以及各个第一特征提取模型,以获得训练后的预测模型以及各个第二特征提取模型,即基于纵向联邦学习将第一特征表征及第三样本输入可解释的待训练预测模型进行模型训练,得到第一预测损失值,具体地,确定第一特征表征及第三样本对应的特征表征集,并基于纵向联邦学习将第一特征表征及第三样本对应的特征表征集输入可解释的待训练预测模型进行模型训练,该第一特征表征及第三样本对应的特征表征集为包括所有第一特征表征及第三样本的数据集,根据该第一预测损失值更新该待训练预测模型得到训练后的预测模型,并根据该第一预测损失值更新第一特征提取模型得到各个第二特征提取模型。
需要说明的是,在其他实施例中,在确定第二特征提取模型时,累计待训练预测模型的训练轮数,若训练轮数小于预设值,则将训练后的预测模型作为待训练预测模型,将第二特征提取模型作为第一特征提取模型,并继续执行该步骤S402。
本实施例提出的联邦迁移学习的数据处理方法,通过第二参与方获取第二参与方中所述第三样本,通过第一参与方获取第一样本对应的第一特征表征;接着基于第一特征表征及第三样本,通过纵向联邦学习算法,计算待训练预测模型的第一预测损失值,分别基于所述第一预测损失值更新待训练预测模型以及各个第一特征提取模型,以获得训练后的预测模型以及各个第二特征提取模型,通过根据第一特征表征以及第三样本训练待训练预测模型,进一步提高模型训练的准确性。
基于第四实施例,提出本发明联邦迁移学习的数据处理方法的第五实施例,在本实施例中,步骤S402包括:
步骤S501,基于第一特征表征及第三样本对应的第一特征表征集,通过纵向联邦学习算法对所述待训练预测模型进行模型训练,以获得第一预测损失值;
步骤S502,基于所述第一预测损失值,通过纵向联邦学习算法,更新所述待训练预测模型,以获得训练后的预测模型;
步骤S503,基于所述第一预测损失值,通过纵向联邦学习算法,更新各个第一特征提取模型,以获得第二特征提取模型。
本实施例中,在确定第一特征提取模型之后,确定第一特征表征及第三样本对应的特征表征集,基于第一特征表征及第三样本对应的第一特征表征集,通过纵向联邦学习算法对所述待训练预测模型进行模型训练,以获得第一预测损失值,即基于纵向联邦学习将第一特征表征及第三样本对应的特征表征集输入可解释的待训练预测模型进行模型训练,以获得对应的第一预测类别标签,根据第一预测类别标签以及第三样本对应的类别标签(真实类别标签)计算第一预测损失值,该第一特征表征及第三样本对应的特征表征集为包括所有第一特征表征及第三样本的数据集。
而后,根据该第一预测损失值,通过纵向联邦学习算法,更新该待训练预测模型得到训练后的预测模型,并根据该第一预测损失值,通过纵向联邦学习算法,更新第一特征提取模型得到第二特征提取模型。
本实施例提出的联邦迁移学习的数据处理方法,通过基于第一特征表征及第三样本对应的第一特征表征集,通过纵向联邦学习算法对所述待训练预测模型进行模型训练,以获得第一预测损失值;接着基于所述第一预测损失值更新,通过纵向联邦学习算法,所述待训练预测模型,以获得训练后的预测模型;而后基于所述第一预测损失值,通过纵向联邦学习算法,更新各个第一特征提取模型,以获得第二特征提取模型,实现了根据第一特征表征以及第三样本对应的第一预测损失值更新待训练预测模型以及第一特征提取模型,进一步提高模型训练的准确性。
基于第一实施例,提出本发明联邦迁移学习的数据处理方法的第六实施例,在本实施例中,步骤S103包括:
步骤S601,通过第三参与方获取第三参与方中的第四样本,通过第一参与方获取第二样本对应的第二特征表征;
步骤S602,基于第二特征表征以及第四样本,通过纵向联邦学习算法,计算训练后的预测模型的第二预测损失值,分别基于所述第二预测损失值更新训练后的预测模型以及各个第二特征提取模型,以获得目标预测模型以及各个目标特征提取模型
本实施例中,在获取到第二特征提取模型时,先第三参与方获取第三参与方中的第四样本,并通过第一参与方获取第二样本对应的第二特征表征。其中,第四样本不需要对特征进行分组,第四样本中的每个样本特征为单体特征。
而后,基于第二特征表征以及第四样本,通过纵向联邦学习算法,计算训练后的预测模型的第二预测损失值,即基于纵向联邦学习通过训练后的预测模型,确定第二特征表征及第四样本对应的第二预测损失值,分别基于所述第二预测损失值更新训练后的预测模型以及各个第二特征提取模型,以获得目标预测模型以及各个目标特征提取模型,即基于纵向联邦学习将第二特征表征及第四样本输入训练后的预测模型进行模型训练,得到第二预测损失值,具体地,确定第二特征表征及第四样本对应的特征表征集,并基于纵向联邦学习将第二特征表征及第四样本对应的特征表征集输入训练后的预测模型进行模型训练,该第二特征表征及第四样本对应的特征表征集为包括所有第二特征表征及第四样本的数据集,根据该第二预测损失值更新该训练后的预测模型得到目标预测模型,并根据该第二预测损失值更新第二特征提取模型得到各个目标特征提取模型。
参照图5,图5中,将第一样本特征组对应的第一特征表征中的ri A,s以(r1 A,s、r2 A,s、r3 A,s等)及单体特征fj B,s(f1 B,s、f2 B,s、f3 B,s等)输入待训练预测模型,得到预测损失值Lcls B,s,最后根据该预测损失值Lcls B,s更新各个更新后的特征提取模型,以获得目标特征提取模型,并更新所述待训练预测模型,以获得目标预测模型G。
本实施例提出的联邦迁移学习的数据处理方法,通过第三参与方获取第三参与方中的第四样本,通过第一参与方获取第二样本对应的第二特征表征;接着基于第二特征表征以及第四样本,通过纵向联邦学习算法,计算训练后的预测模型的第二预测损失值,分别基于所述第二预测损失值更新训练后的预测模型以及各个第二特征提取模型,以获得目标预测模型以及各个目标特征提取模型,通过根据第二特征表征以及第四样本训练得到目标模型,进一步提高模型训练的准确性。
基于第六实施例,提出本发明联邦迁移学习的数据处理方法的第七实施例,在本实施例中,步骤S602包括:
步骤S701,基于第二特征表征以及第四样本对应的特征表征集,通过纵向联邦学习算法对训练后的预测模型进行模型训练,以获得第二预测损失值;
步骤S702,基于所述第二预测损失值,通过纵向联邦学习算法,更新训练后的待训练预测模型,以获得目标预测模型;
步骤S703,基于所述第二预测损失值,通过纵向联邦学习算法,更新各个第二特征提取模型,以获得目标特征提取模型。
本实施例中,在确定第二特征提取模型之后,确定第二特征表征及第四样本对应的特征表征集,基于第二特征表征以及第四样本对应的特征表征集,通过纵向联邦学习算法对训练后的预测模型进行模型训练,以获得第二预测损失值,即基于纵向联邦学习将第二特征表征及第四样本对应的特征表征集输入训练后的预测模型进行模型训练,以获得对应的第一预测类别标签,根据第一预测类别标签以及第四样本对应的类别标签(真实类别标签)计算第二预测损失值,该第二特征表征及第四样本对应的特征表征集为包括所有第二特征表征及第四样本的数据集。
而后,根据该第二预测损失值,通过纵向联邦学习算法,更新该训练后的预测模型得到目标预测模型,并根据该第二预测损失值,通过纵向联邦学习算法,更新第二特征提取模型得到各个目标特征提取模型。
本实施例提出的联邦迁移学习的数据处理方法,通过基于第二特征表征以及第四样本对应的特征表征集,通过纵向联邦学习算法对训练后的预测模型进行模型训练,以获得第二预测损失值;接着基于所述第二预测损失值,通过纵向联邦学习算法,更新训练后的待训练预测模型,以获得目标预测模型;而后基于所述第二预测损失值,通过纵向联邦学习算法,更新各个第二特征提取模型,以获得目标特征提取模型,实现了根据第二特征表征以及第四样本更新训练后的预测模型以及第二特征提取模型,进一步提高模型训练的准确性。
基于上述各个实施例,提出本发明联邦迁移学习的数据处理方法的第八实施例,在本实施例中,步骤S103之后,还包括:
步骤S801,获取第一参与方中第一待预测样本对应的待预测特征表征,其中,第一参与方基于预设业务需求对第一待预测样本的特征进行分组,以获得待预测样本特征组,并基于目标特征提取模型获取各个待预测样本特征组对应的待预测特征表征,第一待预测样本为第二业务场景对应的样本;
步骤S802,获取第三参与方中第二待预测样本,第二待预测样本为第二业务场景样本;
步骤S803,基于各个待预测特征表征以及第二待预测样本对应的特征表征集,通过纵向联邦学习算法计算目标预测模型的预测结果。
需要说明的是,在得到目标预测模型以及目标特征提取模型之后,可通过目标预测模型以及目标特征提取模型,基于第一参与方以及第三参与方在第二业务场景上进行联邦预测。
本实施例中,获取第一参与方中第一待预测样本对应的待预测特征表征,其中,第一参与方基于预设业务需求对第一待预测样本的特征进行分组,以获得待预测样本特征组,并基于目标特征提取模型获取各个待预测样本特征组对应的待预测特征表征,第一待预测样本为第二业务场景对应的样本;具体地,第一待预测样本的特征进行分组的过程与第一样本的分值过程类似,在此不再赘述。而后,获取第三参与方中第二待预测样本。其中,第一待预测样本为第一参与方中第二业务场景对应的样本,即第一待预测样本对应的数据为第二业务场景的数据;第二待预测样本为第三参与方中第二业务场景对应的样本,即第二待预测样本对应的数据为第二业务场景的数据。
接着,确定各个待预测特征表征以及第二待预测样本对应的特征表征集,具体地,将各个待预测特征表征以及第二待预测样本进行拼接得到该特征表征集,该各个待预测特征表征以及第二待预测样本对应的特征表征集包括各个待预测特征表征以及第二待预测样本的所有特征。而后,基于各个待预测特征表征以及第二待预测样本对应的特征表征集,通过纵向联邦学习算法计算目标预测模型的预测结果。即基于纵向联邦学习将各个待预测特征表征以及第二待预测样本对应的特征表征集,输入目标预测模型,以获得预测结果,能够通过目标预测模型对第一参与方以及第三参与方的样本进行准确的联邦预测。
参照图6,图6中,F1 A,t、F2 A,t、F3 A,t为第一待预测样本对应的待预测样本特征组,f1 C ,t、f2 C,t、f3 C,t、f4 C,t为第二待预测样本对应的待预测单体特征,将F1 A,t、F2 A,t、F3 A,t分别输入对应的目标特征提取模型R1、R2、R3,以获得多个待预测特征表征r1 A,t、r2 A,t、r3 At,而后将多个待预测特征表征以及待预测单体特征输入目标预测模型G得到预测结果Lcls C,s,根据预测结果Lcls C,s确定类别标签。
本实施例提出的联邦迁移学习的数据处理方法,通过获取第一参与方中第一待预测样本对应的待预测特征表征,其中,第一参与方基于预设业务需求对第一待预测样本的特征进行分组,以获得待预测样本特征组,并基于目标特征提取模型获取各个待预测样本特征组对应的待预测特征表征,第一待预测样本为第二业务场景对应的样本,接着获取第三参与方中第二待预测样本,而后基于各个待预测特征表征以及第二待预测样本对应的特征表征集,通过纵向联邦学习算法计算目标预测模型的预测结果,能够通过目标预测模型对对第一参与方以及第三参与方的样本进行准确的联邦预测,通过迁移学习得到的目标特征提取模型能够提高预测结果的准确性,通过目标预测模型可以解释得到预测结果的原因,以实现模型迁移与模型可解释的兼顾。
本发明实施例还提供一种联邦迁移学习的数据处理装置,参照图7,图7为本发明联邦迁移学习的数据处理装置一实施例的功能模块示意图,所述联邦迁移学习的数据处理装置包括:
第一模型确定模块100,用于通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型;
第二模型确定模块200,用于基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;
目标模型确定模块300,用于基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型。
可选地,第一模型确定模块100还用于:
通过第一参与方基于预设业务需求对第一样本的特征进行分组,以获得预设数量的第一样本特征组,并基于预设业务需求对第二样本的特征进行分组,以获得预设数量的第二样本特征组;
通过第一参与方通过预设数量的特征提取模型获取各个第一样本特征组对应的第一特征表征,以及各个第二样本特征组对应的第二特征表征;
通过第一参与方基于第一特征表征以及其对应的领域区分模型,确定多个第一领域区分损失值,基于各个第一领域区分损失值以及对应的特征提取模型,确定各个第三特征提取模型;
通过第一参与方基于第二特征表征以及其对应的领域区分模型,确定多个第二领域区分损失值,基于各个第二领域区分损失值以及对应的第三特征提取模型,确定各个第一特征提取模型。
可选地,第一模型确定模块100还用于:
通过第一参与方将各个第一样本特征组输入对应预设数量的特征提取模型,以获得第一特征表征,将各个第二样本特征组输入对应预设数量的特征提取模型,以获得第二特征表征。
可选地,第一模型确定模块100还用于:
通过第一参与方将各个第一特征表征输入对应的领域区分模型,以获得各个第一特征表征对应第一领域区分损失值;
通过第一参与方基于各个第一领域区分损失值确定更新后的各个领域区分模型,并基于各个第一领域区分损失值通过领域对抗学习,更新对应的特征提取模型,以获得各个第三特征提取模型。
可选地,第一模型确定模块100还用于:
通过第一参与方将各个第二特征表征输入对应的更新后的领域区分模型,以获得各个第二特征表征对应的第二领域区分损失值;
通过第一参与方基于各个第二领域区分损失值确定目标领域区分模型,并基于各个第二领域区分损失值通过领域对抗学习,更新对应的第三特征提取模型,以获得各个第一特征提取模型。
可选地,第二模型确定模块200还用于:
通过第二参与方获取第二参与方中所述第三样本,通过第一参与方获取第一样本对应的第一特征表征;
基于第一特征表征及第三样本,通过纵向联邦学习算法,计算待训练预测模型的第一预测损失值,分别基于所述第一预测损失值更新待训练预测模型以及各个第一特征提取模型,以获得训练后的预测模型以及各个第二特征提取模型。
可选地,第二模型确定模块200还用于:
基于第一特征表征及第三样本对应的第一特征表征集,通过纵向联邦学习算法对所述待训练预测模型进行模型训练,以获得第一预测损失值;
基于所述第一预测损失值,通过纵向联邦学习算法,更新所述待训练预测模型,以获得训练后的预测模型;
基于所述第一预测损失值更,通过纵向联邦学习算法,新各个第一特征提取模型,以获得第二特征提取模型。
可选地,目标模型确定模块300还用于:
通过第三参与方获取第三参与方中的第四样本,通过第一参与方获取第二样本对应的第二特征表征;
基于第二特征表征以及第四样本,通过纵向联邦学习算法,计算训练后的预测模型的第二预测损失值,分别基于所述第二预测损失值更新训练后的预测模型以及各个第二特征提取模型,以获得目标预测模型以及各个目标特征提取模型。
可选地,目标模型确定模块300还用于:
基于第二特征表征以及第四样本对应的特征表征集,通过纵向联邦学习算法对训练后的预测模型进行模型训练,以获得第二预测损失值;
基于所述第二预测损失值,通过纵向联邦学习算法,更新训练后的待训练预测模型,以获得目标预测模型;
基于所述第二预测损失值,通过纵向联邦学习算法,更新各个第二特征提取模型,以获得目标特征提取模型。
可选地,目标预测模型为欺诈评分预测模型;所述第一业务场景包括用户的信用评分场景,所述第二业务场景包括用户的欺诈评分场景,所述第一样本包括为第一参与方中的信用评分数据,第二样本为第一参与方中的欺诈评分数据,第三样本为第二参与方中的信用评分数据,第四样本为第三参与方中的欺诈评分数据。
第二模型确定模块200还用于:
根据第一参与方中的信用评分数据、第二参与方中的信用评分数据、待训练预测模型以及第一特征提取模型,确定训练后的欺诈评分预测模型以及各个第二特征提取模型;
目标模型确定模块300还用于:
根据第一参与方中的欺诈评分数据、第三参与方中的欺诈评分数据、训练后的欺诈评分预测模型以及第二特征提取模型,确定欺诈评分预测模型以及各个目标特征提取模型。
可选地,联邦迁移学习的数据处理装置还包括:
获取第一参与方中第一待预测样本对应的待预测特征表征,其中,第一参与方基于预设业务需求对第一待预测样本的特征进行分组,以获得待预测样本特征组,并基于目标特征提取模型获取各个待预测样本特征组对应的待预测特征表征,第一待预测样本为第二业务场景对应的样本;
获取第三参与方中第二待预测样本,第二待预测样本为第二业务场景样本;
基于各个待预测特征表征以及第二待预测样本对应的特征表征集,通过纵向联邦学习算法计算目标预测模型的预测结果。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有联邦迁移学习的数据处理程序,所述联邦迁移学习的数据处理程序被处理器执行时实现如上所述的联邦迁移学习的数据处理方法的步骤。
其中,在所述处理器上运行的联邦迁移学习的数据处理程序被执行时所实现的方法可参照本发明联邦迁移学习的数据处理方法各个实施例,此处不再赘述。
此外,本发明实施例还提出一种计算机程序产品,所述计算机程序产品执行时实现如上所述的联邦迁移学习的数据处理方法的步骤。
其中,计算机程序产品执行联邦迁移学习的数据处理程序时所实现的方法可参照本发明联邦迁移学习的数据处理方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (15)

1.一种联邦迁移学习的数据处理方法,其特征在于,所述联邦迁移学习的数据处理方法包括以下步骤:
通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型;
基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;
基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型。
2.如权利要求1所述的联邦迁移学习的数据处理方法,其特征在于,所述通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型的步骤包括:
通过第一参与方基于预设业务需求对第一样本的特征进行分组,以获得预设数量的第一样本特征组,并基于预设业务需求对第二样本的特征进行分组,以获得预设数量的第二样本特征组;
通过第一参与方通过预设数量的特征提取模型获取各个第一样本特征组对应的第一特征表征,以及各个第二样本特征组对应的第二特征表征;
通过第一参与方基于第一特征表征以及其对应的领域区分模型,确定多个第一领域区分损失值,基于各个第一领域区分损失值以及对应的特征提取模型,确定各个第三特征提取模型;
通过第一参与方基于第二特征表征以及其对应的领域区分模型,确定多个第二领域区分损失值,基于各个第二领域区分损失值以及对应的第三特征提取模型,确定各个第一特征提取模型。
3.如权利要求2所述的联邦迁移学习的数据处理方法,其特征在于,所述通过第一参与方通过预设数量的特征提取模型获取各个第一样本特征组对应的第一特征表征,以及各个第二样本特征组对应的第二特征表征的步骤包括:
通过第一参与方将各个第一样本特征组输入对应预设数量的特征提取模型,以获得第一特征表征,将各个第二样本特征组输入对应预设数量的特征提取模型,以获得第二特征表征。
4.如权利要求2所述的联邦迁移学习的数据处理方法,其特征在于,所述通过第一参与方基于第一特征表征以及其对应的领域区分模型,确定多个第一领域区分损失值,基于各个第一领域区分损失值以及对应的特征提取模型,确定各个第三特征提取模型的步骤包括:
通过第一参与方将各个第一特征表征输入对应的领域区分模型,以获得各个第一特征表征对应第一领域区分损失值;
通过第一参与方基于各个第一领域区分损失值确定更新后的各个领域区分模型,并基于各个第一领域区分损失值通过领域对抗学习,更新对应的特征提取模型,以获得各个第三特征提取模型。
5.如权利要求4所述的联邦迁移学习的数据处理方法,其特征在于,所述通过第一参与方基于第二特征表征以及其对应的领域区分模型,确定多个第二领域区分损失值,基于各个第二领域区分损失值以及对应的第三特征提取模型,确定各个第一特征提取模型的步骤包括:
通过第一参与方将各个第二特征表征输入对应的更新后的领域区分模型,以获得各个第二特征表征对应的第二领域区分损失值;
通过第一参与方基于各个第二领域区分损失值确定目标领域区分模型,并基于各个第二领域区分损失值通过领域对抗学习,更新对应的第三特征提取模型,以获得各个第一特征提取模型。
6.如权利要求1所述的联邦迁移学习的数据处理方法,其特征在于,所述基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型的步骤包括:
通过第二参与方获取第二参与方中所述第三样本,通过第一参与方获取第一样本对应的第一特征表征;
基于第一特征表征及第三样本,通过纵向联邦学习算法,计算待训练预测模型的第一预测损失值,分别基于所述第一预测损失值更新待训练预测模型以及各个第一特征提取模型,以获得训练后的预测模型以及各个第二特征提取模型。
7.如权利要求6所述的联邦迁移学习的数据处理方法,其特征在于,所述基于第一特征表征及第三样本,通过纵向联邦学习算法,计算待训练预测模型的第一预测损失值,分别基于所述第一预测损失值更新待训练预测模型以及各个第一特征提取模型,以获得训练后的预测模型以及各个第二特征提取模型的步骤包括:
基于第一特征表征及第三样本对应的第一特征表征集,通过纵向联邦学习算法对所述待训练预测模型进行模型训练,以获得第一预测损失值;
基于所述第一预测损失值,通过纵向联邦学习算法,更新所述待训练预测模型,以获得训练后的预测模型;
基于所述第一预测损失值更,通过纵向联邦学习算法,新各个第一特征提取模型,以获得第二特征提取模型。
8.如权利要求1所述的联邦迁移学习的数据处理方法,其特征在于,所述基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型的步骤包括:
通过第三参与方获取第三参与方中的第四样本,通过第一参与方获取第二样本对应的第二特征表征;
基于第二特征表征以及第四样本,通过纵向联邦学习算法,计算训练后的预测模型的第二预测损失值,分别基于所述第二预测损失值更新训练后的预测模型以及各个第二特征提取模型,以获得目标预测模型以及各个目标特征提取模型。
9.如权利要求8所述的联邦迁移学习的数据处理方法,其特征在于,所述基于第二特征表征以及第四样本,通过纵向联邦学习算法,计算训练后的预测模型的第二预测损失值,分别基于所述第二预测损失值更新训练后的预测模型以及各个第二特征提取模型,以获得目标预测模型以及各个目标特征提取模型的步骤包括:
基于第二特征表征以及第四样本对应的特征表征集,通过纵向联邦学习算法对训练后的预测模型进行模型训练,以获得第二预测损失值;
基于所述第二预测损失值,通过纵向联邦学习算法,更新训练后的待训练预测模型,以获得目标预测模型;
基于所述第二预测损失值,通过纵向联邦学习算法,更新各个第二特征提取模型,以获得目标特征提取模型。
10.如权利要求1所述的联邦迁移学习的数据处理方法,其特征在于,所述目标预测模型为欺诈评分预测模型;所述第一业务场景包括用户的信用评分场景,所述第二业务场景包括用户的欺诈评分场景,所述第一样本包括为第一参与方中的信用评分数据,第二样本为第一参与方中的欺诈评分数据,第三样本为第二参与方中的信用评分数据,第四样本为第三参与方中的欺诈评分数据;
所述基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型的步骤包括:
根据第一参与方中的信用评分数据、第二参与方中的信用评分数据、待训练预测模型以及第一特征提取模型,确定训练后的欺诈评分预测模型以及各个第二特征提取模型;
所述基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型的步骤包括:
根据第一参与方中的欺诈评分数据、第三参与方中的欺诈评分数据、训练后的欺诈评分预测模型以及第二特征提取模型,确定欺诈评分预测模型以及各个目标特征提取模型。
11.如权利要求1至10任一项所述的联邦迁移学习的数据处理方法,其特征在于,所述基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型的步骤之后,还包括:
获取第一参与方中第一待预测样本对应的待预测特征表征,其中,第一参与方基于预设业务需求对第一待预测样本的特征进行分组,以获得待预测样本特征组,并基于目标特征提取模型获取各个待预测样本特征组对应的待预测特征表征,第一待预测样本为第二业务场景对应的样本;
获取第三参与方中第二待预测样本,第二待预测样本为第二业务场景样本;
基于各个待预测特征表征以及第二待预测样本对应的特征表征集,通过纵向联邦学习算法计算目标预测模型的预测结果。
12.一种联邦迁移学习的数据处理装置,其特征在于,所述联邦迁移学习的数据处理装置包括:
第一模型确定模块,用于通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型;
第二模型确定模块,用于基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;
目标模型确定模块,用于基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型。
13.一种联邦迁移学习的数据处理设备,其特征在于,所述联邦迁移学习的数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的联邦迁移学习的数据处理程序,所述联邦迁移学习的数据处理程序被所述处理器执行时实现如权利要求1至11中任一项所述的联邦迁移学习的数据处理方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有联邦迁移学习的数据处理程序,所述联邦迁移学习的数据处理程序被处理器执行时实现如权利要求1至11中任一项所述的联邦迁移学习的数据处理方法的步骤。
15.一种计算机程序产品,其特征在于,所述计算机程序产品执行时实现如权利要求1至11中任一项所述的联邦迁移学习的数据处理方法的步骤。
CN202011393430.6A 2020-12-02 2020-12-02 联邦迁移学习的数据处理方法、装置、设备及存储介质 Pending CN112381236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011393430.6A CN112381236A (zh) 2020-12-02 2020-12-02 联邦迁移学习的数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011393430.6A CN112381236A (zh) 2020-12-02 2020-12-02 联邦迁移学习的数据处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112381236A true CN112381236A (zh) 2021-02-19

Family

ID=74590354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011393430.6A Pending CN112381236A (zh) 2020-12-02 2020-12-02 联邦迁移学习的数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112381236A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672684A (zh) * 2021-08-20 2021-11-19 电子科技大学 一种面向非独立同分布数据的分层用户训练管理系统及方法
WO2023124312A1 (zh) * 2021-12-29 2023-07-06 新智我来网络科技有限公司 联合学习中的预测方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672684A (zh) * 2021-08-20 2021-11-19 电子科技大学 一种面向非独立同分布数据的分层用户训练管理系统及方法
CN113672684B (zh) * 2021-08-20 2023-04-21 电子科技大学 一种面向非独立同分布数据的分层用户训练管理系统及方法
WO2023124312A1 (zh) * 2021-12-29 2023-07-06 新智我来网络科技有限公司 联合学习中的预测方法及装置

Similar Documents

Publication Publication Date Title
CN111079022B (zh) 基于联邦学习的个性化推荐方法、装置、设备及介质
WO2022016556A1 (zh) 一种神经网络蒸馏方法以及装置
EP3547155A1 (en) Entity representation learning for improving digital content recommendations
WO2021120677A1 (zh) 一种仓储模型训练方法、装置、计算机设备及存储介质
WO2021143267A1 (zh) 基于图像检测的细粒度分类模型处理方法、及其相关设备
CN110825956A (zh) 一种信息流推荐方法、装置、计算机设备及存储介质
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
CN109471978B (zh) 一种电子资源推荐方法及装置
WO2021155691A1 (zh) 用户画像生成方法、装置、存储介质及设备
CN110020022B (zh) 数据处理方法、装置、设备及可读存储介质
US11748452B2 (en) Method for data processing by performing different non-linear combination processing
CN110573837A (zh) 导航方法、装置、存储介质以及服务器
CN116010684A (zh) 物品推荐方法、装置及存储介质
CN112785005B (zh) 多目标任务的辅助决策方法、装置、计算机设备及介质
CN112381236A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
CN111339406A (zh) 个性化推荐方法、装置、设备及存储介质
CN110598084A (zh) 对象排序方法、商品排序方法、装置及电子设备
CN112418442A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
CN113886721B (zh) 个性化兴趣点推荐方法、装置、计算机设备及存储介质
CN112418443A (zh) 基于迁移学习的数据处理方法、装置、设备及存储介质
WO2023050143A1 (zh) 一种推荐模型训练方法及装置
CN112418441A (zh) 基于迁移学习的数据处理方法、装置、设备及存储介质
CN114139052B (zh) 用于智能推荐的排序模型训练方法、智能推荐方法及装置
CN116204709A (zh) 一种数据处理方法及相关装置
CN116205686A (zh) 一种多媒体资源推荐的方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination