WO2022007321A1

WO2022007321A1 - 纵向联邦建模优化方法、装置、设备及可读存储介质

Info

Publication number: WO2022007321A1
Application number: PCT/CN2020/133430
Authority: WO
Inventors: 梁新乐; 刘洋; 陈天健
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2020-07-10
Filing date: 2020-12-02
Publication date: 2022-01-13
Also published as: CN111797999A

Abstract

一种纵向联邦建模优化方法、装置、设备及可读存储介质，所述方法包括参与纵向联邦学习的参与方基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络(S10)；基于更新后的本端搜索网络得到本端目标模型(S20)。该方法中参与方在使用纵向联邦技术建模之时无需事先确定其模型结构，使得纵向联邦学习的参与门槛大大降低。

Description

纵向联邦建模优化方法、装置、设备及可读存储介质

本申请要求2020年7月10日申请的，申请号为202010663980.9，名称为“纵向联邦建模优化方法、装置、设备及可读存储介质”的中国专利申请的优先权，在此将其全文引入作为参考。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种纵向联邦建模优化方法、装置、设备及可读存储介质。

背景技术

随着人工智能的发展，人们为解决数据孤岛的问题，提出了“联邦学习”的概念，使得联邦双方在不用给出己方数据的情况下，也可进行模型训练得到模型参数，并且可以避免数据隐私泄露的问题。

纵向联邦学习是在参与者的数据特征重叠较小，而用户重叠较多的情况下，取出参与者用户相同而用户数据特征不同的那部分用户及数据进行联合训练机器学习模型。比如有属于同一个地区的两个参与者A和B，其中参与者A是一家银行，参与者B是一个电商平台。参与者A和B在同一地区拥有较多相同的用户，但是A与B的业务不同，记录的用户数据特征是不同的。特别地，A和B记录的用户数据特征可能是互补的。在这样的场景下，可以使用纵向联邦学习来帮助A和B构建联合机器学习预测模型，帮助A和B向他们的客户提供更好的服务。

但是，目前纵向联邦学习的参与方在使用纵向联邦技术时需要对各自的模型结构进行预先的设计，而由于设计的模型结构稍有差别可能就会极大地影响整体纵向联邦学习技术的性能，使得纵向联邦学习的参与门槛较高，限制了纵向联邦学习在具体任务领域的应用范围。

发明内容

本申请的主要目的在于提供一种纵向联邦建模优化方法、装置、设备及可读存储介质，旨在解决目前纵向联邦学习的参与方在使用纵向联邦技术时需要对各自的模型结构进行预先的设计，造成纵向联邦学习参与门槛高的问题。

为实现上述目的，本申请提供一种纵向联邦建模优化方法，所述方法包括以下步骤：

所述方法应用于参与纵向联邦建模的参与方，各参与方分别部署有基于各自数据特征构建的数据集和搜索网络，所述方法包括以下步骤：

基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络；

基于更新后的本端搜索网络得到本端目标模型。

在一实施例中，参与方的数据集包括第一数据集和第二数据集，所述基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络的步骤包括：

基于本端第一数据集与其他参与方交互用于更新各自搜索网络中模型参数的第一中间结果，并基于接收到的第一中间结果更新本端搜索网络的副本得到本端初更副本；

基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本；

采用所述本端次更副本中的搜索结构参数更新所述本端搜索网络得到本端初更搜索网络；

基于所述本端第一数据集与其他参与方交互用于更新各自初更搜索网络中模型参数的第三中间结果，并基于接收到的第三中间结果更新所述本端初更搜索网络得到更新后的本端搜索网络。

在一实施例中，所述方法应用于拥有标签数据的数据应用参与方，所述数据应用参与方部署有后接网络，所述基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本的步骤包括：

接收数据提供参与方发送的第二网络输出，其中，所述数据提供参与方将他端第二数据集输入他端初更副本得到所述第一网络输出；

将本端第二数据集输入所述本端初更副本得到第二网络输出，并将所述第一网络输出和所述第二网络输出输入所述后接网络得到第三网络输出；

基于所述第三网络输出和本端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及所述本端初更副本中搜索结构参数的第二梯度；

将所述第一梯度发送给所述数据提供参与方，以供所述数据提供参与方根据所述第一梯度更新他端初更副本中的搜索结构参数；

根据所述第二梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。

在一实施例中，所述方法应用于数据提供参与方，所述基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本的步骤包括：

将本端第二数据集输入所述本端初更副本得到第一网络输出；

将所述第一网络输出发送给拥有标签数据的数据应用参与方，以供所述数据应用参与方将他端第二数据集输入他端初更副本得到第二网络输出，将所述第一网络输出和所述第二网络输出输入后接网络得到第三网络输出，并基于所述第三网络输出和他端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及他端初更副本中搜索结构参数的第二梯度，并根据所述第二梯度更新他端初更副本中的搜索结构参数，其中，所述后接网络部署于所述数据应用参与方；

接收所述数据应用参与方发送的所述第一梯度，并根据所述第一梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。

在一实施例中，参与方的搜索网络中搜索结构参数包括搜索网络中网络单元之间连接操作对应的权重，所述基于更新后的本端搜索网络得到本端目标模型的步骤包括：

根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

将各所述保留操作和各所述保留操作连接的网络单元所构成的模型作为本端目标模型。

在一实施例中，所述根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作的步骤之前，还包括：

检测当前是否满足预设建模停止条件；

若满足所述预设建模停止条件，则执行所述步骤：根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

若不满足所述预设建模停止条件，则基于更新后的本端搜索网络再执行所述步骤：基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络。

在一实施例中，所述方法应用于拥有标签数据的数据应用参与方，所述基于更新后的本端搜索网络得到本端目标模型的步骤之后，还包括：

接收数据提供参与方发送的第一模型输出，其中，所述数据提供参与方将目标用户在他端的第二风险特征对应的用户数据输入他端目标模型，得到所述第一模型输出；

将目标用户在本端的第二风险特征对应的用户数据输入本端目标模型，得到第二模型输出；

将所述第一模型输出和所述第二模型输出进行拼接后输入本端的后接网络，得到所述目标用户的风险预测结果。

为实现上述目的，本申请提供一种纵向联邦建模优化装置，所述装置部署于参与纵向联邦建模的参与方，各参与方分别部署有基于各自数据特征构建的数据集和搜索网络，所述装置包括：

交互模块，用于基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络；

确定模块，用于基于更新后的本端搜索网络得到本端目标模型。

为实现上述目的，本申请还提供一种纵向联邦建模优化设备，所述纵向联邦建模优化设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的纵向联邦建模优化程序，所述纵向联邦建模优化程序被所述处理器执行时实现如上所述的纵向联邦建模优化方法的步骤。

此外，为实现上述目的，本申请还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有纵向联邦建模优化程序，所述纵向联邦建模优化程序被处理器执行时实现如上所述的纵向联邦建模优化方法的步骤。

本申请中，通过在参与纵向联邦学习的各个参与方部署基于各自数据特征构建的数据集和搜索网络，各个参与方采用各自的数据集与其他参与方计算并交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，基于各自接收到的中间结果更新各自的搜索网络，基于更新后的搜索网络得到各自的目标模型。相比于现有纵向联邦学习中，各参与方需要人工花费大量人力物力预先设计模型结构的方式，本申请实现了在纵向联邦建模过程中，各参与方只需要设置各自的搜索网络即可，搜索网络中各个网络单元之间的连接，也即模型结构，是在纵向联邦建模过程中通过优化更新搜索结构参数的方式自动确定的，实现了自动纵向联邦学习，不需要花费大量人力物力预先设置模型结构，降低了参与纵向联邦学习的门槛，使得纵向联邦学习能够被应用于更广泛的具体任务领域中去实现具体的任务，提高了纵向联邦学习的应用范围。并且，在本申请纵向联邦建模过程中，各个参与方之间并不会直接交互数据集和模型本身，而是交互用于更新模型参数和搜索结构参数的中间结果，从而保障了各个参与方的数据安全和模型信息安全。

附图说明

图1为本申请实施例方案涉及的硬件运行环境的结构示意图；

图2为本申请纵向联邦建模优化方法第一实施例的流程示意图；

图3为本申请实施例涉及的一种参与方联合更新模型参数的示意图；

图4为本申请实施例涉及的一种参与方联合更新搜索结构参数的示意图；

图5为本申请实施例涉及的一种参与方联合更新模型参数的示意图；

图6为本申请纵向联邦建模优化装置较佳实施例的功能示意图模块图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，图1是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

需要说明的是，本申请实施例纵向联邦建模优化设备可以是智能手机、个人计算机和服务器等设备，在此不做具体限制。纵向联邦建模优化设备可以是参与纵向联邦建模的参与方，各参与方分别部署有基于各自数据特征构建的数据集和搜索网络。

如图1所示，该纵向联邦建模优化设备可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的设备结构并不构成对纵向联邦建模优化设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及纵向联邦建模优化程序。其中，操作系统是管理和控制设备硬件和软件资源的程序，支持纵向联邦建模优化程序以及其它软件或程序的运行。在图1所示的设备中，用户接口1003主要用于与客户端进行数据通信；网络接口1004主要用于参与纵向联邦建模的其他参与方建立通信连接；处理器1001可以用于调用存储器1005中存储的纵向联邦建模优化程序，并执行以下操作：

基于更新后的本端搜索网络得到本端目标模型。

在一实施例中，当纵向联邦建模优化设备是拥有标签数据的数据应用参与方时，所述数据应用参与方部署有后接网络，所述基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本的步骤包括：

在一实施例中，当纵向联邦建模优化设备是数据提供参与方，所述基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本的步骤包括：

在一实施例中，所述根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作的步骤之前，处理器1001还可以用于调用存储器1005中存储的纵向联邦建模优化程序，执行以下操作：

检测当前是否满足预设建模停止条件；

在一实施例中，所述方法应用于拥有标签数据的数据应用参与方，所述基于更新后的本端搜索网络得到本端目标模型的步骤之后，处理器1001还可以用于调用存储器1005中存储的纵向联邦建模优化程序，执行以下操作：

基于上述的结构，提出纵向联邦建模优化方法的各实施例。

参照图2，图2为本申请纵向联邦建模优化方法第一实施例的流程示意图。需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。本申请纵向联邦建模优化方法应用于参与纵向联邦学习的参与方，各参与方分别部署有基于各自数据特征构建的数据集和搜索网络，参与方可以是智能手机、个人计算机和服务器等设备。在本实施例中，纵向联邦建模优化方法包括：

步骤S10，基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络；

在本实施例中，纵向联邦学习中的参与方分为两类，一类是拥有标签数据的数据应用参与方，一类是没有标签数据的数据提供参与方，一般情况下，数据应用参与方有一个，数据提供参与方有一个或多个。各个参与方分别部署有基于各自数据特征构建的数据集和搜索网络。其中，各个参与方的数据集的样本维度是对齐的，也即，各个数据集的样本ID是相同的，但是各个参与方的数据特征可各不相同。各个参与方预先可采用加密样本对齐的方式来构建样本维度对齐的数据集，在此不进行详细赘述。搜索网络是指用于进行网络结构搜索(NAS)的网络，在本实施例中，各个参与方的搜索网络可以是各自预先根据DARTS(Differentiable Architecture Search，可微结构搜索)方法设计的网络。

搜索网络中包括多个单元，每个单元对应一个网络层，其中部分单元之间设置有连接操作，以其中两个单元为例，这两个单元之前的连接操作可以是预先设置的N种连接操作，并定义了每种连接操作对应的权重，该权重即搜索网络的搜索结构参数，单元内的网络层参数即搜索网络的模型参数。在模型训练过程中，需要进行网络结构搜索以优化更新搜索结构参数和模型参数，基于最终更新的搜索结构参数即可确定最终的网络结构，即确定保留哪个或哪些连接操作。由于该网络的结构是经过网络搜索之后才确定的，各个参与方不需要像设计传统纵向联邦学习的模型一样去设置模型的网络结构，从而降低了设计模型的难度。

进一步地，数据应用参与方还可以部署基于具体的模型预测任务设置的后接网络，后接网络被设置于连接在各个参与方的搜索网络之后，也即，以各个搜索网络的输出数据作为输入数据。后接网络可以采用全连接层，或者其他复杂的神经网络结构，具体可根据模型预测任务不同而不同。

在本实施例中，执行主体可以是数据应用参与方，也可以是数据提供参与方。为区分执行主体这一方与其他参与方，以下将执行主体这一方称为本端。

本端可基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络中的模型参数和搜索结构参数，通过更新参数来更新本端搜索网络。需要说明的是，在以下各实施例中，对搜索网络中模型参数和/或搜索结构参数的更新，即是对搜索网络的更新。其中，各参与方的搜索网络中包括模型参数和搜索结构参数，在各方联合训练之前，参数是初始化的，在联合训练过程中，各方需要进行多轮更新各自的模型参数和搜索结构参数。各个参与方交互的并不是各自的数据集，而是用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，也即，每个参与方在更新自己的参数时，需要其他参与方的数据，因此，各个参与方可以计算其他参与方更新参数时所需的中间结果，传递给其他参数方，进而帮助其他参与方更新它的参数。其中，中间结果可以是参数的梯度，也可以是搜索网络的输出数据。具体地，当参与方是数据提供参与方时，发送给对方的中间结果可以是该端搜索网络的输出数据；当参与方是数据应用参与方时，发送给对方的中间结果可以是计算得到的数据提供方所发送输出数据对应的梯度。由于传递的是中间结果而不是数据集中的原始数据，使得各个参与方互相之间并没有泄露各自的数据隐私，保护了各个参与方的数据安全。

各个参与方可进行多轮联合更新参数，在一种实施方式中，一轮联合更新参数的过程可以是各个参与方联合采用各自的数据集同时更新搜索结构参数和模型参数。具体地，数据提供参与方将该端的数据集输入该端的搜索网络，经过搜索网络的处理得到网络输出(本段中称第一网络输出)，并将第一网络输出发送给数据应用参与方；数据应用参与方将该端的数据集输入该端的搜索网络，经过该端搜索网络的处理得到网络输出(本段中称第二网络输出)；数据应用参与方根据第一网络输出和第二网络输出得到预测结果，具体地，若数据应用参与方部署有后接网络，则数据应用参与方可将第一网络输出和第二网络输出进行拼接后输入后接网络，经过后接网络的处理得到预测结果；数据应用参与方根据预测结果和该端的标签数据计算损失函数，该损失函数可以是回归问题的均方误差或分类问题的交叉熵损失等，并计算损失函数相对于该端模型参数和网络结构参数的梯度，以及，计算损失函数相对于第一网络输出的梯度，数据应用参与方将第一网络输出对应的梯度发送给数据提供参与方；数据提供参与方接收第一网络输出的梯度，并根据链式法则和梯度下降算法，根据第一网络输出的梯度计算得到损失函数相对于该端模型参数和网络结构参数的梯度，并根据梯度更新该端的模型参数和网络结构参数；数据应用参与方也根据该端计算得到的模型参数和网络结构参数的梯度，更新该端的模型参数和网络结构参数，至此完成一轮联合更新参数。其中，数据提供参与方发送给数据应用参与方的中间结果是第一网络输出，数据应用参与方发送给数据提供参与方的中间结果是第一网络输出对应的梯度。

需要说明的是，参与方可在各轮联合更新参数中采用不同的数据集。具体地，参与方可将总的数据集划分为多个小的训练集(也可称为数据批)，每轮采用一个小数据集参与联合更新参数，或者，参与方也可以是每轮联合参数更新前，从总的数据集中进行有放回的采样一批数据来参与该轮的联合参数更新。

在一轮联合更新参数中，参与方的模型参数和网络结构同时更新，每个参与方只需要进行一次数据发送和一次数据接收，数据通信极少，通信效率高，进而极大地提高了纵向联邦学习的效率。

进一步地，在另一种实施方式中，参与方的数据集可分为第一数据集和第二数据集两个数据集，第一数据集可作为训练集，第二数据集可作为验证集。一轮联合更新参数的过程可分为两步，第一步各参与方联合采用各自的第一数据集更新各自搜索网络中的模型参数，在第一步更新的基础上，第二步各个参与方联合采用各自的第二数据集更新各自搜索网络中的搜索结构参数。

具体地，第一步中，数据提供参与方将该端的第一数据集输入该端的搜索网络，经过搜索网络的处理得到网络输出(本段中称第一网络输出)，并将第一网络输出发送给数据应用参与方；数据应用参与方将该端的第一数据集输入该端的搜索网络，经过该端搜索网络的处理得到网络输出(本段中称第二网络输出)；数据应用参与方根据第一网络输出和第二网络输出得到预测结果，具体地，若数据应用参与方部署有后接网络，则数据应用参与方可将第一网络输出和第二网络输出进行拼接后输入后接网络，经过后接网络的处理得到预测结果；数据应用参与方根据预测结果和该端的标签数据计算损失函数，并计算损失函数相对于该端模型参数的梯度，以及，计算损失函数相对于第一网络输出的梯度，数据应用参与方将第一网络输出对应的梯度发送给数据提供参与方；数据提供参与方接收第一网络输出的梯度，并根据链式法则和梯度下降算法，根据第一网络输出的梯度计算得到损失函数相对于该端模型参数的梯度，并根据梯度更新该端的模型参数；数据应用参与方也根据该端计算得到的模型参数的梯度，更新该端的模型参数。

第二步中，数据提供参与方将该端的第二数据集输入该端的搜索网络，经过搜索网络的处理得到网络输出(本段中称第一网络输出)，并将第一网络输出发送给数据应用参与方；数据应用参与方将该端的第二数据集输入该端的搜索网络，经过该端搜索网络的处理得到网络输出(本段中称第二网络输出)；数据应用参与方根据第一网络输出和第二网络输出得到预测结果，具体地，若数据应用参与方部署有后接网络，则数据应用参与方可将第一网络输出和第二网络输出进行拼接后输入后接网络，经过后接网络的处理得到预测结果；数据应用参与方根据预测结果和该端的标签数据计算损失函数，并计算损失函数相对于该端搜索结构参数的梯度，以及，计算损失函数相对于第一网络输出的梯度，数据应用参与方将第一网络输出对应的梯度发送给数据提供参与方；数据提供参与方接收第一网络输出的梯度，并根据链式法则和梯度下降算法，根据第一网络输出的梯度计算得到损失函数相对于该端搜索结构参数的梯度，并根据梯度更新该端的搜索结构参数；数据应用参与方也根据该端计算得到的搜索结构参数的梯度，更新该端的搜索结构参数，至此完成一轮参数更新。

在一轮联合更新参数中，各参与方先采用各自的第一数据集联合更新各自搜索网络的模型参数，再采用各自的第二数据集联合更新各自搜索网络的搜索结构参数，降低了出现过拟合现象的可能性。

需要说明的是，若数据应用参与方部署有后接网络，则该数据方在更新该端搜索网络的模型参数时，还要计算该端后接网络中模型参数的梯度，并根据梯度更新后接网络。

步骤S20，基于更新后的本端搜索网络得到本端目标模型。

本端在更新本端搜索网络后，根据更新后的本端搜索网络得到本端目标模型。具体地，本端可以在进行多轮联合更新参数后，根据最后一轮更新得到的本端搜索网络，得到本端目标模型。在一种实施方式中，可以是将本端搜索网络直接作为本端目标模型，其中的搜索结构参数也作为本端目标模型的模型参数。

进一步地，所述步骤S20包括：

步骤S201，根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

步骤S202，将各所述保留操作和各所述保留操作连接的网络单元所构成的模型作为本端目标模型。

参与方的搜索网络中搜索结构参数可包括搜索网络中网络单元之间连接操作对应的权重。也即，网络单元之间设置了连接操作，每个连接操作对应一个权重。需要说明的是，并不是任意两个网络单元之间都设置有连接操作。本端可根据更新后的本端搜索网络中的搜索结构参数，从各个连接操作中选取保留操作。具体地，对于每两个存在连接操作的网络单元，其之间有多条连接操作，可从多条连接操作中选出权重大的一个或多个连接操作作为保留操作。

在确定保留操作后，将各保留操作以及各个保留操作连接的网络单元所构成的模型，作为本端目标模型。需要说明的是，若本端是数据应用参与方，并部署有后接网络，则本端目标模型还包括后接网络。

在本实施例中，通过在参与纵向联邦学习的各个参与方部署基于各自数据特征构建的数据集和搜索网络，各个参与方采用各自的数据集与其他参与方计算并交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，基于各自接收到的中间结果更新各自的搜索网络，基于更新后的搜索网络得到各自的目标模型。相比于现有纵向联邦学习中，各参与方需要人工花费大量人力物力预先设计模型结构的方式，本申请实施例实现了在纵向联邦建模过程中，各参与方只需要设置各自的搜索网络即可，搜索网络中各个网络单元之间的连接，也即模型结构，是在纵向联邦建模过程中通过优化更新搜索结构参数的方式自动确定的，实现了自动纵向联邦学习，不需要花费大量人力物力预先设置模型结构，降低了参与纵向联邦学习的门槛，使得纵向联邦学习能够被应用于更广泛的具体任务领域中去实现具体的任务，提高了纵向联邦学习的应用范围。并且，在本实施例纵向联邦建模过程中，各个参与方之间并不会直接交互数据集和模型本身，而是交互用于更新模型参数和搜索结构参数的中间结果，从而保障了各个参与方的数据安全和模型信息安全。

进一步地，基于上述第一实施例，提出本申请纵向联邦建模优化方法第二实施例，在本实施例中，参与方的数据集包括第一数据集和第二数据集，所述步骤S10包括：

步骤S101，基于本端第一数据集与其他参与方交互用于更新各自搜索网络中模型参数的第一中间结果，并基于接收到的第一中间结果更新本端搜索网络的副本得到本端初更副本；

在本实施例中，各参与方进行一轮联合更新参数的过程可以是分为三步。第一步是各个参与方采用各自的第一数据集联合更新各自搜索网络的副本中的模型参数；第二步是在第一步更新基础上，各个参与方采用各自的第二数据集联合更新各自副本中的搜索网络参数，以完成一次网络结构搜索；第三步是参与方将第二步更新后的副本搜索网络参数作为各自搜索网络中的搜索网络参数，再采用各自的第一数据集联合更新各自的搜索网络参数，以完成一次模型参数更新。

在第一步中，本端基于本端第一数据集与其他参与方交互用于更新各自搜索网络模型中模型参数的第一中间结果，并基于接收到的第一中间结果更新本端搜索网络的副本得到本端初更副本。其中，各个参与方可在一轮联合更新之前，先复制各自当前的搜索网络，得到各自搜索网络的副本。具体地，数据提供参与方向数据应用参与方发送的第一中间结果可以是数据提供参与方将其第一数据集输入其搜索网络得到的网络输出，数据应用参与方向数据提供参与方发送的第一中间结果可以是该网络输出对应的梯度。

也即，在第一步中，数据提供参与方将该端的第一数据集输入该端的搜索网络，经过搜索网络的处理得到网络输出(本段中称第一网络输出)，并将第一网络输出发送给数据应用参与方；数据应用参与方将该端的第一数据集输入该端的搜索网络，经过该端搜索网络的处理得到网络输出(本段中称第二网络输出)；数据应用参与方根据第一网络输出和第二网络输出得到预测结果，具体地，若数据应用参与方部署有后接网络，则数据应用参与方可将第一网络输出和第二网络输出进行拼接后输入后接网络，经过后接网络的处理得到预测结果；数据应用参与方根据预测结果和该端的标签数据计算损失函数，并计算损失函数相对于该端模型参数的梯度，以及，计算损失函数相对于第一网络输出的梯度，数据应用参与方将第一网络输出对应的梯度发送给数据提供参与方；数据提供参与方接收第一网络输出的梯度，并根据链式法则和梯度下降算法，根据第一网络输出的梯度计算得到损失函数相对于该端搜索网络副本中模型参数的梯度，并根据该梯度更新该端副本中的模型参数，以得到该端的初更副本；数据应用参与方也根据该端计算得到的模型参数的梯度，更新该端副本中的模型参数，得到该端的初更副本。

步骤S102，基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本；

第二步中，本端基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新本端初更副本得到本端次更副本。其中，数据提供参与方发送给数据应用参与方的第二中间结果可以是数据提供参与方将该端的第二数据集输入该端的初更副本得到的网络输出，数据应用参与方发送给数据提供应用方的第二中间结果可以是该网络输出对应的梯度。

也即，在第二步中，数据提供参与方将该端的第二数据集输入该端的初更副本，经过初更副本的处理得到网络输出(本段中称第一网络输出)，并将第一网络输出发送给数据应用参与方；数据应用参与方将该端的第二数据集输入该端的初更副本，经过该端初更副本的处理得到网络输出(本段中称第二网络输出)；数据应用参与方根据第一网络输出和第二网络输出得到预测结果，具体地，若数据应用参与方部署有后接网络，则数据应用参与方可将第一网络输出和第二网络输出进行拼接后输入后接网络，经过后接网络的处理得到预测结果；数据应用参与方根据预测结果和该端的标签数据计算损失函数，并计算损失函数相对于该端初更副本中搜索结构参数的梯度，以及，计算损失函数相对于第一网络输出的梯度，数据应用参与方将第一网络输出对应的梯度发送给数据提供参与方；数据提供参与方接收第一网络输出的梯度，并根据链式法则和梯度下降算法，根据第一网络输出的梯度计算得到损失函数相对于该端初更副本中搜索结构参数的梯度，并根据梯度更新该端的搜索结构参数，得到该端的次更副本；数据应用参与方也根据该端计算得到的搜索结构参数的梯度，更新该端初更副本中的搜索结构参数，得到该端的次更副本。

通过第一步中进行一次模型参数的更新，可近似寻找模型参数最优的过程，而不是训练至模型收敛来完全求解内部优化，从而减少了参与方之间联合更新模型参数的次数，进而提高了纵向联邦建模效率。

步骤S103，采用所述本端次更副本中的搜索结构参数更新所述本端搜索网络得到本端初更搜索网络；

步骤S104，基于所述本端第一数据集与其他参与方交互用于更新各自初更搜索网络中模型参数的第三中间结果，并基于接收到的第三中间结果更新所述本端初更搜索网络得到更新后的本端搜索网络。

第三步中，本端先采用本端次更副本中的搜索结构参数更新本端搜索网络，得到本端初更搜索网络。具体地，参与方将该端当前的搜索网络中的搜索结构参数，替换为该端次更副本中的搜索结构参数，以对该端搜索网络进行更新。也即，相比于该轮联合更新参数之前的搜索网络，初更搜索网络的搜索结构参数改变，模型参数不变，也即在模型参数不变的基础上，完成了一次网络结构搜索，更新了搜索结构参数，以优化搜索网络的结构。

在得到本端初更搜索网络后，本端基于本端第一数据集与其他参与方交互用于更新各自初更搜索网络中模型参数的第三中间结果，并基于接收到的第三中间结果更新本端初更搜索网络得到更新后的本端搜索网络。其中，数据提供参与方发送给数据应用参与方的第三中间结果可以是将该端的第一数据集输入该端的初更搜索网络得到的网络输出，数据应用参与方发送给数据提供参与方的第三中间结果可以是该网络输出对应的梯度。

具体地，数据提供参与方将该端的第一数据集输入该端的初更搜索网络，经过初更搜索网络的处理得到网络输出(本段中称第一网络输出)，并将第一网络输出发送给数据应用参与方；数据应用参与方将该端的第一数据集输入该端的初更搜索网络，经过该端初更搜索网络的处理得到网络输出(本段中称第二网络输出)；数据应用参与方根据第一网络输出和第二网络输出得到预测结果，具体地，若数据应用参与方部署有后接网络，则数据应用参与方可将第一网络输出和第二网络输出进行拼接后输入后接网络，经过后接网络的处理得到预测结果；数据应用参与方根据预测结果和该端的标签数据计算损失函数，并计算损失函数相对于该端初更搜索网络中模型参数的梯度，以及，计算损失函数相对于第一网络输出的梯度，数据应用参与方将第一网络输出对应的梯度发送给数据提供参与方；数据提供参与方接收第一网络输出的梯度，并根据链式法则和梯度下降算法，根据第一网络输出的梯度计算得到损失函数相对于该端初更搜索网络中模型参数的梯度，并根据该梯度更新该端初更搜索网络的模型参数，以得到该端更新后的搜索网络；数据应用参与方也根据该端计算得到的模型参数的梯度，更新该端初更搜索网络中的模型参数，得到该端更新后的搜索网络。

进一步地，各个参与方可联合进行多轮参数更新，参与方每轮采用的数据集可以不同。在第三步中，实现了保持搜索网络中搜索结构参数不变，优化更新搜索网络的模型参数。

在本实施例中，通过多轮联合更新参数，各个参与方交替更新各自搜索网络中的搜索结构参数和模型参数，且更新模型参数采用的是第一数据集，更新搜索结构参数采用的是第二数据集，采用不同的数据集来更新两种参数，有效地避免了过拟合现象发生，进而提高了联合建模的成功率，提高了建模得到的模型的预测准确率。并且，在纵向联邦学习过程中，各个参与方并没有互相暴露自己数据集中的数据，从而保障了各个参与方的数据安全；各个参与方每轮联合更新参数的过程只需要发送三次数据和接收三次数据，数据通信量少，通信效率高，进而使得纵向联邦学习效率高；各个参与方采用搜索网络来参与纵向联邦学习，在使用纵向联邦技术建模之时无需事先确定其模型结构，极大地降低了参与纵向联邦学习的门槛，提高了纵向联邦学习在具体任务领域的应用范围。

进一步地，在另一实施方式中，一轮联合更新参数的过程也可以分三步，第一步，各个参与方先将各自当前的搜索网络中的模型参数进行复制，得到模型参数副本，各个参与方再采用各自的第一数据集联合更新各自的搜索网络中的模型参数；在第一步更新的基础上，第二步是各个参与方采用各自的第二数据集联合更新各自的搜索网络中的搜索结构参数；第三步，各个参与方先采用模型参数副本替换第二步更新后的搜索网络中的模型参数，再采用各自的第一数据集联合更新各自的搜索网络中的模型参数。通过复制模型参数的方式，也可实现保存模型参数不变，更新搜索结构参数，保持搜索结构参数不变，更新模型参数。

进一步地，基于上述第二实施例，提出本申请纵向联邦建模优化方法第三实施例。在本实施例中，所述方法应用于拥有标签数据的数据应用参与方，所述数据应用参与方部署有后接网络，所述步骤S102的步骤包括：

步骤S1021，接收数据提供参与方发送的第二网络输出，其中，所述数据提供参与方将他端第二数据集输入他端初更副本得到所述第一网络输出；

在本实施例中，执行主体为数据应用参与方(以下称本端)，数据应用参与方还部署有后接网络。

本端接收数据提供参与方发送的第二网络输出，其中，数据提供参与方将他端第二数据集输入他端初更副本得到第一网络输出。其中，他端指的是数据提供参与方。具体地，数据提供参与方将他端的第二数据集输入他端初更副本中，经过他端初更副本的处理，得到第一网络输出。需要说明的是，数据提供参与方可以有多个，在本实施例中，以一个数据提供参与方为例进行具体例子的阐述。

步骤S1022，将本端第二数据集输入所述本端初更副本得到第二网络输出，并将所述第一网络输出和所述第二网络输出输入所述后接网络得到第三网络输出；

本端将本端第二数据集输入本端初更副本得到第二网络输出，具体地，将本端第二数据集输入本端初更副本，经过本端初更副本的处理，得到第二网络输出。本端将第一网络输出和第二网络输出输入后接网络，得到第三网络输出，也即预测结果。具体地，本端可将第一网络输出和第二网络输出进行拼接，拼接的方式可以是进行向量拼接，或计算加权平均；将拼接结果输入后接网络，经过后接网络的处理得到第三网络输出。

步骤S1023，基于所述第三网络输出和本端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及所述本端初更副本中搜索结构参数的第二梯度；

本端根据第三网络输出和本端的标签数据计算损失函数，具体的损失函数计算方式可参考现有的机器学习模型损失函数计算方式，在此不进行详细赘述。并计算损失函数相对于第一网络输出的第一梯度，以及损失函数相对于本端初更副本中搜索结构参数的第二梯度。具体可以按照链式法则和梯度下降算法计算梯度。

步骤S1024，将所述第一梯度发送给所述数据提供参与方，以供所述数据提供参与方根据所述第一梯度更新他端初更副本中的搜索结构参数；

本端将第一梯度发送给数据提供参与方。需要说明的是，当数据提供参与方有多个时，本端计算每个数据提供参与方发送的网络输出对应的梯度，并将梯度返回各对应的数据提供参与方。数据提供参与方在接收到第一梯度后，根据第一梯度更新他端初更副本中的搜索结构参数，具体地，数据提供参与方按照链式法则和梯度下降算法，根据第一梯度计算得到他端初更副本中搜索结构参数对应的梯度，并根据搜索结构参数对应的梯度更新他端初更副本中的搜索结构参数，得到他端的次更副本。

步骤S1025，根据所述第二梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。

本端根据第二梯度更新本端初更副本中的搜索结构参数，得到本端次更副本。

在本实施例中，各个参与方通过交互用于更新各自搜索网络的搜索结构参数的中间结果，使得各个参与方能够在不暴露各自数据的情况下完成网络结构搜索，进而能够在保证数据安全的同时，实现各个参与方不需预先设置各自的模型结构，降低了参与纵向联邦学习的门槛。

以下举例说明，一轮联合进行参数更新的过程。数据应用参与方用A表示，数据提供参与方用B表示，Net _A和Net _B分别表示A方和B方的搜索网络，W _A和W _B分别表示Net _A和Net _B的模型参数，α _A和α _B分别表示Net _A和Net _B的搜索结构参数。X ^trn _A和X ^val _A分别表示A方的第一数据集和第二数据集，X ^trn _B和X ^val _B分别表示B方的第一数据集和第二数据集。Y ^trn表示X ^trn _A对应的标签数据，Y ^val表示X ^val _A对应的标签数据。需要说明的是，图3、图4和图5中仅以一种示例图的形式代表各个搜索网络和全连接网络，图形样式并不代表真实的网络结构。

如图3所示，第一步：

1、B方将X ^trn _B输入Net _B得到网络输出U ^trn _B，并传输至A方。为进一步提高数据隐私，B方可按照差分隐私或同态加密方法对U ^trn _B进行处理后再发送给A方；

2、A方将X ^trn _A输入Net _A得到网络输出U ^trn _A，拼接U ^trn _A和U ^trn _B后输入后接网络中，得到Y ^trn _out；A方复制Net _A得到Net _A’，基于Y ^trn和Y ^trn _out计算损失函数相对于W _A的梯度

以及U ^trn _B的梯度

并根据

更新W _A，将更新后的W _A作为Net _A’的模型参数，即，计算

其中，θ是学习率；

3、A方将

发送给B方；

4、B方复制Net _B得到Net _B’，并根据梯度

更新Net _B’中的模型参数W _B’。具体地，B方按照链式法则和梯度下降算法，计算

如图4所示，第二步：

5、B方将X ^val _B输入Net _B’得到网络输出U ^val _B，并传输至A方。

6、A方将X ^val _A输入Net _A’得到网络输出U ^val _A，拼接U ^val _A和U ^val _B后输入后接网络中，得到Y ^val _out；A方基于Y ^val和Y ^val _out计算损失函数相对于Net _A’中的搜索结构参数α _A’的梯度

以及U ^val _B的梯度

A方将

发送给B方；

7、A方根据

更新α _A’，即计算

B方根据

更新Net _B’中的搜索结构参数α _B’。具体地，B方按照链式法则和梯度下降算法，计算

8、A方复制Net _A’中的α _A’到Net _A中的α _A，B方复制Net _B’中的α _B’到Net _B中的α _B。

如图5所示，第三步：

9、B方将X ^trn _B输入Net _B得到网络输出U ^trn _B，并传输至A方；

10、A方将X ^trn _A输入Net _A得到网络输出U ^trn _A，拼接U ^trn _A和U ^trn _B后输入后接网络中，得到Y ^trn _out；A方基于Y ^trn和Y ^trn _out计算损失函数相对于W _A的梯度

和U ^trn _B的梯度

A方将

发送给B方；

11、A方根据

更新W _A，即计算

B方根据

更新W _B。具体地，B方按照链式法则和梯度下降算法，计算

进一步地，基于上述第二实施例，提出本申请纵向联邦建模优化方法第四实施例。在本实施例中，所述方法应用于数据提供参与方，所述步骤S102包括：

步骤S1026，将本端第二数据集输入所述本端初更副本得到第一网络输出；

在本实施例中，执行主体为数据提供参与方(以下称本端)。参与纵向联邦建模的数据应用参与方还部署有后接网络。

本端将本端第二数据集输入本端初更副本得到第一网络输出。具体地，本端将本端的第二数据集输入本端的初更副本中，经过本端初更副本的处理，得到第一网络输出。需要说明的是，数据提供参与方可以有多个，在本实施例中，以一个数据提供参与方为例进行具体例子的阐述。

步骤S1027，将所述第一网络输出发送给拥有标签数据的数据应用参与方，以供所述数据应用参与方将他端第二数据集输入他端初更副本得到第二网络输出，将所述第一网络输出和所述第二网络输出输入后接网络得到第三网络输出，并基于所述第三网络输出和他端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及他端初更副本中搜索结构参数的第二梯度，并根据所述第二梯度更新他端初更副本中的搜索结构参数，其中，所述后接网络部署于所述数据应用参与方；

本端将第一网络输出发送给数据应用参与方。

数据应用参与方将他端第二数据集输入他端初更副本得到第二网络输出。其中，他端是指数据应用参与方。具体地，数据应用参与方将他端第二数据集输入他端初更副本，经过他端初更副本的处理，得到第二网络输出。

数据应用参与方将第一网络输出和第二网络输出进行拼接，拼接的方式可以是进行向量拼接，或计算加权平均；将拼接结果输入后接网络，经过后接网络的处理得到第三网络输出。

数据应用参与方根据第三网络输出和他端的标签数据计算损失函数，并计算损失函数相对于第一网络输出的第一梯度，以及损失函数相对于他端初更副本中搜索结构参数的第二梯度。数据应用参与方根据第二梯度更新他端初更副本中的搜索结构参数，得到他端次更副本。

数据应用参与方将第一梯度发送给数据提供参与方。

步骤S1028，接收所述数据应用参与方发送的所述第一梯度，并根据所述第一梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。

本端接收数据应用参与方发送的第一梯度，并根据第一梯度更新本端初更副本中的搜索结构参数，得到本端次更副本。具体地，本端按照链式法则和梯度下降算法，根据第一梯度计算本端初更副本中搜索结构参数对应的梯度，并根据该梯度更新本端初更副本中搜索结构参数。

进一步地，在一实施方式中，所述步骤S201之前，还包括：

步骤S203，检测当前是否满足预设建模停止条件；

在进行一轮联合更新参数之后，可检测当前是否满足预设建模停止条件。其中，预设建模停止条件可以是预先根据具体需要设置的条件，例如，可以是达到一个最大轮次时停止，或，达到一个最大时长时停止，或模型收敛时停止。其中，检测模型收敛可以是检测模型的损失函数是否收敛。如在上述某些实施例中，数据集划分为第一数据集和第二数据集，分开优化模型参数和搜索结构参数时，可以当检测到在第一数据集上模型收敛或在第二数据集上模型收敛时，即确定模型收敛。

步骤S204，若满足所述预设建模停止条件，则执行所述步骤：根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

若检测到满足预设建模停止条件，则可以执行步骤S201以及后续的操作，得到本端目标模型，至此完成本地纵向联邦建模。

步骤S205，若不满足所述预设建模停止条件，则基于更新后的本端搜索网络再执行所述步骤：基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络。

若检测到不满足预设建模停止条件，则基于更新后的本端搜索网络，继续执行步骤S10及后续操作，也即，进行下一轮联合更新参数的过程。

进一步地，在一实施方式中，所述步骤S20之后，还包括：

步骤S30，接收数据提供参与方发送的第一模型输出，其中，所述数据提供参与方将目标用户在他端的第二风险特征对应的用户数据输入他端目标模型，得到所述第一模型输出；

各个参与方可以是部署于银行或其他金融机构的设备，参与方中存储有各机构在业务处理过程中记录的用户数据。不同的机构涉及的具体业务存在差异，因此各个参与方的用户数据的特征可能不同，各个机构可基于各自的数据特征构建数据集，采用各自的数据集联合进行纵向联邦学习，通过扩充模型特征丰富度的方式来提升模型的预测性能。具体地，各个参与方可联合构建用户风险预测模型，用于在信贷业务、保险业务等等业务场景中预测用户的风险程度。各个参与方的数据特征可以根据实际经验选取与用户风险预测相关的风险特征，例如，用户的存款数额、用户的违约次数等等。

各个参与方采用各自的数据集按照上述实施例中的方式联合进行纵向联邦建模，得到各自的目标模型。

在得到各自的目标模型后，各参与方可联合对用户进行风险预测。

具体地，数据应用参与方接收数据提供参与方发送的第一模型输出。其中，数据提供参与方将目标用户在他端的第二风险特征对应的用户数据输入他端目标模型，经过他端目标模型的处理，得到第一模型输出。他端是指数据提供参与方。

步骤S40，将目标用户在本端的第二风险特征对应的用户数据输入本端目标模型，得到第二模型输出；

步骤S50，将所述第一模型输出和所述第二模型输出进行拼接后输入本端的后接网络，得到所述目标用户的风险预测结果。

数据应用参与方将目标用户在本端的第二风险特征对应的用户数据输入本端目标模型，经过本端目标模型的处理，得到第二模型输出。数据应用参与方将第一模型输出和第二模型输出进行拼接，具体地，可以是将第二模型输出和第二模型输出按照向量拼接的方式进行拼接，也可以是进行加权平均。将拼接结果输入数据应用参与方本端的后接网络，经过后接网络的处理，输出得到目标用户的风险预测结果。

进一步地，当目标用户的风险预测任务是数据提供参与方发起时，数据应用参与方可以将目标用户的风险预测结果发送给数据提供参与方，以供数据提供参与方根据目标用户的风险预测结果进行后续的业务处理，例如，根据风险预测结果确定是否对目标用户进行贷款。

在本实施例中，各参与方只需要设置各自的搜索网络即可，不需要花费大量人力物力去设置精心设置模型结构，从而降低了参与纵向联邦学习的门槛，使得银行和其他金融机构能够更加方便地通过纵向联邦学习进行联合建模，进而通过联合建模得到的风险预测模型完成风险预测任务。并且，在纵向联邦建模和建模后采用模型进行风险预测的过程中，各个参与方不需要直接交互各自的数据集和模型本身，从而保障了各个参与方中的用户隐私数据的安全。

此外本申请实施例还提出一种纵向联邦建模优化装置，参照图6，所述装置部署于参与纵向联邦建模的参与方，各参与方分别部署有基于各自数据特征构建的数据集和搜索网络，所述装置包括：

交互模块10，用于基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络；

确定模块20，用于基于更新后的本端搜索网络得到本端目标模型。

进一步地，参与方的数据集包括第一数据集和第二数据集，所述交互模块10包括：

第一交互单元，用于基于本端第一数据集与其他参与方交互用于更新各自搜索网络中模型参数的第一中间结果，并基于接收到的第一中间结果更新本端搜索网络的副本得到本端初更副本；

第二交互单元，用于基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本；

更新单元，用于采用所述本端次更副本中的搜索结构参数更新所述本端搜索网络得到本端初更搜索网络；

第三交互单元，用于基于所述本端第一数据集与其他参与方交互用于更新各自初更搜索网络中模型参数的第三中间结果，并基于接收到的第三中间结果更新所述本端初更搜索网络得到更新后的本端搜索网络。

进一步地，所述装置部署于拥有标签数据的数据应用参与方，所述数据应用参与方部署有后接网络，所述第二交互单元包括：

第一接收子单元，接收数据提供参与方发送的第二网络输出，其中，所述数据提供参与方将他端第二数据集输入他端初更副本得到所述第一网络输出；

第一输入子单元，用于将本端第二数据集输入所述本端初更副本得到第二网络输出，并将所述第一网络输出和所述第二网络输出输入所述后接网络得到第三网络输出；

计算子单元，用于基于所述第三网络输出和本端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及所述本端初更副本中搜索结构参数的第二梯度；

第一发送子单元，用于将所述第一梯度发送给所述数据提供参与方，以供所述数据提供参与方根据所述第一梯度更新他端初更副本中的搜索结构参数；

更新子单元，用于根据所述第二梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。

进一步地，所述装置部署于数据提供参与方，所述第二交互单元包括：

第二输入子单元，用于将本端第二数据集输入所述本端初更副本得到第一网络输出；

第二发送子单元，用于将所述第一网络输出发送给拥有标签数据的数据应用参与方，以供所述数据应用参与方将他端第二数据集输入他端初更副本得到第二网络输出，将所述第一网络输出和所述第二网络输出输入后接网络得到第三网络输出，并基于所述第三网络输出和他端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及他端初更副本中搜索结构参数的第二梯度，并根据所述第二梯度更新他端初更副本中的搜索结构参数，其中，所述后接网络部署于所述数据应用参与方；

第二接收子单元，用于接收所述数据应用参与方发送的所述第一梯度，并根据所述第一梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。

进一步地，参与方的搜索网络中搜索结构参数包括搜索网络中网络单元之间连接操作对应的权重，所述确定模块20包括：

选取单元，用于根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

确定单元，用于将各所述保留操作和各所述保留操作连接的网络单元所构成的模型作为本端目标模型。

进一步地，所述确定模块20还包括：

检测单元，用于检测当前是否满足预设建模停止条件；

所述确定模块20还用于若满足所述预设建模停止条件，则执行所述步骤：根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；若不满足所述预设建模停止条件，则基于更新后的本端搜索网络再执行所述步骤：基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络。

进一步地，所述装置部署于拥有标签数据的数据应用参与方，所述装置还包括：

接收模块，用于接收数据提供参与方发送的第一模型输出，其中，所述数据提供参与方将目标用户在他端的第二风险特征对应的用户数据输入他端目标模型，得到所述第一模型输出；

输入模块，用于将目标用户在本端的第二风险特征对应的用户数据输入本端目标模型，得到第二模型输出；

预测模块，用于将所述第一模型输出和所述第二模型输出进行拼接后输入本端的后接网络，得到所述目标用户的风险预测结果。

本申请纵向联邦建模优化装置的具体实施方式的拓展内容与上述纵向联邦建模优化方法各实施例基本相同，在此不做赘述。

此外，本申请实施例还提出一种计算机可读存储介质，所述存储介质上存储有纵向联邦建模优化程序，所述纵向联邦建模优化程序被处理器执行时实现如下所述的纵向联邦建模优化方法的步骤。

本申请纵向联邦建模优化设备和计算机可读存储介质的各实施例，均可参照本申请纵向联邦建模优化方法各实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种纵向联邦建模优化方法，其中，所述方法应用于参与纵向联邦建模的参与方，各参与方分别部署有基于各自数据特征构建的数据集和搜索网络，所述方法包括以下步骤：

基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络；

基于更新后的本端搜索网络得到本端目标模型。
如权利要求1所述的纵向联邦建模优化方法，其中，参与方的数据集包括第一数据集和第二数据集，所述基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络的步骤包括：

基于本端第一数据集与其他参与方交互用于更新各自搜索网络中模型参数的第一中间结果，并基于接收到的第一中间结果更新本端搜索网络的副本得到本端初更副本；

基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本；

采用所述本端次更副本中的搜索结构参数更新所述本端搜索网络得到本端初更搜索网络；

基于所述本端第一数据集与其他参与方交互用于更新各自初更搜索网络中模型参数的第三中间结果，并基于接收到的第三中间结果更新所述本端初更搜索网络得到更新后的本端搜索网络。
如权利要求2所述的纵向联邦建模优化方法，其中，所述方法应用于拥有标签数据的数据应用参与方，所述数据应用参与方部署有后接网络，所述基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本的步骤包括：

接收数据提供参与方发送的第二网络输出，其中，所述数据提供参与方将他端第二数据集输入他端初更副本得到所述第一网络输出；

将本端第二数据集输入所述本端初更副本得到第二网络输出，并将所述第一网络输出和所述第二网络输出输入所述后接网络得到第三网络输出；

基于所述第三网络输出和本端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及所述本端初更副本中搜索结构参数的第二梯度；

将所述第一梯度发送给所述数据提供参与方，以供所述数据提供参与方根据所述第一梯度更新他端初更副本中的搜索结构参数；

根据所述第二梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。
如权利要求2所述的纵向联邦建模优化方法，其中，所述方法应用于数据提供参与方，所述基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本的步骤包括：

将本端第二数据集输入所述本端初更副本得到第一网络输出；

将所述第一网络输出发送给拥有标签数据的数据应用参与方，以供所述数据应用参与方将他端第二数据集输入他端初更副本得到第二网络输出，将所述第一网络输出和所述第二网络输出输入后接网络得到第三网络输出，并基于所述第三网络输出和他端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及他端初更副本中搜索结构参数的第二梯度，并根据所述第二梯度更新他端初更副本中的搜索结构参数，其中，所述后接网络部署于所述数据应用参与方；

接收所述数据应用参与方发送的所述第一梯度，并根据所述第一梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。
如权利要求1至4中任一项所述的纵向联邦建模优化方法，其中，参与方的搜索网络中搜索结构参数包括搜索网络中网络单元之间连接操作对应的权重，所述基于更新后的本端搜索网络得到本端目标模型的步骤包括：

根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

将各所述保留操作和各所述保留操作连接的网络单元所构成的模型作为本端目标模型。
如权利要求5所述的纵向联邦建模优化方法，其中，所述根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作的步骤之前，还包括：

检测当前是否满足预设建模停止条件；

若满足所述预设建模停止条件，则执行所述步骤：根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

若不满足所述预设建模停止条件，则基于更新后的本端搜索网络再执行所述步骤：基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络。
如权利要求1至3中任一项所述的纵向联邦建模优化方法，其中，所述方法应用于拥有标签数据的数据应用参与方，所述基于更新后的本端搜索网络得到本端目标模型的步骤之后，还包括：

接收数据提供参与方发送的第一模型输出，其中，所述数据提供参与方将目标用户在他端的第二风险特征对应的用户数据输入他端目标模型，得到所述第一模型输出；

将目标用户在本端的第二风险特征对应的用户数据输入本端目标模型，得到第二模型输出；

将所述第一模型输出和所述第二模型输出进行拼接后输入本端的后接网络，得到所述目标用户的风险预测结果。
一种纵向联邦建模优化装置，其中，所述装置部署于参与纵向联邦建模的参与方，各参与方分别部署有基于各自数据特征构建的数据集和搜索网络，所述装置包括：

交互模块，用于基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络；

确定模块，用于基于更新后的本端搜索网络得到本端目标模型。
一种纵向联邦建模优化设备，其中，所述纵向联邦建模优化设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的纵向联邦建模优化程序，所述纵向联邦建模优化程序被所述处理器执行时实现以下步骤：

基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络；

基于更新后的本端搜索网络得到本端目标模型。
如权利要求9所述的纵向联邦建模优化设备，其中，参与方的数据集包括第一数据集和第二数据集，所述纵向联邦建模优化程序被所述处理器执行时还实现以下步骤：

基于本端第一数据集与其他参与方交互用于更新各自搜索网络中模型参数的第一中间结果，并基于接收到的第一中间结果更新本端搜索网络的副本得到本端初更副本；

基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本；

采用所述本端次更副本中的搜索结构参数更新所述本端搜索网络得到本端初更搜索网络；

基于所述本端第一数据集与其他参与方交互用于更新各自初更搜索网络中模型参数的第三中间结果，并基于接收到的第三中间结果更新所述本端初更搜索网络得到更新后的本端搜索网络。
如权利要求10所述的纵向联邦建模优化设备，其中，所述设备应用于拥有标签数据的数据应用参与方，所述数据应用参与方部署有后接网络，所述纵向联邦建模优化程序被所述处理器执行时还实现以下步骤：

接收数据提供参与方发送的第二网络输出，其中，所述数据提供参与方将他端第二数据集输入他端初更副本得到所述第一网络输出；

将本端第二数据集输入所述本端初更副本得到第二网络输出，并将所述第一网络输出和所述第二网络输出输入所述后接网络得到第三网络输出；

基于所述第三网络输出和本端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及所述本端初更副本中搜索结构参数的第二梯度；

将所述第一梯度发送给所述数据提供参与方，以供所述数据提供参与方根据所述第一梯度更新他端初更副本中的搜索结构参数；

根据所述第二梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。
如权利要求10所述的纵向联邦建模优化设备，其中，所述设备应用于数据提供参与方，所述纵向联邦建模优化程序被所述处理器执行时还实现以下步骤：

将本端第二数据集输入所述本端初更副本得到第一网络输出；

将所述第一网络输出发送给拥有标签数据的数据应用参与方，以供所述数据应用参与方将他端第二数据集输入他端初更副本得到第二网络输出，将所述第一网络输出和所述第二网络输出输入后接网络得到第三网络输出，并基于所述第三网络输出和他端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及他端初更副本中搜索结构参数的第二梯度，并根据所述第二梯度更新他端初更副本中的搜索结构参数，其中，所述后接网络部署于所述数据应用参与方；

接收所述数据应用参与方发送的所述第一梯度，并根据所述第一梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。
如权利要求9至12中任一项所述的纵向联邦建模优化设备，其中，参与方的搜索网络中搜索结构参数包括搜索网络中网络单元之间连接操作对应的权重，所述纵向联邦建模优化程序被所述处理器执行时还实现以下步骤：

根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

将各所述保留操作和各所述保留操作连接的网络单元所构成的模型作为本端目标模型。
如权利要求13所述的纵向联邦建模优化设备，其中，所述纵向联邦建模优化程序被所述处理器执行时还实现以下步骤：

检测当前是否满足预设建模停止条件；

若满足所述预设建模停止条件，则执行所述步骤：根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

若不满足所述预设建模停止条件，则基于更新后的本端搜索网络再执行所述步骤：基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有纵向联邦建模优化程序，所述纵向联邦建模优化程序被处理器执行时实现以下步骤：

基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络；

基于更新后的本端搜索网络得到本端目标模型。
如权利要求15所述的计算机可读存储介质，其中，参与方的数据集包括第一数据集和第二数据集，所述纵向联邦建模优化程序被处理器执行时还实现以下步骤：

基于本端第一数据集与其他参与方交互用于更新各自搜索网络中模型参数的第一中间结果，并基于接收到的第一中间结果更新本端搜索网络的副本得到本端初更副本；

基于本端第二数据集与其他参与方交互用于更新各自初更副本中搜索结构参数的第二中间结果，并基于接收到的第二中间结果更新所述本端初更副本得到本端次更副本；

采用所述本端次更副本中的搜索结构参数更新所述本端搜索网络得到本端初更搜索网络；

基于所述本端第一数据集与其他参与方交互用于更新各自初更搜索网络中模型参数的第三中间结果，并基于接收到的第三中间结果更新所述本端初更搜索网络得到更新后的本端搜索网络。
如权利要求16所述的计算机可读存储介质，其中，所述介质应用于拥有标签数据的数据应用参与方，所述数据应用参与方部署有后接网络，所述纵向联邦建模优化程序被处理器执行时还实现以下步骤：

接收数据提供参与方发送的第二网络输出，其中，所述数据提供参与方将他端第二数据集输入他端初更副本得到所述第一网络输出；

将本端第二数据集输入所述本端初更副本得到第二网络输出，并将所述第一网络输出和所述第二网络输出输入所述后接网络得到第三网络输出；

基于所述第三网络输出和本端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及所述本端初更副本中搜索结构参数的第二梯度；

将所述第一梯度发送给所述数据提供参与方，以供所述数据提供参与方根据所述第一梯度更新他端初更副本中的搜索结构参数；

根据所述第二梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。
如权利要求16所述的计算机可读存储介质，其中，所述介质应用于数据提供参与方，所述纵向联邦建模优化程序被处理器执行时还实现以下步骤：

将本端第二数据集输入所述本端初更副本得到第一网络输出；

将所述第一网络输出发送给拥有标签数据的数据应用参与方，以供所述数据应用参与方将他端第二数据集输入他端初更副本得到第二网络输出，将所述第一网络输出和所述第二网络输出输入后接网络得到第三网络输出，并基于所述第三网络输出和他端的标签数据计算损失函数相对所述第一网络输出的第一梯度以及他端初更副本中搜索结构参数的第二梯度，并根据所述第二梯度更新他端初更副本中的搜索结构参数，其中，所述后接网络部署于所述数据应用参与方；

接收所述数据应用参与方发送的所述第一梯度，并根据所述第一梯度更新所述本端初更副本中的搜索结构参数得到本端次更副本。
如权利要求15至18任一项所述的计算机可读存储介质，其中，参与方的搜索网络中搜索结构参数包括搜索网络中网络单元之间连接操作对应的权重，所述纵向联邦建模优化程序被处理器执行时还实现以下步骤：

根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

将各所述保留操作和各所述保留操作连接的网络单元所构成的模型作为本端目标模型。
如权利要求19所述的计算机可读存储介质，其中，所述纵向联邦建模优化程序被处理器执行时还实现以下步骤：

检测当前是否满足预设建模停止条件；

若满足所述预设建模停止条件，则执行所述步骤：根据更新后的本端搜索网络中的搜索结构参数从各连接操作中选取保留操作；

若不满足所述预设建模停止条件，则基于更新后的本端搜索网络再执行所述步骤：基于本端数据集与其他参与方交互用于更新各自搜索网络中模型参数和搜索结构参数的中间结果，并基于接收到的中间结果更新本端搜索网络。