WO2021092977A1

WO2021092977A1 - 纵向联邦学习优化方法、装置、设备及存储介质

Info

Publication number: WO2021092977A1
Application number: PCT/CN2019/119409
Authority: WO
Inventors: 范涛; 杨恺; 陈天健; 杨强
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2019-11-14
Filing date: 2019-11-19
Publication date: 2021-05-20
Also published as: CN110851785A; CN110851785B

Abstract

一种纵向联邦学习优化方法、装置、设备和存储介质，涉及金融科技技术领域，该方法包括：获取数据在主参与者中的加密数值集合，基于预设判定条件获取新数据在主参与者中的新加密数值集合；将加密数值集合和新加密数值集合作为目标数值集合发送至副参与者，以获取副参与者基于目标数值集合反馈的中间结果值；根据中间结果值计算主参与者中的主加密数据，并将所述主加密数据发送至协调者；接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。

Description

纵向联邦学习优化方法、装置、设备及存储介质

技术领域

本申请涉及金融科技(Fintech)技术领域，尤其涉及纵向联邦学习优化方法、装置、设备及存储介质。

背景技术

随着计算机技术的发展，越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域，传统金融业正在逐步向金融科技(Fintech)转变，但由于金融行业的安全性、实时性要求，也对技术提出了更高的要求。例如，联邦学习的纵向逻辑回归方法，但现有的纵向逻辑回归方案是基于一阶梯度信息的随机梯度下降方法。该方案的原理是先将逻辑回归的损失(loss)函数用在零点的二阶泰勒展开，然后该近似损失函数值和梯度值可以通过AB两方的数据联邦得到，利用同态加密将计算中间结果加密，由C方进行解密后传输回AB两方进行模型参数更新。该方案采用的路线为随机梯度下降方法，即随机选取小批数据，AB两方通过计算、加密和数据交互得到各自参数分量的加密梯度值，发送给C方解密后乘以相应的步长即得到下降方向。随机梯度下降为一阶算法，收敛速度较慢，需要进行大量轮次的数据交互，使得目前纵向联邦学习所需要的通信量高，耗费网络带宽大，计算成本高。

发明内容

本申请的主要目的在于提出一种纵向联邦学习优化方法、装置、设备及存储介质，旨在解决目前进行纵向联邦学习的通信量较高的技术问题。

为实现上述目的，本申请提供一种纵向联邦学习优化方法，所述纵向联邦学习优化方法包括如下步骤：

获取数据在主参与者中的加密数值集合，并基于预设判定条件获取新数据在所述主参与者中的新加密数值集合；

将所述加密数值集合和所述新加密数值集合作为目标数值集合发送至副参与者，以获取所述副参与者基于所述目标数值集合反馈的中间结果值；

根据所述中间结果值计算所述主参与者中的主加密数据，并将所述主加密数据发送至协调者，其中，所述协调者用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副参与者发送的副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。

此外，本申请提供一种纵向联邦学习优化方法包括如下步骤：

接收主参与者发送的主加密数据和副参与者发送的副加密数据，所述主加密数据为根据所述副参与者基于所述主参与者发送目标数值集合反馈的中间结果值计算得，所述目标数值集包括数据对应的加密数值集合和新数据对应的新加密数值集合；

响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

将所述目标主梯度值分别发送给所述主参与者，所述主参与者用于基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。

此外，为实现上述目的，本申请还提供一种纵向联邦学习优化装置，所述纵向联邦学习优化装置包括：

获取模块，用于获取数据在主参与者中的加密数值集合，并基于预设判定条件获取新数据在所述主参与者中的新加密数值集合；

发送模块，用于将所述加密数值集合和所述新加密数值集合作为目标数值集合发送至副参与者，以获取所述副参与者基于所述目标数值集合反馈的中间结果值；

第一计算模块，用于根据所述中间结果值计算所述主参与者中的主加密数据，并将所述主加密数据发送至协调者，其中，所述协调者用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副参与者发送的副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

第一更新模块，用于接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。

可选地，所述纵向联邦学习优化装置包括：

接收模块，用于接收主参与者发送的主加密数据和副参与者发送的副加密数据，所述主加密数据为根据所述副参与者基于所述主参与者发送目标数值集合反馈的中间结果值计算得，所述目标数值集包括数据对应的加密数值集合和新数据对应的新加密数值集合；

第二计算模块，用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

第二更新模块，用于将所述目标主梯度值分别发送给所述主参与者，所述主参与者用于基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。

此外，为实现上述目的，本申请还提供一种纵向联邦学习优化设备，所述纵向联邦学习优化设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述计算机可读指令被所述处理器执行时实现如上所述的纵向联邦学习优化方法的步骤。

此外，为实现上述目的，本申请还提供一种存储介质，所述存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上所述的纵向联邦学习优化方法的步骤。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的设备结构示意图；

图2为本申请纵向联邦学习优化方法第一实施例的流程示意图；

图3为本申请纵向联邦学习优化方法另一实施例的流程示意图；

图4为本申请纵向联邦学习优化装置的装置模块示意图；

图5为本申请纵向联邦学习优化方法计算与交互的流程示意图。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。如图1所示，图1是本申请实施例方案涉及的硬件运行环境的设备结构示意图。本申请实施例纵向联邦学习优化设备可以是PC机或服务器设备，其上运行有Java虚拟机。如图1所示，该纵向联邦学习优化设备可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解，图1中示出的设备结构并不构成对设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机可读指令。在图1所示的设备中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的计算机可读指令，并执行下述纵向联邦学习优化方法中的操作。

基于上述硬件结构，提出本申请纵向联邦学习优化方法实施例。参照图2，图2为本申请纵向联邦学习优化方法第一实施例的流程示意图，所述方法包括：

步骤S10，获取数据在主参与者中的加密数值集合，并基于预设判定条件获取新数据在所述主参与者中的新加密数值集合；

主参与者拥有数据的部分特征，并且在本实施例中仅以主参与者作为A方，副参与者作为B方，协调者作为C方进行解释说明。逻辑回归是一种基于概率模型的二分类方法。逻辑回归的模型训练是在给定数据特征与标签(x _i,y _i)下通过最小化损失函数l(w)＝log(1+exp(-yw ^Tx))来得到模型参数w的过程。纵向联邦学习是指不同方各自拥有不同的特征数据，相当于把每一条完整的数据纵向切分成了多个部分，各方希望在保护数据隐私的情况下实现逻辑回归模型的训练，从而利用模型参数对新数据进行预测打分。由于逻辑回归损失函数l(w)＝log(1+exp(-yw ^Tx))的复杂性(为了简化符号，省略下标i)。现有加密计算方案无法在加密状态下计算指数函数和对数函数，在本实施例中是采用纵向联邦逻辑回归中的现有加密计算方案，使用满足加法同态的加密方法，即[[ax]]＝a[[x]],[[x]]+[[y]]＝[[x+y]]。这里[[·]]代表同态加密操作。纵向联邦场景中只有一方持有数据标签，以两方为例，A方持有数据x _A，维护对应的模型参数w _A，B方持有x _B,y _B，拥有并维护对应的模型参数w _B。为了实现纵向联邦逻辑回归，本方案采用现有的对逻辑回归函数的近似方案，在零点进行二阶泰勒展开，即：

近似后其梯度为：

损失函数和梯度可以表示为双方同态加密数据的运算，即：

本方案利用二阶信息提出了一种快速收敛的技术方案，近似损失函数的二阶导数矩阵(即海森矩阵)为

在本实施例中是利用拟牛顿法，利用二阶信息估计一个逆海森矩阵H，在算法中不用梯度g而采用H _g作为下降方向，以此来加快算法收敛速度。由于逆海森矩阵H的维度比梯度要大很多，设计的核心要点是如何降低各方的数据通信量。本方案提出在C端维护逆海森矩阵H，每L步AB方除了计算梯度以外额外随机选择一小批数据，计算出前L步模型的平均值

与上一个L步模型的平均值

之差

然后计算出一个包含了该批数据二阶信息的向量

发送给C端，其维度同梯度相同。C端利用前M个向量v的信息更新逆海森矩阵一次。因此，可以在本实施例中，将主参与者作为A方，将副参与者作为B方进行阐述，计算数据在A方的逻辑回归得分可以通过公式

来进行计算，即表示A侧各样本的逻辑回归得分，其中，w表示逻辑回归的线性模型参数，x代表数据，y代表数据标签，[[·]]代表同态加密操作，在随机选取一小批数据ID为S后，在主参与者(即A方)中计算出对应数据ID在S里的数值集合u _A,

并采用同态加密计算对所有u _A,

值进行加密，得到加密数值集合[[u _A]]，

并将其传输给B方，然后更新

并确定主参与者对应的纵向逻辑回归模型的当前迭代次数是否大于预设次数(也就是确定纵向逻辑回归模型是否满足预设判定条件)。在确定当前迭代次数是否大于预设次数时，需要先确定当前迭代次数k与L的关系，并在当前迭代次数k是L的整数倍时，再判断迭代次数是否大于2L，此时2L就是预设次数，当经过判断发现迭代次数k大于2L时，A端(即主参与者)令

也就是计算

的平均值，并计算本次(t)与上次(t-1)的

之差，即

另外随机选择一小批数据ID为S _H，A端计算出S _H上的

并将同态加密后的数据

传输给B端。也就是获取新加密数值集合，并将新加密数值集合和加密数值集合一起作为目标数值集合发送到副参与者。但是当迭代次数k不大于2L时，A端仅更新

并且主参与者只发送加密数值集合到副参与者。其中，在进行纵向联邦学习优化之前，还需要先进行初始化操作，也就是A、B两侧初始化模型参数w _A,w _B，以及同一大小的全零向量

并在C端(即协调者)中初始化矩阵H，用于估计H的记忆长度M，以及更新H的迭代步数间隔L，以及维度为A与B模型参数之和的全零向量

步骤S20，将所述加密数值集合和所述新加密数值集合作为目标数值集合发送至副参与者，以获取所述副参与者基于所述目标数值集合反馈的中间结果值；

主参与者将加密数值集合和新加密数值集合作为目标数值集合发送至副参与者，也就是在副参与者(即B方)接收到主参与者(A方)发送的目标数值集合后，B方也会同样先计算出对应数据ID在S里的数值集合u _B,

并根据目标数值集合计算出损失函数值和加密系数。即B方利用同态加密的性质，计算出加密的loss(损失函数)值，

同时计算得到每条对应数据的加密值

也就是加密系数，并将其传输给A端。然后更新

并再次判断当前迭代次数k与L的关系，如果当前迭代次数k是L的整数倍，且迭代次数k大于2L：B端更新

并计算本次(t)与上次(t-1)的

之差，即

另外B方计算出S _H上的

从而计算出中间结果值

并传输给A方。如果当前迭代次数k是L的整数倍，且迭代次数k不大于2L；B端则仅更新

并且，当通过B方(即副参与者)计算得到每条数据对应的加密系数后，B方会将各个加密系数返回给A方，并且AB两方各自利用同态加密的性质对每个[[d]]值(即同态系数)乘以对应数据x _A,x _B，然后对得到的向量集合求和，计算出加密的梯度值[[g _A]]＝∑[[d]]x _A,[[g _B]]＝∑[[d]]x _B。

步骤S30，根据所述中间结果值计算所述主参与者中的主加密数据，并将所述主加密数据发送至协调者，其中，所述协调者用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副参与者发送的副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

AB两方会分别将[[g _A]],[[g _B]]传输给C方(即协调者)，并且B方会将加密的loss值传给C方，也就是此时协调者已接收到损失函数值、梯度值(主梯度值和副梯度值)。此时还是需要继续判断当前迭代次数k与L的关系，并在当前迭代次数k是L的整数倍，且迭代次数k大于2L时，则A、B两端分别根据[[h]]计算出主加密数据和副加密数据，即[[υ _A]]＝∑[[h]]x _A,[[υ _B]]＝∑[[h]]x _B，并传输给C方，也就是协调者。C方对收到的数据进行解密，得到g _A,g _B,loss，并根据loss(损失函数值)判断纵向逻辑回归模型是否收敛，若纵向逻辑回归模型已收敛，则发送迭代停止信号到A、B两方(即主参与者和副参与者)，并且主参与者会根据迭代停止信号停止获取主参与者中具有逻辑回归得分的加密数值集合。若纵向逻辑回归模型未收敛，则更新

并需要判断当前迭代次数k与迭代步数间隔L的关系，如果不大于2L，则计算出提前设置的步长与梯度的乘积

并将各自的乘积分别发送到各自对应的A方和B方中，再让A方根据获取到的乘积(即目标主梯度值)更新A方本地的模型参数，并进行下一次的数据模型训练，同理也让B方根据获取到的乘积更新B方本地的模型参数，再进行下一次的模型训练，直到获取到新的损失函数值，并将其传递给到C方(协调者)进行判定，即确定纵向逻辑回归模型是否收敛，若收敛，则发送迭代停止信号给A方和B方，并停止纵向逻辑回归模型的训练。若未收敛，则再次执行

的操作，直至纵向逻辑回归模型收敛。并且在k大于2L时，则将两个梯度合并成一个长向量g,计算出步长、H与g的乘积，并拆分成对应的A、B两部分(即A方对应的目标主梯度值和B方对应的目标副梯度值)分别传输给A和B，即：

进一步，如果同时k不是L的整数倍则结束步骤4；如果k是L的整数倍，则C还收到了加密数据[[v _A]],[[v _B]],将其进行解密后合并可以得到

并存储在一个长度为M的v队列中。同时，计算本次(t)与上次(t-1)的w～之差，即

将其存在长度为M的s队列中。如果目前的存储器已经达到最大存储长度M，则将队列首个删掉并将最新得到v和s放在队列末尾。利用当前存储器里的m(m不大于M)个v和s，来计算H。其中，计算H的方法为利用存储器队列末尾的值初始化，即计算

H←p[m]I，其中I为单位矩阵。然后从队列首到队列尾(j＝1,..,m)迭代计算得到更新的H：p[j]＝1/(v[j] ^Ts[j]),H←(I-p[j]s[j]v[j] ^T)H(I-p[j]v[j]s[j] ^T)+p[j]s[j]s[j] ^T。

步骤S40，接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。

主参与者接收协调者反馈的目标主梯度值，并根据此目标主梯度值更新主参与者中的本地模型参数，同理副参与者也接收协调者反馈的副参与者对应的目标副梯度值以更新副参与者中的本地模型参数。并继续进行模型训练，也就是再次随机获取新数据，并通过相应的算法计算其加密数值集合，直至协调者发送纵向逻辑回归模型收敛，并发送迭代停止信号到主参与者和副参与者。另外，为辅助理解本实施例中进行纵向联邦学习优化的流程，下面进行举例说明。例如，如图5所示，存在有A、B、C三方进行模型训练，其中A 方为主参与者，B方为副参与者，C方为协调者。A方本地计算与传输数据给B方，也就是将加密的[[u _A]]，

传输给B方，B方根据A方传输的加密数据进行本地计算得到加密损失函数值和加密值，并将[[d]][[h]]传输给A方，并且AB两方同时根据加密值计算各自的梯度值，并将其传输给C方，也就是AB两方将[[g _A]],[[g _B]][[v _A]],[[v _B]]发送给C方，并且B方还将[[loss]]传输给C方，C方对接收到的[[v _A]],[[v _B]]，[[loss]]进行解密，得到解密后的g _A,g _B,lossμ _A,μ _B，并根据loss判断算法是否收敛，若未收敛，则根据接收到的梯度值更新H，并计算与传输，即在k不大于2L时，计算出事先选定的步长与梯度的乘积

并将其分别传输给A和B；在k大于2L时，将两个梯度合并成一个长向量g,计算出步长、H与g的乘积，并拆分成对应的A、B两部分分别传输给A和B，即：

并且AB两方根据C方传递的未加密的向量来更新本地的模型参数，即

在本实施例中，通过获取数据在主参与者中的加密数值集合，并基于预设判定条件获取新数据在所述主参与者中的新加密数值集合；将所述加密数值集合和所述新加密数值集合作为目标数值集合发送至副参与者，以获取所述副参与者基于所述目标数值集合反馈的中间结果值；根据所述中间结果值计算所述主参与者中的主加密数据，并将所述主加密数据发送至协调者，其中，所述协调者用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副参与者发送的副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值，将所述目标主梯度值发送至所述主参与者；接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。通过根据预设判定条件将主参与者中的加密数值集合和新加密数值集合作为目标数值集合发送至副参与者，从而提高了发送目标数值集合的发送量，并根据副参与者反馈的中间结果值计算主加密数据，再将主加密数据发送至协调者，根据协调者反馈的目标主梯度值对主参与者中的本地模型参数进行更新，并且由于协调者是根据二阶导数矩阵计算目标主梯度值，避免了现有技术进行纵向联邦学习采用一阶算法而使得收敛速度较慢，需要进行大量轮次的数据交互的现象发生，减少了进行纵向联邦学习的通信量。

进一步地，基于本申请纵向联邦学习优化方法第一实施例，提出本申请纵向联邦学习优化方法第二实施例。本实施例是本申请第一实施例的步骤S40，接收所述协调者反馈的目标主梯度值的步骤的细化，包括：

步骤a，接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者根据响应于所述纵向逻辑回归模型满足所述预设判定条件而更新的二阶导数矩阵获取的。

在主参与者接收到协调者反馈的目标主梯度值时，可以根据此目标主梯度值更新自身的本地模型参数，其中，目标主梯度值是协调者在确定纵向逻辑回归模型不收敛，且满足预设判定条件时，根据已进行更新的二阶导数矩阵进行计算获取的，而判断纵向逻辑回归模型是否满足预设判定条件，例如判断纵向逻辑回归模型的新迭代次数是否满足预设次数条件(如确定新迭代次数是否为迭代步数间隔的整数倍，且是否大于两倍大于预设次数)。并根据不同的判断结果执行不同的操作。

在本实施例中，通过确定目标主梯度值是由纵向逻辑回归模型满足预设判定条件而更新的二阶导数矩阵获取的，从而保障了获取的目标主梯度值的准确性。

进一步地，接收所述协调者反馈的目标主梯度值的步骤，包括：

步骤b，接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者根据目标数据更新的二阶导数矩阵获取的，所述目标数据为响应于纵向逻辑回归模型未收敛，且满足预设判定条件，将所述主加密数据和所述副参与者发送的副加密数据进行解密合并得到的。

在主参与者接收到协调者反馈的目标主梯度值时，可以根据此目标主梯度值更新自身的本地模型参数，其中，目标主梯度值是协调者在确定纵向逻辑回归模型不收敛，且满足预设判定条件时，根据目标数据对二阶导数矩阵进行更新，并根据已进行更新的二阶导数矩阵进行计算获取的，其中，目标数据是在纵向逻辑回归模型未收敛，且满足预设判定条件时，将主参与者发送的主加密数据和副参与者发送的副加密数据进行解密合并得到的。

在本实施例中，通过确定目标主梯度值是根据目标数据和更新的二阶导数矩阵获取的，并且目标数据是主加密数据和副加密数据进行合并得到的，从而保障了获取的目标主梯度值的准确性。

步骤c，接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者对第一目标乘积进行拆分得到的，所述第一目标乘积为根据响应于所述纵向逻辑回归模型满足所述预设判定条件而更新的二阶导数矩阵、所述主参与者发送的主梯度值和所述副参与者发送的副梯度值合并的长向量，和预设步长之间的乘积。

在主参与者接收到协调者反馈的目标主梯度值时，可以根据此目标主梯度值更新自身的本地模型参数，其中，目标主梯度值是由协调者对第一目标乘积进行拆分得到的，而第一目标乘积是纵向逻辑回归模型未收敛且满足预设判定条件时，根据已更新的二阶导数矩阵、主参与者发送的主梯度值和副参与者发送的副梯度值合并的长向量、预设的步长进行计算的乘积。

在本实施例中，通过确定目标主梯度值是协调者对第一目标乘积进行拆分得到的，而第一目标乘积是长向量、预设步长和更新的二阶导数矩阵的乘积，从而保障了获取到的目标主梯度值的准确性。

步骤d，接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值为第二目标乘积，所述第二目标乘积为所述协调者响应于纵向逻辑回归模型未收敛，且不满足预设判定条件，计算的所述主参与者发送的主梯度值和预设的步长之间的乘积。

在主参与者接收到协调者反馈的目标主梯度值时，可以根据此目标主梯度值更新自身的本地模型参数，其中，目标主梯度值是第二乘积，第二乘积是协调者在纵向逻辑回归模型未收敛，且不满足预设判定条件时，对主参与者发送的主梯度值和预设的步长之间进行计算，以获取其乘积，该乘积就是第二乘积，也就是目标主梯度值。

在本实施例中，通过确定目标主梯度值时在纵向逻辑回归模型未收敛，且不满足预设判定条件时，计算主梯度值和预设的步长的乘积，从而保障了获取到的目标主梯度值的准确性。

进一步地，在第一至第二任意一个实施例的基础上，提出了本申请纵向联邦学习优化方法第三实施例。本实施例是本申请第一实施例的步骤S10，基于预设判定条件获取新数据在所述主参与者中的新加密数值集合的步骤，包括：步骤e，检测所述主参与者对应的纵向逻辑回归模型是否满足预设判定条件；

在主参与者获取到加密数值集合后，还需要检测主参与者对应的纵向逻辑回归模型是否满足预设判定条件，例如判断纵向逻辑回归模型的新迭代次数是否满足预设次数条件(如确定新迭代次数是否为迭代步数间隔的整数倍，且是否大于两倍大于预设次数)。根据不同的判断结果执行不同的操作。

步骤f，若满足，则根据所述预设逻辑回归算法获取新数据在所述主参与者中的新加密数值集合。

若满足，则随机获取新的数据，通过预设逻辑回归算法来计算新的数据在主参与者中的逻辑回归得分，对其进行加密，得到新加密数值集合。但是若不满足，则可以直接将加密数值集合作为目标数值集合发送到副参与者。

在本实施例中，通过检测纵向逻辑回归模型是否满足预设判定条件，若满足，则获取新数据在主参与者中的新加密数值集合，从而保障了模型训练的效率。

进一步地，获取数据在主参与者中的加密数值集合的步骤的细化，包括：

步骤g，获取主参与者中的预设逻辑回归算法，并根据所述预设逻辑回归算法计算数据在所述主参与者中的逻辑回归得分，对所述逻辑回归得分进行加密，以获取加密数值集合。

获取主参与者自身模型的模型参数，即本地模型参数，并随机选择一小批待进行模型训练的训练数据，以便进行模型训练。再获取主参与者中的预设逻辑回归算法，如

即表示A侧各样本的逻辑回归得分，其中，w表示逻辑回归的线性模型参数，x代表数据，T表示数量。并根据预设逻辑回归算法和本地模型参数对各个训练数据进行计算，以获取主参与者中各个训练数据对应的逻辑回归得分，并对所有的逻辑回归得分进行加密，得到加密数值集合。

在本实施例中，通过根据预设逻辑回归公式和本地模型参数对各个训练数据进行计算，以获取加密数值集合，从而保障了获取到的加密数值集合的准确性。

进一步地，参照图3，图3为本申请纵向联邦学习优化方法另一实施例的流程示意图，包括：步骤S100，接收主参与者发送的主加密数据和副参与者发送的副加密数据，所述主加密数据为根据所述副参与者基于所述主参与者发送目标数值集合反馈的中间结果值计算得，所述目标数值集包括数据对应的加密数值集合和新数据对应的新加密数值集合；

在协调者中当根据副参与者发送的损失函数值确定纵向逻辑回归模型未收敛，且满足预设判定条件时，例如判断纵向逻辑回归模型的新迭代次数是否满足预设次数条件(如确定新迭代次数是否为迭代步数间隔的整数倍，且是否大于两倍大于预设次数)，若满足预设次数条件，则确定纵向逻辑回归模型满足预设判定条件时，在接收到主参与者发送的主加密数据和副参与者发送的副加密数据后，根据主加密数据和副加密数据更新二阶导数矩阵。其中，主加密数据是副参与者基于主参与者发送的目标数值集合反馈的中间结果值计算得到的，也就是主参与者发送加密数值集合到副参与者，副参与者根据加密数值集合计算出中间结果值和损失函数值，并将损失函数值发送至协调者，根据中间结果值计算出副加密数据，并将副加密数据发送至协调者，同时将中间结果值反馈至主参与者，主参与者根据此中间结果值进行计算获取到主加密数据，将此主加密数据发送至协调者。其中，目标数值集合可以包括数据对应的加密数值集合和新数据对应的新加密数值集合，也就是在主参与者对应的当前迭代次数是否满足预设条件(如当前迭代次数是否经过预设次数)，若不满足，则将加密数值集合作为目标数值集合，若满足，则将加密数值集合和新加密数值集合作为目标数值集合。并且在本申请中数据加密的方式可以是采用同态加密的方式。

步骤S200，响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

在协调者检测到纵向逻辑回归模型未收敛时，可以根据主参与者发送的主加密数据和副参与者发送的副加密数据来更新二阶导数矩阵，也就是将主加密数据和副加密数据进行解密合并，并将其存储在一个预设长度的队列中，得到目标队列，并根据此目标队列来更新二阶导数矩阵H，其中，计算H的方法为利用存储器队列末尾的值初始化，即计算

并且在本实施例中，若纵向逻辑回归模型未收敛，则更新

步骤S300，将所述目标主梯度值发送给所述主参与者，所述主参与者用于基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。

在协调者计算得到目标主梯度值后，会将此目标主梯度值发送给主参与者，主参与者会根据此目标主梯度值来更新主参与者中的本地模型参数，并会继续执行获取数据在主参与者中的加密数值集合，直至协调者对应的纵向逻辑回归模型收敛，并发送迭代停止信号到主参与者和副参与者。同理副参与者也接收协调者反馈的副参与者对应的目标副梯度值以更新副参与者中的本地模型参数。

在本实施例中，通过协调者根据主加密数据和副加密数据更新二阶导数矩阵，并根据更新的二阶导数矩阵计算目标主梯度值，将目标主梯度值发送至主参与者，以更新主参与者中的本地模型参数，从而避免了现有技术进行纵向联邦学习采用一阶算法而使得收敛速度较慢，需要进行大量轮次的数据交互的现象发生，减少了进行纵向联邦学习的通信量。

进一步地，根据所述主加密数据和所述副加密数据更新二阶导数矩阵的步骤，包括步骤x，判断所述纵向逻辑回归模型是否满足所述预设判定条件；

在协调者接收到主参与者发送的主梯度值和副协调者发送的副梯度值、损失值，并确定纵向逻辑回归模型不收敛后，需要判断纵向逻辑回归模型是否满足预设判定条件，例如判断纵向逻辑回归模型的新迭代次数是否满足预设次数条件(如确定新迭代次数是否为迭代步数间隔的整数倍，且是否大于两倍大于预设次数)。并根据不同的判断结果执行不同的操作。

步骤y，若满足，则根据所述主加密数据和所述副加密数据更新二阶导数矩阵。

当经过判断发现纵向逻辑回归模型满足预设判定条件时，则需要根据协调者接收到的主参与者发送的主加密数据和副参与者发送的副加密数据来更新协调者中的二阶导数矩阵。

在本实施例中，通过在纵向逻辑回归模型未收敛时，判断纵向逻辑回归模型是否满足预设判定条件，并在满足时，才更新二阶导数矩阵，从而保障了纵向逻辑回归模型的模型训练效率。

进一步地，根据所述主加密数据和所述副加密数据更新二阶导数矩阵的步骤，包括：步骤z，所述协调者将所述主加密数据和所述副加密数据进行解密合并，以获取目标数据；

协调者在接收到主参与者发送的主加密数据和副参与者发送的副加密数据后，进行解密合并得到目标数据，也就是将加密数据[[v _A]],[[v _B]]进行解密后合得到目标数据

步骤m，将所述目标数据存储至预设长度的队列中，以获取目标队列，并通过所述目标队列对二阶导数矩阵进行更新。

协调者将目标数据存储在一个长度为M(即预设长度)的v队列中。同时，计算本次(t)与上次(t-1)的

之差，即

将其存在长度为M的s队列中。如果目前的存储器已经达到最大存储长度M，则将队列首个删掉并将最新得到v和s放在队列末尾。利用当前存储器里的m(m不大于M)个v和s，来计算H(二阶导数矩阵)。计算方法如下：

利用存储器队列末尾的值初始化，即计算

在本实施例中，通过将主加密数据和副加密数据进行解密合并得到目标数据，再根据目标数据对二阶导数矩阵进行更新，从而保障了二阶导数矩阵更新的有效性。

进一步地，判断所述纵向逻辑回归模型是否满足所述预设判定条件的步骤之后，包括：步骤n，若不满足，则所述协调者获取所述主参与者发送的主梯度值和预设的步长之间的第一乘积，并将所述第一乘积作为目标主梯度值发送至所述主参与者。

当经过判断发现纵向逻辑回归模型不满足预设判定条件，则协调者计算出事先选定的预设步长与主梯度值的第一乘积，和预设步长与副参与者对应的副梯度值的第三乘积，并将第一乘积作为目标主梯度值发送到主参与者中更新主参与者中的本地模型参数，将第三乘积发送到副参与者中更新副参与者中的模型参数，再根据更新后的各个模型参数重新进行模型训练，以获取新的损失函数值，并通过副参与者发送到协调者中。在本实施例中，通过在确定纵向逻辑回归模型不满足预设判定条件时，计算主梯度值和预设的步长之间的第一乘积，并将第一乘积作为目标主梯度值，从而保障了获取到的目标主梯度值的准确性。

本申请实施例还提供一种纵向联邦学习优化装置，参照图4，所述纵向联邦学习优化装置包括：获取模块，用于获取数据在主参与者中的加密数值集合，并基于预设判定条件获取新数据在所述主参与者中的新加密数值集合；发送模块，用于将所述加密数值集合和所述新加密数值集合作为目标数值集合发送至副参与者，以获取所述副参与者基于所述目标数值集合反馈的中间结果值；第一计算模块，用于根据所述中间结果值计算所述主参与者中的主加密数据，并将所述主加密数据发送至协调者，其中，所述协调者用于响应于纵向逻辑回归模型未收敛时，根据所述主加密数据和所述副参与者发送的副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；第一更新模块，用于接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。可选地，所述第一更新模块还用于：接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者根据响应于所述纵向逻辑回归模型满足所述预设判定条件而更新的二阶导数矩阵获取的。可选地，所述第一更新模块还用于：接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者根据目标数据更新的二阶导数矩阵获取的，所述目标数据为响应于纵向逻辑回归模型未收敛，且满足预设判定条件，将所述主加密数据和所述副参与者发送的副加密数据进行解密合并得到的。可选地，所述第一更新模块还用于：接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者对第一目标乘积进行拆分得到的，所述第一目标乘积为根据响应于所述纵向逻辑回归模型满足所述预设判定条件而更新的二阶导数矩阵、所述主参与者发送的主梯度值和所述副参与者发送的副梯度值合并的长向量，和预设步长之间的乘积。可选地，所述第一更新模块还用于：接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值为第二目标乘积，所述第二目标乘积为所述协调者响应于纵向逻辑回归模型未收敛，且不满足预设判定条件，计算的所述主参与者发送的主梯度值和预设的步长之间的乘积。可选地，所述获取模块还用于：检测所述主参与者对应的纵向逻辑回归模型是否满足预设判定条件；若满足，则根据所述预设逻辑回归算法获取新数据在所述主参与者中的新加密数值集合。可选地，所述获取模块还用于：获取主参与者中的预设逻辑回归算法，并根据所述预设逻辑回归算法计算数据在所述主参与者中的逻辑回归得分，对所述逻辑回归得分进行加密，以获取加密数值集合。本申请实施例还提供一种纵向联邦学习优化装置，所述纵向联邦学习优化装置包括：接收模块，用于接收主参与者发送的主加密数据和副参与者发送的副加密数据，所述主加密数据为根据所述副参与者基于所述主参与者发送目标数值集合反馈的中间结果值计算得，所述目标数值集包括数据对应的加密数值集合和新数据对应的新加密数值集合；第二计算模块，用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；第二更新模块，用于将所述目标主梯度值分别发送给所述主参与者，所述主参与者用于基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。可选地，所述第二计算模块还用于：判断所述纵向逻辑回归模型是否满足所述预设判定条件；若满足，则根据所述主加密数据和所述副加密数据更新二阶导数矩阵。可选地，所述第二计算模块还用于：所述协调者将所述主加密数据和所述副加密数据进行解密合并，以获取目标数据；将所述目标数据存储至预设长度的队列中，以获取目标队列，并通过所述目标队列对二阶导数矩阵进行更新。可选地，所述第二计算模块还用于：若不满足，则所述协调者获取所述主参与者发送的主梯度值和预设的步长之间的第一乘积，并将所述第一乘积作为目标主梯度值发送至所述主参与者。上述各程序模块所执行的方法可参照本申请纵向联邦学习优化方法各个实施例，此处不再赘述。

本申请实施例还提供一种存储介质，所述存储介质可以为非易失性可读存储介质。本申请存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上所述的纵向联邦学习优化方法的步骤。其中，在所述处理器上运行的计算机可读指令被执行时所实现的方法可参照本申请纵向联邦学习优化方法各个实施例，此处不再赘述。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种纵向联邦学习优化方法，其中，所述纵向联邦学习优化方法包括如下步骤：

获取数据在主参与者中的加密数值集合，并基于预设判定条件获取新数据在所述主参与者中的新加密数值集合；

将所述加密数值集合和所述新加密数值集合作为目标数值集合发送至副参与者，以获取所述副参与者基于所述目标数值集合反馈的中间结果值；

根据所述中间结果值计算所述主参与者中的主加密数据，并将所述主加密数据发送至协调者，其中，所述协调者用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副参与者发送的副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。
如权利要求1所述的纵向联邦学习优化方法，其中，所述接收所述协调者反馈的目标主梯度值的步骤，包括：

接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者根据响应于所述纵向逻辑回归模型满足所述预设判定条件而更新的二阶导数矩阵获取的。
如权利要求2所述的纵向联邦学习优化方法，其中，所述接收所述协调者反馈的目标主梯度值的步骤，包括：

接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者根据目标数据更新的二阶导数矩阵获取的，所述目标数据为响应于纵向逻辑回归模型未收敛，且满足预设判定条件，将所述主加密数据和所述副参与者发送的副加密数据进行解密合并得到的。
如权利要求2所述的纵向联邦学习优化方法，其中，所述接收所述协调者反馈的目标主梯度值的步骤，包括：

接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者对第一目标乘积进行拆分得到的，所述第一目标乘积为根据响应于所述纵向逻辑回归模型满足所述预设判定条件而更新的二阶导数矩阵、所述主参与者发送的主梯度值和所述副参与者发送的副梯度值合并的长向量，和预设步长之间的乘积。
如权利要求1所述的纵向联邦学习优化方法，其中，所述接收所述协调者反馈的目标主梯度值的步骤，包括：

接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值为第二目标乘积，所述第二目标乘积为所述协调者响应于纵向逻辑回归模型未收敛，且不满足预设判定条件，计算的所述主参与者发送的主梯度值和预设的步长之间的乘积。
如权利要求1所述的纵向联邦学习优化方法，其中，所述基于预设判定条件获取新数据在所述主参与者中的新加密数值集合的步骤，包括：

检测所述主参与者对应的纵向逻辑回归模型满足预设判定条件，则根据所述预设逻辑回归算法获取新数据在所述主参与者中的新加密数值集合。
如权利要求1所述的纵向联邦学习优化方法，其中，所述获取数据在主参与者中的加密数值集合的步骤，包括：

获取主参与者中的预设逻辑回归算法，并根据所述预设逻辑回归算法计算数据在所述主参与者中的逻辑回归得分，对所述逻辑回归得分进行加密，以获取加密数值集合。
一种纵向联邦学习优化方法，其中，所述纵向联邦学习优化方法包括如下步骤：

接收主参与者发送的主加密数据和副参与者发送的副加密数据，其中，所述主加密数据为根据所述副参与者基于所述主参与者发送目标数值集合反馈的中间结果值计算的，所述目标数值集包括数据对应的加密数值集合和新数据对应的新加密数值集合；

响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

将所述目标主梯度值发送给所述主参与者，所述主参与者用于基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。
如权利要求8所述的纵向联邦学习优化方法，其中，所述根据所述主加密数据和所述副加密数据更新二阶导数矩阵的步骤，包括：

确定所述纵向逻辑回归模型满足所述预设判定条件，则根据所述主加密数据和所述副加密数据更新二阶导数矩阵。
如权利要求9所述的纵向联邦学习优化方法，其中，所述根据所述主加密数据和所述副加密数据更新二阶导数矩阵的步骤，包括：

所述协调者将所述主加密数据和所述副加密数据进行解密合并，以获取目标数据；

将所述目标数据存储至预设长度的队列中，以获取目标队列，并通过所述目标队列对二阶导数矩阵进行更新。
如权利要求8所述纵向联邦学习优化方法，其中，所述纵向联邦学习优化方法，包括：

确定纵向逻辑回归模型不满足所述预设判定条件，则所述协调者获取所述主参与者发送的主梯度值和预设的步长之间的第一乘积，并将所述第一乘积作为目标主梯度值发送至所述主参与者。
一种纵向联邦学习优化装置，其中，所述纵向联邦学习优化装置包括：

获取模块，用于获取数据在主参与者中的加密数值集合，并基于预设判定条件获取新数据在所述主参与者中的新加密数值集合；

发送模块，用于将所述加密数值集合和所述新加密数值集合作为目标数值集合发送至副参与者，以获取所述副参与者基于所述目标数值集合反馈的中间结果值；

第一计算模块，用于根据所述中间结果值计算所述主参与者中的主加密数据，并将所述主加密数据发送至协调者，其中，所述协调者用于响应于确定纵向逻辑回归模型未收敛，根据所述主加密数据和所述副参与者发送的副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

第一更新模块，用于接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。
一种纵向联邦学习优化装置，其中，所述纵向联邦学习优化装置还包括：

接收模块，用于接收主参与者发送的主加密数据和副参与者发送的副加密数据，所述主加密数据为根据所述副参与者基于所述主参与者发送目标数值集合反馈的中间结果值计算得，所述目标数值集包括数据对应的加密数值集合和新数据对应的新加密数值集合；

第二计算模块，用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

第二更新模块，用于将所述目标主梯度值分别发送给所述主参与者，所述主参与者用于基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。
一种纵向联邦学习优化设备，其中，所述纵向联邦学习优化设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述计算机可读指令被所述处理器执行时实现如下步骤：

获取数据在主参与者中的加密数值集合，并基于预设判定条件获取新数据在所述主参与者中的新加密数值集合；

将所述加密数值集合和所述新加密数值集合作为目标数值集合发送至副参与者，以获取所述副参与者基于所述目标数值集合反馈的中间结果值；

根据所述中间结果值计算所述主参与者中的主加密数据，并将所述主加密数据发送至协调者，其中，所述协调者用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副参与者发送的副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。
如权利要求14所述的纵向联邦学习优化设备，其中，所述接收所述协调者反馈的目标主梯度值的步骤，包括：

接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者根据响应于所述纵向逻辑回归模型满足所述预设判定条件而更新的二阶导数矩阵获取的。
一种纵向联邦学习优化设备，其中，所述纵向联邦学习优化设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述计算机可读指令被所述处理器执行时实现如下步骤：

接收主参与者发送的主加密数据和副参与者发送的副加密数据，其中，所述主加密数据为根据所述副参与者基于所述主参与者发送目标数值集合反馈的中间结果值计算的，所述目标数值集包括数据对应的加密数值集合和新数据对应的新加密数值集合；

响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

将所述目标主梯度值发送给所述主参与者，所述主参与者用于基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。
如权利要求16所述的纵向联邦学习优化设备，其中，所述根据所述主加密数据和所述副加密数据更新二阶导数矩阵的步骤，包括：

确定所述纵向逻辑回归模型满足所述预设判定条件，则根据所述主加密数据和所述副加密数据更新二阶导数矩阵。
一种存储介质，其中，所述存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如下步骤：

获取数据在主参与者中的加密数值集合，并基于预设判定条件获取新数据在所述主参与者中的新加密数值集合；

将所述加密数值集合和所述新加密数值集合作为目标数值集合发送至副参与者，以获取所述副参与者基于所述目标数值集合反馈的中间结果值；

根据所述中间结果值计算所述主参与者中的主加密数据，并将所述主加密数据发送至协调者，其中，所述协调者用于响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副参与者发送的副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

接收所述协调者反馈的目标主梯度值，基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。
如权利要求18所述的存储介质，其中，所述接收所述协调者反馈的目标主梯度值的步骤，包括：

接收所述协调者反馈的目标主梯度值，其中，所述目标主梯度值由所述协调者根据响应于所述纵向逻辑回归模型满足所述预设判定条件而更新的二阶导数矩阵获取的。
一种存储介质，其中，所述存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如下步骤：

接收主参与者发送的主加密数据和副参与者发送的副加密数据，其中，所述主加密数据为根据所述副参与者基于所述主参与者发送目标数值集合反馈的中间结果值计算的，所述目标数值集包括数据对应的加密数值集合和新数据对应的新加密数值集合；

响应于纵向逻辑回归模型未收敛，根据所述主加密数据和所述副加密数据更新二阶导数矩阵，并根据所述更新后的二阶导数矩阵计算目标主梯度值；

将所述目标主梯度值发送给所述主参与者，所述主参与者用于基于所述目标主梯度值更新所述主参与者中的本地模型参数，并继续执行所述获取数据在主参与者中的加密数值集合的步骤，直至所述协调者对应的纵向逻辑回归模型收敛。