CN111325417B

CN111325417B - 实现隐私保护的多方协同更新业务预测模型的方法及装置

Info

Publication number: CN111325417B
Application number: CN202010409988.2A
Authority: CN
Inventors: 李龙飞; 周俊
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-05-15
Filing date: 2020-05-15
Publication date: 2020-08-25
Anticipated expiration: 2040-05-15
Also published as: CN111325417A

Abstract

本说明书实施例提供一种实现隐私保护的多方协同更新业务预测模型的方法，其中多方包括服务器和多个数据方，该服务器部署针对业务对象的业务预测模型，该方法包括对业务预测模型进行任一轮迭代更新，具体包括：参与本轮迭代更新的第一数据方，从服务器获取第一当前参数部分，该第一当前参数部分是基于业务预测模型的当前模型参数进行随机选取而得到；第一数据方利用本地训练数据，更新上述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；第一数据方将该第一更新参数部分上传至服务器；服务器根据该第一更新参数部分，以及从参与本轮迭代更新的其他数据方接收的其他更新参数部分，更新业务预测模型。

Description

实现隐私保护的多方协同更新业务预测模型的方法及装置

技术领域

本说明书一个或多个实施例涉及信息安全技术领域，尤其涉及一种实现隐私保护的多方协同更新业务预测模型的方法及装置。

背景技术

目前，多个数据方协同训练机器学习模型已引发研究热潮。比如说，大量物联网（The Internet of Things，简称IOT）设备希望打通数据孤岛，通过将各个IOT设备链接到一起，来集中学习得到相应的机器学习模型。其中的难点在于，如何在协同建模以发挥数据连接价值的同时，确保各个数据方的数据隐私不被窥探。

然而，目前已有的协同建模方式较为单一，难以满足实际应用中更高的隐私保护要求。因此，迫切需要一种协同建模的方案，可以在实现高效建模的同时，有效地保障各方数据安全。

发明内容

本说明书一个或多个实施例描述了一种实现隐私保护的多方协同更新业务预测模型的方法及装置，可以有效保障各方数据安全，同时，大幅提高建模效率。

根据第一方面，提供一种实现隐私保护的多方协同更新业务预测模型的方法，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述方法应用于所述多个数据方中任意的第一数据方，所述方法包括对所述业务预测模型进行多轮迭代更新，其中任一轮迭代更新包括：

从所述服务器获取第一当前参数部分，该第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；利用本地训练数据，更新所述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；将所述第一更新参数部分发送至所述服务器，以使所述服务器根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

在一个实施例中，所述业务对象包括以下之一：用户，商户，商品，事件；所述业务预测模型用于预测所述业务对象的分类或回归值。

在一个实施例中，从所述服务器获取第一当前参数部分，包括：从所述当前模型参数的参数编号中随机选取多个参数编号；向所述服务器发送参数获取请求，其中包括所述多个参数编号；从所述服务器接收具有所述多个参数编号的第一当前参数部分。

在一个具体的实施例中，所述服务器维护所述当前模型参数的排名，该排名根据预设的参数累计更新指标而确定，所述参数累计更新指标包括累计更新频次和/或累计变化量。

其中，从所述当前模型参数的参数编号中随机选取多个参数编号，包括：从排名靠前的名次区间中选取多个靠前名次，从排名靠后的名次区间中随机选取多个靠后名次，所述多个靠前名次的数量大于所述多个靠后名次的数量，所述多个靠前名次和多个靠后名次对应的参数编号构成所述多个参数编号。

在一个更具体的实施例中，所述第一数据方中存储迭代更新轮次和可获取参数数量之间的映射关系；其中从所述当前模型参数的参数编号中随机选取多个参数编号，还包括：根据所述映射关系，确定所述任一轮迭代更新的轮次所对应的当前可获取参数数量；确定第一数量和第二数量，使得其和值等于所述当前可获取参数数量，所述第一数量用于选取所述多个靠前名次，所述第二数量用于选取所述多个靠后名次。

在一个实施例中，利用本地训练数据，更新所述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分，包括：利用所述本地训练数据，更新所述第一当前参数部分，得到所述更新后参数；从所述更新后参数中选取部分参数，作为所述第一更新参数部分。

在一个具体的实施例中，从所述更新后参数中选取部分参数，作为所述第一更新参数部分，还包括：根据所述第一数据方与所述服务器之间的当前通信情况，确定可上传参数数量，用于选取所述部分参数。

在另一个具体的实施例中，利用所述本地训练数据，更新所述第一当前参数部分，得到所述更新后参数，包括：利用所述本地训练数据，计算与所述第一当前参数部分对应的更新梯度；基于所述第一当前参数部分和所述更新梯度，得到所述更新后参数。

其中，从所述更新后参数中选取部分参数，作为所述第一更新参数部分，包括：将所述更新后参数中，所对应更新梯度大于预定梯度阈值的参数，确定为所述部分参数；基于本地验证数据和预设的预测性能指标，确定所述更新后参数和部分参数各自对应的性能指标值；在两个性能指标值之间的差值小于相差阈值的情况下，将所述部分参数作为所述第一更新参数部分。

根据第二方面，提供一种实现隐私保护的多方协同更新业务预测模型的方法，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述方法应用于所述多个数据方中任意的第一数据方，所述第一数据方参与对所述业务预测模型进行多轮迭代更新中的若干轮，该若干轮中的任一轮迭代更新包括：

从所述服务器接收参与本轮迭代更新的通知，所述通知被发送至所述多个数据方中的部分数据方；根据所述通知，从所述服务器获取第一当前参数部分，该第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；利用本地训练数据，更新所述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；将所述第一更新参数部分发送至所述服务器，以使所述服务器根据所述第一更新参数部分和从所述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

在一个实施例中，在得到第一更新参数部分之后，所述方法还包括：利用本地验证数据和预设的预测性能指标，确定所述第一更新参数部分的第一性能指标值；将所述第一性能指标值发送至所述服务器，以使所述服务器至少根据所述第一性能指标值和从所述其他数据方接收的其他性能指标值，从所述多个数据方中选取参与下一轮迭代更新的部分数据方。

根据第三方面，提供一种实现隐私保护的多方协同更新业务预测模型的方法，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述方法应用于所述服务器，所述方法包括对所述业务预测模型进行多轮迭代更新，其中任一轮迭代更新包括：

针对所述多个数据方中任意的第一数据方，向其发送第一当前参数部分，所述第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；从所述第一数据方接收所述第一更新参数部分，其由所述第一数据方通过利用本地训练数据更新所述第一当前参数部分而得到；根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

在一个实施例中，在针对所述多个数据方中任意的第一数据方，向其发送第一当前参数部分之前，所述方法还包括：从所述第一数据方接收参数获取请求，其中包括从所述当前模型参数的参数编号中随机选取的多个参数编号；从所述当前模型参数中确定与所述多个参数编号对应的多个当前参数，作为所述第一当前参数部分。

在一个具体的实施例中，所述服务器维护所述当前模型参数的排名，所述排名根据预设的参数累计更新指标而确定，所述参数累计更新指标包括累计更新频次和/或累计变化量。其中，所述多个参数编号对应从排名靠前的名次区间中选取的多个靠前名次，以及从排名靠后的名次区间中随机选取的多个靠后名次，所述多个靠前名次的数量大于所述多个靠后名次的数量。

在一个实施例中，根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数，包括：对于所述当前模型参数中的某个模型参数，从所述第一更新参数部分和所述其他更新参数部分中确定与之对应的若干更新后参数；将所述某个模型参数更新为所述若干更新后参数的平均值。

根据第四方面，提供一种实现隐私保护的多方协同更新业务预测模型的方法，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述方法应用于所述服务器，所述方法包括对所述业务预测模型进行多轮迭代更新，其中任一轮迭代更新包括：

从所述多个数据方中选取参与本轮迭代更新的部分数据方；针对所述部分数据方中任意的第一数据方，向其发送参与本轮迭代更新的通知；向所述第一数据方发送第一当前参数部分，所述第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；从所述第一数据方接收所述第一更新参数部分，其由所述第一数据方通过利用本地训练数据更新所述第一当前参数部分而得到；根据所述第一更新参数部分和从所述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

在一个实施例中，在向所述第一数据方发送第一当前参数部分之后，所述方法还包括：从所述第一数据方接收所述第一更新参数部分的第一性能指标值，其由所述第一数据方根据其本地验证数据和预设的预测性能指标而确定；至少根据所述第一性能指标值和从所述其他数据方接收的其他性能指标值，从所述多个数据方中选取参与下一轮迭代更新的部分数据方。

在一个具体的实施例中，从所述第一数据方接收所述第一更新参数部分之后，所述方法还包括：根据预设的通信质量指标，以及所述第一更新参数部分对应的数据量和/或接收时长，确定所述第一数据方与所述服务器之间通信的第一通信指标值；其中，至少根据所述第一性能指标值和从所述其他数据方接收的其他性能指标值，从所述多个数据方中选取参与下一轮迭代更新的部分数据方，包括：根据所述第一性能指标值、其他性能指标值、第一通信指标值和其他通信指标值，从所述多个数据方中选取参与下一轮迭代更新的部分数据方。

根据第五方面，提供一种实现隐私保护的多方协同更新业务预测模型的装置，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述装置集成于所述多个数据方中任意的第一数据方，所述装置用于对所述业务预测模型进行多轮迭代更新，所述装置通过其包括的以下单元执行其中任一轮迭代更新：

部分参数获取单元，配置为从所述服务器获取第一当前参数部分，该第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；更新参数确定单元，配置为利用本地训练数据，更新所述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；更新参数发送单元，配置为将所述第一更新参数部分发送至所述服务器，以使所述服务器根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

根据第六方面，提供一种实现隐私保护的多方协同更新业务预测模型的装置，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述装置集成于所述多个数据方中任意的第一数据方，所述第一数据方参与对所述业务预测模型进行多轮迭代更新中的若干轮，所述装置通过其包括的以下单元执行该若干轮中的任一轮迭代更新：

参与通知接收单元，配置为从所述服务器接收参与本轮迭代更新的通知，所述通知被发送至所述多个数据方中的部分数据方；部分参数获取单元，配置为根据所述通知，从所述服务器获取第一当前参数部分，该第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；更新参数确定单元，配置为利用本地训练数据，更新所述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；更新参数发送单元，配置为将所述第一更新参数部分发送至所述服务器，以使所述服务器根据所述第一更新参数部分和从所述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

根据第七方面，提供一种实现隐私保护的多方协同更新业务预测模型的装置，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述装置集成于所述服务器，所述装置用于对所述业务预测模型进行多轮迭代更新，所述装置通过其包括的以下单元执行其中任一轮迭代更新：

部分参数发送单元，配置为针对所述多个数据方中任意的第一数据方，向其发送第一当前参数部分，所述第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；更新参数接收单元，配置为从所述第一数据方接收所述第一更新参数部分，其由所述第一数据方通过利用本地训练数据更新所述第一当前参数部分而得到；模型更新单元，配置为根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

根据第八方面，提供一种实现隐私保护的多方协同更新业务预测模型的装置，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述装置集成于所述服务器，所述装置用于对所述业务预测模型进行多轮迭代更新，所述装置通过其包括的以下单元执行其中任一轮迭代更新：

数据方选取单元，配置为从所述多个数据方中选取参与本轮迭代更新的部分数据方；参与通知发送单元，配置为针对所述部分数据方中任意的第一数据方，向其发送参与本轮迭代更新的通知；部分参数发送单元，配置为向所述第一数据方发送第一当前参数部分，所述第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；更新参数接收单元，配置为从所述第一数据方接收所述第一更新参数部分，其由所述第一数据方通过利用本地训练数据更新所述第一当前参数部分而得到；模型更新单元，配置为根据所述第一更新参数部分和从所述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

根据第九方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行上述第一方面或第二方面或第三方面或第四方面的方法。

根据第十方面，提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现上述第一方面或第二方面或第三方面或第四方面的方法。

综上，在本说明书实施例提供的上述方法及装置中，多个数据方基于其各自与服务器建立的通信连接，从服务器中获取随机选取的部分模型参数，而非全量模型参数，进一步地，数据方根据该部分模型参数进行训练更新，进而从更新后参数中选取至少一部分上传至服务器，如此可以大幅降低数据方与服务方之间的通信量，降低数据方本地训练模型的计算量，加快参数的学习、收敛速度，有效防止参数过拟合，同时，使得恶意数据方无法通过下载多轮全量参数的方式反推隐私数据，从而有效保障各方数据的隐私安全。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出根据一种实施方式的协同训练机器学习模型的通信架构图；

图2示出本说明书实施例披露的协同训练机器学习模型的通信架构图；

图3A示出本说明书实施例披露的一种实现隐私保护的多方协同更新业务预测模型的交互示意图；

图3B示出根据一个实施例的基于图3A的对步骤S310进行细化的交互示意图；

图4示出本说明书实施例披露的另一种实现隐私保护的多方协同更新业务预测模型的交互示意图；

图5示出本说明书实施例披露的一种实现隐私保护的多方协同更新业务预测模型的装置结构图；

图6示出本说明书实施例披露的另一种实现隐私保护的多方协同更新业务预测模型的装置结构图；

图7示出本说明书实施例披露的又一种实现隐私保护的多方协同更新业务预测模型的装置结构图；

图8示出本说明书实施例披露的还一种实现隐私保护的多方协同更新业务预测模型的装置结构图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

如前所述，多个数据方在协同训练机器学习模型（或称预测模型）的同时，需保障自身数据的隐私安全，防止隐私数据泄漏。在提出的一种协同训练方式中，设立一个中立的全局服务器（以下简称为服务器），并在各个数据方与服务器之间建立通信连接，使得各方数据的借助该服务器实现价值融合，如此，使得各个数据方之间无需直接通信，从而在一定程度上保障各方数据的隐私安全。

具体地，图1示出根据一种实施方式的协同训练机器学习模型的通信架构图，如图1所示，多个数据方（图中示出N个，且N为大于2的正整数）各自与服务器建立通信连接，基于该通信连接，多个数据方每次从服务器上下载全量的机器学习模型（以下或简称全量模型），也就是全部的模型参数，然后利用本地训练数据更新下载的全量模型，再将更新后的全量模型上传给服务器，以使服务器根据从多个数据方接收的多个更新后的全量模型，确定统一提供给各个数据方进行下一轮训练的全量模型。然而，在这种实施方式中，数据方与服务器之间通信频繁，导致通信消耗巨大；再者，一些恶意的数据方，可能会根据从服务器下载的全量模型，反推出一些隐私数据，导致隐私数据泄漏。

对此，发明人提出一种协同训练机器学习模型的方法，可以大幅降低通信量，加快建模速度，同时，更加有效地保障各方数据的隐私安全。在一个实施例中，图2示出本说明书实施例披露的协同训练机器学习模型的通信架构图，如图2所示，数据方从服务器中下载机器学习模型时，通过引入随机性，从服务器中下载机器学习模型的部分模型参数，而非全量模型参数，相应地，只需基于训练好的部分模型参数进行上传，无需上传全量模型参数，从而有效降低数据方与服务器之间的通信量，减少通信时长；同时，数据方只需对下载的部分模型参数进行训练更新，从而可以减小训练时的计算量；另外，因数据方不能从服务器中下载到全量的机器学习模型，由此可以降低数据方根据下载的全量模型进行恶意反推而导致隐私数据泄漏的风险。

下面，结合具体的实施例，详细描述发明人提出的上述方法。具体地，本说明书实施例披露一种实现隐私保护的多方协同更新业务预测模型的方法，其中多方包括上述服务器和多个数据方（可参见图2），其中业务预测模型是用于执行针对业务对象的预测任务的机器学习模型，通过执行该方法，使得多个数据方可以利用各自存储的本地业务数据，协同高效地完成对上述业务预测模型的训练。

为便于理解，先对上述方法的实际应用场景进行介绍。在不同应用场景下，以下方面的内容或多或少存在差异：多个数据方所对应的实体设备、数据方中存储的本地业务数据、业务对象、预测任务、用于执行针对业务对象的预测任务的业务预测模型。

在一个示例性场景中，上述多个数据方为具有人脸识别功能的多个IoT机具，其中每个IoT机具中存储在历史刷脸业务中采集的人脸数据，该人脸数据包括拍摄的人脸图片和对应用户的身份标识（如手机号或系统分配的唯一编号）。在此场景下，上述业务对象和预测任务可以分别为用户和人脸识别，相应地，用于对用户进行人脸识别的业务预测模型可称为人脸识别模型。

在另一个示例性场景中，上述多个数据方为多个用户终端，其中每个用户终端（如智能手机或平板电脑等）存储用户对网站或应用App的操作行为数据。进一步地，在一个更具体的场景中，其中网站或应用App可以包括电商网站或购物App，相应的操作行为数据可以包括浏览、点击或关闭等，在此场景下，上述业务对象可以包括用户和商品，上述预测任务可以为商品推荐，也就是判断是否向某用户推荐某商品，相应地，用于进行商品推荐的业务预测模型可以称为商品推荐模型。在另一个更具体的场景中，其中操作行为数据可以包括登录行为数据，如登录时刻、登录耗时、是否登录成功等，并且，每个用户终端存储的本地业务数据还可以包括操作环境数据，如用户终端的MAC地址，网络IP地址等，在此场景下，上述业务对象可以包括登录事件，上述预测任务可以为事件风险识别，也就是判断某个登录事件是否存在风险，相应地，用于识别事件风险的业务预测模型可以称为事件风险识别模型。

在又一个示例性场景中，上述多个数据方为多个工业设备，其中每个工业设备可以存储通过其传感器采集的传感器数据以及因发生异常而产生的告警数据，其中传感器可以包括温度传感器、湿度传感器、或压力传感器等，相应采集的传感器数据可以包括温度、湿度或压力，在此场景下，上述业务对象和预测任务可以分别为工业设备和异常检测，相应地，用于识别设备异常的业务预测模型可以称为异常检测模型。

在还一个示例性场景中，上述多个数据方为多个商户收款机具，其中每个收款机具中可以记录交易信息，包括交易方、交易时间、交易金额、交易网络环境、交易商品信息等，在此场景下，上述业务对象和预测任务可以分别为商户和商户经营风险评估，相应地，用于评估商户经营风险的业务预测模型可以称为商户风险评估模型。

在以上示例性场景中，多个数据方对应的实体设备可以包括IoT机具、用户终端、工业设备和商户收款机具，数据方中存储的本地业务数据可以包括：人脸数据、用户操作行为数据、设备传感器数据和交易数据，业务对象可以包括用户、商品、工业设备、登录事件和商户，预测任务可以包括人脸识别、商品推荐、异常检测、风险评估，业务预测模型可以为人脸识别模型、商品推荐模型、事件风险识别模型、异常检测模型和商户风险评估模型。需要理解，以上场景仅作为示例，实际上，上述多个数据方还可以实现为其他任何具有计算、处理能力的平台或设备集群或服务器（需要说明，本文别处提及的服务器是指上述全局服务器），上述业务对象还可以包括访问事件等其他业务事件。总的来说，上述业务预测模型可以分类模型或回归模型，用于预测上述业务对象的分类或回归值。在一个实施例中，上述业务预测模型可以基于决策树算法、贝叶斯算法等实现，在另一个实施例中，上述业务预测模型可以基于神经网络实现。

以上对上述方法的实际应用场景进行介绍。进一步地，图3A示出本说明书实施例披露的一种实现隐私保护的多方协同更新业务预测模型的交互示意图。需要说明，上述方法中涉及对上述业务预测模型的多轮迭代更新，图3A中示出其中任一轮迭代更新包括的交互步骤，并且，因参与任一轮迭代更新的各个数据方与服务器的交互过程相近，所以图3A中主要示出参与该任一轮迭代更新的任意一个数据方（为便于描述，称作第一数据方）与服务器的交互步骤，参与该轮迭代更新的其他数据方与服务器的交互步骤，可以参见该第一数据方与服务器的交互步骤。可以理解，通过重复执行其中示出的交互步骤，可以实现对业务预测模型的多轮迭代更新，进而将最后一轮迭代更新后得到的业务预测模型，作为执行上述预测任务的最终使用模型。

如图3A所示，上述第一数据方与服务器之间通过以下步骤进行交互：

步骤S310，第一数据方从上述服务器获取第一当前参数部分，该第一当前参数部分是基于上述业务预测模型的当前模型参数进行随机选取而得到；步骤S320，第一数据方利用本地训练数据，更新上述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；步骤S330，第一数据方将该第一更新参数部分发送至上述服务器；步骤S340，服务器根据该第一更新参数部分和从其他数据方接收的其他更新参数部分，更新上述业务预测模型的当前模型参数。

以上步骤具体如下：

首先，在步骤S310，第一数据方从服务器中获取，基于业务预测模型的当前模型参数随机选取的部分当前参数，为便于描述和区分，文中将该部分当前参数称为第一当前参数部分。

需要说明，在本轮迭代更新为首轮迭代更新的情况下，上述当前模型参数是上述业务预测模型经过初始化所得到的模型参数；在本轮迭代更新不是首轮迭代更新的情况下，上述当前模型参数是上述业务预测模型经过上一轮迭代更新后得到的模型参数。

在一个实施例中，本步骤S310可以包括图3B中示出的子步骤S311至S314，具体包括：先在步骤S311，第一数据方从所述当前模型参数的参数编号中随机选取多个参数编号；接着在步骤S312，第一数据方向所述服务器发送参数获取请求，其中包括所述多个参数编号；再在步骤S313，服务器从当前模型参数中确定对应于多个参数编号的多个当前参数，作为第一当前参数部分，并且，在步骤S314，服务器向第一数据方发送所述第一当前参数部分。

需要说明，其中当前模型参数对应的全部参数编号可以是第一数据方预先获知的。在一个具体的实施例中，上述步骤S311中可以包括，根据预先设定的可获取参数数量（即，可获取对应数量的参数），从当前模型参数的全部参数编号中随机选取对应数量的多个参数编号，其中可获取参数数量小于全部参数编号的数量。在一个例子中，每轮迭代更新中的可获取参数数量可以均相同，例如，每轮迭代更新均可以从全量的100个参数中获取90个参数。

在另一个例子中，迭代更新的不同轮次可以对应不同的可获取参数数量，相应地，第一数据方中可以存储迭代更新轮次和可获取参数数量之间的映射关系，基于该映射关系，可以获取与上述任一轮迭代更新的轮次所对应的当前可获取参数数量，进而根据该当前可获取参数数量，从全量参数编号中随机选取对应数量的多个参数编号。在一个具体的例子中，该映射关系的建立可以符合规则：随着迭代轮次的增加，可获取参数数量减少，如此可以进一步加快迭代更新。

在另一个具体的实施例中，上述步骤S311中可以包括：根据预设的参数数量区间，从上述全部参数编号中，随机选取对应的总数量落在该参数数量区间内的多个参数编号。

另一方面，在一个具体的实施例中，上述步骤S311中选取参数编号时，还可以考虑优先下载重要度高的模型参数，该重要度可以通过更新情况来反映，通常，某个参数更新得越频繁、更新幅度越大，可认为其重要程度越高。具体地，服务器可以根据数据方上传的更新后参数，对全量模型参数的更新情况进行统计，进而根据更新情况进行参数排名，相应地，上述步骤S311中可以包括：根据参数排名，优先选取排名靠前的参数编号。

在一个更具体的实施例中，上述更新情况的统计，可以基于预设的参数累计更新指标而进行，该参数累计更新指标可以包括累计更新频次和/或累计变化量。在一个例子中，其中累计更新频次的统计方式可以为：在某轮迭代更新中，将某个参数在该某轮更新前的参数值，与从若干数据方接收的针对该某个参数的若干更新后参数值，分别进行比对，统计发生变化的次数，作为该某轮的更新次数，并累计到该某个参数的累计更新频次指标值中。在一个例子中，其中累计变化量的统计方式可以为：在某轮迭代更新中，计算该某个参数在该某轮更新前的参数值，与从若干数据方接收的针对该某个参数的若干更新后参数值的平均值之间的差值，作为该某轮的变化量，并累计到该某个参数的累计变化量指标值中。

在一个更具体的实施例中，上述优先选取排名靠前的参数编号可以包括：第一数据方从排名靠前的名次区间（如第1至第60名）中选取多个靠前名次，从排名靠后的名次区间（如第61至第100名）中随机选取多个靠后名次，其中多个靠前名次的数量大于多个靠后名次的数量，并且，多个靠前名次和多个靠后名次对应的参数编号共同构成上述多个参数编号。在一个例子中，上述从排名靠前的名次区间中选取多个靠前名次，可以包括：将该排名靠前的名次区间包含的名次作为该多个靠前名次，或者，从该排名靠前的名次区间中随机选取多个靠前名次。进一步地，通过继续执行步骤S312-步骤S314，实现第一当前参数部分的下载。如此，可以实现对重要度较高的模型参数的优先选取和下载。

根据一个例子，第一数据方中存储迭代更新轮次和可获取参数数量之间的映射关系，服务器维护上述当前模型参数的排名，基于此，本步骤S310中可以包括：第一数据方根据上述映射关系，确定上述任一轮迭代更新的轮次（也就是当前本轮迭代更新的轮次，如第4轮）所对应的当前可获取参数数量（如80个），并确定第一数量（如50）和相对更小的第二数量（如30），使得这两个数量的和值等于该当前可获取参数数量；进一步地，第一数据方从排名靠前的名次区间（如[1，59]）中选取对应该第一数量的多个靠前名次（如第1名、第3名等），以及从排名靠后的名次区间（如[60，100]）中随机选取对应该第二数量的多个靠后名次（如第55名、第99名等），该多个靠前名次和多个靠后名次对应的参数编号构成上述多个参数编号；接着，第一数据方向上述服务器发送参数获取请求，其中包括该多个参数编号；然后，服务器从当前模型参数中确定对应于多个参数编号的多个当前参数（如w₁、w₃、w₅₅、w₉₉等），作为第一当前参数部分，并且，在步骤S314，服务器向第一数据方发送该第一当前参数部分。

以上，第一数据方可以随机选取部分参数编号，并据此从服务器中获取具有该部分参数编号的第一当前参数部分。需要说明，第一当前参数部分的随机选取，除了可以由第一数据方执行以外，也可以由服务器执行。在一个实施例中，本步骤S310中可以包括：服务器从当前模型参数中随机选取一部分当前参数，作为上述第一当前参数部分，进而发送至第一数据方。在另一个实施例中，本步骤S310中可以包括：服务器根据其维护的参数更新情况，结合随机策略和优先选取重要度更高参数的优选策略，从当前模型参数中选取部分参数，作为上述第一当前参数部分，进而发送至第一数据方。如此，可以实现由服务器进行随机选取得到上述第一当前参数部分。另外需要说明的是，在每一轮迭代更新中，因为在数据方所下载参数的选取中引入了随机性，所以，不同数据方从服务器下载得到的参数通常是不完全相同的，如此有助于加强对各方数据的隐私保护。

以上在步骤S310，第一数据方可以从服务器中获取到第一当前参数部分。接着在步骤S320，第一数据方利用其本地训练数据，更新该第一当前参数部分，进而确定用于上传至服务器的第一更新参数部分。

由前述内容可知，第一数据方中存储本地业务数据，相应地，可以根据本地业务数据确定本地训练数据，例如，从本地业务数据中抽取一部分，作为该本地训练数据。

对于利用本地训练数据更新该第一当前参数部分，可以参考现有技术。举例来说，可以利用反向传播法，先计算出第一当前参数部分对应的更新梯度，再基于该更新梯度更新该第一当前参数部分，得到更新后参数。更具体地，将第一当前参数部分减去其所对应的更新梯度与学习步长（为超参）之间的乘积，得到该更新后参数。

在得到第一当前参数部分所对应的更新后参数之后，在一个实施例中，可以直接将该更新后参数作为上述第一更新参数部分。在另一个实施例中，可以从该更新后参数中选取部分参数，作为上述第一更新参数部分。如此，可以进一步减少数据方与服务器之间的通信量。

在一个具体的实施例中，对于上述部分参数的选取，可以考虑第一数据方与服务器之间的当前通信情况，从而确定可上传参数数量，进而根据该可上传参数数量，从上述更新后参数中选取对应数量的部分参数。可以理解，通常当前通信情况越好，确定出的可上传参数数量越多。另外，其中当前通信情况可以用时延、丢包率等通信质量指标进行衡量。在一个更具体的实施例中，可以从上述更新后参数中随机选取该部分参数。在另一个更具体的实施例中，还可以根据该更新后参数对应的本轮更新梯度，进行从大到小的排序，再优先选取排名靠前的参数，归入上述部分参数。

在另一个具体的实施例中，对于上述部分参数的选取，可以从模型剪枝的角度来考虑，具体从更新后参数中去除此次更新中变化量较小的参数，然后判断剩余参数与该更新后参数相比，预测性能是否发生较大变化，若性能降低不明显，甚至性能更好，则将该剩余参数作为选取出的部分参数。否则，将该更新后参数整体作为待上传的上述第一更新参数部分。具体地，将上述更新后参数中，所对应更新梯度大于预定梯度阈值的参数，确定为上述部分参数；然后，基于本地验证数据和预设的预测性能指标，确定该更新后参数和部分参数各自对应的性能指标值；进一步地，在两个性能指标值之间的差值小于相差阈值（可以人为预先设定、调整）的情况下，将该部分参数作为所述第一更新参数部分。在一个例子中，第一数据方可以从其本地业务数据中抽取部分业务数据，作为上述本地验证数据，需要理解，第一数据方中的本地训练数据和本地验证数据通常是互斥的。在一个例子中，其中预测性能指标可以包括：查全率、查准率、错误率等。如此，可以实现从利用本地训练数据对第一当前模型参数更新得到的更新后参数中，选取出部分参数作为上述第一更新参数部分。

以上，第一数据方可以利用其本地训练数据和获取的第一当前参数部分，确定待上传至服务器的第一更新参数部分。然后，在步骤S330，将该第一更新参数部分发送至服务器。并且，在步骤S340，服务器根据该第一更新参数部分和从其他数据方接收的其他更新参数部分，更新上述业务预测模型的当前模型参数。

具体地，服务器可以从参与本轮迭代更新的数据方中接收多个更新参数部分，其中包括第一数据方发送的第一更新参数部分。

以上述当前模型参数中的某个模型参数的更新为例，在一个实施例中，可以从该多个更新参数部分中确定是否存在与该某个模型参数对应的更新后参数，进一步地，若不存在，则不需对该某个模型参数进行更新；若存在一个，则可以将该某个模型参数更新为与之对应的一个更新后参数；若存在多个，在一个具体的实施例中，可以将该某个模型参数更新为与之对应的多个更新后参数的平均值，在另一个具体的实施例中，可以将该某个模型参数更新为该多个更新后参数的中位数。

如此，服务器可以根据参与上述任一轮迭代的数据方所上传的更新参数部分，更新上述业务预测模型的当前模型参数。通过重复执行上述步骤S310至步骤S340，可以实现对上述业务预测模型的多轮迭代更新，进而将最后一轮迭代更新得到的业务预测模型作为最终使用模型。需要说明，可以对业务预测模型迭代预定轮数，也可以对业务预测模型持续迭代更新，直至其参数收敛。

综上，在本说明书实施例披露的实现隐私保护的多方协同更新业务预测模型的方法中，多个数据方基于其各自与服务器建立的通信连接，从服务器中获取随机选取的部分模型参数，而非全量模型参数，进一步地，数据方根据该部分模型参数进行训练更新，进而从更新后参数中选取至少一部分上传至服务器，如此可以大幅降低数据方与服务方之间的通信量，降低数据方本地训练模型的计算量，加快参数的学习、收敛速度，有效防止参数过拟合，同时，使得恶意数据方无法通过下载多轮全量参数的方式反推隐私数据，从而有效保障各方数据的隐私安全。

以上主要对数据方从服务器中获取随机选取的部分模型参数，以及从更新该部分模型参数得到的更新后参数中选取至少一部分进行上传，进行说明。在一种典型的实施方式中，上述多个数据方中的每个数据方均可以参与上述多轮迭代更新中的每一轮迭代更新。而在本说明书实施例中，还进一步提出，针对每一轮迭代更新，让服务器从上述多个数据方中选取部分数据方进行参与，从而进一步降低数据方与服务器之间的通信量，进一步加快参数学习的收敛速度，更加有效地防止参数过拟合。

具体地，图4示出本说明书实施例披露的另一种实现隐私保护的多方协同更新业务预测模型的交互示意图。其中多方包括上述服务器和多个数据方，图4中的第一数据方，参与对业务预测模型进行多轮迭代更新中的若干轮，并且，图4中示出该若干轮中的任意一轮中的交互过程，图中的其他数据方为参与该任意一轮的部分数据方中除第一数据方以外的数据方。

如图4所示，其中的交互过程包括以下步骤：

步骤S410，服务器从多个数据方中选取参与本轮迭代更新的部分数据方；步骤S420，服务器针对该部分数据方中任意的第一数据方，向其发送参与本轮迭代更新的通知；步骤S430，服务器向该第一数据方发送第一当前参数部分，该第一当前参数部分是基于业务预测模型的当前模型参数进行随机选取而得到；步骤S440，第一数据方利用本地训练数据，更新上述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；步骤S450，服务器从该第一数据方接收该第一更新参数部分；步骤S460，服务器根据该第一更新参数部分和从上述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

针对以上步骤，需要说明的是，相较于图3A 和图 3B 中示出的步骤，主要的不同在于，服务器需要通过执行步骤S410，选取参与本轮迭代更新的部分数据方，进而在步骤S420，通知该部分数据方参与迭代更新。并且，在步骤S460，服务器根据该部分数据方上传的更新参数部分，更新业务预测模型的当前模型参数。因此，对上述步骤S430至步骤S460的描述，可以参见前述对图3A 和图 3B 中示出步骤的描述。

另外，在上述第一当前参数部分是由服务器进行随机选取而得到的情况下，在一种实施方式中，上述步骤S420和步骤S420可以合并执行，包括：服务器针对上述第一数据方，向其发送参与本轮迭代的通知，该通知中包括服务器基于上述当前模型参数进行随机选取而得到的第一当前参数部分。

以下重点对服务器选取参与某轮迭代更新的部分数据方的方式进行说明。具体地，在上述步骤S410，服务器从所述多个数据方中选取参与本轮迭代更新的部分数据方。

在一种情况下，本轮迭代更新为首轮迭代更新，相应地，可以从多个数据方中随机选取部分数据方。在一个具体的实施例中，其中随机选取的数量或百分比可以是预先设定的。

在另一种情况下，本轮迭代更新不是首轮迭代更新，相应地，在一个实施例中，可以从多个数据方中随机选取出上述部分数据方。在另一个实施例中，为了加快模型的学习效率，缩短协同建模的时间，服务器可以根据已执行的迭代更新轮次中的参数更新数据、通信数据等，对各个数据方进行评估，然后结合评估情况，从多个数据方中选取出上述部分数据方。

可以理解，选取参与本轮迭代更新的部分数据方，与选取参与下一轮跌打更新的部分数据方类似。为便于清楚和简洁描述，对服务器至少基于本轮迭代更新所产生的相关数据，选取参与下一轮迭代更新的部分数据方进行具体介绍。

在一个实施例中，在上述步骤S430之后，上述方法还可以包括：服务器从上述第一数据方接收上述第一更新参数部分的第一性能指标值，其由所述第一数据方根据其本地验证数据和预设的预测性能指标而确定；然后，至少根据该第一性能指标值和从上述其他数据方接收的其他性能指标值，从多个数据方中选取参与下一轮迭代更新的部分数据方。在一个具体的实施例中，其中预测性能指标可以包括查全率、查准率和错误率等。

在一个更具体的实施例中，服务器可以根据本轮中接收的多个性能指标值，对参与本轮迭代更新的部分数据方进行排序，从中选取排在预定范围内的数据方，参与下一轮迭代更新，并且，从未参与本轮迭代更新的部分数据方中，随机选取若干数据方，参与下一轮迭代更新。

在另一个更具体的实施例中，服务器中可以维护各个数据方对应的累计性能指标值，该累计性能指标值反映对应于已执行迭代更新轮次的综合性能，相应地，可以根据各个参与方所对应的累计性能指标值，选取参与下一轮迭代更新的部分数据方。

在另一个实施例中，在上述步骤S430之后，上述方法还可以包括：服务器根据预设的通信质量指标，以及上述第一更新参数部分对应的数据量和/或接收时长，确定上述第一数据方与服务器之间通信的第一通信指标值；然后，至少根据第一通信指标值和其他通信指标值，从上述多个数据方中选取参与下一轮迭代更新的部分数据方。在一个具体的实施例中，其中通信质量指标可以包括数据传输速率，可以对应于该数据量和接收时长之间的比值。在另一个具体的实施例中，其中通信质量指标还可以包括丢包率等。

在一个更具体的实施例中，服务器可以根据本轮中接收的多个通信指标值，对参与本轮迭代更新的部分数据方进行排序，从中选取排在预定范围内的数据方，参与下一轮迭代更新，并且，从未参与本轮迭代更新的部分数据方中，随机选取若干数据方，参与下一轮迭代更新。

在另一个更具体的实施例中，服务器中可以维护各个数据方对应的累计通信指标值，该累计通信指标值反映对应于已执行迭代更新轮次的综合通信，相应地，可以根据各个参与方所对应的累计通信指标值，选取参与下一轮迭代更新的部分数据方。

另一方面，还可以考虑利用强化学习、贪心算法，选取参与下一轮迭代更新的部分数据方。在一个实施例中，可以在本轮迭代更新中统计出的上述各个参与方对应的累计性能指标值和累积通信指标值，作为当前环境状态输入强化学习模型中，输出当前执行动作，即参与下一轮迭代更新的部分数据方，并且，获取环境给出的当前反馈。其中，当前环境状态、当前执行动作和当前反馈可以组成用于训练强化学习模型的训练样本。在一个具体的实施例中，该当前反馈可以是下一轮迭代更新中服务器接收到的多个性能指标值和/或多个通信指标值。在一个具体的实施例中，其中强化学习模型的实现可以基于Q-learning算法或Sarsa算法。在另一个实施例中，可以利用贪心算法从多个数据方中选取出一些数据方，再利用随机算法从剩余数据方中选取出若干数据方，共同作为参与下一轮迭代更新的部分数据方。

以上，可以选取出参与下一轮迭代更新的部分数据方，可以理解，上述步骤S410中选取参与本轮迭代更新的部分数据方与之类似。

综上，采用本说明书实施例披露的实现隐私保护的多方协同更新业务预测模型的方法，在每轮迭代更新中，服务器选取部分数据方作为该轮迭代更新的参与方，并且，参与的数据方从服务器中获取随机选取的部分模型参数，而非全量模型参数，进一步地，根据该部分模型参数进行训练更新，进而从更新后参数中选取至少一部分进行上传，如此可以大幅降低数据方与服务方之间的通信量，降低数据方本地训练模型的计算量，加快参数学习的收敛速度，有效防止参数过拟合，同时，使得恶意数据方无法通过下载多轮全量参数的方式反推隐私数据，从而有效保障各方数据的隐私安全。

与上述协同更新方法相对应的，本说明书实施例还披露若干种协同更新装置。具体如下：

图5示出本说明书实施例披露的一种实现隐私保护的多方协同更新业务预测模型的装置结构图。其中多方包括服务器和多个数据方，该服务器部署针对业务对象的业务预测模型，该装置500集成于该多个数据方中任意的第一数据方，该装置500用于对该业务预测模型进行多轮迭代更新，该装置500通过其包括的以下单元执行其中任一轮迭代更新：

部分参数获取单元510，配置为从上述服务器获取第一当前参数部分，该第一当前参数部分是基于上述业务预测模型的当前模型参数进行随机选取而得到。更新参数确定单元520，配置为利用本地训练数据，更新上述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分。更新参数发送单元530，配置为将上述第一更新参数部分发送至上述服务器，以使上述服务器根据上述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新上述业务预测模型的当前模型参数。

在一个实施例中，上述业务对象包括以下之一：用户，商户，商品，事件；上述业务预测模型用于预测上述业务对象的分类或回归值。

在一个实施例中，在一个实施例中，上述部分参数获取单元510包括：编号选取模块511，配置为从上述当前模型参数的参数编号中随机选取多个参数编号。参数请求模块512，配置为向上述服务器发送参数获取请求，其中包括上述多个参数编号。参数接收模块513，配置为从上述服务器接收具有上述多个参数编号的第一当前参数部分。

在一个具体的实施例中，上述服务器维护上述当前模型参数的排名，该排名根据预设的参数累计更新指标而确定，上述参数累计更新指标包括累计更新频次和/或累计变化量。其中编号选取模块511具体配置为：从排名靠前的名次区间中选取多个靠前名次，从排名靠后的名次区间中随机选取多个靠后名次，上述多个靠前名次的数量大于上述多个靠后名次的数量，上述多个靠前名次和多个靠后名次对应的参数编号构成上述多个参数编号。

在一个更具体的实施例中，上述第一数据方中存储迭代更新轮次和可获取参数数量之间的映射关系；其中编号选取模块511还配置为：根据上述映射关系，确定上述任一轮迭代更新的轮次所对应的当前可获取参数数量；确定第一数量和第二数量，使得其和值等于上述当前可获取参数数量，上述第一数量用于选取上述多个靠前名次，上述第二数量用于选取上述多个靠后名次。

在一个实施例中，其中更新参数确定单元520包括：参数更新模块521，配置为利用上述本地训练数据，更新上述第一当前参数部分，得到上述更新后参数。参数选取模块522，配置为从上述更新后参数中选取部分参数，作为上述第一更新参数部分。

在一个具体的实施例中，上述参数选取模块522，还配置为：根据上述第一数据方与上述服务器之间的当前通信情况，确定可上传参数数量，用于选取上述部分参数。

在一个具体的实施例中，上述参数更新模块521，具体配置为：利用上述本地训练数据，计算与上述第一当前参数部分对应的更新梯度；基于上述第一当前参数部分和上述更新梯度，得到上述更新后参数；

上述参数选取模块522，具体配置为：将上述更新后参数中，所对应更新梯度大于预定梯度阈值的参数，确定为上述部分参数；基于本地验证数据和预设的预测性能指标，确定上述更新后参数和部分参数各自对应的性能指标值；在两个性能指标值之间的差值小于相差阈值的情况下，将上述部分参数作为上述第一更新参数部分。

图6示出本说明书实施例披露的另一种实现隐私保护的多方协同更新业务预测模型的装置结构图，其中多方包括服务器和多个数据方，该服务器部署针对业务对象的业务预测模型，该装置600集成于该多个数据方中任意的第一数据方，该第一数据方参与对该业务预测模型进行多轮迭代更新中的若干轮，该装置600通过其包括的以下单元执行该若干轮中的任一轮迭代更新：

参与通知接收单元610，配置为从上述服务器接收参与本轮迭代更新的通知，上述通知被发送至上述多个数据方中的部分数据方；部分参数获取单元620，配置为根据上述通知，从上述服务器获取第一当前参数部分，该第一当前参数部分是基于上述业务预测模型的当前模型参数进行随机选取而得到；更新参数确定单元630，配置为利用本地训练数据，更新上述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；更新参数发送单元640，配置为将上述第一更新参数部分发送至上述服务器，以使上述服务器根据上述第一更新参数部分和从上述部分数据方中的其他数据方接收的其他更新参数部分，更新上述业务预测模型的当前模型参数。

在一个实施例中，该装置600还包括：

指标值确定单元650，配置为利用本地验证数据和预设的预测性能指标，确定上述第一更新参数部分的第一性能指标值。指标值发送单元660，配置为将上述第一性能指标值发送至上述服务器，以使上述服务器至少根据上述第一性能指标值和从上述其他数据方接收的其他性能指标值，从上述多个数据方中选取参与下一轮迭代更新的部分数据方。

图7示出本说明书实施例披露的又一种实现隐私保护的多方协同更新业务预测模型的装置结构图，其中多方包括服务器和多个数据方，该服务器部署针对业务对象的业务预测模型，该装置700集成于该服务器，该装置700用于对该业务预测模型进行多轮迭代更新，该装置700通过其包括的以下单元执行其中任一轮迭代更新：

部分参数发送单元710，配置为针对上述多个数据方中任意的第一数据方，向其发送第一当前参数部分，上述第一当前参数部分是基于上述业务预测模型的当前模型参数进行随机选取而得到；更新参数接收单元720，配置为从上述第一数据方接收上述第一更新参数部分，其由上述第一数据方通过利用本地训练数据更新上述第一当前参数部分而得到；模型更新单元730，配置为根据上述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新上述业务预测模型的当前模型参数。

在一个实施例中，上述装置700还包括：参数请求接收单元740，配置为从上述第一数据方接收参数获取请求，其中包括从上述当前模型参数的参数编号中随机选取的多个参数编号；参数确定单元750，配置为从上述当前模型参数中确定与上述多个参数编号对应的多个当前参数，作为上述第一当前参数部分。

在一个具体的实施中，上述服务器维护上述当前模型参数的排名，上述排名根据预设的参数累计更新指标而确定，上述参数累计更新指标包括累计更新频次和/或累计变化量。其中，上述多个参数编号对应从排名靠前的名次区间中选取的多个靠前名次，以及从排名靠后的名次区间中随机选取的多个靠后名次，上述多个靠前名次的数量大于上述多个靠后名次的数量。

在一个实施例中，上述模型更新单元730具体配置为：对于上述当前模型参数中的某个模型参数，从上述第一更新参数部分和上述其他更新参数部分中确定与之对应的若干更新后参数；将上述某个模型参数更新为上述若干更新后参数的平均值。

图8示出本说明书实施例披露的还一种实现隐私保护的多方协同更新业务预测模型的装置结构图，其中多方包括服务器和多个数据方，该服务器部署针对业务对象的业务预测模型，该装置800集成于该服务器，该装置800用于对该业务预测模型进行多轮迭代更新，该装置800通过其包括的以下单元执行其中任一轮迭代更新：

数据方选取单元810，配置为从所述多个数据方中选取参与本轮迭代更新的部分数据方；参与通知发送单元820，配置为针对所述部分数据方中任意的第一数据方，向其发送参与本轮迭代更新的通知；部分参数发送单元830，配置为向所述第一数据方发送第一当前参数部分，所述第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；更新参数接收单元840，配置为从所述第一数据方接收所述第一更新参数部分，其由所述第一数据方通过利用本地训练数据更新所述第一当前参数部分而得到；模型更新单元850，配置为根据所述第一更新参数部分和从所述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

在一个实施例中，该装置800还包括：

性能指标值接收单元860，配置为从所述第一数据方接收所述第一更新参数部分的第一性能指标值，其由所述第一数据方根据其本地验证数据和预设的预测性能指标而确定；下轮参与方选取单元870，配置为至少根据所述第一性能指标值和从所述其他数据方接收的其他性能指标值，从所述多个数据方中选取参与下一轮迭代更新的部分数据方。

在一个具体的实施例中，所述装置还包括：

通信指标值确定单元880，配置为根据预设的通信质量指标，以及所述第一更新参数部分对应的数据量和/或接收时长，确定所述第一数据方与所述服务器之间通信的第一通信指标值；上述下轮参与方选取单元870具体配置为：根据所述第一性能指标值、其他性能指标值、第一通信指标值和其他通信指标值，从所述多个数据方中选取参与下一轮迭代更新的部分数据方。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图3A、图3B或图4所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图3A、图3B或图4所述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种实现隐私保护的多方协同更新业务预测模型的方法，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述方法应用于所述多个数据方中任意的第一数据方，所述方法包括对所述业务预测模型进行多轮迭代更新，其中任一轮迭代更新包括：

从所述服务器获取第一当前参数部分；

利用本地训练数据，更新所述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；

将所述第一更新参数部分发送至所述服务器，以使所述服务器根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数；

其中，从所述服务器获取第一当前参数部分，包括：

根据迭代更新轮次和可获取参数数量之间的映射关系，获取所述任一轮迭代更新的轮次所对应的当前可获取参数数量，该映射关系的建立符合规则：随着迭代轮次的增加，可获取参数数量减少；

从所述业务预测模型的当前模型参数的参数编号中随机选取多个参数编号，该多个参数编号对应所述当前可获取参数数量；

向所述服务器发送参数获取请求，其中包括所述多个参数编号；

从所述服务器接收具有所述多个参数编号的第一当前参数部分。

2.根据权利要求1所述的方法，其中，所述业务对象包括以下之一：用户，商户，商品，事件；所述业务预测模型用于预测所述业务对象的分类或回归值。

3.根据权利要求1所述的方法，其中，所述服务器维护所述当前模型参数的排名，该排名根据预设的参数累计更新指标而确定，所述参数累计更新指标包括累计更新频次和/或累计变化量；

其中，从所述当前模型参数的参数编号中随机选取多个参数编号，包括：

从排名靠前的名次区间中选取多个靠前名次，从排名靠后的名次区间中随机选取多个靠后名次，所述多个靠前名次的数量大于所述多个靠后名次的数量，所述多个靠前名次和多个靠后名次对应的参数编号构成所述多个参数编号。

4.根据权利要求3所述的方法，其中从所述当前模型参数的参数编号中随机选取多个参数编号，还包括：

确定第一数量和第二数量，使得其和值等于所述当前可获取参数数量，所述第一数量用于选取所述多个靠前名次，所述第二数量用于选取所述多个靠后名次。

5.根据权利要求1所述的方法，其中，利用本地训练数据，更新所述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分，包括：

利用所述本地训练数据，更新所述第一当前参数部分，得到所述更新后参数；

从所述更新后参数中选取部分参数，作为所述第一更新参数部分。

6.根据权利要求5所述的方法，其中，从所述更新后参数中选取部分参数，作为所述第一更新参数部分，还包括：

根据所述第一数据方与所述服务器之间的当前通信情况，确定可上传参数数量，用于选取所述部分参数。

7.根据权利要求5所述的方法，其中，利用所述本地训练数据，更新所述第一当前参数部分，得到所述更新后参数，包括：

利用所述本地训练数据，计算与所述第一当前参数部分对应的更新梯度；

基于所述第一当前参数部分和所述更新梯度，得到所述更新后参数；

其中，从所述更新后参数中选取部分参数，作为所述第一更新参数部分，包括：

将所述更新后参数中，所对应更新梯度大于预定梯度阈值的参数，确定为所述部分参数；

基于本地验证数据和预设的预测性能指标，确定所述更新后参数和部分参数各自对应的性能指标值；

在两个性能指标值之间的差值小于相差阈值的情况下，将所述部分参数作为所述第一更新参数部分。

8.一种实现隐私保护的多方协同更新业务预测模型的方法，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述方法应用于所述多个数据方中任意的第一数据方，所述第一数据方参与对所述业务预测模型进行多轮迭代更新中的若干轮，该若干轮中的任一轮迭代更新包括：

从所述服务器接收参与本轮迭代更新的通知，所述通知被发送至所述多个数据方中的部分数据方；

根据所述通知，从所述服务器获取第一当前参数部分，该第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；

将所述第一更新参数部分发送至所述服务器，以使所述服务器根据所述第一更新参数部分和从所述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数；

其中，从所述服务器获取第一当前参数部分，包括：

从所述当前模型参数的参数编号中随机选取多个参数编号，该多个参数编号对应所述当前可获取参数数量；

9.根据权利要求8所述的方法，其中，在得到第一更新参数部分之后，所述方法还包括：

利用本地验证数据和预设的预测性能指标，确定所述第一更新参数部分的第一性能指标值；

将所述第一性能指标值发送至所述服务器，以使所述服务器至少根据所述第一性能指标值和从所述其他数据方接收的其他性能指标值，从所述多个数据方中选取参与下一轮迭代更新的部分数据方。

10.一种实现隐私保护的多方协同更新业务预测模型的方法，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述方法应用于所述服务器，所述方法包括对所述业务预测模型进行多轮迭代更新，其中任一轮迭代更新包括：

从所述多个数据方中任意的第一数据方接收参数获取请求，其中包括从所述业务预测模型的当前模型参数的参数编号中随机选取的多个参数编号，该多个参数编号与所述任一轮迭代更新的轮次所对应的当前可获取参数数量相对应，该当前可获取参数数量基于迭代更新轮次和可获取参数数量之间的映射关系而确定，该映射关系的建立符合规则：随着迭代轮次的增加，可获取参数数量减少；

从所述当前模型参数中确定与所述多个参数编号对应的多个当前参数，作为第一当前参数部分；

向所述第一数据方发送所述第一当前参数部分；

从所述第一数据方接收第一更新参数部分，其由所述第一数据方通过利用本地训练数据更新所述第一当前参数部分而得到；

根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数。

11.根据权利要求10所述的方法，其中，所述业务对象包括以下之一：用户，商户，商品，事件；所述业务预测模型用于预测所述业务对象的分类或回归值。

12.根据权利要求10所述的方法，其中，在针对所述多个数据方中任意的第一数据方，向其发送第一当前参数部分之前，所述方法还包括：

从所述第一数据方接收参数获取请求，其中包括从所述当前模型参数的参数编号中随机选取的多个参数编号；

从所述当前模型参数中确定与所述多个参数编号对应的多个当前参数，作为所述第一当前参数部分。

13.根据权利要求12所述的方法，其中，所述服务器维护所述当前模型参数的排名，所述排名根据预设的参数累计更新指标而确定，所述参数累计更新指标包括累计更新频次和/或累计变化量；

其中，所述多个参数编号对应从排名靠前的名次区间中选取的多个靠前名次，以及从排名靠后的名次区间中随机选取的多个靠后名次，所述多个靠前名次的数量大于所述多个靠后名次的数量。

14.根据权利要求10所述的方法，其中，根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数，包括：

对于所述当前模型参数中的某个模型参数，从所述第一更新参数部分和所述其他更新参数部分中确定与之对应的若干更新后参数；

将所述某个模型参数更新为所述若干更新后参数的平均值。

15.一种实现隐私保护的多方协同更新业务预测模型的方法，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述方法应用于所述服务器，所述方法包括对所述业务预测模型进行多轮迭代更新，其中任一轮迭代更新包括：

从所述多个数据方中选取参与本轮迭代更新的部分数据方；

针对所述部分数据方中任意的第一数据方，向其发送参与本轮迭代更新的通知；

向所述第一数据方发送第一当前参数部分，所述第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；

根据所述第一更新参数部分和从所述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数；

从所述第一数据方接收所述第一更新参数部分的第一性能指标值，其由所述第一数据方根据其本地验证数据和预设的预测性能指标而确定；

根据所述第一性能指标值和从所述其他数据方接收的其他性能指标值，确定所述部分数据方中各个数据方的累计性能指标值；

根据预设的通信质量指标，以及所述第一更新参数部分对应的数据量和/或接收时长，确定所述第一数据方与所述服务器之间通信的第一通信指标值；

根据所述第一通信指标值和从所述其他数据方接收的其他通信指标值，确定所述部分数据方中各个数据方的累计通信指标值；

将所述各个数据方的累计性能指标值和累计通信指标值作为当前环境状态输入强化学习模型中，输出当前执行动作，该当前执行动作为参与下一轮迭代更新的部分数据方，并且，获取环境给出的当前反馈，该当前反馈是下一轮迭代更新中服务器接收到的多个性能指标值和多个通信指标值；其中，所述当前环境状态、当前执行动作和当前反馈组成用于训练所述强化学习模型的训练样本。

16.一种实现隐私保护的多方协同更新业务预测模型的装置，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述装置集成于所述多个数据方中任意的第一数据方，所述装置用于对所述业务预测模型进行多轮迭代更新，所述装置通过其包括的以下单元执行其中任一轮迭代更新：

部分参数获取单元，配置为从所述服务器获取第一当前参数部分；

更新参数确定单元，配置为利用本地训练数据，更新所述第一当前参数部分，基于更新后参数的至少一部分，得到第一更新参数部分；

更新参数发送单元，配置为将所述第一更新参数部分发送至所述服务器，以使所述服务器根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数；

其中，所述部分参数获取单元具体配置为：

17.一种实现隐私保护的多方协同更新业务预测模型的装置，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述装置集成于所述多个数据方中任意的第一数据方，所述第一数据方参与对所述业务预测模型进行多轮迭代更新中的若干轮，所述装置通过其包括的以下单元执行该若干轮中的任一轮迭代更新：

参与通知接收单元，配置为从所述服务器接收参与本轮迭代更新的通知，所述通知被发送至所述多个数据方中的部分数据方；

部分参数获取单元，配置为根据所述通知，从所述服务器获取第一当前参数部分；

更新参数发送单元，配置为将所述第一更新参数部分发送至所述服务器，以使所述服务器根据所述第一更新参数部分和从所述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数；

其中，所述部分参数获取单元具体配置为：

18.一种实现隐私保护的多方协同更新业务预测模型的装置，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述装置集成于所述服务器，所述装置用于对所述业务预测模型进行多轮迭代更新，所述装置通过其包括的以下单元执行其中任一轮迭代更新：

部分参数发送单元，配置为针对所述多个数据方中任意的第一数据方，向其发送第一当前参数部分；

更新参数接收单元，配置为从所述第一数据方接收第一更新参数部分，其由所述第一数据方通过利用本地训练数据更新所述第一当前参数部分而得到；

模型更新单元，配置为根据所述第一更新参数部分和从其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数；

其中，所述部分参数发送单元具体配置为：

从所述当前模型参数中确定与所述多个参数编号对应的多个当前参数，作为第一当前参数部分。

19.一种实现隐私保护的多方协同更新业务预测模型的装置，所述多方包括服务器和多个数据方，所述服务器部署针对业务对象的业务预测模型，所述装置集成于所述服务器，所述装置用于对所述业务预测模型进行多轮迭代更新，所述装置通过其包括的以下单元执行其中任一轮迭代更新：

数据方选取单元，配置为从所述多个数据方中选取参与本轮迭代更新的部分数据方；

参与通知发送单元，配置为针对所述部分数据方中任意的第一数据方，向其发送参与本轮迭代更新的通知；

部分参数发送单元，配置为向所述第一数据方发送第一当前参数部分，所述第一当前参数部分是基于所述业务预测模型的当前模型参数进行随机选取而得到；

模型更新单元，配置为根据所述第一更新参数部分和从所述部分数据方中的其他数据方接收的其他更新参数部分，更新所述业务预测模型的当前模型参数；

其中，所述数据方选取单元还配置为：

20.一种计算机可读存储介质，其上存储有计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-15中任一项的所述的方法。

21.一种计算设备，包括存储器和处理器，其中，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-15中任一项所述的方法。