CN111260061A

CN111260061A - 联邦学习梯度交换中的差异化加噪方法及系统

Info

Publication number: CN111260061A
Application number: CN202010157458.3A
Authority: CN
Inventors: 范晓亮; 龚盛豪; 代明亮; 俞容山; 王程
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2020-03-09
Filing date: 2020-03-09
Publication date: 2020-06-09
Anticipated expiration: 2040-03-09
Also published as: CN111260061B

Abstract

本发明公开了一种联邦学习梯度交换中的差异化加噪方法、介质及系统，其中方法包括：多个数据方分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新深度学习模型的梯度；每个数据方将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器；中心服务器对加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方，以便每个数据方根据聚合后的梯度对本地深度学习模型进行更新；能够提高联邦学习的数据交换过程中隐私的保护强度，同时，相较于传统联邦学习中加密算法，可以降低数据传输的开销。

Description

联邦学习梯度交换中的差异化加噪方法及系统

技术领域

本发明涉及深度学习技术领域，特别涉及一种联邦学习梯度交换中的差异化加噪方法、一种计算机可读存储介质以及一种联邦学习梯度交换中的差异化加噪系统。

背景技术

在进行数据共享和分布式深度学习的过程中，往往存在数据隐私泄露的问题。为了解决这一问题，多采用联邦学习方法，以减少数据交换过程中的隐私泄露。

相关技术中，在使用梯度更新算法的过程中，往往存在隐私保护强度不高的问题；而为了加强隐私保护的强度，通常采用同态加密方法，而这一方法在深度学习的场景中，将会使得原本就庞大的梯度数据再度扩大，进而带来巨大的数据传输开销。

发明内容

本发明旨在至少在一定程度上解决上述技术中的技术问题之一。为此，本发明的一个目的在于提出一种联邦学习梯度交换中的差异化加噪方法，能够提高联邦学习的数据交换过程中隐私的保护强度，同时，降低数据传输的开销。

本发明的第二个目的在于提出一种计算机可读存储介质。

本发明的第三个目的在于提出一种联邦学习梯度交换中的差异化加噪系统。

为达到上述目的，本发明第一方面实施例提出了一种联邦学习梯度交换中的差异化加噪方法，包括以下步骤：多个数据方分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新所述深度学习模型的梯度；每个数据方将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据所述二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器；所述中心服务器对所述加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方，以便每个数据方根据所述聚合后的梯度对本地深度学习模型进行更新。

根据本发明实施例的联邦学习梯度交换中的差异化加噪方法，首先，多个数据方分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新深度学习模型的梯度；接着，每个数据方将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器；然后，中心服务器对加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方，以便每个数据方根据聚合后的梯度对本地深度学习模型进行更新；从而实现提高联邦学习的数据交换过程中隐私的保护强度，同时，降低数据传输的开销。

另外，根据本发明上述实施例提出的联邦学习梯度交换中的差异化加噪方法还可以具有如下附加的技术特征：

可选地，所述深度学习模型的损失函数设置为：

L_ij(θ_i,x_j),x_j∈D_i且j＝1,…,c_i

其中，θ_i表示网络参数，x_j表示训练数据，D_i表示训练数据集，c_i表示训练数据集包含的数据总数。

可选地，所述深度学习模型的梯度通过以下公式计算：

其中，L_i(θ_i)表示平均损失，G_i表示梯度。

可选地，根据以下公式对每一层梯度进行加噪处理：

G_i＝{g₁,g₂,…,g_n}

其中，G_I表示加噪后的梯度，G_i表示梯度，g_n表示第n层梯度的值，N表示数据方的总数，||g_n||₂表示第n层梯度对应的二范数。

可选地，根据以下公式对加噪后的梯度进行聚合：

其中，ω_i表示数据方对应的梯度权重，c_i表示训练数据集包含的数据总数，N表示数据方的总数，

表示所有加噪后的梯度的加权平均值，G_I表示加噪后的梯度。

为达到上述目的，本发明第二方面实施例提出了一种计算机可读存储介质，其上存储有联邦学习梯度交换中的差异化加噪程序，该联邦学习梯度交换中的差异化加噪程序被处理器执行时实现如上述的联邦学习梯度交换中的差异化加噪方法。

根据本发明实施例的计算机可读存储介质，通过存储联邦学习梯度交换中的差异化加噪程序，以使得处理器在执行该联邦学习梯度交换中的差异化加噪程序时，实现如上述的联邦学习梯度交换中的差异化加噪方法，从而实现提高联邦学习的数据交换过程中隐私的保护强度，同时，降低数据传输的开销。

为达到上述目的，本发明第三方面实施例提出了一种联邦学习梯度交换中的差异化加噪系统，包括：多个数据方，多个数据方用于分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新所述深度学习模型的梯度；每个数据方还用于将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据所述二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器；中心服务器，所述中心服务器用于对所述加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方，以便每个数据方根据所述聚合后的梯度对本地深度学习模型进行更新。

根据本发明实施例的联邦学习梯度交换中的差异化加噪系统，通过设置多个数据方用于分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新深度学习模型的梯度；每个数据方还用于将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器；中心服务器用于对加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方，以便每个数据方根据聚合后的梯度对本地深度学习模型进行更新；从而实现提高联邦学习的数据交换过程中隐私的保护强度，同时，降低数据传输的开销。

另外，根据本发明上述实施例提出的联邦学习梯度交换中的差异化加噪系统还可以具有如下附加的技术特征：

可选地，所述深度学习模型的损失函数设置为：

L_ij(θ_i,x_j),x_j∈D_i且j＝1,…,c_i

可选地，所述深度学习模型的梯度通过以下公式计算：

其中，L_i(θ_i)表示平均损失，G_i表示梯度。

可选地，根据以下公式对每一层梯度进行加噪处理：

G_i＝{g₁,g₂,…,g_n}

附图说明

图1为根据本发明实施例的联邦学习梯度交换中的差异化加噪方法的流程示意图；

图2为根据本发明实施例的联邦学习梯度交换中的差异化加噪系统的方框示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

相关技术中，在联邦学习过程中使用梯度更新算法时，往往存在隐私保护强度不高的问题，且容易带来巨大的数据传输开销的问题，根据本发明实施例的联邦学习梯度交换中的差异化加噪方法，首先，多个数据方分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新深度学习模型的梯度；接着，每个数据方将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器；然后，中心服务器对加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方，以便每个数据方根据聚合后的梯度对本地深度学习模型进行更新；从而实现提高联邦学习的数据交换过程中隐私的保护强度，同时，降低数据传输的开销。

为了更好的理解上述技术方案，下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

图1为根据本发明实施例的联邦学习梯度交换中的差异化加噪方法的流程示意图，如图1所示，该联邦学习梯度交换中的差异化加噪方法包括以下步骤：

S101，多个数据方分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新深度学习模型的梯度。

也就是说，在联邦学习方法中，存在多个数据方，每个数据方分别获取自身能够采集的训练数据集，并且，将获取到的训练数据集输入到本地深度学习模型进行训练，以对深度学习模型的梯度进行更新。

作为一种示例，每个数据方在获取到数据之后，各自对获取到的数据进行处理，以形成训练数据集D_i＝{x₁,x₂,…,x_ci}；接着，每个数据方对本地的深度神经网络进行初始化，即言，首先，将深度学习模型初始化为M_i＝(θ_i,G_i)，其中，θ_i为网络参数，g_i为用于更新参数的梯度；然后，根据损失函数计算当前模型的预测值与实际值之间的差距接着，根据损失函数的计算结果计算平均损失，并根据平均损失计算梯度，以对深度学习模型的梯度进行更新。

其中，损失函数的设置方式可以有多种。

作为一种示例，深度学习模型的损失函数设置为：

L_ij(θ_i,x_j),x_j∈D_i且j＝1,…,c_i

其中，梯度的计算方式可以有多种。

作为一种示例，深度学习模型的梯度通过以下公式计算：

其中，L_i(θ_i)表示平均损失，G_i表示梯度。

S102，每个数据方将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器。

即言，每个数据方在计算得到自身对应的梯度之后，首先，对梯度进行分层处理，以得到多层的梯度；接着，对每一层梯度所对应的二范数进行计算，并根据二范数对相应层级的梯度进行加噪，然后，将加噪后的梯度发送给中心服务器；从而，通过在梯度交换过程中加入噪声，以替代传统的同态加密方法，可以提高隐私保护效果，同时，避免了加密算法带来的数据传输开销。

其中，对梯度进行加噪的方式可以有多种。

作为一种示例，根据以下公式对每一层梯度进行加噪处理：

G_i＝{g₁,g₂,…,g_n}

即言，首先，在计算得到梯度之后，对梯度G_i按照深度神经网络的层进行划分，可得到分层结果G_i＝{g₁,g₂,…,g_n}，n表示深度神经网络的总层数；接着，对于

计算其二范数||g_k||₂；然后，根据二范数计算每一层梯度所对应的噪声

以便根据计算结果对每一层梯度进行加噪，从而，通过对每层梯度进行差异化的加噪，可以使得加入的噪声大小适应每一层梯度的需求，避免过度加噪而导致的梯度失真问题，进而可以提高深度学习模型的准确性。

S103，中心服务器对加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方，以便每个数据方根据聚合后的梯度对本地深度学习模型进行更新。

即言，中心服务器在接收到各数据方发送的加噪后的梯度之后，对接收到的加噪后的梯度进行聚合处理，并将聚合后的梯度发送给每个数据方；从而，每个数据方在接收到聚合后的梯度之后，可以对深度学习模型进行更新，以完成梯度交换的过程。

其中，对加噪后的梯度进行聚合的方式可以有多种。

作为一种示例，可以将迭代的次数作为权重进行加噪后的梯度的聚合，或者，将数据总量作为权重进行加噪后的梯度的聚合。

作为另一种示例，根据以下公式对加噪后的梯度进行聚合：

需要说明的是，每个数据方在接收到聚合后的梯度并根据其对本地深度学习模型进行更新之后，还可以通过本地存储的测试数据对更新后的深度学习模型进行验证；以判断当前深度学习模型是否已达到训练目标，如果是，则结束该数据方的训练；如果否，则继续进行训练与迭代，直至深度学习模型的测试结果达到训练目标。

综上所述，根据本发明实施例的联邦学习梯度交换中的差异化加噪方法，首先，多个数据方分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新深度学习模型的梯度；接着，每个数据方将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器；然后，中心服务器对加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方，以便每个数据方根据聚合后的梯度对本地深度学习模型进行更新；从而实现提高联邦学习的数据交换过程中隐私的保护强度，同时，降低数据传输的开销。

为了实现上述实施例，本发明实施例还提出了一种计算机可读存储介质，其上存储有联邦学习梯度交换中的差异化加噪程序，该联邦学习梯度交换中的差异化加噪程序被处理器执行时实现如上述的联邦学习梯度交换中的差异化加噪方法。

为了实现上述实施例，本发明实施例还提出了一种联邦学习梯度交换中的差异化加噪系统，如图2所示，该联邦学习梯度交换中的差异化加噪系统包括：多个数据方10和中心服务器20。

其中，多个数据方10用于分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新深度学习模型的梯度；

每个数据方10还用于将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器20；

中心服务器20用于对加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方10，以便每个数据方10根据聚合后的梯度对本地深度学习模型进行更新。

在一些实施例中，深度学习模型的损失函数设置为：

L_ij(θ_i,x_j),x_j∈D_i且j＝1,…,c_i

在一些实施例中，深度学习模型的梯度通过以下公式计算：

其中，L_i(θ_i)表示平均损失，G_i表示梯度。

在一些实施例中，根据以下公式对每一层梯度进行加噪处理：

G_i＝{g₁,g₂,…,g_n}

综上所述，根据本发明实施例的联邦学习梯度交换中的差异化加噪系统，通过设置多个数据方用于分别获取对应的训练数据集，并分别根据对应的训练数据集对深度学习模型进行训练，以更新深度学习模型的梯度；每个数据方还用于将对应的梯度进行分层处理，并计算每一层梯度对应的二范数，以及根据二范数对每一层梯度进行加噪，并将加噪后的梯度发送至中心服务器；中心服务器用于对加噪后的梯度进行聚合，并将聚合后的梯度发送给每个数据方，以便每个数据方根据聚合后的梯度对本地深度学习模型进行更新；从而实现提高联邦学习的数据交换过程中隐私的保护强度，同时，降低数据传输的开销。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

应当注意的是，在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

在本发明的描述中，需要理解的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不应理解为必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。