CN113688387A

CN113688387A - 基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法

Info

Publication number: CN113688387A
Application number: CN202110872091.8A
Authority: CN
Inventors: 陈洁; 陈昂
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2021-11-23
Anticipated expiration: 2041-07-30
Also published as: CN113688387B

Abstract

本发明公开了一种基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法，其特点是在服务器不访问客户端训练数据的前提下，通过获取客户端正常进行联邦学习模型训练与模拟中毒攻击下的联邦学习模型训练的结果，作为中毒攻击检测器的训练数据集，从而为每个客户端训练一个中毒攻击检测器。服务器根据中毒攻击检测器的结果，选出可疑客户端和可信客户端，再通过综合可信客户端对可疑客户端的评分，来完成中毒攻击检测，从而降低了服务器端异常检测的误报率。本发明能在保证准确率的前提下高效地完成联邦学习背景下的中毒攻击检测。

Description

基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法

技术领域

本发明涉及人工智能技术领域，具体而言，涉及联邦学习中的中毒攻击的防御方法。

背景技术

联邦学习是在人工智能发展下提出的一种新的计算架构。它通过加密机制下的参数交换方式，做到了各个参与方不共享训练数据的情况下学习全局预测模型，避免了分散在多个客户端上的敏感数据的隐私泄露。在联邦学习中，服务器维护一个全局模型；客户端下载当前全局模型后，根据本地数据的训练后计算更新模型，然后将更新返回给服务器；服务器聚合所有客户端的更新结果后，生成一个新的全局模型。

在传统的机器学习中，攻击者可以通过改变训练数据的标签、修改数据、将设计良好的参数注入训练模型来实现中毒攻击。然而，由于联邦学习中训练数据在各个参与方本地，其他参与方无法访问及训练的模型结构由服务器定义且公开的特性，所以上述方法无法在联邦学习中实现。然而，这并不意味着联邦学习不会遭受到中毒攻击。攻击者可以通过创建脏标签数据进行本地训练后，生成模型更新结果或者直接精心制作一份更新的结果上传给服务器以毒害全局模型，从而削弱全局模型的训练效果。

目前，联邦学习中的中毒攻击检测方法比较有限。由于联邦学习中服务器无法访问客户端训练数据，因此，人们认为利用可信数据来训练异常检测器、识别与类相关的特征来检测客户端中的中毒攻击的方法是不可行的。因此，目前的方法主要基于观察各个客户端的更新。使用k-means算法对客户端更新进行聚类进行中毒攻击检测的方法需要假设攻击者每一轮都执行攻击，且已被证明单轮攻击有效。检查更新的余弦相似度的方法已被证明不能防御单个恶意客户端。因此，如何稳定准确地检测出恶意客户端的中毒攻击，是目前联邦学习中的一个难题。

发明内容

本发明的目的是为了解决联邦学习中恶意客户端上传恶意更新参数来削弱全局模型效果的问题，探索了一种服务器在不访问客户端训练数据的前提下，训练异常检测器的方法。同时，本发明还添加了可信客户端评分的过程，降低了服务器端异常检测的误报率，从而提供了一种高效、准确的基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法，克服了传统k-means算法需要假设攻击者每一轮都执行攻击的弊端，并且能有效防御单个恶意客户端。

本发明的目的是这样实现的：

一种基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法，服务器在不访问客户端训练数据的前提下，为每个参与联邦学习的客户端维护一个中毒攻击检测模型，并结合可信客户端的评分来检测中毒攻击；特点是所述方法包括以下步骤：

步骤1：中毒攻击检测模型训练

服务器为每个客户端初始化一个用于中毒攻击检测的二分类模型，接收各个客户端提供的训练参数，针对每个客户端训练一个中毒攻击检测模型；

步骤2：服务器端中毒攻击检测

服务器用步骤1所述中毒攻击检测模型对对应的客户端进行中毒攻击概率预测，将客户端分为可疑客户端和正常客户端；特别地，将正常客户端中中毒攻击概率较低的客户端标记为可信客户端；

步骤3：可信客户端评分

可信客户端接收可疑客户端的更新参数，并根据服务器端制定的评分规则对接收到的可疑客户端进行评分；服务器综合所有可信客户端的评分对可疑客户端是否为中毒攻击客户端进行判断；

步骤4：联邦学习聚合

服务器丢弃被判定为中毒攻击客户端的模型更新参数，只将正常客户端的模型更新参数进行聚合，从而实现了中毒攻击的防御，并完成联邦学习模型的更新。

步骤1所述训练一个中毒攻击检测模型，具体包括下述步骤：

步骤A1：设有N个客户端C＝{C₁，C₂，...，C_n}，服务器为每个客户端初始化一个相同的用于中毒攻击检测的二分类模型G＝{G₁，G₂，...，G_n}；其中，所述二分类模型为使用sigmoid函数作为激活函数的逻辑回归模型，该模型由sigmoid函数输出客户端为中毒攻击的概率；

步骤A2：每个客户端使用本地数据集训练参与联邦学习的模型G_task，得到正确的模型更新参数；需要说明的是，在联邦学习中，模型G_task在系统初始化时由客户端和服务器共同生成；具体而言，首先由服务器发送建模任务，寻求参与客户端；客户端数据持有方根据自身需求，提出联合建模设想；在与其他合作数据持有方达成协议后，联合建模设想被确立，各数据持有方进入联合建立模型G_task的过程，由服务器向各数据持有方发布模型G_task的初始参数；模型G_task随着联邦学习的聚合过程而不断更新；设客户端i得到的正确的模型更新参数为Up_itrue；

步骤A3：每个客户端根据本地数据集，随机生成一些错误标签的数据集，用这些错误标签数据训练联邦学习的模型G_task，模拟中毒攻击，得到中毒的更新参数；设客户端i得到的正确的模型更新参数为Up_ifalse；

步骤A4：服务器接收客户端的正确和错误的模型更新参数对，得到数据集Up＝{UP_1true，Up_1false，...，Up_ntrue，Up_nfalse}；

步骤A5：服务器初始化一个同步骤A1的二分类模型，按顺序每次输入一个更新参数对中的两个数据作为训练数据进行中毒攻击检测模型的训练，并记录下训练后的模型结果，记为{p₁，p₂，...，p_n}；

步骤A6：服务器重新初始化一个同步骤A1的二分类模型，逆序每次输入一个更新参数对中的两个数据作为训练数据进行中毒攻击检测模型的训练，并记录下训练后的模型结果，记为{p_rn，p_rn-1，...，p_r1}；

步骤A7：根据步骤A5和步骤A6的结果，为每个客户端聚合生成一个中毒攻击检测模型；对于客户端C₁，其最终的中毒攻击检测模型G₁的参数即为p_r2；对于客户端C_n，其最终的中毒攻击检测模型G_n的参数即为p_n-1；对于客户端C_i，(1＜i＜n)，服务器将参数p_i-1和p_ri+1聚合，即可得到其最终的中毒攻击检测模型G_i的参数。

所述步骤2具体包括下述步骤：

步骤B1：服务器用每个客户端对应的检测模型，将对应客户端在步骤A2中所得到的正确的更新参数作为输入，得到各客户端为中毒攻击的概率，记为Output＝{Output₁，Output₂，...，Output_n}；

步骤B2：服务器端设定可疑客户端的阈值y₁，对于每个客户端C_i，(1＜i＜n)，服务器比较中毒攻击检测模型G_i的输出值Output_i和y₁；若中毒攻击概率值Output_i大于阈值y₁，服务器将客户端i标记为可疑客户端；若中毒攻击概率值Output_i小于阈值y₁，服务器将客户端i标记为正常客户端；

步骤B3：服务器端设定可信客户端的阈值y₂，对于正常客户端j，服务器比较中毒攻击检测模型G_j的输出值Output_j和y₂；若中毒攻击概率值Output_j大于阈值y₂，服务器对客户端j不做任何操作；若中毒攻击概率值Output_j小于阈值y₂，服务器将客户端j标记为正常客户端中的可信客户端。

所述步骤3具体包括下述步骤：

步骤C1：服务器端制定可信客户端对可疑客户端更新参数的评分规则；所述评分规则如下：服务器设定阈值y₃，若可信客户端在本地数据集下运行模型G_task得到的预测准确率高于y₃，则评分为1；若可信客户端在本地数据集下运行模型G_task得到的预测准确率低于y₃，则评分为0；

步骤C2：可信客户端接收服务器下发的可疑客户端的更新参数，选取本地数据集，按照规则对可疑模型依次进行评分；

步骤C3：服务器聚合各个可信客户端的评分结果，对每个可疑客户端进行判定；聚合过程为：

采用公式(1)计算可疑客户端k的最终评分：

其中，Score_k为可疑客户端k的最终评分，Grade_i[k]表示第i个可信客户端对可疑客户端k的评分，m表示可信客户端的总数；

判定过程为：

服务器设定阈值y4，若可疑客户端k的最终评分Score_k大于y₄，服务器将可疑客户端k标记为正常客户端；若可疑客户端k的最终评分Score_k小于y₄，服务器将可疑客户端k标记为中毒攻击客户端。

本发明与现有技术相比，具有如下的有益效果：

本发明在服务器不访问训练数据的前提下，在服务器端维护了一个中毒攻击检测模型，提高了针对多个客户端中毒攻击检测的效率。同时，构建了客户端的评分系统，根据服务器中毒攻击检测模型的输出概率，将客户端分为正常客户端和可疑客户端，通过综合所有正常客户端对每个可疑客户端的评分，来最终判定客户端是否恶意，有效减少了服务器端中毒攻击检测模型的误判，从而在高效的同时，保证了中毒攻击检测的准确性。同时，与传统的方法相比，本发明不需要假设攻击者每一轮都执行攻击，并且能够有效防御单个恶意客户端。

附图说明

图1为本发明实施例提供的经过基于服务器和客户端双重中毒攻击检测的联邦学习流程示意图；

图2为本发明提供的一种联邦学习中毒攻击检测模型训练示意图；

图3为本发明提供的中毒攻击检测结构示意图；

图4为本发明提供的可信客户端评分流程示意图；

图5为本发明提供的中毒攻击评分完成后联邦学习模型结构示意图。

具体实施方式

下面结合实施例和附图对本发明的技术方案作进一步详细说明，但本发明的实施方式不限于此。

本发明的一种基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法，其特点是在服务器聚合联邦学习模型之前，为每个客户端训练一个中毒攻击检测模型，并用该模型预测客户端上传的更新为恶意更新的概率，再根据可信客户端对疑似恶意客户端的评分进行综合评估。具体包括以下步骤：

步骤1：客户端用本地数据集训练参与联邦学习的模型，并保留正确的更新参数；

步骤2：客户端用错误标签数据重新训练联邦学习的模型，模拟中毒攻击，得到错误的更新参数；

步骤3：服务器接收客户端的正确和错误的模型更新参数，针对每个客户端训练中毒攻击检测模型；

步骤4：服务器用每个客户端对应的检测模型，将该客户端在步骤1中所得到的正确的更新参数作为输入，得到其为中毒攻击的概率；

步骤5：服务器根据步骤4所得到的概率将客户端分为可疑客户端和正常客户端。特别地，服务器将正常客户端中中毒攻击概率较低的客户端标记为可信客户端；

步骤6：服务器将可疑客户端的更新参数下发给可信客户端，可信客户端根据接收的参数所组成的模型在本地数据集上的效果进行评分；

步骤7：服务器综合各个客户端的评分，对各个客户端进行中毒攻击评估，对于评分低的客户端，丢弃其更新参数，从而实现了联邦学习中毒攻击的防御。

所述步骤3中每个客户端的中毒攻击检测模型可以通过下述步骤构建：

步骤A1：设有N个客户端C＝{C₁，C₂，...，C_n}，服务器接收这N个客户端经过步骤1和步骤2得到的正确更新参数和错误更新参数对，形成集合U＝{(U_1true，U_1false)，(U_2true，U_2false)...，(U_ntrue，U_nfalse)}；

步骤A2：服务器用除(U_itrue，U_ifalse)之外的参数对为客户端C_i训练一个中毒攻击检测器。该步骤可通过以下方法进行效率优化：

步骤B1：服务器初始化一个用于中毒攻击检测的二分类模型，按顺序每次输入一个更新参数对中的两个数据作为训练数据进行中毒攻击检测模型的训练，并记录下训练后的模型结果，记为{p₁，p₂，...，p_n}；

步骤B2：服务器重新初始化一个用于中毒攻击检测的二分类模型，用同样的检测模型重新训练，逆序每次输入一个更新参数对中的两个数据作为训练数据，并记录下训练后的模型结果，记为{p_rn，p_rn-1，...，p_r1}；

步骤B3：对于客户端C₁，最终的中毒攻击检测模型的参数即为p_r2；对于客户端C_n，最终的中毒攻击检测模型的参数即为p_n-1；对于客户端C_i，服务器将参数p_i-1和p_ri+1聚合，即可得到最终的中毒攻击检测模型的参数。此时，即可得到每个客户端的中毒攻击检测模型，记为G＝{G₁，G₂，...，G_n}。

实施例

图1为本实施例提供的一种经过基于服务器和客户端双重中毒攻击检测的联邦学习流程示意图。本发明的主要思想是在进行联邦学习全局模型训练之前，客户端和服务器一同构建中毒攻击检测模型，根据该模型在最后的分类器层输出的中毒攻击的概率来对客户端上传的模型更新进行评估，再由评估为正常的客户端对评估为可疑的客户端进行评分。最终，由服务器综合各个正常客户端的评分来完成最后的判定。

本实施例的基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法具体实现过程如下：

(1)中毒攻击检测模型训练过程

图2为本实施例提供的中毒攻击检测模型训练的结构示意图。如图2所示，实施例提供的联邦学习背景下的中毒攻击检测模型的训练包括参与联邦学习的n个客户端：客户端1、客户端2、……、客户端n，一个可信的服务器。实施例提供的联邦学习中毒攻击检测模型的训练包括以下步骤：

步骤1：服务器端选取一种二分类模型，如使用sigmoid函数作为激活函数的逻辑回归模型，为每个客户端初始化一个中毒攻击检测训练模型；

步骤2：每个客户端使用本地数据集训练参与联邦学习的模型，得到正确的模型更新参数。设客户端i得到的正确的模型更新参数为Up_itrue；

步骤3：每个客户端根据本地数据集，随机生成一些错误标签的数据集，用这些错误标签数据训练联邦学习的模型，模拟中毒攻击，得到中毒的更新参数。设客户端i得到的正确的模型更新参数为Up_ifalse；

步骤4：服务器接收客户端的正确和错误的模型更新参数，针对每个客户端训练中毒攻击检测模型。具体地，可通过如下步骤来提升所有客户端中毒攻击检测模型的生成效率：

步骤A1：服务器初始化一个步骤1中所使用的二分类模型，按顺序每次输入一个更新参数对中的两个数据作为训练数据进行中毒攻击检测模型的训练，并记录下训练后的模型结果，记为{p₁，p₂，...，p_n}。具体地，如在一个初始化好的逻辑回归模型中，依次输入Up_1true，Up_1false作为训练数据，得到模型结果P₁；再依次输入Up_2true，Up_2false作为训练数据，得到模型结果P₂，……，直到所有训练数据输入完毕。显然，模型p_i有i个正标签训练数据和i个负标签训练数据；

步骤A2：仿照步骤A1，服务器重新初始化一个步骤1中所使用的二分类模型，逆序每次输入一个更新参数对中的两个数据作为训练数据进行中毒攻击检测模型的训练，并记录下训练后的模型结果，记为{p_rn，p_rn-1，...，p_r1}；

步骤A3：根据步骤A1和步骤A2的结果，为每个客户端聚合一个中毒攻击检测模型。具体地，对于客户端C₁，最终的中毒攻击检测模型的参数即为p_r2；对于客户端C_n，最终的中毒攻击检测模型的参数即为p_n-1；对于客户端C_i，(1＜i＜n)，服务器将参数p_i-1和p_ri+1聚合，即可得到最终的中毒攻击检测模型的参数。此时，即可得到每个客户端的中毒攻击检测模型，记为G＝{G₁，G₂，...，G_n}。

(2)服务器端中毒攻击检测过程

图3为本实施例提供的服务器端中毒攻击检测结构示意图。实施例提供的联邦学习背景下的服务器端中毒攻击检测包括以下步骤：

步骤5：服务器用每个客户端对应的检测模型，将该客户端在步骤1中所得到的正确的更新参数作为输入，在模型最后的分类器层，由sigmoid函数计算得到其为中毒攻击的概率，记为Output＝{Output₁，Output₂，...，Output_n}。如对于客户端1，服务器将Up_true1作为中毒攻击检测模型G₁的输入，得到分类器层的输出值Output₁，即为客户端1为中毒攻击的概率；

步骤6：服务器将步骤5中概率高于阈值y₁的客户端判定为可疑客户端，将剩下的客户端判定为正常客户端。特别地，服务器将正常客户端中概率低于阈值y₂的客户端判定为可信客户端，为接下来对可疑客户端的更新参数的评分做准备。如：服务器设阈值y₁为0.6，则对于客户端i，若Output_i＞0.6，则客户端i被标记为可疑客户端；反之，客户端i会被标记为正常客户端。记输出值低于y₁的正常客户端的数量为m，则服务器可设阈值y₂为概率低于y1的客户端的概率平均值，即

Output_i＜y₁。此时，对于客户端i，若Output_i＜y₂，则客户端i被标记为可信客户端，参与接下来可疑客户端的评分；反之，则不参与接下来的评分。

(3)可信客户端评分过程

图4为本实施例提供的可信客户端评分过程流程示意图。实施例提供的可信客户端评分过程包括以下步骤：

步骤7：服务器制定可信客户端对可疑客户端更新参数的评分规则；

步骤8：可信客户端接收服务器下发的可疑客户端的更新参数，选取部分或全部的本地数据集用于模型的评分。然后，可信客户端依次运行可疑客户端的更新参数下的模型，用选取的本地数据集作为输入，计算模型的预测准确率，并根据服务器制定的评分规则进行评分，并将结果上传给服务器。如：服务器制定的评分规则如下：设定阈值y₃，若可信客户端在本地数据集下运行该模型得到的预测准确率高于y₃，则评分为1；反之，评分为0。可信客户端根据该规则依次对接收到的可疑客户端的更新参数进行评分，用0-1数组Grade记录评分结果。记Grade_i[k]为第i个可信客户端对第k个可疑客户端评分的值；

步骤9：服务器聚合各个可信客户端的评分结果，对每个可疑客户端进行判定。如：服务器先设定阈值y₄，然后，对于第k个可疑客户端，服务器计算

作为可疑客户端k的最终评分。若Score_k＞y₄，则可疑客户端k被判定为正常客户端，参与最终联邦学习模型的聚合；反之，可疑客户端k则被判定为中毒攻击客户端，不参与最终联邦学习模型的聚合。

(4)联邦学习聚合过程

图5为本申请实施例提供的最终的联邦学习聚合过程结构示意图。实施例提供的联邦学习聚合过程包括以下步骤：

步骤10：服务器端丢弃被判定为中毒攻击客户端的模型更新参数，将正常客户端的模型更新参数进行聚合，完成联邦学习模型的更新。此时，在该实施例下训练的联邦学习模型，由于完成了中毒攻击检测，因此解决了部分客户端使用不良数据来训练模型所导致的服务器端全局模型效果被削弱、难以优化的问题。

以上所述，只是对本发明作进一步说明，旨在解读本发明的技术方案，仅为本发明较佳的实施例，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明所公开的范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都属于本发明的保护范围。

Claims

1.一种基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法，其特征在于，所述方法包括以下步骤：

步骤1：中毒攻击检测模型训练

步骤2：服务器端中毒攻击检测

步骤3：可信客户端评分

步骤4：联邦学习聚合

2.根据权利要求1所述的基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法，其特征在于，步骤1所述训练一个中毒攻击检测模型，具体包括下述步骤：

步骤A2：每个客户端使用本地数据集训练参与联邦学习的模型G_task，得到正确的模型更新参数；在联邦学习中，模型G_task在系统初始化时由客户端和服务器共同生成；具体为：首先由服务器发送建模任务，寻求参与客户端；客户端数据持有方根据自身需求，提出联合建模设想；在与其他合作数据持有方达成协议后，联合建模设想被确立，各数据持有方进入联合建立模型G_task的过程，由服务器向各数据持有方发布模型G_task的初始参数；模型G_task随着联邦学习的聚合过程而不断更新；设客户端i得到的正确的模型更新参数为Up_itrue；

3.根据权利要求1所述的基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法，其特征在于，步骤2具体包括下述步骤：

4.根据权利要求1所述的基于服务器和客户端双重检测的联邦学习中毒攻击的防御方法，其特征在于，所述步骤3具体包括下述步骤：

采用公式(1)计算可疑客户端k的最终评分：

判定过程为：

服务器设定阈值y₄，若可疑客户端k的最终评分Score_k大于y₄，服务器将可疑客户端k标记为正常客户端；若可疑客户端k的最终评分Score_k小于y₄，服务器将可疑客户端k标记为中毒攻击客户端。