CN114330750A

CN114330750A - 一种联邦学习毒化攻击检测方法

Info

Publication number: CN114330750A
Application number: CN202111668344.6A
Authority: CN
Inventors: 谢盈; 李世鹏; 刘政奇; 丁旭阳
Original assignee: Southwest Minzu University
Current assignee: Southwest Minzu University
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2022-04-12
Anticipated expiration: 2041-12-31
Also published as: CN114330750B

Abstract

本发明公开了一种联邦学习毒化攻击检测方法，本发明在客户端使用非独立同分布数据前提下，能够对联邦学习系统中的恶意参与方进行检测。通过形成各参与方模型的历史距离函数曲线，观察各曲线变化情况，不聚合单次异常模型，剔除长期异常的恶意参与方，从而保证联邦学习最终全局模型的准确性。本发明能够在服务器无法确定各参与方真实身份的情况下，通过长期检测客户端模型变化，从非独立同分布的本地模型中检测异常，从而保证全局模型性能，实现安全、可靠的联邦学习。

Description

一种联邦学习毒化攻击检测方法

技术领域

本发明涉及网络空间安全领域，具体涉及一种联邦学习毒化攻击检测方法。

背景技术

数据是作为生产资料，是近几年推动产业智能化发展的重要因素。但当前的数据合作同样存在着一些困境，一是跨企业间数据合作受阻，数据安全存在风险，担心泄漏数据隐私，跨企业间存在信任危机。二是企业内跨部门间数据共享建立困难重重，即各部门虽知道数据的价值，寻求和其他部门进行数据合作，但又都不愿意泄露自身业务的核心数据。传统的机器学习方法需要将所有的数据集中到一个地方(如数据中心)，然后进行机器学习模型的训练，但这种基于集中数据的做法无疑会严重侵害用户隐私和数据安全。联邦学习能有效帮助参与方在满足用户隐私保护、数据安全和政府法规的要求下进行数据使用和机器学习建模，其特点是参与方在服务器管理下通过模型的传递、聚合共同训练全局模型。具体过程为参与方利用本地数据训练本地模型后上传至服务器，服务器在接收所有参与方模型后以特定算法进行聚合得到全局模型，如此迭代直至模型收敛，所有参与方共同享有最终的全局模型。参与方通过传递模型代替数据共享，从而保证了用户隐私及数据安全。

目前，多数联邦学习服务器的聚合算法均以各参与方是诚实的这一假设为前提。若参与方中出现恶意参与方，可以轻松修改本地数据并上传异常模型，通过服务器聚合算法污染全局模型，从而影响到所有参与的客户端模型性能。因此在众多参与方中检测恶意参与方，保证最终全局模型的性能，是联邦学习能否广泛应用的重要前提。

发明内容

针对现有技术中的上述不足，本发明提供的一种联邦学习毒化攻击检测方法可以在联邦学习过程中检测出恶意参与方，避免学习失败。

为了达到上述发明目的，本发明采用的技术方案为：

提供一种联邦学习毒化攻击检测方法，其包括以下步骤：

S1、确定参与方的个数，将参与方初始化为正常状态，并初始化全局模型和参与方的信誉值；

S2、在每轮训练后，获取各个参与方上传的模型，并计算各参与方的模型与上轮全局模型之间的距离，以及所有参与方在本轮训练的平均距离；

S3、在第T轮训练后，将获取的各参与方的模型与上轮全局模型之间的距离通过最小二乘法进行拟合，得到若干第一曲线；将平均距离进行拟合，得到第二曲线；

S4、对第一曲线进行求导，得到若干第三曲线；对第二曲线进行求导，得到第四曲线；获取每条第三曲线与第四曲线的余弦相似度；

S5、将余弦相似度大于等于1/2的参与方加入当前轮次聚合集合；根据余弦相似度调整对应参与方的信誉值；

S6、将信誉值低于信誉阈值的参与方认定为恶意参与方并拒绝其加入训练，并将当前轮次聚合集合中符合信誉要求的参与方上传的模型进行聚合，得到新的全局模型；

S7、判断新的全局模型是否收敛，若是则结束；否则进入步骤S8；

S8、将新的全局模型下发至所有参与方，将训练轮数加1，重复步骤S2至 S7。

进一步地，步骤S1中参与方信誉值的初始值为100。

进一步地，步骤S2中计算各参与方的模型与上轮全局模型之间的距离的具体方法为：

根据公式：

获取第i个参与方在第t轮训练后上传的模型

与上轮全局模型

之间的距离

其中W表示模型参数总个数；

表示模型

中第j个参数；

表示全局模型

中第j个参数。

进一步地，步骤S2中计算所有参与方在本轮训练的平均距离的具体方法为：

根据公式：

获取所有参与方在第t轮训练的平均距离avgDis^t；其中N表示第t轮训练的参与方数量。

进一步地，步骤S3中T的数值为5。

进一步地，步骤S4中获取第三曲线与第四曲线的余弦相似度的具体方法为：

根据公式：

获取第三曲线与第四曲线的余弦相似度cosθ；其中θ_k表示第三曲线中第k 个项的系数；

表示第四曲线中第k个项的系数，即训练T次时第三曲线和第四曲线均存在T个项。

进一步地，步骤S5中根据余弦相似度调整对应参与方的信誉值的具体方法为：

若

则根据公式credit_t＝credit_t-1+cosθ×2更新参与方的信誉值；

若

则根据公式credit_t＝credit_t-1更新参与方的信誉值；

若

则根据公式credit_t＝credit_t-1-(1-cosθ)×2更新参与方的信誉值；

其中，cosθ为余弦相似度；credit_t为参与方更新后的信誉值；credit_t-1为参与方更新前的信誉值。

进一步地，步骤S6中信誉阈值为60。

本发明的有益效果为：本发明在客户端使用非独立同分布数据前提下，能够对联邦学习系统中的恶意参与方进行检测。通过形成各参与方模型的历史距离函数曲线，观察各曲线变化情况，不聚合单次异常模型，剔除长期异常的恶意参与方，从而保证联邦学习最终全局模型的准确性。本发明能够在服务器无法确定各参与方真实身份的情况下，通过长期检测客户端模型变化，从非独立同分布的本地模型中检测异常，从而保证全局模型性能，实现安全、可靠的联邦学习。

附图说明

图1为本方法的流程示意图；

图2为实施例中本发明与常规联邦学习聚合算法在面对毒化攻击下对于 MNIST数据集的分类进度。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，该联邦学习毒化攻击检测方法包括以下步骤：

S1、确定参与方的个数，将参与方初始化为正常状态，并初始化全局模型和参与方的信誉值；参与方信誉值的初始值为100；

S3、在第T轮训练后，将获取的各参与方的模型与上轮全局模型之间的距离通过最小二乘法进行拟合，得到若干第一曲线；将平均距离进行拟合，得到第二曲线；T的数值为5；

步骤S2中计算各参与方的模型与上轮全局模型之间的距离的具体方法为：根据公式：

获取第i个参与方在第t轮训练后上传的模型

与上轮全局模型

之间的距离

其中W表示模型参数总个数；

表示模型

中第j个参数；

表示全局模型

中第j个参数。

步骤S2中计算所有参与方在本轮训练的平均距离的具体方法为：根据公式：

步骤S4中获取第三曲线与第四曲线的余弦相似度的具体方法为：根据公式：

步骤S5中根据余弦相似度调整对应参与方的信誉值的具体方法为：

若

则根据公式credit_t＝credit_t-1+cosθ×2更新参与方的信誉值；

若

则根据公式credit_t＝credit_t-1更新参与方的信誉值；

若

则根据公式credit_t＝credit_t-1-(1-cosθ)×2更新参与方的信誉值；

其中，cosθ为余弦相似度；credit_t为参与方更新后的信誉值；credit_t-1为参与方更新前的信誉值。步骤S6中信誉阈值为60。

在本发明的一个实施例中，为了验证本方法的有效性，实验环境为Ubun tu 20.04操作系统。编程环境为Python 3.7.4，pytorch 1.9.0，CUDA 10.2。所有实验采用数据为MNIST数据集，为了模拟非独立同分布环境，我们将MNIST所有数据分布在1000个用户上，每台设备只分配2种标签的样本，每个用户拥有的样本数遵循幂律(即样本大的用户数量小，样本小的用户数量大)，随机抽取其中200客户端(客户端即参与方)完成训练。各参与方利用其拥有的数据进行逻辑回归模型训练。

图2示出了本发明与常规联邦学习聚合算法在面对毒化攻击下对于MNIST 数据集的分类进度，其中accuracy表示准确率，noAttack表示无攻击，noDefence 表示无防御(即常规联邦学习聚合算法)，Defence表示本方法。从图2中可以看出，在面对毒化攻击时本发明可以显著提升模型精度，保证最终训练模型的准确性。

综上所述，本发明在客户端使用非独立同分布数据前提下，能够对联邦学习系统中的恶意参与方进行检测。通过形成各参与方模型的历史距离函数曲线，观察各曲线变化情况，不聚合单次异常模型，剔除长期异常的恶意参与方，从而保证联邦学习最终全局模型的准确性。本发明能够在服务器无法确定各参与方真实身份的情况下，通过长期检测客户端模型变化，从非独立同分布的本地模型中检测异常，从而保证全局模型性能，实现安全、可靠的联邦学习。