CN114239070A

CN114239070A - 在联邦学习中移除非规则用户的隐私保护方法

Info

Publication number: CN114239070A
Application number: CN202111588461.1A
Authority: CN
Inventors: 李洪伟; 徐婕妤; 曾加; 郝猛; 汤殿华; 张希琳; 杨浩淼; 任彦之; 刘鹏飞; 张源
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-12-23
Filing date: 2021-12-23
Publication date: 2022-03-25
Anticipated expiration: 2041-12-23
Also published as: CN114239070B

Abstract

本发明公开了一种在联邦学习中移除非规则用户的隐私保护方法，属于信息安全技术领域。本发明包括不规则用户删除算法Trust_IU和保护用户的敏感信息的加权聚合协议两个部分；Trust_IU利用余弦相似度进行聚合，减少了不规则用户的负面影响，从而确保全局模型主要来源于高质量的数据；在Trust_IU的基础上，本发明采用安全加权的定制密码协议聚合；此聚合方案通过使用双隐蔽隐私保护技术，确保了服务器只学习用户的梯度信息，而不会泄露其他隐私。本发明在具有良好的训练精度和效率的同时，对整个培训过程中对用户退出具有鲁棒性。

Description

在联邦学习中移除非规则用户的隐私保护方法

技术领域

本发明属于信息安全技术领域，具体涉及一种在联邦学习中移除非规则用户的隐私保护方法。

技术背景

联邦学习FL(Federated learning)已经被广泛应用于语音自动识别、自动驾驶、智能医疗等各个领域。在FL中，多个用户通过交换局部计算更新来协作训练全局预测模型，而不泄露他们的私有数据集。

尽管目前存在许多保护隐私的FL协议，这我们经常忽略FL中存在威胁模型可用性的不规则用户。例如，在现实的应用中，不同的用户(包括资源有限的物联网设备和强大的云服务器)可能具有不同的收集训练样本的能力，即强大的用户通常持有高质量的数据，而其他用户(称为不规则用户)可能获得低质量的数据。在训练过程中，这些不规则用户持有低质量的数据，可能会降低收敛速度，甚至损害模型的可用性。

因此，设计一种来消除不规则用户在负面影响的方案是有必要的。据我们所知，只有少数作品同时考虑了隐私和不规则用户问题。然而，这些方案存在以下不足：1)复杂的密码算法增大了通信和计算开销；2)无法准确排除不规则用户的影响。同时这两个问题存在矛盾，即保护隐私的FL方法旨在混淆梯度，而删除不规则用户则需要访问梯度进行统计分析。

发明内容

本发明提出了一种在联邦学习中移除非规则用户的隐私保护方法，在保护用户隐私的同时，消除了非规则用户的负面影响。此外，本发明解决移除非规则用户过程中所有用户必须一直保持在线状态的问题，容忍用户在计算过程中有意或无意的退出。

本发明采用的技术方案如下：

一种在联邦学习中移除非规则用户的隐私保护方法，具体包括以下步骤：

1)密钥生成：每个用户i利用Diffie-Hellman生成技术密钥对，用作伪随机生成器的种子值，并将其公钥信息发送给云服务器；云服务器检测在线用户列表，将当前用户列表和收到的公钥信息发送给用户i的全体邻居用户；

2)生成用户参数：用户根据自己与上一轮全局梯度间的余弦距离更新个人权重，利用Shamir方法和Diffie-Hellman方法分别生成种子的子秘密和加密私钥的交换密钥，并对所有子秘密进行加密，最后将加密结果发送给云服务器；云服务器检测在线用户列表，并将收到的加密结果转发给用户i的全体邻居用户；

3)数据加密：用户首先利用Diffie-Hellman方法生成种子，接着把该种子应用在双掩码方法中对用户的梯度信息及权重信息进行加密，并将加密后数据发送给云服务器；云服务器检测在线用户列表，并将当前用户列表发送给用户i的全体邻居用户；

4)解密并计算全局梯度：用户收到云服务器发送的在线用户列表，并发送掉线用户的子秘密给云服务器。云服务器利用Shamir方法重构掉线用户参数，并用该技术对加密后数据进行解密处理，最后将收到的加密数据进行聚合运算，得到新一轮的全局梯度。

本发明具有如下特点：

1)用户和云服务器使用本发明提供的不规则用户删除算法Trust_IU计算用户数据权重，实现更加准确及高效的聚合。即，用户根据服务器发送的全局梯度计算自己的权重，权重与局部模型梯度与服务器模型梯度之间的余弦距离有关。服务器根据用户权重判断用户是否为非规则用户，并消除他们的负面影响。

2)利用双掩码技术实现密文环境下高效的聚合运算和保护用户传感数据隐私的机密性；

3)利用Diffie-Hellman和Shamir技术解决所有用户必须一直保持在线状态的问题，容忍用户在计算过程中有意或无意的退出。

附图说明

图1为本实施例的系统框架示意图。

具体实施方式

如图1所示，是本发明的系统框架图，每个用户拥有本地数据集，每个用户首先利用本地数据集训练本地模型，上传模型参数。服务器根据上传的参数更新全局模型。此外，用户和云服务器使用本发明提供的不规则用户删除算法Trust_IU计算用户数据权重，实现更加准确及高效的聚合。

本实施例具体包括以下步骤：

步骤1密钥生成：每个用户i利用Diffie-Hellman方法生成密钥对，用作伪随机生成器的种子值，并将其公钥信息发送给云服务器；云服务器检测在线用户列表，将当前用户列表和收到的公钥信息发送给用户i的k个邻居用户，用N_G(i)表示用户i的k个邻居用户的集合。

步骤1.1用户i(i∈U)利用Diffie-Hellman方法在本地生成公私密钥对

其中U表示包含所有用户的列表，

和

表示用户i的公钥信息，

表示用户i的私钥信息，

用作认证加密AE的密钥，

和

用作伪随机生成器PRG的种子值。

步骤1.2用户i(i∈U)将其公钥信息

发送给云服务器。

步骤1.3云服务器检测当前用户列表为U₁(|U₁|≥t,U₁∈U)，其中t表示在线用户数的最低阈值，即如果|U₁|＜t，云服务器终止。

步骤1.4云服务器向用户i∈U₁的全体邻居用户N_G(i)广播其收到的公钥信息

步骤2生成用户参数：用户根据自己与上一轮全局梯度间的余弦距离更新个人权重，利用Shamir方法和Diffie-Hellman方法分别生成种子的子秘密和加密私钥的交换密钥，并对所有子秘密进行加密，最后将加密结果发送给云服务器；云服务器检测在线用户列表，并将收到的加密结果转发给用户i的k个邻居用户，具体包括以下步骤：

步骤2.1用户i∈U₁首先归一化个人梯度大小

表示个人梯度大小，x^d表示全局梯度大小；接着计算个人权重信息

步骤2.2用户i∈U₁选择随机数b_i和b′_i，并利用Shamir方法生成其私钥

及随机数b_i和b′_i的子秘密：

其中，表示用户i的私钥

对用户j产生的子秘密，同理，

表示用户i的私钥

对用户j产生的子秘密，b_i,j表示用户i的随机数b_i对用户j产生的子秘密，b′_i,j表示用户i的随机数b′_i对用户j产生的子秘密；

步骤2.3用户i∈U₁利用认证加密技术对产生的所有子秘密进行加密：

其中，c_i,j表示用户i对用户j经认证加密后输出的密文，

表示经Diffie-Hellman方法计算后的交换密钥，也是认证加密的密钥。

步骤2.4用户i∈U₁将密文值

发送给云服务器。

步骤2.5云服务器检测当前用户列表为U₂(|U₂|≥t,U₂∈U₁)，即如果|U₂|＜t，服务器终止。

步骤2.6云服务器向U₂中的用户i的全体邻居用户N_G(i)广播其收到的密文值

步骤3.数据加密：用户首先利用Diffie-Hellman方法生成种子，接着把该种子应用在双掩码方法中对用户的梯度信息及权重信息进行加密，并将加密后数据发送给云服务器；云服务器检测在线用户列表，并将当前用户列表发送给用户i的k个邻居用户，具体包括以下步骤：

步骤3.1用户i∈U₂计算伪随机生成器PRG的种子值

和

其中s_i,j和s′_i,j表示用户i与用户j经Diffie-Hellman方法计算后的交换密钥。

步骤3.2用户i∈U₂计算两个向量p_i,j＝Δ_i,j·PRG(s_i,j)和p′_i,j＝Δ_i,j·PRG(s′_i,j)，其中当i>j时，△_i,j＝-1；当i<j时，△_i,j＝1；当i＝j时，△_i,j＝0。

步骤3.2对所有j∈N_G(i)，重复步骤3.1和步骤3.2。

步骤3.3用户i∈U₂计算个人掩码p_i＝PRG(b_i)和p′_i＝PRG(b′_i)。

步骤3.4用户i∈U₂利用双掩码方法加密

和w_i：

其中，y_i表示

加密后的密文值，y′_i表示w_i加密后的密文值。

步骤3.5用户i∈U₂将y_i和y′_i发送给云服务器。

步骤3.6云服务器检测当前用户列表为U₃(|U₃|≥t,U₃∈U₂)，即如果|U₃|＜t，服务器终止。

步骤3.7云服务器向U₂发送当前在线用户列表U₃。

4)解密并计算全局梯度：用户收到云服务器发送的在线用户列表，并发送掉线用户的子秘密给服务器。服务器利用Shamir技术重构掉线用户参数，并用该技术对加密后数据进行解密处理，最后将收到的加密数据进行聚合运算，得到新一轮的全局梯度；具体包括以下步骤：

步骤4.1用户i∈U₃检测当前用户列表为U₃(|U₃|≥t,U₃∈U₂)，若|U₃|＜t，中止并重新开始步骤1。

步骤4.2用户i∈U₃对所有c_i,j∈U₂∩N_G(j)，解密

步骤4.3用户i∈U₃将

和{b_i,j,b′_i,j|j∈(U₂\U₃)∩i∈N_G(j)}发送给服务器，其中U₂\U₃表示在步骤2中向云服务器发送数据，但在步骤3将数据上传到云服务器之前退出的用户。

步骤4.4云服务器接收至少t个用户返回的数据，利用Shamir方法恢复出离线用户私钥

和

然后使用PRG重新计算p_i,j和p′_i,j；

步骤4.5云服务器重构

和

然后使用PRG重新计算p_i和p′_i。

步骤4.6云服务器计算并输出当前轮次聚合梯度

Claims

1.一种在联邦学习中移除非规则用户的隐私保护方法，其特征在于，包括以下步骤：

1)密钥生成：每个用户i利用Diffie-Hellman方法生成密钥对，用作伪随机生成器的种子值，并将其公钥信息发送给云服务器；云服务器检测在线用户列表，将当前用户列表和收到的公钥信息发送给用户i的全体邻居用户；

3)数据加密：用户首先利用Diffie-Hellman方法生成种子，接着把该种子应用在双掩码方法中对用户的梯度信息及权重信息进行加密，并将加密后数据发送给云服务器；云服务器检测在线用户列表，并将当前用户列表发送给用户i的全体邻居用户。

4)解密并计算全局梯度：用户收到云服务器发送的在线用户列表，并发送掉线用户的子秘密给云服务器；云服务器利用Shamir方法重构掉线用户参数，并用该技术对加密后数据进行解密处理，最后将收到的加密数据进行聚合运算，得到新一轮的全局梯度。

2.如权利要求1所述的一种在联邦学习中移除非规则用户的隐私保护方法，其特征在于，步骤1密钥生成的具体步骤为：

步骤1.1.用户i(i∈U)利用Diffie-Hellman方法在本地生成公私密钥对

其中U表示包含所有用户的列表，

和

表示用户i的公钥信息，

表示用户i的私钥信息，

用作认证加密AE的密钥，

和

用作伪随机生成器PRG的种子值；

步骤1.2.用户i(i∈U)将其公钥信息

发送给云服务器；

步骤1.3.云服务器检测当前用户列表为U₁(|U₁|≥t,U₁∈U)，其中t表示在线用户数的最低阈值，当|U₁|＜t，云服务器终止；

步骤1.4.云服务器向用户i∈U₁的全体邻居用户N_G(i)广播其收到的公钥信息

3.如权利要求2所述的一种在联邦学习中移除非规则用户的隐私保护方法，其特征在于，步骤2生成用户参数的具体步骤为：

步骤2.1.用户i∈U₁首先归一化个人梯度大小

表示个人梯度大小，x^d表示全局梯度大小；然后计算个人权重信息

步骤2.2.用户i∈U₁选择随机数b_i和b'_i，并利用Shamir方法生成其私钥

及随机数b_i和b'_i的子秘密：

其中，表示用户i的私钥

对用户j产生的子秘密，同理，

表示用户i的私钥

对用户j产生的子秘密，b_i,j表示用户i的随机数b_i对用户j产生的子秘密，b'_i,j表示用户i的随机数b'_i对用户j产生的子秘密；

步骤2.3.用户i∈U₁利用认证加密技术对产生的所有子秘密进行加密：

其中，c_i,j表示用户i对用户j经认证加密后输出的密文，

表示经Diffie-Hellman方法计算后的交换密钥，也是认证加密的密钥；

步骤2.4.用户i∈U₁将密文值

发送给云服务器；

步骤2.5.云服务器检测当前用户列表为U₂(|U₂|≥t,U₂∈U₁)，当|U₂|＜t，服务器终止；

步骤2.6.云服务器向U₂中的用户i的全体邻居用户N_G(i)广播其收到的密文值

4.如权利要求3所述的一种在联邦学习中移除非规则用户的隐私保护方法，其特征在于，步骤3数据加密的具体步骤为：

步骤3.1用户i∈U₂计算伪随机生成器PRG的种子值

和

其中s_i,j和s'_i,j表示用户i与用户j经Diffie-Hellman方法计算后的交换密钥；

步骤3.2用户i∈U₂计算两个向量p_i,j＝Δ_i,j·PRG(s_i,j)和p'_i,j＝Δ_i,j·PRG(s'_i,j)，其中当i>j时，△_i,j＝-1；当i<j时，△_i,j＝1；当i＝j时，Δ_i,j＝0；

步骤3.2对所有j∈N_G(i)，重复步骤3.1和步骤3.2；

步骤3.3用户i∈U₂计算个人掩码p_i＝PRG(b_i)和p'_i＝PRG(b'_i)；

步骤3.4用户i∈U₂利用双掩码方法加密

和w_i：

其中，y_i表示

加密后的密文值，y'_i表示w_i加密后的密文值；

步骤3.5用户i∈U₂将y_i和y'_i发送给云服务器；

步骤3.6云服务器检测当前用户列表为U₃(|U₃|≥t,U₃∈U₂)，当|U₃|＜t，服务器终止；

步骤3.7云服务器向U₂发送当前在线用户列表U₃。

5.如权利要求4所述的一种在联邦学习中移除非规则用户的隐私保护方法，其特征在于，步骤4数据加密的具体步骤为：

步骤4.1.用户i∈U₃检测当前用户列表为U₃(|U₃|≥t,U₃∈U₂)，若|U₃|＜t，中止并重新开始步骤1；

步骤4.2.用户i∈U₃对所有c_i,j∈U₂∩N_G(j)，解密

步骤4.3.用户i∈U₃将

和{b_i,j,b′_i,j|j∈(U₂\U₃)∩i∈N_G(j)}发送给服务器，其中U₂\U₃表示在步骤2中向云服务器发送数据，但在步骤3将数据上传到云服务器之前退出的用户；

步骤4.4.云服务器接收至少t个用户返回的数据，利用Shamir方法恢复出离线用户私钥

和

然后使用PRG重新计算p_i,j和p'_i,j；

步骤4.5.云服务器重构

和

然后使用PRG重新计算p_i和p'_i；

步骤4.6.云服务器计算并输出当前轮次聚合梯度