CN114726496A - 一种安全的应用于纵向联邦学习的特征选择方法 - Google Patents

一种安全的应用于纵向联邦学习的特征选择方法 Download PDF

Info

Publication number
CN114726496A
CN114726496A CN202210215668.2A CN202210215668A CN114726496A CN 114726496 A CN114726496 A CN 114726496A CN 202210215668 A CN202210215668 A CN 202210215668A CN 114726496 A CN114726496 A CN 114726496A
Authority
CN
China
Prior art keywords
matrix
feature
federal learning
vector
longitudinal federal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210215668.2A
Other languages
English (en)
Other versions
CN114726496B (zh
Inventor
李洪伟
张瑞
胡佳
郝猛
陈涵霄
张希琳
刘鹏飞
任彦之
张源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202210215668.2A priority Critical patent/CN114726496B/zh
Publication of CN114726496A publication Critical patent/CN114726496A/zh
Application granted granted Critical
Publication of CN114726496B publication Critical patent/CN114726496B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • H04L63/0442Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload wherein the sending and receiving network entities apply asymmetric encryption, i.e. different keys for encryption and decryption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0816Key establishment, i.e. cryptographic processes or cryptographic protocols whereby a shared secret becomes available to two or more parties, for subsequent use
    • H04L9/0819Key transport or distribution, i.e. key establishment techniques where one party creates or otherwise obtains a secret value, and securely transfers it to the other(s)
    • H04L9/0822Key transport or distribution, i.e. key establishment techniques where one party creates or otherwise obtains a secret value, and securely transfers it to the other(s) using key encryption key
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0816Key establishment, i.e. cryptographic processes or cryptographic protocols whereby a shared secret becomes available to two or more parties, for subsequent use
    • H04L9/085Secret sharing or secret splitting, e.g. threshold schemes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • H04L9/0869Generation of secret information including derivation or calculation of cryptographic keys or passwords involving random numbers or seeds

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供一种安全的应用于纵向联邦学习的特征选择方法,本发明设计了一个通用的基于基尼系数的特征选择框架,并为该框架设计了两个定制的密码协议。其中一个协议建立在轻量级加法秘密共享技术之上,以保护隐私特征,但同时也引入了少量额外计算开销。另一个同时使用秘密共享和线性同态加密技术。本发明方案与纵向联邦学习中现有的大多数机器学习模型兼容,并可作为即插即用模块集成到现有的隐私保护的纵向联邦学习系统中,以进一步提高训练效率和模型准确率。

Description

一种安全的应用于纵向联邦学习的特征选择方法
技术领域
本发明涉及信息安全技术,特别涉及应用于纵向联邦学习的特征选择技术。
背景技术
随着电子病历的快速扩展,深度学习已经被应用于电子健康的各个领域,如预测疾病风险因素和辅助诊断医学影像。然而,医疗数据通常存在数据孤岛,这限制了其进一步应用的潜力。为了解决这个问题,作为一种隐私感知的分布式学习方法,联邦学习应运而生。它使多个医学机构能够在不需要集中所有医疗数据的情况下联合训练一个全局模型。一般来说,根据数据来划分,联邦学习可以分为横向联邦学习和纵向联邦学习。在电子健康应用中,数据通常是纵向分布的。换句话说,对于同一批患者,其标签(例如,诊断结果)和特征(例如,身体状况) 数据由不同的医疗机构持有。因此,我们将重点关注基于纵向联邦学习的电子健康应用。
尽管纵向联邦学习有许多优势,但各种研究表明,纵向联邦学习仍存在隐私泄露的风险。为了进一步保护参与方的隐私,最近有几项工作利用密码技术,例如安全多方计算和同态加密,设计了针对纵向联邦学习的隐私保护模型训练和预测方法。然而,这些工作很少考虑到数据预处理步骤;他们的假设是数据集已经过预处理,尤其是特征已经过评估和预选。在电子健康系统中,数据收集过程中数据空缺和有偏特征是很常见的,如果不正确处理将导致训练过程中收敛速度慢,甚至破坏模型的可用性。
据我们所知,以前的工作没有充分探索纵向联邦学习的隐私保护特征选择,只在在传统的分布式机器学习相关工作中存在少数解决方案。特别地,有一种方案提出了一种基于安全多方计算的协议,该协议用于外包多服务器环境中选择隐私保护特征。在该协议中,所有操作都是基于秘密共享进行的,这导致了大量的交互操作和极大的通信开销。另一种方案设计了一种基于中间表征的分布式特征选择方案,该方案中的方法不依赖于任何密码技术,并且需要向所有参与方广播所选择的特征,这一操作存在潜在的隐私安全风险。一般来说,由于效率和安全性的不足,以前的工作不能直接推广到纵向联邦学习。因此,有必要为纵向联邦学习设计一个高效的隐私保护特征选择协议。
据我们所知,以前的工作没有充分探索纵向联邦学习的隐私保护特征选择,只在在传统的分布式机器学习相关工作中存在少数解决方案。特别地,有一种方案提出了一种基于安全多方计算的协议,该协议用于外包多服务器环境中选择隐私保护特征。在该协议中,所有操作都是基于秘密共享进行的,这导致了大量的交互操作和极大的通信开销。另一种方案设计了一种基于中间表征的分布式特征选择方案,该方案中的方法不依赖于任何密码技术,并且需要向所有参与方广播所选择的特征,这一操作存在潜在的隐私安全风险。由于效率和安全性的不足,以前的工作不能直接推广到纵向联邦学习。
发明内容
本发明所要解决的技术问题是,提供一种高效的隐私保护的特征选择方法,它可以兼容现有的大多数纵向联邦学习模型体系结构。
本发明为解决上述技术问题所采用的技术方案是,一种安全的应用于纵向联邦学习的特征选择方法,
一种安全的应用于纵向联邦学习的特征选择方法,其特征在于,纵向联邦学习系统中包括拥有特征矩阵的机构A与拥有标签矩阵的机构B,其中,特征矩阵D=(dij)n×m,dij表示D中第i行第j列的元素,标签矩阵Lm×p,m、n、p分别表示样本数、特征数和标签数;机构A与机构B通过以下步骤实现特征选择:初始化步骤:
1)A计算每个特征i的平均值作为特征阈值θi,i=1,2,...,n,
Figure RE-GDA0003624091500000021
Figure RE-GDA0003624091500000022
j=1,2,...,m;
2)A通过比较每个dij和θi特征矩阵转换为二元的矩阵X≤θ=(xij)n×m,当满足dij≤θi,则X≤θ中的对应元素xij=1;否则xij=0。
3)A根据二元矩阵X≤θ得到二元矩阵X>θ,X>θ=1-X≤θ
4)A计算X≤θ每一行中的元素1的个数
Figure RE-GDA0003624091500000023
和X>θ中每一行中的元素1的个数
Figure RE-GDA0003624091500000024
安全计算步骤:
1)A和B共同计算矩阵Z≤θ=X≤θ×L与矩阵Z>θ=X>θ×L;
2)A和B计算Z≤θ和Z>θ每一行的点积得到n维向量z≤θ和z>θ,并将z≤θ和z>θ返回给A;
结果重构步骤:
1)A得到z≤θ和z>θ后,计算利用x≤θ、x>θ、z≤θ和z>θ来计算特征得分 s=[(x≤θ-z≤θ/x≤θ)+(x>θ-z>θ/x>θ)];
2)按单个特征的特征得分进行排序从而实现特征选择。
本发明设计了一个通用的基于基尼系数的特征选择框架,并为该框架设计了两个定制的密码协议。其中一个协议πSS-FS建立在轻量级加法秘密共享技术之上,以保护隐私特征,但同时也引入了少量额外计算开销。
协议πSS-FS中,A和B在进行安全计算时具体步骤如下:
1)A生成X≤θ,X>θ的秘密分享[X≤θ],[X>θ];B生成L的秘密分享[L];A与 B分享将各自生成的秘密分享发送给对方;
2)A与B各自在本地计算矩阵[Z≤θ]=[X≤θ]×[L]与矩阵[Z>θ]=[X>θ]× [L];
3)A与B各自在本地再计算向量
Figure RE-GDA0003624091500000031
向量
Figure RE-GDA0003624091500000032
Figure RE-GDA0003624091500000033
B向A分享生成的[z≤θ]和[z>θ]。
基于秘密共享技术的协议πSS-FS需要O(nd)级别的通信开销(其中n表示样本的数量,d表示特征的数量),这将导致带宽受限的参与方的所需成本很高。
为了缓解这个问题,我们进一步设计了一个同时使用秘密共享和线性同态加密技术的混合协议πH-FS。该协议以适量的计算开销为代价,将通信开销减少了到O(d)级别。
协议πH-FS中,A和B在进行安全计算时具体步骤如下:
1)B用其同态加密密钥对的公钥pkb加密L得到
Figure RE-GDA0003624091500000034
并发送给A;
2)A在本地计算矩阵
Figure RE-GDA0003624091500000035
和矩阵
Figure RE-GDA0003624091500000036
3)A随机生成两个矩阵[Z≤θ]1和[Z>θ]1
4)A在本地计算
Figure RE-GDA0003624091500000037
Figure RE-GDA0003624091500000038
并将
Figure RE-GDA0003624091500000039
Figure RE-GDA00036240915000000310
发送给B;
6)B对
Figure RE-GDA0003624091500000043
Figure RE-GDA0003624091500000044
用其同态加密密钥对的私钥skb进行解密得到 [Z≤θ]2和[Z>θ]2
7)A与B各自在本地计算向量
Figure RE-GDA0003624091500000041
和向量
Figure RE-GDA0003624091500000042
t={1,2};B向A分享生成的[z≤θ]2和[z>θ]2
本发明的有益效果是:
针对纵向联邦学习提出了一个高效的保护隐私的特征选择方案,其中包括两种适用于不同场景的加密协议变体——πSS-FS和πH-FS
本发明方案与纵向联邦学习中现有的大多数机器学习模型兼容,并可作为即插即用模块集成到现有的隐私保护的纵向联邦学习系统中,以进一步提高训练效率和模型准确率。
本发明方案在真实数据集上实现了高达27%的准确率提升。效率方面,协议πSS-FS的计算量相对协议πH-FS更少,而协议πH-FS的优势在于通信开销更低。
具体实施方式
实施例为电子健康系统中的纵向联邦学习提出的一个基于基尼系数的通用的多方特征选择方法是基于一种分类和回归树算法。各个参与方首先联合计算每个特征的得分,以评估其预测能力,然后仅保留得分排名前K的特征。这里的特征是指每个电子健康系统中客户的各项病历数据。标签是指客户的诊断结果。
假设A是拥有一组客户的特征的医疗机构,B是拥有同一组客户的标签的另一个医疗机构。粗体大写字母D表示矩阵。粗体小写字母d表示向量。我们用Dj表示D的第j行,×是矩阵乘法运算。·,-,/是矩阵或向量的元素操作。设[X]1和 [X]2是X的两个分享值,我们用[X]来表示这两个份额,因为它们的计算是相同的。设(pkb,skb)为B的用于同态加密的密钥对,用
Figure RE-GDA0003624091500000045
表示用公钥pkb加密的X的密文。|.|表示集合中元素个数。
1)定义特征的基尼系数得分Mean Split Gini(MS-GINI):
假设集合S中有m个样本,每个样本包含n个特征和一个标签 (x1,...,xn,y)。假设Fj是具有连续值的第j个特征。基于最佳阈值θ将数据集分成两个子集。子集S≤θ包含所有的第j个特征值小于等于θ的样本,S>θ则相反。为了方便起见,我们用Fj的平均值作为阈值θ来划分集合。此外,对于k∈[p],集合Lk由标签值y=k的样本组成,其中p是标签值的种类的数量。我们将特征Fj的Mean Split Gini(MS-GINI)得分定义为:
Figure RE-GDA0003624091500000051
其中,S≤θ的基尼系数G(S≤θ)与S>θ的基尼系数G(S>θ)的计算方式如下:
Figure RE-GDA0003624091500000052
其中,
Figure RE-GDA0003624091500000053
表示第K个特征满足特征值xk≤θ、标签值y=k这两个条件的概率,
Figure RE-GDA0003624091500000054
则与之相反。它们的定义如下:
Figure RE-GDA0003624091500000055
原则上,Gini(Fj)根据第j个特征的值来估计随机选择的样本匹配不正确标签的可能性。Gini(Fj)越小,特征Fj越有用。
2)基于MS-GINI的特征选择框架:
框架包括三个步骤:初始化、安全计算和结果重构。首先,A有特征矩阵 D=(dij)n×m,dij表示D中第i行第j列的元素,B有标签矩阵Lm×p,其中m、 n、p分别表示样本数、特征数和标签数。L的每一行都以独热编码(one-hot)的形式表示一个样本的标签。输出是n维的特征得分向量。以下详细介绍了三个步骤:
·初始化:A在本地通过Init(D)计算得到X≤θ,X>θ,x≤θ,x>θ并输出。
具体步骤如下所示:
1)A首先计算每个特征i的平均值作为特征阈值θi,i=1,2,...,n,
Figure RE-GDA0003624091500000056
2)计算二元矩阵X≤θ=(xij)n×m,j=1,2,...,m,其中,
Figure RE-GDA0003624091500000057
即A通过比较每个dij和θi,A将特征矩阵转换为二元的0-1矩阵X≤θ,这意味着如果dij≤θi,则xij=1;否则xij=0。
3)根据二元矩阵X≤θ得到二元矩阵X>θ,X>θ=1-X≤θ;即A通过对矩阵X≤θ逐位取反,得到矩阵X>θ,这意味着当dij>θi时二元矩阵X>θ中的元素xij=1;
4)计算
Figure RE-GDA0003624091500000061
即A统计X≤θ和X>θ中每一行中的元素1的个数,得到向量x≤θ和x>θ,其中x≤θ中的第i个元素表示满足dij≤θ, j∈[m]的样本个数。x>θ中的元素取值为1的含义类似。
·安全计算:
1)A和B共同计算矩阵Z≤0=X≤θ×L与矩阵Z>θ=X>θ×L,其中,L为标签矩阵,Z≤θ中的每个元素eij代表第i个特征值≤θi且标签值为j的样本数, Z>θ中元素每个元素eij代表第i个特征值>θi且标签值为j的样本数。这一步是计算等式(3)中的分子。
2)A和B计算Z≤0和Z>θ每一行的点积,并将n维向量z≤θ和z>θ返回给A。
·结果重构:
1)A得到z≤θ和z>θ。为了将数值计算转换成矩阵形式并计算最终特征分数,等式(1)可以表示如下:
Figure RE-GDA0003624091500000062
上式中包含了与1/m的乘法。实施例在之后的计算中忽略它,因为它不会影响单个特征的得分的排序。
在具体进行安全计算时,实施例提出两种不同的n维向量z≤θ和z>θ安全计算方式:
可选的,基于秘密分享πSS-FS的特征选择步骤:
πSS-FS使用了加法秘密共享技术,并获得了很高的计算效率。所有联合计算的乘法都是基于Beaver三元组完成的。πSS-FS的输入包括特征矩阵D和标签矩阵 L;πSS-FS的输出为征得分向量s,具体步骤如下:
1)A在本地执行初始化操作,即A在本地通过Init(D)计算得到X≤θ,X>θ, x≤θ,x>θ
2)A生成X≤θ,X>θ的秘密分享[X≤θ],[X>0];B生成L的秘密分享[L];A与 B分享将各自生成的秘密分享发送给对方;
3)A与B各自在本地计算[Z≤θ]=[X≤θ]×[L]与矩阵[Z>θ]=[X>θ]×[L];
4)A与B各自在本地再计算
Figure RE-GDA0003624091500000063
Figure RE-GDA0003624091500000071
B向A分享生成的[z≤θ]和[z>θ];
4)A收到B发送的[z≤θ]和[z>θ]并重构z≤θ和z≤θ
5)A在本地计算特征得分向量s=[(x≤θ-z≤θ/x≤θ)+(x>θ-z>θ/x>θ)]。
因为安全计算步骤中基于加法秘密共享的计算与使用明文的计算处理方式是相同的,所以πSS-FS仅增加少量的计算开销。
可选的,基于混合协议πH-FS的特征选择步骤:
在协议πSS-FS中,所有乘法运算都需要由Beaver三元组实现,这导致了大数据集的通信开销很高。为了解决这个问题,进一步提出了一个基于同态加密和秘密共享的混合安全特征选择协议πH-FS。两个协议的区别在于安全计算步骤,πH-FS的输入包括:B的同态加密密钥对{pkb,skb}、特征矩阵D和标签矩阵L;πSS-FS的输出为征得分向量s,具体步骤如下:
1)A在本地执行初始化操作,即A在本地通过Init(D)计算得到X≤θ,X>θ, x≤θ,x>θ
2)B用公钥pkb加密L得到
Figure RE-GDA0003624091500000072
并发送给A;
3)A在本地计算
Figure RE-GDA0003624091500000073
4)A随机生成两个矩阵[Z≤θ]1和[Z>θ]1
5)A在本地计算
Figure RE-GDA0003624091500000074
Figure RE-GDA0003624091500000075
并将
Figure RE-GDA0003624091500000076
Figure RE-GDA0003624091500000077
发送给B;
6)B对
Figure RE-GDA0003624091500000078
Figure RE-GDA0003624091500000079
使用私钥skb进行解密得到[Z≤θ]2和[Z>θ]2
7)A与B各自在本地计算
Figure RE-GDA00036240915000000710
Figure RE-GDA00036240915000000711
t={1,2};B向A分享生成的[z≤θ]2和[z>θ]2
4)A收到B发送的[z≤θ]2和[z>θ]2并重构z≤θ和z≤θ
5)A在本地计算特征得分向量s=[(x≤θ-z≤θ/x≤θ)+(x>θ-z>θ/x>θ)]。
具体来说,B拥有一对同态加密密钥{pkb,skb},并用来加密L得到
Figure RE-GDA00036240915000000712
然后B向A发送
Figure RE-GDA00036240915000000713
在计算
Figure RE-GDA00036240915000000714
使用基于同态BFV的乘法运算,可以由A本地执行,从而著降低通信开销。同时,因为矩阵X≤θ和X>θ是二元的 0-1矩阵,所以此处的矩阵乘法本质上是矩阵元素的加法。矩阵Z≤θ和Z>θ的大小为n×p,比大小为n×m的X≤θ和X>θ小得多,需要秘密分享时的
Figure RE-GDA00036240915000000715
Figure RE-GDA0003624091500000081
以及遵循基于秘密共享的矩阵乘法[z≤θ]2和[z>θ]2的通信开销是可接受的。

Claims (3)

1.一种安全的应用于纵向联邦学习的特征选择方法,其特征在于,纵向联邦学习系统中包括拥有特征矩阵的机构A与拥有标签矩阵的机构B,其中,特征矩阵D=(dij)n×m,dij表示D中第i行第j列的元素,标签矩阵Lm×p,m、n、p分别表示样本数、特征数和标签数;机构A与机构B通过以下步骤实现特征选择:初始化步骤:
1)A计算每个特征i的平均值作为特征阈值θi,i=1,2,…,n,
Figure FDA0003534476140000011
Figure FDA0003534476140000012
2)A通过比较每个dij和θi特征矩阵转换为二元的矩阵X≤θ=(xij)n×m,当满足dij≤θi,则X≤θ中的对应元素xij=1;否则xij=0。
3)A根据二元矩阵X≤θ得到二元矩阵X,X=1-X≤θ
4)A计算X≤θ每一行中的元素1的个数
Figure FDA0003534476140000013
和X中每一行中的元素1的个数
Figure FDA0003534476140000014
安全计算步骤:
1)A和B共同计算矩阵Z≤θ=X≤θ×L与矩阵Z=X×L;
2)A和B计算Z≤θ和Z每一行的点积得到n维向量z≤θ和z,并将z≤θ和z返回给A;
结果重构步骤:
1)A得到z≤θ和z后,计算利用x≤θ、x、z≤θ和z来计算特征得分s=[(x≤θ-z≤θ/x≤θ)+(x-z/x)];
2)按单个特征的特征得分进行排序从而实现特征选择。
2.如权利要求1所述方法,其特征在于,A和B在进行安全计算时具体步骤如下:
1)A生成X≤θ,X的秘密分享[X≤θ],[X];B生成L的秘密分享[L];A与B分享将各自生成的秘密分享发送给对方;
2)A与B各自在本地计算矩阵[Z≤θ]=[X≤θ]×[L]与矩阵[Z]=[X]×[L];
3)A与B各自在本地再计算向量
Figure FDA0003534476140000015
向量
Figure FDA0003534476140000016
Figure FDA0003534476140000021
B向A分享生成的[z≤θ]和[z]。
3.如权利要求1所述方法,其特征在于,A和B在进行安全计算时具体步骤如下:
1)B用其同态加密密钥对的公钥pkb加密L得到
Figure FDA0003534476140000022
并发送给A;
2)A在本地计算矩阵
Figure FDA0003534476140000023
和矩阵
Figure FDA0003534476140000024
3)A随机生成两个矩阵[Z≤θ]1和[Z]1
4)A在本地计算
Figure FDA0003534476140000025
Figure FDA0003534476140000026
并将
Figure FDA0003534476140000027
Figure FDA0003534476140000028
发送给B;
6)B对
Figure FDA0003534476140000029
Figure FDA00035344761400000210
用其同态加密密钥对的私钥skb进行解密得到[Z≤θ]2和[Z]2
7)A与B各自在本地计算向量
Figure FDA00035344761400000211
和向量
Figure FDA00035344761400000212
B向A分享生成的[z≤θ]2和[z]2
CN202210215668.2A 2022-03-07 2022-03-07 一种安全的应用于纵向联邦学习的特征选择方法 Active CN114726496B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210215668.2A CN114726496B (zh) 2022-03-07 2022-03-07 一种安全的应用于纵向联邦学习的特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210215668.2A CN114726496B (zh) 2022-03-07 2022-03-07 一种安全的应用于纵向联邦学习的特征选择方法

Publications (2)

Publication Number Publication Date
CN114726496A true CN114726496A (zh) 2022-07-08
CN114726496B CN114726496B (zh) 2023-10-03

Family

ID=82237988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210215668.2A Active CN114726496B (zh) 2022-03-07 2022-03-07 一种安全的应用于纵向联邦学习的特征选择方法

Country Status (1)

Country Link
CN (1) CN114726496B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241567A (zh) * 2020-01-16 2020-06-05 深圳前海微众银行股份有限公司 基于秘密共享的纵向联邦学习方法、系统及存储介质
CN111600707A (zh) * 2020-05-15 2020-08-28 华南师范大学 一种在隐私保护下的去中心化联邦机器学习方法
CN111985573A (zh) * 2020-08-28 2020-11-24 深圳前海微众银行股份有限公司 因子分解机分类模型构建方法、设备及可读存储介质
WO2021106077A1 (ja) * 2019-11-26 2021-06-03 日本電気株式会社 ニューラルネットワークの更新方法、端末装置、計算装置及びプログラム
CN112989399A (zh) * 2021-05-18 2021-06-18 杭州金智塔科技有限公司 数据处理系统及方法
CN113037460A (zh) * 2021-03-03 2021-06-25 北京工业大学 基于同态加密和秘密共享的联邦学习隐私保护方法
CN113516256A (zh) * 2021-09-14 2021-10-19 深圳市洞见智慧科技有限公司 基于秘密共享、同态加密的无第三方联邦学习方法及系统
CN113836556A (zh) * 2021-09-26 2021-12-24 广州大学 面向联邦学习的去中心化函数加密隐私保护方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021106077A1 (ja) * 2019-11-26 2021-06-03 日本電気株式会社 ニューラルネットワークの更新方法、端末装置、計算装置及びプログラム
CN111241567A (zh) * 2020-01-16 2020-06-05 深圳前海微众银行股份有限公司 基于秘密共享的纵向联邦学习方法、系统及存储介质
CN111600707A (zh) * 2020-05-15 2020-08-28 华南师范大学 一种在隐私保护下的去中心化联邦机器学习方法
CN111985573A (zh) * 2020-08-28 2020-11-24 深圳前海微众银行股份有限公司 因子分解机分类模型构建方法、设备及可读存储介质
CN113037460A (zh) * 2021-03-03 2021-06-25 北京工业大学 基于同态加密和秘密共享的联邦学习隐私保护方法
CN112989399A (zh) * 2021-05-18 2021-06-18 杭州金智塔科技有限公司 数据处理系统及方法
CN113516256A (zh) * 2021-09-14 2021-10-19 深圳市洞见智慧科技有限公司 基于秘密共享、同态加密的无第三方联邦学习方法及系统
CN113836556A (zh) * 2021-09-26 2021-12-24 广州大学 面向联邦学习的去中心化函数加密隐私保护方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MENG HAO: "Efficient and Privacy-Enhanced Federated Learning for Industrial Artificial Intelligence" *
WEI OU, JIANHUAN ZENG: "A Homomorphic-encryption-based Vertical Federated Learning Scheme for Rick Management" *
李尤慧子: "面向隐私保护的非聚合式数据共享综述" *
蒋瀚;刘怡然;宋祥福;王皓;郑志华;徐秋亮;: "隐私保护机器学习的密码学方法", 电子与信息学报, no. 05 *

Also Published As

Publication number Publication date
CN114726496B (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
CN109194507B (zh) 非交互式的保护隐私神经网络预测方法
CN112182649A (zh) 一种基于安全两方计算线性回归算法的数据隐私保护系统
Lin et al. Encryption and decryption of audio signal and image secure communications using chaotic system synchronization control by TSK fuzzy brain emotional learning controllers
Wu et al. Privacy-preservation for stochastic gradient descent application to secure logistic regression
Baryalai et al. Towards privacy-preserving classification in neural networks
CN113987255B (zh) 基于联邦学习与秘密分享的多源密文图像检索方法
CN117711578B (zh) 一种医学影像数据分析管理系统
Chen et al. Fed-EINI: An efficient and interpretable inference framework for decision tree ensembles in vertical federated learning
Zhang et al. Secure feature selection for vertical federated learning in ehealth systems
CN115311118A (zh) 一种基于二维离散忆阻超混沌映射的遥感图像加密方法
CN116644778A (zh) 量子同态神经网络的构建方法及加密图像分类方法
Jiang et al. Private facial prediagnosis as an edge service for parkinson's dbs treatment valuation
Shao et al. Privacy-preserving and verifiable cloud-aided disease diagnosis and prediction with hyperplane decision-based classifier
Kuang et al. A dual-branch neural network for DeepFake video detection by detecting spatial and temporal inconsistencies
Yang et al. Accurate image-based pedestrian detection with privacy preservation
Chen et al. Fed-EINI: an efficient and interpretable inference framework for decision tree ensembles in federated learning
CN114726496A (zh) 一种安全的应用于纵向联邦学习的特征选择方法
Hamza et al. Privacy-preserving deep learning techniques for wearable sensor-based Big Data applications
CN116094686B (zh) 用于量子卷积计算的同态加密方法、系统、设备及终端
CN114638274A (zh) 特征选择方法、设备、可读存储介质及计算机程序产品
CN116402159A (zh) 联邦学习方法、预测方法、装置、电子设备及存储介质
CN114338944A (zh) 一种基于深度学习的密文域图像分类方法
Guo et al. Privacy-preserving convolution neural network inference with edge-assistance
Zhou et al. Homomorphic multi-label classification of virus strains
Liu et al. Secure medical data on cloud storage via DNA homomorphic encryption technique

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant