CN114547643A - 一种基于同态加密的线性回归纵向联邦学习方法 - Google Patents

一种基于同态加密的线性回归纵向联邦学习方法 Download PDF

Info

Publication number
CN114547643A
CN114547643A CN202210064492.5A CN202210064492A CN114547643A CN 114547643 A CN114547643 A CN 114547643A CN 202210064492 A CN202210064492 A CN 202210064492A CN 114547643 A CN114547643 A CN 114547643A
Authority
CN
China
Prior art keywords
owner
data
consumer
random
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210064492.5A
Other languages
English (en)
Other versions
CN114547643B (zh
Inventor
何道敬
袁露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jingshan Technology Co ltd
East China Normal University
Original Assignee
Shanghai Jingshan Technology Co ltd
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jingshan Technology Co ltd, East China Normal University filed Critical Shanghai Jingshan Technology Co ltd
Priority to CN202210064492.5A priority Critical patent/CN114547643B/zh
Publication of CN114547643A publication Critical patent/CN114547643A/zh
Application granted granted Critical
Publication of CN114547643B publication Critical patent/CN114547643B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于同态加密的线性回归纵向联邦学习方法,包括步骤:a)建模训练;b)两种预测。建模训练:采用minist数据集,步骤如下:owner即数据应用方,利用Paillier生成公私钥对,consumer即数据持有,计算特征值与特征矩阵的乘积发送给owner,owner计算预测标签
Figure DDA0003479576890000011
通过与实际Y对比得到
Figure DDA0003479576890000014
然后计算梯度,利用梯度来更新特征值的权重,直到模型达收敛范围,训练结束。预测方法1:无第三方,consumer计算特征值与特征矩阵的乘积发给owner,计算预测值
Figure DDA0003479576890000012
返回给consumer。预测方法2:基于差分隐私,Carol整合双方特征参数后发给consumer,consumer计算预测标签
Figure DDA0003479576890000013
将结果发给Carol。本发明创新点:训练阶段,梯度始终加密,无第三方,未暴露过多特征参数;预测阶段可防止合谋攻击。

Description

一种基于同态加密的线性回归纵向联邦学习方法
技术领域
本发明属于纵向联邦学习领域,特别涉及去除第三方的基于同态加密的线性回归纵向联邦学习建模训练,以及基于差分隐私的模型预测方法。
背景技术
随着互联网技术的发展,机器学习越来越多的参与到社会建设的方方面面,然而当前机器学习始终面临两大挑战:一是数据安全难以得到保障,数据泄露问题频发;二是由于网络安全隔离和行业隐私,不同行业、不同部门之间存在数据壁垒。导致数据形成―孤岛无法安全共享,而仅凭各部门独立数据训练的机器学习模型性能无法达到全局最优化。为了解决以上问题,谷歌率先提出联邦学习技术,其通过将机器学习的数据存储和模型训练阶段转移至本地用户,而仅与中心服务器交互模型更新的方式有效保障了用户的隐私安全。
联邦学习应用场景不同,客户端之间持有的数据集特征各不相同。假设Dm代表客户端m持有的数据,I表示样本ID,Y表示数据集的标签信息,X表示数据集的特征信息,因此一个完整的训练数据集D应由(I,Y,X)构成。根据参与训练客户端的数据集特征信息X的不同,联邦学习被分为横向联邦学习、纵向联邦学习和联邦迁移学习。
由于安全多方计算(Secure multiparty computation,即MPC)相关技术热度持续高升,有许多研究中使用MPC技术直接加密数据集进行机器学习训练,虽然保护了数据隐私安全,但是计算开销和通信开销呈指数级增加,在大数据环境下,这显然更加是一种挑战。联邦学习也应运而生,谷歌率先公开了联邦学习框架FATE,其中纵向联邦学习支持多个参与方联合数据集,在数据中心形成一个完整的数据池进行模型训练,在此过程中每个参与方数据都得到了保护,共同建模提高了模型的拟合度,自身模型无损耗。还有学者将联邦学习引入到更加丰富的应用场景中,根据参与方之间数据分布的差异,形成了完整的联邦学习框架包括横向联邦学习框架、纵向联邦学习框架和联邦迁移学习框架。
线性回归是目前流行病学和医学的疾病诊断、金融行业经济预测等最常用的分析方法,从一组样本数据出发,确定变量之间的数学关系式,对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出显著变量。目前联邦学习框架中大多使用泰勒展开来进行预测,这样会大大损失模型的精确度,同时大多数都有第三方存在,这个第三方在最开始为数据各方分配公钥,第三方持有对应私钥。各个参与方利用该公钥对训练数据的中间结果进行加密后通信,第三方用私钥解密来自各方的中间结果,计算得出此次迭代的中间结果更新。这个过程中,第三方获得了其他参与方的隐私数据,参与方的隐私信息仍然存在暴露的危险。而且应用公钥系统会导致复杂性过高。
发明内容
本发明的目的是提供一种基于同态加密的线性回归纵向联邦学习方法。在训练阶段,利用梯度构建乘法对,相比于Fate的训练方法,本发明直接去除第三方,数据隐私得到更好的保护,同时训练过程中始终利用梯度来更新参数,在保证系统安全性的同时,大大降低了系统的复杂性和提高系统的效率。训练结束后,提供两种模型预测方法,去除第三方的预测方法,简单高效,能迅速得到结果,基于差分隐私的预测方法,在借助第三方的算力同时,加入拉普拉斯噪音能有效防止数据被反推出来,避免了全集的设定,高效且安全。
实现本发明目的的具体技术方案是:
一种基于同态加密的线性回归纵向联邦学习方法,该方法包括下述步骤:
步骤1:构建基于同态加密的线性回归训练模型:
数据应用者即owner:同时持有数据矩阵和类标签的数据提供者;
数据持有者即consumer:将只有一个数据矩阵的数据提供者定义为数据持有者;数据持有者在联邦学习中扮演客户的角色;
步骤A1:初始化模型参数WA∈R1*a,WB∈R1*b,特征值XA∈Rn*a,XB∈Rn*b,owner利用Paillier算法生成公私钥对;所述WA∈R1*a为owner的模型参数,n表示有n个样本,a表示owner有a个特征值,XA表示owner的特征值;WB∈R1*b,b表示consumer有b个特征值,R表示矩阵,Paillier为一种同态加密算法,初始化模型阈值Limites;
步骤A2:consumer和owner分别计算特征值与特征矩阵的乘积,consumer计算加密后的特征值与特征矩阵乘积:
Figure BDA0003479576870000021
发给owner,owner将其解密,然后带入线性回归方程计算预测值
Figure BDA0003479576870000022
并计算加密后的实际值与预测值的误差即:
Figure BDA0003479576870000023
发给consumer,Encrypt()表示加密,y′表示线性回归方程的预测值,T表示矩阵转置;
步骤A3:利用偏导值更新参数,owner计算偏导值
Figure BDA0003479576870000024
owner更新模型参数WA=WA-nLA∈R1*a,owner将加密的偏导值发送给consumer,同理利用加法同态性consumer更新模型参数Encrypt(WB)=Encrypt(WB)-nEncrypt(LB)∈R1*b,LA表示owner偏导值,LB表示consumer偏导值,η表示学习率;
步骤A4:一直重复步骤A2和步骤A3,直到满足
Figure BDA0003479576870000025
其中:sum是指求和,
Figure BDA0003479576870000026
是一个向量,表示实际类标签与预测类标签的差值,整体即:本轮向量
Figure BDA0003479576870000027
内所有元素之和与上轮向量
Figure BDA0003479576870000028
元素之和的差与阈值Limites的比较;
步骤A5:步骤4执行完毕之后owner直接获得更新后的模型参数WA∈R1*a,consumer在本地得到Encrypt(WB),利用加法同态性,consumer选择随机向量RB∈R1*b并计算;Encrypt(WB+RB)=Encrypt(RBWB)发送给owner,owner解密之后consumer再减去随机矩阵即可获得自己更新后的参数Decrypt(WB)=Decrypt(Encrypt(WB+RB))-RB
consumer和owner得到了纵向联邦学习的模型参数WB,WA;其中,Decrypt()表示解密;
步骤2:去除第三方对模型进行预测或基于差分隐私的借助第三方对模型进行预测:
步骤B1:owner利用得到的模型参数WA,计算
Figure BDA0003479576870000031
步骤B2:consumer计算
Figure BDA0003479576870000032
发给owner;
步骤B3:owner计算
Figure BDA0003479576870000033
并将结果返回给consumer;
consumer得到了预测值:类标签y;
基于差分隐私的借助第三方模型预测:
步骤C1:owner计算Encrypt(WA)∈R1*n并发送给Carol,Carol表示可信第三方,同时拥有consumer和owner的特征值XB,XA
步骤C2:Carol计算
Figure BDA0003479576870000034
Figure BDA0003479576870000035
发送给consumer;
步骤C3:consumer计算
Figure BDA0003479576870000036
发送给Carol,Lap(0,1)表示拉普拉斯噪音:
步骤C4:Carol计算Encrypt(y)+Random发送给owner,Random是随机向量;
步骤C5:Owner计算y+Random=D(Encrypt(y+Random))发送给Carol;
Carol得到最终的预测结果:类标签y。
步骤1中所述纵向联邦学习具体为:在两个数据集合中,用户相同而特征不同,将数据集进行纵向切割,取出双方用户相同而用户特征不完全相同的那部分数据进行训练,具体包括下述步骤:
步骤D1:无标签数据的参与方提供加密特征数据协助有标签数据的参与方进行梯度更新和模型参数更新;
步骤D2:有标签数据的参与方提供加密标签数据协助无标签数据的参与方进行梯度更新和模型参数更新;
步骤D3:D1-D2步骤进行迭代,直至纵向联邦学习模型收敛至某一阈值或者达到最大迭代次数。
步骤A1中,所述的同态加密算法Paillier具体为:
步骤E1:生成公私钥对,设p、q是两个满足要求的大素数,且N=pq,
Figure BDA0003479576870000041
Figure BDA0003479576870000042
公钥pk=(N,g),其中N为公开模,而g为公开基;私钥sk=λ(N)=lcm(p-1,q-1);
步骤E2:加密过程,对于任意密文c∈Zn随机选择
Figure BDA0003479576870000045
得到密文c=Encryptpk(m)=gmrNmodN2,符号解释:N表示两质数pq的乘积,g为随机数,Z*表示整数;
步骤E3:解密过程,对于任意密文c∈Zn解密得明文:m=Dsk(c)=L(Cλ(N))modN2)/L(g)λ(N)modN2)modN。
步骤C3中,所述的Lap(0,1)拉普拉斯噪音具体为:
步骤F1:若给定的某随机函数K在某相邻数据集D1和D2上的两个概率输出结果满足如下不等式,则随机函数K满足(∈,δ)-差分隐私;
Pr[K(D1∈S)]≤exp(∈)Pr[K(D2)∈S]+δ (1)
其中Pr表示概率,S表示数据范围,exp即自然质数函数,相邻数据集指的是至多相差一条记录的两个数据集,即一个数据集有另一个数据集增加或删除一条记录产生;式(1)中Pr[K(D1∈S)]表示函数K在D1上的输出在值域S(S∈Range(K))的概率,两个概率值的比小于等于e,∈称为隐私预算或隐私参数,用来平衡隐私保护程度和数据的可用性;从式(1))可以看出,∈越小,两个概率值越趋向于一致,即单条记录的存在与否不影响输出结果,则隐私保护程度越高,相应地,数据可用性越低;同理∈越大,则隐私保护程度越低,而数据可用性越高;当∈=0时,相邻数据集能够以一样的概率分布输出,当然就完全丧失了数据的可用性;
步骤F2:去掉δ并将式(1)变形可得,
Figure BDA0003479576870000043
Laplace机制:对于任意给定的查询函数f:D→Rd,若M(d)满足如下等式的输出结果,则以下Laplace机制满足∈-差分隐私;
Figure BDA0003479576870000044
在式(3)中,(Laplace(·)d为d维的拉普拉斯分布;显示出,添加的噪声水平与Δf成正比,与隐私预算∈成反比,这符合预期。
本发明的有益效果在于:
第一,本发明提出了一种基于同态加密的线性回归纵向联邦学习方法,在建模训练阶段不需要第三方的参与,避免了过多暴露数据参数,在保证系统安全性的同时,大大降低了系统的复杂性,减少了数据泄露的风险。
第二,本发明采用一种基于同态加密的训练方法,在训练阶段不用直接传递特征参数,而是采用梯度下降的方法来训练,这样既可以保护数据的隐私,同时也提高了训练的效率,避免了泰勒展开式和公钥系统加密,大大提高了模型精确度。
第三,设计了基于差分隐私的模型预测方法,该方法不仅实现简单,极大的保护数据持有者数据的隐私,并且避免了全集的设定,阻挡合谋攻击。
附图说明
图1为本发明流程示意图;
图2为本发明实施例纵向联邦学习示意图。
具体实施方式
结合以下具体实施例和附图,对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
实施例
假设有一家保险公司和一家银行,需要通过纵向联邦学习来共享数据,判断用户是否为潜在的优质客户。银行owner是数据应用者,保险公司consumer是数据持有者,对基于线性回归的纵向联邦学习方法步骤具体如下:
第一阶段,银行拥有客户的多个特征值XA∈Rn*a、特征参数WA∈R1*a,类标签Y表客户示是否优质,保险公司拥有特征值XB∈Rn*b和相应的特征参数WB∈R1*b,保险公司需要在不暴露自己特征参数的前提下联合银行来判断自己的客户里面是否有潜在的优质客户。初始模型参数Wk,k∈[1,n],其中n为样本数量,学习率为α,阈值limites=0.01。
第二阶段,获取样本信息并对样本进行对齐,对齐样本是进行联邦学习的第一步,纵向联邦学习流程图如图2所示。样本对齐即对数据进行隐私求交,本发明中使用不经意传输来实现。假设参与双方A、B,都只有一个元素,这时隐私集合求交,就退化成了隐私比较,即A、B比较持有的元素是否相等,同时不泄露自己持有的元素。发送方A持有一组二进制串,可以将这些二进制串整体当作一个随机种子,由A持有。从B的角度来看,隐私比较的过程,就是B输入数据X,得到一个随机二进制串,这个二进制串由A持有的随机种子与输入X来决定,同时A无法得知B的输入X。这一过程,就可以看作是不经意伪随机函数。
第三阶段,银行owner调用Paillier生成公私钥对,并将公钥发给保险公司consumer,然后保险公司计算自己的特征值与特征参数的矩阵乘积并用公钥进行加密,
Figure BDA0003479576870000061
将计算结果发给银行owner,owner接受到数据之后,首先利用私钥解密得到银行的特征值与特征参数的乘积,再结合自己的特征值与特征矩阵,带入线性回归方程就可以计算预测标签值即
Figure BDA0003479576870000062
通过预测值与对应特征所对的实际Y标签做对比即可计算出
Figure BDA0003479576870000063
然后owner和consumer就可以计算各自的梯度即
Figure BDA0003479576870000064
通过梯度来更新模型参数W=W-nL∈R1*a。重复上述步骤,每一次迭代都通过梯度来收敛模型更新特征值的对应权重,直达预测值和实际标签值之间的误差达到预期即可停止训练,最终银行和保险公司都会得到每个特征值所对应的特征参数。
第四阶段,对模型进行预测,由于银行和保险公司的数据比较敏感,这里直接选择去除第三方进行预测,保险公司加密计算特征值与特征矩阵乘积
Figure BDA0003479576870000065
发给银行解密之后直接带入回归方程,计算
Figure BDA0003479576870000066
并将结果返回给保险公司,最后双方都可以得到用户标签Y。整个训练和预测过程银行和保险公司的敏感数据都不会直接暴露出去,且最终可以完成用户画像。

Claims (4)

1.一种基于同态加密的线性回归纵向联邦学习方法,其特征在于,该方法包括下述步骤:
步骤1:构建基于同态加密的线性回归训练模型:
数据应用者即owner:同时持有数据矩阵和类标签的数据提供者;
数据持有者即consumer:将只有一个数据矩阵的数据提供者定义为数据持有者;数据持有者在联邦学习中扮演客户的角色;
步骤A1:初始化模型参数WA∈R1*a,WB∈R1*b,特征值XA∈Rn*a,XB∈Rn*b,owner利用Paillier算法生成公私钥对;所述WA∈R1*a为owner的模型参数,n表示有n个样本,a表示owner有a个特征值,XA表示owner的特征值;WB∈R1*b,b表示consumer有b个特征值,R表示矩阵,Paillier为一种同态加密算法,初始化模型阈值Limites;
步骤A2:consumer和owner分别计算特征值与特征矩阵的乘积,consumer计算加密后的特征值与特征矩阵乘积:
Figure FDA0003479576860000011
发给owner,owner将其解密,然后带入线性回归方程计算预测值
Figure FDA0003479576860000012
并计算加密后的实际值与预测值的误差即:
Figure FDA0003479576860000013
发给consumer,Encrypt()表示加密,y′表示线性回归方程的预测值,T表示矩阵转置;
步骤A3:利用偏导值更新参数,owner计算偏导值
Figure FDA0003479576860000014
owner更新模型参数WA=WA-nLA∈R1*a,owner将加密的偏导值发送给consumer,同理利用加法同态性consumer更新模型参数Encrypt(WB)=Encrypt(WB)-nEncrypt(LB)∈R1*b,LA表示owner偏导值,LB表示consumer偏导值,η表示学习率;
步骤A4:一直重复步骤A2和步骤A3,直到满足
Figure FDA0003479576860000015
其中:sum是指求和,
Figure FDA0003479576860000016
是一个向量,表示实际类标签与预测类标签的差值,整体即:本轮向量
Figure FDA0003479576860000017
内所有元素之和与上轮向量
Figure FDA0003479576860000018
元素之和的差与阈值Limites的比较;
步骤A5:步骤4执行完毕之后owner直接获得更新后的模型参数WA∈R1*a,consumer在本地得到Encrypt(WB),利用加法同态性,consumer选择随机向量RB∈R1*b并计算;Encrypt(WB+RB)=Encrypt(RBWB)发送给owner,owner解密之后consumer再减去随机矩阵即可获得自己更新后的参数Decrypt(WB)=Decrypt(Encrypt(WB+RB))-RB
consumer和owner得到了纵向联邦学习的模型参数WB,WA;其中,Decrypt()表示解密;
步骤2:去除第三方对模型进行预测或基于差分隐私的借助第三方对模型进行预测:
步骤B1:owner利用得到的模型参数WA,计算
Figure FDA0003479576860000019
步骤B2:consumer计算
Figure FDA0003479576860000021
发给owner;
步骤B3:owner计算
Figure FDA0003479576860000022
并将结果返回给consumer;
consumer得到了预测值:类标签y;
基于差分隐私的借助第三方模型预测:
步骤C1:owner计算Encrypt(WA)∈R1*n并发送给Carol,Carol表示可信第三方,同时拥有consumer和owner的特征值XB,XA
步骤C2:Carol计算
Figure FDA0003479576860000023
Figure FDA0003479576860000024
发送给consumer;
步骤C3:consumer计算
Figure FDA0003479576860000025
发送给Carol,Lap(0,1)表示拉普拉斯噪音:
步骤C4:Carol计算Encrypt(y)+Random发送给owner,Random是随机向量;
步骤C5:Owner计算y+Random=D(Encrypt(y+Random))发送给Carol;
Carol得到最终的预测结果:类标签y。
2.根据权利要求1所述的一种基于同态加密的线性回归纵向联邦学习方法,其特征在于,步骤1中所述纵向联邦学习具体为:在两个数据集合中,用户相同而特征不同,将数据集进行纵向切割,取出双方用户相同而用户特征不完全相同的那部分数据进行训练,具体包括下述步骤:
步骤D1:无标签数据的参与方提供加密特征数据协助有标签数据的参与方进行梯度更新和模型参数更新;
步骤D2:有标签数据的参与方提供加密标签数据协助无标签数据的参与方进行梯度更新和模型参数更新;
步骤D3:D1-D2步骤进行迭代,直至纵向联邦学习模型收敛至某一阈值或者达到最大迭代次数。
3.根据权利要求1所述的一种基于同态加密的线性回归纵向联邦学习方法,其特征在于,步骤A1中,所述的同态加密算法Paillier具体为:
步骤E1:生成公私钥对,设p、q是两个满足要求的大素数,且N=pq,
Figure FDA0003479576860000026
Figure FDA0003479576860000027
公钥pk=(N,g),其中N为公开模,而g为公开基;私钥sk=λ(N)=lcm(p-1,q-1);
步骤E2:加密过程,对于任意密文c∈Zn随机选择
Figure FDA0003479576860000028
得到密文c=Encryptpk(m)=gmrNmodN2,符号解释:N表示两质数pq的乘积,g为随机数,Z*表示整数;
步骤E3:解密过程,对于任意密文c∈Zn解密得明文:m=Dsk(c)=L(Cλ(N))modN2)/L(g)λ(N)modN2)modN。
4.根据权利要求1所述的一种基于同态加密的线性回归纵向联邦学习方法,其特征在于,步骤C3中,所述的Lap(0,1)拉普拉斯噪音具体为:
步骤F1:若给定的某随机函数K在某相邻数据集D1和D2上的两个概率输出结果满足如下不等式,则随机函数K满足(∈,δ)-差分隐私;
Pr[K(D1∈S)]≤exp(∈)Pr[K(D2)∈S]+δ (1)
其中Pr表示概率,S表示数据范围,exp即自然质数函数,相邻数据集指的是至多相差一条记录的两个数据集,即一个数据集有另一个数据集增加或删除一条记录产生;式(1)中Pr[K(D1∈S)]表示函数K在D1上的输出在值域S(S∈Range(K))的概率,两个概率值的比小于等于e,∈称为隐私预算或隐私参数,用来平衡隐私保护程度和数据的可用性;从式(1))可以看出,∈越小,两个概率值越趋向于一致,即单条记录的存在与否不影响输出结果,则隐私保护程度越高,相应地,数据可用性越低;同理∈越大,则隐私保护程度越低,而数据可用性越高;当∈=0时,相邻数据集能够以一样的概率分布输出,当然就完全丧失了数据的可用性;
步骤F2:去掉δ并将式(1)变形可得,
Figure FDA0003479576860000031
Laplace机制:对于任意给定的查询函数f:D→Rd,若M(d)满足如下等式的输出结果,则以下Laplace机制满足∈-差分隐私;
Figure FDA0003479576860000032
在式(3)中,(Laplace(·)d为d维的拉普拉斯分布;显示出,添加的噪声水平与Δf成正比,与隐私预算∈成反比,这符合预期。
CN202210064492.5A 2022-01-20 2022-01-20 一种基于同态加密的线性回归纵向联邦学习方法 Active CN114547643B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210064492.5A CN114547643B (zh) 2022-01-20 2022-01-20 一种基于同态加密的线性回归纵向联邦学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210064492.5A CN114547643B (zh) 2022-01-20 2022-01-20 一种基于同态加密的线性回归纵向联邦学习方法

Publications (2)

Publication Number Publication Date
CN114547643A true CN114547643A (zh) 2022-05-27
CN114547643B CN114547643B (zh) 2024-04-19

Family

ID=81671511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210064492.5A Active CN114547643B (zh) 2022-01-20 2022-01-20 一种基于同态加密的线性回归纵向联邦学习方法

Country Status (1)

Country Link
CN (1) CN114547643B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115640509A (zh) * 2022-12-26 2023-01-24 北京融数联智科技有限公司 一种联邦隐私计算中的数据相关性计算方法及系统
CN116049909A (zh) * 2023-01-28 2023-05-02 腾讯科技(深圳)有限公司 联邦特征工程中的特征筛选方法、装置、设备及存储介质
CN116451275A (zh) * 2023-06-15 2023-07-18 北京电子科技学院 一种基于联邦学习的隐私保护方法及计算设备
CN116541870A (zh) * 2023-07-04 2023-08-04 北京富算科技有限公司 用于评估联邦学习模型的方法及装置
CN116882571A (zh) * 2023-07-12 2023-10-13 南京邮电大学 一种基于安全纵向联邦回归模型的烟草销售违规信息预测方法
CN117131443A (zh) * 2023-09-06 2023-11-28 上海零数众合信息科技有限公司 联邦多目标分类方法及系统
WO2024060409A1 (zh) * 2022-09-20 2024-03-28 天翼电子商务有限公司 一种基于联邦学习的单方实时预测算法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021092980A1 (zh) * 2019-11-14 2021-05-20 深圳前海微众银行股份有限公司 纵向联邦学习优化方法、装置、设备及存储介质
CN112906912A (zh) * 2021-04-01 2021-06-04 深圳市洞见智慧科技有限公司 纵向联邦学习中无可信第三方的回归模型训练方法及系统
CN113055902A (zh) * 2021-03-25 2021-06-29 中国科学院计算技术研究所 一种智能化的移动通信网络系统
CN113434873A (zh) * 2021-06-01 2021-09-24 内蒙古大学 一种基于同态加密的联邦学习隐私保护方法
WO2021204268A1 (zh) * 2020-04-10 2021-10-14 支付宝(杭州)信息技术有限公司 基于隐私数据进行模型训练
CN113505894A (zh) * 2021-06-02 2021-10-15 北京航空航天大学 纵向联邦学习线性回归和逻辑回归模型训练方法及装置
CN113553610A (zh) * 2021-09-22 2021-10-26 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于同态加密和可信硬件的多方隐私保护机器学习方法
CN113657617A (zh) * 2020-04-23 2021-11-16 支付宝(杭州)信息技术有限公司 一种模型联合训练的方法和系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021092980A1 (zh) * 2019-11-14 2021-05-20 深圳前海微众银行股份有限公司 纵向联邦学习优化方法、装置、设备及存储介质
WO2021204268A1 (zh) * 2020-04-10 2021-10-14 支付宝(杭州)信息技术有限公司 基于隐私数据进行模型训练
CN113657617A (zh) * 2020-04-23 2021-11-16 支付宝(杭州)信息技术有限公司 一种模型联合训练的方法和系统
CN113055902A (zh) * 2021-03-25 2021-06-29 中国科学院计算技术研究所 一种智能化的移动通信网络系统
CN112906912A (zh) * 2021-04-01 2021-06-04 深圳市洞见智慧科技有限公司 纵向联邦学习中无可信第三方的回归模型训练方法及系统
CN113434873A (zh) * 2021-06-01 2021-09-24 内蒙古大学 一种基于同态加密的联邦学习隐私保护方法
CN113505894A (zh) * 2021-06-02 2021-10-15 北京航空航天大学 纵向联邦学习线性回归和逻辑回归模型训练方法及装置
CN113553610A (zh) * 2021-09-22 2021-10-26 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于同态加密和可信硬件的多方隐私保护机器学习方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KUIHE YANG 等: "Model Optimization Method Based on Vertival Federated Learning", 2021 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS(ISCAS), 27 April 2021 (2021-04-27), pages 1 - 5 *
贾延延;张昭;冯键;王春凯;: "联邦学习模型在涉密数据处理中的应用", 中国电子科学研究院学报, no. 01, 20 January 2020 (2020-01-20), pages 43 - 49 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024060409A1 (zh) * 2022-09-20 2024-03-28 天翼电子商务有限公司 一种基于联邦学习的单方实时预测算法
CN115640509A (zh) * 2022-12-26 2023-01-24 北京融数联智科技有限公司 一种联邦隐私计算中的数据相关性计算方法及系统
CN116049909A (zh) * 2023-01-28 2023-05-02 腾讯科技(深圳)有限公司 联邦特征工程中的特征筛选方法、装置、设备及存储介质
CN116451275A (zh) * 2023-06-15 2023-07-18 北京电子科技学院 一种基于联邦学习的隐私保护方法及计算设备
CN116451275B (zh) * 2023-06-15 2023-08-22 北京电子科技学院 一种基于联邦学习的隐私保护方法及计算设备
CN116541870A (zh) * 2023-07-04 2023-08-04 北京富算科技有限公司 用于评估联邦学习模型的方法及装置
CN116541870B (zh) * 2023-07-04 2023-09-05 北京富算科技有限公司 用于评估联邦学习模型的方法及装置
CN116882571A (zh) * 2023-07-12 2023-10-13 南京邮电大学 一种基于安全纵向联邦回归模型的烟草销售违规信息预测方法
CN116882571B (zh) * 2023-07-12 2023-12-12 南京邮电大学 一种基于安全纵向联邦回归模型的烟草销售违规信息预测方法
CN117131443A (zh) * 2023-09-06 2023-11-28 上海零数众合信息科技有限公司 联邦多目标分类方法及系统

Also Published As

Publication number Publication date
CN114547643B (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
CN114547643A (zh) 一种基于同态加密的线性回归纵向联邦学习方法
Li et al. Multi-key privacy-preserving deep learning in cloud computing
CN111160573B (zh) 保护数据隐私的双方联合训练业务预测模型的方法和装置
Mitani et al. Traceability in permissioned blockchain
Liu et al. Oblivious neural network predictions via minionn transformations
CN108712260B (zh) 云环境下保护隐私的多方深度学习计算代理方法
US20200394518A1 (en) Method for collaborative learning of an artificial neural network without disclosing training data
WO2022237450A1 (zh) 多方安全计算方法、装置、设备及存储介质
CN111242290B (zh) 一种轻量级隐私保护生成对抗网络系统
JP2016512611A (ja) プライバシー保護リッジ回帰
CN113221105B (zh) 一种基于部分参数聚合的鲁棒性联邦学习算法
CN114330759B (zh) 一种纵向联邦学习模型的训练方法及系统
Erkin et al. Privacy-preserving distributed clustering
CN114696990B (zh) 基于全同态加密的多方计算方法、系统及相关设备
Papadimitriou et al. DStress: Efficient differentially private computations on distributed data
Sharma et al. Implementation of cryptography for privacy preserving data mining
CN112613618A (zh) 一种安全联邦学习逻辑回归算法
CN115130880A (zh) 非对称场景下基于联邦学习金融电力数据融合方法及介质
Liu et al. Privacy preserving pca for multiparty modeling
Ying Shared MF: A privacy-preserving recommendation system
Kumbhar et al. Privacy preserving mining of association rules on horizontally and vertically partitioned data: a review paper
CN113962286A (zh) 一种基于分段函数的去中心化逻辑回归分类预测方法
Zhao et al. VFLR: An efficient and privacy-preserving vertical federated framework for logistic regression
CN117521102A (zh) 一种基于联邦学习的模型训练方法及装置
Mai et al. Privacy-preserving multiview matrix factorization for recommender systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant