CN110190946B - 一种基于同态加密的隐私保护多机构数据分类方法 - Google Patents

一种基于同态加密的隐私保护多机构数据分类方法 Download PDF

Info

Publication number
CN110190946B
CN110190946B CN201910629833.7A CN201910629833A CN110190946B CN 110190946 B CN110190946 B CN 110190946B CN 201910629833 A CN201910629833 A CN 201910629833A CN 110190946 B CN110190946 B CN 110190946B
Authority
CN
China
Prior art keywords
data
encryption
homomorphic encryption
ciphertext
polynomials
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910629833.7A
Other languages
English (en)
Other versions
CN110190946A (zh
Inventor
李劲松
陆遥
周天舒
李润泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN201910629833.7A priority Critical patent/CN110190946B/zh
Publication of CN110190946A publication Critical patent/CN110190946A/zh
Priority to JP2021533328A priority patent/JP7064682B2/ja
Priority to PCT/CN2020/083590 priority patent/WO2020233260A1/zh
Application granted granted Critical
Publication of CN110190946B publication Critical patent/CN110190946B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于同态加密的隐私保护多机构数据分类方法,首先使用者生成训练数据的筛选条件发送给计算中心;计算中心利用同态加密算法生成加密参数发送给各家数据提供机构;各家数据提供机构对标注有分类标签的本地数据进行筛选,得到训练数据,根据加密参数利用同态加密算法生成各自的公钥和私钥,通过公钥加密训练数据发送给计算中心;计算中心与各家数据提供机构共同执行同态加密下的逻辑回归分析,得到数据分类模型发送给使用者;使用者将待分类数据输入数据分类模型得到分类结果。本发明在实际应用中具有更高的安全性,既有效保护了个人隐私,又避免了数据提供机构可能产生的利益损失,在很大程度上促进了多机构数据分析的开展。

Description

一种基于同态加密的隐私保护多机构数据分类方法
技术领域
本发明属于多机构数据分析技术领域,尤其涉及一种基于同态加密的隐私保护多机构数据分类方法。
背景技术
当前,大多数的数据分析研究都是在单个机构的有限数据集上进行的。然而,这样的做法具有很大的局限性。一方面,针对某些特定研究,单个机构可能无法产生足够多的的支撑数据,例如:针对某种罕见病,单家医疗机构通常无法提供足够的数据;另一方面,由于各种观测技术的发展,产生了越来越多的异质数据,这也对数据挖掘提出了更多的挑战,例如:范德堡大学的科学家Joshua C Denny于2013年的研究表明,在单家医疗机构的电子病历上进行的全基因组关联研究常常会因为数据量的匮乏而无法得到满意的研究结果。因此,多机构的协同研究势在必行。
目前,为了实现多机构的数据分析,不少多机构数据分析方法被提出并付诸实践,例如观察性健康医疗数据科学与信息学联盟(OHDSI)。多机构数据分析方法主要有训练数据筛选、训练数据上传、分析模型建立、获得模型并进行分析四个步骤。为了保护个人隐私,它们通常在数据上传前会对各家机构提供的数据进行敏感信息的去除。
目前提出的多机构数据分析方法仅仅处理了敏感信息,仍然暴露了大量的信息。一方面,通过对这些暴露的信息进行适当处理,能够推导出部分的敏感信息,从而导致个人隐私的泄露。另一方面,数据本身就具有价值,暴露的大量信息可能在未授权的情况下被第三方恶意使用,从而导致数据提供机构的利益损失。这极大程度地妨碍了多机构数据分析的开展。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于同态加密的隐私保护多机构数据分类方法,首先,在数据生成与上传阶段,各家数据提供机构在上传数据之前利用同态加密技术对各自的数据进行加密,避免了任何信息的泄露。其次,在数据分析阶段,计算中心会与各家数据提供机构共同完成分析中间值与分类模型的解密,避免了在运算过程中任何有意义信息的泄露,有效防止了第三方对于数据的恶意使用。
本发明的目的是通过以下技术方案来实现的:一种基于同态加密的隐私保护多机构数据分类方法,该方法包括以下步骤:
(1)使用者生成训练数据的筛选条件,并将筛选条件发送给计算中心;
(2)计算中心接收筛选条件,利用同态加密算法生成加密参数,并将加密参数连同步骤1的筛选条件一同发送给各家数据提供机构;
(3)各家数据提供机构根据筛选条件对标注有分类标签的本地数据进行筛选,得到训练数据;
(4)各家数据提供机构根据加密参数,利用同态加密算法生成各自的公钥和私钥;
(5)各家数据提供机构通过公钥加密训练数据,其中特征变量加密,分类变量不加密,并将加密后的训练数据连同对应公钥一同发送给计算中心;
(6)计算中心接收到各家数据提供机构加密后的训练数据以及对应公钥后,与各家数据提供机构共同执行同态加密下的逻辑回归分析,得到数据分类模型;
(7)计算中心将数据分类模型发送给使用者;
(8)使用者将待分类数据输入数据分类模型,得到分类结果。
进一步地,所述步骤(2)中,利用NTRU同态加密算法生成加密参数;所述加密参数包括:多项式的次数n、大素数q、密钥生成用标准差σk、加密噪声用标准差σc,加密参数的设置需满足以下条件:
a)n为2的正整数次幂;
b)q=1mod 2n且
Figure BDA0002128366510000021
c)σk、σc均为正数,且σk≈2.5σc
d)n>33.1×log2(q/σk);
e)
Figure BDA0002128366510000022
进一步地,所述步骤(4)中,公钥用于数据的加密,私钥用于数据的解密,公钥和私钥生成的具体步骤如下:
(1)根据一元多项式的生成规则
Figure BDA0002128366510000023
生成多项式f、g;
Figure BDA0002128366510000024
满足:多项式的次数为n-1;多项式的所有系数均通过平均值为0,标准差为σk的离散正态分布采样得到;
f满足:
①f在多项式环
Figure BDA0002128366510000025
中存在逆元f-1
Figure BDA0002128366510000026
中所有多项式的系数为(-q/2,q/2)中的整数,所有多项式的最高次数为n-1,环的模为多项式xn+1;
②f=0(mod 2);
(2)生成公钥pk和私钥sk
pk=g·f-1
sk=f
进一步地,所述步骤(5)中,各家数据提供机构通过公钥加密训练数据的过程如下:
(1)令明文的比特长度L=-1+log2q;
(2)对于待加密整数明文μ,要求-q/2<μ<q/2;
(3)根据一元多项式的生成规则
Figure BDA0002128366510000031
生成L个多项式S1~SL和L个多项式E1~EL
Figure BDA0002128366510000032
满足:多项式的次数为n-1;多项式的所有系数均通过平均值为0,标准差为σc的离散正态分布采样得到;
(4)生成密文C,密文C包含L个多项式,第i个密文多项式Ci的公式为:
Ci=μ·2i-1+Si·pk+Ei
进一步地,所述步骤(6)中,在执行同态加密下的逻辑回归分析过程中进行数据解密,具体步骤如下:
(1)把密文C的所有多项式分别与私钥sk相乘,得到:
Figure BDA0002128366510000033
(2)生成μf,具体公式为:
Figure BDA0002128366510000034
(3)将μf的每一个系数都乘以2再除以私钥sk的对应系数,得到解密结果μ:
Figure BDA0002128366510000035
其中round为取整函数,(μf)i为μf的第i项系数,ski为私钥的第i项系数。
进一步地,所述步骤(6)中,在执行同态加密下的逻辑回归分析过程中进行同态加法和同态乘法,具体如下:
假设密文C和密文D分别由明文μ1和明文μ2加密得到,则分别有密文加法和密文乘法:
ADD(C,D)=C+D
MULT(C,D)=BD(C)·D
其中BD(C)为比特分解方程,输入C为包含L个多项式的集合,该方程将C中的所有系数转化为L位的二进制向量表示。
进一步地,所述步骤(6)中,计算中心与各家数据提供机构共同执行同态加密下的逻辑回归分析;假设一共有x家数据提供机构,它们的训练数据分别有z1~zx条,且加起来共有z条,一共有y个特征变量,具体步骤如下:
(1)计算中心设置逻辑回归的最大迭代次数iter、学习率a;
(2)计算中心初始化分类模型参数θ0~θy
(3)计算中心初始化分类模型参数的更新值Δθ0~Δθy=0;
(4)计算中心分别用各机构的公钥将分类模型参数加密,加密后的模型参数记为Θ01~Θ0x、……、Θy1~Θyx
(5)计算中心对每条密文训练数据C进行如下操作,对于机构i提供的第j条训练数据
Figure BDA0002128366510000041
(其中
Figure BDA0002128366510000042
为Cij的y个特征变量,labelij为Cij的分类变量),计算:
①加权预测值
Figure BDA0002128366510000043
②密文状态下的梯度下降值
Figure BDA0002128366510000044
其中同态加密下的sigmoid函数通过多项式y=-0.0016x3+0.1501x+0.5来进行拟合;
③将
Figure BDA0002128366510000045
发送至数据提供机构i;
(6)数据提供机构i(i=1,2,...,x)接收
Figure BDA0002128366510000046
并初始化噪声求和值
Figure BDA0002128366510000047
之后对每个
Figure BDA0002128366510000048
进行如下操作:
①生成一次性噪声error并将其用公钥加密为密文噪声Eij k
②用加密噪声掩藏ΔΘij k,得到ΔΘ’ij k,具体公式为:ΔΘ’ij k=ΔΘij k+Eij k
③Ei k+=e;
④将
Figure BDA0002128366510000049
解密为
Figure BDA00021283665100000410
并将
Figure BDA00021283665100000411
发送至计算中心;
最后将
Figure BDA00021283665100000412
发送至计算中心;
(7)计算中心接收
Figure BDA00021283665100000413
Figure BDA00021283665100000414
对每个
Figure BDA00021283665100000415
进行如下操作:
Figure BDA00021283665100000416
②进行如下计算,以去除噪声的影响:
Figure BDA0002128366510000051
③进行分类模型参数的更新:
θk+=Δθk,k=0,1,...,y
(8)若尚未达到迭代次数,则返回步骤(3);否则,分析结束。
本发明的有益效果是:本发明通过在上传数据之前利用同态加密技术对数据进行加密,避免了任何信息的泄露。本发明在数据分析与获得分析结果阶段,仅仅暴露了无意义的中间结果,避免了在运算过程中任何有意义信息的泄露,有效防止了第三方对于数据的恶意使用。本发明在实际应用中具有更高的安全性,既有效保护了个人隐私,又避免了数据提供机构可能产生的利益损失,在很大程度上促进了多机构数据分析的开展。
附图说明
图1为隐私保护多机构数据分类方法整体框架图;
图2为隐私保护多机构数据分类方法整体流程图;
图3为同态加密下逻辑回归分析具体流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
本发明提供的一种基于同态加密的隐私保护多机构数据分类方法,整体框架如图1所示。方法的参与者包括:多家数据提供机构、计算中心和使用者。方法的整体流程如图2所示,具体包括以下步骤:
(1)使用者生成训练数据的筛选条件,并将筛选条件发送给计算中心;
(2)计算中心接收筛选条件,利用同态加密算法生成加密参数,并将加密参数连同步骤1的筛选条件一同发送给各家数据提供机构;
(3)各家数据提供机构根据筛选条件对标注有分类标签的本地数据进行筛选,得到训练数据;
(4)各家数据提供机构根据加密参数,利用同态加密算法生成各自的公钥和私钥;
(5)各家数据提供机构通过公钥加密训练数据,其中特征变量加密,分类变量不加密,并将加密后的训练数据连同对应公钥一同发送给计算中心;
(6)计算中心接收到各家数据提供机构加密后的训练数据以及对应公钥后,与各家数据提供机构共同执行同态加密下的逻辑回归分析,得到数据分类模型;
(7)计算中心将数据分类模型发送给使用者;
(8)使用者将待分类数据输入数据分类模型,得到分类结果。
进一步地,所述步骤(2)中,利用NTRU同态加密算法生成加密参数;所述加密参数包括:多项式的次数n、大素数q、密钥生成用标准差σk、加密噪声用标准差σc,加密参数的设置需满足以下条件:
a)n为2的正整数次幂;
b)q=1mod 2n且
Figure BDA0002128366510000061
c)σk、σc均为正数,且σk≈2.5σc
d)n>33.1×log2(q/σk);
e)
Figure BDA0002128366510000062
同态加密是一种特别的加密方式,它的特别之处在于:对经过同态加密的密文进行处理得到一个输出,将这一输出进行解密,其结果与用同一方法处理未加密的明文得到的输出结果是一样的;利用同态加密技术,能够在不知道数据具体内容的前提下对数据进行处理,在保证数据安全的同时实现了数据的利用;NTRU同态加密算法同时满足加法同态与乘法同态。
进一步地,所述步骤(4)中,公钥用于数据的加密,私钥用于数据的解密,公钥和私钥生成的具体步骤如下:
(1)根据一元多项式的生成规则
Figure BDA0002128366510000063
生成多项式f、g,n指定了生成多项式的次数,Z指的是多项式的每一项系数均为整数;
Figure BDA0002128366510000064
满足:多项式的次数为n-1;多项式的所有系数均通过平均值为0,标准差为σk的离散正态分布采样得到;
f满足:
①f在多项式环
Figure BDA0002128366510000065
中存在逆元f-1
Figure BDA0002128366510000066
中所有多项式的系数为(-q/2,q/2)中的整数,所有多项式的最高次数为n-1,环的模为多项式xn+1;
②f=0(mod 2);
(2)生成公钥pk和私钥sk
pk=g·f-1
sk=f
进一步地,所述步骤(5)中,各家数据提供机构通过公钥加密训练数据的过程如下:
(1)令明文的比特长度L=-1+log2q;
(2)对于待加密整数明文μ,要求-q/2<μ<q/2;
(3)根据一元多项式的生成规则
Figure BDA0002128366510000071
生成L个多项式S1~SL和L个多项式E1~EL
Figure BDA0002128366510000072
满足:多项式的次数为n-1;多项式的所有系数均通过平均值为0,标准差为σc的离散正态分布采样得到;
(4)生成密文C,密文C包含L个多项式,第i个密文多项式Ci的公式为:
Ci=μ·2i-1+Si·pk+Ei
进一步地,所述步骤(6)中,在执行同态加密下的逻辑回归分析过程中进行数据解密,具体步骤如下:
(1)把密文C的所有多项式分别与私钥sk相乘,得到:
Figure BDA0002128366510000073
(2)生成μf,具体公式为:
Figure BDA0002128366510000074
(3)将μf的每一个系数都乘以2再除以私钥sk的对应系数,得到解密结果μ:
Figure BDA0002128366510000075
其中round为取整函数,(μf)i为μf的第i项系数,ski为私钥的第i项系数。
进一步地,所述步骤(6)中,在执行同态加密下的逻辑回归分析过程中进行同态加法和同态乘法,具体如下:
假设密文C和密文D分别由明文μ1和明文μ2加密得到,则分别有密文加法和密文乘法:
ADD(C,D)=C+D
MULT(C,D)=BD(C)·D
其中BD(C)为比特分解方程,输入C为包含L个多项式的集合,该方程将C中的所有系数转化为L位的二进制向量表示。
密文加法的同态性证明如下:
ADD(C,D)·sk=μ1·BDI(IL)·f+error12·BDI(IL)·f+error2
=(μ12)·BDI(IL)·f+error
BDI(IL)表示从1开始的2的整数幂向量,长度为L,即{1,2,4,...,2L-1};
密文乘法的同态性证明如下:
MULT(C,D)·sk=BD(C)·D·f=BD(C)·(μ2·BDI(IL)+S2·pk+E2)·f
=BD(C)·(μ2·BDI(IL)·f+S2·g+E2·f)
=μ2·C·f+BD(C)·(S2·g+E2·f)
=μ2·(μ1·BDI(IL)·f+S1·g+E1·f)+BD(C)·(S2·g+E2·f)
=μ2·μ1·BDI(IL)·f+μ2·(S1·g+E1·f)+BD(C)·(S2·g+E2·f)
=μ2·μ1·BDI(IL)·f+μ2·error1+BD(C)·error2
=μ2·μ1·BDI(IL)·f+error
进一步地,所述步骤(6)中,计算中心与各家数据提供机构共同执行同态加密下的逻辑回归分析;逻辑回归是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。逻辑回归的分类变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释,因此本发明采用二分类的逻辑回归。假设一共有x家数据提供机构,它们的训练数据分别有z1~zx条,且加起来共有z条,一共有y个特征变量,同态加密下逻辑回归分析具体流程如图3所示,具体步骤如下:
(1)计算中心设置逻辑回归的最大迭代次数iter、学习率a;
(2)计算中心初始化分类模型参数θ0~θy
(3)计算中心初始化分类模型参数的更新值Δθ0~Δθy=0;
(4)计算中心分别用各机构的公钥将分类模型参数加密,加密后的模型参数记为Θ01~Θ0x、……、Θy1~Θyx
(5)计算中心对每条密文训练数据C进行如下操作,对于机构i提供的第j条训练数据
Figure BDA0002128366510000081
(其中
Figure BDA0002128366510000082
为Cij的y个特征变量,labelij为Cij的分类变量),计算:
①加权预测值
Figure BDA0002128366510000083
②密文状态下的梯度下降值
Figure BDA0002128366510000084
其中同态加密下的sigmoid函数通过多项式y=-0.0016x3+0.1501x+0.5来进行拟合;
③将
Figure BDA0002128366510000085
发送至数据提供机构i;
(6)数据提供机构i(i=1,2,...,x)接收
Figure BDA0002128366510000086
并初始化噪声求和值
Figure BDA0002128366510000087
之后对每个
Figure BDA0002128366510000088
进行如下操作:
①生成一次性噪声error并将其用公钥加密为密文噪声Eij k
②用加密噪声掩藏ΔΘij k,得到ΔΘ’ij k,具体公式为:ΔΘ’ij k=ΔΘij k+Eij k
③Ei k+=e;
④将
Figure BDA0002128366510000091
解密为
Figure BDA0002128366510000092
并将
Figure BDA0002128366510000093
发送至计算中心;
最后将
Figure BDA0002128366510000094
发送至计算中心
(7)计算中心接收
Figure BDA0002128366510000095
Figure BDA0002128366510000096
对每个
Figure BDA0002128366510000097
进行如下操作:
Figure BDA0002128366510000098
②进行如下计算,以去除噪声的影响:
Figure BDA0002128366510000099
③进行分类模型参数的更新:
θk+=Δθk,k=0,1,...,y
(8)若尚未达到迭代次数,则返回步骤(3);否则,分析结束。
以上仅为本发明的实施实例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,不经过创造性劳动所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (7)

1.一种基于同态加密的隐私保护多机构数据分类方法,其特征在于,该方法包括以下步骤:
(1)使用者生成训练数据的筛选条件,并将筛选条件发送给计算中心;
(2)计算中心接收筛选条件,利用同态加密算法生成加密参数,并将加密参数连同步骤1的筛选条件一同发送给各家数据提供机构;
(3)各家数据提供机构根据筛选条件对标注有分类标签的本地数据进行筛选,得到训练数据;
(4)各家数据提供机构根据加密参数,利用同态加密算法生成各自的公钥和私钥;
(5)各家数据提供机构通过公钥加密训练数据,其中特征变量加密,分类变量不加密,并将加密后的训练数据连同对应公钥一同发送给计算中心;
(6)计算中心接收到各家数据提供机构加密后的训练数据以及对应公钥后,与各家数据提供机构共同执行同态加密下的逻辑回归分析,得到数据分类模型;
(7)计算中心将数据分类模型发送给使用者;
(8)使用者将待分类数据输入数据分类模型,得到分类结果。
2.根据权利要求1所述的一种基于同态加密的隐私保护多机构数据分类方法,其特征在于,所述步骤(2)中,利用NTRU同态加密算法生成加密参数;所述加密参数包括:多项式的次数n、大素数q、密钥生成用标准差σk、加密噪声用标准差σc,加密参数的设置需满足以下条件:
a)n为2的正整数次幂;
b)q=1mod2n且
Figure FDA0003120384380000011
c)σk、σc均为正数,且σk≈2.5σc
d)n>33.1×log2(q/σk);
Figure FDA0003120384380000012
3.根据权利要求2所述的一种基于同态加密的隐私保护多机构数据分类方法,其特征在于,所述步骤(4)中,公钥用于数据的加密,私钥用于数据的解密,公钥和私钥生成的具体步骤如下:
(1)根据一元多项式的生成规则
Figure FDA0003120384380000013
生成多项式f、g;
Figure FDA0003120384380000021
满足:多项式的次数为n-1;多项式的所有系数均通过平均值为0,标准差为σk的离散正态分布采样得到,Z指的是多项式的每一项系数均为整数;
f满足:
①f在多项式环
Figure FDA0003120384380000022
中存在逆元f-1
Figure FDA0003120384380000023
中所有多项式的系数为(-q/2,q/2)中的整数,所有多项式的最高次数为n-1,环的模为多项式xn+1;
②f=0(mod2);
(2)生成公钥pk和私钥sk
pk=g·f-1
sk=f 。
4.根据权利要求3所述的一种基于同态加密的隐私保护多机构数据分类方法,其特征在于,所述步骤(5)中,各家数据提供机构通过公钥加密训练数据的过程如下:
(1)令明文的比特长度L=-1+log2q;
(2)对于待加密整数明文μ,要求-q/2<μ<q/2;
(3)根据一元多项式的生成规则
Figure FDA0003120384380000024
生成L个多项式S1~SL和L个多项式E1~EL
Figure FDA0003120384380000025
满足:多项式的次数为n-1;多项式的所有系数均通过平均值为0,标准差为σc的离散正态分布采样得到;
(4)生成密文C,密文C包含L个多项式,第i个密文多项式Ci的公式为:
Ci=μ·2i-1+Si·pk+Ei
5.根据权利要求4所述的一种基于同态加密的隐私保护多机构数据分类方法,其特征在于,所述步骤(6)中,在执行同态加密下的逻辑回归分析过程中进行数据解密,具体步骤如下:
(1)把密文C的所有多项式分别与私钥sk相乘,得到:
Figure FDA0003120384380000026
式中,error表示一次性噪声;
(2)生成μf,具体公式为:
Figure FDA0003120384380000027
(3)将μf的每一个系数都乘以2再除以私钥sk的对应系数,得到解密结果μ:
Figure FDA0003120384380000031
其中round为取整函数,(μf)i为μf的第i项系数,ski为私钥的第i项系数。
6.根据权利要求4所述的一种基于同态加密的隐私保护多机构数据分类方法,其特征在于,所述步骤(6)中,在执行同态加密下的逻辑回归分析过程中进行同态加法和同态乘法,具体如下:
假设密文C和密文D分别由明文μ1和明文μ2加密得到,则分别有密文加法和密文乘法:
ADD(C,D)=C+D
MULT(C,D)=BD(C)·D
其中BD(C)为比特分解方程,输入C为包含L个多项式的集合,该方程将C中的所有系数转化为L位的二进制向量表示。
7.根据权利要求4所述的一种基于同态加密的隐私保护多机构数据分类方法,其特征在于,所述步骤(6)中,计算中心与各家数据提供机构共同执行同态加密下的逻辑回归分析;假设一共有x家数据提供机构,它们的训练数据分别有z1~zx条,且加起来共有z条,一共有y个特征变量,具体步骤如下:
(1)计算中心设置逻辑回归的最大迭代次数iter、学习率a;
(2)计算中心初始化分类模型参数θ0~θy
(3)计算中心初始化分类模型参数的更新值Δθ0~Δθy=0;
(4)计算中心分别用各机构的公钥将分类模型参数加密,加密后的模型参数记为Θ01~Θ0x、……、Θy1~Θyx
(5)计算中心对每条密文训练数据C进行如下操作,对于机构i提供的第j条训练数据
Figure FDA0003120384380000032
(其中
Figure FDA0003120384380000033
为Cij的y个特征变量,labelij为Cij的分类变量),计算:
①加权预测值
Figure FDA0003120384380000034
②密文状态下的梯度下降值
Figure FDA0003120384380000035
其中同态加密下的sigmoid函数通过多项式y=-0.0016x3+0.1501x+0.5来进行拟合;
③将
Figure FDA0003120384380000036
发送至数据提供机构i;
(6)数据提供机构i(i=1,2,...,x)接收
Figure FDA0003120384380000041
并初始化噪声求和值
Figure FDA0003120384380000042
之后对每个
Figure FDA0003120384380000043
进行如下操作:
①生成一次性噪声error并将其用公钥加密为密文噪声Eij k
②用加密噪声掩藏ΔΘij k,得到ΔΘ’ij k,具体公式为:ΔΘ’ij k=ΔΘij k+Eij k
③Ei k+=e;
④将
Figure FDA0003120384380000044
解密为
Figure FDA0003120384380000045
并将
Figure FDA0003120384380000046
发送至计算中心;
最后将
Figure FDA0003120384380000047
发送至计算中心;
(7)计算中心接收
Figure FDA0003120384380000048
Figure FDA0003120384380000049
对每个
Figure FDA00031203843800000410
进行如下操作:
Figure FDA00031203843800000411
②进行如下计算,以去除噪声的影响:
Figure FDA00031203843800000412
③进行分类模型参数的更新:
θk+=Δθk,k=0,1,...,y
(8)若尚未达到迭代次数,则返回步骤(3);否则,分析结束。
CN201910629833.7A 2019-07-12 2019-07-12 一种基于同态加密的隐私保护多机构数据分类方法 Active CN110190946B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910629833.7A CN110190946B (zh) 2019-07-12 2019-07-12 一种基于同态加密的隐私保护多机构数据分类方法
JP2021533328A JP7064682B2 (ja) 2019-07-12 2020-04-07 準同型暗号に基づくプライバシー保護多機関データ分類方法
PCT/CN2020/083590 WO2020233260A1 (zh) 2019-07-12 2020-04-07 一种基于同态加密的隐私保护多机构数据分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910629833.7A CN110190946B (zh) 2019-07-12 2019-07-12 一种基于同态加密的隐私保护多机构数据分类方法

Publications (2)

Publication Number Publication Date
CN110190946A CN110190946A (zh) 2019-08-30
CN110190946B true CN110190946B (zh) 2021-09-03

Family

ID=67725575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910629833.7A Active CN110190946B (zh) 2019-07-12 2019-07-12 一种基于同态加密的隐私保护多机构数据分类方法

Country Status (3)

Country Link
JP (1) JP7064682B2 (zh)
CN (1) CN110190946B (zh)
WO (1) WO2020233260A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110190946B (zh) * 2019-07-12 2021-09-03 之江实验室 一种基于同态加密的隐私保护多机构数据分类方法
CN111062487B (zh) * 2019-11-28 2021-04-20 支付宝(杭州)信息技术有限公司 基于数据隐私保护的机器学习模型特征筛选方法及装置
CN111159727B (zh) * 2019-12-11 2022-12-09 西安交通大学医学院第一附属医院 一种面向多方协同的贝叶斯分类器安全生成系统及方法
CN111143862B (zh) * 2019-12-13 2021-07-09 支付宝(杭州)信息技术有限公司 数据处理方法、查询方法、装置、电子设备和系统
CN111898137A (zh) * 2020-06-30 2020-11-06 深圳致星科技有限公司 一种联邦学习的隐私数据处理方法、设备及系统
CN111859440B (zh) * 2020-08-21 2022-12-23 安徽大学 基于混合协议的分布式隐私保护逻辑回归模型的样本分类方法
CN112104446A (zh) * 2020-09-03 2020-12-18 哈尔滨工业大学 一种基于同态加密的多方联合机器学习方法和系统
CN112597379B (zh) * 2020-12-04 2023-09-01 光大科技有限公司 数据识别方法、装置和存储介质及电子装置
CN114691167A (zh) * 2020-12-31 2022-07-01 华为技术有限公司 机器学习模型更新的方法和装置
CN112685783B (zh) * 2021-01-05 2024-02-27 西安电子科技大学 金融许可区块链中支持隐私保护的数据共享方法
CN112929151B (zh) * 2021-01-25 2023-06-30 苏宁金融科技(南京)有限公司 基于隐私保护的实体对齐方法及计算机存储介质
CN112818369B (zh) * 2021-02-10 2024-03-29 中国银联股份有限公司 一种联合建模方法及装置
CN112949741B (zh) * 2021-03-18 2023-04-07 西安电子科技大学 基于同态加密的卷积神经网络图像分类方法
CN112948883B (zh) * 2021-03-25 2023-10-31 支付宝(杭州)信息技术有限公司 保护隐私数据的多方联合建模的方法、装置和系统
CN113158232A (zh) * 2021-03-26 2021-07-23 北京融数联智科技有限公司 一种隐私数据的计算方法、装置及计算机设备
CN113282935A (zh) * 2021-05-19 2021-08-20 中原银行股份有限公司 一种基于模型的预测方法、装置和存储介质
CN113434873A (zh) * 2021-06-01 2021-09-24 内蒙古大学 一种基于同态加密的联邦学习隐私保护方法
CN113626858B (zh) * 2021-07-21 2024-07-16 西安电子科技大学 隐私保护k-means聚类方法、设备、介质、终端
CN113554182B (zh) * 2021-07-27 2023-09-19 西安电子科技大学 一种横向联邦学习系统中拜占庭节点的检测方法及系统
KR102615381B1 (ko) * 2021-08-24 2023-12-19 서울대학교산학협력단 동형 암호를 활용한 사적 변수의 보안 방법 및 장치
CN113821810B (zh) * 2021-08-26 2024-03-08 上海赢科信息技术有限公司 数据处理方法及系统、存储介质及电子设备
CN113938266B (zh) * 2021-09-18 2024-03-26 桂林电子科技大学 基于整数向量同态加密的垃圾邮件过滤器训练方法及系统
CN113935050A (zh) * 2021-09-26 2022-01-14 平安科技(深圳)有限公司 基于联邦学习的特征提取方法和装置、电子设备、介质
CN114696991B (zh) * 2022-05-31 2022-09-20 蓝象智联(杭州)科技有限公司 基于同态加密的数据聚类方法及装置
CN115276948B (zh) * 2022-07-20 2023-04-07 京信数据科技有限公司 一种同态加密计算方法及系统
CN115442134B (zh) * 2022-09-02 2024-05-07 暨南大学 一种基于同态双向代理重加密的多密钥多方安全计算方法
CN115587139B (zh) * 2022-11-03 2024-03-22 国网江苏省电力有限公司营销服务中心 一种基于同态加密的分布式隐私保护分类方法及系统
CN115622685B (zh) * 2022-12-16 2023-04-28 成方金融科技有限公司 隐私数据同态加密方法、装置及系统
CN116011552A (zh) * 2023-03-24 2023-04-25 摩尔线程智能科技(北京)有限责任公司 模型训练方法、推理方法、装置、系统、设备及存储介质
CN116800906B (zh) * 2023-08-22 2023-11-07 北京电子科技学院 一种基于模分量同态的密文卷积神经网络图像分类方法
CN117411731B (zh) * 2023-12-15 2024-03-01 江西师范大学 一种基于lof算法的加密ddos流量异常检测方法
CN117792637A (zh) * 2024-01-04 2024-03-29 北京睿航至臻科技有限公司 基于深度学习的动态数据加密方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8249250B2 (en) * 2009-03-30 2012-08-21 Mitsubishi Electric Research Laboratories, Inc. Secure similarity verification between homomorphically encrypted signals
US9325671B2 (en) * 2014-02-19 2016-04-26 Raytheon Bbn Technologies Corp. System and method for merging encryption data using circular encryption key switching
KR101726619B1 (ko) * 2015-04-14 2017-04-26 삼성에스디에스 주식회사 암호화 데이터 관리 방법 및 장치
US20170293913A1 (en) * 2016-04-12 2017-10-12 The Governing Council Of The University Of Toronto System and methods for validating and performing operations on homomorphically encrypted data
JP2018207222A (ja) 2017-05-31 2018-12-27 パナソニックIpマネジメント株式会社 カメラ及びパラメータ登録方法
US20190007212A1 (en) * 2017-06-30 2019-01-03 Intel Corporation Secure unlock systems for locked devices
CN108521326B (zh) * 2018-04-10 2021-02-19 电子科技大学 一种基于向量同态加密的隐私保护的线性svm模型训练方法
CN108712260B (zh) 2018-05-09 2021-06-25 曲阜师范大学 云环境下保护隐私的多方深度学习计算代理方法
CN109033854B (zh) * 2018-07-17 2020-06-09 阿里巴巴集团控股有限公司 基于模型的预测方法和装置
CN109359588B (zh) * 2018-10-15 2021-02-09 电子科技大学 一种新的隐私保护下非交互式的k近邻分类方法
CN109858269B (zh) * 2019-02-20 2022-11-01 安徽师范大学 一种基于同态加密的隐私保护密度峰聚类方法
CN110190946B (zh) * 2019-07-12 2021-09-03 之江实验室 一种基于同态加密的隐私保护多机构数据分类方法

Also Published As

Publication number Publication date
JP7064682B2 (ja) 2022-05-11
CN110190946A (zh) 2019-08-30
WO2020233260A1 (zh) 2020-11-26
JP2022508351A (ja) 2022-01-19

Similar Documents

Publication Publication Date Title
CN110190946B (zh) 一种基于同态加密的隐私保护多机构数据分类方法
US11431470B2 (en) Performing computations on sensitive data while guaranteeing privacy
Dowlin et al. Manual for using homomorphic encryption for bioinformatics
Kim et al. Efficient privacy-preserving matrix factorization via fully homomorphic encryption
CN113940028B (zh) 实现白盒密码的方法和装置
US11750362B2 (en) Private decision tree evaluation using an arithmetic circuit
US11251936B2 (en) System and method for performing homomorphic aggregation over encrypted data
CN115065555A (zh) 一种信息安全处理方法、系统
Lu et al. More practical privacy-preserving machine learning as a service via efficient secure matrix multiplication
Jalali et al. ARMv8 SIKE: Optimized supersingular isogeny key encapsulation on ARMv8 processors
Pushpa Hybrid data encryption algorithm for secure medical data transmission in cloud environment
CN116561787A (zh) 视觉图像分类模型的训练方法、装置及电子设备
US8824677B1 (en) Provably secure and efficient pseudorandom number generation
CN113726512A (zh) 密钥生成和分发方法、密钥生成装置、密钥管理系统
CN113055153A (zh) 一种基于全同态加密算法的数据加密方法、系统和介质
CN115865307B (zh) 一种用于联邦学习的数据点乘运算方法
US11343070B2 (en) System and method for performing a fully homomorphic encryption on a plain text
CN111797907B (zh) 一种用于医疗物联网的安全高效的svm隐私保护训练及分类方法
Neelakandan et al. A multi-layer encryption with AES and Twofish encryption algorithm for smart assistant security
JP5208796B2 (ja) 整数の暗号化及び復号化方法
CN115170380A (zh) 一种基于混沌映射的图像分层置乱加密方法
US20230141210A1 (en) Neural networks
Raj et al. A security architecture for cloud data using hybrid security scheme
CN111008236A (zh) 一种数据查询的方法和系统
JP6212377B2 (ja) 演算装置、演算方法およびコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant