CN107241182B - 一种基于向量同态加密的隐私保护层次聚类方法 - Google Patents
一种基于向量同态加密的隐私保护层次聚类方法 Download PDFInfo
- Publication number
- CN107241182B CN107241182B CN201710513628.5A CN201710513628A CN107241182B CN 107241182 B CN107241182 B CN 107241182B CN 201710513628 A CN201710513628 A CN 201710513628A CN 107241182 B CN107241182 B CN 107241182B
- Authority
- CN
- China
- Prior art keywords
- matrix
- vector
- homomorphic encryption
- clustering
- ciphertext
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 title claims abstract description 104
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000011159 matrix material Substances 0.000 claims abstract description 71
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000007621 cluster analysis Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 4
- 238000007417 hierarchical cluster analysis Methods 0.000 abstract description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/008—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/08—Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
- H04L9/0861—Generation of secret information including derivation or calculation of cryptographic keys or passwords
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/08—Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
- H04L9/0861—Generation of secret information including derivation or calculation of cryptographic keys or passwords
- H04L9/0869—Generation of secret information including derivation or calculation of cryptographic keys or passwords involving random numbers or seeds
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于向量同态加密的隐私保护层次聚类方法,解决的是将层次聚类分析迁移至云上后产生的数据隐私有泄露风险的技术问题,通过采用方法包括:(1)聚类分析开始,客户端接收待聚类向量组;(2)使用向量同态加密方法对待聚类向量组进行加密,得到密文向量组;(3)根据密钥交换矩阵N与比特扩展矩阵W定义中间矩阵H;(4)将中间矩阵H与密文向量组进行聚类分析;(5)聚类服务器将聚类分析完成的密文向量组发送回客户端,由客户端使用密钥矩阵S进行解密,根据各个向量的标签组合得到聚类结果的技术方案,较好的解决了该问题,可用于向量类型判断中。
Description
技术领域
本发明涉及层次聚类算法在隐私保护下的向量聚类方法,具体涉及一种基于向量同态加密的隐私保护层次聚类方法。
背景技术
聚类分析,别称群分析,是研究分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类分析是由若干模式组成的,模式是一个度量的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。聚类分析采用,层次法,层次法对给定的数据集进行层次似的分解,直到某种条件满足为止。具体又可分为“自底向上”和“自顶向下”两种方案。在“自底向上”方案中,初始时每一个数据纪录都组成一个单独的组,在后续迭代中,把那些相互邻近的组合并成一个组,直到所有的记录组成一个分组或者某个条件满足为止。
层次聚类方法是基于距离的或基于密度和连通性的。层次聚类方法的一些扩展也考虑子空间聚类。现有的层次方法一旦合并或分裂完成,它就不能被撤销。该特点是基于消除不同选择的组合数目不同,将产生较小的计算量。现有的层次聚类方法存在将层次聚类分析迁移至云上后产生的数据隐私有泄露风险的问题。因此,提供一种层次聚类分析迁移至云上后产生的数据隐私不会泄露的隐私保护层次聚类方法就很有必要。
发明内容
本发明所要解决的技术问题是现有技术中存在的将层次聚类分析迁移至云上后产生的数据隐私有泄露风险的技术问题。提供一种新的基于向量同态加密的隐私保护层次聚类方法,该基于向量同态加密的隐私保护层次聚类方法具有安全性高、泄密可能性小的特点。
为解决上述技术问题,采用的技术方案如下:
一种基于向量同态加密的隐私保护层次聚类方法,所述方法包括:
(1)聚类分析开始,客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由N个待聚类的样本组成;
(2)使用向量同态加密方法对待聚类向量组(x1,x2,…xn)进行加密,在加密过程中保留密钥交换矩阵M、比特扩展矩阵W,得到密文向量组(c1,c2,…,cn);
(3)根据密钥交换矩阵M与比特扩展矩阵W,计算求得矩阵A,使得AM=W,定义中间矩阵H=ATA;
(4)将中间矩阵H与密文向量组(c1,c2,…,cn)传送至聚类服务器进行聚类分析,为密文向量组(c1,c2,…,cn)中的每一个向量附上聚类标签;
(5)聚类服务器将聚类分析完成的密文向量组(c1,c2,…,cn)发送回客户端,由客户端使用密钥矩阵S进行解密,根据各个向量的标签组合得到聚类结果;n为正整数。
上述方案中,为优化,进一步地,所述向量同态加密的方法包括:
(A)生成随机矩阵T,同时生成大整数w及整数l,大整数w>>随机矩阵T中的任一元素,并且2l大于待聚类向量组(x1,x2,…xn)中的任一元素;
(C)根据密钥交换矩阵M及c=Mx*,得到密文向量组(c1,c2,…cn);
其中,T∈Zn×n,S1=[I,T],I为单位矩阵,n×n为T的维度,Y为随机矩阵,E为随机噪声矩阵。
进一步地,所述步骤(4)中聚类分析包括:
(a)根据待聚类向量的密文向量组(c1,c2,…,cn)及中间矩阵H,给密文向量组(c1,c2,…,cn)中每个待聚类向量附上各不相同的标签,记录现有类的数目n;
(b)计算两个向量ci,cj之间的相似度,将计算结果保存在邻接矩阵D;
(c)查找步骤(b)中邻接矩阵D,查找出,将相似度最高的两个类的向量的类合为一个类,更新密文向量组(c1,c2,…,cn)中所有类的标签,定义n=n-1;
(d)检查类的数量达到阀值,是则返回结果,否则返回步骤(b)进行新一轮迭代;
其中,i为小于n的正整数,j为小于n的正整数。
进一步地,所述相似度最高的两个类为距离最近的两个类。
进一步地,所述类为数据点。
进一步地,所述步骤(b)计算两个向量ci,cj之间的相似度包括:计算ci-cj,邻接矩阵D中的元素Dij=Dji=(ci-cj)TH(ci-cj)。
进一步地,所述向量同态加密方法支持向量加法、线性变换和加权内积的同态运算。
本发明通过向量同态加密的方法实现基于向量同态加密的隐私保护层次聚类方法。向量同态加密的方法在对加密数据进行运算时可以保证运算函数的私密性向量同态加密的方法支持向量的加法、线性变换和加权内积的同态运算。本发明可以在对第三方云保密的情况下,实现高效准确的聚类。实际的实施过程中,数据都是外包给第三方云端来进行计算的。而在这个过程中,第三方云端通常都是不可信的,因此在这个过程中对不可信的云端保证数据的隐私是必要的。
本发明能够良好的对用户隐私数据保护,并且在隐私数据受到保护的情况下,通过层次聚类算法对向量组进行高效准确的聚类,提高了对向量类型判断的效率,扩大了向量类型判断的应用范围。
本发明的有益效果:
效果一,保证数据隐私可靠性;
效果二,提高数据安全性;
效果三,提高了对向量类型判断的效率,扩大了向量类型判断的应用范围。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1,实施例1中基于向量同态加密的隐私保护层次聚类方法流程示意图。
图2,聚类分析流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供一种基于向量同态加密的隐私保护层次聚类方法,如图1,所述方法包括:
(1)聚类分析开始,客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由N个待聚类的样本组成;
(2)使用向量同态加密方法对待聚类向量组(x1,x2,…xn)进行加密,在加密过程中保留密钥交换矩阵M、比特扩展矩阵W,得到密文向量组(c1,c2,…,cn);
(3)根据密钥交换矩阵M与比特扩展矩阵W,计算求得矩阵A,使得AM=W,定义中间矩阵H=ATA;
(4)将中间矩阵H与密文向量组(c1,c2,…,cn)传送至聚类服务器进行聚类分析,为密文向量组(c1,c2,…,cn)中的每一个向量附上聚类标签;
(5)聚类服务器将聚类分析完成的密文向量组(c1,c2,…,cn)发送回客户端,由客户端使用密钥矩阵S进行解密,根据各个向量的标签组合得到聚类结果;其中,n为正整数。
具体地,所述向量同态加密的方法包括:
(A)生成随机矩阵T,同时生成大整数w及整数l,大整数w>>随机矩阵T中的任一元素,并且2l大于待聚类向量组(x1,x2,…xn)中的任一元素;
(C)根据密钥交换矩阵M及c=Mx*,得到密文向量组(c1,c2,…cn);
其中,T∈Zn×n,S1=[I,T],I为单位矩阵,n为密文向量组的维度,Y为随机矩阵,E为随机噪声矩阵。
具体地,如图2,所述步骤(4)中聚类分析包括:
(a)根据待聚类向量的密文向量组(c1,c2,…,cn)及中间矩阵H,给密文向量组(c1,c2,…,cn)中每个待聚类向量附上各不相同的标签,记录现有类的数目n;
(b)计算两个向量ci,cj之间的相似度,将计算结果保存在邻接矩阵D;
(c)查找步骤(b)中邻接矩阵D,查找出,将相似度最高的两个类的向量的类合为一个类,更新密文向量组(c1,c2,…,cn)中所有类的标签,定义n=n-1;
(d)检查类的数量达到阀值,是则返回结果,否则返回步骤(b)进行新一轮迭代;
其中,i为小于n的正整数,j为小于n的正整数。
其中,所述相似度最高的两个类为距离最近的两个类。
其中,所述类为数据点。
具体地,所述步骤(b)计算两个向量ci,cj之间的相似度包括:计算ci-cj,邻接矩阵D中的元素Dij=Dji=(ci-cj)TH(ci-cj)。
另外,所述向量同态加密方法支持向量加法、线性变换和加权内积的同态运算。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员能够理解本发明,但是本发明不仅限于具体实施方式的范围,对本技术领域的普通技术人员而言,只要各种变化只要在本发明精神和范围内,一切利用本发明构思的发明创造均在保护之列。
Claims (7)
1.一种基于向量同态加密的隐私保护层次聚类方法,其特征在于:所述方法包括:
(1)聚类分析开始,客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由n个待聚类的样本组成;
(2)使用密钥矩阵S、向量同态加密方法对待聚类向量组(x1,x2,…xn)进行加密,在加密过程中保留密钥交换矩阵M、比特扩展矩阵W,得到密文向量组(c1,c2,…,cn);
(3)根据密钥交换矩阵M与比特扩展矩阵W,计算求得矩阵A,使得AM=W,定义中间矩阵H=ATA;
(4)将中间矩阵H与密文向量组(c1,c2,…,cn)传送至聚类服务器进行聚类分析,为密文向量组(c1,c2,…,cn)中的每一个向量附上聚类标签;
(5)聚类服务器将聚类分析完成的密文向量组(c1,c2,…,cn)发送回客户端,由客户端使用密钥矩阵S进行解密,根据各个向量的标签组合得到聚类结果;
其中,n为正整数,T为随机矩阵。
3.根据权利要求1所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:步骤(4)中聚类分析包括:
(a)接收待聚类向量的密文向量组(c1,c2,…,cn)及中间矩阵H,给密文向量组(c1,c2,…,cn)中每个待聚类向量附上各不相同的标签,记录现有类的数目n;
(b)计算两个向量ci,cj之间的相似度,将计算结果保存在邻接矩阵D;
(c)查找步骤(b)中邻接矩阵D,将相似度最高的两个类的向量的类合为一个类,更新密文向量组(c1,c2,…,cn)中所有类的标签,定义n=n-1;
(d)检查类的数量达到预设值,是则返回结果,否则返回步骤(b)进行新一轮迭代;
其中,i为小于n的正整数,j为小于n的正整数。
4.根据权利要求3所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:所述相似度最高的两个类为距离最近的两个类。
5.根据权利要求3所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:所述类为数据点。
6.根据权利要求3或4所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:步骤(b)中所述计算两个向量ci,cj之间的相似度包括:计算ci-cj,邻接矩阵D中的元素Dij=Dji=(ci-cj)TH(ci-cj)。
7.根据权利要求1所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:所述向量同态加密方法支持向量加法、线性变换和加权内积的同态运算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710513628.5A CN107241182B (zh) | 2017-06-29 | 2017-06-29 | 一种基于向量同态加密的隐私保护层次聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710513628.5A CN107241182B (zh) | 2017-06-29 | 2017-06-29 | 一种基于向量同态加密的隐私保护层次聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107241182A CN107241182A (zh) | 2017-10-10 |
CN107241182B true CN107241182B (zh) | 2020-10-13 |
Family
ID=59991395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710513628.5A Expired - Fee Related CN107241182B (zh) | 2017-06-29 | 2017-06-29 | 一种基于向量同态加密的隐私保护层次聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107241182B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108694702A (zh) * | 2018-03-30 | 2018-10-23 | 宁波宝略智能科技有限公司 | 一种倾斜摄影实景三维模型的空间坐标系统转换方法 |
CN108830284B (zh) * | 2018-06-27 | 2020-10-27 | 电子科技大学 | 基于密文图像灰度直方图向量的图像识别方法 |
CN109359588B (zh) * | 2018-10-15 | 2021-02-09 | 电子科技大学 | 一种新的隐私保护下非交互式的k近邻分类方法 |
CN109615021B (zh) * | 2018-12-20 | 2022-09-27 | 暨南大学 | 一种基于k均值聚类的隐私信息保护方法 |
CN109902742B (zh) * | 2019-02-28 | 2021-07-16 | 深圳前海微众银行股份有限公司 | 基于加密迁移学习的样本补全方法、终端、系统及介质 |
CN110233730B (zh) * | 2019-05-22 | 2022-05-03 | 暨南大学 | 一种基于k均值聚类的隐私信息保护方法 |
CN110163292A (zh) * | 2019-05-28 | 2019-08-23 | 电子科技大学 | 基于向量同态加密的隐私保护k-means聚类方法 |
CN111143865B (zh) * | 2019-12-26 | 2022-12-30 | 国网湖北省电力有限公司 | 一种密文数据上标签自动生成的用户行为分析系统及方法 |
CN111310817B (zh) * | 2020-02-10 | 2022-02-11 | 深圳大学 | 谱聚类方法、装置、系统、计算机设备和存储介质 |
CN113313160B (zh) * | 2021-05-24 | 2022-09-23 | 南京邮电大学 | 一种基于消费数据和同态加密算法的消费人群分类方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105959111A (zh) * | 2016-07-01 | 2016-09-21 | 何钟柱 | 基于云计算和可信计算的信息安全大数据资源访问控制系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708216A (zh) * | 2012-06-28 | 2012-10-03 | 北京邮电大学 | 一种面向密文搜索的分词组织方法和聚类方法 |
US20150381579A1 (en) * | 2014-06-26 | 2015-12-31 | Vivalect Software Ab | Method and server for handling of personal information |
US10791123B2 (en) * | 2015-11-25 | 2020-09-29 | Yaron Gvili | Selectivity in privacy and verification with applications |
EP3387809B1 (en) * | 2015-12-10 | 2021-04-21 | Nokia Technologies Oy | Schemes of homomorphic re-encryption |
CN106790069B (zh) * | 2016-12-21 | 2020-03-31 | 电子科技大学 | 基于向量同态加密的隐私保护k-nn分类方法 |
-
2017
- 2017-06-29 CN CN201710513628.5A patent/CN107241182B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105959111A (zh) * | 2016-07-01 | 2016-09-21 | 何钟柱 | 基于云计算和可信计算的信息安全大数据资源访问控制系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107241182A (zh) | 2017-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107241182B (zh) | 一种基于向量同态加密的隐私保护层次聚类方法 | |
Giannotti et al. | Privacy-preserving mining of association rules from outsourced transaction databases | |
Imani et al. | A framework for collaborative learning in secure high-dimensional space | |
CN106534085B (zh) | 一种基于区块链技术的隐私保护方法 | |
US9438412B2 (en) | Computer-implemented system and method for multi-party data function computing using discriminative dimensionality-reducing mappings | |
CN106790069B (zh) | 基于向量同态加密的隐私保护k-nn分类方法 | |
US10554385B2 (en) | Method for providing encrypted data in a database and method for searching on encrypted data | |
Wang et al. | Safeguarding cross-silo federated learning with local differential privacy | |
CN106952212B (zh) | 一种基于向量同态加密的hog图像特征提取算法 | |
CN106571905A (zh) | 一种数值型数据同态保序加密方法 | |
Bu et al. | Privacy preserving back-propagation based on BGV on cloud | |
Liu et al. | Secure KNN classification scheme based on homomorphic encryption for cyberspace | |
CN115037556A (zh) | 一种智慧城市系统中加密数据可授权共享方法 | |
Fan et al. | Asymmetric structure-preserving subgraph queries for large graphs | |
Vatsalan et al. | Sorted nearest neighborhood clustering for efficient private blocking | |
Shaham et al. | Machine learning aided anonymization of spatiotemporal trajectory datasets | |
Salman et al. | Proposed Approach to Sensitive Association Rules Protection based on Compressing and Cryptography:(SARP-CC) | |
CN109409111B (zh) | 一种面向加密图像的模糊搜索方法 | |
Kaya et al. | Efficient privacy preserving distributed clustering based on secret sharing | |
Hong et al. | Augmented Rotation‐Based Transformation for Privacy‐Preserving Data Clustering | |
CN116756763A (zh) | 一种电力终端交互数据的隐私保护方法及系统 | |
Miao et al. | Grouped secret sharing schemes based on lagrange interpolation polynomials and chinese remainder theorem | |
Blanton et al. | Secure and oblivious maximum bipartite matching size algorithm with applications to secure fingerprint identification | |
Shuguo et al. | Multi-party privacy-preserving decision trees for arbitrarily partitioned data | |
Gorbenko et al. | Analysis of asymmetric NTRU prime IIT Ukraine encryption algorithm with regards to known attacks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201013 |
|
CF01 | Termination of patent right due to non-payment of annual fee |