CN107241182B - 一种基于向量同态加密的隐私保护层次聚类方法 - Google Patents

一种基于向量同态加密的隐私保护层次聚类方法 Download PDF

Info

Publication number
CN107241182B
CN107241182B CN201710513628.5A CN201710513628A CN107241182B CN 107241182 B CN107241182 B CN 107241182B CN 201710513628 A CN201710513628 A CN 201710513628A CN 107241182 B CN107241182 B CN 107241182B
Authority
CN
China
Prior art keywords
matrix
vector
homomorphic encryption
clustering
ciphertext
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710513628.5A
Other languages
English (en)
Other versions
CN107241182A (zh
Inventor
杨浩淼
綦伟良
何伟超
黄云帆
冉鹏
姚铭轩
金保隆
汪小芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201710513628.5A priority Critical patent/CN107241182B/zh
Publication of CN107241182A publication Critical patent/CN107241182A/zh
Application granted granted Critical
Publication of CN107241182B publication Critical patent/CN107241182B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • H04L9/0869Generation of secret information including derivation or calculation of cryptographic keys or passwords involving random numbers or seeds

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于向量同态加密的隐私保护层次聚类方法,解决的是将层次聚类分析迁移至云上后产生的数据隐私有泄露风险的技术问题,通过采用方法包括:(1)聚类分析开始,客户端接收待聚类向量组;(2)使用向量同态加密方法对待聚类向量组进行加密,得到密文向量组;(3)根据密钥交换矩阵N与比特扩展矩阵W定义中间矩阵H;(4)将中间矩阵H与密文向量组进行聚类分析;(5)聚类服务器将聚类分析完成的密文向量组发送回客户端,由客户端使用密钥矩阵S进行解密,根据各个向量的标签组合得到聚类结果的技术方案,较好的解决了该问题,可用于向量类型判断中。

Description

一种基于向量同态加密的隐私保护层次聚类方法
技术领域
本发明涉及层次聚类算法在隐私保护下的向量聚类方法,具体涉及一种基于向量同态加密的隐私保护层次聚类方法。
背景技术
聚类分析,别称群分析,是研究分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类分析是由若干模式组成的,模式是一个度量的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。聚类分析采用,层次法,层次法对给定的数据集进行层次似的分解,直到某种条件满足为止。具体又可分为“自底向上”和“自顶向下”两种方案。在“自底向上”方案中,初始时每一个数据纪录都组成一个单独的组,在后续迭代中,把那些相互邻近的组合并成一个组,直到所有的记录组成一个分组或者某个条件满足为止。
层次聚类方法是基于距离的或基于密度和连通性的。层次聚类方法的一些扩展也考虑子空间聚类。现有的层次方法一旦合并或分裂完成,它就不能被撤销。该特点是基于消除不同选择的组合数目不同,将产生较小的计算量。现有的层次聚类方法存在将层次聚类分析迁移至云上后产生的数据隐私有泄露风险的问题。因此,提供一种层次聚类分析迁移至云上后产生的数据隐私不会泄露的隐私保护层次聚类方法就很有必要。
发明内容
本发明所要解决的技术问题是现有技术中存在的将层次聚类分析迁移至云上后产生的数据隐私有泄露风险的技术问题。提供一种新的基于向量同态加密的隐私保护层次聚类方法,该基于向量同态加密的隐私保护层次聚类方法具有安全性高、泄密可能性小的特点。
为解决上述技术问题,采用的技术方案如下:
一种基于向量同态加密的隐私保护层次聚类方法,所述方法包括:
(1)聚类分析开始,客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由N个待聚类的样本组成;
(2)使用向量同态加密方法对待聚类向量组(x1,x2,…xn)进行加密,在加密过程中保留密钥交换矩阵M、比特扩展矩阵W,得到密文向量组(c1,c2,…,cn);
(3)根据密钥交换矩阵M与比特扩展矩阵W,计算求得矩阵A,使得AM=W,定义中间矩阵H=ATA;
(4)将中间矩阵H与密文向量组(c1,c2,…,cn)传送至聚类服务器进行聚类分析,为密文向量组(c1,c2,…,cn)中的每一个向量附上聚类标签;
(5)聚类服务器将聚类分析完成的密文向量组(c1,c2,…,cn)发送回客户端,由客户端使用密钥矩阵S进行解密,根据各个向量的标签组合得到聚类结果;n为正整数。
上述方案中,为优化,进一步地,所述向量同态加密的方法包括:
(A)生成随机矩阵T,同时生成大整数w及整数l,大整数w>>随机矩阵T中的任一元素,并且2l大于待聚类向量组(x1,x2,…xn)中的任一元素;
(B)设置密钥S1,通过
Figure GDA0002625821310000031
得到对应的密钥交换矩阵M,记录密钥交换矩阵M和密钥矩阵S;
(C)根据密钥交换矩阵M及c=Mx*,得到密文向量组(c1,c2,…cn);
其中,T∈Zn×n,S1=[I,T],I为单位矩阵,n×n为T的维度,Y为随机矩阵,E为随机噪声矩阵。
进一步地,所述步骤(4)中聚类分析包括:
(a)根据待聚类向量的密文向量组(c1,c2,…,cn)及中间矩阵H,给密文向量组(c1,c2,…,cn)中每个待聚类向量附上各不相同的标签,记录现有类的数目n;
(b)计算两个向量ci,cj之间的相似度,将计算结果保存在邻接矩阵D;
(c)查找步骤(b)中邻接矩阵D,查找出,将相似度最高的两个类的向量的类合为一个类,更新密文向量组(c1,c2,…,cn)中所有类的标签,定义n=n-1;
(d)检查类的数量达到阀值,是则返回结果,否则返回步骤(b)进行新一轮迭代;
其中,i为小于n的正整数,j为小于n的正整数。
进一步地,所述相似度最高的两个类为距离最近的两个类。
进一步地,所述类为数据点。
进一步地,所述步骤(b)计算两个向量ci,cj之间的相似度包括:计算ci-cj,邻接矩阵D中的元素Dij=Dji=(ci-cj)TH(ci-cj)。
进一步地,所述向量同态加密方法支持向量加法、线性变换和加权内积的同态运算。
本发明通过向量同态加密的方法实现基于向量同态加密的隐私保护层次聚类方法。向量同态加密的方法在对加密数据进行运算时可以保证运算函数的私密性向量同态加密的方法支持向量的加法、线性变换和加权内积的同态运算。本发明可以在对第三方云保密的情况下,实现高效准确的聚类。实际的实施过程中,数据都是外包给第三方云端来进行计算的。而在这个过程中,第三方云端通常都是不可信的,因此在这个过程中对不可信的云端保证数据的隐私是必要的。
本发明能够良好的对用户隐私数据保护,并且在隐私数据受到保护的情况下,通过层次聚类算法对向量组进行高效准确的聚类,提高了对向量类型判断的效率,扩大了向量类型判断的应用范围。
本发明的有益效果:
效果一,保证数据隐私可靠性;
效果二,提高数据安全性;
效果三,提高了对向量类型判断的效率,扩大了向量类型判断的应用范围。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1,实施例1中基于向量同态加密的隐私保护层次聚类方法流程示意图。
图2,聚类分析流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供一种基于向量同态加密的隐私保护层次聚类方法,如图1,所述方法包括:
(1)聚类分析开始,客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由N个待聚类的样本组成;
(2)使用向量同态加密方法对待聚类向量组(x1,x2,…xn)进行加密,在加密过程中保留密钥交换矩阵M、比特扩展矩阵W,得到密文向量组(c1,c2,…,cn);
(3)根据密钥交换矩阵M与比特扩展矩阵W,计算求得矩阵A,使得AM=W,定义中间矩阵H=ATA;
(4)将中间矩阵H与密文向量组(c1,c2,…,cn)传送至聚类服务器进行聚类分析,为密文向量组(c1,c2,…,cn)中的每一个向量附上聚类标签;
(5)聚类服务器将聚类分析完成的密文向量组(c1,c2,…,cn)发送回客户端,由客户端使用密钥矩阵S进行解密,根据各个向量的标签组合得到聚类结果;其中,n为正整数。
具体地,所述向量同态加密的方法包括:
(A)生成随机矩阵T,同时生成大整数w及整数l,大整数w>>随机矩阵T中的任一元素,并且2l大于待聚类向量组(x1,x2,…xn)中的任一元素;
(B)设置密钥S1,通过
Figure GDA0002625821310000061
得到对应的密钥交换矩阵M,记录密钥交换矩阵M和密钥矩阵S;
(C)根据密钥交换矩阵M及c=Mx*,得到密文向量组(c1,c2,…cn);
其中,T∈Zn×n,S1=[I,T],I为单位矩阵,n为密文向量组的维度,Y为随机矩阵,E为随机噪声矩阵。
具体地,如图2,所述步骤(4)中聚类分析包括:
(a)根据待聚类向量的密文向量组(c1,c2,…,cn)及中间矩阵H,给密文向量组(c1,c2,…,cn)中每个待聚类向量附上各不相同的标签,记录现有类的数目n;
(b)计算两个向量ci,cj之间的相似度,将计算结果保存在邻接矩阵D;
(c)查找步骤(b)中邻接矩阵D,查找出,将相似度最高的两个类的向量的类合为一个类,更新密文向量组(c1,c2,…,cn)中所有类的标签,定义n=n-1;
(d)检查类的数量达到阀值,是则返回结果,否则返回步骤(b)进行新一轮迭代;
其中,i为小于n的正整数,j为小于n的正整数。
其中,所述相似度最高的两个类为距离最近的两个类。
其中,所述类为数据点。
具体地,所述步骤(b)计算两个向量ci,cj之间的相似度包括:计算ci-cj,邻接矩阵D中的元素Dij=Dji=(ci-cj)TH(ci-cj)。
另外,所述向量同态加密方法支持向量加法、线性变换和加权内积的同态运算。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员能够理解本发明,但是本发明不仅限于具体实施方式的范围,对本技术领域的普通技术人员而言,只要各种变化只要在本发明精神和范围内,一切利用本发明构思的发明创造均在保护之列。

Claims (7)

1.一种基于向量同态加密的隐私保护层次聚类方法,其特征在于:所述方法包括:
(1)聚类分析开始,客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由n个待聚类的样本组成;
(2)使用密钥矩阵S、向量同态加密方法对待聚类向量组(x1,x2,…xn)进行加密,在加密过程中保留密钥交换矩阵M、比特扩展矩阵W,得到密文向量组(c1,c2,…,cn);
(3)根据密钥交换矩阵M与比特扩展矩阵W,计算求得矩阵A,使得AM=W,定义中间矩阵H=ATA;
(4)将中间矩阵H与密文向量组(c1,c2,…,cn)传送至聚类服务器进行聚类分析,为密文向量组(c1,c2,…,cn)中的每一个向量附上聚类标签;
(5)聚类服务器将聚类分析完成的密文向量组(c1,c2,…,cn)发送回客户端,由客户端使用密钥矩阵S进行解密,根据各个向量的标签组合得到聚类结果;
其中,n为正整数,T为随机矩阵。
2.根据权利要求1所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:所述向量同态加密的方法包括:
(A)生成随机矩阵T,同时生成大整数w及整数l,大整数w>>随机矩阵T中的任一元素,并且2l大于待聚类向量组(x1,x2,…xn)中的任一元素;
(B)设置密钥S1,通过
Figure FDA0002625821300000011
得到对应的密钥交换矩阵M,记录密钥交换矩阵M和密钥矩阵S;
(C)根据密钥交换矩阵M及c=Mx*,得到密文向量组(c1,c2,…cn);
其中,T∈Zn×n,S1=[I,T],I为单位矩阵,n×n为T的维度,Y为随机矩阵,E为随机噪声矩阵,n为正整数,密钥矩阵S为密钥S1。
3.根据权利要求1所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:步骤(4)中聚类分析包括:
(a)接收待聚类向量的密文向量组(c1,c2,…,cn)及中间矩阵H,给密文向量组(c1,c2,…,cn)中每个待聚类向量附上各不相同的标签,记录现有类的数目n;
(b)计算两个向量ci,cj之间的相似度,将计算结果保存在邻接矩阵D;
(c)查找步骤(b)中邻接矩阵D,将相似度最高的两个类的向量的类合为一个类,更新密文向量组(c1,c2,…,cn)中所有类的标签,定义n=n-1;
(d)检查类的数量达到预设值,是则返回结果,否则返回步骤(b)进行新一轮迭代;
其中,i为小于n的正整数,j为小于n的正整数。
4.根据权利要求3所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:所述相似度最高的两个类为距离最近的两个类。
5.根据权利要求3所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:所述类为数据点。
6.根据权利要求3或4所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:步骤(b)中所述计算两个向量ci,cj之间的相似度包括:计算ci-cj,邻接矩阵D中的元素Dij=Dji=(ci-cj)TH(ci-cj)。
7.根据权利要求1所述的基于向量同态加密的隐私保护层次聚类方法,其特征在于:所述向量同态加密方法支持向量加法、线性变换和加权内积的同态运算。
CN201710513628.5A 2017-06-29 2017-06-29 一种基于向量同态加密的隐私保护层次聚类方法 Expired - Fee Related CN107241182B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710513628.5A CN107241182B (zh) 2017-06-29 2017-06-29 一种基于向量同态加密的隐私保护层次聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710513628.5A CN107241182B (zh) 2017-06-29 2017-06-29 一种基于向量同态加密的隐私保护层次聚类方法

Publications (2)

Publication Number Publication Date
CN107241182A CN107241182A (zh) 2017-10-10
CN107241182B true CN107241182B (zh) 2020-10-13

Family

ID=59991395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710513628.5A Expired - Fee Related CN107241182B (zh) 2017-06-29 2017-06-29 一种基于向量同态加密的隐私保护层次聚类方法

Country Status (1)

Country Link
CN (1) CN107241182B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694702A (zh) * 2018-03-30 2018-10-23 宁波宝略智能科技有限公司 一种倾斜摄影实景三维模型的空间坐标系统转换方法
CN108830284B (zh) * 2018-06-27 2020-10-27 电子科技大学 基于密文图像灰度直方图向量的图像识别方法
CN109359588B (zh) * 2018-10-15 2021-02-09 电子科技大学 一种新的隐私保护下非交互式的k近邻分类方法
CN109615021B (zh) * 2018-12-20 2022-09-27 暨南大学 一种基于k均值聚类的隐私信息保护方法
CN109902742B (zh) * 2019-02-28 2021-07-16 深圳前海微众银行股份有限公司 基于加密迁移学习的样本补全方法、终端、系统及介质
CN110233730B (zh) * 2019-05-22 2022-05-03 暨南大学 一种基于k均值聚类的隐私信息保护方法
CN110163292A (zh) * 2019-05-28 2019-08-23 电子科技大学 基于向量同态加密的隐私保护k-means聚类方法
CN111143865B (zh) * 2019-12-26 2022-12-30 国网湖北省电力有限公司 一种密文数据上标签自动生成的用户行为分析系统及方法
CN111310817B (zh) * 2020-02-10 2022-02-11 深圳大学 谱聚类方法、装置、系统、计算机设备和存储介质
CN113313160B (zh) * 2021-05-24 2022-09-23 南京邮电大学 一种基于消费数据和同态加密算法的消费人群分类方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105959111A (zh) * 2016-07-01 2016-09-21 何钟柱 基于云计算和可信计算的信息安全大数据资源访问控制系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708216A (zh) * 2012-06-28 2012-10-03 北京邮电大学 一种面向密文搜索的分词组织方法和聚类方法
US20150381579A1 (en) * 2014-06-26 2015-12-31 Vivalect Software Ab Method and server for handling of personal information
US10791123B2 (en) * 2015-11-25 2020-09-29 Yaron Gvili Selectivity in privacy and verification with applications
EP3387809B1 (en) * 2015-12-10 2021-04-21 Nokia Technologies Oy Schemes of homomorphic re-encryption
CN106790069B (zh) * 2016-12-21 2020-03-31 电子科技大学 基于向量同态加密的隐私保护k-nn分类方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105959111A (zh) * 2016-07-01 2016-09-21 何钟柱 基于云计算和可信计算的信息安全大数据资源访问控制系统

Also Published As

Publication number Publication date
CN107241182A (zh) 2017-10-10

Similar Documents

Publication Publication Date Title
CN107241182B (zh) 一种基于向量同态加密的隐私保护层次聚类方法
Giannotti et al. Privacy-preserving mining of association rules from outsourced transaction databases
Imani et al. A framework for collaborative learning in secure high-dimensional space
CN106534085B (zh) 一种基于区块链技术的隐私保护方法
US9438412B2 (en) Computer-implemented system and method for multi-party data function computing using discriminative dimensionality-reducing mappings
CN106790069B (zh) 基于向量同态加密的隐私保护k-nn分类方法
US10554385B2 (en) Method for providing encrypted data in a database and method for searching on encrypted data
Wang et al. Safeguarding cross-silo federated learning with local differential privacy
CN106952212B (zh) 一种基于向量同态加密的hog图像特征提取算法
CN106571905A (zh) 一种数值型数据同态保序加密方法
Bu et al. Privacy preserving back-propagation based on BGV on cloud
Liu et al. Secure KNN classification scheme based on homomorphic encryption for cyberspace
CN115037556A (zh) 一种智慧城市系统中加密数据可授权共享方法
Fan et al. Asymmetric structure-preserving subgraph queries for large graphs
Vatsalan et al. Sorted nearest neighborhood clustering for efficient private blocking
Shaham et al. Machine learning aided anonymization of spatiotemporal trajectory datasets
Salman et al. Proposed Approach to Sensitive Association Rules Protection based on Compressing and Cryptography:(SARP-CC)
CN109409111B (zh) 一种面向加密图像的模糊搜索方法
Kaya et al. Efficient privacy preserving distributed clustering based on secret sharing
Hong et al. Augmented Rotation‐Based Transformation for Privacy‐Preserving Data Clustering
CN116756763A (zh) 一种电力终端交互数据的隐私保护方法及系统
Miao et al. Grouped secret sharing schemes based on lagrange interpolation polynomials and chinese remainder theorem
Blanton et al. Secure and oblivious maximum bipartite matching size algorithm with applications to secure fingerprint identification
Shuguo et al. Multi-party privacy-preserving decision trees for arbitrarily partitioned data
Gorbenko et al. Analysis of asymmetric NTRU prime IIT Ukraine encryption algorithm with regards to known attacks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201013

CF01 Termination of patent right due to non-payment of annual fee