CN103970889A - 一种中英文关键词模糊搜索的安全云盘 - Google Patents

一种中英文关键词模糊搜索的安全云盘 Download PDF

Info

Publication number
CN103970889A
CN103970889A CN201410215939.XA CN201410215939A CN103970889A CN 103970889 A CN103970889 A CN 103970889A CN 201410215939 A CN201410215939 A CN 201410215939A CN 103970889 A CN103970889 A CN 103970889A
Authority
CN
China
Prior art keywords
keyword
server end
document
module
trapdoor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410215939.XA
Other languages
English (en)
Inventor
陈何峰
林柏钢
杨旸
钟玲
吴阳
王淑娥
李宇翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201410215939.XA priority Critical patent/CN103970889A/zh
Publication of CN103970889A publication Critical patent/CN103970889A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Abstract

一种中英文关键词模糊搜索的安全云盘,其特征在于:由客户端、私有云服务器端、网络云盘服务器端三个部分组成,用户将敏感数据存储到云服务器中,可以先将文档加密后上传,之后通过密文检索返回所需文档,保证文档的隐私性;又可以为密文文档的信息检索提供针对于中英文的模糊搜索,具有较高的效率。

Description

一种中英文关键词模糊搜索的安全云盘
技术领域
本发明涉及网络关键词搜索技术领域,特别是一种中英文关键词模糊搜索在云盘中的利用。
背景技术
越来越多的用户为节省个人存储资源开支,将数据存储到云服务提供商,云服务提供商以网络云盘的形式向用户提供存储服务,例如360云盘,百度云盘。具有用户数据直接访问权的云服务提供商是 “半可信的”,(相关文献:Li J, Wang Q, Wang C, et al. Fuzzy keyword search over encrypted data in cloud computing[C]//INFOCOM, 2010 Proceedings IEEE. IEEE, 2010: 1-5.。)用户数据必须经过加密保护后上传,包括存放数据的文件名。因此,对加密文件进行快速搜索查找变得非常重要。
将数据加密后存储到云存储服务器中,无论是云服务器管理员还是外部攻击者都无法获取数据真实内容,保护了用户的隐私性。但是,这给密文数据的信息检索带来了极大的挑战,可搜索加密技术用于解决密文检索问题。由于存储在云服务器上的数据都是密文形式,是乱码,而不是有规则的明文形式,所以传统的信息检索方法不适用此种环境。搜索加密模型最先被Song等人提出。在他们的方案中,对文件中的每个词都进行了独立的双层加密结构,他们给搜索对象提供了可证的隐私保护,(相关文献:D. Song, D. Wagner, A. Perrig. Practical techniques for searches on encrypted data[C]. Proceedings of IEEE Security and Privacy, 2000: 44-55,B. Chor, O. Goldreich, E. Kushilevitz, et al. Private information retrieval[C].Proceedings of the 68th Annual Symposium on Foundations of Computer Science.IEEE, 1995:41-50。)尽管该方案安全有效的解决了英文密文搜索问题,但是该方案只能提供英文关键词的精确查找,已无法满足用户的需求。用户在使用关键词查找时,输入的关键词经常会有拼写错误或者存在一定的格式不一致的问题,针对这个问题,Ji提出了基于通配符和Gram-base的关键词模糊集构造法实现了在云存储环境中基于密文的英文关键词模糊查询,(相关文献:S. Ji, G. Li, C. Li, et al. Efficient interactive fuzzy keyword search[C]. VLDB Journal, 2009,20(4): 617-640)该方案通过首先构造关键词模糊集,检索时对模糊集合进行陷门匹配完成模糊搜索,有效解决了密文环境下的英文关键词模糊搜索的安全快速检索问题,但由于中文的特殊性,把任意两个中文间的差异都用一个编辑距离来表示,增加了模糊匹配过程中的模糊程度,不适用于对密文进行中文关键词搜索情况。
发明内容
针对目前尚缺少同时支持中英文关键词的可搜索加密方案,本发明提出了一种高效的基于密文的支持中英文关键词模糊搜索的安全云盘。采用关键词智能识别法分辨中文与英文关键词,若是英文关键词使用Gram-based关键词模糊集构造法构造关键词模糊集合,若是中文关键词则使用基于拼音的汉字串相似度衡量方法,使用基于Gram-based算法的Chinese-Gram-based中文关键词的模糊集构造算法构造模糊集合;改进了现有的搜索索引结构,提出了基于n叉树的关键词陷门搜索索引结构,提高云服务器搜索效率。
本发明的技术方案为:由客户端、私有云服务器端、网络云盘服务器端三个部分组成;所述的客户端由文件加解密模块、界面显示模块、关键词提取模块、中英文关键词识别模块、关键词模糊集合构造模块、陷门生成模块、通信模块组成;所述的私有云服务器端由索引树构造模块、索引查找模块、通信模块组成;所述的网络云盘服务器端由文件查找模块、文件存储模块、通信模块组成;客户端、私有云服务器端、网络云盘服务器端上各自的通信模块通过互联网相互连接。
所述的客户端通过输入密钥对文档进行加密操作,客户端获取文档关键词并进行相应的模糊集扩展,并对扩展后的关键词集合通过安全哈希函数生成陷门集合,并将关键词陷门集合与密文文件ID上传至私有云服务器端,将密文文件上传到网络云盘服务器;当遇到搜索请求时,客户端根据密钥生成关键词陷门集合,并将陷门集合提交给私有云服务器端,对网络云盘服务器端返回的文档使用密钥进行解密。
所述的私有云服务器端通过用户上传的关键词陷门集合以及密文文件ID构建基于n叉树的关键词陷门搜索索引结构树;并对用户提交的关键词陷门,通过索引树查找法找到相应的文档ID,将该文档ID发送给网络云盘服务器端,网络云盘服务器端给用户返回文档ID对应的密文文件;当用户需要更新时,根据用户提交的更新请求,增加、删除和更改操作只需修改私有云服务器端相应的索引树即可,搜索时间只需
所述的网络云盘服务器端存储密文文件,通过文档ID查找到相应文档,并将该文档返回给客户端。
本发明的优点在于:为密文文档的信息检索提供针对于中英文的模糊搜索功能,即使用户对某一关键词的输入发生错误也能返回相关文档,n叉树索引结构对文档的增加、删除和更新操作具有较高的效率。
附图说明
图1为本发明的构造示意图。
图2为关键词模糊集构造方法示意图。
图3为搜索索引构造及关键词搜索方法示意图。
具体实施方式
下面结合图1、图2、图3及具体实施例对本发明作进一步说明。
本发明的技术方案为:由客户端、私有云服务器端、网络云盘服务器端三个部分组成;所述的客户端由文件加解密模块、界面显示模块、关键词提取模块、中英文关键词识别模块、关键词模糊集合构造模块、陷门生成模块、通信模块组成;所述的私有云服务器端由索引树构造模块、索引查找模块、通信模块组成;所述的网络云盘服务器端由文件查找模块、文件存储模块、通信模块组成;客户端、私有云服务器端、网络云盘服务器端上各自的通信模块通过互联网相互连接。
所述的客户端通过输入密钥对文档进行加密操作,客户端获取文档关键词并进行相应的模糊集扩展,并对扩展后的关键词集合通过安全哈希函数生成陷门集合,并将关键词陷门集合与密文文件ID上传至私有云服务器端,将密文文件上传到网络云盘服务器;当遇到搜索请求时,客户端根据密钥生成关键词陷门集合,并将陷门集合提交给私有云服务器端,对网络云盘服务器端返回的文档使用密钥进行解密。
所述的私有云服务器端通过用户上传的关键词陷门集合以及密文文件ID构建基于n叉树的关键词陷门搜索索引结构树;并对用户提交的关键词陷门,通过索引树查找法找到相应的文档ID,将该文档ID发送给网络云盘服务器端,网络云盘服务器端给用户返回文档ID对应的密文文件;当用户需要更新时,根据用户提交的更新请求,增加、删除和更改操作只需修改私有云服务器端相应的索引树即可,搜索时间只需
所述的网络云盘服务器端存储密文文件,通过文档ID查找到相应文档,并将该文档返回给客户端。
图1中,
(1)客户端可以有若干个,每个客户端主要负责文档加解密,构建关键词陷门集合和提交搜索请求等功能, 其中:
A.文件加解密模块:主要通过调用现有的对称加密算法对文档进行加密,如AES,DES,3DES等传统对称加密算法;
B.界面显示模块:主要负责选取加密文件、显示搜索结果以及输入检索关键词等功能;
C.关键词提取模块:主要通过提取文档标题的关键词;
D.中英文关键词识别模块:采用中英文识别法区别出中英文关键词,并采用中文分词法对中文关键词进行分词处理;
E.关键词模糊集合构造模块:英文关键词采用Gram-based算法构造,中文关键词采用Chinese-Gram-based算法构造;
F.陷门生成模块:根据安全哈希HMAC-MD5函数对关键词模糊集合中的关键词进行哈希处理,生成陷门集合;
G.通信模块:主要负责提交用户搜索陷门,上传/下载密文文档集以及上传陷门集合等操作。
(2)私有云服务器端,主要负责索引树构建与索引查找等功能,其中:
A.索引树构造模块:通过用户上传的陷门集合构造n叉树,并在叶子节点链接上相应的文档ID;
B索引查找模块:主要通过用户提交的关键词陷门查找索引树并得出相应文档ID集合;
C.通信模块:主要负责将检索到的密文文档ID发送给网络云盘服务器端以及接收客户端的发送请求。
(3)网络云盘服务器端,主要负责密文文件的存储与文件查找等功能,其中:
A.文件查找模块:根据文档ID返回相应的密文文档信息;
B.文件存储模块:主要负责存储客户端上传的密文文档,通过索引查找结果,将检索到的文档返回给用户;
C.通信模块:主要负责将检索到的密文文档发送给用户端以及接收私有云服务器端的文档ID信息。
参看图2、3,用户先通过客户端对文档进行加密,并对文档提取关键词形成关键词模糊集合,将加密后的文档和关键词陷门集合上传到云存储服务器中,需要文档时,在搜索框中输入关键词,客户端对关键词构造陷门并将陷门提交至云存储服务器,服务器通过陷门对索引进行查找,将查找到的文档返回给客户端,客户端对文档进行解密。
本发明为密文文档的信息检索提供针对于中英文的模糊搜索功能,即使用户对某一关键词的输入发生错误也能返回相关文档,n叉树索引结构对文档的增加、删除和更新操作具有较高的效率。用户将敏感数据存储到云服务器中,可以先将文档加密后上传,之后通过密文检索返回所需文档,保证文档的隐私性。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (4)

1.一种中英文关键词模糊搜索的安全云盘,其特征在于:由客户端、私有云服务器端、网络云盘服务器端三个部分组成;所述的客户端由文件加解密模块、界面显示模块、关键词提取模块、中英文关键词识别模块、关键词模糊集合构造模块、陷门生成模块、通信模块组成;所述的私有云服务器端由索引树构造模块、索引查找模块、通信模块组成;所述的网络云盘服务器端由文件查找模块、文件存储模块、通信模块组成;客户端、私有云服务器端、网络云盘服务器端上各自的通信模块通过互联网相互连接。
2.根据权利要求书1所述的一种中英文关键词模糊搜索的安全云盘,其特征在于:客户端通过输入密钥对文档进行加密操作,客户端获取文档关键词并进行相应的模糊集扩展,并对扩展后的关键词集合通过安全哈希函数生成陷门集合,并将关键词陷门集合与密文文件ID上传至私有云服务器端,将密文文件上传到网络云盘服务器;当遇到搜索请求时,客户端根据密钥生成关键词陷门集合,并将陷门集合提交给私有云服务器端,对网络云盘服务器端返回的文档使用密钥进行解密。
3.根据权利要求书1所述的一种中英文关键词模糊搜索的安全云盘,其特征在于:私有云服务器端通过用户上传的关键词陷门集合以及密文文件ID构建基于n叉树的关键词陷门搜索索引结构树;并对用户提交的关键词陷门,通过索引树查找法找到相应的文档ID,将该文档ID发送给网络云盘服务器端,网络云盘服务器端给用户返回文档ID对应的密文文件;当用户需要更新时,根据用户提交的更新请求,增加、删除和更改操作只需修改私有云服务器端相应的索引树即可,搜索时间只需
4.根据权利要求书1所述的一种中英文关键词模糊搜索的安全云盘,其特征在于:网络云盘服务器端存储密文文件,通过文档ID查找到相应文档,并将该文档返回给客户端。
CN201410215939.XA 2014-05-22 2014-05-22 一种中英文关键词模糊搜索的安全云盘 Pending CN103970889A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410215939.XA CN103970889A (zh) 2014-05-22 2014-05-22 一种中英文关键词模糊搜索的安全云盘

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410215939.XA CN103970889A (zh) 2014-05-22 2014-05-22 一种中英文关键词模糊搜索的安全云盘

Publications (1)

Publication Number Publication Date
CN103970889A true CN103970889A (zh) 2014-08-06

Family

ID=51240387

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410215939.XA Pending CN103970889A (zh) 2014-05-22 2014-05-22 一种中英文关键词模糊搜索的安全云盘

Country Status (1)

Country Link
CN (1) CN103970889A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104579632A (zh) * 2014-12-19 2015-04-29 上海天旦网络科技发展有限公司 运维系统中敏感数据安全存储和检索的方法及装置
CN104978536A (zh) * 2015-07-08 2015-10-14 合肥高维数据技术有限公司 一种隐私保护云图像管理系统
CN105320896A (zh) * 2015-10-21 2016-02-10 成都卫士通信息产业股份有限公司 一种云存储加密以及其密文检索方法与系统
CN106599719A (zh) * 2016-12-12 2017-04-26 西安电子科技大学 支持高效密钥管理的密文检索方法
CN107220343A (zh) * 2017-05-26 2017-09-29 福州大学 基于局部敏感哈希的中文多关键词模糊排序密文搜索方法
CN107734054A (zh) * 2017-11-06 2018-02-23 福州大学 安全云存储中的加密数据检索系统
CN108334612A (zh) * 2018-02-07 2018-07-27 华南理工大学 一种针对密文域的形近汉字全文模糊检索方法
CN108694186A (zh) * 2017-04-07 2018-10-23 阿里巴巴集团控股有限公司 数据发送方法及服务器应用、计算设备及计算机可读介质
CN109214206A (zh) * 2018-08-01 2019-01-15 武汉普利商用机器有限公司 云备份存储系统及方法
CN109471964A (zh) * 2018-10-23 2019-03-15 哈尔滨工程大学 一种基于同义词集的模糊多关键词可搜索加密方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593476A (zh) * 2013-11-28 2014-02-19 中国科学院信息工程研究所 一种面向云存储的多关键词明密文检索方法和系统
CN103685473A (zh) * 2013-11-20 2014-03-26 宇龙计算机通信科技(深圳)有限公司 客户端、代理服务器、检索方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103685473A (zh) * 2013-11-20 2014-03-26 宇龙计算机通信科技(深圳)有限公司 客户端、代理服务器、检索方法及系统
CN103593476A (zh) * 2013-11-28 2014-02-19 中国科学院信息工程研究所 一种面向云存储的多关键词明密文检索方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曹犟 等: "基于拼音索引的中文模糊匹配算法", 《清华大学学报(自然科学版)》 *
李倩: "安全云存储中高效的关键词查找方案", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104579632A (zh) * 2014-12-19 2015-04-29 上海天旦网络科技发展有限公司 运维系统中敏感数据安全存储和检索的方法及装置
CN104978536A (zh) * 2015-07-08 2015-10-14 合肥高维数据技术有限公司 一种隐私保护云图像管理系统
CN104978536B (zh) * 2015-07-08 2018-04-17 合肥高维数据技术有限公司 一种隐私保护云图像管理系统
CN105320896B (zh) * 2015-10-21 2018-04-06 成都卫士通信息产业股份有限公司 一种云存储加密以及其密文检索方法与系统
CN105320896A (zh) * 2015-10-21 2016-02-10 成都卫士通信息产业股份有限公司 一种云存储加密以及其密文检索方法与系统
CN106599719A (zh) * 2016-12-12 2017-04-26 西安电子科技大学 支持高效密钥管理的密文检索方法
CN108694186A (zh) * 2017-04-07 2018-10-23 阿里巴巴集团控股有限公司 数据发送方法及服务器应用、计算设备及计算机可读介质
CN107220343A (zh) * 2017-05-26 2017-09-29 福州大学 基于局部敏感哈希的中文多关键词模糊排序密文搜索方法
CN107220343B (zh) * 2017-05-26 2020-09-01 福州大学 基于局部敏感哈希的中文多关键词模糊排序密文搜索方法
CN107734054A (zh) * 2017-11-06 2018-02-23 福州大学 安全云存储中的加密数据检索系统
CN108334612A (zh) * 2018-02-07 2018-07-27 华南理工大学 一种针对密文域的形近汉字全文模糊检索方法
CN109214206A (zh) * 2018-08-01 2019-01-15 武汉普利商用机器有限公司 云备份存储系统及方法
CN109471964A (zh) * 2018-10-23 2019-03-15 哈尔滨工程大学 一种基于同义词集的模糊多关键词可搜索加密方法

Similar Documents

Publication Publication Date Title
CN103970889A (zh) 一种中英文关键词模糊搜索的安全云盘
CN107480163B (zh) 一种云环境下支持隐私保护的高效密文图像检索方法
US10013574B2 (en) Method and apparatus for secure storage and retrieval of encrypted files in public cloud-computing platforms
CN103955537A (zh) 一种语义模糊可搜索加密云盘设计方法及系统
Fu et al. Smart cloud search services: verifiable keyword-based semantic search over encrypted cloud data
Wang et al. Towards secure and effective utilization over encrypted cloud data
Khan et al. Secure ranked fuzzy multi-keyword search over outsourced encrypted cloud data
CN109213731B (zh) 云环境中基于迭代加密的多关键词密文检索方法
Mittal et al. Privacy preserving synonym based fuzzy multi-keyword ranked search over encrypted cloud data
CN107294701B (zh) 具有高效密钥管理的多维密文区间查询装置及查询方法
CN108768651A (zh) 支持多维区间范围查询的可搜索公钥加密方法
Kozak et al. Efficiency and security in similarity cloud services
Kumari et al. Privacy preserving similarity based text retrieval through blind storage
Kumar et al. Secure query processing over encrypted database through cryptdb
Kamini et al. Encrypted multi-keyword ranked search supporting gram based search technique
Pramanick et al. Searchable encryption with pattern matching for securing data on cloud server
Sude et al. Authenticated CRF based improved ranked multi-keyword search for multi-owner model in cloud computing
Fang et al. A novel storage and search scheme in cloud computing
Liu et al. A secure multi-keyword fuzzy search with polynomial function for encrypted data in cloud computing
Gabel et al. Secure database outsourcing to the cloud using the mimosecco middleware
Li et al. PIMRS: achieving privacy and integrity‐preserving multi‐owner ranked‐keyword search over encrypted cloud data
Mariyammal et al. Secure Ranked Keyword Search Over Encrypted Cloud Data
SARASWATHI et al. A Secure and Dynamic Multi-Keyword Ranked Search Scheme over Encrypted Cloud Data
Ahmad An Approach for Synonym Based Fuzzy Multi Keyword Ranked Search over Encrypted Cloud Data
RANI et al. Immovable and Commanding Multi-keyword Designate Method Using RSA Algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140806

RJ01 Rejection of invention patent application after publication