CN1588365A - 密文全文检索技术 - Google Patents

密文全文检索技术 Download PDF

Info

Publication number
CN1588365A
CN1588365A CN 200410070113 CN200410070113A CN1588365A CN 1588365 A CN1588365 A CN 1588365A CN 200410070113 CN200410070113 CN 200410070113 CN 200410070113 A CN200410070113 A CN 200410070113A CN 1588365 A CN1588365 A CN 1588365A
Authority
CN
China
Prior art keywords
ciphertext
key
data
index
technology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200410070113
Other languages
English (en)
Inventor
李新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Network Information Center of CAS
Original Assignee
Computer Network Information Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Network Information Center of CAS filed Critical Computer Network Information Center of CAS
Priority to CN 200410070113 priority Critical patent/CN1588365A/zh
Publication of CN1588365A publication Critical patent/CN1588365A/zh
Pending legal-status Critical Current

Links

Images

Abstract

此项发明在PKI和全文检索技术的基础上,实现了在不解密的条件下的数据检索。此项发明是对全文检索技术的改造,在这里几乎保留了全文检索的大部分技术,只对索引文件的索引词进行了加密处理,便于系统实现。密文检索系统的加密、解密发生在客户端,有效的降低了数据安全对服务器和网络环境安全的依赖。

Description

密文全文检索技术
技术领域
本发明属于计算机软件相关领域,是对全文检索技术的改进,能够实现在不解密的情况下的信息检索。
背景技术
电子文档的存储方式为数据的检索和利用提供了极大的方便,因此,越来越多的业务数据成为电子文档,其中也包括一些敏感数据。为了保护敏感数据,有时需要进行加密存储。加密技术在提高数据安全性的同时,也为数据的检索设置了障碍。源本可以很方便检索到数据,经过加密处理后成为不可检索的内容。如果密文数据的数量非常庞大,而又缺乏有效的检索手段,将会严重影响密文数据的利用。
只所以能够从海量数据中较快取得相关信息,全文检索依赖事先建立的基于索引项的索引库。其原理是索引程序扫描数据中的索引项,在索引文件中对每一个索引项建立一个索引,指明该索引项在数据中出现的次数和位置;当用户查询时,检索程序将用户查询条件分解为索引项,在事先建立的索引库中进行查找(而不是从原始数据中查找),并将查找的结果反馈给用户。
发明内容
密文全文检索的索引文件是加密之前建立的,索引文件描述了词条在原文中的位置,实际的检索是在索引文件而不是在原文中查找检索词,因此,对原文进行加密不会影响检索。对于索引文件,我们只对其中的索引词单独加密,而不是对整个索引文件进行加密,因此,密文索引文件中的索引词与检索时单独加密的检索词,如果明文、密钥相同则密文相同。因此,可以通过比对检索词密文和索引文件中的索引词密文,找到检索词在原文中的位置。
加密、解密运算以二进制方式处理数据,为方便处理,可以采用Base64进行编码,将二进制数据转换成字符型数据。
具体实施方式
密文检索技术包括加密、解密、检索及密钥共享几个部分。
1、加密
加密前首先要生成对称密钥(以下简称密钥),为了防止来自网络内部,尤其是系统管理员的安全威胁,密钥应该在客户端生成。
按照全文索引的技术要求,扫描原文、分词并建立索引文件,用密钥对索引文件中的索引词进行加密及Base64编码处理,生成密文索引文件。
用密钥对原文进行加密处理,生成密文。
用自己的公开密钥对密钥进行加密处理生成密钥密文。
将密文索引文件、密文、密钥密文保存到密文库中,完成加密操作,见图1。
2、检索及解密
检索密文前首先要从密文库中下载密钥密文,然后用自己的私有密钥解密,得到密钥。
将查询提问分解成检索词,用密钥将检索词加密,经过Base64编码,得到检索词密文,将检索词密文送到密文库,从密文索引文件中查找密文检索词,进行全文检索。
下载符合检索条件到的密文,用密钥解密,得到原文,见图2。
3、密钥共享
密钥共享包括两个方面的内容:“不同数据间的密钥共享”和“不同用户间的密钥共享”。
不同数据间的密钥共享指的是不同数据采用相同的密钥加密、解密,因此,这些数据应该具有相同的秘密等级或秘密分组。将秘密数据分组,同一组数据使用相同的密钥,可以大大减少密钥数量,简化密钥管理和权限分配。密文全文检索系统可以按照这些秘密分组进行设计,在同一组中检索数据时,因为密钥相同,相同的检索词具有相同的密文,因此,只需一次从密文库下载密钥密文,就可以在这个分组内查找匹配数据。不同的秘密分组由于密钥不同,需要下载不同的密钥密文,分别进行检索,最后将各个秘密分组的检索结果合并为一个,呈现给用户。
不同用户间的密钥共享指的是不同的用户对同一数据可以使用相同的密钥加密、解密。因为密钥相同,因此密文在密文库可以只保留一份,这不仅大大减少了密文库的存储空间耗费,而且也为秘密数据的授权带来极大方便,可以在不对原文解密的情况下,为其它用户建立密钥密文。
图3描述了这样一个秘密授权的流程,秘密授权必须由具有秘密读权限的用户进行。首先,下载自己的密钥密文,解密得到密钥;然后,从证书库下载对方公开密钥;用对方公开密钥对密钥加密,得到对方密钥密文;最后,将密钥密文保存到密文库,完成秘密授权过程。此后,对方就可以下载和使用新产生的密钥密文进行密文检索及数据解密了。
附图说明
图1:数据加密流程。
图2:密文检索流程。
图3:秘密授权流程。

Claims (1)

1.为适合密文检索对全文检索技术进行的改进,其特征是在原文加密前建立索引文件,然后将原文及索引文件中的索引词加密,检索时通过比较检索词密文可以得到检索词在原文中的位置,检索过程不需要解密。
CN 200410070113 2004-08-02 2004-08-02 密文全文检索技术 Pending CN1588365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410070113 CN1588365A (zh) 2004-08-02 2004-08-02 密文全文检索技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410070113 CN1588365A (zh) 2004-08-02 2004-08-02 密文全文检索技术

Publications (1)

Publication Number Publication Date
CN1588365A true CN1588365A (zh) 2005-03-02

Family

ID=34604410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410070113 Pending CN1588365A (zh) 2004-08-02 2004-08-02 密文全文检索技术

Country Status (1)

Country Link
CN (1) CN1588365A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100424704C (zh) * 2006-09-30 2008-10-08 华中科技大学 基于密文的全文检索系统
CN101931947A (zh) * 2010-07-28 2010-12-29 南京航空航天大学 基于可搜索密文的wsn数据安全处理方法
CN102024054A (zh) * 2010-12-10 2011-04-20 中国科学院软件研究所 一种面向密文云存储的文档检索方法与系统
CN102176709A (zh) * 2010-12-13 2011-09-07 北京交通大学 一种带隐私保护的数据共享与发布的方法和装置
CN102184234A (zh) * 2011-05-13 2011-09-14 百度在线网络技术(北京)有限公司 用于查询、增加、更新或删除信息处理规则的方法和设备
CN102387343A (zh) * 2010-08-25 2012-03-21 索尼公司 终端设备,服务器,数据处理系统,数据处理方法和程序
CN102708216A (zh) * 2012-06-28 2012-10-03 北京邮电大学 一种面向密文搜索的分词组织方法和聚类方法
CN103049466A (zh) * 2012-05-14 2013-04-17 深圳市朗科科技股份有限公司 一种基于分布式密文存储的全文检索方法及系统
CN101593196B (zh) * 2008-05-30 2013-09-25 日电(中国)有限公司 用于快速密文检索的方法、装置和系统
CN103595730A (zh) * 2013-11-28 2014-02-19 中国科学院信息工程研究所 一种密文云存储方法和系统
CN103914541A (zh) * 2014-04-03 2014-07-09 小米科技有限责任公司 信息搜索的方法及装置
CN103944711A (zh) * 2014-02-17 2014-07-23 国家超级计算深圳中心 一种云存储密文检索方法及其系统
CN104967516A (zh) * 2015-07-24 2015-10-07 四川理工学院 多用户加密数据可比较加密方法及加密数据比较方法
JP2016200938A (ja) * 2015-04-09 2016-12-01 株式会社日立ソリューションズ 検索システム
US9633219B2 (en) 2015-08-26 2017-04-25 International Business Machines Corporation Providing secure indexes for searching encrypted data
CN106961427A (zh) * 2017-03-10 2017-07-18 北京科技大学 一种基于5g通信标准的密文数据搜索方法
CN109255248A (zh) * 2018-08-28 2019-01-22 福建南威软件有限公司 一种基于加解密算法的全文检索方法
CN109740362A (zh) * 2019-01-03 2019-05-10 中国科学院软件研究所 一种基于熵编码的密文索引生成与检索方法及系统

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100424704C (zh) * 2006-09-30 2008-10-08 华中科技大学 基于密文的全文检索系统
CN101593196B (zh) * 2008-05-30 2013-09-25 日电(中国)有限公司 用于快速密文检索的方法、装置和系统
CN101931947A (zh) * 2010-07-28 2010-12-29 南京航空航天大学 基于可搜索密文的wsn数据安全处理方法
CN102387343B (zh) * 2010-08-25 2016-08-03 索尼公司 终端设备,服务器,数据处理系统,数据处理方法
CN102387343A (zh) * 2010-08-25 2012-03-21 索尼公司 终端设备,服务器,数据处理系统,数据处理方法和程序
CN102024054A (zh) * 2010-12-10 2011-04-20 中国科学院软件研究所 一种面向密文云存储的文档检索方法与系统
CN102176709B (zh) * 2010-12-13 2013-11-13 北京交通大学 一种带隐私保护的数据共享与发布的方法和装置
CN102176709A (zh) * 2010-12-13 2011-09-07 北京交通大学 一种带隐私保护的数据共享与发布的方法和装置
CN102184234A (zh) * 2011-05-13 2011-09-14 百度在线网络技术(北京)有限公司 用于查询、增加、更新或删除信息处理规则的方法和设备
CN103049466A (zh) * 2012-05-14 2013-04-17 深圳市朗科科技股份有限公司 一种基于分布式密文存储的全文检索方法及系统
CN103049466B (zh) * 2012-05-14 2016-04-27 深圳市朗科科技股份有限公司 一种基于分布式密文存储的全文检索方法及系统
CN102708216A (zh) * 2012-06-28 2012-10-03 北京邮电大学 一种面向密文搜索的分词组织方法和聚类方法
CN103595730A (zh) * 2013-11-28 2014-02-19 中国科学院信息工程研究所 一种密文云存储方法和系统
CN103595730B (zh) * 2013-11-28 2016-06-08 中国科学院信息工程研究所 一种密文云存储方法和系统
CN103944711A (zh) * 2014-02-17 2014-07-23 国家超级计算深圳中心 一种云存储密文检索方法及其系统
CN103944711B (zh) * 2014-02-17 2017-05-24 国家超级计算深圳中心 一种云存储密文检索方法及其系统
CN103914541A (zh) * 2014-04-03 2014-07-09 小米科技有限责任公司 信息搜索的方法及装置
JP2016200938A (ja) * 2015-04-09 2016-12-01 株式会社日立ソリューションズ 検索システム
CN104967516A (zh) * 2015-07-24 2015-10-07 四川理工学院 多用户加密数据可比较加密方法及加密数据比较方法
CN104967516B (zh) * 2015-07-24 2018-04-24 四川理工学院 多用户加密数据可比较加密方法及加密数据比较方法
US9633219B2 (en) 2015-08-26 2017-04-25 International Business Machines Corporation Providing secure indexes for searching encrypted data
US10037435B2 (en) 2015-08-26 2018-07-31 International Business Machines Corporation Providing secure indexes for searching encrypted data
CN106961427A (zh) * 2017-03-10 2017-07-18 北京科技大学 一种基于5g通信标准的密文数据搜索方法
CN106961427B (zh) * 2017-03-10 2019-08-06 北京科技大学 一种基于5g通信标准的密文数据搜索方法
CN109255248A (zh) * 2018-08-28 2019-01-22 福建南威软件有限公司 一种基于加解密算法的全文检索方法
CN109740362A (zh) * 2019-01-03 2019-05-10 中国科学院软件研究所 一种基于熵编码的密文索引生成与检索方法及系统

Similar Documents

Publication Publication Date Title
Bhardwaj et al. Security algorithms for cloud computing
US7587608B2 (en) Method and apparatus for storing data on the application layer in mobile devices
KR101371608B1 (ko) Dbms 및 데이터베이스에서 암호화 방법
CN1588365A (zh) 密文全文检索技术
JP6884642B2 (ja) データ再暗号化を介して機密データを保護するためのコンピュータ実施システムおよび方法
CN112380557B (zh) 一种关系型数据库加密方法及该加密数据库查询方法
US20030056118A1 (en) Method for encryption in an un-trusted environment
CA3065767C (en) Cryptographic key generation for logically sharded data stores
Shekhawat et al. Privacy-preserving techniques for big data analysis in cloud
CN101692265A (zh) 一种文件加密保护方法
EP1038369A2 (en) System and method of sending and receiving secure data using anonymous keys
Dhumal et al. Confidentiality-conserving multi-keyword ranked search above encrypted cloud data
CN112528309A (zh) 一种数据存储加密和解密的方法及其装置
Sun et al. Research of data security model in cloud computing platform for SMEs
Moghadam et al. A secure order-preserving indexing scheme for outsourced data
CN113239405A (zh) 基于区块链的电子档案信息管理系统
Belose et al. Data security using Armstrong numbers
CN1588366A (zh) 密文数据库检索技术
CN112560065A (zh) 一种数据库密文直接索引的方法
JP4338185B2 (ja) ファイルの暗号化・復号方法
CN115589289B (zh) 一种服务器密码机业务处理方法及系统
KR100973785B1 (ko) Aes 카운터 모드 기반 암호화 장치 및 그 방법
Passricha et al. A secure deduplication scheme for encrypted data
CN109840423B (zh) 一种数据关系的记录方法、装置及设备
Kodada et al. FSACE: finite state automata-based client-side encryption for secure data deduplication in cloud computing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication