CN1588365A - 密文全文检索技术 - Google Patents
密文全文检索技术 Download PDFInfo
- Publication number
- CN1588365A CN1588365A CN 200410070113 CN200410070113A CN1588365A CN 1588365 A CN1588365 A CN 1588365A CN 200410070113 CN200410070113 CN 200410070113 CN 200410070113 A CN200410070113 A CN 200410070113A CN 1588365 A CN1588365 A CN 1588365A
- Authority
- CN
- China
- Prior art keywords
- ciphertext
- key
- data
- index
- technology
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
此项发明在PKI和全文检索技术的基础上,实现了在不解密的条件下的数据检索。此项发明是对全文检索技术的改造,在这里几乎保留了全文检索的大部分技术,只对索引文件的索引词进行了加密处理,便于系统实现。密文检索系统的加密、解密发生在客户端,有效的降低了数据安全对服务器和网络环境安全的依赖。
Description
技术领域
本发明属于计算机软件相关领域,是对全文检索技术的改进,能够实现在不解密的情况下的信息检索。
背景技术
电子文档的存储方式为数据的检索和利用提供了极大的方便,因此,越来越多的业务数据成为电子文档,其中也包括一些敏感数据。为了保护敏感数据,有时需要进行加密存储。加密技术在提高数据安全性的同时,也为数据的检索设置了障碍。源本可以很方便检索到数据,经过加密处理后成为不可检索的内容。如果密文数据的数量非常庞大,而又缺乏有效的检索手段,将会严重影响密文数据的利用。
只所以能够从海量数据中较快取得相关信息,全文检索依赖事先建立的基于索引项的索引库。其原理是索引程序扫描数据中的索引项,在索引文件中对每一个索引项建立一个索引,指明该索引项在数据中出现的次数和位置;当用户查询时,检索程序将用户查询条件分解为索引项,在事先建立的索引库中进行查找(而不是从原始数据中查找),并将查找的结果反馈给用户。
发明内容
密文全文检索的索引文件是加密之前建立的,索引文件描述了词条在原文中的位置,实际的检索是在索引文件而不是在原文中查找检索词,因此,对原文进行加密不会影响检索。对于索引文件,我们只对其中的索引词单独加密,而不是对整个索引文件进行加密,因此,密文索引文件中的索引词与检索时单独加密的检索词,如果明文、密钥相同则密文相同。因此,可以通过比对检索词密文和索引文件中的索引词密文,找到检索词在原文中的位置。
加密、解密运算以二进制方式处理数据,为方便处理,可以采用Base64进行编码,将二进制数据转换成字符型数据。
具体实施方式
密文检索技术包括加密、解密、检索及密钥共享几个部分。
1、加密
加密前首先要生成对称密钥(以下简称密钥),为了防止来自网络内部,尤其是系统管理员的安全威胁,密钥应该在客户端生成。
按照全文索引的技术要求,扫描原文、分词并建立索引文件,用密钥对索引文件中的索引词进行加密及Base64编码处理,生成密文索引文件。
用密钥对原文进行加密处理,生成密文。
用自己的公开密钥对密钥进行加密处理生成密钥密文。
将密文索引文件、密文、密钥密文保存到密文库中,完成加密操作,见图1。
2、检索及解密
检索密文前首先要从密文库中下载密钥密文,然后用自己的私有密钥解密,得到密钥。
将查询提问分解成检索词,用密钥将检索词加密,经过Base64编码,得到检索词密文,将检索词密文送到密文库,从密文索引文件中查找密文检索词,进行全文检索。
下载符合检索条件到的密文,用密钥解密,得到原文,见图2。
3、密钥共享
密钥共享包括两个方面的内容:“不同数据间的密钥共享”和“不同用户间的密钥共享”。
不同数据间的密钥共享指的是不同数据采用相同的密钥加密、解密,因此,这些数据应该具有相同的秘密等级或秘密分组。将秘密数据分组,同一组数据使用相同的密钥,可以大大减少密钥数量,简化密钥管理和权限分配。密文全文检索系统可以按照这些秘密分组进行设计,在同一组中检索数据时,因为密钥相同,相同的检索词具有相同的密文,因此,只需一次从密文库下载密钥密文,就可以在这个分组内查找匹配数据。不同的秘密分组由于密钥不同,需要下载不同的密钥密文,分别进行检索,最后将各个秘密分组的检索结果合并为一个,呈现给用户。
不同用户间的密钥共享指的是不同的用户对同一数据可以使用相同的密钥加密、解密。因为密钥相同,因此密文在密文库可以只保留一份,这不仅大大减少了密文库的存储空间耗费,而且也为秘密数据的授权带来极大方便,可以在不对原文解密的情况下,为其它用户建立密钥密文。
图3描述了这样一个秘密授权的流程,秘密授权必须由具有秘密读权限的用户进行。首先,下载自己的密钥密文,解密得到密钥;然后,从证书库下载对方公开密钥;用对方公开密钥对密钥加密,得到对方密钥密文;最后,将密钥密文保存到密文库,完成秘密授权过程。此后,对方就可以下载和使用新产生的密钥密文进行密文检索及数据解密了。
附图说明
图1:数据加密流程。
图2:密文检索流程。
图3:秘密授权流程。
Claims (1)
1.为适合密文检索对全文检索技术进行的改进,其特征是在原文加密前建立索引文件,然后将原文及索引文件中的索引词加密,检索时通过比较检索词密文可以得到检索词在原文中的位置,检索过程不需要解密。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200410070113 CN1588365A (zh) | 2004-08-02 | 2004-08-02 | 密文全文检索技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200410070113 CN1588365A (zh) | 2004-08-02 | 2004-08-02 | 密文全文检索技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1588365A true CN1588365A (zh) | 2005-03-02 |
Family
ID=34604410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200410070113 Pending CN1588365A (zh) | 2004-08-02 | 2004-08-02 | 密文全文检索技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1588365A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100424704C (zh) * | 2006-09-30 | 2008-10-08 | 华中科技大学 | 基于密文的全文检索系统 |
CN101931947A (zh) * | 2010-07-28 | 2010-12-29 | 南京航空航天大学 | 基于可搜索密文的wsn数据安全处理方法 |
CN102024054A (zh) * | 2010-12-10 | 2011-04-20 | 中国科学院软件研究所 | 一种面向密文云存储的文档检索方法与系统 |
CN102176709A (zh) * | 2010-12-13 | 2011-09-07 | 北京交通大学 | 一种带隐私保护的数据共享与发布的方法和装置 |
CN102184234A (zh) * | 2011-05-13 | 2011-09-14 | 百度在线网络技术(北京)有限公司 | 用于查询、增加、更新或删除信息处理规则的方法和设备 |
CN102387343A (zh) * | 2010-08-25 | 2012-03-21 | 索尼公司 | 终端设备,服务器,数据处理系统,数据处理方法和程序 |
CN102708216A (zh) * | 2012-06-28 | 2012-10-03 | 北京邮电大学 | 一种面向密文搜索的分词组织方法和聚类方法 |
CN103049466A (zh) * | 2012-05-14 | 2013-04-17 | 深圳市朗科科技股份有限公司 | 一种基于分布式密文存储的全文检索方法及系统 |
CN101593196B (zh) * | 2008-05-30 | 2013-09-25 | 日电(中国)有限公司 | 用于快速密文检索的方法、装置和系统 |
CN103595730A (zh) * | 2013-11-28 | 2014-02-19 | 中国科学院信息工程研究所 | 一种密文云存储方法和系统 |
CN103914541A (zh) * | 2014-04-03 | 2014-07-09 | 小米科技有限责任公司 | 信息搜索的方法及装置 |
CN103944711A (zh) * | 2014-02-17 | 2014-07-23 | 国家超级计算深圳中心 | 一种云存储密文检索方法及其系统 |
CN104967516A (zh) * | 2015-07-24 | 2015-10-07 | 四川理工学院 | 多用户加密数据可比较加密方法及加密数据比较方法 |
JP2016200938A (ja) * | 2015-04-09 | 2016-12-01 | 株式会社日立ソリューションズ | 検索システム |
US9633219B2 (en) | 2015-08-26 | 2017-04-25 | International Business Machines Corporation | Providing secure indexes for searching encrypted data |
CN106961427A (zh) * | 2017-03-10 | 2017-07-18 | 北京科技大学 | 一种基于5g通信标准的密文数据搜索方法 |
CN109255248A (zh) * | 2018-08-28 | 2019-01-22 | 福建南威软件有限公司 | 一种基于加解密算法的全文检索方法 |
CN109740362A (zh) * | 2019-01-03 | 2019-05-10 | 中国科学院软件研究所 | 一种基于熵编码的密文索引生成与检索方法及系统 |
-
2004
- 2004-08-02 CN CN 200410070113 patent/CN1588365A/zh active Pending
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100424704C (zh) * | 2006-09-30 | 2008-10-08 | 华中科技大学 | 基于密文的全文检索系统 |
CN101593196B (zh) * | 2008-05-30 | 2013-09-25 | 日电(中国)有限公司 | 用于快速密文检索的方法、装置和系统 |
CN101931947A (zh) * | 2010-07-28 | 2010-12-29 | 南京航空航天大学 | 基于可搜索密文的wsn数据安全处理方法 |
CN102387343B (zh) * | 2010-08-25 | 2016-08-03 | 索尼公司 | 终端设备,服务器,数据处理系统,数据处理方法 |
CN102387343A (zh) * | 2010-08-25 | 2012-03-21 | 索尼公司 | 终端设备,服务器,数据处理系统,数据处理方法和程序 |
CN102024054A (zh) * | 2010-12-10 | 2011-04-20 | 中国科学院软件研究所 | 一种面向密文云存储的文档检索方法与系统 |
CN102176709B (zh) * | 2010-12-13 | 2013-11-13 | 北京交通大学 | 一种带隐私保护的数据共享与发布的方法和装置 |
CN102176709A (zh) * | 2010-12-13 | 2011-09-07 | 北京交通大学 | 一种带隐私保护的数据共享与发布的方法和装置 |
CN102184234A (zh) * | 2011-05-13 | 2011-09-14 | 百度在线网络技术(北京)有限公司 | 用于查询、增加、更新或删除信息处理规则的方法和设备 |
CN103049466A (zh) * | 2012-05-14 | 2013-04-17 | 深圳市朗科科技股份有限公司 | 一种基于分布式密文存储的全文检索方法及系统 |
CN103049466B (zh) * | 2012-05-14 | 2016-04-27 | 深圳市朗科科技股份有限公司 | 一种基于分布式密文存储的全文检索方法及系统 |
CN102708216A (zh) * | 2012-06-28 | 2012-10-03 | 北京邮电大学 | 一种面向密文搜索的分词组织方法和聚类方法 |
CN103595730A (zh) * | 2013-11-28 | 2014-02-19 | 中国科学院信息工程研究所 | 一种密文云存储方法和系统 |
CN103595730B (zh) * | 2013-11-28 | 2016-06-08 | 中国科学院信息工程研究所 | 一种密文云存储方法和系统 |
CN103944711A (zh) * | 2014-02-17 | 2014-07-23 | 国家超级计算深圳中心 | 一种云存储密文检索方法及其系统 |
CN103944711B (zh) * | 2014-02-17 | 2017-05-24 | 国家超级计算深圳中心 | 一种云存储密文检索方法及其系统 |
CN103914541A (zh) * | 2014-04-03 | 2014-07-09 | 小米科技有限责任公司 | 信息搜索的方法及装置 |
JP2016200938A (ja) * | 2015-04-09 | 2016-12-01 | 株式会社日立ソリューションズ | 検索システム |
CN104967516A (zh) * | 2015-07-24 | 2015-10-07 | 四川理工学院 | 多用户加密数据可比较加密方法及加密数据比较方法 |
CN104967516B (zh) * | 2015-07-24 | 2018-04-24 | 四川理工学院 | 多用户加密数据可比较加密方法及加密数据比较方法 |
US9633219B2 (en) | 2015-08-26 | 2017-04-25 | International Business Machines Corporation | Providing secure indexes for searching encrypted data |
US10037435B2 (en) | 2015-08-26 | 2018-07-31 | International Business Machines Corporation | Providing secure indexes for searching encrypted data |
CN106961427A (zh) * | 2017-03-10 | 2017-07-18 | 北京科技大学 | 一种基于5g通信标准的密文数据搜索方法 |
CN106961427B (zh) * | 2017-03-10 | 2019-08-06 | 北京科技大学 | 一种基于5g通信标准的密文数据搜索方法 |
CN109255248A (zh) * | 2018-08-28 | 2019-01-22 | 福建南威软件有限公司 | 一种基于加解密算法的全文检索方法 |
CN109740362A (zh) * | 2019-01-03 | 2019-05-10 | 中国科学院软件研究所 | 一种基于熵编码的密文索引生成与检索方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bhardwaj et al. | Security algorithms for cloud computing | |
US7587608B2 (en) | Method and apparatus for storing data on the application layer in mobile devices | |
KR101371608B1 (ko) | Dbms 및 데이터베이스에서 암호화 방법 | |
CN1588365A (zh) | 密文全文检索技术 | |
JP6884642B2 (ja) | データ再暗号化を介して機密データを保護するためのコンピュータ実施システムおよび方法 | |
CN112380557B (zh) | 一种关系型数据库加密方法及该加密数据库查询方法 | |
US20030056118A1 (en) | Method for encryption in an un-trusted environment | |
CA3065767C (en) | Cryptographic key generation for logically sharded data stores | |
Shekhawat et al. | Privacy-preserving techniques for big data analysis in cloud | |
CN101692265A (zh) | 一种文件加密保护方法 | |
EP1038369A2 (en) | System and method of sending and receiving secure data using anonymous keys | |
Dhumal et al. | Confidentiality-conserving multi-keyword ranked search above encrypted cloud data | |
CN112528309A (zh) | 一种数据存储加密和解密的方法及其装置 | |
Sun et al. | Research of data security model in cloud computing platform for SMEs | |
Moghadam et al. | A secure order-preserving indexing scheme for outsourced data | |
CN113239405A (zh) | 基于区块链的电子档案信息管理系统 | |
Belose et al. | Data security using Armstrong numbers | |
CN1588366A (zh) | 密文数据库检索技术 | |
CN112560065A (zh) | 一种数据库密文直接索引的方法 | |
JP4338185B2 (ja) | ファイルの暗号化・復号方法 | |
CN115589289B (zh) | 一种服务器密码机业务处理方法及系统 | |
KR100973785B1 (ko) | Aes 카운터 모드 기반 암호화 장치 및 그 방법 | |
Passricha et al. | A secure deduplication scheme for encrypted data | |
CN109840423B (zh) | 一种数据关系的记录方法、装置及设备 | |
Kodada et al. | FSACE: finite state automata-based client-side encryption for secure data deduplication in cloud computing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |