CN110138561B

CN110138561B - 基于cp-abe自动校正的高效密文检索方法、云计算服务系统

Info

Publication number: CN110138561B
Application number: CN201910224335.4A
Authority: CN
Inventors: 樊凯; 尹洁; 金雄海; 王昊洋; 李晖
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2019-03-22
Filing date: 2019-03-22
Publication date: 2021-09-17
Anticipated expiration: 2039-03-22
Also published as: CN110138561A

Abstract

本发明属于云计算私保护技术领域，公开了一种基于CP‑ABE自动校正的高效密文检索方法、云计算服务系统；结合R树和布隆过滤器作为索引结构，将一个加密的布隆过滤器和对应的密文文件ID集存储在R树的叶子节点中；云服务器根据搜索陷门对R树进行矩阵定位，然后对叶子节点中加密的布隆过滤器匹配；根据布隆过滤器的内积结果对文件进行排序；陷门生成过程引入了随机数，即使相同的关键字也会生成不同的陷门；通过使用访问结构和拥有者秘密属性共同加密。本发明使用CP‑ABE加密体量较小的对称密钥，实现了细粒度的访问控制；引入多代理服务器实现了去中心化；防止代理服务器之间的共谋。

Description

基于CP-ABE自动校正的高效密文检索方法、云计算服务系统

技术领域

本发明属于云计算隐私保护技术领域，尤其涉及一种基于CP-ABE自动校正的高效密文检索方法、云计算服务系统。

背景技术

随着互联网与的快速发展和逐渐走向成熟，学者们提出了一种与众不同的基于网络的计算模式，即“云计算”。为了获得更廉价的存储资源与计算资源，许多企业和用户都选择购买云计算服务而不是服务器设备，将数据信息上传至云服务器。但是由于云服务是不完全可信的，带了诸如云计算的隐私性、兼容性及稳定性等问题。为了保证信息不被泄露，用户通常选择将数据加密存储在云端。密态数据给用户在操纵数据上带了困难。传统的明文搜索不再有效，一种密态数据下的检索技术诞生了，即可搜索加密技术。

目前，可搜索加密技术的概念是由Song等人^[4]提出的，通过嵌入“单词”的位置信息来支持受控检索，每个单词的查询都需要扫描整个密文文件，导致搜索成本太高。Li等人^[11]首次提出了基于编辑距离和关键词字典的模糊搜索的技术，但是只支持单关键词，而且索引空间较大。Wang等人^[12]提出了一种安全的相似性搜索技术，以编辑距离作为相似性度量，将给定文档的关键字扩展和存储为有效的相似性关键字集，但是存储开销较高。Ning等人^[9]为每个文件建立一个索引，实现了密态文件的精确的多关键字搜索，但该方案需要遍历所有的文件索引，搜索时间较长，效率不高。Sun等人^[10]提出了一种保护多关键字文本的隐私的搜索(MTS)方案，该方案通过余弦相似度量的向量空间模型和树型索引，以获得更高的搜索结果准确性和搜索效率，但是文件更新开销太大。因此，基于对称加密的可搜索加密方案(Symmetric Searchable Encryption,SSE)具有丰富的表达能力，加解密效率高。但是这些方案更适用与一对一场景，彼此通信需要安全信道，导致的灵活性和可扩展性较低，应用场景受到局限。

为了扩展对称可搜索加密方案的用户场景及访问控制能力，我们引入了基于密文策略的属性加密(CP-ABE)。ABE由基于模糊身份的加密(Fuzzy-IBE)发展而来。Sahai和Waters^[23]首次提出了基于属性加密的概念(Attribute Based Encryption,ABE)。将身份标识符视为一组描述属性，当解密者的身份标识与加密者的身份足够接近时，他被允许用自己的私钥解密密文。这是属性基加密的最初原型。Bethencourt,Sahai和Waters等人^[24]提出了一种实现对密文数据进行复杂访问控制的系统，即基于密文策略属性的加密(CP-ABE,Ciphertext-Policy Attribute-Based Encryption)。属性是用户的凭据，而加密方决定了谁可以解密访问策略。即使存储服务器是不可信的，加密数据也可以保密。Lewko和Waters等人^[25]提出了基于多机构的属性加密系统。只需要初始化全局公共参数，该系统不需要中央机构，任何组织都可以成为一方机构，成功避免了单点效应等问题，也克服了抗共谋攻击的障碍。Sun等人^[28]提出了一种基于属性的关键字搜索方案(ABKS-UR)，支持可扩展的细粒度搜索权限，搜索权限制定在索引上。

解决上述技术问题的难度：

现有的对称可搜索加密方案并不考虑关键字的权重问题，忽略了关键字重要程度对搜索结果的影响；其次现有的模糊搜索方案要么依赖于相似性搜索，或依赖于建立一个庞大的索引，该索引需要包含所有可能输入错误的关键词。但是搜索结果却不尽如人意。加之该机制的使用场景受限较强，系统的访问控制能力较差，并不支持复杂的多用户场景。虽然基于属性可搜索加密机制能实现多对一的用户场景，但是文件和索引的加解密开销较大，存在较多的双线性运算，使得搜索效率不高。如何兼顾密文检索方案的高效性、保证搜索的安全性和文件的细粒度访问控制、应用场景可扩展性以及如何保证密文搜索结果的准确性成为待解决问题。

解决上述技术问题的意义：

一个高效、安全和为具有丰富表达能力的密文搜索，可以尽可能的满足用户的明文搜索体验，同时保证数据的安全性和隐私性。针对属性加密开销大和对称可搜索加密应用场景受限的技术难题，本发明使用CP-ABE+SSE的方式，拓展SSE的应用场景，同时将CP-ABE的计算开销降低至系统可接受范围。为了充分发挥CP-ABE的细粒度访问控制的优势，同时降低CP-ABE的开销，本发明使用CP-ABE加密体量较小的对称密钥，以降低用户端的计算开销。而多机构CP-ABE的引入使得系统避免了单点效应问题，即避免了系统因某个点的故障而引发整个系统瘫痪的问题。而模糊搜索即使准确率再高，也无法达到精确搜索的准确率。

针对模糊搜索的不准确问题，本发明使用准确率更高的拼写检查系统对查询关键字进行校正，力求从根本上校正拼写错误的情形，避免了索引关键字集的扩展，节省了存储开销。为了更好获得更好的用户体验，本发明可以区分不同关键字的重要程度，以更高的相关分数对应获得更准确地匹配结果。针对传统搜索系统效率不高的问题，本发明结合R树和布隆过滤器作为索引结构，将一个加密的布隆过滤器和对应的密文文件ID集存储在R树的叶子节点中。云服务器在搜索匹配时不需要遍历所有的文件，即可获得搜索结果，大大提高了检索效率。针对已知密文模型和已知背景模型两种不同的安全需求，本发明给出了两个种不同的方法，以供用户选择。

发明内容

针对现有技术存在的问题，本发明提供了一种基于CP-ABE自动校正的高效密文检索方法、云计算服务系统。

本发明是这样实现的，一种基于CP-ABE自动校正的高效密文检索方法，所述基于CP-ABE自动校正的高效密文检索方法结合R树和布隆过滤器作为索引结构，将一个加密的布隆过滤器和对应的密文文件ID集存储在R树的叶子节点中；云服务器根据搜索陷门对R树进行矩阵定位，然后对叶子节点中加密的布隆过滤器匹配；根据布隆过滤器的内积结果对文件进行排序；陷门生成过程引入了随机数，即使相同的关键字也会生成不同的陷门；通过使用访问结构和拥有者秘密属性共同加密。

进一步，所述基于CP-ABE自动校正的高效密文检索方法具体包括：

第一步，系统初始化阶段，可信权威中心CA通过群参数分别生成系统的主密钥和系统公钥；每个代理服务器和用户需要向CA注册；

第二步，密钥产生阶段；分为可搜索加密的密钥产生和的属性的密钥产生；可搜索加密的密钥产生阶段由权威中心CA生成矩阵密钥、布隆过滤器输入密钥和密文加密密钥；属性的密钥生成阶段CA为每个用户DU和拥有者DO生成对应的公私钥对和相应的属性集，作为解密密钥；

第三步，索引建立阶段，数据拥有者首先从数据文件中提取出关键字集，并使用对称密钥对数据文件集进行加密，生成文件密文；然后以每个文件的关键字集和布隆过滤器密钥作为输入，生成每个文件对应的布隆过滤器；再以矩阵密钥和布隆过滤器作为输入，输出对应的索引；

第四步，密钥加密阶段，数据拥有者选定秘密属性和访问策略，使用CP-ABE的方式加密对称密钥，并将属性加密结果、文件密文和索引一起上传至服务器；

第五步，陷门生成阶段，数据用户选取要搜索的关键字，输入布隆过滤器密钥和矩阵密钥，生成搜索关键字的陷门；将陷门上传至云服务器进行搜索；

第六步，搜索匹配阶段，收到用户的陷门后，云服务器执行操作；将陷门与索引集进行匹配，若匹配成功，则把匹配文件基于综合匹配度排序，输出前L个包含搜索关键字集的文档地址；否则，未搜索到匹配文件；

第七步，用户解密阶段，用户从云服务器下载密文文件和相应的属性密文；如果用户ID在授权用户的列表且用户属性满足拥有者的访问策略，则该用户拥有解密对称密钥的权限；用户首先通过自身属性解密访问策略，再通过拥有者秘密属性解密出对称密钥，并使用对称密钥解密文件。

进一步，所述第一步的系统初始化阶段具体包括：

(1)群参数；输入安全参数λ，CA首先选取一个阶为素数p生成元为g的群G₁；设e:G₁×G₁→G₂表示双线性映射；

(2)注册，假设系统中的注册代理服务器的个数为N，CA中心为每个注册用户和注册代理服务器分发唯一的身份标识符U和P_i；

(3)生成数据拥有者公私钥，随机选取参数a，α_O∈Z_p，数据拥有者DO计算公钥为

(4)生成代理服务器公私钥，选取随机参数b,c_i∈Z_p，将c_i/b秘密发送给每个代理服务器P_i，每个代理服务器P_i选取私钥为

计算公钥为

(5)系统主密钥、公钥分别为：

进一步，所述第二步的密钥产生阶段具体包括：

(1)属性密钥生成，对于每个用户U，选取一个随机数u并生成他的公钥PK_U＝g^u，并生成对应属性集记为ATT_U；

(2)对于每个属性

计算代理服务器属性公钥为

(3)每个代理服务器P_i首先检验用户属性集ATT_U与

中相同的属性是否有效，如果有效则记为att_PU，表示用户U在代理服务器P_i中的有效属性集；计算用户的第一部分私钥为

(4)对于

计算密钥

(5)数据拥有者首先验证搜索用户的身份标识符，如果为有效用户，如果为有效用户，则拥有者选取TP∈Z_p，计算密钥

并发送给用户，搜索用户的解密密钥为SK_U＝(SK₁,SK₂)；

(6)已知密文模型下，可搜索加密系统的密钥生成，数据拥有者生成矩阵密钥SK＝{S,M₁,M₂}，其中S是一个(m+2)维的向量，M₁,M₂是两个(m+2)×(m+2)维的矩阵；然后生成文件加密密钥k；此外生成密钥sk和r个随机数k₁,...,k_r作为布隆过滤器的Hash函数密钥输入，记为K＝(sk,k₁,...,k_r)；

(7)已知背景模型下，可搜索加密系统的密钥生成算法更改为：数据拥有者生成SK＝{S,M₁,M₂}，其中S是一个(m+K+2)维的向量，M₁,M₂是两个(m+K+2)×(m+K+2)维的矩阵；然后生成文件加密密钥k，生成密钥sk和r个随机数k₁,...,k_r作为布隆过滤器的Hash函数密钥输入，记为K＝(sk,k₁,...,k_r)。

进一步，所述第三步的索引建立阶段具体包括：

(1)加密明文文件，给定明文文件集F，数据拥有者首先使用对称密钥k对文件集F进行加密，得到密文C_F,；

(2)提取关键字集，数据拥有者为每个文件F_i基于TF-IDF法则提取关键字集W＝{w₁,...,w_m},；

(3)生成布隆过滤器，输入关键字集W和Hash函数密钥K，拥有者生成了每个文件对应的布隆过滤器BF_i，BF_i[j]表示布隆过滤器的第j位，插入值为相关关键字w_j在文件F_i中的词频TF值；

(4)已知密文模型下，矩阵密钥加密布隆过滤器的过程，将BF_i扩展为(BF_i,ξ_i,1)，其中ξ_i为随机数，将BF_i分割成两个部:BF_i'和BF_i”；根据向量S，如果S[j]＝0，则BF_i'[j]和BF_i”[j]保持不变，否则，设置BF_i'[j]+BF_i”[j]＝BF_i[j]，其中BF_i'[j]和BF_i”[j]为随机数；

(5)已知背景模型下，将BF_i扩展为(m+β+1)维向量，其中β∈[1,K]，扩展的β维均被设置为随机数ξ^(β)，将BF_i分割成两个部:BF_i'和BF_i”；根据向量S，如果S[j]＝0，则BF_i'[j]和BF_i”[j]保持不变，否则，设置BF_i'[j]+BF_i”[j]＝BF_i[j]，其中BF_i'[j]和BF_i”[j]为随机数。；

(6)将加密后每个文件对应的布隆过滤器插入到R树构建索引树，整个索引表示为：于是，整个索引表示为：

进一步，所述第四步的拥有者使用对称密钥加密文件，并使用CP-ABE加密该对称密钥具体包括：

(1)CP-ABE加密，数据拥有者随机选取r₁,r₂∈Z_p并分配给访问结构的根节点和自己的秘密属性TP；

(2)选定访问策略为Λ＝(ρ,M)，其中M是一个l×n的矩阵，l表示访问结构的所有属性的数量，ρ是将矩阵每一行映射到相关属性的单向函数；与访问结构Λ相关的代理服务器集合记为P_Λ，N_Λ集合P_Λ中代理服务器的个数；设

表示向量M_j中的属性集，其中

M_j表示矩阵M的行向量，随机选取向量v＝(r₁,s₂,...,s_n)，r₁表示共享秘密值；

(3)数据拥有者首先使用TP加密得C_TP；

(4)对密钥k使用代理服务器PS的公钥和数据拥有者DO的公钥进行加密得C_k，最后计算C_m为：

(5)数据拥有者将加密文件C_F、加密索引I和加密密钥C_m一起上传至云服务器。

进一步，所述第五步的用户生成陷门阶段具体包括：

(1)对搜索关键字集Q使用拼写校正系统进行纠错，输出纠正后的查询关键字；

(2)对纠正后的关键字集Q中的每个关键字q_i基于语法解析器进行权重计算，记录为KW_i；

(3)计算每个查询关键字的逆向词频IDF_i值，计算IDF_i×KW_i的值，将该值插入至关键字q_i映射到布隆过滤器的对应位置上；将关键词Q转换成为布隆过滤器BF_Q，BF_Q[j]表示相关关键字q_j的IDF_i×KW_i值；

(4)在已知密文模型下，矩阵密钥加密布隆过滤器的过程，拥有者将BF_Q进行扩展为(εBF_Q,ε,t)，其中ε，t为随机数且ε≠0；随后，将BF_Q分割为两个向量BF_Q',BF_Q”：如果S[j]＝0，则BF_Q'[j]和BF_Q”[j]保持不变，否则，设置BF_Q'[j]+BF_Q”[j]＝BF_Q[j]，其中BF_Q'[j]和BF_Q”[j]为随机数；最后，陷门T表示为

(5)在已知背景模型下，为了进一步混淆，矩阵密钥加密布隆过滤器的过程更改如下：将BF_i扩展为(m+β+1)维向量，其中β∈[1,K]；从K维假性关键字中选取J维，将BF_Q扩展为随机关键字并将其相关位置为1，将布隆过滤器BF_Q扩展为(εBF_Q,ε,t)，其中ε，t为随机数且ε≠0；随后，将BF_Q分割为两个向量BF_Q',BF_Q”：如果S[j]＝0，则BF_Q'[j]和BF_Q”[j]保持不变，否则，设置BF_Q'[j]+BF_Q”[j]＝BF_Q[j]，其中BF_Q'[j]和BF_Q”[j]为随机数；最后，陷门T为

进一步，所述第六步的云服务器搜索匹配阶段具体包括：

(1)云服务器收到用户发送过的陷门T后，首先判断该用户是否为授权用户；

(2)云服务器根据收到的陷门T对R树进行矩阵查询和定位，搜索匹配到最小边界矩阵；

(3)已知密文模型下，布隆过滤器的内积计算过程，对于最小边界矩阵中的所有叶子节点中所包含的布隆过滤器，云服务器计算它们与陷门T对应的加密布隆过滤器的内积结果；计算完所有的内积结果并排序之后，CS返回前L个文件标识符列表给用户；

(4)已知背景模型下，布隆过滤器的内积计算过程更改如下：云服务器收到用户发送过的陷门T后，首先判断该用户是否为授权用户；然后根据收到的陷门T对R树进行矩阵查询和定位，搜索匹配到最小边界矩阵；对于最小边界矩阵中的所有叶子节点中所包含的布隆过滤器，云服务器计算它们与陷门T对应的布隆过滤器的内积结果；计算完所有的相似分数之后，CS返回前L个文件标识符列表给用户；

所述第七步的用户解密阶段具体包括：

(1)用户从云服务器下载密文文件和相应对称密钥的属性密文；

(2)访问策略解密，当用户需要搜索密文文件时，他通过代理服务器发送安全索引，代理服务器将匹配的文件标识符发送给用户；用户首先需要解密加密密钥C_m以获得对称密钥k，然后通过k解密文件；根据LSSS访问策略，如果用户属性集满足访问策略，恢复共享秘密r₁；设P_Λ表示满足访问结构的所有代理服务器的属性集，

表示代理服务器P_i的属性集，根据访问结构解密；

∑_j∈Sω_jλ_j＝∑_j∈Sω_jM_jv^T＝r₁；

(3)秘密属性解密，如果用户是授权用户，则可从拥有者手中获得秘密属性TP，并根据TP进行解密；用户解密如下：

(4)用户计算对称密钥为：

(5)用户使用对称密钥k解密所获得的密文文件，得到明文数据。

本发明的另一目的在于提供一种基于所述基于CP-ABE自动校正的高效密文检索方法的基于CP-ABE自动校正的高效密文检索系统，所述基于CP-ABE自动校正的高效密文检索系统包括：包括数据所有者DO、云服务器CS、授权数据用户DU、可信权威中心CA和代理服务器PS；

数据拥有者DO为可信实体和数据拥有者DO制定文件的访问策略，对数据进行关键字提取，并根据访问策略将个人数据和关键字加密上传到云服务器；

授权用户DU为可信实体，系统为每个授权数据用户均分发一组相应的属性；当用户属性满足相关的密文访问策略时，才能查询和解密云服务器上的加密数据；如果授权用户希望通过关键词集Q来搜索所需文档，需要先通过数据所有者共享的陷门密钥K生成搜索陷门，并把陷门发送到服务器；服务器作为半可信的实体，接收到请求后，开始与索引进行匹配并返回相应文档的地址集合给用户；

云服务器CS，包含索引服务器和密文存储服务器；在系统中被假定为是半可信的；云服务器收到代理服务器PS传来的陷门后，搜索匹配相应的密文文件，并把相应的文件地址返回到PS中；

可信权威中心CA，是为包括数据所有者DO、云服务器CS、授权数据用户DU管理和更新密钥的权威中心；在系统中被假设为是完全可信的，用于分发系统密钥、代理服务器属性和用户注册；

代理服务器PS，用于帮助DO将他们的安全索引和密文数据发送到CS，并帮助DU生成搜索陷门，并在云服务器中完成搜索；代理服务器还负责系统中用户属性的授权、撤销和重新授予。

本发明的另一目的在于提供一种应用所述基于CP-ABE自动校正的高效密文检索方法的云计算服务系统。

综上所述，本发明的优点及积极效果为：本发明使用CP-ABE加密体量较小的对称密钥，实现了细粒度的访问控制。引入多代理服务器实现了去中心化。为了防止代理服务器之间的共谋，本发明采取了数据拥有者的秘密属性与访问策略共同加密的方法。通过对查询关键字进行拼写校正而不是模糊词集的扩展，该方案可以容忍拼写错误并降低索引存储空间的复杂性。通过语法分析和计算查询关键字的关键字权重，本发明可以区分不同关键字的重要程度。本发明结合R树和布隆过滤器作为索引结构，将一个加密的布隆过滤器和对应的密文文件ID集存储在R树的叶子节点中。云服务器根据搜索陷门对R树进行矩阵定位，然后对叶子节点中加密的布隆过滤器匹配。根据布隆过滤器的内积结果对文件进行排序。陷门生成过程引入了随机数，即使相同的关键字也会生成不同的陷门，避免了服务器的频率猜测攻击。通过使用访问结构和拥有者秘密属性共同加密，本发明能够抵抗代理服务器和用户的共谋攻击。

本发明基于多机构的CP-ABE的场景，可以应用于一对多场景和避免了单点失效问题，且抵抗代理服务器和用户的共谋攻击。对查询关键字进行拼写校正容忍拼写错误，从根源上解决关键字的错误性，力求达到准确搜索。通过语法解析器计算关键字权重和排序，更重要的搜索词拥有更高的优先级，因此可以获得一个更准确的返回结果排序。使用R树和布隆过滤器结合的索引提高搜索效率，布隆过滤器存于R树的叶子节点中。计算IDF_i×KW_i的值，将该值插入至布隆过滤器中该关键字的对应位置上。根据布隆过滤器内积结果的排序，可以获得一个更准确的返回结果排序。通过使用访问结构和拥有者秘密属性共同加密，本发明能够抵抗代理服务器和用户的共谋攻击。

本发明分别实现了已知密文模型和已知背景模型这两种不同安全需求下的基于CP-ABE自动校正的高效密文检索技术，用户可以根据安全需求各取所需。已知密文模型下云服务器只能访问到密文文件、安全索引和所提交的陷门。云服务器还可以访问和记录每次的搜索结果。已知背景模型下云服务器可以了解额外的背景信息。其中，背景指的是可以从比较数据集学习到的信息。

附图说明

图1是本发明实施例提供的基于CP-ABE自动校正的高效密文检索方法流程图。

图2是本发明实施例提供的基于CP-ABE自动校正的高效密文检索方法实现流程图。

图3是本发明实施例提供的拥有者构建索引的子流程图。

图4是本发明实施例提供的用户生成陷门的子流程图。

图5是本发明实施例提供的云服务搜索过程的子流程图。

图6是本发明实施例提供的拥有者加密对称密钥的子流程图。

图7是本发明实施例提供的数据用户解密属性密文的子流程图。

图8是本发明中索引构建时间随文件数目变化的仿真图；

图9是本发明中陷门生成算法各子步骤及总时间开销的仿真图；

图10是本发明中系统搜索时间随文件数目变化的仿真图；

图11是本发明中属性系统初始化和密钥生成时间随系统属性个数变化的仿真图；

图12是本发明中属性加密和解密时间随系统属性个数变化的仿真图；

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明为了容忍用户的误拼，支持多场景和细粒度访问控制，从根源上先对关键字进行校正，提供了一种支持多关键词和排序的更高效的密文检索方法。

下面结合附图对本发明的应用原理作详细的描述。

如图1所示，本发明实施例提供的基于CP-ABE自动校正的高效密文检索方法包括以下步骤：

S101：系统初始化阶段，可信权威中心CA通过群参数分别生成系统的主密钥和系统公钥；该阶段中，每个代理服务器和用户需要向CA注册；

S102：密钥产生阶段；该阶段分为可搜索加密的密钥产生和的属性的密钥产生。可搜索加密的密钥产生阶段由权威中心CA生成矩阵密钥、布隆过滤器输入密钥和密文加密密钥；属性的密钥生成阶段CA为每个用户DU和拥有者DO生成对应的公私钥对和相应的属性集，作为解密密钥；

S103：索引建立阶段，数据拥有者首先从数据文件中提取出关键字集，并使用对称密钥对数据文件集进行加密，生成文件密文；然后以每个文件的关键字集和布隆过滤器密钥作为输入，生成每个文件对应的布隆过滤器。再以矩阵密钥和布隆过滤器作为输入，输出对应的索引；

S104：密钥加密阶段，数据拥有者选定秘密属性和访问策略，使用CP-ABE的方式加密对称密钥，并将属性加密结果、文件密文和索引一起上传至服务器；

S105：陷门生成阶段，数据用户选取要搜索的关键字，输入布隆过滤器密钥和矩阵密钥，生成搜索关键字的陷门；将陷门上传至云服务器进行搜索；

S106：搜索匹配阶段，收到用户的陷门后，云服务器执行操作；将陷门与索引集进行匹配，若匹配成功，则把匹配文件基于综合匹配度排序，输出前L个包含搜索关键字集的文档地址；否则，未搜索到匹配文件；

S107：用户解密阶段，用户从云服务器下载密文文件和相应的属性密文；如果用户ID在授权用户的列表且用户属性满足拥有者的访问策略，则该用户拥有解密对称密钥的权限；用户首先通过自身属性解密访问策略，再通过拥有者秘密属性解密出对称密钥，并使用对称密钥解密文件。

下面结合附图对本发明的应用原理作进一步的描述。

本发明在实现的过程分为已知密文模型下基于CP-ABE自动校正的高效密文检索方法和已知背景模型下基于CP-ABE自动校正的高效密文检索技术。

如图2所示，本发明实施例提供的基于CP-ABE自动校正的高效密文检索方法包括以下步骤：

步骤一：系统初始化。

1.1)群参数。输入安全参数λ，CA首先选取一个阶为素数p生成元为g的群G₁。设e:G₁×G₁→G₂表示双线性映射。

1.2)注册。假设系统中的注册代理服务器的个数为N，CA中心为每个注册用户和注册代理服务器分发唯一的身份标识符U和P_i。

1.3)生成数据拥有者公私钥。随机选取参数a，α_O∈Z_p，数据拥有者DO计算公钥为

1.4)生成代理服务器公私钥。选取随机参数b,c_i∈Z_p，将c_i/b秘密发送给每个代理服务器P_i。每个代理服务器P_i选取私钥为

计算公钥为

1.5)因此，系统主密钥、公钥分别为：

步骤二：密钥产生阶段。

2.1)属性密钥生成。对于每个用户U，该算法选取一个随机数u并生成他的公钥PK_U＝g^u，并生成对应属性集记为ATT_U。

2.2)对于每个属性

计算代理服务器属性公钥为

2.3)每个代理服务器P_i首先检验用户属性集ATT_U与

中相同的属性是否有效，如果有效则记为att_PU，表示用户U在代理服务器P_i中的有效属性集。计算用户的第一部分私钥为

2.4)对于

计算密钥

2.5)类似的，数据拥有者首先验证搜索用户的身份标识符，如果为有效用户，如果为有效用户，则拥有者选取TP∈Z_p，计算密钥

并发送给用户。综上，搜索用户的解密密钥为SK_U＝(SK₁,SK₂)。

2.6)已知密文模型下，可搜索加密系统的密钥生成。数据拥有者生成矩阵密钥SK＝{S,M₁,M₂}，其中S是一个(m+2)维的向量，M₁,M₂是两个(m+2)×(m+2)维的矩阵。然后生成文件加密密钥k。此外生成密钥sk和r个随机数k₁,...,k_r作为布隆过滤器的Hash函数密钥输入，记为K＝(sk,k₁,...,k_r)。

2.7)已知背景模型下，步骤2.6)所述的可搜索加密系统的密钥生成算法更改为：数据拥有者生成SK＝{S,M₁,M₂}，其中S是一个(m+K+2)维的向量，M₁,M₂是两个(m+K+2)×(m+K+2)维的矩阵。然后生成文件加密密钥k。此外生成密钥sk和r个随机数k₁,...,k_r作为布隆过滤器的Hash函数密钥输入，记为K＝(sk,k₁,...,k_r)。

步骤三：索引建立阶段。

如图3所示，具体实现如下：

3.1)加密明文文件。给定明文文件集F，数据拥有者首先使用对称密钥k对文件集F进行加密，得到密文C_F。

3.2)提取关键字集。数据拥有者为每个文件F_i基于TF-IDF法则提取关键字集W＝{w₁,...,w_m}。

3.3)生成布隆过滤器。输入关键字集W和Hash函数密钥K，拥有者生成了每个文件对应的布隆过滤器BF_i，BF_i[j]表示布隆过滤器的第j位，插入值为相关关键字w_j在文件F_i中的词频TF值。

3.4)已知密文模型下，矩阵密钥加密布隆过滤器的过程。将BF_i扩展为(BF_i,ξ_i,1)，其中ξ_i为随机数。将BF_i分割成两个部:BF_i'和BF_i”。根据向量S，如果S[j]＝0，则BF_i'[j]和BF_i”[j]保持不变，否则，设置BF_i'[j]+BF_i”[j]＝BF_i[j]，其中BF_i'[j]和BF_i”[j]为随机数。

3.5)已知背景模型下，步骤3.4)的过程更改为：将BF_i扩展为(m+β+1)维向量，其中β∈[1,K]，扩展的β维均被设置为随机数ξ^(β)。将BF_i分割成两个部:BF_i'和BF_i”。根据向量S，如果S[j]＝0，则BF_i'[j]和BF_i”[j]保持不变，否则，设置BF_i'[j]+BF_i”[j]＝BF_i[j]，其中BF_i'[j]和BF_i”[j]为随机数。

3.6)将加密后每个文件对应的布隆过滤器插入到R树构建索引树。于是，整个索引表示为：于是，整个索引表示为：

步骤四：拥有者使用对称密钥加密文件，并使用CP-ABE加密该对称密钥。

如图4所示，具体实现如下：

4.1)CP-ABE加密。数据拥有者随机选取r₁,r₂∈Z_p并分配给访问结构的根节点和自己的秘密属性TP。

4.2)选定访问策略为Λ＝(ρ,M)，其中M是一个l×n的矩阵，l表示访问结构的所有属性的数量，ρ是将矩阵每一行映射到相关属性的单向函数。与访问结构Λ相关的代理服务器集合记为P_Λ，N_Λ集合P_Λ中代理服务器的个数。设

表示向量M_j中的属性集，其中

M_j表示矩阵M的行向量。随机选取向量v＝(r₁,s₂,...,s_n)，r₁表示共享秘密值。

4.3)数据拥有者首先使用TP加密得C_TP。

4.4)对密钥k使用代理服务器PS的公钥和数据拥有者DO的公钥进行加密得密文C_k，最后计算C_m为：

4.5)最后，数据拥有者将加密文件C_F、加密索引I和加密密钥C_m一起上传至云服务器。

步骤五：用户生成陷门阶段。

如图5所示，具体实现如下：

5.1)对搜索关键字集Q使用拼写校正系统进行纠错，输出纠正后的查询关键字。

5.2)对纠正后的关键字集Q中的每个关键字q_i基于语法解析器进行权重计算，记录为KW_i。

5.3)计算每个查询关键字的逆向词频IDF_i值。计算IDF_i×KW_i的值，将该值插入至关键字q_i映射到布隆过滤器的对应位置上。也就是说，将关键词Q转换成为布隆过滤器BF_Q，BF_Q[j]表示相关关键字q_j的IDF_i×KW_i值。

5.4)在已知密文模型下，矩阵密钥加密布隆过滤器的过程。拥有者将BF_Q进行扩展为(εBF_Q,ε,t)，其中ε，t为随机数且ε≠0。随后，将BF_Q分割为两个向量BF_Q',BF_Q”：如果S[j]＝0，则BF_Q'[j]和BF_Q”[j]保持不变，否则，设置BF_Q'[j]+BF_Q”[j]＝BF_Q[j]，其中BF_Q'[j]和BF_Q”[j]为随机数。最后，陷门T表示为

5.5)在已知背景模型下，为了进一步混淆，步骤5.4)矩阵密钥加密布隆过滤器的过程更改如下：将BF_i扩展为(m+β+1)维向量，其中β∈[1,K]。从K维假性关键字中选取J维，将BF_Q扩展为随机关键字并将其相关位置为1，将布隆过滤器BF_Q扩展为(εBF_Q,ε,t)，其中ε，t为随机数且ε≠0。随后，将BF_Q分割为两个向量BF_Q',BF_Q”：如果S[j]＝0，则BF_Q'[j]和BF_Q”[j]保持不变，否则，设置BF_Q'[j]+BF_Q”[j]＝BF_Q[j]，其中BF_Q'[j]和BF_Q”[j]为随机数。最后，陷门T为

步骤六：云服务器搜索匹配阶段。

如图6所示，具体实现如下：

6.1)云服务器收到用户发送过的陷门T后，首先判断该用户是否为授权用户。

6.2)云服务器根据收到的陷门T对R树进行矩阵查询和定位，搜索匹配到最小边界矩阵。

6.3)已知密文模型下，布隆过滤器的内积计算过程。对于最小边界矩阵中的所有叶子节点中所包含的布隆过滤器，云服务器计算它们与陷门T对应的加密布隆过滤器的内积结果，计算过程如等式(5)所示。计算完所有的内积结果并排序之后，CS返回前L个文件标识符列表给用户。

6.4)已知背景模型下，步骤6.3)的布隆过滤器的内积计算过程更改如下：云服务器收到用户发送过的陷门T后，首先判断该用户是否为授权用户。然后根据收到的陷门T对R树进行矩阵查询和定位，搜索匹配到最小边界矩阵。对于最小边界矩阵中的所有叶子节点中所包含的布隆过滤器，云服务器计算它们与陷门T对应的布隆过滤器的内积结果，如等式(6)所示。计算完所有的相似分数之后，CS返回前L个文件标识符列表给用户。

步骤七：用户解密阶段。

如图7所示，具体实现如下：

7.1)用户从云服务器下载密文文件和相应对称密钥的属性密文。

7.2)访问策略解密。当用户需要搜索密文文件时，他通过代理服务器发送安全索引，代理服务器将匹配的文件标识符发送给用户。用户首先需要解密加密密钥C_m以获得对称密钥k，然后通过k解密文件。根据LSSS访问策略，如果用户属性集满足访问策略，我们恢复共享秘密r₁如式(7)所示。设P_Λ表示满足访问结构的所有代理服务器的属性集，ATT_Pi表示代理服务器P_i的属性集。因此，根据访问结构解密的第一步如(8)所示。

7.3)秘密属性解密。如果用户是授权用户，则可从拥有者手中获得秘密属性TP，并根据TP进行解密。用户解密如下：

7.4)最后，用户计算对称密钥为：

7.5)用户使用对称密钥k解密所获得的密文文件，得到明文数据。

7.6)解密的一致性验证。

由LSSS的定义可知，文中使用单向函数ρ将矩阵M的第i行所表示的属性映射为ρ(i)。为了验证搜索结果的正确性，当用户的属性集满足访问策略，有H(att)＝H(ρ(j))，于是对称密钥k的解密验证如下：

进一步地，如果用户手中的拥有者秘密属性TP'与拥有者的TP相一致，有H(TP)＝H(TP')，于是式(9)的验证如下：

最终，用户计算对称密钥k如式(13)：

下面我们通过仿真来进一步说明本发明的优势：

1.仿真条件

我们以安装系统Ubuntu16.04的电脑模仿服务器端，使用Windows系统的电脑作为用户端。我们使用Python和C++作为开发语言，两台电脑参数分别为

Core(TM)i5-6500CPU@3.20GHz，RAM8.00GB和

Core(TM)i3-3240 CPU@3.40GHz，RAM8.00GB。我们以RFC库的文档为来源。

2.仿真结果分析

在整个仿真分析过程中，我们将本发明拆分成可搜索加密算法时间开销及属性算法时间开销进行分析。其中可搜索加密算法中我们对索引构建、陷门生成和搜索阶段时间进行了仿真和对比，分别如图8、图9(a)(b)(c)和图10所示。属性算法仿真阶段我们对系统的初始化、密钥生成时间进行了仿真和对比，如图11(a)(b)所示；以及对属性密文加密、解密进行了仿真和对比，如图12(a)(b)所示。

在图8中，索引创建的主要步骤是构建一棵平衡R树和布隆过滤器，其中叶子节点存储的数据为加密的布隆过滤器及相应的密文文件ID，R树插入过程的分裂算法本发明考虑的是平方算法。R树中要求矩形尽量不要重叠。如何均衡分布矩形及如何将R树的矩形分裂成合适的两个部分，是影响R树检索效率的重要因素。索引创建时间主要取决于R树的插入的效率和布隆过滤器的插入效率。布隆过滤器的插入时间与每个文件的关键字的个数基本无关，只与映射函数个数相关，映射函数个数确定时为一个常数值。图8描述了索引创建的效率随着文件个数的变化情况。可以看出，随着文件个数增多，MRSE方案中索引随文件集的增长呈正比趋势，而本发明的切线斜率逐渐接近MRSE的斜率，索引构建的时间开销均在变大，但是本方案的性能仍比MRSE方案高。

图9中陷门生成的主要步骤为：(1)拼写校正；(2)计算关键字权重值；(3)构建布隆过滤器；(4)加密布隆过滤器。我们选取由Wiktionary和British National Corpus语料库组成所选的训练集。选取Oxford Text Archive的Roger Mitton的Birkbeck误拼语料库作为测试集。该方案所使用的具有任意长度的字符串到字符串转换的拼写检查器的正确性如图9(a)所示，可以看到，随着训练集中正确关键字数的增多，校正正确率也会变大，即对输入上下文的正确性有一定的依赖关系。校正系统的运行时间如图9(b)所示，系统对关键字的处理时间基本成正比关系，而一般搜索关键字的个数仅为个位数，系统在ms级之内便可校正。含r个映射函数的布隆过滤的插入效率为O(r)。r一般为系统设定的固定值，因此陷门生成时间也基本为一个固定值，与关键字的个数无关。本发明所使用子矩阵加密的技术减小了矢量加密的运算，图9(c)展示了我们所提的方案在两个不同模型下的陷门创建总时间，均小于MRSE方案。

图10中搜索阶段的主要步骤包括最小边界矩阵定位和加密布隆过滤器之间的内积计算。最坏的情况下，云服务器需要遍历所有的R树节点且计算n个加密布隆过滤器与陷门的匹配程度。最好的情况下，云服务器只需对R树执行一次“深度优先搜索”，匹配叶子节点的布隆过滤器。此时计算复杂度表示为

n表示条目数，这里指的是文件数目。图10描述了搜索时间随文件集大小而变化的时间消耗，可以看出，我们所提的两个方案的搜索时间开销均小于方案MRSE。

图11(a)描述了初始化阶段的时间开销，本发明的初始包括生成系统公钥PK和主密钥MSK，包括每个代理服务器的初始化操作。初始化计算开销与代理服务器个数呈正比趋势，与系统属性个数无关。一般来说，系统属性的总个数远大于代理服务器的总个数。当系统属性个数大于25个时，本发明优于ABKS-UR方案。

图11(b)描述了密钥生成阶段的时间开销。该阶段主要为搜索用户生成解密密钥。本发明的计算开销为(2N+6)e₁，e₁表示群G₁中的模指数运算，而ABKS-UR的计算开销为(2N+1)e₁+2e₂，e₂表示群G₂中的模指数运算，大于本发明。

图12(a)描述了密文加密阶段的时间开销。该阶段主要使用CP-ABE加密对称密钥k，分别包括访问结构的加密和拥有者秘密TP的双重加密。该阶段计算开销为每个代理服务器中的运算量为e₂+(S+4)e₁，S表示用户的授权属性个数，与系统属性个数无关。

图12(b)描述了密文解密阶段的时间开销。该阶段主要包括用户恢复共享秘密r₁和获取拥有者TP相关的密钥来解密ABE密文以获取对称密钥k。该阶段包括(2N+4)个双线性对运算。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于CP-ABE自动校正的高效密文检索方法，其特征在于，所述基于CP-ABE自动校正的高效密文检索方法结合R树和布隆过滤器作为索引结构，将一个加密的布隆过滤器和对应的密文文件ID集存储在R树的叶子节点中；云服务器根据搜索陷门对R树进行矩阵定位，然后对叶子节点中加密的布隆过滤器匹配；根据布隆过滤器的内积结果对文件进行排序；陷门生成过程引入了随机数，即使相同的关键字也会生成不同的陷门；通过使用访问结构和拥有者秘密属性共同加密；

所述基于CP-ABE自动校正的高效密文检索方法具体包括：

第二步，密钥产生阶段；分为可搜索加密的密钥产生阶段和属性的密钥产生阶段；可搜索加密的密钥产生阶段由权威中心CA生成矩阵密钥、布隆过滤器输入密钥和密文加密密钥；属性的密钥生成阶段CA为每个用户DU和拥有者DO生成对应的公私钥对和相应的属性集，作为解密密钥；

第七步，用户解密阶段，用户从云服务器下载密文文件和相应的属性密文；如果用户ID在授权用户的列表且用户属性满足拥有者的访问策略，则该用户拥有解密对称密钥的权限；用户首先通过自身属性解密访问策略，再通过拥有者秘密属性解密出对称密钥，并使用对称密钥解密文件；

所述第一步的系统初始化阶段具体包括：

计算公钥为

(5)系统主密钥、公钥分别为：

2.如权利要求1所述的基于CP-ABE自动校正的高效密文检索方法，其特征在于，所述第二步的密钥产生阶段具体包括：

(2)对于每个属性att∈ATT_Pi，计算代理服务器属性公钥为

(3)每个代理服务器P_i首先检验用户属性集ATT_U与

(4)对于

计算密钥

(5)数据拥有者首先验证搜索用户的身份标识符，如果为有效用户，则拥有者选取TP∈Z_p，计算密钥

并发送给用户，搜索用户的解密密钥为SK_U＝(SK₁,SK₂)；

3.如权利要求1所述的基于CP-ABE自动校正的高效密文检索方法，其特征在于，所述第三步的索引建立阶段具体包括：

(1)加密明文文件，给定明文文件集F，数据拥有者首先使用对称密钥k对文件集F进行加密，得到密文C_F；

(2)提取关键字集，数据拥有者为每个文件F_i基于TF-IDF法则提取关键字集W＝{w₁,...,w_m}；

(5)已知背景模型下，将BF_i扩展为(m+β+1)维向量，其中β∈[1,K]，扩展的β维均被设置为随机数ξ^(β)，将BF_i分割成两个部:BF_i'和BF_i”；根据向量S，如果S[j]＝0，则BF_i'[j]和BF_i”[j]保持不变，否则，设置BF_i'[j]+BF_i”[j]＝BF_i[j]，其中BF_i'[j]和BF_i”[j]为随机数；

(6)将加密后每个文件对应的布隆过滤器插入到R树构建索引树，于是，整个索引表示为：

4.如权利要求1所述的基于CP-ABE自动校正的高效密文检索方法，其特征在于，所述第四步的数据拥有者使用对称密钥加密文件，并使用CP-ABE加密该对称密钥具体包括：

表示向量M_j中的属性集，其中

(3)数据拥有者首先使用TP加密得C_TP；

5.如权利要求1所述的基于CP-ABE自动校正的高效密文检索方法，其特征在于，所述第五步的用户生成陷门阶段具体包括：

(4)在已知密文模型下，矩阵密钥加密布隆过滤器的过程，拥有者将布隆过滤器BF_Q进行扩展为(εBF_Q,ε,t)，其中ε，t为随机数且ε≠0；随后，将BF_Q分割为两个向量BF_Q',BF_Q”：如果S[j]＝0，则BF_Q'[j]和BF_Q”[j]保持不变，否则，设置BF_Q'[j]+BF_Q”[j]＝BF_Q[j]，其中BF_Q'[j]和BF_Q”[j]为随机数；最后，陷门T表示为

6.如权利要求1所述的基于CP-ABE自动校正的高效密文检索方法，其特征在于，所述第六步的云服务器搜索匹配阶段具体包括：

所述第七步的用户解密阶段具体包括：

表示代理服务器P_i的属性集，根据访问结构解密；

(4)用户计算对称密钥为：

7.一种基于权利要求1所述基于CP-ABE自动校正的高效密文检索方法的基于CP-ABE自动校正的高效密文检索系统，其特征在于，所述基于CP-ABE自动校正的高效密文检索系统包括：包括数据所有者DO、云服务器CS、授权数据用户DU、可信权威中心CA和代理服务器PS；

8.一种云计算服务系统包括用于实现权利要求1～6任意一项所述基于CP-ABE自动校正的高效密文检索方法的模块。