CN111177787B

CN111177787B - 多数据拥有者环境中基于属性的连接关键字搜索方法

Info

Publication number: CN111177787B
Application number: CN202010002939.7A
Authority: CN
Inventors: 李慧贤; 杨葆哲; 马勇; 庞辽军; 穆群英; 刘黎明
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2020-01-02
Filing date: 2020-01-02
Publication date: 2022-12-06
Anticipated expiration: 2040-01-02
Also published as: CN111177787A

Abstract

本发明涉及一种多拥有者环境中基于属性的连接关键字搜索方法，该方法利用聚合技术，使得关键字数量线性增长时陷门长度保持不变；并采用线性秘密共享矩阵(Linear secret sharing matrix,LSSS)型访问结构加密关键字集合，在保证表达力的前提下，具有较高的计算效率；同时利用相关性得分对搜索结果排序，提高了搜索精确度。

Description

多数据拥有者环境中基于属性的连接关键字搜索方法

技术领域

本发明涉及一种关键字搜索方法，特别是一种在多数据拥有者环境中基于属性的连接关键字搜索方法。

背景技术

文献“支持关键词任意连接搜索的属性加密方案，通信学报，2016(8):77-85”公开了一种基于属性的关键字任意连接搜索方法。该方法利用多项式方程实现了关键字任意连接查询，无需固定关键字位置，使得关键字连接搜索更加灵活；同时结合属性基加密技术实现了细粒度的访问控制，同时每个索引被多个查询用户搜索，降低了细粒度访问控制带来的网络带宽和发送节点的处理开销。但是该方法中陷门大小随关键字数量线性增长，难以控制陷门大小。

发明内容

要解决的技术问题

为了解决陷门大小与关键字数量成线性增长的问题，降低用户端的计算开销，本发明提供一种多拥有者环境中基于属性的连接关键字搜索方法。该方法利用聚合技术，使得关键字数量线性增长时陷门长度保持不变；并采用线性秘密共享矩阵(Linear secretsharing matrix, LSSS)型访问结构加密关键字集合，在保证表达力的前提下，具有较高的计算效率；同时利用相关性得分对搜索结果排序，提高了搜索精确度。

技术方案

一种多数据拥有者环境中基于属性的连接关键字搜索方法，其特征在于步骤如下：

步骤1：系统初始化

系统中的可信授权中心选择哈希函数H:{0,1}^*→Z_p，阶为p的乘法循环群G、G_T，Z_p为整数有限域，p为素数；双线性映射e:G×G→G_T，g为群G的生成元；可信授权中心为属性全集U＝{1，2，...，u}中的每个属性i，u为正整数，1≤i≤u，从群G中选择对应的随机数h_i∈G，另随机选择α，β∈Z_p，计算X＝g^α，Y＝g^β，得到系统公钥PK和系统主密钥MSK：

PK＝(G，G_T，p，g，e，X，Y，h₁，h₂，…，h_u) (1)

MSK＝(α，β) (2)

步骤2：属性密钥生成

给定查询用户DU_d的属性集S_d，其中

1≤d≤l_DU，l_DU表示系统中查询用户的数量，l_DU为正整数；可信授权中心为该用户随机选取整数r∈Z_p，计算K＝g^αg^βr和L＝g^r，对用户属性集S_d中的每一个属性j，1≤j≤u，计算K_j＝h_j ^r，生成用户DU_d的属性密钥SK_d：

步骤3：索引生成

为了便于云服务器进行密文检索，每个数据拥有者都需要为待上传的文件生成索引；索引生成的具体步骤如下：

1)数据拥有者DO_i从文件F_i，j中选取一组具有代表性的关键字集合

其中1≤i≤l_DO，

l_DO表示系统中数据拥有者的数量，l_DO为正整数；

表示系统中第i个数据拥有者的文件数量，

为正整数；

表示文件F_i，j中选出的关键字数量，

为正整数；关键字集合W_i，j是系统关键字全集

的子集，这里l_w表示系统关键字全集W中关键词的数量，l_w为正整数；对集合W_i，j中的每个关键字

计算

得到索引I_i，j中的

部分；

2)数据拥有者DO_i为文件F_i，j选择LSSS型访问结构(M_l×n，ρ)，其中M_l×n是一个l行n列的秘密共享矩阵，l和n均为正整数；函数ρ：{1，2，...，l}→ρ(i)表示将矩阵M_l×n中的第i行M_i映射为一个属性值ρ(i)，1≤i≤l；令s∈Z_p表示待分享的秘密值，随机选取y₂，y₃，...，y_n∈Z_p，构成列向量v＝(s，y₂，...，y_n)，并计算E₀＝g^s和E₁＝g^αs；对矩阵M_l×n中的每一行M_i，计算λ_i＝v·M_i；另选l个随机数r₁，r₂，...，r_l∈Z_p，计算

和

该步骤的计算可获得索引I_i，j中的{E₀，E₁，{C_i，D_i}_{i∈{1，2，...，l}}}部分；

3)数据拥有者DO_i根据公式(4)计算出关键字集W_i，j中每个关键字w_i，j，t与文件F_i，j的相关性得分RS_i，j，t，得到相关性得分集合

式中，

表示文件F_i，j的长度，即文件F_i，j中包含单词的数量，

为正整数，

表示关键字w_i，j，t出现在文件F_i，j中的频率，

表示系统中所有包含关键字w_i，j，t的文件数量，N表示系统中文件总数量，N为正整数；

为了保证相关性得分的机密性，DO_i利用自身身份ID_i，1≤i≤l_DO，根据公式(5)选取对应的顺序累加隐私保护函数

式中，A_j，k表示m(x，j)·m(y，k)的系数，A_j，k为正整数，τ表示函数

的阶，τ为正整数；x代表相关性得分变量，y表示不同拥有者身份ID_i的哈希值，即y＝H(ID_i)；函数m(x，j)用来保护相关性得分x的顺序，函数m(y，k)用来保护数据拥有者的身份，r_aof是随机整数项，r_aof∈{0，1，...，2^j-1}，m(x，j)是一个如公式(6)所示的递归函数，其中α和λ均为正整数；

数据拥有者DO_i选取对应的

并利用该函数加密RS_i，j集合中的每一个元素RS_i，j，t，得到相关性得分密文

同时为了便于云服务器对不同数据拥有者索引中的相关性得分进行排序，DO_i还需计算函数

该步骤的计算可得到索引I_i，j中的

部分；

经过以上三个步骤的计算，最终得到文件F_i，j的索引I_i，j如下：

步骤4：陷门生成

查询用户DU_d选取待查询关键字集

l_Q表示查询关键字的数量，l_Q为正整数；查询用户利用属性密钥SK_d计算陷门；用户随机选择q∈Z_p，计算

其中

1≤t≤l_Q，T₂＝K^q，T₃＝g^rq，T₄＝g^q；对于查询用户属性密钥SK_d中的每一个元素K_j，计算T_j＝K_j ^q，最终得到陷门T_d，并上传至云服务器；

步骤5：密文搜索

云服务器根据查询用户上传的陷门T_d，对当前已存储的文件进行搜索；以云服务器中已存储的文件F_i，j为例，其中1≤i≤l_DO，

云服务器根据文件F_i，j的索引I_i，j进行如下计算；若用户DU_d的属性集S_d满足LSSS型访问结构(M_l×n，ρ)，即可得到满足访问结构的最小属性集合X＝{i：ρ(i)∈S_d}，

则一定存在常数集{w_i}_i∈X，使得∑_i∈X w_iλ_i＝s；云服务器计算

同时获取索引I_i，j中的

进而验证等式(9)是否成立；若等式(9)成立，表示文件F_i，j的索引I_i，j所包含的关键字集

与查询关键字集

匹配，同时查询用户的属性集S_d满足文件F_i，j的LSSS型访问结构(M_l×n，ρ)，因此文件F_i，j满足搜索条件，将F_i，j加入到初步搜索结果集F中，继续判断云服务器中存储的下一个文件是否满足搜索条件；若等式(9)不成立，表示文件F_i，j不满足搜索条件，则跳过该文件，继续判断存储的下一个文件是否满足搜索条件；经过步骤五的计算，最终得到一个满足用户搜索条件的初步搜索结果集F；

步骤6：搜索结果排序

为了提高搜索精确度，云服务器对初步搜索结果集F进行排序，仅给用户返回最相关的前k个文件，k为正整数；若用户提交的查询关键字集为

假设当前满足搜索条件的文件共有m个，即F＝{F₁，F₂，...，F_m}，其中m为正整数，1≤k≤m；云服务器通过如下计算从而实现搜索结果排序；排序分为以下两种情况：

1)若m个文件来自同一个拥有者DO_i；云服务器分别计算文件F₁，F₂，...，F_m与查询关键字集Q的相关性得分；

再从{V_i，1，V_i，2，...，V_i，m}这m个数值中选出前k个最大的值，并把对应的文件集发送至查询用户；

2)若m个文件来自不同的数据拥有者，假定用户DO_i拥有其中的η个文件，标记为

其中1≤η＜m；云服务器首先计算用户DO_i拥有的文件集

与查询关键字集Q的相关性得分；

除去用户DO_i拥有的文件

将剩余来自不同数据拥有者的

个文件标记为

其中

由于不同拥有者的ID不同，对文件F_{i_j}选取的

函数不同，因此对来自不同拥有者的文件计算的相关性得分密文不具有可比性；云服务器为了对这

个文件与查询关键字集Q的相关性得分排序，首先将不同拥有者的身份哈希值统一用变量y表示，得到公式(12)；

然后用H(IDi)替换公式(12)中的y，固定变量y的值，使得文件排序结果仅与相关性得分有关，得到公式(13)；

从集合

这m个数值中选出前k个最大的值，并把对应的文件集发送至查询用户。

有益效果

本发明提出的一种多数据拥有者环境中基于属性的连接关键字搜索方法，由于采用聚合技术，当用户查询的关键字数量增加时，本方法中的陷门长度保持不变。文献“支持关键词任意连接搜索的属性加密方案，通信学报，2016(8)：77-85”中，陷门大小是关键字数量的一次函数，陷门长度随着关键字数量线性增长。同时本方法采用TF-IDF规则计算相关性得分，实现了对搜索结果的排序整理，仅给用户返回最相关的前k个搜索结果，不仅提高了搜索精确度，而且减少了用户的存储开销。

附图说明

图1是本发明多数据拥有者环境中基于属性的连接关键字搜索方法的实施过程图

具体实施方式

现结合实施例、附图对本发明作进一步描述：

考虑一个实现连接关键字搜索和细粒度访问控制的云存储系统。系统包括多个数据拥有者，多个查询用户，云服务器和可信授权中心。可信授权中心负责系统初始化，生成系统公共参数和主密钥，同时为查询用户生成属性私钥。数据拥有者管理文件并生成索引。查询用户生成用于搜索的陷门。云服务器存储文件密文和文件索引，同时利用强大的计算能力帮助用户进行搜索。

该方法涉及的参数定义为：

表1 参数定义

下面是具体的实施步骤：

1、系统初始化。

设H：{0，1)^*→Z_p是一个将任意长度的字符串映射到Z_p中的哈希函数，Z_p表示整数有限域，G、G_T均为阶为p的乘法循环群，p为素数，g是G的生成元，e：G×G→G_T为双线性映射。可信授权中心选择安全参数λ，λ＝2^k，k是一个大整数。同时可信授权中心为属性全集U＝{1，2，...，u)中的每个属性i，其中u为正整数，1≤i≤u，从群G中选择对应的随机数h_i∈G。另随机选择α，β∈Z_p，计算X＝g^α，Y＝g^β，得到系统公钥PK和系统主密钥MSK。系统公钥公开，主密钥由可信授权中心秘密保存。

PK＝(G，G_T，p，g，e，X，Y，h₁，h₂，…，h_u) (1)

MSK＝(α，β) (2)

2、属性密钥生成。

给定查询用户DU_d的属性集S_d，

可信授权中心为该用户随机选择r∈Z_p，计算K＝g^αg^βr，L＝g^r，对每个属性j∈S_d，计算K_j＝h_j ^r，得到用户DU_d的属性密钥SK_d。

3、索引生成。

为了便于云服务器进行密文检索，每个数据拥有者都需要为待上传的文件生成索引。索引生成的具体步骤如下：

1)数据拥有者DO_i从文件F_i，j中选择一组具有代表性的关键字集合

其中

对集合W_i，j中的每个关键字w_i，j，t，计算

得到索引I_i，j中的

部分。

2)数据拥有者DO_i为文件F_i，j选择LSSS型访问结构(M_l×n，ρ)，其中M_l×n是一个l行n列的秘密共享矩阵，函数ρ：{1，2，...，l)→ρ(i)表示将矩阵M_l×n中的第i行M_i映射为一个属性值ρ(i)，其中1≤i≤l。s∈Z_p表示设定的待分享秘密值，随机选取y₂，y₃，...，y_n∈Z_p，构成列向量v＝(s，y₂，...，y_n)，并计算E₀＝g^s和E₁＝g^αs。对矩阵M_l×n中的每一行M_i，计算λ_i＝v·M_i。另选l个随机数r₁，r₂，...，r_l∈Z_p，计算

和

通过本步骤的计算，获得了索引I_i，j中的{E₀，E₁，{C_i，D_i)_{i∈{1，2，...，l}}}部分。

3)数据拥有者DO_i首先根据公式(4)计算出关键字集W_i，j中每个关键字w_i，j，t与文件F_i，j的相关性得分RS_i，j，t，得到相关性得分集合

式中

表示文件F_i，j的长度，即文件F_i，j中包含单词的数量，

表示关键字w_i，j，t出现在文件F_i，j中的频率，

表示系统中所有包含关键字w_i，j，t的文件数量，N表示系统中文件总数量。

考虑到相关性得分可能包含敏感信息，为了保证相关性得分的机密性，DO_i利用自身身份ID_i，根据公式(5)选取对应的顺序累加隐私保护函数

式中A_j，k表示m(x，j)·m(y，k)的系数，A_j，k为正整数，τ表示函数

的阶。x代表相关性得分变量，y表示不同拥有者身份的哈希值H(ID_i)。函数m(x，j)用来保护相关性得分x的顺序，函数m(y，k)用来保护不同数据拥有者的身份，r_aof是随机整数项，r_aof∈{0，1，...，2^j-1}，m(x，j)是一个如公式(6)所示的递归函数，α和λ均为正整数。

数据拥有者DO_i选取对应的

同时为了便于云服务器对不同数据所有者索引中的相关性得分排序，DO_i还需计算密文

这里y表示不同拥有者身份的哈希值。索引I_i，j中的

部分由该步骤计算得到。

经过以上三个步骤的计算，最终得到文件F_i，j的索引I_i，j。

4、陷门生成。

查询用户DU_d选定待查询关键字集

利用属性密钥SK_d计算陷门。用户随机选择q∈Z_p，计算

T₂＝K^q＝(g^αg^βr)^q，T₃＝g^rq，T₄＝g^q。对于查询用户属性密钥SK_d中的每一个元素K_j，计算T_j＝K_j ^q＝h_j ^rq，得到查询陷门T_d，并上传至云服务器，由云服务器利用强大的计算能力进行文件搜索。

5、密文搜索。

云服务器根据查询用户上传的陷门T_d，对当前已存储的文件进行搜索。以云服务器中已存储的文件F_i，j为例，其中1≤i≤l_DO，

云服务器根据文件F_i，j的索引I_i，j进行如下计算。若用户DU_d的属性集S_d满足LSSS型访问结构(M_l×n，ρ)，即可得到满足访问结构的最小属性集合X＝{i：ρ(i)∈S_d}，

则一定存在常数集{w_i}_i∈X，使得∑_i∈X w_iλ_i＝s。云服务器计算

同时获取索引I_i，j中的

验证等式(9)是否成立。若等式(9)成立，表示文件F_i，j的索引I_i，j所包含的关键字集

与用户查询关键字集

匹配，同时查询用户的属性集S_d满足文件F_i，j的LSSS型访问结构(M_l×n，ρ)，因此文件F_i，j满足搜索条件，将F_i，j加入到初步搜索结果集F中，继续判断存储的下个文件是否满足搜索条件；若等式(9)不成立，表示文件F_i，j不满足搜索条件，则跳过该文件，继续判断存储的下一个文件是否满足搜索条件。经过步骤五的计算，最终得到一个满足用户搜索条件的初步搜索结果集F。

等式左边：

等式右边：

若

同时对于所有的t∈{1，2，...，l_Q}，满足w_i，j，t＝kw_t，则等式

成立。

6、搜索结果排序。

为了提高搜索精确度，云服务器对初步搜索结果集F进行排序，仅给用户返回最相关的前k个文件，k为正整数。若用户提交的查询关键字集为

假设当前满足搜索条件的文件共有m个，即F＝{F₁，F₂，...，F_m}，其中m为正整数，1≤k≤m。云服务器通过如下计算从而实现搜索结果排序。排序分为以下两种情况。

1)若m个文件来自同一个拥有者DO_i。云服务器分别计算文件F₁，F₂，...，F_m与查询关键字集Q的相关性得分。

再从{V_i，1，V_i，2，…，V_i，m}这m个数值中选出前k个最大的值，并把对应的文件集发送至查询用户。

其中1≤η＜m。云服务器首先计算用户DO_i拥有的文件集

与查询关键字集Q的相关性得分。

除去用户DO_i拥有的文件

将剩余来自不同数据拥有者的

个文件标记为

其中

由于不同拥有者的ID不同，对文件F_{i_j}选取的

函数不同，因此对来自不同拥有者的文件计算的相关性得分密文不具有可比性。云服务器为了对这

个文件与查询关键字集Q的相关性得分排序，首先将所有拥有者的身份哈希值H(ID)统一用变量y表示，得到公式(15)。

然后统一用H(ID_i)替换公式(15)中的y，固定变量y的值，使得文件排序结果仅与相关性得分有关，得到如下公式。

从集合

Claims

1.一种多数据拥有者环境中基于属性的连接关键字搜索方法，其特征在于步骤如下：

步骤1：系统初始化

系统中的可信授权中心选择哈希函数H：{0，1}^*→Z_p，阶为p的乘法循环群G、G_T，Z_p为整数有限域，p为素数；双线性映射e：G×G→G_T，g为群G的生成元；可信授权中心为属性全集U＝{1，2，...，u)中的每个属性i，u为正整数，1≤i≤u，从群G中选择对应的随机数h_i∈G，另随机选择α，β∈Z_p，计算X＝g^α，Y＝g^β，得到系统公钥PK和系统主密钥MSK：

PK＝(G，G_T，p，g，e，X，Y，h₁，h₂，…，h_u) (1)

MSK＝(α，β) (2)

步骤2：属性密钥生成

给定查询用户DU_d的属性集S_d，其中