CN110263570B - 一种实现高效相似性查询和访问控制的基因数据脱敏方法 - Google Patents
一种实现高效相似性查询和访问控制的基因数据脱敏方法 Download PDFInfo
- Publication number
- CN110263570B CN110263570B CN201910387357.2A CN201910387357A CN110263570B CN 110263570 B CN110263570 B CN 110263570B CN 201910387357 A CN201910387357 A CN 201910387357A CN 110263570 B CN110263570 B CN 110263570B
- Authority
- CN
- China
- Prior art keywords
- data
- gene sequence
- gene
- data owner
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
- H04L63/0435—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload wherein the sending and receiving network entities apply symmetric encryption, i.e. same key used for encryption and decryption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/06—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
- H04L9/0643—Hash functions, e.g. MD5, SHA, HMAC or f9 MAC
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/08—Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
- H04L9/0861—Generation of secret information including derivation or calculation of cryptographic keys or passwords
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/08—Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
- H04L9/0861—Generation of secret information including derivation or calculation of cryptographic keys or passwords
- H04L9/0869—Generation of secret information including derivation or calculation of cryptographic keys or passwords involving random numbers or seeds
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Power Engineering (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于信息安全技术领域,具体提供一种实现高效相似性查询和访问控制的基因数据脱敏方法,其有效支持密文环境下大规模基因数据的相似性查询,同时支持复杂的逻辑查询以满足用户个性化的查询需求,该方法授权方式灵活,可对不同的数据授予不同的访问权限,并在查询过程中实现对用户的数据访问权限的可靠控制,此外,本发明采用特定的哈希函数压缩数据,显著减少密文状态下匹配的元素数量,进一步提高查询检索效率。
Description
技术领域
本发明属于信息安全技术领域,具体涉及一种实现高效相似性查询和访问控制的基因数据脱敏方法。
背景技术
基因相似性查询已成为一个热门的研究领域,具有良好的医学健康应用前景。例如疾病预测,通过早期的预防治疗降低与病患有相似基因的人群的发病率。随着大数据时代的到来,庞大的基因数据量以及基因间相似度查询的计算开销,使得越来越多的公司和企业将本地的基因数据外包至第三方云服务器,如DNAnexus,Google Genomics等。然而,直接将基因数据以明文方式外包给云服务器,云服务提供商能够轻易地获取诸如基因序列、健康状况等用户敏感信息,使得用户的隐私数据存在极大的泄露隐患。
为解决上述问题,一种简单的方式是在将基因数据外包至云服务器之前,利用传统的加密方法(比如AES)加密整个基因数据;然而,这将显著降低数据的可用性,因为云服务器无法在密文状态下执行基因相似性查询;因此,迫切需要设计出一种安全、高效且功能完备的基因数据脱敏方案。
目前,现有的基因数据脱敏方案仅考虑密文环境下的查询效率,而忽略许多重要因素,尤其是数据的访问权限控制和个性化的查询需求(比如复杂的逻辑查询);在实际应用场景中,不同用户对基因数据可能有不同的访问权限,在进行查询时用户也可能只关注基因序列上某些特定的基因片段而不是整个序列,这就要求脱敏方案应具备完善的访问控制机制并能提供细粒度的密文查询检索方式。
发明内容
本发明提出一种在云环境中实现高效密文相似性查询和安全访问控制的基因数据脱敏方法,其有效支持密文环境下大规模基因数据的相似性查询,同时支持复杂的逻辑查询以满足用户个性化的查询需求,该方法授权方式灵活,可对不同的数据授予不同的访问权限,并在查询过程中实现对用户的数据访问权限的可靠控制,此外,本发明采用特定的哈希函数压缩数据,显著减少密文状态下匹配的元素数量,进一步提高查询检索效率。
为实现上述目的,本发明采用的技术方案如下:
一种实现高效相似性查询和访问控制的基因数据脱敏方法,包括以下步骤:
步骤1.系统初始化:系统生成公共的基因序列,数据拥有者生成用户访问数据的角色权限集合,生成用于特定哈希函数加密、集合伪随机排列以及矩阵安全内积运算所需的密钥;
步骤2.数据预处理:数据拥有者对其拥有的全部基因序列进行分块处理;数据拥有者参照公共基因序列,利用编辑距离算法获取各分块基因序列的编辑操作集合;数据拥有者定义各基因序列的访问权限函数,并获取相应访问权限函数的系数;对于每个基因序列,数据拥有者任意选择ψ个正态分布的随机数,并连同访问权限函数的系数对相应基因序列的编辑操作集合进行维度扩增;
步骤3.安全索引建立:数据拥有者使用特定哈希函数、伪随机排列、矩阵加密对扩维后的编辑操作集合中非函数系数、非随机数的元素进行k次循环加密、求和、混淆以及矩阵内积操作,最终每个基因序列对应k个安全索引;数据拥有者使用对称密码算法对原始基因数据进行加密处理,建立基因密文数据与安全索引之间的联系,并由数据拥有者将基因密文数据以及相应的安全索引上传至云服务器;
步骤4.生成搜索指令:用户将待检索基因序列进行分块处理,并利用编辑距离算法和公共基因序列获取待检索基因序列的编辑操作集合;用户使用数据拥有者授权的函数根值进行多次求幂运算并连同任意选择的ψ个随机数,对待检索基因序列的编辑操作集合进行扩维处理;用户使用特定哈希函数、伪随机排列、矩阵加密对扩维后的编辑操作集合中非函数根的幂值、非随机数的元素进行k次循环加密、求和、混淆以及矩阵内积操作,最终用户将生成的k个搜索指令发送给云服务器;
步骤5.查询处理:云服务器将k个搜索指令同每个基因序列的k个安全索引逐一进行内积运算并计算均值,最终云服务器将前n个大的均值所对应的基因密文返回给用户;
步骤6.数据解密:用户使用数据拥有者授权的解密密钥解密云服务器返回的密文数据,最终获取明文状态下的基因数据。
进一步的,步骤1的具体过程为:
步骤1.1系统发布不包含任何敏感信息的公共基因序列ref;
步骤1.4数据拥有者生成用于集合伪随机排列π混淆的密钥{sk1,sk2,...,skk};
步骤1.5数据拥有者生成用于矩阵安全内积运算所需的加密密钥:
{{S1,S2,...,Sk},{M11,M12,...,M1k},{M21,M22,...,M2k}},
其中{Sj}j=1,2,...,k为分裂指示向量且仅包含0、1元素,{M1j}j=1,2,...,k和{M2j}j=1,2,...,k为可逆矩阵;
步骤1.6数据拥有者生成用于对称加密原始基因数据的密钥key。
进一步的,步骤2的具体过程为:
步骤2.1数据拥有者将其拥有的基因序列{A1,A2,...,AN}进行s分块处理,其中s表示每个基因序列别分成的块数:Ai=(Ai1,Ai2,...,Ais)=(Aim)m=1,2,...,s,其中i=1,2,...,N,m=1,2,...,s;
步骤2.2数据拥有者利用编辑距离算法以及公共基因序列ref获取每个已分块基因序列的编辑操作集合,即A′i=(A′i1,A′i2,...,A′is)=(A′im)m=1,2,...,s,其中A′im表示第i个基因序列的第m个分块在编辑距离算法以及ref的第m个分块的共同处理下得到的编辑操作集合;
步骤2.4数据拥有者为每个基因序列Ai选择ψ个随机数{γρ}ρ=1,2,...,ψ,其中γρ服从正态分布,并连同基因序列Ai访问权限函数的系数{βil}l=0,1,...,ω对A′i进行扩维处理:
进一步的,步骤3的具体过程为:
步骤3.6数据拥有者使用对称密码算法加密原始基因序列{A1,A2,...,AN},获得密文基因数据Enc表示对称密码算法的加密函数;数据拥有者建立每个密文基因数据与其安全索引之间的对应关系并将发送给云服务器;
进一步的,步骤4的具体过程为:
步骤4.1授权用户将待检索的基因序列Q进行s分块处理:Q=(Q1,Q2,...,Qs)=(Qm)m=1,2,...,s;授权用户利用编辑距离算法以及公共基因序列ref获取已分块基因序列Q的编辑操作集合:Q'=(Q′1,Q'2,...,Q′s)=(Q'm)m=1,2,...,s,其中Q'm表示基因序列Q的第m个分块在编辑距离算法以及ref的第m个分块的共同处理下得到的编辑操作集合;
步骤4.2授权用户选择ψ个随机数{γ'ρ}ρ=1,2,...,ψ,并连同权限η对Q'进行扩维处理:
进一步的,步骤5的具体过程为:
进一步的,步骤6的具体过程为:
本发明的有益效果在于:
本发明提供一种实现高效相似性查询和访问控制的基因数据脱敏方法,具有如下优点:1)利用KNN技术实现密文环境下基因数据的相似性查询;2)利用多项式函数实现数据的权限分配以及查询过程中对用户的数据访问权限的可靠控制;3)利用编辑距离算法,参照公共基因序列获取原始基因数据的编辑操作集合;4)利用特定的哈希函数压缩数据,提高查询检索效率;5)在数据预处理、生成搜索指令阶段引入随机数,确保中间结果的机密性;6)利用集合伪随机排列混淆数据的分布方式,进一步提高数据的安全性;7)利用向量分裂、矩阵加密技术,实现搜索指令之间的无关联性;8)利用向量分裂、矩阵加密、超递增序列技术实现密文环境下的“与”、“非”逻辑查询。
附图说明
图1为本发明一种实现高效相似性查询和访问控制的基因数据脱敏方法的流程示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细说明。
本实施例提出一种在云环境中实现高效密文相似性查询和安全访问控制的基因数据脱敏方法,其流程如图1所示,具体包括以下步骤:
步骤1.系统初始化:系统生成公共的基因序列,数据拥有者生成用户访问数据的角色权限集合,生成用于特定哈希函数加密、集合伪随机排列以及矩阵安全内积运算所需的密钥;
系统初始化,具体包括以下步骤:
步骤1.1系统发布不包含任何敏感信息的公共基因序列ref,ref是编辑距离算法处理时所需的目标序列;
步骤1.4数据拥有者生成用于集合伪随机排列π混淆的密钥{sk1,sk2,...,skk},其中伪随机排列π仅改变集合中元素的顺序;
步骤1.5数据拥有者生成用于矩阵安全内积运算所需的加密密钥:
{{S1,S2,...,Sk},{M11,M12,...,M1k},{M21,M22,...,M2k}},
其中,{Sj}j=1,2,...,k是维度为1×(2s+ω+ψ+1)的分裂指示向量且仅包含0、1元素,{M1j}j=1,2,...,k和{M2j}j=1,2,...,k是维度为(2s+ω+ψ+1)×(2s+ω+ψ+1)的可逆矩阵,ψ为每个基因序列加入的随机数个数;
步骤1.6数据拥有者生成用于对称加密原始基因数据的密钥key;
步骤2数据预处理:数据拥有者对其拥有的全部基因序列进行分块处理;数据拥有者参照公共基因序列,利用编辑距离算法获取各分块基因序列的编辑操作集合;数据拥有者定义各基因序列的访问权限函数,并获取相应访问权限函数的系数;对于每个基因序列,数据拥有者任意选择ψ个正态分布的随机数,并连同访问权限函数的系数对相应基因序列的编辑操作集合进行维度扩增。数据预处理,具体包括以下步骤:
步骤2.1数据拥有者将其拥有的基因序列{A1,A2,...,AN}进行s分块处理,其中,s表示每个基因序列被分成的块数,即Ai=(Ai1,Ai2,...,Ais)=(Aim)m=1,2,...,s,其中i=1,2,...,N,m=1,2,...,s;
步骤2.2数据拥有者利用编辑距离算法以及公共基因序列ref获取每个已分块基因序列的编辑操作集合,即A′i=(A′i1,A′i2,...,A′is)=(A′im)m=1,2,...,s,其中A′im表示第i个基因序列的第m个分块在编辑距离算法以及ref的第m个分块的共同处理下得到的编辑操作集合;
步骤2.4数据拥有者为基因序列Ai选择ψ个随机数{γρ}ρ=1,2,...,ψ,其中γρ服从正态分布,并连同基因序列Ai访问权限函数的系数{βil}l=0,1,...,ω对A′i进行扩维处理,即其中表示A′i扩维后的向量,维度为1×(s+ω+ψ+1);
步骤3安全索引建立:数据拥有者使用特定哈希函数、伪随机排列、矩阵加密对扩维后的编辑操作集合中非函数系数、非随机数的元素进行k次循环加密、求和、混淆以及矩阵内积操作,最终每个基因序列对应k个安全索引;数据拥有者使用对称密码算法对原始基因数据进行加密处理,建立基因密文数据与安全索引之间的联系,并由数据拥有者将基因密文数据以及相应的安全索引上传至云服务器。安全索引建立,具体包括以下步骤:
步骤3.6数据拥有者使用对称密码算法加密原始基因序列{A1,A2,...,AN},获得密文基因数据即Enc表示对称密码算法的加密函数;数据拥有者建立每个密文基因数据与其安全索引之间的对应关系并将发送给云服务器;
步骤4生成搜索指令:用户将待检索基因序列进行分块处理,并利用编辑距离算法和公共基因序列获取待检索基因序列的编辑操作集合;用户使用数据拥有者授权的函数根值进行多次求幂运算并连同任意选择的ψ个随机数,对待检索基因序列的编辑操作集合进行扩维处理;用户使用特定哈希函数、伪随机排列、矩阵加密对扩维后的编辑操作集合中非函数根的幂值、非随机数的元素进行k次循环加密、求和、混淆以及矩阵内积操作,最终用户将生成的k个搜索指令发送给云服务器。生成搜索指令,具体包括以下步骤:
步骤4.1授权用户将待检索的基因序列Q进行s分块处理,基因序列别分成的块数,即Q=(Q1,Q2,...,Qs)=(Qm)m=1,2,...,s;授权用户利用编辑距离算法以及公共基因序列ref获取已分块基因序列Q的编辑操作集合,即Q'=(Q′1,Q'2,...,Q′s)=(Q'm)m=1,2,...,s,其中Q'm表示基因序列Q的第m个分块在编辑距离算法以及ref的第m个分块的共同处理下得到的编辑操作集合;
步骤4.2授权用户选择ψ个随机数{γ'ρ}ρ=1,2,...,ψ,并连同权限η对Q'进行扩维处理,即其中γ'ρ服从正态分布,η表示数据拥有者授予的角色权限,满足表示Q'扩维后的向量,维度为1×(s+ω+ψ+1);
步骤5查询处理:云服务器将k个搜索指令同每个基因序列的k个安全索引逐一进行内积运算并计算均值,最终云服务器将前n个大的均值所对应的基因密文返回给用户。查询处理,具体包括以下步骤:
步骤6数据解密:用户使用数据拥有者授权的解密密钥解密云服务器返回的密文数据,最终获取明文状态下的基因数据。数据解密,具体包括以下步骤:
以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换;所公开的所有特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以任何方式组合。
Claims (7)
1.一种实现高效相似性查询和访问控制的基因数据脱敏方法,包括以下步骤:
步骤1.系统初始化:系统生成公共的基因序列,数据拥有者生成用户访问数据的角色权限集合,生成用于特定哈希函数加密、集合伪随机排列以及矩阵安全内积运算所需的密钥;
步骤2.数据预处理:数据拥有者对其拥有的全部基因序列进行分块处理;数据拥有者参照公共基因序列,利用编辑距离算法获取各分块基因序列的编辑操作集合;数据拥有者定义各基因序列的访问权限函数,并获取相应访问权限函数的系数;对于每个基因序列,数据拥有者任意选择ψ个正态分布的随机数,并连同访问权限函数的系数对相应基因序列的编辑操作集合进行维度扩增;
步骤3.安全索引建立:数据拥有者使用特定哈希函数、伪随机排列、矩阵加密对扩维后的编辑操作集合中非函数系数、非随机数的元素进行k次循环加密、求和、混淆以及矩阵内积操作,最终每个基因序列对应k个安全索引;数据拥有者使用对称密码算法对原始基因数据进行加密处理,建立基因密文数据与安全索引之间的联系,并由数据拥有者将基因密文数据以及相应的安全索引上传至云服务器;
步骤4.生成搜索指令:用户将待检索基因序列进行分块处理,并利用编辑距离算法和公共基因序列获取待检索基因序列的编辑操作集合;用户使用数据拥有者授权的函数根值进行多次求幂运算并连同任意选择的ψ个随机数,对待检索基因序列的编辑操作集合进行扩维处理;用户使用特定哈希函数、伪随机排列、矩阵加密对扩维后的编辑操作集合中非函数根的幂值、非随机数的元素进行k次循环加密、求和、混淆以及矩阵内积操作,最终用户将生成的k个搜索指令发送给云服务器;
步骤5.查询处理:云服务器将k个搜索指令同每个基因序列的k个安全索引逐一进行内积运算并计算均值,最终云服务器将前n个大的均值所对应的基因密文返回给用户;
步骤6.数据解密:用户使用数据拥有者授权的解密密钥解密云服务器返回的密文数据,最终获取明文状态下的基因数据。
2.按权利要求1所述实现高效相似性查询和访问控制的基因数据脱敏方法,其特征在于,步骤1的具体过程为:
步骤1.1系统发布不包含任何敏感信息的公共基因序列ref;
步骤1.4数据拥有者生成用于集合伪随机排列π混淆的密钥{sk1,sk2,...,skk};
步骤1.5数据拥有者生成用于矩阵安全内积运算所需的加密密钥:
{{S1,S2,...,Sk},{M11,M12,...,M1k},{M21,M22,...,M2k}},
其中{Sj}j=1,2,...,k为分裂指示向量且仅包含0、1元素,{M1j}j=1,2,...,k和{M2j}j=1,2,...,k为可逆矩阵;
步骤1.6数据拥有者生成用于对称加密原始基因数据的密钥key。
3.按权利要求1所述实现高效相似性查询和访问控制的基因数据脱敏方法,其特征在于,步骤2的具体过程为:
步骤2.1数据拥有者将其拥有的基因序列{A1,A2,...,AN}进行s分块处理,其中s表示每个基因序列别分成的块数:Ai=(Ai1,Ai2,...,Ais)=(Aim)m=1,2,...,s,其中i=1,2,...,N,m=1,2,...,s;
步骤2.2数据拥有者利用编辑距离算法以及公共基因序列ref获取每个已分块基因序列的编辑操作集合,即A′i=(A′i1,A′i2,...,A′is)=(A′im)m=1,2,...,s,其中A′im表示第i个基因序列的第m个分块在编辑距离算法以及ref的第m个分块的共同处理下得到的编辑操作集合;
步骤2.4数据拥有者为每个基因序列Ai选择ψ个随机数{γρ}ρ=1,2,...,ψ,其中γρ服从正态分布,并连同基因序列Ai访问权限函数的系数{βil}l=0,1,...,ω对A′i进行扩维处理:
4.按权利要求1所述实现高效相似性查询和访问控制的基因数据脱敏方法,其特征在于,步骤3的具体过程为:
步骤3.6数据拥有者使用对称密码算法加密原始基因序列{A1,A2,...,AN},获得密文基因数据 Enc表示对称密码算法的加密函数;数据拥有者建立每个密文基因数据与其安全索引之间的对应关系并将发送给云服务器;
5.按权利要求1所述实现高效相似性查询和访问控制的基因数据脱敏方法,其特征在于,步骤4的具体过程为:
步骤4.1授权用户将待检索的基因序列Q进行s分块处理:Q=(Q1,Q2,...,Qs)=(Qm)m=1,2,...,s;授权用户利用编辑距离算法以及公共基因序列ref获取已分块基因序列Q的编辑操作集合:Q'=(Q′1,Q'2,...,Q′s)=(Q'm)m=1,2,...,s,其中Q'm表示基因序列Q的第m个分块在编辑距离算法以及ref的第m个分块的共同处理下得到的编辑操作集合;
步骤4.2授权用户选择ψ个随机数{γ'ρ}ρ=1,2,...,ψ,并连同权限η对Q'进行扩维处理:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910387357.2A CN110263570B (zh) | 2019-05-10 | 2019-05-10 | 一种实现高效相似性查询和访问控制的基因数据脱敏方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910387357.2A CN110263570B (zh) | 2019-05-10 | 2019-05-10 | 一种实现高效相似性查询和访问控制的基因数据脱敏方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110263570A CN110263570A (zh) | 2019-09-20 |
CN110263570B true CN110263570B (zh) | 2020-09-25 |
Family
ID=67914548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910387357.2A Active CN110263570B (zh) | 2019-05-10 | 2019-05-10 | 一种实现高效相似性查询和访问控制的基因数据脱敏方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263570B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110660450A (zh) * | 2019-09-23 | 2020-01-07 | 长沙学院 | 一种基于加密基因组数据的安全计数查询与完整性验证装置和方法 |
CN110957003B (zh) * | 2019-11-20 | 2023-05-26 | 河南师范大学 | 一种面向用户隐私保护的高效基因比对方法 |
CN112104609B (zh) * | 2020-08-20 | 2021-12-03 | 电子科技大学 | 在移动群智感知系统中可验证的、具有隐私意识的真值发现的方法 |
CN112052478A (zh) * | 2020-09-01 | 2020-12-08 | 上海观安信息技术股份有限公司 | 一种多表子集抽取脱敏方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102314580A (zh) * | 2011-09-20 | 2012-01-11 | 西安交通大学 | 一种基于向量和矩阵运算的支持计算的加密方法 |
CN104462582A (zh) * | 2014-12-30 | 2015-03-25 | 武汉大学 | 一种基于结构和内容二级过滤的Web数据相似性检测方法 |
US9015167B1 (en) * | 2014-01-27 | 2015-04-21 | Tipbit Inc. | User isolated indexes for determining the context and relevance of relationships |
CN105681280A (zh) * | 2015-12-29 | 2016-06-15 | 西安电子科技大学 | 一种云环境中基于中文的可搜索加密方法 |
CN106657059A (zh) * | 2016-12-21 | 2017-05-10 | 哈尔滨工业大学深圳研究生院 | 一种具有访问控制功能的数据库查询方法和系统 |
CN106776904A (zh) * | 2016-11-30 | 2017-05-31 | 中南大学 | 一种不可信云计算环境中支持动态验证的模糊查询加密方法 |
CN108062485A (zh) * | 2017-12-15 | 2018-05-22 | 北京工业大学 | 一种面向多服务器多用户的模糊关键字搜索方法 |
CN108345802A (zh) * | 2018-02-11 | 2018-07-31 | 西安电子科技大学 | 基于车联云系统的安全高效的密文检索方法、车载系统 |
CN108632385A (zh) * | 2018-05-15 | 2018-10-09 | 上海海事大学 | 基于时间序列的多叉树数据索引结构云存储隐私保护方法 |
CN108768951A (zh) * | 2018-05-03 | 2018-11-06 | 上海海事大学 | 一种云环境下保护文件隐私的数据加密和检索方法 |
CN108985094A (zh) * | 2018-06-28 | 2018-12-11 | 电子科技大学 | 云环境下实现密文空间数据的访问控制和范围查询方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107463848B (zh) * | 2017-07-18 | 2021-10-12 | 北京邮电大学 | 一种面向应用的密文搜索方法、装置、代理服务器和系统 |
-
2019
- 2019-05-10 CN CN201910387357.2A patent/CN110263570B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102314580A (zh) * | 2011-09-20 | 2012-01-11 | 西安交通大学 | 一种基于向量和矩阵运算的支持计算的加密方法 |
US9015167B1 (en) * | 2014-01-27 | 2015-04-21 | Tipbit Inc. | User isolated indexes for determining the context and relevance of relationships |
CN104462582A (zh) * | 2014-12-30 | 2015-03-25 | 武汉大学 | 一种基于结构和内容二级过滤的Web数据相似性检测方法 |
CN105681280A (zh) * | 2015-12-29 | 2016-06-15 | 西安电子科技大学 | 一种云环境中基于中文的可搜索加密方法 |
CN106776904A (zh) * | 2016-11-30 | 2017-05-31 | 中南大学 | 一种不可信云计算环境中支持动态验证的模糊查询加密方法 |
CN106657059A (zh) * | 2016-12-21 | 2017-05-10 | 哈尔滨工业大学深圳研究生院 | 一种具有访问控制功能的数据库查询方法和系统 |
CN108062485A (zh) * | 2017-12-15 | 2018-05-22 | 北京工业大学 | 一种面向多服务器多用户的模糊关键字搜索方法 |
CN108345802A (zh) * | 2018-02-11 | 2018-07-31 | 西安电子科技大学 | 基于车联云系统的安全高效的密文检索方法、车载系统 |
CN108768951A (zh) * | 2018-05-03 | 2018-11-06 | 上海海事大学 | 一种云环境下保护文件隐私的数据加密和检索方法 |
CN108632385A (zh) * | 2018-05-15 | 2018-10-09 | 上海海事大学 | 基于时间序列的多叉树数据索引结构云存储隐私保护方法 |
CN108985094A (zh) * | 2018-06-28 | 2018-12-11 | 电子科技大学 | 云环境下实现密文空间数据的访问控制和范围查询方法 |
Non-Patent Citations (6)
Title |
---|
《一种云环境中密文数据的模糊多关键词检索方案》;何亨等;《计算机科学》;20170531;第44卷(第5期);第146-152页 * |
《一种全同态加密的安全内积计算方案》;邓江等;《电子科技大学学报》;20160930;第45卷(第5期);第808-811页 * |
《云环境下支持访问控制的高效密文查询技术研究》;张荑;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20170515;第2017年卷(第5期);第I138-38页 * |
《云计算环境下密文搜索算法的研究》;项菲等;《通信学报》;20130731;第34卷(第7期);第143-153页 * |
《具有访问控制功能的密文查询方案设计与实现》;黄家俊;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20190115;第2019年卷(第1期);第I138-168页 * |
《面向云端加密数据的多关键字模糊检索策略》;胡胜平;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20170515;第2017年卷(第5期);第I138-84页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110263570A (zh) | 2019-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263570B (zh) | 一种实现高效相似性查询和访问控制的基因数据脱敏方法 | |
EP3058678B1 (en) | System and method for dynamic, non-interactive, and parallelizable searchable symmetric encryption | |
CN107317666B (zh) | 一种支持浮点运算的并行全同态加解密方法 | |
JP6180177B2 (ja) | プライバシーを保護することができる暗号化データの問い合わせ方法及びシステム | |
CN104363215B (zh) | 一种基于属性的加密方法和系统 | |
JP6144992B2 (ja) | 検索可能暗号処理システム及び方法 | |
CN108959567B (zh) | 一种云环境下适用于大规模图像的安全检索方法 | |
CN109361644B (zh) | 一种支持快速搜索和解密的模糊属性基加密方法 | |
WO2024077948A1 (zh) | 匿踪查询方法、装置和系统及存储介质 | |
CN107135062A (zh) | 一种改进的大文件的加密方法 | |
CN108400970A (zh) | 云环境中相似数据消息锁定加密去重方法、云存储系统 | |
WO2012081450A1 (ja) | 暗号化データベース管理システム、クライアントおよびサーバ、自然結合方法およびプログラム | |
CN109688143A (zh) | 一种面向云环境中隐私保护的聚类数据挖掘方法 | |
CN106936820A (zh) | 数据变长修改方法及其在大数据加密中的应用 | |
WO2017033843A1 (ja) | 検索可能暗号処理システム | |
CN110768797A (zh) | 一种基于身份格式保留加密的数据脱敏方法 | |
CN113098675B (zh) | 基于多项式完全同态的二进制数据加密系统及方法 | |
Randall et al. | Privacy preserving record linkage using homomorphic encryption | |
JP2021534443A (ja) | データをセキュアにするための方法およびシステム | |
Muthumari et al. | High Security for De-Duplicated Big Data Using Optimal SIMON Cipher. | |
Verma | Secure client-side deduplication scheme for cloud with dual trusted execution environment | |
CN112528309A (zh) | 一种数据存储加密和解密的方法及其装置 | |
CN108920968B (zh) | 一种基于连接关键词的文件可搜索加密方法 | |
Salman et al. | A homomorphic cloud framework for big data analytics based on elliptic curve cryptography | |
CN116070276A (zh) | 基于同态加密与Simhash的密文查重与存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |