CN112948848A - 一种基于改进knn的时空数据范围查询方法 - Google Patents
一种基于改进knn的时空数据范围查询方法 Download PDFInfo
- Publication number
- CN112948848A CN112948848A CN202110162659.7A CN202110162659A CN112948848A CN 112948848 A CN112948848 A CN 112948848A CN 202110162659 A CN202110162659 A CN 202110162659A CN 112948848 A CN112948848 A CN 112948848A
- Authority
- CN
- China
- Prior art keywords
- data
- cloud server
- user
- index
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于改进knn的时空数据范围查询方法,克服了现有技术的加密算法难以应用与大数据场景的问题,数据拥有者先利用私钥把初始的空间数据加密,生成与之相关的索引,然后将索引向量化,并将索引和密文数据发送给云服务器,最后将密钥发送给用户。当用户想要检索数据时,首先利用多项式拟合技术,将陷门向量化然后发送至云服务器,其次通过内积的计算方式,将查询结果与索引进行匹配,最后将符合条件的密文数据返还给搜索用户。本发明利用改进的knn算法,因此在一定程度上增强数据的安全性,从而防止信息的泄露。
Description
技术领域
本发明涉及信息安全技术领域,尤其是涉及一种基于改进knn的时空数据范围查询方法。
背景技术
随着大数据时代的到来,数字信息呈指数式增长,在给人们带来便利的同时,也提高了储存开销和计算开销。考虑到云服务器的海量储存和低成本的优点,更多的个人或企业将自身的数据外包给云服务器。然而,外包数据存在广泛的隐私问题:云服务器可能会利用其强大的计算优势窃取用户的敏感信息,或者数据信息可能被泄露给第三方。因此把数据外包给云服务器前,要对初始数据进行加密。但是这会对数据查询以及检索带来巨大挑战,从而使数据的可用性降低。
为了解决这一难题,一系列的关于范围查询以及检索的方案被相继提出。Xue等人提出了一种安全数据库的双云模型,该模型可以支持各种与数字相关的范围查询。但是,该方案的缺陷是不能支持多维数据的任意图形范围查询。然后,Wang等人设计了一种几何距离搜索方案,此方案利用布朗过滤器生成搜索陷门,并验证一个点是否在几何范围内,从而实现了对加密数据下任意几何的距离搜索。但是,随着搜索范围的增加,它需要一个较大量级的的布朗过滤器来加载所有可能匹配的数据。随后,Wang等人提出了一个几何范围查询方案(Fast Geo),进一步提高了查询过程的效率。但是,随着搜索范围的扩大,它还需要遍历整个查询过程中可能被搜索的数据,从而导致计算和存储开销过大。Guowen Xu等人在其发表的论文“EFRS:Enabling efficient andfine-grained range search on encryptedspatial data”(in Proc.IEEE ICC,May 2018,pp.1–6)中提出了一种传统的基于安全的k-nearest neighbor(knn)算法来实现空间数据的查询,但是由于传统的安全的knn算法在其计算的结果上缺乏随机性,导致原有的APSE方案的无法抵御已知明文攻击。另外,保序加密技术也可以实现数据的范围查询,但是加密算法的复杂性和其固有的安全风险,难以应用于大数据场景。
发明内容
本发明是为了克服现有技术的加密算法难以应用与大数据场景的问题,提供一种基于改进knn的时空数据范围查询方法,本发明能够增强数据的安全性,从而在实际应用中防止信息泄露。
为了实现上述目的,本发明采用以下技术方案:
一种基于改进knn的时空数据范围查询方法,包括以下步骤:
S1、初始化;
S2、索引建立;
S3、陷门生成;
S4、查询。
在本发明中,数据拥有者先利用私钥把初始的空间数据加密,生成与之相关的索引,然后将索引向量化,并将索引和密文数据发送给云服务器,最后将密钥发送给用户。当用户想要检索数据时,首先利用多项式拟合技术,将陷门向量化然后发送至云服务器,其次通过内积的计算方式,将查询结果与索引进行匹配,最后将符合条件的密文数据返还给搜索用户。在索引向量化和陷门向量化的过程中,本方案利用改进的knn算法,因此在一定程度上增强数据的安全性,从而防止信息的泄露。
作为优选,S1内容包括:数据拥有者首先利用和sk1和sk2分别来加密初始空间数据和矩形的搜索范围,然后生成分裂明文向量的二进制向量S,同时随机选取两个M1,M2可逆矩阵,其维数与向量S一样,用来加密分裂后的向量;最后数据拥有者将密钥通过安全通道发送给用户;
其中,sk1用来加密原始的空间数据,sk2用来加密矩形的搜索范围。
作为优选,S2内容包括:数据拥有者首先将初始的空间数据加密且将它转换成向量形式记为U1,其次用一个随机的正数乘以U1且对它进行维数扩充生成U2,再次用伪随机置换函数作用在U2得到U3,然后将U3随机分裂成两个随机向量{U4,U5},最后将{U4,U5}用矩阵加密并发送给云服务器。
作为优选,S3内容包括:用户首先通过多项式拟合技术得到拟合曲线的参数,将它们转化为向量形式记为V1,其次用一个随机的正数乘以V1且对它进行维数扩充生成V2,再次用伪随机置换函数作用在V2得到V3,然后将V3随机分裂成两个随机向量{V4,V5},最后将{V4,V5}发送给云服务器。
作为优选,S4内容包括:服务器在接收到用户发送的搜索请求陷门,会遍历整个R-树,在内积计算下,得到结果,判断结果是否在闭型曲线内,如果是则返还相关密文数据。
作为优选,S1具体步骤为:数据拥有者随机产生密钥Ψ=(sk1,sk2,S,M1,M2),sk1用来加密原始的空间数据,sk2用来加密矩形的搜索范围.(N+2+n)的二进制向量S是用来分裂明文向量的,M1,M2是(N+2+n)维的可逆矩阵,用来加密分割后的向量,密钥Ψ生成后,数据拥有者将通过安全通道发送给用户。
作为优选,S2具体步骤为:首先,为了保证数据的隐私性,数据拥有者用sk1进行加密;
其中是与下一部分的陷门生成有关的向量,且每个ui是随机生成的正数,在伪随机置换函数π(·)的作用下,在S的作用下,分裂成两个随机向量当S[j]=0,(j=0,1,2,…,N+2+n),有否则最后,把加密后的索引发送给云服务器。
作为优选,S3具体步骤为:在二维平面上给定一条闭合曲线,把此曲线分别分成上下两部分,记为C1(x)和C2(x);
取一个随机的正数β≤1×10-a(a∈{1,2,3,…}),乘以Bi且扩充到(N+2+n)维得到:
作为优选,S4具体步骤为:云服务器在接收到陷门后,遍历R-树,得到查询结果,在此过程中,需要对陷门和索引进行计算,具体计算如下式所示:
考虑R'i≤0,R”i≥0,因为α,β都是大于的数,故只需考虑B1(xi)-yi与B2(xi)-yi与0的大小关系,
当B1(xi)-yi≤0,B2(xi)-yi≥0时,说明(xi,yi)在闭型曲线中,然后云服务器把该点的相关数据返还给用户。
作为优选,所述方法采用系统模型,系统模型设计三个主要实体,包括数据拥有者、云服务器和用户;其中:
数据拥有者:数据拥有者将初始数据加密,通过生成与初始数据相关的索引来提高搜索效率,最后将加密后的数据和索引发送给云服务器,同时通过安全通道将密钥发送给用户;
云服务器:它的主要职能是储存数据拥有者上传的数据以及处理用户的搜索请求并返还相关数据;
用户:用户将自己的搜索请求生成的陷门发送给云服务器,云服务器对此陷门进行查询,并与索引进行匹配,然后把查询结果返还给用户。
因此,本发明具有如下有益效果:
1.数据拥有者先利用私钥把初始的空间数据加密,生成与之相关的索引,然后将索引向量化,并将索引和密文数据发送给云服务器,最后将密钥发送给用户。当用户想要检索数据时,首先利用多项式拟合技术,将陷门向量化然后发送至云服务器,其次通过内积的计算方式,将查询结果与索引进行匹配,最后将符合条件的密文数据返还给搜索用户。在索引向量化和陷门向量化的过程中,本方案利用改进的knn算法,因此在一定程度上增强数据的安全性,从而防止信息的泄露;
3.本发明引入多项式拟合技术和R-树技术,可以实现对加密云数据的高效、高精度范围查询,就可以实现对任意闭合曲线的距离搜索;
4.本发明适用于二维数据及多维数据。
附图说明
图1是本实施例的系统模型图。
图2是本实施例的多项式拟合曲线图。
具体实施方式
下面结合附图与具体实施方式对本发明做进一步的描述。
实施例1:
本实施例提供了一种基于改进knn的时空数据范围查询方法,采用在本方案的系统模型里,涉及到三个主要实体,它们分别是数据拥有者,云服务器和用户。
数据拥有者:数据拥有者将初始数据加密,通过生成与初始数据相关的索引来提高搜索效率,最后将加密后的数据和索引发送给云服务器,同时通过安全通道将密钥发送给用户。
云服务器:它的主要职能是储存数据拥有者上传的数据以及处理用户的搜索请求并返还相关数据。
用户:用户将自己的搜索请求(生成的陷门)发送给云服务器,云服务器对此陷门进行查询,并与索引进行匹配,然后把查询结果返还给用户。
本方法包括以下步骤:
S1、初始化:
数据拥有者首先利用和sk1和sk2分别来加密初始空间数据和矩形的搜索范围,然后生成分裂明文向量的二进制向量S,同时随机选取两个M1,M2可逆矩阵,其维数与向量S一样,用来加密分裂后的向量;最后数据拥有者将密钥通过安全通道发送给用户;
其中,sk1用来加密原始的空间数据,sk2用来加密矩形的搜索范围。
S2、索引建立:数据拥有者首先将初始的空间数据加密且将它转换成向量形式记为U1,其次用一个随机的正数乘以U1且对它进行维数扩充生成U2,再次用伪随机置换函数作用在U2得到U3,然后将U3随机分裂成两个随机向量{U4,U5},最后将{U4,U5}用矩阵加密并发送给云服务器。
S3、陷门生成:数据拥有者首先将初始的空间数据加密且将它转换成向量形式记为U1,其次用一个随机的正数乘以U1且对它进行维数扩充生成U2,再次用伪随机置换函数作用在U2得到U3,然后将U3随机分裂成两个随机向量{U4,U5},最后将{U4,U5}用矩阵加密并发送给云服务器。
S4、查询:服务器在接收到用户发送的搜索请求陷门,会遍历整个R-树,在内积计算下,得到结果,判断结果是否在闭型曲线内,如果是则返还相关密文数据。
实施例2:
本实施例提供了一种基于改进knn的时空数据范围查询方法,如图1、2所示,包括以下步骤:S1、初始化:数据拥有者随机产生密钥Ψ=(sk1,sk2,S,M1,M2),sk1用来加密原始的空间数据,sk2用来加密矩形的搜索范围.(N+2+n)的二进制向量S是用来分裂明文向量的,M1,M2是(N+2+n)维的可逆矩阵,用来加密分割后的向量,密钥Ψ生成后,数据拥有者将通过安全通道发送给用户。
S2、索引建立:首先,为了保证数据的隐私性,数据拥有者用sk1进行加密;
其中是与下一部分的陷门生成有关的向量,且每个ui是随机生成的正数,在伪随机置换函数π(·)的作用下,在S的作用下,分裂成两个随机向量当S[j]=0,(j=0,1,2,…,N+2+n),有否则最后,把加密后的索引发送给云服务器。
S3、陷门生成:在二维平面上给定一条闭合曲线,把此曲线分别分成上下两部分,记为C1(x)和C2(x);
得到拟合后的多项式后,再把它们转化为向量模式,记为
取一个随机的正数β≤1×10-a(a∈{1,2,3,…}),乘以Bi且扩充到(N+2+n)维得到:
S4、查询:云服务器在接收到陷门后,遍历R-树,得到查询结果,
在此过程中,需要对陷门和索引进行计算,具体计算如下式所示:
考虑R'i≤0,R”i≥0,因为α,β都是大于的数,故只需考虑B1(xi)-yi与B2(xi)-yi与0的大小关系,
当B1(xi)-yi≤0,B2(xi)-yi≥0时,说明(xi,yi)在闭型曲线中,然后云服务器把该点的相关数据返还给用户。
上述实施例对本发明的具体描述,只用于对本发明进行进一步说明,不能理解为对本发明保护范围的限定,本领域的技术工程师根据上述发明的内容对本发明作出一些非本质的改进和调整均落入本发明的保护范围内。
Claims (10)
1.一种基于改进knn的时空数据范围查询方法,其特征是,包括以下步骤:
S1、初始化;
S2、索引建立;
S3、陷门生成;
S4、查询。
2.根据权利要求1所述的一种基于改进knn的时空数据范围查询方法,其特征是,S1内容包括:数据拥有者首先利用和sk1和sk2分别来加密初始空间数据和矩形的搜索范围,然后生成分裂明文向量的二进制向量S,同时随机选取两个M1,M2可逆矩阵,其维数与向量S一样,用来加密分裂后的向量;最后数据拥有者将密钥通过安全通道发送给用户;
其中,sk1用来加密原始的空间数据,sk2用来加密矩形的搜索范围。
3.根据权利要求1所述的一种基于改进knn的时空数据范围查询方法,其特征是,S2内容包括:数据拥有者首先将初始的空间数据加密且将它转换成向量形式记为U1,其次用一个随机的正数乘以U1且对它进行维数扩充生成U2,再次用伪随机置换函数作用在U2得到U3,然后将U3随机分裂成两个随机向量{U4,U5},最后将{U4,U5}用矩阵加密并发送给云服务器。
4.根据权利要求1所述的一种基于改进knn的时空数据范围查询方法,其特征是,S3内容包括:用户首先通过多项式拟合技术得到拟合曲线的参数,将它们转化为向量形式记为V1,其次用一个随机的正数乘以V1且对它进行维数扩充生成V2,再次用伪随机置换函数作用在V2得到V3,然后将V3随机分裂成两个随机向量{V4,V5},最后将{V4,V5}发送给云服务器。
5.根据权利要求1所述的一种基于改进knn的时空数据范围查询方法,其特征是,S4内容包括:服务器在接收到用户发送的搜索请求陷门,会遍历整个R-树,在内积计算下,得到结果,判断结果是否在闭型曲线内,如果是则返还相关密文数据。
6.根据权利要求2所述的一种基于改进knn的时空数据范围查询方法,其特征是,S1具体步骤为:数据拥有者随机产生密钥Ψ=(sk1,sk2,S,M1,M2),sk1用来加密原始的空间数据,sk2用来加密矩形的搜索范围.(N+2+n)的二进制向量S是用来分裂明文向量的,M1,M2是(N+2+n)维的可逆矩阵,用来加密分割后的向量,密钥Ψ生成后,数据拥有者将通过安全通道发送给用户。
8.根据权利要求4所述的一种基于改进knn的时空数据范围查询方法,其特征是,S3具体步骤为:在二维平面上给定一条闭合曲线,把此曲线分别分成上下两部分,记为C1(x)和C2(x);然后在两条曲线上随机共选取20个等距的点,然后进行多项式拟合,得到:
得到拟合后的多项式后,再把它们转化为向量模式,记为
取一个随机的正数β≤1×10-a(a∈{1,2,3,…}),乘以Bi且扩充到(N+2+n)维得到:
10.根据权利要求1所述的一种基于改进knn的时空数据范围查询方法,其特征是,所述方法采用系统模型,系统模型设计三个主要实体,包括数据拥有者、云服务器和用户;其中:
数据拥有者:数据拥有者将初始数据加密,通过生成与初始数据相关的索引来提高搜索效率,最后将加密后的数据和索引发送给云服务器,同时通过安全通道将密钥发送给用户;
云服务器:它的主要职能是储存数据拥有者上传的数据以及处理用户的搜索请求并返还相关数据;
用户:用户将自己的搜索请求生成的陷门发送给云服务器,云服务器对此陷门进行查询,并与索引进行匹配,然后把查询结果返还给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110162659.7A CN112948848A (zh) | 2021-02-05 | 2021-02-05 | 一种基于改进knn的时空数据范围查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110162659.7A CN112948848A (zh) | 2021-02-05 | 2021-02-05 | 一种基于改进knn的时空数据范围查询方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112948848A true CN112948848A (zh) | 2021-06-11 |
Family
ID=76242698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110162659.7A Pending CN112948848A (zh) | 2021-02-05 | 2021-02-05 | 一种基于改进knn的时空数据范围查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112948848A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114124371A (zh) * | 2021-10-27 | 2022-03-01 | 杭州师范大学 | 一种基于无证书的满足mtp安全的公钥可搜索加密方法 |
CN114417068A (zh) * | 2022-01-20 | 2022-04-29 | 三未信安科技股份有限公司 | 一种具有隐私性保护的大规模图数据匹配方法 |
WO2023065477A1 (zh) * | 2021-10-18 | 2023-04-27 | 深圳前海微众银行股份有限公司 | 一种空间文本的查询方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985094A (zh) * | 2018-06-28 | 2018-12-11 | 电子科技大学 | 云环境下实现密文空间数据的访问控制和范围查询方法 |
-
2021
- 2021-02-05 CN CN202110162659.7A patent/CN112948848A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985094A (zh) * | 2018-06-28 | 2018-12-11 | 电子科技大学 | 云环境下实现密文空间数据的访问控制和范围查询方法 |
Non-Patent Citations (1)
Title |
---|
罗玉川: "位置服务中的安全查询和匹配机制研究", 中国博士学位论文全文数据库 信息科技辑, no. 2021, pages 23 - 43 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023065477A1 (zh) * | 2021-10-18 | 2023-04-27 | 深圳前海微众银行股份有限公司 | 一种空间文本的查询方法及装置 |
CN114124371A (zh) * | 2021-10-27 | 2022-03-01 | 杭州师范大学 | 一种基于无证书的满足mtp安全的公钥可搜索加密方法 |
CN114417068A (zh) * | 2022-01-20 | 2022-04-29 | 三未信安科技股份有限公司 | 一种具有隐私性保护的大规模图数据匹配方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108494768B (zh) | 一种支持访问控制的密文搜索方法及系统 | |
US11567950B2 (en) | System and method for confidentiality-preserving rank-ordered search | |
CN109543061B (zh) | 一种支持多密钥的加密图像检索方法 | |
CN112948848A (zh) | 一种基于改进knn的时空数据范围查询方法 | |
CN112270006A (zh) | 电商平台中隐藏搜索模式和访问模式的可搜索加密方法 | |
JP6180177B2 (ja) | プライバシーを保護することができる暗号化データの問い合わせ方法及びシステム | |
CN109471964B (zh) | 一种基于同义词集的模糊多关键词可搜索加密方法 | |
CN105681280A (zh) | 一种云环境中基于中文的可搜索加密方法 | |
CN106934301B (zh) | 一种支持密文数据操作的关系型数据库安全外包数据处理方法 | |
CN111339539B (zh) | 一种多用户环境下的高效加密图像检索方法 | |
US20090138698A1 (en) | Method of searching encrypted data using inner product operation and terminal and server therefor | |
CN107547530A (zh) | 移动云环境下基于属性的在线/离线关键字搜索方法及其云计算应用系统 | |
CN113037753B (zh) | 一种基于区块链的具有隐私保护性的加密数据共享方法 | |
CN111859421B (zh) | 一种基于词向量的多关键字密文存储、检索方法及系统 | |
CN115309928A (zh) | 可隐藏数据访问的图像加密检索方法、装置及介质 | |
CN107766739B (zh) | 面向加密文本数据的短语检索方法及其装置 | |
CN116522019A (zh) | 一种前向安全的时空数据检索方法、系统、设备及介质 | |
Wang et al. | An efficient and privacy-preserving range query over encrypted cloud data | |
Li et al. | A secure index resisting keyword privacy leakage from access and search patterns in searchable encryption | |
CN108011713B (zh) | 一种云存储中基于同态加密的密文检索方法 | |
Liu et al. | Multi-user image retrieval with suppression of search pattern leakage | |
CN113221140A (zh) | 一种基于访问控制的密文时空数据查询方法 | |
CN109582818B (zh) | 一种基于可搜索加密的曲库云检索方法 | |
CN115102733B (zh) | 一种高效打包的图像加密检索方法 | |
CN114996722B (zh) | 一种适用于边缘环境的多源图像安全检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |