CN115391642B - 一种基于秘密共享的隐私查询方法及系统 - Google Patents
一种基于秘密共享的隐私查询方法及系统 Download PDFInfo
- Publication number
- CN115391642B CN115391642B CN202210899054.0A CN202210899054A CN115391642B CN 115391642 B CN115391642 B CN 115391642B CN 202210899054 A CN202210899054 A CN 202210899054A CN 115391642 B CN115391642 B CN 115391642B
- Authority
- CN
- China
- Prior art keywords
- query
- hash
- result
- key
- inquiry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000006870 function Effects 0.000 claims abstract description 49
- 238000004140 cleaning Methods 0.000 claims abstract description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 2
- 238000013506 data mapping Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 11
- 230000035945 sensitivity Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于秘密共享的隐私查询方法,包括:步骤S1,构造对应哈希函数簇,哈希函数簇包含L个哈希函数;步骤S2,服务端构建数据映射;步骤S3,清理哈希表;步骤S4,查询端向任一服务端发起获取哈希函数的请求,服务端将L个哈希函数发送至查询端;步骤S5,查询端根据查询特征构建查询键;步骤S6,查询端基于查询键构建两个密钥键k0、k1;步骤S7,查询端将两个密钥键k0、k1分别发送至两个服务端;步骤S8,服务端对密钥键进行计算处理并将结果值发送回查询端;步骤S9,查询端接收所述步骤S8中由两个服务端发送来的结果值,将两个将两个结果值相加后得到目标结果。本发明在不暴露具体特征信息的前提下实现了搜索查询。
Description
技术领域
本发明涉及信息搜索查询方法,油气涉及一种基于秘密共享的隐私查询方法及系统。
背景技术
现有技术中,搜索用户相似对象是互联网常用的一种搜索技术,基于用户、商品或者其他类目的特征,搜索近似的、相关的其他信息,频繁用于社交网络、电商购物、影音娱乐等领域。随着互联网、大数据领域和人工智能领域的发展,越来越多实体特征被挖掘出来,企业可以采用更加精细的模型来计算各种实体的数字化特征,而更详尽的特征可以让搜索算法的结果精确度更高,为用户带来更好的个性化推荐服务。然而当今互联网采用搜索技术基本都是基于明文的数据特征来进行,这样带来了非常大的隐私安全隐患。
对于用户自身而言,自身的数字化特征随着数字化融入生活而带来的大量个人数据的产生,已经达到一个非常精确的地步,甚至在量化的特征中可能已经包含个人的DNA信息融入其中,这个信息如果在互联网中随意传递,对个人来说是非常危险的,是个人隐私的极大泄漏。
此外,企业间的搜索(例如不同类型的企业,社交公司和电商公司)如果将自身产品的特征暴露给其他企业也是非常不安全的,如果第三方企业存在恶意企图,很容易通过明文的产品特征拟合出实际的产品信息,造成商业机密的泄漏。
发明内容
本发明要解决的技术问题在于,针对现有技术的不足,提供一种结合秘密共享技术、多重局部哈希敏感技术、分布式点函数等多种手段,在不暴露具体特征信息的前提下实现搜索查询的隐私查询方法及系统。
为解决上述技术问题,本发明采用如下技术方案。
一种基于秘密共享的隐私查询方法,该方法基于查询端和两个服务端实现,两个服务端预设有相同的哈希函数与数据,所述方法包括有如下步骤:步骤S1,服务端构建用于映射原始特征到低纬空间的局部敏感哈希函数簇,哈希函数簇包含L个哈希函数;步骤S2,服务端针对其预设数据集中的每一个元素,将所述步骤S1中的每个哈希函数应用于元素的特征信息中,得到对应的哈希编码,构建以哈希编码为键的L个哈希表;步骤S3,对所述步骤S2中哈希表值大于1的元素进行清理,只留下一个元素;步骤S4,查询端向任一服务端发起获取哈希函数的请求,服务端将L个哈希函数发送至查询端;步骤S5,查询端接收所述步骤S4中由服务端提供的L个哈希函数,应用每个哈希函数到查询特征中,得到查询键;步骤S6,查询端基于查询键构建两个密钥键k0、k1;步骤S7,查询端将两个密钥键k0、k1分别发送至两个服务端;步骤S8,服务端对接收到的密钥键进行计算处理,并将结果值发送回查询端;步骤S9,查询端接收所述步骤S8中由两个服务端发送来的结果值,将两个将两个结果值相加后得到目标结果。
优选地,所述步骤S1中,根据局部敏感哈希的定义(R,cR,P1,P2)敏感,对于任意查询序列p和q,如果两者距离小于等于R,则两者哈希碰撞概率至少为P1,如果两者距离大于等于cR,则两者的哈希碰撞概率至多为P2。
优选地,所述步骤S2中,构建多个以元素特征哈希编码为键,元素ID为值的哈希表。
优选地,所述步骤S5中,将得到的查询键向外扩充,将与目标查询键相邻的若干查询键一起作为查询条件。
优选地,所述步骤S6中,通过两个密钥k0,k1和函数Eval来表示函数P查询键,1(x′),具体表示为:
服务端根据接收到的k0或k1进行如下运算:
D·Eval(k,x′);
并将运算结果返回给查询端,其中,D表示查询键对应的哈希桶里的数据值;
优选地,所述步骤S8中,服务端进行的计算处理过程包括:设定查询键是α,计算D·Eval(k,α)的值,将所有结果值累加,设定服务端共有N个数据,i表示第i个数据,则服务端运算结果表示为将该运算结果发送至查询端。
优选地,所述步骤S9包括如下过程:查询端接收由两个服务端发送来的运算结果,由于查询端发送给两个服务端的k值不同,所以从服务端1得到的结果为从服务端2得到的结果为将两个结果相加得到再对该结果进行乘法的结合律得到根据所述步骤S6,仅当αi是查询端目标键时,Eval(k0,αi)+Eval(k1,αi)结果为1,乘以D后得到结果数据;当αi不是目标键时,Eval(k0,αi)+Eval(k1,αi)结果为0,最终累加结果数据D即为目标结果。
一种基于秘密共享的隐私查询系统,其包括有查询端和两个服务端实现,所述系统用于实现上述方法。
本发明公开的基于秘密共享的隐私查询方法及系统中,查询端指持有私有特征信息,目标是搜索数据端与特征信息相似的项目,服务端作为数据拥有者,用于响应查询端发起的查询请求,本发明中的两个服务端拥有一致的数据集,查询端与服务端各自持有的特征信息是指一定维度的浮点数向量,查询端与服务端通过网络链接,该网络可以是有线网络或无线网络。基于上述架构,本发明结合秘密共享技术、多重局部哈希敏感技术、分布式点函数等,通过执行步骤S1至步骤S9,实现了在不暴露具体特征信息前提下的信息查询、搜索,同时限制搜索结果仅为单一近似结果,不暴露数据方额外的数据信息,进而实现隐私搜索。
附图说明
图1为本发明基于秘密共享的隐私查询方法流程图一;
图2为本发明基于秘密共享的隐私查询方法流程图二。
具体实施方式
下面结合附图和实施例对本发明作更加详细的描述。
本发明公开了一种基于秘密共享的隐私查询方法,结合图1和图2所示,该方法基于查询端和两个服务端实现,两个服务端预设有相同的哈希函数与数据,所述方法包括有如下步骤:
步骤S1,服务端构建用于映射原始特征到低纬空间的局部敏感哈希函数簇,哈希函数簇包含L个哈希函数;
步骤S2,服务端针对其预设数据集中的每一个元素,将所述步骤S1中的每个哈希函数应用于元素的特征信息中,得到对应的哈希编码,构建以哈希编码为键的L个哈希表;
步骤S3,对所述步骤S2中哈希表值大于1的元素进行清理,只留下一个元素;
步骤S4,查询端向任一服务端发起获取哈希函数的请求,服务端将L个哈希函数发送至查询端;
步骤S5,查询端接收所述步骤S4中由服务端提供的L个哈希函数,应用每个哈希函数到查询特征中,得到查询键;
步骤S6,查询端基于查询键构建两个密钥键k0、k1;
步骤S7,查询端将两个密钥键k0、k1分别发送至两个服务端;
步骤S8,服务端对接收到的密钥键进行计算处理,并将结果值发送回查询端;
步骤S9,查询端接收所述步骤S8中由两个服务端发送来的结果值,将两个将两个结果值相加后得到目标结果。
上述方法中,查询端指持有私有特征信息,目标是搜索数据端与特征信息相似的项目,服务端作为数据拥有者,用于响应查询端发起的查询请求,本发明中的两个服务端拥有一致的数据集,查询端与服务端各自持有的特征信息是指一定维度的浮点数向量,查询端与服务端通过网络链接,该网络可以是有线网络或无线网络。基于上述架构,本发明结合秘密共享技术、多重局部哈希敏感技术、分布式点函数等,通过执行步骤S1至步骤S9,实现了在不暴露具体特征信息前提下的信息查询、搜索,同时限制搜索结果仅为单一近似结果,不暴露数据方额外的数据信息,进而实现隐私搜索。
进一步地,在本发明的所述步骤S1中,根据局部敏感哈希的定义(R,cR,P1,P2)敏感,对于任意查询序列p和q,如果两者距离小于等于R,则两者哈希碰撞概率至少为P1,如果两者距离大于等于cR,则两者的哈希碰撞概率至多为P2。具体地,在非隐私的搜索场景下,由于哈希碰撞得到的是一个概率结果,在计算得出的碰撞结果后还需要计算其真实距离,以避免假阳性的情况(具体是指发生了哈希碰撞但两个特征之间实际距离很远的情况)。在隐私场景下,因没有办法去进行实际的距离计算,所以需要调整参数,确保假阳性的概率很低,确保发生哈希碰撞时,两个特征之间距离大于cR的概率非常小。
作为一种优选方式,所述步骤S2中,构建多个以元素特征哈希编码为键,元素ID为值的哈希表。具体地,服务端对数据集中每一个元素,将步骤S1中的每个哈希函数应用于元素的特征信息中,得到对应的哈希编码,构建以哈希编码为键的哈希表,哈希表的值是一个列表,存放哈希编码相同的元素ID。有L个哈希簇(此处的多个哈希函数是因为需要重复多次映射来提高碰撞率),此时一共构建了L个哈希表。
关于本实施例的所述步骤S3:其执行的功能为清理哈希表。该步骤对步骤S2中的哈希表值的元素大于1的进行清理,只留下一个元素。根据步骤S1中提到的条件设置,当出现哈希碰撞时,已经存在非常大概率是查询条件的结果,所以这里没有必要在同一个哈希桶中存多个元素,而且存多个元素会影响后续的隐私查询。
本实施的所述步骤S5中,将得到的查询键向外扩充,将与目标查询键相邻的若干查询键一起作为查询条件。具体地,该步骤针对步骤S4中服务端提供的L个哈希函数,应用每个哈希函数到查询特征中,得到的结果就是查询的哈希键,为了提高碰撞几率,还需要将哈希键往周围扩充,根据局部敏感哈希的定义,原空间跟哈希后的空间在一定程度上保持了原有空间的位置关系,基于这一点,我们将得到的哈希键往外扩充,得到跟目标哈希键相邻的若干哈希键一起作为查询条件。举例说明:假设有一个哈希键010,那么扩充是指将相邻的值也添加进来,例如110、000、011,这样原哈希键010扩充之后,就有了4个哈希键了。
作为一种优选方式,所述步骤S6中,分布式点函数通过多个密钥表示点函数,本实施例通过两个密钥k0,k1和函数Eval来表示函数P查询键,1(x′),具体表示为:
举例说明,假设查询端的查询键是010,那么查询端会构造基于010查询键的密钥k0,k1,其中k0发送给服务端1,将k1发送给服务端2,服务端根据接收到的k0或k1进行如下运算:
D·Eval(k,x′);
并将运算结果返回给查询端,其中,D表示查询键010对应的哈希桶里的数据值;
在本实施例中,关于步骤S7:将所有k0发送给一方服务端,将所有k1发送给另一个服务端。
进一步地,所述步骤S8中,针对所述步骤S7中发送的秘密键k值进行计算,服务端将会对哈希表中的所有元素进行运算,服务端进行的计算处理过程包括:
本实施例中,所述步骤S9包括如下过程:
根据所述步骤S6,仅当αi是查询端目标键时,Eval(k0,αi)+Eval(k1,αi)结果为1,乘以D后得到结果数据;当αi不是目标键时,Eval(k0,αi)+Eval(k1,αi)结果为0,最终累加结果数据D即为目标结果。
为实现上述过程,本发明还涉及一种基于秘密共享的隐私查询系统,该系统包括有查询端和两个服务端实现,该系统用于实现以上所述的方法。具体地,所述查询端和两个服务端均为计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,可实现上述实施例中基于秘密共享技术的隐私搜索方法各个步骤。
本发明公开的基于秘密共享的隐私查询方法及系统,其相比现有技术而言的有益效果在于,本发明采用秘密共享技术、多重局部哈希敏感技术、分布式点函数等手段,实现了在不暴露具体特征信息前提下的信息搜索,同时限制搜索结果仅为单一相似结果,不暴露数据方额外的数据信息,进而实现隐私搜索,较好地满足了应用需求。
以上所述只是本发明较佳的实施例,并不用于限制本发明,凡在本发明的技术范围内所做的修改、等同替换或者改进等,均应包含在本发明所保护的范围内。
Claims (8)
1.一种基于秘密共享的隐私查询方法,其特征在于,该方法基于查询端和两个服务端实现,两个服务端预设有相同的哈希函数与数据,所述方法包括有如下步骤:
步骤S1,服务端构建用于映射原始特征到低纬空间的局部敏感哈希函数簇,哈希函数簇包含L个哈希函数;
步骤S2,服务端针对其预设数据集中的每一个元素,将所述步骤S1中的每个哈希函数应用于元素的特征信息中,得到对应的哈希编码,构建以哈希编码为键的L个哈希表;
步骤S3,对所述步骤S2中哈希表值大于1的元素进行清理,只留下一个元素;
步骤S4,查询端向任一服务端发起获取哈希函数的请求,服务端将L个哈希函数发送至查询端;
步骤S5,查询端接收所述步骤S4中由服务端提供的L个哈希函数,应用每个哈希函数到查询特征中,得到查询键;
步骤S6,查询端基于查询键构建两个密钥键k0、k1;
步骤S7,查询端将两个密钥键k0、k1分别发送至两个服务端;
步骤S8,服务端对接收到的密钥键进行计算处理,并将结果值发送回查询端;
步骤S9,查询端接收所述步骤S8中由两个服务端发送来的结果值,将两个结果值相加后得到目标结果。
2.如权利要求1所述的基于秘密共享的隐私查询方法,其特征在于,所述步骤S1中,根据局部敏感哈希的定义(R,cR,P1,P2)敏感,对于任意查询序列p和q,如果两者距离小于等于R,则两者哈希碰撞概率至少为P1,如果两者距离大于等于cR,则两者的哈希碰撞概率至多为P2。
3.如权利要求1所述的基于秘密共享的隐私查询方法,其特征在于,所述步骤S2中,构建多个以元素特征哈希编码为键,元素ID为值的哈希表。
4.如权利要求1所述的基于秘密共享的隐私查询方法,其特征在于,所述步骤S5中,将得到的查询键向外扩充,将与目标查询键相邻的若干查询键一起作为查询条件。
8.一种基于秘密共享的隐私查询系统,其特征在于,包括有查询端和两个服务端实现,所述系统用于实现权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210899054.0A CN115391642B (zh) | 2022-07-28 | 2022-07-28 | 一种基于秘密共享的隐私查询方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210899054.0A CN115391642B (zh) | 2022-07-28 | 2022-07-28 | 一种基于秘密共享的隐私查询方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115391642A CN115391642A (zh) | 2022-11-25 |
CN115391642B true CN115391642B (zh) | 2023-03-10 |
Family
ID=84117175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210899054.0A Active CN115391642B (zh) | 2022-07-28 | 2022-07-28 | 一种基于秘密共享的隐私查询方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115391642B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108632248A (zh) * | 2018-03-22 | 2018-10-09 | 平安科技(深圳)有限公司 | 数据加密方法、数据查询方法、装置、设备及存储介质 |
CN110489419A (zh) * | 2019-08-08 | 2019-11-22 | 东北大学 | 一种基于多层局部敏感哈希的k最近邻近似查询方法 |
CN113420141A (zh) * | 2021-06-24 | 2021-09-21 | 中国人民解放军陆军工程大学 | 基于哈希聚类和上下文信息的敏感数据搜索方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230289469A1 (en) * | 2020-07-15 | 2023-09-14 | Georgia Tech Research Corporation | Privacy-preserving fuzzy query system and method |
-
2022
- 2022-07-28 CN CN202210899054.0A patent/CN115391642B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108632248A (zh) * | 2018-03-22 | 2018-10-09 | 平安科技(深圳)有限公司 | 数据加密方法、数据查询方法、装置、设备及存储介质 |
CN110489419A (zh) * | 2019-08-08 | 2019-11-22 | 东北大学 | 一种基于多层局部敏感哈希的k最近邻近似查询方法 |
CN113420141A (zh) * | 2021-06-24 | 2021-09-21 | 中国人民解放军陆军工程大学 | 基于哈希聚类和上下文信息的敏感数据搜索方法 |
Non-Patent Citations (2)
Title |
---|
Junfeng He 等.Compact Hashing with Joint Optimization of Search Accuracy and Time.2011,正文第753-760页. * |
张仕 等.开放环境多分布特性的局部敏感哈希检索方法.2022,第33卷(第4期),正文第1200-1217页. * |
Also Published As
Publication number | Publication date |
---|---|
CN115391642A (zh) | 2022-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qi et al. | Time-aware distributed service recommendation with privacy-preservation | |
Qian et al. | Social network de-anonymization and privacy inference with knowledge graph model | |
Qian et al. | De-anonymizing social networks and inferring private attributes using knowledge graphs | |
Hidano et al. | Model inversion attacks for prediction systems: Without knowledge of non-sensitive attributes | |
Singh et al. | Fuzzy-folded bloom filter-as-a-service for big data storage in the cloud | |
KR20130064701A (ko) | 프라이버시―보존 협력 필터링 | |
CN106254314B (zh) | 一种位置查询服务信息保护方法及系统 | |
CN110659394B (zh) | 基于双向邻近度的推荐方法 | |
CN105138664A (zh) | 一种隐私保护的大数据推荐方法及系统 | |
KR20220101671A (ko) | 그래디언트 부스팅을 통한 프라이버시 보호 기계 학습 | |
CN116109372A (zh) | 基于多层次区块链的冷链物流产品联邦推荐方法及装置 | |
CN115905633A (zh) | 一种隐私保护的图相似性检索方法及系统 | |
CN115481415A (zh) | 基于纵向联邦学习的通信成本优化方法、系统、设备及介质 | |
CN108040321B (zh) | 一种路网环境下抗重放攻击的位置匿名方法 | |
Wang et al. | Horizontal Federated Recommender System: A Survey | |
CN115391642B (zh) | 一种基于秘密共享的隐私查询方法及系统 | |
CN111597582B (zh) | 一种构建加密倒序矩形树方法、一种空间关键词查询方法 | |
Zhang et al. | LPPS‐AGC: Location Privacy Protection Strategy Based on Alt‐Geohash Coding in Location‐Based Services | |
CN117725611A (zh) | 数据共享方法及装置 | |
CN113076319A (zh) | 基于离群值检测技术和位图索引的动态数据库填充方法 | |
Min et al. | Personalized 3D Location Privacy Protection With Differential and Distortion Geo-Perturbation | |
CN112084411A (zh) | 一种面向个性化信息检索的用户隐私保护方法 | |
Qu et al. | Personalized privacy-preserving medical data sharing for blockchain-based smart healthcare networks | |
Wang et al. | Travel trajectory frequent pattern mining based on differential privacy protection | |
Lee et al. | A new cloaking algorithm using Hilbert curves for privacy protection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 7 / F, 57 Zhongshan 5th Road, East District, Zhongshan City, Guangdong Province, 528400 Patentee after: Jingxin Technology Co.,Ltd. Country or region after: China Address before: 7 / F, 57 Zhongshan 5th Road, East District, Zhongshan City, Guangdong Province, 528400 Patentee before: Jingxin Data Technology Co.,Ltd. Country or region before: China |