CN116702192A - 数据混淆的高效隐私保护联合计算方法、系统及装置 - Google Patents
数据混淆的高效隐私保护联合计算方法、系统及装置 Download PDFInfo
- Publication number
- CN116702192A CN116702192A CN202310618960.3A CN202310618960A CN116702192A CN 116702192 A CN116702192 A CN 116702192A CN 202310618960 A CN202310618960 A CN 202310618960A CN 116702192 A CN116702192 A CN 116702192A
- Authority
- CN
- China
- Prior art keywords
- query
- party
- result
- calculation
- confusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 130
- 239000013598 vector Substances 0.000 claims abstract description 90
- 238000000034 method Methods 0.000 claims abstract description 27
- 230000006870 function Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000010195 expression analysis Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种数据混淆的高效隐私保护联合计算方法、系统及装置,该系统包括:查询方和被查询方;方法包括:查询方获取待查询ID,随机选取m个混淆ID,通过m个混淆ID对待查询ID进行混淆,得到ID集合;确定ID集合对应的权重,得到权重集合;根据ID集合生成第一查询向量,对其进行同态加密,得到第二查询向量;被查询方依据ID集合和本地数据库进行参数查询,得到查询结果;将查询结果与权重集合进行联合计算,得到计算结果集;将查询结果与第二查询向量进行内积运算,得到加密查询结果;查询方对其进行解密,得到明文查询结果。采用本申请实施例可以在提升隐私保护安全性的基础上,提升数据查询效率。
Description
技术领域
本申请涉及隐私计算技术领域或者计算机技术领域,具体涉及一种数据混淆的高效隐私保护联合计算方法、系统及装置。
背景技术
实际应用中,考虑两方联合查询及计算场景,查询方拥有ID以及一部分参数,被查询方拥有ID对应的另一组参数以及求值函数,该函数可以是计算规则、多项式,也可以是机器学习模型、评分卡等,任意计算规则均可。查询方提供ID以及对应参数给被查询方,被查询方利用该ID在自己数据库中查询出另一部分参数,把上述所有参数输入一个特定函数进行求值,并返回求值结果给查询方。
然而,在传统的查询协议中,查询方需要提供己方的ID以及参数明文给被查询方,这一过程会导致ID以及参数信息的泄露,从而,导致查询方的隐私信息受到威胁,因此,如何在提升隐私保护安全性的基础上,提升数据查询效率的问题亟待解决。
发明内容
本申请实施例提供了一种数据混淆的高效隐私保护联合计算方法、系统及装置,可以在提升隐私保护安全性的基础上,提升数据查询效率。
第一方面,本申请实施例提供一种数据混淆的高效隐私保护联合计算方法,应用于数据混淆的高效隐私保护联合计算系统,该系统包括:查询方和被查询方;所述方法包括:
通过所述查询方获取待查询ID,随机选取m个混淆ID,通过所述m个混淆ID对所述待查询ID进行混淆,得到ID集合,m为正整数;将所述ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据所述ID集合生成第一查询向量,并对所述第一查询向量进行同态加密,得到第二查询向量;将所述ID集合、所述权重集合和所述第二查询向量发送给所述被查询方;
通过所述被查询方依据所述ID集合和本地数据库进行参数查询,得到查询结果;将所述查询结果与所述权重集合进行联合计算,得到计算结果集,所述计算结果集包括m+1个计算结果,所述ID集合中每一ID对应一个计算结果;
通过所述被查询方将所述计算结果集按照顺序写入本地缓存,将所述查询结果与所述第二查询向量进行内积运算,得到加密查询结果;
通过所述查询方对所述加密查询结果进行解密,得到明文查询结果。
第二方面,本申请实施例提供了一种数据混淆的高效隐私保护联合计算系统,该系统包括:查询方和被查询方;其中,
所述查询方,用于获取待查询ID,随机选取m个混淆ID,通过所述m个混淆ID对所述待查询ID进行混淆,得到ID集合,m为正整数;将所述ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据所述ID集合生成第一查询向量,并对所述第一查询向量进行同态加密,得到第二查询向量;将所述ID集合、所述权重集合和所述第二查询向量发送给所述被查询方;
所述被查询方,用于依据所述ID集合和本地数据库进行参数查询,得到查询结果;将所述查询结果与所述权重集合进行联合计算,得到计算结果集,所述计算结果集包括m+1个计算结果,所述ID集合中每一ID对应一个计算结果;将所述计算结果集按照顺序写入本地缓存,将所述查询结果与所述第二查询向量进行内积运算,得到加密查询结果;
所述查询方,还用于对所述加密查询结果进行解密,得到明文查询结果。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,本申请实施例中所描述的数据混淆的高效隐私保护联合计算方法、系统及装置,应用于数据混淆的高效隐私保护联合计算系统,该系统包括:查询方和被查询方,通过查询方获取待查询ID,随机选取m个混淆ID,通过m个混淆ID对待查询ID进行混淆,得到ID集合,m为正整数;将ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据ID集合生成第一查询向量,并对第一查询向量进行同态加密,得到第二查询向量;将ID集合、权重集合和第二查询向量发送给被查询方,通过被查询方依据ID集合和本地数据库进行参数查询,得到查询结果;将查询结果与权重集合进行联合计算,得到计算结果集,计算结果集包括m+1个计算结果,ID集合中每一ID对应一个计算结果,通过被查询方将计算结果集按照顺序写入本地缓存,将查询结果与第二查询向量进行内积运算,得到加密查询结果,通过查询方对加密查询结果进行解密,得到明文查询结果,一方面,引入数据混淆的隐私保护查询及计算,避免额外的计算和存储开销,另一方面,混淆后的数据集和经过同态加密的包含数据索引的向量可以一次性发给被查询方,避免了传统密码协议中的多轮交互,大大提升协议的通信复杂度,进而,能够在提升隐私保护安全性的基础上,提升数据查询效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种用于实现数据混淆的高效隐私保护联合计算方法的数据混淆的高效隐私保护联合计算系统的架构示意图;
图2是本申请实施例提供的一种数据混淆的高效隐私保护联合计算方法的流程示意图;
图3是本申请实施例提供的一种数据混淆的高效隐私保护联合计算系统的结构示意图;
图4是本申请实施例提供的另一种数据混淆的高效隐私保护联合计算系统的结构示意图;
图5是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所描述的查询方、被查询方均可以为电子设备,电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、行车记录仪、服务器、笔记本电脑、移动互联网设备(MID,Mobile Internet Devices)或穿戴式设备(如智能手表、蓝牙耳机)等,上述仅是举例,而非穷举,包含但不限于上述电子设备,该电子设备也可以为云服务器,或者,该电子设备也可以为计算机集群。
本申请实施例中,查询方可以包括客户端,被查询方可以包括服务端,如服务器。
本申请实施例中,样本可以理解为:原始数据中的每一行数据,样本包含了:ID、特征和标签。身份标识(identification,ID)是每一行数据的唯一标识符,每一行都不相同,如:身份证号,手机号或自增序号;标签是建模的目标,样本要预测的某一结果,如某一借款人(ID是身份证号)违约(标签)了,另一借款人没违约(标签)。其中,样本包含了ID和标签,标签是对ID的一个描述,也是一次建模的目标。本申请实施例中,广义上来说,ID可以理解为关键词,关键字包括身份标识。
下面对本申请实施例进行详细介绍。
请参阅图1,图1是本申请实施例提供的一种用于实现数据混淆的高效隐私保护联合计算方法的数据混淆的高效隐私保护联合计算系统的架构示意图,如图所示,该系统包括:查询方和被查询方;其中,
所述查询方,用于获取待查询ID,随机选取m个混淆ID,通过所述m个混淆ID对所述待查询ID进行混淆,得到ID集合,m为正整数;将所述ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据所述ID集合生成第一查询向量,并对所述第一查询向量进行同态加密,得到第二查询向量;将所述ID集合、所述权重集合和所述第二查询向量发送给所述被查询方;
所述被查询方,用于依据所述ID集合和本地数据库进行参数查询,得到查询结果;将所述查询结果与所述权重集合进行联合计算,得到计算结果集,所述计算结果集包括m+1个计算结果,所述ID集合中每一ID对应一个计算结果;将所述计算结果集按照顺序写入本地缓存,将所述查询结果与所述第二查询向量进行内积运算,得到加密查询结果;
所述查询方,还用于对所述加密查询结果进行解密,得到明文查询结果。
可选的,在所述根据所述ID集合生成第一查询向量方面,所述查询方具体用于:
将所述ID集合中所述待查询ID的索引设置为1,除所述待查询ID之外的其他索引设置为0;
将所述ID集合中各ID的索引构成所述第一查询向量。
可选的,所述被查询方还具体用于:
通过所述被查询方配置预设表达式;
调用触发器加载所述预设表达式;
所述将所述查询结果与所述权重集合进行联合计算,得到计算结果集,包括:
通过所述预设表达式将所述查询结果与所述权重集合进行联合计算,得到所述计算结果集。
可选的,所述查询方与所述被查询方均通过隐私信息检索协议实现查询功能。
请参阅图2,图2是本申请实施例提供的一种数据混淆的高效隐私保护联合计算方法的流程示意图;应用于如图1所示的数据混淆的高效隐私保护联合计算系统,该系统包括:查询方和被查询方;该方法可以包括如下步骤:
201、通过所述查询方获取待查询ID,随机选取m个混淆ID,通过所述m个混淆ID对所述待查询ID进行混淆,得到ID集合,m为正整数;将所述ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据所述ID集合生成第一查询向量,并对所述第一查询向量进行同态加密,得到第二查询向量;将所述ID集合、所述权重集合和所述第二查询向量发送给所述被查询方。
本申请实施例中,待查询ID可以为一个ID,采用m个混淆ID将待查询ID进行混淆,以提升安全性,m为正整数。接着,再将ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合,即每一ID的权重对应一组随机数,即引入数据混淆的隐私保护来替代复杂的公钥密码计算,提升整体查询过程中的计算性能。其中,明文ID可以直接进行数据库检索,从而避免额外的存储开销。
进一步的,查询方可以根据ID集合生成第一查询向量,再对第一查询向量进行同态加密,得到第二查询向量,再将ID集合、权重集合和第二查询向量发送给被查询方,被查询方则可以接收ID集合、权重集合和第二查询向量,混淆后的数据集和经过同态加密的包含数据索引的向量可以一次性发给被查询方,避免了传统密码协议中的多轮交互,大大提升协议的通信复杂度。
可选的,上述步骤201,根据所述ID集合生成第一查询向量,可以包括如下步骤:
11、将所述ID集合中所述待查询ID的索引设置为1,除所述待查询ID之外的其他索引设置为0;
12、将所述ID集合中各ID的索引构成所述第一查询向量。
具体实现中,可以将ID集合中待查询ID的索引设置为1,除待查询ID之外的其他索引设置为0,进而,将待查询ID与其他ID加以区分,再将ID集合中各ID的索引构成第一查询向量。
可选的,所述查询方与所述被查询方均通过隐私信息检索协议实现查询功能。
本申请实施例中,查询方可以基于隐私信息检索(private informationretrieval,PIR)协议实现查询功能,被查询方也可以基于PIR协议实现查询功能。
本申请实施例中,引入索引的隐私信息检索协议,由于是由查询方发起ID混淆,因此,查询方已知混淆ID集合中待查询ID的索引,因此,可以直接利用索引的隐私信息检索协议进行查询,而不需要依赖关键词的隐私信息检索,后者会带来较大的性能开销。另外,引入数据索引的隐私信息检索协议,只通过一次交互即可获取查询结果,无需执行复杂的密码学协议,大大降低整体通信复杂度。
举例说明下,具体实现中,查询方选取待查询ID并随机选取混淆ID对待查询ID进行混淆,查询方对于混淆后的每个ID生成一组随机数作为当前ID的权重,查询方的PIR模块依据混淆后的ID集合生成查询向量并对该向量进行同态加密。查询方发送混淆后的结果以及加密后的查询向量给被查询方的计算节点。
其中,本申请实施例中,上述查询向量可以为独热编码的形式,例如,假设混淆后的ID集合为id1,id2,...,idi,....,idn,其中,idi为待查询ID,则生成的查询向量为0,0,...,1,....,0,其中,值为1的位置索引为i。
202、通过所述被查询方依据所述ID集合和本地数据库进行参数查询,得到查询结果;将所述查询结果与所述权重集合进行联合计算,得到计算结果集,所述计算结果集包括m+1个计算结果,所述ID集合中每一ID对应一个计算结果。
本申请实施例中,被查询方可以依据ID集合和本地数据库进行参数查询,得到查询结果,再将查询结果与权重集合进行联合计算,得到计算结果集,计算结果集包括m+1个计算结果,ID集合中每一ID对应一个计算结果。
可选的,还可以包括如下步骤:
S1、通过所述被查询方配置预设表达式;
S2、调用触发器加载所述预设表达式;
其中,表达式存在于计算模块的内存中,设置触发器的目的是在不重启计算服务的前提下加载表达式。
具体实现中,触发器(Trigger)的加载方式为本地微服务的方式,流程如下:
1、计算模块启动触发器监听模块,即生成一个服务,并监听一个本地的端口。(如服务名为Trigger,对应ip+端口为127.0.0.1:12345)。
2、表达式发生变动时,管理员修改表达式json文件(表达式以json文件的形式进行存储)并在本地保存。
3、管理员调用本地微服务接口,即步骤S1中的Trigger服务,并传输步骤S2中存储表达式内容的json文件路径给Trigger服务。
4、Trigger服务收到请求后根据路径参数读取json文件,并触发表达式解析模块对表达式进行解析,解析后的结果存储在内存中,并替换原有的表达式内存模块。
5、Trigger返回结果(结果包含解析是否成功、内存替换是否成功等状态信息)给管理员。
则上述步骤202,将所述查询结果与所述权重集合进行联合计算,得到计算结果集,可以按照如下方式实施:
通过所述预设表达式将所述查询结果与所述权重集合进行联合计算,得到所述计算结果集。
本申请实施例中,引入触发器,实现针对表达式字符串的在线解析,无需重启服务或进行源码修改,大大降低函数更新成本。
本申请实施例中,预设表达式可以预先设置或者系统默认,预设表达式可以为一个字符串,配置预设表达式的方式可以为配置文件或者网络请求。
具体实现中,表达式加载阶段可以引入触发器和表达式解析模块,实现计算函数动态更新。具体的,在被查询方的计算节点中引入触发器,被查询方函数(模型、算法)管理人员可以通过表达式字符串替换在线更新计算函数,并通过触发器触发计算节点进行实时函数更新。
具体实现中,可以通过被查询方配置预设表达式,调用触发器加载预设表达式,再通过预设表达式将查询结果与权重集合进行联合计算,得到计算结果集。
203、通过所述被查询方将所述计算结果集按照顺序写入本地缓存,将所述查询结果与所述第二查询向量进行内积运算,得到加密查询结果。
本申请实施例中,被查询方可以将计算结果集按照顺序写入本地缓存,再将查询结果与第二查询向量进行内积运算,得到加密查询结果。
204、通过所述查询方对所述加密查询结果进行解密,得到明文查询结果。
本申请实施例中,查询方可以对加密查询结果进行解密,得到明文查询结果。
本申请实施例中,针对海量数据情况下的隐私保护数据查询及计算场景,主要为了在保护查询方以及被查询方隐私的前提下,实现高效的海量数据查询和计算,采用上述本申请实施例,解决了计算函数低成本动态更新、高效数据查询以及通信轮数优化等问题。
具体实现中,混淆的方式,查询方通过每次提交包含多个混淆ID的查询ID集合进行隐私保护查询,被查询方只需要对上述ID集合直接向数据库进行多次查询,无需对原数据库进行改造。此外,所有ID集合的信息都明文参与计算,隐私保护强度只依赖于混淆的规模,整体计算效率为明文计算的线性倍数,相比与公钥密码学的隐私保护计算协议,大大提升了计算效率。
举例说明下,A、B两个企业联合进行广告效果预测,假设A企业有用户的出行数据,B企业有用户的电商数据,同时A企业有广告效果预测的模型,预测的过程如下:B企业提供用户ID、该ID对应的电商数据给A企业,A企业通过用户ID在本地查询出该ID对应的出行数据,然后结合两部分数据输入到模型(假设模型在A企业本地)中进行预测,最终得到广告效果的预测结果并返回给B企业。在整个过程中,B企业不希望A企业知道其要预测的真实用户ID,利用本申请实施例的方案,B企业对要进行预测的ID进行混淆,同时发送多个用户ID和对应的电商数据到A企业,在A企业进行查询并计算,得到多个预测结果,随后B企业通过PIR协议对得到的多个数据进行隐私保护查询(即B从A处计算得到的多个结果中查走一个),最终得到B企业所需要目标用户ID对应的查询结果,进而,能够在提升隐私保护安全性的基础上,提升数据查询效率。
举例说明下,如图3所示,客户端为查询方,服务端为被查询方,服务端包括:计算节点、本地数据库、PIR模块、本地缓存。客户端将待查询ID以及混淆ID通过混淆模块进行混淆,得到ID集合,基于ID集合确定权重集合,以及生成同态加密的查询向量,将ID集合、权重集合以及同态加密的查询向量发送给计算节点,计算节点通过PIR模块基于ID集合和本地数据库进行查询,得到查询结果,再将查询结果与权重集合进行联合计算,得到计算结果,将其存入本地缓存,再将计算结果和同态加密的查询向量进行内积运算,得到加密查询结果,再将加密查询结果发送给查询方,以供查询方对加密查询结果进行解密,得到明文查询结果。
再举例说明下,如图4所示,查询方即客户端,查询方将查询ID、ID权重进行混淆服务,得到ID混淆,随机数混淆。服务端实现计算查询服务,复杂函数插件实现预设表达式,计算节点实现计算服务,其可以利用数据查询模块完成数据库(本地数据库)以及查询方发送的参数实现查询功能,再利用表达式解析或者函数求值,得到计算结果,将计算结果存入本地缓存(Redis)。具体实现中,服务端和客户端利用PIR协议实现查询功能,两者分别可以被称之为PIR服务端,PIR客户端。
举例说明下,假设客户端拥有ID以及对应的权重信息两种类型的数据,在查询方对ID以及数据进行混淆,被查询方通过混淆后的ID进行参数查询,并利用查得数据进行计算,得到多组数据,查询方通过隐私信息检索协议获取待查询结果,具体可以包括2个阶段:表达式加载阶段和在线查询阶段。
其中,表达式加载阶段可以包括如下步骤:
A1、服务端设置表达式(可以是配置文件、网络请求等多种方式);
A2、调用触发器,触发表达式解析模块加载表达式。
具体实现中,表达式加载阶段引入触发器和表达式解析模块,实现计算函数动态更新。
其中,在线查询阶段可以包括如下步骤:
B1、查询方选取待查询ID并随机选取混淆ID对待查询ID进行混淆;
B2、查询方对于混淆后的每个ID生成一组随机数作为当前ID的权重,查询方的PIR模块依据混淆后的ID集合生成查询向量并对该向量进行同态加密。查询方发送混淆后的结果以及加密后的查询向量给计算节点。(该查询向量为独热编码的形式,例如,假设混淆后的ID集合为<id1,id2,...,idi,....,idn>,其中idi为待查询ID,则生成的查询向量为<0,0,...,1,....,0>其中值为1的位置索引为i;
B3、被查询方依据所有收到的ID向其本地数据库进行参数查询,并集合查到的参数以及客户端发送的参数进行联合计算,每个ID得到一个对应的计算结果;
B4、被查询方将计算结果按顺序写入本地缓存,并将查询结果构造成向量(<res1,res2,...,resi,....,resn>),与加密索引向量进行内积运算,从而得到加密的查询结果([[resi]]);
B5、被查询方发送加密查询结果给查询方;
B6、查询方在本地对加密查询结果进行解密,得到最终的明文查询结果。
其中,在线查询阶段步骤B1引入了随机ID的混淆,后续在被查询方的计算和查询均可以明文方式并行执行,无需对数据库进行改造,减少存储开销,一次交互完成查询,降低通信复杂度,另外,在线查询阶段步骤B4引入了全同态加密的内积运算,在被查询方直接计算出加密的查询结果,
总体来看,本申请实施例中,在计算节点中引入触发器和表达式解析,实现计算函数动态更新,引入索引的隐私信息检索协议,大幅度提升隐私保护查询的效率,引入数据混淆的隐私保护查询及计算,避免额外的计算和存储开销。
可以看出,本申请实施例中所描述的数据混淆的高效隐私保护联合计算方法,应用于数据混淆的高效隐私保护联合计算系统,该系统包括:查询方和被查询方,通过查询方获取待查询ID,随机选取m个混淆ID,通过m个混淆ID对待查询ID进行混淆,得到ID集合,m为正整数;将ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据ID集合生成第一查询向量,并对第一查询向量进行同态加密,得到第二查询向量;将ID集合、权重集合和第二查询向量发送给被查询方,通过被查询方依据ID集合和本地数据库进行参数查询,得到查询结果;将查询结果与权重集合进行联合计算,得到计算结果集,计算结果集包括m+1个计算结果,ID集合中每一ID对应一个计算结果,通过被查询方将计算结果集按照顺序写入本地缓存,将查询结果与第二查询向量进行内积运算,得到加密查询结果,通过查询方对加密查询结果进行解密,得到明文查询结果,一方面,引入数据混淆的隐私保护查询及计算,避免额外的计算和存储开销,另一方面,混淆后的数据集和经过同态加密的包含数据索引的向量可以一次性发给被查询方,避免了传统密码协议中的多轮交互,大大提升协议的通信复杂度,进而,能够在提升隐私保护安全性的基础上,提升数据查询效率。
与上述实施例一致地,请参阅图5,图5是本申请实施例提供的一种电子设备的结构示意图,如图所示,该电子设备包括处理器、存储器、通信接口以及一个或多个程序,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,本申请实施例中,该电子设备应用于数据混淆的高效隐私保护联合计算系统,该系统包括:查询方和被查询方;上述程序包括用于执行以下步骤的指令:
通过所述查询方获取待查询ID,随机选取m个混淆ID,通过所述m个混淆ID对所述待查询ID进行混淆,得到ID集合,m为正整数;将所述ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据所述ID集合生成第一查询向量,并对所述第一查询向量进行同态加密,得到第二查询向量;将所述ID集合、所述权重集合和所述第二查询向量发送给所述被查询方;
通过所述被查询方依据所述ID集合和本地数据库进行参数查询,得到查询结果;将所述查询结果与所述权重集合进行联合计算,得到计算结果集,所述计算结果集包括m+1个计算结果,所述ID集合中每一ID对应一个计算结果;
通过所述被查询方将所述计算结果集按照顺序写入本地缓存,将所述查询结果与所述第二查询向量进行内积运算,得到加密查询结果;
通过所述查询方对所述加密查询结果进行解密,得到明文查询结果。
可选的,在所述根据所述ID集合生成第一查询向量方面,上述程序包括用于执行以下步骤的指令:
将所述ID集合中所述待查询ID的索引设置为1,除所述待查询ID之外的其他索引设置为0;
将所述ID集合中各ID的索引构成所述第一查询向量。
可选的,上述程序还包括用于执行以下步骤的指令:
通过所述被查询方配置预设表达式;
调用触发器加载所述预设表达式;
所述将所述查询结果与所述权重集合进行联合计算,得到计算结果集,包括:
通过所述预设表达式将所述查询结果与所述权重集合进行联合计算,得到所述计算结果集。
可选的,所述查询方与所述被查询方均通过隐私信息检索协议实现查询功能。
可以看出,本申请实施例中所描述的电子设备,应用于数据混淆的高效隐私保护联合计算系统,该系统包括:查询方和被查询方,通过查询方获取待查询ID,随机选取m个混淆ID,通过m个混淆ID对待查询ID进行混淆,得到ID集合,m为正整数;将ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据ID集合生成第一查询向量,并对第一查询向量进行同态加密,得到第二查询向量;将ID集合、权重集合和第二查询向量发送给被查询方,通过被查询方依据ID集合和本地数据库进行参数查询,得到查询结果;将查询结果与权重集合进行联合计算,得到计算结果集,计算结果集包括m+1个计算结果,ID集合中每一ID对应一个计算结果,通过被查询方将计算结果集按照顺序写入本地缓存,将查询结果与第二查询向量进行内积运算,得到加密查询结果,通过查询方对加密查询结果进行解密,得到明文查询结果,一方面,引入数据混淆的隐私保护查询及计算,避免额外的计算和存储开销,另一方面,混淆后的数据集和经过同态加密的包含数据索引的向量可以一次性发给被查询方,避免了传统密码协议中的多轮交互,大大提升协议的通信复杂度,进而,能够在提升隐私保护安全性的基础上,提升数据查询效率。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种数据混淆的高效隐私保护联合计算方法,其特征在于,应用于数据混淆的高效隐私保护联合计算系统,该系统包括:查询方和被查询方;所述方法包括:
通过所述查询方获取待查询ID,随机选取m个混淆ID,通过所述m个混淆ID对所述待查询ID进行混淆,得到ID集合,m为正整数;将所述ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据所述ID集合生成第一查询向量,并对所述第一查询向量进行同态加密,得到第二查询向量;将所述ID集合、所述权重集合和所述第二查询向量发送给所述被查询方;
通过所述被查询方依据所述ID集合和本地数据库进行参数查询,得到查询结果;将所述查询结果与所述权重集合进行联合计算,得到计算结果集,所述计算结果集包括m+1个计算结果,所述ID集合中每一ID对应一个计算结果;
通过所述被查询方将所述计算结果集按照顺序写入本地缓存,将所述查询结果与所述第二查询向量进行内积运算,得到加密查询结果;
通过所述查询方对所述加密查询结果进行解密,得到明文查询结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述ID集合生成第一查询向量,包括:
将所述ID集合中所述待查询ID的索引设置为1,除所述待查询ID之外的其他索引设置为1;
将所述ID集合中各ID的索引构成所述第一查询向量。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
通过所述被查询方配置预设表达式;
调用触发器加载所述预设表达式;
所述将所述查询结果与所述权重集合进行联合计算,得到计算结果集,包括:
通过所述预设表达式将所述查询结果与所述权重集合进行联合计算,得到所述计算结果集。
4.根据权利要求1或2所述的方法,其特征在于,所述查询方与所述被查询方均通过隐私信息检索协议实现查询功能。
5.一种数据混淆的高效隐私保护联合计算系统,其特征在于,该系统包括:查询方和被查询方;其中,
所述查询方,用于获取待查询ID,随机选取m个混淆ID,通过所述m个混淆ID对所述待查询ID进行混淆,得到ID集合,m为正整数;将所述ID集合中的每一ID生成一组随机数作为该ID的权重,得到权重集合;根据所述ID集合生成第一查询向量,并对所述第一查询向量进行同态加密,得到第二查询向量;将所述ID集合、所述权重集合和所述第二查询向量发送给所述被查询方;
所述被查询方,用于依据所述ID集合和本地数据库进行参数查询,得到查询结果;将所述查询结果与所述权重集合进行联合计算,得到计算结果集,所述计算结果集包括m+1个计算结果,所述ID集合中每一ID对应一个计算结果;将所述计算结果集按照顺序写入本地缓存,将所述查询结果与所述第二查询向量进行内积运算,得到加密查询结果;
所述查询方,还用于对所述加密查询结果进行解密,得到明文查询结果。
6.根据权利要求5所述的系统,其特征在于,在所述根据所述ID集合生成第一查询向量方面,所述查询方具体用于:
将所述ID集合中所述待查询ID的索引设置为1,除所述待查询ID之外的其他索引设置为0;
将所述ID集合中各ID的索引构成所述第一查询向量。
7.根据权利要求5或6所述的系统,其特征在于,所述被查询方还具体用于:
通过所述被查询方配置预设表达式;
调用触发器加载所述预设表达式;
所述将所述查询结果与所述权重集合进行联合计算,得到计算结果集,包括:
通过所述预设表达式将所述查询结果与所述权重集合进行联合计算,得到所述计算结果集。
8.根据权利要求5或6所述的系统,其特征在于,所述查询方与所述被查询方均通过隐私信息检索协议实现查询功能。
9.一种电子设备,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-4任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310618960.3A CN116702192A (zh) | 2023-05-29 | 2023-05-29 | 数据混淆的高效隐私保护联合计算方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310618960.3A CN116702192A (zh) | 2023-05-29 | 2023-05-29 | 数据混淆的高效隐私保护联合计算方法、系统及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116702192A true CN116702192A (zh) | 2023-09-05 |
Family
ID=87825009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310618960.3A Pending CN116702192A (zh) | 2023-05-29 | 2023-05-29 | 数据混淆的高效隐私保护联合计算方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116702192A (zh) |
-
2023
- 2023-05-29 CN CN202310618960.3A patent/CN116702192A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109891424B (zh) | 在不披露特定识别信息的情况下建立标识符之间的链接 | |
Atiewi et al. | Scalable and secure big data IoT system based on multifactor authentication and lightweight cryptography | |
US10346627B2 (en) | Privacy preserving data querying | |
CN103107889B (zh) | 一种可搜索的云计算环境数据加密存储系统和方法 | |
JP4958246B2 (ja) | 高速検索可能な暗号化のための方法、装置およびシステム | |
CN105610793B (zh) | 一种外包数据加密存储与密文查询系统及其应用方法 | |
US9219722B2 (en) | Unclonable ID based chip-to-chip communication | |
CN112800088A (zh) | 基于双向安全索引的数据库密文检索系统及方法 | |
KR20150052131A (ko) | 블룸 필터를 숨기는 콘텐츠에 의한 안전한 개인 데이터베이스 쿼링 | |
JP5348337B2 (ja) | 暗号化データベース管理システム、クライアントおよびサーバ、自然結合方法およびプログラム | |
Deebak et al. | AI-enabled privacy-preservation phrase with multi-keyword ranked searching for sustainable edge-cloud networks in the era of industrial IoT | |
CN104967693A (zh) | 面向云存储的基于全同态密码技术的文档相似度计算方法 | |
CN114491637B (zh) | 数据查询方法、装置、计算机设备和存储介质 | |
Badsha et al. | Privacy preserving user based web service recommendations | |
CN108549824A (zh) | 一种数据脱敏方法及装置 | |
JP6879311B2 (ja) | メッセージ送信システム、通信端末、サーバ装置、メッセージ送信方法、およびプログラム | |
CN116436682A (zh) | 数据处理方法、装置及系统 | |
CN116032667A (zh) | 支持高效更新的在线匿踪查询方法、系统及相关设备 | |
US20200145200A1 (en) | Attribute-based key management system | |
Park et al. | PKIS: practical keyword index search on cloud datacenter | |
Purushothama et al. | Efficient query processing on outsourced encrypted data in cloud with privacy preservation | |
KR102248756B1 (ko) | 순방향 안정성을 갖는 탐색 가능한 암호화 시스템과 그 장치 및 방법 | |
Yan et al. | Secure and efficient big data deduplication in fog computing | |
Nie et al. | Time‐enabled and verifiable secure search for blockchain‐empowered electronic health record sharing in IoT | |
CN110232570A (zh) | 一种信息监管方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |