CN106844599B - 一种基于数据映射的个性化隐私信息检索方法 - Google Patents
一种基于数据映射的个性化隐私信息检索方法 Download PDFInfo
- Publication number
- CN106844599B CN106844599B CN201710028191.6A CN201710028191A CN106844599B CN 106844599 B CN106844599 B CN 106844599B CN 201710028191 A CN201710028191 A CN 201710028191A CN 106844599 B CN106844599 B CN 106844599B
- Authority
- CN
- China
- Prior art keywords
- data
- retrieval
- buyer
- puppet
- referring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/606—Protecting data by securing the transmission between two devices or processes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于数据映射的个性化隐私信息检索方法,数据交易平台的买卖双方协商得到检索的参照列,卖方对其数据记录进行伪ID编号进行数据映射,并采用不可逆加密算法进行加密得到参照列数据密文,一起发送给买方,买方采用相同的不可逆加密算法获取查询参照列数据密文,查询得到对应的伪ID,根据隐私要求参数k生成(k‑1)M个假伪ID,然后将(k‑1)M个假伪ID和M个所需检索数据对应的伪ID构建k匿名集合发送给卖方,卖方将检索得到的数据记录集发送给买方,买方根据其真实检索参照列数据对应的伪ID在检索记录集中筛选出所需检索记录,得到检索结果。采用本发明可以实现对买方检索内容和意图隐私的良好保护。
Description
技术领域
本发明属于数据交易中的信息检索技术领域,更为具体地讲,涉及一种基于数据映射的个性化隐私信息检索方法。
背景技术
随着网络信息技术飞速发展,各行各业对数据的需求量不断增长,不论是在学术界还是在工业界都希望可以得到满足生产和研究的数据,并且数据在人们的生活中扮演着越来越重要的角色。政府部门、商业组织或研究机构等各行业都需要大量的数据输入来满足各式各样的需求,但是数据是复杂的,多变的,因此,各行业就需要从海量数据中搜索有用信息来满足自身需要。但这样有可能导致个体查询内容隐私以及查询方的商业意图的泄露,随之而来的是各种解决私密信息(如日常习惯、不良历史、信誉程度、以往病史等)方面的研究,以确保信息的利用在满足行业需求的同时能保证个人隐私以及商业意图不被泄露。正是这样的需求使得安全可信的数据交易平台应运而生,为用户提供保护数据主体隐私的安全隐私平台。
在各种保护隐私的数据检索模型中最具代表性的是隐私信息检索保护模型,隐私信息检索经过多年的研究,已经形成了相对完善的理论体系。虽然一些方法还存在一定的缺陷,但随着一些关键问题的解决,隐私信息检索将越来越多地应用到各个领域,许多行业为了保护数据查询提供方的利益以及查询方的商业利益,引入了隐私信息检索方法。
在进入了大数据时代之后,各种数据不断融合,各大机构都有足够多的数据,但是当他们想通过其他机构查询数据的时候,他们不想暴露自己的数据给数据提供方,然而对于此种需求目前行业内并没有有效的解决方法。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于数据映射的个性化隐私信息检索方法,实现对买方检索内容和意图隐私的良好保护。
为实现上述发明目的,本发明基于数据映射的个性化隐私信息检索方法,包括以下步骤:
S1:数据交易平台的买卖双方协商得到检索的参照列R;
S2:卖方将其数据库中的数据记录进行伪ID编号,对每条数据记录中参照列R的数据采用不可逆加密算法进行加密得到参照列数据密文,卖方将每条数据记录的伪ID和参照列数据密文发送给买方;
S3:买方在自己所要检索的数据中提取参照列R对应的数据,采用与卖方相同的不可逆加密算法进行加密,在所接收到的伪ID和参照列数据密文中查询得到检索参照列数据密文对应的伪ID,然后生成(k-1)M个假伪ID,其中k表示买方的隐私要求参数,k>1,M表示买方检索参照列数据个数,将(k-1)M个假伪ID和对检索参照列数据对应的伪ID构成k匿名集合,发送给卖方;
S4:卖方根据买方所发送来的k匿名集合,在其数据库中检索得到数据记录集,发送给买方;
S5:买方接收到检索记录集后根据其真实检索参照列数据对应的伪ID在检索记录集中筛选出所需检索记录,得到检索结果。
本发明基于数据映射的个性化隐私信息检索方法,数据交易平台的买卖双方协商得到检索的参照列,卖方对其数据记录进行伪ID编号进行数据映射,并采用不可逆加密算法进行加密得到参照列数据密文,一起发送给买方,买方采用相同的不可逆加密算法获取查询参照列数据密文,查询得到对应的伪ID,根据隐私要求参数k生成(k-1)M个假伪ID,然后将(k-1)M个假伪ID和M个所需检索数据对应的伪ID构建k匿名集合发送给卖方,卖方将检索得到的数据记录集发送给买方,买方根据其真实检索参照列数据对应的伪ID在检索记录集中筛选出所需检索记录,得到检索结果。采用本发明可以实现对买方检索内容和意图隐私的良好保护。
附图说明
图1是本发明基于数据映射的个性化隐私信息检索方法的具体实施方式流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于数据映射的个性化隐私信息检索方法的具体实施方式流程图。如图1所示,本发明基于数据映射的个性化隐私信息检索方法的具体步骤包括:
S101:买卖双方协商检索参照列:
数据交易平台的买卖双方协商得到检索的参照列R,例如身份证号、手机号等。通过这种方式,可以根据买方的自身需求情况和卖方的数据提供情况来确定检索参照列,从而提供个性化的信息检索。
S102:卖方基于数据映射加密数据:
卖方将其数据库中的数据记录进行伪ID编号,对每条数据记录中参照列R的数据采用不可逆加密算法进行加密得到参照列数据密文,卖方将每条数据记录的伪ID和参照列数据密文发送给买方。
伪ID编号就是对数据记录进行统一编号,可以视为对数据记录进行了映射,将每条数据记录以一个伪ID来表示。本实施例中记卖方数据库中的数据记录数量为N,其伪ID为自然数,那么数据记录的伪ID为0-N-1,然后将伪ID发送给买方。显然,伪ID是均匀分布的,这样就忽略了实际数据的分布情况,防止了根据数据分布情况窃取信息的问题。表1是本实施例中卖方所保存数据记录。
表1
如表1所示,本实施例中卖方保存有1000条数据记录,因此其伪ID为0-999。
本发明中卖方需要对每条数据记录中参照列R的数据采用不可逆加密算法进行加密得到参照列数据密文,假设本实施例中选择的参照列R为PhoneNum,则需要对每个PhoneNum进行加密,不可逆加密算法的特点就是无法根据密文解密得到原始明文。本实施例中采用SHA(Secure Hash Algorithm,安全散列算法)256加密算法来进行不可逆加密,该算法可以把任何类型的数据转换成256位的数据摘要,两个不同的数据不会产生同样的数据摘要。以PhoneNum“15955592645”为例,采用SHA256加密算法得到的密文为“3BE481CA29E74A01 367CEACA 0B5C7F5E E53E9A40 7D26D436 8EDD5395 41F7B13C”。该密文是不可逆的,不能将此密文转变为手机号。本发明中将卖方将每条数据记录的伪ID和参照列数据密文发送给买方,可以有效保证卖方数据安全。
S103:买方生成查询集合:
买方在自己所要检索的数据中提取参照列R对应的数据,采用与卖方相同的不可逆加密算法进行加密,在所接收到的伪ID和参照列数据密文中查询得到检索参照列数据密文对应的伪ID,然后生成(k-1)M个假伪ID,其中k表示买方的隐私要求参数,k>1,M表示买方检索参照列数据个数,将(k-1)M个假伪ID和检索参照列数据对应的伪ID构成k匿名集合,发送给卖方。
表2是本实施例中买方的检索参照列数据及对应伪ID。
Id | PhoneNum |
0 | 15253592634 |
1 | 18753594256 |
2 | 18625562646 |
3 | 15642592185 |
4 | 15955592792 |
表2
如表2所示,本实施例中,需要查询5个数据,其对应的伪ID为0,1,2,3,4。设置k=2,因此需要生成的假数据数量为5,即生成5个假伪ID,与表1中的年龄数据一起构成k匿名集合。表3是本实施例中的k匿名集合。
Id |
0 |
8 |
10 |
2 |
25 |
1 |
3 |
105 |
4 |
101 |
表3
可见,本发明中买家将其检索参照列数据采用同样方式进行不可逆加密后,根据密文来查询得到伪ID,再生成假伪ID一起构成k匿名集合,这样在传输检索数据时,传输的并非检索参照列数据,而是伪ID,伪ID数据不存在特殊的分布特征或其他数据特性,即使被窃取也很难获取买方的检索参照列数据。并且由于加入了假伪ID,卖方也不会得知买方的真实的检索内容和意图隐私,加强了对买方的保护。
S104:卖方信息检索与反馈:
卖方根据买方所发送来的k匿名集合在其数据库中检索得到数据记录集,并发送给买方。
S105:买方获取检索结果:
买方接收到检索记录集后,根据其真实检索参照列数据对应的伪ID在检索记录集中筛选出所需检索记录,得到检索结果。
根据以上说明可知,本发明中买卖双方通过协商检索参照列,来实现个性化信息检索,在检索过程中卖方将其数据库中的数据记录进行伪ID编号以实现数据映射,然后将参照列数据采用不可逆加密算法进行加密,买方对检索参照列数据进行加密,筛选出检索参照列数据密文对应的伪ID,发送给卖方进行检索,从而解决了隐私信息检索中对检索内容和意图隐私保护问题。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (2)
1.一种基于数据映射的个性化隐私信息检索方法,其特征在于,包括以下步骤:
S1:数据交易平台的买卖双方协商得到检索的参照列R;
S2:卖方将其数据库中的数据记录进行伪ID编号,对每条数据记录中参照列R的数据采用不可逆加密算法进行加密得到参照列数据密文,卖方将每条数据记录的伪ID和参照列数据密文发送给买方;
S3:买方在自己所要检索的数据中提取参照列R对应的数据,采用与卖方相同的不可逆加密算法进行加密,在所接收到的伪ID和参照列数据密文中查询得到检索参照列数据密文对应的伪ID,然后生成(k-1)M个假伪ID,其中k表示买方的隐私要求参数,k>1,M表示买方检索参照列数据个数,将(k-1)M个假伪ID和检索参照列数据对应的伪ID构成k匿名集合,发送给卖方;
S4:卖方根据买方所发送来的k匿名集合在其数据库中检索得到数据记录集,作为检索记录集发送给买方;
S5:买方接收到检索记录集后,根据其真实检索参照列数据对应的伪ID在检索记录集中筛选出所需检索记录,得到检索结果。
2.根据权利要求1所述的个性化隐私信息检索方法,其特征在于,所述不可逆加密算法采用SHA256加密算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710028191.6A CN106844599B (zh) | 2017-01-13 | 2017-01-13 | 一种基于数据映射的个性化隐私信息检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710028191.6A CN106844599B (zh) | 2017-01-13 | 2017-01-13 | 一种基于数据映射的个性化隐私信息检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106844599A CN106844599A (zh) | 2017-06-13 |
CN106844599B true CN106844599B (zh) | 2019-06-21 |
Family
ID=59123382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710028191.6A Active CN106844599B (zh) | 2017-01-13 | 2017-01-13 | 一种基于数据映射的个性化隐私信息检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106844599B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107454070B (zh) * | 2017-07-24 | 2019-06-25 | 华东师范大学 | 一种基于区块链的个性化隐私信息检索方法 |
CN108768608B (zh) * | 2018-05-25 | 2020-05-12 | 电子科技大学 | 在区块链pki下支持瘦客户端的隐私保护身份认证方法 |
CN110858251B (zh) * | 2018-08-22 | 2020-07-21 | 阿里巴巴集团控股有限公司 | 数据查询方法和装置 |
CN110457945B (zh) * | 2019-08-01 | 2021-03-02 | 卫盈联信息技术(深圳)有限公司 | 名单查询的方法、查询方设备、服务方设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101017559A (zh) * | 2007-03-09 | 2007-08-15 | 成都死海盐疗健康馆服务有限公司 | 一种由买方决定交易条件的商业网络交易平台的建立方法 |
CN101178801A (zh) * | 2006-12-20 | 2008-05-14 | 腾讯科技(深圳)有限公司 | 一种网络交易方法及系统 |
CN105718818A (zh) * | 2016-03-07 | 2016-06-29 | 卫晓东 | 一种用于网络购物的个人信息保密方法及系统 |
-
2017
- 2017-01-13 CN CN201710028191.6A patent/CN106844599B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101178801A (zh) * | 2006-12-20 | 2008-05-14 | 腾讯科技(深圳)有限公司 | 一种网络交易方法及系统 |
CN101017559A (zh) * | 2007-03-09 | 2007-08-15 | 成都死海盐疗健康馆服务有限公司 | 一种由买方决定交易条件的商业网络交易平台的建立方法 |
CN105718818A (zh) * | 2016-03-07 | 2016-06-29 | 卫晓东 | 一种用于网络购物的个人信息保密方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106844599A (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107454070B (zh) | 一种基于区块链的个性化隐私信息检索方法 | |
CN106127075B (zh) | 一种云存储环境下基于隐私保护的可搜索加密方法 | |
CN106909617B (zh) | 一种基于数据拟合的个性化隐私信息检索方法 | |
CN106844599B (zh) | 一种基于数据映射的个性化隐私信息检索方法 | |
Guo et al. | Fine-grained database field search using attribute-based encryption for e-healthcare clouds | |
CN109784931B (zh) | 一种基于区块链的数据查询平台的查询方法 | |
CN1776701B (zh) | 定义、使用和操纵权限管理数据结构的技术 | |
CN106687984B (zh) | 用于数据匹配和匿名化的设备和方法 | |
CN105723681B (zh) | 用于保护消费者隐私的匿名链接的伙伴编码 | |
CN102713995A (zh) | 隐匿检索系统以及密码处理系统 | |
CN105592085B (zh) | 面向位置感知推荐系统的隐私保护方法 | |
CN104102483A (zh) | 安全地使用公共服务以实现私人或企业目的的方法和系统 | |
CN109361644A (zh) | 一种支持快速搜索和解密的模糊属性基加密方法 | |
Zhang et al. | Privacyasst: Safeguarding user privacy in tool-using large language model agents | |
CN110765488B (zh) | 数据存储与读取方法和电子设备 | |
JP2001265771A (ja) | 個人情報管理装置、個人情報管理方法、及び個人情報管理装置または方法を実行するプログラムを記録した記録媒体 | |
CN108377319A (zh) | 图片传输方法及装置 | |
CN114091062A (zh) | 职业数据处理方法及装置 | |
Hussain et al. | Sharing is caring–design and demonstration of a data privacy tool for interorganizational transfer of data | |
CN111597582B (zh) | 一种构建加密倒序矩形树方法、一种空间关键词查询方法 | |
Rai et al. | Pseudonymization techniques for providing privacy and security in EHR | |
Vidhya et al. | Fusion-based advanced encryption algorithm for enhancing the security of Big Data in Cloud | |
Swathi et al. | Virtual Health Assistant | |
Yogeshwar et al. | Building dynamic permutation based privacy preservation model with block chain technology for IoT healthcare sector | |
US20100145807A1 (en) | Device for management of personal data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |