CN106909617A - 一种基于数据拟合的个性化隐私信息检索方法 - Google Patents
一种基于数据拟合的个性化隐私信息检索方法 Download PDFInfo
- Publication number
- CN106909617A CN106909617A CN201710024872.5A CN201710024872A CN106909617A CN 106909617 A CN106909617 A CN 106909617A CN 201710024872 A CN201710024872 A CN 201710024872A CN 106909617 A CN106909617 A CN 106909617A
- Authority
- CN
- China
- Prior art keywords
- data
- retrieval
- buyer
- retrieved
- anonymous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/606—Protecting data by securing the transmission between two devices or processes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Abstract
本发明公开了一种基于数据拟合的个性化隐私信息检索方法,数据交易平台的买卖双方协商得到检索的参照列,买方拟合确定检索参照列数据的分布函数,然后根据检索参照列数据的分布函数和隐私要求参数获取k匿名集合,采用不可逆加密算法对匿名集合进行加密,将匿名密文集合发送给卖方,卖方采用与买方相同的不可逆加密算法对自身数据库中参照列R中的数据进行加密处理,然后根据匿名密文集合进行检索,将检索记录集发送给买方,买方根据其真实检索参照列数据在检索记录集中筛选出所需检索记录,得到检索结果。采用本发明可以实现对买方检索内容和意图隐私的良好保护。
Description
技术领域
本发明属于数据交易中的信息检索技术领域,更为具体地讲,涉及一种基于数据拟合的个性化隐私信息检索方法。
背景技术
随着网络信息技术飞速发展,各行各业对数据的需求量不断增长,不论是在学术界还是在工业界都希望可以得到满足生产和研究的数据,并且数据在人们的生活中扮演着越来越重要的角色。政府部门、商业组织或研究机构等各行业都需要大量的数据输入来满足各式各样的需求,但是数据是复杂的、多变的,因此,各行业就需要从海量数据中搜索有用信息来满足自身需要。但这样有可能导致个体查询内容隐私以及查询方的商业意图的泄露,随之而来的是各种解决私密信息(如日常习惯、不良历史、信誉程度、以往病史等)方面的研究,以确保信息的利用在满足行业需求的同时能保证个人隐私以及商业意图不被泄露。正是这样的需求使得安全可信的数据交易平台应运而生,为用户提供保护数据主体隐私的安全隐私平台。
在各种保护隐私的数据检索模型中最具代表性的是隐私信息检索保护模型,隐私信息检索经过多年的研究,已经形成了相对完善的理论体系。虽然一些方法还存在一定的缺陷,但随着一些关键问题的解决,隐私信息检索将越来越多地应用到各个领域,许多行业为了保护数据查询提供方的利益以及查询方的商业利益,引入了隐私信息检索方法。
在进入了大数据时代之后,各种数据不断融合,各大机构都有足够多的数据,但是当他们想通过其他机构查询数据的时候,他们不想暴露自己的数据给数据提供方,然而对于此种需求目前行业内并没有有效的解决方法。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于数据拟合的个性化隐私信息检索方法,实现对买方检索内容和意图隐私的良好保护。
为实现上述发明目的,本发明基于数据拟合的个性化隐私信息检索方法,包括以下步骤:
S1:数据交易平台的买卖双方协商得到检索的参照列R;
S2:买方在自己所要检索的数据中提取参照列R对应的数据,拟合确定检索参照列数据的分布函数,然后根据检索参照列数据的分布函数生成(k-1)M个假数据,其中k表示买方的隐私要求参数,k>1,M表示买方检索参照列数据个数,将(k-1)M个假数据和检索参照列数据构成k匿名集合,采用不可逆加密算法对匿名集合进行加密,将匿名密文集合发送给卖方;
S3:卖方采用与买方相同的不可逆加密算法对自身数据库中参照列R中的数据进行加密处理,根据买方发送的匿名密文集合在自身数据库中进行检索,将检索记录集发送给买方;
S4:买方接收到检索记录集后,根据其真实检索参照列数据在检索记录集中筛选出所需检索记录,得到检索结果。
本发明基于数据拟合的个性化隐私信息检索方法,数据交易平台的买卖双方协商得到检索的参照列,买方拟合确定检索参照列数据的分布函数,然后根据检索参照列数据的分布函数和隐私要求参数获取k匿名集合,采用不可逆加密算法对匿名集合进行加密,将匿名密文集合发送给卖方,卖方采用与买方相同的不可逆加密算法对自身数据库中参照列R中的数据进行加密处理,然后根据匿名密文集合进行检索,将检索记录集发送给买方,买方根据其真实检索参照列数据在检索记录集中筛选出所需检索记录,得到检索结果。采用本发明可以实现对买方检索内容和意图隐私的良好保护。
附图说明
图1是本发明基于数据拟合的个性化隐私信息检索方法的具体实施方式流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于数据拟合的个性化隐私信息检索方法的具体实施方式流程图。如图1所示,本发明基于数据拟合的个性化隐私信息检索方法的具体步骤包括:
S101:买卖双方协商检索参照列:
数据交易平台的买卖双方协商得到检索的参照列R,例如身份证号、手机号等。通过这种方式,可以根据买方的自身需求情况和卖方的数据提供情况来确定检索参照列,从而提供个性化的信息检索。
表1是本实施例中买方检索数据表。
Name | Age | PhoneNum |
Rich | 11 | 15253592645 |
Stick | 33 | 18753597551 |
Roc | 23 | 18625566432 |
Emily | 12 | 15642592117 |
Alice | 15 | 15955592663 |
表1
S102:买方基于数据拟合加密检索数据:
买方在自己所要检索的数据中提取参照列R对应的数据,拟合确定检索参照列数据的分布函数,分布函数体现了检索参照列数据的分布特征(例如均匀分布、高斯分布等),然后根据检索参照列数据的分布函数生成(k-1)M个假数据,其中k表示买方的隐私要求参数,k>1,M表示买方检索参照列数据个数,将(k-1)M个假数据和检索参照列数据构成k匿名集合,采用不可逆加密算法对匿名集合进行加密,将匿名密文集合发送给卖方。
在本发明中,为了隐藏买方的真实查询意图,需要生成(k-1)M个假数据来和真实数据构成k匿名集合,由于不同的数据分布特征不同,如果随机生成假数据,很有可能产生的是噪音数据,很容易被排除掉,从而暴露买方的真实查询意图。因此,本发明中买方首先对检索参照列数据进行了数据拟合,得到了分布函数,以此生成k匿名集合。假定将年龄作为参照列,那么买方将根据表1中的年龄列所对应数据来拟合得到分布函数,由于年龄的分布满足高斯分布,所以此处高斯分布对年龄进行拟合,得到对应拟合函数,据此来生成k匿名集合。本实施例中设置k=2,由于表1中存在5个年龄数据,因此需要生成的假数据数量为5,即根据拟合函数生成5个假年龄数据,与表1中的年龄数据一起构成k匿名集合。表2是本实施例中的k匿名集合。
Age |
11 |
33 |
23 |
12 |
15 |
16 |
19 |
18 |
17 |
34 |
表2
本发明中,买方需要采用不可逆加密算法对匿名集合进行加密,不可逆加密算法的特点就是无法根据密文解密得到原始明文。本实施例中采用SHA(Secure HashAlgorithm,安全散列算法)256加密算法来进行不可逆加密,该算法可以把任何类型的数据转换成256位的数据摘要,两个不同的数据不会产生同样的数据摘要。
S103:卖方信息检索与反馈:
卖方采用与买方相同的不可逆加密算法对自身数据库中参照列R中的数据进行加密处理,根据买方发送的匿名密文集合在自身数据库中进行检索,将检索记录集发送给买方。
由于本发明采用密文来检索,卖方最多只能根据自身数据库中参照列数据密文来获取匿名密文集合中密文对应的数据,对于卖方不存在的记录,就无法得知了,因此可以对那些卖方没有的检索记录进行很好的保护。
S104:买方获取检索结果:
买方接收到检索记录集后,根据其真实检索参照列数据的密文在检索记录集中筛选出所需检索记录,得到检索结果。
根据以上说明可知,本发明中买卖双方通过协商检索参照列,来实现个性化信息检索,在检索过程中买方采用检索参照列数据的分布函数来生成k匿名集合,并采用不可逆加密算法对匿名集合进行加密,卖方采用密文进行检索,从而解决了隐私信息检索中对检索内容和意图隐私保护问题。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (2)
1.一种基于数据拟合的个性化隐私信息检索方法,其特征在于,包括以下步骤:
S1:数据交易平台的买卖双方协商得到检索的参照列R;
S2:买方在自己所要检索的数据中提取中参照列R对应的数据,拟合确定检索参照列数据的分布函数,然后根据检索参照列数据的分布函数生成(k-1)M个假数据,其中k表示买方的隐私要求参数,k>1,M表示买方检索参照列数据个数,将(k-1)M个假数据和检索参照列数据构成k匿名集合,采用不可逆加密算法对匿名集合进行加密,将匿名集合匿名密文集合发送给卖方;
S3:卖方采用与买方相同的不可逆加密算法对自身数据库中参照列R中的数据进行加密处理,根据买方发送的匿名密文集合在自身数据库中进行检索,将检索记录集发送给买方;
S4:买方接收到检索记录集后,根据其真实检索参照列数据在检索记录集中筛选出所需检索记录,得到检索结果。
2.根据权利要求1所述的个性化隐私信息检索方法,其特征在于,所述步骤S2中不可逆加密算法采用SHA256加密算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710024872.5A CN106909617B (zh) | 2017-01-13 | 2017-01-13 | 一种基于数据拟合的个性化隐私信息检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710024872.5A CN106909617B (zh) | 2017-01-13 | 2017-01-13 | 一种基于数据拟合的个性化隐私信息检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106909617A true CN106909617A (zh) | 2017-06-30 |
CN106909617B CN106909617B (zh) | 2019-06-21 |
Family
ID=59206879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710024872.5A Active CN106909617B (zh) | 2017-01-13 | 2017-01-13 | 一种基于数据拟合的个性化隐私信息检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106909617B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107454070A (zh) * | 2017-07-24 | 2017-12-08 | 华东师范大学 | 一种基于区块链的个性化隐私信息检索方法 |
CN108768608A (zh) * | 2018-05-25 | 2018-11-06 | 电子科技大学 | 在区块链pki下支持瘦客户端的隐私保护身份认证方法 |
CN110457945A (zh) * | 2019-08-01 | 2019-11-15 | 卫盈联信息技术(深圳)有限公司 | 名单查询的方法、查询方设备、服务方设备及存储介质 |
CN111489155A (zh) * | 2020-03-11 | 2020-08-04 | 华控清交信息科技(北京)有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN113127892A (zh) * | 2019-12-31 | 2021-07-16 | 华控清交信息科技(北京)有限公司 | 数据交易方法、装置、系统及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101178801A (zh) * | 2006-12-20 | 2008-05-14 | 腾讯科技(深圳)有限公司 | 一种网络交易方法及系统 |
CN103854182A (zh) * | 2012-11-30 | 2014-06-11 | 国泰世华商业银行股份有限公司 | 利用实名认证进行网络购物的方法 |
CN105718818A (zh) * | 2016-03-07 | 2016-06-29 | 卫晓东 | 一种用于网络购物的个人信息保密方法及系统 |
-
2017
- 2017-01-13 CN CN201710024872.5A patent/CN106909617B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101178801A (zh) * | 2006-12-20 | 2008-05-14 | 腾讯科技(深圳)有限公司 | 一种网络交易方法及系统 |
CN103854182A (zh) * | 2012-11-30 | 2014-06-11 | 国泰世华商业银行股份有限公司 | 利用实名认证进行网络购物的方法 |
CN105718818A (zh) * | 2016-03-07 | 2016-06-29 | 卫晓东 | 一种用于网络购物的个人信息保密方法及系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107454070A (zh) * | 2017-07-24 | 2017-12-08 | 华东师范大学 | 一种基于区块链的个性化隐私信息检索方法 |
CN107454070B (zh) * | 2017-07-24 | 2019-06-25 | 华东师范大学 | 一种基于区块链的个性化隐私信息检索方法 |
CN108768608A (zh) * | 2018-05-25 | 2018-11-06 | 电子科技大学 | 在区块链pki下支持瘦客户端的隐私保护身份认证方法 |
CN108768608B (zh) * | 2018-05-25 | 2020-05-12 | 电子科技大学 | 在区块链pki下支持瘦客户端的隐私保护身份认证方法 |
CN110457945A (zh) * | 2019-08-01 | 2019-11-15 | 卫盈联信息技术(深圳)有限公司 | 名单查询的方法、查询方设备、服务方设备及存储介质 |
CN113127892A (zh) * | 2019-12-31 | 2021-07-16 | 华控清交信息科技(北京)有限公司 | 数据交易方法、装置、系统及存储介质 |
CN111489155A (zh) * | 2020-03-11 | 2020-08-04 | 华控清交信息科技(北京)有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN111489155B (zh) * | 2020-03-11 | 2024-04-09 | 华控清交信息科技(北京)有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106909617B (zh) | 2019-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106909617B (zh) | 一种基于数据拟合的个性化隐私信息检索方法 | |
CN107454070B (zh) | 一种基于区块链的个性化隐私信息检索方法 | |
Campra et al. | Bibliometrix analysis of medical tourism | |
US7747491B2 (en) | Anonymous information system, information registering device and information storing device | |
Rejeb et al. | The impact of blockchain on medical tourism | |
US20180012039A1 (en) | Anonymization processing device, anonymization processing method, and program | |
US20160048690A1 (en) | Genetic information storage apparatus, genetic information search apparatus, genetic information storage program, genetic information search program, genetic information storage method, genetic information search method, and genetic information search system | |
CN106844599B (zh) | 一种基于数据映射的个性化隐私信息检索方法 | |
US20150278547A1 (en) | Information processing apparatus, information processing method, and recording medium | |
US10216940B2 (en) | Systems, methods, apparatuses, and computer program products for truncated, encrypted searching of encrypted identifiers | |
JP6557338B2 (ja) | 類似性秘匿検索システム、類似性秘匿検索方法 | |
US20130266135A1 (en) | System for DNA Identification Hiding Personal Traits | |
Guan et al. | Achieving secure and efficient data access control for cloud-integrated body sensor networks | |
Vardalachakis et al. | ShinyAnonymizer: A Tool for Anonymizing Health Data. | |
JP2014066831A (ja) | データ処理プログラム、データ処理装置及びデータ処理システム | |
Vovk et al. | Methods and tools for healthcare data anonymization: a literature review | |
US20240005433A1 (en) | Anonymous crime reporting and escrow system with hashed perpetrator matching | |
JP4822842B2 (ja) | 匿名化識別情報生成システム、及び、プログラム。 | |
JP2003005645A (ja) | 暗号方法、暗号システム、暗号化装置、復号化装置及びコンピュータプログラム | |
Eleuteri et al. | Global regularity and stability of solutions to elliptic equations with nonstandard growth | |
KR100910303B1 (ko) | 가변코드 테이블을 이용한 데이터 암복호화 장치 및 그 방법 | |
Kong et al. | Protecting privacy in a clinical data warehouse | |
Zhu et al. | Privacy Preserving Association Rule Mining Algorithm Based on Hybrid Partial Hiding Strategy | |
Swathi et al. | Virtual Health Assistant | |
Saha et al. | Efficient protocols for private database queries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |