CN107943925A - 用于隐私信息匿名发布系统中个体信息的模糊化方法 - Google Patents

用于隐私信息匿名发布系统中个体信息的模糊化方法 Download PDF

Info

Publication number
CN107943925A
CN107943925A CN201711164472.0A CN201711164472A CN107943925A CN 107943925 A CN107943925 A CN 107943925A CN 201711164472 A CN201711164472 A CN 201711164472A CN 107943925 A CN107943925 A CN 107943925A
Authority
CN
China
Prior art keywords
individual
processing device
information
privacy information
fuzzy processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711164472.0A
Other languages
English (en)
Other versions
CN107943925B (zh
Inventor
郭亚军
梁心宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong Normal University
Original Assignee
Huazhong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong Normal University filed Critical Huazhong Normal University
Priority to CN201711164472.0A priority Critical patent/CN107943925B/zh
Publication of CN107943925A publication Critical patent/CN107943925A/zh
Application granted granted Critical
Publication of CN107943925B publication Critical patent/CN107943925B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2291User-Defined Types; Storage management thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0407Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the identity of one or more communicating identities is hidden
    • H04L63/0421Anonymous communication, i.e. the party's identifiers are hidden from the other party or parties, e.g. using an anonymizer

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种用于隐私信息匿名发布系统中个体信息的模糊化方法,涉及互联网中的隐私信息匿名发布系统。本系统是:隐私信息数据库、模糊化处理器和信息发布器依次连接;隐私信息数据库将个体的隐私信息以表格的形式进行存储;模糊化处理器从隐私信息数据库获取个体的隐私信息表格,采用最优模糊化方法对隐私信息表格进行模糊化,并将模糊化后的表格传送至信息发布器;信息发布器对外发布被模糊化处理后的表格。与现有的技术相比,本发明达到了相对意义上的最高准确性和最高安全性;②方法简介,显著提高了模糊化处理器的模糊化效率。适用于隐私信息匿名发布系统中具有个人隐私信息的数据发布。

Description

用于隐私信息匿名发布系统中个体信息的模糊化方法
技术领域
本发明涉及互联网中的隐私信息匿名发布系统,尤其涉及一种用于隐私信息匿名发布系统中个体信息的模糊化方法。
背景技术
为了满足现实需求,数据持有者经常需要对外发布一定的数据信息。正常情况下,这些数据将被某些组织或机构正当利用。特殊情况下,由于数据发布是开放性的,数据也可以被攻击者获取,这就有可能导致信息泄露。考虑到这两方面的因素,发布的数据应该同时保证准确性和安全性。权衡这两方面的基本方式是对数据进行一定程度的匿名。一个简单的匿名方式是去掉每个个体的标识属性。然而之后的研究显示仅仅去掉标识属性并不能完全保证个体的安全性。在某些情况下,攻击者仍然可以通过连接已掌握的被攻击者的外部信息间接地确定某个人的信息,这种攻击方式称为连接攻击。
隐私信息数据库包含有一定数量的个体,每个个体具有多种属性,这些属性分为标识属性、拟标识属性和敏感属性。标识属性(Identifier)是可以唯一地确定一个人身份的属性,例如身份证号和姓名。拟标识属性(Quasi-identifier) 是发布的属性信息与攻击者已掌握的属性信息重合的属性。拟标识属性的存在连接了发布的属性信息和外部信息。拟标识属性可能具有多个,每个个体的每种拟标识属性又可能具有多种取值,每个个体的多个拟标识属性的拟标识属性值就具有许多种组合,这些组合就可能暴露被攻击者的身份。敏感属性(Sensitive Attribute)是攻击者希望得到的属性信息,同时也是被攻击者希望保护的隐私信息,例如收入、健康状况、住址等。一种敏感属性会有多个敏感属性值(Sensitive Attribute Value)。假如被攻击者的敏感属性为健康状况,其中就可能具有病毒感染、外伤、肥胖症、癌症四种敏感属性值。
攻击者根据外部信息可以事先获悉被攻击者的标识属性和拟标识属性,同时数据持有者发布的表格中具有被攻击者的拟标识属性和敏感属性。在连接攻击中,攻击者根据发布表格中拟标识属性的唯一性就可以确定被攻击者的敏感属性,从而造成隐私泄露。为了防止隐私泄露,我们必须对拟标识属性进行模糊化处理,从而使多个个体的拟标识属性因为被模糊化从而变得彼此相同。拟标识属性值彼此相同的个体构成了一个等价类(Equivalence Class)。在攻击者看来,每个等价类中的个体是无法彼此区分的,从而也就无法确定个体的敏感属性值。
发明内容
本发明的目的就在于克服现有技术存在的缺点和不足,提供一种用于隐私信息匿名发布系统中个体信息的模糊化方法。
本发明的目的是这样实现的:
本发明的重点和难点在于采用等分方法将具有相同敏感属性值的个体等分到m个等价类中;可以证明,采用等分方法处理得到的等价类中,拟标识属性被最大限度地保留了,同时个体的敏感属性值又是最安全的。
具体地说:
一、隐私信息匿名发布系统
包括标隐私信息数据库、模糊化处理器和信息发布器;
其连接关系是:
隐私信息数据库、模糊化处理器和信息发布器依次连接。
隐私信息数据库将个体的隐私信息以表格的形式进行存储;模糊化处理器从隐私信息数据库获取个体的隐私信息表格,采用最优模糊化方法对隐私信息表格进行模糊化,并将模糊化后的表格传送至信息发布器;信息发布器对外发布被模糊化处理后的表格。
二、个体信息的模糊化方法
本方法包括下列步骤:
①模糊化处理器从隐私信息数据库中提取所有个体的所有属性信息并记录在表格中;
②模糊化处理器12将已知数量值W(个体总数)、已知数量值n(敏感属性值的数量)、固定参数d(最大数量比例偏离)和参数q(最小数量比例)代入公式中并得到二分法划分轮数r;
③模糊化处理器12按照可重合区间划分方法将具有相同敏感属性值的个体按照数量等分至2r个等价类。
④模糊化处理器对每个等价类中所有个体的敏感属性值进行模糊化,使所有个体的敏感属性值保持相同,并将得到的模糊化表格数据送至信息发布器;
⑤信息发布器将经过模糊化的表格信息对外发布。
本发明的工作原理:
传统的模糊化方法具有一个基本矛盾:如果模糊化程度过低,虽然每个等价类中个体拟标识属性的准确性相对较高,但是安全性太低;如果模糊化程度过高,虽然每个等价类中粉体的安全性相对较高,但是拟标识属性的准确性较低;为了达到相对意义上的最高准确性和最高安全性,经过证明,模糊化处理器采用等分方法将具有相同敏感属性值的个体等分到m个等价类中,从而达到最佳状态。
与现有的技术相比,本发明具有如下优点和有益效果:
①达到了相对意义上的最高准确性和最高安全性;
②方法简介,显著提高了模糊化处理器的模糊化效率。
本发明适用于隐私信息匿名发布系统中具有个人隐私信息的数据发布。
附图说明
图1是隐私信息匿名发布系统的结构方框图;
图2是本方法的具体实施例流程图;
图3是本方法步骤③的具体工作流程图。
图中:
10—隐私信息匿名发布系统,
11—隐私信息数据库,
12—模糊化处理器,
13—信息发布器。
具体实施方式
下面结合附图和实施例详细说明:
一、系统
1、总体
如图1,隐私信息匿名发布系统10包括标隐私信息数据库11、模糊化处理器12和信息发布器13;
其连接关系是:
隐私信息数据库11、模糊化处理器12和信息发布器13依次连接。
隐私信息数据库11将个体的隐私信息以表格的形式进行存储;模糊化处理器12从隐私信息数据库11获取个体的隐私信息表格,采用最优模糊化方法对隐私信息表格进行模糊化,并将模糊化后的表格传送至信息发布器13;信息发布器13对外发布被模糊化处理后的表格。
2、功能块(结构及其功能)
1)隐私信息数据库11
隐私信息数据库11是一种信息存储部件。
功能:记录所有个体的信息,每个个体的信息包括若干属性值,这些属性包括标识属性、拟标识属性和敏感属性。
2)模糊化处理器12
模糊化处理器12是一种数据处理装置:
将从隐私信息数据库11内已知数量值W(个体总数)、已知数量值n(敏感属性值种类的数量)、固定参数d(最大数量比例偏离)和参数q(最小数量比例) 代入公式中并得到二分法划分轮数r;再按照可重合区间划分方法将具有相同敏感属性值的个体按照数量等分至2r个等价类;又对每个等价类中所有个体的敏感属性值进行模糊化,使所有个体的敏感属性值保持相同;最后将得到的模糊化表格数据送至信息发布器13。
3)信息发布器13
信息发布器13是一种公共信息发布装置。
功能:外界的用户可以自由申请访问信息发布器13中的公共信息,信息发布器13响应访问并对外界用户传输被模糊化的个人信息。
二、方法
如图2,本方法包括以下步骤:
①提取信息-201
模糊化处理器12从隐私信息数据库11中提取所有个体的所有属性信息并记录在表格中,个体的属性分为标识属性、拟标识属性和敏感属性;
②数量统计和预运算-202
模糊化处理器12将已知数量值W(个体总数)、已知数量值n(敏感属性值的数量)、固定参数d(最大数量比例偏离)和参数q(最小数量比例)代入公式中并得到二分法划分轮数r;
③等价类划分-203
模糊化处理器12按照可重合区间划分方法将具有相同敏感属性值的个体按照数量等分至2r个等价类;
④模糊化处理-204
模糊化处理器12对每个等价类中所有个体的敏感属性值进行模糊化,使所有个体的敏感属性值保持相同,并将得到的模糊化表格数据送至信息发布器。
⑤信息发布-205:
信息发布器13将经过模糊化的表格信息对外发布。
如图3,所述步骤③的具体工作流程如下:
A、线性化处理—3-1
模糊化处理器将c种拟标识属性(Ag)线性化,并令h=0、g=0、j=0;
B、模糊化处理器判断划分轮数h是否小于等于最大值r—3-2,如果是则进入步骤C,否则结束流程;
C、模糊化处理器判断拟标识属性序号g是否小于等于最大值c—3-3,如果是则进入步骤D,否则令g=1并进入步骤D;
D、模糊化处理器判断敏感属性值序号j是否小于等于最大值n—3-4,如果是则进入步骤E,否则跳转到步骤B;
E、等分处理—3-5
模糊化处理器将每个等价类中具有第j种敏感属性值的个体按照Ag的线性分布等分到两个新等价类中209,再回步骤D。

Claims (4)

1.一种隐私信息匿名发布系统,其特征在于:
包括标隐私信息数据库(11)、模糊化处理器(12)和信息发布器(13);
其连接关系是:
隐私信息数据库(11)、模糊化处理器(12)和信息发布器(13)依次连接;
隐私信息数据库(11)将个体的隐私信息以表格的形式进行存储;模糊化处理器(12)从隐私信息数据库(11)获取个体的隐私信息表格,采用最优模糊化方法对隐私信息表格进行模糊化,并将模糊化后的表格传送至信息发布器(13);信息发布器(13)对外发布被模糊化处理后的表格。
2.按权利要求1所述的一种隐私信息匿名发布系统,其特征在于
所述的模糊化处理器(12)是一种数据处理装置;
将从隐私信息数据库(11)内已知数量值W(个体总数)、已知数量值n(敏感属性值种类的数量)、固定参数d(最大数量比例偏离)和参数q(最小数量比例)代入公式中并得到二分法划分轮数r;再按照可重合区间划分方法将具有相同敏感属性值的个体按照数量等分至2r个等价类;又对每个等价类中所有个体的敏感属性值进行模糊化,使所有个体的敏感属性值保持相同;最后将得到的模糊化表格数据送至信息发布器(13)。
3.基于权利要求1-2所述隐私信息匿名发布系统的个体信息的模糊化方法,其特征在于包括下列步骤:
①模糊化处理器(12)从隐私信息数据库(11)中提取所有个体的所有属性信息并记录在表格中;
②模糊化处理器(12)将已知数量值W(个体总数)、已知数量值n(敏感属性值的数量)、固定参数d(最大数量比例偏离)和参数q(最小数量比例)代入公式中并得到二分法划分轮数r;
③模糊化处理器(12)按照可重合区间划分方法将具有相同敏感属性值的个体按照数量等分至2r个等价类;
④模糊化处理器(12)对每个等价类中所有个体的敏感属性值进行模糊化,使所有个体的敏感属性值保持相同,并将得到的模糊化表格数据送至信息发布器;
⑤信息发布器(13)将经过模糊化的表格信息对外发布。
4.按权利要求3所述的个体信息的模糊化方法,其特征在于所述的步骤③:
A、线性化处理(3-1)
模糊化处理器将c种拟标识属性(Ag)线性化,并令h=0、g=0、j=0;
B、模糊化处理器判断划分轮数h是否小于等于最大值r(3-2),如果是则进入步骤C,否则结束流程;
C、模糊化处理器判断拟标识属性序号g是否小于等于最大值c(3-3),如果是则进入步骤D,否则令g=1并进入步骤D;
D、模糊化处理器判断敏感属性值序号j是否小于等于最大值n(3-4),如果是则进入步骤E,否则跳转到步骤B;
E、等分处理(3-5)
模糊化处理器将每个等价类中具有第j种敏感属性值的个体按照Ag的线性分布等分到两个新等价类中209,再回步骤D。
CN201711164472.0A 2017-11-21 2017-11-21 用于隐私信息匿名发布系统中个体信息的模糊化方法 Expired - Fee Related CN107943925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711164472.0A CN107943925B (zh) 2017-11-21 2017-11-21 用于隐私信息匿名发布系统中个体信息的模糊化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711164472.0A CN107943925B (zh) 2017-11-21 2017-11-21 用于隐私信息匿名发布系统中个体信息的模糊化方法

Publications (2)

Publication Number Publication Date
CN107943925A true CN107943925A (zh) 2018-04-20
CN107943925B CN107943925B (zh) 2021-06-01

Family

ID=61929474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711164472.0A Expired - Fee Related CN107943925B (zh) 2017-11-21 2017-11-21 用于隐私信息匿名发布系统中个体信息的模糊化方法

Country Status (1)

Country Link
CN (1) CN107943925B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726589A (zh) * 2018-12-22 2019-05-07 北京工业大学 一种面向众智云环境的隐私数据访问方法
CN110287711A (zh) * 2019-06-06 2019-09-27 广东技术师范大学 一种保护用户隐私的分析方法
CN112765659A (zh) * 2021-01-20 2021-05-07 丁同梅 针对大数据云服务的数据泄露防护方法及大数据服务器

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8621026B2 (en) * 2011-09-11 2013-12-31 Microsoft Corporation Batching notifications to optimize for battery life
US8914024B2 (en) * 2008-01-10 2014-12-16 Ximoxi, Inc. Discovery of network members by personal attributes
CN104394509A (zh) * 2014-11-21 2015-03-04 西安交通大学 一种高效的差分扰动位置隐私保护系统及方法
CN106657606A (zh) * 2016-11-16 2017-05-10 努比亚技术有限公司 一种照片处理方法、装置及终端
CN106803784A (zh) * 2017-03-30 2017-06-06 福州大学 安全多媒体云存储中基于格的多用户模糊可搜索加密方法
US20170220652A1 (en) * 2016-02-03 2017-08-03 Facebook, Inc. Search-Results Interfaces for Content-Item-Specific Modules on Online Social Networks

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8914024B2 (en) * 2008-01-10 2014-12-16 Ximoxi, Inc. Discovery of network members by personal attributes
US8621026B2 (en) * 2011-09-11 2013-12-31 Microsoft Corporation Batching notifications to optimize for battery life
CN104394509A (zh) * 2014-11-21 2015-03-04 西安交通大学 一种高效的差分扰动位置隐私保护系统及方法
US20170220652A1 (en) * 2016-02-03 2017-08-03 Facebook, Inc. Search-Results Interfaces for Content-Item-Specific Modules on Online Social Networks
CN106657606A (zh) * 2016-11-16 2017-05-10 努比亚技术有限公司 一种照片处理方法、装置及终端
CN106803784A (zh) * 2017-03-30 2017-06-06 福州大学 安全多媒体云存储中基于格的多用户模糊可搜索加密方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726589A (zh) * 2018-12-22 2019-05-07 北京工业大学 一种面向众智云环境的隐私数据访问方法
CN109726589B (zh) * 2018-12-22 2021-11-12 北京工业大学 一种面向众智云环境的隐私数据访问方法
CN110287711A (zh) * 2019-06-06 2019-09-27 广东技术师范大学 一种保护用户隐私的分析方法
CN110287711B (zh) * 2019-06-06 2021-07-16 广东技术师范大学 一种保护用户隐私的分析方法
CN112765659A (zh) * 2021-01-20 2021-05-07 丁同梅 针对大数据云服务的数据泄露防护方法及大数据服务器
CN112765659B (zh) * 2021-01-20 2021-09-21 曙光星云信息技术(北京)有限公司 针对大数据云服务的数据泄露防护方法及大数据服务器

Also Published As

Publication number Publication date
CN107943925B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN107888557B (zh) 一种协议文件的生成方法及其系统
CN105187365B (zh) 基于角色和数据项的访问控制方法及装置
CN103995879B (zh) 基于olap系统的数据查询方法、装置及系统
US10346620B2 (en) Systems and methods for authentication of access based on multi-data source information
CN107943925A (zh) 用于隐私信息匿名发布系统中个体信息的模糊化方法
HK1080317A1 (en) System and method for accessing contact information on a communication device
CN109597822B (zh) 一种用户数据的存储及查询方法和用户数据处理装置
CN104732154A (zh) 将数据匿名化的方法和系统
CN104537764A (zh) 一种医保卡异常使用的检测方法和检测系统
CN107766470B (zh) 一种数据分享的智能统计方法、智能统计显示方法及装置
CN108140152A (zh) 计算机实现的追踪机制及数据管理
CN106504097A (zh) 一种资产信息的处理方法和装置
US20150254783A1 (en) Systems and methods for estate account discovery
CN109213781A (zh) 风控数据查询方法及装置
CN107423960A (zh) 一种数字票据的管理方法及其系统
CN111476596A (zh) 基于同源设备的家庭人口数据处理方法、系统及存储介质
CN109657873A (zh) 电子政务的事项服务优化方法、系统、存储介质及设备
US20150310226A1 (en) Methods, Systems, and Products for Anonymous Loan Documents
CA2891449A1 (en) Third-party communications to social networking system users using user descriptors
CN116091394A (zh) 一种基于深度学习的虫子种类以及数量图像识别算法
CN108962362A (zh) 一种医疗信息处理方法及装置
CN111078774A (zh) 一种数据的自动整合方法
CN109784084B (zh) 数据交易方法、装置和系统
CN103678626A (zh) 网站点评的方法和装置
CN110135190B (zh) 数据管理方法、服务器及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210601

Termination date: 20211121