CN103902924A - 社交网络数据发布的混合随机化隐私保护方法 - Google Patents
社交网络数据发布的混合随机化隐私保护方法 Download PDFInfo
- Publication number
- CN103902924A CN103902924A CN201410154786.2A CN201410154786A CN103902924A CN 103902924 A CN103902924 A CN 103902924A CN 201410154786 A CN201410154786 A CN 201410154786A CN 103902924 A CN103902924 A CN 103902924A
- Authority
- CN
- China
- Prior art keywords
- limit
- point
- social network
- randomization
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000011160 research Methods 0.000 description 2
- 244000097202 Rathbunia alamosensis Species 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0407—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the identity of one or more communicating identities is hidden
- H04L63/0421—Anonymous communication, i.e. the party's identifiers are hidden from the other party or parties, e.g. using an anonymizer
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Bioethics (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Medical Informatics (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Storage Device Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
社交网络数据发布的混合随机化隐私保护方法,是把表示社交网络数据的无向图G(V,E)的顶点V,以k-匿名为条件,按照度的数量分为两个集合Vk和Vr,Vk中包含度的数量满足k-匿名条件的点;Vr中包含不满足k-匿名条件的点;对Vk集合中的点不做处理;对Vr集合中的点进行随机化保护处理。该方法将现有的k-匿名法和随机化的方法结合,不改变社交网络用户数目,对提供给第三方的数据的性质和质量影响较小,处理过程简单,速度快。经过处理后,社交网络数据中每个个人数据会处于两种保护状态之一:度属性没有改变,处于至少k个和他的度属性相同的其他个人之中;或度属性改变。这种保护能够阻止采用结构背景知识的重定位攻击,满足社交网络用户对隐私安全的需求。
Description
技术领域
本发明涉及数据安全领域,具体是网络数据中隐私的保护技术,更具体是社交网络数据发布的混合随机化隐私保护方法。
背景技术
随着网络信息技术的发展,互联网已经渗入到我们生活的各个方面。社会网络服务如:新浪微博、QQ空间、人人网、淘宝网、LinkedIn和Google+等大量出现。社会网络的出现,改变了我们同朋友的联系方式,拓展了我们的交际范围,提供了更加直接快速的信息交流和传播方式。随着智能手机、平板及可穿戴智能设备的普及,人们在线的时间越来越多,提供给网络的数据越来越详细,互联网将逐步和现实世界产生融合。使用这些社会网络服务给我们生活带来极大的便利,同时也产生了大量的有关我们个人信息的数据如年龄、性别、爱好、照片、位置等,其中有些是我们不想让他人知道的个人隐私的信息。但是这些数据是存放在社会网络服务提供商处的,由于科研、商业,或是政府的要求,服务商会把他们所收集的数据发布给第三方使用。如果发布数据不当,将会泄露用户的个人隐私信息。如果个人隐私被泄露,将会带来不可估量的损失。因此迫切需要一种安全的社会网络数据发布方法,在保护个人隐私数据安全的情况下,尽可能大的保持原始数据的可用性,满足第三方对社会网络数据的分析研究和其他方面的需求。
社交网络数据,由于其关系复杂性,一般用图数据结构表示。对这些数据发布前需进行隐私保护处理,目前主要使用k-匿名的隐私保护方法、以k-匿名为基础的l-不同、t-接近等方法。这些方法其核心思想都是把个体隐藏在群体中,以不可区分性来保护个体的隐私。这些已有方法为了隐藏个体标识信息,通过添加虚拟用户,虚拟关系等方式对原始数据进行更改,对原始数据改变较大,对数据的可用性有较大影响。
发明内容
本发明的目的是提供一种社交网络数据发布的混合随机化隐私保护方法。
本发明是针对社交网络图数据的结构属性进行保护的。社交网络数据发布前,首先进行初步匿名工作,去掉姓名,身份证等显式的标识符并分离一般属性和结构属性,一般属性如年龄、爱好、地区等采用二维表表示,结构属性采用无向图G(V,E)表示,他们之间的联系用重新编号的标识符表示,其中V是顶点的有限集合,表示社交网络中的个人或其他实体;E是V上的二元关系,即用户或实体间的关系,如朋友、同学、共同爱好等关系,也叫做一条边,每个顶点的度表示与该顶点相关的二元关系的个数,即边的数量。经过上述处理的数据,能够有效防止攻击者使用背景知识,如某个用户朋友列表,对这个用户在发布的数据中重新定位。
本发明的方法的具体步骤如下:
1)把无向图G(V,E)的顶点V,以是否满足k-匿名为条件分为两个集合Vk和Vr,Vk中存放满足k-匿名条件的点;Vr中存放不满足k-匿名条件的点;
2)对Vk,由于满足k-匿名不需要继续处理;对Vr集合中的点进行下述处理:
3)随机选择重复次数n;
4)对于Vr中点,随机的(等概率的)在原来没有边的两点间添加m条边,然后再随机在原来有边的顶点间去掉m条边。
5)依次检测Vr中点的度,删除Vr中度有变化的点;
6)n=n-1
7)如果重复次数n大于零且Vr非空,转到步骤4);否则转到步骤8)。
8)判读Vr中的点是否为奇数,如果为奇数转步骤9),否则转步骤10)。
9)在Vr中随机选择两点,如果他们间有边就去掉这条边,否则在他们之间增加一条边。在Vr中移除这两点中的一点。
10)对于Vr中的点,随机选择两两组合,如果他们间原本有边就去掉边;原本没有边添加一条边;
11)结束;
在步骤1),k-匿名条件的k值范围为2~20,,由用户根据需求选择,优选为10。
在步骤3),随机数n范围为:1~10。
在步骤4),m为:10~100%Vr中包含的点,优选为:20~40%Vr中包含的点。
本发明的方法是将已有技术中的k-匿名法和改变度属性的方法进行结合,并对原有的改变度属性的方法进行改进,不会影响提供给第三方的数据的性质和质量,也不改变数量,处理过程简单,速度快。
经过上述处理后,将数据进行发布或提供给第三方使用,这样,社交网络数据中每个个人数据就会处于两种保护状态之一:1.度属性没有改变,处于至少k个和他的度属性相同的其他个人之中;2.度属性改变。
处于状态1的个人数据,攻击者根据背景信息只能定位到至少k个体;
处于状态2的个人数据,攻击者根据背景信息不能够确定攻击目标。
本方法能够很好的保护社交网络参与者的个人隐私信息,这种保护能够阻止采用结构背景知识的重定位攻击。本发明结合已有技术的方法思想,在个体标识信息隐藏过程中结合随机换的概率思想,规避掉个体标识信息必须成组的复杂问题,巧妙而有效的的解决了社交网络数据发布的隐私保护问题。
附图说明
图1是本发明方法的具体流程图。
具体实施方式
测试数据集采用Facebook的朋友圈数据集,下载地址:http://snap.stanford.edu/data/ 。数据集经过处理,包含534位有朋友的用户和3466条朋友关系。
参照图1,按照本发明的方法,首先进行初步匿名工作,去掉显式的标识符如姓名,身份证等,并分离一般属性和结构属性,一般属性如年龄、爱好、地区等采用二维表表示,结构属性采用无向图G(V,E)表示,他们之间的联系用重新编号的标识符表示,其中V是顶点的有限集合,表示社交网络中的个人或其他实体;E是V上的二元关系,即用户或实体间的关系,如朋友、同学、共同爱好等关系,也叫做一条边,每个顶点的度表示与该顶点相关的二元关系的个数,即边的数量。
然后,选择k=5,完成步骤1)后Vk中包含480个点,Vr中包含54个点。
然后,对Vk中的点不作处理;对Vr中的点进行下述处理:
在步骤3)随机选择重复次数n如n=1,
步骤4)中取m为50% Vr中包含的点,则m为27,
完成步骤5)有45个点的度发生改变,9个点的度没有变,删除这45个度有变化的点;
步骤6)n的值减少1,变为0,由于n不大于0(等于0),按照步骤7)转到步骤8),
由于Vr中的点是9,为奇数,所以转到步骤9),在这9个点中,随机选择两点,如果它们间有边就去掉这条边,否则在他们之间增加一条边,之后在移除这两点中的一点;Vr中顶点数又减少了一个,变成8个,为偶数。
之后按照步骤10)随机选择两两组合,如果它们间原本有边就去掉边,原本没有边添加一条边,完成整个处理过程。
Claims (7)
1.社交网络数据发布的混合随机化隐私保护方法,其特征在于:首先进行数据预处理,并采用无向图G(V,E)表示数据的结构属性,然后按照下述具体步骤:
1)把无向图G(V,E)的顶点V,以是否满足k-匿名为条件分为两个集合Vk和Vr,Vk中存放满足k-匿名条件的点;Vr中存放不满足k-匿名条件的点;
2)对Vk中的点不作处理;对Vr中的点进行下述处理:
3)随机选择重复次数n;
4)对于Vr中点,随机地在原来没有边的两点间添加m条边,然后再随机在原来有边的顶点间去掉m条边;
5)依次检测Vr中点的度,删除Vr中度有变化的点;
6)n=n-1;
7)如果重复次数n大于零且Vr非空,转到步骤4);否则转到步骤8);
8)判读Vr中的点是否为奇数,如果为奇数转步骤9),否则转步骤10);
9)在Vr中随机选择两点,如果它们间有边就去掉这条边,否则在他们之间增加一条边;之后在Vr中移除这两点中的一点;
10)随机选择两两组合,如果它们间原本有边就去掉边;原本没有边添加一条边;
11)结束。
2.根据权利要求1所述的隐私保护方法,其特征在于:所述数据预处理,首先进行初步匿名工作,去掉显式的标识符如姓名、身份证,并分离一般属性和结构属性;
所述一般属性如年龄、爱好和地区采用二维表表示;
所述结构属性采用无向图G(V,E)表示,他们之间的联系用重新编号的标识符表示,其中V是顶点的有限集合,表示社交网络中的个人或其他实体;E是V上的二元关系,即用户或实体间的关系,如朋友关系、同学关系或共同爱好关系,也叫做一条边,每个顶点的度表示与该顶点相关的二元关系的个数,即边的数量。
3.根据权利要求1所述的隐私保护方法,其特征在于:在步骤1),k-匿名条件的k值范围为2~20。
4.根据权利要求1或所述的隐私保护方法,其特征在于:在步骤1),k-匿名条件的k值范围为10。
5.根据权利要求1所述的隐私保护方法,其特征在于:在步骤3),随机数n范围为:1~10。
6.根据权利要求1所述的隐私保护方法,其特征在于:在步骤4),m为:10~100%Vr中包含的点。
7.根据权利要求1或6所述的隐私保护方法,其特征在于:在步骤4),m为:20~40%Vr中包含的点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410154786.2A CN103902924B (zh) | 2014-04-17 | 2014-04-17 | 社交网络数据发布的混合随机化隐私保护方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410154786.2A CN103902924B (zh) | 2014-04-17 | 2014-04-17 | 社交网络数据发布的混合随机化隐私保护方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103902924A true CN103902924A (zh) | 2014-07-02 |
CN103902924B CN103902924B (zh) | 2016-07-06 |
Family
ID=50994237
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410154786.2A Active CN103902924B (zh) | 2014-04-17 | 2014-04-17 | 社交网络数据发布的混合随机化隐私保护方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103902924B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104318167A (zh) * | 2014-10-07 | 2015-01-28 | 北京理工大学 | 一种改进的k-匿名中准标识符求解方法 |
CN104361123A (zh) * | 2014-12-03 | 2015-02-18 | 中国科学技术大学 | 一种个人行为数据匿名化方法及系统 |
CN105138928A (zh) * | 2015-08-14 | 2015-12-09 | 重庆邮电大学 | 一种基于缓存机制的社交网络隐私保护方法 |
CN106599725A (zh) * | 2016-12-22 | 2017-04-26 | 广西师范大学 | 图数据发布的随机化隐私保护方法 |
CN107104962A (zh) * | 2017-04-24 | 2017-08-29 | 广西师范大学 | 动态网络多次发布中防止标签邻居攻击的匿名方法 |
CN107179954A (zh) * | 2017-04-25 | 2017-09-19 | 内蒙古科技大学 | 一种保持节点可达性的分布式社会网络隐私保护方法 |
CN107689950A (zh) * | 2017-06-23 | 2018-02-13 | 平安科技(深圳)有限公司 | 数据发布方法、装置、服务器和存储介质 |
CN107742083A (zh) * | 2017-10-31 | 2018-02-27 | 华中科技大学 | 一种面向大规模图数据发布的隐私保护方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110197255A1 (en) * | 2009-08-12 | 2011-08-11 | Telcordia Technologies, Inc. | Social network privacy by means of evolving access control |
CN103279713A (zh) * | 2013-06-08 | 2013-09-04 | 广西师范大学 | 一种优化的社交网络图数据发布隐私保护方法 |
-
2014
- 2014-04-17 CN CN201410154786.2A patent/CN103902924B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110197255A1 (en) * | 2009-08-12 | 2011-08-11 | Telcordia Technologies, Inc. | Social network privacy by means of evolving access control |
CN103279713A (zh) * | 2013-06-08 | 2013-09-04 | 广西师范大学 | 一种优化的社交网络图数据发布隐私保护方法 |
Non-Patent Citations (2)
Title |
---|
MINGXUAN YUAN,ETC: "Protecting Sensitive Labels in Social Network Data Anonymization", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 * |
兰丽辉等: "社会网络数据的k-匿名发布", 《计算机科学》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104318167A (zh) * | 2014-10-07 | 2015-01-28 | 北京理工大学 | 一种改进的k-匿名中准标识符求解方法 |
CN104361123B (zh) * | 2014-12-03 | 2017-11-03 | 中国科学技术大学 | 一种个人行为数据匿名化方法及系统 |
CN104361123A (zh) * | 2014-12-03 | 2015-02-18 | 中国科学技术大学 | 一种个人行为数据匿名化方法及系统 |
CN105138928B (zh) * | 2015-08-14 | 2018-06-26 | 重庆邮电大学 | 一种基于缓存机制的社交网络隐私保护方法 |
CN105138928A (zh) * | 2015-08-14 | 2015-12-09 | 重庆邮电大学 | 一种基于缓存机制的社交网络隐私保护方法 |
CN106599725A (zh) * | 2016-12-22 | 2017-04-26 | 广西师范大学 | 图数据发布的随机化隐私保护方法 |
CN106599725B (zh) * | 2016-12-22 | 2019-05-10 | 广西师范大学 | 图数据发布的随机化隐私保护方法 |
CN107104962A (zh) * | 2017-04-24 | 2017-08-29 | 广西师范大学 | 动态网络多次发布中防止标签邻居攻击的匿名方法 |
CN107104962B (zh) * | 2017-04-24 | 2020-02-07 | 广西师范大学 | 动态网络多次发布中防止标签邻居攻击的匿名方法 |
CN107179954A (zh) * | 2017-04-25 | 2017-09-19 | 内蒙古科技大学 | 一种保持节点可达性的分布式社会网络隐私保护方法 |
CN107179954B (zh) * | 2017-04-25 | 2020-07-31 | 内蒙古科技大学 | 一种保持节点可达性的分布式社会网络隐私保护方法 |
CN107689950A (zh) * | 2017-06-23 | 2018-02-13 | 平安科技(深圳)有限公司 | 数据发布方法、装置、服务器和存储介质 |
WO2018233051A1 (zh) * | 2017-06-23 | 2018-12-27 | 平安科技(深圳)有限公司 | 数据发布方法、装置、服务器和存储介质 |
US10848466B2 (en) | 2017-06-23 | 2020-11-24 | Ping An Technology (Shenzhen) Co., Ltd. | Method, server and storage medium for data distribution |
CN107742083A (zh) * | 2017-10-31 | 2018-02-27 | 华中科技大学 | 一种面向大规模图数据发布的隐私保护方法及系统 |
CN107742083B (zh) * | 2017-10-31 | 2019-10-25 | 华中科技大学 | 一种面向大规模图数据发布的隐私保护方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103902924B (zh) | 2016-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103902924B (zh) | 社交网络数据发布的混合随机化隐私保护方法 | |
US10554601B2 (en) | Spam detection and prevention in a social networking system | |
Gharibi et al. | Cyber threats in social networking websites | |
Gorwa | Computational propaganda in Poland: False amplifiers and the digital public sphere | |
CN101415010B (zh) | Web浏览装置及其操作方法 | |
Sorell | Human rights and hacktivism: The cases of wikileaks and anonymous | |
He et al. | A defence scheme against identity theft attack based on multiple social networks | |
Beye et al. | Privacy in online social networks | |
WO2010150251A1 (en) | Method and system of monitoring a network based communication among users | |
KR101064735B1 (ko) | 수신인 불특정 메시지 교환 서비스 제공 방법 | |
Beye et al. | Literature overview-privacy in online social networks | |
Mahmood | New privacy threats for facebook and twitter users | |
CN102915306A (zh) | 一种搜索方法和系统 | |
Tiwari | Analysis and detection of fake profile over social network | |
Bergh | Social network centric warfare–understanding influence operations in social media | |
CN117957827A (zh) | 在通信平台中建立新连接 | |
Wise et al. | SOCIAL NETWORKING AND THE EXCHANGE OF INFORMATION. | |
Rao et al. | Evolving cyber threats, combating techniques, and open issues in online social networks | |
Saez-Trumper et al. | High Correlation between Incoming and Outgoing Activity: A Distinctive Property of Online Social Networks? | |
Décary-Hétu | Information exchange paths in IRC hacking chat rooms | |
Krubhala et al. | Online social network-a threat to privacy and security of human society | |
McCoy | 140 characters or less: Maintaining privacy and publicity in the age of social networking | |
CN105378789A (zh) | 创建联系人列表和预添置用户帐号 | |
CN105488038B (zh) | 通信应用的个性化信息匹配方法及装置 | |
Revathi et al. | An intelligent and novel algorithm for securing vulnerable users of online social network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210326 Address after: 100043 No.291, commercial building, 2nd floor, building 1, jianxiyuan Zhongli, Haidian District, Beijing Patentee after: Beijing Ruihang Zhizhen Technology Co.,Ltd. Address before: 541004 No. 15 Yucai Road, Qixing District, Guilin, the Guangxi Zhuang Autonomous Region Patentee before: Guangxi Normal University |