CN109858282A - 一种社交网络关系数据隐私保护方法及系统 - Google Patents

一种社交网络关系数据隐私保护方法及系统 Download PDF

Info

Publication number
CN109858282A
CN109858282A CN201910110712.1A CN201910110712A CN109858282A CN 109858282 A CN109858282 A CN 109858282A CN 201910110712 A CN201910110712 A CN 201910110712A CN 109858282 A CN109858282 A CN 109858282A
Authority
CN
China
Prior art keywords
data
user
privacy
indicate
social network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910110712.1A
Other languages
English (en)
Other versions
CN109858282B (zh
Inventor
康海燕
张书旋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Information Science and Technology University
Original Assignee
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University filed Critical Beijing Information Science and Technology University
Priority to CN201910110712.1A priority Critical patent/CN109858282B/zh
Publication of CN109858282A publication Critical patent/CN109858282A/zh
Application granted granted Critical
Publication of CN109858282B publication Critical patent/CN109858282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种社交网络关系数据隐私保护方法及系统,该方法包括:获取社交网络数据图;根据社交网络数据图,获取用户属性向量集;根据用户属性向量集,采用Skyline方法计算用户隐私泄露等级;根据用户隐私泄露等级,对社交网络数据图进行分组,获得多个数据子图;对各数据子图采用不同的阈值进行抽样,获取抽样后的数据子图;对各采样后的数据子图进行整合,获得整合后的数据图;对整合后的数据图进行加噪处理,获取加噪后的数据图,并将加噪后的数据图进行发布。本发明中为每个数据子图设定不同的采样阈值,以实现不同用户的差分隐私保护,更有针对性,在保证数据安全性的同时更提高了数据的可用性。

Description

一种社交网络关系数据隐私保护方法及系统
技术领域
本发明涉及数据隐私保护技术领域,特别是涉及一种社交网络关系数据隐私保护方法及系统。
背景技术
随着互联网的普及与发展,围绕用户和用户关系的社交网络在世界范围内迅猛发展,社交网络为用户提供信息分享和信息交流的同时,也可能会产生用户隐私泄露的风险,社交网络隐私信息可以分为两种:一种隐私是用户敏感信息隐私,比如用户的手机号码、家庭住址、疾病、收入等;另一种隐私是社交网络关系隐私,即社交网络中人与人之间的连接关系信息,如亲属关系,同学关系。在社交网络中上述隐私之间往往相互关联、相互影响,无论是哪种类型隐私信息的披露都可能会使个人的隐私受到威胁。因此,如何更好地在社交网络中保护用户隐私,成为当前大众关注的焦点。
目前的数据隐私保护局限于为所有用户提供相同级别的隐私保护,但实际生活中并非所有用户都需要相同的隐私级别。因此,亟待一种能够实现对不同用户隐私进行差别的保护,避免对那些不需要太高隐私级别的用户提供过多的隐私保护。
发明内容
基于此,有必要提供一种社交网络关系数据隐私保护方法及系统,以实现不同用户的差分隐私保护。
为实现上述目的,本发明提供了如下方案:
一种社交网络关系数据隐私保护方法,所述方法包括:
获取社交网络数据图;
根据所述社交网络数据图,获取用户属性向量集;
根据所述用户属性向量集,采用Skyline方法计算用户隐私泄露等级;
根据所述用户隐私泄露等级,对所述社交网络数据图进行分组,获得多个数据子图;
对各所述数据子图采用不同的阈值进行抽样,获取抽样后的数据子图,所述抽样后的数据子图为从所述数据子图中抽取的样本构成的数据图;
对各所述采样后的数据子图进行整合,获得整合后的数据图;
对所述整合后的数据图进行加噪处理,获取加噪后的数据图,并将加噪后的数据图进行发布。
可选的,所述方法还包括:对加噪后的数据图采用差分隐私进行验证,具体包括:设有随机算法M,Range(M)表示算法M生成的所有结果集,对于数据集D、D′和若满足Pr[M(D)∈O]≤eε·Pr[M(D′)∈O],则数据进行发布,其中,D表示社交网络数据图,D′表示加噪后的数据图,概率Pr由算法M确定,表示隐私被披露的风险,参数ε称为隐私保护预算,ε=min{Qi,Qj},Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,N表示所述社交网络数据图中用户的个数。
可选的,所述根据社交网络数据图,获取用户属性向量集,具体包括:
计算用户在一跳内连接的用户数量,记为第一跳连接点数量;
计算用户在两跳内连接的用户数量,记为第二跳连接点数量;
根据所述第一跳连接点数量和用户隐私要求,计算邻接点威胁等级
其中,Ti表示第i个用户的邻接点威胁等级,Qj表示第j个用户的隐私要求,CFP1j表示第j个用户第一跳连接点数量,1≤i≤N,1≤j≤N,N表示所述社交网络数据图中用户的个数。
可选的,所述对各所述数据子图采用不同的阈值进行抽样,获取抽样后的数据子图,具体包括:
在第一阈值t下,计算各边被抽取的概率:
其中,eij表示第i个用户和第j个用户的边,t表示第一阈值,P(eij,t)表示eij在阈值t时被抽到的概率,minQv≤t≤maxQv,Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,Qv表示社交网络数据图中所有用户的隐私要求;
根据所述边被抽取的概率P(eij,t)和第二阈值S(k)进行抽样,若P(eij,t)小于S(k),则该边被删除,其中S(k)表示第k个数据子图的阈值,1≤k≤R,R表示数据子图的个数。
可选的,所述对所述整合后的数据图采用拉普拉斯机制或指数机制进行加噪处理,获取加噪后的数据图。
可选的,所述系统包括:
数据获取模块,用于获取社交网络数据图;
数据处理模块,用于根据所述社交网络数据图,获取用户属性向量集;
用户隐私泄露等级计算模块,用于根据所述用户属性向量集,采用Skyline方法计算用户隐私泄露等级;
分组模块,用于根据所述用户隐私泄露等级,对所述社交网络数据图进行分组,获得多个数据子图;
抽样模块,用于对各所述数据子图采用不同的阈值进行抽样,获取抽样后的数据子图,所述抽样后的数据子图为从所述数据子图中抽取的样本构成的数据图;
数据整合模块,用于对各所述采样后的数据子图进行整合,获得整合后的数据图;
加噪模块,用于对所述整合后的数据图进行加噪处理,获取加噪后的数据图,并将加噪后的数据图进行发布。
可选的,所述系统还包括:验证模块,用于对加噪后的数据图采用差分隐私进行验证,设有随机算法M,Range(M)表示算法M生成的所有结果集,对于数据集D、D若满足Pr[M(D)∈O]≤eε·Pr[M(D′)∈O],则数据进行发布,其中,D表示社交网络数据图,D′表示加噪后的数据图,概率Pr由算法M确定,表示隐私被披露的风险,参数ε称为隐私保护预算,ε=min{Qi,Qj},Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,N表示所述社交网络数据图中用户的个数。
可选的,所述数据处理模块,具体包括:
计算用户在一跳内连接的用户数量,记为第一跳连接点数量;
计算用户在两跳内连接的用户数量,记为第二跳连接点数量;
根据所述第一跳连接点数量和用户隐私要求,计算邻接点威胁等级
其中,Ti表示第i个用户的邻接点威胁等级,Qj表示第j个用户的隐私要求,CFP1j表示第j个用户第一跳连接点数量,1≤i≤N,1≤j≤N,N表示所述社交网络图数据中用户的个数。
可选的,所述抽样模块,具体包括:
在第一阈值t下,计算各边被抽取的概率:
其中,eij表示第i个用户和第j个用户的边,t表示第一阈值,P(eij,t)表示eij在阈值t时被抽到的概率,minQv≤t≤maxQv,Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,Qv表示社交网络数据图中所有用户的隐私要求;
根据所述边被抽取的概率P(eij,t)和第二阈值S(k)进行抽样,若P(eij,t)小于S(k),则该边被删除,其中S(k)表示第k个数据子图的阈值,1≤k≤R,R表示数据子图的个数。
可选的,所述加噪模块,具体包括:对所述整合后的数据图采用拉普拉斯机制或指数机制进行加噪处理,获取加噪后的数据图。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明中为每个数据子图设定不同的采样阈值,然后对采样后的数据进行加噪处理,以实现不同用户的差分隐私保护,更有针对性,在保证数据安全性的同时更提高了数据的可用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种社交网络关系数据隐私保护方法的流程图;
图2为本发明实施例一种社交网络关系数据隐私保护系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种社交网络关系数据隐私保护方法及系统,以实现不同用户的差分隐私保护。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例一种社交网络关系数据隐私保护方法的流程图。
参见图1,实施例的一种社交网络关系数据隐私保护方法,包括以下步骤:
步骤S1:获取社交网络数据图。
本发明实施例中的社交网络数据图是从斯坦福大学大规模数据平台获取,其中包含微信、微博、Facebook等社交网络平台的数据集,数据集中包括用户的连接关系及相关属性。具体的,社交网络数据图被定义为一个无向无加权的图D=(V,E),V表示社交网络中用户实体的集合,即表示节点集,节点集中的一个节点代表一个用户,用户的个数记为N,E表示边集,边表示用户之间的关系(例如,友谊、合作和联系),e(vi,vj)∈E表示点vi和vj的边,每个用户都载有隐私要求Q,隐私要求Q是一个数值,用来表示用户的个性化的隐私偏好,Q值越小表示隐私要求越高,要求的隐私保护级别越高。本发明实施例中每个用户设置自己的隐私要求,以确保每个用户都能得到精确的隐私保护。
步骤S2:根据社交网络数据图,获取用户属性向量集。
所述步骤S2具体包括:
计算用户在一跳内连接的用户数量,记为第一跳连接点数量;计算用户在两跳内连接的用户数量,记为第二跳连接点数量;根据所述第一跳连接点数量和用户隐私要求,计算邻接点威胁等级,其中,Ti表示第i个用户的邻接点威胁等级,Qj表示第j个用户的隐私要求,CFP1j表示第j个用户第一跳连接点数量,1≤i≤N,1≤j≤N,N表示所述社交网络数据图中用户的个数。
邻接点威胁等级是指一个用户通过邻接点泄漏隐私信息的可能程度,一个用户具有越多的连接点,隐私要求越低,这个用户就越容易泄露相邻点的隐私信息。T值越小,相邻的用户数量越小且相邻用户的隐私要求越高,则该点的邻接点越安全,即邻接点威胁等级越低。
步骤S3:根据所述用户属性向量集,采用Skyline方法计算用户隐私泄露等级。
具体的,所述用户属性向量集由所有用户的属性向量构成,包括:第一跳连接点数量、第二跳连接点数量、用户隐私要求和邻接点威胁等级,其中,第i个用户的属性向量表示为{CFP1i,CFP2i,Qi,Ti},CFP2i表示第i个用户第二跳连接点数量。以用户的属性向量为决策标准采用Skyline方法计算用户隐私泄露等级,当采用Skyline方法计算第一条时,将第一条上的用户隐私泄露等级定义为L=1即L1,然后删除这些用户,计算第二条,此时将第二条上的用户隐私泄露等级定义为L=2即L2,以此类推。
步骤S4:根据所述用户隐私泄露等级,对所述社交网络数据图进行分组,获得多个数据子图;
CFP1值越小即第一跳连接点数量越少,CFP2值越小即第二跳连接点数量越少,Q值越小即隐私要求越高的用户,为隐私越不容易泄漏的用户。则L值越小,隐私越不容易被泄露。
本发明实施例中用户隐私泄露等级共分了m=100个等级,设定的分割系数k=10,分割系数k能根据具体数据集规模设定,m/k=10即每10个等级为一个数据子图,具体的L1至L10的用户存入数据子图1,L11至L20的用户存入数据子图2,以此类推。
步骤S5:对各所述数据子图采用不同的阈值进行抽样,获取抽样后的数据子图,所述抽样后的数据子图为从所述数据子图中抽取的样本构成的数据图。
所述步骤S5具体包括:
在第一阈值t下,计算各边被抽取的概率:
其中,eij表示第i个用户和第j个用户的边,t表示第一阈值,P(eij,t)表示eij在阈值t时被抽到的概率,minQv≤t≤maxQv,Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,Qv表示社交网络数据图中所有用户的隐私要求;
根据所述边被抽取的概率P(eij,t)和第二阈值S(k)进行抽样,若P(eij,t)小于S(k),则该边被删除,其中S(k)表示第k个数据子图的阈值,1≤k≤R,R表示数据子图的个数,本发明实施例中R=10。
本发明实施例中,根据实验结果数据对阈值进行设置,t=0.3,S(1)=0.7,S(k)=S(1)-0.05*(k-1)。具体的,根据实验结果数据的可用性和安全性综合考量对阈值进行设置。
步骤S6:对各所述采样后的数据子图进行整合,获得整合后的数据图。
具体的,在保留采样前数据子图间的连接关系条件下,对各所述采样后的数据子图进行整合,获得整合后的数据图。
步骤S7:对所述整合后的数据图进行加噪处理,获取加噪后的数据图,并将加噪后的数据图进行发布。
具体的,对所述整合后的数据图采用拉普拉斯机制或指数机制进行加噪处理,获取加噪后的数据图。
本发明实施例一种社交网络关系数据隐私保护方法,在进行数据发布前还包括步骤S8:对加噪后的数据图采用差分隐私进行验证,具体包括:设有随机算法M,Range(M)表示算法M生成的所有结果集,对于数据集D、D′和若满足Pr[M(D)∈O]≤eε·Pr[M(D′)∈O],则数据进行发布,其中,D表示社交网络数据图,D′表示加噪后的数据图,概率Pr由算法M确定,表示隐私被披露的风险,参数ε称为隐私保护预算,ε=min{Qi,Qj},Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,N表示所述社交网络数据图中用户的个数。
若不满足Pr[M(D)∈O]≤eε·Pr[M(D′)∈O],则返回步骤S7。加噪后的数据不满足上述公式,不仅限于通过返回步骤S7进行加噪处理,还可以通过重新采样。
差分隐私是一个强大的隐私保护模型,它为聚合数据分析提供强大的、优秀的隐私保证。但是该模型局限于为所有个人提供相同级别的隐私保护,但实际生活中并非所有用户都需要相同的隐私级别,因此本发明实施例中ε=min{Qi,Qj},对每个用户选取不同的隐私保护预算,从而实现差分隐私,满足不同用户的隐私要求。
在发布前应验证发布图的安全性和可用性。抵抗隐私攻击的能力能够反映数据的安全性,本实施例用隐私攻击的方法来验证数据的安全性,设定攻击者具有一定的背景知识,结合发布的社交网络图进行链接攻击,得出攻击结果的匹配度,将图数据结构特征参数中的平均最短路径及平均聚类系数与隐私保护之前原始数据集进行比较,验证社交网络图的可用性。
本实施例的一种社交网络关系数据隐私保护方法,对社交网络数据图进行分组,然后对每个数据子图设定不同的采样阈值,对采样后的数据进行加噪处理,以实现不同用户的差分隐私保护,更有针对性,在保证数据安全性的同时更提高了数据的可用性。
本发明还提供了一种社交网络关系数据隐私保护系统,图2为本发明实施例一种社交网络关系数据隐私保护系统的结构示意图,所述系统包括:
数据获取模块201,用于获取社交网络数据图。
数据处理模块202,用于根据社交网络数据图,获取用户属性向量集。
用户隐私泄露等级计算模块203,用于根据所述用户属性向量集,采用Skyline方法计算用户隐私泄露等级。
分组模块204,用于根据所述用户隐私泄露等级,对所述社交网络数据图进行分组,获得多个数据子图。
抽样模块205,用于对各所述数据子图采用不同的阈值进行抽样,获取抽样后的数据子图,所述抽样后的数据子图为从所述数据子图中抽取的样本构成的数据图。
数据整合模块206,用于对各所述采样后的数据子图进行整合,获得整合后的数据图。
加噪模块207,用于对所述整合后的数据图进行加噪处理,获取加噪后的数据图,并将加噪后的数据图进行发布。
作为一种可选的实施方式,本发明实施例社交网络关系数据隐私保护系统还包括:验证模块208,用于对加噪后的数据图采用差分隐私进行验证,设有随机算法M,Range(M)表示算法M生成的所有结果集,对于数据集D、D′和若满足Pr[M(D)∈O]≤eε·Pr[M(D′)∈O],则数据进行发布,其中,D表示社交网络数据图,D′表示加噪后的数据图,概率Pr由算法M确定,表示隐私被披露的风险,参数ε称为隐私保护预算,ε=min{Qi,Qj},Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,N表示所述社交网络数据图中用户的个数。
作为一种可选的实施方式,所述数据处理模块202,具体包括:
计算用户在一跳内连接的用户数量,记为第一跳连接点数量;
计算用户在两跳内连接的用户数量,记为第二跳连接点数量;
根据所述第一跳连接点数量和用户隐私要求,计算邻接点威胁等级
其中,Ti表示第i个用户的邻接点威胁等级,Qj表示第j个用户的隐私要求,CFP1j表示第j个用户第一跳连接点数量,1≤i≤N,1≤j≤N,N表示所述社交网络图数据中用户的个数。
作为一种可选的实施方式,所述抽样模块205,具体包括:
在第一阈值t下,计算各边被抽取的概率:
其中,eij表示第i个用户和第j个用户的边,t表示第一阈值,P(eij,t)表示eij在阈值t时被抽到的概率,minQv≤t≤maxQv,Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,Qv表示社交网络数据图中所有用户的隐私要求;
根据所述边被抽取的概率P(eij,t)和第二阈值S(k)进行抽样,若P(eij,t)小于S(k),则该边被删除,其中S(k)表示第k个数据子图的阈值,1≤k≤R,R表示数据子图的个数。
作为一种可选的实施方式,所述加噪模块207,具体包括:对所述整合后的数据图采用拉普拉斯机制或指数机制进行加噪处理,获取加噪后的数据图。
本实施例的一种社交网络关系数据隐私保护系统,对社交网络数据图进行分组,然后对每个数据子图设定不同的采样阈值,对采样后的数据进行加噪处理,以实现不同用户的差分隐私保护,更有针对性,在保证数据安全性的同时更提高了数据的可用性。
对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种社交网络关系数据隐私保护方法,其特征在于,所述方法包括:
获取社交网络数据图;
根据所述社交网络数据图,获取用户属性向量集;
根据所述用户属性向量集,采用Skyline方法计算用户隐私泄露等级;
根据所述用户隐私泄露等级,对所述社交网络数据图进行分组,获得多个数据子图;
对各所述数据子图采用不同的阈值进行抽样,获取抽样后的数据子图,所述抽样后的数据子图为从所述数据子图中抽取的样本构成的数据图;
对各所述采样后的数据子图进行整合,获得整合后的数据图;
对所述整合后的数据图进行加噪处理,获取加噪后的数据图,并将加噪后的数据图进行发布。
2.根据权利要求1所述的社交网络关系数据隐私保护方法,其特征在于,所述方法还包括:对加噪后的数据图采用差分隐私进行验证,具体包括:设有随机算法M,Range(M)表示算法M生成的所有结果集,对于数据集D、D′和若满足Pr[M(D)∈O]≤eε·Pr[M(D′)∈O],则数据进行发布,其中,D表示社交网络数据图,D′表示加噪后的数据图,概率Pr由算法M确定,表示隐私被披露的风险,参数ε称为隐私保护预算,ε=min{Qi,Qj},Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,N表示所述社交网络数据图中用户的个数。
3.根据权利要求1所述的社交网络关系数据隐私保护方法,其特征在于,所述根据社交网络数据图,获取用户属性向量集,具体包括:
计算用户在一跳内连接的用户数量,记为第一跳连接点数量;
计算用户在两跳内连接的用户数量,记为第二跳连接点数量;
根据所述第一跳连接点数量和用户隐私要求,计算邻接点威胁等级
其中,Ti表示第i个用户的邻接点威胁等级,Qj表示第j个用户的隐私要求,CFP1j表示第j个用户第一跳连接点数量,1≤i≤N,1≤j≤N,N表示所述社交网络数据图中用户的个数。
4.根据权利要求1所述的社交网络关系数据隐私保护方法,其特征在于,所述对各所述数据子图采用不同的阈值进行抽样,获取抽样后的数据子图,具体包括:
在第一阈值t下,计算各边被抽取的概率:
其中,eij表示第i个用户和第j个用户的边,t表示第一阈值,P(eij,t)表示eij在阈值t时被抽到的概率,minQv≤t≤maxQv,Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,Qv表示社交网络数据图中所有用户的隐私要求;
根据所述边被抽取的概率P(eij,t)和第二阈值S(k)进行抽样,若P(eij,t)小于S(k),则该边被删除,其中S(k)表示第k个数据子图的阈值,1≤k≤R,R表示数据子图的个数。
5.根据权利要求1所述的社交网络关系数据隐私保护方法,其特征在于,所述对所述整合后的数据图采用拉普拉斯机制或指数机制进行加噪处理,获取加噪后的数据图。
6.一种社交网络关系数据隐私保护系统,其特征在于,所述系统包括:
数据获取模块,用于获取社交网络数据图;
数据处理模块,用于根据所述社交网络数据图,获取用户属性向量集;
用户隐私泄露等级计算模块,用于根据所述用户属性向量集,采用Skyline方法计算用户隐私泄露等级;
分组模块,用于根据所述用户隐私泄露等级,对所述社交网络数据图进行分组,获得多个数据子图;
抽样模块,用于对各所述数据子图采用不同的阈值进行抽样,获取抽样后的数据子图,所述抽样后的数据子图为从所述数据子图中抽取的样本构成的数据图;
数据整合模块,用于对各所述采样后的数据子图进行整合,获得整合后的数据图;
加噪模块,用于对所述整合后的数据图进行加噪处理,获取加噪后的数据图,并将加噪后的数据图进行发布。
7.根据权利要求6所述的社交网络关系数据隐私保护系统,其特征在于,所述系统还包括:验证模块,用于对加噪后的数据图采用差分隐私进行验证,设有随机算法M,Range(M)表示算法M生成的所有结果集,对于数据集D、D′和若满足Pr[M(D)∈O]≤eε·Pr[M(D′)∈O],则数据进行发布,其中,D表示社交网络数据图,D′表示加噪后的数据图,概率Pr由算法M确定,表示隐私被披露的风险,参数ε称为隐私保护预算,ε=min{Qi,Qj},Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,N表示所述社交网络数据图中用户的个数。
8.根据权利要求6所述的社交网络关系数据隐私保护系统,其特征在于,
所述数据处理模块,具体包括:
计算用户在一跳内连接的用户数量,记为第一跳连接点数量;
计算用户在两跳内连接的用户数量,记为第二跳连接点数量;
根据所述第一跳连接点数量和用户隐私要求,计算邻接点威胁等级
其中,Ti表示第i个用户的邻接点威胁等级,Qj表示第j个用户的隐私要求,CFP1j表示第j个用户第一跳连接点数量,1≤i≤N,1≤j≤N,N表示所述社交网络图数据中用户的个数。
9.根据权利要求6所述的社交网络关系数据隐私保护系统,其特征在于,
所述抽样模块,具体包括:
在第一阈值t下,计算各边被抽取的概率:
其中,eij表示第i个用户和第j个用户的边,t表示第一阈值,P(eij,t)表示eij在阈值t时被抽到的概率,minQv≤t≤maxQv,Qi表示第i个用户的隐私要求,Qj表示第j个用户的隐私要求,1≤i≤N,1≤j≤N,Qv表示社交网络数据图中所有用户的隐私要求;
根据所述边被抽取的概率P(eij,t)和第二阈值S(k)进行抽样,若P(eij,t)小于S(k),则该边被删除,其中S(k)表示第k个数据子图的阈值,1≤k≤R,R表示数据子图的个数。
10.根据权利要求6所述的社交网络关系数据隐私保护系统,其特征在于,
所述加噪模块,具体包括:对所述整合后的数据图采用拉普拉斯机制或指数机制进行加噪处理,获取加噪后的数据图。
CN201910110712.1A 2019-02-12 2019-02-12 一种社交网络关系数据隐私保护方法及系统 Active CN109858282B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910110712.1A CN109858282B (zh) 2019-02-12 2019-02-12 一种社交网络关系数据隐私保护方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910110712.1A CN109858282B (zh) 2019-02-12 2019-02-12 一种社交网络关系数据隐私保护方法及系统

Publications (2)

Publication Number Publication Date
CN109858282A true CN109858282A (zh) 2019-06-07
CN109858282B CN109858282B (zh) 2020-12-25

Family

ID=66897677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910110712.1A Active CN109858282B (zh) 2019-02-12 2019-02-12 一种社交网络关系数据隐私保护方法及系统

Country Status (1)

Country Link
CN (1) CN109858282B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322003A (zh) * 2019-06-10 2019-10-11 浙江大学 一种基于梯度的通过添加虚假节点的图对抗样本生成方法
CN110334742A (zh) * 2019-06-10 2019-10-15 浙江大学 一种基于强化学习的通过添加虚假节点的图对抗样本生成方法
CN115114381A (zh) * 2022-06-22 2022-09-27 广州大学 一种面向本地化差分隐私的图统计分析方法
CN115828312A (zh) * 2023-02-17 2023-03-21 浙江浙能数字科技有限公司 一种面向电力用户社交网络的隐私保护方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279713A (zh) * 2013-06-08 2013-09-04 广西师范大学 一种优化的社交网络图数据发布隐私保护方法
CN103648092A (zh) * 2013-12-26 2014-03-19 安徽师范大学 隐私保护的两层传感网Skyline查询系统及方法
CN107194278A (zh) * 2017-05-15 2017-09-22 华中科技大学 一种基于Skyline的数据泛化方法
CN107862219A (zh) * 2017-11-14 2018-03-30 哈尔滨工业大学深圳研究生院 一种社交网络中需求隐私的保护方法
CN108197492A (zh) * 2017-12-29 2018-06-22 南京邮电大学 一种基于差分隐私预算分配的数据查询方法及系统
CN108520182A (zh) * 2018-04-09 2018-09-11 哈尔滨工业大学深圳研究生院 一种基于差分隐私和关联规则的需求隐私保护方法
CN109195098A (zh) * 2018-06-20 2019-01-11 苏州大学 一种基于差分隐私的共享协同过滤方法
CN109299615A (zh) * 2017-08-07 2019-02-01 南京邮电大学 一种面向社交网络数据的差分隐私处理发布方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279713A (zh) * 2013-06-08 2013-09-04 广西师范大学 一种优化的社交网络图数据发布隐私保护方法
CN103648092A (zh) * 2013-12-26 2014-03-19 安徽师范大学 隐私保护的两层传感网Skyline查询系统及方法
CN107194278A (zh) * 2017-05-15 2017-09-22 华中科技大学 一种基于Skyline的数据泛化方法
CN109299615A (zh) * 2017-08-07 2019-02-01 南京邮电大学 一种面向社交网络数据的差分隐私处理发布方法
CN107862219A (zh) * 2017-11-14 2018-03-30 哈尔滨工业大学深圳研究生院 一种社交网络中需求隐私的保护方法
CN108197492A (zh) * 2017-12-29 2018-06-22 南京邮电大学 一种基于差分隐私预算分配的数据查询方法及系统
CN108520182A (zh) * 2018-04-09 2018-09-11 哈尔滨工业大学深圳研究生院 一种基于差分隐私和关联规则的需求隐私保护方法
CN109195098A (zh) * 2018-06-20 2019-01-11 苏州大学 一种基于差分隐私的共享协同过滤方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BEE-CHUNG CHEN等: "Privacy Skyline: Privacy with Multidimensional Adversarial Knowledge", 《CONFERENCE: PROCEEDINGS OF THE 33RD INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES》 *
ZHEFENG QIAO等: "Privacy-Preserving Skyline Queries in LBS", 《2010 INTERNATIONAL CONFERENCE ON MACHINE VISION AND HUMAN-MACHINE INTERFACE》 *
孙宇晴: "社交网络个性化差分隐私数据发布方法的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
张书旋等: "基于 Skyline 计算的社交网络关系数据隐私保护", 《计算机应用》 *
彭真明等: "《光电图像处理及应用》", 30 April 2013, 电子科技大学出版社 *
马跃雷等: "一种基于差分隐私的数据发布方法", 《北京信息科技大学学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322003A (zh) * 2019-06-10 2019-10-11 浙江大学 一种基于梯度的通过添加虚假节点的图对抗样本生成方法
CN110334742A (zh) * 2019-06-10 2019-10-15 浙江大学 一种基于强化学习的通过添加虚假节点的图对抗样本生成方法
CN110322003B (zh) * 2019-06-10 2021-06-29 浙江大学 一种用于文档分类的基于梯度的通过添加虚假节点的图对抗样本生成方法
CN110334742B (zh) * 2019-06-10 2021-06-29 浙江大学 一种用于文档分类的基于强化学习的通过添加虚假节点的图对抗样本生成方法
CN115114381A (zh) * 2022-06-22 2022-09-27 广州大学 一种面向本地化差分隐私的图统计分析方法
CN115828312A (zh) * 2023-02-17 2023-03-21 浙江浙能数字科技有限公司 一种面向电力用户社交网络的隐私保护方法及系统

Also Published As

Publication number Publication date
CN109858282B (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN109858282A (zh) 一种社交网络关系数据隐私保护方法及系统
Gong et al. Evolution of social-attribute networks: measurements, modeling, and implications using google+
Quercia et al. Friendsensing: recommending friends using mobile phones
CN104040550B (zh) 集成安全策略和事件管理
CN106980795A (zh) 社会网络数据隐私保护方法
CN110445801B (zh) 一种物联网的态势感知方法和系统
CN106339396B (zh) 用于对用户生成的内容进行隐私风险评估的方法和设备
CN110059468A (zh) 一种小程序风险识别方法和装置
CN105894372A (zh) 预测群体信用的方法和装置
CN108833139B (zh) 一种基于类别属性划分的ossec报警数据聚合方法
Giorgi et al. Correlation approach to work extraction from finite quantum systems
CN102819701A (zh) 一种填表组件密码安全性提示的方法和装置
CN112508075A (zh) 基于横向联邦的dbscan聚类方法、及其相关设备
CN112990583A (zh) 一种数据预测模型的入模特征确定方法及设备
CN115830010A (zh) 输电导线交叉跨越距离检测方法、装置和计算机设备
CN109272378A (zh) 一种风险群组的发现方法和装置
CN114662157A (zh) 社交文本数据流的块压缩感知不可区分性保护方法及装置
CN105069003B (zh) 一种基于转发链相似度的用户关注对象推荐计算方法
JP6915457B2 (ja) サイバー攻撃情報処理プログラム、サイバー攻撃情報処理方法および情報処理装置
KR101482411B1 (ko) 패턴 기반 개인정보 검출 방법
CN110839000B (zh) 一种网络信息系统的安全等级确定方法和装置
CN110059097A (zh) 数据处理方法和装置
CN105868986A (zh) 一种用于提供用户设备的安全信息的方法及设备
Narang et al. Utilizing social networks data for trust management in a social Internet of Things network
CN104866588B (zh) 一种针对单个不确定图的频繁子图挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant