CN109002468A - 图数据发布隐私保护的聚类匿名方法及系统 - Google Patents

图数据发布隐私保护的聚类匿名方法及系统 Download PDF

Info

Publication number
CN109002468A
CN109002468A CN201810589811.8A CN201810589811A CN109002468A CN 109002468 A CN109002468 A CN 109002468A CN 201810589811 A CN201810589811 A CN 201810589811A CN 109002468 A CN109002468 A CN 109002468A
Authority
CN
China
Prior art keywords
cluster
node
diagram data
anonymous
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810589811.8A
Other languages
English (en)
Inventor
尚凌辉
陈鑫
叶淑阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zechk Artificial Intelligence Research And Development Co Ltd
Original Assignee
Zhejiang Zechk Artificial Intelligence Research And Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Zechk Artificial Intelligence Research And Development Co Ltd filed Critical Zhejiang Zechk Artificial Intelligence Research And Development Co Ltd
Priority to CN201810589811.8A priority Critical patent/CN109002468A/zh
Publication of CN109002468A publication Critical patent/CN109002468A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0407Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the identity of one or more communicating identities is hidden
    • H04L63/0421Anonymous communication, i.e. the party's identifiers are hidden from the other party or parties, e.g. using an anonymizer

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了图数据发布隐私保护的聚类匿名方法及系统,以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系,并以此计算每个节点及其相邻节点间的属性相似度和结构相似度,再根据计算结果对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类,根据划分得到的聚类对每个聚类内的节点进行匿名处理。本发明将聚类分析技术应用于图数据发布的隐私保护中,首先计算节点间的结构相似度和属性相似度,依次进行图属性聚类划分和图结构聚类划分,最后对各个聚类进行匿名处理,能够同时保护用户的属性信息和结构信息,防止一切以连接边和属性值为背景知识的攻击,从而保障社交网络图数据发布的隐私安全。

Description

图数据发布隐私保护的聚类匿名方法及系统
技术领域
本发明涉及信息技术和数据挖掘的技术领域,尤其涉及图数据发布隐私保护的聚类匿名方法及系统。
背景技术
当前,如何对图数据发布形式的隐私进行保护是研究话题之一。在社交网络图中,个体节点或边蕴含的隐私信息可能因遭受到恶意盗取而泄露。隐私保护技术通常来说不能够对攻击者所能获得的数据背景知识做定义,因此在处理复杂多变的攻击模型中,随着攻击者掌握背景知识的增加,往往会生成很多攻击变体。攻击者通过将用户的出生日期、性别、邮编等准标识符数据进行组合,常常能推断并锁定特定个体,进而获取该个体其他重要的隐私信息。隐私保护算法在通用性上的限制,使数据管理者不得不针对个性化的攻击模式设计出新的隐私保护算法。
聚类分析是对于统计数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性。
如果能够将聚类分析技术应用于对图数据形式发布的隐私进行保护,则可以一定程度上改善社交网络中个性化隐私保护不足的问题。
发明内容
为了克服现有技术的不足,本发明的目的在于提供图数据发布隐私保护的聚类匿名方法及系统,旨在将聚类分析技术应用于对图数据形式发布的隐私进行保护,解决目前社交网络中个性化隐私保护不足的问题。
本发明的目的采用以下技术方案实现:
一种图数据发布隐私保护的聚类匿名方法,包括:
获取步骤,以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
计算步骤,计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
聚类步骤,根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
匿名步骤,根据划分得到的聚类对每个聚类内的节点进行匿名处理。
在上述实施例的基础上,优选的,所述聚类步骤,具体为:
根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;
所述匿名步骤,具体为:
根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
在上述任意实施例的基础上,优选的,还包括:
调用步骤,在图数据的某一节点被调用时,返回匿名处理后的结果。
在上述任意实施例的基础上,优选的,所述用户属性包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
在上述任意实施例的基础上,优选的,所述用户间相互关系包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
一种图数据发布隐私保护的聚类匿名系统,包括:
获取模块,用于以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
计算模块,用于计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
聚类模块,用于根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
匿名模块,用于根据划分得到的聚类对每个聚类内的节点进行匿名处理。
在上述实施例的基础上,优选的,所述聚类模块用于:
根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;
所述匿名模块用于:
根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
在上述任意实施例的基础上,优选的,还包括:
调用模块,用于在图数据的某一节点被调用时,返回匿名处理后的结果。
在上述任意实施例的基础上,优选的,所述用户属性包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
在上述任意实施例的基础上,优选的,所述用户间相互关系包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
相比现有技术,本发明的有益效果在于:
本发明公开了图数据发布隐私保护的聚类匿名方法及系统,以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系,并以此计算每个节点及其相邻节点间的属性相似度和结构相似度,再根据计算结果对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类,根据划分得到的聚类对每个聚类内的节点进行匿名处理。本发明将聚类分析技术应用于图数据发布的隐私保护中,提出一种基于结构相似度和属性相似度的图聚类匿名方式,首先计算节点间的结构相似度和属性相似度,依次进行图属性聚类划分和图结构聚类划分,最后对各个聚类进行匿名处理,能够同时保护用户的属性信息和结构信息,防止一切以连接边和属性值为背景知识的攻击,从而保障社交网络图数据发布的隐私安全。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1示出了本发明实施例提供的一种图数据发布隐私保护的聚类匿名方法的流程示意图;
图2示出了本发明实施例提供的一种图数据发布隐私保护的聚类匿名系统的结构示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
具体实施例一
如图1所示,本发明实施例提供了一种图数据发布隐私保护的聚类匿名方法,包括:
获取步骤S101,以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
计算步骤S102,计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
聚类步骤S103,根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
匿名步骤S104,根据划分得到的聚类对每个聚类内的节点进行匿名处理。
本发明实施例以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系,并以此计算每个节点及其相邻节点间的属性相似度和结构相似度,再根据计算结果对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类,根据划分得到的聚类对每个聚类内的节点进行匿名处理。本发明实施例将聚类分析技术应用于图数据发布的隐私保护中,提出一种基于结构相似度和属性相似度的图聚类匿名方式,首先计算节点间的结构相似度和属性相似度,依次进行图属性聚类划分和图结构聚类划分,最后对各个聚类进行匿名处理,能够同时保护用户的属性信息和结构信息,防止一切以连接边和属性值为背景知识的攻击,从而保障社交网络图数据发布的隐私安全。
优选的,所述聚类步骤S103,可以具体为:根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;所述匿名步骤S104,可以具体为:根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。这样做的好处是,对图数据依次进行图属性聚类划分和图结构聚类划分。
优选的,本发明实施例还可以包括:调用步骤S105,在图数据的某一节点被调用时,返回匿名处理后的结果。这样做的好处是,在图数据被调用时,返回匿名处理后的结果,保障用户社交网络图数据发布的隐私安全。
本发明实施例对用户属性不做限定,优选的,所述用户属性可以包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
本发明实施例对用户间相互关系不做限定,优选的,所述用户间相互关系可以包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
在上述的具体实施例一中,提供了图数据发布隐私保护的聚类匿名方法,与之相对应的,本申请还提供图数据发布隐私保护的聚类匿名系统。由于系统实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。
具体实施例二
如图2所示,本发明实施例提供了一种图数据发布隐私保护的聚类匿名系统,包括:
获取模块201,用于以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
计算模块202,用于计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
聚类模块203,用于根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
匿名模块204,用于根据划分得到的聚类对每个聚类内的节点进行匿名处理。
本发明实施例以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系,并以此计算每个节点及其相邻节点间的属性相似度和结构相似度,再根据计算结果对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类,根据划分得到的聚类对每个聚类内的节点进行匿名处理。本发明实施例将聚类分析技术应用于图数据发布的隐私保护中,提出一种基于结构相似度和属性相似度的图聚类匿名方式,首先计算节点间的结构相似度和属性相似度,依次进行图属性聚类划分和图结构聚类划分,最后对各个聚类进行匿名处理,能够同时保护用户的属性信息和结构信息,防止一切以连接边和属性值为背景知识的攻击,从而保障社交网络图数据发布的隐私安全。
优选的,所述聚类模块203可以用于:根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;所述匿名模块204可以用于:根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
优选的,本发明实施例还可以包括:调用模块205,用于在图数据的某一节点被调用时,返回匿名处理后的结果。
本发明实施例对用户属性不做限定,优选的,所述用户属性可以包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
本发明实施例对用户间相互关系不做限定,优选的,所述用户间相互关系可以包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
本发明从使用目的上,效能上,进步及新颖性等观点进行阐述,其具有的实用进步性,己符合专利法所强调的功能增进及使用要件,本发明以上的说明及附图,仅为本发明的较佳实施例而己,并非以此局限本发明,因此,凡一切与本发明构造,装置,待征等近似、雷同的,即凡依本发明专利申请范围所作的等同替换或修饰等,皆应属本发明的专利申请保护的范围之内。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。尽管本发明已进行了一定程度的描述,明显地,在不脱离本发明的精神和范围的条件下,可进行各个条件的适当变化。可以理解,本发明不限于所述实施方案,而归于权利要求的范围,其包括所述每个因素的等同替换。对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

Claims (10)

1.一种图数据发布隐私保护的聚类匿名方法,其特征在于,包括:
获取步骤,以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
计算步骤,计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
聚类步骤,根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
匿名步骤,根据划分得到的聚类对每个聚类内的节点进行匿名处理。
2.根据权利要求1所述的图数据发布隐私保护的聚类匿名方法,其特征在于,所述聚类步骤,具体为:
根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;
所述匿名步骤,具体为:
根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
3.根据权利要求1或2所述的图数据发布隐私保护的聚类匿名方法,其特征在于,还包括:
调用步骤,在图数据的某一节点被调用时,返回匿名处理后的结果。
4.根据权利要求1或2所述的图数据发布隐私保护的聚类匿名方法,其特征在于,所述用户属性包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
5.根据权利要求1或2所述的图数据发布隐私保护的聚类匿名方法,其特征在于,所述用户间相互关系包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
6.一种图数据发布隐私保护的聚类匿名系统,其特征在于,包括:
获取模块,用于以图数据群体内每个用户为一个节点,获取每个节点的用户属性和用户间相互关系;
计算模块,用于计算每个节点及其相邻节点间的属性相似度和结构相似度;所述属性相似度由两个相邻节点的用户属性决定,所述结构相似度由两个相邻节点的用户间相互关系决定;
聚类模块,用于根据每个节点及其相邻节点间的属性相似度和结构相似度,对群体内的节点依次进行属性聚类划分和结构聚类划分,得到若干个聚类;
匿名模块,用于根据划分得到的聚类对每个聚类内的节点进行匿名处理。
7.根据权利要求6所述的图数据发布隐私保护的聚类匿名系统,其特征在于,所述聚类模块用于:
根据每个节点及其相邻节点间的属性相似度,对群体内的节点进行属性聚类划分,得到若干个属性聚类;根据每个属性聚类中每个节点及其相邻节点间的结构相似度,对属性聚类内的节点进行结构聚类划分,得到若干个结构聚类;
所述匿名模块用于:
根据划分得到的属性聚类和结构聚类对每个聚类内的节点进行匿名处理。
8.根据权利要求6或7所述的图数据发布隐私保护的聚类匿名系统,其特征在于,还包括:
调用模块,用于在图数据的某一节点被调用时,返回匿名处理后的结果。
9.根据权利要求6或7所述的图数据发布隐私保护的聚类匿名系统,其特征在于,所述用户属性包括身份信息、家庭信息、职业信息、爱好信息、信用信息中的一种或多种。
10.根据权利要求6或7所述的图数据发布隐私保护的聚类匿名系统,其特征在于,所述用户间相互关系包括家庭关系、教育关系、就业关系、爱好关系、信用关系中的一种或多种。
CN201810589811.8A 2018-06-08 2018-06-08 图数据发布隐私保护的聚类匿名方法及系统 Pending CN109002468A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810589811.8A CN109002468A (zh) 2018-06-08 2018-06-08 图数据发布隐私保护的聚类匿名方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810589811.8A CN109002468A (zh) 2018-06-08 2018-06-08 图数据发布隐私保护的聚类匿名方法及系统

Publications (1)

Publication Number Publication Date
CN109002468A true CN109002468A (zh) 2018-12-14

Family

ID=64601063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810589811.8A Pending CN109002468A (zh) 2018-06-08 2018-06-08 图数据发布隐私保护的聚类匿名方法及系统

Country Status (1)

Country Link
CN (1) CN109002468A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569655A (zh) * 2019-09-06 2019-12-13 中国科学院信息工程研究所 一种群组隐私信息发现方法及系统
CN110990878A (zh) * 2019-12-13 2020-04-10 支付宝(杭州)信息技术有限公司 一种隐私数据衍生图的构建方法
CN112633388A (zh) * 2020-12-28 2021-04-09 中国科学院软件研究所 一种面向社交网络的分布式用户聚类方法
CN113486396A (zh) * 2021-07-02 2021-10-08 北京工业大学 面向社交网络的高可用性k-匿名数据处理方法、装置、电子设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569655A (zh) * 2019-09-06 2019-12-13 中国科学院信息工程研究所 一种群组隐私信息发现方法及系统
CN110569655B (zh) * 2019-09-06 2021-05-25 中国科学院信息工程研究所 一种群组隐私信息发现方法及系统
CN110990878A (zh) * 2019-12-13 2020-04-10 支付宝(杭州)信息技术有限公司 一种隐私数据衍生图的构建方法
CN110990878B (zh) * 2019-12-13 2021-09-28 支付宝(杭州)信息技术有限公司 一种隐私数据衍生图的构建方法
CN112633388A (zh) * 2020-12-28 2021-04-09 中国科学院软件研究所 一种面向社交网络的分布式用户聚类方法
CN112633388B (zh) * 2020-12-28 2022-07-29 中国科学院软件研究所 一种面向社交网络的分布式用户聚类方法
CN113486396A (zh) * 2021-07-02 2021-10-08 北京工业大学 面向社交网络的高可用性k-匿名数据处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109002468A (zh) 图数据发布隐私保护的聚类匿名方法及系统
Snow Collective identity and expressive forms
Turner et al. Theories of globalization: Issues and origins
Pan et al. Protecting location privacy against location-dependent attack in mobile services
CN105512566A (zh) 一种基于k-匿名的健康数据隐私保护方法
WO2017040632A4 (en) Event categorization and key prospect identification from storylines
CN109962789A (zh) 基于网络数据构建物联网应用标签体系的方法和装置
CN104881594B (zh) 一种基于精准画像的智能手机拥有权检测方法
Albatineh Means and variances for a family of similarity indices used in cluster analysis
Tai et al. Structural diversity for resisting community identification in published social networks
Liu et al. Randomized perturbation for privacy-preserving social network data publishing
Liu et al. A collaborative deep learning microservice for backdoor defenses in Industrial IoT networks
Canbay et al. The Effect of clustering on data privacy
Wang et al. A clustering approach for privacy-preserving in social networks
Prasanthi et al. A comprehensive assessment of privacy preserving data mining techniques
Marsan et al. Improving the efficiency of the analysis of DSPN models
Wang et al. Research on the association of mobile social network users privacy information based on big data analysis
Babba et al. Input driven synthesis of PLDs and PGAs
CN104462939B (zh) 一种集群节点间密码信息处理方法及系统
Kaveri et al. Cluster based anonymization for privacy preservation in social network data community
US9171267B2 (en) System for categorizing lists of words of arbitrary origin
Arif et al. Location based communication privacy in Internet of Vehicles using fog computing
Reza et al. 3lp: Three layers of protection for individual privacy in facebook
Xia et al. Personalized privacy protection with spatio-temporal features in social networks
Fu et al. Privacy preserving social network against dopv attacks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181214