CN112214793A - 一种基于融合差分隐私的随机游走模型推荐方法 - Google Patents
一种基于融合差分隐私的随机游走模型推荐方法 Download PDFInfo
- Publication number
- CN112214793A CN112214793A CN202011064433.5A CN202011064433A CN112214793A CN 112214793 A CN112214793 A CN 112214793A CN 202011064433 A CN202011064433 A CN 202011064433A CN 112214793 A CN112214793 A CN 112214793A
- Authority
- CN
- China
- Prior art keywords
- node
- random walk
- score
- method based
- recommendation method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005295 random walk Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000004927 fusion Effects 0.000 title claims abstract description 7
- 230000035945 sensitivity Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioethics (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于融合差分隐私的随机游走模型推荐方法,包括将网页关系图数据转化成二分图,基于PersonalRank随机游走迭代,得到节点的分值,以Top10的分值作为打分函数,以满足指数机制的概率输出推荐结果。本发明不仅能够保证推荐结果的准确性,同时也保证了目标用户以及其他用户对物品行为的隐私。
Description
技术领域
本发明涉及一种融合差分隐私的随机游走推荐的方法,属于推荐算法领域。
背景技术
近些年,由于移动互联网的兴起,人们随时随地可以上网交友,将人们拉近了彼此之间交流的距离。2020年第1季度,全球各大网络社交应用平台用户数量进一步膨胀:推特3.7亿,微信12亿,抖音5.18亿,Facebook20亿。庞大的社交网络数据,一方面,可以为人们提供越来越符合心意的推荐,Georg Groh和Christian Ehmig的研究表明,社会化推荐系统推荐结果的用户满意度明显高于基于协同过滤算法的几个真实推荐系统,最关键的是得到用户所有好友的选择结果,根据好友的选择给予推荐。但是与此同时,个人信息的选择暴露在网络中。所以,从保护用户隐私角度着手,保护图数据中用户行为的隐私是热点研究课题。
目前,隐私保护算法主要分为2类,一种是对用户节点匿名方法,比如k-匿名、1-多样和t-closeness等,但是网络图的特殊性,使得匿名数据遇到节点度数或者结构的攻击,更容易被识别出来,比如,在并不想披露朋友之间的关系的情况下,识别出该独特关系的图数据。
另一种,是由Dwork等人提出了定义极为严格的、与背景知识无关的新型隐私保护模型:差分隐私保护(differential privacy),提供严格可证明的隐私保护,不仅丰富了隐私保护理论研究的内涵,目前更已被应用于实际产品中。
发明内容
发明目的:针对当前图的随机游推荐,无法保护用户行为隐私的问题,本发明提供一种基于融合差分隐私的随机游走模型推荐方法,保证随机游走推荐的同时,进行差分隐私操作,保护用户以及好友的个人隐私。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于融合差分隐私的随机游走模型推荐方法,获取网页关系图数据并处理成二分图,基于PersonalRank随机游走迭代,得到节点的分值,以Top10的分值作为打分函数,以满足指数机制的概率输出推荐结果,具体包括以下步骤:
步骤1,获取网页关系图数据,将网页关系图数据转化成二分图。
步骤2,基于PersonalRank随机游走迭代步骤1中得到的二分图,得到节点分值:
其中,PR(v)是节点v被访问到的节点分值,α代表用户继续访问节点v的概率,N为所有网页的数量,in(v)代表所有指向网页v的节点集合,out(v)代表节点v指向的其他网页集合,v′代表所有指向节点v的节点集合中的任意一个,PR(v′)代表节点v′被访问到的节点分值,vu代表目标用户的节点,|out(v′)|代表网页v′指向的其他节点的边个数;
步骤3,如果满足迭代条件,即下次迭代和前一次的结果相同,或者超出迭代次数阈值iter_num。则筛去用户u已经选择的物品,并输出Top10结果,Top10代表节点分值最高的前十个。如果不满足迭代条件,返回步骤2重新计算节点分值。
步骤4,以Top10的分值作为打分函数,以满足指数机制的概率输出推荐结果item。
指数机制的概率方程如下:
eε*PR(v)*10/2Δq
其中,ε是隐私保护参数,PR(v)为步骤2计算的Top10分数列表中的一个,Δq为打分函数的敏感度。
优选的:打分函数的敏感度Δq为PR(v)max-PR(v)min,PR(v)max表示节点分值最大分值,PR(v)min表示节点分值最小分值。
优选的:打分函数q(D,r)→R,D表示输入数据集,r表示输出的实体对象,→R表示输出的范围为R。
优选的:迭代次数阈值iter_num=100。
优选的:用户继续访问网页的概率α=0.8。
优选的:初始目标节点的节点分值为1。
本发明相比现有技术,具有以下有益效果:
本发明每次输出的推荐结果不一定相同,分值高的节点输出概率更高,以满足指数机制的概率输出目标用户节点的推荐结果,攻击者不会通过查询作差得到目标用户或者其他用户对物品的行为,在保证用户的推荐准确的情况下,也保护了用户行为的隐私。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基于融合差分隐私的随机游走模型推荐方法,如图1所示,包括以下步骤:
步骤1,获取网页关系图数据,设置迭代次数阈值iter_num=100,用户继续访问网页的概率α=0.8,初始目标节点的节点分值为1。输入网页关系图数据,将网页关系图数据转化成二分图。
步骤2,基于PersonalRank随机游走迭代步骤1中得到的二分图,得到节点分值,为了方便之后的指数机制计算,将节点分值乘以10:
节点分值的计算如下:
其中,PR(v)是节点v被访问到的节点分值,α代表用户继续访问节点v的概率,N为所有网页的数量,in(v)代表所有指向网页v的节点集合,out(v)代表节点v指向的其他网页集合,v′代表所有指向节点v的节点集合中的任意一个,PR(v′)代表节点v′被访问到的节点分值,vu代表目标用户的节点,|out(v′)|代表网页v′指向的其他节点的边个数;
步骤3,如果满足迭代条件,即下次迭代和前一次的结果相同,或者超出迭代次数阈值iter_num。则筛去用户u已经选择的物品,并输出Top10结果,Top10代表节点分值最高的前十个。如果不满足迭代条件,返回步骤2重新计算节点分值。
步骤4,以Top10的分值作为打分函数,以满足指数机制的概率输出推荐结果item。
指数机制的概率方程如下:
eε*PR(v)*10/2Δq
其中,ε是隐私保护参数,用来表示隐私保护的程度,ε越小意味着隐私保护程度越高。PR(v)为步骤2计算的Top10分数列表,Δq为打分函数的敏感度,打分函数的敏感度Δq为PR(v)max-PR(v)min,PR(v)max表示节点分值最大分值中的一个,PR(v)min表示节点分值最小分值中的一个。打分函数q(D,r)→R,D表示输入数据集,r表示输出的实体对象,→R表示输出的范围为R。
本发明使用指数机制输出目标节点的推荐结果,攻击者不会通过查询作差得到目标用户或者其他用户对物品的行为,在保证用户的推荐准确的情况下,也保护了用户行为的隐私。因此本发明在保证了推荐结果的准确性,同时也保证了目标用户以及其他用户对物品行为的隐私。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种基于融合差分隐私的随机游走模型推荐方法,其特征在于,包括以下步骤:
步骤1,获取网页关系图数据,将网页关系图数据转化成二分图;
步骤2,基于PersonalRank随机游走迭代步骤1中得到的二分图,得到节点分值:
其中,PR(v)是节点v被访问到的节点分值,α代表用户继续访问节点v的概率,N为所有网页的数量,in(v)代表所有指向网页v的节点集合,out(v)代表节点v指向的其他网页集合,v′代表所有指向节点v的节点集合中的任意一个,PR(v′)代表节点v′被访问到的节点分值,vu代表目标用户的节点,|out(v′)|代表网页v′指向的其他节点的边个数;
步骤3,如果满足迭代条件,即下次迭代和前一次的结果相同,或者超出迭代次数阈值iter_num;则筛去用户u已经选择的物品,并输出Top10结果,Top10代表节点分值最高的前十个,如果不满足迭代条件,返回步骤2重新计算节点分值;
步骤4,以Top10的分值作为打分函数,以满足指数机制的概率输出推荐结果item;
指数机制的概率方程如下:
eε*PR(v)*10/2Δq
其中,ε是隐私保护参数,PR(v)为步骤2计算的Top10分数列表,Δq为打分函数的敏感度。
2.根据权利要求1所述基于融合差分隐私的随机游走模型推荐方法,其特征在于:打分函数的敏感度Δq为PR(v)max-PR(v)min,PR(v)max表示节点分值中的最大分值,PR(v)min表示节点分值中的最小分值。
3.根据权利要求2所述基于融合差分隐私的随机游走模型推荐方法,其特征在于:打分函数q(D,r)→R,D表示输入数据集,r表示输出的实体对象,→R表示输出的范围为R。
4.根据权利要求3所述基于融合差分隐私的随机游走模型推荐方法,其特征在于:迭代次数阈值iter_num=100。
5.根据权利要求4所述基于融合差分隐私的随机游走模型推荐方法,其特征在于:用户继续访问网页的概率α=0.8。
6.根据权利要求5所述基于融合差分隐私的随机游走模型推荐方法,其特征在于:初始目标节点的节点分值为1。
7.根据权利要求6所述基于融合差分隐私的随机游走模型推荐方法,其特征在于:网页v被访问到的节点分值PR(v)乘以10。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011064433.5A CN112214793A (zh) | 2020-09-30 | 2020-09-30 | 一种基于融合差分隐私的随机游走模型推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011064433.5A CN112214793A (zh) | 2020-09-30 | 2020-09-30 | 一种基于融合差分隐私的随机游走模型推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112214793A true CN112214793A (zh) | 2021-01-12 |
Family
ID=74052467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011064433.5A Pending CN112214793A (zh) | 2020-09-30 | 2020-09-30 | 一种基于融合差分隐私的随机游走模型推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112214793A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392049A (zh) * | 2017-07-26 | 2017-11-24 | 安徽大学 | 一种基于差分隐私保护的推荐方法 |
CN107491557A (zh) * | 2017-09-06 | 2017-12-19 | 徐州医科大学 | 一种基于差分隐私的TopN协同过滤推荐方法 |
CN108427891A (zh) * | 2018-03-12 | 2018-08-21 | 南京理工大学 | 基于差分隐私保护的邻域推荐方法 |
CN109978657A (zh) * | 2019-03-07 | 2019-07-05 | 北京工业大学 | 一种面向众智平台的改进随机游走图模式推荐算法 |
CN111079004A (zh) * | 2019-12-06 | 2020-04-28 | 成都理工大学 | 一种基于word2vec标签相似性的三部图随机游走推荐方法 |
-
2020
- 2020-09-30 CN CN202011064433.5A patent/CN112214793A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392049A (zh) * | 2017-07-26 | 2017-11-24 | 安徽大学 | 一种基于差分隐私保护的推荐方法 |
CN107491557A (zh) * | 2017-09-06 | 2017-12-19 | 徐州医科大学 | 一种基于差分隐私的TopN协同过滤推荐方法 |
CN108427891A (zh) * | 2018-03-12 | 2018-08-21 | 南京理工大学 | 基于差分隐私保护的邻域推荐方法 |
CN109978657A (zh) * | 2019-03-07 | 2019-07-05 | 北京工业大学 | 一种面向众智平台的改进随机游走图模式推荐算法 |
CN111079004A (zh) * | 2019-12-06 | 2020-04-28 | 成都理工大学 | 一种基于word2vec标签相似性的三部图随机游走推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11100466B2 (en) | Social media profiling for one or more authors using one or more social media platforms | |
Li et al. | Privacy leakage via de-anonymization and aggregation in heterogeneous social networks | |
Abbass et al. | A framework to predict social crime through twitter tweets by using machine learning | |
Gu et al. | Privacy on the edge: Customizable privacy-preserving context sharing in hierarchical edge computing | |
WO2021068608A1 (zh) | 提取用户画像的方法、装置、计算机设备和存储介质 | |
US20110191352A1 (en) | Socially- And Context-Aware People-Matching Systems and Methods Relating Thereto | |
CN106133727A (zh) | 通过知识库促进的用户兴趣 | |
Ngoc et al. | New approach to quantification of privacy on social network sites | |
CN105138664A (zh) | 一种隐私保护的大数据推荐方法及系统 | |
CN111400504A (zh) | 企业关键人的识别方法和装置 | |
CN111400612A (zh) | 一种融合社交影响和项目关联的个性化推荐方法 | |
WO2014179082A1 (en) | Systems and methods for instant e-coupon distribution | |
CN112507245A (zh) | 基于图神经网络的社交网络好友推荐方法 | |
CN117540106B (zh) | 一种多模态数据隐私保护的社交活动推荐方法及设备 | |
CN109344643B (zh) | 一种面向图中三角形数据发布的隐私保护方法及系统 | |
CN107070932A (zh) | 社会网络动态发布中防止标签邻居攻击的匿名方法 | |
WO2021135540A1 (zh) | 基于Neo4j的异常用户处理方法、装置、计算机设备和介质 | |
Dharani et al. | Detection of phishing websites using ensemble machine learning approach | |
Sun et al. | Anomaly subgraph detection with feature transfer | |
CN112214793A (zh) | 一种基于融合差分隐私的随机游走模型推荐方法 | |
Zhang et al. | A practical defense against attribute inference attacks in session-based recommendations | |
Riboni et al. | Incremental release of differentially-private check-in data | |
US11601509B1 (en) | Systems and methods for identifying entities between networks | |
Gao et al. | Context-aware privacy preserving in edge computing | |
CN114048380A (zh) | 一种基于图神经网络的兴趣点推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210112 |
|
RJ01 | Rejection of invention patent application after publication |