CN112016006A - 一种基于Trust-Walker的信任推荐模型 - Google Patents
一种基于Trust-Walker的信任推荐模型 Download PDFInfo
- Publication number
- CN112016006A CN112016006A CN202010900785.3A CN202010900785A CN112016006A CN 112016006 A CN112016006 A CN 112016006A CN 202010900785 A CN202010900785 A CN 202010900785A CN 112016006 A CN112016006 A CN 112016006A
- Authority
- CN
- China
- Prior art keywords
- trust
- users
- item
- user
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000005295 random walk Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000012546 transfer Methods 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 7
- 150000001875 compounds Chemical class 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000009191 jumping Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 10
- 238000000034 method Methods 0.000 abstract description 9
- 238000002474 experimental method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 208000037004 Myoclonic-astatic epilepsy Diseases 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000000874 microwave-assisted extraction Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 101100400452 Caenorhabditis elegans map-2 gene Proteins 0.000 description 1
- 101150064138 MAP1 gene Proteins 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于Trust‑Walker的信任推荐模型,包括如下步骤:步骤一、确定用户之间的信任关系;步骤二、根据共同信任用户数量对用户之间的信任关系进行修正;步骤三、在用户间基于信任关系进行随机游走获得用户的信任关系和项目评分;步骤四、根据项目之间的相似度对待推荐项目进行评分预测;步骤五、根据修正后的信任度得到修正后的待推荐项目的预测评分。本发明具有缓解用户信任关系的数据稀疏性,使推荐模型的可扩展性和计算效率得到提高。
Description
技术领域
本发明涉及信息安全技术领域,更具体的是,本发明涉及一种基于Trust-Walker的信任推荐模型。
背景技术
基于Trust-Walker的信任推荐模型为用户快速准确推荐合适资源提供了便捷可靠的实现方案,为了缓解传统推荐系统所面临的数据稀疏性和冷启动问题,充分利用信任关系构建基于Trust-Walker的信任推荐模型,推荐精度提高的同时,也带来了海量数据下推荐系统可扩展性困难和计算效率低的问题。如何缓解数据稀疏性,冷启动和提高推荐精度,同时又提高可扩展性和计算效率,是当前研究面临的主要难点。
现有方法大多基于信任关系对传统协同过滤推荐进行相应的改进优化,但却忽视了基于信任的推荐研究还有很多不足,相关的研究还处于初始阶段,另外由于大数据背景下随着海量数据的出现和数据爆炸性的增长,导致给现有推荐模式带来了极大困难,推荐可扩展性和计算效率下降,为此,提出了在大数据处理平台上进行并行化处理方法。
发明内容
本发明的目的是设计开发了一种基于Trust-Walker的信任推荐模型,基于Trust-Walker充分利用信任关系构建信任推荐模型,并对信任模型的信任度进行修正,缓解用户信任关系的数据稀疏性;在Hadoop集群上进行并行化实验,在海量数据得以存储的基础上,通过实现MapReduce框架下的分布式计算,使推荐模型的可扩展性和计算效率得到提高。
本发明提供的技术方案为:
一种基于Trust-Walker的信任推荐模型,包括如下步骤:
步骤一、确定用户之间的信任关系;
步骤二、根据共同信任用户数量对用户之间的信任关系进行修正;
步骤三、在用户间基于信任关系进行随机游走获得用户的信任关系和项目评分;
步骤四、根据项目之间的相似度对待推荐项目进行评分预测;
步骤五、根据修正后的信任度得到修正后的待推荐项目的预测评分。
优选的是,所述信任关系通过用户之间的间接信任度获得,所述用户之间的间接信任度满足:
式中,tu,v表示用户之间的间接信任度,p表示u用户与v用户之间的可以到达的路径,n表示用户之间可以到达的路径数目。
优选的是,当所述u用户与v用户之间的可以到达的路径为单路径p=(u,a,bL n,v)时,所述用户之间的间接信任度满足:
t1(u,v)=w·tu,a·ta,bL tn,v;
式中,w表示信任衰减因子,tu,a,ta,b,L tn,v表示用户之间的直接信任度,n≤6。
优选的是,所述信任衰减因子满足:
式中,pmax表示信任传递的最大步长,pu,v表示在信任关系网络中两个用户之间的信任传递路线的长度,n≤6。
优选的是,所述对用户之间的信任关系进行修正满足:
式中,Tv表示v用户的所有信任用户的数据集合,Tu表示u用户的所有信任用户的数据集合,Tu∩Tv表示u用户和v用户之间的共同信任用户的数量,t*u,v表示修正后的间接信任度。
优选的是,所述项目相似度的修正值满足:
式中,corr(i,j)表示项目相似度,UCi,j表示评价过项目i和项目j的用户总数。
优选的是,所述项目相似度满足:
优选的是,所述步骤四中对待推荐项目进行评分预测满足:
式中,r’u,i表示待推荐项目i的评分预测,P(XYu,i=(v,j))表示目标节点基于随机游走算法游走到结点v并从v的已有评分集合中选择项目j的概率,rv,j表示用户v对项目j的评分,Rv,j表示基于随机游走算法用户v对项目j的评分矩阵。
优选的是,所述修正后的待推荐项目的预测评分满足:
式中,r”u,i表示修正后的待推荐项目的预测评分,P(XYu,i=(v,j))表示目标节点基于随机游走算法游走到结点v并从v的已有评分集合中选择项目j的概率,表示间接信任度,Tv表示v用户的所有信任用户的数据集合,Tu表示u用户的所有信任用户的数据集合,Tu∩Tv表示u用户和v用户之间的共同信任用户的数量,f(p)表示用户之间共同信任用户的奇偶数概率。
本发明所述的有益效果:
(1)本发明提供的基于Trust-Walker的信任推荐模型,针对用户在大数据背景下基于信任推荐系统的推荐,先构建一种信任关系传播模型。基于初始的直接信任关系,借助信任的传播特性,依赖于一定的规则,计算用户的间接信任关系,填充和扩展信任网络,缓解用户信任关系数据的稀疏性问题。
(2)本发明提供的基于Trust-Walker的信任推荐模型,通过一定的方法对不同用户间的信任度进行了修正,使其更符合现实意义。
(3)在修正的信任模型的基础上,构建一种基于信任的协同过滤的推荐模型,有效结合用户信任关系和用户兴趣偏好作为推荐的重要基础,进而提高推荐效果。该模型利用并改进了Trust Walker模型,主要在信任用户的选择和评分预测上进行了改进。一方面,基于扩展的信任网络进行随机游走,确保发现更多的用户信任关系和项目评分,另一方面利用修正的信任度赋予那些信任度高的用户的评分更高的权重,综合这方面的内容提高推荐的准确性和可信性。最后,在大数据环境下,面对海量数据的挑战,把改进的推荐模型在大数据处理平台上进行分布式并行计算,以此来提高算法的效率和增强算法的可扩展性。
附图说明
图1是本发明所述的Hadoop平台下扩展率性能的比较结果曲线。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
本发明提供一种基于Trust-Walker的信任推荐模型,具体包括如下步骤:步骤一、确定多种路径信任传递下的用户之间的信任关系;
(1)、研究信任传递的步长问题:
信任衰减因子与信任传递的步长有关,其具体定义如式(1)所示:
式中,w表示信任衰减因子,pmax表示信任传递的最大步长,Path Len=6,pu,v表示在信任关系网络中两个用户之间的信任传递路线的长度。
(2)在信任网络中,假定两个用户之间存在着一条可以到达的且是最短的信任传递路径p=(u,a,bL n,v),那么单路径信任传递下的用户之间的间接信任度的计算公式如式(2)所示:
t1(u,v)=w·tu,a·ta,bL tn,v,n≤6 (2)
式中,tu,v表示用户之间的间接信任度,tu,a、ta,b、tn,v表示用户之间的直接信任度。
(3)采用以加权平均为基础的聚合计算多路径信任传递下的用户之间的间接信任度情况,计算公式如式(3)所示:
其中,p表示u用户与v用户之间的可以到达的路径,n表示用户之间可以到达的路径数目。
步骤二、根据共同信任用户数量对用户之间的信任关系进行修正;
修正用户的信任度是引入了共同信任用户数量作为影响因子。修正后的间接信任度,如式(4)所示:
式中,Tv表示v用户的所有信任用户的数据集合,Tu表示u用户的所有信任用户的数据集合,Tu∩Tv表示u用户和v用户之间的共同信任用户的数量。
步骤三、在用户间基于信任关系进行随机游走获得用户的信任关系和项目评分;
假设在随机游走时第k步游走访问到了一个v用户,如果用户v对项目i进行过评分,存在一个项目评分ru,i,那么这一次的随机游走立即停止,然后把这个项目评分rv,i返回,否则,推荐系统会先基于一定的概率在用户v这里停止这一次游走,然后再从用户v对项目进行过的评分中选取与项目i最相似的项目j,最后把用户v对项目j的评分rv,j返回。之后随机游走是以的概率继续进行游走。然后第k+1步直接跳转到任意一个与用户v直接信任的用户结点上。假定用户u的用户信任集合是TUu,Xu代表的是进行下一步随机游走时,在一个大集合里随机选取的一个用户的变量,概率用以下公式表示:
其中,tu,v代表着用户u给用户v的间接信任度,p(Xu=v)表示用户v进行下一步游走的概率,tu,w表示用户u给用户w的间接信任度。
实验中以信任游走为基础的模型的实验数据采用EPN数据集,所以只用0和1表示信任评价。因此推导出:
式中,RIu表示用户u所评价过的项目集合。
因此根据上述两式,可以得到一个概率是,进行第k步随机游走时从用户u跳转到用户v的条件概率是:
式中,p(su=v)表示选择v作为用户u信任关系中下一个随机游走的用户的概率,su表示用户u的最近邻集合。
步骤四、实现项目选择:项目之间的相似度决定了项目被选取的概率。
Trust Walker模型引入一个影响因子来进行项目的相似度修正,这个影响因子是一起评价过项目i和项目j的用户总数UCi,j,计算基于皮尔逊的项目相似度的计算公式如式(9)所示:
项目相似度的修正计算公式如式(10)所示:
式中,sim(i,j)表示修正的项目相似度,sim(i,I)表示项目i在总项目I中的项目相似度。
随着随机游走的不断进行,当最后得到的返回数据上下波动平稳时,代表着过程结束。在过程中设定返回数据是rk,循环次数用n表示,多次循环后得到的平均值用表示,并把临界值最低设置为0.00001,那么符合式(12)时,结束游走过程。与此同时,可能存在一个问题,那就是发散,基于这个原因,又把循环次数的临界值最高设置为9999,如果循环次数超过99999次还发散,就结束随机游走。
然后,把每次随机游走后获得的所有数据信息整合起来,然后把信任用户对待推荐项目的评分信息和相似项目的评分信息集合之后,最后对待推荐项目的评分进行预测。待推荐项目i的评分预测如式(13)所示:
式中,P(XYu,i=(v,j))表示目标节点基于随机游走算法游走到结点v并从v的已有评分集合中选择项目j的概率,rv,j表示用户v对项目j的评分,Rv,j表示基于随机游走算法用户v对项目j的评分矩阵。
步骤五、根据修正后的信任度得到修正后的待推荐项目的预测评分,修正信任度,把所有用户之间以及项目之间相关的联系充分考量,计算分为以下三种情形:
在待推荐项目的评分预测中引入上述修正的信任度,因此,最终改进后的预测评分如式(15)所示:
式中,r”u,i表示修正后的待推荐项目的预测评分,P(XYu,i=(v,j))表示目标节点基于随机游走算法游走到结点v并从v的已有评分集合中选择项目j的概率,表示间接信任度,Tv表示v用户的所有信任用户的数据集合,Tu表示u用户的所有信任用户的数据集合,Tu∩Tv表示u用户和v用户之间的共同信任用户的数量,f(p)表示用户之间共同信任用户的奇偶数概率。
实施例
仿真实验采用了EPN十万条用户对商品的评分作为实验数据集,它具有的用户达到了5500个,并基于Python与大数据处理框架的MapReduce实现推荐模型的功能。通过MapReduce接口来实现改进信任推荐模型的评估实验,这种评估实验是使用Map函数和Reduce函数来计算MAE。先把评分记录输入到测试集,与此同时使用Map1函数对其进行处理,结果得到一个用户和物品的评分值。其次,第二阶段使用Map2把推荐结果读入预测集。最后在Reduce阶段把两个经过Map函数处理后得到的结果输出,最后进行相关的数据统计,分别从推荐质量和可扩展性两方面进行仿真实验与结果分析。
(1)推荐系统推荐质量结果分析:
对比实验过程中采用的数据与在单机系统环境下实验中所用的数据相同,并且使用的计算是一致的,得到的MAE分别为0.8103和0.8109,由此可见,从推荐质量角度来说,Hadoop大数据处理平台上并行的算法与在单机系统环境下算法并没有太大的区别。
(2)推荐系统可扩展性结果分析:
原始数据采用5500个左右用户在平台上的运行效率,如图1所示,结果以曲线图表示,从实验结果可以看出,当数据规模是500时,算法在单机运行的效率比在Hadoop上并行算法高。但是随着数据规模不断增加,并行方法比在单机运行的效率高,渐渐体现出其优势。最后,当数据规模更大时,在Hadoop上实现的推荐算法依然可以运行,并得出结果,单机运行反而会出现内存不足,系统崩溃的情况。由此可见,在Hadoop大数据处理平台上实现的推荐算法处理较大规模的数据时,效果更好。
本发明提供的基于Trust-Walker的信任推荐模型,采用以信任为基础的协同推荐模型,是在以信任游走推荐模型和信任传递模型的基础上进行改进的,先构建用户之间的信任网络,并提出了一种信任传递模型,最后修正信任度,获得待推荐项目的预测评分,提高推荐的准确性和可信性。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (10)
1.一种基于Trust-Walker的信任推荐模型,其特征在于,包括如下步骤:
步骤一、确定用户之间的信任关系;
步骤二、根据共同信任用户数量对用户之间的信任关系进行修正;
步骤三、在用户间基于信任关系进行随机游走获得用户的信任关系和项目评分;
步骤四、根据项目之间的相似度对待推荐项目进行评分预测;
步骤五、根据修正后的信任度得到修正后的待推荐项目的预测评分。
3.如权利要求2所述的基于Trust-Walker的信任推荐模型,其特征在于,当所述u用户与v用户之间的可以到达的路径为单路径p=(u,a,bL n,v)时,所述用户之间的间接信任度满足:
t1(u,v)=w·tu,a·ta,bL tn,v;
式中,w表示信任衰减因子,tu,a,ta,b,L tn,v表示用户之间的直接信任度,n≤6。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010900785.3A CN112016006A (zh) | 2020-09-01 | 2020-09-01 | 一种基于Trust-Walker的信任推荐模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010900785.3A CN112016006A (zh) | 2020-09-01 | 2020-09-01 | 一种基于Trust-Walker的信任推荐模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112016006A true CN112016006A (zh) | 2020-12-01 |
Family
ID=73515286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010900785.3A Withdrawn CN112016006A (zh) | 2020-09-01 | 2020-09-01 | 一种基于Trust-Walker的信任推荐模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112016006A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113486259A (zh) * | 2021-07-06 | 2021-10-08 | 天津大学 | 基于双向稀疏信任的推荐方法 |
-
2020
- 2020-09-01 CN CN202010900785.3A patent/CN112016006A/zh not_active Withdrawn
Non-Patent Citations (1)
Title |
---|
李帅等: "大数据中一种基于Trust-Walker的信任推荐方法", 《电子测试》, vol. 440, no. 11, pages 72 - 75 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113486259A (zh) * | 2021-07-06 | 2021-10-08 | 天津大学 | 基于双向稀疏信任的推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Block-wisely supervised neural architecture search with knowledge distillation | |
Kuhn | Variable selection using the caret package | |
CN109062919B (zh) | 一种基于深度强化学习的内容推荐方法及装置 | |
US7742906B2 (en) | Balancing collections of vertices in a network | |
US20120330864A1 (en) | Fast personalized page rank on map reduce | |
CN110033097B (zh) | 基于多个数据域确定用户与物品的关联关系的方法及装置 | |
WO2019154215A1 (zh) | 机器人运行路径生成方法、计算设备及存储介质 | |
Rakshit et al. | Extending multi-objective differential evolution for optimization in presence of noise | |
WO2022166125A1 (en) | Recommendation system with adaptive weighted baysian personalized ranking loss | |
CN115456140A (zh) | 一种基于夏普利值解释的图神经网络模型重要链路确定方法及装置 | |
CN111753215B (zh) | 一种多目标推荐优化方法及可读介质 | |
Linusson | Multi-output random forests | |
CN113918834A (zh) | 融合社交关系的图卷积协同过滤推荐方法 | |
CN112016006A (zh) | 一种基于Trust-Walker的信任推荐模型 | |
CN110929172A (zh) | 信息选择方法、装置、电子设备及可读存储介质 | |
US11972335B2 (en) | System and method for improving classification in adversarial machine learning | |
CN117556891A (zh) | 基于子图范围采样的图神经网络训练方法及系统 | |
CN107944045B (zh) | 基于t分布哈希的图像检索方法及系统 | |
CN110222055A (zh) | 一种动态图下多边更新的单轮核值维护方法 | |
Ding et al. | Efficient model-based collaborative filtering with fast adaptive PCA | |
CN111125541B (zh) | 面向多用户的可持续多云服务组合的获取方法 | |
Sandberg et al. | Combinatorial Gaussian Process Bandits in Bayesian Settings: Theory and Application for Energy-Efficient Navigation | |
Clarkson et al. | Computing optimal strategies for a search game in discrete locations | |
US20160055121A1 (en) | Node-based sequential implicit enumeration method and system thereof | |
US11615345B2 (en) | Systems and methods for optimizing a machine learning model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201201 |
|
WW01 | Invention patent application withdrawn after publication |