CN110119478A - 一种结合多种用户反馈数据的基于相似度的物品推荐方法 - Google Patents
一种结合多种用户反馈数据的基于相似度的物品推荐方法 Download PDFInfo
- Publication number
- CN110119478A CN110119478A CN201910403221.6A CN201910403221A CN110119478A CN 110119478 A CN110119478 A CN 110119478A CN 201910403221 A CN201910403221 A CN 201910403221A CN 110119478 A CN110119478 A CN 110119478A
- Authority
- CN
- China
- Prior art keywords
- data
- similarity
- user
- feedback
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 241001269238 Data Species 0.000 title claims description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 52
- 238000013508 migration Methods 0.000 claims abstract description 25
- 230000005012 migration Effects 0.000 claims abstract description 25
- 238000004364 calculation method Methods 0.000 claims abstract description 24
- 238000005295 random walk Methods 0.000 claims abstract description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 238000002156 mixing Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种结合多种用户反馈的基于相似度的物品推荐方法。方法包括:对复杂辅助信息中隐含语义信息进行建模,针对不同类型用户反馈类型,采用不同的异步双向游走方式,计算不同类型对象间的相似度,再将这些相似度计算结果以贝叶斯排序优化技术组合,再根据组合后的用户‑物品相似度矩阵向每个用户生成Top‑N推荐结果。本发明提出的随机游走方法能建模出路径内任意节点对最终该路径计算结果的影响,从而能够充分挖掘隐含语义并量化语义得到不同类型对象间的相似度。
Description
技术领域
本发明属于推荐系统领域,具体涉及一种结合多种反馈数据的基于相似度的物品推荐方法。
背景技术
随着Web2.0技术的发展,互联网承载了人们大量的数据分享活动,如何让人们在海量的数据中想要找到他们需要的信息将变得越来越难。为了解决这类问题,搜索引擎通过键入关键词的方式帮助用户快速找到目标信息,但是在用户无明确需求、不能将需求简化为关键词、需求更符合自身兴趣和口味的内容时,搜索系统便不能满足用户需求。因此推荐系统应运而生,将用户获取信息的方式扩展至更符合人们使用习惯的领域。如今推荐系统更是在电子商务(Amazon等)和社交网络(豆瓣等)等站点广泛部署和应用,在推荐系统中进一步挖掘用户兴趣爱好并据此推荐相关内容是重要的发展方向。
为了达到此目标,可以利用Google公司在2012年5月提出的“知识图谱”概念。知识图谱原来用以提高搜索引擎准确率并改善用户的搜索体验,但是随着机器学习技术的发展,逐渐被用于个性化推荐和智能搜索等领域。而当知识图谱应用于推荐系统中时,电商和社交网络等站点可以构建为一类异质信息网络(Heterogeneous Information Network,HIN),这类HIN可以用于描述网站或系统中存在的各种数据实体或概念及其关系,并形成一张巨大的语义网络图。
为了在此类巨型语义网络中挖掘语义关系,相似度被提出用于计算推荐度,并成为最重要的推荐方法之一。其主要思路是通过对相同类型对象间进行相似度计算,根据协同过滤的基本思路进行推荐。但是计算相同类型对象间的相似度方法不能充分利用异质信息网络中不同类型对象和链接下的各种隐含语义,导致推荐系统的准确率不尽如人意。为了利用更多的类型信息,另一类方法是通过随机游走算法对不同类型对象间相似度进行计算,并将该相似度视为系统推荐度的依据。通常异质信息网络场景中约束路径下不同随机游走方式和方向会挖掘出不同的语义并计算出不同的游走概率,但是使用这类基于游走路径间的方法仅考虑路径间语义含义而忽略了路径内语义,因为它们仅考虑每个路径上只有一个会合位置,因此会减少对路径内语义的挖掘,也会影响推荐质量。
然而上述这类仅利用用户点击等隐式反馈数据进行相似度计算并推荐物品的前提和假设是:用户在网站中的点击、浏览、停留、跳转、关闭等行为反映了用户的兴趣爱好,这类行为从侧面反映用户喜好与之产生互动行为的物品。但是在现实生活中这类行为存在用户误点击、点击后无兴趣和恶意访问(例如购物网站中多次浏览页面补充差评) 等现象,这些现象与上述假设具有较大偏差甚至完全相反。因此充分利用系统中的评分等显式反馈具有语义充分且准确的优点,而使用显式用户反馈的系统中研发推荐算法的难点:数据稀疏和评分不稳定。因此在系统中混合两类用户反馈时也是需要解决这类问题的。
发明内容
发明目的:基于现有技术的不足,本发明提出一种结合多种用户反馈数据的基于相似度的物品推荐方法,针对辅助信息中隐含语义信息被忽视这一问题,改进了以往基于随机游走为核心的相似度计算,并使该方法适用于多类反馈信息混合的系统,同时提高了利用相似度计算的个性化推荐系统的推荐准确度。
技术方案:一种结合多种用户反馈数据的基于相似度的物品推荐方法,所述方法包括以下步骤:
S10、收集推荐系统的用户访问和评分记录两类数据,同时整理系统中用户和物品的元数据以及系统用户间或物品间的关系数据,将这些数据转换为多个邻接矩阵;
S20、根据邻接矩阵的行列关系建立异质信息网络模型;
S30、确定推荐对象和推荐主体,并抽取出异质信息网络模型中所有符合条件的元路径,同时标记每条元路径上的关系来源的用户反馈种类;
S40、针对元路径上关系的用户反馈类型,分别采用相应的异步双向随机游走算法进行相似度计算;
S50、针对每条元路径相似度计算结果,采用贝叶斯排序优化技术将其整合,并对每个用户提供Top-N推荐结果。
进一步地,所述步骤S10包括:
S11、逐条挑选系统数据,按照产生数据关系的种类将记录信息分解为多张数据记录表;
S12、根据各记录表中的数据类型关系将表内数据以两类关系为维度组织成邻接矩阵,矩阵的行列分别代表各类关系;
S13、如果生成邻接矩阵的数据是隐式反馈,则将“是/否”转为0/1数据;如果生成邻接矩阵的数据是显式反馈,则将数据填入邻接矩阵对应位置;如果生成邻接矩阵的数据是两类反馈数据混合,则分别生成由各自类型反馈数据组成的邻接矩阵并标记。
进一步地,所述步骤S20包括:
S21、根据步骤S10中各种数据类型,将对象类型生成有向无环图中的节点信息;
S22、根据邻接矩阵,如果行列是上述图结构中的节点,则在图中将两节点以一类关系用双向链接相连,并且按照连接的对象类型将链接标记相应的语义信息;
S23、在构建了上述的有向无环图后,根据对邻接矩阵的标记,按照用户反馈类型对链接边进行标记,得到三类链接边。
进一步地,所述步骤S30中确定元路径的方法如下:
S31、根据平台部署推荐算法的要求,确定推荐对象和推荐主体;
S32、使用广度优先搜索算法来搜索从推荐对象出发到推荐主体的所有元路径,其中路径长度约束参数l设置为与异质信息网络对象类型数目相等,当路径长度大于l时,算法主动停止。
进一步地,所述步骤S40中相似度计算方法包括:
S41、如果所有路径为隐式用户反馈相连,则采用异步双向随机游走算法计算元路径相似度,记录下计算结果;
S42、如果元路径建立在显式反馈的基础上,则按照显式反馈大小,计算下一跳的游走概率,并将此游走概率融合入S41的随机游走算法中,即在S41中某方向游走概率计算过程中的原有一跳中的概率替换为当前步骤计算出的概率;
S43、如果路径中存在混合用户反馈,则将显式反馈压缩为隐式反馈并和原有隐式反馈组合,执行步骤S41,再将计算结果离散化为显式反馈,与原有显式反馈汇合,执行步骤S42,得到的结果即为运算结果。
有益效果:本发明所提方法主要关注异质信息网络场景下的推荐系统,在建立利用相似度计算的推荐模型后,异质信息网络场景下的Top-N推荐算法核心部分就是计算出足够精准的对象间相似度,而根据对过去技术工作分析,能够充分挖掘异质信息网络中异构信息中路径内和路径间的隐含语义是计算相似度的关键。因此提出的随机游走方法能建模出路径内任意节点对最终该路径计算结果的影响,就能充分挖掘隐含语义并量化语义得到不同类型对象间的相似度。
附图说明
图1是根据本发明的物品推荐方法总体流程图;
图2是根据本发明的数据预处理和提取结构信息的示意图;
图3是根据本发明的基于隐式和显式反馈相似度计算方法示意图;
图4是根据本发明的基于混合反馈相似度计算方法示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。应当了解,以下提供的实施例仅是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的技术构思,本发明还可以用许多不同的形式来实施,并且不局限于此处描述的实施例。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。
本发明通过对复杂辅助信息中隐含语义信息进行建模,针对不同类型用户反馈类型,采用不同的异步双向游走方式,计算不同类型对象间的相似度,再将这些相似度计算结果以贝叶斯排序优化技术组合,再根据组合后的用户-物品相似度矩阵向每个用户生成Top-N推荐结果。
图1所示为根据本发明的物品推荐方法的整体框架示意图,包括以下主要环节:
S10、信息预处理环节:先收集数据,在具有复杂类型数据平台收集用户与物品交互数据、用户属性信息、物品属性信息、社交关系和物品间组件关系等,然后对各类数据进行处理,过滤和清洗“脏”数据和孤立数据,处理成数据对形式,再组织成邻接矩阵并记录矩阵数据类型。
在收集数据时本发明的方法会根据应用平台的数据历史数据特征提取出各类关系数据对,以这些关系数据对类型建立不同的邻接矩阵。作为优选,本发明提供了数据预处理功能,用于过滤邻接矩阵中无效的数据和另一些数据量极小的矩阵。因为本发明立足于个性化推荐,因此可在预处理时将全局流行的数据直接过滤,并且将一些与其他类型对象发生关系极少的对象删去,并根据“奥卡姆剃刀”原则直接清理对于数据密度极低的邻接矩阵。
图2是以IMDb网站中为例的数据预处理和提取结构信息环节示意图。如图所示,计算中的数据源是多种类型,包括用户访问数据、物品属性数据、用户元数据等,在图中即为数据对<x,y>形式表示。每个数据对都是类型数据间的关系,例如图中的<u,m>为用户-电影对,<t,m>为题材-电影对等。
在处理数据时,从IMDb平台中产生的初始数据是一些携带多个字段的元数据,如[用户id,电影id,电影名,用户国籍]这类数据,从类数据中可以提取出6类数据对用户id-电影id,用户id-电影名,用户id-用户国籍,电影id-电影名,电影id-用户国籍,电影名-用户国籍,因为电影名基本可以与电影id一一对应,且电影与用户国籍之间没有直接关连,所以最终提取的数据对有2对用户-电影,用户-国籍。
在抽取出所有的数据对后,按照数据对类型建立不同的邻接矩阵,如图2中所示,<u0,m1>和<u1,m2>分别对应生成的用户-电影邻接矩阵第0行第1列和第1行第2列。同时根据元数据中的反馈数据类型标志,对生成的邻接矩阵进行标记,将用户的观看和点击行为设置为隐式反馈(点击行为为1,否则为0),将用户评分数据设置为显式反馈(有评分设置评分为反馈,否则为0)。例如,用户-电影矩阵被标记为两类,分别是:用户- 电影(隐)和用户-电影(显)。
S20、建立和提取结构环节:由上述邻接矩阵的行列关系建立成异质信息网络,并从网络中提取出可有效挖掘语义的元路径。
提取结构信息环节首先是将所有数据对象类型构建成一类图结构:首先需要收集上述得到邻接矩阵中行列类型信息,将这些类型信息作为图结构的节点;将每个邻接矩阵的行列在图中以边相连,最终形成一类图。之后需要从图中提取元路径:先确定计算相似度的两类对象类型,即需要提取的元路径的起点与终点;再使用广度优先搜索算法从图结构搜索出从要求的起点出发到达要求的终点结束的所有搜索路径。
具体而言,通过对所有生成的邻接矩阵标记进行分析,建构异质信息网络的网络模型,而异质信息网络为:一个异质信息网络可以表示为一个有向图其中V是对象(实际系统中的某个用户、商品等)的集合,E是链接边的集合。A是对象类型的集合,且有映射关系φ:V→A,,这表示V中每个特定元素属于A中的某个分类。同时R是链接类型集合,也有类似的映射关系也是将链接分类的函数关系。每种链接类型都代表一种特定的关系,如链接eu,v∈E(u,v∈V)代表u连接到v的链接,而这种链接类型是由u,v的类型和关系决定的。值得注意的是,在有向图G中有 |A|>1且|R|>1。在邻接矩阵将所有的行列视为图中的一个点,将数据关系视为边,建立起图结构。如图2中建立的图中有5个节点和4个链接。
从图中的结构出发,异质网络模式揭示了异质信息网络下一对对象类型可以通过不同关系的组合由不同的路径连接。因此可以通过异质信息网络的网络模型提取出各个元路径,如图2中所示,以用户和电影推荐对象和推荐主体,即元路径的起点和终点。本发明使用广度优先搜索(BFS)算法来搜索从用户出发的所有元路径。虽然网络模型的规模很小,但是BFS算法无法主动停止,因此需要结合网络模型的规模大小将路径长度约束参数l设置为合适的大小,一般而言在会将l设置为与异质信息网络对象类型数目相等。在设定l后,当路径长度大于l时,算法主动停止。在所有搜索得到的元路径中筛选出所有起点为用户终点为电影的元路径,假设满足条件元路径的数量为L。
S30、计算单一元路径相似度环节:根据用户反馈类型,由元路径不同中间节点为会合位置,使用成对随机游走方案计算元路径两端对象相似度。
首先从刚刚生成的邻接矩阵和图中获取所有用户反馈类型,根据反馈数据分为隐式、显式和混合三类,再根据三类反馈类型分别使用不同的算法计算相似度。各类反馈对应的算法分别为:
1)隐式反馈:应用异步双向随机游走算法,即以每条元路径为计算单元,将从路径的起点开始至终点为止,以每个中间节点(包括起点和终点)为会合点,以双向成对游走的方式,计算到该中间节点会合的游走概率。因为每个中间点导致的结果量纲不同,所以将标准化后的相似度计算求和再求平均作为基于该条路径的相似度计算结果。
2)显式反馈:在计算隐式反馈时考虑到每个语义网络上每个节点出度和入度的不对等性,本发明在对元路径中包含显式反馈关系的关系计算相似度时利用显式反馈表示到下一跳的游走概率,即根据用户评分等显式反馈数据的大小确定游走概率值,通过上述方法计算每条元路径实例两端所有对象两两之间的游走概率作为相似度。
3)混合反馈:在元路径上存在某个关系是由隐式反馈和显式反馈混合而成,而这类反馈多是和元路径两端相同的对象类型。因此利用元级别技术对混合反馈类型进行处理并计算相似度,先利用1)中的计算方式计算出该关系上的相似度,将相似度转换为显式反馈后与原有显式反馈数据汇合,再将汇合后的显式反馈数据再次由2)中方法计算相似度。
在一个实施例中,参照图3,在某条元路径中利用随机游走算法计算相似度,分别以元路径上每个节点为游走会合的中间节点,以成对随机游走,计算出游走概率作为相似度结果之一。在对结果进行标准化后,利用算术平均数得到该条元路径的相似度计算结果。
在基于隐式反馈或显式反馈计算方式下,可以利用统一的计算方式,但是数据类型不同,如公式:
其中,P-1是成对随机游走中的反向游走部分,P是元路径的正向游走部分。
而公式1中的到达概率为:
其中函数O()为节点的出邻域,而概率Prob(u′|O(u|A0A1))为:
其中,wght(u′|O(u|A0A1))是指u带u’的显式反馈值,sum(O(u|A0A1))是指u到O(A0A1) 中所有对象的显式反馈值之和。X(A0A1)是指示函数,当A0A1为显式反馈时为1,否则为0。
同理,对于成对随机游走的向后随机游走的计算方式为:
其中计算Prob(v′|I(v|Al-1Al))的方式也类似,只需将函数O()换为内接邻域I():
在以上述方法计算方式是在元路径上所有关系都是纯粹用户反馈数据,但是在实际的数据中,在推荐对象和推荐实体间中的反馈数据是混合的。因此本发明提出一种处理该种情况的方法,如图3所示,使用元级别技术计算此类情况下的相似度:
1)将用户对电影的评分数据压缩成为{0,1}隐式反馈并于原有的隐式反馈数据合并,再将合并后的数据通过HybSim计算出的用户与电影间相似度矩阵Stmp;
2)将此矩阵转化为和原有评分矩阵量纲相同的显式反馈矩阵,再将转化后的矩阵与原有评分矩阵合并,去除Stmp中和原有评分矩阵重复的值;
3)将合并后的值投入HybSim的计算流程再次计算出相似度矩阵结果。
S40、合成全局相似度环节:将多条元路径计算得出的相似度使用加权和组合,并使用贝叶斯优化技术计算最优权值向量。
根据上述相似度计算结果进行推荐是用于衡量使用相似度计算推荐质量的关键步骤。将每条元路径获得的相似度使用加权和的方式组合,而权值向量的值使用贝叶斯排序优化技术训练和调参得到。
图4是在计算出所有的元路径上两端的相似度后,利用加权和的方式合成流程的示意图。主要利用贝叶斯排序技术计算出最优解。对于一个给定的用户评分数据矩阵(m和n分别是用户U和物品集I大小),可以通过相似度计算方法得到全体用户和物品的相似度矩阵相似度矩阵S中的元素S(i,j)代表用户i和物品j在指定元路径下的关联程度,即i对j的喜好程度。因为在搜索后系统中用户集和物品集间有L条元路径,所以可以得到L个承载不同语义的相似度矩阵S1S2···SL。因为不同元路径下的语义信息对推荐结果有着不同的影响,所以引入θi来作为元路径的重要性权值,因此将所有元路径下的矩阵合成后得:
为了求出θi的最优解,采用贝叶斯优化技术来求解。首先,将用户数据组织成三元组(u,i,j)的形式,这表示用户的喜好中有i>j的偏序,再将所有用户的三元组集合成训练集D。而贝叶斯排序优化的思想是最大化一个贝叶斯后验概率,最终求解出最优解。
S50、生成推荐结果环节:利用每个用户对应的向量中,按照相似度降序排列,选取该用户尚未访问物品中的Top-N,生成列表推荐给用户。
在求解出θi的最优解后,利用(6)式计算得到并将其作为最终的推荐结果参考矩阵。针对某个用户uj,可以推荐中第j行中值大小前N个未访问的物品作为Top-N推荐结果。
本发明所提方法主要关注异质信息网络场景下的推荐系统,在建立利用相似度计算的推荐模型后,异质信息网络场景下的Top-N推荐算法核心部分就是计算出足够精准的对象间相似度,而根据对过去技术工作分析,能够充分挖掘异质信息网络中异构信息中路径内和路径间的隐含语义是计算相似度的关键。针对于此,本发明提出一种随机游走方法,能建模出路径内任意节点对最终该路径计算结果的影响,从而能充分挖掘隐含语义并量化语义得到不同类型对象间的相似度。
Claims (6)
1.一种结合多种用户反馈数据的基于相似度的物品推荐方法,其特征在于,所述方法包括以下步骤:
S10、收集推荐系统的用户访问和评分记录两类数据,同时整理系统中用户和物品的元数据以及系统用户间或物品间的关系数据,将这些数据转换为多个邻接矩阵;
S20、根据邻接矩阵的行列关系建立异质信息网络模型;
S30、确定推荐对象和推荐主体,并抽取出异质信息网络模型中所有符合条件的元路径,同时标记每条元路径上的关系来源的用户反馈种类;
S40、针对元路径上关系的用户反馈类型,分别采用相应的异步双向随机游走算法进行相似度计算;
S50、针对每条元路径相似度计算结果,采用贝叶斯排序优化技术将其整合,并对每个用户提供Top-N推荐结果。
2.根据权利要求1所述的结合多种用户反馈数据的基于相似度的物品推荐方法,其特征在于,所述步骤S10包括:
S11、逐条挑选系统数据,按照产生数据关系的种类将记录信息分解为多张数据记录表;
S12、根据各记录表中的数据类型关系将表内数据以两类关系为维度组织成邻接矩阵,矩阵的行列分别代表各类关系;
S13、如果生成邻接矩阵的数据是隐式反馈,则将“是/否”转为0/1数据;如果生成邻接矩阵的数据是显式反馈,则将数据填入邻接矩阵对应位置;如果生成邻接矩阵的数据是两类反馈数据混合,则分别生成由各自类型反馈数据组成的邻接矩阵并标记。
3.根据权利要求1所述的结合多种用户反馈数据的基于相似度的物品推荐方法,其特征在于,所述步骤S20包括:
S21、根据步骤S10中各种数据类型,将对象类型生成有向无环图中的节点信息;
S22、根据邻接矩阵,如果行列是上述图结构中的节点,则在图中将两节点以一类关系用双向链接相连,并且按照连接的对象类型将链接标记相应的语义信息;
S23、在构建了上述的有向无环图后,根据对邻接矩阵的标记,按照用户反馈类型对链接边进行标记,得到三类链接边。
4.根据权利要求1所述的结合多种用户反馈数据的基于相似度的物品推荐方法,其特征在于,其特征在于,所述步骤S30中确定元路径的方法如下:
S31、根据平台部署推荐算法的要求,确定推荐对象和推荐主体;
S32、使用广度优先搜索算法来搜索从推荐对象出发到推荐主体的所有元路径,其中路径长度约束参数l设置为与异质信息网络对象类型数目相等,当路径长度大于l时,算法主动停止。
5.根据权利要求1所述的结合多种用户反馈数据的基于相似度的物品推荐方法,其特征在于,其特征在于,所述步骤S40中相似度计算方法包括:
S41、如果所有路径为隐式用户反馈相连,则采用异步双向随机游走算法计算元路径相似度,记录下计算结果;
S42、如果元路径建立在显式反馈的基础上,则按照显式反馈大小,计算下一跳的游走概率,并将此游走概率融合入S41的随机游走算法中,即在S41中某方向游走概率计算过程中的原有一跳中的概率替换为当前步骤计算出的概率;
S43、如果路径中存在混合用户反馈,则将显式反馈压缩为隐式反馈并和原有隐式反馈组合,执行步骤S41,再将计算结果离散化为显式反馈,与原有显式反馈汇合,执行步骤S42,得到的结果即为运算结果。
6.根据权利要求1所述的结合多种用户反馈数据的基于相似度的物品推荐方法,其特征在于,所述步骤S50包括:
S51、将所有元路径得出的结果以加权和的形式组合;
S53、利用贝叶斯排序优化技术计算出最优的权值向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910403221.6A CN110119478B (zh) | 2019-05-15 | 2019-05-15 | 一种结合多种用户反馈数据的基于相似度的物品推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910403221.6A CN110119478B (zh) | 2019-05-15 | 2019-05-15 | 一种结合多种用户反馈数据的基于相似度的物品推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110119478A true CN110119478A (zh) | 2019-08-13 |
CN110119478B CN110119478B (zh) | 2023-07-21 |
Family
ID=67522533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910403221.6A Active CN110119478B (zh) | 2019-05-15 | 2019-05-15 | 一种结合多种用户反馈数据的基于相似度的物品推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110119478B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111191081A (zh) * | 2019-12-17 | 2020-05-22 | 安徽大学 | 一种基于异质信息网络的开发者推荐方法及装置 |
CN112115358A (zh) * | 2020-09-14 | 2020-12-22 | 中国船舶重工集团公司第七0九研究所 | 一种利用知识图谱中多跳路径特征的个性化推荐方法 |
CN115170178A (zh) * | 2022-06-27 | 2022-10-11 | 天翼爱音乐文化科技有限公司 | 一种基于呼叫网络的营销方法、系统、设备及存储介质 |
CN117076787A (zh) * | 2023-10-13 | 2023-11-17 | 北京百特迈科技有限公司 | 婚恋交友对象推荐方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120226651A1 (en) * | 2011-03-03 | 2012-09-06 | Xerox Corporation | System and method for recommending items in multi-relational environments |
CN103955535A (zh) * | 2014-05-14 | 2014-07-30 | 南京大学镇江高新技术研究院 | 一种基于元路径的个性化推荐方法及系统 |
CN106777051A (zh) * | 2016-12-09 | 2017-05-31 | 重庆邮电大学 | 一种基于用户组的多反馈协同过滤推荐方法 |
-
2019
- 2019-05-15 CN CN201910403221.6A patent/CN110119478B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120226651A1 (en) * | 2011-03-03 | 2012-09-06 | Xerox Corporation | System and method for recommending items in multi-relational environments |
CN103955535A (zh) * | 2014-05-14 | 2014-07-30 | 南京大学镇江高新技术研究院 | 一种基于元路径的个性化推荐方法及系统 |
CN106777051A (zh) * | 2016-12-09 | 2017-05-31 | 重庆邮电大学 | 一种基于用户组的多反馈协同过滤推荐方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111191081A (zh) * | 2019-12-17 | 2020-05-22 | 安徽大学 | 一种基于异质信息网络的开发者推荐方法及装置 |
CN111191081B (zh) * | 2019-12-17 | 2022-02-22 | 安徽大学 | 一种基于异质信息网络的开发者推荐方法及装置 |
CN112115358A (zh) * | 2020-09-14 | 2020-12-22 | 中国船舶重工集团公司第七0九研究所 | 一种利用知识图谱中多跳路径特征的个性化推荐方法 |
CN112115358B (zh) * | 2020-09-14 | 2024-04-16 | 中国船舶重工集团公司第七0九研究所 | 一种利用知识图谱中多跳路径特征的个性化推荐方法 |
CN115170178A (zh) * | 2022-06-27 | 2022-10-11 | 天翼爱音乐文化科技有限公司 | 一种基于呼叫网络的营销方法、系统、设备及存储介质 |
CN117076787A (zh) * | 2023-10-13 | 2023-11-17 | 北京百特迈科技有限公司 | 婚恋交友对象推荐方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110119478B (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Billion-scale commodity embedding for e-commerce recommendation in alibaba | |
CN110119478A (zh) | 一种结合多种用户反馈数据的基于相似度的物品推荐方法 | |
Dominguez-Sal et al. | A discussion on the design of graph database benchmarks | |
CN104317801B (zh) | 一种面向大数据的数据清洗系统及方法 | |
Pham et al. | S3g2: A scalable structure-correlated social graph generator | |
CN105320719B (zh) | 一种基于项目标签和图形关系的众筹网站项目推荐方法 | |
CN105719191B (zh) | 多尺度空间下不确定行为语义的社交群体发现方法 | |
CN107103000A (zh) | 一种基于关联规则与贝叶斯网络集成的推荐技术 | |
CN106484764A (zh) | 基于人群画像技术的用户相似度计算方法 | |
US20100205176A1 (en) | Discovering City Landmarks from Online Journals | |
CN107145527A (zh) | 对齐异构社交网络中基于元路径的链路预测方法 | |
CN107239512B (zh) | 一种结合评论关系网络图的微博垃圾评论识别方法 | |
CN104239496B (zh) | 一种结合模糊权重相似性度量和聚类协同过滤的方法 | |
CN106934071A (zh) | 基于异构信息网络和贝叶斯个性化排序的推荐方法及装置 | |
CN103092911A (zh) | 一种融合社会标签相似度基于k近邻的协同过滤推荐系统 | |
Ying et al. | Semantic trajectory-based high utility item recommendation system | |
Zhang et al. | Proposing a new friend recommendation method, FRUTAI, to enhance social media providers' performance | |
CN109284443A (zh) | 一种基于爬虫技术的旅游推荐方法及系统 | |
CN109992784A (zh) | 一种融合多模态信息的异构网络构建和距离度量方法 | |
CN115481325A (zh) | 基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统 | |
Lang et al. | POI recommendation based on a multiple bipartite graph network model | |
Pan et al. | Exploiting user behavior learning for personalized trajectory recommendations | |
Yu et al. | Point-of-interest recommendation based on user contextual behavior semantics | |
CN118071400A (zh) | 基于图计算技术在信息消费领域的应用方法及系统 | |
Cai et al. | An extension of social network group decision-making based on trustrank and personas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |