CN102789462B - 一种项目推荐方法及系统 - Google Patents
一种项目推荐方法及系统 Download PDFInfo
- Publication number
- CN102789462B CN102789462B CN201110130424.6A CN201110130424A CN102789462B CN 102789462 B CN102789462 B CN 102789462B CN 201110130424 A CN201110130424 A CN 201110130424A CN 102789462 B CN102789462 B CN 102789462B
- Authority
- CN
- China
- Prior art keywords
- user
- item
- items
- project
- scoring matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims abstract description 79
- 238000004364 calculation method Methods 0.000 claims description 25
- 238000009499 grossing Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 description 11
- 230000006872 improvement Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种项目推荐方法及系统,方法包括:获取用户的历史数据,所述历史数据包括:用户以及项目之间的对应关系;根据所述历史数据计算任意两个项目之间的关联检索相关度;对于每一项目,分别将与该项目之间的关联检索相关度最大的预设第一数量个项目确定为该项目的关联检索相关项目;并且,根据用户的历史数据建立原始的用户-项目打分矩阵;使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,形成计算用户-项目打分矩阵;基于计算用户-项目打分矩阵,确定用户的项目推荐集合。所述方法及系统能够提高推荐结果的准确性,进而提高电子商务网站与用户终端之间的数据传输速度。
Description
技术领域
本申请涉及项目推荐技术,尤其涉及一种项目推荐方法及系统。
背景技术
当用户进入电子商务网站选择图书、视频等产品时,面对的是海量的产品,仅仅依赖搜索与浏览,很难发现符合自己独特兴趣的产品。因此,进行产品的个性化推荐,能够解决用户的信息过载,为用户提供符合其兴趣的产品。
个性化推荐研究的历史根源可以追溯到认知科学、逼近论、信息抽取和预测论等领域的研究工作,同时与管理科学以及市场营销中的客户机会建模有关。但是,推荐系统作为一个独立的研究领域出现还在于1990年代中期。从那时开始,推荐系统研究问题集中解决显式的依赖用户打分结构的推荐方法。在这样的背景下,推荐问题可以规约为:为用户未见项目预测打分的问题。这种估计通常基于用户对其他项目的打分和其他信息。一旦对用户未见项目打分做出预测,我们可以向用户推荐得分高的项目。这里,所谓“项目”概指推荐系统所在的系统向用户所推荐对象,如图书、电影和旅馆等。
更为形式化地,推荐系统可以形式化地描述为:
(1)给定用户集合U,要推荐的项目集合S;
(2)构建一个用户对项目的打分函数f:U×S→R,R为一定范围内的非负整数;
(3)对任一个用户u∈U,从S中选择打分函数值最高的项目Su,即为:
根据具体的推荐策略,推荐系统一般分为以下三类:
(1)基于内容的推荐系统:向用户推荐与其过去选择的项目相似的项目;
(2)协同过滤推荐系统:在基于用户的协同过滤推荐系统中,向用户推荐与其偏好相似的其他用户选择的项目;在基于项目的协同过滤推荐系统中,首先根据所有人的选择情况(打分、是否购买等,而不是项目的内容描述),计算项目之间的相似度;进一步地,根据项目之间的相似度,向一个用户推荐的与其历史选择相近的项目。
(3)混合型推荐系统:混合上述两种推荐方式的数据或策略,向用户推荐项目的系统。
不同方法适用于不同应用领域与数据集合,例如在图书领域,图书的推荐系统一般属于基于项目的协同过滤推荐系统。
具体的,如图1所示,现有图书推荐系统的处理流程一般包括以下步骤:
步骤101:根据用户的购买历史记录形成用户-图书打分矩阵;
用户-图书打分矩阵中,行为用户,列为图书,元素为对应用户对对应图书的打分值,在实际应用中,所述元素值一般根据用户是否购买了该图书而相应设置为1或0。
步骤102:计算任意两个图书之间的余弦相关性;
步骤103:对每个图书,选择与该图书余弦相关性最高的预设M个图书作为该图书的邻居图书。
步骤104:根据用户的购买图书以及被购买图书的邻居图书确定用户的图书候选集合,并确定图书候选集合中每一图书的推荐强度,将推荐强度最高的预设N个图书作为该用户的图书推荐集合。
虽然在实际应用中,图书推荐系统是根据用户的购买历史确定用户的最终图书推荐集合,但是,所述最终图书推荐集合中包含的图书往往与用户感兴趣的图书并不匹配,因此,用户往往无法从推荐系统中获取所需的图书信息。这时,用户仍然需要在电子商务图书网站通过传统的搜索和浏览等操作,最终自主确定感兴趣的图书,进而进行购买等后续操作。对于其他的项目推荐系统,也存在与图书推荐系统类似的推荐结果不准确的问题。
基于以上情况,在不考虑电子商务网站建立项目推荐系统等成本的情况下,因项目推荐结果不准确,还将导致如下问题:用户终端与电子商务网站之间需要进行项目推荐数据请求和发送,而所述项目推荐数据对于大多数用户来说并非有用的信息,因此用户仍需按照自身的兴趣通过原有的搜索和浏览等确定自己感兴趣的项目,从而当用户数量很大时,这种数据的传输必然浪费电子商务网站的数据传输带宽,从而降低电子商务网站与各个用户终端之间的数据传输速度,进而降低了电子商务网站对于用户终端的响应速度和效率。
发明内容
有鉴于此,本申请要解决的技术问题是,提供一种项目推荐方法及系统,能够提高推荐结果的准确性,进而提高电子商务网站与用户终端之间的数据传输速度。
为此,本申请实施例采用如下技术方案:
本申请实施例提供一种项目推荐方法,包括:
获取用户的历史数据,所述历史数据包括:用户以及项目之间的对应关系;
根据所述历史数据计算两个项目之间的关联检索相关度;对于每一项目,分别将与该项目之间的关联检索相关度最大的预设第一数量个项目确定为该项目的关联检索相关项目;
并且,根据用户的历史数据建立原始的用户-项目打分矩阵;
使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,形成计算用户-项目打分矩阵;
基于计算用户-项目打分矩阵,确定用户的项目推荐集合。
本申请实施例还提供一种项目推荐系统,包括:
获取单元,用于获取用户的历史数据,所述历史数据包括:用户以及项目之间的对应关系;
计算单元,用于根据所述历史数据计算任意两个项目之间的关联检索相关度;对于每一项目,分别将与该项目之间的关联检索相关度最大的预设第一数量个项目确定为该项目的关联检索相关项目;
建立单元,用于根据用户的历史数据建立原始的用户-项目打分矩阵;
磨平单元,用于使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,形成计算用户-项目打分矩阵;
推荐单元,用于基于计算用户-项目打分矩阵,确定用户的项目推荐集合。
对于上述技术方案的技术效果分析如下:
根据用户的历史数据计算任意两个项目之间的关联检索相关度,并且,据此确定每个项目的关联检索相关项目;从而,在建立原始的用户-项目打分矩阵后,使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,基于磨平后得到的用户-项目打分矩阵确定用户的项目推荐集合,从而使得一个项目的关联检索项目,可以跨用户获得,而后续的磨平方法使得计算项目之间相关度的矩阵稀疏性得以填充,提高了项目之间相关度计算的可靠性,而且,也使得现有技术中由于矩阵的数据稀疏性而不能计算的潜在相关项目之间可以建立相关性,从而在一定程度上解决了因为每个用户直接关联项目较少或者潜在关联项目无法发生关联所导致的推荐结果不准确的问题,提高了推荐系统对于项目推荐结果的准确性;进而,由于推荐结果准确性的提高,使得用户无需如现有技术般过多的进行搜索和浏览操作,即可得到自己感兴趣的项目的信息,从而减少了用户所在用户终端与电子商务网站之间由于搜索和浏览等项目信息查找操作对带宽的占用,节省了带宽,从而提高了电子商务网站与用户终端之间的数据传输速度,提高了两者之间的数据传输效率。
附图说明
图1为现有技术图书推荐方法流程示意图;
图2为本申请实施例项目推荐方法可以适用的应用环境示例;
图3为本申请实施例一种项目推荐方法流程示意图;
图4为本申请实施例另一种项目推荐方法流程示意图;
图4a为本申请实施例的一种用户-项目二部图结构示例;
图5为本申请实施例一种项目推荐系统结构示意图。
具体实施方式
一般电子商务网站所提供的产品数量都非常巨大,例如一个一般的电子商务图书网站其图书存储量都在百万级别,相对这一产品数量,每个用户购买或者打分过的产品数量是非常小的,导致图1所示推荐方法中用户-项目打分矩阵中的数据过于稀疏,而数据稀疏性问题将导致项目与项目之间的相关度计算结果不准确,进一步地,导致项目推荐结果的不准确;而且,由于数据稀疏性问题,使得用户-项目打分矩阵中许多项目之间因为没有被同时购买或者打分情况,从而无法得到相关度,导致具有潜在相关性的项目被推荐机会的减少,整体上使得推荐系统的推荐结果对于项目的覆盖度较低,从而最终也可能导致项目推荐结果的不准确。
基于以上分析,本申请实施例提供一种项目推荐方法及系统,能够提高推荐结果的准确性,进而提高电子商务网站与用户终端之间的数据传输速度。
为了使得后续对本申请实施例的推荐方法及系统的理解更为方便,首先介绍一种本申请实施例的推荐方法及系统可以适用的应用环境,仍以图书推荐为例,如图2所示,包括:
用户终端210、Web服务器220、图书交易数据库服务器230、图书推荐列表检索服务器240以及推荐计算平台250;其中,
用户终端210为用户提供浏览器,以便用户进行电子商务网站的浏览、搜索、购买等操作,用户的购买信息通过用户终端210和Web服务器220发送到图书交易数据库服务器230,由图书交易数据库服务器230进行存储,并经过预处理转存入推荐计算平台250。所述推荐计算平台250可以由分布式硬件集群、Hadoop分布式操作环境和文件系统以及基于MapReduce的JAVA语言程序组成,推荐计算平台250定期更新计算电子商务网站内每个用户的图书产品推荐结果,将计算结果更新到图书推荐列表检索服务器240中。
当用户通过用户终端210向Web服务器220发送包含图书推荐功能的请求时,Web服务器220在接收到所述请求时,向图书推荐列表检索服务器240发送检索用户的图书推荐结果的检索请求,图书推荐列表检索服务器240接收该检索请求,查找到用户对应的图书推荐结果,通过Web服务器220向用户终端210进行反馈,以便用户终端210将图书推荐结果通过浏览器向用户进行展现。
而本申请实施例的所述产品推荐方法及系统既可以设置于所述推荐计算平台250中,用于进行图书产品推荐结果的确定。
当然,以上图2所示的应用环境仅是本申请实施例项目推荐方法及系统的应用环境之一,本申请实施例的项目推荐方法及系统还可以适用于其他类似的项目推荐系统中,例如电影推荐系统、旅游推荐系统等等,只要存在用户与项目之间的历史关联数据,本申请实施例的项目推荐方法及系统即可以根据历史关联数据进行对应的项目推荐。
以下,结合附图详细说明本申请实施例项目推荐方法及系统的实现。
图3为本申请实施例一种项目推荐方法流程示意图,如图3所示,该方法包括:
步骤301:获取用户的历史数据,所述历史数据包括:用户以及项目之间的对应关系;
步骤302:根据所述历史数据计算任意两个项目之间的关联检索相关度;对于每一项目,分别将与该项目之间的关联检索相关度最大的预设第一数量个项目确定为该项目的关联检索相关项目;
步骤303:根据用户的历史数据建立原始的用户-项目打分矩阵;
步骤304:使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,形成计算用户-项目打分矩阵;
步骤305:基于计算用户-项目打分矩阵,确定用户的项目推荐集合。
其中,步骤302与步骤303之间的执行顺序并无固定的限制,可以在实际应用中自主设置。
图3所示的项目推荐方法中,根据用户的历史数据计算任意两个项目之间的关联检索相关度,并且,据此确定每个项目的关联检索相关项目;从而在建立原始的用户-项目打分矩阵后,使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,基于磨平后得到的用户-项目打分矩阵确定用户的项目推荐集合,从而使得一个项目的关联检索项目,可以跨用户获得,而后续的磨平方法使得计算项目之间相关度的矩阵稀疏性得以填充,这提高了项目之间相关度计算的可靠性,而且,也使得现有技术中由于矩阵的数据稀疏性而不能计算的潜在相关项目之间可以建立相关性,从而在一定程度上解决了因为每个用户直接关联项目较少或者潜在关联项目无法发生关联所导致的推荐结果不准确的问题,提高了推荐系统对于项目推荐结果的准确性;进而,由于推荐结果准确性的提高,使得用户无需如现有技术般过多的进行搜索和浏览操作,即可得到自己感兴趣的项目的信息,从而减少了用户所在用户终端与电子商务网站之间由于搜索和浏览等项目信息查找操作对带宽的占用,节省了带宽,从而提高了电子商务网站与用户终端之间的数据传输速度,提高了两者之间的数据传输效率。
在图3的基础上,通过图4对本申请实施例的项目推荐方法进行更为详细的说明,如图4所示,该方法包括:
步骤401:获取用户的历史数据;
所述用户的历史数据可以包括:用户标识以及用户标识对应的项目标识。
具体的,在不同的应用环境下,所述用户的历史数据可能不同,例如,在图1所示的应用环境下,所述历史数据可以包括:用户标识以及与用户标识对应的用户所购买图书的图书标识;而在其他的项目推荐系统中,可能为用户标识以及用户标识对应的用户感兴趣项目的项目标识等。
步骤402:根据用户的历史数据建立用户-项目二部图;
如图4a所示,所述用户-项目二部图依照用户的历史数据建立,具体的,可根据历史数据中用户标识与项目标识之间的对应关系建立,在建立所述二部图时,将用户和项目分别作为二部图中的节点,在用户和与该用户具有对应关系的项目对应的节点之间建立直接通路,从而形成基于用户和项目的二部图,二部图可以认为是一种拓扑图,例如在图4a中,上层节点p1~p4为项目节点,下层节点c1~c3为用户节点,用户节点和项目节点之间的边即表示:在所述历史数据中,用户节点和项目节点之间具有对应关系。
步骤403:根据建立的所述用户-项目二部图,计算任意两个项目之间的关联检索相关度。
其中,在计算两个项目之间的关联检索相关度时,可以计算两个项目对应节点之间所有路径的相关度之和,将计算得到的结果作为两个项目之间的关联检索相关度。其中,两个项目节点之间的每条路径的相关度为:am。其中,a为路径长度影响因子,在实际应用中,a的取值为(0,1)的实数,具体结合应用数据获得,例如,可以设置a=0.8;m为相应路径长度,具体的,可以将二部图中每一跳路径的路径长度设置为1,m的取值可以根据两个项目节点之间的路径经过的跳数确定。
在实际应用中,由于用户-项目二部图一般包含的用户和项目很多,因此,在计算关联检索相关度时,计算两个项目节点之间所有路径的相关度之和时,计算量将非常巨大,影响系统处理效率,因此,可以在实际应用中设置两个项目节点之间路径的最大路径长度,也即m的最大值,从而在计算时,仅计算路径长度小于该最大路径长度的两个项目节点之间的路径的相关度,进而加和得到两个项目节点之间关联检索相关度。例如,可以设置最大路径长度为6等,这里并不具体限定。
步骤404:对于每一项目,根据该项目与其他项目之间的关联检索相关度,将与该项目之间的关联检索相关度最大的预设第一数量个其他项目作为该项目的关联检索相关项目。
其中,所述预设数量可以在实际应用中自主取值,这里并不限定,例如可以取值为35、20等任意数值。
步骤405:根据用户的历史数据建立原始的用户-项目打分矩阵。
本步骤的建立方法可以为:
预设用户-项目矩阵的行为用户,列为项目,元素取值根据历史数据中用户与项目之间是否存在对应关系确定,具体取值规则可以自主设定。例如,在本申请实施例的一种具体实现中:当用户与项目之间具有对应关系时,取值为1;当用户与项目之间没有对应关系时,取值为0。
其中,步骤402~404与步骤405之间的执行顺序并无固定的限制,可以在实际应用中自主设置。
步骤406:使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,形成计算用户-项目打分矩阵。
本步骤的实现可以包括:
当在原始的用户-项目打分矩阵中用户与项目之间具有对应关系时,则确定该项目的关联检索相关项目与该用户之间也具有对应关系,相应修改原始的用户-项目打分矩阵用户与所述关联检索相关项目对应的元素值,这样对整个原始的用户-项目打分矩阵进行操作后获得计算用户-项目打分矩阵。
在步骤405中具体的取值设置规则下,本步骤的实现可以为:
当在原始的用户-项目打分矩阵中用户与项目之间具有对应关系时,则将原始的用户-项目打分矩阵该用户与该项目的所述关联检索相关项目对应的元素值修改为1,这样对整个原始的用户-项目打分矩阵进行操作后获得计算用户-项目打分矩阵。
步骤407:基于计算用户-项目打分矩阵,计算任意两个项目之间的相关性。
在实际应用中,一般可以选择余弦相关性作为两个项目之间相关性的表征,具体的,两个项目之间的的余弦相关性计算公式如下:
其中,Xu,Xv表示两个项目u,v对应的项目列向量;Iu,Iv分别表示打分u,v的用户集合;Iuv表示同时打分u,v的用户集合;rui表示用户i对u的打分。
步骤408:对于每一项目,根据该项目与其他项目之间的相关性,确定预设第二数量个与该项目相关性最大的其他项目作为该项目的邻居项目。
步骤409:对于每一用户,根据用户与项目之间的对应关系,与用户之间有对应关系的项目的邻居项目,确定用户的项目推荐集合。
本步骤的实现可以包括:
(1)将与用户之间有对应关系项目的邻居项目构成用户的项目候选集合;并且,剔除所述项目候选集合中包含的、原始的用户-项目打分矩阵中与用户中间具有对应关系的项目;
(2)根据与用户之间有对应关系的项目与邻居项目之间的相关性计算项目候选集合中各个项目的推荐强度。
一个候选项目的推荐强度通过以下公式计算得到:
其中,表示用户u对于项目i的推荐强度(或称用户u对于项目i的预测打分值);ruj表示用户u对于项目i的实际打分;wij为项目i与项目j之间的余弦相关度。
(3)选择项目候选集合中推荐强度最大的预设第三数量个项目构成用户的项目推荐集合。
在实际应用中,可以将项目推荐集合中的项目标识与用户标识对应存储构成用户的项目推荐列表,并存储该项目推荐列表,以保存推荐结果,并且,后续电子商务网站,如电子商务图书网站等如何向用户终端传输所述项目推荐集合或者所述项目推荐列表中的项目数据,以及用户终端如何通过浏览器向用户进行推荐项目的展现,这里都并不限制,不再赘述。
与本申请实施例的项目推荐方法相对应的,本申请实施例还提供一种项目推荐系统,如图5所示,该系统可以包括:
获取单元510,用于获取用户的历史数据,所述历史数据包括:用户以及项目之间的对应关系;
计算单元520,用于根据所述历史数据计算任意两个项目之间的关联检索相关度;对于每一项目,分别将与该项目之间的关联检索相关度最大的预设第一数量个项目确定为该项目的关联检索相关项目;
建立单元530,用于根据用户的历史数据建立原始的用户-项目打分矩阵;
磨平单元540,用于使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,形成计算用户-项目打分矩阵;
推荐单元550,用于基于计算用户-项目打分矩阵,确定用户的项目推荐集合。
优选地,计算单元520可以包括:
建立子单元,用于以历史数据中的用户以及项目作为节点,具有对应关系的用户与项目对应的节点之间建立直接通路,从而建立用户-项目二部图;
第一计算子单元,用于根据建立的所述用户-项目二部图计算任意两个项目之间的关联检索相关度;
第一确定子单元,用于对于每一项目,分别将与该项目之间的关联检索相关度最大的预设第一数量个项目确定为该项目的关联检索相关项目。
优选地,计算子单元具体可以用于:计算所述两个项目对应节点之间所有路径的相关度之和,将计算得到的结果作为两个项目节点之间的关联检索相关度;其中,两个项目节点之间每条路径的相关度计算公式为am,其中,a为路径长度影响因子,m为对应路径的路径长度。
优选地,磨平单元540具体可以用于:遍历整个原始用户-项目打分矩阵,当在原始的用户-项目打分矩阵中用户与项目之间具有对应关系时,则确定该项目的关联检索相关项目与该用户之间也具有对应关系,修改原始的用户-项目打分矩阵中对应的元素值。
优选地,推荐单元550可以包括:
第二计算子单元,用于基于计算用户-项目打分矩阵,计算任意两个项目之间的相关性;
第二确定子单元,用于对于每一项目,根据该项目与其他项目之间的相关性,确定预设第二数量个与该项目相关性最大的其他项目最为该项目的邻居项目;
第三确定子单元,用于对于每一用户,根据用户与项目之间的对应关系,与用户之间有对应关系的项目的邻居项目,确定用户的项目推荐集合。
第三确定子单元可以包括:
构成子模块,用于由与用户之间有对应关系项目的邻居项目构成用户的项目候选集合;并且,剔除所述项目候选集合中包含的、原始的用户-项目打分矩阵中与用户中间具有对应关系的项目;
计算子模块,用于根据与用户之间有对应关系的项目与邻居项目之间的相关性计算项目候选集合中各个项目的推荐强度;
选择子模块,用于选择项目候选集合中推荐强度最大的预设第三数量个项目构成用户的项目推荐集合。
图5所示的项目推荐系统中,计算单元根据用户的历史数据计算任意两个项目之间的关联检索相关度,并且,据此确定每个项目的关联检索相关项目;从而,在建立原始的用户-项目打分矩阵后,磨平单元使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,推荐单元基于磨平后得到的用户-项目打分矩阵确定用户的项目推荐集合,从而使得一个项目的关联检索项目,可以跨用户获得,而后续的磨平处理使得计算项目之间相关度的矩阵稀疏性得以填充,提高了项目之间相关度计算的可靠性,而且,也使得现有技术中由于矩阵的数据稀疏性而不能计算的潜在相关项目之间可以建立相关性,从而在一定程度上解决了因为每个用户直接关联项目较少或者潜在关联项目无法发生关联所导致的推荐结果不准确的问题,提高了推荐系统对于项目推荐结果的准确性;进而,由于推荐结果准确性的提高,使得用户无需如现有技术般过多的进行搜索和浏览操作,即可得到自己感兴趣的项目的信息,从而减少了用户所在用户终端与电子商务网站之间由于搜索和浏览等项目信息查找操作对带宽的占用,节省了带宽,从而提高了电子商务网站与用户终端之间的数据传输速度,提高了两者之间的数据传输效率。
本领域普通技术人员可以理解,实现上述实施例的方法的过程可以通过程序指令相关的硬件来完成,所述的程序可以存储于可读取存储介质中,该程序在执行时执行上述方法中的对应步骤。所述的存储介质可以如:ROM/RAM、磁碟、光盘等。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (4)
1.一种项目推荐方法,其特征在于,包括:
获取用户的历史数据,所述历史数据包括:用户以及项目之间的对应关系;
根据所述历史数据计算两个项目之间的关联检索相关度;对于每一项目,分别将与该项目之间的关联检索相关度最大的预设第一数量个项目确定为该项目的关联检索相关项目;
并且,根据用户的历史数据建立原始的用户-项目打分矩阵;
使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,其中,所述使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵包括:遍历整个原始用户-项目打分矩阵,当在原始的用户-项目打分矩阵中用户与项目之间具有对应关系时,则确定该项目的关联检索相关项目与该用户之间也具有对应关系,相应修改原始的用户-项目打分矩阵中用户与所述关联检索相关项目对应的元素值,使得矩阵稀疏性得以填充,形成计算用户-项目打分矩阵;
基于计算用户-项目打分矩阵,确定用户的项目推荐集合;
其中,所述根据所述历史数据计算任意两个项目之间的关联检索相关度包括:以历史数据中的用户以及项目作为节点,在具有对应关系的用户与项目对应的节点之间建立直接通路,从而建立用户-项目二部图;根据建立的所述用户-项目二部图计算任意两个项目之间的关联检索相关度;
其中,所述计算任意两个项目节点之间的关联检索相关度包括:计算所述两个项目对应节点之间所有路径的相关度之和,将计算得到的结果作为两个项目节点之间的关联检索相关度;其中,两个项目节点之间每条路径的相关度计算公式为am,其中,a为路径长度影响因子,m为对应路径的路径长度。
2.根据权利要求1所述的方法,其特征在于,基于计算用户-项目打分矩阵,确定用户的项目推荐集合包括:
基于计算用户-项目打分矩阵,计算任意两个项目之间的相关性;
对于每一项目,根据该项目与其他项目之间的相关性,确定预设第二数量个与该项目相关性最大的其他项目作为该项目的邻居项目;
对于每一用户,根据用户与项目之间的对应关系,与用户之间有对应关系的项目的邻居项目,确定用户的项目推荐集合。
3.根据权利要求2所述的方法,其特征在于,所述确定用户的项目推荐集合包括:
由与用户之间有对应关系项目的邻居项目构成用户的项目候选集合;并且,剔除所述项目候选集合中包含的、原始的用户-项目打分矩阵中与用户中间具有对应关系的项目;
根据与用户之间有对应关系的项目与邻居项目之间的相关性计算项目候选集合中各个项目的推荐强度;
选择项目候选集合中推荐强度最大的预设第三数量个项目构成用户的项目推荐集合。
4.一种项目推荐系统,其特征在于,包括:
获取单元,用于获取用户的历史数据,所述历史数据包括:用户以及项目之间的对应关系;
计算单元,用于根据所述历史数据计算任意两个项目之间的关联检索相关度;对于每一项目,分别将与该项目之间的关联检索相关度最大的预设第一数量个项目确定为该项目的关联检索相关项目;
其中,所述计算单元包括:建立子单元,用于以历史数据中的用户以及项目作为节点,具有对应关系的用户与项目对应的节点之间建立直接通路,从而建立用户-项目二部图;第一计算子单元,用于根据建立的所述用户-项目二部图计算任意两个项目之间的关联检索相关度;第一确定子单元,用于对于每一项目,分别将与该项目之间的关联检索相关度最大的预设第一数量个项目确定为该项目的关联检索相关项目;
其中,所述计算子单元具体用于:计算所述两个项目对应节点之间所有路径的相关度之和,将计算得到的结果作为两个项目节点之间的关联检索相关度;其中,两个项目节点之间每条路径的相关度计算公式为am,其中,a为路径长度影响因子,m为对应路径的路径长度;
建立单元,用于根据用户的历史数据建立原始的用户-项目打分矩阵;
磨平单元,用于使用每个项目的关联检索相关项目磨平原始的用户-项目打分矩阵,形成计算用户-项目打分矩阵;其中,所述磨平单元,具体用于遍历整个原始用户-项目打分矩阵,当在原始的用户-项目打分矩阵中用户与项目之间具有对应关系时,则确定该项目的关联检索相关项目与该用户之间也具有对应关系,相应修改原始的用户-项目打分矩阵中用户与所述关联检索相关项目对应的元素值,使得矩阵稀疏性得以填充,形成计算用户-项目打分矩阵;
推荐单元,用于基于计算用户-项目打分矩阵,确定用户的项目推荐集合。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110130424.6A CN102789462B (zh) | 2011-05-18 | 2011-05-18 | 一种项目推荐方法及系统 |
TW100131688A TW201248534A (en) | 2011-05-18 | 2011-09-02 | Method and system of recommending items |
JP2014511411A JP2014519097A (ja) | 2011-05-18 | 2012-05-10 | アイテムを推薦する方法およびシステム |
US13/576,490 US20130018755A1 (en) | 2011-05-18 | 2012-05-10 | Method and System of Recommending Items |
PCT/US2012/037344 WO2012158465A1 (en) | 2011-05-18 | 2012-05-10 | Method and system of recommending items |
EP12785916.3A EP2710537A4 (en) | 2011-05-18 | 2012-05-10 | METHOD AND SYSTEM FOR RECOMMENDING ARTICLES |
HK12113150.5A HK1172411A1 (zh) | 2011-05-18 | 2012-12-20 | 種項目推薦方法及系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110130424.6A CN102789462B (zh) | 2011-05-18 | 2011-05-18 | 一种项目推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102789462A CN102789462A (zh) | 2012-11-21 |
CN102789462B true CN102789462B (zh) | 2015-12-16 |
Family
ID=47154866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110130424.6A Expired - Fee Related CN102789462B (zh) | 2011-05-18 | 2011-05-18 | 一种项目推荐方法及系统 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20130018755A1 (zh) |
EP (1) | EP2710537A4 (zh) |
JP (1) | JP2014519097A (zh) |
CN (1) | CN102789462B (zh) |
HK (1) | HK1172411A1 (zh) |
TW (1) | TW201248534A (zh) |
WO (1) | WO2012158465A1 (zh) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9110955B1 (en) * | 2012-06-08 | 2015-08-18 | Spotify Ab | Systems and methods of selecting content items using latent vectors |
TWI499290B (zh) * | 2012-11-30 | 2015-09-01 | Ind Tech Res Inst | 資訊推薦方法及系統 |
US10074121B2 (en) * | 2013-06-20 | 2018-09-11 | Dassault Systemes | Shopper helper |
US9372928B2 (en) * | 2013-07-01 | 2016-06-21 | Palo Alto Research Center Incorporated | System and method for parallel search on explicitly represented graphs |
CN103544632B (zh) * | 2013-07-22 | 2016-09-21 | 杭州师范大学 | 一种网络商品个性化推荐方法及系统 |
US20150073932A1 (en) * | 2013-09-11 | 2015-03-12 | Microsoft Corporation | Strength Based Modeling For Recommendation System |
CN103559626A (zh) * | 2013-09-24 | 2014-02-05 | 浙江工商大学 | 基于二部图资源非均匀分配的个性化商品推荐方法 |
US9672557B2 (en) * | 2013-10-11 | 2017-06-06 | Palo Alto Research Center Incorporated | System and method for improved parallel search on bipartite graphs using dynamic vertex-to-processor mapping |
JP6052900B2 (ja) * | 2014-03-04 | 2016-12-27 | 日立建機株式会社 | 情報処理装置 |
CN103823908B (zh) * | 2014-03-21 | 2017-07-14 | 北京飞流九天科技有限公司 | 基于用户偏好的内容推荐方法和服务器 |
CN103974097B (zh) * | 2014-05-22 | 2017-03-01 | 南京大学镇江高新技术研究院 | 基于流行度和社交网络的个性化用户原创视频预取方法及系统 |
CN104298702A (zh) * | 2014-07-18 | 2015-01-21 | 合肥工业大学 | 基于社交网络信息进行电子阅读读物推荐的方法及系统 |
CN105404626B (zh) * | 2014-09-03 | 2018-11-06 | 阿里巴巴集团控股有限公司 | 一种类目上下游关系计算方法、类目推荐方法及对应装置 |
JP2016062076A (ja) * | 2014-09-22 | 2016-04-25 | Nltテクノロジー株式会社 | 画素回路、その駆動方法及び表示装置 |
US20160124959A1 (en) * | 2014-10-31 | 2016-05-05 | Google Inc. | System and method to recommend a bundle of items based on item/user tagging and co-install graph |
WO2016141510A1 (en) * | 2015-03-06 | 2016-09-15 | Nokia Technologies Oy | Method and apparatus for mutual-aid collusive attack detection in online voting systems |
CN106156068A (zh) * | 2015-03-30 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 一种用户关联处理方法和装置 |
CN104899763A (zh) * | 2015-05-07 | 2015-09-09 | 西安电子科技大学 | 基于二分网络双向扩散的个性化推荐方法 |
CN105183748B (zh) * | 2015-07-13 | 2018-11-06 | 电子科技大学 | 一种基于内容和评分的组合预测方法 |
CN106570031A (zh) * | 2015-10-13 | 2017-04-19 | 阿里巴巴集团控股有限公司 | 一种业务对象的推荐方法和装置 |
CN105183925A (zh) * | 2015-10-30 | 2015-12-23 | 合一网络技术(北京)有限公司 | 内容关联推荐方法及装置 |
CN105608111B (zh) * | 2015-12-11 | 2019-02-15 | 中国银联股份有限公司 | 向终端用户推荐对象的方法及系统 |
CN105740415B (zh) * | 2016-01-29 | 2019-07-26 | 张墨琴 | 基于标签位置权重与自学习的招投标好友推荐系统 |
CN105930469A (zh) * | 2016-04-23 | 2016-09-07 | 北京工业大学 | 基于Hadoop的个性化旅游推荐系统及方法 |
CN107369091B (zh) * | 2016-05-12 | 2021-02-05 | 创新先进技术有限公司 | 产品推荐方法、装置及理财产品推荐方法 |
CN106066873B (zh) * | 2016-05-30 | 2019-09-27 | 哈尔滨工程大学 | 一种基于本体的旅游信息推荐方法 |
CN106708938A (zh) * | 2016-11-18 | 2017-05-24 | 北京大米科技有限公司 | 用于辅助推荐的方法及装置 |
CN108121737B (zh) * | 2016-11-29 | 2022-04-26 | 阿里巴巴集团控股有限公司 | 一种业务对象属性标识的生成方法、装置和系统 |
CN107368974A (zh) * | 2017-07-25 | 2017-11-21 | 山西百得科技开发股份有限公司 | 一种易地扶贫搬迁项目申报方法和系统 |
CN110020151B (zh) * | 2017-12-01 | 2022-04-26 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置、电子设备以及存储介质 |
CN108520303A (zh) * | 2018-03-02 | 2018-09-11 | 阿里巴巴集团控股有限公司 | 一种推荐系统构建方法及装置 |
CN109165847B (zh) * | 2018-08-24 | 2021-11-26 | 广东工业大学 | 一种基于推荐系统的项目推荐方法、装置及设备 |
CN109146306B (zh) * | 2018-09-04 | 2021-07-23 | 浙江国脉数联网络有限公司 | 一种企业管理系统 |
CN110503506B (zh) * | 2019-07-05 | 2022-07-08 | 平安科技(深圳)有限公司 | 基于评分数据的物品推荐方法、装置及介质 |
JP2021022279A (ja) * | 2019-07-30 | 2021-02-18 | 株式会社エヌ・ティ・ティ・データ | 情報処理装置、情報処理方法およびプログラム |
CN113688314B (zh) * | 2021-08-13 | 2024-03-19 | 今彩慧健康科技(苏州)有限公司 | 一种理疗门店推荐方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007075622A2 (en) * | 2005-12-19 | 2007-07-05 | Strands, Inc. | User-to-user recommender |
CN101271559A (zh) * | 2008-05-16 | 2008-09-24 | 华东师范大学 | 一种基于用户局部兴趣挖掘的协作推荐系统 |
CN101329683A (zh) * | 2008-07-25 | 2008-12-24 | 华为技术有限公司 | 推荐系统及方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6317722B1 (en) * | 1998-09-18 | 2001-11-13 | Amazon.Com, Inc. | Use of electronic shopping carts to generate personal recommendations |
JP4266511B2 (ja) * | 2000-12-14 | 2009-05-20 | 日本ビクター株式会社 | 情報提供サーバ及び情報提供方法 |
US7630916B2 (en) * | 2003-06-25 | 2009-12-08 | Microsoft Corporation | Systems and methods for improving collaborative filtering |
US7974888B2 (en) * | 2007-03-30 | 2011-07-05 | Amazon Technologies, Inc. | Services for providing item association data |
US7779040B2 (en) * | 2007-09-27 | 2010-08-17 | Amazon Technologies, Inc. | System for detecting associations between items |
US7778247B2 (en) * | 2007-10-26 | 2010-08-17 | Nokia Siemens Networks Oy | Cross layer network optimization for OFDMA systems using message passing algorithm |
US20100268661A1 (en) * | 2009-04-20 | 2010-10-21 | 4-Tell, Inc | Recommendation Systems |
-
2011
- 2011-05-18 CN CN201110130424.6A patent/CN102789462B/zh not_active Expired - Fee Related
- 2011-09-02 TW TW100131688A patent/TW201248534A/zh unknown
-
2012
- 2012-05-10 WO PCT/US2012/037344 patent/WO2012158465A1/en active Application Filing
- 2012-05-10 JP JP2014511411A patent/JP2014519097A/ja active Pending
- 2012-05-10 US US13/576,490 patent/US20130018755A1/en not_active Abandoned
- 2012-05-10 EP EP12785916.3A patent/EP2710537A4/en not_active Withdrawn
- 2012-12-20 HK HK12113150.5A patent/HK1172411A1/zh not_active IP Right Cessation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007075622A2 (en) * | 2005-12-19 | 2007-07-05 | Strands, Inc. | User-to-user recommender |
CN101271559A (zh) * | 2008-05-16 | 2008-09-24 | 华东师范大学 | 一种基于用户局部兴趣挖掘的协作推荐系统 |
CN101329683A (zh) * | 2008-07-25 | 2008-12-24 | 华为技术有限公司 | 推荐系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
US20130018755A1 (en) | 2013-01-17 |
WO2012158465A1 (en) | 2012-11-22 |
TW201248534A (en) | 2012-12-01 |
HK1172411A1 (zh) | 2013-04-19 |
CN102789462A (zh) | 2012-11-21 |
EP2710537A1 (en) | 2014-03-26 |
EP2710537A4 (en) | 2015-03-04 |
JP2014519097A (ja) | 2014-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102789462B (zh) | 一种项目推荐方法及系统 | |
JP6356744B2 (ja) | ウェブサイト横断情報を表示する方法およびシステム | |
CN108287864B (zh) | 一种兴趣群组划分方法、装置、介质及计算设备 | |
US9589025B2 (en) | Correlated information recommendation | |
US9286391B1 (en) | Clustering and recommending items based upon keyword analysis | |
US8924314B2 (en) | Search result ranking using machine learning | |
CN102982042B (zh) | 一种个性化内容推荐方法、平台以及系统 | |
US20190018900A1 (en) | Method and Apparatus for Displaying Search Results | |
Yu | The dynamic competitive recommendation algorithm in social network services | |
CN104899763A (zh) | 基于二分网络双向扩散的个性化推荐方法 | |
CN105809475A (zh) | “互联网+旅游”环境下支持o2o应用的商品推荐方法 | |
US20090077081A1 (en) | Attribute-Based Item Similarity Using Collaborative Filtering Techniques | |
CN102542490A (zh) | 基于模型匹配的商品推荐方法 | |
US10169797B2 (en) | Identification of entities based on deviations in value | |
CN104778237A (zh) | 一种基于关键用户的个性化推荐方法和系统 | |
CN112801803B (zh) | 一种理财产品推荐方法和装置 | |
CN107292648A (zh) | 一种用户行为分析方法及装置 | |
CN105894310A (zh) | 一种个性化推荐方法 | |
CN115423555A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
US10282474B2 (en) | Category constrained queries | |
CN105574015A (zh) | 搜索推荐方法和装置 | |
CN106777069A (zh) | 基于矩阵因子分解的个性化推荐方法及推荐系统 | |
US20090077093A1 (en) | Feature Discretization and Cardinality Reduction Using Collaborative Filtering Techniques | |
US20170031918A1 (en) | Techniques for graph-based recommendations | |
ur Rehman et al. | Frequency-based similarity measure for multimedia recommender systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1172411 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1172411 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151216 Termination date: 20190518 |