CN102169566A - 在陌生领域中生成推荐项目的方法和装置 - Google Patents

在陌生领域中生成推荐项目的方法和装置 Download PDF

Info

Publication number
CN102169566A
CN102169566A CN2010101168088A CN201010116808A CN102169566A CN 102169566 A CN102169566 A CN 102169566A CN 2010101168088 A CN2010101168088 A CN 2010101168088A CN 201010116808 A CN201010116808 A CN 201010116808A CN 102169566 A CN102169566 A CN 102169566A
Authority
CN
China
Prior art keywords
user
field
degree
strange
recommended project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101168088A
Other languages
English (en)
Inventor
赵石顽
袁泉
张夏天
吴贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN2010101168088A priority Critical patent/CN102169566A/zh
Priority to US13/034,849 priority patent/US9785954B2/en
Publication of CN102169566A publication Critical patent/CN102169566A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了在陌生领域中为当前用户生成推荐项目的方法和装置。所述方法包括:在不同于所述陌生领域的参考领域中,选择当前用户的参考用户,其中所述当前用户和所述参考用户的行为在所述参考领域中具有符合用户近似度指标条件的用户近似度指标;根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目。根据本发明的技术方案,即使当前用户在陌生领域完全没有历史行为数据或者仅有少量的历史行为数据,也能向当前用户进行有效的推荐。

Description

在陌生领域中生成推荐项目的方法和装置
技术领域
本发明涉及信息处理领域,更具体地说,涉及在陌生领域中生成推荐项目的方法和装置。
背景技术
传统的生成推荐项目的方法是基于对大量用户的行为统计,以例如排行榜、畅销榜之类的形式进行推荐。这种推荐方式没有考虑到用户之间的差异。以图书在线销售系统的推荐项目生成系统为例,专业书籍由于其面向的读者群体有限,其销量往往大大少于小说等的销量,从而无法进入畅销榜形式进行的推荐。但是,如果向经常购买专业书籍的用户推荐小说显然并不能向该用户进行有效的推荐。这里的有效推荐可以是指所推荐的项目被用户实际查看。当然本领域中还有很多其他方法来衡量一个推荐是否是有效推荐。
作为对这种无差异性推荐方法的改进,可以进一步结合用户自身的历史行为数据来生成推荐项目。再次以图书在线销售系统的推荐项目生成系统为例,如果用户购买了某本图书,那么可以向用户推荐同样购买了该图书的其他用户所购买的其他图书。或者可以根据图书之间的关联性向用户推荐与该图书相关联的其他图书,所述关联性例如同一出版社、同一作者、同一关键词等。还可以根据用户的历史购买行为将用户归入某种的用户类型,例如经常购买旅行指南的用户类型、经常购买计算机教材的用户类型或者经常购买语言学习教材的用户类型等,然后向用户推荐同样属于该用户类型的其他用户所购买的其他图书。当然,还存在进一步的其他改进。
当今,图书在线销售系统往往是综合性在线销售系统的一部分。综合性在线销售系统可以包括许多销售领域,例如图书、音像制品、体育器材、服装等。如果用户在某个领域中没有或者仅有很少的历史行为数据可以分析,则难以向用户进行有效的推荐。这样的领域称为陌生领域。本领域技术人员可以根据需要定义陌生领域,例如将用户的历史行为数据量少于某阈值的领域作为该用户的陌生领域。对于主要购买过音像制品、体育器材和服装而很少或者根本不购买图书的用户,图书即为所述陌生领域。在该用户第一次或前几次查看图书时,无法通过对该用户在图书这一陌生领域中的历史行为数据的分析向该用户进行有效的推荐。例如如果用户根本没有购买过图书,那么就不可能向用户推荐同样购买了某图书的其他用户所购买的其他图书。即使用户购买过少量图书,很可能也无法可以根据用户的历史购买行为将用户归入某种的用户类型。
此外,除了在线销售系统以外,对于存在领域划分并且存在推荐需求的其他系统,例如搜索引擎系统,也同样存在上述问题。
发明内容
有鉴于此,本发明提供了在陌生领域中生成推荐项目的方法和装置。
根据本发明的一个方面,一种在陌生领域中为当前用户生成推荐项目的方法包括:在不同于所述陌生领域的参考领域中,选择当前用户的参考用户,其中所述当前用户和所述参考用户的行为在所述参考领域中具有符合用户近似度指标条件的用户近似度指标;根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目。
根据本发明的另一方面,一种在陌生领域中为当前用户生成推荐项目的装置包括:参考用户确定模块,配置为在不同于所述陌生领域的参考领域中,选择当前用户的参考用户,其中所述当前用户和所述参考用户的行为在所述参考领域中具有符合用户近似度指标条件的用户近似度指标;当前用户推荐模块,配置为根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目。
按照根据本发明实施例的技术方案,由于所述参考用户在所述参考领域与当前用户的行为近似,那么有很大可能该参考用户在所述陌生领域与所述当前用户的行为也近似,因此以该参考用户在所述陌生领域的历史行为数据作为参考为所述当前用户生成的推荐项目很可能是对该当前用户的有效推荐。还可以进一步考虑参考领域和陌生领域之间的领域近似度指标。如果某参考领域与所述陌生领域的领域近似度指标高,说明在该参考领域中行为相似的用户,在该陌生领域中的行为也应该相似;如果在该参考领域中某参考用户与当前用户的用户相似度指标也高,那么在所述陌生领域中该参考用户与当前用户的行为也应该相似,因此在该陌生领域中为该参考用户生成的推荐项目很有可能对于当前用户是有效推荐。这样,即使当前用户在陌生领域完全没有历史行为数据或者仅有少量的历史行为数据,也能向当前用户进行有效的推荐。
附图说明
所附权利要求中阐述了被认为是本发明的特点的创造性特征。但是,通过参照附图阅读下面对说明性实施例的详细说明可更好地理解发明本身以及其优选使用模式、目标、特征以及优点,在附图中:
图1是根据本发明实施例的生成推荐项目的方法的流程图。
图2是根据本发明实施例的生成推荐项目的装置的方框图。
具体实施方式
下面参照附图来说明本发明的实施例。在下面的说明中,阐述了许多具体细节以便更全面地了解本发明。但是,本技术领域技术人员容易理解,本发明的实现可不具有这些具体细节中的一些,并且本发明并不限于所介绍的特定实施例。相反,可以考虑用下面的特征和要素的任意组合来实施本发明,而无论它们是否涉及不同的实施例。因此,下面的方面、特征、实施例和优点仅作说明之用而不应被看作是所附权利要求的要素或限定,除非权利要求中明确提出。还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。此外,除非刻意地使用“直接”或者“间接”加以限定,否则本申请文件中的连接既包括直接连接,也包括间接地连接。
此外,如前所述,除了在线销售系统以外,对于存在领域划分并且存在推荐需求的其他系统,例如搜索引擎系统,也同样存在上述问题。虽然在以下描述中以在线销售系统为例对本发明的实施例进行了说明,但是本领域技术人员可以容易地将本发明的思想应用于其他存在领域划分并且存在推荐需求的系统。
如图1所示,根据本发明实施例的生成推荐项目的方法包括:
步骤101,在不同于所述陌生领域的至少一个参考领域中选择当前用户的至少一个参考用户,其中所述当前用户和所述参考用户的行为在所述至少一个参考领域中具有符合条件的用户近似度指标。用户近似度指标所需要满足的条件可以称为用户近似度指标条件。
根据本发明的一个实施例,可以将在所述参考领域中与当前用户属于同一用户类型的用户作为当前用户的参考用户。如果当前用户在所述参考领域中属于多个用户类型,那么可以将属于这些用户类型的用户都作为当前用户的参考用户。
本领域技术人员可以理解,在一个领域中属于同一用户类型的用户其行为必然在一定程度上近似,从而具有符合用户近似度指标条件的用户近似度指标。换句话说,这相当于推断与当前用户属于同一用户类型的用户均具有相同的并且符合所述用户近似度指标条件的用户近似度指标。
可以对得出用户近似度指标的方法进行改进,采用根据历史行为数据计算的方法而不是从用户类型推断的方法来得到用户近似度指标,从而使得所述用户近似度指标能更加精确地衡量这些参考用户与当前用户的近似程度。可以将根据历史行为数据计算的方法和从用户类型推断的方法结合使用,即首先选择在所述参考领域中与用户具有属于相同的用户类型的用户作为候选参考用户,然后对候选参考用户计算用户近似度指标,最后根据用户近似度指标选择参考用户。
下面详细描述几种计算同一参考领域中两个用户之间的用户近似度指标的实施例。
根据本发明的一个实施例,可以根据这两个用户在所述参考领域中的历史行为数据确定这两个用户共同购买的物品,然后根据所述共同购买的物品的数目计算出两个用户之间的用户近似度指标。本领域技术人员容易理解,对于搜索引擎系统,可以通过共同点击的搜索结果的数目计算出两个用户之间的用户近似度指标。推而广之,对于各种存在领域划分并且存在推荐需求的系统,可以针对该系统定义共同行为。根据两个用户在参考领域中的历史行为数据确定这两个用户在参考领域的共同行为的数目,然后根据所述共同行为的数目计算出两个用户之间的用户近似度指标。也就是说,当所述共同行为数目满足共同行为数目条件时,就认为用户近似度指标满足了用户近似度指标条件。
可以直接以所述数目作为所述用户近似度指标,例如假设用户甲用户乙共同购买了3件物品,则所述用户近似度指标可以是3。也可以以所述数目与这两个用户购买的物品总数之间的比值作为所述用户近似度指标,例如假设用户甲购买了7件物品而用户乙购买了8件物品,其中一样的物品有3件,那么用户甲和用户乙购买的物品总数是12,则所述用户近似度指标可以是0.25。显然,这样得到的近似度指标较高,说明两个用户购买了很多相同的物品,即其行为是近似的。
可以用计算购买物品向量的不相关指标的方法来计算两个用户之间的用户近似度指标。例如,假设当前用户购买了物品A、物品B、物品C和物品D,用户甲购买了物品A、物品B、物品E和物品F,用户乙购买了物品A、物品C、物品D和物品F。可以将当前用户的购买物品向量用{1,1,1,1,0,0}表示,其中前四个1表示当前用户购买了物品A、物品B、物品C和物品D,而后两个0表示当前用户没有购买物品E和物品F;类似地,用户甲的购买物品向量可以用{1,1,0,0,1,1}表示,用户乙的购买物品向量用{1,0,1,1,0,1}表示。假设购买物品向量X和购买物品向量Y之间的不相关指标定义为:
Σ n = 1 N ( X n - Y n ) 2 N
其中Xi和Yi是向量中对应的元素,N是向量的维度即购买的物品总数。
那么当前用户的购买物品向量与用户甲的购买物品向量之间的不相关指标是1/3,即:
( 1 - 1 ) 2 + ( 1 - 1 ) 2 + ( 1 - 0 ) 2 + ( 1 - 0 ) 2 + ( 0 - 1 ) 2 + ( 0 - 1 ) 2 6 ;
当前用户的购买物品向量与用户乙的购买物品向量之间的不相关指标是
Figure GSA00000023348900063
( 1 - 1 ) 2 + ( 1 - 0 ) 2 + ( 1 - 1 ) 2 + ( 1 - 1 ) 2 + ( 0 - 0 ) 2 + ( 0 - 1 ) 2 6 .
因此,当前用户的购买物品向量与用户乙的购买物品向量之间的不相关指标更小,从而用户乙与当前用户之间的用户近似度指标更高。本领域技术人员可以容易地设计出其他方法来计算购买物品向量之间的不相关指标。
根据本发明的另一个实施例,还可以根据历史行为数据中确定两个用户对所购买的相同物品的评分,然后通过所述评分来更加精确地计算用户近似度指标。本领域技术人员容易理解,对于搜索引擎系统,可以确定两个用户对共同点击的搜索结果的评分。推而广之,对于各种存在领域划分并且存在推荐需求的系统,可以确定这两个用户对在参考领域的共同行为的评分,然后根据所述评分来更加精确地计算出两个用户之间的用户近似度指标。也就是说,当所述共同行为评分满足共同行为评分条件时,就认为用户近似度指标满足了用户近似度指标条件。
基于对共同行为的评分的方法与基于共同行为数目的方法可以结合使用,也可以单独使用。
可以计算两个用户各自对所购买的相同物品的评分的均值、方差等统计量,如果统计量很接近,那么可能用户近似度指标就很高。本领域技术人员容易地设计各种根据所述统计量来定量地计算出所述用户近似度指标的方法。
可以计算评分向量之间的相关指标。假设当前用户、用户甲和用户乙都购买了3件物品,当前用户给这3件物品的评分是5、3、4分,用户甲给这3件物品的评分分别是3、4、2分,用户乙给这3件物品的评分分别是3、1、2分。此外,还假设评分向量P和评分向量Q之间的相关指标的定义是:
Σ m = 1 M ( P m - P ‾ ) ( Q m - Q ‾ ) Σ m = 1 M ( P m - P ‾ ) 2 Σ m = 1 M ( Q m - Q ‾ ) 2
其中Pm和Qm是向量中对应的元素即评分,M是向量的维度即共同购买的物品的件数,P是P中各元素的平均值,P是Q中各元素的平均值。
那么当前用户的评分向量与用户甲的评分向量之间的相关指标是:
( 5 - 4 ) ( 3 - 3 ) + ( 3 - 4 ) ( 4 - 3 ) + ( 4 - 4 ) ( 2 - 3 ) ( 5 - 4 ) 2 + ( 3 - 4 ) 2 + ( 4 - 4 ) 2 ( 3 - 3 ) 2 + ( 4 - 3 ) 2 + ( 2 - 3 ) 2 = - 1 2
当前用户的评分向量与用户乙的评分向量之间的相关指标是:
( 5 - 4 ) ( 3 - 2 ) + ( 3 - 4 ) ( 1 - 2 ) + ( 4 - 4 ) ( 2 - 2 ) ( 5 - 4 ) 2 + ( 3 - 4 ) 2 + ( 4 - 4 ) 2 ( 3 - 2 ) 2 + ( 1 - 2 ) 2 + ( 2 - 2 ) 2 = 1 2
也就是说,按照评分向量之间的相关指标来看,当前用户与用户乙的用户近似度指标更高。这从当前用户、用户甲和用户乙对3件物品的评分可以直观地看出来。即当前用户和用户乙对这3件物品的评分的趋势是一样的,都是第一件物品评分最高,第二件物品评分最低。
步骤102,根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目。
由于所述参考用户在所述参考领域与当前用户的行为近似,那么有很大可能该参考用户在所述陌生领域与当前用户的行为也近似,因此以该参考用户在所述陌生领域的历史行为数据作为参考为所述当前用户生成的在该陌生领域中的推荐项目很可能是对该用户的有效推荐。
作为一个简单的例子,假设在所述陌生领域中用户甲购买了物品A、物品B、物品C和物品D,用户乙购买了物品A、物品B、物品E和物品F,用户丙购买了物品A、物品C、物品D和物品F。而用户甲与当前用户之间的用户近似度指标为0.5,用户乙与当前用户之间的用户近似度指标为0.9,用户丙与当前用户之间的用户近似度指标为0.3。
根据本发明的一个实施例,可以通过参考用户对应的用户近似度指标来计算出参考用户的权值,然后根据权值符合参考用户权值条件的参考用户在陌生领域中的历史行为数据,生成在陌生领域中提供给当前用户的推荐项目。例如,可以直接将所述用户近似度指标作为参考用户的权值,以权值排名第一作为所述参考用户权值条件。换句话说,就是根据与当前用户的用户相似度指标最高的参考用户在陌生领域中的历史行为数据,生成在陌生领域中提供给当前用户的推荐项目。在上面的例子中,用户相似度指标最高的是用户乙,从而为当前用户推荐物品A、物品B、物品E和物品F。
作为替换,可以将参考用户在所述陌生领域中购买的物品作为候选推荐项目,通过候选推荐项目对应的用户近似度指标来计算各候选推荐项目的权值,然后将权值符合候选推荐项目权值条件的候选推荐项目作为用于当前用户的在陌生领域中的推荐项目。由于候选推荐项目是针对参考用户生成的,推荐项目对应的用户近似度指标就是该参考用户对应的用户近似度指标。根据一种计算方法,在上面的例子中,候选推荐项目的权值为:
候选推荐项目        权值
A                   0.5+0.9+0.3=1.7
B                   0.5+0.9=1.4
C         0.5+0.3=0.8
D         0.5+0.3=0.8
E         0.9
F         0.9+0.3=1.2
因此,如果所述候选推荐项目权值条件是权值排在前4,那么用于当前用户的在陌生领域中的推荐项目就是:物品A、物品B、物品F、物品E。
本领域技术人员可以理解,对于不考虑参考用户的用户近似度指标差别的情况,例如将在参考领域中与当前用户属于同一用户类型的用户都选为参考用户等,相当于在计算权值时令所有参考用户均具有相同的用户近似度指标,因此仍然属于根据用户近似度指标来计算权值的范围。
在以上描述中,只考虑了一个参考领域。在实际应用中,可能存在两个以上的参考领域。而这两个以上参考领域对陌生领域的参考价值可能不同。例如,在音像制品这一参考领域中行为近似的两个用户,可能在图书这一陌生领域中的行为也近似;但是在服装这一参考领域中行为近似的两个用户,可能在图书这一陌生领域中的行为并不近似。
一种简单的方法是不考虑参考领域对陌生领域的参考价值的差别。也就是说,相同地对待在音像制品领域和在服装领域所找到的参考用户。这相当于将除了陌生领域的其他领域合并成一个参考领域。
可以通过计算参考领域和陌生领域之间的领域近似度指标,从而区分对陌生领域的参考价值不同的参考领域。根据本发明的一个实施例,可以根据标定用户在两个领域中的历史行为数据来计算两个领域——领域i和领域j——之间的领域近似度指标,见步骤103。其中所述两个领域对于所述标定用户而言都不是陌生领域。所述标定用户可以是在步骤101中所选择的当前用户的参考用户,也可以不是。
可以只选择一个标定用户,然后根据前述的方法,确定有多少共同近似用户,其中所述共同近似用户既在领域i中是所述标定用户的近似用户,又在领域j中是所述标定用户的近似用户。在某领域中标定用户的近似用户的行为与标定用户在该领域中的行为具有符合条件的用户近似度指标。确定近似用户时用户近似度指标的计算方法和所需要满足的条件可以与确定参考用户时用户近似度指标的计算方法和所需要满足的条件相同,也可以不同。
接着根据共同近似用户的数目计算出两个领域之间的用户近似度指标。可以直接以所述数目作为所述领域近似度指标,例如假设有3个共同近似用户,则所述领域近似度指标可以是3。也可以以所述数目与所述标定用户在这两个领域中的近似用户的总数之间的比值作为所述领域近似度指标,例如该标定用户在领域i中有7个近似用户而在领域j中有8个近似用户,其中共同近似用户有3个,那么标定用户在这两个领域中的近似用户的总数是12,则所述领域近似度指标可以是0.25。显然,如果该指标值比较大,说明在领域i中表现近似的用户,在领域j中表现也近似,反之亦然。
也可以选择两个标定用户,首先分别计算所述两个标定用户在领域i中的用户近似度指标和在和领域j中的用户近似度指标。令计算出的该两个标定用户在领域i中的用户近似度指标为UserSimi,在领域j中的用户近似度指标为UserSimj。然后根据所述两个标定用户的用户近似度指标计算所述领域近似度指标。例如,如果在领域i中行为相似的两个用户在领域j中行为相似程度越低,那么UserSimi和UserSimj之间的差值就会比较大,领域近似度指标就越小。
实际应用中,往往可以找到大量的标定用户。通过考虑大量的标定用户计算出的领域近似度指标往往能够更加准确地反映领域之间的参考价值。
根据本发明的一个实施例,可以在领域i和领域j中分别计算一组标定用户中两两之间的用户近似度指标,然后分别计算两个领域中的所述一组标定用户中两两之间的用户近似度指标的统计量,例如均值、方差等,如果统计量很接近,那么可能用户近似度指标就很高。本领域技术人员容易地设计各种根据所述统计量来定量地计算出所述领域近似度指标的方法。
根据本发明的另一个实施例,还可以采用以下公式从所述标定用户的用户近似度指标计算领域近似度指标。
DomainSim i , j = Σ 1 ≤ x ≤ T , 1 ≤ y ≤ T , x ≠ y ( UserSim i , x , y - UserSim i ‾ ) ( UserSim j , x , y - UserSim j ‾ ) Σ 1 ≤ x ≤ T , 1 ≤ y ≤ T , x ≠ y ( UserSim i , x , y - UserSim i ‾ ) 2 Σ 1 ≤ x ≤ T , 1 ≤ y ≤ T , x ≠ y ( UserSim j , x , y - UserSim j ‾ ) 2
其中,T是标定用户的数目,UserSimi,x,y表示在领域i中标定用户x和标定用户y之间的用户近似度指标,UserSimi表示在领域i中各用户近似度指标的平均值。
根据本发明的再一个实施例,还可以采用以下公式从所述标定用户的用户近似度指标计算领域近似度指标。
DomainSim i , j = 1 / Σ 1 ≤ x ≤ T , 1 ≤ y ≤ T , x ≠ y ( UserSim i , x , y - UserSim j , x , y ) 2
本领域技术人员可以理解,这实际上是计算了分别对应于领域i和领域j的两个用户近似度指标向量之间的距离,距离越大,则领域相似度指标越小。所述用户近似度指标向量的每个元素是两个标定用户在该领域中的用户近似度指标。该向量的维度为CT 2
在分别得到陌生领域与各参考领域之间的领域相似度指标后,就可以通过综合考虑用户近似度指标和领域近似度指标来为当前用户生成在所述陌生领域中的推荐项目。从逻辑上说,如果某参考领域与所述陌生领域的领域近似度指标高,说明在该参考领域中行为相似的用户,在该陌生领域中的行为也应该相似;如果在该参考领域中某参考用户与当前用户的用户相似度指标也高,那么在所述陌生领域中该参考用户与当前用户的行为也应该相似,因此在该陌生领域中根据该参考用户的历史行为数据生成的推荐项目很有可能对于当前用户是有效推荐。
作为一个简单的例子,假设在所述陌生领域中用户甲购买了物品A、物品B、物品C和物品D,用户乙购买了物品A、物品B、物品E和物品F,用户丙购买了物品A、物品C、物品D和物品F。用户甲和用户乙是在第一参考领域中为当前用户找到的参考用户,用户甲与当前用户之间的用户近似度指标为0.5,用户乙与当前用户之间的用户近似度指标为0.9,第一参考领域与陌生领域的领域近似度指标为0.2;用户丙是在第二参考领域中为当前用户找到的参考用户,用户丙与当前用户之间的用户近似度指标为0.3,第二参考领域与陌生领域的领域近似度指标为0.7。
一种定量计算的方法是,可以通过参考用户对应的领域近似度指标和用户近似度指标来计算出参考用户的权值,然后根据权值符合参考用户权值条件的参考用户在陌生领域中的历史行为数据,生成在陌生领域中提供给当前用户的推荐项目。由于参考用户是根据在参考领域中的历史行为数据选择的,因此参考用户所对应的领域近似度指标就是该参考领域与陌生领域的领域近似度指标。根据一种计算方法,在上面的例子中,参考用户的权值为:
参考用户          参考用户权值
甲                0.5*0.2=0.1
乙                0.9*0.2=0.18
丙                0.3*0.7=0.21
这样,如果所述参考用户权值条件是排名第一,则可以直接将物品A、物品C、物品D和物品F作为当前用户在陌生领域中的推荐项目。
作为替换,可以将参考用户在所述陌生领域中购买的物品作为候选推荐项目,通过候选推荐项目对应的用户近似度指标和领域近似度指标来计算出各候选推荐项目的权值,然后将权值符合候选推荐项目权值条件的候选推荐项目作为用于当前用户的在陌生领域中的推荐项目。由于候选推荐项目是针对参考用户生成的,候选推荐项目对应的用户近似度指标就是该参考用户对应的用户近似度指标,候选推荐项目所对应的领域近似度指标就是该参考用户所对应的领域近似度指标。根据一种计算方法,在上面的例子中,候选推荐项目的权值为:
候选推荐项目      权值
A                 0.5*0.2+0.9*0.2+0.3*0.7=0.49
B                 0.5*0.2+0.9*0.2=0.28
C                 0.5*0.2+0.3*0.7=0.31
D                 0.5*0.2+0.3*0.7=0.31
E                 0.9*0.2=0.18
F                 0.9*0.2+0.3*0.7=0.39
因此,如果所述候选推荐项目权值条件是权值排在前4,那么用于当前用户的在陌生领域中的推荐项目就是:物品A、物品F、物品C/D。
本领域技术人员可以理解,如果在计算权值时,只考虑用户近似度指标和领域近似度指标中的一个,相当于另一个是常数。在只考虑用户近似度指标时,相当于所有参考领域与陌生领域的领域近似度指标均为相同的值;在只考虑领域近似度指标时,相当于所有参考用户与当前用户的用户近似度指标均为相同的值。因此,这些情况仍然包括在根据用户近似度指标和领域近似度指标来计算权值的范围内。
本领域技术人员还可以设计出很多其他的方法来综合使用领域近似度指标和用户近似度指标来对在陌生领域中为各参考用户生成的推荐项目进行排序从而在所述陌生领域中为当前用户生成推荐项目。
如图2所示,根据本发明实施例的生成推荐项目的装置包括:
参考用户确定模块201,配置为在不同于所述陌生领域的参考领域中,选择当前用户的参考用户,其中所述当前用户和所述参考用户的行为在所述参考领域中具有符合用户近似度指标条件的用户近似度指标;
当前用户推荐模块202,配置为根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目。
所述装置还可以进一步包括标定模块203,配置为根据标定用户在所述陌生领域和所述参考领域中的历史行为数据,确定所述陌生领域和所述参考领域之间的领域近似度指标。
本领域的普通技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本实施例的用于处理物流信息的装置及其组件可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
虽然已经图示和描述了本发明的若干示例性实施例,不过本领域技术人员可以理解的是,在不偏离本发明原则和精神的前提下,可以对这些实施例进行改变,本发明的范围由权利要求书及其等价变换所限定。

Claims (14)

1.一种在陌生领域中为当前用户生成推荐项目的方法,包括:
在不同于所述陌生领域的参考领域中,选择当前用户的参考用户,其中所述当前用户和所述参考用户的行为在所述参考领域中的用户近似度指标符合用户近似度指标条件;
根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目。
2.根据权利要求1所述的方法,其中所述在不同于所述陌生领域的参考领域中选择当前用户的参考用户包括:
选择在所述参考领域中与当前用户属于同一用户类型的用户作为所述参考用户。
3.根据权利要求1或2所述的方法,其中所述在不同于所述陌生领域的参考领域中选择当前用户的参考用户包括:
选择在参考领域中与所述当前用户的共同行为数目符合共同行为数目条件的用户作为所述参考用户。
4.根据权利要求1至3中任意一项所述的方法,其中所述在不同于所述陌生领域的参考领域中选择当前用户的参考用户包括:
选择在参考领域中与所述当前用户的共同行为评分符合共同行为评分条件的用户作为所述参考用户。
5.根据权利要求1所述的方法,进一步包括:
根据标定用户在所述陌生领域和所述参考领域中的历史行为数据,确定所述陌生领域和所述参考领域之间的领域近似度指标,其中所述陌生领域和所述参考领域对于所述标定用户而言均非陌生领域。
6.根据权利要求5所述的方法,其中根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目包括:
根据参考用户所对应的领域近似度指标和用户近似度指标计算参考用户权值;
针对参考用户权值符合参考用户权值条件的参考用户,根据其在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目。
7.根据权利要求5所述的方法,其中根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目包括:
根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的候选推荐项目,
根据候选推荐项目所对应的领域近似度指标和用户近似度指标计算候选推荐项目权值;
将候选推荐项目权值符合候选推荐项目权值条件的候选推荐项目作为用于所述当前用户的在该陌生领域中的推荐项目。
8.一种在陌生领域中为当前用户生成推荐项目的装置,包括:
参考用户确定模块,配置为在不同于所述陌生领域的参考领域中,选择当前用户的参考用户,其中所述当前用户和所述参考用户的行为在所述参考领域中具有符合用户近似度指标条件的用户近似度指标;和
当前用户推荐模块,配置为根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目。
9.根据权利要求8所述的装置,其中所述参考用户确定模块包括:
配置为选择在所述参考领域中与当前用户属于同一用户类型的用户作为所述参考用户的模块。
10.根据权利要求8或9所述的装置,其中所述参考用户确定模块包括:
配置为选择在参考领域中与所述当前用户的共同行为数目符合共同行为数目条件的用户作为所述参考用户的模块。
11.根据权利要求8至10中任意一项所述的装置,其中所述参考用户确定模块包括:
配置为选择在参考领域中与所述当前用户的共同行为评分符合共同行为评分条件的用户作为所述参考用户的模块。
12.根据权利要求8所述的装置,进一步包括:
标定模块,配置为根据标定用户在所述陌生领域和所述参考领域中的历史行为数据,确定所述陌生领域和所述参考领域之间的领域近似度指标,其中所述陌生领域和所述参考领域对于所述标定用户而言均非陌生领域。
13.根据权利要求12所述的装置,其中所述当前用户推荐模块包括:
配置为根据参考用户所对应的领域近似度指标和用户近似度指标计算参考用户权值的模块;
配置为针对参考用户权值符合参考用户权值条件的参考用户,根据其在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的推荐项目的模块。
14.根据权利要求12所述的装置,其中所述当前用户推荐模块包括:
配置为根据所述参考用户在所述陌生领域中的历史行为数据为所述当前用户生成在该陌生领域中的候选推荐项目的模块;
配置为根据候选推荐项目所对应的领域近似度指标和用户近似度指标计算候选推荐项目权值的模块;
配置为将候选推荐项目权值符合候选推荐项目权值条件的候选推荐项目作为用于所述当前用户的在该陌生领域中的推荐项目的模块。
CN2010101168088A 2010-02-26 2010-02-26 在陌生领域中生成推荐项目的方法和装置 Pending CN102169566A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2010101168088A CN102169566A (zh) 2010-02-26 2010-02-26 在陌生领域中生成推荐项目的方法和装置
US13/034,849 US9785954B2 (en) 2010-02-26 2011-02-25 Generating recommended items in unfamiliar domain

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101168088A CN102169566A (zh) 2010-02-26 2010-02-26 在陌生领域中生成推荐项目的方法和装置

Publications (1)

Publication Number Publication Date
CN102169566A true CN102169566A (zh) 2011-08-31

Family

ID=44490722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101168088A Pending CN102169566A (zh) 2010-02-26 2010-02-26 在陌生领域中生成推荐项目的方法和装置

Country Status (2)

Country Link
US (1) US9785954B2 (zh)
CN (1) CN102169566A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880501A (zh) * 2012-07-24 2013-01-16 北京奇虎科技有限公司 应用推荐的实现方法、装置和系统
CN103049452A (zh) * 2011-10-14 2013-04-17 百度在线网络技术(北京)有限公司 一种基于预估下载率进行应用排序的方法与设备
CN104239450A (zh) * 2014-09-01 2014-12-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10191927B2 (en) * 2014-04-02 2019-01-29 Facebook, Inc. Selecting previously-presented content items for presentation to users of a social networking system
US10419820B2 (en) * 2014-08-19 2019-09-17 CharacTour LLC Profiling media characters
CN106651546B (zh) * 2017-01-03 2021-12-07 重庆邮电大学 一种面向智慧社区的电子商务信息推荐方法
CN107688984A (zh) * 2017-07-27 2018-02-13 上海壹账通金融科技有限公司 产品信息推送方法、装置、存储介质和计算机设备
CN107943910B (zh) * 2017-11-18 2021-09-07 电子科技大学 一种基于组合算法的个性化图书推荐方法
CN108334575B (zh) * 2018-01-23 2022-04-26 北京三快在线科技有限公司 一种推荐结果排序修正方法及装置,电子设备
CN109064285B (zh) * 2018-08-02 2021-02-02 西北大学 一种获得商品推荐序列及商品推荐方法
CN109299355B (zh) * 2018-08-09 2020-12-04 咪咕数字传媒有限公司 一种推荐书单展示方法、装置及存储介质
US11113702B1 (en) * 2018-12-12 2021-09-07 Amazon Technologies, Inc. Online product subscription recommendations based on a customers failure to perform a computer-based action and a monetary value threshold
US10867000B2 (en) * 2019-03-31 2020-12-15 Td Ameritrade Ip Company, Inc. Recommendation system for providing personalized and mixed content on a user interface based on content and user similarity
CN112084404B (zh) * 2020-09-01 2024-03-01 北京百度网讯科技有限公司 内容推荐方法、装置、设备和介质
CN118520175B (zh) * 2024-07-23 2024-10-01 深圳市智加云栖科技有限公司 一种数字产品生成方法及系统

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6266646B1 (en) * 1993-07-22 2001-07-24 Texas Instruments Incorporated Method and apparatus for providing choices for a facility
US6092049A (en) * 1995-06-30 2000-07-18 Microsoft Corporation Method and apparatus for efficiently recommending items using automated collaborative filtering and feature-guided automated collaborative filtering
US5872850A (en) * 1996-02-02 1999-02-16 Microsoft Corporation System for enabling information marketplace
US20010013009A1 (en) * 1997-05-20 2001-08-09 Daniel R. Greening System and method for computer-based marketing
US6064980A (en) * 1998-03-17 2000-05-16 Amazon.Com, Inc. System and methods for collaborative recommendations
US6266649B1 (en) * 1998-09-18 2001-07-24 Amazon.Com, Inc. Collaborative recommendations using item-to-item similarity mappings
US6389372B1 (en) 1999-06-29 2002-05-14 Xerox Corporation System and method for bootstrapping a collaborative filtering system
US6321179B1 (en) 1999-06-29 2001-11-20 Xerox Corporation System and method for using noisy collaborative filtering to rank and present items
JP2001034086A (ja) 1999-07-19 2001-02-09 Ricoh Co Ltd 画像形成装置およびその制御方法
US7440943B2 (en) * 2000-12-22 2008-10-21 Xerox Corporation Recommender system and method
DE10154656A1 (de) * 2001-05-10 2002-11-21 Ibm System und Verfahren für Empfehlungen von Artikeln
US7966334B1 (en) * 2001-10-24 2011-06-21 Amazon Technologies, Inc. Information retrieval systems and methods that use user-defined lists to identify related offerings
DE10247929A1 (de) * 2001-10-31 2003-05-28 Ibm Auslegen eines Empfehlungssystems zum Vorsehen von Anwender-zu-Anwender-Empfehlungen
US7693827B2 (en) * 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US7689452B2 (en) 2004-05-17 2010-03-30 Lam Chuck P System and method for utilizing social networks for collaborative filtering
US20070192318A1 (en) * 2005-09-14 2007-08-16 Jorey Ramer Creation of a mobile search suggestion dictionary
US8751507B2 (en) * 2007-06-29 2014-06-10 Amazon Technologies, Inc. Recommendation system with multiple integrated recommenders
EP2176730A4 (en) * 2007-08-08 2011-04-20 Baynote Inc METHOD AND APPARATUS FOR CONTENT RECOMMENDATION BASED ON CONTEXT
US8321793B1 (en) * 2008-07-02 2012-11-27 Amdocs Software Systems Limited System, method, and computer program for recommending web content to a user
MX2011006340A (es) * 2008-12-12 2011-10-28 Atigeo Llc Suministro de recomendaciones utilizando la informacion determinada para dominios de interés.
US8386519B2 (en) * 2008-12-30 2013-02-26 Expanse Networks, Inc. Pangenetic web item recommendation system
US20100268661A1 (en) * 2009-04-20 2010-10-21 4-Tell, Inc Recommendation Systems
US8694514B2 (en) * 2009-10-12 2014-04-08 Oracle International Corporation Collaborative filtering engine

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049452A (zh) * 2011-10-14 2013-04-17 百度在线网络技术(北京)有限公司 一种基于预估下载率进行应用排序的方法与设备
CN103049452B (zh) * 2011-10-14 2017-12-26 百度在线网络技术(北京)有限公司 一种基于预估下载率进行应用排序的方法与设备
CN102880501A (zh) * 2012-07-24 2013-01-16 北京奇虎科技有限公司 应用推荐的实现方法、装置和系统
CN102880501B (zh) * 2012-07-24 2016-05-25 北京奇虎科技有限公司 应用推荐的实现方法、装置和系统
CN104239450A (zh) * 2014-09-01 2014-12-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置

Also Published As

Publication number Publication date
US20110213786A1 (en) 2011-09-01
US9785954B2 (en) 2017-10-10

Similar Documents

Publication Publication Date Title
CN102169566A (zh) 在陌生领域中生成推荐项目的方法和装置
Cooper et al. Random walks in recommender systems: exact computation and simulations
Dimitrov et al. What makes a link successful on wikipedia?
CN109389442A (zh) 商品推荐方法及装置、存储介质及电子终端
US20130138531A1 (en) Social network-based recommendation
Kommineni et al. Machine learning based efficient recommendation system for book selection using user based collaborative filtering algorithm
CN102609422A (zh) 类目错放识别方法和装置
US20190087859A1 (en) Systems and methods for facilitating deals
CN104462554A (zh) 问答页面相关问题推荐方法和装置
CN104346428A (zh) 信息处理装置、信息处理方法及程序
CN110020171A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN103853789A (zh) 一种用于向用户推荐信息的方法和设备
Feng et al. Social network regularized sparse linear model for top-n recommendation
CN102142107B (zh) 物流信息处理方法和装置
Tiwary Learning apache mahout
CN111339419A (zh) 信息推荐方法、装置、电子设备及存储介质
CN104462556A (zh) 问答页面相关问题推荐方法和装置
Yang et al. Generalized linguistic hesitant intuitionistic fuzzy hybrid aggregation operators
CN111062449A (zh) 预测模型的训练方法、兴趣度预测方法、装置和存储介质
Ebina et al. Consumer confusion from price competition and excessive product attributes under the curse of dimensionality
Cherednichenko et al. Information technology for intellectual analysis of item descriptions in e-commerce
Badiezadeh et al. Efficiency evaluation of production lines using maximal balance index
Gao et al. Similarity measure based on punishing popular items for collaborative filtering
Sukestiyarno et al. Application of Recommendation System on E-Learning Platform Using Content-Based Filtering with Jaccard Similarity and Cosine Similarity Algorithms
Shamoyan et al. On distance function in some new analytic bergman type spaces in ℂn

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110831