CN103177093B - 一种基于对象标签的通用推荐方法及系统 - Google Patents

一种基于对象标签的通用推荐方法及系统 Download PDF

Info

Publication number
CN103177093B
CN103177093B CN201310080076.5A CN201310080076A CN103177093B CN 103177093 B CN103177093 B CN 103177093B CN 201310080076 A CN201310080076 A CN 201310080076A CN 103177093 B CN103177093 B CN 103177093B
Authority
CN
China
Prior art keywords
tag
user
label
candidate recommendation
dependency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310080076.5A
Other languages
English (en)
Other versions
CN103177093A (zh
Inventor
薛晔伟
何平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING KAIXINREN INFORMATION TECHNOLOGY Co Ltd
Original Assignee
BEIJING KAIXINREN INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING KAIXINREN INFORMATION TECHNOLOGY Co Ltd filed Critical BEIJING KAIXINREN INFORMATION TECHNOLOGY Co Ltd
Priority to CN201310080076.5A priority Critical patent/CN103177093B/zh
Publication of CN103177093A publication Critical patent/CN103177093A/zh
Application granted granted Critical
Publication of CN103177093B publication Critical patent/CN103177093B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于对象标签的通用推荐方法及系统,方法包括:获取用户标签和候选推荐对象标签;获取所述用户标签和所述候选推荐对象标签之间的相关性;根据所述相关性选择候选推荐对象推荐给用户。本发明提出了一种以对象标签为基础统一对象相关性计算方法,及以此相关性计算为基础的通用推荐理论模型,并构建了一个实际推荐系统来证明上述方法的有效性。本发明建立的通用推荐系统,能够应用于几乎所有的个性化推荐场合和部分非个性化推荐场合,具有数据通用、部署简便、扩展灵活等特点,可以非常方便的部署和使用。

Description

一种基于对象标签的通用推荐方法及系统
技术领域
本发明涉及互联网信息挖掘领域,特别涉及一种基于对象标签的通用推荐方法及系统。
背景技术
现有的非个性化推荐方法主要是热点推荐和手工推荐两种,两者都是将推荐结果不加区分的推荐给所有用户,前者的结果来源于大多数用户的选择,后者的结果则依赖人工选择。
现有的个性化推荐系统主要分为如下几个不同的体系:
统计体系:这个体系通过挖掘用户的年龄、地址、收入等社会化信息,将目标对象直接推荐给合适的人。例如,部分个性化广告产品、大多数的广告邮件等。
优点:方法简单,计算量小;
缺点:1.必须事先对待推荐对象同样做分类映射,如果实体数量较多,会面临映射代价大和精度低的问题;2.用户信息获取困难,可信度低,用户抵触大;3.推荐精度低,效果差。
分类体系:这个体系设定一些用户兴趣的类目,在用户注册或首次使用产品的时候,要求用户从中选择几个感兴趣的类目,然后按照对象的类目(手动或自动生成)以对应方式推荐给用户。例如,多数邮件服务商提供的订阅服务、部分互联网兴趣图谱产品等。
优点:1.适合“冷启动问题”,新用户也能得到推荐;2.用户参与少,抵触小;
缺点:1.必须事先对待推荐对象同样做分类映射,如果实体数量较多,会面临映射代价大和精度低的问题;2.灵活性不够,不能正确反映用户兴趣的变化,导致推荐结果过于僵硬;3.类目数量受到限制,不能对用户兴趣进行稍细致的描述,导致推荐结果不够精准。
从众体系:这个体系的方法利用用户和实体之间产生的直接关联,采用协同过滤、用户聚类等从众方法,将用户可能感兴趣、但尚未发生关联的待推荐对象和该用户关联起来。简单来说,此类方法就是依赖与待推荐用户行为模式非常相似的一大群其他用户的共同选择做出推荐。例如,电商网站提供的“购买了xx的用户还购买了xx”等推荐服务,如下图所示:
优点:1.对从众性的用户和实体往往能够取得不错的推荐结果;2.不依赖其他数据,开销小;
缺点:1.对小众用户的推荐不好;2.数据无法复用或通用,每个领域的数据仅仅能够应用于该领域本身。
发明内容
本发明的目的是针对上述问题,提出一种基于对象标签的通用推荐方法及系统,克服传统技术中的缺陷,既可以为用户提供其感兴趣的产品和内容,提升用户满意度和网站点击率,又可以为商业用户提供精准的广告投放,提升广告效果。
为实现上述目的,本发明提供了一种基于对象标签的推荐方法,包括:
获取用户标签和候选推荐对象标签;
获取所述用户标签和所述候选推荐对象标签之间的相关性;
根据所述相关性选择候选推荐对象推荐给用户。
可选的,在本发明一实施例中,所述获取所述用户标签和所述候选推荐对象标签之间的相关性的步骤包括:
根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
R ( t , w ) = Dist ( TF ( t ) , TF ( w ) ) = exp ( - γ * | TF ( t ) - TF ( w ) | 2 ) = exp ( - γ * Σ i | TF i ( t ) - TF i ( w ) | 2 )
其中,γ为核函数参数,TF(t)为对象t在标签空间中以权重为坐标的向量表述形式,t为用户对象,TF(w)为对象w在标签空间中以权重为坐标的向量表述形式,w为候选推荐对象,R(t,w)就越大,代表二者之间越相关。
可选的,在本发明一实施例中,所述用户标签通过正排索引获取。
可选的,在本发明一实施例中,所述候选推荐对象标签根据所述用户标签进行检索倒排索引获取。
为实现上述目的,本发明还提供了一种基于对象标签的推荐系统,包括:
第一标签获取单元,用于获取用户标签和候选推荐对象标签;
第一相关性单元,用于获取所述用户标签和所述候选推荐对象标签之间的相关性;
第一推荐单元,用于根据所述相关性选择候选推荐对象推荐给用户。
可选的,在本发明一实施例中,所述第一相关性单元进一步用于根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
R ( t , w ) = Dist ( TF ( t ) , TF ( w ) ) = exp ( - γ * | TF ( t ) - TF ( w ) | 2 ) = exp ( - γ * Σ i | TF i ( t ) - TF i ( w ) | 2 )
其中,γ为核函数参数,TF(t)为对象t在标签空间中以权重为坐标的向量表述形式,t为用户对象,TF(w)为对象w在标签空间中以权重为坐标的向量表述形式,w为候选推荐对象,R(t,w)就越大,代表二者之间越相关。
可选的,在本发明一实施例中,所述第一标签获取单元通过正排索引获取用户标签。
可选的,在本发明一实施例中,所述第一标签获取单元根据所述用户标签进行检索倒排索引获取候选推荐对象标签。
为实现上述目的,本发明提供了一种基于对象标签的推荐方法,包括:
获取与用户关联的媒介对象标签和候选推荐对象标签;
获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;
根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户。
可选的,在本发明一实施例中,所述获取所述媒介对象标签和所述候选推荐对象标签之间的相关性的步骤包括:
根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
R ( y 1 , y 2 ) = Dist ( TF ( y 1 ) , TF ( y 2 ) ) = exp ( - γ * | TF ( y 1 ) - TF ( y 2 ) | 2 ) = exp ( - γ * Σ i | TF i ( y 1 ) - TF i ( y 2 ) | 2 )
其中,γ为核函数参数,TF(y1)为对象y1在标签空间中以权重为坐标的向量表述形式,y1为一与用户关联的媒介对象,TF(y2)为对象y2在标签空间中以权重为坐标的向量表述形式,y2为候选推荐对象,R(y1,y2)就越大,代表二者之间越相关。
为实现上述目的,本发明还提供了一种基于对象标签的推荐系统,包括:
第二标签获取单元,用于获取与用户关联的媒介对象标签和候选推荐对象标签;
第二相关性单元,用于获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;
第二推荐单元,用于根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户。
可选的,在本发明一实施例中,所述第二相关性单元进一步用于根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
R ( y 1 , y 2 ) = Dist ( TF ( y 1 ) , TF ( y 2 ) ) = exp ( - γ * | TF ( y 1 ) - TF ( y 2 ) | 2 ) = exp ( - γ * Σ i | TF i ( y 1 ) - TF i ( y 2 ) | 2 )
其中,γ为核函数参数,TF(y1)为对象y1在标签空间中以权重为坐标的向量表述形式,y1为一与用户关联的媒介对象,TF(y2)为对象y2在标签空间中以权重为坐标的向量表述形式,y2为候选推荐对象,R(y1,y2)就越大,代表二者之间越相关。
为实现上述目的,本发明提供了一种基于对象标签的推荐方法,包括:
获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签;
获取所述媒介对象标签和候选推荐对象标签之间的相关性;
根据所述相关性选择大于相关性阈值的候选推荐对象;
获取所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性;
根据所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性,从大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。
为实现上述目的,本发明还提供了一种基于对象标签的推荐系统,包括:
第三标签获取单元,用于获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签;
第三相关性单元,用于获取所述媒介对象标签和候选推荐对象标签之间的相关性;
第一选择单元,用于根据所述相关性选择大于相关性阈值的候选推荐对象;
第四相关性单元,用于获取所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性;
第三推荐单元,用于根据所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性,从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。
为实现上述目的,本发明提供了一种基于对象标签的推荐方法,包括:
获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签;
获取所述用户标签和候选推荐对象标签之间的相关性;
根据所述相关性选择大于相关性阈值的候选推荐对象;
获取所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性;
根据所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性,从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。
为实现上述目的,本发明还提供了一种基于对象标签的推荐系统,包括:
第四标签获取单元,用于获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签;
第五相关性单元,用于获取所述用户标签和候选推荐对象标签之间的相关性;
第二选择单元,用于根据所述相关性选择大于相关性阈值的候选推荐对象;
第六相关性单元,用于获取所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性;
第四推荐单元,用于根据所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性,从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。
上述技术方案具有如下有益效果:本发明提出了一种以对象标签为基础统一对象相关性计算方法,及以此相关性计算为基础的通用推荐理论模型,并构建了一个实际推荐系统来证明上述方法的有效性。本发明建立的通用推荐系统,能够应用于几乎所有的个性化推荐场合和部分非个性化推荐场合,具有数据通用、部署简便、扩展灵活等特点,可以非常方便的部署和使用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提出的一种基于对象标签的通用推荐方法流程图之一;
图2为本发明提出的一种基于对象标签的通用推荐系统框图之一;
图3为本发明提出的一种基于对象标签的通用推荐方法流程图之二;
图4为本发明提出的一种基于对象标签的通用推荐系统框图之二;
图5为本发明提出的一种基于对象标签的通用推荐方法流程图之三;
图6为本发明提出的一种基于对象标签的通用推荐系统框图之三;
图7为本发明提出的一种基于对象标签的通用推荐方法流程图之四;
图8为本发明提出的一种基于对象标签的通用推荐系统框图之五。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明提出的一种基于对象标签的通用推荐方法流程图之一。包括:
步骤101):获取用户标签和候选推荐对象标签;
步骤102):获取所述用户标签和所述候选推荐对象标签之间的相关性;
步骤103):根据所述相关性选择候选推荐对象推荐给用户。
步骤102)进一步包括:根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
R ( t , w ) = Dist ( TF ( t ) , TF ( w ) ) = exp ( - γ * | TF ( t ) - TF ( w ) | 2 ) = exp ( - γ * Σ i | TF i ( t ) - TF i ( w ) | 2 )
其中,γ为核函数参数,TF(t)为对象t在标签空间中以权重为坐标的向量表述形式,t为用户对象,TF(w)为对象w在标签空间中以权重为坐标的向量表述形式,w为候选推荐对象,R(t,w)就越大,代表二者之间越相关。
在步骤101)中,所述用户标签通过正排索引获取。
在步骤101)中,所述候选推荐对象标签根据所述用户标签进行检索倒排索引获取。
如图2所示,为本发明提出的一种基于对象标签的通用推荐系统框图之一。包括:
第一标签获取单元201,用于获取用户标签和候选推荐对象标签;
第一相关性单元202,用于获取所述用户标签和所述候选推荐对象标签之间的相关性;
第一推荐单元203,用于根据所述相关性选择候选推荐对象推荐给用户。
所述第一相关性单元202进一步用于根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
R ( t , w ) = Dist ( TF ( t ) , TF ( w ) ) = exp ( - γ * | TF ( t ) - TF ( w ) | 2 ) = exp ( - γ * Σ i | TF i ( t ) - TF i ( w ) | 2 )
其中,γ为核函数参数,TF(t)为对象t在标签空间中以权重为坐标的向量表述形式,t为用户对象,TF(w)为对象w在标签空间中以权重为坐标的向量表述形式,w为候选推荐对象,R(t,w)就越大,代表二者之间越相关。
所述第一标签获取单元201通过正排索引获取用户标签。
所述第一标签获取单元201根据所述用户标签进行检索倒排索引获取候选推荐对象标签。
如图3所示,为本发明提出的一种基于对象标签的通用推荐方法流程图之二。包括:
步骤301):获取与用户关联的媒介对象标签和候选推荐对象标签;
步骤302):获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;
步骤303):根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户。
步骤302)进一步包括:根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
R ( y 1 , y 2 ) = Dist ( TF ( y 1 ) , TF ( y 2 ) ) = exp ( - γ * | TF ( y 1 ) - TF ( y 2 ) | 2 ) = exp ( - γ * Σ i | TF i ( y 1 ) - TF i ( y 2 ) | 2 )
其中,γ为核函数参数,TF(y1)为对象y1在标签空间中以权重为坐标的向量表述形式,y1为一与用户关联的媒介对象,TF(y2)为对象y2在标签空间中以权重为坐标的向量表述形式,y2为候选推荐对象,R(y1,y2)就越大,代表二者之间越相关。
如图4所示,为本发明提出的一种基于对象标签的通用推荐系统框图之二。包括:
第二标签获取单元401,用于获取与用户关联的媒介对象标签和候选推荐对象标签;
第二相关性单元402,用于获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;
第二推荐单元403,用于根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户
所述第二相关性单元402进一步用于根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
R ( y 1 , y 2 ) = Dist ( TF ( y 1 ) , TF ( y 2 ) ) = exp ( - γ * | TF ( y 1 ) - TF ( y 2 ) | 2 ) = exp ( - γ * Σ i | TF i ( y 1 ) - TF i ( y 2 ) | 2 )
其中,γ为核函数参数,TF(y1)为对象y1在标签空间中以权重为坐标的向量表述形式,y1为一与用户关联的媒介对象,TF(y2)为对象y2在标签空间中以权重为坐标的向量表述形式,y2为候选推荐对象,R(y1,y2)就越大,代表二者之间越相关。
如图5所示,为本发明提出的一种基于对象标签的通用推荐方法流程图之三。包括:
步骤501):获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签;
步骤502):获取所述媒介对象标签和候选推荐对象标签之间的相关性;
步骤503):根据所述相关性选择大于相关性阈值的候选推荐对象;
步骤504):获取所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性;
步骤505):根据所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性,从大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。
如图6所示,为本发明提出的一种基于对象标签的通用推荐系统框图之三。包括:
第三标签获取单元601,用于获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签;
第三相关性单元602,用于获取所述媒介对象标签和候选推荐对象标签之间的相关性;
第一选择单元603,用于根据所述相关性选择大于相关性阈值的候选推荐对象;
第四相关性单元604,用于获取所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性;
第三推荐单元605,用于根据所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性,从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。
如图7所示,为本发明提出的一种基于对象标签的通用推荐方法流程图之四。包括:
步骤701):获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签;
步骤702):获取所述用户标签和候选推荐对象标签之间的相关性;
步骤703):根据所述相关性选择大于相关性阈值的候选推荐对象;
步骤704):获取所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性;
步骤705):根据所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性,从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。
如图8所示,为本发明提出的一种基于对象标签的通用推荐系统框图之五。包括:
第四标签获取单元801,用于获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签;
第五相关性单元802,用于获取所述用户标签和候选推荐对象标签之间的相关性;
第二选择单元803,用于根据所述相关性选择大于相关性阈值的候选推荐对象;
第六相关性单元804,用于获取所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性;
第四推荐单元805,用于根据所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性,从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。
实施例:
一、对象相关性分析
本实施例为所有需要进行分析的对象指定了相应的标签和权重。例如,对象Oi的标签向量为{<Ti,TFi>,…,<Tk,TFk>},对象Oj的标签向量为{<Tj,TFj>,…,<Tp,TFp>}。Ti代表某种标签,既可以是封闭集合内的标签,也可以是开放标签,但必须能够相互比较,即存在某种f(x),使得当Ti=Tj,则f(Ti)=f(Tj),且当Ti≠Tj,则f(Ti)≠f(Tj)。TFi代表Ti在某个对象上的权重,是个浮点数,如果该对象没有这个标签,则TFi为0;如果有但该标签的权重无法统计,则可以将TFi赋值为1或其他指定值。
对象之间的相关性可以由它们的标签集合之间的相关性来间接表达。例如,用R(x,y)来代表对象之间的相关性计算公式,其中,x和y的取值范围为所有对象。用TFi(x)代表标签Ti在对象x上的权重,则可以用一个类核函数的标签空间向量距离公式计算相关性。
R ( x , y ) = Dist ( TF ( x ) , TF ( y ) ) = exp ( - &gamma; * | TF ( x ) - TF ( y ) | 2 ) = exp ( - &gamma; * &Sigma; i | TF i ( x ) - TF i ( y ) | 2 )
其中,γ为核函数参数,TF(x)为对象x在标签空间中以权重为坐标的向量表述形式。从上述公式可以看到,对象之间的标签命中和权重分布情况越相似,R(x,y)就越大,代表二者之间越相关。
有时候出于性能或应用的需要,不需要计算全部的标签对。例如,仅仅提取每个对象权重最大的部分标签组成标签集合进行相似性判断。
二、推荐方法
推荐相关的对象可以将其分为两个类型:人和物,前者一般代表用户,后者代表某个非人实体,例如,文本、电影、歌曲、照片、广告等等。本发明并不刻意区分对象的具体种类或来源,通过统一的表述,来实现通用的推荐。通过为对象附加代表其内在含义的标签,并且以这些标签为媒介,就可以在各种对象之间建立联系,然后,利用上节提到的相关性计算方法完成对象之间的相关性刻画,然后用这种相关性实现对象间的相互推荐。
对于推荐系统,所有最终的推荐结果都要落在用户身上。从相互关系的种类来看,相关性存在于三个不同种类的关系对上,即“人与人”的相关性、“人与物”的相关性、“物与物”的相关性。我们以U代表用户集合,Re(x)代表用户x的推荐结果,则整个推荐可以用如下公式来统一表示:
Re(x)=f(x,y,g(y),θ)
其中,y是媒介对象,即触发推荐的具体对象,可以是人也可以是物,g(y)代表y的相关对象,θ代表其他因素,例如时间、数量等。上述公式说明,整个推荐过程由两个变量三个因素决定,即目标用户和媒介对象,再加上媒介对象的相关对象共同影响推荐结果。θ具有一定的通用性,不影响个性化结果,因此下述内容不再详细描述。
从上述公式可以看出,无论是为用户推荐何种类型的对象,都可以以“标签”的相关性进行关联并完成推荐。以“游戏推荐”为例,针对用户u,假定该用户的标签向量为TSu={<Ti,TFi>,…,<Tn,TFn>}。同样,假定待推荐的“游戏”对象Oj有基于同一标签集合的标签向量TSOj={<Tj,TFj>,…,<Tm,TFm>}。以上节描述的标签向量相关性计算R(x,y)为基础,将对象之间的相关性转化为标签向量之间的距离计算,采用三种推荐模式:
第一种:直接推荐模式
这种模式适合于无法获取媒介或纯个性化推荐的场合,例如,用户刚刚进入页面且未点击过任何游戏时。此时用户本身就是推荐的媒介,即x=y=u,g(x)=g(u)={Oj},其中,Oj是满足R(u,Oj)大于相关性阈值的某个游戏对象,即Oj为所有候选推荐对象中满足R(u,Oj)大于相关性阈值的所有游戏对象,不考虑其他因素,则最终推荐结果可以直接表述为Re(x)={Oj}。
第二种:媒介推荐模式
这种模式适合于非个性化而仅仅考虑相关性的推荐场合。此时,x用户的信息不予考虑,y为某个游戏对象O,即O表示为与用户相关联的媒介对象。g(y)=g(O)={Oj},Oj是满足R(O,Oj)大于相关性阈值的所有游戏对象,即Oj为所有候选推荐对象中满足R(O,Oj)大于相关性阈值的所有游戏对象,不考虑其他因素,则最终推荐结果可以直接表述为Re(x)={Oj}。
第三种:兼容模式
这种模式同时考虑用户和触发媒介,用于需要平衡个性化和相关性的推荐场合。此时,假定x为用户u,y为某个游戏对象O,即O表示为与用户相关联的媒介对象。即O表示为与用户u相关联的媒介对象。此时,依旧有两种处理方法:优先个性化和优先相关性。前者首先按照用户u直接推荐模式得到{Oj},Oj是满足R(u,Oj)大于相关性阈值的所有游戏对象,即Oj为所有候选推荐对象中满足R(u,Oj)大于相关性阈值的所有游戏对象,然后再用对象O的标签向量作用于{Oj}得到{Op},Op是满足R(O,Op)大于相关性阈值的所有{Oj}中的游戏对象,即Op为Oj中满足R(O,Op)大于相关性阈值的所有游戏对象,Op推荐给用户u;后者首先按照媒介O的媒介推荐模式得到{Oj},Oj是满足R(O,Oj)大于相关性阈值的所有游戏对象,即Oj为所有候选推荐对象中满足R(O,Oj)大于相关性阈值的所有游戏对象,然后再用用户u的标签向量作用于{Oj}得到{Op},Op是满足R(u,Op)大于相关性阈值的所有{Oj}中的游戏对象,即Op为Oj中满足R(u,Op)大于相关性阈值的所有游戏对象,Op推荐给用户u。
在上述推荐过程中,我们可以将待推荐的对象或作为媒介的对象,替换为其他任何来源的数据对象。例如,如果将待推荐的游戏对象换做是文章对象,那么就可以实现文章推荐;如果换做用户对象,那么就可以实现用户推荐。这样,只要使用了可比较的标签集合,在我们的推荐系统中,就既没有用户和实物对象的区别,也没有不同来源对象的区别,所以,我们将这个推荐系统叫做“通用”推荐系统。
三、推荐系统结构
前两节的内容说明了一次推荐过程的所有理论描述和计算过程,在实际的实施中,我们用类似搜索引擎使用的倒排索引来加快相关性的计算。我们将上面提到的对象标签向量看做是一个文本,对象的编号当做文本的编号,标签向量当做将文本内容分好词并统计好Term Frequence形成的内容向量,将这样的编号和向量作为正排索引的一条内容。然后,对所有的正排内容建倒排索引,即倒排索引中的每一条的构成为:编号,是某个标签的编号,内容向量,是包含该标签的所有对象的编号和相应的权重。
以直接推荐模式为例,每当需要对一个用户进行推荐时,首先提取他的正排索引,得到所有该用户的标签;其次,根据这些标签去检索倒排索引,可以快速得到所有相关的候选推荐对象;然后,用上面提到的相关性计算公式计算用户和这些候选对象之间的相关性,并用这个相关性对这些候选对象排序;最后,选择排序靠前的对象推荐给该用户。
以媒介推荐模式为例,每当用户关联(例如,点击、浏览等)某个媒介对象时,首先提取媒介对象的正排索引,得到该对象的标签;其次,根据这些标签去检索倒排索引,可以快速得到所有相关的候选推荐对象;然后,用上面提到的相关性计算公式计算媒介对象和这些候选推荐对象之间的相关性,并用这个相关性对这些候选推荐对象排序;最后,选择排序靠前的候选推荐对象直接推荐给该用户。
以兼容模式为例,每当用户关联(例如,R(u,Op)点击、浏览等)某个媒介对象时,首先提取媒介对象的正排索引,得到该对象的标签;其次,根据这些标签去检索倒排索引,可以快速得到所有相关的候选推荐对象;再次,用上面提到的相关性计算公式计算媒介对象和这些候选推荐对象之间的相关性,并用选择相关性超过阈值的候选推荐对象;然后,提取用户的正排索引,得到该用户的标签,并用上面提到的相关性计算公式计算用户和相关性超过阈值的候选推荐对象之间的相关性,用这个相关性对相关性超过阈值的候选推荐对象重新排序;最后,选择排序靠前的候选推荐对象推荐给该用户。
以上所述的具体实施方程,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方程而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于对象标签的推荐方法,其特征在于,包括:
获取用户标签和候选推荐对象标签;
获取所述用户标签和所述候选推荐对象标签之间的相关性;
根据所述相关性选择候选推荐对象推荐给用户;
其中,所述获取所述用户标签和所述候选推荐对象标签之间的相关性的步骤包括:
根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
其中,γ为核函数参数,TF(t)为对象t在标签空间中以权重为坐标的向量表述形式,t为用户对象,TF(w)为对象w在标签空间中以权重为坐标的向量表述形式,w为候选推荐对象,R(t,w)越大,代表二者之间越相关。
2.如权利要求1所述的方法,其特征在于,所述用户标签通过正排索引获取。
3.如权利要求1所述的方法,其特征在于,所述候选推荐对象标签根据所述用户标签进行检索倒排索引获取。
4.一种基于对象标签的推荐系统,其特征在于,包括:
第一标签获取单元,用于获取用户标签和候选推荐对象标签;
第一相关性单元,用于获取所述用户标签和所述候选推荐对象标签之间的相关性;
第一推荐单元,用于根据所述相关性选择候选推荐对象推荐给用户;
其中,所述第一相关性单元进一步用于根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
其中,γ为核函数参数,TF(t)为对象t在标签空间中以权重为坐标的向量表述形式,t为用户对象,TF(w)为对象w在标签空间中以权重为坐标的向量表述形式,w为候选推荐对象,R(t,w)越大,代表二者之间越相关。
5.如权利要求4所述的系统,其特征在于,所述第一标签获取单元通过正排索引获取用户标签。
6.如权利要求4所述的系统,其特征在于,所述第一标签获取单元根据所述用户标签进行检索倒排索引获取候选推荐对象标签。
7.一种基于对象标签的推荐方法,其特征在于,包括:
获取与用户关联的媒介对象标签和候选推荐对象标签;
获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;
根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户;
其中,所述获取所述媒介对象标签和所述候选推荐对象标签之间的相关性的步骤包括:
根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
其中,γ为核函数参数,TF(y1)为对象y1在标签空间中以权重为坐标的向量表述形式,y1为一与用户关联的媒介对象,TF(y2)为对象y2在标签空间中以权重为坐标的向量表述形式,y2为候选推荐对象,R(y1,y2)越大,代表二者之间越相关。
8.一种基于对象标签的推荐系统,其特征在于,包括:
第二标签获取单元,用于获取与用户关联的媒介对象标签和候选推荐对象标签;
第二相关性单元,用于获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;
第二推荐单元,用于根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户;
其中,所述第二相关性单元进一步用于根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性;所述标签空间向量距离公式为:
其中,γ为核函数参数,TF(y1)为对象y1在标签空间中以权重为坐标的向量表述形式,y1为一与用户关联的媒介对象,TF(y2)为对象y2在标签空间中以权重为坐标的向量表述形式,y2为候选推荐对象,R(y1,y2)越大,代表二者之间越相关。
CN201310080076.5A 2013-03-13 2013-03-13 一种基于对象标签的通用推荐方法及系统 Active CN103177093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310080076.5A CN103177093B (zh) 2013-03-13 2013-03-13 一种基于对象标签的通用推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310080076.5A CN103177093B (zh) 2013-03-13 2013-03-13 一种基于对象标签的通用推荐方法及系统

Publications (2)

Publication Number Publication Date
CN103177093A CN103177093A (zh) 2013-06-26
CN103177093B true CN103177093B (zh) 2016-08-17

Family

ID=48636954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310080076.5A Active CN103177093B (zh) 2013-03-13 2013-03-13 一种基于对象标签的通用推荐方法及系统

Country Status (1)

Country Link
CN (1) CN103177093B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298679B (zh) * 2013-07-18 2019-05-07 腾讯科技(深圳)有限公司 应用业务推荐方法及装置
CN105045865B (zh) * 2015-07-13 2019-04-26 电子科技大学 一种基于核的协同主题回归标签推荐方法
CN106651418A (zh) * 2015-11-03 2017-05-10 北京京东尚科信息技术有限公司 针对电商满减活动的凑单商品推荐的方法
CN105608111B (zh) * 2015-12-11 2019-02-15 中国银联股份有限公司 向终端用户推荐对象的方法及系统
CN106528851A (zh) * 2016-11-24 2017-03-22 腾讯科技(深圳)有限公司 一种智能推荐方法及装置
CN106503269A (zh) * 2016-12-08 2017-03-15 广州优视网络科技有限公司 应用推荐的方法、装置及服务器
CN108804450B (zh) * 2017-04-28 2022-02-01 百度在线网络技术(北京)有限公司 信息推送的方法和装置
CN107463853B (zh) * 2017-08-04 2020-01-21 晶赞广告(上海)有限公司 受众标签分析的方法及系统
CN107944927A (zh) * 2017-12-11 2018-04-20 加和(北京)信息科技有限公司 一种选择广告流量的方法及装置
CN107832478A (zh) * 2017-12-15 2018-03-23 上海京颐科技股份有限公司 医疗移动终端及其应用推荐方法及装置、存储介质
CN110555157B (zh) * 2018-03-27 2023-04-07 阿里巴巴(中国)有限公司 内容推荐方法、内容推荐装置和电子设备
CN110555131B (zh) * 2018-03-27 2023-04-07 阿里巴巴(中国)有限公司 内容推荐方法、内容推荐装置和电子设备
CN110555135B (zh) * 2018-03-27 2023-04-07 阿里巴巴(中国)有限公司 内容推荐方法、内容推荐装置和电子设备
CN108829800B (zh) * 2018-05-29 2021-11-16 努比亚技术有限公司 一种搜索数据处理方法、设备及计算机可读存储介质
CN108875023A (zh) * 2018-06-20 2018-11-23 郑州村村联网络技术有限公司 动态属性的生成方法及装置
CN109801101A (zh) * 2019-01-03 2019-05-24 深圳壹账通智能科技有限公司 标签确定方法、装置、计算机设备和存储介质
CN110110133B (zh) * 2019-04-18 2020-08-11 贝壳找房(北京)科技有限公司 一种智能语音数据生成方法及装置
CN110147498A (zh) * 2019-05-20 2019-08-20 东软集团股份有限公司 一种知识推送方法、装置及存储设备、程序产品
CN110795625B (zh) * 2019-10-25 2021-11-23 腾讯科技(深圳)有限公司 推荐方法、装置、计算机设备及存储介质
CN113139834A (zh) * 2021-04-29 2021-07-20 北京沃东天骏信息技术有限公司 信息处理方法、装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2107475A1 (en) * 2008-03-31 2009-10-07 British Telecommunications Public Limited Company Electronic resource anotation
CN102004774A (zh) * 2010-11-16 2011-04-06 清华大学 基于统一概率模型的个性化用户标签建模与推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2107475A1 (en) * 2008-03-31 2009-10-07 British Telecommunications Public Limited Company Electronic resource anotation
CN102004774A (zh) * 2010-11-16 2011-04-06 清华大学 基于统一概率模型的个性化用户标签建模与推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于社会化标签的协同过滤推荐策略研究;万朔;《中国优秀硕士学位论文全文数据库 信息科技辑》;20110415;第I139-254第35-38页 *

Also Published As

Publication number Publication date
CN103177093A (zh) 2013-06-26

Similar Documents

Publication Publication Date Title
CN103177093B (zh) 一种基于对象标签的通用推荐方法及系统
Mulet-Forteza et al. A bibliometric research in the tourism, leisure and hospitality fields
Liu et al. Hot topics and emerging trends in tourism forecasting research: A scientometric review
Iniesta-Bonillo et al. Sustainability, value, and satisfaction: Model testing and cross-validation in tourist destinations
Padhi et al. Quantifying potential tourist behavior in choice of destination using Google Trends
Kupfer Landscape ecology and biogeography: rethinking landscape metrics in a post-FRAGSTATS landscape
Zhang et al. Using OpenStreetMap point-of-interest data to model urban change—A feasibility study
CN110222272A (zh) 一种潜在客户挖掘与推荐方法
CN102929939B (zh) 个性化信息的提供方法及装置
Chi Consumer perceived value of environmentally friendly apparel: An empirical study of Chinese consumers
Baker et al. Research constituents, intellectual structure, and collaboration pattern in the Journal of Forecasting: A bibliometric analysis
Cheng et al. Blog intention based on fashion involvement and trust
Lin et al. Using customer knowledge in designing electronic catalog
Ebrahimi Smarterdeals: a context-aware deal recommendation system based on the smartercontext engine
CN108073667A (zh) 产生用户浏览属性的方法、以及非暂存计算机可读介质
Shafiee et al. The effect of implementing SEO techniques and websites design methods on e-tourism development: A study of travel agencies e-tourism websites
De la Torre et al. Advances in sub national measurement of the Human Development Index: The case of Mexico
Creigh-Tyte Measuring creativity: A case study in the UK's designer fashion sector
Yu et al. Spatial and functional organizations of industrial agglomerations in China’s Greater Bay Area
CN102929975A (zh) 基于文档标签表征的推荐方法
Arora et al. A synonym based approach of data mining in search engine optimization
Kumar et al. Using social media for word-of-mouth marketing
Espasandin-Bustelo et al. CSR intellectual structure in management and tourism
Alias et al. Internet marketing of residential properties: Investigation on effectiveness of its application
Xu et al. SocioLink: Leveraging Relational Information in Knowledge Graphs for Startup Recommendations

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant