CN103177093B

CN103177093B - 一种基于对象标签的通用推荐方法及系统

Info

Publication number: CN103177093B
Application number: CN201310080076.5A
Authority: CN
Inventors: 薛晔伟; 何平
Original assignee: BEIJING KAIXINREN INFORMATION TECHNOLOGY Co Ltd
Current assignee: BEIJING KAIXINREN INFORMATION TECHNOLOGY Co Ltd
Priority date: 2013-03-13
Filing date: 2013-03-13
Publication date: 2016-08-17
Anticipated expiration: 2033-03-13
Also published as: CN103177093A

Abstract

本发明涉及一种基于对象标签的通用推荐方法及系统，方法包括：获取用户标签和候选推荐对象标签；获取所述用户标签和所述候选推荐对象标签之间的相关性；根据所述相关性选择候选推荐对象推荐给用户。本发明提出了一种以对象标签为基础统一对象相关性计算方法，及以此相关性计算为基础的通用推荐理论模型，并构建了一个实际推荐系统来证明上述方法的有效性。本发明建立的通用推荐系统，能够应用于几乎所有的个性化推荐场合和部分非个性化推荐场合，具有数据通用、部署简便、扩展灵活等特点，可以非常方便的部署和使用。

Description

一种基于对象标签的通用推荐方法及系统

技术领域

本发明涉及互联网信息挖掘领域，特别涉及一种基于对象标签的通用推荐方法及系统。

背景技术

现有的非个性化推荐方法主要是热点推荐和手工推荐两种，两者都是将推荐结果不加区分的推荐给所有用户，前者的结果来源于大多数用户的选择，后者的结果则依赖人工选择。

现有的个性化推荐系统主要分为如下几个不同的体系：

统计体系：这个体系通过挖掘用户的年龄、地址、收入等社会化信息，将目标对象直接推荐给合适的人。例如，部分个性化广告产品、大多数的广告邮件等。

优点：方法简单，计算量小；

缺点：1.必须事先对待推荐对象同样做分类映射，如果实体数量较多，会面临映射代价大和精度低的问题；2.用户信息获取困难，可信度低，用户抵触大；3.推荐精度低，效果差。

分类体系：这个体系设定一些用户兴趣的类目，在用户注册或首次使用产品的时候，要求用户从中选择几个感兴趣的类目，然后按照对象的类目（手动或自动生成）以对应方式推荐给用户。例如，多数邮件服务商提供的订阅服务、部分互联网兴趣图谱产品等。

优点：1.适合“冷启动问题”，新用户也能得到推荐；2.用户参与少，抵触小；

缺点：1.必须事先对待推荐对象同样做分类映射，如果实体数量较多，会面临映射代价大和精度低的问题；2.灵活性不够，不能正确反映用户兴趣的变化，导致推荐结果过于僵硬；3.类目数量受到限制，不能对用户兴趣进行稍细致的描述，导致推荐结果不够精准。

从众体系：这个体系的方法利用用户和实体之间产生的直接关联，采用协同过滤、用户聚类等从众方法，将用户可能感兴趣、但尚未发生关联的待推荐对象和该用户关联起来。简单来说，此类方法就是依赖与待推荐用户行为模式非常相似的一大群其他用户的共同选择做出推荐。例如，电商网站提供的“购买了xx的用户还购买了xx”等推荐服务，如下图所示：

优点：1.对从众性的用户和实体往往能够取得不错的推荐结果；2.不依赖其他数据，开销小；

缺点：1.对小众用户的推荐不好；2.数据无法复用或通用，每个领域的数据仅仅能够应用于该领域本身。

发明内容

本发明的目的是针对上述问题，提出一种基于对象标签的通用推荐方法及系统，克服传统技术中的缺陷，既可以为用户提供其感兴趣的产品和内容，提升用户满意度和网站点击率，又可以为商业用户提供精准的广告投放，提升广告效果。

为实现上述目的，本发明提供了一种基于对象标签的推荐方法，包括：

获取用户标签和候选推荐对象标签；

获取所述用户标签和所述候选推荐对象标签之间的相关性；

根据所述相关性选择候选推荐对象推荐给用户。

可选的，在本发明一实施例中，所述获取所述用户标签和所述候选推荐对象标签之间的相关性的步骤包括：

根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：

R (t, w) = Dist (TF (t), TF (w)) = \exp (- γ * {| TF (t) - TF (w) |}^{2}) = \exp (- γ * \underset{i}{Σ} {| {TF}_{i} (t) - {TF}_{i} (w) |}^{2})

其中，γ为核函数参数，TF(t)为对象t在标签空间中以权重为坐标的向量表述形式，t为用户对象，TF(w)为对象w在标签空间中以权重为坐标的向量表述形式，w为候选推荐对象，R(t,w)就越大，代表二者之间越相关。

可选的，在本发明一实施例中，所述用户标签通过正排索引获取。

可选的，在本发明一实施例中，所述候选推荐对象标签根据所述用户标签进行检索倒排索引获取。

为实现上述目的，本发明还提供了一种基于对象标签的推荐系统，包括：

第一标签获取单元，用于获取用户标签和候选推荐对象标签；

第一相关性单元，用于获取所述用户标签和所述候选推荐对象标签之间的相关性；

第一推荐单元，用于根据所述相关性选择候选推荐对象推荐给用户。

可选的，在本发明一实施例中，所述第一相关性单元进一步用于根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：

R (t, w) = Dist (TF (t), TF (w)) = \exp (- γ * {| TF (t) - TF (w) |}^{2}) = \exp (- γ * \underset{i}{Σ} {| {TF}_{i} (t) - {TF}_{i} (w) |}^{2})

可选的，在本发明一实施例中，所述第一标签获取单元通过正排索引获取用户标签。

可选的，在本发明一实施例中，所述第一标签获取单元根据所述用户标签进行检索倒排索引获取候选推荐对象标签。

获取与用户关联的媒介对象标签和候选推荐对象标签；

获取所述媒介对象标签和所述候选推荐对象标签之间的相关性；

根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户。

可选的，在本发明一实施例中，所述获取所述媒介对象标签和所述候选推荐对象标签之间的相关性的步骤包括：

根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：

R (y_{1}, y_{2}) = Dist (TF (y_{1}), TF (y_{2})) = \exp (- γ * {| TF (y_{1}) - TF (y_{2}) |}^{2}) = \exp (- γ * \underset{i}{Σ} {| {TF}_{i} (y_{1}) - {TF}_{i} (y_{2}) |}^{2})

其中，γ为核函数参数，TF(y₁)为对象y₁在标签空间中以权重为坐标的向量表述形式，y₁为一与用户关联的媒介对象，TF(y₂)为对象y₂在标签空间中以权重为坐标的向量表述形式，y₂为候选推荐对象，R(y₁,y₂)就越大，代表二者之间越相关。

第二标签获取单元，用于获取与用户关联的媒介对象标签和候选推荐对象标签；

第二相关性单元，用于获取所述媒介对象标签和所述候选推荐对象标签之间的相关性；

第二推荐单元，用于根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户。

可选的，在本发明一实施例中，所述第二相关性单元进一步用于根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：

R (y_{1}, y_{2}) = Dist (TF (y_{1}), TF (y_{2})) = \exp (- γ * {| TF (y_{1}) - TF (y_{2}) |}^{2}) = \exp (- γ * \underset{i}{Σ} {| {TF}_{i} (y_{1}) - {TF}_{i} (y_{2}) |}^{2})

获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签；

获取所述媒介对象标签和候选推荐对象标签之间的相关性；

根据所述相关性选择大于相关性阈值的候选推荐对象；

获取所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性；

根据所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性，从大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。

第三标签获取单元，用于获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签；

第三相关性单元，用于获取所述媒介对象标签和候选推荐对象标签之间的相关性；

第一选择单元，用于根据所述相关性选择大于相关性阈值的候选推荐对象；

第四相关性单元，用于获取所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性；

第三推荐单元，用于根据所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性，从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。

获取所述用户标签和候选推荐对象标签之间的相关性；

根据所述相关性选择大于相关性阈值的候选推荐对象；

获取所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性；

根据所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性，从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。

第四标签获取单元，用于获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签；

第五相关性单元，用于获取所述用户标签和候选推荐对象标签之间的相关性；

第二选择单元，用于根据所述相关性选择大于相关性阈值的候选推荐对象；

第六相关性单元，用于获取所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性；

第四推荐单元，用于根据所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性，从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。

上述技术方案具有如下有益效果：本发明提出了一种以对象标签为基础统一对象相关性计算方法，及以此相关性计算为基础的通用推荐理论模型，并构建了一个实际推荐系统来证明上述方法的有效性。本发明建立的通用推荐系统，能够应用于几乎所有的个性化推荐场合和部分非个性化推荐场合，具有数据通用、部署简便、扩展灵活等特点，可以非常方便的部署和使用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提出的一种基于对象标签的通用推荐方法流程图之一；

图2为本发明提出的一种基于对象标签的通用推荐系统框图之一；

图3为本发明提出的一种基于对象标签的通用推荐方法流程图之二；

图4为本发明提出的一种基于对象标签的通用推荐系统框图之二；

图5为本发明提出的一种基于对象标签的通用推荐方法流程图之三；

图6为本发明提出的一种基于对象标签的通用推荐系统框图之三；

图7为本发明提出的一种基于对象标签的通用推荐方法流程图之四；

图8为本发明提出的一种基于对象标签的通用推荐系统框图之五。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，为本发明提出的一种基于对象标签的通用推荐方法流程图之一。包括：

步骤101）：获取用户标签和候选推荐对象标签；

步骤102）：获取所述用户标签和所述候选推荐对象标签之间的相关性；

步骤103）：根据所述相关性选择候选推荐对象推荐给用户。

步骤102）进一步包括：根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：

R (t, w) = Dist (TF (t), TF (w)) = \exp (- γ * {| TF (t) - TF (w) |}^{2}) = \exp (- γ * \underset{i}{Σ} {| {TF}_{i} (t) - {TF}_{i} (w) |}^{2})

在步骤101）中，所述用户标签通过正排索引获取。

在步骤101）中，所述候选推荐对象标签根据所述用户标签进行检索倒排索引获取。

如图2所示，为本发明提出的一种基于对象标签的通用推荐系统框图之一。包括：

第一标签获取单元201，用于获取用户标签和候选推荐对象标签；

第一相关性单元202，用于获取所述用户标签和所述候选推荐对象标签之间的相关性；

第一推荐单元203，用于根据所述相关性选择候选推荐对象推荐给用户。

所述第一相关性单元202进一步用于根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：

R (t, w) = Dist (TF (t), TF (w)) = \exp (- γ * {| TF (t) - TF (w) |}^{2}) = \exp (- γ * \underset{i}{Σ} {| {TF}_{i} (t) - {TF}_{i} (w) |}^{2})

所述第一标签获取单元201通过正排索引获取用户标签。

所述第一标签获取单元201根据所述用户标签进行检索倒排索引获取候选推荐对象标签。

如图3所示，为本发明提出的一种基于对象标签的通用推荐方法流程图之二。包括：

步骤301）：获取与用户关联的媒介对象标签和候选推荐对象标签；

步骤302）：获取所述媒介对象标签和所述候选推荐对象标签之间的相关性；

步骤303）：根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户。

步骤302）进一步包括：根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：

R (y_{1}, y_{2}) = Dist (TF (y_{1}), TF (y_{2})) = \exp (- γ * {| TF (y_{1}) - TF (y_{2}) |}^{2}) = \exp (- γ * \underset{i}{Σ} {| {TF}_{i} (y_{1}) - {TF}_{i} (y_{2}) |}^{2})

如图4所示，为本发明提出的一种基于对象标签的通用推荐系统框图之二。包括：

第二标签获取单元401，用于获取与用户关联的媒介对象标签和候选推荐对象标签；

第二相关性单元402，用于获取所述媒介对象标签和所述候选推荐对象标签之间的相关性；

第二推荐单元403，用于根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户

所述第二相关性单元402进一步用于根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：

R (y_{1}, y_{2}) = Dist (TF (y_{1}), TF (y_{2})) = \exp (- γ * {| TF (y_{1}) - TF (y_{2}) |}^{2}) = \exp (- γ * \underset{i}{Σ} {| {TF}_{i} (y_{1}) - {TF}_{i} (y_{2}) |}^{2})

如图5所示，为本发明提出的一种基于对象标签的通用推荐方法流程图之三。包括：

步骤501）：获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签；

步骤502）：获取所述媒介对象标签和候选推荐对象标签之间的相关性；

步骤503）：根据所述相关性选择大于相关性阈值的候选推荐对象；

步骤504）：获取所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性；

步骤505）：根据所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性，从大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。

如图6所示，为本发明提出的一种基于对象标签的通用推荐系统框图之三。包括：

第三标签获取单元601，用于获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签；

第三相关性单元602，用于获取所述媒介对象标签和候选推荐对象标签之间的相关性；

第一选择单元603，用于根据所述相关性选择大于相关性阈值的候选推荐对象；

第四相关性单元604，用于获取所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性；

第三推荐单元605，用于根据所述大于相关性阈值的候选推荐对象标签与所述用户标签之间的相关性，从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。

如图7所示，为本发明提出的一种基于对象标签的通用推荐方法流程图之四。包括：

步骤701）：获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签；

步骤702）：获取所述用户标签和候选推荐对象标签之间的相关性；

步骤703）：根据所述相关性选择大于相关性阈值的候选推荐对象；

步骤704）：获取所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性；

步骤705）：根据所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性，从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。

如图8所示，为本发明提出的一种基于对象标签的通用推荐系统框图之五。包括：

第四标签获取单元801，用于获取用户标签、与用户关联的媒介对象标签和候选推荐对象标签；

第五相关性单元802，用于获取所述用户标签和候选推荐对象标签之间的相关性；

第二选择单元803，用于根据所述相关性选择大于相关性阈值的候选推荐对象；

第六相关性单元804，用于获取所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性；

第四推荐单元805，用于根据所述大于相关性阈值的候选推荐对象标签与所述媒介对象标签之间的相关性，从所述大于相关性阈值的候选推荐对象中选择候选推荐对象给用户。

实施例：

一、对象相关性分析

本实施例为所有需要进行分析的对象指定了相应的标签和权重。例如，对象O_i的标签向量为{<T_i,TF_i>,…,<T_k,TF_k>}，对象O_j的标签向量为{<T_j,TF_j>,…,<T_p,TF_p>}。T_i代表某种标签，既可以是封闭集合内的标签，也可以是开放标签，但必须能够相互比较，即存在某种f(x)，使得当Ti＝Tj，则f(Ti)＝f(Tj)，且当Ti≠Tj，则f(Ti)≠f(Tj)。TFi代表Ti在某个对象上的权重，是个浮点数，如果该对象没有这个标签，则TFi为0；如果有但该标签的权重无法统计，则可以将TFi赋值为1或其他指定值。

对象之间的相关性可以由它们的标签集合之间的相关性来间接表达。例如，用R(x,y)来代表对象之间的相关性计算公式，其中，x和y的取值范围为所有对象。用TF_i(x)代表标签Ti在对象x上的权重，则可以用一个类核函数的标签空间向量距离公式计算相关性。

R (x, y) = Dist (TF (x), TF (y)) = \exp (- γ * {| TF (x) - TF (y) |}^{2}) = \exp (- γ * \underset{i}{Σ} {| {TF}_{i} (x) - {TF}_{i} (y) |}^{2})

其中，γ为核函数参数，TF(x)为对象x在标签空间中以权重为坐标的向量表述形式。从上述公式可以看到，对象之间的标签命中和权重分布情况越相似，R(x,y)就越大，代表二者之间越相关。

有时候出于性能或应用的需要，不需要计算全部的标签对。例如，仅仅提取每个对象权重最大的部分标签组成标签集合进行相似性判断。

二、推荐方法

推荐相关的对象可以将其分为两个类型：人和物，前者一般代表用户，后者代表某个非人实体，例如，文本、电影、歌曲、照片、广告等等。本发明并不刻意区分对象的具体种类或来源，通过统一的表述，来实现通用的推荐。通过为对象附加代表其内在含义的标签，并且以这些标签为媒介，就可以在各种对象之间建立联系，然后，利用上节提到的相关性计算方法完成对象之间的相关性刻画，然后用这种相关性实现对象间的相互推荐。

对于推荐系统，所有最终的推荐结果都要落在用户身上。从相互关系的种类来看，相关性存在于三个不同种类的关系对上，即“人与人”的相关性、“人与物”的相关性、“物与物”的相关性。我们以U代表用户集合，Re(x)代表用户x的推荐结果，则整个推荐可以用如下公式来统一表示：

Re(x)＝f(x,y,g(y),θ)

其中，y是媒介对象，即触发推荐的具体对象，可以是人也可以是物，g(y)代表y的相关对象，θ代表其他因素，例如时间、数量等。上述公式说明，整个推荐过程由两个变量三个因素决定，即目标用户和媒介对象，再加上媒介对象的相关对象共同影响推荐结果。θ具有一定的通用性，不影响个性化结果，因此下述内容不再详细描述。

从上述公式可以看出，无论是为用户推荐何种类型的对象，都可以以“标签”的相关性进行关联并完成推荐。以“游戏推荐”为例，针对用户u，假定该用户的标签向量为TSu={<T_i,TF_i>,…,<Tn,TFn>}。同样，假定待推荐的“游戏”对象O_j有基于同一标签集合的标签向量TSO_j={<T_j,TF_j>,…,<Tm,TFm>}。以上节描述的标签向量相关性计算R(x,y)为基础，将对象之间的相关性转化为标签向量之间的距离计算，采用三种推荐模式：

第一种：直接推荐模式

这种模式适合于无法获取媒介或纯个性化推荐的场合，例如，用户刚刚进入页面且未点击过任何游戏时。此时用户本身就是推荐的媒介，即x=y=u，g(x)＝g(u)＝{O_j}，其中，O_j是满足R(u,O_j)大于相关性阈值的某个游戏对象，即O_j为所有候选推荐对象中满足R(u,O_j)大于相关性阈值的所有游戏对象，不考虑其他因素，则最终推荐结果可以直接表述为Re(x)＝{O_j}。

第二种：媒介推荐模式

这种模式适合于非个性化而仅仅考虑相关性的推荐场合。此时，x用户的信息不予考虑，y为某个游戏对象O，即O表示为与用户相关联的媒介对象。g(y)＝g(O)＝{O_j}，O_j是满足R(O,O_j)大于相关性阈值的所有游戏对象，即O_j为所有候选推荐对象中满足R(O,O_j)大于相关性阈值的所有游戏对象，不考虑其他因素，则最终推荐结果可以直接表述为Re(x)＝{O_j}。

第三种：兼容模式

这种模式同时考虑用户和触发媒介，用于需要平衡个性化和相关性的推荐场合。此时，假定x为用户u，y为某个游戏对象O，即O表示为与用户相关联的媒介对象。即O表示为与用户u相关联的媒介对象。此时，依旧有两种处理方法：优先个性化和优先相关性。前者首先按照用户u直接推荐模式得到{O_j}，O_j是满足R(u,O_j)大于相关性阈值的所有游戏对象，即O_j为所有候选推荐对象中满足R(u,O_j)大于相关性阈值的所有游戏对象，然后再用对象O的标签向量作用于{O_j}得到{O_p}，O_p是满足R(O,O_p)大于相关性阈值的所有{O_j}中的游戏对象，即O_p为O_j中满足R(O,O_p)大于相关性阈值的所有游戏对象，O_p推荐给用户u；后者首先按照媒介O的媒介推荐模式得到{O_j}，O_j是满足R(O,O_j)大于相关性阈值的所有游戏对象，即O_j为所有候选推荐对象中满足R(O,O_j)大于相关性阈值的所有游戏对象，然后再用用户u的标签向量作用于{O_j}得到{O_p}，O_p是满足R(u,O_p)大于相关性阈值的所有{O_j}中的游戏对象，即O_p为O_j中满足R(u,O_p)大于相关性阈值的所有游戏对象，O_p推荐给用户u。

在上述推荐过程中，我们可以将待推荐的对象或作为媒介的对象，替换为其他任何来源的数据对象。例如，如果将待推荐的游戏对象换做是文章对象，那么就可以实现文章推荐；如果换做用户对象，那么就可以实现用户推荐。这样，只要使用了可比较的标签集合，在我们的推荐系统中，就既没有用户和实物对象的区别，也没有不同来源对象的区别，所以，我们将这个推荐系统叫做“通用”推荐系统。

三、推荐系统结构

前两节的内容说明了一次推荐过程的所有理论描述和计算过程，在实际的实施中，我们用类似搜索引擎使用的倒排索引来加快相关性的计算。我们将上面提到的对象标签向量看做是一个文本，对象的编号当做文本的编号，标签向量当做将文本内容分好词并统计好Term Frequence形成的内容向量，将这样的编号和向量作为正排索引的一条内容。然后，对所有的正排内容建倒排索引，即倒排索引中的每一条的构成为：编号，是某个标签的编号，内容向量，是包含该标签的所有对象的编号和相应的权重。

以直接推荐模式为例，每当需要对一个用户进行推荐时，首先提取他的正排索引，得到所有该用户的标签；其次，根据这些标签去检索倒排索引，可以快速得到所有相关的候选推荐对象；然后，用上面提到的相关性计算公式计算用户和这些候选对象之间的相关性，并用这个相关性对这些候选对象排序；最后，选择排序靠前的对象推荐给该用户。

以媒介推荐模式为例，每当用户关联（例如，点击、浏览等）某个媒介对象时，首先提取媒介对象的正排索引，得到该对象的标签；其次，根据这些标签去检索倒排索引，可以快速得到所有相关的候选推荐对象；然后，用上面提到的相关性计算公式计算媒介对象和这些候选推荐对象之间的相关性，并用这个相关性对这些候选推荐对象排序；最后，选择排序靠前的候选推荐对象直接推荐给该用户。

以兼容模式为例，每当用户关联（例如，R(u,O_p)点击、浏览等）某个媒介对象时，首先提取媒介对象的正排索引，得到该对象的标签；其次，根据这些标签去检索倒排索引，可以快速得到所有相关的候选推荐对象；再次，用上面提到的相关性计算公式计算媒介对象和这些候选推荐对象之间的相关性，并用选择相关性超过阈值的候选推荐对象；然后，提取用户的正排索引，得到该用户的标签，并用上面提到的相关性计算公式计算用户和相关性超过阈值的候选推荐对象之间的相关性，用这个相关性对相关性超过阈值的候选推荐对象重新排序；最后，选择排序靠前的候选推荐对象推荐给该用户。

以上所述的具体实施方程，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方程而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于对象标签的推荐方法，其特征在于，包括：

获取用户标签和候选推荐对象标签；

获取所述用户标签和所述候选推荐对象标签之间的相关性；

根据所述相关性选择候选推荐对象推荐给用户；

其中，所述获取所述用户标签和所述候选推荐对象标签之间的相关性的步骤包括：

其中，γ为核函数参数，TF(t)为对象t在标签空间中以权重为坐标的向量表述形式，t为用户对象，TF(w)为对象w在标签空间中以权重为坐标的向量表述形式，w为候选推荐对象，R(t,w)越大，代表二者之间越相关。

2.如权利要求1所述的方法，其特征在于，所述用户标签通过正排索引获取。

3.如权利要求1所述的方法，其特征在于，所述候选推荐对象标签根据所述用户标签进行检索倒排索引获取。

4.一种基于对象标签的推荐系统，其特征在于，包括：

第一推荐单元，用于根据所述相关性选择候选推荐对象推荐给用户；

其中，所述第一相关性单元进一步用于根据标签空间向量距离公式获取所述用户标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：

5.如权利要求4所述的系统，其特征在于，所述第一标签获取单元通过正排索引获取用户标签。

6.如权利要求4所述的系统，其特征在于，所述第一标签获取单元根据所述用户标签进行检索倒排索引获取候选推荐对象标签。

7.一种基于对象标签的推荐方法，其特征在于，包括：

获取与用户关联的媒介对象标签和候选推荐对象标签；

根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户；

其中，所述获取所述媒介对象标签和所述候选推荐对象标签之间的相关性的步骤包括：

其中，γ为核函数参数，TF(y₁)为对象y₁在标签空间中以权重为坐标的向量表述形式，y₁为一与用户关联的媒介对象，TF(y₂)为对象y₂在标签空间中以权重为坐标的向量表述形式，y₂为候选推荐对象，R(y₁,y₂)越大，代表二者之间越相关。

8.一种基于对象标签的推荐系统，其特征在于，包括：

第二推荐单元，用于根据所述相关性选择候选推荐对象推荐给与媒介对象关联的用户；

其中，所述第二相关性单元进一步用于根据标签空间向量距离公式获取所述媒介对象标签和所述候选推荐对象标签之间的相关性；所述标签空间向量距离公式为：