CN104239374A

CN104239374A - 用于文档推荐的方法和装置

Info

Publication number: CN104239374A
Application number: CN201310262708.XA
Authority: CN
Inventors: 陈弢; 周宝曜; 曹逾; 郭小燕; 钟钱杰
Original assignee: EMC Corp
Current assignee: EMC Corp
Priority date: 2013-06-21
Filing date: 2013-06-21
Publication date: 2014-12-24
Anticipated expiration: 2033-06-21
Also published as: US20200257739A1; US20140379618A1; US11188597B2; US10635721B2; CN104239374B

Abstract

根据本发明的各实施方式提供了一种用于文档推荐的方法和装置，该方法包括：从与源用户使用多个第一文档有关的活动中获得用于源推荐任务的多个第一数据；从与目标用户使用多个第二文档有关的活动中获得用于目标推荐任务的多个第二数据；基于所述多个第一数据、所述多个第二数据以及从所述源推荐任务中迁移的知识来执行所述目标推荐任务以获得目标推荐模型；以及使用所述目标推荐模型向所述目标用户进行文档推荐。

Description

用于文档推荐的方法和装置

技术领域

本发明的各实施例总体上涉及文档推荐领域，并且更具体地涉及一种基于迁移学习进行文档推荐的方法和装置。

背景技术

文档推荐是用户导向的内容管理系统中的主要组成部分。准确的文档推荐可以潜在地增加用户的工作效率以及改善诸如web浏览的用户体验。用户爱好或偏好的构建是通过集成从用户的活动(例如，浏览历史)中获得的信息而自动实现的。当新用户不具有足够的历史数据时，这种推荐系统将面临如何对新用户进行个性化推荐的挑战，这被称为冷启动(cold start)问题。

对文档推荐的传统方法往往依赖于文档内容，用户信息、诸如显式或暗式的用户反馈、用户简档(profile)以及有时经由辞典的语义分析的帮助。另一种方法是协作过滤(CF)，该方法广泛用于web推荐。CF方法能够通过计算来自用户活动日志的各项目的相似性或相关性来进行推荐。CF方法的关键是如何定义用户和文档之间的相关性函数(或距离函数)，但是在可用数据较少时，很难准确地建立这种相关性函数。因此，这两种方法都不能够有效地克服冷启动问题。

因此，在文档推荐领域中，存在对于有效地克服冷启动问题的方法的需要。

发明内容

针对上述问题，本发明的各示例性实施例提供了一种基于迁移学习的文档推荐方法。该方法在没有足够的训练数据的情况下能够通过迁移学习对新用户进行准确的文档推荐，从而有效地克服了冷启动问题。

根据本发明的一个方面，提供了一种用于文档推荐的方法，包括：从与源用户使用多个第一文档有关的活动中获得用于源推荐任务的多个第一数据；从与目标用户使用多个第二文档有关的活动中获得用于目标推荐任务的多个第二数据；基于所述多个第一数据、所述多个第二数据以及从所述源推荐任务中迁移的知识来执行所述目标推荐任务以获得目标推荐模型；以及使用所述目标推荐模型向所述目标用户进行文档推荐。

根据本发明的另一方面，提供了一种用于文档推荐的装置，包括：获得模块，用于从与源用户使用多个第一文档有关的活动中获得用于源推荐任务的多个第一数据，并且用于从与目标用户使用多个第二文档有关的活动中获得用于目标推荐任务的多个第二数据；处理模块，用于基于所述多个第一数据、所述多个第二数据以及从所述源推荐任务中迁移的知识来执行所述目标推荐任务以获得目标推荐模型；以及输出模块，用于使用所述目标推荐模型向所述目标用户进行文档推荐并且输出文档推荐结果。

附图说明

结合附图并参考以下详细说明，本发明各实施例的特征、优点及其他方面将变得更加明显，在此以示例性而非限制性的方式示出了本发明的若干实施例，在附图中：

图1示出了通过根据本发明实施例的方法所获得的迁移学习结果的示例；

图2示出了根据本发明实施例的用于文档推荐的方法200的流程图；

图3示出了图2所示的根据本发明实施例的方法200中用于生成目标推荐模型的步骤的细化流程图；以及

图4示出了根据本发明实施例的装置400的框图。

具体实施方式

以下参考附图详细描述了本发明的各个示例性实施例。

应当理解，给出这些示例性实施例仅仅是为了使本领域技术人员能够更好地理解并进而实现本发明，而并非以任何方式限制本发明的范围。

根据本发明的实施例，提出了一种在迁移学习(transferlearning)架构下组合文档内容和协作数据的文档推荐方法。

迁移学习是对传统的机器学习的改进。在传统的机器学习的框架下，学习的任务就是在给定充分训练数据的基础上来学习一个分类模型；然后利用这个学习到的模型对测试文档进行分类与预测。然而，对于很难获得大量训练数据的新领域，以及训练数据与测试数据不服从相同的数据分布的情况下，这种学习与应用将无法开展。而迁移学习可以从已有的数据中迁移必要的知识以用来帮助新环境中的学习任务。因此，迁移学习可以在没有来自新环境的大量数据的情况下，诸如在对文档推荐系统中新加入的用户进行文档推荐时，克服冷启动的问题。

然而，在先前的迁移学习方法中，由于不同的学习任务会导致不同的预测向量，因此以往的方法基于对用于源域S和目标域T的预测向量w_S和w_T的关系进行建模。例如，在Sinno Jialin Pan和Qiang Yang于2010年10月在IEEE Transactions on Knowledge and DataEngineering，Vol.22，No.10中发表的“A Survey on TransferLearning”中所记载的，将用于每个任务的预测参数w划分成两项：公共参数w₀和任务特定的项v，然后将支持向量机(SVM)扩展以对这两项进行正则化，而后通过公共参数来实现知识的循环。但是，这种迁移学习的方法并不适用于源域S和目标域T可能对一些特征具有完全相反的偏好的情况。例如，在文本分类项目中，Marc和Bruno都采用技术版面信息作为是否接受通知以进行文档访问的决定因素，Marc喜欢了解关于“xCP技术”版面的通知，而Bruno喜欢了解关于“企业工程”版面的通知。在这种情况下，如果直接应用通过Marc的数据训练的分类器，则可以预期的是关于xCP技术版面的那些通知将被推荐给Bruno，这将导致错误的分类。但是，如果理解了文档推荐系统更可能例如将来自Marc的数据的版面名称和作者名称进行通知，那么将可以仅使用来自Bruno的评估的若干数据(可能一下点击)而了解他将对哪个版面和哪个作者感兴趣，然后利用这些仅有的数据来进行预测。

考虑到在传统的迁移学习中，常常会对类别(categorical)变量置以相同的重要性，虽然人们对类别内容可能具有相悖的兴趣(例如，当人们要阅读科技论文时，与论文的主体内容相比，变量“作者”对于读者来说可能是决定他们是否将继续阅读这篇论文的关键变量，因此可以对于不同域中的变量“作者”置以相同的重要性，但由于每个人的研究偏好不同，因此不同的人可能会被不同的作者所吸引)，因此，根据本发明的实施例提出了将“子空间重要性(subspace importance)”作为源域(在本发明中可以被视为老用户)和目标域(在本发明中可以被视为新用户)所共享的公共知识进行迁移。子空间重要性是在许多类型的文档(例如，研究论文、新闻文章、博客、twitter等)中普遍存在的信息。

基于迁移学习的文档推荐方法充分利用从老用户获得的知识以改善对新用户的推荐，根据本发明实施例的文档推荐方法可以包括两个阶段：离线模型学习阶段和在线推荐阶段。在离线模型学习阶段，通过大量的遗留数据和来自新用户的有限数据来训练正则化的(regularized)迁移学习模型；然后在在线推荐阶段，使用该正则化的迁移学习模型来将文档进行分级以向新用户推荐。

根据本发明的实施例，文档推荐任务被规范化为正则化的迁移学习问题，其中由优化目标函数时使用的约束来表示一致的子空间重要性，该约束被称为一致性子空间约束。通过解决优化问题来获得离线模型学习阶段的参数；然后，利用学习到的参数，可以不仅将文档标记为“推荐”或“不推荐”，而且还可以通过对推荐得分而向用户呈现不同的推荐优先级。

以下将分别对离线模型学习阶段和在线推荐阶段进行示例性描述。

离线模型学习阶段

作为示例而非对本发明的限制，在本发明各实施例中考虑在迁移学习框架下的二元分类的问题，但本领域技术人员应当理解，本发明可以适用于迁移学习框架下的其他分类问题。

迁移学习是通过来自已经进行了学习的相关任务的知识的迁移对新任务中的学习的改善。在下文中所说的任务可以理解为针对学习模型的训练或者分类器的训练，最终目的是获得推荐模型以用于对用户进行文档推荐。

假设新任务是目标任务T，并且用于目标任务的数据集合被表示为相关任务被称作源任务S，并且用于源任务S的数据集合被表示为在本发明的各实施例中，用于各任务的所有数据来自相同空间χ×Y，其中χ＝R^m，其表示各个任务的整个特征矢量空间并且Y＝{-1，＋1}；表示用于目标任务T的一个特征向量；表示用于源任务S的一个特征向量，并且

x_{T_{j}}, x_{S_{j}} &Element; χ,

y_{T_{j}}, y_{S_{j}} &Element; Y

且

y_{T_{j}}, y_{S_{J}} = {- 1, + 1},

其中例如，＋1表示“推荐”，-1表示“不推荐”，但是应当理解，y值并不仅限于-1和＋1，任何可以实现推荐目的的值都适用于本发明；n_T和n_S分别表示用于目标任务和源任务的数据的数目，例如每个任务中的可用文档的数目。在每个任务中，需要从训练数据中学习目标预测函数f_S(x)(或者f_T(x))，使得

y_{S_{i}} \approx f_{s} (x_{S_{i}})

并且

y_{T_{i}} \approx f_{T} (x_{T_{i}}) .

根据本发明的实施例，通过将迁移学习的问题简化为正则化的支持向量机(SVM)的分类问题来实现本发明。出于简明但非限制性的目的，在本文中对于每个任务t∈{S，T}，考虑SVM线性分类器，但是应当理解本发明并不仅限于SVM线性分类器。

在不失一般性的情况下，假设针对每个任务的输入数据可以被表达为：

x = (x_{1}^{C = 1}, x_{2}^{C = 1}, \cdot \cdot \cdot x_{n_{1}}^{C = 1}; x_{1}^{C = 2}, x_{2}^{C = 2}, \cdot \cdot \cdot, x_{n_{2}}^{C = 2}; \cdot \cdot \cdot; x_{1}^{C = c}, x_{2}^{C = c}, \cdot \cdot \cdot, x_{n_{c}}^{C = c}),

该输入数据是从用户使用文档的活动中获得的数据。当将该数据用于分类器的训练任务时，需要从所获得的数据中提取特征向量。提取特征向量的方式有很多种，在一个示例中，特征向量中的每一维表示某一个特定的关键词，如果文档出现了该关键词，则此维度值为1，否则为0，例如如果一个文档有两个关键词，第一个关键词出现过(不管出现了几次)而第二个未出现过，那么从该文档提取的特征向量为[1，0]；在另一示例中，假设一个文档具有两个关键词，其中第一个在文档出现2次，第二个没有出现够，则从该文档中提取的特征向量可以表示为[2，0]，等等。应当理解，其他从文档相关数据中提取特征向量的方式也适用于本发明。

从用户使用文档的活动中获得的数据或者所提取的特征向量可以被划分到多个子空间，该子空间在前述x中被表示为C，C代表了从1到c的子空间。将数据划分为多个子空间可以通过如下方式来实现：例如，对于一个文档来说，可以将其标题划分到一个子空间、将其摘要划分到一个子空间并且将其正文划分到一个子空间，因此可将与该文档相关的数据划分到c＝3个子空间。但是，应当理解本发明中所使用的划分方式并不仅限于此。根据子空间的重要性，可以分别将“标题”子空间设置为C＝1，将“摘要”子空间设置为C＝2并且将“正文”子空间设置为C＝3。前述x表达式中的n_i是以i索引的各子空间的维度的数目，也即在该子空间中所取的特征的数目。在下文中，用x表示根据从使用文档的活动中获得的数据而生成的特征向量。

假设使用SVM线性分类器用于源任务S和目标任务T，那么用于任务t(t∈{S，T})的函数f_t是基于超平面(hyperplane)的函数，即：

f_t(x)＝sign(w_t·x＋b_t)，t∈{S，T}， (1)

其中“.”表示R^m中的标准内积，w_t和b_t是该函数的参数。b_t为一常数，因此也可以将等式(1)简化表示为：

f_t(x)＝sign(w_t·x)，t∈{S，T} (2)。

根据本发明的实施例，通过将关于预测参数w_S的知识从任务S迁移到T来获得用于目标任务T的分类器或迁移学习模型，此处不失一般性地将用于目标任务T的预测参数w_T和用于源任务的预测参数w_S分别表示为：

w_{T} = (w_{1, T}^{C = 1}, w_{2, T}^{C = 1}, \cdot \cdot \cdot 2_{n_{1}, T}^{C = 1}; w_{1, T}^{C = 2}, w_{2, T}^{C = 2}, \cdot \cdot \cdot, w_{n_{2}, T}^{C = 2}; \cdot \cdot \cdot; w_{1, T}^{C = c}, w_{2, T}^{C = c}, \cdot \cdot \cdot, x_{n_{c}, T}^{C = c}) - - - (3)

w_{S} = (w_{1, S}^{C = 1}, w_{2, S}^{C = 1}, \cdot \cdot \cdot 2_{n_{1}, S}^{C = 1}; w_{1, S}^{C = 2}, w_{2, S}^{C = 2}, \cdot \cdot \cdot, w_{n_{2}, S}^{C = 2}; \cdot \cdot \cdot; w_{1, S}^{C = c}, w_{2, S}^{C = c}, \cdot \cdot \cdot, x_{n_{c}, S}^{C = c}) - - - (4)

其中C代表从1到c的子空间并且n_i是以i索引的各子空间的维度的数目，该数目对应于输入数据被划分成的各子空间的维度的数目。

在根据本发明实施例的文档推荐方法中，通过迁移“空间重要性”来实现更准确的文档推荐，而该“空间重要性”的迁移是通过在对如下问题的最优化中施加|W_T ^C＝1|＝|W_S ^C＝1|，|W_T ^C＝2|＝|W_S ^C＝2|，...，|W_T ^C＝c|＝|W_S ^C＝c|的一致性子空间约束来实现的，其中假设用于各任务的数据的每个对应子空间中的特征相同：

\min_{w_{S}, w_{T}, ξ_{T}, ξ_{S}, a} Σ_{i = 1}^{n_{S}} ξ_{S_{i}} + Σ_{i = 1}^{n_{T}} ξ_{T_{i}} + \frac{λ}{2} Σ_{i = 1}^{c} {(a^{i})}^{2} s . t . \{\begin{matrix} ξ_{S_{i}} &GreaterEqual; 0 \\ ξ_{T_{i}} &GreaterEqual; 0 \\ y_{T_{i}} (w_{T} x_{T_{i}}) &GreaterEqual; 1 - ξ_{T_{i}} \\ y_{S_{i}} (w_{S} x_{S_{i}}) &GreaterEqual; 1 - ξ_{S_{i}} \\ | w_{T}^{c = i} | = | w_{S}^{c = i} | = a^{c = i} \end{matrix} - - - (5)

通过将约束条件代入表达式(5)中可以将其进一步表达为：

\min_{w_{S,} w_{T,} a} Σ_{i = 1}^{n_{S}} \max (0,1 - y_{S_{i}} (w_{S} x_{S_{i}})) + Σ_{i = 1}^{n_{T}} \max (0,1 - y_{T_{i}} (w_{T} x_{T_{i}})) + \frac{λ}{2} Σ_{k = 1}^{c} {(a^{k})}^{2} - - - (6)

s . t . Σ_{j = 1}^{n_{k}} {(w_{j, S}^{C = k})}^{2} = Σ_{j = 1}^{n_{k}} {(w_{j, T}^{C = k})}^{2} = a^{k}, k = 1,2, . . ., c

其中，w_S，w_T分别表示用于源任务的预测向量和用于目标任务的预测向量；n_S表示用于源任务的源域中的可用数据(或者特征矢量)的数目；表示用于源任务的第i个特征向量；表示用于源任务的第i个文档的实际推荐值；n_T表示用于目标任务的目标域的可用数据(或者特征向量)的数目；表示用于目标任务的第i个特征向量；表示用于目标任务的第i个文档的实际推荐值；λ为常数；c为划分的子空间的数目；n_k表示用于源任务或目标任务的特征向量中与第k个子空间对应的部分中特征的数目。

在表达式(6)中所示的优化问题里，如果用预测向量w_S表示对目标函数f_S超平面的预测，则第一项中的表示对源任务的源域中的点(对应于例如一个文档的数据)预测的值与实际的推荐值的差别。如果用矢量w_T表示对目标函数f_T超平面的预测，则第二项中的表示对目标任务的目标域中的点(对应于一个数据记录，例如一个文档的数据)预测的值与实际的推荐值的差别。在该优化问题中的第三项为正则项，在本发明中利用对于SVM分类器的二次范数来进行正则化。在限制条件中，要求对于每一类(即，每一个子空间)的变量，它们在源域和目标域中的重要性相等，其中，aⁱ表示第i类(第i个子空间)变量在源域(或者目标域)中的重要性，通过这个变量来传递“子空间重要性”的知识。对于表达式(6)的求解可以通过现有的优化问题求解器(诸如梯度牛顿法)来完成，出于简明的目的，在此不再赘述。

为了更便于理解，下面例举一个二元示例。例如，假设源任务和目标任务均具有两个特征[x₁，x₂]，并且在本迁移学习框架内将它们标记为此时子空间的数目为2。如果源任务具有n_S＝6个数据，即在源域中有6个点如图1(a)所示，并且目标任务具有n_T＝2个数据，即在目标域中有2个点如图1(b)所示，那么将如图1(a)和图1(b)中所示的各个点的值代入表达式(2)，在添加一致性约束|W_T ^c＝1|＝|W_S ^c＝1|和|W_T ^c＝2|＝|W_S ^c＝2|的情况下对表达式(6)进行优化，则可以得到用于源任务的推荐模型为5x₁＋(-1)x₂＋5＝0的超平面，源预测向量w_S＝[5，-1]，并且用于目标任务的推荐模型为5x₁＋1x₂＝0的超平面，目标预测向量w_T＝[5，1]。

在线推荐阶段

在获得了学习的预测向量w_T之后，即获得了目标预测函数f_T的超平面之后，可以进行文档推荐。仍以图1所示的非限制性示例来进行说明，如果从一个文档中提取的特征向量为[2，0]，那么根据图1(b)所示的目标函数计算得到的预测值为y＝f_T(x)＝sign(w_T·x)＝1，根据该值可以确定该文档符合用户的偏好，因此可以被“推荐”。

此外，由于SVM本身是一个天然的基于信心的分类器，因此在根据本发明实施例的方法中，在学习得到了w_T所表示的超平面之后，不仅仅可以对是否推荐进行判断，而且还可以对于应该推荐的信心有一个度量。具体而言，对于一个文档x，通过计算c＝w_T·x可以得到推荐该文档的信心的得分c。当需要产生一个推荐列表的时候，得分c的值越大的文档在该推荐列表上的排列越靠前，即可以最先得到推荐。

图2示出了根据本发明实施例的文档推荐方法200的流程图。如图2所示，在框201中从与源用户使用多个第一文档有关的活动中获得用于源推荐任务的多个第一数据；在框202中，从与目标用户使用多个第二文档有关的活动中获得用于目标推荐任务的多个第二数据；然后在框203中，基于多个第一数据、多个第二数据以及从源推荐任务中迁移的知识来执行目标推荐任务以获得目标推荐模型，该目标推荐模型可以例如是上文所述的正则化的迁移学习模型。根据本发明的一个实施例，从源推荐任务中迁移的知识包括关于多个第一文档的子空间重要性的信息。根据本发明的另一实施例，源推荐任务包括训练基于源预测向量(w_S)的源预测函数(f_S)以获得源推荐模型并且目标推荐任务包括训练基于目标预测向量(w_T)的目标预测函数(f_T)以获得目标推荐模型。根据本发明的又一实施例，源预测函数和目标预测函数是支持向量机(SVM)线性分类器。最后在框204中，使用所获得的目标推荐模型向目标用户进行文档推荐。

图3示出了图2所示的根据本发明实施例的方法200中的框203中的步骤的细化流程图。如图3所示，在框301中将多个第一数据和多个第二数据中的每一个数据均划分到多个子空间；在框302中获得第一优化项，该第一优化项是使用源预测向量对多个第一文档进行推荐预测所得到的多个预测值分别与相应的实际推荐值之差的和；在框303中获得第二优化项，该第二优化项是使用目标预测向量对多个第二文档进行推荐预测所得到的多个预测值分别与相应的实际推荐值之差的和；在框304中获得正则项，该正则项是在使得用于每一个子空间的源预测向量的子向量的模值与用于该子空间的目标预测向量的子向量的模值相等的条件下，对源预测向量或目标预测向量进行正则化所得到的项；然后在框305中对第一优化项、第二优化项和正则项的和进行优化以获得前述和最小的情况所对应的目标向量的值作为目标推荐模型的参数。

虽然在图2和图3中按图示顺序描绘了各个框中的步骤，但是根据本发明实施例的方法并不受图示的顺序的限制，而是任何可以实现本发明方法的顺序均落入本发明的保护范围之内。例如，图3中按图示顺序示出了框302-304，但是按照逆序或是并行地执行302-304中的步骤也同样可以实现本发明的方法。

图4示出了根据本发明实施例的用于进行文档推荐的装置400的框图。如图4中所示，装置400包括：获得模块401，用于从与源用户使用多个第一文档有关的活动中获得用于源推荐任务的多个第一数据，并且用于从与目标用户使用多个第二文档有关的活动中获得用于目标推荐任务的多个第二数据；处理模块402，用于基于多个第一数据、多个第二数据以及从源推荐任务中迁移的知识来执行目标推荐任务以获得目标推荐模型；以及输出模块403，用于使用目标推荐模型向目标用户进行文档推荐并且输出文档推荐结果。

与传统的文档推荐方法相比，根据本发明实施例的基于迁移学习的文档推荐方法具有以下优点：

无需用户付出努力，例如编辑用户简档等，而是通过根据老用户过去的活动日志来自动地训练迁移学习模型便可以预测新用户对文档的偏好；

充足的老用户的访问日志数据包含了丰富的用户行为信息并且能够辅助更准确地预测新用户对文档的偏好；

通过使用于新用户的数据域的每个子空间具有与老用户的子空间相同的重要性可以准确地确定新用户对文档的偏好；

当新用户不具有足够的历史数据时，根据本发明各实施例的方法可以解决文档推荐中的冷启动问题；

根据本发明各实施例的方法将文档推荐问题规范化为分类问题并且通过对传统的SVM分类器施加被称为一致子空间约束的约束得以有效实现；

可以经由现有的优化问题求解器(诸如梯度牛顿法)来求得迁移学习优化问题中的参数；

利用在正则化SVM中学习的参数，可以为新文档计算推荐得分，并且将其标记为推荐或不推荐。如果给定了文档列表，可以不仅对文档进行标记而且可以通过文档得分对他们排序，以更切合用户的偏好向用户进行推荐。

虽然以上以SVM分类器为例对基于迁移学习的文档推荐方法进行了描述，但本领域技术人员将理解，本发明方法并不仅限于SVM，而是同样还可适用于其他可以实现文档分类的线性或非线性分类器。

以上结合附图所进行的描述只是为了说明本发明而示例性给出的。本领域技术人员应当理解，可以基于上面所描述的本发明的原理提出不同的方法步骤或装置结构，虽然这些不同的方法步骤或装置结构未在此处明确描述或示出，但都体现了本发明的原理并被包括在本发明的精神和范围之内。此外，所有此处提到的示例主要用于教导目的以帮助读者理解本发明的原理以及发明人所贡献的促进本领域技术发展的构思，并不应被解释为对本发明范围的限制。此外，此处所有提到本发明的原理、方面和实施方式的陈述及其具体示例包含其等同物在内。

Claims

1.一种用于文档推荐的方法，包括：

从与源用户使用多个第一文档有关的活动中获得用于源推荐任务的多个第一数据；

从与目标用户使用多个第二文档有关的活动中获得用于目标推荐任务的多个第二数据；

基于所述多个第一数据、所述多个第二数据以及从所述源推荐任务中迁移的知识来执行所述目标推荐任务以获得目标推荐模型；以及

使用所述目标推荐模型向所述目标用户进行文档推荐。

2.根据权利要求1所述的方法，其中所迁移的知识包括关于所述多个第一文档的子空间重要性的信息。

3.根据权利要求2所述的方法，其中：

所述源推荐任务包括训练基于源预测向量(w_S)的源预测函数(f_S)以获得源推荐模型；并且

所述目标推荐任务包括训练基于目标预测向量(w_T)的目标预测函数(f_T)以获得所述目标推荐模型。

4.根据权利要求3所述的方法，其中执行所述目标推荐任务以获得所述目标推荐模型进一步包括：

将所述多个第一数据和所述多个第二数据中的每一个数据均划分到多个子空间；

获得第一优化项，所述第一优化项是使用所述源预测向量对所述多个第一文档进行推荐预测所得到的多个预测值分别与相应的实际推荐值之差的和；

获得第二优化项，所述第二优化项是使用所述目标预测向量对所述多个第二文档进行推荐预测所得到的多个预测值分别与相应的实际推荐值之差的和；

获得正则项，所述正则项是在使得用于每一个所述子空间的所述源预测向量的子向量的模值与用于该子空间的所述目标预测向量的子向量的模值相等的条件下，对所述源预测向量或所述目标预测向量进行正则化所得到的项；以及

对所述第一优化项、所述第二优化项和所述正则项的和进行优化以获得所述和最小的情况所对应的所述目标向量的值作为所述目标推荐模型的参数。

5.根据权利要求4所述的方法，进一步包括：

基于所述多个第一数据生成多个第一特征向量

基于所述多个第二数据生成多个第二特征向量以及

对以下表达式进行优化：

\min_{w_{S,} w_{T,} a} Σ_{i = 1}^{n_{S}} \max (0,1 - y_{S_{i}} (w_{S} x_{S_{i}})) + Σ_{i = 1}^{n_{T}} \max (0,1 - y_{T_{i}} (w_{T} x_{T_{i}})) + \frac{λ}{2} Σ_{k = 1}^{c} {(a^{k})}^{2}

s . t . Σ_{j = 1}^{n_{k}} {(w_{j, S}^{C = k})}^{2} = Σ_{j = 1}^{n_{k}} {(w_{j, T}^{C = k})}^{2} = {(a^{k})}^{2}, k = 1,2, \cdot \cdot \cdot, c

其中，w_S、w_T分别表示所述源预测向量和所述目标预测向量；n_S表示所述多个第一特征向量的数目；表示第i个所述第一特征向量；表示用于第i个所述第一文档的实际推荐值；n_T表示所述多个第二特征向量的数目；表示第i个所述第二特征向量；表示用于第i个所述第二文档的实际推荐值；λ为常数；c为所述子空间的数目；n_k表示所述第一特征向量中与第k个子空间对应的部分中的特征的数目，所述数目与所述第二特征向量中与第k个子空间对应的部分中的特征的数目相同。

6.根据权利要求2-5中的任一项所述的方法，其中所述源预测函数和所述目标预测函数是支持向量机(SVM)线性分类器。

7.一种用于文档推荐的装置，包括：

获得模块，用于从与源用户使用多个第一文档有关的活动中获得用于源推荐任务的多个第一数据，并且用于从与目标用户使用多个第二文档有关的活动中获得用于目标推荐任务的多个第二数据；

处理模块，用于基于所述多个第一数据、所述多个第二数据以及从所述源推荐任务中迁移的知识来执行所述目标推荐任务以获得目标推荐模型；以及

输出模块，用于使用所述目标推荐模型向所述目标用户进行文档推荐并且输出文档推荐结果。

8.根据权利要求1所述的装置，其中所迁移的知识包括关于所述多个第一文档的子空间重要性的信息。

9.根据权利要求2所述的装置，其中：

10.根据权利要求3所述的装置，其中所述处理模块进一步用于：

11.根据权利要求4所述的方法，所述处理模块进一步用于：

基于所述多个第一数据生成多个第一特征向量

基于所述多个第二数据生成多个第二特征向量以及

对以下表达式进行优化：

\min_{w_{S,} w_{T,} a} Σ_{i = 1}^{n_{S}} \max (0,1 - y_{S_{i}} (w_{S} x_{S_{i}})) + Σ_{i = 1}^{n_{T}} \max (0,1 - y_{T_{i}} (w_{T} x_{T_{i}})) + \frac{λ}{2} Σ_{k = 1}^{c} {(a^{k})}^{2}

s . t . Σ_{j = 1}^{n_{k}} {(w_{j, S}^{C = k})}^{2} = Σ_{j = 1}^{n_{k}} {(w_{j, T}^{C = k})}^{2} = {(a^{k})}^{2}, k = 1,2, \cdot \cdot \cdot, c

12.根据权利要求2-5中的任一项所述的装置，其中所述源预测函数和所述目标预测函数是支持向量机(SVM)线性分类器。