CN107341679A

CN107341679A - 获取用户画像的方法及装置

Info

Publication number: CN107341679A
Application number: CN201610284124.6A
Authority: CN
Inventors: 鲁梦平
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-04-29
Filing date: 2016-04-29
Publication date: 2017-11-10
Also published as: CN110378731B; US11394798B2; WO2017186106A1; JP2019503006A; US20180316776A1; KR102122373B1; CN110378731A; JP6615362B2; KR20180091043A

Abstract

本发明公开了一种获取用户画像的方法及装置，属于信息处理技术领域。所述方法包括：根据用户行为日志，获取M个训练样本；根据训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n；根据最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n。本发明通过将用户和标签参数化，并采用数据拟合模型修正用户参数矩阵和标签参数矩阵，使之拟合训练样本，无需人工为标签设定相应的标签权重，根据用户行为日志采用数据拟合方法自动地获取用户画像，达到了节省时间和人力成本，准确高效地获取用户画像的技术效果。

Description

获取用户画像的方法及装置

技术领域

本发明实施例涉及信息处理技术领域，特别涉及一种获取用户画像的方法及装置。

背景技术

用户画像，又称用户角色(Persona)，是一种用于勾画目标用户、联系用户诉求与设计方向的有效工具，其在各领域得到了广泛的应用。具体实现时，可将用户画像以用于刻画用户特征的标签(tag)集合表示，该标签集合可包括从用户社会属性、生活习惯、消费行为等角度刻画用户特征的标签。比如年龄、性别、地域、学历和用户偏好等标签。

现有技术提供了一种获取用户画像的方法。预先设定多个标签，并人工为每一个标签设定相应的标签权重，标签权重可以根据实际应用的需求或人工经验预先设定。可选的，对于每一个标签，根据具备该标签的物品在所有物品中的占比，设定该标签对应的标签权重。通常，上述占比与标签权重呈负相关关系，也即上述占比越大则标签权重越小，上述占比越小则标签权重越大。而后获取用户行为日志，用户行为日志记录有用户对各个物品执行的各种行为，比如：用户1浏览了物品1、用户2购买了物品1、用户1购买了物品2等。然后根据各个物品所具备的标签和用户对各个物品执行的行为，确定用户对各个标签的行为权重。最后分别根据每一个标签对应的标签权重和行为权重，计算得到用户对该标签的喜好程度，整合用户对各个标签的喜好程度得到用户画像。例如，用户对某一标签的喜好程度，可采用该标签对应的标签权重与行为权重的乘积表示。

然而，在现有技术中，由于需要人工为每一个标签设定相应的标签权重，而标签的数量往往较多，这就导致需要花费大量的时间和人力资源，获取用户画像所耗费的时间和人力成本较高；并且，由于人工设定标签权重的方式难免存在误差，很难保证人工设定的标签权重与实际业务相符，导致最终获取的用户画像的准确度较低。

发明内容

为了解决现有技术提供的获取用户画像的方法，所耗费的时间和人力成本较高，且获取的用户画像的准确度较低的问题，本发明实施例提供了一种获取用户画像的方法及装置。所述技术方案如下：

根据本发明实施例的第一方面，提供了一种获取用户画像的方法，所述方法包括：

根据用户行为日志，获取M个训练样本；其中，训练样本<u，i，j>用于反映用户u对物品i和物品j的喜好程度的差异，所述M为正整数；

根据所述训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n；其中，所述m表示用户个数，所述k表示因子个数，所述n表示标签个数，所述m为正整数，所述k为正整数，所述n为大于1的整数；

根据所述最终的用户参数矩阵W_m×k和所述最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n；其中，所述用户画像矩阵P_m×n中第u行第t列的元素P_ut表示用户u对标签t的喜好程度，所述u为大于等于1且小于等于m的整数，所述t为大于等于1且小于等于n的整数。

根据本发明实施例的第二方面，提供了一种获取用户画像的装置，所述装置包括：

样本获取模块，用于根据用户行为日志，获取M个训练样本；其中，训练样本<u，i，j>用于反映用户u对物品i和物品j的喜好程度的差异，所述M为正整数；

矩阵修正模块，用于根据所述训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n；其中，所述m表示用户个数，所述k表示因子个数，所述n表示标签个数，所述m为正整数，所述k为正整数，所述n为大于1的整数；

画像获取模块，用于根据所述最终的用户参数矩阵W_m×k和所述最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n；其中，所述用户画像矩阵P_m×n中第u行第t列的元素P_ut表示用户u对标签t的喜好程度，所述u为大于等于1且小于等于m的整数，所述t为大于等于1且小于等于n的整数。

本发明实施例提供的技术方案带来的有益效果包括：

通过根据用户行为日志，获取M个训练样本，根据训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，而后根据最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n；解决了现有技术提供的获取用户画像的方法，所耗费的时间和人力成本较高，且获取的用户画像的准确度较低的问题；通过将用户和标签参数化，并采用数据拟合模型修正用户参数矩阵和标签参数矩阵，使之拟合训练样本，无需人工为标签设定相应的标签权重，根据用户行为日志采用数据拟合方法自动地获取用户画像，达到了节省时间和人力成本，准确高效地获取用户画像的技术效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例提供的获取用户画像的方法的流程图；

图2是本发明另一个实施例提供的获取用户画像的方法的流程图；

图3是图2所示实施例中步骤201的子步骤的流程图；

图4是本发明一个实施例提供的生成用户相似度矩阵的流程图；

图5是本发明一个实施例提供的获取用户画像的装置的结构方框图；

图6是本发明另一个实施例提供的获取用户画像的装置的结构方框图；

图7是本发明一个实施例提供的服务器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

为了便于理解，首先对本文中涉及的一些名词做介绍和说明。

物品

物品包括实体物品和虚拟物品。实体物品是指真实存在的物品，是与办公、生活消费有关的物件，如衣服、食物、办公用品等；虚拟物品是指在现实生活中摸不到的物品，诸如视频、音频、图片、应用软件、微博之类的互联网产品或内容，或者是从虚拟的网络世界里衍生出来的物品，如游戏道具、会员、图标等。

标签

标签是指用于描述物品属性的关键词。比如，衣服的标签可以包括从颜色、款式、尺寸等角度描述的关键词；再比如，视频的标签可以包括从年份、国家、类型、演员等角度描述的关键词；再比如，游戏道具的标签可以包括从分类、功能、等级等角度描述的关键词。

用户的行为类型

用户的行为类型是指用户对物品执行的行为。比如：浏览、购买、收藏、删除、使用、转发、点赞、踩、评论等。针对不同的物品，用户对该物品所能够执行的行为可能相同，也可能不同。比如，对于衣服，用户对该物品所能够执行的行为可以包括浏览、购买、收藏等；再比如，对于视频，用户对该物品所能够执行的行为可以包括浏览、预览、观看、购买、收藏等；再比如，对于微博，用户对该物品所能够执行的行为可以包括浏览、转发、收藏等。可选的，用户的行为类型还包括“未知”类型，用于表示用户未对物品执行任何行为。用户对物品的行为类型反映了用户对物品的喜好程度，根据用户对两个物品的行为类型，便可确定用户对该两个物品的喜好程度的差异。

本发明实施例提供的方法，各步骤的执行主体可以是具备数据存储和计算能力的电子设备，如服务器。在下述方法实施例中，仅以各步骤的执行主体为服务器为例进行举例说明，但对此不构成限定。

请参考图1，其示出了本发明一个实施例提供的获取用户画像的方法的流程图。该方法可以包括如下几个步骤。

步骤101，根据用户行为日志，获取M个训练样本；其中，训练样本<u，i，j>用于反映用户u对物品i和物品j的喜好程度的差异，M为正整数。

步骤102，根据训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n。

其中，m表示用户个数，k表示因子个数，n表示标签个数，m为正整数，k为正整数，n为大于1的整数。

步骤103，根据最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n。

其中，用户画像矩阵P_m×n中第u行第t列的元素P_ut表示用户u对标签t的喜好程度，u为大于等于1且小于等于m的整数，t为大于等于1且小于等于n的整数。

综上所述，本实施例提供的方法，通过根据用户行为日志，获取M个训练样本，根据训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，而后根据最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n；解决了现有技术提供的获取用户画像的方法，所耗费的时间和人力成本较高，且获取的用户画像的准确度较低的问题；通过将用户和标签参数化，并采用数据拟合模型修正用户参数矩阵和标签参数矩阵，使之拟合训练样本，无需人工为标签设定相应的标签权重，根据用户行为日志采用数据拟合方法自动地获取用户画像，达到了节省时间和人力成本，准确高效地获取用户画像的技术效果。

请参考图2，其示出了本发明另一个实施例提供的获取用户画像的方法的流程图。在本实施例中，以各步骤的执行主体为服务器进行举例说明。该方法可以包括如下几个步骤。

步骤201，根据用户行为日志，获取M个训练样本。

训练样本<u，i，j>用于反映用户u对物品i和物品j的喜好程度的差异，M为正整数。

用户行为日志用于记录用户对物品的操作行为。用户行为日志中包括用户标识、用户的行为类型、物品标识和物品标签信息。其中，用户标识是用于识别用户身份的标识号码，也称为用户帐号，是某个体系中相对唯一的编码。用户的行为类型是指用户对物品执行的行为，比如浏览、购买、收藏、删除、使用、转发、点赞、踩、评论、未知等。用户的行为类型的种类可以根据实际应用的需求进行设置。物品标识是用于识别物品的标识号码，与用户标识类似，每个物品对应有唯一的物品标识。物品标签信息是用于描述物品属性的关键词，一个物品可以包括一个或多个标签。获取用户行为日志的方式可以是服务器采集终端上的用户操作行为或终端主动上报用户操作行为到服务器。

训练样本<u，i，j>用于反映用户u对物品i和物品j的喜好程度的差异。在一种可能的实施方式中，训练样本<u，i，j>用于反映用户u对物品i的喜好程度大于对物品j的喜好程度；在另一种可能的实施方式中，训练样本<u，i，j>用于反映用户u对物品i的喜好程度小于对物品j的喜好程度。用户对物品的行为类型反映了用户对物品的喜好程度，根据用户对两个物品的行为类型，便可确定用户对该两个物品的喜好程度的差异。

可选的，根据用户付出的代价决定行为类型的权重的准则，按照行为类型的权重确定出所有行为类型之间的相对大小关系。例如，“购买”行为类型的权重大于“浏览”行为类型的权重。如果用户未对物品执行任何行为，则获取用户的行为类型是“未知”类型。一般来说，用户对其执行了某种行为的物品的喜好程度大于其对未执行过任何行为的物品的喜好程度，因此“未知”行为类型的权重最小，小于“浏览”、“购买”等行为类型的权重。例如：用户u对物品i执行了某种行为，而对物品j未执行过任何行为，则用户u对物品i的喜好程度大于对物品j的喜好程度。

例如，以训练样本<u，i，j>用于反映用户u对物品i的喜好程度大于对物品j的喜好程度为例，如果用户u喜欢物品i的程度大于喜欢物品j的程度，则得到的训练样本是<u，i，j>，相反地，则得到的训练样本是<u，j，i>。例如：用户u购买物品i、浏览物品j，则获取的训练样本是<u，i，j>；用户浏览物品i、购买物品j，则获取的训练样本是<u，j，i>。又例如：用户浏览物品i，但没有对物品j执行任何行为，则获取的训练样本是<u，i，j>。针对一个用户可以获取到一个或多个训练样本，如果用户1浏览了物品2，但对物品1、物品3和物品4并未执行任何行为，则获取到的训练样本包括<1，2，1>、<1，2，3>和<1，2，4>。

在一种可能的实施方式中，如图3所示，步骤201可以包括如下几个子步骤：

步骤201a，根据用户行为日志，获取m个用户中的每一个用户对h个物品中的每一个物品的行为类型。

其中，m表示用户个数，h表示物品个数，m为正整数，h为大于1的整数。

步骤201b，根据每一个用户对每一个物品的行为类型，获取M个训练样本。

作为一种可能的实施方式，步骤201b可以包括：

1、根据用户的行为类型获取用户物品矩阵；

可选的，用户物品矩阵R_m×h的行表示用户，列表示物品，m表示用户个数，h表示物品个数，元素R_ui表示用户u对物品i是否执行了某种行为。示例性的，用户物品矩阵R_m×h中的元素用0或1表示。1表示用户对物品执行了某种行为，0表示用户对物品未执行任何行为。示例性的，当用户个数为3，物品个数为4时，用户物品矩阵R_m×h为：

其中，第一行第二列中的1表示用户1对物品2执行了某种行为。

2、根据用户的行为类型和用户物品矩阵，获取M个训练样本。

根据用户物品矩阵可以知道用户是否对物品执行了某种行为，对于用户u，根据行为类型可以确定用户u喜欢物品i的程度是否大于喜欢物品j的程度，从而得到一个训练样本。示例性的，由用户物品矩阵R_3×4的第一行可知，用户1对物品2执行了某种行为，用户1对物品1、物品3和物品4并未执行任何行为，以训练样本<u，i，j>用于反映用户u对物品i的喜好程度大于对物品j的喜好程度为例，则获取到的用户1的训练样本包括：<1，2，1>、<1，2，3>和<1，2，4>。

需要说明的是，在一般情况下，用户对其执行了某种行为的物品的喜好程度大于其对未执行过任何行为的物品的喜好程度。但是，在其它可能的情况下，用户对其执行了某种行为的物品的喜好程度也有可能小于其对未执行过任何行为的物品的喜好程度。以物品为视频为例，如果用户对视频A执行的行为为踩，对视频B并未执行任何行为，则认为用户对视频A的喜好程度小于对视频B的喜好程度。

另外，由于用户个数为m，物品个数为h，因此理论上可构建个样本，在实际操作时，采用采样方式从上述个样本中选取部分较为可靠的样本作为训练样本。例如，如果用户u对物品i和物品j均未执行任何行为，或者用户u对物品i和物品j执行的行为类型相同，则无法明确用户u对物品i和物品j的喜好程度的差异，这类样本不作为训练样本。再例如，获取每一个物品的执行可能性，一个物品的执行可能性是指用户对该物品执行行为的可能性。执行可能性可基于物品在整个系统中的出现率、流行度、推荐度、显示排序等因素进行确定。例如，物品在整个系统中的出现率越大，说明用户很容易便可获取到该物品，则该物品的执行可能性越大；反之，物品在整个系统中的出现率越小，说明用户获取到该物品较为困难，则该物品的执行可能性越小。在获取训练样本时，若选择一个用户u执行了行为的物品和一个用户u未执行行为的物品构建训练样本，则可从用户u未执行行为的物品中，选择执行可能性较大的物品，以构建训练样本。通过上述方式，可以确保所获取的训练样本更加准确地反映用户对两个物品的喜好程度的差异，降低训练样本的错误风险，提高训练样本的可靠性。

步骤202，生成初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n；

其中，m表示用户个数，k表示因子个数，n表示标签个数，m为正整数，k为正整数，n为大于1的整数。在一种可能的实施方式中，采用生成呈正态分布的随机数的方式，构建初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n。也即，初始化的用户参数矩阵W_m×k中的元素为呈正态分布的随机数，初始化的标签参数矩阵H_k×n中的元素为呈正态分布的随机数。

可选的，因子个数k是预先设定的值，或，因子个数k是根据大量实验得到的经验值。

可选的，正态分布的均值设置为0，方差设置为0.01。

示例性的，随机生成的用户参数矩阵W_m×k和标签参数矩阵H_k×n如下所示：

其中，用户参数矩阵W_m×k的每一行对应一个用户的因子向量；标签参数矩阵H_k×n的每一列对应一个标签的因子向量。

下面，通过如下步骤203至步骤207修正初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n。首先，令a＝0，并执行如下步骤203。

步骤203，根据第a轮修正后的用户参数矩阵W_m×k和第a轮修正后的标签参数矩阵H_k×n，计算m个用户中的每一个用户对n个标签中的每一个标签的喜好程度。

其中，a为大于等于0的整数，第0轮修正后的用户参数矩阵W_m×k为初始化的用户参数矩阵W_m×k，第0轮修正后的标签参数矩阵H_k×n为初始化的标签参数矩阵H_k×n。

当a＝0时，根据初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n计算m个用户中的每一个用户对n个标签中的每一个标签的喜好程度。

可选的，用户u对标签t的喜好程度计算公式如下：

比如：如上示例性的初始化的用户参数矩阵W和初始化的标签参数矩阵H中，用户1对标签1的喜好程度为：用户3对标签5的喜好程度为：

步骤204，根据m个用户中的每一个用户对n个标签中的每一个标签的喜好程度和物品标签矩阵A_h×n，计算m个用户中的每一个用户对h个物品中的每一个物品的喜好程度。

根据初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n计算出每一个用户对每一个标签的喜好程度后，结合物品标签矩阵A_h×n，计算m个用户中的每一个用户对h个物品中的每一个物品的喜好程度。

其中，物品标签矩阵A_h×n是根据用户行为日志中携带的物品标识和物品标签得到的矩阵。

可选的，物品标签矩阵A_h×n的行表示物品，列表示标签。示例性的，物品标签矩阵A_h×n中的元素用0或1表示。0表示物品不具有标签所描述的属性，1表示物品具有标签所描述的属性。假定物品的个数为4，标签的个数为5，则示例性的物品标签矩阵A_h×n为：

其中，物品标签矩阵A₁表示物品标签矩阵的第一行，说明物品1具有标签1和标签2所描述的属性，物品1不具有标签3、标签4和标签5所描述的属性。

用户喜欢某一物品，通常是因为该物品具有用户喜好的标签(也即标签所描述的属性)，用户对物品的喜好可以看成是用户对该物品具有的标签的喜好程度的综合。用户u对物品i的喜好程度可以根据用户u对物品i具有的标签的喜好程度计算得到。

可选的，本发明实施例中采用将用户u对物品i具有的标签的喜好程度进行求和计算用户u对物品i的喜好程度，计算公式为：

比如：如上示例性的初始化用户参数矩阵W_m×k、初始化标签参数矩阵H_k×n中，用户1对物品1的喜好程度用户3对物品2的喜好程度

步骤205，根据m个用户中的每一个用户对h个物品中的每一个物品的喜好程度，获取每一个训练样本对应的概率。

其中，训练样本<u，i，j>对应的概率是指用户u对物品i的喜好程度大于对物品j的喜好程度的概率。

可选的，计算用户u对物品i的喜好程度大于对物品j的喜好程度的概率的过程如下：

第一步，根据计算出的每个用户对每个物品的喜好程度，计算用户u对物品i的喜好程度与用户u对物品j的喜好程度的差值：

第二步，根据逻辑斯蒂函数σ(x)计算用户u对物品i的喜好程度大于对物品j的喜好程度的概率：

步骤206，将M个训练样本分别对应的概率作为数据拟合模型的输入参数，计算数据拟合模型的输出结果。

可选的，数据拟合模型是采用贝叶斯最大似然估计方法构建的模型，具体的数据拟合模型如下所示：

其中，λ_W、λ_H和λ_S是用于防止过拟合的正则化参数，λ_W、λ_H和λ_S为正实数，||·||表示矩阵的二范数，D_s表示M个训练样本的集合，训练样本<u，i，j>对应的概率表示用户u对物品i的喜好程度与用户u对物品j的喜好程度的差值，σ(x)表示逻辑斯蒂函数，N_u表示用户u的关联用户集合，S_uv是用户相似度矩阵S_m×m中第u行第v列的元素，S_uv表示用户u和用户v之间的相似度，W_u表示所述第a轮修正后的用户参数矩阵W_m×k中第u行对应的行向量，W_v表示所述第a轮修正后的用户参数矩阵W_m×k中第v行对应的行向量。

N_u表示用户u的关联用户集合，也即表示与用户u之间存在关联关系的其他用户的集合。其中，关联关系可以是好友关系，例如某一用户v与用户u是社交类应用中的好友，则用户u与用户v之间具有好友关系，用户u与用户v互为关联用户；或者，关联关系也可以是非好友关系，例如某一用户v与用户u属于社交类应用中的同一群组，则用户u与用户v互为关联用户。需要说明的是，在构建用户相似度矩阵S_m×m时，用户相似度矩阵S_m×m中的任意两个用户，可以是具有好友关系的用户，也可以是并未建立好友关系(如属于同一群组，甚至为互不相识的陌生用户)的用户。

用户相似度矩阵S_m×m中包括m个用户中两两用户之间的相似度。可选的，将矩阵S对角元素设置为S_uu＝0，最后按行归一化以使得

步骤207，若输出结果不符合预设条件，则修正第a轮修正后的用户参数矩阵W_m×k得到第a+1轮修正后的用户参数矩阵W_m×k，以及修正第a轮修正后的标签参数矩阵H_k×n得到第a+1轮修正后的标签参数矩阵H_k×n，令a＝a+1，并返回执行上述步骤203至步骤206。

预设条件包括本轮输出结果与上轮输出结果之间的差值小于预定阈值，和/或，对用户参数矩阵和标签参数矩阵的修正轮数达到预定轮数。其中，预定阈值和预定轮数综合衡量修正精度和修正效率之后进行设定。

可选的，根据第a轮修正后的用户参数矩阵W_m×k按照下述公式计算得到第a+1轮修正后的用户参数矩阵W_m×k。

其中，W_u′表示第a+1轮修正后的用户参数矩阵W_m×k中第u行对应的行向量，W_u表示第a轮修正后的用户参数矩阵W_m×k中第u行对应的行向量，表示第a轮修正后的标签参数矩阵H_k×n中第l列对应的列向量的转置向量，l为大于等于1且小于等于n的整数，α为学习效率，α为正实数。其中，α为预先设定的经验值，α可综合衡量修正速度和修正精度之后进行设定。

可选的，根据第a轮修正后的标签参数矩阵H_k×n按照下述公式计算得到第a+1轮修正后的标签参数矩阵H_k×n。

其中，H_f′表示第a+1轮修正后的标签参数矩阵H_k×n中第f行对应的行向量，H_f表示第a轮修正后的标签参数矩阵H_k×n中第f行对应的行向量，f为大于等于1且小于等于k的整数，α为学习效率，α为正实数。其中，α为预先设定的经验值，α可综合衡量修正速度和修正精度之后进行设定。

在每一轮修正过程中，采用M个训练样本中的每一个训练样本对应的依次逐个代入上述公式，对用户参数矩阵和标签参数矩阵进行M次修正。

也即，在对用户参数矩阵和标签参数矩阵进行第a轮修正的过程中，令x＝1，将第x个训练样本对应的第x-1次修正后的用户参数矩阵和第x-1次修正后的标签参数矩阵代入上述用户参数矩阵的修正公式，计算得到第x次修正后的用户参数矩阵；将第x个训练样本对应的第x-1次修正后的标签参数矩阵和第x次修正后的用户参数矩阵代入上述标签参数矩阵的修正公式，计算得到第x次修正后的标签参数矩阵；令x＝x+1，检测x是否大于M；若否，则重新从所述将第x个训练样本对应的第x-1次修正后的用户参数矩阵和第x-1次修正后的标签参数矩阵代入上述用户参数矩阵的修正公式，计算得到第x次修正后的用户参数矩阵的步骤开始执行；若是，则结束流程，完成第a轮修正。其中，第0次修正后的用户参数矩阵是第a-1轮修正后的用户参数矩阵，第0轮修正后的用户参数矩阵即为初始化的用户参数矩阵，在第a轮修正过程中得到的第M次修正后的用户参数矩阵即为第a轮修正后的用户参数矩阵；第0次修正后的标签参数矩阵是第a-1轮修正后的标签参数矩阵，第0轮修正后的标签参数矩阵即为初始化的标签参数矩阵，在第a轮修正过程中得到的第M次修正后的标签参数矩阵即为第a轮修正后的标签参数矩阵。

步骤208，若输出结果符合预设条件，则将第a轮修正后的用户参数矩阵W_m×k和第a轮修正后的标签参数矩阵H_k×n分别确定为最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n。

当数据拟合模型的输出结果符合预设条件时，停止修正用户参数矩阵W_m×k和标签参数矩阵H_k×n，确定当前的用户参数矩阵W_m×k为最终的用户参数矩阵W_m×k以及当前的标签参数矩阵H_k×n为最终的标签参数矩阵H_k×n。

步骤209，根据最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n。

在反复修正用户参数矩阵和标签参数矩阵后，得到最终的用户参数矩阵和最终的标签参数矩阵，根据最终的用户参数矩阵和最终的标签参数矩阵输出用户对标签的喜好程度。

示例性的，假定拟合训练样本得到最终的用户参数矩阵和最终的标签参数矩阵分别为m＝3，k＝2，n＝5，那么计算得到的用户画像矩阵为：

可选的，本实施例提供的方法还包括如下步骤210。

步骤210，根据获取得到的用户画像矩阵P_m×n和目标物品所具有的标签，计算用户u对目标物品的喜好程度。

可选的，将用户u对目标物品所具有的各个标签的喜好程度进行求和，计算用户u对目标物品的喜好程度。

另外，采用机器学习的方式对用户参数矩阵和标签参数矩阵进行修正，使之拟合训练样本，进而自动获取用户画像，更加准确高效。

另外，基于物以类聚人以群分的思想，两个相似度更高的用户，其用户偏好也应当更为接近，通过在数据拟合模型中增加用户相似度矩阵作为约束条件，而不仅仅单一地依赖于用户行为日志来获取用户画像，并且在修正用户参数矩阵时考虑用户相似度矩阵，体现了用户参数向量与其关联用户的用户参数向量之间的强相关性，从而更加精准地获取用户画像。

可选的，如图4所示，通过如下步骤获取用户相似度矩阵S_m×m。

步骤401，获取m个用户中的每一个用户的社交网络信息。

社交网络信息中包括用户标识、用户的关联用户列表、用户与关联用户之间的相似度。

其中，用户标识是用于识别用户身份的标识号码，也称为用户帐号，是某个体系中相对唯一的编码。用户的关联用户列表中包括用户的各个关联用户，也即与用户具有关联关系的其他用户。用户与关联用户之间的相似度是指用户与关联用户之间的相关性。其中，用户与关联用户之间的相似度可根据如下一项或者多项参数进行确定：用户与关联用户之间的交往频率、用户与关联用户之间是否为好友关系、用户与关联用户之间是否拥有相同的社交圈、用户与关联用户之间是否拥有相同的人口属性、用户与关联用户之间是否存在相同的偏好。等等。

步骤402，根据m个用户的社交网络信息，生成用户相似度矩阵S_m×m。

根据m个用户的社交网络信息，获取两两用户之间的相似度，生成用户相似度矩阵S_m×m。用户相似度矩阵S_m×m中的行和列都表示用户，比如：用户相似度矩阵S_m×m中的第二行第三列表示用户2与用户3之间的相似度。

示例性的，当用户个数为3时，用户相似度矩阵S_m×m为：

其中，第一行中的0.6表示用户1与用户2之间的相似度，0.4表示用户1与用户3之间的相似度，等等。在生成用户相似度矩阵S_m×m时，仅考虑用户与关联用户之间的相似度，而不考虑用户与其自身之间的相似度，因此将用户相似度矩阵S_m×m的对角元素S_uu设为0。

综上所述，通过引入用户相似度矩阵作为数据拟合模型的约束条件，同时也作为修正用户参数矩阵的一个参数，进一步提高了最终获取的用户画像的准确度。

此外，在上述实施例中，仅以用户之间的相似度作为约束条件融入到数据拟合模型中，以体现用户参数向量与其关联用户的用户参数向量之间的强相关性。在其它可能的实施例中，也可根据需要将其它数据作为约束条件融入到数据拟合模型中。例如，将标签之间的相似度作为约束条件融入到数据拟合模型中，构建标签相似度矩阵，标签相似度矩阵中的行和列都表示标签，每个元素表示对应的行和列表示的两个标签之间的相似度，标签之间的相似度可依据标签所表达的意思的相近程度进行确定，例如两个意思越接近的标签之间的相似度越高，以体现标签参数向量与其相似标签的标签参数向量之间的强相关性。因此，上述数据拟合模型是一种比较通用的、自动地学习用户参数向量和标签参数向量从而获取用户对标签的喜好程度的框架，可根据需要加入其它数据到该模型中。

请参考图5，其示出了本发明一个实施例提供的获取用户画像的装置的结构方框图。该装置可通过软件、硬件或者两者的结合实现成为服务器的部分或者全部。该装置可以包括：样本获取模块520、矩阵修正模块540和画像获取模块560。

样本获取模块520，用于根据用户行为日志，获取M个训练样本；其中，训练样本<u，i，j>用于反映用户u对物品i和物品j的喜好程度的差异，M为正整数。

矩阵修正模块540，用于根据样本获取模块520获取的训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n；其中，m表示用户个数，k表示因子个数，n表示标签个数，m为正整数，k为正整数，n为大于1的整数。

画像获取模块560，用于根据矩阵修正模块540得到的最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n；其中，用户画像矩阵P_m×n中第u行第t列的元素P_ut表示用户u对标签t的喜好程度，u为大于等于1且小于等于m的整数，t为大于等于1且小于等于n的整数。

综上所述，本实施例提供的装置，通过根据用户行为日志，获取M个训练样本，根据训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，而后根据最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n；解决了现有技术提供的获取用户画像的方法，所耗费的时间和人力成本较高，且获取的用户画像的准确度较低的问题；通过将用户和标签参数化，并采用数据拟合模型修正用户参数矩阵和标签参数矩阵，使之拟合训练样本，无需人工为标签设定相应的标签权重，根据用户行为日志采用数据拟合方法自动地获取用户画像，达到了节省时间和人力成本，准确高效地获取用户画像的技术效果。

请参考图6，其示出了本发明另一个实施例提供的获取用户画像的装置的结构方框图。该装置可通过软件、硬件或者两者的结合实现成为服务器的部分或者全部。该装置可以包括：样本获取模块610、矩阵修正模块650和画像获取模块660。

样本获取模块610，用于根据用户行为日志，获取M个训练样本；其中，训练样本<u，i，j>用于反映用户u对物品i和物品j的喜好程度的差异，M为正整数。

在一种可能的实现方式中，样本获取模块610包括：行为获取单元611和样本获取单元612。

行为获取单元611，用于根据用户行为日志，获取m个用户中的每一个用户对h个物品中的每一个物品的行为类型，h为大于1的整数。

样本获取单元612，用于根据行为获取单元611获取的每一个用户对每一个物品的行为类型，获取M个训练样本。

可选的，该装置还包括：第二生成模块620。

第二生成模块620，用于生成初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n。其中，初始化的用户参数矩阵W_m×k中的元素为呈正态分布的随机数，初始化的标签参数矩阵H_k×n中的元素为呈正态分布的随机数。

可选的，该装置还包括：信息获取模块630和第一生成模块640。

信息获取模块630，用于获取m个用户中的每一个用户的社交网络信息。

第一生成模块640，用于根据信息获取模块630获取的m个用户的社交网络信息，生成用户相似度矩阵S_m×m。

矩阵修正模块650，用于根据样本获取模块610获取的训练样本，采用数据拟合模型修正第二生成模块620生成的初始化的用户参数矩阵W_m×k和初始化的标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n；其中，m表示用户个数，k表示因子个数，n表示标签个数，m为正整数，k为正整数，n为大于1的整数。

在一种可能的实现方式中，矩阵修正模块650包括：第一计算单元651、第二计算单元652、概率获取单元653、第三计算单元654、矩阵确定单元655和矩阵修正单元656。

第一计算单元651，用于令a＝0，根据第a轮修正后的用户参数矩阵W_m×k和第a轮修正后的标签参数矩阵H_k×n，计算m个用户中的每一个用户对n个标签中的每一个标签的喜好程度；其中，a为大于等于0的整数，第0轮修正后的用户参数矩阵W_m×k为初始化的用户参数矩阵W_m×k，第0轮修正后的标签参数矩阵H_k×n为初始化的标签参数矩阵H_k×n。

第二计算单元652，用于根据m个用户中的每一个用户对n个标签中的每一个标签的喜好程度和物品标签矩阵A_h×n，计算m个用户中的每一个用户对h个物品中的每一个物品的喜好程度；其中，h表示物品个数，h为大于1的整数。

概率获取单元653，用于根据m个用户中的每一个用户对h个物品中的每一个物品的喜好程度，获取每一个训练样本对应的概率；其中，训练样本<u，i，j>对应的概率是指用户u对物品i的喜好程度大于对物品j的喜好程度的概率。

第三计算单元654，用于将M个训练样本分别对应的概率作为数据拟合模型的输入参数，计算数据拟合模型的输出结果。

可选的，数据拟合模型为：

其中，λ_W、λ_H和λ_S是用于防止过拟合的正则化参数，λ_W、λ_H和λ_S为正实数；||·||表示矩阵的二范数，D_s表示M个训练样本的集合，训练样本<u，i，j>对应的概率表示用户u对物品i的喜好程度与用户u对物品j的喜好程度的差值，σ(x)表示逻辑斯蒂函数，N_u表示用户u的关联用户集合，S_uv是用户相似度矩阵S_m×m中第u行第v列的元素，S_uv表示用户u和用户v之间的相似度，W_u表示所述第a轮修正后的用户参数矩阵W_m×k中第u行对应的行向量，W_v表示所述第a轮修正后的用户参数矩阵W_m×k中第v行对应的行向量。

矩阵确定单元655，用于在输出结果符合预设条件时，将第a轮修正后的用户参数矩阵W_m×k和第a轮修正后的标签参数矩阵H_k×n分别确定为最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n。

矩阵修正单元656，用于在输出结果不符合预设条件时，修正第a轮修正后的用户参数矩阵W_m×k得到第a+1轮修正后的用户参数矩阵W_m×k，以及修正第a轮修正后的标签参数矩阵H_k×n得到第a+1轮修正后的标签参数矩阵H_k×n，令a＝a+1，并重新从根据第a轮修正后的用户参数矩阵W_m×k和第a轮修正后的标签参数矩阵H_k×n，计算m个用户中的每一个用户对n个标签中的每一个标签的喜好程度的步骤开始执行。

在一种可能的实现方式中，矩阵修正单元656，具体用于按照下述公式计算第a+1轮修正后的用户参数矩阵W_m×k：

其中，W_u′表示第a+1轮修正后的用户参数矩阵W_m×k中第u行对应的行向量，W_u表示第a轮修正后的用户参数矩阵W_m×k中第u行对应的行向量，表示第a轮修正后的标签参数矩阵H_k×n中第l列对应的列向量的转置向量，l为大于等于1且小于等于n的整数，α为学习效率，α为正实数。

在一种可能的实现方式中，矩阵修正单元656，具体用于按照下述公式计算第a+1轮修正后的标签参数矩阵H_k×n：

其中，H_f′表示第a+1轮修正后的标签参数矩阵H_k×n中第f行对应的行向量，H_f表示第a轮修正后的标签参数矩阵H_k×n中第f行对应的行向量，f为大于等于1且小于等于k的整数，α为学习效率，α为正实数。

画像获取模块660，用于根据矩阵修正模块650得到的最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n；其中，用户画像矩阵P_m×n中第u行第t列的元素P_ut表示用户u对标签t的喜好程度，u为大于等于1且小于等于m的整数，t为大于等于1且小于等于n的整数。

可选的，该装置还包括：喜好计算模块670。

喜好计算模块670，用于根据画像获取模块660获取的用户画像矩阵P_m×n和目标物品所具有的标签，计算用户u对目标物品的喜好程度。

需要说明的是：上述实施例提供的装置在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的获取用户画像的装置与获取用户画像的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

请参考图7，其示出了本发明一个实施例提供的服务器的结构示意图。该服务器用于实施上述实施例中提供的获取用户画像的方法。具体来讲：

所述服务器700包括中央处理单元(CPU)701、包括随机存取存储器(RAM)702和只读存储器(ROM)703的系统存储器704，以及连接系统存储器704和中央处理单元701的系统总线705。所述服务器700还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)706，和用于存储操作系统713、应用程序714和其他程序模块715的大容量存储设备707。

所述基本输入/输出系统706包括有用于显示信息的显示器708和用于用户输入信息的诸如鼠标、键盘之类的输入设备709。其中所述显示器708和输入设备709都通过连接到系统总线705的输入输出控制器710连接到中央处理单元701。所述基本输入/输出系统706还可以包括输入输出控制器710以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器710还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备707通过连接到系统总线705的大容量存储控制器(未示出)连接到中央处理单元701。所述大容量存储设备707及其相关联的计算机可读介质为服务器700提供非易失性存储。也就是说，所述大容量存储设备707可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。

不失一般性，所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术，CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器704和大容量存储设备707可以统称为存储器。

根据本发明的各种实施例，所述服务器700还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器700可以通过连接在所述系统总线705上的网络接口单元711连接到网络712，或者说，也可以使用网络接口单元711来连接到其他类型的网络或远程计算机系统(未示出)。

所述存储器还包括一个或者一个以上的程序，所述一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于执行上述方法的指令。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种获取用户画像的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n，包括：

令a＝0，根据第a轮修正后的用户参数矩阵W_m×k和第a轮修正后的标签参数矩阵H_k×n，计算所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度；其中，所述a为大于等于0的整数，第0轮修正后的用户参数矩阵W_m×k为所述初始化的用户参数矩阵W_m×k，第0轮修正后的标签参数矩阵H_k×n为所述初始化的标签参数矩阵H_k×n；

根据所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度和物品标签矩阵A_h×n，计算所述m个用户中的每一个用户对所述h个物品中的每一个物品的喜好程度；其中，所述h表示物品个数，所述h为大于1的整数；

根据所述m个用户中的每一个用户对所述h个物品中的每一个物品的喜好程度，获取每一个训练样本对应的概率；其中，所述训练样本<u，i，j>对应的概率是指所述用户u对所述物品i的喜好程度大于对所述物品j的喜好程度的概率；

将所述M个训练样本分别对应的概率作为所述数据拟合模型的输入参数，计算所述数据拟合模型的输出结果；

若所述输出结果符合预设条件，则将所述第a轮修正后的用户参数矩阵W_m×k和所述第a轮修正后的标签参数矩阵H_k×n分别确定为所述最终的用户参数矩阵W_m×k和所述最终的标签参数矩阵H_k×n；

若所述输出结果不符合所述预设条件，则修正所述第a轮修正后的用户参数矩阵W_m×k得到第a+1轮修正后的用户参数矩阵W_m×k，以及修正所述第a轮修正后的标签参数矩阵H_k×n得到第a+1轮修正后的标签参数矩阵H_k×n，令a＝a+1，并重新从所述根据第a轮修正后的用户参数矩阵W_m×k和第a轮修正后的标签参数矩阵H_k×n，计算所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度的步骤开始执行。

3.根据权利要求2所述的方法，其特征在于，所述数据拟合模型为：

<mrow> <munder> <mi>&Sigma;</mi> <mrow> <mrow> <mo>(</mo> <mrow> <mi>u</mi> <mo>,</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mo>)</mo> </mrow> <mo>&Element;</mo> <msub> <mi>D</mi> <mi>s</mi> </msub> </mrow> </munder> <mrow> <mo>(</mo> <mrow> <mi>ln</mi> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msub> <mover> <mi>x</mi> <mo>^</mo> </mover> <mrow> <mi>u</mi> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mfrac> <msub> <mi>&lambda;</mi> <mi>W</mi> </msub> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <msub> <mi>W</mi> <mi>u</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mfrac> <msub> <mi>&lambda;</mi> <mi>H</mi> </msub> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <mi>H</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mfrac> <msub> <mi>&lambda;</mi> <mi>S</mi> </msub> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <msub> <mi>W</mi> <mi>u</mi> </msub> <mo>-</mo> <munder> <mi>&Sigma;</mi> <mrow> <mi>v</mi> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>u</mi> </msub> </mrow> </munder> <msub> <mi>S</mi> <mrow> <mi>u</mi> <mi>v</mi> </mrow> </msub> <msub> <mi>W</mi> <mi>v</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow> <mo>)</mo> </mrow> <mo>;</mo> </mrow>

其中，所述λ_W、所述λ_H和所述λ_S是用于防止过拟合的正则化参数，所述λ_W、所述λ_H和所述λ_S为正实数，||·||表示矩阵的二范数，所述D_s表示所述M个训练样本的集合，所述训练样本<u，i，j>对应的概率所述表示所述用户u对所述物品i的喜好程度与所述用户u对所述物品j的喜好程度的差值，σ(x)表示逻辑斯蒂函数，所述N_u表示所述用户u的关联用户集合，所述S_uv是用户相似度矩阵S_m×m中第u行第v列的元素，所述S_uv表示所述用户u和用户v之间的相似度，所述W_u表示所述第a轮修正后的用户参数矩阵W_m×k中第u行对应的行向量，所述W_v表示所述第a轮修正后的用户参数矩阵W_m×k中第v行对应的行向量。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

获取所述m个用户中的每一个用户的社交网络信息；

根据所述m个用户的社交网络信息，生成所述用户相似度矩阵S_m×m。

5.根据权利要求3所述的方法，其特征在于，所述修正所述第a轮修正后的用户参数矩阵W_m×k得到第a+1轮修正后的用户参数矩阵W_m×k，包括：

按照下述公式计算所述第a+1轮修正后的用户参数矩阵W_m×k：

<mrow> <msup> <msub> <mi>W</mi> <mi>u</mi> </msub> <mo>&prime;</mo> </msup> <mo>=</mo> <msub> <mi>W</mi> <mi>u</mi> </msub> <mo>+</mo> <mi>&alpha;</mi> <mrow> <mo>(</mo> <mrow> <mfrac> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>^</mo> </mover> <mrow> <mi>u</mi> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> </msup> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>^</mo> </mover> <mrow> <mi>u</mi> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> </msup> </mrow> </mfrac> <munderover> <mi>&Sigma;</mi> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>H</mi> <mrow> <mo>&CenterDot;</mo> <mi>l</mi> </mrow> <mi>T</mi> </msubsup> <mrow> <mo>(</mo> <mrow> <msub> <mi>A</mi> <mrow> <mi>i</mi> <mi>l</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>A</mi> <mrow> <mi>j</mi> <mi>l</mi> </mrow> </msub> </mrow> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>&lambda;</mi> <mi>W</mi> </msub> <msub> <mi>W</mi> <mi>u</mi> </msub> <mo>-</mo> <msub> <mi>&lambda;</mi> <mi>S</mi> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>W</mi> <mi>u</mi> </msub> <mo>-</mo> <munder> <mi>&Sigma;</mi> <mrow> <mi>v</mi> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>u</mi> </msub> </mrow> </munder> <msub> <mi>S</mi> <mrow> <mi>u</mi> <mi>v</mi> </mrow> </msub> <msub> <mi>W</mi> <mi>v</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&lambda;</mi> <mi>S</mi> </msub> <munder> <mi>&Sigma;</mi> <mrow> <mo>{</mo> <mrow> <mi>v</mi> <mo>|</mo> <mi>u</mi> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>v</mi> </msub> </mrow> <mo>}</mo> </mrow> </munder> <msub> <mi>S</mi> <mrow> <mi>v</mi> <mi>u</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>W</mi> <mi>v</mi> </msub> <mo>-</mo> <munder> <mi>&Sigma;</mi> <mrow> <mi>w</mi> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>v</mi> </msub> </mrow> </munder> <msub> <mi>S</mi> <mrow> <mi>v</mi> <mi>w</mi> </mrow> </msub> <msub> <mi>W</mi> <mi>w</mi> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> </mrow>

其中，所述W_u′表示所述第a+1轮修正后的用户参数矩阵W_m×k中第u行对应的行向量，所述W_u表示所述第a轮修正后的用户参数矩阵W_m×k中第u行对应的行向量，所述表示所述第a轮修正后的标签参数矩阵H_k×n中第l列对应的列向量的转置向量，所述l为大于等于1且小于等于n的整数，所述α为学习效率，所述α为正实数。

6.根据权利要求3所述的方法，其特征在于，所述修正所述第a轮修正后的标签参数矩阵H_k×n得到第a+1轮修正后的标签参数矩阵H_k×n，包括：

按照下述公式计算所述第a+1轮修正后的标签参数矩阵H_k×n：

<mrow> <msup> <msub> <mi>H</mi> <mi>f</mi> </msub> <mo>&prime;</mo> </msup> <mo>=</mo> <msub> <mi>H</mi> <mi>f</mi> </msub> <mo>+</mo> <mi>&alpha;</mi> <mrow> <mo>(</mo> <mfrac> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>^</mo> </mover> <mrow> <mi>u</mi> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> </msup> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>^</mo> </mover> <mrow> <mi>u</mi> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> </msup> </mrow> </mfrac> <msub> <mi>W</mi> <mrow> <mi>u</mi> <mi>f</mi> </mrow> </msub> <mo>(</mo> <mrow> <msub> <mi>A</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>A</mi> <mi>j</mi> </msub> </mrow> <mo>)</mo> <mo>-</mo> <msub> <mi>&lambda;</mi> <mi>H</mi> </msub> <msub> <mi>H</mi> <mi>f</mi> </msub> <mo>)</mo> </mrow> <mo>;</mo> </mrow>

其中，所述H_f′表示所述第a+1轮修正后的标签参数矩阵H_k×n中第f行对应的行向量，所述H_f表示所述第a轮修正后的标签参数矩阵H_k×n中第f行对应的行向量，所述f为大于等于1且小于等于k的整数，所述α为学习效率，所述α为正实数。

7.根据权利要求1至6任一项所述的方法，其特征在于，所述根据用户行为日志，获取M个训练样本，包括：

根据所述用户行为日志，获取所述m个用户中的每一个用户对h个物品中的每一个物品的行为类型，所述h为大于1的整数；

根据每一个用户对每一个物品的行为类型，获取所述M个训练样本。

8.根据权利要求1至6任一项所述的方法，其特征在于，所述根据所述训练样本，采用数据拟合模型修正初始化的用户参数矩阵W_m×k和标签参数矩阵H_k×n，得到最终的用户参数矩阵W_m×k和最终的标签参数矩阵H_k×n之前，还包括：

生成所述初始化的用户参数矩阵W_m×k和所述初始化的标签参数矩阵H_k×n；

其中，所述初始化的用户参数矩阵W_m×k中的元素为呈正态分布的随机数，所述初始化的标签参数矩阵H_k×n中的元素为呈正态分布的随机数。

9.根据权利要求1至6任一项所述的方法，其特征在于，所述根据所述最终的用户参数矩阵W_m×k和所述最终的标签参数矩阵H_k×n，获取用户画像矩阵P_m×n之后，还包括：

根据所述用户画像矩阵P_m×n和目标物品所具有的标签，计算所述用户u对所述目标物品的喜好程度。

10.一种获取用户画像的装置，其特征在于，所述装置包括：

11.根据权利要求10所述的装置，其特征在于，所述矩阵修正模块，包括：

第一计算单元，用于令a＝0，根据第a轮修正后的用户参数矩阵W_m×k和第a轮修正后的标签参数矩阵H_k×n，计算所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度；其中，所述a为大于等于0的整数，第0轮修正后的用户参数矩阵W_m×k为所述初始化的用户参数矩阵W_m×k，第0轮修正后的标签参数矩阵H_k×n为所述初始化的标签参数矩阵H_k×n；

第二计算单元，用于根据所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度和物品标签矩阵A_h×n，计算所述m个用户中的每一个用户对所述h个物品中的每一个物品的喜好程度；其中，所述h表示物品个数，所述h为大于1的整数；

概率获取单元，用于根据所述m个用户中的每一个用户对所述h个物品中的每一个物品的喜好程度，获取每一个训练样本对应的概率；其中，所述训练样本<u，i，j>对应的概率是指所述用户u对所述物品i的喜好程度大于对所述物品j的喜好程度的概率；

第三计算单元，用于将所述M个训练样本分别对应的概率作为所述数据拟合模型的输入参数，计算所述数据拟合模型的输出结果；

矩阵确定单元，用于在所述输出结果符合预设条件时，将所述第a轮修正后的用户参数矩阵W_m×k和所述第a轮修正后的标签参数矩阵H_k×n分别确定为所述最终的用户参数矩阵W_m×k和所述最终的标签参数矩阵H_k×n；

矩阵修正单元，用于在所述输出结果不符合所述预设条件时，修正所述第a轮修正后的用户参数矩阵W_m×k得到第a+1轮修正后的用户参数矩阵W_m×k，以及修正所述第a轮修正后的标签参数矩阵H_k×n得到第a+1轮修正后的标签参数矩阵H_k×n，令a＝a+1，并重新从所述根据第a轮修正后的用户参数矩阵W_m×k和第a轮修正后的标签参数矩阵H_k×n，计算所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度的步骤开始执行。

12.根据权利要求11所述的装置，其特征在于，所述数据拟合模型为：

13.根据权利要求12所述的装置，其特征在于，所述装置还包括：

信息获取模块，用于获取所述m个用户中的每一个用户的社交网络信息；

第一生成模块，用于根据所述m个用户的社交网络信息，生成所述用户相似度矩阵S_m×m。

14.根据权利要求12所述的装置，其特征在于，所述矩阵修正单元，具体用于按照下述公式计算所述第a+1轮修正后的用户参数矩阵W_m×k：

15.根据权利要求12所述的装置，其特征在于，所述矩阵修正单元，具体用于按照下述公式计算所述第a+1轮修正后的标签参数矩阵H_k×n：

16.根据权利要求10至15任一项所述的装置，其特征在于，所述样本获取模块，包括：

行为获取单元，用于根据所述用户行为日志，获取所述m个用户中的每一个用户对h个物品中的每一个物品的行为类型，所述h为大于1的整数；

样本获取单元，用于根据每一个用户对每一个物品的行为类型，获取所述M个训练样本。

17.根据权利要求10至15任一项所述的装置，其特征在于，所述装置还包括：

第二生成模块，用于生成所述初始化的用户参数矩阵W_m×k和所述初始化的标签参数矩阵H_k×n；

18.根据权利要求10至15任一项所述的装置，其特征在于，所述装置还包括：

喜好计算模块，用于根据所述用户画像矩阵P_m×n和目标物品所具有的标签，计算所述用户u对所述目标物品的喜好程度。