CN104679743B

CN104679743B - 一种确定用户的偏好模式的方法及装置

Info

Publication number: CN104679743B
Application number: CN201310611618.7A
Authority: CN
Inventors: 王波
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2013-11-26
Filing date: 2013-11-26
Publication date: 2019-10-29
Anticipated expiration: 2033-11-26
Also published as: CN104679743A

Abstract

本申请提出一种确定用户的偏好模式的方法及装置，包括提取用户的历史行为特征形成用户的历史行为特征向量，利用机器学习模型对用户的历史行为特征向量进行训练以得到一个或多个历史偏好模式；从当前用户的在预设实时时段内的行为信息中提取指定用户的实时行为特征以形成指定用户的实时行为特征向量；基于指定用户的历史行为特征向量和实时行为特征向量，确定指定用户的当前行为特征向量；以及基于指定用户的当前行为特征向量和历史偏好模式，确定指定用户当前的偏好模式。从而实现快速检索出用户当前偏好模式及找出当前偏好模式下的偏好对象。

Description

一种确定用户的偏好模式的方法及装置

技术领域

本申请涉及网络信息处理技术，尤其涉及一种确定用户的偏好模式的方法及装置。

背景技术

随着互联网技术的快速普及，当今社会的信息资源呈爆炸性的增长，信息需求也日益猛增，如何使用户在庞乱繁杂的信息海洋中及时准确地获得所需要的信息，又如何满足不同用户对不同层次的信息需求，已成为互联网信息服务中亟待解决的问题。互联网个性化信息服务无疑是一条很好的解决途径，它可以为用户提供有针对性的信息服务。

互联网个性化信息服务，是能够满足用户个性化信息需求的一种服务，通过对用户信息需求、兴趣爱好、使用习惯和访问历史的收集分析、建立用户模型，并将用户模型应用于网上信息的过滤和排序，从而指导用户浏览、检索信息或向用户主动推送信息。

具体而言，目前现有技术对于实现互联网个性化信息服务主要有两方面，一方面是按用户分类提供互联网个性化信息服务，它是基于对用户的性别、年龄、所在地级别、职业等，将用户划分为多个类目之后，按类目实现个性化信息推送。另一方面是根据用户历史行为提供互联网个性化信息服务，它是基于模式识别的方法，通过用户网络行为日志分析挖掘出用户的喜好实现搜索或推送个性化信息。

然而，上述现有技术所提出的方法都存在一定的缺陷。例如，按用户分类提供互联网个性化信息服务。此种技术是对应用的用户人群的简单划分，从划分比例来看，划分粒度相对较粗，划分到同一类的用户会出现不同的偏好。此时，个性化服务相对就显得在搜索或推送信息时定位就不够准确，也就不能实现符合用户需求的最优搜索或推送信息的排序显示。而另一种根据用户历史行为提供互联网个性化信息服务。尽管相对于第一种方法有所改进，使之更加贴近用户的行为偏好，但是将一个用户完全通过他的历史日志划分到某一类从而影响他未来的偏好，这是很有风险的。因此，此种方法不能实时捕获以及修正用户在当前环境所表现出来的偏好。所以，也不能达到准确的搜索或推送信息的最优排序显示给用户。

发明内容

本申请的主要目的在于提供一种确定用户的偏好模式的方法及装置，以解决现有技术存在的问题，其中：

根据本申请的一个方面的实施例，提出一种确定用户的偏好模式的方法包括：从用户的历史行为信息中提取用户的历史行为特征以形成用户的历史行为特征向量，其中所述历史行为信息为预定历史时段的行为信息；利用机器学习模型对用户的历史行为特征向量进行训练以得到一个或多个历史偏好模式；从当前用户的在预设实时时段内的行为信息中提取指定用户的实时行为特征以形成指定用户的实时行为特征向量；基于指定用户的历史行为特征向量和实时行为特征向量，确定指定用户的当前行为特征向量；以及基于指定用户的当前行为特征向量和历史偏好模式，确定指定用户当前的偏好模式。

根据本申请的另一方面的实施例，提出一种确定用户的偏好模式的装置，包括：第一提取模块，用于从用户的历史行为信息中提取个用户的历史行为特征以形成用户的历史行为特征向量，其中历史行为信息为预定历史时段的行为信息；训练模块，用于利用机器学习模型对用户的历史行为特征向量进行训练以得到一个或多个历史偏好模式；第二提取模块，用于从当前用户的在预设实时时段内的行为信息中提取指定用户的实时行为特征以形成指定用户的实时行为特征向量；第一确定模块，用于基于指定用户的历史行为特征向量和实时行为特征向量，确定指定用户的当前行为特征向量；以及第二确定模块，用于基于指定用户的当前行为特征向量和历史偏好模式，确定指定用户当前的偏好模式。

与现有技术相比，根据本申请的技术方案，利用机器学习模型训练获取的用户的历史行为特征以形成用户的历史行为特征向量，得到一个或多个历史偏好模式。再基于指定用户的历史行为特征向量和实时行为特征向量确定指定用户的当前行为特征向量，结合预先得到的历史偏好模式，确定指定用户当前的偏好模式。从而可以实现线下实时确定出每位用户的当前偏好，也即是说，确定每个用户当前所具有的偏好模式。该方法不仅预测准确率高，且复杂度低。通过预测出的当前偏好模式，以实现向用户展示更精确的对象排序。

另外，通过利用对对象产生了最大点击率的偏好用户群以及所述偏好用户群中用户共同具有的历史偏好模式对对象进行标记，并且对应其进行实时更新，从而实现每次用户线上搜索时，快速检索出用户当前偏好及其最优偏好对象，检测准确率高。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本申请实施例的一种确定用户当前偏好模式的方法流程图；

图2是本申请实施例的计算各个用户的历史行为特征向量的方法流程图；

图3是本申请实施例的确定指定用户针对指定类别的当前偏好模式的方法流程图；

图4是本申请实施例的更新对象的方法流程图；以及

图5本申请实施例的一种确定用户当前偏好模式的装置结构图。

具体实施方式

本申请的主要思想在于，提供一种确定用户的偏好模式的方法及装置，通过LDA模型得到一个或多个历史偏好模式，再通过获取指定用户的实时行为特征及其实时行为特征向量，然后，结合其用户的历史行为特征向量，进而得到指定用户的当前行为特征向量。然后，基于指定用户的当前行为特征向量和历史偏好模式，确定指定用户当前的偏好模式。因此，可以实现实时预测出用户当前偏好模式。从而为后续排序或打下良好的基础。此外，进一步实现在每次用户线上搜索时，线下快速检索出用户当前偏好，并且检测准确率高。

为使本申请的目的、技术方案和优点更加清楚，以下结合附图及具体实施例，对本申请作进一步地详细说明。

根据本申请的实施例，提供了一种确定用户的偏好模式的方法。

参考图1，图1是本申请实施例的确定用户的偏好模式的方法流程图。如图1所示，在步骤S101处，从用户的历史行为信息中，提取用户的历史行为特征，以形成该用户的历史行为特征向量。

根据本申请的实施例，可以对用户进行分组，分别统计不同分组内的用户的历史行为特征向量。对用户的分组可以是基于人口统计学的人群粗划分，例如，采取用户的年龄、性别、所在地区进行分组等。而历史行为信息是预定历史时段的行为信息，其中历史行为信息可以包括以下信息中的一个或多个：用户针对对象的点击信息、收藏信息、交互成功信息。

具体而言，从用户针对预定的某一类别在预定历史时间段内的历史行为信息中，提取历史行为信息所涉及到的操作对象的标题和/或关键属性，并对其标题和/或关键属性进行分词处理，以得到用户历史行为所涉及的分词。用户的历史行为特征即包括用户历史行为所涉及的分词。

将用户在预定历史时间段内所有历史行为进行统计，可以得到用户历史行为所涉及的所有分词及每一分词对应的用户历史行为次数。用户的历史行为涉及的分词及每一分词对应的用户历史行为次数形成用户的历史行为特征向量。

可以理解的，用户的历史行为信息随着时间的变化，对用户行为偏好的影响也是不同的。因此，用户涉及某一分词的历史行为在计入到用户的历史行为特征向量时可以根据该历史行为发生时间的远近进行衰减。在一些实施例中，可以给将根据时间衰减后的用户的各次历史行为所涉及的分词及该分词分别对应用户的行为次数合并统计，形成用户的历史行为特征向量。从而，为预测用户历史偏好模式建立有效基础信息。

下面结合图2描述根据本申请一个实施例的根据各个用户历史行为特征形成各个用户的历史行为特征向量的示例性过程。

参照图2，在步骤S201处，获取每个用户的历史行为信息以提取历史行为信息中包含的对象的标题与关键属性。

具体而言，例如，在一个预定历史时间段360天内，提取每个用户对对象的点击信息、收藏信息、交互成功信息，得到其相关操作对象的标题和/或关键属性。对象的关键属性可以是该对象的类别、名称或主题等基础信息列表。

接下来，在步骤S202处，通过对标题和/或关键属性进行语义分词处理，提取用户的历史行为特征。

具体而言，提取每一个用户在预定历史时间段内的历史行为信息下用户发生点击信息、收藏信息、交互成功信息的对象的标题和/或关键属性。然后，针对这些信息进行语义分词处理。例如，根据词性，保留对象的品牌词、修饰词、所属类型词、型号词等，过滤其余没有意义的词，进而得到了代表用户在过去某一次行为时间点所涉及的分词，即得到历史行为特征。此外，本申请中之所以采用语义分词处理，是为了后续模型处理有一个资源丰富的语料库，从而可以实现对当前用户偏好更准确的预测。

例如，在商品搜索领域，抽取用户K=360天内的用户历史行为信息。这里的用户历史行为则可以包括点击、收藏、购买商品等行为。可以将历史行为信息中的所有行为信息都换算成点击数。例如，将1次购买商品的行为换算成40次点击行为，1次收藏信息转换成20次点击，进而可以统计出每一次用户行为涉及的分词分别对应的点击数，记作w_i=(t_i,num)，i为自然数。其中，t_i为用户行为涉及的第i个分词，num为该分词对应的用户点击数。将一天作为用户行为时间点的一个计算周期，则用户在某一天的历史行为记作h，用户在k天前的历史行为记作h_k，包括用户行为涉及的各个分词及每个分词在这一天对应的点击数，可以表示为：h_k=｛w₁，w₂，w₃，.....w_i｝。

进一步而言，设预定的历史时间段序列的用户行为为H={h₁,h₂,...,h_k}，k为预设的历史时间。

在步骤S203处，基于用户的历史行为特征，计算用户的历史行为特征向量。

用户的历史行为特征向量包括在预设历史时间段内的用户的历史行为涉及的分词及分词分别对应的行为次数。

在本申请实施例中，预设历史时间段为M天，M为自然数。用户的历史行为特征向量记作f_old，

在另外一些实施例中，用户的历史行为特征向量可以给将根据时间衰减后的用户的各次历史行为所涉及的分词及该分词分别对应用户的行为次数获得。

具体而言，在提取用户的历史行为特征之后，优选地，可以利用时间衰减因子组合在预设历史时间段内的用户的历史行为特征，得到用户的历史行为特征向量。例如，可以通过公式（1）来获取历史行为特征向量f_old。

其中r是时间衰减因子的权重，r越大，表示时间越久的行为越不重要，反之越重要。f_old是历史行为特征向量，M是预设时间。h_k代表k天前用户所发生的历史行为特征。

本领域技术人员应理解到，本申请并不限于图2所示的示例性历史行为特征向量的获取过程，而是可以通过本领域已知或未来开发的任意合适方式来获取历史行为特征向量。

返回图1，在步骤S102处，利用机器学习模型对用户的历史行为特征向量进行训练以得到一个或多个历史偏好模式。

用于偏好模式的训练的用户的历史行为可以是所有用户的历史行为特征向量，也可以是某一分组内的用户的历史行为特征向量。在本申请实施例中，所述的用户的历史行为特征向量可以为在某一预定类别下用户的历史行为特征向量。

通过得到在预定类别下的各个用户的历史行为特征向量，将该历史行为特征向量应用机器学习模型训练，确定出该预定类别的历史偏好模式。从而为确定用户当前偏好模式奠定准确丰富的资源基础。

具体而言，例如可以利用非监督机器学习技术中的LDA（Latent DirichletAllocation）模型，对所获取的用户的历史行为特征向量进行训练以得到用户在预定类别下的一个或多个历史偏好模式。例如，用户在服装类别下的偏好可以有欧美风格、复古风格、可爱风格等多个偏好模式。

本领域技术人员应理解到，本申请并不限于利用LDA模型对所获取的特征向量进行训练，而是可以通过本领域已知或未来开发的任意合适方式来进行训练。

进一步而言，在利用LDA模型训练之前，需要构建LDA模型训练时所使用到的语料库，由于语料库为用户真实的历史行为信息，所以，经过LDA模型对语料库的资源训练之后，才会得到真实有效的历史偏好模式。对于建立该语料库，例如，可以利用“Bag of words”模型将对象的标题与关键属性进行语义分词处理的结果组织成一个代表该用户行为信息的文档。进而使每一个预定类别下的所有用户的历史行为信息所构成的文档组成LDA模型训练的语料库。

然后，将已经取得的用户的历史行为特征向量通过LDA模型训练得到用户在指定类别下的每种偏好模式的分布、以及在不同偏好模式下各个历史行为特征的分布概率矩阵。基于此，可以得出在某一指定类别下的用户的历史偏好模式。

此处，由于LDA模型中涉及的算法理论较多，例如，贝叶斯理论、狄利克雷分布（Dirichlet分布）、多项分布、图模型、变分推断、EM算法（Expectation-maximizationalgorithm，期望最大化算法）、Gibbs抽样等，由于本申请主要通过LDA模型训练所采集的历史行为信息，预估出用户历史偏好模式的过程，因此，在本申请实施中采用EM算法预估用户的各种偏好模式的分布、以及在不同偏好模式下各个历史行为特征的分布概率矩阵。从而得到指定类别的多个历史偏好模式。其中，各种偏好模式的分布可以表示用户在各个偏好模式下发生行为的概率，并且各个概率之和为1。

例如，基于所获取的所有用户的历史行为特征向量集合

S={f_old1,f_old2,f_old3,…,f_oldm}，其中，f_old1,f_old2,f_old3,…,f_oldm中的每一个分别都是针对某一个用户的f_old。采用EM算法，求使公式（2）

最大时的用户的各种偏好模式的分布α、在不同偏好模式下各个历史行为特征的分布概率矩阵β。该LDA模型训练过程即是求解最大似然函数的最大化，即求使得l(α、β)最大时的α、β。基于此，可以得到该指定类别的多个历史偏好模式，即可以表示为T=｛z₁,z₂,z₃,…,z_T｝。其中，其表示在α、β确定后，历史行为特征向量f_old的概率。l（α,β）代表LDA模型的最大似然函数，

在步骤S103处，从当前用户的在预设实时时段内的行为信息中提取指定用户的实时行为特征以形成指定用户的实时行为特征向量。

具体而言，所谓预设实时时段，可以是指在一个session（会话或交互）内（假设当用户离开会话后在30分钟内没有任何操作行为，则进行一次session分割）或系统设定的与当前交互时间最近时间段（例如，系统设定时间为每25分钟统计一次用户历史操作行为，而当前用户最后一次操作行为是在28分钟，那么系统就会将距离最后一次操作行为最近的一段时间25分钟内用户操作行为统计出来）。进一步地，在预设实时时段内的指定类别的实时行为信息，可以是获取在距离指定用户当前交互时间最近一段时间内的对对象的点击信息、收藏信息、交互成功信息。对于实时行为特征的提取方式与步骤S101中对于历史行为特征提取方式类似，在此不一一赘述。

进一步而言，根据所提取的指定用户的实时行为特征，以形成指定用户的实时行为特征向量。而实时行为特征向量的计算与步骤S101中历史行为特征向量的计算方法类似，在此不一一赘述。只是实时行为特征向量是根据预设实时时间内的行为特征来计算的。例如，用户在当前操作行为中止时间为30分钟，那么这30分钟为一个会话分割点来获取实时行为信息，进而得到实时行为特征。那么实时行为特征向量也是根据该实时行为特征计算的。

接下来，在步骤S104处，基于指定用户的历史行为特征向量和实时行为特征向量，确定指定用户的当前行为特征向量。

具体而言，在已经确定出该指定用户所浏览或其他操作的对象，并通过该对象所对应的指定类别，既而可以得到该指定用户在指定类别下的历史行为信息，进而获取到其历史行为特征及其形成的历史行为特征向量。由于在步骤S103中已得到实时行为特征向量。因此，可以结合已获取的历史行为特征向量和实时行为特征向量得到指定用户当前行为特征向量。具体可以通过下面的线性公式（3）来说明：

f_new=λ₁c+λ₂f_old （3）

其中，c表示在一个session内或系统设定的最近时间段内的指定用户的实时行为特征向量。λ₁代表可预设用户实时行为权重，λ₂代表可预设用户历史行为权重，f_old表示为历史行为特征向量。基于公式（3）表达到计算出了用户的当前行为特征向量f_new。

可选地，由于用户的最近时间段的行为对用户的偏好模式预测影响更大，因此可以选取λ₁大于λ₂。例如，可以选取λ₁=0.9，λ₂=0.1。本领域技术人员应理解到，本申请并不限于上述λ₁和λ₂的选取，而是可以按照需求选择任意合适的λ₁和λ₂的权重取值。

再接下来，在步骤S105处，基于指定用户的当前行为特征向量和历史偏好模式，确定指定用户当前的偏好模式。

下面结合具体说明参见图3所描述的根据指定用户的当前行为特征向量和所述历史偏好模式，确定指定用户当前的偏好模式的示例性过程。

参照图3，在步骤S301处，计算当前行为特征向量在各个历史偏好模式下的出现概率。

具体而言，根据在不同偏好模式下各个历史行为特征的分布概率矩阵下，计算当前行为特征向量在每个历史偏好模式下的出现概率。即，计算用户在每个历史偏好模式下，针对历史行为（即，点击、收藏、交互成功）中操作的对象时，其对应行为特征所形成的当前行为特征向量出现的概率。例如，在前述的偏好模式的训练中得到T种历史偏好模式，这T种历史偏好模式可以表示为｛z₁、z₂、z₃、。。。。z_T｝，其中，T为自然数。计算当前行为特征向量f_new在每一个历史偏好模式的出现概率。其中，当前行为特征向量f_new在任一历史偏好模式的出现概率的计算可以利用概率均匀分布解析或者全概率等其他算法获得。

接下来，在步骤S302处，将当前行为特征向量的出现概率大于阈值时的历史偏好模式确定为用户当前的偏好模式。

具体而言，将已计算出的当前行为特征向量在各个历史偏好模式下的出现概率与预设的阈值进行比较，并根据其比较的结果分析出用户当前的偏好模式。

进一步而言，例如，设阈值φ=0.2，历史偏好模式包括z₁、z₂、z₃等三种模式，当前行为特征向量f_new在历史偏好模式z₁下的概率为0.3、在z₂下的概率为0.1、在z₃下的概率为0.4，…，那么就可以确定出该用户当前的偏好模式为｛z₁、z₃｝。

本领域技术人员应理解到，本申请并不限于上述阈值的选取，而是可以按照需求选择任意合适的阈值的取值。

至此描述了根据本申请一个实施例确定用户当前的偏好模式的方法。其中，通过对预先获取的用户历史行为特征计算出其历史行为特征向量，既而由LDA模型训练该历史行为特征向量，得到历史偏好模式。另外，通过获取指定用户的实时行为特征及其实时行为特征向量，并结合其用户的历史行为特征向量，进而得到指定用户的当前行为特征向量。并且进一步结合在历史偏好模式下分析当前行为特征向量分布概率，从而实现了实时预测用户当前偏好模式的方案，不仅预测准确率高，且复杂度低，完全适用于线上实时用户群体的预测。

针对上述确定出的用户当前的偏好模式，该当前偏好模式可以在多种场景中应用。例如，根据用户搜索请求对对象进行实时排序时，可以将用户的偏好模式应用于搜索到对象的排序中，还可以将用户的偏好模式应用于预测当前用户的偏好对象等场景中。然而，本申请并不限于上述几种应用场景。

下面参照图4描述根据本申请一实施例利用确定的用户当前行为偏好模式进一步用于基于用户当前的偏好模式对对象进行排序的方法。在本实施例中更具体地描述如何在指定类别中的多个历史偏好模式中确定出用户针对指定类别的历史偏好模式，从而可以确定出每位用户的偏好，实现了更精确对象排序。另外，通过利用对对象产生了最大点击率的偏好用户群和所述偏好用户群中用户共同具有的历史偏好模式对对象进行标记，并且对其进行实时更新，从而实现每次用户线上搜索时，快速检索出用户当前偏好与最优偏好对象，并且检测准确率高。

如图4所示，在步骤S401处，分别计算用户的历史行为特征向量在各历史偏好模式的出现概率。

具体而言，在确定用户的多个历史偏好模式之后，可以进一步确定出用户在各历史偏好模式中历史行为特征向量的概率分布，即，每一个用户历史行为特征向量在历史偏好模式中的概率分布。例如，计算用户U的历史行为特征向量f_old在历史偏好模式T=｛z₁、z₂、z₃。。。。z_T｝的概率分布。

接下来，在步骤S402处，针对每一个用户，将用户的历史行为特征向量的出现概率大于阈值时的历史偏好模式确定为用户的候选偏好模式。

具体而言，在得到每一个用户的历史行为特征向量在每一个历史偏好模式下的出现概率之后，可以根据预设的阈值判断每一个用户的候选偏好模式。

在步骤S403处，将具有相同候选偏好模式的用户归组到相同的偏好用户群。

具体而言，把具有相同候选偏好模式的用户归为同一个偏好用户群，并且一个用户可以分别分在多个偏好用户群。如果一个用户分别在多个用户群，说明该用户具有多种候选偏好模式。

在步骤S404处，通过计算各个偏好用户群对对象的点击率，利用点击率最大时的偏好用户群及该偏好用户群中用户共同具有的历史偏好模式对该对象进行标记。

具体而言，根据历史行为日志，计算各个偏好用户群对每一对象的点击率。从在某一对象上产生了点击的各个偏好用户群中，确定对该对象产生了最大点击率的偏好用户群。确定该偏好用户群中用户共同拥有的历史偏好模式，并将该历史偏好模式对该对象进行标记，也即将该对象分为用户在该历史偏好模式下偏好的对象集合中。

举例而言，例如有三个偏好用户群：欧美风格偏好用户群、复古风格偏好用户群、可爱风格偏好用户群。例如该三个偏好用户群对某一对象A的点击率分别为：0、0.1、0.3。其中，点击率的相应分值通过将点击量进行换算而获得。则将具有最大点击率0.3的可爱风格偏好用户群对应的历史偏好模式即为可爱风格。使用可爱风格这一历史偏好模式对对象A进行标记，从而对象A被标记为：偏好模式：可爱风格；和，点击率：0.3。

在步骤S405处，将用户当前的偏好模式与对象上标记的历史偏好模式进行匹配；当匹配时，执行步骤S406,对该对象的排序特征值进行加分。其中，排序特征是指对被搜索对象的排序产生影响的特征因子，其可以是一个或多个特征，其数值即为排序特征值。点击率也可以视为排序特征中的一个特征。当不匹配时，转向结束。

具体而言，例如，在用户U实时搜索的时候，对用户U确定出是属于少女组的用户，进而确定出了当前偏好模式为服装类别下的欧美和可爱风格之后，与预先确定出的标记对象所在历史偏好模式匹配，如果匹配上，则在最终该对象排序的得分上加上该对象所在历史偏好模式对应的点击率。

进一步地，当用户U对对象发生了点击、收藏、交互成功等行为之后，该用户U属于某一偏好用户群，相当于该类用户群在该对象上的点击率会发生变化，进而影响该对象的排序并且更新偏好用户群在对象上的点击率。

点击率分数越高，则说明该对象越匹配该偏好用户群，则对该对象进行加分，从而使得该对象在被搜索时排序靠前。

与上述确定用户的偏好模式的方法类似，本申请的实施例还提供相应的确定用户的偏好模式的装置。

在步骤S407处，基于排序特征值，对当前搜索对象进行排序。

具体而言，对于利用了用户偏好模式对当前搜索对象的排序进行影响后的对象排序，可以更精确地基于用户当前的偏好模式预估出针对该用户的更加精确且个性化的搜索对象结果的排序展示。

例如，某用户当前的偏好模式为“可爱风格”。当该用户搜索对象为“风衣”时，首先系统会依据数据库中所含有风衣相关对象进行排序特征统计，即，如果用一表达式可以表示为：F=λ₁F₁+λ₂F₂+…+λ_nF_n，其中，F₁，…,F为该对象的排序特征。，λ₁，…，λ_n为相应排序特征的权重。然后，根据当前用户偏好模式为“可爱风格”与标记有“可爱风格”模式的“风衣”相关对象相匹配，取得对应的特征值：点击率，即可以表示为F_n1=λ_n1F_n1，并将该维特征加入原有的排序特征中，从而可以得到最符合当前用户搜索需求的排序展示，即，可以表示为F=λ₁F₁+λ₂F₂+…+λ_nF_n+λ_n1F_n1。然后，基于加分后的排序特征值对被搜索对象进行排序。从而实现了利用用户当前的偏好模式对其搜索的对象的排序产生影响，最终实现更加贴近用户偏好的对象排序展示。

此外，还可以基于用户的当前行为，更新该加分的对象的点击率。

参照图5，图5示出了根据本申请一个实施例的确定用户的偏好模式的装置500的示意性结构框图。

如图5所示，该装置可以包括：第一提取模块501，训练模块502，第二提取模块503，第一确定模块504，第二确定模块505。

第一提取模块501，可以用于从用户的历史行为信息中提取各个用户的历史行为特征以形成用户的历史行为特征向量，其中所述历史行为信息为预定历史时段的行为信息。

根据本申请实施例，该第一提取模块501还可以包括：获取子模块，用于获取每个用户的历史行为信息以提取历史行为信息中包含的对象的标题与关键属性。提取子模块，用于通过对标题和/或关键属性进行语义分词处理，提取用户的历史行为特征；以及计算子模块，用于基于用户的历史行为特征，计算用户的历史行为特征向量。

根据本申请实施例，用户是所有用户或者是针对所有用户进行分组后的分组用户；历史行为信息包括以下信息中的一个或多个：用户针对对象的点击信息、收藏信息、交互成功信息。

训练模块502，可以用于利用机器学习模型对用户的历史行为特征向量进行训练以得到一个或多个历史偏好模式。

第二提取模块503，可以用于从当前用户的预设实时时段内的行为信息中提取指定用户的实时行为特征以形成指定用户的实时行为特征向量。

第一确定模块504，可以用于基于指定用户的历史行为特征向量和实时行为特征向量，确定指定用户的当前行为特征向量。

第二确定模块505，可以用于基于指定用户的当前行为特征向量和历史偏好模式，确定指定用户当前的偏好模式。

根据本申请实施例，该第二确定模块505可以进一步包括：计算子模块，用于基于历史偏好模式，计算当前行为特征向量在历史偏好模式下的出现概率；以及确定子模块，用于将出现概率大于阈值的历史偏好模式确定为指定用户当前的偏好模式。

根据本申请实施例，该装置还可以包括：计算模块、第三确定模块、分群归组模块、标记模块、匹配模块、加分模块以及更新模块。

计算模块，可以用于基于历史偏好模式，分别计算用户的历史行为特征向量在所述历史偏好模式下的出现概率。（未在图中示出）

第三确定模块，可以用于针对每一个用户，将所述出现概率大于阈值的历史偏好模式确定为所述用户的候选偏好模式。（未在图中示出）

分群归组模块，可以用于将具有相同候选偏好模式的用户归组到相同的偏好用户群。（未在图中示出）

标记模块，可以用于通过计算各个偏好用户群对对象的点击率，利用对所述对象产生了最大点击率的偏好用户群以及所述偏好用户群中用户共同具有的历史偏好模式对所述对象进行标记。（未在图中示出）

匹配模块，可以用于将用户当前的偏好模式与所述对象上标记的历史偏好模式进行匹配。（未在图中示出）

加分模块，可以用于当用户当前的偏好模式与所述对象上标记的历史偏好模式相匹配时，对所述对象的排序特征值进行加分，例如加上点击率分数。（未在图中示出）

排序模块，用于基于排序特征值，对当前搜索对象进行排序。（未在图中示出）

以上描述的确定用户的偏好模式的装置与之前描述的确定用户的偏好模式的方法处理是对应的，因此，关于更详细的技术细节，可以参见之前描述的方法。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域内的技术人员应明白，本申请的实施例可提供为方法、设备、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种确定用户的偏好模式的方法，其特征在于，包括：

从用户的历史行为信息中提取用户的历史行为特征以形成用户的历史行为特征向量，其中所述历史行为信息为预定历史时段的行为信息，所述历史行为特征向量基于用户的历史行为涉及的分词及分词对应的用户历史行为次数确定；

利用机器学习模型对用户的历史行为特征向量进行训练以得到一个或多个历史偏好模式；

从当前用户的在预设实时时段内的行为信息中提取指定用户的实时行为特征以形成所述指定用户的实时行为特征向量，其中，所述预设实时时段包括距离指定用户当前交互时间最近的预设时间段，所述实时行为特征向量基于所述当前用户在所述预设实时时段内的行为信息涉及的分词及所述分词在当前用户的在预设实时时段内对应的行为次数确定；

基于所述指定用户的历史行为特征向量和实时行为特征向量，确定所述指定用户的当前行为特征向量；以及

基于所述指定用户的当前行为特征向量和所述历史偏好模式，确定所述指定用户当前的偏好模式。

2.根据权利要求1所述的方法，其特征在于，基于所述指定用户的当前行为特征向量和所述历史偏好模式，确定所述指定用户当前的偏好模式进一步包括：

基于所述历史偏好模式，计算所述当前行为特征向量在所述历史偏好模式下的出现概率；

将所述出现概率大于阈值的历史偏好模式确定为所述指定用户当前的偏好模式。

3.根据权利要求1所述的方法，其特征在于，进一步包括：

基于所述历史偏好模式，分别计算用户的历史行为特征向量在所述历史偏好模式下的出现概率；

针对每一个用户，将所述出现概率大于阈值的历史偏好模式确定为所述用户的候选偏好模式。

4.根据权利要求1所述的方法，其特征在于，所述用户是所有用户或者是针对所有用户进行分组后的分组用户；所述历史行为信息包括以下信息中的一个或多个：用户针对对象的点击信息、收藏信息、交互成功信息。

5.根据权利要求1所述的方法，其特征在于，从用户的历史行为信息中分别提取用户的历史行为特征以形成用户的历史行为特征向量包括：

获取每个用户的历史行为信息以提取历史行为信息中包含的对象的标题与关键属性；

通过对所述标题和/或关键属性进行语义分词处理，提取用户的历史行为特征；以及

基于用户的历史行为特征，计算用户的历史行为特征向量。

6.根据权利要求3所述的方法，其特征在于，进一步包括：

将具有相同候选偏好模式的用户归组到相同的偏好用户群；

通过计算各个偏好用户群对对象的点击率，利用对所述对象产生了最大点击率的偏好用户群以及所述偏好用户群中用户共同具有的历史偏好模式对所述对象进行标记。

7.根据权利要求6所述的方法，其特征在于，进一步包括：

将用户当前的偏好模式与所述对象上标记的历史偏好模式进行匹配；

当所述用户当前的偏好模式与所述对象上标记的历史偏好模式相匹配时，对所述对象的排序特征值进行加分；

基于排序特征值，对当前搜索对象进行排序。

8.一种确定用户的偏好模式的装置，其特征在于，包括：

第一提取模块，用于从用户的历史行为信息中提取用户的历史行为特征以形成用户的历史行为特征向量，其中所述历史行为信息为预定历史时段的行为信息，所述历史行为特征向量基于用户的历史行为涉及的分词及分词对应的用户历史行为次数确定；

训练模块，用于利用机器学习模型对用户的历史行为特征向量进行训练以得到一个或多个历史偏好模式；

第二提取模块，用于从当前用户的在预设实时时段内的行为信息中提取指定用户的实时行为特征以形成所述指定用户的实时行为特征向量，其中，所述预设实时时段包括距离指定用户当前交互时间最近的预设时间段，所述实时行为特征向量基于所述当前用户在所述预设实时时段内的行为信息涉及的分词及所述分词在当前用户的在预设实时时段内对应的行为次数确定；

第一确定模块，用于基于所述指定用户的历史行为特征向量和实时行为特征向量，确定所述指定用户的当前行为特征向量；以及

第二确定模块，用于基于所述指定用户的当前行为特征向量和所述历史偏好模式，确定所述指定用户当前的偏好模式。

9.根据权利要求8所述的装置，其特征在于，所述第二确定模块，进一步包括：

计算子模块，用于基于所述历史偏好模式，计算所述当前行为特征向量在所述历史偏好模式下的出现概率；

确定子模块，用于将所述出现概率大于阈值的历史偏好模式确定为所述指定用户当前的偏好模式。

10.根据权利要求8所述的装置，其特征在于，还包括：

计算模块，用于基于所述历史偏好模式，分别计算用户的历史行为特征向量在所述历史偏好模式下的出现概率；

第三确定模块，用于针对每一个用户，将所述出现概率大于阈值的历史偏好模式确定为所述用户的候选偏好模式。

11.根据权利要求8所述的装置，其特征在于，所述用户是所有用户或者是针对所有用户进行分组后的分组用户；所述历史行为信息包括以下信息中的一个或多个：用户针对对象的点击信息、收藏信息、交互成功信息。

12.根据权利要求8所述的装置，其特征在于，所述第一提取模块包括：

获取子模块，用于获取每个用户的历史行为信息以提取历史行为信息中包含的对象的标题与关键属性；

提取子模块，用于通过对所述标题和/或关键属性进行语义分词处理，提取用户的历史行为特征；以及

计算子模块，用于基于用户的历史行为特征，计算用户的历史行为特征向量。

13.根据权利要求10所述的装置，其特征在于，还包括：

分群归组模块，用于将具有相同候选偏好模式的用户归组到相同的偏好用户群；

标记模块，用于通过计算各个偏好用户群对对象的点击率，利用对所述对象产生了最大点击率的偏好用户群以及所述偏好用户群中用户共同具有的历史偏好模式对所述对象进行标记。

14.根据权利要求13所述的装置，其特征在于，还包括：

匹配模块，用于将用户当前的偏好模式与所述对象上标记的历史偏好模式进行匹配；

加分模块，用于当所述用户当前的偏好模式与所述对象上标记的历史偏好模式相匹配时，对所述对象的排序特征值进行加分；

排序模块，用于基于排序特征值，对当前搜索对象进行排序。