CN112328778A

CN112328778A - 确定用户特征和模型训练的方法、装置、设备及介质

Info

Publication number: CN112328778A
Application number: CN202011209328.6A
Authority: CN
Inventors: 余志伟
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-11-03
Filing date: 2020-11-03
Publication date: 2021-02-05

Abstract

本申请提供了一种确定用户特征和模型训练的方法、装置、设备及介质，该方法采用训练出的BERT模型作为提取用户访问的对象的对象特征的语言模型。在训练BERT模型的过程中，会控制热度不高而用户感兴趣程度较高的对象对应的对象标识被掩码处理的概率增大，从而使得训练出的BERT模型能够更为准确的用户的对象序列中提取出能够表征用户喜好的对象特征。而且，基于训练出的BERT模型可以结合用户访问过的对象序列中各对象标识之间的上下文信息，确定用户访问过的对象对应的对象特征，从而更为准确提取出能够反映用户喜好的对象特征，因此，基于BERT提取出的对象特征能够更为准确的确定出反映用户喜好的用户特征。

Description

确定用户特征和模型训练的方法、装置、设备及介质

技术领域

本申请涉及推荐技术领域，尤其涉及一种确定用户特征和模型训练的方法、装置、设备及介质。

背景技术

在内容推荐场景中，推荐系统可以向用户推荐该用户感兴趣的对象内容。如，网络读书平台可以将新上架的图书推荐给感兴趣的用户；或者是，将用户阅读过的图书推荐给与该用户喜好相似的其他用户。

为了较为合理的向用户推荐对象，推荐系统需要确定出用户的喜好特征。如果无法准确用户的喜好特征，则会导致无法精准的向用户推荐对象，从而影响到推荐对象的访问率。因此，如何较为准确的确定出推荐系统中用户的用户喜好特征是本领域技术人员需要解决的技术问题。

发明内容

有鉴于此，本申请提供了一种确定用户特征和模型训练的方法、装置、设备及介质，以训练得到能够较为准确提取反映用户喜好的对象特征的特征提取模型，并使得确定出的用户特征能够更为准确反映用户喜好。

为实现上述目的，本申请提供了如下技术方案：

一方面，本申请提供了一种确定用户特征的方法，包括：

获得待分析的用户的对象序列，所述用户的对象序列包括：所述用户在对象推荐系统中访问过的多个对象的对象标识；

利用语言模型结合所述用户的对象序列中各对象标识的上下文信息，确定所述用户的对象序列中各对象标识的对象特征向量，其中，所述语言模型为基于变换器的双向编码表征BERT模型，且所述BRET模型为利用多个样本用户对应的已掩码对象序列，并以预测出所述已掩码对象序列中被掩码处理的对象标识为训练目标，训练得到的；所述样本用户的已掩码对象序列为所述样本用户的对象序列中至少一个对象标识被掩码处理后得到的对象序列；

依据所述用户的对象序列中各对象标识的对象特征向量，确定出用于表征所述用户对所述对象推荐系统中对象的感兴趣特征的用户特征向量。

在以上方面的一种可能的实现方式中，所述获得待分析的用户的对象序列，包括：

获得待分析的用户的对象访问信息，所述用户的对象访问信息包括：所述用户在对象推荐系统中访问过的多个对象的对象标识，以及，所述用户访问所述多个对象中各对象的访问行为特征；

按照对象的访问行为特征所表征的感兴趣程度，对所述用户访问过的多个对象的对象标识进行排序，得到所述用户的对象序列。

又一方面本申请还提供了一种模型训练方法，包括：

获得多个样本用户各自的对象序列，其中，样本用户的对象序列包括：所述样本用户在对象推荐系统访问过的多个对象的对象标识；

针对每个样本用户，结合所述样本用户的对象序列中各对象标识的重要性信息，从所述样本用户的对象序列中确定待掩码的至少一个对象标识，并对确定出的至少一个对象标识进行掩码处理，得到已掩码对象序列；

其中，对象标识的重要性信息包括：访问行为特征和访问热度中的一种或者两种，对象标识的访问行为特征为表征所述样本用户对所述对象标识对应的对象的感兴趣程度的行为特征；所述对象标识被确定为待掩码的对象标识的概率与所述对象标识的访问行为特征所表征出的感兴趣程度成正相关，且与所述对象标识对应的访问热度成负相关；

以预测出所述样本用户的已掩码对象序列中被掩码的至少一个对象标识为训练目标，利用所述样本用户的已掩码对象序列训练BERT模型，得到用于提取用户的对象序列中各对象标识的对象特征的BERT模型，其中，对象特征用于表征用户对于对象的感兴趣特征。

又一方面，本申请提供了一种确定用户特征的装置，包括：

用户序列获得单元，用于获得待分析的用户的对象序列，所述用户的对象序列包括：所述用户在对象推荐系统中访问过的多个对象的对象标识；

向量确定单元，利用语言模型结合所述用户的对象序列中各对象标识的上下文信息，确定所述用户的对象序列中各对象标识的对象特征向量，其中，所述语言模型为基于变换器的双向编码表征BERT模型，且所述BRET模型为利用多个样本用户对应的已掩码对象序列，并以预测出所述已掩码对象序列中被掩码处理的对象标识为训练目标，训练得到的；所述样本用户的已掩码对象序列为所述样本用户的对象序列中至少一个对象标识被掩码处理后得到的对象序列；

特征确定单元，依据所述用户的对象序列中各对象标识的对象特征向量，确定出用于表征所述用户对所述对象推荐系统中对象的感兴趣特征的用户特征向量。

又一方面，本申请还提供了一种模型训练装置，包括：

样本序列获得单元，用于获得多个样本用户各自的对象序列，其中，样本用户的对象序列由所述样本用户在对象推荐系统访问过的多个对象的对象标识构成；

掩码处理单元，针对每个样本用户，结合所述样本用户的对象序列中各对象标识的重要性信息，从所述样本用户的对象序列中确定待掩码的至少一个对象标识，并对确定出的至少一个对象标识进行掩码处理，得到已掩码对象序列；

模型训练单元，用于以预测出所述样本用户的已掩码对象序列中被掩码的至少一个对象标识为训练目标，利用所述样本用户的已掩码对象序列训练BERT模型，得到用于提取用户的对象序列中各对象标识的对象特征的BERT模型，其中，对象特征用于表征用户对于对象的感兴趣特征。

又一方面，本申请还提供了一种计算机设备，其特征在于，包括存储器和处理器；

其中，所述存储器用于存储程序；

所述处理器用于执行所述程序，所述程序被执行时，具体用于实现如上任意一项所述的确定用户特征的方法或者如上所述的模型训练方法。

又一方面，本申请提供了一种存储介质，用于存储程序，所述程序被执行时，用于实现如上任意一项所述的确定用户特征的方法或者如上所述的模型训练方法。

由以上内容可知，本申请训练BERT模型作为用于提取用户访问过的对象的对象特征的特征提取模型。在训练BERT模型的过程中，会控制热度不高而用户感兴趣程度较高的对象的对象标识被掩码处理的概率增大。由于热度不高但用户感兴趣较高的对象更能反映出用户的喜好，因此，在训练BERT模型的过程中，将热度不高而用户感兴趣程度较高的对象的对象标识被掩码处理并重点训练，从而使得训练出的BERT模型能够更为准确的用户的对象序列中提取出能够表征用户喜好的对象特征。

而且，由于BERT模型可以结合用户访问过的对象序列中各对象标识之间的上下文信息，确定用户访问过的对象的对象特征，也使得基于BERT模型可以更为准确提取出能够反映用户喜好的对象特征，因此，基于BERT提取出的对象特征能够更为准确的确定出反映用户喜好的用户特征。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1示出了本申请所适用的推荐系统的一种组成架构示意图；

图2示出了本申请确定用户特征的方法一个实施例的流程示意图；

图3示出了本申请获得用户的对象序列的一种实现流程示意图；

图4示出了本申请提供的模型训练方法一个实施例的流程示意图；

图5示出了本申请提供模型训练方法又一个实施例的流程示意图；

图6示出了本申请中BERT模型的一种结构示意图；

图7示出了BERT模型中变换器模型的一种结构示意图；

图8示出了本申请的方案所适用的一种具体应用场景的组成架构示意图；

图9示出了在本申请在一种应用场景下训练BERT模型的一种训练流程示意图；

图10示出了本申请提供的确定用户特征的方法在一种应用场景下的实现流程示意图；

图11示出了本申请提供的模型训练装置一个实施例的组成结构示意图；

图12示出了本申请提供的确定用户特征的装置的一种组成架构示意图；

图13示出了本申请所适用的一种计算机设备的组成结构示意图。

具体实施方式

本申请的方案适用于对象推荐系统，其中，对象推荐系统能够向用户推荐对象的服务平台。其中，对象推荐平台不同，对象推荐平台向用户推荐的对象也会有所不同。如，对象推荐系统推荐的对象可以为图书、文章、视频、应用程序或者图像等等。

例如，对象推荐系统可以为网络读书平台，用户通过该网络读书平台可以阅读该网络读书平台所具有的图书，同时，网络读书平台还可以有针对性的向用户推荐该用户感兴趣的图书。

又如，对象推荐系统可以为多媒体服务平台，该多媒体服务平台可以基于用户终端的媒体访问请求，向用户终端返回多媒体；同时，多媒体服务平台还可以向用户终端发送推荐的多媒体信息。

在本申请实施例中，为了确定对象推荐系统中用户的用户特征，会基于人工智能技术进行模型的机器学习等处理。

其中，人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

在本申请实施例中，至少会基于机器学习进行模型的训练。其中，机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

先对本申请的方案所适用的对象推荐系统进行介绍。

如图1所示，其示出了本申请所适用的一种对象推荐系统的一种组成架构示意图。

由图1可知，对象推荐系统100可以包括至少一台推荐服务器101。

如，该对象推荐系统可以是由单台推荐服务器构成，也可以是由多台推荐服务器构成的集群、分布式系统或者云平台等等。其中，云平台也称为云计算平台，其基于云技术构建出的网络平台。其中，云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。

对象推荐系统的推荐服务器中可存储有可供推荐的多个，如前面提到的图书以及多媒体等等。

当然，对象推荐系统也可以是在推荐服务器之外设置数据库，并在数据库中存储对象推荐系统所需推荐的对象的相关信息。

在本申请中，用户的终端102可以通过网络与对象推荐系统100建立通信连接。终端102可以向对象推荐系统请求访问某个对象。

同时，对象推荐系统也会根据该终端的用户对该对象推荐系统中对象的历史访问信息，确定用户的喜好情况，并有针对性的向用户推荐对象。

在本申请实施例中，对象推荐系统可以先获得能够表征用户喜好特征的用户特征，并基于用户特征进行对象的推荐。

为了实现更为精准的对象推荐，本申请还会结合用户访问过的对象训练基于变换器的双向编码表征(Bidirectional Encoder Representations from Transformers，BERT)模型，以训练得到特征提取模型。该特征提取模型用于提取用户访问过的对象对应的对象标识所具有的对象特征，且通过该特征提取提取模型提取出的对象特征可以反映用户对于对象推荐系统中对象的喜好特征。

为了便于理解，下面先对本申请提供的确定用户特征的方法方法进行介绍。

如图2所示，其示出了本申请一种确定用户特征的方法一个实施例的流程示意图，本实施例的方法可以应用于对象推荐系统的推荐服务器或者计算机设备等。本实施例的方法可以包括：

S201，获得待分析的用户的对象序列。

其中，用户的对象序列包括：该用户在对象推荐系统中访问过的多个对象的对象标识。该用户的对象序列中该多个对象的对象标识具有先后顺序。

其中，对象的对象标识用于在该对象推荐系统中唯一标识该对象。

如，对象的对象标识可以对象的唯一编号。

又如，该对象的对象标识还可以是由对象的标识信息映射出的数字，例如，假设对象推荐系统包括100个可供推荐的对象，那么可以将这100个对象的对象标识依次设置为从1到100的自然数。

S202，利用语言模型结合该用户的对象序列中各对象标识的上下文信息，确定该用户的对象序列中各对象标识的对象特征向量。

在本申请中，该语言模型为BERT模型。

如，将用户的对象序列输入到该BERT模型，该BERT模型可以分别对象序列中各个对象标识之间的上下文关系，并结合上下文关系确定各个对象标识的对象特征向量。

在本申请中，该BRET模型为利用多个样本用户对应的已掩码对象序列，并以预测出该已掩码对象序列中被掩码处理的对象标识为训练目标，训练得到的。样本用户的已掩码对象序列为该样本用户的对象序列中至少一个对象标识被掩码(mask)处理后得到的对象序列。

其中，在获得用于训练BERT模型的多个样本用户的已掩码对象序列，且确定出训练目标之后，训练BERT模型的具体方式可以有多种，本申请对此不加限制。

为了便于区分，在本实施例中将该BERT模型输出的各个对象标识的特征向量称为对象特征向量。

S203，依据该用户的对象序列中各对象标识的对象特征向量，确定出用于表征该用户对该对象推荐系统中对象的感兴趣特征的用户特征向量。

可以理解的是，对象序列由用户访问过的对象对应的对象标识组成，因此，对象序列中各对象标识的对象特征向量可以反映出用户对于该对象推荐系统中对象的感兴趣特征，因此，基于对象序列中各对象标识的对象特征可以确定出用于表征用户感兴趣特征的用户特征向量。

如，在一种可能的实现方式中，确定该用户特征向量的方式可以为：确定对象序列中各对象标识的对象特征向量的平均值，得到平均值向量；将得到的该平均值向量确定为该用户的用户特征向量。即，用户特征向量T可以通过如下公式一计算得到：

其中，T_i为用户的对象序列中第i个对象标识的对象特征向量，i为从1到M的自然数，M为用户的对象序列中对象标识的总个数。

当然，还可以有其他确定该用户特征的方式，对此不加限制。

可以理解的是，在确定出用户的用户特征向量之后，对象推荐系统还可以基于该用户特征向量向该用户推荐至少一个对象。

在一种实现方式中，由于用户的用户特征向量可以反映出用户已访问对象的对象特征，因此，如果不同用户的用户特征向量比较相似，则说明这两个用户喜好的对象也较为相似。基于此可知，本申请还可以确定与该用户的用户特征向量相似的至少一个相似用户，并将相似用户访问的对象推荐给该用户；或者是，将该用户访问过的对象推荐给相似用户。

可见，本申请在获得用户访问过的对象序列之后，会通过训练出的BERT模型结合该用户的对象序列中各个对象的对象标识之间的上下文信息，准确提取出用户的对象序列中各对象标识的对象特征向量，使得对象标识的对象特征向量能够表征出该对象标识与该用户的对象序列中其他对象标识之间的上下文信息，而对象标识之间的上下文信息可以反映出用户喜好的对象之间的特征关系。因此，结合用户访问过的多个对象的对象标识所对应的对象特征向量，来确定该用户特征，可以使得用户特征能够更为准确的反映出用户的喜好特征，从而有利于更为合理推荐对象，提高推荐对象的访问率。

可以理解的是，用户的对象序列中该用户访问过的多个对象的对象标识的排序方式可以根据需要设定。

在一种可能的实现方式中，为了使得BERT模型结合用户的对象序列中不同对象标识之间的上下文信息，能够更为准确提取出该用户的对象序列中各个对象标识所表征的对象特征，本申请还可以结合用户对该多个对象的访问行为特征来对该多个对象的对象标识进行排序。

如图3所示，其示出本申请获得用户的对象序列的一种实现流程示意图，该流程可以包括：

S301，获得用户的对象访问信息。

用户的对象访问信息包括：用户访问过的多个对象的对象标识，以及，用户访问该多个对象中各对象的访问行为特征。

其中，用户访问该对象的访问行为特征可以表示出用户对于该对象的访问行为表现。具体的，该用户对应的对象标识的访问行为特征为用于表征该用户对该对象标识对应的对象的感兴趣程度的行为特征。该用户对应的对象标识的访问行为特征可以从推荐系统中存储的该用户对该对象标识表示的对象的访问数据中获得。

如，用户对应的对象标识的访问行为特征可以包括：用户访问该对象标识对应用户的访问时长和访问次数等信息中的一种或者多种。

可以理解的是，用户对于对象的访问时长越长，则说明该用户对该对象喜好或者说感兴趣的程度越高。例如，用户阅读某本书籍的总时间越长，越能说明用户喜欢该本书籍。类似的，用户对于对象的访问次数越多，用户对该对象的感兴趣程度也越高。

当然，还可以包括用户访问该对象标识对应用户的各个访问时间或者最后访问时间等。如，用户访问对象的最后时间可以表征用户最近对于该对象的关注，也就可以反映出用户最近是否仍喜好该类对象。

S302，按照对象的访问行为特征所表征的感兴趣程度，对该用户访问过的多个对象的对象标识进行排序，得到该用户的对象序列。

可以理解的是，由于对象的访问行为特征可以表征用户对于对象的感兴趣程度，因此，按照对象的访问行为特征所表征的感兴趣程度对用户访问过的对象对应的对象标识进行排序，可以使得用户感兴趣程序相似的对象在对象序列中相邻。

如，可以按照对象的访问行为特征所表征的感兴趣程度从高到低(或者从低到高)的顺序，对该用户访问过的多个对象的对象标识进行排序。

在一种可能的实现方式中，对象的访问行为特征可以包括对象的访问时长。在该种情况下，由于对象的访问时长可以表征用户对于对象的感兴趣程度，因此，按照对象的访问时长从长到短(或者从短到长)，对该用户访问过的多个对象的对象标识进行排序，从而得到该用户的对象序列。

在又一种可能的实现方式中，用户访问对象的访问行为特征包括：用户访问对象的访问时长和访问次数。在该种情况下，可以将该用户访问对象的访问时长作为主排序依据，并将该用户访问对象的访问次数作为次排序依据，对该用户访问过的多个对象的对象标识进行排序。

其中，访问时长为主排序依据也就是优先以访问时长作为对该多个对象的对象标识排序的依据，如果两个或者多个对象的访问时长相同，则可以按照访问这两个或者多个对象的访问次数对这两个或者多个对象的对象标识进行排序。

例如，可以按照对象的访问时长从长到短的顺序对该用户的多个对象的对象标识进行排序。其中，在排序过程中，如果两个或者多个对象的访问时长相同，则按照对象的访问次数从多到少对这两个或者多个对象的对象标识进行排序。

可见，在图3实施例中，可以按照对象的访问行为特征所表征的用户感兴趣程度，对该用户访问过的多个对象的对象标识进行排序，使得感兴趣程度相近的对象在该样本用户的对象序列中相邻，从而更有利于BERT模型结合对象序列中的上下文信息更为准确提取出用户的对象序列中各对象标识所表征的对象特征。

为了使得确定出的用户特征能够更为准确的反映出该用户对于对象推荐系统中对象的喜好特征，本申请在训练BERT模型的过程中，可以结合样本用户访问对象的访问行为特征和对象的访问热度，确定样本用户的对象序列中需要掩码的对象标识。下面结合图4进行详细介绍。

如图4所示，其示出了本申请一种模型训练方法一个实施例的流程示意图，本实施例的方法可以包括应用于对象推荐系统，如推荐对象系统中的服务器或者计算机设备等。

本实施例的方法可以包括：

S401，获得多个样本用户各自的对象序列。

其中，样本用户的对象序列由该样本用户在对象推荐系统访问过的多个对象的对象标识构成。可以理解是，样本用户的对象序列中该多个对象的对象标识具有先后顺序。

在一种可能的实现方式中，可以获得多个样本用户各自的对象访问信息，该样本用户的对象访问信息包括：样本用户访问过的多个对象的对象标识，以及，样本用户访问该多个对象中各对象的访问行为特征。针对每个样本用户，按照对象的访问行为特征所表征的感兴趣程度，对该样本用户访问过的多个对象的对象标识进行排序，得到该样本用户的对象序列。

通过该种实现方式，可以使得在样本用户感兴趣程度相似的对象的对象标识在对象序列中相邻，从而有利于训练BERT模型的过程中，能够更为准确分析对象序列中各对象标识之间的上下文关系，从而能够更准确提取对象序列中对象的对象特征。

可以理解的是，为了便于区分，本申请将模型训练所需的对象序列所属的用户称为样本用户。

样本用户的对象序列的获得方式与前面获得用户的对象序列的具体实现方式相同，具体可以参见前面实施例的相关介绍，在此不再赘述。

S402，针对每个样本用户，结合样本用户的对象序列中各对象标识的重要性信息，从该样本用户的对象序列中确定待掩码的至少一个对象标识，并对确定出的至少一个对象标识进行掩码处理，得到已掩码对象序列。

其中，对象标识的重要性信息包括：访问行为特征和访问热度中的一种或者两种

样本用户访问对象的访问行为特征与前面用户访问对象的访问行为特征所包含的信息相似。如，样本用户对应的对象标识的访问行为特征可以包括：样本用户访问该对象标识对应用户的访问时长和访问次数等信息中的一种或者多种。

其中，对象标识的访问热度为该多个样本用户访问该对象标识对应的对象的热度。多个样本用户访问对象的热度可以通过该多个样本用户中访问过该对象的总人数来表征，其中，访问过对象的人数越多，该对象的热度也就越高。

当然，如果可以统计推荐平台中所有用户对应不同对象的访问热度，那么对象标识的访问热度可以是对象推荐系统中访问过该对象标识对应对象的总用户数量。

其中，针对每个样本用户而言，对于该至少一个对象标识的掩码(mask)处理是指采用设定掩码规则，对该至少一个对象标识部分或者全部进行替换或者更改，以使得掩码处理后的该至少一个对象标识发生变化。

如，可以将该至少一个对象标识中80％替换为掩码标识，10％替换为其他字符，10％保持不变。

可以理解的是，在训练BERT模型的过程中，对样本用户的对象序列中部分对象标识进行mask处理的目的是：通过训练该BERT模型，使得BERT模型预测出该对象序列中被mask的对象标识。在训练BERT模型的过程中，使得训练出的BERT模型学习到对象序列中各个对象标识的上下文信息。

可以理解的是，如果采用随机抽取方式从用户的对象序列中确定待掩码的对象标识，那么很可能会导致访问热度较高的对象对应的对象标识被抽取的概率较高，而访问热度较高的对象实际上是大部分用户都看过的对象，并不能准确反映出用户的喜好特征。同时，采用随机抽取方式，可能会导致用户喜好但是热度较低的对象标识被抽取的概率较低，从而导致抽取作为待掩码的对象标识无法准确反映用户喜好，进而导致后续训练出的BERT模型无法准确从对象序列的各对象标识中抽取出能够反映该用户喜好特征的上下文信息。

而在本申请中，对象标识被确定为待掩码的对象标识的概率与对象标识的访问行为特征所表征出的感兴趣程度成正相关，且与该对象标识对应的访问热度成负相关，因此，可以使得用户喜好程度较高的对象标识被抽取为需要掩码处理的对象标识的概率较高，且访问热度较高的对象被抽取的概率较低，从而有利于后续训练出的BERT模型能够更为准确的从用户的对象序列中提取出用于反映用户喜好特征的上下文信息。

在本申请中为了便于区分，将样本用户的对象序列进行掩码处理之后所得到的对象序列称为已掩码对象序列。

S403，以预测出样本用户的已掩码对象序列中被掩码的至少一个对象标识为训练目标，并利用样本用户对应的已掩码对象序列训练BERT模型，得到用于提取用户的对象序列中各对象标识的对象特征的BERT模型。

其中，训练出的BERT模型从用户的对象序列中提取出的各对象标识对应的对象特征可以用于表征用户对于对象推荐系统中对象的感兴趣特征。

可以理解的是，在采用本申请的方案对该样本用户的对象序列中一些对象标识进行掩码处理之后，训练该BRET模型的具体实现过程可以有多种，本申请不加限制。

如，针对每个样本用户，可以将该样本用户的已掩码对象序列输入到待训练的BERT模型，获得该BERT模型输出的该已掩码对象序列中各个对象标识的对象特征向量；然后，可以基于该样本用户对应的已掩码对象序列中各对象标识的对象特征向量，预测该已掩码对象序列中被掩码处理的至少一个对象标识。

相应的，结合各个样本用户的已掩码对象序列中实际被掩码的至少一个对象标识和预测出的被掩码的至少一个对象标识，来判断该BERT模型的训练是否达到训练要求。如果尚未达到训练要求，则调整BERT模型的内部参数，并重新利用各个样本用户的已掩码对象序列进行BERT模型训练，直至达到训练要求。

由于BERT模型采用了多层变换器(Transformer)对文本(如本申请中的对象系列)进行双向学习，因此，可以更为准确的学习到文本中各词(本申请中的对象标识)之间的上下文关系，从而能够准确抽取出文本中各词的语义特征。

由以上内容可知，本申请在训练BERT模型的过程中，会控制热度不高而用户感兴趣程度较高的对象的对象标识被掩码处理的概率增大。由于热度不高但用户感兴趣较高的对象更能反映出用户的喜好，因此，在训练BERT模型的过程中，将热度不高而用户感兴趣程度较高的对象的对象标识被掩码处理并重点训练，从而可以使得训练出的BERT模型能够更为准确从用户的对象序列中提取出能够表征用户喜好的对象特征，进而有利于依据该BERT提取出的对象特征更为准确的确定用户特征。

为了能够更为清楚的理解本申请特征提取模型的训练方法，下面以一种训练方式为例进行介绍。如图5所示，其示出了本申请一种特征提取模型的训练方法又一个实施例的流程示意图，本实施例的方法可以包括：

S501，获得多个样本用户各自的对象访问信息。

其中，样本用户的对象访问信息包括：用户访问过的多个对象的对象标识，以及，用户访问该多个对象中各对象的访问行为特征。

S502，针对每个样本用户，按照对象的访问行为特征所表征的感兴趣程度，对该样本用户访问过的多个对象的对象标识进行排序，得到该样本用户的对象序列。

本申请是以S501和S502获得样本用户的对象序列的一种方式为例说明，对于通过其他方式获得样本用户的对象序列的具体实现方式也同样适用于本实施例，对此不加限制。

S503，针对每个样本用户，获得该样本用户的对象序列中各对象标识的重要性信息。

其中，对象标识的重要性信息包括：访问行为特征和访问热度中的一种或者两种。

S504，针对每个样本用户，基于该样本用户的对象序列中各对象标识的重要性信息，确定该样本用户的对象序列中各对象标识的权重。

其中，针对每个样本用户，对象标识对应的访问行为特征表征样本用户对该对象标识对应的对象的感兴趣程度越高，对象标识的权重越高；且，对象标识对应的热度越高，对象标识对应的权重越低。

如，针对每个样本用户，对象标识对应的访问行为特征可以为样本用户访问该对象标识对应对象的访问时长，那么访问时长越长，则样本用户的对象序列中该对象标识的权重越高。类似的，对象标识对应的访问行为特征可以为样本用户对该对象标识对应对象的访问次数，如果访问次数越高，该对象标识的权重越高。

在一种可能的实现方式中，如果重要性信息包括对象标识对应的访问时长，那么针对该样本用户的对象序列中任意一个对象标识，可以将该对象标识对应的访问时长与该样本用户的对象序列中所有对象标识对应的总访问时长的比值，确定为该对象标识的权重。样本用户对应的该总访问时长为该样本用户的对象序列中各个对象标识对应的访问时长的总和。

类似的，如果重要性信息包括对象标识对应的访问次数，可以将对象标识的访问次数与样本用户的对象序列中所有对象标识对应的访问次数的总次数的比值，确定为该对象标识的权重。

在又一种可能的实现方式中，针对每个样本用户对应的任意一个对象标识，重要性信息可以包括：对象标识对应的访问时长和对象标识的访问热度。在该种情况下，可以将对象标识对应的访问时长与总基数的比值确定为该样本用户的对象序列中各对象标识的权重。其中，总基数为该样本用户对应的总访问时长与该对象标识对应的热度的导数之间的乘积。总访问时长见上面介绍。可见，对于样本用户的任意一对象标识而言，该对象标识的热度越高，对象标识的权重越低；而对象标识的访问时长越高，则其权重越高。

可以理解的是，以上是以几种情况为例对确定样本用户的对象标识对应权重的过程进行介绍，在实际应用中，只要该样本用户下，访问时长相对较长的对象标识的权重相对较高，且访问热度较高的对象标识的权重相对较低即可，对于具体实现方式本申请不加限制。

S505，针对每个样本用户，基于该样本用户的对象序列中各对象标识的权重，从该样本用户的对象序列中确定待掩码的至少一个对象标识，并对该对象序列中待掩码的至少一个对象标识进行掩码处理，得到样本用户对应的已掩码对象序列。

其中，对象标识的权重越高，对象标识被确定为待掩码的对象标识的可能性越高。

在一种可能的实现方式中，针对每个样本用户，可以依据样本用户的对象序列中各对象标识的权重，采用随机加权算法从该样本用户的对象序列中确定待掩码的至少一个对象标识。

其中，对确定出待掩码的对象标识进行掩码处理的过程可以参见前面实施例的相关介绍，在此不再赘述。

需要说明的是，本实施例是以先确定样本用户的对象序列中各个对象标识的权重，再基于对象标识的权重确定待掩码的对象标识为例说明。但是可以理解的是，对于通过其他实施例提到的其他方式确定待掩码的对象标识也同样适用于本实施例。

S506，针对每个样本用户，将样本用户的已掩码对象序列输入到待训练的BERT模型，获得BERT模型输出的已掩码对象序列中各对象标识对应的对象特征向量。

在将样本用户的已掩码对象序列输入到BERT模型之后，BERT模型会结合已掩码对象序列中各个对象标识之间的上下文关系，提取出该已掩码对象序列中对象标识的语义特征向量。语义特征向量可以表征出对象标识与其他对象标识之间的上下文关系。

如图6所示，其示出了BERT模型的一种组成结构示意图。

其中，BERT为包括双向变换器(Transformer)的特征抽取模型。BERT模型可以获得对象序列中各个对象标识的初始向量表示，如图6中初始向量1到初始向量M，M为对象序列中对象标识的总个数。

其中，对象标识的初始向量可以是由BERT模型中最底层(如图6中最下面一层)的向量编码层对各对象标识进行向量编码得到的。当然，也可能是采用词向量编码方式将对象标识编码为向量后输入到BERT模型。

对象序列中各对象标识的初始向量依次经过各层Transformer最终便可以抽取出各对象标识的新的特征表示，即，对象标识的对象特征向量。

其中，Transformer的组成结构可以如图7所示。其中，Transformer由若干个编码器和解码器堆叠形成。如图7中的左侧部分为编码器，由多头注意力(Multi-HeadAttention)和一个全连接组成，用于将输入的对象序列转化成特征向量。图7中右侧部分是解码器，其输入为编码器的输出以及已经预测的结果，由掩码多头注意力(Masked Multi-Head Attention)、多头注意力(Multi-Head Attention)以及一个全连接网络组成，用于输出最后结果的条件概率。

S507，针对每个样本用户，将已掩码对象序列中各对象标识对应的对象特征向量输入到待训练的全连接网络模型，得到全连接网络模型预测出的已掩码对象序列中各个对象标识的掩码概率。

其中，对象标识的掩码概率为对象标识属于被掩码处理的对象标识的概率。

可以理解的是，通过BERT模型提取出的已掩码对象序列中各对象标识的对象特征向量，而各对象标识的对象特征向量可以反映对象标识之间的上下文关系。在此基础上，本申请需要由全连接申请网络模型依据BERT模型提取出的对象特征向量，来预测对象标识属于被掩码处理后的对象标识的概率。因此，本申请需要不断训练来使得BERT模型提取出的对象特征向量更能够准确反映出对象序列中各个对象之间的关系，同时，使得全连接网络模型输出的概率也更为准确。

例如，在对象序列为按照用户对对象的感兴趣程度对用户访问的多个对象的对象标识排序的情况下，对象序列中相邻对象的感兴趣程度相似，因此，相邻对象的特征也会具有一定的共性。在此基础上，对象序列中相邻对象标识对应的语义特征向量(即对象特征向量)所表征的用户感兴趣特征也相似。相应的，如果对象序列中某些对象标识被掩码，则对象标识与相邻对象标识之间的上下文关系也会改变，因此，需要通过训练BERT模型可以识别出不同对象标识的语义上下文关系等信息，并最终使得全连接网络模型准确确定各个对象标识对应的概率。

为了便于区分，将全连接网络模型输出的各个对象标识属于被掩码的对象标识的概率称为掩码概率。

S508，针对每个样本用户，将样本用户对应的已掩码对象序列中掩码概率大于设定值的至少一个对象标识确定为预测出的被掩码的至少一个对象标识。

其中，该设定值可以根据需要设定，如，设定值可以为百分之六十。

S509，依据多个样本用户各自对应的已掩码对象序列中实际被掩码的至少一个对象标识以及预测出的被掩码的至少一个对象标识，检测BERT模型和全连接网络模型是否达到训练要求，如果是，则训练结束，如果否，调整BERT模型和全连接网络模型的内部参数，并返回执行S506，直至达到训练要求。

其中，BERT模型和全连接网络模型达到训练要求说明，基于该BERT模型和全连接网络可以准确预测出已掩码对象序列中被掩码的对象标识。其中，BERT模型和全连接网络模型所需满足的训练要求可以有多种可能。

如，在一种可能的实现方式中，可以依据设定的损失函数，各样本用户已掩码对象序列中实际被掩码的至少一个对象标识以及预测出的被掩码的至少一个对象标识，计算损失函数值。如果当前损失函数值收敛，则说明符合训练要求；如果损失函数值尚未收敛，则说明仍需要继续训练BERT模型和全连接网络模型。

例如，BERT模型和全连接网络模型达到训练要求可以是基于BERT模型中掩码处理的损失函数(mask token的损失函数)来计算损失函数值，并在损失函数值收敛的情况下，确定BERT模型和全连接网络模型的训练完成。

当然，以上S507到S509仅仅是以训练方式为例说明，在实际应用中，还可以有其他可能情况，对此不加限制。

可以理解的是，在未完成模型训练未达到训练要求的情况下，也可以是返回步骤S505，以重新对样本用户的对象序列进行掩码处理后等操作。

为了便于理解，下面结合一种应用场景对本申请训练模型以及确定用户特征的过程进行介绍。

以对象推荐系统为网络读书平台(例如微信读书平台等)为例。如图8，其示出了本申请的方案所适用的一种应用场景的组成架构示意图。

由图8可以看出，网络读书平台801可以包括至少一台服务器802。

用户终端803可以通过网络与网络读书平台801的服务器建立通信连接。

如图8所示，用户终端803可以向网络读书平台801的服务器发送书籍阅读请求，该书籍阅读请求用于请求访问该网络读书平台中的图书。

网络读书平台的服务器802响应该书籍阅读请求，可以向用户终端返回该图书的数据信息，如该图书的首页面的数据以及章节介绍页面的数据等。

相应的，用户终端803可以基于该图书的数据信息，展现该图书相应的页面，以使得用户可以阅读该图书。

在本申请中，网络读书平台还会记录用户阅读的图书的标识、阅读该图书的时间，阅读该图书的阅读时长以及用户阅读该图书的阅读次数等等信息。

网络读书平台还可以确定出各个用户的用户特征，该用户特征可以表征用户感兴趣的图书类型。同时，网络读书平台可以基于用户特征向用户推荐适合该用户的图书列表，该图书列表可以包括至少一本图书的信息。

结合图8的应用场景，对训练用于提取用户感兴趣的图书的图书特征的BERT模型的过程进行介绍。如图9所示，其示出了本申请训练特征提取模型的方法应用于微信读书这一场景下的流程示意图。本流程可以包括：

S901，获得多个样本用户各自的图书序列样本以及图书序列样本中各图书标识对应的访问热度和访问时长。

其中，每个样本用户对应一个图书序列样本。样本用户的图书序列样本包括：该样本用户阅读过的多本图书的图书标识。

为了便于与后续待分析用户特征的用户的图书序列进行区分，在本实施例中，将训练BERT模型所用的样本用户的图书序列称为图书序列样本。

如，可以根据样本用户在该网络读书平台中阅读过的各图书的阅读时长，对样本用户阅读过的多本图书的图书标识进行排序，得到该样本用户的图书序列样本。

在实际应用中，为了使得各个样本用户的图书序列样本的长度相同，本申请还可以在对样本用户阅读过的多本图书进行排序之后，选择排序处于前设定位的图书对应的图书标识，以构成图书序列样本。其中，设定位可以根据需要设定，如可以选择排序处于前100位的图书。

其中，图书标识对应的访问热度为该图书标识对应的图书的访问热度，如，该多个用户样本中阅读过该图书的总人数，或者是，网络读书平台中阅读过该图书的用户的总数量。

针对每个样本用户，图书标识的访问时长为该样本用户阅读该图书标识对应的图书的总时长。

可以理解的是，为了便于理解，本申请以图书标识的重要性信息为访问热度和访问时长为例说明，但是对于重要性信息包含前面提到的其他信息的情况，也同样适用于本实施例。

S902，针对每个样本用户，依据其图书序列样本中各图书标识对应的访问热度和访问时长，分别确定该图书序列样本中每个图书标识的权重。

其中，图书标识对应的访问时长越长，该图书标识的权重越高；且，图书标识对应的访问热度越高，该图书标识的权重越低。

S903，针对每个样本用户，基于其图书序列样本中各图书标识的权重，从该图书序列样本中选择出待掩码的至少一个图书标识，并对该图书序列样本中待掩码的至少一个图书标识进行掩码处理，得到已掩码图书序列样本。

对于BERT模型而言，该BERT模型可以采用掩码语言模型MLM对图书序列样本中的图书标识进行掩码，但是在本实施例中确定需要掩码的图书标识结合了图书标识的权重，可以使得用户阅读时间较长且热度相对不高的图书标识作为被抽取并被掩码的概率增加。

由于图书标识的权重可以反映出该图书标识对应的图书对于用户喜好特征的影响程度，因此，结合图书标识的权重来对图书序列样本中的图书标识进行掩码处理，有利于使得训练出的BERT模型能够更为准确提取出图书标识中提取出与用户阅读的图书的图书特征。

在确定出需要掩码的至少一个图书标识之后，可以根据需要选择掩码方式。如，BERT模型可以将选择出的该至少一个图书标识中，80％的图书标识用设定的标记替代，而10％的图书标识用随机词替换；剩下的10％的图书标识可以保持不变。

为了便于区分，将样本用户的图书序列样本经过掩码处理后所得的图书序列样本称为已掩码图书序列样本。

S904，针对每个样本用户，将该样本用户的已掩码图书序列样本输入到待训练的BERT模型，获得该BERT模型输出的已掩码图书序列样本中各个图书标识的图书特征向量。

在本实施例中将BERT提取出的图书标识对应的特征向量称为图书特征向量。

S905，针对每个样本用户，将样本用户对应的已掩码图书序列样本中各图书标识的图书特征向量输入到待训练的全连接网络模型，得到全连接网络模型预测的该已掩码图书序列样本中各图书标识对应的掩码概率。

针对每个样本用户，该样本用户的已掩码图书序列中图书标识的掩码概率为该图书标识属于被掩码处理后的图书标识的概率。

在实际应用中，还可以结合该已掩码图书序列样本中各图书标识的对象特征向量，采用负采样方式，并利用该全连接网络模型确定图书标识的掩码概率。

S906，基于该已掩码图书序列样本中各图书标识对应的掩码概率，确定预测出的已掩码图书序列样本中被掩码的至少一个图书标识。

如，可以将对应的掩码概率相对较高的设定数量个图书标识确定为预测出的被掩码的图书标识。

当然，还可以结合掩码语言模型的方式，依据全连接网络输出的各个图书标识对应的掩码概率确定被掩码的图书标识，对此本申请不加限制。

S907，基于该多个样本用户中各样本用户的已掩码图书序列中实际被掩码的至少一个图书标识以及预测出的被掩码的至少一个图书标识，检测该BERT模型是否达到训练要求。

其中，BERT模型符合训练要求，则会结合模型训练。

如，可以基于BERT模型预训练采用的MLM方式对应损失函数，以及各个样本用户的已掩码图书序列中实际掩码的图书标识以及预测出的被掩码的图书标识，计算损失函数值。如损失函数值收敛则完成该BERT模型的训练。

S908，如该BERT模型尚未达到训练要求，则调整该BERT模型和全连接网络模型的内部参数，并返回S902的操作，直至达到训练要求为止。

可以理解的是，在本申请训练BERT模型中仅仅基于掩码语言模型对应的预测掩码掉的图书标识这一任务进行训练(这一部分所依据的对象序列以抽取需要掩码的对象标识均有所变化)，而并未涉及预测下一句(next sentence)的训练任务。由于下一句预测的目的是让BERT模型学习句子(图书标识)之间关系，其本质是为了判断两个句子是否来源于同一主题。而本申请中图书序列样本中各个图书标识的来源相同，都属于同一图书阅读平台中同一用户阅读过的图书，因此无需进行下一句预测在本申请实施例训练BERT模型的过程中，去掉了next sentence的相关训练，可以降低BERT模型训练的复杂度，加速模型训练速度。

本申请在训练BERT模型的过程中，结合图书标识对应的访问时长和热度来设置权重，使得热度较高的图书标识的权重相对较低，而用户访问时长较长的图书标识的权重相对较高，有利于更为合理的从图书序列样本中图书标识能选择被掩码的图书标识，也可以提升BERT模型提取图书标识对应特征的准确性。

可以理解的是，在图8的应用场景中，在训练得到BERT模型之后，本申请可以基于该BERT模型确定网络读书平台中的用户的用户特征，该用户特征可以反映用户感兴趣的图书的图书特征。如，参见图10，其示出了本申请确定用户特征方法应用于图8应用场景中的流程示意图，本实施例可以包括：

S1001，获得网络读书平台中待分析的用户对应的图书序列。

该图书序列包括：用户在该网络读书平台中访问过的多个图书的图书标识，且图书序列中多个图书的图书标识按照用户阅读图书标识对应图书的阅读时长从长到短排序。

本实施例，为了便于理解以按照用户阅读的图书的阅读时长来构建图书序列，但是对于前面获得该用户的对象序列的其他方式也同样适用于本实施例，在此不再赘述。

在一种可选方式中，如果训练BERT模型的图书序列样本中的长度为设定位对应的设定数量，则该图书序列也可以由用户阅读过的前设定位图书的图示标识组成。当然，如果用户阅读过的图书不足设定位，则可以采用设定图像标识或者字符补全。

S1002，将该用户的图书序列输入到训练出的BERT模型中，得到BERT模型输出的该图书序列中各图书标识的图书特征向量。

S1003，将该用户的图书序列中各图书标识的图书特征向量求平均值，并将得到的平均值向量确定为该用户的用户特征向量。

S1004，基于该用户特征向量，确定网络读书平台中与该用户的感兴趣特征相似的至少一个相似用户，并将该相似用户阅读的图书推荐给该用户。

可以理解的是，步骤S1004为可选步骤，在实际应用中确定出用于表征用户喜好的图书的用户特征向量之后，也可以仅仅保存用户特征向量，以便在需要时调用该用户特征向量为该用户进行图书推荐。

可以理解的是，不同用户对阅读的图书以及图书的时长等访问特征，可以反映用户感兴趣的特征，在此基础上，由于确定用户特征向量基于用户阅读的图书序列确定出的，因此，如果不同用户的用户特征向量相似，那么这两个用户感兴趣的图书也会较为相似。在此基础上，本申请可以结合该用户的用户特征向量，确定与该用户喜好相似的相似用户，以便可以实现将相似用户阅读的图书相互推荐。

对应本申请的一种确定用户特征的方法，本申请还提供了一种确定用户特征的装置。

如图11所示，其示出了本申请一种确定用户特征的装置一个实施例的组成结构示意图，本实施例的装置可以包括：

用户序列获得单元1101，用于获得待分析的用户的对象序列，该用户的对象序列包括：该用户在对象推荐系统中访问过的多个对象的对象标识；

向量确定单元1102，利用语言模型结合该用户的对象序列中各对象标识的上下文信息，确定该用户的对象序列中各对象标识的对象特征向量，其中，该语言模型为基于变换器的双向编码表征BERT模型，且该BRET模型为利用多个样本用户对应的已掩码对象序列，并以预测出该已掩码对象序列中被掩码处理的对象标识为训练目标，训练得到的；该样本用户的已掩码对象序列为该样本用户的对象序列中至少一个对象标识被掩码处理后得到的对象序列；

特征确定单元1103，依据该用户的对象序列中各对象标识的对象特征向量，确定出用于表征该用户对该对象推荐系统中对象的感兴趣特征的用户特征向量。

在一种可能的实现方式中，用户序列获得单元，包括：

用户信息获得单元，用于获得待分析的用户的对象访问信息，该用户的对象访问信息包括：该用户在对象推荐系统中访问过的多个对象的对象标识，以及，该用户访问该多个对象中各对象的访问行为特征；

用户序列生成单元，用于按照对象的访问行为特征所表征的感兴趣程度，对该用户访问过的多个对象的对象标识进行排序，得到该用户的对象序列。

在一种可选方式中，用户信息获得单元获得的用户访问过的对象的访问行为特征包括：该用户访问对象的访问时长和访问次数；

用户序列生成单元具体为，用于将该用户访问对象的访问时长作为主排序依据，并将该用户访问对象的访问次数作为次排序依据，对该用户访问过的多个对象的对象标识进行排序，得到该用户的对象序列。

在又一种可能的实现方式中，特征确定单元，包括：

平均确定子单元，用于确定该用户的对象序列中各对象标识的对象特征向量的平均值，得到平均值向量；

向量确定子单元，用于将该平均值向量确定为用于表征该用户对该对象推荐系统中对象的感兴趣特征的用户特征向量。

对应本申请中模型训练方法，本申请还提供了一种模型训练装置。如图12所示，其示出了本申请一种模型训练装置一个实施例的组成结构示意图，本实施例的装置可以包括：

样本序列获得单元1201，用于获得多个样本用户各自的对象序列，其中，样本用户的对象序列由该样本用户在对象推荐系统访问过的多个对象的对象标识构成；

掩码处理单元1202，针对每个样本用户，结合该样本用户的对象序列中各对象标识的重要性信息，从该样本用户的对象序列中确定待掩码的至少一个对象标识，并对确定出的至少一个对象标识进行掩码处理，得到已掩码对象序列；

其中，对象标识的重要性信息包括：访问行为特征和访问热度中的一种或者两种，对象标识的访问行为特征为表征该样本用户对该对象标识对应的对象的感兴趣程度的行为特征；该对象标识被确定为待掩码的对象标识的概率与该对象标识的访问行为特征所表征出的感兴趣程度成正相关，且与该对象标识对应的访问热度成负相关；

模型训练单元1203，用于以预测出该样本用户的已掩码对象序列中被掩码的至少一个对象标识为训练目标，利用该样本用户的已掩码对象序列训练BERT模型，得到用于提取用户的对象序列中各对象标识的对象特征的BERT模型，其中，对象特征用于表征用户对于对象的感兴趣特征。

在一种可能的实现方式中，样本序列获得单元，包括：

样本信息获得单元，用于获得多个样本用户各自的对象访问信息，该样本用户的对象访问信息包括：该样本用户访问过的多个对象的对象标识，以及，该样本用户访问该多个对象中各对象的访问行为特征；

样本序列生成单元，用于针对每个样本用户，按照对象的访问行为特征所表征的感兴趣程度，对该样本用户访问过的多个对象的对象标识进行排序，得到该样本用户的对象序列。

在又一种可能的实现方式中，掩码处理单元，包括：

权重确定子单元，用于基于该样本用户的对象序列中各对象标识的重要性信息，确定该样本用户的对象序列中各对象标识的权重，该对象标识的权重与该对象标识的访问行为特征所表征出的感兴趣程度成正相关，且与该对象标识对应的访问热度成负相关；

掩码处理子单元，用于依据该样本用户的对象序列中各对象标识的权重，采用随机加权算法从该样本用户的对象序列中确定待掩码的至少一个对象标识。

又一方面，本申请还提供了一种计算机设备，该计算机设备可以为对象推荐系统中的推荐服务器，或者是用于数据分析处理的计算设备。当然，也可以是独立于对象推荐系统之外的计算机设备。

如图13，其示出了本申请提供的计算机设备的一种组成架构示意图。在图13中，该计算机设备1300可以包括：处理器1301和存储器1302。

可选的，该计算机设备还可以包括：通信接口1303、输入单元1304和显示器1305和通信总线1306。

其中，处理器1301、存储器1302、通信接口1303、输入单元1304和显示器1305均通过通信总线1306完成相互间的通信。

在本申请实施例中，该处理器1301，可以为中央处理器，特定应用集成电路等。

该处理器可以调用存储器1302中存储的程序，具体的，处理器可以执行以上实施例中对象推荐系统所执行的操作。

存储器1302中用于存放一个或者一个以上程序，程序可以包括程序代码，所述程序代码包括计算机操作指令，在本申请实施例中，该存储器中至少存储有用于实现以上任意一个实施例中的模型训练方法，或者，确定用户特征的方法的程序。

在一种可能的实现方式中，该存储器1302可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、以上所提到的程序等；存储数据区可存储根据计算机设备的使用过程中所创建的数据。

该通信接口1303可以为通信模块的接口。

本申请还可以包括输入单元1304，该输入单元可以包括触摸感应单元、键盘等等。

该显示器1305包括显示面板，如触摸显示面板等。

当然，图13所示的计算机设备结构并不构成对本申请实施例中计算机设备的限定，在实际应用中计算机设备可以包括比图13所示的更多或更少的部件，或者组合某些部件。

另一方面，本申请还提供了一种存储介质，该存储介质中存储有计算机可执行指令，所述计算机可执行指令被处理器加载并执行时，实现如上任意一个实施例中模型训练方法或者确定用户特征的方法。

本申请还提出了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述模型训练方法方面、模型训练装置方面、确定用户特征的方法方面或确定用户特征的装置方面的各种可选实现方式中所提供方法，具体实现过程可以参照上述相应实施例的描述，不做赘述。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。同时，本说明书中各实施例中记载的特征可以相互替换或者组合，使本领域专业技术人员能够实现或使用本申请。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

以上仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种确定用户特征的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获得待分析的用户的对象序列，包括：

3.根据权利要求1所述的方法，其特征在于，所述用户访问过的对象的访问行为特征包括：所述用户访问对象的访问时长和访问次数；

所述按照对象的访问行为特征所表征的感兴趣程度，对所述用户访问过的多个对象的对象标识进行排序，得到所述用户的对象序列，包括：

将所述用户访问对象的访问时长作为主排序依据，并将所述用户访问对象的访问次数作为次排序依据，对所述用户访问过的多个对象的对象标识进行排序，得到所述用户的对象序列。

4.根据权利要求1所述的方法，其特征在于，所述依据所述用户的对象序列中各对象标识的对象特征向量，确定出用于表征所述用户对所述对象推荐系统中对象的感兴趣特征的用户特征向量，包括：

确定所述用户的对象序列中各对象标识的对象特征向量的平均值，得到平均值向量；

将所述平均值向量确定为用于表征所述用户对所述对象推荐系统中对象的感兴趣特征的用户特征向量。

5.一种模型训练方法，其特征在于，包括：

6.根据权利要求5所述的方法，其特征在于，所述获得多个样本用户各自的对象序列，包括：

获得多个样本用户各自的对象访问信息，所述样本用户的对象访问信息包括：所述样本用户访问过的多个对象的对象标识，以及，所述样本用户访问所述多个对象中各对象的访问行为特征；

针对每个样本用户，按照对象的访问行为特征所表征的感兴趣程度，对所述样本用户访问过的多个对象的对象标识进行排序，得到所述样本用户的对象序列。

7.根据权利要求5所述的方法，其特征在于，所述结合所述样本用户的对象序列中各对象标识的重要性信息，从所述样本用户的对象序列中确定待掩码的至少一个对象标识，包括：

基于所述样本用户的对象序列中各对象标识的重要性信息，确定所述样本用户的对象序列中各对象标识的权重，所述对象标识的权重与所述对象标识的访问行为特征所表征出的感兴趣程度成正相关，且与所述对象标识对应的访问热度成负相关；

依据所述样本用户的对象序列中各对象标识的权重，采用随机加权算法从所述样本用户的对象序列中确定待掩码的至少一个对象标识。

8.一种确定用户特征的装置，其特征在于，包括：

9.一种模型训练装置，其特征在于，包括：

10.一种计算机设备，其特征在于，包括存储器和处理器；

其中，所述存储器用于存储程序；

所述处理器用于执行所述程序，所述程序被执行时，具体用于实现如权利要求1至4任意一项所述的确定用户特征的方法或者如权利要求5至7任一项所述的模型训练方法。

11.一种存储介质，其特征在于，用于存储程序，所述程序被执行时，用于实现如权利要求1至4任意一项所述的确定用户特征的方法或者如权利要求5至7任一项所述的模型训练方法。