CN110598105A

CN110598105A - 一种基于概率采样的推荐方法、装置、设备及介质

Info

Publication number: CN110598105A
Application number: CN201910853538.XA
Authority: CN
Inventors: 刘鹏
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Shenzhen Yayue Technology Co ltd
Priority date: 2019-09-10
Filing date: 2019-09-10
Publication date: 2019-12-20
Anticipated expiration: 2039-09-10
Also published as: CN110598105B

Abstract

本发明公开了一种基于概率采样的推荐方法、装置、设备及介质，所述方法包括获取行为日志；根据所述行为日志生成初始样本集；根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样以得到所述初始样本对应的训练样本；根据多个初始样本对应的训练样本得到训练样本集；根据所述训练样本集训练推荐模型，基于所述推荐模型得到所述训练样本集中各个对象对应的词嵌入向量；获取候选对象集，基于所述推荐模型得到所述候选对象集中各个候选对象对应的词嵌入向量；根据训练样本集中各个对象的词嵌入向量和候选对象集中各个候选对象对应的词嵌入向量，在所述候选对象集中提取推荐对象集。本发明可以推荐更具有多样性的对象，提升用户粘度。

Description

一种基于概率采样的推荐方法、装置、设备及介质

技术领域

本发明涉及推荐领域，尤其涉及一种基于概率采样的推荐方法、装置、设备及介质。

背景技术

现有技术中的媒体服务平台中经常会涉及到向用户推荐其潜在的感兴趣对象，比如，推荐用户感兴趣的新闻对象、音视频对象或图文对象。推荐依据是用户的历史记录，即根据用户记录为用户推荐与历史记录相似的感兴趣对象。

现有技术中通常通过线下构建训练样本，根据训练样本训练推荐模型，并依赖推荐推荐模型进行线上推荐的方式为用户推荐感兴趣对象。所述线下构建训练样本即根据用户的历史记录，提取用户曾经选择过的对象作为训练样本。这种训练样本的构建方式并未对用户曾经选择过多的对象进行严格的筛选，由此导致训练样本中的数据之间的相关度较高，训练样本的无序性降低，从而影响了训练样本的质量。而训练样本质量不高必然导致基于所述训练样本训练而得的推荐模型的推荐质量难以保证，从而影响推荐的感兴趣对象对用户兴趣的命中率，降低了用户粘度。

发明内容

为了解决现有技术中训练样本质量不高从而导致的推荐精度低的技术问题，本发明实施例提供一种基于概率采样的推荐方法、装置、设备及介质。

一方面，本发明提供了一种基于概率采样的推荐方法，所述方法包括：

获取行为日志；

根据所述行为日志生成初始样本集，所述初始样本集中包括多个初始样本，每个初始样本包括多个对象；

根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样以得到所述初始样本对应的训练样本；根据多个初始样本对应的训练样本得到训练样本集；所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的相关相似度反相关，所述当前对象的相关相似度为所述当前对象与所述初始样本中最近一个被采样的对象之间的相似度；和/或，所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的感兴趣指数正相关；

根据所述训练样本集训练推荐模型，基于所述推荐模型得到所述训练样本集中各个对象对应的词嵌入向量；

获取候选对象集，基于所述推荐模型得到所述候选对象集中各个候选对象对应的词嵌入向量；

根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，在所述候选对象集中提取推荐对象集。

另一方面，本发明提供一种基于概率采样的推荐装置，所述装置包括：

行为日志获取模块，用于获取行为日志；

初始样本集生成模块，用于根据所述行为日志生成初始样本集，所述初始样本集中包括多个初始样本，每个初始样本包括多个对象；

训练样本集生成模块，用于根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样以得到所述初始样本对应的训练样本；根据多个初始样本对应的训练样本得到训练样本集；所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的相关相似度反相关，所述当前对象的相关相似度为所述当前对象与所述初始样本中最近一个被采样的对象之间的相似度；和/或，所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的感兴趣指数正相关；

推荐模型训练模块，用于根据所述训练样本集训练推荐模型，基于所述推荐模型得到所述训练样本集中各个对象对应的词嵌入向量；

候选对象集获取模块，用于获取候选对象集，基于所述推荐模型得到所述候选对象集中各个候选对象对应的词嵌入向量；

推荐对象集提取模块，用于根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，在所述候选对象集中提取推荐对象集。

另一方面，本发明提供了一种基于概率采样的推荐设备，其特征在于，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现一种基于概率采样的推荐方法。

另一方面，本发明提供了一种计算机存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行一种基于概率采样的推荐方法。

本发明提供了一种基于概率采样的推荐方法、装置、设备及介质。本发明可以对初始训练集进行采样，通过采样得到质量更高的训练样本集，训练样本集中各个对象之间的关联度更低并且对于用户兴趣的指向性更高，从而使得基于训练样本集得到的推荐模型更为优越，可以推荐更具有多样性的对象，从而更为精准地满足用户变化的需求，提升用户粘度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本发明提供的基于I2I推荐算法的推荐系统的示意图；

图2是本发明提供的一种基于概率采样的推荐方法的实施环境示意图；

图3是本发明提供的区块链系统的一个可选的结构示意图；

图4是本发明提供的本发明实施例提供的区块结构示意图；

图5是本发明提供的一种基于概率采样的推荐方法的流程图；

图6是本发明提供的初始样本集示意图；

图7是本发明提供的根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样的方法流程图；

图8是本发明提供的另一根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样的方法流程图；

图9是本发明提供的另一根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样的方法流程图；

图10是本发明提供的对于一个初始样本中的对象进行采样的示意图；

图11是本发明提供的根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，在所述候选对象集中提取推荐对象集流程图；

图12是本发明提供的一种基于概率采样的推荐方法构建的推荐系统示意图；

图13是本发明提供的一种基于概率采样的推荐装置框图；

图14是本发明提供的一种用于实现本发明实施例所提供的方法的设备的硬件结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了使本发明实施例公开的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明实施例进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本发明实施例，并不用于限定本发明实施例。

以下，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中，除非另有说明，“多个”的含义是两个或两个以上。为了便于理解本发明实施例所述的技术方案及其产生的技术效果，本发明实施例首先对于相关专业名词进行解释：

Word2Vec：词嵌入向量模型，是一种使用神经网络训练词语分布式表征的算法模型。Word2Vec包括两个训练模型，即CBOW和Skip-Gram，Word2Vec的优化框架有两种，分别为HierarchicalSoftmax以及NegativeSampling。其中Skip-Gram模型根据中心词语预测上下文的词语，CBOW(ContinuousBagof-Words)模型可以根据上下文的词语预测中心词语。CBOW所训练得到的词语分布式表征向量可用于语义相似、向量检索、词句分类等任务。HierarchicalSoftmax使用霍夫曼树来代替神经网络，来提高模型的训练效率，而NegativeSampling则通过采样N个不同的中心词做负例，来加速训练模型。

FastText(快速文本)分类器：是脸书(FaceBook)于2016年开源的一个词向量计算和文本分类工具，它的优点非常明显，在文本分类任务中，FastText能取得和深度网络相媲美的精度，却在训练时间上比深度网络快许多数量级。

UCF(User-basedCollaborativeFiltering，基于用户的协同过滤)：为用户推荐和他兴趣相似的其他用户喜欢的对象。

ICF(Item-basedCollaborativeFiltering，基于对象的协同过滤):计算对象(Item)之间的相似度，推荐与已知Item最相关的其它Item的算法，其可以通过Item-User矩阵计算各个Item之间的相似度，进而实现推荐，其中所述相似度可以基于曼哈顿距离、余弦相似度或欧几里得距离进行度量。

推荐系统的矩阵分解技术(Matrixfactorization techniques for recommendersystems)，对于一个推荐系统，其用户数据可以整理成一个Item-User矩阵。矩阵中每一行代表一个用户，而每一列则代表一个对象。基于推荐系统的矩阵分解技术可以计算每个对象的向量。

现有技术中通常使用I2I推荐算法(Item to Item)，进行相似内容推荐。I2I即基于对象(Item)推荐对象(Item)，其适用于对象推荐的主要场景，常见的I2I推荐方法包括关联推荐和协同过滤等等，其能基于对象寻找相似对象，为最后的对象推荐提供充足的候选集。I2I推荐算法通过计算各个对象与用户的相关度，得到各个对象的质量分，通过按照质量分对对象进行排序得到推荐结果。如图1所示，其示出了基于I2I推荐算法的推荐系统的示意图。所述推荐系统中需要根据用户行为日志获取训练样本以便于训练推荐模型。

已有的基于I2I的推荐算法，由于在关联推荐和协同推荐环节缺少对于训练样本的筛选，导致存在推荐结果非常相似、多样性不足的问题。

为了解决现有技术中训练样本质量不高从而导致的推荐精度低的技术问题，本发明实施例提供一种基于概率采样的推荐方法。所述基于概率采样的推荐方法能够对用户的行为日志进行概率采样从而得到高质量的训练样本，进而提升推荐精度。

首先，本发明实施例公开了在一个可行的实施例中所述一种基于概率采样的推荐方法的实施环境。

参见图2，该实施环境包括：至少一个客户端01和服务器03。

客户端01可以包括：智能手机、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、车载终端等类型的实体设备，也可以包括运行于实体设备中的软体，例如具有对象推荐功能的应用程序等。所述具有对象推荐功能的应用程序可以是新闻类应用程序、视频类应用程序、音频类应用程序、社交类应用程序、图文类应用程序。所述客户端01可以基于浏览器/服务器模式(Browser/Server，B/S)或客户端/服务器模式(Client/Server，C/S)与所述服务器03通信连接。

所述客户端01可以向服务器03反馈用户产生的行为日志，所述服务器03可以基于所述行为日志，通过概率采样生成训练样本，根据所述训练样本训练推荐模型，根据所述推荐模型生成推荐对象，将所述推荐对象发送至所述客户端01。

所述服务器03可以包括一个独立运行的服务器，或者分布式服务器，或者由多个服务器组成的服务器集群。所述分布式服务器具体可以为区块链结构，所述区块链结构中的任意一个节点都可以执行或参与执行所述基于概率采样的推荐方法。

在一个优选的实施例中，所述训练样本也可以存储于区块链系统之中。参见图3，图3是本发明实施例提供的区块链系统的一个可选的结构示意图，多个节点之间形成组成的点对点(P2P，PeerTo Peer)网络，P2P协议是一个运行在传输控制协议(TCP，Transmission Control Protocol)协议之上的应用层协议。在区块链系统中，任何机器如服务器、终端都可以加入而成为节点，节点包括硬件层、中间层、操作系统层和应用层。

参见图3示出的区块链系统中各节点的功能，涉及的功能包括：

1)路由，节点具有的基本功能，用于支持节点之间的通信。

节点除具有路由功能外，还可以具有以下功能：

2)应用，用于部署在区块链中，根据实际业务需求而实现特定业务，记录实现功能相关的数据形成记录数据，在记录数据中携带数字签名以表示任务数据的来源，将记录数据发送到区块链系统中的其他节点，供其他节点在验证记录数据来源以及完整性成功时，将记录数据添加到临时区块中。

3)区块链，包括一系列按照产生的先后时间顺序相互接续的区块(Block)，新区块一旦加入到区块链中就不会再被移除，区块中记录了区块链系统中节点提交的记录数据。

参见图4，图4是本发明实施例提供的区块结构(Block Structure)一个可选的示意图，每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值，各区块通过哈希值连接形成区块链。另外，区块中还可以包括有区块生成时的时间戳等信息。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了相关的信息，用于验证其信息的有效性(防伪)和生成下一个区块。

请参考图5，其示出了一种基于概率采样的推荐方法的流程图，所述方法可以以图2所述的实施环境中的服务器为执行主体实施，所述方法可以包括：

S101.获取行为日志。

在一个优选的实施例中，可以通过设定行为日志的产生时间的方式来获取指定时间区间内产生的行为日志。本发明实施例认为产生时间较新的行为日志对于用户的兴趣有更强的指向性，因此，可以通过获取指定时间区间内产生的行为日志的方式来获取时效性强的行为日志。比如获取最近一周、一个月、三个月内的行为日志。

具体地，所述行为日志可以来自一个或多个应用软件，所述行为日志记录有用户对各种感兴趣对象的选择记录。比如，所述行为日志可以包括新闻的点击日志、音视频的浏览日志、图书的阅读日志等，本发明实施例并不限定行为日志的具体形式和具体内容，行为日志中涉及的对象可以是图文、音视频、短视频等各种媒体文件。

S103.根据所述行为日志生成初始样本集，所述初始样本集中包括多个初始样本，每个初始样本包括多个对象。

所述行为日志记录有用户对对象的选择行为，具体地，每一条行为日志的记录可以包括用户标识、对象标识、选择时间、离开时间、选择次数等属性。比如所述记录可以为“User Id：1124，ItemId：0626，Start：2019-09-01-16：00，Last：2019-09-01-16：30，Time：3”表示用户1124在2019-09-01-16：00选择对象0626进行使用(比如浏览，或者收听)，持续时间为30分钟，并且一共选择了三次。

所述行为日志记录有用户对对象的选择时间，因此可以根据选择时间生成选择序列，如图6所示。具体地，可以使用用户在一个会话(session)内产生的选择序列，作为一个初始样本，而多个会话产生的选择序列构成了初始样本集。每个会话中产生的选择序列的长度可以相同或不同，选择序列中的各条记录对应了初始样本中的多个对象。

在一个优选的实施例认为热点对象可能降低推荐效果，因此，为了保证训练样本的生成效果，可以根据需要降低初始样本集中热点对象的数量。即若一个对象在一个用户产生的行为日志中多次出现，则降低所述对象在所述初始样本集中的数量，以降低对所述对象进行重复采样的概率。

对于不同的应用场景，本发明实施例可以根据实际应用需求和训练样本数量，决定收集的行为日志以及初始样本集的数量。

现有技术中大多直接使用所述初始样本集作为I2I推荐的训练数据源，从而影响了推荐精度，本发明实施例并未直接将初始样本集作为训练数据源，而是对初始样本集进行了采样以得到训练样本集，从而提升了训练数据源的质量。

S105.根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样以得到所述初始样本对应的训练样本；根据多个初始样本对应的训练样本得到训练样本集；所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的相关相似度反相关，所述当前对象的相关相似度为所述当前对象与所述初始样本中最近一个被采样的对象之间的相似度；和/或，所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的感兴趣指数正相关。

在一个可行的实施例中，所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的相关相似度反相关，本发明具体给出根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样的方法，如图7所示，所述方法包括：

S1.以所述初始样本中的第一个对象作为当前对象。

S3.获取所述初始样本中最近一个被采样的对象。

S5.若所述初始样本中最近一个被采样的对象为空，则所述采样命中率为预设值；根据所述采样命中率对当前对象进行采样。

在所述概率采样算法对所述初始样本进行采样伊始，尚未对所述初始样本中的任意对象进行采样，此时所述初始样本中最近一个被采样的对象为空。以所述初始样本为包括10个对象的选择序列为例，由所述概率采样算法按序对所述选择序列进行采样。以所述选择序列中的第一个对象为当前对象时，所述初始样本中最近一个被采样的对象必然为空。若所述第一个对象被采样，则以所述选择序列中的第二个对象为当前对象时，所述初始样本中最近一个被采样的对象为第一个对象；若所述第一个对象未被采样，则以所述选择序列中的第二个对象为当前对象时，所述初始样本中最近一个被采样的对象仍然为空。

所述预设值可以为1或者其它值。当所述预设值为1的时候，表征所述当前对象被采样命中。当所述预设值不为1的时候，表征所述当前对象以预设值对应的概率被采样命中。

S7.若所述初始样本中最近一个被采样的对象非空，则计算当前对象与所述初始样本中最近一个被采样的对象的相似度；根据所述相似度计算所述采样命中率；根据所述采样命中率对所述当前对象进行采样。

在一个可行的实施例中，所述计算当前对象与所述初始样本中最近一个被采样的对象的相似度包括：基于预设的词嵌入向量模型生成当前对象的词向量和初始样本中最近一个被采样的对象的词向量；计算所述当前对象的词向量和初始样本中最近一个被采样的对象的词向量的余弦相似度；以所述余弦相似度作为当前对象与所述初始样本中最近一个被采样的对象的相似度。

在另一个可行的实施例中，所述计算当前对象与所述初始样本中最近一个被采样的对象的相似度包括：使用基于对象的协同过滤算法计算当前对象与所述初始样本中最近一个被采样的对象的相似度。

在另一个可行的实施例中，所述计算当前对象与所述初始样本中最近一个被采样的对象的相似度包括：基于推荐系统的矩阵分解技术获取当前对象的向量和初始样本中最近一个被采样的对象的向量；计算所述当前对象的向量和初始样本中最近一个被采样的对象的向量的余弦相似度；以所述余弦相似度作为当前对象与所述初始样本中最近一个被采样的对象的相似度。

具体地，所述采样命中率可以根据公式来计算，其中S_AB＝similarity(ItemA,ItemB)表征ItemA,ItemB之间的相似度，其中ItemA,ItemB分别表征初始样本中最近一个被采样的对象和当前对象。w,b表示超参数，p_SAB表示当ItemA被采样后，ItemB被采样的概率。如果ItemB与ItemA的相似度越高，则ItemB被采样的概率越小；反之，如果ItemB与ItemA的相似度越低，则ItemB被采样的概率越大。通过采用这种方法，可以降低新生成的训练样本中各个对象的相关程度，在训练样本体量有限的条件下，尽量保证新生成的训练样本中对象的多样性，避免产生推荐结果非常相似的问题。

S9.判断所述当前对象是否为所述初始样本中的最后一个对象。

S11.若否，则以所述初始样本中所述当前对象的下一个对象作为当前对象，返回执行步骤S3。

在一个可行的实施例中，所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的感兴趣指数正相关，本发明具体给出根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样的方法，如图8所示，所述方法包括：

S10.以所述初始样本中的第一个对象作为当前对象。

S30.获取所述当前对象的感兴趣指数。

具体地，所述感兴趣指数表征用户对于所述当前对象的偏好程度，所述感兴趣指数可以指向其对应的行为日志的记录中的选择时间、离开时间和/或选择次数。比如，可以根据所述选择时间和离开时间计算持续时间，持续时间越高，则感兴趣指数越高；还可以获取选择次数，选择次数越多，则感兴趣指数也越高。

S50.根据所述感兴趣指数计算所述当前对象的采样命中率，根据所述采样命中率对所述当前对象进行采样。

具体地，所述采样命中率可以根据公式来计算，其中t_B表征对当前对象ItemB的感兴趣指数，f(t_B)表征基于感兴趣指数确定的概率函数，表征对当前对象的采样命中率。在一个可行的实施例中，f(t_B)＝α·log(t_B)+β，其中α,β表示超参数。如果用户对ItemB的感兴趣指数越高，则ItemB被采样的概率越高；反之，如果用户对ItemB的感兴趣指数越低，则ItemB被采样的概率越低。通过采用这种方法，可以有效筛选出用户更偏好的对象，降低训练噪声的影响，提高线上推荐效果。

S70.判断所述当前对象是否为所述初始样本中的最后一个对象。

S90.若否，则以所述初始样本中所述当前对象的下一个对象作为当前对象，返回执行步骤S30。

在一个更为优选的实施例中，可以将步骤S1-S11和步骤S10-S90进行综合，从相关相似度和感兴趣指数两方面综合计算采样命中率，从而达到降低训练样本中对象的相关度，并提升训练样本中对象对用户偏好的指向性的双重目的。具体地，所述根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样的方法，如图9所示，所述方法包括：

S100.以所述初始样本中的第一个对象作为当前对象。

S300.计算所述当前对象的第一采样命中率和第二采样命中率；所述第一采样命中率与当前对象的相关相似度反相关，所述第二采样命中率与当前对象的感兴趣指数正相关。

具体地，所述第一采样命中率计算方法可以参考步骤S3-S7。若初始样本中最近一个被采样的对象为空，则所述第一采样命中率为预设值，若所述初始样本中最近一个被采样的对象非空，则所述第一采样命中率可以根据公式来计算，其中S_AB＝similarity(ItemA,ItemB)表征ItemA,ItemB之间的相似度，其中ItemA,ItemB分别表征初始样本中最近一个被采样的对象和当前对象。w,b表示超参数，表示当ItemA被采样后，ItemB的第一采样命中率。

具体地，所述第二采样命中率的计算方法可以参考步骤S30-S50。所述第二采样命中率可以根据公式来计算，其中t_B表征对当前对象ItemB的感兴趣指数，f(t_B)表征基于感兴趣指数确定的概率函数，表征对当前对象的第二采样命中率。在一个可行的实施例中，f(t_B)＝α·log(t_B)+β，其中α,β表示超参数。

S500.根据所述第一采样命中率和第二采样命中率计算综合采样命中率，根据所述综合采样命中率对所述当前对象进行采样。

具体地，所述综合命中率可以为其中P_AB表示综合采样命中率，θ,bias为超参数。

S700.判断所述当前对象是否为所述初始样本中的最后一个对象。

S900.若否，则以所述初始样本中所述当前对象的下一个对象作为当前对象，返回执行步骤S300。

如图10所示，其示出对于一个初始样本中的对象进行采样的示意图。在对所述初始样本对象中第一个对象进行采样时，不需要计算相关相似度，即为预设值，在一个可行的实施方式中，可以将其定义为1.如图10所示，在计算ItemA的综合采样命中率P_A时，只需要计算P_AB＝θ·P_tA+bias。如果ItemA没有被采样命中，在对ItemB进行采样时，也采用这种方法。如果ItemA被选取，可以使用公式计算ItemB的综合采样命中率P_AB。如果ItemB没有被选取，可以使用公式计算ItemC的综合采样命中率P_AC。如果ItemC被选取，则可以基于计算ItemD的综合采样命中率。

S107.根据所述训练样本集训练推荐模型，基于所述推荐模型得到所述训练样本集中各个对象对应的词嵌入向量。

具体地，在完成训练样本集构建后，可以基于Word2Vec进行训练，得到训练样本集中各个对象的词嵌入向量。

具体地，本发明实施例中可以使用FaceBook开源的FastText，对具体的训练过程进行说明。FastText是一种常用的Word2Vec训练工具，具有计算速度快等优点，很合适处理大规模训练样本。在训练时，使用训练样本集作为训练的输入数据，根据实际需求，设置词嵌入向量的长度，训练模式可以选取Skip-Gram或CBOW(ContinuousBagof-Words)，计算加速方法可以选取HierarchicalSoftmax或NegativeSampling。在使用FastText完成训练后，训练样本集中每个对象将会有一个指定长度的词嵌入向量。

S109.获取候选对象集，基于所述推荐模型得到所述候选对象集中各个候选对象对应的词嵌入向量。

S1011.根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，在所述候选对象集中提取推荐对象集。

在一个可行的实施例中，所述根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，在所述候选对象集中提取推荐对象集，如图11所示，包括：

S10111.根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，计算所述候选对象集中各个候选对象的相关度得分。

具体地，所述相关度得分可以通过候选对象的词嵌入向量与所述训练样本集中各个对象的词嵌入向量之间的相似度来度量。

在一个可行的实施例中，可以计算候选对象的词嵌入向量与所述训练样本集中各个对象的词嵌入向量之间的相似度，以取值最高的相似度作为相似度得分。

在另一个可行的实施例中，可以计算候选对象的词嵌入向量与所述训练样本集中各个对象的词嵌入向量之间的相似度，按照相似度取值降序的顺序进行相似度排序，选取TopN个相似度的平均值作为相似度得分。

在本发明实施例中，可以使用两个词嵌入向量的余弦相似度作为词嵌入向量之间的相似度。

S10113.按照相似度得分降序的顺序对所述候选对象集中的各个候选对象进行排序以得到候选对象序列。

S10115.根据所述候选对象序列提取推荐对象以得到推荐对象集。

具体地，所述推荐对象可以为一个或多个，可以提取所述候选对象序列中的TopM作为推荐对象。

在其它优选的实施例中，还可以以所述推荐对象集中的推荐对象作为待过滤对象，基于其它因子对所述推荐对象进行过滤以得到过滤后的推荐对象，并将所述过滤后的推荐对象推荐至用户。具体地，所述其它因子可以包括用户画像或者客户端产生的实时特征数据。

本发明实施例公开的一种基于概率采样的推荐方法可以对初始训练集进行采样，通过采样得到质量更高的训练样本集，训练样本集中各个对象之间的关联度更低并且对于用户兴趣的指向性更高，从而使得基于训练样本集得到的推荐模型更为优越，可以推荐更具有多样性的对象，从而更为精准地满足用户变化的需求，提升用户粘度。

本发明实施例公开的一种基于概率采样的推荐方法可以被广泛应用于各种推荐场景，请参考图12，其示出了基于本发明实施例公开的一种基于概率采样的推荐方法构建的推荐系统。所述推荐系统包括推荐服务器与推荐客户端。所述推荐客户端向推荐服务器上报用户的点击日志(行为日志)，推荐服务器根据点击日志得到训练样本以及提取实时特征，将所述训练样本输入预设的模型以得到训练后的推荐模型，将所述实时特征、所述推荐模型、用户画像、上下文环境信息均作为CTR预估模块的输入。CTR即Click-Through-Rate，意指点击通过率，所述CTR预估模块可以基于推荐模型从内容数据库输入的各个对象中提取推荐对象，再基于实时特征、用户画像、上下文环境信息对所述推荐对象进行过滤以得到过滤后的推荐对象，将所述过滤后的推荐对象进一步输入重排打散模块以得到重排打散后的推荐对象，将所述重排打散后的推荐对象推送至推荐客户端。具体地，在一个优选的实施方式中，内容数据库中的对象还可以经过预过滤模块的预过滤处理后再被输入CTR预估模块，所述预过滤处理可以包括基于现有的I2I算法、ICF算法和/或UCF算法从内容数据库中的对象中提取候选对象，以所述候选对象作为CTR预估模块的输入。

所述推荐系统中所述推荐模型基于所述概率采样的推荐方法进行训练而得到，所述推荐系统可以快速地在内容数据库中选出1000-2000个与用户相关的内容，并由重排打散模块输出10-20条内容推荐给用户。所述推荐系统既可以有效提高推荐结果的多样性，避免产生推荐结果非常类似的问题，更好的满足用户兴趣变化的需求，又可以推荐用户更偏好的对象，提高推荐效果。通过线上对比实验，这一推荐系统与已有方案相比，用户点击对象的多样性提升3.2％，用户消费时长提升1.2％。

本发明实施例还公开了一种基于概率采样的推荐装置，如图13所示，包括：

行为日志获取模块201，用于获取行为日志；

初始样本集生成模块203，用于根据所述行为日志生成初始样本集，所述初始样本集中包括多个初始样本，每个初始样本包括多个对象；

训练样本集生成模块205，用于根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样以得到所述初始样本对应的训练样本；根据多个初始样本对应的训练样本得到训练样本集；所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的相关相似度反相关，所述当前对象的相关相似度为所述当前对象与所述初始样本中最近一个被采样的对象之间的相似度；和/或，所述概率采样算法对所述初始样本中的当前对象的采样命中率与当前对象的感兴趣指数正相关；

推荐模型训练模块207，用于根据所述训练样本集训练推荐模型，基于所述推荐模型得到所述训练样本集中各个对象对应的词嵌入向量；

候选对象集获取模块209，用于获取候选对象集，基于所述推荐模型得到所述候选对象集中各个候选对象对应的词嵌入向量；

推荐对象集提取模块2011，用于根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，在所述候选对象集中提取推荐对象集。

具体地，本发明实施例所述一种基于概率采样的推荐装置与方法实施例均基于相同发明构思。详情请参见方法实施例，在此不再赘述。

本发明实施例还提供了一种计算机存储介质，所述计算机存储介质可以存储有多条指令。所述指令可以适于由处理器加载并执行本发明实施例所述的一种基于概率采样的推荐方法，所述方法至少包括下述步骤：

一种基于概率采样的推荐方法，所述方法包括：

获取行为日志；

在一个优选的实施例中，所述根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样，包括：

以所述初始样本中的第一个对象作为当前对象；

获取所述初始样本中最近一个被采样的对象；

若所述初始样本中最近一个被采样的对象为空，则所述采样命中率为预设值；根据所述采样命中率对当前对象进行采样；

若所述初始样本中最近一个被采样的对象非空，则计算当前对象与所述初始样本中最近一个被采样的对象的相似度；根据所述相似度计算所述采样命中率；根据所述采样命中率对所述当前对象进行采样；

判断所述当前对象是否为所述初始样本中的最后一个对象；

若否，则以所述初始样本中所述当前对象的下一个对象作为当前对象，返回执行步骤：获取所述初始样本中最近一个被采样的对象。

以所述初始样本中的第一个对象作为当前对象；

获取所述当前对象的感兴趣指数；

根据所述感兴趣指数计算所述当前对象的采样命中率，根据所述采样命中率对所述当前对象进行采样；

判断所述当前对象是否为所述初始样本中的最后一个对象；

若否，则以所述初始样本中所述当前对象的下一个对象作为当前对象，返回执行步骤：获取所述当前对象的感兴趣指数。

一个优选的实施例中，所述根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样，包括：

以所述初始样本中的第一个对象作为当前对象；

计算所述当前对象的第一采样命中率和第二采样命中率；所述第一采样命中率与当前对象的相关相似度反相关，所述第二采样命中率与当前对象的感兴趣指数正相关；

根据所述第一采样命中率和第二采样命中率计算综合采样命中率，根据所述综合采样命中率对所述当前对象进行采样；

判断所述当前对象是否为所述初始样本中的最后一个对象；

若否，则以所述初始样本中所述当前对象的下一个对象作为当前对象，返回执行步骤：计算所述当前对象的第一采样命中率和第二采样命中率。

一个优选的实施例中，所述根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，在所述候选对象集中提取推荐对象集，包括：

根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，计算所述候选对象集中各个候选对象的相关度得分；

按照相似度得分降序的顺序对所述候选对象集中的各个候选对象进行排序以得到候选对象序列；

根据所述候选对象序列提取推荐对象以得到推荐对象集。

进一步地，图14示出了一种用于实现本发明实施例所提供的方法的设备的硬件结构示意图，所述设备可以参与构成或包含本发明实施例所提供的装置或系统。如图14所示，设备10可以包括一个或多个(图中采用102a、102b，……，102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图14所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，设备10还可包括比图14中所示更多或者更少的组件，或者具有与图14所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到设备10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块，如本发明实施例中所述的方法对应的程序指令/数据存储装置，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的一种基于概率采样的推荐方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括设备10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(NetworkInterfaceController，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(RadioFrequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与设备10(或移动设备)的用户界面进行交互。

需要说明的是：上述本发明实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置和服务器实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于概率采样的推荐方法，其特征在于，所述方法包括：

获取行为日志；

2.根据权利要求1所述的方法，其特征在于，所述根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样，包括：

以所述初始样本中的第一个对象作为当前对象；

获取所述初始样本中最近一个被采样的对象；

判断所述当前对象是否为所述初始样本中的最后一个对象；

3.根据权利要求1所述的方法，其特征在于，所述根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样，包括：

以所述初始样本中的第一个对象作为当前对象；

获取所述当前对象的感兴趣指数；

判断所述当前对象是否为所述初始样本中的最后一个对象；

4.根据权利要求1所述的方法，其特征在于，所述根据概率采样算法对所述初始样本集中的初始样本中的各个对象进行采样，包括：

以所述初始样本中的第一个对象作为当前对象；

判断所述当前对象是否为所述初始样本中的最后一个对象；

5.根据权利要求1所述的方法，其特征在于，所述根据所述训练样本集中各个对象的词嵌入向量和所述候选对象集中各个候选对象对应的词嵌入向量，在所述候选对象集中提取推荐对象集，包括：

根据所述候选对象序列提取推荐对象以得到推荐对象集。

6.根据权利要求5所述的方法，其特征在于，所述计算所述候选对象集中各个候选对象的相关度得分，包括：

计算候选对象的词嵌入向量与所述训练样本集中各个对象的词嵌入向量之间的相似度，以取值最高的相似度作为相似度得分；

或，

计算候选对象的词嵌入向量与所述训练样本集中各个对象的词嵌入向量之间的相似度，按照相似度取值降序的顺序进行相似度排序，选取排序结果的前N个相似度的平均值作为相似度得分。

7.根据权利要求1所述的方法，其特征在于：

基于区块链系统存储所述训练样本集，所述区块链系统包括多个节点，多个节点之间形成点对点网络。

8.一种基于概率采样的推荐装置，其特征在于，所述装置包括：

行为日志获取模块，用于获取行为日志；

9.一种计算机存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如权利要求1-7任一项所述的一种基于概率采样的推荐方法。

10.一种基于概率采样的推荐设备，其特征在于，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行如权利要求1-7任一项所述的一种基于概率采样的推荐方法。