CN109960761A

CN109960761A - 信息推荐方法、装置、设备及计算机可读存储介质

Info

Publication number: CN109960761A
Application number: CN201910246269.0A
Authority: CN
Inventors: 李天浩; 崔瑞
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Shenzhen Yayue Technology Co ltd
Priority date: 2019-03-28
Filing date: 2019-03-28
Publication date: 2019-07-02
Anticipated expiration: 2039-03-28
Also published as: CN109960761B

Abstract

本申请实施例公开了一种信息推荐方法、装置、设备及计算机可读存储介质，其中方法包括：获取用户的N个历史行为信息；其中，所述历史行为信息为用户浏览过的信息，所述N个历史行为信息在时间上呈连续分布；将所述N个历史行为信息按照会话机制进行聚合，得到多个会话；多个会话在时间上连续分布；对所述多个会话分别进行特征提取，所述提取的特征为时序序列特征集合；将提取到的特征输入训练好的预设机器学习模型，得到推荐结果。实施本申请，可以提高推荐结果的准确率。

Description

信息推荐方法、装置、设备及计算机可读存储介质

技术领域

本申请涉及数据挖掘推荐技术领域，尤其涉及一种信息推荐方法、装置、设备及计算机可读存储介质。

背景技术

随着网络的快速发展，如何在庞大的信息库中准确找到自己需要的信息是本领域技术人员的研究热点。

现有技术中，传统的推荐技术主要包括以下两大类推荐方法：第一类为基于内容的推荐方法；第二类为基于协同过滤的推荐方法。具体来说，基于内容的推荐方法是指，根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐物品；基于协同过滤的推荐方法是指，基于"跟你喜好相似的人喜欢的物品你也很有可能喜欢"这一假设，找出用户的最近邻居，从而根据最近邻居的喜好做出未知项的评分预测。以最近邻的方式为例，该方式通过寻找其他与自己行为最相近的用户，通过这些用户曾经消费过或看过的物品来给自己推荐。

总的来说，从推荐方法的实质来看，现有的这两大类推荐方法更多关注的是物品间相互独立的关系，例如，在向用户推荐物品时，只单一考虑了待推荐物品与最后一次用户喜欢或关注过的物品的相似性，容易导致推荐结果的准确率不高。

发明内容

本申请实施例提供一种信息推荐方法、相关装置、设备及计算机可读存储介质，可以解决传统的推荐方式中推荐结果的准确率不高的问题，提高推荐结果的准确率。

第一方面，本申请实施例提供了一种信息推荐方法，该方法包括：

获取用户的N个历史行为信息；其中，所述历史行为信息为用户浏览过的信息，所述N个历史行为信息在时间上呈连续分布；

将所述N个历史行为信息按照会话机制进行聚合，得到多个会话；；所述多个会话在时间上连续分布；

对所述多个会话分别进行特征提取，所述提取的特征为时序序列特征集合；

将提取到的特征输入训练好的预设机器学习模型，得到推荐结果。

通过实施本申请实施例，设备基于用户连续的N个历史行为信息以及训练好的预设机器学习模型来向用户推荐物品，而不是只单一的考虑了N个历史行为信息中的某一个历史行为信息，可以解决传统的推荐方式中推荐结果的准确率不高的问题，提高推荐结果的准确率。

在其中一个可能的实现方式中，在训练所述预设机器学习模型时，包括：

获取第一会话内第一信息的人均浏览量；其中，所述第一会话为所述多个会话中在时间维度上最近的一个会话；

将所述第一会话内第一信息的人均浏览量设置为所述预设机器学习模型的输入特征的数量；

根据所述多个会话内的历史行为信息对所述预设机器学习模型进行训练，得到所述训练好的预设机器学习模型。

通过实施本申请实施例，将预设机器学习模型的输入特征的数量等于最近的会话内第一信息的人均浏览量，可以提高预设机器学习模型的泛化能力，进而提高推荐结果的准确率。

在其中一个可能的实现方式中，所述将提取到的特征输入训练好的预设机器学习模型，得到推荐结果，包括：

根据所述预设机器学习模型确定用户浏览信息库中每个信息的第一评分，并将符合预设规则的第一评分对应的信息推荐给用户。

在其中一个可能的实现方式中，所述根据所述预设机器学习模型确定用户浏览信息库中每个信息的第一评分之后，所述并将符合预设规则的第一评分对应的信息推荐给用户之前，还包括：

根据所述每个信息的内容属性与所述用户的画像信息确定第二评分；

根据所述第一评分以及所述第二评分得到每个信息的总评分；

所述将符合预设规则的第一评分对应的信息推荐给用户，包括：

将符合预设规则的总评分对应的信息推荐给用户。

在其中一个可能的实现方式中，所述根据所述每个信息的内容属性与所述用户的画像信息确定第二评分，包括：

在所述信息库中根据所述每个信息的内容属性与所述用户的画像信息确定第二评分，或，在第一推荐集合中根据所述每个信息的内容属性与所述用户的画像信息确定第二评分；其中，所述第一推荐集合为排名前M位的所述第一评分对应的信息组成的集合。

在其中一个可能的实现方式中，所述根据所述第一评分以及所述第二评分得到每个信息的总评分，包括：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1*Y2；

其中，Y表示每个信息的总评分，Y1表示第一评分，Y2表示第二评分。

在其中一个可能的实现方式中，所述根据所述第一评分以及所述第二评分得到每个信息的总评分，还包括：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1+Y2

第二方面，本申请实施例提供了一种信息推荐装置，该装置包括用于执行上述第一方面的方法的单元。具体地，该装置至少可以包括：

第一获取单元，用于获取用户的N个历史行为信息；其中，所述历史行为信息为用户浏览过的信息，所述N个历史行为信息在时间上呈连续分布；

聚合单元，用于将所述N个历史行为信息按照会话机制进行聚合，得到多个会话；所述多个会话在时间上连续分布；

特征提取单元，用于对所述多个会话分别进行特征提取，所述提取的特征为时序序列特征集合；

推荐单元，用于将提取到的特征输入训练好的预设机器学习模型，得到推荐结果。

在其中一个可能的实现方式中，所述装置还包括：训练单元；

所述训练单元用于训练所述预设机器学习模型；

所述训练单元，包括：

第二获取单元，用于获取第一会话内第一信息的人均浏览量；其中，所述第一会话为所述多个会话中在时间维度上最近的一个会话；

设置单元，用于将所述第一会话内第一信息的人均浏览量设置为所述预设机器学习模型的输入特征的数量；

生成单元，用于根据所述多个会话内的历史行为信息对所述预设机器学习模型进行训练，得到所述训练好的预设机器学习模型。

在其中一个可能的实现方式中，所述推荐单元包括第一确定单元和第一推荐单元；

其中，所述第一确定单元，用于根据所述预设机器学习模型确定用户浏览信息库中每个信息的第一评分；

所述第一推荐单元，用于将符合预设规则的第一评分对应的信息推荐给用户。

在其中一个可能的实现方式中，所述推荐单元还包括第二确定单元和计算单元；其中，

所述第二确定单元，用于第一确定单元根据所述预设机器学习模型确定用户浏览信息库中每个信息的第一评分之后，第一推荐单元将符合预设规则的第一评分对应的信息推荐给用户之前，根据所述每个信息的内容属性与所述用户的画像信息确定第二评分；

所述计算单元，用于根据所述第一评分以及所述第二评分得到每个信息的总评分；

其中，所述第一推荐单元具体用于：

将符合预设规则的总评分对应的信息推荐给用户。

在其中一个可能的实现方式中，所述第二确定单元具体用于：

在其中一个可能的实现方式中，所述计算单元具体用于：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1*Y2

在其中一个可能的实现方式中，所述计算单元还具体用于：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1+Y2

第三方面，本申请实施例提供了一种信息推荐设备，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储支持设备执行上述方法的计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行上述第一方面的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。

第五方面，本申请实施例还提供了一种计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。

图1是本申请实施例提供的一种LSTM神经网络模型的内部处理逻辑的结构示意图；

图2是本申请实施例提供的一种级联形式的LSTM神经网络模型的结构示意图；

图3A是本申请实施例提供的一种信息推荐系统的结构示意图；

图3B是本申请实施例提供的信息推荐系统30对应的方法流程示意图；

图4A是本申请实施例提供的一种信息推荐方法的流程示意图；

图4B是本申请实施例提供的另一种信息推荐方法的流程示意图；

图5是本申请实施例提供的一种信息推荐装置的结构示意图；

图6是本申请实施例提供的一种信息推荐设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

首先，介绍下本申请的主要发明构思。

以向用户推荐资讯为例，现有技术中，传统的推荐方式，更多关注的是资讯间相互独立的关系，因此，在刻画用户行为序列上存在诸多不足，导致无法有效的捕捉用户针对资讯的连续偏好信息，从而在向用户进行推荐时的推荐结果在一定程度上并不能很好的满足用户的预期。基于此，本申请实施例提供了一种信息推荐方法，该方法基于用户连续的N个历史行为信息来向用户推荐物品，这里，连续的N个历史行为信息用于表征用户的连续偏好，而不是只单一的考虑了N个历史行为信息中的某一个历史行为信息，可以解决传统的推荐方式中推荐结果的准确率不高的问题，提高推荐结果的准确率。

接下来，对本申请中的部分用语进行解释说明，以便本领域技术人员理解。

(1)长短时记忆神经网络

为了解决传统的循环神经网络(Recurrent Neural Network，RNN)存在的问题，长短时记忆神经网络(Long-Short Term Memory，LSTM)模型应运而生。LSTM模型是将输入门、输出门、遗忘门以及细胞(cell)结构，用于控制对历史信息的学习和遗忘，使模型适合处理长序列问题。请参见图1，是本申请实施例提供的一种LSTM的结构示意图。如图1所示，设时刻t，LSTM模型的记忆单元表示为C_t，遗忘门的输出表示为f_t，输入门的输出表示为i_t，输出门的输出表示为O^(t)，三个门的元素值都在区间[0,1]。

具体来说，遗忘门是控制是否遗忘的，即以一定的概率控制是否遗忘上一层的隐藏细胞状态。在时刻t，对于遗忘门来说，其输入为上一序列的隐藏状态h(t-1)和本序列数据x(t)，在激活函数的作用下，得到遗忘门的输出。具体地，这里的激活函数可以为sigmoid。

在实际应用中，遗忘门的处理逻辑可以表示为如下数学表达式(1)：

f_t＝σ(W_fh^(t-1)+U_fx^(t)+b_f

其中，W_f、U_f、b_f为线性关系的系数和偏置，σ表示激活函数sigmoid。

具体来说，输入门负责处理当前序列位置的输入，决定放什么新信息到“细胞状态”中，从图1中可以看出，输入门由两部分组成，第一部分在激活函数sigmoid的作用下，输出为i_t，第二部分在激活函数tanh的作用下，输出为a_t，这两部分结果进行相乘再去更新细胞状态。总的来说，输入门的作用是为了状态更新做准备。

在实际应用中，输入门的处理逻辑可以表示为如下数学表达式(2)：

i_t＝σ(W_ih^(t-1)+U_ix^(t)+b_i

a_t＝tanh(W_ah^(t-1)+U_ax^(t)+b_a

其中，W_i、U_i、b_i，W_a、U_a、b_a为线性关系的系数和偏置，σ表示激活函数sigmoid。

在经过遗忘门和输入门后，可以确定传递信息的删除和增加，也即可以进行“细胞状态”的更新，由图1可以知道，细胞状态C^(t)由两部分组成，第一部分是C^(t-1)和遗忘门输出f_t的乘积，第二部分是输入门i_t和a_t的乘积，也即可以表示为如下数学表达式(3)：

C^(t)＝C^(t-1)*f^(t)+i^(t)*a^(t)

其中，*表示哈达玛积Hadamard积。

具体来说，这里，Hadamard积按位做乘法运算。

从图1中可以看出，隐藏状态h^(t)的更新由两部分组成，第一部分是O^(t)，它由上一序列的隐藏状态h^(t-1)和本序列数据x^(t)，以及激活函数sigmoid得到，第二部分由隐藏状态C^(t)和激活函数tanh组成，其处理逻辑可以表示为如下数学表达式(4)：

O^(t)＝σ(W_Oh^(t-1)+U_Ox^(t)+b_O

h^(t)＝O^(t)*tanh(C^(t))

在本申请实施例中，预设机器学习模型可以包括但不限于LSTM神经网络模型。具体地，该模型的具体架构可以如图2所示，在该LSTM神经网络模型中，级联了多个细胞，例如，如图2所示，在该模型中级联了t个细胞，该模型可以挖掘用户的连续偏好信息，继而根据用户的多个连续偏好信息提取到的特征，预测下一个用户会浏览的信息。

在本申请实施例中，作为其中一种实施方式，选择LSTM神经网络模型的原因在于：用户下一次将要浏览的信息可能与上一次浏览的信息相关，也有可能与上上一次浏览的信息相关，还可能与前几次的浏览信息相关，要找出用户浏览信息的行为之间的关系，就需要带有处理较长历史记忆功能的模型，以便综合考虑用户多次浏览信息的行为对用户下一次浏览信息的行为的影响。LSTM神经网络模型为递归神经网络RNN(Recursive NeuroNetwork，RNN)的一种，所不同的是RNN只能记住上一次的行为，而LSTM神经网络模型可以记住较长时间的行为，也即，LSTM神经网络模型能够很好地处理历史数据，并输出预测结果，例如，推荐下一次用户将要浏览的信息。

为了便于更好的理解本申请实施例提供的一种信息推荐方法，下面结合图3A所示的本申请实施例提供的一种信息推荐系统来具体说明在实际应用中是如何实现信息推荐的，如图3A所示，该信息推荐系统30集成了火星(Spark)离线计算系统300，谷歌张量流图(TensorFlow)人工智能学习系统302以及实时在线推荐系统304；其中，火星(Spark)离线计算系统302包括资讯池聚类模块3001、训练库生成模块3002、会话(session)聚合模块3003以及特征提取模块(1)3004；谷歌张量流图(TensorFlow)人工智能学习系统302包括机器学习模型训练模块3021、固化图(Freeze Graph)模块3022、模型推送模块3023；实时在线推荐系统304包括模型校验模块3041、固化图加载模块3042、模型更换模块3043、实时行为收集模块3044、特征提取模块(2)3045、机器学习模型在线预测模块3046。

接下来对信息推荐系统30中的各个模块进行详细描述。

具体实现中，资讯池聚类模块3001用于对资讯池中的信息进行聚类，这里，聚类是指按照某个特定标准(如距离准则，即数据点之间的距离)把一个数据集分割成不同的类或簇，使得同一个簇内的数据对象的相似性尽可能大，同时不在同一个簇中的数据对象的差异性也尽可能地大。在本申请实施例中，可以根据资讯的内容属性进行聚类，例如，第一聚类集为搞笑型信息，第二聚类集为教育型信息，第三聚类集为常识型信息等等。在对信息进行聚类之后，可以将聚类结果按照一定规则进行编码，编码后的标识来代表这一组聚类信息，同时将编码映射关系存储为索引关系(例如，该索引关系的表现形式为索引文件)，例如，该具体表现形式可以如表1所示：

表1信息的索引关系

聚类集类型	编码
		搞笑型信息	001
教育型信息	002
		常识型信息	003

在实际应用中，例如，可以通过001这一索引标识可以找到对应的搞笑型信息。

具体实现中，训练库生成模块3002用于生成机器学习模型的训练样本数据。在实际应用中，训练库生成模块3002对采集到的用户的原始数据进行有效预处理。这里，预处理方式可以包括：将用户的将用户的曝光日志、播放日志、信息正排索引以及画像特征日志，按照用户设备号进行融合；去除缺失数据等等，这一技术手段可以保证训练样本数据的完整性，不出现缺失数据，是提高预设机器学习模型针对推荐结果预测的准确性的前提。

具体实现中，会话(session)聚合模块3003是指将用户的历史行为信息按照session机制进行聚合。具体来说，session是指一个终端用户与交互系统进行通信的时间间隔。当一个session第一次被启用时，一个唯一的标识被存储于本地的cookie中。这意味着，根据session的标识跟踪用户的点击行为或浏览行为。例如，在本申请实施例中，该时间间隔可以为4小时，也可以为2小时，等等。以时间间隔为4小时为例，那么，从上午8点-下午16点这8个小时内，可以包括两个会话(session)，也即session1、session2。

具体实现中，特征提取模块(1)3004用于提取特征。例如，特征提取模块(1)在多个session内提取到的特征为一个序列特征集合，该序列特征集合的表现形式为X＝{X1,X2,X3,X4}，其中，通过{X1,X2,X3}映射为对应的嵌入(Embedding)信息，将得到的Embedding信息作为机器学习预测模型的输入，X4作为机器学习预测模型的输出。基于提取到的特征可以实现机器学习模型的训练，从而可以得到本申请中所涉及的预设机器学习模型，这里，预设机器学习模型可以为LSTM神经网络模型。

具体实现中，机器学习模型训练模块3021用于根据上述提取到的特征，在训练样本数据的基础上，得到训练好的预设机器学习模型(如LSTM神经网络模型)。这里，关于LSTM的内部处理逻辑请参考前述描述。

具体实现中，固化图(Freeze Graph)模块3022用于通过将训练样本数据与机器学习模型的网络结构进行融合，将模型参数通过转换为常量的方式固化在机器学习模型的网络结构中，以保证离线训练模型与在线预测模型的网络结果一致。这里，经过固化后的模型文件为可执行的二进制文件。在实际应用中，实时在线推荐系统304通过加载固化后的模型文件(也即离线模型文件)，即可获取机器学习网络模型以及模型训练参数。

具体实现中，模型推送模块3023将上述经过固化后的模型文件以及经过聚类得到的索引文件推送给实时在线推荐系统。在其中一个可能的实现方式中，模型推送模块将上述经过固化后的模型文件以及经过聚类得到的索引文件通过定时任务按照预设的频次(例如，5次)，按预设时间长度(例如，按天或者按小时)推送给实时在线推荐系统。此外，可以采用信息-摘要算法5(Message-Digest Algorithm 5,MD5)对文件内容进行加密，生成MD5编码。这一技术手段为后续的模型校验模块做准备。

具体实现中，模型校验模块3041用于对上离线模型文件(包括上述离线训练模型)做校验，以确定模型推送模块3023每次推送的模型文件是基于最新样本数据进行训练得到的结果。在实际应用中，模型校验模块3041将模型推送模块3023中的MD5结果与上一次模型得到的MD5结果做比对，在满足：模型校验文件中的关键参数值在预设数据范围内，模型推送模块3023推送的索引文件与模型文件的对应关系准确无误的情况下，完成模型的校验，至此，完成了上述校验的离线模型文件可以用于发送给固化图加载模块3042，以实现离线模型文件的加载。

具体实现中，固化图加载模块3042用于加载经过校验后的离线模型文件。在其中一个可能的实现方式中，采用多线程的方式完成离线模型文件的加载过程。具体地，设备可以按照预设时间间隔检测推送至实时在线推荐系统的模型文件，当发现经过固化后的模型文件发生了更新时，开始执行加载过程。

具体实现中，模型更换模块3043用于对模型文件进行更替。具体地，在完成了离线模型文件的加载之后，实时在线推荐系统中的模型更新标识位生效。当实时在线推荐系统确定新的模型文件以及对应的索引文件已经加载到内存中后，完成模型文件的更替操作。

具体实现中，实时行为收集模块3044用于实时收集、记录用户的session行为信息。可以理解的是，这里所涉及的session行为信息即为预设机器学习模型的输入。在其中一个可能的实现方式中，基于批处理流(Spark streaming)实时记录用户的行为，并将结果存储在重申(Redis)缓存数据库中，那么，对于实时在线推荐系统来说，可以通过拉取Redis得到对应的信息。

具体实现中，特征提取模块(2)3045用于提取特征，并将提取到的特征输入预设机器学习模型。其具体实现请参考前述关于特征提取模块(1)3004的描述。

具体实现中，机器学习模型在线预测模块3046用于根据提取到的特征以及测试样本数据得到推荐结果。具体地，可以通过预设机器学习模型预测得到用户在所有聚类集上的得分，之后，根据得分确定推荐结果。继而，将推荐结果反馈给用户。

基于图3A所示的信息推荐系统，接下来结合图3B所示的该信息推荐系统对应的方法流程具体阐述该信息推荐系统是如何实现信息推荐的，可以包括如下步骤：

步骤S300、资讯池聚类模块3001对资讯池中的信息进行聚类；

步骤S301、训练库生成模块3002根据聚类好的信息生成机器学习模型的训练样本数据；

步骤S302、会话聚合模块3003将获取到的用户的历史行为信息按照session机制进行聚合，得到多个会话；

步骤S303、特征提取模块(1)3004对上述多个会话分别提取特征；

步骤S304、机器学习模型训练模块3021根据提取到的特征以及训练样本数据确定训练好的预设机器学习模型；

步骤S305、固化图模块3022对上述确定好的预设机器学习模型进行固化，得到离线训练模型；

步骤S306、模型推送模型3023将固化好的离线训练模型推送给实时在线推荐系统；

步骤S307、模型校验模块3041对离线训练模型进行校验，以确定每次推送的模型文件是基于最新样本数据进行训练得到的结果；

步骤S308、固化图加载模块3042加载经过校验后的离线模型文件；

步骤S309、若检测到机器学习模型发生更新，模型更换模块3043对模型文件进行更替，得到最新的机器学习模型，并基于最新的机器学习模型进行预测；

步骤S3010、实时行为收集模块3044获取用户的session行为信息；

步骤S3011、特征提取模块(2)3045对获取到的用户的session行为信息进行特征提取；

步骤S3012、机器学习模型在线预测模块3046根据提取到的特征以及测试样本数据得到推荐结果。

实施本申请所描述的推荐方法，可以解决传统的推荐方式中推荐结果的准确率不高的问题。

基于图3A所示的信息推荐系统的架构示意图，下面将结合图4所示的本申请实施例提供的一种信息推荐方法的流程示意图具体说明在本申请实施例中是如何实现信息的推荐的，可以包括但不限于如下步骤：

步骤400、获取用户的N个历史行为信息；其中，所述历史行为信息为用户浏览过的信息，所述N个历史行为信息在时间上呈连续分布。

在其中一个可能的实现方式中，设备采用Spark streaming获取用户的N个历史行为信息，这里的N个历史行为信息为连续的N个时间点上的浏览行为，用于表征用户在一段时间内的连续偏好信息。例如，设备获取了用户的3个历史行为信息，分别为：设备在10点10分记录了用户针对第一资讯的浏览行为，在11点20分记录了用户针对第二资讯的浏览行为，在13点40分记录了用户针对第三资讯的浏览行为。

在实际应用中，N为大于0的正整数。例如，N＝5，又例如，N＝10。

步骤402、将所述N个历史行为信息按照会话机制进行聚合，得到多个会话；其中，所述多个会话在时间上连续分布。

如前所述，session是指一个终端用户与交互系统进行通信的时间间隔。例如，该时间间隔为2小时。举例来说，设备在上午8点-下午16点这8个小时内获取了20个用户A的历史行为信息。设备根据会话机制对这20个历史行为信息进行聚合，可以得到4个不同的会话，例如，会话1、会话2、会话3以及会话4。这里，4个会话在时间上连续分布。

步骤S404、对所述多个会话分别进行特征提取，所述提取的特征为时序序列特征集合。

如前所述，设备在得到了4个不同的会话(例如，会话1、会话2、会话3以及会话4)之后，设备在这4个会话内进行特征提取，得到时序序列特征集合item。这里，时序序列特征集合是多个带有顺序的特征所组成的集合，可以表征用户浏览信息的行为顺序。之后，将确定好的时序序列特征集合以及预测数据输入预设的机器学习模型，可以得到推荐结果。

具体实现中，所述预测数据为最近的会话内的数据。在前述举例中，这里，会话4内的数据即为预测数据。

接下来重点阐述设备如何生成训练好的预设机器学习模型：

具体来说，本申请所描述的信息推荐方法，也即，针对信息推荐结果的预测，该方法实际上是一个机器学习问题，在实际应用中，通常需要两套独立的数据样本集，即训练样本数据和测试样本数据。具体实现中，首先输入有标记的训练样本数据，这里，对于用户A来说，有标记的训练样本数据是指用户曾经浏览过的信息，对机器学习模型进行训练，得到训练好的预设机器学习模型(例如，LSTM模型)。可以理解的是，训练好的预设机器学习模型可以用于对测试样本数据(例如，用户A在会话机制内的连续多个偏好信息)进行推测。继而，完成信息的推荐。

以信息为资讯为例，在其中一个可能的实现方式中，这里所涉及的训练样本数据为设备对原始数据进行有效预处理之后得到的，具体地，预处理方式可以包括：将用户的曝光日志、播放日志、视频正排索引以及画像特征日志，按照用户设备号进行融合、去除缺失数据等。通过对数据进行有效的预处理，可以保证训练样本数据的完整性，这一技术手段是提高预设机器学习模型针对推荐结果预测的准确性的前提。

具体实现中，在训练所述预设机器学习模型时，包括：

在其中一个可能的实现方式中，所述预设机器学习模型的输入特征的数量等于会话内第一信息的人均浏览量。这里所涉及的会话是指最近的会话。

这里，浏览量，也即页面访问量或点击量，用户每1次对网站中的每个网页访问均被记录1次。用户对同一页面的多次访问，访问量累计。

以信息为“XX在深圳开演唱会”这一资讯为例，设备在最近的会话内确定针对该资讯的人均访问量为7次，在这种情况下，预设机器学习模型中的输入特征的数量可以为Q个，这里，Q可以为数据集{1,2,3,4,5,6,7}中的任意一个数。以Q＝2为例，这意味着，当前的预设机器学习模型中输入特征的数量为2个，可以表示为X＝(X1,X2，X3)，其中，通过{X1,X2}映射为对应的嵌入(Embedding)信息，将得到的Embedding信息作为机器学习预测模型的输入，X3表示预设机器学习模型的预测输出结果。需要说明的是，在这种情况下，容易带来得到的推荐结果在某种程度上没有满足预设条件(例如，预设条件可以为精度)，此时，可以对预设机器学习的输入作相应的调整。

作为一种优选的实现方式，当Q＝7时，这意味着，当前的预设机器学习模型中输入特征的数量为7个，可以表示为X＝(X1,X2,X3,X4,X5,X6,X7,X8)，其中，通过{X1,X2,X3,X4,X5,X6,X7}映射为对应的嵌入(Embedding)信息，将得到的Embedding信息作为机器学习预测模型的输入，X8表示预设机器学习模型的预测输出结果。在这种情况下，当预设机器学习模型的输入特征的数量等于最近的会话内信息的人均浏览量时，其预测结果相较于其他的情形来说，准确率更高。

也就是说，在本申请实施例中，将预设机器学习模型的输入特征的数量等于最近的会话内信息的人均浏览量，可以提高模型的泛化能力，进而提高推荐结果的准确率。

需要说明的是，在本申请实施例中，训练好的预设机器学习模型在不同的阶段因其训练样本数据的不同，导致训练好的预设的机器学习模型有所差异。具体来说，在第一时间段内包括会话1、会话2以及会话3，在该时间段内的训练样本数据为会话1、会话2中用户的历史行为信息，在这种情况下，基于会话3中的第一信息的人均浏览量设置预设的机器学习模型的输入特征的数量为5，经过训练得到的预设机器学习模型为模型1；在第二时间段内(这里，第二时间段为第一时间段的下一个时间段，与第一时间段相邻)包括会话1、会话1、会话2、会话3、会话4以及会话5，在该时间段内的训练样本数据为会话1、会话2、会话3、会话4中用户的历史行为信息，在这种情况下，基于会话5中的第一信息的人均浏览量设置预设的机器学习模型的输入特征的数量为7，经过训练得到的预设机器学习模型为模型2，这里，模型1与模型2为不同的模型。也即，在本申请实施例中，会基于不同的训练样本数据得到不同的训练好的预设机器学习模型，并基于最新训练样本数据得到新的模型，并对预设机器学习模型进行更替，可以提高向用户推荐下一个将要浏览信息的准确率。

步骤S406、将提取到的特征输入训练好的预设机器学习模型，得到推荐结果。

在其中一个可能的实现方式中，将符合预设规则的第一评分对应的信息推荐给用户，可以包括：

将排名前M位的第一评分对应的信息推荐给用户。

在其中一个可能的实现方式中，将符合预设规则的第一评分对应的信息推荐给用户，还可以包括：

将所述第一评分大于预设阈值对应的信息推荐给用户。

具体实现中，设备将提取到的序列特征集合输入训练好的预设机器学习模型，可以预测得到用户浏览信息库(例如，信息库中包含5个信息)中每个信息的第一评分。

例如，设备根据训练好的预设机器学习模型确定用户浏览第一信息的评分为0.8，根据训练好的预设机器学习模型确定用户浏览第二信息的评分为0.6，根据训练好的预设机器学习模型确定用户浏览第三信息的评分为0.4，根据训练好的预设机器学习模型确定用户浏览第四信息的评分为0.1，根据训练好的预设机器学习模型确定用户浏览第五信息的评分为0.9，之后，设备可以将排名前2位的评分对应的信息推荐给用户，在这种情况下，设备将第五信息以及第一信息推荐给用户；设备也可以将评分大于预设阈值(例如，该预设阈值为0.9)对应的信息推荐给用户，在这种情况下，设备将第五信息推荐给用户。

在其中一个可能的实现方式中，本申请实施例还提供了另外一种信息推荐方法的流程示意图，如图4B所示，该方法可以包括如下步骤：

步骤S500、获取用户的N个历史行为信息；其中，所述历史行为信息为用户浏览过的信息，所述N个历史行为信息在时间上呈连续分布。

步骤S502、将N个历史行为信息按照会话机制进行聚合，得到多个会话；多个会话在时间上连续分布。

步骤S504、将多个会话分别进行特征提取，提取的特征为时序序列特征集合。

在本申请实施例中，关于步骤S500-步骤S504的具体实现请参考前述关于步骤S400-步骤S404的描述，此处不多加赘述。

步骤S506、根据预设机器学习模型确定用户浏览信息库中每个信息的第一评分。

步骤S508根据所述每个信息的内容属性与所述用户的画像信息确定第二评分。

步骤S5010：根据所述第一评分以及所述第二评分得到每个信息的总评分。

步骤S5012：将符合预设规则的总评分对应的信息推荐给用户。

这里，设备根据用户的基础数据确定用户的画像信息。例如，用户的基础数据可以包括：性别、年龄、资讯喜好类型等等。

在本申请实施例中，用户的画像信息用于勾勒用户是一个什么样子的人，或者说，用户的画像信息用于勾勒用户是一个拥有什么行为的人。

例如，设备获取到的用户A的基础数据可以如表2所示：

表2用户的基础数据

用户	性别	年龄	资讯喜好类型
				用户A	男	20	搞笑型资讯

设备根据表2所示的用户A的基础数据确定用户A是一个对搞笑型资讯感兴趣的人。

如前所述，设备根据训练好的预设机器学习模型确定用户浏览第一信息的评分为0.8，设备根据训练好的预设机器学习模型确定用户浏览第二信息的评分为0.6，根据训练好的预设机器学习模型确定用户浏览第三信息的评分为0.4，设备根据训练好的预设机器学习模型确定用户浏览第四信息的评分为0.1，设备根据训练好的预设机器学习模型确定用户浏览第五信息的评分为0.9，设备在确定用户浏览信息库的每个信息的第一评分之后，设备根据每个信息的内容属性与用户的画像信息确定第二评分。接下来具体阐述设备如何确定第二评分：

具体实现中，所述根据所述每个信息的内容属性与所述用户的画像信息确定第二评分，包括：

第一种情形：设备在信息库中根据每个信息的内容属性与用户的画像信息确定第二评分。

在前述举例中，信息库中包含5个信息，这5个信息分别为第一信息、第二信息、第三信息、第四信息以及第五信息。设备确定第一信息的内容属性与用户A的画像信息之间的评分为0.7；设备确定第二信息的内容属性与用户A的画像信息之间的评分为0.5；设备确定第三信息的内容属性与用户A的画像信息之间的评分为0.6；设备确定第四信息的内容属性与用户A的画像信息之间的评分为0.4；设备确定第五信息的内容属性与用户A的画像信息之间的评分为0.8。在这种情况下，设备根据第一评分以及第二评分得到每个信息的总评分。

在确定每个信息的总评分时，根据以下公式(1)计算：

Y＝aY1*bY2 (1)

其中，Y表示每个信息的总评分，Y1表示第一评分，a表示第一评分的权重系数；Y2表示第二评分，b表示第二评分的权重系数。

在其中一个可能的实现方式中，a＝1，b＝1，在这种情况下，公式(1)可以变形为公式(2)：

Y＝Y1*Y2 (2)

以采用公式(2)确定每个信息的总评分为例，在前述举例中，设备确定用户A浏览第一信息的总评分为0.56；设备确定用户A浏览第二信息的总评分为0.3；设备确定用户A浏览第三信息的总评分为0.24；设备确定用户A浏览第四信息的总评分为0.04；设备确定用户A浏览第五信息的总评分为0.72，之后，设备将符合预设规则的总评分对应的信息推荐给用户。例如，设备可以将排名前2位的评分对应的信息推荐给用户，在这种情况下，设备将第五信息以及第一信息推荐给用户。又例如，设备可以将评分大于预设阈值(例如，该预设阈值为0.7)对应的信息推荐给用户，在这种情况下，设备将第五信息推荐给用户。

在确定每个信息的总评分时，根据以下公式(3)计算：

Y＝aY1+bY2 (3)

这里，第一评分的权重系数a和第二评分的权重系数b满足：

a+b＝1

在其中一个可能的实现方式中，a＝0.5，b＝0.5，在这种情况下，公式(3)可以变形为公式(4)：

Y＝0.5*Y1+0.5*Y2 (4)

以采用公式(4)确定每个信息的总评分为例，在前述举例中，设备确定用户A浏览第一信息的总评分为0.75；设备确定用户A浏览第二信息的总评分为0.55；设备确定用户A浏览第三信息的总评分为0.5；设备确定用户A浏览第四信息的总评分为0.25；设备确定用户A浏览第五信息的总评分为0.85，之后，设备将符合预设规则的总评分对应的信息推荐给用户。例如，设备可以将排名前2位的评分对应的信息推荐给用户，在这种情况下，设备将第五信息以及第一信息推荐给用户。又例如，设备可以将评分大于预设阈值(例如，该预设阈值为0.7)对应的信息推荐给用户，在这种情况下，设备将第五信息以及第一信息推荐给用户。

第二种情形：设备在第一推荐集合汇总根据每个信息的内容属性与用户的画像信息确定第二评分；例如，第一推荐集合为排名前2位的第一评分对应的信息组成的集合。

在前述举例中，信息库中包含5个信息，在确定了第一评分之后，根据第一评分确定的第一推荐集合中包含第一信息和第五信息。设备确定第一信息的内容属性与用户A的画像信息之间的评分为0.7；设备确定第五信息的内容属性与用户A的画像信息之间的评分为0.8。在这种情况下，设备根据第一评分以及第二评分得到每个信息的总评分。例如，设备根据公式(4)确定总评分，在这种情况下，设备确定用户A浏览第一信息的总评分为0.75；设备确定用户A浏览第五信息的总评分为0.85，之后，设备将符合预设规则的总评分对应的信息推荐给用户。例如，设备可以将排名前1位的评分对应的信息推荐给用户，在这种情况下，设备将第五信息推荐给用户。又例如，设备可以将评分大于预设阈值(例如，该预设阈值为0.8)对应的信息推荐给用户，在这种情况下，设备将第五信息推荐给用户。

可以理解的是，在第一推荐集合中确定的每个信息的总评分这一实现方式相较于在整个信息库中确定每个信息的总评分来说，计算过程更为精简，与此同时，得到的推荐结果的准确率更高。

实施本申请实施例，设备基于用户连续的N个历史行为信息以及训练好的预设机器学习模型来向用户推荐物品，而不是只单一的考虑了N个历史行为信息中的某一个历史行为信息，可以解决传统的推荐方式中推荐结果的准确率不高的问题，提高推荐结果的准确率。

上述详细阐述了本申请实施例的方法，为了便于更好地实施本申请实施例的上述方案，相应地，下面还提供用于配合实施上述方案的相关装置。

参见图5，图5为本申请实施例提供发一种信息推荐装置的结构示意图，该装置50至少可以包括：获取单元500、聚合单元502、特征提取单元504、以及推荐单元506；其中，

第一获取单元500，用于获取用户的N个历史行为信息；其中，所述历史行为信息为用户浏览过的信息，所述N个历史行为信息在时间上呈连续分布；

聚合单元502，用于将所述N个历史行为信息按照会话机制进行聚合，得到多个会话；所述多个会话在时间上连续分布；

特征提取单元504，用于对所述多个会话分别进行特征提取，所述提取的特征为时序序列特征集合；

推荐单元506，用于将提取到的特征输入训练好的预设机器学习模型，得到推荐结果。

在其中一个可能的实现方式中，所述装置50还包括：训练单元508；

具体实现中，所述训练单元508，包括：

在其中一个可能的实现方式中，所述推荐单元506包括第一确定单元和第一推荐单元；

所述第一确定单元，用于根据所述预设机器学习模型确定用户浏览信息库中每个信息的第一评分；

在其中一个可能的实现方式中，所述推荐单元506还包括第二确定单元和计算单元；

其中，所述第二确定单元，用于第一确定单元根据所述预设机器学习模型确定用户浏览信息库中每个信息的第一评分之后，第一推荐单元将符合预设规则的第一评分对应的信息推荐给用户之前，根据所述每个信息的内容属性与所述用户的画像信息确定第二评分；

其中，所述第一推荐单元具体用于：

将符合预设规则的总评分对应的信息推荐给用户。

在其中一个可能的实现方式中，所述计算单元具体用于：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1*Y2；

在其中一个可能的实现方式中，所述计算单元还具体用于：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1+Y2

为了便于更好地实施本发明实施例的上述方案，本发明还对应提供了一种信息推荐设备，下面结合附图来进行详细说明：

如图6示出的本发明实施例提供的信息推荐设备的结构示意图，设备60可以包括处理器601、存储器604和通信模块605，处理器601、存储器604和通信模块605可以通过总线606相互连接。存储器604可以是高速随机存储记忆体(Random Access Memory，RAM)存储器，也可以是非易失性的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器604可选的还可以是至少一个位于远离前述处理器601的存储系统。存储器604用于存储应用程序代码，可以包括操作系统、网络通信模块、用户接口模块以及数据处理程序，通信模块605用于与外部设备进行信息交互；处理器601被配置用于调用该程序代码，执行以下步骤：

将所述N个历史行为信息按照会话机制进行聚合，得到多个会话；所述多个会话在时间上连续分布；

其中，处理器601在训练所述预设机器学习模型时，可以包括：

其中，处理器601将提取到的特征输入训练好的预设机器学习模型，得到推荐结果，可以包括：

其中，处理器601根据所述预设机器学习模型确定用户浏览信息库中每个信息的第一评分之后，并将符合预设规则的第一评分对应的信息推荐给用户之前，还可以包括：

所述处理器601将符合预设规则的第一评分对应的信息推荐给用户，可以包括：

将符合预设规则的总评分对应的信息推荐给用户。

其中，处理器601根据所述每个信息的内容属性与所述用户的画像信息确定第二评分，可以包括：

其中，处理器601根据所述第一评分以及所述第二评分得到每个信息的总评分，可以包括：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1*Y2；

其中，处理器601根据所述第一评分以及所述第二评分得到每个信息的总评分，还可以包括：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1+Y2

需要说明的是，本发明实施例中的设备60中处理器的执行步骤可参考上述各方法实施例中图4实施例中的设备运行的具体实现方式，这里不再赘述。

在具体实现中，信息推荐设备60可以为终端或者服务器，具体地，其表现形式可以包括移动手机、平板电脑、个人数字助理(Personal Digital Assistant，PDA)、移动互联网设备(Mobile Internet Device，MID)等各种用户可以使用的设备，本发明实施例不作具体限定。

应理解，本申请实施例提供的方法可以适用的应用场景只是作为一种示例，实际应用中并不限于此。

还应理解，本申请中涉及的第一、第二、第三以及各种数字编号仅仅为描述方便进行的区分，并不用来限制本申请的范围。

应理解，本申请中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本申请中字符“/”，一般表示前后关联对象是一种“或”的关系。

此外，在本申请的各个实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚的了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块和单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

所述作为分离部件说明的单元可以是物理上分开的，也可以不是物理上分开的，作为单元显示的部件可以是物理单元，也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。

此外，在本申请各个实施例中所涉及的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现，本申请对此不作限定。

本发明实施例还提供了一种计算机存储介质，该计算机可读存储介质中存储有指令，当其在计算机或处理器上运行时，使得计算机或处理器执行上述任一个实施例所述方法中的一个或多个步骤。上述装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在所述计算机可读取存储介质中，基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机产品存储在计算机可读存储介质中。

上述计算机可读存储介质可以是前述实施例所述的设备的内部存储单元，例如硬盘或内存。上述计算机可读存储介质也可以是上述设备的外部存储设备，例如配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，上述计算机可读存储介质还可以既包括上述设备的内部存储单元也包括外部存储设备。上述计算机可读存储介质用于存储上述计算机程序以及上述设备所需的其他程序和数据。上述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，可通过计算机程序来指令相关的硬件来完成，该计算机的程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可存储程序代码的介质。

本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种信息推荐方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，

在训练所述预设机器学习模型时，包括：

3.根据权利要求1所述的方法，其特征在于，所述将提取到的特征输入训练好的预设机器学习模型，得到推荐结果，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述预设机器学习模型确定用户浏览信息库中每个信息的第一评分之后，所述并将符合预设规则的第一评分对应的信息推荐给用户之前，还包括：

将符合预设规则的总评分对应的信息推荐给用户。

5.根据权利要求4所述的方法，其特征在于，所述根据所述每个信息的内容属性与所述用户的画像信息确定第二评分，包括：

6.根据权利要求4所述的方法，其特征在于，所述根据所述第一评分以及所述第二评分得到每个信息的总评分，包括：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1*Y2；

7.根据权利要求4所述的方法，其特征在于，所述根据所述第一评分以及所述第二评分得到每个信息的总评分，还包括：

在确定每个信息的总评分时，根据以下公式计算：

Y＝Y1+Y2

8.一种信息推荐装置，其特征在于，包括：

9.一种信息推荐设备，其特征在于，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。