CN109543112A

CN109543112A - 一种基于循环卷积神经网络的序列推荐方法及装置

Info

Publication number: CN109543112A
Application number: CN201811457888.6A
Authority: CN
Inventors: 赵朋朋; 徐程凤; 周晓方; 崔志明
Original assignee: Suzhou University
Current assignee: Suzhou University
Priority date: 2018-11-30
Filing date: 2018-11-30
Publication date: 2019-03-29

Abstract

本发明公开了一种基于循环卷积神经网络的序列推荐方法，包括以下步骤：获得用户历史互动项目序列后，在预先训练获得的循环卷积神经网络的循环层，对每个项目做转换处理，获得隐藏状态向量，在循环卷积神经网络的卷积层，对基于隐藏状态向量确定的窗口矩阵分别进行水平卷积操作和垂直卷积操作，获得水平卷积结果和垂直卷积结果，在全连接层，根据水平卷积结果、垂直卷积结果和隐藏状态向量，获得用户与项目集合中每个项目的互动概率预测结果，根据该预测结果，确定推荐给用户的项目。应用本发明实施例所提供的技术方案，增强了推荐性能，实现了更加高效的序列推荐。本发明还公开了一种基于循环卷积神经网络的序列推荐装置，具有相应技术效果。

Description

一种基于循环卷积神经网络的序列推荐方法及装置

技术领域

本发明涉及推荐技术领域，特别是涉及一种基于循环卷积神经网络的序列推荐方法及装置。

背景技术

随着移动互联网技术不断发展，网络中的信息量以指数规律迅速扩展和增加，网络上的信息过载和信息迷航问题日益严重。为了给用户提供满意的信息和服务，推荐系统应运而生，成为众多研究学者关注的研究领域。推荐系统通过预测用户对信息资源的喜好程度来进行信息过滤。为了构建有效的推荐系统，一个关键的因素是如何准确的表征和理解用户动态变化以及不断发展的兴趣和品味，因此序列推荐系统被提出来实现这一目标。序列推荐是基于用户过去的活动序列来为用户推荐未来可能与之互动项目的一种推荐方法。

传统的推荐方法，比如标准的矩阵分解技术，都不能很好的解决序列推荐的任务，因为它们都是建模静态的用户-项目交互行为。因此，基于马尔科夫链的序列方法提出来建模相邻两个项目之间的局部序列模式，然而它们却不能建模用户-项目之间更高阶的关系。而近年来，深度学习在图像处理、自然语言处理等领域取得了突破性的进展，为序列推荐系统的研究也带来了新的机遇。例如循环神经网络(Recurrent Neural Network，RNN)已经成为了一个很流行的序列神经模型。为了更好地建模用户的长期依赖性，RNN的两个变体，长短期记忆网络(Long-Short Term Memory，LSTM)和门控循环单元(Gated Recurrent Unit，GRU)也被广泛的运用。此外，基于会话的RNN，层次化的个性RNN和基于注意力的RNN都对建模序列数据产生很大的帮助。

然而，RNN模型是基于一个假设，即时间依赖性是单调变化的。这意味着当前项目或者其隐藏状态比其之前的项目或隐藏状态更加重要，RNN的这种单调时间依赖性削弱了用户短期兴趣的建模。尽管后来基于注意力的RNN模型对缓解这一问题做了一些努力，但它并没有考虑到建模短期序列模式时的特征交互，使得推荐性能不佳。

发明内容

本发明的目的是提供一种基于循环卷积神经网络的序列推荐方法及装置，以提升推荐性能。

为解决上述技术问题，本发明提供如下技术方案：

一种基于循环卷积神经网络的序列推荐方法，包括：

获得用户历史互动项目序列；

在预先训练获得的循环卷积神经网络的循环层，对所述历史互动项目序列中的每个项目做转换处理，获得所述历史互动项目序列中每个项目对应的隐藏状态向量；

在所述循环卷积神经网络的卷积层，基于所述循环层获得的隐藏状态向量，确定窗口矩阵，对所述窗口矩阵分别进行水平卷积操作和垂直卷积操作，获得水平卷积结果和垂直卷积结果；

在所述循环卷积神经网络的全连接层，根据所述水平卷积结果、所述垂直卷积结果和所述隐藏状态向量，获得所述用户与项目集合中每个项目的互动概率预测结果；

根据所述互动概率预测结果，确定推荐给所述用户的项目。

在本发明的一种具体实施方式中，所述对所述历史互动项目序列中的每个项目做转换处理，获得所述历史互动项目序列中每个项目对应的隐藏状态向量，包括：

将所述历史互动项目序列中的每个项目转换成一个隐含空间内的嵌入向量，通过LSTM的循环结构，获得所述历史互动项目序列中每个项目对应的隐藏状态向量。

在本发明的一种具体实施方式中，通过以下步骤对所述窗口矩阵进行水平卷积操作，获得所述水平卷积结果：

根据所述窗口矩阵，确定多个水平窗口矩阵；

将每个所述水平窗口矩阵分别与每个相同大小的水平卷积过滤器互动，生成多个水平卷积值，获得所述水平卷积结果。

在本发明的一种具体实施方式中，通过以下公式将所述水平窗口矩阵与一个所述水平卷积过滤器互动：

其中，·表示向量的内积运算，j是水平窗口矩阵E^(u,t)每个行向量的位置，b∈R是一个偏置向量，f是一个ReLU激活函数，水平卷积过滤器F∈R^1×w，高度为1，宽度为w，对于用户u的历史互动项目序列I^u中的每个时间步t，均有一个水平窗口矩阵E^(u,t)∈R^1×d。

在本发明的一种具体实施方式中，通过以下步骤对所述窗口矩阵进行垂直卷积操作，获得所述垂直卷积结果：

根据所述窗口矩阵，确定多个垂直窗口矩阵；

将垂直卷积过滤器分别在每个所述垂直窗口矩阵的每列上以一个固定的方式滑动d次，生成多个垂直卷积值，获得所述垂直卷积结果。

在本发明的一种具体实施方式中，所述根据所述窗口矩阵，确定多个垂直窗口矩阵，包括：

通过以下公式确定所述垂直窗口矩阵：

其中，对于用户u的历史互动项目序列I^u中的每个时间步t，均有一个垂直窗口矩阵表示个连续项目的隐藏状态向量，每个逗号表示行向量的拼接，的整个宽度等于d。

在本发明的一种具体实施方式中，所述根据所述水平卷积结果、所述垂直卷积结果和所述隐藏状态向量，获得所述用户与项目集合中每个项目的互动概率预测结果，包括：

通过以下公式确定所述用户与项目集合中每个项目的互动概率预测结果：

其中，W'∈R^|I|×(2d+n)和b'∈R^|I|分别是输出层的权重矩阵和偏见向量，h_t倾向于捕捉用户的长期偏好，o_t用于学习项目具体的特征，用来捕捉用户的短期序列模式，是用户u在时刻t+1和项目i的互动概率值。

一种基于循环卷积神经网络的序列推荐装置，包括：

序列获得模块，用于获得用户历史互动项目序列；

循环层处理模块，用于在预先训练获得的循环卷积神经网络的循环层，对所述历史互动项目序列中的每个项目做转换处理，获得所述历史互动项目序列中每个项目对应的隐藏状态向量；

卷积层处理模块，用于在所述循环卷积神经网络的卷积层，基于所述循环层获得的隐藏状态向量，确定窗口矩阵，对所述窗口矩阵分别进行水平卷积操作和垂直卷积操作，获得水平卷积结果和垂直卷积结果；

全连接层处理模块，用于在所述循环卷积神经网络的全连接层，根据所述水平卷积结果、所述垂直卷积结果和所述隐藏状态向量，获得所述用户与项目集合中每个项目的互动概率预测结果；

项目推荐模块，用于根据所述互动概率预测结果，确定推荐给所述用户的项目。

在本发明的一种具体实施方式中，所述循环层处理模块，具体用于：

在本发明的一种具体实施方式中，所述卷积层处理模块具体用于通过以下步骤对所述窗口矩阵进行水平卷积操作，获得所述水平卷积结果：

根据所述窗口矩阵，确定多个水平窗口矩阵；

应用本发明实施例所提供的技术方案，获得用户历史互动项目序列后，在预先训练获得的循环卷积神经网络的循环层，对每个项目做转换处理，获得隐藏状态向量，在循环卷积神经网络的卷积层，对基于隐藏状态向量确定的窗口矩阵分别进行水平卷积操作和垂直卷积操作，获得水平卷积结果和垂直卷积结果，在全连接层，根据水平卷积结果、垂直卷积结果和隐藏状态向量，获得用户与项目集合中每个项目的互动概率预测结果，根据该预测结果，确定推荐给用户的项目。通过循环神经网络的循环结构捕捉复杂的长期依赖性，通过卷积神经网络的卷积操作提取循环隐藏状态的短期序列模式，通过对卷积层的输出和隐藏状态向量的拼接形成用户兴趣的高阶混合表征，增强了推荐性能，实现了更加高效的序列推荐。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种循环卷积神经网络的框架示意图；

图2为本发明实施例中一种基于循环卷积神经网络的序列推荐方法的实施流程图；

图3为本发明实施例中一种基于循环卷积神经网络的序列推荐装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面结合附图和具体实施方式对本发明作进一步的详细说明。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的核心是提供一种基于循环卷积神经网络的序列推荐方法，该方法基于预先训练获得的循环卷积神经网络进行序列推荐。该循环卷积神经网络为一种全新的整合循环神经网络和卷积神经网络两种深度神经网络的序列推荐模型-RCNN，循环神经网络的循环结构用于捕捉复杂的长期依赖性，卷积神经网络的卷积操作用于提取循环隐藏状态的短期序列模式，然后将卷积层的输出和循环层的隐藏状态向量拼接起来形成一个用户兴趣的高阶混合表征来产生推荐。

循环神经网络(RNN)在捕捉和表征序列推荐的时间依赖性方面是有效的，但是RNN在处理长序列的时候会遭遇“梯度消失”的问题。LSTM(Long-Short Term Memory)是RNN的一种变体，它通过使用长短期记忆单元和相关的门类型神经元结构可以减少梯度消失的问题。本发明实施例即使用LSTM网络来捕捉用户长期依赖性，实现简明和通用的目的。给定一个输入向量x_t，这个LSTM隐藏层的输出h_t由以下公式计算：

其中，h₀＝0，σ(·)是一个sigmoid层，映射0到1之间的值，1代表“完全保留”，0代表“完全放弃”。W_i、W_f、W_c、W_o是门的权重，b_i、b_f、b_c、b_o是相应的偏置，表示两个向量之间的哈达玛乘积运算。i_t、f_t、o_t和c_t分别表示第t个物体的输入门、遗忘门、输出门和单元状态向量。h_t是用于记忆和存储过去状态结点的隐藏状态向量。

RNN中最常用的优化算法是随时间反向传播算法，即Back-Propagation ThroughTime(BPTT)，是一种适合于多层神经元网络的一种学习算法。与反向传播算法(BP)类似，它是在时间上反传的梯度下降算法，建立在梯度下降法的基础上。BPTT网络的输入输出关系实质上是一种映射关系：一个输入m输出的BPTT神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射，这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合，因此具有很强的函数复现能力。这是BPTT算法得以应用的基础。反向传播算法主要由两个环节(激励传播、权重更新)反复循环迭代，直到网络的对输入的响应达到预定的目标范围为止。

BPTT算法的学习过程由正向传播过程和反向传播过程组成。在正向传播过程中，输入信息通过输入层经隐含层，逐层处理并传向输出层。如果在输出层得不到期望的输出值，则取输出与期望的误差的平方和作为目标函数，转入反向传播，逐层求出目标函数对各神经元权值的偏导数，构成目标函数对权值向量的梯量，作为修改权值的依据，网络的学习在权值修改过程中完成。误差达到所期望值时，网络学习结束。

下面先对循环卷积神经网络的训练过程进行说明。

本发明实施例考虑的序列内容主要是每个用户的项目交互记录。假设有|U|个用户u₁,u₂,...,u_|U|，分别将其收录到用户集合U，可表示为U＝{u₁,u₂,...,u_|U|}；同样地，将|I|个项目收录到项目集合I，可表示为I＝{i₁,i₂,...,i_|I|}。主要关注隐式反馈的推荐场景，关心用户u在t时刻和项目i是否进行过互动。每位用户u都有其按照时间排序的项目序列，将这些项目统一放在集合中，其中i_t ^u∈I并且|I^u|是用户u互动的项目总数量。另外i_t ^u中的索引t采用的是类似于时间推荐中的相对索引而不是绝对索引。即给定了|U|位用户和|I|个项目，以及用户u的历史互动项目序列Iu。

图1所示为本发明实施例所提供的循环卷积神经网络的框架示意图，该循环卷积神经网络包括循环层(Recurrent Layer)、卷积层(Convolutional Layer)和全连接层(Fully-connected Layer)。循环层中的虚线矩形框部分为窗口矩阵，卷积层上方虚线矩形框部分为水平卷积过滤器，卷积层下方虚线矩形框部分为垂直卷积过滤器。通过LSTM的循环结构来生成每个时间步的隐藏状态，然后把每个时间步最近的几个隐藏状态作为一个“图像”，通过水平卷积过滤器和垂直卷积过滤器来搜索短期序列模式和特征互动。

在循环层，即一个长短期记忆神经网络，给定一位用户u在t时刻曾经互动过的项目i_t ^u，将其转换成一个隐含空间内的嵌入向量x_t，然后将这个嵌入向量x_t输入进LSTM的循环结构中，得到一个隐藏状态向量h_t，用来建模用户u在t时刻的序列偏好。

在卷积层，将上一层循环层的输出同时输入进水平卷积层和垂直卷积层。借用CNN在文本分类中的操作，可以把每个时间步最近的k个隐藏状态向量作为一个k×d的窗口矩阵E^(u,t)，其中d是隐藏状态向量的大小，然后对该窗口矩阵分别作水平卷积和垂直卷积。通过水平卷积过滤器捕获非线性特性相互作用，针对非单调短期序列模式引进垂直卷积过滤器。

隐藏状态的水平卷积。卷积是一个过滤器在一条序列上进行滑动，然后在不同的时间步提取序列信息的过程。假设一个水平卷积过滤器F∈R^1×w，其中过滤器的高度为1，宽度为w，对于项目序列I^u中的每个时间步t，均有一个水平窗口矩阵E^(u,t)∈R^1×d，相当于序列中的每一个h_t，最后E^(u,t)与F互动的结果为：

其中，·表示向量的内积运算，j是水平窗口矩阵E^(u,t)每个行向量的位置，b∈R是一个偏置向量，f是一个ReLU激活函数。

通过n个相同大小的水平卷积过滤器可以生成多个水平卷积值，最后的水平卷积结果是：

o_t＝[v_t ¹ v_t ² ... v_t ⁿ] (3)

其中，v_t ^l是由第l个水平卷积过滤器生成的卷积值，o_t是由n个水平卷积过滤器生成的一个新的特征表征，相当于当前项目的特征互动。

隐藏状态的垂直卷积。标记一个垂直卷积过滤器为对于项目序列I_u中的每个时间步t，均有一个垂直窗口矩阵表示个连续项目的隐藏状态向量，可以标记为：

其中，每个逗号表示行向量的拼接，的整个宽度等于d。在的每列上以一个固定的方式滑动d次，生成垂直卷积值v_t∈R^d，

垂直卷积结果为：

其中，相当于最近几个项目隐藏特征的权重，是垂直卷积的最终输出，表示用户u在时间t的局部序列模式。这里只使用一个垂直卷积过滤器。通过使用垂直卷积过滤器可以增强前k个项目的隐藏状态对用户u当前兴趣的影响，突出了用户在最近个时间步内的短期兴趣。另外，由于LSTM是为序列输入和输出指定的，因此在水平卷积和垂直卷积运算后没有应用池化层。

在全连接层，为了捕获用户u当前的总偏好，可以将两个卷积层的输出和LSTM的隐藏状态向量拼接在一起，映射到全连接层，得到最终的概率预测：

其中W'∈R^|I|×(2d+n)和b'∈R^|I|分别是输出层的权重矩阵和偏见向量。h_t倾向于捕捉用户的长期偏好，o_t用于学习项目具体的特征，用来捕捉用户的短期序列模式，是用户u在时刻t+1和项目i的互动概率值。

最后，可以采用交叉熵损失函数为循环卷积神经网络进行优化，通过最小化以下目标函数优化相关参数：

其中，y^(u,t)是用户u在时刻t+1和所有项目的互动概率值。是一个独热向量，如果用户u在时刻t+1和项目i互动，则否则θ是网络中的所有超参数，λ是正则化权重。

还可以使用Adam(随机梯度下降的一个变种)来优化循环卷积神经网络RCNN中的参数。Adam通过对频繁的参数进行较小的更新和对不频繁的参数进行较大的更新，以此来适应每个参数的学习速率。

本发明实施例的循环卷积神经网络的时间复杂度就是循环神经网络的时间复杂度和卷积神经网络的时间复杂度之和。将每个用户的互动项目序列长度设为n，则循环神经网络层的时间复杂度为O(n)；由于卷积层的两个过滤器都是一维的，窗口矩阵的宽度为隐藏状态向量的大小d，因此卷积神经网络的时间复杂度为O(nd)，最后整个循环卷积神经网络的时间复杂度为O(n+nd)。

经过训练获得循环卷积神经网络后，可以利用循环卷积神经网络进行序列推荐。

参见图2所示，为本发明实施例所提供的一种基于循环卷积神经网络的序列推荐方法的实施流程图，该方法可以包括以下步骤：

步骤S210：获得用户历史互动项目序列。

用户历史互动项目序列可以通过不同平台收集得到，为用户互动过的项目的集合。

S220：在预先训练获得的循环卷积神经网络的循环层，对历史互动项目序列中的每个项目做转换处理，获得历史互动项目序列中每个项目对应的隐藏状态向量。

在上述训练获得的循环卷积神经网络的循环层，可以针对历史互动项目序列中的每个项目，对该项目做转换处理，获得该项目对应的隐藏状态向量。

具体的，可以将历史互动项目序列中的每个项目转换成一个隐含空间内的嵌入向量，通过LSTM的循环结构，获得历史互动项目序列中每个项目对应的隐藏状态向量。即针对于历史互动项目序列中的每个项目，将该项目转换成一个隐含空间内的嵌入向量，然后将这个嵌入向量输入进LSTM的循环结构中，得到一个隐藏状态向量，表征用户在该项目对应时刻的序列偏好。

S230：在循环卷积神经网络的卷积层，基于循环层获得的隐藏状态向量，确定窗口矩阵，对窗口矩阵分别进行水平卷积操作和垂直卷积操作，获得水平卷积结果和垂直卷积结果。

将上一层循环层的输出同时输入进卷积层，确定窗口矩阵，具体的，可以把每个时间步最近的几个隐藏状态向量作为一个窗口矩阵，对窗口矩阵分别进行水平卷积操作和垂直卷积操作。

在本发明的一种具体实施方式中，可以通过以下步骤对窗口矩阵进行水平卷积操作，获得水平卷积结果：

步骤一：根据窗口矩阵，确定多个水平窗口矩阵；

步骤二：将每个水平窗口矩阵分别与每个相同大小的水平卷积过滤器互动，生成多个水平卷积值，获得水平卷积结果。

在本发明实施例中，根据窗口矩阵，可以确定出多个水平窗口矩阵，每个水平窗口矩阵对应于一个隐藏状态向量。

针对每个水平窗口矩阵，将该水平窗口矩阵与一个水平卷积过滤器互动，可以生成水平卷积值。具体可以通过上述公式(2)将水平窗口矩阵与一个水平卷积过滤器互动。

生成多个水平卷积值后，可以获得水平卷积结果，如上述公式(3)所示。

在本发明的一种具体实施方式中，可以通过以下步骤对窗口矩阵进行垂直卷积操作，获得垂直卷积结果：

第一个步骤：根据窗口矩阵，确定多个垂直窗口矩阵；

第二个步骤：将垂直卷积过滤器分别在每个垂直窗口矩阵的每列上以一个固定的方式滑动d次，生成多个垂直卷积值，获得垂直卷积结果。

在本发明实施例中，根据窗口矩阵，可以确定出多个垂直窗口矩阵，每个垂直窗口矩阵表示几个连续项目的隐藏状态向量。具体可以通过公式(4)确定垂直窗口矩阵。

针对每个垂直窗口矩阵，可以将垂直卷积过滤器在该垂直窗口矩阵的每列上以一个固定的方式滑动d次，生成垂直卷积值。

生成多个垂直卷积值后，可以获得垂直卷积结果，如公式(5)所示。

S240：在循环卷积神经网络的全连接层，根据水平卷积结果、垂直卷积结果和隐藏状态向量，获得用户与项目集合中每个项目的互动概率预测结果。

获得水平卷积结果和垂直卷积结果后，可以将水平卷积结果和垂直卷积结果及LSTM的隐藏状态向量拼接在一起，映射到全连接层，获得用户与项目集合中每个项目的互动概率预测结果。具体可以通过公式(6)确定。

S250：根据互动概率预测结果，确定推荐给用户的项目。

获得用户与项目集合中每个项目的互动概率预测结果后，可以根据互动概率预测结果，确定推荐给用户的项目。

具体的，可以按照互动概率值的大小进行排序，在前面选择设定个数的项目推荐给用户，或者在前面选择设定个数的用户没有交互过的项目推荐给用户。

应用本发明实施例所提供的方法，获得用户历史互动项目序列后，在预先训练获得的循环卷积神经网络的循环层，对每个项目做转换处理，获得隐藏状态向量，在循环卷积神经网络的卷积层，对基于隐藏状态向量确定的窗口矩阵分别进行水平卷积操作和垂直卷积操作，获得水平卷积结果和垂直卷积结果，在全连接层，根据水平卷积结果、垂直卷积结果和隐藏状态向量，获得用户与项目集合中每个项目的互动概率预测结果，根据该预测结果，确定推荐给用户的项目。通过循环神经网络的循环结构捕捉复杂的长期依赖性，通过卷积神经网络的卷积操作提取循环隐藏状态的短期序列模式，通过对卷积层的输出和隐藏状态向量的拼接形成用户兴趣的高阶混合表征，增强了推荐性能，实现了更加高效的序列推荐。

相应于上面的方法实施例，本发明实施例还提供了一种基于循环卷积神经网络的序列推荐装置，下文描述的一种基于循环卷积神经网络的序列推荐装置与上文描述的一种基于循环卷积神经网络的序列推荐方法可相互对应参照。

参见图3所示，该装置包括：

序列获得模块310，用于获得用户历史互动项目序列；

循环层处理模块320，用于在预先训练获得的循环卷积神经网络的循环层，对历史互动项目序列中的每个项目做转换处理，获得历史互动项目序列中每个项目对应的隐藏状态向量；

卷积层处理模块330，用于在循环卷积神经网络的卷积层，基于循环层获得的隐藏状态向量，确定窗口矩阵，对窗口矩阵分别进行水平卷积操作和垂直卷积操作，获得水平卷积结果和垂直卷积结果；

全连接层处理模块340，用于在循环卷积神经网络的全连接层，根据水平卷积结果、垂直卷积结果和隐藏状态向量，获得用户与项目集合中每个项目的互动概率预测结果；

项目推荐模块350，用于根据互动概率预测结果，确定推荐给用户的项目。

应用本发明实施例所提供的装置，获得用户历史互动项目序列后，在预先训练获得的循环卷积神经网络的循环层，对每个项目做转换处理，获得隐藏状态向量，在循环卷积神经网络的卷积层，对基于隐藏状态向量确定的窗口矩阵分别进行水平卷积操作和垂直卷积操作，获得水平卷积结果和垂直卷积结果，在全连接层，根据水平卷积结果、垂直卷积结果和隐藏状态向量，获得用户与项目集合中每个项目的互动概率预测结果，根据该预测结果，确定推荐给用户的项目。通过循环神经网络的循环结构捕捉复杂的长期依赖性，通过卷积神经网络的卷积操作提取循环隐藏状态的短期序列模式，通过对卷积层的输出和隐藏状态向量的拼接形成用户兴趣的高阶混合表征，增强了推荐性能，实现了更加高效的序列推荐。

在本发明的一种具体实施方式中，循环层处理模块320，具体用于：

将历史互动项目序列中的每个项目转换成一个隐含空间内的嵌入向量，通过LSTM的循环结构，获得历史互动项目序列中每个项目对应的隐藏状态向量。

在本发明的一种具体实施方式中，卷积层处理模块330具体用于通过以下步骤对窗口矩阵进行水平卷积操作，获得水平卷积结果：

根据窗口矩阵，确定多个水平窗口矩阵；

将每个水平窗口矩阵分别与每个相同大小的水平卷积过滤器互动，生成多个水平卷积值，获得水平卷积结果。

在本发明的一种具体实施方式中，卷积层处理模块330具体用于通过以下公式将水平窗口矩阵与一个水平卷积过滤器互动：

在本发明的一种具体实施方式中，卷积层处理模块330具体用于通过以下步骤对窗口矩阵进行垂直卷积操作，获得垂直卷积结果：

根据窗口矩阵，确定多个垂直窗口矩阵；

将垂直卷积过滤器分别在每个垂直窗口矩阵的每列上以一个固定的方式滑动d次，生成多个垂直卷积值，获得垂直卷积结果。

在本发明的一种具体实施方式中，卷积层处理模块330具体用于：

通过以下公式确定垂直窗口矩阵：

在本发明的一种具体实施方式中，全连接层处理模块340，具体用于：

通过以下公式确定用户与项目集合中每个项目的互动概率预测结果：

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干改进和修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

Claims

1.一种基于循环卷积神经网络的序列推荐方法，其特征在于，包括：

获得用户历史互动项目序列；

根据所述互动概率预测结果，确定推荐给所述用户的项目。

2.根据权利要求1所述的方法，其特征在于，所述对所述历史互动项目序列中的每个项目做转换处理，获得所述历史互动项目序列中每个项目对应的隐藏状态向量，包括：

3.根据权利要求1所述的方法，其特征在于，通过以下步骤对所述窗口矩阵进行水平卷积操作，获得所述水平卷积结果：

根据所述窗口矩阵，确定多个水平窗口矩阵；

4.根据权利要求3所述的方法，其特征在于，通过以下公式将所述水平窗口矩阵与一个所述水平卷积过滤器互动：

其中，·表示向量的内积运算，j是水平窗口矩阵E^(u,t)每个行向量的位置，b∈R是一个偏置向量，f是一个ReLU激活函数，水平卷积过滤器F∈R^1×w，高度为1，宽度为w，对于用户u的历史互动项目序列I^u中的每个时间步t，均有一个水平窗口矩阵E^(u，t)∈R^1×d。

5.根据权利要求1所述的方法，其特征在于，通过以下步骤对所述窗口矩阵进行垂直卷积操作，获得所述垂直卷积结果：

根据所述窗口矩阵，确定多个垂直窗口矩阵；

6.根据权利要求5所述的方法，其特征在于，所述根据所述窗口矩阵，确定多个垂直窗口矩阵，包括：

通过以下公式确定所述垂直窗口矩阵：

7.根据权利要求1至6之中任一项所述的方法，其特征在于，所述根据所述水平卷积结果、所述垂直卷积结果和所述隐藏状态向量，获得所述用户与项目集合中每个项目的互动概率预测结果，包括：

8.一种基于循环卷积神经网络的序列推荐装置，其特征在于，包括：

序列获得模块，用于获得用户历史互动项目序列；

9.根据权利要求8所述的装置，其特征在于，所述循环层处理模块，具体用于：

10.根据权利要求8所述的装置，其特征在于，所述卷积层处理模块具体用于通过以下步骤对所述窗口矩阵进行水平卷积操作，获得所述水平卷积结果：

根据所述窗口矩阵，确定多个水平窗口矩阵；