CN112084415A

CN112084415A - 一种基于用户和项目长短期时间耦合关系分析的推荐方法

Info

Publication number: CN112084415A
Application number: CN202010982167.8A
Authority: CN
Inventors: 张全贵; 王天昊; 李鑫
Original assignee: Liaoning Technical University
Current assignee: Liaoning Technical University
Priority date: 2020-09-17
Filing date: 2020-09-17
Publication date: 2020-12-15
Anticipated expiration: 2040-09-17
Also published as: CN112084415B

Abstract

本发明公开了一种基于用户和项目长短期时间耦合关系分析的推荐方法，包括数据采集和处理、划分数据集、构建耦合模型、训练模型和项目推荐。本发明运用了LSTM算法学习了用户及项目在长短期时间内的动态特征信息，使推荐系统具有更好的推荐效果和可解释性，从非独立同分布的角度探究用户/项目之间的耦合关系，并考虑到了其中长短期动态耦合，利用MLP多层感知器捕获了用户/项目之间的动态耦合关系，提高了推荐的质量和准确度；将非独立同分布及将长短期时间因素作为动态特征结合到了协同过滤中，可以较好的解决数据稀疏性和冷启动问题。

Description

一种基于用户和项目长短期时间耦合关系分析的推荐方法

技术领域

本发明属于计算机人工智能的技术领域，尤其涉及一种基于用户和项目长短期时间耦合关系分析的推荐方法。

背景技术

随着个性化服务的快速发展，随着用户兴趣的不断发展，推荐系统的推荐准确性也越来越高。然而，大多数传统的顺序推荐方法都隐含地假设用户和项是独立且同分布的(IID)。具体来说，他们忽略了用户和项之间的复杂耦合性及异构性，而考虑到非独立同分布(Non-IID)的推荐系统几乎没有考虑到用户特征及项目特征的动态耦合性，实际上用户的评分喜好都会随着时间有长短期的变化，项目对于大众的受欢迎情况也会随着长短期时间而变化，例如，同一用户的长期偏好与近期的喜好可能是相关的，这种动态的耦合关系可以更好的解释用户对项目的动态偏好，从而为用户提供更准确的推荐。

发明内容

基于以上现有技术的不足，本发明所解决的技术问题在于提供一种基于用户和项目长短期时间耦合关系分析的推荐方法，具有良好的推荐准确度和可解释性。

为了解决上述技术问题，本发明通过以下技术方案来实现：本发明提供一种基于用户和项目长短期时间耦合关系分析的推荐方法，包括：

S1、数据采集和处理：在Grouplens网站下载MovieLens 100K和MovieLens 1M数据集，清理脏数据；

S2、划分数据集：将处理好的数据集按8:1:1的比例划分为训练集、测试集和验证集；

S3、构建耦合模型：用长短期记忆神经网络学习用户的动态偏好及项目的动态受欢迎情况，用多层感知器分别学习用户特征耦合关系与项目特征耦合关系，并将两者融合进行推荐；

S4、训练模型和项目推荐：步骤S2中所得到的训练数据集和测试数据集分别用于训练和评估步骤S3构建的耦合模型，考虑用户/项目长短期的动态偏好以及相应用户/项目特征信息之间的耦合关系，根据用户对项目的预测评分判断是否将项目推荐给用户。

所述步骤S1的数据采集和处理的具体步骤如下：

S101、Grouplens网站下载MovieLens 100K和MovieLens 1M数据集，做数据预处理，并清理脏数据；

S102、提取数据集中用户/项目在长期和短期内的评价信息及基本特征信息，将其转化为向量。

进一步的，所述步骤S3中构建耦合模型的具体步骤如下：

S301、构建输入层：输入层包括4个输入内容，用户项目ID、用户长短期评价信息、项目ID及项目长短期评价信息；

S302、构建用户动态预测模型、项目动态预测模型以及基于用户和项目长短期时间耦合性方法；即构建基于用户项目长短期时间耦合关系学习框架；

S303、构建输出层：预测用户对项目的评分。

进一步的，所述步骤S302中构建用户动态预测模型、项目动态预测模型以及基于用户及项目的长短期时间耦合关系方法的具体步骤如下：

S302-1、构建用户动态预测模型：通过输入用户ID及用户长短期评分信息，将用户ID Embedding转化为指定维度的向量，代表用户人口统计学的基本特征，将用户在长短期内的评分信息Embedding转化为指定维度，用以连接长短期时间记忆网络(LSTM)，学习用户的动态偏好，将用户基本特征向量与用户动态偏好向量进行拼接，传入多层感知器，学习用户动态偏好的耦合关系；

S302-2、构建项目动态预测模型：通过输入项目ID及项目的长短期评分信息，将项目ID Embedding转化为指定维度的向量，代表项目的基本特征，将项目在长短期内的被评分信息Embedding转化为指定维度，用以连接长短期时间记忆网络(LSTM)，学习项目的动态受欢迎程度，将项目的基本特征信息与项目的动态向量进行拼接，传入多层感知器，学习项目动态受欢迎情况的耦合关系；

S302-3、构建基于用户和项目长短期时间耦合性方法，用户动态预测模型的输出与项目动态预测模型的输出合并为一个串联的向量，然后由一个全连接层进行处理，输出最终的向量。该方法的最终输出由一个Sigmoid函数激活，从而压缩到范围[0，1]。

进一步的，所述步骤S302-1构建用户动态预测模型的具体步骤如下：

S302-1-1、每个用户的基本特征信息转化为向量并进行Embedding，输出用户的基本特征信息向量；用户在长短期内的评价信息转化为向量，并对其进行Embedding，将此向量作为LSTM的输入；

S302-1-2、LSTM算法学习出用户在长短期时间的动态特征，输出用户的动态特征向量，再将用户的动态特征向量与用户的基本特征信息向量进行Concatenation操作，将结果向量作为MLP的输入；

S302-1-3、MLP多层感知器学习出用户动态特征的耦合关系，并将输入向量转化为用户动态耦合关系向量，作为后续全连接层的输入。

进一步的，所述步骤S302-2构建用户动态预测模型的具体步骤如下：

S302-2-1、每个项目的基本特征信息转化为向量并进行Embedding，输出项目的基本特征信息向量；项目在长短期内的评价信息转化为向量，并对其进行Embedding，将此向量作为LSTM的输入；

S302-2-2、LSTM算法学习出项目在长短期时间内动态的受欢迎的情况，输出项目的动态特征向量，再将项目的动态特征向量与项目的基本特征信息向量进行Concatenation操作，将结果向量作为MLP的输入；

S302-2-3、MLP多层感知器学习出项目动态特征的耦合关系，并将输入向量转化为项目动态耦合关系向量，作为后续全连接层的输入。

进一步的，所述步骤S302-3中训练模型和项目推荐的具体步骤如下：

S302-3-1、将用户动态预测模型和项目动态预测模型的输出向量用融合层进行融合，输出的向量作为全连接层的输入；

S302-3-2、通过全连接层学习用户项目交互关系，即用全连接层将用户项目关系转化为非线性交互；

S302-3-3、将上步产生的非线性关系用Sigmoid函数激活，从而压缩到范围[0，1]。

进一步的，所述步骤S4中训练模型和项目推荐的具体步骤如下：

S401、构建损失函数：使用平均绝对误差(MAE)损失函数计算模型的损失值，损失函数公式如下所示：

其中，m为测试数据集的长度，y_i是测试数据集中的标签，

是预测值；

S402、构建优化函数：使用Adam作为模型的优化函数。

由上，本发明的基于用户和项目长短期时间耦合关系分析的推荐方法至少具有以下优点：

(1)、本发明考虑了用户的长短期动态耦合关系，项目的长短期动态耦合关系，用户动态特征与项目动态特征之间在长短期的耦合关系，当评分信息比较稀疏时这种耦合关系可以给用户推荐其在相应时间内的偏好项目，提高了推荐质量。

(2)、本发明运用了LSTM算法学习了用户及项目在长短期时间内的动态特征信息，使推荐系统具有更好的推荐效果和可解释性。

(3)、本发明从非独立同分布的角度探究用户/项目之间的耦合关系，并考虑到了其中长短期动态耦合，利用MLP多层感知器捕获了用户/项目之间的动态耦合关系，提高了推荐的质量和准确度。

(4)、本发明将非独立同分布及将长短期时间因素作为动态特征结合到了协同过滤中，可以较好的解决数据稀疏性和冷启动问题。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其他目的、特征和优点能够更简明易懂，以下结合优选实施例，并配合附图，详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例的附图作简单地介绍。

图1为本发明的基于用户和项目长短期时间耦合关系分析的推荐方法流程图；

图2为本发明的基于用户和项目长短期时间耦合关系分析的推荐模型的流程图；

图3为本发明的基于用户和项目长短期时间耦合关系学习框架的流程图；

图4为本发明的用户动态预测模型的流程图；

图5为本发明的基于用户和项目长短期时间耦合性方法的流程图；

图6为本发明的训练模型和项目推荐的流程图；

图7为本发明的基于用户和项目长短期时间耦合性的协同过滤推荐方法的结构框图。

具体实施方式

下面结合附图详细说明本发明的基于用户和项目长短期时间耦合性的协同过滤推荐方法的具体实施方式。

如图1和图7所示，本发明的基于用户和项目长短期时间耦合性的协同过滤推荐方法，该方法包括如下步骤：

S1、数据采集和处理：在Grouplens网站下载MovieLens 100K和MovieLens 1M数据集，清理脏数据。

用户的长短期动态数据包括"UserID"，"MovieID"，"L_Rating"，"S_Rating"，"Long_Time"，"Short_Time"，如下所示：

UserID	MovieID	L_Rating	S_Rating	Long_Time	Short_Time
						1	1993	1	1	978300760	854300797

用户的人口统计学信息数据包括"UserID"，"Gender"，"Age"，"Occupation"，"Zip-code"，如下所示：

UserID	Gender	Age	Occupation	Zip-code
					1	F	1	10	48067

项目的特征数据包括"MovieID"，"Title"，"Genres"，如下所示:

MovieID	Title	Genres
			1	Toy Story(1995)	Animation\|Children's\|Comedy

项目的长短期动态数据包括"MovieID"，"UserID"，"L_Rating"，"S_Rating"，"Long_Time"，"Short_Time"，如下所示：

MovieID	UserID	L_Rating	S_Rating	Long_Time	Short_Time
						1993	1	1	1	978300760	854300797

如图2所示，步骤S3中构建基于用户和项目长短期时间耦合关系分析的推荐模型的具体步骤如下：

S301、构建输入层：输入层包括4个输入内容，用户项目ID、用户长短期评价信息、项目ID及项目长短期评价信息输入层的形式为(user_id_input，user_tim_input，item_id_input，item_tim_input，)。

在Keras中，输入层可用如下代码实现：

user_id_input＝Input(shape＝(1，)，dtype＝'float32'，name＝'user_id_input')

user_tim_input＝Input(shape＝(K，)，dtype＝'float32'，name＝'user_tim_input')

item_id_input＝Input(shape＝(1，)，dtype＝'float32'，name＝'item_id_input')

item_tim_input＝Input(shape＝(18，)，dtype＝'float32'，name＝'item_tim_input')

S302、构建用户动态预测模型、项目动态预测模型以及基于用户和项目长短期时间耦合性方法。即构建基于用户项目长短期时间耦合关系学习框架；

S303、构建输出层：预测用户对项目的评分。

在Keras中，输出层可用如下代码实现：

topLayer＝Dense(1，activation＝'sigmoid'，init＝'lecun_uniform'，name＝'topLayer')(dense_1)

如图3所示，步骤S302中构建基于用户和项目长短期时间耦合关系学习框架的具体步骤如下所示：

S302-1、构建用户动态预测模型：通过输入用户ID及用户长短期评分信息，将用户ID Embedding转化为指定维度的向量U_CF，代表用户人口统计学的基本特征，将用户在长短期内的评分信息Embedding转化为指定维度U_CB，用以连接长短期时间记忆网络(LSTM)，学习用户的动态偏好，将用户基本特征向量与用户动态偏好向量进行拼接得到向量U，传入多层感知器，学习用户动态偏好的耦合关系；

通过多层感知器(MLP)学习用户之间动态特征的耦合关系的实现代码如下所示：

predict_vec＝keras.layers.Multiply()([vec，att])

predict_vec＝Dense(16)(predict_vec)

predict_vec＝BatchNormalization()(predict_vec)

predict_vec＝Activation('relu')(predict_vec)

predict_vec＝Dense(8)(predict_vec)

predict_vec＝BatchNormalization()(predict_vec)

predict_vec＝Activation('relu')(predict_vec)；

S302-2、构建项目动态预测模型：通过输入项目ID及项目的长短期评分信息，将项目ID Embedding转化为指定维度的向量V_CF，代表项目的基本特征，将项目在长短期内的被评分信息Embedding转化为指定维度V_CB，用以连接长短期时间记忆网络(LSTM)，学习项目的动态受欢迎程度，将项目的基本特征信息与项目的动态向量进行拼接得到向量V，传入多层感知器，学习项目动态受欢迎情况的耦合关系；

S302-3、构建基于用户和项目长短期时间耦合性方法，用户动态预测模型的输出U与项目动态预测模型的输出V合并为一个串联的向量(记为r)，然后由一个全连接层进行处理，输出最终的向量。基于用户和项目长短期时间耦合性方法的最终输出由一个Sigmoid函数激活，从而压缩到范围[0，1]。

因此，基于用户和项目长短期时间耦合性方法的最终输出表达式为:

在Keras中，输出层实现代码如下所示：

merge_attr_id_embedding＝merge([attr_2，id_2]，mode＝'concat')

dense_1＝Dense(256)(merge_attr_id_embedding)

dense_1＝Activation('relu')(dense_1)

如图4所示，步骤S302-1及中构建用户动态预测模型的具体步骤如下：

S302-1-1、构建向量映射层：每个用户的基本特征信息转化为向量并进行Embedding，输出用户的基本特征信息向量；用户在长短期内的评价信息转化为向量，并对其进行Embedding，将此向量作为LSTM的输入。

实现代码如下所示：

user_vector_input＝Input(shape＝(20，)，dtype＝'float32'，name＝'user_vector_input')

user_vector_embedding＝Embedding(input_dim＝6041，output_dim＝64，

name＝'user_vector_embedding'，embeddings_initializer＝RandomNormal(mean＝0.0，stddev＝0.01，seed＝None)，W_regularizer＝l2(0)，input_length＝10)

user_vector_embedding＝user_vector_embedding(user_vector_input)

user_vector_embedding＝Lambda(lambda x:K.mean(x，axis＝1))(user_vector_embedding)

item_attr_input＝Input(shape＝(18，)，dtype＝'float32'，name＝'item_attr_input')

item_attr_embedding＝Dense(18，activation＝'relu'，name＝'item_attr_embedding')(item_attr_input)

通过多层感知器(MLP)学习用户特征与项目特征之间的耦合关系的实现代码如下所示：

predict_vec＝keras.layers.Multiply()([vec，att])

predict_vec＝Dense(16)(predict_vec)

predict_vec＝BatchNormalization()(predict_vec)

predict_vec＝Activation('relu')(predict_vec)

predict_vec＝Dense(8)(predict_vec)

predict_vec＝BatchNormalization()(predict_vec)

predict_vec＝Activation('relu')(predict_vec)

S302-1-3、MLP多层感知器学习出用户动态特征的耦合关系，并将输入向量转化为用户动态耦合关系向量，作为后续全连接层的输入；

如图5所示，步骤S302-3中基于用户和项目长短期时间耦合性方法的具体步骤如下：

S302-3-1、构建向量映射层：将用户动态预测模型和项目动态预测模型的输出向量U、V用融合层进行融合，输出的融合向量记为f，作为全连接层的输入；

融合向量f实现代码如下所示：

vec＝keras.layers.Multiply()([user_latent，item_latent])；

S302-3-2、通过全连接层学习用户项目交互关系，即用全连接层将用户项目关系转化为非线性交互，表示为：

...

其中，W₁,W₂,...,W_L和b₁,b₂,...,b_L表示各层的权矩阵和偏置，a₁,a₂,...,a_L表示由ReLU激活函数激活的每一层的输出；

在Keras中，构建深层潜在因素表示网络的用户项目交互转换为非线性交互的代码如下所示：

id_1＝Dense(64)(merge_id_embedding)

id_1＝Activation('relu')(id_1)

id_2＝Dense(32)(id_1)

id_2＝Activation('relu')(id_2)；

S302-3-3、将上步产生的非线性关系用Sigmoid函数激活，从而压缩到范围[0，1]，并将目标问题解释为概率:p_Θ(y＝1|u,v|)，用

作为预测输出：

其中W₀是最后一层的权重矩阵，a_L是上一层的输出，b₀是最后一层的偏重向量。

在Keras中，用户项目交互概率的代码如下所示：

topLayer＝Dense(1，activation＝'sigmoid'，init＝'lecun_uniform'，name＝'topLayer')(id_2)

如图6所示，步骤S4的训练模型和项目推荐的具体步骤为：

其中，m为数据集的长度，y_i是数据集中的标签，

是预测值。

在Keras中，MAE实现代码如下所示：

model.compile(optimizer＝Adam(lr＝learning_rate)，loss＝'mean_squared_error')

S402、构建优化函数：使用Adam作为模型的优化函数；其中，学习率参数设置为0.001，其他参数使用keras的默认值即可。

在Keras中，优化函数实现代码如下所示：

本发明的基于用户和项目长短期时间耦合关系分析的推荐方法包括如下：S1、数据采集和处理；S2、划分数据集；S3、构建基于用户和项目长短期时间耦合关系学习框架：(1)用户动态预测模型；(2)项目动态预测模型；(3)基于用户和项目长短期时间耦合性方法。S4、训练耦合模型和项目推荐。

一个项目的受欢迎程度可能会随着时间段的不同而改变，用户的平均评分也可能会随着时间的推移而上升或下降，本发明既考虑用户/项目之间的关系，也考虑到用户/项目在长期和短期时间内动态偏好之间微观的耦合关系，起到辅助协同过滤推荐的作用，尤其是当评分信息比较稀疏时借助于这种耦合关系仍可以较好的给用户推荐其喜好的项目，提高了推荐的质量。本发明建立了基于用户/项目的长短期时间耦合模型，应用LSTM算法学习用户/项目的动态特征，并用多层感知器(MLP)来分析长短期时间之间内用户/项目的耦合关系，结合非独立同分布的协同过滤精确推荐结果。

最后应说明的是：以上所述是本发明的优选实施方式而已，当然不能以此来限定本发明之权利范围，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和变动，这些改进和变动也视为本发明的保护范围。

Claims

1.一种基于用户和项目长短期时间耦合关系分析的推荐方法，其特征在于，包括：

2.根据权利要求1所述的基于用户和项目长短期时间耦合关系分析的推荐方法，其特征在于，所述步骤S1的数据采集和处理的具体步骤如下：

3.根据权利要求1所述的基于用户和项目长短期时间耦合关系分析的推荐方法，其特征在于，所述步骤S3中构建耦合模型的具体步骤如下：

S303、构建输出层：预测用户对项目的评分。

4.根据权利要求3所述的基于用户和项目长短期时间耦合关系分析的推荐方法，其特征在于，所述步骤S302中构建用户动态预测模型、项目动态预测模型以及基于用户及项目的长短期时间耦合关系方法的具体步骤如下：

S302-1、构建用户动态预测模型：通过输入用户ID及用户长短期评分信息，将用户IDEmbedding转化为指定维度的向量，代表用户人口统计学的基本特征，将用户在长短期内的评分信息Embedding转化为指定维度，用以连接长短期时间记忆网络，学习用户的动态偏好，将用户基本特征向量与用户动态偏好向量进行拼接，传入多层感知器，学习用户动态偏好的耦合关系；

S302-2、构建项目动态预测模型：通过输入项目ID及项目的长短期评分信息，将项目IDEmbedding转化为指定维度的向量，代表项目的基本特征，将项目在长短期内的被评分信息Embedding转化为指定维度，用以连接长短期时间记忆网络，学习项目的动态受欢迎程度，将项目的基本特征信息与项目的动态向量进行拼接，传入多层感知器，学习项目动态受欢迎情况的耦合关系；

S302-3、构建基于用户和项目长短期时间耦合性方法，用户动态预测模型的输出与项目动态预测模型的输出合并为一个串联的向量，然后由一个全连接层进行处理，输出最终的向量。

5.根据权利要求4所述的基于用户和项目长短期时间耦合关系分析的推荐方法，其特征在于，所述步骤S302-1构建用户动态预测模型的具体步骤如下：

6.根据权利要求4所述的基于用户和项目长短期时间耦合关系分析的推荐方法，其特征在于，所述步骤S302-2构建项目动态预测模型的具体步骤如下：

7.根据权利要求3所述的基于用户和项目长短期时间耦合关系分析的推荐方法，其特征在于，所述步骤S302-3中训练模型和项目推荐的具体步骤如下：

8.根据权利要求2所述的基于用户和项目长短期时间耦合关系分析的推荐方法，其特征在于，所述步骤S4中训练模型和项目推荐的具体步骤如下：

S401、构建损失函数：使用平均绝对误差损失函数计算模型的损失值，损失函数公式如下所示：

其中，m为测试数据集的长度，y_i是测试数据集中的标签，

是预测值；

S402、构建优化函数：使用Adam作为模型的优化函数。