CN113849728A

CN113849728A - 面向新项目推广的个性化推荐方法和系统

Info

Publication number: CN113849728A
Application number: CN202110997182.4A
Authority: CN
Inventors: 孙见山; 朱明月; 刘业政; 姜元春; 袁昆; 柴一栋; 钱洋
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2021-08-27
Filing date: 2021-08-27
Publication date: 2021-12-28

Abstract

本发明提供一种面向新项目推广的个性化推荐方法和系统，涉及个性化推荐技术领域。本发明首先获取候选用户日志数据和发布者发布的待推广的新项目数据，然后基于预先构建的多任务模型、所述候选用户日志数据和所述待推广的新项目数据获取候选用户分享所述新项目的概率，选择分享概率为top‑N的候选用户作为推荐用户。本发明综合考虑了用户和项目发布者的利益，将新项目推荐给可能会采取分享行为的用户，不仅能向用户推荐其感兴趣的新项目，还能提升新项目的推广效果，提升项目发布者的知名度以及活跃度，促进社交媒体网站和网络社区的良性发展。

Description

面向新项目推广的个性化推荐方法和系统

技术领域

本发明涉及个性化推荐技术领域，具体涉及一种面向新项目推广的个性化推荐方法和系统。

背景技术

随着互联网技术的发展，各种社交媒体网站和网络社区正在不断涌现。越来越多的人喜欢在这些平台上创建内容和分享信息，数据正在以前所未有的速度产生。这使得所谓的信息过载现象出现，用户在海量的信息中找到对自己真正有用的信息变得越来越困难。为了克服信息过载的问题，个性化推荐系统已经成为一种有效的解决方案。目前，推荐系统已经广泛应用于各个领域，如电影、新闻、音乐等等。

协同过滤(CF)作为实现推荐最成功的方法之一，已经有大量的研究者对其进行了研究。CF主要包括两大类：基于用户的CF和基于项目的CF。基于用户的CF的基本假设是，如果两个用户喜欢的项目相似或者具有的行为相似，则其对其他的项目也会具有相似的偏好或行为。其根据用户的历史评分来识别用户之间的共性，然后根据与目标用户兴趣相似的其他用户的偏好生成新的推荐。基于项目的CF方法则是假设当一个项目与用户过去喜欢的项目相似时，用户也会喜欢该项目。然而，无论是哪一类CF方法，都面临着新项目冷启动问题。

目前，针对新项目推荐的研究已经有很多。主要有两种方式，一种是使用基于内容的过滤方法，另外一种是将协同过滤与基于内容的方法进行混合。然而，目前的新项目推荐方法都是从用户的角度出发，只考虑新项目与用户兴趣的匹配度。但对于企业或者新项目的发布者而言，则希望新项目能够尽快的推广出去，获得更多的关注和热度。显然，目前的新项目推荐方法推广效果较低。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种面向新项目推广的个性化推荐方法和系统，解决了现有的新项目推荐方法推广效果较低的技术问题。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

第一方面，本发明提供一种面向新项目推广的个性化推荐方法，所述方法包括：

S1、获取候选用户日志数据和发布者发布的待推广的新项目数据；

S2、基于预先构建的多任务模型、所述候选用户日志数据和所述待推广的新项目数据获取候选用户分享所述新项目的概率，选择分享概率为top-N的候选用户作为推荐用户。

优选的，所述候选用户日志数据包括：用户、与用户发生交互关系的项目、发生交互关系的时间以及具体的交互关系；所述具体的交互关系包括点击、点赞和分享行为。

优选的，所述预先构建的多任务模型的构建过程如下：

A1、获取日志数据、与日志数据中的用户发生交互的项目数据；

A2、对日志数据和项目数据进行预处理，得到训练数据、测试数据和验证数据，所述训练数据、测试数据和验证数据中均包括用户的历史点击数据和新项目数据，所述新项目数据为训练数据、测试数据和验证数据中所对应的时间范围内产生的项目；

A3、获取初始多任务模型；

A4、基于训练数据、验证数据以及测试数据对初始多任务模型进行训练、验证和测试，得到多任务模型。

优选的，所述A2包括：

A201、将日志数据按照时间划分，预设时间点以前发生的点击行为当作用户的历史点击数据，预设时间点以后的数据按照天数x：y：z的比例划分为训练数据、验证数据以及测试数据；

A202、分别获取训练数据、验证数据、测试数据中新项目数据；

A203、对训练数据进行处理，得到形式为新项目ID、用户ID、是否点击、是否点赞、是否分享的训练日志数据；对验证数据和测试数据进行处理，得到形式为新项目、分享过该项目的用户集的验证日志数据和测试日志数据。

优选的，所述A3包括：

基于注意力机制融合新项目不同的属性特征获取新项目特征向量，基于长短期记忆网络从用户的历史点击数据中学习用户的兴趣特征向量；将新项目特征向量与用户的兴趣特征向量进行拼接，输入到四个多层感知机层，分别预测暴露→点击的概率、点击→点赞的概率、点赞→分享的概率、其他情况→分享的概率；基于上述四个概率计算出暴露→点击→点赞、暴露→点击→点赞/其他情况→分享的概率。

优选的，所述基于注意力机制融合新项目不同的属性特征获取新项目特征向量，包括：

给定新项目i的属性a＝[a₁，a₂，...，a_M]；

通过嵌入层将新项目的属性转换为嵌入向量，新项目的属性嵌入矩阵表示为

其中：d是嵌入向量的维度，M是新项目属性的个数，

是属性a_m的嵌入向量；

利用注意力机制将新项目的不同属性特征进行加权融合，得到新项目特征向量；

所述基于长短期记忆网络从用户的历史点击数据中学习用户的兴趣特征向量，包括：

给定用户历史点击的项目序列{i₁，i₂，...，i_N}；

通过嵌入层将项目序列转化成嵌入向量为

通过LSTM网络将嵌入向量转化成用户的兴趣特征向量为e_u。

优选的，所述A4包括：

在训练多任务模型时，依据暴露→点击、暴露→点击→点赞、暴露→点击→点赞/其他情况→分享分别构建交叉熵损失函数，再对其进行加权求和，形成多任务模型的联合损失函数；

其中：w_c、w_z、w_s分别是点击、点赞、分享行为的权重，其满足w_c+w_z+w_s＝1；

是点击行为对应的损失函数；

是点赞行为对应的损失函数；

是分享行为对应的损失函数；

利用Adam优化器对模型进行训练，并依据训练好的多任务模型在验证数据上的表现来优化多任务模型的超参数。

第二方面，发明提供一种面向新项目推广的个性化推荐系统，所述系统包括：

数据获取模块，用于获取候选用户日志数据和发布者发布的待推广的新项目数据；

推荐模块，用于基于预先构建的多任务模型、所述候选用户日志数据和所述待推广的新项目数据获取候选用户分享所述新项目的概率，选择分享概率为top-N的候选用户作为推荐用户。

第三方面，本发明提供一种计算机可读存储介质，其存储用于面向新项目推广的个性化推荐的计算机程序，其中，所述计算机程序使得计算机执行如权上述所述的面向新项目推广的个性化推荐方法。

第四方面，本发明提供一种电子设备，包括：

一个或多个处理器；

存储器；以及

一个或多个程序，其中所述一个或多个程序被存储在所述存储器中，并且被配置成由所述一个或多个处理器执行，所述程序包括用于执行如上述所述的面向新项目推广的个性化推荐方法。

(三)有益效果

本发明提供了一种面向新项目推广的个性化推荐方法和系统。与现有技术相比，具备以下有益效果：

本发明基于预先构建的多任务模型、所述候选用户日志数据和所述待推广的新项目数据获取候选用户分享所述新项目的概率，选择分享概率为top-N的候选用户作为推荐用户。本发明综合考虑了用户和项目发布者的利益，将新项目推荐给可能会采取分享行为的用户，不仅能向用户推荐其感兴趣的新项目，还能提升新项目的推广效果，提升项目发布者的知名度以及活跃度，促进社交媒体网站和网络社区的良性发展。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种面向新项目推广的个性化推荐方法的框图；

图2为发明实施例中多任务模型示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例通过提供一种面向新项目推广的个性化推荐方法和系统，解决了现有的新项目推荐方法推广效果较低的技术问题，实现提升推广效果，提升新项目发布者的知名度。

本申请实施例中的技术方案为解决上述技术问题，总体思路如下：

目前，针对新项目推荐的研究已经有很多。主要有两种方式，一种是使用基于内容的过滤方法，另外一种是将协同过滤与基于内容的方法进行混合。然而，目前的新项目推荐方法都是从用户的角度出发，只考虑新项目与用户兴趣的匹配度。但对于企业或者新项目的发布者而言，则希望新项目能够尽快的推广出去，获得更多的关注和热度。因此，在实现新项目推荐时，也尽可能将新项目推广出去，是一个有价值的问题。已有研究表明，社交网站上人们之间的相互联系可以加强信息传播的过程，并扩大这些信息的影响。像分享这样的互动，则可以直接或间接地影响社交网络中的其他人，加快信息的传播。因此，利用用户的分享行为，可以有效实现新项目的推广。但目前关于面向新项目推广的个性化推荐的研究还非常少，用户的分享行为并没有被充分利用，如何在解决新项目冷启动问题的同时也推广新项目还有待进一步研究。针对上述问题，本发明实施例提出了一种面向新项目推广的个性化推荐方法，该方法同时考虑了用户和项目发布者的利益，将新项目推荐给可能会采取分享行为的用户，不仅能向用户推荐其感兴趣的新项目，还能为新项目带来一定的推广效果，提升项目发布者的知名度以及活跃度，促进社交媒体网站和网络社区的良性发展。本发明使用注意力机制融合了不同的属性特征，可以为不同的属性赋予不同的权重，能够得到更加准确的新项目特征表示，解决新项目的冷启动问题。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

本发明实施例提供一种面向新项目推广的个性化推荐方法，如图1所示，该方法包括步骤S1～S2：

本发明实施例综合考虑了用户和项目发布者的利益，将新项目推荐给可能会采取分享行为的用户，不仅能向用户推荐其感兴趣的新项目，还能提升新项目的推广效果，提升项目发布者的知名度以及活跃度，促进社交媒体网站和网络社区的良性发展。

下面对本发明实施例的实现过程进行详细说明：

在步骤S1中，获取候选用户日志数据和发布者发布的待推广的新项目数据。具体实施过程如下：

候选用户日志数据包括：用户、与用户发生交互关系的项目、发生交互关系的时间以及具体的交互关系，具体的交互关系包括点击、点赞和分享行为。

发布者发布的待推广的新项目数据包括：项目的发布者、发布时间和发布内容等。

在步骤S2中，基于预先构建的多任务模型、所述候选用户日志数据和所述待推广的新项目数据获取候选用户分享所述新项目的概率，选择分享概率为top-N的候选用户作为推荐用户。具体实施过程如下：

需要说明的是，在本发明实施例中，所述预先构建的多任务模型的构建过程如下：

A1、获取日志数据、与日志数据中的用户发生交互的项目数据。

具体为：

日志数据中包括：用户、与用户发生交互的项目、时间戳以及点击、点赞、分享行为是否发生的标签；

项目数据包括：项目的发布者、发布时间、内容等等。

A2、对日志数据和项目数据进行预处理，得到训练数据、测试数据和验证数据，所述训练数据、测试数据和验证数据中均包括用户的历史点击数据和新项目数据，所述新项目数据为训练数据、测试数据和验证数据中所对应的时间范围内产生的项目。具体为：

A201、将日志数据按照时间划分，某个时间点以前发生的点击行为当作用户的历史点击数据，而该时间点以后的数据按照天数6：2：2的比例划分为训练数据、验证数据以及测试数据；

A202、分别获取训练、验证、测试数据中所涉及到的建模过程中的新项目的相关日志记录，其中新项目指的是在各个数据中所对应的时间范围内产生的项目。比如训练数据是2020/11/01-2020/11/18期间产生的日志数据，则训练集中的新项目指的就是在2020/11/01-2020/11/18产生的项目。

用户的历史点击数据即用户行为数据，即用户在过去点击过的项目序列。

A3、获取初始多任务模型。具体包括：

首先基于注意力机制融合新项目不同的属性特征获取新项目特征向量，同时基于长短期记忆网络(LSTM)从用户的点击历史中学习用户的兴趣特征向量。然后将新项目特征向量与用户的兴趣特征向量进行拼接，输入到四个多层感知机(MLP)层，分别预测“暴露→点击”、“点击→点赞”、“点赞→分享”、“其他情况→分享”的概率。基于这四个概率再进一步的计算出“暴露→点击→点赞”、“暴露→点击→点赞/其他情况→分享”的概率。

其中：

基于注意力机制融合新项目不同的属性特征获取新项目特征向量这一过程通过新项目特征建模实现。具体为：

在社交媒体网站和网络社区中，项目往往具有不同的属性信息，虽然这些属性都是对项目的描述，但不同方面的属性对于用户的影响往往是不同的。利用注意力模型可以学习项目不同方面属性的不同重要性。给定新项目i的属性a＝[a₁,a₂,…,a_M]，具体建模过程如下：

首先，需要经过嵌入层将新项目的属性转换为嵌入向量，这个嵌入向量是随机初始化的，后面会根据模型的训练进行不断学习。新项目的属性嵌入矩阵可表示为

其中：d是嵌入向量的维度，M是新项目属性的个数，

是属性a_m的嵌入向量。

然后利用注意力机制将新项目的不同属性特征进行加权融合，得到新项目特征向量。具体公式如下：

其中：

是注意力网络的参数，d₁是注意力网络参数维度；s(x)是Leakly ReLU激活函数。将得到的α_m进行归一化，即可得到不同方面属性的重要性α′_m。再进行加权求和即可得到新项目特征向量e_i。

基于长短期记忆网络(LSTM)从用户的点击历史中学习用户的兴趣特征向量通过用户特征建模实现。具体为：

用户的点击历史可以很好的反映用户的偏好，这里利用LSTM网络进行学习。给定用户过去点击过的项目序列{i₁，i₂，...，i_N}，经过嵌入层，可以得到对应项目的嵌入向量为

经过LSTM网络，最终可得到用户的兴趣特征向量为e_u。LSTM网络包括输入门、遗忘门以及输出门，具体计算公式如下所示：

i_t＝σ(W_i·[h_t-1，x_t]+b_i)

f_t＝σ(W_f·[h_t-1，x_t]+b_f)

o_t＝σ(W_o·[h_t-1，x_t]+b_o)

h_t＝o_t*tanh(c_t)

其中：W_c、W_i、W_f、W_o是权重矩阵，b_c、b_i、b_f、b_o是偏置向量；h_t-1和h_t分别表示t-1时刻和t时刻的隐藏状态；x_t是t时刻的输入向量；

是候选值，它是经过tanh层得到的；c_t-1和c_t分别代表t-1时刻和t时刻的细胞状态；i_t、f_t、o_t分别表示输入门、遗忘门和输出门。

将新项目特征向量e_i和用户的兴趣特征向量e_u进行拼接，分别输入到四个预测网络中。这里使用MLP作为预测网络，分别预测的是“暴露→点击”、“点击→点赞”、“点赞→分享”、“其他情况→分享”的概率。四个MLP层结构相同，但参数不共享。MLP层的公式表示如下：

z₁＝ReLU(W₁[e_i，e_u]+b₁)

……

z_L＝ReLU(W_Lz_L-1+b_L)

y_i＝σ(h^Tz_L+b)

其中：L表示多层感知机中隐藏层的数量，W_x、b_x是第x个隐藏层的权重矩阵和偏置向量，隐藏层使用的激活函数为ReLU函数，这有利于建立深层模型。[e_i，e_u]表示的是将新项目特征向量e_i和用户的兴趣特征向量e_u进行拼接。h和b是输出层的权重向量和偏置，输出层使用的激活函数为sigmoid函数，可以得到预测的概率y_i。通过四个预测网络模块，可分别得到“暴露→点击”的预测概率

“点击→点赞”的预测概率

“点赞→分享”的预测概率

“其他情况→分享”的预测概率

再进行点击、点赞、分享行为的预测：

其中：

分别是“暴露→点击”的预测概率、“暴露→点击→点赞”的预测概率、“暴露→点击→点赞/其他情况→分享”的预测概率。

其中：“暴露→点击”、“点击→点赞”、“点赞→分享”、“点击→其他情况”、“其他情况→分享”的计算公式如下：

用户的行为路径可以分解为5个基本路径，包括“暴露→点击”、“点击→点赞”、“点赞→分享”、“点击→其他情况”、“其他情况→分享”。每个路径的条件概率计算公式如下：

(1)“暴露→点击”路径的概率描述的是给定一个项目已经被暴露在用户的视野下，该用户点击这个项目的条件概率。其用公式表示如下：

其中：c_i∈{0，1}定义的是项目i是否被点击，i∈[1，N]，N为项目总数；v_i∈{0，1}表示的是项目i是否被用户看到；y_1i是“暴露→点击”的条件概率的表示符。

(2)“点击→点赞”路径的概率描述的是在给定一个项目已经被用户点击的条件下，该用户点赞这个项目的概率。其用公式表示如下：

其中：z_i∈{0，1}定义的是项目i是否被点赞，y_2i是“点击→点赞”的条件概率的表示符。

(3)“点赞→分享”路径的概率描述的是在给定一个项目已经被用户点赞的条件下，该用户分享这个项目的概率。其用公式表示如下：

其中：s_i∈{0，1}定义的是项目i是否被分享，y_3i是“点赞→分享”的条件概率的表示符。

(4)“点击→其他情况”路径的概率描述的是在给定一个项目已经被用户点击的条件下，该用户没有点赞该项目的概率。其用公式表示如下：

P(z_i＝0|v_i＝1，c_i＝1)＝1-y_2i

(5)“其他情况→分享”路径的概率描述的是在给定一个项目已经被用户点击但没有被点赞的条件下，该用户分享这个项目的概率。其用公式表示如下：

其中：y_4i是“其他情况→分享”的条件概率的表示符。

基于这5个基本路径的概率，可进一步算出“暴露→点击→点赞”的概率，其计算公式为：

“暴露→点击→点赞/其他情况→分享”的计算公式如下：

A4、基于训练数据、验证数据以及测试数据对初始多任务模型进行训练、验证和测试，得到最终的多任务模型。

在训练模型的时候，依据“暴露→点击”、“暴露→点击→点赞”、“暴露→点击→点赞/其他情况→分享”分别构建交叉熵损失函数，再对其进行加权求和，形成模型的联合损失函数。

具体地，训练的三部分损失函数包括：

(1)点击行为对应的损失函数表示如下：

其中：C₊和C_-是点击行为的正负样本集。

(2)点赞行为对应的损失函数表示如下：

其中：Z₊和Z_-是点赞行为的正负样本集。

(3)分享行为对应的损失函数表示如下：

其中：S₊和S_-是分享行为的正负样本集。

最终的训练目标为最小化以下联合损失函数：

其中：w_c、w_z、w_s分别是点击、点赞、分享行为的权重，其满足w_c+w_z+w_s＝1，控制的是不同类型的行为在联合训练中的影响大小。

然后利用Adam优化器对模型进行训练，并依据训练好的模型在验证数据上的表现来优化模型的超参数。可以优化的超参数包括嵌入向量的维度d；注意力网络参数维度d₁；长短期记忆网络隐藏层的维度；多层感知机中隐藏层的数量L；多层感知机隐藏层的维度；损失函数中点击、点赞、分享行为的权重w_c、w_z、w_s；学习速率；批量大小。

在验证和测试的时候，是针对每一个特定的新项目，都会依据多任务模型预测出所有用户分享这个新项目的概率，然后按照概率值由大到小排序，将排在前N位的用户作为推荐列表，基于用户的反馈，即通过分享过该项目的用户集以进一步计算相关指标，如准确率、召回率等，对多任务模型的超参数进行优化，得到多任务模型。

如图2所示，将候选用户的历史数据和待推广的新项目数据的属性输入到多任务模型中，得到候选用户的分享概率，选择分享概率为top-N的候选用户作为推荐用户。

本发明实施例还提供一种面向新项目推广的个性化推荐系统，该系统包括：

理解的是，本发明实施例提供的面向新项目推广的个性化推荐系统与上述面向新项目推广的个性化推荐方法相对应，其有关内容的解释、举例、有益效果等部分可以参考面向新项目推广的个性化推荐方法中的相应内容，此处不再赘述。

本发明实施例还提供一种计算机可读存储介质，其存储用于面向新项目推广的个性化推荐的计算机程序，其中，所述计算机程序使得计算机执行上述所述的面向新项目推广的个性化推荐方法。

本发明实施例还提供一种电子设备，包括：一个或多个处理器；存储器；以及一个或多个程序，其中所述一个或多个程序被存储在所述存储器中，并且被配置成由所述一个或多个处理器执行，所述程序包括用于执行上述所述的面向新项目推广的个性化推荐方法。

综上所述，与现有技术相比，具备以下有益效果：

1、本发明实施例综合考虑了用户和项目发布者的利益，将新项目推荐给可能会采取分享行为的用户，不仅能向用户推荐其感兴趣的新项目，还能提升新项目的推广效果，提升项目发布者的知名度以及活跃度，促进社交媒体网站和网络社区的良性发展。

2、由于分享行为相对与点击和点赞行为来说，是非常稀疏的。因此，本发明实施例构建了一个多任务模型，不仅会使用分享行为，还会将点击和点赞行为也考虑进来，缓解分享行为稀疏的问题，为训练模型中的参数提供了更好的支持，可以提升推荐结果的准确性。

3、对于新项目，由于其缺乏交互信息，存在冷启动问题，所以通常只能基于项目的属性来学习新项目的特征。但新项目的属性有很多，不同的属性反映的是项目不同方面的特征，因此其具有的重要性是不同的。本发明使用注意力机制融合了不同的属性特征，可以为不同的属性赋予不同的权重，能够得到更加准确的新项目特征表示。

需要说明的是，通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。