CN114168790A

CN114168790A - 一种基于特征自动组合的个性化视频推荐方法及系统

Info

Publication number: CN114168790A
Application number: CN202111138288.5A
Authority: CN
Inventors: 盛津芳; 黄河; 朱嘉富; 王斌
Original assignee: Hunan Xingsheng Optimized E Commerce Co ltd; Central South University
Current assignee: Hunan Xingsheng Optimized E Commerce Co ltd; Central South University
Priority date: 2021-09-27
Filing date: 2021-09-27
Publication date: 2022-03-11

Abstract

本发明公开了一种基于特征自动组合的个性化视频推荐方法及系统，该方法包括：根据用户唯一标识，通过基于深度神经网络的相似召回子模块，得到用户和视频的嵌入表示向量；将所述用户和视频的嵌入表示向量输入到向量相似性检索工具中，搜索得到用户感兴趣的多个初始推荐视频；将所述多个初始推荐视频，与通过热门召回子模块获取的多个热门视频，以及通过人工召回子模块获取的多个人工选定视频，进行组合形成视频推荐候选列表；通过用户唯一标识和对应的视频推荐候选列表，输入精准排序模块进行排序得到有序的视频推荐列表。本发明能自动进行用户特征和视频特征的组合，为用户提供个性化视频推荐。

Description

一种基于特征自动组合的个性化视频推荐方法及系统

技术领域

本发明涉及视频推荐技术领域，尤其涉及一种基于特征自动组合的个性化视频推荐方法及系统。

背景技术

随着信息技术和互联网的高速发展，尤其是短视频技术的发展，使得在互联网视频平台上，用户不仅可以作为视频的消费者，也可以成为视频的生产者。而随着移动设备性能的提升和第四代、第五代移动通信技术的广泛应用，视频生产更突破了时间空间的限制，在短视频平台上，每秒钟都会生产大量视频。视频量和用户量的井喷式增长也带来了视频过载的问题。视频过载是指由于视频量过于庞大和错综复杂，视频用户如何从大量视频中找到自己感兴趣的视频是一件非常困难的事情。

视频推荐系统是解决这一矛盾的重要工具，具有重大的研究价值。由于视频推荐系统的重要性，在视频推荐系统发展的早期，常见的推荐方法是简单的依据物品的销量、话题的点击量或新闻的阅读量等进行排序。但这种方法过于片面而且不够个性化。随后出现了基于矩阵分解的个性化推荐算法，但这种低维且线性的方法，缺少足够的泛化能力，即在未被训练的数据样本上的效果不够好。

目前比较通用的基于深度学习的算法，虽然满足了个性化推荐的要求，并且具有较好的泛化能力，但是没能很好地考虑到用户和视频特征的交叉组合。然而事实上，特征组合是具有实际意义的。例如一个用户是长沙的，并且是男性，他喜欢吃槟榔。如果不将“长沙”，“男性”两个特征组合起来一起训练的话，模型可能会得到“长沙人”喜欢吃槟榔，或者“男性”喜欢吃槟榔的结论，这是不恰当的。目前也有一些从业人员采用手动方式来组合特征，并进行训练，但是这种方式不够通用灵活。

发明内容

本发明提供了一种基于特征自动组合的个性化视频推荐方法及系统，其目的是为了解决目前视频推荐方法没能很好地考虑到用户和视频特征的交叉组合，导致视频用户难以准确地获得个性化视频推荐列表的技术问题。

为解决上述技术问题，本发明提出的技术方案为：

一种基于特征自动组合的个性化视频推荐方法，包括以下步骤：

根据用户唯一标识，通过基于深度神经网络的相似召回子模块，得到用户和视频的嵌入表示向量；

将用户和视频的嵌入表示向量输入到向量相似性检索工具中，搜索得到用户感兴趣的多个初始推荐视频；

将多个初始推荐视频，与通过热门召回子模块获取的多个热门视频，以及通过人工召回子模块获取的多个人工选定视频，进行组合形成视频推荐候选列表；

通过用户唯一标识和对应的视频推荐候选列表，输入精准排序模块进行排序得到有序的视频推荐列表。

优选地，基于深度神经网络的相似召回子模块，通过以下步骤训练得到：

收集用户侧信息、视频侧信息以及用户与视频的历史交互信息；根据用户与视频的历史交互信息计算得到用户对视频的偏好权重；构建每个样本为：用户-视频-偏好权重的训练数据库；

将用户唯一标识和对应的用户侧信息，以及视频唯一标识和对应的视频侧信息作为输入，以用户对视频的偏好权重作为监督标签，以用户未交互过的视频作为负采样数据，以用户和和视频嵌入表示向量作为输出，进行有监督的学习，训练得到基于深度神经网络的相似召回子模块。

优选地，相似召回子模块、热门召回子模块、人工召回子模块以及精准排序模块均通过离线训练，并依周期或者不定期的更新。

优选地，用户对视频的偏好权重的计算模型为：

weight＝(click_time×click_weight+like_time×like_weight+favorite_time×favorite_weight)×watch_time_ratio

其中weight为用户对视频的偏好权重；click_time，like_time，favourite_time分别表示用户点击该视频的次数，用户是否点赞该视频，以及用户是否收藏该视频；click_weight，like_weight，favourite_weight分别表示对应行为的权重；watch_time_ratio表示用户已观看该视频时长占总视频时长的占比。

优选地，精准排序模块，通过以下步骤训练得到：

将用户唯一标识、用户侧信息、以及视频推荐候选列表中的视频唯一标识、和视频侧信息作为输入，分别输入相互并列的特征自动组合层和深度学习层；特征自动组合层和深度学习层的输出向量拼接后输入到一层神经网络隐藏层，输出排序后的与用户唯一标识对应的视频推荐列表；采用绝对值损失函数衡量用户对该视频的实际偏好权重和训练结果的误差，使用梯度下降算法训练模型收敛至到误差较小的稳定状态，作为精准排序模块。

优选地，特征自动组合层，包括以下多个隐藏层，每一个隐藏层的输入输出如下：

x_l+1＝x₀x_lw_l+1+b_l+1+x_l

其中，x_l表示第l个隐藏层的输出，w_l表示第l个隐藏层的神经元权重，b_l表示第l个隐藏层的偏置。

优选地，特征自动组合层，使用下述函数作为神经网络激活函数：

y_i＝a_i×(1-p_i)×y_i+p_i×y_i；

其中y_i是神经元i的输出，E[y_i]和Var[y_i]是训练期间统计得到的均值和方差，∈是一个小的正数；a_i是一个很小的超参数，通常设置为0.01，p_i是可以训练的变量，用来激活神经元的传播。

本发明还提供一种基于特征自动组合的个性化视频推荐系统，包括：

侧信息模块，用于收集用户侧信息和视频侧信息，用户侧信息包括用户画像，视频侧信息包括视频的属性信息；

交互记录模块，用于记录用户与视频的历史交互信息，包括用户点击行为、点赞行为、收藏行为以及观看时长；

快速召回模块，以及

精准排序模块，用于通过用户唯一标识和对应的视频推荐候选列表，进行排序得到有序的视频推荐列表；

其中，快速召回模块包括：

相似召回子模块，用于根据用户唯一标识，得到用户和视频的嵌入表示向量；

向量相似性检索工具，用于根据用户和视频的嵌入表示向量，搜索得到用户感兴趣的多个初始推荐视频；

热门召回子模块，用于获取多个热门视频；

人工召回子模块，用于获取多个人工选定视频；

以及，视频组合模块，用于将多个初始推荐视频，多个热门视频，以及多个人工选定视频，进行组合形成视频推荐候选列表。

本发明还提供一种计算机系统，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述任一方法的步骤。

本发明还提供一种计算机存储介质，其上存储有计算机程序，程序被处理器执行时实现上述任一方法中的步骤。

本发明具有以下有益效果：

本发明的基于特征自动组合的个性化视频推荐方法及系统，通过用户与视频交互记录，能快速生成推荐候选集，挖掘用户兴趣爱好；并将初始推荐视频与热门视频和人工选取的视频组合并排序得到最终视频推荐列表，能为用户提供个性化视频推荐。

除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照附图，对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明实施例的基于特征自动组合的个性化视频推荐方法的流程图；

图2为本发明实施例的基于特征自动组合的个性化视频推荐系统的架构图；

图3为本发明实施例的计算用户对视频偏好权重的流程图；

图4为本发明实施例的相似召回子模块的示意图；

图5为本发明实施例的精准排序模块的示意图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

参见图1，本发明的基于特征自动组合的个性化视频推荐方法，预测阶段，包括以下步骤：

上述的步骤中，参见图5，相似召回子模块、热门召回子模块、人工召回子模块以及精准排序模块均通过离线训练，并依周期或者不定期的更新(发布)。

其中，本实施例的基于深度神经网络的相似召回子模块，优选通过以下步骤训练得到：

收集用户侧信息、视频侧信息以及用户与视频的历史交互信息。数据收集时，将用户侧信息、视频侧信息记录到数据库中，通过埋点技术收集用户视频的交互信息，存储到数据库中。本实施例中，采用的是Kafka消息队列和Hive大数据存储引擎。

根据用户与视频的历史交互信息计算得到用户对视频的偏好权重。构建每个样本为：用户-视频-偏好权重的训练数据库。

将用户唯一标识和对应的用户侧信息，以及视频唯一标识和对应的视频侧信息作为输入，以用户对视频的偏好权重作为监督标签，以用户未交互过的视频作为负采样数据，以用户和和视频嵌入表示向量作为输出，进行有监督的学习，训练得到基于深度神经网络的相似召回子模块。实施时，通过离线训练，定期训练和发布快速召回模块中的相似召回子模块。

其中，本实施例的精准排序模块，优选通过以下步骤训练得到：

将用户唯一标识、用户侧信息、以及视频推荐候选列表中的视频唯一标识、和视频侧信息作为输入，分别输入相互并列的特征自动组合层和深度学习层；特征自动组合层和深度学习层的输出向量拼接后，将拼接向量输入到送入1层输出维度为1的神经网络隐藏层，输出排序后的与用户唯一标识对应的视频推荐列表；采用绝对值损失函数衡量用户对该视频的实际偏好权重和训练结果的误差，使用梯度下降算法训练模型收敛至到误差较小的稳定状态，作为精准排序模块。

通过上述步骤，本发明的基于特征自动组合的个性化视频推荐方法及系统，通过用户与视频交互记录，能快速生成推荐候选集，挖掘用户兴趣爱好；并将初始推荐视频与热门视频和人工选取的视频组合并排序得到最终视频推荐列表，能为用户提供个性化视频推荐。

对应上述的方法，本发明实施例还提供一种基于特征自动组合的个性化视频推荐系统，包括：

侧信息模块，用于收集用户侧信息和视频侧信息，用户侧信息包括用户画像，视频侧信息包括视频的属性信息。视频侧信息包括视频上传时，创作者填写的视频的类别、标签、语言、以及视频本身的长度等信息，用户侧信息包括用户注册时填写的用户性别、爱好、地区等信息。收集到这些侧信息后可作为作为快速召回模块和精准排序模块的训练数据。

交互记录模块，用于记录用户与视频的历史交互信息，包括用户点击行为、点赞行为、收藏行为以及观看时长。并计算其与交互视频的偏好权重，存入数据库中。用户交互行为通过三个标识来确认，即用户标识(uId)、视频标识(vId)和行为标识(like_time,favorite_time,watch_time_ratio)。通过序列化使用消息队列保存，其中队列采用先进先出的消费逻辑。将数据写入到大数据存储引擎Hive中，通过编写Hive结构化查询语句计算用户对视频的偏好权重。

通过交互记录模块后，我们可以得到(用户，视频，偏好权重)的大量交互数据，将用户唯一标识(uId)、用户侧信息、视频唯一标识(vId)、视频侧信息，作为输入数据，偏好权重作为监督标签，就可以进行后续快速召回模块和精准排序模块的训练和预测。

快速召回模块，该模块主要用于生成候选视频列表。包括：

相似召回子模块，用于根据用户唯一标识，得到用户和视频的嵌入表示向量；将用户唯一标识(uId)、用户侧信息、视频唯一标识(vId)、视频侧信息，作为输入数据，偏好权重作为标签，通过深度神经网络进行有监督学习，从而得到用户和视频的嵌入表示向量。

向量相似性检索工具，用于根据用户和视频的嵌入表示向量，搜索得到用户感兴趣的多个初始推荐视频。使用高性能向量检索工具根据用户嵌入表示向量得到最可能感兴趣的N1(例如N1取30)个视频vId。

热门召回子模块，用于获取多个热门视频；选取最热门的N2(例如N2取10)个视频vId。

人工召回子模块，用于获取多个人工选定视频；人工选取N3(例如N3取10)个视频vId。

以及，视频组合模块，用于将多个初始推荐视频，多个热门视频，以及多个人工选定视频，进行组合形成视频推荐候选列表。将上述3种方法得到的视频候选列表合并，得到最终的候选列表candidate_vIds。

本实施例的个性化视频推荐系统还包括：精准排序模块，用于通过用户唯一标识和对应的视频推荐候选列表，进行排序得到有序的视频推荐列表。该模块的主要目的是将快速召回模块得到的candidate_vIds进行进一步的精准排序。在精准排序模块使用深度神经网络分别构建特征自动组合层和深度学习层，利用深度神经网络的强鲁棒性，自动获取适合的特征组合方式。并利用深度神经网络层，提高模型的泛化能力。

图3为计算用户对视频偏好权重的流程示意图。主要包括四个步骤：

步骤1：埋点。在客户端，通过埋点技术可以在用户触发某些特定行为时，生成对应的记录数据，采用对象序列化技术，将每一条记录数据转为字符串进行传递。

记录规范为：{“uId”:uId,“vId”:vId,“behave_type”:behave_type,“num”:num}；

其中uId为唯一用户标识,vId为唯一视频标识。behave_type有三种取值，分别是like,favorite,end,num表示对应行为的数值，例如当behave_type为like时，num可取1和0，分别表示用户点赞和取消点赞了该视频，同理，当behave_type为favorite时，num的0和1表示用户收藏和取消收藏了该视频。当behave_type为end时，num取值范围为0到1之间，表示用户观看时长占视频总时长的比例。

步骤2：记录存入数据库。得到规范化的记录数据后，可以通过Kafka消息队列来接收记录数据，并且在数据条数累积到一定数额(例如1000)之后，再将记录数据存储到Hive分布式数据库中，这么做可以避免每生成一条记录数据就对Hive数据库进行一次写操作，能够有效提高数据库性能。

在Hive数据库设计一张表(例如表名为records)，用来存储记录数据，表至少包括uId,vId,like_time,favorite_time,watch_time_ratio五个字段。

步骤3：定制查询语句计算偏好权重。得到记录数据后，需要定制查询语句，计算用户对视频的偏好权重的同时，将数据取出，用于后续的模型训练。

偏好权重计算公式：

例如当clikc_weight取1,like_weight取2，favorite_weight取3，可以定制结构化查询语句如下：

SELECT uId,vId,(click_time*1+like_time*2+favorite_time*3)*watch_time_ratio ASweight FROM records；

步骤4：得到可训练的数据。定制好结构化查询语句后，可以使用语句：

hive-e“SELECT uId,vId,(click_time*1+like_time*2+favorite_time*3)*watch_time_ratio as weight FROM records；”>>data.csv；

将其转存为csv文件供训练使用。

图4为相似召回子模块的示意图，主要包括三层：输入层，表示层和匹配层。

输入层：输入层主要作用是将用户或视频的输入(例如uId，vId，对应的侧信息)转换为欧式空间的向量，这一步可采用的方法有one-hot编码等。

表示层：表示层是学习用户和视频表示向量的关键层，主要是利用了深度神经网络的强表征能力，通过若干隐藏层，使用梯度下降算法，不断优化每一层的权重数值，就可以将表示层最终的输出作为用户和视频的表示向量。

匹配层：匹配层是决定表示效果的关键层，在这一层，通过使用向量内积的方式可以得到一个训练样本中，就可以得到该用户对该视频的模型的得分，也可以理解为模型预测偏好权重。计算方式如下：

其中，a、b分别表示一个训练样本中用户和视频在表示层得到的表示向量。将这个得分与在交互记录模块计算得到的用户对视频的实际偏好权重对比，就可以建立有监督学习，通过反向传播就可以不断优化模型。

得到用户、视频的表示向量之后，通过高性能向量相似性检索工具(例如faiss、Elasticsearch)就可以快速得到指定用户最感兴趣的N1个视频。

图5为精准排序模块示意图。该模块主要由特征自动组合层和深度学习层组成。其中深度学习层与相似召回子模块的表示层类似。

特征自动组合层的特点是可以显式的学习特征交叉，每一层的输入输出为：

x_l+1＝x₀x_lw_l+1+b_l+1+x_l

特征自动组合层是通过特征相乘的方式形成合成特征，有助于表示非线性关系。特征自动组合层的特殊结构使得交叉特征的阶数随着网络的深度加深而增加。对于L层的特征自动组合层，其交叉特征的阶数最高可以达到L+1阶。特征自动组合层的时间复杂度、空间复杂度都是输入维度的线性函数。因此特征自动组合层相对于右侧的深度学习层来讲，其代价几乎是可以忽略不计的。

在实际训练和预测的过程中，将用户和视频的uId,，vId，侧信息的嵌入表示拼接起来得到新的向量，计算方式如下：

o^*＝o¹+o²

其中o¹表示特征自动组合层最终的输出向量，o²表示深度学习层的最终输出，+在这里表示拼接操作，即将o²的元素依次添加到o¹后方。

得到o^*后，作为输入，送入一层输出维度为1的神经网络隐藏层，这样就联合了特征自动组合层和深度学习层的输出，采用绝对值损失函数衡量用户对该视频的实际偏好权重和训练结果的差异，损失函数的计算方式如下：

L(Y,f(x))＝|Y-f(x)|

其中Y表示用户对该视频的实际偏好权重，f(x)表示模型的输出值，其含义是模型预测的用户对该视频的偏好权重，事实上，模型输出值和用户实际偏好权重是有误差的，为此需要通过算法来训练模型到一个误差较小的状态。

本发明使用的是随机梯度下降算法。其计算方式为：

其中f_i(x)表示随机采样的样本i的输出，

表示对其求偏导，η表示学习率，即可以调整梯度下降的幅度，和模型收敛的速率。事实上，在实际应用中，可以将η初始化为一个比较大的值，然后随着训练迭代次数的增加而逐渐减小，这样做的好处是能够保证收敛速率的同时，尽可能提高收敛的效果、模型的准确率，如果一直保持一个较大的η值，可能导致模型无法收敛。

在实际训练中，为了提高模型的鲁棒性，需要使用激活函数，即针对每一个神经元的输出，需要通过一个激活函数的映射之后再输出。本实施例使用的激活函数如下所示：

y_i＝a_i×(1-p_i)×y_i+p_i×y_i

其中y_i是神经元i的输出，E[y_i]和Var[y_i]是训练期间统计得到的均值和方差，∈是一个小的正数，目的是为了使结果变得平滑。a_i是一个很小的超参数，通常设置为0.01，p_i是可以训练的变量，用来激活神经元的传播。

本发明还提供一种计算机系统，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述任一实施例的步骤。

本发明还提供一种计算机存储介质，其上存储有计算机程序，程序被处理器执行时实现上述任一实施例中的步骤。

综上可知，本发明针对现有推荐系统的不足，公开了基于特征自动组合的个性化视频推荐方法及系统，对用户视频交互记录自动记录，快速生成初始推荐视频，将初始推荐视频与热门视频和人工选取的视频组合并排序得到最终视频推荐列表。本发明能自动进行用户特征和视频特征的组合，为用户提供个性化视频推荐。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于特征自动组合的个性化视频推荐方法，其特征在于，包括以下步骤：

将所述用户和视频的嵌入表示向量输入到向量相似性检索工具中，搜索得到用户感兴趣的多个初始推荐视频；

将所述多个初始推荐视频，与通过热门召回子模块获取的多个热门视频，以及通过人工召回子模块获取的多个人工选定视频，进行组合形成视频推荐候选列表；

2.根据权利要求1所述的基于特征自动组合的个性化视频推荐方法，其特征在于，所述基于深度神经网络的相似召回子模块，通过以下步骤训练得到：

收集用户侧信息、视频侧信息以及用户与视频的历史交互信息；根据所述用户与视频的历史交互信息计算得到用户对视频的偏好权重；构建每个样本为：用户-视频-偏好权重的训练数据库；

3.根据权利要求1所述的基于特征自动组合的个性化视频推荐方法，其特征在于，所述相似召回子模块、热门召回子模块、人工召回子模块以及精准排序模块均通过离线训练，并依周期或者不定期的更新。

4.根据权利要求2所述的基于特征自动组合的个性化视频推荐方法，其特征在于，所述用户对视频的偏好权重的计算模型为：

5.根据权利要求1所述的基于特征自动组合的个性化视频推荐方法，其特征在于，所述精准排序模块，通过以下步骤训练得到：

将用户唯一标识、用户侧信息、以及视频推荐候选列表中的视频唯一标识、和视频侧信息作为输入，分别输入相互并列的特征自动组合层和深度学习层；所述特征自动组合层和深度学习层的输出向量拼接后输入到一层神经网络隐藏层，输出排序后的与用户唯一标识对应的视频推荐列表；采用绝对值损失函数衡量用户对该视频的实际偏好权重和训练结果的误差，使用梯度下降算法训练模型收敛至到误差较小的稳定状态，作为精准排序模块。

6.根据权利要求5所述的基于特征自动组合的个性化视频推荐方法，其特征在于，

所述特征自动组合层，包括以下多个隐藏层，每一个隐藏层的输入输出如下：

x_l+1＝x₀x_lw_l+1+b_l+1+x_l

7.根据权利要求5所述的基于特征自动组合的个性化视频推荐方法，其特征在于，所述特征自动组合层，使用下述函数作为神经网络激活函数：

y_i＝a_i×(1-p_i)×y_i+p_i×y_i；

其中y_i是神经元i的输出，E[y_i]和Var[y_i]是训练期间统计得到的均值和方差，

是一个小的正数；a_i是一个很小的超参数，通常设置为0.01，p_i是可以训练的变量，用来激活神经元的传播。

8.一种如权利要求1至7中任一项所述的基于特征自动组合的个性化视频推荐系统，其特征在于，包括：

侧信息模块，用于收集用户侧信息和视频侧信息，所述用户侧信息包括用户画像，视频侧信息包括视频的属性信息；

快速召回模块，以及

其中，快速召回模块包括：

向量相似性检索工具，用于根据所述用户和视频的嵌入表示向量，搜索得到用户感兴趣的多个初始推荐视频；

热门召回子模块，用于获取多个热门视频；

人工召回子模块，用于获取多个人工选定视频；

以及，视频组合模块，用于将所述多个初始推荐视频，多个热门视频，以及多个人工选定视频，进行组合形成视频推荐候选列表。

9.一种计算机系统，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述权利要求1至7任一所述方法的步骤。

10.一种计算机存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现上述权利要求1至7任一所述方法中的步骤。