CN114282054A

CN114282054A - 一种视频推荐方法、装置、计算机设备和存储介质

Info

Publication number: CN114282054A
Application number: CN202011041634.3A
Authority: CN
Inventors: 许良武; 姜栋栋
Original assignee: Suning Cloud Computing Co Ltd
Current assignee: Suning Cloud Computing Co Ltd
Priority date: 2020-09-28
Filing date: 2020-09-28
Publication date: 2022-04-05
Also published as: CA3132002A1

Abstract

本申请涉及一种视频推荐方法、装置、计算机设备和存储介质。方法包括：获取视频的向量化表示；确定目标用户，根据视频分类标签，获取目标用户的多维度向量化；针对每个视频分类标签，划分用户群，确定与所述目标用户相似的用户群；根据每个视频分类标签下的推荐集合，构建推荐结果集。本发明根据用户的观看历史，针对用户的主要兴趣点来计算相似用户群，过滤掉热点和误点视频，进行用户协同，最终将不同兴趣画像下的协同推荐结果按照兴趣占比构成最终的用户推荐结果，推荐更精准。

Description

一种视频推荐方法、装置、计算机设备和存储介质

技术领域

本申请涉及用户推荐技术领域，特别是涉及一种视频推荐方法、装置、计算机设备和存储介质。

背景技术

对于视频播放平台而言，由于庞大的用户规模和海量的视频资源，已造成严重的信息过载问题。通常采用搜索和推荐系统两种策略，将目标用户与相似的优质视频建立联系，来提升用户停留时长和满意度。

推荐系统通常采用多路召回策略，用户协同作为其中最常用的召回算法，相较于主题模型等算法能很好地发散用户兴趣，带来推荐结果的多样性。传统的用户协同算法基于用户物品矩阵建立物品到用户之间的倒排表，进而构建用户相似度矩阵的方式，只关注共现矩阵，不同时间和不同物品贡献度相同，且不便于剔除一些并不能代表用户兴趣的热点物品和误点物品。同时，由于用户规模和视频规模都非常大，计算用户相似度矩阵代价很大，此外数据稀疏问题也导致寻找相似用户精度不高也直接影响着推荐质量。

因此，为了使得用户在海量视频中发现自己感兴趣的内容，精准的用户画像和推荐系统起到举足轻重的作用。

发明内容

本发明旨在解决传统用户协同算法用户相似度矩阵计算代价过大，以及数据稀疏带来的相似度不高等问题。基于此，有必要针对上述技术问题，提供一种视频表示和用户画像均采用向量化，映射到低维的稠密空间的视频推荐方法、装置、计算机设备和存储介质。

一种视频推荐方法，方法包括：

获取视频的向量化表示；

确定目标用户，根据视频分类标签，获取目标用户的多维度向量化；

针对每个视频分类标签，划分用户群，确定与目标用户相似的用户群；

根据每个视频分类标签下的推荐集合，构建推荐结果集。

在一个实施例中，，获取视频的向量化表示，包括：

根据文本语料库，获得文本语料库中每个词的词向量和IDF值；

对视频标题进行分词处理，生成视频的特征词；

根据文本语料库中每个词的词向量和IDF值，获取视频的向量化表示。

在一个实施例中，确定目标用户，根据视频分类标签，获取目标用户的多维度向量化，包括：

根据用户的历史播放记录，确定目标用户；

根据目标用户的播放记录以及视频分类标签，统计目标用户的不同视频分类标签下的视频占比，确定目标用户的兴趣分类；

根据兴趣分类对应的视频分类标签进行用户画像，计算该目标用户的多维度向量表示。

在一个实施例中，将包含视频数达到TopN且视频数占比符合预设占比阈值的视频分类标签确定为该目标用户的兴趣分类，其中N为大于1的正整数。

在一个实施例中，针对每个视频分类标签，划分用户群，确定与目标用户相似的用户群，包括：

分别对每个视频分类标签下的用户进行分层抽样，划分用户群；

计算每个用户群包含的用户之间的相似度；

倒序排列相似度，取TopK的用户形成目标用户的相似用户群，其中，K为大于1的正整数。

在一个实施例中，聚类统计相似用户群中每个用户的同一视频分类标签下的视频播放记录，过滤目标用户在该视频分类标签下已播放的视频，确定播放数量TopE的视频形成推荐待选列表，构建推荐集合，其中，E为大于1的正整数。

在一个实施例中，根据每个视频分类标签下的推荐集合，构建推荐结果集，包括：

根据目标用户的兴趣分类，确定兴趣分类对应的每个视频分类标签下的推荐集合；

按照目标用户的兴趣分类中的每个视频分类标签的视频占比，在每个视频分类标签下的推荐集合中获取相应数量的视频，构建最终的推荐结果集；

其中，在每个推荐集合中，根据视频播放次数，倒序选择构建到推荐结果集的视频。

一种视频推荐装置，装置包括：

视频向量化组件，用于获取视频的向量化表示；

用户多维向量化组件，用于确定目标用户，根据视频分类标签，获取目标用户的多维度向量化；

相似用户群组件，用于针对每个视频分类标签，划分用户群，确定与目标用户相似的用户群；

视频协同推荐组件，用于根据每个视频分类标签下的推荐集合，构建推荐结果集。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一实施例所述方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一实施例所述的方法的步骤。

上述视频推荐方法、装置、计算机设备和存储介质，考虑到物品的深层语义关系，突出关键字，以及时间衰减等策略，使得在用户画像过程中不同视频不同时间的贡献度不同，更好地满意用户兴趣转移的需求。根据用户的观看历史，针对用户的主要兴趣点来计算相似用户群，过滤掉热点和误点视频，进行用户协同，最终将不同兴趣画像下的协同推荐结果按照兴趣占比构成最终的用户推荐结果，推荐更精准。

附图说明

图1为本发明中视频推荐方法的流程示意图；

图2为本发明中视频向量化的流程示意图；

图3为本发明中用户多维度向量化的流程示意图；

图4为本发明中用户协同推荐的流程示意图；

图5为本发明中视频推荐装置的结构框图；

图6为本发明中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供了一种视频推荐方法，如图1所示，包括以下步骤：

S100，获取视频的向量化表示。

在本实施例中，需要将视频采用低维的稠密向量化表示。

在一个实施例中，S110，根据文本语料库，获得文本语料库中每个词的词向量和IDF值。

在本实施例中，通过大量的语料库、领域词库(如娱乐明星、体育明星等)和/或停用词库等文本语料库，进行分词、TF-IDF训练和word2vec词向量训练，通过word2vec的词向量训练获得每个词的词向量表示，通过向量化表示可以获得词语之间的深层次语义关系。

其中，假定词向量V1＝(v′₁₁，v′₁₂，...，v′_1n)，n表示向量的维度，优选地，在当前实施例中，n取值为200。词向量标准化为

记为：(v₁₁，v₁₂，...，v_1n)。

通过TF-IDF训练获得每个词的IDF值，IDF值为映射到0-1之间的数值，优选地，将体育明星、球队、娱乐明星等提升为1，以增加相应的权重。

其中，将每个词的IDF值通过(idf_current-idf_min)/(idf_max-idf_min)映射到[0,1]区间，结合领域词库对词的IDF值提升为1，从而突出领域词的重要性。

S120，对视频标题进行分词处理，生成视频的特征词。

S130，根据文本语料库中每个词的词向量和IDF值，获取视频的向量化表示。

在本实施例中，将视频标题分词后，结合IDF权重和词向量加权计算视频向量，以突出关键词对视频语义的表示。

具体地，将视频标题分词，结合标签字段，作为视频的特征词汇，采用IDF权重加权计算获得视频的向量化表示，作为标准化处理。

视频标题分词结合标签后词汇为S1＝(w₁，w₂，...，w_m),当前视频内容构成为m个词汇，则视频向量计算为

式中IDF_k为第k个词对应的IDF值，V_k为第k个词对应的标准化向量表示为(v_k1，v_k2，…，v_kn)，视频向量标准化处理同步骤S110。

S200，确定目标用户，根据视频分类标签，获取目标用户的多维度向量化。

在本实施例中，需要根据用户的观看记录过滤掉播放完整度较低的记录，因为这部分可能是误点击行为或标题党等，从而确定目标用户。再根据视频一级分类标签将目标用户的观看记录统计获得topN占比且每个类别超过设定比例，在多个维度细粒度结合时间衰减进行用户画像获得目标用户的稠密向量化表示。

具体地，S210，根据用户的历史播放记录，确定目标用户。

根据用户近期的观看历史，即历史播放记录，统计获得目标用户，即在一定的周期内，播放完整度超过某个设定值的视频数量，该步骤是为了过滤掉播放完整度较低的记录，因为过低的播放完成率表明用户并不感兴趣，过滤掉有助于提升用户画像的精准度。优选地，在最近一个月内，用户播放完整度超过20％的视频数大于等于20个的用户，认为是目标用户。

S220，根据目标用户的播放记录以及视频分类标签，统计目标用户的不同视频分类标签下的视频占比，确定目标用户的兴趣分类。

在本实施例中，将超过设定播放完整度阈值的目标用户的播放记录，结合视频分类标签，统计目标用户在不同的视频分类标签下的播放的视频占比，从而确定目标用户的兴趣分类。具体地，将包含视频数达到TopN且视频数占比符合预设占比阈值的视频分类标签确定为该目标用户的兴趣分类，其中N为大于1的正整数。

进一步地，统计目标用户的视频数达到Top3且每个视频分类标签下视频数的占比超过10％的视频分类标签。通过选取Top3的视频分类标签可以有效地抓住目标用户的主要兴趣点，剔除目标用户的视频播放占比较低的视频分类标签，这部分可能是热点视频或者目标用户误点视频，并不能代表目标用户的真实兴趣，该策略可以有效地抓住用户的主要兴趣点，同时过滤掉一些误点击或热点视频。优选地，目标用户在最近一个月的时间内，其播放完整度超过20％的视频数总计为100个，其中，每个视频分类标签下的视频数为:体育50个、娱乐35个、财经12个、社会2个、政治1个，每个视频分类标签的占比为：体育占50％、娱乐占35％、财经占12％、社会占2％、政治占1％。在绘制用户画像的过程中，取视频数Top3且占比超过10％的视频分类标签类别，因此，需针对体育、娱乐、财经三个维度对目标用户进行绘制用户画像，计算相应维度的向量表示。而对于社会和政治可能是热点视频，并非该目标用户的真实兴趣点，因此予以剔除。

S230，根据兴趣分类对应的视频分类标签进行用户画像，计算该目标用户的多维度向量表示。

在本实施例中，经步骤S220确定了目标用户兴趣分类对应的视频分类标签，在不同的视频分类标签下，结合时间衰减因素计算目标用户的用户画像向量表示，通过在不同分类标签下的用户画像，可以在垂直度较高的情况下获得目标用户的各维度用户画像，提升用户画像精度。同时，时间衰减能较好地体现用户兴趣的转移。

优选地，在体育、娱乐和财经这三个不同视频分类标签类别下，分别计算目标用户的用户画像向量，时间衰减因子取0.95，衰减周期为3天，衰减系数计算公式：

其中，t_cur为当前的日期，t_play为播放日期。目标用户在当前视频分类标签下的向量表示：

其中，λ_i为第i个视频的衰减系数，V_i为第i的视频的标准化向量,对目标用户向量进行标准化处理同步骤S100，用户标准化向量记为U_i，其中i为目标用户ID。

同时对目标用户在多个视频分类标签下用户画像，可以保证在垂直度较高的情况下用户画像，后续寻找相似的用户群更精准。在多角度用户画像过程中，考虑视频的观看时间进行衰减，以突出用户的兴趣转移。将各维度下的观看视频向量结合时间衰减系数加权获得用户的向量化表示。

S300，针对每个视频分类标签，划分用户群，确定与目标用户相似的用户群。

在本实施例中，针对步骤S200得到的视频分类标签，对每个视频分类标签进行用户群划分，从而确定与目标用户相似的用户群。

S310，分别对每个视频分类标签下的用户进行分层抽样，划分用户群。

在本实施例中，为了避免因用户规模庞大而导致矩阵运算维度过高带来时间消耗大和内存容量不足等瓶颈，分别针对每个视频分类标签下的用户进行分层抽样，划分成规模合适的小型的用户群，从而使样本代表性较好，抽样误差较小，能够在用户相似度计算精度非常接近的前提下，带来内存利用率以及矩阵运算并行化效率的较大提升。

优选地，全体用户规模记为p，划分的用户群规模为

取整，用户群向量记为

S320，计算每个用户群包含的用户之间的相似度。

在本实施例中，对步骤S310得到的用户群，计算每个用户群包含的用户之间的相似度。

具体地，由于用户向量化表示均为归一化处理的，用户群记为矩阵V[M*N]，则矩阵的转置记为V^T[N*M]]，其中M为用户数，N为用户的向量维度，将两个矩阵的点乘运算即为用户之间的相似度，根据相似度倒排即可得到相似的用户群。

优选地，计算用户之间相似度采用矩阵运算如下：

由于所有的用户向量都归一化处理为标准化的向量，因此相似度矩阵中的每一行都表示各个用户与目标用户之间的相似度。

S330，倒序排列相似度，取TopK的用户形成目标用户的相似用户群，其中，K为大于1的正整数。

在本实施例，通过对步骤S320得到的相似度进行倒排序取TopK即可获得与目标用户最近邻的用户群索引

具体地，对于近邻用户群规模选择，采用用户协同算法。用户协同算法一个重要的参数K，即每个用户最相似的用户群规模，K越大推荐结果就越趋于热门，K过小也得不到较好的协同推荐效果。因此选择合适的K对于获得较高的推荐精度至关重要。

优选地，参数K通过对比实验选择,首先选择两个对照组：K＝10和K为全体用户，分别计算两种情况下的准确率、召回率和覆盖率。当K＝10时，也就是随机挑选10个相似用户将其感兴趣的内容过滤目标用户观看历史后全部推荐给目标用户，获得很低的准确率和召回率，但覆盖率非常高；当K取全体用户时，也就是将热门视频推荐给目标用户，获得很高的准确率和召回率，但覆盖率很低。用户协同推荐希望获得相似度并不是很高，但目标用户又感兴趣的内容，提升推荐结果的多样性。通过将K选择不同的取值，观察各指标的变化情况，实验发现

其中n为全体用户数，λ∈[2,5]范围内，能获得准确率、召回率和覆盖率各指标都较好的性能。

S400，根据每个视频分类标签下的推荐集合，构建推荐结果集。

在本实施中，确定了目标用户的相似用户群之后，根据观看视频的共现次数进行排序，最低的共现次数以及推荐列表数量根据实际情况确定。获得用户在每个视频分类标签下的推荐集合。

根据目标用户不同分类标签占比，将多个标签维度下的推荐集合构建一个推荐结果集，推荐列表数量根据实际情况确定。每个类别均按共现得分排序和标签占比概率依次加入到推荐结果集中。

具体地，S410，根据目标用户的兴趣分类，确定兴趣分类对应的每个视频分类标签下的推荐集合。

获取近邻用户相应视频分类标签下的视频的播放记录，聚类统计相似用户群中每个用户的同一视频分类标签下的视频播放记录，过滤目标用户在该视频分类标签下已播放的视频，根据聚合统计的观看次数进行倒排序，确定播放数量TopE的视频形成推荐待选列表，构建推荐集合，其中，E为大于1的正整数。

S420，按照目标用户的兴趣分类中的每个视频分类标签的视频占比，在每个视频分类标签下的推荐集合中获取相应数量的视频，可选地，根据视频播放次数，倒序选择构建到推荐结果集的视频，构建最终的推荐结果集。

优选地，目标用户Top3的视频分类标签为体育占50％，娱乐占35％，财经占12％，将不同的视频分类标签类别占比映射到[0,1]区间内的不同范围，即体育[0,0.5155]，娱乐(0.5155,0.8763)，财经[0.8763,1.0]。生成最终推荐列表时根据每次的[0,1]之间的随机数落入哪个区间来决定从体育、娱乐或财经中来选择视频构建最终的推荐列表，选择视频时均按照相应标签中倒排的顺序依次获取视频。

上述视频推荐方法，通过区分不同兴趣标签分别画像抓住用户的主要兴趣点，同时在垂直度较高的前提下用户画像，后续的计算相似用户群更精准；突出体育明星、影视明星等关键词权重，时间衰减体现用户的兴趣转移，提升了用户画像的精准度。

应该理解的是，虽然流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，附图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，提供了一种视频推荐装置，包括：视频向量化组件100、用户多维向量化组件200、相似用户群组件300和用户视频协同推荐组件400，其中：

视频向量化组件100，用于获取视频的向量化表示；

用户多维向量化组件200，用于确定目标用户，根据视频分类标签，获取目标用户的多维度向量化；

相似用户群组件300，用于针对每个视频分类标签，划分用户群，确定与目标用户相似的用户群；

视频协同推荐组件400，用于根据每个视频分类标签下的推荐集合，构建推荐结果集。

关于视频推荐装置的具体限定可以参见上文中对于视频推荐方法的限定，在此不再赘述。上述视频推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是数据管理服务器，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的数据源终端通过网络连接通信，以接收数据源终端上传的数据。该计算机程序被处理器执行时以实现视频推荐方法。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述视频推荐方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本发明的视频推荐方法、装置、计算机设备和存储介质，通过对用户协同算法的改进，以满足用户多样性的内容需求，避免用户兴趣收窄，同时带来一定的惊喜度。区分用户TopN兴趣标签占比进行细粒度用户画像,使得用户在不同标签垂直度较高的情况下用户画像以及后续的寻找相似用户群，获得的相似用户群质量较高。过滤占比较低的兴趣标签内容，可以有效地抓住用户的主要兴趣，去除少量热点内容或误点操作对用户画像的负面影响，使得用户画像更精准；突出体育明星、影视明星等关键词权重；时间衰减体现用户的兴趣转移；以及过滤播放完整度较低记录等策略，提升用户画像的精准度；用户最终推荐结果集根据不同分类标签排序和标签占比概率综合构建推荐结果集。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种视频推荐方法，其特征在于，所述方法包括：

获取视频的向量化表示；

针对每个视频分类标签，划分用户群，确定与所述目标用户相似的用户群；

根据每个视频分类标签下的推荐集合，构建推荐结果集。

2.根据权利要求1所述的方法，其特征在于，所述获取视频的向量化表示，包括：

根据文本语料库，获得所述文本语料库中每个词的词向量和IDF值；

对视频标题进行分词处理，生成视频的特征词；

根据所述文本语料库中每个词的词向量和IDF值，获取视频的向量化表示。

3.根据权利要求1所述的方法，其特征在于，所述确定目标用户，根据视频分类标签，获取目标用户的多维度向量化，包括：

根据用户的历史播放记录，确定目标用户；

根据所述目标用户的播放记录以及视频分类标签，统计所述目标用户的不同视频分类标签下的视频占比，确定所述目标用户的兴趣分类；

根据所述兴趣分类对应的视频分类标签进行用户画像，计算该目标用户的多维度向量表示。

4.根据权利要求3所述的方法，其特征在于，将包含视频数达到TopN且视频数占比符合预设占比阈值的视频分类标签确定为该目标用户的兴趣分类，其中N为大于1的正整数。

5.根据权利要求1所述的方法，其特征在于，所述针对每个视频分类标签，划分用户群，确定与所述目标用户相似的用户群，包括：

计算每个用户群包含的用户之间的相似度；

倒序排列所述相似度，取TopK的用户形成所述目标用户的相似用户群，其中，K为大于1的正整数。

6.根据权利要求5所述的方法，其特征在于，

聚类统计所述相似用户群中每个用户的同一视频分类标签下的视频播放记录，过滤所述目标用户在该视频分类标签下已播放的视频，确定播放数量TopE的视频形成推荐待选列表，构建推荐集合，其中，E为大于1的正整数。

7.根据权利要求4所述的方法，其特征在于，所述根据每个视频分类标签下的推荐集合，构建推荐结果集，包括：

根据所述目标用户的兴趣分类，确定所述兴趣分类对应的每个视频分类标签下的推荐集合；

按照所述目标用户的兴趣分类中的每个视频分类标签的视频占比，在每个视频分类标签下的推荐集合中获取相应数量的视频，构建最终的推荐结果集；

8.一种视频推荐装置，其特征在于，所述装置包括：

视频向量化组件，用于获取视频的向量化表示；

相似用户群组件，用于针对每个视频分类标签，划分用户群，确定与所述目标用户相似的用户群；

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。