CN112487300B - 一种视频推荐方法、装置、电子设备及存储介质 - Google Patents
一种视频推荐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112487300B CN112487300B CN202011502668.8A CN202011502668A CN112487300B CN 112487300 B CN112487300 B CN 112487300B CN 202011502668 A CN202011502668 A CN 202011502668A CN 112487300 B CN112487300 B CN 112487300B
- Authority
- CN
- China
- Prior art keywords
- video
- feature
- sample
- similarity
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000013598 vector Substances 0.000 claims description 99
- 238000012549 training Methods 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 19
- 238000007906 compression Methods 0.000 claims description 16
- 230000006835 compression Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 230000000694 effects Effects 0.000 abstract description 12
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种视频推荐方法、装置、电子设备及存储介质,所述方法包括:获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;将目标视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,得到第一特征;将待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,得到第二特征;针对每个待推荐视频,确定该待推荐视频的第二特征与第一特征之间的相似度;基于每个待推荐视频对应的相似度,确定目标视频的视频推荐列表,并按照视频推荐列表向用户推荐视频。采用本发明实施例,可以提高视频推荐效果。
Description
技术领域
本发明涉及互联网技术领域,特别是涉及一种视频推荐方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的快速发展,越来越多的用户在通过网络观看电影、电视剧等视频。在用户观看完当前视频时,视频网站往往会向用户推荐视频,用户可以继续观看推荐视频,这样可以使用户在视频网站上停留的时间更长。
目前,通常是根据预先生成的视频推荐列表向用户推荐视频。具体来说,电子设备可以获取用户正在观看或刚刚观看过的视频的标识,然后从视频推荐列表数据库中查找该标识对应的视频推荐列表,进而基于查找到的视频推荐列表向用户推荐视频。针对每个视频,该视频的视频推荐列表中包含与该视频的属性相似或相同的其他视频,视频的属性可以为视频的类别,还可以为视频的标签、标题、内容等。例如,视频A的类别为“电视剧”,那么视频A的视频推荐列表中包含多个其他电视剧视频;又例如,视频B的标签为“演员A”,那么视频B的视频推荐列表中包含多个演员A出演的其他视频。
在上述视频推荐方式中,将与目标视频的某一属性相同或相似的其他视频确定为视频推荐列表中的视频。但是与目标视频的某一属性相同或相似的视频并不一定符合用户的兴趣,所以按照该视频推荐列表向用户推荐视频时,向用户推荐的视频很可能并不是用户想要观看的视频,视频推荐效果较差。
发明内容
本发明实施例的目的在于提供一种视频推荐方法、装置、电子设备及存储介质,以提高视频推荐效果。具体技术方案如下:
第一方面,本发明实施例提供了一种视频推荐方法,所述方法包括:
获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;
将所述目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到所述目标视频的组合特征向量,作为第一特征;
针对所述每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入所述特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;
针对所述每个待推荐视频,确定该待推荐视频的第二特征与所述第一特征之间的相似度;
基于所述每个待推荐视频对应的相似度,确定所述目标视频的视频推荐列表,并按照所述视频推荐列表向用户推荐视频。
可选的,所述针对所述每个待推荐视频,确定该待推荐视频的第二特征与所述第一特征之间的相似度的步骤,包括:
将所述第二特征与所述第一特征分别输入相似度索引库中,以使所述相似度索引库分别对第二特征与所述第一特征进行特征压缩处理,得到所述第二特征与所述第一特征分别对应的压缩特征;
针对每个所述第二特征,计算该第二特征对应的压缩特征与所述第一特征对应的压缩特征之间的相似度,作为该待推荐视频的第二特征与所述第一特征之间的相似度。
可选的,所述特征组合模型的训练方式,包括:
获取初始特征组合模型及多个视频三元组,其中,每个所述视频三元组包括第一视频样本、第二视频样本及第三视频样本,所述第一视频样本与所述第二视频样本组成正样本对,所述第一视频样本与所述第三视频样本组成负样本对,所述正样本对包括的两个视频样本的之间的相似度高于预设阈值,所述负样本对包括的两个视频样本的之间的相似度不高于所述预设阈值,每个视频样本包括标题特征样本、图像特征样本及类型特征样本中的至少两种;
针对每个所述视频三元组,基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签;
将每个所述视频三元组输入所述初始特征组合模型,以使所述初始特征组合模型基于当前模型参数,确定第一视频样本对应的第一组合特征向量样本、第二视频样本对应的第二组合特征向量样本及第三视频样本对应的第三组合特征向量样本,并基于所述第一组合特征向量样本与第二组合特征向量样本之间的相似度,以及所述第一组合特征向量样本与所述第三组合特征向量样本之间的相似度,确定并输出该视频三元组的预测标签;
基于每个视频三元组对应的预测标签及标定标签之间的差异,调整所述初始特征组合模型的模型参数,直到所述初始特征组合模型收敛,停止训练,得到所述特征组合模型。
可选的,所述针对每个所述视频三元组,基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签的步骤,包括:
获取所述视频三元组包括的视频样本的用户操作历史数据,其中,所述用户操作历史数据包括用户对所述视频三元组包括的视频样本的观看关系;
针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第二视频样本之间的观看关系,确定该第一视频样本与该第二视频样本之间的相似度,并根据该相似度确定第一标定子标签;
针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第三视频样本之间的观看关系,确定该第一视频样本与该第三视频样本之间的相似度,并根据该相似度确定第二标定子标签;
根据每个所述视频三元组对应的所述第一标定子标签及所述第二标定子标签,生成该视频三元组的标定标签。
第二方面,本发明实施例提供了一种视频推荐装置,所述装置包括:
特征获取模块,用于获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;
第一组合模块,用于将所述目标视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到所述目标视频的组合特征向量,作为第一特征,其中,所述特征组合模型为通过模型训练模块预先训练完成的;
第二组合模块,用于针对所述每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入所述特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;
相似度确定模块,用于针对所述每个待推荐视频,确定该待推荐视频的第二特征与所述第一特征之间的相似度;
视频推荐模块,用于基于所述每个待推荐视频对应的相似度,确定所述目标视频的视频推荐列表,并按照所述视频推荐列表向用户推荐视频。
可选的,所述相似度确定模块包括:
索引子模块,用于将所述第二特征与所述第一特征分别输入相似度索引库中,以使所述相似度索引库分别对第二特征与所述第一特征进行特征压缩处理,得到所述第二特征与所述第一特征分别对应的压缩特征;
相似度确定子模块,用于针对每个所述第二特征,计算该第二特征对应的压缩特征与所述第一特征对应的压缩特征之间的相似度,作为该待推荐视频的第二特征与所述第一特征之间的相似度。
可选的,所述模型训练模块包括:
样本获取子模块,用于获取初始特征组合模型及多个视频三元组,其中,每个所述视频三元组包括第一视频样本、第二视频样本及第三视频样本,所述第一视频样本与所述第二视频样本组成正样本对,所述第一视频样本与所述第三视频样本组成负样本对,所述正样本对包括的两个视频样本的之间的相似度高于预设阈值,所述负样本对包括的两个视频样本的之间的相似度不高于所述预设阈值,每个视频样本包括标题特征样本、图像特征样本及类型特征样本中的至少两种;
标定子模块,用于针对每个所述视频三元组,基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签;
预测子模块,用于将每个所述视频三元组输入所述初始特征组合模型,以使所述初始特征组合模型基于当前模型参数,确定第一视频样本对应的第一组合特征向量样本、第二视频样本对应的第二组合特征向量样本及第三视频样本对应的第三组合特征向量样本,并基于所述第一组合特征向量样本与第二组合特征向量样本之间的相似度,以及所述第一组合特征向量样本与所述第三组合特征向量样本之间的相似度,确定并输出该视频三元组的预测标签;
参数调整子模块,用于基于每个视频三元组对应的预测标签及标定标签之间的差异,调整所述初始特征组合模型的模型参数,直到所述初始特征组合模型收敛,停止训练,得到所述特征组合模型。
可选的,所述标定子模块包括:
历史数据确定单元,用于获取所述视频三元组包括的视频样本的用户操作历史数据,其中,所述用户操作历史数据包括用户对所述视频三元组包括的视频样本的观看关系;
第一标定单元,用于针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第二视频样本之间的观看关系,确定该第一视频样本与该第二视频样本之间的相似度,并根据该相似度确定第一标定子标签;
第二标定单元,用于针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第三视频样本之间的观看关系,确定该第一视频样本与该第三视频样本之间的相似度,并根据该相似度确定第二标定子标签;
标签生成单元,用于根据每个所述视频三元组对应的所述第一标定子标签及所述第二标定子标签,生成该视频三元组的标定标签。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的视频推荐方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的视频推荐方法步骤。
本发明实施例提供的方案中,电子设备可以获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;将目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到目标视频的组合特征向量,作为第一特征;针对每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;针对每个待推荐视频,确定该待推荐视频的第二特征与第一特征之间的相似度;基于每个待推荐视频对应的相似度,确定目标视频的视频推荐列表,并按照视频推荐列表向用户推荐视频。电子设备可以确定目标视频的组合特征和待推荐视频的组合特征,组合特征可以更加全面地表征视频的内容特点,这样电子设备可以更加准确的确定与目标视频相似的待推荐视频。由于用户对与目标视频相似的待推荐视频的感兴趣程度较高,所以,电子设备基于视频推荐列表向用户推荐的视频时,可以更加符合用户的兴趣,提高视频推荐的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例所提供的一种视频推荐方法的流程图;
图2为视频推荐列表展示界面的示意图;
图3为图1所示实施例中特征组合模型的训练方式的流程图;
图4为图3所示实施例中标定标签的生成方式的流程图;
图5为本发明实施例所提供的一种视频推荐装置的结构示意图;
图6为本发明实施例中模型训练模块的结构示意图;
图7为图6所示实施例中标定子模块602的结构示意图;
图8为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了提高视频推荐效果,本发明实施例提供了一种视频推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品。下面首先对本发明实施例提供的一种视频推荐方法进行介绍。
本发明实施例提供的一种视频推荐方法可以应用于任意需要向用户推荐视频的电子设备,例如,可以为电脑、服务器、处理器等。为了描述清楚,后续称为电子设备。
如图1所示,一种视频推荐方法,所述方法包括:
S101,获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;
S102,将所述目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到所述目标视频的组合特征向量,作为第一特征;
S103,针对所述每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入所述特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;
S104,针对所述每个待推荐视频,确定该待推荐视频的第二特征与所述第一特征之间的相似度;
S105,基于所述每个待推荐视频对应的相似度,确定所述目标视频的视频推荐列表,并按照所述视频推荐列表向用户推荐视频。
可见,本发明实施例提供的方案中,电子设备可以获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;将目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到目标视频的组合特征向量,作为第一特征;针对每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;针对每个待推荐视频,确定该待推荐视频的第二特征与第一特征之间的相似度;基于每个待推荐视频对应的相似度,确定目标视频的视频推荐列表,并按照视频推荐列表向用户推荐视频。电子设备可以确定目标视频的组合特征和待推荐视频的组合特征,组合特征可以更加全面地表征视频的内容特点,这样电子设备可以更加准确的确定与目标视频相似的待推荐视频。由于用户对与目标视频相似的待推荐视频的感兴趣程度较高,所以,电子设备基于视频推荐列表向用户推荐的视频时,可以更加符合用户的兴趣,提高视频推荐的效果。
用户在观看视频网站中的电影、电视剧、综艺节目等视频的过程中,可以向用户推荐视频,用户可以继续观看推荐视频,这样可以使用户在视频网站上停留的时间更长,从而提高用户黏性。
由于用户一般会对与其正在观看或刚刚观看过的视频相似的其他视频感兴趣,因此,在向用户推荐视频时,可以将与用户刚刚观看过的或刚刚观看过的视频相似的其他视频推荐给用户。那么,在向用户推荐视频时,便需要确定用户正在观看或刚刚观看过的视频与待推荐视频之间的相似度。针对每个待推荐视频,为了确定该待推荐视频与目标视频之间的相似度,在上述步骤S101中,电子设备可以获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征。
其中,上述标题特征为待处理视频的文字信息对应的标题向量,待处理视频即为上述目标视频或上述待推荐视频,待处理视频的文字信息可以为待处理视频的标题、简介等。上述图像特征为待处理视频的图像对应的图像向量,待处理视频的图像可以为待处理视频的封面图像、海报图像等。上述类型特征可以为待处理视频的类型标签对应的类型向量,类型标签用于表示待处理视频的类型,该类型可以为预先设置的各个类型,可以包括娱乐、体育、电影、综艺、电视剧、演员等。例如,待处理视频为篮球比赛的视频,那么该待处理视频的类型标签可以为“篮球”;待处理视频为演员A出演的视频,那么该待处理视频的类型标签可以为“演员A”。
在一种实施方式中,电子设备可以采用预先训练完成的文本向量确定模型生成待处理视频的标题特征及类型特征。具体的,电子设备可以取待处理视频的标题、简介及类型标签,然后将标题和简介输入文本向量确定模型,生成待处理视频的标题特征,将待处理视频的类型标签输入文本向量确定模型,生成待处理视频的类型特征。其中,上述文本向量确定模型可以为BERT(Bidirectional Encoder Representations from Transformer)模型、Transformer模型、Word2vec(word to vector)模型等,在此不做具体限定。
在一种实施方式中,电子设备可以通过预先训练完成的图像向量确定模型生成待处理视频的图像特征。具体的,电子设备可以获取待处理视频的封面图像,然后将待处理视频的封面图像输入图像向量确定模型,得到待处理视频的图像特征。其中,上述图像向量确定模型可以为imagenet模型、卷积神经网络模型等,在此不做具体限定及说明。
视频的标题特征、图像特征或类型特征均可以表征待处理视频的内容特点,但仅通过标题特征、图像特征或类型特征中的一种特征并不能全面的表示待处理视频的内容特点。并且,上述标题特征、图像特征及类型特征对于确定待处理视频的内容特点的重要程度往往是不同的。例如,标题特征可以表示待处理视频的具体内容,因此标题特征对于确定待处理视频的内容特点的重要程度往往较高;类型特征可以表示待处理视频的类型,但一般不能表示待处理视频的具体内容,因此类型特征对于确定待处理视频的内容特点的重要程度往往较低。
为了获得能够更加准确、全面的表示目标视频的内容特点的特征,在上述步骤S102中,电子设备可以将目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到目标视频的组合特征向量,作为第一特征。由于第一特征包含了目标视频的标题特征、图像特征或类型特征中至少两种特征,所以,第一特征可以更加全面的表示目标视频的内容特点。
上述特征组合模型的模型参数可以表示标题特征、图像特征及类型特征对于确定待处理视频的内容特点的重要程度。在训练过程中,可以不断调整初始特征组合模型的模型参数,以使特征组合模型的模型参数可以准确表征标题特征、图像特征及类型特征对于确定待处理视频的内容特点的重要程度,进而得到可以准确确定待处理视频的组合特征向量的特征组合模型。这样,电子设备可以通过训练完成的特征组合模型,准确确定目标视频的组合特征向量,也就是目标视频的第一特征。
其中,上述特征组合模型可以为CDML(Collaborative Deep Metric Learning,协作式深度度量学习)模型、CML(Collaborative Metric Learning,协作式度量学习)模型等深度学习模型,在此不做具体限定及说明。
为了获得能够更加准确、全面的表示上述待推荐视频的内容特点的特征,在上述步骤S103中,针对每个待推荐视频,电子设备可以将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征。
由于第二特征包含了待推荐视频的标题特征、图像特征或类型特征中至少两种特征,所以,第二特征可以更加全面的表示待推荐视频的内容特点。由于上述特征组合模型的模型参数可以表示标题特征、图像特征及类型特征对于确定待处理视频的内容特点的重要程度,因此,电子设备可以通过训练完成的特征组合模型,准确确定待推荐视频的组合特征向量,也就是待推荐视频的的第二特征。
在得到上述第一特征及上述第二特征后,电子设备可以通过上述步骤S104得到每个待推荐视频分别与目标视频之间的相似度。具体的,针对每个待推荐视频,电子设备可以确定该待推荐视频的第二特征与第一特征之间的相似度。由于上述第一特征可以表示目标视频的具体内容,上述第二特征可以表示待推荐视频的具体内容,所以,针对每个待推荐视频,该待推荐视频与目标视频之间的相似度也就是该待推荐视频的第二特征与第一特征之间的相似度。
上述第一特征即为目标视频的组合向量,上述第二特征即为待推荐视频的组合向量。针对第一特征a和第二特征b来说,第一特征a与第二特征b之间的余弦距离为:
其中,<a,b>为第一特征a与第二特征b之间的内积,|a|为第一特征a的长度,|b|为第二特征b的长度。当cosθ越接近1时,说明第一特征a与第二特征b之间的距离越小,第一特征a与第二特征b的方向也就越接近,那么第一特征a对应的目标视频与第二特征b对应的待推荐视频之间的相似度也就越高;当cosθ越接近-1时,说明第一特征a与第二特征b之间的距离越大,第一特征a与第二特征b的方向相差也就越大,那么第一特征a对应的目标视频与第二特征b对应的待推荐视频之间的相似度也就越低。
因此,针对每个待推荐视频,电子设备可以确定该待推荐视频的第二特征与第一特征之间的距离,作为该第二特征与第一特征之间的相似度。其中,上述相似度的确定方式可以为余弦距离的确定方式、欧氏距离的确定方式、曼哈顿距离的确定方式、切比雪夫距离的确定方式等,在此不做具体限定及说明。
在得到每个待推荐视频对应的相似度后,电子设备便可以基于每个待推荐视频对应的相似度,确定上述目标视频的视频推荐列表,并按照视频推荐列表向用户推荐视频,也就是执行上述步骤S105。
其中,目标视频的视频推荐列表中包括对应的相似度较高的待推荐视频。在一种实施方式中,目标视频的视频推荐列表可以包括对应的相似度大于预设值的待推荐视频,预设值可以根据经验值进行设置。
例如,预设值为0.60,待推荐视频D1-待推荐视频D4对应的相似度分别为0.55、0.73、0.62、0.85,那么电子设备可以得到如下表所示的视频推荐列表:
相似度 | 待推荐视频 |
0.85 | 待推荐视频D4 |
0.73 | 待推荐视频D2 |
0.62 | 待推荐视频D3 |
在另一种实施方式中,可以将所有待推荐视频按照对应的相似度由大到小的顺序进行排序,得到排序结果,然后将排序结果中前预设数量个待推荐视频存储在目标视频的视频推荐列表中,预设数量可以按照需求进行设置,例如,可以为3、5、10等。
例如,预设数量为3,待推荐视频D*1-待推荐视频D*6对应的相似度为0.43、0.52、0.74、0.61、0.85、0.23,那么,那么电子设备可以得到如下表所示的视频推荐列表:
排序结果 | 相似度 | 待推荐视频 |
1 | 0.85 | 待推荐视频D*5 |
2 | 0.74 | 待推荐视频D*3 |
3 | 0.61 | 待推荐视频D*4 |
用户通常对与目标视频相似的待推荐视频的感兴趣程度较高,因此,电子设备基于视频推荐列表向用户推荐的视频时,可以更加符合用户的兴趣,提高视频推荐的效果。
作为本发明实施例的一种实施方式,上述针对所述每个待推荐视频,确定该待推荐视频的第二特征与所述第一特征之间的相似度的步骤,可以包括:
将第二特征与第一特征分别输入相似度索引库中,以使相似度索引库分别对第二特征与第一特征进行特征压缩处理,得到第二特征与第一特征分别对应的压缩特征;针对每个第二特征,计算该第二特征对应的压缩特征与第一特征对应的压缩特征之间的相似度,作为该待推荐视频的第二特征与第一特征之间的相似度。
目标视频往往存在大量的待推荐视频。由于第一特征及第二特征的长度通常较长,所以,电子设备需要通过大量的计算来确定每个待推荐视频的第二特征分别与第一特征之间的相似度,这会导致电子设备确定第二特征与第一特征之间的相似度时的效率较低。
针对这种情况,电子设备可以将第二特征与第一特征分别输入相似度索引库中,以使相似度索引库分别对第二特征与第一特征进行特征压缩处理,得到第二特征与第一特征分别对应的压缩特征。然后,针对每个第二特征,计算该第二特征对应的压缩特征与第一特征对应的压缩特征之间的相似度,作为该待推荐视频的第二特征与第一特征之间的相似度。
通过相似度索引库得到的压缩特征的长度将会小于第二特征以及第一特征的长度,这样,电子设备在计算第二特征对应的压缩特征与第一特征对应的压缩特征之间的相似度的计算量将会大大降低,从而可以减少确定第二特征与第一特征确定之间的相似度时花费的时间,提高确定第二特征与第一特征之间的相似度的效率。
在一种实施方式中,上述相似度索引库可以为faiss索引库,上述特征压缩处理的具体算法可以为PAC(Principal Component Analysis,主成分分析)算法和PQ(ProductQuantization,乘积量化)算法,在此不做具体说明。
可见,本发明实施例所提供的方案中,电子设备可以将第二特征与第一特征分别输入相似度索引库中,以使相似度索引库分别对第二特征与第一特征进行特征压缩处理,得到第二特征与第一特征分别对应的压缩特征;针对每个第二特征,计算该第二特征对应的压缩特征与第一特征对应的压缩特征之间的相似度,作为该待推荐视频的第二特征与第一特征之间的相似度。这样,电子设备可以通过相似度索引库对每个第一特征及每个第二特征进行压缩处理,从而减少确定第二特征与第一特征之间的相似度的计算量,提高确定第二特征与第一特征之间的相似度的效率。
作为本发明实施例的一种实施方式,上述按照所述视频推荐列表向用户推荐视频的步骤,可以包括:
在用户端播放目标视频的过程中,获取目标视频的视频推荐列表;在目标视频播放过程中,或在目标视频播放结束时,将视频推荐列表推送至用户端,以使用户端展示所述视频推荐列表。
电子设备可以与用户端通信连接,在用户通过用户端播放目标视频时,电子设备可以向用户推荐视频。
具体的,首先,在用户端播放目标视频的过程中,电子设备可以获取目标视频的视频推荐列表。
在一种实施方式中,电子设备可以预先确定目标视频的视频推荐列表,并将目标视频的视频推荐列表存储在视频推荐数据库中,其中,视频推荐数据库包括视频推荐列表与视频标识的对应关系。当用户通过用户端发出播放目标视频的指令时,电子设备可以获取该指令,进而按照该指令包括的目标视频的视频标识,在上述视频推荐数据库中查找该目标视频的视频推荐列表。
例如,视频推荐数据库包括的视频推荐列表与视频标识的对应关系如下表所示:
视频推荐列表 | 视频标识 |
S1 | P1 |
S2 | P2 |
S3 | P3 |
当电子设备获取到播放目标视频P3的指令时,电子设备可以按照上表所示的对应关系,确定目标视频P3的视频推荐列表为S3。
在目标视频播放过程中,或在目标视频播放结束时,电子设备可以将视频推荐列表推送至用户端,以使用户端展示目标视频的视频推荐列表。
例如,如图2所示,图2为视频推荐列表展示界面的示意图,用户端可以在目标视频的播放区域下方的预设区域210展示视频推荐列表,视频推荐列表中包括待推荐视频Dt1、待推荐视频Dt2、待推荐视频Dt3及待推荐视频Dt4。
在一种实施方式中,视频推荐列表中可以包括待推荐视频的相关信息,待推荐视频的相关信息可以为待推荐视频的缩略图、视频时长、视频发布者、发布时间等信息,这样,当用户端展示视频推荐列表时可以展示待推荐视频的相关信息,用户可以根据待推荐视频的相关信息决定继续观看哪个待推荐视频。
可见,本发明实施例所提供的方案中,电子设备可以在用户端播放目标视频的过程中,获取目标视频的视频推荐列表;在目标视频播放过程中,或在目标视频播放结束时,将视频推荐列表推送至用户端,以使用户端展示所述视频推荐列表。这样,用户端可以在用户正在观看目标视频的过程中,或用户刚刚观看过目标视频视频后,向用户端展示视频推荐列表,从而可以方便用户查看其感兴趣的待推荐视频,进而可以提高用户黏性。
作为本发明实施例的一种实施方式,如图3所示,上述特征组合模型的训练方式,可以包括:
S301,获取初始特征组合模型及多个视频三元组;
为了获得能够准确确定待处理视频的组合特征向量的特征组合模型,电子设备可以获取初始特征组合模型及多个视频三元组,基于该多个视频三元组对初始特征组合模型进行训练。
其中,每个视频三元组包括第一视频样本、第二视频样本及第三视频样本,第一视频样本与第二视频样本组成正样本对,第一视频样本与第三视频样本组成负样本对。上述正样本对包括的两个视频样本的之间的相似度高于预设阈值,上述负样本对包括的两个视频样本的之间的相似度不高于预设阈值,每个视频样本包括标题特征样本、图像特征样本及类型特征样本中的至少两种。
S302,针对每个所述视频三元组,基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签;
由于目标视频与待推荐视频之间的相似度即为目标视频的组合特征与待推荐视频的组合特征之间的相似度,而目标视频的组合特征与待推荐视频的组合特征之间的相似度,取决于组合特征模型输出的待处理视频的组合特征向量,所以,为了使训练完成的组合特征模型能够输出准确的组合特征向量,针对每个视频三元组,电子设备可以基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签。
S303,将每个所述视频三元组输入所述初始特征组合模型,以使所述初始特征组合模型基于当前模型参数,确定第一视频样本对应的第一组合特征向量样本、第二视频样本对应的第二组合特征向量样本及第三视频样本对应的第三组合特征向量样本,并基于所述第一组合特征向量样本与第二组合特征向量样本之间的相似度,以及所述第一组合特征向量样本与所述第三组合特征向量样本之间的相似度,确定并输出该视频三元组的预测标签;
在对初始组合特征模型进行训练的过程中,电子设备可以将每个视频三元组输入初始特征组合模型,以使初始特征组合模型基于当前模型参数,确定第一视频样本对应的第一组合特征向量样本、第二视频样本对应的第二组合特征向量样本及第三视频样本对应的第三组合特征向量样本,并基于第一组合特征向量样本与第二组合特征向量样本之间的相似度,以及第一组合特征向量样本与第三组合特征向量样本之间的相似度,确定并输出该视频三元组的预测标签。
S304,基于每个视频三元组对应的预测标签及标定标签之间的差异,调整所述初始特征组合模型的模型参数,直到所述初始特征组合模型收敛,停止训练,得到所述特征组合模型。
当前的初始组合特征模型的模型参数很可能不合适,不能准确确定待处理视频的组合特征向量。因此,在得到上述每个视频三元组对应的预测标签及标定标签之后,电子设备可以基于每个视频三元组对应的预测标签及标定标签之间的差异,调整初始特征组合模型的模型参数,以使初始特征组合模型的模型参数更加合适。其中,上述调整初始特征组合模型的模型参数的方式可以为梯度下降算法、随机梯度下降算法等模型参数调整方式,在此不做具体限定及说明。
为了确定上述初始组合特征模型是否收敛,电子设备可以判断初始组合特征模型的迭代次数是否达到预设次数,或,初始组合特征模型的预测结果的准确度是否大于预设值。
如果初始组合特征模型的迭代次数达到预设次数,或,初始组合特征模型的预测结果的准确度第一预设值,说明初始组合特征模型已经收敛,也就是说,当前初始组合特征模型可以准确确定待处理视频对应的组合特征向量,所以此时可以停止训练,得到组合特征模型。
其中,上述预设次数可以根据预测结果的准确度要求、模型结构等因素设定,例如,可以为6000次、9000次、12000次等,在此不做具体限定。预设值可以根据预测结果的准确度要求、模型结构等因素设定,例如可以为0.91、0.89、0.90等,在此不做具体限定。
如果初始组合特征模型的迭代次数没有达到预设次数,或,初始组合特征模型的预测结果的准确度不大于预设值,说明初始组合特征模型还未收敛,也就是说,当前初始组合特征模型还无法准确确定待处理视频对应的组合特征向量,那么电子设备需要继续训练初始组合特征模型。
可见,本发明实施例所提供的方案中,电子设备可以通过上述方式对初始特征组合模型进行训练,得到特征组合模型。这样,可以获得能够准确确定待处理视频的组合特征向量的特征组合模型。
作为本发明实施例的一种实施方式,如图4所示,上述针对每个所述视频三元组,基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签的步骤,可以包括:
S401,获取所述视频三元组包括的视频样本的用户操作历史数据;
针对每个视频三元组,为了准确确定该视频三元组对应的标定标签,电子设备可以获取该视频三元组包括的视频样本的用户操作历史数据。
其中,用户操作历史数据包括用户对视频三元组包括的视频样本的观看关系,例如,视频三元组Z1包括视频样本A1、视频样本A2及视频样本A3,用户在观看视频样本A1后观看过视频样本A2,且用户在观看视频样本A1后没有观看过视频样本A3,那么用户操作历史数据包括的用户对视频三元组Z1中的视频样本A1、视频样本A2及视频样本A3的观看关系可以记为:(A1&A2,A1/A3),其中,A1&A2表示用户在观看视频样本A1后观看过视频样本A2,A1/A3表示用户在观看视频样本A1后没有观看过视频样本A3。
S402,针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第二视频样本之间的观看关系,确定该第一视频样本与该第二视频样本之间的相似度,并根据该相似度确定第一标定子标签;
针对每个视频三元组,电子设备可以基于用户对该视频三元组中的第一视频样本与第二视频样本之间的观看关系,确定该第一视频样本与该第二视频样本之间的相似度。对于每个视频三元组,用户对该视频三元组中的第一视频样本与第二视频样本之间的观看关系通常为:用户在观看第一视频样本后观看过第二视频样本,由于用户通常会继续观看与已观看的视频之间的相似度较高的其他视频,因此,电子设备可以确定该第一视频样本与该第二视频样本之间的相似度,该相似度大于上述预设阈值,进而根据该相似度确定第一标定子标签。
S403,针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第三视频样本之间的观看关系,确定该第一视频样本与该第三视频样本之间的相似度,并根据该相似度确定第二标定子标签;
针对每个视频三元组,电子设备可以基于用户对该视频三元组中的第一视频样本与第三视频样本之间的观看关系,确定该第一视频样本与该第三视频样本之间的相似度。对于每个视频三元组,用户对该视频三元组中的第一视频样本与第三视频样本之间的观看关系通常为:用户在观看第一视频样本后没有观看过第三视频样本,由于用户通常不会继续观看与已观看的视频之间的相似度较低的其他视频,因此,电子设备可以确定该第一视频样本与该第三视频样本之间的相似度,该相似度不大于上述预设阈值,进而根据该相似度确定第二标定子标签。
S404,根据每个所述视频三元组对应的所述第一标定子标签及所述第二标定子标签,生成该视频三元组的标定标签。
针对每个视频三元组,在确定该视频三元组对应的第一标定子标签及第二标定子标签后,电子设备可以根据该视频三元组对应的第一标定子标签及第二标定子标签,生成该视频三元组的标定标签。
在一种实施方式中,上述第一标定子标签可以为第一视频样本与第二视频样本之间的相似度,上述第二标定标签可以为第一视频样本与第三视频样本之间的相似度,视频三元组的标定标签可以为包含该视频三元组中第一视频样本与第二视频样本之间的相似度数值及第一视频样本与第三视频样本之间的相似度数值的向量。
例如,视频三元组Z*1中的第一视频样本B1与第二视频样本B2之间的相似度为0.87、第一视频样本B1与第三视频样本B3之间的相似度为0.51,那么电子设备可以确定视频三元组Z*1的标定标签为(0.87,0.51)。
可见,本发明实施例所提供的方案中,电子设备可以通过上述方式确定每个视频三元组的标定标签。这样,电子设备可以准确确定每个视频三元组的标定标签,进而可以基于每个视频三元组的标定标签对初始特征组合模型的模型参数进行调整,从而得到能够准确确定每个视频的组合特征的特征组合模型。
作为本发明实施例的一种实施方式,在上述按照所述视频推荐列表向用户推荐视频的步骤之前,上述方法还可以包括:
当视频推荐列表中的待推荐视频对应的相似度相同时,按照预设的视频筛选规则,从目标推荐视频中确定最终的待推荐视频,得到最终的视频推荐列表。
在视频推荐列表中,可能存在对应的相似度相同的待推荐视频,对应的相似度相同的待推荐视频很可能是内容完全相同的待推荐视频。在这种情况下,。为了避免视频推荐列表中出现重复的待推荐视频,电子设备可以按照预设的视频筛选规则,从目标推荐视频中确定最终的待推荐视频,得到最终的视频推荐列表。其中,目标推荐视频即为对应的相似度相同的待推荐视频。
在一种实施方式中,上述视频筛选规则可以为:将目标推荐视频中分辨率最高的待推荐视频确定为最终的待推荐视频。这样,电子设备便可以将目标推荐视频中分辨率最高的待推荐视频确定为最终的待推荐视频,从而可以确保推荐至用户的待推荐视频的内容清晰可见。
可见,本发明实施例所提供的方案中,当视频推荐列表中的待推荐视频对应的相似度相同时,电子设备可以按照预设的视频筛选规则,从目标推荐视频中确定最终的待推荐视频,得到最终的视频推荐列表。这样,可以避免视频推荐列表中出现重复的待推荐视频,提高视频推荐效果。
相应于上述视频推荐方法,本发明实施例还提供了一种视频推荐装置。下面对本发明实施例所提供的一种视频推荐装置进行介绍。
如图5所示,一种视频推荐装置,所述装置包括:
特征获取模块501,用于获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;
第一组合模块502,用于将所述目标视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到所述目标视频的组合特征向量,作为第一特征;
其中,所述特征组合模型为通过模型训练模块(图5中未示出)预先训练完成的。
第二组合模块503,用于针对所述每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入所述特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;
相似度确定模块504,用于针对所述每个待推荐视频,确定该待推荐视频的第二特征与所述第一特征之间的相似度;
视频推荐模块505,用于基于所述每个待推荐视频对应的相似度,确定所述目标视频的视频推荐列表,并按照所述视频推荐列表向用户推荐视频。
可见,本发明实施例提供的方案中,电子设备可以获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;将目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到目标视频的组合特征向量,作为第一特征;针对每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;针对每个待推荐视频,确定该待推荐视频的第二特征与第一特征之间的相似度;基于每个待推荐视频对应的相似度,确定目标视频的视频推荐列表,并按照视频推荐列表向用户推荐视频。电子设备可以确定目标视频的组合特征和待推荐视频的组合特征,组合特征可以更加全面地表征视频的内容特点,这样电子设备可以更加准确的确定与目标视频相似的待推荐视频。由于用户对与目标视频相似的待推荐视频的感兴趣程度较高,所以,电子设备基于视频推荐列表向用户推荐的视频时,可以更加符合用户的兴趣,提高视频推荐的效果。
作为本发明实施例的一种实施方式,上述相似度确定模块504可以包括:
索引子模块(图5中未示出),用于将所述第二特征与所述第一特征分别输入相似度索引库中,以使所述相似度索引库分别对第二特征与所述第一特征进行特征压缩处理,得到所述第二特征与所述第一特征分别对应的压缩特征;
相似度确定子模块(图5中未示出),用于针对每个所述第二特征,计算该第二特征对应的压缩特征与所述第一特征对应的压缩特征之间的相似度,作为该待推荐视频的第二特征与所述第一特征之间的相似度。
作为本发明实施例的一种实施方式,如图6所示,上述模型训练模块(图5中未示出)可以包括:
样本获取子模块601,用于获取初始特征组合模型及多个视频三元组;
其中,每个所述视频三元组包括第一视频样本、第二视频样本及第三视频样本,所述第一视频样本与所述第二视频样本组成正样本对,所述第一视频样本与所述第三视频样本组成负样本对,所述正样本对包括的两个视频样本的之间的相似度高于预设阈值,所述负样本对包括的两个视频样本的之间的相似度不高于所述预设阈值,每个视频样本包括标题特征样本、图像特征样本及类型特征样本中的至少两种。
标定子模块602,用于针对每个所述视频三元组,基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签;
预测子模块603,用于将每个所述视频三元组输入所述初始特征组合模型,以使所述初始特征组合模型基于当前模型参数,确定第一视频样本对应的第一组合特征向量样本、第二视频样本对应的第二组合特征向量样本及第三视频样本对应的第三组合特征向量样本,并基于所述第一组合特征向量样本与第二组合特征向量样本之间的相似度,以及所述第一组合特征向量样本与所述第三组合特征向量样本之间的相似度,确定并输出该视频三元组的预测标签;
参数调整子模块604,用于基于每个视频三元组对应的预测标签及标定标签之间的差异,调整所述初始特征组合模型的模型参数,直到所述初始特征组合模型收敛,停止训练,得到所述特征组合模型。
作为本发明实施例的一种实施方式,如图7所示,上述标定子模块602可以包括:
历史数据确定单元701,用于获取所述视频三元组包括的视频样本的用户操作历史数据;
其中,所述用户操作历史数据包括用户对所述视频三元组包括的视频样本的观看关系。
第一标定单元702,用于针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第二视频样本之间的观看关系,确定该第一视频样本与该第二视频样本之间的相似度,并根据该相似度确定第一标定子标签;
第二标定单元703,用于针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第三视频样本之间的观看关系,确定该第一视频样本与该第三视频样本之间的相似度,并根据该相似度确定第二标定子标签;
标签生成单元704,用于根据每个所述视频三元组对应的所述第一标定子标签及所述第二标定子标签,生成该视频三元组的标定标签。
本发明实施例还提供了一种电子设备,如图8所示,包括处理器801、通信接口802、存储器803和通信总线804,其中,处理器801,通信接口802,存储器803通过通信总线804完成相互间的通信,
存储器803,用于存放计算机程序;
处理器801,用于执行存储器803上所存放的程序时,实现上述任一实施例所述的视频推荐方法步骤。
可见,本发明实施例提供的方案中,电子设备可以获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;将目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到目标视频的组合特征向量,作为第一特征;针对每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;针对每个待推荐视频,确定该待推荐视频的第二特征与第一特征之间的相似度;基于每个待推荐视频对应的相似度,确定目标视频的视频推荐列表,并按照视频推荐列表向用户推荐视频。电子设备可以确定目标视频的组合特征和待推荐视频的组合特征,组合特征可以更加全面地表征视频的内容特点,这样电子设备可以更加准确的确定与目标视频相似的待推荐视频。由于用户对与目标视频相似的待推荐视频的感兴趣程度较高,所以,电子设备基于视频推荐列表向用户推荐的视频时,可以更加符合用户的兴趣,提高视频推荐的效果。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例中所述的视频推荐方法。
可见,本发明实施例提供的方案中,计算机可读存储介质内存储的计算机程序被处理器执行时,可以获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;将目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到目标视频的组合特征向量,作为第一特征;针对每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;针对每个待推荐视频,确定该待推荐视频的第二特征与第一特征之间的相似度;基于每个待推荐视频对应的相似度,确定目标视频的视频推荐列表,并按照视频推荐列表向用户推荐视频。电子设备可以确定目标视频的组合特征和待推荐视频的组合特征,组合特征可以更加全面地表征视频的内容特点,这样电子设备可以更加准确的确定与目标视频相似的待推荐视频。由于用户对与目标视频相似的待推荐视频的感兴趣程度较高,所以,电子设备基于视频推荐列表向用户推荐的视频时,可以更加符合用户的兴趣,提高视频推荐的效果。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一实施例中所述的视频推荐方法。
可见,本发明实施例提供的方案中,包含指令的计算机程序产品在计算机上运行时,可以获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;将目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到目标视频的组合特征向量,作为第一特征;针对每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;针对每个待推荐视频,确定该待推荐视频的第二特征与第一特征之间的相似度;基于每个待推荐视频对应的相似度,确定目标视频的视频推荐列表,并按照视频推荐列表向用户推荐视频。电子设备可以确定目标视频的组合特征和待推荐视频的组合特征,组合特征可以更加全面地表征视频的内容特点,这样电子设备可以更加准确的确定与目标视频相似的待推荐视频。由于用户对与目标视频相似的待推荐视频的感兴趣程度较高,所以,电子设备基于视频推荐列表向用户推荐的视频时,可以更加符合用户的兴趣,提高视频推荐的效果。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (8)
1.一种视频推荐方法,其特征在于,所述方法包括:
获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;
将所述目标视频的标题特征、图像特征及类型特征中的至少两种特征输入预先训练完成的特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到所述目标视频的组合特征向量,作为第一特征;
针对所述每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入所述特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;
针对所述每个待推荐视频,确定该待推荐视频的第二特征与所述第一特征之间的相似度;
基于所述每个待推荐视频对应的相似度,确定所述目标视频的视频推荐列表,并按照所述视频推荐列表向用户推荐视频;
所述特征组合模型的训练方式,包括:
获取初始特征组合模型及多个视频三元组,其中,每个所述视频三元组包括第一视频样本、第二视频样本及第三视频样本,所述第一视频样本与所述第二视频样本组成正样本对,所述第一视频样本与所述第三视频样本组成负样本对,所述正样本对包括的两个视频样本的之间的相似度高于预设阈值,所述负样本对包括的两个视频样本的之间的相似度不高于所述预设阈值,每个视频样本包括标题特征样本、图像特征样本及类型特征样本中的至少两种;
针对每个所述视频三元组,基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签;
将每个所述视频三元组输入所述初始特征组合模型,以使所述初始特征组合模型基于当前模型参数,确定第一视频样本对应的第一组合特征向量样本、第二视频样本对应的第二组合特征向量样本及第三视频样本对应的第三组合特征向量样本,并基于所述第一组合特征向量样本与第二组合特征向量样本之间的相似度,以及所述第一组合特征向量样本与所述第三组合特征向量样本之间的相似度,确定并输出该视频三元组的预测标签;
基于每个视频三元组对应的预测标签及标定标签之间的差异,调整所述初始特征组合模型的模型参数,直到所述初始特征组合模型收敛,停止训练,得到所述特征组合模型。
2.根据权利要求1所述的方法,其特征在于,所述针对所述每个待推荐视频,确定该待推荐视频的第二特征与所述第一特征之间的相似度的步骤,包括:
将所述第二特征与所述第一特征分别输入相似度索引库中,以使所述相似度索引库分别对第二特征与所述第一特征进行特征压缩处理,得到所述第二特征与所述第一特征分别对应的压缩特征;
针对每个所述第二特征,计算该第二特征对应的压缩特征与所述第一特征对应的压缩特征之间的相似度,作为该待推荐视频的第二特征与所述第一特征之间的相似度。
3.根据权利要求1所述的方法,其特征在于,所述针对每个所述视频三元组,基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签的步骤,包括:
获取所述视频三元组包括的视频样本的用户操作历史数据,其中,所述用户操作历史数据包括用户对所述视频三元组包括的视频样本的观看关系;
针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第二视频样本之间的观看关系,确定该第一视频样本与该第二视频样本之间的相似度,并根据该相似度确定第一标定子标签;
针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第三视频样本之间的观看关系,确定该第一视频样本与该第三视频样本之间的相似度,并根据该相似度确定第二标定子标签;
根据每个所述视频三元组对应的所述第一标定子标签及所述第二标定子标签,生成该视频三元组的标定标签。
4.一种视频推荐装置,其特征在于,所述装置包括:
特征获取模块,用于获取目标视频的标题特征、图像特征及类型特征,并获取每个待推荐视频的标题特征、图像特征及类型特征;
第一组合模块,用于将所述目标视频的标题特征、图像特征及类型特征中的至少两种特征输入特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到所述目标视频的组合特征向量,作为第一特征,其中,所述特征组合模型为通过模型训练模块预先训练完成的;
第二组合模块,用于针对所述每个待推荐视频,将该待推荐视频的标题特征、图像特征及类型特征中的至少两种特征输入所述特征组合模型,以使所述特征组合模型基于模型参数对输入的至少两种特征进行组合,得到该待推荐视频的组合特征向量,作为第二特征;
相似度确定模块,用于针对所述每个待推荐视频,确定该待推荐视频的第二特征与所述第一特征之间的相似度;
视频推荐模块,用于基于所述每个待推荐视频对应的相似度,确定所述目标视频的视频推荐列表,并按照所述视频推荐列表向用户推荐视频;
所述模型训练模块包括:
样本获取子模块,用于获取初始特征组合模型及多个视频三元组,其中,每个所述视频三元组包括第一视频样本、第二视频样本及第三视频样本,所述第一视频样本与所述第二视频样本组成正样本对,所述第一视频样本与所述第三视频样本组成负样本对,所述正样本对包括的两个视频样本的之间的相似度高于预设阈值,所述负样本对包括的两个视频样本的之间的相似度不高于所述预设阈值,每个视频样本包括标题特征样本、图像特征样本及类型特征样本中的至少两种;
标定子模块,用于针对每个所述视频三元组,基于该视频三元组包括的正样本对及负样本对分别对应的相似度,确定该视频三元组的标定标签;
预测子模块,用于将每个所述视频三元组输入所述初始特征组合模型,以使所述初始特征组合模型基于当前模型参数,确定第一视频样本对应的第一组合特征向量样本、第二视频样本对应的第二组合特征向量样本及第三视频样本对应的第三组合特征向量样本,并基于所述第一组合特征向量样本与第二组合特征向量样本之间的相似度,以及所述第一组合特征向量样本与所述第三组合特征向量样本之间的相似度,确定并输出该视频三元组的预测标签;
参数调整子模块,用于基于每个视频三元组对应的预测标签及标定标签之间的差异,调整所述初始特征组合模型的模型参数,直到所述初始特征组合模型收敛,停止训练,得到所述特征组合模型。
5.根据权利要求4所述的装置,其特征在于,所述相似度确定模块包括:
索引子模块,用于将所述第二特征与所述第一特征分别输入相似度索引库中,以使所述相似度索引库分别对第二特征与所述第一特征进行特征压缩处理,得到所述第二特征与所述第一特征分别对应的压缩特征;
相似度确定子模块,用于针对每个所述第二特征,计算该第二特征对应的压缩特征与所述第一特征对应的压缩特征之间的相似度,作为该待推荐视频的第二特征与所述第一特征之间的相似度。
6.根据权利要求4所述的装置,其特征在于,所述标定子模块包括:
历史数据确定单元,用于获取所述视频三元组包括的视频样本的用户操作历史数据,其中,所述用户操作历史数据包括用户对所述视频三元组包括的视频样本的观看关系;
第一标定单元,用于针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第二视频样本之间的观看关系,确定该第一视频样本与该第二视频样本之间的相似度,并根据该相似度确定第一标定子标签;
第二标定单元,用于针对每个所述视频三元组,基于所述用户对该视频三元组中的第一视频样本与第三视频样本之间的观看关系,确定该第一视频样本与该第三视频样本之间的相似度,并根据该相似度确定第二标定子标签;
标签生成单元,用于根据每个所述视频三元组对应的所述第一标定子标签及所述第二标定子标签,生成该视频三元组的标定标签。
7.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-3任一所述的方法步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-3任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011502668.8A CN112487300B (zh) | 2020-12-18 | 2020-12-18 | 一种视频推荐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011502668.8A CN112487300B (zh) | 2020-12-18 | 2020-12-18 | 一种视频推荐方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112487300A CN112487300A (zh) | 2021-03-12 |
CN112487300B true CN112487300B (zh) | 2024-06-07 |
Family
ID=74914149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011502668.8A Active CN112487300B (zh) | 2020-12-18 | 2020-12-18 | 一种视频推荐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112487300B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378784B (zh) * | 2021-07-01 | 2022-06-07 | 北京百度网讯科技有限公司 | 视频标签推荐模型的训练方法和确定视频标签的方法 |
CN113641855A (zh) * | 2021-08-13 | 2021-11-12 | 北京奇艺世纪科技有限公司 | 一种视频推荐方法、装置、设备及存储介质 |
CN114979767B (zh) * | 2022-05-07 | 2023-11-21 | 咪咕视讯科技有限公司 | 视频推荐方法、装置、设备及计算机可读存储介质 |
CN114926771B (zh) * | 2022-06-01 | 2024-09-27 | 抖音视界有限公司 | 一种视频识别方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107305557A (zh) * | 2016-04-20 | 2017-10-31 | 北京陌上花科技有限公司 | 内容推荐方法及装置 |
CN108307240A (zh) * | 2018-02-12 | 2018-07-20 | 北京百度网讯科技有限公司 | 视频推荐方法和装置 |
CN109800328A (zh) * | 2019-01-08 | 2019-05-24 | 青岛聚看云科技有限公司 | 视频推荐方法、其装置、信息处理设备及存储介质 |
CN109800325A (zh) * | 2018-12-26 | 2019-05-24 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置和计算机可读存储介质 |
CN110232152A (zh) * | 2019-05-27 | 2019-09-13 | 腾讯科技(深圳)有限公司 | 内容推荐方法、装置、服务器以及存储介质 |
CN110619061A (zh) * | 2018-12-25 | 2019-12-27 | 北京时光荏苒科技有限公司 | 一种视频分类方法、装置、电子设备及可读介质 |
CN111241311A (zh) * | 2020-01-09 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 媒体信息推荐方法、装置、电子设备及存储介质 |
CN111695458A (zh) * | 2020-05-28 | 2020-09-22 | 腾讯科技(深圳)有限公司 | 一种视频图像帧处理方法及装置 |
CN111984824A (zh) * | 2020-07-31 | 2020-11-24 | 河海大学 | 一种基于多模态的视频推荐方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2648368B1 (es) * | 2016-06-29 | 2018-11-14 | Accenture Global Solutions Limited | Recomendación de vídeo con base en el contenido |
WO2018081751A1 (en) * | 2016-10-28 | 2018-05-03 | Vilynx, Inc. | Video tagging system and method |
CN108763314B (zh) * | 2018-04-26 | 2021-01-19 | 深圳市腾讯计算机系统有限公司 | 一种兴趣推荐方法、装置、服务器及存储介质 |
-
2020
- 2020-12-18 CN CN202011502668.8A patent/CN112487300B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107305557A (zh) * | 2016-04-20 | 2017-10-31 | 北京陌上花科技有限公司 | 内容推荐方法及装置 |
CN108307240A (zh) * | 2018-02-12 | 2018-07-20 | 北京百度网讯科技有限公司 | 视频推荐方法和装置 |
CN110619061A (zh) * | 2018-12-25 | 2019-12-27 | 北京时光荏苒科技有限公司 | 一种视频分类方法、装置、电子设备及可读介质 |
CN109800325A (zh) * | 2018-12-26 | 2019-05-24 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置和计算机可读存储介质 |
CN109800328A (zh) * | 2019-01-08 | 2019-05-24 | 青岛聚看云科技有限公司 | 视频推荐方法、其装置、信息处理设备及存储介质 |
CN110232152A (zh) * | 2019-05-27 | 2019-09-13 | 腾讯科技(深圳)有限公司 | 内容推荐方法、装置、服务器以及存储介质 |
CN111241311A (zh) * | 2020-01-09 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 媒体信息推荐方法、装置、电子设备及存储介质 |
CN111695458A (zh) * | 2020-05-28 | 2020-09-22 | 腾讯科技(深圳)有限公司 | 一种视频图像帧处理方法及装置 |
CN111984824A (zh) * | 2020-07-31 | 2020-11-24 | 河海大学 | 一种基于多模态的视频推荐方法 |
Non-Patent Citations (2)
Title |
---|
"基于多模态特征融合的个性化视频推荐方法";谭晓 等;《智能计算机与应用》;第209-213页 * |
J. Cheng 等."Practice of a New Model Fusion Structure in Short Video Recommendation,".《2019 International Conference on Virtual Reality and Intelligent Systems》.2019,第27-30页. * |
Also Published As
Publication number | Publication date |
---|---|
CN112487300A (zh) | 2021-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112487300B (zh) | 一种视频推荐方法、装置、电子设备及存储介质 | |
US10997229B2 (en) | Content recommendation system | |
US11244017B2 (en) | Content recommendation system with weighted metadata annotations | |
US11017024B2 (en) | Media content rankings for discovery of novel content | |
CN108431833B (zh) | 端到端深度协作过滤 | |
CN108829808B (zh) | 一种页面个性化排序方法、装置及电子设备 | |
KR102008000B1 (ko) | 매체 프로그램들 사이의 유사성 계산 | |
JP6364424B2 (ja) | メディアアセットに関するコンテクスト上関係する情報を表示するための方法およびシステム | |
WO2017101317A1 (zh) | 智能推荐的全端显示方法及装置 | |
CN111767461A (zh) | 数据处理方法及装置 | |
CN112507163B (zh) | 时长预测模型训练方法、推荐方法、装置、设备及介质 | |
CN109800328B (zh) | 视频推荐方法、其装置、信息处理设备及存储介质 | |
CN110287375B (zh) | 视频标签的确定方法、装置及服务器 | |
CN110019944A (zh) | 一种视频的推荐方法及系统 | |
CN109063080B (zh) | 一种视频推荐方法及装置 | |
CN117061796A (zh) | 影片推荐方法、装置、设备及可读存储介质 | |
CN110569447A (zh) | 一种网络资源的推荐方法、装置及存储介质 | |
CN116501918A (zh) | 基于知识图谱的影视推荐方法、设备、系统及存储介质 | |
WO2016082134A1 (zh) | 一种影视资源的推荐方法以及推荐影视资源的装置 | |
CN110942070B (zh) | 内容展示方法、装置、电子设备及计算机可读存储介质 | |
CN112565826A (zh) | 一种基于大数据的视频推荐方法和装置 | |
JP7546226B2 (ja) | 情報処理装置、情報処理方法、プログラム、及び情報処理システム | |
CN109063137A (zh) | 一种推荐对象确定方法、装置、设备及可读存储介质 | |
US20240129583A1 (en) | Methods and systems for modifying a media guidance application based on user data | |
CN108681601B (zh) | 一种视频分享的方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |