CN117641004B - 一种短视频推荐方法、装置、电子设备及存储介质 - Google Patents

一种短视频推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117641004B
CN117641004B CN202311565887.4A CN202311565887A CN117641004B CN 117641004 B CN117641004 B CN 117641004B CN 202311565887 A CN202311565887 A CN 202311565887A CN 117641004 B CN117641004 B CN 117641004B
Authority
CN
China
Prior art keywords
short video
identification information
feature vector
video identification
information list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311565887.4A
Other languages
English (en)
Other versions
CN117641004A (zh
Inventor
何俊华
宋子强
王鹤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Fengping Intelligent Technology Co ltd
Original Assignee
Beijing Fengping Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Fengping Intelligent Technology Co ltd filed Critical Beijing Fengping Intelligent Technology Co ltd
Priority to CN202311565887.4A priority Critical patent/CN117641004B/zh
Publication of CN117641004A publication Critical patent/CN117641004A/zh
Application granted granted Critical
Publication of CN117641004B publication Critical patent/CN117641004B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请属于视频推荐技术领域,特别涉及一种短视频推荐方法、装置、电子设备及存储介质。方法包括:步骤一、获取用户历史观看数据,确定第一短视频标识信息列表以及第二短视频标识信息列表,并生成第一特征向量以及第二特征向量;步骤二、获取待扩展短视频标识信息列表,并根据待扩展短视频标识信息列表生成第三特征向量;步骤三、根据第一特征向量、第二特征向量以及第三特征向量计算出第四特征向量;步骤四、获取待推荐的短视频库,提取待推荐短视频标识信息列表,生成第五特征向量,计算第五特征向量与第四特征向量的相似度,并根据相似度筛选出待推荐的短视频。本申请通过对短视频标识信息进行扩展,增加了短视频推荐的多样性和新鲜感。

Description

一种短视频推荐方法、装置、电子设备及存储介质
技术领域
本申请属于视频推荐技术领域,特别涉及一种短视频推荐方法、装置、电子设备及存储介质。
背景技术
随着移动终端的普及和网络的提速,短平快的视频受到各大平台和用户的青睐,短视频平台逐渐崛起。短视频平台中包含海量的视频数据,如何从海量的短视频中向用户推荐用户感兴趣的短视频,已成为技术人员所重点关注的技术问题。
现有技术中基于内容推荐短视频的方式,一般仅依赖于用户的历史偏好,因此产生的推荐结果会与用户历史交互过的对象具有非常高的相似性,从而难以挖掘出用户潜在的其他兴趣,使推荐缺乏多样性和新鲜感。
因此,希望有一种技术方案来克服或至少减轻现有技术的至少一个上述缺陷。
发明内容
本申请的目的是提供了一种短视频推荐方法、装置、电子设备及存储介质,以解决现有技术存在的短视频推荐方式缺乏多样性和新鲜感的问题。
本申请的技术方案是:
本申请的第一个方面提供了一种短视频推荐方法,包括:
步骤一、获取用户历史观看数据,根据所述用户历史观看数据确定按照用户感兴趣程度排序的第一短视频标识信息列表,以及按照用户讨厌程度排序的第二短视频标识信息列表,并根据所述第一短视频标识信息列表生成第一特征向量,以及根据所述第二短视频标识信息列表生成第二特征向量;
步骤二、获取待扩展短视频标识信息列表,并根据所述待扩展短视频标识信息列表生成第三特征向量;
步骤三、根据所述第一特征向量、所述第二特征向量以及所述第三特征向量计算出第四特征向量;
步骤四、获取待推荐的短视频库,提取所述短视频库中每个短视频的待推荐短视频标识信息列表,根据所述待推荐短视频标识信息列表生成第五特征向量,计算所述第五特征向量与所述第四特征向量的相似度,并根据相似度筛选出待推荐的短视频。
在本申请的至少一个实施例中,步骤一中,所述获取用户历史观看数据,根据所述用户历史观看数据确定按照用户感兴趣程度排序的第一短视频标识信息列表,以及按照用户讨厌程度排序的第二短视频标识信息列表,包括:
S11、获取用户历史观看数据,所述用户历史观看数据包括历史观看短视频库、正反馈行为信息以及负反馈行为信息,其中,
所述正反馈行为信息包括点赞、关注、正向评论、长时间停留;
所述负反馈行为信息包括拉黑、点击不感兴趣、负向评论、短时间停留;
S12、根据所述正反馈行为信息筛选出正反馈短视频库,并提取所述正反馈短视频库中每个短视频的短视频标识信息;
根据所述负反馈行为信息筛选出负反馈短视频库,并提取所述负反馈短视频库中每个短视频的短视频标识信息;
S13、根据所述正反馈短视频库中各个短视频标识信息的出现频次生成第一短视频标识信息列表,其中,所述第一短视频标识信息列表中包括根据出现频次由多到少排序的n个短视频标识信息,以及根据出现频次赋予对应短视频标识信息的权重值;
根据所述负反馈短视频库中各个短视频标识信息的出现频次生成第二短视频标识信息列表,其中,所述第二短视频标识信息列表中包括根据出现频次由多到少排序的m个短视频标识信息,以及根据出现频次赋予对应短视频标识信息的权重值。
在本申请的至少一个实施例中,步骤二中,所述获取待扩展短视频标识信息列表,包括:
S21、获取短视频标识信息库;
S22、从所述短视频标识信息库中移除所述第一短视频标识信息列表以及所述第二短视频标识信息列表中包含的短视频标识信息;
S23、从移除所述第一短视频标识信息列表以及所述第二短视频标识信息列表中包含的短视频标识信息后的所述短视频标识信息库中随机选取预定数量的短视频标识信息,生成待扩展短视频标识信息列表。
在本申请的至少一个实施例中,步骤三中,所述根据所述第一特征向量、所述第二特征向量以及所述第三特征向量计算出第四特征向量,包括:
其中,Wu为第四特征向量,Ir为用户感兴趣的短视频标识信息的集合,Inr为用户讨厌的短视频标识信息的集合,Ie为待扩展的短视频标识信息的集合,wj为第一特征向量中第j个用户感兴趣的短视频标识信息的特征向量,wk为第二特征向量中第k个用户讨厌的短视频标识信息的特征向量,we为第三特征向量中第e个待扩展的短视频标识信息的特征向量,aj、bk、A、B、C、D分别为对应的权重值。
在本申请的至少一个实施例中,
权重值A为0.8,权重值B为0.2;
权重值C、D的确定方式为:
获取连续的x个短视频的总时长tz,以及用户观看该x个短视频的总时长tg,计算出观看深度:
X=tg/tz
根据观看深度X值的大小,确定C、D的值:
D=1-C
其中,c1、c2、c3、α、β分别为常数。
在本申请的至少一个实施例中,步骤四中,所述获取待推荐的短视频库,包括:
获取短视频库,对所述短视频库中的每个短视频进行质量打分,根据质量分值筛选出满足要求的短视频,得到待推荐的短视频库;
其中,对所述短视频库中的每个短视频进行质量打分,包括:
获取短视频的静态标签,根据所述静态标签确定账号分值;
获取短视频的动态标签,根据所述动态标签确定互动分值;
将所述账号分值与所述互动分值进行加和,得到短视频的质量分值。
在本申请的至少一个实施例中,步骤四中,计算所述第五特征向量与所述第四特征向量的相似度,包括:
其中,Wu为第四特征向量,Wi为第五特征向量。
本申请的第二个方面提供了一种短视频推荐装置,包括:
用户特征提取模块,用于获取用户历史观看数据,根据所述用户历史观看数据确定按照用户感兴趣程度排序的第一短视频标识信息列表,以及按照用户讨厌程度排序的第二短视频标识信息列表,并根据所述第一短视频标识信息列表生成第一特征向量,以及根据所述第二短视频标识信息列表生成第二特征向量;
待扩展特征提取模块,用于获取待扩展短视频标识信息列表,并根据所述待扩展短视频标识信息列表生成第三特征向量;
特征计算模块,用于根据所述第一特征向量、所述第二特征向量以及所述第三特征向量计算出第四特征向量;
短视频推荐模块,用于获取待推荐的短视频库,提取所述短视频库中每个短视频的待推荐短视频标识信息列表,根据所述待推荐短视频标识信息列表生成第五特征向量,计算所述第五特征向量与所述第四特征向量的相似度,并根据相似度筛选出待推荐的短视频。
本申请的第三个方面提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并能够在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的短视频推荐方法。
本申请的第四个方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时能够实现如上所述的短视频推荐方法。
发明至少存在以下有益技术效果:
本申请的短视频推荐方法,根据用户感兴趣程度和讨厌程度对用户特征进行赋予权重,有利于从海量视频中找到用户真正感兴趣的内容;通过对短视频标识信息进行扩展,增加了短视频推荐的多样性和新鲜感。
附图说明
图1是本申请一个实施方式的短视频推荐方法流程图;
图2是本申请一个实施方式的用户特征提取方法流程图;
图3是本申请一个实施方式的高质量短视频筛选方法流程图;
图4是本申请一个实施方式的短视频推荐装置示意图;
图5为适于用来实现本申请实施方式的终端或服务器的计算机设备的结构示意图。
其中:
100-用户特征提取模块;200-待扩展特征提取模块;300-特征计算模块;400-短视频推荐模块;500-计算机设备;501-CPU;502-ROM;503-RAM;504-总线;505-I/O接口;506-输入部分;507-输出部分;508-存储部分;509-通信部分;510-驱动器;511-可拆卸介质。
具体实施方式
为使本申请实施的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行更加详细的描述。在附图中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。所描述的实施例是本申请一部分实施例,而不是全部的实施例。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。下面结合附图对本申请的实施例进行详细说明。
在本申请的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请保护范围的限制。
下面结合附图1至图5对本申请做进一步详细说明。
本申请的第一个方面提供了一种短视频推荐方法,如图1所示,包括以下步骤:
步骤一、获取用户历史观看数据,根据用户历史观看数据确定按照用户感兴趣程度排序的第一短视频标识信息列表,以及按照用户讨厌程度排序的第二短视频标识信息列表,并根据第一短视频标识信息列表生成第一特征向量,以及根据第二短视频标识信息列表生成第二特征向量;
步骤二、获取待扩展短视频标识信息列表,并根据待扩展短视频标识信息列表生成第三特征向量;
步骤三、根据第一特征向量、第二特征向量以及第三特征向量计算出第四特征向量;
步骤四、获取待推荐的短视频库,提取短视频库中每个短视频的待推荐短视频标识信息列表,根据待推荐短视频标识信息列表生成第五特征向量,计算第五特征向量与第四特征向量的相似度,并根据相似度筛选出待推荐的短视频。
在本申请的优选实施方式中,如图2所示,步骤一中,用户特征提取的过程具体包括:
S11、获取用户历史观看数据,用户历史观看数据包括历史观看短视频库、正反馈行为信息以及负反馈行为信息,其中,
正反馈行为信息包括点赞、关注、正向评论、长时间停留等;
负反馈行为信息包括拉黑、点击不感兴趣、负向评论、短时间停留等;
S12、根据正反馈行为信息筛选出正反馈短视频库,并提取正反馈短视频库中每个短视频的短视频标识信息;
根据负反馈行为信息筛选出负反馈短视频库,并提取负反馈短视频库中每个短视频的短视频标识信息;
S13、根据正反馈短视频库中各个短视频标识信息的出现频次生成第一短视频标识信息列表,其中,第一短视频标识信息列表中包括根据出现频次由多到少排序的n个短视频标识信息,以及根据出现频次赋予对应短视频标识信息的权重值;
根据负反馈短视频库中各个短视频标识信息的出现频次生成第二短视频标识信息列表,其中,第二短视频标识信息列表中包括根据出现频次由多到少排序的m个短视频标识信息,以及根据出现频次赋予对应短视频标识信息的权重值。
本申请的短视频推荐方法,首先根据反馈的正向性分类将用户反馈行为分成正反馈行为和负反馈行为,正反馈行为表示用户倾向于对此内容感兴趣,负反馈行为表示用户倾向于讨厌此内容。然后根据不同的用户反馈行为从历史观看短视频库中筛选出正反馈短视频库和负反馈短视频库,并从对应的短视频库中分别提取每个短视频的短视频标识信息。短视频标识信息的提取包括对短视频中文本内容、音频内容以及图像内容的标识提取。其中,可以采用ASR技术将短视频中音频内容转化为文本描述;并通过提取短视频的关键帧,得到信息比较丰富的图像,采用OCR技术将图像转换为文本信息;最后再从得到的文本信息集合中提取出短视频标识信息。其中,短视频标识信息包括但不限于:产品标识,例如衣服、电脑、汽车等;位置标识,例如北京、上海、东北等;节日标识,春节、情人节、中秋节等;行业标识,例如美妆、美食、旅游等;动物标识,狗、猫、鸭子等。统计出短视频库中各个短视频标识信息的出现频次,根据出现频次由高到低进行排序,得到具有特定数量的短视频标识信息的短视频标识信息列表,并根据出现频次的比重赋予对应短视频标识信息的权重值,最后可以采用词袋模型、N-gram模型、TF-IDF模型、基于神经网络的模型等方式将短视频标识信息列表中的文本信息转换为特征向量,可以理解的是,在分布式表示方面,深度学习相比传统方法具有较大优势,优选采用Paragraph2Vec技术得到特征向量。
在本申请的优选实施方式中,步骤二中,获取待扩展短视频标识信息列表,包括:
S21、获取短视频标识信息库;
S22、从短视频标识信息库中移除第一短视频标识信息列表以及第二短视频标识信息列表中包含的短视频标识信息;
S23、从移除第一短视频标识信息列表以及第二短视频标识信息列表中包含的短视频标识信息后的短视频标识信息库中随机选取预定数量的短视频标识信息,生成待扩展短视频标识信息列表。
本申请的短视频推荐方法,通过从短视频标识信息库中随机选取的若干个短视频标识信息对用户特征进行扩展,从而挖掘出用户潜在的其他兴趣。
在本申请的优选实施方式中,步骤三中,根据第一特征向量、第二特征向量以及第三特征向量计算出第四特征向量,具体为:
其中,Wu为第四特征向量,Ir为用户感兴趣的短视频标识信息的集合,Inr为用户讨厌的短视频标识信息的集合,Ie为待扩展的短视频标识信息的集合,wj为第一特征向量中第j个用户感兴趣的短视频标识信息的特征向量,wk为第二特征向量中第k个用户讨厌的短视频标识信息的特征向量,we为第三特征向量中第e个待扩展的短视频标识信息的特征向量,aj、bk、A、B、C、D分别为对应的权重值。
由于正反馈的重要性一般要比负反馈大,本实施例中,设置权重值A为0.8,权重值B为0.2。
有利的是,本实施例中,权重值C、D的确定方式为:
获取连续的x个短视频的总时长tz,以及用户观看该x个短视频的总时长tg,计算出观看深度:
X=tg/tz
根据观看深度X值的大小,确定C、D的值:
D=1-C
其中,c1、c2、c3、α、β分别为常数。
本申请的短视频推荐方法,一方面,分别为第一特征向量以及第二特征向量中的每个短视频标识信息的特征向量赋予了权重值,有利于筛选出用户更加感兴趣的特征;另一方面,根据正反馈的重要性分别为第一特征向量以及第二特征向量赋予了权重值;另外,还根据观看深度分别为用户特征向量和待扩展的特征向量赋予了权重值,当观看深度X值过小时,说明用户对推荐的内容不感兴趣,不容易提取出合适的用户特征,因此直接根据待扩展的特征向量实现短视频的推荐,当观看深度X值稳定在一个比较大的值时,说明用户对推荐的内容比较感兴趣,容易提取出合适的用户特征,此时,将权重值C确定为一个定值c3,例如0.8,确保推荐的短视频在用户比较感兴趣的基础上,适当的提高多样性和新鲜感。通过本实施例中的特征融合方式,可以根据用户反馈实时更新特征向量,实现对推荐的短视频的实时调整。
在本申请的优选实施方式中,如图3所示,步骤四中,获取待推荐的短视频库,包括:
获取短视频库,对短视频库中的每个短视频进行质量打分,根据质量分值筛选出满足要求的短视频,得到待推荐的短视频库;
其中,对短视频库中的每个短视频进行质量打分,包括:
获取短视频的静态标签,根据静态标签确定账号分值;
获取短视频的动态标签,根据动态标签确定互动分值;
将账号分值与互动分值进行加和,得到短视频的质量分值。
本实施例中,采用余弦相似度的方式计算第五特征向量与第四特征向量的相似度,包括:
其中,Wu为第四特征向量,Wi为第五特征向量。
本申请的短视频推荐方法,根据静态标签以及动态标签为短视频打分,静态标签包括头像、昵称、签名、性别等账号信息,可以基于账号信息的完整率实现对账号的打分,得到账号分值;动态标签包括完播率、点赞、关注、评论、分享等互动信息,可以基于各个互动量实现对互动情况的打分,得到互动分值;最后计算出每个短视频的质量分值,根据质量分值的大小筛选出满足质量分值要求的短视频,得到待推荐的短视频库。最后根据特征相似度从质量较高的短视频集合中筛选出待推荐的短视频。
本申请的短视频推荐方法,根据用户感兴趣程度和讨厌程度对用户特征分配权重,有利于筛选出用户真正感兴趣的内容;通过随机选取的特征对用户特征进行扩展,有利于提高短视频的多样性和新鲜感;通过特殊的特征融合方式,有利于对推荐的短视频进行实时调整;通过质量打分,得到高质量的待推荐的短视频集合,有利于提高用户满意度。本申请能够实现更加精准的个性化推荐,提高用户对平台的粘度,提高平台的受益,同时提高用户的体验。
基于上述的短视频推荐方法,本申请的第二个方面提供了一种短视频推荐装置,包括:
用户特征提取模块100,用于获取用户历史观看数据,根据用户历史观看数据确定按照用户感兴趣程度排序的第一短视频标识信息列表,以及按照用户讨厌程度排序的第二短视频标识信息列表,并根据第一短视频标识信息列表生成第一特征向量,以及根据第二短视频标识信息列表生成第二特征向量;
待扩展特征提取模块200,用于获取待扩展短视频标识信息列表,并根据待扩展短视频标识信息列表生成第三特征向量;
特征计算模块300,用于根据第一特征向量、第二特征向量以及第三特征向量计算出第四特征向量;
短视频推荐模块400,用于获取待推荐的短视频库,提取短视频库中每个短视频的待推荐短视频标识信息列表,根据待推荐短视频标识信息列表生成第五特征向量,计算第五特征向量与第四特征向量的相似度,并根据相似度筛选出待推荐的短视频。
本申请的另一方面,提供了一种计算机设备,包括处理器、存储器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序用于实现上述短视频推荐方法。
下面参考图5,其示出了适于用来实现本申请实施方式的计算机设备500的结构示意图。图5示出的计算机设备仅仅是一个示例,不应对本申请实施方式的功能和使用范围带来任何限制。
如图5所示,计算机设备500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM503中,还存储有设备500操作所需的各种程序和数据。CPU501、ROM502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本申请的实施方式,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施方式包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请的计算机存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施方式中所涉及到的模块或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块或单元也可以设置在处理器中,这些模块或单元的名称在某种情况下并不构成对该模块或单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时按上述短视频推荐方法对数据进行处理。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种短视频推荐方法,其特征在于,包括:
步骤一、获取用户历史观看数据,根据所述用户历史观看数据确定按照用户感兴趣程度排序的第一短视频标识信息列表,以及按照用户讨厌程度排序的第二短视频标识信息列表,并根据所述第一短视频标识信息列表生成第一特征向量,以及根据所述第二短视频标识信息列表生成第二特征向量;
步骤二、获取待扩展短视频标识信息列表,并根据所述待扩展短视频标识信息列表生成第三特征向量;
所述获取待扩展短视频标识信息列表,包括:
S21、获取短视频标识信息库;
S22、从所述短视频标识信息库中移除所述第一短视频标识信息列表以及所述第二短视频标识信息列表中包含的短视频标识信息;
S23、从移除所述第一短视频标识信息列表以及所述第二短视频标识信息列表中包含的短视频标识信息后的所述短视频标识信息库中随机选取预定数量的短视频标识信息,生成待扩展短视频标识信息列表;
步骤三、根据所述第一特征向量、所述第二特征向量以及所述第三特征向量计算出第四特征向量;
所述根据所述第一特征向量、所述第二特征向量以及所述第三特征向量计算出第四特征向量,包括:
其中,Wu为第四特征向量,Ir为用户感兴趣的短视频标识信息的集合,Inr为用户讨厌的短视频标识信息的集合,Ie为待扩展的短视频标识信息的集合,wj为第一特征向量中第j个用户感兴趣的短视频标识信息的特征向量,wk为第二特征向量中第k个用户讨厌的短视频标识信息的特征向量,we为第三特征向量中第e个待扩展的短视频标识信息的特征向量,aj、bk、A、B、C、D分别为对应的权重值;
步骤四、获取待推荐的短视频库,提取所述短视频库中每个短视频的待推荐短视频标识信息列表,根据所述待推荐短视频标识信息列表生成第五特征向量,计算所述第五特征向量与所述第四特征向量的相似度,并根据相似度筛选出待推荐的短视频。
2.根据权利要求1所述的短视频推荐方法,其特征在于,步骤一中,所述获取用户历史观看数据,根据所述用户历史观看数据确定按照用户感兴趣程度排序的第一短视频标识信息列表,以及按照用户讨厌程度排序的第二短视频标识信息列表,包括:
S11、获取用户历史观看数据,所述用户历史观看数据包括历史观看短视频库、正反馈行为信息以及负反馈行为信息,其中,
所述正反馈行为信息包括点赞、关注、正向评论、长时间停留;
所述负反馈行为信息包括拉黑、点击不感兴趣、负向评论、短时间停留;
S12、根据所述正反馈行为信息筛选出正反馈短视频库,并提取所述正反馈短视频库中每个短视频的短视频标识信息;
根据所述负反馈行为信息筛选出负反馈短视频库,并提取所述负反馈短视频库中每个短视频的短视频标识信息;
S13、根据所述正反馈短视频库中各个短视频标识信息的出现频次生成第一短视频标识信息列表,其中,所述第一短视频标识信息列表中包括根据出现频次由多到少排序的n个短视频标识信息,以及根据出现频次赋予对应短视频标识信息的权重值;
根据所述负反馈短视频库中各个短视频标识信息的出现频次生成第二短视频标识信息列表,其中,所述第二短视频标识信息列表中包括根据出现频次由多到少排序的m个短视频标识信息,以及根据出现频次赋予对应短视频标识信息的权重值。
3.根据权利要求2所述的短视频推荐方法,其特征在于,
权重值A为0.8,权重值B为0.2;
权重值C、D的确定方式为:
获取连续的x个短视频的总时长tz,以及用户观看该x个短视频的总时长tg,计算出观看深度:
X=tg/tz
根据观看深度X值的大小,确定C、D的值:
D=1-C
其中,c1、c2、c3、α、β分别为常数。
4.根据权利要求3所述的短视频推荐方法,其特征在于,步骤四中,所述获取待推荐的短视频库,包括:
获取短视频库,对所述短视频库中的每个短视频进行质量打分,根据质量分值筛选出满足要求的短视频,得到待推荐的短视频库;
其中,对所述短视频库中的每个短视频进行质量打分,包括:
获取短视频的静态标签,根据所述静态标签确定账号分值;
获取短视频的动态标签,根据所述动态标签确定互动分值;
将所述账号分值与所述互动分值进行加和,得到短视频的质量分值。
5.根据权利要求4所述的短视频推荐方法,其特征在于,步骤四中,计算所述第五特征向量与所述第四特征向量的相似度,包括:
其中,Wu为第四特征向量,Wi为第五特征向量。
6.一种短视频推荐装置,其特征在于,包括:
用户特征提取模块,用于获取用户历史观看数据,根据所述用户历史观看数据确定按照用户感兴趣程度排序的第一短视频标识信息列表,以及按照用户讨厌程度排序的第二短视频标识信息列表,并根据所述第一短视频标识信息列表生成第一特征向量,以及根据所述第二短视频标识信息列表生成第二特征向量;
待扩展特征提取模块,用于获取待扩展短视频标识信息列表,并根据所述待扩展短视频标识信息列表生成第三特征向量;
所述获取待扩展短视频标识信息列表,包括:
S21、获取短视频标识信息库;
S22、从所述短视频标识信息库中移除所述第一短视频标识信息列表以及所述第二短视频标识信息列表中包含的短视频标识信息;
S23、从移除所述第一短视频标识信息列表以及所述第二短视频标识信息列表中包含的短视频标识信息后的所述短视频标识信息库中随机选取预定数量的短视频标识信息,生成待扩展短视频标识信息列表;
特征计算模块,用于根据所述第一特征向量、所述第二特征向量以及所述第三特征向量计算出第四特征向量;
所述根据所述第一特征向量、所述第二特征向量以及所述第三特征向量计算出第四特征向量,包括:
其中,Wu为第四特征向量,Ir为用户感兴趣的短视频标识信息的集合,Inr为用户讨厌的短视频标识信息的集合,Ie为待扩展的短视频标识信息的集合,wj为第一特征向量中第j个用户感兴趣的短视频标识信息的特征向量,wk为第二特征向量中第k个用户讨厌的短视频标识信息的特征向量,we为第三特征向量中第e个待扩展的短视频标识信息的特征向量,aj、bk、A、B、C、D分别为对应的权重值;
短视频推荐模块,用于获取待推荐的短视频库,提取所述短视频库中每个短视频的待推荐短视频标识信息列表,根据所述待推荐短视频标识信息列表生成第五特征向量,计算所述第五特征向量与所述第四特征向量的相似度,并根据相似度筛选出待推荐的短视频。
7.一种电子设备,包括存储器、处理器以及存储在所述存储器中并能够在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任意一项所述的短视频推荐方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时能够实现如权利要求1至5中任意一项所述的短视频推荐方法。
CN202311565887.4A 2023-11-22 2023-11-22 一种短视频推荐方法、装置、电子设备及存储介质 Active CN117641004B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311565887.4A CN117641004B (zh) 2023-11-22 2023-11-22 一种短视频推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311565887.4A CN117641004B (zh) 2023-11-22 2023-11-22 一种短视频推荐方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN117641004A CN117641004A (zh) 2024-03-01
CN117641004B true CN117641004B (zh) 2024-05-14

Family

ID=90033181

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311565887.4A Active CN117641004B (zh) 2023-11-22 2023-11-22 一种短视频推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117641004B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929928A (zh) * 2012-09-21 2013-02-13 北京格致璞科技有限公司 基于多维相似度的个性化新闻推荐方法
FR3030982A1 (fr) * 2014-12-19 2016-06-24 Orange Procede d'enregistrement automatique de contenus video recommandes, dispositif et produit programme d'ordinateur associes.
CN109168047A (zh) * 2018-11-06 2019-01-08 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN113407845A (zh) * 2021-07-14 2021-09-17 上海明略人工智能(集团)有限公司 用于信息推荐的方法、装置、电子设备及存储介质
CN113407772A (zh) * 2020-03-16 2021-09-17 北京达佳互联信息技术有限公司 视频推荐模型的生成方法、视频推荐方法、装置
CN115309974A (zh) * 2022-05-19 2022-11-08 安徽合思网络科技股份有限公司 一种基于大数据的用户管理方法及系统
CN115618101A (zh) * 2022-09-21 2023-01-17 清华大学 基于负反馈的流媒体内容推荐方法、装置及电子设备
CN115687690A (zh) * 2022-10-09 2023-02-03 北京奇艺世纪科技有限公司 一种视频推荐方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004194108A (ja) * 2002-12-12 2004-07-08 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
US20140222775A1 (en) * 2013-01-09 2014-08-07 The Video Point System for curation and personalization of third party video playback
US20170169341A1 (en) * 2015-12-14 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method for intelligent recommendation
US10467308B2 (en) * 2016-10-27 2019-11-05 Conduent Business Services, Llc Method and system for processing social media data for content recommendation
CN110162703A (zh) * 2019-05-13 2019-08-23 腾讯科技(深圳)有限公司 内容推荐方法、训练方法、装置、设备及存储介质
CN112069414A (zh) * 2020-09-15 2020-12-11 腾讯科技(深圳)有限公司 推荐模型训练方法、装置、计算机设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929928A (zh) * 2012-09-21 2013-02-13 北京格致璞科技有限公司 基于多维相似度的个性化新闻推荐方法
FR3030982A1 (fr) * 2014-12-19 2016-06-24 Orange Procede d'enregistrement automatique de contenus video recommandes, dispositif et produit programme d'ordinateur associes.
CN109168047A (zh) * 2018-11-06 2019-01-08 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN113407772A (zh) * 2020-03-16 2021-09-17 北京达佳互联信息技术有限公司 视频推荐模型的生成方法、视频推荐方法、装置
CN113407845A (zh) * 2021-07-14 2021-09-17 上海明略人工智能(集团)有限公司 用于信息推荐的方法、装置、电子设备及存储介质
CN115309974A (zh) * 2022-05-19 2022-11-08 安徽合思网络科技股份有限公司 一种基于大数据的用户管理方法及系统
CN115618101A (zh) * 2022-09-21 2023-01-17 清华大学 基于负反馈的流媒体内容推荐方法、装置及电子设备
CN115687690A (zh) * 2022-10-09 2023-02-03 北京奇艺世纪科技有限公司 一种视频推荐方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Exploiting Geo-Social Correlations to Improve Pairwise Ranking for Point-of-Interest Recommendation;Rong Gao;Jing Li;Bo Du;Xuefei Li;Jun Chang;Chengfang Song;Donghua Liu;;中国通信;20180715(第07期);全文 *
基于用户行为与内容综合分析评估的视频推荐方法研究;杨箭;;电子技术与软件工程;20160701(第13期);全文 *

Also Published As

Publication number Publication date
CN117641004A (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
CN110751224B (zh) 视频分类模型的训练方法、视频分类方法、装置及设备
CN111381909B (zh) 一种页面展示方法、装置、终端设备及存储介质
JP2022506274A (ja) テキストの分類およびモデレーション
CN108108743B (zh) 异常用户识别方法和用于识别异常用户的装置
CN112215171B (zh) 目标检测方法、装置、设备及计算机可读存储介质
CN113806588B (zh) 搜索视频的方法和装置
CN110020162B (zh) 用户识别方法和装置
CN111666898B (zh) 用于识别车辆所属类别的方法和装置
CN111582360B (zh) 用于标注数据的方法、装置、设备和介质
CN110659657B (zh) 训练模型的方法和装置
CN106354856B (zh) 基于人工智能的深度神经网络强化搜索方法和装置
CN112818224B (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN109873756B (zh) 用于发送信息的方法和装置
CN114154013A (zh) 视频推荐方法、装置、设备及存储介质
CN110909768B (zh) 一种标注数据获取方法及装置
CN111897950A (zh) 用于生成信息的方法和装置
CN114625918A (zh) 视频推荐方法、装置、设备、存储介质及程序产品
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
CN117235371A (zh) 视频推荐方法、模型训练方法及装置
CN110414625B (zh) 确定相似数据的方法、装置、电子设备及存储介质
CN117641004B (zh) 一种短视频推荐方法、装置、电子设备及存储介质
JP2020502710A (ja) ウェブページメイン画像認識方法及び装置
CN111382262A (zh) 用于输出信息的方法和装置
CN109344327B (zh) 用于生成信息的方法和装置
CN112000872A (zh) 基于用户向量的推荐方法、模型的训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant