CN114528435A - 搜索场景下的视频排序方法、装置、电子设备及存储介质 - Google Patents

搜索场景下的视频排序方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114528435A
CN114528435A CN202011321732.2A CN202011321732A CN114528435A CN 114528435 A CN114528435 A CN 114528435A CN 202011321732 A CN202011321732 A CN 202011321732A CN 114528435 A CN114528435 A CN 114528435A
Authority
CN
China
Prior art keywords
video
historical
target
videos
playing characteristics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011321732.2A
Other languages
English (en)
Inventor
张志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202011321732.2A priority Critical patent/CN114528435A/zh
Publication of CN114528435A publication Critical patent/CN114528435A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种搜索场景下的视频排序方法、装置、电子设备及存储介质。该搜索场景下的视频排序方法包括:获取目标视频集,以及获取目标视频集中的目标视频对应的目标播放特征;将目标视频对应的目标播放特征输入预设的视频排序模型,并输出目标视频集中的目标视频的排序结果;其中,视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的;按照排序结果,对目标视频集中的目标视频进行展示。该搜索场景下的视频排序方法,根据历史视频特征,对模型训练中的损失函数进行调整,使训练得到的视频排序模型能够充分兼顾视频样本之间的差异性,提高视频排序和展示结果的准确性。

Description

搜索场景下的视频排序方法、装置、电子设备及存储介质
技术领域
本公开涉及视频处理技术领域,尤其涉及一种搜索场景下的视频排序方法、装置、电子设备及存储介质。
背景技术
随着现代信息传输技术的快速进步和智能手机等视频接收设备的普及,视频逐渐成为了人们日常接收信息的主要载体之一,各种各样的视频平台如雨后春笋般涌现。在视频平台中,经常需要按照用户输入的搜索词,向用户展示与搜索词对应的视频。在向用户展示与搜索词对应的视频时,通常需要按照一定的顺序对召回的与搜索词相关的多个视频进行排布展示,便于用户能更加快速的完成搜索,获得想要的视频内容。传统的视频排序方法,通常是按照视频特征(或播放特征,例如,视频的曝光量、点击数、点击率、点赞数、点赞率、关注率或完播率等),对多个与搜索词相关的视频的特征进行比较,根据比较后的结果对视频进行排序,并向用户展示排序后的视频。
然而,传统视频排序方法,是无差别地对待排序视频进行比较和排序的,没有兼顾样本的差异性,导致视频排序和展示的结果不准确。
发明内容
本公开提供一种搜索场景下的视频排序方法、装置、电子设备及存储介质,以至少解决相关技术中视频排序和展示结果不准确的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种搜索场景下的视频排序方法,包括:
获取目标视频集,以及获取所述目标视频集中的目标视频对应的目标播放特征;
将所述目标视频对应的目标播放特征输入预设的视频排序模型,并输出所述目标视频集中的目标视频的排序结果;其中,所述视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的;
按照所述排序结果,对所述目标视频集中的目标视频进行展示。
在一示例性实施例中,所述目标视频集的获取方式,包括:
获取目标搜索词;
获取与所述目标搜索词相关的视频,得到所述目标视频集。
在一示例性实施例中,所述获取所述目标视频集中的目标视频对应的目标播放特征,包括:
获取所述目标视频集中的目标视频对应的项目播放特征;
按照预设权重向量,对所述项目播放特征进行加权,得到所述目标视频对应的目标播放特征。
在一示例性实施例中,所述项目播放特征包括所述目标视频对应的点击率、点赞率、关注率或者平均播放时长中的至少一种。
在一示例性实施例中,所述视频排序模型的获取方式,包括:
从所述历史视频集中的历史视频中选出样本对,所述样本对包括第一历史视频和第二历史视频;
按照所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征,对预设的初始视频排序模型的第一损失函数进行加权,得到第二损失函数;
按照所述第二损失函数,对所述初始视频排序模型进行训练,得到所述视频排序模型。
在一示例性实施例中,所述按照所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征,对预设的初始视频排序模型的第一损失函数进行加权,得到第二损失函数,包括:
当所述第一历史视频对应的显示次数小于等于第一预设阈值,或所述第二历史视频对应的显示次数小于等于第二预设阈值时,将1确定为样本权重;
当所述第一历史视频对应的显示次数大于所述第一预设阈值,且所述第二历史视频对应的显示次数大于所述第二预设阈值时,将所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征的比值,确定为所述样本权重;
按照所述样本权重,对所述第一损失函数进行加权,得到所述第二损失函数。
在一示例性实施例中,所述将所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征的比值,确定为所述样本权重,包括:
获取所述第一历史视频与预设的历史搜索词之间的第一相关度,以及获取所述第二历史视频与所述历史搜索词之间的第二相关度;
若所述第一相关度大于所述第二相关度,则所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征的比值,确定为所述样本权重。
根据本公开实施例的第二方面,提供一种搜索场景下的视频排序装置,包括:
视频集获取单元,被配置为执行获取目标视频集,以及获取所述目标视频集中的目标视频对应的目标播放特征;
视频排序单元,被配置为执行将所述目标视频对应的目标播放特征输入预设的视频排序模型,并输出所述目标视频集中的目标视频的排序结果;其中,所述视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的;
视频展示单元,被配置为执行按照所述排序结果,对所述目标视频集中的目标视频进行展示。
在一示例性实施例中,所述视频集获取单元还被配置为执行:
获取目标搜索词;
获取与所述目标搜索词相关的视频,得到所述目标视频集。
在一示例性实施例中,所述视频集获取单元还被配置为执行:
获取所述目标视频集中的目标视频对应的项目播放特征;
按照预设权重向量,对所述项目播放特征进行加权,得到所述目标视频对应的目标播放特征。
在一示例性实施例中,所述项目播放特征包括所述目标视频对应的点击率、点赞率、关注率或者平均播放时长中的至少一种。
在一示例性实施例中,所述视频排序单元还被配置为执行:
从所述历史视频集中的历史视频中选出样本对,所述样本对包括第一历史视频和第二历史视频;
按照所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征,对预设的初始视频排序模型的第一损失函数进行加权,得到第二损失函数;
按照所述第二损失函数,对所述初始视频排序模型进行训练,得到所述视频排序模型。
在一示例性实施例中,所述视频排序单元还被配置为执行:
当所述第一历史视频对应的显示次数小于等于第一预设阈值,或所述第二历史视频对应的显示次数小于等于第二预设阈值时,将1确定为样本权重;
当所述第一历史视频对应的显示次数大于所述第一预设阈值,且所述第二历史视频对应的显示次数大于所述第二预设阈值时,将所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征的比值,确定为所述样本权重;
按照所述样本权重,对所述第一损失函数进行加权,得到所述第二损失函数。
在一示例性实施例中,所述视频排序单元还被配置为执行:
获取所述第一历史视频与预设的历史搜索词之间的第一相关度,以及获取所述第二历史视频与所述历史搜索词之间的第二相关度;
若所述第一相关度大于所述第二相关度,则所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征的比值,确定为所述样本权重。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述第一方面中任一项所述的搜索场景下的视频排序方法。
根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述第一方面中任一项所述的搜索场景下的视频排序方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,设备的至少一个处理器从所述可读存储介质读取并执行所述计算机程序,使得设备执行第一方面的任一项实施例中所述的搜索场景下的视频排序方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过获取目标视频集,以及获取目标视频集中的目标视频对应的目标播放特征,将目标视频对应的目标播放特征输入预设的视频排序模型,并输出目标视频集中的目标视频的排序结果,并按照排序结果,对目标视频集中的目标视频进行展示。其中,视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的。该搜索场景下的视频排序方法,根据历史视频特征,对模型训练中的损失函数进行调整,使训练得到的视频排序模型能够充分兼顾视频样本之间的差异性,精确地对通过该视频排序模型进行排序的目标视频进行展示,提高视频排序和展示结果的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种搜索场景下的视频排序方法的流程图。
图2是根据一示例性实施例示出的视频排序模型的一种获取方式的流程图。
图3是根据一示例性实施例示出的步骤S220的一种可实施方式的流程图。
图4是根据一示例性实施例示出的步骤S222的一种可实施方式的流程图。
图5是根据一示例性实施例示出的一种搜索场景下的视频排序装置的框图。
图6是根据一示例性实施例示出的一种用于搜索场景下的视频排序的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种搜索场景下的视频排序方法的流程图,本实施例以该方法应用于电子设备进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
在步骤S100中,获取目标视频集,以及获取目标视频集中的目标视频对应的目标播放特征。
在步骤S200中,将目标视频对应的目标播放特征输入预设的视频排序模型,并输出目标视频集中的目标视频的排序结果;其中,视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的。
在步骤S300中,按照排序结果,对目标视频集中的目标视频进行展示。
其中,目标视频集是需要进行排序和展示的视频形成的集合。目标播放特征是指与目标视频相关的播放特征,例如,点击率、点赞率、关注率或者平均播放时长等。
具体地,获取目标视频集,以及获取目标视频集中的目标视频对应的目标播放特征,并将目标视频对应的目标播放特征输入预设的视频排序模型,通过视频排序模型,按照每一目标视频对应的目标播放特征,对目标视频集中的目标视频进行排序,输出目标视频的排序结果,并按照排序结果,对目标视频集中的目标视频进行展示。
其中,视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的,该视频排序模型,根据历史视频特征,对模型训练中的损失函数进行调整,使训练得到的视频排序模型能够充分兼顾视频样本之间的差异性。并在视频排序的过程中,可以按照每一目标视频对应的目标播放特征,对目标视频集中的目标视频进行排序。
上述搜索场景下的视频排序方法,通过获取目标视频集,以及获取目标视频集中的目标视频对应的目标播放特征,将目标视频对应的目标播放特征输入预设的视频排序模型,并输出目标视频集中的目标视频的排序结果,并按照排序结果,对目标视频集中的目标视频进行展示。其中,视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的。该搜索场景下的视频排序方法,根据历史视频特征,对模型训练中的损失函数进行调整,使训练得到的视频排序模型能够充分兼顾视频样本之间的差异性,精确地对通过该视频排序模型进行排序的目标视频进行展示,提高视频排序和展示结果的准确性。
在一示例性实施例中,为步骤S100的一种可实施方式,其中,目标视频集的获取方式,包括:
获取目标搜索词;获取与目标搜索词相关的视频,得到目标视频集。
具体地,在一个视频搜索场景下,按照目标搜索词,可以召回与目标搜索词相关的视频,这些视频是需要进行排序和展示的视频,形成目标视频集,为后续对视频进行排序和展示提供边界。可以理解的是,上述仅为目标视频集的一种获取方式,并不用于对目标视频集进行限定。示例地,还可以通过用户ID、视频ID、视频发布区域、视频发布时间等确定出一个目标视频集合。
可选地,获取目标视频集中的目标视频对应的目标播放特征,包括:获取目标视频集中的目标视频对应的项目播放特征;按照预设权重向量,对项目播放特征进行加权,得到目标视频对应的目标播放特征。可选地,项目播放特征包括目标视频对应的点击率、点赞率、关注率或者平均播放时长中的至少一种。可以理解的是上述仅为项目播放特征的一种示例性说明,并不用于对项目播放特征进行限定。示例地,项目播放特征还可以包括点击数、点赞数、播放量等。
其中,权重向量为可以将项目播放特征映射至目标播放特征的一组权重。
具体地,对于任意一个搜索词,通过其搜索日志,可以统计出一段时间内的搜索词(query)下所有视频(photo)的项目播放特征,例如点击率(ctr)、点赞率(ltr)、关注率(ftr)、平均播放时长等。具体地项目播放特征的获取方式如公式(1)、(2)、(3)、(4)所示:
Figure BDA0002793091620000071
Figure BDA0002793091620000072
Figure BDA0002793091620000073
Figure BDA0002793091620000074
其中,
Figure BDA0002793091620000075
表示根据查询词query查询到的视频的点击率,
Figure BDA0002793091620000076
表示根据查询词query查询到的视频的点赞率,
Figure BDA0002793091620000077
表示根据查询词query查询到的视频的关注率,
Figure BDA0002793091620000078
表示根据查询词query查询到的视频的平均播放时长,#SHOW表示根据查询词query查询到的视频的展示数,#CLICK表示根据查询词query查询到的视频的点击数,click表示根据查询词query查询到的视频的一次点击,like表示根据查询词query查询到的视频的一次点赞,follow表示根据查询词query查询到的视频的一次关注,play_time表示根据查询词query查询到的视频播放时长,user表示根据查询词query查询到的用户,date表示根据查询词query查询的时间。
在按照上述方式得到项目播放特征后,按照预设权重向量,对项目播放特征进行加权,可以得到目标视频对应的目标播放特征。示例地,目标播放特征的获取方式如公式(5)所示:
Figure BDA0002793091620000081
其中,
Figure BDA0002793091620000082
表示目标播放特征,α、β、γ为三超参。
上述示例性实施例,提供了一种目标视频集获取方式,为后续对视频进行排序和展示提供边界。并通过目标视频的项目播放特征,确定出了后续进行视频排序和展示的目标视频特征,为后续视频排序模型能够充分兼顾视频样本之间的差异性,精确地对通过该视频排序模型进行排序的目标视频进行展示提供基础,提高视频排序和展示结果的准确性。
在一示例性实施例中,如图2所示,为根据一示例性实施例示出的视频排序模型的一种获取方式的流程图,具体包括以下步骤:
在步骤S210中,从历史视频集中的历史视频中选出样本对,样本对包括第一历史视频和第二历史视频。
在步骤S220中,按照第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征,对预设的初始视频排序模型的第一损失函数进行加权,得到第二损失函数。
在步骤S230中,按照第二损失函数,对初始视频排序模型进行训练,得到视频排序模型。
其中,样本对是指需要进行排序的两个视频形成的样本。历史播放特征为与目标播放特征对应的与历史视频相关的项目播放特征,例如,点击率、点赞率、关注率或者平均播放时长等。在视频排序过程中,存在多种不同的排序方案,其中往往涉及对两个不同的视频之间的位置关系进行确定。例如,可用于排序的LTR(Learning to Rank)算法。
具体地,从历史视频集中的历史视频中选出样本对,样本对包括第一历史视频和第二历史视频,按照第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征,对预设的初始视频排序模型的第一损失函数进行加权,得到第二损失函数,使得第二损失函数能够包含两个不同视频样本的特征,根据样本自身的差异性,对样本的权重进行控制,并按照第二损失函数,对初始视频排序模型进行训练,得到视频排序模型。使训练得到的视频排序模型能够充分兼顾视频样本之间的差异性,并在视频排序的过程中,可以按照每一目标视频对应的目标播放特征,对目标视频集中的目标视频进行排序。
上述示例性实施例,从历史视频集中的历史视频中选出样本对,样本对包括第一历史视频和第二历史视频;按照第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征,对预设的初始视频排序模型的第一损失函数进行加权,得到第二损失函数;按照第二损失函数,对初始视频排序模型进行训练,得到视频排序模型。从而使得到的视频排序模型能够充分兼顾视频样本之间的差异性,在模型的应用时,也能精确地对通过该视频排序模型进行排序的目标视频进行展示,提高视频排序和展示结果的准确性。
在一示例性实施例中,如图3所示,为根据一示例性实施例示出的步骤S220的一种可实施方式的流程图,具体包括以下步骤:
在步骤S221中,当第一历史视频对应的显示次数小于等于第一预设阈值,或第二历史视频对应的显示次数小于等于第二预设阈值时,将1确定为样本权重。
在步骤S222中,当第一历史视频对应的显示次数大于第一预设阈值,且第二历史视频对应的显示次数大于第二预设阈值时,将第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征的比值,确定为样本权重。
在步骤S223中,按照样本权重,对第一损失函数进行加权,得到第二损失函数。
其中,第一预设阈值、第二预设阈值是指界定视频的展示数是否充分,展示的数量是否能充分反映该视频的特性,例如一个视频的展示数为1、5、20等比较小的数值时,这一视频的点击率、点赞率、关注率或者平均播放时长并不能充分反映视频的播放特征。因此,第一预设阈值、第二预设阈值可以设置为1000、10000、10000或者更大,第一预设阈值与第二预设阈值可以相同,也可以不同。
具体地,当第一历史视频对应的显示次数小于等于第一预设阈值,或第二历史视频对应的显示次数小于等于第二预设阈值时,说明样本视频对训练的影响不明确,因此,不对样本权重进行调整,将1确定为样本权重。当第一历史视频对应的显示次数大于第一预设阈值,且第二历史视频对应的显示次数大于第二预设阈值时,说明样本视频能够训练的结果产生较大的影响,因此,为使训练得到的视频排序模型能输出更为准确的视频排序结果,需要对样本权重进行调整,此时,将第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征的比值,确定为样本权重。在得到样本调整的权重的,按照样本权重,对第一损失函数进行加权,得到第二损失函数。使用第二损失函数和历史视频集对模型进行训练,得到对应的视频排序模型。
上述示例性实施例,当第一历史视频对应的显示次数小于等于第一预设阈值,或第二历史视频对应的显示次数小于等于第二预设阈值时,将1确定为样本权重;当第一历史视频对应的显示次数大于第一预设阈值,且第二历史视频对应的显示次数大于第二预设阈值时,将第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征的比值,确定为样本权重,并按照样本权重,对第一损失函数进行加权,得到第二损失函数。该第二损失函数能够充分兼顾视频样本之间的差异性,由该第二损失函数训练得到的视频排序模型,能够精确地对通过该视频排序模型进行排序的目标视频进行展示,提高视频排序和展示结果的准确性。
在一示例性实施例中,如图4所示,为步骤S222的一种可实施方式的流程图,具体包括以下步骤:
在步骤S2221中,获取第一历史视频与预设的历史搜索词之间的第一相关度,以及获取第二历史视频与历史搜索词之间的第二相关度。
在步骤S2222中,若第一相关度大于第二相关度,则第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征的比值,确定为样本权重。
具体地,确定出第一历史视频与预设的历史搜索词之间的第一相关度,以及获取第二历史视频与历史搜索词之间的第二相关度后,可以根据相关度确定不同的样本权重,以加强样本的排序准确性,或者减小样本的排序准确性。示例地,对于一个历史视频集,在训练的过程中,根据标注的数据,会随机选择两个样本,第一历史视频i和第二历史视频j。第一相关度ranklabeli>第二相关度ranklabelj,即相关性i>j。对于i,j样本,其对应的历史播放特征分别为engagementi和engagementj,则得到的样本对的样本权重如公式(6)所示:
Figure BDA0002793091620000101
其中,δ为样本i,j对应的展示的阈值(第一预设阈值或第二预设阈值),如此,可以保证i、j样本在充足的后验的情况下才会产生置信的后验历史播放特征。
需要说明的是,当第一相关度ranklabeli>第二相关度ranklabelj时,上述样本权重为
Figure BDA0002793091620000102
可以加强样本的排序准确性,出于一些特殊的目的,还可以将样本权重设置为
Figure BDA0002793091620000103
的倒数,以减小样本的排序准确性,使得视频排序更加多样化。
上述示例性实施例,通过获取第一历史视频与预设的历史搜索词之间的第一相关度,以及获取第二历史视频与历史搜索词之间的第二相关度,在第一相关度大于第二相关度时,则第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征的比值,确定为样本权重。通过该样本权重调整后的第二损失函数,能够充分兼顾视频样本之间的差异性,由该第二损失函数训练得到的视频排序模型,能够精确地对通过该视频排序模型进行排序的目标视频进行展示,提高视频排序和展示结果的准确性。
应该理解的是,虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
图5是根据一示例性实施例示出的一种搜索场景下的视频排序装置的框图。参照图5,该装置包括视频集获取单元501、视频排序单元502和视频展示单元503:
视频集获取单元501,被配置为执行获取目标视频集,以及获取目标视频集中的目标视频对应的目标播放特征;
视频排序单元502,被配置为执行将目标视频对应的目标播放特征输入预设的视频排序模型,并输出目标视频集中的目标视频的排序结果;其中,视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的;
视频展示单元503,被配置为执行按照排序结果,对目标视频集中的目标视频进行展示。
在一示例性实施例中,视频集获取单元501还被配置为执行:获取目标搜索词;获取与目标搜索词相关的视频,得到目标视频集。
在一示例性实施例中,视频集获取单元501还被配置为执行:获取目标视频集中的目标视频对应的项目播放特征;按照预设权重向量,对项目播放特征进行加权,得到目标视频对应的目标播放特征。
在一示例性实施例中,项目播放特征包括目标视频对应的点击率、点赞率、关注率或者平均播放时长中的至少一种。
在一示例性实施例中,视频排序单元502还被配置为执行:从历史视频集中的历史视频中选出样本对,样本对包括第一历史视频和第二历史视频;按照第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征,对预设的初始视频排序模型的第一损失函数进行加权,得到第二损失函数;按照第二损失函数,对初始视频排序模型进行训练,得到视频排序模型。
在一示例性实施例中,视频排序单元502还被配置为执行:当第一历史视频对应的显示次数小于等于第一预设阈值,或第二历史视频对应的显示次数小于等于第二预设阈值时,将1确定为样本权重;当第一历史视频对应的显示次数大于第一预设阈值,且第二历史视频对应的显示次数大于第二预设阈值时,将第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征的比值,确定为样本权重;按照样本权重,对第一损失函数进行加权,得到第二损失函数。
在一示例性实施例中,视频排序单元502还被配置为执行:获取第一历史视频与预设的历史搜索词之间的第一相关度,以及获取第二历史视频与历史搜索词之间的第二相关度;若第一相关度大于第二相关度,则第一历史视频对应的历史播放特征与第二历史视频对应的历史播放特征的比值,确定为样本权重。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种用于搜索场景下的视频排序的电子设备600的框图。例如,设备600可以是移动电话、计算机、数字广播终端、消息收发设备、游戏控制台、平板设备、医疗设备、健身设备、个人数字助理等。
参照图6,设备600可以包括以下一个或多个组件:处理组件602、存储器604、电源组件606、多媒体组件608、音频组件610、输入/输出(I/O)的接口612、传感器组件614以及通信组件616。
处理组件602通常控制设备600的整体操作,诸如与显示、电话呼叫、数据通信、相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理组件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在设备600的操作。这些数据的示例包括用于在设备600上操作的任何应用程序或方法的指令、联系人数据、电话簿数据、消息、图片、视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、快闪存储器、磁盘或光盘。
电源组件606为设备600的各种组件提供电力。电源组件606可以包括电源管理系统,一个或多个电源,及其他与为设备600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述设备600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(MIC),当设备600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
I/O接口612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为设备600提供各个方面的状态评估。例如,传感器组件614可以检测到设备600的打开/关闭状态,组件的相对定位,例如所述组件为设备600的显示器和小键盘,传感器组件614还可以检测设备600或设备600一个组件的位置改变,用户与设备600接触的存在或不存在,设备600方位或加速/减速和设备600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器、陀螺仪传感器、磁传感器、压力传感器或温度传感器。
通信组件616被配置为便于设备600和其他设备之间有线或无线方式的通信。设备600可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或6G),或它们的组合。在一个示例性实施例中,通信组件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件616还包括近场通信(NFC)模块,以促进短程通信。
在示例性实施例中,设备600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由设备600的处理器620执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,设备的至少一个处理器620从所述可读存储介质读取并执行所述计算机程序,使得设备执行上述方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种搜索场景下的视频排序方法,其特征在于,包括:
获取目标视频集,以及获取所述目标视频集中的目标视频对应的目标播放特征;
将所述目标视频对应的目标播放特征输入预设的视频排序模型,并输出所述目标视频集中的目标视频的排序结果;其中,所述视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的;
按照所述排序结果,对所述目标视频集中的目标视频进行展示。
2.根据权利要求1所述的搜索场景下的视频排序方法,其特征在于,所述目标视频集的获取方式,包括:
获取目标搜索词;
获取与所述目标搜索词相关的视频,得到所述目标视频集。
3.根据权利要求1所述的搜索场景下的视频排序方法,其特征在于,所述获取所述目标视频集中的目标视频对应的目标播放特征,包括:
获取所述目标视频集中的目标视频对应的项目播放特征;
按照预设权重向量,对所述项目播放特征进行加权,得到所述目标视频对应的目标播放特征。
4.根据权利要求3所述的搜索场景下的视频排序方法,其特征在于,所述项目播放特征包括所述目标视频对应的点击率、点赞率、关注率或者平均播放时长中的至少一种。
5.根据权利要求1所述的搜索场景下的视频排序方法,其特征在于,所述视频排序模型的获取方式,包括:
从所述历史视频集中的历史视频中选出样本对,所述样本对包括第一历史视频和第二历史视频;
按照所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征,对预设的初始视频排序模型的第一损失函数进行加权,得到第二损失函数;
按照所述第二损失函数,对所述初始视频排序模型进行训练,得到所述视频排序模型。
6.根据权利要求5所述的搜索场景下的视频排序方法,其特征在于,所述按照所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征,对预设的初始视频排序模型的第一损失函数进行加权,得到第二损失函数,包括:
当所述第一历史视频对应的显示次数小于等于第一预设阈值,或所述第二历史视频对应的显示次数小于等于第二预设阈值时,将1确定为样本权重;
当所述第一历史视频对应的显示次数大于所述第一预设阈值,且所述第二历史视频对应的显示次数大于所述第二预设阈值时,将所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征的比值,确定为所述样本权重;
按照所述样本权重,对所述第一损失函数进行加权,得到所述第二损失函数。
7.根据权利要求6所述的搜索场景下的视频排序方法,其特征在于,所述将所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征的比值,确定为所述样本权重,包括:
获取所述第一历史视频与预设的历史搜索词之间的第一相关度,以及获取所述第二历史视频与所述历史搜索词之间的第二相关度;
若所述第一相关度大于所述第二相关度,则所述第一历史视频对应的历史播放特征与所述第二历史视频对应的历史播放特征的比值,确定为所述样本权重。
8.一种搜索场景下的视频排序装置,其特征在于,包括:
视频集获取单元,被配置为执行获取目标视频集,以及获取所述目标视频集中的目标视频对应的目标播放特征;
视频排序单元,被配置为执行将所述目标视频对应的目标播放特征输入预设的视频排序模型,并输出所述目标视频集中的目标视频的排序结果;其中,所述视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的;
视频展示单元,被配置为执行按照所述排序结果,对所述目标视频集中的目标视频进行展示。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的搜索场景下的视频排序方法。
10.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至7中任一项所述的搜索场景下的视频排序方法。
CN202011321732.2A 2020-11-23 2020-11-23 搜索场景下的视频排序方法、装置、电子设备及存储介质 Pending CN114528435A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011321732.2A CN114528435A (zh) 2020-11-23 2020-11-23 搜索场景下的视频排序方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011321732.2A CN114528435A (zh) 2020-11-23 2020-11-23 搜索场景下的视频排序方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114528435A true CN114528435A (zh) 2022-05-24

Family

ID=81618585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011321732.2A Pending CN114528435A (zh) 2020-11-23 2020-11-23 搜索场景下的视频排序方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114528435A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304512A (zh) * 2018-01-19 2018-07-20 北京奇艺世纪科技有限公司 一种视频搜索引擎粗排序方法、装置及电子设备
CN109299344A (zh) * 2018-10-26 2019-02-01 Oppo广东移动通信有限公司 排序模型的生成方法、搜索结果的排序方法、装置及设备
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质
CN111353068A (zh) * 2020-02-28 2020-06-30 腾讯音乐娱乐科技(深圳)有限公司 一种视频推荐方法及装置
CN111708942A (zh) * 2020-06-12 2020-09-25 北京达佳互联信息技术有限公司 多媒体资源推送方法、装置、服务器及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304512A (zh) * 2018-01-19 2018-07-20 北京奇艺世纪科技有限公司 一种视频搜索引擎粗排序方法、装置及电子设备
CN109299344A (zh) * 2018-10-26 2019-02-01 Oppo广东移动通信有限公司 排序模型的生成方法、搜索结果的排序方法、装置及设备
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质
CN111353068A (zh) * 2020-02-28 2020-06-30 腾讯音乐娱乐科技(深圳)有限公司 一种视频推荐方法及装置
CN111708942A (zh) * 2020-06-12 2020-09-25 北京达佳互联信息技术有限公司 多媒体资源推送方法、装置、服务器及存储介质

Similar Documents

Publication Publication Date Title
CN107105314B (zh) 视频播放方法及装置
CN111556327A (zh) 直播间推荐方法、装置、终端、服务器、系统及存储介质
US10296191B2 (en) Method and device for changing display background
CN111859020A (zh) 推荐方法、装置、电子设备及计算机可读存储介质
CN112148923B (zh) 搜索结果的排序方法、排序模型的生成方法、装置及设备
CN111369271A (zh) 一种广告的排序方法、装置、电子设备及存储介质
CN112148980A (zh) 基于用户点击的物品推荐方法、装置、设备和存储介质
CN112131466A (zh) 群组展示方法、装置、系统和存储介质
CN108629814B (zh) 相机调整方法及装置
CN111859097B (zh) 数据处理方法、装置、电子设备及存储介质
CN112000840A (zh) 一种业务对象的展示方法和装置
CN111382242A (zh) 一种信息提供方法、装置及可读介质
CN114528435A (zh) 搜索场景下的视频排序方法、装置、电子设备及存储介质
CN113159206A (zh) 图像比对方法、装置、电子设备、计算机可读存储介质
CN112380388B (zh) 搜索场景下的视频排序方法、装置、电子设备及存储介质
CN112256892A (zh) 视频推荐方法、装置、电子设备及存储介质
CN112241486A (zh) 多媒体信息获取方法及装置
CN117350824B (zh) 电子元件信息上传及展示方法、装置、介质及设备
CN110929055A (zh) 多媒体质量检测方法、装置、电子设备及存储介质
CN114722238B (zh) 视频推荐方法、装置、电子设备、存储介质及程序产品
CN114416246B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN111666436B (zh) 一种数据处理方法、装置和电子设备
CN113190725B (zh) 对象的推荐及模型训练方法和装置、设备、介质和产品
CN112364247B (zh) 一种信息处理方法及装置
CN112989172B (zh) 内容推荐方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination