CN115269978A - 一种视频标签生成方法、装置、设备及介质 - Google Patents
一种视频标签生成方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115269978A CN115269978A CN202210872885.9A CN202210872885A CN115269978A CN 115269978 A CN115269978 A CN 115269978A CN 202210872885 A CN202210872885 A CN 202210872885A CN 115269978 A CN115269978 A CN 115269978A
- Authority
- CN
- China
- Prior art keywords
- video
- processed
- prediction model
- feature vector
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种视频标签生成方法、装置、设备及介质,其中,方法包括:针对任一待处理视频,获取该待处理视频对应的相关信息,该相关信息包括待处理视频的图像、音频、文本信息等。将该相关信息输入预测模型,获得该预测模型输出的预测特征向量。其中,预测模型是基于视频推荐模型以及目标训练样本训练生成的,其中,视频推荐模型用于向用户推荐视频,在进行推荐时可以从视频提取反映用户兴趣的特征向量。即,预测模型输出的预测特征向量可以反映用户的兴趣特征。对预测特征向量进行聚类,根据聚类结果确定待处理视频的标签。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种视频标签生成方法、装置、设备及介质。
背景技术
视频标签是描述视频内容的一种常见的方法,通常视频标签的生成往往基于专家定义和运营挖掘等方法建立的标签体系,通过内容识别模型判断视频的分类信息。然而,对于一些有较少互动的视频而言,依赖专家定义的标签体系很难获取精准的标签。基于此,如何为推荐的内容匹配标签是急需解决的技术问题。
发明内容
有鉴于此,本申请实施例提供一种视频标签生成方法、装置、设备及介质,以实现为视频生成匹配的标签,保证视频的标签与用户兴趣保持一致性。
为实现上述目的,本申请提供的技术方案如下:
在本申请第一方面,提供了一种视频标签生成方法,该方法包括:
获取待处理视频的相关信息,所述相关信息包括所述待处理视频的图像、音频和文本信息;
将所述相关信息输入预测模型,获得所述预测模型输出的预测特征向量,所述预测模型是基于视频推荐模型以及目标训练样本训练生成的,所述视频推荐模型用于向用户推荐视频;
对所述预测特征向量进行聚类,根据聚类结果确定所述待处理视频的标签。
在本申请第二方面,提供了一种视频标签生成装置,所述装置包括:
第一获取单元,用于获取待处理视频的相关信息,所述相关信息包括所述待处理视频的图像、音频和文本信息;
第二获取单元,用于将所述相关信息输入预测模型,获得所述预测模型输出的预测特征向量,所述预测模型是基于视频推荐模型以及目标训练样本训练生成的,所述视频推荐模型用于向用户推荐视频;
确定单元,用于对所述预测特征向量进行聚类,根据聚类结果确定所述待处理视频的标签。
在本申请第三方面,提供了一种电子设备,所述设备包括:处理器和存储器;所述存储器,用于存储指令或计算机程序;所述处理器,用于执行所述存储器中的所述指令或计算机程序,以使得所述电子设备执行第一方面所述的方法。
在本申请第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在设备上运行时,使得所述设备执行第一方面所述的方法。
在本申请第五方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现第一方面所述的方法。
由此可见,本申请实施例具有如下有益效果:
本申请实施例中,针对任一待处理视频,获取该待处理视频对应的相关信息,该相关信息包括待处理视频的图像、音频、文本信息等。将该相关信息输入预测模型,获得该预测模型输出的预测特征向量。其中,预测模型是基于视频推荐模型以及目标训练样本训练生成的,其中,视频推荐模型用于向用户推荐视频,在进行推荐时可以从视频提取反映用户兴趣的特征向量。即,预测模型输出的预测特征向量可以反映用户的兴趣特征。对预测特征向量进行聚类,根据聚类结果确定待处理视频的标签。可见,通过本申请提供的技术方案,能够获取任一待处理视频的预测特征,且该预测特征能够与用户的兴趣相匹配,进而根据该预测特征进行聚类获得该待处理视频的分类标签,从而对于有较少互动的视频而言,也可以匹配到更加精准的标签,不再局限于专家定义的标签体系中,进而使得视频能够被推荐给更多用户。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种视频标签生成方法流程图;
图2为本申请实施例提供的一种视频标签生成场景示意图;
图3为本申请实施例提供的一种视频标签生成装置示意图;
图4为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
由于视频标签的生成往往基于专家定义和运营挖掘等方法建立的标签体系,然而,一方面,分类的粒度往往是固定的,很难适应所有的场景;另一方面,由于人的兴趣是细粒度且复杂的,依赖专家定义的标签体系很难实现精准的分类。
基于此,本申请提供了一种视频标签生成方法,对于尚未分配标签的待处理视频,获取该待处理视频的相关信息,该相关信息包括待处理视频的图像、音频和文本信息等,即获得待处理视频的多模态信息。将该相关信息输入预测模型,通过该预测模型获取能够反映用户兴趣的预测特征向量。其中,预测模型是基于视频推荐模型以及目标训练样本训练生成的,视频推荐模型用于向用户推荐视频,其在推荐视频时能够从视频中提取反映用户兴趣的特征向量,从而使得训练生成的预测模型所输出的预测特征向量也可以反映用户的兴趣。基于预测特征向量进行聚类,获得聚类结果,以根据聚类结果确定待处理视频的标签。即通过对预测特征聚类的方式确定待处理视频的标签,不再依赖专家定义的标签体系,提高分类准确性。
可以理解的是,在使用本公开中各个实施例的技术方案之前,均会通过恰当的方式对所涉及的个人信息的类型、使用范围、使用场景等告知用户,并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确的提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主的选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限定的实现方式,响应于接受到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其他满足相关法律法规的方式也可应用于本公开的实现方式中。
为便于理解本申请实施例提供的技术方案,下面将结合附图进行说明。
参见图1,该图为本申请实施例提供的一种视频标签生成方法,该方法可以由视频标签生成执行,该视频标签生成设备可以为电子设备或服务器。其中,电子设备可以包括移动电话、平板电脑、笔记本电脑、车载终端、可穿戴电子设备、一体机、智能家居设备等具有通信功能的设备,也可以是虚拟机或者模拟器模拟的设备。如图1所示,该方法可以包括如下步骤:
S101:获取待处理视频的相关信息。
本实施例中,为准确地获取待处理视频的特征,从待处理视频中提取相关信息,该相关信息包括待处理视频的图像、音频和文本信息等。即获取待处理视频的多模态内容。其中,文本信息可以包括待处理视频的标题和待处理视频画面中的字符,该字符可以通过光学字符识别(optical character recognition,OCR)技术获得。
S102:将相关信息输入预测模型,获得该预测模型输出的预测特征向量。
在从待处理视频中提取到相关信息后,将该相关信息输入预测模型,以通过该预测模型获得预测特征向量。其中,预测模型用于基于输入的相关信息进行特征向量预测,其预测出的特征向量可以反映用户的兴趣。
其中,预测模型是基于视频推荐模型以及目标训练样本训练生成的,视频推荐模型用于向用户推荐视频。视频推荐模型在向用户推荐视频时,其所提取的特征向量能够反映用户的兴趣,因此,基于视频推荐模型训练生成的预测模型所预测的特征向量也可以表达出用户的兴趣。
其中,预测模型的训练过程包括:
1).将目标训练样本输入视频推荐模型,获得推荐特征向量。
其中,视频推荐模型为已经经过训练的模型,用于向用户推荐感兴趣的视频。其中,为提高训练的准确性,目标训练样本可以为被用户经常访问的视频,即目标训练样本被用户访问的频率大于等于预设访问频率阈值。由于高热数据往往经过更多次与用户的交互,其对应的推荐特征向量的表达能力更强,向量更加纯净。其中,目标训练样本被用户访问的频率满足预设条件,表明目标训练样本属于高热数据。预设访问频率阈值的具体取值可以根据实际应用情况进行确定,本实施例在此不再限定。
2).将目标训练样本输入初始预测模型,获得初始预测特征向量。
3).根据推荐特征向量和初始预测特征向量对初始预测模型进行训练,直至初始预测特征向量与推荐特征向量之间的距离小于预设距离阈值,生成预测模型。
在训练开始时,将目标训练样本输入初始预测模型,以获得该初始预测模型输出的初始预测特征向量。将推荐特征向量作为目标训练样本的真实值和将预测特征向量作为目标训练样本的预测值对初始预测模型进行训练,更新初始预测模型中的相关参数,获得更新后的初始预测模型。再次将目标训练样本输入更新后的初始预测模型,获得更新后初始预测特征向量。再次根据推荐特征向量和更新后的初始预测特征向量对更新后的初始预测模型再次训练,依次执行上述训练过程,直至初始预测模型输出的初始预测特征向量与推荐特征向量之间的距离小于预设距离阈值,获得预测模型。
在本公开的一个实施例中,根据推荐特征向量和初始预测特征向量对初始预测模型进行训练,包括:根据推荐特征向量、初始预测特征向量以及损失函数对初始预测模型进行训练,直至损失函数满足预设条件,生成预测模型。即,将推荐特征向量和初始预测特征向量输入损失函数,根据损失函数的取值对初始预测模型进行训练,直至损失函数的取值满足预设条件。其中,损失函数可以为余弦损失函数、均方误差损失函数等。
S103:对预测特征向量进行聚类,根据聚类结果确定待处理视频的标签。
在获取到预测特征向量后,对该预测特征向量进行聚类,获得聚类结果,进而根据聚类结果确定待处理视频的标签。具体地,可以将预测特征向量输入预先训练生成的聚类模型中,通过该聚类模型获取聚类结果,将该聚类结果对应的标签确定为待处理视频的标签。
在本公开的一个实施例中,为提高聚类的多样性,进而为待处理视频确定多样化的分类标签,本实施例获取了多种聚类粒度,以在不同聚类粒度下确定与预测特征向量相似的聚类中心。具体地:针对k种聚类粒度任一聚类粒度,确定预测特征向量与聚类粒度中每个聚类中心向量的距离,其中,k大于等于2,不同聚类粒度对应的分类数量不同;根据距离从聚类粒度中确定m个目标聚类中心向量,该目标聚类中心向量与预测特征向量的距离小于预设距离阈值,其中,m大于等于1;将目标聚类中心向量对应的标签确定为待处理视频的标签。其中,待处理视频对应k*m个标签。即,将预测特征向量与不同聚类粒度下的不同聚类中心向量进行比较,以从任一聚类粒度中确定出一个或多个目标聚类中心向量,进而将目标聚类中心向量对应的标签确定为待处理视频的标签。其中,不同的聚类粒度对应的分类数量不同,不同的聚类中心对应不同的聚类中心向量,不同的聚类中心向量对应不同的标签。例如,聚类粒度为64表示该聚类粒度中共划分64个分类、聚类粒度为512表示该聚类粒度中共划分512个分类。
例如,存在3种聚类粒度,分别64/512和2048,针对每一种聚类粒度,根据预测特征向量以及该聚类粒度中每个聚类中心向量确定3个目标聚类中心量,则共存在9个目标聚类中心向量,将该9个目标聚类中心向量分别对应的标签确定为待处理视频的标签。即,待处理视频共存在9个标签。
在本公开的一个实施例中,当确定出待处理视频对应的标签后,可以根据该待处理视频的标签向用户推荐该待处理视频,从而保证该待处理视频能够被感兴趣的用户观看。
在本公开的一个实施例中,待处理视频不仅可以是访问频率较高的视频,还可以为被用户访问的频率小于预设访问频率阈值的视频。即,预测模型可以针对各种类型的视频进行特征预测,并使得所预测的特征向量能够反映用户的兴趣。也就是,预测模型不仅能够实现高热内容的兴趣表达,在低热内容上也具有有效的表征能力,从而可以动态的获取视频的标签。
可见,针对任一待处理视频,获取该待处理视频对应的相关信息,该相关信息包括待处理视频的图像、音频、文本信息等。将该相关信息输入预测模型,获得该预测模型输出的预测特征向量。其中,预测模型是基于视频推荐模型以及目标训练样本训练生成的,其中,视频推荐模型用于向用户推荐视频,在进行推荐时可以从视频提取反映用户兴趣的特征向量。即,预测模型输出的预测特征向量可以反映用户的兴趣特征。对预测特征向量进行聚类,根据聚类结果确定待处理视频的标签。可见,通过本申请提供的技术方案,能够获取任一待处理视频的预测特征,且该预测特征能够与用户的兴趣相匹配,进而根据该预测特征进行聚类获得该待处理视频的分类标签,从而对于有较少互动的视频而言,也可以匹配到更加精准的标签,不再局限于专家定义的标签体系中,进而使得视频能够被推荐给更多用户。
为便于理解本申请,参见图2所示的视频标签生成场景图,首先将目标训练样本分别输入视频推荐模型和初始预测模型,获得推荐向量x1、初始预测特征向量x2,根据x1和x2确定二者对应的损失函数loss,并根据该损失函数loss对初始预测模型进行训练,依次循环,直至损失函数满足预设条件,生成预测模型。将待处理视频的相关信息输入预测模型,获得预测特征向量x,并将该预测特征向量x输入聚类模型,获得不同聚类粒度下的聚类结果c,从而根据聚类结果c确定待处理视频的标签。
基于上述方法实施例,本申请实施例提供了一种视频标签生成装置和设备,下面将结合附图进行说明。
参见图3,该图为本申请实施例提供的一种视频标签生成装置结构图,如图3所示,该装置包括:第一获取单元301、第二获取单元302和确定单元303。
第一获取单元301,用于获取待处理视频的相关信息,所述相关信息包括所述待处理视频的图像、音频和文本信息;
第二获取单元302,用于将所述相关信息输入预测模型,获得所述预测模型输出的预测特征向量,所述预测模型是基于视频推荐模型以及目标训练样本训练生成的,所述视频推荐模型用于向用户推荐视频;
确定单元303,用于对所述预测特征向量进行聚类,根据聚类结果确定所述待处理视频的标签。
在本公开的一个实施例中,所述确定单元303,用于针对k种聚类粒度中任一聚类粒度,确定所述预测特征向量与所述聚类粒度中每个聚类中心向量的距离,其中,k大于等于2,不同聚类粒度对应的分类数量不同;根据所述距离从所述聚类粒度中确定m个目标聚类中心向量,所述目标聚类中心向量与所述预测特征向量的距离小于预设距离阈值,其中,m大于等于1;将所述目标聚类中心向量对应的标签确定为所述待处理视频的标签,所述待处理视频对应k*m个标签。
在本公开的一个实施例中,所述预测模型的训练过程包括:将所述目标训练样本输入所述视频推荐模型,获得推荐特征向量;将所述目标训练样本输入初始预测模型,获得初始预测特征向量;根据所述推荐特征向量和所述初始预测特征向量对所述初始预测模型进行训练,直至初始预测特征向量与所述推荐特征向量之间的距离小于预设距离阈值,生成所述预测模型。
在本公开的一个实施例中,所述根据所述推荐特征向量和所述初始预测特征向量对所述初始预测模型进行训练,包括:根据所述推荐特征向量、初始预测特征向量以及损失函数对所述初始预测模型进行训练,直至所述损失函数满足预设条件,生成所述预测模型。
在本公开的一个实施例中,所述目标训练样本被用户访问的频率大于等于预设访问频率阈值。
在本公开的一个实施例中,所述待处理视频为被用户访问的频率小于所述预设访问频率阈值的视频。
在本公开的一个实施例中,所述装置还包括:推荐单元;
所述推荐单元,用于根据所述待处理视频的标签向用户推荐所述待处理视频。
需要说明的是,本实施例中各个单元的具体实现可以参见上述方法实施例中的相关描述。
本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。本申请实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。例如,上述实施例中,处理单元和发送单元可以是同一个单元,也可以是不同的单元。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
参见图4,其示出了适于用来实现本公开实施例的电子设备400的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)404中的程序而执行各种适当的动作和处理。在RAM403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
本公开实施例提供的电子设备与上述实施例提供的方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(Hyper Text TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元/模块的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种视频标签生成方法,其特征在于,该方法包括:
获取待处理视频的相关信息,所述相关信息包括所述待处理视频的图像、音频和文本信息;
将所述相关信息输入预测模型,获得所述预测模型输出的预测特征向量,所述预测模型是基于视频推荐模型以及目标训练样本训练生成的,所述视频推荐模型用于向用户推荐视频;
对所述预测特征向量进行聚类,根据聚类结果确定所述待处理视频的标签。
2.根据权利要求1所述的方法,其特征在于,所述对所述预测特征向量进行聚类,根据聚类结果确定所述待处理视频的标签,包括:
针对k种聚类粒度中任一聚类粒度,确定所述预测特征向量与所述聚类粒度中每个聚类中心向量的距离,其中,k大于等于2,不同聚类粒度对应的分类数量不同;
根据所述距离从所述聚类粒度中确定m个目标聚类中心向量,所述目标聚类中心向量与所述预测特征向量的距离小于预设距离阈值,其中,m大于等于1;
将所述目标聚类中心向量对应的标签确定为所述待处理视频的标签,所述待处理视频对应k*m个标签。
3.根据权利要求1或2所述的方法,其特征在于,所述预测模型的训练过程包括:
将所述目标训练样本输入所述视频推荐模型,获得推荐特征向量;
将所述目标训练样本输入初始预测模型,获得初始预测特征向量;
根据所述推荐特征向量和所述初始预测特征向量对所述初始预测模型进行训练,直至初始预测特征向量与所述推荐特征向量之间的距离小于预设距离阈值,生成所述预测模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述推荐特征向量和所述初始预测特征向量对所述初始预测模型进行训练,包括:
根据所述推荐特征向量、初始预测特征向量以及损失函数对所述初始预测模型进行训练,直至所述损失函数满足预设条件,生成所述预测模型。
5.根据权利要求1所述的方法,其特征在于,所述目标训练样本被用户访问的频率大于等于预设访问频率阈值。
6.根据权利要求5所述的方法,其特征在于,所述待处理视频为被用户访问的频率小于所述预设访问频率阈值的视频。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述待处理视频的标签向用户推荐所述待处理视频。
8.一种视频标签生成装置,其特征在于,所述装置包括:
第一获取单元,用于获取待处理视频的相关信息,所述相关信息包括所述待处理视频的图像、音频和文本信息;
第二获取单元,用于将所述相关信息输入预测模型,获得所述预测模型输出的预测特征向量,所述预测模型是基于视频推荐模型以及目标训练样本训练生成的,所述视频推荐模型用于向用户推荐视频;
确定单元,用于对所述预测特征向量进行聚类,根据聚类结果确定所述待处理视频的标签。
9.一种电子设备,其特征在于,所述设备包括:处理器和存储器;
所述存储器,用于存储指令或计算机程序;
所述处理器,用于执行所述存储器中的所述指令或计算机程序,以使得所述电子设备执行权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在设备上运行时,使得所述设备执行权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210872885.9A CN115269978A (zh) | 2022-07-21 | 2022-07-21 | 一种视频标签生成方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210872885.9A CN115269978A (zh) | 2022-07-21 | 2022-07-21 | 一种视频标签生成方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115269978A true CN115269978A (zh) | 2022-11-01 |
Family
ID=83768677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210872885.9A Pending CN115269978A (zh) | 2022-07-21 | 2022-07-21 | 一种视频标签生成方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115269978A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116996708A (zh) * | 2023-08-10 | 2023-11-03 | 广州阿凡提电子科技有限公司 | 基于机器学习的短视频数据标签推荐方法、系统及云平台 |
-
2022
- 2022-07-21 CN CN202210872885.9A patent/CN115269978A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116996708A (zh) * | 2023-08-10 | 2023-11-03 | 广州阿凡提电子科技有限公司 | 基于机器学习的短视频数据标签推荐方法、系统及云平台 |
CN116996708B (zh) * | 2023-08-10 | 2024-02-09 | 广州阿凡提电子科技有限公司 | 基于机器学习的短视频数据标签推荐方法、系统及云平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110634047B (zh) | 一种推荐房源的方法、装置、电子设备及存储介质 | |
CN110516159B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN111291258A (zh) | 搜索热词的推荐方法、装置、电子设备及可读介质 | |
CN113449070A (zh) | 多模态数据检索方法、装置、介质及电子设备 | |
CN114443897A (zh) | 一种视频推荐方法、装置、电子设备和存储介质 | |
CN110188782B (zh) | 图像相似性确定方法、装置、电子设备及可读存储介质 | |
CN115205305A (zh) | 一种实例分割模型训练方法、实例分割方法及装置 | |
CN115269978A (zh) | 一种视频标签生成方法、装置、设备及介质 | |
CN111262744B (zh) | 多媒体信息发送方法、备份服务器及介质 | |
CN117241092A (zh) | 一种视频处理方法、装置、存储介质及电子设备 | |
CN116306981A (zh) | 策略确定方法、装置、介质及电子设备 | |
CN116186545A (zh) | 预训练模型的训练、应用方法、装置、电子设备及介质 | |
CN116258911A (zh) | 图像分类模型的训练方法、装置、设备及存储介质 | |
CN116092092A (zh) | 匹配方法、装置、介质及电子设备 | |
CN113033682B (zh) | 视频分类方法、装置、可读介质、电子设备 | |
CN111737575B (zh) | 内容分发方法、装置、可读介质及电子设备 | |
CN113592607A (zh) | 产品推荐方法、装置、存储介质及电子设备 | |
CN111680754B (zh) | 图像分类方法、装置、电子设备及计算机可读存储介质 | |
CN113033680A (zh) | 视频分类方法、装置、可读介质及电子设备 | |
CN113836415A (zh) | 信息推荐方法、装置、介质及设备 | |
CN113222050A (zh) | 图像分类方法、装置、可读介质及电子设备 | |
CN113177176A (zh) | 特征构建方法、内容显示方法及相关装置 | |
CN112488947A (zh) | 模型训练和图像处理方法、装置、设备和计算机可读介质 | |
CN111738311A (zh) | 面向多任务的特征提取方法、装置及电子设备 | |
CN114625876B (zh) | 作者特征模型的生成方法、作者信息处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |