CN111914120A - 视频分类方法、装置、电子设备以及计算机可读存储介质 - Google Patents

视频分类方法、装置、电子设备以及计算机可读存储介质 Download PDF

Info

Publication number
CN111914120A
CN111914120A CN201910379507.5A CN201910379507A CN111914120A CN 111914120 A CN111914120 A CN 111914120A CN 201910379507 A CN201910379507 A CN 201910379507A CN 111914120 A CN111914120 A CN 111914120A
Authority
CN
China
Prior art keywords
video
classification result
information
classification
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910379507.5A
Other languages
English (en)
Inventor
邢景轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910379507.5A priority Critical patent/CN111914120A/zh
Publication of CN111914120A publication Critical patent/CN111914120A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种视频分类方法、装置、电子设备以及计算机可读存储介质,该方法包括:获取视频的分类结果信息,其中,所述分类结果信息包括视频的第一分类结果,所述第一分类结果是基于所述视频的文字信息确定的;获取所述视频,并基于所述视频确定视频画面特征信息;根据所述视频画面特征信息确定所述视频的第二分类结果;基于所述视频的第一分类结果和所述视频的第二分类结果生成优化后的视频的分类结果信息。

Description

视频分类方法、装置、电子设备以及计算机可读存储介质
技术领域
本发明涉及分类处理技术领域,更具体地,涉及一种视频分类方法、一种视频分类装置、一种电子设备以及一种计算机可读存储介质。
背景技术
对于新入库的信息流内容,主要分类方式是依据信息流内容的文字信息进行分类的。其中,信息流内容包括两种类型的内容,即视频内容和图文内容。
目前,对于视频内容来说,依据视频的文字信息进行分类,得到的分类结果不够精准。
因此,需要提供一种视频分类方法,以对仅依据文字信息得到的分类结果进行补充和优化,以提高视频分类结果的精准性。
发明内容
本发明的一个目的是提供一种用于视频分类的新技术方案。
根据本发明的第一方面,提供了一种视频分类方法,包括:
获取视频的分类结果信息,其中,所述分类结果信息包括视频的第一分类结果,所述第一分类结果是基于所述视频的文字信息确定的;
获取所述视频,并基于所述视频确定视频画面特征信息;
根据所述视频画面特征信息确定所述视频的第二分类结果;
基于所述视频的第一分类结果和所述视频的第二分类结果生成优化后的视频的分类结果信息。
可选地,所述视频的文字信息包括视频的标题信息和/或视频内容介绍信息,在所述获取视频的分类结果信息之前,所述方法还包括:
从所述视频的标题信息和/或视频内容介绍信息提取关键词;
根据所述关键词确定所述视频的第一分类结果;
基于所述视频的第一分类结果生成所述视频的分类结果信息。
可选地,在获取所述视频,并基于所述视频确定视频画面特征信息之前,所述方法还包括:
检测所述视频的第一分类结果是否为未分类;
在所述检测所述视频的第一分类结果为未分类的情况下,才执行所述获取所述视频,并基于所述视频确定视频画面特征信息的操作。
可选地,所述分类结果信息还包括视频的存储地址信息,其中,所述获取所述视频包括:
基于所述视频的存储地址信息,获得所述视频。
可选地,所述基于所述视频确定视频画面特征信息包括:
从所述视频中截取预设帧数的视频画面图像;
根据所述预设帧数的视频画面图像确定所述视频画面特征信息。
可选地,所述根据所述视频画面特征信息确定所述视频的第二分类结果包括:
将所述视频画面特征信息输入至训练后的神经网络模型中,得到各个分类的预测分数值;
根据所述各个分类的预测分数值确定所述视频的第二分类结果。
可选地,所述基于所述视频的第一分类结果和所述视频的第二分类结果得到优化后的视频的分类结果信息包括:
将所述视频的第一分类结果与所述视频的第二分类结果进行合并,生成优化后的视频的分类结果信息;或者,
将所述视频的第二分类结果替换所述视频的第一分类结果,得到优化后的视频的分类结果信息。
根据本发明的第二方面,提供了一种视频分类装置,包括:
获取模块,用于获取视频的分类结果信息,其中,所述分类结果信息包括视频的第一分类结果;
视频画面特征信息确定模块,用于获取所述视频,并基于所述视频确定视频画面特征信息;
第二分类结果确定模块,用于根据所述视频画面特征信息确定所述视频的第二分类结果;
生成模块,用于基于所述视频的第一分类结果和所述视频的第二分类结果生成优化后的视频的分类结果信息。
根据本发明的第三方面,提供了一种电子设备,包括处理器和存储器,所述存储器用于存储可执行的指令,所述处理器用于根据指令的控制运行电子设备执行根据第一方面中任意一项所述的方法。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据第一方面中任意一项所述的方法。
本发明实施例提供的视频分类方法,通过获取视频的分类结果信息,其中,所述分类结果信息包括视频的第一分类结果,获取所述视频,并基于所述视频确定视频画面特征信息,根据所述视频画面特征信息确定所述视频的第二分类结果,基于所述视频的第一分类结果和所述视频的第二分类结果生成优化后的视频的分类结果信息,对视频的第一分类结果进行补充和优化,提高了视频分类的精准性。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是可用于实现本发明任意实施例的视频分类方法的电子设备的硬件配置的框图。
图2是根据本发明一个实施例的视频分类方法的处理流程图。
图3根据本发明一个例子的视频分类方法的处理流程图。
图4为根据本发明实施例的视频分类装置的原理框图。
图5是根据本发明一个实施例的电子设备的原理框图。
图6是根据本发明一个实施例的电子设备的硬件结构示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1是可用于实现本发明任意实施例的视频分类方法的电子设备的硬件配置的框图。
在一个实施例中,如图1所示,电子设备可以是服务器1000。
服务器1000提供处理、数据库、通讯设施的业务点。服务器1000可以是整体式服务器或是跨多计算机或计算机数据中心的分散式服务器。服务器可以是各种类型的,例如但不限于,网络服务器,新闻服务器,邮件服务器,消息服务器,广告服务器,文件服务器,应用服务器,交互服务器,数据库服务器,或代理服务器。在一些实施例中,每个服务器可以包括硬件,软件,或用于执行服务器所支持或实现的合适功能的内嵌逻辑组件或两个或多个此类组件的组合。例如,服务器例如刀片服务器、云端服务器等,或者可以是由多台服务器组成的服务器群组,可以包括上述类型的服务器中的一种或多种等等。
在一个例子中,服务器1000可以如图1所示,包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600。服务器也可以包括扬声器、麦克风等等。
其中,处理器1100例如可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、串行接口、红外接口等。通信装置1400例如能够进行有线或无线通信。显示装置1500例如是液晶显示屏、LED显示屏触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘等。
尽管在图1中对服务器1000均示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,服务器1000只涉及存储器1200和处理器1100。
应用于本发明的实施例中,服务器1000的所述存储器1200用于存储指令,所述指令用于控制所述处理器1100执行本发明实施例提供的视频分类方法。
在上述描述中,技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
<方法实施例>
现有技术中,对于新入库的视频,服务器根据视频的文字信息进行分类,得到的分类结果不太精准。针对该技术问题,本发明的一个实施例提供了一种视频分类方法,以提高视频分类结果的精准性。
图2是根据本发明一个实施例的视频分类方法的处理流程图。
根据图2所示,该视频分类方法可以包括以下步骤S2100-S2400。
步骤S2100,获取视频的分类结果信息,其中,分类结果信息包括视频的第一分类结果,第一分类结果是基于所述视频的文字信息确定的。
视频的文字信息包括视频的标题信息和/或视频内容描述信息。
在步骤S2100之前,该视频分类方法还包括以下步骤S2500-S2700。
步骤S2500,从视频的标题信息和/或视频内容介绍信息提取关键词。
步骤S2600,根据关键词确定视频的第一分类结果。
步骤S2700,基于视频的第一分类结果生成视频的分类结果信息。
需要说明地是,新增的待分类内容包括两种类型,一种是视频内容,另一种是图文内容。图文内容至少包括图片和文本中的一种。
当获取到新增待分类内容时,根据新增待分类内容的文字信息确定分类结果。当新增的待分类内容的类型为图文时,将该分类结果作为图文内容的最终分类结果。当新增的待分类内容的类型为视频时,继续执行下述步骤S2200-S2400,以对基于文字信息确定的视频的第一分类结果进行补充和优化。
在本发明的一个实施例中,在确定视频的第一分类结果后,利用视频的第一分类结果和视频的标识信息生成视频的分类结果信息。在生成视频的分类结果信息后,对其执行存储操作。
步骤S2200,获取视频,并基于视频确定视频画面特征信息。
在一个实施例中,步骤S2100中的分类结果信息还包括视频的存储地址信息。基于视频的存储地址信息,获得该视频。
步骤S2200中的基于视频确定视频画面特征信息可以包括以下步骤S2210-S2220。
步骤S2210,从视频中截取预设帧数的视频画面图像。
视频是由连续帧的视频画面图像组成的。一秒视频可以包括多帧视频画面图像。例如,首先从视频中截取预设秒数对应的视频画面图像,然后从每一秒对应的视频画面图像中截取一帧视频画面图像,得到预设帧数的视频画面图像。其中,预设秒数可以是连续秒数,也可以是非连续秒数。
步骤S2220,根据预设帧数的视频画面图像确定视频画面特征信息。
在本实施例中,将预设帧数的视频画面图像输入至神经网络模型,得到视频画面特征信息。
例如,该神经网络模型可以是Inception-V3模型。将预设帧数的视频画面图像输入至Inception-V3模型,得到视频画面特征信息。其中,该视频画面特征信息是一组向量。
在本发明的一个实施例中,在步骤S2200之前,服务器检测视频的第一分类结果是否为未分类。在检测视频的第一分类结果为未分类的情况下,才执行步骤S2200中的获取视频,并基于视频确定视频画面特征信息的操作。
步骤S2300,根据视频画面特征信息确定视频的第二分类结果。
在本发明实施例中,步骤S2300可以包括以下步骤S2310-S2320。
步骤S2310,将视频画面特征信息输入至训练后的神经网络模型中,得到各个分类的预测分数值。
步骤S2310中的神经网络模型可以是Tensorflow模型。具体地,将根据Inception-V3模型得到的向量输入至训练后的Tensorflow模型,得到各个分类的预测分数值。
在一个实施例中,Tensorflow模型训练过程是一个迭代过程,具体包括:将作为训练数据的已知视频类别的视频画面特征信息输入至Tensorflow模型中,得到各个分类的预测分数值。根据各个分类的预测分数值得到视频的预测类别,并基于视频的预测类别与视频的实际类别调整Tensorflow模型中的参数的取值,直至基于Tensorflow模型得到的视频的预测类别与视频的实际类别一致,停止对Tensorflow模型的训练。
步骤S2320,根据各个分类的预测分数值确定视频的第二分类结果。
首先将各个分类的预测分数值进行排序,得到排序结果。然后根据排序结果选取出最高预测分数值,并将最高预测分数值对应的类别作为视频的第二分类结果。或者,根据排序结果选取出多个预测分数值,该多个预测分数值是按照由高到低的预测分数值排序选取出的排列靠前的预测分数值,将该多个预测分数值分别对应的类别作为视频的第二分类结果。
步骤S2400,基于视频的第一分类结果和视频的第二分类结果生成优化后的视频的分类结果信息。
在一个实施例中,将视频的第一分类结果与视频的第二分类结果进行合并,生成优化后的视频的分类结果信息。例如,视频的第一分类结果为历史,视频的第二分类结果为武侠,将该两个分类结果进行合并,得到历史和武侠两个分类结果。利用历史和武侠这两个分类结果生成优化后的视频的分类结果信息。
在另一个实施例中,将视频的第二分类结果替换视频的第一分类结果,得到优化后的视频的分类结果信息。例如,视频的第一分类结果为历史,视频的第二分类结果为武侠,将武侠替换掉历史,得到视频的分类结果为武侠,并基于该分类结果生成优化后的视频的分类结果信息。
在本发明的一个实施例中,当生成优化后的视频的分类结果信息时,利用视频的标识信息,查找并删除携带有视频的第一分类结果的视频分类结果信息,将优化后的视频的分类结果信息执行写入操作。
本发明实施例提供的视频分类方法,通过获取视频的分类结果信息,其中,所述分类结果信息包括视频的第一分类结果,获取所述视频,并基于所述视频确定视频画面特征信息,根据所述视频画面特征信息确定所述视频的第二分类结果,基于所述视频的第一分类结果和所述视频的第二分类结果生成优化后的视频的分类结果信息,对视频的第一分类结果进行补充和优化,提高了视频分类的精准性。
<例子>
图3根据本发明一个例子的视频分类方法的处理流程图。
根据图3所示,该视频分类方法可以包括以下步骤S301-S311。
对于新入库的待分类内容,首先,执行步骤S301,根据待分类内容的文字信息确定第一分类结果。
步骤S302,利用待分类内容的类型信息、待分类内容的标识信息和第一分类结果生成分类结果信息。
步骤S303,对分类结果信息执行存储操作。
在该例子中,将生成的分类结果信息以Kafka消息队列传输至服务器的存储模块。这种以Kafka消息队列进行数据传输的方式,便于数据的并行处理。
步骤S304,根据待分类内容的类型信息确定分类结果信息是否进行优化。
在待分类内容的类型信息为图文时,确定分类结果信息不再进行优化。在待分类内容的类型信息为视频时,确定分类结果信息需要进行优化,执行步骤S305,利用视频的存储地址信息和视频的标识信息生成数据包。
在该例子中,数据包以Kafka消息队列传输至服务器的计算模块。这种以Kafka消息队列进行数据传输的方式,便于数据的并行处理。
步骤S306,基于视频的存储地址信息,获得该视频。
步骤S307,从视频中截取预设帧数的视频画面图像,并将预设帧数的视频画面图像输入至Inception-V3模型,得到视频画面特征信息。
步骤S308,将视频画面特征信息输入至Tensorflow模型,得到各个分类的预测分数值。
步骤S309,根据各个分类的预测分数值确定视频的第二分类结果。
步骤S310,基于视频的第一分类结果和视频的第二分类结果生成优化后的视频的分类结果信息。
步骤S311,利用视频的标识信息,查找并删除存储的视频分类结果信息,将优化后的视频的分类结果信息执行写入操作。
<装置实施例>
图4为根据本发明实施例的视频分类装置的原理框图。
根据图4所示,本实施例的视频分类装置4000可以包括获取模块4100、视频画面特征信息确定模块4200、第二分类结果确定模块4300和生成模块4400。
获取模块4100用于获取视频的分类结果信息,其中,分类结果信息包括视频的第一分类结果,第一分类结果是基于视频的文字信息确定的。
视频画面特征信息确定模块4200用于获取视频,并基于视频确定视频画面特征信息。
第二分类结果确定模块4300用于根据视频画面特征信息确定视频的第二分类结果。
生成模块4400用于基于视频的第一分类结果和视频的第二分类结果生成优化后的视频的分类结果信息。
在一个实施例中,视频的文字信息包括视频的标题信息和/或视频内容介绍信息。视频分类装置4000还包括第一分类结果确定模块。
第一分类结果确定模块用于从视频的标题信息和/或视频内容介绍信息提取关键词;根据关键词确定视频的第一分类结果。生成模块4400用于基于视频的第一分类结果生成视频的分类结果信息。
在一个实施例中,视频分类装置4000还包括检测模块。
检测模块用于检测视频的第一分类结果是否为未分类。在检测模块的检测结果为检测视频的第一分类结果为未分类的情况下,获取模块4100才执行获取视频,并基于视频确定视频画面特征信息的操作。
在一个实施例中,分类结果信息还包括视频的存储地址信息。视频画面特征信息确定模块4200还用于基于视频的存储地址信息,获得视频。
在一个实施例中,视频画面特征信息确定模块4200还用于从视频中截取预设帧数的视频画面图像;根据预设帧数的视频画面图像确定视频画面特征信息。
在一个实施例中,第二分类结果确定模块4300还用于将视频画面特征信息输入至训练后的神经网络模型中,得到各个分类的预测分数值;根据各个分类的预测分数值确定视频的第二分类结果。
在一个实施例中,生成模块4400还用于将视频的第一分类结果与视频的第二分类结果进行合并,生成优化后的视频的分类结果信息;或者,将视频的第二分类结果替换视频的第一分类结果,得到优化后的视频的分类结果信息。
<电子设备实施例>
在本实施例中,还提供一种电子设备,电子设备可以是图1所示的服务器。
根据图5所示,电子设备5000可以包括根据本发明任意实施例的视频分类装置4000,用于实施本发明任意实施例的视频分类方法。
在另一个实施例中,电子设备5000还可以包括处理器5100和存储器5200,该存储器5200用于存储可执行的指令;该处理器5100用于根据指令的控制运行电子设备5000执行根据本发明任意实施例的视频分类方法。
<计算机可读存储介质>
在本实施例中,还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时实现如本发明任意实施例的视频分类方法。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims (10)

1.一种视频分类方法,包括:
获取视频的分类结果信息,其中,所述分类结果信息包括视频的第一分类结果,所述第一分类结果是基于所述视频的文字信息确定的;
获取所述视频,并基于所述视频确定视频画面特征信息;
根据所述视频画面特征信息确定所述视频的第二分类结果;
基于所述视频的第一分类结果和所述视频的第二分类结果生成优化后的视频的分类结果信息。
2.根据权利要求1所述的方法,其中,所述视频的文字信息包括视频的标题信息和/或视频内容介绍信息;
在所述获取视频的分类结果信息之前,所述方法还包括:
从所述视频的标题信息和/或视频内容介绍信息提取关键词;
根据所述关键词确定所述视频的第一分类结果;
基于所述视频的第一分类结果生成所述视频的分类结果信息。
3.根据权利要求1所述的方法,其中,在获取所述视频,并基于所述视频确定视频画面特征信息之前,所述方法还包括:
检测所述视频的第一分类结果是否为未分类;
在所述检测所述视频的第一分类结果为未分类的情况下,才执行所述获取所述视频,并基于所述视频确定视频画面特征信息的操作。
4.根据权利要求1所述的方法,其中,所述分类结果信息还包括视频的存储地址信息,其中,所述获取所述视频包括:
基于所述视频的存储地址信息,获得所述视频。
5.根据权利要求1所述的方法,其中,所述基于所述视频确定视频画面特征信息包括:
从所述视频中截取预设帧数的视频画面图像;
根据所述预设帧数的视频画面图像确定所述视频画面特征信息。
6.根据权利要求1所述的方法,其中,所述根据所述视频画面特征信息确定所述视频的第二分类结果包括:
将所述视频画面特征信息输入至训练后的神经网络模型中,得到各个分类的预测分数值;
根据所述各个分类的预测分数值确定所述视频的第二分类结果。
7.根据权利要求1所述的方法,其中,所述基于所述视频的第一分类结果和所述视频的第二分类结果得到优化后的视频的分类结果信息包括:
将所述视频的第一分类结果与所述视频的第二分类结果进行合并,生成优化后的视频的分类结果信息;或者,
将所述视频的第二分类结果替换所述视频的第一分类结果,得到优化后的视频的分类结果信息。
8.一种视频分类装置,包括:
获取模块,用于获取视频的分类结果信息,其中,所述分类结果信息包括视频的第一分类结果,所述第一分类结果是基于所述视频的文字信息确定的;
视频画面特征信息确定模块,用于获取所述视频,并基于所述视频确定视频画面特征信息;
第二分类结果确定模块,用于根据所述视频画面特征信息确定所述视频的第二分类结果;
生成模块,用于基于所述视频的第一分类结果和所述视频的第二分类结果生成优化后的视频的分类结果信息。
9.一种电子设备,包括处理器和存储器,所述存储器用于存储可执行的指令,所述处理器用于根据指令的控制运行电子设备执行根据权利要求1-7中任意一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任意一项所述的方法。
CN201910379507.5A 2019-05-08 2019-05-08 视频分类方法、装置、电子设备以及计算机可读存储介质 Pending CN111914120A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910379507.5A CN111914120A (zh) 2019-05-08 2019-05-08 视频分类方法、装置、电子设备以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910379507.5A CN111914120A (zh) 2019-05-08 2019-05-08 视频分类方法、装置、电子设备以及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111914120A true CN111914120A (zh) 2020-11-10

Family

ID=73241992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910379507.5A Pending CN111914120A (zh) 2019-05-08 2019-05-08 视频分类方法、装置、电子设备以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111914120A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418215A (zh) * 2020-11-17 2021-02-26 峰米(北京)科技有限公司 一种视频分类识别方法、装置、存储介质和设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056137A (zh) * 2016-05-25 2016-10-26 南京大学 一种基于数据挖掘多分类算法的电信集团业务推荐方法
CN107194419A (zh) * 2017-05-10 2017-09-22 百度在线网络技术(北京)有限公司 视频分类方法及装置、计算机设备与可读介质
CN108205685A (zh) * 2017-11-22 2018-06-26 深圳市商汤科技有限公司 视频分类方法、视频分类装置及电子设备
CN109271521A (zh) * 2018-11-16 2019-01-25 北京九狐时代智能科技有限公司 一种文本分类方法及装置
CN109359636A (zh) * 2018-12-14 2019-02-19 腾讯科技(深圳)有限公司 视频分类方法、装置及服务器
CN109614517A (zh) * 2018-12-04 2019-04-12 广州市百果园信息技术有限公司 视频的分类方法、装置、设备及存储介质
CN109710800A (zh) * 2018-11-08 2019-05-03 北京奇艺世纪科技有限公司 模型生成方法、视频分类方法、装置、终端及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056137A (zh) * 2016-05-25 2016-10-26 南京大学 一种基于数据挖掘多分类算法的电信集团业务推荐方法
CN107194419A (zh) * 2017-05-10 2017-09-22 百度在线网络技术(北京)有限公司 视频分类方法及装置、计算机设备与可读介质
CN108205685A (zh) * 2017-11-22 2018-06-26 深圳市商汤科技有限公司 视频分类方法、视频分类装置及电子设备
CN109710800A (zh) * 2018-11-08 2019-05-03 北京奇艺世纪科技有限公司 模型生成方法、视频分类方法、装置、终端及存储介质
CN109271521A (zh) * 2018-11-16 2019-01-25 北京九狐时代智能科技有限公司 一种文本分类方法及装置
CN109614517A (zh) * 2018-12-04 2019-04-12 广州市百果园信息技术有限公司 视频的分类方法、装置、设备及存储介质
CN109359636A (zh) * 2018-12-14 2019-02-19 腾讯科技(深圳)有限公司 视频分类方法、装置及服务器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418215A (zh) * 2020-11-17 2021-02-26 峰米(北京)科技有限公司 一种视频分类识别方法、装置、存储介质和设备

Similar Documents

Publication Publication Date Title
CN104298429B (zh) 一种基于输入的信息展示方法和输入法系统
CN108182211B (zh) 视频舆情获取方法、装置、计算机设备及存储介质
CN106874314B (zh) 信息推荐的方法和装置
KR102002024B1 (ko) 객체 라벨링 처리 방법 및 객체 관리 서버
US20170177623A1 (en) Method and apparatus for using business-aware latent topics for image captioning in social media
CN109325223B (zh) 文章推荐方法、装置及电子设备
US20210390317A1 (en) Method and system for editing video on basis of context obtained using artificial intelligence
CN111753079B (zh) 文本分类方法、装置、电子设备以及计算机可读存储介质
US20210295109A1 (en) Method and device for generating painting display sequence, and computer storage medium
CN111222030A (zh) 信息推荐方法、装置及电子设备
US20180204083A1 (en) Cognitive object and object use recognition using digital images
CN112235613B (zh) 视频处理方法、装置、电子设备及存储介质
CN111177462A (zh) 视频分发时效的确定方法和装置
CN113552984A (zh) 文本提取方法、装置、设备及介质
CN111783515A (zh) 行为动作识别的方法和装置
CN111160410A (zh) 一种物体检测方法和装置
CN113869063A (zh) 数据推荐方法、装置、电子设备及存储介质
CN111385659A (zh) 一种视频推荐方法、装置、设备及存储介质
CN111914120A (zh) 视频分类方法、装置、电子设备以及计算机可读存储介质
CN112446214A (zh) 广告关键词的生成方法、装置、设备及存储介质
CN110910168A (zh) 一种文旅行业获客方法及设备
CN114302231B (zh) 视频处理方法及装置、电子设备和存储介质
CN112241752A (zh) 模型训练方法、数据处理方法、分类方法、装置、设备
US11574467B2 (en) Document augmented auto complete
CN111143740B (zh) 信息处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination