CN112749299A - 确定视频类型的方法、装置、电子设备及可读存储介质 - Google Patents

确定视频类型的方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN112749299A
CN112749299A CN201911054391.4A CN201911054391A CN112749299A CN 112749299 A CN112749299 A CN 112749299A CN 201911054391 A CN201911054391 A CN 201911054391A CN 112749299 A CN112749299 A CN 112749299A
Authority
CN
China
Prior art keywords
video
type
classified
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911054391.4A
Other languages
English (en)
Inventor
李学海
冯鸳鹤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201911054391.4A priority Critical patent/CN112749299A/zh
Publication of CN112749299A publication Critical patent/CN112749299A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明实施例提出的一种确定视频类型的方法、装置、电子设备及可读存储介质,获取与待分类视频对应的文本信息,对文本信息进行分词得到多个词语,确定每个词语在待分类视频中的播放时间,将得到的词语输入预设的文本分类模型,得到每个词语对应的类型,确定播放时间在目标时间段的目标词语,根据目标词语确定待分类视频在目标时间段的类型。本方案通过文本分类模型对待分类视频的词语进行分类,然后再根据词语的类型确定待分类视频在目标时间段的类型,通过本方案确定视频类型时,不再需要人工进行分类,节省时间和人力,而且本方案还可以根据词语对应的播放时间和类型对视频进行更加精细的分段分类。

Description

确定视频类型的方法、装置、电子设备及可读存储介质
技术领域
本发明实施例涉及数据处理技术领域,具体涉及一种确定视频类型的方法、装置、电子设备及可读存储介质。
背景技术
目前各大电影网站对于影视作品进行分类的时候,通常是通过人工观看电影后再做手动分类,当前这种进行影视作品分类的方法,效率较低。
上述对问题的发现过程的描述,仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明实施例提供了一种确定视频类型的方法、装置、电子设备及可读存储介质。
有鉴于此,第一方面,本发明实施例提供一种确定视频类型的方法,包括:
获取与待分类视频对应的文本信息;
对文本信息中的文本进行分词处理,得到多个词语;
确定每个词语在待分类视频中对应的播放时间;
将每个词语分别输入预设的文本分类模型,得到每个词语分别对应的类型;
确定播放时间在目标时间段内的词语,作为目标词语;
根据目标词语对应的类型,确定待分类视频在目标时间段的类型。
在一种可能的实现方式中,获取与待分类视频对应的文本信息,包括:
获取与待分类视频对应的字幕信息,得到相对应的文本信息;
提取待分类视频中的音频数据,从音频数据中提取文本信息。
在一种可能的实现方式中,提取待分类视频中的音频数据,从音频数据中提取文本信息,包括:
将待分类视频转换为音频数据;
对音频数据进行语音识别,得到与音频数据对应的文本信息。
在一种可能的实现方式中,将每个词语分别输入预设的文本分类模型之前,方法还包括:
获取语料信息,语料信息包括词语和类型;
利用语料信息对预设的神经网络模型进行训练,得到以词语为输入,类型为输出的文本分类模型。
在一种可能的实现方式中,根据目标词语对应的类型,确定待分类视频在目标时间段的类型,包括:
若目标词语的个数为一个,则确定目标词语对应的类型为待分类视频在目标时间段的类型;
若目标词语的个数为多个,则确定对应的目标词语个数最多的类型为待分类视频在目标时间段的类型。
在一种可能的实现方式中,方法还包括:
判断待分类视频在目标时间段的类型是否为目标类型;
若待分类视频在目标时间段的类型为目标类型,则将待分类视频存储至预设的与目标类型对应的视频库。
第二方面,本发明实施例还提供了一种确定视频类型的装置,包括:
获取模块,用于获取与待分类视频对应的文本信息;
分词模块,用于对文本信息中的文本进行分词处理,得到多个词语;
播放时间确定模块,用于确定每个词语在待分类视频中对应的播放时间;
第一类型确定模块,用于将每个词语分别输入预设的文本分类模型,得到每个词语分别对应的类型;
目标词语确定模块,用于确定播放时间在目标时间段内的词语,作为目标词语;
第二类型确定模块,用于根据目标词语对应的类型,确定待分类视频在目标时间段的类型。
在一种可能的实现方式中,第二类型确定模块根据目标词语对应的类型,确定待分类视频在目标时间段的类型,包括:
若目标词语的个数为一个,则确定目标词语对应的类型为待分类视频在目标时间段的类型,若目标词语的个数为多个,则确定对应的目标词语个数最多的类型为待分类视频在目标时间段的类型。
第三方面,本发明实施例还提供了一种电子设备,包括:
至少一个处理器、以及与处理器连接的至少一个存储器、总线,其中,处理器、存储器通过总线完成相互间的通信,处理器用于调用存储器中的程序指令,以执行第一方面确定视频类型的方法的步骤。
第四方面,本发明实施例还提供了一种可读存储介质,可读存储介质存储计算机指令,计算机指令使计算机执行第一方面确定视频类型的方法的步骤。
相比现有技术,本发明实施例提出的一种确定视频类型的方法,获取与待分类视频对应的文本信息,对文本信息进行分词处理,得到多个词语,确定每个词语在待分类视频中对应的播放时间,将得到的词语输入预设的文本分类模型,得到每个词语对应的类型,确定播放时间在目标时间段的目标词语,根据目标词语确定待分类视频在目标时间段的类型。本方案通过文本分类模型对待分类视频的词语进行分类,然后再根据词语的类型确定待分类视频在目标时间段的类型,通过本方案确定视频类型时,不再需要人工进行分类,节省时间和人力,而且本方案还可以根据播放时间对视频进行更加精细的分段分类。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种确定视频类型的方法的流程图;
图2为本发明实施例提供的一种获取与待分类视频对应的文本信息的方法流程图;
图3为本发明实施例提供的一种文本分类模型构建方法的流程图;
图4为本发明实施例提供的一种确定视频类型的装置的框图;
图5为本发明实施例提供的一种电子设备的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供一种确定视频类型的方法的流程图,如图1所示,该方法包括如下步骤:
S11.获取与待分类视频对应的文本信息。
其中,待分类视频为要进行分类的视频,例如要对第一视频进行分类,则第一视频就是待分类视频。
因为视频的剧情与视频中的文字解说和人物对话等文字信息是密不可分的,通常根据视频的文字信息就可以了解视频的剧情,本实施例的目的是根据视频的剧情对视频进行分类,所以在进行分类是要先获取视频中的文字信息(文字解说和人物对话等)。
在一种可能的实现方式中,可以通过下述方式获取与待分类视频对应的文本信息:
获取与待分类视频对应的字幕信息,得到相对应的文本信息。
通常的视频都会有对应的字幕文件,字幕文件中包含的信息即为字幕信息,而字幕信息中又通常包含了视频中的所有文字信息,具体的可以通过在服务器中搜索的方式获取与待分类视频对应的字幕文件,然后提取字幕文件中的文本信息。
在一种可能的实现方式中,有的视频文件可能没有字幕文件,针对没有字幕文件的待分类视频,可以通过下述方式获取与待分类该视频对应的文本信息:提取待分类视频中的音频数据,从音频数据中提取文本信息。
在一种可能的实现方式中,如图2所示,提取待分类视频中的音频数据,从音频数据中提取文本信息,可以包括下述步骤:
S111.将待分类视频转换为音频数据。
在实施时,可以采用现有的音视频转换软件(例如FFmpeg,FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序)将待分类视频转换为音频数据。
S112.对音频数据进行语音识别,得到与音频数据对应的文本信息。
在实施时,可以采用现有的语音识别软件(例如百度语音识别软件或者阿里语音识别软件等)将音频数据转换成文本文件。
但是现有的大部分语音识别软件通常只能对短音频进行识别,所以在进行语音识别之前可以先对音频数据进行拆分,将音频数据拆分为多个短音频数据(例如将与整个待分类视频对应的一个音频数据拆分为多个时长为60秒的短音频数据),然后再利用语音识别软件对短音频数据进行语音识别,得到分别与各个短音频数据对应的文本信息,所有短音频数据分别对应的文本信息组成的就是待分类视频的音频数据对应的文本信息。
而由于音频数据是由待分类视频转换得到的,所以与该音频数据对应的文本信息就是与待分类视频对应的文本信息。
S12.对文本信息中的文本进行分词处理,得到多个词语。
本实施例的目的是通过对每个词语进行分类,使得分类结果更加精确,而通常文本信息中的文本通常是由多个词语组成的,所以若想对词语进行分类,则需要先对文本信息中的文本进行分词处理,将文本信息中的文本拆分成多个词语。
在一种可能的实现方式中,可以采用现有的分词算法(例如基于字符串匹配的分词方法、基于理解的分词方法或基于统计的分词方法等)对文本信息中的文本进行分词处理。
S13.确定每个词语在待分类视频中对应的播放时间。
在一种可能的实现方式中,如果文本信息是由于待分类视频对应的字幕信息中得到的,因为在字幕信息中每个词语都有各自对应的时间戳,所以各个词语在字幕信息中对应的时间戳就各个词语对应的播放时间。
在一种可能的实现方式中,如果文本信息是由待分类视频通过音视频转换及语音识别得到的,则在将待分类视频转换成音频数据时,记录音频数据对应的播放时间,在对音频数据进行语音识别转换成文本信息时,将与文本信息中各词语分别对应的音频数据的播放时间作为各词语分别对应的播放时间。
S14.将每个词语分别输入预设的文本分类模型,得到每个词语分别对应的类型。
在一个实施例中,在执行S14之前,需要先构建文本分类模型。
在一种可能的实现方式中,如图3所示,可以通过下述方式构建文本分类模型:
S141.获取语料信息,语料信息包括词语和类型。
在一种可能的实现方式中,语料信息中的词语可以从现有的语料库中获取,而类型的数量和名称则可以根据需求自行设置,例如将类型设置为血腥、暴力、温馨、搞笑等等。
S142.利用语料信息对预设的神经网络模型进行训练,得到以词语为输入,类型为输出的文本分类模型。
神经网络模型的训练为现有成熟技术此处不再赘述,通过训练得到以词语为输入,类型为输出的文本分类模型,利用此模型进行分类时,只需输入需要分类的词语就可以得到该词语对应的类型,方便,准确。
在一种可能的实现方式中,为了方便后续查找各词语对应的类型,可以建立一个对应表,对应表中记录与各个词语与类型的对应关系,后续可以根据已知词语,通过查表的方式确定与词语对应的类型,反之也可以根据已知类型确定与该类型对应的所有词语。
S15.确定播放时间在目标时间段内的词语,作为目标词语。
在执行S15之前先获取目标时间段,其中目标时间段可以通过下述任一种方式获取:
第一种方式:
获取用户输入的目标时间段,通过此种方式通常用于查询,用户可以输入任意时间段作为目标时间段,进而用户可以知道待分类视频中任一时间段对应的类型。
例如:用户通过预设的窗口输入“0-60分钟”,则目标时间就是“0-60分钟”,其中的时间为待分类视频中播放时间。
第二种方式:
获取预设设置的目标时间段,此种方式通常用于自动分类,预先设置至少一个目标时间段,在需要分类时,直接获取预设目标时间段即可,从而自动确定目标时间段对应的类型,通过此种方式可以同时确定多个时间段对应的类型,例如:可以将播放时间为“0-60分钟”和“100-120分钟”的两个时间段均设置为目标时间段。
由于一个目标时间段中可能包含有多个词语,而这些词语对应的类型可能不同,所以在确定待分类视频在目标时间段对应的类型时,先确定播放时间在目标时间段的目标词语。
S16.根据目标词语对应的类型,确定待分类视频在目标时间段的类型。
因为在S14中已经确定了每个词语对应的类型,所以根据S14确定出的词语与类型的对应关系就可以确定出与每个目标词语分别对应的类型,然后再根据所有目标词语对应的类型来确定待分类视频在目标时间段的类型。
在一个可能的实现方式中,根据所有目标词语分别对应的类型可以通过下述方式确定待分类视频在目标时间段的类型:
如果待分类视频在目标时间段内只要一个目标词语,则这个目标词语对应的类型就是目标时间段对应的类型。
如果待分类视频在目标时间段内有多个目标词语,且多个目标词语对应有多个类型,则此时就选出现次数最多的类型为目标时间段的类型,例如共有5个目标词语,其中4个目标词语对应的类型为搞笑,1个目标词语对应的类型为血腥,则确定目标时间段对应的类型为搞笑。如果目标词语对应的多个类型中,每个类型出现的次数一样,则可以选取任意一个类型作为目标时间段的类型,例如共有6个目标词语,其中3个目标词语对应的类型为搞笑,例外3个目标词语对应的类型为血腥,则该目标时间段对应的类型既可以为搞笑也可以为血腥。
本实施例提供的确定视频类型的方法,可以确定待分类视频中某一播放时间段的类型,与现有的一个视频对应一个类型相比,本方案确定的类型更加精确,例如某一视频在“0-60分钟”是搞笑的剧情,在“100-120分钟”是血腥的剧情,按照现有的分类方法则就可能将该视频的类型设置为“搞笑”,在用户为了调节心情想看搞笑的情况下观看此视频,就可能会因为“100-120分钟”的血腥剧情导致用户的心情更加郁闷,从而使用户体验不好,但是通过本方案来设置上述视频的类型时就可以设置为“0-60分钟搞笑,100-120分钟血腥”,这样用户预先知道了“100-120分钟血腥”,在观看时可以通过快进或关闭等操作来避免观看这一时间段的血腥剧情,从而提升了用户体验。
在本实施例中,不同的播放时间对可能包含不同的词语,而不同的词语可能对应不同的类型,所以本方案可以根据词语建立待分类视频的播放时间与类型的对应关系,例如“拥抱”对应的类型为“温馨”,而拥抱在待分类视频的20分15秒处和30分21秒处,均出现过,则与待分类视频的20分15秒和30分21秒对应的类型均为“温馨”。
本发明实施例提出的一种视频分类确定视频类型的方法,获取与待分类视频对应的文本文件信息,对文本文件信息进行分词处理,得到多个词语,确定每个词语在待分类视频中对应的播放时间,将得到的词语输入预设的文本分类模型,得到每个词语对应的类型,确定播放时间在目标时间段的目标词语,根据目标词语确定待分类视频在目标时间段的类型针对每个词语,将与该词语对应的类型,作为待分类视频中与该词语对应的播放时间所对应的类型。本方案通过文本分类模型对待分类视频的词语进行分类,然后再根据词语的类型确定待分类视频在目标时间段的类型,通过本方案确定视频类型时,不再需要人工进行分类,节省时间和人力,而且本方案得到的是与播放时间对应的类型,所以后续在应用时可以根据还可以根据播放时间和类型对视频进行更加精细的分段分类。
在一个可能的实施例中,确定视频类型的方法还可以包括:
判断待分类视频在目标时间段的类型是否为目标类型,若待分类视频在目标时间段的类型为目标类型,则将待分类视频存储至预设的与目标类型对应的视频库。
通过上述步骤,在对多个视频进行处理时,可以完成对多个视频的自动分类,通过上述步骤可以将同一播放时间段(目标时间段)对应的类型一致的视频放入同一视频库中,例如设置目标时间段为“0-60分钟”,目标类型为“温馨”,通过上述步骤判断出视频1和视频2在“0-60分钟”的类型均为“温馨”,则可以将视频1和视频2归为同一类,均都放入预设的标签为“0-60分钟温馨”的视频库。
基于与上述方法相同的发明构思,本发明实施例还提供了一种确定视频类型的装置,如图4所示,该装置40可以包括:
获取模块401,用于获取与待分类视频对应的文本文件。
分词模块402,用于对文本文件进行分词处理,得到多个词语。
播放时间确定模块403,用于确定每个词语在待分类视频中对应的播放时间。
第一类型确定模块404,用于将每个词语分别输入预设的文本分类模型,得到每个词语分别对应的类型。
目标词语确定模块405,用于确定播放时间在目标时间段内的词语,作为目标词语;
第二类型确定模块406,用于根据目标词语对应的类型,确定待分类视频在目标时间段的类型。
在一种可能的实现方式中,获取模块401获取与待分类视频对应的文本信息,包括:
获取与待分类视频对应的字幕信息,得到相对应的文本信息;
提取待分类视频中的音频数据,从音频数据中提取文本信息。
在一种可能的实现方式中,提取待分类视频中的音频数据,从音频数据中提取文本信息,包括:
将待分类视频转换为音频数据;
对音频数据进行语音识别,得到与音频数据对应的文本信息。
在一种可能的实现方式中,将每个词语分别输入预设的文本分类模型之前,装置还包括:
模型构建模块:用于获取语料信息,语料信息包括词语和类型,利用语料信息对预设的神经网络模型进行训练,得到以词语为输入,类型为输出的文本分类模型。
在一种可能的实现方式中,第二类型确定模块406根据目标词语对应的类型,确定待分类视频在目标时间段的类型,包括:
若目标词语的个数为一个,则确定目标词语对应的类型为待分类视频在目标时间段的类型;
若目标词语的个数为多个,则确定对应的目标词语个数最多的类型为待分类视频在目标时间段的类型。
在一种可能的实现方式中,该装置还包括:
存储模块,用于判断待分类视频在目标时间段的类型是否为目标类型,若待分类视频在目标时间段的类型为目标类型,则将待分类视频存储至预设的与目标类型对应的视频库。
确定视频类型的装置包括处理器和存储器,上述获取模块401、分词模块402、播放时间确定模块403、第一类型确定模块404、目标词语确定模块405、第二类型确定模块406、模型构建模块及存储模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来确定待分类视频在目标时间段的类型。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现确定视频类型的方法。
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行确定视频类型的方法。
本发明实施例提供了一种电子设备,如图5所示,该电子设备50包括至少一个处理器501、以及与处理器501连接的至少一个存储器502、总线503;其中,处理器501、存储器502通过总线503完成相互间的通信;处理器501用于调用存储器502中的程序指令,以执行上述的确定视频类型的方法。本文中的电子设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取与待分类视频对应的文本信息,对文本信息中的文本进行分词处理,得到多个词语,确定每个词语在待分类视频中对应的播放时间,将每个词语分别输入预设的文本分类模型,得到每个词语分别对应的类型,确定播放时间在目标时间段内的词语,作为目标词语,根据目标词语对应的类型,确定待分类视频在目标时间段的类型。
在一种可能的实现方式中,获取与待分类视频对应的文本信息,包括:获取与待分类视频对应的字幕信息,得到相对应的文本信息,或提取待分类视频中的音频数据,从音频数据中提取文本信息。
在一种可能的实现方式中,提取待分类视频中的音频数据,从音频数据中提取文本信息,包括:将待分类视频转换为音频数据,对音频数据进行语音识别,得到与音频数据对应的文本信息。
在一种可能的实现方式中,将每个词语分别输入预设的文本分类模型之前,方法还包括:获取语料信息,语料信息包括词语和类型,利用语料信息对预设的神经网络模型进行训练,得到以词语为输入,类型为输出的文本分类模型。
在一种可能的实现方式中,根据目标词语对应的类型,确定待分类视频在目标时间段的类型,包括:若目标词语的个数为一个,则确定目标词语对应的类型为待分类视频在目标时间段的类型,若目标词语的个数为多个,则确定对应的目标词语个数最多的类型为待分类视频在目标时间段的类型。
在一种可能的实现方式中,方法还包括:判断待分类视频在目标时间段的类型是否为目标类型,若待分类视频在目标时间段的类型为目标类型,则将待分类视频存储至预设的与目标类型对应的视频库。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种确定视频类型的方法,其特征在于,包括:
获取与待分类视频对应的文本信息;
对所述文本信息中的文本进行分词处理,得到多个词语;
确定每个所述词语在所述待分类视频中对应的播放时间;
将每个所述词语分别输入预设的文本分类模型,得到每个所述词语分别对应的类型;
确定播放时间在目标时间段内的词语,作为目标词语;
根据所述目标词语对应的类型,确定所述待分类视频在所述目标时间段的类型。
2.根据权利要求1所述的方法,其特征在于,获取与待分类视频对应的文本信息,包括:
获取与所述待分类视频对应的字幕信息,得到相对应的文本信息;
提取所述待分类视频中的音频数据,从所述音频数据中提取文本信息。
3.根据权利要求2所述的方法,其特征在于,提取所述待分类视频中的音频数据,从所述音频数据中提取文本信息,包括:
将所述待分类视频转换为音频数据;
对所述音频数据进行语音识别,得到与所述音频数据对应的文本信息。
4.根据权利要求1所述的方法,其特征在于,将每个所述词语分别输入预设的文本分类模型之前,所述方法还包括:
获取语料信息,所述语料信息包括词语和类型;
利用所述语料信息对预设的神经网络模型进行训练,得到以词语为输入,类型为输出的文本分类模型。
5.根据权利要求1所述的方法,其特征在于,根据所述目标词语对应的类型,确定所述待分类视频在所述目标时间段的类型,包括:
若所述目标词语的个数为一个,则确定所述目标词语对应的类型为所述待分类视频在所述目标时间段的类型;
若所述目标词语的个数为多个,则确定对应的目标词语个数最多的类型为所述待分类视频在所述目标时间段的类型。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断所述待分类视频在所述目标时间段的类型是否为目标类型;
若所述待分类视频在所述目标时间段的类型为所述目标类型,则将所述待分类视频存储至预设的与所述目标类型对应的视频库。
7.一种确定视频类型的装置,其特征在于,包括:
获取模块,用于获取与待分类视频对应的文本信息;
分词模块,用于对所述文本信息中的文本进行分词处理,得到多个词语;
播放时间确定模块,用于确定每个所述词语在所述待分类视频中对应的播放时间;
第一类型确定模块,用于将每个所述词语分别输入预设的文本分类模型,得到每个所述词语分别对应的类型;
目标词语确定模块,用于确定播放时间在目标时间段内的词语,作为目标词语;
第二类型确定模块,用于根据所述目标词语对应的类型,确定所述待分类视频在所述目标时间段的类型。
8.根据权利要求7所述的装置,其特征在于,所述第二类型确定模块根据所述目标词语对应的类型,确定所述待分类视频在所述目标时间段的类型,包括:
若所述目标词语的个数为一个,则确定所述目标词语对应的类型为所述待分类视频在所述目标时间段的类型,若所述目标词语的个数为多个,则确定对应的目标词语个数最多的类型为所述待分类视频在所述目标时间段的类型。
9.一种电子设备,其特征在于,包括:至少一个处理器、以及与处理器连接的至少一个存储器、总线,其中,处理器、存储器通过总线完成相互间的通信,处理器用于调用存储器中的程序指令,以执行权利要求1-6任一所述确定视频类型的方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质存储计算机指令,所述计算机指令使计算机执行权利要求1-6任一所述确定视频类型的方法的步骤。
CN201911054391.4A 2019-10-31 2019-10-31 确定视频类型的方法、装置、电子设备及可读存储介质 Pending CN112749299A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911054391.4A CN112749299A (zh) 2019-10-31 2019-10-31 确定视频类型的方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911054391.4A CN112749299A (zh) 2019-10-31 2019-10-31 确定视频类型的方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112749299A true CN112749299A (zh) 2021-05-04

Family

ID=75644818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911054391.4A Pending CN112749299A (zh) 2019-10-31 2019-10-31 确定视频类型的方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112749299A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407765A (zh) * 2021-07-15 2021-09-17 北京达佳互联信息技术有限公司 视频分类方法、装置、电子设备和计算机可读存储介质
CN113420723A (zh) * 2021-07-21 2021-09-21 北京有竹居网络技术有限公司 获取视频热点的方法、装置、可读介质和电子设备
CN113453065A (zh) * 2021-07-01 2021-09-28 深圳市中科网威科技有限公司 一种基于深度学习的视频分段方法、系统、终端及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005610A (zh) * 2015-07-08 2015-10-28 无锡天脉聚源传媒科技有限公司 一种专辑分类方法和装置
WO2017166512A1 (zh) * 2016-03-31 2017-10-05 乐视控股(北京)有限公司 视频分类模型的训练方法和视频分类方法
CN107343223A (zh) * 2017-07-07 2017-11-10 北京慕华信息科技有限公司 视频片段的识别方法和装置
CN109922373A (zh) * 2019-03-14 2019-06-21 上海极链网络科技有限公司 视频处理方法、装置及存储介质
CN110008378A (zh) * 2019-01-28 2019-07-12 平安科技(深圳)有限公司 基于人工智能的语料收集方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005610A (zh) * 2015-07-08 2015-10-28 无锡天脉聚源传媒科技有限公司 一种专辑分类方法和装置
WO2017166512A1 (zh) * 2016-03-31 2017-10-05 乐视控股(北京)有限公司 视频分类模型的训练方法和视频分类方法
CN107343223A (zh) * 2017-07-07 2017-11-10 北京慕华信息科技有限公司 视频片段的识别方法和装置
CN110008378A (zh) * 2019-01-28 2019-07-12 平安科技(深圳)有限公司 基于人工智能的语料收集方法、装置、设备及存储介质
CN109922373A (zh) * 2019-03-14 2019-06-21 上海极链网络科技有限公司 视频处理方法、装置及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113453065A (zh) * 2021-07-01 2021-09-28 深圳市中科网威科技有限公司 一种基于深度学习的视频分段方法、系统、终端及介质
CN113407765A (zh) * 2021-07-15 2021-09-17 北京达佳互联信息技术有限公司 视频分类方法、装置、电子设备和计算机可读存储介质
CN113407765B (zh) * 2021-07-15 2023-12-05 北京达佳互联信息技术有限公司 视频分类方法、装置、电子设备和计算机可读存储介质
CN113420723A (zh) * 2021-07-21 2021-09-21 北京有竹居网络技术有限公司 获取视频热点的方法、装置、可读介质和电子设备

Similar Documents

Publication Publication Date Title
CN112749299A (zh) 确定视频类型的方法、装置、电子设备及可读存储介质
CN111274442B (zh) 确定视频标签的方法、服务器及存储介质
CN109754783B (zh) 用于确定音频语句的边界的方法和装置
CN111477250A (zh) 音频场景识别方法、音频场景识别模型的训练方法和装置
CN107609149B (zh) 一种视频定位方法和装置
US11531839B2 (en) Label assigning device, label assigning method, and computer program product
CN110046278B (zh) 视频分类方法、装置、终端设备及存储介质
CN112511818B (zh) 视频播放质量检测方法、装置
CN110473519B (zh) 一种语音处理方法及装置
CN111741331B (zh) 一种视频片段处理方法、装置、存储介质及设备
CN111382241A (zh) 会话场景切换方法及装置
CN113992970A (zh) 视频数据处理方法、装置、电子设备及计算机存储介质
CN107369450B (zh) 收录方法和收录装置
CN114022955A (zh) 一种动作识别方法及装置
US20140307968A1 (en) Method and apparatus for automatic genre identification and classification
US11010562B2 (en) Visual storyline generation from text story
CN111461901B (zh) 车辆保险理赔信息的输出方法和装置
CN113506565B (zh) 语音识别的方法、装置、计算机可读存储介质与处理器
CN115171735A (zh) 一种语音活动检测方法、存储介质及电子设备
CN109558402B (zh) 数据的存储方法及装置
CN113421552A (zh) 音频识别方法和装置
CN109286510B (zh) 日志数据的收集方法和装置
CN112397073A (zh) 一种音频数据处理方法及装置
CN112116367A (zh) 用于推荐广告的方法和装置、机器可读存储介质及处理器
US20240212706A1 (en) Audio data processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination