CN110110143A - 一种视频分类方法及装置 - Google Patents

一种视频分类方法及装置 Download PDF

Info

Publication number
CN110110143A
CN110110143A CN201910297460.8A CN201910297460A CN110110143A CN 110110143 A CN110110143 A CN 110110143A CN 201910297460 A CN201910297460 A CN 201910297460A CN 110110143 A CN110110143 A CN 110110143A
Authority
CN
China
Prior art keywords
video
sorted
feature vector
vector
term vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910297460.8A
Other languages
English (en)
Other versions
CN110110143B (zh
Inventor
陈迅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Wangsu Co Ltd
Original Assignee
Xiamen Wangsu Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Wangsu Co Ltd filed Critical Xiamen Wangsu Co Ltd
Priority to CN201910297460.8A priority Critical patent/CN110110143B/zh
Publication of CN110110143A publication Critical patent/CN110110143A/zh
Application granted granted Critical
Publication of CN110110143B publication Critical patent/CN110110143B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种视频分类方法及装置,涉及视频处理技术领域,方法包括:获取待分类视频的文本信息;待分类视频的文本信息用于对待分类视频进行描述;根据待分类视频的文本信息确定待分类视频的视频特征向量;待分类视频的视频特征向量是通过对语料库中语料对应的词向量进行聚类后得到的;根据待分类视频的视频特征向量以及分类模型,确定待分类视频的分类结果;分类模型是通过历史视频的文本信息对应的视频特征向量确定的。本发明实施例中确定视频分类的方法,能够避免对原始视频进行视频解码,帧提取,帧特征抽取等步骤的计算和处理开销,能更迅速地得到目标视频的分类结果,提高分类效率。

Description

一种视频分类方法及装置
技术领域
本发明涉及视频处理技术领域,尤其涉及一种视频分类方法及装置。
背景技术
视频服务提供商在向用户提供视频服务时,常常需要先根据视频内容对视频进行分类。一方面,视频服务提供商能够在网页上或者移动终端应用上分门别类地展示视频,能够帮助用户更快速地找到感兴趣的视频。另一方面,通过事先确定视频类别,也能够为视频的搜索和推荐提供了方便。
现有技术中针对视频分类从人工分类发展为机器分类,在机器分类中,一种常用的方法是使用预训练的图像分类卷积神经网络(CNN)对视频中的待分类视频进行分类。但是,使用CNN对待分类视频进行分类时由于涉及到视频解码,帧提取,帧特征抽取等步骤,导致现有技术中的分类方法计算量大,实时性差。
发明内容
本发明提供一种视频分类方法及装置,用于解决现有技术中的分类方法计算量大,实时性差的问题。
本发明实施例提供一种视频分类方法,所述方法包括:
获取待分类视频的文本信息;所述待分类视频的文本信息用于对所述待分类视频进行描述;
根据所述待分类视频的文本信息确定所述待分类视频的视频特征向量;所述待分类视频的视频特征向量是通过对语料库中语料对应的词向量进行聚类后得到的;根据所述待分类视频的视频特征向量以及分类模型,确定所述待分类视频的分类结果;所述分类模型是通过所述历史视频的文本信息对应的视频特征向量确定的。
本发明实施例中,根据待分类视频的文本信息以及历史视频的文本信息确定视频特征向量来确定待分类视频的分类结果,能够避免对原始视频进行视频解码,帧提取,帧特征抽取等步骤的计算和处理开销,能更迅速地得到目标视频的分类结果,提高分类效率。
进一步地,所述根据所述待分类视频的文本信息确定所述待分类视频的视频特征向量,包括:
获取各特征基准词向量,所述各特征基准词向量是根据语料库中语料对应的词向量进行聚类后得到的;
根据所述待分类视频的文本信息以及所述各特征基准词向量确定所述待分类视频的视频特征向量。
本发明实施例中,通过语料库中的语料对应的词向量进行聚类,通过聚类结果可以得到基准词向量,通过该基准词向量与待分类视频的文本信息,就能够快速的确定出待分类视频的文本信息的分类结果。
进一步地,所述方法还包括,所述根据所述待分类视频的文本信息以及所述各特征基准词向量确定所述待分类视频的视频特征向量,包括:
根据所述待分类视频的文本信息确定所述待分类视频的文本信息对应的关键词信息;
针对每个关键词信息,根据所述关键词信息的词向量与所述各特征基准词向量间的关系,确定所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。本发明实施例中,通过将待分类视频的文本信息进行转换,转换为关键词信息,能够快速的将待分类视频的文本信息进行关键词提取,除去文本信息中与分类无关的文本,提高分类效率,减少计算量。
进一步地,所述根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量,包括:
针对每个关键词信息,确定所述关键词信息的词向量与所述各特征基准词向量之间的距离差的最小值,并将最小的距离差作为所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。
本发明实施例中,通过每个关键词信息与视频特征子向量的距离能够确定该关键词信息是否与该视频特征向量的分量属于一类,所以通过各关键词信息的词向量与所述各特征基准词向量之间的距离差的最小值来作为视频特征向量的分量,并通过所有的视频特征向量的分量确定待分类视频的视频特征向量。
进一步地,所述各特征基准词向量是根据语料库中语料对应的词向量进行聚类后得到的,包括:
对语料库中每个语料对应的词向量按照设定规则从每个聚类结果中获取一个词向量作为所述聚类结果的特征基准词向量。
本发明实施例中,通过对语料库中的每个语料对应的词向量进行聚类,能够确定多个聚类结果,该聚类结果能够表征语料库中不同语料之间的相似性,所以通过选择该聚类结果中的一个词向量来表征该聚类结果,利用该词向量来表征该聚类结果降低了分类过程中的计算量,提高了分类效率。
进一步地,所述设定规则为选择每个聚类中心或者选择离每个聚类中心最近的一个词向量。
本发明实施例中,通过聚类中心或者离聚类中心最近的词向量来表征该聚类结果更准确。
进一步地,所述分类模型是通过所述历史视频的文本信息对应的视频特征向量确定的,包括:
针对每个历史视频,根据所述历史视频的历史关键词信息的词向量与所述各特征基准词向量间的关系,确定所述历史视频的视频特征向量;
根据各历史视频的视频特征向量以及所述各历史视频的已知的分类结果进行训练,得到所述分类模型。
本发明实施例中,分类模型是通过历史视频的文本信息进行训练得到的,该分类模型具有自学习功能以及快速寻找分类结果的能力。
本发明实施例还提供一种视频分类装置,包括:
获取单元,用于获取待分类视频的文本信息;所述待分类视频的文本信息用于对所述待分类视频进行描述;
视频特征向量确定单元,用于根据所述待分类视频的文本信息确定所述待分类视频的视频特征向量;所述待分类视频的视频特征向量是通过语料库中语料对应的词向量进行聚类后得到的;
分类结果确定单元,用于根据所述待分类视频的视频特征向量以及分类模型,确定所述待分类视频的分类结果;所述分类模型是通过所述历史视频的文本信息对应的视频特征向量确定的。
进一步地,所述视频特征向量确定单元具体用于:
获取各特征基准词向量,所述各特征基准词向量是根据语料库中语料对应的词向量进行聚类后得到的;
根据所述待分类视频的文本信息以及所述各特征基准词向量确定所述待分类视频的视频特征向量。
进一步地,所述视频特征向量确定单元具体用于:
根据所述待分类视频的文本信息确定所述待分类视频的文本信息对应的关键词信息;
针对每个关键词信息,根据所述关键词信息的词向量与所述各特征基准词向量间的关系,确定所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。
进一步地,所述视频特征向量确定单元具体用于:
针对每个关键词信息,确定所述关键词信息的词向量与所述各特征基准词向量之间的距离差的最小值,并将最小的距离差作为所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。
进一步地,所述视频特征向量确定单元具体用于:
对每个语料对应的词向量进行聚类,得到N个聚类结果,其中N大于等于2;
按照设定规则从每个聚类结果中获取一个词向量作为所述聚类结果的特征基准词向量。
进一步地,所述设定规则为选择每个聚类中心或者选择离每个聚类中心最近的一个词向量。
进一步地,所述装置还包括:
分类模型确定单元,用于针对每个历史视频,根据所述历史视频的历史关键词信息的词向量与所述各特征基准词向量间的关系,确定所述历史视频的视频特征向量;
根据各历史视频的视频特征向量以及所述各历史视频的已知的分类结果进行训练,得到所述分类模型。
本发明实施例还提供一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述实施例中任一所述的方法。
本发明实施例还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述实施例中任一所述方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种视频分类方法的流程示意图;
图2为本发明实施例提供的一种确定特征基准词向量的方法的流程示意图;
图3为本发明实施例提供的一种确定待分类视频的分类结果的方法的流程示意图;
图4为本发明实施例提供的一种视频分类装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在任一视频应用中,该应用不仅包括网页应用,还包括终端上的应用,用户通常需要上传需要分享的视频信息,将该视频信息作为待分类视频;用户在上传该应用视频时,往往需要选择会输入一段描述性文字,基于此,本发明实施例提供一种基于视频文本信息进行分类的方法,具体如图1所示,包括:
步骤101,获取待分类视频的文本信息;所述待分类视频的文本信息用于对所述待分类视频进行描述;
步骤102,根据所述待分类视频的文本信息确定所述待分类视频的视频特征向量;所述待分类视频的视频特征向量是通过对语料库中语料对应的词向量进行聚类后得到的;步骤103,根据所述待分类视频的视频特征向量以及分类模型,确定所述待分类视频的分类结果;所述分类模型是通过所述历史视频的文本信息对应的视频特征向量确定的。
在步骤101中,通过用户输入的对待分类视频的文字描述,获取了待分类视频的文本信息,示例性的,用户上传了待分类视频,添加的描述为“难得的晴天”,则“难得的晴天”为待分类视频的文本信息。可选的,获取的待分类视频的文本信息不仅仅限于用户的输入,还包括用户点击的一些个性化标签,例如用户在上传视频后,点击了“风景”、“心情”等标签,通过这些标签也能够获取待分类视频的文本信息。
在步骤102中,根据获取的待分类视频的文本信息能够确定该待分类视频的特征向量,而待分类视频的特征向量又是对语料库中语料对应的词向量进行聚类后得到的;而语料库中的聚类结果可以表征在不同语料之间的相似性,所以待分类视频的特征向量能够表征该待分类视频的分类信息,即能够表征该待分类视频属于哪种分类结果。
在步骤103中,获取分类模型,将待分类视频的视频特征向量输入至该分类模型中,得到了待分类视频信息的分类结果,由于该分类模型是根据历史视频的文本信息对应的视频特征向量确定的,能够保证分类模型的准确性,所以也能够保证待分类视频的分类结果的准确性。
可选的,在步骤102中,在获取了待分类视频的文本信息后,根据待分类视频的文本信息与各特征基准词向量来确定待分类视频的视频特征向量。特征基准词向量是用来表征语料库中的语料类别特性,也就是说,通过对语料库中所有语料进行聚类,能够确定语料类别特性,并根据语料的类别特性,确定待分类视频的类别特性。
在本发明实施例中,首先建立大规模语料库,可以认为,在实际能够获得的语料都存储在语料库中,也可以通过现有技术中的一个或者多个语料库建立适用于本申请的语料库。
针对语料库,对语料库中的所有语料聚类,首先就需要对每个语料对语料库中的所有语料首先进行向量变换,以便转换为计算机语言。在本发明实施例中,确定语料库中的每个词对应的词向量,每个词向量为一个一维数值向量,词向量的每个分量为一个浮点数,词向量的长度通常为100-1000之间。
在本发明实施例中,通过词向量进行聚类,然后得到聚类结果,根据聚类结果来确定特征基准词向量;可选的,有多少聚类结果,就对应多少个特征基准词向量。
可选的,在本发明实施例中,聚类方法为K-Means(K均值)聚类、均值漂移聚类、基于密度的聚类方法、用高斯混合模型(GMM)的最大期望(EM)聚类、凝聚层次聚类、图团体检测聚类方法中的任一种。
可选的,在本发明实施例中,根据所述待分类视频的文本信息以及各特征基准词向量确定待分类视频的视频特征向量的具体过程为,首先根据待分类视频的文本信息来确定文本信息对应的关键词信息,然后根据关键词信息与各基准词向量来确定待分类视频的视频特征向量。
在本发明实施例中,文本信息对应的关键词信息可以是文本信息中的部分词信息,文本信息中包括一些可以删掉的助动词、助词、语气词点,可以将该部分删除后,再根据删除后的文本,得到文本信息对应的关键词信息。可选的,在本发明实施例中,文本信息的关键词信息是通过分词的方式确定的,使用分词算法对待分类视频文本信息中的标题以及待分类视频的其它内容描述进行分词,并从分词结果中去除停用词。
可选的,在本发明实施例中,分词的方法为正向最大匹配法、逆向最大匹配法、最小切分法、双向匹配法等分词方法中的任一个。
可选的,在本发明实施例中,在确定了待分类视频的文本信息的分词结果后,从分词结果中确定待分类视频的文本信息的关键词信息。
可选的,在本发明实施例中,还需要对关键词信息中的关键词进行提取,去除不必要的文本信息,只保留可以保证待分类视频的关键词作为最终的关键词信息。
示例性的解释由待分类视频的文本信息到确定待分类视频的关键词信息的过程,待分类视频A的文本信息为“今天打篮球真开心,三分球5投5中”,首先对待分类视频A的文本信息进行分词,去除标点,得到的分词结果为“今天/打/篮球/真/开心/三分球/5/投/5/中”;然后对分词结果进行关键词提取,提取的结果为“篮球”、“三分球”。
在获取了关键词信息后,根据关键词信息的词向量与特征基准词向量间的关系来确定待分类视频的视频特征向量,也就是说,当确定了待分类视频的文本信息的关键词信息后,进一步确定关键词信息的词向量,而特征基准词向量确定的具体过程为:
获取语料库中的各个语料,并将各个语料转换为词向量,对各词向量进行聚类,得到N个聚类结果,其中N大于等于2;按照设定规则从每个聚类结果中获取一个词向量作为聚类结果的特征基准词向量。
可选的,在本发明实施例中,设定规则可以根据对聚类结果的精度要求、对计算量的考虑来综合设定,可选的设定规则有选择每个聚类中心或者选择离每个聚类中心最近的一个词向量。也就是说,选择每个聚类结果的中心作为特征基准词向量,该聚类结果的中心可能不是一个具有实际意义的词向量,所说义还可以选择离聚类中心最近的一个词向量作为特征基准词向量。
在本发明实施例中,根据关键词信息的词向量与特征基准词向量间的关系来确定待分类视频的视频特征向量的方法有多种,在此示例性的说明。
方法一,通过关键词信息的词向量与特征基准词向量之间的相似度来确定待分类视频的视频特征向量。例如,关键词信息有3个,即关键词信息的词向量有3个,特征基准词向量有4个,通过每个关键词信息的词向量与每个特征基准词向量进行相似度比较,得到相似度最高的一组,将该组中的特征基准词向量作为待分类视频的视频特征向量。
方法二,通过关键词信息的词向量与特征基准词向量之间的距离来确定待分类视频的视频特征向量。具体的,针对每个关键词信息,确定关键词信息的词向量与各特征基准词向量之间的距离差的最小值,并将最小的距离差作为该关键词信息的视频特征向量的分量;根据各关键词信息的视频特征向量的分量确定待分类视频的视频特征向量。
示例性说明,由各个特征基准词构成的特征基准向量表示为{k1,k2,…,kN},关键词信息的词向量可以表示为{v1,v2,…,vM},对每一个待分类视频,构造一个长度为N的特征向量T{t1,t2,t3,…,tN},向量的每个分量,为该待分类视频的每个关键词信息的词向量与对应的特征基准词向量的距离的最小值。即tn=min{|v1-kn|,|v2-kn|,…,|vM-kn|},tn为待分类视频的视频特征向量。
在步骤103中,分类模型是通过对历史视频数据进行训练得到的,具体的,在获取到历史视频后,获取历史视频的文本信息,通过对文本信息的分词、关键词提取后,确定了文本信息的关键词信息;通过关键词信息与词向量的映射关系,确定了历史视频的关键词信息的词向量。在确定了历史视频的关键词信息的词向量后,将历史视频的关键词信息的词向量以及各特征基准词向量确定历史视频的视频特征向量,并将历史视频的视频特征向量作为训练模型的训练样本,对初始分类模型进行训练,即将训练样本输入至初始分类模型,得到分类结果,根据分类结果以及各历史视频的已知的分类结果来调整初始分类模型,得到所述分类模型。
可选的,在本发明实施例中,可以使用随机森林方法、支持向量机方法以及神经网络方法进行模型训练。
下面采用示意性的实施例进行说明,在本发明实施例中,如图2所示,提供一种确定特征基准词向量的方法,具体过程为:
步骤201,通过国家语委现代汉语语料库、《人民日报》标注语料库构建语料库,并获取语料库中的每个语料;
步骤202,对语料库中的所有语料进行K-means聚类;
步骤203,根据N个聚类结果,并将N个聚类结果中离类中心最近的语料作为各特征基准词。
在本发明实施例中,如图3所示,提供一种确定待分类视频的分类结果的方法,具体过程为:
步骤301,获取待分类视频的文本信息;
步骤302,对待分类视频的文本信息进行分词;
步骤303,对分词结果进行关键词信息提取;
步骤304,提取后的关键词信息进行词向量表示;
步骤305,针对每个关键词信息,确定关键词信息的词向量与各特征基准词向量之间的距离差的最小值,并将最小的距离差作为该关键词信息的视频特征向量的分量;根据各关键词信息的视频特征向量的分量确定待分类视频的视频特征向量;
步骤306,将待分类视频的视频特征向量输入到分类模型中,得到分类结果。
基于同样的构思,本发明实施例还提供一种视频分类装置,如图4所示,包括:
获取单元401,用于获取待分类视频的文本信息;所述待分类视频的文本信息用于对所述待分类视频进行描述;
视频特征向量确定单元402,用于根据所述待分类视频的文本信息确定所述待分类视频的视频特征向量;所述待分类视频的视频特征向量是通过语料库中语料对应的词向量进行聚类后得到的;分类结果确定单元403,用于根据所述待分类视频的视频特征向量以及分类模型,确定所述待分类视频的分类结果;所述分类模型是通过所述历史视频的文本信息对应的视频特征向量确定的。
进一步地,所述视频特征向量确定单元402具体用于:
获取各特征基准词向量,所述各特征基准词向量是根据语料库中语料对应的词向量进行聚类后得到的;
根据所述待分类视频的文本信息以及所述各特征基准词向量确定所述待分类视频的视频特征向量。
进一步地,所述视频特征向量确定单元402具体用于:
根据所述待分类视频的文本信息确定所述待分类视频的文本信息对应的关键词信息;
针对每个关键词信息,根据所述关键词信息的词向量与所述各特征基准词向量间的关系,确定所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。
进一步地,所述视频特征向量确定单元402具体用于:
针对每个关键词信息,确定所述关键词信息的词向量与所述各特征基准词向量之间的距离差的最小值,并将最小的距离差作为所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。
进一步地,所述视频特征向量确定单元402具体用于:
对每个语料对应的词向量进行聚类,得到N个聚类结果,其中N大于等于2;
按照设定规则从每个聚类结果中获取一个词向量作为所述聚类结果的特征基准词向量。
进一步地,所述设定规则为选择每个聚类中心或者选择离每个聚类中心最近的一个词向量。
进一步地,所述装置还包括:
分类模型确定单元404,用于针对每个历史视频,根据所述历史视频的历史关键词信息的词向量与所述各特征基准词向量间的关系,确定所述历史视频的视频特征向量;
根据各历史视频的视频特征向量以及所述各历史视频的已知的分类结果进行训练,得到所述分类模型。
本发明实施例提供了一种电子设备,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行视频分类方法的步骤。如图5所示,为本发明实施例中所述的电子设备的硬件结构示意图,该电子设备具体可以为台式计算机、便携式计算机、智能手机、平板电脑等。具体地,该电子设备可以包括存储器501、处理器502及存储在存储器上的计算机程序,所述处理器502执行所述程序时实现上述实施例中的任一视频分类方法的步骤。其中,存储器501可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器502提供存储器501中存储的程序指令和数据。
进一步地,本申请实施例中所述的电子设备还可以包括输入装置503以及输出装置504等。输入装置503可以包括键盘、鼠标、触摸屏等;输出装置504可以包括显示设备,如液晶显示器、阴极射线管(Cathode Ray Tube,CRT),触摸屏等。存储器501,处理器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。处理器502调用存储器501存储的程序指令并按照获得的程序指令执行上述实施例提供的视频分类方法。
本申请实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项视频分类方法。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (16)

1.一种视频分类方法,其特征在于,所述方法包括:
获取待分类视频的文本信息;所述待分类视频的文本信息用于对所述待分类视频进行描述;
根据所述待分类视频的文本信息确定所述待分类视频的视频特征向量;所述待分类视频的视频特征向量是通过对语料库中语料对应的词向量进行聚类后得到的;
根据所述待分类视频的视频特征向量以及分类模型,确定所述待分类视频的分类结果;所述分类模型是通过所述历史视频的文本信息对应的视频特征向量确定的。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待分类视频的文本信息确定所述待分类视频的视频特征向量,包括:
获取各特征基准词向量,所述各特征基准词向量是根据语料库中语料对应的词向量进行聚类后得到的;
根据所述待分类视频的文本信息以及所述各特征基准词向量确定所述待分类视频的视频特征向量。
3.根据权利要求2所述的方法,其特征在于,所述根据所述待分类视频的文本信息以及所述各特征基准词向量确定所述待分类视频的视频特征向量,包括:
根据所述待分类视频的文本信息确定所述待分类视频的文本信息对应的关键词信息;
针对每个关键词信息,根据所述关键词信息的词向量与所述各特征基准词向量间的关系,确定所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。
4.根据权利要求3所述的方法,其特征在于,所述根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量,包括:
针对每个关键词信息,确定所述关键词信息的词向量与所述各特征基准词向量之间的距离差的最小值,并将最小的距离差作为所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。
5.根据权利要求2所述的方法,其特征在于,所述各特征基准词向量是根据语料库中语料对应的词向量进行聚类后得到的,包括:
对语料库中每个语料对应的词向量进行聚类,得到N个聚类结果,其中N大于等于2;
按照设定规则从每个聚类结果中获取一个词向量作为所述聚类结果的特征基准词向量。
6.根据权利要求5所述的方法,其特征在于,所述设定规则为选择每个聚类中心或者选择离每个聚类中心最近的一个词向量。
7.根据权利要求5所述的方法,其特征在于,所述分类模型是通过所述历史视频的文本信息对应的视频特征向量确定的,包括:
针对每个历史视频,根据所述历史视频的历史关键词信息的词向量与所述各特征基准词向量间的关系,确定所述历史视频的视频特征向量;
根据各历史视频的视频特征向量以及所述各历史视频的已知的分类结果进行训练,得到所述分类模型。
8.一种视频分类装置,其特征在于,包括:
获取单元,用于获取待分类视频的文本信息;所述待分类视频的文本信息用于对所述待分类视频进行描述;
视频特征向量确定单元,用于根据所述待分类视频的文本信息确定所述待分类视频的视频特征向量;所述待分类视频的视频特征向量是通过对语料库中语料对应的词向量进行聚类后得到的;
分类结果确定单元,用于根据所述待分类视频的视频特征向量以及分类模型,确定所述待分类视频的分类结果;所述分类模型是通过所述历史视频的文本信息对应的视频特征向量确定的。
9.根据权利要求8所述的装置,其特征在于,所述视频特征向量确定单元具体用于:
获取各特征基准词向量,所述各特征基准词向量是根据语料库中语料对应的词向量进行聚类后得到的;
根据所述待分类视频的文本信息以及所述各特征基准词向量确定所述待分类视频的视频特征向量。
10.根据权利要求9所述的装置,其特征在于,所述视频特征向量确定单元具体用于:
根据所述待分类视频的文本信息确定所述待分类视频的文本信息对应的关键词信息;
针对每个关键词信息,根据所述关键词信息的词向量与所述各特征基准词向量间的关系,确定所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。
11.根据权利要求10所述的装置,其特征在于,所述视频特征向量确定单元具体用于:
针对每个关键词信息,确定所述关键词信息的词向量与所述各特征基准词向量之间的距离差的最小值,并将最小的距离差作为所述关键词信息对应的视频特征向量的分量;
根据各关键词信息对应的视频特征向量的分量确定所述待分类视频的视频特征向量。
12.根据权利要求9所述的装置,其特征在于,所述视频特征向量确定单元具体用于:
对每个语料对应的词向量进行聚类,得到N个聚类结果,其中N大于等于2;
按照设定规则从每个聚类结果中获取一个词向量作为所述聚类结果的特征基准词向量。
13.根据权利要求12所述的装置,其特征在于,所述设定规则为选择每个聚类中心或者选择离每个聚类中心最近的一个词向量。
14.根据权利要求12所述的装置,其特征在于,所述装置还包括:
分类模型确定单元,用于针对每个历史视频,根据所述历史视频的历史关键词信息的词向量与所述各特征基准词向量间的关系,确定所述历史视频的视频特征向量;
根据各历史视频的视频特征向量以及所述各历史视频的已知的分类结果进行训练,得到所述分类模型。
15.一种电子设备,其特征在于,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~7任一权利要求所述方法的步骤。
16.一种计算机可读介质,其特征在于,其存储有可由终端设备执行的计算机程序,当所述程序在终端设备上运行时,使得所述终端设备执行权利要求1~7任一所述方法的步骤。
CN201910297460.8A 2019-04-15 2019-04-15 一种视频分类方法及装置 Expired - Fee Related CN110110143B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910297460.8A CN110110143B (zh) 2019-04-15 2019-04-15 一种视频分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910297460.8A CN110110143B (zh) 2019-04-15 2019-04-15 一种视频分类方法及装置

Publications (2)

Publication Number Publication Date
CN110110143A true CN110110143A (zh) 2019-08-09
CN110110143B CN110110143B (zh) 2021-08-03

Family

ID=67483919

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910297460.8A Expired - Fee Related CN110110143B (zh) 2019-04-15 2019-04-15 一种视频分类方法及装置

Country Status (1)

Country Link
CN (1) CN110110143B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689040A (zh) * 2019-08-19 2020-01-14 广州荔支网络技术有限公司 一种基于主播画像的声音分类方法
CN111104553A (zh) * 2020-01-07 2020-05-05 中国科学院自动化研究所 一种高效运动互补神经网络系统
CN113139085A (zh) * 2020-01-20 2021-07-20 上海哔哩哔哩科技有限公司 用户兴趣的挖掘方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243121A (zh) * 2015-09-29 2016-01-13 中国运载火箭技术研究院 一种基于数据挖掘的文本数据网络构建系统
CN105913072A (zh) * 2016-03-31 2016-08-31 乐视控股(北京)有限公司 视频分类模型的训练方法和视频分类方法
CN105955951A (zh) * 2016-04-29 2016-09-21 中山大学 一种消息过滤的方法及装置
CN106095791A (zh) * 2016-01-31 2016-11-09 长源动力(山东)智能科技有限公司 一种基于上下文的抽象样本信息检索系统及其抽象样本特征化表示方法
CN106294783A (zh) * 2016-08-12 2017-01-04 乐视控股(北京)有限公司 一种视频推荐方法及装置
CN106373123A (zh) * 2016-09-21 2017-02-01 哈尔滨工业大学 基于k_tSL中心聚类算法的工业元件表面缺陷检测方法
CN107063258A (zh) * 2017-03-07 2017-08-18 重庆邮电大学 一种基于语义信息的移动机器人室内导航方法
WO2018040059A1 (en) * 2016-09-02 2018-03-08 Microsoft Technology Licensing, Llc Clip content categorization
KR20180099126A (ko) * 2017-02-28 2018-09-05 한림대학교 산학협력단 멀티미디어 파일 유사도 검색 시스템 및 방법
CN109359636A (zh) * 2018-12-14 2019-02-19 腾讯科技(深圳)有限公司 视频分类方法、装置及服务器
CN109388712A (zh) * 2018-09-21 2019-02-26 平安科技(深圳)有限公司 一种基于机器学习的行业分类方法及终端设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243121A (zh) * 2015-09-29 2016-01-13 中国运载火箭技术研究院 一种基于数据挖掘的文本数据网络构建系统
CN106095791A (zh) * 2016-01-31 2016-11-09 长源动力(山东)智能科技有限公司 一种基于上下文的抽象样本信息检索系统及其抽象样本特征化表示方法
CN105913072A (zh) * 2016-03-31 2016-08-31 乐视控股(北京)有限公司 视频分类模型的训练方法和视频分类方法
CN105955951A (zh) * 2016-04-29 2016-09-21 中山大学 一种消息过滤的方法及装置
CN106294783A (zh) * 2016-08-12 2017-01-04 乐视控股(北京)有限公司 一种视频推荐方法及装置
WO2018040059A1 (en) * 2016-09-02 2018-03-08 Microsoft Technology Licensing, Llc Clip content categorization
CN106373123A (zh) * 2016-09-21 2017-02-01 哈尔滨工业大学 基于k_tSL中心聚类算法的工业元件表面缺陷检测方法
KR20180099126A (ko) * 2017-02-28 2018-09-05 한림대학교 산학협력단 멀티미디어 파일 유사도 검색 시스템 및 방법
CN107063258A (zh) * 2017-03-07 2017-08-18 重庆邮电大学 一种基于语义信息的移动机器人室内导航方法
CN109388712A (zh) * 2018-09-21 2019-02-26 平安科技(深圳)有限公司 一种基于机器学习的行业分类方法及终端设备
CN109359636A (zh) * 2018-12-14 2019-02-19 腾讯科技(深圳)有限公司 视频分类方法、装置及服务器

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG,YONG等: "Chaotic Features for Traffic Video Classification", 《KSII TRANSACTIONS ON INTERNET AND INFORMATION SYSTEMS》 *
何金艳等: "基于内容分析的Blog话题检测方法研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689040A (zh) * 2019-08-19 2020-01-14 广州荔支网络技术有限公司 一种基于主播画像的声音分类方法
CN110689040B (zh) * 2019-08-19 2022-10-18 广州荔支网络技术有限公司 一种基于主播画像的声音分类方法
CN111104553A (zh) * 2020-01-07 2020-05-05 中国科学院自动化研究所 一种高效运动互补神经网络系统
CN111104553B (zh) * 2020-01-07 2023-12-12 中国科学院自动化研究所 一种高效运动互补神经网络系统
CN113139085A (zh) * 2020-01-20 2021-07-20 上海哔哩哔哩科技有限公司 用户兴趣的挖掘方法及系统
CN113139085B (zh) * 2020-01-20 2023-03-21 上海哔哩哔哩科技有限公司 用户兴趣的挖掘方法及系统

Also Published As

Publication number Publication date
CN110110143B (zh) 2021-08-03

Similar Documents

Publication Publication Date Title
CN112699246B (zh) 基于知识图谱的领域知识推送方法
CN109325148A (zh) 生成信息的方法和装置
CN104537341B (zh) 人脸图片信息获取方法和装置
CN107291840B (zh) 一种用户属性预测模型构建方法和装置
JP7334395B2 (ja) ビデオ分類方法、装置、機器、および記憶媒体
CN109635260B (zh) 用于生成文章模板的方法、装置、设备和存储介质
CN110110143A (zh) 一种视频分类方法及装置
CN111967302A (zh) 视频标签的生成方法、装置及电子设备
CN109598307B (zh) 数据筛选方法、装置、服务器及存储介质
CN111475613A (zh) 案件分类方法、装置、计算机设备及存储介质
CN110287313A (zh) 一种风险主体的确定方法及服务器
CN112948575B (zh) 文本数据处理方法、装置和计算机可读存储介质
CN113656582A (zh) 神经网络模型的训练方法、图像检索方法、设备和介质
CN111666766A (zh) 数据处理方法、装置和设备
CN112417121A (zh) 客户意图识别方法、装置、计算机设备及存储介质
CN114564666A (zh) 百科信息展示方法、装置、设备和介质
CN110363206B (zh) 数据对象的聚类、数据处理及数据识别方法
CN113204636A (zh) 基于知识图谱的用户动态个性化画像方法
CN111475731A (zh) 数据处理方法、装置、存储介质及设备
CN112446214A (zh) 广告关键词的生成方法、装置、设备及存储介质
CN111831819A (zh) 一种文本更新方法及装置
CN105740389A (zh) 一种分类方法及装置
US20220319504A1 (en) Generating aspects from attributes identified in digital video audio tracks
KR20150101846A (ko) 스케치를 기반으로 하는 영상 분류 서비스 시스템, 사용자 장치, 서비스 제공 장치, 그 서비스 방법 및 컴퓨터 프로그램이 기록된 기록매체
CN114449342A (zh) 视频推荐方法、装置、计算机可读存储介质和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210803

CF01 Termination of patent right due to non-payment of annual fee