CN110443171A - 视频文件的分类方法、装置、存储介质及终端 - Google Patents

视频文件的分类方法、装置、存储介质及终端 Download PDF

Info

Publication number
CN110443171A
CN110443171A CN201910677764.7A CN201910677764A CN110443171A CN 110443171 A CN110443171 A CN 110443171A CN 201910677764 A CN201910677764 A CN 201910677764A CN 110443171 A CN110443171 A CN 110443171A
Authority
CN
China
Prior art keywords
video
characteristic
image
characteristic sequence
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910677764.7A
Other languages
English (en)
Other versions
CN110443171B (zh
Inventor
张义飞
王兴华
康斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Wuhan Co Ltd
Original Assignee
Tencent Technology Wuhan Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Wuhan Co Ltd filed Critical Tencent Technology Wuhan Co Ltd
Priority to CN201910677764.7A priority Critical patent/CN110443171B/zh
Publication of CN110443171A publication Critical patent/CN110443171A/zh
Application granted granted Critical
Publication of CN110443171B publication Critical patent/CN110443171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种视频文件的分类方法、装置、存储介质及终端,其中视频文件的分类方法包括:从视频文件中获取视频图像序列;获取视频图像序列中相邻视频图像之间的差异特征,得到特征序列;从特征序列中获取多个特征序列片段;根据特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频的片段数量;当片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定视频文件为所述指定类型视频。本方案根据多个特征序列片段确定相应视频片段的分类,并结合多个视频片段的分类结果来确定视频文件的类型,可有效识别出图像轮播类视频,提升视频文件的分类效率。

Description

视频文件的分类方法、装置、存储介质及终端
技术领域
本申请涉及信息处理技术领域,具体涉及一种视频文件的分类方法、装置、存储介质及终端。
背景技术
随着UGC(User Generated Conten,用户生成内容)视频的快速发展,图像轮播视频由于制作成本低、方便快捷等特点,大量出现在各种短视频播放平台上。由于该图像轮播类视频是由通常是以同一张图片持续性地重复播放,其观赏价值较低,不适合推荐给平台用户,需要进行识别标记。
对于该图像轮播类视频,特别是增加了切换、显示动态等特效的视频,与动漫视频、画面变化小的常规视频差异性较小,使得在对该图像轮播类视频分类时易受所增加特效的干扰,导致分类准确率较差。
发明内容
本申请实施例提供一种视频文件的分类方法、装置、存储介质及终端,可有效识别图像轮播类视频,提升视频文件的分类效率。
本申请实施例提供了一种视频文件的分类方法,包括:
从视频文件中获取多帧视频图像,得到视频图像序列;
获取所述视频图像序列中相邻视频图像之间的差异特征,得到特征序列;
从所述特征序列中获取多个特征序列片段,其中,每一特征序列片段对应一视频文件片段;
根据所述特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频的片段数量;
当所述片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定所述视频文件为所述指定类型视频。
相应的,本申请实施例还提供了一种视频文件的分类装置,包括:
图像获取单元,用于从视频文件中获取多帧视频图像,得到视频图像序列;
特征获取单元,用于获取所述视频图像序列中相邻视频图像之间的差异特征,得到特征序列;
片段获取单元,用于从所述特征序列中获取多个特征序列片段,其中,每一特征序列片段对应一视频文件片段;
数量确定单元,用于根据所述特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频的片段数量;
类型确定单元,用于当所述片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定所述视频文件为所述指定类型视频。
相应的,本申请实施例还提供了一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行如上所述视频文件的分类方法中的步骤。
相应的,本申请实施例还提供了一种终端,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述视频文件的分类方法的步骤
本申请方案,通过从视频文件中获取视频图像序列,并获取相邻视频图像之间的差异特征形成特征序列。从特征序列中获取多个特征序列片段,并确定对应视频文件片段为指定类型视频的特征序列片段的片段数量。当片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定该视频文件为指定类型视频。本方案根据多个特征序列片段确定相应视频片段的分类,并结合多个视频片段的分类结果来确定视频文件的类型,可有效识别出图像轮播类视频,提升视频文件的分类效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的视频文件的分类方法的一流程示意图。
图2是本申请实施例提供的视频文件的分类方法的另一流程示意图。
图3为本申请实施例提供的视频文件的分类方法的应用场景示意图
图4是本申请实施例提供的神经网络模型的示意图。
图5是本申请实施例提供的attention模型的示意图。
图6是本申请实施例提供的视频文件的分类装置的结构示意图。
图7是本申请实施例提供的终端的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
基于上述问题,本申请实施例提供一种视频文件的分类方法、装置、存储介质及终端,可及时识别出恶意账户,并有效提升恶意账户的识别准确率。以下分别进行详细说明。需说明的是,以下实施例的顺序不作为对实施例优选顺序的限定。
在一实施例中,将以该第一视频文件的分类装置集成在终端中的角度进行描述。
请参阅图1,图1为本申请实施例提供的视频文件的分类方法的一种流程示意图。该视频文件的分类方法的具体流程可以如下:
101、从视频文件中获取多帧视频图像,得到视频图像序列。
具体的,视频文件是互联网多媒体重要内容之一,其主要指包含了实时的音频、视频信息的多媒体文件。在本实施例中,视频文件中包括一定数量的静态视频图像,通过视频处理技术可将该一定数量的静态视频图像以视频的形式呈现。当连续的视频图像变化每秒超过一定帧数(通常为24帧)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频。
参考图2,在一些实施例中,步骤“从视频文件中获取多帧视频图像,得到视频图像序列”,可以包括以下流程:
1011、按照预定帧率时间间隔从视频文件中抽取多帧视频图像;
1012、对多帧视频图像按抽取的先后顺序进行排序,生成视频图像序列。
其中,在将视频抽帧成图像时,预定帧率时间间隔可以由产品生产厂商或本领域技术人员进行设定。例如,该帧率可以为20帧/秒、50帧/秒等,相应的帧率时间间隔为50毫秒、20毫秒等。
在抽取到多帧视频图像后,按照图像抽取时间的先后顺序对该多帧视频图像进行排序,从而得到视频图像序列。其中,该排序可以是由先到后的抽取顺序,也可以是由后到先的抽取顺序。
102、获取视频图像序列中相邻视频图像之间的差异特征,得到特征序列。
具体的,按照视频图像序列中各视频图像的排列顺序,确定相邻的视频图像对。然后,获取每一视频图像对之间的差异特征,并基于获取的差异特征,对应按照上述排列顺序进行排序,以得到特征序列。
例如,该视频图像序列为:{图像a,图像b,图像c,图像d,图像e},则可以包括四对相邻图像对,分别为:图像a与图像b,图像b与图像c,图像c与图像d,图像d与图像e。然后,可获取图像a与图像b之间的差异特征x1、图像b与图像c之间的差异特征x2、图像c与图像d之间的差异特征x3、图像d与图像e之间的差异特征x4。最后,基于差异特征x1、差异特征x2、差异特征x3、差异特征x4,生成特征序列为:{差异特征x1,差异特征x2,差异特征x3,差异特征x4}。
具体实施过程中,需要预先提取视频图像序列中每一视频图像的图像特征,从而获取各相邻视频图像的图像特征之间的差异特征。也即,在一些实施例中,继续参考图2,步骤“获取视频图像序列中相邻视频图像之间的差异特征,得到特征序列”,可以包括以下流程:
1021、对视频图像序列中的视频图像进行特征提取,得到每一视频图像的图像特征;
1022、获取视频图像序列中相邻视频图像的图像特征之间的差异特征;
1023、根据获取的差异特征生成特征序列。
其中,该特征序列至少包括一个差异特征。在对对视频图像序列中的视频图像进行特征提取时,可根据实际需求(指具体需要图像的哪些特征)采用相应的提取算法进行图像特征的提取。例如,可根据实际需求,对每帧视频图像提取图像哈希值(也称哈希指纹)、局部特征,以及生成视频图像对应的灰度图特征。
实际应用中,在提取图像哈希指纹时,可采用phash算法进行特征提取。另外,还可以采用avhash算法、dhash算法等方法进行特征提取。此外,为加特征快提取速度,还可以同时采用时多个哈希指纹提取算法提取多个哈希指纹。
在提取图像局部特征时,可采用orb算子从视频序列中的每一视频图像中提取多个局部特征。另外,还可以采用surf算子、sift算子等方法进行图像局部特征的提取。此外,还可以同时采用上述多个局部特征提取算法提取多种局部特征。在本实施例中,对于单色图等局部特征数目较少的视频图像,可对其进行标记。
另外,在一些实施例中,还可以将视频图像压缩成RGB图,后续计算相邻RGB图之间的色差值作为差异特征。
在生成视频图像对应的灰度图特征时,可将视频图像转换为大小为N*M的压缩灰度图。其中,M、N的取值一般在1-256之间。转换后灰度图的长宽比例可保持与原视频图像的长宽比例相同。例如,480*270的原视频图像,可将其压缩调整为240*135的灰度图。当然,也可以选择M=N,其值大小受后续计算灰度差特征时的速度影响,值越小则计算速度越快。
具体的,在根据获取的差异特征生成特征序列时,需对应到上述视频图像序列中各视频图像的排列顺序,对获取的差异特征进行排序。
103、从特征序列中获取多个特征序列片段,其中,每一特征序列片段对应一视频文件片段。
具体的,本实施例中获取特征序列片段的方式可以包括多种。
可选地,可从该特征序列中任意截取一定数量的差异特征,并进行多次截取,以得到多个特征序列片段。其中,该一定数量小于该特征序列中差异特征的总数量。实际截取时,所截取的多个特征序列片段可尽可能的覆盖该特征序列中的所有差异特征,以尽可能保证视频文件的特征不丢失。
可选地,可按指定步长从该特征序列中获取预设数目的差异特征,得到特征序列片段。其中,所获取的特征序列片段的数量,与片段截取时的步长、该预设数目、及该特征序列的总长度相关。
例如,对于总长度为L的特征序列,可以步长为s、预设数目为w,截取相应数量的特征序列片段。其中,特征序列片段的数量可以为:
其中,L、w、s均为大于0的整数。当n不为整数时,所截取的特征序列片段的数量为n的值向下取整,且最小为0。实际应用中,可通过滑动窗口的方法截取生成多个特征序列片段,窗口宽度则为w。
随后,可将截取的多个特征序列片段输入到分类模型进行分类,判断其对应视频文件片段是否为指定类型视频。
在一些实施例中,指定步长s对应的差异特征数目可设定为小于预设数目,以使相邻时间截取的两个特征序列片段存在交叉的部分。进而在执行特征序列片段的分类时,可结合到相邻特征序列片段中的部分差异特征,从而提升分类结果的准确性。
104、根据特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频的片段数量。
在本申请实施例中,该指定类型视频可以指图像轮播类视频。该图像轮播类视频是由通常是以同一张图片持续性地重复播放。
实际应用中,确定特征序列片段对应视频文件片段是否为指定类型视频的方式可以有多种。例如,可基于阈值和统计的方法进行分类。也即,在一些实施例中,步骤“从多个特征序列片段中确定对应视频文件片段为指定类型视频”,可以包括以下流程:
(11)获取特征序列片段中满足预设条件的差异特征的特征数量;
(12)当特征数量与特征序列片段中差异特征的总数量比值超过第一阈值时,确定特征序列片段对应的视频文件片段为指定类型视频。
其中,第一阈值可以根据实际需求进行设置。在本申请实施例中,该第一阈值可的取值范围可设定在0.2至1之间。
在一些实施例中,该图像特征至少包括图像哈希值、指定数量的图像局部特征、及灰度图特征。相应的,该差异特征至少包括:相邻视频图像之间图像哈希值的汉明距离、相邻视频图像之间图像局部特征的匹配数量、及相邻视频图像之间灰度图特征的灰度差。
其中,哈希指纹的汉明距离,即为相邻两帧视频图像的哈希指纹二进制化后不同的位数。
局部特征的匹配数目,即为相邻两帧视频图像的局部特征之间的距离,此处需统计距离小于一定值的局部特征的数目,距离小于该值则说明两个局部特征是相似特征、是匹配的。对于有特殊标志的图像,如果相邻两帧视频图像均有特殊标志,则匹配数目为最大值为上述指定数量;若只有一帧视频图像有特殊标志,匹配数目为0。
灰度差,即为相邻两帧视频图像的压缩灰度图之间每个像素点的灰度差值,此处需统计灰度差值小于一定阈值的像素点数目。
具体的,为了便于计算,可对于获取的差异特征进行归一化处理,各个差异特征值范围限定在0-1之间,而后再生成特征序列。
例如,原始哈希指纹有64位,提取100个局部特征,灰度图为32*32。假设差异特征中,哈希指纹的汉明距离为8,局部特征的匹配数目20,灰度图特征的灰度差为256,则归一化处理后,汉明距离为0.125=8/640、匹配数目为0.2=20/100、灰度差为0.25=256/(32*32),得到一个差异特征为{0.125,0.2,0.25}。
在一些实施例中,当汉明距离小于预设汉明距离,匹配数量大于预设匹配数量,且灰度差小于第一预设灰度差或大于第二预设灰度差时,确定差异特征满足预设条件。
其中,汉明距离小于预设汉明距离,则表明相邻两帧视频图像的哈希指纹比较相似,两张图像整体比较相似。实际应用中,预设汉明距离的取值在归一化后可设在0至0.375之间。
另外,匹配数量大于预设匹配数量,则表明相邻两帧视频图像的局部特征比较匹配,两帧视频图像的局部比较相似。实际应用中,预设匹配数量的取值在归一化后可设在0.05至0.66之间。
需要说明的是,第二预设灰度差大于第一预设灰度差。灰度差小于第一预设灰度差,表明相邻两帧视频图像的细节差异小,因此为轮播图像的可能也较大。灰度差大于第二预设灰度差,则表明相邻两帧视频图像一一对应的细节有差异较大。而通常在增加了图像缩放特效的的视频中,其图像整体和局部仍然相似,但是细节上差异较大,因此为轮播图像的可能也较大。实际应用中,第二预设灰度差值的取值在归一化后可设在0.5至1之间。
在一些实施例中,在确定特征序列对应的视频片段是否为指定类型视频时,还可以包括以下流程:
(21)当特征数量与特征序列片段中差异特征的总数量比值,未超过第一阈值且未低于第二阈值时,获取特征序列片段对应的第一概率,其中,第一概率指:所述特征序列片段对应的视频文件片段为指定类型视频的概率,第一阈值大于第二阈值;
(22)若第一概率大于预设概率阈值,则确定特征序列对应的视频片段为指定类型视频。
需要说明的是,特征数量与特征序列片段中差异特征的总数量比值超过第一阈值,则表明该特征序列片段对应的视频文件片段为指定类型视频。特征数量与特征序列片段中差异特征的总数量比值低于第二阈值,则表明该特征序列片段对应的视频文件片段为指定类型视频不为该指定类型视频。特征数量与特征序列片段中差异特征的总数量比值,未超过第一阈值且未低于第二阈值,则表明该特征序列片段对应的视频文件片段不确定是否为指定类型视频。
具体的,当该特征序列片段对应的视频文件片段不确定是否为指定类型视频时,则需要采用其他方式来进一步确定是否为指定类型视频。因此,可通过计算特征序列片段对应的视频文件片段为指定类型视频的概率,来确定其是否为指定类型视频。
在一些实施例中,步骤“获取特征序列片段对应的视频文件片段为指定类型视频的第一概率”,可以包括以下流程:
(211)获取特征序列片段中每一差异特征对应的第二概率,其中,第二概率指:所述差异特征对应的视频图像为所述指定类型视频中视频图像的概率;
(212)至少根据第二概率确定第一概率。
具体的,可基于特征序列片段中的多个差异特征对应的视频图像(即相邻视频图像)在该指定类型视频上的多个概率(即第二概率),来确定该特征序列片段对应在该指定类型上的概率(即第一概率)。
在一些实施例中,该视频文件的分类方法还可以包括以下流程:
(213)获取特征序列片段中每一差异特征对应的视频图像,对应在指定类型视频中的权重系数。
那么,在计算第一概率时,具体可以根据该第二概率和该权重系数确定第一概率。
具体实施时,在获取特征序列片段中每一差异特征对应的视频图像,对应在指定类型视频中的权重系数时,可以利用指定的注意力模型,获取特征序列片段中每一差异特征对应的视频图像为指定类型视频中视频图像的权重值,再根据该权重值确定权重系数。
其中,该指定的注意力模型可以为attention模型。实际应用中,该权重值可直接作为差异特征对应的视频图像对应在该指定类型视频上的权重系数。
105、当片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定视频文件为指定类型视频。
具体的,该预设比值可根据用户的实际需求进行设定。在本实施例中,该预设比值可设定在0.1至0.9之间。
本实施例提供的视频文件的分类方法,通过从视频文件中获取视频图像序列,并获取相邻视频图像之间的差异特征形成特征序列。从特征序列中获取多个特征序列片段,并确定对应视频文件片段为指定类型视频的特征序列片段的片段数量。当片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定该视频文件为指定类型视频。本方案根据多个特征序列片段确定相应视频片段的分类,并结合多个视频片段的分类结果来确定视频文件的类型,可有效识别出图像轮播类视频,提升视频文件的分类效率。
下面,将以指定类型视频为图像轮播类视频为例,对本申请中的视频文恩建的分类方法进行详细描述。参考图3,图3为本申请实施例提供的视频文件的分类方法的应用场景示意图。
在本实施例中,需要预先构建视频特征序列片段。具体的,可针对待处理的视频文件,依次进行视频抽帧、图像特征提取、视频特征提取(即差异特征提取)等操作,从而构建视频特征序列片段。具体可参考上述特征序列片段的相关描述,对此不再赘述。
在本申请实施例中,根据视频片段特征判断其是否为图像轮播视频片段的分类模型,可以是单独基于阈值和统计的方法进行分类,也可以单独基于神经网络模型进行分类,还可以采用其他的结合方法,如先基于阈值和统计的方法选出符合要求的图像轮播视频片段,然后将其输入神经网络模型进行分类;或者先输入神经网络模型进行判断,选出符合要求的图像轮播视频片段,然后再基于阈值和统计的方法做最终分类。下面将进行详细描述。
具体的,在实施例中,视频特征序列片段中的视频特征包括有汉明距离、局部特征的匹配数目及灰度差。参考图3,先基于统计和阈值的方法将视频特征序列片段分成3类,图像轮播类视频片段、非图像轮播类视频片段和待定片段,然后将待定片段输入到神经网络模型进行一步分类,识别是否为图像轮播片段。
基于阈值和统计的方法:对于长度为w的视频特征片段,统计特征序列片段中图像哈希指纹的汉明距离小于阈值t1,且局部特征匹配数目大于阈值t2,且灰度差小于阈值t3或者大于阈值t4时的视频特征数目m。当m/w大于阈值t5时,判断该片段为图像轮播类视频片段,然后当小于阈值t6时,判断该片段为非图像轮播类视频片段;其他部分为待定片段。
针对待定片段,可基于神经网络模型对其进行分类。具体实施时,可预先收集正负样本视频,参考上述方法提取视频特征片段并打上相应的正负标签,然后输入到神经网络模型中进行训练。然后,将视频特征片段输入到训练好的神经网络中进行推理,根据神经网络输出的结果判断该片段是否为图像轮播视频片段。
其中,采用的神经网络模型可参考图4,该神经网络模型可以采用CNN模型(Convolutional Neural Networks,卷积神经网络)与attention模型相结合的结构,可以用于灵活处理不同输入长度的视频特征序列片段。
在本实施例中,CNN模型可以包含多个级联的卷积层,每个卷积层由卷积函数、批归一化函数和激活函数组成。第一个卷积层的输入为长度为w,宽度为特征数目h的视频特征片段,输出为隐层数目k*w。第一层卷积层之后的卷积层的输入和输出均是隐层数目k*w。卷积部分的最终输出为k*w的特征e(x1)~e(xw)。其中,k是卷积层内选择使用的卷积核的数目,数量太少时影响CNN模型的特征提取能力,数量太多影响计算速度,k的取值一般可设置在1至1000以内。
参考图5,attention部分主要由分类函数、attention函数和结合函数构成。如图5所示,分类函数主要由卷积函数、激活函数组成,对于每个输入的视频特征,判断其属于某个类别的概率。分类函数的输入为cnn部分输出的k*w的特征e(x1)~e(xw),输出为每个视频特征的分类结果。在本实施例中,分类结果可以包括两种,分别为类别1和类别2。其中,类别1为图像轮播类视频、类别2为非图像轮播类视频。
例如,将分类结果为两种(即类别1和类别2)、长度为w的视频特征片段记作:w*2。则w*2的概率值f1(x1)~f1(xw)和f2(x1)~f2(xw)。其中,f1(xw)可以是图像轮播类视频的概率、f2(xw)可为非图像轮播类视频的概率。
attention函数主要由卷积函数、激活函数、限幅均值函数构成,对于每个输入的视频特征,判断每个视频特征在某个类别上分类时的权重系数。卷积函数和激活函数的输出为h1(x1)~h1(xw)和h2(x1)~h2(xw)。其中,h1(xw)可以是图像轮播类视频的概率、h2(xw)可为非图像轮播类视频的概率。
其中,h1(xk)为限制范围后的值,以防止出现某些值过大或过小的情况出现,避免神经网络训练时难以收敛。限幅均值函数对激活函数输出的w*2个值做限幅和均值处理,获得权重系数p1(x1)~p1(xw)和p2(x1)~p2(xw)。即将所有输入值限制到0-1范围内,对每个类别对应的w个视频特征的值求和,然后计算出每个视频特征在某个类别分类时的平均概率,即为权重系数。
如上式所示,结合函数,将分类函数输出的每个视频特征属于某个类别的概率,与attention函数输出的每个视频特征在某个类别分类时的权重系数对应相乘,然后再求和,获得视频特征片段是否为图像轮播视频片段的概率y1,如下:
当为图像轮播类视频片段的概率y1最大,且大于阈值t7时,判断该片段为图像轮播视频片段。其中,t7的取值可以设定在0.1值0.9之间。最后,统计生成的多个视频特征片段中被识别为图像轮播视频的片段数目。当该片段数目占总视频片段数目的占比大于t8时,识别该视频为图像轮播类视频。其中,t8的取值可以设定在0.1值0.9之间。
本方案中,融合了多种图像和视频特征,采用基于统计和阈值的方法与神经网络模型相结合的方法识别图像轮播视频,可以有效识别单张图片、图片轮播、文字轮播等类型的视频,对于带有各种切换和显示动态效果的图像轮播视频等都有较好的识别效果。另外,基于统计和阈值的方法与神经网络模型相结合的方法,在保证算法有较快的速度的同时,还有较高的准确率和召回率。
为便于更好的实施本申请实施例提供的视频文件的分类方法,本申请实施例还提供一种基于上述视频文件的分类方法的装置。其中名词的含义与上述视频文件的分类方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图6,图6为本申请实施例提供的一种视频文件的分类装置的结构示意图。其中,该视频文件的分类装置400可以集成在终端中。该视频文件的分类装置400可以包括图像获取单元401、特征获取单元402、片段获取单元403、数量确定单元404及类型确定单元405,具体可以如下:
图像获取单元401,用于从视频文件中获取多帧视频图像,得到视频图像序列;
特征获取单元402,用于获取所述视频图像序列中相邻视频图像之间的差异特征,得到特征序列;
片段获取单元403,用于从所述特征序列中获取多个特征序列片段,其中,每一特征序列片段对应一视频文件片段;
数量确定单元404,用于根据所述特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频的片段数量;
类型确定单元405,用于当所述片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定所述视频文件为所述指定类型视频。
在一些实施例中,所述数量确定单元404可以用于:
获取所述特征序列片段中满足预设条件的差异特征的特征数量;
当所述特征数量与所述特征序列片段中差异特征的总数量比值超过第一阈值时,确定所述特征序列片段对应的视频文件片段为指定类型视频。
在一些实施例中,图像特征至少包括图像哈希值、指定数量的图像局部特征、及灰度图特征;
差异特征至少包括:相邻视频图像之间图像哈希值的汉明距离、相邻视频图像之间图像局部特征的匹配数量、及相邻视频图像之间灰度图特征的灰度差;
数量确定单元404,进一步用于当所述汉明距离小于预设汉明距离,所述匹配数量大于预设匹配数量,且所述灰度差小于第一预设灰度差或大于第二预设灰度差时,确定所述差异特征满足预设条件。
在一些实施例中,数量确定单元404可以包括:
概率获取子单元,用于当所述特征数量与所述特征序列片段中差异特征的总数量比值,未超过第一阈值且未低于第二阈值时,获取所述特征序列片段对应的第一概率,其中,第一概率指所述特征序列片段对应的视频文件片段为指定类型视频的概率,第一阈值大于第二阈值;
确定子单元,用于若所述第一概率大于预设概率阈值,则确定所述特征序列对应的视频片段为指定类型视频。
在一些实施例中,获取子单元进一步可以用于:
获取特征序列片段中每一差异特征对应的第二概率,其中,第二概率指所述差异特征对应的视频图像为所述指定类型视频中视频图像的概率;
至少根据所述第二概率确定所述第一概率。
在一些实施例中,该数量确定单元404还可包括:
系数获取子单元,用于获取所述特征序列片段中每一差异特征对应的视频图像,对应在所述指定类型视频中的权重系数;
确定子单元,具体用于根据所述第二概率和所述权重系数确定所述第一概率。
在一些实施例中,系数获取子单元具体可以用于:
获取所述特征序列片段中每一差异特征对应的视频图像,为所述指定类型视频中视频图像的权重值;
根据所述权重值确定所述权重系数。
在一些实施例中,序列获取单元402可以用于:
对所述视频图像序列中的视频图像进行特征提取,得到每一视频图像的图像特征;
获取所述视频图像序列中相邻视频图像的图像特征之间的差异特征;
根据获取的差异特征生成所述特征序列。
在一些实施例中,片段获取单元403具体可以用于:
按指定步长从所述特征序列中获取预设数目的差异特征,得到所述特征序列片段。
在一些实施例中,所述指定步长对应的差异特征数目小于所述预设数目。
在一些实施例中,图像获取单元401具体可以用于:
按照预定帧率时间间隔从视频文件中抽取多帧视频图像;
对所述多帧视频图像按抽取的先后顺序进行排序,生成所述视频图像序列。
本申请实施例提供的视频文件的分类装置,通过从视频文件中获取视频图像序列,并获取相邻视频图像之间的差异特征形成特征序列。从特征序列中获取多个特征序列片段,并确定对应视频文件片段为指定类型视频的特征序列片段的片段数量。当片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定该视频文件为指定类型视频。本方案根据多个特征序列片段确定相应视频片段的分类,并结合多个视频片段的分类结果来确定视频文件的类型,可有效识别出图像轮播类视频,提升视频文件的分类效率。
本申请实施例还提供一种终端。如图7所示,该终端可以包括射频(RF,RadioFrequency)电路601、包括有一个或一个以上计算机可读存储介质的存储器602、输入单元603、显示单元604、传感器605、音频电路606、无线保真(WiFi,Wireless Fidelity)模块607、包括有一个或者一个以上处理核心的处理器608、以及电源609等部件。本领域技术人员可以理解,图7中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路601可用于收发信息过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器608处理;另外,将涉及上行的数据发送给基站。通常,RF电路601包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,LowNoise Amplifier)、双工器等。此外,RF电路601还可以通过无线通信与网络和其他设备通信。
存储器602可用于存储软件程序以及模块,处理器608通过运行存储在存储器602的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器608和输入单元603对存储器602的访问。
输入单元603可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元603可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。除了触敏表面,输入单元603还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元604可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元604可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器608以确定触摸事件的类型,随后处理器608根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图7中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
终端还可包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和或或背光。
音频电路606、扬声器,传声器可提供用户与终端之间的音频接口。音频电路606可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路606接收后转换为音频数据,再将音频数据输出处理器608处理后,经RF电路601以发送给比如终端,或者将音频数据输出至存储器602以便进一步处理。音频电路606还可能包括耳塞插孔,以提供外设耳机与终端的通信。
WiFi属于短距离无线传输技术,终端通过WiFi模块607可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块607,但是可以理解的是,其并不属于终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器608是终端的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器602内的软件程序和或或模块,以及调用存储在存储器602内的数据,执行终端的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器608可包括一个或多个处理核心;优选的,处理器608可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器608中。
终端还包括给各个部件供电的电源609(比如电池),优选的,电源可以通过电源管理系统与处理器608逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源609还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
具体在本实施例中,终端中的处理器608会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中,并由处理器608来运行存储在存储器602中的应用程序,从而实现各种功能:
从视频文件中获取多帧视频图像,得到视频图像序列;
获取所述视频图像序列中相邻视频图像之间的差异特征,得到特征序列;
从所述特征序列中获取多个特征序列片段,其中,每一特征序列片段对应一视频文件片段;
根据所述特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频的片段数量;
当所述片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定所述视频文件为所述指定类型视频。
本申请方案提供的终端,可根据多个特征序列片段确定相应视频片段的分类,并结合多个视频片段的分类结果来确定视频文件的类型,可有效识别出图像轮播类视频,提升视频文件的分类效率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种视频文件的分类方法中的步骤。例如,该指令可以执行如下步骤:
从视频文件中获取多帧视频图像,得到视频图像序列;
获取所述视频图像序列中相邻视频图像之间的差异特征,得到特征序列;
从所述特征序列中获取多个特征序列片段,其中,每一特征序列片段对应一视频文件片段;
根据所述特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频的片段数量;
当所述片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定所述视频文件为所述指定类型视频。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种视频文件的分类方法中的步骤,因此,可以实现本申请实施例所提供的任一种视频文件的分类方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的视频文件的分类方法、装置、存储介质及终端进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (15)

1.一种视频文件的分类方法,其特征在于,包括:
从视频文件中获取多帧视频图像,得到视频图像序列;
获取所述视频图像序列中相邻视频图像之间的差异特征,得到特征序列;
从所述特征序列中获取多个特征序列片段,其中,每一特征序列片段对应一视频文件片段;
根据所述特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频的片段数量;
当所述片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定所述视频文件为所述指定类型视频。
2.根据权利要求1所述的视频文件分类方法,其特征在于,根据所述特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频,包括:
获取所述特征序列片段中满足预设条件的差异特征的特征数量;
当所述特征数量与所述特征序列片段中差异特征的总数量比值超过第一阈值时,确定所述特征序列片段对应的视频文件片段为指定类型视频。
3.根据权利要求2所述的视频分类方法,其特征在于,所述图像特征至少包括图像哈希值、指定数量的图像局部特征、及灰度图特征;
所述差异特征至少包括:相邻视频图像之间图像哈希值的汉明距离、相邻视频图像之间图像局部特征的匹配数量、及相邻视频图像之间灰度图特征的灰度差;
当所述汉明距离小于预设汉明距离,所述匹配数量大于预设匹配数量,且所述灰度差小于第一预设灰度差或大于第二预设灰度差时,确定所述差异特征满足预设条件。
4.根据权利要求3所述的视频文件分类方法,其特征在于,还包括:
当所述特征数量与所述特征序列片段中差异特征的总数量比值,未超过第一阈值且未低于第二阈值时,获取所述特征序列片段对应的第一概率,其中,第一概率指:所述特征序列片段对应的视频文件片段为指定类型视频的概率,第一阈值大于第二阈值;
若所述第一概率大于预设概率阈值,则确定所述特征序列对应的视频片段为指定类型视频。
5.根据权利要求4所述的视频文件的分类方法,其特征在于,所述获取所述特征序列片段对应的视频文件片段为指定类型视频的第一概率,包括:
获取所述特征序列片段中每一差异特征对应的第二概率,其中,第二概率指:所述差异特征对应的视频图像为所述指定类型视频中视频图像的概率;
至少根据所述第二概率确定所述第一概率。
6.根据权利要求5所述的视频文件的分类方法,其特征在于,还包括:
获取所述特征序列片段中每一差异特征对应的视频图像,对应在所述指定类型视频中的权重系数;
所述至少根据所述第二概率确定所述第一概率,包括:
根据所述第二概率和所述权重系数确定所述第一概率。
7.根据权利要求6所述的视频文件的分类方法,其特征在于,所述获取所述特征序列片段中每一差异特征对应的视频图像,对应在所述指定类型视频中的权重系数,包括:
获取所述特征序列片段中每一差异特征对应的视频图像,为所述指定类型视频中视频图像的权重值;
根据所述权重值确定所述权重系数。
8.根据权利要求1-7任一项所述的视频文件的分类方法,其特征在于,所述获取所述视频图像序列中相邻视频图像之间的差异特征,得到特征序列,包括:
对所述视频图像序列中的视频图像进行特征提取,得到每一视频图像的图像特征;
获取所述视频图像序列中相邻视频图像的图像特征之间的差异特征;
根据获取的差异特征生成所述特征序列。
9.根据权利要求1所述的视频文件的分类方法,其特征在于,所述从所述特征序列中获取多个特征序列片段,包括:
按指定步长从所述特征序列中获取预设数目的差异特征,得到所述特征序列片段。
10.根据权利要求9所述的视频文件的分类方法,其特征在于,其特征在于,所述指定步长对应的差异特征数目小于所述预设数目。
11.根据权利要求1所述的视频文件的分类方法,其特征在于,所述从视频文件中获取多帧视频图像,得到视频图像序列,包括:
按照预定帧率时间间隔从视频文件中抽取多帧视频图像;
对所述多帧视频图像按抽取的先后顺序进行排序,生成所述视频图像序列。
12.一种视频文件的分类装置,其特征在于,包括:
图像获取单元,用于从视频文件中获取多帧视频图像,得到视频图像序列;
特征获取单元,用于获取所述视频图像序列中相邻视频图像之间的差异特征,得到特征序列;
片段获取单元,用于从所述特征序列中获取多个特征序列片段,其中,每一特征序列片段对应一视频文件片段;
数量确定单元,用于根据所述特征序列片段中的差异特征,从多个特征序列片段中确定对应视频文件片段为指定类型视频的片段数量;
类型确定单元,用于当所述片段数量与多个特征序列片段的总数量的比值大于预设比值时,确定所述视频文件为所述指定类型视频。
13.根据权利要求12所述的视频文件的分类装置,其特征在于,所述数量确定单元用于:
获取所述特征序列片段中满足预设条件的差异特征的特征数量;
当所述特征数量与所述特征序列片段中差异特征的总数量比值超过第一阈值时,确定所述特征序列片段对应的视频文件片段为指定类型视频。
14.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1-11任一项所述视频文件的分类方法的步骤。
15.一种终端,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-11任一项所述视频文件的分类方法的步骤。
CN201910677764.7A 2019-07-25 2019-07-25 视频文件的分类方法、装置、存储介质及终端 Active CN110443171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910677764.7A CN110443171B (zh) 2019-07-25 2019-07-25 视频文件的分类方法、装置、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910677764.7A CN110443171B (zh) 2019-07-25 2019-07-25 视频文件的分类方法、装置、存储介质及终端

Publications (2)

Publication Number Publication Date
CN110443171A true CN110443171A (zh) 2019-11-12
CN110443171B CN110443171B (zh) 2022-11-29

Family

ID=68431537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910677764.7A Active CN110443171B (zh) 2019-07-25 2019-07-25 视频文件的分类方法、装置、存储介质及终端

Country Status (1)

Country Link
CN (1) CN110443171B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111008280A (zh) * 2019-12-04 2020-04-14 北京百度网讯科技有限公司 一种视频分类方法、装置、设备和存储介质
CN112040287A (zh) * 2020-08-31 2020-12-04 聚好看科技股份有限公司 显示设备及视频播放方法
CN113204992A (zh) * 2021-03-26 2021-08-03 北京达佳互联信息技术有限公司 视频质量确定方法、装置、存储介质及电子设备
CN113326760A (zh) * 2021-05-26 2021-08-31 上海哔哩哔哩科技有限公司 视频分类方法及装置

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6052482A (en) * 1996-01-12 2000-04-18 Canon Kabushiki Kaisha Character recognition apparatus and method
US20060085477A1 (en) * 2004-10-01 2006-04-20 Ricoh Company, Ltd. Techniques for retrieving documents using an image capture device
CN101551864A (zh) * 2009-05-13 2009-10-07 西安电子科技大学 基于频域方向特征相关性的图像分类方法
US20100142914A1 (en) * 2007-10-23 2010-06-10 Guangyao Zhao Method and device for describing and capturing video object
CN101753943A (zh) * 2008-12-18 2010-06-23 佳能株式会社 图像处理设备和图像处理方法
CN101990093A (zh) * 2009-08-06 2011-03-23 索尼株式会社 检测视频中的重放片段的方法和设备
CN104023263A (zh) * 2014-05-20 2014-09-03 小米科技有限责任公司 视频选集提供方法和装置
CN105512610A (zh) * 2015-11-25 2016-04-20 华南理工大学 一种基于感兴趣点位置信息的视频中人体动作识别方法
CN106227868A (zh) * 2016-07-29 2016-12-14 努比亚技术有限公司 视频文件的归类方法和装置
CN106447689A (zh) * 2016-09-27 2017-02-22 微美光速资本投资管理(北京)有限公司 一种全息视频流的分割方法
CN106777114A (zh) * 2016-12-15 2017-05-31 北京奇艺世纪科技有限公司 一种视频分类方法及系统
CN107832708A (zh) * 2017-11-09 2018-03-23 云丁网络技术(北京)有限公司 一种人体动作识别方法及装置
CN109389096A (zh) * 2018-10-30 2019-02-26 北京字节跳动网络技术有限公司 检测方法和装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6052482A (en) * 1996-01-12 2000-04-18 Canon Kabushiki Kaisha Character recognition apparatus and method
US20060085477A1 (en) * 2004-10-01 2006-04-20 Ricoh Company, Ltd. Techniques for retrieving documents using an image capture device
US20100142914A1 (en) * 2007-10-23 2010-06-10 Guangyao Zhao Method and device for describing and capturing video object
CN101753943A (zh) * 2008-12-18 2010-06-23 佳能株式会社 图像处理设备和图像处理方法
CN101551864A (zh) * 2009-05-13 2009-10-07 西安电子科技大学 基于频域方向特征相关性的图像分类方法
CN101990093A (zh) * 2009-08-06 2011-03-23 索尼株式会社 检测视频中的重放片段的方法和设备
CN104023263A (zh) * 2014-05-20 2014-09-03 小米科技有限责任公司 视频选集提供方法和装置
CN105512610A (zh) * 2015-11-25 2016-04-20 华南理工大学 一种基于感兴趣点位置信息的视频中人体动作识别方法
CN106227868A (zh) * 2016-07-29 2016-12-14 努比亚技术有限公司 视频文件的归类方法和装置
CN106447689A (zh) * 2016-09-27 2017-02-22 微美光速资本投资管理(北京)有限公司 一种全息视频流的分割方法
CN106777114A (zh) * 2016-12-15 2017-05-31 北京奇艺世纪科技有限公司 一种视频分类方法及系统
CN107832708A (zh) * 2017-11-09 2018-03-23 云丁网络技术(北京)有限公司 一种人体动作识别方法及装置
CN109389096A (zh) * 2018-10-30 2019-02-26 北京字节跳动网络技术有限公司 检测方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
TAO MEI 等: "Automatic Video Genre Categorization using Hierarchical SVM", 《RESERACHGATE》 *
康斌 等: "利用高分化种内和种间序列利用高分化种内和种间序列", 《生物物理学报》 *
朱毅 等: "一种基于禁忌搜索的全局最优化模糊聚类算法", 《电子学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111008280A (zh) * 2019-12-04 2020-04-14 北京百度网讯科技有限公司 一种视频分类方法、装置、设备和存储介质
CN111008280B (zh) * 2019-12-04 2023-09-05 北京百度网讯科技有限公司 一种视频分类方法、装置、设备和存储介质
CN112040287A (zh) * 2020-08-31 2020-12-04 聚好看科技股份有限公司 显示设备及视频播放方法
CN113204992A (zh) * 2021-03-26 2021-08-03 北京达佳互联信息技术有限公司 视频质量确定方法、装置、存储介质及电子设备
CN113204992B (zh) * 2021-03-26 2023-10-27 北京达佳互联信息技术有限公司 视频质量确定方法、装置、存储介质及电子设备
CN113326760A (zh) * 2021-05-26 2021-08-31 上海哔哩哔哩科技有限公司 视频分类方法及装置
CN113326760B (zh) * 2021-05-26 2023-05-09 上海哔哩哔哩科技有限公司 视频分类方法及装置

Also Published As

Publication number Publication date
CN110443171B (zh) 2022-11-29

Similar Documents

Publication Publication Date Title
CN110443171A (zh) 视频文件的分类方法、装置、存储介质及终端
US10169639B2 (en) Method for fingerprint template update and terminal device
CN104143097B (zh) 分类函数获取方法、人脸年龄识别方法、装置和设备
CN108334887B (zh) 一种用户选取方法和装置
CN109346061B (zh) 音频检测方法、装置及存储介质
CN111260665A (zh) 图像分割模型训练方法和装置
CN108520058A (zh) 一种商家信息推荐方法及移动终端
CN106951868B (zh) 一种基于身形特征的步态识别方法及装置
CN103745235A (zh) 人脸识别方法、装置及终端设备
CN112820299B (zh) 声纹识别模型训练方法、装置及相关设备
CN108280458A (zh) 群体关系类型识别方法及装置
CN107729815A (zh) 图像处理方法、装置、移动终端及计算机可读存储介质
CN109508399A (zh) 一种表情图像处理方法、移动终端
CN105303149A (zh) 人物图像的展示方法和装置
CN107451444A (zh) 解锁控制方法及相关产品
CN109376781A (zh) 一种图像识别模型的训练方法、图像识别方法和相关装置
CN109067981A (zh) 分屏应用切换方法、装置、存储介质和电子设备
CN103501487A (zh) 分类器更新方法、装置、终端、服务器及系统
CN106022074A (zh) 一种指纹解锁方法及终端
CN107590464A (zh) 人脸识别方法及相关产品
CN107545163A (zh) 解锁控制方法及相关产品
CN114626036B (zh) 基于人脸识别的信息处理方法、装置、存储介质及终端
US11200437B2 (en) Method for iris-based living body detection and related products
CN108536869A (zh) 一种搜索分词的方法、装置及计算机可读存储介质
CN116307394A (zh) 产品用户体验评分方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant