CN103631786A - 一种视频文件的聚类方法和装置 - Google Patents

一种视频文件的聚类方法和装置 Download PDF

Info

Publication number
CN103631786A
CN103631786A CN201210299743.4A CN201210299743A CN103631786A CN 103631786 A CN103631786 A CN 103631786A CN 201210299743 A CN201210299743 A CN 201210299743A CN 103631786 A CN103631786 A CN 103631786A
Authority
CN
China
Prior art keywords
video file
video
characteristic curve
curve
approximate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210299743.4A
Other languages
English (en)
Other versions
CN103631786B (zh
Inventor
刘刚
傅斌
吴运声
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210299743.4A priority Critical patent/CN103631786B/zh
Publication of CN103631786A publication Critical patent/CN103631786A/zh
Application granted granted Critical
Publication of CN103631786B publication Critical patent/CN103631786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明实施例提供了一种视频文件的聚类方法,所述方法包括:根据视频文件内图像的亮度均值,获取所述视频文件的亮度均值曲线;根据所述亮度均值曲线中的极值点获取所述视频文件的特征曲线;根据所述视频文件的特征曲线对所述视频文件进行聚类。本发明实施例还公开了一种视频文件聚类装置。采用本发明,实现了根据视频文件内容特性来对视频文件进行聚类,避免了现有技术中视频聚类需要大量抽取视频帧以及巨大的计算量,提升了视频聚类的效率。

Description

一种视频文件的聚类方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种视频文件的聚类方法和装置。
背景技术
随着多媒体技术的迅速发展,现代计算机技术特别是海量数据存储与传输技术的成熟,视频作为一种主要的媒体类型在人们的生活、教育、娱乐等方面日益成为不可或缺的信息载体。随着视频压缩技术的迅速发展以及存储设备价格的日益下降和网络传输速度不断加快,越来越多的视频数据可供用户使用。视频虽然具有表现力强、蕴含信息量大、形象生动等优点,但同时其非结构化的数据格式、巨大的数据量以及表现内容的不透明等缺点,使得对视频数据的管理和分析例如对视频数据的聚类和检索等相当困难。如何有效地组织和管理视频数据,如何有效地按照视频数据的特性去存取视频数据,使人们能够方便地从大量视频数据中找到自己感兴趣的相关视频文件已成为一种迫切的需求。而现有的视频文件管理通常有如下2种技术方案:
一是基于视频文件名称来进行分类的和管理,由于每个视频文件都有文件名称,通常情况下文件名称和视频的内容一定程度上是对应的,因此根据视频文件名称来进行分类和管理是现有最常用的管理手段。但是在该方案中视频文件的命名很难统一进行管理,由于视频数据表现内容的不透明的特性很难在对其命名时考虑文件的内容特性,因此不能保证视频文件内容与名称的一致性,进而文件名中也可能会有很多干扰的信息影响分析的结果,例如外语电影有很多不同的翻译名称,名字不一样的难以界定之间的相似度,对应名称中间当中有中文和外文混合的情况尤其如此。
二是基于内容的视频检索技术(CBR,Content-Based Video Retrieval)。该方案的主要思路是基于镜头提取关键帧,一段视频分割成多个镜头后,从每个镜头中按照一定的规则提取关键帧,然后基于关键帧进行聚类。该方式主要存在两个方面的问题:(1)通常会为了不漏选关键帧而选取了过多的帧作为关键帧,造成了关键帧冗余,从而导致聚类过程中需要存储中间信息和计算量非常大,面对海量视频文件处理效率很低;(2)所选取的关键帧代表性不强,导致通过关键帧对视频进行检索时易产生多选和遗漏的情况。
发明内容
本发明实施例所要解决的技术问题在于,提供一种视频文件的聚类方法和装置,可根据视频文件内容特性来对视频文件进行聚类,避免现有技术中视频聚类需要大量抽取视频帧以及巨大的计算量。
为了解决上述技术问题,本发明实施例提供了一种视频文件的聚类方法,所述方法包括:
根据视频文件内至少的亮度均值,获取所述视频文件的亮度均值曲线;
根据所述亮度均值曲线中的极值点获取所述视频文件的特征曲线;
根据所述视频文件的特征曲线对所述视频文件进行聚类。
相应地,本发明实施例还提供了一种视频文件聚类装置,所述视频文件聚类装置包括:
亮度均值曲线获取模块,用于根据视频文件内图像的亮度均值,获取所述视频文件的亮度均值曲线;
特征曲线获取模块,用于根据所述亮度均值曲线中的极值点获取所述视频文件的特征曲线;
聚类模块,用于根据所述视频文件的特征曲线对所述视频文件进行聚类。
实施本发明实施例,具有如下有益效果:通过基于视频图像的亮度均值表征视频文件的特征,从而实现了根据视频文件内容特性来对视频文件进行聚类,避免了现有技术中视频聚类需要大量抽取视频帧以及巨大的计算量,提升了视频聚类的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中的视频文件聚类装置的结构示意图;
图2是本发明实施例中视频文件聚类装置的亮度均值曲线获取模块的结构示意图;
图3是本发明实施例中视频文件聚类装置的聚类模块的结构示意图;
图4是本发明实施例中一种视频文件的聚类方法的流程示意图;
图5是本发明实施例中视频文件的聚类方法中获取视频文件的亮度均值曲线的流程示意图;
图6是本发明实施例中视频文件的聚类方法中对视频文件进行聚类的具体流程示意图;
图7是本发明实施例中视频文件的聚类方法中根据所述视频文件的特征曲线查找近似视频文件的具体流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
图1为本发明实施例中的一种视频文件聚类装置的结构示意图,如图所示本实施例中的视频文件聚类装置至少包括:亮度均值曲线获取模块10、特征曲线获取模块20以及聚类模块30,其中:
亮度均值曲线获取模块10用于根据视频文件内图像的亮度均值,获取所述视频文件的亮度均值曲线。本发明所涉及的视频泛指将一系列静态影像以电信号方式加以捕捉、纪录、处理、储存、传送以及重现过程中的数据文件,当连续的图像变化每秒超过24帧(frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,包括这样连续的画面的数据文件即本发明所述的视频。当视频文件聚类装置需要对一视频文件进行聚类时,首先由亮度均值曲线获取模块10按照一定的规则抽取视频文件内的至少部分图像,并计算抽取出的图像的亮度均值,然后根据计算得到的图像的亮度均值获取所述视频文件的亮度均值曲线。具体实现中可以如图2所示,亮度均值曲线获取模块10可以进一步包括:
视频段落抽取单元101,用于根据所述视频文件的时长以及预设的抽取规则从所述视频文件中抽取出至少一个时间段的视频段落。具体的,视频段落抽取单元101从视频文件中抽取视频段落的规则可以为按照一定的比例从视频文件的前、中及后部分各抽取一部分视频段落,例如将视频文件的总时长按照百分比均分,抽取6~20%、41~50%以及81~100%三个时间段的视频段落。
截图单元102,用于对所述视频段落抽取单元101抽取出的每个视频段落进行截图。具体的,截图单元102对视频段落的截图方式可以为根据视频段落的时间轴中预设的采样时间点附近抽取一个或多个视频帧的视频图像作为截图,例如在视频时间轴上预设的t1时间点附近抽取一个或多个视频帧的视频图像,然后往后推一个预设的时间间隔在t2时间点附近抽取一个或多个视频帧的视频图像,以此类推。所述预设的采样时间点之间的时间间隔可以如每间隔1秒、3秒或5秒等,为了防止视频的时间偏移,也可以在采样时间点附近前后Δt之间任意抽取多个视频帧的图像作为截图,Δt的取值可以例如为0.05秒等。经过截图单元102的截图可以得到每个视频段落的多个图像。
亮度均值计算单元103,用于计算每个视频段落经过截图得到的所有图像的亮度均值。具体的,亮度均值计算单元103可以获取所述每个视频段落经过截图得到的图像中每个像素的亮度值,然后求和并除于总像素个数得到每个图像的亮度均值。
亮度均值曲线获取单元104,用于分别获取每个视频段落的亮度均值曲线,并根据所述若干个视频段落的亮度均值曲线获取所述视频文件的亮度均值曲线。具体可以例如,在以图像所在视频时间点为横坐标,图像的亮度均值为纵坐标画出每个视频段落的亮度均值曲线。可以直接采用所述若干个视频段落的亮度均值曲线作为所述视频文件的亮度均值曲线,或将每个视频段落的亮度均值曲线直接按照时间顺序线性连接,即得到所述视频文件的亮度均值曲线。由于之前抽取视频段落时可能各视频段落之间的时间不是连续的,中间空缺的时间段可以线性补全或直接缺省。
特征曲线获取模块20用于根据所述亮度均值曲线中的极值点获取所述视频文件的特征曲线。所述极值点可以为所述亮度均值曲线中发生波折的点,具体实现中,特征曲线获取模块20可以设定曲线角度阈值α,当所述亮度均值曲线中某一点p与前后间距时长n的(p+n)、(p-n)三点构成的角度小于α,则将p设为所述亮度均值曲线的极值点,α例如可以为104°。将所述视频文件的亮度均值曲线中的所有极值点进行线性连接,即可做为所述视频文件的特征曲线。可选的,特征曲线获取模块20在获取极值点之前可以先对所述视频文件的亮度均值曲线进行去噪处理,减少无意义的极值点,还可以将多个临近极值点进行去重处理,例如在5秒内的亮度均值曲线中出现多个极值点,这时可以仅取其中一个列入极值点。另一方面可选的,若视频文件的画面长时间内较为平缓,在某极值点p后一段时间没有出现新的极值点,则可以将p点所在的亮度均值对所述特征曲线往后做延续插值处理。
聚类模块30用于根据所述视频文件的特征曲线对所述视频文件进行聚类。具体的,聚类模块30可以根据所述视频文件的特征曲线表征视频文件的特征,从而可以查找其他相似的视频文件,或作为被其他视频文件视为相似视频文件的判别依据,只要两个视频文件的特征曲线相似,那么就可以认为这两个视频文件近似,从而可以实现相同或近似内容的视频文件的聚类。具体的如图3所示,聚类模块30可以包括:
特征曲线分段单元301,用于将所述视频文件的特征曲线进行分成至少两个特征曲线段落。具体实现中,特征曲线分段单元301可以例如将所述视频文件的特征曲线平均分为5段、10段等。
聚类单元302根据所述每个特征曲线段落的均值以及所述特征曲线的总时长,对所述视频文件进行聚类。以将特征曲线平均分为5段为例,这时聚类单元302可以根据5段特征曲线段落的均值以及总时长共六个特征向量,对所述视频文件进行聚类。
进而所述聚类模块30还可以包括:
索引建立单元304,用于根据所述视频文件的特征曲线建立所述视频文件的索引信息。具体实现中,索引建立单元304可以采用R*树索引结构建立聚类索引树,将视频文件的标识以及表征视频文件的特权曲线的特征向量插入R*树中建立该视频文件的索引信息,例如采用视频文件的Hash值标识视频文件,将上述聚类单元302采用的5段特征曲线段落的均值以及总时长共六个特征向量以及视频文件Hash插入R*树中建立该视频文件的索引信息,以及将多个具有相近特征曲线的视频文件的Hash保存在一个聚类分组中。
近似查找单元303,用于根据所述视频文件的特征曲线查找近似视频文件。具体的,近似查找单元303可以根据所述特征曲线的特征向量,查找其他拥有近似特征曲线的近似视频文件,例如采用上述的将特征曲线分段得到的5段特征曲线段落的均值以及总时长共六个特征向量查找其他具有相似特征向量的近似视频文件,当已建立有根据多段特征曲线段落均值以及总时长作为特征向量建立的聚类索引R*树,则可以在该R*树中查找特征向量数据近似的近似视频文件集合。
进一步可选的,所述聚类模块30还可以包括:
比较单元305,用于将所述视频文件与所述近似查找单元303查找到的近似视频文件进行比较,进一步可以包括:将所述视频文件的特征曲线和/或截图与所述查找到的近似视频文件的特征曲线和/或截图进行比较;和/或将所述视频文件的截图与所述查找到的近似视频文件的截图进行比较。具体的,当近似查找单元303查找到某一视频文件的近似视频文件或近似视频文件集合时,可以进一步将作为聚类分析目标的视频文件A的特征曲线与其近似视频文件B的特征曲线进行比较,例如将A与B的特征曲线上相对应的点计算方差,方差值越小则表示特征曲线越近似,进一步还可以考虑到视频时间偏移的问题可以将A或B的特征曲线进行正负m秒区间的平移后再计算二者方差值,在确定最匹配的偏移时间后再得到最小方差;和/或例如根据一定的截图选取规则(如亮度值等于所在视频段落的亮度均值)在从A与B中分别选取若干截图,比较两者对应时间点(同样可以考虑时间偏移的问题)的截图的亮度均值,分别选取到的截图的亮度均值越接近似则表示A或B的特征曲线越近似。
近似度获取单元306,用于根据比较单元305的比较结果获取所述视频文件与所述查找到的近似视频文件的近似度。所述近似度可以为两个视频文件的内容接近程度,可以采用百分比或近似等级来表示,例如同一部影片会有许多不同清晰度、不同格式、不同字幕、不同配音等多个版本,近似度获取单元306可以根据比较单元305的比较结果,将这些不同版本但是内容相同的视频文件判断为近似度非常高的近似视频文件,并将它们聚在同一个聚类组别中。
图4为本发明实施例中一种视频文件的聚类方法的流程示意图,如图所示本实施例中的流程包括:
步骤S41,根据视频文件内图像的亮度均值,获取所述视频文件的亮度均值曲线。具体实现中,可以按照一定的规则抽取视频文件内的至少部分图像,并计算抽取出的图像的亮度均值,然后根据计算得到的图像的亮度均值获取所述视频文件的亮度均值曲线。具体实现中可以如图5所示,本实施例中获取视频文件的亮度均值曲线的流程可以包括:
S411根据所述视频文件的时长以及预设的抽取规则从所述视频文件中抽取出至少一个时间段的视频段落。具体的,从视频文件中抽取视频段落的规则可以为按照一定的比例从视频文件的前、中及后部分各抽取一部分视频段落,例如将视频文件的总时长按照百分比均分,抽取6~20%、41~50%以及81~100%三个时间段的视频段落。
S412对所述抽取出的每个视频段落进行截图。具体实现中,对视频段落的截图方式可以为根据视频段落的时间轴中预设的采样时间点附近抽取一个或多个视频帧的视频图像作为截图,例如在视频时间轴上预设的t1时间点附近抽取一个或多个视频帧的视频图像,然后往后推一个预设的时间间隔在t2时间点附近抽取一个或多个视频帧的视频图像,以此类推。所述预设的采样时间点之间的时间间隔可以如每间隔1秒、3秒或5秒等,为了防止视频的时间偏移,也可以在采样时间点附近前后Δt之间任意抽取多个视频帧的图像作为截图,Δt的取值可以例如为0.05秒等。经过截图可以得到每个视频段落的多个图像。
S413计算每个视频段落经过截图得到的所有图像的亮度均值。具体的,可以获取所述每个视频段落经过截图得到的图像中每个像素的亮度值,然后求和并除于总像素个数即可得到每个图像的亮度均值。
S414分别获取每个视频段落的亮度均值曲线,并根据所述若干个视频段落的亮度均值曲线获取所述视频文件的亮度均值曲线。具体可以例如,在以图像所在视频时间点为横坐标,图像的亮度均值为纵坐标画出每个视频段落的亮度均值曲线。可以直接采用所述若干个视频段落的亮度均值曲线作为所述视频文件的亮度均值曲线,或将每个视频段落的亮度均值曲线直接按照时间顺序线性连接,即得到所述视频文件的亮度均值曲线。由于之前抽取视频段落时可能各视频段落之间的时间不是连续的,中间空缺的时间段可以线性补全或直接缺省。
步骤S42,根据所述亮度均值曲线中的极值点获取所述视频文件的特征曲线.所述极值点可以为所述亮度均值曲线中发生波折的点,具体实现中,可以设定曲线角度阈值α,当所述亮度均值曲线中某一点p与前后间距时长n的(p+n)、(p-n)三点构成的角度小于α,则将p设为所述亮度均值曲线的极值点,α例如可以为104°。将所述视频文件的亮度均值曲线中的所有极值点进行线性连接,即可做为所述视频文件的特征曲线。可选的,特征曲线获取模块20在获取极值点之前可以先对所述视频文件的亮度均值曲线进行去噪处理,减少无意义的极值点,还可以将多个临近极值点进行去重处理,例如在5秒内的亮度均值曲线中出现多个极值点,这时可以仅取其中一个列入极值点。另一方面可选的,若视频文件的画面长时间内较为平缓,在某极值点p后一段时间没有出现新的极值点,则可以将p点所在的亮度均值对所述特征曲线往后做延续插值处理。
步骤S43,根据所述视频文件的特征曲线对所述视频文件进行聚类。具体的,可以根据所述视频文件的特征曲线表征视频文件的特征,从而可以查找其他相似的视频文件,或作为被其他视频文件视为相似视频文件的判别依据,只要两个视频文件的特征曲线相似,那么就可以认为这两个视频文件近似,从而可以实现相同或近似内容的视频文件的聚类。具体的如图6所示,本实施例对视频文件进行聚类的具体流程可以包括:
S431将所述视频文件的特征曲线进行分成至少两个特征曲线段落。具体实现中,可以例如将所述视频文件的特征曲线平均分为5段、10段等。
S432根据所述每个特征曲线段落的均值以及所述特征曲线的总时长,对所述视频文件进行聚类。以将特征曲线平均分为5段为例,这时聚类单元302可以根据5段特征曲线段落的均值以及总时长共六个特征向量,对所述视频文件进行聚类。
进一步的,本发明所述对视频文件进行聚类,包括根据所述视频文件的特征曲线查找近似视频文件;和/或根据所述视频文件的特征曲线建立所述视频文件的索引信息。
其中根据所述视频文件的特征曲线建立所述视频文件的索引信息可以采用R*树索引结构建立聚类索引树,将视频文件的标识以及表征视频文件的特权曲线的特征向量插入R*树中建立该视频文件的索引信息,例如采用视频文件的Hash值标识视频文件,将上述聚类单元302采用的5段特征曲线段落的均值以及总时长共六个特征向量以及视频文件Hash插入R*树中建立该视频文件的索引信息,以及将多个具有相近特征曲线的视频文件的Hash保存在一个聚类分组中。
而根据所述视频文件的特征曲线查找近似视频文件可以如图7所示,包括以下流程:
步骤S701,根据所述视频文件的特征曲线查找近似视频文件。具体可以为根据所述特征曲线的特征向量,查找其他拥有近似特征曲线的近似视频文件,例如采用上述的将特征曲线分段得到的5段特征曲线段落的均值以及总时长共六个特征向量查找其他具有相似特征向量的近似视频文件,当已建立有根据多段特征曲线段落均值以及总时长作为特征向量建立的聚类索引R*树,则可以在该R*树中查找特征向量数据近似的近似视频文件集合。
步骤S702,将所述视频文件与所述查找到的近似视频文件进行比较,包括:将所述视频文件的特征曲线和/或截图与所述查找到的近似视频文件的特征曲线和/或截图进行比较;和/或将所述视频文件的截图与所述查找到的近似视频文件的截图进行比较。具体实现中,当查找到某一视频文件的近似视频文件或近似视频文件集合时,可以进一步将作为聚类分析目标的视频文件A的特征曲线和/或截图与其近似视频文件B的特征曲线和/或截图进行比较,例如将A与B的特征曲线上相对应的点计算方差,方差值越小则表示特征曲线越近似,进一步还可以考虑到视频时间偏移的问题可以将A或B的特征曲线进行正负m秒区间的平移后再计算二者方差值,在确定最匹配的偏移时间后再得到最小方差;和/或例如根据一定的截图选取规则(如亮度值等于所在视频段落的亮度均值)在从A与B中分别选取若干截图,比较两者对应时间点(同样可以考虑时间偏移的问题)的截图的亮度均值,分别选取到的截图的亮度均值越接近似则表示A或B的特征曲线越近似。
步骤S703,根据步骤S702比较结果获取所述视频文件与所述查找到的近似视频文件的近似度。所述近似度可以为两个视频文件的内容接近程度,可以采用百分比或近似等级来表示,例如同一部影片会有许多不同清晰度、不同格式、不同字幕、不同配音等多个版本,可以根据步骤S702的比较结果,可以得出这些不同相同内容但不同版本的视频文件的近似度非常高,并可以将这些近似视频文件聚在同一个聚类组别中。
本发明实施例通过基于视频图像的亮度均值表征视频文件的特征,从而实现了根据视频文件内容特性来对视频文件进行聚类,避免了现有技术中视频聚类需要大量抽取视频帧以及巨大的计算量,提升了视频聚类的效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (14)

1.一种视频文件的聚类方法,其特征在于,所述方法包括:
根据视频文件内图像的亮度均值,获取所述视频文件的亮度均值曲线;
根据所述亮度均值曲线中的极值点获取所述视频文件的特征曲线;
根据所述视频文件的特征曲线对所述视频文件进行聚类。
2.如权利要求1所述的视频文件的聚类方法,其特征在于,所述根据视频文件内图像的亮度均值,获取所述视频文件的亮度均值曲线包括:
根据所述视频文件的时长以及预设的抽取规则从所述视频文件中抽取出至少一个时间段的视频段落;
对所述抽取出的每个视频段落进行截图;
计算每个视频段落经过截图得到的所有图像的亮度均值;
分别获取每个视频段落的亮度均值曲线,并根据所述若干个视频段落的亮度均值曲线获取所述视频文件的亮度均值曲线。
3.如权利要求2所述的视频文件的聚类方法,其特征在于,所述对所述抽取出的每个视频段落进行截图包括:
在视频段落的时间轴中预设的采样时间点附近抽取一个或多个视频帧的视频图像作为截图。
4.如权利要求1所述的视频文件的聚类方法,其特征在于,所述根据所述视频文件的特征曲线对所述视频文件进行聚类包括:
将所述视频文件的特征曲线进行分成至少两个特征曲线段落;
根据所述每个特征曲线段落的均值以及所述特征曲线的总时长,对所述视频文件进行聚类。
5.如权利要求1所述的视频文件的聚类方法,其特征在于,所述根据所述视频文件的特征曲线对所述视频文件进行聚类为:
根据所述视频文件的特征曲线查找近似视频文件;和/或
根据所述视频文件的特征曲线建立所述视频文件的索引信息。
6.如权利要求5所述的视频文件的聚类方法,其特征在于,所述根据所述视频文件的特征曲线查找近似视频文件之后还包括:
将所述视频文件与所述查找到的近似视频文件进行比较;
根据所述视频文件与所述查找到的近似视频文件的比较结果确定所述视频文件与所述查找到的近似视频文件的近似度。
7.如权利要求6所述的视频文件的聚类方法,其特征在于,所述将所述视频文件与所述查找到的近似视频文件进行比较,包括:
将所述视频文件的特征曲线与所述查找到的近似视频文件的特征曲线进行比较;和/或
将所述视频文件的截图与所述查找到的近似视频文件的截图进行比较。
8.一种视频文件聚类装置,其特征在于,所述视频文件聚类装置包括:
亮度均值曲线获取模块,用于根据视频文件内图像的亮度均值,获取所述视频文件的亮度均值曲线;
特征曲线获取模块,用于根据所述亮度均值曲线中的极值点获取所述视频文件的特征曲线;
聚类模块,用于根据所述视频文件的特征曲线对所述视频文件进行聚类。
9.如权利要求8所述的视频文件聚类装置,其特征在于,所述亮度均值曲线获取模块包括:
视频段落抽取单元,用于根据所述视频文件的时长以及预设的抽取规则从所述视频文件中抽取出至少一个时间段的视频段落;
截图单元,用于对所述视频段落抽取单元抽出的每个视频段落进行截图;
亮度均值计算单元,用于计算每个视频段落经过截图得到的所有图像的亮度均值;
亮度均值曲线获取单元,用于分别获取每个视频段落的亮度均值曲线,并根据所述若干个视频段落的亮度均值曲线获取所述视频文件的亮度均值曲线。
10.如权利要求9所述的视频文件的聚类装置,其特征在于,所述截图单元对所述抽取出的每个视频段落进行截图包括:
在视频段落的时间轴中预设的采样时间点附近抽取一个或多个视频帧的视频图像作为截图。
11.如权利要求9所述的视频文件聚类装置,其特征在于,所述聚类模块包括:
特征曲线分段单元,用于将所述视频文件的特征曲线进行分成至少两个特征曲线段落;
聚类单元,用于根据所述每个特征曲线段落的均值以及所述特征曲线的总时长,对所述视频文件进行聚类。
12.如权利要求9所述的视频文件聚类装置,其特征在于,所述聚类模块包括:
近似查找单元,用于根据所述视频文件的特征曲线查找近似视频文件;和/或
索引建立单元,用于根据所述视频文件的特征曲线建立所述视频文件的索引信息。
13.如权利要求12所述的视频文件聚类装置,其特征在于,所述聚类模块还包括:
比较单元,用于将所述视频文件与所述近似查找单元查找到的近似视频文件进行比较;
近似度获取单元,用于所述比较单元的根据比较结果获取所述视频文件与所述查找到的近似视频文件的匹配结果。
14.如权利要求13所述的视频文件聚类装置,其特征在于,所述比较单元将所述视频文件与所述近似查找单元查找到的近似视频文件进行比较包括:
将所述视频文件的特征曲线和/或截图与所述查找到的近似视频文件的特征曲线和/或截图进行比较;和/或
将所述视频文件的截图与所述查找到的近似视频文件的截图进行比较。
CN201210299743.4A 2012-08-22 2012-08-22 一种视频文件的聚类方法和装置 Active CN103631786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210299743.4A CN103631786B (zh) 2012-08-22 2012-08-22 一种视频文件的聚类方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210299743.4A CN103631786B (zh) 2012-08-22 2012-08-22 一种视频文件的聚类方法和装置

Publications (2)

Publication Number Publication Date
CN103631786A true CN103631786A (zh) 2014-03-12
CN103631786B CN103631786B (zh) 2017-04-12

Family

ID=50212861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210299743.4A Active CN103631786B (zh) 2012-08-22 2012-08-22 一种视频文件的聚类方法和装置

Country Status (1)

Country Link
CN (1) CN103631786B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786857A (zh) * 2014-12-24 2016-07-20 Tcl集团股份有限公司 一种提高视频聚合效率的方法及系统
CN107707857A (zh) * 2017-10-19 2018-02-16 佛山市章扬科技有限公司 一种可分类录制视频的方法
CN110096605A (zh) * 2019-04-26 2019-08-06 北京迈格威科技有限公司 图像处理方法及装置、电子设备、存储介质
CN110543584A (zh) * 2018-05-29 2019-12-06 腾讯科技(深圳)有限公司 一种建立人脸索引的方法、装置、处理服务器及存储介质
CN111046839A (zh) * 2019-12-25 2020-04-21 中国建设银行股份有限公司 视频分割方法及装置
WO2021175040A1 (zh) * 2020-03-02 2021-09-10 Oppo广东移动通信有限公司 视频处理方法及相关装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110795597A (zh) * 2018-07-17 2020-02-14 上海智臻智能网络科技股份有限公司 视频关键字确定、视频检索方法及装置、存储介质、终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1325089A (zh) * 2000-04-17 2001-12-05 汤姆森多媒体公司 用于检测连续视频图象中镜头变化的方法
CN101359368A (zh) * 2008-09-09 2009-02-04 华为技术有限公司 一种视频图像聚类方法及系统
CN101389029A (zh) * 2008-10-21 2009-03-18 北京中星微电子有限公司 一种视频图像编码和检索的方法及装置
CN102175613A (zh) * 2011-01-26 2011-09-07 南京大学 基于图像亮度特征的ptz视频能见度检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1325089A (zh) * 2000-04-17 2001-12-05 汤姆森多媒体公司 用于检测连续视频图象中镜头变化的方法
CN101359368A (zh) * 2008-09-09 2009-02-04 华为技术有限公司 一种视频图像聚类方法及系统
CN101389029A (zh) * 2008-10-21 2009-03-18 北京中星微电子有限公司 一种视频图像编码和检索的方法及装置
CN102175613A (zh) * 2011-01-26 2011-09-07 南京大学 基于图像亮度特征的ptz视频能见度检测方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786857A (zh) * 2014-12-24 2016-07-20 Tcl集团股份有限公司 一种提高视频聚合效率的方法及系统
CN105786857B (zh) * 2014-12-24 2019-12-10 Tcl集团股份有限公司 一种提高视频聚合效率的方法及系统
CN107707857A (zh) * 2017-10-19 2018-02-16 佛山市章扬科技有限公司 一种可分类录制视频的方法
CN110543584A (zh) * 2018-05-29 2019-12-06 腾讯科技(深圳)有限公司 一种建立人脸索引的方法、装置、处理服务器及存储介质
CN110543584B (zh) * 2018-05-29 2023-05-05 腾讯科技(深圳)有限公司 一种建立人脸索引的方法、装置、处理服务器及存储介质
CN110096605A (zh) * 2019-04-26 2019-08-06 北京迈格威科技有限公司 图像处理方法及装置、电子设备、存储介质
CN110096605B (zh) * 2019-04-26 2021-06-04 北京迈格威科技有限公司 图像处理方法及装置、电子设备、存储介质
CN111046839A (zh) * 2019-12-25 2020-04-21 中国建设银行股份有限公司 视频分割方法及装置
CN111046839B (zh) * 2019-12-25 2023-05-19 中国建设银行股份有限公司 视频分割方法及装置
WO2021175040A1 (zh) * 2020-03-02 2021-09-10 Oppo广东移动通信有限公司 视频处理方法及相关装置

Also Published As

Publication number Publication date
CN103631786B (zh) 2017-04-12

Similar Documents

Publication Publication Date Title
CN103631786A (zh) 一种视频文件的聚类方法和装置
US20120148149A1 (en) Video key frame extraction using sparse representation
US8467610B2 (en) Video summarization using sparse basis function combination
CN110442747B (zh) 一种基于关键词的视频摘要生成方法
US8316301B2 (en) Apparatus, medium, and method segmenting video sequences based on topic
WO2020259510A1 (zh) 信息植入区域的检测方法、装置、电子设备及存储介质
US8467611B2 (en) Video key-frame extraction using bi-level sparsity
CN104881458B (zh) 一种网页主题的标注方法和装置
Poullot et al. Scalable mining of large video databases using copy detection
CN103761284A (zh) 一种视频检索方法和系统
EP2419861A1 (en) Key frames extraction for video content analysis
US20090204604A1 (en) Method and device for online dynamic semantic video compression and video indexing
CN102760169A (zh) 一种电视直播流中的广告段检测方法
CN110619284B (zh) 一种视频场景划分方法、装置、设备及介质
EP3989158A1 (en) Method, apparatus and device for video similarity detection
CN109684511A (zh) 一种视频剪辑方法、视频聚合方法、装置以及系统
US20150356353A1 (en) Method for identifying objects in an audiovisual document and corresponding device
CN108966042B (zh) 一种基于最短路径的视频摘要生成方法及装置
Baber et al. Video segmentation into scenes using entropy and SURF
CN110933520B (zh) 一种基于螺旋摘要的监控视频展示方法及存储介质
CN115035509A (zh) 一种视频检测方法、装置、电子设备和存储介质
CN106548118A (zh) 影院放映内容的识别检索方法及系统
CN110139134B (zh) 一种个性化弹幕智能推送方法与系统
Zhu et al. Automatic scene detection for advanced story retrieval
CN107748761A (zh) 一种视频摘要的关键帧提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant