WO2016086731A1

WO2016086731A1 - 多级并行关键帧云提取方法及系统

Info

Publication number: WO2016086731A1
Application number: PCT/CN2015/092349
Authority: WO
Inventors: 朱定局; 汤庸; 蒋运承
Original assignee: 华南师范大学
Priority date: 2014-12-05
Filing date: 2015-10-21
Publication date: 2016-06-09
Also published as: CN104463864B; CN104463864A

Abstract

本发明公开一种多级并行关键帧云提取方法及系统。所述关键帧云提取系统包括：视频输入模块，被构造为提取关键帧的视频输入接口；视频镜头分割模块，被构造为对输入的视频进行镜头分割，以便进行关键帧提取并行处理；多级并行关键帧云处理模块，被构造为对视频镜头通过多级并行策略，通过并行提取帧特征向量、并行聚类操作，生成各镜头关键帧组；关键帧输出模块，被构造为对各镜头所生成的关键帧组进行组合，最后输出整个视频的关键帧组。本发明的多级并行关键帧云提取方法及系统对处理大规模关键帧提取时具有较高的效率，同时，具有很好的可扩展性及稳定性，能够满足大规模关键帧提取的需求。

Description

多级并行关键帧云提取方法及系统

技术领域

本发明涉及关键帧云提取技术，更具体地讲，涉及一种多级并行关键帧云提取方法及多级并行关键帧云提取系统。

背景技术

视频关键帧指能代表镜头中的最重要的、有代表性的一幅或多幅图像。关键帧的提取能大大减少视频数据的处理量，受到研究者的广泛关注。

云计算能够无缝扩展到大规模的集群，且能够容忍部分节点的错误码，甚至很大部分节点发生失效也不会影响程序的正确运行，因此云计算具有较好的可扩展性及稳定性。

现有的关键帧提取的主要方法包括：基于镜头边界的方法、基于运动分析提取关键帧、基于图像信息提取关键帧、基于聚类提取关键帧等。大部分研究主要集中在视频关键帧的提取准确度方面，但视频关键帧的提取涉及许多数字运算，具视频帧数量多，串行视频关键帧抽取会耗时长，且单机处理能力有限，故有必要研究一种多级并行关键帧云提取方法和云提取系统。

发明内容

为了解决上述现有技术存在的问题，本发明的目的在于提供一种多级并行关键帧云提取系统，其中，所述多级并行关键帧云提取系统包括：视频输入模块，被构造为提取关键帧的视频输入接口；视频镜头分割模块，被构造为对输入的视频进行镜头分割，以便进行关键帧提取并行处理；多级并行关键帧云处理模块，被构造为对视频镜头通过多级并行策略，通过并行提取帧特征向量、并行聚类操作，生成各镜头关键帧组；关键帧输出模块，被构造为对各镜头所生成的关键帧组进行组合，最后输出整个视频的关键帧组。

本发明的另一目的还在于提供一种多级并行关键帧云提取方法，其中，所述多级并行关键帧云提取方法包括：接受需提取关键帧的视频；对所述视频进行镜头分割；对所述镜头进行多级并行关键帧云提取操作；对所提取的镜头关键帧组进行组合，输出最终视频关键帧组。

进一步地，所述多级并行关键帧云提取操作包含并行提取视频帧特征向量、根据视频帧特征向量并行聚类操作。

进一步地，所述镜头关键帧组组合，包含最终聚类产生视频最终关键帧。

进一步地，所述视频特征向量聚类操作可为k-means聚类、模糊C均值聚类或其他适合并行处理的图像特征聚类算法。

本发明的多级并行关键帧云提取方法及云提取系统能大大提高关键帧提取效率，同时具有很好的可扩展性及稳定性。

附图说明

图1是根据本发明的实施例的多级并行关键帧云提取系统示意图。

图2是根据本发明的实施例的多级并行关键帧云提取调度方法的流程图。

图3是根据本发明的实施例的多级并行关键帧云提取某实例操作图。

具体实施方式

现在对本发明的实施例进行详细的描述，其示例表示在附图中，其中，相同的标号始终表示相同部件。下面通过参照附图对实施例进行描述以解释本发明。在附图中，为了清晰起见，可以夸大层和区域的厚度。在下面的描述中，为了避免公知结构和/或功能的不必要的详细描述所导致的本发明构思的混淆，可省略公知结构和/或功能的不必要的详细描述。

参照图1，根据本发明的实施例的多级并行关键帧云提取系统包括：视频输入模块10，被构造为提取关键帧的视频输入接口；视频镜头分割模块20，被构造为对输入的视频进行镜头分割，以便进行关键帧提取并行处理；多级并行关键帧云处理模块30，被构造为对视频镜头通过多级并行策略，通过并行提取帧特征向量、并行聚类操作，生成各镜头关键帧组；关键帧输出模块40，被构造为对各镜头所生成的关键帧组进行组合，最后输出整个视频的关键帧组。

此外，多级并行关键帧云提取操作包含并行提取视频帧特征向量、根据视频帧特征向量并行聚类操作。

所述视频特征向量聚类操作可为k-means聚类、模糊C均值聚类或其他适合并行处理的图像特征聚类算法。

相对应地，本发明还提供了一种多级并行关键帧云提取方法，具体请参照图2，其是根据本发明的实施例的多级并行关键帧云提取方法的流程图。

参照图2，根据本发明的实施例的多级并行关键帧云提取方法包括：S1、接受需进行关键帧抽取的视频；S2、对视频进行视频镜头分割；S3、对镜头多级并行提取视频关键帧；S4、对镜头关键帧组进行组合输出。

在本实施例中，视频镜头分割后，可并行提取视频帧特征向量，之后可并行进行视频特征向量聚类操作，聚类可为k-means聚类、模糊C均值聚类或其他适合并行处理的图像特征聚类算法。下面将以并行提取视频帧向量处理及并行进行k-means聚类提取关键帧为例来对本发明进行说明。其中，K-means算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。而，模糊c-均值聚类算法fuzzy c-means algorithm(FCMA)作为无监督机器学习的主要技术之一，是用模糊理论对重要数据分析和建模的方法，建立了样本类属的不确定性描述，能比较客观地反映现实世界。

具体而言，参照图3，假如经过S1、S2步骤后，视频已分割成k个镜头(k≥1，k∈Z)。S3被构造为如下步骤：

S31：一级镜头map操作，此操作实现将分割的镜头分布到一级云计算平台节点中，此处所述的节点为双重角色，具体为：在第一级云平台中为Datanode及TaskTasker角色，在第二级云计算平台节点中为Namenode及Jobtracker角色。S301操作中，map函数构造输入数据记录的<key,value>为<镜头ID，视频镜头位置>，函数操作为：将镜头拷贝至第一级云计算平台节点中，以便进行第二级的map操作。

S32：对分发到节点上的镜头作第二级map操作预处理。将镜头分割成一组视频帧图像。镜头1包含视频帧数N₁、镜头2包含视频帧数N₂、镜头K包含视频帧数N_k。N₁、N₂、…N_k指各镜头N₁、N₂、…、N_k实际所包含的视频帧数(N₁、N₂、…N_k≥1,N₁、N₂、…N_k∈Z)。

S33：对各镜头并行进行第二级map操作。所述第二级map操作，在于将各帧分发到下一级云计算平台Tasktracker节点中，并行提取视频帧特征向量。所述S33操作中，map函数构造输入数据记录的<key,value>为<帧ID，帧图像位置>，函数操作为对视频帧进行特征向量提取，输出结果<key,value>对的形式为<帧ID，帧特征向量>。

S34：对S33操作所得到的结果进行第三级map操作。所述S34操作，在于对S33生成的<帧ID，帧特征向量>记录组并行进行云聚类操作。具体可描述为：完成每个数据帧到初始帧聚类中心的距离计算，并重新标记其属于的新聚类类别，其输入为S33所生成的<帧ID，帧特征向量>所有记录和上一轮迭代(或初始聚类)的聚类中心。每个map函数都读入聚类中心描述文件，map函数对输入的每个记录点计算其最近的类中心，并做新类别的标记。Map函数输入数据记录的<key,value>为<帧ID，帧特征向量>；输出中间结果<key,value>的形式为<帧所属类别，帧特征向量>。

上述镜头1、镜头2、…、镜头k的初始聚类中心个数被描述为m₁、m₂、…、m_k(m₁、m₂、…、m_k≥1，m₁、m₂、…、m_k∈Z)其值根据各镜头数据帧总数及一定的规则确定，在一定程度上，m₁、m₂、…、m_k也代表各镜头将产生的关键帧数。

上述初始聚类中心被构造为：根据m₁、m₂、…、m_k的值，分别从镜头1、镜头2、…、镜头k中随机抽取m₁、m₂、…、m_k个征特征向量作为镜头1、镜头2、…、镜头k的初始聚类中心。

上述数据帧到聚类中心的距离计算，可以描述为欧式距离、马氏距离等。

S34被构造的map函数可以描述为：

上述map阶段会进行shuffle操作，完成中间计算结果的分组排序。

S35：根据S34的输出，更新聚类中心，供下一轮map-reduce使用。所述S35操作，输入数据<key,value>对的形式为<聚类类别ID，{记录属性向量集}>；所有key相同的记录(即相同聚类中心类别ID的记录)将送给一个reduce任务。S35操作被描述为：累加key相同的点的个数和各记录分量的和，求各分量的均值，得到新的聚类中心。S35操作输出结果<key,value>对的形式为<聚类类别ID，均值向量>。S35操作过程可描述为：

S36：迭代过程。S36步骤可描述为：对S34的输出结果，判断该聚类是否已收敛。具体可描述为：比较上一轮map-reduce得到的聚类中心与本轮map-reduce聚类中心的距离。若距离小于给定阀值，则算法结束。否之，则将本轮的聚类中心替换上一轮的聚类中心，并启动新一轮的map-reduce操作。

S4：对镜头关键帧组进行组合输出。对S3步聚的最终各镜头视频关键帧组进行组合输出视频关键帧。

综上所述，根据本发明的实施例的多级并行关键帧云提取方法及云提取系统，具有多级并行操作的特点，能大大提高关键帧提取效率。同时，系统基于云计算平台，故具有较好的可扩展性和稳定性。

尽管已经参照其示例性实施例具体显示和描述了本发明，但是本领域的技术人员应该理解，在不脱离权利要求所限定的本发明的精神和范围的情况下，可以对其进行形式和细节上的各种改变。

Claims

一种多级并行关键帧云提取系统，其特征在于，其包括：

视频输入模块，被构造为提取关键帧的视频输入接口；

视频镜头分割模块，被构造为对输入的视频进行镜头分割，以便进行关键帧提取并行处理；多级并行关键帧云处理模块，被构造为对视频镜头通过多级并行策略，通过并行提取帧特征向量、并行聚类操作，生成镜头关键帧组；

关键帧输出模块，被构造为对镜头所生成的关键帧组进行组合，最后输出整个视频的关键帧组。
根据权利要求1所述的多级并行关键帧云提取系统，其特征在于，多级并行关键帧云处理模块进行并行提取视频帧特征向量、根据视频帧特征向量并行聚类操作。
根据权利要求2所述的多级并行关键帧云提取系统，其特征在于，所述多级并行关键帧云处理模块中的视频特征向量聚类操作可为k-means聚类、模糊C均值聚类或其他适合并行处理的图像特征聚类算法。
一种多级并行关键帧云提取方法，其特征在于，所述多级并行关键帧云提取方法包括如下步骤：

S1.接受需进行关键帧抽取的视频；

S2.对视频进行视频镜头分割；

S3.对镜头多级并行提取视频关键帧；

S4.对镜头关键帧组进行组合输出。
根据权利要求4所述的多级并行关键帧云提取方法，其特征在于，所述步骤s3包含并行提取视频帧特征向量操作，并根据视频帧特征向量并行聚类操作。
根据权利要求5所述的多级并行关键帧云提取方法，其特征在于，所述视频特征向量聚类操作为k-means聚类或模糊C均值聚类或其他适合并行处理的图像特征聚类算法中的一种或多种。