CN108509917A

CN108509917A - 基于镜头类相关性分析的视频场景分割方法和装置

Info

Publication number: CN108509917A
Application number: CN201810290282.1A
Authority: CN
Inventors: 吉长江
Original assignee: Beijing Yingpu Technology Co Ltd
Current assignee: Shanghai Yingpu Technology Co ltd
Priority date: 2018-03-30
Filing date: 2018-03-30
Publication date: 2018-09-07
Anticipated expiration: 2038-03-30
Also published as: CN108509917B

Abstract

本申请公开了一种基于镜头类相关性分析的视频场景分割方法和装置。该方法包括：镜头分割步骤：对视频进行镜头分割，得到镜头序列；镜头类计算步骤：计算所述镜头序列中各个镜头之间相似度，将镜头相似度超过第一阈值并且时间间隔不超过第二阈值的镜头分到同一镜头类中，生成镜头类序列；和场景分割步骤：根据所述镜头类序列中各个镜头类之间的相关系数对镜头类进行合并，得到分割后的视频场景。本申请提供的场景分割方法，基于镜头类相关性分析进行视频场景分割，解决了语义级别的视频场景分割问题。

Description

基于镜头类相关性分析的视频场景分割方法和装置

技术领域

本申请涉及图像处理领域，特别是涉及一种基于镜头类相关性分析的视频场景分割方法和装置。

背景技术

在视频中，镜头是指摄像机的一个连续拍摄过程，场景是指语义相关的一组镜头序列。场景检测的目的，是将视频分割为语义级别的片段。镜头的分割相对简单，可以借助于相邻帧的相似度判断；而场景的分割则更加复杂，这是由视频作品剪辑方法的多样性造成的。组成场景的镜头在视觉上可能存在巨大差别，但从语义上却表达着同一个主题。例如车内的人看着窗外不断变换的风景，而镜头在人和风景间来回的切换。再比如对话场景和访谈节目，镜头在对话者双方之间不断进行切换，但应该属于同一情景。现有技术采用视频帧之间的相关性对镜头进行分割，因而经常将同一场景下不断切换的帧分到不同的场景中。由于无法实现语义级别的视频场景分割，这影响了后续数据处理和分析的准确性。

发明内容

本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。

根据本申请的一个方面，提供了一种视频场景分割方法，包括：

镜头分割步骤：对视频进行镜头分割，得到镜头序列；

镜头类计算步骤：计算所述镜头序列中各个镜头之间相似度，将镜头相似度超过第一阈值并且时间间隔不超过第二阈值的镜头分到同一镜头类中，生成镜头类序列；和

场景分割步骤：根据所述镜头类序列中各个镜头类之间的相关系数对镜头类进行合并，得到分割后的视频场景。

本申请提供的场景分割方法，基于镜头类相关性分析进行视频场景分割，解决了语义级别的视频场景分割问题。

可选地，所述镜头分割步骤包括：

镜头划分步骤：对于视频中的每一帧，计算该帧与该帧的前一帧的帧间差，在所述帧间差小于第三阈值，并且帧间差累加和不超过第四阈值的情况下，则将该帧与前一帧划分为同一个镜头，其中所述帧间差累加和是所述前一帧所属镜头的起始帧到该帧之间相邻两帧的帧间差之和；和

镜头序列生成步骤：将镜头按照时间顺序生成该视频的镜头序列。

可选地，所述镜头类计算步骤包括：

镜头相似度计算步骤：对于镜头序列中的每一个镜头，计算该镜头中的每一帧与该镜头的前一个镜头中的每一帧之间相似度的均值，得到两个镜头的相似度；

镜头分类步骤：在两个镜头的相似度超过第一阈值并且时间间隔不超过第二阈值的情况下，将该镜头分到所述前一个镜头所属的镜头类中；和

镜头类序列生成步骤：将镜头类按照时间顺序生成视频的镜头类序列。

可选地，所述场景分割步骤包括：

镜头类相关系数计算步骤：计算两个镜头类之间的相关系数，得到相关系数矩阵；和

镜头类合并步骤：对于所述镜头类序列中的每一个镜头类，根据所述相关系数矩阵，在所述镜头类序列中的镜头类和该镜头类的前一个镜头类的相关系数不超过第五阈值的情况下，将该镜头类合并到所述前一个镜头类中，得到分割后的视频场景。

根据本申请的另一个方面，还提供了一种视频场景分割装置，包括：

镜头分割模块，其配置成用于对视频进行镜头分割，得到镜头序列；

镜头类计算模块，其配置成用于计算所述镜头序列中各个镜头之间相似度，将镜头相似度超过第一阈值并且时间间隔不超过第二阈值的镜头分到同一镜头类中，生成镜头类序列；和

场景分割模块，其配置成用于根据所述镜头类序列中各个镜头类之间的相关系数对镜头类进行合并，得到分割后的视频场景。

本申请提供的场景分割装置解决了语义级别的视频场景分割问题。

可选地，所述镜头分割模块包括：

镜头划分模块，其配置成对于视频中的每一帧，计算该帧与该帧的前一帧的帧间差，在所述帧间差小于第三阈值，并且帧间差累加和不超过第四阈值的情况下，则将该帧与前一帧划分为同一个镜头，其中所述帧间差累加和是所述前一帧所属镜头的起始帧到该帧之间相邻两帧的帧间差之和；和

镜头序列生成模块，其配置成用于将镜头按照时间顺序生成该视频的镜头序列。

可选地，所述镜头类计算模块包括：

镜头相似度计算模块，其配置成用于对于镜头序列中的每一个镜头，计算该镜头中的每一帧与该镜头的前一个镜头中的每一帧之间相似度的均值，得到两个镜头的相似度；

镜头分类模块，其配置成用于在两个镜头的相似度超过第一阈值并且时间间隔不超过第二阈值的情况下，将该镜头分到所述前一个镜头所属的镜头类中；和

镜头类序列生成模块，其配置成用于将镜头类按照时间顺序生成视频的镜头类序列。

可选地，所述场景分割模块包括：

镜头类相关系数计算模块，其配置成用于计算两个镜头类之间的相关系数，得到相关系数矩阵；和

镜头类合并模块，其配置成对于所述镜头类序列中的每一个镜头类，根据所述相关系数矩阵，在所述镜头类序列中的镜头类和该镜头类的前一个镜头类的相关系数不超过第五阈值的情况下，将该镜头类合并到所述前一个镜头类中，得到分割后的视频场景。

根据本申请的另一个方面，还一种计算机设备，包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如上所述的方法。

根据本申请的另一个方面，还一种计算机可读存储介质，优选为非易失性可读存储介质，其内存储有计算机程序，所述计算机程序在由处理器执行时实现如上述的方法。

根据下文结合附图对本申请的具体实施例的详细描述，本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。

附图说明

后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解，这些附图未必是按比例绘制的。附图中：

图1是根据本申请的视频场景分割方法的一个实施例的流程图；

图2是本申请的方法的镜头分割步骤的一个实施例的流程图；

图3是本申请的方法的镜头类计算步骤的一个实施例的流程图；

图4是本申请的方法的场景分割步骤的一个实施例的流程图；

图5是根据本申请的视频场景分割装置的一个实施例的框图；

图6是本申请的装置的镜头分割模块的一个实施例的框图；

图7是本申请的装置的镜头类计算模块的一个实施例的框图；

图8是本申请的装置的场景分割模块的一个实施例的框图；

图9是本申请的计算机设备的一个实施例的框图；

图10是本申请的计算机可读存储介质的一个实施例的框图。

具体实施方式

根据本申请的一个方面，提供了一种视频场景分割方法。图1是根据本申请的视频场景分割方法的一个实施例的流程图。该方法包括：

该方法包括S1镜头分割步骤：对视频进行镜头分割，得到镜头序列。

该方法还包括S2镜头类计算步骤：计算所述镜头序列中各个镜头之间相似度，将镜头相似度超过第一阈值并且时间间隔不超过第二阈值的镜头分到同一镜头类中，生成镜头类序列。

该方法还包括S3场景分割步骤：根据所述镜头类序列中各个镜头类之间的相关系数对镜头类进行合并，得到分割后的视频场景。

本申请提供的场景分割方法，是基于镜头类相关性分析进行视频场景分割的方法，该方法解决了语义级别的视频场景分割问题。

在S1镜头分割步骤：对视频进行镜头分割，得到镜头序列中，对于一段视频，先对该视频进行镜头分割，得到镜头序列S。S＝s₁s₂...s_i...s_n-1s_n,i＝1,2,...,n。其中，s_i表示第i个镜头。n表示镜头的数量。镜头分割可以采用多种方法实现。

图2是本申请的方法的镜头分割步骤的一个实施例的流程图。在一个可选实施方案中，所述S1镜头分割步骤包括：

S11帧间差计算步骤：对于视频中的每一帧，计算该帧与该帧的前一帧的帧间差，在所述帧间差小于第三阈值，并且帧间差累加和不超过第四阈值的情况下，则将该帧与前一帧划分为同一个镜头，其中所述帧间差累加和是所述前一帧所属镜头的起始帧到该帧之间相邻两帧的帧间差之和；和

S12镜头序列生成步骤：将镜头按照时间顺序生成该视频的镜头序列。

该镜头分割方法，不但考虑了帧的数值的关系还考虑了视频时间的因素，能够快速地对镜头进行分割，并且能够得到准确的分割结果。

例如，帧f₂和帧f₃是视频中的两个相邻的帧。将f₃与f₂的对应位置的像素点的RGB(红绿蓝)分量分别作差，计算所有像素点的差值的总和，得到相邻两帧的帧间差。如果该帧间差小于第三阈值，例如，低阈值T1，并且累计帧间差尚未达到第四阈值，例如，高阈值T2，则认为此相邻帧属于同一镜头；否则属于两个不同的镜头。其中，累计帧间差可以通过将多个帧间差进行累加得到。例如，当帧f₁和帧f₂属于同一镜头，并且帧f₁和帧f₂之间的帧间差与帧f₂和帧f₃之间的帧间差相加小于T2，则认为帧f₃与帧f₁属于一个镜头。

可以理解的是，除了RGB颜色空间外，还可以采用其他颜色空间中的数值进行镜头分割。例如，颜色空间还包括：CMY(三基色)、HSV(Hue,Saturation,Value，色调、饱和度、亮度)、HIS(Hue,Saturation,Intensity，色调、饱和度、强度)。

对于S2镜头类计算步骤：计算所述镜头序列中各个镜头之间相似度，将镜头相似度超过第一阈值并且时间间隔不超过第二阈值的镜头分到同一镜头类中，生成镜头类序列，镜头类是处于镜头和场景中的一个中间概念，其粒度比镜头更大，比场景更小。通过镜头类计算步骤，能够得到具有内容相似性、并且在时间上相接近的镜头的集合，降低为后续数据处理的数量和难度。值得注意的是，从时间序列上看，形成镜头类的镜头也可能不集中或者不连续。例如，在“车内的人看着窗外不断变换的风景”的视频中，通过该步骤能够将车内的人的镜头划分为一个镜头类，而窗外的风景镜头划分为另一个镜头类。

图3是本申请的方法的镜头类计算步骤的一个实施例的流程图。在一个可选实施方案中，所述S2镜头类计算步骤包括：

S21镜头相似度计算步骤：对于镜头序列中的每一个镜头，计算该镜头中的每一帧与该镜头的前一个镜头中的每一帧之间相似度的均值，得到两个镜头的相似度；

S22镜头分类步骤：在两个镜头的相似度超过第一阈值并且时间间隔不超过第二阈值的情况下，将该镜头分到所述前一个镜头所属的镜头类中；和

S23镜头类序列生成步骤：将镜头类按照时间顺序生成视频的镜头类序列。

在S21镜头相似度计算步骤中，两个镜头间的相似度可以是每个镜头中所有视频帧两两之间相似度的均值。镜头之间的相似度可以采用下式计算：

其中，Sim(s_m,s_n)表示镜头s_m和镜头s_n之间的镜头相似度，f_i表示镜头s_m中的帧，f_j表示镜头s_n中的帧，l和k分别表示镜头s_m和镜头s_n中帧的数量。SimFF表示帧间相似度。

该步骤充分利用了各个镜头之间所有帧的相似程度，得到的相似度结果能够准确地标注两个镜头之间的关联关系。

可选地，帧间相似度可以用HSV颜色空间中的帧间相似度表示，可以用如下公式计算：

其中，l表示归一化的级数，bins是HSV直方图的bin(盒子)的数目，表示归一化的总级数，Hf_i(l)和Hf_j(l)分别表示帧f_i和帧f_j的第l级对应的像素点数量。

对于HSV颜色空间，可以对所述帧的HSV数据进行归一化处理，构建归一化后HSV直方图，该直方图的横轴表示归一化的级数，纵轴表示所述级数对应的像素点数量。归一化处理时，可选地，把H、S、V分别分为8份、3份、3份，即8-3-3模式，此时级数取值为8+3+3＝14。确定级数并进行归一化处理的原因是考虑到人类的视觉分辨能力和计算机的处理速度，因此按照颜色的不同范围和主观颜色感知进行间隔不等的归一化处理，即量化处理。

采用归一化的HSV直方图方法计算帧间相似度，由于对数据进行了归一化处理，因此能够提高运算速度和准确度。

在S22镜头分类步骤中，根据镜头之间的相似度生成镜头类集合SC＝{sc₁,sc₂,...,sc_p}，P表示集合中镜头类的数量。可选地，可以采用如下计算方法：在两个镜头的相似度超过第一阈值T'并且时间间隔不超过第二阈值T_t的情况下，将该镜头分到所述前一个镜头所属的镜头类中。在不满足这两个条件的情况下，认为两个镜头属于不同的镜头类。

S22镜头分类步骤包括以下步骤：

S221：对镜头类集合和镜头指针进行初始化。初始化镜头类集合：S＝s₁s₂...s_i...s_n-1s_n，SC＝{}，将当前镜头指针index的初始值设置为1。

S222：如果当前镜头指针index大于n，则镜头分类步骤停止，否则采用下面的公式将s_index与s_index之后的每一个镜头s_i(i＝index+1,index+2,...,n)分别进行相似度的比较，

其中T'为第一阈值，T_t为第二阈值；f表示从镜头序列S中的镜头s到镜头类集合SC的映射，f:S→SC，f()表示类别；如果f(s_i)＝f(s_index)，则将f(s_i)加入镜头类集合SC中，同时，将s_index后面所有与s_index属于同一类别的镜头从镜头序列中移除，即S＝S-{s_i}。

S223：将镜头指针index的值加1，重复步骤S222。

例如，在S＝s₁s₂...s_i...s_n-1s_n中，当index＝1时，将s₁与s₂、s₃……s_n逐一进行比较，假设，s₂至s₅均满足条件，能够与s₁划分为同一个镜头类，则将s₁至s₅的镜头类别写入镜头类集合SC中，并且将s₂至s₅从镜头序列S中移除，当指针index指向下一个镜头时，指向的是s₆，再重复上述步骤。

该方法将已经计算过的镜头从镜头序列中移除，能够避免重复计算，极大地缩小计算时间，提高了处理效率。

该步骤考虑了帧间相似度和时间两个因素，通过遍历的方法对每一个镜头进行了分类，运算速度快，分类结果准确。

对于S3场景分割步骤：根据所述镜头类序列中各个镜头类之间的相关系数对镜头类进行合并，得到分割后的视频场景。图4是本申请的方法的场景分割步骤的一个实施例的流程图。在一个可选实施方案中，所述S3场景分割步骤包括：

S31镜头类相关系数计算步骤：计算两个镜头类之间的相关系数，得到相关系数矩阵；

S32镜头类合并步骤：对于所述镜头类序列中的每一个镜头类，根据所述相关系数矩阵，在所述镜头类序列中的镜头类和该镜头类的前一个镜头类的相关系数不超过第五阈值的情况下，将该镜头类合并到所述前一个镜头类中，得到分割后的视频场景。

两个镜头类之间的相关系数可以通过如下公式计算：

其中，Cor(SC_x,SC_y)表示两个镜头类SC_x、SC_y之间的相关系数，between(SC_x|SC_y)表示镜头序列中两个相邻的镜头类SC_x之间的属于镜头类SC_y的镜头数目，Count(SC_x)表示镜头序列中属于镜头类SC_x的镜头数目。

通过计算两个镜头类之间的相关系数，能够对两个镜头类之间相互交错的关系进行定量分析；将相关性强的镜头类进行合并，就可以完成对视频的语义级别的场景分割任务。相关性系数所反映的不但包括内容的“相似性”，也反映了内容在时间序列上交错关系的有无、交错程度的强弱。

例如，根据步骤S1得到镜头序列如下：S＝s₁s₂...s₁₉s₂₀，根据步骤221定义的映射，得到：

f(s₁)＝f(s₂)＝f(s₃)＝f(s₄)＝f(s₅)＝SC₁，

f(s₆)＝f(s₈)＝f(s₁₀)＝f(s₁₁)＝SC₂，

f(s₇)＝f(s₉)＝f(s₁₂)＝SC₃，

f(s₁₃)＝f(s₁₄)＝f(s₁₅)＝f(s₁₆)＝SC₄，

f(s₁₇)＝f(s₁₈)＝f(s₁₉)＝SC₅，

f(s₂₀)＝SC₆。

则可以将镜头序列按照镜头类的所属关系重写，得到镜头类序列：

SC＝{SC₁SC₁SC₁SC₁SC₁SC₂SC₃SC₁SC₃SC₂SC₂SC₃SC₄SC₄SC₄SC₄SC₅SC₅SC₅SC₆}；

根据步骤S32的相关系数公式，可以计算出这6个镜头类之间彼此的相关系数矩阵P，其中矩阵中的元素Cor(SC_x,SC_y)表示镜头类的相关系数。

按照时间轴顺序，对镜头类序列中的元素进行合并，将相关系数大于第五阈值Tc的镜头类合并为一个场景。

例如，若设T_c＝0，则合并过程及结果如下：

SC₁SC₁SC₁SC₁SC₁SC₂SC₃SC₁SC₃SC₂SC₂SC₃SC₄SC₄SC₄SC₄SC₅SC₅SC₅SC₆

↓

SC₁SC₄SC₅SC₆

在选择该阈值的情况下，最终得到4个场景片段的分割结果，该分割结果是顺序进展的。

例如，若设T_c＝0.5，则合并过程及结果如下：

↓

SC₁SC₂SC₁SC₂SC₄SC₅SC₆

在选择该阈值的情况下，最终得到7个场景片段的分割结果，该分割结果是交错进展。

其中，第五阈值是可以根据需要设定的，通过设置不同的阈值，可以得到不同粒度的分割结果。

通过定义镜头类之间的相关系数，能够通过有限次的运算，快速对镜头类进行合并，得到语义级别的分割结果，避免得到过于零散的分割结果。

根据本申请的另一个方面，还提供了一种视频场景分割装置。图5是根据本申请的视频场景分割装置的一个实施例的框图。

该装置包括镜头分割模块1，其配置成用于对视频进行镜头分割，得到镜头序列。

该装置还包括镜头类计算模块2，其配置成用于计算所述镜头序列中各个镜头之间相似度，将镜头相似度超过第一阈值并且时间间隔不超过第二阈值的镜头分到同一镜头类中，生成镜头类序列。

该装置还包括场景分割模块3，其配置成用于根据所述镜头类序列中各个镜头类之间的相关系数对镜头类进行合并，得到分割后的视频场景。

本申请提供的场景分割装置，是基于镜头类相关性分析进行视频场景分割的方法，该方法解决了语义级别的视频场景分割问题。

图6是本申请的装置的镜头分割模块的一个实施例的框图。在一个可选实施方案中，所述镜头分割模块1包括：

镜头划分模块11，其配置成用于对于视频中的每一帧，计算该帧与该帧的前一帧的帧间差，在所述帧间差小于第三阈值，并且帧间差累加和不超过第四阈值的情况下，则将该帧与前一帧划分为同一个镜头，其中所述帧间差累加和是所述前一帧所属镜头的起始帧到该帧之间相邻两帧的帧间差之和；和

镜头序列生成模块12，其配置成用于将镜头按照时间顺序生成该视频的镜头序列。

该镜头分割模块不但考虑了帧的数值的关系还考虑了视频时间的因素，能够快速地对镜头进行分割，并且能够得到准确的分割结果。

图7是本申请的装置的镜头类计算模块的一个实施例的框图。在一个可选实施方案中，所述镜头类计算模块2包括：

镜头相似度计算模块21，其配置成用于对于镜头序列中的每一个镜头，计算该镜头中的每一帧与该镜头的前一个镜头中的每一帧之间相似度的均值，得到两个镜头的相似度；

镜头分类模块22，其配置成用于在两个镜头的相似度超过第一阈值并且时间间隔不超过第二阈值的情况下，将该镜头分到所述前一个镜头所属的镜头类中；和

镜头类序列生成模块23，其配置成用于将镜头类按照时间顺序生成视频的镜头类序列。

该模块充分利用了各个镜头之间所有帧的相似程度，得到的相似度结果能够准确地标注两个镜头之间的关联关系。

其中，可选地，帧间相似度可以用HSV颜色空间中的帧间相似度表示。

镜头分类模块22包括：

初始化模块221，其配置成用于对镜头类集合和镜头指针进行初始化；

类别判断模块222，其配置成如果当前镜头指针index大于等于n，则镜头分类步骤停止，若否，则遍历从当前镜头指针index之后所有镜头s_i(i＝index+1,...,n)：对于每一个s_i，判断s_i和s_index这两个镜头是否属于同一个类别；如果f(s_i)＝f(s_index)，则将f(s_i)加入镜头类集合SC中，同时，将s_index后面所有与s_index属于同一类别的镜头从镜头序列中移除。

循环模块223，其配置成用于将镜头指针index的值加1，重复类别判断模块222。

图8是本申请的装置的场景分割模块的一个实施例的框图。可选地，所述场景分割模块3包括：

镜头类相关系数计算模块31，其配置成用于计算两个镜头类之间的相关系数，得到相关系数矩阵；和

镜头类合并模块32，其配置成用于对于所述镜头类序列中的每一个镜头类，根据所述相关系数矩阵，在所述镜头类序列中的镜头类和该镜头类的前一个镜头类的相关系数不超过第五阈值的情况下，将该镜头类合并到所述前一个镜头类中，得到分割后的视频场景。

两个镜头类之间的相关系数可以通过上面方法中的提及的公式进行计算。通过计算两个镜头类之间的相关系数，能够对两个镜头类之间相互交错的关系进行定量分析；将相关性强的镜头类进行合并，就可以完成对视频的语义级别的场景分割任务。

如图9所示，本申请实施例还提供了一种计算机设备，包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序，其中，所述处理器执行所述计算机程序时实现上述方法中的任意一个。该计算机程序被图9中处理器执行。

如图10所示，本申请实施例还提供了一种计算机可读存储介质，优选为非易失性可读存储介质，其内存储有计算机程序，所述计算机程序在由处理器执行时实现上述方法中的任意一个。

本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时，使得计算机执行上述方法中的任意一个。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

专业人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成，所述的程序可以存储于计算机可读存储介质中，所述存储介质是非短暂性(英文：non-transitory)介质，例如随机存取存储器，只读存储器，快闪存储器，硬盘，固态硬盘，磁带(英文：magnetic tape)，软盘(英文：floppy disk)，光盘(英文：optical disc)及其任意组合。

以上所述，仅为本申请较佳的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种视频场景分割方法，包括：

镜头分割步骤：对视频进行镜头分割，得到镜头序列；

2.根据权利要求1所述的方法，其特征在于，所述镜头分割步骤包括：

3.根据权利要求1或2所述的方法，其特征在于，所述镜头类计算步骤包括：

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述场景分割步骤包括：

5.一种视频场景分割装置，包括：

6.根据权利要求5所述的装置，其特征在于，所述镜头分割模块包括：

7.根据权利要求5或6所述的装置，其特征在于，所述镜头类计算模块包括：

8.根据权利要求5至7中任一项所述的装置，其特征在于，所述场景分割模块包括：

9.一种计算机设备，包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的方法。

10.一种计算机可读存储介质，优选为非易失性可读存储介质，其内存储有计算机程序，所述计算机程序在由处理器执行时实现如权利要求1至4中任一项所述的方法。