CN106960211B - 关键帧获取方法及装置 - Google Patents

关键帧获取方法及装置 Download PDF

Info

Publication number
CN106960211B
CN106960211B CN201610014064.6A CN201610014064A CN106960211B CN 106960211 B CN106960211 B CN 106960211B CN 201610014064 A CN201610014064 A CN 201610014064A CN 106960211 B CN106960211 B CN 106960211B
Authority
CN
China
Prior art keywords
frame
color
video
video frame
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610014064.6A
Other languages
English (en)
Other versions
CN106960211A (zh
Inventor
张默
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Moshanghua Technology Co ltd
Original Assignee
Beijing Moshanghua Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Moshanghua Technology Co ltd filed Critical Beijing Moshanghua Technology Co ltd
Priority to CN201610014064.6A priority Critical patent/CN106960211B/zh
Publication of CN106960211A publication Critical patent/CN106960211A/zh
Application granted granted Critical
Publication of CN106960211B publication Critical patent/CN106960211B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

本申请公开了一种关键帧获取方法及装置,所述方法包括:针对任意一帧视频帧以及与其相邻的前一帧视频帧,统计每一帧视频帧中每一种颜色的不同颜色值的颜色值分布数据;根据同一种颜色的不同颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度;在所述相似度小于第一阈值时,确定所述任意一帧视频帧为候选帧;计算所述候选帧的颜色丰富度,所述颜色丰富度表示所述候选帧的色彩分布情况;获取颜色丰富度大于第二阈值的候选帧为关键帧。本申请实施例通用于任意视频数据的关键帧获取,提高了关键帧获取的有效性。

Description

关键帧获取方法及装置
技术领域
本申请属于视频处理技术领域,具体地说,涉及一种关键帧获取方法及装置。
背景技术
关键帧是指视频数据中能够代表该视频数据关键信息的一帧视频帧。由于视频数据大部分拍摄的是连续场景,相邻视频帧之间具有较大的相关性,导致视频数据中可能存在很多冗余信息,因此在涉及视频处理的不同应用场景中,通常需要首先获取视频数据中的关键帧,以获取视频数据的关键信息。
现有技术中的一种关键帧的获取方法,是在解码视频文件的同时,获取每一帧视频的类型标签,类型标签为该视频帧在解码时是否需要依赖其他视频帧,如果不需要依赖,则定义为关键帧。
但是,现有技术中的这种方式虽然可以有效提取关键帧,但是只能应用于离线视频数据,通用性较差。
发明内容
有鉴于此,本申请所要解决的技术问题是提供了关键帧获取方法和装置,用以解决现有技术关键帧获取方式通用性较差,无法实现关键有效获取的技术问题。
为了解决上述技术问题,本申请公开了一种关键帧获取方法,所述方法包括:
针对任意一帧视频帧以及与其相邻的前一帧视频帧,统计每一帧视频帧中每一种颜色的不同颜色值的颜色值分布数据;
根据同一种颜色的不同颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度;
在所述相似度小于第一阈值时,确定所述任意一帧视频帧为候选帧;
计算所述候选帧的颜色丰富度,所述颜色丰富度表示所述候选帧的色彩分布情况;
获取颜色丰富度大于第二阈值的候选帧为关键帧。
本申请公开了一种关键帧获取装置,所述装置包括:
颜色特征获取模块,用于针对任意一帧视频帧以及与其相邻的前一帧视频帧,统计每一帧视频帧中的每一种颜色的不同颜色值的颜色值分布数据;
相似度计算模块,用于根据同一种颜色的不同颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度;
候选帧获取模块,用于在所述相似度小于第一阈值时,确定所述任意一帧视频帧为候选帧;
信息计算模块,用于计算所述候选帧的颜色丰富度,所述颜色丰富度表示所述候选帧的信息量;
关键帧获取模块,用于获取颜色丰富度大于第二阈值的候选帧为关键帧。
与现有技术相比,本申请可以获得包括以下技术效果:
通过将任意一帧视频帧与前一帧视频帧进行相似度判断,确定任意一种视频帧是否可以作为候选帧,对候选帧进行颜色丰富度判断,即可以候选帧是否可以为关键帧,本申请技术方案可以适用于不同视频数据的关键帧获取,提高了通用性,且通过颜色统计即可以实现相似度的判断以及关键帧的判断,复杂度低、效率高,实现了关键帧快速有效的获取。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例的一种关键帧获取方法一个实施例的流程图;
图2是本申请实施例的一种关键帧获取方法又一个实施例的流程图;
图3是本申请实施例的一种关键帧获取装置一个实施例的结构示意图;
图4是本申请实施例的一种关键帧获取装置又一个实施例的结构示意图。
具体实施方式
以下将配合附图及实施例来详细说明本申请的实施方式,藉此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
随着网络的发展,越来越多的视频开始出现在网络上,无论是电影、电视剧、娱乐节目,或者是用户自己制作的小视频,都在以前所未有的速度增长。视频中包含大量信息,如视频的拍摄场景,视频中出现的明星、服饰等,都可以作为与电商相关的应用开发,如服饰自动检索推荐等。但是,由于视频大部分拍摄的是连续场景,前后帧之间具有较大的相关性,因此,一段视频中有很多冗余信息。而通过获取视频关键帧,可以有效的提取视频中关键信息,如场景切换,画面突变等。通过获取视频关键帧一方可以有效降低每一帧之间的冗余性,从而为后续处理提供高质量的视频帧。
现有的关键帧获取方式是在解码视频文件的同时进行提取,只适用于离线视频,无法对视频数据进行关键帧的实时获取,特征是对于网络直播视频数据等需要实时处理的视频数据,因此通用性较差,无法有效实现关键帧获取。
为了解决这一技术问题,在本申请实施例中,针对任意一帧视频帧,通过将其与其相邻的前一帧视频帧进行比较,根据统计的颜色值分布数据,计算相邻两帧视频帧的相似度,从而可以确定任意一帧视频帧如果与其相邻的前一帧视频帧的相似度小于第一阈值,则即可以作为候选帧;对于候选帧,可以通过判断其颜色丰富度,选择颜色丰富度大于第二阈值的候选帧作为最终的关键帧,本申请实施例通过提取视频帧的颜色特征,与前一帧视频帧进行比较,即可以实现关键帧的判断,可以实现实时处理,因此不仅适用于离线视频数据,提高了通用性,使得可以实现关键的有效获取。
且颜色值分布数据以及颜色丰富度均为视频帧的全局特征,鲁棒性高,统计时间短、统计方式简单,可以降低关键帧提取的复杂度,使得能够快速有效的实现关键帧的获取。
下面结合附图对本申请技术方案进行详细描述。
图1为本申请提供的一种关键帧获取方法一个实施例的流程图,该方法可以包括以下几个步骤:
101:针对任意一帧视频帧以及与其相邻的前一帧视频帧,统计每一帧视频帧中每一种颜色的不同颜色值的颜色值分布数据。
颜色值分布数据可以包括同一种颜色的不同颜色值的出现次数或者不同颜色值的出现频率,用以表示视频帧的颜色特征。
任一颜色值出现频率具体是指任一颜色值出现次数与视频帧总像素点数的比值,颜色值分布数据为不同颜色值出现频率时,该颜色值分布数据可以具体是指颜色直方图。
其中,本申请实施例中,对于视频帧为彩色图像时,由于不同色彩是由三原色叠加而成,都可以用三原色进行表示,因此颜色颜色值分布数据包括每一种原色,即R(red,红色)、G(green,绿色)或B(blue,蓝色)对应的颜色值分布数据。
对于视频帧为灰度图像,也即黑白图像时,其颜色值分布数据即为灰度值分布数据。
颜色值的取值范围为0~255,也即统计的是每一种颜色的256个颜色值的分布数据。
102:根据同一种颜色的不同颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度。
对于相邻两帧视频帧,针对同一种颜色在相邻两帧视频帧的不同颜色值分布数据,可以获得该相邻两帧视频帧的相似度。
相似度的计算可以有多种可能的实现方式,在下面实施例中会详细进行介绍。
103:在所述相似度小于第一阈值时,确定所述任意一帧视频帧为候选帧。
如果相似度小于第一阈值,表明该视频帧与其相邻的前一帧视频帧相似度较小,则该视频帧可能为关键帧,因此可以确定该视频帧为关键帧的候选帧。
而如果相似度大于第一阈值,表明该视频帧与其相邻的前一帧视频帧相似,则该视频帧不会是关键帧,即舍弃该视频帧。
104:计算所述候选帧的颜色丰富度,所述颜色丰富度表示所述候选帧的色彩分布情况。
105:获取颜色丰富度大于第二阈值的候选帧为关键帧。
对于获得的候选帧,通过计算其颜色丰富度,选择颜色丰富或者亮度丰富的候选帧作为关键帧。
颜色丰富度可以用于表示候选帧的色彩分布情况,如果颜色丰富度大于第二阈值,表明候选帧色彩丰富,不会出现较大的单一颜色,包含信息量较多,因此即为关键帧。
本申请实施例中,在获得每一个候选帧之后,即可以计算其颜色丰富度,如果其颜色丰富度大于第二阈值,则该候选帧即为关键帧。
当然,作为又一个实施例,对于任意一个视频帧均可以按照步骤101~步骤103的操作,来确定是否为候选帧。因此对一段视频数据可以获得多个候选帧,对该多个候选帧可以分别计算颜色丰富度,再选择颜色丰富度大于第二阈值的候选帧作为关键帧。
颜色丰富度可以有多种可能实现方式,在下面实施例中会详细进行介绍。
在本申请实施例中,对于任意一帧视频帧,可以与其相邻的前一帧视频帧,通过颜色值分布数据进行比较,以确定该任意一帧视频帧是否可以作为关键帧的候选帧,从而再对候选帧进行颜色丰富度的判断,即可以确定候选帧是否可以作为关键帧,使得不仅适用于对离线视频数据进行关键帧的获取,可以对任一视频数据进行实时处理,提高了关键帧获取的有效性和通用性。
且申请实施例中,利用颜色值分布数据的颜色特征进行相邻两帧视频帧的相似度判断,仅对颜色值进行统计即可,复杂度低,提取速度快,且该颜色值分布数据为视频帧的全局特征,视频图像中主体的小幅度变化不会引起全局特征的变化,因此,鲁棒性更高。
其中,在视频帧包括多种颜色的颜色值分布数据时,作为又一个实施例,根据同一种颜色分别的颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度可以具体是:
根据同一种颜色的颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧颜色值分布数据对应同一种颜色的相似系数;
将所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应不同种颜色的颜色值分布数据相似系数的平均值、最大值或最小值,作为所述所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度。
当然还可以选择不同种颜色值分布数据的相似系数的和值等,作为相似度,本申请并不对此进行限定,只要依据不同颜色的颜色值分布数据的相交系数获得的相似度,均应在本申请的保护范围内。
在视频帧为灰度图像时,视频帧只有一种灰度对应的颜色值分布数据,也即灰度值分布数据,因此相邻两帧视频帧的对应灰度的相似系数,即作为相邻两帧视频帧的相似度。
在颜色值分布数据统计的是每一个颜色值出现频率时,颜色值分布数据即可以用颜色直方图进行表示。相似度可以根据颜色直方图进行计算,作为一种可能的实现方式,可以参见图2所示实施例。
如图2所示,为本申请提供的关键帧获取方法又一个实施例,该方法可以包括以下几个步骤:
201:针对任意一帧视频帧以及与其相邻的前一帧视频帧,统计每一帧视频帧的每一种颜色的颜色直方图。
颜色值分布数据具体可以是指颜色直方图,用以表示不同颜色值出现频率,可以通过统计同一种颜色中每一个颜色值出现次数,将每一个颜色值的出现次数与视频帧的像素点相除,也即进行归一化,即得到每一个颜色值出现频率,进而即可以得到颜色直方图。
202:根据同一种颜色的不同颜色直方图,计算颜色直方图相交系数。
其中,计算颜色直方图相交系数具体是将两个颜色直方图中每一个颜色值的颜色值出现频率的最小值进行叠加,将叠加的和值作为相交系数。
具体可以按照如下公式进行相交系数计算公式获得:
Figure BDA0000903987090000071
也即两个颜色直方图中每一个颜色值的颜色值出现频率的最小值进行叠加,将叠加的和值作为相交系数。
其中,H1和H2为同一种颜色的两个颜色直方图,dinter(H1,H2)表示颜色值分布数据相交系数,H1(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256。
203:选择不同种颜色的颜色直方图相交系数的平均值、最大值或最小值,作为所述所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度。
204:在所述相似度小于第一阈值时,确定所述任意一帧视频帧为候选帧。
确定出视频帧为候选帧之后,可以通过比较候选帧的颜色丰富度来确定候选帧是否为关键帧。
一种可能的实现方式为,可以通过计算候选帧的图像颜色熵作为候选帧的颜色丰富度,因此,如图2所示,该方法还可以包括:
205:根据所述候选帧的灰度图像的灰度值分布数据,计算所述候选帧的图像颜色熵。
图像颜色熵即作为所述候选帧的颜色丰富度。
图像颜色熵是根据灰度图像的灰度值分布数据计算得到,具体可以是根据候选帧的灰度图像的灰度直方图计算得到。
图像颜色熵也是视频帧的全局特征,因此鲁棒性很高。
作为一种可能的实现方式,该图像颜色熵具体可以通过如下图像颜色熵计算公式获得:
Figure BDA0000903987090000081
其中,p(xi)表示第i个灰度值的出现频率,i=0、1、2……N-1,N=256。
通过图像颜色熵即可以表示候选帧的颜色丰富度。
当然,还可以将灰度图中灰度值的和值或者平均值等作为图像颜色熵。
206:将图像颜色熵大于第二阈值的候选帧作为关键帧。
在实际应用中,对于一段视频数据,是将第n帧视频帧与第n-1帧视频帧进行相似度比较,n=2、3、4……N,N为该视频数据的总帧数。
也即从第2帧开始,将每一帧视频帧均与其前一帧视频帧进行相似度比较,如果第n帧视频帧与第n-1帧视频帧的相似度大于第一阈值,则第n帧视频帧即作为候选帧,且其图像颜色熵大于第二阈值,则该候选帧即为关键帧,如果第n帧视频帧与第n-1帧视频帧的相似度小于第一阈值,或者第n帧图像的图像颜色熵小于第二阈值,则舍弃该视频帧。
在本实施例中,通过颜色直方图以及图像颜色熵,可以快速有效的获取关键帧,使得能够实时提取视频数据中的关键帧,不仅适用于离线视频数据,提高了通用性,颜色直方图以及图像颜色熵均为视频帧的全部图像,鲁棒性更高,计算复杂度低,使得关键帧获取速度更快。
且任意一帧视频帧与和与其相邻的前一帧视频帧的相似度根据颜色直方图相交系数获得,颜色直方图相交系数的计算复杂度低,从而可以使得关键帧获取更加快速有效。
其中,作为又一种可能的实现方式,颜色丰富度还可以用候选帧中不同颜色值的颜色值分布数据中最大颜色值出现频率或最大颜色值出现次数进行表示。
如果最大颜色值出现频率大于第三阈值或最大颜色值出现次数大于第四阈值,即表示颜色丰富度小于第二阈值,此时图像可以能存在较大的色块、或者为全黑或全白等,颜色丰富度小,因此即将该候选帧舍弃,不能作为关键帧。
如果最大的颜色值出现频率小于第三阈值或最大颜色值出现次数小于第四阈值,即表示颜色丰富度大于第二阈值,该候选帧即作为关键帧。
作为又一种可能的实现方式,还可以首先根据候选帧中最大颜色值出现次数或者最大颜色值出现频率,判断最大的颜色值出现频率是否大于第三阈值或者最大颜色值出现次数是否大于第四阈值,以确定候选帧是否为全黑、全白或者存在较大色块,如果是,则舍弃该候选帧,如果否,再计算候选帧的图像颜色熵,在图像颜色熵小于第二阈值时,确定候选帧为关键帧,否则即舍弃该候选帧。
当然,还可以计算候选帧的图像颜色熵,在图像颜色熵小于第二阈值时,再判断候选帧的最大的颜色值出现频率是否大于第三阈值或者最大颜色值出现次数是否大于第四阈值,如果是,则确定候选帧为关键帧,否则即舍弃该候选帧。
其中,将颜色值分布数据表示为颜色直方图,任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数,可以通过颜色直方图相交系数计算得到,当然还可以采用其他实现方式。
作为又一种可能的实现方式,可以采用同一种颜色的两个颜色直方图相关系数作为任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数。
因此,所述根据同一种颜色的颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应每一种颜色的相似系数包括:
根据同一种颜色的两个颜色直方图,按照如下相关系数计算公式,计算两个颜色直方图相关系数,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧对应每一种颜色的相似系数;
所述相关系数计算公式为:
Figure BDA0000903987090000101
其中,
Figure BDA0000903987090000102
Figure BDA0000903987090000103
H1和H2为同一种颜色的两个颜色直方图,dcorrel(H1,H2)表示颜色值分布数据相交系数,H1(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256。H1(j)和H2(j)分别表示第j个颜色值出现频率,j=0、1、2……N-1,N=256。
作为又一种可能的实现方式,可以采用两个颜色直方图的卡方系数作为任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数。
因此,所述根据同一种颜色的颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应每一种颜色的相似系数包括:
根据同一种颜色的两个颜色直方图,按照如下卡方系数计算公式,计算两个颜色直方图的卡方系数,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧对应每一种颜色的相似系数;
所述卡方系数计算公式为:
Figure BDA0000903987090000111
H1和H2为同一种颜色的两个颜色直方图,dchi-square(H1,H2)为两个颜色直方图的卡方系数,用于表示颜色值分布数据相交系数,H1(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256。
作为又一种可能的实现方式,可以采用两个颜色直方图的巴氏距离作为任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数。
因此,所述根据同一种颜色的颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应每一种颜色的相似系数包括:
根据同一种颜色的两个颜色直方图,按照如下巴氏距离计算公式,计算两个颜色直方图的巴氏距离,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧对应每一种颜色的相似系数;
所述巴氏距离计算公式为:
Figure BDA0000903987090000112
H1和H2为同一种颜色的两个颜色直方图,dBhattacharyya(H1,H2)为两个颜色直方图的巴氏距离,用于表示颜色值分布数据相交系数,H1(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256。
图3为本申请实施例提供的一种关键帧获取装置一个实施例的结构示意图,该装置可以包括:
颜色特征获取模块301,用于针对任意一帧视频帧以及与其相邻的前一帧视频帧,分别统计每一帧视频帧的每一种颜色的颜色值分布数据。
颜色值分布数据包括同一种颜色中不同颜色值的出现次数或者出现频率,用以表示视频帧的颜色特征。
任一颜色值出现频率具体是指任一颜色值出现次数与视频帧像素点数的比值,颜色值分布数据为不同颜色值出现频率时,该颜色值分布数据可以具体是指颜色直方图。
其中,本申请实施例中,对于视频帧为彩色图像时,由于不同色彩是由三原色叠加而成,都可以用三原色进行表示,因此颜色颜色值分布数据包括每一种原色,即R(red,红色)、G(green,绿色)或B(blue,蓝色)对应的颜色值分布数据。
对于视频帧为灰度图像,也即黑白图像时,其颜色值分布数据即为灰度值分布数据。
相似度计算模块302,用于根据同一种颜色的颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度。
候选帧获取模块303,用于在所述相似度小于第一阈值时,确定所述任意一帧视频帧为候选帧。
如果相似度小于第一阈值,表明该视频帧与其相邻的前一帧视频帧相似度较小,则该视频帧可能为关键帧,因此可以确定该视频帧为关键帧的候选帧。
而如果相似度大于第一阈值,表明该视频帧与其相邻的前一帧视频帧相似,则该视频帧不会是关键帧,即舍弃该视频帧。
信息计算模块304,用于计算所述候选帧的颜色丰富度,所述颜色丰富度表示所述候选帧的色彩分布情况;
关键帧获取模块305,用于获取颜色丰富度大于第二阈值的候选帧为关键帧。
在本申请实施例中,对于任意一帧视频帧,可以与其相邻的前一帧视频帧,通过颜色值分布数据进行比较,以确定该任意一帧视频帧是否可以作为关键帧的候选帧,从而再对候选帧进行颜色丰富度的判断,即可以确定候选帧是否可以作为关键帧,使得不仅适用于对离线视频数据进行关键帧的获取,可以对任一视频数据进行实时处理,提高了关键帧获取的有效性和通用性。
且申请实施例中,利用颜色值分布数据的颜色特征进行相邻两帧视频帧的相似度判断,仅对颜色值进行统计即可,复杂度低,提取速度快,且该颜色值分布数据为视频帧的全局特征,视频图像中主体的小幅度变化不会引起全局特征的变化,因此,鲁棒性更高。
其中,所述视频帧为彩色图像时,颜色值分布数据;包括三种原色对应的三个颜色值分布数据;所述视频帧为灰度图像时,颜色值分布数据包括一个灰度值分布数据;
在视频帧包括多种颜色的颜色值分布数据时,作为又一个实施例,如图4所示,与图3所示实施例不同之处在于,所述相似度计算模块302可以包括:
相似系数计算单元401,用于根据同一种颜色的颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数;
相似度计算单元402,用于将所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应不同种颜色的相似系数的平均值、最大值或最小值,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度。
当然还可以选择不同种颜色值分布数据的相似系数的和值等,作为相似度,本申请并不对此进行限定,只要依据不同颜色的颜色值分布数据的相交系数获得的相似度,均应在本申请的保护范围内。
在视频帧为灰度图像时,视频帧只有一种灰度对应的颜色值分布数据,也即灰度值分布数据,因此相邻两帧视频帧的对应灰度的相似系数,即作为相邻两帧视频帧的相似度。
其中,确定出视频帧为候选帧之后,可以通过比较候选帧的颜色丰富度来确定候选帧是否为关键帧。
一种可能的实现方式为,可以通过计算候选帧的图像颜色熵作为候选帧的颜色丰富度,因此所述信息计算模块304可以具体用于:
根据所述候选帧的灰度图像的灰度值分布数据,计算所述候选帧的图像颜色熵,将所述图像颜色熵作为所述候选帧的颜色丰富度。
图像颜色熵是根据灰度图像的灰度值分布数据计算得到,具体是根据灰度图像的灰度直方图计算得到。
图像颜色熵也是视频帧的全局特征,因此鲁棒性很高。
该图像颜色熵具体可以通过如下图像颜色熵计算公式获得:
Figure BDA0000903987090000141
其中,p(xi)表示第i个灰度值的出现频率,i=0、1、2……N-1,N=256。
通过图像颜色熵即可以表示候选帧的颜色丰富度。
其中,作为又一种可能的实现方式,颜色丰富度还可以根据视频帧是否具有较大色块进行判断,例如颜色值分布数据为颜色值出现次数时,可以将不同种颜色中的最大颜色值出现次数作为颜色丰富度,如果最大颜色值出现次数出现次数大于第二阈值,则表明图像中可能出现较大色块、或者为全黑或全白,此时该候选帧即舍弃,不能作为关键帧。
作为又一种可能的实现方式,还可以首先判断候选帧中的最大颜色值出现次数是否大于次数阈值,如果是,则舍弃该候选帧,如果否,再计算候选帧的图像颜色熵,在图像颜色熵小于第二阈值时,确定候选帧为关键帧,否则即舍弃该候选帧。
在颜色值分布数据统计的是每一个颜色值出现频率时,颜色值分布数据即可以用颜色直方图进行表示。相似度可以根据颜色直方图进行计算,因此,作为一种可能的实现方式,所述相似系数计算单元可以具体用于:
根据同一种颜色的颜色直方图,按照如下相交系数计算公式,计算颜色直方图相交系数,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧对应每一种颜色的相似系数;
所述相交系数计算公式为:
Figure BDA0000903987090000151
其中,H1和H2分别同一种颜色的两个颜色直方图,H1(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256。
作为又一种可能的方式中,可以采用同一种颜色的两个颜色直方图相关系数作为任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数。
因此,所述相似系数计算单元可以具体用于:
根据同一种颜色的两个颜色直方图,按照如下相关系数计算公式,计算两个颜色直方图相关系数,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧对应每一种颜色的相似系数;
所述相关系数计算公式为:
Figure BDA0000903987090000152
其中,
Figure BDA0000903987090000153
Figure BDA0000903987090000154
H1和H2为同一种颜色的两个颜色直方图,dcorrel(H1,H2)表示颜色值分布数据相交系数,H1(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256,H1(j)和H2(j)分别表示第j个颜色值出现频率,j=0、1、2……N-1,N=256。
作为又一种可能的实现方式,可以采用两个颜色直方图的卡方系数作为任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数。
因此,所述相似系数计算单元可以具体用于:
根据同一种颜色的两个颜色直方图,按照如下卡方系数计算公式,计算两个颜色直方图的卡方系数,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧对应每一种颜色的相似系数;
所述卡方系数计算公式为:
Figure BDA0000903987090000161
H1和H2为同一种颜色的两个颜色直方图,dchi-square(H1,H2)为两个颜色直方图的卡方系数,用于表示颜色值分布数据相交系数,H1(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256。
作为又一种可能的实现方式,可以采用两个颜色直方图的巴氏距离作为任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数。
因此,所述相似系数计算单元可以具体用于:
将颜色值分布数据表示为颜色直方图;
根据同一种颜色的两个颜色直方图,按照如下巴氏距离计算公式,计算两个颜色直方图的巴氏距离,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧对应每一种颜色的相似系数;
所述巴氏距离计算公式为:
Figure BDA0000903987090000162
H1和H2为同一种颜色的两个颜色直方图,dBhattacharyya(H1,H2)为两个颜色直方图的巴氏距离,用于表示颜色值分布数据相交系数,H1(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256。
通过本申请实施例的技术方案,对于一段视频数据,针对任意一帧视频帧,可以将其与其相邻的前一帧视频帧进行比较,通过统计颜色值分布数据,计算相邻两帧视频帧的相似度,以确定任意一帧视频帧如果与其相邻的前一帧视频帧的相似度小于第一阈值,则即可以作为候选帧继续进行判断;对于候选帧,可以通过判断其颜色丰富度,选择颜色丰富度大于第二阈值的候选帧作为最终的关键帧,本申请实施例通过提取视频帧的颜色特征,与前一帧视频帧进行比较,即可以实现关键帧的判断,不仅适用于离线视频数据,还可以实现实时获取关键帧,且颜色值分布数据以及颜色丰富度均为视频帧的全局特征,鲁棒性稿,统计时间短、统计方式简单,可以降低关键帧提取的复杂度,使得能够快速有效的提取关键帧。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

Claims (8)

1.一种关键帧获取方法,其特征在于,包括:
针对任意一帧视频帧以及与其相邻的前一帧视频帧,统计每一帧视频帧中每一种颜色的不同颜色值的颜色值分布数据;
根据同一种颜色的不同颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度;
在所述相似度小于第一阈值时,确定所述任意一帧视频帧为候选帧;
计算所述候选帧的颜色丰富度,所述颜色丰富度表示所述候选帧的色彩分布情况;
获取颜色丰富度大于第二阈值的候选帧为关键帧;其中,
所述视频帧为彩色图像时,颜色值分布数据包括三原色对应的三个颜色值分布数据;所述视频帧为灰度图像时,颜色值分布数据为灰度色对应的一个灰度值分布统计数据;
所述根据同一种颜色的颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度包括:
根据同一种颜色的不同颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数;
将所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应不同种颜色的相似系数的平均值、最大值或最小值,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度。
2.根据权利要求1所述的方法,其特征在于,所述计算所述候选帧的颜色丰富度包括:
根据所述候选帧的灰度图像的灰度值分布数据,计算所述候选帧的图像颜色熵,将所述图像颜色熵作为所述候选帧的颜色丰富度。
3.根据权利要求1所述的方法,其特征在于,所述颜色值分布数据为颜色直方图;
所述根据同一种颜色的不同颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应每一种颜色的相似系数包括:
根据同一种颜色的不同颜色直方图,按照如下相交系数计算公式,计算颜色直方图相交系数,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧对应同一种颜色的相似系数;
所述相交系数计算公式为:
Figure FDA0002287182400000021
其中,H1和H2分别表示任一帧视频帧以及与其相邻的前一帧视频帧对应同一种颜色的颜色直方图,Hi(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256。
4.根据权利要求2所述的方法,其特征在于,所述根据所述候选帧的灰度图像的灰度值分布数据,计算所述候选帧的图像颜色熵,将所述图像颜色熵作为所述候选帧的颜色丰富度包括:
根据所述候选帧的灰度图像的灰度值分布数据,按照如下图像颜色熵计算公式,计算所述候选帧的图像颜色熵,将所述图像颜色熵作为所述候选帧的颜色丰富度;
Figure FDA0002287182400000022
其中,p(xi)表示第i个灰度值的出现频率,i=0、1、2……N-1,N=256。
5.一种关键帧获取装置,其特征在于,包括:
颜色特征获取模块,用于针对任意一帧视频帧以及与其相邻的前一帧视频帧,统计每一帧视频帧中的每一种颜色的不同颜色值的颜色值分布数据;
相似度计算模块,用于根据同一种颜色的不同颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度;
候选帧获取模块,用于在所述相似度小于第一阈值时,确定所述任意一帧视频帧为候选帧;
信息计算模块,用于计算所述候选帧的颜色丰富度,所述颜色丰富度表示所述候选帧的信息量;
关键帧获取模块,用于获取颜色丰富度大于第二阈值的候选帧为关键帧;其中,
所述视频帧为彩色图像时,颜色值分布数据;包括三种原色对应的三个颜色值分布数据;所述视频帧为灰度图像时,颜色值分布数据包括一个灰度值分布数据;
所述相似度计算模块包括:
相似系数计算单元,用于根据同一种颜色的不同颜色值分布数据,计算所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应同一种颜色的相似系数;
相似度计算单元,用于将所述任意一帧视频帧以及与其相邻的前一帧视频帧的对应不同种颜色的相似系数的平均值、最大值或最小值,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧的相似度。
6.根据权利要求5所述的装置,其特征在于,所述信息计算模块具体用于:
根据所述候选帧的灰度图像的灰度值分布数据,计算所述候选帧的图像颜色熵,将所述图像颜色熵作为所述候选帧的颜色丰富度。
7.根据权利要求5所述的装置,其特征在于,所述颜色值分布数据为颜色直方图;
所述相似系数计算单元具体用于:
根据同一种颜色的不同颜色直方图,按照如下相交系数计算公式,计算颜色直方图相交系数,作为所述任意一帧视频帧以及与其相邻的前一帧视频帧对应同一种颜色的相似系数;
所述相交系数计算公式为:
Figure FDA0002287182400000031
其中,H1和H2分别表示任一帧视频帧以及与其相邻的前一帧视频帧对应同一种颜色的颜色直方图,H1(i)和H2(i)分别表示第i个颜色值出现频率,i=0、1、2……N-1,N=256。
8.根据权利要求6所述的装置,其特征在于,所述信息计算模块具体用于:
根据所述候选帧的灰度图像的灰度值分布数据,按照如下图像颜色熵计算公式,计算所述候选帧的图像颜色熵,将所述图像颜色熵作为所述候选帧的颜色丰富度;
Figure FDA0002287182400000041
其中,p(xi)表示第i个灰度值的出现频率,i=0、1、2……N-1,N=256。
CN201610014064.6A 2016-01-11 2016-01-11 关键帧获取方法及装置 Active CN106960211B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610014064.6A CN106960211B (zh) 2016-01-11 2016-01-11 关键帧获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610014064.6A CN106960211B (zh) 2016-01-11 2016-01-11 关键帧获取方法及装置

Publications (2)

Publication Number Publication Date
CN106960211A CN106960211A (zh) 2017-07-18
CN106960211B true CN106960211B (zh) 2020-04-14

Family

ID=59480406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610014064.6A Active CN106960211B (zh) 2016-01-11 2016-01-11 关键帧获取方法及装置

Country Status (1)

Country Link
CN (1) CN106960211B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107527072B (zh) * 2017-08-31 2020-07-03 北京小米移动软件有限公司 确定相似头像的方法及装置、电子设备
CN108875619B (zh) * 2018-06-08 2021-09-07 Oppo广东移动通信有限公司 视频处理方法和装置、电子设备、计算机可读存储介质
CN109214317B (zh) * 2018-08-22 2021-11-12 北京慕华信息科技有限公司 一种信息量确定方法及装置
CN112396551A (zh) * 2019-08-16 2021-02-23 阿里巴巴集团控股有限公司 一种水印嵌入方法及装置
CN110533117B (zh) * 2019-09-04 2022-05-24 浙江齐聚科技有限公司 图像比对方法、装置、设备和存储介质
CN111797707B (zh) * 2020-06-12 2022-03-15 武汉大学 一种基于聚类的镜头关键帧提取方法
CN112954450B (zh) * 2021-02-02 2022-06-17 北京字跳网络技术有限公司 视频处理方法、装置、电子设备和存储介质
CN113627363B (zh) * 2021-08-13 2023-08-15 百度在线网络技术(北京)有限公司 视频文件的处理方法、装置、设备以及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1477566A (zh) * 2003-07-18 2004-02-25 北京大学计算机科学技术研究所 一种对镜头进行基于内容的视频检索的方法
EP2443589A1 (en) * 2009-06-16 2012-04-25 Alibaba Group Holding Limited Method and system for near-duplicate image searching
CN102685398A (zh) * 2011-09-06 2012-09-19 天脉聚源(北京)传媒科技有限公司 一种新闻视频场景生成方法
CN103339655A (zh) * 2011-02-03 2013-10-02 株式会社理光 图像捕捉装置、图像捕捉方法及计算机程序产品
CN103426176A (zh) * 2013-08-27 2013-12-04 重庆邮电大学 基于改进直方图和聚类算法的视频镜头检测方法
CN103810711A (zh) * 2014-03-03 2014-05-21 郑州日兴电子科技有限公司 一种用于监控系统视频的关键帧提取方法及其系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1477566A (zh) * 2003-07-18 2004-02-25 北京大学计算机科学技术研究所 一种对镜头进行基于内容的视频检索的方法
EP2443589A1 (en) * 2009-06-16 2012-04-25 Alibaba Group Holding Limited Method and system for near-duplicate image searching
CN103339655A (zh) * 2011-02-03 2013-10-02 株式会社理光 图像捕捉装置、图像捕捉方法及计算机程序产品
CN102685398A (zh) * 2011-09-06 2012-09-19 天脉聚源(北京)传媒科技有限公司 一种新闻视频场景生成方法
CN103426176A (zh) * 2013-08-27 2013-12-04 重庆邮电大学 基于改进直方图和聚类算法的视频镜头检测方法
CN103810711A (zh) * 2014-03-03 2014-05-21 郑州日兴电子科技有限公司 一种用于监控系统视频的关键帧提取方法及其系统

Also Published As

Publication number Publication date
CN106960211A (zh) 2017-07-18

Similar Documents

Publication Publication Date Title
CN106960211B (zh) 关键帧获取方法及装置
US11140374B2 (en) Method and apparatus for calibrating image
Fan et al. Estimating EXIF parameters based on noise features for image manipulation detection
US20170289434A1 (en) Method and system for image processing to detect salient objects in image
CN112465727A (zh) 基于HSV色彩空间和Retinex理论的无正常光照参考的低照度图像增强方法
Su et al. Image inpainting for random areas using dense context features
Villalba et al. Identification of smartphone brand and model via forensic video analysis
WO2013056311A1 (en) Keypoint based keyframe selection
CN114640881A (zh) 视频帧对齐方法、装置、终端设备及计算机可读存储介质
CN113132695A (zh) 镜头阴影校正方法、装置及电子设备
WO2017024901A1 (zh) 视频转码方法和装置
CN108122218B (zh) 基于颜色空间的图像融合方法与装置
US11373279B2 (en) Image processing method and device
CN112019827A (zh) 视频图像色彩增强的方法、装置、设备及存储介质
CN101304483A (zh) 通过使用存储的图像进行图像处理的方法和装置
AU2015259903B2 (en) Segmentation based image transform
WO2017152822A1 (zh) 图像处理方法和装置
CN110689565B (zh) 一种深度图确定的方法、装置及电子设备
US8412002B2 (en) Method for generating all-in-focus image
CN107729387B (zh) 一种视频缩略图选取方法、存储介质及电子设备
Wang et al. Asymmetric stereo color transfer
CN110827287B (zh) 确定背景色置信度和图像处理的方法、装置及设备
CN111476101A (zh) 视频镜头切换检测方法及装置、计算机可读存储介质
US10382516B2 (en) Detecting upscaled source video
Yu et al. Computational similarity based on chromatic barycenter algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20170718

Assignee: Apple R&D (Beijing) Co., Ltd.

Assignor: BEIJING MOSHANGHUA TECHNOLOGY CO., LTD.

Contract record no.: 2019990000055

Denomination of invention: Key frame acquisition method and key frame acquisition device

License type: Common License

Record date: 20190211

GR01 Patent grant
GR01 Patent grant