CN106559714A - 一种面向数字视频版权保护的关键帧提取方法 - Google Patents

一种面向数字视频版权保护的关键帧提取方法 Download PDF

Info

Publication number
CN106559714A
CN106559714A CN201610998972.3A CN201610998972A CN106559714A CN 106559714 A CN106559714 A CN 106559714A CN 201610998972 A CN201610998972 A CN 201610998972A CN 106559714 A CN106559714 A CN 106559714A
Authority
CN
China
Prior art keywords
key frame
frame
video
digital video
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610998972.3A
Other languages
English (en)
Inventor
石蕴玉
刘翔
夏永祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cultural Broadcasting Film & Television Group Ltd
Shanghai University of Engineering Science
Original Assignee
Shanghai Cultural Broadcasting Film & Television Group Ltd
Shanghai University of Engineering Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cultural Broadcasting Film & Television Group Ltd, Shanghai University of Engineering Science filed Critical Shanghai Cultural Broadcasting Film & Television Group Ltd
Priority to CN201610998972.3A priority Critical patent/CN106559714A/zh
Publication of CN106559714A publication Critical patent/CN106559714A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8358Generation of protective data, e.g. certificates involving watermark
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种面向数字视频版权保护的关键帧提取方法,该方法基于帧差法,具体包括以下步骤:第一步,对数字视频进行分解和预处理;第二步,根据原始视频帧之间的颜色特征差异得到关键帧备选序列;第三步,根据关键帧备选序列帧之间的结构特征差异得到关键帧序列;第四步,通过判断关键帧的数量来确保关键帧的有效性。与现有技术相比,本发明具有不考虑镜头分割,直接从一段视频中提取关键帧,基于颜色和结构信息进行两步关键帧提取,快速、全面、准确提取视频关键帧等优点。

Description

一种面向数字视频版权保护的关键帧提取方法
技术领域
本发明涉及一种数字视频分析与数字视频版权保护技术领域,尤其是涉及一种面向数字视频版权保护的关键帧提取方法。
背景技术
随着视频数据的急剧增长,视频的数字版权保护也得到了越来越多的重视。在传统的视频版权保护中,数字水印的方法得到了有效的发展和应用。但数字水印的方法也有很多的局限性,例如数字水印的所属问题,数字水印的重复构建问题等等。但这种方法在网络增长的情况下并不适应。
针对原有水印添加方法计算量大,且程序编写过程复杂的缺点,中国专利CN103458320A公开了一种基于水印技术的版权控制系统,系统包括前台页面模块、调度模块、流媒体模块、转码及水印添加模块、数据库模块和存储模块,所述的调度模块用以接收所述的前台页面模块发送的任务信息并确定执行相应的策略调度转码和流媒体服务,所述的转码及水印添加模块用以将视频转换成YUV向量格式的图片并添加用0、1比特信号表示的水印信息。但该方法仍然存在很多局限性。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种面向数字视频版权保护的关键帧提取方法。
本发明的目的可以通过以下技术方案来实现:
一种面向数字视频版权保护的关键帧提取方法,其特征在于,该方法基于帧差法,具体包括以下步骤:
第一步,对数字视频进行分解和预处理;
第二步,根据原始视频帧之间的颜色特征差异得到关键帧备选序列;
第三步,根据关键帧备选序列帧之间的结构特征差异得到关键帧序列;
第四步,通过判断关键帧的数量来确保关键帧的有效性。
该方法直接从数字视频中提取关键帧,组成视频的关键帧序列。
第二步中采用计算视频帧间颜色直方图特征差值的方法来快速形成关键帧备选序列,采用RGB颜色空间并根据相邻帧之间颜色直方图的差异计算每帧的颜色直方图。
第三步具体步骤包括:
S1、用协方差作为结构相似程度的度量,σxy为图像块x,y的相关系数,也即x和y的协方差,计算公式为:
其中N为图像块的数量,μi为图像块的平均值;
S2、将备选关键帧序列的前一帧作为原始图像,将相邻的后一帧作为测试图像来计算两者之间的结构相似分量,根据两幅图像中相同位置处的对应图像块x,y视成两大输入信号,计算其结构相似度分量s(x,y):
C=((KL)2/2),K<<1,L∈(0,255],σx、σy分别为图像块x和y的方差,将图像块的大小设置为8*8像素值;
S3、若分量值s(x,y)小于设定阈值,则说明两者之间内容信息的区分度不大,不必同时作为关键帧予以保留,仅提取其中一帧作为优化后的关键帧。
第四步中具体步骤为,若一段视频没有提取出关键帧,将直接从原始视频中按照等时长的方式提取相应数量的关键帧。
第四步后对最终提取的关键帧进行评价,评价指标包括:灰度值在可以让观看者主观感知视频内容的范围内;关键帧的时间顺序与原视频中的帧的时间顺序保持一致;并确保每隔一段时长即存在一帧关键帧。
与现有技术相比,本发明具有以下优点:
(1)为了提高运算效率,此方法与传统的镜头分割方法不同的地方在于,传统方法是对一段视频先进行镜头分割,再从每个镜头内进行提取关键帧,进而组成该视频的关键帧序列。在本方法中,不考虑镜头分割,直接从一段视频中提取关键帧,进而组成该视频的关键帧序列。
(2)基于颜色特征的关键帧数提取方法,对于视频序列中的较为明显的视频内容转换具有较好的判断能力。
(3)对提取到的关键帧进行基于结构特征的优化,即对备选关键帧进行相邻帧之间的结构相似度判断,从而减少关键帧的过度冗余。
(4)视频关键帧所表达的信息能够涵盖整段检测视频的主要内容,符合面向数字视频版权保护的实际需求。
附图说明
图1为本发明面向数字视频版权保护的关键帧提取总体方案;
图2为本发明基于颜色特征的关键帧备选序列的生成流程图;
图3为本发明基于结构特征的关键帧序列优化流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
实施例
图1为面向数字视频版权保护的关键帧提取总体方案。首先对数字视频进行视频帧分解。由于从网络上下载得到的视频格式众多,包括f4v、flv、mp4、ts等,为了提高视频关键提取算法的普适性,在本发明中不考虑视频的具体格式和码流结构,对视频解码后进行视频帧的分解处理。从图1可知,本方案对关键帧的提取主要分为两步,首先根据原始视频帧之间的颜色特征差异得到关键帧备选序列,然后根据关键帧备选序列帧之间的结构特征差异得到关键帧序列,最后通过判断关键帧的数量来确保关键帧的有效性。
一般来讲,广播电视节目需要传达一定的视觉内容,因而过暗或过亮的视频图像不符合这一主观感受。为了与节目预告片等节目加以区分,必须保证提取出的关键帧之间的时间关系与原视频中各帧之间的前后关系保持一致。由于网上盗播的视频经常被分割成较小的视频文件进行播放,因而在母带的关键帧提取中应当允许适当的冗余,确保每隔一段时长即存在一帧关键帧,例如在选秀节目中每隔一个选手的比赛情况即可能出现主持人点评的画面,那么在关键帧提取的过程中,最好每隔一段时间即保留一幅以主持人为关键信息的视频帧。
基于以上考虑,通过分析视频数据中存在的空间冗余和时间冗余,采用帧差法来提取关键帧,值得一提的是,为了提高运算效率,此方法与传统的镜头分割方法不同的地方在于,传统方法是对一段视频先进行镜头分割,再从每个镜头内进行提取关键帧,进而组成该视频的关键帧序列。在本方法中,不考虑镜头分割,直接从一段视频中提取关键帧,进而组成该视频的关键帧序列。
在本发明中对关键帧进行了定义,在视频版权保护中一段视频的关键帧应满足如下条件:
1)灰度值在一定范围内,即可以让观看者主观感知视频内容;
2)关键帧的时间顺序与原视频中的帧的时间顺序保持一致;
3)存在适当冗余,确保每隔一段时长即存在一帧关键帧。
图2为基于颜色特征的关键帧备选序列的生成,主要采用计算视频帧间颜色直方图特征差值的方式来快速挑选备用的关键帧。
颜色是图像的重要属性之一,常被用于表征图像的统计信息,甚至对于一些指定域的视频,颜色信息可以直接表达语义,如足球视频中,绿色通常代表草地。此外,不同的颜色空间对人的感官视觉的感知效果也不一致。在本发明中,为了在视频关键帧提取效果与速度之间取得有效平衡,对视频采用RGB颜色空间并计算每帧的颜色直方图,采用相邻帧之间颜色直方图的差异
基于颜色特征的关键帧数提取方法,对于视频序列中的较为明显的视频内容转换具有较好的判断能力,但是对于渐变效果或者颜色、灯光的些许变化的检测效果并不算理想,原因在于颜色直方图对于姿色渐变和灯光渐变等效果非常敏感,为几帧到十几帧之间虽然视频内容变化不大,相邻帧之间变化较小,但颜色直方图特征会发生明显的改变。正如本发明前文中强调的,为了得到快速有效的关键帧提取效果,并不会直接对视频进行镜头分割,虽然诸如运动估计、光流分析、运动建模等方法的分割效果较好,但它们的时间复杂性也较高,这些不足都严重影响了在视频版权监测中的实际应用。
图3为基于结构特征的关键帧序列优化。本方案首先采用基于颜色特征的备选关键帧提取,再对提取到的关键帧进行基于结构特征的优化,即对备选关键帧进行相邻帧之间的结构相似度判断,从而减少关键帧的过度冗余。
结构相似度方法是来源于图像质量评价的评判方法,是一种衡量两幅图像相似度的指标,值越接近于1,表明两幅图像的质量越相近。结构相似性理论认为自然图像信号是高度结构化的,即像素间有很强的相关性,特别是空域中最接近的像素,这种相关性蕴含着视觉场景中物体结构的重要信息。人眼视觉系统(HVS)的主要功能是从视野中提取结构信息,可以用对结构信息的度量作为图像感知质量的近似。在本方案中,将结构相近这一概念引入到关键帧优化的过程,从而去除基于颜色特征关键帧提取对结构信息不敏感这一不足。
本方案仅采用结构相似度指数结构相似这一分量。作为结构相似性理论的实现,从图像组成的角度将结构信息定义为独立于亮度、对比度的,反映场景中物体结构的属性,用协方差作为结构相似程度的度量。其主要计算过程是:
用协方差作为结构相似程度的度量,σxy为图像块x,y的相关系数,也即x和y的协方差,计算公式为:
将备选关键帧序列的前一帧作为原始图像,将相邻的后一帧作为测试图像来计算两者之间的结构相似分量,根据两幅图像中相同位置处的对应图像块x,y视成两大输入信号,计算其结构相似度分量s(x,y):
C=((KL)2/2),K<<1,L∈(0,255],σx、σy分别为x和y的方差;
若分量值s(x,y)较小,则说明两者之间内容信息的区分度不大,不必同时作为关键帧予以保留,可以仅提取其中一帧作为优化后的关键帧。
经过基于颜色特征的备选关键帧提取和基于结构特征的关键帧优化后,会判断关键帧的数量是否符合需求。若一段视频没有提取出关键帧,将直接从原始视频中按照等时长的方式提取相应数量的关键帧。一般这种情况出现在对无分割镜头的介绍片中,如新闻广播中主播播报一段新闻的镜头,视频帧之间没有明显的颜色特征和结构特征的变化。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (6)

1.一种面向数字视频版权保护的关键帧提取方法,其特征在于,该方法基于帧差法,具体包括以下步骤:
第一步,对数字视频进行分解和预处理;
第二步,根据原始视频帧之间的颜色特征差异得到关键帧备选序列;
第三步,根据关键帧备选序列帧之间的结构特征差异得到关键帧序列;
第四步,通过判断关键帧的数量来确保关键帧的有效性。
2.根据权利要求1所述的一种面向数字视频版权保护的关键帧提取方法,其特征在于,该方法直接从数字视频中提取关键帧,组成视频的关键帧序列。
3.根据权利要求1所述的一种面向数字视频版权保护的关键帧提取方法,其特征在于,第二步中采用计算视频帧间颜色直方图特征差值的方法来快速形成关键帧备选序列,采用RGB颜色空间并根据相邻帧之间颜色直方图的差异计算每帧的颜色直方图。
4.根据权利要求1所述的一种面向数字视频版权保护的关键帧提取方法,其特征在于,第三步具体步骤包括:
S1、用协方差作为结构相似程度的度量,σxy为图像块x,y的相关系数,也即x和y的协方差,计算公式为:
σ x y = 1 N - 1 Σ i - 1 N ( x i - μ i ) ( y i - μ i ) ;
S2、将备选关键帧序列的前一帧作为原始图像,将相邻的后一帧作为测试图像来计算两者之间的结构相似分量,根据两幅图像中相同位置处的对应图像块x,y视成两大输入信号,计算其结构相似度分量s(x,y):
s ( x , y ) = σ x y + C σ x σ y + C
C=((KL)2/2),K<<1,L∈(0,255],σx、σy分别为图像块x和y的方差,将图像块的大小设置为8*8像素值;
S3、若分量值s(x,y)小于设定阈值,则说明两者之间内容信息的区分度不大,不必同时作为关键帧予以保留,仅提取其中一帧作为优化后的关键帧。
5.根据权利要求1所述的一种面向数字视频版权保护的关键帧提取方法,其特征在于,第四步中具体步骤为,若一段视频没有提取出关键帧,将直接从原始视频中按照等时长的方式提取相应数量的关键帧。
6.根据权利要求1所述的一种面向数字视频版权保护的关键帧提取方法,其特征在于,第四步后对最终提取的关键帧进行评价,评价指标包括:灰度值在可以让观看者主观感知视频内容的范围内;关键帧的时间顺序与原视频中的帧的时间顺序保持一致;并确保每隔一段时长即存在一帧关键帧。
CN201610998972.3A 2016-11-14 2016-11-14 一种面向数字视频版权保护的关键帧提取方法 Pending CN106559714A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610998972.3A CN106559714A (zh) 2016-11-14 2016-11-14 一种面向数字视频版权保护的关键帧提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610998972.3A CN106559714A (zh) 2016-11-14 2016-11-14 一种面向数字视频版权保护的关键帧提取方法

Publications (1)

Publication Number Publication Date
CN106559714A true CN106559714A (zh) 2017-04-05

Family

ID=58444295

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610998972.3A Pending CN106559714A (zh) 2016-11-14 2016-11-14 一种面向数字视频版权保护的关键帧提取方法

Country Status (1)

Country Link
CN (1) CN106559714A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111078941A (zh) * 2019-12-18 2020-04-28 福州大学 一种基于帧相关系数和感知哈希的相似视频检索系统
CN111175618A (zh) * 2019-12-31 2020-05-19 浙江黑卡电气有限公司 一种适用于同时处理红外和局放数据的局部相关性滤波方法
CN112396551A (zh) * 2019-08-16 2021-02-23 阿里巴巴集团控股有限公司 一种水印嵌入方法及装置
CN117440162A (zh) * 2023-12-19 2024-01-23 齐齐哈尔医学院 一种多媒体互动教学方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701014B1 (en) * 2000-06-14 2004-03-02 International Business Machines Corporation Method and apparatus for matching slides in video
CN103065153A (zh) * 2012-12-17 2013-04-24 西南科技大学 一种基于色彩量化和聚类的视频关键帧提取方法
CN105049875A (zh) * 2015-07-24 2015-11-11 上海上大海润信息系统有限公司 一种基于混合特征与突变检测的精确关键帧提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701014B1 (en) * 2000-06-14 2004-03-02 International Business Machines Corporation Method and apparatus for matching slides in video
CN103065153A (zh) * 2012-12-17 2013-04-24 西南科技大学 一种基于色彩量化和聚类的视频关键帧提取方法
CN105049875A (zh) * 2015-07-24 2015-11-11 上海上大海润信息系统有限公司 一种基于混合特征与突变检测的精确关键帧提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈天华: "《数字图像处理》", 30 September 2014 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396551A (zh) * 2019-08-16 2021-02-23 阿里巴巴集团控股有限公司 一种水印嵌入方法及装置
CN111078941A (zh) * 2019-12-18 2020-04-28 福州大学 一种基于帧相关系数和感知哈希的相似视频检索系统
CN111175618A (zh) * 2019-12-31 2020-05-19 浙江黑卡电气有限公司 一种适用于同时处理红外和局放数据的局部相关性滤波方法
CN111175618B (zh) * 2019-12-31 2022-06-24 浙江黑卡电气有限公司 一种适用于同时处理红外和局放数据的局部相关性滤波方法
CN117440162A (zh) * 2023-12-19 2024-01-23 齐齐哈尔医学院 一种多媒体互动教学方法及系统
CN117440162B (zh) * 2023-12-19 2024-02-23 齐齐哈尔医学院 一种多媒体互动教学方法及系统

Similar Documents

Publication Publication Date Title
Wang et al. A fast single-image dehazing method based on a physical model and gray projection
CN106559714A (zh) 一种面向数字视频版权保护的关键帧提取方法
CN106937120B (zh) 基于对象的监控视频浓缩方法
CN106254933A (zh) 字幕提取方法及装置
CN101729911B (zh) 一种基于视觉感知的多视点图像颜色校正方法
CN104272377B (zh) 运动图片项目管理系统
CN110944200B (zh) 一种评估沉浸式视频转码方案的方法
CN104063883A (zh) 一种基于对象和关键帧相结合的监控视频摘要生成方法
CN101651772A (zh) 一种基于视觉注意的视频感兴趣区域的提取方法
CN103984778B (zh) 一种视频检索方法及系统
CN105868683A (zh) 台标识别方法及装置
CN107798304A (zh) 一种快速视频审核的方法
Yan et al. MMP-net: a multi-scale feature multiple parallel fusion network for single image haze removal
CN102306153B (zh) 基于归一化语义加权和规则的足球视频进球事件检测方法
CN101707711A (zh) 一种基于压缩域的视频序列Copy-Move篡改检测方法
CN100548030C (zh) 一种基于时空条带模式分析的新闻主播镜头检测方法
Lin et al. Saliency-aware spatio-temporal artifact detection for compressed video quality assessment
CN102393909B (zh) 基于隐马尔科夫模型的足球视频进球事件检测方法
Zhou et al. A deep learning algorithm for fast motion video sequences based on improved codebook model
CN103618899A (zh) 基于光强信息的视频插帧篡改检测方法及装置
CN111429375A (zh) 日间图像参照辅助的夜晚监控视频质量提升方法
CN109978834A (zh) 一种基于色彩和纹理特征的屏幕图像质量评价方法
Sankoh et al. Dynamic camera calibration method for free-viewpoint experience in sport videos
CN102339625B (zh) 视频对象级时域编辑方法及系统
CN115063800A (zh) 文本识别方法和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170405