CN103065301B - 一种双向比对视频镜头分割方法 - Google Patents

一种双向比对视频镜头分割方法 Download PDF

Info

Publication number
CN103065301B
CN103065301B CN201210567017.6A CN201210567017A CN103065301B CN 103065301 B CN103065301 B CN 103065301B CN 201210567017 A CN201210567017 A CN 201210567017A CN 103065301 B CN103065301 B CN 103065301B
Authority
CN
China
Prior art keywords
video
frame
camera lens
centerdot
matching degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210567017.6A
Other languages
English (en)
Other versions
CN103065301A (zh
Inventor
吴春明
熊伟
姜明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201210567017.6A priority Critical patent/CN103065301B/zh
Publication of CN103065301A publication Critical patent/CN103065301A/zh
Application granted granted Critical
Publication of CN103065301B publication Critical patent/CN103065301B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种双向比对视频镜头分割方法,该方法通过分析视频帧的灰度级分布,计算每一帧与相邻帧的综合匹配度,根据每一帧的相邻匹配度的整体变化规律,对视频进行分类。针对每个类别的视频,训练相应的全局分镜阈值,基于全局阈值,对每一帧的相邻匹配度进行双向比对,找出镜头切分点。

Description

一种双向比对视频镜头分割方法
技术领域
本发明涉及一种将视频按镜头分割的方法,尤其涉及一种采用相邻帧综合匹配度与分类全局阈值的双向比对视频镜头分割方法。
背景技术
近年来,由于多媒体技术的发展,与视频相关的应用不断增加,如网络电视、互动电视、视频会议、远程教学等,这一系列的应用使得视频内容呈现爆炸式增长。由于视频内容往往不具备传统的结构化特征,并且包含大量的数据,传统的数据索引和检索方法不能有效的处理视频内容。因而,国内外展开了大量的关于视频内容索引、组织、浏览、检索和管理技术的研究。在这些技术和研究中,视频镜头分割(或视频镜头边界检测)是首要的工作。视频镜头分割技术主要包含三个部分内容,帧匹配度计算、镜头边界检测阈值设定、镜头边界检测方法。
目前传统的视频分割技术中,帧匹配度计算一般采用单一的帧色彩分布直方图距离计算公式,实际应用中,同类型的视频使用不同的距离计算公式结果有一定差距,各种计算公式有各自适应的类型。因此,在通用系统中,需要使用多种距离计算公式,提高计算结果的适应性。
传统的镜头边界检测方法包括两类,一类是相邻帧距离,如果帧距大于设定的全局或者动态设定的边界阈值,则认定此两帧分别为两个镜头的边界,这类方法对于镜头明显转换的边界检测具有较高的适应性,且执行效率高;另一类是段检测,即统计一段视频帧的相邻帧距离,如果其大于设定的全局或者动态设定的边界阈值,则认定此段帧为镜头之间的分解,这类方法对于镜头间夹杂如人工处理的合成帧等类型视频的检测具有较高的适应性,由于需要统计的数据量大,这类方法的执行效率相较前者较低。
发明内容
本发明的目的在于针对现有技术的不足,提供了一种双向比对视频镜头分割方法。
本发明的目的是通过以下技术方案来实现的:一种双向比对视频镜头分割方法,该方法包括以下步骤:
(1)全局阈值训练:通过对样例视频重复进行的边界检测,用检测结果不断修正全局阈值,具体步骤为:
(1.1)设定分类全局边界检测阈值基准值和修正增量;设定一个基准值,由于视频帧距离标准化为[0,1]区间的实数,通常设定基准值为0.5;设定一个修正增量,根据实际应用的计算精度设定;
(1.2)选取样本视频,用于对全局阈值进行修正,进行1.3到1.5的操作;
(1.3)计算样本视频每一帧的左匹配度和右匹配度,对视频流的第k帧                                                ,其综合匹配度计算公式分为左匹配度与右匹配度
    其中,对于,定义;对于,定义;其中函数定义为相邻帧的灰度级直方图相关量,定义为相邻两帧的灰度级直方图相交量,定义为1与相邻两帧的Bhattacharyya距离的差值;为常量,且保证:
(1.4)使用当前的全局阈值和前文所述的方法检测样本视频的边界帧,即对视频进行镜头分割;镜头边界检测采用线性扫描,双向同步检测,对视频流的第k帧,如果,则认定第k帧是一段镜头的右边界;如果,则认定第k帧是一段镜头的左边界;如果,则认定第k帧是一段剧变镜头的一部分,而非镜头边界;如果,则认定第k帧是一段平稳变化镜头的一部分,而非镜头边界;依次将匹配的一段视频左边界和视频右边界限定的视频内容提取为一个镜头;
(1.5)将步骤1.4计算的分割结果与人工检测的分割结果进行比对,如果1.4计算的分割结果超过人工检测的分割结果的10%,即计算结果中的镜头包含多个实际镜头,则将基准值减去修正增量,否则加上修正增量;然后重新进行1.3到1.4的步骤;当1.4计算的分割结果不超过人工检测的分割结果的10%时,认定当前值为全局阈值;
(2)视频检测阶段:使用训练的全局阈值,对输入的视频进行镜头分割,具体步骤为:
(2.1)从存储设备上读取输入视频,对其进行基本处理,转换成统一视频格式;(2.2)计算样本视频每一帧的左匹配度和右匹配度,对视频流的第k帧,其综合匹配度计算公式分为左匹配度与右匹配度
    对于,定义;对于,定义;其中函数定义为相邻帧的灰度级直方图相关量,定义为相邻两帧的灰度级直方图相交量,定义为等价于相邻两帧的Bhattacharyya距离;为常量,且保证:
(2.3)检测样本视频的边界帧:镜头边界检测采用线性扫描,双向同步检测,对视频流的第k帧,如果,则认定第k帧是一段镜头的右边界;如果,则认定第k帧是一段镜头的左边界;如果,则认定第k帧是一段剧变镜头的一部分,而非镜头边界;如果,则认定第k帧是一段平稳变化镜头的一部分,而非镜头边界;
(2.4)按照步骤2.3的边界帧结果,依次将匹配的一段视频左边界和视频右边界限定的视频内容提取为一个镜头,将视频分割为镜头组成的单元输出,生成新的视频单元或者生成视频镜头分割的文本数据。
    本发明的有益效果是:本发明采用加权综合直方图相关量、相交量和Bhattacharyya距离的方法计算帧的匹配度,综合各种计算方法应性,使本方法对各种类型视频均有较高的检测精度。镜头边界检测方法为线性扫描,双向同步检测,由于使用线性扫描,方法具有很高的效率,同时,基于每一帧的双匹配度的双向同步检测也保证了对于镜头变换复杂的一类视频的检测精度。
附图说明
图1是全局阈值训练流程图;
图2是视频镜头分割流程图。
具体实施方式
 本发明提供一种双向比对视频镜头分割方法,视频镜头分割主要用于视频摘要、视频索引、视频浏览、视频检索等领域,是这些领域对视频内容进行处理的首要内容。具体的实施过程包括两个大的步骤,第一部分是分类的全局阈值训练,第二部分是视频边界检测。
 1.全局阈值训练,全局阈值的训练是通过对样例视频重复进行的边界检测,用检测结果不断修正全局阈值的过程。具体步骤为:
 1.1 设定分类全局边界检测阈值基准值和修正增量。设定一个基准值,由于视频帧距离标准化为[0,1]区间的实数,通常设定基准值为0.5;设定一个修正增量,根据实际应用的计算精度设定,如计算精度为小数点后1位,则修正增量设定为0.1。
 1.2 选取样本视频,用于对全局阈值进行修正,进行1.3到1.5的操作。
 1.3 计算样本视频每一帧的左匹配度和右匹配度。对视频流的第k帧,其综合匹配度计算公式分为左匹配度与右匹配度
    特别的,对于,定义;对于,定义。其中函数定义为相邻帧的灰度级直方图相关量,定义为相邻两帧的灰度级直方图相交量,定义为1与相邻两帧的Bhattacharyya距离的差值,为常量,且保证:
 的具体取值可根据实际要求变动。本发明定为:
 1.4 使用当前的全局阈值和前文所述的方法检测样本视频的边界帧,即对视频进行镜头分割。镜头边界检测采用线性扫描,双向同步检测,对视频流的第k帧,如果,则认定第k帧是一段镜头的右边界;如果,则认定第k帧是一段镜头的左边界;如果,则认定第k帧是一段剧变镜头的一部分,而非镜头边界;如果,则认定第k帧是一段平稳变化镜头的一部分,而非镜头边界。依次将匹配的一段视频左边界和视频右边界限定的视频内容提取为一个镜头。
 1.5将步骤1.4计算的分割结果与人工检测的分割结果进行比对,如果1.4计算的分割结果超过人工检测的分割结果的10%,即计算结果中的镜头包含多个实际镜头,则将基准值减去修正增量,否则加上修正增量;然后重新进行1.3到1.4的步骤;当1.4计算的分割结果不超过人工检测的分割结果的10%时,认定当前值为全局阈值。
 2.视频检测阶段,本阶段使用训练的全局阈值,对输入的视频进行镜头分割,具体步骤为:
 2.1 从存储设备上读取输入视频,对其进行基本处理,转换成统一视频格式(具体格式可根据实际情况统一设定,如AVI等)。
 2.2 计算样本视频每一帧的左匹配度和右匹配度。对视频流的第k帧,其综合匹配度计算公式分为左匹配度与右匹配度
    特别的,对于,定义;对于,定义。其中函数定义为相邻帧的灰度级直方图相关量,定义为相邻两帧的灰度级直方图相交量,定义为等价于相邻两帧的Bhattacharyya距离。为常量,且保证:
    的具体取值可根据实际要求变动。本发明定为:
 2.3检测样本视频的边界帧。镜头边界检测采用线性扫描,双向同步检测,对视频流的第k帧,如果,则认定第k帧是一段镜头的右边界;如果,则认定第k帧是一段镜头的左边界;如果,则认定第k帧是一段剧变镜头的一部分,而非镜头边界;如果,则认定第k帧是一段平稳变化镜头的一部分,而非镜头边界。
 2.4按照2.3的边界帧结果,依次将匹配的一段视频左边界和视频右边界限定的视频内容提取为一个镜头,将视频分割为镜头组成的单元输出,生成新的视频单元或者生成视频镜头分割的文本数据。

Claims (1)

1.一种双向比对视频镜头分割方法,其特征在于,该方法包括以下步骤:
(1)全局阈值训练:通过对样例视频重复进行的边界检测,用检测结果不断修正全局阈值,具体步骤为:
(1.1)设定全局阈值基准值和修正增量;设定一个基准值,由于视频帧距离标准化为[0,1]区间的实数,通常设定基准值为0.5;设定一个修正增量,根据实际应用的计算精度设定;
(1.2)选取样本视频,用于对全局阈值进行修正,进行步骤(1.3)到(1.5)的操作;
(1.3)计算样本视频每一帧的左匹配度和右匹配度,对视频流的第k帧fk,其综合匹配度计算公式分为左匹配度M(fk)L与右匹配度M(fk)R
∀ k > 0 , M ( f k ) L = a · D 1 ( f k , f k - 1 ) + b · D 2 ( f k , f k - 1 ) + c · D 3 ( f k , f k - 1 ) ,
&ForAll; k < T , M ( f k ) R = a &CenterDot; D 1 ( f k , f k + 1 ) + b &CenterDot; D 2 ( f k , f k + 1 ) + c &CenterDot; D 3 ( f k , f k + 1 ) ;
其中,对于k=0,定义M(fk)L=0;对于k=T,定义M(fk)R=0;其中函数D1定义为相邻帧的灰度级直方图相关量,D2定义为相邻两帧的灰度级直方图相交量,D3定义为1与相邻两帧的Bhattacharyya距离的差值;a,b,c为常量,且保证:a+b+c=1;
(1.4)使用当前的全局阈值和前文所述的方法检测样本视频的边界帧,即对视频进行镜头分割;镜头边界检测采用线性扫描,双向同步检测,对视频流的第k帧fk,如果M(fk)L>T且M(fk)R≤T,则认定第k帧是一段镜头的右边界;如果M(fk)L≤T且M(fk)R>T,则认定第k帧是一段镜头的左边界;如果M(fk)L>T且M(fk)R>T,则认定第k帧是一段剧变镜头的一部分,而非镜头边界;如果M(fk)L<T且M(fk)R<T,则认定第k帧是一段平稳变化镜头的一部分,而非镜头边界;依次将匹配的一段视频左边界和视频右边界限定的视频内容提取为一个镜头;
(1.5)将步骤(1.4)计算的分割结果与人工检测的分割结果进行比对,如果步骤(1.4)计算的分割结果超过人工检测的分割结果的10%,即计算结果中的镜头包含多个实际镜头,则将基准值减去修正增量,否则加上修正增量;然后重新进行步骤(1.3)到步骤(1.4);当步骤(1.4)计算的分割结果不超过人工检测的分割结果的10%时,认定当前值为全局阈值;
(2)视频检测阶段:使用训练的全局阈值,对输入的视频进行镜头分割,具体步骤为:
(2.1)从存储设备上读取输入视频,对其进行基本处理,转换成统一视频格式;
(2.2)计算样本视频每一帧的左匹配度和右匹配度,对视频流的第k帧fk,其综合匹配度计算公式分为左匹配度M(fk)L与右匹配度M(fk)R
&ForAll; k > 0 , M ( f k ) L = a &CenterDot; D 1 ( f k , f k - 1 ) + b &CenterDot; D 2 ( f k , f k - 1 ) + c &CenterDot; D 3 ( f k , f k - 1 ) ,
&ForAll; k < T , M ( f k ) R = a &CenterDot; D 1 ( f k , f k + 1 ) + b &CenterDot; D 2 ( f k , f k + 1 ) + c &CenterDot; D 3 ( f k , f k + 1 ) ;
对于k=0,定义M(fk)L=0;对于k=T,定义M(fk)R=0;其中函数D1定义为相邻帧的灰度级直方图相关量,D2定义为相邻两帧的灰度级直方图相交量,D3定义为1与相邻两帧的Bhattacharyya距离的差值;a,b,c为常量,且保证:a+b+c=1;
(2.3)检测样本视频的边界帧:镜头边界检测采用线性扫描,双向同步检测,对视频流的第k帧fk,如果M(fk)L>T且M(fk)R≤T,则认定第k帧是一段镜头的右边界;如果M(fk)L≤T且M(fk)R>T,则认定第k帧是一段镜头的左边界;如果M(fk)L>T且M(fk)R>T,则认定第k帧是一段剧变镜头的一部分,而非镜头边界;如果M(fk)L<T且M(fk)R<T,则认定第k帧是一段平稳变化镜头的一部分,而非镜头边界;
(2.4)按照步骤(2.3)的边界帧结果,依次将匹配的一段视频左边界和视频右边界限定的视频内容提取为一个镜头,将视频分割为镜头组成的单元输出,生成新的视频单元或者生成视频镜头分割的文本数据。
CN201210567017.6A 2012-12-25 2012-12-25 一种双向比对视频镜头分割方法 Expired - Fee Related CN103065301B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210567017.6A CN103065301B (zh) 2012-12-25 2012-12-25 一种双向比对视频镜头分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210567017.6A CN103065301B (zh) 2012-12-25 2012-12-25 一种双向比对视频镜头分割方法

Publications (2)

Publication Number Publication Date
CN103065301A CN103065301A (zh) 2013-04-24
CN103065301B true CN103065301B (zh) 2015-07-22

Family

ID=48107918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210567017.6A Expired - Fee Related CN103065301B (zh) 2012-12-25 2012-12-25 一种双向比对视频镜头分割方法

Country Status (1)

Country Link
CN (1) CN103065301B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL228204A (en) * 2013-08-29 2017-04-30 Picscout (Israel) Ltd Efficiently obtaining content-based video
CN105678743B (zh) * 2015-12-29 2018-06-29 深圳市未来媒体技术研究院 一种视频镜头分割边界检测的方法及装置
CN105678243B (zh) * 2015-12-30 2019-02-12 山东大学 一种监控视频特征帧在线提取方法
CN108776676B (zh) * 2018-02-02 2020-05-05 腾讯科技(深圳)有限公司 信息推荐方法、装置、计算机可读介质及电子设备
CN109089159A (zh) * 2018-08-27 2018-12-25 深圳艺达文化传媒有限公司 推介视频的拼接预览方法及相关产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1336071A (zh) * 1999-07-06 2002-02-13 皇家菲利浦电子有限公司 视频序列结构的自动提取方法
CN101247470A (zh) * 2007-02-14 2008-08-20 三菱电机株式会社 用于检测视频中的场景边界的由计算机实现的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1336071A (zh) * 1999-07-06 2002-02-13 皇家菲利浦电子有限公司 视频序列结构的自动提取方法
CN101247470A (zh) * 2007-02-14 2008-08-20 三菱电机株式会社 用于检测视频中的场景边界的由计算机实现的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A Model-Based Shot Boundary Detection Technique Using Frame Transition Parameters;Partha Pratim Mohanta et al;《IEEE TRANSACTIONS ON MULTIMEDIA》;20120229;第14卷(第1期);223-233 *
A new method for shot gradual transiton detection using support vector machine;JIAN LING et al;《Proceedings of the Fourth International Conference on Machine Learning and Cybernetics》;20050821;5599-5604 *
Linear Transition Detection as a Unified Shot Detection Approach;Costantino Grana,Rita Cucchiara;《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》;20070430;第17卷(第4期);483-489 *

Also Published As

Publication number Publication date
CN103065301A (zh) 2013-04-24

Similar Documents

Publication Publication Date Title
CN103065301B (zh) 一种双向比对视频镜头分割方法
Saba et al. Analysis of vision based systems to detect real time goal events in soccer videos
CN106649663B (zh) 一种基于紧凑视频表征的视频拷贝检测方法
CN107038167A (zh) 基于模型评估的大数据挖掘分析系统及其分析方法
CN102779184A (zh) 一种近似重复视频片段自动定位方法
CN108647694A (zh) 基于上下文感知和自适应响应的相关滤波目标跟踪方法
CN104331437A (zh) 生成图片描述信息的方法和装置
CN103617263A (zh) 一种基于多模态特征的电视广告片花自动检测方法
CN103839270A (zh) 一种图像匹配方法及装置
Sun et al. A defect detection method for a boiler inner wall based on an improved YOLO-v5 network and data augmentation technologies
CN111402289A (zh) 基于深度学习的人群表演误差检测方法
Zhang et al. S4od: Semi-supervised learning for single-stage object detection
CN102306179B (zh) 基于分级颜色分布描述符的图像内容检索方法
Shen et al. HQA‐Trans: An end‐to‐end high‐quality‐awareness image translation framework for unsupervised cross‐domain pedestrian detection
CN104504729B (zh) 基于三次样条曲线的视频特征提取方法和系统
CN116630770A (zh) 一种基于深度学习的装配工艺复用的方法
Yuan et al. Detection of cigarette appearance defects based on improved YOLOv4
Mei et al. Learning multi-frequency integration network for RGBT tracking
CN104794495B (zh) 一种基于直线统计特征的大幅面遥感影像区域分类方法
Xue et al. Fabric defect detection based on the improved cascade R-CNN
CN109308458B (zh) 一种基于特征谱尺度变换提升小目标检测精度的方法
Xue et al. An efficient method of casting defects detection based on deep learning
Zhu et al. Multi-loss Spatial-Temporal Attention-Convolution Network for Action Tube Detection
Peng et al. HSNet: An Intelligent Hierarchical Semantic-Aware Network System for Real-Time Semantic Segmentation
Shen et al. Automatic video shot boundary detection of news stream using a high-level fuzzy Petri net

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150722

Termination date: 20181225

CF01 Termination of patent right due to non-payment of annual fee