CN102495887A - 一种基于关键区域色彩矩阵的视频镜头分割方法及其应用 - Google Patents
一种基于关键区域色彩矩阵的视频镜头分割方法及其应用 Download PDFInfo
- Publication number
- CN102495887A CN102495887A CN2011104055423A CN201110405542A CN102495887A CN 102495887 A CN102495887 A CN 102495887A CN 2011104055423 A CN2011104055423 A CN 2011104055423A CN 201110405542 A CN201110405542 A CN 201110405542A CN 102495887 A CN102495887 A CN 102495887A
- Authority
- CN
- China
- Prior art keywords
- video
- color
- critical area
- key
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明公开了一种基于关键区域色彩矩阵的视频镜头分割方法,包括以下流程:帧预处理→定义多个关键区域→通过色彩均值化计算关键区域的色彩矩阵,得到关键矩阵→将关键矩阵储存入视频特征数据库→根据色彩矩阵,生成关键区域色彩曲线,并对曲线进行滤波→检测关键区域色彩曲线拐点,得到拐点矩阵→对拐点处相邻帧分析,计算相邻帧间距离D→通过分析D的值,判断是否存在镜头切换。本发明还公开了一种视频镜头分割方法的应用,将所述视频镜头分割方法应用于视频内容检索。本发明既能够避免只取关键帧信息而造成特征提取不全面、不准确的问题,又能克服提取一段视频整体特征而造成保存信息和检索时效率低、耗时长的弊端。
Description
技术领域
本发明涉及一种视频镜头分割方法及其应用,尤其涉及一种基于关键区域色彩矩阵的视频镜头分割方法及其在视频检索过程中的应用。
背景技术
随着信息传播工具的迅速发展,视频已经渐渐取代文本、图像成为人们日常生活中获取信息的一个主要途径,如何对这些视频进行有效的检索和识别已经成为互联网应用的一个重要问题。由于视频信息数据量大、分辨率不统一、编码多种多样等特点,制约着基于视频内容检索的发展。因此,如何提高视频内容检测的准确度与效率,成为视频内容检索关注的问题。
为了对视频内容进行有效的组织,需要将视频分解为一个个基本单元,而一般认为视频的基本物理单元是镜头,一个镜头由一组摄像机连续拍摄得到的时间上连续的若干帧图像组成。镜头的自动分割是视频结构化的基础,也是视频分析和视频检索过程中的首要任务,镜头分割在基于内容的视频分析与检索的研究中具有重要地位,镜头分割的好坏将直接影响到更高一级的视频结构化以及后续视频检索的效果。
传统镜头分割的主要思想为依据两帧图像的特征值的差值与给定阈值进行比较,如果差值大于给定的阈值,说明两帧的特征变化较大,可以认为两帧为不同的主题,在此两帧之间进行镜头分割;如果差值小于给定的阈值,则说明两帧的特征变化较小,可以认为两帧为同一主题,可以继续进行下两帧的比较。
目前镜头分割的常用方法可以分为两类:一类是基于图像的色彩特征来进行镜头分割。另一类是利用图像的形态信息进行镜头的分割。
基于图像色彩特征来进行镜头分割的基本思想是:比较两帧图像的色彩差别,当差别大于一定阈值的时候认为两帧属于不同的主题,反之则认为是同一个主题。该方法是利用整个图像的色彩差别来判断镜头的切换,计算量比较大,受画面的分辨率影响较大,并且检测切变和渐变较为复杂。另一方面,采用整个画面的颜色数据作为检索特征,特征数据很庞大,降低了检索效率。
基于图像形态信息来进行镜头分割的主要思想是:比较两帧图像形态特征的差别,例如比较两帧图像的边缘信息,或者角点信息等,如果差别较大,则认为两帧属于不同的主题,差别较小则认为是同一个主题。该方法是利用画面的形态变化来判断镜头的切换,需要额外计算图像的形态特征,计算量较大,同时也受视频分辨率等因素影响,准确率不高。
发明内容
本发明的目的就在于为了解决上述问题而提供一种基于关键区域色彩矩阵的视频镜头分割方法及其在视频内容检索领域的应用。
为了达到上述目的,本发明采用了以下技术方案:
本发明中的基于关键区域色彩矩阵的视频镜头分割方法包括以下流程:帧预处理→定义多个关键区域→通过色彩均值化计算关键区域的色彩矩阵,得到关键矩阵→将关键矩阵储存入视频特征数据库→根据色彩矩阵,生成关键区域色彩曲线,并对曲线进行滤波→检测关键区域色彩曲线拐点,得到拐点矩阵→对拐点处相邻帧分析,计算相邻帧间距离D→通过分析D的值,判断是否存在镜头切换。
所述流程中,定义关键区域的方法为:将帧图像划分为六个关键区域,分别是:中心区域、中上区域、左上区域、左下区域、右上区域和右下区域;其中,中心区域为视觉集中区域,左上区域、右上区域、左下区域、右下区域这四个区域为画面背景区域,中上区域为视频画面比例检测区域。
所述流程中,计算关键区域的色彩矩阵的方法为:首先采用以下公式计算第l帧图像的第k个关键区域的色彩向量:
其中,
式中,表示第l帧图像的第k个关键区域的色彩向量,Ωk表示第k个关键区域的像素范围,表示在第l帧图像中(i,j)处的色彩向量,分别表示第l帧图像中(i,j)处像素的RGB色彩分量,wk表示第k个关键区域的像素宽度,hk表示第k个关键区域的像素高度;
然后计算第l帧图像的关键区域的色彩矩阵Ml,其计算公式为:
所述关键矩阵的计算方法为:第l帧图像的关键矩阵Nl的计算公式为:
式中,||·||表示向量1-范数。
所述流程中,对拐点处相邻帧分析的方法为:计算第l帧拐点矩阵Tl,其计算公式如下:
所述计算相邻帧间距离D的方法为:
D=(Tl-Tl-1)T·[α1 α2…α6]T,
式中,αi,i=1,2,...,6为根据不同关键区域对镜头分割的影响而设置的权重系数。
所述流程中,判断是否存在镜头切换的方法为:设置阈值Φ,若D≥Φ,则判断在第l帧处存在镜头切换,否则判断为在第l帧处不存在镜头切换。
所述视频特征数据库的结构依次为:视频内容的文字描述;视频索引矩阵;视频关键帧的色彩矩阵、关键矩阵;视频关键帧直方图数据。
所述视频索引矩阵的计算公式为:
式中,Index表示视频索引矩阵,Kf表示当前视频序列中关键帧集合,|Kf|为集合中关键帧个数。
本发明中视频镜头分割方法的应用,将所述视频镜头分割方法应用于视频内容检索,其方法为:检测当前视频序列;采用所述视频镜头分割方法提取关键帧;根据关键帧的色彩矩阵,从视频特征数据库中检索存储的索引矩阵,获得候选视频特征列表;计算当前视频的关键帧直方图;根据直方图信息,在候选特征列表中确定当前视频内容。
本发明的有益效果在于:
由于本发明中视频镜头分割的方法采用多个关键区域划分视频帧,并针对多个关键帧计算视频索引矩阵,既能够避免只取关键帧信息而造成特征提取不全面、不准确的问题,又能克服提取一段视频整体特征而造成保存信息和检索时效率低、耗时长的弊端。
结合本发明的应用,本发明的优点还体现在以下方面:受画面分辨率影像较小;由于采用关键区域划分方法,大大降低了算法的时间复杂度,检测镜头切换速度较快,准确度较高,特征数据量较小,能够反应视频内容随时间动态变化特征。
附图说明
图1是本发明中视频镜头分割方法在视频内容检索系统中应用的整体结构图;
图2是本发明中视频镜头分割方法的流程图;
图3是本发明中视频镜头分割方法中的关键区域划分示意图;
图4是本发明中视频镜头分割方法应用于视频内容检索的方法流程图。
具体实施方式
下面结合附图对本发明作进一步具体描述:
如图2所示,本发明中视频镜头分割方法包括以下流程:
1.对视频图像进行预处理201,预处理201的过程包括统一分辨率,去噪,中值滤波。
2.对视频图像进行单帧扫描202。
3.定义多个关键区域,这里定义6个关键区域,对关键区域划分203,划分的结构如图3所示。
4.关键区域扫描204,对每帧图像计算关键区域色彩向量205,其计算公式如下:
其中,
式中,表示第l帧图像的第k个关键区域的色彩向量,Ωk表示第k个关键区域的像素范围,表示在第l帧图像中(i,j)处的色彩向量,分别表示第l帧图像中(i,j)处像素的RGB色彩分量,wk表示第k个关键区域的像素宽度,hk表示第k个关键区域的像素高度;
然后计算色彩矩阵206,其计算公式如下:
式中,Ml表示第l帧图像的关键区域的色彩矩阵;
再计算关键矩阵207,其计算公式为:
式中,Nl表示第l帧图像的关键矩阵,||·||表示向量1-范数。
5.将该帧关键矩阵、色彩矩阵存入视频特征数据库即视频特征缓存208。
7.对滤波后得到的色彩曲线进行分析,检测拐点211,计算第l帧拐点矩阵Tl,其计算公式如下:
然后进行区域加权212,再进行镜头分割213,镜头分割213首先要计算相邻帧间距离D,其计算方法为:
D=(Tl-Tl-1)T·[α1 α2…α6]T,
式中,αi,i=1,2,...,6为根据不同关键区域对镜头分割的影响而设置的权重系数;
最后判断是否存在镜头切换,其方法为:设置阈值Φ,若D≥Φ,则判断在第l帧处存在镜头切换,否则判断为在第l帧处不存在镜头切换。
8.当发生镜头切换时,进行关键帧提取214,具体为:提取镜头变换的第一帧作为关键帧。
9.计算索引矩阵215,其计算公式为:
式中,Index表示视频索引矩阵,Kf表示当前视频序列中关键帧集合,|Kf|为集合中关键帧个数。
如图1所示,基于本发明中视频镜头分割方法的视频内容检索系统主要涉及两个阶段:特征提取阶段和特征检索阶段,分为离线过程和在线过程。见图1中101-104,离线过程主要完成对视频样本库中的视频进行特征提取,并存入视频特征库105;见图1中102-104和106-108,在线过程主要应用类似原理对待检测视频完成特征提取,然后与视频特征库105中的特征进行匹配,完成特征检索的过程,最后输出结果,确定待检索视频内容。
在特征提取阶段主要是经过视频镜头分割,提取视频特征,具体步骤如图2所示。
在特征检索阶段,利用同样的方法进行镜头分割,提取当前视频的关键帧特征,并在数据库中进行比对,根据比对结果来判断该视频的内容。详细步骤如图4所示,包括如下流程:
1.对待检测视频进行预处理401,并获取首帧色彩矩阵402;
2.将得到的色彩矩阵与视频特征库中的视频索引矩阵进行特征粗匹配403,得到与当前视频颜色相近的一系列视频特征,即候选特征列表404;
3.继续检测视频中的镜头切换,获取关键帧405,以及关键帧直方图406;
4.将得到的关键帧的直方图,与候选特征列表对应的关键帧直方图进行精确匹配407,判断当前待检索视频与特征库中视频数据是否一致,然后进行检索结果输出408,完成视频检索。
如图3所示,本发明中视频镜头分割方法中关键区域的分布,将帧图像划分为六个关键区域,分别是:中心区域即图中区域4、中上区域即图中区域2、左上区域即图中区域1、左下区域即图中区域5、右上区域即图中区域3和右下区域即图中区域6;其中,中心区域为视觉集中区域,左上区域、右上区域、左下区域、右下区域这四个区域为画面背景区域,中上区域为视频画面比例检测区域。这六个区域包含了大多数的前景和背景内容。与采用整幅视频图像进行计算的方法相比,这种关键区域划分方法能够减少视频字幕、台标等因素对镜头分割造成的影响,提高镜头分割精度,减少镜头分割检测时间。
Claims (8)
1.一种基于关键区域色彩矩阵的视频镜头分割方法,其特征在于:包括以下流程:帧预处理→定义多个关键区域→通过色彩均值化计算关键区域的色彩矩阵,得到关键矩阵→将关键矩阵储存入视频特征数据库→根据色彩矩阵,生成关键区域色彩曲线,并对曲线进行滤波→检测关键区域色彩曲线拐点,得到拐点矩阵→对拐点处相邻帧分析,计算相邻帧间距离D→通过分析D的值,判断是否存在镜头切换。
2.根据权利要求1所述的基于关键区域色彩矩阵的视频镜头分割方法,其特征在于:所述流程中,定义关键区域的方法为:将帧图像划分为六个关键区域,分别是:中心区域、中上区域、左上区域、左下区域、右上区域和右下区域;其中,中心区域为视觉集中区域,左上区域、右上区域、左下区域、右下区域这四个区域为画面背景区域,中上区域为视频画面比例检测区域。
5.根据权利要求1所述的基于关键区域色彩矩阵的视频镜头分割方法,其特征在于:所述流程中,判断是否存在镜头切换的方法为:设置阈值Φ,若D≥Φ,则判断在第l帧处存在镜头切换,否则判断为在第l帧处不存在镜头切换。
6.根据权利要求1所述的基于关键区域色彩矩阵的视频镜头分割方法,其特征在于:所述视频特征数据库的结构依次为:视频内容的文字描述;视频索引矩阵;视频关键帧的色彩矩阵、关键矩阵;视频关键帧直方图数据。
7.根据权利要求6所述的基于关键区域色彩矩阵的视频镜头分割方法,其特征在于:所述视频索引矩阵的计算公式为:
式中,Index表示视频索引矩阵,Kf表示当前视频序列中关键帧集合,|Kf|为集合中关键帧个数。
8.一种如权利要求1所述的基于关键区域色彩矩阵的视频镜头分割方法的应用,其特征在于:将所述视频镜头分割方法应用于视频内容检索,其方法为:检测当前视频序列;采用所述视频镜头分割方法提取关键帧;根据关键帧的色彩矩阵,从视频特征数据库中检索存储的索引矩阵,获得候选视频特征列表;计算当前视频的关键帧直方图;根据直方图信息,在候选特征列表中确定当前视频内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110405542.3A CN102495887B (zh) | 2011-12-08 | 2011-12-08 | 一种基于关键区域色彩矩阵的视频镜头分割方法及其应用方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110405542.3A CN102495887B (zh) | 2011-12-08 | 2011-12-08 | 一种基于关键区域色彩矩阵的视频镜头分割方法及其应用方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102495887A true CN102495887A (zh) | 2012-06-13 |
CN102495887B CN102495887B (zh) | 2014-03-26 |
Family
ID=46187712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110405542.3A Expired - Fee Related CN102495887B (zh) | 2011-12-08 | 2011-12-08 | 一种基于关键区域色彩矩阵的视频镜头分割方法及其应用方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102495887B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103237233A (zh) * | 2013-03-28 | 2013-08-07 | 深圳Tcl新技术有限公司 | 一种电视广告的快速检测方法及系统 |
CN103455748A (zh) * | 2013-08-15 | 2013-12-18 | 华为技术有限公司 | 校验码获取方法及装置 |
CN104580300A (zh) * | 2013-10-18 | 2015-04-29 | 拍知道(北京)信息技术有限公司 | 基于云端运算的图形与实景识别的方法和系统 |
CN106331524A (zh) * | 2016-08-18 | 2017-01-11 | 无锡天脉聚源传媒科技有限公司 | 一种识别镜头切换的方法及装置 |
CN110460838A (zh) * | 2019-07-11 | 2019-11-15 | 平安科技(深圳)有限公司 | 一种镜头切换的检测方法、装置及计算机设备 |
TWI798874B (zh) * | 2021-10-15 | 2023-04-11 | 海華科技股份有限公司 | 亮度差異修正系統、亮度差異修正方法以及圖表顯示結構 |
CN116399401A (zh) * | 2023-04-14 | 2023-07-07 | 浙江年年发农业开发有限公司 | 一种基于人工智能的农业种植系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6549643B1 (en) * | 1999-11-30 | 2003-04-15 | Siemens Corporate Research, Inc. | System and method for selecting key-frames of video data |
CN1687929A (zh) * | 2005-05-13 | 2005-10-26 | 北京工业大学 | 基于视频特征曲线的视频检索的方法 |
CN101236604A (zh) * | 2008-01-11 | 2008-08-06 | 北京航空航天大学 | 一种快速的镜头边界检测方法 |
CN102129681A (zh) * | 2011-02-28 | 2011-07-20 | 太原理工大学 | 一种镜头边界检测方法 |
CN102254006A (zh) * | 2011-07-15 | 2011-11-23 | 上海交通大学 | 基于内容的互联网视频检索方法 |
-
2011
- 2011-12-08 CN CN201110405542.3A patent/CN102495887B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6549643B1 (en) * | 1999-11-30 | 2003-04-15 | Siemens Corporate Research, Inc. | System and method for selecting key-frames of video data |
CN1687929A (zh) * | 2005-05-13 | 2005-10-26 | 北京工业大学 | 基于视频特征曲线的视频检索的方法 |
CN101236604A (zh) * | 2008-01-11 | 2008-08-06 | 北京航空航天大学 | 一种快速的镜头边界检测方法 |
CN102129681A (zh) * | 2011-02-28 | 2011-07-20 | 太原理工大学 | 一种镜头边界检测方法 |
CN102254006A (zh) * | 2011-07-15 | 2011-11-23 | 上海交通大学 | 基于内容的互联网视频检索方法 |
Non-Patent Citations (2)
Title |
---|
王丽红 等: "一种基于颜色特征的视频镜头边界检测方法", 《计算机工程与科学》 * |
耿玉亮 等: "视频镜头边界检测的统一策略", 《中国图象图形学报》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103237233A (zh) * | 2013-03-28 | 2013-08-07 | 深圳Tcl新技术有限公司 | 一种电视广告的快速检测方法及系统 |
CN103455748A (zh) * | 2013-08-15 | 2013-12-18 | 华为技术有限公司 | 校验码获取方法及装置 |
CN103455748B (zh) * | 2013-08-15 | 2017-06-27 | 华为技术有限公司 | 校验码获取方法及装置 |
CN104580300A (zh) * | 2013-10-18 | 2015-04-29 | 拍知道(北京)信息技术有限公司 | 基于云端运算的图形与实景识别的方法和系统 |
CN106331524A (zh) * | 2016-08-18 | 2017-01-11 | 无锡天脉聚源传媒科技有限公司 | 一种识别镜头切换的方法及装置 |
CN106331524B (zh) * | 2016-08-18 | 2019-07-26 | 无锡天脉聚源传媒科技有限公司 | 一种识别镜头切换的方法及装置 |
CN110460838A (zh) * | 2019-07-11 | 2019-11-15 | 平安科技(深圳)有限公司 | 一种镜头切换的检测方法、装置及计算机设备 |
CN110460838B (zh) * | 2019-07-11 | 2022-09-30 | 平安科技(深圳)有限公司 | 一种镜头切换的检测方法、装置及计算机设备 |
TWI798874B (zh) * | 2021-10-15 | 2023-04-11 | 海華科技股份有限公司 | 亮度差異修正系統、亮度差異修正方法以及圖表顯示結構 |
CN116399401A (zh) * | 2023-04-14 | 2023-07-07 | 浙江年年发农业开发有限公司 | 一种基于人工智能的农业种植系统及方法 |
CN116399401B (zh) * | 2023-04-14 | 2024-02-09 | 浙江年年发农业开发有限公司 | 一种基于人工智能的农业种植系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102495887B (zh) | 2014-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102495887B (zh) | 一种基于关键区域色彩矩阵的视频镜头分割方法及其应用方法 | |
CN112001339B (zh) | 一种基于YOLO v4的行人社交距离实时监测方法 | |
CN102663015B (zh) | 基于特征袋模型和监督学习的视频语义标注方法 | |
CN113971209B (zh) | 一种基于注意力机制增强的无监督跨模态检索方法 | |
CN102395984A (zh) | 用于视频内容分析的关键帧提取 | |
Varnousfaderani et al. | Weighted color and texture sample selection for image matting | |
CN112508090A (zh) | 一种外包装缺陷检测方法 | |
CN103440640A (zh) | 一种视频场景聚类及浏览方法 | |
CN103559196A (zh) | 一种基于多核典型相关分析的视频检索方法 | |
CN102331990A (zh) | 一种基于字幕提取的新闻视频检索方法 | |
RU2697649C1 (ru) | Способы и системы сегментации документа | |
CN111008978B (zh) | 基于深度学习的视频场景分割方法 | |
CN101365072A (zh) | 字幕区域提取装置和方法 | |
CN115019111B (zh) | 用于互联网文创作品的数据处理方法 | |
CN103631932A (zh) | 一种对重复视频进行检测的方法 | |
CN103279473A (zh) | 海量视频内容检索方法、系统及移动终端 | |
CN104036280A (zh) | 基于感兴趣区域和聚类相结合的视频指纹方法 | |
CN114998744B (zh) | 基于运动与视觉双特征融合的农机轨迹田路分割方法及装置 | |
CN111353544A (zh) | 一种基于改进的Mixed Pooling-YOLOV3目标检测方法 | |
CN113112519A (zh) | 基于感兴趣目标分布的关键帧筛选方法 | |
CN108966042B (zh) | 一种基于最短路径的视频摘要生成方法及装置 | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
CN111221819B (zh) | 一种基于多维数据空间分割的相似台风快速匹配方法 | |
CN112446308A (zh) | 基于语义增强的多尺度特征金字塔融合的行人检测方法 | |
CN112633389A (zh) | 一种基于mdl和速度方向的飓风运动轨迹趋势计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140326 Termination date: 20211208 |