CN101340576A - 利用变换和运动补偿的场景转换图像增强处理方法及系统 - Google Patents
利用变换和运动补偿的场景转换图像增强处理方法及系统 Download PDFInfo
- Publication number
- CN101340576A CN101340576A CN 200710122838 CN200710122838A CN101340576A CN 101340576 A CN101340576 A CN 101340576A CN 200710122838 CN200710122838 CN 200710122838 CN 200710122838 A CN200710122838 A CN 200710122838A CN 101340576 A CN101340576 A CN 101340576A
- Authority
- CN
- China
- Prior art keywords
- frame
- scene
- algorithm
- motion compensation
- psnr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本文提出的是一种基于变换和运动补偿的场景转换图像增强处理方法和系统,虽然MPEG-4视频编码标准能提供高品质的视频效果,但如果有场景转换发生时整体的编码效率和视觉效果都会降低。我们提出一个以运动补偿为基础的算法用来测量两张相邻画面的相似性。为了降低计算量,我们使用小波变化后低频的信号去判断是否发生了场景转换。我们的算法何以避免两张完全不同画面却具有相同特征时所造成的误判。
Description
所属技术领域
本算法涉及MPEG-4视频编码场景转换检测技术,尤其是使用了小波变换,以运动补偿为基础的检测方法。
背景技术
近年来,视频压缩的技术在许多的应用上扮演着相当重要的角色,例如资料传输与资料存储.MPEG-4标准是为了能提供更好的品质与更具弹性的应用而制定的。虽然MPEG-4视频编码标准能提供高品质的视频效果,但如果有场景转换发生时整体的编码效率和视觉效果都会降低。
为了解决这个问题我们视频编码器提出一种新的场景转换侦测机制来测量两张相邻画面的相似性。就视频压缩而言,突发的场景转换对视频质量和压缩效率影响最大.这是因为突发转换具有不可预测性.所以我们的研究主要集中于在未压缩域怎样精确检测突发场景转换.现有的突发场景转换检测方法主要有两种:基于象素的检测方法和基于特征的检测方法.基于特征的检测方法又有两种:基于直方图的和基于边缘的.而基于象素的检测方法主要用于压缩域上的检测.而基于直方图的方法的问题在于具有一个需要动态调整的阈值.基于边缘的方法算法又过于复杂.
发明内容
[要解决的技术问题]
我们提出一个以运动补偿为基础的算法用来测量两张相邻画面的相似性。为了降低计算量,我们使用小波变化后低频的信号去判断是否发生了场景转换。我们的算法何以避免两张完全不同画面却具有相同特征时所造成的误判。
[技术方案]
场景转换检测技术经常用于视频数据库系统。因为视频数据库中的视频大多是压缩过的,所以对于视频数据库系统来说,场景转换检测技术是基于压缩领域的。视频数据库使用场景转换检测技术的目的是防止数据丢失而引起的错误。我们提出的算法的目标是在未压缩领域确保前一帧和当前帧存在着某种关系。
基于上面的讨论,我们提出如下算法:
步骤1:帧内相似度度量
1)设置帧计数frame counter为0
2)从视频序列中读取一帧,解码成频带。帧计数frame counter加1
3)根据当前帧和前一帧的最低频带中生成运动补偿帧F’。
4)计算运动补偿帧F’和当前帧最低频带的PSNR值。
5)将PSNR值记录在S[frame counter]中(S[.]是一个数组)。
6)跳转到2)直到视频序列的最后一帧。
步骤2检测场景转换,计算图像组(GOP)的长度。
1)使用窗口大小为3的滑动窗口来查找关键点,将关键点标记为I。
2)计算关键点之间的区间。将个各个区间作为各个GOP所要压缩的帧。
3)如果最后一帧或两帧是B帧,并且运动补偿是后向的,则PSNR如下定义:
MSE表示原始帧和重构帧之间的平均square-error.图1是帧内相似度度量的流程图。
将一帧装载如内存之后,我们用小波变化将它分解成若干频带。使用小波变换有如下优点:
1.它可以将信号分解成若干频带,每个频带可以采用不同的分析策略。
2.它能有效的聚集信号能量,它能将空间域的频率特征保存在低频部分。
3.低频图象比DC图象更平滑,DC图象中包含对全局运动敏感的位置特征。
4.减小图象大小不但能降低PSNR的计算而且能减少接下来的一系列的运动矢量的计算。
当一帧可以通过另一帧预测时,我们称这两帧是相似的。在很多视频编码算法中,通过运动估计和运动补偿来消除时间上的冗余,特别是当处理连续帧的时候。我们设当前帧为I,前一帧为L,补偿帧为F.当且仅当I帧和L帧相似度非常高的时候,才适合使用运动补偿。运动补偿的计算是视频压缩算法的一个瓶颈,所以我们使用小波变换来减小图像大小。我们设I’,L’为I和L的低频部分。F’是通过I’和L’计算的运动补偿。
度量两幅图像之间相似度的方法有很多。在许多视频或图象压缩论文中,通常采用PSNR值来评估一个算法的效率。它可以作为评估空间相似度的客观标准,所以我们也采用PSNR值作为评估标准。
帧内相似度度量之后,下一步就是要找出场景变化的位置,确定各个片段的区间。在开始阶段,我们选择了一个固定的阈值来判断是否有场景切换。通常,如果将PSNR值设置为20,大部分场景切换都能检测到。这种方法并没有产生我们预期的效果。当同一个场景中有物体快速移动时,这种检测方法会产生错误的报警信息。
在我们的算法中,PSNR值作为一个相互关联的因素来考虑。如果有场景切换,PSNR值会降低然后立即上升。在图2中显示了这一过程。图2(a)~(d)是视频序列,图2(e)~(g)是运动补偿帧,图2(e)和(b),(g)和(d)非常相似。很明显,图2(f)和(c)非常特殊。图2(h)表示了PSNR值。
这些特殊点满足如下条件:
1)S[K]-S[K-1]>0
2)S[K+1]-S[K]<0
3)(S[K]-S[K-1])(S[K+1]-S[K])=rk<0
我们用r来表示第三个条件的值。突发场景切换是空间域上的位置变化,这样非常适合于阈值来判断位置变化。所以我们使用一个滑动窗口来检测N个连续帧之间的相似度。如图3所示,考虑N个连续的相似度值,形成一个滑动窗口。我们要找出这个范围的所有特殊点,并计算出各个特殊点的r值。在窗口的中间,通过如下式子来检测突发场景切换是否出现:
rsm是滑动窗口中第二小的数,a是一个正数,如果Rk满足上式,我们就可以判定在第k帧发生了场景切换.
大部分度量两幅连续图像相似度或相异度的方法都是基于直方图的.然而这些方法并不是太好.如图4所示,这四幅图片具有相同的直方分布,但他们并不相似.如果我们使用DOH或CHI方法,将会产生误判.这是因为基于直方图的算法并没有考虑空间上的相似性.
[有益效果]
试验结果显示,我们提出的算法在画面品质和错误判断上都有相当好的效果.我们也发现所提出的算法和传统的MPEG-2标准在相同的位元率下画质大约可以有0.33dB的提高。
附图说明
图1是帧内相似度度量的流程图;
图2是帧内相似度度量的一个例子
(a),(b),(c),(d)是输入序列,(e)是(a),(b)的运动补偿帧,(f)是(b),(c)的运动补偿帧(g)是(c),(d)的运动补偿帧,(f)是PSNR值与帧编号的对应图;
图3是一个滑动窗口的示例;
图4四幅具有相同直方分布而不同的图片。
Claims (1)
- [要解决的技术问题]我们提出一个以运动补偿为基础的算法用来测量两张相邻画面的相似性。为了降低计算量,我们使用小波变化后低频的信号去判断是否发生了场景转换。我们的算法何以避免两张完全不同画面却具有相同特征时所造成的误判。[技术方案]场景转换检测技术经常用于视频数据库系统。因为视频数据库中的视频大多是压缩过的,所以对于视频数据库系统来说,场景转换检测技术是基于压缩领域的。视频数据库使用场景转换检测技术的目的是防止数据丢失而引起的错误。我们提出的算法的目标是在未压缩领域确保前一帧和当前帧存在着某种关系。基于上面的讨论,我们提出如下算法:步骤1:帧内相似度度量1)设置帧计数frame counter为02)从视频序列中读取一帧,解码成频带。帧计数frame counter加13)根据当前帧和前一帧的最低频带中生成运动补偿帧F’。4)计算运动补偿帧F’和当前帧最低频带的PSNR值。5)将PSNR值记录在S[frame counter]中(S[.]是一个数组)。6)跳转到2)直到视频序列的最后一帧。步骤2检测场景转换,计算图像组(GOP)的长度。1)使用窗口大小为3的滑动窗口来查找关键点,将关键点标记为I。2)计算关键点之间的区间。将个各个区间作为各个GOP所要压缩的帧。3)如果最后一帧或两帧是B帧,并且运动补偿是后向的,则PSNR如下定义:MSE表示原始帧和重构帧之间的平均square-error.图1是帧内相似度度量的流程图。将一帧装载如内存之后,我们用小波变化将它分解成若干频带。使用小波变换有如下优点:1.它可以将信号分解成若干频带,每个频带可以采用不同的分析策略。2.它能有效的聚集信号能量,它能将空间域的频率特征保存在低频部分。3.低频图象比DC图象更平滑,DC图象中包含对全局运动敏感的位置特征。4.减小图象大小不但能降低PSNR的计算而且能减少接下来的一系列的运动矢量的计算。当一帧可以通过另一帧预测时,我们称这两帧是相似的。在很多视频编码算法中,通过运动估计和运动补偿来消除时间上的冗余,特别是当处理连续帧的时候。我们设当前帧为I,前一帧为L,补偿帧为F.当且仅当I帧和L帧相似度非常高的时候,才适合使用运动补偿。运动补偿的计算是视频压缩算法的一个瓶颈,所以我们使用小波变换来减小图像大小。我们设I’,L’为I和L的低频部分。F’是通过I’和L’计算的运动补偿。度量两幅图像之间相似度的方法有很多。在许多视频或图象压缩论文中,通常采用PSNR值来评估一个算法的效率。它可以作为评估空间相似度的客观标准,所以我们也采用PSNR值作为评估标准。帧内相似度度量之后,下一步就是要找出场景变化的位置,确定各个片段的区间。在开始阶段,我们选择了一个固定的阈值来判断是否有场景切换。通常,如果将PSNR值设置为20,大部分场景切换都能检测到。这种方法并没有产生我们预期的效果。当同一个场景中有物体快速移动时,这种检测方法会产生错误的报警信息。在我们的算法中,PSNR值作为一个相互关联的因素来考虑。如果有场景切换,PSNR值会降低然后立即上升。在图2中显示了这一过程。图2(a)~(d)是视频序列,图2(e)~(g)是运动补偿帧,图2(e)和(b),(g)和(d)非常相似。很明显,图2(f)和(c)非常特殊。图2(h)表示了PSNR值。这些特殊点满足如下条件:1)S[K]-S[K-1]>02)S[K+1]-S[K]<03)(S[K]-S[K-1])(S[K+1]-S[K])=rk<0我们用r来表示第三个条件的值。突发场景切换是空间域上的位置变化,这样非常适合于阈值来判断位置变化。所以我们使用一个滑动窗口来检测N个连续帧之间的相似度。如图3所示,考虑N个连续的相似度值,形成一个滑动窗口。我们要找出这个范围的所有特殊点,并计算出各个特殊点的r值。在窗口的中间,通过如下式子来检测突发场景切换是否出现:rsm是滑动窗口中第二小的数,a是一个正数,如果Rk满足上式,我们就可以判定在第k帧发生了场景切换.大部分度量两幅连续图像相似度或相异度的方法都是基于直方图的.然而这些方法并不是太好.如图4所示,这四幅图片具有相同的直方分布,但他们并不相似.如果我们使用DOH或CHI方法,将会产生误判.这是因为基于直方图的算法并没有考虑空间上的相似性.[有益效果]试验结果显示,我们提出的算法在画面品质和错误判断上都有相当好的效果.我们也发现所提出的算法和传统的MPEG-2标准在相同的位元率下画质大约可以有0.33dB的提高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710122838 CN101340576A (zh) | 2007-07-06 | 2007-07-06 | 利用变换和运动补偿的场景转换图像增强处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710122838 CN101340576A (zh) | 2007-07-06 | 2007-07-06 | 利用变换和运动补偿的场景转换图像增强处理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101340576A true CN101340576A (zh) | 2009-01-07 |
Family
ID=40214507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200710122838 Pending CN101340576A (zh) | 2007-07-06 | 2007-07-06 | 利用变换和运动补偿的场景转换图像增强处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101340576A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101917614A (zh) * | 2010-06-03 | 2010-12-15 | 北京邮电大学 | 一种基于h.264分层b帧编码结构的码率控制方法 |
CN103747267A (zh) * | 2014-01-09 | 2014-04-23 | 上海交通大学 | 基于嵌入式变换编码的压缩感知光谱成像测量值压缩方法 |
WO2015100514A1 (en) * | 2013-12-30 | 2015-07-09 | Qualcomm Incorporated | Simplification of delta dc residual coding in 3d video coding |
CN110248182A (zh) * | 2019-05-31 | 2019-09-17 | 成都东方盛行电子有限责任公司 | 一种场景片段镜头检测方法 |
-
2007
- 2007-07-06 CN CN 200710122838 patent/CN101340576A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101917614A (zh) * | 2010-06-03 | 2010-12-15 | 北京邮电大学 | 一种基于h.264分层b帧编码结构的码率控制方法 |
CN101917614B (zh) * | 2010-06-03 | 2012-07-04 | 北京邮电大学 | 一种基于h.264分层b帧编码结构的码率控制方法 |
WO2015100514A1 (en) * | 2013-12-30 | 2015-07-09 | Qualcomm Incorporated | Simplification of delta dc residual coding in 3d video coding |
US10230983B2 (en) | 2013-12-30 | 2019-03-12 | Qualcomm Incorporated | Simplification of delta DC residual coding in 3D video coding |
CN103747267A (zh) * | 2014-01-09 | 2014-04-23 | 上海交通大学 | 基于嵌入式变换编码的压缩感知光谱成像测量值压缩方法 |
CN103747267B (zh) * | 2014-01-09 | 2017-04-12 | 上海交通大学 | 基于嵌入式变换编码的压缩感知光谱成像测量值压缩方法 |
CN110248182A (zh) * | 2019-05-31 | 2019-09-17 | 成都东方盛行电子有限责任公司 | 一种场景片段镜头检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9060177B2 (en) | System and method to process motion vectors of video data | |
US9232217B2 (en) | Method and apparatus for objective video quality assessment based on continuous estimates of packet loss visibility | |
JP4001400B2 (ja) | 動きベクトル検出方法及び動きベクトル検出装置 | |
CN110519600B (zh) | 帧内帧间联合预测方法、装置、编解码器及存储装置 | |
CN106231214A (zh) | 基于可调宏块的高速cmos传感器图像近似无损压缩方法 | |
US20130148723A1 (en) | Block Error Compensating Apparatus Of Image Frame And Method Thereof | |
CN101635846A (zh) | 一种视频质量评估方法、系统及装置 | |
CN101088280B (zh) | 视频图像中场景切换或相似图像的检测方法与装置 | |
US20080049845A1 (en) | Methods and apparatus for concealing corrupted blocks of video data | |
US20130051468A1 (en) | Method and device for video predictive encoding | |
KR20070003502A (ko) | 에러 은닉 방법 및 장치 | |
CN101389029A (zh) | 一种视频图像编码和检索的方法及装置 | |
CN108596109A (zh) | 一种基于神经网络和运动矢量的目标检测方法及装置 | |
US8421928B2 (en) | System and method for detecting scene change | |
TWI339524B (en) | Device and method for coding video data | |
CN101340576A (zh) | 利用变换和运动补偿的场景转换图像增强处理方法及系统 | |
CN101931820A (zh) | 空间性错误隐藏方法 | |
KR20040106416A (ko) | 저비율 애플리케이션들을 위한 디지털 이미지들의 처리 방법 | |
EP1480170A1 (en) | Method and apparatus for processing images | |
JP2004096752A (ja) | 動きベクトルを近似する方法、該方法を実行するコンピュータプログラム、該プログラムを記憶するデータ記憶媒体、該方法を実行するように適合した装置、及び該装置を備える受信機 | |
CN108521573A (zh) | 一种分布式视频压缩感知编解码方法 | |
US6754278B1 (en) | Method for recovering moving picture by extending a damaged region in which an error occurs | |
CN101370145A (zh) | 图像帧的掩盖方法与装置 | |
JP2002281508A (ja) | スキップ領域検出型動画像符号化装置および記録媒体 | |
CN102196259B (zh) | 一种适用于压缩域的运动目标检测系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20090107 |