CN101184221A - 基于视觉关注度的视频编码方法 - Google Patents

基于视觉关注度的视频编码方法 Download PDF

Info

Publication number
CN101184221A
CN101184221A CNA2007101718461A CN200710171846A CN101184221A CN 101184221 A CN101184221 A CN 101184221A CN A2007101718461 A CNA2007101718461 A CN A2007101718461A CN 200710171846 A CN200710171846 A CN 200710171846A CN 101184221 A CN101184221 A CN 101184221A
Authority
CN
China
Prior art keywords
macro block
texture
edge
local motion
mobility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101718461A
Other languages
English (en)
Inventor
沈礼权
张兆扬
刘志
王蕾睿
杨其彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CNA2007101718461A priority Critical patent/CN101184221A/zh
Publication of CN101184221A publication Critical patent/CN101184221A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种基于视觉关注度视频编码方法。本方法是将人眼视觉关注特性引入到视频编码中:通过对宏块局部运动度、边缘强度以及纹理活动度的分析,将宏块归类为:局部运动宏块、边缘宏块、平滑宏块以及纹理宏块;基于人眼对于这四种类型宏块关注度的不同,调节宏块的量化参数。本发明在增加不到4%的计算量的同时,可提高10%编码效率,且能改善视频编码的主观质量。

Description

基于视觉关注度的视频编码方法
技术领域
本发明涉及到一种基于视觉关注度的视频编码方法。特别是与现有方法截然不同的是将人眼视觉关注度融入到视频编码中。
背景技术
ITU-T和ISO联合推出视频编码的新标准H.264/AVC。H.264/AVC采用和发展了近几年视频编码方面的先进技术,以较高编码效率和网络友好性而著称。但它仍基于以前视频编码标准的运动补偿混合编码方案,主要不同有:增强的运动预测能力;准确匹配的较小块变换;自适应环内滤波器;增强的熵编码。测试结果表明这些新特征使编码效率比以前的标准约提高50%。然而,随着各种压缩编码技术的日趋完善和成熟,压缩效率已达到较高水平,压缩比很难有较大的提高。视频编码中量化能提高压缩效率的同时,也必然造成图像的失真。视频编码的失真是由量化参数选取不当或量化矩阵不合适造成的。HVS特性是选择量化参数QP时需要考虑的一个关键的因素。近年来,国内外研究学者逐渐将HVS特性应用到视频编码算法中,一些学者提出了基于对象的视频编码方法,降低关注对象的量化参数,改善关注对象的质量,从而提高视频的主观质量。这类方法存在的问题需要对视频关注对象进行分割,在编码器中引入了大量计算复杂度,很难应用在实时性要求高的场合。由于人眼对于动态区域更敏感,在相同的MSE的条件下,人眼对于动态区域的失真敏感度比静态区域高,在动态区域和静态区域共存于一副图像中时,人眼对于动态区域的敏感度更高。同时,人眼对图像中心区域更为关注。根据上述理论,一些学者对图像质量的评测标准MSE和PSNR进行修正,主要思路是对于人眼敏感的区域中的宏块,通过对MSE加权,使得带加权系数的MSE大于客观评测标准,而对于人眼不敏感的区域中的宏块,则做相反的修改。同时对失真模型中失真权数进行修改,利用Lagrange求解带感知权数的最优量化步长,最终形成低时延视频通信的可感知码率控制算法。实验结果表明上述基于视觉特性改进的码率控制算法在几乎相同的码率下可以获得更高的感知PSNR。但是,对于动态区域以及中心区域的提取没有给出合适的算法。同时,对于失真模型以及MSE的加权系数没有给出合理的计算方法。而前者是整个算法实现的基础,后者关系到整个算法的精确程度。另外一些文献利用人脸检测算法和空域频域Foveation加权模型进行视觉注意点的选择,并实现了分级编码。该类算法需引入人脸检测,增加了编码器复杂度,且仅针对某一类视频,普适性差。近来还有一些文献根据宏块的亮度特性、颜色分布特性、时域活动特性以及目标大小等人眼的感兴趣区域,结合分析镜头运动为区域中的不同宏块确定不同的视觉重要性,以此为基础确定各个宏块总的自适应量化加权系数。这些算法首先根据序列复杂性分析确定帧级量化参数,然后利用各个宏块总的自适应量化加权系数进行迭代算法调整并获得宏块的实际量化参数。从而实现与MPEG-2语法一致的非实时应用下的感知码率控制算法。然而,上述方法也存在以下不足之处:首先,在编码前要得到编码帧各个宏块的运动矢量,必须要对当前帧进行预先编码,会在原有的编码器中引入一倍的计算量。其次,运动有全局运动和局部运动,全局运动为非关注区域,局部运动为关注区域,上述方法中并没有提出一个有效策略区分全局运动(背景运动)和局部运动,将非关注背景区域误认为关注区域处理。再次,这类算法根据匹配估计的运动矢量场分析镜头运动、确定运动目标的分割。然而,块匹配运动估计算法是以最优率失真性能为目标,块匹配的运动向量场与实际运动存在偏差。运动向量场的准确性对于HVS的时间掩盖效应和视觉兴趣性有重要影响。
从上述国内外研究现状分析可以发现,基于HVS模型的高效视频编码算法在国际上尚处在不成熟阶段。国内外现有的研究结果可以启示我们,现有的应用于视频编码的视觉特性只是模型中的某部分或只针对某一特定的对象(人脸或者皮肤),而且大部分算法在确定感知的加权系数时是根据几个序列的经验值,这些值的选取不具有普遍的意义。如果不将这些宏观的特性统一到一个较完整的感知模型下,所进行的感知编码算法只能是部分地反映人类视觉感知系统的局部特征。同时,上述大部分算法在确定感兴趣区域需耗费相当大的计算量,如视频对象的分割、人脸区域的检测和局部运动区域的提取,很难在实时性要求比较高的场合下应用。
发明内容
本发明的目的是提供一种基于视觉关注度的视频编码方法,在计算量增加不大的同时,可显著提高编码效率,且能改善视觉编码的主观质量。
为达到上述发明目的,本发明构思如附图1所示,首先,检测宏块的局部运动度,由宏块的局部运动度,快速分割局部运动宏块。接着,检测宏块的边缘强度和纹理活动度,由宏块边缘强度和纹理活动度,快速分割边缘、平滑和纹理宏块。最后,根据人眼视觉关注度的不同,调节不同类型宏块的量化参数。本发明可以提高关注区域的信噪比,降低非关注以及能够掩盖更多失真的区域的信噪比,从而可以在降低码流比特率的同时,改善图像的主观质量。
运动对我们的视觉注意力影响最大。我们的视觉注意力会不由自主地被吸引到与周围环境发生了运动的区域。运动分为全局运动和局部运动,全局运动为人眼视觉非关注区域,局部运动为人眼视觉关注区域。时间域掩盖效应又表明,人眼对快速运动目标的细节分辨率会低于静止的目标。但是在平滑跟踪眼睛移动效应(SPEM)作用下,人眼对视频中运动区域的噪声和视觉模糊的灵敏度会相对提高。当观察者的眼睛跟踪感兴趣的平滑运动目标时,SPEM效应会改变人眼视觉系统的空间域和时间域的掩盖效应。在考虑图像序列的运动特性对视觉感知的影响时,必须要得到真实的运动矢量。现有视频编码标准中采用的都是块匹配的运动估计算法,即假设整个块内的所有像素点有相同的运动。所以估计的运动矢量可能偏离真实运动,特别是当宏块中包含运动边缘信息情况下。另一方面,在编码前要得到编码帧各个宏块的运动矢量,必须要对当前帧进行预编码,会在原有的编码器中引入一倍的计算量。运动有全局运动和局部运动,需要一种方法有效的区分全局运动和局部运动。现在文献中一般采用全局运动估计算法提取局部运动。然而,全局运动估计算法又要在编码器中引入相当大的计算量。为此本发明提出一种快速分割局部运动的方法。宏块的局部运动度A(i,j)定义如下:
A ( i , j ) = Σ m = 0 16 Σ n = 0 16 | I t ( i · 16 + m , j · 16 + n ) - I t - 1 ( i · 16 + m + m v x , j · 16 + n + m v y ) | - - - ( 1 )
其中,It和It-1分别代表当前帧和前一帧,i和j为宏块坐标,mvx和mvy为前一帧对应位置宏块的运动矢量。必须强调的是在计算宏块局部运动度之前对每一帧需进行简单的3×3低通滤波以减少高频噪声的影响。全局运动由镜头引起,其运动矢量在时域方向具有一致性。局部运动由前景运动引起,具有随机性。其运动矢量在时域方向是非连续的。全局运动以及静止区域宏块的运动矢量可以用前一帧相同位置宏块的运动矢量近似,由(1)式可知,这些宏块具有比较小的局部运动度。相反,局部(前景)运动宏块具有相当大的局部运动度。当宏块的局部运动度A(i,j)大于某个阈值Thrm时,本发明认为此宏块为局部运动宏块,Thrm定义如下:
Thr m = 1 M × N Σ i = 0 M - 1 Σ j = 0 N - 1 A ( i , j ) - - - ( 2 )
上式中M和N分别表示帧在水平、垂直方向上的宏块数。
我们以QCIF为格式的“Children”图像为例,各宏块的图像及相应的局部运动度的分布如附图2所示。
空间掩盖效应表明,失真容易在图像平滑区和边缘区容易被察觉,而在高频成分比较丰富的纹理区可以被掩盖。TM5中用方差来度量宏块的空间活动度,方差可以有效的区分平滑区域和纹理区域,但是不能有效区分强边缘区域和纹理区域。按照TM5的量化策略和定义的空间活动特性,强边缘区和纹理区都被粗量化,这不符合人眼对边缘敏感的特性。目前,很多学者在纹理活动度度量这个方面做了进一步研究。纹理活动性的度量的方法可大致归类为以下五种,宏块方差、绝对方差、水平和垂直梯度、DCT系数以及边缘检测。Kim等学者对这五种纹理活动性度量方法进行了比较,发现采用梯度的纹理活动度量方法相对来说准确性和复杂度都有比较好的性能,但它不能有效区分强边缘和纹理。边缘检测方法只能检测出强边缘,但不能有效检测出纹理。为此,本发明提出将一种将梯度和边缘检测相结合的方法来区分平滑、纹理及边缘区域。在我们发明中采用以下水平/垂直梯度式度量纹理活动度,宏块的纹理活动度定义如下:
TACT ( i , j ) = 1 16 × 15 { Σ m = 0 14 Σ n = 0 15 | I 16 · i + m , 16 · j + n - I 16 · i + m + 1,16 · j + n | + Σ m = 0 15 Σ n = 0 14 | I 16 · i + m , 16 · j + n - I 16 · i + m , 16 · j + n + 1 | } - - - ( 3 )
上式中,i,j分别表示宏块的水平和垂直坐标、TACT(i,j)为宏块MBi,j的纹理活动度、Im,n为位置(m,n)的亮度值。当宏块纹理活动度大于阈值Thri,本发明认为此宏块为纹理宏块或者边缘宏块。阈值Thrt定义如下:
Thr t = 1 ( M - 1 ) × N · Σ i = 0 M - 2 Σ j = 0 N - 1 | I i , j - I i + 1 , j | + 1 M × ( N - 1 ) · Σ i = 0 M - 1 Σ j = 0 N - 2 | I i , j - I i , j + 1 - - - ( 4 )
上式中M和N分别表示帧在水平、垂直方向的像素点数。
本发明选择Canny边缘检测器作为边缘检测的方法。该方法总结如下:(1)图像使用带有指定标准偏差σ的高斯滤波器来平滑,从而减少噪声。(2)在每一点计算局部梯度 g ( x , y ) = [ G x 2 + G y 2 ] 1 / 2 和边缘方向α(x,y)=arctan(Gy/Gx)。边缘定义为梯度方向上其强度局部最大的点。(3)在第2条中确定的边缘点会导致梯度幅度图像中出现脊。然后算法追踪所有脊的顶部,并将所有不在脊的顶部像素设为零,以便在输出中给出一条曲线,这就是众所周知的非最大值抑制处理。脊像素使用两个阈值T1和T2做阈值处理,其中T1<T2。值大于T2的脊像素称为强边缘,T1和T2之间的脊像素称为弱边缘像素。最后,算法通过将不连接的弱像素集成到强像素,执行边缘链接。宏块的边缘强度定义如下,
EACT ( i , j ) = 1 16 × 16 Σ m = 0 15 Σ n = 0 15 e 16 · i + m , 16 · j + n - - - ( 5 )
上式中,i,j分别表示宏块在水平方向和垂直方向上的坐标,em、n为点(m,n)边缘强度,EACT(i,j)为宏块MBi,j的边缘强度。当宏块的边缘强度大于某个阈值Thre,当前宏块被认为边缘宏块。阈值Thre定义如下:
Th r e = 1 M × N Σ i = 0 M - 1 Σ j = 0 N - 1 e i , j - - - ( 6 )
上式中M和N分别表示帧在水平、垂直方向的像素点数。
基于上述计算所得的宏块纹理强度和边缘强度,本发明可以有效区分边缘宏块、平滑宏块和纹理宏块。当宏块的边缘强度大于阈值Thre,此宏块为边缘宏块。当宏块的纹理活动度大于阈值Thrt且当宏块的边缘强度小于阈值Thre,此宏块为纹理宏块。当宏块的纹理活动度小于阈值Thrt,此宏块为平滑宏块。以QCIF格式的视频序列“Suize”为例,各宏块的图像、相应的纹理活动度以及边缘强度分布如附图3所示。
按照宏块的局部运动度、纹理活动度以及边缘强度将宏块可以分为下面四类:局部运动宏块(I)、边缘宏块(II)、平滑宏块(III)和纹理宏块(IV)。人眼对于这四类宏块失真敏感度高低排序依次如下:局部运动宏块、边缘宏块、平滑宏块和纹理宏块。基于人眼视觉关注度不同,本发明对各类型宏块的量化参数(QP)调整如下式所示:
QP ′ ( i , j ) = QP - DQP / 2 MB ( i , j ) ∈ I QP MB ( i , j ) ∈ II QP + DQP / 2 MB ( i , j ) ∈ III QP + DQP MB ( i , j ) ∈ IV - - - ( 7 )
根据上述的发明构思,本发明采用下面所述的技术方案:
一种基于视觉关注度视频编码方法,其特征在于将人眼视觉关注特性引入到视频编码中:通过对宏块局部运动度、边缘强度以及纹理活动度的分析,将宏块归类为:局部运动宏块、边缘宏块、平滑宏块以及纹理宏块;基于人眼对于这四种类型宏块关注度的不同,调节宏块的量化参数;其步骤是:
(1)局部运动宏块快速分割:对输入的图像帧进行滤波,以减少高频噪声的影响,计算宏块局部运动度以及运动度阈值,由局部运动度及活动度阈值,将宏块归类为局部运动宏块和非局部运动宏块;
(2)边缘宏块快速分割:采用Canny边缘检测器检测边缘输出各个像素点的边缘强度,计算宏块边缘强度以及边缘强度的阈值,将宏块归类为边缘宏块和非边缘宏块;
(3)纹理宏块的快速分割:采用水平/垂直梯度检测纹理输出各个像素点的纹理活动度,计算宏块纹理活动度以及纹理活动度的阈值,将宏块归类为纹理宏块和平滑宏块;
(4)宏块量化参数的调节:选择调节参数,基于人眼对不同类型的宏块关注度不同,对宏块的量化参数进行调节。
上述的局部运动宏块快速分割的步骤是:
(1)采用3×3低通滤波器对处理帧进行滤波,以减弱高频噪声的影响;
(2)由当前帧宏块的坐标,提取前一帧对应位置宏块的运动矢量;
(3)由提取的宏块运动矢量、当前帧亮度像素值以及前一帧亮度像素值,计算宏块的局部运动度和运动度阈值Thrm
(4)由步骤(3)得到的宏块局部运动度和阈值Thrm,将宏块归类为局部运动宏块和非局部运动宏块。
上述的边缘宏块的快速分割的步骤是:
(1)采用Canny边缘检测器检测边缘,输出各个像素点边缘强度;
(2)由步骤(1)输出各个像素点边缘强度,计算宏块的边缘强度和边缘强度阈值Thre
(3)由步骤(2)得到的宏块边缘强度和边缘强度阈值Thre,将宏块归类为边缘宏块和非边缘宏块。
上述的纹理宏块的快速分割的步骤是:
(1)采用水平/垂直梯度检测纹理,输出各个像素点纹理活动度;
(2)由步骤(1)输出各个像素点纹理活动度,计算宏块的纹理活动度和纹理活动度阈值Thrt
(3)由步骤(2)得到的宏块纹理活动度、纹理活动度阈值Thrt、宏块边缘强度以及强度阈值Thre,将宏块归类为纹理宏块和平滑宏块。
上述的宏块量化参数的调节的步骤是:
(1)确定调节参数DQP;
(2)调节各类型宏块的量化参数(QP):对于局部运动宏块调节后的量化参数QP′=QP-DQP/2,边缘宏块调节后的量化参数QP′=QP,平滑宏块调节后的量化参数QP′=QP+DQP/2,纹理宏块调节后的量化参数QP′=QP′+DQP。
本发明与现有技术相比较,其有如下显而易见的突出实质性特点和显著优点,本发明引入运动关注度模型和纹理关注度模型,提出了基于运动和纹理关注度的码率分配算法,在增加不到4%的计算量的同时,可提高10%编码效率,且能改善视频编码的主观质量。
附图说明
附图1是基于人眼视觉关注度视频编码的结构框图。
附图2是“Children”序列图像及相应的局部运动度的分布。
附图3是“Suize”序列图像、相应的纹理活动度以及边缘强度分布。
附图4是“Suize”序列本发明的解码图像和H.264解码图像。
具体实施方式
本发明的一个优选实施如下所述:
参见图1,本发明是基于视觉关注度的视频编码方法。首先,基于宏块局部运动度、纹理活动度、边缘强度,快速分割局部运动宏块、边缘宏块、纹理宏块和平滑宏块。
接着,基于人眼视觉对各种类型宏块关注度的不同,对宏块的量化参数进行调整。本方法提高视频主观质量的同时,降低10%左右的码率。
其步骤是:
(1)快速分割局部运动的宏块:提取前一帧相同位置宏块的运动矢量,由式(1)和(2)分别计算各个宏块局部运动度、运动度的阈值Thrm,如果宏块的局部运动度大于阈值Thrm,此宏块被认为局部运动宏块(I类)。
(2)快速分割边缘宏块:采用Canny边缘检测器检测边缘,由Canny边缘检测器检测点边缘强度,由式(5)和(6)分别计算宏块边缘强度、边缘强度的阈值Thre,如果宏块的边缘强度大于阈值Thre,此宏块被认为边缘宏块(II类)。
(3)快速分割纹理和平滑宏块,采用水平和垂直方向的梯度检测纹理的活动度,由式(3)和(4)分别计算宏块纹理活动度、纹理活动度的阈值Thrt,如果宏块的纹理活动度大于阈值Thrt且宏块的边缘强度小于阈值Thre,此宏块被认为纹理宏块(IV类);如果宏块的纹理活动度小于阈值Thrt,此宏块被认为平滑宏块(III类)。
(4)基于人眼视觉对各类宏块关注度不同,对宏块的量化参数进行调整。调节参数为DQP,I类宏块调节后的量化参数:QP′=QP-DQP/2,II类宏块调节后的量化参数:QP′=QP,III类宏块调节后的量化参数:QP′=QP+DQP/2,IV类宏块调节后的量化参数:QP′=QP+DQP。
上述局部运动宏块快速分割的步骤如下:
(1)采用3×3低通滤波器对处理帧进行滤波,以减少高频噪声的影响。
(2)根据当前帧宏块的坐标,提取前一帧对应位置宏块的运动矢量。
(3)由提取的宏块运动矢量、当前帧亮度像素值以及前一帧亮度像素值,计算各个宏块的局部运动度和运动度阈值Thrm
(4)由步骤(3)得到的宏块局部运动度和阈值Thrm,将宏块归类为局部运动宏块和非局部运动宏块。
上述的快速分割边缘宏块步骤如下:
(1)采用Canny边缘检测器检测边缘,输出各个像素点边缘强度。
(2)由步骤(1)输出各个像素点边缘强度,计算宏块的边缘强度和边缘强度阈值Thre
(3)由步骤(2)得到的宏块边缘强度和边缘强度阈值Thre,将宏块归类为边缘宏块和非边缘宏块。
上述的快速分割纹理宏块步骤如下:
(1)采用水平/垂直梯度检测纹理的活动度,输出各个像素点纹理活动度。
(2)由步骤(1)输出各个像素点纹理活动度,计算宏块的纹理活动度和纹理活动度阈值Thrt
(3)由步骤(2)得到的宏块纹理活动度、纹理活动度阈值Thrt、宏块边缘强度以及边缘强度阈值Thre,将宏块归类为纹理宏块和平滑宏块。
上述的基于人眼视觉关注度量化参数调节步骤如下:
(1)确定调节参数DQP。
(2)调节各类型宏块的量化参数QP。局部运动宏块调节后的量化参数:QP′=QP-DQP/2,边缘宏块调节后的量化参数:QP′=QP,纹理宏块调节后的量化参数:QP′=QP+DQP,平滑宏块调节后的量化参数:QP′=QP+DQP/2。
下面比较H.264码率分配算法和本发明码率分配算法,仿真条件如表1。
           表1.编码参数
  Symbol Mode   CABAC
  RD Optimization   On
  Qp   24、28
  Reference Frame   1
  MV Reference Range   16
以下给出一个输入的视频格式为QCIF的实例。首先对输入视频进行滤波、计算宏块局部运动度、快速分割局部运动宏块,接着进行边缘检测、快速分割边缘宏块,然后采用水平/垂直梯度进行纹理检测、快速分割纹理宏块,最后根据人眼视觉关注度的不同,对不同类型宏块的量化参数进行调节。实例以五个QCIF格式测试序列Salesman、Silent、Suzie、Foreman和Children作为输入视频。表2比较了H.264码率分配和本发明码率分配的编码效率。图2示出“Children”序列图像和宏块局部运动度分布,其中图a为28th帧图像,图b为28th宏块局部运动度分布。图3示出“Suize”序列图像(图a)、相应的纹理活动强度(图b)及边缘强度分布(图c)。图4以视频序列“Suize”为例比较H.264解码图像(b图、d图)和本发明的解码图像(a图、c图)。可见本发明可以降低10%码流码率、提高编码效率的同时,图像的主观质量也有所提高。表3比较了以H.264码率分配的编码复杂度和本发明的编码复杂度,本发明仅增加了不到H.264编码器4%运算量。
            表2.H.264码率分配和本发明的码率分配的编码效率比较
  QP   H.264的码率分配   本发明的码率分配   比特率变化
  测试序列   比特率(kbps)   比特率(kbps)   比特率提高(%)
  Salesman   24   99.29   86.35   -13.03%
  28   58.82   51.17   -13.01%
  Silent   24   127.6   117.55   -7.88%
  28   78.47   72.19   -8.00%
  Suzie   24   151.02   130.74   -13.43%
  28   80.24   74.84   -6.73%
  Forman   24   215.27   184.07   -14.49%
  28   128.7   112.23   -12.80%
  Children   24   247.18   248.28   0.45%
  28   158.05   163.13   3.21%
                        表3.本发明运算复杂度的分析
测试序列   以H.264码率分配所需的编码运算时间(ms/帧)   以本发明的码率分配所需的编码运算时间(ms/帧)   本发明增加的运算时间(ms/帧)   本发明增加时间占总运算时间的百分比(%)
  Salesman   72.3   75.2   2.8   3.9%
  Silent   80.5   83.5   3.0   3.7%
  Suzie   87.6   91.0   3.4   3.9%
  Foreman   93.4   86.5   3.1   3.4%
  Children   82.8   85.4   2.6   3.1%

Claims (5)

1.一种基于视觉关注度视频编码方法,其特征在于将人眼视觉关注特性引入到视频编码中:通过对宏块局部运动度、边缘强度以及纹理活动度的分析,将宏块归类为:局部运动宏块、边缘宏块、平滑宏块以及纹理宏块;基于人眼对于这四种类型宏块关注度的不同,调节宏块的量化参数;其步骤是:
i.局部运动宏块快速分割:对输入的图像帧进行滤波,以减少高频噪声的影响,计算宏块局部运动度以及运动度阈值,由局部运动度及活动度阈值,将宏块归类为局部运动宏块和非局部运动宏块;
ii.边缘宏块快速分割:采用Canny边缘检测器检测边缘输出各个像素点的边缘强度,计算宏块边缘强度以及边缘强度的阈值,将宏块归类为边缘宏块和非边缘宏块;
iii.纹理宏块的快速分割:采用水平/垂直梯度检测纹理输出各个像素点的纹理活动度,计算宏块纹理活动度以及纹理活动度的阈值,将宏块归类为纹理宏块和平滑宏块;
iv.宏块量化参数的调节:选择调节参数,基于人眼对不同类型的宏块关注度不同,对宏块的量化参数进行调节。
2.根据权利要求1所述的基于视觉关注度的视频编码方法,其特征在于所述的局部运动宏块快速分割的步骤是:
i.采用3x3低通滤波器对处理帧进行滤波,以减弱高频噪声的影响;
ii.由当前帧宏块的坐标,提取前一帧对应位置宏块的运动矢量;
iii.由提取的宏块运动矢量、当前帧亮度像素值以及前一帧亮度像素值,计算宏块的局部运动度和运动度阈值Thrm
iv.由步骤(iii)得到的宏块局部运动度和阈值Thrm,将宏块归类为局部运动宏块和非局部运动宏块。
3.根据权利要求1所述的基于视觉关注度的视频编码方法,其特征在于所述的边缘宏块的快速分割的步骤是:
i.采用Canny边缘检测器检测边缘,输出各个像素点边缘强度;
ii.由步骤(i)输出各个像素点边缘强度,计算宏块的边缘强度和边缘强度阈值Thre;
iii.由步骤(ii)得到的宏块边缘强度和边缘强度阈值Thre,将宏块归类为边缘宏块和非边缘宏块。
4.根据权利要求1所述的基于视觉关注度的视频编码方法,其特征在于所述的纹理宏块的快速分割的步骤是:
i.采用水平/垂直梯度检测纹理,输出各个像素点纹理活动度;
ii.由步骤(i)输出各个像素点纹理活动度,计算宏块的纹理活动度和纹理活动度阈值Thrt;
iii.由步骤(ii)得到的宏块纹理活动度、纹理活动度阈值Thrt、宏块边缘强度以及强度阈值Thre,将宏块归类为纹理宏块和平滑宏块。
5.根据权利要求1所述的基于视觉关注度的视频编码方法,其特征在于所述的宏块量化参数的调节的步骤是:
i.确定调节参数DQP;
ii.调节各类型宏块的量化参数(QP):对于局部运动宏块调节后的量化参数QP′=QP-DQP/2,边缘宏块调节后的量化参数QP′=QP,平滑宏块调节后的量化参数QP′=QP+DQP/2,纹理宏块调节后的量化参数QP′=QP′+DQP。
CNA2007101718461A 2007-12-06 2007-12-06 基于视觉关注度的视频编码方法 Pending CN101184221A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007101718461A CN101184221A (zh) 2007-12-06 2007-12-06 基于视觉关注度的视频编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007101718461A CN101184221A (zh) 2007-12-06 2007-12-06 基于视觉关注度的视频编码方法

Publications (1)

Publication Number Publication Date
CN101184221A true CN101184221A (zh) 2008-05-21

Family

ID=39449271

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101718461A Pending CN101184221A (zh) 2007-12-06 2007-12-06 基于视觉关注度的视频编码方法

Country Status (1)

Country Link
CN (1) CN101184221A (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101697593A (zh) * 2009-09-08 2010-04-21 武汉大学 一种基于时域预测的关注度提取方法
CN102006472A (zh) * 2010-11-18 2011-04-06 无锡中星微电子有限公司 视频码率控制系统及其方法
CN101534444B (zh) * 2009-04-20 2011-05-11 杭州华三通信技术有限公司 一种图像处理方法、系统和装置
CN102067600A (zh) * 2008-06-12 2011-05-18 汤姆森特许公司 将局部自适应滤波用于运动补偿内插和基准画面滤波的方法和装置
CN101389038B (zh) * 2008-09-28 2012-01-18 湖北科创高新网络视频股份有限公司 一种基于宏块分类的视频差错掩盖的方法和装置
CN101436301B (zh) * 2008-12-04 2012-01-18 上海大学 视频编码中特征运动区域的检测方法
CN101729912B (zh) * 2009-11-26 2013-02-20 大地辰星科技发展(北京)有限公司 图像序列色彩空间转换的方法
CN103188493A (zh) * 2011-12-28 2013-07-03 佳能株式会社 图像编码装置及图像编码方法
CN103414900A (zh) * 2013-08-24 2013-11-27 渭南高新区金石为开咨询有限公司 配置视频编码质量和分级传输视频数据的方法
CN103945220A (zh) * 2014-02-24 2014-07-23 西南交通大学 一种用于高效视频编码hevc的量化优化方法
CN104602018A (zh) * 2014-10-21 2015-05-06 腾讯科技(北京)有限公司 视频数据的运动信息的获取方法和装置、编码方法和装置
CN106165420A (zh) * 2014-04-15 2016-11-23 高通股份有限公司 用于显示流压缩(dsc)的平度检测的系统及方法
CN106254868A (zh) * 2016-08-19 2016-12-21 浙江宇视科技有限公司 视频编码码率控制方法、装置及系统
CN106688232A (zh) * 2014-09-11 2017-05-17 欧几里得发现有限责任公司 基于模型的视频编码的感知优化
CN107197265A (zh) * 2011-03-09 2017-09-22 佳能株式会社 图像编码设备和方法以及图像解码设备和方法
CN107277525A (zh) * 2011-02-23 2017-10-20 高通股份有限公司 多度量滤波
CN107431811A (zh) * 2015-04-13 2017-12-01 高通股份有限公司 用于显示流压缩的量化参数更新分类
CN107742288A (zh) * 2017-10-11 2018-02-27 成都国铁电气设备有限公司 一种受电弓打弓缺陷检测方法及系统
CN108270997A (zh) * 2016-12-30 2018-07-10 安讯士有限公司 注视控制的比特率
CN109587495A (zh) * 2018-11-05 2019-04-05 深圳威尔视觉传媒有限公司 视频编码方法、装置、设备及存储介质
CN110062230A (zh) * 2019-04-29 2019-07-26 湖南国科微电子股份有限公司 图像编码方法及装置
CN110460851A (zh) * 2012-08-21 2019-11-15 Emc公司 分段图像数据的无损压缩
CN110505481A (zh) * 2019-07-15 2019-11-26 杭州亿圣信息技术有限公司 一种利用眼动监测提高视频poi低损编码效率的方法
WO2020034078A1 (en) * 2018-08-14 2020-02-20 Huawei Technologies Co., Ltd. Event-based adaptation of coding parameters for video image encoding
CN112119639A (zh) * 2018-03-29 2020-12-22 艾锐势有限责任公司 用于对hdr内容进行去方块的系统和方法
CN114584772A (zh) * 2022-05-07 2022-06-03 宁波康达凯能医疗科技有限公司 一种基于视觉注意力的全视场视频编码方法与系统

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102067600B (zh) * 2008-06-12 2015-05-20 汤姆森特许公司 将局部自适应滤波用于运动补偿内插和基准画面滤波的方法和装置
CN102067600A (zh) * 2008-06-12 2011-05-18 汤姆森特许公司 将局部自适应滤波用于运动补偿内插和基准画面滤波的方法和装置
CN101389038B (zh) * 2008-09-28 2012-01-18 湖北科创高新网络视频股份有限公司 一种基于宏块分类的视频差错掩盖的方法和装置
CN101436301B (zh) * 2008-12-04 2012-01-18 上海大学 视频编码中特征运动区域的检测方法
CN101534444B (zh) * 2009-04-20 2011-05-11 杭州华三通信技术有限公司 一种图像处理方法、系统和装置
CN101697593A (zh) * 2009-09-08 2010-04-21 武汉大学 一种基于时域预测的关注度提取方法
CN101729912B (zh) * 2009-11-26 2013-02-20 大地辰星科技发展(北京)有限公司 图像序列色彩空间转换的方法
CN102006472A (zh) * 2010-11-18 2011-04-06 无锡中星微电子有限公司 视频码率控制系统及其方法
CN107277525B (zh) * 2011-02-23 2020-05-01 高通股份有限公司 用于视频解码的方法、装置、设备及计算机可读存储介质
CN107277525A (zh) * 2011-02-23 2017-10-20 高通股份有限公司 多度量滤波
CN107197265B (zh) * 2011-03-09 2020-01-14 佳能株式会社 图像编码设备和方法以及图像解码设备和方法
CN107197265A (zh) * 2011-03-09 2017-09-22 佳能株式会社 图像编码设备和方法以及图像解码设备和方法
US10554995B2 (en) 2011-03-09 2020-02-04 Canon Kabushiki Kaisha Image coding apparatus, method for coding image, program therefor, image decoding apparatus, method for decoding image, and program therefor
US10567785B2 (en) 2011-03-09 2020-02-18 Canon Kabushiki Kaisha Image coding apparatus, method for coding image, program therefor, image decoding apparatus, method for decoding image, and program therefor
US9571828B2 (en) 2011-12-28 2017-02-14 Canon Kabushiki Kaisha Image encoding apparatus, image encoding method and program
CN103188493B (zh) * 2011-12-28 2017-04-26 佳能株式会社 图像编码装置及图像编码方法
CN103188493A (zh) * 2011-12-28 2013-07-03 佳能株式会社 图像编码装置及图像编码方法
CN110460851B (zh) * 2012-08-21 2022-03-08 Emc 公司 分段图像数据的无损压缩系统、方法及存储介质
CN110460851A (zh) * 2012-08-21 2019-11-15 Emc公司 分段图像数据的无损压缩
CN103414900B (zh) * 2013-08-24 2016-06-29 倪效宽 配置视频编码质量和分级传输视频数据的方法
CN103414900A (zh) * 2013-08-24 2013-11-27 渭南高新区金石为开咨询有限公司 配置视频编码质量和分级传输视频数据的方法
CN103945220B (zh) * 2014-02-24 2017-02-15 西南交通大学 一种用于高效视频编码hevc的量化优化方法
CN103945220A (zh) * 2014-02-24 2014-07-23 西南交通大学 一种用于高效视频编码hevc的量化优化方法
CN106165420B (zh) * 2014-04-15 2021-06-29 高通股份有限公司 用于译码视频数据的方法及装置
CN106165420A (zh) * 2014-04-15 2016-11-23 高通股份有限公司 用于显示流压缩(dsc)的平度检测的系统及方法
CN106688232A (zh) * 2014-09-11 2017-05-17 欧几里得发现有限责任公司 基于模型的视频编码的感知优化
CN104602018B (zh) * 2014-10-21 2018-09-18 腾讯科技(北京)有限公司 视频数据的运动信息的获取方法和装置、编码方法和装置
CN104602018A (zh) * 2014-10-21 2015-05-06 腾讯科技(北京)有限公司 视频数据的运动信息的获取方法和装置、编码方法和装置
CN107431811A (zh) * 2015-04-13 2017-12-01 高通股份有限公司 用于显示流压缩的量化参数更新分类
CN106254868B (zh) * 2016-08-19 2019-08-27 浙江宇视科技有限公司 视频编码码率控制方法、装置及系统
CN106254868A (zh) * 2016-08-19 2016-12-21 浙江宇视科技有限公司 视频编码码率控制方法、装置及系统
CN108270997A (zh) * 2016-12-30 2018-07-10 安讯士有限公司 注视控制的比特率
CN107742288A (zh) * 2017-10-11 2018-02-27 成都国铁电气设备有限公司 一种受电弓打弓缺陷检测方法及系统
CN112119639B (zh) * 2018-03-29 2024-03-12 艾锐势有限责任公司 用于对hdr内容进行去方块的系统和方法
CN112119639A (zh) * 2018-03-29 2020-12-22 艾锐势有限责任公司 用于对hdr内容进行去方块的系统和方法
WO2020034078A1 (en) * 2018-08-14 2020-02-20 Huawei Technologies Co., Ltd. Event-based adaptation of coding parameters for video image encoding
US11490092B2 (en) 2018-08-14 2022-11-01 Huawei Technologies Co., Ltd. Event-based adaptation of coding parameters for video image encoding
CN109587495A (zh) * 2018-11-05 2019-04-05 深圳威尔视觉传媒有限公司 视频编码方法、装置、设备及存储介质
CN110062230B (zh) * 2019-04-29 2022-03-25 湖南国科微电子股份有限公司 图像编码方法及装置
CN110062230A (zh) * 2019-04-29 2019-07-26 湖南国科微电子股份有限公司 图像编码方法及装置
CN110505481A (zh) * 2019-07-15 2019-11-26 杭州亿圣信息技术有限公司 一种利用眼动监测提高视频poi低损编码效率的方法
CN110505481B (zh) * 2019-07-15 2021-06-01 杭州亿圣信息技术有限公司 一种利用眼动监测提高视频poi低损编码效率的方法
CN114584772A (zh) * 2022-05-07 2022-06-03 宁波康达凯能医疗科技有限公司 一种基于视觉注意力的全视场视频编码方法与系统

Similar Documents

Publication Publication Date Title
CN101184221A (zh) 基于视觉关注度的视频编码方法
JP5555221B2 (ja) 着目物の適応的な色モデル・パラメータ推定に係る方法および装置
CN103079063B (zh) 一种低码率下视觉关注区域的视频编码方法
US11297319B2 (en) Method for encoding images and corresponding terminals
CN101563926B (zh) 图像压缩与解压缩
CN103124347B (zh) 利用视觉感知特性指导多视点视频编码量化过程的方法
CN101621709B (zh) 一种全参考型图像客观质量评价方法
CN102420988B (zh) 一种利用视觉特性的多视点视频编码系统
CN101325711A (zh) 基于时空掩盖效应的自适应码率控制方法
CN104243973B (zh) 基于感兴趣区域的视频感知质量无参考客观评价方法
CN104954791A (zh) 矿井无线分布式视频编码中的关键帧实时选取方法
CN106534862B (zh) 一种视频编码方法
CN104469386B (zh) 一种基于dof的恰可察觉误差模型的感知立体视频编码方法
CN103141094A (zh) 自适应环路滤波方法和装置
KR101261676B1 (ko) 이미지를 인코딩하는 방법 및 그 방법을 구현하는 장치
Kong et al. Object-detection-based video compression for wireless surveillance systems
WO2016142931A1 (en) Method and system of controlling a quality measure
CN102984540A (zh) 一种基于宏块域失真度估计的视频质量评价方法
CN101605272A (zh) 一种部分参考型图像客观质量评价方法
CN104992419A (zh) 基于jnd因子的超像素高斯滤波预处理方法
CN102685548A (zh) 视频质量的无参评估方法
CN104065962A (zh) 基于视觉注意的宏块层比特分配优化方法
CN107454413A (zh) 一种保留特征的视频编码方法
CN100366091C (zh) 一种视频压缩方法
Yang et al. Optimized-SSIM based quantization in optical remote sensing image compression

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080521