CN1155255C - 图像压缩处理方法 - Google Patents

图像压缩处理方法 Download PDF

Info

Publication number
CN1155255C
CN1155255C CNB001096419A CN00109641A CN1155255C CN 1155255 C CN1155255 C CN 1155255C CN B001096419 A CNB001096419 A CN B001096419A CN 00109641 A CN00109641 A CN 00109641A CN 1155255 C CN1155255 C CN 1155255C
Authority
CN
China
Prior art keywords
coding
image
parameter
macro block
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB001096419A
Other languages
English (en)
Other versions
CN1278693A (zh
Inventor
多米尼克・托罗
多米尼克·托罗
・鲁埃洛
皮埃尔·鲁埃洛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
COLOR PRINTING TECHNOLOGY Co.
Thomson Licensing SAS
International Digital Madison Patent Holding SAS
Original Assignee
Thomson Consumer Electronics SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR9907714A external-priority patent/FR2795277B1/fr
Priority claimed from FR9907715A external-priority patent/FR2795278B1/fr
Application filed by Thomson Consumer Electronics SA filed Critical Thomson Consumer Electronics SA
Publication of CN1278693A publication Critical patent/CN1278693A/zh
Application granted granted Critical
Publication of CN1155255C publication Critical patent/CN1155255C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种图像压缩处理方法,特别是一种MPEG2型压缩处理方法,其中每个图像宏块(10)受到编码选择,对每个宏块而言,从几种类型的编码中选择编码类型。为了选择要应用于所述宏块的编码类型,确定参数MB_activ-α_Q,在该公式:MB_activ的数值为:
Figure 00109641.9_AB_0
,其中,Q为量化间隔,α为预定参数,如1。所选择的编码模式对应于参数MB_activ-α_Q的最小值。

Description

图像压缩处理方法
本发明涉及一种图像压缩处理方法,其中每幅图像或图像宏块用从几种编码方法中选择的一种编码方法所编码。
本发明特别涉及一种MPEG2压缩处理方法。尽管本发明不限于这种类型的压缩,在下文的描述中,我们将主要参照这种类型进行说明。
下面是对这种压缩的原理的回顾,并且在此将指出为每个宏块选择的编码类型。
按照MPEG2标准,可以从递进模式中包含的图像开始,这种图像有576行每行720点。按照隔行模式,这种图像包括两帧,每帧包括288行,也是每行720点。
每幅图像被分为多个宏块,每个宏块由成正方形的16×16亮度点形成。因此,每个宏块由4个8×8亮度点的方块所形成。按照4.2.0格式,与这4个亮度点的方块中的每一个与两个各有8×8点的色度块关联,其中一个色度块表示色差或红色度信号Cr,而另一色度块表示色差或蓝色度信号Cb。按照4.2.2格式,与每个亮度宏块相关联的是四个8×8的色度块,其中两个色度块用于蓝色色度,两个色度块用于红色色度。在此还有4.4.4格式,其中每个亮度和色度成分包括4个8×8的块。
图1中表示的是在该组合中具有参考标号10的四个8×8的亮度块,并且8×8的色度块12和14分别用于蓝色和红色色度,该组合示出在4.2.0标准中的一个宏块。
每个块通过利用称为DCT(离散余弦变换)的变换法进行编码,这种变换使得有可能把一个亮度或色度块变换为一个表示空间频率的系数块。如图2中所示,一个源块16被变换为8×8系数的块18。该块18的左上角20对应于零空间频率(该块的平均亮度值),并且在这一源点20的正向上,水平频率向右增加,如箭头22表示,而垂直空间频率从上到下增加,如箭头24所示。
对于每个宏块而言,必须选择编码类型:或者“内部”型,或者“中间”型。“内部”编码在于把DCT变换应用于该图像的一个源块,而“中间”编码在于把DCT变换应用于表示源块与预测块之间或者与前幅或后幅图像的预测块之间的差值的块。
该选择取决于该宏块所属的图像类型。这些图像有三种类型:第一种是所谓的I型或内部型,它对所有宏块的编码是内部型的。
第二种是P型或预测型,在这种类型的图像中,每个宏块的编码可以是内部型或中间型的。在P型图像的一个宏块的中间编码的情况下,DCT变换被应用于该图像P的当前宏块与从在前的I或P图像产生的预测宏块之间的差值。
第三种类型图像被称为N型或双向型。这类图像的每个宏块是内部编码或中间编码的。中间编码也在于把该变换应用于B图像的当前宏块与预测宏块之间的差值。该预测宏块可以从前幅图像产生或者从后幅图像产生,或者同时从这两幅图像产生(双向预测),所谓的在先或在后预测图像有可能仅仅是I或P型图像。
图3中表示的是形成所谓GOP(图像组)的一组图像,其中包括12幅图像,即一幅I图像之后顺次:B,B,P,B,B,P,B,B,P,B,B跟随着11个B和P图像。
在预测图像的情况中(也就是说从其他图像引出的图像),运动估计和随后的运动补偿都被应用于要编码的宏块。这是因为在两幅图像之间,宏块可因中间图像和中间帧的运动而位于不同的位置。运动补偿的效果是根据给定的内插模式(通常称为预测模式)计算预测宏块;这种宏块实际将被用作对于给定的编码模式对在中间图像模式中的当前宏块的预测。在下文中,按照所取同样的编码模式,根据在用于计算编码模式的选择的程序中的判断,将保留或排除这种预测宏块和这种编码模式。
另外,在隔行扫描的情况下,其中每幅图像由两个相继的帧,即偶数帧和奇数帧形成,需要确定是否应对每个帧逐次或单独地实行DCT变换。这是因为根据该图像的运动或该图像的结构,编码的结果可能不同,这取决于是否对图像或每个帧执行变换。
这种选择由图4a和图4b表示。图4a中表示的是奇数帧的行301、303、...、3015和由偶数帧的行302、304、...、3016所形成的间隔图像的宏块28。图4a对应于关于该图像执行的DTC变换;宏块28的四个块中的每一个被变换,而不对各行重新排列。因此,关于形成宏块28的这四个块281、282、283、284进行编码,并关于块281和282的行301至308和块283和284的行309至3016进行变换。
另一方面,图4b示出分别对奇数和偶数帧进行的变换。块321和322对应于奇数帧,块323和324对应于偶数帧。因此,块321包括行301、303、...、3015,而块323和324包括行302、304、...、3016
图5表示的是要关于图像压缩和视频压缩执行的各种操作的方框图。把每个数字化图形加给功能块40的输入端,该功能块分割为8×8的块,并将这些8×8块发送到功能块42,用于在内部编码和中间编码之间选择。如果所选的编码是内部编码,则将这种块发送到DCT变换功能块44。如果该编码是中间编码,则使这种块被减法器功能块46所减,所述功能块46取得该块本身与由时间预测功能块48所传送的预测块之间的差。
在DCT变换44之后,执行量化50,并按可变或固定长度的VLC编码法将如此获得的量化系数编码52。在编码器52的输出端获得的这种编码的系数被直接传送到缓冲存储器54,存储器54的输出构成编码输出56。为了避免缓冲存储器54的饱和与空白,执行调节60,这改变量化50。
为了能进行时间预测,将量化功能块50的输出连接到用于反量化Q-1的功能块62的输入端,功能块62的输出被提供给执行反余弦变换DCT-1的功能块64。当由功能块68确定该块的编码是内部编码时,该功能块64的输出被直接发送给图像存储器66。另一方面,当功能块68确定该编码是中间编码时,利用加法器70把该方块64的输出加给由功能块48所传送的预测宏块,并且它是来自加法器70的输出,其被发送到图像存储器66。存储器66保存解码的图像。
中间图像和中间帧的运动由功能块72所预测,该功能块一方面从图像存储器66接收信息,另一方面从用于构成块的功能块40的输出接收信息。因此,可以看出,一方面时间预测48根据图像存储器66而执行,另一方面根据运动估计72而执行。
在其它情况中,编码或二进制序列52的计算取决于来自运动估计72的运动矢量、编码的DCT系数、宏块的标头、以及由功能块74所传送的MPEG2编码信息。这个信息与MPEG2信号有关,即宏块(或“片段”)各行的标头、GOP图像的标头以及要被编码的序列的标头。
对于I型图像而言,必须在帧方式内部编码或图像方式内部编码之间选择编码方式。根据对包含在宏块中的活动量的分析做出这种选择;这通常都给出良好的结果。
对于P型图像和B型图像而言,要作出的判断数量明显会更大。
因此,可按8种基本模式给一个P宏块编码:
-内部;帧DCT,
-内部;图像DCT,
-没有运动补偿(noMC);帧DCT,
-没有运动补偿(noMC);图像DCT,
-有运动补偿;由较早的帧预测;帧DCT,
-有运动补偿;由较早的帧预测;图像DCT,
-有运动补偿;由较早的图像预测;帧DCT,
-有运动补偿;由较早的图像预测;图像DCT。
对于B型图像而言,可有14种的基本编码模式,即两种内部编码模式、四种专用于P型图像的具有运动补偿的模式、另外有四种基于较后预测图像的类似编码模式和四种双向模式,即:
-由较后的帧预测;帧DCT,
-由较后的帧预测;图像DCT,
-由较后的图像预测;帧DCT,
-由较后的图像预测;图像DCT,
-帧方式双向预测;帧DCT,
-帧方式双向预测;图像DCT,
-图像方式双向预测;帧DCT,
-图像方式双向预测;图像DCT。
应予说明的是,迄今在用于P和B图像的各种模式之间选择的标准给出质量可变的结果。
1998年8月28日以汤姆森多媒体公司名义提出的在先专利申请第9810802号中描述了一种压缩处理方法,其中根据所有可能模式或者根据其中一些模式进行尝试编码,并对每种尝试编码确定编码的成本和/或质量因子,所用编码模式被选择作为编码成本的数值和/或质量因子的数值的函数。
换句话说,根据在先申请中描述的处理方法,不是作为宏块内部分析的函数选择编码模式,而是通过尝试所有可能的编码(或者一些可能的编码)以及通过采用给出最佳结果的模式而选择编码模式,或者因为它使编码成本最小化,或者因为它使图像质量最大化,或者因为它在编码成本与图像质量之间给出最佳的协调。
特别是当选择给定的成本/质量标准时,这种处理方法对每个宏块提供最佳的结果。但是,难以对必须实时进行的编码应用这种方法,因为它涉及相当多计算时间,特别对便携式装置来说难以减少该计算时间。
但是,按照所述在先申请,编码仍然被用于确定可被实时计算的参数,而且在P和B图像的情况下,使其有可能选择提供最佳结果的编码模式。
根据本发明第一方面,为了确定P和/或B图像的编码宏块的模式,对每个编码模式计算能量参数,该参数对于中间编码模式来说是中间图像能量,并且对于内部编码模式来说是相对于亮度的平均值的相对能量,并且采用提供最小能量参数的编码模式,或者采用提供不比该最小能量参数高出预定的因子k的能量参数。在一个例子中,该因子k等于2.5。
在中间宏块的情况中,中间图像能量MBdfd具有如下数值:
M B dfd = ( Σ i , j = 0 i , j = 15 | e ( i , j ) | )
在该公式中,e(i,j)表示预测误差,i表示宏块中的行数,并且j表示在该宏块中的列数。
在内部编码模式的情况下,可以通过对每个8×8块计算该块的像素亮度x(i,j)与该块亮度的平均值(bl.avr.lum.)之间的差的绝对值的和来确定相对能量,也就是说:
Figure C0010964100112
平均值bl.avr.lum.是按图像编码模式和帧编码模式确定的。
应当指出,在实践中已经知道在中间宏块的情况下利用参数MBdfd。但是,本发明人发现,由上述公式(2)所定义的参数MBdfd可以用于内部编码模式。换句话说,为了确定编码模式,采用新的参数。
还可将这个新的参数MBdfd用于在帧DCT模式和图像DCT模式之间的选择。公知的是,为了确定图像DCT模式与帧DCT模式之间的选择,按图像模式和帧模式比较宏块的局部活动性被,并选择提供最低局部活动性的模式。当图像和帧局部活动性相等时,本发明使得有可能优化选择。在这种情况下,比较上文所定义的能量参数MBdfd,并选择使得参数MBdfd更小的图像或帧DCT编码模式。
最后,如果图像和帧参数MBdfd相等,则优先执行图像DCT编码。
回顾局部活动性的定义如下:
Figure C0010964100113
其中
, block _ activ = MAX ( MAX i , j = 0 i = 6 , j = 7 | x ( i , j ) - x ( i + 1 , j ) | , MAX i , j = 0 i = 7 , j = 6 | x ( i , j ) - x ( i , j + 1 ) | )
在这些公式中,x(i,j)以及i和j具有上述含义。但是,对于预测模式,在预测误差的宏块上计算MB_activ。
按照可以独立于上述特征而应用的本发明的另一个特征,对P和B图像的所有可能模式确定如下参数:
MB_activ-α_Q,
并且选择使该参数最小的编码模式。
MB_activ是宏块的局部活动性,Q表示量化间隔,而α是一个系数,它取决于用于加权量化矩阵的参数。在一个实例中,该参数α等于1。通过从MB_activ中减去数值α_Q,数值(MB_activ-α_Q)提供对所述宏块的潜在成本的一个估计。确实,为了确定MB_activ,量化间隔Q越大,则宏块的成本越低,因为在量化过程中所采用的系数更小。
实际上,在量化过程中,MPEG2编码标准采用量化间隔Q和用于DCT系数的所谓加权矩阵(其大小对应于DCT的8×8),通常,它使得有可能减小高频系数的幅度。因此,DCT系数c(i,j)是通过把其幅度除以量化间隔Q与加权矩阵的对应系数p(i,j)的数值的乘积而量化的。
一般说来,中间以及内部图像加权矩阵是不一致的。另外,这些矩阵的内容不由该标准所确定;因此它可以作为编码器的规格的一个函数而改变。
在如下的一组内部和中间加权矩阵的情况,数值1被选择用于α:
内部矩阵m_intra_1              中间矩阵m_inter_1
08 16 16 19 16 19 22 22        16 17 17 19 18 19 20 20
22 22 22 22 26 24 26 27        20 20 22 21 22 21 22 23
27 27 26 26 26 26 27 27        23 24 23 24 23 25 25 26
27 29 29 29 34 34 34 29        25 26 24 25 26 26 27 27
29 29 27 27 29 29 32 32        28 27 27 26 28 29 29 30
34 34 37 38 37 35 35 34        29 29 28 31 31 32 31 32
35 38 38 40 40 40 48 48        30 33 34 33 34 33 36 35
46 46 56 56 58 69 69 83        36 35 38 39 38 41 40 43
另一方面,在如下矩阵的结构中亦然:
内部矩阵m_intra_1          中间矩阵m_inter_2
08 16 16 19 16 19 22 22    16 16 16 16 16 16 16 16
22 22 22 22 26 24 26 27    16 16 16 16 16 16 16 16
27 27 26 26 26 26 27 27    16 16 16 16 16 16 16 16
27 29 29 29 34 34 34 29    16 16 16 16 16 16 16 16
29 29 27 27 29 29 32 32    16 16 16 16 16 16 16 16
34 34 37 38 37 35 35 34    16 16 16 16 16 16 16 16
35 38 38 40 40 40 48 48    16 16 16 16 16 16 16 16
46 46 56 56 58 69 69 83    16 16 16 16 16 16 16 16
选择小于1的参数值α用于中间图像编码模式,例如0.875。这是因为矩阵m_inter_2允许通过比矩阵m_inter_1多得多的DCT系数。按照这种结构,可有如下关系:
在内部图像模式中  α=α_intra=1,
在中间图像模式中  α=α_inter=0.875按照一种具体实施例,在内部编码块的情况下,如果对于一个块而言,参数的block_activ-α.Q小于一个给定值,则给这个参数的block_activ-α.Q一个缺省值,比如对应于内部编码宏块的最小成本的四分之一。确实,在内部模式下编码的宏块不可能是零成本的,这与中间图像模式的情况不同。一个块的实际最小成本对应于该块的平均值(DC)的编码成本以及表示该块的末端的代码的编码成本。因此:
-在4.2.0编码结构中,块的最小成本的估计给予bl_intra_420_min(例如bl_intra_420_min=11),
-在4.2.2编码结构中,块的最小成本的估计可以给予bl_intra_422_min(例如bl_intra_422_min=15),
当然,这些最小值实际上可以作为用于编码该系数的VLC表的类型的一个函数而变化,它们的块尾代码的长度也变化。该方法的基本特点是使得内部宏块为零成本是不可想象的。
在本明的优选实施例中,采用上述标准的结合,以如下方式对P和B图像进行处理:
对每个宏块从所有可能的编码模式(包括内部编码)确定参数MBdfd的最小值,即MBdfdmin,并选择该编码模式使得:
MBdfd<k.MBdfdmin,其中k是预定的因子,其在一个实例中它等于2.5。
为了确定DCT的类型(帧或图像型),进行上述方法,也就是说考虑局部活动性参数MB_activ,并根据所述图像或帧的MB_activ是否为更小,选择图像或帧DCT;如果这两个参数相等,则根据该图像或帧MBdfd参数是否为更小,选择图像或帧DCT。在参数MBdfd相等的情况下,选择图像DCT。
最后,为了从候选的编码模式中选择要采用的编码模式,考虑如下参数:
Val=(MB_activ-α.Q).MBdfd/MBdfdmin+Hdr_MB      (3)
而且,选择提供参数Val的最小值的编码模式。
在公式(3)中,Hdr_MB表示除参数CBP(编码的块模式)之外,宏块的标头的所有参数。后者是可变长编码,它使得有可能把包含系数的块的分布给予解码器,假定,在中间图像模式中,特定的块可以为空白。确实,除了参数CBP之外,该标头的所有参数可以在编码之前确定。可以由Hdr_MB中的预定值代替这个参数。
根据VLC代码表,对于一个4.2.0宏块(4个亮度块,2个色度块)的CBP代码的长度从3位到9位变化。该预定值例如可以为4。在4.2.2标准(4个亮度块,4个色度块)中,该值将略为更高(例如为6)。
对于所有有用的目的而言,这里回顾一个宏块的标头包括如下参数:MBA地址代码(宏块地址),它表示该宏块相对于最后的编码宏块的相对地址;编码模式;量化间隔的数值;DCT的类型(图像或帧);以及各矢量。
对于最后一点,应当指出这些矢量的成本通常在帧模式中比在图像模式中更大,由于在第一情况中(帧),必须提供为在第二种情况(图像)的两倍那样多的矢量。但是,在帧模式中的编码成本不一定比在图像模式中更高,因为各矢量的编码对于最后发送的矢量而不同。
在上述公式(3)中,最好给MBdfd分配一个加权因子,在中间编码模式的情况下它等于1,而在内部编码模式的情况下大于1,这个加权因子可以表现为不同数值,这根据是否处理P图像或B图像而由经验确定。
所述加权因子传达这样的事实,即在内部模式中编码宏块的成本通常比在中间模式中编码宏块的成本更大。
如果MB_activ-α.Q=0,则该宏块为空白或者未被编码。在这种情况下,任何时候下,参数val都限于标头Hdr_MB的成本。
另外,在宏块被估计为潜在地为空白并且因此未被编码的情况下(仍然在中间图像模式中),考虑被省略的宏块(被忽略的宏块)的结构。这个结构对应于两种特定的情况:
在P图像情况下,该宏块为空白,因此未被编码,并且编码模式为noMC,这是所谓的非补偿模式(实际上,该矢量缺省值为零)。
第二种情况是B图像:宏块为空白,因此未被编码,并且运动矢量与以前发送的相同。
对于省略的宏块而言,没有关于相关宏块的信息被发送。
因此,采用这个参数val,其中包括尝试识别空白的宏块,使得有可能加速未被编码的宏块,或者甚至被省略的宏块,在“先验”方法的情况下,所有这些都是为了合理的成本/质量比,也就是说能够实时地设置。
应当指出,对于内部类型的图像通常必须单独在帧DCT编码和图像DCT编码之间作出选择。为此目的,利用参数MB_activ,并且根据帧或图像的MB_activ参数是否为最小,选择帧或图像编码模式。
实验表明,与现有的处理方法相比,这种图像压缩处理方法对于相同的质量有可能减小编码成本,或者对于同样的编码成本提高质量,而与本发明的实施例无关。
一般而言,本发明提供一种图像压缩处理方法,特别是MPEG2类型的压缩处理方法,其中每个图像宏块10受到编码选择,对于每个宏块而言,从几种编码类型中选择编码。为了选择要应用于该宏块的编码类型,确定如下参数:MB_activ-α_Q,在该公式中:
          MB_activ有如下值
其中
, block _ activ = MAX ( MAX i , j = 0 i = 6 , j = 7 | x ( i , j ) - x ( i + 1 , j ) | , MAX i , j = 0 i = 7 , j = 6 | x ( i , j ) - x ( i , j + 1 ) | )
Q是量化间隔,
α是预定的参数,
被选择的编码模式对应于所述参数MB_activ-α_Q的最小值。
根据一个实施例,系数α等于1。
另外,可以使α的数值取决于用在量化DCT系数的程序中的加权矩阵的内容。
根据这种方法的一个实施例,在内部(或中间)图像模式下,α=1,中间(或内部)图像模式下所用的加权矩阵执行比在内部(或中间)模式下更低的加权,中间(或内部)图像模式下所用的系数α小于1。
根据一个实施例,对于每个块(16)而言,在中间编码模式下,当该参数下降到预定的阈值时,对block_activ-α_Q给定一个预定值。
该预定值对应于内部编码宏块的最小成本的四分之一。
根据一个实施例,通过加权所计算的数值val能够便于编码“忽略宏块”,在这种情况下,估计所述宏块为潜在地为空白。这些情况在上文中已有说明,即:
-在P图像的情况下,编码模式为noMC,即所谓的非补偿模式(实际上该矢量缺省值为零)。
-在B图像的情况下,运动矢量等于以前发送的矢量,也就是说由最后编码的宏块所采用。
根据本发明一种改形,在val的表达式中,由可变的“Context”加权Hdr_MB的值:
val=MB_activ×MB_dfd/MB_dfd_min+Hdr_MB×Context
该变量具有如下数值:
1)如果MB_val_avg≤threshold_val_avg并且
      MB_mean_activ≤threshold_mean_activ
      Context=(MB_val_avg/256)×(MB_mean_activ/16)
所述的阈值为预定的阈值。
2)否则
Context=1
因此该加权取决于两个参数:
-源宏块的平均活动性:
该数值使得通过估计要被编码的宏块的平均活动性有可能考虑到该Context。以如下方式计算:
Figure C0010964100171
-源宏块的平均亮度值:
在平均活动性的情况中,该信息用于估计当前宏块所在的环境,以使得判定标准最佳化。仅仅对亮度块计算该平均值:
MB _ val _ moy = ( Σ i = 0 15 Σ j = 0 15 MB _ src ( i , j ) ) 256
MB_src(i,j)对应于在宏块MB中的像素(i,j)的亮度。更加一般地来说,所选择的加权与源宏块的平均亮度值成正比,并且与该源宏块的平均活动性成反比。这使得有可能考虑到宏块的活动性以及该宏块的平均亮度。
在均匀宏块的情况下,也就是说对于MB_activ的小数值而言,或者在量化间隔较大的情况下,与标头的成本相比,表达式MB_activ-α.Q较小。于是,所述算法有利于根据在先图像或帧或者在后图像或帧的预测模式,对于成本Hdr_MB较高的帧或图像双向预测模式不利。
现在,双向预测模式对预测误差求平均,并且提高主观质量。这是因为,在源宏块的平均亮度值低于预定阈值的情况下,通过利用标头成本的加权,参数val的数值对于双向预测模式降低,以便有利于该模式,也即DFDmin的选择。
在宏块的低平均活动性和低平均亮度情况下,由于均匀黑区域的存在,该块的影响最为可见。于是,执行加权,以有利于双向编码,这有可能限制人为编码的类型。
如果宏块的平均活动性较高或者至少大于预定的阈值,则存在纹理化的区域,并且块的影响最为不可见,而且无需有利于双向模式(Context=1)。这里应当指出的是,确实考虑到宏块的平均编码用于加权,而不是考虑宏块的活动性。因为即使仅仅一个或一些像素在亮度上相对于该宏块的其它像素具有大的差别,宏块的活动性可能较高。

Claims (21)

1.一种图像压缩处理方法,特别是MPEG2类型的压缩处理方法,其中每个图像宏块(10)受到编码选择,对每个宏块而言,从使用中间或内部、帧或场、后向或前向编码模式的几种类型的编码中选择编码类型,其特征在于,为了选择要应用于所述宏块的编码类型,确定如下参数:
MB_activ-α_Q,在该公式中:
MB_activ对应于宏块的能量或者活动性,
Q为量化间隔,并且
α为预定参数,
所选择的编码模式是与所述参数MB_activ-α_Q的最小值相对应的模式。
2.根据权利要求1所述的方法,其特征在于,宏块的活动性由如下的值确定:
其中
, block _ activ = MAX ( MAX i , j = 0 i = 6 , j = 7 | x ( i , j ) - x ( i + 1 , j ) | , MAX i , j = 0 i = 7 , j = 6 | x ( i , j ) - x ( i , j + 1 ) | )
其中公式x(i,j)表示在每个块的i行和j列的点的亮度。
3.根据权利要求1所述的方法,其特征在于,α的值对于内部模式和中间模式是不同的。
4.根据权利要求1所述的方法,其特征在于,所述系数α等于1。
5.根据权利要求1所述的方法,其特征在于,所述α的值取决于用在量化DCT系数的程序中的加权矩阵的内容。
6.根据权利要求5所述的方法,其特征在于,在内部图像模式下,α=1,并且中间图像模式下所用的加权矩阵执行比内部模式下低的加权,中间图像模式下所用的系数α小于1。
7.根据权利要求2至6中任意一项所述的方法,其特征在于,对于每个块(16),在中间编码模式下,当所述参数下降到低于预定的阈值时,对block_activ-α_Q给定一个预定值。
8.根据权利要求7所述的方法,其特征在于,所述预定值对应于内部编码宏块的最小成本的四分之一。
9.根据权利要求1所述的方法,其特征在于,对于相关的编码而言,所述编码模式的选择还取决于编码标头Hdr_MB的成本。
10.根据权利要求9所述的方法,其特征在于,对于中间编码模式来说,所述标头的编码成本不考虑编码的块模式参数。
11.根据权利要求10所述的方法,其特征在于,根据要被编码的图像的标准,所述编码的块模式参数被预定数值所代替。
12.根据权利要求9所述的方法,其特征在于,从各种编码模式中选择的编码模式是一种提供参数val的最小值的编码方式,该参数对应于表达式:
Val=(MBactiv-α.Q)×MBdfd/MBdfdmin+Hdr_MB,该公式中,MB_activ表示宏块的活动性,Q表示量化间隔,α是常量系数,Hdr_MB表示对于相关的编码模式而言标头的编码成本,MBdfd表示宏块的能量参数,该参数MBdfd对于中间编码有如下的值:
M B dfd = ( Σ i , j = 0 i , j = 15 | e ( i , j ) | )
该公式中的i和j表示每个点的行数和列数,而e(i,j)表示对于相应点的亮度预测误差;在内部模式下,该能量参数具有如下数值:
Figure C0010964100041
该公式中的x(i,j)表示每个块的i行和j列中的点的亮度,而bl.avt.lum表示每个块的亮度平均值。
13.根据权利要求9所述的方法,其特征在于,所述参数MBdfd对于内部编码模式中比对于中间编码中分配更高的系数。
14.根据权利要求13所述的方法,其特征在于,在内部模式情况下,被分配给参数MBdfd的系数取决于要被编码的图像P或B的特性。
15.根据权利要求9所述的方法,其特征在于,当MB_activ-α.Q下降到低于预定阈值时,数值MB_activ被以缺省值分配给量MB_activ-α.Q。
16.根据权利要求15所述的方法,其特征在于,所述缺省值对应于内部编码的宏块的最小编码成本的四分之一。
17.根据权利要求9所述的方法,其特征在于,所述图像或者帧DCT编码模式被选择作为局部活动性的数值的一个函数,被选择的DCT编码模式对应于局部活动性更小的情况,在相等的情况下,比较帧和图像能量参数MBdfd,并选择参数MBdfd更小的情况。
18.根据权利要求17所述的方法,其特征在于,在参数MBdfd相等的情况下,选择图像DCT模式。
19.根据权利要求12所述的方法,其特征在于,当必须编码一个“忽略的宏块”的概率较大时,也就是说,对于P型图像而言,如果用所谓的非补偿“no MC”编码模式,或者对于B型图像而言,如果运动矢量与由最后编码的宏块所采用的矢量相同,则数值val下降一个预定的值。
20.根据权利要求12所述的方法,其特征在于,当源宏块的平均活动性
Figure C0010964100042
以及它的平均值 MB _ val _ moy = ( Σ i = 0 15 Σ j = 0 15 MB _ src ( i , j ) ) 256 都低于预定阈值时,
在“val”的表达式中Hdr_MB项被加权,以便于双向预测模式,其中表达式MB_src(i,j)对应于在宏块MB中像素(i,j)的亮度。
21.根据权利要求20所述的方法,其特征在于,所述加权与源宏块的平均值成正比,并与所述源宏块的平均活动性成反比。
CNB001096419A 1999-06-18 2000-06-19 图像压缩处理方法 Expired - Lifetime CN1155255C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
FR9907714A FR2795277B1 (fr) 1999-06-18 1999-06-18 Procede de compression d'images, notamment de type mpeg2
FR9907715A FR2795278B1 (fr) 1999-06-18 1999-06-18 Procede de compression d'images, notamment de type mpeg2
FR9907714 1999-06-18
FR9907715 1999-06-18

Publications (2)

Publication Number Publication Date
CN1278693A CN1278693A (zh) 2001-01-03
CN1155255C true CN1155255C (zh) 2004-06-23

Family

ID=26234995

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001096419A Expired - Lifetime CN1155255C (zh) 1999-06-18 2000-06-19 图像压缩处理方法

Country Status (4)

Country Link
US (1) US6661926B1 (zh)
EP (1) EP1061750A3 (zh)
JP (1) JP4806483B2 (zh)
CN (1) CN1155255C (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7266150B2 (en) * 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
WO2003021971A1 (en) * 2001-08-28 2003-03-13 Ntt Docomo, Inc. Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method, decoding method, and program usable for the same
KR20040075020A (ko) * 2001-12-21 2004-08-26 코닌클리케 필립스 일렉트로닉스 엔.브이. 이미지 코딩
JP4031455B2 (ja) * 2004-03-29 2008-01-09 株式会社東芝 画像符号化装置
EP2187337A1 (en) * 2008-11-12 2010-05-19 Sony Corporation Extracting a moving mean luminance variance from a sequence of video frames
EP2299717A1 (en) * 2009-09-10 2011-03-23 Thomson Licensing Method and apparatus for image encoding using Hold-MBs, and method and apparatus for image decoding using Hold-MBs
US10277906B2 (en) * 2015-03-23 2019-04-30 Arris Enterprises Llc System and method for selectively compressing images

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3125451B2 (ja) * 1991-11-05 2001-01-15 ソニー株式会社 信号処理方法
DE4118571A1 (de) * 1991-06-06 1992-12-10 Philips Patentverwaltung Vorrichtung zur steuerung des quantisierers eines hybrid-kodierers
JPH0678287A (ja) * 1992-03-23 1994-03-18 Canon Inc 符号化方法及び装置
US5592302A (en) * 1992-03-23 1997-01-07 Canon Kabushiki Kaisha Coding method for coding pixel blocks and apparatus therefor
US5559722A (en) 1993-11-24 1996-09-24 Intel Corporation Process, apparatus and system for transforming signals using pseudo-SIMD processing
KR100213015B1 (ko) * 1994-03-31 1999-08-02 윤종용 양자화 방법 및 회로
JPH0846971A (ja) * 1994-07-29 1996-02-16 Sharp Corp 動画像符号化装置
DE4433819A1 (de) * 1994-09-22 1996-03-28 Philips Patentverwaltung Coder zur segmentweisen Codierung eines Eingangssignales
US5737537A (en) * 1995-09-29 1998-04-07 Intel Corporation Two-measure block classification scheme for encoding video images
WO1997016031A1 (en) * 1995-10-26 1997-05-01 Sarnoff Corporation Apparatus and method for selecting a coding mode in a block-based coding system
KR100355375B1 (ko) * 1995-11-01 2002-12-26 삼성전자 주식회사 영상부호화장치에있어서양자화간격결정방법및회로
US5771316A (en) * 1995-12-26 1998-06-23 C-Cube Microsystems Fade detection
US5878166A (en) * 1995-12-26 1999-03-02 C-Cube Microsystems Field frame macroblock encoding decision
US5682204A (en) * 1995-12-26 1997-10-28 C Cube Microsystems, Inc. Video encoder which uses intra-coding when an activity level of a current macro-block is smaller than a threshold level
KR0170735B1 (ko) * 1996-01-29 1999-03-20 김광호 정지영상 데이터의 압축장치
CA2208950A1 (en) * 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
FR2756399B1 (fr) * 1996-11-28 1999-06-25 Thomson Multimedia Sa Procede et dispositif de compression video pour images de synthese
US6005980A (en) * 1997-03-07 1999-12-21 General Instrument Corporation Motion estimation and compensation of video object planes for interlaced digital video
US6278735B1 (en) * 1998-03-19 2001-08-21 International Business Machines Corporation Real-time single pass variable bit rate control strategy and encoder
US7263127B1 (en) * 1998-04-02 2007-08-28 Intel Corporation Method and apparatus for simplifying frame-based motion estimation

Also Published As

Publication number Publication date
JP2001036912A (ja) 2001-02-09
US6661926B1 (en) 2003-12-09
CN1278693A (zh) 2001-01-03
JP4806483B2 (ja) 2011-11-02
EP1061750A3 (en) 2010-05-05
EP1061750A2 (en) 2000-12-20

Similar Documents

Publication Publication Date Title
CN1820512A (zh) 消除块效应的方法、介质和滤波器
CN1324904C (zh) 运动图像编码设备和运动图像编码方法
CN1620821A (zh) 图像信息编码装置和图像信息编码方法、图像信息解码装置和图像信息解码方法
CN1640149A (zh) 影像数据转换装置以及影像数据转换方法
CN101039432A (zh) 在编码过程中实现自适应量化的方法及装置
CN1929611A (zh) 用于视频帧内预测编码和解码的方法和装置
CN1794815A (zh) 产生对图像或图像序列进行编码的量化矩阵的方法和设备
CN1652610A (zh) 视频或图像去块滤波的方法和装置
CN1692653A (zh) 活动图像编码/解码方法和设备
CN1830213A (zh) 用于视频编码的方法和设备
CN1910933A (zh) 图像信息编码装置和图像信息编码方法
CN1921630A (zh) 视频编码/解码的装置和方法及其记录介质
CN101043621A (zh) 一种自适应插值处理方法及编解码模块
CN1925619A (zh) 视频编码和解码的装置和方法及其记录介质
CN1809161A (zh) 对编码视频数据选择编码类型和预测模式
CN1777283A (zh) 一种基于微块的视频信号编/解码方法
CN1842164A (zh) 解码视频数据的解码器和系统
CN1225919C (zh) 编码图像信息的方法和设备及解码图像信息的方法和设备
CN1882083A (zh) 一种降低图像方块效应的方法
CN1155255C (zh) 图像压缩处理方法
CN1756364A (zh) 帧内预测模式的选择方法
CN1713729A (zh) 一种视频压缩方法
CN1750658A (zh) 帧间预测模式的选择方法
CN1164124C (zh) 图像压缩处理方法
CN1581979A (zh) 用于压缩数字图像的设备和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: La France

Patentee after: COLOR PRINTING TECHNOLOGY Co.

Address before: La France

Patentee before: THOMSON MULTIMEDIA

CP01 Change in the name or title of a patent holder
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING S.A.

Address before: French Boulogne Billancourt

Patentee before: THOMSON LICENSING S.A.

TR01 Transfer of patent right

Effective date of registration: 20190301

Address after: Paris France

Patentee after: International Digital Madison Patent Holding Co.

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

Effective date of registration: 20190301

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING S.A.

Effective date of registration: 20190301

Address after: French Boulogne Billancourt

Patentee after: THOMSON LICENSING S.A.

Address before: La France

Patentee before: COLOR PRINTING TECHNOLOGY Co.

TR01 Transfer of patent right
CX01 Expiry of patent term

Granted publication date: 20040623

CX01 Expiry of patent term