CN1647540A - 用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法 - Google Patents

用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法 Download PDF

Info

Publication number
CN1647540A
CN1647540A CNA038089769A CN03808976A CN1647540A CN 1647540 A CN1647540 A CN 1647540A CN A038089769 A CNA038089769 A CN A038089769A CN 03808976 A CN03808976 A CN 03808976A CN 1647540 A CN1647540 A CN 1647540A
Authority
CN
China
Prior art keywords
dct coefficient
dct
coefficient
video image
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038089769A
Other languages
English (en)
Inventor
Y·陈
Z·钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1647540A publication Critical patent/CN1647540A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供一种通过改变视频处理系统中的编码算法来降低MPEG解码器的计算负荷的方法和系统(10)。在编码模式期间,接收数据块流并为每个宏块产生(12)至少一个运动矢量和至少一个运动补偿预测值。该预测值被变换(14)为一组DCT系数。在量化步骤之前,根据预定标准修改(14)该组DCT系数。为此,计算除最低2×2 DCT系数以外的DCT系数的总能级,并交替舍弃最后列和最后行的DCT系数,直到DCT系数的总能级达到预定能级。其后,给该舍弃的列或行分配预定值。然后,经修改的DCT系数被量化(16)和编码(20),从而产生编码的宏块比特流,随后根据常规解码处理对其解码。

Description

用于提供适用于降低复杂度的 解码的单层视频编码比特流的系统和方法
本发明涉及数字视频信息压缩,更具体来说,涉及用于提供不同的编码策略以在解码期间获得效率的方法和设备。
单层视频编码被广泛用于各种应用,比如数字-视频录像和数字电视。将视频按照一定的比特率编码,然后解码器将比特流解码并以编码的全品质输出每张图片。为减少计算负载,已经采用了单层比特流的降低复杂度的解码。然而,由于按照部分品质将图片解码,所以在解码器一侧用于运动补偿的基准图片经常与编码期间使用的基准图片不匹配。结果,在基准图片中发生的错误传播到其它的图片。这又称为预测漂移或错误传播。
分层视频编码或比特率可缩放方法是单层视频编码的替换方案。首先,以低比特率对视频进行编码以产生基本层。然后,对原始视频与基本层重建视频之间的差异进行编码,以产生一个或多个增强层。在解码器一侧,基本层总是被解码,但是对增强层的完全或部分解码取决于可用的处理能力。如果仅有基本层被解码,由于低质量基准图片被用于编码,则不存在预测漂移。如果完全的增强层与基本层都被解码,则为了解码目的,每层在编码期间采用自己对应的基准图片,从而也不存在预测漂移。然而,如果增强层仅仅被部分地解码且在增强层图片中存在运动预测,则增强层中会发生预测漂移。此外,因为增强层中使用的基准图片无益于有效的运动预测,所以在压缩期间,这种编码其本身效率较低。此外,如果要产生相同的品质,多分层编码中的额外开销要比解码单层比特流更为复杂。因此,需要获得相对简单以利于实际实现的最优的解码性能。
本发明涉及通过改变单层编码算法以获得适用于可变复杂度解码的编码的数字视频信号、从而提高MPEG数字视频解码器系统的解码效率的方法与系统。
根据本发明的一个方面,提供了对具有至少一个宏块的输入视频图像流进行编码的方法。该方法包括如下步骤:为输入视频图像的每个宏块产生运动矢量;根据该运动矢量产生输入视频图像的预测图像信号;将该预测图像信号变换为二维阵列的DCT系数;根据预定标准,将该DCT系数阵列修改为一组新的DCT系数;将所述新DCT系数量化为量化的DCT值;执行Z字形扫描,以将每一行新DCT系数读成一个串行链;以及对来自Z字形扫描的串行链和运动矢量进行编码以生成编码的宏块。修改DCT系数阵列的步骤包括如下步骤:交替舍弃最后列的DCT系数和最后行的DCT系数,直到DCT系数的能级到达预定能级;以及给所舍弃的列或行分配预定值。修改DCT系数阵列的步骤包括如下步骤:计算除最低2×2 DCT系数以外的DCT系数的总能级;交替舍弃最后列和最后行的DCT系数,直到DCT系数的总能级达到预定能级;以及给所舍弃的列和行分配预定值。该方法进一步包括如下步骤:将量化的DCT值去量化以产生去量化的、解码的数据;将去量化的、解码的数据从频域变换到空间域,以生成基准数据;以及对基准数据执行运动补偿以生成运动补偿图片。在该实施例中,在将预测图像信号变换为DCT系数阵列的步骤之前,对输入视频图像的预测(P)图片执行全像素(full-pel)运动补偿。
根据本发明的另一方面,对具有至少一个宏块的输入视频图像进行编码的方法包括如下步骤:(a)为输入视频图像的每个宏块产生至少一个运动矢量和至少一个运动补偿预测值;(b)将该预测值变换为一组DCT系数;(c)根据预定标准,将该组DCT系数修改为一组新的DCT系数;(d)对该组DCT系数进行量化;和,(e)对量化的该组DCT系数和运动矢量进行编码,以生成编码的宏块。该方法进一步包括如下步骤:将编码的宏块转发至解码处理;确定来自输入视频图像的图片的类型,其中,如果从输入视频图像中检测到预测图片,则在执行将预测值变换为该组DCT系数的步骤(b)之前对输入视频图像执行全像素运动补偿。当从输入视频图像中检测到预测图片时,将运动矢量变换成全运动矢量。通过计算除最低2×2 DCT系数以外的DCT系数的总能级来修改DCT系数阵列;交替舍弃最后列和最后行的DCT系数、直到DCT系数的总能级达到预定能级;以及给所舍弃的列和行分配预定值。该方法进一步包括如下步骤:将量化的DCT值去量化以产生去量化的、解码的数据;将去量化的、解码的数据从频域变换到空间域,以生成基准数据;和,对基准数据执行运动补偿以生成运动补偿图片。
根据本发明的另一方面,用于对输入视频图像进行编码的编码系统包括:运动估计预测模块,它被配置用来接收输入视频图像和产生至少一个运动矢量与至少一个预测误差信号;离散余弦变换器(DCT)模块,它被耦合至运动估计模块的输出端,以用于将预测误差信号变换为二维阵列的DCT系数。根据对来自输入视频图像的图片类型的分类来修改所述DCT系数;量化模块,它被耦合至DCT模块,以用于对经修改的DCT系数进行量化,以生成量化的系数;Z字形扫描模块,它被耦合至量化模块,并被配置用来将量化的系数转换为串行表示;和编码模块,用于对量化的该组系数和运动矢量进行编码,以生成编码的宏块。该系统进一步包括:反量化模块,其被耦合以便从量化模块接收量化的系数并对其求反;反离散余弦变换器(IDCT),其被耦合至反量化模块的输出端,以用于将去量化的系数从频域变换到空间域;和基准帧缓存器,用于从IDCT接收输出信号以形成运动补偿的图片。
还有另一个方面是,可以为了所希望的特定应用,以硬件、软件或硬件与软件的组合的形式实现本发明。
此外,本发明可以用简易、可靠并且廉价的方式实现。
对于本领域技术人员而言,当结合附图阅读下列详细说明时,这些及其它的优点将变得明显。
通过结合附图参照下列详细说明,将可以更全面地理解本发明的方法与设备,其中:
图1示出用于压缩视频信息的编码器的示例性实施例;
图2示出根据本发明修改DCT系数以用于降低解码期间的计算负荷的图示;
图3示出根据本发明在执行量化之前修改DCT系数的图示;和,
图4是说明根据本发明降低解码期间的计算负荷的处理流程图。
为了提供对本发明的彻底了解,在下列描述中(为了说明而不是为了限制)阐明了诸如特定的体系结构、接口、技术等之类的具体细节。然而,对于本领域技术人员而言,显然可脱离这些细节而在其它实施例中实践本发明。为简单明了,公知的设备、电路和方法的详细说明从略,以免不必要的细节使本发明的说明变得模糊。
为了便于理解本发明,下文将简要描述依照MPEG标准的压缩与解码视频数据的常规方法。
为了减少视频压缩编解码器的高成本和实现在不同厂商之间提供设备互操作性的方法,根据运动图像专家组(MPEG)标准建立了压缩标准,以用于视频的编码与解码。MPEG标准在国际标准ISO/IEC11172-1(即“信息技术-以高达大约1.5Mbit/s的速率对用于数字存储介质的运动图像和有关音频进行编码”)的1993年8月1日第一版第1、2和3部分中定义,在此全面引入作为参考。
存在MPEG标准下的三类视频信息帧:帧内编码帧(I帧)、前向预测帧(P帧)和双向预测帧(B帧)。I帧被周期性地编码,即为每组帧而独立编码一个帧。通过合成位于前向的特定数量帧处的、在下一个基准帧之前的一个视频帧(P帧)来进行预测。在两个基准帧之间,或通过对过去基准帧内的宏块与未来基准帧中的宏块进行内插(求平均),来预测B帧。指定基准帧内部宏块相对于当前帧内部该宏块的相对位置的运动矢量也被编码。可基于先前帧与后续帧对当前帧进行编码。同样,需要基于MPEG编码惯例对一个帧进行编码,然后除了总是与其它帧无关地被编码的I帧以外,与该帧相关的其它帧基于与该帧的差异而被编码。
在基于运动补偿的视频编码中,运动矢量可以具有整数值(即全像素编码),其中按照基准帧中的实际像素值指定当前帧中的像素值,或具有半整数值(即半像素编码)、四分之一整数值(即四分之一像素编码)与分数值(即分数像素编码),其中根据从基准帧内现存像素中内插的“虚拟”像素指定当前帧中的像素值。半像素运动补偿以及四分之一像素与分数像素运动补偿的计算规模比全像素运动补偿更大,这是因为解码器必须从分别由使用半、四分之一、分数像素网格的运动矢量所参照的先前宏块中内插出宏块。
使用离散余弦变换(DCT)编码方案对帧进行编码,该方案将系数编码为特定的余弦基(cosine-basis)函数的振幅。使用可变或游程长度编码对DCT系数进行量化和进一步的编码。当接收压缩编码帧时,解码器通过执行运动补偿将当前P帧宏块解码,该运动补偿利用了施加给过去基准帧的对应宏块的运动矢量。解码器还通过执行运动补偿将B帧的宏块解码,该运动补偿利用了分别施加给过去与未来基准帧的运动矢量。一个帧中的像素宏块可以通过平移先前或后续帧中的像素宏块而获得。平移量又称为运动矢量。由于I帧被作为单个图像编码而不用参考任何过去或未来的帧,所以当对I帧进行解码时不必进行运动处理。
如上所述,在许多常见的视频解压缩方法中,运动补偿是计算最密集的操作之一,尤其当采用分数运动矢量时更是如此。这样,无法满足上述解压缩负载的计算要求的视频系统就会经常丢掉整个帧。有时这是可看得见的,如视频重放中的短时停滞,跟着是图像的突变或抖动。为了降低与解压缩方法有关的对解码端的处理要求,已开发了各种解码复杂度降低方法。本发明提供一种构造压缩视频比特流的新颖方法,从而可以降低解码复杂度,而同时保持最终视频图像的质量。
图1说明根据本发明一个实施例的用于编码视频信号的编码器10的简化框图。编码器10包括:运动估计与预测模块12,DCT模块14,量化模块16,Z字形扫描模块18,游程长度编码模块20,反量化模块22,反DCT模块24和基准帧缓存器模块26。在本发明优选实施例中,编码器10可在下述设备中实现:个人电脑、工作站、个人数字助理(PDA)、手提式电脑中的中央处理器,和/或诸如微处理器、数字信号处理器、微控制器、微型电脑之类的集成电路和/或任何其它根据编程指令处理数字信息的设备。基准帧缓存器26可以是硬驱动存储器、随机存取存储器、只读存储器、外部存储器和/或任何其它存储数字信息的设备。注意,包括运动补偿与预测模块12、反量化模块22、和反DCT模块24的该组模块通常称为“嵌入式解码器”。对于本领域普通技术人员而言,已经熟知这类解码模块;因此,其描述从略以免累赘。
编码器10接收的输入视频信号(V)可以是来自下述设备的信号:摄录一体机,DVD播放机,VCR,电视调谐器和/或任何其它接收数字信息的设备。该视频信息流被从模拟信号变换成数字信号,然后被施加给编码器10。输入视频信号进一步被分成多个层,从而对应于一片图像(帧)的每个图片被分成多个片段,并且每个片段由依从左至右、自上而下顺序的多个宏块组成。每个宏块包括六个分量:Y1到Y4的四个亮度分量,其表示构成16×16像素宏块的四个8×8像素块的亮度,以及构成用于相同宏块的8×8像素块的差异分量Cb与Cr的两个颜色(U,V)。将图片划分为块单元,提高了平滑两个连续图片之间变化的能力。
如图1所示,运动估计与预测模块12适于接收输入视频信号(V),以用于估计运动矢量以提供从当前图片块坐标到基准帧坐标的偏移量。随后,运动矢量可被用来从先前基准帧中重建当前帧,因为运动信息降低了存在于视频序列中的连续帧之间的高冗余度。另外,可以通过使用先前解码帧与运动矢量获得当前帧的估计量。运动补偿涉及预测,该预测使用运动矢量来向过去和/或未来基准帧提供偏移量,所述基准帧包括被用来形成预测误差的先前解码的样本值。
然后,宏块的每个8×8像素块经离散余弦变换(DCT)以为其中64个频带中的每个频带产生一组8×8块的DCT系数。注意,可以独立处理每个系数而不损失压缩效率。最终的8×8块DCT系数由量化模块16接收。在本发明的优选实施例中,为每个宏块编码的信息量也通过根据量化前的预定标准处理某些高频DCT系数而被调整(下文将参照图2和3说明)。然后,将8×8像素块内的DCT系数除以对应的编码参数(即量化权重)。用于给定的8×8像素块的量化权重以8×8量化矩阵的形式表示。其后,附加计算在DCT系数上受影响,以便为每个宏块考虑量化器的标度值。注意,量化标度值对应于量化精度的空间调整程度,该量化精度可以不同于宏块。该调整经常利用人眼,其基于每一宏块视觉内容的特性而对于加载伪像灵敏地变化。通过用这种量化值量化DCT系数,许多DCT系数被变换为零,因此提高图像压缩效率。
最终的经量化的DCT系数的8×8块由Z字形扫描模块18接收,其中按照“Z字形”次序扫描经量化的系数的二维块,以便将其变换为经量化的DCT系数的一维串。其后,游程长度编码模块20使用游程编码而对该串经量化的DCT系数、宏块类型、和运动矢量进行编码,以便通过用单个符号对一连串符号进行编码来提高编码效率。注意,该编码方案已是本领域众所周知的,而且可以根据本发明的技术,采用其它众所周知的编码方案,例如霍夫曼(Huffman)编码。游程长度编码模块20的输出为比特流BS。
现在将详细说明根据本发明通过在量化之前调整高频DCT系数中的信息来提供适于可变复杂度的解码的编码。
参照图2,图片被分成8×8像素矩阵块,在块单元中由DCT模块14执行DCT,以便获得8×8变换系数。然后,最终得到的DCT系数的矩形8×8块经历掩码变换(以下称为“DCT掩码”),其中分析DCT系数以获得包括DCT系数能量的特定百分比(α1)的矩形。通过首先计算除最低2×2 DCT系数以外的全部DCT块的总能量来获得该矩形。然后,如图2(a)所示,在能级计算期间舍弃最后列或第八列的频率分量,并且再次计算除最低2×2 DCT系数以外的能级。与此同时,确定新计算的能级是否超过预定百分比,例如:总能量的85%。如果未超过,如图2(b)所示,当计算除最低2×2 DCT系数以外的DCT块的剩余能级时,舍弃最后行或第八行的频率分量。如果新计算的能级不低于预定的百分比,则舍弃第七列的频率分量,如图2(c)所示,然后再次计算除最低2×2 DCT系数以外的剩余DCT块的新能级。按照这样的方式,交替舍弃附加的列与行频率分量,直到获得所期望的能级。
参照图3,一旦所期望的能级被获得,在计算期望能级时所舍弃的列与行频率分量,被赋予相对高的量化矩阵权重,例如:255。通过用这种高值量化DCT系数,DCT系数在量化期间被有效地变换为零。由于在编码期间执行类似的操作,所以舍弃高频DCT系数不会引起重大的预测漂移。
注意,用降低的复杂度所解码的图片不具有与编码器一侧的图片一样多的高频信息,但是降低的复杂度往往造成预测漂移。如果可以使编码器一侧使用的基准图片更接近于由部分质量解码所得到的图片,则该预测漂移可以被降低。因此,在本发明的优选实施例中,由于某些图片不大会造成预测漂移,有必要对此类被编码的图片类型给出不同的权重。本领域技术人员将理解,由于在下一帧内编码的图片之前只有较少的帧用于误差传播,在当前图片组(GOP)中的P图片比I图片更不易造成预测漂移。这样,在根据本发明执行降低复杂度的解码时,必须以较少的考虑设计用于GOP内稍后图片的量化矩阵或DCT掩码。类似地,如果是部分质量解码,则在设计用于I图片(GOP内的第一张图片)的量化矩阵或DCT掩码时应当最大限度地考虑预测漂移。进一步地,由于B图片不被用作基准图片,故不需要DCT掩码。因此,在编码期间,用于B图片的量化矩阵可以保持与用于最优化的单层编码的量化矩阵一样。
进一步注意,由于运动补偿往往是计算密集的操作,另一个降低解码复杂度的方法是通过简化运动补偿。因此,在本发明的优选实施例中,可以在编码期间应用较粗精度的MC,以便进一步利于可变复杂度的解码。例如,如果1/2像素MC被用于编码(如同在MPEG-2中),当非整数运动矢量在计算高峰负荷周期期间被用于当前宏块时,可强制解码器只应用全像素运动补偿而不用内插1/2像素位置的像素值。类似地,如果1/4像素MC被用于编码,则1/2像素MC、全像素MC或其任何组合可被用于解码。因此,如果在只针对P图片的编码期间使用了简化的运动预测,来自降低复杂度的解码的预测偏移可被消除或降低。然而,没有针对I图片执行运动预测,因此不适于I图片。另外,因为B图片不被用作未来基准图片,所以可用全复杂度、较高精度的运动补偿来编码B图片。
鉴于上述考虑,图4的下列流程图示出根据本发明实施例的能够降低解码复杂度的编码操作过程。
参照图4,在步骤100中由编码器10接收输入视频信息时,在步骤102检测图片的类型,以便可以如下所述地根据图片分类来应用不同的编码方式。
I.当前图片被编码为帧内编码(I)的图片。
I帧图片被分割成8×8块,然后在步骤104执行DCT,其中每个系数用Ci,j表示,i和j的范围从0到7。在步骤106,分析DCT系数,来获得包含除最低2×2 DCT系数以外的DCT系数能量的α1的矩形。
按照数学的形式,获得矩形(iα1,jα1)如下:
首先,计算除最低2×2系数以外的全部DCT块的总能量:
Figure A0380897600121
接着,计算Eα=α1E。接着,设置初始行与列号:i=j=7。接着,通过下列步骤进行迭代:
计算
Figure A0380897600122
(此步舍弃最右列的频率分量),
如果 E ⇐ E α , 停止并输出(i,j-1);否则继续下一步;
计算
Figure A0380897600132
(此步舍弃最低一行的频率分量),
如果 E ⇐ E α , 停止并输出(i-1,j-1);否则继续下一步i=i-1;j=j-1。
在获得矩形产生的期望能级以后,在步骤108计算对应矩形的量化矩阵。假设用于完全编码的量化矩阵是
Figure A0380897600134
其中i,j的范围从0到7。这种矩阵的一个示例为常规的用于帧内编码图片的MPEG编码方案(即测试模型5(TM5))矩阵,其中通过比较预测残差(residuals)(误差信号)的能量来选择用于每个宏块的编码方式。即,通过将宏块像素的方差与用于每种编码方式的预测残差的方差进行比较,来确定intrade-方式的决定。
计算用于当前帧内编码图片的部分编码的量化矩阵如下:
如果 i ⇐ i α 1 j ⇐ j α 1 , W i , j = W i , j ‾
否则Wi,j=255
最后,在步骤110,修改后的量化矩阵被编码,并且编码的信号被转发到解码一侧。
II.当前图片被编码为预测(P)图片。
如果在步骤102检测到P图片,则在步骤120对P图片进行全像素(降低的分辩率)的运动预测。步骤122到步骤128的操作基本与上述相对应的步骤104到步骤110所述相同。仅有的显著差别在于αP的设置取决于该P图片在当前GOP中的位置。因此,在前面段落中描述的类似部分的讨论从略以免累赘。αP的设置取决于该P图片在当前GOP中的位置。由于P图片处于GOP中稍后位置,在I图片复位预测周期之前,在后续帧中将导致较低的预测漂移。我们表示GOP的尺寸大小(图片组中图片的数量)为N,并且GOP中P图片的相对位置为n。计算αP如下:
α p = α 1 ( 1 - n / N ) , 其中n范围从M-1到N-1。
III.当前图片被编码为双向预测图片。
如果当前图片被编码为双向图片,由于B图片不会造成解码器一侧的预测漂移,所以执行普通的编码;因此不需要编码时间复杂度降低的准备。
上文已经公开了通过适应地改变视频编码器中的编码方式、从而降低与解压缩方法学有关的处理要求的方法和系统。对于本领域技术人员而言,通过提高解压缩效率而不过分降级最终视频图像来实现该系统和方法的优点应显而易见。通过设计编码处理以在编码期间保持一定的压缩效率,当与为固定的全品质解码而优化的普通编码处理相比,可实现具用较少品质降级的复杂度的降低,以便减少解码期间的预测漂移。
虽然已经说明和描述了本发明的优选实施例,但对于本领域技术人员而言,在不脱离本发明的真实范围的情况下,显然可以作出各种改变与修改并用等效元件替换其中的元件。因此,我们的意图在于:本发明并不局限于作为被设想用于实现本发明的最佳方式而公开的具体实施例,相反地,本发明包括落在所附权利要求书范围中的全部实施例。

Claims (16)

1.一种用于对具有至少一个宏块的输入视频图像流进行编码的方法(10),该方法包括如下步骤:
-为所述输入视频图像的每个宏块产生(12)运动矢量;
-根据所述运动矢量产生(12)所述输入视频图像的预测图像信号;
-将所述预测图像信号变换(14)为DCT系数的二维阵列;
-根据预定标准,将所述的DCT系数阵列修改(14)为一组新的DCT系数;
-将所述新DCT系数量化(16)为量化的DCT值;
-执行(18)Z字形扫描以将所述新DCT系数的每行读成串行链;和,
-对来自所述Z字形扫描的所述串行链和所述运动矢量进行编码(20),以生成编码的宏块。
2.根据权利要求1的方法,其中修改所述DCT系数阵列的步骤包括如下步骤:
-交替舍弃最后列的DCT系数和最后行的DCT系数,直到所述DCT系数的能级达到预定能级;和,
-给所述舍弃的列或行分配预定值。
3.根据权利要求1的方法,其中DCT系数阵列为一个8×8矩阵。
4.根据权利要求1的方法,其中将所述预测图像信号变换成所述DCT系数阵列的步骤,包括对所述DCT系数的从时域到频域的转换。
5.根据权利要求1的方法,其中修改所述DCT系数阵列的步骤包括如下步骤:
-计算除最低2×2DCT系数以外的所述DCT系数的总能级;
-交替舍弃最后列和最后行的所述DCT系数,直到所述DCT系数的总能级达到预定能级;和,
-给所述舍弃的列和行分配预定值。
6.根据权利要求1的方法,其中根据预定编码配置表执行编码步骤。
7.根据权利要求1的方法,进一步包括如下步骤:
-将量化的DCT值去量化以产生去量化的、解码的数据;
-将所述去量化的、解码的数据从频域变换到空间域,以生成基准数据;和,
-对所述基准数据执行运动补偿以生成运动补偿图片。
8.根据权利要求1的方法,进一步包括步骤:在将所述预测图像信号变换成所述DCT系数阵列的步骤之前,对所述输入视频图像的预测(P)图片执行全像素运动补偿。
9.根据权利要求1的方法,进一步包括将所述编码的宏块转发至解码处理的步骤。
10.一种用于对具有至少一个宏块的输入视频图像进行编码的方法(10),该方法包括如下步骤:
(a)为所述输入视频图像的每个宏块产生(12)至少一个运动矢量和至少一个运动补偿预测值;
(b)将所述预测值变换(14)成一组DCT系数;
(c)根据预定标准,将该组所述DCT系数修改为(14)一组新的DCT系数;
(d)将该组所述DCT系数进行量化(16);和,
(e)对所述量化的该组所述系数和所述运动矢量进行编码(20),以生成编码的宏块。
11.根据权利要求10的方法,进一步包括从所述输入视频图像中确定(102)图片类型的步骤。
12.根据权利要求11的方法,其中,如果从所述输入视频图像中检测到预测图片,在执行将所述预测值变换成该组所述DCT系数的所述步骤(b)之前,对所述输入视频图像执行全像素运动补偿。
13.根据权利要求11的方法,进一步包括,当从所述输入视频图像中检测到预测图片时,将所述运动矢量转换为全运动矢量。
14.一种对输入视频图像进行编码的编码系统(10),包括:
-运动估计预测模块(12),它被配置用来接收所述输入视频图像和产生至少一个运动矢量与至少一个预测误差信号;
-离散余弦变换器(DCT)(14)模块,它被耦合至所述运动估计模块(12)的输出端,用于将所述预测误差信号变换为DCT系数的二维阵列,其中根据对来自所述输入视频图像中的图片类型的分类来修改所述DCT系数;
-量化模块(16),它被耦合至所述DCT模块,用于对所述修改的DCT系数进行量化,以生成量化的系数;
-Z字形扫描模块(18),它被耦合至所述量化模块,被配置用来将所述量化的系数转换为串行表示;和,
-编码模块(20),用于对所述量化的该组所述系数和所述运动矢量进行编码,以生成编码的宏块。
15.权利要求14的编码系统,进一步包括:
-反量化模块(22),它被耦合来从所述量化模块接收量化的系数并对其求反;
-反离散余弦变换器(IDCT)(24),它被耦合至所述反量化模块(22)的输出端,用于将去量化的系数从频域变换到空间域;和,
-基准帧缓存器(26),用于从所述IDCT接收输出信号以形成运动补偿的图片。
16.一种具有存储于其上的表示指令序列的数据的机器可读性介质,当指令序列被处理器执行时,导致处理器:
-为所述输入视频图像的每个宏块产生(12)运动矢量;
-根据所述运动矢量,产生(12)所述输入视频图像的预测图像信号;
-将所述预测图像信号变换(14)为DCT系数的二维阵列;
-根据预定标准,将所述DCT系数阵列修改(14)为一组新的DCT系数;
-将所述新DCT系数量化(16)为量化的DCT值;
-执行(18)Z字形扫描以将所述新DCT系数的每一行读成串行链;和,
-对来自所述Z字形扫描的所述串行链和所述运动矢量进行编码(20),以生成编码的宏块。
CNA038089769A 2002-04-22 2003-04-15 用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法 Pending CN1647540A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/127,528 2002-04-22
US10/127,528 US6985635B2 (en) 2002-04-22 2002-04-22 System and method for providing a single-layer video encoded bitstreams suitable for reduced-complexity decoding

Publications (1)

Publication Number Publication Date
CN1647540A true CN1647540A (zh) 2005-07-27

Family

ID=29215287

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038089769A Pending CN1647540A (zh) 2002-04-22 2003-04-15 用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法

Country Status (7)

Country Link
US (1) US6985635B2 (zh)
EP (1) EP1500279A2 (zh)
JP (1) JP4393875B2 (zh)
KR (1) KR20040106364A (zh)
CN (1) CN1647540A (zh)
AU (1) AU2003216693A1 (zh)
WO (1) WO2003090469A2 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8654848B2 (en) 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US8780957B2 (en) 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
US8879635B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
US8948260B2 (en) 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US9131164B2 (en) 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
US9197912B2 (en) 2005-03-10 2015-11-24 Qualcomm Incorporated Content classification for multimedia processing
TWI514853B (zh) * 2012-07-19 2015-12-21 Omnivision Tech Inc 由量化控制改良解碼器效能的方法與系統

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050185852A1 (en) * 2004-02-20 2005-08-25 Jiliang Song Method and apparatus to generate complex borders
KR100694059B1 (ko) * 2004-09-30 2007-03-12 삼성전자주식회사 멀티 타임 스캔 방식에 기초한 인터 모드 인코딩 및디코딩 방법 및 장치
US20090147851A1 (en) * 2004-11-22 2009-06-11 Koninklijke Philips Electronics, N.V. Motion vector field projection dealing with covering and uncovering
EP1768416A1 (en) * 2005-09-27 2007-03-28 Matsushita Electric Industrial Co., Ltd. Frequency selective video compression and quantization
EP1768415A1 (en) * 2005-09-27 2007-03-28 Matsushita Electric Industrial Co., Ltd. Adaptive scan order of DCT coefficients and its signaling
EP1879401A4 (en) * 2005-05-03 2012-03-28 Panasonic Corp DYNAMIC IMAGE ENCODING METHOD, DYNAMIC IMAGE DECODING METHOD, AND DEVICE THEREFOR
US20070206117A1 (en) * 2005-10-17 2007-09-06 Qualcomm Incorporated Motion and apparatus for spatio-temporal deinterlacing aided by motion compensation for field-based video
US20070171280A1 (en) * 2005-10-24 2007-07-26 Qualcomm Incorporated Inverse telecine algorithm based on state machine
US8780997B2 (en) * 2005-11-18 2014-07-15 Apple Inc. Regulation of decode-side processing based on perceptual masking
CN100405851C (zh) * 2005-11-18 2008-07-23 宁波中科集成电路设计中心有限公司 多模标准解码器中运动矢量预测复用设计方法
US20070147496A1 (en) * 2005-12-23 2007-06-28 Bhaskar Sherigar Hardware implementation of programmable controls for inverse quantizing with a plurality of standards
US8102916B1 (en) 2006-01-12 2012-01-24 Zenverge, Inc. Dynamically changing media compression format in compressed domain
US7830800B1 (en) 2006-01-12 2010-11-09 Zenverge, Inc. Architecture for combining media processing with networking
US8848789B2 (en) * 2006-03-27 2014-09-30 Qualcomm Incorporated Method and system for coding and decoding information associated with video compression
US8208553B2 (en) * 2006-05-04 2012-06-26 Altera Corporation Methods and apparatus for quarter-pel refinement in a SIMD array processor
US8311114B1 (en) 2006-12-06 2012-11-13 Zenverge, Inc. Streamlined transcoder architecture
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
US8265168B1 (en) 2008-02-01 2012-09-11 Zenverge, Inc. Providing trick mode for video stream transmitted over network
WO2009097284A1 (en) * 2008-02-01 2009-08-06 Zenverge, Inc. Intermediate compression of reference frames for transcoding
US9326004B2 (en) * 2008-06-03 2016-04-26 Broadcom Corporation Reduced memory mode video decode
KR101775555B1 (ko) * 2010-03-02 2017-09-07 삼성전자주식회사 동영상 패킷 생성 방법 및 그 장치
KR20120012301A (ko) * 2010-07-30 2012-02-09 삼성전자주식회사 디지털 방송에서의 확장 방송 서비스 송수신 방법 및 장치
TWI470999B (zh) * 2012-06-19 2015-01-21 Wistron Corp 編輯與儲存串流的方法、裝置、系統

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0530022B1 (en) * 1991-08-30 1998-05-06 Fuji Xerox Co., Ltd. Apparatus for encoding am image signal
US5592302A (en) * 1992-03-23 1997-01-07 Canon Kabushiki Kaisha Coding method for coding pixel blocks and apparatus therefor
US5289548A (en) * 1992-06-30 1994-02-22 Loral Aerospace Corp. Compression and reconstruction of radiological images

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8780957B2 (en) 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
US9197912B2 (en) 2005-03-10 2015-11-24 Qualcomm Incorporated Content classification for multimedia processing
US9071822B2 (en) 2005-09-27 2015-06-30 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
US8879857B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Redundant data encoding methods and device
US8879856B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US9088776B2 (en) 2005-09-27 2015-07-21 Qualcomm Incorporated Scalability techniques based on content information
US9113147B2 (en) 2005-09-27 2015-08-18 Qualcomm Incorporated Scalability techniques based on content information
US8879635B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
CN101982977B (zh) * 2005-09-27 2016-07-06 高通股份有限公司 用于与时域边界进行数据对准的方法和装置
US8948260B2 (en) 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US8654848B2 (en) 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US9131164B2 (en) 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
TWI514853B (zh) * 2012-07-19 2015-12-21 Omnivision Tech Inc 由量化控制改良解碼器效能的方法與系統

Also Published As

Publication number Publication date
AU2003216693A8 (en) 2003-11-03
KR20040106364A (ko) 2004-12-17
JP4393875B2 (ja) 2010-01-06
WO2003090469A2 (en) 2003-10-30
JP2005523658A (ja) 2005-08-04
WO2003090469A3 (en) 2004-02-05
US20030198293A1 (en) 2003-10-23
US6985635B2 (en) 2006-01-10
AU2003216693A1 (en) 2003-11-03
EP1500279A2 (en) 2005-01-26

Similar Documents

Publication Publication Date Title
CN1647540A (zh) 用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法
US7010037B2 (en) System and method for rate-distortion optimized data partitioning for video coding using backward adaptation
JP4610195B2 (ja) スキップマクロブロックコード化
US8249145B2 (en) Estimating sample-domain distortion in the transform domain with rounding compensation
US7869661B2 (en) Image coding apparatus, image coding method, and image coding program for coding at least one still frame with still frame coding having a higher quality than normal frame coding of other frames
KR100813963B1 (ko) 동영상의 무손실 부호화, 복호화 방법 및 장치
CN1232123C (zh) 用于精细可伸缩性增强层的基于活动的频率加权方法及系统
US7974340B2 (en) Adaptive B-picture quantization control
CN1251512C (zh) 从不可分级编码视频信号产生可分级编码视频信号的方法和装置
JP4425563B2 (ja) フェーディング補償のためのパラメータ化
US20040136457A1 (en) Method and system for supercompression of compressed digital video
CN1633812A (zh) 视频图片的全局运动补偿
CN1589576A (zh) 使用较大像素格栅运动补偿的降低复杂性视频解码
CN1822677A (zh) 预测视频块的系数的设备和方法
CN1209928C (zh) 一种基于预测块组的采用帧内预测的帧内编码帧编码方法
US20070165717A1 (en) System and method for rate-distortion optimized data partitioning for video coding using parametric rate-distortion model
CN1941914A (zh) 用于在变换域中预测dc系数的设备及其方法
CN1302666C (zh) 编码运动图像的装置和方法
JPH11513873A (ja) ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法
JP3509346B2 (ja) 符号化装置および符号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
C20 Patent right or utility model deemed to be abandoned or is abandoned