CN1708135A - 用于预测视频数据单元的直流系数的方法和设备 - Google Patents

用于预测视频数据单元的直流系数的方法和设备 Download PDF

Info

Publication number
CN1708135A
CN1708135A CNA2005100751887A CN200510075188A CN1708135A CN 1708135 A CN1708135 A CN 1708135A CN A2005100751887 A CNA2005100751887 A CN A2005100751887A CN 200510075188 A CN200510075188 A CN 200510075188A CN 1708135 A CN1708135 A CN 1708135A
Authority
CN
China
Prior art keywords
data unit
unit
coefficient
reference data
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005100751887A
Other languages
English (en)
Other versions
CN100396102C (zh
Inventor
朴光勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Industry University Cooperation Foundation of Sogang University
Industry Academic Cooperation Foundation of Kyung Hee University
Original Assignee
Samsung Electronics Co Ltd
Industry Academic Cooperation Foundation of Kyung Hee University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd, Industry Academic Cooperation Foundation of Kyung Hee University filed Critical Samsung Electronics Co Ltd
Publication of CN1708135A publication Critical patent/CN1708135A/zh
Application granted granted Critical
Publication of CN100396102C publication Critical patent/CN100396102C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供一种用于预测视频数据的DC系数的方法和设备。在该方法中,从根据面向感兴趣区域的扫描被扫描并且在当前数据单元之前被变换的至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元。在面向扫描的区域中,扫描以位于感兴趣区域的预定位置的数据单元开始,并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置的数据单元的形式继续。其后,使用至少一个参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。

Description

用于预测视频数据单元的直流系数的方法和设备
本申请要求于2004年6月11日在韩国知识产权局提交的10-2004-0042909号韩国专利申请的优先权,该申请全部公开于此以资参考。
                          技术领域
本发明涉及视频数据的预测编码,更具体地讲,涉及一种用于预测视频数据单元的直流(DC)系数的方法和设备。
                          背景技术
由于视频数据包含大量的数据,所以压缩编码对于视频数据的存储或传输是必要的。视频数据的编码或解码以如16×16像素的宏块或8×8像素的决的数据单元执行。为了编码或解码预定数据单元中的视频数据,包括在一个画面中的数据单元应被扫描。
图1是用于解释传统光栅扫描的示图,光栅扫描以包括在画面中的数据单元被从左到右和从上到下被扫描的方式来执行。光栅扫描从画面的左上角处的数据单元开始。
作为视频数据压缩方法中的一个,存在帧内空间预测编码。帧内空间预测编码是用于使用一个画面中数据之间的相似性来对视频数据进行压缩的技术。更具体地讲,在使用与当前数据单元具有相关性的至少一个预先数据单元的至少一个像素值来预测将被编码的当前数据单元的像素值之后,当前数据单元的实际像素值与当前数据单元的预测的像素值之间的差被熵编码并且随后被传输。通过帧内空间预测编码,当实际像素值被熵编码并且随后被传输时数据压缩的效率可被提高。
图2显示根据现有技术的用于当前数据单元的帧内空间预测编码的先前数据单元的例子。参照图2,先前数据单元A、B、C和D被用于当前数据单元E的帧内空间预测编码。根据传统的光栅扫描,包括在一个画面中的数据单元被从左到右和从上到下扫描。因此,根据传统扫描,数据单元A、B、C和D已经先于当前数据单元E被扫描和编码。由于用X标记的数据单元没有先于当前数据单元E被编码,所以它们不能被用于当前数据单元E的预测编码。由于用O标记的数据单元与当前数据单元E通常具有低的相关性,所以它们不被用于当前数据单元E的预测编码。先前数据单元已经被编码或者已经被编码并且随后通过解码被恢复。
MPEG-4部分2中采用的帧内预测编码使用离散余弦变换(DCT)系数。如图2所示,如果数据单元E是根据MPEG-4部分2将被帧内空间预测编码的当前数据单元,则先前数据单元A、B和D被用于当前数据单元E的帧内空间预测编码。先前数据单元A、B和D以及当前数据单元E是16×16大小的宏块。
在MPEG-4部分2的情况下,使用先前数据单元A、B和D的DC系数之间的差在以8×8块为单位被DCT变换的区域中预测当前数据单元E的DC系数。
图3是用于解释MPEG-4部分2中的帧内预测编码的示图。参照图3,作为16×16大小宏块的先前数据单元A、B和D以及当前数据单元E以8×8块为单位被预测编码。换句话说,先前数据单元A被分为A1至A4,先前数据单元B被分为B1至B4,先前数据单元D被分为D1至D4,并且当前数据单元E被分为E1至E4
如下当前数据单元E的帧内预测被执行。首先,为了执行当前数据单元E的帧内预测,确定先前数据单元A、B和D是否存在。如果先前数据单元A、B和D中的一个位于不同的视频对象面(VOP),则当前数据单元E的DC系数的预测值被确定为例如128。VOP是一种用于视频编码的视频单元,并且根据MPEG-4部分2,一个图像帧被分为多个VOP,并且以VOP为单位被编码或解码。
如果先前数据单元A、B和D以及当前数据单元E都位于同一VOP,则确定用于处理包括于当前数据单元E中的四个8×8块之中的块E1的块D4、B3和A2是否存在。在块D4、B3和A2中的任何一个不存在或者不被帧内编码的情况下,块E1的DC系数的预测值被确定为128。
其后,在除了以上两种情况以外的另一情况下,块E1的DC系数的帧内预测值被确定如下。换句话说,当块A2的DC系数与块D4的DC系数之间的差小于块D4的DC系数与块B3的DC系数之间的差,则存在块E1的DC系数与块B3的DC系数相似的高可能性。因此,块E1的DC系数的预测值被确定为块B3的DC系数。在相反的情况下,块E1的DC系数的预测值被确定为块A2的DC系数。
由于上述的预测方法可以在编码器和解码器中以相同的方式被执行,所以其具有不需要编码器传输用于DC系数的预测值的参数的优点。换句话说,另外在解码器中,DC系数的预测值可以以与在编码器中相同的方式被获得。
对于使用块E1、B3和B4的块E2的DC系数的预测,对于使用块A2、A4和E1的块E3的DC系数的预测,以及对于使用块E1、E2和E3的块E4的DC系数的预测,上述过程被重复。
与上述光栅扫描不同的新的视频数据扫描方案已经被开发。专利号2002-5365标题为“Apparatus and Method for Water Ring Scan and Apparatusand Method for Video Coding/Decoding Using the Same”的韩国专利公开了一种被称为水环扫描(water ring scan)方法的扫描方法。
图4显示水环扫描方法。图4中显示的画面包括多个数据单元。水环扫描方法从如画面的中心的数据单元的画面的预定位置开始向围绕着被扫描的数据单元的数据单元按顺时针或逆时针旋转开始。当数据单元根据水环扫描方法被扫描时,扫描采用水环的形式,其中多个水环围绕作为水环原点的数据单元。
参照图4,作为水环原点的数据单元由0表示并且多个水环围绕由0表示的数据单元。形成第一水环11的数据单元由1表示,形成第二水环13的数据单元由2表示,并且形成第三水环15、第四水环17和第五水环19的数据单元分别以相同的方式由数字来表示。每一水环采用方形环的形式。
近来建立的新视频压缩编码标准MPEG-4部分10AVC(高级视频编码)或ITU-T H.264被开发以处理从传统电路交换到分组交换业务的过渡,作为如移动通信网络的新的通信途径的各种通信基础结构被快速分布。AVC/H.264与现有标准MPEG-4部分2视觉编解码器相比提高了编码效率50%或更多,并且考虑抗错性和网络友善性(network friendliness)以应对快速改变无线环境和互联网环境。
具体地讲,为了积极地响应无线传输环境或如互联网的基于分组的传输环境中的传输错误,MPEG-4部分10AVC最新采用被称为可变宏块排序(FMO)的视频数据扫描。在FMO中,存在七种模式并且它们之中的三种模式被称为盒状放射(box-out)扫描。盒状放射扫描是上述的水环扫描方法的例子。在盒状放射扫描的情况下,画面被分为用户感兴趣区域和背景区域,并且这两个区域以不同的方式被编码和解码。
图5被分为感兴趣区域(ROI)23和剩余区域21。在一个画面中,感兴趣区域通常是围绕画面的中心的区域。因此,从该画面的中心的预定范围内的区域被确定为ROI23,并且剩余区域被确定为剩余区域21。为了与剩余区域21无关地对ROI23编码和解码,剩余区域21不能被用于ROI23的空间预测编码。
图6A显示在其中数据单元被顺时针扫描的盒状放射扫描,并且图6B显示在其中数据单元被逆时针扫描的盒状放射扫描。
盒状放射扫描是用于对ROI编码的方法中的一个,并且考虑人类视觉特征提高压缩效率或使提高错误保护能够实现。更具体地讲,在编码期间,盒状放射扫描能够提供对ROI比剩余区域更好的错误保护。由于ROI的编码独立于剩余区域的编码,可通过减小其比特率和计算复杂度来对剩余区域的数据编码。具体地讲,当逐步随机访问(gradual random access)被执行时,ROI仅可在解码器中被重建,并且编码器仅可将ROI传输到解码器。
当像上述的水环扫描或盒状放射扫描的从画面中心向该画面的剩余区域扫描数据单元的方法被称为面向ROI的扫描时,传统的帧内空间预测编码不能被应用到根据面向ROI的扫描被扫描并且随后被编码或解码的视频数据中。
图7显示当数据单元根据如图6A所示的顺时针盒状放射扫描被扫描时根据传统预测方法的当前数据单元的DC系数的预测所需的参考数据单元。当数据单元C1是将被帧内预测的当前数据单元时,先前数据单元C2、C10和C11为根据传统预测方法的当前数据单元C1的帧内预测所需要。
然而,当数据单元根据顺时针盒状放射扫描被扫描时,由于数据单元C2、C10和C11将被扫描并且在当前数据单元C1之后被编码,所以它们不能被用于当前数据单元C1的帧内预测。
换句话说,当视频数据根据面向ROI的扫描被扫描并且随后被编码时,当前数据单元的DC系数不能基于传统光栅扫描被预测。
                          发明内容
本发明提供一种用于预测视频数据的DC系数的方法和设备,其适合面向ROI扫描。
根据本发明一方面,提供一种预测视频数据单元的直流(DC)系数的方法,该方法包括:从根据面向感兴趣区域的扫描被扫描并且随后在当前数据单元之前被变换的至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元,其中,在面向感兴趣区域的扫描中,扫描以位于感兴趣区域的预定位置的数据单元开始,并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置的数据单元的多个方形环的形式继续;和使用至少一个参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。
根据本发明另一方面,提供一种用于预测视频数据单元的直流(DC)系数的设备,该设备包括:存储器,存储根据面向感兴趣区域的扫描被扫描并且在当前数据单元之前被变换的至少一个先前数据单元的变换系数,其中,在面向感兴趣区域的扫描中,扫描以位于感兴趣区域的预定位置的数据单元开始,并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置中的数据单元的多个方形环的形式继续;参考数据单元选择单元,从至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元;和预测单元,从参考数据单元选择单元接收指示选择的至少一个参考数据单元的索引,从存储器读取选择的至少一个参考数据单元的DC系数,和使用读取的至少一个参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。
                          附图说明
通过结合附图对示例性实施例进行的详细描述,本发明的上述和其他方面将会变得更加清楚,其中:
图1显示传统光栅扫描;
图2显示根据现有技术的用于当前数据单元的帧内空间预测编码的先前数据单元的例子;
图3是用于解释MPEG-4部分2中的帧内预测编码的示图;
图4显示根据现有技术的水环扫描方法;
图5显示被分为感兴趣区域(ROI)和剩余区域的画面;
图6A显示在其中数据单元被顺时针扫描的盒状放射扫描;
图6B显示在其中数据单元被逆时针扫描的盒状放射扫描;
图7显示根据传统预测方法的当前数据单元的DC系数的预测所需的参考数据单元;
图8是根据本发明示例性实施例的用于预测视频数据的DC系数的设备的方框图;
图9是示出根据本发明示例性实施例的预测视频数据的DC系数的方法的流程图;
图10是根据本发明示例性实施例的用于解释选择参考数据单元的过程的详细流程图;
图11A和11B显示根据本发明示例性实施例的当前宏块和参考宏块;
图12A至12D显示根据本发明另一示例性实施例的当前宏块和参考宏块;和
图13A至13H显示根据本发明另一示例性实施例的当前宏块和参考宏块。
                        具体实施方式
在本发明中,从画面的中心向剩余区域的数据单元的扫描,如上述的水环扫扫描或盒状放射扫描,被称为面向ROI的扫描。每一数据单元是宏块、块、像素或一组预定数量的像素。
视频数据的预测编码是为了对当前数据单元编码使用对与当前数据单元相邻的数据单元编码的结果的技术。作为预测编码技术的例子,存在:(1)使用与当前数据单元相邻的数据单元的运动向量的当前数据单元的运动向量的预测;(2)使用与当前块相邻的块的DCT系数的当前块的离散余弦变换(DCT)系数的预测;和(3)使用与当前像素相邻的像素的值的当前像素的值的预测。
本发明涉及三种类型的预测之中的使用相邻块的DCT系数的当前块的DCT系数的预测。具体地讲,在将被以下描述的本发明示例性实施例中,公开了用于使用8×8的先前块的DC系数预测当前块的DC系数的方法和设备。
图8是根据本发明示例性实施例用于预测视频数据的DC系数的设备的方框图。参照图8,该设备包括存储器31、参考数据单元选择单元33和预测单元35。
存储器31存储根据面向ROI的扫描被扫描并且先于当前数据单元被编码的先前数据单元的DCT系数。在本实施例中,当前数据单元和先前数据单元是16×16的宏块,并且DCT以8×8块为单位被执行。
参考数据单元选择单元33接收当前数据单元的索引信息,选择至少一个用于当前数据单元的DC系数的帧内预测的参考数据单元,并且将选择的参考数据单元的索引信息输出到预测单元35。参考数据单元选择单元33能够基于当前数据单元的索引信息识别被面向ROI扫描的当前视频区域中的当前数据单元的位置。
另外,扫描方向信息还可被输入到参考数据单元选择单元33中。在在MPEG-4/H.264中采用的盒状放射扫描的情况下,以位于区域的中心的数据单元按顺时针或逆时针方向开始扫描。因此,指示扫描的方向的扫描方向信息还可被输入到参考数据单元选择单元33。
预测单元35从参考数据单元选择单元33接收至少一个参考数据单元的索引信息,并且从存储器31中读取当前数据单元的DC系数的帧内预测所需的至少一个参考数据单元的至少一个DC系数。预测单元35使用读取的参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。
基于用于预测图8中显示的DC系数的设备的结构,将详细描述根据本发明预测当前视频数据单元的DC系数的方法。
图9是示出根据本发明示例性实施例预测当前数据单元的DC系数的方法的流程图。
一旦在操作S41,当前数据单元的索引信息被输入到参考数据单元选择单元33,则在操作S43,参考数据单元选择单元33从包括在当前方形环和先前方形环中的先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元。
当前方形环是指包括当前数据单元的方形环,先前方形环是指与当前方形环直接内部相邻的方形环。例如,在图6A中显示的数据单元之中,如果数据单元C11是当前数据单元,则当前方形环是包括数据单元C9至C24的组,先前方形环是包括数据单元C1至C8的组。
在从参考数据单元选择单元33接收至少一个参考数据单元的索引信息之后,预测单元35从存储器31读取用于当前数据单元的DC系数的帧内预测的至少一个参考数据单元的至少一个DC系数。在操作S45,预测单元35使用读取的根据本发明的参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。
图10是用于解释根据本发明示例性实施例选择参考数据单元的过程的详细流程图,其中图9中显示的操作S43被更加详细地描述。
首先,被包括在当前方形环中并且与当前数据单元相邻的先前数据单元被定义为第一先前数据单元,被包括在先前方形环中并且与当前数据单元相邻的先前数据单元被定义为第二先前数据单元,并且与第一先前数据单元和第二先前数据单元相邻的先前数据单元被定义为第三先前数据单元。
在操作S431,参考数据单元选择单元33确定对于为当前数据单元的DC系数的预测所使用的参考数据单元的选择所有的第一先前数据单元、第二先前数据单元和第三先前数据单元是否存在。
在操作S433,如果所有的第一先前数据单元、第二先前数据单元和第三先前数据单元存在,则参考数据单元选择单元33选择第一先前数据单元、第二先前数据单元和第三先前数据单元作为参考数据单元。
然而,如果第一先前数据单元、第二先前数据单元和第三先前数据单元中的任何一个不存在,则在操作S435,参考数据单元选择单元33选择第一先前数据单元和第二先前数据单元中的一个作为参考数据单元。
当数据单元根据面向ROI的扫描被扫描时,对于当前数据单元的预测编码,可存在三种情况,即,仅存在一个先前数据单元,存在两个先前数据单元或者存在三个先前数据单元。其后,将针对这三种情况描述根据本发明实施例的参考数据单元的选择。这里,当前数据单元和先前数据单元为16×16宏块。
I、情况1
在这种情况下,仅存在一个用于当前宏块的预测编码的先前宏块。换句话说,仅存在第一先前数据单元、第二先前数据单元和第三先前数据单元中的一个。
在作为扫描起始点的宏块之后根据用于编码或解码的面向ROI的扫描被扫描的宏块为当前宏块的情况相应于情况1。在情况1中,一个先前宏块被选作用于当前宏块的预测编码的参考宏块。例如,如果图6A中显示的宏块C1为当前宏块,则位于原点的宏块O为参考宏块。
II、情况2
在这种情况下,对于当前宏块的预测编码存在与当前宏块相邻的两个先前宏块。在情况2中,两个先前宏块包括:存在于与当前方形环内部相邻的方形环中并且与当前宏块相邻的一个先前宏块,以及包括于当前方形环中、在当前宏块的编码或解码之前已经被编码或解码、并且可被参考的一个先前宏块。
当当前宏块是宏块E时,存在于包括当前宏块E的当前方形环中并且与当前宏块E相邻的宏块被定为宏块A,并且存在于与包括当前宏块E的当前方形环内部相邻的方形环中并且与当前宏块E相邻的宏块被定义为宏块D。当当前宏块E被分为四个8×8块E1至E4时,宏块A被分为四个8×8块A1至A4,宏块D被分为四个8×8块D1至D4,如图12A至12D所示,存在四种当前宏块和先前宏块的位置。
如图12A至12D所示,宏块D被一直定位于相对于当前宏块E对角。由于视频数据的特征,水平或垂直方向上的视频相关性高于对角方向上的视频相关性。因此,由于宏块D的信息一直不可靠,所以仅宏块A的信息可靠,并且宏块A被选作为用于当前宏块E的帧内预测的参考宏块。换句话说,仅存在第一先前数据单元、第二先前数据单元和第三先前数据单元中的一个,或者存在第一先前数据单元和第二先前数据单元中的一个并且存在第三先前数据单元。
III、情况3
在这种情况下,存在至少三个用于当前宏块的预测编码的与当前宏块相邻的先前宏块。这至少三个先前宏块包括存在于当前方形环中、在当前宏块的编码或解码之前即刻被编码或解码、并且可被参考的一个宏块,以及存在于与当前方形环内部相邻的先前方形环中并且与当前宏块相邻的至少两个先前宏块。
当前宏块被定义为E,存在于包括当前宏块E的当前方形环中并且与当前宏块E相邻的宏块被定义为宏块A,存在于与当前方形环内部相邻的先前方形环中并且与当前宏块相邻的宏块被定义为宏块B,并且与宏块A和宏块B两者相邻并且存在于与当前方形环内部相邻的先前方形环中的宏块被定义为宏块D。换句话说,宏块A相应于第一先前数据单元,宏块B相应于第二先前数据单元,以及宏块C相应于第三先前数据单元。
在情况3中,三个宏块A、B和D被选作为用于当前宏块E的预测编码的参考宏块。
当当前宏块E被分为四个8×8块EA至ED时,宏块A被分为四个8×8块AA至AD,宏块B被分为四个8×8块BA至BD,宏块D被分为四个8×8块DA至DD,如图13A至13H所示,存在当前块和先前块的八个位置。
一旦参考宏块被如上所述选择时,预测单元35对于情况1至情况3中的每个确定当前宏块的DC系数的预测值,如下:
I、情况1
图11A至11B显示参考宏块为原点处的宏块的情况,其中,相应于情况1的当前宏块和参考宏块被显示。参考图11A和11B,当前宏块是宏块F,原点处的宏块是宏块O。图11A显示当前宏块F位于参考宏块O的左侧的情况,图11B显示当前宏块F位于参考宏块O的右侧的情况。
当前宏块F被分为四个8×8块F1至F4,参考宏块O被分为四个8×8块O1至O4。包括在当前宏块F中的四个块F1至F4的DC系数的预测值被确定,如下:
在图11A中,根据包括在当前宏块F中的块F1至F4的处理顺序,可使用总共三种方法确定块F1至F4的DC系数的预测值。
(1)第一方法,其中,DC系数被以块F2、块F4、块F1并且随后F3的顺序预测。
块F2的DC系数的预测值被确定为块O1的DC系数。接下来,块F4的DC系数使用块O1、O3和F2的DC系数而获得。换句话说,当块O1的DC系数与块F2的DC系数之间的差小于块O1的DC系数与块O3的DC系数之间的差时,存在块F4的DC系数与块O3的DC系数相似的高的可能性。因此,块O3的DC系数被确定块F4的DC系数。
块F1的DC系数的预测值被确定为块F2的DC系数。块F3的DC系数的预测值使用块F2、F4和F1的DC系数而被获得。换句话说,当块F2的DC系数与块F1的DC系数之间的差小于块F2的DC系数与块F4的DC系数之间的差时,存在块F3的DC系数与块F4的DC系数相似的高的可能性。因此,块F4的DC系数被确定为块F3的DC系数。在相反的情况中,块F1的DC系数被确定为块F3的DC系数。
(2)第二方法,其中,DC系数被以块F2、块F4、块F3并且随后F1的顺序预测。
确定块F2和F4的DC系数的预测值的方法与在第一方法中相似。
块F3的DC系数的预测值被确定块F4的DC系数。块F1的DC系数的预测值使用块F2、块F3和块F4的DC系数而被获得。换句话说,当块F3的DC系数与块F4的DC系数之间的差小于块F2的DC系数与块F4的DC系数之间的差时,存在块F1的DC系数与块F2的DC系数相以的高的可能性。因此,块F2的DC系数被确定为块F1的DC系数的预测值。在相反的情况中,块F3的DC系数被确定为块F1的DC系数的预测值。
(3)第三方法,其中,DC系数被以块F2、块F1、块F4并且随后F3的顺序预测。
DC系数可以以与在第一和第二方法中相同的方式以块F2、块F1、块F4并且随后F3的顺序预测,但是在本方法中,当与与原点处的宏块O相邻最近的块F2和F4的DC系数被优先预测的第一和第二情况相比时参考块的信息不能被有效使用。
图11B中显示的块F1至F4的DC系数以与图11A中显示的决F1至F4的DC系数的预测相似的方式被预测。换句话说,块F1至F4的处理顺序被分为DC系数被以块F1、块F3、块F2并且随后F4的顺序预测的情况,DC系数被以块F1、块F3、块F4并且随后F2的顺序预测的情况,以及DC系数被以块F1、块F2、块F3并且随后F4的顺序预测的情况。
II、情况2
图12A至12D显示相应于情况2的当前宏块和参考宏块。参照图12A至12D,当前宏块是宏块E,参考宏块是宏块A。当前宏块E被分为四个8×8块E1至E4,参考宏块A被分为四个8×8块A1至A4
包括在当前块E中的四个块E1至E4的DC系数的预测值被确定如下。图12A中显示的块E1至E4的DC系数的预测值被以图11A中显示的块F1至F4的DC系数的预测值的确定相同的方式被确定。图12B中显示的块E1至E4的DC系数的预测值被以图11B中显示的块F1至F4的DC系数的预测值的确定相同的方式被确定。
图12C和12D中显示的块E1至E4的DC系数的预测值也被以图11A和11B中显示的块F1至F4的DC系数的预测值的确定相同的方式被确定。作为例子,图12C中显示的块E1至E4的DC系数的预测将被描述。
图12C中显示的块E1至E4的DC系数的预测值可使用根据块E1至E4的处理顺序使用总共三种方法被确定。
(1)第一方法,其中,DC系数被以块E1、块E2、块E3并且随后E4被顺序预测。
块E1的DC系数的预测值被确定为块A3的DC系数。接下来,E2的DC系数的预测值使用块A3、A4和块E1的DC系数而被获得。换句话说,如果块A3的DC系数与块A4的DC系数之间的差小于块A3的DC系数与块E1的DC系数之间的差时,存在块E2的DC系数与块E1的DC系数相似的高的可能性。因此,块E1的DC系数被确定为块E2的DC系数的预测值。在相反的情况中,块A4的DC系数被确定为块E2的DC系数的预测值。
块E3的DC系数的预测值被确定为块E1的DC系数。E4的DC系数的预测值使用块E1、E2和块E3的DC系数而被获得。换句话说,如果块E1的DC系数与块E2的DC系数之间的差小于块E1的DC系数与块E3的DC系数之间的差时,存在块E4的DC系数与块E3的DC系数相似的高的可能性。因此,块E3的DC系数被确定为块E4的DC系数的预测值。在相反的情况中,块E2的DC系数被确定为块E4的DC系数的预测值。
在其中DC系数被以块E1、块E2、块E4并且随后E3的顺序预测以及DC系数被以块E1、块E3、块E2并且随后E4的顺序预测的方法将不被描述。
III、情况3
图13A至13H显示相应于情况3的当前宏块和参考宏块。参照图13A至13H,当前宏块是宏块E,参考宏块是宏块A、宏块B和宏块D。当前宏块E被分为四个8×8块EA至ED,参考宏块A被分为四个8×8块AA至AD,参考宏块B被分为四个8×8块BA至BD,并且参考宏块D被分为四个8×8块DA至DD
如果DC系数被以包括在图13A至13H中显示的当前宏块E中的块EA、块EB、块EC并且随后块ED的顺x序预测,则总是存在用于块EA至ED的DC系数的预测的与当前宏块E水平、垂直和对角相邻的参考块。因此,通过比较相邻8×8参考块的DC系数可确定当前块的DC系数的预测值。
上述预测DC系数的方法以在编码器和解码器中相同的方式来执行。
如上所述,根据本发明,即使当视频数据根据面向ROI的扫描被扫描并且随后被编码和解码时,视频数据的帧内预测可被使用,导致视频数据的编码效率的提高。
本发明可被实现为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是能够存储其后可被计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的例子包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置以及载波。计算机可读记录介质还可被分布在网络连接的计算机系统上,从而计算机可读代码以分布式方式被存储和执行。
尽管参照其示例性实施例已经具体地显示和描述了本发明,但是本领域的普通技术人员将理解,在不脱离有所附权利要求限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种修改。

Claims (21)

1、一种预测视频数据单元的直流(DC)系数的方法,该方法包括:
从根据面向感兴趣区域的扫描被扫描并且随后在当前数据单元之前被变换的至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元,其中,在面向感兴趣区域的扫描中,扫描以位于感兴趣区域的预定位置的数据单元开始,并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置的数据单元的多个方形环的形式继续;和
使用至少一个参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。
2、如权利要求1所述的方法,其中,在至少一个参考数据单元的选择中,在包括在包括当前数据单元的当前方形环中的当前数据单元以及包括在先前方形环中的先前数据单元中,与当前数据单元相邻的先前数据单元被选作为至少一个参考数据单元。
3、如权利要求2所述的方法,其中,如果包括在当前方形环中的先前数据单元中的一个与当前数据单元水平或垂直相邻,并且包括在先前方形环中的先前数据单元中的一个与当前数据单元对角相邻,则仅包括在当前方形环中的先前数据单元被选作为至少一个参考数据单元。
4、如权利要求2所述的方法,其中,如果与当前数据单元相邻的第一先前数据单元作为包括在当前方形环中的先前数据单元中的一个存在,与当前数据单元相邻的第二先前数据单元作为包括在先前方形环中的先前数据单元中的一个存在,并且与第一先前数据单元和第二先前数据单元两者相邻的第三先前数据单元存在,则第一先前数据单元、第二先前数据单元和第三先前数据单元被选作为参考数据单元。
5、如权利要求1所述的方法,其中,在至少一个参考数据单元的选择中,如果位于预定位置的数据单元仅作为先前数据单元中的一个存在,则位于预定位置的数据单元被选作为至少一个参考数据单元。
6、如权利要求1所述的方法,其中,确定当前数据单元的预测值包括:
将参考数据单元分为多个子数据单元;和
使用包括在至少一个参考数据单元中的多个子参考数据单元的DC系数以及编码或解码的子数据单元的DC系数来确定每一子数据单元的DC系数的预测值。
7、如权利要求6所述的方法,其中,在每一子数据单元的DC系数的预测值的确定中,在子参考数据单元以及编码或解码的子数据单元中,如果存在与子数据单元水平相邻的第一子参考数据单元,与子数据单元垂直相邻的第二子参考数据单元,以及与子数据单元对角相邻的第三子参考数据单元,则根据第一子参考数据单元与第三子参考数据单元之间的相似性以及第二子参考数据单元与第三子参考数据单元之间的相似性来确定每一子数据单元的DC系数的预测值。
8、如权利要求6所述的方法,其中,在每一子数据单元的DC系数的预测值的确定中,在子参考数据单元和编码或解码的子数据单元中,当存在与子数据单元水平相邻的第一子参考数据单元,与子数据单元垂直相邻的第二子参考数据单元,以及与子数据单元对角相邻的第三子参考数据单元时,如果第一子参考数据单元的DC系数与第三子参考数据单元的DC系数之间的差小于第二子参考数据单元的DC系数与第三子参考数据单元的DC系数之间的差,则第二子参考数据单元的DC系数被确定为每一子数据单元的DC系数的预测值。
9、如权利要求6所述的方法,其中,在每一子数据单元的DC系数的预测值的确定中,在子参考数据单元以及编码或解码的单元中,如果与子数据单元水平相邻的第一子参考数据单元,与子数据单元垂直相邻的第二子参考数据单元,以及与子数据单元对角相邻的第三子参考数据单元中的任何一个不存在,则第一子参考数据单元的DC系数和第二子参考数据单元的DC系数中的一个被确定为每一子数据单元的DC系数的预测值。
10、如权利要求6所述的方法,其中,当前数据单元和至少一个参考数据单元为16×16块,并且子数据单元和子参考数据单元为8×8块。
11、一种用于预测视频数据单元的直流(DC)系数的设备,该设备包括:
存储器,存储根据面向感兴趣区域的扫描被扫描并且在当前数据单元之前被变换的至少一个先前数据单元的变换系数,其中,在面向感兴趣区域的扫描中,扫描以位于感兴趣区域的预定位置的数据单元开始,并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置中的数据单元的多个方形环的形式继续;
参考数据单元选择单元,从至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元;和
预测单元,从参考数据单元选择单元接收指示选择的至少一个参考数据单元的索引,从存储器中读取选择的至少一个参考数据单元的DC系数,和使用读取的至少一个参考数据单元的DC系数据来确定当前数据单元的DC系数的预测值。
12、如权利要求11所述的设备,其中,在包括在包括当前数据单元的当前方形环中的先前数据单元以及包括先前方形环中的先前数据单元中,参考数据单元选择单元将与当前数据单元相邻的先前数据单元选作为至少一个参考数据单元。
13、如权利要求12所述的设备,其中,如果包括在当前方形环中的先前数据单元中的一个与当前数据单元水平或垂直相邻,并且包括在先前方形环中的先前数据单元中的一个与当前数据单元对角相邻,则参考数据单元选择单元将包括在当前方形环中的先前数据单元选作为至少一个参考数据单元。
14、如权利要求12所述的设备,其中,如果与当前数据单元相邻的第一先前数据单元作为包括在当前方形环中的先前数据单元中的一个存在,与当前数据单元相邻的第二相邻数据单元作为包括在先前方形环中的先前数据单元中的一个存在,并且与第一先前数据单元和第二先前数据单元两者相邻的第三先前数据单元存在,则参考数据单元选择单元将第一先前数据单元、第二先前数据单元和第三先前数据单元选择作为参考数据单元。
15、如权利要求11所述的设备,其中,如果位于预定位置的数据单元仅作为先前数据单元中的一个存在,则参考数据单元选择单元将位于预定位置的数据单元选择作为至少一个参考数据单元。
16、如权利要求11所述的设备,其中,预定单元将当前数据单元分为多个子数据单元,并且使用包括在至少一个参考数据单元中的多个子参考数据单元的DC系数以及编码或解码的子数据单元的DC系数来确定每一子数据单元的DC系数的预测值。
17、如权利要求16所述的设备,其中,在子参考数据单元以及编码或解码的字数据单元中,如果存在与子数据单元水平相邻的第一子参考数据单元,与子数据单元垂直相邻的第二子参考数据单元,以及与子数据单元对角相邻的第三子参考数据单元,则预测单元根据第一子参考数据单元与第三子参考数据单元之间的相似性以及第二子参考数据单元与第三子参考数据单元之间的相似性来确定每一子数据单元的DC系数的预测值。
18、如权利要求16所述的设备,其中,在子参考数据单元以及编码或解码的字数据单元中,如果存在与子数据单元水平相邻的第一子参考数据单元,与子数据单元垂直相邻的第二子参考数据单元,以及与子数据单元对角相邻的第三子参考数据单元,如果第一子参考数据单元的DC系数与第三子参考数据单元的DC系数之间的差小于第二子参考数据单元的DC系数与第三子参考数据单元的DC系数之间的差,则预测单元确定第二子参考数据单元的DC系数为每一子数据单元的DC系数的预测值。
19、如权利要求16所述的设备,在子参考数据单元以及编码或解码的子数据单元中,如果与子数据单元水平相邻的第一子参考数据单元,与子数据单元垂直相邻的第二子参考数据单元,以及与子数据单元对角相邻的第三子参考数据单元中的任何一个不存在,则预测单元将第一子参考数据单元的DC系数和第二子参考数据单元的DC系数中的一个确定为每一子数据单元的DC系数的预测值。
20、如权利要求16所述的设备,其中,当前数据单元和参考数据单元为16×16块,并且子数据单元和子参考数据单元为8×8块。
21、一种在其上记录有用于执行预测视频数据单元的直流(DC)系数的方法的程序的计算机可读记录介质,该方法包括:
从根据面向感兴趣区域的扫描被扫描并且随后在当前数据单元之前被变换的至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元,其中,在面向感兴趣区域的扫描中,扫描以位于感兴趣区域的预定位置的数据单元开始,并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置的数据单元的多个方形环的形式继续;和
使用至少一个参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。
CNB2005100751887A 2004-06-11 2005-06-10 用于预测视频数据单元的直流系数的方法和设备 Expired - Fee Related CN100396102C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020040042909A KR100982518B1 (ko) 2004-06-11 2004-06-11 영상 데이터 유닛의 dc 계수 예측 방법 및 그 장치
KR1020040042909 2004-06-11

Publications (2)

Publication Number Publication Date
CN1708135A true CN1708135A (zh) 2005-12-14
CN100396102C CN100396102C (zh) 2008-06-18

Family

ID=35460492

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100751887A Expired - Fee Related CN100396102C (zh) 2004-06-11 2005-06-10 用于预测视频数据单元的直流系数的方法和设备

Country Status (3)

Country Link
US (1) US8189673B2 (zh)
KR (1) KR100982518B1 (zh)
CN (1) CN100396102C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101742296A (zh) * 2008-11-14 2010-06-16 北京中星微电子有限公司 降低码流数据量波动的视频编解码方法及装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7808478B2 (en) * 2005-08-22 2010-10-05 Samsung Electronics Co., Ltd. Autonomous handheld device having a drawing tool
US7809214B2 (en) 2005-08-22 2010-10-05 Samsung Electronics Co., Ltd. Device and a method for identifying movement patterns
US7864982B2 (en) * 2005-08-22 2011-01-04 Samsung Electronics Co., Ltd. Displacement and tilt detection method for a portable autonomous device having an integrated image sensor and a device therefor
KR100747587B1 (ko) * 2006-03-31 2007-08-08 엘지전자 주식회사 움직임 추정 방법 및 장치
US9774856B1 (en) 2012-07-02 2017-09-26 Google Inc. Adaptive stochastic entropy coding
US9509998B1 (en) 2013-04-04 2016-11-29 Google Inc. Conditional predictive multi-symbol run-length coding
US9392288B2 (en) 2013-10-17 2016-07-12 Google Inc. Video coding using scatter-based scan tables

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351312A (en) * 1990-10-09 1994-09-27 Matsushita Graphic Communication Systems, Inc. Spatial filter of an image signal processor providing alternating line images without moire
CN100361536C (zh) 1996-05-28 2008-01-09 松下电器产业株式会社 图像预测编码/解码装置和方法以及记录媒体
KR100353851B1 (ko) * 2000-07-07 2002-09-28 한국전자통신연구원 파문 스캔 장치 및 그 방법과 그를 이용한 영상코딩/디코딩 장치 및 그 방법
JP4696388B2 (ja) * 2000-11-15 2011-06-08 ソニー株式会社 情報信号処理装置、情報信号処理方法、画像信号処理装置およびそれを使用した画像表示装置、それに使用される係数種データ生成装置、係数データ生成装置、並びに情報記録媒体
JP2003032681A (ja) * 2001-07-18 2003-01-31 Canon Inc 画像処理装置、及び画像処理方法、並びにプログラムコード、記憶媒体
US6882755B2 (en) * 2001-10-19 2005-04-19 Hewlett-Packard Development Company, L.P. Image transmission for low bandwidth with region of interest
CA2492751C (en) * 2002-07-16 2012-06-12 Nokia Corporation A method for random access and gradual picture refresh in video coding
US7991054B2 (en) * 2002-07-19 2011-08-02 Sony Corporation Information signal processing device, information signal processing method, image signal processing device, image displaying device, device and method for producing correction data used in them, device and method for producing coefficient data, programs for executing these methods, and computer-readable medium for storing the program
US7010044B2 (en) * 2003-07-18 2006-03-07 Lsi Logic Corporation Intra 4×4 modes 3, 7 and 8 availability determination intra estimation and compensation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101742296A (zh) * 2008-11-14 2010-06-16 北京中星微电子有限公司 降低码流数据量波动的视频编解码方法及装置

Also Published As

Publication number Publication date
US20050276333A1 (en) 2005-12-15
CN100396102C (zh) 2008-06-18
KR20050117721A (ko) 2005-12-15
US8189673B2 (en) 2012-05-29
KR100982518B1 (ko) 2010-09-16

Similar Documents

Publication Publication Date Title
CN1929611A (zh) 用于视频帧内预测编码和解码的方法和装置
CN1285216C (zh) 图像编码方法和装置、图像译码方法和装置
CN1229999C (zh) 用于编码和解码运动矢量的方法和装置
CN1224268C (zh) 运动图象编码装置及运动图象解码装置
CN1708135A (zh) 用于预测视频数据单元的直流系数的方法和设备
CN1921630A (zh) 视频编码/解码的装置和方法及其记录介质
CN1925619A (zh) 视频编码和解码的装置和方法及其记录介质
CN1929613A (zh) 用于图像编码和解码的装置及方法、记录介质
CN1874519A (zh) 使用视频对称的帧内预测方法和设备及编解码方法及设备
CN1633811A (zh) 图像编码方法、图像译码方法、图像编码装置、图像译码装置、程序、计算机数据信号,以及图像传送系统
CN1659580A (zh) 基于空间预测的帧内编码
CN1638486A (zh) 预测编码设备、预测编码方法、及其计算机可读记录介质
CN1717051A (zh) 高级视频编码帧内预测的系统和方法
WO2007046644A1 (en) Apparatus and method for encoding and decoding moving picture using adaptive scanning
CN1874521A (zh) 用于图像编码和解码的设备和方法
CN1929612A (zh) 用于视频内预测编码和解码的方法和装置
CN1252203A (zh) 运动图像的预测编码方法和译码方法
CN1520189A (zh) 冗余图像编解码的方法与装置
US9106910B2 (en) Method of coding and decoding images, corresponding device for coding and decoding and computer program
CN1960495A (zh) 图像编码装置、方法及程序
CN1830213A (zh) 用于视频编码的方法和设备
CN1346217A (zh) 能够进行简易的多窗口显示的活动图象解码装置以及活动图象解码方法
CN1750656A (zh) 编码和解码图像
CN1777283A (zh) 一种基于微块的视频信号编/解码方法
KR20090075767A (ko) 인접 블록의 공간 예측 방향성을 이용하여 화면 내 예측모드를 추정하는 인코딩 및 디코딩 방법, 그 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080618

Termination date: 20140610

EXPY Termination of patent right or utility model