CN1708135A

CN1708135A - 用于预测视频数据单元的直流系数的方法和设备

Info

Publication number: CN1708135A
Application number: CNA2005100751887A
Authority: CN
Inventors: 朴光勋
Original assignee: Samsung Electronics Co Ltd; Industry Academic Cooperation Foundation of Kyung Hee University
Current assignee: Samsung Electronics Co Ltd; Industry University Cooperation Foundation of Sogang University; Industry Academic Cooperation Foundation of Kyung Hee University
Priority date: 2004-06-11
Filing date: 2005-06-10
Publication date: 2005-12-14
Anticipated expiration: 2025-06-10
Also published as: KR20050117721A; CN100396102C; US8189673B2; US20050276333A1; KR100982518B1

Abstract

提供一种用于预测视频数据的DC系数的方法和设备。在该方法中，从根据面向感兴趣区域的扫描被扫描并且在当前数据单元之前被变换的至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元。在面向扫描的区域中，扫描以位于感兴趣区域的预定位置的数据单元开始，并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置的数据单元的形式继续。其后，使用至少一个参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。

Description

用于预测视频数据单元的直流系数的方法和设备

本申请要求于2004年6月11日在韩国知识产权局提交的10-2004-0042909号韩国专利申请的优先权，该申请全部公开于此以资参考。

技术领域

本发明涉及视频数据的预测编码，更具体地讲，涉及一种用于预测视频数据单元的直流(DC)系数的方法和设备。

背景技术

由于视频数据包含大量的数据，所以压缩编码对于视频数据的存储或传输是必要的。视频数据的编码或解码以如16×16像素的宏块或8×8像素的决的数据单元执行。为了编码或解码预定数据单元中的视频数据，包括在一个画面中的数据单元应被扫描。

图1是用于解释传统光栅扫描的示图，光栅扫描以包括在画面中的数据单元被从左到右和从上到下被扫描的方式来执行。光栅扫描从画面的左上角处的数据单元开始。

作为视频数据压缩方法中的一个，存在帧内空间预测编码。帧内空间预测编码是用于使用一个画面中数据之间的相似性来对视频数据进行压缩的技术。更具体地讲，在使用与当前数据单元具有相关性的至少一个预先数据单元的至少一个像素值来预测将被编码的当前数据单元的像素值之后，当前数据单元的实际像素值与当前数据单元的预测的像素值之间的差被熵编码并且随后被传输。通过帧内空间预测编码，当实际像素值被熵编码并且随后被传输时数据压缩的效率可被提高。

图2显示根据现有技术的用于当前数据单元的帧内空间预测编码的先前数据单元的例子。参照图2，先前数据单元A、B、C和D被用于当前数据单元E的帧内空间预测编码。根据传统的光栅扫描，包括在一个画面中的数据单元被从左到右和从上到下扫描。因此，根据传统扫描，数据单元A、B、C和D已经先于当前数据单元E被扫描和编码。由于用X标记的数据单元没有先于当前数据单元E被编码，所以它们不能被用于当前数据单元E的预测编码。由于用O标记的数据单元与当前数据单元E通常具有低的相关性，所以它们不被用于当前数据单元E的预测编码。先前数据单元已经被编码或者已经被编码并且随后通过解码被恢复。

MPEG-4部分2中采用的帧内预测编码使用离散余弦变换(DCT)系数。如图2所示，如果数据单元E是根据MPEG-4部分2将被帧内空间预测编码的当前数据单元，则先前数据单元A、B和D被用于当前数据单元E的帧内空间预测编码。先前数据单元A、B和D以及当前数据单元E是16×16大小的宏块。

在MPEG-4部分2的情况下，使用先前数据单元A、B和D的DC系数之间的差在以8×8块为单位被DCT变换的区域中预测当前数据单元E的DC系数。

图3是用于解释MPEG-4部分2中的帧内预测编码的示图。参照图3，作为16×16大小宏块的先前数据单元A、B和D以及当前数据单元E以8×8块为单位被预测编码。换句话说，先前数据单元A被分为A₁至A₄，先前数据单元B被分为B₁至B₄，先前数据单元D被分为D₁至D₄，并且当前数据单元E被分为E₁至E₄。

如下当前数据单元E的帧内预测被执行。首先，为了执行当前数据单元E的帧内预测，确定先前数据单元A、B和D是否存在。如果先前数据单元A、B和D中的一个位于不同的视频对象面(VOP)，则当前数据单元E的DC系数的预测值被确定为例如128。VOP是一种用于视频编码的视频单元，并且根据MPEG-4部分2，一个图像帧被分为多个VOP，并且以VOP为单位被编码或解码。

如果先前数据单元A、B和D以及当前数据单元E都位于同一VOP，则确定用于处理包括于当前数据单元E中的四个8×8块之中的块E₁的块D₄、B₃和A₂是否存在。在块D₄、B₃和A₂中的任何一个不存在或者不被帧内编码的情况下，块E₁的DC系数的预测值被确定为128。

其后，在除了以上两种情况以外的另一情况下，块E₁的DC系数的帧内预测值被确定如下。换句话说，当块A₂的DC系数与块D₄的DC系数之间的差小于块D₄的DC系数与块B₃的DC系数之间的差，则存在块E₁的DC系数与块B₃的DC系数相似的高可能性。因此，块E₁的DC系数的预测值被确定为块B₃的DC系数。在相反的情况下，块E₁的DC系数的预测值被确定为块A₂的DC系数。

由于上述的预测方法可以在编码器和解码器中以相同的方式被执行，所以其具有不需要编码器传输用于DC系数的预测值的参数的优点。换句话说，另外在解码器中，DC系数的预测值可以以与在编码器中相同的方式被获得。

对于使用块E₁、B₃和B₄的块E₂的DC系数的预测，对于使用块A₂、A₄和E₁的块E₃的DC系数的预测，以及对于使用块E₁、E₂和E₃的块E₄的DC系数的预测，上述过程被重复。

与上述光栅扫描不同的新的视频数据扫描方案已经被开发。专利号2002-5365标题为“Apparatus and Method for Water Ring Scan and Apparatusand Method for Video Coding/Decoding Using the Same”的韩国专利公开了一种被称为水环扫描(water ring scan)方法的扫描方法。

图4显示水环扫描方法。图4中显示的画面包括多个数据单元。水环扫描方法从如画面的中心的数据单元的画面的预定位置开始向围绕着被扫描的数据单元的数据单元按顺时针或逆时针旋转开始。当数据单元根据水环扫描方法被扫描时，扫描采用水环的形式，其中多个水环围绕作为水环原点的数据单元。

参照图4，作为水环原点的数据单元由0表示并且多个水环围绕由0表示的数据单元。形成第一水环11的数据单元由1表示，形成第二水环13的数据单元由2表示，并且形成第三水环15、第四水环17和第五水环19的数据单元分别以相同的方式由数字来表示。每一水环采用方形环的形式。

近来建立的新视频压缩编码标准MPEG-4部分10AVC(高级视频编码)或ITU-T H.264被开发以处理从传统电路交换到分组交换业务的过渡，作为如移动通信网络的新的通信途径的各种通信基础结构被快速分布。AVC/H.264与现有标准MPEG-4部分2视觉编解码器相比提高了编码效率50％或更多，并且考虑抗错性和网络友善性(network friendliness)以应对快速改变无线环境和互联网环境。

具体地讲，为了积极地响应无线传输环境或如互联网的基于分组的传输环境中的传输错误，MPEG-4部分10AVC最新采用被称为可变宏块排序(FMO)的视频数据扫描。在FMO中，存在七种模式并且它们之中的三种模式被称为盒状放射(box-out)扫描。盒状放射扫描是上述的水环扫描方法的例子。在盒状放射扫描的情况下，画面被分为用户感兴趣区域和背景区域，并且这两个区域以不同的方式被编码和解码。

图5被分为感兴趣区域(ROI)23和剩余区域21。在一个画面中，感兴趣区域通常是围绕画面的中心的区域。因此，从该画面的中心的预定范围内的区域被确定为ROI23，并且剩余区域被确定为剩余区域21。为了与剩余区域21无关地对ROI23编码和解码，剩余区域21不能被用于ROI23的空间预测编码。

图6A显示在其中数据单元被顺时针扫描的盒状放射扫描，并且图6B显示在其中数据单元被逆时针扫描的盒状放射扫描。

盒状放射扫描是用于对ROI编码的方法中的一个，并且考虑人类视觉特征提高压缩效率或使提高错误保护能够实现。更具体地讲，在编码期间，盒状放射扫描能够提供对ROI比剩余区域更好的错误保护。由于ROI的编码独立于剩余区域的编码，可通过减小其比特率和计算复杂度来对剩余区域的数据编码。具体地讲，当逐步随机访问(gradual random access)被执行时，ROI仅可在解码器中被重建，并且编码器仅可将ROI传输到解码器。

当像上述的水环扫描或盒状放射扫描的从画面中心向该画面的剩余区域扫描数据单元的方法被称为面向ROI的扫描时，传统的帧内空间预测编码不能被应用到根据面向ROI的扫描被扫描并且随后被编码或解码的视频数据中。

图7显示当数据单元根据如图6A所示的顺时针盒状放射扫描被扫描时根据传统预测方法的当前数据单元的DC系数的预测所需的参考数据单元。当数据单元C1是将被帧内预测的当前数据单元时，先前数据单元C2、C10和C11为根据传统预测方法的当前数据单元C1的帧内预测所需要。

然而，当数据单元根据顺时针盒状放射扫描被扫描时，由于数据单元C2、C10和C11将被扫描并且在当前数据单元C1之后被编码，所以它们不能被用于当前数据单元C1的帧内预测。

换句话说，当视频数据根据面向ROI的扫描被扫描并且随后被编码时，当前数据单元的DC系数不能基于传统光栅扫描被预测。

发明内容

本发明提供一种用于预测视频数据的DC系数的方法和设备，其适合面向ROI扫描。

根据本发明一方面，提供一种预测视频数据单元的直流(DC)系数的方法，该方法包括：从根据面向感兴趣区域的扫描被扫描并且随后在当前数据单元之前被变换的至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元，其中，在面向感兴趣区域的扫描中，扫描以位于感兴趣区域的预定位置的数据单元开始，并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置的数据单元的多个方形环的形式继续；和使用至少一个参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。

根据本发明另一方面，提供一种用于预测视频数据单元的直流(DC)系数的设备，该设备包括：存储器，存储根据面向感兴趣区域的扫描被扫描并且在当前数据单元之前被变换的至少一个先前数据单元的变换系数，其中，在面向感兴趣区域的扫描中，扫描以位于感兴趣区域的预定位置的数据单元开始，并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置中的数据单元的多个方形环的形式继续；参考数据单元选择单元，从至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元；和预测单元，从参考数据单元选择单元接收指示选择的至少一个参考数据单元的索引，从存储器读取选择的至少一个参考数据单元的DC系数，和使用读取的至少一个参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。

附图说明

通过结合附图对示例性实施例进行的详细描述，本发明的上述和其他方面将会变得更加清楚，其中：

图1显示传统光栅扫描；

图2显示根据现有技术的用于当前数据单元的帧内空间预测编码的先前数据单元的例子；

图3是用于解释MPEG-4部分2中的帧内预测编码的示图；

图4显示根据现有技术的水环扫描方法；

图5显示被分为感兴趣区域(ROI)和剩余区域的画面；

图6A显示在其中数据单元被顺时针扫描的盒状放射扫描；

图6B显示在其中数据单元被逆时针扫描的盒状放射扫描；

图7显示根据传统预测方法的当前数据单元的DC系数的预测所需的参考数据单元；

图8是根据本发明示例性实施例的用于预测视频数据的DC系数的设备的方框图；

图9是示出根据本发明示例性实施例的预测视频数据的DC系数的方法的流程图；

图10是根据本发明示例性实施例的用于解释选择参考数据单元的过程的详细流程图；

图11A和11B显示根据本发明示例性实施例的当前宏块和参考宏块；

图12A至12D显示根据本发明另一示例性实施例的当前宏块和参考宏块；和

图13A至13H显示根据本发明另一示例性实施例的当前宏块和参考宏块。

具体实施方式

在本发明中，从画面的中心向剩余区域的数据单元的扫描，如上述的水环扫扫描或盒状放射扫描，被称为面向ROI的扫描。每一数据单元是宏块、块、像素或一组预定数量的像素。

视频数据的预测编码是为了对当前数据单元编码使用对与当前数据单元相邻的数据单元编码的结果的技术。作为预测编码技术的例子，存在：(1)使用与当前数据单元相邻的数据单元的运动向量的当前数据单元的运动向量的预测；(2)使用与当前块相邻的块的DCT系数的当前块的离散余弦变换(DCT)系数的预测；和(3)使用与当前像素相邻的像素的值的当前像素的值的预测。

本发明涉及三种类型的预测之中的使用相邻块的DCT系数的当前块的DCT系数的预测。具体地讲，在将被以下描述的本发明示例性实施例中，公开了用于使用8×8的先前块的DC系数预测当前块的DC系数的方法和设备。

图8是根据本发明示例性实施例用于预测视频数据的DC系数的设备的方框图。参照图8，该设备包括存储器31、参考数据单元选择单元33和预测单元35。

存储器31存储根据面向ROI的扫描被扫描并且先于当前数据单元被编码的先前数据单元的DCT系数。在本实施例中，当前数据单元和先前数据单元是16×16的宏块，并且DCT以8×8块为单位被执行。

参考数据单元选择单元33接收当前数据单元的索引信息，选择至少一个用于当前数据单元的DC系数的帧内预测的参考数据单元，并且将选择的参考数据单元的索引信息输出到预测单元35。参考数据单元选择单元33能够基于当前数据单元的索引信息识别被面向ROI扫描的当前视频区域中的当前数据单元的位置。

另外，扫描方向信息还可被输入到参考数据单元选择单元33中。在在MPEG-4/H.264中采用的盒状放射扫描的情况下，以位于区域的中心的数据单元按顺时针或逆时针方向开始扫描。因此，指示扫描的方向的扫描方向信息还可被输入到参考数据单元选择单元33。

预测单元35从参考数据单元选择单元33接收至少一个参考数据单元的索引信息，并且从存储器31中读取当前数据单元的DC系数的帧内预测所需的至少一个参考数据单元的至少一个DC系数。预测单元35使用读取的参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。

基于用于预测图8中显示的DC系数的设备的结构，将详细描述根据本发明预测当前视频数据单元的DC系数的方法。

图9是示出根据本发明示例性实施例预测当前数据单元的DC系数的方法的流程图。

一旦在操作S41，当前数据单元的索引信息被输入到参考数据单元选择单元33，则在操作S43，参考数据单元选择单元33从包括在当前方形环和先前方形环中的先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元。

当前方形环是指包括当前数据单元的方形环，先前方形环是指与当前方形环直接内部相邻的方形环。例如，在图6A中显示的数据单元之中，如果数据单元C11是当前数据单元，则当前方形环是包括数据单元C9至C24的组，先前方形环是包括数据单元C1至C8的组。

在从参考数据单元选择单元33接收至少一个参考数据单元的索引信息之后，预测单元35从存储器31读取用于当前数据单元的DC系数的帧内预测的至少一个参考数据单元的至少一个DC系数。在操作S45，预测单元35使用读取的根据本发明的参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。

图10是用于解释根据本发明示例性实施例选择参考数据单元的过程的详细流程图，其中图9中显示的操作S43被更加详细地描述。

首先，被包括在当前方形环中并且与当前数据单元相邻的先前数据单元被定义为第一先前数据单元，被包括在先前方形环中并且与当前数据单元相邻的先前数据单元被定义为第二先前数据单元，并且与第一先前数据单元和第二先前数据单元相邻的先前数据单元被定义为第三先前数据单元。

在操作S431，参考数据单元选择单元33确定对于为当前数据单元的DC系数的预测所使用的参考数据单元的选择所有的第一先前数据单元、第二先前数据单元和第三先前数据单元是否存在。

在操作S433，如果所有的第一先前数据单元、第二先前数据单元和第三先前数据单元存在，则参考数据单元选择单元33选择第一先前数据单元、第二先前数据单元和第三先前数据单元作为参考数据单元。

然而，如果第一先前数据单元、第二先前数据单元和第三先前数据单元中的任何一个不存在，则在操作S435，参考数据单元选择单元33选择第一先前数据单元和第二先前数据单元中的一个作为参考数据单元。

当数据单元根据面向ROI的扫描被扫描时，对于当前数据单元的预测编码，可存在三种情况，即，仅存在一个先前数据单元，存在两个先前数据单元或者存在三个先前数据单元。其后，将针对这三种情况描述根据本发明实施例的参考数据单元的选择。这里，当前数据单元和先前数据单元为16×16宏块。

I、情况1

在这种情况下，仅存在一个用于当前宏块的预测编码的先前宏块。换句话说，仅存在第一先前数据单元、第二先前数据单元和第三先前数据单元中的一个。

在作为扫描起始点的宏块之后根据用于编码或解码的面向ROI的扫描被扫描的宏块为当前宏块的情况相应于情况1。在情况1中，一个先前宏块被选作用于当前宏块的预测编码的参考宏块。例如，如果图6A中显示的宏块C1为当前宏块，则位于原点的宏块O为参考宏块。

II、情况2

在这种情况下，对于当前宏块的预测编码存在与当前宏块相邻的两个先前宏块。在情况2中，两个先前宏块包括：存在于与当前方形环内部相邻的方形环中并且与当前宏块相邻的一个先前宏块，以及包括于当前方形环中、在当前宏块的编码或解码之前已经被编码或解码、并且可被参考的一个先前宏块。

当当前宏块是宏块E时，存在于包括当前宏块E的当前方形环中并且与当前宏块E相邻的宏块被定为宏块A，并且存在于与包括当前宏块E的当前方形环内部相邻的方形环中并且与当前宏块E相邻的宏块被定义为宏块D。当当前宏块E被分为四个8×8块E₁至E4时，宏块A被分为四个8×8块A₁至A₄，宏块D被分为四个8×8块D1至D₄，如图12A至12D所示，存在四种当前宏块和先前宏块的位置。

如图12A至12D所示，宏块D被一直定位于相对于当前宏块E对角。由于视频数据的特征，水平或垂直方向上的视频相关性高于对角方向上的视频相关性。因此，由于宏块D的信息一直不可靠，所以仅宏块A的信息可靠，并且宏块A被选作为用于当前宏块E的帧内预测的参考宏块。换句话说，仅存在第一先前数据单元、第二先前数据单元和第三先前数据单元中的一个，或者存在第一先前数据单元和第二先前数据单元中的一个并且存在第三先前数据单元。

III、情况3

在这种情况下，存在至少三个用于当前宏块的预测编码的与当前宏块相邻的先前宏块。这至少三个先前宏块包括存在于当前方形环中、在当前宏块的编码或解码之前即刻被编码或解码、并且可被参考的一个宏块，以及存在于与当前方形环内部相邻的先前方形环中并且与当前宏块相邻的至少两个先前宏块。

当前宏块被定义为E，存在于包括当前宏块E的当前方形环中并且与当前宏块E相邻的宏块被定义为宏块A，存在于与当前方形环内部相邻的先前方形环中并且与当前宏块相邻的宏块被定义为宏块B，并且与宏块A和宏块B两者相邻并且存在于与当前方形环内部相邻的先前方形环中的宏块被定义为宏块D。换句话说，宏块A相应于第一先前数据单元，宏块B相应于第二先前数据单元，以及宏块C相应于第三先前数据单元。

在情况3中，三个宏块A、B和D被选作为用于当前宏块E的预测编码的参考宏块。

当当前宏块E被分为四个8×8块E_A至E_D时，宏块A被分为四个8×8块A_A至A_D，宏块B被分为四个8×8块B_A至B_D，宏块D被分为四个8×8块D_A至D_D，如图13A至13H所示，存在当前块和先前块的八个位置。

一旦参考宏块被如上所述选择时，预测单元35对于情况1至情况3中的每个确定当前宏块的DC系数的预测值，如下：

I、情况1

图11A至11B显示参考宏块为原点处的宏块的情况，其中，相应于情况1的当前宏块和参考宏块被显示。参考图11A和11B，当前宏块是宏块F，原点处的宏块是宏块O。图11A显示当前宏块F位于参考宏块O的左侧的情况，图11B显示当前宏块F位于参考宏块O的右侧的情况。

当前宏块F被分为四个8×8块F₁至F₄，参考宏块O被分为四个8×8块O₁至O₄。包括在当前宏块F中的四个块F₁至F₄的DC系数的预测值被确定，如下：

在图11A中，根据包括在当前宏块F中的块F₁至F₄的处理顺序，可使用总共三种方法确定块F₁至F₄的DC系数的预测值。

(1)第一方法，其中，DC系数被以块F₂、块F₄、块F₁并且随后F₃的顺序预测。

块F₂的DC系数的预测值被确定为块O₁的DC系数。接下来，块F₄的DC系数使用块O₁、O₃和F₂的DC系数而获得。换句话说，当块O₁的DC系数与块F₂的DC系数之间的差小于块O₁的DC系数与块O₃的DC系数之间的差时，存在块F₄的DC系数与块O₃的DC系数相似的高的可能性。因此，块O₃的DC系数被确定块F₄的DC系数。

块F₁的DC系数的预测值被确定为块F₂的DC系数。块F₃的DC系数的预测值使用块F₂、F₄和F₁的DC系数而被获得。换句话说，当块F₂的DC系数与块F₁的DC系数之间的差小于块F₂的DC系数与块F₄的DC系数之间的差时，存在块F₃的DC系数与块F₄的DC系数相似的高的可能性。因此，块F₄的DC系数被确定为块F₃的DC系数。在相反的情况中，块F₁的DC系数被确定为块F₃的DC系数。

(2)第二方法，其中，DC系数被以块F₂、块F₄、块F₃并且随后F₁的顺序预测。

确定块F₂和F₄的DC系数的预测值的方法与在第一方法中相似。

块F₃的DC系数的预测值被确定块F₄的DC系数。块F₁的DC系数的预测值使用块F₂、块F₃和块F₄的DC系数而被获得。换句话说，当块F₃的DC系数与块F₄的DC系数之间的差小于块F₂的DC系数与块F₄的DC系数之间的差时，存在块F₁的DC系数与块F₂的DC系数相以的高的可能性。因此，块F₂的DC系数被确定为块F₁的DC系数的预测值。在相反的情况中，块F₃的DC系数被确定为块F₁的DC系数的预测值。

(3)第三方法，其中，DC系数被以块F₂、块F₁、块F₄并且随后F₃的顺序预测。

DC系数可以以与在第一和第二方法中相同的方式以块F₂、块F₁、块F₄并且随后F₃的顺序预测，但是在本方法中，当与与原点处的宏块O相邻最近的块F₂和F₄的DC系数被优先预测的第一和第二情况相比时参考块的信息不能被有效使用。

图11B中显示的块F₁至F₄的DC系数以与图11A中显示的决F₁至F₄的DC系数的预测相似的方式被预测。换句话说，块F₁至F₄的处理顺序被分为DC系数被以块F₁、块F₃、块F₂并且随后F₄的顺序预测的情况，DC系数被以块F₁、块F₃、块F₄并且随后F₂的顺序预测的情况，以及DC系数被以块F₁、块F₂、块F₃并且随后F₄的顺序预测的情况。

II、情况2

图12A至12D显示相应于情况2的当前宏块和参考宏块。参照图12A至12D，当前宏块是宏块E，参考宏块是宏块A。当前宏块E被分为四个8×8块E₁至E₄，参考宏块A被分为四个8×8块A₁至A₄。

包括在当前块E中的四个块E₁至E₄的DC系数的预测值被确定如下。图12A中显示的块E₁至E₄的DC系数的预测值被以图11A中显示的块F₁至F₄的DC系数的预测值的确定相同的方式被确定。图12B中显示的块E₁至E₄的DC系数的预测值被以图11B中显示的块F₁至F₄的DC系数的预测值的确定相同的方式被确定。

图12C和12D中显示的块E₁至E₄的DC系数的预测值也被以图11A和11B中显示的块F₁至F₄的DC系数的预测值的确定相同的方式被确定。作为例子，图12C中显示的块E₁至E₄的DC系数的预测将被描述。

图12C中显示的块E₁至E₄的DC系数的预测值可使用根据块E₁至E₄的处理顺序使用总共三种方法被确定。

(1)第一方法，其中，DC系数被以块E₁、块E₂、块E₃并且随后E₄被顺序预测。

块E₁的DC系数的预测值被确定为块A₃的DC系数。接下来，E₂的DC系数的预测值使用块A₃、A₄和块E₁的DC系数而被获得。换句话说，如果块A₃的DC系数与块A₄的DC系数之间的差小于块A₃的DC系数与块E₁的DC系数之间的差时，存在块E₂的DC系数与块E₁的DC系数相似的高的可能性。因此，块E₁的DC系数被确定为块E₂的DC系数的预测值。在相反的情况中，块A₄的DC系数被确定为块E₂的DC系数的预测值。

块E₃的DC系数的预测值被确定为块E₁的DC系数。E₄的DC系数的预测值使用块E₁、E₂和块E₃的DC系数而被获得。换句话说，如果块E₁的DC系数与块E₂的DC系数之间的差小于块E₁的DC系数与块E₃的DC系数之间的差时，存在块E₄的DC系数与块E₃的DC系数相似的高的可能性。因此，块E₃的DC系数被确定为块E₄的DC系数的预测值。在相反的情况中，块E₂的DC系数被确定为块E₄的DC系数的预测值。

在其中DC系数被以块E₁、块E₂、块E₄并且随后E₃的顺序预测以及DC系数被以块E₁、块E₃、块E₂并且随后E₄的顺序预测的方法将不被描述。

III、情况3

图13A至13H显示相应于情况3的当前宏块和参考宏块。参照图13A至13H，当前宏块是宏块E，参考宏块是宏块A、宏块B和宏块D。当前宏块E被分为四个8×8块E_A至E_D，参考宏块A被分为四个8×8块A_A至A_D，参考宏块B被分为四个8×8块B_A至B_D，并且参考宏块D被分为四个8×8块D_A至D_D。

如果DC系数被以包括在图13A至13H中显示的当前宏块E中的块E_A、块E_B、块E_C并且随后块E_D的顺x序预测，则总是存在用于块E_A至E_D的DC系数的预测的与当前宏块E水平、垂直和对角相邻的参考块。因此，通过比较相邻8×8参考块的DC系数可确定当前块的DC系数的预测值。

上述预测DC系数的方法以在编码器和解码器中相同的方式来执行。

如上所述，根据本发明，即使当视频数据根据面向ROI的扫描被扫描并且随后被编码和解码时，视频数据的帧内预测可被使用，导致视频数据的编码效率的提高。

本发明可被实现为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是能够存储其后可被计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的例子包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置以及载波。计算机可读记录介质还可被分布在网络连接的计算机系统上，从而计算机可读代码以分布式方式被存储和执行。

尽管参照其示例性实施例已经具体地显示和描述了本发明，但是本领域的普通技术人员将理解，在不脱离有所附权利要求限定的本发明的精神和范围的情况下，可以对其进行形式和细节上的各种修改。

Claims

1、一种预测视频数据单元的直流(DC)系数的方法，该方法包括：

从根据面向感兴趣区域的扫描被扫描并且随后在当前数据单元之前被变换的至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元，其中，在面向感兴趣区域的扫描中，扫描以位于感兴趣区域的预定位置的数据单元开始，并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置的数据单元的多个方形环的形式继续；和

使用至少一个参考数据单元的DC系数来确定当前数据单元的DC系数的预测值。

2、如权利要求1所述的方法，其中，在至少一个参考数据单元的选择中，在包括在包括当前数据单元的当前方形环中的当前数据单元以及包括在先前方形环中的先前数据单元中，与当前数据单元相邻的先前数据单元被选作为至少一个参考数据单元。

3、如权利要求2所述的方法，其中，如果包括在当前方形环中的先前数据单元中的一个与当前数据单元水平或垂直相邻，并且包括在先前方形环中的先前数据单元中的一个与当前数据单元对角相邻，则仅包括在当前方形环中的先前数据单元被选作为至少一个参考数据单元。

4、如权利要求2所述的方法，其中，如果与当前数据单元相邻的第一先前数据单元作为包括在当前方形环中的先前数据单元中的一个存在，与当前数据单元相邻的第二先前数据单元作为包括在先前方形环中的先前数据单元中的一个存在，并且与第一先前数据单元和第二先前数据单元两者相邻的第三先前数据单元存在，则第一先前数据单元、第二先前数据单元和第三先前数据单元被选作为参考数据单元。

5、如权利要求1所述的方法，其中，在至少一个参考数据单元的选择中，如果位于预定位置的数据单元仅作为先前数据单元中的一个存在，则位于预定位置的数据单元被选作为至少一个参考数据单元。

6、如权利要求1所述的方法，其中，确定当前数据单元的预测值包括：

将参考数据单元分为多个子数据单元；和

使用包括在至少一个参考数据单元中的多个子参考数据单元的DC系数以及编码或解码的子数据单元的DC系数来确定每一子数据单元的DC系数的预测值。

7、如权利要求6所述的方法，其中，在每一子数据单元的DC系数的预测值的确定中，在子参考数据单元以及编码或解码的子数据单元中，如果存在与子数据单元水平相邻的第一子参考数据单元，与子数据单元垂直相邻的第二子参考数据单元，以及与子数据单元对角相邻的第三子参考数据单元，则根据第一子参考数据单元与第三子参考数据单元之间的相似性以及第二子参考数据单元与第三子参考数据单元之间的相似性来确定每一子数据单元的DC系数的预测值。

8、如权利要求6所述的方法，其中，在每一子数据单元的DC系数的预测值的确定中，在子参考数据单元和编码或解码的子数据单元中，当存在与子数据单元水平相邻的第一子参考数据单元，与子数据单元垂直相邻的第二子参考数据单元，以及与子数据单元对角相邻的第三子参考数据单元时，如果第一子参考数据单元的DC系数与第三子参考数据单元的DC系数之间的差小于第二子参考数据单元的DC系数与第三子参考数据单元的DC系数之间的差，则第二子参考数据单元的DC系数被确定为每一子数据单元的DC系数的预测值。

9、如权利要求6所述的方法，其中，在每一子数据单元的DC系数的预测值的确定中，在子参考数据单元以及编码或解码的单元中，如果与子数据单元水平相邻的第一子参考数据单元，与子数据单元垂直相邻的第二子参考数据单元，以及与子数据单元对角相邻的第三子参考数据单元中的任何一个不存在，则第一子参考数据单元的DC系数和第二子参考数据单元的DC系数中的一个被确定为每一子数据单元的DC系数的预测值。

10、如权利要求6所述的方法，其中，当前数据单元和至少一个参考数据单元为16×16块，并且子数据单元和子参考数据单元为8×8块。

11、一种用于预测视频数据单元的直流(DC)系数的设备，该设备包括：

存储器，存储根据面向感兴趣区域的扫描被扫描并且在当前数据单元之前被变换的至少一个先前数据单元的变换系数，其中，在面向感兴趣区域的扫描中，扫描以位于感兴趣区域的预定位置的数据单元开始，并且以在其中包括在感兴趣区域中的剩余数据单元围绕位于感兴趣区域的预定位置中的数据单元的多个方形环的形式继续；

参考数据单元选择单元，从至少一个先前数据单元中选择用于当前数据单元的DC系数的预测的至少一个参考数据单元；和

预测单元，从参考数据单元选择单元接收指示选择的至少一个参考数据单元的索引，从存储器中读取选择的至少一个参考数据单元的DC系数，和使用读取的至少一个参考数据单元的DC系数据来确定当前数据单元的DC系数的预测值。

12、如权利要求11所述的设备，其中，在包括在包括当前数据单元的当前方形环中的先前数据单元以及包括先前方形环中的先前数据单元中，参考数据单元选择单元将与当前数据单元相邻的先前数据单元选作为至少一个参考数据单元。

13、如权利要求12所述的设备，其中，如果包括在当前方形环中的先前数据单元中的一个与当前数据单元水平或垂直相邻，并且包括在先前方形环中的先前数据单元中的一个与当前数据单元对角相邻，则参考数据单元选择单元将包括在当前方形环中的先前数据单元选作为至少一个参考数据单元。

14、如权利要求12所述的设备，其中，如果与当前数据单元相邻的第一先前数据单元作为包括在当前方形环中的先前数据单元中的一个存在，与当前数据单元相邻的第二相邻数据单元作为包括在先前方形环中的先前数据单元中的一个存在，并且与第一先前数据单元和第二先前数据单元两者相邻的第三先前数据单元存在，则参考数据单元选择单元将第一先前数据单元、第二先前数据单元和第三先前数据单元选择作为参考数据单元。

15、如权利要求11所述的设备，其中，如果位于预定位置的数据单元仅作为先前数据单元中的一个存在，则参考数据单元选择单元将位于预定位置的数据单元选择作为至少一个参考数据单元。

16、如权利要求11所述的设备，其中，预定单元将当前数据单元分为多个子数据单元，并且使用包括在至少一个参考数据单元中的多个子参考数据单元的DC系数以及编码或解码的子数据单元的DC系数来确定每一子数据单元的DC系数的预测值。

17、如权利要求16所述的设备，其中，在子参考数据单元以及编码或解码的字数据单元中，如果存在与子数据单元水平相邻的第一子参考数据单元，与子数据单元垂直相邻的第二子参考数据单元，以及与子数据单元对角相邻的第三子参考数据单元，则预测单元根据第一子参考数据单元与第三子参考数据单元之间的相似性以及第二子参考数据单元与第三子参考数据单元之间的相似性来确定每一子数据单元的DC系数的预测值。

18、如权利要求16所述的设备，其中，在子参考数据单元以及编码或解码的字数据单元中，如果存在与子数据单元水平相邻的第一子参考数据单元，与子数据单元垂直相邻的第二子参考数据单元，以及与子数据单元对角相邻的第三子参考数据单元，如果第一子参考数据单元的DC系数与第三子参考数据单元的DC系数之间的差小于第二子参考数据单元的DC系数与第三子参考数据单元的DC系数之间的差，则预测单元确定第二子参考数据单元的DC系数为每一子数据单元的DC系数的预测值。

19、如权利要求16所述的设备，在子参考数据单元以及编码或解码的子数据单元中，如果与子数据单元水平相邻的第一子参考数据单元，与子数据单元垂直相邻的第二子参考数据单元，以及与子数据单元对角相邻的第三子参考数据单元中的任何一个不存在，则预测单元将第一子参考数据单元的DC系数和第二子参考数据单元的DC系数中的一个确定为每一子数据单元的DC系数的预测值。

20、如权利要求16所述的设备，其中，当前数据单元和参考数据单元为16×16块，并且子数据单元和子参考数据单元为8×8块。

21、一种在其上记录有用于执行预测视频数据单元的直流(DC)系数的方法的程序的计算机可读记录介质，该方法包括：