CN1605212A

CN1605212A - 视频的编码及解码方法

Info

Publication number: CN1605212A
Application number: CNA028253698A
Authority: CN
Inventors: C·杜福尔; G·马匡特; S·E·瓦伦特
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2001-12-20
Filing date: 2002-12-11
Publication date: 2005-04-06
Also published as: US20050100086A1; EP1459554A1; WO2003055225A1; JP2005513926A; KR100944544B1; KR20040068962A; AU2002366826A1

Abstract

本发明涉及一种被应用到帧序列且产生编码位流的视频编码方法和设备，其中每个数据项借助于允许对所述位流内容的所有元素进行识别和解码的位流语法而被加以描述。根据得到例如在视频压缩标准MPEG－4内应用的本发明，语法包括特有的一位标志，其被提供用于以高的描述水平指示序列景物的每个视频目标的形状或轮廓的存在与否。这个标志在编码位流中被传输，并且它的值在解码侧被读取用于对应地控制解码步骤。

Description

视频的编码及解码方法

技术领域

本发明总体上涉及视频压缩领域且例如，尤其涉及MPEG族(MPEG-1，MPEG-2，MPEG-4)的视频标准。更具体地，本发明涉及这样的编码方法，其被应用到对应于被再划分成连贯视频目标平面(VOP)的连贯景物的视频序列，以及涉及用于对所述景物的全部视频目标进行编码而产生的由编码视频数据所构成的编码位流，其中每个数据项借助于允许对所述位流内容的全部元素进行识别且解码的位流语法而加以描述，所述内容被就包括至少亮度通道，带有或不带有色度通道，以及至少一个附加通道的分开通道而言加以描述。

本发明还涉及用于实施所述方法的编码设备，由所述编码设备所产生的编码位流组成的可传输视频信号，以及用于接收和解码所述视频信号的设备。

发明背景

在第一视频编码标准和建议(直至MPEG-2和H.263)中，视频被假定成矩形的且就三个分开的通道被加以描述：即一个亮度通道，其携带在给定位量N，例如八位上变化的黑和白信息；以及两个色度通道，其每一个包含等于这样值的数字信号，所述值被包括在由给定位量M(例如八位)上的色度表示所定义的范围内。

对于MPEG-4，已经介绍了附加的通道：α(阿尔法)通道(在MPEG-4术语中也被称为“任意形状通道”)，其用于描述存在于视频序列中的每个目标的轮廓。可提供其它附加的通道，例如，无需详尽地，透明度通道，其由可被叠加的不同目标所组成的视频内容所要求(对于一目标，这个透明通道可是不透明的，因此目标的结构(texture)覆盖另一目标的结构，或是半透明的，则在显示器上的结构由不同目标的结构的混合而产生)；差别(disparity)通道，其用于其中内容的两个视图被加以要求的应用(这样所述内容可以在使能立体观看的显示器上被显现)；或深度通道(在其中三维导航被使能的应用情况下)。

在MPEG-4标准中，用于说明这种附加通道的仅有手段是所谓的语法元素“video_object_layer_shape_extension”的使用。正如在MPEG-4文件w3056，“Information Technology-Coding of audio-visualobjects-Part2：Visual”，ISO/IEC/JTC1/SC29/WG11，Maui，USA，1999年12月，页111和112中所指出的，语法元素“video_object_layer_shape”是识别视频目标层的形状类型的2位整数(见表6-14，页112)，并且元素“video_object_layer_shape_extension”是识别可以被使用的辅助部件的数量(直至3)和类型的4位整数(见表V2-1，页112，其中有限数量的类型和组合被加以定义，但是USERDEFINED类型的选择允许具有更多可用的应用)。当“video_object_layer_shape”是00时，它意味着(表6-14)所述目标是矩形的。这个矩形目标的说明要求传输矩形就宽度和高度方面的尺寸，这在文件w3056，页36，行26-32(部分：if(video_object_layer_shape＝＝“rectangular”){})中给定且要求29位。为了传输具有MPEG-4语法的矩形目标的附加通道像差别通道或深度通道，这个目标必须通过将“video_object_layer_shape”设定为11(灰标)而作为非矩形被声明。一旦目标被声明为灰标(虽然它是矩形的)，则语法迫使发送描述目标形状的位，其根据文件w3056的下述部分中所给定的语法在宏块水平(macroblock level)被执行：

(a)页52，§6.2.6宏块，行1-6

(b)页56，§6.2.6.1 MB二进制形状编码，行1-5

(c)从页128，§6.3.5.3形状编码，到页129，行8，以及表6.26.

因此显然地是，根据由MPEG-4所提供的语法和语义，用于传输附加通道像差别或深度通道的支持仅被提供给具有一形状(或轮廓)的目标，然后其描述不得不以给定的位数被发送。对于例如CIF画面，最后所得到的位的浪费是每帧至少396位，即每宏块至少一个位以提供在文件w3056，§6.3.5.3(bab_类型＝变量长度码，其事实上包括1至7位)中所提到的bab_类型信息，而仅29位将本应该已经足够。在人们想要传输亮度和色度通道以及例如像矩形目标的差别的一个附加通道时，因此MPEG-4就编码效率而言是次优化的。

发明内容

因此本发明的目的是建议一种视频编码方法，其允许避免这种位的浪费且因此改善编码效率。

为此，本发明涉及如在说明书引言部分中所定义的方法，且此外其特征在于：所述语法包括特有的一位标志，其以高的描述水平表示序列景物的每个视频目标的形状存在与否。

本发明还涉及一种对应的编码设备，以及涉及一种可传输的视频信号，所述信号包括由所述编码方法所产生的编码位流，所述编码方法被应用到被再分成连贯视频目标平面(VOP)的连贯景物的序列上，为了对所述景物的所有视频目标进行编码而产生的所述编码位流由编码视频数据组成，其中每个数据项借助于允许对所述位流内容的全部元素进行识别和解码的位流语法而被加以描述，就包括由带有或不带有色度通道的至少亮度通道以及至少一个附加通道的单独通道而言，所述内容被加以描述，所述信号的进一步特征在于所述编码位流也包括特有的一位标志，所述标志以高的描述水平指示序列景物的每个视频目标的形状存在与否。

本发明最终涉及一种用于接收且解码这样的可传输视频信号的视频解码器。

具体实施方式

为了解决上述解释的位浪费问题，经建议，根据本发明将形状(或轮廓)通道的描述从附加通道的描述中分开。通过在位流中提供有关一形状存在的指示这个操作被实施，所述形状指示将从像差别或深度通道等附加通道的存在的可能指示中被分开。这个指示包括根据本发明以高的描述水平(至少等效于视频目标层或-VOL-MPEG-4水平)被引入的特有一位标志。

这个附加的描述步骤例如以下述方式被加以实施。语法元素如在本实例中被加以定义：

Video_object_layer_shape

并且这个元素的语义含义是：“这是一个一位标志，若其被设定成一给定值(例如1)，则指示形状(或轮廓)通道的存在”。如果这个语法元素被发送到1，则存在轮廓或形状通道且其应该被解码。如果不存在，则不会预期到形状或轮廓的描述。

这个技术方案的有利处在于：用于附加通道传输的支持现在并不取决于目标具有或不具有形状这一事实，这提供更灵活的语法并且导致改善的编码效率。

上面所描述的视频编码方法可在编码设备，如例如在图1中所示例的一个设备中被实施，图1示出具有运动补偿的帧间预测的MPEG编码器实例，所述编码器包括编码和预测级。编码级本身包括以串联的模式判断电路11(用于确定如MPEG中所定义的编码模式I，P或B的选择)，DCT电路12，量化电路13，可变长度编码电路14和联系到速率控制电路16的缓冲器15，所述速率控制电路16用于根据所述缓冲器的内容适应电路13中的量化。预测级包括串联的运动估算电路21及接其后的运动补偿电路22，以及，以串联的，反相量化电路23，反相DCT电路24和加法器25。加法器25的输出在运动补偿电路22的第二输入上被接收，并且所述电路的输出在加法器25的第二输入上被接收(在同时，电路22的所述输出是预测级的输出)。减法器26允许向编码级(11到16)发送编码设备的输入信号IS与在预测级输出处(即在电路22的输出处)可用的预测信号之间的差。这个差，即残余，是被编码的位流，且缓冲器15的输出信号CB是编码位流，其根据本发明将包括这样的语法元素，所述语法元素以高描述水平指示针对编码位流中所描述的每个通道编码残余信号的存在与否。

编码设备的另一实例可基于MPEG-4标准的技术规范。在MPEG-4视频帧框架中，可包括一个或几个视频目标(及可能地它们的增强层)的每个景物，作为被称为视频目标(VO)的这些目标的组分被构建，且通过使用分开的初级位流被编码。因此输入视频信息借助于分段电路被首先分成VO，并且这些VO被发送到涉及形状编码，运动编码和结构编码的基本编码结构。鉴于这些编码步骤，每个VO被分成宏块，其是例如对于格式4∶2∶0的四个亮度块及两个色度块，并且一个接一个地被编码。根据本发明，包括由所述编码步骤导致的编码信号的被复用位流将包括如此特有标志，其用于描述在即将被传输及/或存储的编码位流中每个被描述的通道的最大帧速。

相互地，根据对应的解码方法，这些被传输到解码侧的特有标志由接收包括所述标志的编码位流并且执行所述解码方法的视频解码器中的适当装置读取。能够对编码位流内容的所有段进行识别和解码的解码器读取所述附加的语法元素并且得知每个被描述通道的最大帧速。这样的解码器可是如同编码设备的任何MPEG类型，并且它的基本元件是例如串联的用于接收编码位流的输入缓冲器，VLC解码器，反相量化电路及反相DCT电路。在编码以及解码设备中，可提供控制器用于管理编码或解码操作的步骤。

出于示例和描述的目的，本发明优选实施例的上述描述已经被呈现。它并不旨在是详尽的或将本发明限制到所公开的精确形式，并且明显地按照上述示教，对本领域普通技术人员所显然地且旨在被包括在这个发明范围内的修改和变化是可能的。

例如可理解为在此所描述的编码和解码设备可以以硬件，软件或硬件和软件的组合被加以实施，而无需排除硬件或软件的单个项可以完成几个功能或硬件与软件的组件项或上述两者完成单个功能。所描述的方法和设备可由任何类型的计算机系统或其它自适应装置来实施。硬件和软件的典型组合可是具有这样的程序的通用型计算机系统，当所述程序被装载和执行时，其控制计算机系统以便于它执行在此所描述的方法。作为选择地，可以利用包含用于执行一个或更多个本发明功能性任务的专用硬件的特有计算机。

本发明还可以被嵌入在计算机程序产品内，其包括使能在此所描述的方法和功能得到实施的所有特征，并且当其被装载在计算机系统内时，能够执行这些方法和功能。计算机程序，软件程序，程序，程序产品，或软件，在本环境中意味着一指令集合的以任何语言的任何表达，码或符号，所述指令集合旨在致使具有信息处理能力的系统直接地或在下述任何一个或两者之后执行特定的功能：(a)转换到另一语言，码或符号；以及/或(b)以不同材料形式的再现。

Claims

1.一种被应用到对应于连贯景物的视频序列的视频编码方法，所述方法产生用于对所述景物的所有视频目标进行编码、由编码视频数据所构成的编码位流，其中每个数据项借助于允许对所述位流内容的所有元素进行识别和解码的位流语法而被加以描述，所述内容针对包括带有或不带有色度通道的至少亮度通道及至少一个附加通道的分开通道被加以描述，所述方法的进一步特征在于：所述语法包括特有的一位标志，其以高的描述水平指示序列景物的每个视频目标的形状或轮廓的存在与否。

2.根据权利要求1的方法，其中如果所述特有标志被设定成给定值，则目标的形状存在且必须被解码，如果所述标志被设定成其它值，则没有形状的描述被预期。

3.一种用于将对应于连贯景物的视频序列进行编码的设备，所述设备包括：用于构建作为视频目标(VO)组分的所述序列的每个景物的装置；用于对每个所述VO的形状，运动和结构进行编码的装置；以及用于将由此所获得的编码初级流复用到由编码视频数据所组成的单个编码位流的装置，其中每个数据项借助于允许对所述位流内容的所有元素进行识别和解码的位流语法而被加以描述，就包括带有或不带有色度通道的至少亮度通道及至少一个附加通道的分开通道，所述内容被加以描述，所述设备的进一步特征在于：它还包括用于在所述编码位流中引入特有的一位标志的装置，所述特有的一位标志以高的描述水平指示序列景物的每个视频目标的形状或轮廓的存在与否。

4.一种由编码位流所组成的可传输视频信号，所述编码位流由被应用到对应于连贯景物的序列的视频编码方法所产生，为了对所述景物的所有视频目标进行编码而产生的所述编码位流由编码视频数据构成，其中每个数据项借助于允许对所述位流内容的所有元素进行识别和解码的位流语法而被加以描述，所述内容就包括带有或不带有色度通道的至少亮度通道及至少一个附加通道的单独通道被加以描述，所述信号的进一步特征在于：所述编码位流还包括特有的一位标志，其以高的描述水平指示序列景物的每个视频目标的形状或轮廓的存在与否。

5.一种被应用到由编码位流所组成的视频信号的视频解码方法，所述编码位流由被应用到对应于连贯景物的序列的视频编码方法所产生，用于对所述景物的所有视频目标进行编码所产生的所述编码位流由编码视频数据构成，其中每个数据项借助于允许对所述位流内容的所有元素进行识别和解码的位流语法而被加以描述，所述内容就包括带有或不带有色度通道的至少亮度通道及至少一个附加通道的单独的通道被加以描述，所述编码位流还包括特有的一位标志，其以高的描述水平指示序列景物的每个视频目标的形状或轮廓的存在与否，所述解码方法的特征在于：它包括用于读取所述特有标志的值并且根据所述值控制解码步骤的读取步骤。

6.一种用于对由编码位流所组成的视频信号进行接收和解码的设备，所述位流由被应用到对应于连贯景物的序列的视频编码方法所产生，用于对所述景物的所有视频目标进行编码所产生的所述编码位流由编码视频数据构成，其中每个数据项借助于允许对所述位流内容的所有元素进行识别和解码的位流语法而被加以描述，所述内容就带有或不带有色度通道的至少亮度通道及至少一个附加通道的分开的通道被加以描述，所述编码位流还包括特有的一位标志，其以高的描述水平指示序列景物的每个视频目标的形状或轮廓的存在与否，所述解码设备进一步的特征在于：它包括用于读取所述特有标志的值并且根据所述值对应地控制解码步骤的装置。