CN101356817A

CN101356817A - 对标志编码的方法、对标志解码的方法及其设备

Info

Publication number: CN101356817A
Application number: CNA2006800509180A
Authority: CN
Inventors: 韩宇镇; 李培根; 李泰美; 李教爀
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2006-01-12
Filing date: 2006-11-16
Publication date: 2009-01-28

Abstract

提供一种对标志编码的方法、对标志解码的方法及其设备，其中，可通过使用包括在多个块中的各种标志之间的空间相关性来有效地执行标志编码和解码。该方法包括：根据块的空间相关性收集分别分配给所述多个块的组的标志值以创建标志位串；使用组大小将标志位串分割为多个分割的位串；设置指示包括在分割的位串中的所有位是否为0的图样位；根据设置的图样位对分割的位串执行熵编码。

Description

对标志编码的方法、对标志解码的方法及其设备

技术领域

与本发明一致的方法和设备涉及对标志编码以及对标志解码。更具体地讲，本发明涉及通过使用包括在宏块中的各种标志之间的空间相关性可被有效地执行的标志编码和解码。

背景技术

随着包括互联网的信息通信技术的发展，视频通信以及文本和语音通信显著增加。传统文本通信不能满足用户的各种需求，因此可提供各种类型的信息(例如，文本、图片和音乐)的多媒体服务已经增加。然而，多媒体数据需要具有大容量的存储介质以及用于传输的宽带宽，这是因为多媒体数据量通常很大。因此，需要压缩编码方法来传输包括文本、视频和音频的多媒体数据。

数据压缩的基本原理在于去除数据冗余。可通过去除空间冗余、时间冗余或心理视觉冗余来压缩数据，空间冗余是在图像中重复的相同色彩或对象，时间冗余是在运动图像帧中的相邻帧之间存在的微小改变或者在音频中重复的相同声音，心理视觉冗余考虑人类视觉以及人类视觉对高频的有限感知。在一般的视频编码中，通过基于运动估计的时间滤波来去除时间冗余，并且通过空间变换来去除空间冗余。

对通过根据量化处理的量化步骤去除数据冗余获得的结果来执行有损编码。最终通过熵编码对量化结果执行无损编码。

现在，在H.264标准中使用的熵编码模式的例子包括CAVLC(上下文自适应的可变长度编码)、CABAC(上下文自适应的二进制算术编码)、Exp_Golomb(指数Golomb)等。下面的表1显示用于采用H.264标准编码的每一参数的熵编码模式。

表1

在表1中，如果entropy_coding_mode标志是0，则通过Exp_Golomb来对下述项编码：指示相应宏块是帧间预测模式还是帧内预测模式的宏块类型、指示构成宏块的子块的类型的宏块图样、用作确定量化阶的索引的量化参数、指示在帧间预测模式中参考的多个帧的参考帧索引以及运动向量。此外，通过CAVLC来编码指示原始图像和预测图像之间的差的残差数据。

相反，如果entropy_coding_mode标志是1，则通过CABAC对所有的参数编码。

CABAC在具有高复杂度的参数中表现较好的性能。因此，基于VLC(可变长度编码)的熵编码(例如，CAVLC)被设置为基本简档(profile)。

发明内容

技术问题

同时，在H.264或基于多层的可伸缩视频编码(也称为H.264SE(可伸缩版本))中，存在涉及是否使用层间信息的各种标志。对于片、宏块或子块的每一个设置这些标志。因此，在视频编码中不能忽略通过标志增加的开销。

然而，与文本数据或运动数据相反，当前在不考虑其空间相关性的情况下对标志编码或不编码。

技术方案

本发明的示例性实施例克服上述缺点和以上没有描述的其它缺点。此外，本发明不需要克服上述缺点，并且本发明的示例性实施例可不克服任何上述问题。

根据本发明的一方面，提供一种对标志编码的方法、对标志解码的方法及其设备，其中，在使用其空间相关性的同时可对在视频编解码器中使用的各种标志进行有效编码。

本发明的各方面不限于上述方面，通过以下描述，本领域的技术人员将清楚地理解本发明的其它方面。

根据本发明的第一方面，提供一种对用于对具有多个块的视频帧编码的标志编码的方法。该方法包括：根据特定块的空间相关性收集分别分配给所述多个块的组的标志值以创建标志位串；使用组大小分割标志位串；设置指示包括在分割的位串中的所有位是否为0的图样位；根据设置的图样位对分割的位串执行熵编码。

根据本发明的第二方面，提供一种对用于对具有多层的视频帧编码的标志编码的方法。该方法包括：对当前层的块的第一标志值和与当前层的块相应的下层的块的第二标志值执行异或运算；根据当前层的块的空间相关性收集运算结果值来创建标志位串；使用组大小分割标志位串；设置指示包括在分割的位串中的所有位是否为0的图样位；根据设置的图样位对分割的位串执行熵编码。

根据本发明的第三方面，提供一种对用于对具有多个块的视频帧编码的标志解码的方法。该方法包括：从视频流中读取指示包括在位串中的所有位是否为0的图样位；当图样位具有第一位时，将与组大小相应的标志位串设置为0；当图样位具有第二位时，根据组大小从视频流中读取块的编码的标志位串；对读取的标志位串执行熵解码。

根据本发明的第四方面，提供一种对用于对具有多个块的视频帧编码的标志编码的设备。该设备包括：位串创建单元，根据特定块的空间相关性收集分别分配给所述多个块的组的标志值以创建标志位串；位串分割单元，使用组大小分割标志位串；图样位设置单元，设置指示包括在分割的位串中的所有位是否为0的图样位；熵编码单元，根据设置的图样位对分割的位串执行熵编码。

根据本发明的第五方面，提供一种对用于对具有多层的视频帧编码的标志编码的设备。该设备包括：异或运算单元，对当前层的块的第一标志值和与当前层的块相应的下层的块的第二标志值执行异或运算；标志位串创建单元，根据当前层的块的空间相关性收集运算结果值来创建标志位串；位串分割单元，使用组大小分割标志位串；图样位设置单元，设置指示包括在分割的位串中的所有位是否为0的图样位；熵编码单元，根据设置的图样位对分割的位串执行熵编码。

根据本发明的第六方面，提供一种对用于对具有多个块的视频帧编码的标志解码的设备。该设备包括：图样位读取单元，从视频流中读取指示包括在位串中的所有位是否为0的图样位；标志位串设置单元，当图样位具有第一位时，将与组大小相应的标志位串设置为0；标志位串读取单元，当图样位具有第二位时，根据组大小从视频流中读取块的编码的标志位串；熵解码单元，对读取的标志位串执行熵解码。

附图说明

通过结合附图对其示例性实施例进行的详细描述，本发明的上述和其他方面将会变得更加清楚，其中：

图1是示出根据本发明示例性实施例的形成一帧的宏块的示图；

图2是示出根据本发明示例性实施例的包括在每一宏块头中的特定标志之间的空间相关性的示图；

图3是示出根据本发明示例性实施例的收集相同的标志值并且对收集的标志执行熵编码的构思的示图；

图4是示出根据本发明示例性实施例的标志编码设备的结构的框图；

图5是示出根据本发明示例性实施例的标志解码设备的结构的框图；

图6是示出根据本发明示例性实施例的对标志编码的方法的流程图；

图7是示出根据本发明示例性实施例的在SVC中使用的各种预测方法的构思的示图；

图8是示出根据本发明示例性实施例的标志编码设备的结构的框图；

图9是示出根据本发明示例性实施例的对标志编码的方法的流程图；

图10是示出根据本发明示例性实施例的对标志解码的方法的流程图；

图11是示出根据本发明示例性实施例的标志解码设备的结构的框图；

图12是示出根据本发明示例性实施例的对标志解码的方法的流程图；

图13是示出可应用图4或图8的标志编码设备的视频编码器的结构的框图；

图14是可应用图5或图11的标志解码设备的视频解码器的结构的框图。

具体实施方式

参照以下对示例性实施例的详细描述和附图可更加容易地理解本发明的优点和特点以及实现它们的方法。然而，本发明可以以许多不同形式来实现，并且不应解释为受这里阐述的示例性实施例的限制。然而，提供这些实施例，从而此公开将是彻底和完整的，并将本发明的概念传达给本领域的技术人员，并且本发明仅由权利要求来限定。整个说明书中，相同的标号表示相同的部件。

与传统MPEG-4或H.264相比，可伸缩视频编码增加了许多句法元素量。每一句法元素具有一位或几位的容量，但是如果集中在整个视频流上，则也很难忽略由于句法元素引起的开销。本发明集中在下述方法中：在视频编码中，收集存在于每一块(片、宏块或子块)中的相同标志(句法元素)，随后集中对标志编码，从而减小了由于标志引起的开销。

图1至图3是示出本发明的基本构思的示图。

在视频编码中，通常以具有16×16的像素大小的宏块为单位执行处理。如图1所示，一帧或一片被分为多个宏块MB_n(n是自然数)。各个宏块通过有损/无损编码处理变为视频流。例如，如图1所示可以以Z字形扫描顺序来对宏块编码。

这样，头(宏块头)被添加到编码宏块MB_n的头，随后宏块被收集，从而形成图2中显示的一个视频流20。头中的每一个包括各种标志A_flag_n、B_flag_n等。头中的每一个具有相同的标志，但是标志的值可以不同。然而，空间上彼此相邻的宏块具有空间相关性和亲和力。因此，在相邻宏块中，相同的标志可具有相同的值。例如，指示相应宏块是否被编码的编码的块图样(cbp)标志具有大的空间相关性。在H.264标准和SVC标准中，在帧间宏块的情况下，cbp标志被定义为参数g_aucCbpInter，在帧内宏块的情况下，cbp标志被定义为参数g_aucCbpIntra。

其结果是，提出了收集相同标志的值(位串)并随后对这些值编码的方法。例如，如图3所示，收集并编码值A_flag中的A_flag1，A_flag2，...A_flag_n，收集值B_flag中的B_flag1，B_flag2，...，B_flag_n，并且B_flag1，B_flag2，...，B_flag_n经过熵编码(无损编码)处理。这样，如果相同标志的值被收集以统一对它们编码，很容易预知到：与对标志值分别编码的情况相比，由于标志值之间的相似关系以及亲和力，压缩效率被提高。

接下来，将描述收集的标志值(以下称为“标志位串”)经过熵编码处理的算法。图4是示出根据本发明示例性实施例的标志编码设备100的结构的框图。

标志编码设备100包括组大小设置单元120、标志组合单元110、位串分割单元130、图样位设置单元140、标志编码单元150和记录单元160。此外，标志编码设备100可还包括缓冲器170。

标志组合单元110收集每一宏块的特定标志的值，并且创建如图3所示的标志位串。在这种情况下，标志是指通常由一位表示的标志，但是可以是由两位或更多位表示的标志。

组大小设置单元120设置成为用于分割标志位串的单位的组大小gs。位的数量表示组大小，例如可以是4、8或16。如果在特定标志值的分布中，0的数量多，则最好将组大小设置为大的值。组大小可被设置为具有该数量的宏块的单位，此时，可为由多个宏块形成的每一片或帧设置组大小。在这种情况下，gs值可被记录在片头或帧头中。

位串分割单元130根据组大小设置单元120设置的组大小(gs值)分割由标志组合单元110输入的标志位串。随后，以组大小为单位分割的位串被输入图样位设置单元140。

如果所有分割的位串是0，则图样位设置单元140将位(以下称为图样位pb)设置为1，从而经过熵编码处理，如果所有分割的位串的一部分是0，则图样位设置单元140将图样位设置为0，从而不经过熵编码处理。

如果图样位被设置为0，也就是，除了0之外的值存在于分割的位串中，则标志编码单元150允许分割的位串经过熵编码(有损编码)处理。对于熵编码，可使用已知的可变长度编码、算术编码等。此外，尽管分割的位串的每一个可经过熵编码，但是包含除了0之外的值的所有分割的位串可再次被收集，随后统一经过熵编码处理。

当图样位是0时的意思可以与当图样位是1的意思相反。因此，在说明书中，可由一位表示的两个值之一可由第一位表示，另一位可由第二位表示。

记录单元160将组大小gs和图样位pb记录在视频流上。可以以片或帧为单位记录组大小gs，并且可根据组大小gs为宏块记录图样位pb。例如，当组大小是4时，图样位可被记录在四个宏块中的第一宏块的头。此外，当pb是0时，记录单元160也记录标志编码单元150提供的熵编码结果。以与pb相同的方式，熵编码结果可被记录在第一宏块的头。在标志编码单元150中所有分割的位串被收集且随后统一经过熵编码处理的情况下，熵编码结果可被记录在片头或帧头。

在上述描述中，已经描述了记录设置的组大小gs和发送它的例子。然而，如果通过使用编码设备和解码设备中的公共信息来计算组大小gs，则不需要发送组大小gs。

在标志编码设备100的另一示例性实施例中，组大小设置单元120可确认先前创建的宏块的标志位串的分布，并且改变组大小。例如，组大小设置单元120可从累积的标志位串中选择多个位，并且根据0在选择的位中占据的比率和阈值之间的关系来设置组大小。

具体地讲，如果0在选择的位中占据的比率小于1/3，则组大小设置单元120将组大小设置为1，如果0在选择的位中占据的比率大于4/5，则组大小设置单元120将组大小设置为8。在其他情况下，组大小设置单元120将组大小设置为4。

这样，由于累积的位是标志编码设备和与标志编码设备相应的标志解码设备可公知的信息，因此，记录单元160不需要将设置的组大小记录在视频流上。

图5是示出根据本发明示例性实施例的标志解码设备200的结构的框图。

标志解码设备200可包括组大小设置单元210、图样位读取单元220、标志解码单元230、输出缓冲器240和标志设置单元250。

组大小设置单元210读取包含在视频流中的组大小gs信息以设置组大小。或者，组大小设置单元210通过由输出缓冲器240提供的先前存储的标志值的分布来设置组大小。前者相应于标志编码设备100记录组大小并发送它的情况，后者相应于标志编码设置100根据位分布设置组大小并且不发送它的情况。在后者的情况下，组大小设置单元210以与标志编码设备100的组大小设置单元120相同的方式计算组大小。

图样位读取单元220读取包含在视频流中的图样位pb的值。随后，当读取的值是1时，图样位读取单元220将读取的值通知给标志设置单元250，当读取的值是0时，图样位读取单元220将读取的值通知给标志解码单元230。

当图样位读取单元220通知pb的值为0时，标志解码单元230从视频流中读取与设置的组大小一样多的块的编码标志位串(标志解码设备200中的熵编码的结果)，并且对其执行熵解码。以与标志编码单元150执行的熵编码处理相反的顺序执行熵解码处理。

当图样位读取单元220通知pb的值为1时，标志设置单元250将与组大大小相应的所有标志设置为0。

输出缓冲器240临时存储标志解码单元230熵解码的值以及标志设置单元250设置的值。输出缓冲器240将存储的值作为恢复的标志输出。

图6和图9是示出根据本发明示例性实施例的流程图。图6是示出根据本发明示例性实施例的对标志编码的方法的流程图。

首先，组大小设置单元120设置用作分割标志位串的单位的组大小gs(S11)。例如，组大小可以是4、8或16。位分割单元130以组大小为单位分割标志位串(S12)。

随后，图样位设置单元140确定所有分割的位串是否为0(S13)。在这种情况下，当确定所有分割的位串是0时，图样位设置单元140将图样位pb设置为1(S16)，当确定所有分割的位串的一部分是0时，图样位设置单元140将图样位pb设置为0(S14)。

当图样位被设置为0时，标志编码单元150对分割的位串执行熵编码(S15)。此时，标志编码单元150可对分割的位串的每一个执行熵编码，或者收集包含除了0之外的值的所有分割的位串，随后统一对它们执行熵编码。

最后，如果对片或帧中的所有宏块执行了上述步骤(S17的是)，则完成处理，如果没有对所有的宏块执行上述步骤，则处理回到步骤S12。

同时，如果如图2所示特定标志仅具有空间相关性，则图6中显示的标志编码算法可被应用。在如可伸缩视频编码(SVC)的基于多层的视频编码方案中，特定标志可不仅具有空间相关性，而且具有层间相关性。例如，残差预测标志(residual_prediction_flag)、基础内标志(intra_base_flag)、运动预测标志(motion_prediction_flag)、基础模式标志(base_mode_flag)可具有层间相关性。因此，包括在当前层的宏块中的标志的值可能等于与当前层中的宏块相应的包括在下层(LOWER layer)中的宏块中的标志的值。

残差预测标志是指示是否使用残差预测的标志。残差预测相应于这样一种方法，其中，通过使用与一层的残差信号相应的下层的残差信号来预测该层的残差信号，从而减小残差信号之间的层间冗余。下层相应于为了对一层有效编码而参考的任何其他层。下层不限于第一层，并且没必要是下层。

是否使用残差预测通过残差预测标志来显示，并且被发送给视频解码器的终端。如果标志是1，则指示使用了残差预测，如果标志是0，则指示没有使用残差预测。通常，如果标志是1，则指示使用了相应的功能，如果标志是0，则指示没有使用相应功能。

基础内标志是指示是否使用了基础内预测的标志。当前，在可伸缩视频编码草案中，不仅应用在如图7所示的现有H.264中使用的帧间预测①和帧内预测②，而且应用使用下层的图像预测当前层中的帧并且减小将被编码的数据的基础内预测③。在可伸缩视频编码草案中，基础内预测处理一种帧内预测。在这种情况下，如果在帧内预测中基础内标志是0，则显示传统定向帧内预测，如果在帧内预测中标志是1，则显示基础内预测。

运动预测标志是指示是当前层中相同层的另一运动矢量还是下层矢量中的运动矢量被用于预测运动矢量来计算运动矢量差(MVD)的标志。当所述标志是1时，指示使用了下层中的运动矢量，当所述标志是0时，指示使用了相同层中的另一运动矢量。

基础模式标志是指示在显示当前层中的运动信息中是否使用下层中的运动信息的标志。如果基础模式标志是1，则下层中的运动信息用作当前层中的运动信息，或者通过细化下层中的运动信息获得的值用作当前层中的运动信息。如果基础模式标志是0，则指示不管下层中的运动信息来独立地搜索和记录当前层中的运动信息。该运动信息包括宏块类型(mb_type)、帧间预测时画面的参考方向(向前方向、向后方向和双向)以及运动矢量。

具有层间相关性的标志具有相同值的概率高。因此，如果在编码当前层的宏块的标志中考虑高概率，则可提高编码效率。在本发明另一示例性实施例中，提出这样一种方法，其中，对当前层的宏块的标志值不直接编码，并且对通过在层间标志值之间执行异或(XOR)运算获得的值进行编码。

图8是示出根据本发明另一示例性实施例的标志编码设备190的结构的示图。如果图8与图4进行比较，则标志读取单元101和操作单元105还被包括在图8中。

标志读取单元101读取用于当前层的宏块的标志F_C以及用于与该宏块相应的下层的宏块的标志F_B。通过解析宏块头或者读取加载在存储器中的变量可以理解这些标志。

运算单元105对标志F_C和F_B执行异或运算。其结果是，由于层间相关性，很可能输出0。在这种情况下，可提高熵解码效率。在运算单元105输出的运算结果被输入到标志组合单元110之后，由于处理如图4所示被执行，因此不对以下处理进行描述。

图9是示出图8的实施例的流程图。

首先，标志读取单元101读取标志F_C和F_B(S19)，将读取的标志F_C和F_B输入运算单元105并且对它们执行异或运算(S20)。

随后，组大小设置单元120设置组大小gs(S21)，并且位串分割单元130以组大小为单元分割从运算结果R_C获得的位串(S22)。

图样位设置单元140确定所有分割的位串是否为0(S23)。在这种情况下，如果所有分割的位串是0，则图样位设置单元140将图样位pb设置为1(S26)，如果分割的位串的一部分不是0，则图样位设置单元140将图样位pb设置为0(S24)。

当图样位被设置为0时，标志编码单元150对分割的位串执行熵编码(S25)。最后，如果对片或帧中的所有宏块执行了上述步骤(S27的是)，则完成处理，如果没有对片或帧中的所有宏块执行上述步骤，则处理进行到步骤S22。

图10是示出根据本发明实施例的对标志解码的方法的流程图。

首先，组大小设置单元210设置组大小gs(S31)。此时，组大小设置单元210读取包含在视频流中的组大小gs信息以设置组大小。或者，组大小设置单元210可通过由输出缓冲器240提供的先前恢复的标志值的分布来设置组大小。在后者的情况下，组大小设置单元210以与标志编码设备100的组大小设置单元120相同的方式计算组大小。

图样位读取单元220读取包含在视频流中的图样位pb的值(S32)，并且确定图样位pb的值是0还是1(S33)。

当确定图样位pb的值是1(S33的是)时，标志设置单元250将与组大小相应的所有标志设置为0(S35)。

相反，当确定图样位pb的值是0(S33的否)时，标志解码单元230从视频流读取与设置的组大小一样多的块的编码标志位串(标志解码设备100中的熵编码结果)，并且对其执行熵解码(S34)。以与在标志编码单元150中执行的熵解码处理相反的顺序执行熵解码处理。

最后，如果对片或帧中的所有宏块执行了上述步骤(S36的是)，则完成处理，如果没有对所有宏块执行上述步骤，则处理进行到步骤S32。

同时，在考虑如图8所示的层间相关性的同时对标志编码的情况下，为了执行解码处理，一些部件应该被另外设置在图5中显示的结构中。图11是示出根据本发明另一示例性实施例的标志解码设备290的结构的示图。

如果图11与图5进行比较，则仅运算单元260被另外设置在图11中。由于运算单元260的操作之前的操作与图5中的相同，则将省略对其的描述。从输出缓冲器240输出的值与通过对标志F_C和F_B执行异或运算获得的R_C相应。运算单元260对标志F_C和F_B执行异或运算，从而恢复当前层的宏块的特定标志F_C。

图12是示出图11的实施例的流程图。

首先，组大小设置单元210设置组大小gs(S41)。此时，组大小设置单元210读取包含在视频流中的组大小gs信息以设置组大小。另外，组大小设置单元210可通过由输出缓冲器240提供的先前恢复的标志值的分布来设置组大小。

图样位读取单元220读取包含在视频流中的图样位pb的值(S42)，并且确定图样位pb的值是0还是1(S43)。

当确定图样位pb的值是1(S43的是)时，标志设置单元250将与组大小相应的所有数据R_C设置为0(S46)。

相反，当确定图样位pb的值是0(S43的否)时，标志解码单元230按照组大小读取包含在视频流中的编码数据(也就是R_C)，并且对读取的数据执行熵解码(S44)。

运算单元260对与F_C相应的下层的标志值F_B和在步骤S46设置为0的R_C或者在步骤S44经过熵解码处理的R_C执行异或运算(S45)。

最后，如果对片或帧中的所有宏块执行了上述步骤(S46的是)，则完成处理，如果没有对所有宏块执行上述步骤，则处理回到步骤S42。

图13是示出可应用图4的标志编码设备100或图8的标志编码设备190的基于多层的视频编码器500的结构的框图。

原始视频序列被输入到当前层编码器400，随后通过下采样单元305对视频序列下采样(仅当分辨率在层之间改变时)，随后视频序列被输入到下编码器300。

预测单元410通过预测方法计算当前宏块中预测的图像的差，并且输出残差信号。预测方法的例子可包括方向性帧内预测、帧间预测、基础内预测和残差预测。

变换单元420通过使用空间变换方法(例如，DCT、小波变换等)转换计算的残差信号，从而创建变换系数。

量化单元430在量化步骤中量化变换系数(当量化步长很大时，数据丢失和压缩率很高)，从而创建量化系数。

熵编码单元440对量化系数执行有损编码，并且输出当前层中的视频流。

标志设置单元450基于在各步骤中获得的信息设置标志。例如，基于从预测单元410获得的信息设置残差预测标志(residual_prediction_flag)、基础内标志(intra_base_flag)等。以上述方式设置的当前层的标志F_C被输入到标志编码设备190。

与当前层编码器400类似，下层编码器300也包括预测单元310、变换单元320、量化单元330、熵编码单元340和标志设置单元350。熵编码单元340将下层的视频流输出到复用器360，并且标志设备单元350将下层的标志F_B提供给标志编码设备190。

复用器360将当前层的视频流与下层的视频流进行组合，从而创建视频流VS，并将该视频流VS提供给标志编码设备190。

标志编码设备190通过使用提供的标志F_B和F_C之间的相关性来对标志F_C编码，并将编码的F_C和提供的F_B插入提供的视频流，从而输出最终视频流(最终BS)。

可用标志编码设备100替换标志编码设备190。在这种情况下，由于没有使用层间相关性，因此标志F_C仅通过使用空间相关性而不根据标志F_B来经过熵编码处理。

图14是示出可应用图5的标志编码设备200或图11的标志解码设备290的基于多层的视频解码器800的结构的框图。

输入的最终视频流VS被输入到标志解码设备290和解复用器650。解复用器650将最终视频流分离为当前层的视频流和下层的视频流，随后将它们分别提供给当前层解码器700和下层解码器600。

熵解码单元710以与熵编码单元440相应的方法执行有损解码，并且恢复量化系数。

逆量化单元720对在量化单元430中使用的量化步骤中的恢复的量化系数执行逆量化。

逆变换单元730通过使用逆空间变换方法(例如，逆DCT变换、逆小波变换等)对逆量化的结果执行逆变换。

逆预测单元740以相同的方式计算由预测单元410计算的预测图像，并将计算的预测图像添加到逆变换的结果，从而恢复视频序列。此时，逆预测单元740在特定情况(例如，基础内预测、残差预测等情况)下使用由下层解码器600解码的结果。

与当前层解码器700类似，下层解码器600也包括熵解码单元610、逆量化单元620、逆变换单元630和逆预测单元640。

同时，标志解码设备290从最终视频流提取下层的标志F_B和当前层的标志F_C的编码值，并且从标志F_B和编码值恢复当前层的标志F_C。

在下层解码器600的基本部件610、620、630和640的每一个中执行相应操作中，可使用提取的下层的标志F_B，并且在当前层解码器700的基本部件710、720、730和740的每一个中执行相应操作中，可使用恢复的当前层的标志F_C。

可用标志编码设备200替换标志编码设备290。在这种情况下，由于不使用层间相关性，因此标志F_C仅通过使用空间相关性而不根据标志F_B来经过熵解码处理。

图4、5、8、11、13和14中显示的各个部件可通过可在存储器的预定区域中执行的软件(例如，任务、类、子程序、处理、对象、执行线程、程序等)、硬件(例如，现场可编程门阵列(FPGA)或专用集成电路(ASIC))、或者硬件和软件的组合来实施。各个组件可被包含在可由计算机读取的存储介质，或者其部分可分布在多个计算机中。

产业上的可利用性

尽管已经结合本发明的示例性实施例描述了本发明，但是本领域的技术人员清楚的是，在不脱离本发明的范围和精神的情况下，可以对其进行各种修改和改变。因此，应该理解，上述实施例在所有方面不是限制性的，而是示例性的。

根据本发明示例性实施例的对标志编码的方法、对标志解码的方法及其设备，能够提高在基于多层的可伸缩视频编解码器中使用的各种标志的编码效率。

Claims

1、一种对用于对具有多个块的视频帧编码的标志编码的方法，该方法包括：

根据所述多个块的组的空间相关性收集分别分配给所述多个块的组的标志值以创建标志位串；

使用组大小将标志位串分割为多个分割的位串；

设置指示包括在分割的位串中的所有位是否为0的图样位；

根据设置的图样位对分割的位串执行熵编码。

2、如权利要求1所述的方法，其中，块是片、宏块或子块。

3、如权利要求1所述的方法，其中，组大小是4、8或16中的任何一个。

4、如权利要求1所述的方法，其中，通过将包括在分割的位串的位中的0位与包括在分割的位串中的总位的比率与阈值进行比较来确定组大小。

5、如权利要求4所述的方法，其中，阈值是1/3和4/5。

6、如权利要求5所述的方法，其中，当包括在分割的位串的位中的0位与包括在分割的位串中的总位的比率小于1/3时，确定组大小为0，当包括在分割的位串的位中的0位与包括在分割的位串中的总位的比率大于4/5时，确定组大小为8，在其它情况下，确定组大小为4。

7、如权利要求1所述的方法，其中，标志是残差预测标志或编码的块图样(cbp)标志。

8、如权利要求1所述的方法，其中，图样位被记录在块的头上，并且组大小被记录在片头上。

9、一种对用于对具有多层的视频帧编码的标志编码的方法，该方法包括：

对第一层的块的第一标志值和与第一层的块相应的第二层的块的第二标志值执行异或运算；

根据第一层的块的空间相关性收集运算结果值来创建标志位串；

使用组大小将标志位串分割为多个分割的位串；

设置指示包括在分割的位串中的所有位是否为0的图样位；

根据设置的图样位对分割的位串执行熵编码。

10、如权利要求9所述的方法，其中，第二层低于第一层。

11、如权利要求9所述的方法，其中，块是片、宏块或子块。

12、如权利要求9所述的方法，其中，通过将包括在分割的位串的位中的0位与分割的位串中的总位的比率与阈值进行比较来确定组大小。

13、如权利要求12所述的方法，其中，阈值是1/3和4/5。

14、如权利要求13所述的方法，其中，当包括在分割的位串的位中的0位与分割的位串中的总位的比率小于1/3时，确定组大小为0，当包括在分割的位串的位中的0位与分割的位串中的总位的比率大于4/5时，确定组大小为8，在其它情况下，确定组大小为4。

15、如权利要求9所述的方法，其中，标志是残差预测标志。

16、一种对用于对具有多个块的视频帧编码的标志解码的方法，该方法包括：

从视频流中读取指示包括在标志位串中的所有位是否为0的图样位；

当图样位具有第一位时，将与组大小相应的标志位串设置为0；

当图样位具有第二位时，根据组大小从视频流中读取块的编码的标志位串；

对读取的标志位串执行熵解码。

17、如权利要求16所述的方法，其中，块是片、宏块或子块。

18、如权利要求16所述的方法，其中，从视频流中读取组大小。

19、如权利要求16所述的方法，其中，通过将包括在标志位串的位中的0位与标志位串的总位的比率与阈值进行比较来确定组大小。

20、如权利要求19所述的方法，其中，阈值是1/3和4/5。

21、如权利要求20所述的方法，其中，当包括在标志位串的位中的0位与标志位串的总位的比率小于1/3时，确定组大小为0，当包括在标志位串的位中的0位与标志位串的总位的比率大于4/5时，确定组大小为8，在其它情况下，确定组大小为4。

22、如权利要求16所述的方法，其中，标志是残差预测标志或编码的块图样(cbp)标志。

23、如权利要求16所述的方法，还包括：对在将标志位串设置为0期间设置为0的标志位串与下层的相应的标志位串执行异或运算，或在对读取的标志位串执行熵编码期间的熵解码的标志位串与下层的相应的标志位串执行异或运算。

24、一种对用于对具有多个块的视频帧编码的标志编码的设备，该设备包括：

位串创建单元，根据所述多个块的组的空间相关性收集分别分配给所述多个块的组的标志值以创建标志位串；

位串分割单元，使用组大小将标志位串分割为多个分割的位串；

图样位设置单元，设置指示包括在分割的位串中的所有位是否为0的图样位；

熵编码单元，根据设置的图样位对分割的位串执行熵编码。

25、一种对用于对具有多层的视频帧编码的标志编码的设备，该设备包括：

异或运算单元，对当前层的块的第一标志值和与当前层的块相应的下层的块的第二标志值执行异或运算；

标志位串创建单元，根据当前层的块的空间相关性收集运算结果值来创建标志位串；

位串分割单元，使用组大小分割标志位串；

熵编码单元，根据设置的图样位对分割的位串执行熵编码。

26、一种对用于对具有多个块的视频帧编码的标志解码的设备，该设备包括：

图样位读取单元，从视频流中读取指示包括在位串中的所有位是否为0的图样位；

标志位串设置单元，当图样位具有第一位时，将与组大小相应的标志位串设置为0；

标志位串读取单元，当图样位具有第二位时，根据组大小从视频流中读取块的编码的标志位串；

熵解码单元，对读取的标志位串执行熵解码。

27、一种对用于对具有多层的视频帧编码的标志解码的设备，该设备包括：

熵解码单元，对读取的标志位串执行熵解码。

28、一种包括如权利要求24所述的标志编码设备的视频编码器。

29、一种包括如权利要求25所述的标志编码设备的视频编码器。

30、一种包括如权利要求26所述的标志解码设备的视频解码器。

31、一种包括如权利要求27所述的标志解码设备的视频解码器。