CN1214597A

CN1214597A - 二进制形状编码中的模式编码方法

Info

Publication number: CN1214597A
Application number: CN97121616A
Authority: CN
Inventors: 韩锡源
Original assignee: Daewoo Electronics Co Ltd
Current assignee: Fengye Vision Technology Co., Ltd.
Priority date: 1997-10-14
Filing date: 1997-11-07
Publication date: 1999-04-21
Anticipated expiration: 2017-11-07
Also published as: CN1130920C; GB9723483D0; FR2769784A1; US6049567A; KR100256022B1; JPH11177990A; DE19749604A1; GB2330472A; KR19990031654A; GB2330472B; FR2769784B1

Abstract

基于含多个BAB的当前帧和先前帧对当前帧内二进制α块(BAB)编码中,对当前帧内的BAB亚抽样产生抽样块,基于该抽样块重建一重建BAB,内部模式中,估测重建BAB和BAB的差别,若无差别产生第1模式信号否则产生第2模式信号及误差数据块,交互模式中,还把先前帧内BAB中最相似于当前帧内BAB的检测为预测BAB,并估测BAB和预测BAB的差别,若无差别产生第3模式信号否则产生第四模式信号及误差数据块。

Description

二进制形状编码中的模式编码方法

本发明涉及一种模式编码方法；而且，更具体地，涉及一种二进制形状编码中的模式编码方法。

在诸如电视电话和电话会议系统的数字视频系统中，由于该视频帧信号包括一序列被称作象素值的数字数据，需要大量的数字数据来定义每一视频帧信号。

然而，由于传统传输信道的可用频率带宽是有限的，为了通过其传输大量的数字数据，有必要通过使用各种数据压缩技术来压缩或减少数据量，尤其是如电视电话和电话会议系统的低比特率视频信号编码器的情况下。

此种用于低比特率编码系统的编码视频信号的技术中之一是面向目标的分析-合成编码技术，其中一输入视频图象被分成多个目标；且通过不同的编码信道处理用于定义每一目标的运动、轮廓和象素数据的三组参数。

此种面向目标的编码方法的一例是所谓的MPEG(运动图象专家组)阶段A(MPEG-4)，设计其是为了提供一种音频-视频编码标准用于在诸如低比特率通信、交互多媒体(例如游戏、交互电视等)和地区监视的应用中允许基于内容的交互作用、改进编码效率和/或通用可接近性。

根据MPEG-4，一输入视频图象被分成多个对应于一用户能接入和控制的位流中的实体的视频目标平面(VOP)。一VOP可被称作一个目标，并可由其宽度和高度可以是围绕每一目标的16个象素(一宏块大小)的最小倍数的边界矩形来表示使得编码器可以逐VOP即逐目标地处理输入视频图象。

MPEG-4中所述的一VOP包括形状信息和由亮度和色度数据组成的颜色信息，其中该形状信息由例如二进制掩码表示并相关于亮度数据。在二进制掩码中，用一个二进制值(例如0)来指定位于该VOP中的目标以外的一象素(例如一背景象素)，而用其它二进制值(例如1)表示该目标内部的一象素(例如一目标象素)。

表示该目标的位置和形状的二进制形状信号能被表示为一帧或一VOP内的一个二进制α块(binary alpha block)(BAB)，例如一块16×16的二进制象素，其中每一个二进制象素有一个表示一目标象素或一背景象素的二进制值(例如0或1)。

可通过利用传统的基于位图的形状编码方法给一BAB编码，该方法诸如基于上下文的算术编码(CAE)方法(见MPEG-4 Video VerificationModel Version 7.0，国际标准化组织，移动和相关音频信息的编码，ISO/IEC JTC1/SC29/WG11 MPEG97/N1642,Bristol,1997年4月)。

例如，在一内部模式中，通过使用传统CAE方法给BAB编码以由此产生已编码的BAB。而在一交互模式中，通过运动估计和补偿找到代表当前帧(或VOP)内的BAB和先前帧(或VOP)内的与其最相似的BAB之间位移的运动矢量、以及表示其间位移的误差数据。通过利用传统的CAE方法来编码该误差数据以由此产生已编码误差数据。且然后，将该已编码误差数据和该运动矢量组合以由此产生已编码BAB。

然而，如上述获得的已编码BAB被在一解码器解码成只有预设分辨率的重建图象。因此，如果希望较高分辨率的BAB的图象，则利用其中实现的可量测性来利用传统的方法给BAB编码，它将逐渐提高BAB解码图象的分辨率。这就是，编码代表具有较低分辨率的BAB的图象一基底层；并根据该基底层，加入另外的信息以产生随后被编码的BAB的一加强层。

同时，根据传统二进制形状编码方法，例如CAE方法，来加强其编码效率，编码相应BAB的各种模式信号以由此提供待在逐BAB的基础上经一发送器被发送至一解码器的各自的相应已编码模式信号，而代替编码该BAB内的所有二进制象素值并发送相应的已编码二进制象素值。

详细地说，例如，如果在一帧(或一VOP)内有160×160二进制象素的-图象平面，则存在100个16×16二进制象素的BAB，并且每一个BAB其中包括256个二进制象素。因此，每一个BAB需要256个数据位用以传送代表一BAB内的每一个二进制象素是否是一目标象素或一背景象素的二进制形状信息而在其中无数据丢失。考虑到编码效率这是非常低效的。因而，有必要通过利用该BAB内的二进制象素之间的时间和/或空间相关性来加强BAB的编码效率。

然而，由于通过利用该BAB内的二进制象素之间的时间和/或空间相关性来改进或加强BAB内的编码二进制象素中的编码效率是有限的，就希望通过对代表或表征该BAB的相应编码状况的一模式信号编码来改进编码效率以由此产生并随之发送一相应的已编码模式信号。

例如，假如一BAB内的所有二进制象素都是目标象素，则不对所有此些二进制象素值编码以产生待发送的已编码二进制象素值，而对说明或代表该BAB内的所有二进制象素都是目标象素的一模式信号进行编码以由此产生待发送的一相应的已编码模式信号。通过利用上述的方法，有可能通过发送作为该BAB内256个二进制象素代表的BAB的二进制形状信息的相应的已编码模式信号而提高编码效率。在这方面，以下描述传统的模式编码方法。

根据传统的模式编码方法，在编码一BAB中，将以下说明的7个模式信号中的一个模式信号编码成待传送的一相应的已编码模式信号。以下描述这7个模式信号。

即存在第一模式信号，代表在一交互模式中一运动矢量是0且已执行了一次编码；第二模式信号，代表在一交互模式中，该运动矢量不是0且已执行了一次编码；第三模式信号，代表在-交互模式中，该运动矢量是0且还没有执行该编码；第四模式信号，代表在一交互模式中，该运动矢量不是0且还没有执行该编码；第五模式信号，代表在一内部模式中，已执行了该编码；第六个模式信号，代表该BAB内的所有二进制象素都分别是目标象素；以及第七模式信号，代表该BAB内的所有二进制象素都分别是背景象素(见MPEG-4 VideoVerification Model Version 7.0，国际标准化组织，对移动和相关音频信息的编码，ISO/IEC JTC1/SC29/WG11 MPEG97/N1642,Bristol,1997年4月，第20～21页)。

参考图1，示出了用于在描述二进制形状编码中的传统模式编码方法的内部编码VOP和交互编码VOP。在图1中，显示了一内部编码VOP100和预测编码VOP 110及120。VOP 110包括BAB 111、112和113；而VOP 120包括BAB 121、122和123，其中在每一VOP之内的一阴影区和一非阴影区分别代表一目标和一背景。

由于VOP 100是一内部编码VOP，第5模式信号被分配或被提供给VOP 100之内的每一BAB。由于BAB 111和BAB 113内分别只包括目标象素和只包括背景象素，第7和第6模式信号被分配给VOP 110内的BAB 111和BAB 113。

如果代表VOP 110内的BAB 112和最相似于作为VOP 110的一前一VOP的VOP 100内的BAB 112的一个BAB(下面作为第一预测BAB说明其)之间的位移的相应运动矢量是0，且如果在BAB 112的二进制象素值和该第一预测BAB的相应二进制象素值之间有误差并因此对此误差编码，则第一模式信号被分配给BAB 112。

如果代表VOP 120内的BAB 121和最相似于作为VOP 120的一前一VOP的VOP 110内的BAB 121的一个BAB(下面作为第二预测BAB说明其)之间的位移的相应运动矢量不是0，且如果在BAB 121中的二进制象素值和该第二预测BAB的相应二进制象素值之间有误差并因此对此误差编码，则第二模式信号被分配给BAB 121。

如果代表VOP 120内的BAB 122和最相似于VOP 110内的BAB 122的一个BAB(下面作为第三预测BAB说明其)之间的位移的相应运动矢量是0，且如果在BAB 122中的二进制象素值和该第三预测BAB的相应二进制象素值之间有误差并因此没有对此误差编码，则第三模式信号被分配给BAB 121。

又，如果代表VOP 120内的BAB 123和最相似于VOP 110内的BAB 123的一个BAB(下面作为第四预测BAB说明其)之间的位移的相应运动矢量不是0，且如果在BAB 123中的二进制象素值和该第四预测BAB的相应二进制象素值之间有误差并因此对此误差编码，则第四模式信号被分配给BAB 121。

然而，即使将上述的传统模式编码方法用于基底层编码时该方法可实现极大的性能加强，但当将之用于加强层编码时，由于该方法不能反映加强层编码之中的特性，在改进编码效率上它也是有限的。

因此，本发明的一个主要目的是提供一种二进制形状编码中的模式编码方法，该方法能够进一步提高编码效率。

根据本发明，提供了一种基于包括多个BAB的当前帧和先前帧、对当前帧内的M×N个二进制象素的一个二进制α块(BAB)进行编码的模式编码方法，M和N分别是正整数，其中每一个二进制象素有一代表一目标象素或一背景象素的二进制值，该方法包括以下步骤：(a)根据一个预定的亚抽样规则对当前帧内的BAB进行亚抽样，以由此产生当前帧内的(M/K)×(N/K)二进制象素的一抽样块，其中M和N分别是K的倍数，K是一预定正整数；(b)基于该当前帧内的该抽样块，根据一预定的重建规则，产生M×N个二进制象素的一重建的BAB；(c)估测该重建BAB和当前帧内的BAB之间的差别，如果其间没有差别，则产生第一模式信号用以说明其间没有差别且因此没有对此差别编码；而如果其间有差别，则产生表明其间有差别的第二模式信号并同时产生表示该差别的M×N个二进制象素的第二误差数据块，以被编码成编码第二误差数据块；(d)在交互模式中，根据预定的亚抽样原则对先前帧内的BAB进行亚抽样以由此产生先前帧内的(M/K)×(N/K)二进制象素的多个相应抽样块；(e)在交互模式中，将当前帧内的抽样块和先前帧内的相应抽样块进行比较，并随之检测出在先前帧内相应抽样块中最相似于当前帧内的抽样块的相应第二抽样块作为预测抽样块，以由此产生具有代表当前帧内的抽样块的相应第二抽样块作为预测抽样块，以由此产生具有代表当前帧内的抽样块和该预测抽样块之间的位移的垂直和水平分量的一运动矢量；(f)在交互模式中，根据该运动矢量，在先前帧内的BAB中检测最相似于当前帧的BAB的一BAB作为预测BAB，估测当前帧内的BAB和该预测的BAB之间的差别，如果其间没有差别，产生第三模式信号用以说明其间没有差别，亦因此不对该差别编码；而如果其间有差别，则产生第四模式信号用以说明其间有差别并同时产生代表该差别的M×N个二进制象素的第四误差数据块以被编码为编码第四误差数据块；及(g)如果当前帧内的BAB是在内部模式被编码的，由于第一和第二模式信号之一是在步骤(c)中产生的，则将在步骤(c)中产生的该模式信号提供作被选的模式信号，而如果当前帧内的BAB是在交互模式被编码的，如果第一至第四模式信号中的一个模式信号是产生在步骤(c)和(f)中的，则提供在步骤(c)和(f)中产生的该模式信号作为被选的模式信号，而如果第一至第四模式信号中的两个模式信号是同时产生在步骤(c)和(f)中的，则根据第一预定选择规则选择并提供在步骤(c)和(f)中产生的这两个模式信号之一作为被选的模式信号。

本发明的以上和其它目的和特点将在以下对随附图给出的优选实施例的描述中变得显而易见，其中：

图1显示了用于说明二进制形状编码中的传统模式编码方法的内部编码图象平面和交互编码图象平面；

图2说明了用于解释根据本发明的二进制形状编码中的模式编码方法的其中包括多个二进制α块的一当前帧；

图3A至3I表示块和组成块的行集合，用于描述根据本发明的用以产生BAB的一基底层的亚抽样过程、用以基于该基底层而产生一重建BAB的重建过程、以及一模式编码过程；

图4说明用于描述根据本发明的二进制形状编码中的模式编码方法的内部编码帧和交互编码帧。

根据本发明，提供了一种二进制形状编码中的模式编码方法。图2显示了一当前帧200，其中包括多个二进制α块(BAB)1至16，用于解释根据本发明的二进制形状编码中的模式编码方法，其中，其中的阴影和非阴影区分别代表一目标和一背景。简而言之，通过在对一个二进制形状信号(例如包括BAB1至16的当前帧)的编码中执行模式编码，将一模式信号(或通过对该模式信号编码而产生的每个已编码模式信号)分配或提供给BAB1至16的每一相应的BAB。

图3A至3H表示块和组成块的行集合，用于描述用以产生BAB的基底层的亚抽样过程和用以基于该基底层产生一重建BAB的重建过程，其中黑色部分表示目标象素，白色部分表示背景象素。图3I显示了一误差数据块380，用于描述根据本发明的模式编码方法。又，在图4中，描绘了内部编码帧和交互编码帧，用于描述根据本发明的二进制形状编码中的模式编码方法。参考图2、图3A至3I和图4，以下将描述根据本发明的优选实施例的二进制形状编码中的模式编码方法。

根据本发明，提供了一种根据当前帧和包括多个BAB的先前帧而给当前帧内的M×N个二进制象素的BAB编码中的模式编码方法，M和N分别是正整数，其中每一个二进制象素具有表示一目标象素成一背景象素的一个二进制值。在此应注意到该当前和先前帧可分别被当前视频目标平面(VOP)和先前VOP所代替。为简单起见，在此将只描述给当前帧内的一BAB编码中的模式编码方法。

首先，根据一预定的亚抽样规则为当前帧内的BAB执行亚抽样，以由此产生(M/K)×(N/K)个二进制象素的一抽样块作为当前帧内的一基底层，其中M和N分别是K的倍数，K是一预定的正整数。总之，(1/K)被称为转换率。例如，如果图3A显示的当前帧内的BAB 300的高(M)和宽(N)分别是16，对该BAB 300用转换率(1/2)进行亚抽样或向下抽样(down-sampled)，则如图3B中所示，产生一抽样块310，其高(M)和宽(N)分别是8。

然后，基于当前帧内的该抽样块，根据预定的重建或向上抽样(up-sampling)规则产生当前帧内的M×N个二进制象素的一重建的BAB。例如，基于当前帧内的抽样块310根据一预定重建规则产生图3H中所示的16×16个二进制象素的重建的BAB 370。

可以使用各种亚抽样方法作为预定的亚抽样方法，例如其转换率为1/2的向下抽样方法。至于重建方法，也有若干种公知的方法，包括利用基于上下文的算术编码(CAE)方法的扫描交替方法。参考图3A至3H，以下描述根据本发明的优选实施例的亚抽样方法和重建方法。首先，执行水平亚抽样步骤。即从该BAB的第一或第二水平行开始，对当前帧内的BAB(例如BAB 300)的每隔一水平行进行抽样，以产生(M/2)×N个二进制象素的第一块，其中M和N分别是正偶数，而第一水平行是该BAB的最上面的水平行。

然后，执行一垂直亚抽样步骤。即从第一块的第一或第二垂直行开始对此第一块每隔一垂直行抽样，以由上产生作为一基底层(M/2)×(N/2)个二进制象素的一抽样块，例如如图3B所示的8×8个二进制象素的抽样块310，其中，第一垂直行是第一块的最左边的垂直行。

然后，在将该抽样块的(N/2)个垂直行放置于在该垂直抽样步骤中抽样的垂直行的位置处的条件下，可通过将(N/2)个被重建的垂直行顺序地插在在垂直亚抽样步骤中没有被抽样的垂直行的位置处而产生(M/2)×N个二进制象素的被重建的第一块，其中被重建的垂直行是基于该抽样块的垂直行根据一预定内插规则产生的。

然后，在将此被重建的第一块的(M/2)个水平行放置于在水平亚抽样步骤中抽样的水平行的位置处的条件下，可通过将(M/2)个被重建的水平行顺序地插在水平亚抽样步骤中没有被抽样的水平行的位置处而产生M×N个二进制象素的被重建的第一BAB，其中被重建的水平行是基于该被重建的第一块的水平行根据一预定内插规则产生的。

参考图3C至3H，示出了块和组成块的行集合，用于描述用以基于作为BAB300的基底层的抽样块310根据一预定内插规则而产生被重建的BAB370的重建过程。图3C显示了一垂直行集合320，包括抽样块310的8个垂直行作为8个偶数垂直行V2、V4、…、V16。图3D说明了一垂直行集合330，包括基于垂直行集合320的根据预定内插规则重建的8个奇数垂直行V1、V3、…V15。

又，图3E描绘了8×16个二进制象素的被重建的第一块340，其产生是在将该垂直行集合320的8个垂直行根据如图3C所示的分配予其的索引被顺序地放置于偶数垂直行的位置处的条件下，将该垂直行集合330的8个垂直行根据如图3D所示的分配予其的索引被顺序地插在奇数垂直行的位置处进行的。

图3F显示了一水平行集合350，包括被重建的第一块340的8个水平行作为8个偶数水平行H2、H4、…、H16。图3G说明了一水平行集合360，包括基于水平行集合350根据预定内插规则被重建的8个奇数水平行H1、H3、…、H15。

图3H描绘16×16个二进制象素的被重建的BAB 370，其产生是在将该水平行集合350的8个水平行根据如图3F所示的分配予其的索引被顺序地放置于偶数水平行的位置处的条件下，将该水平行集合360的8个水平行根据如图3G所示的分配予其的索引被顺序地插在奇数水平行的位置处进行的。

然后，估测被重建的BAB和当前帧内的BAB之间的差别。并随之，如果其间无差别，则产生第一模式信号，其中该第一模式信号说明其间无差别、并因此不对此差别编码。如果其间有差别，则产生第二模式信号，其中该第二模式信号说明其间有差别。并且同时产生代表该差别的M×N个二进制象素的第二误差数据块、且又将该第二误差数据块编码成编码第二误差数据块。

详细地说，参考图3I，示出了第二误差数据块380，它说明当前帧内的BAB 370之间的差别。在图3I中，黑色部分代表二进制象素值，例如1，说明在BAB 300中的象素和分别在被重建的BAB 370之间的相同位置处有相应象素之间的差别，而白色部分表示二进制象素值，例如0，说明在BAB中的象素和在被重建的BAB 370中的相同位置处的相应象素之间没有差别。

同时，在交互模式中，为了完成根据本发明的优选实施例的二进制形状编码中的模式编码，还要紧跟着进行以下描述的一个过程。首先，根据一预定亚抽样规则对先前帧内的BAB执行亚抽样，以由此产生先前帧内的(M/K)/(N/K)个二进制象素的多个相应抽样块。

然后，将当前帧内的抽样块和先前帧内的相应抽样块进行比较，并随之将先前帧内相应抽样块中最与当前帧内的抽样块相似的相应抽样块检测为一预测抽样块，以由此产生具有代表当前帧内抽样块和预测抽样块之间的位移的垂直和水平分量的一运动矢量。

在交互模式中，根据该运动矢量，在先前帧内的BAB中检测出最与当前帧内的BAB相似的BAB作为预测BAB，然后估测当前帧内的BAB和此预测的BAB之间的误差。根据本发明的优选实施例，当前帧内的BAB和产生的预测BAB之间的水平和垂直位移分别是运动矢量的水平和垂直分量的2倍。

然后，如果其间没有差别，则产生第三模式信号，其中该第三模式信号说明其间没有差别亦因此不对该差别编码。如果其间有差别，则产生第四模式信号，其中该第四模式信号说明二者之前有差别。同时产生表示该差别的第四误差数据块，且又将此第四误差数据块编码为编码第四误差数据块。

在模式编码中，如果当前帧内的BAB是在内部模式中被编码的，由于产生了第一和第二模式信号之一，则将此产生的模式信号提供作选择模式信号。而如果当前帧内的BAB是在交互模式中被编码的，如果产生了第一至第四模式信号之一的模式信号，则该产生的模式信号被提供作选择模式信号；而如果在第一至第四模式信号中同时产生了二个模式信号，则根据第一预定选择规则选择二个产生的模式信号之一提供作选择模式信号。

以下描述根据本发明的优选实施例的第一预定选择规则。如果同时产生了第一和第三模式信号，则根据第二预定选择规则(例如选择第三模式信号的规则)选择第一和第三模式信号之一作为选择模式信号。如果产生了第一模式信号而没有产生第三模式信号，则即使同时产生了第四模式信号也将第一模式信号选作选择模式信号。

而如果产生了第三模式信号而没有产生第一模式信号，则即使同时产生了第二模式信号也将第三模式信号选作选择模式信号。如果同时产生了第二和第四模式信号，则根据第三预定选择规则，选择第二和第四模式信号之一作为选择模式信号。

第三预定选择规则如下。首先，将第二和第四模式信号编码以由此分别产生编码第二和编码第四模式信号，并且将第二和第四误差数据块编码以由此分别产生编码第二和编码第四误差数据块。并将编码第二和编码第四模式信号与编码第二和编码第四误差数据块组合以由此分别产生编码第二和编码第四加强层数据。

然后，分别计算编码第二和编码第四加强层数据的第二和第四数据位数目；随之，比较第二数据位数目和第四数据位数目，以便如果第二数据位数目等于或小于第四数据位数目则将第二模式信号选作选择模式信号，如果第二数据位数目大于第四数据位数目则将第四模式信号选作选择模式信号。

根据本发明的优选实施例的模式编码方法，例如，将每一选择模式信号(或通过对相应选择模式信号编码获得的每一编码选择模式信号)提供或分配给如图2所示的当前帧内的BAB1至16中的每一相应的BAB。

之后，如果分别选择第一和第三模式信号作为选择模式信号，则将该第一和该第三模式信号分别编码为编码第一和编码第三模式信号，然后将此编码第一和该编码第三模式信号分别提供为编码第一和编码第三加强层。而如果分别选择第二和第四模式信号作为选择模式信号，则将编码第二和编码第四加强层数据分别提供作编码加强层。

上面描述了根据本发明的优选实施例的模式编码方法。在此应注意到该模式编码方法能被应用于二进制形状编码，即加强层编码，而不管该方法的种类如何，例如二进制形状编码的亚抽样方法和重建方法。

图4描绘了用于说明根据本发明的优选实施例的模式编码方法的内部编码帧和交互编码帧。参考图4，以下描述应用于其的模式编码方法。在图4中，I代表一作为基底层的内部编码帧；P1代表一作为加强层的内部编码帧；P2和P3分别代表作为基底层的内部编码帧；而B1和B2分别代表作为加强层的交互编码帧。在图4中，帧I是帧P1的基底层；帧P2和P3分别是帧B1和B2的基底层。

根据本发明的优选实施例的模式编码方法与对帧P1、B1和B2内的BAB编码有关。因此，下面将描述分别将什么模式信号分配给帧P1、B1和B2的BAB。在此应注意到：可以将编码模式信号代替该模式信号分配给帧P1、B1和B2内的BAB。为了简单起见，以下只描述将模式信号分配至其的情形。

在内部模式中，由于帧P1是基于帧I被重建的(参考图4所示的路径1)，第1模式信号或第3模式信号被产生。因而，在其编码模式中第1模式信号或第3模式信号被分配至帧P1内的每一个BAB。将第1至第4模式信号中分配至帧B1内的每一个BAB的一模式信号选作选择模式信号，这是由于帧B1可以基于帧P2(参考图4所示的路径3)或作为帧B1的先前帧的帧P1(参考图4所示的路径2)被重建。

又，在其模式编码中将第1至第4模式信号之一分配给帧B2内的每一BAB，这是由于帧B2能够基于帧P3(参考图4所示的路径5)或作为帧B2的先前帧的帧B1(参考图4所示的路径4)被重建。

如上所述，在对一帧(或一VOP)内的二进制形状信号(例如一BAB)编码中，尤其是二进制形状信号的加强层编码中，根据本发明的模式编码方法能够有效地提高其编码效率。

虽然对本发明的描述只参考了某些优选实施例，在不背离以下权利要求中提出的本发明的精神和范围的前提下，可作其它变化和修改。

Claims

1．一种基于包括多个BAB的当前帧和先前帧、对当前帧内的M×N个二进制象素的一个二进制α块(BAB)进行编码的模式编码方法，M和N分别是正整数，其中每一个二进制象素有一代表一目标象素或一背景象素的二进制值，该方法包括以下步骤：

(a)根据一个预定的亚抽样规则对当前帧内的BAB进行亚抽样，以由此产生当前帧内的(M/K)×(N/K)二进制象素的一抽样块，其中M和N分别是K的倍数，K是一预定正整数；

(b)基于该当前帧内的该抽样块，根据一预定的重建规则，产生M×N个二进制象素的一重建的BAB；

(c)估测该重建BAB和当前帧内的BAB之间的差别，如果其间没有差别，则产生第一模式信号用以说明其间没有差别且因此没有对此差别编码；而如果其间有差别，则产生表明其间有差别的第二模式信号并同时产生表示该差别的M×N个二进制象素的第二误差数据块，以被编码成编码第二误差数据块；

(d)在交互模式中，根据预定的亚抽样原则对先前帧内的BAB进行亚抽样以由此产生先前帧内的(M/K)×(N/K)二进制象素的多个相应抽样块；

(e)在交互模式中，将当前帧内的抽样块和先前帧内的相应抽样块进行比较，并随之检测出在先前帧内相应抽样块中最相似于当前帧内的抽样块的相应第二抽样块作为预测抽样块，以由此产生具有代表当前帧内的抽样块的相应第二抽样块作为预测抽样块，以由此产生具有代表当前帧内的抽样块和该预测抽样块之间的位移的垂直和水平分量的一运动矢量；

(f)在交互模式中，根据该运动矢量，在先前帧内的BAB中检测最相似于当前帧的BAB的一BAB作为预测BAB，估测当前帧内的BAB和该预测的BAB之间的差别，如果其间没有差别，产生第三模式信号用以说明其间没有差别，亦因此不对该差别编码；而如果其间有差别，则产生第四模式信号用以说明其间有差别并同时产生代表该差别的M×N个二进制象素的第四误差数据块以被编码为编码第四误差数据块；

及(g)如果当前帧内的BAB是在内部模式被编码的，由于第一和第二模式信号之一是在步骤(c)中产生的，则将在步骤(c)中产生的该模式信号提供作被选的模式信号，而如果当前帧内的BAB是在交互模式被编码的，如果第一至第四模式信号中的一个模式信号是产生在步骤(c)和(f)中的，则提供在步骤(c)和(f)中产生的该模式信号作为被选的模式信号，而如果第一至第四模式信号中的两个模式信号是同时产生在步骤(c)和(f)中的，则根据第一预定选择规则选择并提供在步骤(c)和(f)中产生的这两个模式信号之一作为被选的模式信号。

2．根据权利要求1的方法，其中该当前和先前帧分别由一当前视频目标平面(VOP)和一先前VOP所代替。

3．根据权利要求1的方法，其中该第1预定选择规则如下：

如果同时产生了第一和第三模式信号，则根据第二预定选择规则选择第一和第三模式信号之一作为选择模式信号。如果产生了第一模式信号而没有产生第三模式信号，则即使同时产生了第四模式信号也将第一模式信号选作选择模式信号，而如果产生了第三模式信号而没有产生第一模式信号，则即使同时产生了第二模式信号也将第三模式信号选作选择模式信号。如果同时产生了第二和第四模式信号，则根据第三预定选择规则，选择第二和第四模式信号之一作为选择模式信号。

4．根据权利要求3的方法，其中该第3预定选择规则如下：

将第二和第四模式信号编码以由此分别产生编码第二和编码第四模式信号，并且将第二和第四误差数据块编码以由此分别产生编码第二和编码第四误差数据块。并将编码第二和编码第四模式信号与编码第二和编码第四误差数据块组合以由此分别产生编码第二和编码第四加强层数据，然后，分别计算编码第二和编码第四加强层数据的第二和第四数据位数目；随之，比较第二数据位数目和第四数据位数目，以便如果第二数据位数目等于或小于第四数据位数目则将第二模式信号选作选择模式信号，如果第二数据位数目大于第四数据位数目则将第四模式信号选作选择模式信号。

5．根据权利要求4的方法，其中第2预定选择规则是：如果第1和第3模式信号同时被产生，则选择第3模式信号作为被选模式信号。

6．根据权利要求5的方法，其中：

如果分别选择第一和第三模式信号作为选择模式信号，则将该第一和该第三模式信号分别编码为编码第一和编码第三模式信号，然后将此编码第一和该编码第三模式信号分别提供为编码第一和编码第三加强层。而如果分别选择第二和第四模式信号作为选择模式信号，则将编码第二和编码第四加强层数据分别提供作编码加强层。

7．根据权利要求6的方法，其中步骤(a)包括下列步骤：

(a1)从该BAB的第1或第2水平行开始对BAB的每隔一个水平行抽样，以产生(M/2)×N个二进制象素的一第1块，其中该第1水平行是该BAB的最上面的水平行；且

(a2)从该第1块的第1或第2垂直行开始，对该第1块的每隔一垂直行抽样，以产生(M/2)×(N/2)个二进制象素的抽样块作为一基底层，其中该第1垂直行是该第1块的最左边的垂直行。

8．根据权利要求7的方法，其中步骤(b)包括以下步骤：

(b1)在将该抽样块的(N/2)个垂直行放置于在步骤(a2)抽样的垂直行的位置处的条件下，可通过将(N/2)个被重建的垂直行顺序地插在步骤(a2)没有被抽样的垂直行的位置处而产生(M/2)×N个二进制象素的被重建的第一块，其中被重建的垂直行是基于该抽样块的垂直行根据一预定内插规则产生的；

(b2)在将此被重建的第一块的(M/2)个水平行放置于步骤(a1)抽样的水平行的位置处的条件下，可通过将(M/2)个被重建的水平行顺序地插步骤(a1)没有被抽样的水平行的位置处而产生M×N个二进制象素的被重建的第一BAB，其中被重建的水平行是基于该被重建的第一块的水平行根据一预定内插规则产生的。

9．根据权利要求8的方法，其中在当前帧内BAB和在步骤(f)中产生的预测BAB之间的水平和垂直距离分别是该运动矢量的水平和垂直分量的2倍。

10．根据权利要求9的方法，其中步骤(a1)是对该BAB的偶数水平行抽样以产生该第一块的步骤，而步骤(a2)是对该第一块的偶数垂直行抽样以产生该抽样块的步骤。

11．根据权利要求10的方法，其中M等于N。

12．根据权利要求11的方法，其中M和N各为16。