CN1221290A - 隔行二进制形状编码方法和装置 - Google Patents

隔行二进制形状编码方法和装置 Download PDF

Info

Publication number
CN1221290A
CN1221290A CN 97122074 CN97122074A CN1221290A CN 1221290 A CN1221290 A CN 1221290A CN 97122074 CN97122074 CN 97122074 CN 97122074 A CN97122074 A CN 97122074A CN 1221290 A CN1221290 A CN 1221290A
Authority
CN
China
Prior art keywords
pattern
data
coding
object block
mvd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 97122074
Other languages
English (en)
Other versions
CN1146245C (zh
Inventor
赵晟烈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fengye Vision Technology Co., Ltd.
Original Assignee
Daewoo Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daewoo Electronics Co Ltd filed Critical Daewoo Electronics Co Ltd
Priority to CNB971220743A priority Critical patent/CN1146245C/zh
Publication of CN1221290A publication Critical patent/CN1221290A/zh
Application granted granted Critical
Publication of CN1146245C publication Critical patent/CN1146245C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供一种用于在逐个场的基础上编码二进制形状信号且能提高编码效率的方法和装置。

Description

隔行二进制形状编码方法和装置
本发明涉及用来编码二进制形状信号的方法和装置,更具体地,涉及用来编码隔行的二进制形状信号的方法和装置。
代表目标的位置和形状的二进制形状信号能够表达为例如一帧(或一VOP)之内的16×16二进制像素的二进制α块(BAB),其中每个二进制象素均有一二进制值,例如代表或者是背景像素或者是目标像素的0或255。使用诸如基于上下文算术编码(CAE)方法的一传统基于比特图的形状编码方法能够对BAB编码。
例如,对于帧内,当前BAB通过使用传统的帧内(intra)CAE方法来编码,其中根据从当前帧选择的一组像素构成的帧内-上下文对当前BAB中的每个像素进行算术地编码。对于帧间,当前BAB可用帧内CAE或帧间(inter)CAE技术来编码,据此CAE技术产生少量编码数据来定。按照帧间-CAE技术,首先计算代表当前BAB和先前帧中包括的每个预定候选BAB之间差值的误差,然后用运动估算技术找到最近似的候选BAB和运动矢量,其中最近似候选BAB代表在候选的BAB之中的产生最少误差的一候选BAB,而运动矢量表示当前BAB和最近似候选BAB之间的位移。此后,根据帧间上下文算术地编码当前BAB中的每个像素,且通过使用例如可变长度编码(VLC)方案编码表示该运动矢量与其运动矢量预测值(MVDP)之间的差的运动矢量差(MVD),其中帧间上下文由两个像素子集构成,一个像素子集选自当前帧之中,而另一个像素子集根据运动矢量从先前帧中选出。需要更详细的CAE技术和MVD,请参考MPEG-4视频验证模型版本7.0,国际标准化组织,运动图象及相关音频信息的编码,ISO/IECJJCL/SC29/WG11  MPEG97/N1642,布里斯托尔,1997年4月。
为进一步增强二进制形状信号的编码效率,为每个BAB分配一个表1中列出的模式信号。
模式1     MVD=0& &   无更新
模式2     MVD!=0& &  无更新
模式3     全为0
模式4     全为255
模式5     帧内-CAE
模式6     MVD=0& &    帧间-CAE
模式7     MVD!=0& &   帧间-CAE
              表1    编码模式
模式1代表BAB的MVD是0,并且能用其最近似候选BAB来代表该BAB,而模式2表示BAB的MVD有一非零值,且能用一最近似候选BAB来代表此BAB。对于模式1的BAB只有模式信号被编码,而模式2的BAB由模式信号和其MVD来代表。在确定“没有更新”的过程中,由最近似BAB的每个像素与当前BAB中其相应像素之间的差形成差值BAB,并检验差值BAB中包括的4×4像素的任何4×4子块的误差是否小于预定阈值,子块的误差是例如子块中绝对像素值之和。如果所有子块的误差值等于或小于此阈值,则依据其MVD的值宣布BAB为模1或2。
类似地,如果在BAB中的像素都变为0时任何4×4子块的误差等于或小于阈值,将BAB编码为“全为0”模式,即模式3。如果在BAB中的像素都变为255时任何4×4子块的误差等于或小于阈值,则将BAB编码为“全为255”模式,即模式4。对于模式3或4的BAB,只为BAB编码模式信号。当BAB不属于模式1到4中的任何一个时,采用“帧内-CAE”或“帧间-CAE”来编码BAB,其中模式5的BAB由模式信号和帧内-CAE编码的BAB数据来代表。模式6的BAB由模式信号和帧间-CAE编码的BAB数据来表示;而模式7的BAB由模式信号、帧间-CAE编码的BAB数据和MVD来表示。
在MPEG-4中,已在逐个帧的基础上而不是在逐个场的基础上编码二进制形状信号中提出上述模式确定方案,但其中没有公开能够对二进制形状信号进行编码的方法及装置。在逐帧的基础上编码二进制形状信号时,如果一帧或VOP内目标的运动相当大则会降低编码效率。参照图1A到1C,说明了分别代表场中和帧中的具有较大运动的目标。
图1A表示顶部场;图1B表示底部场;而图1C表示二进制形状信号中的一帧,其中这些场和该帧中的每个方块是一个像素,一阴影方块为目标中的一像素,而一空白方块为背景中的一像素。通过一行一行地排列每个场行构成该帧,也就是例如将顶部场的各行放在具有第0到第(2N-1)行的帧中偶数行处,而将底部场的各行放在帧中奇数行处,每个场有N行,N为正整数。传统的采用逐行编码方法的二进制形状信号编码技术在逐个帧的基础上编码二进制形状信号。然而,当帧中目标的运动很大时,如图1A到1C所示,对其空间相关性很低的二进制形状信号进行编码会导致很差的编码效率。
由此可见,已有技术参考文献没有公开能够在一场的基础之上编码二进制形状信号的方法和装置。
因此,本发明的主要目的是提供一种用于编码二进制形状信号的方法和装置。
本发明的另一目的是提供一种用于在逐个场的基础上编码二进制形状信号且能提高编码效率的方法和装置。
按照本发明的一个方面,提供一种编码二进制形状信号的目标块的方法,其中二进制形状信号包括多个画面,而每个画面分为多个M×N各具有第一和第二二进制值中的一个的像素的块,目标块代表要编码的当前画面的一个块,M和N分别为正整数;该方法包括下列步骤:(a)如果目标块相对于第一基准块的误差不大于预定阈值则确定第一模式为该目标块的模式,而如果目标块相对于第二基准块的误差不大于此阈值则确定第二模式为该目标块的模式,各个基准块有M×N个像素,并且第一和第二基准块的所有像素分别是第一和第二二进制值;(b)如果在步骤(a)中第一和第二模式都没有被确定,则相对于当前画面的一个或多个先前的画面运动估算和补偿此目标块,由此产生包括一运动矢量的运动矢量信息和一运动补偿块,该运动补偿块包括该目标块的最近似块;(c)计算目标块和最近似块之间的运动补偿误差(MCE)及该运动矢量和其预测值之间的运动矢量差(MVD);(d)如果MVD不为零则编码MVD,以便提供编码的MVD数据;(e)如果MVD等于零且MCE不大于阈值则将第三模式设置为目标块的模式,而如果MVD不为零且MCE不大于所比较的阈值则将第四模式设置为目标块的模式;(f)如果在步骤(d)中第三和四模式都没有确定为目标块的模式,则产生帧内编码的数据和帧间编码的数据,该帧内编码的数据是通过根据当前画面的预定像素编码目标块的像素而产生的,而该帧间编码的数据则是根据当前画面中包括的预设像素和运动补偿块对目标块的像素进行编码而提供的;(g)比较帧内编码的数据的比特数和帧间编码的数据的比特数;(h)如果帧内编码的数据的比特数不大于帧间编码的数据的比特数,则确定第五模式为目标块的模式;及(i)如果在步骤(h)中没有确定第五模式,则如果MVD为零将第六模式设置为目标块的模式,而如果MVD不为零,将第七模式设置为目标块的模式。
按照本发明的另一方面,提供一种编码二进制形状信号的目标块的装置,其中二进制形状信号包括多个画面,每个画面分为各多个M×N具有第一和第二二进制值中的一个的像素的块,目标块代表要编码的当前画面的一个块,M和N分别为正整数;该装置包括:模式检测装置,对目标块作出响应,用来如果该目标块相对于第一和第二基准块的误差都不大于预定阈值时分别产生类型1和类型2的第一指示信号,各个基准块有M×N像素,并且第一和第二基准块的所有像素分别是第一和第二二进制值;重建装置,用来重建编码的二进制形状信号,由此产生并存储该重建的二进制形状信号;运动估算和补偿装置,用来相对于与当前画面的一个或多个先前画面相对应的重建的二进制形状信号来运动估算该目标块,由此产生运动矢量信息和运动补偿块,该运动矢量信息包括一运动矢量,而该运动补偿块包括该目标块的最近似块;模式选择装置,用来计算该目标块和该最近似块之间的运动补偿误差(MCE),且如果MCE不大于阈值时产生第二指示信号;运动矢量差(MVD)确定装置,用来计算该运动矢量和其预测值之间的MVD,并编码该MVD,以产生编码的MVD数据;编码装置,响应于该目标块、运动补偿块和重建的二进制形状信号,用来对该目标块分别进行帧内和帧间编码,以产生帧内和帧间编码的数据,由此根据帧内和帧间编码的数据的比特数选择帧内和帧间编码的数据中的一个,并且如果选择帧内编码的数据则提供类型3的第三指示信号,如果选择帧间编码的数据则提供类型4的第三指示信号;格式化装置,响应于该MVD、编码的MVD数据、编码的数据及指示信号,用来确定该目标块的模式并根据确定的模式产生编码的目标块数据。
根据下面参照附图给出的对优选实施例的说明,本发明的上述及其它目的和特征将变得显而易见:
图1A、1B及1C分别说明二进制形状信号的顶部场、底部场和一帧;
图2说明按照本发明的隔行二进制形状信号编码装置。
图3表示按照本发明的场BAB的运动估算过程;及
图4A和4B提供表示按照本发明的编码过程的流程图。
按照本发明,提供一种用来在逐个画面的基础上有效地编码二进制形状信号的方法和装置,其中一个画面表示一帧场。在本发明的优选实施例中,将一画面视作一场,将参照在逐个场基础上编码二进制形状信号来说明本发明,以便适应目标的大量运动。二进制形状信号包括一先前帧的和一当前帧,将该先前帧分为一先前顶部和一先前底部场。而将该当前帧分为一当前顶部和一当前底部场。按照本发明的方法和装置按该先前顶部场、先前底部场、当前顶部场及当前底部场的顺序处理这些场。每个场分割为P×Q二进制像素块,P和Q都是正整数,其中每个块被称为顶部场BAB或底部场BAB。在本发明优选实施例中,P和Q都设置为16,而在另一优选实施例中,P和Q分别设置为8和16。
参照图2,说明按照本发明用于编码隔行的二进制形状信号的装置。当前顶部场BAB数据或当前底部场BAB数据被提供给场BAB模式检测单元10,其中当前顶部场BAB数据包含当前顶部场BAB的二进制像素数据;而当前底部场BAB数据包含当前底部场BAB的二进制像素数据。在二进制像素数据中,目标和背景像素分别由例如255和0的二进制数来表示。
场BAB模式检测单元10检查当前场BAB的编码模式是否为“全为0”或“全为255”。具体地说,当前场BAB分割为T×S像素,例如4×4像素,T和S都是正整数,其中第一实施例中16×16像素的场BAB在其中包括4×4的子块,而8×16像素的场BAB包括2×4的子块。如果当前场BAB的任何子块与全为0场BAB的子块之间的误差小于或等于预定阈值,则类型1的指示信号S1从场BAB模式检测单元10提供给格式化单元60中的模式确定单元62,所谓类型1表示当前场BAB的编码模式为“全为0”,其中全为0场BAB是其内每个像素值均为0的场BAB。如果当前场BAB的任何子块与全为255场BAB的子块之间的误差小于或等于预定阈值,则表示当前场BAB的编码模式是“全为255”的类型2的指示信号S1从场BAB模式检测单元10提供给模式检测单元62,其中全为255的场BAB是其每个像素值均为255的场BAB。
如果确定当前场BAB的编码模式既不是“全为0”也不是“全为255”,则场BAB模式检测单元10将当前场BAB数据经线L10提供给场BAB模式选择单元20、运动估算和补偿单元30中的运动估算单元32及场重建单元70中的第一多路复用器(MUX)72。还经线L30从运动估算和补偿单元30中的运动补偿单元34向场BAB模式选择单元20提供运动补偿的场BAB数据。将分别针对当前场BAB对应于顶部场BAB和底部场BAB两种不同情况来说明运动估算和补偿过程。
在场重建单元70中的场存储器74中,存储重建的场数据,其中重建的场数据表示有关正好在当前场之前的两个先前编码的场的信息。如果当前场BAB是当前顶部场中包含的顶部场BAB,则运动估算单元32经线L70从场存储器74中提取重建的先前顶部场数据和重建的先前底部场数据;而如果当前场BAB是当前底部场中包含的底部场BAB,则运动估算单元32经线L70从场存储器74中提取重建的先前底部场数据和重建的当前顶部场数据。当前场BAB数据还经线L10从场BAB模式检测单元10提供给运动估算单元32。
参照图3,说明按照本发明的优选实施例的运动估算和补偿过程。当前帧100包括当前顶部场110和当前底部场120,而先前帧200包括先前顶部场210和一先前底部场220。
如果当前场BAB是当前顶部场110中包含的顶部场BAB,例如当前顶部场BAB112,则运动估算单元32检测先前底部场220中的第一先前底部场BAB222,其中第一先前底部场BAB222位于该先前底部场220中与当前顶部场110中当前顶部场BAB112相同的位置。然后在先前底部场220中形成的第一先前底部检索区226中以逐个像素为基础地位移当前顶部场BAB112,其中第一先前底部检索区226有包括第一先前底部场222的多个候选场BAB。在各位移处,计算当前顶部场BAB112与相应候选场BAB之间的误差。
并且然后运动估算单元32检测先前顶部场210中的先前顶部场BAB212,其中先前顶部场BAB212位于与当前顶部场BAB112相同的位置。然后在前顶部场210中形成的先前顶部检索区214中以逐个像素为基础地位移当前顶部场BAB112,其中先前顶部检索区214有包括先前顶部场BAB212的多个候选场BAB。在各位移处,也计算当前顶部场BAB112与相应候选场BAB之间的误差。
类似地,如果当前场BAB是当前底部场120中包含的底部场BAB,例如当前底部场BAB122,则运动估算单元32检测当前顶部场110中的当前顶部场BAB114,其中当前顶部场BAB114位于与当前底部场BAB122相同的位置,然后,在当前顶部场110中形成的当前顶部检索区116之中以逐个像素为基础地位移当前底部场BAB122,其中当前顶部检索区116有包括当前顶部场BAB114的多个候选场BAB。在各位移处,计算当前底部场BAB122与相应候选场BAB之间的误差。
且然后运动估算单元32检测先前底部场220中的先前底部场BAB224,其中先前底部场BAB224位于与当前底部场BAB122相同的位置。然后在先前底部场220中形成的第二先前底部检索区228之中以逐个像素为基础地位移当前底部场BAB122,其中第二先前底部检索区228有包括先前底部场BAB224的多个候选场BAB。在各位移处,也计算当前底部场BAB与相应候选场BAB之间的误差。
如上述,运动估算单元32相对于当前场BAB的两先前场来执行该当前场BAB的运动估算,并选择产生最小误差的候选场BAB作为最优候选场BAB或最近似场BAB。运动估算单元32的输出是当前运动矢量和场指示标志,它们经线L34引入运动矢量差值(MVD)确定单元40中的运动矢量存储器(MV存储器)42和运动矢量差值计算单元44以及运动补偿单元34,其中当前运动矢量表示当前场BAB和最优候选场BAB之间的位移,而场指示标志表示最优候选场BAB所属于的场。
运动补偿单元34经线L72从场存储器74提取带边场BAB数据,其中带边界BAB数据代表最优候选场BAB和其周围1个像素宽度的边界上的像素;并经线L30将作为运动补偿的场BAB数据的带边场BAB数据提供给场BAB模式选择单元20及第一MUX72。
MVD计算单元44,响应于经线L34从运动估算单元32传来的当前运动矢量和场指示标志,从MV存储器42中提取运动矢量预测值,其中运动矢量预测值是按上文中MPEG-4确定的当前场BAB的预设相邻场BAB中一个的运动矢量。然后计算当前运动矢量和相应运动矢量预测值之间的运动矢量差值(MVD)。MVD和场指示标志被提供给运动矢量差值确定单元40中的MVD编码单元46和模式确定单元62。
当且仅当MVD有非零值时MVD编码单元46编码来自MVD计算单元44的此MVD以及场指示标志,并且如果有一个的话,将编码的MVD和作为编码的MVD数据的编码场指示标志经线L40提供给基于上下文算术编码(CAE)单元50中的帧间比特计算单元54-2和选择单元58以及格式化单元60中的第二多路复用器(MUX)66,其中CAE单元50包括帧内-CAE和帧间-CAE单元52-1及52-2,帧内-比特和帧间-比特计算单元54-1和54-2,比较器56和选择单元58。
同时,响应于在线L10上传来的当前场BAB数据和在线L30上传来的运动补偿的场BAB数据,场BAB模式选择单元20将当前场BAB和运动补偿的场BAB中包括的最优候选场BAB分为4×4像素的子块。如果当前场BAB中的任何子块与最优候选场BAB中其相应子块之间的误差小于或等于预定阈值,则场BAB模式选择单元产生一指示信号S2,它表示当前BAB场不必被编码,并将此信号提供给模式确定单元62。
如果当前场BAB中各个子块与最优候选场BAB中它们相应的子块之间的任何误差大于预定阈值,则场BAB模式选择单元20将当前场BAB数据提供给帧内-CAE单元52-1和帧间-CAE单元52-2,而将运动补偿的场BAB数据提供给帧间-CAE单元52-2。
帧内-CAE单元52-1根据当前场BAB本身和自第一MUX72在线L76上传送来的位于其周围的预先重建的场BAB产生该当前场BAB中每个像素的帧内上下文,并根据产生的帧内上下文,使用传统帧内-CAE技术对当前场BAB编码。当前场BAB的帧内-CAE数据被供给帧内-比特计算单元54-1和选择单元58。
帧内-比特计算单元54-1计算帧内-CAE数据的比特数,并将计算的比特数供给比较器56。
帧间-CAE单元52-2根据在线L76上传来的先前重建的场BAB和来自场BAB模式选择单元20的运动补偿的场BAB产生当前场BAB中每个像素的帧间上下文;并根据传统的帧间-CAE技术对当前场BAB编码。当前场BAB的帧间-CAE数据被供给帧间-比特计算单元54-2和选择单元58。
帧间比特计算单元54-2响应于在线L40上传来的编码的MVD数据和来自帧间-CAE单元52-2的帧间-CAE数据,计算编码的MVD数据和帧间-CAE数据组合的比特数,并将计算的比特数提供给比较器56。
比较器56将帧内-CAE数据的比特数与帧间-CAE数据和编码的MVD数据的比特数相比较。如果帧内-CAE数据的比特数小于帧间-CAE数据和编码的MVD数据的比特数,则比较器56将类型3的指示信号S3提供给选择单元58和模式确定单元62;而如果不是这样,则比较器56将类型4的指示信号S3提供给选择单元58和模式确定单元62。
选择单元58响应类型3或类型4的指示信号S3选择或者帧内-CAE数据或者帧间-CAE数据及编码的MVD数据,由此提供选择的结果给格式化单元60中的第二MUX66。
模式确定单元62根据分别来自场BAB模式检测单元10、场BAB模式选择单元20、比较器56和MVD计算单元44的指示信号S1、S2、S3和MVD来确定当前场BAB的编码模式,并将确定的模式信号提供给格式化单元60中的模式编码单元64和第二MUX66及第一MUX72。表2表示按照发明如何确定当前场BAB的编码模式。
    S1     S2     S3     MVD 模式
    ×     ○     ×     =0 模式1
    ×     ○     ×     ≠0 模式2
 类型1     ×     ×     × 模式3
 类型2     ×     ×     × 模式4
    ×     ×  类型3  =0或≠0 模式5
    ×     ×  类型4     =0 模式6
    ×     ×  类型4     ≠0 模式7
                  表2确定编码模式
具体地,当存在S2且MVD=0时确定当前场BAB为模式1,当存在S2且MVD≠0时,为模式2;当存在类型1的S1时,为模式3;当存在类型2的S1时,为模式4;当不管MVD的值而存在类型3的S3时,为模式5;当存在类型4的S3且MVD=0时,为模式6;当存在类型4的S3且MVD≠0时,为模式7,其中参照记号“×”表示相应信号不适用。
第一MUX72响应来自模式确定单元62的模式信号,重建与当前场BAB对应的场BAB数据。换言之。第一MUX72响应模式3信号将全为0场BAB经线L76提供给场存储器74;响应模式4信号,提供全为255场BAB;响应模式5、6或7信号,提供当前场BAB;以及响应模式1或2信号,提供最优候选场BAB。
模式编码单元64例如通过使用传统VLC技术来编码来自模式确定单元62的模式信号,并将编码的模式信号提供给第二MUX66。
响应来自模式确定单元62的模式信号,第二MUX66选择地多路复用输入给它的信号,并将多路复用的信号作为编码的当前场BAB数据提供给用来发射的发射器(未示出)。编码的当前场BAB数据在模式1或2信号的情况下是编码的模式信号和编码的MVD数据;在模式3或4信号的情况下仅是编码的模式信号;在模式5信号的情况下是帧内-CAE数据;而在模式6或7信号的情况下是编码的模式信号、帧间-CAE数据及编码的MVD数据。请注意当在模式1或6的情况下MVD等于零时编码的MVD数据包括编码的场指示信号。
参照图4A和4B,说明按照本发明的以场为基础编码二进制形状信号的程序。在步骤S1,判断当前场BAB中的像素能否由全为255或全为0的像素来表示,然后在步骤S2,如果当前场BAB中的全部像素能由0来代表则确定当前场BAB的模式为模式3;而如果全部像素由255来代表则为模式4,同在图2所示场BAB模式检测单元10处所作一样。如果当前场BAB的模式被确定是模式3或4,在步骤S3编码该模式信号,通过发射此编码的模式信号终止此程序。
如果在步骤S1判断的结果是否定的,则程序进到步骤S4,其中在图2中的运动估算和补偿单元30中进行当前场BAB的运动估算和补偿,由此产生运动补偿的场BAB、当前运动矢量及场指示标志(FIF)。在步骤S5,在场BAB模式选择单元20中计算运动补偿误差(MCE)和MVD,其中MCE表示当前场BAB和运动补偿的场BAB中包括的最优候选场BAB之间的误差。
在步骤S6,将MCE与预定阈值(TH)相比较;并且如果MCE等于或小于TH,则程序进到步骤S7。在步骤S7,如果MVD是零则确定当前场BAB的模式为模式1,如果不是则为模式2。在步骤S8,检查当前场BAB的模式是模式1还是模式2。如果发现已将模式1分配给当前场BAB,则在步骤S9编码在步骤S4产生的模式1信号和FIF,然后程序终止。如果发现当前场BAB的模式是模式2,则在步骤S10编码模式2信号、FIF和MVD,然后发射编码的数据终止该程序。
参照步骤S6,如果判断MCE大于TH,程序经节点B进到步骤S11。在步骤S11,通过帧内-CAE和帧间-CAE编码方案对当前场BAB进行编码,并生成对应帧内-CAE数据的比特数和帧间-CAE数据的比特数,如同参照图2所示帧内-CAE和帧间-CAE单元52-1、52-2及帧内一比特计算和帧间-比特计算单元54-1、54-2所述的一样。如果在步骤S12判定帧内-CAE比特数等于或小于帧间-CAE比特数,则程序进到步骤S13,而如果不是这样则进到步骤S15。
在步骤S13,将当前场BAB的模式设置为模式5,而在步骤S14,编码该模式5信号,而后发射编码的模式信号和帧内-CAE数据来终止此程序。在步骤S15,如果MVD等于0则确定当前场BAB的模式为模式6,而如果不是这样则为模式7,而后程序进到步骤S16。在步骤S16,检查该模式是否为6。如果在步骤S16该模式被确定为6,则在步骤S17该模式6信号和FIF与帧间-CAE数据一起被编码和发射,而后程序终止。另一方面,如果发现当前场BAB的模式是模式7,则程序进到步骤S18。最终在步骤S18,模式7信号、FIF和MVD与帧间-CAE数据一起被编码并被发送到发射器,而后程序终止。
尽管本发明已通过参照在逐个场的基础上编码二进制形状信号得到了说明,但同样的方法可以延伸到在逐个帧的基础上编码二进制形状信号。在这样的情况下,参照代替两先前场的一先前帧来进行运动估算和补偿过程。
本发明仅针对某些优选实施例来加以说明,只要不偏离如下面权利要求书中提出的本发明的精神和范围可以做出其他修改和变化。

Claims (20)

1、一种用来编码二进制形状信号的目标块的方法,其中二进制形状信号包括多个画面,而每个画面分为多个M×N像素块,各像素具有第一和第二二进制值中的一个,目标块代表要编码的当前画面的这些块中的一个,M和N分别为正整数,该方法包括下列步骤:
(a)如果该目标块相对于第一基准块的误差不大于预定阈值则确定第一模式为该目标块的模式,而如果该目标块相对于第二基准块的误差不大于此阈值则确定第二模式为该目标块的模式,各个基准块有M×N个像素,并且第一和第二基准块的所有像素分别是第一和第二二进制值;
(b)如果在步骤(a)中第一和第二模式都没有被确定,则相对于该当前画面的一个或多个先前画面对此目标块运动估算和补偿,由此产生包括一运动矢量的运动矢量信息和一运动补偿的块,该运动补偿的块包括该目标块的一最近似块;
(c)计算该目标块和该最近似块之间的运动补偿误差(MCE)及该运动矢量和其预测值之间的运动矢量差(MVD);
(d)如果该MVD不为零则编码该MVD,以提供编码的MVD数据;
(e)如果该MVD等于零且该MCE不大于阈值则将第三模式设置为该目标块的模式,而如果该MVD不为零且该MCE不大于该阈值则将第四模式设置为该目标块的模式;
(f)如果在步骤(e)中第三和第四模式都没有被确定为该目标块的模式,则产生帧内编码的数据和帧间编码的数据,该帧内编码的数据是通过根据当前画面的预定像素编码该目标块的像素而产生的,而该帧间编码的数据则是根据当前画面中包括的预设的像素和该运动补偿的块对该目标块的像素进行编码而提供的;
(g)比较该帧内编码的数据的比特数和该帧间编码的数据的比特数;
(h)如果该帧内编码的数据的比特数不大于该帧间编码的数据的比特数,则确定第五模式为该目标块的模式;及
(i)如果在步骤(h)中没有确定第五模式,则如果该MVD为零将第六模式设置为该目标块的模式,而如果该MVD不为零,将第七模式设置为该目标块的模式。
2、按照权利要1的方法,步骤(i)之后还包括下列步骤:
(j)编码该目标块的模式以产生一编码的模式信号;及
(R)根据其模式产生编码的该目标块数据。
3、按照权利要求2的方法,其中编码的该目标块数据包括编码的模式信号,并且还包括第四模式的编码的MVD数据;第五模式的帧内编码的数据;第六模式的帧间编码的数据和第七模式的编码的MVD数据。
4、按照权利要求3的方法,其中通过基于帧内上下文的算术编码(CAE)方法提供该帧内编码的数据。
5、按照权利要求4的方法,其中通过帧间-CAE方法提供该帧间编码的数据。
6、按照权利要求5的方法,其中一个画面对应一帧。
7、按照权利要求6的方法,其中参照该当前帧的一先前帧进行运动估算和补偿步骤(b)。
8、按照权利要求5的方法,其中一个画面对应一个场。
9、按照权利要求8的方法,其中参照该当前场的两先前场进行运动估算和补偿步骤(b)。
10、按照权利要求9的方法,其中步骤(b)中的运动矢量信息还包括指示包括该运动补偿的块的场的场指示标志。
11、按照权利要求10的方法,其中编码步骤(d)包括对该场指示标志进行编码以产生一编码的标志信号的步骤(d1)。
12、按照权利要求11的方法,其中在步骤(h)中,如果帧内-编码的数据的比特数不大于帧间-编码的数据、编码的MVD数据和编码的标志信号的组合比特数,则判定为第五模式。
13、一种用来编码二进制形状信号的目标块的装置,其中二进制形状信号包括多个画面,而每个画面分为多个M×N像素块,各像素具有第一和第二二进制值中的一个,目标块代表要编码的当前画面的这些块中的一个块,M和N分别为正整数,该装置包括:
模式检测装置,对目标块作出响应,用来在该目标块相对于第一和第二基准块的误差都不大于预定阈值时分别产生类型1和类型2的第一指示信号,各自基准块有M×N个像素,并且第一和第二基准块的所有像素分别是第一和第二二进制值;
重建装置,用来重建一编码的二进制形状信号,由此产生并存储该重建的二进制形状信号,其中该重建的二进制形状信号包括预先编码的画面;
运动估算和补偿装置,用来相对于与当前画面的一个或多个先前的画面相对应的该重建的二进制形状信号来运动估算该目标块,由此产生运动矢量信息和一运动补偿的块,该运动矢量信息包括一运动矢量,而该运动补偿的块包括该目标块的一最近似块;
模式选择装置,用来计算该目标块和该最近似块之间的运动补偿误差(MCE),并在MCE不大于该阈值时产生第二指示信号;
运动矢量差(MVD)确定装置,用来计算该运动矢量和其预测值之间的MVD,并编码该MVD,以产生编码的MVD数据;
编码装置,响应于该目标块、运动补偿的块和重建的二进制形状信号,用来对该目标块分别进行帧内和帧间编码,以产生帧内和帧间编码的数据,由此根据该帧内和帧间编码的数据的比特数来选择帧内和帧间编码的数据中的一个,并且如果选择帧内编码的数据则提供类型3的第三指示信号,如果选择帧间编码的数据则提供类型4的第三指示信号;
格式化装置,响应于该MVD、编码的MVD数据、编码的数据及这些指示信号,用来确定该目标块的模式并根据确定的模式产生编码的目标块数据。
14、按照权利要求13的装置,其中MVD确定装置包括:
用来存储当前画面的预先编码的块的运动矢量的装置;
用来从存储装置中取出存储的运动矢量之一作为该目标块的运动矢量的预测值,由此计算MVD的装置;
用来编码该MVD以提供编码的MVD数据的MVD装置。
15、按照权利要求14的装置,其中编码装置包括:
帧内编码装置,用来根据与当前画面对应的重建的二进制形状信号中一部分中包括的像素,对该目标块进行帧内编码,由此产生帧内编码的数据;
帧间编码装置,根据重建的二进制形状信号的该部分中包括的像素和该运动补偿的块,对该目标块进行帧间编码,由此产生帧间编码的数据;
用来发现该帧内编码的数据的比特数的装置;
用来计算该帧间编码的数据的比特数和该编码的MVD数据的比特数之和的装置;
用来比较该帧内编码的数据的比特数和该和值,从而如果该和值大于该帧内编码的数据的比特数,就产生类型3的第3指示信号;如果不是这样,就产生类型4的第3指示信号的装置;及
选择装置,响应类型3的第3指示信号,选择帧内编码的数据为该编码的数据;响应类型4的第3指示信号,选择该帧间编码的数据为该编码的数据。
16、按照权利要求15的装置,其中格式化装置包括:
判定装置,用来响应第1到第3指示信号及MVD,确定该目标块的模式,其中如果接收到类型1的第一指示信号,确定第1模式为该目标块的模式,如果接收到类型2的第1指示信号,确定第2模式为该目标块的模式,如果接收到第2指示信号且MVD为零,确定第3模式为该目标块的模式,如果接收到第2指示信号且MVD不为零,确定第4模式为该目标块的模式,如果接收到类型3的第3指示信号,确定第5模式为该目标块的模式,如果接收到类型4的第3指示信号且MVD为零,确定第6模式为该目标块的模式,如果接收到类型4的第3指示信号且MVD不为零,确定第7模式为目标块的模式;
用来编码该目标块的模式,以提供一个编码的模式信号的装置;及
供给装置,用来响应该确定的模式、编码的数据和编码的模式信号,产生编码的目标块的数据,其中如果确定的模式为第1、第2和第3模式中的1个,生成编码的模式信号作为该编码的目标块数据,如果确定的模式为第4模式,生成编码的模式信号和编码的MVD数据作为该编码的目标块数据,如果确定的模式是第5和第6模式中任何一个,生成编码的模式信号和编码的数据作为该编码的目标块数据,如果确定的模式为第7模式,生成编码的模式信号、编码的MVD数据和编码的数据作为该编码的目标块数据。
17、按照权利要求16的装置,其中一个画面对应一个场,且该目标块参照当前场的两先前场而被运动估算。
18、按照权利要求17的装置,其中该运动矢量信息还包括一表示包括该最近似块的一个场的场指示标志。
19、按照权利要求18的装置,其中MVD装置包括用来编码该场指示标志,以提供编码的标志信号的装置。
20、按照权利要求19的方法,其中如果确定的模式对应于第3、第4、第6或第7模式,该编码的目标块数据还包括该编码的标志信号。
CNB971220743A 1997-12-22 1997-12-22 隔行二进制形状编码方法和装置 Expired - Fee Related CN1146245C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB971220743A CN1146245C (zh) 1997-12-22 1997-12-22 隔行二进制形状编码方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB971220743A CN1146245C (zh) 1997-12-22 1997-12-22 隔行二进制形状编码方法和装置

Publications (2)

Publication Number Publication Date
CN1221290A true CN1221290A (zh) 1999-06-30
CN1146245C CN1146245C (zh) 2004-04-14

Family

ID=5176663

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB971220743A Expired - Fee Related CN1146245C (zh) 1997-12-22 1997-12-22 隔行二进制形状编码方法和装置

Country Status (1)

Country Link
CN (1) CN1146245C (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100396107C (zh) * 2004-12-13 2008-06-18 武汉大学 一种对视频序列中每一帧图像进行标记的方法
CN101778286B (zh) * 2003-09-07 2012-05-30 微软公司 隔行扫描视频的编码与解码
CN101754012B (zh) * 2004-10-14 2012-06-20 英特尔公司 采用自适应搜索策略的快速多帧运动估计方法
WO2013040994A1 (zh) * 2011-09-23 2013-03-28 中兴通讯股份有限公司 一种运动矢量二次压缩编解码方法及装置
CN107529710A (zh) * 2011-06-16 2018-01-02 Ge视频压缩有限责任公司 解码器、编码器、解码和编码视频的方法及存储介质
US10645388B2 (en) 2011-06-16 2020-05-05 Ge Video Compression, Llc Context initialization in entropy coding

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101778286B (zh) * 2003-09-07 2012-05-30 微软公司 隔行扫描视频的编码与解码
CN101848386B (zh) * 2003-09-07 2012-06-06 微软公司 隔行扫描视频的编码与解码
CN101411195B (zh) * 2003-09-07 2012-07-04 微软公司 隔行扫描视频的编码与解码
CN101931802B (zh) * 2003-09-07 2013-01-23 微软公司 隔行扫描视频的编码与解码
CN101754012B (zh) * 2004-10-14 2012-06-20 英特尔公司 采用自适应搜索策略的快速多帧运动估计方法
CN100396107C (zh) * 2004-12-13 2008-06-18 武汉大学 一种对视频序列中每一帧图像进行标记的方法
US10630987B2 (en) 2011-06-16 2020-04-21 Ge Video Compression, Llc Entropy coding supporting mode switching
US10440364B2 (en) 2011-06-16 2019-10-08 Ge Video Compression, Llc Context initialization in entropy coding
CN107529710A (zh) * 2011-06-16 2018-01-02 Ge视频压缩有限责任公司 解码器、编码器、解码和编码视频的方法及存储介质
CN107529704A (zh) * 2011-06-16 2018-01-02 Ge视频压缩有限责任公司 解码器、编码器、解码和编码视频的方法及存储介质
US10148962B2 (en) 2011-06-16 2018-12-04 Ge Video Compression, Llc Entropy coding of motion vector differences
US10230954B2 (en) 2011-06-16 2019-03-12 Ge Video Compression, Llp Entropy coding of motion vector differences
US10298964B2 (en) 2011-06-16 2019-05-21 Ge Video Compression, Llc Entropy coding of motion vector differences
US10306232B2 (en) 2011-06-16 2019-05-28 Ge Video Compression, Llc Entropy coding of motion vector differences
US10313672B2 (en) 2011-06-16 2019-06-04 Ge Video Compression, Llc Entropy coding supporting mode switching
CN107529704B (zh) * 2011-06-16 2019-08-09 Ge视频压缩有限责任公司 解码器、解码和编码视频的方法
US10425644B2 (en) 2011-06-16 2019-09-24 Ge Video Compression, Llc Entropy coding of motion vector differences
US10432940B2 (en) 2011-06-16 2019-10-01 Ge Video Compression, Llc Entropy coding of motion vector differences
US10432939B2 (en) 2011-06-16 2019-10-01 Ge Video Compression, Llc Entropy coding supporting mode switching
US12069267B2 (en) 2011-06-16 2024-08-20 Ge Video Compression, Llc Context initialization in entropy coding
CN107529710B (zh) * 2011-06-16 2020-04-07 Ge视频压缩有限责任公司 解码器、解码和编码视频的方法
US11838511B2 (en) 2011-06-16 2023-12-05 Ge Video Compression, Llc Entropy coding supporting mode switching
US10630988B2 (en) 2011-06-16 2020-04-21 Ge Video Compression, Llc Entropy coding of motion vector differences
US10645388B2 (en) 2011-06-16 2020-05-05 Ge Video Compression, Llc Context initialization in entropy coding
US10819982B2 (en) 2011-06-16 2020-10-27 Ge Video Compression, Llc Entropy coding supporting mode switching
US11012695B2 (en) 2011-06-16 2021-05-18 Ge Video Compression, Llc Context initialization in entropy coding
US11277614B2 (en) 2011-06-16 2022-03-15 Ge Video Compression, Llc Entropy coding supporting mode switching
US11516474B2 (en) 2011-06-16 2022-11-29 Ge Video Compression, Llc Context initialization in entropy coding
US11533485B2 (en) 2011-06-16 2022-12-20 Ge Video Compression, Llc Entropy coding of motion vector differences
WO2013040994A1 (zh) * 2011-09-23 2013-03-28 中兴通讯股份有限公司 一种运动矢量二次压缩编解码方法及装置
CN103024370A (zh) * 2011-09-23 2013-04-03 中兴通讯股份有限公司 一种运动矢量二次压缩编解码方法及装置

Also Published As

Publication number Publication date
CN1146245C (zh) 2004-04-14

Similar Documents

Publication Publication Date Title
CN1099656C (zh) 视频压缩方法和装置
CN1147153C (zh) 对二进制形状信号的运动矢量进行编码的方法和装置
CN102656890B (zh) 用于视频编码的方法和设备
CN1126262C (zh) 用于二进制形状编码器中的模式信号编码方法和装置
CN100527842C (zh) 基于背景的运动估计编码方法
CN1761322B (zh) 选择参考图像的方法
CN1220550A (zh) 用于隔行形状编码器的模式编码方法及装置
CN113542740B (zh) 图像传输方法及装置
EP0921497A1 (en) Interlaced binary shape coding method and apparatus
CN111447452B (zh) 数据编码方法及系统
CN1146245C (zh) 隔行二进制形状编码方法和装置
CN1224977A (zh) 用于编码交错形状信息的方法和设备
CN107360433A (zh) 一种帧间预测编码方法和装置
CN1452397A (zh) 利用基数近似或利用差分码和转义码的帧压缩
CN101827268A (zh) 一种基于对象的分形视频压缩与解压缩方法
GB2327312B (en) A method of coding an arbitrary shape of an object
US6594310B1 (en) Partition coding method and device
CN1210429A (zh) 编码二进制形状信号的方法
CN115474044B (zh) 一种Bayer域图像有损压缩方法
JP2000069482A (ja) 動画像の符号化方法及び装置
CN1174634C (zh) 基于上下文的算术编码/解码方法及装置
CN106941610B (zh) 基于改进方块编码的二值roi掩模编码方法
CN1290336C (zh) 用于改进算术编码/译码的设备
CN1214597A (zh) 二进制形状编码中的模式编码方法
CN1159923C (zh) 图像信号自适应编码的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20030425

Address after: Seoul

Applicant after: Daewoo Electronics Co., Ltd.

Address before: Seoul

Applicant before: Daewoo Electronics Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: FENGYE VISION TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: DAEWOO ELECTRONICS CO., LTD.

Effective date: 20130419

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130419

Address after: Ontario

Patentee after: Fengye Vision Technology Co., Ltd.

Address before: Seoul, South Kerean

Patentee before: Daewoo Electronics Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040414

Termination date: 20141222

EXPY Termination of patent right or utility model