CN1240092A - 视频编码 - Google Patents

视频编码 Download PDF

Info

Publication number
CN1240092A
CN1240092A CN97180513.XA CN97180513A CN1240092A CN 1240092 A CN1240092 A CN 1240092A CN 97180513 A CN97180513 A CN 97180513A CN 1240092 A CN1240092 A CN 1240092A
Authority
CN
China
Prior art keywords
frame
data
vision signal
group
produce
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN97180513.XA
Other languages
English (en)
Other versions
CN1207921C (zh
Inventor
戴维·达尔比
理查德·詹姆斯·怀廷
约翰·马丁·奥唐奈
安东尼·理查德·利宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Telecommunications PLC
Original Assignee
British Telecommunications PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecommunications PLC filed Critical British Telecommunications PLC
Publication of CN1240092A publication Critical patent/CN1240092A/zh
Application granted granted Critical
Publication of CN1207921C publication Critical patent/CN1207921C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)
  • Glass Compositions (AREA)
  • Television Systems (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

公开了一种对代表活动图象的视频信号进行编码的方法和装置,该方法包括:接收视频信号的相继帧;参照视频信号的一先前帧来编码视频信号的各帧,由此产生第一组数据,当它被重构时,代表活动图象的第一播放方式;编码视频信号的各帧,以产生第二组数据,当它重构时,代表活动图象的第二播放方式;解码第一组数据,以产生第一重构视频信号;解码第二组数据,以产生第二重构视频信号;计算第二重构视频信号的一帧与对应于在第二视频信号的该帧后继的帧的第一重构视频信号的一帧之间的差值,并当该些差值超过一阈值时,编码该些差值并产生另一组数据。

Description

视频编码
本发明涉及视频信号的编码,尤其是用于在低带宽传输系统、如要求小于128kbit/s的低带宽传输系统上传输的视频信号的编码。
对于传输未压缩的广播质量电视信号需要大约6MHZ的模拟带宽或超过100Mbit/s的数字信息的数据速率。这样高的位速信号用有限的带宽系统来传输实际上是行不通的。因此需要必须通过压缩视频信号来减少信息量。这可以利用相邻图象元(象素)之间的相关性及数据缩减与图象质量之间的折衷来实现。
视频压缩技术依赖于在空间中和/或在时间中相邻象素之间的相关性。例如,在一个相对一致的场景区域中(例如一个房间壁),该区域内的一个象素与相邻象素的相似度可能十分接近。类似地,在一个相当静止的场景中,一帧的象素将与后继帧的等效象素相当接近。因此,一个信号帧的象素能鉴于它们彼此间的关系来编码(帧内编码)和/或鉴于它们与相邻帧中象素的关系来编码(帧间编码)。帧内编码的帧(帧内信息),可明确地被解码且不用参考任何其它帧,而帧间编码的帧(帧间信息)需要与用作预测的帧相关的信息。差分技术可被使用来进一步压缩视频信号。差分编码技术仅对帧之间的差别进行编码,故意味着比编码整个帧需要的数据少。
已经发展出各种视频压缩标准。其中之一是被称为MPEG1的国际标准ISO-IEC11172:“用于在最大约1.5Mbit/s位速下工作的数字存储介质的活动图象及音频信号的编码”。该标准的开发是为了在数字存储介质、如CD-ROM、数字音频磁带(DAT)、磁带驱动器、可写光驱动器上存储视频及相关的音频信号,及为了在电信信道上传输它们。根据MPEG1标准,帧内信息被包括在规则间隔的数据流中,以便允许随机地存取视频信号并对它们进行编辑。规则的帧内信息也允许与视频信号交互作用,即,用户可请求视频信号的快进或快退,且这个可由向用户提供I帧的视频信号来实现,直到请求正常播放为止。但是,与包括帧内及帧间信息两者的视频信号的正常播放方式相比,这增加了每图象的平均位速。
也发展出涉及低数据速率系统的标准。例如,ITU标准H.261涉及在n×64bit/s位速下活动图象的编码(其中n为1至30中的一个整数)(用于在ISDN网络上通信),及ITU标准H.263用于在小于64kbit/s数据位速下编码活动图象(用于在PSTN网络上通信)。这些编码方案不需要帧内信息的规则包含。在视频呼叫过程中,仅当由接收机检测出误差状态或可能在场景变换时通常才传输帧内信息。而这意味着,与MPEG1(对于代表所有数据中大部分的帧内信息所产生的数据)相比,减小了平均数据速率,它不可能提供交互性能、如快进及快退,因为除开始点外对数据没有明确的存取点。因此,H.261及H.263编码方案不适用于提供用户能交互使用的视频信息流。
在1996年9月4—5日在英国的洛夫城(Loughborough)大学举行的IEEE第一届无线电图象/视频通信国际研讨会上,由N Farber,ESteinbach及B Griod发表的题为“用于移动视频服务器访问的增强H.263兼容传输”的文章中,描述了允许对H.263编码视频数据流随机存取且不需要周期的帧内信息的附加位(overhead)的一种方法。根据该文章,要存储两个数据流,一个是在正常播放方式中传输的由帧间信息组成的数据流(所谓的P—数据流)。第二数据流是由帧内信息组成的数据流(所谓的I—数据流)。这主要用于误差的纠正,但应指出,视频信号的随机存取可基于用户的请求通过在被传输信号中插入帧内信息来提供。因此,在正常使用中传输无周期帧内信息的帧间编码信号,仅当对视频数据流请求随机存取时才传输帧内信息。
正如著者所肯定的,帧内信息的插入导致“失配”误差,它是由所谓的P数据流重构的帧与由相应的帧内信息重构的帧之间的差别所导致的。著者建议,为减小该误差,帧内信息自P数据流的重构的帧来被编码而非自原始视频信号来被编码。
根据本发明,提供了一种对代表活动图象的视频信号编码的方法,该方法包括:
接收视频信号的相继帧;
参照视频信号的先前帧来编码视频信号的每一帧,由此产生第一组数据,它在重构时,代表活动图象的第一播放方式;
编码视频信号的各帧,由此产生第二组数据,它在重构时,代表活动图象的第二播放方式;
解码第一组数据,以产生第一重构的视频信号;
解码第二组数据,以产生第二重构的视频信号;
计算第二重构的视频信号的一帧及对应于继第二视频信号的该帧后的帧的第一重构的视频信号的一帧之间的差,并当该差超过一阈值时,编码该差值并产生另一组数据。
因此,由第二及另一组数据重构的一帧能和与P数据流的一连接的帧密切匹配,而对于所需的帧内信息不会有每帧位速的明显增大。
最好第二组数据不参照视频信号的任何其他帧来产生,即它是帧内编码的。然后这些I帧可用来提供快进及快退功能。
第二组数据可使用比产生第一组数据所使用的量化步长更粗的量化步长来产生,及另一组数据可使用用于产生第一组数据的量化步长及用于产生第二组数据的量化步长中间的量化步长来产生。因此,可编码一帧内编码的图象而不会超过每图象最大位,及另一组数据提高了由第二组数据产生的图象质量。
最好,另一组数据与第二重构的视频信号的该帧相组合,计算该帧及第一视频信号的该帧之间的差值,并当差值超过阈值时,将差值编码,以产生又一组数据。最好这些组合、计算及编码步骤重复地进行,直到符合一标准为止。合适的标准为,对于第二重构的视频信号的每帧执行固定次数或两次步骤直到差值小于阈值为止。
现在将参照附图仅以例子的方式来进一步描述本发明,附图为:
图1表示包括根据本发明编码的编码视频信号的一个交互视频服务系统;
图2表示根据本发明的视频编码器的框图;
图3表示根据本发明产生的数据,它允许快进及快退;
图4表示根据本发明另一实施例生成的数据,它允许快进及快退及更频繁的暂停可用性;
图5表示在播放方式中使用怎样的控制表;
图6是图5中所示控制表单元的例子;
图7表示由视频服务器使用怎样的控制表来产生位流的例子。
图1表示一个交互视频系统,例如所谓的视频点播系统,它提供代表根据用户要求的由用户选择的视频信号的位流。该系统包括视频服务器2,它与代表活动图象如电影、纪录片等的编码的视频信号的存储器4协同工作。多个用户终端6通过传输通路7、例如PSTN、ISDN、无线电卫星等与视频服务器2相连接。每个用户设有控制视频服务器2用的装置(未示出)。返回到服务器8的返回通路8被设置来传输这些控制信号。返回通路可通过与从服务器2将信号传输到终端6所使用的传输媒介相同的传输媒介或一分开的传输媒介。
在使用中,用户选择待播放的活动图象,及通过返回通路8将控制信号发送给服务器。服务器2确认选择的视频信号、识别存储器4中该视频信号的位置,建立从视频存储器4到请求用户终端6的通路7及将选择的视频信号传输到终端。提供这种操作性的服务器在视频点播领域中是公知的,将在这里不作进一步论。除非本发明对服务器有特殊的作用。
在存储器4中的视频信号依赖可根据任何适合的编码方案来编码。
在许多当前的编码方案、如H.261/263及MPEG标准中,有一种称为量化的处理,用于减少被传输的位数。使用离散余弦变换(DCT)将图象从空间域变换到频域。对产生的数据,以增加频率分量的次序进行扫描,然后它被量化或被固定数目除;使小于阈值的所有这些除得结果被放弃。较高频率分量通常其值低于较低频率分量的值,因此,由于被固定数目除,许多高频分量被放弃。由编码器来选择被量化器用作为除数的数,以保证合理数目的帧被传送到信道。例如,当在视频序列中具有大量细节或运动需被编码时,编码器可增大量化值以减少用于编码该信号的各帧(或宏块)的位数。粗量化器的使用具有另外未意料的效果,在被传输图象元中,解码的系数值是有很大级别,它导致具有低信噪比的图象并出现“块状”。
现在将参照图2来描述本发明的第一实施例,该图表示根据本发明的一编码器。该编码器包括一个输入部分11,一个编码装置12,后者为DCT计算单元14形式,该单元14输出DCT系数及具有一个量化器16,该量化器量化DCT单元14的输出。量化器16的输出被连接到可变长度编码器(VLC)18,并连接到一个逆量化器21。量化器16及逆量化器21的量化步长由控制单元22控制。VLC18被连接到控制单元22,并将关于VLC操作状态的信息传送给控制单元。控制单元修改量化器16和逆量化器21的量化步长,以将编码数据保持在被选择的方案所允许的每图象最大位的极限范围内。
为此,不是被编码的视频信号的每个帧必须被编码。如果编码一帧所需的数据量变得太大时,控制单元22可使帧数减少。
逆量化器21及逆DCT单元24构成本机解码器25。在帧间编码中,被该本机解码器解码的图象被输入到帧存储器(FS)26。当下一被编码的帧出现在编码器的输入部分10上时,减法器28计算输入到编码器的帧与帧存储器26的内容之间的差值。并可通过传统的运动估算器31执行运动估算,如果这样的话,根据运动矢量修改帧存储器26的内容。这种运动估算是在视频编码领域中公知的,在这里将不再讨论。
在帧间编码时,通过将由减法器28计算的差值加到帧存储器26中,如加法器32所指示的,使帧存储器26的内容更新。编码器的输出被存储在本机存储器34中。
根据本发明的第一实施例(以下将参照图3来描述了),视频信号的编码需要多次通过编码器:
1、第一次通过,根据所要求的编码方案产生相应于正常播放方式位流的第一组数据10。例如在H.261或H.263编码的视频信号中,该位流将由后随P帧的一初始I帧组成。第一组数据10被存储在本机存储器34中。
2、第二次通过,以产生代表视频信号的第二播放方式,例如快进或快退的第二组数据20。该次通过以适于快进及快退的低位速产生I帧序列I’I’I’I’,连同确定连接至/自第一位流的控制结构的一表中各项目。控制单元22从编码环路中关掉本机解码器25。控制单元被编程,并以与所需快进/快退播放方式相兼容的位速产生第二组数据。例如,如果需要10倍于正常速度的快进/快退播放方式时,则以正常播放方式的平均位速的1/10倍位速产生第二组数据。第二组数据20也与相关控制表一起被存储在本机存储器34中。
3、后继各次通过,以产生附加P’P”及P帧30。第二组数据20的I帧被用作为P’P”P序列的起始点,及第二组数据20的解码帧I’被控制单元22加载到帧存储器26中。在待被重连接的点处的编码的正常位流10中的帧P(即在通过#1中产生的帧)被解码并作为P(n)施加到编码器的输入部分11。减法器28计算帧存储器26中图象I’及正常播放位流的重构的目标P(n)帧之间的差值。如果这两者之间的差值小于预定阈值,则编码程序将被停止。如果它大于阈值,则该差值作为P’被编码并作为第三组数据存储在本机存储器34中。然后P’被解码,并被加法器32加到帧存储器26中,及控制单元再起动帧存储器内容与帧P(n)之间差值的计算、编码及存储。这继续下去,直到编码器的输入P(n)及帧存储器26的内容会聚,以致两者之差小于预定阈值为止。该数据P’、P”、P被作为第三组数据被存储。因此对于第二播放方式的每帧可产生出可变数目的附加P’帧。在本发明的一个简单形式中,编码器可对于一个固定数目的帧工作以产生固定数目的P’帧。实际经验表明,三个P’帧,即P’、P”及P给出可接受的结果。
因此产生出代表视频信号的正常播放方式的第一组数据10:PPPPP……,连同代表第二播放方式(快进/快退)的第二组数据20:I’I’I’I’I’……和允许正常播放方式位流10被再连接的另一组数据30:P’P”P一起。这些数据组与相关的控制表(以下再讨论)一起被存储在本机存储器34中,控制表中记录了各组数据之间的连接。
与正常播放方式位流的位速相比较,用于快进/快退播放方式的帧内信息以降低的位速被编码。I’帧及与I’帧相联系的正常播放方式位流的该帧之间的差然后被编码以形成附加P’帧。编码器的控制单元22具有任何附加P’帧中每宏块的自由度,并以下列方式修改量化器的步长。在已编码的I’帧后面,编码器附加上附加P帧,如图3中所示分别为P’P”及P。在每个I帧后面的被编码的P帧的数目在内容被编码时是可编程的,但对本发明并非重要的。
因此每个I’帧用相对粗的量化步长被编码(例如,在H.261编码方案中的级8),以保证被传输以形成的I’帧的位数落在该编码方案的最大位数/图象极限内。当被解码及显示时该I’帧将被看到稍微模糊及块状。随后的P帧,P’,也使用相对粗的量化步长并用来使图象清晰。应当指出,在H.261及H.263规定中较细的量化步长仅可用于低象素值。因此,为使主位流的帧与同其(间接地)连接的I’帧的相会聚,实际中的I’帧将后随2个或多个附加P帧P’及P”、P,以使图象清楚到可与通过P帧的主位流获得的清晰度相比较的水平。第一帧P’具有的量化步长允许在标准(如H.261编码方案中的等级8)中规定的象素值的所有范围,第二帧P”具有较细小的量化步长(如H.261编码方案中的等级4)以获得可与主位流的图象质量相比的图象质量。在此时象素值的较低范围是可接受的,因为所期望的是,P’及P”帧之间的任何差的幅度小于255。后继的P’帧P使用一甚至更小的量化步长(例如H.261编码方案中的等级1)。
该技术的优点在于,当要求快进或快退时,具有一个较小的延时直到第一帧被终端接收为止。相继的I’帧连续地被传输直到从用户终端6接收到请求服务器2恢复正常播放方式的控制信号为止。然后传送与播放的最后I’帧相关的附加P’帧,以便使信号会聚到由自正常位流播放的下一帧所代表的信号。采用愈加细小的步长,该技术可扩展到包括在I’帧后的任何数目的附加P帧,以会聚到由编码方案支持的最佳图象质量。
最后的附加帧P相对与其连接的数据10的正常编码的帧应具有很小的差,因为任何差通过在相当长时间上被传输的正常序列的P帧将被维持。它们仅通过规定为H.261及H.263标准部分的“系统更新”过程对于特定的宏块而被取消。
因此,粗量化的I’帧需要比MPEG或H.261标准中的标准I帧更少的传输位,因而以较小延时被传输。后继的附加P’帧除掉了由粗量化所产生的虚象并对粗量化I帧及P’帧之间预期的较大差值进行编码。最后的P帧被量化,以致与正常位流很好地匹配。
这允许快进及快退而不对显示的信号的导入附加虚象,否则它会被维持到视频信号的正常播放方式中。快进及快退获得的加速在该序列被编码的时刻而被确定。如果需要高速度的快进及快退,则在每个I帧之间将具有许多被编码的P帧,并在每个I帧之间将具有显著的时间量。例如,如果存储的内容以128kbit/s的平均位速被编码及需要10倍的加速因数作快进及快退,则I’帧将以12.8kbit/s的平均位速被编码。
当请求暂停时,用户终端将显示当前的被解码帧。但是,当在用户显示器上维持该被解码帧时,在图象中的任何虚象将对观看者更明显。
因此,另一方案是,服务器2可连续地传输正常播放信号,直到达到第二组数据的I’帧的下一连接为止。然后传输I’帧和后续的P’,P”及P帧进行显示。但是,如果快进以比视频信号正常播放速率快得多的速率被编码,则在达到下个I’帧前可能有大的延时。
根据本发明的第二实施例,多个暂停序列PP’,PP”,PPP比用于快进及快退的I帧相对更加频繁地被编码,如从图4中看到的。通过计算正常播放方式重构的帧Pn及原始视频信号的相应帧Fn之间的差而对每个PP’暂停序列40a进行编码。暂停序列40也被存储在存储器34中,作为另一组数据。
暂停序列的编码处理类似于对于快进及快退序列所使用的处理,其区别在于,在此情况下不产生起始I帧:
1、对相应于正常播放方式位流的第一组数据10进行解码并将帧从本机存储器34加载到编码器的帧存储器26中。
2、产生代表第二播放方式即暂停的另一组数据40。该另一组数据是通过将视频信号的起始帧F(n)输入到编码器输入部分11中并对帧存储器26加载主位流10的相应解码帧而被生成的。计算这两帧之间的差值,如果它大于阈值,则对其编码并作为暂停帧PP’被存储在本机存储器34中,其带有相关控制表。
3、然后对PP’进行解码并通过加法器32加到帧存储器26中,及控制单元再启动帧存储器的内容与帧F(n)之间的差值的计算。这继续直至对编码器F(n)的输入与帧存储器26的内容会聚以使得这两者之差小于预定阈值为止。因此,对于暂停方式的每帧可产生出可变数目的PP’暂停帧。
显然最后产生的PP’帧偏离了正常位流10中的相应帧。这可用多种方式来解决。
a)将与一具体暂停点的最后PP’相关的控制表中的一项连接到下一I’帧以出现在快进数据组中,例如在图4中,将PP’连接到I’(如图4中标号42所指示的);或
a)对另外数据进行编码,以使由暂停帧PP’代表的图象会聚到正常播放位流10中的一重构P帧。这样将与最后PP’帧相关的连
接中的一项连接到下个P帧,如图4中由标号44所指示的。以与
参照第一实施例所描述的相同方式,暂停点待被连接至的主位流10的解码帧(例如下帧Px+1)经输入部分11被输入到编码器,而被解码的最后暂停帧PP被加载到帧存储器26。如同第一实施例,输入帧Px+1及帧存储器26中的内容之间的差值被编码,以形成播放恢复帧及相关的控制表,直到输入到减法器的两输入会聚或发生固定次数的重复为止。
因为帧间信息比帧内信息包含较少的位,仅对于暂停方式使用PP’帧意味着可插入更多的暂停点,而不会有存储在服务器上的视频数据量有大的增加。
可对来自各种源的音频一视频内容编码,被编码的位流存储在大容量存储系统,典型为硬盘驱动器或CD-ROM中,用于在作视频服务器2的存储器4中的后级的存储。
因此,在本发明中,编码处理仅发生在内容被处理并存储在存储介质中的时刻上。内容可用支持带宽及被支持的终端类型所需的多种速率被存储。典型地,音频一视频内容将在网络PSTN、ISDN、LAN或ADSL上被传输,及对于每个所需速率来执行编码处理。
存储内容可由任何用户终端6来访问,后者能够解码被编码的位流加上相关的音频编码算法。需要有控制信道8,以便能控制服务器,以实现快进、快退、暂停及另外的方式。目前对于控制机构尚无ITU标准。图1表示这样一种结构。
在音频一视频内容被用户终端请求的时刻,该内容可直接地传输到标准依从的终端,而无服务器所需的附加解码/编码/重编码处理。因此,可用相对价廉的服务器来支持对存储内容的多个同时访问。
使用来自用户解码器的指令来控制服务器传输的位流形式。传输位流的组成部分由保持在服务器上的控制表的控制。在图5中,F0至F9代表待被编码内容中的原始帧并以固定的帧速率发生。Pn代表将由解码器重构的正常播放方式预测帧,及B(n,m)代表当传输时能使解码器从Pn移动到Pm的位流。
控制表在编码期间被产生出来并保持在存储介质上,以便由服务器从存储器4中存取。控制表50包括自保存在存储器中的不同帧的连接。对于每个标以B(0,1)至B(N,N+1)的位流单元设有一个控制表。在图5中在视频流后面表示有从一个控制表到下个控制表的“播放“连接。
控制表中各单元的一个例子表示在图6中。每个控制表或框50包括:位流识别符51;时间标记52,它指示相对于编码信号的起点(在该起点一位流能被解码器播出)的最早时间;文件偏移53,它指示存储器中帧的被压缩位流的位置;位流长度54,它指示帧中的位数;播放连接55,它指示在播放方式中待播放的下个控制表的识别;向后播放连接56,它指示在向后播放方式中待播放的下个控制表的识别;快进连接57,它指示在快进方式中待播放的下个控制表的识别;快退连接58,它指示在快退方式中待播放的下个控制表的识别;暂停连接59,它指示在暂停方式中待播放的下个控制表的识别;再起动连接60,它指示在播放方式恢复时待播放的下个控制表的识别。
图7表示用于一编码视频信号中一部分的控制表。控制表501-506代表正常播放方式的P帧。控制表507-509与用于快进/快退方式所产生的I’帧相关。控制表510-518与用于使快进图象会聚到正常播放位流的再连接点所产生的附加P’帧相关。
图7中没有表示出暂停序列PP’,但可以理解,存储了用于其的类似的控制表,及另外的各种播放方式也是需要的。

Claims (15)

1.一种对代表活动图象的视频信号进行编码的方法,该方法包括:
接收一视频信号的相继帧;
参照该视频信号的先前帧来编码该视频信号的各帧,由此产生第一组数据,当它被重构时,代表活动图象的第一播放方式;
编码该视频信号的各帧,由此产生第二组数据,当它被重构时,代表活动图象的第二播放方式;
解码第一组数据,以产生第一重构的视频信号;
解码第二组数据,以产生第二重构的视频信号;
计算第二重构的视频信号的一帧与对应于继该第二视频信号的该帧后的帧的第一重构的视频信号的一帧之间的差值,并当该些差值超过一阈值时,编码该些差值并产生另一组数据。
2.根据权利要求1的方法,其中第二组数据不参照任何另外的该视频信号的帧而产生。
3.根据权利要求1或2的方法,其中第二组数据使用比产生第一组数据所使用的量化步长更粗的量化步长来产生,及另一组数据使用用于产生第一组数据的量化步长与用于产生第二组数据的量化步长中间的一量化步长来产生。
4.根据权利要求1、2或3的,还包括将另一组数据与第二重构的视频信号的该帧相组合,计算该帧及第一视频信号的帧之间的差值,并当该些差值超过阈值时,将该些差值编码并产生又一组数据,所述组合、计算及编码步骤被重复进行,直到符合一标准为止。
5.根据权利要求4的方法,其中该标准为,对于第二重构的视频信号的各帧执行这些步骤两次。
6.根据权利要求4的方法,其中该标准为该些差值小于阈值。
7.根据权利要求1的方法,其中第二组数据代表该视频信号的暂停方式,该暂停方式是通过对第一组数据的一解码帧与起始视频信号的相应帧之间的差值进行重复编码而产生的。
8.视频信号编码装置,它包括::
用于接收一视频信号的相继帧的输入部分:
编码装置及量化器,后者用于对该编码装置的输出进行量化;
用于对该量化器的输出进行逆量化的逆量化器及用于对该逆量化器的输出进行解码的解码装置;
用于计算存储在一帧存储器中的一帧与输入到该编码装置的一帧之间的差值的减法器,当该差值超过一阈值时,该编码装置被配置来对差值进行编码,以产生另一组数据;
控制装置,用于控制将解码的帧间视频信号输入到该编码装置中,及将该视频信号的各帧输入到帧存储器中,以使得输入到该编码器的该视频信号的该帧对应于后继于存储在帧存储器中的该帧的该视频信号的一帧,并控制该量化器及逆量化器,以便修改相关的量化步长。
9.根据权利要求8的装置,其中该控制装置被配置来修改量化步长,以使使用比产生到编码器的输入所使用的量化步长粗的量化步长来产生得输入到该帧存储器的该视频信号,及使用在先使用的两个量化步长中间的一量化步长来产生另一组数据。
10.根据权利要求8或9的装置,其中输入到该帧存储器的视频信号不参照该视频信号的任何其他帧来产生。
11.根据权利要求8、9或10的装置,该装置被配置来将另一组数据与存储在帧存储器中的该帧相组合以形成一组合帧,以计算该组合帧与输入到编码器中的该视频信号的所述帧之间的差值,并当该些差值超过阈值时,编码该些差值以产生另一组数据,该控制装置被配置以使所述组合,计算及编码步骤能被重复地执行直到符合一标准为止。
12.根据权利要求11的装置,其中该标准为对第二重构的视频信号的各帧执行这些步骤两次。
13.根据权利要求11的装置,其中该标准为该些差值小于阈值。
14.包括根据权利要求8至13中任一权利要求所述装置的交互视频装置。
15.代表活动图象的视频信号,该信号包括:
第一组数据,当被重构时它代表该活动图象的第一播放方式;
第二组数据,当被重构时它代表该活动图象的第二播放方式;及
第三组数据,它代表第二组数据的一重构帧与对应于第二组数据的该重构帧后继的帧的第一组数据的一重构帧之间的差值。
CN97180513.XA 1996-12-10 1997-12-01 视频编码 Expired - Lifetime CN1207921C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP96308943 1996-12-10
EP96308943.8 1996-12-10

Publications (2)

Publication Number Publication Date
CN1240092A true CN1240092A (zh) 1999-12-29
CN1207921C CN1207921C (zh) 2005-06-22

Family

ID=8225177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN97180513.XA Expired - Lifetime CN1207921C (zh) 1996-12-10 1997-12-01 视频编码

Country Status (9)

Country Link
US (1) US6002440A (zh)
EP (1) EP0945023B1 (zh)
JP (1) JP3920356B2 (zh)
CN (1) CN1207921C (zh)
AU (1) AU726129B2 (zh)
CA (1) CA2274181C (zh)
DE (1) DE69715660T2 (zh)
ES (1) ES2184137T3 (zh)
WO (1) WO1998026604A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1870754B (zh) * 2005-05-24 2010-06-09 三星电子株式会社 减少分块现象的编/解码装置和方法
CN104813633A (zh) * 2012-11-20 2015-07-29 阿尔卡特朗讯公司 用于传输视频流的方法

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000013777A (ja) * 1998-06-26 2000-01-14 Matsushita Electric Ind Co Ltd 映像再生装置及び映像蓄積装置
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
US7190883B2 (en) * 1999-06-18 2007-03-13 Intel Corporation Systems and methods for fast random access and backward playback of video frames using decoded frame cache
DE60109376T2 (de) 2000-08-01 2006-01-19 Command Audio Corp., Redwood City Verfahren und Signal zur Übertragung eines Rundfunkprogramms an einen drahtlosen Empfänger
EP2071827A3 (en) 2000-12-15 2010-08-25 BRITISH TELECOMMUNICATIONS public limited company Transmission and reception of audio and/or video material
US20020122491A1 (en) 2001-01-03 2002-09-05 Marta Karczewicz Video decoder architecture and method for using same
US6765963B2 (en) 2001-01-03 2004-07-20 Nokia Corporation Video decoder architecture and method for using same
US7693220B2 (en) * 2002-01-03 2010-04-06 Nokia Corporation Transmission of video information
US7463684B2 (en) 2002-05-03 2008-12-09 Microsoft Corporation Fading estimation/compensation
US7609767B2 (en) 2002-05-03 2009-10-27 Microsoft Corporation Signaling for fading compensation
US7277486B2 (en) 2002-05-03 2007-10-02 Microsoft Corporation Parameterization for fading compensation
JP4087852B2 (ja) * 2002-11-18 2008-05-21 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー ビデオの伝送方法
GB0306973D0 (en) 2003-03-26 2003-04-30 British Telecomm Transmitting video
US6784811B1 (en) * 2003-03-31 2004-08-31 Scopus Network Technologies Ltd. System and a method for an ultra-low delay MPEG-syntax video codec
US8085844B2 (en) 2003-09-07 2011-12-27 Microsoft Corporation Signaling reference frame distances
US7577198B2 (en) * 2003-09-07 2009-08-18 Microsoft Corporation Number of reference fields for an interlaced forward-predicted field
US8009739B2 (en) 2003-09-07 2011-08-30 Microsoft Corporation Intensity estimation/compensation for interlaced forward-predicted fields
US7818444B2 (en) 2004-04-30 2010-10-19 Move Networks, Inc. Apparatus, system, and method for multi-bitrate content streaming
US8634413B2 (en) 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
US20080065676A1 (en) * 2006-09-13 2008-03-13 Hause Curtis B System and method for tracing data storage devices
JP4875008B2 (ja) 2007-03-07 2012-02-15 パナソニック株式会社 動画像符号化方法、動画像復号化方法、動画像符号化装置及び動画像復号化装置
US8098333B2 (en) * 2007-06-29 2012-01-17 Seiko Epson Corporation Phase shift insertion method for reducing motion artifacts on hold-type displays
JP2009111932A (ja) * 2007-10-31 2009-05-21 Panasonic Corp 動画像復号化装置
EP2101503A1 (en) 2008-03-11 2009-09-16 British Telecommunications Public Limited Company Video coding
EP2200319A1 (en) 2008-12-10 2010-06-23 BRITISH TELECOMMUNICATIONS public limited company Multiplexed video streaming
EP2219342A1 (en) 2009-02-12 2010-08-18 BRITISH TELECOMMUNICATIONS public limited company Bandwidth allocation control in multiple video streaming

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0778703A3 (en) * 1992-03-24 1999-03-31 Kabushiki Kaisha Toshiba Variable length code recording/playback apparatus
US5717816A (en) * 1993-01-13 1998-02-10 Hitachi America Ltd. Method and apparatus for the selection of data for use in VTR trick playback operation in a system using intra-coded video frames
GB9405487D0 (en) * 1994-03-21 1994-05-04 Rca Thomson Licensing Corp VSB demodulator
SG43131A1 (en) * 1994-03-23 1997-10-17 British Telecomm Video signal coding
JP3172635B2 (ja) * 1994-07-14 2001-06-04 シャープ株式会社 ディジタル記録再生装置
KR970004637B1 (ko) * 1994-07-18 1997-03-29 엘지전자 주식회사 디브이씨알(dvcr)의 변속 재생 방법
JP3277713B2 (ja) * 1994-08-31 2002-04-22 ソニー株式会社 ディジタルビデオ信号の記録装置、記録再生装置及び再生装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1870754B (zh) * 2005-05-24 2010-06-09 三星电子株式会社 减少分块现象的编/解码装置和方法
CN104813633A (zh) * 2012-11-20 2015-07-29 阿尔卡特朗讯公司 用于传输视频流的方法
CN104813633B (zh) * 2012-11-20 2018-04-10 阿尔卡特朗讯公司 用于传输视频流的方法

Also Published As

Publication number Publication date
CA2274181C (en) 2009-10-20
ES2184137T3 (es) 2003-04-01
CA2274181A1 (en) 1998-06-18
EP0945023B1 (en) 2002-09-18
DE69715660D1 (de) 2002-10-24
CN1207921C (zh) 2005-06-22
AU5129898A (en) 1998-07-03
JP3920356B2 (ja) 2007-05-30
US6002440A (en) 1999-12-14
JP2001509329A (ja) 2001-07-10
AU726129B2 (en) 2000-11-02
EP0945023A1 (en) 1999-09-29
WO1998026604A1 (en) 1998-06-18
DE69715660T2 (de) 2003-07-31

Similar Documents

Publication Publication Date Title
CN1207921C (zh) 视频编码
US5305113A (en) Motion picture decoding system which affords smooth reproduction of recorded motion picture coded data in forward and reverse directions at high speed
KR100252108B1 (ko) Mpeg 압축부호화 및 복호화기를 채용한 디지털 기록 재생장치 및 그 방법
JP3072035B2 (ja) 2ステージビデオフィルム圧縮方法及びシステム
JP3443867B2 (ja) 画像信号符号化、復号化方法及び画像信号記録媒体
US20060114995A1 (en) Method and system for high speed video encoding using parallel encoders
EP0920214B1 (en) Apparatus and method of coding/decoding moving picture
CA2412722A1 (en) Video error resilience
CN1256048A (zh) 用于视频图像的误差消除方法和装置
CN1575552A (zh) 生成伪双向预测场图像
CN1171158C (zh) 视频点播系统中活动图象的流动方法
CN100539670C (zh) 已编码a/v序列的编辑
Chen et al. Stream conversion to support interactive video playout
CN1123229C (zh) 视频信号编码
CN113259671A (zh) 视频编解码中的环路滤波方法、装置、设备及存储介质
KR20040091700A (ko) Fgs 인코딩된 구조물 사이의 부드러운 천이를 실행하기위한 방법 및 장비
US20060133491A1 (en) Video codec
JPH0984019A (ja) 画像データ蓄積装置
Psannis et al. MPEG-2 streaming of full interactive content
JPH11243548A (ja) 画像シーケンスを符号化及び復号化する方法並びに装置
US20050238099A1 (en) Encoding device, encoding method, decoding device, and decoding method
CN1254115C (zh) 双回路移动补偿精细颗粒的可标度性
KR100552169B1 (ko) 이동통신 시스템의 비디오 스트리밍 압축 장치
JP3027759B2 (ja) 可変レート画像符号化装置
KR100337724B1 (ko) 비디오신호부호화방법및비디오부호/복호기

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20050622