CN101523919B - 基于用于精细化系数译码的视频区块类型的可变长度译码表选择 - Google Patents
基于用于精细化系数译码的视频区块类型的可变长度译码表选择 Download PDFInfo
- Publication number
- CN101523919B CN101523919B CN200780038020.6A CN200780038020A CN101523919B CN 101523919 B CN101523919 B CN 101523919B CN 200780038020 A CN200780038020 A CN 200780038020A CN 101523919 B CN101523919 B CN 101523919B
- Authority
- CN
- China
- Prior art keywords
- decoding
- variable
- video block
- video
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明描述用于对可缩放视频译码(SVC)方案中的增强层进行译码的技术。所述技术可用于对变换系数进行译码,且尤其有用于SVC方案的增强层的精细化系数的可变长度译码。根据本发明的所述技术,将信息从编码器装置传输到解码器装置,所述解码器装置识别应使用哪些可变长度译码表来解码两种或两种以上不同类型的视频区块。可每帧(或其它译码单元)一次地传输所述信息,且所述信息可识别将要用于帧内译码区块的第一表和将要用于各自帧的帧间译码区块的第二表。所述解码器基于此信息来执行表选择,且使用针对每一区块类型选择的表来解码不同类型的视频区块。
Description
本申请案主张以下美国临时申请案的利益,每一美国临时申请案的全部内容以引用的方式并入本文中:
2006年10月12日申请的第60/829,274号美国临时申请案,
2007年1月5日申请的第60/883,741号美国临时申请案,以及
2006年10月12日申请的第60/829,276号美国临时申请案。
技术领域
本发明涉及数字视频译码,且更特定来说,涉及可缩放视频译码(SVC)方案的增强层中的变换系数的可变长度译码(VLC)。
背景技术
数字视频能力可并入较广范围的装置中,其包括数字电视、数字直播系统、无线通信装置、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、数码相机、数字记录装置、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话等。数字视频装置实施例如MPEG-2、MPEG-4或H.264/MPEG-4第10部分、高级视频译码(AVC)的视频压缩技术以较有效地传输和接收数字视频。视频压缩技术执行空间和时间预测以减少或移除视频序列中固有的冗余。
在视频译码中,视频压缩通常包括空间预测、运动估计和运动补偿。帧内译码依赖于空间预测来减少或移除在给定视频帧内的视频区块之间的空间冗余。帧间译码依赖于时间预测来减少或移除在视频序列的连续视频帧的视频区块之间的时间冗余。对于帧间译码,视频编码器执行运动估计以追踪在两个或两个以上邻近帧之间的匹配的视频区块的移动。运动估计产生运动向量,其指示视频区块相对于一个或一个以上参考帧中的对应预测视频区块的移位。运动补偿使用运动向量以从参考帧产生预测视频区块。在运动补偿之后,通过从将要编码的原始视频区块减去预测视频区块来形成残余视频区块。
视频编码器通常应用变换、量化和可变长度译码(VLC)过程以进一步减小与残余区块的通信相关联的位速率。残余区块的VLC涉及可变长度码的应用以进一步压缩由变换和量化操作产生的残余系数。举例来说,VLC表可用于以促进译码效率的方式使系数的不同集合匹配可变长度码字。不同的VLC表可用于不同的视频内容。视频解码器执行相反的VLC操作以重建系数,且随后反变换系数。视频解码器可基于与视频区块相关联的运动信息和残余信息来解码视频信息。
一些视频译码利用可缩放技术。举例来说,可缩放视频译码(SVC)指使用基础层和一个或一个以上可缩放增强层的视频译码。对于SVC,基础层通常载运具有基础质量水平的视频数据。一个或一个以上增强层载运额外视频数据以支持较高的空间、时间和/或SNR水平。可以比增强层的传输可靠的方式传输基础层。增强层可将空间分辨率添加到基础层的帧或,可添加额外帧以增加总体帧速率。在一个实例中,所调制信号的最可靠部分可用于传输基础层,而所调制信号的较不可靠部分可用于传输增强层。增强层可界定不同类型的系数,其被称为重要系数和精细化系数。
发明内容
一般来说,本发明描述用于对可缩放视频译码(SVC)方案中的增强层进行译码的技术。技术以促进计算简单性的方式提供用于在解码器处选择可变长度译码(VLC)表。技术可用于译码变换系数,且尤其有用于SVC方案的增强层的精细化系数的VLC。精细化系数指SVC方案中的先前层的对应系数具有非零值所针对的增强层的系数。精细化系数的可变长度译码可与重要系数的可变长度译码分开执行,所述重要系数指SVC方案中的先前层的对应系数具有零值所针对的增强层的系数。
根据本发明的技术,将信息从编码器装置传输到解码器装置,所述解码器装置识别应使用哪些VLC表来用于解码两种或两种以上不同类型的视频区块。可每帧(或例如一切片或一帧的FGS层的其它译码单元)一次地传输信息,且可识别将要用于帧内译码区块的第一表和将要用于各自帧的帧间译码区块的第二表。解码器基于此信息执行VLC表选择,且使用选定的VLC表解码视频区块。而且,在一些情况下,编码器和解码器具有关于将要用于不同类型区块的表的协议。在此情况下,所使用的表是区块类型相关的,但由于编码器和解码器具有协议,因此无需将额外信息从编码器传输到解码器。
在一个实例中,本发明提供一种译码SVC方案的增强层的方法,所述方法包含基于可变长度译码表来编码与增强层的视频区块相关联的系数,产生识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息,将表示编码系数的信息传输到解码装置,和传输识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息。
在另一实例中,本发明提供一种译码SVC方案的增强层的方法,所述方法包含接收表示与增强层的视频区块相关联的编码系数的信息,接收识别将要用于解码第一类型的视频区块的第一可变长度译码表和将要用于解码第二类型的视频区块的第二可变长度译码表的信息,基于识别将要使用的第一可变长度译码表和第二可变长度译码表的信息来选择用于解码表示编码系数的信息的表,和基于选定表来解码表示编码系数的信息。
在另一实例中,本发明提供一种译码SVC方案的增强层的装置,所述装置包含编码器,其基于可变长度译码表来编码与增强层的视频区块相关联的系数,且产生识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息;以及传输器,其传输表示编码系数的信息,且传输识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息。
在另一实例中,本发明提供一种译码SVC方案的增强层的装置,所述装置包含接收器,其接收表示与增强层的视频区块相关联的编码系数的信息,且接收识别将要用于解码第一类型的视频区块的第一可变长度译码表和将要用于解码第二类型的视频区块的第二可变长度译码表的信息;以及解码器,其基于识别将要使用的第一可变长度译码表和第二可变长度译码表的信息来选择用于解码表示编码系数的信息的表,且基于选定表来解码表示编码系数的信息。
在另一实例中,本发明提供一种译码SVC方案的增强层的装置,所述装置包含:用于基于可变长度译码表来编码与增强层的视频区块相关联的系数的装置,其中用于编码的装置产生识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息;以及用于将表示编码系数的信息传输到解码装置的装置,其中用于传输的装置传输识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息。
在另一实例中,本发明提供一种译码SVC方案的增强层的装置,所述装置包含:用于接收与增强层的视频区块相关联的编码系数的装置,其中用于接收的装置也接收识别将要用于解码第一类型的视频区块的第一可变长度译码表和将要用于解码第二类型的视频区块的第二可变长度译码表的信息;用于基于识别将要使用的第一可变长度译码表和第二可变长度译码表的信息来选择用于解码表示编码系数的信息的表的装置;以及用于基于选定表来解码表示编码系数的信息的装置。
本发明中所述的技术可以硬件、软件、固件或任何其组合来实施。如果以软件实施,则可在一个或一个以上处理器中执行软件,例如微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或数字信号处理器(DSP)。执行技术的软件最初可存储于计算机可读媒体中,且加载在处理器中并执行。
因此,本发明也涵盖一种包含指令的计算机可读媒体,所述指令当在视频译码装置中执行时致使装置译码SVC方案的增强层,其中所述指令致使装置基于可变长度译码表来编码与增强层的视频区块相关联的系数,产生识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息,将表示编码系数的信息传输到解码装置,且传输识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息。
另外,本发明也涵盖一种包含指令的计算机可读媒体,所述指令当在视频译码装置中执行时致使装置译码SVC方案的增强层,其中在接收表示与增强层的视频区块相关联的编码系数的信息且接收识别将要用于解码第一类型的视频区块的第一可变长度译码表和将要用于解码第二类型的视频区块的第二可变长度译码表的信息时,所述指令致使装置基于识别将要使用的第一可变长度译码表和第二可变长度译码表的信息来选择用于解码表示编码系数的信息的表,且基于选定表来解码表示编码系数的信息。
在一些情况下,计算机可读媒体可形成计算机程序产品的部分,其可出售给制造商和/或用于视频译码装置中。计算机程序产品可包括计算机可读媒体,且在一些情况下也可包括封装材料。
本发明也可针对电路,例如集成电路、芯片组专用集成电路(ASIC)、现场可编程门阵列(FPGA)、逻辑或其各种组合,其经配置以执行本文中所描述的技术中的一者或一者以上。因此,本发明也涵盖一种经配置用于译码SVC方案的增强层的电路,其中所述电路经配置以基于可变长度译码表来编码与增强层的视频区块相关联的系数,产生识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息,将表示编码系数的信息传输到解码装置,且传输识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息。
本发明也涵盖一种经配置用于译码可缩放视频译码(SVC)方案的增强层的电路,其中所述电路经配置以接收表示与增强层的视频区块相关联的编码系数的信息,接收识别将要用于解码第一类型的视频区块的第一可变长度译码表和将要用于解码第二类型的视频区块的第二可变长度译码表的信息,基于识别将要使用的第一可变长度译码表和第二可变长度译码表的信息来选择用于解码表示编码系数的信息的表,以及基于选定表来解码表示编码系数的信息。
另外,本发明涵盖一种经配置用于译码SVC方案的增强层的电路,其中所述电路经配置以接收表示与增强层的视频区块相关联的编码系数的信息,根据与编码器一起建立的协议基于与视频区块相关联的区块类型来选择将要用于解码信息的不同的可变长度译码表,基于选定表来解码表示编码系数的信息。
下文在附图和描述中陈述本发明的一个或一个以上方面的细节。从描述和图式且从权利要求书将明白本发明中所述技术的其它特征、目的和优点。
附图说明
图1为说明视频编码和解码系统的示范性方框图。
图2为说明可缩放视频位流的基础层和增强层的视频帧的概念图。
图3为说明与本发明一致的视频编码器的实例的方框图。
图4为说明与本发明一致的视频解码器的实例的方框图。
图5为可变长度译码(VLC)编码单元的示范性方框图。
图6为VLC解码单元的示范性方框图。
图7为说明与本发明一致的可变长度编码的VLC技术的流程图。
图8为说明与本发明一致的可变长度解码的VLC技术的流程图。
具体实施方式
本发明描述用于对可缩放视频译码(SVC)方案中的增强层进行译码的技术。所述技术以促进计算简单性的方式提供在解码器处选择可变长度译码(VLC)表。所述技术可用于编码变换系数且特别有用于SVC方案的增强层的精细化系数的可变长度译码。精细化系数指SVC方案中的先前层的对应系数具有非零值所针对的增强层的系数。精细化系数的可变长度译码可与重要系数的可变长度译码分开执行(例如,SVC方案中的先前层的对应系数具有零值所针对的重要系数)。
根据本发明的技术,将识别应使用哪些VLC表来用于解码两种或两种以上不同类型的视频区块的信息从编码器装置传输到解码器装置。可每帧(或其它译码单元)一次地传输所述信息,且所述信息可识别将要用于帧内译码区块的第一表和将要用于各自帧的帧间译码区块的第二表。解码器基于此信息执行表选择,且使用选定表解码视频区块。
在编码器装置处,可基于经搜集以用于先前或当前译码帧的信息来执行用于编码不同视频区块的VLC表选择。举例来说,可执行先前编码帧的统计分析以有助于编码器装置处的表选择。然而,可在解码器装置处避免此计算密集型分析。作为替代,可将识别将要选择以用于第一类型和第二类型的视频区块(例如,帧内译码区块和帧间译码区块)的表的信息从编码器装置传输到解码器装置。解码器装置可使用此传输的信息以有助于正确的表选择。或者,在一些情况下,编码器和解码器可具有关于将要用于不同类型区块的表的协议。在此情况下,所使用的表是区块类型相关的,但由于编码器和解码器具有协议,因此无需将额外信息从编码器传输到解码器。
编码器处的选定表可高度取决于译码过程中所使用的量化水平。所使用的量化水平又可取决于视频区块的类型。由于解码器通常不知道编码器处所使用的量化水平,因此关于视频区块类型的信息为解码器处的表选择提供有用的机制。具体来说,由于量化水平可取决于视频区块的类型,因此基于视频区块类型在解码器处的VLD表选择可为有用的。对于解码器识别不同视频区块类型的VLC表,且解码器可确定与各自视频区块相关联的类型并使用适当VLC表来解码所述各自视频区块。
图1为说明视频编码和解码系统10的方框图。如图1中所示,系统10包括源装置12,所述源装置12经由通信信道15将编码视频传输到接收装置16。源装置12可包括视频源20、视频编码器22和调制器/传输器24。接收装置16可包括接收器/解调器26、视频解码器28和显示装置30。系统10可经配置以应用与可缩放视频译码(SVC)方案中的增强层相关联的视频信息的可变长度译码(VLC)的技术。
SVC指使用基础层和一个或一个以上可缩放增强层的视频译码。对于SVC,基础层通常载运具有基本质量水平的视频数据。一个或一个以上增强层载运额外视频数据以支持较高的空间、时间和/或信噪比SNR水平。可相对于先前编码的层来界定增强层。增强层界定至少两种不同类型的系数,其被称为重要系数和精细化系数。可相对于先前编码层的对应值来界定值精细化系数。增强层的帧有时仅包括基础层或先前增强层中的视频区块的总数的一部分(例如,仅对其执行增强的那些区块)。
重要系数指先前层中的对应系数具有零值所针对的系数。精细化系数指先前层中的对应系数在先前层中具有非零值所针对的系数。增强层的可变长度译码通常涉及两回合方法。第一回合经执行以游程长度译码重要系数,且另一回合经执行以译码精细化系数。本发明的技术尤其有用于精细化系数的可变长度译码,但本发明并不一定限于此方面。
根据本发明的技术,将信息从源装置12传输到接收装置16,所述接收装置16识别应使用哪些VLC表来用于解码两种或两种以上不同类型的视频区块。可每帧(或其它译码单元)一次地传输信息,且所述信息可识别将要用于帧内译码区块的第一表和将要用于各自帧的帧间译码区块的第二表。信息可包含识别用于帧内译码区块的第一VLC表的一个或一个以上位和识别用于帧间译码区块的第二VLC表的一个或一个以上位。接收装置16的视频解码器28基于此信息执行表选择,且使用选定表来解码视频区块。而且,然而在一些情况下,编码器22和解码器28可具有关于将要用于不同类型区块的表的协议。在此情况下,所使用的表是区块类型相关的,但由于编码器22和解码器28具有协议,因此无需将额外信息从源装置12传输到接收装置16。
在图1的实例中,通信信道15可包含例如射频(RF)频谱或一个或一个以上物理传输线的任何无线或有线通信媒体或无线和有线媒体的任何组合。通信信道15可形成例如局域网、广域网或全域网(例如因特网)的基于包的网络的一部分。通信信道15通常表示用于将视频数据从源装置12传输到接收装置16的任何合适的通信媒体或不同通信媒体的集合。通信信道15可包括各种基站或其它组件以有助于从源装置12到接收装置16的通信。
源装置12和接收装置16可包含广泛多种无线通信装置中的任一者,例如无线数字电视、无线通信装置手机、个人数字助理(PDA)、无线膝上型或台式计算机、无线数码相机、无线数字记录装置、无线视频游戏装置、无线视频游戏控制台、蜂窝式或卫星无线电电话等。
源装置12产生用于传输到接收装置16的译码视频数据。然而,在一些情况下,装置12、16可以大体上对称的方式操作。举例来说,装置12、16中的每一者可包括视频编码和解码组件。因此,系统10可支持视频装置12、16之间的单向或双向视频传输,例如用于视频串流、视频广播或视频电话。
源装置12的视频源20可包括例如摄像机的视频俘获装置、含有先前俘获的视频的视频档案或来自视频内容提供者的视频馈送。作为另一替代方案,视频源20可产生基于计算机图形的数据作为源视频、或直播视频和计算机产生的视频的组合。在一些情况下,如果视频源20为视频相机,则源装置12和接收装置16可形成所谓的相机电话或视频电话。在每一情况下,所俘获、预先俘获或计算机产生的视频可由视频编码器22编码,以用于经由调制器/传输器22、通信通道15和接收器/解调器26从视频源装置12传输到视频接收装置16的视频解码器28。视频编码和解码过程可实施本文中所述的游程长度译码技术以改进过程。显示装置30向使用者显示所解码的视频数据,且可包含多种显示装置中的任一者,例如阴极射线管、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器22和视频解码器28可经配置以支持空间、时间和/或信噪比(SNR)可缩放性的SVC。在一些方面中,视频编码器22和视频解码器28可经配置以支持SVC的精细粒度SNR可缩放性(FGS)译码。编码器22和解码器28可通过支持基础层和一个或一个以上可缩放增强层的编码、传输和解码来支持各种程度的可缩放性。而且,对于可缩放视频译码,基础层载运具有基础质量水平的视频数据。一个或一个以上增强层载运额外数据以支持较高的空间、时间和/或SNR水平。可以比增强层的传输可靠的方式传输基础层。举例来说,所调制信号的最可靠部分可用于传输基础层,而所调制信号的较不可靠部分可用于传输增强层。
为了支持SVC,视频编码器22可包括基础层编码器32和一个或一个以上增强层编码器34,以分别执行基础层和一个或一个以上增强层的编码。本发明的技术(其涉及VLC表选择)适用于SVC中的增强层的视频区块的译码。
视频解码器28可包括组合的基础/增强解码器,其解码基础层视频区块与增强层视频区块两者。视频解码器28可解码与基础层和增强层相关联的视频区块,且组合所解码的视频以重建视频序列的帧。显示装置30接收所解码的视频序列,且向使用者呈现视频序列。
视频编码器22和视频解码器28可根据例如MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4第10部分、高级视频译码(AVC)的视频压缩标准来操作。尽管图1中未展示,但在一些方面中,视频编码器22和视频解码器28可各与音频编码器和音频解码器整合,且可包括适当的MUX-DEMUX单元或其它硬件和软件,以处置在共同数据流或独立数据流中的音频与视频的编码。如果适用,则MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
由ITU-T视频译码专家组(VCEG)与ISO/IEC运动图片专家组(MPEG)一起将H.264/MPEG-4(AVC)标准制定为被称为联合视频小组(JVT)的集体合作伙伴的产物。在一些方面中,本发明中所描述的技术可应用于通常符合H.264标准的装置。ITU-T研究组在2005年3月在ITU-T推荐H.264“用于通用音视频服务的高级视频译码(AdvancedVideo Coding for generic audiovisual services)”中描述了H.264标准,其在本文中可被称作H.264标准或H.264规范或H.264/AVC标准或规范。。
联合视频小组(JVT)继续致力于对H.264/MPEG-4AVC的SVC扩展。演进SVC扩展的规范呈联合草案(JD)的形式。由JVT创建的联合可缩放视频模型(JSVM)实施用于可缩放视频中的工具,其可在系统10内使用以用于本发明中所描述的各种译码任务。关于精细粒度SNR可缩放性(FGS)译码的详细信息可在联合草案文献中找到,且特定来说,在日内瓦,2006年4月,JVT-S 201,托拉斯维干德(Thomas Wiegand)、加力苏立文(Gary Sullivan)、居莲瑞秋(Julien Reichel)、黑寇思沃兹(Heiko Schwarz)和马思阿斯闻(Mathias Wien)的“联合草案6:可缩放视频译码(Joint Draft 6:ScalableVideo Coding)”的联合草案6(SVC JD6)中找到,且在摩洛哥的马拉喀什,2007年1月,JVT-V 201,托拉斯维干德(Thomas Wiegand)、加力苏立文(Gary Sullivan)、居莲瑞秋(Julien Reichel)、黑寇思沃兹(Heiko Schwarz)和马思阿斯闻(Mathias Wien)的“SVC修正的联合草案9(Joint Draft 9 of SVC Amendment)”的联合草案9(SVC JD9)中找到。
在一些方面中,为进行视频广播,可将本发明中所描述的技术应用于增强型H.264视频译码以用于使用待出版为技术标准TIA-1099(“FLO规范”)的仅前向链路(FLO)空中接口规范(“用于陆地移动多媒体多播的仅前向链路空中接口规范(Forward LinkOnly Air Interface Specification for Terrestrial Mobile Multimedia Multicast)”)而在陆地移动多媒体多播(TM3)系统中传递实时视频服务。即,通信信道15可包含用以根据FLO规范或类似规范来广播无线视频信息的无线信息信道。FLO规范包括界定适用于FLO空中接口的位流语法与语义和解码过程的实例。或者,可根据例如DVB-H(数字视频广播-掌上型)、ISDB-T(整合服务数字广播-陆地型)或DMB(数字媒体广播)的其它标准来广播视频。因此,源装置2可为移动无线终端、视频串流服务器或视频广播服务器。然而,本发明中所描述的技术不限于任何特定类型的广播、多播或点对点系统。在广播的情况中,源装置12可向多个接收装置广播若干视频数据信道,所述多个接收装置中的每一者可类似于图1的接收装置16。
视频编码器22和视频解码器28可各实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码器12和视频解码器18中的每一者可包括在一个或一个以上编码器或解码器中,其任一者可作为经组合的编码器/解码器(CODEC)的部分整合在各自移动装置、订户装置、广播装置、服务器或类似装置中。另外,源装置12和接收装置16可各包括适当的调制、解调、频率转换、过滤和放大器组件以用于传输和接收经编码的视频,包括(适用时)足以支持无线通信的射频(RF)无线组件和天线。然而,出于易于说明的目的,所述组件在图1中被概括为源装置12的调制器/传输器24和接收装置16的接收器/解调器26。
视频序列包括一系列视频帧。视频编码器22对个别视频帧内的像素区块(或变换系数区块)进行操作以编码视频数据。视频区块可具有固定或变化大小,且可根据特定译码标准而在大小上有所不同。在一些情况下,每一视频帧为一译码单元,而在其它情况下,每一视频帧可分裂,包括形成译码单元的一系列切片。每一切片可包括一系列宏区块,其可布置成子区块。举例来说,ITU-T H.264标准支持以各种区块大小(例如对于亮度分量来说为16×16、8×8或4×4且对于色度分量来说为8×8)的帧内预测;以及以各种区块大小(例如对于亮度分量来说为16×16、16×8、8×16、8×8、8×4、4×8和4×4且对于色度分量来说为对应缩放大小)的帧间预测。根据本发明,可每译码单元一次(例如,每帧一次、每切片一次或每帧的FGS层一次)地将帧内译码区块和帧间译码区块的VLC表选择信息从源装置12传输到接收装置16。此信息随后可用于与那个各自译码单元相关联的视频区块的变换系数的译码的VLC表选择。
经传输以识别不同VLC表的信息的形式和内容可改变。举例来说,信息可被制定为两种不同的单位或多位码,其识别哪一VLC表将要用于解码第一类型的视频区块且哪一VLC表将要用于解码第二类型的视频区块。对于将要解码的每一帧,可发送一个单位或多位码用于帧内区块,且可发送另一单位或多位码用于帧间区块。解码器28基于在码中所识别的表来选择用于解码帧内译码区块和帧间译码区块的不同VLC表。
较小视频区块可提供较好的分辨率且可用于视频帧的包括较高水平细节的定位。一般来说,可将宏区块(MB)和各种子区块视为视频区块。另外,可将切片视为一系列视频区块(例如若干MB和/或子区块)。如所述,每一切片可为视频帧的独立可解码单元。在预测之后,可对8×8残余区块或4×4残余区块执行变换,且如果使用帧内_16×16预测模式,则额外变换可应用于4×4区块的色度分量或亮度分量的DC系数。
在基于帧内或帧间的预测译码之后,额外译码技术可应用于所传输的位流。这些额外译码技术可包括变换技术(例如用于H.264/AVC中的4×4或8×8整数变换或离散余弦变换DCT)和可变长度译码。变换系数的区块可被称为视频区块。换句话说,术语“视频区块”指视频数据的区块而不管信息的域。因此,视频区块可在像素域或变换系数域中。大体将在本发明中相对于变换系数的区块来描述VLC译码的应用。
本发明提供用于精细化系数的可变长度译码的技术。而且,精细化系数指在先前层中具有非零值的系数,而重要系数指在先前层中具有零值的系数。根据本发明,可将信息从源装置12传输到接收装置16,以完成在解码器处用于两种或两种以上不同类型的视频区块的VLC表选择。可基于从源装置12发送到接收装置16的信息来选择多个不同VLC表中的一者以用于每一视频区块类型。接收装置随后基于所解码的视频区块类型在两个所识别的VLC表之间进行选择。
每一VLC表可包括具有不同长度的码符号的集合。码符号可被指派有视频区块内的各自特征(例如精细化系数的特定零游程长度)。在一些情况下,表是静态的,但在其它情况下,可基于编码统计而产生或更新表本身,使得可变长度码字以促进译码效率的方式映射到系数集合。当然,如果在编码器处更新表,则也将需要在解码器处更新表更新。
编码器22和解码器28可执行译码SVC方案中的增强层的互反方法。在编码器22处,可基于经搜集以用于当前或先前译码帧的信息来执行用于编码不同视频区块的表选择。如果选择是基于先前译码帧,则可使用单回合译码,但如果译码基于当前译码帧,则此可需要两回合译码。在一些情况下,可执行先前编码帧的统计分析以有助于编码器22处的表选择。然而,可在解码器28处避免此计算密集型分析。作为替代,可将识别用于第一类型和第二类型的视频区块(例如,帧内译码区块和帧间译码区块)的表的信息从源装置12传输到接收装置16。解码器28随后可使用此传输的信息以有助于正确的表选择。
编码器处的选定表(例如,其可基于统计来选择)可高度取决于译码过程中所使用的量化水平。所使用的量化水平又可取决于视频区块的类型。由于解码器28通常不知道编码器22处所使用的量化水平,因此关于视频区块类型的信息提供有用的替代方案来应用于解码器28处。因此,解码器28识别不同视频区块类型的表,且解码器28可确定与各自视频区块相关联的类型并使用适当的VLC表以解码那个各自视频区块。如本文中所使用,术语译码通常指编码过程或解码过程的至少一部分。视频编码器22编码数据,而视频解码器28解码数据。
VLC表本身可将码字指派到变换系数的不同集合。零值系数的集合可由零的游程长度表示,且可将较常见的游程长度指派给较短VLC码。可将较不常见的游程长度指派给较长VLC码。因此,从VLC表选择码可改进译码效率。VLC表中的码指派在表形成过程期间也可基于统计,但也可使用静态VLC表。
图2为说明可缩放视频位流的基础层17和增强层18内的视频帧的图。如上所述,本发明的技术适用于译码增强层的数据。基础层17可包含含有表示第一水平的空间、时间或SNR可缩放性的编码视频数据的位流。增强层18可包含含有表示第二水平的空间、时间和/或SNR可缩放性的编码视频数据的位流。尽管展示单一增强层,但在一些情况下可使用若干增强层。增强层位流可仅结合基础层(或如果存在多个增强层,则为先前增强层)是可解码的。增强层18含有对基础层17中的所解码视频数据的参考。这些参考可用于变换域或像素域中以产生最终解码的视频数据。
基础层17和增强层18可含有帧内(I)、帧间(P)和双向(B)帧。帧内帧可包括所有帧内译码视频区块。I和P帧可包括至少一些帧间译码视频区块,但也可包括一些帧内译码区块。增强层17的不同帧不需要包括基础层17中的所有视频区块。增强层18中的P帧依赖于对基础层17中的P帧的参考。通过解码增强层18和基础层17中的帧,视频解码器能够增加所解码视频的视频质量。举例来说,基础层17可包括以(例如)每秒15帧的最小帧速率编码的视频,而增强层18可包括以(例如)每秒30帧的最高帧速率编码的视频。为了支持以不同质量水平的编码,可分别使用较高量化参数(QP)和较低QP编码基础层17和增强层18。此外,可以比增强层18的传输可靠的方式传输基础层17。举例来说,所调制信号的最可靠部分可用于传输基础层17,而所调制信号的较不可靠部分可用于传输增强层18。由于可以许多不同方式来界定基础层和增强层,因此图2的说明仅为示范性的。
图3为说明与本发明一致的视频编码器50的实例的方框图,所述视频编码器50包括VLC单元46以编码数据。图3的视频编码器50可对应于图1中的源装置12的增强层编码器34。即,为简单起见未在图3中说明基础层编码组件。因此,可将视频编码器50视为增强层编码器。或者,视频编码器50的所说明组件也可(例如)在支持基础层和增强层的可缩放视频译码的金字塔式编码器设计中与基础层编码模块或单元组合实施。
视频编码器50可执行视频帧内的区块的帧内和帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除在视频序列的邻近帧内的视频中的时间冗余。对于帧间译码,视频编码器50执行运动估计以追踪在两个或两个以上邻近帧之间的匹配的视频区块的移动。
如图3中所示,视频编码器50接收在将要编码的视频帧内的当前视频区块31(例如,增强层视频区块)。在图3的实例中,视频编码器50包括运动估计单元33、参考帧存储装置35、运动补偿单元37、区块变换单元39、量化单元41、反量化单元42、反变换单元44和VLC单元46。也可包括解块过滤器(未图示)以过滤区块边界来移除区块假影。视频编码器50也包括求和器48和求和器51。图3说明用于帧间译码视频区块的视频编码器50的时间预测组件。尽管为易于说明起见而未在图3中展示,但视频编码器50也可包括用于帧内译码一些视频区块的空间预测组件。然而,空间预测组件通常仅用于基础层译码。
运动估计单元33比较视频区块31与一个或一个以上邻近视频帧中的区块以产生一个或一个以上运动向量。可从参考帧存储装置35中检索邻近帧,所述参考帧存储装置35可包含任何类型的存储器或数据存储装置以存储从先前编码区块重建的视频区块。可对(例如)16×16、16×8、8×16、8×8或更小区块大小的可变大小的区块执行运动估计。运动估计单元33(例如)基于速率失真模型来识别邻近帧中的最紧密匹配当前视频区块31的区块,且确定在区块之间的移位。在此基础上,运动估计单元33产生运动向量(MV)(或在双向预测情况下为多个MV),所述运动向量(MV)指示在当前视频区块31与用于译码当前视频区块31的预测区块之间的移位的量值和轨迹。
运动向量可具有一半或四分之一像素精度,或甚至更精细的精度,从而允许视频编码器50以比整数像素定位高的精度追踪运动且获得更好的预测区块。当使用具有分数像素值的运动向量时,在运动补偿单元37中实行内插操作。运动估计单元33可使用速率失真模型来识别用于视频区块的最佳运动向量。通过使用所得的运动向量,运动补偿单元37通过运动补偿形成预测视频区块。
视频编码器50通过在求和器48处从原始、当前视频区块31减去由运动补偿单元37产生的预测视频区块来形成残余视频区块。区块变换单元39将例如离散余弦变换(DCT)等变换应用于残余区块,从而产生残余变换区块系数。量化单元41量化残余变换区块系数以进一步减小位速率。求和器49A(例如)从基础层编码器(未图示)接收基础层系数信息,且定位在区块变换单元39与量化单元41之间以将此基础层系数信息供应到增强层译码中。具体来说,求和器49A从区块变换单元39的输出减去基础层系数信息。以类似方式,定位在反变换单元44与反量化单元42之间的求和器49B也从基础层编码器(未图示)接收基础层系数信息。求和器49B将基础层系数信息添加回到反量化单元42的输出。
VLC单元46根据可变长度译码方法来译码经量化的变换系数以更进一步减小所传输信息的位速率。具体来说,VLC单元46应用本发明的技术来对增强层的精细化系数进行译码。VLC单元46也可产生额外信息以识别解码器应将哪些表用于不同类型的视频区块。此额外信息可包括在经译码的位流中,使得解码器可确定用于不同类型的视频区块的正确表,且随后基于将要解码的视频区块类型来选择所述表。
可基于经搜集以用于先前或当前译码帧的信息来执行由VLC单元46进行的对用于编码不同视频区块的表选择。举例来说,可执行对先前译码帧的统计分析以有助于由VLC单元46进行表选择。然而,可在解码器处避免此计算密集型分析。作为替代,可将识别用于第一类型和第二类型的视频区块(例如,帧内译码区块和帧间译码区块)的表的信息译码到位流中。解码器装置可使用此传输的信息来促进正确的表选择。或者,在一些情况下,编码装置和解码装置可具有将哪些表用于不同视频区块类型的协议。
在可变长度译码之后,可将编码视频传输到另一装置。另外,反量化单元42和反变换单元44分别应用反量化和反变换以重建残余区块。求和器51将所重建的残余区块添加到由运动补偿单元37产生的运动补偿预测区块,以产生用于存储在参考帧存储装置35中的经重建视频区块。经重建视频区块由运动估计单元33和运动补偿单元37使用以编码随后视频帧中的区块。
图4为说明视频解码器60的实例的方框图,其可对应于执行基础层和增强层解码的图1的视频解码器28。视频解码器60包括用于增强层信息的VLC单元52A,其执行图3的VLC单元46的互反功能。即,如同VLC单元46,VLC单元52A译码增强层的精细化系数。如所述,在编码器处,可基于经搜集以用于先前或当前译码帧的信息来执行用于编码不同视频区块的VLC表选择,例如使用先前编码或当前编码帧的统计分析以有助于编码器处的表选择。然而,可在解码器40处避免此计算密集型分析。作为替代,可将识别用于第一类型和第二类型的视频区块(例如,帧内译码区块和帧间译码区块)的表的信息从编码器传输到解码器60。解码器60可使用此传输的信息以有助于正确的表选择。
视频解码器60也可包括用于基础层信息的另一VLC单元52B。帧内预测单元55可任选地执行基础层视频区块的任何空间解码,且可将帧内预测单元55的输出提供到加法器53。增强层路径可包括反量化单元58A,且基础层路径可包括反量化单元56B。可由加法器57来组合基础层和增强层路径中的信息。
视频解码器60可执行视频帧内的区块的帧内和帧间解码。在图4的实例中,视频解码器60包括VLC单元52A和52B(以上提及)、运动补偿单元54、反量化单元56A和56B、反变换单元58和参考帧存储装置62。视频解码器60也包括求和器64。任选地,视频解码器60也可包括过滤求和器64的输出的解块过滤器(未图示)。而且,加法器57组合基础层和增强层路径中的信息,且帧内预测单元55和加法器53有助于基础层视频区块的任何空间解码。
根据本发明,VLC单元52A接收经编码视频位流的增强层信息,且应用在本发明中所描述的VLC技术。具体来说,对于精细化系数,视频位流可经译码以识别用于两种或两种以上不同类型的视频区块的适当VLC表。VLC单元52A确定正译码的每一视频区块的视频区块类型,且基于在位流中所传输的识别用于那个视频区块类型的此VLC解码表的信息来选择用于各自视频区块的适当VLC解码表。解码过程可产生经量化的残余系数、宏区块和子区块译码模式和运动信息,所述运动信息可包括运动向量和区块分割。
在由VLC单元52A执行的解码之后,运动补偿单元54从参考帧存储装置62接收运动向量和一个或一个以上经重建参考帧。反量化单元56A反量化(即,解量化)经量化的区块系数。在由加法器57组合增强层和基础层信息之后,反变换单元58将反变换(例如,反DCT)应用于系数以产生残余区块。运动补偿单元54产生运动补偿区块,由求和器64将其与残余区块求和以形成解码区块。需要时,也可应用解块过滤器以过滤解码区块以移除区块假影。随后将过滤区块置放于参考帧存储装置62中,其从运动补偿提供参考区块且也产生到驱动显示装置(例如图1的装置30)的解码视频。
图5为说明示范性VLC单元46的方框图,其可对应于图3中所示的那个VLC单元。VLC单元46包括编码模块72、表选择模块74和VLC表78。VLC表78通常指可存储于任何位置(例如,在本地或在单独的存储器位置上的芯片外)中的表。可在需要时周期地更新VLC表78。
编码模块72在单独的译码回合中编码精细化系数和重要系数。可基于经搜集以用于先前译码或当前译码帧的信息来执行由VLC单元46用于编码与不同视频区块相关联的系数的表选择。举例来说,先前编码帧的统计分析可经执行以有助于由VLC单元46进行表选择。对于精细化系数(和可能的其它系数),VLC单元46产生信息(其随后包括在经编码位流中),所述信息识别在解码器处用于不同类型的视频区块的不同VLC表。解码器装置可使用此信息以有助于正确的表选择。识别在解码器处用于不同类型的视频区块的不同VLC表的信息可采取不同形式,但在一种情况下包含两位信息。第一位识别来自帧内译码区块的两个可能表的表,且第二位识别来自帧间译码区块的两个可能表的表。当然,如果存在选自每一类型区块的两个以上表,则可需要更多信息。
精细化系数可具有限于-1,0和1的值,其可由两位信息译码。第一位(coeff_ref_flag)可指示系数等于0(coeff_ref_flag=0)或非(coeff_ref_flag=1),且第二位可指示精细化系数的正负号(被指示为sn)与先前层的对应系数的正负号(被指示为sn-1)相同(coeff_ref_dir_flag=0)或不同(coeff_ref_dir_flag=1)。先前层表示为sn-1。如果当前系数的正负号与先前层的正负号相同,则coeff_ref_dir_flag=0,且如果当前系数的正负号不同于先前层的正负号,则coeff_ref_dir_flag=1。可将两个精细化位组合成如下表1中中的三个精细化符号的字母表:
表1
coeff_ref_flag | coeff_ref_dir_flag | ref_symbol |
0 | - | 0 |
1 | 0 | 1 |
1 | 1 | 2 |
或者,在不偏离本发明的技术的情况下另一方案也可用于译码精细化系数。
VLC表78可包含映射到系数的不同集合的可变长度码字,其可由符号、旗标或其它类型的位来界定。可在需要时更新VLC表78。任何数目的表可包括在VLC表88中。在一些情况下,使用两个表,但可包括更多表。在任何情况下,编码模块72可存取用于不同类型的视频区块的VLC表的不同者,且可传达关于用于不同类型的视频区块的这些表的信息作为经编码位流的一部分。以此方式,解码器装置不需要执行任何计算密集型统计分析以确定使用哪些表,且作为替代,可简单地从经编码位流中的信息来识别表。可每帧一次、每切片一次、每帧的FGS层一次或每其它类型的译码单元一次地界定译码不同类型的视频区块中所使用的表。
图6为说明示范性VLC单元52A的方框图,其可对应于图4中所示的VLC单元52A。VLC单元52A相对于由VLC单元46执行的编码来执行互反解码(reciprocaldecoding)功能。因此,VLC单元46接收经量化的残余系数且产生位流,而VLC单元52A接收位流且产生经量化的残余系数。然而,不同于VLC单元46,VLC解码单元不需要执行任何计算密集型统计分析来确定使用哪些表,且作为替代,可简单地从经编码位流中的信息来识别表,且基于那个视频区块的区块类型来选择用于给定视频区块的表。
VLC单元52A包括解码模块82、表选择模块86和一个或一个以上VLC表88。如同在单元46中,单元52的VLC表88通常指可存储于任何位置(例如,在本地或在单独的存储器位置上的芯片外)中的表。可在需要时周期地更新VLC表88。任何数目的表可包括在VLC表88中。在一些情况下使用两个表,但可包括更多表。
VLC解码单元82可执行用于重要系数和精细化系数的单独解码回合。本发明的技术可仅适用于译码或精细化系数,或可用于精细化系数和重要系数两者。
由解码模块82接收的经编码位流包括表示编码系数的信息(例如,码字);和识别将要用于解码不同类型的视频区块的表的信息。表选择模块86确定应使用哪些表来用于每一译码单元(例如每一帧)的不同类型的视频区块。解码模块82随后基于如由表选择模块86界定的适当VLC表86来解码所接收的信息,以产生在位流中译码的经量化的残余系数。
图7为说明与本发明一致的用于增强层的系数(例如,通常为精细化系数)的可变长度译码的编码技术的流程图。如图7中所示,表选择模块76选择将要用于编码的适当表(91)。选定表可促进译码效率,且可基于先前译码或当前译码的视频帧的统计分析来选择。具体来说,表选择模块76可基于与此些区块相关联的量化水平和指示哪些表用作类似量化水平的对应统计来选择将要用于译码视频区块的不同VLC表。
编码模块72通过在VLC表78中执行表查找来编码系数(92),由表选择模块76选择所述VLC表78。系数的集合(例如零游程长度的集合或译码区块模式的集合)可被指派有VLC表中的可变长度码。以此方式,可使用较短长度的码字译码系数的较可能集合,且可使用较短长度的码字译码系数的较不可能集合以促进译码效率。
不同VLC表可经选择以用于不同类型的视频区块(例如,帧内译码区块和帧间译码区块),因为通常以不同量化水平译码这些不同类型的视频区块。VLC单元46产生识别将要用于解码不同视频区块类型的表的信息(93)。VLC单元46的输出位流可包括表示编码系数的信息和识别将要用于解码不同类型的视频区块的表的信息。
可将输出位流转发到传输器(例如图1的调制器/传输器24)以用于在通信通道15上传输到接收装置16。位流的此传输包括表示编码系数的信息的传输(94),其可包含从VLC表78中选择的码字。另外,位流的传输包括识别将要用于解码不同类型的视频区块的表的信息的传输(95)。可针对每一译码单元(例如针对将要译码的每一切片或每一帧)重复图7的过程(96)。
图8为说明与本发明一致的用于增强层的可变长度译码系数(通常为精细化系数)的解码技术的流程图。如图8中所示,VLC解码模块82接收表示编码系数的信息(101),且接收识别将要用于解码不同视频区块类型的不同表的信息(102)。例如接收器/解调器26(图1)的接收器可有助于从通信信道15接收此信息。
表选择模块86基于识别将要使用的不同表的所接收信息来选择用于不同视频区块类型的表(103)。不同视频区块类型可包含帧内译码区块和帧间译码区块。因此,帧内译码区块和帧间译码区块可被指派有用于每一译码单元(例如,每一帧或每一切片)的不同VLC表。解码模块82基于选定表来解码表示编码系数的信息(104)。举例来说,解码模块82可存取VLC表88中的选定者且执行表查找以解码信息而产生系数。针对每一译码单元重复图8的过程(105)。或者,如果在编码器与解码器之间预先建立关于用于不同区块类型的表的协议,则可消除步骤102,且步骤103的表选择可仅基于将要解码的区块类型。
如本文中所描述,在编码器处,可基于经搜集以用于先前译码或当前译码帧的信息来执行用于编码与不同类型的视频区块相关联的精细化系数的表选择。举例来说,先前译码帧的统计分析可经执行以有助于编码器处的表选择。举例来说,可使用可用表来编码精细化系数,且可选择提供给出最少数目的位以编码信息的表。然而,可在解码器处避免此计算密集型分析。作为替代,可将识别用于第一类型和第二类型的视频区块(例如,帧内译码区块和帧间译码区块)的表的信息从编码器传输到解码器。解码器可基于区块类型使用此传输的信息以有助于正确的表选择。
选定表可取决于编码过程中所使用的量化水平。所使用的量化水平又可视视频区块的类型而定。由于解码器通常不知道编码器处所使用的量化水平,因此关于视频区块类型的信息提供应用于解码器处的有用选择工具。因此,解码器识别用于不同视频区块类型的表,且解码器可确定与各自视频区块相关联的类型并选择适当VLC表以解码所述各自视频区块。用于不同类型的视频区块的表可在逐帧基础上(或逐切片基础上)改变。
本文中所描述的技术可以硬件、软件、固件或其任何组合来实施。可在整合的逻辑装置中一起实施描述为模块或组件的任何特征,或作为离散但可互操作的逻辑装置单独地实施。如果以软件实施,则所述技术可至少部分由计算机可读媒体实现,所述计算机可读媒体包含在执行时执行以上所描述方法中的一者或一者以上的指令。计算机可读数据存储媒体可形成计算机程序产品的一部分,所述计算机程序产品可包括封装材料。计算机可读媒体可包含例如同步动态随机存取存储器(SDRAM)的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体等。另外或替代地,所述技术可至少部分由计算机可读通信媒体实现,所述计算机可读通信媒体以指令或数据结构的形式载运或传送代码且可由计算机存取、读取和/或执行。
代码可由一个或一个以上处理器执行,例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效整合或离散的逻辑电路。因此,如本文中所使用的术语“处理器”可指以上结构中的任一者或适合于实施本文所描述技术的任何其它结构。另外,在一些方面中,可将本文中所描述的功能性提供在经配置以用于编码和解码的专用软件模块或硬件模块内,或并入组合的视频编码器-解码器(CODEC)中。
本发明也可针对电路,例如集成电路、芯片组ASIC、FPGA、逻辑或其各种组合,其经配置以执行本文中所描述的技术中的一者或一者以上。因此,本发明也涵盖一种经配置用于译码SVC方案的增强层的电路,其中所述电路经配置以基于可变长度译码表来编码与增强层的视频区块相关联的系数,产生识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息,将表示编码系数的信息传输到解码装置,和传输识别将要由解码装置用于解码第一类型的视频区块的第一可变长度译码表和将要由解码装置用于解码第二类型的视频区块的第二可变长度译码表的信息。
本发明也涵盖一种经配置以用于译码可缩放视频译码(SVC)方案的增强层的电路,其中所述电路经配置以接收表示与增强层的视频区块相关联的编码系数的信息,接收识别将要用于解码第一类型的视频区块的第一可变长度译码表和将要用于解码第二类型的视频区块的第二可变长度译码表的信息,基于识别将要使用的第一可变长度译码表和第二可变长度译码表的信息来选择用于解码表示编码系数的信息的表,和基于选定表来解码表示编码系数的信息。
另外,本发明涵盖一种经配置以用于译码SVC方案的增强层的电路,其中所述电路经配置以接收表示与增强层的视频区块相关联的编码系数的信息,根据与编码器一起建立的协议基于与视频区块相关联的区块类型来选择将要用于解码信息的不同的可变长度译码表,基于选定表来解码表示编码系数的信息。
已描述本发明的各种实施例。这些和其它实施例处于所附权利要求书的范围内。
Claims (25)
1.一种对可缩放视频译码(SVC)方案的增强层进行译码的方法,所述方法包含:
基于复数个译码单元中的每一个译码单元的可变长度译码表来编码与所述增强层的视频区块相关联的系数;
针对每一个译码单元,产生识别将要由解码装置用于解码第一类型的所述视频区块的第一可变长度译码表和将要由所述解码装置用于解码第二类型的所述视频区块的第二可变长度译码表的信息,其中所述产生识别将要由解码装置用于解码第一类型的所述视频区块的第一可变长度译码表和将要由所述解码装置用于解码第二类型的所述视频区块的第二可变长度译码表的信息包括执行针对与所述增强层相关联的先前译码或当前译码所搜集的信息的统计分析;
将表示所述编码系数的信息传输到解码装置;以及
针对每一个译码单元,传输识别将要由所述解码装置用于解码所述第一类型的所述视频区块的所述第一可变长度译码表和将要由所述解码装置用于解码所述第二类型的所述视频区块的所述第二可变长度译码表的所述信息,其中所述传输识别将要由所述解码装置用于解码所述第一类型的所述视频区块的所述第一可变长度译码表和将要由所述解码装置用于解码所述第二类型的所述视频区块的所述第二可变长度译码表的所述信息针对每一译码单元传输一次。
2.根据权利要求1所述的方法,其中所述系数包含所述可缩放视频译码方案中的一个或一个以上先前层的对应系数针对其具有非零值的精细化系数。
3.根据权利要求1所述的方法,其中编码所述系数包含:所述译码单元包括视频帧,
基于经搜集以用于先前译码帧的信息来选择所述第一可变长度译码表和第二可变长度译码表。
4.根据权利要求3所述的方法,其中选择所述第一译码表和第二译码表包含:从两个或两个以上可能表中选择所述第一译码表和第二译码表。
5.根据权利要求1所述的方法,其中所述第一类型的所述视频区块包括帧内译码视频区块,且所述第二类型的所述视频区块包含帧间译码视频区块。
6.根据权利要求1所述的方法,其中所述视频区块布置在帧中,所述译码单元为视频帧,所述方法进一步包含:对于所述帧中的每一者,传输识别将要使用的所述第一可变长度译码表和第二可变长度译码表的所述信息。
7.根据权利要求1所述的方法,其中表示所述编码系数的所述信息包含从所述可变长度译码表中的一者或一者以上中选择的码字。
8.一种对可缩放视频译码(SVC)方案的增强层进行解码的方法,所述方法包含:
针对复数个译码单元中的每一个译码单元接收表示与所述增强层的视频区块相关联的编码系数的信息;
针对每一个译码单元,接收识别将要用于解码第一类型的所述视频区块的第一可变长度译码表和将要用于解码第二类型的所述视频区块的第二可变长度译码表的信息;
针对每一个译码单元,基于识别将要使用的所述第一可变长度译码表和第二可变长度译码表的所述信息来选择用于解码表示所述编码系数的所述信息的表;以及
基于所述选定表来解码表示所述编码系数的所述信息,其中所述识别将要由所述解码装置用于解码所述第一类型的所述视频区块的所述第一可变长度译码表和将要由所述解码装置用于解码所述第二类型的所述视频区块的所述第二可变长度译码表的所述信息针对每一译码单元被接收一次。
9.根据权利要求8所述的方法,其中所述系数包含所述可缩放视频译码方案中的一个或一个以上先前层的对应系数针对其具有非零值的精细化系数。
10.根据权利要求8所述的方法,其中选择所述第一译码表和第二译码表包含:从两个或两个以上可能表中选择所述第一译码表和第二译码表。
11.根据权利要求8所述的方法,其中所述第一类型的所述视频区块包含帧内译码视频区块,且所述第二类型的所述视频区块包含帧间译码视频区块。
12.根据权利要求8所述的方法,其进一步包含:接收识别将要每帧使用一次的所述第一可变长度译码表和第二可变长度译码表的所述信息。
13.根据权利要求8所述的方法,其中表示所述编码系数的所述信息包含由编码器从所述可变长度译码表中的一者或一者以上中选择的码字。
14.一种对可缩放视频译码(SVC)方案的增强层进行译码的装置,所述装置包含:
编码器,其基于复数个译码单元中的每一个译码单元的可变长度译码表来编码与所述增强层的视频区块相关联的系数,且针对每一个译码单元,产生识别将要由解码装置用于解码第一类型的所述视频区块的第一可变长度译码表和将要由所述解码装置用于解码第二类型的所述视频区块的第二可变长度译码表的信息,其中所述产生识别将要由解码装置用于解码第一类型的所述视频区块的第一可变长度译码表和将要由所述解码装置用于解码第二类型的所述视频区块的第二可变长度译码表的信息包括执行针对与所述增强层相关联的先前译码或当前译码所搜集的信息的统计分析;以及
传输器,其针对每一个译码单元传输表示所述编码系数的信息,且针对每一个译码单元,传输识别将要由所述解码装置用于解码所述第一类型的所述视频区块的第一可变长度译码表和将要由所述解码装置用于解码第二类型的视频区块的所述第二可变长度译码表的所述信息,其中所述传输识别将要由所述解码装置用于解码所述第一类型的所述视频区块的所述第一可变长度译码表和将要由所述解码装置用于解码所述第二类型的所述视频区块的所述第二可变长度译码表的所述信息针对每一译码单元传输一次。
15.根据权利要求14所述的装置,其中所述系数包含所述可缩放视频译码方案中的一个或一个以上先前层的对应系数针对其具有非零值的精细化系数。
16.根据权利要求14所述的装置,其中所述译码单元包括视频帧,所述编码器基于经搜集以用于先前译码帧的信息来选择所述第一可变长度译码表和第二可变长度译码表。
17.根据权利要求14所述的装置,其中所述第一类型的所述视频区块包含帧内译码视频区块,且所述第二类型的所述视频区块包含帧间译码视频区块。
18.根据权利要求14所述的装置,其中所述视频区块布置在帧中,所述译码单元为视频帧,且所述传输器传输识别将要针对所述帧中的每一者使用一次的所述第一可变长度译码表和第二可变长度译码表的所述信息。
19.根据权利要求14所述的装置,其中表示所述编码系数的所述信息包含从所述可变长度译码表中的一者或一者以上中选择的码字。
20.根据权利要求14所述的装置,其中所述装置包含以下至少一者:
电路;以及
无线通信装置。
21.一种对可缩放视频译码(SVC)方案的增强层进行解码的装置,所述装置包含:
接收器,其针对复数个译码单元中的每一个译码单元接收表示与所述增强层的视频区块相关联的编码系数的信息,且接收识别将要用于解码第一类型的所述视频区块的第一可变长度译码表和将要用于解码第二类型的所述视频区块的第二可变长度译码表的信息;以及
解码器,其针对每一个译码单元,基于识别将要使用的所述第一可变长度译码表和第二可变长度译码表的所述信息来选择用于解码表示所述编码系数的所述信息的表,且基于所述选定表来解码表示所述编码系数的所述信息,其中所述识别将要由所述解码装置用于解码所述第一类型的所述视频区块的所述第一可变长度译码表和将要由所述解码装置用于解码所述第二类型的所述视频区块的所述第二可变长度译码表的所述信息针对每一译码单元被接收一次。
22.根据权利要求21所述的装置,其中所述系数包含所述可缩放视频译码方案中的一个或一个以上先前层的对应系数针对其具有非零值的精细化系数。
23.根据权利要求21所述的装置,其中所述第一类型的所述视频区块包含帧内译码视频区块,且所述第二类型的所述视频区块包含帧间译码视频区块。
24.根据权利要求21所述的装置,其中所述视频区块布置在帧中,所述译码单元包括 视频帧,且所述接收器接收识别将要针对所述帧中的每一者使用一次的所述第一可变长度译码表和第二可变长度译码表的所述信息。
25.根据权利要求21所述的装置,其中所述装置包含以下至少一者:
电路;以及
无线通信装置。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US82927406P | 2006-10-12 | 2006-10-12 | |
US82927606P | 2006-10-12 | 2006-10-12 | |
US60/829,274 | 2006-10-12 | ||
US60/829,276 | 2006-10-12 | ||
US88374107P | 2007-01-05 | 2007-01-05 | |
US60/883,741 | 2007-01-05 | ||
US11/867,999 US8325819B2 (en) | 2006-10-12 | 2007-10-05 | Variable length coding table selection based on video block type for refinement coefficient coding |
US11/867,999 | 2007-10-05 | ||
PCT/US2007/080832 WO2008045883A2 (en) | 2006-10-12 | 2007-10-09 | Variable length coding table selection based on video block type for refinement coefficient coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101523919A CN101523919A (zh) | 2009-09-02 |
CN101523919B true CN101523919B (zh) | 2011-09-14 |
Family
ID=41082559
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780038020.6A Expired - Fee Related CN101523919B (zh) | 2006-10-12 | 2007-10-09 | 基于用于精细化系数译码的视频区块类型的可变长度译码表选择 |
CN200780037940.6A Expired - Fee Related CN101669368B (zh) | 2006-10-12 | 2007-10-11 | 基于对应变换系数值的历史的精细化系数译码 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780037940.6A Expired - Fee Related CN101669368B (zh) | 2006-10-12 | 2007-10-11 | 基于对应变换系数值的历史的精细化系数译码 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN101523919B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9912943B2 (en) * | 2013-07-15 | 2018-03-06 | Qualcomm Incorporated | Signaling of bit rate information and picture rate information in VPS |
US9554150B2 (en) * | 2013-09-20 | 2017-01-24 | Qualcomm Incorporated | Combined bi-predictive merging candidates for 3D video coding |
CN115361549B (zh) * | 2018-12-21 | 2024-04-09 | 华为技术有限公司 | 一种使用基于历史的运动矢量预测的编码器、解码器及相应方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7010037B2 (en) * | 2002-08-06 | 2006-03-07 | Koninklijke Philips Electronics N.V. | System and method for rate-distortion optimized data partitioning for video coding using backward adaptation |
US20040179606A1 (en) * | 2003-02-21 | 2004-09-16 | Jian Zhou | Method for transcoding fine-granular-scalability enhancement layer of video to minimized spatial variations |
-
2007
- 2007-10-09 CN CN200780038020.6A patent/CN101523919B/zh not_active Expired - Fee Related
- 2007-10-11 CN CN200780037940.6A patent/CN101669368B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101523919A (zh) | 2009-09-02 |
CN101669368A (zh) | 2010-03-10 |
CN101669368B (zh) | 2013-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101578870B (zh) | 对可缩放视频译码(svc)方案的增强层进行译码的方法和装置 | |
CN101627636B (zh) | 可缩放视频译码增强层中的精细化和有效系数的组合式游程长度译码的方法和装置 | |
CN101637024B (zh) | 用于经译码块模式的可变长度译码技术 | |
JP5307017B2 (ja) | リファインメント係数符号化のためのビデオブロックに基づいた可変長符号化テーブル選択 | |
CN101828399B (zh) | 用于可缩放位深度的可缩放视频译码方法和设备 | |
CN102172023B (zh) | 用大宏块进行视频译码 | |
CN102172021B (zh) | 用大宏块进行视频译码 | |
US9319700B2 (en) | Refinement coefficient coding based on history of corresponding transform coefficient values | |
CN102187671B (zh) | 基于向量化熵译码的加权预测 | |
CN102172025A (zh) | 用大宏块进行视频译码 | |
CN101822065A (zh) | 对视频块的经交错子块的熵译码 | |
CN101822057A (zh) | 视频块标头信息的自适应译码 | |
CN101919253A (zh) | 基于水平和垂直对称的滤波系数的视频译码 | |
CN101855908B (zh) | 用于可缩放视频译码的改进的加强层译码 | |
CN101622880A (zh) | 第二回合视频译码中的有效的视频块模式改变 | |
CN102007769A (zh) | 用于视频编码中的速率控制的死区参数选择 | |
CN101523919B (zh) | 基于用于精细化系数译码的视频区块类型的可变长度译码表选择 | |
RU2409003C1 (ru) | Выбор таблицы кодирования с переменной длиной на основании типа видеоблока для совершенствования кодирования коэффициентов |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110914 Termination date: 20181009 |
|
CF01 | Termination of patent right due to non-payment of annual fee |