CN101690227B - 用于对子带进行熵译码的子带扫描技术 - Google Patents

用于对子带进行熵译码的子带扫描技术 Download PDF

Info

Publication number
CN101690227B
CN101690227B CN2008800218127A CN200880021812A CN101690227B CN 101690227 B CN101690227 B CN 101690227B CN 2008800218127 A CN2008800218127 A CN 2008800218127A CN 200880021812 A CN200880021812 A CN 200880021812A CN 101690227 B CN101690227 B CN 101690227B
Authority
CN
China
Prior art keywords
subband
video
coding
decoding
carried out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008800218127A
Other languages
English (en)
Other versions
CN101690227A (zh
Inventor
郑赫俊
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN101690227A publication Critical patent/CN101690227A/zh
Application granted granted Critical
Publication of CN101690227B publication Critical patent/CN101690227B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明描述用于对视频序列的视频数据进行编码及/或解码的技术。一般来说,本发明陈述用于子带译码的情形中的扫描技术,其可改进可由子带译码之后的熵译码实现的压缩级别。在一个实例中,一种对视频序列的视频数据进行编码方法包含对所述视频数据进行子带编码以产生多个子带;基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从二维块扫描成一维向量;及对所述经扫描的子带中的每一者进行熵编码。

Description

用于对子带进行熵译码的子带扫描技术
本申请案主张2007年6月26日申请的美国临时申请案第60/946,358号的权利,所述申请案的全文以引用的方式并入本文中。
技术领域
本发明涉及用以压缩视频数据的视频译码,且更明确地说涉及在对视频数据进行熵译码期间使用的扫描技术。
背景技术
数字视频能力可并入广泛范围的装置中,包括数字电视、数字直播系统、例如无线电电话手持机的无线通信装置、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、视频游戏装置、视频游戏控制台等。数字视频装置实施视频压缩技术(例如MPEG-2、MPEG-4或H.264/MPEG-4第十部分、高级视频译码(AVC))以更有效地发射及接收数字视频。视频压缩技术执行空间及时间预测以减少或移除为视频序列中所固有的冗余。
基于块的视频压缩技术通常执行空间预测及/或时间预测。帧内译码通常依赖于空间预测来减少或移除给定译码单元内视频块之间的空间冗余,给定译码单元可包含视频帧、视频帧的片段或任何独立可解码单元。相反,帧间译码依赖于时间预测来减少或移除视频序列的时间上连续的译码单元的视频块之间的时间冗余。对于帧内译码,视频编码器可执行空间预测以基于相同译码单元内的其它数据来压缩数据。对于帧间译码,视频编码器可执行运动估计及运动补偿以追踪两个或两个以上邻近译码单元的对应视频块的移动。
译码视频块可由包含预测模式及预测块大小的预测信息以及指示正被译码的块与预测块之间的差异的残差数据块表示。在帧间译码的情况下,使用一个或一个以上运动向量识别预测数据块。对于帧内译码,预测模式可用以产生预测块。
在基于块的预测译码之后,视频编码器可应用变换、量化及熵译码处理以进一步减少与残差块的通信相关联的位速率。变换技术可包含离散余弦变换或概念上类似的处理、整数变换或其它类型的变换。在离散余弦变换(DCT)处理中,作为实例,变换处理将一组像素值转换成变换系数,其可表示频域中像素值的能量。
将量化应用到变换系数,且通常涉及限制与任何给定变换系数相关联的位数目的处理。熵译码包含一个或一个以上共同地压缩经量化变换系数的序列的处理。可对量化变换系数执行扫描技术(例如Z字形(zig-zag)扫描技术)以界定来自二维块的系数的一维向量。接着(例如)经由内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码处理而对经扫描的系数熵进行译码。
在许多情况下,视频序列可被译码成基础层及一个或一个以上增强层。在此情况下,基础层可界定视频质量的基础水平,且一个或一个以上增强层可增强经解码的视频信号的质量。增强层可以多种方式改进视频质量,例如,通过向基础层帧提供空间或信噪增强或通过在基础层帧之间添加额外帧而向经解码的视频提供时间增强。在任一情况下,可将经编码的视频发射到视频解码装置,所述视频解码装置执行视频编码器的互逆处理以便重构视频序列。
发明内容
本发明描述用于对视频序列的视频数据的编码及/或解码的技术。一般来说,本发明陈述用于子带译码的情形中的扫描技术。所描述的扫描技术可改进可由子带译码之后的熵译码实现的压缩级别。所述扫描技术可用于许多不同情形,例如,在编码处理中无论何时熵编码在子带编码之后,及在解码处理中无论何时子带解码在熵解码之后。另外,本发明陈述完整编码及解码处理,其尤其可用于帧内译码视频块,且可提供用于界定基础及增强层的机制以实现译码处理中的缩放性。
在一个实例中,本发明提供一种对视频序列的视频数据进行编码的方法,所述方法包含对所述视频数据进行子带编码以产生多个子带;基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从二维块扫描成一维向量;及对所述经扫描的子带中的每一者进行熵编码。
在另一实例中,本发明提供一种对视频序列的视频数据进行解码的方法,所述方法包含对对应于所述视频数据的多个子带中的每一者进行熵解码;基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从一维向量扫描成二维块;及对所述多个子带进行子带解码以产生所述视频数据。
在另一实例中,本发明提供一种对视频序列的视频数据进行编码的设备,所述设备包含子带译码单元,其对所述视频数据进行编码以产生多个子带;扫描单元,其基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从二维块扫描成一维向量;及熵译码单元,其对所述经扫描的子带中的每一者进行熵编码。
在另一实例中,本发明提供一种对视频序列的视频数据进行解码的设备,所述设备包含熵译码单元,其对对应于所述视频数据的多个子带中的每一者进行熵解码;扫描单元,其基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从一维向量扫描成二维块;及子带译码单元,其对所述多个子带进行子带解码以产生所述视频数据。
在另一实例中,本发明提供一种对视频序列的视频数据进行编码的装置,所述装置包含用于对所述视频数据进行子带编码以产生多个子带的装置;用于基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从二维块扫描成一维向量的装置;及用于对所述经扫描的子带中的每一者进行熵编码的装置。
在另一实例中,本发明提供一种用于对视频序列的视频数据进行解码的装置,所述装置包含用于对对应于所述视频数据的多个子带中的每一者进行熵解码的装置;用于基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从一维向量扫描成二维块的装置;及用于对所述多个子带进行子带解码以产生所述视频数据的装置。
本发明中描述的技术可以硬件、软件、固件或其任何组合来实施。如果以硬件实施,则设备可作为集成电路、处理器、离散逻辑或其任何组合实现。如果以软件实施,则软件可执行于一个或一个以上处理器中,例如微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或数字信号处理器(DSP)。执行所述技术的软件可初始地存储于计算机可读媒体中且被加载于处理器中并在处理器中执行。
因此,本发明还涵盖一种计算机可读媒体,其包含在视频译码装置中执行时致使所述装置对视频序列的视频数据进行编码的指令,其中所述指令致使所述装置对所述视频数据进行子带编码以产生多个子带;基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从二维块扫描成一维向量;及对所述经扫描的子带中的每一者进行熵编码。
另外,本发明还涵盖一种计算机可读媒体,其包含在视频译码装置中执行时致使所述装置对视频序列的视频数据进行解码的指令,其中所述指令致使所述装置对对应于所述视频数据的多个子带中的每一者进行熵解码;基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从一维向量扫描成二维块;及对所述多个子带进行子带解码以产生所述视频数据。
在又一实例中,本发明提供一种对视频序列的视频数据进行编码的装置,所述装置包含子带译码单元,其对所述视频数据进行编码以产生多个子带;扫描单元,其基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从二维块扫描成一维向量;熵译码单元,其对所述经扫描的子带中的每一者进行熵编码以产生位流的至少一部分;及无线发射器,其将所述位流发送到另一装置。
在又一实例中,本发明提供一种对视频序列的视频数据进行解码的装置,设备包含无线接收器,其接收包含对应于所述视频数据的多个经熵译码的子带的位流;熵译码单元,其对所述多个子带中的每一者进行熵解码;扫描单元,其基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从一维向量扫描成二维块;及子带译码单元,其对所述多个子带进行子带解码以产生所述视频数据。
在附图及以下描述中陈述本发明的一个或一个以上方面的细节。本发明中描述的技术的其它特征、目标及优势将从描述及图式及从权利要求书变得显而易见。
附图说明
图1为说明视频编码及解码系统的示范性框图。
图2为说明符合本发明的视频编码器的实例的框图。
图3为说明符合本发明的子带译码单元的实例的框图。
图4为说明符合本发明的视频解码器的实例的概念图。
图5为说明符合本发明的用于子带译码的情形中的扫描及熵译码技术的流程图。
图6A到图6D说明不同子带的示范性扫描顺序。
图7到图12为说明符合本发明的各种译码技术的流程图。
具体实施方式
本发明描述用于对视频序列的视频数据进行编码及/或解码的技术。一般来说,本发明陈述用于子带译码的情形中的扫描技术。所描述的扫描技术可改进可由子带译码之后的熵译码实现的压缩级别。所述扫描技术可用于许多不同情形,例如,在编码处理中无论何时熵编码在子带编码之后,及在解码处理中无论何时子带解码在熵解码之后。另外,本发明陈述完整的编码及解码处理,其可特定地用于帧内译码视频块,且可提供用于界定基础及增强层的机制以实现译码处理中的缩放性。
子带译码指其中将数据块变换成多个子带的处理。通常,子带译码涉及由编码器进行的滤波及下取样。举例来说,视频数据的块可由高通及低通滤波器进行滤波,且在每一滤波步骤之后被下取样。在二维子带译码中,视频数据块可变换成四个子带,包含低低(LL)子带、低高(LH)子带、高低(HL)子带及高高(HH)子带。LL子带本质上为原始视频块的下取样型式,而LH、HL及HH子带界定(例如)在水平、垂直及对角维度上的LL子带的下取样中丢失的信息。如果使用额外子带译码(例如,三维子带译码),则可相对于LL子带再次应用相同子带译码处理。此处理可针对子带译码的任一维度重复多次。在下文更详细地论述子带译码的额外细节。
在某些方面中,本发明陈述用于子带译码的情形中的扫描技术,其可改进可由子带译码之后的熵译码实现的压缩级别。然而,所述扫描技术可用于许多其它情形,例如,在编码处理中无论何时熵编码在子带编码之后,及在解码处理中无论何时子带解码在熵解码之后。一般来说,本发明提出对于LL子带、LH子带、HL子带及HH子带使用不同扫描顺序。所述扫描将二维数据块转换成一维向量,其可接着被熵译码。通过界定不同子带的不同扫描顺序,高能量子带系数可分组在一起,且低能量子带系数可分组在一起,借此促进有效熵译码。所述扫描技术可对于每一子带为固定的或自适应的。
另外,本发明还陈述完整的编码及解码处理,其可特定地用于视频块的帧内译码。所描述的编码及解码处理还可提供用于界定基础及增强层的机制以实现译码处理中的缩放性。基本上,编码处理包括子带译码,继之以子带域中的子带中的每一者的预测译码。预测译码可包含类似于ITU H.264中陈述者的帧内预测,但应用于子带域中,而非常规像素域中。根据本发明还可使用其它类型的帧内预测,或可能的帧间预测。
在子带域中的预测之后,残差子带可经由离散余弦变换(DCT)或概念上类似的处理予以变换,且接着被量化。扫描及熵译码可接着应用于经量化及经变换的子带,例如,实施本发明的扫描技术,其提供用于子带中的每一者的不同扫描顺序。
经帧内译码的数据可表示为对应于经译码的LL子带的基础层,及对应于其它子带的一个或一个以上增强层。此外,本发明还认识到,对于HH子带,可避免DCT变换步骤(只要DCT不压缩HH子带便可)。解码处理执行编码处理中的那些处理的逆操作以便重构原始视频数据。
图1为说明可实施本发明的技术中的一者或一者以上的示范性视频编码及解码系统10的框图。如图1中所示,系统10包括经由通信信道15将经编码的视频发射到目的装置16的源装置12。源装置12及目的装置16可包含广泛范围装置中的任一者。在某些情况下,源装置12及目的装置16包含无线通信装置手持机,例如所谓的蜂窝式或卫星无线电电话。然而,更一般地应用于视频编码及解码的本发明的技术未必限于无线应用或设定。
在图1的实例中,源装置12可包括视频源20、视频编码器22、调制器/解调制器(调制解调器)23及发射器24。目的装置16可包括接收器26、调制解调器27、视频解码器28及显示器装置30。根据本发明,源装置12的视频编码器22可经配置以执行本发明的编码技术。类似地,目的装置16的视频解码器28可经配置以执行本发明的解码技术。又,图1的所说明的系统10仅为本发明的技术可使用的一个示范性系统。
根据本发明,视频编码器22对视频序列的视频数据进行编码。明确地说,视频编码器22可编码视频数据以产生多个子带,基于针对子带中的每一者所界定的扫描顺序将子带中的每一者从二维块扫描成一维向量,且熵编码经扫描的子带中的每一者。在某些情况下,在子带译码之后及在扫描及熵译码之前,视频编码器22可预测性地编码所述子带以产生子带的残差、对所述残差进行变换且对与所述残差相关联的变换系数进行量化。
在解码器侧,视频解码器28可对视频序列的视频数据进行解码。明确地说,视频解码器28可对对应于视频数据的多个子带中的每一者进行解码,基于针对子带中的每一者所界定的扫描顺序将子带中的每一者从一维向量扫描成二维块,且对所述多个子带进行子带解码以产生视频数据。在某些情况下,在扫描及熵译码之后及在子带译码之前,视频编码器28可对所述子带进行逆量化、逆变换及预测性解码。
一般来说,源装置12产生经译码的视频数据以供发射到目的装置16。然而,在某些情况下,装置12、16可以大体上对称的方式操作。举例来说,装置12、16中的每一者可包括视频编码及解码组件。因此,系统10可支持视频装置12、16之间的单程或双程视频发射,例如,以用于视频串流、视频回放、视频广播或视频电话。符合本发明的装置还可在(例如)不向其它装置传达经编码的视频的情况下对视频数据进行捕捉、编码、存档及解码以供回放。
源装置12的视频源20可包括视频捕捉装置,例如摄像机、含有先前捕捉的视频的视频存档或来自视频内容提供者的视频馈入。作为另一替代方案,视频源20可产生基于计算机图形的数据作为源视频,或直播视频、所存档的视频与计算机产生的视频的组合。在某些情况下,如果视频源20为摄像机,则源装置12及目的装置16可形成所谓的相机电话或视频电话。在每一情况下,所捕捉、预捕捉或计算机产生的视频可由视频编码器22编码。经编码的视频信息可接着由调制解调器23根据通信技术(例如码分多址(CDMA)或另一通信技术或标准)调制,且经由发射器24发射到目的装置16。
目的装置16的接收器26经由信道15接收信息,且调制解调器27对所述信息进行解调制。由视频解码器28执行的视频解码处理可执行熵解码、扫描及子带解码作为视频序列的重构的部分。显示器装置28将经解码的视频数据显示给用户,且可包含各种显示器装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示器装置。
在图1的实例中,通信信道15可包含任何无线或有线通信媒体,例如射频(RF)频谱或一个或一个以上物理发射线,或无线媒体与有线媒体的任何组合。通信信道15可形成基于包的网络的部分,例如局域网络、广域网络或全球网络(例如因特网)。通信信道15通常表示任何适合的通信媒体,或不同通信媒体的集合,以供将视频数据从源装置12发射到目的装置16。
由视频编码器22及视频解码器28执行的熵译码可根据内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码方法操作。此外,所述技术可容易地配置以符合一个或一个以上视频压缩标准,例如运动图片专家组(MPEG)在MPEG-1、MPEG-2及MPEG-4中界定的那些标准、ITU-T H.263标准、ITU-TH.264标准、H.264/MPEG-4第十部分、高级视频译码(AVC)、运动图片与电视工程师协会(SMPTE)421M视频CODEC标准(通常称作“VC-1”)、由中国音频视频译码技术标准工作组(通常称作“AVS”)界定的标准,以及由标准化组织界定或由组织开发的如专属或非专属标准的任何其它视频译码标准。
尽管在图1中未图示,但在某些方面中,视频编码器22及视频解码器28可各自与音频编码器及解码器集成,且可包括适当多路复用-解多路复用(MUX-DEMUX)单元或其它硬件及软件,以处理共同数据流或单独数据流中的音频与视频两者的编码。如果适用,则多路复用-解多路复用单元(MUX-DEMUX)可遵照ITU H.223多路复用器协议,或例如用户数据报协议(UDP)的其它协议。
视频编码器22及视频解码器28各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码器22及视频解码器28中的每一者可包括于一个或一个以上编码器或解码器中,其任一者可在相应移动装置、订户装置、广播装置、服务器等中集成为组合式编码器/解码器(CODEC)的部分。此外,视频编码器22及视频解码器28各自可以软件实施,在所述情况下,视频编码器22及视频解码器28可包含由装置12及16的一个或一个以上处理器执行的计算机可执行指令以便执行本文描述的技术。
视频序列包括一系列视频帧,视频帧包括视频块及可能的经译码的单元(例如视频块的片段)。在某些情况下,视频序列可被布置为图像群组(GOP)。视频编码器22对个别视频帧内的视频块操作以便对视频数据进行编码。本发明的所述技术提供可应用到包含视频块的视频数据的译码技术。在某些情况下,所述技术可应用到某些视频块(例如帧内块),而其它类型的技术用于其它类型的视频块(例如帧间块)。
视频块可具有固定或变化的大小,且大小可根据所规定的译码标准而不同。每一视频帧可包括一系列片段,且在某些情况下,片段可自身独立地界定可解码单元。每一片段可包括一系列视频块,例如宏块,宏块可布置成甚至更小的视频块。宏块通常指16×16的视频数据块。ITU-T H.264标准支持各种块大小的帧内预测,例如16×16、8×8、4×4(亮度(luma)分量),及8×8(色度分量),以及各种块大小的帧间预测,例如16×16、16×8、8×16、8×8、8×4、4×8及4×4(对于亮度分量)及对应的经缩放大小(对于色度分量)。
在本发明中,术语“视频块”一般可指任何大小的视频数据块。此外,视频块可界定于若干不同域中,例如像素域、子带域、DCT变换域等。较大视频块(例如宏块)可分割成较小大小视频块。较小视频块可提供较好分辨率,且可用于定位包括较高级别细节的视频帧。在下文的论述中,子带译码为二维的,且从8×8元件视频块产生四个4×4元件子带。然而,所述技术并不限于二维子带译码或任何特定视频块大小或子带大小。
图2为说明视频编码器50的实例的框图,其可对应于视频编码器22且可包含视频编码器22的一部分。视频编码器50尤其适用作帧内译码器,以基于译码单元内的空间相似性而对视频块进行帧内译码。如图2中所示,视频编码器50接收输入视频数据,所述输入视频数据可包含待帧内译码的视频块。
视频编码器50包括子带译码单元52。子带译码单元52对输入的视频数据进行子带编码以产生多个子带。举例来说,子带译码单元52可对所述视频数据进行滤波及下取样以产生多个子带。在二维子带译码的情况下,子带包含低低(LL)子带、低高(LH)子带、高低(HL)子带及高高(HH)子带。对于三维子带译码,LL子带自身用以产生四个子-子带。对于四维子带译码,从LL子带产生的LL子-子带又用以产生四个子-子-子带。
本发明可应用于任何维的子带译码。在任一情况下,所产生的多个子带包含共同表示视频块的一组子带。下文更详细地论述的图3提供示范性子带译码单元的额外细节。出于说明的目的,本发明描述二维子带译码,其中视频块被子带译码成LL、LH、HL及HH子带。
预测译码单元54接收LL、LH、HL及HH子带,且执行相对于所述子带中的每一者的预测译码。预测译码可包含帧间或帧内预测技术,例如,时间或空间预测。然而,出于说明的目的,可假设预测译码单元54执行帧内预测。在此情况下,帧内预测可包含基于相同译码单元内及子带域内的数据(例如)以类似于H.264帧内预测的方式的预测。然而,常规H.264帧内预测发生在像素域中,而本发明的类H.264帧内预测技术可发生在子带域中。还可使用其它类型的帧内预测(例如,类似于H.263或另一标准的帧内预测的帧内预测)。
在H.264中,帧内译码模式可包含例如垂直、水平、DC、左下对角、右下对角、垂直向右、水平向下、垂直向左及水平向上的模式。这些不同模式的每一者界定基于相同译码单元内的相邻数据产生预测块的方式。帧内译码模式还可界定上文提及的模式的组合,例如垂直加水平、DC加垂直、DC加水平、左下对角加水平、右下对角加垂直、垂直向右加水平、水平向下加垂直、垂直向左加水平,及水平向上加垂直。
若干符合H.264的模式的额外细节陈述在以下文献中:Y.野(Y.Ye)及M.卡兹维茨(M.Karczewicz)的“改进帧内译码(Improved Intra Coding)”,ITU-T Q.6/SG16 VCEG,C257,瑞士的日内瓦(Geneva,Switzerland),2007年6月,所述文献以引用的方式并入本文中。在任一情况下,本发明并不限于任一特定数目的模式或模式类型。此外,与上文参考的文献中描述的模式不同,预测译码单元54在子带域中操作,例如,使用类似于帧内H.264预测的技术将子带与由预测译码单元54产生的预测子带的数据进行比较,但在子带域中而非常规像素域中进行此操作。基本上,预测模式可界定定位或产生预测子带数据块的数据的方式。预测译码单元54从所产生的预测子带块减去当前子带数据块,以便产生与所述子带相关联的残差数据。所述子带还可被重构且存储为预测参考数据55。
变换单元58对子带应用DCT或概念上类似的变换,子带在此点上由残差数据块表示。量化单元56接着对所述子带进行量化,其在变换处理之后可由变换系数表示。预测语法(例如,指示由预测译码单元54产生预测块的方式)从预测译码单元54转发到熵译码单元62以用于包括于经编码的位流中。逆量化单元61及逆变换单元59重构经译码的子带,使得此经重构的数据可添加回到用于译码中的预测子带数据。如果使用时间预测译码,则预测参考数据55可被存储且用于译码当前子带或可能的随后子带。简短来说,预测译码单元54产生包含残差子带数据的输出。另外,预测译码单元54从逆变换单元59接收残差子带数据的重构型式,且将残差子带数据的重构型式与由预测译码单元54使用的预测子带数据进行组合以对所述残差进行预测性编码。以此方式,预测参考数据55经重构且存储以供在子带域中的当前或随后预测中使用。
根据本发明,扫描单元60应用不同扫描顺序以用于将所述子带中的每一者从二维数据块扫描成一维向量。又,在译码处理的此点处,子带可包含变换到频域的残差数据块。本发明认识到,LL、LH、HL及HH子带通常界定二维数据块内的不同位置处的高能量元件。通过针对LL、LH、HL及HH子带界定不同扫描顺序,扫描可更容易促进有效熵译码。可针对LL、LH、HL及HH子带以不同方式界定所述扫描顺序。此外,在某些情况下,可基于与每一子带中的数据相关联的统计数据随着时间过去而调适LL、LH、HL及HH子带的扫描顺序。以此方式,扫描单元60可以允许通过熵译码单元62进行的改进压缩的方式将二维块(例如,残差或变换格式的子带)扫描成一维向量。
熵译码单元62根据熵译码方法来对对应于LL、LH、HL及HH子带的数据的一维向量以及例如来自预测译码单元54的预测语法的语法进行熵编码。熵译码可遵照内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码方法。熵译码单元62输出经编码的位流,其可接着被发射到另一装置。
CAVLC为由ITU H.264/MPEG4、AVC标准支持的一类熵译码技术。CAVLC以有效地压缩变换系数的串行化“游程”的方式使用可变长度译码(VLC)表。CABAC为由ITU H.264/MPEG4、AVC标准支持的另一类熵译码技术。CABAC可涉及若干阶段,包括二值化、上下文模型选择及二进制算术译码。也存在许多其它类型的熵译码技术,且新的熵译码技术将很可能在将来出现。在任一情况下,本发明的技术通过根据针对不同子带特定地界定的扫描顺序独立地对LL、LH、HL及HH子带进行扫描而促进有效熵译码。
在某些情况下,HH子带可不由变换单元58变换。在此情况下,变换单元58仅对一子组经预测性编码的子带进行变换,例如,LL子带、LH子带及HL子带。DCT或类DCT变换对于HH子带的压缩可为无效的。明确地说,HH子带数据到频域的变换可不压缩HH子带。相应地,对于HH子带,可避免DCT或类DCT变换,但将DCT或类DCT变换应用到其它子带。在此情况下,在熵译码期间HH子带保持未变换。
图3为说明符合本发明的子带译码单元70的实例的框图。子带译码单元70可对应于图2的子带译码单元52。子带译码单元70可视作包括水平单元72及垂直单元74。子带译码单元70接收视频块形式(例如,8×8像素视频块)的视频数据。水平单元72在水平维度上对数据进行滤波及下取样,且垂直单元74在垂直维度上对数据进行滤波及下取样。子带LL包含原始视频块的以因子4下取样(例如,在水平及垂直维度上下取样2倍)的型式。子带LH可视作由于下取样而丢失的水平维度的信息,子带HL可视作由于下取样而丢失的垂直维度的信息,且子带HH可视作由于下取样而丢失的对角维度的信息。
更具体来说,输入视频块由水平单元72接收,且水平单元72向数据应用低通滤波器L(X)76及高通滤波器H(X)78。下取样单元82及84以因子2下取样经低通及高通滤波的数据。下取样单元82及84的输出传到垂直单元74,垂直单元74向每一相应数据路径应用低通滤波器L(Y)86及90及高通滤波器H(Y)88及92。下取样单元94、96、98及99分别以因子2下取样由滤波器86、88、90、82输出的每一数据路径。如图3中说明,垂直处理单元74的输出对应于子带译码单元70的输出,且包含LL、LH、HL及HH子带。在某些情况下,LL子带界定基础层的至少一部分,而LH子带、HL子带及HH子带中的一者或一者以上形成一个或一个以上增强层的至少部分。以此方式,子带译码可用以促进可缩放视频译码,其中LL子带界定基础质量等级,且其它子带界定对由LL子带界定的基础质量等级的空间增强。
图4为说明符合本发明的视频解码器100的实例的框图,其可对应于视频解码器28。基本上,视频解码器100执行由图2的编码器50执行的编码处理的互逆解码处理。在此情况下,视频解码器100接收经编码的位流。熵解码器单元102应用相对于由熵编码单元62(图2)执行的熵编码的互逆熵解码。将预测语法转发到预测解码单元110,且预测语法可包含用于预测解码的预测模式,或用于预测解码的任何其它信息。
逆扫描单元104使用相对于由扫描单元60(图2)应用的技术的互逆扫描技术来逆扫描经熵解码的子带。在此情况下,逆扫描单元104基于针对子带中的每一者所界定的扫描顺序将所述子带中的每一者从一维向量扫描成二维块。又,通过界定LL、LH、HL及HH子带的不同扫描顺序,可促进有效熵译码。此外,LL、LH、HL及HH子带的扫描顺序(及因此的逆扫描)可(例如)基于先前译码统计数据为自适应的。本发明提供针对LL、LH、HL及HH子带中的每一者的不同扫描顺序(及逆扫描顺序)的使用,但不应被视作限制可使用的各种实际扫描顺序。下文提供实例扫描顺序。
逆量化单元108对子带执行逆量化。逆变换单元106接着执行逆变换(例如,逆DCT或类逆DCT操作),如果HH子带未在编码器侧变换,则可能排除对HH子带的逆变换。变换方法可针对编码器50且针对解码器100被预设定以确保一致性,或可在所发射的数据的语法中传达。预测解码单元110基于从熵解码单元102转发的预测语法来使用预测参考数据111产生预测数据。预测解码单元110将预测数据与残差子带数据进行组合以便产生子带。类似预测译码单元54,预测解码单元110可在子带域中实施类似于ITU H.264帧内预测模式的帧内预测技术。以此方式,预测解码单元110可产生解码子带域中的残差所需的预测数据。
子带解码单元112接着通过执行子带编码单元52(图2)的相反功能而对子带中的每一者进行解码。可通过观察图3的子带译码单元70而在概念上理解子带解码单元112的操作。对于解码,信号路径被反向,滤波器抽头(filter tap)被反转,且执行向上取样而非下取样。因此,对于解码,解码单元112接收LL、LH、HL及HH子带且将这些子带组合(例如,根据图3中展示的路径的反相信号路径),以便产生由编码器初始地译码的对应于视频数据的视频块。
图5为说明符合本发明的用于子带译码的情形中的扫描及熵译码技术的流程图。图5关于编码处理的角度论证扫描及熵译码,但还可应用于解码处理。对于编码,扫描将对应于每一子带的二维数据块改变成一维向量,且熵译码在扫描之后。对于解码,扫描将对应于每一子带的所接收的一维向量改变回为二维块。在已知编码及解码的互逆性质的情况下,图5仅呈现从编码器的角度的扫描及熵译码。在解码器中,可执行相同决定,但熵译码(在此情况下为解码)在扫描之前。此外,在解码侧,扫描可为从一维向量产生二维块的逆扫描。
如图5中所示,扫描单元60执行针对不同子带的不同扫描。对于LL子带(“是”120),扫描单元60使用LL扫描模式以便将对应于LL子带的二维数据块扫描成一维向量(122)。熵译码单元62接着对对应于经扫描的LL子带的一维向量进行熵译码(124)。对于LH子带(“是”130),扫描单元60使用LH扫描模式以便将对应于LH子带的二维数据块扫描成一维向量(132)。熵译码单元62接着对对应于经扫描的LH子带的一维向量进行熵译码(134)。
对于HL子带(“是”140),扫描单元60使用HL扫描模式以便将对应于HL子带的二维数据块扫描成一维向量(142)。熵译码单元62接着对对应于经扫描的HL子带的一维向量进行熵译码(144)。对于HH子带(“是”150),扫描单元60使用HH扫描模式以便将对应于HH子带的二维数据块扫描成一维向量(152)。熵译码单元62接着对对应于经扫描的HH子带的一维向量进行熵译码(154)。又,针对LL、LH、HL及HH子带使用不同扫描顺序可改进可由熵译码实现的压缩级别。
图6A到图6D说明针对不同子带的示范性扫描顺序。明确地说,图6A到图6D说明子带域中的二维数据块,其具有对应于将二维上的数据扫描成一维向量的顺序的编号系数。对于LL带(图6A中所示),扫描顺序可类似于扫描在左上角开始且进行到右下角的Z字形扫描。这是因为LL带的高能量系数通常位于二维块的左上角中,及低能量系数位于右下角中。对于LH带(图6B中所示),扫描顺序可类似于的Z字形扫描,但可开始于右上角且朝向左下角扫描。这是因为LH带的高能量系数通常位于二维块的右上角中,及低能量系数位于左下角中。
对于HL带(图6C中所示),扫描顺序可类似于的Z字形扫描,但可开始于左下角且朝向右上角扫描。这是因为LH带的高能量系数通常位于二维块的左下角中,及低能量系数位于右上角中。对于HH带(图6D中所示),扫描顺序可类似于的Z字形扫描,但可开始于右下角且朝向左上角扫描。这是因为LH带的高能量系数通常位于二维块的右下角中,及低能量系数位于左上角中。
如图6A到图6D的实例中所示的实际扫描顺序可从纯粹的Z字形顺序有少许改变。此外,在某些情况下,这些所界定的扫描顺序可基于与先前经译码的子带相关联的统计数据随着时间经过而调适。以此方式,扫描可调适为更佳地反映低能量及高能量系数的可能位置。通过将高能量系数分组在经扫描的一维向量的开始附近,且将低能量系数分组在经扫描的一维向量的结束附近,随后的熵译码可实现改进的压缩。明确地说,低能量系数的分组通常引起零值系数的较大“游程”,其可经由熵译码而容易地得以压缩。
图7为说明根据本发明的译码处理的流程图,所述译码处理尤其可用于帧内译码。图8为展示对应解码处理的流程图。图7的处理可由编码器50执行以用于对帧内块进行编码,且图8的处理可由解码器100执行以用于对帧内块进行解码。在下文从编码器50的角度描述图7的处理,且从解码器100的角度描述图8的处理。
对于编码处理,视频编码器50的子带译码单元52对帧内块进行子带译码以产生多个子带(170)。所述子带可对应于LL子带、LH子带、HL子带及HH子带。预测译码单元54使用预测技术对所述子带中的每一者进行预测性编码(171)。举例来说,预测译码单元54可应用类似于H.264帧内译码的技术,但可在子带域中应用所述技术。变换单元58(例如)根据离散余弦变换(DCT)或类似于H.264中界定的变换的概念上类似的处理而对经量化的子带进行变换(172)。量化单元56接着对所述子带进行量化(173)。在变换及量化期间(例如,在预测译码之后),所述子带可由残差数据块表示。在变换之后,所述子带可由界定频域中的残差块的变换系数表示。
接着,扫描单元60根据针对每一子带界定的扫描顺序来对每一经量化及经变换的子带进行扫描(174)。熵译码单元62接着对每一经扫描的子带进行熵译码(175)。举例来说,熵译码单元62可应用CAVLC技术、CABAC技术或其它熵译码技术以对每一经扫描的子带进行熵译码。
对于解码处理,视频解码器100的熵解码单元102对每一子带进行熵解码(180)以产生变换系数的一维集合。逆扫描单元104根据每一子带的扫描顺序对所述子带进行逆扫描(181)以产生对应于所述子带的二维块。逆量化单元108对所述子带进行逆量化(182),且逆变换单元106对每一子带进行逆变换(183)。预测解码单元110(例如)通过在子带域中应用类H.264帧内解码技术对所述子带进行预测性解码(184)。子带解码单元112接着对所述子带进行解码(185)以对不同子带的数据进行组合且借此产生经解码的帧内块。子带的预测及子带解码通常可并行地发生。
如上文提及,在某些情况下,可能不希望对HH子带应用变换(例如,172(图7)或183(图8)的DCT或类DCT变换及逆变换步骤)。在所述情况下,对HH子带的变换对压缩可为无效的。相应地,在所述情况下,除去对HH子带的变换步骤。
图9及图10为说明根据本发明的编码及解码处理的流程图,所述编码及解码处理可用于帧内译码。在图9及图10中,不对HH子带进行变换。对于编码处理,视频编码器50的子带译码单元52对帧内块进行子带译码以产生子带LL、LH、HL及HH(190)。预测译码单元54使用预测技术对所述子带中的每一者进行预测性编码(191)。预测译码单元54可应用类似于H.264帧内译码的技术,但可在子带域中应用所述技术。接着,变换单元58对LL、LH及HL带进行变换,但不对HH带进行变换(192)。量化单元56接着对所述子带进行量化(193)。扫描单元60根据针对每一子带所界定的扫描顺序对每一子带进行扫描(194)。熵译码单元62接着对每一经扫描的子带进行熵译码(195)。
对于解码处理,视频解码器100的熵解码单元102对每一子带进行熵译码(200)以产生系数的一维集合。逆扫描单元104根据针对每一子带的扫描顺序对所述子带进行逆扫描(201)以产生对应于所述子带的二维块。逆量化单元108对所述子带进行逆量化(202)。逆变换单元106接着对子带LL、LH及HL进行逆变换,但不对HH子带进行逆变换(203)。预测解码单元110对所述子带进行预测性解码(204),且子带解码单元112接着对LL、LH、HL及HH子带进行解码(205)以组合不同子带的数据且借此产生经解码的帧内块。
图11及图12说明可使用本发明的扫描技术的编码及解码的替代类型。如上文所述,图11及图12的技术不使用子带译码作为初始编码步骤及最终解码步骤。而是,在图11及图12中,将较常规预测译码方法用于像素域中,且将子带译码使用执行为替换常规DCT译码的变换处理。在此类情形中,可仍实施涉及针对不同子带使用不同扫描顺序的本发明的扫描技术以改进熵译码。
将从图1的视频编码器22及视频解码器28的角度描述图11及图12。如图11中所示,视频编码器22接收(例如)包含待译码的视频块的视频数据(210)。视频编码器22在像素域中使用预测技术对视频数据进行编码(211)。视频编码器22经由子带译码对视频数据进行变换以产生多个子带(212),且对视频数据进行量化(213)。根据本发明,视频编码器22根据针对所述子带中的每一者所界定的扫描顺序而对所述子带中的每一者进行扫描(214)。又,此意味着所述子带中的每一者具有其自身的扫描顺序,其可为固定的或自适应的。一旦经过扫描,视频编码器22接着对所述子带中的每一者进行熵译码(215)。通过针对不同子带界定不同扫描顺序,可使熵译码在实现压缩上更有效。
如图12中所示,视频解码器28接收(例如)包含经译码的视频块的经编码的子带数据(220)。视频解码器28对所述子带中的每一者进行熵解码(221)。接着,视频解码器28根据针对所述子带中的每一者所界定的扫描顺序而对所述子带中的每一者进行逆扫描(222)。视频解码器28对所述数据进行逆量化(223),且经由子带解码对所述数据进行逆变换(224)。在此情况下,视频解码器28在像素域中对所述数据进行预测性解码(225)。又,图11及图12的技术为相对上文描述的技术的替代译码技术,其中使用子带译码作为DCT译码的替代方案。在此情况下,类似于上文提出的帧内译码方法,可希望针对不同子带界定不同扫描顺序以便改进熵译码。
本发明的所述技术可以广泛多种装置或设备实现,包括无线手持机及集成电路(IC)或一组IC(即,芯片组)。已描述经提供以强调功能方面的任何组件、模块或单元,且其未必需要通过不同硬件单元实现。
因此,本文描述的技术可以硬件、软件、固件或其任何组合实施。描述为模块或组件的任何特征可一起实施于集成逻辑装置中或单独作为离散但能共同操作的逻辑装置。如果以软件实施,则所述技术可至少部分地通过计算机可读媒体实现,所述计算机可读媒体包含当在视频译码装置中执行时致使装置执行上文描述的所述方法中的一者或一者以上的指令。所述计算机可读媒体可形成计算机程序产品的部分,其可包括包装材料。计算机可读媒体可包含随机存取存储器(RAM)(例如同步动态随机存取存储器(SDRAM))、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体等。另外或替代地,所述技术可至少部分地由计算机可读通信媒体来实现,所述计算机可读通信媒体携载或传达呈指令或数据结构的形式的代码且可由计算机存取、读取及/或执行。
代码可由一个或一个以上处理器来执行,例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。因此,在本文中所使用的术语“处理器”可指上述结构的任一者或适于实施本文中所述的技术的任何其它结构。另外,在某些方面中,本文描述的功能性可提供于经配置以用于编码及解码的专用软件模块或硬件模块内,或并入于组合式视频编码器-解码器(CODEC)中。此外,所述技术可完全实施于一个或一个以上电路或逻辑元件中。
已描述本发明的各种方面。这些及其它方面均在所附权利要求书的范围内。

Claims (28)

1.一种对视频序列的视频数据进行编码的方法,所述方法包含:
对所述视频数据进行子带编码以产生多个子带,包含产生低低LL子带、产生低高LH子带、产生高低HL子带及产生高高HH子带;
基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从二维块扫描成一维向量;以及
对所述经扫描的子带中的每一者进行熵编码;
其中在对所述子带中的每一者进行扫描及熵编码之前,所述方法还包括:
对所述子带中的每一者进行预测性编码;
对一子组所述经预测性编码的子带进行变换,及对所述子带中的每一者进行量化,其中对所述子组进行变换包含对所述LL子带、所述LH子带及所述HL子带进行变换,其中所述HH子带在所述熵编码期间保持未变换;以及
对所述经变换及经预测性编码的所述子带中的每一者进行量化。
2.根据权利要求1所述的方法,其中对所述视频数据进行子带编码包含对所述视频数据进行滤波及下取样以产生所述多个子带。
3.根据权利要求1所述的方法,其中所述视频数据包含视频块,其中所述多个子带包含共同表示所述视频块的一组子带。
4.根据权利要求3所述的方法,其中所述方法对应于用于对所述视频块进行帧内编码的帧内译码模式。
5.根据权利要求4所述的方法,其中所述LL子带形成基础层的至少部分,且所述LH子带、所述HL子带及所述HH子带中的一者或一者以上形成一个或一个以上增强层的至少部分。
6.一种对视频序列的视频数据进行解码的方法,所述方法包含:
对对应于所述视频数据的多个子带中的每一者进行熵解码,其中所述多个子带包括低低LL子带、低高LH子带、高低HL子带及高高HH子带;
基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从一维向量扫描成二维块;以及
对所述多个子带进行子带解码以产生所述视频数据;
其中在对所述多个子带进行子带解码之前,所述方法还包括:
对所述子带中的每一者进行逆量化;
对一子组所述子带进行逆变换,其中对所述子组进行逆变换包含对所述LL子带、所述LH子带及所述HL子带进行逆变换,其中所述HH子带未变换;以及对所述子带中的每一者进行预测性解码。
7.根据权利要求6所述的方法,其中对所述多个子带进行子带解码包含将所述多个子带进行组合以产生对应于所述视频数据的视频块。
8.根据权利要求6所述的方法,其中所述视频数据包含视频块,其中所述多个子带包含共同表示所述视频块的一组子带。
9.根据权利要求8所述的方法,其中所述方法对应于用于对所述视频块进行帧内解码的帧内译码模式。
10.根据权利要求9所述的方法,其中所述LL子带形成基础层的至少部分,且所述LH子带、所述HL子带及所述HH子带中的一者或一者以上形成一个或一个以上增强层的至少部分。
11.一种对视频序列的视频数据进行编码的设备,所述设备包含:
子带译码单元,其对所述视频数据进行编码以产生多个子带;其中所述子带译码单元产生低低LL子带、产生低高LH子带、产生高低HL子带及产生高高HH子带;
扫描单元,其基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从二维块扫描成一维向量;以及
熵译码单元,其对所述经扫描的子带中的每一者进行熵编码;
其中所述设备进一步包含:
预测译码单元,其对所述子带中的每一者进行预测性编码,
变换单元,其在所述扫描单元对所述子带中的每一者进行扫描之前对一子组所述经预测性编码的子带进行变换,其中所述变换单元对所述LL子带、所述LH子带及所述HL子带进行变换,其中所述HH子带在由所述熵译码单元进行的所述熵编码期间保持未变换;以及
量化单元,其在所述扫描单元对所述子带中的每一者进行扫描之前对所述子带中的每一者进行量化。
12.根据权利要求11所述的设备,其中所述子带译码单元对所述视频数据进行滤波及下取样以产生所述多个子带。
13.根据权利要求11所述的设备,其中所述视频数据包含视频块,其中所述多个子带包含共同表示所述视频块的一组子带。
14.根据权利要求13所述的设备,其中所述设备执行用于对所述视频块进行帧内编码的帧内译码模式。
15.根据权利要求14所述的设备,其中所述LL子带形成基础层的至少部分,且所述LH子带、所述HL子带及所述HH子带中的一者或一者以上形成一个或一个以上增强层的至少部分。
16.根据权利要求11所述的设备,其中所述设备包含集成电路。
17.根据权利要求11所述的设备,其中所述设备包含微处理器。
18.一种对视频序列的视频数据进行解码的设备,所述设备包含:
熵译码单元,其对对应于所述视频数据的多个子带中的每一者进行熵解码;其中所述多个子带包括低低LL子带、低高LH子带、高低HL子带及高高HH子带;
扫描单元,其基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从一维向量扫描成二维块;以及
子带译码单元,其对所述多个子带进行子带解码以产生所述视频数据;
其中所述设备进一步包含:
逆量化单元,其对所述子带中的每一者进行逆量化;
逆变换单元,其对一子组所述子带进行逆变换,其中所述逆变换单元对所述LL子带、所述LH子带及所述HL子带进行逆变换,其中所述HH子带未变换;以及0
预测译码单元,其在所述子带译码单元对所述多个子带进行解码之前对所述子带中的每一者进行预测性解码。
19.根据权利要求18所述的设备,其中所述子带译码单元对所述多个子带进行组合以产生对应于所述视频数据的视频块。
20.根据权利要求18所述的设备,其中所述视频数据包含视频块,其中所述多个子带包含共同表示所述视频块的一组子带。
21.根据权利要求20所述的设备,其中所述设备执行用于对所述视频块进行帧内解码的帧内译码模式。
22.根据权利要求21所述的设备,其中所述LL子带形成基础层的至少部分,且所述LH子带、所述HL子带及所述HH子带中的一者或一者以上形成一个或一个以上增强层的至少部分。
23.根据权利要求18所述的设备,其中所述设备包含集成电路。
24.根据权利要求18所述的设备,其中所述设备包含微处理器。
25.一种对视频序列的视频数据进行编码的装置,所述装置包含:
子带译码单元,其对所述视频数据进行编码以产生多个子带:其中所述子带译码单元产生低低LL子带、产生低高LH子带、产生高低HL子带及产生高高HH子带;
扫描单元,其基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从二维块扫描成一维向量;
熵译码单元,其对所述经扫描的子带中的每一者进行熵编码以产生位流的至少一部分;以及
无线发射器,其将所述位流发送到另一装置;
其中所述装置进一步包含:
预测译码单元,其对所述子带中的每一者进行预测性编码,
变换单元,其在所述扫描单元对所述子带中的每一者进行扫描之前对一子组所述经预测性编码的子带进行变换,其中所述变换单元对所述LL子带、所述LH子带及所述HL子带进行变换,其中所述HH子带在由所述熵译码单元进行的所述熵编码期间保持未变换;以及
量化单元,其在所述扫描单元对所述子带中的每一者进行扫描之前对所述子带中的每一者进行量化。
26.根据权利要求25所述的装置,其中所述装置包含无线通信手持机。
27.一种对视频序列的视频数据进行解码的装置,设备包含:
无线接收器,其接收包含对应于所述视频数据的多个经熵译码的子带的位流;
熵译码单元,其对所述多个子带中的每一者进行熵解码;其中所述多个子带包括低低LL子带、低高LH子带、高低HL子带及高高HH子带;
扫描单元,其基于针对所述子带中的每一者所界定的扫描顺序将所述子带中的每一者从一维向量扫描成二维块;以及
子带译码单元,其对所述多个子带进行子带解码以产生所述视频数据;
其中所述装置进一步包含:
逆量化单元,其对所述子带中的每一者进行逆量化;
逆变换单元,其对一子组所述子带进行逆变换,其中所述逆变换单元对所述LL子带、所述LH子带及所述HL子带进行逆变换,其中所述HH子带未变换;以及
预测译码单元,其在所述子带译码单元对所述多个子带进行解码之前对所述子带中的每一者进行预测性解码。
28.根据权利要求27所述的装置,其中所述装置包含无线通信手持机。
CN2008800218127A 2007-06-26 2008-06-25 用于对子带进行熵译码的子带扫描技术 Expired - Fee Related CN101690227B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US94635807P 2007-06-26 2007-06-26
US60/946,358 2007-06-26
US12/144,454 2008-06-23
US12/144,454 US8331444B2 (en) 2007-06-26 2008-06-23 Sub-band scanning techniques for entropy coding of sub-bands
PCT/US2008/068241 WO2009003065A2 (en) 2007-06-26 2008-06-25 Sub-band scanning techniques for entropy coding of sub-bands

Publications (2)

Publication Number Publication Date
CN101690227A CN101690227A (zh) 2010-03-31
CN101690227B true CN101690227B (zh) 2013-05-29

Family

ID=40160459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800218127A Expired - Fee Related CN101690227B (zh) 2007-06-26 2008-06-25 用于对子带进行熵译码的子带扫描技术

Country Status (7)

Country Link
US (1) US8331444B2 (zh)
EP (1) EP2172027A2 (zh)
JP (1) JP5453253B2 (zh)
KR (1) KR101151114B1 (zh)
CN (1) CN101690227B (zh)
TW (1) TW200910973A (zh)
WO (1) WO2009003065A2 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010092740A1 (ja) * 2009-02-10 2010-08-19 パナソニック株式会社 画像処理装置、画像処理方法、プログラムおよび集積回路
KR20100095992A (ko) * 2009-02-23 2010-09-01 한국과학기술원 비디오 부호화에서의 분할 블록 부호화 방법, 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
US20110090952A1 (en) * 2009-10-21 2011-04-21 Cohen Robert A Directional Transforms for Video and Image Coding
US9215470B2 (en) 2010-07-09 2015-12-15 Qualcomm Incorporated Signaling selected directional transform for video coding
KR20130054408A (ko) 2010-10-05 2013-05-24 제너럴 인스트루먼트 코포레이션 지그재그 스캔에 의한 적응적 컨텍스트 모델 선택을 이용하는 코딩 및 디코딩
US10992958B2 (en) 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
US20130083856A1 (en) * 2011-06-29 2013-04-04 Qualcomm Incorporated Contexts for coefficient level coding in video compression
US8891616B1 (en) 2011-07-27 2014-11-18 Google Inc. Method and apparatus for entropy encoding based on encoding cost
US8885706B2 (en) 2011-09-16 2014-11-11 Google Inc. Apparatus and methodology for a video codec system with noise reduction capability
CN103096058B (zh) * 2011-11-08 2015-12-16 珠海全志科技股份有限公司 一种无线视频传输方法和系统
US9131073B1 (en) 2012-03-02 2015-09-08 Google Inc. Motion estimation aided noise reduction
US9451258B2 (en) * 2012-04-03 2016-09-20 Qualcomm Incorporated Chroma slice-level QP offset and deblocking
US9774856B1 (en) 2012-07-02 2017-09-26 Google Inc. Adaptive stochastic entropy coding
US9344729B1 (en) 2012-07-11 2016-05-17 Google Inc. Selective prediction signal filtering
US9509998B1 (en) 2013-04-04 2016-11-29 Google Inc. Conditional predictive multi-symbol run-length coding
US9392288B2 (en) 2013-10-17 2016-07-12 Google Inc. Video coding using scatter-based scan tables
US9179151B2 (en) 2013-10-18 2015-11-03 Google Inc. Spatial proximity context entropy coding
US10102613B2 (en) 2014-09-25 2018-10-16 Google Llc Frequency-domain denoising
US10602187B2 (en) 2015-11-30 2020-03-24 Intel Corporation Efficient, compatible, and scalable intra video/image coding using wavelets and HEVC coding
US9955176B2 (en) * 2015-11-30 2018-04-24 Intel Corporation Efficient and scalable intra video/image coding using wavelets and AVC, modified AVC, VPx, modified VPx, or modified HEVC coding
US10869032B1 (en) * 2016-11-04 2020-12-15 Amazon Technologies, Inc. Enhanced encoding and decoding of video reference frames
US10264265B1 (en) 2016-12-05 2019-04-16 Amazon Technologies, Inc. Compression encoding of images
KR102645652B1 (ko) * 2018-06-28 2024-03-11 애플 인크. 비디오 인코딩 시스템
KR102541392B1 (ko) 2018-06-28 2023-06-13 애플 인크. 저 레이턴시 비디오 인코딩 및 송신을 위한 레이트 제어

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657085A (en) * 1993-02-18 1997-08-12 Nec Corporation Wavelet transform coding method
EP0817494A2 (en) * 1996-06-28 1998-01-07 Oki Electric Industry Co., Ltd. Image coding method and apparatus

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2869164B2 (ja) * 1990-08-08 1999-03-10 沖電気工業株式会社 画像符号化及び復号化装置
JPH04306095A (ja) * 1991-04-03 1992-10-28 Oki Electric Ind Co Ltd 動画像パケット符号化復号化方式
JPH04326886A (ja) 1991-04-26 1992-11-16 Kokusai Denshin Denwa Co Ltd <Kdd> サブバンド符号化における周波数変換係数のスキャニング方式
JP3534465B2 (ja) 1994-12-28 2004-06-07 パイオニア株式会社 サブバンド符号化方法
JP3660548B2 (ja) 2000-02-01 2005-06-15 日本電信電話株式会社 画像符号化方法及び画像復号方法、画像符号化装置及び画像復号装置、並びにそれらのプログラムを記憶した媒体
US7062098B1 (en) * 2000-05-12 2006-06-13 International Business Machines Corporation Method and apparatus for the scaling down of data
US6839468B1 (en) * 2000-06-28 2005-01-04 International Business Machines Corporation Scaling of multi-dimensional data in a hybrid domain
US6907075B2 (en) * 2000-06-30 2005-06-14 Koninklijke Philips Electronics N.V. Encoding method for the compression of a video sequence
US6891974B1 (en) 2001-01-08 2005-05-10 Microsoft Corporation System and method providing improved data compression via wavelet coefficient encoding
JP3855827B2 (ja) * 2002-04-05 2006-12-13 ソニー株式会社 2次元サブバンド符号化装置
JP2003304404A (ja) * 2002-04-09 2003-10-24 Canon Inc 画像符号化装置
US20050232353A1 (en) * 2002-06-28 2005-10-20 Koninklijke Philips Electronics N.V. Subband video decoding mehtod and device
AU2003280197A1 (en) * 2002-12-04 2004-06-23 Koninklijke Philips Electronics N.V. Video coding method and device
US7590059B2 (en) * 2004-05-21 2009-09-15 Broadcom Corp. Multistandard video decoder
US8442108B2 (en) * 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
WO2007046644A1 (en) 2005-10-21 2007-04-26 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding moving picture using adaptive scanning
TW200746655A (en) * 2005-11-18 2007-12-16 Sony Corp Encoding device and method, decoding device and method, and transmission system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657085A (en) * 1993-02-18 1997-08-12 Nec Corporation Wavelet transform coding method
EP0817494A2 (en) * 1996-06-28 1998-01-07 Oki Electric Industry Co., Ltd. Image coding method and apparatus

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Jungwoo Lee.Subband Video Coding with temporally adaptibe motion interpolation.《Proceedings of the international conference on acoustics,speech,and signal processing》.1994,第499页第1、2段,附图4. *
XinJin等.H.264-Compatible Spatially Scalable Video Coding with In-band Prediction.《Image Processing,2005,ICIP 2005.IEEE International Conference on》.2005,第489-492页. *

Also Published As

Publication number Publication date
KR20100030655A (ko) 2010-03-18
WO2009003065A2 (en) 2008-12-31
US20090003440A1 (en) 2009-01-01
JP5453253B2 (ja) 2014-03-26
TW200910973A (en) 2009-03-01
CN101690227A (zh) 2010-03-31
KR101151114B1 (ko) 2012-06-01
JP2010532141A (ja) 2010-09-30
US8331444B2 (en) 2012-12-11
EP2172027A2 (en) 2010-04-07
WO2009003065A3 (en) 2009-02-26

Similar Documents

Publication Publication Date Title
CN101690227B (zh) 用于对子带进行熵译码的子带扫描技术
RU2482616C2 (ru) Видеокодирование коэффициентов фильтра на основе горизонтальной и вертикальной симметрии
CN102369731B (zh) 基于视频译码中的活动度量的滤波预测
CN101682771B (zh) 视频译码中的自适应系数扫描
CN101637024B (zh) 用于经译码块模式的可变长度译码技术
CN101627636B (zh) 可缩放视频译码增强层中的精细化和有效系数的组合式游程长度译码的方法和装置
CN102342101B (zh) 用于在视频译码中进行内插滤波、环路内滤波和环路后滤波的组合方案
JP5415546B2 (ja) ベクトル化エントロピーコーディングに基づく加重予測
CN103404144A (zh) 视频译码中的经量化脉码调制
CN103270754A (zh) 对视频数据块的系数的模式相依扫描
CN101946515A (zh) Cabac译码器的二回合量化
CN101828399A (zh) 用于可缩放位深度的可缩放视频译码技术
CN101822065A (zh) 对视频块的经交错子块的熵译码
CN103283230A (zh) 使用一维切换滤波器与一维自适应滤波器的组合的视频滤波
EP3010234B1 (en) Method and device for subband coding frequency conversion unit, and method and device for image encoding using same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130529

Termination date: 20190625

CF01 Termination of patent right due to non-payment of annual fee