CN108293138B - 有效和可缩放帧内视频/图像编码 - Google Patents

有效和可缩放帧内视频/图像编码 Download PDF

Info

Publication number
CN108293138B
CN108293138B CN201680069931.4A CN201680069931A CN108293138B CN 108293138 B CN108293138 B CN 108293138B CN 201680069931 A CN201680069931 A CN 201680069931A CN 108293138 B CN108293138 B CN 108293138B
Authority
CN
China
Prior art keywords
wavelet
image
frame
decoder
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680069931.4A
Other languages
English (en)
Other versions
CN108293138A (zh
Inventor
A.普里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN108293138A publication Critical patent/CN108293138A/zh
Application granted granted Critical
Publication of CN108293138B publication Critical patent/CN108293138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

讨论了与使用小波和(高级视频编码)AVC、修改的AVC、VPx、修改的VPx或修改的高效视频编码(HEVC)的帧内视频帧或图像编码有关的技术。这些技术可以包括用以生成子带的对帧或图像的小波分解以及使用相符和/或修改的编码技术对子带进行编码。

Description

有效和可缩放帧内视频/图像编码
要求优先权
本申请要求于2015年11月30日提交的题为“EFFICIENT AND SCALABLE INTRAVIDEO/IMAGE CODING USING WAVELETS AND AVC,MODIFIED AVC,VPx,MODIFIED VPX ORMODIFIED HEVC CODING”的美国专利申请序列号14/954,715的优先权,并且其全部内容通过引用结合于此。
相关申请的交叉引用
本申请包含涉及于2015年11月30日提交的题为“EFFICIENT INTRA VIDEO/IMAGECODING USING WAVELETS AND VARIABLE SIZE TRANSFORM CODING”的美国专利申请序列号14/954,710以及于2015年11月30日提交的题为“EFFICIENT, COMPATIBLE, AND SCALABLEINTRA VIDEO/IMAGE CODING USING WAVELETS AND HEVC CODING”的美国专利申请序列号14/954,837的主题。
背景技术
图像或视频译码器压缩图像或视频信息,以便可以在给定带宽上发送更多信息。然后可以将压缩的信号传送到具有解码器的接收器,解码器在显示之前对信号进行解码或解压缩。
在图像/视频处理方面的进步的环境下开发的本公开解决了与执行对视频的帧内帧和图像的改进编码相关联的问题。这种改进的编码可以包括有效编码和支持基本可缩放性的编码的组合。例如,术语有效编码指的是提供较高压缩效率的译码,允许将特定质量的视频的更多帧内帧或图像存储在计算机磁盘/设备上或者通过指定网络进行传送或者允许存储或传送相同数目但是更高质量(的例如视频的帧内帧或图像)。此外,术语可缩放编码在这里指的是对视频的帧内帧或图像进行译码,使得从单个译码的比特流子集中可以对其进行解码,从而导致不同分辨率的图像或帧内帧。例如,术语“基础可缩放性”在其应用于本公开时指的是除了从相同比特流解码全分辨率版本的能力之外对比特流的子集进行解码以导致较低分辨率层图像或帧内帧的能力。
随着对添加了可缩放性的灵活性的更高质量的更多图像和视频的捕获、存储和传送的需求不断增加,为视频的帧内帧和图像提供改进的压缩技术可能是有利的。正是出于这些和其他考虑,需要目前改进。
附图说明
本文所描述的材料在附图中以示例而非限制的方式图示出。为了说明的简单和清楚起见,附图中所图示的元件不一定按比例绘制。例如,为了清楚起见,一些元件的尺寸可能相对于其他元件被夸大。此外,在认为合适的情况下,参考标记在附图中被重复以指示对应或类似的元件。在附图中:
图1A图示了分析滤波器的示例应用;
图1B图示了合成滤波器的示例应用;
图1C图示了2D信号的示例分析滤波;
图1D图示了示例合成滤波;
图2A图示了将小波滤波应用于图像或视频帧的示例结果;
图2B图示了图像或视频帧的示例两级分解;
图3A是基于小波的译码器/解码器系统的框图;
图3B图示了分解成10个子带的小波3级倍频程;
图3C图示了空间定向树;
图3D图示了示例SPECK译码过程;
图3E示出图像或帧内帧的示例划分;
图4是示例JPEG2000译码器的框图;
图5A是图示出AVC视频高画质译码器的示例块内/I帧编码子集的示例译码器系统的框图;
图5B是图示出AVC视频解码器的块内/I帧编码子集的示例解码器系统的框图,其在本文中被称为能够解码AVC视频高I/帧内译码的比特流的AVC视频高I/帧内帧解码器;
图6A图示了具有移除帧内预测并且包括扫描起始位置和扫描方向信息的AVC高(或高10)I/帧内译码器,其在本文中被表征为AVC视频High*I/帧内译码器;
图6B是在本文中被表征为AVC视频High*I/帧内解码器的示例解码器的框图,其可以解码由AVC视频High*I/帧内译码器生成的比特流;
图6C图示了AVC视频高*(或高10*)帧内译码器的示例特征的框图;
图6D图示了AVC视频高*(或高10*)帧内解码器的示例特征的框图;
图7A是用于提供能够对图像/帧内帧进行空间/SNR可缩放编码的2层可缩放AVC(例如,可缩放视频编码(SVC))译码器的示例译码器的框图;
图7B是用于提供能够对由图7A的译码器生成的空间/SNR可缩放帧内译码流进行解码的2层可缩放AVC(例如,可缩放视频编码(SVC))解码器的示例解码器的框图;
图8A是示例组合自适应小波AVC(AWAVC)编码器的框图;
图8B是另一示例组合自适应小波AVC(AWAVC)编码器的框图;
图9A图示了用于AWAVC帧内译码的示例过程;
图9B图示了用于AWAVC帧内解码的示例过程,其反转了由AWAVC帧内译码所执行的过程;
图10A图示了示例AWAVC帧内译码器的功能框图;
图10B图示了对应于图10A的译码器的功能独立的AWAVC帧内解码器的框图;
图11图示了提供图10A的AWAVC译码器的“自适应小波分析滤波”模块和图10B的AWAVC解码器的“自适应小波合成滤波”模块的细节的系统;
图12A图示了提供图10A的AWAVC帧内译码器的“本地缓冲器和预测分析器和生成器”以及到其余部分的接口的细节的系统;
图12B图示了提供图10B的AWAVC帧内解码器的“本地缓冲器和预测生成器”以及到其余部分的接口的细节的系统;
图13图示了提供图10A的AWAVC帧内译码器的“4×4/8×8 2D块整数(DCT近似)变换”模块和图10B的AWAVC帧内解码器的“4×4/8×8 2D块整数(DCT近似)逆变换”模块的细节的系统;
图14A图示了图像的二级二元分解过程;
图14B是示例AWAC(AW2AVC)帧内编码器的框图;
图15A图示了用于AW2AVC译码的示例过程;
图15B图示了用于AW2AVC解码的示例过程;
图16是自适应小波修改的AVC(AWMAVC)编码器的框图;
图17A图示了AWMAVC帧内译码的示例过程;
图17B图示了用于AWMAVC帧内解码的示例过程,其反转了由AWMAVC帧内译码所执行的过程;
图18A图示了对于变换为4×4变换系数块的LL频带4×4采样块,针对所述变换系数的锯齿形扫描方向;
图18B图示了对于变换为4×4变换系数块的HL频带4×4采样块,针对所述变换系数的锯齿形扫描方向;
图18C图示了对于变换为4×4变换系数块的LH频带4×4采样块,针对所述变换系数的锯齿形扫描方向;
图18D图示了对于变换为4×4变换系数块的HH频带4×4采样块,针对所述变换系数的锯齿形扫描方向;
图19是示例编码器的框图;
图20A图示了用于自适应小波可缩放AVC(AWSVC)帧内译码的示例过程;
图20B图示了用于自适应小波可缩放AVC(AWSVC)帧内解码的示例过程;
图21A图示了示例HEVC主10帧内译码器;
图21B是示例HEVC主10帧内解码器的框图;
图22A图示了可以在不进行帧内预测的情况下提供HEVC主10帧内译码器的示例HEVC主10*帧内译码器;
图22B图示了示例HEVC主10*解码器2202;
图22C图示了HEVC主10*帧内译码器的示例特征的框图;
图22D图示了HEVC主10*帧内解码器的示例特征的框图;
图23是自适应小波修改的HEVC(AWMHVC)编码器的框图;
图24A图示了AWMHVC帧内译码的示例过程;
图24B图示了AWMHVC帧内解码的示例过程,其反转了由AWMHVC帧内译码所执行的过程;
图25A是示例AWMHVC帧内译码器的框图;
图25B是对应于图25A的译码器的示例AWMHVC帧内解码器的框图;
图26A图示了用于LL频带4×4变换系数块的示例扫描图案;
图26B图示了用于HL频带4×4变换系数块的示例扫描图案;
图26C图示了用于LH频带4×4变换系数块的示例扫描图案;
图26D图示了用于HH频带4×4变换系数块的示例扫描图案;
图26E图示了用于LL频带8×8变换系数块的示例扫描图案;
图26F图示了用于HL频带8×8变换系数块的示例扫描图案;
图26G图示了用于LH频带8×8变换系数块的示例扫描图案;
图26H图示了用于HH频带8×8变换系数块的示例扫描图案;
图26I图示了用于LL频带16×16变换系数块的示例扫描图案;
图26J图示了用于HL频带16×16变换系数块的示例扫描图案;
图26K图示了用于LH频带16×16变换系数块的示例扫描图案;
图26L图示了用于HH频带16×16变换系数块的示例扫描图案;
图27是示例自适应小波VP9(AWVP9)编码器的框图;
图28是示例自适应小波修改的VP9(AWMVP9)、VP10(AWMVP10)或AOM(AWMAOM)编码器的框图;
图29是用于译码和/或解码的示例系统的图示;
图30是示例系统的图示;和
图31图示了全部根据本公开的至少一些实现进行布置的示例小形状因子设备。
具体实施方式
现在参考附图描述一个或多个实施例或实现。虽然讨论了特定配置和布置,但应该理解,这仅是用于说明性目的。相关领域的技术人员将认识到,在不脱离本描述的精神和范围的情况下可采用其它配置和布置。相关领域的技术人员将明白,本文所描述的技术和/或布置也可被用在不同于本文所描述的各种其它系统和应用中。
虽然如下描述阐述了可在例如诸如片上系统(SoC)架构的架构中体现的各种实现,但本文描述的技术和/或布置的实现不限于具体架构和/或计算系统,而是可由为了类似目的的任何架构和/或计算系统实现。比如,例如采用多个集成电路(IC)芯片和/或封装的各种架构和/或诸如多功能设备、平板电脑、智能电话等的各种计算装置和/或消费电子(CE)装置可实现本文描述的技术和/或布置。进一步说,虽然如下描述可阐述众多特定细节,诸如系统组件的逻辑实现、类型和相互关系、逻辑划分/集成选择等,但所要求保护的主题可在没有此类特定细节的情况下实行。在其它实例中,诸如例如控制结构和全软件指令序列的一些材料可能未详细示出,以免使本文公开的材料模糊不清。
本文公开的材料可用硬件、固件、软件或它们的任何组合来实现。本文公开的材料还可被实现为存储在机器可读介质上的指令,所述指令可由一个或多个处理器读取和执行。机器可读介质可包含用于存储或传送由机器(例如计算设备)可读形式的信息的任何介质和/或机制。例如,机器可读介质可包含只读存储器(ROM);随机存取存储器(RAM);磁盘存储介质;光存储介质;闪存设备;电、光、声或其它形式的传播信号(例如载波、红外信号、数字信号等)及其它。
在说明书中提到“一个实现”、“实现”、“示例实现”(或“实施例”、“示例”等)等指示所描述的实现可包含具体特征、结构或特性,但每一个实施例可能不一定包含该具体特征、结构或特性。而且,此类短语不一定是指同一实现。进一步说,当结合一个实施例描述具体特征、结构或特性时,认为结合不管本文是否明确描述的其它实现来实现此类特征、结构或特性在本领域技术人员的知识范围内。
本文描述的方法、设备、装置、计算平台和制品涉及使用小波和高级视频编码(AVC)、修改的AVC或修改的高效率视频编码(HEVC)编码的有效帧内视频/图像编码。
在讨论各种实施例的细节之前,本公开提供了基于小波的图像编码的讨论。例如,数字信号的小波滤波过程可以被认为包括两个互补过程,一个是将信号分解为低通和高通子集信号,而反转过程是将低通和高通子集信号组合(重组)回到原始(或接近原始)信号。用于分解的滤波器可被称为分析滤波器,可以先应用分析滤波器,用于重组的滤波器可被称为合成滤波器,并可应用于分解的信号(可在分析滤波器和合成滤波器之间插入其他操作)。在一些示例中,分析和合成滤波器可以是互补对,并且可能需要满足某些数学属性以使最终重建与原始信号类似并具有良好质量的信号。作为它们拥有的不同类别/类型的滤波器和属性的示例,提供了正交滤波器和双正交滤波器类别的属性以及落入前述类别中的特定滤波器或滤波器类型的示例。
在一些示例中,可以利用正交滤波器。例如,正交滤波器可以包括是其相关联的分析滤波器的时间反转版本的合成滤波器、可以从低通滤波器导出的高通滤波器、以及满足正交约束的分析滤波器。在其他示例中,可以利用双正交滤波器。例如,双正交滤波器可以包括有限脉冲响应(FIR)、线性相位和完美重建。但是,双正交滤波器可能不是正交的。
示例双正交类别的小波滤波器包括Haar小波滤波器,但同类别的更高质量的滤波器包括Cohen-Daubechies-Feauveau CDF 5/3、LeGall 5/3滤波器和CDF 9/7滤波器。例如,CDF 5/3或CDF 9/7滤波器可以是双正交的(例如,提供FIR、线性相位和完美重建但不是正交的)、对称的,并且可以具有奇数长度。
正交小波滤波器的一个示例包括各种尺寸的正交镜像滤波器(QMF)。例如,QMF滤波器可以提供FIR、线性相位、无混叠但不完美的重建,并且可以是正交的。
在下面的讨论中,分别在图示出示例滤波器的表格1A-表格3以及本文其他地方中的缩写或术语lpaf、hpaf、lpsf和hpsf分别表示低通分析滤波器、高通分析滤波器、低通合成滤波器和高通合成滤波器。
表1A提供5抽头低通分析滤波器的示例系数,使得滤波器围绕中心系数0.75对称,并且提供3抽头高通分析滤波器的系数,使得滤波器围绕中心系数1.0对称。
Figure 752651DEST_PATH_IMAGE001
表1A 示例CDF或LeGall 5/3分析滤波器。
表1B提供3抽头低通合成滤波器的示例系数,使得滤波器围绕中心系数1.0对称,并且提供5抽头高通合成滤波器的系数,使得滤波器围绕中心系数0.75对称。
Figure 873054DEST_PATH_IMAGE002
表1B 示例CDF或LeGall 5/3合成滤波器。
表1A和表1B的示例滤波器组可以被称为Daubechies 5/3、CDF 5/3或LeGall 5/3滤波器。
图1A图示出了根据本公开的至少一些实现进行布置的分析滤波器的示例应用101。如图1A中所示,原始1D信号可以经历低通分析滤波(lpaf),从而导致由输入信号的2个子带(例如,近似系数)下采样的低通1D信号。例如,并行地,原始1D信号还可以经历高通分析滤波(hpaf),从而导致由输入信号的2个子带(例如,细节系数)下采样的高通1D信号。在一些示例中,图1A中应用的分析滤波器可以是表1A的分析滤波器。
图1B图示出了根据本公开的至少一些实现进行布置的合成滤波器的示例应用102。如图1B中所示,与图1A中应用的分析滤波器互补的合成滤波器可以被应用。例如,来自分析滤波的两个下采样信号(低通和高通子带;例如,近似系数和细节系数)可以被称为低通合成滤波器和高通合成滤波器的一对合成滤波器滤波。两个输出可以被组合,从而导致与输入处的1D原始信号(例如,原始/闭合信号)相同(或几乎相同)的重建信号。在一些示例中,图1B中应用的合成滤波器可以是表1B的合成滤波器。在表1A和表1B的5/3滤波器的应用示例中,由于系数是2的幂,所以输出可以精确相同。但是,在其他示例滤波器的应用中,由于稍微的舍入差异,如果输出不完全相同,则输出可能非常接近。在一些示例中,在分析滤波之后,所得到的低通和高通子带像素(也被称为滤波系数)可以在译码期间通过量化而被选择性地降低精度,并且然后被熵译码以导致压缩。然后,解码器可以通过执行熵解码和逆量化随后合成滤波来反转译码过程。
所讨论的分析/合成滤波过程不限于使用5/3滤波,诸如表1A和表1B的滤波器。例如,所讨论的分析/合成滤波过程可适用于任何分析和合成滤波器,诸如本文讨论的那些滤波器。例如,表2A和表2B提供了示例CDF 9/7滤波器。CDF 9/7滤波器的低通分析滤波器可以是围绕中心系数0.602949对称的9抽头滤波器,并且高通分析滤波器可以是围绕中心系数1.115087对称的7抽头滤波器。在表2B中提供了示例互补低通合成和高通合成滤波器,其中低通合成滤波器长度为7抽头和高通合成滤波器长度为9抽头。
Figure 800863DEST_PATH_IMAGE003
表2A 示例CDF 9/7分析滤波器
Figure 179760DEST_PATH_IMAGE004
表2B 示例CDF 9/7合成滤波器。
先前讨论的滤波器组(例如,CDF(或LeGall)5/3滤波器和CDF 9/7滤波器)是双正交滤波器的示例。然而,本文讨论的技术也适用于诸如QMF滤波器的正交滤波器。例如,表3提供了13抽头QMF低通和高通分析滤波器的示例系数。可以将互补合成滤波器生成为时间反转版本的分析滤波器。
Figure 197395DEST_PATH_IMAGE005
表3 示例QMF 13分析滤波器(合成滤波器是时间反转版本的分析滤波器)。
所描述的技术可以提供信号的1D滤波。现在讨论转向2D滤波,因为图像是2D信号,并且视频可以被认为是由2D帧加上时间维度组成的。例如,到目前为止讨论的1D滤波技术可以被扩展以导出2D滤波技术,如本文进一步讨论的。
例如,小波滤波可以通过不同的分解技术将诸如图像(或视频帧)的2D信号分解成子带,所述分解技术包括均匀带分解、倍频带分解和小波分组分解。例如,倍频带分解可以提供非均匀分离技术,其将低频带分解为更窄的频带,使得高频带留下而不被进一步分解。
图1C图示出了根据本公开的至少一些实现布置的2D信号的示例分析滤波103。如图1C中所示,2D信号的分析滤波可以包括两个阶段,第一阶段用于在一维(例如,垂直)执行滤波,并且第二阶段用于在第二维(例如,水平)对第一阶段的输出执行滤波。例如,分析滤波103可以提供2D信号(例如图像或帧内帧)的分析滤波。在第一阶段中使用的分析滤波器(例如,低通分析滤波器和高通分析滤波器)和在第二阶段中可以是相同的。例如,在第一阶段中,它们可以被应用于行,而在第二阶段中,它们可以被应用于列。图1C中所图示的用于2D信号的整个2阶段分解/分析滤波过程可以通过2次操作来提供滤波和子采样,并且可以导致被称为低-低(LL)、低-高(LH)、高-低(HL)和高-高(HH)的4个子带。例如,图1C图示出了将2D信号x(m,n)分解成具有由y LL (p,q)、y LH (p,q)、y HL (p,q)、y HH (p,q)表示的采样的4个子带。在图1C的示例分解中,每个子带包括原始信号x(m,n)的采样(系数)的数目的四分之一。
图1D图示了根据本公开的至少一些实现布置的示例合成滤波104。如图1D中所示,合成滤波104可以包括2倍插值以及滤波的操作,其被应用于表示四个子带中的每一个的采样(例如,系数)y’ LL (p,q)、y’ LH (p,q)、y’ HL (p,q)、y’ HH (p,q)上以提供原始信号(例如,x’(m, n))的重组版本。在没有量化子带系数的完美滤波器的示例中,最终(例如,重组的)信号(例如,x’(m,n))可以与提供给分析滤波103的输入信号(例如,x(m,n);请参考图1C)完全相同。
图2A图示了根据本公开的至少一些实现布置的对图像或视频帧201应用小波滤波的示例结果202、203。如图2A中所示,可应用小波滤波应用于图像或视频帧201的行,从而导致图像或视频帧201分解成结果202,结果202可包括2个子带:低频子带L和高频子带H,其各自可以是相对于图像或视频帧201的水平一半尺寸但是是垂直全长。小波滤波可以应用于结果202的列(例如,应用到两个子带L和H中的每一个)以将每个子带进一步分解成每个的两个子带,总共4个子带(例如,LL、HL、LH和HH子带),如关于结果203所示。关于图2A所图示的过程可以被称为图像或视频帧201的一级分解。例如,图2A可以提供一级离散小波变换(DWT)分解。
图2B图示了根据本公开的至少一些实现布置的图像或视频帧的示例二级分解204。如图2B中所示,一级分解的过程可以扩展到两级(例如,其可以被称为两级分解)。提供两级分解204的过程可以包括执行导致关于图2A讨论的4个子带的一级分解并且在图2B中被称为LL1(由于随后的分解而未在图2B中示出)、HL1、LH1和HH1子带。此外,在一些实施例中,通过用于一级分解的相同过程,可以进一步分解低-低(LL1)子带。在其他实施例中,第一和第二分解可以包括不同的分解(例如,滤波器类型等)。这种处理可以提供将LL1子带进一步分解成被称为LL2、HL2、LH2和HH2的4个子带,其中LL2现在是低-低子带。
在一些示例中,这种分解处理可以进一步继续,其中每次迭代执行来自先前迭代的低-低频带的四分割,这可以提供更高级别的分解。
现在讨论转向用于编码视频的帧内帧或图像的基于小波的编码器。图3A是根据本公开的至少一些实现布置的基于小波的译码器/解码器系统301的框图。如图3A中所示,要由系统301的小波译码器译码的图像可以被输入到颜色空间转换器,其可以例如将RGB图像/帧转换为YUV图像/帧,其可以被输入到小波分析变换模块,其可以将YUV图像/帧分解为可以由量化器量化的小波(例如,子带)系数,其之后可以由有效性(significance)映射和系数熵译码器对有效量化的系数的位置以及量化系数本身的映射进行熵编码以产生用于储存或通过信道传送的编码比特流。
来自储存或传送的编码比特流可在系统301的小波解码器处经历在有效性映射和系数熵解码器处的系数本身和有效性映射的熵解码,接着在逆量化器处对量化系数进行逆量化,其可以被输入到小波合成变换模块,该小波合成变换模块可以从小波(例如,子带)系数重构YUV图像/帧,其可以被颜色空间逆变器转换为期望的(例如,通常是RGB)格式来生成解码图像。
不失一般性,可以说如果要被编码的图像已经处于译码器使用的颜色格式中,则颜色空间转换不是必需的。此外,如果解码图像可以以解码格式消费,则解码图像可以不需要颜色空间逆变。关于系统301讨论的译码/解码过程可以应用于在本文中被称为(一个或多个)帧内帧的视频的(一个或多个)帧或图像。
小波编码器可以提供不同的质量/复杂度折衷功能性/灵活性。例如,其中只有LL频带被分割成四元组的小波分解使得较低/较粗糙频带中的每个系数具有对应于其在下一较高频带中的空间位置的4个系数。因此,一个频带的系数与先前频带中的系数之间存在唯一的空间关系。此外,小波编码器可以利用小波系数的唯一结构来提供附加功能性,诸如图像解码可缩放性或随机访问比特流。
示例小波编码器包括嵌入式零树小波(EZW)编码器、层级树中的集合分区(SPIHT) 编码器、集合分区嵌入式块(SPECK)编码器和具有优化截取的嵌入式块编码(EBCOT)编码 器。表3提供了这种小波图像编码器采用的有效性映射编码和熵编码技术的示例。
小波图像编码器 有效性映射编码 系数结构和熵编码
EZW、SPIHT 零树 交叉比例系数树和算术编码
SPECK 集合分区 集合分解成子集和算术编码
EBCOT、JPEG2000 条件编码 小系数块的多上下文算术编码。算术编码。最优块截取
表3 基于小波的图像编码器及其系数编码策略。
例如,EZW可以基于小波系数的嵌入式零树编码的原理。小波变换的一个有益属性是它将输入信号的能量压缩成少量的小波系数,诸如对于自然图像,大部分能量集中在LLk频带(其中k是分解的级别)以及高频带(HLi、LHi、HHi)中的其余能量也收缩在少量系数中。例如,在小波变换之后,可能有少量的较高幅度系数,其是稀疏的,但是大多数系数相对较小(并且携带相对较小的能量),并且因此这样的系数在量化之后量化为零。而且,跨越不同频带的共位系数是相关的。EZW通过使用两个主要概念来利用这些属性——使用零树的有效性映射和逐步近似量化的编码。例如,EZW可以利用小波分解的多分辨率性质。
图3B图示了根据本公开的至少一些实现布置的小波3级倍频程分解302到10个子带。例如,小波3级倍频程分解302是比先前讨论的还要多一级的分解。如图3B中所示,可以在每个子带级别中提供系数之间的空间结构关系。例如,HL3、LH3和HH3频带中由方形表示的每个子带系数可以对应于HL2、LH2和HH2频带中的2×2系数的共位方形和/或在HL1、LH1和HH1频带中的4×4子带系数中的共位方形。例如,从这种结构中受益的一种方式是:如果较粗糙标度(例如,级3)中的小波子带系数相对于阈值而言是不有效的或为零,则在较精细标度(例如,级2和1)中相同定向的小波系数相对于相同阈值而言也可能是不有效的或为零。这允许形成可以被非常有效地表示的零树(例如,由指示跨越子带标度的零系数的块结束所表示的零符号树)。这种关系在图3B中被示出为实线箭头之间的父子依赖关系。图3B还示出(通过粗虚线箭头)跨越不同标度的子带系数的锯齿形扫描的示例顺序。例如,零树结构可允许跨越更精细分辨率子带(更小级编号)的许多小系数被丢弃,这可以在树以4为幂增长时提供显著的节省。此外,EZW编码可以按照它们的重要性的顺序来译码所获得的树结构,从而导致嵌入式编码,其中译码器可以在任何点处终止译码以满足译码目标比特率,或者解码器可以在任何点终止解码,以导致比全比特率更低的比特率的可行但质量较差的解码图像。
此外,SPIHT可基于层次树中的集合分区原则。例如,SPIHT可以利用编码原理,诸如利用集合分区排序算法的幅度进行部分地排列顺序、有序的比特平面传送以及在不同图像标度上利用自相似性。在一些实现中,SPIHT编码可能比EZW编码更有效。在SPIHT编码中,可以通过小波变换对图像进行分解,从而导致可以被分组为诸如空间定向树的集合的小波变换系数。每个空间定向树中的系数可以以最高幅度的系数开始,从最高有效比特平面逐步编码到最低有效比特平面。与EZW一样,SPIHT可涉及两个历程:排序历程和细化历程。在形成扫描历程的一次排序历程和一次细化历程之后,可以将阈值减半,并重复该过程直至达到期望的比特率。
由于子带之间的空间相似性,当在金字塔中向下移动时系数的幅度有序性更好。例如,低细节区域也许可能在金字塔的最高级别处是可识别的,并且可以在相同的空间位置处的较低级别中被复制。图3C图示出根据本公开的至少一些实现布置的空间定向树303。例如,空间定向树303可以是定义层次树上的空间关系的树结构。在一些示例中,可以在利用递归四频带分割所创建的金字塔中定义空间定向树,使得树的每个节点定义像素,并且其后代对应于下一更精细级别的金字塔中的相同空间定向的像素。例如,树可以以每个节点没有子节点或者具有形成2×2个相邻像素群组的四个子节点的方式来进行定义。
另外,SPECK编码可以基于以跨越小波子带的块的形式编码像素集合的原理。例如,SPECK可能与EZW或SPIHT不同,EZW或SPIHT反而使用树。SPECK可以在2个阶段中对输入图像或帧内帧和代码执行小波变换并进行2阶段编码,该2个阶段包括可以迭代重复的排序历程和细化历程。除了2个阶段之外,SPECK可执行初始化阶段。在一些示例中,SPECK可以维护两个链接列表:非有效集合列表(LIS)和有效像素列表(LISP)。
图3D图示了根据本公开的至少一些实现布置的示例SPECK编码过程304。如图3D中所示,在初始化阶段中,输入图像(例如,F)可以被分区成两个集合,集合S和集合I。集合S可以代表根,并可被添加到LIS。集合I可表示其余部分(例如F-S)。在排序历程阶段中,可以针对当前阈值执行有效性测试,以对LIS中的每个S类型块进行排序。如果S块是有效的,则它被四叉树划分,分区成四个子集,并且每个子集被视为一个类型S集合并被递归处理,直到达到像素级。不有效集合被移到LIS进行进一步处理。一旦完成集合S的处理,就使用相同的阈值对I块执行有效性测试。如果I块是有效的,则将它划分成四个集合,其中一个集合具有相同类型I,而其他集合具有类型S。对LSP像素执行细化历程,使得除了在最后一次排序历程期间添加的像素之外,输出第n个最高有效比特。此外,阈值可以减半,并且可以重复编码过程直到达到预期的比特率。
此外,EBCOT可以包括小波子带的嵌入式块编码,其可以支持来自单个译码比特流的诸如空间可缩放性(例如,解码各种空间分辨率的图片的能力)和SNR可缩放性(例如,解码各种质量的图片的能力)之类的特征。尽管对SNR可缩放性的要求也可以通过执行逐步近似或比特平面译码的EZW和SPIHT编码来解决,但是如果需要提供空间可缩放性,则EZW和SPIHT二者都必须修改译码/比特流,但是所得到的比特流继而将不是SNR可缩放的——因为子带之间的相互依赖性降低。在一些示例中,EBCOT通过独立地编码每个频带来解决这些缺点。此外,通过将子带采样分区成被称为代码块的小块来使编码更加灵活,所述代码块的尺寸决定了可实现的编码效率。例如,代码块的独立处理可以提供本地化并且可能对于硬件实现是有用的。
图3E图示了根据本公开的至少一些实现布置的图像或帧内帧的示例划分305。如图3E中所示,要被编码的图像或帧内帧可以被划分成图块,其中每个图块小波被变换并分区成被称为选区的分组分区位置,使得每个选区包含三个空间一致的矩形,在每个分辨率级别有来自每个子带的一个。每个选区可以被进一步划分成形成熵编码器的输入的代码块。在条带内(例如,条带可以是代码块比特平面中的4个连续行的像素比特),可以逐列扫描采样。图3E还示出了对于宽16高n的代码块的示例代码块扫描过程。从左上角开始,可以扫描第一列的前四个比特,直到代码块的宽度被覆盖。然后,可以扫描下一个条带的第一列的后四个比特,以此类推。
图4是根据本公开的至少一些实现布置的示例JPEG2000译码器401的框图。在一些示例中,JPEG2000译码器401可以基于本文讨论的EBCOT技术。如图4中所示,待译码的图像或帧内帧(图像)可以在颜色矩阵、电平偏移器、图块转换器”模块中经历预处理,该模块可以将像素值偏移128,执行颜色格式转换并将图像分区为固定尺寸的图块。此外,“小波(分析)变换”模块可以执行将2D小波分解成频带,并且每个子带的系数可以通过“量化器”量化并且使用2层译码器进行熵译码和分层。例如,“层1译码器”可以包括“上下文建模器”(例如,包括“系数比特平面编码器”和“上下文信息”模块),随后是“算术译码器”(例如,包括“MQ编码器”和“状态变量”模块)和“层2译码器”可以包括“分层(RDO截取代码块)比特流格式化器/分包器”,其可以生成随后被打包的嵌入式/可缩放比特流。
示例的JPEG 2000解码器(未示出)可以反转编码器的操作顺序,开始于将被解码的比特流输入到“层2解码器”,包括“解包器和比特流无格式化器”,并且然后在“层1(算术)解码器”中进行熵解码,可以将其输出提供给“逆量化器”,然后提供给“小波(合成)变换”模块,并且然后提供给“图块无格式化器、电平非偏移器和颜色逆矩阵”后处理器,所述后处理器可以输出解码图像。
JPEG2000于2000年由ISO/WG1委员会完成。原始的JPEG图像编码标准于1992年被开发为ITU-T Rec.T.81并且后来于1994年由同一个ISO委员会通过。尽管JPEG2000标准比原始JPEG标准提供了显著的改进,但其可能包括诸如复杂度、压缩性能有限、硬件实现困难以及可缩放性以压缩效率为代价等缺点。此外,使用固定块尺寸变换编码的原始JPEG标准仍然是迄今使用的流行图像编码标准。然而,原始JPEG标准具有诸如压缩性能有限的缺点。
本文讨论的技术可以提供一种新的帧内编码方法,其在比特率效率方面是有效的并且是可缩放的,使得从单个译码流中可以对子集进行独立解码。此外,译码流的一个或多个子集(例如,LL子带的编码)可以完全或部分地与AVC兼容或者部分地与HEVC视频帧内编码标准兼容。这样的兼容性的优点可包括与已建立标准的互操作性以及来自便捷可用的硬件实现的规模益处。本文讨论的新的编码方法可以包括改进的小波和变换编码,使得全局冗余度被小波处理利用,并且本地冗余度被自适应变换编码利用。就压缩效率而言,所讨论的技术可比JPEG2000标准高出约22%,并且所讨论的技术可以提供超过JPEG2000的若干其他优点。
早先的讨论包括小波分析/合成滤波的细节。现在讨论转向与AVC视频高(画质)I/帧内译码/解码相关联的技术。
图5A是图示出了根据本公开的至少一些实现布置的AVC视频高画质译码器的示例帧内块/I帧编码子集的示例译码器系统501的框图,AVC视频高画质译码器在上面被称为AVC视频高I/帧内帧译码器。例如,图5A可以图示可以用于像素块的变换译码(或小波LL子带的块的变换译码)的AVC视频高(或高10)帧内译码器。如所示,通过“将帧分区成16×16MB和进一步分区成8×8和4×4块的分区器”可以将输入视频帧(帧)分区成固定的16×16尺寸的宏块(MB),并且然后分区成8×8块,并且根据需要进一步分区成4×4块,以用于帧内预测。关于是否使用4×4或8×8块以用于预测的决定可以是在帧中是本地自适应的,并且可以基于在编码期间由“预处理器”或“速率失真优化(RDO)”模块或两者的内容分析来决定(为简单起见,未示出这样的模块和/或操作)。
例如,内容分析预处理器或RDO过程的结果可以是确定宏块的16×16亮度块是否可以被预测、或者是否需要将其分区成8×8块、以及8×8块中的任何一个或全部是否需要进一步被分区成4×4块以用于预测。这样的分区可以是本地自适应的,并且某些MB可以在16×16级处被预测,而其他MB可以被分区成8×8以用于预测,而其他的其中某些8×8可以被进一步分区成4×4块以用于预测。在任何情况下,对于输入分区块,可以从解码的相邻块形成(例如,预测)相同尺寸的预测块。预测可以是基于块的,并且可以从9个选择中确定:DC(平均)、平面或7个可能的方向。例如,预测块可以基于由“帧内 DC/平面/7预测方向估计器”做出的模式决定而由“帧内 DC/平面/7方向预测器”生成。预测之后的16×16或8×8或4×4尺寸的每个残余信号块可由差分器511确定。然后可以由“4×4/8×8 2D块整数(DCT近似)变换”模块通过基8(对于16×16或8×8预测)或基4(对于4×4预测)的正交整数变换来将每个残差信号块变换为然后可由“量化器”量化的8×8尺寸/4×4尺寸的变换系数块,并且已量化系数可由上下文自适应二进制算术编码器(CABAC)进行熵译码,如由生成译码比特流(bitstr)的“4×4/8×8扫描、CABAC译码器和比特流格式化器”所实现的。熵编码器还可以对分区信息(partn)、量化器(qp)和帧内预测方向(模式)信息进行译码。译码器框图还示出了在译码器处生成本地解码帧的反馈环路。在该环路中,已译码已量化系数可以在“逆量化器”中解量化,并且在“4×4/8×8 2D块整数(DCT近似)逆变换”模块进行逆变换并且在加法器512处被添加到先前讨论的预测块以重新生成解码块,其然后可以在“4×4和8×8块组装成16×16 MB和组装成帧的组装器”处进行组装以形成MB,所述MB可以在“解块滤波”模块处被解块滤波以生成解码帧(dec.frame),以及在“本地(块行)缓冲器”处被缓冲以用于生成定向预测。
图5B是图示出了根据本公开的至少一些实现布置的AVC视频解码器的帧内块/I帧编码子集的示例解码器系统502的框图,AVC视频解码器在本文中被称为能够解码AVC视频高I/帧内译码比特流的AVC视频高I/帧内帧解码器。例如,图5B可以图示出可以被用于解码对应的AVC视频高(或高10)帧内译码比特流的AVC视频高帧内解码器。如所示,输入比特流(bitstr)可以基于CABAC解码由“比特流无格式化器、CABAC解码器&4×4/8×8逆扫描”模块进行解码,从而导致解码系数、分区信息(partn)、量化器(qp)和预测方向(模式)。可以通过“逆量化器”来对变换系数块进行逆量化,这导致逆量化系数,所述逆量化系数继而可以由“4×4/8×8 2D整数(DCT近似)逆变换”模块进行逆变换,这导致解码的残余块,可由加法器521将所选择的预测添加到解码的残余块。例如,预测块可以由“帧内DC/平面/7方向预测器”使用过去解码的相邻块和针对正被解码的块的模式信息来确定(例如,表示DC或平面或7个方向中的一个的9个值中的一个)。块残差和对应的块预测的总和的结果可以是解码块,解码块可以通过“4×4和8×8块组装成16×16 MB和组装成帧的组装器”组装成MB并且通过“解块滤波”进行块滤波以生成最终解码帧(dec.frame)。
在一些示例中,AVC视频标准(或其AVC视频高帧内子集)可以处理8比特输入视频的编码。使用本文讨论的技术,可以将对应的译码器/解码器应用于对由一个级别(或甚至2个级别或更多级别)小波分解产生的LL和其他(例如,HL、LH和HH)频带进行译码。当不是使用标准的AVC视频高画质帧内子集而是将AVC标准未经修改地用于小波频带的编码时,被称为AVC视频High10(画质)帧内的可以对(诸如从子带分解中产生的)较高比特深度像素进行译码的较高(10比特)比特深度版本可以被使用。现在讨论转向较高(例如,HL、LH、HH)频带的AVC标准的修改版本。
图6A图示了根据本公开的至少一些实现布置的具有移除帧内预测并且包括扫描起始位置和扫描方向信息的AVC高(或高10)I/帧内译码器601,其在本文中被表征为AVC视频High*I/帧内译码器。例如,图6A可以图示出AVC高*(或高10*)帧内译码器。图6A中所图示的译码器可以通过允许AVC编码中的系数扫描的自适应被定制到诸如HL、LH和HH频带等各个较高小波频带的特性来提供更高的效率。
如所示,可以把由小波分解(帧)产生的较高子带输入到“将帧分区成16×16 MB和进一步分区成8×8和4×4块的分区器”(例如分区器),其可将帧分区成16×16 MB并且可以使用内容分析或RDO或两者(例如,如由“预处理器”或“速率失真优化(RDO)”模块或两者所提供的,未示出)以确定每个MB:每一MB是否需要进一步被分区。如果需要进一步被分区,则分区器可以将MB划分成8×8块,并再次确定8×8块是否需要进一步被分区成4×4块(并根据需要执行分区)。对于变换编码,8×8块(当分区成16×16或8×8时)或4×4块(当分区成4×4块尺寸时)可以被“4×4/8×8 2D块整数(DCT近似)变换”模块使用,并且变换系数可以用量化器(qp)通过“量化器”来量化,并且量化的变换系数可以与分区信息(partn)和量化器(qp)一起由“4×4/8×8扫描、CABAC译码器和比特流格式化器”进行CABAC商译码以生成比特流(bitstr)。
图6B是根据本公开的至少一些实现布置的在本文中被表征为AVC视频High*I/帧内解码器的示例解码器602的框图,其可以解码由AVC视频High*I/帧内译码器生成的比特流。例如,图6B可以图示出了AVC高*(或高10*)帧内解码器,其可以解码对应于诸如HL、LH、HH等小波频带的AVC高*(高10*)帧内译码流。例如,AVC视频High*I/帧内解码器可以不使用帧内预测,而是可以使用取决于正被解码的小波频带(例如HL、LH、HH等)的扫描起始位置和方向自适应。如所示,可以将AVC高*I/帧内译码比特流(bitstr)输入到CABAC熵解码器,诸如“比特流无格式化器、CABAC解码器和4×4/8×8逆扫描”模块,其可以解码变换系数、分区(partn)信息和量化器(qp)值。解码后的系数可以通过“逆量化器”进行逆量化并被输入到“4×4/8×8 2D整数(DCT近似)逆变换”模块(例如,逆变换单元),其可以执行尺寸为4×4/8×8的逆变换,从而产生块(例如,子带块),所述块可以由“将4×4和8×8块组装成16×16MB和组装成帧的组装器”组装成MB和帧并且由“解块滤波”模块进行解块滤波以生成解码频带(dec.frame)。
例如,在译码器6012和本文讨论的其他技术的支持下,可以在原始图像或帧上执行小波分解以生成多个小波子带,可以接收原始图像或帧的非LL小波子带以用于编码,可以将接收到的小波子带分区成多个变换分区,可以在多个变换分区中的至少第一变换分区上执行变换以生成块变换系数,可以对块变换系数进行量化,可以扫描第一变换分区的已量化块变换系数,使得扫描的方向基于接收到的小波子带的类型,并且可以利用高级视频编码(AVC)相符的熵译码器将已扫描已量化变换系数熵编码成比特流。例如,接收到的小波子带的类型和扫描已量化块变换系数的方向可以是以下中的至少一个:LH子带和从右上角到左下角、HL子带和从左下角到右上角、或HH子带和从左上角到右下角。在一个实施例中,分区和变换是高级视频编码(AVC)相符的。此外,可以利用AVC相符的译码器将多个子带中的第二子带译码为第二比特流,并且可以将比特流和第二比特流进行复用以生成可缩放比特流,使得可缩放比特流的至少一部分是AVC相符的,如本文进一步讨论的。例如,第二子带可以是LL子带,并且接收到的小波子带可以是LH、HL或HH子带中的至少一个。在一些实施例中,如本文进一步讨论的,可以使用基于第三至第七子带的类型的扫描方向对多个子带中的第三至第七子带进行译码。例如,第二子带可以是LL2子带,并且小波子带可以是HH1、LH1、HL1、HH2、LH2或HL2子带中的至少一个。
此外,在解码器602和本文讨论的其他技术的支持下,可以对可缩放比特流进行解复用以提供多个比特流——其每个对应于多个小波子带的子带,可以经由高级视频编码(AVC)相符的解码器对与小波子带的第一子带相对应的比特流进行熵解码,可以对解码的比特流进行逆扫描以生成解码的变换系数,使得逆扫描的扫描方向基于第一子带的类型,并且逆量化、逆变换和块组装可以至少部分地基于解码的变换系数来执行以生成重建的小波子带块。例如,小波子带的类型和扫描的方向可以包括LH子带和从左下角到右上角生成块、HL子带和从右上角到左下角生成块、或HH子带和从右下角到左上角生成块中的至少一个。在一个实施例中,解码、逆量化、逆变换和块组装是AVC相符的。此外,可以用AVC相符的解码器来解码多个比特流中的第二比特流以生成多个子带中的第二子带,并且可以基于第二子带和重建的小波子带子块来重建图像或帧。例如,可以有4个子带,并且可以使用基于第三和第四子带的类型的逆扫描方向来对与子带的第三和第四子带相对应的第三和第四比特流进行解码。例如,第二子带可以是LL子带,并且小波子带可以是LH、HL或HH子带中的至少一个。在另一示例中,可以存在7个子带,并且可以使用基于第三至第七子带的类型的逆扫描方向来对与子带的第三至第七子带相对应的第三至第七比特流进行解码。例如,第二子带可以是LL2子带,并且小波子带可以是HH1、LH1、HL1、HH2、LH2或HL2子带中的至少一个。
图6C图示了根据本公开的至少一些实现布置的AVC视频高*(或高10*)帧内译码器的示例特征603的框图。例如,图6C可以提供AVC高*(或高10*)帧内译码器的抽象概念,其示出了取决于小波子带而禁用(诸如帧内预测)或修改(诸如扫描起始位置和扫描方向)哪些译码特征。如图6C中所示,针对HL、LH和HH频带的定制译码,可以将AVC高*(或高10*)帧内译码器修改为具有以下特征:可以禁用/移除帧内预测,并且已量化系数扫描可以具有取决于正被译码的频带的扫描起始位置和方向(例如,对于HL频带,扫描从右上开始锯齿形至左下)。
图6D图示了根据本公开的至少一些实现布置的AVC视频高*(或高10*)帧内解码器的示例特征604的框图。例如,图6D可以提供AVC高*(或高10*)帧内解码器的抽象概念,其示出了取决于小波子带而可以禁用(诸如帧内预测)或修改(诸如扫描起始位置和扫描方向)的解码特征。如图6D中所示,针对HL、LH和HH频带的定制解码,可以将AVC高*(或高10*)帧内解码器修改为具有以下特征:可以禁用/移除帧内预测并且为了确定量化系数而对比特流进行的逆扫描可以具有取决于正被解码的频带的扫描起始位置和方向(例如,对于HL频带,逆扫描开始可以从左下到右上生成针对块的量化系数)。
图7A是根据本公开的至少一些实现布置的用于提供能够对图像/帧内帧进行空间/SNR可缩放编码的2层可缩放AVC(例如,可缩放视频编码(SVC))译码器的示例译码器701的框图。例如,图7A图示了用于帧内帧或图像的空间/SNR可缩放编码的示例两层可缩放AVC(SVC)译码器。如所示,对于由“基础层译码器”的译码,输入图像/视频帧(视频)可以通过可以对输入图像/视频帧进行滤波和下采样的“空间下采样器”来进行下采样。然后可以在块的基础上(例如,使用“帧内方向估计器/预测器”的方向预测)对下采样的图像/视频帧进行帧内预测,并且(通过“变换和量化”模块)可以将其原始块与预测块进行差分,从而导致可用变换译码进行译码的预测误差块。预测误差块可以被变换(通过“变换和量化”模块)、被量化(通过“变换和量化”模块)并且被译码(通过“熵译码器”),块尺寸为4×4/8×8,基于速率失真优化(RDO)(未示出)或通过本地内容分析来选择最佳块尺寸,以生成基础层比特流(基础层比特流)。可以通过“逆量化和逆变换”模块在译码器处对译码块进行本地解码,该“逆量化和逆变换”模块可以对量化后的误差块系数进行逆量化和逆变换,从而导致解码的预测误差块,可以通过“重建生成器”单元将对应的预测块添加到解码的预测误差块,从而导致可以被缓冲(在“本地缓冲器”处)的本地解码的图像/视频帧块,并且相邻块可被用于预测正被编码的当前块。此外,本地解码的图像/视频帧块可以在“解块滤波”模块处被解块滤波。解码的预测误差块(在“逆量化和逆变换”模块的输出处)和最终重建块(例如,在“重建生成器”或“解块滤波”模块的输出处)可以(在通过“层间上采样器”进行上采样之后)可用于在“增强层译码器”处的较高层的预测。
如所示,全分辨率视频帧(视频,无下采样)可以被输入到“增强层译码器”并且被转换为宏块和块,并且然后逐块可以通过“帧内方向估计器/预测器”而经历帧内预测。“帧内方向估计器/预测器”的一个输入可以是解码的相邻块区域,以用作用于计算当前块的帧内预测的参考,并且另一输入可以是(例如,来自“层间上采样器”)来自较低层的上采样的共位块,其可以用作替代预测。可以将来自较低层的每个原始块及其最佳选择的预测块基础和上采样的解码的预测误差发送到“预测误差/差异计算机”,其可以确定基于块的预测误差,并且在一些情况下甚至可以预测来自较低层预测误差信号的预测误差。预测误差差异信号可以在“变换与量化”模块处被变换(例如,通过4×4/8×8变换)、在“变换和量化”模块处被量化并在“熵译码器”处由(CABAC)熵译码器进行熵译码。在译码器处的反馈环路可以包括:确定(预测误差或预测误差差异的)量化的变换系数,在“逆量化和逆变换”模块中执行逆量化,并且然后在“逆量化和逆变换”模块处执行逆变换,从而导致解码的预测误差或预测误差差异信号,其可被输入到“重建生成器”,在“重建生成器”的其他输入处是(最佳)预测信号和上采样的较低层预测误差(在当前块预测误差差异被编码的情况下)。“重建生成器”的输出是解码块,其可以被存储在“本地缓冲器”中,以形成可用于预测下一块的相邻块。此外,解码块可以通过“解块滤波”模块解块以生成本地解码帧。在基础层和增强层“熵译码器”的输出端处的比特流可以分别被表征为基础层比特流(基础层比特流)和增强层比特流(增强层比特流),通过“系统复用器”可以将其复用成单个可缩放编码比特流(bitstr)。
图7B是根据本公开的至少一些实现布置的用于提供能够对由图7A的译码器生成的空间/SNR可缩放帧内译码流进行解码的2层可缩放AVC(例如,可缩放视频编码(SVC))解码器的示例解码器702的框图。例如,图7B图示了用于帧内帧或图像的空间/SNR可缩放解码的示例两层可缩放AVC(SVC)帧内解码器。图7B的解码器可以以与图7A的译码器处的本地解码环路相同的方式操作。如所示,可以将来自图7A的译码器的诸如比特流的可缩放译码比特流(bitstr)解复用为基础层比特流和增强层比特流,使得取决于解码器能力,基础层比特流(导致较低分辨率解码的帧/图像)或者基础和增强层比特流二者都可以被解码(导致全分辨率解码帧/图像)。现在讨论转向解码器702的“基础层解码器”和“增强层解码器”的操作。
例如,接收到的比特流(bitstr)可以通过“系统解复用器”来解复用,并且如所示,可以将基础层比特流输入到“基础层解码器”的“熵解码器”。可以对来自“熵解码器”的解码量化系数进行逆量化(通过“逆量化器和逆变换”模块)、并且然后进行逆变换(通过“逆量化器和逆变换”模块),从而导致解码的帧内预测误差块,可以将其逐块地输入到“重建生成器”,在“重建生成器”的另一个输入处的是针对每个块的对应的帧内预测。在“重建生成器”的输出处的解码块可以被存储在“本地缓冲器”中,并且可以提供参考块区域以用于通过“帧内方向预测器”进行帧内预测。解码块也可以通过“解块滤波”模块经历解块滤波,从而导致解码的较低分辨率/质量帧(基础层视频)。此外,可以将增强层比特流输入到“增强层解码器”的“熵解码器”,并且作为结果所得到的解码量化系数可以被逆量化(通过“逆量化器和逆变换”模块),并且然后被逆变换(通过“逆量化器和逆变换”模块),从而导致解码的帧内预测误差块或者在一些情况下导致解码的帧内预测差异块,可以将其逐块地输入到“重建生成器”。对于“重建生成器”有两个其它可能的输入:一个来自“帧内方向预测器”(如果需要,其针对特定块还包括来自上采样的基础层的预测),另一个对应于来自“层间上采样器”的上采样的解码的较低层预测误差(其针对某些块可以被用于通过将其添加到预测差异误差块来导出预测差异块)。可以将来自“重建生成器”的作为结果所得到的输出块存储在本地缓冲器中(并且形成用于预测正被解码的块的相邻区域块)和/或通过“解块滤波”模块进行解块滤波并输出以提供全分辨率/质量解码帧/图像(较高层视频)。
为了呈现的清楚起见,在描述图7A和图7B时,讨论不包括由基础和增强层比特流携带的控制信号/模式信息,其可以用于正确解码这些比特流,从而导致解码的较低分辨率/质量和全分辨率/质量帧/图像。例如,基础层比特流可携带每块帧内预测模式信息以发信号通知最佳预测模式,并且此信息可由基础层解码器提取及使用以根据需要生成每块预测以生成解码帧/图像。此外,在增强层比特流中的帧内预测信息和关于是否可以从上采样的共位基础层块中预测一个块的信息以及进一步关于是否可以从来自基础层的上采样预测误差块来预测增强层中的预测误差块的进一步信息,可以被携带以供增强层解码器使用以正确地解码较高分辨率/质量帧。此外,不失一般性,可以将图7A和图7B的两层系统延伸至三层或更多层。例如,2层系统可以包括基础和增强层(如在所讨论的2层系统中一样)以及第二增强层,第二增强层可以以与第一增强层使用基础层帧作为预测的相同方式使用第一增强层生成的图像进行预测。
现在讨论转向基于小波的帧内视频/图像编码器。
图8A是根据本公开的至少一些实现布置的示例组合自适应小波AVC(AWAVC)编码器801的框图。例如,图8A可提供将自适应小波分析/合成滤波与AVC高(或高10)I图片或帧内译码/解码进行组合的自适应小波AVC(AWAVC)帧内译解码器。如所示,在译码侧,在“自适应小波分析滤波”模块处,输入视频(或图像)YUV帧(帧)可以使用来自滤波器组的码本中的滤波器组而经历自适应小波分解,其中滤波器的选择基于应用(例如,分辨率、内容和比特率)。使用所选择的滤波器组,对于一级分解,可以在输入帧/图像上执行分析滤波的过程,其可以将图像/帧转换为诸如LL、HL、LH和HH子带的小波子带,其中每一个都是四分之一尺寸,比特深度为9比特(例如,对于8比特输入视频或图像)。LL子带可以通过“AVC高10 I/帧内译码器”用诸如关于图5A描述的那些之类的特征进行译码,并且HL、LH和HH子带可以用各自的“AVC高10 I/帧内译码器”进行译码。译码过程的结果可以包括诸如LL比特流、HL比特流、LH比特流和HH比特流之类的四个单独比特流,其可以通过“到分层比特流的复用器”模块复用成单个可缩放比特流(bitstr)以用于存储或通过信道进行传送。复用的比特流还可以携带关于用于小波分析分解的所选滤波器组的信息(wfi)。
也如图8A中所示,在解码侧,可以将复用的比特流(bitstr)解复用为单独的LL、HL、LH和HH比特流,其可以被发送到针对每个子带的对应的AVC高10 I/帧内解码器,从而导致对应的4个四分之一尺寸的解码子带。从复用的比特流中解码的还有关于用于分解的小波滤波器的信息(wfi),使得互补滤波器对可以被“自适应小波合成滤波”模块使用,所述模块可以接收四个四分之一尺寸的解码子带并将它们组成全分辨率/尺寸的最终重建用于显示的视频(或图像)帧(dec.frame)。例如,尽管比特流是可缩放的,但刚刚描述的用例可导致仅单个全尺寸视频(或图像)帧(dec.frame)的显示的重建。
例如,如图8A中所示,(例如,通过“自适应小波分析滤波”模块)可以执行图像或帧的小波分解以生成多个子带(HH、LH、HL、LH子带),可以用高级视频编码(AVC)相符的译码器对多个子带中的每一个进行译码以生成每个对应于一个子带的多个AVC相符比特流,并且可以对子带进行复用以生成可缩放比特流。此外,可以选择小波分析滤波器组以用于执行小波分解。在一个实施例中,图像或帧(帧)具有8比特的比特深度,并且每个子带具有9比特的比特深度。例如,AVC相符的译码器可以是10比特帧内画质编码器。如所示,执行小波分解可以包括单级小波分析滤波,并且多个子带可以包括四个子带:LL子带、LH子带、HL子带和HH子带。
此外,在解码器侧,可以对可缩放比特流进行解复用,使得可缩放比特流的至少一些部分是高级视频编码(AVC)相符的以提供多个比特流——每个比特流对应于多个小波子带的一个子带,至少一个比特流可以用AVC相符的解码器来解码,并且可以基于所述解码来重建图像或帧。在图8A的上下文中(以及本文讨论的其他上下文)中,重建图像或帧可以包括用AVC相符的解码器对每个对应于一个子带的多个比特流进行解码以生成解码子带并在解码子带上执行单级小波合成滤波以生成图像或帧。
图8B是根据本公开的至少一些实现布置的另一示例组合自适应小波AVC(AWAVC)编码器802的框图。例如,图8B提供了自适应小波AVC(AWAVC)帧内译解码器,其将自适应小波分析/合成滤波与AVC高(或高10)I图片或帧内译码器/解码器进行组合,并且示出可以从同一比特流中解码的全质量视频或较低质量视频。如所示,图8B的译码侧与图8A的译码侧相同。为简洁起见,不再重复讨论这种译码。此外,图8B中所示出的解码侧的许多与图8A的解码侧框图相同——除了输出开关821(例如,输出选择开关)可以控制用于显示的两个选项,诸如:是对低分辨率视频/图像帧进行上采样并输出、还是在利用“自适应小波合成滤波”模块组合全部解码子带之后输出全分辨率视频/图像帧。该选择可以基于解码能力(一些解码器可能不解码全分辨率版本)、应用、用户选择、系统选择等。
例如,在编码器802的解码器侧,可以对可缩放比特流进行解复用,使得可缩放比特流的至少一些部分是高级视频编码(AVC)相符的以提供多个比特流——每个比特流对应于多个小波子带的一个子带,可以用AVC相符的解码器来解码至少一个比特流,并且可以基于所述解码来重建图像或帧。此外,可以确定对应于图像或帧(dec.frame)的输出选择,使得输出选择可以是低分辨率或全分辨率选择,使得对图像或帧进行重建可以响应于输出选择。例如,当输出选择是低分辨率时,对图像或帧进行重建可以包括利用如图8B中所示的AVC相符的解码器来仅解码LL子带。例如,对图像或帧进行重建可以进一步包括在解码侧通过“比特深度限制器和1:2上采样器”应用比特深度限制器和/或执行上采样,如图8B中所示。当输出选择是全分辨率时,对图像或帧进行重建可以包括利用至少AVC相符的解码器来解码多个比特流——每个比特流对应于多个小波子带的一个子带,以生成多个已解码子带,并且(通过“自适应小波合成滤波”模块)可以对多个已解码子带执行小波合成滤波以生成全分辨率的图像或帧。
尽管图8A和图8B中示出的实施例在译码侧提供了输入视频/图像帧到4个子带的1级小波分析/分解,并且相应地在解码器侧提供了4个子带的1级合成/组合/重组以形成解码视频/图像帧,可以将本文讨论的技术扩展到多于1级分解/重组。
图9A图示了根据本公开的至少一些实现布置的用于AWAVC帧内译码的示例过程901。如所示,输入视频(或图像)帧(被标记为“帧”)可以(在被标记为“执行自适应小波分析以生成4个子带”的操作处)经历一级自适应小波分析滤波(例如,分解,其可包括选择小波分析滤波器)以生成4个子带,其中每个子带相对于输入帧或图像为一个四分之一尺寸,并且由子带系数(也被称为子带像素或采样)组成,在输入帧的像素为8比特精度时所述子带系数精度为9比特。然后(在被标记为“1/4尺寸9b LL/HL/LH/HH子带子帧贮存器”的操作处)可以将每个生成的子带存储在相应的四分之一尺寸子帧贮存器中并且将其划分成宏块和块,使得将LL子带子帧输入到AVC高10 I/帧内译码器,并且将HL、LH或HH子带子帧输入到对应的AVC高10/I帧内译码器。来自这些AVC高10 I/帧内译码器的(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内译码LL/HL/LH/HH MB/块”处生成的)各个生成的比特流可以与报头(包括用于识别用于分析/分解滤波的所选子带滤波器的报头)组合并被复用(在被标记为“对报头进行译码、对小波系数数据进行熵译码以及进行复用以生成AWAVC帧内译码比特流”的操作处)以生成单个AWAVC编码比特流(被标记为“比特流”)以用于存储和/或传送等。刚刚描述的编码过程可以生成可缩放比特流,其中可以独立地解码LL子带比特流或者可以一起解码所有四个子带。
图9B图示了根据本公开的至少一些实现布置的用于AWAVC帧内解码的示例过程902,其逆转由AWAVC帧内译码执行的过程。如所示,(在被标记为“对AWAVC帧内译码比特流进行熵解码”的操作处)可以接收AWAVC帧内比特流(被标记为“比特流”),并且可以解码比特流报头,并且可以将其余的比特流解复用成单独的LL、HL、LH和HH比特流中的每一个。如果(在被标记为“小波编码的全分辨率输出
Figure DEST_PATH_IMAGE007
”的判定操作处)输出选择(例如,用户请求等)请求低分辨率输出,则(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内解码LL MB/块”的操作处)可以由AVC高10 I/帧内解码器(仅)解码LL子带,被进行比特深度限制,并且(在被标记为“在每个维度上被2倍上采样”的操作处)被上采样以生成可以被发送以输出用于显示的低分辨率上采样视频/图像帧(被标记为“否,小波低分辨率”)。如果请求全分辨率输出,则(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内解码LL/HL/LH/HH MB/块”的操作处)四个子带中的每一个都可由对应的AVC高10 I/帧内解码器解码器解码。例如,LL子带可以由AVC高10 I/帧内解码器解码,并且HL、LH和HH子带也可以由相应的AVC高10 I/帧内解码器解码,并且(在被标记为“1/4尺寸9b LL/HL/LH/HH子带子帧贮存器”的操作处)可以将全部四个子带存储在子帧贮存器中。(在被标记为“执行自适应小波合成以生成重建帧”的操作处)使用互补滤波器对(到分析滤波器),来自子帧贮存器的已解码LL、HL、LH和HH子带可以经历合成/重建滤波,可以从比特流中解码关于其的信息。例如,合成滤波器可以组合已解码的子带,从而导致可以被输出以进行显示的完全重建视频/图像帧(被标记为“是,小波全分辨率”)。如所讨论的,取决于应用、用户请求或解码器资源限制等,从相同比特流解码低分辨率输出或全分辨率输出的这种类型的条件解码可以被称为可缩放解码,并且可能是由于可缩放(例如,嵌入)编码而是可能的,所述可缩放编码可能由于小波编码而更容易被执行。关于图9A和图9B讨论的可缩放性的类型可以提供2层:四分之一分辨率层和另一个全分辨率层。在其他示例中,小波编码可以提供多个或许多层的可缩放性(压缩效率有一些损失)。
图10A图示了根据本公开的至少一些实现布置的示例AWAVC帧内译码器1001的功能框图。如所示,输入图像(图像)可以通过“颜色空间转换器”从RGB到YUV帧(帧)进行颜色转换(如果输入是YUV视频帧而不是RGB图像,那么不需要该操作)。此外,在不失一般性的情况下,假定YUV帧是4:2:0格式(例如,在水平和垂直方向上,U和V分辨率都是Y的分辨率的一半)。基于“应用、内容、速率、复杂度分析器”对应用参数(例如图像/帧分辨率、比特率等)和内容(例如复杂度)的评估,可以选择小波分解/分析滤波器,可以设置质量和速率目标,可以调节频带的分区,并且可以执行比特率控制。
同样如所示,YUV帧可以通过“自适应小波分析滤波”模块而经历一级小波分解(使用基于应用/分辨率而选择的小波滤波器对)成为LL、HL、LH和HH子带,并且然后每个频带的每个宏块的内容可以在“速率失真优化和比特率控制器”的控制下通过“将小波频带分区成16×16 MB和8×8和4×4块的分区器”分区成8×8块,并进一步通过“将小波频带分区成16×16 MB和8×8和4×4块的分区器”被分区成4×4块。这种处理可导致每个宏块的许多候选分区(partn)。例如,“速率失真优化和比特率控制器”可以提供分区尺寸、预测模式和变换类型的最佳选择。
此外,对于每个LL频带宏块分区,可以通过“本地缓冲器和DC/平面/7方向预测分析器和生成器”使用已解码的相邻块来生成若干个候选帧内(DC、平面和7个方向)预测模式(模式)。对于其他(例如,HL、LH、HH)频带宏块分区,不执行帧内预测。
如图10A中所示,可以通过差分器1011将LL频带MB分区块与候选预测分区块进行差分以计算候选差异分区块,然后通过“4×4/8×8 D2块整数变换”模块对候选差异分区块进行变换,从而导致候选变换系数块。对于其他频带,不需要预测,并且因此预测分区/块采样被直接变换,从而导致变换系数块。所有变换块系数由“量化器”量化并由CABAC熵译码器在“小波频带的4×4/8×8扫描变换系数块、CAVLC/CABAC熵译码器和比特流格式化器”处进行熵译码。诸如变换系数熵编码比特成本、MB分区比特成本、预测模式比特成本之类的所有比特成本由“小波频带的4×4/8×8扫描变换系数块、CAVLC/CABAC熵译码器和比特流格式化器”模块确定。因此,对于组合(分区尺寸、预测模式、变换系数块),可以计算成本并且可以确定重建的分区,并且因此也可以计算失真。在速率失真优化中这些成本和失真使用如下。
给定每个宏块的候选分区(partn)、候选帧内预测模式(模式)和潜在量化器值(q)的集合,“速率失真优化和比特率控制器”通过确定用于编码每个分区的最佳帧内预测模式(模式b)和最佳分区(partnb)以及可以在可用比特率的约束下允许实现最佳(RD折衷)质量结果的量化器(qp)、使用(来自由熵译码器提供的比特成本的)比特率和(从原始和重建的子带分区的差异计算出的)失真度量对最佳编码策略做出最佳判定。经由比特流(bitstr)将Partnb、模式bqp的选择发送到解码器。
从邻居形成预测的过程需要重建相邻块,需要在译码器处的解码环路。如所示,在译码器处的每个频带的量化系数块(来自“量化器”)可以在“逆量化器”处经历解量化,随后在“4×4/8×8 2D块整数逆变换”模块中进行逆变换,从而导致HL、LH和HH频带的重建采样块以及LL频带的重建采样过渡块。对于LL频带,可以使用预测模式来获取预测块以添加到LL频带过渡重建块以生成最终重建块。例如,预测块可以由“本地缓冲器和DC/平面/7方向预测分析器和生成器”生成并由加法器1012添加到过渡重建块。重建的LL频带块也可以被保存在本地缓冲器中,并且由“本地缓冲器和DC/平面/7方向预测分析器和生成器”使用以用于当前块预测,使得预测块向差分器1011提供一个输入。到差分1011的另一个输入可以是正被编码的当前分区/块。此外,由于计算失真的目的,需要对所有频带进行完全重建,因此将重建的LL频带和其他(HL、LH、HH)频带块进行组装,以在“将4×4和8×8块组装成16×16 MB和组装成小波频带的组装器”处于形成宏块,并且然后在“解块滤波”模块中经历解块,从而导致重建的LL、HL、LH和HH频带,其具有输入到RDO以用于在计算失真中使用的减少的伪像。
图10B图示了根据本公开的至少一些实现布置的与图10A的译码器相对应的功能独立的AWAVC帧内解码器1002的框图。除了“自适应小波合成滤波”模块和“颜色空间逆变器”的操作之外,解码器1002的大部分讨论对应于AWAVC帧内译码器1002中的解码环路的讨论。如所示,译码的AWAVC比特流(bitstr)可以由“比特流无格式化器、CABAC熵解码器和小波频带的4×4/8×8逆扫描变换系数块”模块来解码,从而导致选定的分区信息(partnb)、选定的帧内预测模式信息(模式b)、选定的量化器(qp)和已量化变换系数块。可以使用量化器qp在“逆量化器”处对量化的变换系数块进行解量化,并且通过“4×4/8×8 2D块整数(DCT近似)逆变换”模块进行逆变换,从而导致针对HL、LH和HH频带的重建采样块以及针对LL频带的过渡采样块。如所讨论的,通过由加法器1121将由“本地缓冲器和DC/平面/7方向预测生成器”所生成的(使用预测模式b信息生成的)预测块添加到已解码的过渡块,可以生成LL频带的最终块。通过“将4×4和8×8块组装成16×16 MB和组装成小波频带的组装器”,每个小波频带的所有分区/块可以被组装成宏块并由此被组装成全频带,其可以在“解块滤波”模块中经历解块以减少编码伪像,并且然后可以被输入到“自适应小波合成滤波”模块,该模块可以使用与小波分析滤波器互补的滤波器(具有关于经由比特流发送的在译码器处使用的滤波器的信息)来执行合成滤波,该合成滤波可以将所有4个频带进行组合以生成解码的YUV帧(dec.frame)。取决于应用,该帧本身可能已经足够,或者它可能需要通过“颜色空间逆变器”通过可选处理而被转换为RGB格式图像以生成解码图像(dec.image)(解码图像)。
图11图示出了根据本公开的至少一些实现布置的提供图10A的AWAVC译码器的“自适应小波分析滤波”模块和图10B的AWAVC解码器的“自适应小波合成滤波”模块的细节的系统1101。图11还图示出了到译码器和解码器的其余部分的接口。例如,图11示出了一些实际块(“颜色空间转换器”、“应用、内容、速率和复杂度分析器”、“速率失真优化(RDO)和比特率控制器”和“颜色空间逆变器”)和一些与“自适应小波分析滤波器”或“自适应小波合成滤波器”进行接口的捆绑块(“在分析滤波后的其他译码和解码步骤”和“在合成滤波前的其他解码步骤”)。如所示,“自适应小波分析滤波器”模块可由两个块或模块组成:“自适应小波分析滤波器系数组”模块和“小波分析滤波”单元或模块。“自适应小波分析滤波器系数组”可以是多个滤波器组(例如,包括CDF 5/3、CDF9/7、QMF13和QMF15或QMF31的组1-4)的查找表或码本,使得该组的第一滤波器被用于低通分析滤波(lpqf),并且该组的第二滤波器被用于高通分析滤波(hpaf),如本文所讨论的。基于应用(例如,高质量/快速处理)、分辨率(例如,1080p或更少)和内容(例如高对比度/模糊),选定的滤波器组可以被选择并经由小波滤波器组索引(wfi)在比特流(bitstr)中被信号发送。例如,“小波分析滤波”模块可以使用(由wfi索引的)从码本中选定的滤波器组来在译码器处执行子带分解。
此外,图11图示了“自适应小波合成滤波器”可以包括“小波合成滤波”模块和“自适应小波合成滤波器系数组”模块。“自适应小波合成滤波器系数组”可以是多个滤波器组(例如,包括CDF 5/3CDF9/7QMF13和QMF15或QMF31的组1-4)的查找表或码本,使得该组的第一滤波器用于低通合成滤波(lpsf),并且该组的第二滤波器用于高通合成滤波(hpsf),如本文所讨论的。例如,lpsfhpsflpafhpaf滤波器的对应匹配滤波器。“小波合成滤波”可以使用码本中已解码的小波滤波器组索引来确定滤波器组以使用来在解码器处执行子带重组。
图12A图示出了根据本公开的至少一些实现布置的提供图10A的“本地缓冲器和预测分析器和生成器”以及到AWAVC帧内译码器的其余部分的接口的细节的系统1201。例如,图12A图示了在AWAVC帧内译码器中的“本地缓冲器和预测分析器和预测生成器”。例如,图12A示出了到捆绑单元“应用、内容、速率和复杂度分析器、颜色空间转换器和小波分析滤波”的接口,所述捆绑单元是三个单元或模块(例如“应用、内容、速率和复杂度分析器”、“颜色空间转换器”和“小波分析滤波”)的组合。此外,图12A图示了到“速率失真分析器(RDO)和比特率控制器”的接口,为了清楚起见将“速率失真分析器(RDO)和比特率控制器”分成三个子单元(例如“译码比特率和重建失真计算器”、“用于分区尺寸和预测模式的最佳选择的RDO”和“比特率控制器”)以清楚地显示与系统其余部分的接口。图12A还图示出了诸如到“将小波频带分区成16×16 MB和8×8和4×4块的分区器”以及到一起被称为“在预测之后的其他译码步骤”的子单元集合的其他接口。“在预测之后的其他译码步骤”单元可以包括子单元,诸如“差分器”、“4×4/8×8 2D块整数(DCT近似)变换”模块、“量化器”、“小波频带的4×4到8×8扫描变换系数块、CAVLC/CABAC熵译码器和比特流格式化器”、“逆量化器”、“4×4/8×8 2D块整数(DCT近似)逆变换”模块、“加法器”、“将4×4和8×8块组装成16×16 MB和小波频带的组装器”以及“解块滤波”模块)。此外,还显示了这些子单元到“本地缓冲器和预测分析器和生成器”的接口。
此外,“本地缓冲器和预测分析器和生成器”被示出被划分成两个单元:“已解码小波LL频带相邻本地区域缓冲器”和“DC/平面/7方向预测分析器和生成器”。“已解码小波LL频带相邻本地区域缓冲器”可以存储已解码的先前块以使用作为用于生成帧内预测的参考。“DC/平面/7方向预测分析器和生成器”可被用来使用相邻块区域在分区/块的基础上形成帧内预测。例如,生成帧内预测的过程可以使用DC预测、平面预测和基于7个角度的方向预测来生成9个候选预测(模式),其可由RDO分析以确定最佳预测模式(模式b)。除了模式b信号之外,由“小波频带的4×4/8×8扫描变换系数块、CAVLC/CABAC熵译码器和比特流格式化器”生成的译码比特流可以携带包括小波滤波器组选择索引(wfi)的其他信号。
图12B图示出了根据本公开的至少一些实现布置的提供图10B的“本地缓冲器和预测生成器”以及到AWAVC帧内解码器的其余部分的接口的细节的系统1202。例如,图12B图示出了AWAVC帧内解码器中的“本地缓冲器和预测生成器”。如所图示,各种单元或模块(例如,“比特流无格式化器、CAVLC/CABAC熵解码器和小波频带的4×4/8×8逆扫描变换系数块”模块、“逆量化器”、“4×4/8×8 2D块整数(DCT近似)逆变换”模块、“加法器”、“将4×4和8×8块组装成16×16 MB和组装成小波频带的组装器”、“解块滤波”模块、“自适应小波合成滤波”模块和“颜色空间逆变器”)被提供并用于示出到“本地缓冲器和预测生成器”的接口。如所示,“本地缓冲器和预测生成器”模块可以被划分成两个子单元或模块:“已解码小波LL频带相邻区域缓冲器”和“DC/平面/7方向预测生成器”。“已解码小波LL频带相邻区域缓冲器”可以保存“DC/平面/7方向预测生成器”进行预测所需的相邻块,所述“DC/平面/7方向预测生成器”可以使用模式b来提取最佳预测模式并且仅为该模式产生预测。
图13图示出了根据本公开的至少一些实现布置的提供图10A的AWAVC帧内译码器的“4×4/8×8 2D块整数(DCT近似)变换”模块以及图10B的AWAVC帧内解码器的“4×4/8×82D块整数(DCT近似)逆变换”模块的细节的系统1301。在图13中,在译码侧,图示出了两个捆绑块(例如,“在正向变换之前的其他译码步骤”和“在正向变换之后的其他译码和解码步骤”),其与“4×4/8×8 2D块整数(DCT近似)变换”模块进行接口,其可以包括两个组件或模块:“2D块整数(DCT近似)变换”模块和“基础矩阵整数近似DCT4、DCT8 LUT”单元。例如,所支持的针对正向变换的选项可以是4×4和8×8整数DCT近似。
此外,译码器可以经由其生成的比特流(bitstr)发送多个控制信号。比特流格式化过程没有被明确示出,但被并入在捆绑块“在正向变换之后的其他译码和解码步骤”模块中。控制信号携带诸如针对图块的最佳分区(partnb)、每个分区的最佳模式判定(模式b)(由于简化而在图13中未示出)以及对所选小波滤波器组的索引(wfi)之类的信息。这种控制信号在解码器处可以由捆绑块“在逆变换之前的其他解码步骤”来解码,其可以在包括对解码器处的解码过程的控制在内的其他操作之中提供比特流无格式化。
此外,在解码侧上,捆绑块(“在逆变换之前的其他解码步骤”和“在逆变换之后的其他解码步骤”)被示出与“4×4/8×8 2D块整数(DCT近似)逆变换”组件进行接口,该组件本身可包括两个组件或模块:“2D块整数(DCT近似)逆变换”模块和“基础矩阵整数近似DCT4、DCT8 LUT”模块(例如,如在译码器侧那样)。例如,所支持的针对逆变换的选项可以是4×4和8×8 DCT近似(例如,与针对正向变换的相同)。
图14A图示出了根据本公开的至少一些实现布置的图像的两级二元分解过程1401。例如,图14A图示出了由视频帧/图像的2级分解导致的7个小波频带。如所示,该过程可以包括通过对行然后对列应用低通和高通滤波来执行图像的一级分解,从而导致LL1、HL1、LH1和HH1子带。此外,可以通过相同的分解过程进一步分解低-低(LL1)子带。这导致LL1子带进一步分解成可被表征为LL2、HL2、LH2和HH2的4个子带,其中LL2现在是低-低子带。如所示,两级二元分解过程可以生成7个子带:LL2、HL2、LH2、HH2、HL1、LH1和HH1
图14B是根据本公开的至少一些实现布置的示例AWAC(AW2AVC)帧内译码器1402的框图。例如,图14B的译码器/解码器可以提供由两级分解所导致的视频/图像帧的7个子带的译码/解码。例如,图14可以图示将自适应小波2级分析/合成与AVC高10译码器/解码器进行组合的自适应小波AVC(AW2AVC)帧内译码器/解码器。如所示,在译码侧,输入视频(或图像)YUV帧(帧)可以通过“自适应小波分析滤波”模块使用来自滤波器组的码本的滤波器组而经历自适应小波分解以及选择滤波器,其中滤波器的选择基于应用(例如,分辨率、内容和比特率)。使用所选择的滤波器组,可以针对两级分解执行分析滤波过程,并且可以将帧转换为LL2、HL2、LH2、HH2、HL1、LH1和HH1子带。例如,子带LL2、HL2、LH2和HH2是十六分之一尺寸,而子带HL1、LH1和HH1是四分之一尺寸。所有的子带都具有9比特的比特深度(假设是一个8比特输入视频或图像或帧)。此外,一级分解可以将幅度扩大2的平方根(例如,因子为1.414,因此在在0-255范围内的8比特输入视频在一级分解之后可以在0-361范围内,需要9比特)。对LL1频带执行另一级分解也是如此,其将0-361范围乘以2的平方根,作为结果所得到的范围0-511仍然适合于9比特值。因此,在2级分解之后,不需要10比特精度。如所示,来自2级分解的子带LL2、HL2、LH2和HH2导致输入视频/图像帧的1/16尺寸的子带,而子带HL1、LH1和HH1是输入视频/图像帧的1/4尺寸。
如所示,所有7个子带(例如,LL2、HL2、LH2、HH2、HL1、LH1和HH1)子带可以由AVC高10I/帧内译码器(例如,“AVC高10 I/高10帧内/高4:4:2帧内译码器”)译码。虽然在每个频带上使用相同的译码器可能未提供最高的压缩效率(因为所有子带将使用帧内预测并且未针对每个子带优化扫描等),但是这种实现可能更简单并且可以提供兼容性并允许使用高效硬件或软件译码器。如所示,作为结果所得到的7个比特流可以通过“到分层比特流的复用器”而与报头复用以形成单个已译码比特流(bitstr),其中比特流中的报头之一包括用于分解的小波滤波器组的索引(wfi)。
例如,如图14B中所示,可以执行图像或帧的小波分解(例如,通过“自适应小波分析滤波”模块)以生成多个子带(LL2、HL2、LH2、HH2、HL1、LH1和HH1子带),可以使用高级视频编码(AVC)相符的译码器对多个子带的每一个进行译码以生成多个AVC相符比特流——每一个对应于一个子带,并且可以对这些子带进行复用以生成可缩放比特流。此外,可以选择小波分析滤波器组以用于执行小波分解。在一个实施例中,图像或帧(帧)具有8比特的比特深度,并且每个子带具有9比特的比特深度。例如,AVC相符的译码器可以是10比特帧内画质译码器。如所示,执行小波分解可以包括多级小波分析滤波,并且多个子带可以包括七个子带:LL2、HL2、LH2、HH2、HL1、LH1和HH1
如所示,图14B的解码侧反转译码过程。例如,可以通过“到比特流层的解复用器”将所接收的比特流(bitstr)解复用为子带比特流和解码报头。例如,解码报头中的一个可以包括小波滤波器组选择信息。取决于应用或用户要求等,可以经由开关1421进行输出选择。例如,如果选择了1/16尺寸/最低质量帧(其可以被上采样以用于显示)的已解码LL2子带,则只有LL2频带被诸如“AVC高10 I/高10帧内/高4:4:2帧内解码器”之类的“AVC高10 I/帧内解码器”解码(这样的选择可以被表征为低分辨率选择)。例如,这样的帧可以通过“比特深度限制器和1:4上采样器”而被进行比特深度限制并且可选地进行上采样以生成帧(dec.frame)。如果该分辨率不足,则用户或系统可能需要是由LL2、HL2、LH2和HH2频带的合成所形成的输入帧的1/4尺寸的下一个可用分辨率,并且因此除了对LL2频带进行解码之外还使用AVC高10 I/帧内解码器(“AVC高10 I/高10帧内/高4:4:2帧内解码器”)来解码HL2、LH2和HH2频带,并应用1级自适应合成滤波以重建1/4尺寸的中等质量帧(其可以被上采样以用于显示)。这样的选择可以被表征为中分辨率选择。例如,这样的帧可以通过“比特深度限制器和1:2上采样器”而被进行比特深度限制并且可选地进行上采样以生成帧(解码帧)。如果用户或系统要求是全尺寸/全质量帧(例如,全分辨率选择),则全分辨率帧(dec.frame)可以通过由AVC高10 I/帧内解码器(“AVC高10 I/高10帧内/高4:4:2帧内解码器”)对全部7个频带进行解码并且由“自适应小波合成滤波”模块通过2级自适应合成滤波而将7个已解码子带进行组合来获得。例如,在每个亮度分量预期显示的8比特上输出每个亮度分量图像的9比特时,如所讨论的,比特深度限制(例如通过截取或舍入或更复杂的手段)可能是必要的。
例如,在编码器1402的解码器侧,可以对可缩放比特流进行解复用,使得可缩放比特流的至少一些部分是高级视频编码(AVC)相符的,以提供多个比特流——每一个对应于多个小波子带的一个子带,至少一个比特流可以用AVC相符的解码器来解码,并且可以基于解码来重建图像或帧。此外,可以确定对应于图像或帧(dec.frame)的输出选择,使得输出选择可以是低分辨率、中分辨率或全分辨率选择,使得对图像或帧进行重建可以响应于输出选择。例如,当输出选择是低分辨率时,对图像或帧进行重建可以包括利用AVC相符的解码器来仅解码LL2子带。例如,对图像或帧进行重建可以进一步包括通过“比特深度限制器和1:4上采样器”应用比特深度限制器和/或执行上采样。当输出选择是中分辨率时,对图像或帧进行重建可以包括利用至少AVC相符的解码器来解码多个比特流——每一个对应于多个小波子带的一个子带,以生成多个已解码子带,使得多个比特流包括多个比特流的子集。例如,该子集可以是LL2、HL2、LH2和HH2频带。例如,对图像或帧进行重建可以进一步包括通过“比特深度限制器和1:2上采样器”应用比特深度限制器和/或执行上采样。当输出选择是全分辨率时,对图像或帧进行重建可以包括利用至少AVC相符的解码器来解码多个比特流——每个比特流对应于多个小波子带的一个子带,以生成多个已解码子带,并且(通过“自适应小波合成滤波”模块)对多个已解码子带执行多级小波合成滤波以生成全分辨率的图像或帧。
图15A图示了根据本公开的至少一些实现布置的用于AW2AVC译码的示例过程1501。如所示,输入视频/图像帧(被标记为“帧”)可以(在被标记为“执行2级自适应小波分析以生成7个子带”的操作处)经历2级自适应小波分析滤波以将其分解成7个频带。(在被标记为“子帧贮存器中的1/16尺寸9b LL2/HL2/LH2/HH2子带”和“子帧贮存器中的1/4尺寸9bHL1/LH1/HH1子带”的操作处)可以将7个子带存储在它们自己的子帧缓冲器中——七个频带中的4个是原始帧尺寸的1/16并且因此需要这种尺寸的帧缓冲器,并且3个频带是输入帧尺寸的1/4并且因此需要四分之一尺寸的帧缓冲器。当输入为8比特比特深度时,每个子带中的每个采样(例如,子带系数)具有9比特的比特深度。可以将七个子带中的每一个划分成MB,并且(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内译码LL2/HL2/LH2/HH2/HL1/LH1/HH1 MB/块”的操作处)可以用AVC高10I/帧内译码器对块进行译码。(在被标记为“对报头进行译码、对小波系数数据进行熵译码并且进行复用以产生帧内译码比特流”的操作处)可以将作为结果所得到的7个子带比特流与已译码报头(包括识别所选小波滤波器组的报头)进行复用并输出为单个可缩放比特流(被标记为“比特流”)。
图15B图示了根据本公开的至少一些实现布置的用于AW2AVC解码的示例过程1502。如所示,可以将AW2AVC译码比特流(被标记为“比特流”)输入到解复用器和报头解码器,该解复用器和报头解码器可以分离并解码报头并分离各个子带比特流(在被标记为“解复用、解码报头和熵解码来自帧内可缩放小波编码比特流的小波系数数据”的操作处)。取决于用户或系统要求,解码过程可以工作在三种不同的(通过被标记为“输出全分辨率
Figure DEST_PATH_IMAGE008A
”的判决操作所确定的)方式之一中。例如,如果1/16分辨率/质量图像被认为是足够的(被标记为“基于1/16”),则(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内解码LL2 MB/块”的操作处)可以由AVC高10I/帧内解码器仅解码LL2频带并且(在被标记为“在每个维度上被4倍上采样”的操作处)可选地进行上采样以用于显示。如果中分辨率/质量图像(被标记为“基于1/4”)可以满足用户要求等,则(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内解码LL2/HL2/LH2/HH2 MB/块”的操作处)LL2、HL2、LH2和HH2频带可以由一个或多个AVC高10 I/帧内解码器解码并(在被标记为“1/16尺寸9b LL2/HL2/LH2/HH2子带重建子帧贮存器”的操作处)存储在子帧中并且(在被标记为“执行1级自适应小波合成”的操作处)由自适应小波合成滤波进行组成以创建1/4分辨率解码视频/图像,其(在被标记为“在每个维度上被2倍上采样”的操作处)可以选择性地被上采样以供显示。如果用户等需要全分辨率/质量帧(被标记为“全”),则(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内解码LL2/HL2/LH2/HH2/HL1/LH1/HH1 MB/块”的操作处)所有七个频带可以由一个或多个AVC高I/帧内解码器解码并(在被标记为“1/16尺寸9b LL2/HL2/LH2/HH2/HL1/LH1/HH1子带重建子帧贮存器”的操作处)存储在子帧中并且(在被标记为“执行2级自适应小波合成”的操作处)由自适应小波合成滤波(其使用由wfi识别的小波滤波器组)进行组成以创建全分辨率/质量解码视频/图像帧以用于显示。
图16是根据本公开的至少一些实现来布置的自适应小波修改的AVC(AWMAVC)编码器1601的框图。例如,图16图示出了自适应小波修改的AVC(AWMAVC)帧内译码器/解码器,其将自适应小波分析/合成滤波与AVC高10/高10*译解码器组合,使得译码器对输入视频帧/图像进行译码以生成单个比特流,从该单个比特流中可以解码较低质量或全质量版本的译码输入视频帧/图像。
如所示,在译码侧,输入视频(或图像)YUV帧(帧)可以通过“自适应小波分析滤波”模块使用来自滤波器组的码本的滤波器组而经历自适应小波分解,其中滤波器的选择基于应用(例如,分辨率、内容和比特率)。使用所选择的滤波器组,对于一级分解,可以执行分析滤波的过程,其可以将帧转换为LL、HL、LH和HH子带,其中每一个都是四分之一尺寸,并且比特深度为9比特(假定8比特输入视频或图像)。LL子带可以由AVC高10 I/帧内译码器(例如,“AVC高10 I/高10*帧内/高4:4:2帧内译码器”)进行译码,并且HL、LH和HH子带可以利用单独定制的AVC高10* I/帧内译码器(例如,“AVC高10* I/高10*帧内/高4:4:2*帧内译码器”)进行译码。译码过程的结果可以包括诸如LL比特流、HL比特流、LH比特流和HH比特流之类的四个单独比特流,其可以通过“到分层比特流的复用器”复用成具有报头的单个可缩放比特流(bitstr),所述报头包括携带所选小波滤波器组的索引(wfi)的报头。
也如图16中所示,在解码侧,可以接收比特流(bitstr),并且包括携带所选小波滤波器组的索引(wfi)的报头的报头可以被解码,并且通过“到比特流层的解复用器”可以将比特流解复用为单独的LL、HL、LH和HH比特流。解复用的LL比特流可以被提供给AVC高10 I/帧内解码器(例如,“AVC高10 I/高10帧内/高4:4:2帧内解码器”)并且取决于如通过开关1611所实现的用户或系统输出选择,可以在通过“比特深度限制器和1:2上采样器”在每个维度上进行可选的2倍上采样之后提供低分辨率解码视频(或图像)帧(dec.frame)以用于显示。如果用户或系统(经由开关1611)选择全分辨率视频(或图像)帧,则可将其余的3个(HL、LH和HH)频带提供给对应的定制AVC高10* I/帧内解码器(例如“ AVC高10* I/高10*帧内/高4:4:2*帧内解码器”)并且可以通过“自适应小波合成滤波”模块使用(由从比特流中解码的索引所指示的)匹配滤波器组组合所有四个四分之一尺寸的解码子带。结果可以提供全分辨率/尺寸最终重建视频(或图像)帧(dec.frame)以用于显示。
图17A图示了根据本公开的至少一些实现布置的用于AWMAVC帧内译码的示例过程1701。如所示,基于取决于应用(例如,分辨率、内容和比特率)的最佳合适滤波器组的选择,输入视频(或图像)帧(被标记为“帧”)可以(在被标记为“执行自适应小波分析以生成4个子带”的操作处)经历一级自适应小波分析滤波。分析滤波过程可以导致四个子带,其中每个子带是输入帧尺寸的1/4,并且包括子带系数(也被称为子带像素或采样),在输入帧的像素为8比特精度时所述子带系数精度为9比特。(在被标记为“1/4尺寸9b LL/HL/LH/HH子带子帧贮存器”的操作处)可以将每个生成的子带存储在相应的四分之一尺寸子帧贮存器中并且将其划分成MB和块。(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内译码LL MB/块”的操作处)可以由AVC高10 I/帧内译码器对LL子带的块进行编码,并且(在被标记为“AVC高10* I/高10*帧内/高4:4:2*帧内译码HL/LH/HH MB/块”的操作处)可以由一个或多个AVC高10* I/帧内译码器对HL、LH和HH子带的块进行编码。来自这些AVC高10 I/帧内或AVC高10*I/帧内译码器的单独生成的比特流可以与报头(所述报头包括用信号通知针对分析所使用的小波滤波器组的报头)组合并被复用(在被标记为“译码报头、熵译码小波系数数据以及复用以生成AWMAVC帧内译码比特流”的操作处)以生成单个AWMAVC编码比特流(被标记为“比特流”)以用于存储或传送。刚刚描述的译码方法生成可缩放比特流,其中可以独立地解码LL子带比特流或者可以一起解码所有四个子带。
图17B图示了根据本公开的至少一些实现布置的用于AWMAVC帧内解码的示例过程1702,其逆转由AWMAVC帧内译码执行的过程。如所示,可以接收AWMAVC帧内比特流(被标记为“比特流”),并且可以对包括关于在译码器处针对分析所使用的小波滤波器组的解码信息在内的比特流报头进行解码,并且(在被标记为“对AWMAVC帧内译码比特流进行熵解码”的操作处)可以将其余的比特流解复用成单独的LL、HL、LH和HH比特流中的每一个。如果用户或系统基于(如由被标记为“小波编码全分辨率输出
Figure DEST_PATH_IMAGE009
”的判定操作所实现的)输出选择等而请求低分辨率输出,则(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内解码LL MB/块”的操作处)LL子带可以被AVC高10 I/帧内解码,被进行比特深度限制,并且(在被标记为“在每个维度上被2倍上采样”的操作处)可选地被上采样以生成可被发送以输出的低分辨率上采样视频/图像帧(被标记为“否,小波低分辨率”)。如果用户或系统要求全分辨率输出,则(在被标记为“AVC高10* I/高10*帧内/高4:4:2*帧内解码HL/LH/HH MB/块”的操作处)每个其余子带可由AVC高10* I/帧内解码器解码,并且包括LL解码的LL频带,全部四个子带可以被存储在子帧贮存器中(在被标记为“1/4尺寸9b LL/HL/LH/HH子带子帧贮存器”的操作处)。使用指示要被用于小波分析滤波的小波滤波器组的解码报头,确定匹配小波合成滤波器组。(在被标记为“执行自适应小波合成以生成重建帧”的操作处)来自子帧贮存器的解码LL、HL、LH和HH子带可以使用这些滤波器经历帧合成以组合解码子带,从而导致可以被输出以进行显示的完全重建视频/图像帧(被标记为“是,小波全分辨率”)。如所讨论的,取决于用户或系统要求(例如,解码资源限制等)从相同比特流解码低分辨率输出或全分辨率输出的这种条件解码可以被表征为可缩放解码,并且可能是由于可缩放(也被称为嵌入)译码而是可能的,所述可缩放译码由于小波编码而能被执行。关于图17A和图17B讨论的可缩放性的类型可以提供2层:四分之一分辨率层和全分辨率层。
图18A图示出了根据本公开的至少一些实现布置的、针对被变换为4×4变换系数块的LL频带4×4采样块的用于变换系数的锯齿形扫描方向1801。例如,变换系数或已量化变换系数可以使用如图18A中所图示的扫描方向进行锯齿形扫描。例如,图18A图示出了AWMAVC帧内编码中的小波LL频带4×4块变换系数的扫描。如所示,对于LL频带,锯齿形扫描可以被使用,其中扫描从右下角开始并水平移动到下一个较高频率,并且然后沿对角向上垂直移动到相同频率,并且然后垂直向上移动到下一个较高频率,沿对角向上移动,扫描中间系数,水平移动到相同频率,以此类推,直到它达到块的左上角处的最高频率系数。逆扫描可以通过以相反的方式(例如,从块的左上角到右下角)提供系数而从解码比特流中生成变换系数或已量化变换系数。
图18B图示出了根据本公开的至少一些实现布置的、针对被变换为4×4变换系数块的HL频带4×4采样块的用于变换系数的锯齿形扫描方向1802。例如,18B可以提供在AWMAVC帧内编码中的小波HL频带4×4块变换系数或已量化变换系数的修改的扫描。如所示,对于HL频带,锯齿形扫描可以被使用,其中扫描从右上角开始并且以锯齿形图案移动到块的左下角。逆扫描可以通过以相反的方式(例如,从块的左下角到右上角)提供系数而从解码比特流中生成变换系数或已量化变换系数。
图18C图示出了根据本公开的至少一些实现布置的、针对被变换为4×4变换系数块的LH频带4×4采样块的用于变换系数的锯齿形扫描方向1803。例如,18C可以提供在AWMAVC帧内编码中的小波LH频带4×4块变换系数或已量化变换系数的修改的扫描。如所示,对于LH频带,锯齿形扫描可以被使用,其中扫描从左下角开始并且以锯齿形图案移动到块的右上角。逆扫描可以通过以相反的方式(例如,从块的右上角到左下角)提供系数而从解码比特流中生成变换系数或已量化变换系数。
图18D图示出了根据本公开的至少一些实现布置的、针对被变换为4×4变换系数块的HH频带4×4采样块的用于变换系数的锯齿形扫描方向1804。例如,18D可以提供在AWMAVC帧内编码中的小波HH频带4×4块变换系数或已量化变换系数的修改的扫描。如所示,对于HH频带,锯齿形扫描可以被使用,其中扫描从左上角开始并且以锯齿形图案移动到块的右下角。逆扫描可以通过以相反的方式(例如,从块的右下角到左上角)提供系数而从解码比特流中生成变换系数或已量化变换系数。
如关于图8、图14和图16所讨论的,可以结合AVC高10 I/帧内编码来提供基于小波的可缩放性。在其他示例中,基于小波的可缩放性可以与传统的空间可缩放性组合。图19图示了组合空间可缩放性和基于小波的可缩放性的示例系统。
图19是根据本公开的至少一些实现布置的示例编码器1901的框图。例如,图19可以提供自适应小波可缩放AVC(AWSVC)帧内译码器/解码器,其通过组合自适应小波滤波、下/上采样和AVC高10帧内编码来提供SNR可缩放编码。从单个可缩放比特流中,可以解码3个版本:具有相同分辨率但不同质量的2个以及具有最高分辨率的一个。如所示,在译码侧,输入视频帧(帧)可以被滤波并由“2:1下采样器”在每个维度上以因子2进行下采样。由于下采样图像是正常8比特的比特深度像素域信号,因此(例如,在“AVC主I/高I/渐进I/约束高I/高10 I/高10帧内;MPEG-2主I译码器”处)可以通过AVC主I、AVC高I、AVC约束高、AVC高10I、AVC高10帧内、非AVC译码器诸如MPEG-2主I译码器对其进行译码。而且,如所示,相同的输入视频/图像帧可以在“自适应小波分析滤波”模块处(例如,利用取决于应用、分辨率或用户需求的滤波器组)经历分解,该模块可以将帧分解为LL、HL、LH和HH子带。如所示,来自“AVC主I/高I/渐进I/约束高I/高10 I/高10帧内;MPEG-2主I译码器”的本地解码视频/图像帧可以被用于LL频带的编码和“帧间频带”(inter band)预测(被标记为“层间预测”)。对于LL子带的编码,“AVC可缩放高10 I/帧内译码器”(例如类似于可缩放视频编码(SVC)中使用的AVC可缩放高I/帧内译码器——除了它支持10比特的比特深度输入以处理9比特的比特深度信号的LL频带。这种类型的空间/SNR可缩放性结构可以允许LL频带帧内编码以不仅从LL频带而且还从未被小波译码的基础层(这可能需要比特偏移以在用它来预测之前将基础层扩展到9比特信号)本地地使用自适应预测。在图示的示例中,基础层使用与小波LL频带子带相同的分辨率,因此基础层解码的视频/图像帧不需要在LL频带的预测之前被上采样。当两层(基础层和LL频带层)处于相同的分辨率时,这样的缩放性可被表征为SNR可缩放性。
如所示,可以如本文所讨论的那样提供其余的3个(HL、LH和HH)子带的编码(例如,编码器1901可以使用一个或多个AVC高10 I/帧内译码器,其被示为“AVC高10 I/高10帧内/高4:4:2帧内译码器”或修改的AVC译码器,诸如关于图16讨论的“AVC高10* I/高10*帧内/高4:4:2*帧内译码器”)。作为结果所得到的基础层比特流和4个子带比特流可以与报头一起复用为单个比特流(bitstr)。报头可以指示哪个滤波器组被用于自适应小波分析滤波,并且LL频带是关于外部(非子带分解的)基础层进行译码的SNR可缩放性。
解码侧可以通过接收比特流(bitstr)、通过“到比特流层的解复用器”将复用的基础层比特流和子带比特流解复用并解码必要的报头以确定所使用的可缩放性并创建成功解码可缩放流所需的解码结构来执行反转过程。这可以基于输出选择来进行选择并且经由开关1911来实现,可以有三种可用于解码的选择:通过“AVC主I/高I/渐进I/约束高I/高10I/高10帧内;MPEG-2主I解码器”来以1/4分辨率解码独立编码的基础层流,其可导致比LL频带更低质量的解码视频/图像帧,通过“AVC可缩放高10 I/可缩放高10帧内解码器”进行1/4分辨率LL频带流解码,其可以提供1/4分辨率视频/图像帧但具有较高质量,和“自适应小波合成滤波”模块的输出,其可以组合由“AVC可缩放高10 I/可缩放高10帧内解码器”(LL子带)和“AVC高10 I/高10帧内/高4:4:2帧内解码器”(LH、HL、HH子带)解码的4个子带,从而导致全分辨率/质量解码视频/图像帧;所选择的实际解码方法取决于用户要求。
例如,如果独立的基础层分辨率/质量(例如,低分辨率)对于用户或系统是足够的,那么可以通过使用匹配(取决于在译码侧所使用的译码器)解码器诸如AVC主I或AVC高I或AVC约束高或AVC高10 I或AVC高10帧内或MPEG-2主I解码器对那个流进行解码。解码视频/图像帧可以在“1:2上采样器”处在每个维度上被2倍上采样以用于显示。如果期望中等质量的LL频带输出,则不仅基础层需要被解码(如刚刚所述),而且LL频带也需要由使用已解码的基础层视频/图像帧用于SNR可缩放预测的AVC可缩放高10比特/帧内解码器来进行解码。如果用户需要全分辨率/质量解码视频/图像帧,除了刚刚描述的用于解码LL子带的过程之外,还需要通过使用一个或多个AVC高10 I/帧内解码器来解码诸如HL、LH和HH子带之类的其余3个子带。然后,可以将所有四个解码子带输入到“自适应小波合成滤波”模块,该模块使用从比特流中的报头所解码的滤波器组信息来执行合成滤波。该过程的输出是解码的全分辨率/质量视频/图像帧。
尽管在图19的系统中,基础层和LL频带具有相同的(1/4尺寸)分辨率,但是可以通过使用4:1而不是2:1下采样滤波器以诸如1/16分辨率之类的较低空间分辨率来对基础层进行编码。在这样的示例中,LL子带将使用空间可缩放性。
图20A图示了根据本公开的至少一些实现布置的用于自适应小波可缩放AVC(AWSVC)帧内译码的示例过程2001。如所示,输入视频/图像帧(被标记为“帧”)可以被滤波并且(在被标记为“在每个维度上被2倍下采样和子帧贮存器”的操作处)在每个维度上以因子2进行下采样,从而导致(在被标记为“在每个维度上被2倍下采样和子帧贮存器”的操作处)可以存储的1/4尺寸的图像,并(在被标记为“AVC主I/高I/渐进高I/约束高I/高10 I/高10帧内;MPEG-2主I帧内译码MB/块”的操作处)由诸如AVC主I或AVC高I或AVC约束高或AVC高10 I或AVC高10帧内或MPEG-2主I译码器之类的译码器进行译码。所生成的译码流可以被表征为基础层比特流。此外,(在被标记为“执行自适应小波分析以生成4个子带”的操作处)也可以使用滤波器组(例如,取决于应用、内容或用户要求)将输入视频/图像帧进行自适应小波分析滤波成为LL、HL、LH和HH小波子带。(在被标记为“1/4尺寸9b LL/HL/LH/HH子带子帧贮存器”的操作处)可以将4个子带存储在对应的帧贮存器中,其可以存储可以被译码的1/4尺寸的9比特的比特深度子帧。(在被标记为“AVC可缩放高10 I/可缩放高10帧内译码LLMB/块”的操作处)LL频带可以经历AVC可缩放高10 I/帧内译码,其可以相对于本地解码的基础层视频/图像帧而使用SNR可缩放性译码。(在被标记为“AVC高10 I/高10帧内译码HL/LH/HH MB/块”的操作处)其余子带可以经历AVC高10 I/帧内译码或修改的译码,如本文所讨论的。(在被标记为“译码报头、熵译码小波系数数据、并且复用以生成帧内可缩放小波译码比特流”的操作处)所有五个译码流可以与若干译码报头一起复用以生成比特流,所述报头携带诸如哪个小波滤波器组被用于分析和相对于非小波编码的基础层而用于编码LL频带的可缩放性的类型的信息。
图20B图示了根据本公开的至少一些实现布置的用于自适应小波可缩放AVC(AWSVC)帧内解码的示例过程2002。如所示,(在被标记为“解复用、解码报头和熵解码来自帧内可缩放小波编码比特流的小波系数数据”的操作处)要被解码的比特流可以被解复用成五个不同比特流中的每一个并且可以解码报头。如所讨论的,报头可以携带关于在译码器处选择哪个小波滤波器组以及使用哪种类型的可缩放性从而可以使用必要的解码结构的信息。在五个解复用的比特流中,第一个是基础层比特流,而其他的是LL、HL、LH和HH子带比特流。三种类型的解码是可能的(如由被标记为“输出全分辨率
Figure DEST_PATH_IMAGE008AA
”的判定操作所示),诸如以1/4分辨率解码独立编码基础层比特流(导致较低质量的解码视频/图像帧)、解码可提供1/4分辨率视频/图像帧但质量较高的1/4分辨率LL频带比特流、以及对全部4个频带进行解码并且然后进行自适应小波合成滤波从而导致全分辨率/质量解码视频/图像帧。例如,所选解码技术可取决于用户或系统要求等。
如果独立基础层分辨率/质量对于用户或系统是足够的,则(在被标记为“AVC主I/高I/渐进高I/约束高I/高10 I/高10帧内;MPEG-2主I帧内解码MB/块”的操作处)可以使用匹配(取决于译码侧所使用的译码器)解码来解码基础层流,诸如AVC主I或AVC高I或AVC约束高或AVC高10 I或AVC高10帧内或MPEG-2主I解码。(在被标记为“在每个维度上被2倍上采样”的操作处)解码视频/图像帧可以在每个维度上被2倍上采样以用于显示(被标记为“变换、低分辨率”)。如果期望中等质量的LL频带输出,则需要对基础层进行解码(如刚刚所述),并且(在被标记为“AVC可缩放高10 I/可缩放高帧内解码LL MB/块”的操作处)LL频带需要通过使用已解码的基础层视频/图像帧用于SNR可缩放预测的AVC可缩放高10I/帧内解码来解码。(在被标记为“比特深度限制和在每个维度上进行2倍上采样”的操作处)已解码的LL频带可以被进行比特深度限制并且被上采样,并且可以提供视频/图像帧(被标记为“小波、低分辨率”)。如果用户或系统需要全分辨率/质量解码视频/图像帧,除了刚刚描述的用于解码LL子带的过程之外,(在被标记为“AVC高10 I/高10帧内/高4:4:2帧内解码HL/LH/HH MB/块”的操作处)还需要通过使用AVC高10 I/帧内来解码诸如HL、LH和HH子带之类的其余3个小波子带。(在被标记为“1/4尺寸9b LL/LH/HL/HH子带重建子帧贮存器”的操作处)所有四个解码子带可被存储并且输入到自适应小波合成滤波,其(在被标记为“执行自适应小波合成以生成重建帧”的操作处)使用从比特流中的报头所解码的滤波器组信息来执行合成滤波。该过程的输出是全分辨率/质量视频/图像帧(被标记为“小波、全分辨率”)。
例如,在译码侧,可以对原始图像或帧执行小波分解以生成多个子带,原始图像或帧可以被下采样以生成下采样图像,可以用高级视频编码(AVC)相符的译码器(或任何其他合适的译码器)对下采样图像进行译码以提供层间预测,则可使用AVC相符的可缩放译码器基于层间预测对多个子带中的至少一个子带进行译码(例如,LL子带)以生成对应于子带的比特流,多个子带的其余子带可以被译码以生成一个或多个第二比特流,并且至少对应于该子带的比特流和第二比特流可以被复用以生成可缩放比特流。例如,对其余子带进行译码可以包括AVC相符的译码,并且可缩放比特流可以是AVC相符的。在一个实施例中,对其余子带进行译码可以包括使用基于其余子带的类型的扫描方向对其余子带的已量化变换系数块进行译码,如关于图18A-图18D所讨论的。在一个实施例中,下采样包括在水平维度和垂直维度两者中的2倍下采样。
在解码侧,可以对可缩放比特流进行解复用以提供每个对应于多个小波子带的一个子带的多个比特流和对应于下采样图像的第二比特流,可以利用高级视频编码(AVC)相符的解码器(或任何合适的解码器)对第二比特流进行解码以生成下采样图像,下采样图像可被上采样,可使用AVC相符的可缩放解码器并基于使用上采样图像的层间预测来解码多比特流中的第一比特流以生成多个小波子带的第一子带,多个比特流的其余比特流可被解码以生成多个小波子带的其余子带,并且可基于解码来重建图像或帧。此外,可以确定对应于图像或帧的输出选择,使得输出选择是低分辨率、中分辨率或全分辨率中的至少一个,并且对图像或帧进行重建响应于输出选择。如果输出选择是低分辨率,则重建的图像或帧可以是下采样图像。如果输出选择是中分辨率,则重建的图像或帧可以是第一子带。如果输出选择是全分辨率,则重建的图像或帧可以包括对第一子带和其余子带执行小波重组以生成全分辨率的重建图像或帧。
讨论主要集中在组合小波滤波和AVC译码从而导致多种组合的系统,所述多种组合例如是固定/自适应小波滤波、完全AVC相符的/稍微修改的AVC编码(以获得最大压缩效率)、2层/3层可缩放性、仅小波域可缩放性/组合的空间和小波域可缩放性等等。现在讨论转向小波滤波和高效视频编码(HEVC)编码的组合。例如,可以提供稍微修改的HEVC编码(以提供最大压缩效率)。
图21A图示了根据本公开的至少一些实现方式布置的示例HEVC主10帧内译码器2101。例如,图21A图示了可被用于像素块的变换译码或原始块(或小波子带)的变换译码的示例HEVC主10帧内译码器。如所示,可以将输入帧(帧)分区成被称为最大编码单元(LCU)或编码树单元(CTU)的大块,典型地尺寸为64×64(尽管也允许32×32和16×16)。对于帧内编码,可以通过“CTU到方形CU/PU的自适应分区器”将LCU自适应地分区为诸如32×32、16×16和8×8之类各种尺寸的编码单元(CU)。这种分区可以基于内容和比特率分析或速率失真优化(RDO)来完成,其细节未被示出。此外,对于帧内编码,可以通过“CTU到方形CU/PU的自适应分区器”将CU划分为直至4×4块的方形预测单元(PU)。对于输入视频/图像帧的PU,可以通过“帧内DC/平面/33方向预测器”来生成相同尺寸的帧内预测块。可以通过从由“帧内DC/平面/33预测方向估计器”确定的相邻解码块中所生成的35个不同候选预测(DC、平面和33个方向)来预测一个块。可以在差分器2111的输出处生成预测误差块,并且可以通过“自适应方形TU(4×4、8×8、16×16、32×32)DCT/4×4 DST”模块对预测误差块进行变换编码。对于帧内编码,可以支持32×32、16×16、8×8和4×4的变换块,其中PU尺寸被继承用于变换编码。此外,所有DCT近似变换对于所有TU块尺寸都是可用的;但是,对于4×4块尺寸而言,DST近似变换也是可用的。可以通过“量化器”来量化由正向变换生成的变换系数块,并且可以通过“每个TU尺寸的自适应扫描、CABAC译码器和比特流格式化器”利用CABAC熵译码器来扫描和商编码已量化系数。不同类型的开销数据和控制信号,诸如partn,模式,xmbqp也可以通过“每个TU尺寸的自适应扫描、CABAC译码器和比特流格式化器”进行熵译码。HEVC帧内译码器还包括反馈或解码环路,其可以通过“逆量化器”对已量化变换系数进行解量化,随后是通过“自适应方形TU(4×4、8×8、16×16、32×32)逆DCT/4×4逆DST”模块对用于正向变换所使用的相同尺寸和变换类型的逆变换,随后是在加法器2112处向预测块添加解码误差块,从而导致重建块。为了预测正被译码的块而需要的相邻重建块可以被存储在“本地缓冲器”中并且被用于形成前述的35个候选预测。重建的块也可以通过“方形CU组装成CTU的自适应组装器”组装成CU和CTU以组装本地解码帧,其可以在“解块滤波”模块处进行解块滤波以及在“采样自适应偏移量”模块处进行采样自适应偏移(SAO)滤波并可选地进行输出(dec.frame)。
图21B是根据本公开的至少一些实现布置的示例HEVC主10帧内解码器2102的框图。例如,图21B图示了可解码HEVC主10帧内译码流的示例HEVC主10帧内解码器。例如,解码器可以与相对于参照图21A讨论的HEVC主10译码器的本地反馈环路起相同的作用。如所示,可将HEVC主10译码比特流()输入到“比特流格式化器、CABAC解码器和每个TU尺寸的自适应逆扫描”模块,该模块可提取和解码开销数据和控制信号(然后使其可用于不同的处理块,如所示)并且还可以解码和扫描已量化变换系数。可以通过“逆量化器”对变换系数进行逆量化,并且然后通过“自适应方形TU(4×4、8×8、16×16、32×32)逆DCT/4×4逆DST”模块使用由译码器所使用的变换和块尺寸进行逆变换,从而导致解码预测误差块,其形成到加法器2121的一个输入。在加法器2121的另一个输入处是预测或预测块,其可以通过“帧内DC/平面/33预测方向预测器”以多达35种不同的方式——诸如dc、平面或基于33个方向中的任何一个——而被生成。例如,对于正被预测的每个块,比特流中的模式b信息可以识别需要生成35个可能预测中的哪一个。在加法器2121的输出处生成的重建的帧块/CU可以被存储在“本地缓冲器”中,并且重建的相邻块(对于被解码的块)可以被用来生成预测。重建的帧块/CU也可以被输入到“方形CU组装成CTU的自适应组装器”,其可以组装重建的块/CU以生成CTU并因此生成完整的重建帧。重建的帧可以通过“解块滤波”模块进行解块滤波并且通过“采样自适应偏移”模块进行采样自适应偏移滤波并被输出以用于呈现(dec.frame)。
图22A图示了根据本公开的至少一些实现方式布置的示例HEVC主10*帧内译码器2201,其可以提供HEVC主10帧内译码器而没有帧内预测。例如,HEVC主10*帧内译码器2201可以禁用帧内预测,取决于频带修改系数块内的扫描的起始位置和扫描方向,取决于频带和块尺寸修改扫描次数。例如,图22A的HEVC主10*帧内译码器可以向HEVC主10帧内译码器提供移除了帧内预测但包括取决于子带(诸如LL、HL、LH或HH)的变换类型和自适应扫描位置/方向的选择。如所示,要被译码的视频/图像帧(帧)可被输入到“将CTU分区为方形CU/PU的自适应分区器”,其可将帧分区为相等尺寸的CTU(例如,尺寸为64×64),并且取决于RDO或经由内容和比特率分析,自适应地将每个CTU分区为方形CU(例如,帧内尺寸为64×64、32×32、16×16、8×8)并进一步分区为PU(例如,帧内尺寸为32×32、16×16、8×8、4×4)。由于对于帧内编码,PU和TU可以具有相同的尺寸,所以可以在“自适应方形TU(4×4、8×8、16×16、32×32)DCT/4×4 DST”模块处执行与PU尺寸相同尺寸的正向变换,并且作为结果所得到的变换系数块可以在“量化器”处被量化。可以使用HEVC中的扫描来自适应地扫描已量化变换系数块,但是针对哪个子带使用哪个扫描(水平、对角、垂直),扫描应该开始于块中的系数以及扫描的方向是基于正被编码的子带,并且扫描的系数可以用CABAC译码器并且与开销数据(诸如分区partn、变换xm和量化器qp)和选择的小波滤波器组报头一起进行熵译码,并且通过“每个TU尺寸的修改的自适应扫描、CABAC译码器和比特流格式化器”被格式化成比特流并进行输出。
图22B图示了根据本公开的至少一些实现布置的示例HEVC主10*解码器2202。例如,图22B图示了可解码HEVC主10*译码流的HEVC主10*帧内解码器。如所示,来自HEVC主10*译码器的译码比特流(bitstr)可以被输入到“比特流无格式化器、CABAC解码器和每个TU尺寸的修改的自适应逆扫描”模块,其可以解码开销数据(诸如分区partn、变换xm和量化器qp)和选择的小波滤波器组报头,熵解码变换系数,并且执行变换系数的逆扫描,从而生成已量化变换系数块。可以通过“逆量化器”对已量化变换系数进行逆量化,并且基于控制开销(例如,partn、xmb)可以通过“自适应方形TU(4×4、8×8、16×16、32×32)逆DCT/4×4逆DST”模块进行自适应逆变换以生成解码像素块。通过“方形CU组装成CTU的自适应组装器”可以将解码像素块组装成CTU,并由此组装成完整帧,其可以通过“解块滤波”模块进行解块并且(在编码中丢失的)其边缘可以通过“采样自适应偏移”模块而被改进并提供以用于显示(dec.frame)。
图22C图示了根据本公开的至少一些实现布置的HEVC主10*帧内译码器的示例特征2203的框图。例如,特征2203可以包括无帧内预测,4×4和8×8块对于HL频带使用对角和垂直扫描(无水平扫描),在LH频带中使用对角和水平(无垂直)扫描,并且对于HH频带仅使用对角扫描(无垂直或水平扫描),并且扫描起始位置和方向取决于正被扫描的变换块的频带(在本文中关于图26A-图26L提供细节)。如图22C中所示,HEVC主10*帧内译码器可以被修改为具有用于HL、LH和HH频带的定制译码的以下特征:帧内预测可以被禁用/移除,HL频带中的4×4和8×8变换块使用对角或垂直扫描,HH频带使用对角扫描;用于所有频带的16×16和32×32变换块使用对角扫描,并且基于子带修改的所有变换块系数扫描起始位置和方向(例如,HL频带对角扫描从右上开始并且对角地前进到左下)。
图22D图示了根据本公开的至少一些实现布置的HEVC主10*帧内解码器的示例特征2204的框图。例如,特征2204可以包括无帧内预测,取决于由HEVC主10*译码器所支持的频带的4×4和8×8块扫描,并且对于所有变换块而言开始扫描的位置和方向取决于正被编码的子带。例如,HEVC主10*帧内解码器可以是能够解码由HEVC主10*译码器所生成的比特流的解码器。如图22D中所示,HEVC主10*帧内解码器可以被修改为具有用于HL、LH和HH频带的定制译码的以下特征:帧内预测可以被禁用/移除,HL频带中的4×4和8×8变换块使用对角或垂直逆扫描,在HH频带中使用对角逆扫描;用于所有频带的16×16和32×32变换块使用对角逆扫描,并且基于子带修改的全尺寸变换块系数扫描起始位置和方向(例如,HL频带对角扫描从右上开始并且对角地前进到左下)。
图23是根据本公开的至少一些实现布置的自适应小波修改的HEVC(AWMHVC)编码器2301的框图。例如,图23可以提供使用自适应小波分析/合成滤波的AWMHVC帧内译码器/解码器和HEVC主10/主10* I(或主静止图片/主静止*图片或主4:4:4 16帧内/主4:4:4 16*帧内)图片译码器/解码器。从单个编码比特流中,可以提取2个不同的解码版本,一个较低分辨率和一个全分辨率/较高质量。如所示,在译码侧,输入视频(或图像)YUV帧(帧)可以通过“自适应小波分析滤波”模块使用来自滤波器组的码本中的滤波器组而经历自适应小波分解,其中滤波器的选择基于应用(例如,分辨率、内容和比特率)。使用所选择的滤波器组,对于一级分解,可以执行分析滤波的过程,其可以将帧转换为LL、HL、LH和HH子带,其中每个子带都是四分之一尺寸并且比特深度为9比特(假设8比特输入视频或图像)。LL子带可以通过HEVC主10 I/帧内译码器(例如,HEVC主10 I/主4:2:2 10帧内/主12帧内译码器)进行译码,并且HL、LH和HH子带可以用单独的定制HEVC主10* I/帧内译码器(例如,“HEVC主10* I/主4:2:2 10*帧内/主12*帧内译码器”)进行译码。译码过程的结果可以包括诸如LL比特流,HL比特流,LH比特流和HH比特流之类的四个单独比特流,其可以通过“到分层比特流的复用器”被复用成具有报头的单个可缩放比特流(bitstr),所述报头包含携带选择的小波滤波器组的索引(wfi)的报头。
还在图23中示出的,在解码侧,可以接收比特流(bitstr),从其中从其他数据中的报头中解码选择的小波滤波器组的索引,并且由“到比特流层的解复用器”可以将比特流解复用为单独的LL、HL、LH和HH比特流。解复用的LL比特流可以被提供给HEVC主10 I/帧内解码器(例如,“HEVC主10 I/主4:2:2 10帧内/主12帧内解码器”),并且取决于由开关2311所实现的输出选择,通过“1:2上采样器”在每个维度上进行2倍可选上采样之后的它的低分辨率解码视频(或图像)帧可以被提供以用于显示(dec.frame)。然而,如果用户或系统等请求全分辨率视频(或图像)帧,则其余3个(HL、LH和HH)频带可被提供给对应的定制HEVC主10*I/帧内解码器(例如“HEVC主10* I/主4:2:2 10*帧内/主12*帧内解码器”),并且可以使用(由从比特流中解码的索引所指示的)匹配滤波器组来组合所有四个四分之一尺寸的解码子带。也被称为合成滤波的频带组合过程可以通过“自适应小波合成滤波”模块来执行,并且可以导致全分辨率/尺寸的最终重建视频(或图像)帧以用于显示(dec.frame)。
图24A图示了根据本公开的至少一些实现布置的AWMHVC帧内译码的示例过程2401。如所示,输入视频(或图像)帧(被标记为“帧”)可以(在被标记为“执行自适应小波分析以生成4个子带”的操作处)经历一级自适应小波分析滤波,其允许取决于应用(分辨率、内容和比特率)参数选择最适合的滤波器组。分析滤波过程导致四个子带,其中每个子带是输入帧尺寸的1/4,并且由子带系数(也被称为子带像素或采样)组成,在输入帧的像素为8比特精度时所述子带系数精度为9比特。(在被标记为“子帧贮存器中的1/4尺寸9b LL/HL/LH/HH子带”的操作处)可以将每个生成的子带存储在相应的四分之一尺寸子帧贮存器中并且将其分区为LCU和CU/块。LL子带的块可由HEVC主10 I/帧内译码器(在被标记为“HEVC主10 I/主4:2:2 10帧内/主12帧内译码LL CTU”的操作处)进行编码,并且HL、LH和HH子带的块可以由一个或多个HEVC主10* I/帧内译码器(在被标记为“HEVC主10* I/主4:2:2 10*帧内/主12*帧内译码HL/LH/HH CTU”的操作处)进行编码。来自这些HEVC主10 I/帧内或HEVC主10* I/帧内译码器的单独生成的比特流可以与报头(所述报头包括用信号通知针对分析所使用的小波滤波器组的报头)组合并复用(在被标记为“译码报头、熵译码小波系数数据以及复用以生成帧内可缩放小波译码比特流”的操作处)以生成单个AWMHVC编码比特流(被标记为“比特流”)以用于存储或传送。刚刚描述的译码方法生成可缩放比特流,其中可以独立地解码LL子带比特流或者可以一起解码所有四个子带。
图24B图示了根据本公开的至少一些实现布置的AWMHVC帧内解码的示例过程2402,其逆转由AWMHVC帧内译码执行的过程。如所示,(在被标记为“解复用,解码报头和熵解码来自帧内可缩放小波编码比特流的小波系数数据”的操作处)可以接收AWMHVC帧内比特流(被标记为“比特流”),并且可以解码比特流报头,包括解码关于在译码器处用于分析的小波滤波器组的信息,并且可以将其余比特流解复用成单独的LL、HL、LH和HH比特流的每个。如果用户或系统仅要求低分辨率输出(例如,如在被标记为“小波编码的全分辨率输出
Figure DEST_PATH_IMAGE008AAA
”的判定操作处所确定的输出选择),则(在被标记为“HEVC主10 I/主4:2:2 10帧内/主12帧内解码LL CTU”的操作处)LL子带被进行HEVC主10 I/帧内解码,被进行比特深度限制,并且(在被标记为“在每个维度上被2倍上采样”的操作处)可选地被进行上采样以生成可以被发送以输出的低分辨率上采样视频/图像帧(被标记为“否,小波低分辨率”)。如果基于用户或系统要求确定的输出选择选择全分辨率输出,则(在被标记为“HEVC主10* I/主4:2 :2 10*帧内/主12*帧内解码HL/LH/HH CTU”的操作处)其余子带中的每一个可由HEVC主10* I/帧内解码器解码,并且包括已解码的LL频带,(在被标记为”1/4尺寸9b LL/HL/LH.HH子带重建子帧贮存器”的操作处)全部四个子带可以被存储在子帧贮存器中。使用关于用于小波分析滤波的小波滤波器组的解码报头,可以确定匹配小波合成滤波器组。(在被标记为“执行自适应小波合成以生成重建帧”的操作处)来自子帧贮存器的解码LL、HL、LH和HH子带可以使用这些滤波器经历帧合成以组合解码子带,从而导致可以被输出以进行显示的完全重建视频/图像帧(被标记为“是,小波全分辨率”)。如所讨论的,取决于用户或系统要求(例如解码资源限制等),可从同一比特流解码低分辨率输出或全分辨率输出的这种条件解码可被表征为可缩放解码并且可能是由于可缩放(也称为嵌入)译码而是可能的,所述可缩放译码可能由于小波编码而被执行。关于图24A和图24B讨论的可缩放性可以提供2层:四分之一分辨率层和全分辨率层。
图25A是根据本公开的至少一些实现布置的示例AWMHVC帧内译码器2501的框图。如所示,输入图像(图像)可以通过“颜色空间转换器”从RGB到YUV帧(帧)进行颜色转换(如果输入是YUV视频帧而不是RGB图像,则不需要该步骤)。此外,在不失一般性的情况下,假定YUV帧是4:2:0格式(例如,在水平和垂直方向上,U和V分辨率都是Y的分辨率的一半)。基于“应用、内容、速率和复杂度分析器”对应用参数(例如,图像/帧分辨率、比特率)和内容(例如复杂度)的评估,可以选择小波分解/分析滤波器,可以设置质量和速率目标,可以调节频带的分区,并且可以执行比特率控制。
如所示,YUV帧可以通过“自适应小波分析滤波”模块而经历一级小波分解(使用基于应用/分辨率而选择的小波滤波器对)成为LL、HL、LH和HH子带,并且每个频带的每个LCU(例如CTU)的内容可以在“速率失真优化和比特率控制器”的控制下通过“将小波频带CTU分区成方形CU/PU的自适应分区器”被分区成CU并且进一步分区成PU块。这种处理可导致每个LCU的许多候选分区(partn)。例如,“速率失真优化和比特率控制器”可以提供分区尺寸、预测模式和变换类型的最佳选择。
此外,对于每个LL频带LCU分区,可以通过“DC/平面/33方向预测分析器和生成器(包括本地缓冲器)”使用已解码的相邻CU来生成若干候选帧内(例如,DC、平面和33个方向)预测模式(模式)。对于其他(HL、LH、HH)频带LCU分区,不执行帧内预测。
可以在差分器2511处将LL频带LCU分区PU/块与候选预测分区进行差分以确定候选差异分区块,可以由“自适应方形TU(4×4、8×8、16×16、32×32)DCT/4×4 DST”模块对候选差异分区块进行变换,从而导致候选变换系数块。对于其他频带,不需要预测,并且因此预测分区/块采样被直接变换,从而导致变换系数块。所有变换块系数可以由“量化器”量化并由CABAC熵译码器熵译码。诸如变换系数熵编码比特成本、LCU分区比特成本、预测模式比特成本之类的所有比特成本通过“取决于小波频带的TU的每个TU尺寸的修改的自适应扫描、CABAC译码器和比特流格式化器”来确定。例如,如本文所使用的术语“修改的自适应扫描”可以指这样的事实:在不同的小波频带中,使用扫描的不同方向子集以用于扫描不同尺寸的TU——取决于该频带的属性。总体而言,对于组合(分区尺寸、预测模式、变换类型、变换系数块),不仅可以计算成本,还可以计算重建的分区并且因此也可以计算失真。这些成本和失真在速率失真优化中使用如下。
给定每个LCU的一组候选分区(partn)、候选帧内预测模式(模式)、变换(xm)和潜在量化器值(q),“速率失真优化和比特率控制器”可以通过确定用于编码每个分区的最佳帧内预测模式(模式b)和最佳分区(partnb)以及在可用比特率的约束下允许实现最佳(RD折衷)质量结果的量化器(qp)和所选变换(xmb)、使用(来自由熵译码器提供的比特成本的)比特率和(从原始和重建的子带分区的差异计算出的)失真度量对最佳译码策略做出最佳判定。Partnb模式b、xmb和qp的选择经由比特流(bitstr)发送到解码器。
从邻居形成预测的过程需要重建相邻块,需要在译码器处的解码环路。例如,在译码器处的每个频带的量化系数块可以在“逆量化器”处经历解量化,随后在“自适应方形TU(4×4、8×8、16×16、32×32)逆DCT/4×4逆DST”模块处进行逆变换,从而导致HL、LH和HH频带的重建采样的CU/块以及LL频带的重建采样的过渡TU/块。对于LL频带,可以使用预测模式来获取PU/块以在加法器2512处添加到LL频带过渡重建TU/块以生成最终重建CU。重建的LL频带CU也被保存在本地缓冲器中,并由“DC/平面/33方向预测分析器和生成器(包括本地缓冲器)”使用以用于当前CU预测,其中PU/块形成到差分器2511的一个输入,差分器2511的另一个输入处是正被编码的当前分区/块。而且,由于计算失真的目的,需要对所有频带进行完全重建,因此将重建的LL频带和其他(HL、LH、HH)频带CU进行组装以在“小波频带方形CU组装成CTU的自适应组装器”处于形成LCU,其然后可以在“解块和采样自适应偏移滤波器”模块中经历解块和边缘修复,从而导致重建的LL、HL、LH和HH频带,具有输入到RDO以用于在计算失真中使用的减少的伪像。
图25B是根据本公开的至少一些实现布置的与图25A的译码器相对应的示例AWMHVC帧内解码器2502的框图。除了“自适应小波合成滤波”模块和“颜色空间逆变器”的操作之外,在讨论AWMHVC帧内译码器中的解码环路时讨论了解码器2502的大部分。如所示,译码的AWMHVC比特流(bitstr)可以通过“比特流无格式化器、CABAC解码器和取决于小波频带的TU的每个TU尺寸的修改的自适应逆扫描”模块来解码,导致选定的分区信息(partnb)、选择的帧内预测模式信息(模式b)、选定的变换信息(xmb)、选定的量化器(qp)和已量化TU系数块。如本文所使用的,术语修改的自适应逆扫描是指这样的事实:在不同的小波频带中,扫描的不同方向子集被用于不同尺寸的TU的逆扫描——取决于该频带的属性。如所示,可以通过“逆量化器”使用量化器qp对变换系数块进行解量化,并且通过“自适应方形TU(4×4、8×8、16×16、32×32)逆DCT/4×4逆DST”模块进行逆变换,从而导致HL、LH和HH频带的重建采样以及用于LL频带的过渡采样块的TU。如所讨论的,通过在加法器2512处将通过“DC/平面/33方向预测生成器(包括本地缓冲器)”使用预测模式b信息所生成的预测块添加到已解码的过渡TU,可以生成LL频带的最终CU。每个小波频带的所有CU可以在“将小波频带方形CU组装成CTU的自适应组装器”中被组装成LCU并由此被组装成全频带,其可以在“解块和采样自适应偏移滤波器”模块中经历解块和边缘修复以减少编码伪像并且然后可以被输入到“自适应小波合成滤波”,其使用与小波分析滤波器互补的滤波器(具有关于经由比特流发送的在译码器处使用的滤波器的信息)来执行合成滤波以组合所有4个频带以生成解码的YUV帧(dec.frame)。取决于应用,可以使用该帧,和/或可以通过“颜色空间逆变器”将帧可选地转换为RGB格式图像。
图26A至图26L示出了如何将用于像素域编码的HEVC的各种尺寸块变换块扫描应用于扫描不同小波子带中的各种尺寸变换块。例如,图26A-图26D涉及4×4变换块的扫描,图26E-图26H涉及8×8变换块的扫描,并且26I-图26L涉及扫描16×16和32×32变换块。本文描述了对于每个块尺寸和每个频带使用(哪个或哪些)扫描的细节。
图26A图示了根据本公开的至少一些实现布置的用于LL频带4×4变换系数块的示例扫描图案2601。例如,可以在用于LL频带帧内编码的AWMHVC译解码器中提供水平(左)、对角(中心)和垂直(右)扫描方向。这种扫描选择可以与用于帧内4×4变换块扫描的HEVC中的那些扫描选择相同。例如,HEVC帧内编码标准可以支持3个不同的扫描方向,用于在对像素域中的原始帧进行编码时扫描4×4变换系数块。由于LL频带是类似于原始帧的低通信号,因此可以在AWMHVC译解码器中为LL频带中的4×4变换系数块提供相同的3次扫描。在编码期间,可以选择并在比特流中指示扫描方向之一。在解码期间,逆扫描可通过以相反的方式(例如,使用在比特流中指示的扫描方向-水平、对角或垂直-从块的左上角到右下角)提供系数来从解码比特流中生成变换系数块。
图26B图示了根据本公开的至少一些实现布置的用于HL频带4×4变换系数块的示例扫描图案2602。例如,可以在用于HL频带帧内编码的AWMHVC译解码器中提供对角(左)和垂直(右)扫描方向。此外,对角和垂直扫描可在针对HL频带的块的右上角处开始和左下角处结束。在编码期间,可以选择并在比特流中指示扫描方向之一,并且在解码期间,逆扫描可以通过以相反的方式(例如,使用在比特流中指示的扫描方向-对角或垂直-从块的左下角到右上角)提供系数来从解码比特流中生成变换系数块。
图26C图示了根据本公开的至少一些实现布置的用于LH频带4×4变换系数块的示例扫描图案2603。例如,可以在用于LH频带帧内编码的AWMHVC译解码器中提供水平(左)和对角(右)扫描方向。此外,水平扫描和对角扫描可以在针对LH频带的块的左下角处开始和右上角处结束。在编码期间,可以选择并在比特流中指示扫描方向之一,并且在解码期间,逆扫描可以通过以相反的方式(例如,使用在比特流中指示的扫描方向-垂直或对角-从块的右上角到左下角)提供系数来从解码比特流中生成变换系数块。
图26D图示了根据本公开的至少一些实现布置的用于HH频带4×4变换系数块的示例扫描图案2604。例如,可以在用于HH频带帧内编码的AWMHVC译解码器中提供对角扫描方向。此外,对角扫描可以在针对HH频带的块的左上角处开始和右下角处结束。在解码期间,逆扫描可通过以相反的方式(例如,使用对角扫描方向从块的右下角到左上角)提供系数来从解码的比特流生成变换系数块。
在一个实施例中,如果针对LL频带选择对角扫描图案,则将用于其他频带的扫描图案也被设置为对角扫描图案。在一个实施例中,如果针对HL频带选择垂直扫描图案,则用于LH频带的扫描图案被设置为水平扫描图案。可以将这种技术应用于4×4和/或8×8变换系数块。
图26E图示了根据本公开的至少一些实现布置的用于LL频带8×8变换系数块的示例扫描图案2605。例如,可以在用于LL频带帧内编码的AWMHVC译解码器中提供水平(左)、对角(中心)和垂直(右)扫描方向。这种扫描选择可以与用于帧内8×8变换块扫描的HEVC中的那些扫描选择相同。例如,HEVC帧内编码标准可以支持3个不同的扫描,用于在对像素域中的原始帧进行编码时扫描8×8变换系数块。由于LL频带是类似于原始帧的低通信号,因此可以在AWMHVC译解码器中为LL频带中的8×8变换系数块提供相同的3次扫描。如所示,可以在8×8块内为每个4×4块(对于每个4×4块从右下角到左上角)提供这样的扫描方向,使得4×4块以如下顺序被遍历:右下、左下、右上、左上。在编码期间,可以选择并在比特流中指示扫描方向之一(例如,针对4×4块),并且在解码期间,逆扫描可以通过以相反的方式提供系数来从解码比特流中生成变换系数块。例如,可以不需要在比特流中指示4×4块之中的遍历,并且可以在比特流中指示4×4块内的遍历的扫描方向(例如,使用在比特流中指示的扫描方向-水平、对角或垂直-从块的左下角到右上角)。
图26F图示了根据本公开的至少一些实现布置的用于HL频带8×8变换系数块的示例扫描图案2606。例如,可以在用于HL频带帧内编码的AWMHVC译解码器中提供对角(左)和垂直(右)扫描方向。如所示,可以在8×8块内为每个4×4块(对于每个4×4块从右上角到左下角)提供这样的扫描方向,使得4×4块以如下顺序被遍历:右上、右下、左上、左下。在编码期间,可以选择并在比特流中指示扫描方向之一(例如,针对4×4块),并且在解码期间,逆扫描可以通过以相反的方式提供系数来从解码比特流中生成变换系数块。例如,可以不需要在比特流中指示4×4块之中的遍历,并且可以在比特流中指示4×4块内的遍历的扫描方向(例如,使用在比特流中指示的扫描方向-对角或垂直-从块的左下角到右上角)。
图26G图示了根据本公开的至少一些实现布置的用于LH频带8×8变换系数块的示例扫描图案2607。例如,可以在用于LH频带帧内编码的AWMHVC译解码器中提供水平(左)和对角(右)扫描方向。如所示,可以在8×8块内为每个4×4块(对于每个4×4块从左下角到右上角)提供这样的扫描方向,使得4×4块以如下顺序被遍历:左下、右下、左上、右上。在编码期间,可以选择并在比特流中指示扫描方向之一(例如,针对4×4块),并且在解码期间,逆扫描可以通过以相反的方式提供系数来从解码比特流生成变换系数块。例如,可以不需要在比特流中指示4×4块之中的遍历,并且可以在比特流中指示4×4块内的遍历的扫描方向(例如,使用在比特流中指示的扫描方向-水平或对角-从块的左下角到右上角)。
图26H图示了根据本公开的至少一些实现布置的用于HH频带8×8变换系数块的示例扫描图案2608。例如,可以在用于HH频带帧内编码的AWMHVC译解码器中提供对角扫描方向。如所示,可以在8×8块内为每个4×4块(对于每个4×4块从左上角到右下角)提供这样的扫描方向,使得4×4块以如下顺序被遍历:左上、左下、右上、右下。在解码期间,逆扫描可以通过以相反的方式提供系数来从解码比特流中生成变换系数块。例如,可以不需要在比特流中指示4×4块之中的遍历,也可以不需要在比特流中指示4×4块内的遍历的扫描方向。
图26I图示了根据本公开的至少一些实现布置的用于LL频带16×16变换系数块的示例扫描图案2609。如图26I中所示,在16×16块的4×4块之间的遍历可以是从右下角开始并在左上角结束的对角图案。在一个实施例中,4×4块内的扫描方向也限于从右下角开始并在左上角结束的对角图案。在其他实施例中,还可以提供4×4块内的水平和/或垂直扫描方向(如关于图26A所讨论的)。可以将图示出的用于16×16变换系数块的扫描图案扩展到32×32变换系数块。例如,当编码像素域中可用的原始帧时,HEVC帧内编码标准仅支持用于扫描16×16和32×32变换系数块的单个扫描(对角)方向。由于LL频带是与原始帧非常类似的低通信号,所以在AWMHVC译解码器中也可以为LL频带中的16×16和32×32变换系数块提供相同的扫描图案(对角)。
图26J图示了根据本公开的至少一些实现布置的用于HL频带16×16变换系数块的示例扫描图案2610。如图26J中所示,在16×16块的4×4块之间的遍历可以是从右上角开始并在左下角结束的对角图案。在一个实施例中,4×4块内的扫描方向也限于从右上角开始并在左下角结束的对角图案。在其他实施例中,还可以提供4×4块内的垂直扫描方向(如关于图26B所讨论的)。可以将图示出的用于16×16变换系数块的扫描图案扩展到32×32变换系数块。
图26K图示了根据本公开的至少一些实现布置的用于LH频带16×16变换系数块的示例扫描图案2611。如图26K中所示,在16×16块的4×4块之间的遍历可以是从左下角开始到右上角结束的对角图案。在一个实施例中,4×4块内的扫描方向也限于从左下角开始并在右上角结束的对角图案。在其他实施例中,还可以提供4×4块内的水平扫描方向(如关于图26C所讨论的)。可以将图示出的用于16×16变换系数块的扫描图案扩展到32×32变换系数块。
图26L图示了根据本公开的至少一些实现布置的用于HH频带16×16变换系数块的示例扫描图案2612。如图26L中所示,在16×16块的4×4块之间的遍历可以是从左上角开始到右下角结束的对角图案。4×4块内的扫描方向也可以是从左下角开始并在右上角结束的对角图案。可以将图示出的用于16×16变换系数块的扫描图案扩展到32×32。
例如,如所讨论的,在译码器处,可以对原始图像或帧执行小波分解以生成多个子带,多个子带中的第一子带(例如,LL子带)可以用高效视频编码(HEVC)相符的译码器进行译码以生成第一比特流,多个子带(例如,HL、LH或HH子带)中的第二子带可以被译码,使得译码包括使用基于第二子带的类型的扫描方向来对第二子带的已量化变换系数块进行扫描以生成第二比特流,并且可以将第一比特流和第二比特流进行复用以生成可缩放比特流。在一个实施例中,对第二子带进行译码包括禁用帧内预测。此外,可以为第二子带选择扫描图案(例如,水平、垂直或对角),并且可以在比特流中指示扫描图案。在一个实施例中,第二子带是LH子带,扫描方向是从右上角到左下角,并且扫描图案是对角或垂直。在一个实施例中,第二子带是HL子带,扫描方向是从左下角到右上角,并且扫描图案是对角或水平。在一个实施例中,第二子带是HH子带,扫描方向是从左上角到右下角并且扫描图案是对角。此外,可以将第二子带的变换单元划分成子块,可以为第二子带选择扫描图案,可以通过将扫描图案应用于变换单元的子块来扫描变换单元。
此外,在解码器处,可以对可缩放比特流进行解复用以提供多个比特流——其每一个对应于多个小波子带的一个子带,多个比特流中的第一比特流可以用高效率视频编码(HEVC)相符的解码器进行解码以生成多个小波子带中的第一子带(例如,LL子带),多个比特流中的第二比特流可以被解码,使得解码包括使用基于对应于第二比特流的第二子带的类型的逆扫描方向对第二比特流进行逆扫描以生成第二子带(例如,HL、LH或HH子带),并且可以在第一和第二子带上执行小波合成滤波以生成重建图像。此外,可以基于可缩放比特流中的扫描图案指示符来确定与第二比特流相对应的逆扫描图案(例如,对角、水平或垂直)。在一个实施例中,第二子带是LH子带,逆扫描的方向是从左下角到右上角生成块,并且扫描图案是对角或垂直。在一个实施例中,第二子带是HL子带,逆扫描的方向是从右上角到左下角生成块,并且扫描图案是对角或水平。在一个实施例中,第二子带是HH子带,逆扫描的方向是从右下角到左上角生成块,并且扫描图案是对角。
如所讨论的,基于小波的基于分解的处理可以与使用ISO MPEG AVC或HEVC(或其稍微修改的版本)的基于预测和变换的帧内编码进行组合。现在讨论将基于小波分解的方法与基于VP9、VP10或开放媒体联盟(AOM)预测和变换的帧内编码进行组合。
图27是根据本公开的至少一些实现布置的示例自适应小波VP9(AWVP9)、VP10(AWVP10)或AOM(AW AOM)编码器2701的框图。例如,图27可以提供AWVP9、AWVP10或AWAOM帧内译码器和解码器,其可以使用自适应小波分析/合成滤波和VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I译码器和解码器。如所示,从单个编码比特流中,可以在解码器侧提取2个不同的解码版本:一个较低分辨率和一个全分辨率/较高质量。如所示,在译码侧,输入视频(或图像)YUV帧(帧)可以使用来自滤波器组的码本中的滤波器组而经历自适应小波分解,其中滤波器的选择基于应用(例如,分辨率、内容和比特率等)。使用所选择的滤波器组,对于一级分解,可以执行分析滤波的过程,其可以将帧转换为LL、HL、LH和HH子带,其中每个子带都是四分之一尺寸并且比特深度是9比特(假设8比特输入视频或图像)。LL子带可以由VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I译码器(例如“VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I译码器”)进行译码。此外,HL、LH和HH子带可以用相同的VP9画质2 I/VP9画质3 I/VP 10画质x I/AOM画质x I译码器(例如,“VP9画质2 I/VP9画质3I/VP10画质x I/AOM画质x I 译码器”)进行译码。译码过程的结果包括诸如LL比特流、HL比特流、LH比特流和HH比特流之类的四个单独比特流,其可以通过“到分层比特流的复用器”复用成具有报头的单个可缩放比特流(bitstr),所述报头包括携带所选小波滤波器组的索引(wfi)的报头。
也如图27中所示,在解码侧,可以接收比特流(bitstr),从其中可以解码包括所选小波滤波器组的索引的报头并且可以通过“到比特流层的解复用器”将比特流解复用为单独的LL、HL、LH和HH比特流。可以将解复用的LL比特流提供给VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I解码器(例如“VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I解码器”),并且取决于诸如由开关2711实现的输出选择(例如,其可包括低分辨率选择或全分辨率选择)的用户或系统输入,在由“1:2上采样器”在每个维度上进行2倍上采样之后的低分辨率解码视频(或图像)帧可以被提供以用于显示(dec.frame)。然而,如果用户或系统选择全分辨率视频(或图像)帧以用于呈现,则可以将其余3个(HL、LH和HH)频带提供给一个或多个VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I解码器(例如,“VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I解码器”),并且可以使用(由从比特流解码的索引所指示的)匹配滤波器组对所有四个四分之一尺寸的解码子带进行组合。对频带进行组合的过程可以被表征为合成滤波,并且可以通过“自适应小波合成滤波”模块执行,从而导致用于显示的全分辨率/尺寸最终重建视频(或图像)帧(dec.frame)。
图28是根据本公开的至少一些实现布置的示例自适应小波修改的VP9(AWMVP9)、VP10(AWMVP10)或AOM(AWMAOM)编码器2801的框图。例如,图28可以提供AWMVP9、AWMVP10或AWMAOM帧内译码器和解码器,其可以使用自适应小波分析/合成滤波和VP9画质2 I/VP9画质3 I/VP 10画质x I/AOM画质x I(或其略微修改的版本VP9画质2* I/VP9画质3* I/VP 10画质x* I/AOM画质x*)译码器和解码器。如所示,从单个编码比特流中,可以提取2个不同的解码版本:一个较低分辨率和一个全分辨率/较高质量。如所示,在译码侧,通过“自适应小波分析滤波”模块,输入视频(或图像)YUV帧(帧)可以使用来自滤波器组的码本中的滤波器组而经历自适应小波分解,其中滤波器的选择基于应用(例如,分辨率、内容和比特率等)。使用所选择的滤波器组,对于一级分解,可以执行分析滤波的过程,其可以将帧转换为LL、HL、LH和HH子带,其中每个子带都是四分之一尺寸并且比特深度是9比特(假设8比特输入视频或图像)。LL子带可以由VP9画质2 I/VP9画质3I/VP 10画质x I/AOM画质x I译码器(例如“VP9画质2 I/VP9画质3 I/VP 10画质x I/AOM画质x I译码器”)进行译码,并且HL、LH和HH子带可以用VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I译码器的单独定制的VP9画质2* I/VP9画质3* I/VP 10画质x* I/AOM画质x* I译码器版本(其禁用了帧内预测并且扫描适应于每个子带的方向性)(例如“VP9画质2* I/VP9画质3* I/VP 10画质x* I/AOM画质x* I译码器”)进行译码。译码过程的结果可以包括诸如LL比特流、HL比特流、LH比特流和HH比特流之类的四个单独比特流,其可以通过“到分层比特流的复用器”复用成具有报头的单个可缩放比特流(bitstr),所述报头包括所选小波滤波器组的索引。
也如图28中所示,在解码侧,可以接收比特流(bitstr),从其中可以解码包括所选小波滤波器组的索引的报头并且可以通过“到比特流层的解复用器”将比特流解复用为单独的LL、HL、LH和HH比特流。可以将解复用的LL比特流提供给VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I解码器(例如“VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I解码器”),并且取决于诸如由开关2811实现的输出选择(例如,其可包括低分辨率选择或全分辨率选择)的用户输入或系统选择等,在由“1:2上采样器”在每个维度上进行2倍上采样之后的低分辨率解码视频(或图像)帧可以被提供以用于显示(dec.frame)。如果用户或系统选择全分辨率视频(或图像)帧,则可以将其余3个(HL、LH和HH)频带提供给VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I解码器的对应定制的VP9画质2* I/VP9画质3* I/VP 10画质x* I/AOM画质x* I解码器版本(其禁用了帧内预测并且扫描适应于每个子带的方向性)(例如“VP9画质2* I/VP9画质3* I/VP 10画质x* I/AOM画质x* I解码器”)。可以使用(由从比特流解码的索引所指示的)匹配滤波器组对四个四分之一尺寸的解码子带进行组合。对频带进行组合的过程可以被表征为合成滤波,并且可以通过“自适应小波合成滤波”模块执行,从而导致用于显示的全分辨率/尺寸最终重建视频(或图像)帧(dec.frame)。
例如,在译码器处,可执行图像或帧的小波分解以生成多个子带,多个子带中的每一个可以用VP9相符的译码器、VP10相符的译码器或开放媒体联盟(AOM)相符的译码器进行译码,以生成多个VP9、VP10或AOM相符的比特流——其每一个对应于多个子带的一个子带,并且可以将比特流进行复用以生成可缩放比特流。此外,可以选择小波分析滤波器组以用于执行小波分解。在一个实施例中,图像或帧具有8比特的比特深度,并且每个子带具有9比特的比特深度。在一个实施例中,执行小波分解包括单级小波分析滤波,并且多个子带包括四个子带:LL子带、LH子带、HL子带和HH子带。
此外,在解码器处,可以对可缩放比特流进行解复用,使得可缩放比特流的至少一些部分是VP9相符的、VP10相符的或开放媒体联盟(AOM)相符的,以提供多个比特流——每个比特流对应于多个小波子带的一个子带,可以用VP9相符的解码器、VP10相符的解码器或AOM相符的解码器来解码多个比特流中的至少一个,并且可以基于解码来重建图像或帧。此外,可以确定对应于图像或帧的输出选择,使得输出选择是低分辨率或全分辨率并且对图像或帧进行重建响应于输出选择。如果输出选择是低分辨率,则对图像或帧进行重建可以包括用VP9相符的解码器、VP10相符的解码器或AOM相符的解码器来仅解码LL子带。如果输出选择是全分辨率,则对图像或帧进行重建可以包括用至少VP9相符的解码器、VP10相符的解码器或AOM相符的解码器来解码多个比特流——每个比特流对应于多个小波子带的一个子带,以生成多个已解码子带并且对多个解码子带执行小波合成滤波以生成全分辨率的原始图像或帧。
如所讨论的,本文讨论的技术可以提供可缩放且与AVC视频帧内(或I)编码前向兼容的基于小波的高效图像/视频-帧内编码。例如,当对输入执行1级(固定或自适应)小波分析滤波时,从而导致4个小波频带,并且采用AVC高10帧内译码来对每个频带进行编码,该技术生成单个、高效、可缩放和兼容的比特流。在解码器处,使用AVC高10帧内解码器从该单个比特流中可以解码LL频带,从而导致可以在有上采样或没有上采样至全尺寸的情况下被显示的四分之一分辨率图像/视频帧,和/或可以用AVC高10帧内解码来解码全部3个其余频带(HL、LH和HH)并且其连同已解码的LL频带经由(固定或自适应)合成滤波而被组合成可以随后被显示的全分辨率图像/视频帧。
此外,本文讨论的技术可以提供高度可缩放且与AVC视频帧内(或I)编码前向兼容的基于小波的高效图像/视频-帧内编码。当对输入执行2级(固定或自适应)小波分析滤波时,从而导致7个小波频带,并且可以采用AVC高10帧内译码来对每个频带进行编码以生成单个、高效、高度可缩放和兼容的比特流。在解码器处,使用AVC高10帧内解码器从该单个比特流中可以解码LL2频带,从而导致可以在有或没有上采样的情况下被显示的十六分之一分辨率图像/视频帧,和/或也可以通过AVC高10帧内解码器来解码3个附加频带(HL2、LH2和HH2)并且其连同已解码的LL2频带经由(固定或自适应)合成滤波而被组合成可以在有上采样或没有上采样至全尺寸的情况下被显示的四分之一分辨率图像/视频帧,和/或也可以通过AVC高10帧内解码来解码3个附加频带(HL1、LH1和HH1)并且连同已解码的LL2、HL2、LH2和HH2频带经由(固定或自适应)合成滤波而被组合成可以被显示的全分辨率图像/视频帧。
此外,本文讨论的技术可以提供略微修改的AVC高10帧内译码器/解码器,其被定义为在译码器和解码器处关闭了DC预测的AVC高10帧内译码器/解码器,该译码器和解码器对4×4/8×8块使用修改后的锯齿形扫描,其中扫描起始点以及扫描方向取决于被译码的小波频带类型(HL或LH或HH)。
此外,本文讨论的技术可以提供效率更高且可缩放且与AVC视频帧内(或I)编码部分兼容的高效基于小波的图像/视频帧内编码。当对输入执行1级(固定或自适应)小波分析滤波时,从而导致4个小波频带,并且采用AVC高10帧内编码来编码LL频带并且采用稍微修改的AVC高10(AVC高10*)帧内编码来编码HL、LH和HH频带,则该技术生成单个、高效、可缩放和部分兼容的比特流。在解码器处,使用AVC高10帧内解码器从该单个比特流中,可以解码LL频带,从而导致可以在有上采样或没有上采样至全尺寸的情况下被显示的四分之一分辨率图像/视频帧,和/或可以用AVC高10*帧内解码器来解码全部3个其余频带(HL、LH和HH)并经由(固定或自适应)合成滤波将其与LL频带组合成然后可以被显示的全分辨率图像/视频帧。
此外,本文讨论的技术可以提供编码效率更高且可缩放且还与AVC视频帧内(或I)编码部分兼容的高效的基于小波的图像/视频帧内编码。当对输入执行2级(固定或自适应)小波分析滤波时,从而导致7个小波频带,并且采用AVC高10帧内译码来编码LL频带并且采用AVC高10*帧内译码用于其他6个频带,该技术生成单个、高效、高度可缩放和兼容的比特流。在解码器处,使用AVC高10帧内解码器从该单个比特流中,可以解码LL2频带,从而导致可以在有上采样或没有上采样的情况下被显示的十六分之一分辨率图像/视频帧,和/或可以通过AVC高10*帧内解码器来解码3个附加频带(HL2、LH2和HH2)并且其与已解码的LL2频带经由(固定或自适应)合成滤波而被组合成可以在有上采样或没有上采样至全尺寸的情况下被显示的四分之一分辨率图像/视频帧,和/或也可以通过AVC高10*帧内解码来解码3个附加频带(HL1、LH1和HH1)并且其与已解码的LL2、HL2、LH2和HH2频带经由(固定或自适应)合成滤波而被组合成可以被显示的全分辨率图像/视频帧。
此外,本文讨论的技术可以提供可缩放并且与AVC视频帧内(或I)编码以及AVC空间/SNR可缩放视频帧内(或I)编码前向兼容的基于小波的高效图像/视频-帧内编码。输入图像/视频帧可以首先在每个维度上被2倍下采样,并且用正常AVC主或高帧内译码器进行译码,并且本地解码的图像/视频帧可以按照从输入的1级(固定或自适应)小波分析滤波中获得的LL频带的AVC可缩放高10帧内(或I)译码在可缩放译码中而被使用作为预测。在译码器处,也可以用AVC高10帧内(或I)译码器译码也从相同的1级分析滤波中获得的其余3个频带(HL、LH和HH)。使用AVC主或高帧内解码器、AVC可缩放帧内解码器和AVC高10帧内解码器,在解码器处对应地解码所导致的可缩放且兼容的比特流。在输出处,有三种选择之一或全部三种选择可用,诸如低质量1/4分辨率图像/视频帧,其可以按原样被使用或被上采样以用于显示;全质量1/4分辨率LL频带版本的图像/视频帧,其也可以按原样被使用或被上采样以用于显示;以及3个其余频带(HL、LH和HH),其用AVC高10帧内解码器进行解码,并经由(固定或自适应)合成滤波与全质量LL频带进行组合,从而导致可以随后被显示的全分辨率图像/视频帧。
此外,本文讨论的技术可以提供稍微修改的HEVC主10 I或HEVC主4:2:2帧内或HEVC主12帧内(又名HEVC主10* I或HEVC主4:2:2 10*帧内或HEVC主12帧内*)译码器/解码器,其关闭了DC预测的,包括对4×4块(或TU)进行修改后的锯齿形扫描,其中扫描起始点以及扫描方向取决于小波频带(HL或LH或HH),并且将诸如16×16系数块之类的较大TU划分为4×4子块,对每个4×4子块进行锯齿形扫描,扫描起始点和扫描方向取决于该频带,并且取决于频带类似地也对子块的4×4阵列(即形成16×16块)进行锯齿形扫描。
此外,本文讨论的技术可以提供效率更高且可缩放且与HEVC视频帧内(或I)编码部分兼容的基于小波的高效图像/视频-帧内编码。当执行1级(固定或自适应)小波分析滤波时,从而导致4个小波频带,并且使用HEVC主10 I或HEVC主4:2:2 10帧内或HEVC主12帧内来译码LL频带并且采用HEVC主10* I或HEVC主4:2:2 10*帧内或HEVC主12*帧内译码来编码HL、LH和HH频带,则该技术生成单个高效可缩放且部分兼容的比特流。在解码器处,使用对应的HEVC主10 I或HEVC主4:2:2 10帧内或HEVC主12帧内解码器从该单个比特流,可以解码LL频带,从而导致在有上采样或没有上采样至全尺寸的情况下可以被显示的四分之一分辨率图像/视频帧,和/或可以用HEVC主10* I或HEVC主4:2:2 10*帧内或HEVC主12*帧内解码器来解码其余3个频带(HL、LH和HH)并经由(固定或自适应)合成滤波将其与LL频带进行组合,从而导致然后可以被显示的全分辨率图像/视频帧。
此外,本文讨论的技术可以提供小波和VP9画质2 I/VP 9画质3 I/VP 10画质x I/AOM画质x I译码器/解码器的组合,其可以提供完全兼容的解决方案。此外,本文讨论的技术可以提供小波和VP9画质2 I/VP9画质3 I/VP10画质x I/AOM画质x I(以及稍微修改的VP9画质2* I/VP9画质3* I/VP10画质x* I/AOM画质x* I)译码器/解码器的组合,其可以提供大部分兼容的解决方案。
图29是根据本公开的至少一些实现布置的用于译码和/或解码的示例系统2900的图示图表。如图29中所示,系统2900可以包括中央处理器2901、图形处理器2902、存储器2903、相机2904、显示器2905和发射器/接收器2906。在一些实施例中,系统2900可以不包括相机2904、显示器2905和/或发射器/接收器2906。如所示,中央处理器2901和/或图形处理器2902可以实现译码器2911和/或解码器2912。译码器2911和解码器2912可以包括本文讨论的任何译码器或解码器或其组合。在一些实施例中,系统2900可以不实现译码器2911或解码器2902。在系统2900的示例中,存储器2903可以存储帧数据、图像数据或比特流数据或任何相关数据,例如本文讨论的任何其他数据。
如所示,在一些实施例中,译码器和/或解码器2912可以经由中央处理器2901来实现。在又其他实施例中,译码器和/或解码器2912的一个或多个或部分可以经由图形处理器2902来实现。在其他实施例中,译码器和/或解码器2912可以由图像处理单元、图像处理流水线、视频处理流水线等来实现。在一些实施例中,译码器和/或解码器2912可以以硬件而被实现为片上系统(SoC)。
图形处理器2902可以包括可以提供如本文所讨论的操作的任何数量和类型的图形处理单元。这些操作可以经由软件或硬件或其组合来实现。例如,图形处理器2902可以包括专用于操纵和/或分析从存储器2903获得的图像或帧的电路。中央处理器2901可以包括任何数量和类型的处理单元或模块,其可以为系统2900提供控制和其他高级功能和/或提供如本文所讨论的任何操作。存储器2903可以是诸如易失性存储器(例如静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)等)或非易失性存储器(例如闪存等)等等的任何类型的存储器。在非限制性示例中,存储器2903可以由高速缓存存储器来实现。在一个实施例中,译码器和/或解码器2912的一个或多个或部分可以经由图形处理器2902的执行单元(EU)或另一处理器来实现。例如,EU可以包括诸如一个或多个逻辑核之类的可编程逻辑或电路,其可以提供各种各样的可编程逻辑功能。在一个实施例中,译码器和/或解码器2912的一个或多个或部分可以经由诸如固定功能电路等的专用硬件来实现。固定功能电路可以包括专用逻辑或电路,并且可以提供一组固定功能入口点,其可以映射到用于固定目的或功能的专用逻辑。相机2904可以是可以获得图像或帧数据以供处理(诸如本文所讨论的译码处理)的任何合适的相机或设备。显示器2905可以是可以呈现图像或帧数据(诸如本文所讨论的解码图像或帧)的任何显示器或设备。发射器/接收器2906可以包括可以传送或接收如本文所讨论的比特流数据的任何合适的发射器和/或接收器。
系统2900可以实现如本文所讨论的任何设备、系统、译码器、解码器、模块、单元等。此外,系统2900可以实现如本文所讨论的任何过程、操作等。
本文描述的系统的各种组件可以用软件、固件和/或硬件和/或其任何组合来实现。例如,可以至少部分地通过诸如可以在诸如例如智能电话的计算系统中找到的计算片上系统(SoC)的硬件来提供本文讨论的设备或系统的各种组件。本领域的技术人员可以认识到,本文描述的系统可以包括未在对应的附图中描绘的附加组件。例如,本文讨论的系统可以包括为了清楚起见而未被描绘的附加组件。
虽然本文讨论的示例过程的实现可以包括承担以所图示的顺序示出的所有操作,但是本公开在这方面不受限制,并且在各种示例中,本文的示例过程的实现可以仅包括所示操作的子集、以不同于所图示的顺序执行的操作或附加操作。
另外,可以响应于由一个或多个计算机程序产品提供的指令来承担本文所讨论的任何一个或多个操作。这样的程序产品可以包括提供指令的信号承载介质,所述指令在由例如处理器执行时可以提供本文描述的功能性。计算机程序产品可以以一种或多种机器可读介质的任何形式来提供。因此,例如,包括一个或多个图形处理单元或(一个或多个)处理器核的处理器可以响应于通过一个或多个机器可读介质而传达给处理器的程序代码和/或指令或指令集来承担本文的示例过程的一个或多个框。通常,机器可读介质可以以程序代码和/或指令或指令集的形式传达软件,所述程序代码和/或指令或指令集可以使得本文所描述的任何设备和/或系统实现设备或系统的至少一些部分或者如本文讨论的其他模块或组件。
如本文所描述的任何实现中所使用的,术语“模块”是指软件逻辑、固件逻辑、硬件逻辑和/或电路结构的任何组合,以提供本文描述的功能性。软件可以被体现为软件包、代码和/或指令集或指令,并且本文所描述的任何实现中所使用的“硬件”可以包括——例如单独地或以任何组合的形式——硬连线电路、可编程电路、状态机电路、固定功能电路、执行单元电路和/或存储由可编程电路所执行的指令的固件。这些模块可以共同或单独地被体现为形成较大系统的一部分的电路,例如集成电路(IC)、片上系统(SoC)等等。
图30是根据本公开的至少一些实现布置的示例系统3000的图示图表。在各种实现中,系统3000可以是移动设备系统,尽管系统3000不限于此上下文中。例如,系统3000可以结合到个人计算机(PC)、膝上型计算机、超膝上型计算机、平板、触摸板、便携计算机、手持计算机、掌上计算机、个人数字助理(PDA)、蜂窝电话、组合蜂窝电话/PDA、电视机、智能设备(例如智能电话、智能平板或者智能电视机)、移动因特网设备(MID)、消息传递设备、数据通信设备、相机(例如,傻瓜相机、超级变焦相机、数字单反(DSLR)相机)等等。
在各种实现中,系统3000包括耦合到显示器3020的平台3002。平台3002可以从诸如(一个或多个)内容服务设备3030或(一个或多个)内容递送设备3040之类的内容设备或诸如图像传感器3019之类的其他内容源接收内容。例如,平台3002可以从图像传感器3019或任何其他内容源接收如本文所讨论的图像数据。包括一个或多个导航特征的导航控制器3050可以被用来与例如平台3002和/或显示器3020进行交互。下面更详细地描述这些组件中的每一个。
在各种实现中,平台3002可以包括芯片组3005、处理器3010、存储器3011、天线3013、储存器3014、图形子系统3015、应用3016、图像信号处理器3017和/或无线电3018的任何组合。芯片组3005可以提供在处理器3010、存储器3011、储存器3014、图形子系统3015、应用3016、图像信号处理器3017和/或无线电3018之间的相互通信。例如芯片组3005可以包括能够提供与储存器3014的相互通信的储存适配器(未描绘)。
处理器3010可以被实现为复杂指令集计算机(CISC)或者精简指令集计算机(RISC)处理器、x86指令集兼容处理器、多核或任何其他微处理器或中央处理单元(CPU)。在各种实现中,处理器3010可以是(一个或多个)双核处理器、(一个或多个)双核移动处理器等等。
存储器3011可以被实现为易失性存储器设备,诸如但不限于随机存取存储器(RAM)、动态随机存取存储器(DRAM)或静态RAM(SRAM)。
储存器3014可以被实现为非易失性储存设备,诸如但不限于磁盘驱动器、光盘驱动器、磁带驱动器、帧内储存设备、附接的储存设备、闪存、电池备份的SDRAM(同步DRAM)和/或网络可访问储存设备。在各种实现中,例如,当包括多个硬盘驱动器时,储存器3014可以包括用于增加对有价值的数字媒体的储存性能增强保护的技术。
图像信号处理器3017可以被实现为用于图像处理的专用数字信号处理器等。在一些示例中,可以基于单指令多数据或多指令多数据架构等来实现图像信号处理器3017。在一些示例中,图像信号处理器3017可以被表征为媒体处理器。如本文所讨论的,可以基于片上系统架构和/或基于多核架构来实现图像信号处理器3017。
图形子系统3015可以执行诸如静止或视频之类的图像的处理以用于显示。图形子系统3015例如可以是图形处理单元(GPU)或可视处理单元(VPU)。模拟或数字接口可以用来可通信地耦合图形子系统3015和显示器3020。例如,接口可以是高清多媒体接口、显示端口(DisplayPort)、无线HDMI和/或无线HD相符技术中的任何一种。可以将图形子系统3015集成到处理器3010或芯片组3005中。在一些实现中,图形子系统3015可以是可通信地耦合到芯片组3005的独立设备。
可以在各种硬件架构中实现本文描述的图像和/或视频处理技术。例如,可以将图像和/或视频功能性集成在芯片组内。可替代地,可以使用分离的图形和/或视频处理器。作为又另一实现,图像和/或视频功能可以由包括多核处理器在内的通用处理器来提供。在进一步的实施例中,功能可以在消费电子设备中实现。
无线电3018可以包括能够使用各种合适的无线通信技术来传送和接收信号的一个或多个无线电。这种技术可涉及跨越一个或多个无线网络的通信。示例无线网络包括(但不限于)无线局域网(WLAN)、无线个域网(WPAN)、无线城域网(WMAN)、蜂窝网络和卫星网络。在跨越这样的网络进行通信时,无线电3018可以根据任何版本中的一个或多个适用标准进行操作。
在各种实现中,显示器3020可以包括任何电视类型的监视器或显示器。显示器3020可以包括例如计算机显示屏、触摸屏显示器、视频监视器、类似电视的设备和/或电视机。显示器3020可以是数字和/或模拟的。在各种实现中,显示器3020可以是全息显示器。而且,显示器3020可以是可以接收视觉投影的透明表面。这样的投影可以传达各种形式的信息、图像和/或对象。例如,这样的投影可以是针对移动增强现实(MAR)应用的视觉覆盖。在一个或多个软件应用3016的控制下,平台3002可以在显示器3020上显示用户界面3022。
在各种实现中,(一个或多个)内容服务设备3030可以由任何国家、国际和/或独立的服务进行托管,并且因此例如经由因特网可访问平台3002。(一个或多个)内容服务设备3030可以耦合到平台3002和/或显示器3020。平台3002和/或(一个或多个)内容服务设备3030可以耦合到网络3060以将媒体信息传递(例如,传送和/或接收)往返于网络3060。(一个或多个)内容递送设备3040也可以耦合到平台3002和/或显示器3020。
图像传感器3019可以包括可以基于场景提供图像数据的任何合适的图像传感器。例如,图像传感器3019可以包括基于半导体电荷耦合器件(CCD)的传感器、基于互补金属氧化物半导体(CMOS)的传感器、基于N型金属氧化物半导体(NMOS)的传感器等等。例如,图像传感器3019可以包括可以检测场景的信息以生成图像数据的任何设备。
在各种实现中,(一个或多个)内容服务设备3030可以包括有线电视盒、个人计算机、网络、电话、启用因特网的设备或能够递送数字信息和/或内容的器具以及能够经由网络3060或者直接地在内容提供商与平台3002和/显示器3020之间单向地或双向地传递内容的任何其他类似设备。将意识到,内容可以经由网络3060被单向地和/或双向地传递往返于系统3000中的任何一个组件以及内容提供商。内容的示例可以包括任何媒体信息,包括例如视频、音乐、医疗和游戏信息等等。
(一个或多个)内容服务设备3030可以接收内容,诸如包括媒体信息、数字信息和/或其他内容的有线电视节目。内容提供商的示例可以包括任何有线或卫星电视或无线电或者因特网内容提供商。所提供的示例并不意味着以任何方式来限制按照本公开的实现。
在各种实现中,平台3002可以从具有一个或多个导航特征的导航控制器3050接收控制信号。例如,导航控制器3050的导航特征可以被用来与用户界面3022交互。在各种实施例中,导航控制器3050可以是定点设备,其可以是允许用户将空间(例如,连续和多维)数据输入到计算机中的计算机硬件组件(具体来说是人机界面设备)。许多系统(例如图形用户界面(GUI)、电视机和监视器)允许用户使用物理姿态来控制并且将数据提供给计算机或电视机。
通过显示器上显示的指针、光标、聚焦环或者其他视觉指示符的移动,可在显示器(例如显示器3020)上复制导航控制器3050的导航特征的移动。例如,在软件应用3016的控制下,位于导航控制器3050上的导航特征可映射到例如用户界面3022上显示的虚拟导航特征。在各个实施例中,控制器3050可以不是单独组件,而是可集成到平台3002和/或显示器3020中。但是,本公开并不局限于本文所示或所述的元件或上下文。
在各个实现中,驱动器(未示出)可包括使用户能够例如通过在初始引导之后触摸按钮(在被启用时)来立即接通和关断平台3002例如电视机的技术。程序逻辑可允许平台3002甚至在平台“关断”时也将内容流式传输到媒体适配器或者(一个或多个)其他内容服务设备3030或者(一个或多个)内容递送设备3040。另外,芯片组3005可包括例如对5.1环绕声音频和/或高清晰度7.1环绕声音频的硬件和/或软件支持。驱动器可包括用于集成图形平台的图形驱动器。在各种实施例中,图形驱动器可包括外设组件互连(PCI)Express图形卡。
在各个实现中,可以集成系统3000中所示的组件的任一个或多个。例如,可以集成平台3002和(一个或多个)内容服务设备3030,或者可以集成平台3002和(一个或多个)内容递送设备3040,或者例如可以集成平台3002、(一个或多个)内容服务设备3030和(一个或多个)内容递送设备3040。在各个实施例中,平台3002和显示器3020可以是集成单元。例如,可以集成显示器3020和(一个或多个)内容服务设备3030,或者可以集成显示器3020和(一个或多个)内容递送设备3040。这些示例并不意味着限制本公开。
在各个实施例中,系统3000可以实现为无线系统、有线系统或者两者的组合。当被实现为无线系统时,系统3000可以包括适合于通过无线共享媒体进行通信的组件和接口,诸如一个或多个天线、发射器、接收器、收发器、放大器、滤波器、控制逻辑等。无线共享媒体的示例可以包括无线谱的部分,诸如RF谱等。当被实现为有线系统时,系统3000可以包括适合于通过有线通信媒体进行通信的组件和接口,例如输入/输出(I/O)适配器、将I/O适配器与对应有线通信媒介连接的物理连接器、网络接口卡(NIC)、磁盘控制器、视频控制器、音频控制器等。有线通信媒体的示例可以包括电线、电缆、金属引线、印刷电路板(PCB)、背板、交换结构、半导体材料、双绞线、同轴电缆、光纤等。
平台3002可以建立一个或多个逻辑或物理信道以传递信息。信息可以包括媒体信息和控制信息。媒体信息可以是指表示预计送往用户的内容的任何数据。内容的示例可以包括例如来自语音转换的数据、电视会议、流式传输视频、电子邮件(“email”)消息、语音邮件消息、字母数字符号、图形、图像、视频、文本等。来自语音转换的数据可以是例如话音信息、静寂周期、背景噪声、舒适噪声、音调等。控制信息可以是指表示预计用于自动化系统的命令、指令或控制字的任何数据。例如,控制信息可以用来通过系统路由媒体信息,或者指示节点以预定方式处理媒体信息。但是,实施例并不局限于图30所示或所述的元件或上下文。
如上所述,可以将系统3000体现为变化的物理风格或形状因素。图31图示出了根据本公开的至少一些实现布置的示例小型形状因素设备3100。在一些示例中,系统3000可以经由设备3100来实现。在各种实施例中,例如,设备3100可以被实现为具有无线能力的移动计算设备。例如,移动计算设备可以指任何具有处理系统和诸如一个或多个电池的移动电源或供应的设备。
移动计算设备的示例可包括个人计算机(PC)、膝上型计算机、超膝上型计算机、平板、触摸板、便携计算机、手持计算机、掌上计算机、个人数字助理(PDA)、蜂窝电话、组合蜂窝电话/PDA、智能设备(例如智能电话、智能平板或者智能移动电视机)、移动因特网装置(MID)、消息传递设备、数据通信设备、相机等。
移动计算设备的示例还可包括被布置成供人佩戴的计算机,诸如手腕计算机、手指计算机、指环计算机、眼镜计算机、皮带夹计算机、臂章计算机、靴式计算机、服饰计算机和其他可佩戴计算机。在各个实施例中,例如,移动计算设备可实现为智能电话,其能够运行计算机应用以及进行语音通信和/或数据通信。虽然通过示例可采用实现为智能电话的移动计算设备来描述一些实施例,但是可以意识到,其他实施例也可使用其他无线移动计算设备来实现。实施例并不局限于这个上下文。
如图31中所示,设备3100可以包括具有前部3101和后部3102的外壳。设备3100包括显示器3104、输入/输出(I/O)设备3106和集成天线3108。设备3100还可以包括导航特征3111。I/O设备3106可以包括用于将信息输入到移动计算设备中的任何合适的I/O设备。I/O设备3106的示例可以包括字母数字键盘、数字小键盘、触摸板、输入键、按钮、开关、麦克风、扬声器、语音识别设备和软件等等。信息也可以通过麦克风(未示出)被输入到设备3100中,或者可以由语音识别设备数字化。如所示,设备3100可以包括被集成到设备3100的后部3102(或其他地方)中的闪光灯3110以及相机3105(例如,包括镜头、光圈和成像传感器)。在其他示例中,可以将相机3105和/或闪光灯3110集成到设备3100的前部3101和/或可以提供附加相机(例如,使得设备3100具有前部相机和背部相机)。
各个实施例可使用硬件元件、软件元件或者两者的组合来实现。硬件元件的示例可包括处理器、微处理器、电路、电路元件(例如晶体管、电阻器、电容器、电感器等)、集成电路、专用集成电路(ASIC)、可编程逻辑器件(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体器件、芯片、微芯片、芯片组等。软件的示例可包括软件组分、程序、应用、计算机程序、应用程序、系统程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、功能、方法、规程、软件接口、应用程序接口(API)、指令集、计算代码、计算机代码、代码段、计算机代码段、字、值、符号或者它们的任何组合。确定实施例是否使用硬件元件和/或软件元件来实现可按照任何数量的因素而改变,例如预期计算速率、功率级、耐热性、处理周期预算、输入数据速率、输出数据速率、存储器资源、数据总线速度以及其他设计和性能限制。
至少一个实施例的一个或多个方面可通过机器可读媒介上存储的、表示处理器内的各种逻辑的代表指令来实现,其在由机器读取时使机器制作执行本文所述技术的逻辑。称作“IP核”的这类表示可存储在有形机器可读媒介上,并且供应给各种客户或制造设施,以加载到实际制作逻辑或处理器的制造机器中。
虽然参照各个实现描述了本文所提出的某些特征,但是本描述不意图理解为限制性意义的。因此,对本公开属于的领域的技术人员显然的是,本文所述实现的各种修改的各种修改以及其他实现被认为落入本公开的精神和范围之内。
以下示例涉及进一步的实施例。
在一个或多个第一实施例中,用于图像或视频编码的计算机实现的方法包括执行图像或帧的小波分解以生成多个子带,利用高级视频编码(AVC)相符的译码器对所述多个子带中的每一个进行译码以生成多个AVC相符的比特流,每个AVC相符的比特流对应于所述多个子带的一个子带,并且将所述多个子带进行复用以生成可缩放比特流。
进一步对于第一实施例,该方法进一步包括选择用于执行所述小波分解的小波分析滤波器组。
进一步对于第一实施例,所述图像或帧具有8比特的比特深度,并且每个子带具有9比特的比特深度。
进一步对于第一实施例,所述AVC相符的译码器包括10比特帧内画质译码器。
进一步对于第一实施例,执行所述小波分解包括单级小波分析滤波并且所述多个子带包括四个子带。
进一步对于第一实施例,执行所述小波分解包括单级小波分析滤波,并且所述多个子带包括四个子带,并且所述多个子带包括LL子带、LH子带、HL子带和HH子带。
进一步对于第一实施例,执行所述小波分解包括多级小波分析滤波。
进一步对于第一实施例,执行所述小波分解包括多级小波分析滤波,并且所述多个子带包括七个子带。
在一个或多个第二实施例中,用于图像或视频编码的系统包括:用于存储图像或帧的存储器和耦合到所述存储器的处理器,所述处理器执行所述图像或帧的小波分解以生成多个子带,利用高级视频编码(AVC)相符的译码器对所述多个子带中的每一个进行译码以生成多个AVC相符的比特流,每个AVC相符的比特流对应于所述多个子带的一个子带,并且对所述多个子带进行复用以生成可缩放比特流。
进一步对于第二实施例,所述处理器进一步用于选择用于执行所述小波分解的小波分析滤波器组。
进一步对于第二实施例,用于执行小波分解的所述处理器包括用于执行单级小波分析滤波的所述处理器,并且多个子带包括四个子带。
进一步对于第二实施例,用于执行小波分解的所述处理器包括用于执行单级小波分析滤波的所述处理器,并且所述多个子带包括四个子带,并且所述多个子带包括LL子带、LH子带、HL子带和HH子带。
进一步对于第二实施例,用于执行小波分解的所述处理器包括用于执行多级小波分析滤波的所述处理器。
在一个或多个第三实施例中,用于图像或视频解码的计算机实现的方法包括对可缩放比特流进行解复用以提供多个比特流,其中所述可缩放比特流的至少一些部分是高级视频编码(AVC)相符的,所述多个比特流的每一个对应于多个小波子带的一个子带,利用AVC相符的解码器解码所述多个比特流中的至少一个,以及基于所述解码重建图像或帧。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于输出选择并且所述输出选择包括低分辨率并且重建所述图像或帧包括利用所述AVC相符的解码器仅解码LL子带。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于输出选择并且所述输出选择包括低分辨率并且重建所述图像或帧包括利用所述AVC相符的解码器仅解码LL子带并且重建所述图像或帧进一步包括应用比特深度限制器或者执行上采样中的至少一个。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于输出选择并且所述输出选择包括全分辨率并且重建所述图像或帧包括利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带并且对所述多个解码子带执行小波合成滤波以生成全分辨率的图像或帧。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于输出选择。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括低分辨率并且重建所述图像或帧包括利用AVC相符的解码器来仅解码LL2子带。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括低分辨率并且重建所述图像或帧包括利用AVC相符的解码器来仅解码LL2子带并且重建所述图像或帧进一步包括应用比特深度限制器并且执行1:4上采样。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括中分辨率,并且重建所述图像或帧包括利用至少所述AVC相符的解码器来解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带,其中所述多个比特流包括所述多个比特流的子集,并且对所述多个解码子带执行单级小波合成滤波以生成图像或帧。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括中分辨率,并且重建所述图像或帧包括利用至少所述AVC相符的解码器来解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带,其中所述多个比特流包括所述多个比特流的子集,并且对所述多个解码的子带执行单级小波合成滤波以生成图像或帧并且重建所述图像或帧还包括应用比特深度限制器并且执行1:2上采样。
进一步对于第三实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括全分辨率并且重建所述图像或帧包括利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带,其中所述多个比特流包括所有所述多个比特流,并对所述多个解码子带执行多级小波合成滤波以生成全分辨率的图像或帧。
在一个或多个第四实施例中,用于图像或视频解码的系统包括:用于存储可缩放比特流的存储器,其中所述可缩放比特流的至少一些部分是高级视频编码(AVC)相符的,以及耦合到所述存储器的处理器,所述处理器用于对所述可缩放比特流进行解复用以提供多个比特流,所述多个比特流的每一个对应于多个小波子带的一个子带,利用AVC相符的解码器解码所述多个比特流中的至少一个,并且基于所述解码重建图像或帧。
进一步对于第四实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
进一步对于第四实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括低分辨率,并且用于重建图像或帧的所述处理器包括用于利用AVC相符的解码器来仅解码LL子带的处理器。
进一步对于第四实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括全分辨率,并且用于重建图像或帧的所述处理器包括用于利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带并用于对所述多个解码子带执行小波合成滤波以生成全分辨率的图像或帧的处理器。
进一步对于第四实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
进一步对于第四实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括低分辨率,并且用于重建所述图像或帧的所述处理器包括用于利用AVC相符的解码器来仅解码LL2子带的处理器。
进一步对于第四实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括中分辨率,并且用于重建所述图像或帧的所述处理器包括处理器,所述处理器用于利用至少所述AVC相符的解码器来解码每个对应于多个小波子带的一个子带的多个比特流以生成多个解码子带,其中所述多个比特流包括所述多个比特流的子集,并且用于对所述多个解码子带执行单级小波合成滤波以生成图像或帧。
进一步对于第四实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括全分辨率,并且用于重建所述图像或帧的所述处理器包括处理器,所述处理器用于利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带,其中所述多个比特流包括所有所述多个比特流,并且用于对所述多个解码子带执行多级小波合成滤波以生成全分辨率的图像或帧。
在一个或多个第五实施例中,用于图像或视频编码的计算机实现的方法包括:对原始图像或帧执行小波分解以生成多个小波子带;接收用于编码的所述原始图像或帧的非LL小波子带,将接收到的小波子带分区成多个变换分区;对所述多个变换分区中的至少第一变换分区执行变换以生成块变换系数;量化所述块变换系数;扫描所述第一变换分区的所述已量化变换系数块,其中扫描的方向基于接收到的小波子带的类型,并且利用高级视频编码(AVC)相符的熵译码器将已扫描已量化变换系数进行熵编码为比特流。
进一步对于第五实施例,接收到的小波子带的类型和扫描已量化变换系数块的方向包括以下中的至少一个:LH子带和从右上角到左下角、HL子带和从左下角到右上角、或HH子带和从左上角到右下角。
进一步对于第五实施例,分区和变换是高级视频编码(AVC)相符的。
进一步对于第五实施例,该方法进一步包括利用AVC相符的译码器将所述多个子带中的第二子带译码成第二比特流,并且至少复用所述比特流和所述第二比特流以生成可缩放比特流,其中至少一部分可缩放比特流是AVC相符的。
进一步对于第五实施例,该方法进一步包括利用AVC相符的译码器将所述多个子带中的第二子带译码成第二比特流,并且至少复用所述比特流和所述第二比特流以生成可缩放比特流,其中至少一部分可缩放比特流是AVC相符的并且使用基于第三和第四子带的类型的扫描方向来译码所述多个子带的第三和第四子带,其中所述多个子带包括四个子带。
进一步对于第五实施例,所述第二子带包括LL子带,并且接收到的小波子带包括LH、HL或HH子带中的至少一个。
进一步对于第五实施例,所述多个子带包括七个子带,并且该方法进一步包括使用基于第三至第七子带的类型的扫描方向来译码所述多个子带的所述第三至第七子带。
进一步对于第五实施例,所述多个子带包括七个子带,并且该方法进一步包括使用基于第三至第七子带的类型的扫描方向来译码所述多个子带的所述第三至第七子带,并且所述第二子带包括LL2子带,并且所述小波子带包括HH1、LH1、HL1、HH2、LH2或HL2子带中的至少一个。
在一个或多个第六实施例中,用于图像或视频编码的系统包括存储原始图像或帧的存储器和耦合到所述存储器的处理器,所述处理器用于对所述原始图像或帧执行小波分解以生成多个小波子带;接收用于编码的所述原始图像或帧的非LL小波子带,将接收到的小波子带分区成多个变换分区;对所述多个变换分区中的至少第一变换分区执行变换以生成块变换系数;量化所述块变换系数;扫描所述第一变换分区的所述已量化变换系数块,其中扫描的方向基于接收到的小波子带的类型,并且利用高级视频编码(AVC)相符的熵译码器将已扫描已量化变换系数进行熵编码为比特流。
进一步对于第六实施例,接收到的小波子带的类型和扫描扫描已量化变换系数块的方向包括以下中的至少一个:LH子带和从右上角到左下角、HL子带和从左下角到右上角、或HH子带和从左上角到右下角。
进一步对于第六实施例,所述处理器进一步利用AVC相符的译码器将所述多个子带中的第二子带译码成第二比特流,并且至少复用所述比特流和所述第二比特流以生成可缩放比特流,其中至少一部分可缩放比特流是AVC相符的。
进一步对于第六实施例,所述处理器进一步利用AVC相符的译码器将所述多个子带中的第二子带译码成第二比特流,并且至少复用所述比特流和所述第二比特流以生成可缩放比特流,其中至少一部分可缩放比特流是AVC相符的,并且所述第二子带包括LL子带,并且接收到的小波子带包括LH、HL或HH子带中的至少一个。
进一步对于第六实施例,所述多个子带包括七个子带,并且该处理器进一步包括使用基于第三至第七子带的类型的扫描方向来译码所述多个子带的所述第三至第七子带。
在一个或多个第七实施例中,用于图像或视频解码的计算机实现的方法包括:对可缩放比特流进行解复用以提供多个比特流,每个比特流对应于多个小波子带的一个子带,经由高级视频编码(AVC)相符的解码器熵解码与多个小波子带中的第一子带相对应的比特流,对解码比特流进行逆扫描以生成解码变换系数,其中所述逆扫描的扫描方向基于所述第一子带的类型,并且至少部分地基于所述解码变换系数来执行逆量化、逆变换和块组装,以生成重建小波子带块。
进一步对于第七实施例,所述小波子带的类型和扫描方向包括以下中的至少一个:LH子带和从左下角到右上角生成块、HL子带和从右上角到左下角生成块、或HH子带和从右下角到左上角生成块。
进一步对于第七实施例,所述解码、逆量化、逆变换和块组装是AVC相符的。
进一步对于第七实施例,该方法进一步包括利用AVC相符的解码器对所述多个比特流中的第二比特流进行解码以生成所述多个子带中的第二子带,并且基于所述第二子带和所述重建小波子带块来重建图像或帧。
进一步对于第七实施例,基于所述第二子带和所述重建小波子带块来重建图像或帧,并且使用基于所述第三和第四子带的类型的逆扫描方向来解码与所述多个子带的第三和第四子带相对应的第三和第四比特流,其中所述多个子带包括四个子带。
进一步对于第七实施例,该方法进一步包括利用AVC相符的解码器对所述多个比特流中的第二比特流进行解码以生成所述多个子带中的第二子带,并且基于所述第二子带和所述重建小波子带块来重建图像或帧,并且所述第二子带包括LL子带,并且所述小波子带包括LH、HL或HH子带中的至少一个。
进一步对于第七实施例,该方法进一步包括利用AVC相符的解码器对所述多个比特流中的第二比特流进行解码以生成所述多个子带中的第二子带,并且基于所述第二子带和所述重建小波子带块来重建图像或帧,并且使用基于第三至第七子带的类型的逆扫描方向来对与所述多个子带中的所述第三至第七子带相对应的第三至第七比特流进行解码,其中所述多个子带包括七个子带。
进一步对于第七实施例,该方法进一步包括利用AVC相符的解码器对所述多个比特流中的第二比特流进行解码以生成所述多个子带中的第二子带,并且基于所述第二子带和所述重建小波子带块来重建图像或帧,并且使用基于第三至第七子带的类型的逆扫描方向来对与所述多个子带中的所述第三至第七子带相对应的第三至第七比特流进行解码,其中,所述多个子带包括七个子带,并且所述第二子带包括LL2子带,以及小波子带包括HH1、LH1、HL1、HH2、LH2或HL2子带中的至少一个。
在一个或多个第八实施例中,用于图像或视频解码的系统包括存储可缩放比特流的存储器和耦合到所述存储器的处理器,所述处理器对可缩放比特流进行解复用以提供多个比特流,每个比特流对应于多个小波子带的一个子带,经由高级视频编码(AVC)相符的解码器熵解码与多个小波子带中的第一子带相对应的比特流,对解码比特流进行逆扫描以生成解码变换系数,其中所述逆扫描的扫描方向基于所述第一子带的类型,并且至少部分地基于所述解码变换系数来执行逆量化、逆变换和块组装,以生成重建小波子带块。
进一步对于第八实施例,小波子带的类型和扫描的方向包括以下中的至少一个:LH子带和从左下角到右上角生成块、HL子带和从右上角到左下角生成块、或HH子带和从右下角到左上角生成块。
进一步对于第八实施例,所述处理器进一步用于利用AVC相符的解码器对所述多个比特流中的第二比特流进行解码以生成所述多个子带中的第二子带,并且基于所述第二子带和所述重建小波子带块来重建图像或帧。
进一步对于第八实施例,所述处理器进一步用于利用AVC相符的解码器对所述多个比特流中的第二比特流进行解码以生成所述多个子带中的第二子带,并且基于所述第二子带和所述重建小波子带块来重建图像或帧,并且所述多个子带包括七个子带,并且所述处理器进一步用于使用基于第三至第七子带的类型的逆向扫描方向来解码与所述多个子带中的所述第三至第七子带相对应的第三至第七比特流。
在一个或多个第九实施例中,用于图像或视频编码的计算机实现的方法包括对原始图像或帧执行小波分解以生成多个子带,对所述原始图像或帧进行下采样以生成下采样图像,利用高级视频编码(AVC)相符的译码器对所述下采样图像进行译码以提供层间预测,使用AVC相符的可缩放译码器基于所述层间预测对所述多个子带中的至少一个子带进行译码以生成对应于所述子带的比特流,对所述多个子带的其余子带进行译码以生成一个或多个第二比特流,并且至少复用对应于所述子带的比特流和所述第二比特流以生成可缩放比特流。
进一步对于第九实施例,对所述其余子带进行译码包括AVC相符的译码,并且所述可缩放比特流是AVC相符的。
进一步对于第九实施例,对所述其余子带进行编码包括使用基于其余子带的类型的扫描方向对所述其余子带的所述已量化变换系数块进行译码。
进一步对于第九实施例,所述下采样包括在水平和垂直维度上的两倍下采样。
在一个或多个第十实施例中,用于图像或视频编码的系统包括存储原始图像或帧的存储器和耦合到所述存储器的处理器,所述处理器用于对原始图像或帧执行小波分解以生成多个子带,对所述原始图像或帧进行下采样以生成下采样图像,利用高级视频编码(AVC)相符的译码器对所述下采样图像进行编码以提供层间预测,使用AVC相符的可缩放译码器基于所述层间预测对所述多个子带中的至少一个子带进行译码以生成对应于所述子带的比特流,对所述多个子带的其余子带进行译码以生成一个或多个第二比特流,并且至少复用对应于所述子带的比特流和所述第二比特流以生成可缩放比特流。
进一步对于第十实施例,用于对所述其余子带进行译码的所述处理器包括用于执行AVC相符的译码的处理器,并且所述可缩放比特流是AVC相符的。
进一步对于第十实施例,用于对所述其余子带进行译码的所述处理器包括用于使用基于其余子带的类型的扫描方向对所述其余子带的所述已量化变换系数块进行译码的处理器。
在一个或多个第十一实施例中,用于图像或视频编码的计算机实现的方法包括:对可缩放比特流进行解复用以提供每个对应于多个小波子带的一个子带的多个比特流和对应于下采样图像的第二比特流,利用高级视频编码(AVC)相符的解码器对所述第二比特流进行解码以生成所述下采样图像,对所述下采样图像进行上采样,基于使用所述上采样图像的层间预测并且使用AVC相符的可缩放解码器对所述多个比特流中的第一比特流进行解码,以生成所述多个小波子带中的第一子带,对所述多个比特流中的其余比特流进行解码以生成所述多个小波子带中的其余子带,以及基于所述解码来重建图像或帧。
进一步对于第十一实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
进一步对于第十一实施例,确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括低分辨率,并且所述重建的图像或帧包括所述下采样图像。
进一步对于第十一实施例,确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括中分辨率,并且所述重建的图像或帧包括所述第一子带。
进一步对于第十一实施例,确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且输出选择包括中分辨率,并且所述重建的图像或帧包括所述第一子带,并且重建所述图像或帧包括对所述第一子带进行比特深度限制或对所述第一子带进行上采样中的至少一个。
进一步对于第十一实施例,确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且输出选择包括全分辨率,并且重建所述图像或帧包括对所述第一子带和所述其余子带执行小波重组以生成全分辨率的所述重建的图像或帧。
在一个或多个第十二实施例中,用于图像或视频解码的系统包括用于存储可缩放比特流的存储器和与所述存储器耦合的处理器,所述处理器用于对所述可缩放比特流进行解复用以提供每个对应于多个小波子带的一个子带的多个比特流和对应于下采样图像的第二比特流,利用高级视频编码(AVC)相符的解码器对所述第二比特流进行解码以生成所述下采样图像,对所述下采样图像进行上采样,基于使用所述上采样图像的层间预测并且使用AVC相符的可缩放解码器对所述多个比特流中的第一比特流进行解码,以生成所述多个小波子带中的第一子带,对所述多个比特流中的其余比特流进行解码以生成所述多个小波子带中的其余子带,以及基于所述解码来重建图像或帧。
进一步对于第十二实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
进一步对于第十二实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括低分辨率,并且所述重建的图像或帧包括所述下采样图像。
进一步对于第十二实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括中分辨率,并且所述重建的图像或帧包括所述第一子带。
进一步对于第十二实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括全分辨率,并且用于重建所述图像或帧的所述处理器包括用于对所述第一子带和所述其余子带执行小波重组以生成全分辨率的所述重建的图像或帧的处理器。
在一个或多个第十三实施例中,一种用于图像或视频编码的计算机实现的方法包括:对原始图像或帧执行小波分解以生成多个子带;利用高效视频编码(HEVC)相符的译码器译码所述多个子带中的第一子带以生成第一比特流;对所述多个子带中的第二子带进行编码包括:使用基于所述第二子带的类型的扫描方向扫描所述第二子带的已量化变换系数块以生成第二比特流;以及至少复用所述第一和第二比特流以生成可缩放比特流。
进一步对于第十三实施例,对所述第二子带进行译码包括禁用帧内预测。
进一步对于第十三实施例,所述第一子带包括LL子带,并且所述第二子带包括LH、HL或HH子带中的至少一个。
进一步对于第十三实施例,该方法进一步包括选择用于所述第二子带的扫描图案。
进一步对于第十三实施例,该方法进一步包括选择用于所述第二子带的扫描图案,并且所述第二子带包括LH子带,所述扫描方向包括从右上角到左下角,并且所述扫描图案包括对角或垂直中的至少一个。
进一步对于第十三实施例,该方法进一步包括选择用于所述第二子带的扫描图案,并且所述第二子带包括HL子带,所述扫描方向包括从左下角到右上角,并且所述扫描图案包括对角或水平中的至少一个。
进一步对于第十三实施例,该方法进一步包括选择用于所述第二子带的扫描图案,并且所述第二子带包括HH子带,所述扫描方向包括从左上角到右下角并且扫描图案包括对角。
进一步对于第十三实施例,该方法进一步包括将所述第二子带的变换单元划分为子块,为所述第二子带选择扫描图案,并且通过将所述扫描图案应用于所述变换单元的子块来扫描所述变换单元。
在一个或多个第十四实施例中,用于图像或视频编码的系统包括存储原始图像或帧的存储器和耦合到所述存储器的处理器,所述处理器用于对所述原始图像或帧执行小波分解以生成多个子带;利用高效视频编码(HEVC)相符的译码器译码所述多个子带中的第一子带以生成第一比特流;对所述多个子带中的第二子带进行编码包括:使用基于所述第二子带的类型的扫描方向扫描所述第二子带的已量化变换系数块以生成第二比特流;以及至少复用所述第一和第二比特流以生成可缩放比特流。
进一步对于第十四实施例,所述处理器进一步用于选择用于所述第二子带的扫描图案。
进一步对于第十四实施例,所述处理器进一步用于选择用于所述第二子带的扫描图案,并且所述第二子带包括LH子带,扫描方向包括从右上角到左下角,并且所述扫描图案包括对角或垂直中的至少一个。
进一步对于第十四实施例,所述处理器进一步用于选择用于所述第二子带的扫描图案,并且所述第二子带包括HL子带,扫描方向包括从左下角到右上角,并且所述扫描图案包括对角或水平中的至少一个。
进一步对于第十四实施例,所述处理器进一步用于选择用于所述第二子带的扫描图案,并且所述第二子带包括HH子带,扫描方向包括从左上角到右下角并且所述扫描图案包括对角。
进一步对于第十四实施例,所述处理器进一步用于将第二子带的变换单元划分为子块,选择用于所述第二子带的扫描图案,并且通过将所述扫描图案应用于所述变换单元的子块来扫描所述变换单元。
在一个或多个第十五实施例中,用于图像或视频解码的计算机实现的方法包括:对可缩放比特流进行解复用以提供多个比特流,每个比特流对应于多个小波子带的一个子带;利用高效视频编码(HEVC)相符的解码器解码所述多个比特流中的第一比特流以生成所述多个小波子带中的第一子带,解码所述多个比特流中的第二比特流,包括:使用基于对应于所述第二比特流的第二子带的类型的逆扫描方向对所述第二比特流进行逆扫描以生成所述第二子带,并且至少对所述第一和第二子带执行小波合成滤波以生成重建图像。
进一步对于第十五实施例,所述第一子带包括LL子带,并且所述第二子带包括LH、HL或HH子带中的至少一个。
进一步对于第十五实施例,该方法进一步包括基于所述可缩放比特流中的扫描图案指示符来确定与所述第二比特流相对应的逆扫描图案。
进一步对于第十五实施例,该方法进一步包括基于所述可缩放比特流中的扫描图案指示符来确定与所述第二比特流相对应的逆扫描图案,并且所述扫描图案包括对角、水平或垂直中的至少一个。
进一步对于第十五实施例,该方法进一步包括基于所述可缩放比特流中的扫描图案指示符来确定与所述第二比特流相对应的逆扫描图案,并且所述第二子带包括LH子带,所述逆扫描方向包括从左下角到右上角生成块,并且所述扫描图案包括对角或垂直中的至少一个。
进一步对于第十五实施例,该方法进一步包括基于所述可缩放比特流中的扫描图案指示符来确定与所述第二比特流相对应的逆扫描图案,并且所述第二子带包括HL子带,所述逆扫描方向包括从右上角到左下角生成块,并且所述扫描图案包括对角或水平中的至少一个。
进一步对于第十五实施例,该方法进一步包括基于所述可缩放比特流中的扫描图案指示符来确定与所述第二比特流相对应的逆扫描图案,并且所述第二子带包括HH子带,所述逆扫描方向包括从右下角到左上角生成块,并且所述扫描图案包括对角。
在一个或多个第十六实施例中,用于图像或视频解码的系统包括用于存储可缩放比特流的存储器和与所述存储器耦合的处理器,所述处理器用于对所述可缩放比特流进行解复用以提供多个比特流,每个比特流对应于多个小波子带的一个子带;利用高效视频编码(HEVC)相符的解码器解码所述多个比特流中的第一比特流以生成所述多个小波子带中的第一子带,解码所述多个比特流中的第二比特流,包括:使用基于对应于所述第二比特流的第二子带的类型的逆扫描方向对所述第二比特流进行逆扫描以生成所述第二子带,并且至少对所述第一和第二子带执行小波合成滤波以生成重建图像。
进一步对于第十六实施例,所述处理器进一步用于基于所述可缩放比特流中的扫描图案指示符来确定与所述第二比特流相对应的逆扫描图案。
进一步对于第十六实施例,所述处理器进一步用于基于所述可缩放比特流中的扫描图案指示符来确定与所述第二比特流相对应的逆扫描图案,并且所述第二子带包括LH子带,所述逆扫描方向包括从左下角到右上角生成块并且所述扫描图案包括对角或垂直中的至少一个。
进一步对于第十六实施例,所述处理器进一步用于基于所述可缩放比特流中的扫描图案指示符来确定与所述第二比特流相对应的逆扫描图案,并且所述第二子带包括HL子带,所述逆扫描方向包括从右上角到左下角并且所述扫描图案包括对角或水平中的至少一个。
进一步对于第十六实施例,所述处理器进一步用于基于所述可缩放比特流中的扫描图案指示符来确定与所述第二比特流相对应的逆扫描图案,并且所述第二子带包括HH子带,所述逆扫描方向包括从右下角到左上角生成块并且所述扫描图案包括对角。
在一个或多个第十七实施例中,用于图像或视频编码的计算机实现的方法包括执行图像或帧的小波分解以生成多个子带,利用VP9相符的译码器、VP10相符的译码器或开放媒体联盟(AOM)相符的译码器对所述多个子带中的每一个进行译码,以生成每个对应于所述多个子带的一个子带的多个VP9、VP10或AOM相符比特流,并且复用所述多个比特流以生成可缩放比特流。
进一步对于第十七实施例,该方法进一步包括选择用于执行所述小波分解的小波分析滤波器组。
进一步对于第十七实施例,所述图像或帧具有8比特的比特深度,并且每个子带具有9比特的比特深度。
进一步对于第十七实施例,执行所述小波分解包括单级小波分析滤波并且所述多个子带包括四个子带。
进一步对于第十七实施例,执行所述小波分解包括单级小波分析滤波,并且所述多个子带包括四个子带,并且所述多个子带包括LL子带、LH子带、HL子带和HH子带。
在一个或多个第十八实施例中,用于图像或视频编码的系统包括存储图像或帧的存储器和耦合到所述存储器的处理器,所述处理器用于执行所述图像或帧的小波分解以生成多个子带,利用VP9相符的译码器、VP10相符的译码器或开放媒体联盟(AOM)相符的译码器对所述多个子带中的每一个进行译码,以生成每个对应于所述多个子带的一个子带的多个VP9、VP10或AOM相符比特流,并且复用所述多个比特流以生成可缩放比特流。
进一步对于第十八实施例,所述处理器进一步用于选择用于执行所述小波分解的小波分析滤波器组。
进一步对于第十八实施例,用于执行小波分解的所述处理器包括用于执行单级小波分析滤波的处理器,并且所述多个子带包括四个子带。
进一步对于第十八实施例,用于执行小波分解的所述处理器包括用于执行单级小波分析滤波的处理器,并且所述多个子带包括四个子带,并且所述多个子带包括LL子带、LH子带、HL子带和HH子带。
在一个或多个第十九实施例中,用于图像或视频解码的计算机实现的方法包括:对可缩放比特流进行解复用以提供多个比特流,其中所述可缩放比特流的至少一些部分是VP9相符的、VP10相符的或开放媒体联盟(AOM)相符的,每个比特流对应于多个小波子带的子带;利用VP9相符的解码器、VP10相符的解码器或AOM相符的解码器解码所述多个比特流中的至少一个;以及基于所述解码重建图像或帧。
进一步对于第十九实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
进一步对于第十九实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括低分辨率,并且重建所述图像或帧包括利用所述VP9相符的解码器、所述VP10相符的解码器或所述AOM相符的解码器来仅解码LL子带。
进一步对于第十九实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且输出选择包括低分辨率,并且重建所述图像或帧包括利用所述VP9相符的解码器、所述VP10相符的解码器或所述AOM相符的解码器来仅解码LL子带,并且重建所述图像或帧进一步包括比特深度限制器或执行上采样中的至少一个。
进一步对于第十九实施例,该方法进一步包括确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括全分辨率,并且重建所述图像或帧包括利用至少所述VP9相符的解码器、所述VP 10相符的解码器或所述AOM相符的解码器来解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带并对所述多个解码子带执行小波合成滤波以生成全分辨率的所述原始图像或帧。
在一个或多个第二十实施例中,用于图像或视频解码的系统包括存储可缩放比特流的存储器和耦合到所述存储器的处理器,所述处理器用于对所述可缩放比特流进行解复用以提供多个比特流,其中所述可缩放比特流的至少一些部分是VP9相符的、VP10相符的或开放媒体联盟(AOM)相符的,每个比特流对应于多个小波子带的子带;利用VP9相符的解码器、VP10相符的解码器或AOM相符的解码器解码所述多个比特流中的至少一个;以及基于所述解码重建图像或帧。
进一步对于第二十实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
进一步对于第二十实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括低分辨率,并且用于重建所述图像或帧的所述处理器包括用于利用VP9相符的解码器、VP10相符的解码器或AOM相符的解码器来仅解码LL子带的处理器。
进一步对于第二十实施例,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择并且所述输出选择包括全分辨率,并且用于重建所述图像或帧的所述处理器包括用于至少使用VP9相符的解码器、VP10相符的解码器或者AOM相符的解码器来解码每个对应于多个小波子带的一个子带的多个比特流以生成多个解码子带并对所述多个解码子带执行小波合成滤波以生成全分辨率的所述原始图像或帧的处理器。
在一个或多个第二十一实施例中,至少一个机器可读介质可以包括多个指令,所述多个指令响应于在计算设备上被执行而使得所述计算设备执行根据上述实施例的任何一个的方法。
在一个或多个第二十二实施例中,设备或系统可以包括用于执行根据上述实施例中的任何一个的方法或任何功能的装置。
将认识到的是,实施例不限于如此描述的实施例,而是可以在不脱离所附权利要求的范围的情况下通过修改和变更来进行实践。例如,上述实施例可以包括特征的特定组合。然而,上述实施例在这方面不受限制,并且在各种实现中,上述实施例可以包括:仅承担这些特征的子集、承担这些特征的不同顺序、承担这些特征的不同组合、和/或承担除了明确列出的特征之外的附加特征。因此,实施例的范围应该参考所附权利要求以及这些权利要求所赋权的等同物的全部范围来确定。

Claims (34)

1.一种用于图像或视频编码的计算机实现的方法,包括:
执行图像或帧的小波分解以生成包括LL子带的多个子带;
利用具有针对所述LL子带而启用的帧内预测的高级视频编码(AVC)相符的译码器对所述LL子带进行译码以生成第一AVC相符的比特流;
利用具有针对每个其余子带的全部而禁用的帧内预测的AVC相符的译码器对每个其余子带进行译码,以生成多个第二AVC相符的比特流;以及
将所述第一AVC相符的比特流和所述多个第二AVC相符的比特流进行复用以生成可缩放比特流。
2.根据权利要求1所述的方法,还包括:
选择用于执行所述小波分解的小波分析滤波器组。
3.根据权利要求1所述的方法,其中,所述图像或帧具有8比特的比特深度,并且每个所述子带具有9比特的比特深度。
4.根据权利要求1所述的方法,其中,所述AVC相符的译码器包括10比特帧内画质译码器。
5.根据权利要求1所述的方法,其中,执行所述小波分解包括单级小波分析滤波,并且所述多个子带包括四个子带。
6.根据权利要求5所述的方法,其中,所述多个子带包括LL子带、LH子带、HL子带和HH子带。
7.根据权利要求1所述的方法,其中,执行所述小波分解包括多级小波分析滤波。
8.根据权利要求7所述的方法,其中,所述多个子带包括七个子带。
9.一种用于图像或视频编码的系统,包括:
用于存储图像或帧的存储器;和
耦合到所述存储器的处理器,所述处理器用于执行所述图像或帧的小波分解以生成包括LL子带的多个子带,利用具有针对所述LL子带而启用的帧内预测的高级视频编码(AVC)相符的译码器对所述LL子带进行译码以生成第一AVC相符的比特流,利用具有针对每个其余子带的全部而禁用的帧内预测的AVC相符的译码器对每个其余子带进行译码以生成多个第二AVC相符的比特流,并且对所述第一AVC相符的比特流和所述多个第二AVC相符的比特流进行复用以生成可缩放比特流。
10.根据权利要求9所述的系统,其中,所述处理器进一步用于选择用于执行所述小波分解的小波分析滤波器组。
11.根据权利要求9所述的系统,其中,用于执行所述小波分解的所述处理器包括用于执行单级小波分析滤波的所述处理器,并且所述多个子带包括四个子带。
12.根据权利要求11所述的系统,其中,所述多个子带包括LL子带、LH子带、HL子带和HH子带。
13.根据权利要求9所述的系统,其中,用于执行所述小波分解的所述处理器包括用于执行多级小波分析滤波的所述处理器。
14.一种用于图像或视频解码的计算机实现的方法,包括:
对可缩放比特流进行解复用以提供多个比特流,其中所述可缩放比特流的至少一些部分是高级视频编码(AVC)相符的,所述多个比特流的每一个对应于多个小波子带的一个子带,其中所述多个比特流中的第一比特流对应于所述多个小波子带中的LL子带;
利用具有针对所述第一比特流而启用的帧内预测的AVC相符的解码器解码所述第一比特流以生成所述LL子带;
利用具有针对每个其余比特流的全部而禁用的帧内预测的AVC相符的解码器对每个其余比特流进行解码,以生成所述多个小波子带中的其余子带;以及
基于所述第一比特流和所述其余比特流的解码重建图像或帧。
15.根据权利要求14所述的方法,还包括:
确定对应于所述图像或帧的输出选择,其中,所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
16.根据权利要求15所述的方法,其中,所述输出选择包括低分辨率,并且重建所述图像或帧包括利用所述AVC相符的解码器仅解码LL子带。
17.根据权利要求16所述的方法,其中,重建所述图像或帧进一步包括应用比特深度限制器或执行上采样中的至少一个。
18.根据权利要求15所述的方法,其中,所述输出选择包括全分辨率并且重建所述图像或帧包括:
利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带;和
对所述多个解码子带执行小波合成滤波以生成全分辨率的图像或帧。
19.根据权利要求14所述的方法,还包括:
确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
20.根据权利要求19所述的方法,其中,所述输出选择包括低分辨率,并且重建所述图像或帧包括利用所述AVC相符的解码器仅解码LL2子带。
21.根据权利要求20所述的方法,其中,重建所述图像或帧进一步包括应用比特深度限制器且执行1:4上采样。
22.根据权利要求19所述的方法,其中,所述输出选择包括中分辨率并且重建所述图像或帧包括:
利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带,其中所述多个比特流包括所述多个比特流的子集;和
对所述多个解码子带执行单级小波合成滤波以生成图像或帧。
23.根据权利要求22所述的方法,其中,重建所述图像或帧进一步包括应用比特深度限制器且执行1:2上采样。
24.根据权利要求19所述的方法,其中,所述输出选择包括全分辨率并且重建所述图像或帧包括:
利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带,其中所述多个比特流包括所有所述多个比特流;和
对所述多个解码子带执行多级小波合成滤波以生成全分辨率的图像或帧。
25.一种用于图像或视频解码的系统,包括:
用于存储可缩放比特流的存储器,其中所述可缩放比特流的至少一些部分是高级视频编码(AVC)相符的;和
耦合到所述存储器的处理器,所述处理器用于:对所述可缩放比特流进行解复用以提供多个比特流,所述多个比特流的每一个对应于多个小波子带的一个子带,其中所述多个比特流中的第一比特流对应于所述多个小波子带中的LL子带;利用具有针对所述第一比特流而启用的帧内预测的AVC相符的解码器解码所述第一比特流以生成所述LL子带;利用具有针对每个其余比特流的全部而禁用的帧内预测的AVC相符的解码器对每个其余比特流进行解码以生成所述多个小波子带中的其余子带;并且基于所述第一比特流和所述其余比特流的解码重建图像或帧。
26.根据权利要求25所述的系统,其中,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
27.根据权利要求26所述的系统,其中,所述输出选择包括低分辨率,并且用于重建所述图像或帧的所述处理器包括用于利用所述AVC相符的解码器仅解码LL子带的处理器。
28.根据权利要求26所述的系统,其中,所述输出选择包括全分辨率,并且用于重建所述图像或帧的所述处理器包括用于利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带并用于对所述多个解码子带执行小波合成滤波以生成全分辨率的图像或帧的处理器。
29.根据权利要求25所述的系统,其中,所述处理器进一步用于确定对应于所述图像或帧的输出选择,其中所述输出选择包括低分辨率、中分辨率或全分辨率中的至少一个,并且其中重建所述图像或帧响应于所述输出选择。
30.根据权利要求29所述的系统,其中,所述输出选择包括低分辨率,并且用于重建所述图像或帧的所述处理器包括用于利用所述AVC相符的解码器来仅解码LL2子带的处理器。
31.根据权利要求29所述的系统,其中,所述输出选择包括中分辨率,并且用于重建所述图像或帧的所述处理器包括用于进行以下操作的处理器:用于利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带,其中所述多个比特流包括所述多个比特流的子集,并且用于对所述多个解码子带执行单级小波合成滤波以生成图像或帧。
32.根据权利要求29所述的系统,其中,所述输出选择包括全分辨率,并且用于重建所述图像或帧的所述处理器包括用于进行以下操作的处理器:用于利用至少所述AVC相符的解码器解码每个对应于所述多个小波子带的一个子带的多个比特流以生成多个解码子带,其中所述多个比特流包括所有所述多个比特流,并且用于对所述多个解码子带执行多级小波合成滤波以生成全分辨率的图像或帧。
33.至少一种机器可读介质,包括:
多个指令,所述多个指令响应于在计算设备上被执行而使得所述计算设备执行根据权利要求1-8或权利要求14-24中任一项所述的方法。
34.一种设备,包括:
用于执行根据权利要求1-8或权利要求14-24中任一项所述的方法的装置。
CN201680069931.4A 2015-11-30 2016-09-07 有效和可缩放帧内视频/图像编码 Active CN108293138B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/954,715 US9955176B2 (en) 2015-11-30 2015-11-30 Efficient and scalable intra video/image coding using wavelets and AVC, modified AVC, VPx, modified VPx, or modified HEVC coding
US14/954715 2015-11-30
PCT/US2016/050553 WO2017095491A1 (en) 2015-11-30 2016-09-07 EFFICIENT AND SCALABLE INTRA VIDEO/IMAGE CODING USING WAVELETS AND AVC, MODIFIED AVC, VPx, MODIFIED VPx, OR MODIFIED HEVC CODING

Publications (2)

Publication Number Publication Date
CN108293138A CN108293138A (zh) 2018-07-17
CN108293138B true CN108293138B (zh) 2021-09-24

Family

ID=58777851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680069931.4A Active CN108293138B (zh) 2015-11-30 2016-09-07 有效和可缩放帧内视频/图像编码

Country Status (3)

Country Link
US (1) US9955176B2 (zh)
CN (1) CN108293138B (zh)
WO (1) WO2017095491A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10694210B2 (en) * 2016-05-28 2020-06-23 Microsoft Technology Licensing, Llc Scalable point cloud compression with transform, and corresponding decompression
US10223810B2 (en) 2016-05-28 2019-03-05 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression
US11297346B2 (en) 2016-05-28 2022-04-05 Microsoft Technology Licensing, Llc Motion-compensated compression of dynamic voxelized point clouds
CN109120926B (zh) * 2017-06-23 2019-08-13 腾讯科技(深圳)有限公司 预测模式选择方法、装置及介质
US10942914B2 (en) * 2017-10-19 2021-03-09 Adobe Inc. Latency optimization for digital asset compression
US11086843B2 (en) 2017-10-19 2021-08-10 Adobe Inc. Embedding codebooks for resource optimization
US11120363B2 (en) 2017-10-19 2021-09-14 Adobe Inc. Latency mitigation for encoding data
WO2019208677A1 (ja) * 2018-04-27 2019-10-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法
CN112313954A (zh) 2018-06-28 2021-02-02 苹果公司 视频编码系统
WO2020006291A1 (en) * 2018-06-28 2020-01-02 Apple Inc. Priority-based video encoding and transmission
CN112313951A (zh) 2018-06-28 2021-02-02 苹果公司 低延迟视频编码和传输的速率控制
US10715812B2 (en) * 2018-07-13 2020-07-14 Tencent America LLC Method and apparatus for video coding
GB201817780D0 (en) * 2018-10-31 2018-12-19 V Nova Int Ltd Methods,apparatuses, computer programs and computer-readable media for processing configuration data
KR102647030B1 (ko) * 2019-01-23 2024-03-14 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
US11330296B2 (en) * 2020-09-14 2022-05-10 Apple Inc. Systems and methods for encoding image data
WO2024010919A1 (en) * 2022-07-07 2024-01-11 Innopeak Technology, Inc. System and method for geometry point cloud coding
WO2024119404A1 (en) * 2022-12-07 2024-06-13 Intel Corporation Visual quality enhancement in cloud gaming by 3d information-based segmentation and per-region rate distortion optimization

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3844844B2 (ja) * 1997-06-06 2006-11-15 富士通株式会社 動画像符号化装置及び動画像符号化方法
US6771695B1 (en) * 1999-07-30 2004-08-03 Agere Systems Inc. Low-complexity DMT transceiver
US7321625B2 (en) 2002-12-13 2008-01-22 Ntt Docomo, Inc. Wavelet based multiresolution video representation with spatially scalable motion vectors
FR2867328A1 (fr) 2004-03-02 2005-09-09 Thomson Licensing Sa Procede de decodage d'une sequence d'images codee avec echelonnabilite spatiale et temporelle
US8116374B2 (en) 2004-05-07 2012-02-14 Broadcom Corporation Method and system for generating a transform size syntax element for video decoding
KR100654436B1 (ko) * 2004-07-07 2006-12-06 삼성전자주식회사 비디오 코딩 방법과 디코딩 방법, 및 비디오 인코더와디코더
KR100679011B1 (ko) 2004-07-15 2007-02-05 삼성전자주식회사 기초 계층을 이용하는 스케일러블 비디오 코딩 방법 및 장치
US20080095235A1 (en) * 2006-10-20 2008-04-24 Motorola, Inc. Method and apparatus for intra-frame spatial scalable video coding
US9031129B2 (en) * 2007-06-15 2015-05-12 Microsoft Technology Licensing, Llc Joint spatio-temporal prediction for video coding
US8331444B2 (en) * 2007-06-26 2012-12-11 Qualcomm Incorporated Sub-band scanning techniques for entropy coding of sub-bands
JP4849130B2 (ja) * 2008-02-19 2012-01-11 ソニー株式会社 画像処理装置、および画像処理方法、並びにプログラム
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US20100208795A1 (en) 2009-02-19 2010-08-19 Motorola, Inc. Reducing aliasing in spatial scalable video coding
WO2011021240A1 (ja) * 2009-08-20 2011-02-24 トムソン ライセンシング ステレオ画像符号化方法、ステレオ画像符号化装置及びステレオ画像符号化プログラム
TW201117618A (en) * 2009-11-12 2011-05-16 Univ Nat Cheng Kung Scalable video coding method
US8879632B2 (en) 2010-02-18 2014-11-04 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
US9788019B2 (en) 2011-03-09 2017-10-10 Hfi Innovation Inc. Method and apparatus of transform unit partition with reduced complexity
US9247254B2 (en) 2011-10-27 2016-01-26 Qualcomm Incorporated Non-square transforms in intra-prediction video coding
GB2496194A (en) * 2011-11-07 2013-05-08 Sony Corp Entropy encoding video data using reordering patterns
US9756353B2 (en) * 2012-01-09 2017-09-05 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for single and multiple layered video coding systems
JP6480186B2 (ja) * 2012-01-19 2019-03-06 ヴィド スケール インコーポレイテッド ビデオコーディング量子化およびダイナミックレンジ制御のシステムおよび方法
EP2920962A4 (en) 2012-11-13 2016-07-20 Intel Corp ADAPTIVE TRANSFORMATION ENCODING OF CONTENT FOR NEXT GENERATION VIDEO
EP3158734A4 (en) * 2014-06-19 2017-04-26 Microsoft Technology Licensing, LLC Unified intra block copy and inter prediction modes

Also Published As

Publication number Publication date
WO2017095491A1 (en) 2017-06-08
US9955176B2 (en) 2018-04-24
US20170155906A1 (en) 2017-06-01
CN108293138A (zh) 2018-07-17

Similar Documents

Publication Publication Date Title
CN108293138B (zh) 有效和可缩放帧内视频/图像编码
CN108293120B (zh) 使用小波和可变尺寸变换编码的高效帧内视频/图像编码
US10602187B2 (en) Efficient, compatible, and scalable intra video/image coding using wavelets and HEVC coding
CN105453570B (zh) 用于下一代视频的对分区数据的内容自适应熵编码
US9532059B2 (en) Method and apparatus for spatial scalability for video coding
US10230950B2 (en) Bit-rate control for video coding using object-of-interest data
KR20130054413A (ko) 특징 기반 비디오 코딩 방법 및 장치
WO2014088772A1 (en) Matched filtering of prediction and reconstruction signals for next generation video
JP2008503981A (ja) グリッド動き推定/補償を用いたスケーラブルビデオ符号化
CN104168479B (zh) 用于视频成码的切片级比特率控制
CN108718411B (zh) 图像解码方法和使用其的装置
WO2013173292A1 (en) Scalable video coding with enhanced base layer
CN116762338A (zh) 使用预处理的视频编码
Hu et al. Motion differential set partition coding for image sequence and video compression
CN102833542A (zh) 一种提高可伸缩视频编码质量增强层编码速度装置和方法
WO2013147497A1 (ko) 스케일러블 비디오 코딩에서 샘플 적응적 오프셋 적용 방법 및 이를 이용한 장치
Huang et al. Less buffer sized efficienct compression algorithm based on column DCTs, Row DWTs, and predictive coding
Shum et al. Image Compression Techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant