CN102804173A

CN102804173A - 用于媒体数据译码的8点变换

Info

Publication number: CN102804173A
Application number: CN2010800276543A
Authority: CN
Inventors: 尤里娅·列兹尼克; 拉詹·L·乔希; 马尔塔·卡切维奇
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2009-06-24
Filing date: 2010-06-23
Publication date: 2012-11-28
Also published as: US20130148718A1; WO2011005572A2; WO2011005572A3; US9319685B2; JP2012531670A; BRPI1013292A2; KR20120048570A; US9118898B2; EP2446375A2; US20100329329A1; TW201122846A

Abstract

大体来说，本发明描述用于实施8点逆离散余弦变换IDCT的技术。一种包含8点逆离散余弦变换IDCT硬件单元的设备可实施这些技术，以将媒体数据从频域变换到空间域。所述8点IDCT硬件单元包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的因子A、B。所述8点IDCT硬件单元还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第一关系使所述第一经缩放因子与所述第一内部因子及所述第二内部因子相关。所述第二关系使所述第二经缩放因子与所述第三内部因子、所述第四内部因子、所述第五内部因子及所述第六内部因子相关。

Description

用于媒体数据译码的8点变换

本申请案主张2009年6月24日申请的第61/219,891号美国临时申请案的权利，所述申请案的全部内容以引用的方式并入本文中。

本专利申请案与以下共同待决的美国专利申请案有关：

8-POINT TRANSFORM FOR MEDIA DATA CODING(用于媒体数据译码的8点变换)，其具有代理人案号第092240U2号、与此同时申请、转让给本发明的受让人且以引用的方式明确地并入本文中。

技术领域

本发明涉及数据压缩，且更明确来说，涉及包含变换的数据压缩。

背景技术

数据压缩广泛用于多种应用中以减少对数据存储空间、传输带宽或两者的消耗。数据压缩的实例应用包括可见或可听媒体数据译码，例如数字视频译码、图像译码、语音译码及音频译码。数字视频译码(例如)用于广泛范围的装置中，所述装置包括数字电视、数字直接广播系统、无线通信装置、个人数字助理(PDA)、膝上型或桌上型计算机、数字相机、数字记录装置、视频游戏装置、蜂窝式或卫星无线电电话或其类似者。数字视频装置实施例如MPEG-2、MPEG-4或H.264/MPEG-4高级视频译码(AVC)的视频压缩技术，以更有效地传输及接收数字视频。

总地来说，视频压缩技术执行空间预测、运动估计及运动补偿以减少或移除视频数据中所固有的冗余。确切地说，帧内译码依赖于空间预测以减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除邻近帧内的视频中的时间冗余。对于帧间译码来说，视频编码器执行运动估计以追踪两个或两个以上邻近帧之间的匹配视频块的移动。运动估计产生运动向量，所述运动向量指示视频块相对于一个或一个以上参考帧中的对应视频块的位移。运动补偿使用运动向量以从参考帧产生预测视频块。在运动补偿之后，通过从原始视频块减去预测视频块而形成残余视频块。

视频编码器接着应用变换，接着应用量化及无损统计译码过程，以进一步降低由视频译码过程产生的残余块的位速率。在一些情况下，所应用的变换包含在水平方向及垂直方向上分别应用的离散余弦变换(DCT)。通常，将DCT应用于大小为2的幂的视频块，例如为4个像素高×4个像素宽的视频块(其常常称为“4×4视频块”)。通常，DCT为一维DCT或线性DCT，其首先应用于视频块的行，接着应用于视频块的列。这些一维(1D)DCT可因此被称作4点DCT，因为这些DCT被应用于4×4视频块以产生DCT系数的4×4矩阵。通过将4点DCT应用于残余块所产生的4×4DCT系数矩阵接着经历量化及无损统计译码过程(通常称为“熵译码”过程)以产生位流。统计译码过程的实例包括上下文自适应可变长度译码(CAVLC)或上下文自适应二进制算术译码(CABAC)。视频解码器接收经编码位流且执行无损解码以解压缩用于块中的每一者的残余信息。使用残余信息及运动信息，视频解码器重新建构经编码视频。

发明内容

大体来说，本发明是针对用于使用可提供相对于常规8点DCT增加的译码增益的8点离散余弦变换(DCT)的一个或一个以上实施方案来译码例如媒体数据的数据的技术。根据本发明的技术而应用的8点DCT的实施方案涉及经缩放因子与内部因子之间的各种关系。术语“经缩放因子”指代在8点DCT的实施方案外部的经由因子分解而移除的因子。术语“内部因子”指代在8点DCT的实施方案内部的在因子分解后仍保留的因子。8点DCT的一个实例实施方案为正交的，其意味着表示8点DCT的系数矩阵在乘以此矩阵的转置时等于单位矩阵。8点DCT的另一实例实施方案为接近正交的(或近似正交的)。通过遵守下文详细描述的各种关系，所述技术促进在两种情况下选择产生正交及接近正交8点DCT实施方案的矩阵系数，所述实施方案在应用于数据时可促进相对于常规8点DCT增加的译码增益。

在一个方面中，一种方法包含：用译码装置接收媒体数据，及用所述译码装置的8点离散余弦变换(DCT)硬件单元执行8点DCT以将所述接收到的媒体数据从空间域变换到频域。所述8点DCT硬件单元包括：偶数部分，其包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述第一经缩放因子等于所述第一内部因子的平方加上所述第二内部因子的平方的总和的平方根；及奇数部分，其包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于所述第三内部因子的平方加上所述第四内部因子的平方的总和的平方根。所述第二关系还经定义以使得所述第二经缩放因子等于所述第五内部因子的平方加上所述第六内部因子的平方的总和的平方根。

在另一方面中，一种设备包含8点离散余弦变换(DCT)硬件单元，所述DCT硬件单元将媒体数据从空间域变换到频域。所述8点DCT硬件单元包括：偶数部分，其包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述第一经缩放因子等于所述第一内部因子的平方加上所述第二内部因子的平方的总和的平方根；及奇数部分，其包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于所述第三内部因子的平方加上所述第四内部因子的平方的总和的平方根。所述第二关系还经定义以使得所述第二经缩放因子等于所述第五内部因子的平方加上所述第六内部因子的平方的总和的平方根。

在另一方面中，一种装置包含：用于接收媒体数据的装置，及用于执行8点离散余弦变换DCT以将所述接收到的媒体数据从空间域变换到频域的装置。所述用于执行8点DCT-II的装置包括：偶数部分，其包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述第一经缩放因子等于所述第一内部因子的平方加上所述第二内部因子的平方的总和的平方根；及奇数部分，其包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于所述第三内部因子的平方加上所述第四内部因子的平方的总和的平方根。所述第二关系还经定义以使得所述第二经缩放因子等于所述第五内部因子的平方加上所述第六内部因子的平方的总和的平方根。

在另一方面中，一种非暂时性计算机可读存储媒体包含使处理器执行以下操作的指令：用译码装置接收媒体数据，及用所述译码装置的8点离散余弦变换(DCT)硬件单元执行8点DCT以将所述接收到的媒体数据从空间域变换到频域。所述8点DCT硬件单元包括：偶数部分，其包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述第一经缩放因子等于所述第一内部因子的平方加上所述第二内部因子的平方的总和的平方根；及奇数部分，其包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于所述第三内部因子的平方加上所述第四内部因子的平方的总和的平方根。所述第二关系还经定义以使得所述第二经缩放因子等于所述第五内部因子的平方加上所述第六内部因子的平方的总和的平方根。

在另一方面中，一种方法包含：用译码装置接收媒体数据，及用所述译码装置的8点离散余弦变换(DCT)硬件单元执行8点DCT以将所述媒体数据从空间域变换到频域。所述8点DCT硬件单元包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述经缩放因子等于所述第一内部因子加上所述第二内部因子的总和除以三乘以常数pi(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pi(π)除以八的正弦的第二近似值(β)的总和。所述8点DCT硬件单元还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于以下等式中的产生最小误差的等式：(1)所述第三内部因子(G)加上所述第四内部因子(D)的总和除以所述常数pi除以十六的余弦的第三近似值(γ)加上所述常数pi除以十六的正弦的第四近似值(δ)的总和，(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和，(3)所述第三内部因子(G)加上所述第六内部因子(Z)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的正弦的第六近似值(ζ)的总和，(4)所述第四内部因子(D)加上所述第五内部因子(E)的总和除以所述第四近似值(δ)加上所述第五近似值(ε)的总和，(5)所述第四内部因子(D)加上所述第六内部因子(Z)的总和除以所述第四近似值(δ)加上所述第六近似值(ζ)的总和，及(6)所述第五内部因子(E)加上所述第六内部因子(Z)的总和除以所述第五近似值(ε)加上所述第六近似值(ζ)的总和。

在另一方面中，一种设备包含8点离散余弦变换(DCT)硬件单元，所述DCT硬件单元将媒体数据从空间域变换到频域。所述8点DCT硬件单元包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述经缩放因子等于所述第一内部因子加上所述第二内部因子的总和除以三乘以常数pi(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pi(π)除以八的正弦的第二近似值(β)的总和。所述8点DCT硬件单元包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于以下等式中的产生最小误差的等式：(1)所述第三内部因子(G)加上所述第四内部因子(D)的总和除以所述常数pi除以十六的余弦的第三近似值(γ)加上所述常数pi除以十六的正弦的第四近似值(δ)的总和，(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和，(3)所述第三内部因子(G)加上所述第六内部因子(Z)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的正弦的第六近似值(ζ)的总和，(4)所述第四内部因子(D)加上所述第五内部因子(E)的总和除以所述第四近似值(δ)加上所述第五近似值(ε)的总和，(5)所述第四内部因子(D)加上所述第六内部因子(Z)的总和除以所述第四近似值(δ)加上所述第六近似值(ζ)的总和，及(6)所述第五内部因子(E)加上所述第六内部因子(Z)的总和除以所述第五近似值(ε)加上所述第六近似值(ζ)的总和。

在另一方面中，一种设备包含：用于接收媒体数据的装置，及用于执行8点离散余弦变换(DCT)以将所述媒体数据从空间域变换到频域的装置。所述用于执行所述8点DCT的装置包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述经缩放因子等于所述第一内部因子加上所述第二内部因子的总和除以三乘以常数pi(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pi(π)除以八的正弦的第二近似值(β)的总和。所述用于执行所述8点DCT的装置还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于以下等式中的产生最小误差的等式：(1)所述第三内部因子(G)加上所述第四内部因子(D)的总和除以所述常数pi除以十六的余弦的第三近似值(γ)加上所述常数pi除以十六的正弦的第四近似值(δ)的总和，(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和，(3)所述第三内部因子(G)加上所述第六内部因子(Z)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的正弦的第六近似值(ζ)的总和，(4)所述第四内部因子(D)加上所述第五内部因子(E)的总和除以所述第四近似值(δ)加上所述第五近似值(ε)的总和，(5)所述第四内部因子(D)加上所述第六内部因子(Z)的总和除以所述第四近似值(δ)加上所述第六近似值(ζ)的总和，及(6)所述第五内部因子(E)加上所述第六内部因子(Z)的总和除以所述第五近似值(ε)加上所述第六近似值(ζ)的总和。

在另一方面中，一种非暂时性计算机可读存储媒体包含使处理器执行以下操作的指令：接收媒体数据，及用8点离散余弦变换(DCT)硬件单元执行8点DCT以将所述媒体数据从空间域变换到频域。所述8点DCT硬件单元包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述经缩放因子等于所述第一内部因子加上所述第二内部因子的总和除以三乘以常数pi(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pi(π)除以八的正弦的第二近似值(β)的总和。所述8点DCT硬件单元还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于以下等式中的产生最小误差的等式：(1)所述第三内部因子(G)加上所述第四内部因子(D)的总和除以所述常数pi除以十六的余弦的第三近似值(γ)加上所述常数pi除以十六的正弦的第四近似值(δ)的总和，(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和，(3)所述第三内部因子(G)加上所述第六内部因子(Z)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的正弦的第六近似值(ζ)的总和，(4)所述第四内部因子(D)加上所述第五内部因子(E)的总和除以所述第四近似值(δ)加上所述第五近似值(ε)的总和，(5)所述第四内部因子(D)加上所述第六内部因子(Z)的总和除以所述第四近似值(δ)加上所述第六近似值(ζ)的总和，及(6)所述第五内部因子(E)加上所述第六内部因子(Z)的总和除以所述第五近似值(ε)加上所述第六近似值(ζ)的总和。

在另一方面中，一种方法包含：用译码装置接收经译码媒体数据，及用所述译码装置的8点逆离散余弦变换(IDCT)硬件单元执行8点IDCT以将所述接收到的经译码媒体数据从频域变换到空间域。所述8点IDCT硬件单元包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述第一经缩放因子等于所述第一内部因子的平方加上所述第二内部因子的平方的总和的平方根。所述8点IDCT硬件单元还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于所述第三内部因子的平方加上所述第四内部因子的平方的总和的平方根。所述第二关系还经定义以使得所述第二经缩放因子等于所述第五内部因子的平方加上所述第六内部因子的平方的总和的平方根。

在另一方面中，一种设备包含8点逆离散余弦变换(IDCT)硬件单元，所述IDCT硬件单元将经译码媒体数据从频域变换到空间域。所述8点IDCT硬件单元包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述第一经缩放因子等于所述第一内部因子的平方加上所述第二内部因子的平方的总和的平方根。所述8点IDCT硬件单元还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于所述第三内部因子的平方加上所述第四内部因子的平方的总和的平方根。所述第二关系还经定义以使得所述第二经缩放因子等于所述第五内部因子的平方加上所述第六内部因子的平方的总和的平方根。

在另一方面中，一种装置包含：用于接收经译码媒体数据的装置，及用于执行8点逆离散余弦变换(IDCT)以将所述接收到的经译码媒体数据从频域变换到空间域的装置。所述用于执行所述8点IDCT的装置包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述第一经缩放因子等于所述第一内部因子的平方加上所述第二内部因子的平方的总和的平方根。所述用于执行所述8点IDCT的装置还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于所述第三内部因子的平方加上所述第四内部因子的平方的总和的平方根。所述第二关系还经定义以使得所述第二经缩放因子等于所述第五内部因子的平方加上所述第六内部因子的平方的总和的平方根。

在另一方面中，一种非暂时性计算机可读存储媒体包含使处理器执行以下操作的指令：用译码装置接收经译码媒体数据，及用所述译码装置的8点逆离散余弦变换(IDCT)硬件单元执行8点IDCT以将所述接收到的经译码媒体数据从频域变换到空间域。所述8点IDCT硬件单元包括：偶数部分，其包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述第一经缩放因子等于所述第一内部因子的平方加上所述第二内部因子的平方的总和的平方根；及奇数部分，其包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于所述第三内部因子的平方加上所述第四内部因子的平方的总和的平方根。所述第二关系还经定义以使得所述第二经缩放因子等于所述第五内部因子的平方加上所述第六内部因子的平方的总和的平方根。

在另一方面中，一种方法包含：用译码装置接收经译码媒体数据，及用所述译码装置的8点逆离散余弦变换(IDCT)硬件单元执行8点IDCT以将所述经译码媒体数据从频域变换到空间域。所述8点IDCT硬件单元包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述经缩放因子等于所述第一内部因子加上所述第二内部因子的总和除以三乘以常数pi(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pi(π)除以八的正弦的第二近似值(β)的总和。所述8点IDCT硬件单元还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于以下等式中的产生最小误差的等式：(1)所述第三内部因子(G)加上所述第四内部因子(D)的总和除以所述常数pi除以十六的余弦的第三近似值(γ)加上所述常数pi除以十六的正弦的第四近似值(δ)的总和，(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和，(3)所述第三内部因子(G)加上所述第六内部因子(Z)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的正弦的第六近似值(ζ)的总和，(4)所述第四内部因子(D)加上所述第五内部因子(E)的总和除以所述第四近似值(δ)加上所述第五近似值(ε)的总和，(5)所述第四内部因子(D)加上所述第六内部因子(Z)的总和除以所述第四近似值(δ)加上所述第六近似值(ζ)的总和，及(6)所述第五内部因子(E)加上所述第六内部因子(Z)的总和除以所述第五近似值(ε)加上所述第六近似值(ζ)的总和。

在另一方面中，一种设备包含8点逆离散余弦变换(IDCT)硬件单元，所述IDCT硬件单元将经译码媒体数据从频域变换到空间域。所述8点IDCT硬件单元包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述经缩放因子等于所述第一内部因子加上所述第二内部因子的总和除以三乘以常数pi(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pi(π)除以八的正弦的第二近似值(β)的总和。所述8点IDCT硬件单元还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于以下等式中的产生最小误差的等式：(1)所述第三内部因子(G)加上所述第四内部因子(D)的总和除以所述常数pi除以十六的余弦的第三近似值(γ)加上所述常数pi除以十六的正弦的第四近似值(δ)的总和，(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和，(3)所述第三内部因子(G)加上所述第六内部因子(Z)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的正弦的第六近似值(ζ)的总和，(4)所述第四内部因子(D)加上所述第五内部因子(E)的总和除以所述第四近似值(δ)加上所述第五近似值(ζ)的总和，(5)所述第四内部因子(D)加上所述第六内部因子(Z)的总和除以所述第四近似值(δ)加上所述第六近似值(ζ)的总和，及(6)所述第五内部因子(E)加上所述第六内部因子(Z)的总和除以所述第五近似值(ε)加上所述第六近似值(ζ)的总和。

在另一方面中，一种设备包含：用于接收经译码媒体数据的装置，及用于执行8点逆离散余弦变换(IDCT)以将所述经译码媒体数据从频域变换到空间域的装置。所述用于执行所述8点IDCT的装置包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述经缩放因子等于所述第一内部因子加上所述第二内部因子的总和除以三乘以常数pi(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pi(π)除以八的正弦的第二近似值(β)的总和。所述用于执行所述8点IDCT的装置还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于以下等式中的产生最小误差的等式：(1)所述第三内部因子(G)加上所述第四内部因子(D)的总和除以所述常数pi除以十六的余弦的第三近似值(γ)加上所述常数pi除以十六的正弦的第四近似值(δ)的总和，(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和，(3)所述第三内部因子(G)加上所述第六内部因子(Z)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的正弦的第六近似值(ζ)的总和，(4)所述第四内部因子(D)加上所述第五内部因子(E)的总和除以所述第四近似值(δ)加上所述第五近似值(ε)的总和，(5)所述第四内部因子(D)加上所述第六内部因子(Z)的总和除以所述第四近似值(δ)加上所述第六近似值(ζ)的总和，及(6)所述第五内部因子(E)加上所述第六内部因子(Z)的总和除以所述第五近似值(ε)加上所述第六近似值(ζ)的总和。

在另一方面中，一种非暂时性计算机可读存储媒体包含使处理器执行以下操作的指令：接收经译码媒体数据，及用8点逆离散余弦变换(IDCT)硬件单元执行8点IDCT以将所述经译码媒体数据从频域变换到空间域。所述8点IDCT硬件单元包括偶数部分，所述偶数部分包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述经缩放因子等于所述第一内部因子加上所述第二内部因子的总和除以三乘以常数pi(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pi(π)除以八的正弦的第二近似值(β)的总和。所述8点IDCT硬件单元还包括奇数部分，所述奇数部分包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)。所述第二关系经定义以使得所述第二经缩放因子等于以下等式中的产生最小误差的等式：(1)所述第三内部因子(G)加上所述第四内部因子(D)的总和除以所述常数pi除以十六的余弦的第三近似值(γ)加上所述常数pi除以十六的正弦的第四近似值(δ)的总和，(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和，(3)所述第三内部因子(G)加上所述第六内部因子(Z)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的正弦的第六近似值(ζ)的总和，(4)所述第四内部因子(D)加上所述第五内部因子(E)的总和除以所述第四近似值(δ)加上所述第五近似值(ε)的总和，(5)所述第四内部因子(D)加上所述第六内部因子(Z)的总和除以所述第四近似值(δ)加上所述第六近似值(ζ)的总和，及(6)所述第五内部因子(E)加上所述第六内部因子(Z)的总和除以所述第五近似值(ε)加上所述第六近似值(ζ)的总和。

在下文的随附图式图及描述中陈述所述技术的一个或一个以上方面的细节。本发明中描述的技术的其它特征、目标及优点将通过所述描述及所述图式且权利要求书显而易见。

附图说明

图1为说明视频编码及解码系统的框图。

图2为更详细地说明图1的视频编码器的框图。

图3为更详细地说明图1的视频解码器的框图。

图4为说明根据本发明的技术所建构的经缩放8点DCT-II的实施方案的图。

图5为说明译码装置在应用根据本发明的技术所建构的8点DCT实施方案时的示范性操作的流程图。

图6为说明译码装置在应用根据本发明的技术所建构的8点DCT-III实施方案时的实例操作的流程图。

具体实施方式

大体来说，本发明是针对用于使用表示为根据各种关系所选择的系数的8×8矩阵的一个或一个以上8点离散余弦变换(DCT)来译码数据的技术。可应用所述技术以压缩各种数据(包括可见或可听媒体数据，例如数字视频、图像、语音及/或音频数据)，且借此将表示此数据的这些电信号变换成压缩信号以便更有效地处理、传输或存档所述电信号。通过遵守根据本发明的技术所定义的各种关系，可为所述系数矩阵选择系数，使得8点DCT的正交及接近正交实施方案在应用于数据时可促进增加的译码增益。

按离散数据单元来表示上文所表示的大小(即，8点)。为进行说明，通常按视频块来描述视频数据(尤其是关于视频压缩)。视频块通常指代视频帧的为任何大小的部分，其中视频帧指代一系列图片或图像中的一图片或图像。每一视频块通常包含多个离散像素数据，其指示例如红色、蓝色及绿色的色彩分量(所谓的“色度”分量)或亮度分量(所谓的“明度”分量)。每一像素数据集合包含所述视频块中的单一1×1点且可被视为关于视频块的离散数据单元。因此，一8×8视频块(例如)包含八行像素数据，每一行中有八个离散的像素数据集合。可给每一像素指派一n位值以规定色彩或亮度值。在变换8×8视频块时，将8点DCT应用于所述行以产生经变换行。在此变换之后将8点DCT应用于经变换行数据的列。也可颠倒行一列定序。类似地，对于含有8个行及4个列的矩形块，跨行应用4点DCT，且然后跨中间经变换行数据的列应用8点DCT。

通常按DCT能够处理的数据(不管是音频、语音图像或是视频数据)的大小来描述DCT。举例来说，如果DCT可处理输入数据的8个样本，则DCT可被称作8点DCT。此外，DCT可表示为特定类型。八种不同类型的DCT中最常用类型的DCT为II类型DCT，其可表示为“DCT-II”。通常，在一般参考DCT时，此参考指代II类型DCT或DCT-II。DCT-II的逆向操作被称作III类型DCT，其可类似地表示为“DCT-III”，或由于通常将DCT理解为指代DCT-II，因此表示为“IDCT”，其中“I”在“IDCT”中表示逆向形式。下文对DCT的参考符合此标记法，其中除非另外规定，否则对DCT的一般参考指代DCT-II。然而，为避免混淆，下文主要参考具有已指示的对应类型(II、III等)的DCT(包括DCT-II)。

本发明中所描述的技术涉及编码器及/或解码器两者，其分别使用8点DCT-II及/或8点DCT-III的一个或一个以上实施方案来促进数据的压缩及/或解压缩。此外，经由应用这些8点DCT-II实施方案所实现的压缩及解压缩准许表示数据的电信号的物理变换，以使得可使用物理计算硬件、物理传输媒体(例如，铜、光纤、无线媒体或其它媒体)及/或存储硬件(例如，磁盘或光盘或磁带，或各种固态媒体中的任一者)更高效地处理、传输及/或存储信号。所述实施方案可仅以硬件来配置或可以硬件与软件的组合来配置。

8点DCT-II的实施方案可为正交或接近正交的。术语“正交”大体上指代矩阵的性质，其中矩阵在乘以矩阵的转置时等于单位矩阵。术语“接近正交”指代此正交性质被放松使得不需要严格正交性的情况。就此来说，“接近正交”暗示近似正交性或松散正交性。然而，接近正交矩阵不符合正交的技术定义，且从纯粹技术角度来说，这些接近正交矩阵可被视为非正交的。

为了说明本发明中所描述的8点DCT-II的正交实施方案，考虑包括8点DCT模块的设备。所述8点DCT模块实施根据本发明中描述的技术所建构的正交8点DCT-II。此正交8点DCT-II实施方案包括偶数部分及奇数部分。8点DCT-II的所谓“偶数部分”指代所述8点DCT-II实施方案的输出偶数编号的系数的部分。8点DCT-II的所谓“奇数部分”指代所述8点DCT-II实施方案的输出奇数编号的系数的部分。

根据本发明的技术，所述偶数部分包含第一及第二内部因子(A、B)及第一经缩放因子(μ)。如以下等式(1)中所表示，所述第一经缩放因子等于第一内部因子的平方加上第二内部因子的平方的总和的平方根；

μ = \sqrt{A^{2} + B^{2}} . - - - (1)

所述奇数部分包含第三、第四、第五及第六内部因子(G、D、E、Z)及第二经缩放因子(η)。所述第二经缩放因子等于第三内部(G)因子的平方加上第四内部因子(D)的平方的总和的平方根。所述第二经缩放因子也等于第五内部因子(E)的平方加上第六内部因子(Z)的平方的总和的平方根。第二经缩放因子与第三、第四、第五及第六内部因子之间的此两种关系是由以下等式(2)用数学方式定义：

η = \sqrt{G^{2} + D^{2}} = \sqrt{E^{2} + Z^{2}} . - - - (2)

术语“内部因子”指代在8点DCT的实施方案内部的在因子分解后仍保留的因子。术语“经缩放因子”指代在8点DCT的实施方案外部的经由因子分解而移除的因子。

内部因子通常由于需要在实施复杂性方面可能代价大的乘法而增加实施方案复杂性。举例来说，与较简单的加法运算相比，乘法可能需要三倍或三倍以上的计算操作。可实施特定乘法器以更高效地(例如，在较少的时钟循环中)执行乘法，但这些乘法器实施方案通常消耗显著更多的芯片或硅表面积且还可能会汲取大量电力。因此通常避免乘以因子的乘法，尤其是在功率敏感装置中，例如大多数移动装置，其包括蜂窝式电话、所谓的“智能型”蜂窝式电话、个人数字助理(PDA)、膝上型计算机、所谓的“上网本”及其类似者。因子分解为可用以从8点DCT-II实施方案移除一个或一个以上内部因子且用外部因子加以替换的过程。接着可通常以最小的花费或最小的复杂性增加将外部因子并入于例如关于视频编码器的随后量化操作中。

无论如何，上文提到的由等式(1)及(2)定义的在内部因子与经缩放因子之间的以上关系提供了8点DCT-II的先前实施方案中未使用的内部因子的特定值。视频编码器接着将具有这些内部因子的8点DCT-II实施方案(跨行及列)应用于媒体数据以便将媒体数据从空间域变换到频域。通过应用此正交8点DCT-II实施方案，在与标准8点DCT-II实施方案相比时，所述技术促进了译码增益(其为表示压缩效率的术语)。

就DCT-II实施方案来说，正交性通常为所要的，因为其为可逆的。作为一个实例，此可逆性质允许视频编码器应用正交8点DCT-II实施方案以从视频数据的残余块产生DCT系数。视频解码器可接着应用8点逆DCT-II(IDCT)实施方案以便在数据有极小损耗(即使有)的情况下从DCT-II系数重新建构视频数据的残余块。考虑到视频编码的主要目标为保存数据，所以例如H.264视频译码标准的各种译码标准采用8点DCT的正交实施方案。

虽然正交性通常在理论上为所要的，但视频、音频或通用译码管线在实践中涉及会引入所谓的“噪声”的若干步骤，所述“噪声”在大多数方面实际上阻止准确重新建构由正交8点DCT-II实施方案提供的值。因此，放松正交性质以实现接近正交(其在技术上来说是非正交的)可改善译码效率同时减小实施方案复杂性，代价为原始DCT基函数的近似较不精确。实际上，放松正交性质会将噪声引入到系统中，但可改善译码增益同时还减小实施方案复杂性。

为说明本发明中描述的8点DCT-II的接近正交实施方案的实例，考虑所述设备的8点DCT模块实施根据本发明中描述的技术所建构的此接近正交8点DCT-II。此接近正交8点DCT-II实施方案包括偶数部分，所述偶数部分包含第一及第二内部因子(A、B)及第一经缩放因子(μ)。如以下等式(3)中用数学方式所表示，所述经缩放因子等于第一内部因子加上第二内部因子的总和除以三乘以常数pie(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pie(π)除以八的正弦的第二近似值(β)的总和：

μ = \frac{A + B}{α + β} . - - - (3)

此实例的接近正交8点DCT-II实施方案还包括奇数部分，所述奇数部分包含第三、第四、第五及第六内部因子(G、D、E、Z)及第二经缩放因子(η)。所述第二经缩放因子等于以下各项中的产生最小误差的项，此关系由以下等式(4)定义：

η &Element; {\frac{G + D}{γ + δ}, \frac{G + E}{γ + ϵ}, \frac{G + Z}{γ + ζ}, \frac{D + E}{δ + ϵ}, \frac{D + Z}{δ + ζ}, \frac{E + Z}{ϵ + ζ}} . - - - (4)

等式(4)指示所述第二经缩放因子可等于以下各者中的一者：(1)第三内部因子(G)加上第四内部因子(D)的总和除以常数pie除以十六的余弦的第三近似值(γ)加上常数pie除以十六的正弦的第四近似值(δ)的总和，(2)第三内部因子(G)加上第五内部因子(E)的总和除以第三近似值(γ)加上三乘以常数pie除以16的余弦的第五近似值(ε)的总和，(3)第三内部因子(G)加上第六内部因子(Z)的总和除以第三近似值(γ)加上三乘以常数pie除以16的正弦的第六近似值(ζ)的总和，(4)第四内部因子(D)加上第五内部因子(E)的总和除以第四近似值(δ)加上第五近似值(ε)的总和，(5)第四内部因子(D)加上第六内部因子(Z)的总和除以第四近似值(δ)加上第六近似值(ζ)的总和，及(6)第五内部因子(E)加上第六内部因子(Z)的总和除以第五近似值(ε)加上第六近似值(ζ)的总和。

同样，这些等式可识别类似于上文关于针对正交实施方案所定义的关系而确定的内部因子值的特定内部因子值，但产生不同的外部因子。然而，由于上文提到的原因，不同的外部因子通常不增加实施方案复杂性，而是通常提供与常规8点DCT-II实施方案且甚至在一些情况下与根据本发明的技术所建构的正交8点DCT-II实施方案相比改善的译码增益。因此，控制单元将此接近正交8点DCT-II应用于媒体数据以将所述媒体数据从空间域变换到频域，结果可能改善译码增益。

图1为说明视频编码及解码系统10的框图。如图1中所展示，系统10包括源硬件装置12，所述源硬件装置12经由通信信道16将经编码的视频传输到接收硬件装置14。源装置12可包括视频源18、视频编码器20及发射器22。目的地装置14可包括接收器24、视频解码器26及视频显示装置28。

在图1的实例中，通信信道16可包含任何无线或有线通信媒体，例如，射频(RF)频谱或一个或一个以上物理传输线，或无线与有线媒体的任何组合。信道16可形成基于包的网络(例如，局域网络、广域网络或例如因特网的全球网络)的一部分。通信信道16通常表示用于将视频数据从源装置12传输到接收装置14的任何合适通信媒体或不同通信媒体的集合。

源装置12产生用于传输到目的地装置14的视频。然而，在一些情况下，装置12、14可以大体上对称的方式操作。举例来说，装置12、14中的每一者可包括视频编码及解码组件。因此，系统10可支持在视频装置12、14之间的单向或双向视频传输(例如)以用于视频串流、视频广播或视频电话。对于其它数据压缩及译码应用，装置12、14可经配置以发送及接收或交换其它类型的数据，例如，图像、语音或音频数据，或视频、图像、语音及音频数据中的两者或两者以上的组合。因此，为实现说明的目的而提供以下对视频应用的论述且不应认为其会限制本文中广泛描述的本发明的各种方面。

视频源18可包括视频俘获装置(例如，一个或一个以上视频相机)、含有先前俘获的视频的视频存档，或来自视频内容提供者的实况视频馈入。作为另一替代方案，视频源18可产生基于计算机图形的数据作为源视频，或实况视频与计算机产生的视频的组合。在一些情况下，如果视频源18为相机，则源装置12及接收装置14可形成所谓的相机电话或视频电话。因此，在一些方面中，源装置12、接收装置14或两者可形成无线通信装置手持机(例如，移动电话)。在每一种情况下，所俘获、预先俘获或计算机产生的视频可由视频编码器20编码以经由发射器22、信道16及接收器24从视频源装置12传输到视频接收装置14的视频解码器26。显示装置28可包括各种显示装置中的任一者，例如液晶显示器(LCD)、等离子显示器或有机发光二极管(OLED)显示器。

视频编码器20及视频解码器26可经配置以支持可缩放视频译码，以获得空间、时间及/或信噪比(SNR)可缩放性。在一些方面中，视频编码器20及视频解码器22可经配置以支持精细粒度SNR可缩放性(FGS)译码。编码器20及解码器26可通过支持基础层及一个或一个以上可缩放增强层的编码、传输及解码而支持各种程度的可缩放性。对于可缩放视频译码，基础层载运具有最小质量等级的视频数据。一个或一个以上增强层载运额外位流以支持较高的空间、时间及/或SNR等级。

视频编码器20及视频解码器26可根据例如MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4高级视频译码(AVC)的视频压缩标准来操作。尽管图1中未展示，但在一些方面中，视频编码器20及视频解码器26可分别与音频编码器及解码器集成，且包括适当的MUX-DEMUX单元或其它硬件及软件以处置对共同数据流或分离的数据流中的音频与视频的编码。如果适用，则MUX-DEMUX单元可符合ITU H.223多路复用器协议，或例如用户数据报协议(UDP)的其它协议。

在一些方面中，对于视频广播，可应用本发明中描述的技术以增强H.264视频译码以用于(例如)经由无线视频广播服务器或无线通信装置手持机使用仅前向链路(FLO)空中接口规格(作为技术标准TIA-1099公开的“陆地移动多媒体多播的仅前向链路空中接口规范(Forward Link Only Air Interface Specification for Terrestrial MobileMultimedia Multicast)”(“FLO规格”))在陆地移动多媒体多播(TM3)系统中传递实时视频服务。所述FLO规格包括定义适合于FLO空中接口的位流语法及语义以及解码过程的实例。或者，可根据例如DVB-H(手持型数字视频广播)、ISDB-T(陆地集成服务数字广播)或DMB(数字媒体广播)的其它标准来广播视频。因此，源装置12可为移动无线终端、视频串流服务器或视频广播服务器。然而，本发明中描述的技术不限于任何特定类型的广播、多播或点对点系统。在广播的情况下，源装置12可将若干信道的视频数据广播到多个接收装置，所述多个接收装置中的每一者类似于图1的接收装置14。

视频编码器20及视频解码器26各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。因此，视频编码器20及视频解码器26中的每一者可至少部分地实施为集成电路(IC)芯片或装置，且包括于一个或一个以上编码器或解码器中，其中任一者可集成为相应移动装置、用户装置、广播装置、服务器或其类似者中的组合编码器/解码器(编解码器)的一部分。另外，源装置12及接收装置14各自可包括(适用时)用于传输及接收经编码的视频的适当调制、解调、频率转换、滤波及放大器组件，其包括足以支持无线通信的射频(RF)无线组件及天线。然而，为易于说明，图1中未展示这些组件。

一视频序列包括一系列视频帧。视频编码器20对各个视频帧内的像素块进行操作以便编码视频数据。视频块可具有固定或变化的大小，且可根据规定译码标准而大小不同。每一视频帧包括一系列片段。每一片段可包括一系列宏块，其可布置成子块。作为一实例，ITU-T H.264标准支持各种二元块大小的帧内预测，例如16乘16、8乘8、4乘4(对于明度分量)及8×8(对于色度分量)，以及支持各种块大小的帧间预测，例如16乘16、16乘8、8乘16、8乘8、8乘4、4乘8及4乘4(对于明度分量)及对应的经缩放大小(对于色度分量)。

较小的视频块通常可提供较好的分辨率，且可用于视频帧的包括较高细节等级的位置。大体来说，通常可认为宏块(MB)及各种子块表示视频块。另外，可认为片段表示一系列视频块，例如MB及/或子块。每一片段可为可独立解码的单元。在预测后，可对二元或非二元大小的残余块执行变换，且可在使用帧内16×16预测模式的情况下将额外变换应用于色度分量或明度分量的4×4块的DCT系数。

图1的系统10的视频编码器20及/或视频解码器26可经配置以分别包括8点DCT-II及其逆向形式(例如，8点DCT-III)的实施方案，其中8点DCT-II遵守本发明中描述的用于为8点大小的DCT选择DCT-II矩阵系数的技术的各种关系中的一者。虽然ITU-TH.264标准支持各种块大小的帧内预测，例如16乘16、8乘8、4乘4(对于明度分量)及8乘8(对于色度分量)，但为了改善译码效率而对此标准进行的修订目前正在进行中。由视频译码联合合作团队(JCT-VC)(其为MPEG与ITU-T之间的合作)提出的一个经修订标准可被称作高效视频译码(HEVC)。因此，HEVC及其它演进中的标准或规格可考虑这些DCT-II及DCT-III以改善译码效率。

根据本发明中描述的技术，可以遵守各种关系中的一者的方式产生8点DCT-II的实施方案，所述实施方案可促进与常规实施方案相比改善的译码增益。就正交实施方案来说，以上的等式(1)(为便利起见，在此处对其进行重申)识别在偶数内部因子(或所述因子中的在DCT-II实施方案的偶数部分内部的因子)与应用于所述偶数部分的输出中的一者或一者以上的第一经缩放因子之间的第一关系：

μ = \sqrt{A^{2} + B^{2}}, - - - (1)

其中变量A及B表示8点DCT-II实施方案的“偶数”部分中的第一及第二内部因子，且变量μ表示应用于8点DCT-II实施方案的“偶数”部分的第一经缩放因子。8点DCT-II的所谓的“偶数”部分指代4点DCT-II实施方案的输出偶数编号的系数的部分。

8点DCT-II的所谓“奇数部分”指代4点DCT-II实施方案的输出奇数编号的系数的部分。在正交8点DCT-II实施方案中，所述奇数部分包含第三、第四、第五及第六内部因子(G、D、E、Z)及第二经缩放因子(η)。所述第二经缩放因子等于第三内部(G)因子的平方加上第四内部因子(D)的平方的总和的平方根。所述第二经缩放因子也等于第五内部因子(E)的平方加上第六内部因子(Z)的平方的总和的平方根。第二经缩放因子与第三、第四、第五及第六内部因子之间的此两种关系如上文关于等式(2)所展示一样用数学方式来定义，为便利起见在此处再次重现等式(2)：

η = \sqrt{G^{2} + D^{2}} = \sqrt{E^{2} + Z^{2}} . - - - (2)

内部因子通常由于需要涉及较复杂的实施方案的乘法而增加实施方案复杂性。举例来说，与较简单的加法运算相比，乘法可能需要三倍或三倍以上计算操作。可实施特定乘法器以更高效地(例如，在较少的时钟循环中)执行乘法，但这些乘法器实施方案通常消耗显著更多的芯片或硅表面积且还可能会汲取大量电力。因此通常避免乘以因子的乘法，尤其在功率敏感装置中，例如大部分移动装置，包括蜂窝式电话、所谓的“智能型”蜂窝式电话、个人数字助理(PDA)、膝上型计算机、所谓的“上网本”及其类似者。因子分解为可用以从8点DCT-II实施方案移除一个或一个以上内部因子且用外部因子加以替换的过程。接着可通常以最小的花费或最小的复杂性增加将外部因子并入于例如关于视频编码器的随后量化操作中。

无论如何，上文关于等式(1)所提到的第一及第二内部因子A、B与第一经缩放因子(μ)之间的以上关系及第三至第六内部因子G、D、E及Z与第二经缩放因子(η)之间的关系提供了8点DCT-II的先前实施方案中通常未使用的内部因子的特定值。举例来说，分别用于内部因子A及B的值2及5以及分别用于G、D、E及Z的值11、3、9及7不会过度增加实施方案复杂性，且与已知8点DCT实施方案相比改善了译码增益。视频编码器接着将具有这些内部因子的8点DCT-II实施方案应用于媒体数据以便将媒体数据从空间域变换到频域。通过应用此正交8点DCT-II实施方案，在与常规DCT-II实施方案相比时，所述技术促进译码增益(其为表示压缩效率的术语)。

就DCT-II实施方案来说，正交性通常为所要的，因为其为可逆的。作为一个实例，此可逆性质允许视频编码器应用正交8点DCT实施方案以从视频数据的残余块产生DCT系数。视频解码器可接着应用8点逆DCT-II(IDCT)实施方案以便在数据有极小损耗(即使有)的情况下从DCT-II系数重新建构视频数据的残余块。考虑到视频编码的主要目标为保存数据，所以例如H.264视频译码标准的各种译码标准采用8点DCT的正交实施方案。

虽然正交性通常在理论上为所要的，但视频、音频或通用译码管线在实践中涉及会引入所谓的“噪声”的若干步骤，所述“噪声”在大多数方面实际上阻止准确重新建构由正交8点DCT-II实施方案提供的值。因此，放松正交性质以实现接近正交(其在技术上来说是非正交的)可改善译码效率同时减小实施方案复杂性，代价为原始DCT基函数的近似较不精确。实际上，正交性质将噪声引入到系统中，但可改善译码增益同时还减小实施方案复杂性。

为说明8点DCT-II的接近正交实施方案的实例，作为一个实例，考虑包括控制单元的设备。所述控制单元实施根据本发明中描述的技术的接近正交8点DCT-II。此接近正交8点DCT-II实施方案包括偶数部分，所述偶数部分包含第一及第二内部因子(A、B)及第一经缩放因子(μ)，此与正交实施方案相同。如由上述等式(3)用数学方式表示，所述经缩放因子等于第一内部因子加上第二内部因子的总和除以三乘以常数pie(π)除以八的余弦的第一近似值(α)加上三乘以常数pie(π)除以八的正弦的第二近似值(β)的总和，为便利起见在以下再次重现等式(3)：

μ = \frac{A + B}{α + β} . - - - (3)

在此实例中，接近正交8点DCT-II实施方案还包括奇数部分，所述奇数部分包含第三、第四、第五及第六内部因子(G、D、E、Z)及第二经缩放因子(η)。所述第二经缩放因子等于以下各项中的产生最小误差的项，此关系由上述等式(4)定义，为便利起见在以下重现等式(4)：

η &Element; {\frac{G + D}{γ + δ}, \frac{G + E}{γ + ϵ}, \frac{G + Z}{γ + ζ}, \frac{D + E}{δ + ϵ}, \frac{D + Z}{δ + ζ}, \frac{E + Z}{ϵ + ζ}} . - - - (4)

等式(4)指示第二经缩放因子可等于以下各者中的一者：(1)第三内部因子(G)加上第四内部因子(D)的总和除以常数pie除以十六的余弦的第三近似值(γ)加上常数pie除以十六的正弦的第四近似值(δ)的总和，(2)第三内部因子(G)加上第五内部因子(E)的总和除以第三近似值(γ)加上三乘以常数pie除以16的余弦的第五近似值(ε)的总和，(3)第三内部因子(G)加上第六内部因子(Z)的总和除以第三近似值(γ)加上三乘以常数pie除以16的正弦的第六近似值(ζ)的总和，(4)第四内部因子(D)加上第五内部因子(E)的总和除以第四近似值(δ)加上第五近似值(ε)的总和，(5)第四内部因子(D)加上第六内部因子(Z)的总和除以第四近似值(δ)加上第六近似值(ζ)的总和，及(6)第五内部因子(E)加上第六内部因子(Z)的总和除以第五近似值(ε)加上第六近似值(ζ)的总和。

同样，这些等式可识别类似于上文关于针对正交实施方案所定义的关系而确定的内部因子值的特定内部因子值，但产生不同的外部因子。然而，由于上文提到的原因，不同的外部因子通常不增加实施方案复杂性，而是通常提供与常规8点DCT-II实施方案且甚至在一些情况下与根据本发明的技术所建构的正交8点DCT-II实施方案相比改善的译码增益。因此，控制单元将此接近正交8点DCT-II应用于媒体数据以将媒体数据从空间域变换到频域，结果可能改善译码增益。

图2为更详细地说明图1的视频编码器20的框图。视频编码器20可至少部分地形成为一个或一个以上集成电路装置，其可共同被称作集成电路装置。在一些方面中，视频编码器20可形成无线通信装置手持机或广播服务器的一部分。视频编码器20可执行视频帧内的块的帧内译码及帧间译码。帧内译码依赖于空间预测来减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测来减少或移除视频序列的邻近帧内的视频的时间冗余。对于帧间译码，视频编码器20执行运动估计以追踪在邻近帧之间的匹配的视频块的移动。

如图2中所展示，视频编码器20接收待编码的视频帧内的当前视频块30。在图2的实例中，视频编码器20包括运动估计单元32、参考帧存储装置34、运动补偿单元36、块变换单元38、量化单元40、逆量化单元42、逆变换单元44及熵译码单元46。可应用环路内或环路后解块滤波器(未图示)，以对块滤波以移除块假影。视频编码器20还包括求和器48及求和器50。图2说明用于视频块的帧间译码的视频编码器20的时间预测组件。尽管为易于说明而在图2中未展示，但视频编码器20还可包括用于一些视频块的帧内译码的空间预测组件。

运动估计单元32将视频块30与一个或一个以上邻近视频帧中的块比较以产生一个或一个以上运动向量。可从参考帧存储装置34检索所述邻近帧，所述参考帧存储装置34可包含任何类型的存储器或数据存储装置，以存储从先前编码的块重新建构的视频块。可对具有可变大小(例如，16×16、16×8、8×16、8×8或更小的块大小)的块执行运动估计。运动估计单元32(例如)基于速率失真模型来识别邻近帧中最紧密匹配当前视频块30的一个或一个以上块，且确定在邻近帧中的块与当前视频块之间的位移。在此基础上，运动估计单元32产生一个或一个以上运动向量(MV)，所述一个或一个以上运动向量指示当前视频块30与来自用以译码当前视频块30的参考帧的一个或一个以上匹配块之间的位移的量值及轨迹。所述匹配块将充当预测性(或预测)块，用于待译码的块的帧间译码。

运动向量可具有二分之一或四分之一像素的精度乃至更细的精度，从而允许视频编码器20以比整数像素位置高的精度来追踪运动且获得较好的预测块。在使用具有分数像素值的运动向量时，在运动补偿单元36中进行内插运算。运动估计单元32使用例如速率失真模型的某些准则来识别视频块的最好块分割及一个或一个以上运动向量。举例来说，在双向预测的情况下，可能不只存在运动向量。通过使用所得的块分割及运动向量，运动补偿单元36形成预测视频块。

视频编码器20通过在求和器48处从原始的当前视频块30减去由运动补偿单元36产生的预测视频块来形成残余视频块。块变换单元38应用产生残余变换块系数的变换。如图2中所展示，块变换单元38包括8点DCT-II单元52，其实施根据本发明中描述的技术所建构的8点DCT-II。8点DCT-II单元52表示在一些情况下执行软件的硬件模块(例如，执行软件代码或指令的数字信号处理器或DSP)，所述硬件模块实施具有由上文识别的两种关系中的一者定义的内部因子的8点DCT-II。块变换单元38将经缩放8点DCT-II单元52应用于残余块以产生残余变换系数的8×8块。8点DCT-II单元52通常将残余块从空间域(表示为残余像素数据)变换到频域(表示为DCT系数)。所述变换系数可包含DCT系数，其包括至少一个DC系数及一个或一个以上AC系数。

量化单元40量化(例如，舍位)所述残余变换块系数以进一步减小位速率。如上文所提及，量化单元40通过并入在因子分解期间移除的内部因子来考虑经缩放8点DCT-II单元52的经缩放性质。也就是说，量化单元40并入有下文关于图4的实施方案70所展示的外部因子。由于量化通常涉及乘法，因此将这些因子并入到量化单元40中可能不会增加量化单元40的实施方案复杂性。就此来说，从经缩放8点DCT-II单元52移除因子在不增加量化单元40的实施方案复杂性的情况下，减小DCT-II单元52的实施方案复杂性，从而产生关于视频编码器20的实施方案复杂性的净减小。

熵译码单元46对经量化的系数进行熵译码，以更进一步减小位速率。熵译码单元46执行统计无损译码，在一些情况下被称作熵译码。熵译码单元46为经量化DCT系数的概率分布建模，且基于经建模的概率分布来选择码簿(例如，CAVLC或CABAC)。通过使用此码簿，熵译码单元46以压缩经量化DCT系数的方式来为每一经量化DCT系数选择代码。为进行说明，熵译码单元46可为频繁出现的经量化DCT系数选择短码字(依据位)，且为较不频繁出现的经量化DCT系数选择较长码字(依据位)。只要短码字使用比经量化DCT系数少的位，则平均来说熵译码单元46压缩经量化DCT系数。熵译码单元46输出经熵译码的系数作为发送给视频解码器26的位流。大体来说，如将参考图3的实例来描述，视频解码器26执行逆向操作以从所述位流解码且重新建构经译码的视频。

重新建构单元42及逆变换单元44分别重新建构经量化的系数及应用逆变换以重新建构残余块。逆变换单元44可包括逆DCT(IDCT)，其一般被称作III类型DCT，所述III类型DCT执行8点DCT-II单元52的逆向操作，类似于下文关于图3描述的8点DCT-III单元68。求和单元50将重新建构的残余块加到由运动补偿单元36产生的经运动补偿的预测块以产生重新建构的视频块以供存储于参考帧存储装置34中。所述重新建构的视频块由运动估计单元32及运动补偿单元36用以编码后续视频帧中的块。

图3为更详细地说明图1的视频解码器26的实例的框图。视频解码器26可至少部分地形成为一个或一个以上集成电路装置，其可共同被称作集成电路装置。在一些方面中，视频解码器26可形成无线通信装置手持机的一部分。视频解码器26可执行视频帧内的块的帧内解码及帧间解码。如图3中所展示，视频解码器26接收已由视频编码器20编码的经编码视频位流。在图3的实例中，视频解码器26包括熵解码单元54、运动补偿单元56、重新建构单元58、逆变换单元60及参考帧存储装置62。熵解码单元64可存取存储于存储器64中的一个或一个以上数据结构以获得可用于译码的数据。视频解码器26还可包括对求和器66的输出滤波的环路内解块滤波器(未图示)。视频解码器26还包括求和器66。图3说明用于视频块的帧间解码的视频解码器26的时间预测组件。尽管图3中未展示，但视频解码器26还可包括用于一些视频块的帧内解码的空间预测组件。

熵解码单元54接收经编码的视频位流且从所述位流解码经量化的残余系数及经量化的参数以及其它信息，例如宏块译码模式及运动信息(其可包括运动向量及块分割)。运动补偿单元56接收运动向量及块分割及来自参考帧存储装置62的一个或一个以上重新建构的参考帧以产生预测视频块。

重新建构单元58逆量化(即，解量化)经量化的块系数。逆变换单元60将逆变换(例如，逆DCT)应用于所述系数以产生残余块。更具体来说，逆变换单元60包括经缩放8点DCT-III单元68，逆变换单元60将其应用于所述系数以产生残余块。为图2中所展示的经缩放8点DCT-II单元52的逆向形式的经缩放8点DCT-III单元68可将所述系数从频域变换到空间域以产生残余块。类似于以上的量化单元40，重新建构单元58通过在实施方案复杂性有极小增加(即使有)的情况下将在因子分解期间移除的外部因子并入到重新建构过程中来考虑8点DCT-III单元68的经缩放性质。从经缩放8点DCT-III单元68移除因子可减小实施方案复杂性，借此产生视频解码器26的复杂性的净减小。

接着通过求和器66将预测视频块与残余块求和以形成经解码的块。可应用解块滤波器(未图示)以对经解码的块滤波以移除块假影。接着将经滤波的块放置于参考帧存储装置62中，所述参考帧存储装置62提供参考帧以供解码后续视频帧且还产生经解码的视频以驱动显示装置28(图1)。

图4为说明根据本发明的技术所建构的经缩放8点DCT-II(例如，由图2的实例中所展示的8点DCT-II单元52表示的经缩放8点DCT-II)的一般实施方案的图。在图4的实例中，8点DCT-II实施方案70表示上文所描述的8点DCT-II的正交及接近正交实施方案两者。在此意义上，如下文更详细地指出，可使用相同因子分解过程确定正交及接近正交实施方案两者，正交实施方案与接近正交实施方案之间的差异出现在不同的内部因子及经缩放因子的形式上。虽然关于此示范性实施方案进行描述，但可使用通过不同因子分解过程导出的其它实施方案。因此，本发明的技术不应限于图4的实例。图2的实例中所展示的8点DCT-II单元52可并入有一个或一个以上这些实施方案70。图3的实例中所展示的8点DCT-III单元68可并入有这些实施方案70中的一者或一者以上的逆向实施方案，其中所述逆向实施方案仅颠倒信号路径以使得输入从实施方案70的右侧进入且输出从实施方案70的左侧离开。

如图4的实例中所展示，8点DCT-II实施方案70A包括蝶形单元72、偶数部分74A及奇数部分74B。蝶形单元72可表示用于将输入x₀，...，x₃路由或以其它方式转发到适当的偶数部分74A及奇数部分47B(“部分74”)的硬件或硬件与软件的组合。蝶形单元72通常组合较小DCT(例如，4点DCT-II实施方案)的结果，其在此情况下可分别由偶数部分74A及奇数部分74B表示。偶数部分74A为8点DCT-II实施方案70的输出偶数DCT系数X₀、X₂、X₄及X₆的4×4部分。值得注意的是，偶数系数X₀及X₄乘以为一除以二的平方根的外部因子，所述外部因子可由且通常由量化单元40应用。偶数系数X₂及X₆乘以为一除以mu(μ)的外部因子，所述外部因子同样可且通常并入到量化单元40中且由量化单元40应用。偶数部分74A包括两个外部因子A及B，如下文更详细地描述，所述两个外部因子以两种方式中的一者与mu(μ)相关。

奇数部分74B为8点DCT-II实施方案70的输出奇数DCT系数X₁、X₃、X₅及X₇的4点部分。奇数部分74B包括表示为G、D、E及Z的4个内部因子，同样如下文更详细地描述，所述四个内部因子以两种方式中的一者与应用于奇数DCT系数X₁、X₃、X₅及X₇的经缩放因子eta(η)相关。此外，为一除以二的平方根(1/√2)的外部因子被应用于奇数系数X₁及X₇。为一除以二的平方根的外部因子及为一除以经缩放因子eta的外部因子均可并入到量化单元40中，所述量化单元40通常在不增加视频编码器20的实施方案复杂性的情况下应用这些因子。

对于正交实施方案，可通过首先考虑正交性质来导出等式(1)及(2)中所提到的关系，正交性质由以下等式(5)用数学方式陈述：

C^TC＝I。(5)

在此情况下，变量C指代任何矩阵，而C^T表示矩阵C的转置。变量I表示单位矩阵。因此，如果矩阵的转置乘以矩阵本身等于单位矩阵，则所述矩阵展现出正交性质。

假定由于上文提到的原因在媒体译码实施方案中优选的经缩放矩阵，如以下等式(6)中所指出，矩阵C可被分成表示为C′的整数经缩放变换及比例因子或外部因子的对角矩阵D：

C＝C′D。(6)

用来自等式(6)的C′D替换等式(5)中的C得出以下等式(7)：

(C′D)^T(C′D)＝DC′^TC′D＝I，(7)

其可简化为以下等式(8)中所展示的数学等式：

C′C＝D^-2。(8)

等式(8)提供用于选择缩放因子以使得所得整数变换仍为正交的机制。

举例来说，在8点DCT-II实施方案的情况下，此DCT-II实施方案通常仅应用表示以下各者的因子的近似值：三乘以常数pi除以八的余弦、三乘以常数pi除以八的正弦、常数pi除以十六的余弦、常数pi除以十六的正弦、三乘以常数pi除以十六的余弦，及三乘以常数pi除以十六的正弦。假定将用整数A、B、G、D、E及Z(其为矩阵C′的系数)替换此六个因子且使用以上正交性条件，以上等式(1)表示正规化因子，使得设计8点DCT-II的正交近似的任务可限于找到整数(A、B、G、D、E及Z)，使得以下等式(9)及(10)得到满足：

μ = \sqrt{A^{2} + B^{2}} - - - (9)

η = \sqrt{G^{2} + D^{2}} = \sqrt{E^{2} + Z^{2}} - - - (10)

下表1说明针对整数A及B选择的各个值及实施方案70的偶数部分74A的所得近似误差(与无理DCT-II相比)以及所使用的位的数目。

表1

下表2说明针对整数G、D、E及Z选择的各个值及实施方案70的奇数部分74B的所得近似误差(与无理DCT-II相比)以及所使用的位的数目。

表2

值得注意的是，表1及表2中的前三个解有点不准确，但从第四个解(其中A及B设定为5及12，且G、D、E及Z分别设定为11、3、9及7)开始，所得实施方案70的复杂性增加，但各个余弦及正弦项的近似值的误差小得多。表2的第五行(在标题行后面)中的第五个解在近似误差方面大约等于表2的第六行的解。表2的第七行及第八行中列出的第七个解及第八个解展现出极低的近似误差。根据表1及表2，可尝试内部因子A、B、G、D、E及Z的若干不同组合以使实施方案70适合于特定用途。值得注意的组合包括：为(1、2)、(2、5)或(3、7)的(A、B)值结合为(I1、3、9、7)及(19、4、16、11)的(G、D、E、Z)值中的一者。就此来说，本发明中描述的技术促进增加的译码增益，而复杂性仅有较小的增加，其中实施方案70并入有内部因子A、B、G、D、E及Z的值的以上组合中的一者或一者以上以提供可能改善的译码增益，而实施方案复杂性有最小的增加。

对于接近正交实施方案，可通过首先考虑以下情况来导出等式(3)及(4)中所提到的关系：虽然正交性在理论上通常确保8点DCT-II的直接逆向实施方案，但在实践中大部分比例因子(在整数变换之后)变成无理数，其难以使用整数乘法器精确地实施。此外，量化通常在8点DCT变换的应用之后且此量化新增噪声，其可阻止逆正交DCT-II实施方案的直接应用。此外，保持正交性实际上可使这些正交实施方案的近似关于原始DCT-II基函数较不精确。因此，放松直接实施方案与逆向实施方案之间的此正交性失配的程度实际上可改善译码增益。

为表征失配的程度，根据以下等式(11)定义离单位矩阵的距离的范数：

‖C^TC-I‖。(11)

使用与上文关于等式(5)的标记法相同的标记法，等式(11)简单地指示离单位矩阵的距离的范数可定义为矩阵的转置乘以矩阵减去单位矩阵。假定C^TC仍为对角的，则可根据以下等式(12)来计算平均绝对距离：

δ_{N} = \frac{1}{N} tr (| C^{T} C - I |), - - - (12)

其中平均绝对距离由变量δ_N表示，且N等于矩阵的大小。

通过放松正交性性质，译码增益可改善，但关于平均绝对差的对译码增益的分析过于取决于经历压缩的图像的特定模型或统计数据。因此，可经由分析与找到在匹配DCT-II的基函数方面可能最好的整数变换有关的不同量度来确定放松正交性性质的程度。关于此形式的评估的更多信息可在由Y·A·瑞兹尼克(Y.A.Reznik)、A·T·海因兹(A.T.Hinds)及J·L·米歇尔(J.L.Mitchell)创作的题为“借助于公因子改善定点算法的精度(Improved Precision of Fixed-Point Algorithms by Means of Common Factors)”(ICIP2008(加州圣地亚哥市)的会刊)的文章中找到，其全部内容以引用方式并入本文中，就如同本文中完全陈述一样。

根据此并入的参考文献，用于产生最好匹配设计的一种技术被称作“基于公因子的近似”。使用此种技术，可导出等式(3)及(4)，为便利起见在以下重现等式(3)及(4)两者：

μ = \frac{A + B}{α + β}, - - - (3)

η &Element; {\frac{G + D}{γ + δ}, \frac{G + E}{γ + ϵ}, \frac{G + Z}{γ + ζ}, \frac{D + E}{δ + ϵ}, \frac{D + Z}{δ + ζ}, \frac{E + Z}{ϵ + ζ}} . - - - (4)

下表3说明针对整数A及B选择的各个值及所得近似误差。

表3

下表4说明针对整数G、D、E及Z选择的各个值及与无理DCT-II相比的所得近似误差。

表4

在表4中，给通过使用公因子方法而变得对称的误差对加下划线。这些对称误差表示针对变换的奇数部分中的四个内部因子的集合找到的最坏情况近似误差。

下表5说明基于所使用的位的数目的对正交实施方案70与接近正交或非正交实施方案70的最坏情况精度的比较。

表5

如表5中所见，DCT-II的所有非正交实施方案具有比对应的正交实施方案低的最坏情况误差，尤其是三位非正交实施方案与三位正交实施方案相比。此三位非正交实施方案除了经由无理DCT-II因子的最好近似而提供增加的译码增益外，还需要甚至与在H.264视频译码标准中规定的8点DCT-II相比来说较不复杂的数学运算。

虽然在上文描述为线性或1维DCT，但本发明中描述的8点DCT实施方案可表示为如下表6中所展示的8×8DCT-II矩阵。视参数A、B、G、D、E及Z的选择而定，若干矩阵系数可变大，从而导致在执行乘以这些大值的乘法所需的运算方面增加的实施方案复杂性。为移除这些大值及跨变换的平衡动态范围，可在乘法之后将右移位引入到实施方案中。在一些情况下，右移位可将值向右移位任意正整数，其中一个实例约束为，用于参数A与B的右移位相同。类似地，用于G、D、E及Z的向右移位可能也需要相同。右移位将这些整数参数转换成二元有理数，其为具有为二的幂的分母的有理数。通常，右移位使变换的准确性减小，且因此，通常希望保持这些右移位为最小值。也可将输入样本预先向左移位一常数以最小化由右移位引起的准确性损失。典型实例为，针对A及B，右移位一，且针对G、D、E及Z，右移位4。

表6：8×8DCT-II矩阵

1

E+Z

D+G

G-D

-Z+E

Z-E

-G+D

-D-G

-E-Z

B

A

-A

-B

-A

A

B

E

-D

-G

-Z

Z

G

D

-E

1

-1

1

-1

1

Z

-G

D

E

-E

-D

G

-Z

A

-B

B

-A

B

-B

A

-Z+E

-G+D

D+G

-E-Z

E+Z

-D-G

G-D

Z-E

虽然在图4的实例中关于DCT-II单元来进行描述，但此DCT-II单元也可表示根据本发明的技术所建构的IDCT。由图4的实例中所展示的实施方案形成逆DCT涉及颠倒输入与输出，以使得输入由图4的右侧上的实施方案接收且输出是在实施方案的左侧输出。换句话说，关于垂直存取反转所述实施方案以使得输入接着变成输出且输出变成输入将通常产生IDCT实施方案。为易于说明且考虑到由DCT形成IDCT在此项技术中是众所周知的，未在单独的图中展示这些额外IDCT实施方案。

图5为说明译码装置(例如，图2的视频编码器20)在应用根据本发明的技术所建构的8点DCT实施方案时的示范性操作的流程图。首先，视频编码器20接收待译码的视频帧内的当前视频块30(90)。运动估计单元32执行运动估计以将视频块30与一个或一个以上邻近视频帧中的块比较以产生一个或一个以上运动向量(92)。可从参考帧存储装置34检索所述邻近帧。可对具有可变大小(例如，16×16、16×8、8×16、8×8、4×4或更小的块大小)的块执行运动估计。运动估计单元32(例如)基于速率失真模型来识别邻近帧中最紧密匹配当前视频块30的一个或一个以上块，且确定在相邻帧中的块与当前视频块之间的位移。在此基础上，运动估计单元32产生一个或一个以上运动向量(MV)，所述一个或一个以上运动向量指示在当前视频块30与来自用以译码当前视频块30的参考帧的一个或一个以上匹配块之间的位移的量值及轨迹。所述匹配块将充当预测性(或预测)块以便对待译码的块进行帧间译码。

运动向量可具有二分之一或四分之一像素的精度乃至更细的精度，从而允许视频编码器20以比整数像素位置高的精度来追踪运动且获得较好的预测块。在使用具有分数像素值的运动向量时，在运动补偿单元36中进行内插运算。运动估计单元32使用例如速率失真模型的某些准则识别视频块的最好块分割及运动向量。举例来说，在双向预测的情况下，可能不只存在运动向量。通过使用所得的块分割及运动向量，运动补偿单元36形成预测视频块(94)。

视频编码器20通过在求和器48处从原始的当前视频块30减去由运动补偿单元36产生的预测视频块来形成残余视频块(96)。块变换单元38应用产生残余变换块系数的变换。块变换单元38包括根据本发明中描述的技术而产生的8点DCT-II单元52。块变换单元38将经缩放8点DCT-II单元52应用于残余块以产生残余变换系数的8×8块。8点DCT-II单元52通常将残余块从空间域(表示为残余像素数据)变换到频域(表示为DCT系数)。以此方式，8点DCT-II单元52将上文所描述的8点DCT-II的实施方案应用于残余数据以确定DCT系数(98)。所述变换系数可包含DCT系数，其包括至少一个DC系数及一个或一个以上AC系数。

量化单元40量化(例如，舍位)残余变换块系数，以进一步减小位速率(100)。如上文所提及，量化单元40通过并入在因子分解期间移除的内部因子来考虑经缩放8点DCT-II单元52的经缩放性质。也就是说，量化单元40并入有上文关于图4的实施方案70所提到的外部因子。由于量化通常涉及乘法，因此将这些因子并入到量化单元40中可能不会增加量化单元40的实施方案复杂性。就此来说，从经缩放8点DCT-II单元52移除因子在不增加量化单元40的实施方案复杂性的情况下减小DCT-II单元52的实施方案复杂性，从而产生关于视频编码器20的实施复杂性的净减小。

熵译码单元46对经量化的系数进行熵译码以更进一步减小位速率。熵译码单元46执行统计无损译码(在一些情况下被称作熵译码)以产生经译码位流(102)。熵译码单元46为经量化DCT系数的概率分布建模，且基于经建模的概率分布来选择码簿(例如，CAVLC或CABAC)。通过使用此码簿，熵译码单元46以压缩经量化DCT系数的方式来为每一经量化DCT系数选择代码。熵译码单元46输出经熵译码的系数作为存储到存储器或存储装置及/或发送到视频解码器26的经译码位流(104)。

重新建构单元42及逆变换单元44分别重新建构经量化的系数及应用逆变换以重新建构残余块。此外，逆变换单元44可包括逆DCT(IDCT)，其一般被称作III类型DCT，所述III类型DCT执行8点DCT-II单元52的逆向操作，类似于下文关于图3描述的8点DCT-III单元68。求和单元50将重新建构的残余块加到由运动补偿单元36产生的经运动补偿的预测块以产生重新建构的视频块，以供存储于参考帧存储装置34中。重新建构的视频块由运动估计单元32及运动补偿单元36用以编码后续视频帧中的块。

图6为说明译码装置(例如，图3的视频解码器26)在应用根据本发明的技术所建构的8点DCT-III实施方案时的实例操作的流程图。视频解码器26接收已由视频编码器20编码的经编码视频位流。确切地说，熵解码单元54接收经编码的视频位流，且从所述位流解码经量化的残余系数及经量化的参数，以及其它信息，例如，宏块译码模式及运动信息(其可包括运动向量及块分割)(106、108)。运动补偿单元56接收运动向量及块分割及来自参考帧存储装置62的一个或一个以上重新建构的参考帧以产生预测视频块(110)。

重新建构单元58逆量化(即，解量化)经量化的块系数(112)。逆变换单元60向所述系数应用逆变换(例如，逆DCT)以产生残余块。更具体来说，逆变换单元60包括经缩放8点DCT-III单元68，所述逆变换单元60将其应用于所述系数以产生残余块(114)。图2中所展示的经缩放8点DCT-II单元52的逆向形式的经缩放8点DCT-III单元68可将所述系数从频域变换到空间域以产生残余块。类似于以上的量化单元40，重新建构单元58通过在实施方案复杂性有极小增加(即使有)的情况下将在因子分解期间移除的外部因子并入到重新建构过程中来考虑8点DCT-III单元68的经缩放性质。从经缩放8点DCT-III单元68移除因子可减小实施方案复杂性，借此产生视频解码器26的复杂性的净减小。

接着通过求和器66将预测视频块与残余块求和以形成经解码的块(116)。可应用解块滤波器(未图示)以对经解码的块滤波以移除块假影。接着将经滤波的块放置于参考帧存储装置62中，所述参考帧存储装置62提供参考帧以供解码后续视频帧且还产生经解码的视频以驱动显示装置(例如，图1的显示装置28)(118)。

本发明的技术可实施于广泛多种装置或设备中，包括无线通信装置手持机(例如，移动电话)、集成电路(IC)或一组IC(即，芯片组)。已描述经提供以强调功能方面的任何组件、模块或单元且其未必需要通过不同硬件单元来实现。还可以硬件或硬件、软件、固件的任何组合来实施本文中所描述的技术。描述为模块、单元或组件的任何特征可一起实施于集成式逻辑装置中或单独实施为离散但可共同操作的逻辑装置。在一些状况下，可将各种特征实施为集成电路装置(例如，集成电路芯片或芯片组)。

如果以软件来实施，则可至少部分地通过包含指令的计算机可读媒体来实现所述技术，当在处理器中执行时，所述指令执行上文所描述的方法中的一者或一者以上。所述计算机可读媒体可包含为物理非暂时性结构的计算机可读存储媒体，且可形成可包括封装材料的计算机程序产品的一部分。所述计算机可读存储媒体可包含例如同步动态随机存取存储器(SDRAM)的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、闪存、磁性或光学数据存储媒体及其类似者。

可由一个或一个以上处理器如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)，或其它等效集成或离散逻辑电路来执行代码或指令。因此，如本文中所使用，术语“处理器”可指代前述结构中的任一者或适合于实施本文中所描述的技术的任何其它结构。另外，在一些方面中，本文中所描述的功能性可提供于为编码及解码而配置的专用软件模块或硬件模块内，或并入于组合的视频编解码器中。又，所述技术可完全实施于一个或一个以上电路或逻辑元件中。

本发明还涵盖多种集成电路装置中的任一者，其包括用以实施本发明中所描述的技术中的一者或一者以上的电路。可将此电路提供于单一集成电路芯片中或提供于所谓的芯片组中的多个可共同操作的集成电路芯片中。可将这些集成电路装置用于多种应用中，所述应用中的一些应用可包括在无线通信装置(例如，移动电话手持机)中的使用。

已描述所述技术的各种方面。这些及其它方面在所附权利要求书的范畴内。

Claims

1.一种方法，其包含：

用译码装置接收经译码媒体数据；及

用所述译码装置的8点逆离散余弦变换IDCT硬件单元执行8点IDCT，以将所述接收到的经译码媒体数据从频域变换到空间域，其中所述8点IDCT硬件单元包括：

偶数部分，其包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述第一经缩放因子等于所述第一内部因子的平方加上所述第二内部因子的平方的总和的平方根；及

奇数部分，其包含根据第二关系与第二经缩放因子(η)相关的第三、第四、第五及第六内部因子(G、D、E、Z)，

其中所述第二关系经定义以使得所述第二经缩放因子等于所述第三内部因子的平方加上所述第四内部因子的平方的总和的平方根，且

其中所述第二关系还经定义以使得所述第二经缩放因子等于所述第五内部因子的平方加上所述第六内部因子的平方的总和的平方根。

2.根据权利要求1所述的方法，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为三，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为七。

3.根据权利要求1所述的方法，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为十九，

其中所述第四内部因子D设定为四，

其中所述第五内部因子E设定为十六，且

其中所述第六内部因子Z设定为十一。

4.根据权利要求1所述的方法，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为三，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为七。

5.根据权利要求1所述的方法，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为十九，

其中所述第四内部因子D设定为四，

其中所述第五内部因子E设定为十六，且

其中所述第六内部因子Z设定为十一。

6.根据权利要求1所述的方法，

其中所述第一内部因子A设定为三，

其中所述第二内部因子B设定为七，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为三，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为七。

7.根据权利要求1所述的方法，

其中所述第一内部因子A设定为三，

其中所述第二内部因子B设定为七，

其中所述第三内部因子G设定为十九，

其中所述第四内部因子D设定为四，

其中所述第五内部因子E设定为十六，且

其中所述第六内部因子Z设定为十一。

8.根据权利要求1所述的方法，其进一步包含用逆量化单元将所述第一经缩放因子及所述第二经缩放因子(μ、η)应用于所述经译码媒体数据的一个或一个以上经量化DCT系数以确定DCT系数。

9.根据权利要求1所述的方法，其中所述8点IDCT硬件单元包含处理器，所述处理器执行用以实施所述8点IDCT的软件。

10.根据权利要求1所述的方法，

其中所述内部因子A、B、G、D、E及Z经正规化以使得这些内部因子变成二元有理数值，

其中用以正规化所述内部因子A及B的第一分母为二的一次幂，且

其中用以正规化所述接口因子G、D、E及Z的第二分母为二的二次幂。

11.一种设备，其包含：

8点逆离散余弦变换IDCT硬件单元，其将经译码媒体数据从频域变换到空间域，其中所述8点IDCT硬件单元包括：

12.根据权利要求11所述的设备，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为三，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为七。

13.根据权利要求11所述的设备，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为十九，

其中所述第四内部因子D设定为四，

其中所述第五内部因子E设定为十六，且

其中所述第六内部因子Z设定为十一。

14.根据权利要求11所述的设备，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为三，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为七。

15.根据权利要求11所述的设备，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为十九，

其中所述第四内部因子D设定为四，

其中所述第五内部因子E设定为十六，且

其中所述第六内部因子Z设定为十一。

16.根据权利要求11所述的设备，

其中所述第一内部因子A设定为三，

其中所述第二内部因子B设定为七，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为三，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为七。

17.根据权利要求11所述的设备，

其中所述第一内部因子A设定为三，

其中所述第二内部因子B设定为七，

其中所述第三内部因子G设定为十九，

其中所述第四内部因子D设定为四，

其中所述第五内部因子E设定为十六，且

其中所述第六内部因子Z设定为十一。

18.根据权利要求11所述的设备，其进一步包含逆量化单元，所述逆量化单元将所述第一经缩放因子及所述第二经缩放因子(μ、η)应用于所述经译码媒体数据的一个或一个以上经量化DCT系数以确定DCT系数。

19.根据权利要求11所述的设备，其中所述8点IDCT硬件单元包含处理器，所述处理器执行用以实施所述正交8点IDCT的软件。

20.根据权利要求11所述的设备，

21.一种装置，其包含：

用于接收经译码媒体数据的装置；及

用于执行8点逆离散余弦变换IDCT以将所述接收到的经译码媒体数据从频域变换到空间域的装置，其中所述用于执行所述8点IDCT的装置包括：

22.根据权利要求21所述的装置，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为三，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为七。

23.根据权利要求21所述的装置，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为十九，

其中所述第四内部因子D设定为四，

其中所述第五内部因子E设定为十六，且

其中所述第六内部因子Z设定为十一。

24.根据权利要求21所述的装置，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为三，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为七。

25.根据权利要求21所述的装置，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为十九，

其中所述第四内部因子D设定为四，

其中所述第五内部因子E设定为十六，且

其中所述第六内部因子Z设定为十一。

26.根据权利要求21所述的装置，

其中所述第一内部因子A设定为三，

其中所述第二内部因子B设定为七，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为三，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为七。

27.根据权利要求21所述的装置，

其中所述第一内部因子A设定为三，

其中所述第二内部因子B设定为七，

其中所述第三内部因子G设定为十九，

其中所述第四内部因子D设定为四，

其中所述第五内部因子E设定为十六，且

其中所述第六内部因子Z设定为十一。

28.根据权利要求21所述的装置，其进一步包含用于将所述第一经缩放因子及所述第二经缩放因子(μ、η)应用于所述经译码媒体数据的一个或一个以上DCT系数以确定DCT系数的装置。

29.根据权利要求21所述的装置，

30.一种非暂时性计算机可读存储媒体，其包含使处理器执行以下操作的指令：

用译码装置接收经译码媒体数据；及

用所述译码装置的8点逆离散余弦变换IDCT硬件单元执行8点IDCT以将所述接收到的经译码媒体数据从频域变换到空间域，其中所述8点IDCT硬件单元包括：

31.一种方法，其包含：

用译码装置接收经译码媒体数据；及

用所述译码装置的8点逆离散余弦变换IDCT硬件单元执行8点IDCT以将所述经译码媒体数据从频域变换到空间域，其中所述8点IDCT硬件单元包括：

偶数部分，其包含根据第一关系与第一经缩放因子(μ)相关的第一及第二内部因子(A、B)，其中所述第一关系经定义以使得所述经缩放因子等于所述第一内部因子加上所述第二内部因子的总和除以三乘以常数pi(π)除以八的余弦的第一近似值(α)加上三乘以所述常数pi(π)除以八的正弦的第二近似值(β)的总和；及

其中所述第二关系经定义以使得所述第二经缩放因子等于以下等式中的产生最小误差的等式：

(1)所述第三内部因子(G)加上所述第四内部因子(D)的总和除以所述常数pi除以十六的余弦的第三近似值(γ)加上所述常数pi除以十六的正弦的第四近似值(δ)的总和；

(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和；

(3)所述第三内部因子(G)加上所述第六内部因子(Z)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的正弦的第六近似值(ζ)的总和；

(4)所述第四内部因子(D)加上所述第五内部因子(E)的总和除以所述第四近似值(δ)加上所述第五近似值(ε)的总和；

(5)所述第四内部因子(D)加上所述第六内部因子(Z)的总和除以所述第四近似值(δ)加上所述第六近似值(ζ)的总和；及

(6)所述第五内部因子(E)加上所述第六内部因子(Z)的总和除以所述第五近似值(ε)加上所述第六近似值(ζ)的总和。

32.根据权利要求31所述的方法，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为五，

其中所述第四内部因子D设定为一，

其中所述第五内部因子E设定为四，且

其中所述第六内部因子Z设定为三。

33.根据权利要求31所述的方法，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为二，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为六。

34.根据权利要求31所述的方法，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为五，

其中所述第四内部因子D设定为一，

其中所述第五内部因子E设定为四，且

其中所述第六内部因子Z设定为三。

35.根据权利要求31所述的方法，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为二，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为六。

36.根据权利要求31所述的方法，

其中所述第一内部因子A设定为五，

其中所述第二内部因子B设定为十二，

其中所述第三内部因子G设定为五，

其中所述第四内部因子D设定为一，

其中所述第五内部因子E设定为四，且

其中所述第六内部因子Z设定为三。

37.根据权利要求31所述的方法，

其中所述第一内部因子A设定为五，

其中所述第二内部因子B设定为十二，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为二，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为六。

38.根据权利要求31所述的方法，其进一步包含用逆量化单元将所述第一经缩放因子及所述第二经缩放因子(μ、η)应用于所述经译码媒体数据的一个或一个以上经量化DCT系数以确定DCT系数。

39.根据权利要求31所述的方法，其中所述8点IDCT硬件单元包含处理器，所述处理器执行用以实施所述8点IDCT的软件。

40.根据权利要求31所述的方法，

41.一种设备，其包含：

42.根据权利要求41所述的设备，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为五，

其中所述第四内部因子D设定为一，

其中所述第五内部因子E设定为四，且

其中所述第六内部因子Z设定为三。

43.根据权利要求41所述的设备，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为二，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为六。

44.根据权利要求41所述的设备，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为五，

其中所述第四内部因子D设定为一，

其中所述第五内部因子E设定为四，且

其中所述第六内部因子Z设定为三。

45.根据权利要求41所述的设备，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为二，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为六。

46.根据权利要求41所述的设备，

其中所述第一内部因子A设定为五，

其中所述第二内部因子B设定为十二，

其中所述第三内部因子G设定为五，

其中所述第四内部因子D设定为一，

其中所述第五内部因子E设定为四，且

其中所述第六内部因子Z设定为三。

47.根据权利要求41所述的设备，

其中所述第一内部因子A设定为五，

其中所述第二内部因子B设定为十二，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为二，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为六。

48.根据权利要求41所述的设备，其进一步包含逆量化单元，所述逆量化单元将所述第一经缩放因子及所述第二经缩放因子(μ、η)应用于所述经译码媒体数据的一个或一个以上经量化DCT系数以确定经量化DCT系数。

49.根据权利要求41所述的设备，其中所述8点IDCT硬件单元包含处理器，所述处理器执行用以实施所述8点IDCT的软件。

50.根据权利要求41所述的设备，

51.一种设备，其包含：

用于接收经译码媒体数据的装置；及

用于执行8点逆离散余弦变换IDCT以将所述经译码媒体数据从频域变换到空间域的装置，其中所述用于执行所述8点IDCT的装置包括：

(2)所述第三内部因子(G)加上所述第五内部因子(E)的总和除以所述第三近似值(γ)加上三乘以所述常数pi除以16的余弦的第五近似值(ε)的总和，

52.根据权利要求51所述的设备，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为五，

其中所述第四内部因子D设定为一，

其中所述第五内部因子E设定为四，且

其中所述第六内部因子Z设定为三。

53.根据权利要求51所述的设备，

其中所述第一内部因子A设定为一，

其中所述第二内部因子B设定为二，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为二，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为六。

54.根据权利要求51所述的设备，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为五，

其中所述第四内部因子D设定为一，

其中所述第五内部因子E设定为四，且

其中所述第六内部因子Z设定为三。

55.根据权利要求51所述的设备，

其中所述第一内部因子A设定为二，

其中所述第二内部因子B设定为五，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为二，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为六。

56.根据权利要求51所述的设备，

其中所述第一内部因子A设定为五，

其中所述第二内部因子B设定为十二，

其中所述第三内部因子G设定为五，

其中所述第四内部因子D设定为一，

其中所述第五内部因子E设定为四，且

其中所述第六内部因子Z设定为三。

57.根据权利要求51所述的设备，

其中所述第一内部因子A设定为五，

其中所述第二内部因子B设定为十二，

其中所述第三内部因子G设定为十一，

其中所述第四内部因子D设定为二，

其中所述第五内部因子E设定为九，且

其中所述第六内部因子Z设定为六。

58.根据权利要求51所述的设备，其进一步包含用于将所述第一经缩放因子及所述第二经缩放因子(μ、η)应用于所述经译码媒体数据的一个或一个以上DCT系数以确定DCT系数的装置。

59.根据权利要求51所述的设备，

60.一种非暂时性计算机可读存储媒体，其包含使处理器执行以下操作的指令：

接收经译码媒体数据；及

用8点逆离散余弦变换IDCT硬件单元执行8点IDCT以将所述经译码媒体数据从频域变换到空间域，其中所述8点IDCT硬件单元包括：