CN102804172A - 用于媒体数据译码的16点变换 - Google Patents

用于媒体数据译码的16点变换 Download PDF

Info

Publication number
CN102804172A
CN102804172A CN2010800276539A CN201080027653A CN102804172A CN 102804172 A CN102804172 A CN 102804172A CN 2010800276539 A CN2010800276539 A CN 2010800276539A CN 201080027653 A CN201080027653 A CN 201080027653A CN 102804172 A CN102804172 A CN 102804172A
Authority
CN
China
Prior art keywords
idct
unit
dct
interior factor
carry out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800276539A
Other languages
English (en)
Inventor
尤里娅·列兹尼克
拉詹·L·乔希
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN102804172A publication Critical patent/CN102804172A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Discrete Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Image Processing (AREA)

Abstract

大体来说,本发明描述用于实施16点逆离散余弦变换IDCT的技术,所述16点IDCT能够应用具有不同大小的多个IDCT。举例来说,包含16点II类型逆离散余弦变换IDCT-II单元的设备可实施这些技术。所述16点IDCT-II单元执行具有不同大小的这些IDCT-II以将数据从空间域变换到频域。所述16点IDCT-II单元包括执行IDCT-II中大小为8的一者的8点IDCT-II单元及执行IDCT-II中大小为4的一者的第一4点IDCT-II单元。所述8点IDCT-II单元包括所述第一4点DCT-II单元。所述16点IDCT-II单元还包含逆8点DCT-IV单元,所述逆8点DCT-IV单元包括第二4点IDCT-II单元及第三4点IDCT-II单元。所述第二4点IDCT-II单元及所述第三4点IDCT-II单元中的每一者执行IDCT-II中大小为4的一者。

Description

用于媒体数据译码的16点变换
本申请案主张2009年6月24日申请的第61/219,885号美国临时申请案的权利,所述申请案的全部内容以引用的方式并入本文中。
本专利申请案与以下共同待决的美国专利申请案有关:
16-POINT TRANSFORM FOR MEDIA DATA CODING(用于媒体数据译码的16点变换),其具有代理人案号第092241U2号、与此同时申请、转让给本发明的受让人且以引用的方式明确地并入本文中。
技术领域
本发明涉及数据压缩,且更确切地说涉及包含变换的数据压缩。
背景技术
数据压缩广泛用于多种应用中以减少对数据存储空间、传输带宽或两者的消耗。数据压缩的实例应用包括可见或可听媒体数据译码,例如数字视频译码、图像译码、语音译码及音频译码。数字视频译码(例如)用于广泛范围的装置中,所述装置包括数字电视、数字直接广播系统、无线通信装置、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、数字相机、数字记录装置、视频游戏装置、蜂窝式或卫星无线电电话或其类似者。数字视频装置实施例如MPEG-2、MPEG-4或H.264/MPEG-4高级视频译码(AVC)的视频压缩技术,以更有效地传输及接收数字视频。
视频压缩技术可执行空间预测、运动估计及运动补偿以减少或移除视频数据中所固有的冗余。确切地说,帧内译码依赖于空间预测以减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除邻近帧内的视频中的时间冗余。对于帧间译码来说,视频编码器执行运动估计以追踪两个或两个以上邻近帧之间的匹配视频块的移动。运动估计产生运动向量,所述运动向量指示视频块相对于一个或一个以上参考帧中的对应视频块的位移。运动补偿使用运动向量以从参考帧产生预测视频块。在运动补偿之后,通过从原始视频块减去预测视频块而形成残余视频块。
视频编码器接着应用变换,接着应用量化及无损统计译码过程,以进一步降低由视频译码过程产生的残余块的位速率。在一些例子中,所应用的变换包含离散余弦变换(DCT)。通常,将DCT应用于大小为2的幂的视频块,例如为16个像素高×16个像素宽的视频块(其常常称为“16×16视频块”)。这些DCT可因此称为16点DCT,因为这些DCT应用于16×16视频块以产生16点DCT系数阵列。通过将16点DCT应用于残余块所产生的16点DCT系数阵列接着经历量化及无损统计译码过程(通常称为“熵译码”过程)以产生位流。统计译码过程的实例包括上下文自适应可变长度译码(CAVLC)或上下文自适应二进制算术译码(CABAC)。视频解码器接收经编码位流且执行无损解码以解压缩用于块中的每一者的残余信息。使用残余信息及运动信息,视频解码器重新建构经编码视频。
发明内容
大体来说,本发明是针对用于使用16点离散余弦变换(DCT)的实施方案来译码数据(例如,媒体数据)的技术,所述16点DCT不仅能够执行16点DCT而且能够执行具有不同大小的多个不同DCT。作为一个实例,根据本发明的技术建构的16点DCT实施方案执行大小为16的DCT,且包括执行大小为8的DCT的至少一个8点DCT实施方案及执行大小为4的DCT的至少一个DCT实施方案。在另一实例中,根据本发明的技术建构的16点DCT实施方案执行大小为16的线性DCT,且包括执行大小为8的线性DCT的至少一个8点DCT实施方案及各自执行大小为4的线性DCT的至少两个4点DCT实施方案,所述4点DCT实施方案可彼此同时操作。此外,8点DCT实施方案可包括执行大小为4的另一线性DCT的又一4点DCT实施方案,所述又一4点DCT实施方案可与由所述至少两个4点DCT实施方案执行的4点DCT同时操作。因此,根据本发明的技术建构的16点DCT实施方案可并入有具有变化的大小的多个不同DCT实施方案,与由单独的16点DCT实施方案、8点DCT实施方案及4点DCT实施方案中的每一者按照惯例消耗的芯片面积相比,其可消耗显著更小的芯片面积。
这些线性DCT可通过首先在沿块的一个方向上(例如,沿水平轴)应用这些线性DCT中的一者且接着在沿块的另一方向上(例如,沿垂直轴)加以应用而应用于具有任何给定大小的视频块。通过以此方式应用这些线性DCT,可应用具有变化的大小的DCT。举例来说,取决于基础视频块的大小,可在一个方向上应用16点DCT且可在另一方向上应用8点DCT以有效地应用16×8DCT或8点DCT。以此方式,可应用线性DCT以执行大小为16、16×8、8×16、8×8、8×4、4×8的DCT或上述具有线性大小的DCT的任何其它组合。
在一个方面中,一种设备包含II类型16点离散余弦变换(DCT-II)单元,所述16点DCT-II单元执行具有不同大小的多个DCT-II,所述DCT-II将内容数据从空间域变换到频域。所述16点DCT-II单元包括执行所述多个DCT-II中大小为8的一者的8点DCT-II单元及执行所述多个DCT-II中大小为4的一者的第一4点DCT-II单元。所述8点DCT-II单元包括所述第一4点DCT-II单元。所述16点DCT-II单元还包括一包含第二4点DCT-II单元及第三4点DCT-II单元的8点DCT-IV单元,其中所述第二4点DCT-II单元及所述第三4点DCT-II单元中的每一者执行所述多个DCT-II中大小为4的一者。
在另一方面中,一种方法包含:通过译码装置接收内容数据;及通过所述译码装置内所包括的16点DCT-II单元来执行多个II类型离散余弦变换(DCT-II)中的一者或一者以上,所述DCT-II将所述所接收的内容数据从空间域变换到频域。所述16点DCT-II单元包括:至少一个8点DCT-II单元,其用以执行所述多个DCT-II中大小为8的一者;一第一4点DCT-II单元,其用以执行所述多个经缩放DCT-II中大小为4的一者;及一8点DCT-IV单元,其包含第二4点DCT-II单元及第三4点DCT-II单元,其中所述第二4点DCT-II单元及所述第三4点DCT-II单元中的每一者执行所述多个经缩放DCT-II中大小为4的一者。
在另一方面中,一种非暂时性计算机可读存储媒体包含指令,所述指令在执行时使得处理器通过译码装置接收内容数据及通过所述译码装置内所包括的16点DCT-II单元来执行多个II类型离散余弦变换(DCT-II)中的一者或一者以上,所述DCT-II将所述所接收的内容数据从空间域变换到频域。所述16点DCT-II单元包括:至少一个8点DCT-II单元,其用以执行所述多个DCT-II中大小为8的一者;一第一4点DCT-II单元,其用以执行所述多个经缩放DCT-II中大小为4的一者;及一8点DCT-IV单元,其包含第二4点DCT-II单元及第三4点DCT-II单元,其中所述第二4点DCT-II单元及所述第三4点DCT-II单元中的每一者执行所述多个经缩放DCT-II中大小为4的一者。
在另一方面中,一种装置包含用于接收内容数据的装置及用于执行多个II类型离散余弦变换(DCT-II)中的一者或一者以上的装置,所述DCT-II将所述所接收的内容数据从空间域变换到频域。所述用于执行多个DCT-II中的所述一者或一者以上的装置包括:用于执行所述多个DCT-II中大小为8的一者的装置;用于执行所述多个经缩放DCT-II中大小为4的第一者的第一装置,其中所述用于执行所述多个DCT-II中大小为8的一者的装置包含所述用于执行所述多个经缩放DCT-II中大小为4的一者的第一装置;用于执行所述多个DCT-II中大小为4的第二者的第二装置;及用于执行所述多个经缩放DCT-II中大小为4的第三者的第三装置。
在另一方面中,一种设备包含16点逆离散余弦变换(IDCT)单元,所述16点IDCT单元执行具有不同大小的多个IDCT,所述IDCT将内容数据从频域变换到空间域。所述16点IDCT单元包括:8点IDCT单元,其执行所述多个IDCT中大小为8的一者;4点IDCT单元,其执行所述多个IDCT中大小为4的一者,其中所述8点IDCT单元包括所述4点IDCT单元;及逆8点DCT-IV单元,其包含第二4点IDCT单元及第三4点IDCT单元,所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者执行所述多个IDCT中大小为4的一者。
在另一方面中,一种方法包含:通过译码装置接收内容数据;及通过所述译码装置内所包括的16点IDCT单元来执行多个逆离散余弦变换(IDCT)中的一者或一者以上,所述IDCT将所述所接收的内容数据从空间域变换到频域。所述16点IDCT单元包括:至少一个8点IDCT单元,其用以执行所述多个IDCT中大小为8的一者;一第一4点IDCT单元,其用以执行所述多个IDCT中大小为4的一者,其中所述至少一个8点IDCT单元包括所述第一4点IDCT单元;及一逆8点DCT-IV单元,其包含第二4点IDCT单元及第三4点IDCT单元,所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者执行所述多个IDCT中大小为4的一者。
在另一方面中,一种非暂时性计算机可读存储媒体包含指令,所述指令在执行时使得处理器通过译码装置接收内容数据及通过所述译码装置内所包括的16点IDCT单元来执行多个逆离散余弦变换(IDCT)中的一者或一者以上,所述IDCT将所述所接收的内容数据从空间域变换到频域。所述16点IDCT单元包括:至少一个8点IDCT单元,其用以执行所述多个IDCT中大小为8的一者;一第一4点IDCT单元,其用以执行所述多个经缩放IDCT中大小为4的一者,其中所述至少一个8点IDCT单元包括所述第一4点IDCT单元;及一逆8点DCT-IV单元,其包含第二4点IDCT单元及第三4点IDCT单元,所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者执行所述多个IDCT中大小为4的一者。
在另一方面中,一种装置包含用于接收内容数据的装置及用于执行多个逆离散余弦变换中的一者或一者以上的装置,所述逆离散余弦变换将所述所接收的内容数据从空间域变换到频域。所述用于执行多个IDCT中的所述一者或一者以上的装置包括:用于执行所述多个IDCT-II中大小为8的一者的装置;用于执行所述多个经缩放IDCT-II中大小为4的第一者的第一装置,其中所述用于执行所述多个IDCT-II中大小为8的一者的装置包含所述用于执行所述多个经缩放IDCT-II中大小为4的一者的第一装置;用于执行所述多个IDCT-II中大小为4的第二者的第二装置;及用于执行所述多个经缩放IDCT-II中大小为4的第三者的第三装置。
在下文的随附图式及描述中阐述所述技术的一个或一个以上方面的细节。本发明中所描述的技术的其它特征、目标及优点将通过所述描述及所述图式以及通过权利要求书显而易见。
附图说明
图1为说明可实施本发明的技术的视频编码及解码系统的框图。
图2为更详细地说明图1的视频编码器的框图。
图3为更详细地说明图1的视频解码器的框图。
图4A至图4D为更详细地说明图2的16点DCT-II单元的各种方面的图式。
图5为说明译码装置在应用根据本发明的技术建构的16点DCT实施方案时的示范性操作的流程图。
图6为说明译码装置在应用根据本发明的技术配置的16点DCT-III时的实例操作的流程图。
具体实施方式
大体来说,本发明是针对用于使用16点离散余弦变换(DCT)实施方案来译码数据的技术,所述16点DCT实施方案包括多个不同DCT实施方案,所述不同DCT实施方案能够执行具有不同大小的多个不同DCT。可应用所述技术以压缩多种数据,包括例如数字视频数据、图像数据、语音数据及/或音频数据的可见媒体数据或可听媒体数据,且借此将表示此数据的这些电信号变换为经压缩信号以用于更有效地处理、传输或存档所述电信号。根据本发明的技术建构的16点DCT实施方案因此能够执行具有多个大小的DCT。通过执行具有多个大小的DCT,16点DCT实施方案潜在地消除用以执行具有类似大小的DCT的单独DCT实施方案。因此,所描述的技术可有助于减少所谓的“板空间”的消耗,因为根据所述技术所建构的16点DCT实施方案并入有、嵌套有或另外嵌入有具有不同大小(例如,8及4)的DCT实施方案,而与单独的16点DCT实施方案、8点DCT实施方案及4点DCT实施方案的总大小相比大体上不增加16点实施方案的大小。消耗更少的板空间一般转化为功率消耗的减少,且结果,本发明的技术可促进更具能量效率的DCT实施方案。
上文所表示的大小(即,16、8及4)是依据离散数据单位来表示。为说明,常常依据视频块来描述视频数据(确切地说关于视频压缩)。视频块一般指代视频帧的具有任何大小的部分,其中视频帧指代一系列图片或图像中的一图片或图像。每一视频块通常包含多个离散像素数据,所述多个离散像素数据指示色彩分量(例如,红色、蓝色及绿色(所谓的“色度”或“色度”分量))或亮度分量(所谓的“亮度”分量)。每一组像素数据包含视频块中的单一像素且可被视为关于视频块的离散数据单位。因此,8×8视频块(例如)包含八行像素数据,其中每一行中具有八个离散组的像素数据。可将n位值指派给每一像素以规定色彩或亮度值。
通常依据DCT能够处理的数据块的大小来描述DCT,不管所述数据块是音频、语音图像还是视频数据。举例来说,如果DCT可处理16数据阵列,则可将DCT称为线性16点DCT。可应用具有不同大小的线性DCT以向具有不同大小的视频块有效地执行16×16、16×8、8×16、8×8、8×4、4×8、4×4或任何其它大小组合。此外,可将DCT表示为特定类型。八种不同类型的DCT中的最普遍使用的类型的DCT为II类型DCT,其可表示为“DCT-II”。常常,当一般提及DCT时,此参考指代II类型DCT或DCT-II。将DCT-II的反向形式称为III类型DCT(其类似地可表示为“DCT-III”),或在DCT指代DCT-II的普遍理解的情况下,将DCT-II的反向形式称为“IDCT”,其中“IDCT”中的“I”表示反向。下文对DCT的参考遵照此表示方法,其中除非另外规定,否则对DCT的一般参考指代DCT-II。然而,为避免混淆,下文在对应类型(II、III等)被指示的情况下提及DCT(包括DCT-II)。
本发明中所描述的技术可实施于分别使用16点DCT-II及/或16点DCT-III的一个或一个以上实施方案的编码器及/或解码器中,以促进对数据的压缩及/或解压缩。又,通过应用这些16点DCT-II实施方案所实现的压缩及解压缩准许对表示数据的电信号进行物理变换,使得可使用物理计算硬件、物理传输媒体(例如,铜、光纤、无线或其它媒体)及/或存储硬件(例如,磁盘或光盘或磁带、或多种固态媒体中的任一者)来更有效地处理、传输及/或存储所述信号。所述实施方案可单独地配置于硬件中或可配置于硬件与软件的组合中。
16点DCT-II的实施方案可被缩放,其中术语“被缩放”指代产生经缩放DCT系数的DCT实施方案。经缩放DCT系数在乘以对应的比例因子时产生所谓的“完整”DCT系数。经缩放的DCT实施方案表示从实施方案中移除了某些因子的DCT实施方案。一般来说,这些因子并入到给定译码装置或系统的另一元件、模块或单元中。举例来说,视频编码器可包括根据本发明的技术建构的经缩放16点DCT实施方案。视频编码器一般将所移除的因子并入到量化单元中,所述量化单元量化由经缩放16点DCT实施方案所输出的经缩放DCT系数。所述量化单元可一般应用这些因子而大体上不增加量化单元的复杂性,而应用这些因子的完整DCT实施方案一般比与应用所述因子的另一模块(例如,量化单元)结合的经缩放DCT实施方案更复杂。因此,在某些上下文中,经缩放DCT实施方案可提供降低的实施方案复杂性同时提供相同的译码增益。尽管在本发明中关于经缩放DCT实施方案加以描述,但可将所述技术应用于非经缩放或所谓的“完整”DCT实施方案。
为说明,一设备可包括根据本发明的技术建构的呈16点DCT变换模块的形式的16点DCT实施方案。所述16点DCT变换模块可执行具有不同大小的多个经缩放DCT变换以将内容数据从空间域变换到频域。所述经缩放16点DCT模块可包括至少一个经缩放8点DCT模块,所述至少一个经缩放8点DCT模块执行多个经缩放DCT变换中大小为8的第一者。所述16点DCT模块还可包括至少一个经缩放4变换模块,所述至少一个经缩放4变换模块执行所述多个经缩放DCT变换中大小为4的至少一第二者。
在此方面,根据本发明的技术建构的16点DCT实施方案至少在一些方面中可能能够执行具有多个大小的DCT,借此潜在地消除用以执行具有所述多个大小的DCT的单独DCT实施方案。因此,本发明的技术有助于减少所谓的“板空间”的消耗,因为根据所述技术所建构的16点DCT实施方案并入有、嵌套有或另外嵌入有具有不同大小(例如,8及4)的DCT实施方案而大体上不增加16点实施方案的大小。与单独的16点DCT实施方案、8点DCT实施方案及4点DCT实施方案的总大小相比,本发明的16点DCT-II实施方案就所消耗的物理板空间来说可为大体上更小的,其中术语板空间指代在提供不同组件之间的互连的硅板或其它物理板上所消耗的空间量。消耗更少的板空间一般转化为功率消耗的减少,且结果,本发明的技术可促进更具能量效率的DCT实施方案。
图1为说明视频编码及解码系统10的框图。如图1中所示,系统10包括源硬件装置12,所述源硬件装置12经由通信信道16将经编码视频传输到接收硬件装置14。源装置12可包括视频源18、视频编码器20及发射器22。目的地装置14可包括接收器24、视频解码器26及视频显示装置28。
在图1的实例中,通信信道16可包含任何无线或有线通信媒体(例如,射频(RF)频谱,或一个或一个以上物理传输线),或无线与有线媒体的任何组合。信道16可形成基于包的网络(例如,局域网络、广域网络或例如因特网的全球网络)的一部分。通信信道16一般表示用于将视频数据从源装置12传输到接收装置14的任何合适的通信媒体或不同通信媒体的集合。
源装置12产生供传输到目的地装置14的视频。然而,在一些状况下,装置12、14可以大体上对称的方式操作。举例来说,装置12、14中的每一者可包括视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传输(例如)以用于视频串流、视频广播或视频电话。对于其它数据压缩及译码应用来说,装置12、14可经配置以发送及接收或交换其它类型的数据,例如图像、语音或音频数据,或视频、图像、语音及音频数据中的两者或两者以上的组合。因此,出于说明的目的提供对视频应用的以下论述,且不应将此论述视为限制如本文中广泛描述的本发明的各种方面。
视频源18可包括视频俘获装置,例如一个或一个以上视频相机、含有先前俘获的视频的视频存档,或来自视频内容提供者的实况视频馈送。作为另一替代方案,视频源18可产生作为源视频的基于计算机图形的数据,或实况视频与计算机产生的视频的组合。在一些状况下,如果视频源18为相机,则源装置12及接收装置14可形成所谓的相机电话或视频电话。因此,在一些方面中,源装置12、接收装置14或两者可形成无线通信装置手持机(例如,移动电话)。在每一状况下,可由视频编码器20编码经俘获、经预先俘获或由计算机产生的视频以用于经由发射器22、信道16及接收器24从视频源装置12传输到视频接收装置14的视频解码器26。显示装置28可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子显示器或有机发光二极管(OLED)显示器。
视频编码器20及视频解码器26可经配置以针对空间、时间及/或信噪比(SNR)可缩放性而支持可缩放视频译码。在一些方面中,视频编码器20及视频解码器22可经配置以支持细粒度SNR可缩放性(FGS)译码。编码器20及解码器26可通过支持基础层及一个或一个以上可缩放增强层的编码、传输及解码来支持各种可缩放性程度。对于可缩放视频译码来说,基础层载运具有最低质量等级的视频数据。一个或一个以上增强层载运额外位流以支持更高的空间、时间及/或SNR等级。
视频编码器20及视频解码器26可根据例如MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4高级视频译码(AVC)的视频压缩标准来操作。尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器26可分别与音频编码器及解码器集成,且包括适当的MUX-DEMUX单元或其它硬件及软件,以处置对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,则MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
视频编码器20及视频解码器26各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。因此,视频编码器20及视频解码器26中的每一者可至少部分地实施为集成电路(IC)芯片或装置,且可包括于一个或一个以上编码器或解码器中,所述一个或一个以上编码器或解码器中的任一者可集成为相应移动装置、用户装置、广播装置、服务器或其类似者中的组合的编码器/解码器(CODEC)的一部分。另外,源装置12及接收装置14各自可包括适当的调制、解调、频率转换、滤波及放大器组件以用于传输及接收经编码视频(当适用时),所述组件包括足以支持无线通信的射频(RF)无线组件及天线。然而,为了易于说明起见,图1中未展示这些组件。
视频序列包括一系列视频帧。视频编码器20对各个视频帧内的像素块操作以便编码视频数据。视频块可具有固定或变化的大小,且可根据规定的译码标准而在大小方面不同。每一视频帧包括一系列片段。每一片段可包括一系列宏块,所述系列宏块可布置为子块。作为一实例,ITU-T H.264标准支持呈各种二元块大小(例如,用于亮度分量的16×16、8×8、4×4,及用于色度分量的8×8)的帧内预测以及呈各种块大小(例如,用于亮度分量的16×16、16×8、8×16、8×8、8×4、4×8及4×4,及用于色度分量的对应经缩放大小)的帧间预测。
更小的视频块可提供更好的分辨率,且可用于视频帧的包括高详细等级的位置。一般来说,可将宏块及各种子块或分区全部视为视频块。另外,可将片段视为一系列视频块(例如,宏块及/或子块或分区)。一般来说,宏块可指代一组界定16×16像素区域的色度值及亮度值。亮度块可包含一16×16组的值,但其可进一步分割为更小的视频块(例如,8×8块、4×4块、8×4块、4×8块或其它大小)。两个不同色度块可定义宏块的色彩,且可各自包含与16×16像素区域相关联的色彩值的8×8子取样块。宏块可包括语法信息以定义译码模式及/或应用于宏块的译码技术。
可将宏块或其它视频块分组为可解码单位(例如,片段、帧或其它独立单位)。每一片段可为视频帧的可独立解码单位。或者,帧自身可为可解码单位,或可将帧的其它部分定义为可解码单位。在本发明中,术语“译码单位”指代视频帧的任何可独立解码单位,例如整个帧、帧的片段、一群图像(GOP),或根据所使用的译码技术所定义的另一可独立解码单位。
图1的系统10的视频编码器20及/或视频解码器26可经配置以分别包括16点DCT-II及其反向形式(例如,16点DCT-III)的实施方案,其中所述16点DCT-II实施方案是根据本发明中所描述的技术而建构。尽管ITU-T H.264标准支持呈各种块大小(例如,用于亮度分量的16×16、8×8、4×4,及用于色度分量的8×8)的帧内预测,但用以改善译码效率的对此标准的修订当前正在进行中。由视频译码联合合作小组(JointCollaborative Team-Video Coding)(JCT-VC,其为MPEG与ITU-T之间的合作)提议的一种修订标准可称为高效率视频译码(HEVC)。在一些例子中,根据本发明的技术建构的II类型16点DCT(“DCT-II”)实施方案可保持译码效率,同时还减小实施方案的大小,借此消耗更少的物理板空间及促进功率效率。因此,HEVC及其它演进的标准或规范可考虑这些DCT-II及DCT-III。
根据本发明中所描述的技术,16点DCT-II的实施方案提供具有不同大小的多个DCT-II。视频编码器20可包括表示此16点DCT-II实施方案的16点DCT-II单元(出于易于说明的目的而未在图1中予以展示)。所述16点DCT-II单元一般执行多个或许多具有不同大小的经缩放DCT变换以将内容数据从空间域变换到频域。作为一个实例,16点DCT-II单元可包括:至少一个经缩放8点DCT模块,其执行经缩放DCT变换中大小为8的第一者;及至少一个经缩放4点变换模块,其执行DCT变换中大小为4的至少一第二者。
在此方面,根据本发明的技术建构的单一16点DCT-II实施方案至少在一些方面中能够执行具有多个大小的DCT,借此潜在地消除用以执行具有类似大小的DCT的单独DCT实施方案。因此,本发明的技术可有助于减少所谓的“板空间”(其指代在硅板上所消耗的物理空间的面积)的消耗,因为根据所述技术所建构的16点DCT实施方案并入有、嵌套有或另外嵌入有具有不同大小(例如,8及4)的DCT实施方案,而大体上不增加16点实施方案的大小。与单独的16点DCT实施方案、8点DCT实施方案及4点DCT实施方案的总大小相比,16点DCT-II实施方案就所消耗的物理板空间来说可为大体上更小的。消耗更少的板空间一般转化为功率消耗的减少,且结果,本发明的技术可促进更具能量效率的DCT实施方案。
根据本发明的技术建构的16点DCT-II的实施方案可被缩放,其中术语“被缩放”指代产生经缩放DCT系数而非所谓的“完整”DCT系数的DCT实施方案。经缩放的DCT实施方案表示从实施方案中移除了某些因子的DCT实施方案。一般来说,这些所移除的因子并入到给定译码装置或系统的另一元件、模块或单元中。举例来说,视频编码器可包括根据本发明的技术建构的经缩放16点DCT实施方案。视频编码器一般将所移除的因子并入到量化单元中,所述量化单元量化由经缩放16点DCT实施方案所输出的经缩放DCT系数。所述量化单元可一般应用这些因子而大体上不增加量化单元的复杂性,而应用这些因子的完整DCT实施方案一般比与应用所述因子的另一模块(例如,量化单元)结合的经缩放DCT实施方案更复杂。因此,在某些上下文中,经缩放DCT实施方案可提供降低的实施方案复杂性同时提供相同的译码增益。尽管在本发明中关于经缩放DCT实施方案加以描述,但可将所述技术应用于非经缩放或所谓的“完整”DCT实施方案。
图2为更详细地说明图1的视频编码器20的框图。视频编码器20可至少部分地形成为一个或一个以上集成电路装置(其可共同地称为集成电路装置)。在一些方面中,视频编码器20可形成无线通信装置手持机或广播服务器的一部分。视频编码器20可执行对视频帧内的块的帧内译码及帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的邻近帧内的视频中的时间冗余。对于帧间译码来说,视频编码器20执行运动估计以追踪邻近帧之间的匹配视频块的移动。
如图2中所示,视频编码器20接收待编码的视频帧内的当前视频块30。在图2的实例中,视频编码器20包括运动估计单元32、存储器34、运动补偿单元36、块变换单元38、量化单元40、逆量化单元42、逆变换单元44及熵译码单元46。可应用环路内或环路后解块滤波器(未图示)以对块进行滤波来移除块假影。视频编码器20还包括求和器48及求和器50。图2说明视频编码器20的用于视频块的帧间译码的时间预测组件。尽管出于说明的容易性而未在图2中展示,但视频编码器20还可包括用于一些视频块的帧内译码的空间预测组件。
运动估计单元32将视频块30与一个或一个以上邻近视频帧中的块比较以产生一个或一个以上运动向量。可从存储器34检索所述邻近帧,存储器34可包含任何类型的存储器或数据存储装置以存储由先前编码的块重新建构的视频块。可针对可变大小(例如,16×16、16×8、8×16、8×8或更小的块大小)的块执行运动估计。运动估计单元32(例如)基于速率失真模型识别邻近帧中的最密切匹配当前视频块30的一个或一个以上块,且确定邻近帧中的块与所述当前视频块之间的移位。以此为基础,运动估计单元32从用以译码当前视频块30的参考帧中产生指示当前视频块30与一个或一个以上匹配块之间的移位的量值及轨迹的一个或一个以上运动向量(MV)。所述匹配块将充当用于待译码块的帧间译码的预测性(或预测)块。
运动向量可具有半像素精度或四分之一像素精度或甚至更细的精度,从而允许视频编码器20以比整数像素位置高的精度追踪运动及获得更好的预测块。当使用具有分数像素值的运动向量时,在运动补偿单元36中执行内插操作。运动估计单元32使用某些准则(例如,速率失真模型)来确定最好块分区及产生用以识别视频块的运动向量。举例来说,在双向预测的状况下可不仅仅存在运动向量。使用所得块分区及运动向量,运动补偿单元36形成预测视频块。
视频编码器20通过在求和器48处从原始、当前视频块30减去由运动补偿单元36产生的预测视频块而形成残余视频块。块变换单元38应用变换从而产生残余变换块系数。如图2中所示,块变换单元38包括实施根据本发明中所描述的技术建构的16点DCT-II的16点DCT-II单元52。16点DCT-II单元52表示在一些例子中执行软件的硬件模块(例如,执行软件代码或指令的数字信号处理器或DSP),其实施能够执行16点DCT-II、8点DCT-II及4点DCT-II中的一者或一者以上的16点DCT-II,如本发明中所描述。16点DCT-II单元52将这些DCT-II中大小为16、8及4的一者或一者以上应用于残余块以产生对应大小为16、8及/或4的残余变换系数块。16点DCT-II单元52一般将残余块从空间域(其被表示为残余像素数据)变换到频域(其被表示为DCT系数)。变换系数可包含包括至少一个DC系数及一个或一个以上AC系数的DCT系数。
量化单元40量化(例如,舍位)残余变换块系数以进一步降低位速率。如上文所提及,量化单元40通过并入有在因子分解期间所移除的内部因子来虑及经缩放16点DCT-II单元52的缩放性质。由于量化通常涉及乘法,因此将这些因子并入到量化单元40中可能不增加量化单元40的实施方案复杂性。在此方面,从经缩放16点DCT-II单元52移除因子在不增加量化单元40的实施方案复杂性的情况下降低了DCT-II单元52的实施方案复杂性,从而引起关于视频编码器20的实施方案复杂性的净降低。
熵译码单元46对经量化系数进行熵译码以甚至进一步降低位速率。熵译码单元46可执行统计无损译码(在一些例子中,其称为熵译码)。熵译码单元46为经量化DCT系数的概率分布建模且基于经建模的概率分布选择码簿(例如,CAVLC或CABAC)。使用此码簿,熵译码单元46以压缩经量化DCT系数的方式选择用于每一经量化DCT系数的代码。为说明,熵译码单元46可选择短代码字(就位来说)用于频繁出现的经量化DCT系数及选择更长代码字(就位来说)用于较不频繁出现的经量化DCT系数。只要短代码字使用比经量化DCT系数少的位,平均来说,熵译码单元46便压缩经量化DCT系数。熵译码单元46将经熵译码系数输出作为被发送到视频解码器26的位流。一般来说,视频解码器26执行反向操作以解码位流及从位流重新建构经编码视频,如将参考图3的实例所描述。
重新建构单元42及逆变换单元44分别重新建构经量化系数及应用逆变换,以重新建构残余块。逆变换单元44包括逆DCT(IDCT)(其通常称为执行16点DCT-II单元52的反向操作的III类型DCT),所述逆DCT类似于下文关于图3所描述的16点DCT-III单元68。此逆16点DCT-II被展示为16点DCT-III单元53,其再次可大体上类似于图3的实例中所示的16点DCT-II单元68。求和单元50将重新建构的残余块加到由运动补偿单元36产生的运动补偿预测块以产生供存储于存储器34中的重新建构的视频块。所述重新建构的视频块由运动估计单元32及运动补偿单元36使用以编码后续视频帧中的块。
图3为更详细地说明图1的视频解码器26的实例的框图。视频解码器26可至少部分地形成为一个或一个以上集成电路装置(其可共同地称为集成电路装置)。在一些方面中,视频解码器26可形成无线通信装置手持机的一部分。视频解码器26可执行视频帧内的块的帧内解码及帧间解码。如图3中所示,视频解码器26接收已由视频编码器20编码的经编码视频位流。在图3的实例中,视频解码器26包括熵解码单元54、运动补偿单元56、重新建构单元58、逆变换单元60及存储器62。熵解码单元64可存取存储于存储器64中的一个或一个以上数据结构以获得在译码时有用的数据。视频解码器26还可包括对求和器66的输出进行滤波的环路内或环路后解块滤波器(未图示)。视频解码器26还包括求和器66。图3说明视频解码器26的用于视频块的帧间解码的时间预测组件。尽管图3中未展示,但视频解码器26还可包括用于一些视频块的帧内解码的空间预测组件。
熵解码单元54接收经编码视频位流且从所述位流解码经量化残余系数及经量化参数以及其它信息,例如宏块译码模式及运动信息(其可包括运动向量及块分区)。运动补偿单元56接收运动向量及块分区以及来自存储器62的一个或一个以上重新建构的参考帧以产生预测视频块。
重新建构单元58逆量化(即,解量化)经量化块系数。逆变换单元60将逆变换(例如,逆DCT)应用于所述系数以产生残余块。更具体来说,逆变换单元60包括16点DCT-III单元68,逆变换单元60将所述16点DCT-III单元68应用于系数以产生残余块。16点DCT-III单元68(其为图2中所示的16点DCT-II单元52的反向形式)可将所述系数从频域变换到空间域以产生残余块。类似于上文的量化单元40,重新建构单元58通过将在因子分解期间所移除的外部因子并入到重新建构过程中来考虑到16点DCT-III单元68的缩放性质,且实施方案复杂性增加得很少甚至并未增加。从经缩放16点DCT-III单元68移除因子可降低实施方案复杂性,借此引起视频解码器26的复杂性的净降低。
接着由求和器66对预测视频块与残余块求和以形成经解码块。可应用解块滤波器(未图示)以对经解码块进行滤波从而移除块假影。接着将经滤波块放置于存储器62中,所述存储器62提供用于解码后续视频帧的参考帧且还产生经解码视频以驱动显示装置28(图1)。在一些例子中,可在将帧存储到存储器62之后应用环路后解块滤波器以对所述帧进行滤波从而移除假影。
图4A至图4D为更详细地说明16点DCT-II单元52的各种方面的图式。在图4A的实例中,16点DCT-II单元52包括蝶形单元70、8点DCT-II单元72及8点DCT-Ⅳ单元74。8点DCT-II单元72包括第一4点DCT-II单元76A,而8点DCT-Ⅳ单元74包括第二4点DCT-II单元76B及第三4点DCT-II单元76C。8点DCT-Ⅳ单元74还包括因子相乘单元78及交叉相加单元80,所述因子相乘单元78及所述交叉相加单元80在下文关于图4D的实例更详细地描述。16点DCT-II单元52接收输入x0-x15并产生输出X0-X15。蝶形单元70将输入x0-x15重新布置为偶数输入x0、x2、x4、x6、x8、x10、x12及x14以及奇数输入x1、x3、x5、x7、x9、x11、x13及x15,同时还关于偶数输入执行交叉相加及关于奇数输入执行交叉相减。蝶形单元70将交叉相加的偶数输入输出到8点DCT-II单元72及将交叉相减的奇数输入输出到8点DCT-I4单元74。
图4B为更详细地说明4点DCT-II单元76A至76C中的任一者的实例的图式。为反映图4B的实例中所示的4点DCT-II单元可表示4点DCT-II单元76A至76C中的任一者,一般将图4B的实例中所示的4点DCT-II单元称为4点DCT-II单元76。4点DCT-II单元76包括蝶形单元82,所述蝶形单元82就功能性来说大体上类似于蝶形单元70,但就缩放比例来说不同于蝶形单元70,因为蝶形单元82仅接收4个输入而非16个输入。蝶形单元82将输入重新布置为偶数输入及奇数输入,如由在两个上部输出上的“0”及“2”符号及在两个下部输出上的“1”及“3”符号所表示。可将4点DCT-II单元76的对奇数输入操作的部分称为奇数部分,而可将对偶数输入操作的部分称为偶数部分。
在奇数部分中,将表示为A及B的两个因子展示为被应用于奇数输入。在确定这些因子的值时,设计者可平衡多个关注的方面。常常,考虑到以为2的幂的因子进行的乘法在二进制系统中通常仅涉及右移,可容易地执行为2的幂的因子。因此,尽管为2的幂的因子可能未以足够的精度来适当地反映DCT系数以提供大量译码增益或压缩效率,但这些因子受到偏爱。或者,非为2的幂的因子可提供更高精度,但可能不容易实施,因而增加实施方案复杂性。此外,更大的因子一般提供更多译码增益但需要显著更多的存储空间,而更小的因子可消耗更少的存储空间但提供更少的译码增益。无论如何,在选择用于任何给定DCT实施方案(例如,由4点DCT-II单元76表示的DCT实施方案)的因子时涉及多个折衷。下文描述因子的各种组合,其更详细地说明这些各种折衷。
图4C为更详细地说明8点DCT-II单元72的框图。在图4C的实例中,8点DCT-II单元72包括蝶形单元84,考虑到蝶形单元84仅接收8个输入(与分别由蝶形单元70及82接收的16个输入及4个输入相比),所述蝶形单元84在功能方面大体上类似于蝶形单元70及82,但在缩放比例方面不同于蝶形单元70及82。无论如何,蝶形单元84将其输入重新布置为偶数输入及奇数输入,同时还执行交叉相加以产生偶数输入及执行交叉相减以产生奇数输入。可将8点DCT-II单元72的对偶数输入操作的部分称为偶数部分,而可将对奇数输入操作的部分称为奇数部分。在此例子中偶数部分包含经嵌套的4点DCT-II单元76A,所述4点DCT-II单元76A大体上类似于上文关于图4B的实例所描述的4点DCT-II单元76。
8点DCT-II单元72的奇数部分包括各自执行各种数学运算的多个单元86至90。因子相乘单元86在以因子C、D、E及F乘奇数输入之后执行这些输入的交叉相加。因子C、D、E及F表示可以上文所描述的方式修改以促进各种益处的变量。交叉相加单元88以关于图4C的实例所示的方式执行交叉相加,而交叉相加单元90执行外部加法输入的交叉相加以产生表示为7及1的奇数输出。又,下文描述因子的各种组合,其更详细地说明这些各种折衷。
图4D为更详细地说明8点DCT-Ⅳ单元74的框图。在图4D的实例中,如上文所提,8点DCT-Ⅳ单元74包括两个4点DCT-II单元76B、76C,所述4点DCT-II单元76B、76C中的每一者可大体上类似于上文关于图4B的实例所描述的4点DCT-II单元76。再次如上文所提,8点DCT-Ⅳ单元74还包括因子相乘单元78及交叉相加单元80。因子相乘单元78将对8点DCT-Ⅳ单元74的输入乘以因子H、I、J、K、L、M及N,且一旦乘以所述因子,便使上部四个输入与下部四个输入交叉相加及从下部四个输入交叉减去上部四个输入。上部四个输入接着由4点DCT-II单元76B处理,而下部四个输入由4点DCT-II单元76C处理。交叉相加单元80接着交叉加上/减去(其中减法被视为另一形式的加法)下部七个输入。
一般来说,可将上文所描述的DCT-II或DCT-Ⅳ单元72、74及76A至76C中的每一者表示为上文所提的因子A至N的矩阵。举例来说,DCT-II单元76A至76C(“DCT-II单元76”)中的每一者可由以下表1中所阐述的矩阵来表示。
表1:4×4 DCT-II矩阵
  1   1   1   1
  B   A   -A   -B
  1   -1   -1   1
  A   -B   B   -A
DCT-II单元72可由以下表2中所阐述的矩阵来表示。
表2:8×8 DCT-II矩阵
  1   1   1   1   1   1   1   1
  E+F   D+C   C-D   -F+E   F-E   -C+D   -D-C   -E-F
  B   A   -A   -B   -B   -A   A   B
  E   -D   -C   -F   F   C   D   -E
  1   -1   -1   1   1   -1   -1   1
  F   -C   D   E   -E   -D   C   -F
  A   -B   B   -A   -A   B   -B   A
  -F+E   -C+D   D+C   -E-F   E+F   -D-C   C-D   F-E
DCT-Ⅳ单元74可由以下表3中所阐述的矩阵来表示。
表3:8×8DCT-Ⅳ矩阵
  M   K   I   G   H   J   L   N
  B*M+A*N   A*K+B*L   -A*I+B*J   -B*G+A*H   -B*H-A*G   -A*J-B*I   A*L-B*K   B*N-A*M
  B*M-A*N   A*K-B*L   -A*I-B*J   -B*G-A*H   -B*H+A*G   -A*J+B*I   A*L+B*K   B*N+A*M
  M+N   -K+L   -I-J   G-H   H+G   -J+1   -L-K   N-M
  M-N   -L-K   -1+J   H+G   H-G   -1-J   -L+K   M+N
  B*N+A*M   -B*K-A*L   -A*J+B*I   -A*G+B*H   -B*G-A*H   B*J+A*I   A*K-B*L   A*N-B*M
  A*M-B*N   A*L-B*K   B*I+A*J   -B*H-A*G   -A*H+B*G   -A*I+B*J   -B*L-A*K   B*M+A*N
  N   -L   J   -H   G   -I   K   -M
基于表示4×4DCT-II矩阵、8×8DCT-II矩阵及8×8DCT-Ⅳ矩阵的以上表,可通过以下表4中所阐述的所得矩阵来确定用于16点DCT-II单元52的矩阵。
表4:16×16DCT-II矩阵
Figure BPA00001481867000161
返回参看图4A,将多个外部因子展示为被乘到输出X0-X15,所述输出X0-X15中的一些输出涉及正规化因子ξ,ζ,η。这些外部因子可能不包括于16点DCT-II单元52内,而是可替代地被移除并并入到量化单元40中。一般来说,这些外部因子由以下对角矩阵S来表示,所述对角矩阵S再次并入到量化单元40中。
S = diag ( 1 4 , 1 2 2 η , 1 4 ζ , 1 2 2 ξη , 1 2 2 ξ , 1 2 2 ξη , 1 2 2 ζ , 1 4 η , 1 4 , 1 4 η , 1 2 2 ζ , 1 2 2 ξη , 1 2 2 ξ , 1 2 2 ξη , 1 4 ζ , 1 2 2 η ) ;
其中这些正规化因子可通过减小需要许多操作来应用于输入的内部因子的大值来改善实施方案复杂性。如果移除这些外部因子,则考虑到16点DCT-II单元52输出需要应用对角矩阵S以恰当地产生完整、非经缩放输出(其准确地表示DCT系数)的经缩放输出,将16点DCT-II单元52称为经缩放16点DCT-II单元52。如果16点DCT-II单元52保留这些外部因子,则将16点DCT-II单元52称为完整16点DCT-II单元52。取决于上下文,可将完整单元或经缩放单元用于16点DCT-II单元52,且本发明的技术不应限于任何类型的完整或经缩放实施方案。
无论如何,下文为一些示范性实施方案特定值,其可被选择用于上文的内部因子及正规化因子以产生提供各种益处的16点DCT-II单元52。作为一般注释,选择所述因子的以下值,使得所得DCT矩阵保留正交性性质,其由以下方程式(1)来定义。
CTC=I,(1)
其中C表示完整非经缩放变换矩阵且CT表示矩阵C的转置。一般来说,关于DCT-II实施方案需要正交性,因为其为可逆的。作为一个实例,此可逆性质允许视频编码器应用正交16点DCT实施方案以从视频数据的残余块产生DCT系数。视频解码器可接着应用8点逆DCT-II(IDCT)实施方案以从DCT-II系数重新建构视频数据的残余块,且数据很少有损失甚至没有损失。考虑到视频编码的主要目标中的一者为保存数据,各种译码标准(例如,H.264视频译码标准)采用8点DCT的正交实施方案。
对内部因子A至N的各种值的调查提供关于在选择这些值时所涉及的折衷的某一指示。以4点DCT-II单元76及内部因子A及B开始,在以下表5中阐述对这些因子的值的分析。
表5
Figure BPA00001481867000172
参看表5,关于近似误差及存储因子A及B所需的位数目展示了内部因子A及B的值。一般来说,随着内部因子A及B的值的大小增加,近似误差减小且存储这些更大的值所需的位数目增加。
继续关于8点DCT-II单元72及内部因子C、D、E及F的调查,在以下表6中阐述对这些因子的值的分析。
表6
Figure BPA00001481867000182
类似于以上表5中所阐述的分析,随着内部因子C至F的值的大小增加,近似误差减小且存储这些更大的值所需的位数目增加。
在以下表7中阐述对8点DCT-Ⅳ单元74的内部因子H至N的分析。
表7
Figure BPA00001481867000183
Figure BPA00001481867000191
类似于在以上表5及表6中所阐述的分析,随着内部因子H至N的值的大小增加,最大近似误差减小且存储这些更大的值所需的位数目增加。关于表7中所阐述的分析,最大近似误差关于内部因子的最初4个或5个组合非常大,以致于对内部因子H至N的值的选择在5位近似值、6位近似值及7位近似值之间。
在以上调查分析完成的情况下,可经由从以上表5至表7对内部因子A至N的值作出各种选择而产生多个不同实施方案或设计。可配置第一设计或实施方案,当与通过分别选择内部因子A及B的值1及2的以下两个设计相比时,所述第一设计或实施方案就近似误差来说为最不精确的。还通过从以上表7选择5位近似值来配置此第一设计,其中内部因子N、L、J、H、G、I、K、M分别设定成值1、6、10、10、15、15、17、18。在分别针对内部因子C、D、E、F而设定值11、3、9及7的情况下,进一步配置所述第一设计。
可通过以下表8中所阐述的矩阵来概述第一设计或实施方案。
表8
  1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1
  18   17   15   15   10   10   6   1   -1   -6   -10   -10   -15   -15   -17   -18
  16   14   8   2   -2   -8   -14   -16   -16   -14   -8   -2   2   8   14   16
  37   29   5   -20   -35   -40   -28   -16   16   28   40   35   20   -5   -29   -37
  2   1   -1   -2   -2   -1   1   2   2   1   -1   -2   -2   -1   1   2
  35   5   -35   -40   -5   20   40   20   -20   -40   -20   5   40   35   -5   -35
  9   -3   -11   -7   7   11   3   -9   -9   3   11   7   -7   -11   -3   9
  19   -11   -25   5   25   5   -23   -17   17   23   -5   -25   -5   25   11   -19
  1   -1   -1   1   1   -1   -1   1   1   -1   -1   1   1   -1   -1   1
  17   -23   -5   25   -5   -25   11   19   -19   -11   25   5   -25   5   23   -17
  7   -11   3   9   -9   -3   11   -7   -7   11   -3   -9   9   3   -11   7
  20   -40   20   5   -40   35   5   -35   35   -5   -35   40   -5   -20   40   -20
  1   -2   2   -1   -1   2   -2   1   1   -2   2   -1   -1   2   -2   1
  16   -28   40   -35   20   5   -29   37   -37   29   -5   -20   35   -40   28   -16
  2   -8   14   -16   16   -14   8   -2   -2   8   -14   16   -16   14   -8   2
  1   -6   10   -10   15   -15   17   -18   18   -17   15   -15   10   -10   6   -1
以上表8中所示的多个矩阵系数为大值,就执行以这些大值进行的乘法所需的操作来说,其可增加实施方案复杂性。为移除这些大值并跨越变换来平衡动态范围,可在乘法之后将右移引入到第一设计的实施方案中,从而产生在表9中所阐述的以下正规化内部因子。应注意,右移可为任意正整数。唯一的限制为针对参数A及B的右移为相同的。类似地,针对C、D、E及F的右移为相同的。最后,针对N、L、J、H、G、I、K及M的参数的右移为相同的。右移将这些整数参数变换为二元有理数。二元有理数为分母为2的幂的有理数。右移可降低变换的准确度。因此,需要使其保持为最小。
表9
  A   B   C   D   E   F   N   L   J   H   G   I   K   M
  1/2   2/2   11/16   3/16   9/16   7/16   1/16   6/16   10/16   10/16   15/16   15/16   17/16   18/16
使用这些正规化内部因子,表8中所阐述的矩阵简化成以下表10中所阐述的矩阵。
表10
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
9/8 17/16 15/16 15/16 5/8 5/8 3/8 1/16 -1/16 -3/8 -5/8 -5/8 -15/16 -15/16 -17/16 -9/8
1 7/8 1/2 1/8 -1/8 -1/2 -7/8 -1 -1 -7/8 -1/2 -1/8 1/8 1/2 7/8 1
37/32 29/32 5/32 -5/8 -35/32 -5/4 -7/8 -1/2 1/2 7/8 5/4 35/32 5/8 -5/32 -29/32 -37/32
1 1/2 -1/2 -1 -1 -1/2 1/2 1 1 1/2 -1/2 -1 -1 -1/2 1/2 1
35/32 5/32 -35/32 -5/4 -5/32 5/8 5/4 5/8 -5/8 -5/4 -5/8 5/32 5/4 35/32 -5/32 -35/32
9/16 -3/16 -11/16 -7/16 7/16 11/16 3/16 -9/16 -9/16 3/16 11/16 7/16 -7/16 -11/16 -3/16 9/16
19/16 -11/16 -25/16 5/16 25/16 5/16 -23/16 -17/16 17/16 23/16 -5/16 -25/16 -5/16 25/16 11/16 -19/16
1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1
17/16 -23/16 -5/16 25/16 -5/16 -25/16 11/16 19/16 -19/16 -11/16 25/16 5/16 -25/16 5/16 23/16 -17/16
7/16 -11/16 3/16 9/16 -9/16 -3/16 11/16 -7/16 -7/16 11/16 -3/16 -9/16 9/16 3/16 -11/16 7/16
5/8 -5/4 5/8 5/32 -5/4 35/32 5/32 -35/32 35/32 -5/32 -35/32 5/4 -5/32 -5/8 5/4 -5/8
1/2 -1 1 -1/2 -1/2 1 -1 1/2 1/2 -1 1 -1/2 -1/2 1 -1 1/2
1/2 -7/8 5/4 -35/32 5/8 5/32 -29/32 37/32 -37/32 29/32 -5/32 -5/8 35/32 -5/4 7/8 -1/2
1/8 -1/2 7/8 -1 1 -7/8 1/2 -1/8 -1/8 1/2 -7/8 1 -1 7/8 -1/2 1/8
1/16 -3/8 5/8 -5/8 15/16 -15/16 17/16 -9/8 9/8 -17/16 15/16 -15/16 5/8 -5/8 3/8 -1/16
表10中的矩阵系数的范围在-1.56与1.56之间,所述范围一般足够紧密或适合于DCT实施方案。第一设计具有对角矩阵S,所述对角矩阵S具有以下值:
1 4 , 4 130 65 , 2 130 65 , 8 130 325 , 10 10 , 8 130 325 , 4 65 65 , 4 13 65 , 1 4 , 4 13 65 , 4 65 65 , 8 130 325 , 10 10 , 8 130 325 , 2 130 65 , 4 26 65 ,
在乘以四及转换成浮点之后,其近似等于以下值:
[1.、1.255143265、1.403292831、1.122634265、1.264911064、1.122634265、1.984555754、.8875203140、1.、.8875203140、1.984555754、1.122634265、1.264911064、1.122634265、1.403292831、1.255143265]。
第二设计比第一设计更精确,但不如下文予以更详细地描述的第三设计精确。第二设计经配置而使内部因子N、L、J、H、G、I、K、M分别具有值6、11、21、27、34、38、42及43,其中这些值产生6位近似值。使所有剩余内部因子与上文针对第一设计所规定的内部因子相同,16点DCT系数矩阵变成以下表11中所阐述的16点DCT系数矩阵。
表11
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
43 42 38 34 27 21 11 6 -6 -11 -21 -27 -34 -38 -42 -43
16 14 8 2 -2 -8 -14 -16 -16 -14 -8 -2 2 8 14 16
92 64 4 -41 -88 -97 -73 -31 31 73 97 88 41 -4 -64 -92
2 1 -1 -2 -2 -1 1 2 2 1 -1 -2 -2 -1 1 2
80 20 -80 -95 -20 55 95 55 -55 -95 -55 20 95 80 -20 -80
9 -3 -11 -7 7 11 3 -9 -9 3 11 7 -7 -11 -3 9
49 -31 -59 7 61 17 -53 -37 37 53 -17 -61 -7 59 31 -49
1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1
37 -53 -17 61 -7 -59 31 49 -49 -31 59 7 -61 17 53 -37
7 -11 3 9 -9 -3 11 -7 -7 11 -3 -9 9 3 -11 7
55 -95 55 20 -95 80 20 -80 80 -20 -80 95 -20 -55 95 -55
1 -2 2 -1 -1 2 -2 1 1 -2 2 -1 -1 2 -2 1
31 -73 97 -88 41 4 -64 92 -92 64 -4 -41 88 -97 73 -31
2 -8 14 -16 16 -14 8 -2 -2 8 -14 16 -16 14 -8 2
6 -11 21 -27 34 -38 42 -43 43 -42 38 -34 27 -21 11 -6
在引入上文所提的右移之后,因子A至N变成以下表12中所阐述的因子。
表12
  A   B   C   D   E   F   N   L   J   H   G   I   K   M
  1/2   2/2   11/16   3/16   9/16   7/16   6/64   11/64   21/64   27/64   34/64   38/64   42/64   43/64
当引入这些移位时,表11中所规定的矩阵变成以下表13中所阐述的矩阵。
表13
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
21/32 19/32 17/32 27/64 21/64 11/64 3/32 -3/32 -11/64 -21/64 -27/64 -17/32 -19/32 -21/32 -43/64
7/8 1/2 1/8 -1/8 -1/2 -7/8 -1 -1 -7/8 -1/2 -1/8 1/8 1/2 7/8 1
1/2 1/32 41/128 -11/16 -97/128 -73/128 -31/128 31/128 73/128 97/128 11/16 41/128 -1/32 -1/2 -23/32
1/2 -1/2 -1 -1 -1/2 1/2 1 1 1/2 -1/2 -1 -1 -1/2 1/2 1
5/32 -5/8 -95/128 -5/32 55/128 95/128 55/128 -55/128 -95/128 -55/128 5/32 95/128 5/8 -5/32 -5/8
-3/16 -11/16 -7/16 7/16 11/16 3/16 -9/16 -9/16 3/16 11/16 7/16 -7/16 -11/16 -3/16 9/16
-31/64 -59/64 7/64 61/64 17/64 -53/64 -37/64 37/64 53/64 -17/64 -61/64 -7/64 59/64 31/64 -49/64
-1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1
-53/64 -17/64 61/64 -7/64 -59/64 31/64 49/64 -49/64 -31/64 59/64 7/64 -61/64 17/64 53/64 -37/64
-11/16 3/16 9/16 -9/16 -3/16 11/16 -7/16 -7/16 11/16 -3/16 -9/16 9/16 3/16 -11/16 7/16
-95/128 55/128 5/32 -95/128 5/8 5/32 -5/8 5/8 -5/32 -5/8 95/128 -5/32 -55/128 95/128 -55/128
-1 1 -1/2 -1/2 1 -1 1/2 1/2 -1 1 -1/2 -1/2 1 -1 1/2
-73/128 97/128 -11/16 41/128 1/32 -1/2 23/32 -23/32 1/2 -1/32 -41/128 11/16 -97/128 73/128 -31/128
-1/2 7/8 -1 1 -7/8 1/2 -1/8 -1/8 1/2 -7/8 1 -1 7/8 -1/2 1/8
-11/64 21/64 -27/64 17/32 -19/32 21/32 -43/64 43/64 -21/32 19/32 -17/32 27/64 -21/64 11/64 -3/32
参看表13,所有因子在[-1…1]范围中。比例因子的对角矩阵S的值变成以下值:
1 4 , 16 3770 1885 , 2 130 65 , 32 754 1885 , 10 10 , 32 754 65 , 4 65 65 , 16 1885 1885 , 1 4 , 16 1885 1885 , 4 65 65 , 32 754 1885 , 10 10 , 32 754 1885 , 2 130 65 , 16 3770 1885 ,
在乘以四及转换成浮点值之后,其近似等于以下值:
[1.、2.084679494、1.403292831、1.864594024、1.264911064、1.864594024、1.984555754、1.474091007、1.、1.474091007、1.984555754、1.864594024、1.264911064、1.864594024、1.403292831、2.084679494]。
第三设计包括与针对第二设计所配置的内部因子的值相同的内部因子N、L、J、H、G、I、K、M的值(即,在此实例中为6位近似值)。替代于改变这些值,第三设计包括内部因子A及B的值2及5以及内部因子C至F的值19、4、16及11。在设定所述内部因子的这些值的情况下,产生以下表14中所阐述的变换矩阵。
表14
  1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1
  43   42   38   34   27   21   11   6   -6   -11   -21   -27   -34   -38   -42   -43
  27   23   15   5   -5   -15   -23   -27   -27   -23   -15   -5   5   15   23   27
  227   139   29   -116   -203   -232   -188   -56   56   188   232   203   116   -29   -139   -227
  5   2   -2   -5   -5   -2   2   5   5   2   -2   -5   -5   -2   2   5
  203   29   -181   -224   -67   148   232   116   -116   -232   -148   67   224   181   -29   -203
  16   -4   -19   -11   11   19   4   -16   -16   4   19   11   -11   -19   -4   16
  49   -31   -59   7   61   17   -53   -37   37   53   -17   -61   -7   59   31   -49
  1   -1   -1   1   1   -1   -1   1   1   -1   -1   1   1   -1   -1   1
  37   -53   -17   61   -7   -59   31   49   -49   -31   59   7   -61   17   53   -37
  11   -19   4   16   -16   -4   19   -11   -11   19   -4   -16   16   4   -19   11
  116   -232   148   67   -224   181   29   -203   203   -29   -181   224   -67   -148   232   -116
  2   -5   5   -2   -2   5   -5   2   2   -5   5   -2   -2   5   -5   2
  56   -188   232   -203   116   29   -139   227   -227   139   -29   -116   203   -232   188   -56
  5   -15   23   -27   27   -23   15   -5   -5   15   -23   27   -27   23   -15   5
  6   -11   21   -27   34   -38   42   -43   43   -42   38   -34   27   -21   11   -6
在引入上文所提的右移之后,因子A至N变成以下表15中所阐述的因子。
表15
  A   B   C   D   E   F   N   L   J   H   G   I   K   M
  2/4   5/4   19/32   4/32   16/32   11/32   6/64   11/64   21/64   27/64   34/64   38/64   42/64   43/64
当引入这些移位时,表14中所规定的矩阵变成以下表16中所阐述的矩阵。
表16
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
43/64 21/32 19/32 17/32 27/64 21/64 11/64 3/32 -3/32 -11/64 -21/64 -27/64 -17/32 -19/32 -21/32 -43/64
27/32 23/32 15/32 5/32 -5/32 -15/32 -23/32 -27/32 -27/32 -23/32 -15/32 -5/32 5/32 15/32 23/32 27/32
227/256 139/256 29/256 -29/64 -203/256 -29/32 -47/64 -7/32 7/32 47/64 29/32 203/256 29/64 -29/256 -139/256 -227/256
5/4 1/2 -1/2 -5/4 -5/4 -1/2 1/2 5/4 5/4 1/2 -1/2 -5/4 -5/4 -1/2 1/2 5/4
203/256 29/256 -181/256 -7/8 -67/256 37/64 29/32 29/64 -29/64 -29/32 -37/64 67/256 7/8 181/256 -29/256 -203/256
1/2 -1/8 -19/32 -11/32 11/32 19/32 1/8 -1/2 -1/2 1/8 19/32 11/32 -11/32 -19/32 -1/8 1/2
49/64 -31/64 -59/64 7/64 61/64 17/64 -53/64 -37/64 37/64 53/64 -17/64 -61/64 -7/64 59/64 31/64 -49/64
1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1
37/64 -53/64 -17/64 61/64 -7/64 -59/64 31/64 49/64 -49/64 -31/64 59/64 7/64 -61/64 17/64 53/64 -37/64
11/32 -19/32 1/8 1/2 -1/2 -1/8 19/32 -11/32 -11/32 19/32 -1/8 -1/2 1/2 1/8 -19/32 11/32
29/64 -29/32 37/64 67/256 -7/8 181/256 29/256 -203/256 203/256 -29/256 -181/256 7/8 -67/256 -37/64 29/32 -29/64
1/2 -5/4 5/4 -1/2 -1/2 5/4 -5/4 1/2 1/2 -5/4 5/4 -1/2 -1/2 5/4 -5/4 1/2
7/32 -47/64 29/32 -203/256 29/64 29/256 -139/256 227/256 -227/256 139/256 -29/256 -29/64 203/256 -29/32 47/64 -7/32
5/32 -15/32 23/32 -27/32 27/32 -3/32 15/32 -5/32 -5/32 15/32 -23/32 27/32 -27/32 23/32 -15/32 5/32
3/32 -11/64 21/64 -27/64 17/32 -19/32 21/32 -43/64 43/64 -21/32 19/32 -17/32 27/64 -21/64 11/64 -3/32
参看表13,所有因子在[-1.25…1.25]范围中。比例因子的对角矩阵S的值变成以下值:
1 4 , 16 3770 1885 , 8 377 377 , 64 130 1885 , 58 29 , 64 130 1885 , 8 754 377 , 16 1885 1885 , 1 4 , 16 1885 1885 , 8 754 377 , 64 130 1885 , 58 29 , 64 130 1885 , 8 377 377 , 16 3770 1885 ,
在乘以四及转换成浮点值之后,其近似等于以下值:
[1.、2.084679494、1.648083848、1.548461055、1.050451463、1.548461055、2.330742531、1.474091007、1.、1.474091007、2.330742531、1.548461055、1.050451463、1.548461055、1.648083848、2.084679494]。
就实施方案复杂性来说,产生上文关于图4A至图4D所描述的实施方案的基础因子分解需要大约72次加法及以恒定的内部因子A至N进行的36次乘法。然而,由于内部因子A至N为整数(或二元有理数),因此可用一系列加法及移位操作来替代这些乘法。在以下表17中阐述第三设计的此无乘数实施方案的复杂性。
表17
Figure BPA00001481867000241
添加这些38次加法及48次移位以替代上文所提的36次乘法产生110次加法及48次移位的总实施方案复杂性。
对于第二设计来说,以下表18概述无乘数实施方案的复杂性。
表18
Figure BPA00001481867000242
在此例子中,在用32次加法及38次移位替代上文所提的36次乘法之后的总复杂性产生104次加法及38次移位的总实施方案复杂性。
对于第一设计来说,以下表19概述无乘数实施方案的复杂性。
表19
Figure BPA00001481867000251
在此例子中,在用22次加法及36次移位替代上文所提的36次乘法之后的总复杂性产生94次加法及36次移位的总实施方案复杂性。
在给定以上复杂性分析的情况下,第一设计提供执行DCT的适当近似值且需要执行比其它设计少的操作。第二设计涉及操作的相对适度增加以执行DCT近似(当与第一设计相比时),但关于执行DCT的准确度也改善(当与第一设计相比时)。第三设计为三个设计中的最复杂设计,但也提供执行所述三个设计的DCT的最准确近似值。取决于使用这些设计的上下文,可使用这些可能设计中的一者或一者以上。对于需要高效的功率消耗(作为一个实例)的移动应用来说,考虑到低实施方案复杂性一般转化为改善的功率效率,可使用第一设计。对于与功率效率关系不太大的装置来说,第二设计可关于实施方案复杂性而提供就准确度来说性能的适当平衡。对于需要更高等级的准确度的例子来说,可使用第三设计以提供就近似DCT来说所述三个设计中的最准确设计。
尽管在图4的实例中关于DCT-II单元进行描述,但此DCT-II单元也可表示根据本发明的技术建构的IDCT。从图4的实例中所示的实施方案形成逆DCT涉及颠倒输入及输出,使得由所述实施方案在图4的右边接收输入且在所述实施方案的左边来输出输出。换句话说,关于垂直存取使所述实施方案反转使得输入于是变成输出且输出变成输入将一般产生IDCT实施方案。出于说明容易的目的且考虑到从DCT形成IDCT在此项技术中是众所周知的,这些额外IDCT实施方案未展示于单独的图中。
图5为说明译码装置(例如,图2的视频编码器20)在应用根据本发明的技术建构的16点DCT实施方案时的示范性操作的流程图。首先,视频编码器20接收待编码的视频帧内的当前视频块30(90)。运动估计单元32执行运动估计以将视频块30与一个或一个以上邻近视频帧中的块相比较以产生一个或一个以上运动向量(92)。可从存储器34检索所述邻近帧。可针对可变大小(例如,16×16、16×8、8×16、8×8、4×4或更小的块大小)的块执行运动估计。运动估计单元32(例如)基于速率失真模型识别邻近帧中的最密切匹配当前视频块30的一个或一个以上块,且确定邻近帧中的块与所述当前视频块之间的移位。以此为基础,运动估计单元32从用以译码当前视频块30的参考帧产生指示当前视频块30与一个或一个以上匹配块之间的移位的量值及轨迹的一个或一个以上运动向量(MV)。所述匹配块将充当用于待译码的块的帧间译码的预测性(或预测)块。
运动向量可具有半像素精度或四分之一像素精度或甚至更精细的精度,从而允许视频编码器20以比整数像素位置高的精度追踪运动及获得更好的预测块。当使用具有分数像素值的运动向量时,在运动补偿单元36中执行内插操作。运动估计单元32使用某些准则(例如,速率失真模型)来识别视频块的最好块分区及运动向量。举例来说,在双向预测的状况下可能不仅仅存在运动向量。使用所得块分区及运动向量,运动补偿单元36形成预测视频块(94)。
视频编码器20通过在求和器48处从原始、当前视频块30减去由运动补偿单元36产生的预测视频块而形成残余视频块(96)。块变换单元38应用变换从而产生残余变换块系数。块变换单元38包括根据本发明中所描述的技术配置的16点DCT-II单元52。块变换单元38调用经缩放16点DCT-II单元52以将具有给定大小的一个或一个以上DCT-II应用于残余块,从而以上文所描述的方式产生具有对应大小的残余变换系数块。参看图4A至图4D的实例,16点DCT-II单元52可调用4点DCT-II单元76中的一者或一者以上以将4点DCT-II同时应用于数据的不同4×4残余块。或者,16点DCT-II单元52可调用8点DCT-II单元72以将8点DCT-II应用于8×8残余块。作为又一替代方案,16点DCT-II单元52可调用所有子或经嵌套4点DCT-II单元72、8点DCT-II单元72及8点DCT-Ⅳ单元74以应用16点DCT-II以处理16×16残余数据块。16点DCT-II单元52一般将残余块从空间域(其被表示为残余像素数据)变换到频域(其被表示为DCT系数)。以此方式,16点DCT-II单元52将一个或一个以上具有对应大小的DCT-II应用于残余数据以确定DCT系数(98)。所述变换系数可包含包括至少一个DC系数及一个或一个以上AC系数的DCT系数。
量化单元40量化(例如,舍位)残余变换块系数以进一步降低位速率(100)。如上文所提及,量化单元40通过并入有在因子分解期间所移除的因子来说明经缩放16点DCT-II单元52的缩放性质,所述因子在上文由对角比例因子矩阵S来识别。由于量化通常涉及乘法,因此将这些因子并入到量化单元40中可能不增加量化单元40的实施方案复杂性。在此方面,从经缩放16点DCT-II单元52移除因子可在不增加量化单元40的实施方案复杂性的情况下降低DCT-II单元52的实施方案复杂性,从而引起关于视频编码器20的实施方案复杂性的净降低。
熵译码单元46对经量化系数进行熵译码以甚至进一步降低位速率。熵译码单元46执行统计无损译码(在一些例子中,称为熵译码)以产生经译码位流(102)。熵译码单元46将经量化DCT系数的概率分布建模且基于经建模的概率分布选择码簿。使用此码簿,熵译码单元46以压缩经量化DCT系数的方式选择用于每一经量化DCT系数的代码。熵译码单元46将经熵译码系数作为经译码位流输出,所述经译码位流被存储到存储器或存储装置及/或发送到视频解码器26(104)。
重新建构单元42及逆变换单元44分别重新建构经量化系数及应用逆变换,以重新建构残余块。又,逆变换单元44可包括逆DCT(IDCT)(其通常称为执行16点DCT-II单元52的反向操作的III类型DCT),其类似于下文关于图3所描述的16点DCT-III单元68。求和单元50将重新建构的残余块加到由运动补偿单元36产生的运动补偿预测块以产生供存储于存储器34中的重新建构的视频块。所述重新建构的视频块由运动估计单元32及运动补偿单元36使用以编码后续视频帧中的块。
图6为说明译码装置(例如,图3的视频解码器26)在应用根据本发明的技术配置的16点DCT-III时的实例操作的流程图。视频解码器26接收已由视频编码器20编码的经编码视频位流。确切地说,熵解码单元54接收经编码视频位流且从所述位流解码经量化残余系数及经量化参数以及其它信息,例如宏块译码模式及运动信息(其可包括运动向量及块分区)(106、108)。运动补偿单元56接收运动向量及块分区以及来自存储器62的一个或一个以上重新建构的参考帧以产生预测视频块(110)。
重新建构单元58逆量化(即,解量化)经量化块系数(112)。逆变换单元60将逆变换(例如,逆DCT)应用于所述系数以产生残余块。更具体来说,逆变换单元60包括经缩放16点DCT-III单元68,逆变换单元60调用所述经缩放16点DCT-III单元68以处理所述系数且借此产生残余块(114)。经缩放16点DCT-III单元68(其为图2中所示的经缩放16点DCT-II单元52的反向形式)可将所述系数从频域变换到空间域从而以上文所描述的方式产生残余块。类似于上文的量化单元40,重新建构单元58通过将在因子分解期间所移除的外部因子并入到重新建构过程中来考虑到16点DCT-III单元68的缩放性质,且实施方案复杂性增加得很少甚至不增加。从经缩放16点DCT-III单元68移除因子可降低实施方案复杂性,借此引起视频解码器26的复杂性的净降低。
接着由求和器66对预测视频块与残余块求和以形成经解码块(116)。可应用解块滤波器(未图示)以对经解码块进行滤波从而移除块假影。接着将经滤波块放置于存储器62中,所述存储器62提供用于对后续视频帧进行解码的参考帧且还产生经解码视频以驱动显示装置(例如,图1的显示装置28)(118)。
尽管上文关于大小为16的DCT-II及DCT-III(其包括一个或一个以上经嵌套8点DCT-II及DCT-III以及一个或一个以上经嵌套4点DCT-II及DCT-III)加以描述,但所述技术不应限于这些特定大小。实情为,所述技术可应用于具有任何大小的任何DCT-II或DCT-III(其包括具有更小大小的经嵌套DCT-II及DCT-III)。因此,在此方面,所述技术不应限于本发明中所阐述的实例。
本发明的技术可实施于广泛多种装置或设备中,包括无线通信装置手持机(例如,移动电话)、集成电路(IC)或一组IC(即,芯片组)。已描述经提供以强调功能方面的任何组件、模块或单元且其未必需要通过不同硬件单元来实现。还可以硬件或硬件、软件、固件的任何组合来实施本文中所描述的技术。描述为模块、单元或组件的任何特征可一起实施于集成式逻辑装置中或单独实施为离散但可共同操作的逻辑装置。在一些状况下,可将各种特征实施为集成电路装置(例如,集成电路芯片或芯片组)。
如果以软件来实施,则可至少部分地通过包含指令的计算机可读媒体来实现所述技术,当在处理器中执行时,所述指令执行上文所描述的方法中的一者或一者以上。所述计算机可读媒体可包含为物理非暂时性结构的计算机可读存储媒体,且可形成可包括封装材料的计算机程序产品的一部分。所述计算机可读存储媒体可包含例如同步动态随机存取存储器(SDRAM)的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、闪存、磁性或光学数据存储媒体及其类似者。
可由一个或一个以上处理器如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA),或其它等效集成或离散逻辑电路来执行代码或指令。因此,如本文中所使用,术语“处理器”可指代前述结构中的任一者或适合于实施本文中所描述的技术的任何其它结构。另外,在一些方面中,本文中所描述的功能性可提供于为编码及解码而配置的专用软件模块或硬件模块内,或并入于组合的视频编解码器中。又,所述技术可完全实施于一个或一个以上电路或逻辑元件中。
本发明还涵盖多种集成电路装置中的任一者,其包括用以实施本发明中所描述的技术中的一者或一者以上的电路。可将此电路提供于单一集成电路芯片中或提供于所谓的芯片组中的多个可共同操作的集成电路芯片中。可将这些集成电路装置用于多种应用中,所述应用中的一些应用可包括在无线通信装置(例如,移动电话手持机)中的使用。已描述所述技术的各种方面。这些及其它方面在所附权利要求书的范畴内。

Claims (53)

1.一种设备,其包含:
16点逆离散余弦变换IDCT单元,其执行具有不同大小的多个IDCT,所述IDCT将内容数据从频域变换到空间域,其中所述16点IDCT单元包括:
执行所述多个IDCT中大小为8的一者的8点IDCT单元;
执行所述多个IDCT中大小为4的一者的4点IDCT单元,其中所述8点IDCT单元包括所述4点IDCT单元;及
包含第二4点IDCT单元及第三4点IDCT单元的逆8点DCT-IV单元,所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者执行所述多个IDCT中大小为4的一者。
2.根据权利要求1所述的设备,其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元各自同时执行所述多个IDCT中大小为4的所述一者以将所述内容数据的不同部分从所述频域变换到所述空间域。
3.根据权利要求1所述的设备,
其中所述至少一个8点IDCT单元执行所述多个IDCT中大小为8的所述一者以将所述内容数据的第一部分从所述频域变换到所述空间域,且
其中,与所述8点IDCT单元执行所述多个IDCT中大小为8的所述一者同时,所述第二4点IDCT单元及所述第三4点IDCT单元各自执行所述多个IDCT中大小为4的所述一者以将所述内容数据的相应第二部分及第三部分从所述频域变换到所述空间域。
4.根据权利要求1所述的设备,
其中所述至少一个8点IDCT单元执行所述多个IDCT中大小为8的所述一者以将所述内容数据的第一部分从所述频域变换到所述空间域,且
其中,与所述8点IDCT单元执行所述多个IDCT中大小为8的所述一者同时,所述第二4点IDCT单元或所述第三4点IDCT单元执行所述多个IDCT中大小为4的所述一者以将所述内容数据的第二部分从所述频域变换到所述空间域。
5.根据权利要求1所述的设备,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且其中内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N被设定成相应值1、2、11、3、9、7、15、10、15、10、17、6、18及1。
6.根据权利要求1所述的设备,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子变成二元有理数值,
其中用以正规化所述内部因子A及B的第一分母为2的一次幂,
其中用以正规化所述内部因子C、D、E及F的第二分母为2的二次幂,且
其中用以正规化所述内部因子G、H、I、J、K、L、M及N的第三分母为2的三次幂。
7.根据权利要求6所述的设备,其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子被设定成相应值1/2、1、11/16、3/16、9/16、7/16、15/16、10/16、15/16、10/16、17/16、6/16、18/16及1/16。
8.根据权利要求6所述的设备,其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子被设定成相应值1/2、1、11/16、3/16、9/16、7/16、34/64、27/64、38/64、21/64、42/64、11/64、43/64及6/64。
9.根据权利要求6所述的设备,其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子被设定成相应值2/4、5/4、19/32、4/32、16/32、11/32、34/64、27/64、38/64、21/64、42/64、11/64、43/64及6/64。
10.根据权利要求1所述的设备,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N被设定成相应值1、2、11、3、9、7、34、27、38、21、42、11、43及6。
11.根据权利要求1所述的设备,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N被设定成相应值2、5、19、4、16、11、34、27、38、21、42、11、43及6。
12.根据权利要求1所述的设备,其中所述16点IDCT单元执行所述多个IDCT中大小为16的一者以将所述内容数据从所述频域变换到所述空间域。
13.根据权利要求1所述的设备,
其中所述16点IDCT包含经缩放16点IDCT,所述经缩放16点IDCT执行具有不同大小的多个经缩放IDCT,所述经缩放IDCT将所述内容数据从所述频域变换到所述空间域且输出经缩放IDCT系数,
其中所述设备进一步包含量化单元,所述量化单元将比例因子应用于所述经缩放IDCT系数以便产生经量化的完整IDCT系数。
14.根据权利要求1所述的设备,
其中所述设备包含多媒体译码装置,且
其中所述内容数据包括视频数据、图像数据及音频数据中的一者或一者以上。
15.根据权利要求1所述的设备,其中所述设备包含手持机。
16.根据权利要求1所述的设备,其中所述16点IDCT-II单元执行所述多个IDCT-II中具有不同大小的两者或两者以上以便实施具有不同大小的二维IDCT-II,其中所述不同大小包括16×16、16×8、8×16、8×8、8×4、4×8及4×4。
17.一种方法,其包含:
通过译码装置接收内容数据;及
通过所述译码装置内所包括的16点IDCT单元来执行多个逆离散余弦变换IDCT中的一者或一者以上,所述IDCT将所述所接收的内容数据从空间域变换到频域,其中所述16点IDCT单元包括:
至少一个8点IDCT单元,其用以执行所述多个IDCT中大小为8的一者;
第一4点IDCT单元,其用以执行所述多个IDCT中大小为4的一者,其中所述至少一个8点IDCT单元包括所述第一4点IDCT单元;及
逆8点DCT-IV单元,其包含第二4点IDCT单元及第三4点IDCT单元,所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者执行所述多个IDCT中大小为4的一者。
18.根据权利要求17所述的方法,其进一步包含通过所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元来同时执行所述多个IDCT中大小为4的所述一者以将所述内容数据的不同部分从所述频域变换到所述空间域。
19.根据权利要求17所述的方法,其进一步包含:
通过所述至少一个8点IDCT单元执行所述多个IDCT中大小为8的所述一者以将所述内容数据的第一部分从所述频域变换到所述空间域,及
与所述8点IDCT单元执行所述多个IDCT中大小为8的所述一者同时,通过所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者执行所述多个IDCT中大小为4的所述一者以将所述内容数据的相应第二部分及第三部分从所述频域变换到所述空间域。
20.根据权利要求17所述的方法,其进一步包含:
通过所述至少一个8点IDCT单元执行所述多个IDCT中大小为8的所述一者以将所述内容数据的第一部分从所述频域变换到所述空间域,及
与所述8点IDCT单元执行所述多个IDCT中大小为8的所述一者同时,通过所述第二4点IDCT单元或所述第三4点IDCT单元执行所述多个IDCT中大小为4的所述一者以将所述内容数据的第二部分从所述频域变换到所述空间域。
21.根据权利要求17所述的方法,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N被设定成相应值1、2、11、3、9、7、15、10、15、10、17、6、18及1。
22.根据权利要求17所述的方法,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子变成二元有理数值,
其中用以正规化所述内部因子A及B的第一分母为2的一次幂,
其中用以正规化所述内部因子C、D、E及F的第二分母为2的二次幂,且
其中用以正规化所述内部因子G、H、I、J、K、L、M及N的第三分母为2的三次幂。
23.根据权利要求22所述的方法,其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子被设定成相应值1/2、1、11/16、3/16、9/16、7/16、15/16、10/16、15/16、10/16、17/16、6/16、18/16及1/16。
24.根据权利要求22所述的方法,其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子被设定成相应值1/2、1、11/16、3/16、9/16、7/16、34/64、27/64、38/64、21/64、42/64、11/64、43/64及6/64。
25.根据权利要求22所述的方法,其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子被设定成相应值2/4、5/4、19/32、4/32、16/32、11/32、34/64、27/64、38/64、21/64、42/64、11/64、43/64及6/64。
26.根据权利要求17所述的方法,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N被设定成相应值1、2、11、3、9、7、34、27、38、21、42、11、43及6。
27.根据权利要求17所述的方法,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N被设定成相应值2、5、19、4、16、11、34、27、38、21、42、11、43及6。
28.根据权利要求17所述的方法,其中所述16点IDCT单元执行所述多个IDCT中大小为16的一者以将所述内容数据从所述频域变换到所述空间域。
29.根据权利要求17所述的方法,
其中所述16点IDCT包含经缩放16点IDCT,所述经缩放16点IDCT执行具有不同大小的多个经缩放IDCT,所述经缩放IDCT将所述内容数据从所述频域变换到所述空间域且输出经缩放IDCT系数,
其中所述方法进一步包含通过量化单元将比例因子应用于所述经缩放IDCT系数以便产生经量化的完整IDCT系数。
30.根据权利要求17所述的方法,
其中在多媒体译码装置内执行所述方法,且
其中所述内容数据包括视频数据、图像数据及音频数据中的一者或一者以上。
31.根据权利要求17所述的方法,其中在手持机内执行所述方法。
32.根据权利要求17所述的方法,其进一步包含执行所述多个IDCT-II中具有不同大小的两者或两者以上以便实施具有不同大小的二维IDCT-II,其中所述不同大小包括16×16、16×8、8×16、8×8、8×4、4×8及4×4。
33.一种包含指令的非暂时性计算机可读存储媒体,所述指令在执行时使得处理器:
通过译码装置接收内容数据;及
通过所述译码装置内所包括的16点IDCT单元来执行多个逆离散余弦变换IDCT中的一者或一者以上,所述IDCT将所述所接收的内容数据从空间域变换到频域,其中所述16点IDCT单元包括:
至少一个8点IDCT单元,其用以执行所述多个IDCT中大小为8的一者;
第一4点IDCT单元,其用以执行所述多个经缩放IDCT中大小为4的一者,其中所述至少一个8点IDCT单元包括所述第一4点IDCT单元;及
逆8点DCT-IV单元,其包含第二4点IDCT单元及第三4点IDCT单元,所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者执行所述多个IDCT中大小为4的一者。
34.根据权利要求33所述的非暂时性计算机可读存储媒体,其中所述指令使得所述处理器通过所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元来同时执行所述多个IDCT中大小为4的所述一者以将所述内容数据的不同部分从所述频域变换到所述空间域。
35.根据权利要求33所述的非暂时性计算机可读存储媒体,其中所述指令进一步使得所述处理器:
通过所述至少一个8点IDCT单元执行所述多个IDCT中大小为8的所述一者以将所述内容数据的第一部分从所述频域变换到所述空间域;及
与所述8点IDCT单元执行所述多个IDCT中大小为8的所述一者同时,通过所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者执行所述多个IDCT中大小为4的所述一者以将所述内容数据的相应第二部分及第三部分从所述频域变换到所述空间域。
36.根据权利要求33所述的非暂时性计算机可读存储媒体,其中所述指令进一步使得所述处理器:
通过所述至少一个8点IDCT单元执行所述多个IDCT中大小为8的所述一者以将所述内容数据的第一部分从所述频域变换到所述空间域;及
与所述8点IDCT单元执行所述多个IDCT中大小为8的所述一者同时,通过所述第二4点IDCT单元或所述第三4点IDCT单元执行所述多个IDCT中大小为4的所述一者以将所述内容数据的第二部分从所述频域变换到所述空间域。
37.根据权利要求33所述的非暂时性计算机可读存储媒体,其中所述指令进一步使得所述处理器执行所述多个IDCT-II中具有不同大小的两者或两者以上以便实施具有不同大小的二维IDCT-II,其中所述不同大小包括16×16、16×8、8×16、8×8、8×4、4×8及4×4。
38.一种装置,其包含:
用于接收内容数据的装置;及
用于执行多个逆离散余弦变换中的一者或一者以上的装置,所述逆离散余弦变换将所述所接收的内容数据从空间域变换到频域,其中所述用于执行多个IDCT中的所述一者或一者以上的装置包括:
用于执行所述多个IDCT-II中大小为8的一者的装置;
用于执行所述多个经缩放IDCT-II中大小为4的第一者的第一装置,其中所述用于执行所述多个IDCT-II中大小为8的一者的装置包含所述用于执行所述多个经缩放IDCT-II中大小为4的一者的第一装置;
用于执行所述多个IDCT-II中大小为4的第二者的第二装置;及
用于执行所述多个经缩放IDCT-II中大小为4的第三者的第三装置。
39.根据权利要求38所述的装置,
其中所述用于执行所述多个经缩放IDCT-II中大小为4的第一者的第一装置包含第一4点IDCT-II单元,
其中用于执行所述多个IDCT-II中的一者或一者以上的装置包含16点IDCT-II单元,
其中所述用于执行所述多个IDCT-II中大小为4的所述第二者的第二装置包括第二4点IDCT-II单元,
其中所述用于执行所述多个IDCT-II中大小为4的所述第三者的第三装置包括第三4点IDCT-II单元,
其中所述用于执行所述多个IDCT-II中大小为8的所述一者的装置包括包含所述第一4点IDCT-II单元的8点IDCT-II单元,
其中所述16点IDCT单元包括逆8点DCT-IV单元,且
其中所述逆8点DCT-Ⅳ单元包括所述第二4点IDCT-II单元及所述第三4点DCT-II单元。
40.根据权利要求39所述的装置,其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元各自同时执行所述多个IDCT中大小为4的所述一者以将所述内容数据的不同部分从所述频域变换到所述空间域。
41.根据权利要求39所述的装置,
其中所述至少一个8点IDCT单元执行所述多个IDCT中大小为8的所述一者以将所述内容数据的第一部分从所述频域变换到所述空间域,且
其中,与所述8点IDCT单元执行所述多个IDCT中大小为8的所述一者同时,所述第二4点IDCT单元及所述第三4点IDCT单元各自执行所述多个IDCT中大小为4的所述一者以将所述内容数据的相应第二部分及第三部分从所述频域变换到所述空间域。
42.根据权利要求39所述的装置,
其中所述至少一个8点IDCT单元执行所述多个IDCT中大小为8的所述一者以将所述内容数据的第一部分从所述频域变换到所述空间域,且
其中,与所述8点IDCT单元执行所述多个IDCT中大小为8的所述一者同时,所述第二4点IDCT单元或所述第三4点IDCT单元执行所述多个IDCT中大小为4的所述一者以将所述内容数据的第二部分从所述频域变换到所述空间域。
43.根据权利要求39所述的装置,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且其中内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N被设定成相应值1、2、11、3、9、7、15、10、15、10、17、6、18及1。
44.根据权利要求39所述的装置,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子变成二元有理数值,
其中用以正规化所述内部因子A及B的第一分母为2的一次幂,
其中用以正规化所述内部因子C、D、E及F的第二分母为2的二次幂,且其中用以正规化所述内部因子G、H、I、J、K、L、M及N的第三分母为2的三次幂。
45.根据权利要求44所述的装置,其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子被设定成相应值1/2、1、11/16、3/16、9/16、7/16、15/16、10/16、15/16、10/16、17/16、6/16、18/16及1/16。
46.根据权利要求44所述的装置,其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子被设定成相应值1/2、1、11/16、3/16、9/16、7/16、34/64、27/64、38/64、21/64、42/64、11/64、43/64及6/64。
47.根据权利要求44所述的装置,其中所述内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N经正规化,使得这些内部因子被设定成相应值2/4、5/4、19/32、4/32、16/32、11/32、34/64、27/64、38/64、21/64、42/64、11/64、43/64及6/64。
48.根据权利要求39所述的装置,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N被设定成相应值1、2、11、3、9、7、34、27、38、21、42、11、43及6。
49.根据权利要求39所述的装置,
其中所述第一4点IDCT单元、所述第二4点IDCT单元及所述第三4点IDCT单元中的每一者包括内部因子A及B,
其中所述8点IDCT单元包括内部因子C、D、E及F,
其中所述逆8点DCT-IV单元包括内部因子G、H、I、J、K、L、M及N,且
其中内部因子A、B、C、D、E、F、G、H、I、J、K、L、M及N被设定成相应值2、5、19、4、16、11、34、27、38、21、42、11、43及6。
50.根据权利要求38所述的装置,其中用于执行多个IDCT中的一者或一者以上的装置执行所述多个IDCT中大小为16的一者以将所述内容数据从所述频域变换到所述空间域。
51.根据权利要求38所述的装置,
其中用于执行多个IDCT中的一者或一者以上的装置包括用于执行具有不同大小的多个经缩放IDCT的装置,所述经缩放IDCT将所述内容数据从所述频域变换到所述空间域且输出经缩放IDCT系数,
其中所述装置进一步包含用于将比例因子应用于所述经缩放IDCT系数以便产生经量化的完整IDCT系数的装置。
52.根据权利要求38所述的装置,
其中所述装置包含多媒体译码装置,且
其中所述内容数据包括视频数据、图像数据及音频数据中的一者或一者以上。
53.根据权利要求38所述的装置,其中所述装置包含手持机。
CN2010800276539A 2009-06-24 2010-06-23 用于媒体数据译码的16点变换 Pending CN102804172A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US21988509P 2009-06-24 2009-06-24
US61/219,885 2009-06-24
US12/820,346 US9081733B2 (en) 2009-06-24 2010-06-22 16-point transform for media data coding
US12/820,346 2010-06-22
PCT/US2010/039676 WO2011005578A2 (en) 2009-06-24 2010-06-23 16-point transform for media data coding

Publications (1)

Publication Number Publication Date
CN102804172A true CN102804172A (zh) 2012-11-28

Family

ID=43429782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800276539A Pending CN102804172A (zh) 2009-06-24 2010-06-23 用于媒体数据译码的16点变换

Country Status (8)

Country Link
US (1) US9081733B2 (zh)
EP (1) EP2446373A2 (zh)
JP (1) JP2013502625A (zh)
KR (1) KR101315629B1 (zh)
CN (1) CN102804172A (zh)
BR (1) BRPI1013297A2 (zh)
TW (1) TW201108744A (zh)
WO (1) WO2011005578A2 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9110849B2 (en) * 2009-04-15 2015-08-18 Qualcomm Incorporated Computing even-sized discrete cosine transforms
US9069713B2 (en) * 2009-06-05 2015-06-30 Qualcomm Incorporated 4X4 transform for media coding
US8762441B2 (en) * 2009-06-05 2014-06-24 Qualcomm Incorporated 4X4 transform for media coding
US9118898B2 (en) 2009-06-24 2015-08-25 Qualcomm Incorporated 8-point transform for media data coding
US9075757B2 (en) * 2009-06-24 2015-07-07 Qualcomm Incorporated 16-point transform for media data coding
US8451904B2 (en) * 2009-06-24 2013-05-28 Qualcomm Incorporated 8-point transform for media data coding
US9378185B2 (en) 2010-09-30 2016-06-28 Texas Instruments Incorporated Transform and quantization architecture for video coding and decoding
US9824066B2 (en) 2011-01-10 2017-11-21 Qualcomm Incorporated 32-point transform for media data coding
EP2732627A1 (en) * 2011-07-13 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) Encoder, decoder and methods thereof for reference picture management
US10452743B2 (en) * 2011-11-07 2019-10-22 Vid Scale, Inc. Video and data processing using even-odd integer transforms
CN102387367B (zh) * 2011-11-08 2014-01-08 复旦大学 适用于多种视频标准、多尺寸二维整数余弦变换的通用方法
CN102404569B (zh) * 2011-11-08 2014-01-08 复旦大学 可用于多种视频标准、多尺寸二维整数余弦反变换的通用方法
US8719321B2 (en) * 2011-12-11 2014-05-06 Hong Kong Applied Science and Technology Research Institute Company Limited Adaptive block-size transform using LLMICT
US9596463B2 (en) 2012-02-22 2017-03-14 Qualcomm Incorporated Coding of loop filter parameters using a codebook in video coding
EP3085095B1 (en) * 2013-12-22 2020-07-08 LG Electronics Inc. Method and apparatus for intra prediction of a video signal
KR101601864B1 (ko) * 2014-02-25 2016-03-10 숭실대학교산학협력단 동영상 코덱의 역변환 방법 및 그 장치
CN105100811B (zh) * 2014-05-14 2018-04-03 北京君正集成电路股份有限公司 一种视频变换的实现方法及装置
US10904573B2 (en) * 2017-11-30 2021-01-26 Embry-Riddle Aeronautical University, Inc. Reduced multiplicative complexity discrete cosine transform (DCT) circuitry
US10687081B2 (en) 2018-06-29 2020-06-16 Tencent America LLC Method, apparatus and medium for decoding or encoding
US10666981B2 (en) 2018-06-29 2020-05-26 Tencent America LLC Method, apparatus and medium for decoding or encoding
US11412258B2 (en) * 2020-02-12 2022-08-09 Tencent America LLC Line graph transforms (LGTs) using 8-bit and 10-bit cores
US11405647B2 (en) 2020-02-18 2022-08-02 Tencent America LLC Primary transforms using 8-bit and 10-bit cores

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1617594A (zh) * 2003-12-03 2005-05-18 威盛电子股份有限公司 以管线架构应用于离散余弦变换与反离散余弦变换的方法
WO2007047478A2 (en) * 2005-10-12 2007-04-26 Qualcomm Incorporated Efficient multiplication-free computation for signal and data processing
CN101375274A (zh) * 2006-01-11 2009-02-25 高通股份有限公司 使用共用因数的变换

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2581463B1 (fr) 1985-05-03 1989-09-08 Thomson Csf Dispositifs de calcul de transformees cosinus, dispositif de codage et dispositif de decodage d'images comportant de tels dispositifs de calcul
US5253055A (en) 1992-07-02 1993-10-12 At&T Bell Laboratories Efficient frequency scalable video encoding with coefficient selection
US5408425A (en) * 1993-05-25 1995-04-18 The Aerospace Corporation Split-radix discrete cosine transform
US5508949A (en) 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
US5649077A (en) 1994-03-30 1997-07-15 Institute Of Microelectronics, National University Of Singapore Modularized architecture for rendering scaled discrete cosine transform coefficients and inverse thereof for rapid implementation
TW284869B (zh) 1994-05-27 1996-09-01 Hitachi Ltd
JP3115199B2 (ja) 1994-12-16 2000-12-04 松下電器産業株式会社 画像圧縮符号化装置
US5737450A (en) 1995-05-15 1998-04-07 Polaroid Corporation Method and apparatus for fast two-dimensional cosine transform filtering
JP2778622B2 (ja) 1995-06-06 1998-07-23 日本電気株式会社 2次元dct回路
JPH09212484A (ja) 1996-01-30 1997-08-15 Texas Instr Inc <Ti> 離散コサイン変換方法
AU9030298A (en) 1997-08-25 1999-03-16 Qualcomm Incorporated Variable block size 2-dimensional inverse discrete cosine transform engine
CN1213612C (zh) 1997-11-17 2005-08-03 索尼电子有限公司 用于采用离散变换进行数字视频数据去压缩的方法和系统
US6252994B1 (en) 1998-01-26 2001-06-26 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
US6222944B1 (en) 1998-05-07 2001-04-24 Sarnoff Corporation Down-sampling MPEG image decoder
JP2001346213A (ja) 2000-06-02 2001-12-14 Nec Corp 離散コサイン変換装置及びその離散コサイン変換方法
US20020106020A1 (en) 2000-02-09 2002-08-08 Cheng T. C. Fast method for the forward and inverse MDCT in audio coding
JP2004523815A (ja) 2000-10-23 2004-08-05 インターナショナル・ビジネス・マシーンズ・コーポレーション スケーリング項、アーリー・アボート、および精度リファインメントを用いた高速変換
US7929610B2 (en) 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
US7366236B1 (en) * 2001-06-04 2008-04-29 Cisco Sytems Canada Co. Source adaptive system and method for 2D iDCT
US7185037B2 (en) 2001-08-23 2007-02-27 Texas Instruments Incorporated Video block transform
ATE363183T1 (de) 2001-08-24 2007-06-15 Koninkl Philips Electronics Nv Addieren von halbbildern eines bildes
US7082450B2 (en) 2001-08-30 2006-07-25 Nokia Corporation Implementation of a transform and of a subsequent quantization
US6882685B2 (en) 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
KR100481067B1 (ko) 2001-09-28 2005-04-07 브이케이 주식회사 분산 산술 처리장치 및 그를 이용한 이차원 이산여현변환 처리장치
US7088791B2 (en) 2001-10-19 2006-08-08 Texas Instruments Incorporated Systems and methods for improving FFT signal-to-noise ratio by identifying stage without bit growth
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
FR2834362A1 (fr) 2001-12-28 2003-07-04 Koninkl Philips Electronics Nv Dispositif de transformation inverse adaptatif
JP2003223433A (ja) 2002-01-31 2003-08-08 Matsushita Electric Ind Co Ltd 直交変換方法、直交変換装置、符号化方法、符号化装置、逆直交変換方法、逆直交変換装置、復号化方法、及び、復号化装置
US7007055B2 (en) 2002-03-12 2006-02-28 Intel Corporation Method of performing NxM Discrete Cosine Transform
US7242713B2 (en) 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
US20060069035A1 (en) * 2002-05-08 2006-03-30 Higazi Abd Al-Roof Peptide for regulation of urokinase plasminogen activator and method of optimizing therapeutic efficacy
US7437394B2 (en) 2002-06-19 2008-10-14 The Aerospace Corporation Merge and split discrete cosine block transform method
US20040136602A1 (en) 2003-01-10 2004-07-15 Nithin Nagaraj Method and apparatus for performing non-dyadic wavelet transforms
US7412100B2 (en) 2003-09-04 2008-08-12 Qualcomm Incorporated Apparatus and method for sub-sampling images in a transform domain
US7379500B2 (en) 2003-09-30 2008-05-27 Microsoft Corporation Low-complexity 2-power transform for image/video compression
TWI241074B (en) 2003-11-05 2005-10-01 Bing-Fei Wu Image compression system using two-dimensional discrete wavelet transformation
US20050213835A1 (en) 2004-03-18 2005-09-29 Huazhong University Of Science & Technology And Samsung Electronics Co., Ltd. Integer transform matrix selection method in video coding and related integer transform method
US8861600B2 (en) * 2004-06-18 2014-10-14 Broadcom Corporation Method and system for dynamically configurable DCT/IDCT module in a wireless handset
US7587093B2 (en) 2004-07-07 2009-09-08 Mediatek Inc. Method and apparatus for implementing DCT/IDCT based video/image processing
US7471850B2 (en) 2004-12-17 2008-12-30 Microsoft Corporation Reversible transform for lossy and lossless 2-D data compression
US7792385B2 (en) 2005-01-25 2010-09-07 Globalfoundries Inc. Scratch pad for storing intermediate loop filter data
TW200643848A (en) 2005-06-01 2006-12-16 Wintek Corp Method and apparatus for four-color data conversion
US20070025441A1 (en) 2005-07-28 2007-02-01 Nokia Corporation Method, module, device and system for rate control provision for video encoders capable of variable bit rate encoding
TWI280804B (en) 2005-09-26 2007-05-01 Yuh-Jue Chuang Method for splitting 8x8 DCT into four 4x4 modified DCTS used in AVC/H. 264
US7725516B2 (en) 2005-10-05 2010-05-25 Qualcomm Incorporated Fast DCT algorithm for DSP with VLIW architecture
TWI311856B (en) * 2006-01-04 2009-07-01 Quanta Comp Inc Synthesis subband filtering method and apparatus
CN100562111C (zh) 2006-03-28 2009-11-18 华为技术有限公司 离散余弦逆变换方法及其装置
US8849884B2 (en) * 2006-03-29 2014-09-30 Qualcom Incorporate Transform design with scaled and non-scaled interfaces
EP1850597A1 (en) 2006-04-24 2007-10-31 Universität Dortmund Method and circuit for performing a cordic based Loeffler discrete cosine transformation (DCT), particularly for signal processing
US8571340B2 (en) 2006-06-26 2013-10-29 Qualcomm Incorporated Efficient fixed-point approximations of forward and inverse discrete cosine transforms
US8582663B2 (en) 2006-08-08 2013-11-12 Core Wireless Licensing S.A.R.L. Method, device, and system for multiplexing of video streams
US8548815B2 (en) 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
US8654833B2 (en) 2007-09-26 2014-02-18 Qualcomm Incorporated Efficient transformation techniques for video coding
WO2009045683A1 (en) 2007-09-28 2009-04-09 Athanasios Leontaris Video compression and tranmission techniques
US20090141808A1 (en) 2007-11-30 2009-06-04 Yiufai Wong System and methods for improved video decoding
US8631060B2 (en) 2007-12-13 2014-01-14 Qualcomm Incorporated Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
KR20090078494A (ko) 2008-01-15 2009-07-20 삼성전자주식회사 영상 데이터의 디블록킹 필터링 방법 및 디블록킹 필터
CN101330616B (zh) 2008-07-31 2011-04-13 上海交通大学 视频解码过程中反离散余弦变换的硬件实现装置及方法
US20100172409A1 (en) 2009-01-06 2010-07-08 Qualcom Incorporated Low-complexity transforms for data compression and decompression
US9110849B2 (en) 2009-04-15 2015-08-18 Qualcomm Incorporated Computing even-sized discrete cosine transforms
US9069713B2 (en) 2009-06-05 2015-06-30 Qualcomm Incorporated 4X4 transform for media coding
US8762441B2 (en) 2009-06-05 2014-06-24 Qualcomm Incorporated 4X4 transform for media coding
US9075757B2 (en) 2009-06-24 2015-07-07 Qualcomm Incorporated 16-point transform for media data coding
US8451904B2 (en) 2009-06-24 2013-05-28 Qualcomm Incorporated 8-point transform for media data coding
US9118898B2 (en) 2009-06-24 2015-08-25 Qualcomm Incorporated 8-point transform for media data coding
CN101989253B (zh) 2009-07-31 2012-08-29 鸿富锦精密工业(深圳)有限公司 离散余弦转换电路及使用其的影像处理装置
US9824066B2 (en) 2011-01-10 2017-11-21 Qualcomm Incorporated 32-point transform for media data coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1617594A (zh) * 2003-12-03 2005-05-18 威盛电子股份有限公司 以管线架构应用于离散余弦变换与反离散余弦变换的方法
WO2007047478A2 (en) * 2005-10-12 2007-04-26 Qualcomm Incorporated Efficient multiplication-free computation for signal and data processing
WO2007047478A3 (en) * 2005-10-12 2008-09-25 Qualcomm Inc Efficient multiplication-free computation for signal and data processing
CN101375274A (zh) * 2006-01-11 2009-02-25 高通股份有限公司 使用共用因数的变换

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
R.JOSHI ET AL.: "Simplified transforms for extended block sizes", 《ITU-TELECOMMUNICATIONS STANDARDIZATION SECTOR》 *

Also Published As

Publication number Publication date
TW201108744A (en) 2011-03-01
WO2011005578A3 (en) 2012-05-18
US9081733B2 (en) 2015-07-14
WO2011005578A2 (en) 2011-01-13
US20110153699A1 (en) 2011-06-23
JP2013502625A (ja) 2013-01-24
EP2446373A2 (en) 2012-05-02
KR101315629B1 (ko) 2013-10-08
BRPI1013297A2 (pt) 2016-03-29
KR20120048571A (ko) 2012-05-15

Similar Documents

Publication Publication Date Title
CN102804172A (zh) 用于媒体数据译码的16点变换
CN102804171B (zh) 用于媒体数据译码的16点变换
US11647194B2 (en) Look-up table for enhanced multiple transform
CN102713895B (zh) 用于媒体编码的4x4变换
CN102667757B (zh) 用于媒体编码的4x4变换
CN102460425B (zh) 计算偶数尺寸的离散余弦变换
CN102804173A (zh) 用于媒体数据译码的8点变换
CN102714714A (zh) 用于媒体数据译码的8点变换
JP4920034B2 (ja) マルチスレッドsimd処理を利用したメディア符号化の並列実行
CN103190147B (zh) 用于视频译码的语法元素的联合译码方法及设备
CN101743751B (zh) 视帧内预测模式而定的残差块的自适应变换
CN108605141A (zh) 用于紧凑多遍变换的高效参数存储
CN103299620B (zh) 在视频译码中使用最可能扫描次序对用于视频块的扫描次序信息进行有效译码
CN103380425A (zh) 用于媒体数据译码的32点变换
CN103238323A (zh) 在视频译码中基于视频块的扫描次序对块内的最后有效系数的位置进行译码
US20100172409A1 (en) Low-complexity transforms for data compression and decompression
CN108605142A (zh) 用于视频译码的多遍不可分开的变换
CN108702517A (zh) 使用优化的紧凑多遍变换的高效变换编码
CN103238322A (zh) 在视频译码中单独地译码视频块的最后有效系数的位置
CN105474647A (zh) 关于多层视频译码中的层间预测类型的处理位流限制
CN105103549A (zh) 根据重要系数的参数的重要系数编码和解码
CN104041040A (zh) 用于无损视频编码的预测残差编码
CN102792698A (zh) 用于运动内插法的色度高精度运动滤波
CN105264895B (zh) 再取样过程中的中间数据的动态范围控制

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121128