JP5497163B2 - メディアコード化のための4×4変換 - Google Patents

メディアコード化のための4×4変換 Download PDF

Info

Publication number
JP5497163B2
JP5497163B2 JP2012514201A JP2012514201A JP5497163B2 JP 5497163 B2 JP5497163 B2 JP 5497163B2 JP 2012514201 A JP2012514201 A JP 2012514201A JP 2012514201 A JP2012514201 A JP 2012514201A JP 5497163 B2 JP5497163 B2 JP 5497163B2
Authority
JP
Japan
Prior art keywords
idct
factor
internal
dct
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012514201A
Other languages
English (en)
Other versions
JP2012529128A (ja
Inventor
レズニク、ユリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2012529128A publication Critical patent/JP2012529128A/ja
Application granted granted Critical
Publication of JP5497163B2 publication Critical patent/JP5497163B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • H04N19/45Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Discrete Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Description

優先権の主張
本出願は、2009年6月5日に出願された米国仮出願第61/184,656号と、2009年6月24日に出願された米国仮出願第61/219,887号との利益を主張する。
特許に対する本出願は、本出願の譲受人に譲渡され、参照により明白にここに組み込まれ、同時に出願された、代理人ドケット第092164U2号を有する、同時継続中の米国特許出願“メディアコード化のための4×4変換”に関連する。
本開示は、データ圧縮に関し、より詳細には、変換を伴うデータ圧縮に関する。
背景
データ記憶空間、送信帯域幅、あるいはその両方の消費を低減させるために、データ圧縮が、さまざまなアプリケーションにおいて広く使用されている。データ圧縮の例示的な適用は、デジタルビデオ、画像、スピーチおよびオーディオの、コード化のような、可視または可聴のメディアデータのコード化を含む。例えば、デジタルビデオのコード化は、デジタルテレビ、デジタル直接放送システム、ワイヤレス通信デバイス、パーソナルデジタルアシスタント(PDA)、ラップトップまたはデスクトップコンピュータ、デジタルカメラ、デジタル記録デバイス、ビデオゲームデバイス、セルラまたは衛星無線電話機、あるいは、これらに類似するものを含む、広範囲のデバイスにおいて使用されている。デジタルビデオデバイスは、MPEG−2、MPEG−4、または、H.264/MPEG−4 Advanced Video Coding(AVC)のような、ビデオ圧縮技術を実現して、より効率的にデジタルビデオを送信および受信する。
一般に、ビデオ圧縮技術は、空間的予測、動き推定および動き補償を実行して、ビデオデータに固有の冗長性を低減させるか、または、取り除く。特に、イントラコード化は、空間的予測に依拠して、所定のビデオフレーム内のビデオ中の空間的冗長性を低減させるかまたは取り除く。インターコード化は、時間的予測に依拠して、近接したフレーム内のビデオ中の時間的冗長性を低減させるかまたは取り除く。インターコード化に対して、ビデオエンコーダは、動き推定を実行して、2つ以上の近接フレーム間の、整合するビデオブロックの動きを追跡する。動き推定は、動きベクトルを発生させ、動きベクトルは、1つ以上の参照フレーム中の対応するビデオブロックに対する、ビデオブロックの変位を示す。動き補償は、動きベクトルを使用して、参照フレームから予測ビデオブロックを生成させる。動き補償後に、元のビデオブロックから予測ビデオブロックを減算することにより、残差ビデオブロックが形成される。
ビデオエンコーダは次に、量子化および無損失統計コード化プロセスが後に続く変換を適用して、ビデオコード化プロセスにより生成される残差ブロックのビットレートをさらに低減させる。いくつかの例において、適用される変換は、離散コサイン変換(DCT)を含む。通常、DCTは、(“4×4ビデオブロックと呼ばれることが多い)高さ4画素、幅4画素であるビデオブロックのような、サイズが2の累乗であるビデオブロックに適用される。それゆえに、これらのDCTが、4×4ビデオブロックに適用されて、DCT係数の4×4行列が生成されるという点において、これらのDCTは、4×4DCTと呼ばれ得る。4×4DCTを残差ブロックに適用することから生成される、DCT係数の4×4行列は、量子化および無損失統計コード化プロセスを受けて、ビットストリームを発生させる。(“エントロピーコード化”プロセスとしても知られている)統計コード化の例は、コンテキスト適応可変長コード化(CAVLC)またはコンテキストバイナリ算術コード化(CABAC)を含む。ビデオデコーダは、エンコードされたビットストリームを受信し、無損失デコーディングを実行して、ブロックのそれぞれに対する残差情報を復元する。残差情報および動き情報を使用して、ビデオデコーダは、エンコードされたビデオを再構築する。
概要
一般に、本開示は、従来の4×4離散コサイン変換(DCT)に比べてコード化利得の増加を提供する、近似の4×4 DCTの1つ以上の構成を使用して、メディアデータのようなデータをコード化する技術に向けられている。本開示の技術にしたがって適用される4×4 DCTの構成は、スケーリングされたファクタと、内部ファクタとの間のさまざまな関係を伴う。用語“スケーリングされたファクタ”は、因数分解によって取り除かれる、4×4 DCTの構成から外部のファクタを指す。用語“内部ファクタ”は、因数分解後にとどまる、4×4 DCTの構成内部のファクタを指す。4×4 DCTの1つの例示的な構成は、直交であり、直交は、4×4 DCTを表す係数の行列が、この行列の転置により乗算されるときに、恒等行列に等しくなることを意味する。4×4 DCTの別の例示的な構成は、ほぼ直交(または、おおよそ直交)である。以下で詳細に記述されるさまざまな関係に従うことにより、本技術は、両方の例において、行列の係数の選択を容易にし、データに適用されるとき、従来の4×4 DCTと比べてコード化利得の増加を促進し得る、直交およびほぼ直交の4×4 DCT構成をもたらす。
1つの観点において、装置は、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、前記スケーリングされたファクタに関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する直交の4×4 DCTを実現する、4×4DCTハードウェアユニットを備える。4×4 DCTハードウェアユニットは、4×4 DCT構成をメディアデータに適用して、空間領域から周波数領域にメディアデータを変換する。
別の観点において、方法は、4×4離散コサイン変換(DCT)ハードウェアユニットにより、直交の4×4 DCT構成をメディアデータに適用して、空間領域から周波数領域にメディアデータを変換することを含む。直交の4×4 DCT構成は、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、スケーリングされたファクタに関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を含む。
別の観点において、装置は、直交の4×4離散コサイン変換(DCT)構成をメディアデータに適用して、空間領域から周波数領域に前記メディアデータを変換する手段を備える。直交の4×4 DCT構成は、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、スケーリングされたファクタに関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を含む。
別の観点において、非一時的コンピュータ読み取り可能記憶媒体は命令を記憶しており、プロセッサにより実行されるとき、命令は、4×4離散コサイン変換(DCT)ハードウェアユニットにより、直交の4×4 DCT構成をメディアデータに適用して、空間領域から周波数領域にメディアデータを変換することをプロセッサに生じさせる。直交の4×4 DCT構成は、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、スケーリングされたファクタに関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を含む。
別の観点において、装置は、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、スケーリングされたファクタに関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する直交の4×4 DCTの逆離散コサイン変換を実現する、4×4 IDCTハードウェアユニットを備える。4×4 IDCTハードウェアユニットは、4×4 IDCT構成を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換する。
別の観点において、方法は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、直交の4×4 DCTの4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換することを含む。直交の4×4 DCTは、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、スケーリングされたファクタに関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を含む。
別の観点において、装置は、直交の4×4 DCTの4×4逆離散コサイン変換(IDCT)を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換する手段を備える。直交の4×4 DCTは、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、スケーリングされたファクタに関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を含む。
別の観点において、非一時的コンピュータ読み取り可能記憶媒体は命令を記憶しており、プロセッサにより実行されるとき、命令は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、直交の4×4 DCTの4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換することをプロセッサに生じさせる。直交の4×4 DCTは、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、スケーリングされたファクタに関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を含む。
別の観点において、装置は、4×4離散コサイン変換(DCT)ハードウェアユニットを備え、DCTモジュールは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の変数(C、S)を適用する奇数部を有する非直交の4×4 DCTを実現する。変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す。4×4 DCTハードウェアユニットは、4×4 DCT構成をメディアデータに適用して、空間領域から周波数領域に前記メディアデータを変換する。
別の観点において、方法は、4×4 離散コサイン変換(DCT)ハードウェアユニットにより、非直交の4×4 DCTをメディアデータに適用して、空間領域から周波数領域にメディアデータを変換することを含む。非直交の4×4 DCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の変数(C、S)を適用する奇数部を含む。変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す方法。
別の観点において、装置は、4×4 離散コサイン変換(DCT)ハードウェアユニットにより、非直交の4×4 DCTをメディアデータに適用して、空間領域から周波数領域にメディアデータを変換する手段を備える。非直交の4×4 DCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の変数(C、S)を適用する奇数部を含む。変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す。
別の観点において、非一時的コンピュータ読み取り可能記憶媒体は命令を記憶しており、プロセッサにより実行されるとき、命令は、4×4 離散コサイン変換(DCT)ハードウェアユニットにより、非直交の4×4 DCTをメディアデータに適用して、空間領域から周波数領域にメディアデータを変換することをプロセッサに生じさせる。非直交の4×4 DCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の変数(C、S)を適用する奇数部を含む。変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す。
別の観点において、装置は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットを備える。IDCTハードウェアユニットは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTの逆DCTを実現する。変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す。4×4 IDCTハードウェアユニットは、4×4 IDCT構成を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換する。
別の観点において、方法は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換することを含む。4×4 IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含む。変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す。
別の観点において、装置は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換する手段を備える。4×4 IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含む。変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す。
別の観点において、非一時的コンピュータ読み取り可能記憶媒体が命令を記憶しており、プロセッサにより実行されるとき、命令は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換することをプロセッサに生じさせる。4×4 IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含む。変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す。
別の観点において、装置は、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4離散コサイン変換(DCT)を実現する4×4 DCTハードウェアユニットを備える。スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、第1の内部ファクタ(A)と第2の内部ファクタ(B)との合計に等しい。4×4 DCTハードウェアユニットは、4×4 DCT構成をメディアデータに適用して、空間領域から周波数領域にメディアデータを変換する。
別の観点において、方法は、4×4離散コサイン変換(DCT)ハードウェアユニットにより、非直交の4×4 DCTをメディアデータに適用して、空間領域から周波数領域に前記メディアデータを変換することを含む。非直交の4×4 DCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を含み、スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、第1の内部ファクタ(A)と第2の内部ファクタ(B)との合計に等しい。
別の観点において、装置は、4×4離散コサイン変換(DCT)ハードウェアユニットにより、非直交の4×4 DCTをメディアデータに適用して、空間領域から周波数領域にメディアデータを変換する手段を備える。非直交の4×4 DCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を含み、スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、第1の内部ファクタ(A)と第2の内部ファクタ(B)との合計に等しい。
別の観点において、非一時的コンピュータ読み取り可能記憶媒体は命令を記憶しており、プロセッサにより実行されるとき、命令は、4×4離散コサイン変換(DCT)ハードウェアユニットにより、非直交の4×4 DCTをメディアデータに適用して、空間領域から周波数領域にメディアデータを変換することをプロセッサに生じさせる。非直交の4×4 DCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を含み、スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、第1の内部ファクタ(A)と第2の内部ファクタ(B)との合計に等しい。
別の観点において、装置は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットを備える。4×4 IDCTハードウェアユニットは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを実現する。スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、第1の内部ファクタ(A)と第2の内部ファクタ(B)との合計に等しく、4×4 IDCTハードウェアユニットは、4×4 IDCT構成を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換する。
別の観点において、方法は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換することを含む。IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、第1の内部ファクタ(A)と第2の内部ファクタ(B)との合計に等しい。
別の観点において、装置は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換する手段を備える。IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、第1の内部ファクタ(A)と第2の内部ファクタ(B)との合計に等しい。
別の観点において、非一時的コンピュータ読み取り可能記憶媒体は命令を記憶しており、プロセッサにより実行されるとき、命令は、4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域にメディアデータを変換することをプロセッサに生じさせる。IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、第1の内部ファクタ(A)と第2の内部ファクタ(B)との合計に等しい。
本技術の1つ以上の観点の詳細は、添付図面と、以下の詳細な説明において示される。本開示中で記述される技術の他の特徴、目的および利点は、詳細な説明、図面および特許請求の範囲から明らかになるであろう。
図1は、ビデオエンコーディングおよびデコーディングのシステムを図示するブロック図である。 図2は、より詳細に、図1のビデオエンコーダを図示するブロック図である。 図3は、より詳細に、図1のビデオデコーダを図示するブロック図である。 図4Aは、本開示の技術にしたがって構築される、スケーリングされた4×4DCT−IIの構成を図示する図である。 図4Bは、本開示の技術にしたがって構築される、スケーリングされた4×4DCT−IIの構成を図示する図である。 図4Cは、本開示の技術にしたがって構築される、スケーリングされた4×4DCT−IIの構成を図示する図である。 図5は、本開示の技術にしたがって構築される4×4 DCT構成を適用する際の、コード化デバイスの例示的な動作を説明するフローチャートである。 図6は、本開示の技術にしたがって構築される4×4 DCT−III構成を適用する際の、コード化デバイスの例示的な動作を説明するフローチャートである。 図7Aは、本開示の技術にしたがって構築される4×4 DCT−II構成に対する、ビットレートに対するピーク信号対雑音比のグラフを図示する図である。 図7Bは、本開示の技術にしたがって構築される4×4 DCT−II構成に対する、ビットレートに対するピーク信号対雑音比のグラフを図示する図である。 図7Cは、本開示の技術にしたがって構築される4×4 DCT−II構成に対する、ビットレートに対するピーク信号対雑音比のグラフを図示する図である。
詳細な説明
一般に、本開示は、さまざまな関係にしたがって選択された係数の4×4行列として表される、1つ以上の4×4離散コサイン変換(DCT)を使用して、データをコード化する技術に向けられている。本技術を適用して、デジタルビデオデータ、画像データ、スピーチデータおよび/またはオーディオデータのような、可視または可聴のメディアデータを含む、さまざまなデータを圧縮して、それによって、そのようなデータを表すそのような電気信号を、電気信号のより効率的な処理、送信またはアーカイブのために圧縮信号に変換してもよい。本開示の技術にしたがって規定されたさまざまな関係に従うことにより、データに対して適用されるとき、4×4 DCTの直交およびほぼ直交の構成が、コード化利得の増加を促進するように、係数行列に対して係数を選択してもよい。
上記のサイズ、すなわち、4×4が、離散データの単位の点で表される。説明するために、ビデオデータは、ビデオブロックの点で、特に、ビデオ圧縮に関して説明されることが多い。ビデオブロックは一般に、ビデオフレームの任意のサイズの部分を指し、ビデオフレームは、一連のピクチャまたは画像における、ピクチャまたは画像を指す。各ビデオブロックは通常、複数の離散画素データを含み、離散画素データは、例えば、赤、青および緑のような色成分(いわゆる、“色度”または“クロマ”成分)、あるいは、輝度成分(いわゆる、“ルーマ”成分)のいずれかを示す。各組の画素データは、ビデオブロック中の単一の1×1点を構成し、ビデオブロックに関して離散データの単位と考えてもよい。したがって、例えば、4×4ビデオブロックは、各行中に4つの離散的な組の画素データを有する、4つの行の画素データから成り立っている。nビットの値を各画素に割り当てて、色または輝度の値を指定してもよい。
オーディオデータであろうと、スピーチデータであろうと、画像データであろうと、または、ビデオデータであろうと、DCTは、DCTが処理できるデータのブロックのサイズの点で一般に記述される。例えば、DCTが、4×4のデータのブロックを処理できる場合、DCTは、4×4 DCTと呼ばれてもよい。さらに、特定のタイプとして、DCTを表してもよい。8の異なるタイプのDCTの、最も一般に用いられるタイプのDCTは、タイプ−IIのDCTであり、“DCT−II”として表してもよい。一般にDCTに言及するとき、そのような言及は、タイプIIのDCTすなわちDCT−IIを指すことが多い。DCT−IIの逆は、タイプIIIのDCTと呼ばれ、同様に、“DCT−III”と表されることがあり、または、DCTがDCT−IIを指す共通の理解により、“IDCT”として表されることもある。ここで、“IDCT”中の“I”は、逆を表す。以下のDCTに対する言及は、この表記に従い、特に指定がない限り、DCTに対する一般的な言及は、DCT−IIを指す。しかしながら、混乱を回避するために、DCT−IIを含むDCTは、たいてい、対応するタイプ(II、IIIなど)を示して以下で言及される。
本開示中で記述される技術は、4×4 DCT−IIの1つ以上の構成を用いて、データの圧縮および/または復元を容易にする、エンコーダおよび/またはデコーダの両方を伴う。繰り返すが、これらの4×4 DCT−II構成を適用することによって達成される圧縮および復元は、物理的計算ハードウェア、物理的送信媒体(例えば、銅、光ファイバ、ワイヤレスまたは他の媒体)および/または記憶ハードウェア(例えば、磁気または光のディスクまたはテープ、あるいは、任意のさまざまな固体媒体)を使用して、信号をより効率的に、処理、送信および/または記憶できるように、データを表す電気信号の物理的変換を可能にする。前記構成は、ハードウェア中で単独で構成されてもよく、または、ハードウェアおよびソフトウェアの組み合わせにおいて構成されてもよい。
4×4 DCT−IIの構成は、直交または、ほぼ直交であってもよい。用語“直交”は、行列の転置により乗算されるときに、行列が、恒等行列に等しくなる行列全般の特性を指す。用語“ほぼ直交”は、この直交の特性が緩和される場合を指し、それにより、厳格な直交性は要求されない。この点で、“ほぼ直交”は、おおよそまたはゆるく直交することを示唆する。しかしながら、ほぼ直交の行列は、直交の技術的定義を満たさず、そのようなほぼ直交の行列を、純然たる技術的観点から、非直交と考えてもよい。
本開示において記述される4×4 DCT−IIの直交の構成を説明するために、4×4 DCTモジュールを含む装置を考える。4×4 DCTモジュールは、本開示中で記述される技術にしたがって構築される直交の4×4 DCT−IIを実現する。この直交の4×4 DCT−IIの構成は、奇数部と偶数部とを含む。いわゆる、4×4 DCT−IIの“奇数部”は、奇数番号の係数を出力する、4×4 DCT−II構成の部分を指す。いわゆる、4×4 DCT−IIの“偶数部”は、偶数番号の係数を出力する、4×4 DCT−II構成の部分を指す。
本開示の技術にしたがうと、奇数部は、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、スケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタC、Sを適用する。用語“内部ファクタ”は、因数分解後に留まる、4×4 DCTの構成内部のファクタを指す。用語“スケーリングされたファクタ”は、因数分解によって取り除かれる、4×4 DCTの構成から外部のファクタを指す。
内部ファクタは一般に、構成の複雑さの点で、費用がかかるかもしれない乗算を必要とすることにより、構成の複雑さを増加させる。例えば、乗算は、より単純な加算よりも、完了するのに3倍またはより大きな倍数の計算動作(例えば、クロックサイクル)を必要とするかもしれない。特定の乗算器を実現して、より効率的に(例えば、より少ないクロックサイクルで)乗算を実行してもよいが、これらの乗算器は通常、チップまたはシリコンの表面積を著しく多く消費し、さらに、大きな電力量を消費するかもしれない。それゆえに、特に、セルラ電話機、いわゆる“スマート”セルラ電話機、パーソナルデジタルアシスタント(PDA)、ラップトップコンピュータ、いわゆる“ネットブック”および、これらに類似するものを含む、ほとんどの移動デバイスのような、電力に敏感なデバイスにおいて、ファクタによる乗算は、回避されることが多い。因数分解は、それによって、1つ以上の内部ファクタを、4×4 DCT−II構成から取り除き、外部ファクタに置き換えるプロセスである。例えば、ビデオエンコーダに関して、通常、複雑さにおける最小の費用または増加により、外部ファクタを、後続の量子化動作中に組み込むことができる。
いずれにしても、上記の、第1および第2の内部ファクタC、Sと、スケーリングされたファクタ(ξ)との間の上述の関係は、4×4 DCT−IIの以前の構成において使用されていない内部ファクタの特定の値を提供する。例えば、それぞれ、2および5の、内部ファクタCおよびSに対する値は、構成の複雑さを過度に増加させず、CおよびSに対して1および2の値を伴う既知の4×4 DCT構成に比べて、コード化利得に改良を加える。ビデオエンコーダは次に、内部ファクタ2および5を有する4×4 DCT−II構成をメディアデータに適用して、空間領域から周波数領域にメディアデータを変換する。この直交の4×4 DCT−II構成を適用することにより、1および2の内部ファクタを含む標準のDCT−II構成と比較したとき、本技術は、(圧縮効率を表す用語である)コード化利得を促進する。
直交性は、それが可逆であることから、DCT−II構成に関して一般に望まれる。1つの例として、この可逆の特性により、ビデオエンコーダは、直交の4×4 DCT構成を適用して、ビデオデータの残差ブロックから、DCT係数を生成させることが可能になる。ビデオデコーダは次に、4×4逆DCT−II(IDCT)構成を適用して、データ中の何らかの損失をほとんど伴わずに、DCT−II係数から、ビデオデータの残差ブロックを再構築できる。ビデオエンコーディングの主な目標が、データの保存であることを考えると、H.264ビデオコード化標準規格のような、さまざまなコード化標準規格は、4×4DCTの直交の構成を採用している。
直交性は一般に、理論上は望まれるが、実際は、ビデオ、オーディオまたは一般のコード化パイプラインは、いわゆる“雑音”を持ち込む多数のステップを伴い、雑音は、ほとんどの点において、直交の4×4 DCT−II構成により提供される値の正確な再構築を有効に妨げる。整数演算の構成を考えると、ほぼ直交の変換が、コード化効率を改善させ、また、一方で、厳密に直交の整数変換と比較して、構成の複雑さを低減させる可能性がある。事実上、直交の特性を緩和することは、雑音をシステムに持ち込むが、コード化利得を改善する一方で、構成の複雑さを低減させる可能性がある。
本開示中で記述される、4×4 DCT−IIのほぼ直交の構成を説明するために、装置の4×4 DCTモジュールが、本開示中で記述される技術にしたがって構築される、このほぼ直交の4×4 DCT−IIを実現すると考える。このほぼ直交の4×4 DCT−II構成はまた、奇数部と偶数部とを含む。この例における奇数部は、以下の等式によるスケーリングされたファクタ(ξ)に関連している、第1および第2の内部ファクタ(C、S)を適用する:
Figure 0005497163
この等式において、変数ωおよびψは、元の(無理数の)内部変換ファクタを表し、例えば、(ω)は、8により除算された定数パイ(π)の3倍の余弦であってもよく、(ψ)は、8により除算された定数パイ(π)の3倍の正弦であってもよい。変数(C)および(S)は、(ω)および(ψ)の代わりに置かれる、整数(または2進分数)の内部変換ファクタを表す。等式(2)は、スケーリングされたファクタ(ξ)が、(ψ)を加えた(ω)によって除算される、第1の内部ファクタ(C)と第2の内部ファクタ(S)との合計に等しいことを示している。この等式は、直交の構成に関して規定した上述の関係に類似の、CおよびSの特定の内部ファクタ値を識別するかもしれないが、異なる外部ファクタをもたらす。しかしながら、異なる外部ファクタは通常、上記の理由から、構成の複雑さを増加させないが、一般に、元の変換ファクタのより正確な近似を提供する。それはまた、従来の4×4 DCT−II構成に比べて、さらに、場合によっては、上述した直交の4×4 DCT−II構成に比べて、改善されたコード化利得を提供する可能性がある。結果として、制御ユニットは、このほぼ直交の4×4 DCT−IIをメディアデータに適用して、潜在的に改善されたコード化利得の結果とともに、空間領域から周波数領域にメディアデータを変換する。
図1は、ビデオエンコーディングおよびデコーディングのシステム10を図示するブロック図である。図1中で示されているように、システム10は、通信チャネル16によって、エンコードされたビデオを受信ハードウェアデバイス14に送信するソースハードウェアデバイス12を含む。ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、送信機22とを含んでいてもよい。宛先デバイス14は、受信機24と、ビデオデコーダ26と、ビデオディスプレイデバイス28とを含んでいてもよい。
図1の例において、通信チャネル16は、無線周波数(RF)スペクトルまたは1つ以上の物理送信ラインのような、任意のワイヤレスまたはワイヤード通信媒体、あるいは、ワイヤレスおよびワイヤード媒体の任意の組み合わせを含んでいてもよい。チャネル16は、ローカルエリアネットワーク、ワイドエリアネットワーク、または、インターネットのようなグローバルネットワークのような、パケットベースのネットワークの部分を形成してもよい。通信チャネル16は一般に、ソースデバイス12から受信デバイス14にビデオデータを送信するための、任意の適切な通信媒体、または、異なる通信媒体の集合を表す。
ソースデバイス12は、宛先デバイス14に送信するためのビデオを発生させる。しかしながら、いくつかのケースにおいて、デバイス12、14は、実質的に対称的な方法で動作してもよい。例えば、デバイス12、14のそれぞれは、ビデオエンコーディングコンポーネントおよびビデオデコーディングコンポーネントを含んでいてもよい。したがって、システム10は、例えば、ビデオストリーミング、ビデオブロードキャスティングまたはビデオ電話通信に対して、ビデオデバイス12、14の間の一方向または双方向のビデオ送信をサポートしてもよい。他のデータ圧縮およびコード化アプリケーションに対して、デバイス12、14は、画像データ、スピーチデータ、またはオーディオデータ、あるいは、ビデオデータ、画像データ、スピーチデータおよびオーディオデータのうちの2つ以上の組み合わせ、のような、他のタイプのデータを送信し、受信し、または交換するように構成できる。したがって、ビデオアプリケーションに関する以下の記述は、説明のために提供され、ここで広く記述する開示のさまざまな観点の限定と考えるべきではない。
ビデオソース18は、1つ以上のビデオカメラのようなビデオ取り込みデバイス、以前に取り込んだビデオを含んでいるビデオアーカイブ、またはビデオコンテンツプロバイダから供給されるライブビデオを含んでいてもよい。さらなる代替として、ビデオソース18は、ソースビデオとしてコンピュータグラフィックベースのデータ、または、ライブビデオおよびコンピュータにより生成されたビデオの組み合わせを生成させてもよい。いくつかのケースにおいて、ビデオソース18がカメラである場合、ソースデバイス12および受信デバイス14は、いわゆるカメラ電話機またはビデオ電話機を形成してもよい。したがって、いくつかの観点において、ソースデバイス12、受信デバイス14、あるいはその両方は、移動電話機のような、ワイヤレス通信デバイスハンドセットを形成してもよい。それぞれのケースにおいて、取り込まれた、事前に取り込まれている、または、コンピュータにより生成されたビデオは、送信機22、チャネル16および受信機24を介して、ビデオソースデバイス12からビデオ受信デバイス14のビデオデコーダ26に送信するために、ビデオエンコーダ20によりエンコードされてもよい。ディスプレイデバイス28は、液晶ディスプレイ(LCD)、プラズマディスプレイまたは有機発光ダイオード(OLED)ディスプレイのような、さまざまなディスプレイデバイスのいずれかを含んでいてもよい。
ビデオエンコーダ20およびビデオデコーダ26は、空間、時間、および/または、信号対雑音比(SNR)のスケーラビリティに対して、スケーラブルなビデオコード化をサポートするように構成されていてもよい。いくつかの観点において、ビデオエンコーダ20およびビデオデコーダ22は、微粒度SNRスケーラビリティ(FGS)コード化をサポートするように構成されていてもよい。エンコーダ20およびデコーダ26は、ベースレイヤおよび1つ以上のスケーラブルな拡張レイヤの、エンコーディング、送信およびデコーディングをサポートすることによって、さまざまな程度のスケーラビリティをサポートしてもよい。スケーラブルなビデオコード化に対して、ベースレイヤは、最小レベルの品質を有するビデオデータを搬送する。1つ以上の拡張レイヤは、追加のビットストリームを搬送して、より高い、空間、時間および/またはSNRのレベルをサポートする。
ビデオエンコーダ20およびビデオデコーダ26は、MPEG−2、MPEG−4、ITU−T H.263、または、ITU−T H.264/MPEG−4 Advanced Video Coding(AVC)のようなビデオ圧縮標準規格にしたがって動作してもよい。図1中に示されていないが、いくつかの観点において、ビデオエンコーダ20およびビデオデコーダ26は、それぞれ、オーディオエンコーダおよびオーディオデコーダと統合されていてもよく、共通のデータストリームまたは別々のデータストリーム中のオーディオおよびビデオの両方のエンコーディングを取り扱うために、適切なMUX−DEMUXユニットまたは他のハードウェアおよびソフトウェアを含んでいてもよい。該当する場合、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、または、ユーザデータグラムプロトコル(UDP)のような他のプロトコルに従ってもよい。
いくつかの観点において、ビデオブロードキャスティングに対して、例えば、ワイヤレスビデオブロードキャストサーバまたはワイヤレス通信デバイスハンドセットによって、フォワードリンクオンリー(FLO)無線インターフェース仕様である、技術標準規格TIA−1099(“FLO仕様”)として発行されている“地上モバイルマルチメディアマルチキャストのためのフォワードリンクオンリー無線インターフェース仕様”を使用して、地上モバイルマルチメディアマルチキャスト(TM3)システムにおいてリアルタイムのビデオサービスを配信するために、本開示中で記述される技術を適用して、H.264ビデオコード化を拡張してもよい。FLO仕様は、ビットストリームのシンタックスおよびセマンティックスを定義し、FLO無線インターフェースに適切なプロセスをデコードする例を含む。代わりに、DVB−H(デジタルビデオブロードキャスト−ハンドヘルド)、ISDB−T(統合デジタルブロードキャストサービス−地上)、または、DMB(デジタルメディアブロードキャスト)のような、他の標準規格にしたがって、ビデオをブロードキャストしてもよい。したがって、ソースデバイス12は、移動ワイヤレス端末、ビデオストリーミングサーバ、または、ビデオブロードキャストサーバであってもよい。しかしながら、本開示中で記述される技術は、何らかの特定のタイプの、ブロードキャスト、マルチキャスト、または、ポイントツーポイントシステムに限定されない。ブロードキャストのケースにおいて、ソースデバイス12は、いくつかのチャネルのビデオデータを複数の受信デバイスにブロードキャストしてもよく、それぞれの受信デバイスは、図1の受信デバイス14に類似していてもよい。
ビデオエンコーダ20およびビデオデコーダ26はそれぞれ、1つ以上のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラム可能ゲートアレイ信号(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、あるいは、これらの任意の組み合わせとして実現してもよい。したがって、ビデオエンコーダ20およびビデオデコーダ26のそれぞれは、集積回路(IC)チップまたはデバイスとして少なくとも部分的に実現されて、1つ以上のエンコーダまたはデコーダ中に含まれていてもよく、エンコーダまたはデコーダのいずれかは、それぞれの移動デバイス、加入者デバイス、ブロードキャストデバイス、サーバまたはこれらに類似するものにおける、結合されたエンコーダ/デコーダ(CODEC)の一部として統合されていてもよい。加えて、ソースデバイス12および受信デバイス14は、それぞれ、該当する場合、ワイヤレス通信をサポートするのに十分な、無線周波数(RF)ワイヤレスコンポーネントおよびアンテナを含む、エンコードされたビデオの送信および受信のための、適切な変調、復調、周波数変換、フィルタリングおよび増幅のコンポーネントを含んでいてもよい。しかしながら、説明を容易にするために、そのようなコンポーネントを、図1中で示していない。
ビデオシーケンスは、一連のビデオフレームを含む。ビデオエンコーダ20は、ビデオデータをエンコードするために、個々のビデオフレーム内の画素のブロックに対して動作する。ビデオブロックは、固定された、または変化するサイズを有していてもよく、指定されたコード化標準規格にしたがってサイズが異なっていてもよい。各ビデオフレームは、一連のスライスを含む。各スライスは、一連のマクロブロックを含み、マクロブロックは、サブブロックに配列されていてもよい。一例として、ITU−T H.264標準規格は、ルーマ成分に対して16×16、8×8、4×4、および、クロマ成分に対して8×8のような、さまざまな2進ブロックサイズにおけるイントラ予測だけでなく、ルーマ成分に対して16×16、16×8、8×16、8×8、8×4、4×8および4×4、およびクロマ成分に対して、対応するスケーリングされたサイズのような、さまざまなブロックサイズにおけるインター予測もサポートする。
より小さいビデオブロックは一般に、より良い解像度を提供でき、より高いレベルのディテールを含むビデオフレームの場所に対して使用してもよい。一般に、マクロブロック(MB)およびさまざまなサブブロックは、ビデオブロックを表すものと考えられる。さらに、スライスは、MBおよび/またはサブブロックのような、一連のビデオブロックを表すものと考えられる。各スライスは、独立してデコード可能な単位であってもよい。予測後、2進または非2進のサイズの残差ブロックに対して変換を実行してもよく、イントラ_16×16予測モードが使用される場合、クロマ成分またはルーマ成分に対する4×4ブロックのDCT係数に対して、追加の変換を適用してもよい。
図1のシステム10のビデオエンコーダ20および/またはビデオデコーダ26は、それぞれ、4×4 DCT−IIの構成と、それの逆(例えば、4×4 DCT−III)とを含むように構成されていてもよく、4×4 DCT−IIは、本開示において記述される、4×4サイズのDCTに対してDCT−II行列の係数を選択する技術のさまざまな関係のうちの1つにしたがう。ITU−T H.264標準規格は、ルーマ成分に対して16×16、8×8、4×4、および、クロマ成分に対して8×8のような、さまざまなブロックサイズにおけるイントラ予測をサポートしているが、コード化効率を改善するための、この標準規格に対する改訂が、現在進行中である。改訂される1つの標準規格は、ITU−T H.265または単にH.265と呼ばれる(次世代ビデオコード化またはNGVCと呼ばれることもある)。図7Aないし7Cに関して以下で記述するように、本開示の技術にしたがって示されるさまざまな関係のうちの1つに従う、タイプIIの4×4 DCT(“DCT−II”)は、ピーク信号対雑音比(PSNR)の点で測定されるようなコード化効率を改善することができる。結果として、ITU−T H.265、および、他の進化しつつある標準規格または仕様は、コード化効率を改善するために、これらのDCT−IIを考慮に入れるかもしれない。
本開示中で記述される技術にしたがうと、従来の構成と比べて改善されたコード化利得を促進できるさまざまな関係のうちの1つに従う方法で、4×4 DCT−IIの構成を生成させることができる。第1の関係は、4×4 DCT−IIの直交の構成に対して定義され、等式(1)を参照して以下で示される:
Figure 0005497163
ここで、CおよびSは、4×4 DCT−II構成の“奇数”部中の第1および第2の内部ファクタを表し、(ξ)は、4×4 DCT−II構成の“奇数”部に適用される、スケーリングされたファクタを表す。いわゆる、4×4 DCT−IIの“奇数部”は、奇数番号の係数を出力する、4×4 DCT−II構成の部分を指す。いわゆる、4×4 DCT−IIの“偶数”部は、偶数番号の係数を出力する、4×4 DCT−II構成の部分を指す。用語“内部ファクタ”は、因数分解後に留まる、4×4 DCTの構成内部のファクタを指す。用語“スケーリングされたファクタ”は、因数分解によって取り除かれる、4×4 DCTの構成から外部のファクタを指す。
内部ファクタは一般に、構成の複雑さの点で、費用がかかるかもしれない乗算を必要とすることにより、構成の複雑さを増加させる。例えば、乗算は、より単純な加算よりも、完了するのに3倍またはより大きな倍数の計算動作(例えば、クロックサイクル)を必要とするかもしれない。特定の乗算器を実現して、より効率的に(例えば、より少ないクロックサイクルで)乗算を実行してもよいが、これらの乗算器は通常、チップまたはシリコンの表面積を著しく多く消費し、さらに、大きな電力量を消費するかもしれない。それゆえに、特に、セルラ電話機、いわゆる“スマート”セルラ電話機、パーソナルデジタルアシスタント(PDA)、ラップトップコンピュータ、いわゆる“ネットブック”および、これらに類似するものを含む、ほとんどの移動デバイスのような、電力に敏感なデバイスにおいて、ファクタによる乗算は、回避されることが多い。因数分解は、それによって、1つ以上の内部ファクタを、4×4 DCT−II構成から取り除き、外部ファクタに置き換えるプロセスである。例えば、ビデオエンコーダに関して、通常、複雑さにおける最小の費用または増加により、外部ファクタを、後続の量子化動作中に組み込むことができる。
いずれにしても、上記の、第1および第2の内部ファクタC、Sと、スケーリングされたファクタ(ξ)との間の上述の関係は、4×4 DCT−IIの以前の構成において使用されていない内部ファクタの特定の値を提供する。例えば、それぞれ、2および5の、内部ファクタCおよびSに対する値は、構成の複雑さを過度に増加させず、CおよびSに対して1および2の値を伴う既知の4×4 DCT構成に比べて、コード化に改良を加える。ビデオエンコーダは次に、内部ファクタ2および5を有する4×4 DCT−II構成をメディアデータに適用して、空間領域から周波数領域にメディアデータを変換する。この直交の4×4 DCT−II構成を適用することにより、1および2の内部ファクタを含む標準のDCT−II構成と比較したとき、本技術は、(圧縮効率を表す用語である)コード化利得を促進する。
直交性は、それが可逆であることから、DCT−II構成に関して一般に望まれる。1つの例として、この可逆の特性により、ビデオエンコーダは、直交の4×4 DCT構成を適用して、ビデオデータの残差ブロックから、DCT係数を生成させることが可能になる。ビデオデコーダは次に、4×4逆DCT−II(IDCT)構成を適用して、データ中の何らかの損失をほとんど伴わずに、DCT−II係数から、ビデオデータの残差ブロックを再構築できる。H.264ビデオコード化標準規格のような、いくつかのコード化標準規格は、4×4 DCTの直交の構成を採用している。
直交性は一般に、理論上は望まれるが、実際は、ビデオ、オーディオまたは一般のコード化パイプラインは、いわゆる“雑音”を持ち込む(スケーリングまたは量子化のような)多数の追加のステップを伴い、雑音は、ほとんどの点において、直交の4×4 DCT−II構成により提供される値の正確な再構築を有効に妨げる。結果として、直交の特性を緩和して、(技術的に言えば非直交である)ほぼ直交を達成することが、可能である。整数演算の構成を考えると、そのようなほぼ直交の変換が、コード化効率を改善させ、また、一方で、厳密に直交の整数変換と比較して、構成の複雑さを低減させる可能性がある。一般に、直交の特性を緩和することは、雑音をシステムに持ち込むが、コード化利得を改善する一方で、構成の複雑さを低減させる可能性がある。
4×4 DCT−IIのほぼ直交の構成を説明するために、1つの例として、制御ユニットを含む装置を考える。制御ユニットが、本開示中で記述される技術にしたがって、ほぼ直交の4×4 DCT−IIを実現する。このほぼ直交の4×4 DCT−II構成はまた、奇数部と偶数部とを含む。この例における奇数部は、以下の等式(2)によるスケーリングされたファクタ(ξ)に関連している、第1および第2の内部ファクタ(C、S)を適用する:
Figure 0005497163
等式(2)において、変数ωおよびψは、元の(無理数の)内部変換ファクタを表し、例えば、(ω)は、8により除算された定数パイ(π)の3倍の余弦であってもよく、(ψ)は、8により除算された定数パイ(π)の3倍の正弦であってもよい。変数(C)および(S)は、(ω)および(ψ)の代わりに置かれる、整数(または2進分数)の内部変換ファクタを表す。等式(2)は、スケーリングされたファクタ(ξ)が、(ψ)を加えた(ω)によって除算される、第1の内部ファクタ(C)と第2の内部ファクタ(S)との合計に等しいことを示している。この等式は、直交の構成に関して規定した上述の関係に類似の、CおよびSの特定の内部ファクタ値を識別するかもしれないが、異なる外部ファクタをもたらす。しかしながら、異なる外部ファクタは通常、上記の理由から、構成の複雑さを増加させないが、一般に、元の変換ファクタのより正確な近似を提供する。それはまた、従来の4×4 DCT−II構成に比べて、さらに、場合によっては、上述した直交の4×4 DCT−II構成に比べて、改善されたコード化利得を提供する可能性がある。結果として、制御ユニットは、このほぼ直交の4×4 DCT−IIをメディアデータに適用して、潜在的に改善されたコード化利得の結果とともに、空間領域から周波数領域にメディアデータを変換する。
本開示中で記述される技術にしたがって構築される、上述の結果の4×4 DCT−II構成は、直接の4×4 DCT−II構成に対して、スケーリングされた4×4 DCT−II構成を表す。構成は、それらが内部ファクタを取り除くために因数分解を受けており、その結果、4×4 DCTを正確に計算するために追加の外部ファクタが適用されることを必要とする、スケーリングされた係数を出力するという点で、“スケーリング”される。いわゆる、“直接の”DCT−II構成は、4×4 DCTを正確に計算するために、外部ファクタによる乗算のような、何らかのさらなる演算を必要としない係数を出力する。
スケーリングされた4×4 DCT−II構成を生成させることができる、多数の異なる因数分解がある。1つの代替の因数分解は、スケーリングされた異なる4×4 DCT−II構成を生成させ、その構成から、本開示の技術にしたがって別の関係を導出して、H.264に準拠するビデオエンコーダによって一般に用いられている従来のDCT−IIと比べてコード化利得を改善するほぼ直交の構成を生成させることができる。
スケーリングされた4×4 DCT−IIを生成させる代替の因数分解に関して、ほぼ直交の構成を説明するために、1つの例として、制御ユニットを含む装置を考える。制御ユニットは、本開示中で記述される技術にしたがって、ほぼ直交の4×4 DCT−IIを実現する。このほぼ直交の4×4 DCT−II構成は、上述した構成に類似の、奇数部と偶数部とを含む。この例における奇数部は、以下の等式(3)によるスケーリングされたファクタ(ξ)に関連している、第1および第2の内部ファクタ(A、B)を適用する:
Figure 0005497163
等式(3)は、スケーリングされたファクタ(ξ)が、2の平方根により除算された1を加えた1により除算された、第1の内部ファクタ(A)と第2の内部ファクタ(B)との合計に等しいことを示す。この等式は、それぞれ、内部ファクタAおよびBに対して、7および5の特定の値を識別してもよい。代替の因数分解を使用し、上記の内部ファクタにより構築される、この結果として生じるほぼ直交の4×4 DCT−II構成は、従来のH.264の4×4 DCT−II構成よりも、直接の4×4 DCT−IIの無理数の内部ファクタをより正確に表し、その結果、従来の4×4 DCT−II構成と比べて、改善されたコード化利得を提供することができる。結果として、制御ユニットは、このほぼ直交の4×4 DCT−IIをメディアデータに適用して、潜在的に改善されたコード化利得の結果とともに、空間領域から周波数領域にメディアデータを変換する。
図2は、より詳細に、図1のビデオエンコーダ20を図示するブロック図である。ビデオエンコーダ20は、集合的に集積回路デバイスと呼ばれてもよい、1つ以上の集積回路デバイスとして少なくとも部分的に形成されていてもよい。いくつかの観点において、ビデオエンコーダ20は、ワイヤレス通信デバイスハンドセットまたはブロードキャストサーバの一部を形成してもよい。ビデオエンコーダ20は、ビデオフレーム内のブロックの、イントラコード化およびインターコード化を実行してもよい。イントラコード化は、空間的予測に依拠して、所定のビデオフレーム内のビデオ中の空間的冗長性を低減させるかまたは取り除く。インターコード化は、時間的予測に依拠して、ビデオシーケンスの近接フレーム内のビデオ中の時間的冗長性を低減させるかまたは取り除く。インターコード化に対して、ビデオエンコーダ20は、動き推定を実行して、近接フレーム間の、整合するビデオブロックの動きを追跡する。
図2中で示されているように、ビデオエンコーダ20は、エンコードすべきビデオフレーム内の現在のビデオブロック30を受け取る。図2の例において、ビデオエンコーダ20は、動き推定ユニット32と、参照フレーム記憶装置34と、動き補償ユニット36と、ブロック変換ユニット38と、量子化ユニット40と、逆量子化ユニット42と、逆変換ユニット44と、エントロピーコード化ユニット46とを含む。(示していない)インループまたはポストループのデブロッキングフィルタを適用して、ブロックをフィルタリングしてブロッキングアーティファクトを取り除いてもよい。ビデオエンコーダ20はまた、加算器48と加算器50とを含む。図2は、ビデオブロックのインターコード化に対する、ビデオエンコーダ20の時間的予測コンポーネントを図示する。説明を容易にするために図2中で示されていないが、ビデオエンコーダ20はまた、いくつかのビデオブロックのイントラコード化に対する、空間的予測コンポーネントを含んでいてもよい。
動き推定ユニット32は、ビデオブロック30を、1つ以上の近接したビデオフレーム中のブロックと比較して、1つ以上の動きベクトルを生成させる。近接フレームを、参照フレーム記憶装置34から取得してもよく、参照フレーム記憶装置34は、以前にエンコードされたブロックから再構築されるビデオブロックを記憶するために、任意のタイプのメモリまたはデータ記憶デバイスを備えていてもよい。動き推定は、例えば、16×16、16×8、8×16、8×8、または、より小さいブロックサイズのような、可変サイズのブロックに対して実行してもよい。動き推定ユニット32は、例えば、レート歪みモデルに基づいて、現在のビデオブロック30に最も整合する、近接フレーム中の1つ以上のブロックを識別し、近接フレーム中のブロックと、現在のビデオブロックとの間の変位を決定する。これをもとに、動き推定ユニット32は、1つ以上の動きベクトル(MV)を生成させる。動きベクトル(MV)は、現在のビデオブロック30と、現在のビデオブロック30をコード化するために使用される参照フレームからの1つ以上の整合ブロックとの間の変位の、大きさと軌道とを示す。整合ブロックは、コード化すべきブロックのインターコード化に対して、予測ブロックとして役割を果たすであろう。
動きベクトルは、ハーフ画素またはクォータ画素の精度、あるいは、さらに細かい精度を有していてもよく、ビデオエンコーダ20が、整数画素のロケーションよりも高い精度により動きを追跡し、より適切な予測ブロックを取得することが可能になる。分数の画素値を有する動きベクトルが使用されるとき、補間動作が、動き補償ユニット36において実行される。動き推定ユニット32は、レート歪みモデルのような、ある基準を使用して、ビデオブロックに対して、最良のブロックパーティションと動きベクトルとを識別する。例えば、双方向の予測のケースにおいて、より多い動きベクトルがあってもよい。結果として生じるブロックパーティションおよび動きベクトルを使用して、動き補償ユニット36は、予測ビデオブロックを形成する。
ビデオエンコーダ20は、加算器48において、動き補償ユニット36によって生成された予測ビデオブロックを、元の現在のビデオブロック30から減算することにより、残差ビデオブロックを形成する。ブロック変換ユニット38が、残差変換ブロック係数を生成させる変換を適用する。図2中で示されているように、ブロック変換ユニット38は、本開示中で記述される技術にしたがって構築される4×4 DCT−IIを実現する4×4 DCT−IIユニット52を含んでいる。4×4 DCT−IIユニット52は、場合によっては、(デジタル信号プロセッサ、または、ソフトウェアコードまたは命令を実行するDSPのような)ソフトウェアを実行するハードウェアモジュールを表し、先に特定した3つの関係のうちの1つにより定義される内部ファクタを有する4×4 DCT−IIを実現する。ブロック変換ユニット38は、スケーリングされた4×4 DCT−IIユニット52を残差ブロックに適用して、残差変換係数の4×4ブロックを生成させる。4×4 DCT−IIユニット52は一般に、残差画素データとして表される空間領域から、DCT係数として表される周波数領域に、残差ブロックを変換する。変換係数は、少なくとも1つのDC係数と、1つ以上のAC係数とを含むDCT係数を含んでいてもよい。
量子化ユニット40は、残差変換ブロック係数を量子化して(例えば、丸めて)、ビットレートをさらに低減させる。上述したように、量子化ユニット40は、因数分解の間に取り除かれた内部ファクタを取り入れることにより、スケーリングされた4×4 DCT−IIユニット52の、スケーリングされた性質に対処する。すなわち、量子化ユニット40は、図4Aないし4Cの構成70Aないし70Cを参照して以下で示す外部ファクタを取り入れる。量子化は通常、乗算を伴うことから、これらのファクタを量子化ユニット40に取り入れることは、量子化ユニット40の構成の複雑さを増加させない可能性がある。この点で、スケーリングされた4×4 DCT−IIユニット52からファクタを取り除くことは、量子化ユニット40の構成の複雑さを増加させることなく、DCT−IIユニット52の構成の複雑さを減少させ、ビデオエンコーダ20に関して、構成の複雑さの最終的な減少をもたらす。
エントロピーコード化ユニット46は、量子化された係数をエントロピーコード化して、ビットレートをさらに低減させる。エントロピーコード化ユニット46は、場合によっては、エントロピーコード化と呼ばれる、無損失統計コード化を実行する。エントロピーコード化ユニット46は、量子化されたDCT係数の確率分布をモデル化し、モデル化された確率分布に基づいて、コードブック(例えば、CAVLCまたはCABAC)を選択する。このコードブックを使用して、エントロピーコード化ユニット46は、量子化されたDCT係数を圧縮するように、量子化された各DCT係数に対してコードを選択する。説明するように、エントロピーコード化ユニット46は、頻繁に発生する量子化DCT係数に対して、(ビットの点で)短いコードワードを選択し、頻繁に発生しない量子化DCT係数に対して、(ビットの点で)より長いコードワードを選択してもよい。短いコードワードが、量子化されたDCT係数よりも少ないビットを使用する限り、概して、エントロピーコード化ユニット46は、量子化されたDCT係数を圧縮する。エントロピーコード化ユニット46は、ビデオデコーダ26に送られるビットストリームとして、エントロピーコード化された係数を出力する。一般に、図3の例を参照して記述するように、ビデオデコーダ26は、逆の動作を実行して、ビットストリームから、エンコードされたビデオをデコードして再構築する。
再構築ユニット42および逆変換ユニット44は、残差ブロックを再構築するために、それぞれ、量子化された係数を再構築し、逆変換を適用する。加算ユニット50は、再構築された残差ブロックを、動き補償ユニット36によって生成された、動き補償された予測ブロックに加算して、参照フレーム記憶装置34中での記憶のために、再構築されたビデオブロックを生成させる。再構築されたビデオブロックは、後続のビデオフレーム中のブロックをエンコードするために、動き推定ユニット32および動き補償ユニット36によって使用される。
図3は、より詳細に、図1のビデオデコーダ26の例を図示するブロック図である。ビデオデコーダ26は、集合的に集積回路デバイスと呼ばれてもよい、1つ以上の集積回路デバイスとして少なくとも部分的に形成されていてもよい。いくつかの観点において、ビデオデコーダ26は、ワイヤレス通信デバイスハンドセットの一部を形成してもよい。ビデオデコーダ26は、ビデオフレーム内のブロックの、イントラデコーディングおよびインターデコーディングを実行してもよい。図3中で示されているように、ビデオデコーダ26は、ビデオエンコーダ20によってエンコードされている、エンコードされたビデオビットストリームを受け取る。図3の例において、ビデオデコーダ26は、エントロピーデコーディングユニット54と、動き補償ユニット56と、再構築ユニット58と、逆変換ユニット60と、参照フレーム記憶装置62とを含む。エントロピーデコーディングユニット64は、メモリ64中に記憶されている1つ以上のデータ構造にアクセスして、コード化する際に有用なデータを取得してもよい。ビデオデコーダ26はまた、加算器66の出力をフィルタリングする(示していない)インループデブロッキングフィルタを含んでいてもよい。ビデオデコーダ26はまた、加算器66を含む。図3は、ビデオブロックのインターデコーディングに対して、ビデオデコーダ26の時間的予測コンポーネントを図示する。図3中で示されていないが、ビデオデコーダ26はまた、何らかのビデオブロックのイントラデコーディングに対して、空間的予測コンポーネントを含んでいてもよい。
エントロピーデコーディングユニット54は、エンコードされたビデオビットストリームを受け取り、ビットストリームから、量子化された残差係数および量子化されたパラメータと、動きベクトルおよびブロックパーティションを含んでいてもよい、マクロブロックコード化モードおよび動き情報のような、他の情報とをデコードしてもよい。動き補償ユニット56は、動きベクトルおよびブロックパーティションと、参照フレーム記憶装置62から1つ以上の再構築された参照フレームとを受け取って、予測ビデオブロックを生成させる。
再構築ユニット58は、量子化されたブロック係数を、逆量子化、すなわち、デクオンタイズする。逆変換ユニット60は、例えば逆DCTのような逆変換を係数に適用して、残差ブロックを生成させる。より詳細には、逆変換ユニット60は、スケーリングされた4×4 DCT−IIIユニット68を含み、逆変換ユニット60は、スケーリングされた4×4 DCT−IIIユニット68を係数に適用して、残差ブロックを生成させる。図2中で示されている、スケーリングされた4×4 DCT−IIユニット52の逆である、スケーリングされた4×4 DCT−IIIユニット68は、周波数領域から空間領域に係数を変換して、残差ブロックを生成させ得る。上述の量子化ユニット40と同様に、再構築ユニット58は、構成の複雑さにおける増加をほとんど伴わずに、因数分解の間に取り除かれた外部ファクタを再構築プロセスに取り入れることにより、4×4 DCT−IIIユニット68のスケーリングされた性質に対処する。スケーリングされた4×4 DCT−IIIユニット68からファクタを取り除くことは、構成の複雑さを低減させ、その結果、ビデオデコーダ26に対して、複雑さの最終的な減少をもたらす。
予測ビデオブロックは次に、加算器66により残差ブロックと合計されて、デコードされたブロックが形成される。(示していない)デブロッキングフィルタを適用して、デコードされたブロックをフィルタリングしてブロッキングアーティファクトを取り除いてもよい。フィルタリングされたブロックは次に、参照フレーム記憶装置62中に置かれて、参照フレーム記憶装置62は、後続のビデオフレームのデコーディングのために参照フレームを提供し、また、デコードされたビデオを生成させて、ディスプレイ28(図1)を駆動する。
図4Aないし4Cは、本開示の技術にしたがって構築される、スケーリングされた4×4 DCT−IIの構成をそれぞれ図示する図である。図4Aは、本開示の技術にしたがって構築される、スケーリングされた、直交の4×4 DCT−II構成70Aを図示する図である。図4Bは、本開示の技術にしたがって構築される、スケーリングされた、ほぼ直交の4×4 DCT−II構成70Bを図示する図である。図4Cは、本開示の技術にしたがって構築される、スケーリングされた、ほぼ直交の4×4 DCT−IIの代替の構成70Cを図示する図である。図2の例において示されている4×4 DCTユニット52は、1つ以上のこれらの構成70Aないし70Cを組み込んでいてもよい。
最初に、図4Aの例を参照すると、4×4 DCT−II構成70Aは、バタフライユニット72と、偶数部74Aと、奇数部74Bとを含む。バタフライユニット72は、入力x0、...、x3を、適切な偶数部74Aおよび奇数部74B(“部分74”)にルーティングまたはさもなければ転送するための、ハードウェアあるいはハードウェアおよびソフトウェアの組み合わせを表してもよい。バタフライユニット72は通常、このケースにおいて、それぞれ、偶数部および奇数部74によって表される、2×2 DCT−II構成のような、より小さいDCTの結果を結合する。偶数部74Aは、偶数のDCT係数X0およびX2を出力する、4×4 DCT−II構成70Aの2×2部分である。特に、これらの偶数係数X0およびX2は、ハーフ(1/2)の外部ファクタにより乗算される。ハーフ(1/2)の外部ファクタは、量子化ユニット40によって適用でき、通常、量子化ユニット40によって適用される。
奇数部74Bは、奇数のDCT係数X1およびX3を出力する、4×4 DCT−II構成70Aの2×2部分である。奇数部74Bは、CおよびSで表される2つの内部ファクタを含み、2つの内部ファクタCおよびSは、本開示の技術にしたがって定義される上記の等式(1)により奇数の係数X1およびX3に適用される外部ファクタに関連している。2の平方根により除算された1(1/√2)の追加の外部ファクタが、上記等式(1)中で示された関係により除算された1と乗算されて、奇数係数X1およびX3に関して示した外部ファクタがもたらされる。
等式(1)中で示した関係は、以下の等式(4)により数学的に示される直交の特性を最初に考慮に入れることにより導出できる:
Figure 0005497163
この例における変数Cは、任意の行列を指し、一方、CTは、行列Cの転置を表す。変数Iは、恒等行列を表す。したがって、行列に、その行列の転置を乗算したものが恒等行列に等しい場合、行列は直交の特性を示す。
上記の理由で、メディアコード化構成において好まれる、スケーリングされた行列を仮定して、以下の等式(5)中で示されるように、行列Cは、C’と表される、整数のスケーリングされた変換と、スケールファクタの対角行列すなわち外部ファクタDとに分解できる:
Figure 0005497163
等式(4)中のCの代わりにC’Dを用いると、次の等式(6)が結果として生じる:
Figure 0005497163
等式(6)は、次の等式(7)中で示される数学的な等式に単純化できる:
Figure 0005497163
等式(7)は、結果として生じる整数変換が直交のままであるように、スケーリングファクタを選ぶメカニズムを提供する。
例えば、4×4 DCT−II構成のケースにおいて、このDCT−IIは通常、8により除算された定数πの3倍の余弦と、8により除算された定数πの3倍の正弦とを表すファクタの近似値を適用するだけである。これらの2つのファクタが、行列C’の係数である、整数CおよびSに取って代わられることを仮定し、かつ、上述の直交性の条件を使用すると、上記の等式(1)は、正規化ファクタを表し、それにより、4×4 DCT−IIの直交の近似を設計するタスクを、次の等式(8)および(9)を満たすように、一対の整数(C、S)を見つけることに制限できる:
Figure 0005497163
この仮定の下で、4×4 DCT−II構成70Aとして示される、整数のスケーリングされた変換が結果として生ずる。
以下の表1は、CおよびSの整数に対して選択されるさまざまな値と、H.264ビデオコード化標準規格において採用されている4×4 DCT−II構成と比較した、結果として生ずる近似誤差とを示す。
Figure 0005497163
特に、変数CおよびSが、それぞれ、2および5に設定されるとき、結果として生ずる構成70Aの複雑さは増加するが、8により除算された定数πの3倍の余弦と、8により除算された定数πの3倍の正弦との近似における誤差がはるかに小さく、コード化利得を促進する。ベースのH.264構成と比較したとき、複雑さは、追加の加算およびシフトだけを伴うが、演算の意味において、高価な乗算を伴わない。結果として、本開示中で記述される技術は、複雑さの小さな増加だけで、増加したコード化利得を促進し、変数CおよびSに対して、それぞれ2および5の値を取り入れる構成70Aにより、構成の複雑さに対して最小の増加を伴う、潜在的に最良のコード化利得を提供する。
タイプIIのDCTに関して上述したが、図4Aの例において示されている構成70Aはまた、タイプIIIのDCTすなわち逆DCTの構成を表してもよい。構成70Aから逆DCTを形成することは、入力が図4Aの右側での構成により受け取られ、かつ、出力が構成の左側で出力されるように、入力と出力とを逆にすることを伴う。入力は、最初に偶数部および奇数部74により処理され、次に、左側で出力される前にバタフライ72により処理される。説明を容易にするために、構成70Aに対して逆である、このIDCT構成は、そのような構成が構成70Aの鏡像として記述されることを考慮に入れて、別の図中で示していない。
図4Bは、本開示の技術にしたがって構築される、スケーリングされた、ほぼ直交の4×4 DCT−IIの構成70Bを図示する図である。4×4 DCT−II構成70Bは、図4Aのバタフライユニット72に類似するバタフライユニット76と、偶数および奇数部78A、78B(“部分78”)とを含む。偶数部78Aは、偶数部74Aと類似している。奇数部78Bもまた、内部ファクタC、Sおよびスケーリングされたファクタξの間の、異なる関係、すなわち、等式(2)に関して上記した関係に至るように、直交の条件が緩和されていることを除いて、奇数部74Bと類似している。
等式(2)によって表された関係にしたがって、図4Bの例示的な構成70Bを導出するために、直交性が一般に、理論上は4×4 DCT−IIの直接の逆の構成を保証するが、実際には、ほとんどのスケールファクタ(以下の整数変換)が、整数乗算器を使用して正確に実現することが困難である無理数になることを最初に考える。さらに、量子化が一般に、4×4 DCT変換の適用の後に続き、この量子化は、逆の直交のDCT−II構成の直接の適用を妨げる雑音を加える。さらに、整数演算の構成を考えると、そのようなほぼ直交の変換は、コード化効率を改善する一方で、厳密に直交の整数変換と比較して、構成の複雑さを低減させ得る。結果として、直接の構成と逆の構成との間の、そのような直交性の不整合の程度を緩和することにより、実際にコード化利得が改善される可能性がある。
不整合の程度を特徴づけるために、恒等行列からの距離のノルムが、次の等式(10)にしたがって定義される:
Figure 0005497163
等式(4)に関して上記したものと同じ表記を使用すると、等式(10)は、恒等行列からの距離のノルムを、恒等行列を引いた、行列に行列の転置を乗算したものとして定義できることを単に示す。CTCが対角のままであることを仮定すると、平均の絶対距離を次の等式(11)にしたがって計算できる:
Figure 0005497163
ここで、平均の絶対距離は、変数δNにより表され、Nは、行列のサイズに等しい。
直交性の特性を緩和することによって、コード化利得は改善されるが、平均の絶対距離に対するコード化利得の解析は、圧縮を受けている画像の、特定のモデルまたは統計に非常に依存する。結果として、直交性の特性を緩和する程度は、DCT−IIの基本機能に整合する点で潜在的に最良である整数変換を見つけることに関連した、異なるメトリックの解析を通じて決定されるかもしれない。この形態の評価に関するより多くの情報は、Y.A. Reznik氏、A.T.Hinds氏およびJ.L.Mitchell氏により著された、“共通のファクタによる、固定小数点アルゴリズムの改善された精度”(Proc.ICIP2008、サンディエゴ、CA)と題する記事に見出すことができ、その全体の内容は、ここで十分に示されるかのように、参照により組み込まれている。
この組み込まれた参照から、最も整合する設計をもたらす1つの技術は、“共通のファクタベースの近似”と呼ばれる。この技術を使用して、次の等式(12)を導出できる:
Figure 0005497163
これにより、次の式(13)および(14)を導出できる:
Figure 0005497163
等式(12)は、スケーリングされたファクタξに対して、CおよびSに対する、対応する近似の誤差が、同じ大きさであるが、符号が反対であることを保証する。これらの仮定の下で、4×4 DCT−II構成70Bとして示された、整数のスケーリングされた変換が結果として生ずる。
次の表2は、CおよびSの整数に対して選択されるさまざまな値と、結果として生ずる近似誤差とを示す。
Figure 0005497163
詳細に表2を考察すると、変数CおよびSが、それぞれ、2および5に設定されるとき、近似誤差が低減される。“近似誤差”の表題の下にある、先に示した第3の誤差メトリック(C2+S2/ξ2−1)は、本質的には、等式(11)に関して上述した、直交性の不整合メトリックδNのサブセットである。この不整合メトリックは、CTC−Iの対角線に沿って奇数の位置に現れる値を記述する。特に、DCT−IIの基本機能に対する、より正確な整数近似はまた、一般に、直交であることにより近づく。そのような整数近似は、一般に、直交であることにより近づくが、それぞれ、1および2の値に設定されたCおよびSを有するDCT−II構成70Bは、図7Bに関して以下で示されるように、コード化利得の点でリスト表示したCおよびSの中で潜在的に最も大きなリターンを提供する。
タイプIIのDCT関して上述したが、図4Bの例において示されている構成70Bはまた、タイプIIIのDCTすなわち逆DCTの構成を表してもよい。構成70Bから逆DCTを形成することは、入力が図4Bの右側での構成により受け取られ、かつ、出力が構成の左側で出力されるように、入力と出力とを逆にすることを伴う。入力は、最初に偶数部および奇数部78により処理され、次に、左側で出力される前にバタフライ76により処理される。説明を容易にするために、構成70Bに対して逆である、このIDCT構成は、そのような構成が構成70Bの鏡像として記述されることを考慮に入れて、別の図中で示していない。
図4Cは、代替の因数分解から結果として生ずる、本開示の技術にしたがって構築される、別の例示的な、スケーリングされたほぼ直交の4×4 DCT−II構成70Cを図示する図である。4×4 DCT−II構成70Cは、図4Aのバタフライユニット72および図4Bのバタフライユニット76に類似するバタフライユニット80と、偶数および奇数部82A、82B(“部分82”)とを含む。偶数部82Aは、偶数部78Aと類似している。奇数部78Bは、直交性の条件が緩和されているという点で奇数部78Bと類似しているが、代替の因数分解の結果として、内部ファクタA、Bと、スケーリングされたファクタξとの間の異なる関係、すなわち、等式(3)に関して上記した関係が、結果として生ずる。代替の因数分解に関するより多くの情報は、Y.A. Reznik氏およびR.C.Chivukula氏により著され、“高解像度/高性能ビデオコード化のための変換の1つの設計”(MPEG入力文書M16438)と題し、2009年4月のマウイ、HIにおけるMPEG第88回ミーティングにおいて与えられた記事に見出すことができ、その全体の内容は、ここで十分に示されるかのように、参照によりここに組み込まれている。
特に、異なるスケールファクタが、奇数係数X1およびX3に適用され、4×4 DCT−II構成70Cにおいて近似するために、1つの無理数のファクタだけがある。直交のままであるために、内部ファクタBは通常、2の平方根で除算した1に設定されなければならず、Aは、1に設定されなければならない。結果として、これらの値から内部ファクタA、Bを変えることは、非直交の構成を招来する。これらの内部ファクタのさまざまな値を評価するために、図4Bに関して上記した、共通のファクタ近似技術と呼ばれる上記の技術が用いられる。この技術を使用すると、次の等式(15)が決定され、それにより、2つの整数値を内部ファクタA、Bに対して選択して、パラメータξを導出できる:
Figure 0005497163
これにより、以下の式(16)および(17)が満たされる:
Figure 0005497163
上記の等式(15)は、対応する近似の誤差が、大きさにおいて釣り合いがとれ、符号が反対になることを保証する。これらの仮定の下で、4×4 DCT−II構成70Cとして示された、整数のスケーリングされた変換が結果として生ずる。
次の表3は、CおよびSの整数に対して選択されるさまざまな値と、結果として生ずる近似誤差とを示す。
Figure 0005497163
詳細に表3を考察すると、変数AおよびBが、それぞれ、7および5に設定されるとき、近似誤差が低減される。それぞれ、7および5の値に設定されたAおよびBを有する4×4 DCT−II構成70Cは、図7Cに関して以下で示されるように、(表3中で示していない)複雑さの増加と比較して、コード化利得の点でリスト表示したAおよびBの中で潜在的に最も大きなリターンを提供する。
タイプIIのDCT関して上述したが、図4Cの例において示されている構成70Cはまた、タイプIIIのDCTすなわち逆DCTの構成を表してもよい。構成70Cから逆DCTを形成することは、入力が図4Cの右側での構成により受け取られ、かつ、出力が構成の左側で出力されるように、入力と出力とを逆にすることを伴う。入力は、最初に偶数部および奇数部82により処理され、次に、左側で出力される前にバタフライ80により処理される。説明を容易にするために、構成70Cに対して逆である、このIDCT構成は、そのような構成が構成70Cの鏡像として記述されることを考慮に入れて、別の図中で示していない。
図5は、本開示の技術にしたがって構築される、4×4 DCT構成を適用する際の、図2のビデオエンコーダ20のようなコード化デバイスの例示的な動作を説明するフローチャートである。最初に、ビデオエンコーダ20は、エンコードすべきビデオフレーム内の現在のビデオブロック30を受け取る(90)。動き推定ユニット32が、動き推定を実行して、ビデオブロック30を、1つ以上の近接したビデオフレーム中のブロックと比較して、1つ以上の動きベクトルを生成させる(92)。近接フレームは、参照フレーム記憶装置34から取得してもよい。動き推定は、例えば、16×16、16×8、8×16、8×8、4×4、または、より小さいブロックサイズのような、可変サイズのブロックに対して実行してもよい。動き推定ユニット32は、例えば、レート歪みモデルに基づいて、現在のビデオブロック30に最も整合する、近接フレーム中の1つ以上のブロックを識別し、近接フレーム中のブロックと、現在のビデオブロックとの間の変位を決定する。これをもとに、動き推定ユニット32は、1つ以上の動きベクトル(MV)を生成させる。動きベクトル(MV)は、現在のビデオブロック30と、現在のビデオブロック30をコード化するために使用される参照フレームからの1つ以上の整合ブロックとの間の変位の、大きさと軌道とを示す。整合ブロックは、コード化すべきブロックのインターコード化に対して、予測ブロックとして役割を果たすであろう。
動きベクトルは、ハーフ画素またはクォータ画素の精度、あるいは、さらに細かい精度を有していてもよく、ビデオエンコーダ20が、整数画素のロケーションよりも高い精度により動きを追跡し、より適切な予測ブロックを取得することが可能になる。分数の画素値を有する動きベクトルが使用されるとき、補間動作が、動き補償ユニット36において実行される。動き推定ユニット32は、レート歪みモデルのような、ある基準を使用して、ビデオブロックに対して、最良のブロックパーティションと動きベクトルとを識別する。例えば、双方向の予測のケースにおいて、より多い動きベクトルがあってもよい。結果として生じるブロックパーティションおよび動きベクトルを使用して、動き補償ユニット36は、予測ビデオブロックを形成する(94)。
ビデオエンコーダ20は、加算器48において、動き補償ユニット36によって生成された予測ビデオブロックを、元の現在のビデオブロック30から減算することにより、残差ビデオブロックを形成する(96)。ブロック変換ユニット38が、残差変換ブロック係数を生成させる変換を適用する。ブロック変換ユニット38は、本開示中で記述される技術にしたがって生成される4×4 DCT−IIユニット52を含んでいる。ブロック変換ユニット38は、スケーリングされた4×4 DCT−IIユニット52を残差ブロックに適用して、残差変換係数の4×4ブロックを生成させる。4×4 DCT−IIユニット52は一般に、残差画素データとして表される空間領域から、DCT係数として表される周波数領域に、残差ブロックを変換する(98)。変換係数は、少なくとも1つのDC係数と、1つ以上のAC係数とを含むDCT係数を含んでいてもよい。
量子化ユニット40が、残差変換ブロック係数を量子化して(例えば、丸めて)、ビットレートをさらに低減させる(100)。上述したように、量子化ユニット40は、因数分解の間に取り除かれた内部ファクタを取り入れることにより、スケーリングされた4×4 DCT−IIユニット52の、スケーリングされた性質に対処する。すなわち、量子化ユニット40は、図4Aないし4Cの構成70Aないし70Cを参照して上記した外部ファクタを取り入れる。量子化は通常、乗算を伴うことから、これらのファクタを量子化ユニット40に取り入れることは、量子化ユニット40の構成の複雑さを増加させない可能性がある。この点で、スケーリングされた4×4 DCT−IIユニット52からファクタを取り除くことは、量子化ユニット40の構成の複雑さを増加させることなく、DCT−IIユニット52の構成の複雑さを減少させ、ビデオエンコーダ20に関して、構成の複雑さの最終的な減少をもたらす。
エントロピーコード化ユニット46が、量子化された係数をエントロピーコード化して、ビットレートをさらに低減させる。エントロピーコード化ユニット46は、場合によっては、エントロピーコード化と呼ばれる、無損失統計コード化を実行して、コード化されたビットストリームを生成させる(102)。エントロピーコード化ユニット46は、量子化されたDCT係数の確率分布をモデル化し、モデル化された確率分布に基づいて、コードブック(例えば、CAVLCまたはCABAC)を選択する。このコードブックを使用して、エントロピーコード化ユニット46は、量子化されたDCT係数を圧縮するように、量子化された各DCT係数に対してコードを選択する。エントロピーコード化ユニット46は、メモリまたは記憶デバイスに記憶され、ならびに/あるいは、ビデオデコーダ26に送られる、コード化されたビットストリームとして、エントロピーコード化された係数を出力する(104)。
再構築ユニット42および逆変換ユニット44は、残差ブロックを再構築するために、それぞれ、量子化された係数を再構築し、逆変換を適用する。加算ユニット50は、再構築された残差ブロックを、動き補償ユニット36によって生成された、動き補償された予測ブロックに加算して、参照フレーム記憶装置34中での記憶のために、再構築されたビデオブロックを生成させる。再構築されたビデオブロックは、後続のビデオフレーム中のブロックをエンコードするために、動き推定ユニット32および動き補償ユニット36によって使用される。
図6は、本開示の技術にしたがって構築される4×4 DCT−III構成を適用する際の、図3のビデオデコーダ26のようなコード化デバイスの例示的な動作を説明するフローチャートである。ビデオデコーダ26は、ビデオエンコーダ20によってエンコードされている、エンコードされたビデオビットストリームを受け取る。特に、エントロピーデコーディングユニット54は、エンコードされたビデオビットストリームを受け取り、ビットストリームから、量子化された残差係数および量子化されたパラメータと、動きベクトルおよびブロックパーティションを含んでいてもよい、マクロブロックコード化モードおよび動き情報のような、他の情報とをデコードしてもよい(106、108)。動き補償ユニット56は、動きベクトルおよびブロックパーティションと、参照フレーム記憶装置62から1つ以上の再構築された参照フレームとを受け取って、予測ビデオブロックを生成させる(110)。
再構築ユニット58は、量子化されたブロック係数を、逆量子化、すなわち、デクオンタイズする(112)。逆変換ユニット60は、例えば逆DCTのような逆変換を係数に適用して、残差ブロックを生成させる。より詳細には、逆変換ユニット60は、スケーリングされた4×4 DCT−IIIユニット68を含み、逆変換ユニット60は、スケーリングされた4×4 DCT−IIIユニット68を係数に適用して、残差ブロックを生成させる(114)。図2中で示されている、スケーリングされた4×4 DCT−IIユニット52の逆である、スケーリングされた4×4 DCT−IIIユニット68は、周波数領域から空間領域に係数を変換して、残差ブロックを生成させることができる。上述の量子化ユニット40と同様に、再構築ユニット58は、構成の複雑さにおける増加をほとんど伴わずに、因数分解の間に取り除かれた外部ファクタを再構築プロセスに取り入れることにより、4×4 DCT−IIIユニット68のスケーリングされた性質に対処する。スケーリングされた4×4 DCT−IIIユニット68からファクタを取り除くことは、構成の複雑さを低減させ、その結果、ビデオデコーダ26に対して、複雑さの最終的な減少をもたらす。
予測ビデオブロックは次に、加算器66により残差ブロックと合計されて、デコードされたブロックが形成される(116)。(示していない)デブロッキングフィルタを適用して、デコードされたブロックをフィルタリングしてブロッキングアーティファクトを取り除いてもよい。フィルタリングされたブロックは次に、参照フレーム記憶装置62中に置かれて、参照フレーム記憶装置62は、後続のビデオフレームのデコーディングのために参照フレームを提供し、また、デコードされたビデオを生成させて、図1のディスプレイ28のようなディスプレイデバイスを駆動する(118)。
図7Aないし7Cは、本開示の技術にしたがって構築される、図4Aないし4Cの構成70Aないし70Cのような3つの異なる4×4 DCT−II構成のそれぞれに対する、ビットレートに対するピーク信号対雑音比のグラフ120Aないし120Cを図示する図である。図7Aは、本開示の技術にしたがって構築される、図4Aの構成70Aのような、直交の、スケーリングされた4×4 DCT−II構成に対する、ビットレートに対するピーク信号対雑音比(PSNR)のグラフ120Aを図示する図である。グラフ120Aの略語にしたがうと、実線は、H.264ビデオコード化標準規格により取り入れられた、標準規格の4×4 DCT−II構成を表す。点線は、無理数の乗算と加算とを実行できる、理論上の最良のDCT構成を表す。長い破線は、それぞれ、2および5に設定された内部ファクタCおよびSを有する、直交の4×4 DCT−II構成70Aを表す。短い破線は、それぞれ、3および7に設定された内部係数CおよびSを有する、直交の4×4 DCT−II構成70Aを表す。一点鎖線は、それぞれ、5および12に設定された内部係数CおよびSを有する、直交の4×4 DCT−II構成70Aを表す。特に、2および5に設定された内部ファクタCおよびSを有する、直交の4×4 DCT−II構成70Aは、H.264構成よりも、理論上の最良のDCT−II構成をより正確に近似する。さらに、3および7、または、5および12に設定された内部ファクタCおよびSを有する、直交の4×4 DCT−II構成70Aは、これらの構成がより複雑な構成を伴うにもかかわらず、2および5に設定された内部ファクタCおよびSを有する直交の4×4 DCT−II構成70Aと比べて、PSNRの点で、より大きな利得を提供しない。
図7Bは、本開示の技術にしたがって構築される、図4Bの構成70Bのような、直交の、スケーリングされた4×4 DCT−II構成に対する、ビットレートに対するピーク信号対雑音比(PSNR)のグラフ120Bを図示する図である。グラフ120Bの略語にしたがうと、実線は、H.264ビデオコード化標準規格により取り入れられた、標準規格の直交の4×4 DCT−II構成を表す。点線は、無理数の乗算と加算とを実行できる、理論上の最良のDCT構成を表す。短い破線は、それぞれ、1および2に設定された内部ファクタCおよびSを有する、ほぼ直交の4×4 DCT−II構成70Bを表す。長い破線は、それぞれ、2および5に設定された内部係数CおよびSを有する、ほぼ直交の4×4 DCT−II構成70Bを表す。一点鎖線は、それぞれ、5および12に設定された内部係数CおよびSを有する、ほぼ直交の4×4 DCT−II構成70Bを表す。特に、2および5に設定された内部ファクタCおよびSを有する、ほぼ直交の4×4 DCT−II構成70Bは、H.264構成と比較して、PSNRの点で、あまり優れていない。しかしながら、1および2に設定された内部ファクタCおよびSを有する、ほぼ直交の4×4 DCT−II構成70Bは、理論上のDCT構成でさえよりも、良好なPSNRを提供し、一方、5および12に設定された内部ファクタCおよびSを有する、ほぼ直交の4×4 DCT−II構成70Bは、理論上のDCT構成を最も正確に表す。
図7Cは、本開示の技術にしたがって構築される、図4Cの構成70Cのような、代替の因数分解から導出される、ほぼ直交の、スケーリングされた4×4 DCT−II構成に対する、ビットレートに対するピーク信号対雑音比(PSNR)のグラフ120Cを図示する図である。グラフ120Cの略語にしたがうと、実線は、H.264ビデオコード化標準規格により取り入れられた、標準規格の直交の4×4 DCT−II構成を表す。点線は、無理数の乗算と加算とを実行できる、理論上の最良のDCT構成を表す。長い破線は、それぞれ、2および3に設定された内部ファクタBおよびAを有する、ほぼ直交の4×4 DCT−II構成70Cを表す。短い破線は、それぞれ、5および7に設定された内部係数BおよびAを有する、ほぼ直交の4×4 DCT−II構成70Cを表す。一点鎖線は、それぞれ、29および41に設定された内部係数BおよびAを有する、ほぼ直交の4×4 DCT−II構成70Cを表す。特に、2および3に設定された内部ファクタBおよびAを有する、ほぼ直交の4×4 DCT−II構成70Cは、H.264構成よりも、PSNRの点で劣る。しかしながら、5および7に設定された内部ファクタBおよびAを有する、ほぼ直交の4×4 DCT−II構成70Cは、29および41に設定された内部ファクタBおよびAを有する、ほぼ直交の4×4 DCT−II構成70Cの複雑さを必要とすることなく、H.264構成よりも良好なPSNRを提供し、理論上のDCT構成を正確に表す。
本開示の技術は、移動電話機のようなワイヤレス通信デバイスハンドセット、集積回路(IC)または1組のIC(すなわち、チップセット)を含む、幅広いさまざまなデバイスまたは装置において実現可能である。機能の観点を強調するために、いくつかのコンポーネント、モジュールまたはユニットを記述し、提供してきたが、必ずしも、異なるハードウェアユニットによる実現を必要としない。ここで記述した技術はまた、ハードウェア中で、ソフトウェア中で、ファームウェア中で、あるいは、これらの任意の組み合わせ中で実現してもよい。モジュール、ユニットまたはコンポーネントとして記述された任意の機能を、集積論理デバイス中で一緒に、または、ディスクリートであるが相互運用可能なデバイスとして別々に、実現してもよい。いくつかのケースにおいて、集積回路チップまたはチップセットのような、集積回路デバイスとして、さまざまな機能を実現してもよい。
ソフトウェア中で実現する場合、プロセッサにおいて実行されるとき、上述した方法のうちの1つ以上を実行させる命令を含むコンピュータ読み取り可能媒体により、本技術を少なくとも部分的に実現してもよい。コンピュータ読み取り可能媒体は、物理的な構造であるコンピュータ読み取り可能記憶媒体を備えていてもよく、実装材料を含んでいてもよいコンピュータプログラムプロダクトの一部を形成してもよい。コンピュータ読み取り可能記憶媒体は、同期ダイナミックランダムアクセスメモリ(SDRAM)のようなランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、電気的に消去可能なプログラム可能読み出し専用メモリ(EEPROM)、フラッシュメモリ、磁気または光データ記憶媒体、および、これらに類似するものを備えていてもよい。この点で、コンピュータ読み取り可能記憶媒体は、いくつかの観点において、一時的ではないコンピュータ読み取り可能記憶媒体と考えてもよい。
コードまたは命令は、1つ以上のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラム可能論理アレイ(FPGA)、あるいは、他の同等の集積回路またはディスクリート論理回路のような、1つ以上のプロセッサにより実行してもよい。したがって、ここで使用する用語“プロセッサ”は、前述の構造またはここで記述した技術の実現に適した他の任意の構造のいずれをも指してもよい。さらに、いくつかの観点において、ここで記述した機能性は、エンコーディングおよびデコーディングのために構成された、専用のソフトウェアモジュールまたはハードウェアモジュール内で提供されてもよく、あるいは、結合されたビデオコーデック中に組み込まれていてもよい。また、1つ以上の回路または論理素子中で、本技術を完全に実現してもよい。
本開示はまた、本開示中で記述した技術のうちの1つ以上を実現する回路を含む、さまざまな集積回路デバイスのいずれをも考慮する。そのような回路は、単一の集積回路チップ中で、または、いわゆるチップセットにおける複数の相互運用可能な集積回路チップ中で、提供してもよい。そのような集積回路は、さまざまなアプリケーション中で使用してもよく、集積回路デバイスのいくつかは、移動電話機ハンドセットのようなワイヤレス通信デバイス中での使用を含んでいてもよい。
本技術のさまざまな観点を記述した。これらの、および他の観点は、次の特許請求の範囲の範囲内である。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1]装置において、
スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、前記スケーリングされたファクタに関連している前記第1および第2の内部ファクタ(C、S)を適用する奇数部を有する直交の4×4 DCTの逆離散コサイン変換(IDCT)を実現する、4×4 IDCTハードウェアユニットを具備し、
前記4×4 IDCTハードウェアユニットは、前記4×4 IDCT構成を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換する装置。
[2]前記内部ファクタCは1に等しく、
前記内部ファクタSは2に等しい上記[1]記載の装置。
[3]前記内部ファクタCは2に等しく、
前記内部ファクタSは5に等しい上記[1]記載の装置。
[4]前記内部ファクタCは3に等しく、
前記内部ファクタSは7に等しい上記[1]記載の装置。
[5]前記内部ファクタCは5に等しく、
前記内部ファクタSは12に等しい上記[1]記載の装置。
[6]前記内部ファクタCは17に等しく、
前記内部ファクタSは41に等しい上記[1]記載の装置。
[7]前記スケーリングされたファクタ(ξ)を使用して、前記DCT係数を決定する再構築ユニットをさらに具備する上記[1]記載の装置。
[8]前記4×4 IDCTハードウェアユニットは、前記直交の4×4 DCTのIDCTを実現するソフトウェアを実行するプロセッサを備える上記[1]記載の装置。
[9]方法において、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、直交の4×4 DCTの4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換することを含み、
前記直交の4×4 DCTは、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、前記スケーリングされたファクタに関連している前記第1および第2の内部ファクタ(C、S)を適用する奇数部を含む方法。
[10]前記内部ファクタCは1に等しく、
前記内部ファクタSは2に等しい上記[9]記載の方法。
[11]前記内部ファクタCは2に等しく、
前記内部ファクタSは5に等しい上記[9]記載の方法。
[12]前記内部ファクタCは3に等しく、
前記内部ファクタSは7に等しい上記[9]記載の方法。
[13]前記内部ファクタCは5に等しく、
前記内部ファクタSは12に等しい上記[9]記載の方法。
[14]前記内部ファクタCは17に等しく、
前記内部ファクタSは41に等しい上記[9]記載の方法。
[15]前記スケーリングされたファクタ(ξ)を使用して、前記DCT係数を決定することをさらに含む上記[9]記載の方法。
[16]装置において、
直交の4×4 DCTの4×4逆離散コサイン変換(IDCT)を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換する手段を具備し、
前記直交の4×4 DCTは、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、前記スケーリングされたファクタに関連している前記第1および第2の内部ファクタ(C、S)を適用する奇数部を含む装置。
[17]前記内部ファクタCは1に等しく、
前記内部ファクタSは2に等しい上記[16]記載の装置。
[18]前記内部ファクタCは2に等しく、
前記内部ファクタSは5に等しい上記[16]記載の装置。
[19]前記内部ファクタCは3に等しく、
前記内部ファクタSは7に等しい上記[16]記載の装置。
[20]前記内部ファクタCは5に等しく、
前記内部ファクタSは12に等しい上記[16]記載の装置。
[21]前記内部ファクタCは17に等しく、
前記内部ファクタSは41に等しい上記[16]記載の装置。
[22]前記スケーリングされたファクタ(ξ)を使用して、前記DCT係数を決定する手段をさらに具備する上記[16]記載の装置。
[23]命令を記憶している非一時的コンピュータ読み取り可能記憶媒体において、
プロセッサにより実行されるとき、前記命令は、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、直交の4×4 DCTの4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換することを前記プロセッサに生じさせ、
前記直交の4×4 DCTは、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、前記スケーリングされたファクタに関連している前記第1および第2の内部ファクタ(C、S)を適用する奇数部を含む、非一時的コンピュータ読み取り可能記憶媒体。
[24]装置において、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットを具備し、
前記DCTハードウェアユニットは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTの逆DCTを実現し、
変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、前記非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表し、
前記4×4 IDCTハードウェアユニットは、前記4×4 IDCT構成を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換する装置。
[25]前記内部ファクタCは1に等しく、
前部内部ファクタSは2に等しい上記[24]記載の装置。
[26]前記内部ファクタCは2に等しく、
前記内部ファクタSは5に等しい上記[24]記載の装置。
[27]前記内部ファクタCは5に等しく、
前記内部ファクタSは12に等しい上記[24]記載の装置。
[28]前記スケーリングされたファクタ(ξ)を使用して、前記DCT係数を決定する再構築ユニットをさらに具備する上記[24]記載の装置。
[29]前記4×4 IDCTハードウェアユニットは、前記非直交の4×4 DCTのIDCTを実現するソフトウェアを実行するプロセッサを備える上記[24]記載の装置。
[30]方法において、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換することを含み、
前記4×4 IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、前記非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す方法。
[31]前記内部ファクタCは1に等しく、
前部内部ファクタSは2に等しい上記[30]記載の方法。
[32]前記内部ファクタCは2に等しく、
前記内部ファクタSは5に等しい上記[30]記載の方法。
[33]前記内部ファクタCは5に等しく、
前記内部ファクタSは12に等しい上記[30]記載の方法。
[34]前記スケーリングされたファクタ(ξ)を使用して、前記DCT係数を決定する再構築ユニットをさらに具備する上記[30]記載の方法。
[35]装置において、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換する手段を具備し、
前記4×4 IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、前記非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す装置。
[36]前記内部ファクタCは1に等しく、
前部内部ファクタSは2に等しい上記[35]記載の装置。
[37]前記内部ファクタCは2に等しく、
前記内部ファクタSは5に等しい上記[35]記載の装置。
[38]前記内部ファクタCは5に等しく、
前記内部ファクタSは12に等しい上記[35]記載の装置。
[39]前記スケーリングされたファクタ(ξ)を使用して、前記DCT係数を決定する手段をさらに具備する上記[35]記載の装置。
[40]命令を記憶している非一時的コンピュータ読み取り可能記憶媒体において、
プロセッサにより実行されるとき、前記命令は、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換することを前記プロセッサに生じさせ、
前記4×4 IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、前記非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表す、非一時的コンピュータ読み取り可能記憶媒体。
[41]装置において、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットを具備し、
前記4×4 IDCTハードウェアユニットは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを実現し、
前記スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、前記第1の内部ファクタ(A)と前記第2の内部ファクタ(B)との合計に等しく、
前記4×4 IDCTハードウェアユニットは、前記4×4 IDCT構成を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換する装置。
[42]前記内部ファクタAは3に等しく、
前部内部ファクタBは2に等しい上記[41]記載の装置。
[43]前記内部ファクタAは7に等しく、
前記内部ファクタBは5に等しい上記[41]記載の装置。
[44]前記内部ファクタAは29に等しく、
前記内部ファクタBは41に等しい上記[41]記載の装置。
[45]前記スケーリングされたファクタ(ξ)を使用して、前記DCT係数を決定する再構築ユニットをさらに具備する上記[41]記載の装置。
[46]前記4×4 IDCTハードウェアユニットは、前記非直交の4×4 DCTのIDCTを実現するソフトウェアを実行するプロセッサを備える上記[41]記載の装置。
[47]方法において、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換することを含み、
前記IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
前記スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、前記第1の内部ファクタ(A)と前記第2の内部ファクタ(B)との合計に等しい方法。
[48]前記内部ファクタAは3に等しく、
前部内部ファクタBは2に等しい上記[47]記載の方法。
[49]前記内部ファクタAは7に等しく、
前記内部ファクタBは5に等しい上記[47]記載の方法。
[50]前記内部ファクタAは29に等しく、
前記内部ファクタBは41に等しい上記[47]記載の方法。
[51]前記スケーリングされたファクタ(ξ)を使用して、前記DCT係数を決定する再構築ユニットをさらに具備する上記[47]記載の方法。
[52]装置において、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換する手段を具備し、
前記IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
前記スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、前記第1の内部ファクタ(A)と前記第2の内部ファクタ(B)との合計に等しい装置。
[53]前記内部ファクタAは3に等しく、
前部内部ファクタBは2に等しい上記[52]記載の装置。
[54]前記内部ファクタAは7に等しく、
前記内部ファクタBは5に等しい上記[52]記載の装置。
[55]前記内部ファクタAは29に等しく、
前記内部ファクタBは41に等しい上記[52]記載の装置。
[56]前記スケーリングされたファクタ(ξ)を使用して、前記DCT係数を決定する手段をさらに具備する上記[52]記載の装置。
[57]命令を記憶している非一時的コンピュータ読み取り可能記憶媒体において、
プロセッサにより実行されるとき、前記命令は、
4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換することを前記プロセッサに生じさせ、
前記IDCTは、以下の等式
Figure 0005497163
によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
前記スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、前記第1の内部ファクタ(A)と前記第2の内部ファクタ(B)との合計に等しい、非一時的コンピュータ読み取り可能記憶媒体。

Claims (42)

  1. メディアデータを符号化するための装置において、
    スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、前記スケーリングされたファクタに関連している前記第1および第2の内部ファクタ(C、S)を適用する奇数部を有する直交の4×4DCTの逆離散コサイン変換(IDCT)を実現する、4×4IDCTハードウェアユニットを具備し、前記第1および第2の内部ファクタ(C,S)が互いに素であり、2以上であり、
    前記4×4 IDCTハードウェアユニットは、前記4×4 IDCT構成を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換し、1以上のIDCT係数を決定し、
    前記4×4 IDCTハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、装置。
  2. 前記内部ファクタCは2に等しく、
    前記内部ファクタSは5に等しい請求項1記載の装置。
  3. 前記内部ファクタCは3に等しく、
    前記内部ファクタSは7に等しい請求項1記載の装置。
  4. 前記内部ファクタCは5に等しく、
    前記内部ファクタSは12に等しい請求項1記載の装置。
  5. 前記内部ファクタCは17に等しく、
    前記内部ファクタSは41に等しい請求項1記載の装置。
  6. 前記4×4 IDCTハードウェアユニットは、前記直交の4×4 DCTのIDCTを実現するソフトウェアを実行するプロセッサを備える請求項1記載の装置。
  7. メディアデータを符号化するための方法において、
    4×4逆離散コサイン変換(IDCT)ハードウェアユニット、直交の4×4 DCTの4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換し、1以上のIDCT係数を決定することを含み、
    前記直交の4×4 DCTは、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、前記スケーリングされたファクタに関連している前記第1および第2の内部ファクタ(C、S)を適用する奇数部を含み、前記第1及び第2の内部ファクタ(C,S)は互いに素であり、2以上であり、
    前記4×4 IDCTハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、方法。
  8. 前記内部ファクタCは2に等しく、
    前記内部ファクタSは5に等しい請求項記載の方法。
  9. 前記内部ファクタCは3に等しく、
    前記内部ファクタSは7に等しい請求項記載の方法。
  10. 前記内部ファクタCは5に等しく、
    前記内部ファクタSは12に等しい請求項記載の方法。
  11. 前記内部ファクタCは17に等しく、
    前記内部ファクタSは41に等しい請求項記載の方法。
  12. メディアデータを符号化するための装置において、
    周波数領域から空間領域にメディアデータを変換し、1つ以上の逆離散コサイン変換(IDCT)係数を決定するため前記メディアデータを表すDCT係数に直交の4×4 DCTの4×4IDCTを適用する手段を具備し、
    前記直交の4×4 DCTは、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、前記スケーリングされたファクタに関連している前記第1および第2の内部ファクタ(C、S)を適用する奇数部を含み、前記第1及び第2の内部ファクタ(C,S)は互いに素であり、2以上であり、
    前記4×4 IDCTを適用する手段は、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、装置。
  13. 前記内部ファクタCは2に等しく、
    前記内部ファクタSは5に等しい請求項12記載の装置。
  14. 前記内部ファクタCは3に等しく、
    前記内部ファクタSは7に等しい請求項12記載の装置。
  15. 前記内部ファクタCは5に等しく、
    前記内部ファクタSは12に等しい請求項12記載の装置。
  16. 前記内部ファクタCは17に等しく、
    前記内部ファクタSは41に等しい請求項12記載の装置。
  17. メディアデータを符号化するための命令を記憶しているコンピュータ読み取り可能記憶媒体において、
    プロセッサにより実行されるとき、前記命令は、
    4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、直交の4×4 DCTの4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換し、1つ以上のIDCT係数を決定することを前記プロセッサに生じさせ、
    前記直交の4×4 DCTは、スケーリングされたファクタ(ξ)が、第1の内部ファクタ(C)の2乗と、第2の内部ファクタ(S)の2乗との合計の平方根に等しいように、前記スケーリングされたファクタに関連している前記第1および第2の内部ファクタ(C、S)を適用する奇数部を含み、前記第1及び第2の内部ファクタ(C,S)は互いに素であり、2以上であり、
    前記4×4逆離散コサイン変換(IDCT)ハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、コンピュータ読み取り可能記憶媒体。
  18. メディアデータを符号化するための装置において、
    4×4逆離散コサイン変換(IDCT)ハードウェアユニットを具備し、
    前記DCTハードウェアユニットは、以下の等式
    Figure 0005497163
    によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTの逆DCTを実現し、
    変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、前記非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表し、前記第1及び第2の内部ファクタ(C,S)は互いに素であり、2以上であり、前記4×4 IDCTハードウェアユニットは、前記4×4 IDCT構成を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換し、1つ以上のIDCT係数を決定し、
    前記4×4 IDCTハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、装置。
  19. 前記内部ファクタCは2に等しく、
    前記内部ファクタSは5に等しい請求項18記載の装置。
  20. 前記内部ファクタCは5に等しく、
    前記内部ファクタSは12に等しい請求項18記載の装置。
  21. 前記4×4 IDCTハードウェアユニットは、前記非直交の4×4 DCTのIDCTを実現するソフトウェアを実行するプロセッサを備える請求項18記載の装置。
  22. メディアデータを符号化するための方法において、
    4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換し、1つ以上のIDCT係数を決定することを含み、
    前記4×4 IDCTは、以下の等式
    Figure 0005497163
    によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
    変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、前記非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表し、前記第1及び第2の内部ファクタ(C,S)は互いに素であり、2以上であり、
    前記4×4 IDCTハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、方法。
  23. 前記内部ファクタCは2に等しく、
    前記内部ファクタSは5に等しい請求項22記載の方法。
  24. 前記内部ファクタCは5に等しく、
    前記内部ファクタSは12に等しい請求項22記載の方法。
  25. メディアデータを符号化するための装置において、
    4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換する手段を具備し、
    前記4×4 IDCTは、以下の等式
    Figure 0005497163
    によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
    変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、前記非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表し、前記第1及び第2の内部ファクタ(C,S)は互いに素であり、2以上であり、
    前記4×4 IDCTハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、装置。
  26. 前記内部ファクタCは2に等しく、
    前記内部ファクタSは5に等しい請求項25記載の装置。
  27. 前記内部ファクタCは5に等しく、
    前記内部ファクタSは12に等しい請求項25記載の装置。
  28. メディアデータを符号化するための命令を記憶しているコンピュータ読み取り可能記憶媒体において、
    プロセッサにより実行されるとき、前記命令は、
    4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換し、1つ以上のIDCT係数を決定することを前記プロセッサに生じさせ、
    前記4×4 IDCTは、以下の等式
    Figure 0005497163
    によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(C、S)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
    変数ωおよびψは、無理数の内部変換ファクタを表し、変数CおよびSは、前記非直交の4×4 DCTの整数の構成において、変数ωおよびψの代わりに使用される2進有理数の内部変換ファクタを表し、前記第1及び第2の内部ファクタ(C,S)は互いに素であり、2以上であり、
    前記4×4 IDCTハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、コンピュータ読み取り可能記憶媒体。
  29. メディアデータを符号化するための装置において、
    4×4逆離散コサイン変換(IDCT)ハードウェアユニットを具備し、
    前記4×4 IDCTハードウェアユニットは、以下の等式
    Figure 0005497163
    によるスケーリングされたファクタ(ξ)に関連している4×4 IDCTの一部として第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを実現し、
    前記スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、前記第1の内部ファクタ(A)と前記第2の内部ファクタ(B)との合計に等しく、前記第1及び第2の内部ファクタ(A,B)は互いに素であり、2以上であり、
    前記4×4 IDCTハードウェアユニットは、前記4×4 IDCT構成を、メディアデータを表すDCT係数に適用して、周波数領域から空間領域に前記メディアデータを変換し、1つ以上のIDCT係数を決定し、
    前記4×4 IDCTハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、装置。
  30. 前記内部ファクタAは3に等しく、
    前部内部ファクタBは2に等しい請求項29記載の装置。
  31. 前記内部ファクタAは7に等しく、
    前記内部ファクタBは5に等しい請求項29記載の装置。
  32. 前記内部ファクタAは29に等しく、
    前記内部ファクタBは41に等しい請求項29記載の装置。
  33. 前記4×4 IDCTハードウェアユニットは、前記非直交の4×4 DCTのIDCTを実現するソフトウェアを実行するプロセッサを備える請求項29記載の装置。
  34. メディアデータを符号化するための方法において、
    4×4逆離散コサイン変換(IDCT)ハードウェアユニット、4×4 IDCTを、メディアデータに適用して、周波数領域から空間領域に前記メディアデータを変換し、1つ以上のIDCT係数を決定することを含み、
    前記IDCTは、以下の等式
    Figure 0005497163
    によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を有する非直交の4×4 DCTのIDCTを含み、
    前記スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、前記第1の内部ファクタ(A)と前記第2の内部ファクタ(B)との合計に等しく、前記第1及び第2の内部ファクタ(A,B)は互いに素であり、2以上であり、
    前記4×4 IDCTハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、方法。
  35. 前記内部ファクタAは3に等しく、
    前部内部ファクタBは2に等しい請求項34記載の方法。
  36. 前記内部ファクタAは7に等しく、
    前記内部ファクタBは5に等しい請求項34記載の方法。
  37. 前記内部ファクタAは29に等しく、
    前記内部ファクタBは41に等しい請求項34記載の方法。
  38. メディアデータを符号化するための装置において、
    周波数領域から空間領域に前記メディアデータを変換するため4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、メディアデータに4×4 IDCTを適用する手段を具備し、
    非直交の4×4 DCTは、以下の等式
    Figure 0005497163
    によるスケーリングされたファクタ(ξ)に関連している第1および第2の内部ファクタ(A、B)を適用する奇数部を含み、
    前記スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、前記第1の内部ファクタ(A)と前記第2の内部ファクタ(B)との合計に等しく、前記第1及び第2の内部ファクタ(A,B)は互いに素であり、2以上であり、
    前記4×4 IDCTを適用する手段は、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、装置。
  39. 前記内部ファクタAは3に等しく、
    前部内部ファクタBは2に等しい請求項38記載の装置。
  40. 前記内部ファクタAは7に等しく、
    前記内部ファクタBは5に等しい請求項38記載の装置。
  41. 前記内部ファクタAは29に等しく、
    前記内部ファクタBは41に等しい請求項38記載の装置。
  42. メディアデータを符号化するための命令を記憶しているコンピュータ読み取り可能記憶媒体において、
    プロセッサにより実行されるとき、前記命令は、
    4×4逆離散コサイン変換(IDCT)ハードウェアユニットにより、4×4 IDCTを、メディアデータに適用して、周波数領域から空間領域に前記メディアデータを変換し、1つ以上のIDCT係数を決定することを前記プロセッサに生じさせ、
    非直交の4×4 DCTは、以下の等式
    Figure 0005497163
    によるスケーリングされたファクタ(ξ)に関連している前記4×4DCTの一部として第1および第2の内部ファクタ(A、B)を適用する奇数部を含み、
    前記スケーリングファクタ(ξ)は、2の平方根により除算された1を加えた1により除算された、前記第1の内部ファクタ(A)と前記第2の内部ファクタ(B)との合計に等しく、前記第1及び第2の内部ファクタ(A,B)は互いに素であり、2以上であり、
    前記4×4 IDCTハードウェアユニットは、量子化IDCT係数を決定するため前記スケーリングされたファクタ(ξ)の逆数を1以上のIDCT係数で掛け算する量子化ユニットを含む、コンピュータ読み取り可能記憶媒体。
JP2012514201A 2009-06-05 2010-06-04 メディアコード化のための4×4変換 Expired - Fee Related JP5497163B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US18465609P 2009-06-05 2009-06-05
US61/184,656 2009-06-05
US21988709P 2009-06-24 2009-06-24
US61/219,887 2009-06-24
US12/788,625 US9069713B2 (en) 2009-06-05 2010-05-27 4X4 transform for media coding
US12/788,625 2010-05-27
PCT/US2010/037513 WO2010141899A2 (en) 2009-06-05 2010-06-04 4x4 transform for media coding

Publications (2)

Publication Number Publication Date
JP2012529128A JP2012529128A (ja) 2012-11-15
JP5497163B2 true JP5497163B2 (ja) 2014-05-21

Family

ID=43298574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012514201A Expired - Fee Related JP5497163B2 (ja) 2009-06-05 2010-06-04 メディアコード化のための4×4変換

Country Status (8)

Country Link
US (3) US9069713B2 (ja)
EP (1) EP2438535A2 (ja)
JP (1) JP5497163B2 (ja)
KR (1) KR101315600B1 (ja)
CN (3) CN102667757B (ja)
BR (1) BRPI1010755A2 (ja)
TW (1) TW201126349A (ja)
WO (1) WO2010141899A2 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9110849B2 (en) * 2009-04-15 2015-08-18 Qualcomm Incorporated Computing even-sized discrete cosine transforms
US8762441B2 (en) * 2009-06-05 2014-06-24 Qualcomm Incorporated 4X4 transform for media coding
US9069713B2 (en) * 2009-06-05 2015-06-30 Qualcomm Incorporated 4X4 transform for media coding
US9081733B2 (en) * 2009-06-24 2015-07-14 Qualcomm Incorporated 16-point transform for media data coding
US9075757B2 (en) * 2009-06-24 2015-07-07 Qualcomm Incorporated 16-point transform for media data coding
US8451904B2 (en) * 2009-06-24 2013-05-28 Qualcomm Incorporated 8-point transform for media data coding
US9118898B2 (en) 2009-06-24 2015-08-25 Qualcomm Incorporated 8-point transform for media data coding
US9824066B2 (en) 2011-01-10 2017-11-21 Qualcomm Incorporated 32-point transform for media data coding
EP2723079A4 (en) 2011-06-15 2015-03-04 Korea Electronics Telecomm MODULABLE VIDEO ENCODING AND DECODING METHOD AND DEVICE APPLYING THE SAME
GB2559062B (en) * 2011-10-17 2018-11-14 Kt Corp Video decoding method using transform method selected from a transform method set
CN107835420B (zh) * 2011-10-18 2021-05-14 株式会社Kt 视频信号解码方法
CN107277552B (zh) * 2011-12-21 2019-10-29 太阳专利托管公司 图像编码方法及装置、图像解码方法及装置
US10289856B2 (en) * 2014-10-17 2019-05-14 Spatial Digital Systems, Inc. Digital enveloping for digital right management and re-broadcasting
EP3051818A1 (en) * 2015-01-30 2016-08-03 Thomson Licensing Method and device for decoding a color picture
US9998763B2 (en) * 2015-03-31 2018-06-12 Nxgen Partners Ip, Llc Compression of signals, images and video for multimedia, communications and other applications
AU2019315029A1 (en) * 2018-08-03 2021-03-11 V-Nova International Limited Transformations for signal enhancement coding
SG11202105604UA (en) * 2018-11-27 2021-06-29 Op Solutions Llc Block-based spatial activity measures for pictures cross-reference to related applications
JP2022508245A (ja) 2018-11-27 2022-01-19 オーピー ソリューションズ, エルエルシー 文脈的区分化および処理のためのブロックベースのピクチャ融合

Family Cites Families (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2581463B1 (fr) * 1985-05-03 1989-09-08 Thomson Csf Dispositifs de calcul de transformees cosinus, dispositif de codage et dispositif de decodage d'images comportant de tels dispositifs de calcul
US5253055A (en) * 1992-07-02 1993-10-12 At&T Bell Laboratories Efficient frequency scalable video encoding with coefficient selection
US5408425A (en) * 1993-05-25 1995-04-18 The Aerospace Corporation Split-radix discrete cosine transform
US5508949A (en) * 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
US5649077A (en) * 1994-03-30 1997-07-15 Institute Of Microelectronics, National University Of Singapore Modularized architecture for rendering scaled discrete cosine transform coefficients and inverse thereof for rapid implementation
TW284869B (ja) 1994-05-27 1996-09-01 Hitachi Ltd
JP3115199B2 (ja) * 1994-12-16 2000-12-04 松下電器産業株式会社 画像圧縮符号化装置
US5737450A (en) * 1995-05-15 1998-04-07 Polaroid Corporation Method and apparatus for fast two-dimensional cosine transform filtering
JP2778622B2 (ja) * 1995-06-06 1998-07-23 日本電気株式会社 2次元dct回路
JPH09212484A (ja) 1996-01-30 1997-08-15 Texas Instr Inc <Ti> 離散コサイン変換方法
CN1268231A (zh) 1997-08-25 2000-09-27 夸尔柯姆股份有限公司 数据块规模可变的2维逆向离散余弦变换机
US6215909B1 (en) * 1997-11-17 2001-04-10 Sony Electronics, Inc. Method and system for improved digital video data processing using 4-point discrete cosine transforms
CN1296852C (zh) 1997-11-17 2007-01-24 索尼电子有限公司 用于采用离散变换进行数字视频数据去压缩的方法和系统
US6252994B1 (en) * 1998-01-26 2001-06-26 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
US6222944B1 (en) 1998-05-07 2001-04-24 Sarnoff Corporation Down-sampling MPEG image decoder
JP2001346213A (ja) * 2000-06-02 2001-12-14 Nec Corp 離散コサイン変換装置及びその離散コサイン変換方法
AU2001234971A1 (en) * 2000-02-09 2001-08-20 T. C. Cheng Fast method for the forward and inverse mdct in audio coding
EP1352336A4 (en) 2000-10-23 2006-09-06 Ibm FASTER TRANSFORMATIONS THROUGH THE USE OF SCALED TERMS, EARLY BREAKDOWN AND PRECISION REFINANCES
US7929610B2 (en) * 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
US7366236B1 (en) * 2001-06-04 2008-04-29 Cisco Sytems Canada Co. Source adaptive system and method for 2D iDCT
US7185037B2 (en) * 2001-08-23 2007-02-27 Texas Instruments Incorporated Video block transform
CN1283093C (zh) 2001-08-24 2006-11-01 皇家飞利浦电子股份有限公司 对视频帧的场进行相加
US7082450B2 (en) 2001-08-30 2006-07-25 Nokia Corporation Implementation of a transform and of a subsequent quantization
US6882685B2 (en) * 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
KR100481067B1 (ko) * 2001-09-28 2005-04-07 브이케이 주식회사 분산 산술 처리장치 및 그를 이용한 이차원 이산여현변환 처리장치
US7088791B2 (en) 2001-10-19 2006-08-08 Texas Instruments Incorporated Systems and methods for improving FFT signal-to-noise ratio by identifying stage without bit growth
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
FR2834362A1 (fr) 2001-12-28 2003-07-04 Koninkl Philips Electronics Nv Dispositif de transformation inverse adaptatif
JP2003223433A (ja) 2002-01-31 2003-08-08 Matsushita Electric Ind Co Ltd 直交変換方法、直交変換装置、符号化方法、符号化装置、逆直交変換方法、逆直交変換装置、復号化方法、及び、復号化装置
US7007055B2 (en) * 2002-03-12 2006-02-28 Intel Corporation Method of performing NxM Discrete Cosine Transform
US7242713B2 (en) * 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
US7437394B2 (en) * 2002-06-19 2008-10-14 The Aerospace Corporation Merge and split discrete cosine block transform method
US20040136602A1 (en) * 2003-01-10 2004-07-15 Nithin Nagaraj Method and apparatus for performing non-dyadic wavelet transforms
US7412100B2 (en) * 2003-09-04 2008-08-12 Qualcomm Incorporated Apparatus and method for sub-sampling images in a transform domain
US7379500B2 (en) * 2003-09-30 2008-05-27 Microsoft Corporation Low-complexity 2-power transform for image/video compression
TWI241074B (en) 2003-11-05 2005-10-01 Bing-Fei Wu Image compression system using two-dimensional discrete wavelet transformation
TWI289992B (en) 2003-12-03 2007-11-11 Via Tech Inc Method and device for sharing MPEG frame buffers
US20050213835A1 (en) * 2004-03-18 2005-09-29 Huazhong University Of Science & Technology And Samsung Electronics Co., Ltd. Integer transform matrix selection method in video coding and related integer transform method
US8861600B2 (en) * 2004-06-18 2014-10-14 Broadcom Corporation Method and system for dynamically configurable DCT/IDCT module in a wireless handset
US7587093B2 (en) 2004-07-07 2009-09-08 Mediatek Inc. Method and apparatus for implementing DCT/IDCT based video/image processing
US8130827B2 (en) * 2004-08-13 2012-03-06 Samsung Electronics Co., Ltd. Method and apparatus for interpolating a reference pixel in an annular image and encoding/decoding an annular image
KR100688382B1 (ko) * 2004-08-13 2007-03-02 경희대학교 산학협력단 환형 영상의 참조 화소 보간 방법, 그 장치, 환형 영상부호화 방법, 그 장치 및 환형 영상 복호화 방법 및 그장치
TWI284869B (en) 2004-10-22 2007-08-01 Au Optronics Corp Pixel of display
US7471850B2 (en) 2004-12-17 2008-12-30 Microsoft Corporation Reversible transform for lossy and lossless 2-D data compression
US7792385B2 (en) * 2005-01-25 2010-09-07 Globalfoundries Inc. Scratch pad for storing intermediate loop filter data
TW200643848A (en) 2005-06-01 2006-12-16 Wintek Corp Method and apparatus for four-color data conversion
US20070025441A1 (en) * 2005-07-28 2007-02-01 Nokia Corporation Method, module, device and system for rate control provision for video encoders capable of variable bit rate encoding
TWI280804B (en) 2005-09-26 2007-05-01 Yuh-Jue Chuang Method for splitting 8x8 DCT into four 4x4 modified DCTS used in AVC/H. 264
US7725516B2 (en) * 2005-10-05 2010-05-25 Qualcomm Incorporated Fast DCT algorithm for DSP with VLIW architecture
US20070200738A1 (en) * 2005-10-12 2007-08-30 Yuriy Reznik Efficient multiplication-free computation for signal and data processing
TWI311856B (en) * 2006-01-04 2009-07-01 Quanta Comp Inc Synthesis subband filtering method and apparatus
US8595281B2 (en) * 2006-01-11 2013-11-26 Qualcomm Incorporated Transforms with common factors
CN100562111C (zh) 2006-03-28 2009-11-18 华为技术有限公司 离散余弦逆变换方法及其装置
US8849884B2 (en) * 2006-03-29 2014-09-30 Qualcom Incorporate Transform design with scaled and non-scaled interfaces
CN101018327B (zh) * 2006-04-11 2012-10-31 炬力集成电路设计有限公司 离散余弦变换集成模块及其运算组合方法
EP1850597A1 (en) 2006-04-24 2007-10-31 Universität Dortmund Method and circuit for performing a cordic based Loeffler discrete cosine transformation (DCT), particularly for signal processing
US8699810B2 (en) * 2006-06-26 2014-04-15 Qualcomm Incorporated Efficient fixed-point approximations of forward and inverse discrete cosine transforms
US8582663B2 (en) * 2006-08-08 2013-11-12 Core Wireless Licensing S.A.R.L. Method, device, and system for multiplexing of video streams
US8300698B2 (en) * 2006-10-23 2012-10-30 Qualcomm Incorporated Signalling of maximum dynamic range of inverse discrete cosine transform
US8548815B2 (en) 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
US8654833B2 (en) 2007-09-26 2014-02-18 Qualcomm Incorporated Efficient transformation techniques for video coding
EP2227020B1 (en) * 2007-09-28 2014-08-13 Dolby Laboratories Licensing Corporation Video compression and transmission techniques
US20090141808A1 (en) * 2007-11-30 2009-06-04 Yiufai Wong System and methods for improved video decoding
US8631060B2 (en) * 2007-12-13 2014-01-14 Qualcomm Incorporated Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
KR20090078494A (ko) * 2008-01-15 2009-07-20 삼성전자주식회사 영상 데이터의 디블록킹 필터링 방법 및 디블록킹 필터
CN101330616B (zh) 2008-07-31 2011-04-13 上海交通大学 视频解码过程中反离散余弦变换的硬件实现装置及方法
US20100172409A1 (en) * 2009-01-06 2010-07-08 Qualcom Incorporated Low-complexity transforms for data compression and decompression
US9110849B2 (en) * 2009-04-15 2015-08-18 Qualcomm Incorporated Computing even-sized discrete cosine transforms
US8762441B2 (en) * 2009-06-05 2014-06-24 Qualcomm Incorporated 4X4 transform for media coding
US9069713B2 (en) * 2009-06-05 2015-06-30 Qualcomm Incorporated 4X4 transform for media coding
US9118898B2 (en) * 2009-06-24 2015-08-25 Qualcomm Incorporated 8-point transform for media data coding
US9081733B2 (en) * 2009-06-24 2015-07-14 Qualcomm Incorporated 16-point transform for media data coding
US9075757B2 (en) * 2009-06-24 2015-07-07 Qualcomm Incorporated 16-point transform for media data coding
US8451904B2 (en) * 2009-06-24 2013-05-28 Qualcomm Incorporated 8-point transform for media data coding
CN101989253B (zh) * 2009-07-31 2012-08-29 鸿富锦精密工业(深圳)有限公司 离散余弦转换电路及使用其的影像处理装置
US9824066B2 (en) * 2011-01-10 2017-11-21 Qualcomm Incorporated 32-point transform for media data coding

Also Published As

Publication number Publication date
US20150256855A1 (en) 2015-09-10
KR101315600B1 (ko) 2013-10-10
CN102667757A (zh) 2012-09-12
CN102667757B (zh) 2016-03-30
BRPI1010755A2 (pt) 2016-03-22
US9069713B2 (en) 2015-06-30
WO2010141899A3 (en) 2012-05-18
JP2012529128A (ja) 2012-11-15
EP2438535A2 (en) 2012-04-11
US20100309974A1 (en) 2010-12-09
KR20120052927A (ko) 2012-05-24
WO2010141899A2 (en) 2010-12-09
CN105744280A (zh) 2016-07-06
US20150256854A1 (en) 2015-09-10
TW201126349A (en) 2011-08-01
CN105491389B (zh) 2018-12-04
CN105491389A (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
JP5497164B2 (ja) メディアコード化のための4×4変換
JP5497163B2 (ja) メディアコード化のための4×4変換
US9118898B2 (en) 8-point transform for media data coding
US8451904B2 (en) 8-point transform for media data coding
US9110849B2 (en) Computing even-sized discrete cosine transforms
EP2446374B1 (en) 16-point transform for media data coding
JP2013502625A (ja) メディアデータコーディングのための16点変換

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130723

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140305

R150 Certificate of patent or registration of utility model

Ref document number: 5497163

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees