JP2013502624A - メディアデータ符号化用8点変換 - Google Patents
メディアデータ符号化用8点変換 Download PDFInfo
- Publication number
- JP2013502624A JP2013502624A JP2012517690A JP2012517690A JP2013502624A JP 2013502624 A JP2013502624 A JP 2013502624A JP 2012517690 A JP2012517690 A JP 2012517690A JP 2012517690 A JP2012517690 A JP 2012517690A JP 2013502624 A JP2013502624 A JP 2013502624A
- Authority
- JP
- Japan
- Prior art keywords
- intrinsic factor
- factor
- intrinsic
- sum
- approximation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
- H04N19/45—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Discrete Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
一般に、8点離散コサイン変換(DCT)を実施する技術が記載される。8点離散コサイン変換(DCT)ハードウェアユニットを備える装置は、空間領域から周波数領域へメディアデータを変換するためにこれらの技術を実施する。8点DCTハードウェアユニットは、第1の関係に基づいて第1のスケール因子(μ)に関係している内部因子A、Bを備える偶数部を含む。8点DCTハードウェアユニットは、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部を更に含む。第1の関係は、第1のスケール因子を第1及び第2の内部因子に関係付ける。第2の関係は、第2のスケール因子を第3の内部因子及び第4の内部因子ならびに前記第5内部因子及び第6の内部因子に関係付ける。
Description
本願は、年6月24日付けで出願された米国仮特許出願第61/219,891号の利益を主張し、この仮特許出願の内容全体が参照により本明細書に組み込まれる。
本特許出願は、代理人書類番号092240U1を有し、本願と同日に出願され、本願譲受人に譲渡され、参照により本明細書に明確に組み込まれる同時係属中の米国特許出願:メディアデータ符号化のための8点変換(8−POINT TRANSFORM FOR MEDIA DATA CODING)に関係している。
本開示はデータ圧縮、より詳しくは変換を伴うデータ圧縮に関係する。
データ圧縮は、データ記憶空間、伝送帯域幅、又は両方の消費を削減するため種々の用途において広く用いられる。データ圧縮の用途例は、デジタル映像符号化、画像符号化、スピーチ符号化、及び、音声符号化のような視覚又は聴覚メディアデータ符号化を含む。デジタル映像符号化は、例えば、デジタルテレビジョン、デジタル・ダイレクト・ブロードキャスト・システム、ワイヤレス通信機器、携帯情報端末(PDA)、ラップトップ若しくはデスクトップコンピュータ、デジタルカメラ、デジタル記録装置、テレビゲーム装置、セルラ若しくは衛星無線電話機などを含む広範囲の装置で使用される。デジタル映像装置は、デジタル映像をより効率的に送受信するため、MPEG−2、MPEG−4、又はH.264/MPEG−4次世代映像符号化(AVC)のような映像圧縮技術を実施する。
一般に、映像圧縮技術は、映像データに本来備わる冗長性を低減又は除去するため、空間的予測、動き推定、及び、動き補償を実行する。特に、イントラ符号化は、所定の映像フレーム内の映像の空間的冗長性を低減又は除去するために、空間的予測に依存する。インター符号化は、隣接フレーム間の映像の時間的冗長性を低減又は除去するために、時間的予測に依存する。インター符号化に関して、映像エンコーダは、2個以上の隣接フレーム間の対応する映像ブロックの動きを追跡するために、動き推定を実行する。動き推定は動きベクトルを生成し、この動きベクトルは1以上の参照フレームにおける対応する映像ブロックの変位を示す。動き補償は、参照フレームから予測映像ブロックを生成するために動きベクトルを使用する。動き補償後、残りの映像ブロックは、原映像ブロックから予測映像ブロックを差し引くことによって形成される。
映像エンコーダは、その後、映像符号化プロセスによって生じた残りのブロックのビットレートをさらに低減するため、変換とその後に続く量子化及び可逆統計的符号化プロセス(lossless statistical coding processes)とを適用する。一部の事例では、適用される変換は、水平方向及び垂直方向に別々に適用された離散コサイン変換(DCT)を含む。典型的に、DCTは、高さ4画素と幅4画素である映像ブロック(「4×4映像ブロック」と呼ばれることがよくある)のような、そのサイズが2の累乗である映像ブロックに適用される。しばしば、DCTは、1次元すなわち線形DCTであり、このDCTは、最初に、映像ブロックの複数行に適用され、次に、映像ブロックの複数列に適用される。これらの1次元(1D)DCT群は、その結果、これらのDCT群がDCT係数の4×4行列を生成するために4×4映像ブロックに適用されるので、4点DCT群と呼ばれることがある。4点DCTを残りのブロックに適用することから生成されたDCT係数の4×4行列は、その後、ビットストリームを生成するため量子化及び可逆統計的符号化プロセス(「エントロピー符号化」プロセスとしてよく知られている)を受ける。統計的符号化プロセスの例は、コンテキスト適応型(context-adaptive)可変長符号化(CAVLC)又はコンテキスト適応型2進算術符号化(CABAC)を含む。映像デコーダは、符号化ビットストリームを受信し、個々のブロックの残りの情報を伸長するために可逆復号化(lossless decoding)を実行する。残りの情報及び動き情報を使用して、映像デコーダは、符号化済みの映像を再構成する。
映像エンコーダは、その後、映像符号化プロセスによって生じた残りのブロックのビットレートをさらに低減するため、変換とその後に続く量子化及び可逆統計的符号化プロセス(lossless statistical coding processes)とを適用する。一部の事例では、適用される変換は、水平方向及び垂直方向に別々に適用された離散コサイン変換(DCT)を含む。典型的に、DCTは、高さ4画素と幅4画素である映像ブロック(「4×4映像ブロック」と呼ばれることがよくある)のような、そのサイズが2の累乗である映像ブロックに適用される。しばしば、DCTは、1次元すなわち線形DCTであり、このDCTは、最初に、映像ブロックの複数行に適用され、次に、映像ブロックの複数列に適用される。これらの1次元(1D)DCT群は、その結果、これらのDCT群がDCT係数の4×4行列を生成するために4×4映像ブロックに適用されるので、4点DCT群と呼ばれることがある。4点DCTを残りのブロックに適用することから生成されたDCT係数の4×4行列は、その後、ビットストリームを生成するため量子化及び可逆統計的符号化プロセス(「エントロピー符号化」プロセスとしてよく知られている)を受ける。統計的符号化プロセスの例は、コンテキスト適応型(context-adaptive)可変長符号化(CAVLC)又はコンテキスト適応型2進算術符号化(CABAC)を含む。映像デコーダは、符号化ビットストリームを受信し、個々のブロックの残りの情報を伸長するために可逆復号化(lossless decoding)を実行する。残りの情報及び動き情報を使用して、映像デコーダは、符号化済みの映像を再構成する。
一般に本開示は、従来型の8点DCTより増大した符号化利得を提供し得る8点離散コサイン変換(DCT)の1回以上の実施を使用して、メディアデータのようなデータを符号化する技術を対象にする。本開示の技術に基づいて適用される8点DCTの実施は、スケール因子と内部因子間の様々な関係を含む。用語「スケール因子」は、因数分解を介して取り除かれる8点DCTの実施部分の外部にある因子を示す。用語「内部因子」は、因数分解後に残る8点DCTの実施部分の内部にある因子を示す。8点DCTの一実施例は、直交であり、これは、8点DCTを表現する係数の行列が、この行列の転置を乗じられたとき、単位行列に等しくなることを示唆する。8点DCTの別の実施例は、準直交(又は近似直交)である。以下に詳述される種々な関係に従うことにより、これらの技術は、直交8点DCT方式及び準直交8点DCT方式の両方の事例において行列係数の選択を容易とし、これら8点DCTがデータに適用されたとき、従来型の8点DCT群に対する符号化利得の増大を促進することになる。
一態様では、方法は、コーディング(coding:符号化又は複合化)装置を用いてメディアデータを受信することと、受信されたメディアデータを空間領域から周波数領域へ変換するためのコーディング装置の8点離散コサイン変換(DCT)ハードウェアユニットを用いて8点DCTを実行することを備える。8点DCTハードウェアユニットは、第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部と、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部とを含む。第2の関係は、第2のスケール因子が第3の内部因子の平方と第4の内部因子の平方との和の平方根に等しくなるように定義される。第2の関係は、さらに、第2のスケール因子が第5の内部因子の平方と第6の内部因子の平方との和の平方根に等しくなるように定義される。
別の態様では、装置は、メディアデータを空間領域から周波数領域へ変換する8点離散コサイン変換(DCT)ハードウェアユニットを備える。8点DCTハードウェアユニットは、第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部と、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部とを含む。第2の関係は、第2のスケール因子が第3の内部因子の平方と第4の内部因子の平方との和の平方根に等しくなるように定義される。第2の関係は、さらに、第2のスケール因子が第5の内部因子の平方と第6の内部因子の平方との和の平方根に等しくなるように定義される。
別の態様では、装置は、メディアデータを受信する手段と、受信されたメディアデータを空間領域から周波数領域へ変換するため8点離散コサイン変換(DCT)を実行する手段とを備える。8点DCT−IIを実行する手段は、第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部と、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部とを含む。第2の関係は、第2のスケール因子が第3の内部因子の平方と第4の内部因子の平方との和の平方根に等しくなるように定義される。第2の関係は、さらに、第2のスケール因子が第5の内部因子の平方と第6の内部因子の平方との和の平方根に等しくなるように定義される。
別の態様では、一時的でないコンピュータ読み取り可能な記憶媒体は、プロセッサにコーディング装置を用いてメディアデータを受信させ、受信されたメディアデータを空間領域から周波数領域へ変換するためコーディング装置の8点離散コサイン変換(DCT)ハードウェアユニットを用いて8点離散コサイン変換(DCT)を実行させる命令を備える。8点DCTハードウェアユニットは、第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部と、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部とを含む。第2の関係は、第2のスケール因子が第3の内部因子の平方と第4の内部因子の平方との和の平方根に等しくなるように定義される。第2の関係は、さらに、第2のスケール因子が第5の内部因子の平方と第6の内部因子の平方との和の平方根に等しくなるように定義される。
別の態様では、方法は、コーディング装置を用いてメディアデータを受信することと、受信されたメディアデータを空間領域から周波数領域へ変換するためコーディング装置の8点離散コサイン変換(DCT)ハードウェアユニットを用いて8点DCTを実行することとを備える。8点DCTハードウェアユニットは、第1のスケール因子が第1の内部因子と第2の内部因子との和を定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点DCTハードウェアユニットは、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部をさらに含む。第2の関係は、第2のスケール因子が、最小誤差を生じる以下の式:(1)第3の内部因子(G)と第4の内部因子(D)との和を定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、
(4)第4の内部因子(D)と第5の内部因子(E)との和を第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を第5の近似(ε)と第6の近似(ζ)との和で除したものとの1つに等しくなるように定義される。
別の態様では、装置は、メディアデータを空間領域から周波数領域へ変換する8点離散コサイン変換(DCT)ハードウェアユニットを備える。8点DCTハードウェアユニットは、第1のスケール因子が第1の内部因子と第2の内部因子との和を定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点DCTハードウェアユニットは、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部を含む。第2の関係は、第2のスケール因子が、最小誤差を生じる以下の式:(1)第3の内部因子(G)と第4の内部因子(D)との和を定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、(4)第4の内部因子(D)と第5の内部因子(E)との和を第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を第5の近似(ε)と第6の近似(ζ)との和で除したものとの1つに等しくなるように定義される。
別の態様では、装置は、メディアデータを受信する手段と、受信されたメディアデータを空間領域から周波数領域へ変換するため8点離散コサイン変換(DCT)を実行する手段とを備える。8点DCTを実行する手段は、第1のスケール因子が第1の内部因子と第2の内部因子との和を定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点DCTを実行する手段は、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部をさらに含む。第2の関係は、第2のスケール因子が、最小誤差を生じる以下の式:(1)第3の内部因子(G)と第4の内部因子(D)との和を定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、(4)第4の内部因子(D)と第5の内部因子(E)との和を第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を第5の近似(ε)と第6の近似(ζ)との和で除したものとの1つに等しくなるように定義される。
別の態様では、一時的でないコンピュータ読み取り可能な記憶媒体は、プロセッサに8点離散コサイン変換(DCT)ハードウェアユニットを用いてメディアデータを受信させ、メディアデータを空間領域から周波数領域へ変換するため、8点離散コサイン変換(DCT)を実行させる命令を備える。8点DCTハードウェアユニットは、第1のスケール因子が第1の内部因子と第2の内部因子との和を定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点DCTハードウェアユニットは、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部をさらに含む。第2の関係は、第2のスケール因子が、最小誤差を生じる以下の式:(1)第3の内部因子(G)と第4の内部因子(D)との和を定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、(4)第4の内部因子(D)と第5の内部因子(E)との和を第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を第5の近似(ε)と第6の近似(ζ)との和で除したものとの1つに等しくなるように定義される。
別の態様では、方法は、コーディング装置を用いて符号化済みメディアデータを受信することと、受信された符号化済みメディアデータを周波数領域から空間領域へ変換するためコーディング装置の8点逆離散コサイン変換(IDCT)ハードウェアユニットを用いて8点IDCTを実行することとを備える。8点IDCTハードウェアユニットは、第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点IDCTハードウェアユニットは、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部をさらに含む。第2の関係は、第2のスケール因子が第3の内部因子の平方と第4の内部因子の平方との和の平方根に等しくなるように定義される。第2の関係は、さらに、第2のスケール因子が第5の内部因子の平方と第6の内部因子の平方との和の平方根に等しくなるように定義される。
別の態様では、装置は、符号化済みメディアデータを周波数領域から空間領域へ変換する8点逆離散コサイン変換(IDCT)ハードウェアユニットを備える。8点IDCTハードウェアユニットは、第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点IDCTハードウェアユニットは、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部をさらに含む。第2の関係は、第2のスケール因子が第3の内部因子の平方と第4の内部因子の平方との和の平方根に等しくなるように定義される。第2の関係は、さらに、第2のスケール因子が第5の内部因子の平方と第6の内部因子の平方との和の平方根に等しくなるように定義される。
別の態様では、装置は、符号化済みメディアデータを受信する手段と、受信された符号化済みメディアデータを周波数領域から空間領域へ変換するため8点逆離散コサイン変換(IDCT)を実行する手段とを備える。8点IDCTを実行する手段は、第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点IDCTを実行する手段は、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部を含む。第2の関係は、第2のスケール因子が第3の内部因子の平方と第4の内部因子の平方との和の平方根に等しくなるように定義される。第2の関係は、さらに、第2のスケール因子が第5の内部因子の平方と第6の内部因子の平方との和の平方根に等しくなるように定義される。
別の態様では、一時的でないコンピュータ読み取り可能な記憶媒体は、プロセッサにコーディング装置を用いて符号化済みメディアデータを受信させ、受信された符号化済みメディアデータを周波数領域から空間領域へ変換するためコーディング装置の8点逆離散コサイン変換(IDCT)ハードウェアユニットを用いて8点IDCTを実行させる命令を備える。8点IDCTハードウェアユニットは、第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部と、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部とを含む。第2の関係は、第2のスケール因子が第3の内部因子の平方と第4の内部因子の平方との和の平方根に等しくなるように定義される。第2の関係は、さらに、第2のスケール因子が第5の内部因子の平方と第6の内部因子の平方との和の平方根に等しくなるように定義される。
別の態様では、方法は、コーディング装置を用いて符号化済みメディアデータを受信することと、符号化済みメディアデータを周波数領域から空間領域へ変換するためコーディング装置の8点逆離散コサイン変換(IDCT)ハードウェアユニットを用いて8点逆離散コサイン変換(IDCT)を実行することとを備える。8点IDCTハードウェアユニットは、第1のスケール因子が第1の内部因子と第2の内部因子との和を定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点IDCTハードウェアユニットは、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部をさらに含む。第2の関係は、第2のスケール因子が、最小誤差を生じる以下の式:(1)第3の内部因子(G)と第4の内部因子(D)との和を定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、(4)第4の内部因子(D)と第5の内部因子(E)との和を第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を第5の近似(ε)と第6の近似(ζ)との和で除したものとの1つに等しくなるように定義される。
別の態様では、装置は、符号化済みメディアデータを周波数領域から空間領域へ変換する8点逆離散コサイン変換(IDCT)ハードウェアユニットを備える。8点IDCTハードウェアユニットは、第1のスケール因子が第1の内部因子と第2の内部因子との和を定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点IDCTハードウェアユニットは、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部を含む。第2の関係は、第2のスケール因子が、最小誤差を生じる以下の式:(1)第3の内部因子(G)と第4の内部因子(D)との和を定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、(4)第4の内部因子(D)と第5の内部因子(E)との和を第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を第5の近似(ε)と第6の近似(ζ)との和で除したものとの1つに等しくなるように定義される。
別の態様では、装置は、符号化済みメディアデータを受信する手段と、符号化済みメディアデータを周波数領域から空間領域へ変換するため8点逆離散コサイン変換(IDCT)を実行する手段とを備える。8点IDCTを実行する手段は、第1のスケール因子が第1の内部因子と第2の内部因子との和を定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点IDCTを実行する手段は、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部をさらに含む。第2の関係は、第2のスケール因子が、最小誤差を生じる以下の式:(1)第3の内部因子(G)と第4の内部因子(D)との和を定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、(4)第4の内部因子(D)と第5の内部因子(E)との和を第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を第5の近似(ε)と第6の近似(ζ)との和で除したものとの1つに等しくなるように定義される。
別の態様では、一時的でないコンピュータ読み取り可能な記憶媒体は、プロセッサに8点逆離散コサイン変換(IDCT)ハードウェアユニットを用いて符号化済みメディアデータを受信させ、符号化済みメディアデータを周波数領域から空間領域へ変換するため、8点逆離散コサイン変換(IDCT)を実行させる命令を備える。8点IDCTハードウェアユニットは、第1のスケール因子が第1の内部因子と第2の内部因子との和を定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて第1のスケール因子(μ)に関係している第1及び第2の内部因子(A,B)を備える偶数部を含む。8点IDCTハードウェアユニットは、第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G,D,E,Z)を備える奇数部をさらに含む。第2の関係は、第2のスケール因子が、最小誤差を生じる以下の式:(1)第3の内部因子(G)と第4の内部因子(D)との和を定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、(4)第4の内部因子(D)と第5の内部因子(E)との和を第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を第5の近似(ε)と第6の近似(ζ)との和で除したものとの1つに等しくなるように定義される。
技術の1つ以上の態様の詳細は、添付図面と以下の説明とに記載される。本開示に記載された技術の他の特徴、目的、及び利点は、説明及び図面と、請求項とから明白になるであろう。
一般に、本開示は、様々な関係に基づいて選択された係数の8×8行列として表現された1つ以上の8点離散コサイン変換(DCT)を使用してデータを符号化する技術を対象にする。これらの技術は、デジタル映像データ、画像データ、スピーチデータ、及び/又は、音声データのような視覚又は聴覚メディアデータを含む種々のデータを圧縮し、それによって、このようなデータを表現する電気信号をより効率的に処理、伝送又は保管するための圧縮信号に変換するために適用されることがある。本開示の技術に基づいて定義された様々な関係に従うことにより、8点DCTの直交及び準直交実施がデータに適用されたとき、符号化利得の増大を促進するような係数が係数行列のために選択されることがある。
上記サイズ、すなわち8点は、離散データ単位の観点から表現されている。例えば、映像データは、しばしば映像ブロックの観点から、特に映像圧縮に関して説明される。映像ブロックは、一般に映像フレームのどのようなサイズの部分でも示すが、映像フレームは、一連のピクチャ又は画像内のピクチャ又は画像を示す。各映像ブロックは典型的に、例えば赤、青及び緑のような色成分(いわゆる「色度(chromaticity)」若しくは「クロマ(chroma)」成分)、又は、輝度成分(いわゆる「ルマ(luma)」成分)の何れかを示す複数の離散画素データを含む。画素データの個々の組は、映像ブロック内に単一の1×1点を含み、映像ブロックに関して離散データ単位と見なされ得る。よって、8×8映像ブロックは、例えば、各行に8個の離散的な画素データの組を含む8行の画素データを備える。nビット値は、色又は輝度値を指定するため各画素に割り当てられる。8×8映像ブロックを変換するとき、8点DCTは行に適用され、変換された行を生成する。この8点DCTの適用に続いて、変換された行データの列に8点DCTを適用する。行−列の順序は、逆転されてもよい。同様に、8行4列を収容する矩形ブロックに対して、4点DCTが行全体に適用され、続いて、8点DCTが中間変換された行データの列全体に適用される。
DCTは、DCTが処理することができる音声データ、スピーチ画像データ又は映像データ等のデータのサイズの観点から一般に説明される。例えば、DCTが入力データの8サンプルを処理できる場合、DCTは、8点DCTと呼ばれることがある。さらに、DCTは、特定のタイプとして表されることがある。8つの異なるDCTのタイプのうち最も広く利用されるDCTのタイプは、DCTタイプ−IIであり、これは、「DCT−II」として表されることがある。しばしば、一般にDCTに言及するとき、この言及は、DCTタイプ−II、すなわちDCT−IIを示す。DCT−IIの逆は、DCTタイプ−IIIと呼ばれ、これは同様に「DCT−III」又は、DCTがDCT−IIを示すという共通の理解の下で、「IDCT」の中の「I」が逆を表す「IDCT」として表されることがある。以下のDCTへの言及は、この表記に従い、一般的なDCTへの言及は、特に断らない限り、DCT−IIを示す。しかし、混乱を避けるため、DCT−IIを含むDCTは、大半は、対応するタイプ(II、IIIなど)を示した状態で以下参照される。
本開示において記載される技術は、データの圧縮及び/又は伸長を実現し易くするため、8点DCT−II及び/又は8点DCT−IIIの1つ以上の実施をそれぞれ利用するエンコーダ及び/又はデコーダの両方を含む。同様に、これら8点DCT−II方式を適用することにより実現される圧縮及び伸長は、物理的コンピューティングハードウェア、物理的伝送媒体(例えば、銅、光ファイバ、ワイヤレス、又は他の媒体)、及び/又は、記憶ハードウェア(例えば、磁気的若しくは光学的なディスク若しくはテープ、又は、種々のソリッドステート媒体のうちの何れか)を使用して電気信号をより効率的に処理、送信、及び/又は記憶することができるような、データを表現する電気信号の物理的変換を可能にする。実施は、ハードウェアだけで構成されることがあり、又は、ハードウェアとソフトウェアとの組み合わせで構成されることがある。
8点DCT−IIの実施は、直交又は準直交でもよい。用語「直交」は、行列にこの行列の転置を乗じたときに単位行列に等しくなるという行列一般の特性を示す。用語「準直交(near-orthogonal)」は、厳密な直交性が要求されないような直交特性が緩和された場合を示す。この点に関して、「準直交」は、近似的な又は緩い直交性を示唆する。しかし、準直交行列は、直交の技術的定義を満たさず、このような準直交行列は、純粋に技術的な見方をすると非直交と見なされることがある。
本開示に記載された8点DCT−IIの直交方式を例示するため、8点DCTモジュールを含む装置を検討する。8点DCTモジュールは、本開示に記載された技術に基づいて構成された直交8点DCT−IIを実施する。この直交8点DCT−II方式は、偶数部及び奇数部を含む。8点DCT−IIのいわゆる「偶数部」は、偶数番号が付けられた係数を出力する8点DCT−II実施部分の一部分を示す。8点DCT−IIのいわゆる「奇数部」は、奇数番号が付けられた係数を出力する8点DCT−II実施部分の一部分を示す。
に表されているように、第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなる。奇数部は、第3、第4、第5及び第6の内部因子(G,D,E,Z)と第2のスケール因子(η)とを備える。第2のスケール因子は、第3の内部因子(G)の平方と第4の内部因子(D)の平方との和の平方根に等しい。第2のスケール因子は、第5の内部因子(E)の平方と第6の内部因子(Z)の平方との和の平方根にさらに等しい。第2のスケール因子と第3、第4、第5及び第6の内部因子との間のこれら2つの関係は、以下の式(2):
を用いて数学的に定義される。用語「内部因子」は、因数分解後に残る8点DCTの実施部分の内部にある因子を示す。用語「スケール因子」は、因数分解を介して除去された8点DCTの実施部分の外部にある因子を示す。
内部因数は一般に、実施の複雑性の観点から費用がかさむ乗算を必要とすることから、実施複雑性を増大する。例えば乗算は、より単純な加算演算と比べると、完了するために3倍以上の多数回のコンピュータ演算を必要とすることがある。具体的な乗算器は、より効率的に(例えば、より少ないクロック数で)乗算を実行するために実施されるものもあるが、これらの乗算器方式は、典型的に、非常に多くのチップすなわちシリコン表面積を使い尽くし、そして大量の電力を引き出すこともある。従って因子による乗算は、しばしば、特にセルラ電話機、いわゆる「スマート」セルラ電話機、携帯情報端末(PDA)、ラップトップコンピュータ、いわゆる「ネットブック」などを含む殆どのモバイル機器のような電力に敏感な装置において回避される。因数分解は、1以上の内部因子が8点DCT−II方式から除去され、外部因子で置き換えられるプロセスである。外部因子は、その後、例えば映像エンコーダに関して、通常は最小限の費用又は複雑性の増加で、後続の量子化演算に組み入れることができる。
いずれにしても、上述された内部因子とスケール因子との間の式(1)及び(2)によって定義された上記関係は、これまでの8点DCT−II方式では使用されない内部因子の具体的な値を与える。映像エンコーダは、その結果、これらの内部因子を含む8点DCT−II方式(行及び列の全体)をメディアデータに適用し、メディアデータを空間領域から周波数領域へ変換する。この直交8点DCT−II方式を適用することにより、これらの技術は、標準的な8点DCT−II方式と比較したとき、(圧縮効率を表す用語である)符号化利得を向上する。
直交性は、一般に、可逆であるためDCT−II方式に関して望ましい。この可逆特性は、例えば映像データの残りのブロックからDCT係数を生成するために、映像エンコーダが直交8点DCT−II方式を適用することを可能にする。そして映像デコーダは、たとえあるとしてもデータ損失が僅かなDCT−II係数から、映像データの残りのブロックを再構成するために、8点逆DCT−II(IDCT)方式を適用することが可能である。映像符号化の主要な目標がデータの保存であることを考慮して、H.264映像符号化規格のような様々な符号化規格が、8点DCTの直交方式を採用した。
直交性は、原理的には一般に望まれるが、映像、音声、又は汎用符号化パイプラインは、実際には、直交8点DCT−II方式によって提供される値の正確な再構成を、殆どの点で実質的に阻止するいわゆる「雑音」を生成する多数の段階を伴う。その結果、(厳密に言うと非直交である)準直交を達成するために、直交特性を緩和することは、元のDCT基底関数の精密な近似を少し犠牲にして実施の複雑性を低減すると共に、符号化効率を改善し得る。実質的に、直交特性の緩和は、雑音をシステムに導入するが、実施複雑性を同様に低減すると共に符号化利得を改善し得る。
本開示に記載された8点DCT−IIの準直交方式の例を説明するため、本開示に記載された技術に基づいて構成された準直交8点DCT−IIを実施する装置として8点DCTモジュールを検討する。この準直交8点DCT−II方式は、第1及び第2の内部因子(A,B)と第1のスケール因子(μ)とを備える偶数部を含む。スケール因子は、第1の内部因子と第2の内部因子との和を、定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しく、数学的には、次式(3):
として表される。
本例の準直交8点DCT−II方式は、第3、第4、第5及び第6の内部因子(G,D,E,Z)と第2のスケール因子(η)とを備える奇数部をさらに含む。第2のスケール因子は、最小誤差を生じる以下の項の1つに等しい。この関係は、以下の式(4):
によって定義される。式(4)は、第2のスケール因子が、(1)第3の内部因子(G)と第4の内部因子(D)との和を、定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を、第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を、第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、(4)第4の内部因子(D)と第5の内部因子(E)との和を、第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を、第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を、第5の近似(ε)と第6の近似(ζ)との和で除したもののうちの1つに等しくてもよいことを示す。
また、これらの式は、直交方式に関して定義された関係について、上で決定された内部因子に類似した特有の内部因子値を特定することがあるが、結果として異なった外部因子を生じ得る。しかし、異なった外部因子は典型的に、上述された理由から実施の複雑性を増大させないが、一般に従来型の8点DCT−II方式より、場合によっては本開示の技術によって構成された直交8点DCT−II方式より符号化利得の改善を提供する。従って、制御ユニットは、メディアデータを空間領域から周波数領域へ変換するために、この準直交8点DCT−IIをメディアデータに適用し、符号化利得を改善することになる。
図1は、映像符号化及び復号化システム10を示すブロック図である。図1に示されるように、システム10は、通信チャネル16を介して符号化済みの映像を受信先ハードウェア装置14へ送信する送信元ハードウェア装置12を含む。送信元装置12は、映像源18と、映像エンコーダ20と、送信器22とを含み得る。宛先装置14は、受信器24と、映像デコーダ26と、映像表示装置28とを含み得る。
図1の例では、通信チャネル16は、無線周波数(RF)スペクトル若しくは1つ以上の物理伝送線、又は、無線媒体と有線媒体との何らかの組み合わせのような無線通信媒体でも有線通信媒体でもよい。チャネル16は、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、又は、インターネットのようなグローバル・ネットワークといったパケット・ベース・ネットワークの一部を形成し得る。通信チャネル16は、一般に、送信元装置12から受信先装置14へ映像データを送信する何らかの適当な通信媒体、又は異なる通信媒体の集まりでもよい。
送信元装置12は、宛先装置14への送信用の映像を生成する。しかし一部の場合、装置12、14は、実質的に対称的に動作し得る。例えば、個々の装置12、14は、映像符号化及び復号化コンポーネントを含む。従って、システム10は、例えば、映像ストリーミング、映像ブロードキャスティング、又は、テレビ電話用に、映像装置12、14の間で一方向又は双方向映像伝送をサポートし得る。他のデータ圧縮及び符号化の用途に、装置12、14は、画像データ、スピーチ若しくは音声データ、又は、映像データ、画像データ、スピーチデータ及び音声データのうちの2つ以上の組み合わせのような他のタイプのデータを送受信又は交換するため構成することができる。従って、映像用途の以下の説明は、例示の目的のため提供され、本明細書中に広範に記載されているような開示の種々の態様の限定としてみなされるべきでない。
映像源18は、1台以上の映像カメラのような映像捕捉装置、以前に捕捉された映像を収容する映像アーカイブ、又は映像コンテンツプロバイダから供給されるライブ映像を含む。さらなる代替案として、映像源18は、ソース映像としてのコンピュータ・グラフィックス・ベース・データ、又は、ライブ映像及びコンピュータ生成映像の組み合わせを生成し得る。ある場合において、映像源18がカメラである場合、送信元装置12及び受信先装置14は、いわゆるカメラ付き携帯電話機、又は、テレビ電話機を形成し得る。従って、ある態様では、送信元装置12、受信先装置14、又は両方は、携帯電話機のようなワイヤレス通信機器ハンドセットを形成する。何れの場合も、捕捉映像、事前捕捉映像又はコンピュータ生成映像は、送信器22、チャネル16及び受信器24を介した映像源装置12から映像受信先装置14の映像デコーダ26への送信用の映像エンコーダ20によって符号化される。表示装置28は、液晶ディスプレイ(LCD)、プラズマディスプレイ、又は、有機発光ダイオード(OLED)ディスプレイのような種々の表示装置のうちの何れかを含む。
映像エンコーダ20及び映像デコーダ26は、空間、時間及び/又は信号対雑音比(SNR)のスケーラビリティのためのスケーラブル映像符号化をサポートするため構成されることがある。ある態様では、映像エンコーダ20及び映像デコーダ22は、細粒度(fine granularity)SNRスケーラビリティ(FGS)符号化をサポートするために構成されることがある。エンコーダ20及びデコーダ26は、ベース・レイヤ及び1つ以上のスケーラブル・エンハンスメント・レイヤの符号化、送信及び復号化をサポートすることにより、様々なスケーラビリティの程度をサポートし得る。スケーラブル映像符号化のため、ベース・レイヤは、最低水準の品質で映像データを搬送する。1つ以上のエンハンスメント・レイヤは、より高い空間、時間及び/又はSNRレベルをサポートするために、付加的なビットストリームを搬送する。
映像エンコーダ20及び映像デコーダ26は、MPEG−2、MPEG−4、ITU−T H.263、又はITU−T H.264/MPEG−4次世代映像符号化(AVC)のような映像圧縮基準に準拠して動作し得る。図1に図示されないが、一態様では、映像エンコーダ20及び映像デコーダ26は、それぞれ音声エンコーダ及び映像デコーダと一体化されることがあり、そして、共通データストリーム又は別個のデータストリームの中で音声及び映像の両方の符号化を取り扱うため、適切なMUX−DEMUXユニット、又は他のハードウェア及びソフトウェアを含むことがある。妥当な場合、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、又は、ユーザ・データグラム・プロトコル(UDP)のような他のプロトコルに準拠することがある。
一部の態様では、映像ブロードキャスティングに関して、本開示に記載された技術は、例えば、ワイヤレス映像ブロードキャストサーバ又はワイヤレス通信機器ハンドセットを介して、技術規格TIA−(「FLO仕様書(FLO Specification)」として公開された順方向リンクオンリー(FLO)エアー・インターフェース仕様である「地上波モバイル・マルチメディア・マルチキャスト用の順方向リンク・オンリー・エアー・インターフェース仕様(Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast)」を使用する地上波モバイル・マルチメディア・マルチキャスト(TM3)システムにおいてリアルタイム映像サービスを配信するH.264映像符号化を強化するため適用されることがある。FLO仕様書は、ビットストリームシンタックス及びセマンティックスを定義する例と、FLOエアー・インターフェースに適した復号化プロセスとを含む。代替的に、映像は、DVB−H(デジタル・ビデオ・ブロードキャスト・ハンドヘルド)、ISDB−T(統合デジタル・ブロードキャスト・サービス−地上波)、又はDMB(デジタル・メディア・ブロードキャスト)のような他の規格に基づいてブロードキャストされることがある。従って、送信元装置12は、モバイル・ワイヤレス端末、映像ストリーミング・サーバ、又は映像ブロードキャストサーバでもよい。しかし、本開示に記載された技術は、いかなる特定のタイプのブロードキャスト、マルチキャスト、又はポイント・ツー・ポイント・システムに限定されない。ブロードキャストの場合、送信元装置12は、幾つかの映像データのチャネルを複数の受信先装置へブロードキャストすることがあり、個々の受信先装置は、図1の受信先装置14に類似し得る。
映像エンコーダ20及び映像デコーダ26は、個々に、1以上のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、ディスクリート・ロジック、ソフトウェア、ハードウェア、ファームウェア、又はこれらのうちの何れかの組み合わせとして実施され得る。従って、個々の映像エンコーダ20及び映像デコーダ26は、集積回路(IC)チップ又は装置として少なくとも部分的に実施され、そして、1台以上のエンコーダ又はデコーダに含まれることがあり、エンコーダ及びデコーダはどちらも複合型エンコーダ/デコーダ(CODEC)の一部としてそれぞれのモバイル機器、加入者機器、放送機器、サーバなどに統合され得る。さらに、送信元装置12及び受信装置14は、個々に、符号化済みの映像の送信及び受信のために、適切な変調コンポーネント、復調コンポーネント、周波数変換コンポーネント、フィルタリングコンポーネント、及び、増幅器コンポーネントを含むことがあり、適用可能なものとして、ワイヤレス通信をサポートするため十分な無線周波数(RF)コンポーネント及びアンテナを含む。しかし、例示を簡単にするため、このようなコンポーネントは、図1に図示されない。
映像シーケンスは、一連の映像フレームを含む。映像エンコーダ20は、映像データを符号化するため個別の映像フレーム内画素のブロックを操作する。映像ブロックは、固定サイズ又は可変サイズを有することがあり、指定された符号化規格によってサイズが異なることもある。各映像フレームは一連のスライスを含む。各スライスは、一連のマクロブロックを含むことがあり、マクロブロックは、サブブロックに配置されることがある。一例として、ITU−T H.264規格は、ルマ成分用の16×16、8×8、4×4と、クロマ成分用の8×8のような様々な2個1組のブロックサイズでイントラ予測をサポートし、同様に、ルマ成分用の16×16、16×8、8×16、8×8、8×4、4×8及び4×4と、クロマ成分用の対応するスケールサイズのような様々なブロックサイズでインター予測をサポートする。
より小さい映像ブロックは、一般に、より優れた分解能を提供することができ、より高いレベルの細部を含む映像フレームの位置用に使用されることがある。一般に、マクロブロック(MB)及び様々なサブブロックは、映像ブロックを示すと考えられる。さらに、スライスは、MB及び/又はサブブロックのような一連の映像ブロックを示すと考えられる。各スライスは、独立に復号化可能なユニットでもよい。予測後、変換が2個1組又は2個1組ではないサイズをもつ残りのブロックに実行され、イントラ16×16予測モードが使用される場合、さらなる変換がクロマ成分又はルマ成分のための4×4ブロックのDCT係数に適用されることがある。
図1のシステム10の映像エンコーダ20及び/又は映像デコーダ26は、それぞれ、8点DCT−II及びこの8点DCT−IIの逆(例えば、8点DCT−III)の実施部分を含むよう構成される。8点DCT−IIは、本開示において記載された8点サイズのDCTのためのDCT−II行列係数を選択する技術の種々の関係のうちの1つに従う。ITU−T H.264規格は、ルマ成分のための16×16、8×8、4×4とクロマ成分のための8×8のような様々なブロックサイズにおけるイントラ予測をサポートするが、符号化効率を改善するためのこの規格の改定が現在のところ進行中である。MPEGとITU−Tとの間の共同研究である映像符号化−共同研究部会(JCT−VC)によって提案された1つの改定規格は、次世代映像符号化(HEVC)と呼ばれることがある。その結果、HEVC及び他の発展型規格又は仕様は、符号化効率を改善するために、これらのDCT−II及びDCT−IIIを考慮することがある。
本開示に記載された技術によれば、8点DCT−IIの実施部分は、従来的な実施部分より符号化利得の改善を促進し得る様々な関係のうちの1つに従う方法で生み出されることがある。直交方式に関して、説明の便宜上ここで繰り返される上記式(1)は、偶数内部因子(すなわち、DCT−II方式の偶数部の内部にある因子のうちの因子)と、偶数部の出力のうちの1以上に適用される第1のスケール因子との間で第1の関係:
を特定する。式中、変数A及びBは、8点DCT−II方式の「偶数」部分における第1及び第2の内部因子を表し、変数μは、8点DCT−II方式の「偶数」部分に適用される第1のスケール因子を表す。8点DCT−IIのいわゆる「偶数」部分は、偶数番号が付けられた係数を出力する4点DCT−II方式の一部分を示す。
8点DCT−IIのいわゆる「奇数部」は、奇数番号が付けられた係数を出力する4点DCT−II方式の一部分を示す。直交8点DCT−II方式では、奇数部は、第3、第4、第5及び第6の内部因子(G,D,E,Z)と第2のスケール因子(η)とを備える。第2のスケール因子は、第3の内部因子(G)の平方と第4の内部因子(D)の平方との和の平方根に等しくなる。第2のスケール因子は、第5の内部因子(E)の平方と第6の内部因子(Z)の平方との和の平方根にさらに等しくなる。第2のスケール因子と第3、第4、第5及び第6の内部因子との間のこれらの2つの関係は、式(2)に関して上述されるように数学的に定義され、この式(2):
が説明の便宜上ここに再掲される。用語「内部因子」は、因数分解後に残る8点DCTの実施部分の内部にある因子を示す。用語「スケール因子」は、因数分解を介して除去された8点DCTの実施部分の外部にある因子を示す。
一般に内部因子は、より複雑な実施を伴う乗算を必要とすることから実施複雑性を増大させる。例えば乗算は、より単純な加算演算と比べると、完了するためには3倍以上の多数回のコンピュータ演算を必要とすることがある。具体的な乗算器は、より効率的に(例えば、より少ないクロック数で)乗算を実行するために実施されることがあるが、これらの乗算器方式は典型的に、非常により多くのチップすなわちシリコン表面積を使い尽くし、そして、大量の電力を引き出すこともある。従って因子による乗算は、しばしば、特にセルラ電話機、いわゆる「スマート」セルラ電話機、携帯情報端末(PDA)、ラップトップコンピュータ、いわゆる「ネットブック」などを含む殆どのモバイル機器のような電力に敏感な装置において回避される。因数分解は、1以上の内部因子が8点DCT−II方式から除去され、外部因子で置き換えられるプロセスである。その後外部因子は、例えば映像エンコーダに関して、通常は最小限の費用又は複雑性の増加で、後続の量子化演算に組み入れることができる。
何れにしても、式(1)に関連して記載された第1及び第2の内部因子A、Bと第1のスケール因子(μ)との間の上記関係と、第3から第6までの内部因子G、D、E及びZと第2のスケール因子(η)との間の関係は、これまでの8点DCT−IIの実施部分では一般に使用されない内部因子の具体的な値を提供する。例えば、内部因子A及びBそれぞれの値2及び5と、G、D、E及びZそれぞれの値11、3、9及び7は、実施複雑性を過度に増大させることがなく、公知の8点DCT方式より符号化利得を改善する。そして映像エンコーダは、メディアデータを空間領域から周波数領域へ変換するために、これら内部因子を含む8点DCT−II方式をメディアデータに適用する。この直交8点DCT−II方式を適用することにより、これらの技術は、従来のDCT−II方式と比べたとき、(圧縮効率を表す用語である)符号化利得を向上し易くする。
直交性は、一般に可逆であるためDCT−II方式に関して望ましい。この可逆特性は一例として、映像エンコーダが直交8点DCT−II方式を適用し、映像データの残りのブロックからDCT係数を生成することを可能にする。映像デコーダは、8点逆DCT−II(IDCT)方式を適用して、DCT−II係数から、データ損失がほとんどない状態で、映像データの残りのブロックを再構成することが可能である。映像符号化の主要な目標がデータの保存であることを考慮して、H.264映像符号化規格のような様々な符号化規格は、8点DCTの直交方式を採用した。
一般に直交性は、原理的には望まれるが、映像、音声又は汎用符号化パイプラインは、実際には、直交8点DCT−II方式によって提供される値の正確な再構成を殆ど実質的に阻止するいわゆる「雑音」を生じる数多くのステップを伴う。その結果、直交特性を緩和して(厳密に言うと非直交である)準直交を達成することにより、元のDCT基底関数の精密な近似を少し犠牲にして、実施複雑性を低減すると共に、符号化効率を改善し得る。実質的に直交特性の緩和は、雑音をシステムに導入するが、実施複雑性を同様に低減すると共に符号化利得を改善し得る。
8点DCT−IIの準直交方式の例を説明するため、一例として制御ユニットを含む装置を検討する。制御ユニットは、本開示に記載された技術に基づく準直交8点DCT−IIを実施する。この準直交8点DCT−II方式は、第1及び第2の内部因子(A,B)と第1のスケール因子(μ)とを備える偶数部を含み、これは、直交方式と同じである。スケール因子は、第1の内部因子と第2の内部因子との和を、定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなり、上記式(3)のように数学的に表される。この式:
を説明の便宜上ここに再掲する。
本例における準直交8点DCT−II方式は、第3、第4、第5及び第6の内部因子(G,D,E,Z)と第2のスケール因子(η)とを備える奇数部奇数部をさらに含む。第2のスケール因子は、最小誤差を生じる以下の項の1つに等しく、この関係は、上記式(4)によって定義される。この式:
を説明の便宜上ここに再掲する。式(4)は、第2のスケール因子が、(1)第3の内部因子(G)と第4の内部因子(D)との和を、定数パイの1/16のコサインの第3の近似(γ)と定数パイの1/16のサインの第4の近似(δ)との和で除したものと、(2)第3の内部因子(G)と第5の内部因子(E)との和を、第3の近似(γ)と定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、(3)第3の内部因子(G)と第6の内部因子(Z)との和を、第3の近似(γ)と定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、(4)第4の内部因子(D)と第5の内部因子(E)との和を、第4の近似(δ)と第5の近似(ε)との和で除したものと、(5)第4の内部因子(D)と第6の内部因子(Z)との和を、第4の近似(δ)と第6の近似(ζ)との和で除したものと、(6)第5の内部因子(E)と第6の内部因子(Z)との和を、第5の近似(ε)と第6の近似(ζ)との和で除したもののうちの1つに等しくなり得ることを示す。
同様に、これらの式は、直交方式に関して定義された関係について、上で決定された内部因子に類似した特有の内部因子値を特定することがあるが、結果として異なった外部因子を生じ得る。しかし、異なった外部因子は典型的に、上述した理由から実施複雑性を増大させないが、一般に、従来型の8点DCT−II方式について、さらに一部の事例では、本開示の技術によって構成される直交8点DCT−II方式について、符号化利得の改善を提供する。その結果、制御ユニットは、この準直交8点DCT−IIをメディアデータに適用して、メディアデータを空間領域から周波数領域へ変換し、符号化利得を改善する。
図2は、図1の映像エンコーダ20をより詳細に例示するブロック図である。映像エンコーダ20は、例えば1以上の集積回路装置として少なくとも部分的に形成され、これらの集積回路装置は、全体として集積回路装置と呼ばれることもある。一部の態様では、映像エンコーダ20はワイヤレス通信機器ハンドセット又はブロードキャストサーバの一部を形成する。映像エンコーダ20は、映像フレーム内でブロックのイントラ符号化及びインター符号化を実行し得る。イントラ符号化は空間予測に依存して、所定の映像フレーム内で映像中の空間的冗長性を低減又は除去する。インター符号化は時間予測に依存して、映像シーケンスの中の隣接フレーム内で、映像中の時間的冗長性を低減又は除去する。インター符号化に関して、映像エンコーダ20は動き推定を実行し、隣接フレーム間の対応する映像ブロックの動きを追跡する。
図2に示されるように、映像エンコーダ20は、符号化される映像フレーム内の現在の映像ブロック30を受信する。図2の例では、映像エンコーダ20は、動き推定ユニット32と、基準フレーム記憶装置34と、動き補償ユニット36と、ブロック変換ユニット38と、量子化ユニット40と、逆量子化ユニット42と、逆変換ユニット44と、エントロピー符号化ユニット46とを含む。ループ内又はループ後非ブロック化フィルタ(post loop deblocking filter)(図示せず)が、ブロックをフィルタ処理して、ブロック化アーティファクトを除去するために適用されることがある。映像エンコーダ20は、加算器48及び加算器50をさらに含む。図2は、映像ブロックのインター符号化用の映像エンコーダ20の時間予測コンポーネントを例示する。例示を簡単にするため図2に図示されないが、映像エンコーダ20は、一部の映像ブロックのイントラ符号化のための空間予測コンポーネントを含むことがある。
動き推定ユニット32は、映像ブロック30を1又は複数の(以下、「1以上の」と記載する)隣接映像フレーム内のブロックと比較し、1以上の動きベクトルを生成する。1以上の隣接フレームは、基準フレーム記憶装置34から取り出される。この基準フレーム記憶装置34は、どのようなタイプのメモリ又はデータ記憶装置でもよく、既に符号化済みのブロックから再構成された映像ブロックを記憶する。動き推定は、例えば、16×16、16×8、8×16、8×8、又はより小さいブロックサイズの可変サイズのブロックに対し実行され得る。動き推定ユニット32は、例えばレート歪みモデルに基づいて、現在映像ブロック30と最も良く一致する隣接フレーム内の1以上のブロックを特定し、隣接フレーム内のブロックと現在映像ブロックとの間の変位を決定する。これに基づいて、動き推定ユニット32は、現在映像ブロック30と、現在映像ブロック30を符号化するために使用された基準フレームからの1以上の対応するブロックとの間の変位の絶対値及び軌跡を示す1以上の動きベクトル(MV)を生成する。1以上の一致するブロックは、符号化されるブロックのインター符号化のための予測的(又は予測)ブロックとしての役割を果たすことになる。
動きベクトルは、半画素精度若しくは4分の1画素精度、又は、より一層微細な精度を有することがあり、映像エンコーダ20が整数画素位置より高い精度で動きを追跡し、より優れた予測ブロックを取得することを可能にする。分数画素値をもつ動きベクトルが使用されるとき、補間演算が動き補償ユニット36の中で実行される。動き推定ユニット32は、レート歪みモデルのようなある一定の規準を使用して、最良ブロック区分と、1映像ブロックに対する1以上の動きベクトルとを特定する。例えば、双方向予測の場合、2以上の動きベクトルが存在することがある。結果として得られたブロック区分と動きベクトルとを使用して、動き補償ユニット36は、予測映像ブロックを形成する。
映像エンコーダ20は、加算器48において元の現在映像ブロック30から動き補償ユニット36によって生成された予測映像ブロックを差し引くことにより残りの映像ブロックを形成する。ブロック変換ユニット38は、残りの変換ブロック係数を生成する変換を適用する。図2に示されるように、ブロック変換ユニット38は、本開示に記載された技術に基づいて構成された8点DCT−IIを実施する8点DCT−IIユニット52を含む。8点DCT−IIユニット52は、ハードウェアモジュールを表現し、このハードウェアモジュールは、一部の事例では、(ソフトウェアコード又は命令を実行するデジタル信号プロセッサ、すなわち、DSPのような)ソフトウェアを実行し、上で特定された2つの関係のうちの一方によって定義された内部因子を有する8点DCT−IIを実施する。ブロック変換ユニット38は、スケール化された(scaled)8点DCT−IIユニット52を残りのブロックに適用し、残りの変換係数の8×8ブロックを生成する。8点DCT−IIユニット52は一般に、残りのブロックを残りの画素データとして表現された空間領域から、DCT係数として表現される周波数領域へ変換する。変換係数は、少なくとも1個のDCT係数及び1以上のAC係数を含むDCT係数を備える得る。
量子化ユニット40は、残りの変換ブロック係数を量子化し(例えば、丸めて(round))、ビットレートをさらに削減する。上述のように、量子化ユニット40は、因数分解中に除去された内部因子を組み入れることにより、スケール化された8点DCT−IIユニット52のスケール化された特性の原因となる。すなわち、量子化ユニット40は、図4の実施部70に関連して以下に示される外部因子を組み入れる。量子化は典型的に乗算を伴うので、量子化ユニット40の実施複雑性を増大させずに、これらの因子を量子化ユニット40に組み入れることが可能である。この点に関して、スケール化された8点DCT−IIユニット52から因子を除去することは、量子化ユニット40の実施複雑性を増大することなく、DCT−IIユニット52の実施複雑性を減少させ、結果として、映像エンコーダ20に関して実施複雑性の有効な減少をもたらす。
エントロピー符号化ユニット46は、量子化済みの係数をエントロピー符号化し、ビットレートをより一層削減する。エントロピー符号化ユニット46は、一部の事例では、エントロピー符号化と呼ばれる統計的な可逆符号化を実行する。エントロピー符号化ユニット46は、量子化済みのDCT係数の確率分布をモデル化し、モデル化された確率分布に基づいて符号表(例えば、CAVLC又はCABAC)を選択する。この符号表を使用して、エントロピー符号化ユニット46は、量子化済みのDCT係数を圧縮する方法で、個々の量子化済みのDCT係数のための符号を選択する。例示するため、エントロピー符号化ユニット46は、頻繁に出現する量子化済みのDCT係数のための(ビット数の)短い符号語(codeword)と、あまり頻繁に出現しない量子化済みのDCT係数のための(ビット数の)長い符号語とを選択し得る。短い符号語が量子化済みのDCT係数より少ないビットを使用する限り、平均してエントロピー符号化ユニット46は、量子化済みのDCT係数を圧縮する。エントロピー符号化ユニット46は、映像デコーダ26へ送信されるビットストリームとしてエントロピー符号化済みの係数を出力する。一般に、映像デコーダ26は、図3の例に関連して記載されるように、逆演算を実行し、ビットストリームから符号化済みの映像を復号化し再構成する。
再構成ユニット42及び逆変換ユニット44はそれぞれ、量子化済みの係数を再構成し、逆変換を適用し、残りのブロックを再構成する。逆変換ユニット44は、逆DCT(IDCT)を含むことがあり、この逆DCTは、図3に関連して後述される8点DCT−IIIユニット68と同様に、8点DCT−IIユニット52の逆演算を実行するDCTタイプIIIと一般に呼ばれる。加算ユニット50は、再構成済みの残りのブロックを動き補償ユニット36によって生成された動き補償済みの予測ブロックに加算し、基準フレーム記憶装置34への記憶用の再構成済みの映像ブロックを生成する。再構成済みの映像ブロックは、その後の映像フレーム内のブロックを符号化するために、動き推定ユニット32及び動き補償ユニット36によって使用される。
図3は、図1の映像デコーダ26の例をより詳細に例示するブロック図である。映像デコーダ26は、少なくとも部分的に1以上の集積回路装置として形成され、この集積回路装置は、全体的に集積回路装置と呼ばれることがある。一部の態様では、映像デコーダ26は、ワイヤレス通信機器ハンドセットの一部を形成することがある。映像デコーダ26は、映像フレーム内でブロックのイントラ復号化又はインター復号化を実行し得る。図3に示されるように、映像デコーダ26は、映像エンコーダ20によって符号化された符号化済みの映像ビットストリームを受信する。図3の例では、映像デコーダ26は、エントロピー復号化ユニット54と、動き補償ユニット56と、再構成ユニット58と、逆変換ユニット60と、基準フレーム記憶装置62とを含む。エントロピー復号化ユニット64は、メモリ64に記憶された1以上のデータ構造体にアクセスし、符号化中に役立つデータを取得する。映像デコーダ26は、加算器66の出力をフィルタ処理するループ内非ブロック化フィルタ(図示せず)をさらに含むことがある。映像デコーダ26は、加算器66をさらに含む。図3は、映像ブロックのインター復号化用の映像デコーダ26の時間予測コンポーネントを例示する。図3には図示されないが、映像デコーダ26は、一部の映像ブロックのイントラ復号化のための空間予測コンポーネントをさらに含むことがある。
エントロピー復号化ユニット54は、符号化済みの映像ビットストリームを受信し該ビットストリームから、量子化済みの残りの係数及び量子化済みのパラメータを復号化すると共に、マクロブロック符号化モード及び動き情報のような他の情報を復号化する。この他の情報は、動きベクトル及びブロック区分を含み得る。動き補償ユニット56は、動きベクトル及びブロック区分と、基準フレーム記憶装置62からの1以上の再構成済みの基準フレームとを受信し、予測映像ブロックを生成する。
再構成ユニット58は、量子化済みのブロック係数を逆量子化、すなわち、脱量子化(de-quantize)する。逆変換ユニット60は、逆変換、例えば逆DCTを係数に適用し、残りのブロックを生成する。より具体的に、逆変換ユニット60はスケール化された8点DCT−IIIユニット68を含み、逆変換ユニット60はユニット68を係数に適用し、残りのブロックを生成する。図2に示されるスケール化された8点DCT−IIユニット52の逆であるスケール化された8点DCT−IIIユニット68は、係数を周波数領域から空間領域へ変換し、残りのブロックを生成し得る。上記量子化ユニット40と同様に、再構成ユニット58は、因数分解中に除去された外部因子を再構成プロセスに、実施複雑性の増大がほとんどない状態で、組み入れることにより、8点DCT−IIIユニット68のスケール化された特性の原因となる。スケール化された8点DCT−IIIユニット68から因子を除去することは、実施複雑性を減少させ、結果として、映像デコーダ26に関して複雑性の有効な減少をもたらす。
次に予測映像ブロックは、残りのブロックと加算器66によって加算され、復号化済みのブロックを形成する。非ブロック化フィルタ(図示せず)が、復号化済みのブロックをフィルタ処理するために適用され、ブロック化アーティファクト(artifact)を除去し得る。次にフィルタ処理されたブロックは、基準フレーム記憶装置62の中に配置される。この基準フレーム記憶装置は、その後の映像フレーム復号化用の基準フレームを提供し、表示装置28(図1)を駆動する復号化済みの映像をさらに生成する。
図4は、本開示の技術に基づいて構成された図2の例に示される8点DCT−IIユニット52によって表現されたような、スケール化された8点DCT−IIの一般的な方式を例示する図である。図4の例では、8点DCT−II実施部70は、上述の8点DCT−IIの直交方式及び準直交方式の両方を表現する。この意味では、直交方式及び準直交方式の両方は、同じ因数分解プロセスを使用して決定され、以下でより詳しく記載されるように、直交方式と準直交方式との間の差は、異なる内部因子及びスケール因子の形式で現われる。本実施例に関連して記載されているが、様々な因数分解プロセスを介して導出される他の方式が使用され得る。従って、本開示の技術は、図4の例に限定されるべきでない。図2の例に示された8点DCT−IIユニット52は、1以上のこれらの実施部70を組み込むことがある。図3の例に示された8点DCT−IIIユニット68は、これらの実施部70のうちの1以上の逆実施を組み込むことがある。ここで逆実施は、入力が実施部70の右から入り、出力が実施部70の左から出るように信号路を単に反転するだけのものである。
図4の例に示されるように、8点DCT−II実施部70Aは、バタフライユニット72と、偶数部74Aと、奇数部74Bとを含む。バタフライユニット72は、入力x0、…、x3を適切な偶数部74A及び奇数部47B(「部分74」)へ導く、又は、そうでなければ転送するハードウェア、又はハードウェアとソフトウェアとの組み合わせを表す。バタフライユニット72は通常、4点DCT−II方式のような、偶数部74A及び奇数部74Bによって、この場合に、それぞれ表現されるより小さいDCTの結果を合成する。偶数部74Aは、偶数DCT係数X0、X2、X4及びX6を出力する8点DCT−II実施部70の4×4部分である。特に、偶数係数X0及びX4は、1を平方根2で除した外部因子が乗じられ、量子化ユニット40によって適用可能であり、通常は適用される。偶数係数X2及びX6は、1をミュー(μ)で除した外部因子が乗じられ、また、量子化ユニット40によって組み込み可能で通常は組み込まれ、かつ適用可能で通常は適用される。偶数部74Aは、2個の外部因子A及びBを含み、これらの外部因子は、以下でより詳細に記載されるように、2つの方法のうちの一方でミュー(μ)に関係している。
奇数部74Bは、奇数DCT係数X1、X3、X5及びX7を出力する8点DCT−II実施部70の4点部分である。奇数部74Bは、G、D、E及びZで表された4個の内部因子を含み、これらの内部因子は、再度以下でより詳細に記載されるように、2つの方法のうちの一方で奇数DCT係数X1、X3、X5及びX7に適用されたスケール因子イータ(η)に関係している。さらに、1を平方根2で除した外部因子(1/√2)は、奇数係数X1及びX7に適用される。1を平方根2で除した外部因子と、1をスケール因子イータで除したスケール因子との両方は、量子化ユニット40に組み込むことが可能である。量子化ユニットは、一般に、映像エンコーダ20の実施複雑性を増大させることなく、これらの因子を適用する。
直交方式について、式(1)及び(2)に記載された関係は、直交特性を最初に考慮することにより導出することができ、この直交特性は、以下の式(5):
CTC=I (5)
によって数学的に記載される。変数Cは、本事例では何らかの行列を指し、一方、CTは、行列Cの転置を表す。変数Iは単位行列を表す。よって行列は、この行列の転置とこの行列自体との積が、単位行列に等しくなる場合に直交特性を示す。
CTC=I (5)
によって数学的に記載される。変数Cは、本事例では何らかの行列を指し、一方、CTは、行列Cの転置を表す。変数Iは単位行列を表す。よって行列は、この行列の転置とこの行列自体との積が、単位行列に等しくなる場合に直交特性を示す。
上述の理由からメディア符号化の実施において好ましいスケール行列を想定すると、以下の式(6):
C=C’D (6)
に記載されるように、行列Cは、C’と表された整数スケール化変換と、スケール因子又は外部因子の対角行列Dとに分割される。式(5)内のCに式(6)からのC’Dを代入すると、以下の式(7):
(C’D)T’(C’D)=DC’TC’D=I (7)
が得られ、この式は、以下の式(8):
C’C=D―2 (8)
に示された数学的方程式に簡単化することができる。式(8)は、結果として得られる整数変換が直交したまま維持されるように、スケーリング因子を選択する仕組みを提供する。
C=C’D (6)
に記載されるように、行列Cは、C’と表された整数スケール化変換と、スケール因子又は外部因子の対角行列Dとに分割される。式(5)内のCに式(6)からのC’Dを代入すると、以下の式(7):
(C’D)T’(C’D)=DC’TC’D=I (7)
が得られ、この式は、以下の式(8):
C’C=D―2 (8)
に示された数学的方程式に簡単化することができる。式(8)は、結果として得られる整数変換が直交したまま維持されるように、スケーリング因子を選択する仕組みを提供する。
例えば、8点DCT−II方式の場合、このDCT−II方式は、通常は、定数パイの3倍を8で除したもののコサインと、定数パイの3倍を8で除したもののサインと、定数パイを16で除したもののコスティング(costing)と、定数パイを16で除したもののサインと、定数パイの3倍を16で除したもののコサインと、定数パイの3倍を16で除したもののサインとを表す因子の近似だけを適用する。これら6個の因子が行列C’の係数である整数A、B、G、D、E及びZで置換されると仮定し、そして、上記直交性条件を使用すると、上記式(1)は、8点DCT−IIの直交近似を線形するタスクが、以下の式(9)及び(10):
を満たすような整数(A、B、G、D、E及びZ)を見つけるタスクに限定することができるような正規化因子を表す。
特に、表1及び2の両方における最初の3個の解は、やや不正確であるが、A及びBが5及び12に設定され、G、D、E及びZが11、3、9及び7にそれぞれ設定された4番目の解から始めて、結果として得られる実施部70の複雑性は増大するが、様々なコサイン項及びサイン項の近似の誤差ははるかに小さい。表2の(ヘッダ行以降の)第5行における5番目の解は、近似誤差の観点では、表2の第6行における解におおよそ等しくなる。表2の第7行及び第8行に掲載された7番目の解及び8番目の解は、非常に低い近似誤差を示す。表1及び表2から、内部因子A、B、G、D、E及びZに関する数多くの異なる組み合わせが、特定用途に用いられる実施部70に適合するよう試行され得る。注目の組み合わせは、(11、3、9、7)及び(19、4、16、11)という(G、D、E、Z)の値の1つと組み合わせた(1、2)、(2、5)又は(3、7)という(A、B)の値を含む。この点に関して、本開示に記載された技術は、小さい複雑性の増大だけで、符号化利得の増大を促進し、実施部70は内部因子A、B、G、D、E及びZに対する上記値の1以上の組み合わせを組み入れ、実施複雑性の最小限の増加で、潜在的に改善された符号化利得を提供する。
準直交方式に対し、式(3)及び(4)に記載された関係は、直交性が原理的には8点DCT−IIの簡単な逆実施を一般に保証する一方、実際には、(整数変換に続く)大半のスケール因子が無理数になり、整数乗算器を使用して厳密に実施することが難しい、という点を最初に考慮することにより得られる。さらに、量子化が、一般に8点DCT変換の適用の後に続き、この量子化は、逆直交DCT−II方式の簡単な適用を妨げることがある雑音を加える。さらに、直交性の維持は、実際には、元のDCT−IIに基づく関数に関してこのような直交方式の近似の的確さを低下させることがある。その結果として、順及び逆(straight and inverse )方式の間のこのような直交性不一致の程度の緩和は、実際に符号化利得を改善することがある。
に基づいて定義される。式(5)に関する上の表記と同じ表記を使用して、式(11)は、単位行列からの距離のノルムが行列の転置と行列との積から単位行列を差し引いたものとして定義できることを端的に示す。CTCが対角行列のままであると仮定すると、平均絶対距離は、以下の式(12):
に基づいて計算することができ、平均絶対距離は、変数δNによって表され、Nは、行列のサイズに等しくなる。
直交性の特徴を緩和することにより、符号化利得は改善し得るが、平均絶対差に関する符号化利得の解析は、圧縮される画像の特有のモデル又は統計値に過度に依存する。その結果、直交性の特徴を緩和する程度は、DCT−IIを基本とする関数の一致の観点で潜在的に最良である整数変換を見つけることに関係する異なった尺度の解析を介して決定され得る。この評価形式に関するさらなる情報は、Y.A.Reznik、A.T.Hinds及びJ.L.Mitchellによる「共通因子を用いる固定点アルゴリズムの精度改善(Improved Precision of Fixed-Point Algorithms by Means of Common Factors)」、ICIP 予稿集(Proc.ICIP )、サンディエゴ市(San Diego)、カリフォルニア州(CA)と題する論文に見出すことができ、この論文の内容全体は、本明細書中に完全に記載されているかのように参照により組み込まれる。
が説明の便宜上ここに再掲される。
表4において、共通因子アプローチを使用することによって対称的になる誤差の対は、下線が付けられている。これらの対称的な誤差は、変換の奇数部の4個の内部因子の組について見出される最悪状況の近似誤差を表現する。
表5において分かるように、DCT−IIの非直交方式のすべて、特に、3ビット直交方式と比較したときの3ビット非直交方式は、対応する直交方式より低い最悪の状況の誤差を有している。この3ビット非直交方式は、無理数DCT−II因子のより優れた近似を介して符号化利得を増大させるのに加えて、H.264映像符号化規格において指定された8点DCT−IIよりも複雑性の低い数学的演算を必要とする。
線形又は1次元DCTとして上述されたが、この開示に記載された8点DCT方式は、以下の表6に示されるように、8×8DCT−II行列として表現できる。パラメータA、B、G、D、E及びZの選定に依存して、ある程度の数の行列係数が大きくなり、これらの大きい値による乗算を実行するために必要となる演算に関して、実施複雑性を増大させる。これらの大きい値を除去し、変換全体を介してダイナミックレンジをバランスさせるために、右シフトを乗算の後実施に導入できる。幾つかの例では、右シフトは、パラメータA及びBの右シフトが同じであるという1つの制約例を用いて、任意の正の整数個ずつ値を右にシフトする。同様に、G、D、E及びZに対する右へのシフトは、同様に同じであることが必要である。右シフトは、これらの整数パラメータを2個1組の有理数に変換し、この有理数は、2の累乗のような分母をもつ有理数である。典型的に、右シフトは、変換の正確さを減少させ、その結果、これらの右シフトを最小限に保つことがしばしば望ましい。同様に、入力サンプルは、右シフトに起因した正確さの損失を最小限に抑えるために定数個ずつ予め左シフトされてもよい。典型的な例は、A及びBに対する1ずつの右シフトと、G、D、E及びZに対する4ずつの右シフトである。
DCT−IIユニットに関して図4の例に記載されているが、このDCT−IIユニットは、本開示の技術に基づいて構成されたIDCTをさらに表現することがある。図4の例に図示された実施部分からの逆DCTの形成は、入力が図4の右の実施部分によって受信され、出力が実施部分の左で出力されるように入力及び出力を逆転させることを伴う。換言すると、入力が次に出力になり、出力が入力になるように垂直アクセスに関する実施部分を反転させることは、一般に、IDCT実施部分を生成することになる。説明を簡単にするため、そして、DCTからIDCTを形成することが技術的に周知であることを考慮して、これらのさらなるIDCT実施部分は、別個の図に図示されていない。
図5は、本開示の技術に基づいて構成される8点DCT実施部分を適用する、図2の映像エンコーダ20のようなコーディング(coding)装置の動作例を示すフローチャートである。最初に、映像エンコーダ20は、符号化される映像フレーム内の現在映像ブロック30を受信する(90)。動き推定ユニット32は、映像ブロック30を1以上の隣接映像フレーム内のブロックと比較する動き推定を実行し、1以上の動きベクトルを生成する(92)。1以上の隣接フレームは、基準フレーム記憶装置34から取り出ることができる。動き推定は、可変サイズ、例えば、16×16、16×8、8×16、8×8、4×4又はより小さいブロックサイズのブロックに対し実行され得る。動き推定ユニット32は、例えば、レート歪みモデル(rate-distortion model)に基づいて、隣接フレーム内で現在映像ブロック30と最もよく一致する1以上のブロックを特定し、隣接フレーム内の当該ブロックと現在映像ブロックとの間の変位を決定する。これに基づいて、動き推定ユニット32は、現在映像ブロック30と現在映像ブロック30を符号化するために使用される基準フレームからの1以上の一致するブロックとの間の変位の大きさ及び軌跡を示す1以上の動きベクトル(MV)を生成する。1以上の一致するブロックは、符号化されるブロックのインター符号化用の予測的(又は予測)ブロックとしての役割を果たすことになる。
動きベクトルは、半画素精度、4分の1画素精度、又は、より一層微細な精度を有することがあり、映像エンコーダ20が整数画素位置より高い精度で動きを追跡し、より優れた予測ブロックを取得することを可能にする。分数画素値をもつ動きベクトルが使用されるとき、補間演算が動き補償ユニット36の中で実行される。動き推定ユニット32は、レート歪みモデルのようなある一定の規準を使用して、最良ブロック区分と、映像ブロックに対する1以上の動きベクトルとを特定する。例えば、双方向予測の場合、2個以上の動きベクトルが存在することがある。結果として得られたブロック区分と動きベクトルとを使用して、動き補償ユニット36は、予測映像ブロックを形成する(94)。
映像エンコーダ20は、加算器48において元の現在映像ブロック30から動き補償ユニット36によって生成された予測映像ブロックを差し引くことにより残りの映像ブロックを形成する(96)。ブロック変換ユニット38は、残りの変換ブロック係数を生成する変換を適用する。ブロック変換ユニット38は、本開示に記載された技術に基づいて生成された8点DCT−IIユニット52を含む。ブロック変換ユニット38は、スケール化された8点DCT−IIユニット52を残りのブロックに適用し、残りの変換係数の8×8ブロックを生成する。一般に8点DCT−IIユニット52は、残りのブロックを、残りの画素データとして表現された空間領域から、DCT係数として表現された周波数領域へ変換する。このように、8点DCT−IIユニット52は、上述された8点DCT−II方式を残りのデータに適用し、DCT係数を決定する(98)。変換係数は、少なくとも1個のDC係数及び1以上のAC係数を含むDCT係数を備え得る。
量子化ユニット40は、ビットレートをさらに削減するために、残りの変換ブロック係数を量子化する(例えば、丸める)(100)。上述のように、量子化ユニット40は、因数分解中に除去された内部因子を組み入れることにより、スケール化された8点DCT−IIユニット52のスケール化された性質の原因となる。すなわち、量子化ユニット40は、図4の実施部70に関連して上述された外部因子を組み入れる。量子化は、典型的に乗算を伴うので、これらの因子を量子化ユニット40に組み入れることは、量子化ユニット40の実施複雑性を増大させない。この点に関して、スケール化された8点DCT−IIユニット52から因子を除去することは、量子化ユニット40の実施複雑性を増大することなく、DCT−IIユニット52の実施複雑性を減少させ、結果として、映像エンコーダ20に関して実施複雑性の正味の減少をもたらす。
エントロピー符号化ユニット46は、ビットレートをより一層削減するために、量子化済みの係数をエントロピー符号化する。エントロピー符号化ユニット46は、一部の事例ではエントロピー符号化と呼ばれる統計的な可逆符号化(lossless coding)を実行し、符号化ビットストリームを生成する(102)。エントロピー符号化ユニット46は、量子化済みのDCT係数の確率分布をモデル化し、モデル化された確率分布に基づいて符号表(例えば、CAVLC又はCABAC)を選択する。この符号表を使用して、エントロピー符号化ユニット46は、量子化済みのDCT係数を圧縮する方法で個々の量子化済みのDCT係数の符号(code)を選択する。エントロピー符号化ユニット46は、メモリ又は記憶装置に記憶されるか、及び/又は映像デコーダ26へ送信される符号化ビットストリームとして、エントロピー符号化済みの係数を出力する(104)。
再構成ユニット42及び逆変換ユニット44はそれぞれ、量子化済みの係数を再構成して逆変換を適用し、残りのブロックを再構成する。また逆変換ユニット44は、逆DCT(IDCT)を含み、この逆DCTは図3に関連して後述される8点DCT−IIIユニット68と同様に、8点DCT−IIユニット52の逆演算を実行するDCTタイプIIIと一般に呼ばれる。加算ユニット50は、再構成済みの残りのブロックを動き補償ユニット36によって生成された動き補償済みの予測ブロックに加算し、再構成済みの映像ブロックを生成し、この映像ブロックは基準フレーム記憶装置34へ記憶され。再構成済みの映像ブロックは、その後の映像フレーム内のブロックを符号化するための動き推定ユニット32及び動き補償ユニット36によって使用される。
図6は、本開示の技術に基づいて構成された8点DCT−III方式を適用する、図3の映像デコーダ26のようなコーディング装置の動作例を示すフローチャートである。映像デコーダ26は、映像エンコーダ20によって符号化された符号化済みの映像ビットストリームを受信する。詳細には、エントロピー復号化ユニット54は、符号化済みの映像ビットストリームを受信し、このビットストリームから、量子化済みの残りの係数及び量子化済みのパラメータ、ならびに動きベクトル及びブロック区分を含み得るマクロブロックコーディングモード及び動き情報のような他の情報を復号化する(106、108)。動き補償ユニット56は、動きベクトルと、基準フレーム記憶装置62からのブロック区分及び1以上の再構成済みの基準フレームを受信し、予測映像ブロックを生成する(110)。
再構成ユニット58は、量子化済みのブロック係数を逆量子化、すなわち、脱量子化(de-quantize)する(112)。逆変換ユニット60は、逆変換例えば逆DCTを係数に適用し、残りのブロックを生成する。より具体的に、逆変換ユニット60は、スケール化された8点DCT−IIIユニット68を含み、この8点DCT−IIIユニット68を上記係数に適用し、残りのブロックを生成する(114)。スケール化された8点DCT−IIIユニット68は、図2に示されたスケール化された8点DCT−IIユニット52の逆であり、係数を周波数領域から空間領域へ変換し、残りのブロックを生成する。上記量子化ユニット40と同様に、再構成ユニット58は、たとえあるとしても実施複雑性の増大がほとんどなく、因数分解中に除去された外部因子を再構成プロセスに組み入れることにより、8点DCT−IIIユニット68のスケール化された性質の原因となる。スケール化された8点DCT−IIIユニット68から因子を除去することは、実施複雑性を減少させ、結果として、映像デコーダ26に関して複雑性の正味の減少をもたらす。
次に予測映像ブロックは、加算器66によって残りのブロックと加算され、復号化済みのブロックを形成する(116)。非ブロック化(deblocking)フィルタ(図示せず)が復号化済みのブロックをフィルタ処理し、ブロック化アーティファクトを除去するために適用されることがある。フィルタ処理されたブロックは、次に、基準フレーム記憶装置62の中に配置され、この基準フレーム記憶装置は、次の映像フレームの復号化のための基準フレームを提供するとともに、復号化済みの映像を生成して図1の表示装置28のような表示装置を駆動する(118)。
本開示の技術は、携帯電話機、集積回路(IC)若しくはICの組(すなわち、チップセット)のようなワイヤレス通信機器ハンドセットを含む多種多様の機器又は装置で実施され得る。コンポーネント、モジュール又はユニットはどれもが機能的な態様を強調するため説明され、必ずしも異なるハードウェアユニットによる実現を必要としない。本明細書に記載された技術は、ハードウェア、又は、ハードウェア、ソフトウェア、ファームウェアの何れかの組み合わせで実施されることもある。モジュール、ユニット又はコンポーネントとして記載された特徴はどれもが集積化された論理装置として一緒に、又は、ディスクリートであるが、同時使用可能な論理装置として別々に実施されることがある。一部の場合、様々な特徴は、集積回路チップ又はチップセットのような集積回路装置として実施されることがある。
ソフトウェアで実施された場合、技術は、プロセッサで実行されたとき、上記方法のうちの1つ以上を実行する命令を備えるコンピュータ読み取り可能な媒体によって少なくとも部分的に実現されることがある。コンピュータ読み取り可能な媒体は、物理的な非一時的構造体であるコンピュータ読み取り可能な記憶媒体を備えることがあり、パッケージング材料を含むことがあるコンピュータ・プログラム・プロダクトの一部を形成することがある。コンピュータ読み取り可能な記憶媒体は、同期ダイナミック・ランダム・アクセス・メモリ(SDRAM)のようなランダム・アクセス・メモリ(RAM)と、リード・オンリ・メモリ(ROM)と、不揮発性ランダム・アクセス・メモリ(NVRAM)と、電気的消去可能プログラマブル・リード・オンリ・メモリ(EEPROM)と、フラッシュメモリと、磁気的又は光学的データ記憶媒体などを備えることがある。
コード又は命令は、1台以上のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ロジック・アレイ(FPGA)、又は、他の等価的な集積論理回路若しくはディスクリート論理回路のような1台以上のプロセッサによって実行される。従って、本明細書で使用されるような用語「プロセッサ」は、上記構造体のうちの何れか、又は、本明細書に記載された技術の実施のために適した何らかの他の構造体を示すことがある。さらに、一部の態様では、本明細書に記載された機能は、符号化及び復号化のために構成された専用ソフトウェアモジュール、又は、ハードウェアモジュールの内部に設けられるか、又は、合成済の映像コーデックに組み込まれる。また、技術は1台以上の回路若しくは論理素子の中に完全に組み込まれることがある。
本開示は、また、本開示に記載された技術のうちの1つ以上を実施する回路を含む種々の集積回路装置の何れかを検討する。このような回路は、単独の集積回路チップ、又は、いわゆるチップセットの中の複数の、同時使用可能な集積回路チップに設けられることがある。このような集積回路装置は、多種多様の用途で使用されることがあり、用途のうちの一部は、携帯電話機ハンドセットのようなワイヤレス通信機器の中での使用を含むことがある。
技術の種々の態様が記載された。上記態様及び他の態様は、特許請求の範囲に含まれる。
Claims (60)
- コーディング装置を用いてメディアデータを受信することと、
前記コーディング装置の8点離散コサイン変換(DCT)ハードウェアユニットを用いて8点離散コサイン変換(DCT)を実行し、前記受信されたメディアデータを空間領域から周波数領域へ変換すること、
を備え、前記8点DCTハードウェアユニットは、
第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて、前記第1のスケール因子(μ)に関係している前記第1及び前記第2の内部因子(A、B)を備える偶数部と、
第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G、D、E、Z)を備える奇数部と
を含み、
前記第2の関係は、前記第2のスケール因子が前記第3の内部因子の平方と前記第4の内部因子の平方との和の平方根に等しくなるように定義され、
前記第2の関係は、更に前記第2のスケール因子が前記第5の内部因子の平方と前記第6の内部因子の平方との和の平方根に等しくなるように定義されている、方法。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、3に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、7に設定されている、請求項1に記載の方法。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、19に設定され、
前記第4の内部因子Dは、4に設定され、
前記第5の内部因子Eは、16に設定され、
前記第6の内部因子Zは、11に設定されている、請求項1に記載の方法。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、3に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、7に設定されている、請求項1に記載の方法。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、19に設定され、
前記第4の内部因子Dは、4に設定され、
前記第5の内部因子Eは、16に設定され、
前記第6の内部因子Zは、11に設定されている、請求項1に記載の方法。 - 前記第1の内部因子Aは、3に設定され、
前記第2の内部因子Bは、7に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、3に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、7に設定されている、請求項1に記載の方法。 - 前記第1の内部因子Aは、3に設定され、
前記第2の内部因子Bは、7に設定され、
前記第3の内部因子Gは、19に設定され、
前記第4の内部因子Dは、4に設定され、
前記第5の内部因子Eは、16に設定され、
前記第6の内部因子Zは、11に設定されている、請求項1に記載の方法。 - 前記8点DCTを実行することは、前記8点DCTを実行して、前記メディアデータから1以上のDCT係数を決定することを含み、
前記方法は、量子化ユニットを用いて前記第1及び第2のスケール因子(μ、η)を、前記1以上のDCT係数に適用し、量子化済みのDCT係数を決定することを更に備える、請求項1に記載の方法。 - 前記8点DCTハードウェアユニットは、前記8点DCTを実施するためのソフトウェアを実行するプロセッサを備える、請求項1に記載の方法。
- 前記内部因子A、B、G、D、E及びZは、これらの内部因子が2個1組の有理数値になるように正規化され、
前記内部因子A及びBを正規化するために使用される第1の分母が2の1乗であり、
前記インターフェース因子G、D、E及びZを正規化するために使用される第2の分母が2の2乗である、請求項1に記載の方法。 - メディアデータを空間領域から周波数領域へ変換する8点離散コサイン変換(DCT)ハードウェアユニットを備え、
前記8点DCTハードウェアユニットは、
第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて、前記第1のスケール因子(μ)に関係している前記第1及び第2の内部因子(A、B)を備える偶数部と、
第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G、D、E、Z)を備える奇数部と
を含み、
前記第2の関係は、前記第2のスケール因子が前記第3の内部因子の平方と前記第4の内部因子の平方との和の平方根に等しくなるように定義され、
前記第2の関係は、更に前記第2のスケール因子が前記第5の内部因子の平方と前記第6の内部因子の平方との和の平方根に等しくなるように定義されている、装置。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、3に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、7に設定されている、請求項11に記載の装置。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、19に設定され、
前記第4の内部因子Dは、4に設定され、
前記第5の内部因子Eは、16に設定され、
前記第6の内部因子Zは、11に設定されている、請求項11に記載の装置。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、3に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、7に設定されている、請求項11に記載の装置。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、19に設定され、
前記第4の内部因子Dは、4に設定され、
前記第5の内部因子Eは、16に設定され、
前記第6の内部因子Zは、11に設定されている、請求項11に記載の装置。 - 前記第1の内部因子Aは、3に設定され、
前記第2の内部因子Bは、7に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、3に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、7に設定されている、請求項11に記載の装置。 - 前記第1の内部因子Aは、3に設定され、
前記第2の内部因子Bは、7に設定され、
前記第3の内部因子Gは、19に設定され、
前記第4の内部因子Dは、4に設定され、
前記第5の内部因子Eは、16に設定され、
前記第6の内部因子Zは、11に設定されている、請求項11に記載の装置。 - 前記8点DCTハードウェアユニットは、前記DCTをメディアデータに適用し、1以上のDCT係数を決定し、
前記装置は、前記第1及び第2のスケール因子(μ、η)を前記1以上のDCT係数に適用し、調子化済みのDCT係数を決定する量子化ユニットを更に備える、請求項11に記載の装置。 - 前記8点DCTハードウェアユニットは、直交8点DCTを実施するためのソフトウェアを実行するプロセッサを備える、請求項11に記載の装置。
- 前記内部因子A、B、G、D、E及びZは、これらの内部因子が2個1組の有理数値になるように正規化され、
前記内部因子A及びBを正規化するために使用される第1の分母が2の1乗であり、
前記インターフェース因子G、D、E及びZを正規化するために使用される第2の分母が2の2乗である、請求項11に記載の装置。 - メディアデータを受信する手段と、
前記受信されたメディアデータを空間領域から周波数領域へ変換するために8点離散コサイン変換(DCT)を実行する手段と
を備え、前記8点DCTを実行する手段は、
第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて、前記第1のスケール因子(μ)に関係している前記第1及び第2の内部因子(A、B)を備える偶数部と、
第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G、D、E、Z)を備える奇数部と
を含み、
前記第2の関係は、前記第2のスケール因子が前記第3の内部因子の平方と前記第4の内部因子の平方との和の平方根に等しくなるように定義され、
前記第2の関係は、更に前記第2のスケール因子が前記第5の内部因子の平方と前記第6の内部因子の平方との和の平方根に等しくなるように定義されている、装置。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、3に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、7に設定されている、請求項21に記載の装置。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、19に設定され、
前記第4の内部因子Dは、4に設定され、
前記第5の内部因子Eは、16に設定され、
前記第6の内部因子Zは、11に設定されている、請求項21に記載の装置。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、3に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、7に設定されている、請求項21に記載の装置。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、19に設定され、
前記第4の内部因子Dは、4に設定され、
前記第5の内部因子Eは、16に設定され、
前記第6の内部因子Zは、11に設定されている、請求項21に記載の装置。 - 前記第1の内部因子Aは、3に設定され、
前記第2の内部因子Bは、7に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、3に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、7に設定されている、請求項21に記載の装置。 - 前記第1の内部因子Aは、3に設定され、
前記第2の内部因子Bは、7に設定され、
前記第3の内部因子Gは、19に設定され、
前記第4の内部因子Dは、4に設定され、
前記第5の内部因子Eは、16に設定され、
前記第6の内部因子Zは、11に設定されている、請求項21に記載の装置。 - 前記DCTを実行する手段は、8点DCTを前記メディアデータに提供し、1以上のDCT係数を決定する手段を更に備え、
前記装置は、前記第1及び第2のスケール因子(μ、η)を前記1以上のDCT係数に適用し、量子化されたDCT係数を決定する手段を更に備える、請求項21に記載の装置。 - 前記内部因子A、B、G、D、E及びZは、これらの内部因子が2個1組の有理数値になるように正規化され、
前記内部因子A及びBを正規化するために使用される第1の分母が2の1乗であり、
前記インターフェース因子G、D、E及びZを正規化するために使用される第2の分母が2の2乗である、請求項21に記載の装置。 - コーディング装置を用いてメディアデータを受信することと、
前記コーディング装置の8点離散コサイン変換(DCT)ハードウェアユニットを用いて8点離散コサイン変換(DCT)を実行し、前記受信されたメディアデータを空間領域から周波数領域へ変換すること
をプロセッサに行わせる命令を備え、
前記8点DCTハードウェアユニットは、
第1のスケール因子が第1の内部因子の平方と第2の内部因子の平方との和の平方根に等しくなるように定義された第1の関係に基づいて、前記第1のスケール因子(μ)に関係している前記第1及び第2の内部因子(A、B)を備える偶数部と、
第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G、D、E、Z)を備える奇数部と
を含み、
前記第2の関係は、前記第2のスケール因子が前記第3の内部因子の平方と第4の内部因子の平方との和の平方根に等しくなるように定義され、
前記第2の関係は、更に前記第2のスケール因子が前記第5の内部因子の平方と前記第6の内部因子の平方との和の平方根に等しくなるように定義されている、恒久的コンピュータ読み取り可能な記憶媒体。 - コーディング装置を用いてメディアデータを受信することと、
前記コーディング装置の8点離散コサイン変換(DCT)ハードウェアユニットを用いて8点離散コサイン変換(DCT)を実行し、前記メディアデータを空間領域から周波数領域へ変換すること
を備え、
前記8点DCTハードウェアユニットは、
第1のスケール因子が第1の内部因子と第2の内部因子との和を、定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて、前記第1のスケール因子(μ)に関係している前記第1及び第2の内部因子(A、B)を備える偶数部と、
第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G、D、E、Z)を備える奇数部と
を含み、
前記第2の関係は、前記第2のスケール因子が、最小誤差を生じる以下の(1)〜(6)式:
(1)前記第3の内部因子(G)と前記第4の内部因子(D)との和を、前記定数パイの1/16のコサインの第3の近似(γ)と前記定数パイの1/16のサインの第4の近似(δ)との和で除したものと、
(2)前記第3の内部因子(G)と前記第5の内部因子(E)との和を、前記第3の近似(γ)と前記定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、
(3)前記第3の内部因子(G)と前記第6の内部因子(Z)との和を、前記第3の近似(γ)と前記定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、
(4)前記第4の内部因子(D)と前記第5の内部因子(E)との和を、前記第4の近似(δ)と前記第5の近似(ε)との和で除したものと、
(5)前記第4の内部因子(D)と前記第6の内部因子(Z)との和を、前記第4の近似(δ)と前記第6の近似(ζ)との和で除したものと、
(6)前記第5の内部因子(E)と前記第6の内部因子(Z)との和を、前記第5の近似(ε)と前記第6の近似(ζ)との和で除したものと
の1つに等しくなるように定義されている、方法。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、5に設定され、
前記第4の内部因子Dは、1に設定され、
前記第5の内部因子Eは、4に設定され、
前記第6の内部因子Zは、3に設定されている、請求項31に記載の方法。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、2に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、6に設定されている、請求項31に記載の方法。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、5に設定され、
前記第4の内部因子Dは、1に設定され、
前記第5の内部因子Eは、4に設定され、
前記第6の内部因子Zは、3に設定されている、請求項31に記載の方法。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、2に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、6に設定されている、請求項31に記載の方法。 - 前記第1の内部因子Aは、5に設定され、
前記第2の内部因子Bは、12に設定され、
前記第3の内部因子Gは、5に設定され、
前記第4の内部因子Dは、1に設定され、
前記第5の内部因子Eは、4に設定され、
前記第6の内部因子Zは、3に設定されている、請求項31に記載の方法。 - 前記第1の内部因子Aは、5に設定され、
前記第2の内部因子Bは、12に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、2に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、6に設定されている、請求項31に記載の方法。 - 前記8点DCTを実行することは、前記8点DCTを実行し、前記メディアデータから1以上のDCT係数を決定することを含み、
前記方法は、量子化ユニットを用いて前記第1及び第2のスケール因子(μ、η)を前記1以上のDCT係数に適用し、量子化済みのDCT係数を決定することを更に備える、請求項31に記載の方法。 - 前記8点DCTハードウェアユニットは、前記8点DCTを実施するためのソフトウェアを実行するプロセッサを備える、請求項31に記載の方法。
- 前記内部因子A、B、G、D、E及びZは、これらの内部因子が2個1組の有理数値になるように正規化され、
前記内部因子A及びBを正規化するために使用される第1の分母が2の1乗であり、
前記内部因子G、D、E及びZを正規化するために使用される第2の分母が2の2乗である、請求項31に記載の方法。 - メディアデータを空間領域から周波数領域へ変換する8点離散コサイン変換(DCT)ハードウェアユニットを備え、
前記8点DCTハードウェアユニットは、
第1のスケール因子が第1の内部因子と第2の内部因子との和を、定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて、前記第1のスケール因子(μ)に関係している前記第1及び第2の内部因子(A、B)を備える偶数部と、
第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G、D、E、Z)を備える奇数部と
を含み、
前記第2の関係は、前記第2のスケール因子が、最小誤差を生じる以下の式(1)〜(6):
(1)前記第3の内部因子(G)と前記第4の内部因子(D)との和を、前記定数パイの1/16のコサインの第3の近似(γ)と前記定数パイの1/16のサインの第4の近似(δ)との和で除したものと、
(2)前記第3の内部因子(G)と前記第5の内部因子(E)との和を、前記第3の近似(γ)と前記定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、
(3)前記第3の内部因子(G)と前記第6の内部因子(Z)との和を、前記第3の近似(γ)と前記定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、
(4)前記第4の内部因子(D)と前記第5の内部因子(E)との和を、前記第4の近似(δ)と前記第5の近似(ε)との和で除したものと、
(5)前記第4の内部因子(D)と前記第6の内部因子(Z)との和を、前記第4の近似(δ)と前記第6の近似(ζ)との和で除したものと、
(6)前記第5の内部因子(E)と前記第6の内部因子(Z)との和を、前記第5の近似(ε)と前記第6の近似(ζ)との和で除したものと
の1つに等しくなるように定義されている、装置。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、5に設定され、
前記第4の内部因子Dは、1に設定され、
前記第5の内部因子Eは、4に設定され、
前記第6の内部因子Zは、3に設定されている、請求項41に記載の装置。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、2に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、6に設定されている、請求項41に記載の装置。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、5に設定され、
前記第4の内部因子Dは、1に設定され、
前記第5の内部因子Eは、4に設定され、
前記第6の内部因子Zは、3に設定されている、請求項41に記載の装置。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、2に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、6に設定されている、請求項41に記載の装置。 - 前記第1の内部因子Aは、5に設定され、
前記第2の内部因子Bは、12に設定され、
前記第3の内部因子Gは、5に設定され、
前記第4の内部因子Dは、1に設定され、
前記第5の内部因子Eは、4に設定され、
前記第6の内部因子Zは、3に設定されている、請求項41に記載の装置。 - 前記第1の内部因子Aは、5に設定され、
前記第2の内部因子Bは、12に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、2に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、6に設定されている、請求項41に記載の装置。 - 前記8点DCTハードウェアユニットは、8点DCTを前記メディアデータに適用し、1以上のDCT係数を決定し、
前記装置は、前記第1及び第2のスケール因子(μ、η)を前記1以上のDCT係数に適用し、量子化済のDCT係数を決定する量子化ユニットを更に備える、請求項41に記載の装置。 - 前記8点DCTハードウェアユニットは、前記8点DCTを実施するためのソフトウェアを実行するプロセッサを備える、請求項41に記載の装置。
- 前記内部因子A、B、G、D、E及びZは、これらの内部因子が2個1組の有理数値になるように正規化され、
前記内部因子A及びBを正規化するために使用される第1の分母が2の1乗であり、
前記インターフェース因子G、D、E及びZを正規化するために使用される第2の分母が2の2乗である、請求項41に記載の装置。 - メディアデータを受信する手段と、
前記メディアデータを空間領域から周波数領域へ変換する8点離散コサイン変換(DCT)を実行する手段と、
を備え、
前記8点DCTを実行する手段は、
第1のスケール因子が第1の内部因子と第2の内部因子との和を、定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて前記第1のスケール因子(μ)に関係している前記第1及び第2の内部因子(A、B)を備える偶数部と、
第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G、D、E、Z)を備える奇数部と
を含み、
前記第2の関係は、前記第2のスケール因子が、最小誤差を生じる以下の式(1)〜(6):
(1)前記第3の内部因子(G)と前記第4の内部因子(D)との和を、前記定数パイの1/16のコサインの第3の近似(γ)と前記定数パイの1/16のサインの第4の近似(δ)との和で除したものと、
(2)前記第3の内部因子(G)と前記第5の内部因子(E)との和を、前記第3の近似(γ)と前記定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、
(3)前記第3の内部因子(G)と前記第6の内部因子(Z)との和を、前記第3の近似(γ)と前記定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、
(4)前記第4の内部因子(D)と前記第5の内部因子(E)との和を、前記第4の近似(δ)と前記第5の近似(ε)との和で除したものと、
(5)前記第4の内部因子(D)と前記第6の内部因子(Z)との和を、前記第4の近似(δ)と前記第6の近似(ζ)との和で除したものと、
(6)前記第5の内部因子(E)と前記第6の内部因子(Z)との和を、前記第5の近似(ε)と前記第6の近似(ζ)との和で除したものと
の1つに等しくなるように定義されている、装置。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、5に設定され、
前記第4の内部因子Dは、1に設定され、
前記第5の内部因子Eは、4に設定され、
前記第6の内部因子Zは、3に設定されている、請求項51に記載の装置。 - 前記第1の内部因子Aは、1に設定され、
前記第2の内部因子Bは、2に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、2に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、6に設定されている、請求項51に記載の装置。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、5に設定され、
前記第4の内部因子Dは、1に設定され、
前記第5の内部因子Eは、4に設定され、
前記第6の内部因子Zは、3に設定されている、請求項51に記載の装置。 - 前記第1の内部因子Aは、2に設定され、
前記第2の内部因子Bは、5に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、2に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、6に設定されている、請求項51に記載の装置。 - 前記第1の内部因子Aは、5に設定され、
前記第2の内部因子Bは、12に設定され、
前記第3の内部因子Gは、5に設定され、
前記第4の内部因子Dは、1に設定され、
前記第5の内部因子Eは、4に設定され、
前記第6の内部因子Zは、3に設定されている、請求項51に記載の装置。 - 前記第1の内部因子Aは、5に設定され、
前記第2の内部因子Bは、12に設定され、
前記第3の内部因子Gは、11に設定され、
前記第4の内部因子Dは、2に設定され、
前記第5の内部因子Eは、9に設定され、
前記第6の内部因子Zは、6に設定されている、請求項51に記載の装置。 - 前記DCTを実行する手段は、8点DCTを前記メディアデータに適用し、1以上のDCT係数を決定する手段を備え、
前記装置は、前記第1及び第2のスケール因子(μ、η)を前記1以上のDCT係数に適用し、量子化済みのDCT係数を決定する手段を更に備える、請求項51に記載の装置。 - 前記内部因子A、B、G、D、E及びZは、これらの内部因子が2個1組の有理数値になるように正規化され、
前記内部因子A及びBを正規化するために使用される第1の分母が2の1乗であり、
前記内部因子G、D、E及びZを正規化するために使用される第2の分母が2の2乗である、請求項51に記載の装置。 - メディアデータを受信することと、
前記メディアデータを空間領域から周波数領域へ変換する8点DCTハードウェアユニットを用いて8点離散コサイン変換(DCT)を実行すること
をプロセッサに行わせる命令を備え、
前記8点DCTハードウェアユニットは、
第1のスケール因子が第1の内部因子と第2の内部因子との和を定数パイ(π)の3/8倍のコサインの第1の近似(α)と定数パイ(π)の3/8倍のサインの第2の近似(β)との和で除したものに等しくなるように定義された第1の関係に基づいて前記第1のスケール因子(μ)に関係している前記第1及び第2の内部因子(A、B)を備える偶数部と、
第2の関係に基づいて第2のスケール因子(η)に関係している第3、第4、第5及び第6の内部因子(G、D、E、Z)を備える奇数部と
を含み、
前記第2の関係は、前記第2のスケール因子が、最小誤差を生じる以下の式(1)〜(6):
(1)前記第3の内部因子(G)と前記第4の内部因子(D)との和を、前記定数パイの1/16のコサインの第3の近似(γ)と前記定数パイの1/16のサインの第4の近似(δ)との和で除したものと、
(2)前記第3の内部因子(G)と前記第5の内部因子(E)との和を、前記第3の近似(γ)と前記定数パイの3/16倍のコサインの第5の近似(ε)との和で除したものと、
(3)前記第3の内部因子(G)と前記第6の内部因子(Z)との和を、前記第3の近似(γ)と前記定数パイの3/16倍のサインの第6の近似(ζ)との和で除したものと、
(4)前記第4の内部因子(D)と前記第5の内部因子(E)との和を、前記第4の近似(δ)と前記第5の近似(ε)との和で除したものと、
(5)前記第4の内部因子(D)と前記第6の内部因子(Z)との和を、前記第4の近似(δ)と前記第6の近似(ζ)との和で除したものと、
(6)前記第5の内部因子(E)と前記第6の内部因子(Z)との和を、前記第5の近似(ε)と前記第6の近似(ζ)との和で除したものと
の1つに等しくなるように定義されている、恒久的コンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US21989109P | 2009-06-24 | 2009-06-24 | |
US12/820,329 US8451904B2 (en) | 2009-06-24 | 2010-06-22 | 8-point transform for media data coding |
PCT/US2010/039660 WO2011005573A2 (en) | 2009-06-24 | 2010-06-23 | 8-point transform for media data coding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013502624A true JP2013502624A (ja) | 2013-01-24 |
Family
ID=43429778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012517690A Pending JP2013502624A (ja) | 2009-06-24 | 2010-06-23 | メディアデータ符号化用8点変換 |
Country Status (7)
Country | Link |
---|---|
US (2) | US8451904B2 (ja) |
EP (1) | EP2446372A2 (ja) |
JP (1) | JP2013502624A (ja) |
KR (1) | KR20120040208A (ja) |
CN (1) | CN102714714A (ja) |
TW (1) | TW201108746A (ja) |
WO (1) | WO2011005573A2 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9110849B2 (en) * | 2009-04-15 | 2015-08-18 | Qualcomm Incorporated | Computing even-sized discrete cosine transforms |
US9069713B2 (en) * | 2009-06-05 | 2015-06-30 | Qualcomm Incorporated | 4X4 transform for media coding |
US8762441B2 (en) * | 2009-06-05 | 2014-06-24 | Qualcomm Incorporated | 4X4 transform for media coding |
US8451904B2 (en) | 2009-06-24 | 2013-05-28 | Qualcomm Incorporated | 8-point transform for media data coding |
US9081733B2 (en) * | 2009-06-24 | 2015-07-14 | Qualcomm Incorporated | 16-point transform for media data coding |
US9075757B2 (en) * | 2009-06-24 | 2015-07-07 | Qualcomm Incorporated | 16-point transform for media data coding |
US9118898B2 (en) | 2009-06-24 | 2015-08-25 | Qualcomm Incorporated | 8-point transform for media data coding |
US8635357B2 (en) * | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
US9824066B2 (en) | 2011-01-10 | 2017-11-21 | Qualcomm Incorporated | 32-point transform for media data coding |
US9008180B2 (en) | 2011-04-21 | 2015-04-14 | Intellectual Discovery Co., Ltd. | Method and apparatus for encoding/decoding images using a prediction method adopting in-loop filtering |
JP2014523708A (ja) | 2011-07-01 | 2014-09-11 | モトローラ モビリティ エルエルシー | 動きベクトル予測設計の簡易化 |
KR101362696B1 (ko) * | 2011-10-19 | 2014-02-17 | 전북대학교산학협력단 | 하이브리드 아키텍쳐가 적용된 신호 변환 장치, 신호 변환 방법 및 기록매체 |
KR101616010B1 (ko) * | 2011-11-04 | 2016-05-17 | 구글 테크놀로지 홀딩스 엘엘씨 | 비균일 움직임 벡터 그리드에 대한 움직임 벡터 스케일링 |
WO2013070605A2 (en) * | 2011-11-07 | 2013-05-16 | Vid Scale, Inc. | Video and data processing using even-odd integer transforms background |
US9172970B1 (en) | 2012-05-29 | 2015-10-27 | Google Inc. | Inter frame candidate selection for a video encoder |
US11317101B2 (en) | 2012-06-12 | 2022-04-26 | Google Inc. | Inter frame candidate selection for a video encoder |
SG11201500316PA (en) * | 2012-09-28 | 2015-02-27 | Intel Corp | Inter-layer intra mode prediction |
US9503746B2 (en) | 2012-10-08 | 2016-11-22 | Google Inc. | Determine reference motion vectors |
US9485515B2 (en) | 2013-08-23 | 2016-11-01 | Google Inc. | Video coding using reference motion vectors |
JP2015185897A (ja) * | 2014-03-20 | 2015-10-22 | パナソニックIpマネジメント株式会社 | 画像符号化方法及び画像符号化装置 |
WO2016056977A1 (en) | 2014-10-06 | 2016-04-14 | Telefonaktiebolaget L M Ericsson (Publ) | Coding and deriving quantization parameters |
KR102680708B1 (ko) * | 2016-07-14 | 2024-07-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 변환 기반 잔차 코딩을 이용한 예측 화상 코딩 |
CN107277551B (zh) * | 2017-06-12 | 2019-08-23 | 电子科技大学 | 一种用于图像处理的近似离散余弦变换方法 |
US11862315B2 (en) | 2020-12-16 | 2024-01-02 | Express Scripts Strategic Development, Inc. | System and method for natural language processing |
US11776672B1 (en) | 2020-12-16 | 2023-10-03 | Express Scripts Strategic Development, Inc. | System and method for dynamically scoring data objects |
US11423067B1 (en) | 2020-12-16 | 2022-08-23 | Express Scripts Strategic Development, Inc. | System and method for identifying data object combinations |
CN114125461B (zh) * | 2021-11-29 | 2023-07-14 | 成都国科微电子有限公司 | 通用视频编码变换电路和通用视频编码设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09212484A (ja) * | 1996-01-30 | 1997-08-15 | Texas Instr Inc <Ti> | 離散コサイン変換方法 |
JP2007129731A (ja) * | 2001-08-30 | 2007-05-24 | Nokia Corp | 離散余弦変換の近似と量子化ならびに逆量子化と逆離散余弦変換の近似を実行する方法 |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5253055A (en) | 1992-07-02 | 1993-10-12 | At&T Bell Laboratories | Efficient frequency scalable video encoding with coefficient selection |
US5408425A (en) * | 1993-05-25 | 1995-04-18 | The Aerospace Corporation | Split-radix discrete cosine transform |
US5508949A (en) * | 1993-12-29 | 1996-04-16 | Hewlett-Packard Company | Fast subband filtering in digital signal coding |
US5649077A (en) * | 1994-03-30 | 1997-07-15 | Institute Of Microelectronics, National University Of Singapore | Modularized architecture for rendering scaled discrete cosine transform coefficients and inverse thereof for rapid implementation |
JP3115199B2 (ja) * | 1994-12-16 | 2000-12-04 | 松下電器産業株式会社 | 画像圧縮符号化装置 |
US5737450A (en) * | 1995-05-15 | 1998-04-07 | Polaroid Corporation | Method and apparatus for fast two-dimensional cosine transform filtering |
JP2778622B2 (ja) * | 1995-06-06 | 1998-07-23 | 日本電気株式会社 | 2次元dct回路 |
CN1268231A (zh) | 1997-08-25 | 2000-09-27 | 夸尔柯姆股份有限公司 | 数据块规模可变的2维逆向离散余弦变换机 |
US6222944B1 (en) | 1998-05-07 | 2001-04-24 | Sarnoff Corporation | Down-sampling MPEG image decoder |
JP2001346213A (ja) * | 2000-06-02 | 2001-12-14 | Nec Corp | 離散コサイン変換装置及びその離散コサイン変換方法 |
AU2001234971A1 (en) | 2000-02-09 | 2001-08-20 | T. C. Cheng | Fast method for the forward and inverse mdct in audio coding |
EP1352336A4 (en) | 2000-10-23 | 2006-09-06 | Ibm | FASTER TRANSFORMATIONS THROUGH THE USE OF SCALED TERMS, EARLY BREAKDOWN AND PRECISION REFINANCES |
US7929610B2 (en) * | 2001-03-26 | 2011-04-19 | Sharp Kabushiki Kaisha | Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding |
US7366236B1 (en) * | 2001-06-04 | 2008-04-29 | Cisco Sytems Canada Co. | Source adaptive system and method for 2D iDCT |
US7185037B2 (en) * | 2001-08-23 | 2007-02-27 | Texas Instruments Incorporated | Video block transform |
CN1283093C (zh) * | 2001-08-24 | 2006-11-01 | 皇家飞利浦电子股份有限公司 | 对视频帧的场进行相加 |
US6882685B2 (en) * | 2001-09-18 | 2005-04-19 | Microsoft Corporation | Block transform and quantization for image and video coding |
KR100481067B1 (ko) * | 2001-09-28 | 2005-04-07 | 브이케이 주식회사 | 분산 산술 처리장치 및 그를 이용한 이차원 이산여현변환 처리장치 |
FR2834362A1 (fr) | 2001-12-28 | 2003-07-04 | Koninkl Philips Electronics Nv | Dispositif de transformation inverse adaptatif |
JP2003223433A (ja) | 2002-01-31 | 2003-08-08 | Matsushita Electric Ind Co Ltd | 直交変換方法、直交変換装置、符号化方法、符号化装置、逆直交変換方法、逆直交変換装置、復号化方法、及び、復号化装置 |
US7007055B2 (en) | 2002-03-12 | 2006-02-28 | Intel Corporation | Method of performing NxM Discrete Cosine Transform |
US7437394B2 (en) * | 2002-06-19 | 2008-10-14 | The Aerospace Corporation | Merge and split discrete cosine block transform method |
US20040136602A1 (en) * | 2003-01-10 | 2004-07-15 | Nithin Nagaraj | Method and apparatus for performing non-dyadic wavelet transforms |
US7412100B2 (en) * | 2003-09-04 | 2008-08-12 | Qualcomm Incorporated | Apparatus and method for sub-sampling images in a transform domain |
US7379500B2 (en) * | 2003-09-30 | 2008-05-27 | Microsoft Corporation | Low-complexity 2-power transform for image/video compression |
TWI241074B (en) | 2003-11-05 | 2005-10-01 | Bing-Fei Wu | Image compression system using two-dimensional discrete wavelet transformation |
US20050213835A1 (en) | 2004-03-18 | 2005-09-29 | Huazhong University Of Science & Technology And Samsung Electronics Co., Ltd. | Integer transform matrix selection method in video coding and related integer transform method |
US8861600B2 (en) * | 2004-06-18 | 2014-10-14 | Broadcom Corporation | Method and system for dynamically configurable DCT/IDCT module in a wireless handset |
US7587093B2 (en) | 2004-07-07 | 2009-09-08 | Mediatek Inc. | Method and apparatus for implementing DCT/IDCT based video/image processing |
US7792385B2 (en) * | 2005-01-25 | 2010-09-07 | Globalfoundries Inc. | Scratch pad for storing intermediate loop filter data |
TW200643848A (en) | 2005-06-01 | 2006-12-16 | Wintek Corp | Method and apparatus for four-color data conversion |
US20070025441A1 (en) * | 2005-07-28 | 2007-02-01 | Nokia Corporation | Method, module, device and system for rate control provision for video encoders capable of variable bit rate encoding |
TWI280804B (en) | 2005-09-26 | 2007-05-01 | Yuh-Jue Chuang | Method for splitting 8x8 DCT into four 4x4 modified DCTS used in AVC/H. 264 |
US7725516B2 (en) | 2005-10-05 | 2010-05-25 | Qualcomm Incorporated | Fast DCT algorithm for DSP with VLIW architecture |
US20070200738A1 (en) | 2005-10-12 | 2007-08-30 | Yuriy Reznik | Efficient multiplication-free computation for signal and data processing |
TWI311856B (en) * | 2006-01-04 | 2009-07-01 | Quanta Comp Inc | Synthesis subband filtering method and apparatus |
US8595281B2 (en) * | 2006-01-11 | 2013-11-26 | Qualcomm Incorporated | Transforms with common factors |
CN100562111C (zh) * | 2006-03-28 | 2009-11-18 | 华为技术有限公司 | 离散余弦逆变换方法及其装置 |
US8849884B2 (en) * | 2006-03-29 | 2014-09-30 | Qualcom Incorporate | Transform design with scaled and non-scaled interfaces |
EP1850597A1 (en) | 2006-04-24 | 2007-10-31 | Universität Dortmund | Method and circuit for performing a cordic based Loeffler discrete cosine transformation (DCT), particularly for signal processing |
US8699810B2 (en) * | 2006-06-26 | 2014-04-15 | Qualcomm Incorporated | Efficient fixed-point approximations of forward and inverse discrete cosine transforms |
US8582663B2 (en) * | 2006-08-08 | 2013-11-12 | Core Wireless Licensing S.A.R.L. | Method, device, and system for multiplexing of video streams |
US8654833B2 (en) | 2007-09-26 | 2014-02-18 | Qualcomm Incorporated | Efficient transformation techniques for video coding |
EP2227020B1 (en) * | 2007-09-28 | 2014-08-13 | Dolby Laboratories Licensing Corporation | Video compression and transmission techniques |
US20090141808A1 (en) * | 2007-11-30 | 2009-06-04 | Yiufai Wong | System and methods for improved video decoding |
US8631060B2 (en) | 2007-12-13 | 2014-01-14 | Qualcomm Incorporated | Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures |
KR20090078494A (ko) * | 2008-01-15 | 2009-07-20 | 삼성전자주식회사 | 영상 데이터의 디블록킹 필터링 방법 및 디블록킹 필터 |
CN101330616B (zh) * | 2008-07-31 | 2011-04-13 | 上海交通大学 | 视频解码过程中反离散余弦变换的硬件实现装置及方法 |
US20100172409A1 (en) | 2009-01-06 | 2010-07-08 | Qualcom Incorporated | Low-complexity transforms for data compression and decompression |
US9110849B2 (en) * | 2009-04-15 | 2015-08-18 | Qualcomm Incorporated | Computing even-sized discrete cosine transforms |
US8762441B2 (en) * | 2009-06-05 | 2014-06-24 | Qualcomm Incorporated | 4X4 transform for media coding |
US9069713B2 (en) * | 2009-06-05 | 2015-06-30 | Qualcomm Incorporated | 4X4 transform for media coding |
US8451904B2 (en) | 2009-06-24 | 2013-05-28 | Qualcomm Incorporated | 8-point transform for media data coding |
US9075757B2 (en) | 2009-06-24 | 2015-07-07 | Qualcomm Incorporated | 16-point transform for media data coding |
US9118898B2 (en) | 2009-06-24 | 2015-08-25 | Qualcomm Incorporated | 8-point transform for media data coding |
US9081733B2 (en) * | 2009-06-24 | 2015-07-14 | Qualcomm Incorporated | 16-point transform for media data coding |
US9824066B2 (en) * | 2011-01-10 | 2017-11-21 | Qualcomm Incorporated | 32-point transform for media data coding |
-
2010
- 2010-06-22 US US12/820,329 patent/US8451904B2/en not_active Expired - Fee Related
- 2010-06-23 EP EP10730933A patent/EP2446372A2/en not_active Withdrawn
- 2010-06-23 WO PCT/US2010/039660 patent/WO2011005573A2/en active Application Filing
- 2010-06-23 CN CN2010800278661A patent/CN102714714A/zh active Pending
- 2010-06-23 KR KR1020127001833A patent/KR20120040208A/ko active IP Right Grant
- 2010-06-23 JP JP2012517690A patent/JP2013502624A/ja active Pending
- 2010-06-24 TW TW099120668A patent/TW201108746A/zh unknown
-
2013
- 2013-01-08 US US13/736,270 patent/US8718144B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09212484A (ja) * | 1996-01-30 | 1997-08-15 | Texas Instr Inc <Ti> | 離散コサイン変換方法 |
JP2007129731A (ja) * | 2001-08-30 | 2007-05-24 | Nokia Corp | 離散余弦変換の近似と量子化ならびに逆量子化と逆離散余弦変換の近似を実行する方法 |
Non-Patent Citations (1)
Title |
---|
JPN5012018493; JOSHI R: 'SIMPLIFIED TRANSFORMS FOR EXTENDED BLOCK SIZES' ITU-T SG16 Q6 (VCEG), DOCUMENT VCEG-AL30, 38TH VCEG MEETING [ONLINE] , 20090703 * |
Also Published As
Publication number | Publication date |
---|---|
CN102714714A (zh) | 2012-10-03 |
US20130121406A1 (en) | 2013-05-16 |
US20110150078A1 (en) | 2011-06-23 |
US8718144B2 (en) | 2014-05-06 |
KR20120040208A (ko) | 2012-04-26 |
EP2446372A2 (en) | 2012-05-02 |
US8451904B2 (en) | 2013-05-28 |
TW201108746A (en) | 2011-03-01 |
WO2011005573A2 (en) | 2011-01-13 |
WO2011005573A3 (en) | 2012-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8718144B2 (en) | 8-point transform for media data coding | |
US9319685B2 (en) | 8-point inverse discrete cosine transform including odd and even portions for media data coding | |
US9081733B2 (en) | 16-point transform for media data coding | |
US8762441B2 (en) | 4X4 transform for media coding | |
US9069713B2 (en) | 4X4 transform for media coding | |
US9075757B2 (en) | 16-point transform for media data coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140204 |