JP2013502624A

JP2013502624A - メディアデータ符号化用８点変換

Info

Publication number: JP2013502624A
Application number: JP2012517690A
Authority: JP
Inventors: レズニク、ユリー; ジョシ、ラジャン・エル．; カークゼウィックズ、マルタ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2009-06-24
Filing date: 2010-06-23
Publication date: 2013-01-24
Also published as: CN102714714A; US20130121406A1; US20110150078A1; US8718144B2; KR20120040208A; EP2446372A2; US8451904B2; TW201108746A; WO2011005573A2; WO2011005573A3

Abstract

一般に、８点離散コサイン変換（ＤＣＴ）を実施する技術が記載される。８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを備える装置は、空間領域から周波数領域へメディアデータを変換するためにこれらの技術を実施する。８点ＤＣＴハードウェアユニットは、第１の関係に基づいて第１のスケール因子（μ）に関係している内部因子Ａ、Ｂを備える偶数部を含む。８点ＤＣＴハードウェアユニットは、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部を更に含む。第１の関係は、第１のスケール因子を第１及び第２の内部因子に関係付ける。第２の関係は、第２のスケール因子を第３の内部因子及び第４の内部因子ならびに前記第５内部因子及び第６の内部因子に関係付ける。

Description

本願は、年６月２４日付けで出願された米国仮特許出願第６１／２１９，８９１号の利益を主張し、この仮特許出願の内容全体が参照により本明細書に組み込まれる。

本特許出願は、代理人書類番号０９２２４０Ｕ１を有し、本願と同日に出願され、本願譲受人に譲渡され、参照により本明細書に明確に組み込まれる同時係属中の米国特許出願：メディアデータ符号化のための８点変換（８−ＰＯＩＮＴＴＲＡＮＳＦＯＲＭＦＯＲＭＥＤＩＡＤＡＴＡＣＯＤＩＮＧ）に関係している。

本開示はデータ圧縮、より詳しくは変換を伴うデータ圧縮に関係する。

データ圧縮は、データ記憶空間、伝送帯域幅、又は両方の消費を削減するため種々の用途において広く用いられる。データ圧縮の用途例は、デジタル映像符号化、画像符号化、スピーチ符号化、及び、音声符号化のような視覚又は聴覚メディアデータ符号化を含む。デジタル映像符号化は、例えば、デジタルテレビジョン、デジタル・ダイレクト・ブロードキャスト・システム、ワイヤレス通信機器、携帯情報端末（ＰＤＡ）、ラップトップ若しくはデスクトップコンピュータ、デジタルカメラ、デジタル記録装置、テレビゲーム装置、セルラ若しくは衛星無線電話機などを含む広範囲の装置で使用される。デジタル映像装置は、デジタル映像をより効率的に送受信するため、ＭＰＥＧ−２、ＭＰＥＧ−４、又はＨ．２６４／ＭＰＥＧ−４次世代映像符号化（ＡＶＣ）のような映像圧縮技術を実施する。

一般に、映像圧縮技術は、映像データに本来備わる冗長性を低減又は除去するため、空間的予測、動き推定、及び、動き補償を実行する。特に、イントラ符号化は、所定の映像フレーム内の映像の空間的冗長性を低減又は除去するために、空間的予測に依存する。インター符号化は、隣接フレーム間の映像の時間的冗長性を低減又は除去するために、時間的予測に依存する。インター符号化に関して、映像エンコーダは、２個以上の隣接フレーム間の対応する映像ブロックの動きを追跡するために、動き推定を実行する。動き推定は動きベクトルを生成し、この動きベクトルは１以上の参照フレームにおける対応する映像ブロックの変位を示す。動き補償は、参照フレームから予測映像ブロックを生成するために動きベクトルを使用する。動き補償後、残りの映像ブロックは、原映像ブロックから予測映像ブロックを差し引くことによって形成される。
映像エンコーダは、その後、映像符号化プロセスによって生じた残りのブロックのビットレートをさらに低減するため、変換とその後に続く量子化及び可逆統計的符号化プロセス（lossless statistical coding processes）とを適用する。一部の事例では、適用される変換は、水平方向及び垂直方向に別々に適用された離散コサイン変換（ＤＣＴ）を含む。典型的に、ＤＣＴは、高さ４画素と幅４画素である映像ブロック（「４×４映像ブロック」と呼ばれることがよくある）のような、そのサイズが２の累乗である映像ブロックに適用される。しばしば、ＤＣＴは、１次元すなわち線形ＤＣＴであり、このＤＣＴは、最初に、映像ブロックの複数行に適用され、次に、映像ブロックの複数列に適用される。これらの１次元（１Ｄ）ＤＣＴ群は、その結果、これらのＤＣＴ群がＤＣＴ係数の４×４行列を生成するために４×４映像ブロックに適用されるので、４点ＤＣＴ群と呼ばれることがある。４点ＤＣＴを残りのブロックに適用することから生成されたＤＣＴ係数の４×４行列は、その後、ビットストリームを生成するため量子化及び可逆統計的符号化プロセス（「エントロピー符号化」プロセスとしてよく知られている）を受ける。統計的符号化プロセスの例は、コンテキスト適応型（context-adaptive）可変長符号化（ＣＡＶＬＣ）又はコンテキスト適応型２進算術符号化（ＣＡＢＡＣ）を含む。映像デコーダは、符号化ビットストリームを受信し、個々のブロックの残りの情報を伸長するために可逆復号化（lossless decoding）を実行する。残りの情報及び動き情報を使用して、映像デコーダは、符号化済みの映像を再構成する。

一般に本開示は、従来型の８点ＤＣＴより増大した符号化利得を提供し得る８点離散コサイン変換（ＤＣＴ）の１回以上の実施を使用して、メディアデータのようなデータを符号化する技術を対象にする。本開示の技術に基づいて適用される８点ＤＣＴの実施は、スケール因子と内部因子間の様々な関係を含む。用語「スケール因子」は、因数分解を介して取り除かれる８点ＤＣＴの実施部分の外部にある因子を示す。用語「内部因子」は、因数分解後に残る８点ＤＣＴの実施部分の内部にある因子を示す。８点ＤＣＴの一実施例は、直交であり、これは、８点ＤＣＴを表現する係数の行列が、この行列の転置を乗じられたとき、単位行列に等しくなることを示唆する。８点ＤＣＴの別の実施例は、準直交（又は近似直交）である。以下に詳述される種々な関係に従うことにより、これらの技術は、直交８点ＤＣＴ方式及び準直交８点ＤＣＴ方式の両方の事例において行列係数の選択を容易とし、これら８点ＤＣＴがデータに適用されたとき、従来型の８点ＤＣＴ群に対する符号化利得の増大を促進することになる。

一態様では、方法は、コーディング（coding：符号化又は複合化）装置を用いてメディアデータを受信することと、受信されたメディアデータを空間領域から周波数領域へ変換するためのコーディング装置の８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを用いて８点ＤＣＴを実行することを備える。８点ＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部と、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部とを含む。第２の関係は、第２のスケール因子が第３の内部因子の平方と第４の内部因子の平方との和の平方根に等しくなるように定義される。第２の関係は、さらに、第２のスケール因子が第５の内部因子の平方と第６の内部因子の平方との和の平方根に等しくなるように定義される。

別の態様では、装置は、メディアデータを空間領域から周波数領域へ変換する８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを備える。８点ＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部と、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部とを含む。第２の関係は、第２のスケール因子が第３の内部因子の平方と第４の内部因子の平方との和の平方根に等しくなるように定義される。第２の関係は、さらに、第２のスケール因子が第５の内部因子の平方と第６の内部因子の平方との和の平方根に等しくなるように定義される。

別の態様では、装置は、メディアデータを受信する手段と、受信されたメディアデータを空間領域から周波数領域へ変換するため８点離散コサイン変換（ＤＣＴ）を実行する手段とを備える。８点ＤＣＴ−ＩＩを実行する手段は、第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部と、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部とを含む。第２の関係は、第２のスケール因子が第３の内部因子の平方と第４の内部因子の平方との和の平方根に等しくなるように定義される。第２の関係は、さらに、第２のスケール因子が第５の内部因子の平方と第６の内部因子の平方との和の平方根に等しくなるように定義される。

別の態様では、一時的でないコンピュータ読み取り可能な記憶媒体は、プロセッサにコーディング装置を用いてメディアデータを受信させ、受信されたメディアデータを空間領域から周波数領域へ変換するためコーディング装置の８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを用いて８点離散コサイン変換（ＤＣＴ）を実行させる命令を備える。８点ＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部と、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部とを含む。第２の関係は、第２のスケール因子が第３の内部因子の平方と第４の内部因子の平方との和の平方根に等しくなるように定義される。第２の関係は、さらに、第２のスケール因子が第５の内部因子の平方と第６の内部因子の平方との和の平方根に等しくなるように定義される。

別の態様では、方法は、コーディング装置を用いてメディアデータを受信することと、受信されたメディアデータを空間領域から周波数領域へ変換するためコーディング装置の８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを用いて８点ＤＣＴを実行することとを備える。８点ＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子と第２の内部因子との和を定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＤＣＴハードウェアユニットは、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部をさらに含む。第２の関係は、第２のスケール因子が、最小誤差を生じる以下の式：（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、

（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を第５の近似（ε）と第６の近似（ζ）との和で除したものとの１つに等しくなるように定義される。

別の態様では、装置は、メディアデータを空間領域から周波数領域へ変換する８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを備える。８点ＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子と第２の内部因子との和を定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＤＣＴハードウェアユニットは、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部を含む。第２の関係は、第２のスケール因子が、最小誤差を生じる以下の式：（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を第５の近似（ε）と第６の近似（ζ）との和で除したものとの１つに等しくなるように定義される。

別の態様では、装置は、メディアデータを受信する手段と、受信されたメディアデータを空間領域から周波数領域へ変換するため８点離散コサイン変換（ＤＣＴ）を実行する手段とを備える。８点ＤＣＴを実行する手段は、第１のスケール因子が第１の内部因子と第２の内部因子との和を定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＤＣＴを実行する手段は、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部をさらに含む。第２の関係は、第２のスケール因子が、最小誤差を生じる以下の式：（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を第５の近似（ε）と第６の近似（ζ）との和で除したものとの１つに等しくなるように定義される。

別の態様では、一時的でないコンピュータ読み取り可能な記憶媒体は、プロセッサに８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを用いてメディアデータを受信させ、メディアデータを空間領域から周波数領域へ変換するため、８点離散コサイン変換（ＤＣＴ）を実行させる命令を備える。８点ＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子と第２の内部因子との和を定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＤＣＴハードウェアユニットは、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部をさらに含む。第２の関係は、第２のスケール因子が、最小誤差を生じる以下の式：（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を第５の近似（ε）と第６の近似（ζ）との和で除したものとの１つに等しくなるように定義される。

別の態様では、方法は、コーディング装置を用いて符号化済みメディアデータを受信することと、受信された符号化済みメディアデータを周波数領域から空間領域へ変換するためコーディング装置の８点逆離散コサイン変換（ＩＤＣＴ）ハードウェアユニットを用いて８点ＩＤＣＴを実行することとを備える。８点ＩＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＩＤＣＴハードウェアユニットは、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部をさらに含む。第２の関係は、第２のスケール因子が第３の内部因子の平方と第４の内部因子の平方との和の平方根に等しくなるように定義される。第２の関係は、さらに、第２のスケール因子が第５の内部因子の平方と第６の内部因子の平方との和の平方根に等しくなるように定義される。

別の態様では、装置は、符号化済みメディアデータを周波数領域から空間領域へ変換する８点逆離散コサイン変換（ＩＤＣＴ）ハードウェアユニットを備える。８点ＩＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＩＤＣＴハードウェアユニットは、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部をさらに含む。第２の関係は、第２のスケール因子が第３の内部因子の平方と第４の内部因子の平方との和の平方根に等しくなるように定義される。第２の関係は、さらに、第２のスケール因子が第５の内部因子の平方と第６の内部因子の平方との和の平方根に等しくなるように定義される。

別の態様では、装置は、符号化済みメディアデータを受信する手段と、受信された符号化済みメディアデータを周波数領域から空間領域へ変換するため８点逆離散コサイン変換（ＩＤＣＴ）を実行する手段とを備える。８点ＩＤＣＴを実行する手段は、第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＩＤＣＴを実行する手段は、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部を含む。第２の関係は、第２のスケール因子が第３の内部因子の平方と第４の内部因子の平方との和の平方根に等しくなるように定義される。第２の関係は、さらに、第２のスケール因子が第５の内部因子の平方と第６の内部因子の平方との和の平方根に等しくなるように定義される。

別の態様では、一時的でないコンピュータ読み取り可能な記憶媒体は、プロセッサにコーディング装置を用いて符号化済みメディアデータを受信させ、受信された符号化済みメディアデータを周波数領域から空間領域へ変換するためコーディング装置の８点逆離散コサイン変換（ＩＤＣＴ）ハードウェアユニットを用いて８点ＩＤＣＴを実行させる命令を備える。８点ＩＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部と、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部とを含む。第２の関係は、第２のスケール因子が第３の内部因子の平方と第４の内部因子の平方との和の平方根に等しくなるように定義される。第２の関係は、さらに、第２のスケール因子が第５の内部因子の平方と第６の内部因子の平方との和の平方根に等しくなるように定義される。

別の態様では、方法は、コーディング装置を用いて符号化済みメディアデータを受信することと、符号化済みメディアデータを周波数領域から空間領域へ変換するためコーディング装置の８点逆離散コサイン変換（ＩＤＣＴ）ハードウェアユニットを用いて８点逆離散コサイン変換（ＩＤＣＴ）を実行することとを備える。８点ＩＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子と第２の内部因子との和を定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＩＤＣＴハードウェアユニットは、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部をさらに含む。第２の関係は、第２のスケール因子が、最小誤差を生じる以下の式：（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を第５の近似（ε）と第６の近似（ζ）との和で除したものとの１つに等しくなるように定義される。

別の態様では、装置は、符号化済みメディアデータを周波数領域から空間領域へ変換する８点逆離散コサイン変換（ＩＤＣＴ）ハードウェアユニットを備える。８点ＩＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子と第２の内部因子との和を定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＩＤＣＴハードウェアユニットは、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部を含む。第２の関係は、第２のスケール因子が、最小誤差を生じる以下の式：（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を第５の近似（ε）と第６の近似（ζ）との和で除したものとの１つに等しくなるように定義される。

別の態様では、装置は、符号化済みメディアデータを受信する手段と、符号化済みメディアデータを周波数領域から空間領域へ変換するため８点逆離散コサイン変換（ＩＤＣＴ）を実行する手段とを備える。８点ＩＤＣＴを実行する手段は、第１のスケール因子が第１の内部因子と第２の内部因子との和を定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＩＤＣＴを実行する手段は、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部をさらに含む。第２の関係は、第２のスケール因子が、最小誤差を生じる以下の式：（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を第５の近似（ε）と第６の近似（ζ）との和で除したものとの１つに等しくなるように定義される。

別の態様では、一時的でないコンピュータ読み取り可能な記憶媒体は、プロセッサに８点逆離散コサイン変換（ＩＤＣＴ）ハードウェアユニットを用いて符号化済みメディアデータを受信させ、符号化済みメディアデータを周波数領域から空間領域へ変換するため、８点逆離散コサイン変換（ＩＤＣＴ）を実行させる命令を備える。８点ＩＤＣＴハードウェアユニットは、第１のスケール因子が第１の内部因子と第２の内部因子との和を定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて第１のスケール因子（μ）に関係している第１及び第２の内部因子（Ａ，Ｂ）を備える偶数部を含む。８点ＩＤＣＴハードウェアユニットは、第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）を備える奇数部をさらに含む。第２の関係は、第２のスケール因子が、最小誤差を生じる以下の式：（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を第５の近似（ε）と第６の近似（ζ）との和で除したものとの１つに等しくなるように定義される。

技術の１つ以上の態様の詳細は、添付図面と以下の説明とに記載される。本開示に記載された技術の他の特徴、目的、及び利点は、説明及び図面と、請求項とから明白になるであろう。

図１は、映像符号化及び復号化システムを示すブロック図である。図２は、図１の映像エンコーダをより詳しく示すブロック図である。図３は、図１の映像デコーダをより詳しく示すブロック図である。図４は、本開示の技術により構成されたスケール８点ＤＣＴ−ＩＩの実施部分を示す図である。図５は、本開示の技術により構成された８点ＤＣＴ実施部分を適用する際のコーディング装置の動作例を示すフローチャートである。図６は、本開示の技術により構成された８点ＤＣＴ−ＩＩＩ方式を適用する際のコーディング装置の動作例を示すフローチャートである。

一般に、本開示は、様々な関係に基づいて選択された係数の８×８行列として表現された１つ以上の８点離散コサイン変換（ＤＣＴ）を使用してデータを符号化する技術を対象にする。これらの技術は、デジタル映像データ、画像データ、スピーチデータ、及び／又は、音声データのような視覚又は聴覚メディアデータを含む種々のデータを圧縮し、それによって、このようなデータを表現する電気信号をより効率的に処理、伝送又は保管するための圧縮信号に変換するために適用されることがある。本開示の技術に基づいて定義された様々な関係に従うことにより、８点ＤＣＴの直交及び準直交実施がデータに適用されたとき、符号化利得の増大を促進するような係数が係数行列のために選択されることがある。

上記サイズ、すなわち８点は、離散データ単位の観点から表現されている。例えば、映像データは、しばしば映像ブロックの観点から、特に映像圧縮に関して説明される。映像ブロックは、一般に映像フレームのどのようなサイズの部分でも示すが、映像フレームは、一連のピクチャ又は画像内のピクチャ又は画像を示す。各映像ブロックは典型的に、例えば赤、青及び緑のような色成分（いわゆる「色度（chromaticity）」若しくは「クロマ（chroma）」成分）、又は、輝度成分（いわゆる「ルマ（luma）」成分）の何れかを示す複数の離散画素データを含む。画素データの個々の組は、映像ブロック内に単一の１×１点を含み、映像ブロックに関して離散データ単位と見なされ得る。よって、８×８映像ブロックは、例えば、各行に８個の離散的な画素データの組を含む８行の画素データを備える。ｎビット値は、色又は輝度値を指定するため各画素に割り当てられる。８×８映像ブロックを変換するとき、８点ＤＣＴは行に適用され、変換された行を生成する。この８点ＤＣＴの適用に続いて、変換された行データの列に８点ＤＣＴを適用する。行−列の順序は、逆転されてもよい。同様に、８行４列を収容する矩形ブロックに対して、４点ＤＣＴが行全体に適用され、続いて、８点ＤＣＴが中間変換された行データの列全体に適用される。

ＤＣＴは、ＤＣＴが処理することができる音声データ、スピーチ画像データ又は映像データ等のデータのサイズの観点から一般に説明される。例えば、ＤＣＴが入力データの８サンプルを処理できる場合、ＤＣＴは、８点ＤＣＴと呼ばれることがある。さらに、ＤＣＴは、特定のタイプとして表されることがある。８つの異なるＤＣＴのタイプのうち最も広く利用されるＤＣＴのタイプは、ＤＣＴタイプ−ＩＩであり、これは、「ＤＣＴ−ＩＩ」として表されることがある。しばしば、一般にＤＣＴに言及するとき、この言及は、ＤＣＴタイプ−ＩＩ、すなわちＤＣＴ−ＩＩを示す。ＤＣＴ−ＩＩの逆は、ＤＣＴタイプ−ＩＩＩと呼ばれ、これは同様に「ＤＣＴ−ＩＩＩ」又は、ＤＣＴがＤＣＴ−ＩＩを示すという共通の理解の下で、「ＩＤＣＴ」の中の「Ｉ」が逆を表す「ＩＤＣＴ」として表されることがある。以下のＤＣＴへの言及は、この表記に従い、一般的なＤＣＴへの言及は、特に断らない限り、ＤＣＴ−ＩＩを示す。しかし、混乱を避けるため、ＤＣＴ−ＩＩを含むＤＣＴは、大半は、対応するタイプ（ＩＩ、ＩＩＩなど）を示した状態で以下参照される。

本開示において記載される技術は、データの圧縮及び／又は伸長を実現し易くするため、８点ＤＣＴ−ＩＩ及び／又は８点ＤＣＴ−ＩＩＩの１つ以上の実施をそれぞれ利用するエンコーダ及び／又はデコーダの両方を含む。同様に、これら８点ＤＣＴ−ＩＩ方式を適用することにより実現される圧縮及び伸長は、物理的コンピューティングハードウェア、物理的伝送媒体（例えば、銅、光ファイバ、ワイヤレス、又は他の媒体）、及び／又は、記憶ハードウェア（例えば、磁気的若しくは光学的なディスク若しくはテープ、又は、種々のソリッドステート媒体のうちの何れか）を使用して電気信号をより効率的に処理、送信、及び／又は記憶することができるような、データを表現する電気信号の物理的変換を可能にする。実施は、ハードウェアだけで構成されることがあり、又は、ハードウェアとソフトウェアとの組み合わせで構成されることがある。

８点ＤＣＴ−ＩＩの実施は、直交又は準直交でもよい。用語「直交」は、行列にこの行列の転置を乗じたときに単位行列に等しくなるという行列一般の特性を示す。用語「準直交（near-orthogonal）」は、厳密な直交性が要求されないような直交特性が緩和された場合を示す。この点に関して、「準直交」は、近似的な又は緩い直交性を示唆する。しかし、準直交行列は、直交の技術的定義を満たさず、このような準直交行列は、純粋に技術的な見方をすると非直交と見なされることがある。

本開示に記載された８点ＤＣＴ−ＩＩの直交方式を例示するため、８点ＤＣＴモジュールを含む装置を検討する。８点ＤＣＴモジュールは、本開示に記載された技術に基づいて構成された直交８点ＤＣＴ−ＩＩを実施する。この直交８点ＤＣＴ−ＩＩ方式は、偶数部及び奇数部を含む。８点ＤＣＴ−ＩＩのいわゆる「偶数部」は、偶数番号が付けられた係数を出力する８点ＤＣＴ−ＩＩ実施部分の一部分を示す。８点ＤＣＴ−ＩＩのいわゆる「奇数部」は、奇数番号が付けられた係数を出力する８点ＤＣＴ−ＩＩ実施部分の一部分を示す。

本開示の技術によれば、偶数部は、第１及び第２の内部因子（Ａ，Ｂ）と第１のスケール因子（μ）とを備える。第１のスケール因子は、次式（１）：

に表されているように、第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなる。奇数部は、第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）と第２のスケール因子（η）とを備える。第２のスケール因子は、第３の内部因子（Ｇ）の平方と第４の内部因子（Ｄ）の平方との和の平方根に等しい。第２のスケール因子は、第５の内部因子（Ｅ）の平方と第６の内部因子（Ｚ）の平方との和の平方根にさらに等しい。第２のスケール因子と第３、第４、第５及び第６の内部因子との間のこれら２つの関係は、以下の式（２）：

を用いて数学的に定義される。用語「内部因子」は、因数分解後に残る８点ＤＣＴの実施部分の内部にある因子を示す。用語「スケール因子」は、因数分解を介して除去された８点ＤＣＴの実施部分の外部にある因子を示す。

内部因数は一般に、実施の複雑性の観点から費用がかさむ乗算を必要とすることから、実施複雑性を増大する。例えば乗算は、より単純な加算演算と比べると、完了するために３倍以上の多数回のコンピュータ演算を必要とすることがある。具体的な乗算器は、より効率的に（例えば、より少ないクロック数で）乗算を実行するために実施されるものもあるが、これらの乗算器方式は、典型的に、非常に多くのチップすなわちシリコン表面積を使い尽くし、そして大量の電力を引き出すこともある。従って因子による乗算は、しばしば、特にセルラ電話機、いわゆる「スマート」セルラ電話機、携帯情報端末（ＰＤＡ）、ラップトップコンピュータ、いわゆる「ネットブック」などを含む殆どのモバイル機器のような電力に敏感な装置において回避される。因数分解は、１以上の内部因子が８点ＤＣＴ−ＩＩ方式から除去され、外部因子で置き換えられるプロセスである。外部因子は、その後、例えば映像エンコーダに関して、通常は最小限の費用又は複雑性の増加で、後続の量子化演算に組み入れることができる。

いずれにしても、上述された内部因子とスケール因子との間の式（１）及び（２）によって定義された上記関係は、これまでの８点ＤＣＴ−ＩＩ方式では使用されない内部因子の具体的な値を与える。映像エンコーダは、その結果、これらの内部因子を含む８点ＤＣＴ−ＩＩ方式（行及び列の全体）をメディアデータに適用し、メディアデータを空間領域から周波数領域へ変換する。この直交８点ＤＣＴ−ＩＩ方式を適用することにより、これらの技術は、標準的な８点ＤＣＴ−ＩＩ方式と比較したとき、（圧縮効率を表す用語である）符号化利得を向上する。

直交性は、一般に、可逆であるためＤＣＴ−ＩＩ方式に関して望ましい。この可逆特性は、例えば映像データの残りのブロックからＤＣＴ係数を生成するために、映像エンコーダが直交８点ＤＣＴ−ＩＩ方式を適用することを可能にする。そして映像デコーダは、たとえあるとしてもデータ損失が僅かなＤＣＴ−ＩＩ係数から、映像データの残りのブロックを再構成するために、８点逆ＤＣＴ−ＩＩ（ＩＤＣＴ）方式を適用することが可能である。映像符号化の主要な目標がデータの保存であることを考慮して、Ｈ．２６４映像符号化規格のような様々な符号化規格が、８点ＤＣＴの直交方式を採用した。

直交性は、原理的には一般に望まれるが、映像、音声、又は汎用符号化パイプラインは、実際には、直交８点ＤＣＴ−ＩＩ方式によって提供される値の正確な再構成を、殆どの点で実質的に阻止するいわゆる「雑音」を生成する多数の段階を伴う。その結果、（厳密に言うと非直交である）準直交を達成するために、直交特性を緩和することは、元のＤＣＴ基底関数の精密な近似を少し犠牲にして実施の複雑性を低減すると共に、符号化効率を改善し得る。実質的に、直交特性の緩和は、雑音をシステムに導入するが、実施複雑性を同様に低減すると共に符号化利得を改善し得る。

本開示に記載された８点ＤＣＴ−ＩＩの準直交方式の例を説明するため、本開示に記載された技術に基づいて構成された準直交８点ＤＣＴ−ＩＩを実施する装置として８点ＤＣＴモジュールを検討する。この準直交８点ＤＣＴ−ＩＩ方式は、第１及び第２の内部因子（Ａ，Ｂ）と第１のスケール因子（μ）とを備える偶数部を含む。スケール因子は、第１の内部因子と第２の内部因子との和を、定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しく、数学的には、次式（３）：

として表される。

本例の準直交８点ＤＣＴ−ＩＩ方式は、第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）と第２のスケール因子（η）とを備える奇数部をさらに含む。第２のスケール因子は、最小誤差を生じる以下の項の１つに等しい。この関係は、以下の式（４）：

によって定義される。式（４）は、第２のスケール因子が、（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を、定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を、第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を、第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を、第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を、第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を、第５の近似（ε）と第６の近似（ζ）との和で除したもののうちの１つに等しくてもよいことを示す。

また、これらの式は、直交方式に関して定義された関係について、上で決定された内部因子に類似した特有の内部因子値を特定することがあるが、結果として異なった外部因子を生じ得る。しかし、異なった外部因子は典型的に、上述された理由から実施の複雑性を増大させないが、一般に従来型の８点ＤＣＴ−ＩＩ方式より、場合によっては本開示の技術によって構成された直交８点ＤＣＴ−ＩＩ方式より符号化利得の改善を提供する。従って、制御ユニットは、メディアデータを空間領域から周波数領域へ変換するために、この準直交８点ＤＣＴ−ＩＩをメディアデータに適用し、符号化利得を改善することになる。

図１は、映像符号化及び復号化システム１０を示すブロック図である。図１に示されるように、システム１０は、通信チャネル１６を介して符号化済みの映像を受信先ハードウェア装置１４へ送信する送信元ハードウェア装置１２を含む。送信元装置１２は、映像源１８と、映像エンコーダ２０と、送信器２２とを含み得る。宛先装置１４は、受信器２４と、映像デコーダ２６と、映像表示装置２８とを含み得る。

図１の例では、通信チャネル１６は、無線周波数（ＲＦ）スペクトル若しくは１つ以上の物理伝送線、又は、無線媒体と有線媒体との何らかの組み合わせのような無線通信媒体でも有線通信媒体でもよい。チャネル１６は、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、又は、インターネットのようなグローバル・ネットワークといったパケット・ベース・ネットワークの一部を形成し得る。通信チャネル１６は、一般に、送信元装置１２から受信先装置１４へ映像データを送信する何らかの適当な通信媒体、又は異なる通信媒体の集まりでもよい。

送信元装置１２は、宛先装置１４への送信用の映像を生成する。しかし一部の場合、装置１２、１４は、実質的に対称的に動作し得る。例えば、個々の装置１２、１４は、映像符号化及び復号化コンポーネントを含む。従って、システム１０は、例えば、映像ストリーミング、映像ブロードキャスティング、又は、テレビ電話用に、映像装置１２、１４の間で一方向又は双方向映像伝送をサポートし得る。他のデータ圧縮及び符号化の用途に、装置１２、１４は、画像データ、スピーチ若しくは音声データ、又は、映像データ、画像データ、スピーチデータ及び音声データのうちの２つ以上の組み合わせのような他のタイプのデータを送受信又は交換するため構成することができる。従って、映像用途の以下の説明は、例示の目的のため提供され、本明細書中に広範に記載されているような開示の種々の態様の限定としてみなされるべきでない。

映像源１８は、１台以上の映像カメラのような映像捕捉装置、以前に捕捉された映像を収容する映像アーカイブ、又は映像コンテンツプロバイダから供給されるライブ映像を含む。さらなる代替案として、映像源１８は、ソース映像としてのコンピュータ・グラフィックス・ベース・データ、又は、ライブ映像及びコンピュータ生成映像の組み合わせを生成し得る。ある場合において、映像源１８がカメラである場合、送信元装置１２及び受信先装置１４は、いわゆるカメラ付き携帯電話機、又は、テレビ電話機を形成し得る。従って、ある態様では、送信元装置１２、受信先装置１４、又は両方は、携帯電話機のようなワイヤレス通信機器ハンドセットを形成する。何れの場合も、捕捉映像、事前捕捉映像又はコンピュータ生成映像は、送信器２２、チャネル１６及び受信器２４を介した映像源装置１２から映像受信先装置１４の映像デコーダ２６への送信用の映像エンコーダ２０によって符号化される。表示装置２８は、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、又は、有機発光ダイオード（ＯＬＥＤ）ディスプレイのような種々の表示装置のうちの何れかを含む。

映像エンコーダ２０及び映像デコーダ２６は、空間、時間及び／又は信号対雑音比（ＳＮＲ）のスケーラビリティのためのスケーラブル映像符号化をサポートするため構成されることがある。ある態様では、映像エンコーダ２０及び映像デコーダ２２は、細粒度（fine granularity）ＳＮＲスケーラビリティ（ＦＧＳ）符号化をサポートするために構成されることがある。エンコーダ２０及びデコーダ２６は、ベース・レイヤ及び１つ以上のスケーラブル・エンハンスメント・レイヤの符号化、送信及び復号化をサポートすることにより、様々なスケーラビリティの程度をサポートし得る。スケーラブル映像符号化のため、ベース・レイヤは、最低水準の品質で映像データを搬送する。１つ以上のエンハンスメント・レイヤは、より高い空間、時間及び／又はＳＮＲレベルをサポートするために、付加的なビットストリームを搬送する。

映像エンコーダ２０及び映像デコーダ２６は、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、又はＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４次世代映像符号化（ＡＶＣ）のような映像圧縮基準に準拠して動作し得る。図１に図示されないが、一態様では、映像エンコーダ２０及び映像デコーダ２６は、それぞれ音声エンコーダ及び映像デコーダと一体化されることがあり、そして、共通データストリーム又は別個のデータストリームの中で音声及び映像の両方の符号化を取り扱うため、適切なＭＵＸ−ＤＥＭＵＸユニット、又は他のハードウェア及びソフトウェアを含むことがある。妥当な場合、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、又は、ユーザ・データグラム・プロトコル（ＵＤＰ）のような他のプロトコルに準拠することがある。

一部の態様では、映像ブロードキャスティングに関して、本開示に記載された技術は、例えば、ワイヤレス映像ブロードキャストサーバ又はワイヤレス通信機器ハンドセットを介して、技術規格ＴＩＡ−（「ＦＬＯ仕様書（ＦＬＯＳｐｅｃｉｆｉｃａｔｉｏｎ）」として公開された順方向リンクオンリー（ＦＬＯ）エアー・インターフェース仕様である「地上波モバイル・マルチメディア・マルチキャスト用の順方向リンク・オンリー・エアー・インターフェース仕様（ＦｏｒｗａｒｄＬｉｎｋＯｎｌｙＡｉｒＩｎｔｅｒｆａｃｅＳｐｅｃｉｆｉｃａｔｉｏｎｆｏｒＴｅｒｒｅｓｔｒｉａｌＭｏｂｉｌｅＭｕｌｔｉｍｅｄｉａＭｕｌｔｉｃａｓｔ）」を使用する地上波モバイル・マルチメディア・マルチキャスト（ＴＭ３）システムにおいてリアルタイム映像サービスを配信するＨ．２６４映像符号化を強化するため適用されることがある。ＦＬＯ仕様書は、ビットストリームシンタックス及びセマンティックスを定義する例と、ＦＬＯエアー・インターフェースに適した復号化プロセスとを含む。代替的に、映像は、ＤＶＢ−Ｈ（デジタル・ビデオ・ブロードキャスト・ハンドヘルド）、ＩＳＤＢ−Ｔ（統合デジタル・ブロードキャスト・サービス−地上波）、又はＤＭＢ（デジタル・メディア・ブロードキャスト）のような他の規格に基づいてブロードキャストされることがある。従って、送信元装置１２は、モバイル・ワイヤレス端末、映像ストリーミング・サーバ、又は映像ブロードキャストサーバでもよい。しかし、本開示に記載された技術は、いかなる特定のタイプのブロードキャスト、マルチキャスト、又はポイント・ツー・ポイント・システムに限定されない。ブロードキャストの場合、送信元装置１２は、幾つかの映像データのチャネルを複数の受信先装置へブロードキャストすることがあり、個々の受信先装置は、図１の受信先装置１４に類似し得る。

映像エンコーダ２０及び映像デコーダ２６は、個々に、１以上のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、ディスクリート・ロジック、ソフトウェア、ハードウェア、ファームウェア、又はこれらのうちの何れかの組み合わせとして実施され得る。従って、個々の映像エンコーダ２０及び映像デコーダ２６は、集積回路（ＩＣ）チップ又は装置として少なくとも部分的に実施され、そして、１台以上のエンコーダ又はデコーダに含まれることがあり、エンコーダ及びデコーダはどちらも複合型エンコーダ／デコーダ（ＣＯＤＥＣ）の一部としてそれぞれのモバイル機器、加入者機器、放送機器、サーバなどに統合され得る。さらに、送信元装置１２及び受信装置１４は、個々に、符号化済みの映像の送信及び受信のために、適切な変調コンポーネント、復調コンポーネント、周波数変換コンポーネント、フィルタリングコンポーネント、及び、増幅器コンポーネントを含むことがあり、適用可能なものとして、ワイヤレス通信をサポートするため十分な無線周波数（ＲＦ）コンポーネント及びアンテナを含む。しかし、例示を簡単にするため、このようなコンポーネントは、図１に図示されない。

映像シーケンスは、一連の映像フレームを含む。映像エンコーダ２０は、映像データを符号化するため個別の映像フレーム内画素のブロックを操作する。映像ブロックは、固定サイズ又は可変サイズを有することがあり、指定された符号化規格によってサイズが異なることもある。各映像フレームは一連のスライスを含む。各スライスは、一連のマクロブロックを含むことがあり、マクロブロックは、サブブロックに配置されることがある。一例として、ＩＴＵ−ＴＨ．２６４規格は、ルマ成分用の１６×１６、８×８、４×４と、クロマ成分用の８×８のような様々な２個１組のブロックサイズでイントラ予測をサポートし、同様に、ルマ成分用の１６×１６、１６×８、８×１６、８×８、８×４、４×８及び４×４と、クロマ成分用の対応するスケールサイズのような様々なブロックサイズでインター予測をサポートする。

より小さい映像ブロックは、一般に、より優れた分解能を提供することができ、より高いレベルの細部を含む映像フレームの位置用に使用されることがある。一般に、マクロブロック（ＭＢ）及び様々なサブブロックは、映像ブロックを示すと考えられる。さらに、スライスは、ＭＢ及び／又はサブブロックのような一連の映像ブロックを示すと考えられる。各スライスは、独立に復号化可能なユニットでもよい。予測後、変換が２個１組又は２個１組ではないサイズをもつ残りのブロックに実行され、イントラ１６×１６予測モードが使用される場合、さらなる変換がクロマ成分又はルマ成分のための４×４ブロックのＤＣＴ係数に適用されることがある。

図１のシステム１０の映像エンコーダ２０及び／又は映像デコーダ２６は、それぞれ、８点ＤＣＴ−ＩＩ及びこの８点ＤＣＴ−ＩＩの逆（例えば、８点ＤＣＴ−ＩＩＩ）の実施部分を含むよう構成される。８点ＤＣＴ−ＩＩは、本開示において記載された８点サイズのＤＣＴのためのＤＣＴ−ＩＩ行列係数を選択する技術の種々の関係のうちの１つに従う。ＩＴＵ−ＴＨ．２６４規格は、ルマ成分のための１６×１６、８×８、４×４とクロマ成分のための８×８のような様々なブロックサイズにおけるイントラ予測をサポートするが、符号化効率を改善するためのこの規格の改定が現在のところ進行中である。ＭＰＥＧとＩＴＵ−Ｔとの間の共同研究である映像符号化−共同研究部会（ＪＣＴ−ＶＣ）によって提案された１つの改定規格は、次世代映像符号化（ＨＥＶＣ）と呼ばれることがある。その結果、ＨＥＶＣ及び他の発展型規格又は仕様は、符号化効率を改善するために、これらのＤＣＴ−ＩＩ及びＤＣＴ−ＩＩＩを考慮することがある。

本開示に記載された技術によれば、８点ＤＣＴ−ＩＩの実施部分は、従来的な実施部分より符号化利得の改善を促進し得る様々な関係のうちの１つに従う方法で生み出されることがある。直交方式に関して、説明の便宜上ここで繰り返される上記式（１）は、偶数内部因子（すなわち、ＤＣＴ−ＩＩ方式の偶数部の内部にある因子のうちの因子）と、偶数部の出力のうちの１以上に適用される第１のスケール因子との間で第１の関係：

を特定する。式中、変数Ａ及びＢは、８点ＤＣＴ−ＩＩ方式の「偶数」部分における第１及び第２の内部因子を表し、変数μは、８点ＤＣＴ−ＩＩ方式の「偶数」部分に適用される第１のスケール因子を表す。８点ＤＣＴ−ＩＩのいわゆる「偶数」部分は、偶数番号が付けられた係数を出力する４点ＤＣＴ−ＩＩ方式の一部分を示す。

８点ＤＣＴ−ＩＩのいわゆる「奇数部」は、奇数番号が付けられた係数を出力する４点ＤＣＴ−ＩＩ方式の一部分を示す。直交８点ＤＣＴ−ＩＩ方式では、奇数部は、第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）と第２のスケール因子（η）とを備える。第２のスケール因子は、第３の内部因子（Ｇ）の平方と第４の内部因子（Ｄ）の平方との和の平方根に等しくなる。第２のスケール因子は、第５の内部因子（Ｅ）の平方と第６の内部因子（Ｚ）の平方との和の平方根にさらに等しくなる。第２のスケール因子と第３、第４、第５及び第６の内部因子との間のこれらの２つの関係は、式（２）に関して上述されるように数学的に定義され、この式（２）：

が説明の便宜上ここに再掲される。用語「内部因子」は、因数分解後に残る８点ＤＣＴの実施部分の内部にある因子を示す。用語「スケール因子」は、因数分解を介して除去された８点ＤＣＴの実施部分の外部にある因子を示す。

一般に内部因子は、より複雑な実施を伴う乗算を必要とすることから実施複雑性を増大させる。例えば乗算は、より単純な加算演算と比べると、完了するためには３倍以上の多数回のコンピュータ演算を必要とすることがある。具体的な乗算器は、より効率的に（例えば、より少ないクロック数で）乗算を実行するために実施されることがあるが、これらの乗算器方式は典型的に、非常により多くのチップすなわちシリコン表面積を使い尽くし、そして、大量の電力を引き出すこともある。従って因子による乗算は、しばしば、特にセルラ電話機、いわゆる「スマート」セルラ電話機、携帯情報端末（ＰＤＡ）、ラップトップコンピュータ、いわゆる「ネットブック」などを含む殆どのモバイル機器のような電力に敏感な装置において回避される。因数分解は、１以上の内部因子が８点ＤＣＴ−ＩＩ方式から除去され、外部因子で置き換えられるプロセスである。その後外部因子は、例えば映像エンコーダに関して、通常は最小限の費用又は複雑性の増加で、後続の量子化演算に組み入れることができる。

何れにしても、式（１）に関連して記載された第１及び第２の内部因子Ａ、Ｂと第１のスケール因子（μ）との間の上記関係と、第３から第６までの内部因子Ｇ、Ｄ、Ｅ及びＺと第２のスケール因子（η）との間の関係は、これまでの８点ＤＣＴ−ＩＩの実施部分では一般に使用されない内部因子の具体的な値を提供する。例えば、内部因子Ａ及びＢそれぞれの値２及び５と、Ｇ、Ｄ、Ｅ及びＺそれぞれの値１１、３、９及び７は、実施複雑性を過度に増大させることがなく、公知の８点ＤＣＴ方式より符号化利得を改善する。そして映像エンコーダは、メディアデータを空間領域から周波数領域へ変換するために、これら内部因子を含む８点ＤＣＴ−ＩＩ方式をメディアデータに適用する。この直交８点ＤＣＴ−ＩＩ方式を適用することにより、これらの技術は、従来のＤＣＴ−ＩＩ方式と比べたとき、（圧縮効率を表す用語である）符号化利得を向上し易くする。

直交性は、一般に可逆であるためＤＣＴ−ＩＩ方式に関して望ましい。この可逆特性は一例として、映像エンコーダが直交８点ＤＣＴ−ＩＩ方式を適用し、映像データの残りのブロックからＤＣＴ係数を生成することを可能にする。映像デコーダは、８点逆ＤＣＴ−ＩＩ（ＩＤＣＴ）方式を適用して、ＤＣＴ−ＩＩ係数から、データ損失がほとんどない状態で、映像データの残りのブロックを再構成することが可能である。映像符号化の主要な目標がデータの保存であることを考慮して、Ｈ．２６４映像符号化規格のような様々な符号化規格は、８点ＤＣＴの直交方式を採用した。

一般に直交性は、原理的には望まれるが、映像、音声又は汎用符号化パイプラインは、実際には、直交８点ＤＣＴ−ＩＩ方式によって提供される値の正確な再構成を殆ど実質的に阻止するいわゆる「雑音」を生じる数多くのステップを伴う。その結果、直交特性を緩和して（厳密に言うと非直交である）準直交を達成することにより、元のＤＣＴ基底関数の精密な近似を少し犠牲にして、実施複雑性を低減すると共に、符号化効率を改善し得る。実質的に直交特性の緩和は、雑音をシステムに導入するが、実施複雑性を同様に低減すると共に符号化利得を改善し得る。

８点ＤＣＴ−ＩＩの準直交方式の例を説明するため、一例として制御ユニットを含む装置を検討する。制御ユニットは、本開示に記載された技術に基づく準直交８点ＤＣＴ−ＩＩを実施する。この準直交８点ＤＣＴ−ＩＩ方式は、第１及び第２の内部因子（Ａ，Ｂ）と第１のスケール因子（μ）とを備える偶数部を含み、これは、直交方式と同じである。スケール因子は、第１の内部因子と第２の内部因子との和を、定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなり、上記式（３）のように数学的に表される。この式：

を説明の便宜上ここに再掲する。

本例における準直交８点ＤＣＴ−ＩＩ方式は、第３、第４、第５及び第６の内部因子（Ｇ，Ｄ，Ｅ，Ｚ）と第２のスケール因子（η）とを備える奇数部奇数部をさらに含む。第２のスケール因子は、最小誤差を生じる以下の項の１つに等しく、この関係は、上記式（４）によって定義される。この式：

を説明の便宜上ここに再掲する。式（４）は、第２のスケール因子が、（１）第３の内部因子（Ｇ）と第４の内部因子（Ｄ）との和を、定数パイの１／１６のコサインの第３の近似（γ）と定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、（２）第３の内部因子（Ｇ）と第５の内部因子（Ｅ）との和を、第３の近似（γ）と定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、（３）第３の内部因子（Ｇ）と第６の内部因子（Ｚ）との和を、第３の近似（γ）と定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、（４）第４の内部因子（Ｄ）と第５の内部因子（Ｅ）との和を、第４の近似（δ）と第５の近似（ε）との和で除したものと、（５）第４の内部因子（Ｄ）と第６の内部因子（Ｚ）との和を、第４の近似（δ）と第６の近似（ζ）との和で除したものと、（６）第５の内部因子（Ｅ）と第６の内部因子（Ｚ）との和を、第５の近似（ε）と第６の近似（ζ）との和で除したもののうちの１つに等しくなり得ることを示す。

同様に、これらの式は、直交方式に関して定義された関係について、上で決定された内部因子に類似した特有の内部因子値を特定することがあるが、結果として異なった外部因子を生じ得る。しかし、異なった外部因子は典型的に、上述した理由から実施複雑性を増大させないが、一般に、従来型の８点ＤＣＴ−ＩＩ方式について、さらに一部の事例では、本開示の技術によって構成される直交８点ＤＣＴ−ＩＩ方式について、符号化利得の改善を提供する。その結果、制御ユニットは、この準直交８点ＤＣＴ−ＩＩをメディアデータに適用して、メディアデータを空間領域から周波数領域へ変換し、符号化利得を改善する。

図２は、図１の映像エンコーダ２０をより詳細に例示するブロック図である。映像エンコーダ２０は、例えば１以上の集積回路装置として少なくとも部分的に形成され、これらの集積回路装置は、全体として集積回路装置と呼ばれることもある。一部の態様では、映像エンコーダ２０はワイヤレス通信機器ハンドセット又はブロードキャストサーバの一部を形成する。映像エンコーダ２０は、映像フレーム内でブロックのイントラ符号化及びインター符号化を実行し得る。イントラ符号化は空間予測に依存して、所定の映像フレーム内で映像中の空間的冗長性を低減又は除去する。インター符号化は時間予測に依存して、映像シーケンスの中の隣接フレーム内で、映像中の時間的冗長性を低減又は除去する。インター符号化に関して、映像エンコーダ２０は動き推定を実行し、隣接フレーム間の対応する映像ブロックの動きを追跡する。

図２に示されるように、映像エンコーダ２０は、符号化される映像フレーム内の現在の映像ブロック３０を受信する。図２の例では、映像エンコーダ２０は、動き推定ユニット３２と、基準フレーム記憶装置３４と、動き補償ユニット３６と、ブロック変換ユニット３８と、量子化ユニット４０と、逆量子化ユニット４２と、逆変換ユニット４４と、エントロピー符号化ユニット４６とを含む。ループ内又はループ後非ブロック化フィルタ（post loop deblocking filter）（図示せず）が、ブロックをフィルタ処理して、ブロック化アーティファクトを除去するために適用されることがある。映像エンコーダ２０は、加算器４８及び加算器５０をさらに含む。図２は、映像ブロックのインター符号化用の映像エンコーダ２０の時間予測コンポーネントを例示する。例示を簡単にするため図２に図示されないが、映像エンコーダ２０は、一部の映像ブロックのイントラ符号化のための空間予測コンポーネントを含むことがある。

動き推定ユニット３２は、映像ブロック３０を１又は複数の（以下、「１以上の」と記載する）隣接映像フレーム内のブロックと比較し、１以上の動きベクトルを生成する。１以上の隣接フレームは、基準フレーム記憶装置３４から取り出される。この基準フレーム記憶装置３４は、どのようなタイプのメモリ又はデータ記憶装置でもよく、既に符号化済みのブロックから再構成された映像ブロックを記憶する。動き推定は、例えば、１６×１６、１６×８、８×１６、８×８、又はより小さいブロックサイズの可変サイズのブロックに対し実行され得る。動き推定ユニット３２は、例えばレート歪みモデルに基づいて、現在映像ブロック３０と最も良く一致する隣接フレーム内の１以上のブロックを特定し、隣接フレーム内のブロックと現在映像ブロックとの間の変位を決定する。これに基づいて、動き推定ユニット３２は、現在映像ブロック３０と、現在映像ブロック３０を符号化するために使用された基準フレームからの１以上の対応するブロックとの間の変位の絶対値及び軌跡を示す１以上の動きベクトル（ＭＶ）を生成する。１以上の一致するブロックは、符号化されるブロックのインター符号化のための予測的（又は予測）ブロックとしての役割を果たすことになる。

動きベクトルは、半画素精度若しくは４分の１画素精度、又は、より一層微細な精度を有することがあり、映像エンコーダ２０が整数画素位置より高い精度で動きを追跡し、より優れた予測ブロックを取得することを可能にする。分数画素値をもつ動きベクトルが使用されるとき、補間演算が動き補償ユニット３６の中で実行される。動き推定ユニット３２は、レート歪みモデルのようなある一定の規準を使用して、最良ブロック区分と、１映像ブロックに対する１以上の動きベクトルとを特定する。例えば、双方向予測の場合、２以上の動きベクトルが存在することがある。結果として得られたブロック区分と動きベクトルとを使用して、動き補償ユニット３６は、予測映像ブロックを形成する。

映像エンコーダ２０は、加算器４８において元の現在映像ブロック３０から動き補償ユニット３６によって生成された予測映像ブロックを差し引くことにより残りの映像ブロックを形成する。ブロック変換ユニット３８は、残りの変換ブロック係数を生成する変換を適用する。図２に示されるように、ブロック変換ユニット３８は、本開示に記載された技術に基づいて構成された８点ＤＣＴ−ＩＩを実施する８点ＤＣＴ−ＩＩユニット５２を含む。８点ＤＣＴ−ＩＩユニット５２は、ハードウェアモジュールを表現し、このハードウェアモジュールは、一部の事例では、（ソフトウェアコード又は命令を実行するデジタル信号プロセッサ、すなわち、ＤＳＰのような）ソフトウェアを実行し、上で特定された２つの関係のうちの一方によって定義された内部因子を有する８点ＤＣＴ−ＩＩを実施する。ブロック変換ユニット３８は、スケール化された（scaled）８点ＤＣＴ−ＩＩユニット５２を残りのブロックに適用し、残りの変換係数の８×８ブロックを生成する。８点ＤＣＴ−ＩＩユニット５２は一般に、残りのブロックを残りの画素データとして表現された空間領域から、ＤＣＴ係数として表現される周波数領域へ変換する。変換係数は、少なくとも１個のＤＣＴ係数及び１以上のＡＣ係数を含むＤＣＴ係数を備える得る。

量子化ユニット４０は、残りの変換ブロック係数を量子化し（例えば、丸めて（round））、ビットレートをさらに削減する。上述のように、量子化ユニット４０は、因数分解中に除去された内部因子を組み入れることにより、スケール化された８点ＤＣＴ−ＩＩユニット５２のスケール化された特性の原因となる。すなわち、量子化ユニット４０は、図４の実施部７０に関連して以下に示される外部因子を組み入れる。量子化は典型的に乗算を伴うので、量子化ユニット４０の実施複雑性を増大させずに、これらの因子を量子化ユニット４０に組み入れることが可能である。この点に関して、スケール化された８点ＤＣＴ−ＩＩユニット５２から因子を除去することは、量子化ユニット４０の実施複雑性を増大することなく、ＤＣＴ−ＩＩユニット５２の実施複雑性を減少させ、結果として、映像エンコーダ２０に関して実施複雑性の有効な減少をもたらす。

エントロピー符号化ユニット４６は、量子化済みの係数をエントロピー符号化し、ビットレートをより一層削減する。エントロピー符号化ユニット４６は、一部の事例では、エントロピー符号化と呼ばれる統計的な可逆符号化を実行する。エントロピー符号化ユニット４６は、量子化済みのＤＣＴ係数の確率分布をモデル化し、モデル化された確率分布に基づいて符号表（例えば、ＣＡＶＬＣ又はＣＡＢＡＣ）を選択する。この符号表を使用して、エントロピー符号化ユニット４６は、量子化済みのＤＣＴ係数を圧縮する方法で、個々の量子化済みのＤＣＴ係数のための符号を選択する。例示するため、エントロピー符号化ユニット４６は、頻繁に出現する量子化済みのＤＣＴ係数のための（ビット数の）短い符号語（codeword）と、あまり頻繁に出現しない量子化済みのＤＣＴ係数のための（ビット数の）長い符号語とを選択し得る。短い符号語が量子化済みのＤＣＴ係数より少ないビットを使用する限り、平均してエントロピー符号化ユニット４６は、量子化済みのＤＣＴ係数を圧縮する。エントロピー符号化ユニット４６は、映像デコーダ２６へ送信されるビットストリームとしてエントロピー符号化済みの係数を出力する。一般に、映像デコーダ２６は、図３の例に関連して記載されるように、逆演算を実行し、ビットストリームから符号化済みの映像を復号化し再構成する。

再構成ユニット４２及び逆変換ユニット４４はそれぞれ、量子化済みの係数を再構成し、逆変換を適用し、残りのブロックを再構成する。逆変換ユニット４４は、逆ＤＣＴ（ＩＤＣＴ）を含むことがあり、この逆ＤＣＴは、図３に関連して後述される８点ＤＣＴ−ＩＩＩユニット６８と同様に、８点ＤＣＴ−ＩＩユニット５２の逆演算を実行するＤＣＴタイプＩＩＩと一般に呼ばれる。加算ユニット５０は、再構成済みの残りのブロックを動き補償ユニット３６によって生成された動き補償済みの予測ブロックに加算し、基準フレーム記憶装置３４への記憶用の再構成済みの映像ブロックを生成する。再構成済みの映像ブロックは、その後の映像フレーム内のブロックを符号化するために、動き推定ユニット３２及び動き補償ユニット３６によって使用される。

図３は、図１の映像デコーダ２６の例をより詳細に例示するブロック図である。映像デコーダ２６は、少なくとも部分的に１以上の集積回路装置として形成され、この集積回路装置は、全体的に集積回路装置と呼ばれることがある。一部の態様では、映像デコーダ２６は、ワイヤレス通信機器ハンドセットの一部を形成することがある。映像デコーダ２６は、映像フレーム内でブロックのイントラ復号化又はインター復号化を実行し得る。図３に示されるように、映像デコーダ２６は、映像エンコーダ２０によって符号化された符号化済みの映像ビットストリームを受信する。図３の例では、映像デコーダ２６は、エントロピー復号化ユニット５４と、動き補償ユニット５６と、再構成ユニット５８と、逆変換ユニット６０と、基準フレーム記憶装置６２とを含む。エントロピー復号化ユニット６４は、メモリ６４に記憶された１以上のデータ構造体にアクセスし、符号化中に役立つデータを取得する。映像デコーダ２６は、加算器６６の出力をフィルタ処理するループ内非ブロック化フィルタ（図示せず）をさらに含むことがある。映像デコーダ２６は、加算器６６をさらに含む。図３は、映像ブロックのインター復号化用の映像デコーダ２６の時間予測コンポーネントを例示する。図３には図示されないが、映像デコーダ２６は、一部の映像ブロックのイントラ復号化のための空間予測コンポーネントをさらに含むことがある。

エントロピー復号化ユニット５４は、符号化済みの映像ビットストリームを受信し該ビットストリームから、量子化済みの残りの係数及び量子化済みのパラメータを復号化すると共に、マクロブロック符号化モード及び動き情報のような他の情報を復号化する。この他の情報は、動きベクトル及びブロック区分を含み得る。動き補償ユニット５６は、動きベクトル及びブロック区分と、基準フレーム記憶装置６２からの１以上の再構成済みの基準フレームとを受信し、予測映像ブロックを生成する。

再構成ユニット５８は、量子化済みのブロック係数を逆量子化、すなわち、脱量子化（de-quantize）する。逆変換ユニット６０は、逆変換、例えば逆ＤＣＴを係数に適用し、残りのブロックを生成する。より具体的に、逆変換ユニット６０はスケール化された８点ＤＣＴ−ＩＩＩユニット６８を含み、逆変換ユニット６０はユニット６８を係数に適用し、残りのブロックを生成する。図２に示されるスケール化された８点ＤＣＴ−ＩＩユニット５２の逆であるスケール化された８点ＤＣＴ−ＩＩＩユニット６８は、係数を周波数領域から空間領域へ変換し、残りのブロックを生成し得る。上記量子化ユニット４０と同様に、再構成ユニット５８は、因数分解中に除去された外部因子を再構成プロセスに、実施複雑性の増大がほとんどない状態で、組み入れることにより、８点ＤＣＴ−ＩＩＩユニット６８のスケール化された特性の原因となる。スケール化された８点ＤＣＴ−ＩＩＩユニット６８から因子を除去することは、実施複雑性を減少させ、結果として、映像デコーダ２６に関して複雑性の有効な減少をもたらす。

次に予測映像ブロックは、残りのブロックと加算器６６によって加算され、復号化済みのブロックを形成する。非ブロック化フィルタ（図示せず）が、復号化済みのブロックをフィルタ処理するために適用され、ブロック化アーティファクト（artifact）を除去し得る。次にフィルタ処理されたブロックは、基準フレーム記憶装置６２の中に配置される。この基準フレーム記憶装置は、その後の映像フレーム復号化用の基準フレームを提供し、表示装置２８（図１）を駆動する復号化済みの映像をさらに生成する。

図４は、本開示の技術に基づいて構成された図２の例に示される８点ＤＣＴ−ＩＩユニット５２によって表現されたような、スケール化された８点ＤＣＴ−ＩＩの一般的な方式を例示する図である。図４の例では、８点ＤＣＴ−ＩＩ実施部７０は、上述の８点ＤＣＴ−ＩＩの直交方式及び準直交方式の両方を表現する。この意味では、直交方式及び準直交方式の両方は、同じ因数分解プロセスを使用して決定され、以下でより詳しく記載されるように、直交方式と準直交方式との間の差は、異なる内部因子及びスケール因子の形式で現われる。本実施例に関連して記載されているが、様々な因数分解プロセスを介して導出される他の方式が使用され得る。従って、本開示の技術は、図４の例に限定されるべきでない。図２の例に示された８点ＤＣＴ−ＩＩユニット５２は、１以上のこれらの実施部７０を組み込むことがある。図３の例に示された８点ＤＣＴ−ＩＩＩユニット６８は、これらの実施部７０のうちの１以上の逆実施を組み込むことがある。ここで逆実施は、入力が実施部７０の右から入り、出力が実施部７０の左から出るように信号路を単に反転するだけのものである。

図４の例に示されるように、８点ＤＣＴ−ＩＩ実施部７０Ａは、バタフライユニット７２と、偶数部７４Ａと、奇数部７４Ｂとを含む。バタフライユニット７２は、入力ｘ_０、…、ｘ_３を適切な偶数部７４Ａ及び奇数部４７Ｂ（「部分７４」）へ導く、又は、そうでなければ転送するハードウェア、又はハードウェアとソフトウェアとの組み合わせを表す。バタフライユニット７２は通常、４点ＤＣＴ−ＩＩ方式のような、偶数部７４Ａ及び奇数部７４Ｂによって、この場合に、それぞれ表現されるより小さいＤＣＴの結果を合成する。偶数部７４Ａは、偶数ＤＣＴ係数Ｘ_０、Ｘ_２、Ｘ_４及びＸ_６を出力する８点ＤＣＴ−ＩＩ実施部７０の４×４部分である。特に、偶数係数Ｘ_０及びＸ_４は、１を平方根２で除した外部因子が乗じられ、量子化ユニット４０によって適用可能であり、通常は適用される。偶数係数Ｘ_２及びＸ_６は、１をミュー（μ）で除した外部因子が乗じられ、また、量子化ユニット４０によって組み込み可能で通常は組み込まれ、かつ適用可能で通常は適用される。偶数部７４Ａは、２個の外部因子Ａ及びＢを含み、これらの外部因子は、以下でより詳細に記載されるように、２つの方法のうちの一方でミュー（μ）に関係している。

奇数部７４Ｂは、奇数ＤＣＴ係数Ｘ_１、Ｘ_３、Ｘ_５及びＸ_７を出力する８点ＤＣＴ−ＩＩ実施部７０の４点部分である。奇数部７４Ｂは、Ｇ、Ｄ、Ｅ及びＺで表された４個の内部因子を含み、これらの内部因子は、再度以下でより詳細に記載されるように、２つの方法のうちの一方で奇数ＤＣＴ係数Ｘ_１、Ｘ_３、Ｘ_５及びＸ_７に適用されたスケール因子イータ（η）に関係している。さらに、１を平方根２で除した外部因子（１／√２）は、奇数係数Ｘ_１及びＸ_７に適用される。１を平方根２で除した外部因子と、１をスケール因子イータで除したスケール因子との両方は、量子化ユニット４０に組み込むことが可能である。量子化ユニットは、一般に、映像エンコーダ２０の実施複雑性を増大させることなく、これらの因子を適用する。

直交方式について、式（１）及び（２）に記載された関係は、直交特性を最初に考慮することにより導出することができ、この直交特性は、以下の式（５）：
Ｃ^ＴＣ＝Ｉ (5)
によって数学的に記載される。変数Ｃは、本事例では何らかの行列を指し、一方、Ｃ^Ｔは、行列Ｃの転置を表す。変数Ｉは単位行列を表す。よって行列は、この行列の転置とこの行列自体との積が、単位行列に等しくなる場合に直交特性を示す。

上述の理由からメディア符号化の実施において好ましいスケール行列を想定すると、以下の式（６）：
Ｃ＝Ｃ’Ｄ (6)
に記載されるように、行列Ｃは、Ｃ’と表された整数スケール化変換と、スケール因子又は外部因子の対角行列Ｄとに分割される。式（５）内のＣに式（６）からのＣ’Ｄを代入すると、以下の式（７）：
（Ｃ’Ｄ）^Ｔ’（Ｃ’Ｄ）＝ＤＣ’^ＴＣ’Ｄ＝Ｉ (7)
が得られ、この式は、以下の式（８）：
Ｃ’Ｃ＝Ｄ^―２ (8)
に示された数学的方程式に簡単化することができる。式（８）は、結果として得られる整数変換が直交したまま維持されるように、スケーリング因子を選択する仕組みを提供する。

例えば、８点ＤＣＴ−ＩＩ方式の場合、このＤＣＴ−ＩＩ方式は、通常は、定数パイの３倍を８で除したもののコサインと、定数パイの３倍を８で除したもののサインと、定数パイを１６で除したもののコスティング（costing）と、定数パイを１６で除したもののサインと、定数パイの３倍を１６で除したもののコサインと、定数パイの３倍を１６で除したもののサインとを表す因子の近似だけを適用する。これら６個の因子が行列Ｃ’の係数である整数Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺで置換されると仮定し、そして、上記直交性条件を使用すると、上記式（１）は、８点ＤＣＴ−ＩＩの直交近似を線形するタスクが、以下の式（９）及び（１０）：

を満たすような整数（Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺ）を見つけるタスクに限定することができるような正規化因子を表す。

以下の表１は、整数Ａ及びＢのために選択された様々な値と、実施部７０の偶数部７４Ａに対する無理数ＤＣＴ−ＩＩとを比較して、結果として生じる近似誤差と、使用ビット数を例示する。

以下の表２は、整数Ｇ、Ｄ、Ｅ及びＺのために選択された様々な値と、実施部７０の奇数部７４Ｂに対する無理数ＤＣＴ−ＩＩとを比較して結果として生じる近似誤差と、使用ビット数とを例示する。

特に、表１及び２の両方における最初の３個の解は、やや不正確であるが、Ａ及びＢが５及び１２に設定され、Ｇ、Ｄ、Ｅ及びＺが１１、３、９及び７にそれぞれ設定された４番目の解から始めて、結果として得られる実施部７０の複雑性は増大するが、様々なコサイン項及びサイン項の近似の誤差ははるかに小さい。表２の（ヘッダ行以降の）第５行における５番目の解は、近似誤差の観点では、表２の第６行における解におおよそ等しくなる。表２の第７行及び第８行に掲載された７番目の解及び８番目の解は、非常に低い近似誤差を示す。表１及び表２から、内部因子Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺに関する数多くの異なる組み合わせが、特定用途に用いられる実施部７０に適合するよう試行され得る。注目の組み合わせは、（１１、３、９、７）及び（１９、４、１６、１１）という（Ｇ、Ｄ、Ｅ、Ｚ）の値の１つと組み合わせた（１、２）、（２、５）又は（３、７）という（Ａ、Ｂ）の値を含む。この点に関して、本開示に記載された技術は、小さい複雑性の増大だけで、符号化利得の増大を促進し、実施部７０は内部因子Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺに対する上記値の１以上の組み合わせを組み入れ、実施複雑性の最小限の増加で、潜在的に改善された符号化利得を提供する。

準直交方式に対し、式（３）及び（４）に記載された関係は、直交性が原理的には８点ＤＣＴ−ＩＩの簡単な逆実施を一般に保証する一方、実際には、（整数変換に続く）大半のスケール因子が無理数になり、整数乗算器を使用して厳密に実施することが難しい、という点を最初に考慮することにより得られる。さらに、量子化が、一般に８点ＤＣＴ変換の適用の後に続き、この量子化は、逆直交ＤＣＴ−ＩＩ方式の簡単な適用を妨げることがある雑音を加える。さらに、直交性の維持は、実際には、元のＤＣＴ−ＩＩに基づく関数に関してこのような直交方式の近似の的確さを低下させることがある。その結果として、順及び逆（straight and inverse ）方式の間のこのような直交性不一致の程度の緩和は、実際に符号化利得を改善することがある。

不一致の程度を特徴付けるため、単位行列からの距離のノルム（norm）は、以下の式（１１）：

に基づいて定義される。式（５）に関する上の表記と同じ表記を使用して、式（１１）は、単位行列からの距離のノルムが行列の転置と行列との積から単位行列を差し引いたものとして定義できることを端的に示す。Ｃ^ＴＣが対角行列のままであると仮定すると、平均絶対距離は、以下の式（１２）：

に基づいて計算することができ、平均絶対距離は、変数δ_Ｎによって表され、Ｎは、行列のサイズに等しくなる。

直交性の特徴を緩和することにより、符号化利得は改善し得るが、平均絶対差に関する符号化利得の解析は、圧縮される画像の特有のモデル又は統計値に過度に依存する。その結果、直交性の特徴を緩和する程度は、ＤＣＴ−ＩＩを基本とする関数の一致の観点で潜在的に最良である整数変換を見つけることに関係する異なった尺度の解析を介して決定され得る。この評価形式に関するさらなる情報は、Ｙ．Ａ．Ｒｅｚｎｉｋ、Ａ．Ｔ．Ｈｉｎｄｓ及びＪ．Ｌ．Ｍｉｔｃｈｅｌｌによる「共通因子を用いる固定点アルゴリズムの精度改善(Improved Precision of Fixed-Point Algorithms by Means of Common Factors)」、ＩＣＩＰ予稿集（Ｐｒｏｃ．ＩＣＩＰ）、サンディエゴ市（ＳａｎＤｉｅｇｏ）、カリフォルニア州（ＣＡ）と題する論文に見出すことができ、この論文の内容全体は、本明細書中に完全に記載されているかのように参照により組み込まれる。

この組み込まれた参考文献から、最も良く適合する設計を生成する一つの技術は、「共通因子ベース近似」と呼ばれる。この技術を使用して、式（３）及び（４）を導出することができ、両方の式：

が説明の便宜上ここに再掲される。

以下の表３は、整数Ａ及びＢのために選択された様々な値と、結果として生じる近似誤差を例示する。

以下の表４は、整数Ｇ、Ｄ、Ｅ及びＺのため選択された様々な値と、無理数ＤＣＴ−ＩＩとを比較して結果として生じる近似誤差とを例示する。

表４において、共通因子アプローチを使用することによって対称的になる誤差の対は、下線が付けられている。これらの対称的な誤差は、変換の奇数部の４個の内部因子の組について見出される最悪状況の近似誤差を表現する。

以下の表５は、使用ビット数に基づく直交実施部７０の最悪状況の精度と準直交又は非直交実施部７０との比較を例示する。

表５において分かるように、ＤＣＴ−ＩＩの非直交方式のすべて、特に、３ビット直交方式と比較したときの３ビット非直交方式は、対応する直交方式より低い最悪の状況の誤差を有している。この３ビット非直交方式は、無理数ＤＣＴ−ＩＩ因子のより優れた近似を介して符号化利得を増大させるのに加えて、Ｈ．２６４映像符号化規格において指定された８点ＤＣＴ−ＩＩよりも複雑性の低い数学的演算を必要とする。

線形又は１次元ＤＣＴとして上述されたが、この開示に記載された８点ＤＣＴ方式は、以下の表６に示されるように、８×８ＤＣＴ−ＩＩ行列として表現できる。パラメータＡ、Ｂ、Ｇ、Ｄ、Ｅ及びＺの選定に依存して、ある程度の数の行列係数が大きくなり、これらの大きい値による乗算を実行するために必要となる演算に関して、実施複雑性を増大させる。これらの大きい値を除去し、変換全体を介してダイナミックレンジをバランスさせるために、右シフトを乗算の後実施に導入できる。幾つかの例では、右シフトは、パラメータＡ及びＢの右シフトが同じであるという１つの制約例を用いて、任意の正の整数個ずつ値を右にシフトする。同様に、Ｇ、Ｄ、Ｅ及びＺに対する右へのシフトは、同様に同じであることが必要である。右シフトは、これらの整数パラメータを２個１組の有理数に変換し、この有理数は、２の累乗のような分母をもつ有理数である。典型的に、右シフトは、変換の正確さを減少させ、その結果、これらの右シフトを最小限に保つことがしばしば望ましい。同様に、入力サンプルは、右シフトに起因した正確さの損失を最小限に抑えるために定数個ずつ予め左シフトされてもよい。典型的な例は、Ａ及びＢに対する１ずつの右シフトと、Ｇ、Ｄ、Ｅ及びＺに対する４ずつの右シフトである。

ＤＣＴ−ＩＩユニットに関して図４の例に記載されているが、このＤＣＴ−ＩＩユニットは、本開示の技術に基づいて構成されたＩＤＣＴをさらに表現することがある。図４の例に図示された実施部分からの逆ＤＣＴの形成は、入力が図４の右の実施部分によって受信され、出力が実施部分の左で出力されるように入力及び出力を逆転させることを伴う。換言すると、入力が次に出力になり、出力が入力になるように垂直アクセスに関する実施部分を反転させることは、一般に、ＩＤＣＴ実施部分を生成することになる。説明を簡単にするため、そして、ＤＣＴからＩＤＣＴを形成することが技術的に周知であることを考慮して、これらのさらなるＩＤＣＴ実施部分は、別個の図に図示されていない。

図５は、本開示の技術に基づいて構成される８点ＤＣＴ実施部分を適用する、図２の映像エンコーダ２０のようなコーディング（coding）装置の動作例を示すフローチャートである。最初に、映像エンコーダ２０は、符号化される映像フレーム内の現在映像ブロック３０を受信する（９０）。動き推定ユニット３２は、映像ブロック３０を１以上の隣接映像フレーム内のブロックと比較する動き推定を実行し、１以上の動きベクトルを生成する（９２）。１以上の隣接フレームは、基準フレーム記憶装置３４から取り出ることができる。動き推定は、可変サイズ、例えば、１６×１６、１６×８、８×１６、８×８、４×４又はより小さいブロックサイズのブロックに対し実行され得る。動き推定ユニット３２は、例えば、レート歪みモデル（rate-distortion model）に基づいて、隣接フレーム内で現在映像ブロック３０と最もよく一致する１以上のブロックを特定し、隣接フレーム内の当該ブロックと現在映像ブロックとの間の変位を決定する。これに基づいて、動き推定ユニット３２は、現在映像ブロック３０と現在映像ブロック３０を符号化するために使用される基準フレームからの１以上の一致するブロックとの間の変位の大きさ及び軌跡を示す１以上の動きベクトル（ＭＶ）を生成する。１以上の一致するブロックは、符号化されるブロックのインター符号化用の予測的（又は予測）ブロックとしての役割を果たすことになる。

動きベクトルは、半画素精度、４分の１画素精度、又は、より一層微細な精度を有することがあり、映像エンコーダ２０が整数画素位置より高い精度で動きを追跡し、より優れた予測ブロックを取得することを可能にする。分数画素値をもつ動きベクトルが使用されるとき、補間演算が動き補償ユニット３６の中で実行される。動き推定ユニット３２は、レート歪みモデルのようなある一定の規準を使用して、最良ブロック区分と、映像ブロックに対する１以上の動きベクトルとを特定する。例えば、双方向予測の場合、２個以上の動きベクトルが存在することがある。結果として得られたブロック区分と動きベクトルとを使用して、動き補償ユニット３６は、予測映像ブロックを形成する（９４）。

映像エンコーダ２０は、加算器４８において元の現在映像ブロック３０から動き補償ユニット３６によって生成された予測映像ブロックを差し引くことにより残りの映像ブロックを形成する（９６）。ブロック変換ユニット３８は、残りの変換ブロック係数を生成する変換を適用する。ブロック変換ユニット３８は、本開示に記載された技術に基づいて生成された８点ＤＣＴ−ＩＩユニット５２を含む。ブロック変換ユニット３８は、スケール化された８点ＤＣＴ−ＩＩユニット５２を残りのブロックに適用し、残りの変換係数の８×８ブロックを生成する。一般に８点ＤＣＴ−ＩＩユニット５２は、残りのブロックを、残りの画素データとして表現された空間領域から、ＤＣＴ係数として表現された周波数領域へ変換する。このように、８点ＤＣＴ−ＩＩユニット５２は、上述された８点ＤＣＴ−ＩＩ方式を残りのデータに適用し、ＤＣＴ係数を決定する（９８）。変換係数は、少なくとも１個のＤＣ係数及び１以上のＡＣ係数を含むＤＣＴ係数を備え得る。

量子化ユニット４０は、ビットレートをさらに削減するために、残りの変換ブロック係数を量子化する（例えば、丸める）（１００）。上述のように、量子化ユニット４０は、因数分解中に除去された内部因子を組み入れることにより、スケール化された８点ＤＣＴ−ＩＩユニット５２のスケール化された性質の原因となる。すなわち、量子化ユニット４０は、図４の実施部７０に関連して上述された外部因子を組み入れる。量子化は、典型的に乗算を伴うので、これらの因子を量子化ユニット４０に組み入れることは、量子化ユニット４０の実施複雑性を増大させない。この点に関して、スケール化された８点ＤＣＴ−ＩＩユニット５２から因子を除去することは、量子化ユニット４０の実施複雑性を増大することなく、ＤＣＴ−ＩＩユニット５２の実施複雑性を減少させ、結果として、映像エンコーダ２０に関して実施複雑性の正味の減少をもたらす。

エントロピー符号化ユニット４６は、ビットレートをより一層削減するために、量子化済みの係数をエントロピー符号化する。エントロピー符号化ユニット４６は、一部の事例ではエントロピー符号化と呼ばれる統計的な可逆符号化（lossless coding）を実行し、符号化ビットストリームを生成する（１０２）。エントロピー符号化ユニット４６は、量子化済みのＤＣＴ係数の確率分布をモデル化し、モデル化された確率分布に基づいて符号表（例えば、ＣＡＶＬＣ又はＣＡＢＡＣ）を選択する。この符号表を使用して、エントロピー符号化ユニット４６は、量子化済みのＤＣＴ係数を圧縮する方法で個々の量子化済みのＤＣＴ係数の符号（code）を選択する。エントロピー符号化ユニット４６は、メモリ又は記憶装置に記憶されるか、及び／又は映像デコーダ２６へ送信される符号化ビットストリームとして、エントロピー符号化済みの係数を出力する（１０４）。

再構成ユニット４２及び逆変換ユニット４４はそれぞれ、量子化済みの係数を再構成して逆変換を適用し、残りのブロックを再構成する。また逆変換ユニット４４は、逆ＤＣＴ（ＩＤＣＴ）を含み、この逆ＤＣＴは図３に関連して後述される８点ＤＣＴ−ＩＩＩユニット６８と同様に、８点ＤＣＴ−ＩＩユニット５２の逆演算を実行するＤＣＴタイプＩＩＩと一般に呼ばれる。加算ユニット５０は、再構成済みの残りのブロックを動き補償ユニット３６によって生成された動き補償済みの予測ブロックに加算し、再構成済みの映像ブロックを生成し、この映像ブロックは基準フレーム記憶装置３４へ記憶され。再構成済みの映像ブロックは、その後の映像フレーム内のブロックを符号化するための動き推定ユニット３２及び動き補償ユニット３６によって使用される。

図６は、本開示の技術に基づいて構成された８点ＤＣＴ−ＩＩＩ方式を適用する、図３の映像デコーダ２６のようなコーディング装置の動作例を示すフローチャートである。映像デコーダ２６は、映像エンコーダ２０によって符号化された符号化済みの映像ビットストリームを受信する。詳細には、エントロピー復号化ユニット５４は、符号化済みの映像ビットストリームを受信し、このビットストリームから、量子化済みの残りの係数及び量子化済みのパラメータ、ならびに動きベクトル及びブロック区分を含み得るマクロブロックコーディングモード及び動き情報のような他の情報を復号化する（１０６、１０８）。動き補償ユニット５６は、動きベクトルと、基準フレーム記憶装置６２からのブロック区分及び１以上の再構成済みの基準フレームを受信し、予測映像ブロックを生成する（１１０）。

再構成ユニット５８は、量子化済みのブロック係数を逆量子化、すなわち、脱量子化（de-quantize）する（１１２）。逆変換ユニット６０は、逆変換例えば逆ＤＣＴを係数に適用し、残りのブロックを生成する。より具体的に、逆変換ユニット６０は、スケール化された８点ＤＣＴ−ＩＩＩユニット６８を含み、この８点ＤＣＴ−ＩＩＩユニット６８を上記係数に適用し、残りのブロックを生成する（１１４）。スケール化された８点ＤＣＴ−ＩＩＩユニット６８は、図２に示されたスケール化された８点ＤＣＴ−ＩＩユニット５２の逆であり、係数を周波数領域から空間領域へ変換し、残りのブロックを生成する。上記量子化ユニット４０と同様に、再構成ユニット５８は、たとえあるとしても実施複雑性の増大がほとんどなく、因数分解中に除去された外部因子を再構成プロセスに組み入れることにより、８点ＤＣＴ−ＩＩＩユニット６８のスケール化された性質の原因となる。スケール化された８点ＤＣＴ−ＩＩＩユニット６８から因子を除去することは、実施複雑性を減少させ、結果として、映像デコーダ２６に関して複雑性の正味の減少をもたらす。

次に予測映像ブロックは、加算器６６によって残りのブロックと加算され、復号化済みのブロックを形成する（１１６）。非ブロック化（deblocking）フィルタ（図示せず）が復号化済みのブロックをフィルタ処理し、ブロック化アーティファクトを除去するために適用されることがある。フィルタ処理されたブロックは、次に、基準フレーム記憶装置６２の中に配置され、この基準フレーム記憶装置は、次の映像フレームの復号化のための基準フレームを提供するとともに、復号化済みの映像を生成して図１の表示装置２８のような表示装置を駆動する（１１８）。

本開示の技術は、携帯電話機、集積回路（ＩＣ）若しくはＩＣの組（すなわち、チップセット）のようなワイヤレス通信機器ハンドセットを含む多種多様の機器又は装置で実施され得る。コンポーネント、モジュール又はユニットはどれもが機能的な態様を強調するため説明され、必ずしも異なるハードウェアユニットによる実現を必要としない。本明細書に記載された技術は、ハードウェア、又は、ハードウェア、ソフトウェア、ファームウェアの何れかの組み合わせで実施されることもある。モジュール、ユニット又はコンポーネントとして記載された特徴はどれもが集積化された論理装置として一緒に、又は、ディスクリートであるが、同時使用可能な論理装置として別々に実施されることがある。一部の場合、様々な特徴は、集積回路チップ又はチップセットのような集積回路装置として実施されることがある。

ソフトウェアで実施された場合、技術は、プロセッサで実行されたとき、上記方法のうちの１つ以上を実行する命令を備えるコンピュータ読み取り可能な媒体によって少なくとも部分的に実現されることがある。コンピュータ読み取り可能な媒体は、物理的な非一時的構造体であるコンピュータ読み取り可能な記憶媒体を備えることがあり、パッケージング材料を含むことがあるコンピュータ・プログラム・プロダクトの一部を形成することがある。コンピュータ読み取り可能な記憶媒体は、同期ダイナミック・ランダム・アクセス・メモリ（ＳＤＲＡＭ）のようなランダム・アクセス・メモリ（ＲＡＭ）と、リード・オンリ・メモリ（ＲＯＭ）と、不揮発性ランダム・アクセス・メモリ（ＮＶＲＡＭ）と、電気的消去可能プログラマブル・リード・オンリ・メモリ（ＥＥＰＲＯＭ）と、フラッシュメモリと、磁気的又は光学的データ記憶媒体などを備えることがある。

コード又は命令は、１台以上のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールド・プログラマブル・ロジック・アレイ（ＦＰＧＡ）、又は、他の等価的な集積論理回路若しくはディスクリート論理回路のような１台以上のプロセッサによって実行される。従って、本明細書で使用されるような用語「プロセッサ」は、上記構造体のうちの何れか、又は、本明細書に記載された技術の実施のために適した何らかの他の構造体を示すことがある。さらに、一部の態様では、本明細書に記載された機能は、符号化及び復号化のために構成された専用ソフトウェアモジュール、又は、ハードウェアモジュールの内部に設けられるか、又は、合成済の映像コーデックに組み込まれる。また、技術は１台以上の回路若しくは論理素子の中に完全に組み込まれることがある。

本開示は、また、本開示に記載された技術のうちの１つ以上を実施する回路を含む種々の集積回路装置の何れかを検討する。このような回路は、単独の集積回路チップ、又は、いわゆるチップセットの中の複数の、同時使用可能な集積回路チップに設けられることがある。このような集積回路装置は、多種多様の用途で使用されることがあり、用途のうちの一部は、携帯電話機ハンドセットのようなワイヤレス通信機器の中での使用を含むことがある。

技術の種々の態様が記載された。上記態様及び他の態様は、特許請求の範囲に含まれる。

Claims

コーディング装置を用いてメディアデータを受信することと、
前記コーディング装置の８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを用いて８点離散コサイン変換（ＤＣＴ）を実行し、前記受信されたメディアデータを空間領域から周波数領域へ変換すること、
を備え、前記８点ＤＣＴハードウェアユニットは、
第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて、前記第１のスケール因子（μ）に関係している前記第１及び前記第２の内部因子（Ａ、Ｂ）を備える偶数部と、
第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ、Ｄ、Ｅ、Ｚ）を備える奇数部と
を含み、
前記第２の関係は、前記第２のスケール因子が前記第３の内部因子の平方と前記第４の内部因子の平方との和の平方根に等しくなるように定義され、
前記第２の関係は、更に前記第２のスケール因子が前記第５の内部因子の平方と前記第６の内部因子の平方との和の平方根に等しくなるように定義されている、方法。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、３に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、７に設定されている、請求項１に記載の方法。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、１９に設定され、
前記第４の内部因子Ｄは、４に設定され、
前記第５の内部因子Ｅは、１６に設定され、
前記第６の内部因子Ｚは、１１に設定されている、請求項１に記載の方法。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、３に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、７に設定されている、請求項１に記載の方法。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、１９に設定され、
前記第４の内部因子Ｄは、４に設定され、
前記第５の内部因子Ｅは、１６に設定され、
前記第６の内部因子Ｚは、１１に設定されている、請求項１に記載の方法。
前記第１の内部因子Ａは、３に設定され、
前記第２の内部因子Ｂは、７に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、３に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、７に設定されている、請求項１に記載の方法。
前記第１の内部因子Ａは、３に設定され、
前記第２の内部因子Ｂは、７に設定され、
前記第３の内部因子Ｇは、１９に設定され、
前記第４の内部因子Ｄは、４に設定され、
前記第５の内部因子Ｅは、１６に設定され、
前記第６の内部因子Ｚは、１１に設定されている、請求項１に記載の方法。
前記８点ＤＣＴを実行することは、前記８点ＤＣＴを実行して、前記メディアデータから１以上のＤＣＴ係数を決定することを含み、
前記方法は、量子化ユニットを用いて前記第１及び第２のスケール因子（μ、η）を、前記１以上のＤＣＴ係数に適用し、量子化済みのＤＣＴ係数を決定することを更に備える、請求項１に記載の方法。
前記８点ＤＣＴハードウェアユニットは、前記８点ＤＣＴを実施するためのソフトウェアを実行するプロセッサを備える、請求項１に記載の方法。
前記内部因子Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺは、これらの内部因子が２個１組の有理数値になるように正規化され、
前記内部因子Ａ及びＢを正規化するために使用される第１の分母が２の１乗であり、
前記インターフェース因子Ｇ、Ｄ、Ｅ及びＺを正規化するために使用される第２の分母が２の２乗である、請求項１に記載の方法。
メディアデータを空間領域から周波数領域へ変換する８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを備え、
前記８点ＤＣＴハードウェアユニットは、
第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて、前記第１のスケール因子（μ）に関係している前記第１及び第２の内部因子（Ａ、Ｂ）を備える偶数部と、
第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ、Ｄ、Ｅ、Ｚ）を備える奇数部と
を含み、
前記第２の関係は、前記第２のスケール因子が前記第３の内部因子の平方と前記第４の内部因子の平方との和の平方根に等しくなるように定義され、
前記第２の関係は、更に前記第２のスケール因子が前記第５の内部因子の平方と前記第６の内部因子の平方との和の平方根に等しくなるように定義されている、装置。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、３に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、７に設定されている、請求項１１に記載の装置。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、１９に設定され、
前記第４の内部因子Ｄは、４に設定され、
前記第５の内部因子Ｅは、１６に設定され、
前記第６の内部因子Ｚは、１１に設定されている、請求項１１に記載の装置。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、３に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、７に設定されている、請求項１１に記載の装置。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、１９に設定され、
前記第４の内部因子Ｄは、４に設定され、
前記第５の内部因子Ｅは、１６に設定され、
前記第６の内部因子Ｚは、１１に設定されている、請求項１１に記載の装置。
前記第１の内部因子Ａは、３に設定され、
前記第２の内部因子Ｂは、７に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、３に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、７に設定されている、請求項１１に記載の装置。
前記第１の内部因子Ａは、３に設定され、
前記第２の内部因子Ｂは、７に設定され、
前記第３の内部因子Ｇは、１９に設定され、
前記第４の内部因子Ｄは、４に設定され、
前記第５の内部因子Ｅは、１６に設定され、
前記第６の内部因子Ｚは、１１に設定されている、請求項１１に記載の装置。
前記８点ＤＣＴハードウェアユニットは、前記ＤＣＴをメディアデータに適用し、１以上のＤＣＴ係数を決定し、
前記装置は、前記第１及び第２のスケール因子（μ、η）を前記１以上のＤＣＴ係数に適用し、調子化済みのＤＣＴ係数を決定する量子化ユニットを更に備える、請求項１１に記載の装置。
前記８点ＤＣＴハードウェアユニットは、直交８点ＤＣＴを実施するためのソフトウェアを実行するプロセッサを備える、請求項１１に記載の装置。
前記内部因子Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺは、これらの内部因子が２個１組の有理数値になるように正規化され、
前記内部因子Ａ及びＢを正規化するために使用される第１の分母が２の１乗であり、
前記インターフェース因子Ｇ、Ｄ、Ｅ及びＺを正規化するために使用される第２の分母が２の２乗である、請求項１１に記載の装置。
メディアデータを受信する手段と、
前記受信されたメディアデータを空間領域から周波数領域へ変換するために８点離散コサイン変換（ＤＣＴ）を実行する手段と
を備え、前記８点ＤＣＴを実行する手段は、
第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて、前記第１のスケール因子（μ）に関係している前記第１及び第２の内部因子（Ａ、Ｂ）を備える偶数部と、
第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ、Ｄ、Ｅ、Ｚ）を備える奇数部と
を含み、
前記第２の関係は、前記第２のスケール因子が前記第３の内部因子の平方と前記第４の内部因子の平方との和の平方根に等しくなるように定義され、
前記第２の関係は、更に前記第２のスケール因子が前記第５の内部因子の平方と前記第６の内部因子の平方との和の平方根に等しくなるように定義されている、装置。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、３に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、７に設定されている、請求項２１に記載の装置。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、１９に設定され、
前記第４の内部因子Ｄは、４に設定され、
前記第５の内部因子Ｅは、１６に設定され、
前記第６の内部因子Ｚは、１１に設定されている、請求項２１に記載の装置。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、３に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、７に設定されている、請求項２１に記載の装置。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、１９に設定され、
前記第４の内部因子Ｄは、４に設定され、
前記第５の内部因子Ｅは、１６に設定され、
前記第６の内部因子Ｚは、１１に設定されている、請求項２１に記載の装置。
前記第１の内部因子Ａは、３に設定され、
前記第２の内部因子Ｂは、７に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、３に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、７に設定されている、請求項２１に記載の装置。
前記第１の内部因子Ａは、３に設定され、
前記第２の内部因子Ｂは、７に設定され、
前記第３の内部因子Ｇは、１９に設定され、
前記第４の内部因子Ｄは、４に設定され、
前記第５の内部因子Ｅは、１６に設定され、
前記第６の内部因子Ｚは、１１に設定されている、請求項２１に記載の装置。
前記ＤＣＴを実行する手段は、８点ＤＣＴを前記メディアデータに提供し、１以上のＤＣＴ係数を決定する手段を更に備え、
前記装置は、前記第１及び第２のスケール因子（μ、η）を前記１以上のＤＣＴ係数に適用し、量子化されたＤＣＴ係数を決定する手段を更に備える、請求項２１に記載の装置。
前記内部因子Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺは、これらの内部因子が２個１組の有理数値になるように正規化され、
前記内部因子Ａ及びＢを正規化するために使用される第１の分母が２の１乗であり、
前記インターフェース因子Ｇ、Ｄ、Ｅ及びＺを正規化するために使用される第２の分母が２の２乗である、請求項２１に記載の装置。
コーディング装置を用いてメディアデータを受信することと、
前記コーディング装置の８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを用いて８点離散コサイン変換（ＤＣＴ）を実行し、前記受信されたメディアデータを空間領域から周波数領域へ変換すること
をプロセッサに行わせる命令を備え、
前記８点ＤＣＴハードウェアユニットは、
第１のスケール因子が第１の内部因子の平方と第２の内部因子の平方との和の平方根に等しくなるように定義された第１の関係に基づいて、前記第１のスケール因子（μ）に関係している前記第１及び第２の内部因子（Ａ、Ｂ）を備える偶数部と、
第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ、Ｄ、Ｅ、Ｚ）を備える奇数部と
を含み、
前記第２の関係は、前記第２のスケール因子が前記第３の内部因子の平方と第４の内部因子の平方との和の平方根に等しくなるように定義され、
前記第２の関係は、更に前記第２のスケール因子が前記第５の内部因子の平方と前記第６の内部因子の平方との和の平方根に等しくなるように定義されている、恒久的コンピュータ読み取り可能な記憶媒体。
コーディング装置を用いてメディアデータを受信することと、
前記コーディング装置の８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを用いて８点離散コサイン変換（ＤＣＴ）を実行し、前記メディアデータを空間領域から周波数領域へ変換すること
を備え、
前記８点ＤＣＴハードウェアユニットは、
第１のスケール因子が第１の内部因子と第２の内部因子との和を、定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて、前記第１のスケール因子（μ）に関係している前記第１及び第２の内部因子（Ａ、Ｂ）を備える偶数部と、
第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ、Ｄ、Ｅ、Ｚ）を備える奇数部と
を含み、
前記第２の関係は、前記第２のスケール因子が、最小誤差を生じる以下の（１）〜（６）式：
（１）前記第３の内部因子（Ｇ）と前記第４の内部因子（Ｄ）との和を、前記定数パイの１／１６のコサインの第３の近似（γ）と前記定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、
（２）前記第３の内部因子（Ｇ）と前記第５の内部因子（Ｅ）との和を、前記第３の近似（γ）と前記定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、
（３）前記第３の内部因子（Ｇ）と前記第６の内部因子（Ｚ）との和を、前記第３の近似（γ）と前記定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、
（４）前記第４の内部因子（Ｄ）と前記第５の内部因子（Ｅ）との和を、前記第４の近似（δ）と前記第５の近似（ε）との和で除したものと、
（５）前記第４の内部因子（Ｄ）と前記第６の内部因子（Ｚ）との和を、前記第４の近似（δ）と前記第６の近似（ζ）との和で除したものと、
（６）前記第５の内部因子（Ｅ）と前記第６の内部因子（Ｚ）との和を、前記第５の近似（ε）と前記第６の近似（ζ）との和で除したものと
の１つに等しくなるように定義されている、方法。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、５に設定され、
前記第４の内部因子Ｄは、１に設定され、
前記第５の内部因子Ｅは、４に設定され、
前記第６の内部因子Ｚは、３に設定されている、請求項３１に記載の方法。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、２に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、６に設定されている、請求項３１に記載の方法。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、５に設定され、
前記第４の内部因子Ｄは、１に設定され、
前記第５の内部因子Ｅは、４に設定され、
前記第６の内部因子Ｚは、３に設定されている、請求項３１に記載の方法。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、２に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、６に設定されている、請求項３１に記載の方法。
前記第１の内部因子Ａは、５に設定され、
前記第２の内部因子Ｂは、１２に設定され、
前記第３の内部因子Ｇは、５に設定され、
前記第４の内部因子Ｄは、１に設定され、
前記第５の内部因子Ｅは、４に設定され、
前記第６の内部因子Ｚは、３に設定されている、請求項３１に記載の方法。
前記第１の内部因子Ａは、５に設定され、
前記第２の内部因子Ｂは、１２に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、２に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、６に設定されている、請求項３１に記載の方法。
前記８点ＤＣＴを実行することは、前記８点ＤＣＴを実行し、前記メディアデータから１以上のＤＣＴ係数を決定することを含み、
前記方法は、量子化ユニットを用いて前記第１及び第２のスケール因子（μ、η）を前記１以上のＤＣＴ係数に適用し、量子化済みのＤＣＴ係数を決定することを更に備える、請求項３１に記載の方法。
前記８点ＤＣＴハードウェアユニットは、前記８点ＤＣＴを実施するためのソフトウェアを実行するプロセッサを備える、請求項３１に記載の方法。
前記内部因子Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺは、これらの内部因子が２個１組の有理数値になるように正規化され、
前記内部因子Ａ及びＢを正規化するために使用される第１の分母が２の１乗であり、
前記内部因子Ｇ、Ｄ、Ｅ及びＺを正規化するために使用される第２の分母が２の２乗である、請求項３１に記載の方法。
メディアデータを空間領域から周波数領域へ変換する８点離散コサイン変換（ＤＣＴ）ハードウェアユニットを備え、
前記８点ＤＣＴハードウェアユニットは、
第１のスケール因子が第１の内部因子と第２の内部因子との和を、定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて、前記第１のスケール因子（μ）に関係している前記第１及び第２の内部因子（Ａ、Ｂ）を備える偶数部と、
第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ、Ｄ、Ｅ、Ｚ）を備える奇数部と
を含み、
前記第２の関係は、前記第２のスケール因子が、最小誤差を生じる以下の式（１）〜（６）：
（１）前記第３の内部因子（Ｇ）と前記第４の内部因子（Ｄ）との和を、前記定数パイの１／１６のコサインの第３の近似（γ）と前記定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、
（２）前記第３の内部因子（Ｇ）と前記第５の内部因子（Ｅ）との和を、前記第３の近似（γ）と前記定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、
（３）前記第３の内部因子（Ｇ）と前記第６の内部因子（Ｚ）との和を、前記第３の近似（γ）と前記定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、
（４）前記第４の内部因子（Ｄ）と前記第５の内部因子（Ｅ）との和を、前記第４の近似（δ）と前記第５の近似（ε）との和で除したものと、
（５）前記第４の内部因子（Ｄ）と前記第６の内部因子（Ｚ）との和を、前記第４の近似（δ）と前記第６の近似（ζ）との和で除したものと、
（６）前記第５の内部因子（Ｅ）と前記第６の内部因子（Ｚ）との和を、前記第５の近似（ε）と前記第６の近似（ζ）との和で除したものと
の１つに等しくなるように定義されている、装置。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、５に設定され、
前記第４の内部因子Ｄは、１に設定され、
前記第５の内部因子Ｅは、４に設定され、
前記第６の内部因子Ｚは、３に設定されている、請求項４１に記載の装置。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、２に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、６に設定されている、請求項４１に記載の装置。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、５に設定され、
前記第４の内部因子Ｄは、１に設定され、
前記第５の内部因子Ｅは、４に設定され、
前記第６の内部因子Ｚは、３に設定されている、請求項４１に記載の装置。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、２に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、６に設定されている、請求項４１に記載の装置。
前記第１の内部因子Ａは、５に設定され、
前記第２の内部因子Ｂは、１２に設定され、
前記第３の内部因子Ｇは、５に設定され、
前記第４の内部因子Ｄは、１に設定され、
前記第５の内部因子Ｅは、４に設定され、
前記第６の内部因子Ｚは、３に設定されている、請求項４１に記載の装置。
前記第１の内部因子Ａは、５に設定され、
前記第２の内部因子Ｂは、１２に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、２に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、６に設定されている、請求項４１に記載の装置。
前記８点ＤＣＴハードウェアユニットは、８点ＤＣＴを前記メディアデータに適用し、１以上のＤＣＴ係数を決定し、
前記装置は、前記第１及び第２のスケール因子（μ、η）を前記１以上のＤＣＴ係数に適用し、量子化済のＤＣＴ係数を決定する量子化ユニットを更に備える、請求項４１に記載の装置。
前記８点ＤＣＴハードウェアユニットは、前記８点ＤＣＴを実施するためのソフトウェアを実行するプロセッサを備える、請求項４１に記載の装置。
前記内部因子Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺは、これらの内部因子が２個１組の有理数値になるように正規化され、
前記内部因子Ａ及びＢを正規化するために使用される第１の分母が２の１乗であり、
前記インターフェース因子Ｇ、Ｄ、Ｅ及びＺを正規化するために使用される第２の分母が２の２乗である、請求項４１に記載の装置。
メディアデータを受信する手段と、
前記メディアデータを空間領域から周波数領域へ変換する８点離散コサイン変換（ＤＣＴ）を実行する手段と、
を備え、
前記８点ＤＣＴを実行する手段は、
第１のスケール因子が第１の内部因子と第２の内部因子との和を、定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて前記第１のスケール因子（μ）に関係している前記第１及び第２の内部因子（Ａ、Ｂ）を備える偶数部と、
第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ、Ｄ、Ｅ、Ｚ）を備える奇数部と
を含み、
前記第２の関係は、前記第２のスケール因子が、最小誤差を生じる以下の式（１）〜（６）：
（１）前記第３の内部因子（Ｇ）と前記第４の内部因子（Ｄ）との和を、前記定数パイの１／１６のコサインの第３の近似（γ）と前記定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、
（２）前記第３の内部因子（Ｇ）と前記第５の内部因子（Ｅ）との和を、前記第３の近似（γ）と前記定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、
（３）前記第３の内部因子（Ｇ）と前記第６の内部因子（Ｚ）との和を、前記第３の近似（γ）と前記定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、
（４）前記第４の内部因子（Ｄ）と前記第５の内部因子（Ｅ）との和を、前記第４の近似（δ）と前記第５の近似（ε）との和で除したものと、
（５）前記第４の内部因子（Ｄ）と前記第６の内部因子（Ｚ）との和を、前記第４の近似（δ）と前記第６の近似（ζ）との和で除したものと、
（６）前記第５の内部因子（Ｅ）と前記第６の内部因子（Ｚ）との和を、前記第５の近似（ε）と前記第６の近似（ζ）との和で除したものと
の１つに等しくなるように定義されている、装置。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、５に設定され、
前記第４の内部因子Ｄは、１に設定され、
前記第５の内部因子Ｅは、４に設定され、
前記第６の内部因子Ｚは、３に設定されている、請求項５１に記載の装置。
前記第１の内部因子Ａは、１に設定され、
前記第２の内部因子Ｂは、２に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、２に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、６に設定されている、請求項５１に記載の装置。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、５に設定され、
前記第４の内部因子Ｄは、１に設定され、
前記第５の内部因子Ｅは、４に設定され、
前記第６の内部因子Ｚは、３に設定されている、請求項５１に記載の装置。
前記第１の内部因子Ａは、２に設定され、
前記第２の内部因子Ｂは、５に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、２に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、６に設定されている、請求項５１に記載の装置。
前記第１の内部因子Ａは、５に設定され、
前記第２の内部因子Ｂは、１２に設定され、
前記第３の内部因子Ｇは、５に設定され、
前記第４の内部因子Ｄは、１に設定され、
前記第５の内部因子Ｅは、４に設定され、
前記第６の内部因子Ｚは、３に設定されている、請求項５１に記載の装置。
前記第１の内部因子Ａは、５に設定され、
前記第２の内部因子Ｂは、１２に設定され、
前記第３の内部因子Ｇは、１１に設定され、
前記第４の内部因子Ｄは、２に設定され、
前記第５の内部因子Ｅは、９に設定され、
前記第６の内部因子Ｚは、６に設定されている、請求項５１に記載の装置。
前記ＤＣＴを実行する手段は、８点ＤＣＴを前記メディアデータに適用し、１以上のＤＣＴ係数を決定する手段を備え、
前記装置は、前記第１及び第２のスケール因子（μ、η）を前記１以上のＤＣＴ係数に適用し、量子化済みのＤＣＴ係数を決定する手段を更に備える、請求項５１に記載の装置。
前記内部因子Ａ、Ｂ、Ｇ、Ｄ、Ｅ及びＺは、これらの内部因子が２個１組の有理数値になるように正規化され、
前記内部因子Ａ及びＢを正規化するために使用される第１の分母が２の１乗であり、
前記内部因子Ｇ、Ｄ、Ｅ及びＺを正規化するために使用される第２の分母が２の２乗である、請求項５１に記載の装置。
メディアデータを受信することと、
前記メディアデータを空間領域から周波数領域へ変換する８点ＤＣＴハードウェアユニットを用いて８点離散コサイン変換（ＤＣＴ）を実行すること
をプロセッサに行わせる命令を備え、
前記８点ＤＣＴハードウェアユニットは、
第１のスケール因子が第１の内部因子と第２の内部因子との和を定数パイ（π）の３／８倍のコサインの第１の近似（α）と定数パイ（π）の３／８倍のサインの第２の近似（β）との和で除したものに等しくなるように定義された第１の関係に基づいて前記第１のスケール因子（μ）に関係している前記第１及び第２の内部因子（Ａ、Ｂ）を備える偶数部と、
第２の関係に基づいて第２のスケール因子（η）に関係している第３、第４、第５及び第６の内部因子（Ｇ、Ｄ、Ｅ、Ｚ）を備える奇数部と
を含み、
前記第２の関係は、前記第２のスケール因子が、最小誤差を生じる以下の式（１）〜（６）：
（１）前記第３の内部因子（Ｇ）と前記第４の内部因子（Ｄ）との和を、前記定数パイの１／１６のコサインの第３の近似（γ）と前記定数パイの１／１６のサインの第４の近似（δ）との和で除したものと、
（２）前記第３の内部因子（Ｇ）と前記第５の内部因子（Ｅ）との和を、前記第３の近似（γ）と前記定数パイの３／１６倍のコサインの第５の近似（ε）との和で除したものと、
（３）前記第３の内部因子（Ｇ）と前記第６の内部因子（Ｚ）との和を、前記第３の近似（γ）と前記定数パイの３／１６倍のサインの第６の近似（ζ）との和で除したものと、
（４）前記第４の内部因子（Ｄ）と前記第５の内部因子（Ｅ）との和を、前記第４の近似（δ）と前記第５の近似（ε）との和で除したものと、
（５）前記第４の内部因子（Ｄ）と前記第６の内部因子（Ｚ）との和を、前記第４の近似（δ）と前記第６の近似（ζ）との和で除したものと、
（６）前記第５の内部因子（Ｅ）と前記第６の内部因子（Ｚ）との和を、前記第５の近似（ε）と前記第６の近似（ζ）との和で除したものと
の１つに等しくなるように定義されている、恒久的コンピュータ読み取り可能な記憶媒体。