JP5590574B2

JP5590574B2 - 多重解像度ビデオ符号化および復号化のための再サンプリングおよび画像サイズ変更の演算

Info

Publication number: JP5590574B2
Application number: JP2012120308A
Authority: JP
Inventors: ジェイ．サリバンゲーリー
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 2006-01-06
Filing date: 2012-05-25
Publication date: 2014-09-17
Anticipated expiration: 2027-01-08
Also published as: CN101366281B; RU2008127319A; US8780272B2; HK1161016A1; US20130271651A1; IL218145A0; JP5302010B2; US8493513B2; CA2635898C; US20140269912A1; AU2007205175A1; JP2009522935A; KR101354741B1; KR20130041378A; EP1985120A2; CN101366281A; KR101344193B1; AU2007205175B2; EP1985120A4; US7956930B2

Description

本発明は、デジタルビデオを符号化／復号化するための手法およびツールに関する。

ＤＶＤ、インターネットによる音楽配信、およびデジタルカメラの普及が拡大するとと
もに、デジタルメディアが当たり前のものになってきた。手法者は、様々な手法を使用し
て、品質をそのまま維持しながらデジタルオーディオ、デジタルビデオ、およびデジタル
画像を効率よく処理する。これらの手法を理解するために、オーディオ、ビデオ、および
画像情報がコンピュータ内でどのように表現され、処理されるかを理解するのは有益なこ
とである。

Ｉ．コンピュータ内のメディア情報の表現
コンピュータは、メディア情報をその情報を表す一連の数値として処理する。例えば、
単一の数値で、画像のそれぞれの基本的な小領域に対する輝度または赤色、緑色、または
青色の色成分の強度を表すことができ、したがって画像のデジタル表現は、このような数
値の１つまたは複数の配列からなる。それぞれのこのような数値は、サンプルと呼ばれう
る。カラー画像の場合、それぞれの画素の色を表すために複数のサンプルを使用するのが
習慣であり、典型的には、３つのサンプルが使用される。要素領域に対するこれらのサン
プルの集合は、ピクセルと呼ぶことができるが、「ピクセル」という単語は、「画素」と
いう概念を指し示す略語である。例えば、１ピクセルは、要素領域を表現するのに必要な
赤色、緑色、青色の光の強度を表す３つのサンプルで構成されうる。このようなピクセル
タイプは、ＲＧＢピクセルと呼ばれる。複数の因子が、サンプル深度、解像度、およびフ
レームレート（ビデオの場合）を含む、メディア情報の品質に影響を及ぼす。

サンプル深度は、サンプルを表現するために使用できる数値の範囲を示すビット単位で
通常測定される特性である。サンプルに対しさらに多くの値を使用できる場合、数値で捕
捉できる強度の微妙な変化が増え、および／または値の範囲が広がるため、品質を高める
ことができる。解像度は、一般に、ある継続時間（オーディオ用）または空間（画像また
は個々の映像用）におけるサンプルの数を意味する。画像は空間解像度が高いほど、他の
画像よりも明瞭に見え、より識別しやすい有益な細部を含むように見える。フレームレー
トは、ビデオの時間解像度に対する一般的な用語である。ビデオはフレームレートが高い
ほど、他のビデオに比べて自然物の動きをより滑らかに再現する傾向があり、同様に、時
間次元においてより精細な細部を含むと考えられる。これらすべての因子について、高品
質に対するトレードオフは、表１に示されているようにサンプル深度、解像度およびフレ
ームレートを表すのに必要なビットレートに関して示されている情報を格納し、送信する
コストである。

高品質ビデオ（ＨＤＴＶ等）を格納して、送信するのに高いビットレートが必要である
にもかかわらず、企業も消費者も、高品質なコンテンツを作成し、配信し、再生するのに
コンピュータにますます依存するようになってきている。このような理由から、手法者は
、圧縮（ソースコーディング（source coding）またはソース符号化とも呼ばれる）を使
用して、デジタルメディアのビットレートを削減する。圧縮は、情報をより低いビットレ
ート形式に変換することにより情報を格納し、送信するコストを低減する。圧縮は、可逆
とすることができ、この場合、ビデオの品質は損なわれないが、ビットレートの低減は、
ビデオの複雑度により制限される。あるいは、圧縮は、不可逆とすることができ、ビデオ
の品質は損なわれるが、ビットレートの低減は、より劇的である。圧縮解除（復号化とも
呼ばれる）では、圧縮形式からあるバージョンの元情報を再構成する。「コーデック」は
、符号器／復号器システムである。

一般に、ビデオ圧縮手法は、「イントラ（画像内）」圧縮、「インター（画像間）」圧
縮または予測圧縮を含む。映像については、イントラ圧縮手法で、個々の画像を圧縮する
。インター圧縮手法では、先行および／または後続の画像を参照して画像を圧縮する。

ＩＩ．多重解像度ビデオおよび空間スケーラビリティ
標準ビデオ符号器では、目標ビットレートが特定の閾値よりも低い場合に性能が劇的に
低下する。量子化および他の不可逆処理段において、歪みを生じる。低ビットレートでは
、高周波情報は、大きく歪むか、または完全に失われることがある。その結果、著しいア
ーチファクトが発生し、再構成されたビデオの品質の実質的低下を引き起こす。利用可能
なビットレートは、伝送および処理手法が改善するにつれ増大するけれども、制約された
ビットレートで高い視覚的品質を維持することが、いぜんとしてビデオコーデック設計の
主要目標である。既存のコーデックでは、制約されたビットレートで視覚的品質を改善す
るために複数の方法を利用する。

多重解像度符号化（多重分解能符号化）では、異なる空間解像度でビデオを符号化する
ことができる。解像度を落としたビデオは、情報が失われるのと引き替えに、実質的に低
いビットレートで符号化されうる。例えば、事前ビデオ符号器（prior video encoder）
は、（ダウンダンプリングフィルタを使用して）最大解像度（フルレゾ）ビデオをダウン
サンプリングし、垂直および／または水平方向に解像度を落として符号化することができ
る。それぞれの方向の解像度を半分に減らすと、符号化された画像サイズの寸法が半分に
なる。符号器は、解像度を落とした符号化信号を復号器に送る。復号器は、解像度を落と
した符号化であることを示す情報を受け取り、受け取った情報から、表示する前に画像サ
イズを増大するのに解像度を落としたビデオを（アップサンプリングフィルタを使用して
）どのようにアップサンプリングするかについて確認する。しかし、符号器がビデオ画像
をダウンサンプリングしたときには、符号化したときに失われた情報は、アップサンプリ
ングされた画像から依然としてなくなっている。

空間的にスケーラブル（拡大縮小可能）なビデオでは、マルチレイヤ（多層）アプロー
チを使用して、これにより、符号器は、１つまたは複数のエンハンスメントレイヤ（拡張
階層：enhancement layer）におけるソースビデオから高解像度の情報を保持しながらベ
ースレイヤ（基層）における空間解像度（したがってビットレート）を低減することがで
きる。例えば、ベースレイヤイントラ画像は、解像度を落として符号化されうるが、随伴
するエンハンスメントレイヤイントラ画像は、高解像度で符号化されうる。同様に、ベー
スレイヤ予測画像には、エンハンスメントレイヤ予測画像が随伴しうる。復号器は、（ビ
ットレート制約条件および／または他の基準に基づき）低解像度再構成画像を得るために
低解像度でベースレイヤ画像のみを復号化すること、または高解像度再構成画像を得るた
めにベースレイヤとエンハンスメントレイヤ画像を復号化することを選択することができ
る。ベースレイヤが、表示される画像よりも低い解像度で符号化される場合（ダウンサン
プリングとも呼ばれる）、符号化された画像サイズは、表示される画像よりも実際に小さ
い。復号器は、再構成される画像のサイズを変更するために計算を実行し、アップサンプ
リングフィルタを使用して再構成される画像内の適切な位置に補間されたサンプル値を生
成する。

米国特許第６，５１０，１７７号明細書ＩＴＵ−Ｔ国際標準勧告Ｈ．２６３

しかしながら、空間的にスケーラブルなビデオを使用する以前のコーデックは、硬直的
なアップサンプリングフィルタと、不正確な、または（計算時間もしくはビットレートに
関して）高コストの画像サイズ変更手法に悩んでいる。

デジタルビデオに対するビデオ圧縮および圧縮解除の決定的な重要性を考えた場合、ビ
デオ圧縮および圧縮解除は、十分に開発の進んでいる分野であることは驚くべきことでは
ない。しかし、以前のビデオ圧縮および圧縮解除手法には、どのような利点があろうと、
以下に説明する本発明の手法およびツールの利点を有していない。

この「発明の開示」では、以下の「発明を実施するための最良の形態」でさらに説明さ
れる簡素化された形式の概念の選択を導入する。この「発明の開示」は、請求されている
主題の鍵となる特徴または本質的特徴を明示することを意図しておらず、また請求されて
いる主題の範囲を制限するために使用されることも意図していない。

つまり、「発明を実施するための最良の形態」は、多重解像度および階層化空間的にス
ケーラブルなビデオ符号化および復号化用の様々な手法およびツールを対象とする。

例えば、「発明を実施するための最良の形態」は、空間的にスケーラブルなビデオ符号
化および復号化などのアプリケーションにおける画像サイズ変更のための高精度の位置計
算を行うための様々な手法およびツールを対象とする。空間的スケーラブルなビデオ符号
化および復号化などのアプリケーションにおける画像サイズ変更のための高精度の位置計
算を行うための手法およびツールについて説明する。一態様では、映像の再サンプリング
は、再サンプリングスケール係数に応じて実行される。再サンプリングは、再サンプリン
グ配列内の位置ｉ、ｊにおけるサンプル値の計算を含む。この計算処理は、一部は２^ｎ値
にアップサンプリングスケール係数の逆数（近似値または厳密な値）を乗算する（か、ま
たは２^ｎ値をアップサンプリングスケール係数またはアップサンプリングスケール係数の
近似値で除算する）ことにより値を近似することを伴う仕方により導出された水平または
垂直のサブサンプル位置（sub-sample position）ｘまたはｙを計算することを含む。指
数ｎは、小数部のビット数を表す整数Ｆを含む２つの整数の和としてよい。この近似は、
近い整数に近似するシーリング関数またはフロア関数などの、丸めまたは他の何らかの種
類の近似とすることができる。サンプル値は、フィルタを使用して補間される。

本明細書で説明されている手法のいくつかの代替え手段は、一実施態様では、サンプル
位置計算プロセスまたはその複雑度を著しく変えることなく計算の中に約１エクストラビ
ット（エキストラビット；extra bit）の精度を用意する変更されたサンプル位置計算を
行う。説明されている手法のさらにいくつかの代替え手段は、４：２：２および４：４：
４のサンプリング構造でサンプル位置計算が動作する仕方に関係する。このようなサンプ
リング構造に対するこれらの代替え手法では、色度および輝度サンプリンググリッドの解
像度が特定の次元において同じである場合に必ず輝度および色度サンプル位置計算を一緒
にロックする。

追加の特徴および利点は、付属の図面を参照しつつ進行する様々な実施形態の以下の詳
細な説明から明白になる。

説明されている実施形態は、多重解像度および階層化空間的にスケーラブルなビデオ符
号化および復号化用の手法およびツールを対象とする。

本明細書で説明されている様々な手法およびツールは、独立に使用することができる。
これらの手法およびツールの一部は、併用することができる（例えば、組み合わされた符
号化および／または復号化プロセスの異なるフェーズで）。

以下では、処理活動の流れ図に関して様々な手法について説明する。流れ図に示されて
いる様々な処理活動を少数の活動にまとめたり、またはさらに多くの活動に分けたりする
ことができる。単純にするため、特定の流れ図に示されている活動と別のところで説明さ
れている活動との関係は、しばしば示されていない。多くの場合、流れ図内の動作は、順
序変更することができる。

「発明を実施するための最良の形態」の大部分において、ビデオ情報の表現、符号化、
および復号化を取りあげている。ビデオ情報の表現、符号化、および復号化について本明
細書で説明されている手法およびツールは、オーディオ情報、静止画情報、または他のメ
ディア情報に適用されうる。

Ｉ．コンピュータ環境
図１は、説明されている実施形態のうちの複数を実装できる好適なコンピュータ環境１
００の一般化された実施形態を例示している。これらの手法およびツールは多様な汎用ま
たは専用コンピュータ環境に実装できるため、コンピュータ環境１００は、使用または機
能性の範囲に関する制限を示唆する意図はない。

図１を参照すると、コンピュータ環境１００は、少なくとも１つの処理装置１１０およ
びメモリ１２０を備える。図１で、この最も基本的な構成１３０は、破線で囲まれている
。処理装置１１０は、コンピュータ実行可能命令を実行し、実プロセッサでも、仮想プロ
セッサでもよい。マルチプロセッシングシステムでは、処理能力を高めるため、複数の処
理装置がコンピュータ実行可能命令を実行する。メモリ１２０は、揮発性メモリ（例えば
、レジスタ、キャッシュ、ＲＡＭ）、不揮発性メモリ（例えば、ＲＯＭ、ＥＥＰＲＯＭ、
フラッシュメモリなど）、またはこれら２つの何らかの組合せとすることができる。メモ
リ１２０は、説明されている手法およびツールのうちの１つまたは複数を使ってビデオ符
号器または復号器を実装するソフトウェア１８０を格納する。

コンピュータ環境には、機能を追加することができる。例えば、コンピュータ環境１０
０は、記憶装置１４０、１つまたは複数の入力デバイス１５０、１つまたは複数の出力デ
バイス１６０、および１つまたは複数の通信接続１７０を含む。バス、コントローラ、ま
たはネットワークなどの相互接続メカニズム（図に示されていない）は、コンピュータ環
境１００のコンポーネントを相互接続する。通常、オペレーティングシステムソフトウェ
ア（図に示されていない）は、コンピュータ環境１００内で他のソフトウェアを実行する
ためのオペレーティング環境を提供し、コンピュータ環境１００のコンポーネントの動作
を調整する。

記憶装置１４０は、取り外し可能であるか、または取り外し不可能であり、磁気ディス
ク、磁気テープまたはカセット、ＣＤ−ＲＯＭ、ＤＶＤ、フラッシュメモリ、または情報
を格納するために使用することができ、コンピュータ環境１００内でアクセスできるその
他の媒体を含む。記憶装置１４０は、ビデオ符号器または復号器を実装するソフトウェア
１８０の命令を格納する。

（複数の）入力デバイス１５０は、キーボード、マウス、ペン、タッチスクリーン、ま
たはトラックボールなどの接触入力デバイス、音声入力デバイス、スキャニングデバイス
、またはコンピュータ環境１００に入力を行う他のデバイスとすることができる。オーデ
ィオまたはビデオ符号化については、（複数の）入力デバイス１５０は、サウンドカード
、ビデオカード、ＴＶチューナーカード、または、アナログもしくはデジタル形式のオー
ディオまたはビデオ入力、またはコンピュータ環境１００内にオーディオまたはビデオサ
ンプルを読み込むＣＤ−ＲＯＭ、ＣＤ−ＲＷ、またはＤＶＤのオーディオまたはビデオ入
力を受け入れる類似のデバイスとすることができる。（複数の）出力デバイス１６０は、
ディスプレイ、プリンタ、スピーカ、ＣＤもしくはＤＶＤライター、またはコンピュータ
環境１００からの出力を供給する他のデバイスとすることができる。

（複数の）通信接続１７０では、通信媒体を介して、他のコンピュータエンティティと
通信することが可能である。通信媒体は、コンピュータ実行可能命令、オーディオまたは
ビデオ入力もしくは出力、または変調データ信号内の他のデータなどの情報を伝達する。
変調データ信号は、信号内の情報を符号化する仕方でその特性のうち１つまたは複数が設
定または変更された信号である。例えば、限定はしないが、通信媒体は、電気的搬送波、
光学的搬送波、ＲＦ搬送波、赤外線搬送波、音響搬送波、またはその他の搬送波により実
装された有線または無線手法を含む。

これらの手法およびツールは、コンピュータ可読媒体の一般的な文脈において説明され
うる。コンピュータ可読媒体は、コンピュータ環境内でアクセスできる入手可能な媒体で
ある。例えば、限定はしないが、コンピュータ環境１００では、コンピュータ可読媒体は
、メモリ１２０、記憶装置１４０、通信媒体、およびこれらのどれかの組合せを含む。

これらの手法およびツールは、１つまたは複数のターゲットの実プロセッサまたは仮想
プロセッサ上のコンピュータ環境で実行される、プログラムモジュールに含まれるような
、コンピュータ実行可能命令の一般的な文脈において説明することができる。一般に、プ
ログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実装する
ルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構
造などを含む。プログラムモジュールの機能は、様々な実施形態で望まれているように、
組み合わせたり、または複数のプログラムモジュールに分割することができる。プログラ
ムモジュールのコンピュータ実行可能命令は、ローカルまたは分散コンピュータ環境内で
実行することができる。

提示するため、「発明を実施するための最良の形態」では、「符号化する」、「複合化
する」、および「選択する」のような用語を使用して、コンピュータ環境におけるコンピ
ュータの演算を説明する。これらの用語は、コンピュータにより実行される演算の高水準
の抽象化であり、人間が実行する行為と混同すべきではない。これらの用語に対応する実
際のコンピュータの演算は、実装によって異なる。

ＩＩ．例示的なビデオ符号器および復号器
図２は、いくつかの説明されている実施形態を実装できる例示的なビデオ符号器２００
のブロック図である。図３は、いくつかの説明されている実施形態を実装できる一般化さ
れたビデオ復号器３００のブロック図である。

符号器２００および復号器３００内のモジュール間に示される関係は、符号器および復
号器内の情報の一般的な流れを示し、他の関係は、単純にするため示されていない。特に
、図２および図３は、通常、ビデオシーケンス、画像、スライス、マクロブロック、ブロ
ックなどに使用される符号器設定、モード、テーブルなどを示すサイド情報を示していな
い。このようなサイド情報は、出力ビットストリームで送信され、これは、典型的には、
サイド情報のエントロピー符号化の後に実行する。出力ビットストリームの形式は、実装
によって異なりうる。

符号器２００および復号器３００は、ビデオフレーム、ビデオフィールド、またはフレ
ームとフィールドの組合せであってよい、映像を処理する。画像およびマクロブロックレ
ベルにおけるビットストリームのシンタックスおよびセマンティックスは、フレームが使
用されるのか、フィールドが使用されるのかに依存しうる。マクロブロックの編成および
全体的なタイミングにも変更が生じうる。符号器２００および復号器３００は、ブロック
ベースであり、フレームには４：２：０マクロブロック形式を使用し、それぞれのマクロ
ブロックは４つの８×８輝度ブロック（ときには、１つの１６×１６マクロブロックとし
て処理される）および２つの８×８色度ブロックを含む。フィールドについては、同じま
たは異なるマクロブロック編成および形式を使用することができる。８×８ブロックは、
さらに、異なる複数の段、例えば、周波数変換およびエントロピー符号化段で、細分され
うる。例示的なビデオフレーム編成について、以下でさらに詳しく説明する。それとは別
に、符号器２００および復号器３００は、オブジェクトベースであるか、異なるマクロブ
ロックまたはブロック形式を使用するか、または８×８ブロックおよび１６×１６マクロ
ブロックと異なるサイズまたは構成のサンプルの集合に対し演算を実行する。

実装および所望の圧縮の種類に応じて、符号器または復号器のモジュールを追加、削除
し、複数のモジュールに分割し、他のモジュールと組み合わせ、および／または類似のモ
ジュールと交換することができる。代替え実施形態では、異なるモジュールおよび／また
はモジュールの他の構成を使用する符号器または復号器は、説明されている手法の１つま
たは複数を実行する。

Ａ．ビデオフレーム編成
いくつかの実装では、符号器２００および復号器３００は、以下のように編成されたビ
デオフレームを処理する。１つのフレームは、１つのビデオ信号の数ライン分の空間情報
を含む。プログレッシブビデオスキャニング（斬新的画像読み取り）では、これらのライ
ンは同じ時刻にサンプリングされたシーンコンテンツのスナップショットを表し、フレー
ムの上部から下部へのシーンで全体を覆うサンプルを含む。プログレッシブビデオフレー
ムは、図４に示されているマクロブロック４００などの複数のマクロブロックに分割され
る。マクロブロック４００は、従来の４：２：０マクロブロック形式に従って４つの８×
８輝度ブロック（Ｙ１からＹ４まで）および４つの輝度ブロックと同一の場所に配置され
るが水平方向および垂直方向分解が半分である２つの８×８色度ブロックを含む。８×８
ブロックは、さらに、異なる複数の段、例えば、周波数変換（例えば、８×４、４×８、
または４×４ＤＣＴ）およびエントロピー符号化段で、細分されうる。プログレッシブＩ
−フレームは、イントラ符号化プログレッシブビデオフレームであるが、ただし、「イン
トラ」という用語は、他のすでに復号化されている画像のコンテンツからの予測を伴わな
い符号化方式を指す。プログレッシブＰ−フレームは、現在の画像と時間的に異なる時刻
の１つまたは複数他の画像からの予測（ときには、文脈によっては前方予測とも呼ばれる
）を使用して符号化されるプログレッシブビデオフレームであり、プログレッシブＢ−フ
レームは、いくつかの領域における複数の予測値の（場合によっては重み付け）平均を伴
うインターフレーム予測を使用して符号化されたプログレッシブビデオフレームである（
ときには、双予測または双方向予測とも呼ばれる）。プログレッシブＰ−およびＢ−フレ
ームは、イントラ符号化されたマクロブロックだけでなく様々な種類のインターフレーム
予測マクロブロックを含むことができる。

インターレースビデオフレームスキャニングは、１つのシーンの２種類のスキャンの交
互系列からなり、１つはフレームの偶数ライン（番号０、２、４などのライン）を含む、
トップフィールド（top field）と呼ばれ、もう１つはそのフレームの奇数ライン（番号
１、３、５などのライン）を含む、ボトムフィールド（bottom field）と呼ばれる。これ
ら２つのフィールドは、典型的には、２つの異なるスナップショット時刻を表す。図５Ａ
は、インターレースビデオフレーム５００の左上部分にトップフィールドおよびボトムフ
ィールドの交互ラインを含む、インターレースビデオフレーム５００の一部を示している
。

図５Ｂは、フレーム５３０として符号化／符号化用に編成された図５Ａのインターレー
スビデオフレーム５００を示している。インターレースビデオフレーム５００は、複数の
マクロブロックまたは図４に示されているような４：２：０形式を使用するマクロブロッ
ク５３１および５３２などの他のそのような複数の領域に分割されている。輝度平面内で
、それぞれのマクロブロック５３１、５３２は、合計１６本のラインについてボトムフィ
ールドからの８本のラインと交互に並ぶトップフィールドからの８本のラインを含み、そ
れぞれのラインは、１６サンプル長である。（画像を複数のマクロブロックまたは他のそ
のような領域に実際に編成すること、および輝度ブロックおよび色度ブロックをマクロブ
ロック５３１、５３２内に配置することは、示されておらず、実際には、異なる符号化決
定および異なるビデオ符号化設計について異なることがある。）与えられたマクドブロッ
ク内で、トップフィールド情報およびボトムフィールド情報は、一緒に符号化されるか、
または様々フェーズにおいて別々に符号化されうる。

インターレースＩ−フレームは、２つのフィールドを含むイントラ符号化インターレー
スビデオフレームであり、それぞれのマクロブロックは、一方または両方のフィールドに
対する情報を含む。インターレースＰ−フレームは、インターフレーム予測を使用して符
号化される２つのフィールドを含むインターレースビデオフレームであり、それぞれのマ
クロブロックは、インターレースＢ−フレームの場合のように、一方または両方のフィー
ルドに対する情報を含む。インターレースＰ−およびＢ−フレームは、イントラ符号化さ
れたマクロブロックだけでなく様々な種類のインターフレーム予測マクロブロックを含む
ことができる。

図５Ｃは、フィールド５６０として符号化／符号化用に編成された図５Ａのインターレ
ースビデオフレーム５００を示している。インターレースビデオフレーム５００の２つの
フィールドはそれぞれ、複数のマクロブロックに分割される。トップフィールドは、マク
ロブロック５６１などの複数のマクロブロックに分割され、ボトムフィールドは、マクロ
ブロック５６２などの複数のマクロブロックに分割される。（ここでもまた、マクロブロ
ックは、図４に示されているように４：２：０形式を使用し、画像を複数のマクロブロッ
クまたは他のそのような領域に編成すること、および輝度ブロックおよび色度ブロックを
複数のマクロブロック内に配置することは、図に示されておらず、異なることがある。）
輝度平面内で、マクロブロック５６１は、トップフィールドからの１６本のラインを含み
、マクロブロック５６２は、ボトムフィールドからの１６本のラインを含み、それぞれの
ラインは１６サンプル長である。

インターレースＩ−フィールドは、インターレースビデオフレームの単一の別々に表現
されたフィールドである。インターレースＰ−フィールドは、インターレースＢ−フィー
ルドのように、画像間予測（inter-picture prediction）を使用して符号化されたインタ
ーレースビデオフレームの単一の別々に表現されたフィールドである。インターレースＰ
−およびＢ−フィールドは、イントラ符号化されたマクロブロックだけでなく様々な種類
の画像間予測マクロブロックを含むことができる。

フィールドとして符号化／復号化するように編成されたインターレースビデオフレーム
は、異なるフィールドタイプの様々な組合せを含むことができる。例えば、そのようなフ
レームはトップフィールドおよびボトムフィールドの両方において同じフィールドタイプ
（Ｉ−フィールド、Ｐ−フィールド、またはＢ−フィールド）を持つか、またはそれぞれ
のフィールドにおいて異なるフィールドタイプを持つことができる。

画像という用語は、一般に、ソース、符号化または再構成された画像データのフレーム
またはフィールドを指す。プログレッシブスキャンビデオでは、画像は、典型的には、プ
ログレッシブビデオフレームである。インターレースビデオでは、画像は、文脈に応じて
、インターレースビデオフレーム、フレームのトップフィールド、またはフレームのボト
ムフィールドを指すことができる。

図５Ｄは、ビデオフレームのそれぞれのフィールドに対する輝度サンプル配置に関する
４：２：０色度サンプル配置の６つの例示的な空間的アライメントを示す。

それとは別に、符号器２００および復号器３００は、オブジェクトベースであるか、異
なるマクロブロック形式（例えば、４：２：２または４：４：４）もしくはブロック形式
を使用するか、または８×８ブロックおよび１６×１６マクロブロックと異なるサイズま
たは構成のサンプルの集合に対し演算を実行する。

Ｂ．ビデオ符号器
図２は、例示的なビデオ符号器システム２００のブロック図である。符号器システム２
００は、現在の画像２０５を含む映像のシーケンス（例えば、プログレッシブビデオフレ
ーム、インターレースビデオフレーム、またはインターレースビデオフレームのフィール
ド）を受け取り、圧縮されたビデオ情報２９５を出力として生成する。ビデオ符号器の特
定の実施形態は、典型的には、例示的な符号器２００の一変更形態または補足バージョン
を使用する。

符号器システム２００は、イントラ符号化された（イントラ）画像（Ｉ−画像）および
画像間予測画像（inter-picture predicted picture）（Ｐ−またはＢ−画像）に符号化
プロセスを使用する。提示するため、図２では、符号器システム２００を通るＩ画像に対
する経路および画像間予測画像に対する経路を示す。符号器システム２００のコンポーネ
ントの多くは、Ｉ−画像と画像間予測画像の両方を圧縮するために使用される。これらの
コンポーネントにより実行される厳密な演算は、圧縮される情報のタイプに依存し、変化
しうる。

画像間予測画像は、１つまたは複数の他の画像（典型的には参照画像と呼ばれる）から
の予測（または差）に関して表現される。予測残差は、予測されたものと元の画像との差
である。対照的に、Ｉ−画像は、他の画像を参照せずに圧縮される。Ｉ−画像では、空間
的予測または周波数領域予測（つまり、イントラ画像予測（画像内画像予測；intra-pict
ure prediction））を使用し、Ｉ−画像それ自体の他の部分からのデータを使用してＩ−
画像のいくつかの部分を予測することができる。しかし、簡単のため、このようなＩ−画
像は、この説明では、「予測」画像と呼ばれず、したがって、「予測画像」というフレー
ズは、画像間予測画像（例えば、Ｐ−またはＢ−画像）であると理解することができる。

現在の画像２０５が予測画像である場合、動き推定器２１０は、１つまたは複数の参照
画像、例えば、画像記憶部（picture store）２２０内にバッファリングされている再構
成された前の画像２２５に関して、現在の画像２０５のサンプルのマクロブロックまたは
サンプルの他の集合の動きを推定する。動き推定器（motion estimator）２１０は、１つ
または複数の時間的に前の参照画像および１つまたは複数の時間的に後の参照画像に関し
て動きを推定することができる（例えば、双予測画像（bi-predictive picture）の場合
）。したがって、符号器システム２００は、複数の参照画像に対し別々のストア２２０お
よび２２２を使用することができる。

動き推定器２１０は、完全サンプル、１／２サンプル、１／４サンプル、または他の増
分により動きを推定することができ、画像毎に、または他の基準に関して動き推定の解像
度（resolution）を切り替えることができる。動き推定器２１０（および補償器２３０）
は、さらに、フレーム毎に、または他の基準に関して、参照画像サンプル補間の種類を切
り替える（例えば、三次畳み込み補間法と双一次補間とを切り替える）こともできる。動
き推定の解像度は、水平方向および垂直方向に同じである場合も、異なる場合もある。動
き推定器２１０は、サイド情報として、差動運動ベクトル情報などの動き情報２１５を出
力する。符号器２００は、例えば、動きベクトルに対する１つまたは複数の予測因子を計
算し、動きベクトルと予測因子との差を計算し、それらの差をエントロピー符号化するこ
とにより動き情報２１５を符号化する。動きベクトルを再構成するために、動き補償器２
３０は、予測因子と動きベクトル差情報（motion vector difference information）とを
組み合わせる。

動き補償器２３０は、再構成された動きベクトルを再構成された（複数の）画像２２５
に適用して、動き補償予測２３５を形成する。しかし、予測は、めったに完全ではなく、
動き補償予測２３５と元の現在画像２０５との差が、予測残差２４５である。画像を後か
ら再構成するときに、予測残差２４５の近似が、動き補償予測２３５に加えられ、これに
より、動き補償予測２３５よりも元の現在画像２０５に近い再構成画像を得ることができ
る。しかし、不可逆圧縮では、元の現在画像２０５から一部の情報がそのまま失われる。
それとは別に、動き推定器および動き補償器は、他の種類の動き推定／補償を適用する。

周波数変換器２６０は、空間領域ビデオ情報を周波数領域（つまり、スペクトル）デー
タに変換する。ブロックベースのビデオ符号化では、周波数変換器２６０は、典型的には
、離散コサイン変換（ＤＣＴ）、ＤＣＴの一変種、または他の何らかのブロック変換をサ
ンプルデータまたは予測残差データのブロックに適用し、周波数領域変換係数のブロック
を生成する。それとは別に、周波数変換器２６０は、フーリエ変換などの他の種類の周波
数変換を適用するか、またはウェーブレットもしくはサブバンド分析を使用する。周波数
変換器２６０は、８×８、８×４、４×８、もしくは４×４または他のサイズの周波数変
換を適用することができる。

次いで、量子化器２７０は、周波数領域変換係数のブロックを量子化する。量子化器は
、画像毎に、マクロブロック毎に、または他の基準により変化する量子化ステップサイズ
に応じてスカラー量子化を変換係数に適用するが、ただし、量子化ステップサイズは、符
号器逆量子化器プロセス２７６で複製されうる復号器逆量子化器プロセスにおける離散表
現可能再構成点同士の間の一定間隔を決定する制御パラメータである。それとは別に、量
子化器は、他の種類の量子化、例えば、非一様な再構成点を持つスカラー量子化器、ベク
トル量子化器、または非適応量子化を周波数領域変換係数に適用するか、または周波数変
換を使用しない符号化システム内で空間領域データを直接量子化する。適応量子化に加え
て、符号器２００は、フレームドロッピング（frame dropping）、適応フィルタリング、
またはレート制御の他の手法を使用することができる。

再構成された現在画像がその後の動き推定／補償に必要な場合、逆量子化２７６は、量
子化された周波数領域変換係数に対し逆量子化を実行する。次いで、逆周波数変換器２６
６は、周波数変換器２６０の演算の逆を実行し、（予測された画像に対する）再構成され
た予測残差近似または再構成されたＩ−画像近似を出力する。現在画像２０５が、Ｉ−画
像であった場合、再構成されたＩ−画像近似は、再構成された現在画像近似（図に示され
ていない）とみなされる。現在画像２０５が、予測画像であった場合、再構成された予測
残差近似が、動き補償予測２３５に加えられ、再構成された現在画像近似を形成する。画
像記憶部２２０、２２２の１つまたは複数に、後続の画像の動き補償予測で参照画像とし
て使用する再構成された現在画像近似をバッファリングする。符号器は、非ブロック化フ
ィルタまたは他の画像リファイニングプロセス（画像精錬工程；picture refining proce
ss）を再構成されたフレームに適用し、画像近似を１つまたは複数の画像記憶部２２０、
２２２に格納するのに先立って不連続を適応平滑化し、画像から他のアーチファクトを除
去することができる。

エントロピー符号器２８０は、量子化器２７０の出力とともに、特定のサイド情報（例
えば、動き情報２１５、量子化ステップサイズ）を圧縮する。典型的なエントロピー符号
化手法は、算術符号化、差分符号化、ハフマン符号化、ランレングス符号化、Ｌｅｍｐｅ
ｌ−Ｚｉｖ符号化、辞書符号化、およびこれらの組合せを含む。エントロピー符号器２８
０は、典型的には、異なる種類の情報（例えば、低周波係数、高周波係数、ゼロ周波数係
数、異なる種類のサイド情報）に対し異なる符号化手法を使用し、特定の符号化手法の範
囲内の複数のコード表の中から選択することができる。

エントロピー符号器２８０は、圧縮ビデオ情報２９５をマルチプレクサ［「ＭＵＸ」］
２９０に供給する。ＭＵＸ２９０は、バッファを備えることができ、バッファ充足レベ
ルインジケータをレート制御のためビットレート適応モジュールにフィードバックするこ
とができる。ＭＵＸ２９０の前または後に、圧縮ビデオ情報２９０は、ネットワークに
よる伝送用に通信路符号化することができる。通信路符号化は、誤り検出および補正デー
タを圧縮ビデオ情報２９５に適用することができる。

Ｃ．ビデオ復号器
図３は、例示的なビデオ復号器システム３００のブロック図である。復号器システム３
００は、圧縮された映像シーケンスに対する情報３９５を受信し、再構成された画像３０
５を含む出力を生成する（例えば、プログレッシブビデオフレーム、インターレースビデ
オフレーム、またはインターレースビデオフレームのフィールド）。ビデオ復号器の特定
の実施形態は、典型的には、一般化された復号器３００の一変更形態または補足バージョ
ンを使用する。

復号器システム３００は、予測画像およびＩ−画像を圧縮解除する。提示のため、図３
では、復号器システム３００を通るＩ−画像に対する経路および予測画像に対する経路を
示す。復号器システム３００のコンポーネントの多くは、Ｉ−画像と予測画像の両方を圧
縮解除するために使用される。これらのコンポーネントにより実行される厳密な演算は、
圧縮解除される情報のタイプに依存し、変化しうる。

ＤＥＭＵＸ３９０は、圧縮されたビデオシーケンスに対する情報３９５を受け取り、
受け取った情報をエントロピー復号器３８０に供給する。ＤＥＭＵＸ３９０は、ジッタ
バッファおよび他のバッファも備えることができる。ＤＥＭＵＸ３９０の前、またはそ
の中で、圧縮されたビデオ情報を通信路復号化し、誤り検出および訂正のため処理するこ
とができる。

エントロピー復号器３８０は、エントロピー復号化された量子化データだけでなく、エ
ントロピー符号化されたサイド情報（例えば、動き情報３１５、量子化ステップサイズ）
をエントロピー復号化し、典型的には、符号器内で実行されるエントロピー符号化の逆演
算を適用する。エントロピー復号化手法は、算術復号化、差分復号化、ハフマン復号化、
ランレングス復号化、Ｌｅｍｐｅｌ−Ｚｉｖ復号化、辞書復号化、およびこれらの組合せ
を含む。エントロピー復号器３８０は、典型的には、異なる種類の情報（例えば、低周波
係数、高周波係数、ゼロ周波数係数、異なる種類のサイド情報）に対し異なる復号化手法
を使用し、特定の復号化手法の範囲内の複数のコード表の中から選択することができる。

復号器３００は、例えば、動きベクトルに対し１つまたは複数の予測因子を計算し、動
きベクトル差をエントロピー復号化し（エントロピー復号器３８０で）、復号化された動
きベクトル差と予測因子と組み合わせて動きベクトルを再構成することにより動き情報３
１５を復号化する。

動き補償器３３０は、動き情報３１５を１つまたは複数の参照画像３２５に適用して、
再構成される画像３０５の予測３３５を形成する。例えば、動き補償器３３０は、１つま
たは複数のマクロブロック動きベクトルを使用して、サンプルのブロックを見つけるか、
または（複数の）参照画像３２５内のサンプル間の分数位置を補間する。１つまたは複数
の画像記憶部（例えば、画像記憶部３２０、３２２）では、参照画像として使用するため
に、前の再構成された画像を格納する。典型的には、Ｂ−画像は、複数の参照画像（例え
ば、少なくとも１つの時間的に前の参照画像および少なくとも１つの時間的に後の参照画
像）を有する。したがって、復号器システム３００は、複数の参照画像に対し別々の画像
記憶部３２０および３２２を使用することができる。動き推定器３３０は、完全サンプル
、１／２サンプル、１／４サンプル、または他の増分で動きを補償することができ、画像
毎に、または他の基準に関して動き補償の解像度を切り替えることができる。動き補償器
３３０は、さらに、フレーム毎に、または他の基準に関して、参照画像サンプル補間の種
類を切り替える（例えば、三次畳み込み補間法と双一次補間とを切り替える）こともでき
る。動き補償の解像度は、水平方向および垂直方向に同じである場合も、異なる場合もあ
る。それとは別に、動き補償器は、他の種類の動き補償を適用する。動き補償器による予
測は、めったに完全ではなく、したがって、復号器３００は、さらに、予測残差を再構成
する。

逆量子化器３７０は、エントロピー復号化データを逆量子化する。典型的には、逆量子
化は、画像毎に、マクロブロック毎に、または他の何らかの基準に関して変化する再構成
ステップサイズにより均一スカラー逆量子化をエントロピー復号化データに適用する。そ
れとは別に、逆量子化器は、他の種類の逆量子化、例えば、不均一、ベクトル、または非
適応逆量子化をデータに適用するか、または逆周波数変換を使用しない復号器システム内
の空間領域データを直接逆量子化する。

逆周波数変換器３６０は、逆量子化された周波数領域変換係数を空間領域ビデオ情報に
変換する。ブロックベース映像では、逆周波数変換器３６０は、逆ＤＣＴ［「ＩＤＣＴ」
］、ＩＤＣＴの一変種、または他の何らかの逆ブロック変換を周波数変換係数のブロック
に適用し、それぞれＩ−画像または予測画像に対するサンプルデータまたは画像間予測残
差データを生成する。それとは別に、逆周波数変換器３６０は、逆フーリエ変換などの他
の種類の逆周波数変換を適用するか、またはウェーブレットもしくはサブバンド合成を使
用する。逆周波数変換器３６０は、８×８、８×４、４×８、４×４、または他のサイズ
の逆周波数変換を適用することができる。

予測画像に対して、復号器３００は、再構成された予測残差３４５と動き補償予測３３
５とを組み合わせて、再構成された画像３０５を形成する。復号器が、後の動き補償のた
め再構成された画像３０５を必要とする場合、それらの画像記憶部の１つまたは複数（例
えば、画像記憶部３２０）に、次の画像を予測する際に使用する再構成された画像３０５
をバッファリングする。いくつかの実施形態では、復号器３００は、非ブロック化フィル
タまたは他の画像リファイニングプロセスを再構成された画像に適用し、再構成された画
像３０５を画像記憶部（例えば、画像記憶部３２０）の１つまたは複数に格納するのに先
立って、または復号化されたビデオの再生時に復号化された画像を表示するのに先立って
、不連続を適応平滑化し、画像から他のアーチファクトを除去する。

ＩＩＩ．多重解像度符号化および復号化の概要
ビデオは、異なる解像度で符号化され（復号化され）うる。この説明のために、多重解
像度符号化および復号化をフレームベースの符号化および復号化（例えば、参照画像再サ
ンプリング）または階層化（ときには、空間的スケーラブルとも呼ばれる）符号化および
復号化として説明することができる。多重解像度符号化および複合化は、さらに、インタ
ーレースビデオおよびフィールドベースの符号化および復号化、ならびに分解特有の基準
に基づき、または他の何らかの基準に従って、フレームベースの符号化および復号化とフ
ィールドベースの符号化および復号化とを切り替えることを伴うこともありうる。しかし
、プログレッシブビデオのフレーム符号化については、概念の説明を簡素化することを目
的としてこの概要において説明する。

Ａ．フレームベースの多重解像度符号化および復号化
フレームベースの多重解像度符号化では、符号器は、異なる解像度で入力画像を符号化
する。符号器は、画像毎に、または他の何らかの基準に従って画像に対する空間解像度を
選択する。例えば、参照画像再サンプリングでは、参照画像は、符号化される画像の解像
度と異なる解像度で符号化される場合に再サンプリングされうる。再サンプリングという
用語は、サンプリングされた信号の画像領域または他の何らかのセクションを表すために
使用されるサンプルの数を増やす（アップサンプリング）または減らす（ダウンサンプリ
ング）ことを説明するために使用される。単位面積当たり、または信号セクション毎のサ
ンプルの数は、サンプリングの解像度と呼ばれる。

空間解像度は、例えば、利用可能なビットレートの増減、量子化ステップサイズの増減
、入力ビデオコンテンツ内の動きの量の増減、ビデオコンテンツの他の特性（例えば、強
いエッジ、テキスト、低解像度で著しく歪みことがある他のコンテンツの存在）、または
他の何らかの基準に基づいて選択できる。空間解像度は、垂直、水平、または垂直と水平
の両方の次元で変化しうる。水平解像度は、垂直解像度と同じ場合もあれば、異なる場合
もある。復号器は、相補的手法を使用して符号化されたフレームを復号化する。

符号器が、現在画像または現在画像内の領域に対する空間解像度を選択すると、符号器
は、符号化する前に所望の解像度に合わせて元の画像を再サンプリングする。次いで、符
号器は、空間解像度の選択結果を復号器に信号で伝えることができる。

図６は、画像のフレームベースの多重解像度符号化の手法（６００）を示す。図２の符
号器２００などの符号器は、画像に対する解像度（６１０）を設定する。例えば、符号器
は、上記の基準または他の基準を考慮する。次いで、符号器は、その解像度で画像（６２
０）を符号化する。符号化すべきすべての画像の符号化が完了したら（６３０）、符号器
は終了する。完了しなかった場合、符号器は、次の画像に対し解像度（６１０）を設定し
、符号化を続ける。それとは別に、符号器は、画像の異なる部分に対し異なる形で解像度
を設定する、または画像のグループまたは画像のシーケンスに対し解像度の選択を行うな
ど、画像レベルと異なる何らかのレベルで解像度を設定する。

符号器は、予測画像だけでなくイントラ画像も符号化することができる。図８は、イン
トラ画像および画像間予測画像のフレームベースの多重解像度符号化の手法（８００）を
示す。第１に、符号器は、符号化すべき現在画像がイントラ画像であるか、または予測画
像であるかを８１０でチェックする。現在画像が、イントラ画像である場合、符号器は、
８２０で現在画像に対する解像度を設定する。画像が予測画像である場合、符号器は、現
在画像に対する解像度を設定する前に８３０で参照画像に対する解像度を設定する。現在
画像に対する解像度を設定した後、符号器は、その解像度で現在画像（８４０）を符号化
する。画像に対する解像度を設定することは（現在ソース画像または格納されている参照
画像かに関係なく）、選択された解像度と一致する画像を再サンプリングすることを伴い
、また信号を符号化して選択された解像度を復号器に指示することを伴うことがある。符
号化すべきすべての画像の符号化が完了したら（８５０）、符号器は終了する。そうでな
ければ、符号器は、追加の画像を符号化することを続ける。それとは別に、符号器は、予
測画像を異なる方法で取り扱う。

復号器は、符号化された画像を復号化し、必要ならば、表示する前に画像を再サンプリ
ングする。符号化された画像の解像度のように、復号化された画像の解像度も、多くの異
なる方法で調節することができる。例えば、復号化された画像の解像度は、出力表示デバ
イスの解像度または出力表示デバイスの一領域の解像度に合うように調節することができ
る（例えば、「ピクチャインピクチャ」またはＰＣデスクトップウィンドウ表示に対し）
。

図７は、画像のフレームベースの多重解像度復号化の手法（７００）を示す。図３の復
号器３００などの復号器は、画像に対する解像度（７１０で）を設定する。例えば、復号
器は、符号器から解像度情報を取得する。次いで、復号器は、その解像度で画像（７２０
）を復号化する。復号化すべきすべての画像の復号化が完了したら（７３０）、復号器は
終了する。完了しなかった場合、復号器は、次の画像に対し解像度（７１０）を設定し、
復号化を続ける。それとは別に、復号器は、画像レベルと異なる何らかのレベルに解像度
を設定する。

復号器は、予測画像だけでなくイントラ画像も復号化することができる。図９は、イン
トラ画像および予測画像のフレームベースの多重解像度復号化の手法（９００）を示す。

第１に、復号器は、復号化すべき現在フレームがイントラ画像であるか、または予測画
像であるかをチェックする（９１０）。現在画像が、イントラ画像である場合、復号器は
、現在画像に対する解像度を設定する（９２０）。画像が予測画像である場合、復号器は
、現在画像に対する解像度を設定する（９２０）前に参照画像（９３０）に対する解像度
を設定する。参照画像の解像度を設定することは、選択された解像度に一致するように格
納されている参照画像を再サンプリングすることを伴いうる。現在画像（９２０）に対す
る解像度を設定した後、復号器は、その解像度で現在画像（９４０）を符号化する。復号
化すべきすべての画像の復号化が完了したら（９５０）、復号器は終了する。そうでない
場合、復号器は、復号化を続ける。

復号器は、典型的には、符号器で使用されるのと同じ解像度で画像を復号化する。それ
とは別に、復号器は、復号器で利用できる解像度が符号器内で使用されるのとまったく同
じではないときなど、異なる解像度で画像を復号化する。

Ｂ．階層化多重解像度符号化および復号化
階層化多重解像度符号化では、符号器は、ビデオをレイヤで符号化し、それぞれのレイ
ヤは異なる解像度でビデオを復号化するための情報を含む。このようにして、符号器は、
複数の解像度でビデオ内の少なくとも一部の個別画像を符号化する。次いで、復号器は、
レイヤの異なる組合せを処理することにより１つまたは複数の解像度でビデオを復号化す
ることができる。例えば、第１のレイヤ（ときには、ベースレイヤとも呼ばれる）は、低
解像度でビデオを復号化するための情報を含むが、１つまたは複数の他のレイヤ（ときに
は、エンハンスメントレイヤとも呼ばれる）は、高解像度でビデオを復号化するための情
報を含む。

ベースレイヤは、それ自体独立に復号化可能なビットストリームとなるように設計され
うる。したがって、このような設計では、ベースレイヤのみを復号化する復号器は、ベー
スレイヤの低解像度の有効な復号化されたビットストリームを生成する。エンハンスメン
トレイヤを使用して高解像度画像を適切に復号化するには、さらに、符号化されたベース
レイヤデータおよび場合によっては１つまたは複数のエンハンスメントレイヤの一部また
は全部を復号化する必要がある場合がある。ベースレイヤおよび１つまたは複数の他の高
解像度のレイヤを復号化する復号器は、ベースレイヤのみを復号化する復号器よりも高い
解像度のコンテンツを生成することができる。２つ、３つ、またはそれ以上のレイヤを使
用することにより、２つ、３つ、またはそれ以上の異なる解像度を利用することができる
。それとは別に、高解像度のレイヤは、それ自体も、独立に復号化可能なビットストリー
ムとなりうる。（このような設計は、サイマルキャスト（同時放送、サーマル放送；simu
lcast）多重解像度符号化アプローチと呼ばれることが多い。）

図１０は、異なる解像度で復号化できるようにビットストリームレイヤを符号化する手
法（１０００）を示す。図２の符号器２００などの符号器は、入力（１０１０）として最
大解像度（full-resolution）のビデオ情報をとる。符号器は、最大解像度のビデオ情報
（１０２０）をダウンサンプリングし、ダウンサンプリングされた情報（１０３０）を使
用してベースレイヤを符号化する。符号器は、ベースレイヤおよび高解像度のビデオ情報
（１０４０）を使用して１つまたは複数の高解像度のレイヤを符号化する。高解像度のレ
イヤは、最大解像度で復号化することを許すレイヤ、または何らかの中間解像度で復号化
することを許すレイヤとすることができる。次いで、符号器は、符号化されたレイヤのも
う２つを含む階層化ビットストリームを出力する。それとは別に、高解像度のレイヤ（１
０４０）の符号化では、ベースレイヤ情報を使用することができず、したがって、サイマ
ルキャスト多重解像度符号化アプローチについては高解像度のレイヤデータを独立に復号
化することができる。

符号器は、図１０に示されている基本アウトラインに従って複数の方法で多重解像度レ
イヤ符号化を実行することができる。詳細については、特許文献１またはＭＰＥＧ−２標
準もしくは他のビデオ標準を参照のこと。

図１１は、異なる解像度でビデオを復号化できるようにビットストリームレイヤを復号
化する手法（１１００）を示す。図３の復号器３００などの復号器は、入力（１１１０）
として階層化ビットストリームをとる。レイヤは、低解像度のレイヤ（ベースレイヤ）、
および高解像度の情報を含む１つまたは複数のレイヤを含む。高解像度のレイヤは、独立
に符号化された画像を含む必要はなく、典型的には、高解像度のレイヤは、画像の高解像
度のバージョンと低解像度のバージョンとの差を記述する残差情報を含む。復号器は、ベ
ースレイヤ（１１２０）を復号化し、高解像度の復号化が望まれている場合、復号器は、
復号化されたベースレイヤ画像（１１３０）を所望の解像度に合わせてアップサンプリン
グする。復号器は、１つまたは複数の高解像度のレイヤ（１１４０）を復号化し、復号化
された高解像度の情報をアップサンプリングされ復号化されたベースレイヤ画像と組み合
わせて、高解像度の画像（１１５０）を形成する。所望の解像度をレベルに応じて、高解
像度の画像は、最大解像度の画像または中間解像度の画像とすることができる。詳細につ
いては、特許文献１またはＭＰＥＧ−２標準もしくは他のビデオ標準を参照のこと。

復号器は、典型的には、符号器で使用される解像度のうちの１つで画像を復号化する。
それとは別に、復号器に利用可能な解像度は、符号器で使用されるのとまったく同じでは
ない。

ＩＶ．スケーラブルなビデオ符号化および復号化用の再サンプリングフィルタ
この節では、スケーラブルなビデオ符号化および復号化用の手法およびツールについて
説明する。いくつかの説明されている手法およびツールは、階層化（または空間的スケー
ラブルな）文脈において説明されるが、いくつかの説明されている手法およびツールは、
フレームベースの（または参照画像サンプリングの）文脈において、または再サンプリン
グフィルタを伴う他の何らかの文脈において使用されうる。さらに、いくつかの説明され
ている手法およびツールが再サンプリング画像の文脈において説明されているが、いくつ
かの説明されている手法およびツールは、さらに、高解像度の信号の予測から結果として
得られる残差または差信号を再サンプリングするために使用されうる。

スケーラブルなビデオ符号化（ＳＶＣ）は、より大きなビットストリームの部分集合を
復号化して、一部のアプリケーションに対し許容可能な品質の復号化された画像を生成す
ることを可能にするデジタルビデオ符号化の一種である（ただし、このような画質は、高
ビットレートのビットストリーム全体を復号化することにより生成される画質よりも低い
ものとなる）。ＳＶＣの種類によって知られているものは、空間スケーラビリティまたは
解像度スケーラビリティと呼ばれる。空間ＳＶＣ設計では、符号化プロセス（または、符
号化プロセスの範囲の正確な定義に応じて、符号化プロセスに先立って実行される前処理
機能）は、典型的には、ビデオを低解像度にダウンサンプリングして低解像度の復号化プ
ロセスを使用できるようにその低解像度のビデオを符号化することと、高解像度のビデオ
の画像内のサンプルの値の予測として使用するため低解像度の符号化された画像をアップ
サンプリングすることとを含む。次いで、高解像度のビデオの復号化プロセスは、低解像
度のビデオ（またはその一部）を復号化することと、そのアップサンプリングされたビデ
オを高解像度のビデオの画像内のサンプルの値の予測として使用することとを含む。この
ような設計では、再サンプリングフィルタを使用する必要がある。特に、コーデック設計
は、復号器と符号器の両方においてアップサンプリングフィルタを使用することと、符号
器または符号化プリプロセッサでダウンサンプリングフィルタを使用することとを含む。
ここでは、特に、このような設計で使用されるアップサンプリングフィルタを重点的に取
りあげる。典型的には、アップサンプリングプロセスは、符号器と復号器において同一と
なるように設計され、これにより、符号化および復号化の際に同じ信号の異なる予測を使
用することに引き起こされる誤差の蓄積であるドリフトと呼ばれる現象を防ぐ。

いくつかの空間ＳＶＣ設計の欠点の１つは、復号化プロセスで低品質のフィルタ（例え
ば、２タップ双線形フィルタ）を使用することである。高品質のフィルタを使用すると、
ビデオ画質には有利である。

空間ＳＶＣは、フィルタの再サンプリング比における柔軟性を高めることができる再サ
ンプリングフィルタを含むことができる。しかし、これは、このようなフィルタのそれぞ
れの異なる「フェーズ」に対する多数の特定のフィルタ設計を開発し、これらのフィルタ
の「タップ」値を符号器および復号器の実装内に格納する必要がある場合がある。

さらに、符号器が空間ＳＶＣに使用される再サンプリングフィルタのぼけの量を制御で
きることは、ビデオ画質にとって有益であると思われる。したがって、アップサンプリン
グまたはダウンサンプリング用に設計される再サンプリングのそれぞれの「フェーズ」に
ついて、プロセスに入り込むぼけの所望の程度に応じて、選択対象となる異なるフィルタ
をいくつか用意すると都合がよいであろう。アップサンプリングの際に実行されるぼけの
程度の選択結果は、復号化プロセスで使用するために伝達される情報として符号器から復
号器に送られうる。このさらなる柔軟性により、設計の複雑度が増し、符号器または復号
器に格納される必要があるかもしれない必要なタップ値の数が大幅に増える。

統一された設計を使用することで、様々なフェーズおよびぼけの様々な程度を有する様
々な再サンプリングフィルタを指定することが可能であろう。可能な解決手段の１つは、
Ｍｉｔｃｈｅｌｌ−Ｎｅｔｒａｖａｌｉフィルタ設計法の使用である。これらの問題にＭ
ｉｔｃｈｅｌｌ−Ｎｅｔｒａｖａｌｉフィルタ設計法を直接適用する場合、符号器または
復号器において計算されるべき量に対し可能な値の過剰なダイナミックレンジの形で過剰
な計算資源を必要とすることがある。例えば、このような設計の１つでは、汎用ＣＰＵお
よびＤＳＰで通常使用される１６ビットまたは３２ビット処理要素ではなく、４５ビット
算術演算処理を使用する必要がある場合もある。このような問題に対処するために、設計
に対しいくつか改良を加える。

典型的なＳＶＣ設計では、空間スケーラビリティに対し標準アップサンプリングフィル
タを必要とする。任意の再サンプリング比（拡張空間スケーラビリティと呼ばれる特徴）
をサポートするために、再サンプリング比に関する大きな柔軟性を組み込んだアップサン
プリングフィルタ設計について説明する。他の重要な態様は、輝度および色度の相対的ア
ライメントである。様々なアライメント構造（例えば、４：２：０色度に対するＨ．２６
１／ＭＰＥＧ−１対ＭＰＥＧ−２のアライメント、およびＨ．２６４／ＭＰＥＧ−４Ａ
ＶＣ）が、単一レイヤアプローチに見つかるので、説明されている手法およびツールは、
柔軟性の高い様々なアライメントをサポートし、符号器がフィルタリングを適宜適用する
方法を復号器に示す簡単な方法となっている。

説明されている手法およびツールは、高品質のアップサンプリングと良好なアンチエイ
リアシングを実行できるアップサンプリングフィルタを含む。特に、説明されている手法
およびツールは、空間スケーラビリティに対する前の双線形フィルタ設計により実現され
たものを超える品質を有する。説明されている手法およびツールは、見栄えよくするだけ
でなく、良好な信号処理周波数挙動をもたらす高品質アップサンプリングフィルタを有す
る。説明されている手法およびツールは、簡単に指定でき、タップ値を保持する大きな記
憶域をとるテーブルを必要としないフィルタ設計を含み、フィルタリング演算それ自体は
、計算動作が単純である。例えば、説明されている手法およびツールは、過剰に冗長であ
るということのない、過剰な数学的精度または過剰に複雑な数学的関数を必要としないフ
ィルタを有する。

この節では、以下の特報のうちの１つまたは複数を有する設計について説明する。

− 輝度／色度フェーズアライメントの柔軟性、
− 再サンプリング比の柔軟性、
− 周波数特性の柔軟性、
− 高い視覚的品質、
− フィルタタップが少なすぎも、多すぎもしない（例えば、４から６の範囲）、
− 指定するのが簡単、
− 動作が単純（例えば、実用的なワード長の算術演算を使用する）。

Ａ．Ｍｉｔｃｈｅｌｌ−Ｎｅｔｒａｖａｌｉアップサンプリングフィルタ
説明されている手法およびツールは、分離可能フィルタリングアプローチを採用する−
したがって、以下の説明では、一次元信号の処理に主に注目するが、それは、二次元の場
合は、一次元の場合の単純な分離可能な応用だからである。最初に、

により与えられる概念的連続的インパルス応答ｈ（ｘ）に基づくフィルタの２パラメータ
集合を提案するが、だたし、ｂおよびｃは、２つのパラメータである。相対的フェーズオ
フセット位置０≦ｘ＜１について、このカーネルは、行列の式

により与えられるタップの値を持つ４タップ有限インパルス応答（ＦＩＲ）フィルタを生
成する。

実際には、ｘに対するＦＩＲフィルタカーネルは、単に、逆順の１−ｘに対するＦＩＲ
フィルタカーネルであるため、０から１／２までのｘの範囲のみを考えるだけで十分であ
る。

この設計は、多数の興味深い、有用な特性を有する。以下にそのいくつかを示す。

− フィルタタップ値を計算するのに三角関数、超越関数、または無理数処理を必要と
しない。実際、このようなフィルタに対するタップ値は、ごく少数の単純な演算で直接計
算できる。使用すべきパラメータおよびフェーズの様々な可能な値に対し格納しておく必
要はなく、必要になったら、単に計算するだけでよい。（したがって、このようなフィル
タの使用を標準化するために、少数の公式があればよい−コサインまたはベッセル関数な
どの関数を近似する巨大な数表または標準化された試行を必要としない。）
− その結果得られるフィルタは、４つのタップを有する。これは、非常に実用的な数
である。
− フィルタは、メインローブのそれぞれの側に単一のサイドローブのみを有する。し
たがって、過剰なリンギングアーチファクト（ringing artifact）を発生しない。
− フィルタは、平滑化されたインパルス応答を有する。その値およびその一次導関数
は、両方とも連続である。
− 利得１のＤＣ応答を有するが、これは、アップサンプリングされる情報内に全体的
な輝度増幅または減衰がないことを意味する。
− このフィルタファミリのメンバは、「Ｌａｎｃｚｏｓ−２」設計および「Ｃａｔｍ
ｕｌｌ−Ｒｏｍ」設計などのよく知られているよいフィルタの比較的良好な近似を含む。

さらに、説明されている手法およびツールは、見栄えよくするフィルタの選択に関する
２つのパラメータの間の特定の関係を含む。この関係は、

のように表すことができる。

これにより、自由度は単一帯域幅制御パラメータｂに下げられる。このパラメータは、
フィルタにより持ち込まれる付加的なぼけの程度を制御する。値ｂ＝０に関連するこのフ
ィルタファミリのメンバは、優秀な、よく知られているＣａｔｍｕｌｌ−Ｒｏｍアップサ
ンプリングフィルタ（Ｋｅｙｓ「三次畳み込み」補間フィルタとも呼ばれる）であること
に留意されたい。

Ｃａｔｍｕｌｌ−Ｒｏｍアップサンプリングフィルタは、Ｍｉｔｃｈｅｌｌ−Ｎｅｔｒ
ａｖａｌｉフィルタファミリのすべてのメンバについて見られる基本的な利点に加えて、
それ自体良好な特性を多数有する。

− これは、「補間」フィルタである、−つまり、フェーズ値ｘ＝０およびｘ＝１に対
し、フィルタは、１に等しい単一の非ゼロタップを有する。言い換えると、アップサンプ
リングされた信号は、それぞれのアップサンプリングされた曲線セグメントのエッジにお
ける入力サンプルの値を正確に通る。
− 入力サンプルの集合が、放物線（または直線、もしくは静的値）を形成すると、出
力点は、正確に放物線（または直線もしくは静的値）上に載る。

実際、いくつかの点で、Ｃａｔｍｕｌｌ−Ｒｏｍアップサンプラーは、これらの理由か
らこの長さの最良のアップサンプリングフィルタであると考えることができる−ただし、
何らかのよけいなぼけを持ち込む（ｂの増大）と、ときには、見栄えよいものとなる可能
性がある。さらに、ある程度のよけいなぼけを持ち込むことで、低ビットレート圧縮アー
チファクトをぼけさせることができ、そのため、真のアップサンプリングされた画像Ｗｉ
ｅｎｅｒフィルタ（ノイズフィルタリングに使用されるよく知られているフィルタ）推定
器により似た挙動を示す。

式（３）を式（２）に単位代入するだけで、タップ値

が得られる。

９人のエキスパート視聴者と５００を超えるサンプルによる主観テストに基づき以下が
報告された。

− 使用可能な範囲は、０≦ｂ≦５／３として報告される、
− ０≦ｂ≦１／２は、視覚的に「満足」のゆくものとして分類され、ｂ＝１／３は、
見栄えをよくするものとして報告される、
− ｂ＞１／２は、「ぼけ」として分類され、ｂ＝３／２は、過剰にぼけているとして
報告される、

Ｂ．帯域幅制御パラメータの整数化
式（４）において６で除算することは、望ましくない場合がある。その代わりに、無限
精度は復号器設計の一部として実用的でないので、帯域幅制御パラメータおよびフィルタ
タップ値を整数化することが望ましい場合がある。新しい整数値変数として
ａ＝（ｂ／６）＊２^Ｓ（５）
で定義されたａを使用する代入を考えるが、
ただし、Ｓは、整数シフト係数であり、ａは、整数化帯域幅制御パラメータとして作用
する符号なし整数である。パラメータａは、ビットストリーム内のビデオシーケンスレベ
ルで符号器によりシンタックス要素として符号化されうる。例えば、パラメータａは、可
変長または固定長のコードで明示的に符号化されるか、または他の情報と一緒に符号化さ
れるか、または明示的に信号で伝達されうる。それとは別に、パラメータａは、ビットス
トリーム内の他の何らかのレベルで信号で伝達される。

整数化の結果、整数化タップ値は

となる。

次いで、この結果は、２進演算処理においてＳ位置だけスケールダウンされる必要があ
る。

ａの範囲が０からＭまでである場合、ｂの範囲は０から６＊Ｍ／２^Ｓまでである。Ｍに
対する可能ないくつかの有益な選択は、以下のとおりである。
− Ｍ＝２^{（Ｓ−２）}−１、この結果ｂの範囲は０から３／２−６／２^Ｓまでである。
− Ｍ＝Ｃｅｉｌ（２^Ｓ／６）、２^Ｓ／６以上の最小の整数を返し、その結果ｂの範囲
は０から１よりも少し大きい値までとなる。
− Ｍ＝２^{（Ｓ−３）}−１、この結果ｂの近似的範囲は０から３／４−６／２^Ｓまでと
なる。

Ｍに対するこれらの選択は、最も有用な場合を十分にカバーできるくらい広く、最初の
選択（Ｍ＝２^{（Ｓ−２）}−１）は３つの選択のうちの大きい方である。Ｓに対する有用な
範囲は、６から８までである。

例えば、Ｓ＝７およびＭ＝２^{（Ｓ−２）}−１、つまりＭ＝３１を考える。それとは別に
、ＭおよびＳの他の値を使用することができる。

Ｃ．分数サンプル位置決めの整数化
次に、ｘの値の粒度を考える。実用上は、ｘも近似すべきである。例えば、整数ｉを、
ｘ＝ｉ÷２^Ｆ（７）
と定義することができる。

ただし、Ｆは、サポートされている分数サンプル位置精度を表す。十分に精度のある再
サンプリング演算の一実施例では、Ｆ≧４（１／１６以上のサンプル位置決め精度）を考
える。この結果、整数化されたフィルタタップ値

が得られる。

例えば、Ｆ＝４を考える。次いで、結果を、３Ｆ＋Ｓ位置だけスケールダウンされる必
要がある。

上記の行列内のすべてのエントリは、係数２を共通に含む（Ｓは、１より大きいと仮定
する）ことに留意されたい。そこで、代わりに、タップ値を

のように公式化することができる。

ただし、タップ値はそれぞれ、２で除算されている。次いで、結果を、３Ｆ＋Ｓ−１位
置だけスケールダウンされる必要がある。

ダウンスケーリングでは、関数ＲｏｕｎｄｉｎｇＲｉｇｈｔＳｈｉｆｔ（ｐ，Ｒ）を、

として計算される入力値ｐについて計算されたＲビットの右シフト（丸めあり）の出力と
して定義する。

ただし、表記「＞＞」は、２の補数の２進演算を使用する２進演算右シフト演算子であ
る。それとは別に、丸め右シフトは、異なる形で実行される。

丸め右シフトに対するいくつかの例示的アプリケーションを以下に示す。

Ｄ．ダイナミックレンジの考慮事項
サンプルビット深度のＮビットで画像をフィルタリングし、丸めの実行前に二次元でそ
うする場合、２＊（３Ｆ＋Ｓ−１）位置だけ結果をダウンシフトし、出力をＮビット範囲
にクリップする前にアキュムレータ内にダイナミックレンジの２＊（３Ｆ＋Ｓ−１）＋Ｎ
＋１ビットが入っている必要がある。例えば、Ｆ＝４、Ｓ＝７、およびＮ＝８であるとす
ると、フィルタリングされた結果を計算するために４５ビットアキュムレータを使用する
必要がある場合がある。

以下の節では、この問題を軽減するいくつかのアプローチについて説明する。これらの
アプローチは、別々に、または互いに組み合わせて使用することができる。本明細書の説
明に基づき、説明されているダイナミックレンジ軽減アプローチのいくつかの変更形態が
可能であることは理解されるであろう。

１．第１の例示的なダイナミックレンジ軽減アプローチ
水平フィルタリングが最初に実行され、続いて垂直フィルタリングが実行される実施例
を考察する。二次元処理パイプライン内の任意の点に対し最大ワード長Ｗビットを考える
。第１のダイナミックレンジ軽減アプローチでは、フィルタリングを実行するために、プ
ロセスの第１（水平）段の出力でＲ_Ｈビットの丸め右シフトを、プロセスの第２の（垂直
）段の出力でＲ_Ｖビットの丸め右シフトを使用する。

そこで、
２＊（３Ｆ＋Ｓ−１）＋Ｎ＋１−Ｒ_Ｈ＝Ｗ（１１）
を計算することができ、したがって
Ｒ_Ｈ＝２＊（３Ｆ＋Ｓ−１）＋Ｎ＋１−Ｗ（１２）
となる。

次いで、第２（垂直）段に対する右シフトを、
Ｒ_Ｈ＋Ｒ_Ｖ＝２＊（３Ｆ＋Ｓ−１）（１３）
から計算することができ、したがって
Ｒ_Ｖ＝２＊（３Ｆ＋Ｓ−１）−Ｒ_Ｈ（１４）
となる。

例えば、Ｆ＝４およびＳ＝７ならびにＮ＝８およびＷ＝３２について、Ｒ_Ｈ＝１３およ
びＲ_Ｖ＝２３が得られる。したがって、ダイナミックレンジの４５ビットの代わりに、丸
め右シフトを使用すると、ダイナミックレンジは、３２ビットに縮小される。ビットの異
なる数の右シフトを、Ｗの異なる値に対し使用することができる。

２．第２の例示的なダイナミックレンジ軽減アプローチ
第２のダイナミックレンジ軽減アプローチは、フェーズ位置決めの精度を減らす（つま
り、Ｆを小さくする）、フィルタ帯域幅調節パラメータの粒度を下げる（つまり、Ｓを小
さくする）、または第１の段の出力の精度を下げる（つまり、Ｒ_Ｈを高くする）のではな
く、タップ値の精度を減らすことを伴う。

式（９）により生成される４つの整数タップ値を［ｔ_−１，ｔ_０，ｔ_１，ｔ_２］で表す
。４つのフィルタタップ値の合計は、２^{３Ｆ＋Ｓ−１}に等しくなる、つまり、
ｔ_−１＋ｔ_０＋ｔ_１＋ｔ_２＝２^{３Ｆ＋Ｓ−１} （１５）
となることに留意されたい。

これは、４つの入力サンプルのすべてが同じ値を持つ場合には必ず、出力はその同じ値
を持つため、この例示的なダイナミックレンジ軽減アプローチの重要な特性である。

式（１０）にある丸め右シフトの例示的な定義を使用し、タップ値に対し右シフト量Ｒ
_ｔを与えて、以下の式を定義する。
ｕ_−１＝ＲｏｕｎｄｉｎｇＲｉｇｈｔＳｈｉｆｔ（ｔ_−１，Ｒ_ｔ）、
ｕ_１＝ＲｏｕｎｄｉｎｇＲｉｇｈｔＳｈｉｆｔ（ｔ_１，Ｒ_ｔ）、
ｕ_２＝ＲｏｕｎｄｉｎｇＲｉｇｈｔＳｈｉｆｔ（ｔ_２，Ｒ_ｔ）、
ｕ_０＝２^{３Ｆ＋Ｓ−１}−ｕ_−１−ｕ_１−ｕ_２。

次いで、［ｔ_−１，ｔ_０，ｔ_１，ｔ_２］ではなく、タップ値［ｕ_−１，ｕ_０，ｕ_１，ｕ
_２］を使用してフィルタリングを実行する。Ｒ_ｔの値において１のそれぞれの増加は、算
術アキュムレータにおいて必要なダイナミックレンジの１少ないビット、および処理の後
続の段において実行される右シフトの１少ないビットを表す。

３．第３の例示的なダイナミックレンジ軽減アプローチ
以前のある設計では、概念上は似ているが、プロセスの第１段の後の右シフトの量をフ
ェーズ位置決め変数ｉの値の関数にするという点で第１の例示的なダイナミックレンジ軽
減アプローチと異なるトリックを使用する。

式（９）に示されているフィルタタップ値は、ｉの値が２^Ｋの整数倍である場合にＫ個
のゼロ値ＬＳＢを含むことがわかる。そこで、フィルタリングプロセスの第２段で、２^Ｋ
の整数倍であるフェーズ位置決め変数ｉを使用する場合、第２段のタップ値をＫビットだ
け右シフトし、第１段の右シフト量をＫビットだけ減らすことができる。

これは、一般化された再サンプリング係数を操作するときに、追跡するのがかなり難し
い場合がある。しかし、２：１の単純な再サンプリング係数または他の単純な係数を実行
する場合には、フィルタリングプロセス第２段について使用中のすべてのフェーズが２^Ｋ
の同じ倍数を含むことを理解することは容易であり、このアプローチをこれらの特別なケ
ースに適用することができる。

Ｖ．位置計算の手法およびツール
空間ＳＶＣに対する位置決め情報を計算するための手法およびツールについて説明する
。

いくつかの手法およびツールは、ワード長Ｂに注目し、そのワード長の制約内で計算の
精度を最適化する方法を対象とする。精度をただ選択し、何らかの必要なワード長を要求
する代わりに、新しい方法を適用すると、実際の実装の精度が高まり、手法の効果的適用
の範囲が広がるが、それというのも、利用可能なワード長すべてを使用して、その制約内
で精度を最大化するからである。

いくつかの手法およびツールは、ａ）座標系の原点をオフセットすることと、ｂ）符号
付き整数ではなく符号なし整数を使用して、精度とワード長／ダイナミックレンジとの間
のトレードオフの関係を改善することとを対象とする。原点オフセット項をそれぞれの計
算された位置に加えるのに、計算量をわずかに増やす必要がある。

いくつかの手法およびツールは、生成されるサンプルの列の異なるセクションの計算を
異なる処理段に分けることを対象とし、その際に、座標系の原点は、それぞれの段の開始
に変更される。ここでもまた、必要な計算量をさらにわずかに増やすだけで精度とワード
長／ダイナミックレンジとの間のトレードオフの関係を改善する（それぞれの段の開始時
にいくつかの余分な計算が実行される）。この手法を論理的極限まで高めると、乗算の必
要性をなくすことができ、また精度とワード長／ダイナミックレンジとの間のトレードオ
フの関係をさらに改善することができる。しかし、サンプル毎にいくつかの余分な演算を
実行する必要がある（「それぞれの段」に必要な余分な計算処理は、すべての段が１つの
サンプルのみを含む場合にサンプル毎に必要になるからである）。

一般的テーマとして、設計は、計算された結果の精度、処理要素のワード長／ダイナミ
ックレンジ、および処理に関与する数学的演算の数および種類（例えば、シフト演算、加
算、および乗算）の間の望ましいトレードオフの関係を達成する処理の位置計算の一部に
ついて説明される。

例えば、説明される手法およびツールを使用することで、Ｂビット（例えば、３２ビッ
ト）算術演算を使用して柔軟精度計算を実行できる。これにより、空間ＳＶＣ符号器／復
号器は、計算のため異なる算術演算（例えば、１６ビットまたは６４ビット算術演算）に
変換することなく異なる画像サイズに柔軟に対応できる。柔軟精度Ｂビット（例えば、３
２ビット）算術演算では、符号器／復号器は、柔軟な個数のビットを分数成分に充てるこ
とができる。これにより、整数成分を表すために必要なビットの個数を減らすとともに計
算の精度を高めることができる（例えば、フレームサイズの縮小のため）。整数成分を表
すのに必要なビットの個数が増えると（例えば、フレームサイズが大きい場合）、符号器
／復号器は整数成分には多くのビットを、分数成分には少ないビットを使用して、精度を
下げるが、Ｂビット算術演算を維持することができる。このようにして、異なる精度と異
なるフレームサイズとの間の変更が、大幅に簡素化される。

この節では、例示的な実装に対する具体的詳細を取りあげる。しかし、本明細書で説明
される詳細は、本明細書で説明される原理に応じて他の実装では変えることができること
に留意されたい。

Ａ．導入および位置計算の原理
精度を著しく失うことなく必要な計算量をかなり減らせる、位置およびフェーズ情報を
計算する手法について説明する。例えば、説明されている手法は、例えば、公称ダイナミ
ックレンジ要件を劇的に（数十ビットほど）下げることにより必要計算量を著しく減らせ
る。ベースレイヤおよびエンハンスメントレイヤで使用されうる様々な可能な色度位置を
考えると、輝度サンプルに関する再サンプリングされた色度サンプルの適切な位置決めを
行う解決策を見つけることが望ましい。したがって、説明されている手法を使用すること
で、輝度位置と色度位置との間の異なる関係によりビデオ形式に対する位置を計算するよ
うに調節を行うことができる。

拡張空間スケーラビリティ用に設計されている以前のアップサンプリング方法では、低
解像度のレイヤをアップサンプリングするときに位置およびフェーズ情報を計算するとい
うかなりやっかいな方法を用い、分母のアップシフトされた近似的逆数をスケーリングす
るが、このため、分子が大きくなると（つまり、アップサンプリングプロセスが左から右
へ、または上から下へ移動するときに）逆数近似の丸め誤差が増幅される。比較すると、
本明細書で説明されている手法は、優れた精度を有し、計算を簡素化する。特に、ダイナ
ミックレンジおよび位置計算の右シフト量を数十ビットほど減らす手法が説明される。

例えば、ＳＶＣ空間アップサンプリングで使用する、整数位置およびｉ＝０．．２^Ｆ−
１であるフェーズ位置決め変数ｉを取得するための位置決め情報を計算する手法について
説明される。

説明される手法は、再サンプリングプロセスを、順方向参照画像再サンプリングではな
く、空間スケーラブルなビデオ符号化のアプリケーションに適用する。空間スケーラブル
なビデオ符号化のこのアプリケーションにおいて、いくつかの簡素化を適用しうる。ここ
では、一般的なワーピングプロセスではなく、画像サイズ変更演算のみを必要とする。こ
れは、それぞれの次元について分離可能な設計とすることができる。

Ｂ．位置計算設計
新しい（アップサンプリングされた）配列内のＬからＲ＞Ｌまでの実数値範囲内に概念
上置かれるサンプルの列の生成として、それぞれの次元（ｘまたはｙ）における、問題文
を考える。この実数値範囲は、参照される低解像度配列におけるＬ’からＲ’＞Ｌ’の範
囲に対応する。

Ｌ≦Ｔ≦Ｒとする新しい配列内の位置Ｔについて、新しい配列内の位置に対応する参照
配列内の位置を計算する必要がある。これは、位置Ｔ’＝Ｌ’＋（Ｔ−Ｌ）＊（Ｒ’−Ｌ
’）÷（Ｒ−Ｌ）である。

次に、ＬからＲまでの範囲のサイズ変更を考える代わりに、整数Ｍ＞０を定義し、同じ
サイズ変更比（Ｒ’−Ｌ’）÷（Ｒ−Ｌ）によりＬからＬ＋２^Ｍまでの範囲をサイズ変更
することを考える。次いで、参照されるサンプル座標における対応する範囲は、Ｌ’から
Ｒ”までであり、Ｒ”＝Ｌ’＋２^Ｍ＊（Ｒ’−Ｌ’）÷（Ｒ−Ｌ）である。Ｍが十分に大
きい場合、つまり、Ｍ≧Ｃｅｉｌ（Ｌｏｇ_２（Ｒ−Ｌ））であれば、Ｒ”≧Ｒ’である。
（ここで、以下の概念を説明するためにこの制約条件が満たされるが、この制約は式の適
切な関数機能に実際に必要ではないと仮定する。）

次に、位置決め計算に位置Ｌ’とＲ”との間の線形補間を使用することができる。位置
Ｌは、位置Ｌ’にマッピングされ、位置Ｔ＞＝Ｌは、位置（（２^Ｍ−（Ｔ−Ｌ））＊Ｌ’
＋（Ｔ−Ｌ）＊Ｒ”）÷２^Ｍ．にマッピングされる。これは、演算の分母を２の累乗に変
換し、したがって、２進数右シフトで置き換えられるようにしつつ、計算複雑度を除算演
算に低減する。

適切な修正を加えることで、計算を整数化することができる。Ｌ’およびＲ”の値を１
÷２^Ｇの整数倍に丸め、Ｇは、整数であり、したがって、Ｌ’は、ｋ÷２^Ｇにより近似さ
れ、Ｒ”は、ｒ÷２^Ｇにより近似され、ｋおよびｒは、整数である。この調節を使用する
ことで、位置Ｔを位置（（２^Ｍ−（Ｔ−Ｌ））＊ｋ＋（Ｔ−Ｌ）＊ｒ）÷２^{（Ｍ＋Ｇ）}に
マッピングしておく。

次に、ＴおよびＬの関連する値は、１÷２^Ｊの整数倍であり、Ｊは整数であり、Ｔ−Ｌ
＝ｊ÷２^Ｊとなる。この調節を使用することで、位置Ｔを位置（（２^{（Ｍ＋Ｊ）}−ｊ）＊
ｋ＋ｊ＊ｒ）÷２^{（Ｍ＋Ｇ＋Ｊ）}にマッピングしておく。

上記の節ＩＶから、再サンプリングフィルタの分数フェーズは、１÷２^Ｆ単位の整数で
あることを思い出しておこう。したがって、これらの単位における計算された位置は、Ｒ
ｏｕｎｄ（（（２^{（Ｍ＋Ｊ）}−ｊ）＊ｋ＋ｊ＊ｒ）÷２^{（Ｍ＋Ｇ＋Ｊ−Ｆ）}）、または
ｔ’＝（（２^{（Ｍ＋Ｊ）}−ｊ）＊ｋ＋ｊ＊ｒ＋２^{（Ｍ＋Ｇ＋Ｊ−Ｆ−１）}）＞＞（Ｍ＋
Ｇ＋Ｊ−Ｆ）（１６）
またはより単純に、
ｔ’＝（ｊ＊Ｃ＋Ｄ）＞＞Ｓ（１７）
であるが、ただし、
Ｓ＝Ｍ＋Ｇ＋Ｊ−Ｆ（１８）
Ｃ＝ｒ−ｋ（１９）
Ｄ＝（ｋ＜＜（Ｍ＋Ｊ））＋（１＜＜（Ｓ−１））（２０）
である。

計算された位置を１÷２^Ｆの最近倍数に丸める前に本明細書で説明されている方法（Ｌ
およびＲならびにＬ’およびＲ’の表現に誤差がないと仮定して）で生じる唯一の誤差（
両方の設計に存在する誤差である）は、位置Ｒ”を１÷２^Ｇの最近倍数に丸めることで生
じる丸め誤差である。この量は、Ｇ＋Ｍが比較的大きい場合には非常に小さい。実際、こ
の誤差発生源は、ほぼ（Ｔ−Ｌ）÷２^{（Ｇ＋Ｍ＋１）}の大きさに強く束縛されており、結
果の計算に対するワード長要件は穏当であり、モジュロ演算により、結果の整数部を分離
してワード長を最小にすることができるか、または計算を他の類似の方法で分解すること
もできる。

例えば、Ｆは、４以上とすることができる。（いくつかのアプリケーションでは、Ｆ＝
３またはＦ＝２で十分な場合がある。）Ｊの例示的な値は、輝度位置計算についてはＪ＝
１、色度サンプル位置についてはＪ＝２を含む。Ｊのこれらの例示的な値に対する根拠を
以下に示す。

１．符号付きＢビット算術演算を使用する第１の例示的な簡素化された位置計算手法
Ｒ’＞０およびＬ’＞−Ｒ’である場合、１÷２^Ｆを単位とする整数として、アップサ
ンプリングされる画像内の計算すべきすべての位置ｔ’は、−２^Ｚと２^Ｚ−１の間にあり
、ただし、Ｚ＝Ｃｅｉｌ（Ｌｏｇ２（Ｒ’））＋Ｆである。（ｊ＊Ｃ＋Ｄ）計算のワード
長がＢビットであり、符号付き２の補数演算を使用すると仮定した場合、Ｂ−１≧Ｚ＋Ｓ
を要求することができる。この制約がきつい場合、つまり、Ｂ−１＝Ｚ＋Ｍ＋Ｇ＋Ｊ−Ｆ
である場合に、高い精度が得られる。

十分に小さな画像サイズ（例えば、現行のＨ．２６４／ＭＰＥＧ−４ＡＶＣ標準にお
ける最大レベル４．２までのレベルの場合）については、Ｂ＝３２がワード長として使用
されうる。Ｂの他の値も、使用できる。非常に大きな画像では、さらに大きなＢを使用で
きる。計算処理は、さらに、１６ビットまたは他のプロセッサ上で使用するため、より小
さなワード長の複数の部分計算に容易に分解することができる。

残り２つの自由度は、ＭおよびＧである。その関係は、Ｌ’をｋ÷２^Ｇと表したときに
丸め誤差の必要性を回避する十分な大きさのＧである限り、柔軟である。したがって、Ｓ
ＶＣについて次の節で説明されている課題に基づき、単にＧ＝２を選ぶことができ、これ
により、
Ｍ＝Ｂ＋Ｆ−（Ｇ＋Ｊ＋Ｚ＋１）
つまり、
Ｍ＝３２＋４−（２＋１＋Ｚ＋１）
つまり、
Ｍ＝３２−Ｚ
が得られる。

例えば、Ｂ＝３２およびＬ’＝０の幅が１０００輝度サンプルである画像の輝度配列を
アップサンプリングしたい場合、この第１の実施例の位置計算手法を使用して、Ｆ＝４、
Ｇ＝２、Ｊ＝１、Ｍ＝１８、Ｓ＝１７、およびＺ＝１４を用いることができる。

ＴがＲに非常に近く（または等しく）、Ｒ’が２の整数乗に非常に近い（または等しい
）場合、特に（Ｔ−Ｌ）＊（Ｒ’−Ｌ’）÷２^Ｆが大きい（例えば、１／２よりも大きい
）場合、仮定上、上限を１だけ違反する可能性がありうる。このようなケースについては
ここではこれ以上説明しないが、このようなケースを取り扱うための調整は簡単である。

２．符号なしＢビット算術演算を使用する第２の例示的な位置計算手法
低解像度画像において計算すべきすべての位置が、０以上の場合、これは、適切なオフ
セットを座標系の原点に加えることにより真にできるものであるが、符号付き２の補数演
算ではなく符号なし整数演算を使用してｔ’＝（ｊ＊Ｃ＋Ｄ）を計算するのがよい選択で
あるといえる。これにより、計算にオーバーフローを起こすことなくダイナミックレンジ
の１つ多いビットを許し（つまり、ダイナミックレンジの大きさのＢ−１ビットではなく
Ｂビットを使用することができ）、したがって、Ｍ（またはＧ）およびＳをそれぞれ１だ
け増やし、さらに、計算された結果の精度を高めることができる。そのため、オフセット
Ｅを入れて、座標系の原点を調節した後、計算の形式は、単にｔ’＝（ｊ＊Ｃ＋Ｄ）＞＞
Ｓではなく、ｔ’＝（（ｊ＊Ｃ＋Ｄ’）＞＞Ｓ’）＋Ｅとなる。

以下のように原点オフセットＥがいつ必要でなくなるかを識別することにより、符号な
し算術演算を伴うこのより正確な方法をさらに詳しく述べる。
− 上述のようにＢ、Ｆ、Ｇ、Ｊ、およびＺに対する値を選択する。
− Ｍ＝Ｂ＋Ｆ−（Ｇ＋Ｊ＋Ｚ）と設定する。
− 式（１８）、（１９）、および（２０）それぞれで上に指定されているようにＳ、
Ｃ、およびＤを計算するが、ただし、Ｄは、符号付き数として計算される。
− Ｄが０以上の場合、原点オフセットは不要であり（つまり、Ｅを使用しない）、計
算処理は、符号なし算術演算を使用して単にｔ’＝（ｊ＊Ｃ＋Ｄ）＞＞Ｓとして実行する
ことができ、結果の精度は、上の節Ｖ．Ｂ．１で説明されている第１の例示的な位置計算
手法よりも高くなる。

符号なし整数を使用する計算を有効にすることにより精度を高めることに加えて、原点
をオフセットすることも、ときには、Ｚの値を小さくできるようにすることにより精度改
善に使用できる。原点オフセットがない場合、Ｚは、Ｒ’の関数である。しかし、原点オ
フセットがある場合、ＺをＲ’−Ｌ’の関数にすることができ、これにより、計算処理は
、この結果Ｚの小さな値が得られる場合により正確なものとなる。

以下のように原点をオフセットする１つの方法を示し、Ｄ’およびＥを導出することに
より、符号なし算術演算を伴うこのより正確な方法をさらに詳しく述べる。
− 上述のようにＢ、Ｆ、Ｇ、およびＪに対する値を選択する。
− Ｚ＝Ｃｅｉｌ（Ｌｏｇ２（Ｒ’−Ｌ’））＋Ｆと設定する。
− Ｍ＝Ｂ＋Ｆ−（Ｇ＋Ｊ＋Ｚ）と設定する。
− 式（１８）、（１９）、および（２０）それぞれで上に指定されているようにＳ、
Ｃ、およびＤを計算するが、ただし、Ｄは、符号付き数として計算される。
− Ｅ＝Ｄ＞＞Ｓと設定する。
− Ｄ’＝Ｄ−（Ｅ＜＜Ｓ）と設定する。
− 次いで、位置計算をｔ’＝（（ｊ＊Ｃ＋Ｄ’）＞＞Ｓ）＋Ｅとして実行することが
できる。

Ｄ’およびＥ（およびＭ、Ｓ、およびＺ）が、このような仕方で計算される場合、式ｔ
’＝（（ｊ＊Ｃ＋Ｄ’）＞＞Ｓ）＋Ｅの数学的結果は、実際には、（ｊ＊Ｃ＋Ｄ）の値が
ときには０から２^Ｂ−１までの値範囲を外れるが、（ｊ＊Ｃ＋Ｄ’）の値はそうでないこ
とを除き式ｔ’＝（ｊ＊Ｃ＋Ｄ）＞＞Ｓの結果と理論上常に同じになる。

例えば、Ｂ＝３２およびＬ’＝０の幅が１０００輝度サンプルである画像の輝度配列を
アップサンプリングしたい場合、この第２の実施例の位置計算手法を使用して、Ｆ＝４、
Ｇ＝２、Ｊ＝１、Ｍ＝１９、Ｓ＝１８、およびＺ＝１４を用いることができる。ｊ＊Ｃ＋
Ｄ’のすべての値が非負となるように原点をオフセットし、符号なし算術演算を使用する
０から２^Ｂ−１までのＢビット計算範囲を使用できるようにする代わりに、同じように働
く可能な別の方法として、さらに２^{（Ｂ−１）}だけ原点をさらに右にオフセットし、符号
付き算術演算を使用する−２^{（Ｂ−１）}から２^{（Ｂ−１）}−１までのＢビット計算範囲を
使用できるようにする方法がある。

前の節の第１の例示的な位置計算手法のように、ＴがＲに非常に近く（または等しく）
、Ｒ’−Ｌ’が２の整数乗に非常に近い（または等しい）場合に必要な「コーナーケース
」修正がありうる。

３．位置計算のための例示的な多段手法
生成されるサンプルの範囲をカバーするｊのすべての値（つまり、ＬとＲの間のＴのす
べての値）に対し同じ変数値Ｃ、Ｄ’、Ｓ、およびＥを用いて、同じ式、例えば、ｔ’＝
（（ｊ＊Ｃ＋Ｄ’）＞＞Ｓ）＋Ｅを使用して計算を実行できるような設計を行う方法につ
いて説明した。次に、この仮定を緩和し、精度を大きくし、および／または計算ダイナミ
ックレンジ要件を下げることができる方法について説明する。

通常、再サンプリングプロセスは、左から右に（または上から下に）進み、等しい間隔
で並ぶ位置に連続するサンプル列を生成する。上のＶ．Ｂ．２節で説明されている第２の
例示的な位置手法では、われわれは、オフセットパラメータＥを使用して原点を変更する
ことで、位置計算の（ｊ＊Ｃ＋Ｄ’）部分を計算するために使用されるレジスタのＢビッ
トダイナミックレンジを活用する方法を示した。

前の節では、ＤのＳ個の最下位ビットのみがＤ’に保持され、残りはＥに移されたこと
に留意されたい。そのため、（ｊ＊Ｃ＋Ｄ’）の計算に対する残りの主な問題点は、ｊ＊
Ｃの大きさである。

ＴおよびＬは、１÷２^Ｊの整数倍であることに留意されたい。通常、アップサンプリン
グプロセスを実行して、高解像度の画像において整数値増分でサンプル列を生成するが、
例えば、連続生成されるサンプル間に２^Ｊの間隔を入れる。そこで、ｐおよびＮの何らか
の値についてｉ＝０からＮ−１に対する位置Ｔ_ｉ＝（ｐ＋ｉ＊２^Ｊ）÷２^Ｊに対応する位
置ｔ’_ｉを計算したい。

このプロセスは、ｐおよびＮのいくつかの値について図１２の擬似コード１２００に示
されているように擬似コードで要約できる。ｉがＮに向かって大きくなるにつれ、ｑの値
は増大し、ｑの最大値は、Ｂビットの利用可能なダイナミックレンジの範囲内に保持され
なければならない。ｑについて計算された最大値は、（ｐ＋（Ｎ−１）＊２^Ｊ）＊Ｃ＋Ｄ
’である。

次に、このようにして１つのループですべてのサンプルを生成する代わりに、プロセス
を複数の段、例えば、２段に分けることを考える。例えば、２段プロセスでは、第１段で
、第１のＮ_０＜Ｎ個のサンプルを生成し、第２段で、残りＮ−Ｎ_０個のサンプルを生成す
る。さらに、ｐは、そのループに関して一定であるため、第１段の前にその影響をＤ’お
よびＥに移動することができる。この結果、図１３の擬似コード１３００に例示されてい
る２段プロセスが得られる。

擬似コード１３００のそれぞれの段の開始時に、その段に対するｑの第１の値のＳ個の
最下位ビット以外のすべてが、Ｅに移動されている（つまり、第１段についてはＥ_０に、
第２段についてはＥ_１に移動する）ように原点がリセットされている。そのため、２段の
それぞれの演算の際に、ｑは、より小さなダイナミックレンジを必要とする。プロセスを
このように複数の段に分けた後、ｑの最大値は、Ｎ_０＊Ｃ’＋Ｄ_０、または（（Ｎ−Ｎ_０
−１）＊Ｃ’＋Ｄ_１のいずれか大きい方となる。しかし、Ｄ_０およびＤ_１はそれぞれが有
する符号なしダイナミックレンジのビット数はＳビット以下なので、これは、通常、すで
に説明されている単一段設計の場合よりも小さい最大値となる。この段で生成されるサン
プルの数（つまり、第１段についてはＮ_０、第２段についてはＮ−Ｎ_０）は、関連する計
算に対するダイナミックレンジに影響を及ぼす可能性がある。例えば、それぞれの段にお
いて少ないサンプル数を使用すると、関連する計算に対するダイナミックレンジが小さく
なる。

それぞれの段は、さらに多くの段に分割することができ、したがって、合計Ｎ個のサン
プルの生成は、さらに、そのような小さな任意の個数の段に分解されうる。例えば、プロ
セスは、例えば、８または１６個の連続サンプルのブロックがそれぞれの段で生成される
ように等しいサイズの複数の段に分けることができるであろう。この手法を使用すること
で、ｑを計算するためダイナミックレンジＢの必要なビット数を減らすか、または計算の
精度を高める（ＳおよびＧ＋Ｍを大きくする）一方で、ダイナミックレンジを同じに保つ
か、またはこれら２つの利点を同時に保持することができる。

位置計算プロセスを複数の段に分解するこの手法は、さらに、サンプルがオーディオ信
号用のアナログ−デジタル変換器から到着するとともにサンプリングレート変換を実行す
る場合など、入力サンプルの非常に長い列（概念上、その列は無限長となりうる）にそっ
て連続再サンプリングプロセスを実行するために使用することができる。明らかに、プロ
セスを有限サイズの複数の段に分割し、原点をそれぞれの段から徐々に次の段へとリセッ
トしなければ、これが処理ワード長における無限ダイナミックレンジを必要とするので、
無限長のサンプル列は前の節で説明されている手法により処理できない場合がある。しか
し、これらの手法を実効無限列長に適用する際の困難は、１÷２^Ｇの倍数を表す整数単位
で仮説的ベンチマーク位置Ｌ’およびＲ’の表現に丸め誤差が一切伴わないときにのみ実
効無限長への適用が有用であるので、そのような手法に対する実質的制限ではない。

多段位置計算手法が適用可能な状況では、レート変換プロセス全体を通して位置計算の
演算においてどのようなものであれ丸め誤差の「ドリフト」累積を生じることなく、無限
長サンプル列にそって計算を実行する手段が実現される。

４．位置計算の例示的な増分演算
上述の多段分解概念に対する興味深い特別なケースは、それぞれの段で生成されるサン
プルの数が１段当たりたった１つのサンプルにまで減らされた場合である。図１４の擬似
コード１４００は、ｉ＝０からＮ−１に対するＮ個の位置ｔ’_ｉを生成するプロセスを表
す。

このプロセスは、アップサンプリングプロセスとして説明されるため（同じ原理をダウ
ンサンプリングプロセスにも適用可能であるけれども）、ｉの増分毎に、高解像度の画像
内に１の間隔があり、したがって、低解像度の画像内に１以下の増分があることがわかる
。低解像度の画像内の空間位置における１の増分は、Ｃ’に対する２^{（Ｓ＋Ｆ）}の値に対
応する。また、Ｄ’＜２^Ｓであることがわかる。したがって、ｑ＝Ｃ’＋Ｄ’の範囲は、
０から２^{（Ｓ＋Ｆ）}＋２^Ｓ未満までであり、したがって、ｑは、符号なし整数演算を使用
してＢ＝Ｓ＋Ｆ＋１ビット以下のダイナミックレンジ要件で計算できる。一実装では、こ
のダイナミックレンジ要件は、画像サイズに対して不変である（つまり、Ｒ’またはＲ’
−Ｌ’の値に依存しない）。

スケーラブルなビデオ符号化および多くの他のそのようなアプリケーションでは、１に
非常に近いアップサンプリング比をサポートする実際の必要性はありえない。このような
アプリケーションでは、Ｃ’は、実際には、Ｓ＋Ｆ以下のビットを必要とすると仮定する
ことができる。

例えば、Ｂ＝３２およびＬ’＝０の幅が１０００輝度サンプルである画像の輝度配列を
アップサンプリングしたい場合、この方法を使用して、Ｆ＝４、Ｇ＝２、Ｊ＝１、Ｍ＝２
９、Ｓ＝２８、およびＺ＝１４を用いることができる。この結果は異常に正確であるため
、Ｂの小さい値がより妥当な選択のように見える。

それとは別に、Ｂ＝１６およびＬ’＝０の幅が１０００輝度サンプルである画像の輝度
配列をアップサンプリングしたい場合、この方法を使用して、Ｆ＝４、Ｇ＝２、Ｊ＝１、
Ｍ＝１３、Ｓ＝１２、およびＺ＝１４を用いることができる。

実行すべきサンプリング演算の状況に関する知識がさらにあれば、さらなる最適化機会
が得られる。例えば、アップサンプリング比が２よりも著しく大きい場合、ダイナミック
レンジ要件は、もう１つのビットだけ低減され、４、１６などよりも大きなアップサンプ
リング比についても同様に低減される。

この節の例示的な増分位置計算手法を参照しつつ説明される（上述の例示的な多段位置
計算手法に関する）変更はどれも、Ｃ、Ｄ、およびＳの与えられた値について位置ｔ’_ｉ
の実際の計算された値に影響を及ぼすことはない。この計算をサポートするのに必要なダ
イナミックレンジのみが変更される。

この形式の分解に対する擬似コード１４００の内側ループは、乗算をまったく必要とし
ない。この事実は、いくつかの計算プロセッサに対する計算時間を短縮するうえで有利で
あると思われる。

５．追加備考
２：１、３：２などの共通再サンプリング比では−位置Ｌ’およびＲ”を１÷２^Ｇ単位
の整数として近似するのに丸めが必要ない場合−これらの方法を使用するときに丸め誤差
はまったくない（最終結果を位置計算法に関係なく存在する誤差である１÷２^Ｆを単位と
する整数に丸めたときに発生しうる丸め誤差以外）。

Ｃ．輝度および色度位置および関係
輝度サンプリンググリッドインデックス座標に関して、完全な新しい（アップサンプリ
ングされた）画像および参照画像配列の正確なアライメントを仮定すると、現在画像座標
における位置ＬおよびＲは、

および

であり、ただし、Ｗは、関連する再サンプリング次元に応じて、画像内のサンプルの垂直
方向または水平方向の数である。同等のことであるが、画像空間座標からグリッドインデ
ックス値に変換するときに、画像空間座標系の原点をグリッドインデックス０の位置の左
（または上）、半サンプル分のところに設定し、１／２を加えることが可能であり、これ
により、空間座標系内で計算を実行したときに負の数を扱わなくて済む。

参照されている（低い解像度の）画像内の位置Ｌ’およびＲ’は、同じようにしてサン
プリンググリッド座標を基準とし、この場合、Ｗは、新しい画像ではなく、参照画像内の
サンプルの数である。

色度サンプリンググリッド（新しい画像であろうと参照画像であろうと）について、こ
の状況は、いくぶん単純ではない。輝度に関して色度サンプルの指定されたアライメント
を構成するために、色度サンプルにより表現される画像矩形を輝度サンプルにより表現さ
れる矩形と同じものであると考える。これにより、以下のケースが生じる。
− 水平方向に、４：２：０の色度サンプリングタイプ０、２、および４（図５Ｄを参
照）については、現在画像座標は、

および

により定義される。
− 水平方向に、４：２：０の色度サンプリングタイプ３、１、および５（図５Ｄを参
照）については、現在画像座標は、

および

により定義される。
− 垂直方向に、４：２：０の色度サンプリングタイプ２および３（図５Ｄを参照）に
ついては、現在画像座標は、

および

により定義される。
− 垂直方向に、４：２：０の色度サンプリングタイプ０および１（図５Ｄを参照）に
ついては、現在画像座標は、

および

により定義される。
− 垂直方向に、４：２：０の色度サンプリングタイプ４および５（図５Ｄを参照）に
ついては、現在画像座標は、

および

により定義される。
− 水平方向に、４：２：２色度サンプリングについて、典型的には業界慣行で使用さ
れる４：２：２サンプリングに対する現在画像座標は、

および

により定義される。
− 垂直方向に、４：２：２色度サンプリングについて、典型的には業界慣行で使用さ
れる４：２：２サンプリングに対する現在画像座標は、

および

により定義される。
− 水平方向と垂直方向の両方で、４：４：４色度サンプリングについて、現在画像座
標は、

および

により定義される。

ここでもまた、オフセットを使用して、座標系の原点を位置Ｌの十分左に配置し、負数
を扱わなくて済むようにできる。

整数座標および分数フェーズオフセット剰余は、アップサンプリングされた配列で生成
されるサンプルの整数座標位置を調節して、分数オフセットＬを補正し、節Ｖ．Ｂの末尾
に示されている変換を適用することにより計算される。概念上、結果をＦビットだけ右に
シフトすると、整数座標ポインタは参照画像を指し、左シフトされた整数座標（Ｆビット
だけシフトされた）を減算すると、フェーズオフセット剰余が得られる。

Ｄ．アップサンプリングに関する位置計算の余分な精度
この節では、上の節Ｖ．Ｃ．４の位置計算方法を、Ｈ．２６４ＳＶＣＥｘｔｅｎｓ
ｉｏｎに使用されうるアップサンプリングプロセスなどの特定のアップサンプリングプロ
セスにマッピングする方法を説明している。位置計算は、非常に融通の利く方法で適用さ
れ、様々な色度形式で輝度と色度の両方のチャネル、さらにはプログレッシブフレーム形
式およびインターレースフレーム形式の両方について精度を最大化する。この節で説明さ
れる手法は、実装に応じて、また異なるアップサンプリングプロセスに関して異なる。

上述の位置計算（上の節Ｖ．Ａ〜Ｃ）では、再スケーリングパラメータ（変数Ｃであり
、以下の式においてこれ以降ｄｅｌｔａＸ（またはｄｅｌｔａＹ））は、２^Ｊ（ただし、
輝度に対してはＪ＝１、色度に対しては２）に等しいスケーリング係数だけスケールアッ
プされ、左から右へ、または上から下へそれぞれのサンプル位置を生成するために加えら
れる増分を形成する。スケーリングは、アップスケーリング増分が１６ビットに収まるよ
うに選択された。

１．スケーリング位置計算の最大精度
位置計算方法を適用する直接的な方法は、輝度に対しＪ＝１、色度に対し２として、２
^Ｊに等しいスケーリング係数により再スケーリングパラメータをスケールアップし、左か
ら右へ、上から下へそれぞれのサンプル位置を生成するために加えられる増分を形成する
ことである。次いで、アップスケーリングされた増分が１６ビットなどの特定のワード長
に収まるようにスケーリングパラメータが選択される。以下の節では、位置精度を最大に
するより柔軟な設計が説明される。

ａ．輝度チャネル
「直接的」輝度位置計算法は、Ｆ＝４およびＳ＝１２に対し以下のサンプル式で要約す
ることができる（水平方向にそって）。
ｄｅｌｔａＸ＝Ｆｌｏｏｒ（（（ＢａｓｅＰｉｃＷｉｄｔｈ＜＜１５）＋（Ｓｃａｌｅ
ｄＢａｓｅＷｉｄｔｈ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈ）
ｘｆ＝（（２＊（ｘＰ−ＳｃａｌｅｄＢａｓｅＬｅｆｔＯｆｆｓｅｔ）＋１）＊ｄｅｌ
ｔａＸ−３０７２０）＞＞１２
ここで、ＢａｓｅＰｉｃＷｉｄｔｈは、ベースレイヤの水平解像度または低解像度画像
であり、ＳｃａｌｅｄＢａｓｅＷｉｄｔｈは、高解像度画像領域またはウィンドウの水平
解像度であり、ｄｅｌｔａＸは、中間再スケーリングパラメータであり、この場合、３２
７６８の丸めた近似にアップサンプリング比の逆数を掛けた値であり、ｘＰは、高解像度
画像内のサンプル位置を表し、ＳｃａｌｅｄＢａｓｅＬｅｆｔＯｆｆｓｅｔは、高解像度
画像内の画像ウィンドウの相対位置を表し、Ｆｌｏｏｒ（）は、その引数以下の最大整数
を表す。定数値３０７２０は、上の節Ｖ．Ｃの始めに説明されているように右シフトし、
輝度サンプリンググリッド参照位置の半サンプルオフセットについて２^Ｓ＊２^Ｆ／２を減
算する前に、２^Ｓ−１を丸めオフセットとして加えた結果得られる。

ｘＰのそれぞれの増分により、式内に２＊ｄｅｌｔａＸの増分が生じることは注目に値
する。そして、数量２＊ｄｅｌｔａＸのＬＳＢは、常に、ゼロであり、したがって計算精
度の１ビットは、本質的に無駄になる。これらの式を以下に変更することにより、複雑度
を著しく増大することなく、約１エクストラビットの精度が得られる。
ｄｅｌｔａＸ＝Ｆｌｏｏｒ（（（ＢａｓｅＰｉｃＷｉｄｔｈ＜＜１６）＋（Ｓｃａｌｅ
ｄＢａｓｅＷｉｄｔｈ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈ）
ｘｆ＝（（ｘＰ−ＳｃａｌｅｄＢａｓｅＬｅｆｔＯｆｆｓｅｔ）＊ｄｅｌｔａＸ＋（ｄ
ｅｌｔａＸ＞＞１）−３０７２０）＞＞１２
または、以下のように（少し）精度が高い形式。
ｄｅｌｔａＸａ＝Ｆｌｏｏｒ（（（ＢａｓｅＰｉｃＷｉｄｔｈ＜＜１６）＋（Ｓｃａｌ
ｅｄＢａｓｅＷｉｄｔｈ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈ）
ｄｅｌｔａＸａ＝Ｆｌｏｏｒ（（（ＢａｓｅＰｉｃＷｉｄｔｈ＜＜１５）＋（Ｓｃａｌ
ｅｄＢａｓｅＷｉｄｔｈ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈ）
ｘｆ＝（（ｘＰ−ＳｃａｌｅｄＢａｓｅＬｅｆｔＯｆｆｓｅｔ）＊ｄｅｌｔａＸａ＋ｄ
ｅｌｔａＸｂ−３０７２０）＞＞１２
これら２つの形式のうちの後者は、精度が高く，複雑度影響度が無視できるくらい小さ
いため、示唆される（精度差も非常に小さく見えるが）。

除算が実行しにくい処理アーキテクチャでは、これらの式のうちの１つの結果を持つこ
とで、他の計算を簡素化することができる。ｄｅｌｔａＸａの値は、常に、２＊ｄｅｌｔ
ａＸａ±１の範囲内にある。したがって、以下の簡素化された規則を、ｄｅｌｔａＸａの
計算に除算を実行する必要がなくなるように導出することができる。
ｄｅｌｔａＸａ＝（ｄｅｌｔａＸｂ＜＜１）
ｒｅｍａｉｎｄｅｒＤｉｆｆ＝（ＢａｓｅＰｉｃＷｉｄｔｈ＜＜１６）＋（Ｓｃａｌｅ
ｄＢａｓｅＷｉｄｔｈ＞＞１）−ｄｅｌｔａＸ
（ｒｅｍａｉｎｄｅＤｉｆｆ＜０）の場合、
ｄｅｌｔａＸａ−−
そうでなく、（ｒｅｍａｉｎｄｅｒＤｉｆｆ≧ＳｅａｌｅｄＢａｓｅＷｉｄｔｈ）の場
合、
ｄｅｌｔａＸａ＋＋

ｂ．色度チャネル
設計のこの部分では、色度チャネルに対して、２倍乗算器の代わりに、４倍乗算器が使
用され、４：２：０サンプリングに対し色度位置を表現することができる（輝度について
説明されているようにＪ＝１ではなく色度に対しＪ＝２を使用する）。したがって、「直
接的」な式は以下のとおりである。
ｄｅｌｔａＸＣ＝Ｆｌｏｏｒ（（（ＢａｓｅＰｉｃＷｉｄｔｈＣ＜＜１４）＋（Ｓｃａ
ｌｅｄＢａｓｅＷｉｄｔｈＣ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈＣ）
ｘｆＣ＝（（（（４＊（ｘＣ−ＳｃａｌｅｄＢａｓｅＬｅｆｔＯｆｆｓｅｔＣ）＋（２
＋ｓｃａｌｅｄＢａｓｅＣｈｒｏｍａＰｈａｓｅＸ））＊ｄｅｌｔａＸＣ）＋２０４８）
＞＞１２）−４＊（２＋ｂａｓｅＣｈｒｏｍａＰｈａｓｅＸ）
ここで、ｂａｓｅＣｈｒｏｍａＰｈａｓｅＸおよびｓｃａｌｅｄＢａｓｅＣｈｒｏｍａ
ＰｈａｓｅＸは、それぞれ、低解像度および高解像度画像に対する色度サンプリンググリ
ッド位置オフセットを表す。これらのパラメータの値は、符号器から復号器に送られる情
報として明示的に伝達されるか、またはアプリケーションにより決定された特定の値を持
つことができる。他のすべての変数は、色度チャネルへのアプリケーションを表す「Ｃ」
サフィックスを付加した輝度チャネルについて定義されているものと似た変数である。

ｘＣのそれぞれの増分の結果として、式の中で４＊ｄｅｌｔａＸＣの増分が得られる。
したがって、これらの式を以下に変更することにより、複雑度を著しく増大することなく
、約２エクストラビットの精度が得られる。
ｄｅｌｔａＸＣ＝Ｆｌｏｏｒ（（（ＢａｓｅＰｉｃＷｉｄｔｈＣ＜＜１６）＋（Ｓｃａ
ｌｅｄＢａｓｅＷｉｄｔｈＣ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈＣ）
ｘｆＣ＝（（（ｘＣ−ＳｃａｌｅｄＢａｓｅＬｅｆｔＯｆｆｓｅｔＣ）＊ｄｅｌｔａＸ
Ｃ＋（２＋ｓｃａｌｅｄＢａｓｅＣｈｒｏｍａＰｈａｓｅＸ）＊（（ｄｅｌｔａＸＣ＋Ｋ
）＞＞２）＋２０４８）＞＞１２）−４＊（２＋ｂａｓｅＣｈｒｏｍａＰｈａｓｅＸ）
ただし、Ｋ＝０、１、または２。Ｋ＝０を使用すると、余分な演算を避けられる。Ｋ＝１
またはＫ＝２を使用すると、精度が少し高くなる。

対応する、少し精度が高い形式は以下のとおりである。
ｄｅｌｔａＸＣａ＝Ｆｌｏｏｒ（（（ＢａｓｅＰｉｃＷｉｄｔｈＣ＜＜１６）＋（Ｓｃ
ａｌｅｄＢａｓｅＷｉｄｔｈＣ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈＣ）
ｄｅｌｔａＸＣｂ＝Ｆｌｏｏｒ（（（ＢａｓｅＰｉｃＷｉｄｔｈＣ＜＜１４）＋（Ｓｃ
ａｌｅｄＢａｓｅＷｉｄｔｈＣ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈＣ）
ｘｆＣ＝（（（ｘＣ−ＳｃａｌｅｄＢａｓｅＬｅｆｔＯｆｆｓｅｔＣ）＊ｄｅｌｔａＸ
Ｃａ＋（２＋ｓｃａｌｅｄＢａｓｅＣｈｒｏｍａＰｈａｓｅＸ）＊ｄｅｌｔａＸＣｂ＋２
０４８）＞＞１２）−４＊（２＋ｂａｓｅＣｈｒｏｍａＰｈａｓｅＸ）
輝度の場合のように、後者の変更形態は、複雑度の差が無視できるくらい小さいように
思われるため好ましい（精度差も非常に小さいにように思われるが）。

ｃ．インターレースフィールド座標
画像の座標系に対する参照は、通常、輝度フレーム座標内の半サンプル位置に基づいて
おり、その結果、上述のように輝度座標参照位置に対し２のスケール係数が得られる。輝
度フレーム座標内の半サンプルシフトは、４：２：０色度フレーム座標内の１／４サンプ
ルシフトに対応するが、これは、現在上述のように色度座標に対するスケーリングにおい
て係数２ではなく係数４を使用しているからである。

水平方向では、フレームを表す符号化された画像とインターレースビデオの単一フィー
ルドを表す画像に対する演算に実質的違いはない。しかし、符号化された画像が、単一フ
ィールドを表す場合、輝度フレーム垂直座標内の半サンプル位置シフトは、輝度フィール
ド垂直座標内の１／４サンプル位置シフトに対応する。そのため、垂直輝度座標位置の計
算では、スケール係数として２ではなく４が適用されるべきである。

同様に、符号化された画像が、単一フィールドを表す場合、輝度フレーム垂直座標内の
半サンプル位置シフトは、色度フィールド垂直座標内の１／８サンプル位置シフトに対応
する。そのため、垂直色度座標位置の計算では、スケール係数として４ではなく８が適用
されるべきである。

符号化フィールド画像内の垂直座標位置の計算に対するこれらのスケーリング係数は、
符号化フレーム画像内の増分計算について上で説明されているのと同じ方法でｄｅｌｔａ
Ｙ垂直増分計算に組み込むことができる。この場合、適用されるスケーリング係数が大き
いため、精度改善は、輝度位置については約２ビットの精度追加、色度（垂直方向）につ
いては３ビットの精度追加となる。

２．４：２：２および４：４：４の色度制限および精密化
節Ｖ．Ｄ．１．ｂの位置計算方法では、色度については輝度と異なる増倍率を使用する
必要がある。これは４：２：０ビデオについてはもっともなことであり、また水平方向で
４：２：２ビデオについては妥当であるが、垂直方向で４：２：２ビデオ、または水平方
向もしくは垂直方向のいずれかで４：４：４ビデオについては必要でないが、それは、こ
れらの場合において、輝度および色度解像度は、同じであり、したがって輝度および色度
サンプルは、たぶん同一の場所に配置されるからである。

その結果、節Ｖ．Ｄ．１．ｂの方法は、輝度および色度解像度がある次元で同じであり
、フェーズシフトが意図されていない場合であっても、丸めが２つのケースにおいて少し
異なる形で実行されるという理由だけで、輝度および色度位置を決定するために別々の計
算を必要とする可能性がある。これは、望ましくなく、したがって、４：２：２および４
：４：４サンプリング構造とともに使用するために、色度の異なる取り扱いが、この節で
提案されている。

ａ．４：２：２垂直ならびに４：４：４水平および垂直位置
４：２：２ビデオの垂直次元、ならびに４：４：４ビデオの垂直および水平次元の両方
について、色度フェーズのカスタム制御の明白な必要性はない。したがって、色度解像度
が、ある次元において輝度解像度と同じである場合には必ず、色度位置を計算する式を修
正すべきであり、その結果、色度サンプリング形式が特定の次元において輝度と色度につ
いて同じ解像度を有する場合に必ず、輝度サンプルと色度サンプルの両方についてまった
く同じ位置を計算することになる。オプションの１つは、色度位置変数を輝度位置変数と
等しくなるように設定することであり、もう１つのオプションは、同じ結果となるように
色度位置式をセットアップすることである。

ｂ．４：２：２水平位置
４：２：２ビデオに対し色度フェーズ調節を水平方向に行えるようにすることに機能的
問題はないが、節Ｖ．Ｄ．１．ｂの式のｓｃａｌｅｄＢａｓｅＣｈｒｏｍａＰｈａｓｅＸ
またはＢａｓｅＣｈｒｏｍａＰｈａｓｅＸに対し値−１に対応するものなど、４：２：２
に使用されている水平サブサンプリング構造が１種類しかない場合、カラーサンプリング
形式が４：２：２であるときに必ずそれらの値が使用されるよう強制することを考慮する
ことが望ましい場合がある。

ＶＩ．拡張と代替え
本明細書で説明されている手法およびツールは、さらに、例えば、非特許文献１の付録
Ｐに示されているように参照画像再サンプリングを使用して多重解像度ビデオ符号化に適
用されうる。

本明細書で説明されている手法およびツールは、さらに、画像サンプル配列のアップサ
ンプリングだけでなく、残差データ信号または他の信号のアップサンプリングにも適用さ
れうる。例えば、本明細書で説明されている手法およびツールは、さらに、例えば、非特
許文献１の付録Ｑに示されているように画像解像度を落とした更新符号化用の残差データ
信号のアップサンプリングに適用されうる。他の実施例では、本明細書で説明されている
手法およびツールは、さらに、空間スケーラブルなビデオ符号化の設計において低解像度
の残差信号から高解像度残差信号を予測するための残差データ信号のアップサンプリング
に適用されうる。他の実施例として、本明細書で説明されている手法およびツールは、さ
らに、空間スケーラブルなビデオ符号化の設計において動きベクトルフィールドのアップ
サンプリングに適用されうる。他の実施例として、本明細書で説明されている手法および
ツールは、さらに、グラフィック画像、写真静止画像、オーディオサンプル信号などのア
ップサンプリングに適用されうる。

様々な説明されている実施形態を参照しつつ本発明の原理を説明し、例示したが、説明
されている実施形態は、そのような原理から逸脱することなく配列および詳細について修
正されうることは理解されるであろう。本明細書で説明されているプログラム、プロセス
、または方法は、特に断りのない限り、特定の種類のコンピュータ環境に関係または制限
されないことは理解されるであろう。様々な種類の汎用または専用コンピュータ環境を、
本明細書で説明されている教示とともに使用するか、または本明細書で説明されている教
示に従って演算を実行することができる。ソフトウェアで示されている説明されている実
施形態の要素は、ハードウェハで実装することができ、またその逆も可能である。

本発明の原理を適用できる多くの可能な実施形態を鑑みて、発明者は請求項および等価
物の範囲および精神の範囲内に収まりうるすべての実施形態を本発明として請求する。

いくつかの説明されている実施形態を実装できる好適なコンピュータ環境のブロック図である。いくつかの説明されている実施形態を実装できる一般化されたビデオ符号器システムのブロック図である。いくつかの説明されている実施形態を実装できる一般化されたビデオ復号器システムのブロック図である。いくつかの説明されている実施形態において使用されるマクロブロック形式の図である。トップフィールドとボトムフィールドの交互に並ぶ線を示す、インターレースビデオフレームの一部の図である。フレームとして符号化および復号化用に編成されたインターレースビデオフレームの図である。フィールドとして符号化および復号化用に編成されたインターレースビデオフレームの図である。ビデオフレームのそれぞれのフィールドに対する輝度サンプル配置に関する４：２：０色度サンプル配置の６つの例示的な空間的アライメントを示す図である。ビデオの多重解像度符号化の一般化された手法を示す流れ図である。ビデオの多重解像度復号化の一般化された手法を示す流れ図である。イントラ画像および画像間予測画像の多重解像度符号化の手法を示す流れ図である。イントラ画像および画像間予測画像の多重解像度復号化の手法を示す流れ図である。異なる解像度でビデオを復号化できるように空間的にスケーラブルなビットストリームレイヤを符号化する手法を示す流れ図である。異なる解像度でビデオを復号化できるように空間的にスケーラブルなビットストリームレイヤを復号化する手法を示す流れ図である。例示的な多段位置計算手法に対する擬似コードを示すコード図である。例示的な多段位置計算手法に対する擬似コードを示すコード図である。例示的な増分位置計算手法に対する擬似コードを示すコード図である。

Claims

画像あるいは映像の符号化または復号化を行うコンピューティング装置でベースレイヤ画像データのアップサンプリングを実行する方法であって、前記コンピューティング装置は、プロセッサとメモリとを含んでおり、前記方法は、アップサンプルされた配列における位置について、
前記コンピューティング装置によって、前記ベースレイヤ画像データにおける位置を計算するステップを含み、ｙは前記ベースレイヤ画像データにおける位置の垂直値を示し、
ｙの導出は、（ｊ＊Ｃ＋Ｄ）＞＞Ｓに基づいて計算され、
ｊはアップサンプルされた配列における位置についての垂直値を示し、
Ｃは垂直スケール係数の逆数を掛けた２^Ｓ＋Ｆに基づき、
Ｄはオフセットであり、
Ｓはシフト値であり、
Ｆはｙの分数部分におけるビット数に基づいている
ことを特徴とする方法。
ｊおよびＤは、前記ベースレイヤ画像データが輝度かまたは色度かに基づいて異なることを特徴とする請求項１に記載の方法。
Ｓはダイナミックレンジをセットし、
Ｄは垂直スケール係数およびＳに基づいて異なることを特徴とする請求項１に記載の方法。
Ｆは４であり、Ｓは１２であることを特徴とする請求項１に記載の方法。
ｘは、前記ベースレイヤ画像データにおける前記位置のための水平値を示し、ｘの導出は、（ｉ＊Ｃ’＋Ｄ’）＞＞Ｓ’に基づいて計算され、
ｉはアップサンプルされた配列における位置についての水平値を示し、
Ｃ’は水平スケール係数の逆数を掛けた２^{Ｓ’＋Ｆ’}に基づき、
Ｄ’はオフセットであり、
Ｓ’はＳと同じまたは異なるシフト値であり、
Ｆ’はｘの分数部分におけるビット数に基づいている
ことを特徴とする請求項１に記載の方法。
Ｃ’は、（（ＢａｓｅＰｉｃＷｉｄｔｈ＜＜１６）＋（ＳｃａｌｅｄＢａｓｅＷｉｄｔｈ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈ）にしたがって、生成され、
ＢａｓｅＰｉｃＷｉｄｔｈは、前記ベースレイヤ画像データのための水平解像度を示し、ＳｃａｌｅｄＢａｓｅＷｉｄｔｈは、前記アップサンプリングの後の水平解像度を示すことを特徴とする請求項５に記載の方法。
ｘはさらに、オフセットＥに依存し、ｘの導出は、（（ｊ＊Ｃ’＋Ｄ’）＞＞Ｓ’）＋Ｅに基づいて計算されることを特徴とする請求項５に記載の方法。
ｙのＦ個の最小位ビットに基づいて垂直フィルタを選択し、ｙの残りのビットに基づいてフィルタされる垂直整数位置を選択するステップであって、前記ベースレイヤ画像データの垂直補間は、前記垂直整数位置で前記垂直フィルタを使用する、ステップと、
ｘのＦ’個の最小位ビットに基づいて水平フィルタを選択し、ｘの残りのビットに基づいてフィルタされる水平整数位置を選択するステップであって、前記ベースレイヤ画像データの水平補間は、前記水平整数位置で前記水平フィルタを使用する、ステップと
をさらに含むことを特徴とする請求項５に記載の方法。
前記ベースレイヤ画像データにおける前記位置で値を補間するステップと、
前記アップサンプルされた配列における前記位置で補間された値を割り当てるステップと
をさらに含むことを特徴とする請求項５に記載の方法。
プロセッサ、メモリ、およびコンピュータにアップサンプリングの方法を実行させるコンピュータ可読実行命令を格納するコンピュータ可読ストレージを含むシステムであって、前記方法は、アップサンプルされた配列における位置について、
前記コンピューティング装置によって、前記ベースレイヤ画像データにおける位置を計算するステップを含み、ｙは前記ベースレイヤ画像データにおける位置の垂直値を示し、
ｙの導出は、（ｊ＊Ｃ＋Ｄ）＞＞Ｓに基づいて計算され、
ｊはアップサンプルされた配列における位置についての垂直値を示し、
Ｃは垂直スケール係数の逆数を掛けた２^Ｓ＋Ｆに基づき、
Ｄはオフセットであり、
Ｓはシフト値であり、
Ｆはｙの分数部分におけるビット数に基づいている
ことを特徴とするシステム。
ｊおよびＤは、前記ベースレイヤ画像データが輝度かまたは色度かに基づいて異なり、
Ｄは、垂直スケール係数およびＳに基づいて異なり、
Ｆは４であり、
Ｓは１２であることを特徴とする請求項１０に記載のシステム。
ｘは、前記ベースレイヤ画像データにおける前記位置のための水平値を示し、ｘの導出は、（ｉ＊Ｃ’＋Ｄ’）＞＞Ｓ’に基づいて計算され、
ｉはアップサンプルされた配列における位置についての水平値を示し、
Ｃ’は水平スケール係数の逆数を掛けた２^{Ｓ’＋Ｆ’} に基づき、
Ｄ’はオフセットであり、
Ｓ’はＳと同じまたは異なるシフト値であり、
Ｆ’はｘの分数部分におけるビット数に基づいている
ことを特徴とする請求項１に記載の方法。
Ｆ’は４であり、
Ｓ’は１２である
Ｃ’は、（（ＢａｓｅＰｉｃＷｉｄｔｈ＜＜１６）＋（ＳｃａｌｅｄＢａｓｅＷｉｄｔｈ＞＞１））÷ＳｃａｌｅｄＢａｓｅＷｉｄｔｈ）にしたがって、生成され、
ＢａｓｅＰｉｃＷｉｄｔｈは、前記ベースレイヤ画像データのための水平解像度を示し、ＳｃａｌｅｄＢａｓｅＷｉｄｔｈは、前記アップサンプリングの後の水平解像度を示すことを特徴とする請求項１２に記載の方法。
ｙのＦ個の最小位ビットに基づいて垂直フィルタを選択し、ｙの残りのビットに基づいてフィルタされる垂直整数位置を選択するステップであって、前記ベースレイヤ画像データの垂直補間は、前記垂直整数位置で前記垂直フィルタを使用する、ステップと、
ｘのＦ’個の最小位ビットに基づいて水平フィルタを選択し、ｘの残りのビットに基づいてフィルタされる水平整数位置を選択するステップであって、前記ベースレイヤ画像データの水平補間は、前記水平整数位置で前記水平フィルタを使用する、ステップと
をさらに含むことを特徴とする請求項１２に記載の方法。
プロセッサ、メモリ、無線通信接続、ディスプレイ、およびコンピュータにアップサンプリングの方法を実行させるコンピュータ可読実行命令を格納するコンピュータ可読ストレージを含むシステムであって、前記方法は、
前記無線通信接続を通じて、ビットストリームにおける符号化されたデータを受信するステップと、
前記符号化されたデータを復号化して映像を再構成するステップであって、
ベースレイヤ画像データを復号するステップと、
前記ベースレイヤ画像データをアップサンプリングするステップであって、
前記ベースレイヤ画像データにおける位置のための垂直値ｙを計算するステップであって、ｙの導出は、（ｊ＊Ｃ＋Ｄ）＞＞Ｓに基づいて計算され、ｊはアップサンプルされた配列における前記位置についての垂直値を示し、Ｃは垂直スケール係数の逆数を掛けた２^Ｓ＋Ｆに基づき、Ｄはオフセットであり、Ｓはシフト値であり、Ｆはｙの分数部におけるビット数に基づいている、ステップと、
前記ベースレイヤ画像データにおける位置のための水平値ｘを計算するステップであって、ｘの導出は（ｉ＊Ｃ’＋Ｄ’）＞＞Ｓ’に基づいて計算され、ｉはアップサンプルされた配列における位置についての水平値を示し、Ｃ’は水平スケール係数の逆数を掛けた２^{Ｓ’＋Ｆ’}に基づき、Ｄ’はオフセットであり、Ｓ’はＳと同じまたは異なるシフト値であり、Ｆ’はｘの分数部分におけるビット数に基づいている、ステップと、
ｙのＦ個の最小位ビットに基づいて垂直フィルタを選択し、ｙの残りのビットに基づいてフィルタされる垂直整数位置を選択するステップであって、前記ベースレイヤ画像データの垂直補間は、前記垂直整数位置で前記垂直フィルタを使用する、ステップと、
ｘのＦ’個の最小位ビットに基づいて水平フィルタを選択し、ｘの残りのビットに基づいてフィルタされる水平整数位置を選択するステップであって、前記ベースレイヤ画像データの水平補間は、前記水平整数位置で前記水平フィルタを使用する、ステップと、を含む、ステップと、
増大レイヤを復号するステップと、を含む、ステップと、
前記再構成された映像を前記ディスプレイ上に出力するステップと
を含む
ことを特徴とするシステム。