JP2011517237A

JP2011517237A - ビデオ・コーディングにおける補間のための予測技法

Info

Publication number: JP2011517237A
Application number: JP2011504209A
Authority: JP
Inventors: イエ、ヤン; カークゼウィックズ、マルタ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2008-04-10
Filing date: 2009-04-10
Publication date: 2011-05-26
Also published as: CA2719215A1; CN101990759A; US8831086B2; CN101990759B; EP2277316A1; TW201004362A; KR101202632B1; WO2009126911A1; BRPI0910635A2; US20090257668A1; KR20100133004A

Abstract

本開示では、ビデオ符号化および／または復号プロセスの予測段階中に符号器および復号器によって適用されるフィルタ処理技法について説明する。フィルタ処理技法は、部分補間中に使用される予測データの精度を向上させ、ピクセルの整数ブロックの予測データを改善することができる。本開示には、補間のために使用できる有用な１２ピクセル・フィルタ・サポート、係数対称性およびピクセル対称性を使用して、補間のためのフィルタ・サポートを構成するために符号器と復号器との間で送信する必要があるデータ量を低減する技法、およびサブピクセル補間と同様の方法で整数ピクセル・ロケーションにおいてデータをフィルタ処理するための技法を含む、いくつかの態様がある。本開示の他の態様は、使用されるフィルタのタイプ、場合によっては使用されるフィルタ係数を搬送するために、ビット・ストリーム中の情報を符号化するための技法に関する。フィルタ係数の予測コーディングについても説明する。

Description

本開示は、デジタル・ビデオ符号化および復号に関し、より詳細には、ビデオ符号化および復号に使用される予測データを発生するために適用されるフィルタ処理技法に関する。

（米国特許法第１１９条に基づく優先権主張）
本出願は、その内容全体が参照により本明細書に組み込まれる、２００８年４月１０日に出願された米国仮出願第６１／０４４，０２０号、２００８年４月１０日に出願された米国仮出願第６１／０４４，０２３号、２００８年４月１１日に出願された米国仮出願第６１／０４４，２４０号、および２００８年５月３０日に出願された米国仮出願第６１／０５７，３７３号の利益を主張する。

デジタル・ビデオ機能は、デジタル・テレビ、デジタル直接ブロードキャスト・システム、ワイヤレス・ブロードキャスト・システム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップ・コンピュータ、デジタル・カメラ、デジタル録音デバイス、ビデオゲーム・デバイス、ビデオゲーム・コンソール、セルラー電話または衛星無線電話などを含む、広範囲にわたるデバイスに組み込むことができる。デジタル・ビデオ・デバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、またはＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）によって定義された規格に記載されたビデオ圧縮技法などのビデオ圧縮技法を実装して、デジタル・ビデオをより効率的に送信および受信する。ビデオ圧縮技法では、ビデオ・シーケンスに固有の冗長性を低減または除去するために空間的予測および／または時間的予測を実行することができる。

ブロック・ベースのインター・コーディングは、時間的予測を利用して、ビデオ・シーケンスの連続したコード化ユニットのビデオ・ブロック間の時間冗長性を低減または除去する非常に有用なコーディング技法である。コード化ユニットは、ビデオ・フレーム、ビデオ・フレームのスライス、ピクチャのグループ、または符号化ビデオ・ブロックの別の定義されたユニットを備えることができる。インター・コーディングの場合、ビデオ符号器は、動き推定および動き補償を実行して、２つ以上の隣接するコード化ユニットの対応するビデオ・ブロックの移動を追跡する。動き推定は、１つまたは複数の参照フレームまたは他のコード化ユニット中の対応する予測ビデオ・ブロックに対するビデオ・ブロックの変位を示す動きベクトルを発生する。動き補償は、動きベクトルを使用して、１つまたは複数の参照フレームまたは他のコード化ユニットから予測ビデオ・ブロックを発生する。動き補償の後、コード化されている元のビデオ・ブロックから予測ビデオ・ブロックを減算することによって、残差ビデオ・ブロックが形成される。

ビデオ符号器はまた、残差ブロックの通信に関連するビットレートをさらに低減するために、変換、量子化およびエントロピー・コーディングプロセスを適用することができる。変換技法は、離散コサイン変換（ＤＣＴ）または概念的に同様のプロセスを備えることができる。代替的に、ウェーブレット変換、整数変換、または他のタイプの変換を使用することができる。ＤＣＴプロセスでは、一例として、ピクセル値のセットが、周波数領域におけるピクセル値のエネルギーを表すことができる変換係数に変換される。量子化は、変換係数に適用され、一般に、任意の所与の変換係数に関連するビット数を低減するプロセスを必要とする。エントロピー・コーディングは、一連のコーディング・モード、動き情報、コード化ブロック・パターン、および量子化変換係数を一括して圧縮する１つまたは複数のプロセスを備える。エントロピー・コーディングの例には、限定はしないが、コンテンツ適応型可変長コーディング（ＣＡＶＬＣ）およびコンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）がある。

コード化ビデオ・ブロックは、予測ブロックを生成または識別するために使用できる予測情報と、コード化されているブロックと予測ブロックとの間の差を示す残差データ・ブロックとによって表される。予測情報は、予測データ・ブロックを識別するために使用される１つまたは複数の動きベクトルを備えることができる。動きベクトルが与えられれば、復号器は、残差をコーディングするために使用された予測ブロックを再構成することができる。したがって、残差ブロックのセットおよび動きベクトルのセット（場合によっては、いくつかの追加のシンタックス）が与えられれば、復号器は、最初に符号化されたビデオ・フレームを再構成することができる。連続したビデオ・フレームまたは他のタイプのコード化ユニットはしばしば極めて類似しているので、動き推定および動き補償に基づくインター・コーディングは極めて良好な圧縮を達成することができる。符号化ビデオ・シーケンスは、残差データのブロック、動きベクトル、場合によっては他のタイプのシンタックスを備えることができる。

インター・コーディングにおいて達成できる圧縮のレベルを改善するために補間技法が開発された。この場合、ビデオ・ブロックをコーディングするために使用される、動き補償中に発生された予測データを、動き推定に使用されるビデオ・フレームまたは他のコード化ユニットのビデオ・ブロックのピクセルから補間することができる。補間は、予測ハーフ・ピクセル（ハーフペル）値および予測クォーター・ピクセル（クォーターペル）値を発生するためにしばしば実行される。ハーフペル値およびクォーターペル値はサブピクセル・ロケーションに関連する。ビデオ・シーケンス中の部分移動をキャプチャするために、部分動きベクトルを使用して、サブピクセル解像度でビデオ・ブロックを識別し、それによって、整数ビデオ・ブロックよりもコード化されているビデオ・ブロックに類似した予測ブロックを与えることができる。

概して、本開示では、ビデオ符号化および／または復号プロセスの予測段階中に符号器および復号器によって適用されるフィルタ処理技法について説明する。説明するフィルタ処理技法は、部分補間中に使用される予測データの精度を向上させ、場合によっては、ピクセルの整数ブロックの予測データを改善することができる。本開示には、補間のために使用できる有用な１２ピクセル・フィルタ・サポート、係数対称性およびピクセル対称性を使用して、補間のためのフィルタ・サポートを構成するために符号器と復号器との間で送信する必要があるデータ量を低減する技法、およびサブピクセル補間と同様の方法で整数ピクセル・ロケーションにおいてデータをフィルタ処理するための技法を含む、いくつかの態様がある。本開示の他の態様は、使用されるフィルタのタイプ、場合によっては使用されるフィルタ係数を搬送するために、ビット・ストリーム中の情報を符号化するための技法に関する。フィルタ係数のための予測符号化技法についても説明する。本開示のこれらおよび他の態様は以下の説明から明らかになろう。

一例では、本開示は、ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別することと、固定補間フィルタに関連するフィルタ係数に対するフィルタ係数のセットの予測コーディングに基づいて、フィルタ係数のセットに関連する残差値を発生することと、その残差値に量子化を適用することと、量子化された残差値をエントロピー・コーディングし、符号化ビット・ストリームの一部として出力することとを備える方法について説明する。

別の例では、本開示は、フィルタ係数のセットに関連する残差値を受信することと、残差値と固定補間フィルタに関連するフィルタ係数とのセットに基づいて予測復号を使用してフィルタ係数のセットを発生することと、ビデオ・ブロックの予測復号に使用される予測データを補間するためにフィルタ係数のセットを適用することとを備える方法について説明する。

別の例では、本開示は、ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別することと、固定補間フィルタに関連するフィルタ係数に対するフィルタ係数のセットの予測コーディングに基づいて、フィルタ係数のセットに関連する残差値を発生することと、その残差値に量子化を適用することと、量子化された残差値をエントロピー・コーディングし、符号化ビット・ストリームの一部として出力することとを行うビデオ符号器を備える装置について説明する。

別の例では、本開示は、フィルタ係数のセットに関連する残差値を受信することと、残差値と固定補間フィルタに関連するフィルタ係数とのセットに基づいて予測復号を使用してフィルタ係数のセットを発生することと、ビデオ・ブロックの予測復号に使用される予測データを補間するためにフィルタ係数のセットを適用することとを行うビデオ復号器を備える装置について説明する。

別の例では、本開示は、ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別するための手段と、固定補間フィルタに関連するフィルタ係数に対するフィルタ係数のセットの予測コーディングに基づいて、フィルタ係数のセットに関連する残差値を発生するための手段と、その残差値に量子化を適用するための手段と、量子化された残差値をエントロピー・コーディングし、符号化ビット・ストリームの一部として出力するための手段とを備えるデバイスについて説明する。

別の例では、本開示は、フィルタ係数のセットに関連する残差値を受信するための手段と、残差値と固定補間フィルタに関連するフィルタ係数とのセットに基づいて予測復号を使用してフィルタ係数のセットを発生するための手段と、ビデオ・ブロックの予測復号に使用される予測データを補間するためにフィルタ係数のセットを適用するための手段とを備えるデバイスについて説明する。

本開示で説明する技法は、ハードウェア、ソフトウェア、ファームウェア、またはその任意の組合せで実装できる。ソフトウェアで実装する場合、ソフトウェアは、マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはデジタル信号プロセッサ（ＤＳＰ）など、１つまたは複数のプロセッサで実行できる。本技法を実行するソフトウェアは、最初にコンピュータ可読媒体に記憶し、プロセッサにロードして実行することができる。

したがって、本開示はまた、プロセッサによって実行されたとき、ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別することと、固定補間フィルタに関連するフィルタ係数に対するフィルタ係数のセットの予測コーディングに基づいて、フィルタ係数のセットに関連する残差値を発生することと、その残差値に量子化を適用することと、量子化された残差値をエントロピー・コーディングし、符号化ビット・ストリームの一部として出力することとをプロセッサに行わせる命令を備えるコンピュータ可読記憶媒体を企図する。

別の例では、本開示は、プロセッサによって実行されたとき、フィルタ係数のセットに関連する残差値を受信することと、残差値と固定補間フィルタに関連するフィルタ係数とのセットに基づいて予測復号を使用してフィルタ係数のセットを発生することと、ビデオ・ブロックの予測復号に使用される予測データを補間するためにフィルタ係数のセットを適用することとをプロセッサに行わせる命令を備えるコンピュータ可読記憶媒体について説明する。

本開示の１つまたは複数の態様の詳細について添付の図面および以下の説明において述べる。本開示で説明する技法の他の特徴、目的、および利点は、これらの説明および図面、ならびに特許請求の範囲から明らかになろう。

本開示の技法を実装することができる１つの例示的なビデオ符号化および復号システムを示すブロック図。本開示に一致するフィルタ処理技法を実行することができるビデオ符号器の例を示すブロック図。予測データに関連する整数ピクセル位置と、補間予測データに関連するサブピクセル位置とを示す概念図。９つのサブピクセル・ロケーションに関する１２ピクセル・フィルタ・サポートを示す概念図。３つの水平サブピクセル・ロケーションに関する水平６ピクセル・フィルタ・サポートと、３つの垂直サブピクセル・ロケーションに関する垂直６ピクセル・フィルタ・サポートとを示す概念図。整数ピクセル・ロケーションをフィルタ処理するための５ピクセル×５ピクセル・フィルタ・サポートを示す概念図。本開示に一致する、４つの整数ピクセル位置と、フィルタ係数のためのピクセル対称性を使用することができるピクセル位置をグループ化するための陰影付きの１５個のサブピクセル位置とを示す概念図。サブピクセルに対する６つの水平線形ピクセル・サポート位置を、係数対称性を示す陰影付きで示す概念図。サブピクセルに対する６つの水平線形ピクセル・サポート位置を、係数対称性の欠如を示す陰影付きで示す概念図。サブピクセルに対する６つの垂直線形ピクセル・サポート位置を、係数対称性を示す陰影付きで示す概念図。サブピクセルに対する６つの垂直線形ピクセル・サポート位置を、係数対称性の欠如を示す陰影付きで示す概念図。サブピクセルに対する１２個の２次元ピクセル・サポート位置を、係数対称性の欠如を示す陰影付きで示す概念図。サブピクセルに対する１２個の２次元ピクセル・サポート位置を、係数対称性を示す陰影付きで示す概念図。サブピクセルに対する１２個の２次元ピクセル・サポート位置を、係数対称性を示す陰影付きで示す概念図。サブピクセルに対する１２個の２次元ピクセル・サポート位置を、係数対称性を示す陰影付きで示す概念図。本明細書で説明する方法で符号化されたビデオ・シーケンスを復号することができるビデオ復号器の例を示すブロック図。本開示に一致する１２ピクセル・フィルタ・サポートを利用するビデオ符号器の例示的な動作を示す流れ図。本開示に一致する１２ピクセル・フィルタ・サポートを利用するビデオ復号器の例示的な動作を示す流れ図。本開示に一致する係数対称性およびピクセル対称性を利用するビデオ符号器の例示的な動作を示す流れ図。本開示に一致する係数対称性およびピクセル対称性を利用するビデオ復号器の例示的な動作を示す流れ図。本開示に一致する、整数ピクセル・ロケーションのフィルタ処理を利用して、調整された整数ピクセル値を発生するビデオ符号器の例示的な動作を示す流れ図。本開示に一致する、整数ピクセル・ロケーションのフィルタ処理を利用して、調整された整数ピクセル値を発生するビデオ復号器の例示的な動作を示す流れ図。固定フィルタまたは適応フィルタに基づくビデオ・コーディングのレートひずみ定義補間のための技法を示す流れ図。予測コーディングを使用してフィルタ係数を符号化するための技法を示す流れ図。予測コーディングを使用してフィルタ係数を符号化するための技法を示す別の流れ図。予測コーディングを使用してフィルタ係数を復号するための技法を示す流れ図。予測コーディングできるフィルタ係数を示す概念グラフ。予測コーディングできるフィルタ係数を示す概念グラフ。予測技法が符号化に使用される整数ピクセル・フィルタ係数のアレイの例を示す図。

本開示では、ビデオ符号化および／または復号プロセスの予測段階中に符号器および復号器によって適用されるフィルタ処理技法について説明する。説明するフィルタ処理技法は、部分補間中に使用される予測データの精度を向上させ、場合によっては、ピクセルの整数ブロックの予測データを改善することができる。本開示には、補間のために使用できる有用な１２ピクセル・フィルタ・サポート、係数対称性およびピクセル対称性を使用して、補間のためのフィルタ・サポートを構成するために符号器と復号器との間で送信する必要があるデータ量を低減する技法、およびサブピクセル補間と同様の方法で整数ピクセル・ロケーションにおいてデータをフィルタ処理するための技法を含む、いくつかの態様がある。これらおよび他の技法について以下で詳細に説明する。

図１は、本開示の技法のうちの１つまたは複数を実装するために使用できる１つの例示的なビデオ符号化および復号システム１０を示すブロック図である。図１に示すように、システム１０は、通信チャネル１５を介して符号化ビデオを宛先デバイス１６に送信するソース・デバイス１２を含む。ソース・デバイス１２および宛先デバイス１６は、広範囲のデバイスのいずれかを備えることができる。場合によっては、ソース・デバイス１２および宛先デバイス１６は、いわゆるセルラー電話または衛星無線電話のワイヤレス・ハンドセットなどのワイヤレス通信デバイス、または通信チャネル１５を介してビデオ情報を伝達することができ、その場合、通信チャネル１５がワイヤレスである任意のワイヤレス・デバイスを備える。ただし、予測コーディング中のフィルタ処理および予測データの発生に関係する本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるわけではない。本技法はまた、物理的ワイヤ、光ファイバまたは他の物理媒体もしくはワイヤレス媒体を介して通信するデバイスを含む、広範囲の他の設定およびデバイスにおいて有用である。さらに、本符号化技法または復号技法は、必ずしも他のデバイスと通信するわけではないスタンドアロン・デバイスにおいても適用できる。

図１の例では、ソース・デバイス１２は、ビデオ・ソース２０と、ビデオ符号器２２と、変調器／復調器（モデム）２３と、送信機２４とを含むことができる。宛先デバイス１６は、受信機２６と、モデム２７と、ビデオ復号器２８と、ディスプレイ・デバイス３０とを含むことができる。本開示によれば、ソース・デバイス１２のビデオ符号器２２は、ビデオ符号化プロセスの一部として本開示の技法のうちの１つまたは複数を適用するように構成できる。同様に、宛先デバイス１６のビデオ復号器２８は、ビデオ復号プロセスの一部として本開示の技法のうちの１つまたは複数を適用するように構成できる。

また、図１の図示のシステム１０は例示にすぎない。本開示の様々な技法は、ブロック・ベースの予測符号化をサポートする任意の符号化デバイスによって、または、ブロック・ベースの予測復号をサポートする任意の復号デバイスによって実行できる。ソース・デバイス１２および宛先デバイス１６は、ソース・デバイス１２が宛先デバイス１６に送信するためのコード化ビデオ・データを発生するような、コーディング・デバイスの例にすぎない。場合によっては、デバイス１２、１６の各々がビデオ符号化構成要素および復号構成要素を含むので、デバイス１２、１６は、ほぼ対称的に動作することができる。したがって、システム１０は、たとえば、ビデオストリーミング、ビデオ再生、ビデオ・ブロードキャストまたはビデオ電話通信のためのビデオ・デバイス１２とビデオ・デバイス１６との間の一方向または双方向のビデオ送信をサポートすることができる。

ソース・デバイス１２のビデオ・ソース２０は、ビデオ・カメラ、あらかじめキャプチャされたビデオを含んでいるビデオ・アーカイブ、またはビデオ・コンテンツ・プロバイダからのビデオ・フィードなど、ビデオ・キャプチャ・デバイスを含むことができる。さらなる代替として、ビデオ・ソース２０はソース・ビデオとしてのコンピュータ・グラフィック・ベースのデータ、またはライブ・ビデオとアーカイブされたビデオとコンピュータ発生ビデオとの組合せを発生することができる。場合によっては、ビデオ・ソース２０がビデオ・カメラである場合、ソース・デバイス１２および宛先デバイス１６は、いわゆるカメラ付き携帯電話またはビデオ電話を形成することができる。各場合において、キャプチャされたビデオ、あらかじめキャプチャされたビデオ、またはコンピュータ発生ビデオをビデオ符号器２２によって符号化することができる。次いで、符号化ビデオ情報は、たとえば、符号分割多元接続（ＣＤＭＡ）または別の通信規格などの通信規格に従ってモデム２３によって変調され、送信機２４および通信チャネル１５を介して宛先デバイス１６に送信される。モデム２３は、信号変調のために設計された様々なミキサ、フィルタ、増幅器または他の構成要素を含むことができる。送信機２４は、増幅器、フィルタ、および１つまたは複数のアンテナを含む、データを送信するために設計された回路を含むことができる。

宛先デバイス１６の受信機２６は通信チャネル１５を介して情報を受信し、モデム２７は情報を復調する。送信機２４と同様に、受信機２６は、増幅器、フィルタ、および１つまたは複数のアンテナを含む、データを受信するために設計された回路を含むことができる。いくつかの例では、送信機２４および／または受信機２６を、受信回路と送信回路の両方を含む単一のトランシーバ構成要素内に組み込むことができる。モデム２７は、信号復調のために設計された様々なミキサ、フィルタ、増幅器または他の構成要素を含むことができる。いくつかの例では、モデム２３および２７は、変調と復調の両方を実行するための構成要素を含むことができる。

この場合も、ビデオ符号器２２によって実行されるビデオ符号化プロセスは、動き補償中に本明細書で説明する技法のうちの１つまたは複数を実装することができる。ビデオ復号器２８によって実行されるビデオ復号プロセスはまた、復号プロセスのその動き補償段階中にそのような技法を実行することができる。「コーダ」という用語は、本明細書では、ビデオ符号化またはビデオ復号を実行する専用コンピュータ・デバイスまたは装置を指すために使用される。「コーダ」という用語は、一般に、任意のビデオ符号器、ビデオ復号器、または複合符号器／復号器（コーデック）を指す。「コーディング」という用語は、符号化または復号を指す。ディスプレイ・デバイス３０は、復号されたビデオ・データをユーザに対して表示し、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイまたは別のタイプのディスプレイ・デバイスなど、様々なディスプレイ・デバイスのいずれかを備えることができる。

図１の例では、通信チャネル１５は、無線周波数（ＲＦ）スペクトルまたは１つまたは複数の物理的伝送線路など、ワイヤレスまたはワイヤードの任意の通信媒体、あるいはワイヤレスおよびワイヤード媒体の任意の組合せを備えることができる。通信チャネル１５は、ローカルエリア・ネットワーク、ワイドエリア・ネットワーク、またはインターネットなどのグローバル・ネットワークなど、パケット・ベースのネットワークの一部を形成することができる。通信チャネル１５は、一般にビデオ・データをソース・デバイス１２から宛先デバイス１６に送信するのに好適な任意の通信媒体、または様々な通信媒体の集合体を表す。通信チャネル１５は、ソース・デバイス１２から宛先デバイス１６への通信を可能にするのに有用なルータ、スイッチ、基地局、または任意の他の機器を含むことができる。

ビデオ符号器２２およびビデオ復号器２８は、代替的にＭＰＥＧ−４、Ｐａｒｔ１０、ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）として説明されるＩＴＵ−ＴＨ．２６４規格など、ビデオ圧縮規格に従って動作することができる。ただし、本開示の技法は、いかなる特定のビデオ・コーディング規格にも限定されない。図１には示されていないが、いくつかの態様では、ビデオ符号器２２およびビデオ復号器２８は、それぞれオーディオ符号器および復号器と統合でき、適切なＭＵＸ−ＤＥＭＵＸユニットまたは他のハードウェアおよびソフトウェアを含み、共通のデータ・ストリームまたは別個のデータ・ストリーム中のオーディオとビデオの両方の符号化を処理することができる。適用可能な場合、ＭＵＸ−ＤＥＭＵＸユニットはＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）など他のプロトコルに準拠することができる。

ビデオ符号器２２およびビデオ復号器２８はそれぞれ、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せとして実装できる。ビデオ符号器２２およびビデオ復号器２８の各々を１つまたは複数の符号器または復号器中に含めることができ、そのいずれかは符号化機能および復号機能を与える複合コーデックの一部としてそれぞれモバイル・デバイス、加入者デバイス、ブロードキャスト・デバイス、サーバなどに統合できる。

ビデオ・シーケンスは、一般に一連のビデオ・フレームを含む。ビデオ符号器２２は、ビデオ・データを符号化するために、個々のビデオ・フレーム内のビデオ・ブロック上で動作する。ビデオ・ブロックは、サイズを固定することも変更することもでき、指定のコーディング規格に応じてサイズが異なることがある。各ビデオ・フレームは一連のスライスを含む。各スライスは一連のマクロブロックを含むことができ、それらはサブブロック中に配置することができる。一例として、ＩＴＵ−ＴＨ．２６４規格は、ルーマ構成要素では１６×１６、８×８、または４×４、およびクロマ構成要素では８×８など、様々なブロック・サイズのイントラ予測、ならびにルーマ構成要素では１６×１６、１６×８、８×１６、８×８、８×４、４×８および４×４、およびクロマ構成要素では対応するスケーリングされたサイズなど、様々なブロック・サイズのインター予測をサポートする。ビデオ・ブロックは、ピクセル・データのブロック、または、たとえば離散コサイン変換（ＤＣＴ）もしくは概念的に同様の変換プロセスなどの変換プロセスの後の変換係数のブロックを備えることができる。

ビデオ・ブロックは、小さいほどより良い解像度が得られ、高い詳細レベルを含むビデオ・フレームの位置決めに使用することができる。一般に、マクロブロックおよび様々なサブブロックをビデオ・ブロックであると考えることができる。さらに、スライスは、マクロブロックおよび／またはサブブロックなど一連のビデオ・ブロックであると考えることができる。各スライスはビデオ・フレームの単独で復号可能な単位とすることができる。代替的に、フレーム自体を復号可能なユニットとすることができるか、またはフレームの他の部分を復号可能なユニットとして定義することができる。「コード化ユニット」という用語は、フレーム全体、フレームのスライス、または使用されるコーディング技法に従って定義される別の単独で復号可能なユニットなど、ビデオ・フレームの単独で復号可能な任意のユニットを指す。

ビデオ・ブロックを符号化するために、ビデオ符号器２２は、イントラ予測またはインター予測を実行して、予測ブロックを発生する。ビデオ符号器２２は、符号化すべき元のビデオ・ブロックから予測ブロックを減算して、残差ブロックを発生する。したがって、残差ブロックは、コード化されているブロックと予測ブロックとの間の差を示す。ビデオ符号器２２は、残差ブロックに対して変換を実行して、変換係数のブロックを発生することができる。イントラ・ベースまたはインター・ベースの予測コーディング技法および変換技法の後、ビデオ符号器２２は量子化を実行する。量子化は、一般に、係数を表すために使用されるデータ量をできるだけ低減するように係数を量子化するプロセスを指す。量子化の後、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）またはコンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）など、エントロピー・コーディング方法に従ってエントロピー・コーディングを実行することができる。ビデオ符号器２２によって実行される符号化プロセスの各ステップのそれ以上の詳細について、以下に図２でより詳細に説明する。

宛先デバイス１６において、ビデオ復号器２８が符号化ビデオ・データを受信する。ビデオ復号器２８は、ＣＡＶＬＣまたはＣＡＢＡＣなど、エントロピー・コーディング方法に従って、受信したビデオ・データをエントロピー復号して、量子化係数を得る。ビデオ復号器２８は、逆量子化（inverse quantization）（逆量子化（de-quantization））機能および逆変換機能を適用して、ピクセル領域中で残差ブロックを再構成する。ビデオ復号器２８はまた、符号化ビデオ・データ中に含まれる（たとえば、コーディング・モード、動きベクトル、フィルタ係数を定義するシンタックスなどの）制御情報またはシンタックス情報に基づいて予測ブロックを発生する。ビデオ復号器２８は、予測ブロックを再構成された残差ブロックと加算して、表示のための再構成されたビデオ・ブロックを生成する。ビデオ符号器２２によって実行される符号化プロセスの各ステップのそれ以上の詳細について、以下に図１６でより詳細に説明する。

本開示の技法によれば、ビデオ符号器２２およびビデオ復号器２８は、動き補償中に１つまたは複数の補間フィルタ処理技法を使用することができる。特に、本開示の一態様によれば、ビデオ符号器２２および／またはビデオ復号器２８は、ピクセルのブロック内の整数ピクセル位置に対応する整数ピクセル値を含む、ピクセルのブロックを得ることと、整数ピクセル値に基づいてピクセルのブロックに関連するサブピクセル位置のサブピクセル値を計算することであって、サブピクセル値を計算することが、サブピクセル位置を放射状に囲む１２個以上の整数ピクセル位置のセットに対応するフィルタ・サポート位置の２次元アレイを定義する補間フィルタを適用することを備える、計算することと、サブピクセル値の少なくともいくつかに基づいて予測ブロックを発生することと、を行うことができる。１２個以上の整数ピクセル位置のセットに対応するフィルタ・サポート位置の２次元アレイの例については、以下にさらに詳細に説明する。

本開示の別の態様によれば、ビデオ符号器２２および／またはビデオ復号器２８は、補間中に使用されるフィルタ係数の通信のためにソース・デバイス１２と宛先デバイス１６との間で通信する必要があるデータ量を低減するために、対称性の態様を利用することができる。ビデオ符号器２２は、１５個の異なるサブピクセル・ロケーションに対して、１５個のサブピクセル・ロケーションの間の係数対称性とピクセル対称性とに基づいて発生された、フィルタ係数の８つのセットを判断し、フィルタ係数の８つのセットを符号化ビット・ストリームの一部として別のデバイスに出力することができる。このようにして、８つのセットは、ピクセル対称性および係数対称性の態様とともに、すべての１５個のハーフペル位置およびクォーターペルピクセル位置に対してフィルタ係数のすべてを定義することができる。その上、垂直寸法および水平寸法における１５個のサブピクセル・ロケーションのうちの異なるサブピクセル・ロケーション間のピクセル対称性は存在するが、サブピクセル・ロケーションの１５個のセットのうちの少なくともいくつかについての対角寸法におけるピクセル対称性は存在しない。１５個のロケーションのうちの少なくともいくつかについての対角寸法におけるこのピクセル対称性の欠如により、ビデオ符号化および復号における補間およびビデオ品質を改善することができる。

宛先デバイス１６のビデオ復号器２８は、符号化ビデオ・ビット・ストリームの一部としてフィルタ係数の８つのセットを受信し、フィルタ係数の８つのセットに基づいて１５個の異なるサブピクセル・ロケーションに対応するフィルタ係数の１５個のセットを発生し、１５個の異なるサブピクセル・ロケーションのうちの１つに対応するビデオ復号のための補間予測データを、フィルタ係数の１５個のセットのうちの１つに基づいて発生し、補間予測データに基づいて１つまたは複数のビデオ・ブロックを復号することができる。

本開示の別の態様によれば、ビデオ符号器２２および／またはビデオ復号器２８は、調整された整数ピクセル値を発生するために整数ピクセル位置に対して補間様フィルタ処理を利用することができる。そのような補間様フィルタ処理は、特に照明変更、シーン・フェードインまたはフェードアウト中に圧縮を改善し、ノイズを除去し、画像フレームのシャープ化を可能にし、特にフィルタ係数に対称性が課せられないとき、連続したビデオ・フレーム間の微細な物体の動きの符号化を改善するのに役立つ。

ビデオ符号器２２および／またはビデオ復号器２８の補間様フィルタ処理技法は、ピクセルのブロック内の整数ピクセル位置に対応する整数ピクセル値を含むピクセルのブロックを得ることと、整数ピクセル位置に対応する、調整された整数ピクセル値を発生するために、ピクセルのブロック内の他の整数ピクセル値に基づいて整数ピクセル値をフィルタ処理することと、調整された整数ピクセル値に基づいて予測ブロックを発生することとを含むことができる。

本開示の別の態様によれば、ビデオ符号器２２は、第１の補間フィルタに基づいてビデオ・データの符号化のために第１の補間予測データを発生し、第２の補間フィルタに基づいてビデオ・データのビデオ符号化のために第２の補間予測データを発生し、レートひずみ分析に基づいて第１の補間予測データと第２の補間予測データとの間で選択し、その選択に基づいてビデオ・データを符号化し、その選択を示すためにシンタックスを符号化することができる。第１の補間フィルタは固定補間フィルタを備え、第２の補間フィルタは適応補間フィルタを備えることができるが、本開示は、必ずしもこれらの例に限定されるわけではない。

さらに、追加の補間予測データを発生するために、同じくレートひずみ分析中に考慮される追加の補間フィルタを適用することもできる。言い換えれば、本開示の技法は、２つの補間フィルタに基づいて第１および第２の補間予測データのみを発生することに限定されず、任意の数の補間フィルタに基づいて任意の複数の補間予測データを発生するために適用できる。重要なことには、レートひずみ分析補間予測データは、どのフィルタを選択すべきかを識別するために使用される。

一例では、方法は、複数の異なる補間フィルタに基づいてビデオ・データの符号化のための予測データの複数の異なるバージョンを発生することと、レートひずみ分析に基づいて予測データの複数の異なるバージョンの間で選択することと、その選択に基づいてビデオ・データを符号化することと、その選択を示すためにシンタックスを符号化することとを備えることができる。

本開示はまた、フィルタ係数を符号化するための技法を企図する。たとえば、ビデオ符号器２２は、ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別し、固定補間フィルタに関連するフィルタ係数に対するフィルタ係数のセットの予測コーディングに基づいて、フィルタ係数のセットに関連する残差値を発生し、その残差値に量子化を適用し、量子化された残差値を符号化ビット・ストリームの一部として出力することができる。

ビデオ復号器２８は、フィルタ係数のセットに関連する残差値を受信し、残差値と固定補間フィルタに関連するフィルタ係数とのセットに基づいて予測復号を使用してフィルタ係数のセットを発生し、ビデオ・ブロックの予測復号のために使用される予測データを補間するためにフィルタ係数のセットを適用することができる。

図２は、本開示に一致するフィルタ処理技法を実行することができるビデオ符号器５０の例を示すブロック図である。ビデオ符号器５０は、本明細書では「コーダ」と呼ぶ専用ビデオ・コンピュータ・デバイスまたは装置の一例である。ビデオ符号器５０は、デバイス２０のビデオ符号器２２、または異なるデバイスのビデオ符号器に対応することがある。ビデオ符号器５０はビデオ・フレーム内のブロックのイントラ・コーディングおよびインター・コーディングを実行することができるが、説明を簡単にするために、イントラ・コーディング構成要素は図２に示していない。イントラ・コーディングは空間的予測を利用して、所与のビデオ・フレーム内のビデオの空間的冗長性を低減または除去する。インター・コーディングは時間的予測を利用して、ビデオ・シーケンスの隣接フレーム内のビデオの時間的冗長性を低減または除去する。イントラ・モード（Ｉモード）は空間ベースの圧縮モードを指し、予測（Ｐモード）または双方向（Ｂモード）などのインター・モードは、時間ベースの圧縮モードを指す。本開示の技法はインター・コーディング中に適用し、したがって、説明を簡単で容易にするために、空間予測ユニットなどのイントラ・コーディング・ユニットは図２に示していない。

図２に示すように、ビデオ符号器５０は、符号化すべきビデオ・フレーム内のビデオ・ブロックを受信する。図２の例では、ビデオ符号器５０は、予測ユニット３２と、メモリ３４と、加算器４８と、変換ユニット３８と、量子化ユニット４０と、エントロピー・コーディング・ユニット４６とを含む。ビデオ・ブロック再構成のために、ビデオ符号器５０はまた、逆量子化ユニット４２と、逆変換ユニット４４と、加算器５１とを含む。再構成されたビデオからブロッキネス・アーティファクトを除去するためにブロック境界をフィルタ処理するデブロッキング・フィルタ（図示せず）を含めることもできる。必要な場合、デブロッキング・フィルタは一般に、加算器５１の出力をフィルタ処理するであろう。

予測ユニット３２は、動き推定（ＭＥ）ユニット３５と、動き補償（ＭＣ）ユニット３７とを含むことができる。本開示によれば、フィルタ３７は、予測ユニット３２中に含めることができ、動き推定および／または動き補償の一部として補間または補間様フィルタ処理を実行するために、ＭＥユニット３５とＭＣユニット３７の一方または両方によって起動できる。フィルタ３７は、実際は、本明細書で説明するように、多数の様々なタイプの補間および補間タイプ・フィルタ処理を可能にする複数の様々なフィルタを表すことができる。したがって、予測ユニット３２は複数の補間または補間様フィルタを含むことができる。符号化プロセス中に、ビデオ符号器５０は、コーディングすべき（図２で「ビデオ・ブロック」と標示される）ビデオ・ブロックを受信し、予測ユニット３２は、インター予測コーディングを実行して（図２で「予測ブロック」と標示される）予測ブロックを発生する。特に、ＭＥユニット３５は、動き推定を実行してメモリ３４中の予測ブロックを識別し、ＭＣユニット３７は、動き補償を実行して予測ブロックを発生することができる。

動き推定は一般に、ビデオ・ブロックの動きを推定する動きベクトルを発生するプロセスと考えられる。動きベクトルは、たとえば、現在のフレーム（または、他のコード化ユニット）内のコーディングすべきブロックに対する、予測フレームまたは参照フレーム（または、他のコード化ユニット、たとえばスライス）内の予測ブロックの変位を示すことができる。参照フレーム（または、参照フレームの部分）は、時間的に、現在のビデオ・ブロックが属するビデオ・フレーム（または、ビデオ・フレームの部分）より前に、またはその後に配置されることがある。動き補償は一般に、メモリ３４から予測ブロックをフェッチまたは発生するプロセス、あるいは、場合によっては、動き推定によって判断された動きベクトルに基づいて、フィルタ処理された予測データを補間するかまたはさもなければ発生するプロセスと考えられる。

ＭＥユニット３５は、コーディングすべきビデオ・ブロックを１つまたは複数の参照フレーム（たとえば、前のフレームおよび／または後続のフレーム）のビデオ・ブロックと比較することによって、そのビデオ・ブロックに適した動きベクトルを選択する。ＭＥユニット３５は、部分ピクセル、部分ペル、またはサブピクセル動き推定と呼ばれることがある部分ピクセル精度を用いて動き推定を実行することができる。したがって、部分ピクセル、部分ペル、およびサブピクセル動き推定という用語は、互換的に使用できる。部分ピクセル動き推定では、ＭＥユニット３５は、整数ピクセル・ロケーション以外のロケーションへの変位を示す動きベクトルを選択することができる。このようにして、部分ピクセル動き推定により、予測ユニット３２は、整数ピクセル（または、フルピクセル）ロケーションよりも高い精度を用いて動きを追跡し、したがって、より正確な予測ブロックを発生することが可能になる。部分ピクセル動き推定は、ハーフ・ピクセル精度、クォーター・ピクセル精度、８分の１ピクセル精度または任意のより微細な精度を有することができる。ＭＥユニット３５は、動き推定プロセス中に任意の必要な補間のために（１つまたは複数の）フィルタ３９を起動することができる。

部分ピクセル動き補償を実行するために、ＭＣユニット３７は、補間（補間フィルタ処理と呼ばれることがある）を実行して、サブピクセル解像度（サブピクセル値または部分ピクセル値と本明細書では呼ぶ）におけるデータを発生することができる。ＭＣユニット３７は、この補間のために（１つまたは複数の）フィルタ３９を起動することができる。予測ユニット３２は、本明細書で説明する技法を使用して補間（または、整数ピクセルの補間様フィルタ処理）を実行することができる。

コーディングすべきビデオ・ブロックのための動きベクトルがＭＥユニット３５によって選択されると、ＭＣユニット３７は、その動きベクトルに関連する予測ビデオ・ブロックを発生する。ＭＣユニット３７は、ＭＣユニット３５によって判断された動きベクトルに基づいて、メモリ３４から予測ブロックをフェッチすることができる。部分ピクセル精度をもつ動きベクトルの場合、ＭＣユニット３７は、そのようなデータをサブピクセル解像度に対して補間するために、たとえば、このプロセスのために（１つまたは複数の）フィルタ３９を起動して、メモリ３４からのデータをフィルタ処理する。場合によっては、サブピクセル予測データを発生するために使用された補間フィルタ処理技法またはモードは、コード化ビット・ストリームに含めるための、エントロピー・コーディング・ユニット４６への１つまたは複数の補間シンタックス要素として示されることがある。実際、本開示のいくつかの態様は、搬送する必要があるシンタックスの量を低減するための、ピクセル対称性および係数対称性の使用に関係する。

予測ユニット３２が予測ブロックを発生した後、ビデオ符号器５０は、コーディングされている元のビデオ・ブロックから予測ブロックを減算することによって（図２で「残差ブロック」と標示される）残差ビデオ・ブロックを形成する。加算器４８は、この減算演算を実行する１つまたは複数の構成要素を表す。変換ユニット３８は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換ブロック係数を備えるビデオ・ブロックを生成する。変換ユニット３８は、たとえば、概念的にＤＣＴと同様である、Ｈ．２６４規格によって定義される変換などの他の変換を実行することができる。ウェーブレット変換、整数変換、サブバンド変換または他のタイプの変換をも使用することができる。いずれの場合も、変換ユニット３８は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報をピクセル領域から周波数領域に変換することができる。

量子化ユニット４０は、ビットレートをさらに低減するために残差変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減することができる。量子化の後、エントロピー・コーディング・ユニット４６が量子化変換係数をエントロピー・コーディングする。たとえば、エントロピー・コーディング・ユニット４６は、ＣＡＶＬＣ、ＣＡＢＡＣ、または別のエントロピー・コーディング方法を実行することができる。

エントロピー・コーディング・ユニット４６はまた、ビデオ符号器５０の予測ユニット３２または他の構成要素から得られた１つまたは複数の予測シンタックス要素をコーディングすることができる。１つまたは複数の予測シンタックス要素は、コーディング・モード、１つまたは複数の動きベクトル、サブピクセル・データを発生するために使用された補間技法、フィルタ係数のセットまたはサブセット、あるいは予測ブロックの発生に関連する他の情報を含むことができる。係数予測および量子化ユニット４１は、本開示のいくつかの態様によれば、フィルタ係数などの予測シンタックスを予測符号化し、量子化することができる。エントロピー・コーディング・ユニット４６によるエントロピー・コーディングの後、符号化ビデオとシンタックス要素とを、別のデバイスに送信するか、あるいは後で送信または検索するためにアーカイブすることができる。

逆量子化ユニット４２および逆変換ユニット４４は、それぞれ逆量子化および逆変換を適用して、たとえば参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構成する。（図２で「再構成された残差ブロック」と標示される）再構成された残差ブロックは、変換ユニット３８に与えられる残差ブロックの再構成されたバージョンを表すことができる。再構成された残差ブロックは、量子化演算および逆量子化演算によって生じた細部の損失により、加算器４８によって発生された残差ブロックとは異なることがある。加算器５１は、再構成された残差ブロックを、予測ユニット３２によって生成された動き補償された予測ブロックに加算して、メモリ３４に記憶するための再構成されたビデオ・ブロックを生成する。再構成されたビデオ・ブロックは、後続のビデオ・フレームまたは後続のコード化ユニット中のブロックをその後コーディングするために使用できる参照ブロックとして予測ユニット３２によって使用される。

上述のように、予測ユニット３２は、部分ピクセル（または、サブピクセル）精度を用いて動き推定を実行することができる。予測ユニット３２は、部分ピクセル動き推定を使用するとき、本開示で説明する補間動作を使用してサブピクセル解像度（たとえば、サブピクセル値または部分ピクセル値）におけるデータを発生することができる。言い換えれば、補間動作を使用して、整数ピクセル位置間の位置における値を計算する。整数ピクセル位置間の距離の半分に配置されるサブピクセル位置をハーフピクセル（ハーフペル）位置と呼び、整数ピクセル位置とハーフ・ピクセル位置との間の距離の半分に配置されるサブピクセル位置をクォーター・ピクセル（クォーターペル）位置と呼び、整数ピクセル位置（または、ハーフ・ピクセル位置）とクォーター・ピクセル位置との間の距離の半分に配置されるサブピクセル位置を８分の１ピクセル（８分の１ペル）位置と呼び、以下同様である。

図３は、予測データに関連する整数ピクセル（または、フルピクセル）位置と、補間予測データに関連するサブピクセル（または、部分ピクセル）位置とを示す概念図である。図３の概念図では、異なるボックスが、フレームまたはフレームのブロック内のピクセルおよびサブピクセル・ロケーションまたは位置を表す。（実線のボックス中の）大文字は整数ピクセル・ロケーションを表し、（点線のボックス中の）小文字はサブピクセル・ロケーションを表す。特に、ピクセル・ロケーションＡ１〜Ａ６、Ｂ１〜Ｂ６、Ｃ１〜Ｃ６、Ｄ１〜Ｄ６、Ｅ１〜Ｅ６およびＦ１〜Ｆ６は、フレーム、スライスまたは他のコード化ユニット内の整数ピクセル・ロケーションの６×６アレイを表す。サブピクセル・ロケーション「ａ」〜「ｏ」は、整数ピクセルＣ３に関連する１５個のサブピクセル・ロケーション、たとえば、整数ピクセル・ロケーションＣ３とＣ４とＤ３とＤ４との間のサブピクセル・ロケーションを表す。同様のサブピクセル・ロケーションが、あらゆる整数ピクセル・ロケーションに対して存在する。サブピクセル・ロケーション「ａ」〜「ｏ」は、整数ピクセルＣ３に関連するあらゆるハーフペルおよびクォーターペルピクセル・ロケーションを表す。

整数ピクセル・ロケーションは、ビデオ・データが最初に生成されたとき、フォト・ダイオードなどの物理的センサ要素に関連することがある。フォト・ダイオードは、センサのロケーションにおける光源の強度を測定し、ピクセル強度値を整数ピクセル・ロケーションに関連付けることができる。この場合も、各整数ピクセル・ロケーションは、１５個の（または場合によってはより多くの）サブピクセル・ロケーションの関連するセットを有することができる。整数ピクセル・ロケーションに関連するサブピクセル・ロケーションの数は、所望の精度に依存することがある。図３に示す例では、所望の精度はクォーター・ピクセル精度であり、その場合、整数ピクセル・ロケーションの各々が１５個の異なるサブピクセル位置と対応する。より多いまたはより少ないサブピクセル位置は、所望の精度に基づいて各整数ピクセル・ロケーションに関連することができる。ハーフ・ピクセル精度の場合、たとえば、各整数ピクセル・ロケーションは、３つのサブピクセル位置と対応することがある。別の例として、整数ピクセル・ロケーションの各々は、８分の１のピクセル精度の場合、６３個のサブピクセル位置と対応することがある。各ピクセル・ロケーションは、１つまたは複数のピクセル値、たとえば、１つまたは複数の輝度およびクロミナンス値を定義することができる。

Ｙが輝度を表し、ＣｂおよびＣｒが３次元ＹＣｂＣｒ色空間のクロミナンスの２つの異なる値を表すことができる。各ピクセル・ロケーションは実際に、３次元色空間の３つのピクセル値を定義することができる。ただし、本開示の技法は、簡単のために１次元に対する予測に関する。技法について１次元のピクセル値に関して説明する限り、同様の技法を他の次元に拡張することができる。

図３の例では、整数ピクセル「Ｃ３」に関連するサブピクセル・ロケーションがクォーター・ピクセル精度で示される。ピクセルＣ３に関連する１５個のサブピクセル位置は、「ａ」、「ｂ」、「ｃ」、「ｄ」、「ｅ」、「ｆ」、「ｇ」、「ｈ」、「ｉ」、「ｊ」、「ｋ」、「ｌ」、「ｍ」、「ｎ」、および「ｏ」と標示される。他の整数ピクセル・ロケーションに関連する（以下でさらに詳細に説明するピクセル・ロケーションＣ３に関連する１５個の異なる部分ロケーションのうちの１つまたは複数を発生するために使用されるもの以外の）他の部分ロケーションのほとんどは、簡単のために示さない。サブピクセル・ロケーション「ｂ」、「ｈ」および「ｊ」をハーフ・ピクセル・ロケーションと呼び、サブピクセル・ロケーション「ａ」、「ｃ」、「ｄ」、「ｅ」、「ｆ」、「ｇ」、「ｉ」、「ｋ」、「ｌ」、「ｍ」、および「ｏ」をクォーター・ピクセル・ロケーションと呼ぶ。

ビデオ符号器４０の予測ユニット３２は、ＭＣユニット３７による補間フィルタ処理を使用してサブピクセル・ロケーション「ａ」〜「ｏ」のピクセル値を判断することができる。ＩＴＵ−ＴＨ．２６４規格に一致して、たとえば、予測ユニット３２は、ウィーナー・フィルタなどの６タップ補間フィルタを使用して、ハーフ・ピクセル・ロケーションのピクセル値を判断することができる。Ｈ．２６４規格の場合、６タップ補間フィルタのフィルタ係数は一般に、［１，−５，２０，２０，−５，１］であるが、他の係数を使用することができる。予測ユニット３２は最初に水平方向で、次いで垂直方向で補間フィルタを適用することができ、または、その逆も同様である。ハーフ・ピクセル位置「ｂ」および「ｈ」の場合、各タップはそれぞれ、水平方向および垂直方向の整数ピクセル位置に対応することができる。特に、ハーフ・ピクセル位置「ｂ」の場合、６タップ・フィルタのタップは、Ｃ１、Ｃ２、Ｃ３、Ｃ４、Ｃ５およびＣ６に対応する。同様に、ハーフ・ピクセル位置「ｈ」の場合、６タップ・フィルタのタップは、Ａ３、Ｂ３、Ｃ３、Ｄ３、Ｅ３およびＦ３に対応する。たとえば、サブピクセル位置「ｂ」および「ｈ」のピクセル値を、式（１）および式（２）を使用して計算することができる。

ハーフ・ピクセル位置「ｊ」の場合、６タップ・フィルタのタップは、位置Ｃ１〜Ｃ６とＤ１〜Ｄ６との間で水平に、または、位置Ａ３〜Ｆ３とＡ４〜Ｆ４との間で垂直に補間されたそれら自体に対応する。ハーフ・ピクセル・ロケーション「ｊ」を、たとえば、式（３）または式（４）のうちの１つに従って、ハーフ・ピクセル位置のあらかじめ補間されたピクセル値を使用する６タップ・フィルタを用いて計算することができる。

ただし、（図３に示すように）ａａはＡ３とＡ４との間の補間に対応し、ｂｂはＢ３とＢ４との間の補間に対応し、ｂはＣ３とＣ４との間の補間に対応し、ｈｈはＤ３とＤ４との間の補間に対応し、ｉｉはＥ３とＥ４との間の補間に対応し、ｊｊはＦ３とＦ４との間に補間に対応する。式４では、ｃｃはＣ１とＤ１との間の補間に対応し、ｄｄはＣ２とＤ２との間の補間に対応し、ｈはＣ３とＤ３との間の補間に対応し、ｅｅはＣ４とＤ４との間の補間に対応し、ｆｆはＣ５とＤ５との間の補間に対応し、ｇｇはＣ６とＤ６との間の補間に対応する。

Ｈ．２６４規格に一致して、予測ユニット３２は、双一次補間フィルタと、周囲の整数ピクセル・ロケーションおよびハーフ・ピクセル・ロケーションのピクセル値とを使用して、クォーター・ピクセル・ロケーション「ａ」、「ｃ」、「ｄ」、「ｅ」、「ｆ」、「ｇ」、「ｉ」、「ｋ」、「ｌ」、「ｍ」、「ｎ」および「ｏ」におけるピクセル値を判断することができる。たとえば、予測ユニット３２は、Ｃ３のピクセル値と「ｂ」のピクセル値とを使用して、サブピクセル位置「ａ」に関連するピクセル値を判断し、「ｂ」のピクセル値とＣ４のピクセル値とを使用して、サブピクセル位置「ｃ」に関連するピクセル値を判断し、以下同様である。

サブピクセル・ロケーションにおける補間データを発生するためにＭＣユニット３７によって適用される実際のフィルタは、多種多様な実装形態によって異なることがある。一例として、予測ユニット３２は、以下で説明する適応補間フィルタ処理（ＡＩＦ）を使用して、補間値を定義することができる。ＩＴＵ−ＴＳＧ１６／Ｑ．６／ＶＣＥＧ（ＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔＧｒｏｕｐ）委員会は、Ｈ．２６４よりも高いコーディング効率を提供するコーディング技術、特にＡＩＦを調査している。ＡＩＦは、特に高い解像度（たとえば、７２０ｉ／ｐまたは１０８０ｉ／ｐ）をもつビデオ・シーケンス上で、Ｈ．２６４規格で使用される補間フィルタ処理よりも大きいコーディング利得を提供する。ＡＩＦでは、サブピクセル位置ごとの補間フィルタは、予測誤差エネルギーを最小限に抑えることによって、ビデオ・フレームごとに分析的に計算される。これは、エイリアシング、量子化誤差および動き推定誤差、カメラノイズ、または元のビデオ・フレームおよび参照ビデオ・フレーム中に含まれる他のアーティファクトに対処するのに役立つ。次いで、フレームごとに分析的に導出された適応フィルタ係数は、予測され、量子化され、コード化され、ビデオ・ビット・ストリームで送信される。本開示の技法の一部は、ＡＩＦ方式ならびに多くの他の補間方式内で動作することができる。

多くの様々なタイプのＡＩＦ方式が、本開示の態様に一致する。たとえば、第１の方式は２次元の分離不可能なＡＩＦ（ＮＳ−ＡＩＦ）であり、第２の方式は分離可能なＡＩＦ（Ｓ−ＡＩＦ）であり、第３の方式は方向フィルタをもつＡＩＦ（Ｄ−ＡＩＦ）である。これらのＡＩＦ方式の各々は、異なる補間技法およびサポートを使用するが、すべての３つのＡＩＦ方式は、同様の分析プロセスを使用してフィルタ係数を導出することができ、以下に一例として分離不可能なＡＩＦを使用して説明する。

６×６の２次元の分離不可能なフィルタが係数

を有すると仮定し、ただし、ｉ，ｊ＝０．．．５であり、ＳＰは、図３に示す１５個のサブピクセル位置（「ａ」〜「ｏ」）のうちの１つを表す。１５個のサブピクセル位置のうちの６つ、すなわち「ａ」、「ｂ」、「ｃ」、「ｄ」、「ｈ」および「ｌ」は１次元（１Ｄ）サブピクセル位置であり、予測ユニット３２は６タップ補間フィルタを使用してそのようなデータを補間することができることに留意されたい。サブピクセル位置「ａ」、「ｂ」、「ｃ」、「ｄ」、「ｈ」および「ｌ」は、２つの整数ピクセル位置間の水平線または垂直線に配置されるという点で１Ｄである。また、参照フレーム中の整数ピクセル位置（図３のＡ１〜Ｆ６）における予測ピクセルが、ピクセル値Ｐ_ｉ，ｊ、ただしｉ，ｊ＝０．．．５をとると仮定する。すなわち、Ａ１は値Ｐ_０，０をとり、Ａ６は値Ｐ_５，０をとり、Ｆ１は値Ｐ_５，０をとり、Ｆ６は値Ｐ_５，５をとる。次いで、サブピクセル位置ＳＰにおける補間値ｐ^ＳＰ、ＳＰ∈｛ａ，．．．，ｏ｝を、以下の式を使用して予測ユニット３２によって計算することができる。

Ｓ_ｘ，ｙを位置（ｘ，ｙ）における現在のビデオ・フレーム中のピクセル値とする。

ただし、（ｍｖｘ，ｍｖｙ）は動きベクトルであり、

は動きベクトルの整数成分であり、ＦＯはフィルタオフセットである。値

は、参照フレーム中の対応するピクセル位置である。たとえば、６タップ・フィルタの場合、ＦＯ＝６／２−１＝２である。サブピクセル位置ＳＰごとに、現在のフレーム中の実際のピクセル値と補間値との間の予測誤差エネルギー（ｅ^ＳＰ）^２が、サブピクセル位置ＳＰに対応する動きベクトル精度を有するすべてのピクセルに対して、予測ユニット３２によって蓄積できる。予測誤差エネルギー（ｅ^ＳＰ）^２を、以下の式を使用して予測ユニット３２によって計算することができる。

サブピクセル位置ａ〜ｏの各々に対して、ＭＣユニット３７は、フィルタ係数

に対する（ｅ^ＳＰ）^２の導関数を計算することによって、式の個々のセットをセットアップすることができる。式の数は、この場合、現在のサブピクセル位置ＳＰに使用されるフィルタ係数の数に等しい。各２次元（２Ｄ）サブピクセル位置「ｅ」、「ｆ」、「ｇ」、「ｉ」、「ｊ」、「ｋ」、「ｍ」、「ｎ」、および「ｏ」に対して、予測ユニット３２は、６×６タップ２Ｄ補間フィルタを使用することができる。サブピクセル位置「ｅ」、「ｆ」、「ｇ」、「ｉ」、「ｊ」、「ｋ」、「ｍ」、「ｎ」、および「ｏ」は、２つの整数ピクセル位置間の垂直線または水平線に配置されないという点で２Ｄである。この場合、３６個の未知数をもつ３６個の式のシステムは、ＭＣユニット３７によって解決できる。残りの１Ｄサブピクセル位置「ａ」、「ｂ」、「ｃ」、「ｄ」、「ｈ」、および「ｌ」は、１Ｄ補間フィルタ（たとえば、１Ｄ６タップ・フィルタ）のみを必要とする。１Ｄ６タップ・フィルタの場合、６つの式のシステムは、ＭＣユニット３７によって解決できる。

（１つまたは複数の）フィルタ３９は、予測データを発生するためにＭＣユニット３７によって使用できる１つのフィルタまたは多くの様々なフィルタのセットを表すことができる。

したがって、ＡＩＦフィルタを導出し、適用する１つの例示的なプロセスは、予測ユニット３２によって実行できる以下のステップを有することができる。

１．コーディングすべきあらゆるビデオ・ブロックについて動きベクトル（ｍｖｘ，ｍｖｙ）を推定する。動き推定中に、固定補間フィルタ（たとえば、Ｈ．２６４／ＡＶＣの補間プロセス）を適用することができる。

２．これらの動きベクトルを使用して、現在のビデオ・フレームにわたってサブピクセル位置ＳＰごとに予測誤差エネルギーを蓄積する。次いで、上記の２つの予測エネルギー式に記載の予測誤差エネルギーを最小限に抑えることによって、サブピクセル位置ＳＰごとに、単独で適応型フィルタ係数

を計算する。

３．新しい動きベクトルを推定する。この動き推定プロセス中に、ステップ２で計算された適応補間フィルタを適用することができる。適応補間フィルタを使用して、エイリアシング、カメラノイズなどによって生じた動き推定誤差を低減し、より良い動き予測を達成する。

上記のように、異なるＡＩＦ方式が同じ分析プロセスを使用することができる。異なる方式間の差は、大部分、補間フィルタが分離可能であるか分離不可能であるかにかかわらず、使用される一意のフィルタ係数の数、および、使用されるフィルタ・サポート（すなわち、サブピクセル位置の少なくとも一部分を補間するために使用される整数ピクセル位置）にある。これらの方式の各々では、符号化し、ビデオ・ビット・ストリーム中で送信する必要があるフィルタ係数の数を低減するために、ＡＩＦフィルタにいくつかの対称性制約を課することがある。

ＮＳ−ＡＩＦの場合、たとえば、予測ユニット３２のＭＣユニット３７は、６つの係数を必要とする（各タップが整数ピクセル位置と対応するので６位置フィルタとも呼ばれる）１Ｄ６タップ補間フィルタを使用して、１Ｄサブピクセル位置「ａ」、「ｂ」、「ｃ」、「ｄ」、「ｈ」、および「ｌ」を補間することができる。１Ｄサブピクセルを補間するために使用される６位置フィルタの６つの係数はそれぞれ、図３に示す整数ピクセル位置のうちの１つと対応する。たとえば、サブピクセル位置「ａ」、「ｂ」、および「ｃ」の場合、係数に対応する６つの整数ピクセル位置は、Ｃ１、Ｃ２、Ｃ３、Ｃ４、Ｃ５およびＣ６であり、サブピクセル位置「ｄ」、「ｈ」、および「ｌ」の場合、係数に対応する６つの整数ピクセル位置は、Ａ３、Ｂ３、Ｃ３、Ｄ３、Ｅ３およびＦ３である。これらの整数ピクセル位置は補間フィルタの「フィルタ・サポート」を表す。

予測ユニット３２は、３６個のフィルタ係数を必要とする２Ｄ６×６補間フィルタを使用して、２Ｄサブピクセル位置「ｅ」、「ｆ」、「ｇ」、「ｉ」、「ｊ」、「ｋ」、「ｍ」、「ｎ」、および「ｏ」を補間することができる。２Ｄサブピクセルを補間するために使用される２Ｄ６×６補間フィルタの３６個の係数はそれぞれ、整数ピクセル位置Ａ１〜Ａ６、Ｂ１〜Ｂ６、Ｃ１〜Ｃ６、Ｄ１〜Ｄ６、Ｅ１〜Ｅ６およびＦ１〜Ｆ６と対応する。これらの整数ピクセル位置は補間フィルタの「フィルタ・サポート」を表す。追加の制限が課せられない、たとえば、係数対称性またはピクセル対称性がない場合、ビデオ符号器５０は、２Ｄサブピクセル位置のための３６個の係数の９つのセットと、１Ｄサブピクセル位置のための６つの係数の６つのセットとの合計３６０個の係数を符号化し、送信することがある。ビデオ・ビット・ストリーム中のその数の係数を符号化し、送信することにより、コストのかかるビット・オーバーヘッドが生じることになる。高いビット・オーバーヘッドは、今度は、ひずみの所与のレベルに対するビットレートを増大させるので、望ましくない。

フィルタ係数を送信することに関連するビット・オーバーヘッドを低減するために、補間フィルタにいくつかの対称性制限を課して、復号器２８に送信する必要がある一意のフィルタ係数の数を低減することができる。２つのタイプの対称性、すなわちピクセル対称性および係数対称性を、単独で、または組合せで課することがある。ピクセル対称性は、異なるサブピクセル位置に対して、フィルタ係数の同じセット（および、そのセットのミラーリングされ、反転され、および／または回転されたバージョン）を実施する。そのようなピクセル対称性が２つ以上のサブピクセル・ロケーションに関連するフィルタ係数に対して適用する限り、ピクセル対称性をサブピクセル対称性と呼ぶこともある。一方、係数対称性は、様々なフィルタ・サポート位置にとって他のフィルタ・サポート位置に対してある方向（たとえば、水平方向、垂直方向またはその両方）で対称的になるように、所与の補間フィルタを補間すべき所与のサブピクセル値に対して実施する。

ピクセル対称性はＮＳ−ＡＩＦで使用できる。図３を再び参照すると、

をサブピクセル位置「ａ」に対するフィルタ係数のセットとし、次いで、サブピクセル位置「ｃ」に対するフィルタ係数のセットは、

、すなわち、逆順序で、または水平に反転された同じ係数である。すなわち、サブピクセル位置「ａ」における予測ピクセル値ｐ^ａと、サブピクセル位置「ｃ」における予測ピクセル値ｐ^ｃとをそれぞれ、（８）および（９）を使用して計算することができる。

サブピクセル位置「ｄ」および「ｌ」はそれぞれ、サブピクセル位置「ａ」および「ｃ」と同じ補間フィルタ係数のセットを使用して補間できる。したがって、サブピクセル位置「ａ」および「ｃ」は、サブピクセル位置「ｄ」および「ｌ」に対するピクセル対称性を有することができる。

本開示の一態様は、サブピクセル位置「ｄ」および「ｌ」に対するサブピクセル位置「ａ」および「ｃ」との間のピクセル対称性を実際に除去することである。さらに、サブピクセル位置「ｉ」に対するサブピクセル位置「ｆ」に対してピクセル対称性を回避することがある。さらに、サブピクセル位置「ｎ」に対するサブピクセル位置「ｋ」に対してピクセル対称性を回避することがある。そのような場合、対角相関は低くなり、これらの場合に対角対称性を課することが非効率的または非効果的になる。

別の例として、

をサブピクセル位置「ｅ」のための６×６２Ｄフィルタ係数のセットとする。その場合、位置「ｇ」のためのフィルタ係数のセットは、

（水平に反転されたバージョン）である。同様に、サブピクセル位置「ｍ」のためのフィルタ係数のセットは、

（垂直に反転されたバージョン）であり、サブピクセル位置「ｏ」のためのフィルタ係数のセットは、

（最初に水平に反転され、次いで垂直に反転された）である。したがって、サブピクセル位置「ｅ」、「ｇ」、「ｍ」および「ｏ」は、ピクセル対称性を有する。上記に与えられた例と同様に、サブピクセル位置「ｂ」と「ｈ」との間の対称性、および位置「ｆ」と「ｉ」と「ｋ」と「ｎ」との間の対称性を課する。そのようなピクセル対称性制約下では、一意のフィルタセットの５つのグループ、すなわち、サブピクセルグループ「ａ」、「ｃ」、「ｄ」および「ｌ」のためのフィルタ係数の第１のセット、サブピクセルグループ「ｂ」および「ｈ」のためのフィルタ係数の第２のセット、サブピクセルグループ「ｅ」、「ｇ」、「ｍ」および「ｏ」のためのフィルタ係数の第３のセット、グループ「ｆ」、「ｉ」、「ｋ」、および「ｎ」のためのフィルタ係数の第４のセット、ならびにサブピクセルグループ「ｊ」のためのフィルタ係数の第５のセットのみが残る。

さらに、ＮＳ−ＡＩＦは、これらのフィルタセットの一部に対して、単独で、または上記のサブピクセル対称性との組合せで係数対称性制限を課することができる。場合によっては、対角係数対称性を故意に回避することができ、たとえば、対角係数対称性制約を削除することができる。一例では、サブピクセル・ロケーション「ａ」、「ｃ」、「ｄ」および「ｌ」を含むサブピクセル位置の第１のグループのためのフィルタに係数対称性を課さない。しかしながら、係数「ｂ」および「ｈ」を含むサブピクセル位置の第２のグループは、式（１０）による係数対称性を有することができる。

同様に、サブピクセル位置「ｅ」、「ｆ」、および「ｊ」を含むサブピクセル位置の第３、第４および第５のグループのための補間フィルタのための係数はそれぞれ、式（１１）、（１２）、および（１３）にそれぞれ与えられる係数対称性を有することができる。

上述のそのようなピクセル対称性および係数対称性制約下では、一意のフィルタ係数の数を、３６０（対称性制約なし）から、６（ａ）＋３（ｂ）＋２１（ｅ）＋１８（ｆ）＋６（ｊ）＝５４係数、すなわち、サブピクセル位置「ａ」を含むグループのための６つの係数、サブピクセル位置「ｂ」を含むグループのための３つの係数、サブピクセル位置「ｅ」を含むグループのための２１個の係数、サブピクセル位置「ｆ」を含むグループのための１８個の係数、およびサブピクセル位置「ｊ」を含むグループのための６つの係数まで低減することができる。したがって、ＮＳ−ＡＩＦでは、ビデオ符号器２２は、対称性制約がない場合のように３６０個ではなく、５４個の係数を符号化し、送信することができる。上述のように、５４個の係数は、上記の式（７）に基づいて分析的に解決できる。次いで、ビデオ符号器５０は、ビット・ストリーム中の係数を予測し、量子化し、（たとえば、符号付き指数ゴロム符号を使用して）コーディングし、送信することができる。フィルタ係数の予測コーディングについてのさらなる詳細については、以下にさらに詳細に論じる。係数予測および量子化ユニット４１は、本開示に一致するフィルタ係数の予測コーディングおよび量子化のために使用できる。

別のＡＩＦ方式、すなわち、Ｓ−ＡＩＦでは、予測ユニット３２は、ＮＳ−ＡＩＦで使用される分離不可能な補間フィルタの代わりに、水平方向および垂直方向で分離可能な補間フィルタを使用することができる。１Ｄサブピクセル位置の場合、予測ユニット３２（たとえば、予測ユニット３２のＭＣユニット３７）は、サブピクセル・ロケーションに応じて、水平方向フィルタのみ、または垂直方向フィルタのみを適用する。一例では、水平方向フィルタおよび垂直方向フィルタは６位置（または６タップ）フィルタを備える。予測ユニット３２は、フィルタ・サポートとして整数ピクセル位置Ｃ１、Ｃ２、Ｃ３、Ｃ４、Ｃ５、およびＣ６（図３参照）を用いて、サブピクセル位置「ａ」、「ｂ」、および「ｃ」に対して水平方向フィルタを適用し、フィルタ・サポートとして整数ピクセル位置Ａ３、Ｂ３、Ｃ３、Ｄ３、Ｅ３およびＦ３（図３参照）を用いて、サブピクセル位置「ｄ」、「ｈ」、および「ｌ」に対して垂直方向フィルタを適用する。残りのサブピクセル位置、すなわち、２Ｄサブピクセル位置に対して、予測ユニット３２は、最初に水平フィルタ処理、その後に垂直フィルタ処理を適用するか、または垂直フィルタ処理、その後に水平フィルタ処理を適用する。この場合も、分離可能な水平フィルタおよび垂直フィルタのために使用されるフィルタ係数を、上記の式（７）に従って計算することができる。対称性がなければ、Ｓ−ＡＩＦは、対称性をもたないＮＳ−ＡＩＦの場合のように、コーディングし、送信する必要がある係数の数を３６０係数から１４４係数まで低減することができる。

Ｓ−ＡＩＦは、補間フィルタの少なくともいくつかに１つまたは複数の対称性制限をさらに課することができる。ＮＳ−ＡＩＦのサブピクセル対称性とは異なり、Ｓ−ＡＩＦの場合、サブピクセル位置「ａ」および「ｃ」のために使用されるフィルタセットは、対称的、すなわち、互いを水平に反転したバージョンではない。代わりに、サブピクセル位置「ａ」および「ｃ」のために使用されるフィルタセットの係数はそれぞれ、互いと独立して、

および

として導出される。垂直移動する各サブピクセル位置に対して、サブピクセル対称性はＮＳ−ＡＩＦと同様である。すなわち、サブピクセル位置「ｄ」および「ｌ」のための係数、サブピクセル位置「ｅ」および「ｍ」のための係数、サブピクセル位置「ｆ」および「ｎ」のための係数、ならびにサブピクセル位置「ｇ」および「ｏ」のための係数はそれぞれ、互いを垂直に反転したバージョンである。たとえば、サブピクセル位置「ｄ」のための垂直フィルタの係数が

である場合、サブピクセル位置「ｌ」のための垂直フィルタの係数は

である。したがって、Ｓ−ＡＩＦ中で使用されるサブピクセル対称性は、１次元での垂直サブピクセル対称性のみを有する。しかしながら、Ｓ−ＡＩＦは水平サブピクセル対称性を有しない。Ｓ−ＡＩＦでのサブピクセル対称性は、符号化し、送信する必要がある係数の数を１４４係数から１０２係数まで低減することができる。

Ｓ−ＡＩＦは、ＮＳ−ＡＩＦのように、係数対称性を使用して、ビデオ符号器５０によって符号化し、送信する必要がある係数の数をさらに低減することもできる。Ｓ−ＡＩＦで使用される係数対称性は、Ｓ−ＡＩＦで１Ｄ（水平または垂直）６タップ・フィルタのみがあることを除いて、ＮＳ−ＡＩＦと同じとすることができる。言い換えれば、６×６２Ｄフィルタがない。Ｓ−ＡＩＦでは、各サブピクセル位置ＳＰ、ＳＰ∈｛ｂ，ｈ，ｉ，ｊ，ｋ｝に対して、フィルタ係数は、式（１４）に示す対称性を有することができる。

したがって、サブピクセル対称性と係数対称性の両方を用いて、Ｓ−ＡＩＦフィルタは一意の１Ｄ６タップ・フィルタの１１個のセットを有することができ、そのうちの５つは、各々が３つの一意の係数を有する対称的なフィルタである。残りの６つのフィルタはそれぞれ、６つの一意の係数を有することができる。この場合、ビデオ符号器２２は、ビデオ・ビット・ストリーム中の合計５１個の一意のフィルタ係数を量子化し、予測し、コーディングし、送信することができる。

別のＡＩＦ方式、Ｄ−ＡＩＦでは、予測ユニット３２は、２Ｄサブピクセル位置「ｅ」、「ｆ」、「ｇ」、「ｉ」、「ｊ」、「ｋ」、「ｍ」、「ｎ」、および「ｏ」に対して方向フィルタを使用する。方向フィルタは６タップ・フィルタを備えることができ、係数は対称性を有するので、係数のサブセットのみを送信すればよい。本明細書で説明するように、フィルタ・サポートは、サブピクセル位置を補間する際に使用される参照フレームからのピクセル位置を指す。ＭＣユニット３７は、フィルタ・サポートとして整数ピクセル位置Ａ１、Ｂ２、Ｃ３、Ｄ４、Ｅ５およびＦ６を有する６位置（または、６タップ）対角補間フィルタを用いて、サブピクセル位置「ｅ」および「ｏ」を計算することができる。予測ユニット３２は、フィルタ・サポートとして整数ピクセル位置Ａ６、Ｂ５、Ｃ４、Ｄ３、Ｅ２およびＦ１を有する６位置対角補間フィルタを用いて、サブピクセル位置「ｇ」および「ｍ」を計算することができる。予測ユニット３２は、フィルタ・サポートとして整数ピクセル位置Ａ１、Ｂ２、Ｃ３、Ｄ４、Ｅ５、Ｆ６、Ａ６、Ｂ５、Ｃ４、Ｄ３、Ｅ２、およびＦ１を有する１２位置対角補間フィルタを用いて、サブピクセル位置「ｆ」、「ｉ」、「ｊ」、「ｋ」および「ｎ」を計算することができる。

Ｄ−ＡＩＦは、ＮＳ−ＡＩＦに関して上述したのと同じサブピクセル対称性および係数対称性を使用することができる。サブピクセル対称性に関して、１５個のサブピクセル位置を補間するためのフィルタ係数の５つの一意のセットがあり、サブピクセル位置「ａ」、「ｃ」、「ｄ」および「ｌ」は同じフィルタ係数（たとえば、ミラーリングされ、反転され、および／または回転されたバージョン）を共有し、サブピクセル位置「ｅ」、「ｇ」、「ｍ」および「ｏ」は同じフィルタ係数（たとえば、ミラーリングされ、反転され、および／または回転されたバージョン）を共有し、サブピクセル位置「ｂ」および「ｈ」は同じフィルタ係数（水平フィルタである「ｂ」、および垂直フィルタである「ｈ」）を共有し、サブピクセル位置「ｆ」、「ｉ」、「ｋ」、および「ｎ」は同じフィルタ係数（たとえば、ミラーリングされ、反転され、および／または回転されたバージョン）を共有し、サブピクセル位置「ｊ」はそれ自体のフィルタ係数のセットを有する。

係数対称性に関して、「ａ」、「ｃ」、「ｄ」および「ｌ」を含む第１のサブピクセルグループのためのフィルタ係数は、６つの一意の係数を有する１Ｄ６位置フィルタを使用し（すなわち、第１のグループは対称的ではない）、第２のサブピクセルグループ「ｂ」および「ｈ」のためのフィルタ係数は、３つの一意の係数を有する１Ｄ６位置フィルタを使用し（すなわち、ｂが対称的である）、サブピクセルグループ「ｅ」、「ｇ」、「ｍ」および「ｏ」のためのフィルタ係数の第３のセットは、６つの一意の係数を有する方向６位置フィルタを使用する。グループ「ｆ」、「ｉ」、「ｋ」、および「ｎ」のためのフィルタ係数の第４のセットは、６つの一意の係数を有する１２タップ・フィルタを使用し、グループ「ｊ」のためのフィルタ係数の第５のセットは、３つの一意の係数を有する。Ｄ−ＡＩＦ方式での一意の係数の総数は、６（ａ）＋３（ｂ）＋６（ｅ）＋６（ｆ）＋３（ｊ）＝２４係数である。これらのフィルタ係数を、予測し、量子化し、コーディングし、ビデオ・ビット・ストリーム中で送信することができる。

予測ユニット３２のＭＣユニット３７は、本明細書で説明する補間技法のうちの１つまたは複数を使用してサブピクセル位置の補間の精度を向上させ、および／または、符号化し、送信する必要がある補間フィルタ係数の数を低減することができる。補間のために使用できる放射形状をもつ有用な１２ピクセル・フィルタ・サポート、係数対称性およびピクセル対称性を使用して、補間のためのフィルタ・サポートを構成するために符号器と復号器との間で送信する必要があるデータ量を低減する技法、従来の技法に対して対称性のいくつかの態様を除去するための技法、およびサブピクセル補間と同様の方法で整数ピクセル・ロケーションにおいてデータをフィルタ処理するための技法について、以下でより詳細で説明する。オフセット技法についても説明する。さらに、補間フィルタ間で選択するための技法、およびフィルタ係数を予測符号化するための技法についても説明する。

図４は、９つのサブピクセル・ロケーションに関する１２ピクセル・フィルタ・サポートを示す概念図である。本開示によれば、ＭＣユニット３７は、陰影付き整数ピクセル値に基づいて、サブピクセル位置「ｅ」、「ｆ」、「ｇ」、「ｉ」、「ｊ」、「ｋ」、「ｍ」、「ｎ」、および「ｏ」のサブピクセル値を計算することができる。この場合、サブピクセル値を計算することは、図４に示すように、サブピクセル位置を囲む１２個の（または場合によっては、より多くの）整数ピクセル位置のセットに対応するフィルタ・サポート位置の２次元アレイを定義する補間フィルタを適用することを備える。フィルタ・サポート位置は陰影付きで大文字を用いて示し、サブピクセル位置は点線と小文字のボックスとして示す。ＭＣユニット３７は、このようにして、ビデオ・ブロックのあらゆるピクセルに対してピクセルを補間し、補間されたサブピクセル値に基づいて予測ブロックを発生することができる。１２位置フィルタ・サポートは、放射形状を有し、ＮＳ−ＡＩＦで使用される３６個の位置フィルタ・サポートと同様の周波数応答を有するが、補間の複雑さはかなり低減されている。

図３から諒解できるように、サブピクセル値は１５個のハーフペル値およびクォーターペル値を備えることができる。フィルタ・サポート位置の２次元アレイを定義する補間フィルタは、図４に示すように１５個のハーフペル値およびクォーターペル値のうちの９つを定義するために適用される。

サブピクセル位置を囲む、１２個以上の整数ピクセル位置のセットは、図４に陰影付きで示されており、９つのハーフペル値およびクォーターペル値を囲む４つの整数ピクセル位置Ｃ３、Ｃ４、Ｄ３およびＤ４、ならびに４つの整数ピクセル位置を囲む８つの整数ピクセル位置Ｂ３、Ｂ４、Ｃ２、Ｃ５、Ｄ２、Ｄ５、Ｅ３およびＥ４を含むことができる。図４に示すフィルタ・サポート位置の２次元アレイ中のフィルタ・サポート位置の各々は、サブピクセル位置に対する２つの整数ピクセル位置内にある。そのようなフィルタ処理は、ビデオ符号器５０（図２）によるビデオ符号化プロセス中に、またはビデオ復号器６０（図１６）によるビデオ復号プロセス中に、動き補償の一部を形成することができる。ビデオ符号化プロセス中に、予測ユニット３２は、予測シンタックス要素の一部として係数値の複数のセットをエントロピー・コーディング・ユニット４６にフォワーディングする。図４に示すように、サブピクセル位置を囲む１２個以上の整数ピクセル位置のセットは、放射形状を有し、補間フィルタ（たとえば、図２の（１つまたは複数の）フィルタ３９）によって定義された９つのハーフペル値およびクォーターペル値に空間的に最も近い整数ピクセル位置のセットを備えることができる。

エントロピー・コーディング・ユニット４６は、係数値のセットを符号化し、符号化ビット・ストリームの一部として補間フィルタの係数値を出力し、次いで、符号化ビット・ストリームは別のデバイスに送信される。図４に示す各異なるサブピクセル・ロケーションに関して定義された係数値の複数のセットの各々は、１２個以上の整数ピクセル位置に対して異なる重み付けを定義することができる。係数値のＭ個のセットが１２個以上の整数ピクセル位置に対してＮ個の異なる重み付けを定義するように、ピクセル対称性が存在することができ、ただし、ＭおよびＮは正の整数であり、ＮはＭより大きい。言い換えれば、ピクセル対称性はピクセル・ロケーションの一部が他のピクセル・ロケーションのミラーリング、反転または回転された重み付けに依拠できるようにするので、他のサブピクセル・ロケーションとのピクセル対称性を有するロケーションに対して係数をコーディングする必要がない。

図５は、３つの水平サブピクセル・ロケーションに関する水平６ピクセル・フィルタ・サポートと、３つの垂直サブピクセル・ロケーションに関する垂直６ピクセル・フィルタ・サポートとを示す概念図である。フィルタ・サポートロケーションを陰影付きで大文字を用いて示し、サブピクセル・ロケーションを陰影なしで小文字と点線を用いて示す。ＭＣユニット３７は、フィルタ・サポート位置Ｃ１〜Ｃ６の１次元アレイを定義する線形補間フィルタを適用することによってロケーション「ａ」、「ｂ」、および「ｃ」のサブピクセル値を計算することができる。ＭＣユニット３７はまた、フィルタ・サポート位置Ａ３〜Ｆ３の１次元アレイを定義する線形補間フィルタを適用することによってロケーション「ｄ」、「ｈ」、および「ｌ」のサブピクセル値を計算することができる。このようにして、線形補間フィルタは、図３に示す１５個のハーフペル値およびクォーターペル値のうちの６つのために使用できる。

図６は、整数ピクセル・ロケーションをフィルタ処理するための５ピクセル×５ピクセル・フィルタ・サポートを示す概念図である。この場合、補間様フィルタ処理は、調整された整数ピクセル値を発生するために整数ピクセル・ロケーションに関して適用できる。図６では、たとえば、位置Ｃ３における整数ピクセル値は、５×５ピクセルアレイＡ１〜Ａ５、Ｂ１〜Ｂ５、Ｃ１〜Ｃ５、Ｄ１〜Ｄ５およびＥ１〜Ｅ５に基づいてフィルタ処理できる。他のフィルタ・サポートを整数フィルタ処理に対して定義することができる。この場合、ＭＥユニット３５が整数ピクセルのブロックを識別する場合、ＭＣユニット３７は、フィルタ処理された整数ピクセル値を発生するために、図６に示す５×５ピクセルアレイ（または他のフィルタ・サポート）に基づいて、各ピクセルをフィルタ処理することができる。このようにして、補間様フィルタ処理を整数ピクセルに適用することができ、それにより、照明変更、あるいはシーン・フェードインまたはフェードアウト時における符号化を改善することができる。さらに、整数フィルタ処理は、ノイズを除去し、画像フレームのシャープ化を可能にし、特にフィルタ係数に対称性が課せられないとき、連続したビデオ・フレーム間の微細な物体の動きの符号化を改善するのに役立つ。整数ペルフィルタ処理はまた、焦点変更を有するビデオ・シーケンスの品質および／または圧縮を改善することに極めて有用である。

したがって、ビデオ符号器２２および／またはビデオ復号器２８は、調整された整数ピクセル値を発生するために整数ピクセル位置に対して補間様フィルタ処理を利用することができる。ビデオ符号器２２またはビデオ復号器２８は、たとえば、ピクセルのブロック内に整数ピクセル位置に対応する整数ピクセル値を含む、ピクセルのブロックを得ることができる。ビデオ符号器２２またはビデオ復号器２８は、整数ピクセル位置に対応する調整された整数ピクセル値を発生するために、ピクセルのブロック内の他の整数ピクセル値に基づいて整数ピクセル値をフィルタ処理し、調整された整数ピクセル値に基づいて予測ブロックを発生することができる。次いで、予測ブロックを使用して、プロセスが符号化中に、または復号中に実行されるかに応じて、ビデオ・ブロックを符号化または復号することができる。

符号化プロセス中に本技法を実行した場合、ビデオ符号器２２は、符号化されている現在のビデオ・ブロックと予測ブロックとの間の差として残差ビデオ・ブロックを発生することができる。ビデオ符号器２２はまた、整数フィルタ処理のためにコード化ユニット当たりフィルタ係数の１つのセットを符号化するか、または場合によっては、コード化ユニット内の異なるロケーションにおける整数フィルタ処理のためにコード化ユニット当たりフィルタ係数の２つ以上のセットを符号化することができる。図６の例では、整数フィルタ処理のためのフィルタ・サポートは、２次元フィルタ、たとえば、オフセットをもつ５×５フィルタを定義することができる。さらに、フィルタ処理のために使用される少なくともいくつかの係数間に係数対称性が存在するので、フィルタのためのすべての２５個の係数を判断するためには、２５個の異なる係数のサブセットのみがあればよい。他の多くのフィルタサイズおよび形状を整数ペルフィルタ処理に従って使用することができる。

整数ペルフィルタ処理が復号プロセス中に実行される場合、本技法は、復号されている現在のビデオ・ブロックに関連する残差ビデオ・ブロックと予測ブロックとの和として再構成されたビデオ・ブロックを発生することを備えることができる。この場合、復号デバイス（たとえば、宛先デバイス１６）は、整数フィルタ処理のためにコード化ユニット当たりフィルタ係数の１つのセットを受信するか、または、コード化ユニット内の異なるロケーションにおける整数フィルタ処理のためにコード化ユニット当たりフィルタ係数の２つ以上のセットを受信することができる。各コード化ユニットは、整数ペルフィルタ処理係数の１つまたは複数のセット、ならびにサブペルフィルタ処理係数のセット、たとえば、ハーフペル位置およびクォーターペル位置のためのすべて１５個のセットを発生するために使用できる８つのセットを有することができる。

この場合も、整数ピクセル値の補間様フィルタ処理は、特に照明変更、シーン・フェードインまたはフェードアウト中に圧縮を改善し、ノイズを除去し、画像フレームのシャープ化を可能にし、特にフィルタ係数に対称性が課せられないとき、連続したビデオ・フレーム間の微細な物体の動きの符号化を改善するのに役立つ。さらに、整数ペルフィルタ処理はまた、たとえば、焦点変更を有するビデオ・シーケンス中で、圧縮を改善するのに極めて有用であることがわかる。

従来では、補間様フィルタ処理をＡＩＦでの整数ピクセル位置に対して実行しない。代わりに、参照フレーム中の対応する整数ピクセル位置を単に「そのまま」使用する。しかしながら、本開示によれば、フィルタを補間と同様の方法で整数ピクセル・ロケーションのために使用することができる。整数ピクセル位置のピクセル値はすでに存在するので、整数ピクセル位置に対する補間フィルタ処理は、技術的に誤った名称である。したがって、整数ピクセル位置のフィルタ処理を、本明細書では補間様フィルタ処理と呼び、新しい調整されたピクセル値を発生するために整数ピクセル値を単にフィルタ処理することとして考える。

目的が参照フレーム中に存在しない値を得ることである、サブピクセル位置のための補間フィルタ処理とは異なり、参照フレーム中の整数位置におけるピクセルはすでに存在する。それでも、参照フレーム中の整数ピクセル位置に対してフィルタ処理を適用することは、いくつかの利益を提供する。たとえば、整数ピクセル位置がオフセットを含むとき、整数ピクセル位置のフィルタ処理により、フレーム間の照明変更をより良くキャプチャすることが可能になる。さらに、整数ピクセル位置に対するフィルタ処理により、整数ピクセル位置がフェードインおよびフェードアウトなどの特殊効果をキャプチャすることが可能になる。整数ピクセル位置に対するフィルタ処理により、いくつかの（カメラノイズなどの）信号ノイズを除去することもでき、および／または、必要な場合、シャープ化を実行する。さらに、整数ピクセル・フィルタに対して対称性が課せられない場合、整数ピクセル・フィルタは、クォーター・ピクセルの倍数ではない物体移動などの微細な物体の移動をキャプチャするのに役立つ。最後に、焦点変更が発生するとき、整数ピクセル・フィルタ処理はまた、ビデオ・シーケンスの圧縮を改善することに有用である。

いくつかの例では、整数ピクセル位置の補間フィルタ処理は動きベクトルに依存することがある。言い換えれば、予測ユニット３２のＭＣユニット３７は、ＭＥユニット３５によって識別される動きベクトルに基づいて補間フィルタ処理を適応的に適用することができる。たとえば、動きベクトルが整数ピクセル位置を指すとき、整数ピクセル位置の補間フィルタ処理を実行することができる。補間フィルタ処理により、整数ピクセル位置の調整されたピクセル値が生じる。動きベクトルがサブピクセル位置を指すとき、整数ピクセル位置のフィルタ処理を整数ピクセル値に関して実行しないが、そのフィルタ処理をサブピクセル値の補間のために使用することができる。このようにして、整数ピクセル・フィルタ処理は動きベクトルに基づいて適応していると考えることができる。

整数ピクセル位置の場合、式（１５）の形態の５×５補間フィルタを、サブピクセル位置フィルタを導出するために使用される同じ分析プロセスを使用して導出することができる。

ただし、ｐ^ＦＰはフィルタ処理された整数ピクセル値であり、Ｐ_ｉ，ｊは位置（ｉ，ｊ）における整数ピクセル値であり、ｈ^ＦＰ _ｉ，ｊは位置（ｉ，ｊ）のための係数であり、ｏ^ＦＰはフィルタオフセットである。いくつかの例では、整数ピクセル位置のための補間フィルタは、フィルタオフセットを有していないことがある（すなわち、ｏ^ＦＰ＝０）。他の例では、フィルタオフセットｏ^ＦＰはいくつかの技法のいずれかを使用することができる。サブピクセル位置ごとに異なるオフセットを定義することができ、たとえば、図３に示すサブピクセル位置ごとに異なる１５個のオフセットを定義することができる。整数ピクセルに対して別のオフセットを定義することができ、オフセットの総数は１６になる。参照により本明細書に組み込まれる、本出願と同じ日に出願され、整理番号第０８１３９９Ｕ２号を有し、Ｋａｒｃｚｅｗｉｃｚらによって出願された、同時係属および同一出願人による「OFFSETS AT SUB-PIXEL RESOLUTION」と題する米国特許出願第号は、異なるピクセル・ロケーションおよびサブピクセル・ロケーションのための多くのオフセットの使用について多くの追加の詳細を与える。

送信すべきフィルタ係数の数を低減するために、式（１６）に記載の係数対称性を、整数ピクセル・フィルタに課することができる。

係数対称性の他の形態を使用することもできる。係数対称性を課するどうかは、符号器によって決定され、復号器に知らされる。（１６）に記載の対称性が整数ピクセル・フィルタに対して使用された場合、９つのフィルタ係数と１つのオフセットとを復号器に送信する必要がある。

オフセットのコーディングは、最初に整数オフセットをコーディングし、次いで各部分オフセットをコーディングすることによって行われる。この場合、整数オフセットおよび部分オフセットを別様にコーディングする。整数オフセットは、符号付き指数ゴロム符号を使用してコーディングできる。整数オフセットの絶対値に応じて、部分オフセットを整数オフセットとは別様に量子化することができる。たとえば、整数オフセットが大きい絶対値を有するとき、より粗いレベルの量子化を部分オフセットに対して適用することができる。量子化の後、固定長符号を使用して部分オフセットをコーディングすることができる。一例として、以下の擬似コードに、整数オフセット値に基づいて定義された異なる固定長符号を使用して所与の部分オフセットをコーディングする方法を示す。

オフセットＩを整数オフセットとする。

オフセットＦを部分オフセットとする。

オフセットＦビットを、オフセットＦを量子化するために使用されるビット数とする。

ａｂｓ（ａ）をａの絶対値とする。

この場合、ビデオ符号器５０は、オフセット値の各々に対して、第１のビット数を所与のオフセット値の整数部分に割り当て、第２のビット数を所与のオフセット値の小数部分に割り当てる係数予測および量子化ユニット４１を使用することができ、第１および第２のビット数は、整数部分の絶対値に基づいて判断される。この場合、オフセット値の量子化バージョンは、オフセット値の量子化が上記の擬似コードに一致して実行された後、予測シンタックス要素として予測ユニット３２からフォワーディングされる。いずれの場合も、ビデオ符号器５０は、第２のビット数とは別様に第１のビット数を符号化することができる。

図７は、本開示に一致する、４つの整数ピクセル位置と、フィルタ係数のためのピクセル対称性を使用することができるピクセル位置をグループ化するための陰影付きの１５個のサブピクセル位置とを示す概念図である。特に、図７は、整数ピクセル位置Ｃ３に対応するサブピクセル位置「ａ」〜「ｏ」を示す。図７に示すサブ整数ピクセル位置は、図４および図５のサブ整数ピクセル位置に対応する。すなわち、サブピクセル・ロケーション「ｅ」、「ｆ」、「ｇ」、「ｉ」、「ｊ」、「ｋ」、「ｍ」、「ｎ」、および「ｏ」は、図４に示す１２ピクセル・サポートによって判断された値を有することができるが、サブピクセル・ロケーション「ａ」、「ｂ」、および「ｃ」、ならびにサブピクセル・ロケーション「ｄ」、「ｈ」、および「ｌ」は、図５に示す水平および線形ピクセル・サポートによって判断された値を有することができる。

このシナリオでは、ピクセル・ロケーション「ａ」のためのフィルタ係数がピクセル・ロケーション「ｃ」のためのフィルタ係数に対して対称的であるようにピクセル対称性を課することができる。同様に、ピクセル・ロケーション「ｄ」のためのフィルタ係数がピクセル・ロケーション「ｌ」のためのフィルタ係数に対して対称的であるようにピクセル対称性を課することができる。ピクセル・ロケーション「ｅ」のためのフィルタ係数がピクセル・ロケーション「ｇ」、「ｍ」、および「ｏ」のためのフィルタ係数に対して対称的であるようにピクセル対称性を課し、ピクセル・ロケーション「ｉ」のためのフィルタ係数がピクセル・ロケーション「ｋ」のためのフィルタ係数に対して対称的であるようにピクセル対称性を課し、ピクセル・ロケーション「ｆ」のためのフィルタ係数がピクセル・ロケーション「ｎ」のためのフィルタ係数に対して対称的であるようにピクセル対称性を課することができる。したがって、復号器がすべての１５個のピクセル・ロケーションのための係数値の完全なセットを発生することができるためには、ビデオ・ビット・ストリームの一部として係数値の８つのセットのみを通信すればよい。さらに、係数の任意の所与のセットに対して、係数対称性は、係数値のサブセットのみを送信できるようにし、復号器は、サブセットおよび係数対称性に基づいて、所与のピクセル・ロケーションのための係数値の完全なセットを発生することができる。

本開示の一態様は、サブピクセル位置「ｄ」および「ｌ」に対するサブピクセル位置「ａ」および「ｃ」との間のピクセル対称性を実際に除去することである。さらに、サブピクセル位置「ｉ」に対するサブピクセル位置「ｆ」に対してピクセル対称性を回避することがある。さらに、サブピクセル位置「ｎ」に対するサブピクセル位置「ｋ」に対してピクセル対称性を回避することがある。そのような場合、対角相関は低くなり、対角対称性を課することが非効率的または非効果的になる。このように、係数のすべての１５個のセットを発生するために使用される係数の８つのセットは、ピクセル・ロケーションの一部に対して対角寸法における対称性を回避する限り、一部の従来の技法よりも大きいセットとなることがある。場合によっては、垂直寸法における分散を可能にするために、対角ピクセル対称性および対角係数対称性を削除または回避することができる。

図１を再び参照すると、ビデオ符号器２２は、フィルタ係数の８つのセットを判断し、また、フィルタ係数の８つのセットを使用して、係数対称性およびピクセル対称性に基づいて１５個の異なるサブピクセル・ロケーションに対応するフィルタ係数のすべての１５個のセットを発生し、符号化ビット・ストリームの一部としてフィルタ係数の８つのセットを出力することができる。フィルタ係数の８つのセットは、符号化ビット・ストリームのあらゆるコード化ユニットに対して出力され、または場合によっては、フィルタ係数の８つのセットのうちのいくつかの発生したセットは、コード化ユニットの異なるエリアに対して出力される。

１５個のセットは、図３に示すあらゆるハーフペルおよびクォーターペルサブピクセル・ロケーションに対応し、８つのセット、係数対称性およびピクセル対称性は、あらゆるハーフペルおよびクォーターペル・サブピクセル・ロケーションのためのフィルタ・サポートを定義する。宛先デバイス１６のビデオ復号器２８は、符号化ビデオ・ビット・ストリームの一部としてフィルタ係数の８つのセットを受信し、フィルタ係数の８つのセットに基づいて１５個の異なるサブピクセル・ロケーションに対応するフィルタ係数の１５個のセットを発生し、１５個の異なるサブピクセル・ロケーションのうちの１つに対応するビデオ復号のための補間予測データを、フィルタ係数の１５個のセットのうちの１つに基づいて発生し、補間予測データに基づいて１つまたは複数のビデオ・ブロックを復号することができる。

係数対称性をもつ所与のセットが、所与のセットに関連する所与のサブピクセル・ロケーションのためのフィルタ・サポートに関連するフィルタ係数のサブセットを備えるように、フィルタ係数の８つのセットのうちの少なくともいくつかは係数対称性を有することができる。したがって、ビデオ復号器２８は、２つ以上の異なるサブピクセル・ロケーション間のピクセル対称性に少なくとも部分的に基づいて、フィルタ係数の１５個のセットを発生することができる。その上、係数対称性をもつ所与のセットが、所与のセットに関連する所与のサブピクセル・ロケーションのためのフィルタ・サポートに関連するフィルタ係数のサブセットを備えるように、ビデオ復号器２８は、２つ以上の異なるサブピクセル・ロケーション間のピクセル対称性に少なくとも部分的に基づいて、また、所与のセットのために定義された係数対称性に少なくとも部分的に基づいて、フィルタ係数の１５個のセットを発生することができる。

この場合も、１５個のセットは、あらゆるハーフペルおよびクォーターペル・サブピクセル・ロケーションに対応することができる。垂直寸法および水平寸法におけるフィルタ係数の１５個のセットのうちの異なるセット間にピクセル対称性は存在するが、フィルタ係数の１５個のセットのうちの少なくともいくつかに対する対角寸法におけるピクセル対称性は存在しない。以下でより詳細に説明するように、８つのセットのうちの２つは、水平フィルタ・サポートのための１５個のセットのうちの３つを定義し、８つのセットのうちの２つは、垂直フィルタ・サポートのための１５個のセットのうちの３つを定義し、８つのセットのうちの４つは、２次元フィルタ・サポートのための１５個のセットのうちの９つを定義することができる。２次元サポートは、放射状に９つのサブピクセル位置を囲む有用な１２位置フィルタ・サポートを備えることができる。

特に、補間予測データは、たとえば、図７に示す１５個のハーフペル値およびクォーターペル値を備えることができ、補間フィルタは、たとえば、図４に示す１２個のフィルタ・サポート位置の２次元アレイを定義し、１２個のフィルタ・サポート位置は、たとえば、図４にまた示す１５個のハーフペル値およびクォーターペル値のうちの９つを定義するために適用される。補間予測データを発生することは、たとえば、図５に示すように１５個のハーフペル値およびクォーターペル値のうちの６つのためのフィルタ・サポート位置の１次元アレイを定義する線形補間フィルタを適用することをさらに備えることができる。

水平対称性および対角対称性の欠如は、サブピクセル位置「ａ」および「ｃ」に関して、またはサブピクセル位置「ｉ」および「ｋ」に関して見られる。この場合、サブ整数ピクセル位置「ａ」および「ｃ」は水平Ｘ軸に沿って対称的であるが、これらのピクセルに対する対角軸に沿って対称性が存在しないので、サブピクセル・ロケーション「ｄ」および「ｌ」はそれぞれサブピクセル位置「ａ」および「ｃ」に対して対称的ではない。同様に、サブピクセル位置「ｉ」および「ｋ」は水平Ｘ軸に沿って対称的であるが、これらのピクセルに対する対角軸に沿って対称性が存在しないので、サブピクセル・ロケーション「ｆ」および「ｎ」はそれぞれサブピクセル位置「ｉ」および「ｋ」に対して対称的ではない。

ピクセル対称性は、第１のサブピクセル位置に対する係数の第１のセットが、第２のサブピクセル位置に対する係数の第２のセットに対して対称的であることを意味する。たとえば、ピクセル・ロケーション「ａ」はピクセル・ロケーション「ｃ」に対してピクセル対称性を有し、ピクセル・ロケーション「ｄ」はピクセル・ロケーション「ｌ」に対してピクセル対称性を有する。ピクセル・ロケーション「ｆ」はピクセル・ロケーション「ｎ」に対してピクセル対称性を有し、ピクセル・ロケーション「ｉ」はピクセル・ロケーション「ｋ」に対してピクセル対称性を有する。ピクセル・ロケーション「ｅ」は、ピクセル・ロケーション「ｇ」、「ｍ」、および「ｏ」に対してピクセル対称性を有する。図７に示す陰影は、このピクセル対称性を示しており、たとえば、共通の陰影は、他のピクセル・ロケーションに対して対称的であるピクセル・ロケーションに対応する。この場合、８つのピクセル・ロケーションのための係数は（ピクセル対称性の態様とともに）、すべての１５個のピクセル・ロケーションのための係数を定義することができる。さらに、係数の所与のセット内に係数対称性が存在することができるので、係数のそのセット中の係数のサブセットのみをビット・ストリームとともに通信すればよい。

ビデオ符号器２２は、補間予測データに基づいて符号化ビデオ・データを発生することができ、補間予測データは、１５個のハーフペル値およびクォーターペル値を備え、補間フィルタは、１５個のハーフペル値およびクォーターペル値のうちの９つを定義するために適用される１２個のフィルタ・サポート位置の２次元アレイを定義する。補間予測データに基づいて符号化ビデオ・データを発生することは、１５個のハーフペル値およびクォーターペル値のうちの６つのためのフィルタ・サポート位置の１次元アレイを定義する線形補間フィルタを適用することをさらに備えることができる。

図８は、サブピクセル位置「ｂ」に対する６つの水平線形ピクセル・サポート位置Ｃ１〜Ｃ６を、係数対称性を示す陰影付きで示す概念図である。この場合、係数対称性は、フィルタ・サポート位置Ｃ１〜Ｃ６のための係数のセット全体を定義するために、３つのフィルタ係数のみがＣ１、Ｃ２およびＣ３のためにあればよいことを意味する。Ｃ１はＣ６と対称的であり、Ｃ２はＣ５と対称的であり、Ｃ３はＣ４と対称的である。したがって、サブピクセル位置「ｂ」を補間するために必要な６つの係数のセットを定義するために、符号化ビデオ・ビット・ストリームの一部として３つの係数のみを通信すればよい。

図９は、サブピクセルに対する６つの水平線形ピクセル・サポート位置を、係数対称性の欠如を示す陰影付きで示す概念図である。したがって、サブピクセル位置「ａ」に関するフィルタ・サポートのための係数のセットを定義するためにすべての６つの係数が必要である。しかしながら、上記のように、ピクセル対称性は、サブピクセル位置「ａ」に関するこれらの同じ係数がまた、サブピクセル位置「ｃ」（図７参照）のためのフィルタ・サポートを導出するために使用できることを意味する。したがって、サブピクセル位置「ａ」および「ｃ」を補間するために必要な６つの係数のうちの２つの異なるセットを定義するために、符号化ビデオ・ビット・ストリームの一部として６つの係数のみを通信すればよい。

図１０は、サブピクセル「ｈ」に対する６つの垂直線形ピクセル・サポート位置Ａ３、Ｂ３、Ｃ３、Ｄ３、Ｅ３およびＦ３を、係数対称性を示す陰影付きで示す概念図である。この場合、係数対称性は、フィルタ・サポート位置Ａ３、Ｂ３、Ｃ３、Ｄ３、Ｅ３およびＦ３のための係数のセット全体を定義するために、Ａ３、Ｂ３およびＣ３のために３つのフィルタ係数のみがあればよいことを意味する。Ａ３はＦ３と対称的であり、Ｂ３はＥ３と対称的であり、Ｃ３はＤ３と対称的である。したがって、サブピクセル位置「ｈ」を補間するために必要な６つの係数のセットを定義するために、符号化ビデオ・ビット・ストリームの一部として３つの係数のみを通信すればよい。

図１１は、サブピクセルに対する６つの垂直線形ピクセル・サポート位置を、係数対称性の欠如を示す陰影付きで示す概念図である。したがって、サブピクセル位置「ｄ」に関するフィルタ・サポートのための係数のセットを定義するためにすべての６つの係数が必要である。しかしながら、上記のように、ピクセル対称性は、サブピクセル位置「ｄ」に関するこれらの同じ係数がまた、サブピクセル位置「ｌ」（図７参照）のためのフィルタ・サポートを導出するために使用できることを意味する。したがって、サブピクセル位置「ｄ」および「ｌ」を補間するために必要な６つの係数のうちの２つの異なるセットを定義するために、符号化ビデオ・ビット・ストリームの一部として６つの係数のみを通信すればよい。

図１２は、サブピクセル位置「ｅ」に対する１２個の２次元ピクセル・サポート位置（大文字と陰影付きで示す整数ピクセル位置）を示す概念図である。陰影は係数対称性の欠如を示す。したがって、サブピクセル位置「ｅ」に関するフィルタ・サポートのための係数のセットを定義するために、すべての１２個の係数が必要である。しかしながら、上記のように、ピクセル対称性は、サブピクセル位置「ｅ」に関するこれらの同じ係数がまた、サブピクセル位置「ｇ」、「ｍ」、および「ｏ」（図７参照）のためのフィルタ・サポートを導出するために使用できることを意味する。したがって、１２個の係数は、サブピクセル位置「ｅ」のためのフィルタ・サポートを定義し、これらの同じ係数は、サブピクセル位置「ｇ」、「ｍ」、および「ｏ」のための係数のセットを導出するために使用できる。

図１３は、サブピクセル「ｉ」に対する１２個の２次元ピクセル・サポート位置（大文字で示される整数ピクセル位置）を、係数対称性を示す陰影付きで示す概念図である。この場合、係数対称性は、フィルタ・サポート位置Ｂ３、Ｂ４、Ｃ２、Ｃ３、Ｃ４およびＣ５のためのフィルタ係数を使用して、フィルタ・サポート位置Ｅ３、Ｅ４、Ｄ２、Ｄ３、Ｄ４およびＤ５のためのフィルタ係数を定義することができることを意味する。Ｂ３はＥ３と対称的であり、Ｂ４はＥ４と対称的であり、Ｃ２はＤ２と対称的であり、Ｃ３はＤ３と対称的であり、Ｃ４はＤ４と対称的であり、Ｃ５はＤ５と対称的である。したがって、サブピクセル位置「ｉ」を補間するために必要な１２個の係数のセットを定義するために、符号化ビデオ・ビット・ストリームの一部として６つの係数のみを通信すればよい。さらに、上記のように、サブピクセル位置「ｉ」は、サブピクセル位置「ｋ」に対するピクセル対称性を有することができる。したがって、６つの係数の同じサブセットは、サブピクセル位置「ｉ」および「ｋ」のための１２個のフィルタ係数のセット全体を定義することができる。

図１４は、サブピクセル「ｆ」に対する１２個の２次元ピクセル・サポート位置（大文字で示される整数ピクセル位置）を、係数対称性を示す陰影付きで示す概念図である。この場合、係数対称性は、フィルタ・サポート位置Ｃ２、Ｄ２、Ｂ３、Ｃ３、Ｄ３およびＥ３のためのフィルタ係数を使用して、フィルタ・サポート位置Ｃ５、Ｄ５、Ｂ４、Ｃ４、Ｄ４およびＥ４のためのフィルタ係数を定義することができることを意味する。Ｃ２はＣ５と対称的であり、Ｄ２はＤ５と対称的であり、Ｂ３はＢ４と対称的であり、Ｃ３はＣ４と対称的であり、Ｄ３はＤ４と対称的であり、Ｅ３はＥ４と対称的である。したがって、サブピクセル位置「ｆ」を補間するために必要な１２個の係数のセットを定義するために、符号化ビデオ・ビット・ストリームの一部として６つの係数のみを通信すればよい。さらに、上記のように、サブピクセル位置「ｆ」は、サブピクセル位置「ｎ」に対するピクセル対称性を有することができる。したがって、６つの係数の同じサブセットは、サブピクセル位置「ｆ」および「ｎ」のための１２個のフィルタ係数のセット全体を定義することができる。

図１５は、サブピクセル「ｊ」に対する１２個の２次元ピクセル・サポート位置（大文字で示される整数ピクセル位置）を、係数対称性を示す陰影付きで示す概念図である。この場合、係数対称性は、フィルタ・サポート位置Ｂ３、Ｂ４、Ｃ２、Ｃ３、Ｃ４、Ｃ５、Ｄ２、Ｄ３、Ｄ４、Ｄ５、Ｅ３およびＥ４のための１２個の係数のセット全体を定義するために、Ｂ３、Ｃ２およびＣ３のために、３つのフィルタ係数のみがあればよいことを意味する。Ｃ３はＣ４、Ｄ３およびＤ４と対称的であり、Ｃ２はＤ２、Ｃ５およびＥ４と対称的であり、Ｂ３はＢ４、Ｅ３およびＤ５と対称的である。したがって、サブピクセル位置「ｊ」を補間するために必要な１２個の係数のセットを定義するために、符号化ビデオ・ビット・ストリームの一部として３つの係数のみを通信すればよい。

図１６は、本明細書で説明する方法で符号化されたビデオ・シーケンスを復号することができるビデオ復号器の例を示すブロック図である。ビデオ復号器６０は、本明細書では「コーダ」と呼ぶ専用ビデオ・コンピュータ・デバイスまたは装置の一例である。ビデオ復号器６０は、量子化係数および予測シンタックス要素を発生するために、受信したビット・ストリームをエントロピー復号するエントロピー復号ユニット５２を含む。予測シンタックス要素は、コーディング・モード、１つまたは複数の動きベクトル、サブピクセル・データを発生するために使用される補間技法を識別する情報、補間フィルタ処理中に使用するための係数、および／または予測ブロックの発生に関連する他の情報を含むことができる。

予測シンタックス要素、たとえば、係数は、予測ユニット５５にフォワーディングされる。予測を使用して、固定フィルタの係数に対する係数、または互いに対する係数をコーディングした場合、係数予測および逆量子化ユニット５３は、実際の係数を定義するために、シンタックス要素を復号することができる。また、量子化を予測シンタックスのいずれかに適用した場合、係数予測および逆量子化ユニット５３は、そのような量子化を除去することもできる。たとえば、本開示に従って、フィルタ係数を予測コーディングし、量子化することができ、この場合、係数予測および逆量子化ユニット５３は、そのような係数を予測的に復号し、逆量子化するためにビデオ復号器６０によって使用できる。

予測ユニット５５は、ビデオ符号器５０の予測ユニット３２に対して上記で詳細に説明したのとほとんど同じ方法で、メモリ６２に記憶されている予測シンタックス要素および１つまたは複数のあらかじめ復号されたブロックに基づいて、予測データを発生することができる。特に、予測ユニット５５は、動き補償中に本開示の補間フィルタ処理技法のうちの１つまたは複数を実行して、クォーター・ピクセル精度などの特定の精度で予測ブロックを発生することができる。したがって、本開示の技法のうちの１つまたは複数は、予測ブロックを発生する際に、ビデオ復号器６０によって使用できる。予測ユニット５５は、本開示の補間および補間様フィルタ処理技法のために使用されるフィルタを備える動き補償ユニットを含むことができる。動き補償構成要素は、説明を簡単で容易にするために図１６に示していない。

逆量子化ユニット５６は、量子化された係数を逆量子化（inverse quantize）、すなわち、逆量子化（de-quantize）する。逆量子化プロセスは、Ｈ．２６４復号のために定義されたプロセスとすることができる。逆変換ユニット５８は、ピクセル領域における残差ブロックを生成するために、変換係数に逆変換、たとえば逆ＤＣＴまたは概念的に同様の逆変換プロセスを適用する。加算器６４は、残差ブロックを、予測ユニット５５によって発生された対応する予測ブロックと加算して、ビデオ符号器５０によって符号化された元のブロックの再構成されたバージョンを形成する。必要に応じて、ブロッキネス・アーティファクトを除去するために、デブロッキング・フィルタを適用して、復号ブロックをフィルタ処理することもできる。次いで、復号ビデオ・ブロックは参照フレームストア６２に記憶され、参照フレームストア６２は参照ブロックをその後の動き補償に供給し、ドライブディスプレイ・デバイス（図１のデバイス２８など）に対して復号ビデオをも生成する。

ＮＳ−ＡＩＦ技法は、３６位置フィルタ・サポート（すなわち、２Ｄ６×６フィルタ・サポート）を有する補間フィルタを使用して、２Ｄサブピクセル位置のピクセル値を計算することができる。Ｓ−ＡＩＦは、最初に垂直寸法よりも水平方向における補間フィルタ処理のためのフィルタ・サポートとして、分離可能な整数ピクセル位置を使用する。Ｄ−ＡＩＦは、２Ｄサブピクセル位置を計算するための、ＮＳ−ＡＩＦよりも複雑ではない補間フィルタを使用する。Ｄ−ＡＩＦでは、６位置フィルタ・サポートまたは１２位置対角フィルタ・サポートのいずれかを有する補間フィルタを使用して２Ｄサブピクセル位置を計算する。

Ｄ−ＡＩＦに記載の対角フィルタ・サポートを使用することの１つの欠点は、フィルタ処理で使用される整数ピクセル位置が、補間すべき現在の位置からはるかに離れているということである。補間すべき現在の位置とフィルタ・サポートとして使用されるピクセルの位置との間の距離が増加するにつれて、空間ピクセル相関は減少する。したがって、Ｄ−ＡＩＦで使用される対角フィルタ・サポートは、正確な予測を形成することにあまり適していない。

Ｄ−ＡＩＦによって提供される同じ低複雑度を維持しながら、補間すべき位置とのより高い相関をもつピクセル（すなわち、補間すべき位置により近い、または補間すべき位置からより短い距離のピクセル位置）を使用してより良い予測を行うために、図４に示す１２位置フィルタ・サポートを補間のために使用することができる。本開示で説明する１２位置フィルタ・サポートで使用される整数ピクセル位置は、サブピクセル位置を囲む４つの整数ピクセル位置すなわち、整数ピクセル位置Ｃ３、Ｃ４、Ｄ３およびＤ４を含み、４つの整数ピクセル位置は、２Ｄサブピクセル位置のコーナーの近くに配置されるので、「コーナー」整数ピクセル位置と呼ばれる。コーナー整数ピクセル位置に加えて、コーナー整数ピクセル位置に直接隣接する１つまたは複数の整数ピクセル位置を、フィルタ・サポートで使用することもできる。コーナー整数ピクセル位置に直接隣接する整数ピクセル位置は、コーナー整数ピクセル位置のすぐ上（上部または北の方向）、あるいは、すぐ下（下部または南の方向）の整数ピクセル位置、ならびに、コーナー整数ピクセル位置のすぐ左（または西）、あるいは、すぐ右（または東）の整数ピクセル位置を含むことができる。図４に示す例では、１２位置フィルタ・サポートは、整数ピクセル・ロケーションＢ３、Ｂ４、Ｃ２、Ｃ３、Ｃ４、Ｃ５、Ｄ２、Ｄ３、Ｄ４、Ｄ５、Ｅ３およびＥ４を含むことができる。これらの整数ピクセル位置のすべては、補間すべきサブピクセルの２つの整数ピクセル位置内に配置される。

しかしながら、本開示の技法によるフィルタ・サポートは、追加の整数ピクセル・ロケーションを含むことができる。たとえば、フィルタ・サポートは、補間すべきサブピクセル位置の、放射形状を形成する３つの整数ピクセル位置内に配置された整数ピクセル・ロケーションを含むことができる。

クォーター・ピクセル位置またはより微細な解像度でも、少なくとも２つの整数ピクセル位置内に配置された整数ピクセル位置に基づいて補間できる。このように、本開示のフィルタ・サポート技法は、Ｄ−ＡＩＦによって提供される同じ低複雑度を維持しながら、補間すべき位置とのより高い相関をもつ整数ピクセルを使用して、より良い補間予測を行う。

上述のように、サブピクセル対称性は、１つまたは複数のサブピクセル位置のグループに対して、フィルタ係数の同じセット（ならびにセットのミラーリング、反転および／または回転されたバージョン）を実施することができる。式（５）における分析プロセスなどの分析プロセスを使用することは、すべてのサブピクセル位置、たとえば、クォーター・ピクセル精度の場合の１５個のサブピクセル位置に対して、補間フィルタ係数を導出するために使用できる。補間フィルタ係数の１５個のセットの間の相関の分析は、同じ寸法（たとえば、垂直または水平寸法）におけるサブピクセル位置（１Ｄサブピクセル位置と２Ｄサブピクセル位置の両方）のフィルタ係数間の比較的強い相関を明らかにする。それとは反対に、異なる対角方向におけるサブピクセル位置のフィルタ係数間の相関は、著しくより弱くなることがある。

たとえば、両方とも水平寸法にあるサブピクセル位置「ａ」と「ｃ」とのためのフィルタ係数間に高い相関が存在することがある。別の例として、両方とも垂直寸法にあるサブピクセル位置「ｄ」と「ｌ」とのためのフィルタ係数間に高い相関が存在することがある。しかしながら、水平寸法にあるサブピクセル位置「ａ」のためのフィルタ係数と、垂直寸法にあるサブピクセル位置「ｄ」のためのフィルタ係数との間には、あるとしても、ほとんど相関がない。相関のこれらの観察に基づいて、対角寸法におけるサブピクセル位置のフィルタ係数に対してサブピクセル対称性が課されないように、サブピクセル対称性を設計することができる。これは、本明細書で説明するように、いくつかの従来のプロセスのために必要となるセットよりも多いセットとすることができる係数の８つのセットをもたらす。いくつかのピクセル・ロケーションに対する対角ピクセル対称性を削除することによって、本明細書で説明するように、ビデオ符号化および圧縮を改善することができる。

この場合も、図７は、サブピクセル対称性を有するサブピクセル位置のグループに属するピクセル位置を同じ陰影（またはハッチング）付きで示す。特に、サブピクセル位置「ａ」および「ｃ」は、サブピクセル対称性を有する第１のグループを形成し、サブピクセル位置「ｄ」および「ｌ」は、サブピクセル対称性を有する第２のグループを形成し、サブピクセル位置「ｅ」、「ｇ」、「ｍ」、および「ｏ」は、サブピクセル対称性を有する第３のグループを形成し、サブピクセル位置「ｆ」および「ｎ」は、サブピクセル対称性を有する第４のグループを形成し、サブピクセル位置「ｉ」および「ｋ」は、サブピクセル対称性を有する第５のグループを形成する。サブピクセル位置「ｂ」、「ｈ」、および「ｊ」は、任意の他のサブピクセル位置とのサブピクセル対称性を有しない。したがって、サブピクセル位置「ｂ」、「ｈ」、および「ｊ」はそれぞれ、それら自体のグループ、すなわち、第６、第７および第８のグループに属するものとして考えられる。様々なタイプのフィルタ処理がコード化ユニットの様々なエリアまたは機能に対して定義された場合、（係数対称性によりサブセットとすることができる）係数の各グループは、コード化ユニット当たり１回、または場合によっては、コード化ユニット当たり複数回通信できる。整数ペル補間様フィルタ処理のための係数はまた、コード化ユニット当たり１回または数回、送信できる。

ＮＳ−ＡＩＦおよびＤ−ＡＩＦでは、同じ寸法におけるサブピクセル位置、たとえば、垂直寸法における２つのサブピクセル位置または水平寸法における２つのサブピクセル位置間にサブピクセル対称性が存在する。いくつかの従来のＮＳ−ＡＩＦおよびＤ−ＡＩＦでは、異なる寸法におけるサブピクセル位置間に対角線的にも対称性が存在する。たとえば、いくつかの従来のＮＳ−ＡＩＦおよびＤ−ＡＩＦでは、垂直寸法におけるサブピクセル位置「ａ」と水平方向におけるサブピクセル位置「ｄ」との間にサブピクセル対称性が存在する。水平、垂直および対角寸法におけるサブピクセル対称性とともに、補間フィルタ係数のわずか５つの一意のセットをクォーター・ピクセル精度に対して使用することができる。

一方、いくつかのタイプのＳ−ＡＩＦの場合、水平寸法におけるサブピクセル位置ではなく、垂直方向（または寸法）におけるサブピクセル位置間にサブピクセル対称性が存在する。言い換えれば、同じ寸法におけるサブピクセル位置に対してサブピクセル対称性が常に存在するわけではない。サブピクセル対称性はまた、対角寸法において存在しない。したがって、いくつかのＳ−ＡＩＦ方式の対称性は、補間係数のより多くのセットを必要とする。特に、クォーター・ピクセル精度の場合、いくつかのＳ−ＡＩＦ方式は、補間係数の１１個の一意のセットを必要とする。

本開示で説明し、図７に示すサブピクセル対称性方式は、ＮＳ−ＡＩＦおよびＤ−ＡＩＦのいくつかのタイプについて上述したサブピクセル対称性よりも正確な予測を生じることができる。特に、図７のサブピクセル対称性方式は、１次元において（たとえば、水平方向または垂直方向において）サブピクセル対称性を課するが、同時に両方の次元において（たとえば、対角線的に）サブピクセル対称性を課するわけではない。

サブピクセル位置に対して対角線的にサブピクセル対称性を課さないことによって、補間フィルタ係数と異なる寸法におけるサブピクセル位置との間の弱い相関は、補間に統合されない。補間係数のより多くの（たとえば、５つではなく８つの）セットが必要とされることがあるが、得られた補間予測データはより正確になることがある。ほとんど同じ方法で、対角係数対称性を回避または削除することもできる。

予測ユニット３２は、上述のように係数対称性を課することもできる。特に、係数対称性を１次元（たとえば、水平方向または垂直方向）においてフィルタ係数に対して課するが、両方の次元に対して対角的に課するわけではない。たとえば、サブピクセル位置「ｅ」のためのフィルタ係数は、式（１１）で表される上述のＮＳ−ＡＩＦ方式の場合のように対角線的に対称的にならない。係数対称性を以下に式（１７）〜（２１）で要約する。

サブピクセル位置「ｆ」、「ｉ」、および「ｊ」の場合、図４に関して詳細に説明した１２位置フィルタが使用できる例では、いくつかのフィルタ係数、すなわち、

が０に等しいことに留意されたい。したがって、本開示で説明するサブピクセルおよび係数対称性は、フィルタ・サポート技法とともに、または、フィルタ・サポート技法とは別個に使用できる。図４で説明した１２位置フィルタ・サポートとともに使用されるとき、復号器に送信する必要があるこれらのサブピクセル位置のための６（ａ）＋３（ｂ）＋６（ｄ）＋３（ｈ）＋１２（ｅ）＋６（ｆ）＋６（ｉ）＋３（ｊ）＝４５個の一意の係数、すなわち、サブピクセル位置「ａ」を含むグループのための６つの係数、サブピクセル位置「ｂ」を含むグループのための３つの係数、サブピクセル位置「ｄ」を含むグループのための６つの係数、サブピクセル位置「ｈ」を含むグループのための３つの係数、サブピクセル位置「ｅ」を含むグループのための１２個の係数、サブピクセル位置「ｆ」を含むグループのための６つの係数、サブピクセル位置「ｉ」を含むグループのための６つの係数、サブピクセル位置「ｊ」を含むグループのための３つの係数がある。

図１７は、本開示に一致する１２ピクセル・フィルタ・サポートを利用するビデオ符号器の例示的な動作を示す流れ図である。図１７の技法について図２のビデオ符号器５０の観点から説明するが、他のデバイスでも同様の技法を実行することができる。図示のように、図１７では、予測ユニット３２のＭＣユニット３７は、整数ピクセル位置に対応する整数ピクセル値を含むピクセルのブロックをメモリ３４から得る（１７１）。（１つまたは複数の）フィルタ３９は、サブピクセル位置を囲む１２個以上の位置を備えるフィルタ・サポートに基づいてサブピクセル値を計算する（１７２）。上記でより詳細に説明したように、１２位置フィルタ・サポートを使用して、１５個の可能なサブピクセル補間のうちの９つを発生することができ、線形水平および線形垂直フィルタ処理を使用して、１５個の可能なサブピクセル補間のうちの６つを発生することができる。

ＭＣユニット３７は、次いで、計算されたサブピクセル値に基づいて予測ブロックを発生する（１７３）。特に、ＭＣユニット３７は、補間サブピクセル値を備える補間予測ブロックを発生し、出力することができる。加算器４８は、次いで、たとえば、符号化されているビデオ・ブロックから補間予測ブロックを減算することによって、補間予測ブロックに基づいて現在のビデオ・ブロックを符号化（１７４）して、残差ブロックを発生する。次いで、それぞれ変換ユニット３８および量子化ユニット４０によって残差ブロックを変換および量子化する。エントロピー・コーディング・ユニット４６によるエントロピー・コーディングの後、ビデオ符号器５０は、符号化ビデオ・ビット・ストリームとフィルタ情報とを出力する（１７５）。フィルタ情報は、本明細書で説明するように、１５個のサブペル位置のための係数のすべての１５個のセットを発生するために使用される、係数の８つのセットを備えることができる。フィルタ情報は、コード化ユニットごとに１回出力され、または場合によっては、コード化ユニットの様々なエリアが様々なタイプのサブペル補間を使用するならば、コード化ユニットごとに数回出力される。

図１８は、本開示に一致する１２ピクセル・フィルタ・サポートを利用するビデオ復号器の例示的な動作を示す流れ図である。したがって、図１８のプロセスは、図１７の符号化プロセスとは逆の復号プロセスと考えることができる。図１８の技法について図１６のビデオ復号器６０の観点から説明するが、他のデバイスでも同様の技法を実行することができる。図１８に示すように、ビデオ復号器６０は、符号化ビデオ・ブロックとフィルタ情報とを受信する（１８１）。エントロピー復号ユニット５２は、この受信情報をエントロピー復号する。予測ユニット５５は、本開示の技法に従って補間動き補償を実行する。特に、予測ユニット５５は、整数ピクセル位置に対応する整数ピクセル値を含むピクセルのブロックをメモリ６２から得る（１８２）。予測ユニット５５は、受信した動きベクトルを使用して、補間をどのように実行するかを判断する。動きベクトルに基づいて、予測ユニット５５は、サブピクセル位置を囲む１２個以上の位置を備えるフィルタ・サポートに基づいてサブピクセル値を計算する（１８３）。このようにして、予測ユニット５５は、補間を使用して予測ブロックを発生する（１８４）。加算器６４を呼び出して予測ブロックを残差ブロックに加算（１８５）することによって、予測ブロックを使用して残差ビデオ・ブロックを復号する。放射状にサブピクセル位置を囲む１２位置フィルタ・サポートの使用を含む、本明細書で説明する補間の様々な態様は、従来の技法よりも優れた品質の補間データを与えることによってビデオ符号化を改善することができる。

図１９は、本開示に一致する係数対称性およびピクセル対称性を利用するビデオ符号器の例示的な動作を示す流れ図である。図１９の技法について図２のビデオ符号器５０の観点から説明するが、他のデバイスでも同様の技法を実行することができる。図示のように、図１９では、本明細書で説明するように、ビデオ符号器５０の予測ユニット３２は、係数対称性とピクセル対称性とに基づいて１５個のサブピクセル位置に対してフィルタ係数の８つのセットを定義する（２０１）。特に、予測ユニット３２は、ピクセル対称性を使用して、係数のセットを１５個から８つに低減し、さらに、所与のセットの係数間の係数対称性に基づいて、８つのセットの一部または全部について係数の数を低減することができる。予測ユニット３２は、次いで、補間フィルタ（（１つまたは複数の）フィルタ３９など）とフィルタ係数の８つのセットとを使用してビデオ・データを符号化する（２０２）。ビデオ符号器５０は、符号化ビデオ・データとフィルタ係数の８つのセットとを出力する（２０３）。補間に使用するフィルタ係数を復号デバイスに通知することができるように、符号化され、ビット・ストリーム中に出力された係数の８つのセットを、各コード化ユニット（たとえば、各フレームまたはスライス）とともに送信することができる。代替的に、コード化ユニット内の様々なロケーションにおいて様々なタイプの補間を可能にするために、係数の８つのセットの様々なグループを符号化し、各コード化ユニットとともに送信することができる。

図２０は、本開示に一致する係数対称性およびピクセル対称性を利用するビデオ復号器の例示的な動作を示す流れ図である。この場合、ビデオ復号器６０の予測ユニット５５は、フィルタ係数の８つのセットを受信（１９１）し、その８つのセットと係数対称性とピクセル対称性とに基づいてフィルタ係数の１５個のセットを発生する。予測ユニット６０は、次いで、その補間フィルタをプログラムし、そのような補間フィルタを適用して、適切に補間予測データを発生する（１９３）。ビデオ復号器６０は、次いで、たとえば、加算器６４を呼び出して、予測ユニット５５によって補間された正しい予測データを、復号すべき残差ブロックに加算し、予測データに基づいてビデオ・ブロックを復号する（１９４）。

図２１は、本開示に一致する、整数ピクセル・ロケーションのフィルタ処理を利用して、調整された整数ピクセル値を発生するビデオ符号器の例示的な動作を示す流れ図である。これについては、補間に類似し、サブ整数値を発生しない限り、補間様フィルタ処理として上述した。そうではなく、このプロセスは、元の整数値と元の整数値を囲む他の整数値とに基づいてフィルタ処理される新しい整数値を発生する。

図２１の技法について図２のビデオ符号器５０の観点から説明するが、他のデバイスでも同様の技法を実行することができる。図示のように、図２１では、予測ユニット３２のＭＣユニット３７は、整数ピクセル・ロケーションに対応する整数ピクセル値を含むピクセルのブロックをメモリ３４から得る（２１１）。予測ユニット３２の（１つまたは複数の）フィルタ３９は、調整された整数ピクセル値を発生するために、ピクセルのブロックの他の整数ピクセル値に基づいて整数ピクセル値をフィルタ処理する（２１２）。予測ユニット３２は、調整された整数ピクセル値に基づいて予測ブロックを発生（２１３）し、ビデオ符号器５０は、たとえば、加算器４８を呼び出して、符号化されているビデオ・ブロックから予測ブロックを減算して残差ブロックを発生し、予測ブロックに基づいてビデオ・ブロックを符号化（２１４）する。変換ユニット３８および量子化ユニット４０による残差ブロックの変換および量子化、ならびにエントロピー・コーディング・ユニット４６によるエントロピー・コーディングの後、ビデオ符号器５０は、符号化ビデオ・ブロックとフィルタ情報とを出力する（２１５）。サブペル補間の場合と同様に、整数ピクセル・ロケーションに対する補間様フィルタ処理は、コード化ユニットごとに１回、フィルタ情報の出力および通信に関与し、または場合によっては、コード化ユニットの様々なエリアが様々なタイプの整数補間様フィルタ処理を使用するならば、コード化ユニットごとに数回、フィルタ情報の出力および通信に関与する。

図２２は、本開示に一致する、整数ピクセル・ロケーションのフィルタ処理を利用して、調整された整数ピクセル値を発生するビデオ復号器の例示的な動作を示す流れ図である。ビデオ復号器６０の予測ユニット５５は、符号化ビデオ・ブロックを受信し、（たとえば、コード化ユニットごとに１回）フィルタ情報をも受信する（２２１）。予測ユニット５５は、整数ピクセル位置に対応する整数ピクセル値を含むピクセルのブロックをメモリ６２から得る（２２２）。予測ユニット５５は、調整された整数ピクセル値を発生するために、動き補償の一部としてフィルタ（図示せず）を呼び出して、ピクセルのブロックの他の整数ピクセル値に基づいて整数ピクセル値をフィルタ処理する（２２３）。予測ユニット５５は、調整された整数ピクセル値に基づいて予測ブロックを発生する（２２４）。ビデオ復号器６０は、次いで、たとえば、加算器６４を呼び出して、予測ユニット５５によって補間された予測ブロックを、復号すべき残差ビデオ・ブロックに加算（２２５）し、予測ブロックに基づいてビデオ・ブロックを復号する。

図２３は、候補フィルタの２つのセットに基づくビデオ・コーディングのレートひずみ定義補間のための技法を示す流れ図である。この場合、予測ユニット３２のＭＣユニット３７は、予測データの２つ以上の異なるセットを発生することができ、あるセットは候補補間フィルタの第１のセットに基づき、別のセットは候補補間フィルタの第２のセットに基づく。ＭＣユニット３７は、次いで、レートひずみに基づく分析を使用して、レートおよびひずみの観点から最良の結果を生じる補間フィルタを選択することができる。このようにして、ＭＣユニット３７は、予測データのどのセットが最良の結果（すなわち、最小ひずみ）を生じるかを考慮するだけでなく、候補フィルタ処理の１つセットがそのフィルタ係数を復号器に搬送するためのビット・オーバーヘッドがより少なくて済むことをも考慮する。

図２３に示すように、予測ユニット３２のＭＣユニット３７は、第１の補間フィルタに基づいてビデオ・データの符号化のための第１の補間予測データを発生する（２３１）。第１の補間フィルタは、一例では、ＩＴＵ−ＴＨ．２６４補間フィルタに対応するフィルタなど、特定のビデオ・コーディング規格によって定義されたフィルタに対応する固定補間フィルタを備える。精度の付加のため、場合によっては、固定補間フィルタは、クォーター・ピクセル値を発生するために使用される、ハーフ・ピクセル値の中間丸めなしのＩＴＵ−ＴＨ．２６４補間フィルタに対応することができる。この場合、固定補間フィルタは、ハーフ・ピクセル値を発生し、ハーフ・ピクセル解像度に対する補間のために、そのような値を上向きに丸めることができる。しかしながら、そのようなハーフ・ピクセル値がクォーター・ピクセル解像度に対する補間のためにも使用される限り、ＭＣユニット３７は、ハーフ・ピクセル値の丸めなしバージョンを記憶し、クォーター・ピクセル解像度に対する補間のためにハーフ・ピクセル値の丸めなしバージョンを使用することができる。参照により本明細書に組み込まれる、本出願と同じ日に出願され、整理番号第０８１３９９Ｕ１号を有し、Ｋａｒｃｚｅｗｉｃｚらによって出願された、同時係属および同一出願人による「ADVANCED INTERPOLATION TECHNIQUES FOR MOTION COMPENSATION IN VIDEO CODING」と題する米国特許出願第号は、クォーター・ピクセル値を発生するために使用される、ハーフ・ピクセル値の中間丸めなしの補間フィルタ処理について多くの追加の詳細を与える。

次に、予測ユニット３２のＭＣユニット３７は、第２の補間フィルタに基づいてビデオ・データのビデオ符号化のための第２の補間予測データを発生する（２３２）。一例では、第２の補間フィルタは適応補間フィルタを備えることができる。この場合、適応補間に一致して、ＭＣユニット３７は、使用すべきフィルタ係数を定義することができる。特に、ＭＣユニット３７は、ＭＣユニット３７が、あらかじめ設定されたフィルタ係数を用いて開始し、暫定予測データを発生し、次いで、そのようなフィルタ係数がより望ましい予測データを定義するように適応プロセスにおいてフィルタ係数を調整する、適応補間プロセスを実行することができる。

予測ユニット３２のＭＣユニット３７が、第１および第２の補間予測データを両方とも発生した後、ＭＣユニット３７は、レートひずみ分析に基づいて第１の補間予測データと第２の補間予測データとの間で選択する（２３３）。このようにして、ＭＣユニット３７は、予測データのどのセットが最良の結果（すなわち、最小ひずみ）を生じるかを考慮するだけでなく、第２の補間フィルタに対して第１の補間フィルタに必要とされる異なるデータ量（すなわち、異なるビットレート）をも考慮する。特に、（たとえば、第１の補間フィルタとして）固定補間フィルタが使用される場合、ビデオ符号器５０はビット・ストリーム中のフィルタ係数を符号化する必要はないが、（たとえば、第２の補間フィルタとして）適応補間フィルタが使用される場合、ビデオ符号器５０はフィルタ係数を符号化する必要がある。したがって、レートひずみ分析は、固定補間フィルタの使用が、フィルタ係数を復号器に搬送するために追加のビットを必要としないということを考慮することによって、予測データのどのセットが最良の結果（すなわち、最小レートひずみコスト）を生じるかを判断することができる。

より詳細には、レートひずみ分析に基づいて第１の補間予測データと第２の補間予測データとの間で選択する（２３３）ことは、ビデオ・データが第１の補間予測データによって符号化される場合、ビデオ・データに関連する第１のレートひずみコストを計算することと、ビデオ・データが第２の補間予測データによって符号化される場合、ビデオ・データに関連する第２のレートひずみコストを計算することと、第１および第２のレートひずみコストに基づいて第１の補間予測データと第２の補間予測データとの間で選択することとを備えることができる。

ビデオ・データが第１の補間予測データによって符号化される場合、ビデオ・データに関連するレートひずみコストは、フィルタ係数の符号化に関連するコストを定量化する第１の値に加えて、ビデオ・データと第１の補間予測データとの間の差を示す第１の差のメトリック、たとえば、ピクセル値の平均２乗誤差（ＭＳＥ）またはピクセル値の絶対差の和（ＳＡＤ）またはピクセル値の２乗差の和（ＳＳＤ）を備えることができる。この場合、第１の補間フィルタが固定補間フィルタであるならば、コストを定量化する第１の値を０と定義することができる。同様に、第２のレートひずみコストは、フィルタ係数の符号化に関連するコストを定量化する第２の値に加えて、ビデオ・データと第２の補間予測データとの間の差を示す第２の差のメトリック（ＭＳＥ、ＳＡＤまたはＳＳＤ）を備えることができる。第２の補間フィルタが適応補間フィルタである場合、フィルタ係数の符号化に関連するコストを定量化する第２の値は、適応補間フィルタ係数を符号化するために必要なビット数（ｒ）を備えることができ、または場合によっては、この数（ｒ）はラグランジュ乗数（λ）によって乗算される。

レートひずみ分析に基づいて第１の補間予測データと第２の補間予測データとの間で選択（２３３）した後、予測ユニット３２のＭＣユニット３７は、その選択に基づいてビデオ・データを符号化（２３４）し、その選択を示すためにシンタックスを符号化（２３５）する。シンタックスは、復号器が第１の補間フィルタを使用すべきか第２の補間フィルタを使用すべきかを定義する１ビットフラグまたはマルチビットフラグを備えることができる。復号器が複数のサブピクセル・ロケーションの各々に対して第１の補間フィルタを使用すべきか第２の補間フィルタを使用すべきかを示すために、ビデオ・シーケンスの各コード化ユニットの複数のサブピクセル・ロケーションの各々に対して図２３のプロセスを繰り返すことができる。サブピクセル・ロケーションは、クォーター・ピクセル解像度に対する補間に一致する１５個の可能なサブピクセル・ロケーションを備えるか、または異なる数のサブピクセル・ロケーションを備えることができる。図２３のプロセスは、復号器が整数ピクセル・ロケーションに対して第１の補間フィルタを使用すべきか第２の補間フィルタを使用すべきかを示すために、ビデオ・シーケンスの各コード化ユニットの整数ピクセル・ロケーションに対しても繰り返すことができる。

ビデオ符号器５０（図２）が、その選択に基づいてビデオ・データを符号化（２３４）し、その選択を示すためにシンタックスを符号化（２３５）した後、モデム２３および送信機２４（図１）は、符号化ビデオ・データおよびシンタックスを変調し、宛先デバイス１７に送信することができる。第１の補間フィルタが固定であり、第２の補間フィルタが適応型である場合、送信機２４は、シンタックスが、符号化ビデオ・データを発生するために第２の補間予測データが使用されたことを示すとき、フィルタ係数を送信し、シンタックスが、符号化ビデオ・データを発生するために第１の補間予測データが使用されたことを示すとき、フィルタ係数を送信しない。このようにして、第１の補間フィルタが固定であり、第２の補間フィルタが適応型であるとき、シンタックスが、適応補間フィルタ処理が使用されたことを示す場合にのみフィルタ係数を送信し、適応補間フィルタ処理を使用すべきか否かの決定は、予測ビデオ品質だけでなく、送信ビット・ストリーム中のフィルタ係数の存在に影響を受けるビットレートをも考慮する。しかしながら、他の例では、第１および第２の補間フィルタは、両方とも固定、または両方とも適応型とすることができる。

本開示の技法は、フィルタの３つ以上のセットが符号器によって選択されているときのシナリオを含む多くのシナリオにおいて適用できる。言い換えれば、追加の補間予測データを発生するために、同じくレートひずみ分析中に考慮される追加の補間フィルタをも適用することができる。言い換えれば、本方法は、２つの補間フィルタに基づいて第１および第２の補間予測データのみを発生することに限定されず、任意の数の補間フィルタに基づいて任意の複数の補間予測データを発生するために適用できる。重要なことには、レートひずみ分析補間予測データは、どのフィルタを選択すべきかを識別するために使用される。一例では、ビデオ符号器５０によって実行される方法は、複数の異なる補間フィルタに基づいてビデオ・データの符号化のための予測データの複数の異なるバージョンを発生することと、レートひずみ分析に基づいて予測データの複数の異なるバージョンの間で選択することと、その選択に基づいてビデオ・データを符号化することと、その選択を示すためにシンタックスを符号化することとを備えることができる。

レートひずみ分析に基づいて補間フィルタを選択し、その選択を示すためにシンタックスを発生することに加えて、予測ユニット３２のＭＣユニット３７はまた、上記でより詳細に説明した、整数ピクセル・フィルタ処理に対する同様のレートひずみ分析を行うことができる。特に、予測ユニット３２のＭＣユニット３７は、整数ピクセル・ロケーションのための予測データの２つ以上の異なるセット、たとえば、整数ピクセル・フィルタ処理があるものと整数ピクセル・フィルタ処理がないものとを発生し、整数ピクセル・フィルタ処理が望まれるかどうかを判断するために、これらの２つの異なるセットに対するレートひずみ分析を行うことができる。したがって、予測ユニット３２のＭＣユニット３７は、整数ピクセル・フィルタ処理をコード化ユニットに適用すべきかどうかを示すために、整数予測データの２つの異なるセットに関連するレートひずみ分析に基づいて別のシンタックス要素を発生することができ、整数予測データの第１のセットはフィルタ処理されず、整数予測データの第２のセットはフィルタ処理される。このようにして、整数ピクセル・フィルタ処理を行うべきかどうかの決定は、特に、整数ピクセル・フィルタ処理が、そのような整数ピクセル・フィルタ処理を実行するために使用される整数ピクセル・フィルタ係数の符号化および送信に関与するとき、ビデオ・コーディングの品質だけでなく、整数ピクセル・フィルタ処理に関連する可能なビット・オーバーヘッドにも基づくことができる。整数フィルタ処理は、Ｎ個の整数フィルタ（たとえば、Ｎは任意の正および複数の整数）をも考慮することができる。Ｎ個の整数フィルタの使用に一致して、上記の例は、Ｎが２であり、フィルタの１つがフィルタ処理を適用しない場合に対応する。

補間フィルタ係数が実際に符号化され、ソース・デバイス１２から宛先デバイス１６に送信されるときはいつでも、本開示はまた、そのような補間フィルタ係数をコーディングするための技法を企図する。フィルタ係数の説明する符号化はデータ圧縮を改善することができる。特に、本開示は、たとえば、固定フィルタ係数に対するフィルタ係数のための予測技法を企図する。さらに、本開示は、フィルタ係数の第１のセットに対するフィルタ係数の第２のセットのための予測技法を企図する。これらの方法では、データ圧縮を可能にするために、様々なフィルタ係数間の不完全な対称性を利用することができる。補間フィルタ係数のためのそのような予測技法の使用に加えて、本開示はまた、有用な量子化技法と、プレフィックスおよびサフィックス・コーディングに基づく補間フィルタ係数のエントロピー・コーディングとを提供する。以下で、本開示のこれらの態様についてより詳細に説明する。

図２４は、予測コーディングを使用してフィルタ係数を符号化するための技法を示す流れ図である。この場合、ビデオ符号器５０によって使用されるフィルタ係数を固定フィルタのフィルタ係数に対して予測符号化し、フィルタ係数が符号化ビット・ストリームの一部として送信されるときのデータ圧縮をさらに改善することができる。

図２４に示すように、予測ユニット３２のＭＣユニット３７は、ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別する（２４１）。たとえば、ＭＣユニット３７は、適応補間フィルタ処理プロセスを実行することによってフィルタ係数のセットを識別することができる。この場合、ＭＣユニット３７は、適応補間フィルタ処理プロセスによってフィルタ係数のセットを判断し、適応補間フィルタ処理プロセスで識別したフィルタ係数に基づいて予測データを発生することができる。適応補間フィルタ処理では、本明細書でより詳細に説明するように、ＭＣユニット３７は、固定フィルタに基づいて予測データを発生し、次いで、予測データが、コーディングされているビデオ・データにより類似するようにフィルタ係数を調整する、２パス手法を実行することができる。その場合、調整されたフィルタ係数は、使用され、ビット・ストリーム中に符号化されるフィルタ係数を定義する。

フィルタ係数をビット・ストリームの一部として送信することができるように、そのようなフィルタ係数を符号化するために、係数予測および量子化ユニット４１は、固定補間フィルタに関連するフィルタ係数に対するフィルタ係数のセットの予測コーディングに基づいて、フィルタ係数のセットに関連する残差値を発生する（２４２）。特に、係数予測および量子化ユニット４１は、ＩＴＵ−ＴＨ．２６４補間フィルタ、またはハーフ・ピクセル値の中間丸めなしのＩＴＵ−ＴＨ．２６４補間フィルタなどの固定フィルタに関連する対応するフィルタ係数から、適応補間フィルタ処理プロセスで判断されたフィルタ係数を減算する。実際のフィルタ係数を送信するのではなく、残差値を符号化し、送信することによって、ビット・ストリーム中で通信されるデータ量を低減することができる。この場合、フィルタ係数が符号化される方法を知るように復号器をプログラムすることができる。

ビデオ符号器５０は、残差係数の予測と量子化との両方を行うために係数予測および量子化ユニット４１を呼び出し、エントロピー・コーディング・ユニット４６は量子化残差をエントロピー・コーディングする（２４３）。ビデオ符号器５０は、次いで、符号化ビット・ストリームの一部として残差値を出力する（２４４）。フィルタ係数に関連する残差値の量子化は、残差値を量子化することを含み、異なるフィルタ係数に関連する残差値の少なくともいくつかには異なるレベルの量子化が割り当てられる。このようにして、係数予測および量子化ユニット４１は、量子化と精度との望ましい平衡を達成するために、より大きい残差係数により多くの量子化を割り当て、より微細な残差係数により少ない量子化を割り当てることができる。より多くの量子化を使用すると、より多くのデータが削除され、より多くの圧縮を達成することができる。エントロピー・コーディング・ユニット４６は、残差値の量子化の後、残差値にプレフィックス符号を割り当て、サフィックス符号を割り当て、符号値を割り当てることによって、残差値をエントロピー・コーディングする。ビデオ符号器５０は、次いで、符号化ビット・ストリームの一部として残差値を出力する（２４４）。

図２７は、予測コーディングできるいくつかの例示的なフィルタ係数を示す概念グラフである。この場合、フィルタ係数Ｏ_１、Ｏ_２、Ｏ_３およびＯ_４は、固定補間フィルタに関連するフィルタ係数を定義する。フィルタ係数Ｘ_１、Ｘ_２、Ｘ_３およびＸ_４は、固定補間フィルタのフィルタ係数にかなり類似している所望のフィルタ係数を定義する。したがって、それぞれフィルタ係数Ｏ_１、Ｏ_２、Ｏ_３およびＯ_４に基づいて、フィルタ係数Ｘ_１、Ｘ_２、Ｘ_３およびＸ_４を予測することができる。特に、Ｘ_１とＯ_１との差として第１の残差を形成することができる。同様に、Ｘ_２とＯ_２との差として第２の残差を形成し、Ｘ_３とＯ_３との差として第３の残差を形成し、Ｘ_４とＯ_４との差として第４の残差を形成することができる。残差は元のフィルタ係数よりも少ないデータを備え、それによってデータ圧縮を促進することができる。

場合によっては、フィルタ係数のセットは、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、フィルタ係数の第２のセットは、フィルタ係数の第１のセットと係数対称性とに基づいて復号器によって判断できる。たとえば、それぞれＯ_１およびＯ_２に基づいて、フィルタ係数Ｘ_１およびＸ_２を予測符号化することができる。しかしながら、この場合、Ｘ_３およびＸ_４はＸ_１およびＸ_２と対称的であり、そのような対称性が課されていることが知れるように復号器をプログラムすることができる。したがって、対称性を使用することによって、この単純な例の係数Ｘ_３およびＸ_４をビット・ストリームから削除し、係数Ｘ_１およびＸ_２が予測復号された後、復号器において、知られている係数対称性に基づいて係数Ｘ_３およびＸ_４を計算することできる。

図２５は、予測コーディングを使用してフィルタ係数を符号化するための技法を示す別の流れ図である。しかしながら、この場合、２つの異なるタイプの予測を使用する。図２５に示すように、予測ユニット３２のＭＣユニット３７は、ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別する（２５１）。図２４のプロセスの場合と同様に、図２５では、ＭＣユニット３７は、適応補間フィルタ処理プロセスを実行することによってフィルタ係数のセットを識別することができる。この場合、ＭＣユニット３７は、適応補間フィルタ処理プロセスによってフィルタ係数のセットを判断し、適応補間フィルタ処理プロセスで識別したフィルタ係数に基づいて予測データを発生することができる。適応補間フィルタ処理では、ＭＣユニット３７は、固定フィルタに基づいて予測データを発生し、次いで、予測データが、コーディングされているビデオ・データにより類似するようにフィルタ係数を調整する、２パス手法を実行することができる。その場合、調整されたフィルタ係数は、使用され、ビット・ストリーム中に符号化されるフィルタ係数を定義する。

フィルタ係数をビット・ストリームの一部として送信することができるように、そのようなフィルタ係数を符号化するために、係数予測および量子化ユニット４１は、固定補間フィルタに関連するフィルタ係数に対する予測コーディングに基づいて、フィルタ係数の第１のセットに関連する残差値の第１のセットを発生する（２５２）。特に、係数予測および量子化ユニット４１は、ＩＴＵ−ＴＨ．２６４補間フィルタ、またはハーフ・ピクセル値の中間丸めなしのＩＴＵ−ＴＨ．２６４補間フィルタなどの固定フィルタに関連する対応するフィルタ係数から、フィルタ係数の第１のセットを減算する。次に、係数予測および量子化ユニット４１は、フィルタ係数の第１のセットに対する予測コーディングに基づいて、フィルタ係数の第２のセットに関連する残差値の第２のセットを発生する（２５３）。特に、係数予測および量子化ユニット４１は、係数の第１のセットのミラーリングまたは回転された値からフィルタ係数の第２のセットを減算する。したがって、係数の第１のセットは固定フィルタの係数に基づいて予測コーディングされ、係数の第２のセットは係数の第１のセットに基づいて予測コーディングされる。実際のフィルタ係数を使用するのではなく、残差値を発生することによって、ビット・ストリーム中で通信されるデータ量を低減することができる。さらに、固定フィルタを使用して係数の第１のセットを予測し、次いで、係数の第１のセットを使用して係数の第２のセットを予測することによって、固定フィルタのみに依拠する予測に対して、さらなるデータ圧縮を達成することができる。

図２４のプロセスの場合と同様に、図２５では、ビデオ符号器５０は、残差係数の予測コーディングと量子化との両方を行うために係数予測および量子化ユニット４１を呼び出し、エントロピー・コーディング・ユニット４６は量子化残差をエントロピー・コーディングする（２５４）。ビデオ符号器５０は、次いで、符号化ビット・ストリームの一部として残差値を出力する（２５４）。この場合も、フィルタ係数に関連する残差値の量子化は、残差値を量子化することを含み、異なるフィルタ係数に関連する残差値の少なくともいくつかには異なるレベルの量子化が割り当てられる。このようにして、係数予測および量子化ユニット４１は、量子化と精度との望ましい平衡を達成するために、より大きい残差係数により多くの量子化を割り当て、より微細な残差係数により少ない量子化を割り当てることができる。エントロピー・コーディング・ユニット４６は、残差値の量子化の後、残差値にプレフィックス符号を割り当て、サフィックス符号を割り当て、符号値を割り当てることによって、残差値をエントロピー・コーディングする。ビデオ符号器５０は、次いで、符号化ビット・ストリームの一部として残差値を出力する（２５５）。

図２８は、図２５のプロセスに一致する、予測コーディングできるいくつかの例示的なフィルタ係数を示す概念グラフである。この場合、フィルタ係数Ｏ_１およびＯ_２は、固定補間フィルタに関連するフィルタ係数を定義する。フィルタ係数Ｘ_１およびＸ_２は、固定補間フィルタのフィルタ係数にかなり類似している所望のフィルタ係数の第１のセットを定義する。したがって、それぞれフィルタ係数Ｏ_１およびＯ_２に基づいて、フィルタ係数Ｘ_１およびＸ_２を予測することができる。特に、Ｘ_１とＯ_１との差として第１の残差を形成し、Ｘ_２とＯ_２との差として第２の残差を形成することができる。残差は元のフィルタ係数よりも少ないデータを備え、それによってデータ圧縮を促進することができる。次いで、残差は、係数予測および量子化ユニット４１によって量子化され、エントロピー・コーディング・ユニット４６によってエントロピー・コーディングされる。

および

は、逆量子化された残差を予測フィルタ係数Ｏ_１およびＯ_２に加算することによって発生される修正フィルタ係数を指す。

次に、たとえば、特に、係数Ｘ_１およびＸ_２に基づいて定義された係数

および

からの、係数Ｘ_１およびＸ_２の第１のセットに基づいて、フィルタ係数Ｚ_１およびＺ_２の第２のセットを予測コーディングする。特に、Ｚ_１と

との差として第３の残差を形成し、Ｚ_２と

との差として第４の残差を形成することができる。

および

は、Ｏ_１およびＯ_２よりもＺ_１およびＺ_２に類似しており、したがって、

および

を使用してＺ_１およびＺ_２を予測符号化することによって、さらなるデータ圧縮を促進することができる。

図２６は、予測コーディングを使用してフィルタ係数を復号するための技法を示す流れ図である。図２６について図１６のビデオ復号器６０の観点から説明する。図示のように、ビデオ復号器６０は、フィルタ係数のセットに関連する残差値を受信する（２６１）。ビデオ復号器６０は、エントロピー復号ユニット５２によって残差値をエントロピー復号し、係数予測および逆量子化ユニット５３を呼び出して残差値を逆量子化（２６２）し、次いで、残差値を予測ユニット５５に送信する。予測ユニット５６は、残差値の予測復号を使用してフィルタ係数のセットを発生する（２６３）。

特に、予測ユニット５６は、たとえば、図２７に概念的に示し、符号化の文脈で上述したように、残差値と固定補間フィルタに関連するフィルタ係数とに基づいてフィルタ係数の全セットを発生することができる。場合によっては、残差値と固定補間フィルタに関連するフィルタ係数とに基づいてフィルタ係数の第１のセットを発生し、対称性に基づいてフィルタ係数の第２のセットを発生することができる。場合によっては、たとえば、図２８に概念的に示し、符号化の文脈で上述したように、残差値と固定補間フィルタに関連するフィルタ係数とに基づいてフィルタ係数の第１のセットを発生し、追加の残差値とフィルタ係数の第１のセットとに基づいてフィルタ係数の第２のセットを発生することができる。いずれの場合も、ビデオ復号器６０の予測ユニット５６は、ビデオ・ブロックの予測復号に使用される予測データを補間するためにフィルタ係数のセットを適用する（２６４）。特に、予測ユニット５６は、補間予測データに基づいてビデオ・ブロックを復号することができるように、予測復号されたフィルタ係数を使用して、そのような補間予測データを発生するためにデータをフィルタ処理する。

この場合も、予測復号されたフィルタ係数のセットは、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備えることができる。この場合、ビデオ復号器６０の係数予測および逆量子化ユニット５３は、フィルタ係数の第１のセットと係数対称性とに基づいてフィルタ係数の第２のセットを発生し、予測データを補間するためにフィルタ係数の第１および第２のセットを適用することができる。

別の場合、予測復号されたフィルタ係数のセットは、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備えることができる。この場合、ビデオ復号器６０は、フィルタ係数の全セットに関連する追加の残差値を受信することができる。係数予測および逆量子化ユニット５３は、追加の残差値とフィルタ係数の第１のセットとに基づいて予測復号を使用してフィルタ係数の第２のセットを発生し、予測ユニット５５は、予測データを補間するためにフィルタ係数の第１および第２のセットを適用することができる。

場合によっては、（図８、図９、図１０および図１１に示すサブピクセル位置ａ、ｂ、ｄ、ｈのためのフィルタを含む）１−Ｄフィルタを予測するために、Ｈ．２６４／ＡＶＣフィルタに基づく固定補間フィルタを使用することができる。図１２、図１３、図１４および図１５に示すサブピクセル位置ｅ、ｆ、ｉ、およびｊのためのフィルタを含む２−Ｄフィルタの場合、以下の予測方式の１つを使用することができる。

１．予測を０（予測なし）に設定する。

２．トレーニング・セットにわたって収集された平均フィルタなどの固定フィルタ予測を使用する。すなわち、

であり、

は、サブピクセル位置ＳＰのための平均フィルタ中の（ｉ，ｊ）番目のフィルタ係数である。

３．係数中の可能な対称性を利用し、すでにコード化された係数を使用して、残りの係数を予測する。

１−Ｄフィルタの場合、これらの３つの予測方法のいずれをも適用することができる。

予測に関して、図２９に、予測技法が符号化に使用される整数ピクセル・フィルタ係数のアレイの例を与える。この例では、整数ピクセル・フィルタに対称性が課されないと仮定する。係数（ｈ０，０）、（ｈ０，１）、（ｈ１，０）、（ｈ１，１）、（ｈ２，０）、（ｈ２，１）（ｈ０，２）、（ｈ１，２）および（ｈ２，２）を最初に量子化し、コーディングする。次いで、すでにコーディングされた左上の係数（ｈ０，０）、（ｈ０，１）、（ｈ１，０）、（ｈ１，１）および（ｈ２，０）を使用して、右上の係数（ｈ０，３）、（ｈ１，３）、（ｈ２，３）、（ｈ０，４）、（ｈ１，４）、および（ｈ２，４）を予測する。次に、上半分のフィルタ係数（ｈ０，０）、（ｈ０，１）、（ｈ０，２）、（ｈ０，３）（ｈ０，４）、（ｈ１，０）、（ｈ１，１）、（ｈ１，２）、（ｈ１，３）および（ｈ１，４）を量子化し、コーディングした後、それらを使用して下半分のフィルタ係数（ｈ３，０）、（ｈ３，１）、（ｈ３，２）、（ｈ３，３）、（ｈ３，４）、（ｈ４，０）、（ｈ４，１）、（ｈ４，２）、（ｈ４，３）および（ｈ４，４）を予測する。他のフィルタ係数の予測を同様にして行うことができる。たとえば、対角線的に何らかの対称性を有するサブピクセル位置「ｅ」フィルタ（図１２参照）の場合、最初に右上の係数を量子化し、コーディングし、次いで、それらを使用して左下の係数を予測することができる。

いずれの場合も、（たとえば、予測ユニット３２の係数予測および量子化ユニット４１による）係数の予測の後、（たとえば、係数予測および量子化ユニット４１によって）予測誤差を量子化する。上記で概説したように、いわゆる「不均一量子化」を使用することができる。この場合、係数予測および量子化ユニット４１によって適用される量子化精度は係数ロケーションに依存する。（一般に、フィルタの中心からより遠くに離れている）絶対値がより小さい係数では、より高い精度が望ましいことがわかっている。対照的に、（一般に、フィルタの中心により近い）絶対値がより大きい係数では、より低い精度が望ましい。

係数予測および量子化ユニット４１によって、それぞれ以下の行列Ｑ^１Ｄ、Ｑ^２Ｄ、Ｑ^ＦＰを使用して、１Ｄフィルタ、２Ｄフィルタ、および整数ピクセル・フィルタ中の係数の量子化精度を指定することができる。行列で与えられるビットの数が、それぞれの係数の符号を符号化するための１ビットを含むことに留意されたい。

係数予測および量子化ユニット４１は、単純なプレフィックス・コーディング方式に基づいて、量子化された係数予測誤差、すなわち、係数残差をコーディングすることができる。最初に、予測誤差の絶対値の動的範囲をＮ個のビン、たとえばＮ＝６に分割する。絶対値の動的範囲が［０，．．．，２^ｑ−１−１］であり、ｑは（上記の行列で指定されたように）所与の係数位置の量子化精度である場合、各ビンｎ、ｎ＝０，．．．Ｎ−１は、以下の範囲に及ぶ。

この場合、単項プレフィックス符号を使用して、入力絶対値ｍが属するビンｂ、ｂ＝０，．．．，Ｎ−１をコーディングする（ｂ＋１ビットを必要とする）。次いで、（ｑ−Ｎ＋ｂ−１）ビットの固定長サフィックス符号を使用して、絶対値の残り、ｍ−ｂ_{ｓｔａｒｔ}をコーディングする。最後に、１ビットを使用して予測誤差の符号をコーディングする。

たとえば、１Ｄフィルタ中の中心係数の場合、係数予測および量子化ユニット４１によって９ビット精度を使用して予測誤差を量子化し、すなわち、ｑ＝９であり、そのうちの８つのビットが、誤差絶対値を量子化するために使用される。誤差絶対値が９７である場合、誤差絶対値は第４のビン内に入り、すなわち、ｂ＝４である。したがって、第４のビンを示すために単項プレフィックス符号「１１１１０」を符号化し、（ｑ−Ｎ＋ｂ−１）＝（９−６＋４−１）＝６ビットの固定長サフィックス符号を使用して、ｍ−ｂ_{ｓｔａｒｔ}の残り＝９７−６４＝３３を符号化する。最後に、正の符号を示すためにビット「０」を符号化する。

本開示の技法は、ワイヤレス・ハンドセットおよび集積回路（ＩＣ）またはＩＣのセット（すなわち、チップセット）を含む、多種多様なデバイスまたは装置で実施できる。機能的態様を強調するために与えられた任意の構成要素、モジュールまたはユニットについて説明したが、異なるハードウェアユニットによる実現を必ずしも必要とするわけではない。

したがって、本明細書で説明する技法は、ハードウェア、ソフトウェア、ファームウェア、またはその任意の組合せで実装できる。ハードウェアで実装する場合、モジュール、ユニットまたは構成要素として説明する特徴は、集積論理デバイスに一緒に、または個別であるが相互運用可能な論理デバイスとして別々に実装できる。ソフトウェアで実装する場合、これらの技法は、プロセッサで実行されると、上記で説明した方法の１つまたは複数を実行する命令を備えるコンピュータ可読媒体によって少なくとも部分的に実現できる。コンピュータ可読媒体は、コンピュータ可読記憶媒体を備え、パッケージング材料を含むことがあるコンピュータプログラム製品の一部をなすことができる。コンピュータ可読記憶媒体は、同期ダイナミック・ランダム・アクセスメモリ（ＳＤＲＡＭ）などのランダムアクセスメモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、電気消去可能プログラマブル読取り専用メモリ（ＥＥＰＲＯＭ）、フラッシュメモリ、磁気または光学データ記憶媒体などを備えることができる。本技法は、追加または代替として、命令またはデータ構造の形態でコードを搬送または伝達し、コンピュータによってアクセス、読取り、および／または実行できるコンピュータ可読通信媒体によって、少なくとも部分的に実現できる。

コードは、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）などの１つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールド・プログラマブル・ロジック・アレイ（ＦＰＧＡ）、または他の等価の集積回路またはディスクリート論理回路によって実行できる。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明する技法の実装に好適な他の構造のいずれかを指す。さらに、いくつかの態様では、本明細書で説明する機能を、符号化および復号のために構成された専用のソフトウェア・モジュールまたはハードウェア・モジュール内に提供することができ、または複合ビデオ・コーデックに組み込むことができる。また、本技法は、１つまたは複数の回路または論理要素中に十分に実装できる。

本開示の様々な態様について説明した。これらおよび他の態様は以下の特許請求の範囲内に入る。

Claims

ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別することと、
固定補間フィルタに関連するフィルタ係数に対するフィルタ係数の前記セットの予測コーディングに基づいて、フィルタ係数の前記セットに関連する残差値を発生することと、
前記残差値に量子化を適用することと、
前記量子化された残差値をエントロピー・コーディングし、符号化ビット・ストリームの一部として出力することと
を備える方法。
フィルタ係数の前記セットを識別することが、フィルタ係数の前記セットを判断し、前記予測データを発生するために適応補間フィルタ処理プロセスを実行することを含む請求項１に記載の方法。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、フィルタ係数の第２のセットが、フィルタ係数の前記第１のセットと係数対称性とに基づいて復号器によって判断できる請求項１に記載の方法。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、前記方法が、
フィルタ係数の前記第１のセットに対するフィルタ係数の前記第２のセットの予測コーディングに基づいて、フィルタ係数の前記全セットに関連する追加の残差値を発生することと、
前記追加の残差値に量子化を適用することと、
前記量子化された追加の残差値をエントロピー・コーディングし、前記符号化ビット・ストリームの一部として出力することと
をさらに備える請求項１に記載の方法。
異なるフィルタ係数に関連する前記残差値の少なくともいくつかに異なるレベルの量子化が割り当てられる請求項１に記載の方法。
絶対値がより小さい前記残差値の少なくともいくつかには、より細かい量子化が割り当てられ、絶対値がより大きい前記残差値の少なくともいくつかには、より粗い量子化が割り当てられる請求項５に記載の方法。
前記量子化された残差値を出力するより前に前記量子化された残差値をエントロピー・コーディングすることをさらに備え、前記量子化された残差値をエントロピー・コーディングすることが、前記残差値の量子化の後、前記量子化された残差値にプレフィックス符号を割り当てることと、サフィックス符号を割り当てることと、符号値を割り当てることと、を備える請求項５に記載の方法。
フィルタ係数のセットに関連する残差値を受信することと、
前記残差値と固定補間フィルタに関連するフィルタ係数とのセットに基づいて予測復号を使用してフィルタ係数の前記セットを発生することと、
ビデオ・ブロックの予測復号に使用される予測データを補間するためにフィルタ係数の前記セットを適用することと、
を備える方法。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、前記方法が、
フィルタ係数の前記第１のセットと係数対称性とに基づいてフィルタ係数の第２のセットを発生することと、
前記予測データを補間するためにフィルタ係数の前記第１および第２のセットを適用することと、
をさらに備える請求項８に記載の方法。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、前記方法が、
フィルタ係数の前記全セットに関連する追加の残差値を受信することと、
追加の残差値とフィルタ係数の前記第１のセットとに基づいて予測復号を使用してフィルタ係数の第２のセットを発生することと、
前記予測データを補間するためにフィルタ係数の前記第１および第２のセットを適用することと、
をさらに備える請求項８に記載の方法。
フィルタ係数の前記セットを発生し、フィルタ係数の前記セットを適用するより前に、前記受信した残差値をエントロピー復号することと、逆量子化することとをさらに備える請求項８に記載の方法。
ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別することと、
固定補間フィルタに関連するフィルタ係数に対するフィルタ係数の前記セットの予測コーディングに基づいて、フィルタ係数の前記セットに関連する残差値を発生することと、
前記残差値に量子化を適用することと、
前記量子化された残差値をエントロピー・コーディングし、符号化ビット・ストリームの一部として出力することと、
を行うビデオ復号器を備える装置。
フィルタ係数の前記セットを識別する際に、前記ビデオ符号器が、フィルタ係数の前記セットを判断し、前記予測データを発生するために適応補間フィルタ処理プロセスを実行する請求項１２に記載の装置。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、フィルタ係数の第２のセットが、フィルタ係数の前記第１のセットと係数対称性とに基づいて復号器によって判断できる請求項１２に記載の装置。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、前記ビデオ符号器が、
フィルタ係数の前記第１のセットに対するフィルタ係数の前記第２のセットの予測コーディングに基づいて、フィルタ係数の前記全セットに関連する追加の残差値を発生することと、
前記追加の残差値に量子化を適用することと、
前記量子化された追加の残差値をエントロピー・コーディングし、前記符号化ビット・ストリームの一部として出力することと
を行う請求項１２に記載の装置。
異なるフィルタ係数に関連する前記残差値の少なくともいくつかに異なるレベルの量子化が割り当てられる請求項１２に記載の装置。
絶対値がより小さい前記残差値の少なくともいくつかには、より細かい量子化が割り当てられ、絶対値がより大きい前記残差値の少なくともいくつかには、より粗い量子化が割り当てられる請求項１６に記載の装置。
前記ビデオ符号器が、前記量子化された残差値を出力するより前に前記量子化された残差値をエントロピー符号化し、前記量子化された残差値をエントロピー符号化することが、前記残差値の量子化の後、前記量子化された残差値にプレフィックス符号を割り当てることと、サフィックス符号を割り当てることと、符号値を割り当てることとを備える請求項１６に記載の装置。
前記ビデオ符号器が集積回路を備える請求項１２に記載の装置。
前記ビデオ符号器がマイクロプロセッサを備える請求項１２に記載の装置。
前記装置が、前記ビデオ符号器を含むワイヤレス通信デバイスを備える請求項１２に記載の装置。
フィルタ係数のセットに関連する残差値を受信することと、
前記残差値と固定補間フィルタに関連するフィルタ係数とのセットに基づいて予測復号を使用してフィルタ係数の前記セットを発生することと、
ビデオ・ブロックの予測復号に使用される予測データを補間するためにフィルタ係数の前記セットを適用することと、
を行うビデオ復号器を備える装置。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、前記ビデオ復号器が、
フィルタ係数の前記第１のセットと係数対称性とに基づいてフィルタ係数の第２のセットを発生することと、
前記予測データを補間するためにフィルタ係数の前記第１および第２のセットを適用することと、
を行う請求項２２に記載の装置。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、前記ビデオ復号器が、
フィルタ係数の前記全セットに関連する追加の残差値を受信することと、
追加の残差値とフィルタ係数の前記第１のセットとに基づいて予測復号を使用してフィルタ係数の第２のセットを発生することと、
前記予測データを補間するためにフィルタ係数の前記第１および第２のセットを適用することと、
を行う請求項２２に記載の装置。
前記ビデオ復号器が、フィルタ係数の前記セットを発生し、フィルタ係数の前記セットを適用するより前に、前記受信した残差値をエントロピー復号し、逆量子化する請求項２２に記載の装置。
前記ビデオ復号器が集積回路を備える請求項２２に記載の装置。
前記ビデオ復号器がマイクロプロセッサを備える請求項２２に記載の装置。
前記装置が、前記ビデオ復号器を含むワイヤレス通信デバイスを備える請求項２２に記載の装置。
ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別するための手段と、
固定補間フィルタに関連するフィルタ係数に対するフィルタ係数の前記セットの予測コーディングに基づいて、フィルタ係数の前記セットに関連する残差値を発生するための手段と、
前記残差値に量子化を適用するための手段と、
前記量子化された残差値をエントロピー・コーディングし、符号化ビット・ストリームの一部として出力するための手段と、
を備えるデバイス。
フィルタ係数の前記セットを識別するための手段が、フィルタ係数の前記セットを判断し、前記予測データを発生するために適応補間フィルタ処理プロセスを実行するための手段を含む、請求項２９に記載のデバイス。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、フィルタ係数の第２のセットが、フィルタ係数の前記第１のセットと係数対称性とに基づいて復号器によって判断できる請求項２９に記載のデバイス。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、前記デバイスが、
フィルタ係数の前記第１のセットに対するフィルタ係数の前記第２のセットの予測コーディングに基づいて、フィルタ係数の前記全セットに関連する追加の残差値を発生するための手段と、
前記追加の残差値に量子化を適用するための手段と、
前記量子化された追加の残差値をエントロピー・コーディングし、前記符号化ビット・ストリームの一部として出力するための手段と、
をさらに備える請求項２９に記載のデバイス。
異なるフィルタ係数に関連する前記残差値の少なくともいくつかに異なるレベルの量子化が割り当てられる請求項２９に記載のデバイス。
絶対値がより小さい前記残差値の少なくともいくつかには、より細かい量子化が割り当てられ、絶対値がより大きい前記残差値の少なくともいくつかには、より粗い量子化が割り当てられる請求項３３に記載の方法。
前記量子化された残差値を出力するより前に前記量子化された残差値をエントロピー・コーディングするための手段をさらに備え、前記量子化された残差値をエントロピー・コーディングするための手段が、前記残差値の量子化の後、前記量子化された残差値にプレフィックス符号を割り当てるための手段と、サフィックス符号を割り当てるための手段と、符号値を割り当てるための手段とを備える請求項３３に記載のデバイス。
フィルタ係数のセットに関連する残差値を受信するための手段と、
前記残差値と固定補間フィルタに関連するフィルタ係数とのセットに基づいて予測復号を使用してフィルタ係数の前記セットを発生するための手段と、
ビデオ・ブロックの予測復号に使用される予測データを補間するためにフィルタ係数の前記セットを適用するための手段と、
を備えるデバイス。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、前記デバイスが、
フィルタ係数の前記第１のセットと係数対称性とに基づいてフィルタ係数の第２のセットを発生するための手段と、
前記予測データを補間するためにフィルタ係数の前記第１および第２のセットを適用するための手段と、
をさらに備える請求項３６に記載のデバイス。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、前記デバイスが、
フィルタ係数の前記全セットに関連する追加の残差値を受信するための手段と、
追加の残差値とフィルタ係数の前記第１のセットとに基づいて予測復号を使用してフィルタ係数の第２のセットを発生するための手段と、
前記予測データを補間するためにフィルタ係数の前記第１および第２のセットを適用するための手段と、
をさらに備える請求項３６に記載のデバイス。
フィルタ係数の前記セットを発生し、フィルタ係数の前記セットを適用するより前に、前記受信した残差値をエントロピー復号するための手段と、前記受信した残差値を逆量子化するための手段とをさらに備える請求項３６に記載のデバイス。
プロセッサによって実行されたとき、
ビデオ符号化中に予測データの補間のためのフィルタ係数のセットを識別することと、
固定補間フィルタに関連するフィルタ係数に対するフィルタ係数の前記セットの予測コーディングに基づいて、フィルタ係数の前記セットに関連する残差値を発生することと、
前記残差値に量子化を適用することと、
前記量子化された残差値をエントロピー・コーディングし、符号化ビット・ストリームの一部として出力することと、
を前記プロセッサに行わせる命令を備えるコンピュータ可読記憶媒体。
フィルタ係数の前記セットを識別する際に、前記命令が、フィルタ係数の前記セットを判断し、前記予測データを発生するために適応補間フィルタ処理プロセスを前記プロセッサに実行させる請求項４０に記載のコンピュータ可読記憶媒体。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、フィルタ係数の第２のセットが、フィルタ係数の前記第１のセットと係数対称性とに基づいて復号器によって判断できる請求項４０に記載のコンピュータ可読記憶媒体。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、実行時に前記命令が、
フィルタ係数の前記第１のセットに対するフィルタ係数の前記第２のセットの予測コーディングに基づいて、フィルタ係数の前記全セットに関連する追加の残差値を発生することと、
前記追加の残差値に量子化を適用することと、
前記量子化された追加の残差値を前記符号化ビット・ストリームの一部として出力することと、
を前記プロセッサに行わせる請求項４０に記載のコンピュータ可読記憶媒体。
異なるフィルタ係数に関連する前記残差値の少なくともいくつかに異なるレベルの量子化が割り当てられる請求項４０に記載のコンピュータ可読記憶媒体。
絶対値がより小さい前記残差値の少なくともいくつかには、より細かい量子化が割り当てられ、絶対値がより大きい前記残差値の少なくともいくつかには、より粗い量子化が割り当てられる請求項４４に記載のコンピュータ可読記憶媒体。
前記量子化された残差値を出力するより前に前記量子化された残差値をエントロピー・コーディングすることを、実行時に前記プロセッサに行わせる命令をさらに備え、前記量子化された残差値をエントロピー・コーディングする際に、前記命令が、前記残差値の量子化の後、前記量子化された残差値にプレフィックス符号を割り当てることと、サフィックス符号を割り当てることと、符号値を割り当てることとを前記プロセッサに行わせる請求項４４に記載のコンピュータ可読記憶媒体。
プロセッサによって実行されたとき、
フィルタ係数のセットに関連する残差値を受信することと、
前記残差値と固定補間フィルタに関連するフィルタ係数とのセットに基づいて予測復号を使用してフィルタ係数の前記セットを発生することと、
ビデオ・ブロックの予測復号に使用される予測データを補間するためにフィルタ係数の前記セットを適用することと、
を前記プロセッサに行わせる命令を備えるコンピュータ可読記憶媒体。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、実行時に前記命令が、
フィルタ係数の前記第１のセットと係数対称性とに基づいてフィルタ係数の第２のセットを発生することと、
前記予測データを補間するためにフィルタ係数の前記第１および第２のセットを適用することと、
を前記プロセッサに行わせる請求項４７に記載のコンピュータ可読記憶媒体。
フィルタ係数の前記セットが、適応補間フィルタに関連するフィルタ係数の全セットの一部分のみを定義するフィルタ係数の第１のセットを備え、実行時に前記命令が、
フィルタ係数の前記全セットに関連する追加の残差値を受信することと、
追加の残差値とフィルタ係数の前記第１のセットとに基づいて予測復号を使用してフィルタ係数の第２のセットを発生することと、
前記予測データを補間するためにフィルタ係数の前記第１および第２のセットを適用することと、
を前記プロセッサに行わせる請求項４７に記載のコンピュータ可読記憶媒体。
フィルタ係数の前記セットを発生し、フィルタ係数の前記セットを適用するより前に、前記受信した残差値をエントロピー復号することと、逆量子化することとを、実行時に前記プロセッサに行わせる命令をさらに備える請求項４７に記載のコンピュータ可読記憶媒体。