JP5876162B2 - ビュー合成参照ピクチャのための参照ピクチャリスト変更 - Google Patents

ビュー合成参照ピクチャのための参照ピクチャリスト変更 Download PDF

Info

Publication number
JP5876162B2
JP5876162B2 JP2014546072A JP2014546072A JP5876162B2 JP 5876162 B2 JP5876162 B2 JP 5876162B2 JP 2014546072 A JP2014546072 A JP 2014546072A JP 2014546072 A JP2014546072 A JP 2014546072A JP 5876162 B2 JP5876162 B2 JP 5876162B2
Authority
JP
Japan
Prior art keywords
reference picture
rplm
picture
video
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014546072A
Other languages
English (en)
Other versions
JP2015505191A (ja
Inventor
ジャン、リ
チェン、イン
カークゼウィックズ、マルタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2015505191A publication Critical patent/JP2015505191A/ja
Application granted granted Critical
Publication of JP5876162B2 publication Critical patent/JP5876162B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

優先権の主張
本出願は、その内容全体が参照により本明細書に組み込まれる、2011年12月9日に出願された米国仮特許出願第61/569,137号の利益を主張する。
本開示はビデオコーディング(すなわち、ビデオデータの符号化および/または復号)に関する。
[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4,Part10,Advanced Video Coding(AVC)、現在開発中の高効率ビデオコーディング(HEVC:High Efficiency Video Coding)規格によって定義された規格、およびそのような規格の拡張に記載されているビデオ圧縮技法など、ビデオ圧縮技法を実装する。ビデオデバイスは、そのようなビデオ圧縮技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
[0004]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために空間的(イントラピクチャ)予測および/または時間的(インターピクチャ)予測を実行する。ブロックベースのビデオコーディングの場合、ビデオスライス(すなわち、ビデオフレームまたはビデオフレームの一部分)がビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス中のビデオブロックは、同じピクチャ中の隣接ブロックにおける参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。
[0005]空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコード化ブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差係数が得られ得、その残差係数は、次いで量子化され得る。量子化された係数は、最初は2次元アレイで構成され、係数の1次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するためにエントロピーコーディングが適用され得る。
[0006]ビデオエンコーダは、短期参照ピクチャを参照ピクチャリスト中に挿入するための参照ピクチャリスト変更(RPLM:reference picture list modification)コマンドのタイプに属するRPLMコマンドを生成する。ビデオデコーダは、RPLMコマンドに応答して、合成(synthetic)参照ピクチャを含むように参照ピクチャリストを変更する。ビデオデコーダは、ピクチャの1つまたは複数のビデオブロックに対してインター予測を実行するために参照ピクチャリスト中の1つまたは複数のピクチャを使用する。
[0007]一態様では、マルチビュービデオ復号のための方法は、ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号することを備える。本方法はまた、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することを備える。さらに、本方法は、RPLMコマンドに応答して、合成参照ピクチャを参照ピクチャリスト内の特定のロケーションに挿入することを備える。RPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属する。さらに、本方法は、現在ピクチャのビデオブロックに対してインター予測を実行するために参照ピクチャリスト中の1つまたは複数のピクチャを使用することを備える。
[0008]別の態様では、ビデオ復号デバイスが、ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号するように構成された1つまたは複数のプロセッサを備える。1つまたは複数のプロセッサはまた、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成するように構成される。さらに、1つまたは複数のプロセッサは、RPLMコマンドに応答して、合成参照ピクチャを参照ピクチャリスト内の特定のロケーションに挿入するように構成される。RPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属する。さらに、1つまたは複数のプロセッサは、現在ピクチャのビデオブロックに対してインター予測を実行するために参照ピクチャリスト中の1つまたは複数のピクチャを使用するように構成される。
[0009]別の態様では、ビデオ復号デバイスは、ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号するための手段を備える。ビデオ復号デバイスはまた、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成するための手段を備える。さらに、ビデオ復号デバイスは、RPLMコマンドに応答して、合成参照ピクチャを参照ピクチャリスト内の特定のロケーションに挿入するための手段を備える。RPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属する。ビデオ復号デバイスはまた、現在ピクチャのビデオブロックに対してインター予測を実行するために参照ピクチャリスト中の1つまたは複数のピクチャを使用するための手段を備える。
[0010]別の態様では、コンピュータ可読記憶媒体は、ビデオ復号デバイスの1つまたは複数のプロセッサによって実行されたとき、ビデオ復号デバイスに、ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号させる命令を記憶している。命令はまた、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成するようにビデオ復号デバイスを構成する。さらに、命令は、RPLMコマンドに応答して、合成参照ピクチャを参照ピクチャリスト内の特定のロケーションに挿入するようにビデオ復号デバイスを構成する。RPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属する。命令はまた、現在ピクチャのビデオブロックに対してインター予測を実行するために参照ピクチャリスト中の1つまたは複数のピクチャを使用するようにビデオ復号デバイスを構成する。
[0011]別の態様では、マルチビュービデオ符号化のための方法は、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することを備える。本方法はまた、現在ピクチャの1つまたは複数のビデオブロックを符号化するために合成参照ピクチャを参照ピクチャとして使用することを備える。さらに、本方法は、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するRPLMコマンドを含むビットストリームを生成することを備える。RPLMコマンドは、合成参照ピクチャを参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令する。
[0012]別の態様では、ビデオ符号化デバイスは、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成するように構成された1つまたは複数のプロセッサを備える。1つまたは複数のプロセッサはまた、現在ピクチャの1つまたは複数のビデオブロックを符号化するために合成参照ピクチャを参照ピクチャとして使用するように構成される。さらに、1つまたは複数のプロセッサは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するRPLMコマンドを含むビットストリームを生成するように構成され、RPLMコマンドは、合成参照ピクチャを参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令する。
[0013]別の態様では、ビデオ符号化デバイスは、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成するための手段を備える。さらに、ビデオ符号化デバイスは、現在ピクチャの1つまたは複数のビデオブロックを符号化するために合成参照ピクチャを参照ピクチャとして使用するための手段を備える。さらに、ビデオ符号化デバイスは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するRPLMコマンドを含むビットストリームを生成するための手段を備え、RPLMコマンドは、合成参照ピクチャを参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令する。
[0014]別の態様では、コンピュータ可読記憶媒体は、ビデオ符号化デバイスの1つまたは複数のプロセッサによって実行されたとき、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成するようにビデオ符号化デバイスを構成する命令を記憶している。命令はまた、現在ピクチャの1つまたは複数のビデオブロックを符号化するために合成参照ピクチャを参照ピクチャとして使用するようにビデオ復号デバイスを構成する。さらに、命令は、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するRPLMコマンドを含むビットストリームを生成するようにビデオ復号デバイスを構成し、RPLMコマンドは、合成参照ピクチャを参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令する。
[0015]本開示の1つまたは複数の例の詳細を添付の図面および以下の説明に記載する。他の特徴、目的、および利点は、説明、図面、および特許請求の範囲から明らかになろう。
本開示で説明する技法を利用し得る例示的なビデオコーディングシステムを示すブロック図。 本開示で説明する技法を実装し得る例示的なビデオエンコーダを示すブロック図。 本開示で説明する技法を実装し得る例示的なビデオデコーダを示すブロック図。 本開示の1つまたは複数の技法による、ビデオデータを符号化するためのプロセスの一部としてビデオエンコーダによって実行される例示的な動作を示すフローチャート。 本開示の1つまたは複数の技法による、符号化されたビデオデータを復号するためのプロセスの一部としてビデオデコーダによって実行される例示的な動作を示すフローチャート。 本開示の1つまたは複数の技法による、短期参照ピクチャまたは合成参照ピクチャを参照ピクチャリスト中に挿入するためのビデオデコーダの例示的な動作を示すフローチャート。
[0022]従来、ビデオエンコーダは、ビュー合成参照ピクチャ(VSRP:view synthesis reference picture)などの合成参照ピクチャ(synthetized reference picture)を参照ピクチャリスト中の任意の位置に挿入するために、短期参照ピクチャのための参照ピクチャリスト変更(RPLM: reference picture list modification)コマンドを使用することができないことがある。RPLMコマンドは、参照ピクチャを参照ピクチャリスト中に挿入するための1つまたは複数のシンタックス要素のセットであり得る。このできないことは、コーディング効率の減少につながり得、潜在的にエラーレジリエンシーを減少させ得る。
[0023]本開示の技法はこの問題を改善し得る。本開示で説明するように、ビデオエンコーダは、短期参照ピクチャのための1つまたは複数のRPLMコマンドを生成し得る。短期参照ピクチャのためのRPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するRPLMコマンドであり得る。ビデオデコーダは、短期参照ピクチャのための1つまたは複数の参照RPLMコマンドに応答して、VSRPを含むように参照ピクチャリストを変更し得る。ビデオデコーダは、ピクチャの1つまたは複数のビデオブロックに対してインター予測を実行するために参照ピクチャリスト中の1つまたは複数の参照ピクチャを使用し得る。
[0024]添付の図面は例を示している。添付の図面中の参照番号によって示される要素は、以下の説明における同様の参照番号によって示される要素に対応する。本開示では、序数語(たとえば、「第1の」、「第2の」、「第3の」など)で始まる名前を有する要素は、必ずしもそれらの要素が特定の順序を有することを暗示するとは限らない。むしろ、そのような序数語は、同じまたは同様のタイプの異なる要素を指すために使用されるにすぎない。
[0025]図1は、本開示の技法を利用し得る例示的なビデオコーディングシステム10を示すブロック図である。本明細書で使用し説明する「ビデオコーダ」という用語は、総称的にビデオエンコーダとビデオデコーダの両方を指す。本開示では、「ビデオコーディング」または「コーディング」という用語は、総称的にビデオ符号化またはビデオ復号を指すことがある。
[0026]図1に示すように、ビデオコーディングシステム10は、ソースデバイス12と宛先デバイス14とを含む。ソースデバイス12は符号化ビデオデータを生成する。したがって、ソースデバイス12は、ビデオ符号化デバイスまたはビデオ符号化装置と呼ばれることがある。宛先デバイス14は、ソースデバイス12によって生成された符号化ビデオデータを復号し得る。したがって、宛先デバイス14は、ビデオ復号デバイスまたはビデオ復号装置と呼ばれることがある。ソースデバイス12および宛先デバイス14は、ビデオコーディングデバイスまたはビデオコーディング装置の例であり得る。
[0027]ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、モバイルコンピューティングデバイス、ノートブック(たとえば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、車内コンピュータなどを含む、広範囲のデバイスを備え得る。
[0028]宛先デバイス14は、チャネル16を介してソースデバイス12から符号化ビデオデータを受信し得る。チャネル16は、ソースデバイス12から宛先デバイス14に符号化ビデオデータを移動することが可能な1つまたは複数の媒体またはデバイスを備え得る。一例では、チャネル16は、ソースデバイス12が符号化ビデオデータを宛先デバイス14にリアルタイムで直接送信することを可能にする1つまたは複数の通信媒体を備え得る。この例では、ソースデバイス12は、ワイヤレス通信プロトコルなどの通信規格に従って符号化ビデオデータを変調し得、変調されたビデオデータを宛先デバイス14に送信し得る。1つまたは複数の通信媒体は、無線周波数(RF)スペクトルあるいは1つまたは複数の物理伝送線路など、ワイヤレスおよび/またはワイヤード通信媒体を含み得る。1つまたは複数の通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはグローバルネットワーク(たとえば、インターネット)など、パケットベースネットワークの一部を形成し得る。1つまたは複数の通信媒体は、ソースデバイス12から宛先デバイス14への通信を可能にする、ルータ、スイッチ、基地局、または他の機器を含み得る。
[0029]別の例では、チャネル16は、ソースデバイス12によって生成された符号化ビデオデータを記憶する記憶媒体を含み得る。この例では、宛先デバイス14は、ディスクアクセスまたはカードアクセスを介して記憶媒体にアクセスし得る。記憶媒体は、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、または符号化ビデオデータを記憶するための他の好適なデジタル記憶媒体など、様々なローカルにアクセスされるデータ記憶媒体を含み得る。
[0030]さらなる例では、チャネル16は、ソースデバイス12によって生成された符号化ビデオデータを記憶するファイルサーバまたは別の中間ストレージデバイスを含み得る。この例では、宛先デバイス14は、ストリーミングまたはダウンロードを介して、ファイルサーバまたは他の中間ストレージデバイスに記憶された符号化ビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶することと、符号化ビデオデータを宛先デバイス14に送信することとが可能なタイプのサーバであり得る。例示的なファイルサーバとしては、(たとえば、ウェブサイト用の)ウェブサーバ、ファイル転送プロトコル(FTP)サーバ、ネットワーク接続ストレージ(NAS)デバイス、およびローカルディスクドライブがある。
[0031]宛先デバイス14は、インターネット接続などの標準的なデータ接続を通して符号化ビデオデータにアクセスし得る。データ接続の例示的なタイプとしては、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適な、ワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または両方の組合せがあり得る。ファイルサーバからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。
[0032]本開示の技法は、ワイヤレス適用例または設定に限定されない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのビデオデータの符号化、データ記憶媒体に記憶されたビデオデータの復号、または他の適用例など、様々なマルチメディア適用例をサポートするビデオコーディングに適用され得る。いくつかの例では、ビデオコーディングシステム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの適用例をサポートするために、単方向または双方向のビデオ送信をサポートするように構成され得る。
[0033]図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。いくつかの例では、出力インターフェース22は、変調器/復調器(モデム)および/または送信機を含み得る。ビデオソース18は、たとえばビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオデータを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオデータを受信するためのビデオフィードインターフェース、および/またはビデオデータを生成するためのコンピュータグラフィックスシステム、あるいはビデオデータのそのようなソースの組合せを含み得る。
[0034]ビデオエンコーダ20は、ビデオソース18からのビデオデータを符号化し得る。いくつかの例では、ソースデバイス12は、出力インターフェース22を介して宛先デバイス14に符号化ビデオデータを直接送信する。他の例では、符号化ビデオデータはまた、復号および/または再生のための宛先デバイス14による後のアクセスのために記憶媒体またはファイルサーバ上に記憶され得る。
[0035]図1の例では、宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。いくつかの例では、入力インターフェース28は、受信機および/またはモデムを含む。入力インターフェース28は、チャネル16を介して符号化ビデオデータを受信し得る。ディスプレイデバイス32は、宛先デバイス14と一体化され得るかまたはその外部にあり得る。概して、ディスプレイデバイス32は、復号ビデオデータを表示する。ディスプレイデバイス32は、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスを備え得る。
[0036]いくつかの例では、ビデオエンコーダ20およびビデオデコーダ30は、それのスケーラブルビデオコーディング(SVC:Scalable Video Coding)およびマルチビュービデオコーディング(MVC:Multiview Video Coding)拡張を含む、ISO/IEC MPEG−4 VisualおよびITU−T H.264(ISO/IEC MPEG−4 AVCとしても知られる)などのビデオ圧縮規格に従って動作する。H.264のMVC拡張のドラフトは、2012年11月7日現在、http://http://wftp3.itu.int/av-arch/jvt-site/2009_01_Geneva/JVT-AD007.zipにおいてダウンロードで入手可能であり、その内容全体は参照により本明細書に組み込まれる。他の例では、ビデオエンコーダ20およびビデオデコーダ30は、現在開発中の高効率ビデオコーディング(HEVC)規格を含む、他のビデオ圧縮規格に従って動作し得る。「HEVC Working Draft 9」と呼ばれる次のHEVC規格の別のドラフトは、2012年11月7日現在、http://phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K1003-v8.zipからダウンロード可能である、Brossら、「High Efficiency Video Coding (HEVC) text specification draft 9」、ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11とのビデオコーディング共同研究部会(JCT−VC)、第11回会合、上海、中国、2012年10月に記載されており、その内容全体は参照により本明細書に組み込まれる。ただし、本開示の技法は、いかなる特定のコーディング規格またはコーディング技法にも限定されない。
[0037]図1は一例にすぎず、本開示の技法は、符号化デバイスと復号デバイスとの間のデータ通信を必ずしも含むとは限らないビデオコーディング設定(たとえば、ビデオ符号化またはビデオ復号)に適用され得る。他の例では、データがローカルメモリから取り出されること、ネットワークを介してストリーミングされることなどが行われる。符号化デバイスがデータを符号化し、メモリに記憶し得、および/または復号デバイスがメモリからデータを取り出し、復号し得る。多くの例では、符号化および復号は、互いに通信しないが、メモリにデータを符号化し、および/またはメモリからデータを取り出して復号するだけであるデバイスによって実行される。
[0038]ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリートロジック、ハードウェアなど、様々な好適な回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装される場合、デバイスは、好適な非一時的コンピュータ可読記憶媒体にソフトウェアの命令を記憶し得、1つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。(ハードウェア、ソフトウェア、ハードウェアとソフトウェアの組合せなどを含む)上記のいずれも、1つまたは複数のプロセッサであると見なされ得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。
[0039]本開示では、概して、ビデオエンコーダ20が、ある情報をビデオデコーダ30などの別のデバイスに「シグナリング」することに言及することがある。「シグナリング」という用語は、概して、圧縮ビデオデータを復号するために使用されるシンタックス要素および/または他のデータの通信を指し得る。そのような通信は、リアルタイムまたはほぼリアルタイムで行われ得る。代替的に、そのような通信は、符号化時に符号化ビットストリーム中でシンタックス要素をコンピュータ可読記憶媒体に記憶するときに行われることがあるなど、ある時間期間にわたって行われ得、次いで、これらの要素は、この媒体に記憶された後の任意の時間に復号デバイスによって取り出され得る。
[0040]ビデオシーケンスは、一般に一連のビデオフレームを含む。ピクチャのグループ(GOP:group of pictures)は、概して、一連の1つまたは複数のビデオフレームを備える。GOPは、GOP中に含まれるいくつかのフレームを記述するシンタックスデータを、GOPのヘッダ中、GOPの1つまたは複数のフレームのヘッダ中、または他の場所に含み得る。各フレームは、それぞれのフレームのための符号化モードを記述するフレームシンタックスデータを含み得る。ビデオエンコーダ20は、一般に、ビデオデータを符号化するために、個々のビデオフレーム内のビデオブロックに対して動作する。H.264では、ビデオブロックは、H.264におけるマクロブロックまたはマクロブロックのパーティションに対応し得る。HEVCでは、ビデオブロックはコーディングユニット(CU)に対応し得る。ビデオブロックは、固定サイズまたは可変サイズを有し得、指定のコーディング規格に応じてサイズが異なり得る。さらに、各ビデオフレームは複数のスライスを含み得る。各スライスは複数のビデオブロックを含み得る。
[0041]ビデオエンコーダ20がビデオブロックを符号化するとき、ビデオエンコーダ20は、ビデオブロックに対応する予測ピクセルブロックを生成し得る。ビデオエンコーダ20は、予測ピクセルブロックを生成するためにイントラ予測またはインター予測を実行し得る。ビデオエンコーダ20がビデオブロックに対してイントラ予測を実行するとき、ビデオエンコーダ20は、ビデオブロックと同じビデオフレーム内のサンプル(たとえば、ピクセルコンポーネントの値)に基づいて、ビデオブロックに対応する予測ピクセルブロックを生成し得る。ビデオエンコーダ20が、ビデオブロックに対応する予測ピクセルブロックを生成するためにインター予測を実行するとき、ビデオエンコーダ20は、1つまたは複数の参照ピクチャ内のサンプルに基づいて予測ピクセルブロックを生成し得る。参照ピクチャは、そのビデオブロックを含んでいるピクチャ以外のピクチャであり得る。
[0042]ビデオエンコーダ20が、ビデオブロックに対応する予測ピクセルブロックを生成した後、ビデオエンコーダ20は、ビデオブロックに対応する残差ビデオブロックを生成し得る。残差ビデオブロック中の各サンプルは、ビデオブロック中の対応するサンプルと予測ピクセルブロックとの間の差分に基づき得る。ビデオエンコーダ20は、1つまたは複数の係数ブロックを生成するために残差ビデオブロックに変換を適用し得る。ビデオエンコーダ20は残差ビデオブロックに様々な変換を適用し得る。たとえば、ビデオエンコーダ20は、離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換などの変換を残差ビデオブロックに適用し得る。ビデオエンコーダ20は、ビデオブロックを表すために使用されるビット数をさらに低減するために係数ブロックを量子化し得る。係数ブロックを量子化した後に、ビデオエンコーダ20は、係数ブロック中の係数を表すシンタックス要素と、ビデオブロックに関連する他のシンタックス要素とに対して、エントロピー符号化(たとえば、コンテキスト適応型バイナリ算術コーディング(CABAC:context-adaptive binary arithmetic coding)、コンテキスト適応型可変長コーディング(CAVLC:context-adaptive variable length coding)、指数ゴロムコーディングなど)を実行し得る。ビデオエンコーダ20は、ビデオブロックに関連するエントロピー符号化されたシンタックス要素を含むビットストリームを出力し得る。
[0043]ビデオデコーダ30は、ビデオデータの符号化表現を含むビットストリームを受信し得る。ビデオデコーダ30は、ビットストリームからシンタックス要素を抽出するためにビットストリームをパースし得る。ビットストリームからシンタックス要素を抽出することの一部として、ビデオデコーダ30は、ビットストリームの部分にエントロピー復号を適用し得る。ビデオデータの各フレームのそれぞれのビデオブロックについて、ビデオデコーダ30は、それぞれのビデオブロックの予測ピクセルブロックを生成するために、それぞれのビデオブロックに関連するシンタックス要素に少なくとも部分的に基づいて、インター予測またはイントラ予測を実行し得る。さらに、ビデオデコーダ30は、それぞれのビデオブロックに関連する係数ブロックの係数を逆量子化し得、係数ブロックに1つまたは複数の逆変換を適用してそれぞれのビデオブロックの残差ビデオブロックを生成し得る。ビデオデコーダ30は、次いで、残差ビデオブロックと予測ピクセルブロックとに少なくとも部分的に基づいてそれぞれのビデオブロックを再構成し得る。このようにして、フレームのビデオブロックの各々を再構成することによって、ビデオデコーダ30はフレームを再構成し得る。
[0044]上述のように、ビデオエンコーダ20は、特定のビデオブロックに対応する予測ピクセルブロックを生成するためにインター予測を実行し得る。より詳細には、ビデオエンコーダ20は、予測ピクセルブロックを生成するために単方向インター予測または双方向インター予測を実行し得る。
[0045]ビデオエンコーダ20が特定のビデオブロックのために単方向インター予測を実行するとき、ビデオエンコーダ20は、単一の参照ピクチャリスト中の参照ピクチャ内の参照ブロックを探索し得る。参照ブロックは、特定のビデオブロックと同様であるサンプルのブロックであり得る。さらに、ビデオエンコーダ20が単方向インター予測を実行するとき、ビデオエンコーダ20は、特定のビデオブロックのための動き情報を生成し得る。特定のビデオブロックのための動き情報は、動きベクトルおよび参照ピクチャインデックスを含み得る。動きベクトルは、現在フレーム(すなわち、特定のビデオブロックを含むフレーム)内の特定のビデオブロックの位置と、参照フレーム内の参照ブロックの位置との間の空間変位を示し得る。参照ピクチャインデックスは、参照ピクチャリストを含んでいる参照フレームの参照ピクチャリスト内の位置を示す。特定のビデオブロックの予測ピクセルブロックは参照ブロックに等しくなり得る。
[0046]ビデオエンコーダ20が特定のビデオブロックのために双方向インター予測を実行するとき、ビデオエンコーダ20は、第1の参照ピクチャリスト(「リスト0」)中の参照ピクチャ内の第1の参照ブロックを探索し得、第2の参照ピクチャリスト(「リスト1」)中の参照ピクチャ内の第2の参照ブロックを探索し得る。ビデオエンコーダ20は、第1の参照ブロックと第2の参照ブロックとに少なくとも部分的に基づいて、特定のビデオブロックの予測ピクセルブロックを生成し得る。さらに、ビデオエンコーダ20は、特定のビデオブロックと第1の参照ブロックとの間の空間変位を示す第1の動きベクトルを生成し得る。ビデオエンコーダ20はまた、第1の参照ブロックを含んでいる参照ピクチャの第1の参照ピクチャリスト内のロケーションを識別する第1の参照ピクチャインデックスを生成し得る。さらに、ビデオエンコーダ20は、特定のビデオブロックと第2の参照ブロックとの間の空間変位を示す第2の動きベクトルを生成し得る。ビデオエンコーダ20はまた、第2の参照ブロックを含む参照ピクチャの第2の参照ピクチャリスト内のロケーションを識別する第2の参照ピクチャインデックスを生成し得る。
[0047]ビデオエンコーダ20が特定のビデオブロックに対して単方向インター予測を実行するとき、ビデオデコーダ30は、特定のビデオブロックの参照サンプルを識別するために特定のビデオブロックの動き情報を使用し得る。ビデオデコーダ30は、次いで、特定のビデオブロックの参照サンプルに基づいて特定のビデオブロックの予測ピクセルブロックを生成し得る。ビデオエンコーダ20が特定のビデオブロックに対して双方向インター予測を実行するとき、ビデオデコーダ30は、特定のビデオブロックの2つの参照サンプルを識別するために特定のビデオブロックの動き情報を使用し得る。ビデオデコーダ30は、特定のビデオブロックの2つの参照サンプルに基づいて特定のビデオブロックの予測ピクセルブロックを生成し得る。
[0048]マルチビュービデオコーディング(MVC)はH.264規格の拡張である。H.264のMVC拡張では、異なる複数の視点(viewpoint)からの同じシーンの複数のビューがあり得る。「アクセスユニット」という用語は、同じ時間インスタンスに対応するピクチャのセットを指すために使用される。したがって、ビデオデータは、時間とともに生じる一連のアクセスユニットとして概念化され得る。
[0049]MVCはビュー間予測をサポートする。ビュー間予測は、H.264において使用されるインター予測と同様であり、同じシンタックス要素を使用し得る。ただし、ビデオコーダがビデオブロックに対してビュー間予測を実行するとき、ビデオエンコーダ20は、参照ピクチャとして、そのビデオブロックと同じアクセスユニット中にあるがビューが異なるピクチャを使用し得る。対照的に、従来のインター予測は、参照ピクチャとして異なるアクセスユニット中のピクチャのみを使用する。MVCでは、ビデオデコーダ(たとえば、ビデオデコーダ30)が、あるビュー中のピクチャを他のビュー中のピクチャと無関係に復号することができる場合、そのビューは「ベースビュー」と呼ばれる。
[0050]複数のビューを符号化することに加えて、H.264の3次元ビデオ(3DV)コーディング拡張を生成するための取り組みが進行中である。H.264の3DV拡張は深度マップを提供する。深度マップは、ピクセル値が、対応する「テクスチャ」ピクチャ中に示されるオブジェクトの3次元深度を表すピクチャである。いくつかの例では、深度マップ中のより明るいピクセル値は、カメラにより近いオブジェクトに対応し得、深度マップ中のより暗いピクセル値は、カメラからより遠くのオブジェクトに対応し得る。「テクスチャ」ピクチャは、通常のH.264/AVCピクチャを含み得る。
[0051]3DV拡張では、ビデオエンコーダ20は、アクセスユニットの他のビューと同じ方法で深度マップを符号化し得る。すなわち、ビデオエンコーダ20は、深度マップのビデオブロックを符号化するためにインター予測および/またはイントラ予測を使用し得る。ビデオエンコーダ20は、異なるビューのためのテクスチャピクチャを含むアクセスユニットの一部として深度マップを符号化し得る。アクセスユニットのための深度マップは、アクセスユニットの「深度ビューコンポーネント」と呼ばれることもある。「ビューコンポーネント」という用語は、アクセスユニットのテクスチャビューコンポーネントまたは深度ビューコンポーネントのいずれかを指すために使用され得る。
[0052]ビデオエンコーダ20は、1つまたは複数のビューコンポーネントに基づいて合成参照ピクチャを生成し、1つまたは複数の参照ピクチャリスト中に合成参照ピクチャを含み得る。たとえば、ビデオエンコーダ20は、利用可能なテクスチャおよび深度ビューコンポーネントに基づいて合成テクスチャビューコンポーネントを生成するために深度画像ベースレンダリング(DIBR:Depth Image Based Rendering)を使用し得る。合成テクスチャビューコンポーネントは、深度マップと1つまたは複数のテクスチャビューコンポーネントとに基づいて合成されたテクスチャビューコンポーネントであり得る。いくつかの事例では、合成テクスチャビューコンポーネントは、インター予測において参照ピクチャとして、またはビュー間予測における参照ピクチャとして使用され得る。参照ピクチャとして使用される合成テクスチャビューコンポーネントはビュー合成参照ピクチャ(VSRP)と呼ばれることがある。ビデオコーダは参照ピクチャリスト中にVSRPを含み得る。
[0053]上述のように、ビデオコーダ(たとえば、ビデオエンコーダ20およびビデオデコーダ30)は、第1の参照ピクチャリスト(リスト0)と、第2の参照ピクチャリスト(リスト1)とを維持し得る。リスト0およびリスト1は参照ピクチャのリストであり得る。ビデオエンコーダ20は、部分的に特定の参照ピクチャの参照ピクチャリスト中の位置をシグナリングすることによって、当該特定の参照ピクチャ中の参照ブロックを使用してビデオブロックがインター予測されることをシグナリングし得る。
[0054]H.264/AVCおよびH.264/MVCでは、ビデオコーダは、時間的(temporal)(すなわち、ビュー内)参照ピクチャが常に初期に最初にリストされるように、常に参照ピクチャリストを生成する。時間的参照ピクチャの後には、参照ピクチャリスト中でビュー間参照ピクチャが続く。すなわち、ビデオコーダは、以下のステップを使用して参照ピクチャを構築し得る。第1に、ビデオコーダは、H.264規格において規定されているように時間的(すなわち、ビュー内)参照ピクチャのための参照ピクチャリスト初期化プロセスを適用し得、他のビューからの参照ピクチャは考慮されない。第2に、ビデオコーダは、MVC SPS拡張(extension)においてビュー間参照ピクチャが生じる順序で参照ピクチャリストの終端にビュー間参照ピクチャを付加し得る。第3に、ビデオコーダは、ビュー内参照ピクチャとビュー間参照ピクチャの両方のために参照ピクチャリスト変更(RPLM)プロセスを適用し得る。ビュー間参照ピクチャは、MVC SPS拡張によって規定されているように、それらのインデックス値によってRPLRコマンド中で識別され得る。RPLMプロセスについては、以下で詳細に説明する。
[0055]いくつかの参照ピクチャは「短期」参照ピクチャであり、いくつかの参照ピクチャは「長期」参照ピクチャである。長期参照ピクチャは、短期参照ピクチャよりも長い時間期間の間、参照ピクチャリスト中に残り得る。延長時間期間にわたって参照ピクチャの利用可能性を維持することが有利であり得るとビデオエンコーダ20が決定した場合、ビデオエンコーダ20は、参照ピクチャが長期参照ピクチャであることをシグナリングし得る。たとえば、参照ピクチャが静的バックグラウンドを含んでおり、他のピクチャがこの静的バックグラウンドの部分をカバー(cover)及びアンカバー(uncover)する場合、ビデオエンコーダ20は、参照フレームが長期参照ピクチャであることを示し得る。H.264/AVCまたはH.264/MVCでは、短期参照ピクチャは、現在ピクチャ(すなわち、現在コーディングされているピクチャ)のフレーム番号に等しいフレーム番号(frame_num)を決して有しない。ピクチャのフレーム番号は、ピクチャのピクチャ番号に基づく値である。ピクチャのフレーム番号は、ピクチャが短期参照ピクチャとして使用されるとき、ピクチャを識別するために使用され得る。
[0056]いくつかの事例では、参照ピクチャリスト中の参照ピクチャの順序を変更することが有利であり得る。たとえば、位置は単項値を使用してシグナリングされ得るので、参照ピクチャリスト中の最初の位置を示すためには、参照ピクチャリスト中の最後の位置よりもより少数のビットが必要とされ得る。したがって、特定の参照ピクチャが頻繁に使用される可能性がある場合、その特定の参照ピクチャを参照ピクチャリスト中の最後の位置よりも参照ピクチャリスト中の最初の位置に近接させることが有利であり得る。
[0057]したがって、ビデオエンコーダ20は、参照ピクチャリストを変更するようにビデオデコーダ30に命令する一連の1つまたは複数の参照ピクチャリスト変更(RPLM)コマンドを含み得る。ビデオエンコーダ20は、コード化スライスのスライスヘッダ中にRPLMコマンドを含み得る。以下の表1に、スライスヘッダ中に含まれ得るRPLMコマンドの例示的なシンタックスを示す。
Figure 0005876162
[0058]表1の例示的なシンタックスにおいて、タイプ記述子ue(v)をもつシンタックス要素は、最初に左ビットとともに指数ゴロムコーディングを使用して符号化される符号なし可変長値である。形式u(n)のタイプ記述子をもつシンタックス要素は、nに等しい長さを有する符号なし値であり、ただし、nは非負整数である。
[0059]表1において、「slice_type」は、現在スライス(すなわち、スライスヘッダがRPLMコマンドを含むスライス)のタイプを示す。以下の表2に、「slice_type」の例示的なセマンティクスを示す。
Figure 0005876162
[0060]範囲5..9内の「slice_type」値は、現在スライスのコーディングタイプに加えて、現在コード化ピクチャのすべての他のスライスが、slice_typeの現在値に等しいかまたはslice_typeの現在値−5に等しいslice_typeの値を有することを指定する。
[0061]さらに、表1の例示的なシンタックスにおいて、「ref_pic_list_modification_flag_l0」シンタックス要素は、リスト0を変更すべき1つまたは複数の「modification_of_pic_nums_idc」シンタックス要素があるかどうかを示す。「ref_pic_list_modification_flag_l1」シンタックス要素は、リスト1を変更すべき1つまたは複数の「modification_of_pic_nums_idc」シンタックス要素があるかどうかを示す。
[0062]「modification_of_pic_nums_idc」シンタックス要素は、実行すべきRPLMコマンドのタイプを指定する。このように、「modification_of_pic_nums_idc」シンタックス要素はRPLMタイプ識別子の一例である。いくつかの例では、「modification_of_pic_nums_idc」シンタックス要素は、両端値を含む0〜5にわたる値を有し得る。「modification_of_pic_nums_idc」シンタックス要素が0に等しい場合、ビットストリームは、ピクチャ番号予測値から減算すべき量を指定する「abs_diff_pic_num_minus1」シンタックス要素を含む。「modification_of_pic_nums_idc」シンタックス要素が1に等しい場合、ビットストリームは、ピクチャ番号予測値に加算すべき量を指定する「abs_diff_pic_num_minus1」シンタックス要素を含む。「modification_of_pic_nums_idc」シンタックス要素が2に等しい場合、ビットストリームは、長期ピクチャ番号を指定する「long_term_pic_num」シンタックス要素を含む。
[0063]「modification_of_pic_nums_idc」シンタックス要素が4に等しい場合、ビットストリームは「abs_diff_view_idx_minus1」シンタックス要素を含み、「abs_diff_view_idx_minus1」シンタックス要素は、参照ビューインデックスの予測値から減算すべき値に対応する。RPLMタイプシンタックス要素が5に等しい場合、ビットストリームは、参照ビューインデックスの予測値に加算すべき値に対応するシンタックス要素(たとえば、「abs_diff_view_idx_minus1」)を含む。0または1に等しいRPLMタイプシンタックス要素をもつRPLMコマンドは、短期参照ピクチャのためのRPLMコマンド、または短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するRPLMコマンドと呼ばれることがある。「modification_of_pic_nums_idc」シンタックス要素が3に等しい場合、「modification_of_pic_nums_idc」シンタックス要素は、参照ピクチャリストの変更が完了したことを示す。
[0064]ビデオデコーダ30は、RPLMコマンドがビットストリーム中でシグナリングされる順序でRPLMコマンドを処理する。さらに、ビデオデコーダ30が一連のRPLMコマンドを処理するとき、ビデオデコーダ30は、初めに現在インデックス値を0に設定し得、各RPLMコマンドの処理中に現在インデックス値を増加(increment)し得る。ビデオデコーダ30がRPLMコマンドを処理するとき、ビデオデコーダ30は、参照ピクチャリスト中で、現在インデックス値によって示される位置にある参照ピクチャと、現在インデックス値によって示される位置に続く位置にあるすべての参照ピクチャとを1つの位置だけシフトダウンし得る。ビデオデコーダ30は、次いで、現在インデックス値によって示される位置において参照ピクチャを参照ピクチャリスト中に挿入し得る。ビデオデコーダ30は、次いで、参照ピクチャリストを走査し、存在する場合、挿入された参照ピクチャの重複を除去し得る。
[0065]ビデオデコーダ30は、RPLMコマンドに関連するピクチャ番号を決定するために、RPLMコマンドの「modification_of_pic_nums_idc」シンタックス要素、「abs_diff_pic_num_pic_minus1」シンタックス要素、および「long_term_pic_num」シンタックス要素を使用する。RPLMコマンドに関連するピクチャ番号は、参照ピクチャリスト中に挿入すべき参照ピクチャのピクチャ番号であり得る。たとえば、ビデオデコーダ30が、0に等しい「modification_of_pic_nums_idc」シンタックス要素を含むRPLMコマンドを処理する場合、ビデオデコーダ30は、ピクチャ番号予測値から「abs_diff_pic_num_pic_minus1」シンタックス要素の値を減算し、1をたすことによって参照ピクチャリスト中に挿入すべき参照ピクチャのピクチャ番号を決定し得る。ビデオデコーダ30が、1に等しい「modification_of_pic_nums_idc」シンタックス要素を含むRPLMコマンドを処理する場合、ビデオデコーダ30は、ピクチャ番号予測値に「abs_diff_pic_num_pic_minus1」シンタックス要素の値を加算し、1をたすことによって参照ピクチャリスト中に挿入すべき参照ピクチャのピクチャ番号を決定し得る。ピクチャ番号予測値は、当初は現在フレームのピクチャ番号に等しい。参照ピクチャリスト中に挿入すべき参照ピクチャのピクチャ番号を決定した後に、ビデオデコーダ30は、ピクチャ番号予測値を、決定されたピクチャ番号に等しくなるように設定する。
[0066]ビデオデコーダ30が、4に等しい「modification_of_pics_nums_idc」シンタックス要素を含むRPLMコマンドを処理する場合、ビデオデコーダ30は、参照ビューインデックスの予測値から「abs_diff_view_idx_minus1」シンタックス要素の値+1を減算することによって参照ピクチャリスト中に挿入すべき参照ピクチャのビューインデックスを決定し得る。ビデオデコーダ30が、5に等しい「modification_of_pics_nums_idc」シンタックス要素を含むRPLMコマンドを処理する場合、ビデオデコーダ30は、参照ビューインデックスの予測値に「abs_diff_view_idx_minus1」シンタックス要素の値+1を加算することによって参照ピクチャリスト中に挿入すべき参照ピクチャのビューインデックスを決定し得る。参照ビューインデックスの予測値は、当初は−1に等しくなり得る。参照ピクチャリスト中に挿入すべき参照ピクチャのビューインデックスを決定した後に、ビデオデコーダ30は、参照ビューインデックスの予測値を、決定されたビューインデックスに等しくなるように設定し得る。
[0067]ビデオデコーダ30が、2に等しい「modification_of_pic_nums_idc」シンタックス要素を含むRPLMコマンドを処理する場合、ビデオデコーダ30は、「long_term_pic_num」シンタックス要素の値に等しいピクチャ番号を有する参照ピクチャを参照ピクチャリスト中に挿入し得る。ビデオデコーダ30が、3に等しい「modification_of_pic_nums_idc」シンタックス要素を含むRPLMコマンドを処理する場合、ビデオデコーダ30は、参照ピクチャリストを変更するプロセスを終了し得る。
[0068]ビットストリーム中にRPLMコマンドを含めることによって、ビデオエンコーダ20は、時間的およびビュー予測参照をフレキシブルに構成し得、それにより、潜在的なコーディング効率利得が与えられ得る。さらに、RPLMコマンドの使用は、参照ピクチャ選択および冗長ピクチャ機構がビュー次元に拡張され得るので、誤り耐性を高め得る。
[0069]現在のMVC設計では、VSRPなどの合成参照ピクチャを参照ピクチャリスト中の特定の位置に挿入するために短期参照ピクチャRPLMコマンドを使用することは可能でない。短期参照ピクチャRPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するようにビデオデコーダに命令し得る。たとえば、0、1、4、または5に等しい値をもつRPLMタイプ識別子(たとえば、「modification_of_pic_nums_idc」シンタックス要素)をもつRPLMコマンドが短期参照ピクチャRPLMコマンドである。したがって、合成参照ピクチャが参照ピクチャとして頻繁に使用される場合でも、合成参照ピクチャは参照ピクチャリスト中の前の位置に移動され得ない。これは、合成参照ピクチャの参照ピクチャリスト中の位置を示すために使用されるビット数を不必要に増加させ得る。
[0070]本開示の技法によれば、ビデオエンコーダ20は、1つまたは複数の短期参照ピクチャRPLMコマンドを生成し得る。1つまたは複数の短期参照ピクチャRPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属し得る。同様に、ビデオデコーダ30は、1つまたは複数の短期参照ピクチャRPLMコマンドに応答して、合成参照ピクチャを含むように参照ピクチャリストを変更し得る。ビデオデコーダ30は、現在ピクチャのビデオブロックに対してインター予測を実行するために参照ピクチャリスト中の1つまたは複数のピクチャを使用し得る。
[0071]上記のように、H.264/AVCまたはH.264/MVCでは、短期参照ピクチャは、現在ピクチャ(すなわち、現在コーディングされているピクチャ)のフレーム番号に等しいフレーム番号(frame_num)を決して有しない。本開示の技法によれば、短期参照ピクチャRPLMコマンドは、3Dビデオコーディング中に合成参照ピクチャを識別するために再利用され得る。たとえば、短期参照ピクチャRPLMコマンドが、現在フレームのフレーム番号に等しい参照ピクチャのフレーム番号に関連するとき、RPLMコマンドは合成参照ピクチャを指している。言い換えれば、現在ピクチャのフレーム番号に等しいフレーム番号は、RPLMコマンドにおいて合成参照ピクチャを示す。このようにして、合成参照ピクチャは、0または1に等しいmodification_of_pic_nums_idcを有する1つのRPLMコマンドを追加することによって参照ピクチャリスト中の任意の位置中に挿入され得る。
[0072]たとえば、現在フレームのフレーム番号は5であり得、2つの短期参照ピクチャのフレーム番号はそれぞれ3および4であり得る。短期参照ピクチャは参照ピクチャリスト中に追加されることになる。さらに、1つの合成参照ピクチャも参照ピクチャリスト中に追加されることになる。4に等しいフレーム番号をもつ短期参照ピクチャ、合成参照ピクチャ、および3に等しいフレーム番号をもつ短期参照ピクチャの順序で参照ピクチャリストを構築するために、ビデオエンコーダ20は、以下の順序で以下のRPLMコマンドをシグナリングし得る。
1. (modification_of_pic_nums_idc, abs_diff_pic_num_minus1) = (0, 0)
2. (modification_of_pic_nums_idc, abs_diff_pic_num_minus1) = (1, 0)
3. (modification_of_pic_nums_idc, abs_diff_pic_num_minus1) = (0, 1)
4. (modification_of_pic_nums_idc) = (3)
[0073]上記で説明したように、「modification_of_pic_nums_idc」シンタックス要素が0に等しい場合、ビデオデコーダ30は、ピクチャ番号予測値から「abs_diff_pic_num_minus1」シンタックス要素の値+1を減算することによって参照ピクチャリスト中に挿入すべき参照ピクチャのフレーム番号を決定し得る。「modification_of_pic_nums_idc」シンタックス要素が1に等しい場合、ビデオデコーダ30は、ピクチャ番号予測値に「abs_diff_pic_num_minus1」シンタックス要素の値+1を加算することによって参照ピクチャリスト中に挿入すべき参照ピクチャのフレーム番号を決定し得る。ピクチャ番号予測値は、当初は現在フレームのピクチャ番号に等しい。このようにして、ビデオデコーダ30は、ピクチャ予測値に、RPLMコマンドによって指定された値+1を加算または減算することによってピクチャ番号を決定し得る。参照ピクチャリスト中に挿入すべき参照ピクチャのピクチャ番号を決定した後に、ビデオデコーダ30は、ピクチャ番号予測値を、決定されたピクチャ番号に等しくなるように設定する。
[0074]したがって、上記の第1のRPLMコマンドに応答して、ビデオデコーダ30は、フレーム番号4(すなわち、5−(0+1)=4)を有する参照フレームを参照ピクチャリスト中に位置0において挿入し、参照ピクチャリストにおいてすべての他の参照ピクチャをシフトダウンし得る。上記の第2のRPLMコマンドに応答して、ビデオデコーダ30は、フレーム番号5(すなわち、4+(0+1)=5)を有する参照フレームを参照ピクチャリスト中に位置1において挿入し、参照ピクチャリストにおいてすべての後続の参照ピクチャをシフトダウンし得る。決定されたフレーム番号「5」は現在フレームのフレーム番号に等しいので、ビデオデコーダ30は、第2のRPLMコマンドに応答して合成参照ピクチャを参照ピクチャリスト中に挿入する。第3のRPLMコマンドに応答して、ビデオデコーダ30は、フレーム番号3(すなわち、5−(1+1)=3)を有する参照フレームを参照ピクチャリスト中に位置2において挿入し、参照ピクチャリストにおいてすべての後続の参照ピクチャをシフダウンし得る。このようにして、ビデオデコーダ30は、第2のRPLMコマンドに応答して、テクスチャビューコンポーネントを参照ピクチャリスト中に挿入し得、第2のRPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属する。第4のRPLMコマンドに応答して、ビデオデコーダ30は、参照ピクチャリストを変更するプロセスを停止し得る。
[0075]図2は、本開示の技法を実装するように構成された例示的なビデオエンコーダ20を示すブロック図である。図2は、説明のために与えられており、本開示で広く例示および説明する技法を限定するものと見なされるべきではない。説明のために、本開示では、H.264コーディングのコンテキストにおいてビデオエンコーダ20について説明する。ただし、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。
[0076]図2の例では、ビデオエンコーダ20は、予測処理ユニット100と、残差生成ユニット102と、変換処理ユニット104と、量子化ユニット106と、逆量子化ユニット108と、逆変換処理ユニット110と、再構成ユニット112と、フィルタユニット113と、復号ピクチャバッファ114と、エントロピー符号化ユニット116と、ビットストリームユニット118とを含む。予測処理ユニット100は、インター予測処理ユニット121と、イントラ予測処理ユニット126とを含む。インター予測処理ユニット121は、動き推定ユニット122と、動き補償ユニット124とを含む。他の例では、ビデオエンコーダ20は、より多数の、より少数の、または異なる機能構成要素を含み得る。
[0077]ビデオエンコーダ20はビデオデータを受信し得る。ビデオデータを符号化するために、ビデオエンコーダ20は、ビデオデータの各ピクチャの各スライスを符号化し得る。スライスを符号化することの一部として、ビデオエンコーダ20は、スライス中のビデオブロックを符号化し得る。
[0078]インター予測処理ユニット121は、ビデオブロックに対してインター予測を実行することによってビデオブロックの予測データを生成し得る。ビデオブロックの予測データは、ビデオブロックに対応する予測ピクセルブロックと、ビデオブロックの動き情報とを含み得る。
[0079]スライスは、Iスライス、Pスライス、またはBスライスであり得る。動き推定ユニット122および動き補償ユニット124は、ビデオブロックがIスライス中にあるか、Pスライス中にあるか、Bスライス中にあるかに応じて、ビデオブロックに対して異なる演算を実行し得る。Iスライス中では、すべてのビデオブロックがイントラ予測される。したがって、ビデオブロックがIスライス中にある場合、動き推定ユニット122および動き補償ユニット124は、ビデオブロックに対してインター予測を実行しない。
[0080]ビデオブロックがPスライス中にある場合、動き推定ユニット122は、ビデオブロックの参照ブロックについて参照ピクチャリスト(たとえば、リスト0)中の参照ピクチャを探索し得る。ビデオブロックの参照ブロックは、ビデオブロックに最も密接に対応するピクセルブロックであり得る。動き推定ユニット122は、様々なメトリックを使用して、参照ピクチャ中のピクセルブロックがどの程度密接にビデオブロックに対応するかを判断し得る。たとえば、動き推定ユニット122は、絶対差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of square difference)、または他の差分メトリックによって、参照ピクチャ中のピクセルブロックがどの程度密接にビデオブロックに対応するかを決定し得る。
[0081]動き推定ユニット122は、Pスライス中にビデオブロックの参照ブロックを含んでいるリスト0中の参照ピクチャを示す参照ピクチャインデックス、およびビデオブロックと参照ブロックとの間の空間変位を示す動きベクトルを生成し得る。動き推定ユニット122は、ビデオブロックの動き情報として参照ピクチャインデックスと動きベクトルとを出力し得る。動き補償ユニット124は、ビデオブロックの動き情報によって示される参照ブロックに基づいてビデオブロックの予測ピクセルブロックを生成し得る。
[0082]ビデオブロックがBスライス中にある場合、動き推定ユニット122は、ビデオブロックについて単方向インター予測または双方向インター予測を実行し得る。ビデオブロックについて単方向インター予測を実行するために、動き推定ユニット122は、ビデオブロックの参照ブロックについてリスト0またはリスト1の参照ピクチャを探索し得る。動き推定ユニット122は、参照ブロックを含んでいる参照ピクチャのリスト0またはリスト1中の位置を示す参照ピクチャインデックス、およびビデオブロックと参照ブロックとの間の空間変位を示す動きベクトルを生成し得る。動き推定ユニット122はまた、参照ピクチャがリスト0中にあるかリスト1中にあるかを示す予測方向インジケータを生成し得る。
[0083]ビデオブロックについて双方向インター予測を実行するために、動き推定ユニット122は、ビデオブロックの参照ブロックについてリスト0中の参照ピクチャを探索し得、また、ビデオブロックの別の参照ブロックについてリスト1中の参照ピクチャを探索し得る。動き推定ユニット122は、参照ブロックを含んでいる参照ピクチャのリスト0およびリスト1中の位置を示す参照ピクチャインデックスを生成し得る。さらに、動き推定ユニット122は、参照ブロックとビデオブロックとの間の空間変位を示す動きベクトルを生成し得る。ビデオブロックの動き情報は、参照ピクチャインデックスとビデオブロックの動きベクトルとを含み得る。動き補償ユニット124は、ビデオブロックの動き情報によって示される参照ブロックに基づいてビデオブロックの予測サンプルブロックを生成し得る。
[0084]イントラ予測処理ユニット126は、ビデオブロックに対してイントラ予測を実行することによってビデオブロックの予測データを生成し得る。ビデオブロックの予測データは、ビデオブロックの予測ピクセルブロックと、様々なシンタックス要素とを含み得る。イントラ予測処理ユニット126は、Iスライス、Pスライス、およびBスライス中のビデオブロックに対してイントラ予測を実行し得る。
[0085]ビデオブロックに対してイントラ予測を実行するために、イントラ予測処理ユニット126は、複数のイントラ予測モードを使用して、ビデオブロックための予測データの複数のセットを生成し得る。イントラ予測モードを使用してビデオブロックのための予測データのセットを生成するために、イントラ予測処理ユニット126は、イントラ予測モードに関連する方向に隣接ビデオブロックからビデオブロックを越えてサンプルを拡張し得る。隣接ビデオブロックは、ビデオブロックについて左から右、上から下の符号化順序を仮定すると、ビデオブロックの上、右上、左上、または左にあり得る。いくつかの例では、イントラ予測モードの数はビデオブロックのサイズに依存し得る。
[0086]予測処理ユニット100は、ビデオブロックについてインター予測処理ユニット121によって生成された予測データ、またはビデオブロックについてイントラ予測処理ユニット126によって生成された予測データの中から、ビデオブロックの予測データを選択し得る。いくつかの例では、予測処理ユニット100は、予測データのセットのレート/ひずみメトリックに基づいてビデオブロックの予測データを選択する。
[0087]残差生成ユニット102は、ビデオブロックの対応するサンプルから予測ピクセルブロック中のサンプルを減算することによって残差サンプルブロックを生成し得る。変換処理ユニット104は、残差サンプルブロックに1つまたは複数の変換を適用することによって各残差サンプルブロックの係数ブロックを生成し得る。変換処理ユニット104は、残差サンプルブロックに様々な変換を適用し得る。たとえば、変換処理ユニット104は、離散コサイン変換(DCT)、方向性変換、または概念的に同様の変換を残差サンプルブロックに適用し得る。
[0088]量子化ユニット106は、係数ブロック中の係数を量子化し得る。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。たとえば、量子化中にnビット係数がmビット係数に切り捨てられ得、ただし、nはmよりも大きい。量子化ユニット106は、量子化パラメータ(QP:quantization parameter)値に基づいて係数ブロックを量子化し得る。ビデオエンコーダ20は、QP値を調整することによって、係数ブロックに適用される量子化の程度を調整し得る。
[0089]逆量子化ユニット108および逆変換処理ユニット110は、それぞれ、係数ブロックに逆量子化および逆変換を適用して、係数ブロックから残差サンプルブロックを再構成し得る。再構成ユニット112は、再構成された残差サンプルブロック中のサンプルを、予測処理ユニット100によって生成された1つまたは複数の予測サンプルブロックからの対応するサンプルに加算して、再構成されたビデオブロックを生成し得る。フィルタユニット113は、再構成されたビデオブロック中のブロッキングアーティファクトを低減するためにデブロッキング動作を実行し得る。復号ピクチャバッファ114は、フィルタユニット113が、再構成されたビデオブロックに対して1つまたは複数のデブロッキング動作を実行した後に、再構成されたビデオブロックを記憶し得る。動き推定ユニット122および動き補償ユニット124は、再構成されたビデオブロックを含んでいる参照ピクチャを使用して、後続のピクチャのビデオブロックに対してインター予測を実行し得る。加えて、イントラ予測処理ユニット126は、復号ピクチャバッファ114中の復元されたビデオブロックを使用してイントラ予測を実行し得る。
[0090]エントロピー符号化ユニット116は、ビデオエンコーダ20の他の機能構成要素からデータを受信し得る。たとえば、エントロピー符号化ユニット116は、量子化ユニット106から係数ブロックを受信し得、予測処理ユニット100からシンタックス要素を受信し得る。エントロピー符号化ユニット116は、データに対して1つまたは複数のエントロピー符号化演算を実行してエントロピー符号化データを生成し得る。たとえば、ビデオエンコーダ20は、コンテキスト適応型可変長コーディング(CAVL)演算、CABAC演算、変数−変数(V2V:variable-to-variable)レングスコーディング演算、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC:syntax-based context-adaptive binary arithmetic coding)演算、確率間隔区分エントロピー(PIPE:Probability Interval Partitioning Entropy)コーディング演算、指数ゴロムコーディング演算、または別のタイプのエントロピー符号化演算をデータに対して実行し得る。
[0091]ビットストリームユニット118は、エントロピー符号化ユニット116によって生成されたエントロピー符号化データを含むビットストリームを出力し得る。ビットストリームは、インター予測処理ユニット121によって生成された1つまたは複数のRPLMコマンドを表すデータを含み得る。RPLMコマンドは、合成参照ピクチャを含むために参照ピクチャリストを変更するようにビデオデコーダに命令する1つまたは複数の短期参照ピクチャRPLMコマンドを含み得る。
[0092]図3は、本開示の技法を実装するように構成された例示的なビデオデコーダ30を示すブロック図である。図3は、説明のために与えられており、本開示で広く例示および説明する技法に対する限定ではない。説明のために、本開示では、H.264コーディングのコンテキストにおいてビデオデコーダ30について説明する。ただし、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。
[0093]図3の例では、ビデオデコーダ30は、エントロピー復号ユニット150と、予測処理ユニット152と、逆量子化ユニット154と、逆変換処理ユニット156と、復元ユニット158と、フィルタユニット159と、復号ピクチャバッファ160とを含む。予測処理ユニット152は、動き補償ユニット162と、イントラ予測処理ユニット164とを含む。他の例では、ビデオデコーダ30は、より多数の、より少数の、または異なる機能構成要素を含み得る。
[0094]ビデオデコーダ30はビットストリームを受信し得る。エントロピー復号ユニット150は、ビットストリームからシンタックス要素を抽出するためにビットストリームをパースし得る。ビットストリームをパースすることの一部として、エントロピー復号ユニット150は、ビットストリーム中のエントロピー符号化されたシンタックス要素をエントロピー復号(たとえば、CABAC復号)し得る。予測処理ユニット152、逆量子化ユニット154、逆変換処理ユニット156、再構成ユニット158、およびフィルタユニット159は、ビットストリームから抽出されたシンタックス要素に基づいて復号ビデオデータを生成し得る。ビットストリームから抽出されたシンタックス要素は、係数ブロックを表すシンタックス要素を含み得る。
[0095]予測処理ユニット152は、スライスに関連するシンタックス要素に基づいて第1の参照ピクチャリスト(リスト0)および第2の参照ピクチャリスト(リスト1)を生成し得る。参照ピクチャリストを生成することの一部として、予測処理ユニット152は、RPLMコマンドに応答して参照ピクチャリストを変更し得る。たとえば、予測処理ユニット152は、1つまたは複数の短期参照ピクチャコマンドに応答して、VSRPなどの合成参照ピクチャを含むように参照ピクチャリストを変更し得る。
[0096]逆量子化ユニット154は、係数ブロックを逆量子化(inverse quantize)、すなわち逆量子化(de-quantize)し得る。逆量子化ユニット154は、量子化の程度を決定し、同様に、逆量子化ユニット154が適用すべき逆量子化の程度を決定するために、QP値を使用し得る。逆量子化ユニット154が係数ブロックを逆量子化した後に、逆変換処理ユニット156は、残差サンプルブロックを生成するために係数ブロックに1つまたは複数の逆変換を適用し得る。たとえば、逆変換処理ユニット156は、逆DCT、逆整数変換、逆カルーネンレーベ変換(KLT)、逆回転変換、逆方向性変換、または別の逆変換を係数ブロックに適用し得る。
[0097]ビデオブロックがイントラ予測を使用して符号化された場合、イントラ予測処理ユニット164は、ビデオブロックの予測ピクセルブロックを生成するためにイントラ予測を実行し得る。たとえば、イントラ予測処理ユニット164は、ビットストリーム中のシンタックス要素に基づいて、ビデオブロックのイントラ予測モードを決定し得る。イントラ予測処理ユニット164は、空間的に隣接するビデオブロックに基づいてビデオブロックの予測ピクセルブロックを生成するためにイントラ予測モードを使用し得る。
[0098]さらに、ビデオブロックがインター予測を使用して符号化された場合、エントロピー復号ユニット150は、ビデオブロックの動き情報を抽出し得る。動き補償ユニット162は、ビデオブロックの動き情報に基づいて、ビデオブロックのための1つまたは複数の参照ブロックを決定し得る。動き補償ユニット162は、ビデオブロックのための1つまたは複数の参照ブロックに基づいて、ビデオブロックの予測ピクセルブロックを生成し得る。
[0099]再構成ユニット158は、ビデオブロックの残差ピクセルブロックとビデオブロックの予測ピクセルブロックとに基づいてビデオブロックを再構成し得る。特に、再構成ユニット158は、ビデオブロックを再構成するために、予測ピクセルブロックの対応するサンプルに残差ピクセルブロックのサンプル(たとえば、ルーマ成分またはクロマ成分)を加算し得る。フィルタユニット159は、ビデオブロックに関連するブロッキングアーティファクトを低減するためにデブロッキング動作を実行し得る。ビデオデコーダ30は、復号ピクチャバッファ160にビデオブロックを記憶し得る。復号ピクチャバッファ160は、後続の動き補償、イントラ予測、および図1のディスプレイデバイス32などのディスプレイデバイス上での提示のために、参照ピクチャを与え得る。たとえば、ビデオデコーダ30は、復号ピクチャバッファ160中のビデオブロックに基づいて、他のCUのPUに対してイントラ予測演算またはインター予測演算を実行し得る。
[0100]図4は、本開示の1つまたは複数の技法による、ビデオデータを符号化するためのプロセスの一部としてビデオエンコーダ20によって実行される例示的な動作200を示すフローチャートである。図4のフローチャートおよび以下の図のフローチャートは例として与えるものである。他の例では、本開示の技法は、図4および以下の図の例に示すステップに対して、より多数の、より少数の、または異なるステップを使用して実装され得る。
[0101]図4の例では、ビデオエンコーダ20のインター予測処理ユニット121が、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成する(202)。いくつかの例では、合成参照ピクチャはVSRPである。インター予測処理ユニット121は、現在ピクチャの1つまたは複数のビデオブロックを符号化するために合成参照ピクチャを参照ピクチャとして使用する(204)。さらに、ビットストリームユニット118が、ピクチャのコード化表現と、合成参照ピクチャを参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令するRPLMコマンドとを含むビットストリームを生成し得る(206)。
[0102]図5は、本開示の1つまたは複数の技法による、符号化されたビデオデータを復号するためのプロセスの一部としてビデオデコーダ30によって実行される例示的な動作230を示すフローチャートである。図5の例では、ビデオデコーダ30は、ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号する(232)。さらに、ビデオデコーダ30は、1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成する(234)。たとえば、ビデオデコーダ30は、アクセスユニットのテクスチャビューコンポーネントとアクセスユニットの深度ビューコンポーネントとに基づいてVSRPを生成するためにDIBRを実行し得る。
[0103]予測処理ユニット152は、RPLMコマンドに応答して、合成参照ピクチャを参照ピクチャリスト内の特定のロケーションに挿入する(236)。RPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属し得る。以下で詳細に説明する図6は、短期参照ピクチャまたは合成参照ピクチャを参照ピクチャリスト中に挿入するための例示的な動作を示すフローチャートである。予測処理ユニット152が短期参照ピクチャまたは合成参照ピクチャを参照ピクチャリスト中に挿入した後に、動き補償ユニット162が、ピクチャのビデオブロックに対してインター予測を実行するために参照ピクチャリスト中の1つまたは複数の参照ピクチャを使用する(238)。いくつかの事例では、動き補償ユニット162は、ビュー間予測のために、挿入された合成参照ピクチャを参照ピクチャとして使用し得る。
[0104]図6は、本開示の1つまたは複数の技法による、短期参照ピクチャまたは合成参照ピクチャを参照ピクチャリスト中に挿入するためのビデオデコーダ30の例示的な動作250を示すフローチャートである。図6の例では、予測処理ユニット152が、RPLMコマンドに関連するピクチャ番号を決定する(251)。たとえば、RPLMコマンドのRPLMタイプ識別子が0または1に等しい場合、予測処理ユニット152は、ピクチャ番号予測値に、RPLMコマンドによって指定された値+1を加算または減算することによって、RPLMコマンドに関連するピクチャ番号を決定し得る。さらに、予測処理ユニット152は、RPLMコマンドに関連するピクチャ番号に基づいて、RPLMコマンドに関連するフレーム番号を決定する(252)。いくつかの例では、RPLMコマンドに関連するフレーム番号は、RPLMコマンドに関連するピクチャ番号の最下位ビットであり得る。
[0105]さらに、予測処理ユニット152は、カウンタ値を参照ピクチャリスト中の最後の位置のインデックスに設定する(253)。予測処理ユニット152は、次いで、カウンタ値が現在インデックス値よりも大きいかどうかを決定する(254)。予測処理ユニット152がスライスヘッダ中の一連のRPLMコマンドを処理し始めるとき、予測処理ユニット152は、初めに現在インデックス値を0に設定し得、一連の各RPLMコマンドの処理中に現在インデックス値を増加し得る。
[0106]カウンタ値が現在インデックス値よりも大きいと決定したことに応答して(254の「YES」)、予測処理ユニット152は、参照ピクチャリストにおいて、カウンタ値によって示される位置にある参照ピクチャを、参照ピクチャリスト中の後に続く次の(following)位置にシフトする(256)。次に、予測処理ユニット152はカウンタ値を減らす(decrement)(258)。カウンタ値を減らした後に、予測処理ユニット152は、カウンタ値が現在インデックス値よりも大きいかどうかを再び決定する(254)。カウンタ値が現在インデックス値よりも大きい場合、予測処理ユニット152はアクション256および258を繰り返す。このようにして、予測処理ユニット152は、参照ピクチャリストにおいて、現在インデックス値に後続するすべての参照フレーム番号をシフトダウンし得る。したがって、予測処理ユニット152が合成参照ピクチャを参照ピクチャリスト中に所与の位置において挿入している場合、予測処理ユニット152は、ピクチャの参照ピクチャリスト中の位置を当該所与の位置の後にシフトし得る。
[0107]カウンタ値が現在インデックス値よりも大きくないと決定したことに応答して(254の「NO」)、予測処理ユニット152は、現在フレーム番号が挿入フレーム番号に等しいかどうかを決定する(260)。現在フレーム番号は、予測処理ユニット152が現在復号しているピクチャのフレーム番号である。挿入フレーム番号は、予測処理ユニット152が参照ピクチャリスト中に挿入しているピクチャのフレーム番号である。現在フレーム番号が挿入フレーム番号に等しくないと決定したことに応答して(260の「NO」)、予測処理ユニット152は、現在インデックス値によって示される位置において参照ピクチャを参照ピクチャリスト中に挿入する(262)。ピクチャのフレーム番号は、ピクチャのピクチャ番号のLSB部分であることができる。現在フレーム番号が挿入フレーム番号に等しくないので、参照ピクチャリスト中に挿入されている参照ピクチャは、短期参照ピクチャであり、合成参照ピクチャではない。
[0108]一方、現在フレーム番号が挿入フレーム番号に等しいと決定したことに応答して(260の「YES」)、予測処理ユニット152は、現在インデックス値によって示される位置において合成参照ピクチャを参照ピクチャリスト中に挿入する(264)。現在フレーム番号が挿入フレーム番号に等しいので、挿入フレーム番号は合成参照ピクチャを指す。このようにして、予測処理ユニット152が、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するRPLMコマンドを受信した場合、予測処理ユニット152は、RPLMコマンドに関連するピクチャ番号を決定し、RPLMコマンドに関連するフレーム番号が、RPLMコマンドに関連するフレーム番号に等しいと決定したことに応答して、合成参照ピクチャを参照ピクチャリスト中に挿入し得る。RPLMコマンドに関連するフレーム番号は、RPLMコマンドに関連するピクチャ番号に等しいピクチャ番号を有する短期参照ピクチャを指すために使用される番号であり得る。いくつかの例では、RPLMコマンドに関連するピクチャ番号は、RPLMコマンドの「abs_diff_pic_num_minus1」シンタックス要素とピクチャ番号予測値とに少なくとも部分的に基づいて決定され得る。
[0109]アクション262または264において参照ピクチャを参照ピクチャリスト中に挿入した後に、予測処理ユニット152は、現在インデックス値を増加し(increment)、一時的インデックス値を現在インデックス値に設定する(266)。さらに、予測処理ユニット152は、カウンタ値を現在インデックス値に設定する(268)。予測処理ユニット152は、次いで、カウンタ値が、参照ピクチャリスト中の最も高い位置以下かどうかを決定する(270)。カウンタが参照ピクチャリスト中の最も高い位置以下でない場合(270の「NO」)、予測処理ユニット152は動作250を終了する。一方、カウンタが参照ピクチャリスト中の最も高い位置以下であると決定したことに応答して(270の「YES」)、予測処理ユニット152は、参照ピクチャリスト中の現在位置(すなわち、カウンタ値によって示される位置)にある参照ピクチャのピクチャ番号が挿入フレーム番号に等しいかどうかを決定する(272)。参照ピクチャリスト中の現在位置にある参照ピクチャのピクチャ番号が挿入フレーム番号に等しい場合(272の「YES」)、予測処理ユニット152は、カウンタ値によって示される参照ピクチャリスト中の位置における参照ピクチャのビュー識別子が現在ビュー識別子に等しいかどうかを決定する(274)。現在ビュー識別子は、ビデオデコーダ30が現在復号しているピクチャのビュー識別子であり得る。
[0110]参照ピクチャリスト中の現在位置にある参照ピクチャのピクチャ番号が挿入フレーム番号に等しくない場合(272の「NO」)、または参照ピクチャリスト中の現在位置にある参照ピクチャのビュー識別子が現在ビュー識別子に等しくない(274の「NO」)場合、予測処理ユニット152は、一時的インデックス値+1における参照ピクチャを、参照ピクチャリスト中の現在位置(すなわち、カウンタ値によって示される参照ピクチャリスト中の位置)にある参照ピクチャになるように設定する(276)。参照ピクチャリスト中の現在位置にある参照ピクチャのビュー識別子が現在ビュー識別子に等しいと決定したことに応答して(274の「YES」)、またはアクション276を実行した後に、予測処理ユニット152はカウンタ値を増加(increment)する(278)。予測処理ユニット152は、次いで、カウンタ値が、参照ピクチャリスト中の最も高い位置よりも小さいかまたはそれに等しいかどうかを再び決定する(270)。アクション268、270、272、274、276、および278は、参照ピクチャリストから、参照ピクチャリスト中に挿入されている参照ピクチャの重複を除去する役目を担う。
[0111]例示的な動作250は、以下の擬似コードを使用して実装され得る。
Figure 0005876162
[0112]上記の擬似コードにおいて、「cIdx」はカウンタ変数である。「num_ref_idxlX_active_minus1」は、参照ピクチャリストX中のアクティブ参照ピクチャの番号を示し、ただし、Xは0または1に等しい。「refIdxX」は、短期参照ピクチャまたはVSRPが参照ピクチャリストX中に挿入されるべき位置を示す。さらに、「RefPicListX[ ]」は参照ピクチャリストXを示す。「picNumLX」は、参照ピクチャリストX中に挿入されるべき短期参照ピクチャまたはVSRPのフレーム番号を示す。RPLMコマンドは「picNumLX」の値を指定し得る。「PicNumF( )」は、参照ピクチャのフレーム番号を返す関数である。「viewID( )」は、参照ピクチャのビュー識別子を返す関数である。
[0113]1つまたは複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび/またはデータ構造を取り出すために1つまたは複数のコンピュータあるいは1つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
[0114]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびBlu−rayディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
[0115]命令は、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、あるいは他の等価な集積回路またはディスクリート論理回路など、1つまたは複数のプロセッサによって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明した技法の実装に好適な他の構造のいずれかを指すことがある。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用ハードウェアおよび/またはソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素中に十分に実装され得る。
[0116]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明した1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。
[0117]様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1] マルチビュービデオ復号のための方法であって、前記方法は、
ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号することと、
前記1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
参照ピクチャリスト変更(RPLM)コマンドに応答して、前記合成参照ピクチャを1つの参照ピクチャリスト内の特定のロケーションに挿入することと、前記RPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属し、
現在ピクチャのビデオブロックに対してインター予測を実行するために、前記1つの参照ピクチャリスト中の1つまたは複数のピクチャを使用することと、
を備える、方法。
[2] 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、[1]に記載の方法。
[3] 前記合成参照ピクチャを挿入することは、
前記RPLMコマンドに関連するピクチャ番号を決定することと、
前記RPLMコマンドに関連する前記ピクチャ番号に基づいてフレーム番号を決定することと、
前記RPLMコマンドに関連する前記フレーム番号が、前記現在ピクチャに関連するフレーム番号に等しいと決定したことに応答して、前記合成参照ピクチャを前記参照ピクチャリスト中に挿入することと、
を備える、[1]に記載の方法。
[4] 前記RPLMコマンドに関連する前記ピクチャ番号を決定することは、ピクチャ番号予測値に、前記RPLMコマンドによって指定された値+1を加算または減算することによって前記ピクチャ番号を決定することを備える、[3]に記載の方法。
[5] 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、[1]に記載の方法。
[6] 前記1つの参照ピクチャリストは、前記特定の位置の後に1つまたは複数のピクチャを含み、
前記合成参照ピクチャを前記1つの参照ピクチャリスト中に前記特定の位置において挿入することは、前記ピクチャの前記1つの参照ピクチャリスト中の位置を前記位置の後にシフトすることを備える、
[1]に記載の方法。
[7] 前記RPLMコマンドは第1のRPLMコマンドであり、前記方法は、第2のRPLMコマンドに応答して、テクスチャビューコンポーネントを前記1つの参照ピクチャリスト中に挿入すること、をさらに備え、前記第2のRPLMコマンドは、短期参照ピクチャを前記参照ピクチャリスト中に挿入するためのRPLMコマンドの前記タイプに属する、[1]に記載の方法。
[8] ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号することと、
前記1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
参照ピクチャリスト変更(RPLM)コマンドに応答して、前記合成参照ピクチャを1つの参照ピクチャリスト内の特定のロケーションに挿入することと、前記RPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属し、
現在ピクチャのビデオブロックに対してインター予測を実行するために、前記1つの参照ピクチャリスト中の1つまたは複数のピクチャを使用することと、
を行うように構成された1つまたは複数のプロセッサを備えるビデオ復号デバイス。
[9] 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、[8]に記載のビデオ復号デバイス。
[10] 前記1つまたは複数のプロセッサは、
前記RPLMコマンドに関連するピクチャ番号を決定することと、
前記RPLMコマンドに関連する前記ピクチャ番号に基づいてフレーム番号を決定することと、
前記RPLMコマンドに関連する前記フレーム番号が、前記現在ピクチャに関連するフレーム番号に等しいと決定したことに応答して、前記合成参照ピクチャを前記1つの参照ピクチャリスト中に挿入することと、
を行うように構成された、[8]に記載のビデオ復号デバイス。
[11] 前記1つまたは複数のプロセッサは、ピクチャ番号予測値に、前記RPLMコマンドによって指定された値+1を加算または減算することによって前記ピクチャ番号を決定するように構成された、[10]に記載のビデオ復号デバイス。
[12] 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、[8]に記載のビデオ復号デバイス。
[13] 前記1つの参照ピクチャリストは、前記特定の位置の後に1つまたは複数のピクチャを含み、
前記1つまたは複数のプロセッサは、前記ピクチャの前記1つの参照ピクチャリスト中の位置を前記特定の位置の後にシフトするように構成された、
[8]に記載のビデオ復号デバイス。
[14] 前記RPLMコマンドは第1のRPLMコマンドであり、前記前記1つまたは複数のプロセッサは、第2のRPLMコマンドに応答して、テクスチャビューコンポーネントを前記1つの参照ピクチャリスト中に挿入すること、を行うようにさらに構成され、前記第2のRPLMコマンドは、短期参照ピクチャを前記参照ピクチャリスト中に挿入するためのRPLMコマンドの前記タイプに属する、[8]に記載のビデオ復号デバイス。
[15] ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号する手段と、
前記1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成する手段と、
参照ピクチャリスト変更(RPLM)コマンドに応答して、前記合成参照ピクチャを1つの参照ピクチャリスト内の特定のロケーションに挿入する手段と、前記RPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属し、
現在ピクチャのビデオブロックに対してインター予測を実行するために、前記1つの参照ピクチャリスト中の1つまたは複数のピクチャを使用する手段と、
を備えるビデオ復号デバイス。
[16] 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、[15]に記載のビデオ復号デバイス。
[17] 前記RPLMコマンドに関連するピクチャ番号を決定する手段と、
前記RPLMコマンドに関連する前記ピクチャ番号に基づいてフレーム番号を決定する手段と、
前記RPLMコマンドに関連する前記フレーム番号が、前記現在ピクチャに関連するフレーム番号に等しいと決定したことに応答して、前記合成参照ピクチャを前記1つの参照ピクチャリスト中に挿入する手段と、
を備える、[15]に記載のビデオ復号デバイス。
[18] 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、[15]に記載のビデオ復号デバイス。
[19] ビデオ復号デバイスの1つまたは複数のプロセッサによって実行されたとき、
ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号することと、
前記1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
参照ピクチャリスト変更(RPLM)コマンドに応答して、前記合成参照ピクチャを1つの参照ピクチャリスト内の特定のロケーションに挿入することと、前記RPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属し、
現在ピクチャのビデオブロックに対してインター予測を実行するために、前記1つの参照ピクチャリスト中の1つまたは複数のピクチャを使用することと、
を行うように前記ビデオ復号デバイスを構成する命令を記憶したコンピュータ可読記憶媒体。
[20] 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、[19]に記載のコンピュータ可読記憶媒体。
[21] 前記命令は、
前記RPLMコマンドに関連するピクチャ番号を決定することと、
前記RPLMコマンドに関連する前記ピクチャ番号に基づいてフレーム番号を決定することと、
前記RPLMコマンドに関連する前記フレーム番号が、前記現在ピクチャに関連するフレーム番号に等しいと決定したことに応答して、前記合成参照ピクチャを前記1つの参照ピクチャリスト中に挿入することと、
を行うように前記ビデオ復号デバイスを構成する、[19]に記載のコンピュータ可読記憶媒体。
[22] 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、[19]に記載のコンピュータ可読記憶媒体。
[23] マルチビュービデオ符号化のための方法であって、前記方法は、
1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
現在ピクチャの1つまたは複数のビデオブロックを符号化するために前記合成参照ピクチャを参照ピクチャとして使用することと、
短期参照ピクチャを参照ピクチャリスト中に挿入するための参照ピクチャリスト変更(RPLM)コマンドのタイプに属するRPLMコマンドを含むビットストリームを生成することと、前記RPLMコマンドは、前記合成参照ピクチャを1つの参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令する、
を備える、方法。
[24] 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、[23]に記載の方法。
[25] 前記RPLMコマンドは前記現在ピクチャのフレーム番号に関連する、[23]に記載の方法。
[26] 前記RPLMコマンドは、値を有するシンタックス要素を備え、前記RPLMコマンドに関連するピクチャ番号は、ピクチャ番号予測値+または−前記値、+1に等しく、前記RPLMコマンドに関連する前記フレーム番号は前記現在ピクチャの前記ピクチャ番号に基づいて決定可能である、[25]に記載の方法。
[27] 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、[23]に記載の方法。
[28] 1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
現在ピクチャの1つまたは複数のビデオブロックを符号化するために前記合成参照ピクチャを参照ピクチャとして使用することと、
短期参照ピクチャを参照ピクチャリスト中に挿入するための参照ピクチャリスト変更(RPLM)コマンドのタイプに属するRPLMコマンドを含むビットストリームを生成することと、前記RPLMコマンドは、前記合成参照ピクチャを1つの参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令する、
を行うように構成された1つまたは複数のプロセッサを備えるビデオ符号化デバイス。
[29] 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、[28]に記載のビデオ符号化デバイス。
[30] 前記RPLMコマンドは前記現在ピクチャのフレーム番号に関連する、[28]に記載のビデオ符号化デバイス。
[31] 前記RPLMコマンドは、値を有するシンタックス要素を備え、前記RPLMコマンドに関連するピクチャ番号は、ピクチャ番号予測値+または−前記値、+1に等しく、前記RPLMコマンドに関連する前記フレーム番号は前記現在ピクチャの前記ピクチャ番号に基づいて決定可能である、[29]に記載のビデオ符号化デバイス。
[32] 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、[27]に記載のビデオ符号化デバイス。
[33] 1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成する手段と、
現在ピクチャの1つまたは複数のビデオブロックを符号化するために前記合成参照ピクチャを参照ピクチャとして使用する手段と、
短期参照ピクチャを参照ピクチャリスト中に挿入するための参照ピクチャリスト変更(RPLM)コマンドのタイプに属するRPLMコマンドを含むビットストリームを生成する手段と、前記RPLMコマンドは、前記合成参照ピクチャを1つの参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令する、
を備えるビデオ符号化デバイス。
[34] 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、[33]に記載のビデオ符号化デバイス。
[35] 前記RPLMコマンドは前記現在ピクチャのフレーム番号に関連する、[33]に記載のビデオ符号化デバイス。
[36] 前記RPLMコマンドは、値を有するシンタックス要素を備え、前記RPLMコマンドに関連するピクチャ番号は、ピクチャ番号予測値+または−前記値、+1に等しく、前記RPLMコマンドに関連する前記フレーム番号は前記現在ピクチャの前記ピクチャ番号に基づいて決定可能である、[35]に記載のビデオ符号化デバイス。
[37] 前記RPLMコマンドは、前記合成参照ピクチャを前記1つの参照ピクチャリスト中に前記1つの参照ピクチャリスト中の特定の位置において挿入するように前記ビデオデコーダに命令する、[33]に記載のビデオ符号化デバイス。
[38] ビデオ符号化デバイスの1つまたは複数のプロセッサによって実行されたとき、
1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
現在ピクチャの1つまたは複数のビデオブロックを符号化するために前記合成参照ピクチャを参照ピクチャとして使用することと、
短期参照ピクチャを参照ピクチャリスト中に挿入するための参照ピクチャリスト変更(RPLM)コマンドのタイプに属するRPLMコマンドを含むビットストリームを生成することと、前記RPLMコマンドは、前記合成参照ピクチャを1つの参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令する、
を行うように前記ビデオ符号化デバイスを構成する命令を記憶したコンピュータ可読記憶媒体。
[39] 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、[38]に記載のコンピュータ可読記憶媒体。
[40] 前記RPLMコマンドは、値を有するシンタックス要素を備え、前記RPLMコマンドに関連するピクチャ番号は、ピクチャ番号予測値+または−前記値、+1に等しく、前記RPLMコマンドに関連する前記フレーム番号は前記現在ピクチャの前記ピクチャ番号に基づいて決定可能である、[38]に記載のコンピュータ可読記憶媒体。
[41] 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、[38]に記載のコンピュータ可読記憶媒体。
[42] 前記RPLMコマンドは、前記合成参照ピクチャを前記1つの参照ピクチャリスト中に前記1つの参照ピクチャリスト中の特定の位置に配置するように前記ビデオデコーダに命令する、[38]に記載のコンピュータ可読記憶媒体。

Claims (40)

  1. マルチビュービデオ復号のための方法であって、前記方法は、プロセッサが実行し、
    ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号することと、
    前記1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
    参照ピクチャリスト変更(RPLM)コマンドに関連するフレーム番号が、現在ピクチャに関連するフレーム番号に等しく、前記RPLMコマンドが、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するとき、前記合成参照ピクチャを1つの参照ピクチャリスト内の特定のロケーションに挿入することと、
    前記現在ピクチャのビデオブロックに対してインター予測を実行するために、前記1つの参照ピクチャリスト中の1つまたは複数のピクチャを使用することと、
    を備える、方法。
  2. 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、請求項1に記載の方法。
  3. 前記合成参照ピクチャを挿入することは、
    前記RPLMコマンドに関連するピクチャ番号を決定することと、
    前記RPLMコマンドに関連する前記ピクチャ番号に基づいて、前記RPLMコマンドに関連する前記フレーム番号を決定することと、
    を備える、請求項1に記載の方法。
  4. 前記RPLMコマンドに関連する前記ピクチャ番号を決定することは、ピクチャ番号予測値に、前記RPLMコマンドによって指定された値+1を加算または減算することによって前記RPLMコマンドに関連する前記ピクチャ番号を決定することを備える、請求項3に記載の方法。
  5. 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、請求項1に記載の方法。
  6. 前記1つの参照ピクチャリストは、前記特定のロケーションの後に1つまたは複数のピクチャを含み、
    前記合成参照ピクチャを前記1つの参照ピクチャリスト内の前記特定のロケーションに挿入することは、前記ピクチャの前記1つの参照ピクチャリスト中のロケーションを前記特定のロケーションの後にシフトすることを備える、
    請求項1に記載の方法。
  7. 前記RPLMコマンドは第1のRPLMコマンドであり、前記方法は、第2のRPLMコマンドに応答して、テクスチャビューコンポーネントを前記1つの参照ピクチャリスト中に挿入すること、をさらに備え、前記第2のRPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドの前記タイプに属する、請求項1に記載の方法。
  8. ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号することと、
    前記1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
    参照ピクチャリスト変更(RPLM)コマンドに関連するフレーム番号が、現在ピクチャに関連するフレーム番号に等しく、前記RPLMコマンドが、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するとき、前記合成参照ピクチャを1つの参照ピクチャリスト内の特定のロケーションに挿入することと、
    前記現在ピクチャのビデオブロックに対してインター予測を実行するために、前記1つの参照ピクチャリスト中の1つまたは複数のピクチャを使用することと、
    を行うように構成された1つまたは複数のプロセッサを備えるビデオ復号デバイス。
  9. 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、請求項8に記載のビデオ復号デバイス。
  10. 前記1つまたは複数のプロセッサは、
    前記RPLMコマンドに関連するピクチャ番号を決定することと、
    前記RPLMコマンドに関連する前記ピクチャ番号に基づいて、前記RPLMコマンドに関連する前記フレーム番号を決定することと、
    を行うように構成された、請求項8に記載のビデオ復号デバイス。
  11. 前記1つまたは複数のプロセッサは、ピクチャ番号予測値に、前記RPLMコマンドによって指定された値+1を加算または減算することによって前記RPLMコマンドに関連する前記ピクチャ番号を決定するように構成された、請求項10に記載のビデオ復号デバイス。
  12. 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、請求項8に記載のビデオ復号デバイス。
  13. 前記1つの参照ピクチャリストは、前記特定のロケーションの後に1つまたは複数のピクチャを含み、
    前記1つまたは複数のプロセッサは、前記ピクチャの前記1つの参照ピクチャリスト中のロケーションを前記特定のロケーションの後にシフトするように構成された、
    請求項8に記載のビデオ復号デバイス。
  14. 前記RPLMコマンドは第1のRPLMコマンドであり、前記前記1つまたは複数のプロセッサは、第2のRPLMコマンドに応答して、テクスチャビューコンポーネントを前記1つの参照ピクチャリスト中に挿入すること、を行うようにさらに構成され、前記第2のRPLMコマンドは、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドの前記タイプに属する、請求項8に記載のビデオ復号デバイス。
  15. ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号する手段と、
    前記1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成する手段と、
    参照ピクチャリスト変更(RPLM)コマンドに関連するフレーム番号が、現在ピクチャに関連するフレーム番号に等しく、前記RPLMコマンドが、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するとき、前記合成参照ピクチャを1つの参照ピクチャリスト内の特定のロケーションに挿入する手段と、
    前記現在ピクチャのビデオブロックに対してインター予測を実行するために、前記1つの参照ピクチャリスト中の1つまたは複数のピクチャを使用する手段と、
    を備えるビデオ復号デバイス。
  16. 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、請求項15に記載のビデオ復号デバイス。
  17. 前記RPLMコマンドに関連するピクチャ番号を決定する手段と、
    前記RPLMコマンドに関連する前記ピクチャ番号に基づいて、前記RPLMコマンドに関連する前記フレーム番号を決定する手段と、
    を備える、請求項15に記載のビデオ復号デバイス。
  18. 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、請求項15に記載のビデオ復号デバイス。
  19. ビデオ復号デバイスの1つまたは複数のプロセッサによって実行されたとき、
    ビットストリームからパースされるシンタックス要素に少なくとも部分的に基づいて、1つまたは複数のビューコンポーネントを復号することと、
    前記1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
    参照ピクチャリスト変更(RPLM)コマンドに関連するフレーム番号が、現在ピクチャに関連するフレーム番号に等しく、前記RPLMコマンドが、短期参照ピクチャを参照ピクチャリスト中に挿入するためのRPLMコマンドのタイプに属するとき、前記合成参照ピクチャを1つの参照ピクチャリスト内の特定のロケーションに挿入することと、
    前記現在ピクチャのビデオブロックに対してインター予測を実行するために、前記1つの参照ピクチャリスト中の1つまたは複数のピクチャを使用することと、
    を行うように前記ビデオ復号デバイスを構成する命令を記憶したコンピュータ可読記憶媒体。
  20. 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、請求項19に記載のコンピュータ可読記憶媒体。
  21. 前記命令は、
    前記RPLMコマンドに関連するピクチャ番号を決定することと、
    前記RPLMコマンドに関連する前記ピクチャ番号に基づいて、前記RPLMコマンドに関連する前記フレーム番号を決定することと、
    を行うように前記ビデオ復号デバイスを構成する、請求項19に記載のコンピュータ可読記憶媒体。
  22. 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、請求項19に記載のコンピュータ可読記憶媒体。
  23. マルチビュービデオ符号化のための方法であって、前記方法は、プロセッサが実行し、
    1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
    現在ピクチャの1つまたは複数のビデオブロックを符号化するために前記合成参照ピクチャを参照ピクチャとして使用することと、
    短期参照ピクチャを参照ピクチャリスト中に挿入するための参照ピクチャリスト変更(RPLM)コマンドのタイプに属するRPLMコマンドを含むビットストリームを生成することと、前記RPLMコマンドは、前記合成参照ピクチャを1つの参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令し、前記RPLMコマンドに関連するフレーム番号は、前記現在ピクチャに関連するフレーム番号に等しい、
    を備える、方法。
  24. 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、請求項23に記載の方法。
  25. 前記RPLMコマンドは前記現在ピクチャの前記フレーム番号に関連する、請求項23に記載の方法。
  26. 前記RPLMコマンドは、値を有するシンタックス要素を備え、前記RPLMコマンドに関連するピクチャ番号は、ピクチャ番号予測値+前記値+1、またはピクチャ番号予測値−前記値+1に等しく、前記RPLMコマンドに関連する前記フレーム番号は前記現在ピクチャの前記ピクチャ番号に基づいて決定可能である、請求項25に記載の方法。
  27. 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、請求項23に記載の方法。
  28. 1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
    現在ピクチャの1つまたは複数のビデオブロックを符号化するために前記合成参照ピクチャを参照ピクチャとして使用することと、
    短期参照ピクチャを参照ピクチャリスト中に挿入するための参照ピクチャリスト変更(RPLM)コマンドのタイプに属するRPLMコマンドを含むビットストリームを生成することと、前記RPLMコマンドは、前記合成参照ピクチャを1つの参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令し、前記RPLMコマンドに関連するフレーム番号は、前記現在ピクチャに関連するフレーム番号に等しい、
    を行うように構成された1つまたは複数のプロセッサを備えるビデオ符号化デバイス。
  29. 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、請求項28に記載のビデオ符号化デバイス。
  30. 前記RPLMコマンドは前記現在ピクチャの前記フレーム番号に関連する、請求項28に記載のビデオ符号化デバイス。
  31. 前記RPLMコマンドは、値を有するシンタックス要素を備え、前記RPLMコマンドに関連するピクチャ番号は、ピクチャ番号予測値+前記値+1、またはピクチャ番号予測値−前記値+1に等しく、前記RPLMコマンドに関連する前記フレーム番号は前記現在ピクチャの前記ピクチャ番号に基づいて決定可能である、請求項30に記載のビデオ符号化デバイス。
  32. 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、請求項28に記載のビデオ符号化デバイス。
  33. 1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成する手段と、
    現在ピクチャの1つまたは複数のビデオブロックを符号化するために前記合成参照ピクチャを参照ピクチャとして使用する手段と、
    短期参照ピクチャを参照ピクチャリスト中に挿入するための参照ピクチャリスト変更(RPLM)コマンドのタイプに属するRPLMコマンドを含むビットストリームを生成する手段と、前記RPLMコマンドは、前記合成参照ピクチャを1つの参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令し、前記RPLMコマンドに関連するフレーム番号は、前記現在ピクチャに関連するフレーム番号に等しい、
    を備えるビデオ符号化デバイス。
  34. 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、請求項33に記載のビデオ符号化デバイス。
  35. 前記RPLMコマンドは前記現在ピクチャの前記フレーム番号に関連する、請求項33に記載のビデオ符号化デバイス。
  36. 前記RPLMコマンドは、値を有するシンタックス要素を備え、前記RPLMコマンドに関連するピクチャ番号は、ピクチャ番号予測値+前記値+1、またはピクチャ番号予測値−前記値+1に等しく、前記RPLMコマンドに関連する前記フレーム番号は前記現在ピクチャの前記ピクチャ番号に基づいて決定可能である、請求項35に記載のビデオ符号化デバイス。
  37. ビデオ符号化デバイスの1つまたは複数のプロセッサによって実行されたとき、
    1つまたは複数のビューコンポーネントに少なくとも部分的に基づいて、合成参照ピクチャを生成することと、
    現在ピクチャの1つまたは複数のビデオブロックを符号化するために前記合成参照ピクチャを参照ピクチャとして使用することと、
    短期参照ピクチャを参照ピクチャリスト中に挿入するための参照ピクチャリスト変更(RPLM)コマンドのタイプに属するRPLMコマンドを含むビットストリームを生成することと、前記RPLMコマンドは、前記合成参照ピクチャを1つの参照ピクチャリスト中の特定のロケーションに挿入するようにビデオデコーダに命令し、前記RPLMコマンドに関連するフレーム番号は、前記現在ピクチャに関連するフレーム番号に等しい、
    を行うように前記ビデオ符号化デバイスを構成する命令を記憶したコンピュータ可読記憶媒体。
  38. 前記合成参照ピクチャはビュー合成参照ピクチャ(VSRP)である、請求項37に記載のコンピュータ可読記憶媒体。
  39. 前記RPLMコマンドは、値を有するシンタックス要素を備え、前記RPLMコマンドに関連するピクチャ番号は、ピクチャ番号予測値+前記値+1、またはピクチャ番号予測値−前記値+1に等しく、前記RPLMコマンドに関連する前記フレーム番号は前記現在ピクチャの前記ピクチャ番号に基づいて決定可能である、請求項37に記載のコンピュータ可読記憶媒体。
  40. 前記RPLMコマンドは、0または1に等しいRPLMタイプ識別子を含む、請求項37に記載のコンピュータ可読記憶媒体。
JP2014546072A 2011-12-09 2012-12-06 ビュー合成参照ピクチャのための参照ピクチャリスト変更 Expired - Fee Related JP5876162B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161569137P 2011-12-09 2011-12-09
US61/569,137 2011-12-09
US13/705,853 2012-12-05
US13/705,853 US9131217B2 (en) 2011-12-09 2012-12-05 Reference picture list modification for view synthesis reference pictures
PCT/US2012/068230 WO2013086180A1 (en) 2011-12-09 2012-12-06 Reference picture list modification for view synthesis reference pictures

Publications (2)

Publication Number Publication Date
JP2015505191A JP2015505191A (ja) 2015-02-16
JP5876162B2 true JP5876162B2 (ja) 2016-03-02

Family

ID=48571961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014546072A Expired - Fee Related JP5876162B2 (ja) 2011-12-09 2012-12-06 ビュー合成参照ピクチャのための参照ピクチャリスト変更

Country Status (7)

Country Link
US (1) US9131217B2 (ja)
EP (1) EP2789163A1 (ja)
JP (1) JP5876162B2 (ja)
KR (1) KR101626695B1 (ja)
CN (1) CN103975598A (ja)
IN (1) IN2014MN00928A (ja)
WO (1) WO2013086180A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2991347B1 (en) * 2010-07-15 2019-10-23 GE Video Compression, LLC Hybrid video coding supporting intermediate view synthesis
JP2012023651A (ja) * 2010-07-16 2012-02-02 Sony Corp 画像処理装置と画像処理方法
US9973749B2 (en) * 2012-01-20 2018-05-15 Nokia Technologies Oy Method for video coding and an apparatus, a computer-program product, a system, and a module for the same
CA2870308A1 (en) * 2012-04-19 2013-10-24 Telefonaktiebolaget L M Ericsson (Publ) View synthesis using low resolution depth maps
WO2016195460A1 (ko) * 2015-06-05 2016-12-08 한양대학교 산학협력단 화면 내 예측에 대한 부호화/복호화 방법 및 장치
EP3422722A1 (en) 2017-06-30 2019-01-02 Thomson Licensing Method for encoding a matrix of image views obtained from data acquired by a plenoptic camera
CN113287311B (zh) 2018-12-22 2024-03-12 北京字节跳动网络技术有限公司 两步交叉分量预测模式的指示
CN111526370B (zh) * 2020-04-17 2023-06-02 Oppo广东移动通信有限公司 视频编码、解码方法及装置和电子设备
CN111770332B (zh) * 2020-06-04 2022-08-09 Oppo广东移动通信有限公司 插帧处理方法、插帧处理装置、存储介质与电子设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100679740B1 (ko) * 2004-06-25 2007-02-07 학교법인연세대학교 시점 선택이 가능한 다시점 동영상 부호화/복호화 방법
US8854486B2 (en) 2004-12-17 2014-10-07 Mitsubishi Electric Research Laboratories, Inc. Method and system for processing multiview videos for view synthesis using skip and direct modes
KR100732961B1 (ko) * 2005-04-01 2007-06-27 경희대학교 산학협력단 다시점 영상의 스케일러블 부호화, 복호화 방법 및 장치
CN101449585A (zh) * 2006-03-30 2009-06-03 Lg电子株式会社 用于解码/编码视频信号的方法和装置
BRPI0710048A2 (pt) * 2006-03-30 2011-08-02 Lg Electronics Inc método e aparelho para decodificar / codificar um sinal de vìdeo
US20100091845A1 (en) * 2006-03-30 2010-04-15 Byeong Moon Jeon Method and apparatus for decoding/encoding a video signal
CN101491099B (zh) 2006-07-11 2011-09-21 汤姆森特许公司 使用虚拟参考画面的方法及装置
WO2009130561A1 (en) 2008-04-21 2009-10-29 Nokia Corporation Method and device for video coding and decoding
WO2010086500A1 (en) 2009-01-28 2010-08-05 Nokia Corporation Method and apparatus for video coding and decoding
WO2010120033A1 (ko) 2009-04-17 2010-10-21 엘지전자 주식회사 다시점 비디오 신호의 처리 방법 및 장치
JP5524594B2 (ja) * 2009-12-14 2014-06-18 パナソニック株式会社 画像復号装置及び画像復号方法

Also Published As

Publication number Publication date
IN2014MN00928A (ja) 2015-04-17
JP2015505191A (ja) 2015-02-16
WO2013086180A1 (en) 2013-06-13
CN103975598A (zh) 2014-08-06
US9131217B2 (en) 2015-09-08
US20130148722A1 (en) 2013-06-13
KR20140102282A (ko) 2014-08-21
KR101626695B1 (ko) 2016-06-01
EP2789163A1 (en) 2014-10-15

Similar Documents

Publication Publication Date Title
US10477240B2 (en) Linear model prediction mode with sample accessing for video coding
US9344737B2 (en) Reference picture list construction for multi-view and three-dimensional video coding
CN107409209B (zh) 用于线性模型预测模式的降取样处理
US9167248B2 (en) Reference picture list modification for video coding
US9521393B2 (en) Non-nested SEI messages in video coding
US9319703B2 (en) Hypothetical reference decoder parameter syntax structure
JP5876162B2 (ja) ビュー合成参照ピクチャのための参照ピクチャリスト変更
US20140348240A1 (en) Video coding using sample prediction among color components
US9369710B2 (en) Reference picture list modification for video coding
US9936196B2 (en) Target output layers in video coding
US20150016503A1 (en) Tiles and wavefront processing in multi-layer context
JP2015516763A (ja) 3次元ビデオコーディングのためのビュー合成モード
JP6199320B2 (ja) 3次元ビデオコーディングのためのネットワーク抽象化レイヤ(nal)ユニットヘッダ設計

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160120

R150 Certificate of patent or registration of utility model

Ref document number: 5876162

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees