JP2015533462A

JP2015533462A - ビデオコーディングのための参照ピクチャステータス

Info

Publication number: JP2015533462A
Application number: JP2015539594A
Authority: JP
Inventors: チェン、イン; ワン、イェ−クイ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2012-10-25
Filing date: 2013-09-05
Publication date: 2015-11-24
Also published as: WO2014065947A1; CN104756499B; CN104756499A; KR20150076235A; US9854234B2; EP2912847A1; US20140119447A1

Abstract

本開示の技法は、一般に、ピクチャの参照ステータスに関連し得る。技法は、ピクチャがコーディングされているインスタンスにおいてピクチャの参照ピクチャの参照ステータス情報を記憶し得る。次に、技法は、後続のピクチャのビデオブロックをインター予測するために、ピクチャがコーディングされたインスタンスにおける、ピクチャの参照ピクチャの参照ステータス情報を利用し得る。

Description

[0001]本出願は、その内容全体が参照により本明細書に組み込まれる、２０１２年１０月２５日に出願された米国仮出願第６１／７１８，６２９号の利益を主張する。

[0002]本開示は、ビデオコーディングに関し、より詳細には、ビデオコーディングのための参照ピクチャステータスに関連する技法に関する。

[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ：Advanced Video Coding）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格によって定義された規格、およびそのような規格の拡張に記載されているビデオ圧縮技法など、ビデオ圧縮技法を実装する。ビデオデバイスは、そのようなビデオ圧縮技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0004]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために、空間的（イントラピクチャ）予測および／または時間的（インターピクチャ）予測を実行する。ブロックベースのビデオコーディングでは、ビデオスライス（すなわち、ビデオフレームまたはビデオフレームの一部）はビデオブロックに区分され得、これらのビデオブロックは、ツリーブロック、コーディングユニット（ＣＵ：coding unit）および／またはコーディングノードと呼ばれることがある。ピクチャのイントラコード化（Ｉ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック内の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0005]空間的予測または時間的予測は、コード化されるべきブロックの予測ブロックを生じる。残差データは、コード化されるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコード化ブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、次いで量子化され得る。量子化変換係数は、最初に２次元アレイで構成され、変換係数の１次元ベクトルを生成するために走査することができ、なお一層の圧縮を達成するためにエントロピーコーディングを適用することができる。

[0006]本開示で説明する技法は、一般に、ビデオコーディングプロセスと、参照ピクチャのうちの１つまたは複数を使用するピクチャがコーディングされるインスタンスにおいて参照ピクチャの参照ステータス情報を記憶することとに関連する。このようにして、参照ピクチャの参照ステータスが後で変わる場合でも、ビデオコーダは、ピクチャがコーディングされたインスタンスにおける参照ピクチャの参照ステータスを判断することができる。

[0007]一例では、本開示は、ビデオデータをコーディングするための方法を説明する。方法は、第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶することと、参照ステータス情報は第１のピクチャがコーディングされるインスタンスにおける１つまたは複数の参照ピクチャの参照ステータス情報を示す；第１のピクチャの１つまたは複数の参照ピクチャの、第１のピクチャがコーディングされたインスタンスにおける記憶された参照ステータス情報に基づいて第２の異なるピクチャ内のビデオブロックをコーディングすることとを含む。

[0008]一例では、本開示は、ビデオデータをコーディングするための装置について説明する。装置は、第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶することと、参照ステータス情報は第１のピクチャがコーディングされるインスタンスにおける１つまたは複数の参照ピクチャの参照ステータス情報を示す；第１のピクチャの１つまたは複数の参照ピクチャの、第１のピクチャがコーディングされたインスタンスにおける記憶された参照ステータス情報に基づいて第２の異なるピクチャ内のビデオブロックをコーディングすることとを行うように構成されたビデオコーダを含む。

[0009]一例では、本開示は、ビデオデータをコーディングするための装置について説明する。装置は、第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶するための手段と、参照ステータス情報は第１のピクチャがコーディングされるインスタンスにおける１つまたは複数の参照ピクチャの参照ステータス情報を示す；第１のピクチャの１つまたは複数の参照ピクチャの、第１のピクチャがコーディングされたインスタンスにおける記憶された参照ステータス情報に基づいて第２の異なるピクチャ内のビデオブロックをコーディングするための手段とを含む。

[0010]一例では、本開示は、命令を記憶したコンピュータ可読記憶媒体について説明し、命令は、実行されると１つまたは複数のプロセッサに、第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶することと、参照ステータス情報は第１のピクチャがコーディングされるインスタンスにおける１つまたは複数の参照ピクチャの参照ステータス情報を示す；第１のピクチャの１つまたは複数の参照ピクチャの、第１のピクチャがコーディングされたインスタンスにおける記憶された参照ステータス情報に基づいて第２の異なるピクチャ内のビデオブロックをコーディングすることとを実行させる。

[0011]１つまたは複数の例の詳細は、添付の図面および以下の説明に記載されている。他の特徴、目的、および利点は、その説明および図面、ならびに特許請求の範囲から明らかになろう。

[0012]本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0013]本開示で説明する技法を実装し得る例示的なビデオエンコーダを示すブロック図。 [0014]本開示で説明する技法を実装し得る例示的なビデオデコーダを示すブロック図。 [0015]本開示で説明する１つまたは複数の例示的な技法による例示的な動作を示すフローチャート。

[0016]本開示で説明する技法は、一般に、ビデオコーディングプロセス内でピクチャの参照ステータスを検査することに関連する。ビデオコーダは、参照ステータスの例として、「長期参照に使用される」、「短期参照に使用される」、または「参照に使用されない」としてピクチャを指定する（たとえば、標識する）ことができる。たとえば、ピクチャ内のビデオブロックをインター予測するために、ビデオコーダは、１つまたは２つの参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０および／またはＲｅｆＰｉｃＬｉｓｔ１）を構築し得る。参照ピクチャリストは、ピクチャ内のビデオブロックをインター予測するために使用され得る参照ピクチャを識別する。本開示で説明する技法では、ビデオコーダは、ピクチャがコーディングされるインスタンスにおける、ＲｅｆＰｉｃＬｉｓｔ０および／またはＲｅｆＰｉｃＬｉｓｔ１内で識別された参照ピクチャに対する参照ステータス情報を記憶する。

[0017]いくつかの場合には、ビデオコーダは、後続のピクチャのビデオブロックをコーディングするときにピクチャの参照ピクチャに対する参照ステータス情報を判断することを必要とすることがある。しかしながら、ピクチャの参照ピクチャの参照ステータスは、ビデオコーダがピクチャをコーディングしたときからビデオコーダが後続のピクチャをコーディングすべきときまでに変わっていることがある。ピクチャがコーディングされるインスタンスにおいてピクチャの参照ピクチャに対する参照ステータス情報を記憶することによって、本開示で説明する技法は、後続のピクチャをコーディングするときのピクチャの参照ピクチャの参照ステータスをビデオコーダが判断することを可能にし得る。

[0018]たとえば、ビデオコーダは、ビデオブロックをコーディングするためのマージ／スキップモードまたは拡張型動きベクトル予測（ＡＭＶＰ）モードを実施するために、参照ステータスが変更された時間より前に参照ピクチャの参照ステータスを取得することを必要とすることがある。単に例示のために、技法が、マージ／スキップモードまたはＡＭＶＰモードに関して説明される。しかしながら、本開示で説明する技法は、マージ／スキップモードまたはＡＭＶＰモードに限定されると見なされるべきではない。

[0019]より詳細に説明するように、マージ／スキップモードまたはＡＭＶＰモードにおいて、ビデオコーダは、インター予測されるべきブロックに対する動きベクトルを判断するために、動きベクトル予測子を利用する。動きベクトル予測子の一例は、時間的動きベクトル予測子（ＴＭＶＰ）である。

[0020]ＴＭＶＰは、時間的隣接ブロックの動きベクトルを指す。時間的隣接ブロックは、インター予測されたブロックを含むピクチャ以外のピクチャ内に存在する。時間的隣接ブロックは、コーディングされたビデオブロックに関連するピクチャと異なるピクチャのコロケートされたブロックであり得るが、他のコロケートされないブロックも同様に使用され得る。説明しやすいように、インター予測されたブロックは、現在ピクチャ内の現在ブロックと呼ばれる。時間的隣接ブロックは、時間的ピクチャ内に存在し、ここで時間的ピクチャは、現在ピクチャ以外のピクチャである。

[0021]ＴＭＶＰは、時間的ピクチャの参照ピクチャであるピクチャを指す。たとえば、ビデオコーダは、時間的ピクチャのために２つの参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１）を構築し得る。時間的隣接ブロックに対する動きベクトルであるＴＭＶＰは、時間的ピクチャのためのＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１のうちの一方の中の参照ピクチャを指す。時間的隣接ブロックが２つの動きベクトルを用いてインター予測される（すなわち、双予測される）例では、一方の動きベクトルはＲｅｆＰｉｃＬｉｓｔ０内の参照ピクチャを指し、他方の動きベクトルはＲｅｆＰｉｃＬｉｓｔ１内のピクチャを指す。これらの例では、２つのＴＭＶＰが存在し得る。

[0022]いくつかの例では、現在ブロックに対する１つまたは複数の動きベクトル予測子として（すなわち、現在ブロックに対する１つまたは複数のＴＭＶＰとして）動きベクトルまたは時間的隣接ブロックのベクトルを利用するために、ビデオコーダは、時間的隣接ブロックの１つまたは複数の動きベクトルが参照した参照ピクチャの参照ステータスを判断することを必要とすることがある。言い換えれば、ビデオコーダは、ビデオコーダが時間的ピクチャをコーディングしたインスタンスにおける、時間的ピクチャに対するＲｅｆＰｉｃＬｉｓｔ０および／またはＲｅｆＰｉｃＬｉｓｔ１内で識別される参照ピクチャの参照ステータスを判断することを必要とすることがある。

[0023]一般に、ビデオコーダは、ピクチャに対する参照ステータス情報を記憶するようにすでに構成されていることがある。しかしながら、ピクチャに対する参照ステータス情報は変わることがある。したがって、時間的ピクチャがコーディングされたインスタンスにおける、時間的ピクチャに対するＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１内で識別されるピクチャの参照ステータスは、後で現在ピクチャをコーディングするときには失われていることがある。

[0024]たとえば、時間的ピクチャに対する参照ピクチャの参照ステータスが、時間的ピクチャがコーディングされたインスタンスにおける「長期参照ピクチャに使用される」であると仮定する。次に、参照ピクチャの参照ステータスが、現在ピクチャのコーディングの前に、「長期参照ピクチャに使用される」から「短期参照ピクチャに使用される」に変わったと仮定する。この例では、ビデオコーダが時間的ピクチャをコーディングしたインスタンスにおける「長期参照ピクチャを使用される」である、参照ピクチャの参照ステータスは、ビデオコーダが現在ピクチャをコーディングするときには失われていることがある。

[0025]本開示で説明する技法では、ビデオコーダは、第１のピクチャがコーディングされるインスタンスにおいて第１のピクチャ（たとえば、時間的ピクチャ）の参照ピクチャに対する参照ステータス情報を記憶する。その結果、第１のピクチャがコーディングされたインスタンスにおける第１のピクチャの参照ピクチャに対する参照ステータス情報は、第２の異なるピクチャ（たとえば、現在ピクチャ）をコーディングするときに利用可能である。たとえば、第１のピクチャ内のブロックに対する動きベクトルが、第２の異なるピクチャ内のブロックに対する動きベクトル予測子であるべきである場合、ビデオコーダは、第２の異なるピクチャ内のブロックの適切なインター予測を確実にするために、第１のピクチャがコーディングされたインスタンスにおける、第１のピクチャ内のブロックに対する動きベクトルが参照した参照ピクチャの参照ステータスを判断することができる。

[0026]図１は、本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システム１０を示すブロック図である。図１に示すように、システム１０は、宛先デバイス１４によって後で復号されるべき符号化ビデオデータを生成するソースデバイス１２を含む。ソースデバイス１２および宛先デバイス１４は、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス１２および宛先デバイス１４は、ワイヤレス通信に対応し得る。

[0027]宛先デバイス１４は、リンク１６を介して復号されるべき符号化ビデオデータを受信することができる。リンク１６は、ソースデバイス１２から宛先デバイス１４に符号化ビデオデータを移動することが可能な任意のタイプの媒体またはデバイスを備え得る。一例では、リンク１６は、ソースデバイス１２が、符号化されたビデオデータをリアルタイムで宛先デバイス１４に直接送信することを可能にするための、通信媒体を備え得る。符号化されたビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、高周波（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたは有線通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットのようなグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス１２から宛先デバイス１４への通信を可能にするために有用であり得る、ルータ、スイッチ、基地局、または任意の他の機器を含み得る。

[0028]代替的に、符号化データは、出力インターフェース２２からストレージデバイス３４に出力され得る。同様に、符号化データは、入力インターフェースによってストレージデバイス３４からアクセスされ得る。ストレージデバイス３４は、ハードドライブ、ブルーレイ（登録商標）ディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性もしくは不揮発性メモリ、または符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体のような、種々の分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス３４は、ソースデバイス１２によって生成された符号化ビデオを保持し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス１４は、ストリーミングまたはダウンロードを介してストレージデバイス３４から、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス１４に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、（たとえば、ウェブサイトのための）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ）デバイス、またはローカルディスクドライブを含む。宛先デバイス１４は、インターネット接続を含む任意の標準データ接続を介して、符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル（たとえば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（たとえば、ＤＳＬ、ケーブルモデムなど）、または両方の組合せを含み得る。ストレージデバイス３４からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。

[0029]本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、無線を通じたテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の用途など、種々のマルチメディア用途のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム１０は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および／またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。

[0030]図１の例では、ソースデバイス１２は、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。場合によっては、出力インターフェース２２は、変調器／復調器（モデム）および／または送信機を含み得る。ソースデバイス１２において、ビデオソース１８は、たとえばビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および／またはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、あるいはそのようなソースの組合せを含み得る。一例として、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび／またはワイヤード適用例に適用され得る。

[0031]キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオエンコーダ２０によって符号化され得る。符号化ビデオデータは、ソースデバイス１２の出力インターフェース２２を介して宛先デバイス１４に直接送信され得る。符号化ビデオデータは、さらに（または代替として）、復号および／または再生のための宛先デバイス１４または他のデバイスによる後のアクセスのためにストレージデバイス３４上に記憶され得る。

[0032]宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。いくつかの場合、入力インターフェース２８は、受信機および／またはモデムを含み得る。宛先デバイス１４の入力インターフェース２８は、リンク１６を介して符号化ビデオデータを受信する。リンク１６を介して通信され、またはストレージデバイス３４上に与えられた符号化ビデオデータは、ビデオデータを復号する際に、ビデオデコーダ３０など、ビデオデコーダが使用するためのビデオエンコーダ２０によって生成される様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信されるか、記憶媒体上に記憶されるか、またはファイルサーバ上に記憶される符号化ビデオデータとともに含まれ得る。

[0033]ディスプレイデバイス３２は、宛先デバイス１４と一体化されるかまたはその外部にあり得る。いくつかの例では、宛先デバイス１４は、一体型ディスプレイデバイスを含み得、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス１４はディスプレイデバイスであり得る。概して、ディスプレイデバイス３２は、復号されたビデオデータをユーザに対して表示し、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。

[0034]ビデオエンコーダ２０およびビデオデコーダ３０は、様々なビデオコーディング規格に従って動作し得る。ビデオコーディング規格は、ＩＴＵ−ＴＨ．２６１、ＩＳＯ／ＩＥＣＭＰＥＧ−１Ｖｉｓｕａｌと、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌと、ＩＴＵ−ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌと、スケーラブルビデオコーディング（ＳＶＣ）拡張とマルチビュービデオコーディング（ＭＶＣ）拡張とを含む（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても知られる）ＩＴＵ−ＴＨ．２６４とを含む。ビデオ圧縮規格の他の例には、ＭＰＥＧ−２およびＩＴＵ−ＴＨ．２６３がある。

[0035]さらに、ＩＴＵ−Ｔビデオコーディングエキスパートグループ（ＶＣＥＧ）とＩＳＯ／ＩＥＣモーションピクチャエキスパートグループ（ＭＰＥＧ：Motion Picture Experts Group）とのジョイントコラボレーションチームオンビデオコーディング（ＪＣＴ−ＶＣ：Joint Collaboration Team on Video Coding）によって開発されている新しいビデオコーディング規格、すなわち、高効率ビデオコーディング（ＨＥＶＣ）がある。これ以降ＨＥＶＣＷＤ９と呼ばれる、ＨＥＶＣの最新の作業草案（ＷＤ）が、２０１３年２月２１日の時点で、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｎｔ−ｅｖｒｙ．ｆｒ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１１＿Ｓｈａｎｇｈａｉ／ｗｇ１１／ＪＣＴＶＣ−Ｋ１００３−ｖ１０．ｚｉｐから入手可能である。

[0036]ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。その上、本開示で説明する技法が特定の規格に必ずしも準拠するとは限らないとしても、本開示で説明する技法は、さらに、様々な規格に関してコーディング効率を支援し得る。同じく、本開示で説明する技法は、将来の規格の一部であり得る。理解しやすいように、技法は開発中のＨＥＶＣ規格に関して説明するが、技法はＨＥＶＣ規格に限定されず、特定の企画によって規定されない他のビデオコーディング企画またはビデオコーディング技法に拡張され得る。

[0037]図１には示されていないが、いくつかの態様では、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれオーディオエンコーダおよびデコーダと統合され得、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、いくつかの例では、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0038]ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、非一時的コンピュータ可読記憶媒体などの好適なコンピュータ可読記憶媒体にソフトウェアの命令を記憶し、１つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ２０およびビデオデコーダ３０の各々は１つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ／デコーダ（コーデック）の一部として統合され得る。

[0039]ＪＣＴ−ＶＣは、ＨＥＶＣ規格の開発に取り組んでいる。ＨＥＶＣ規格化の取り組みは、ＨＥＶＣテストモデル（ＨＭ）と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。ＨＭは、たとえば、ＩＴＵ−ＴＨ．２６４／ＡＶＣに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。たとえば、Ｈ．２６４は９つのイントラ予測符号化モードを提供するが、ＨＭは３３個もの方向性／角度イントラ予測符号化モードプラスＤＣモードおよび平面モードを提供することができる。

[0040]一般に、ＨＭの作業モデルは、ビデオフレームまたはピクチャが、ルーマとクロマの両方のサンプルを含む一連のツリーブロックまたは最大コーディングユニット（ＬＣＵ）に分割され得ることを記載する。ツリーブロックは、Ｈ．２６４規格のマクロブロックと同様の目的を有する。スライスは、コーディング順序でいくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、１つまたは複数のスライスに区分され得る。各ツリーブロックは、４分木に従ってコーディングユニット（ＣＵ）に分割され得る。たとえば、４分木のルートノードとしてのツリーブロックは、４つの子ノードに分割され得、各子ノードは、次に、親ノードとなり、別の４つの子ノードに分割され得る。４分木のリーフノードとしての、最終的な、分割されていない子ノードは、コーディングノード、すなわち、コード化ビデオブロックを備える。コード化ビットストリームに関連するシンタックスデータは、ツリーブロックが分割され得る最大回数を定義し得、コーディングノードの最小サイズをも定義し得る。

[0041]ＣＵは、コーディングノードと、コーディングノードに関連する予測ユニット（ＰＵ）および変換ユニット（ＴＵ）とを含む。ＣＵのサイズは、コーディングノードのサイズに対応し、形状が方形であり得る。ＣＵのサイズは、８×８ピクセルから、最大で６４×６４ピクセル以上のツリーブロックのサイズにまで及び得る。各ＣＵは、１つまたは複数のＰＵと１つまたは複数のＴＵとを含み得る。ＣＵに関連するシンタックスデータは、たとえば、ＣＵを１つまたは複数のＰＵに区分することを記述し得る。区分モードは、ＣＵが、スキップモード符号化またはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、あるいはインター予測モード符号化されるかによって異なり得る。ＰＵは、形状が非方形になるように区分され得る。ＣＵに関連するシンタックスデータは、たとえば、４分木に従って、ＣＵを１つまたは複数のＴＵに区分することも記述し得る。ＴＵは、形状が方形または非方形であり得る。

[0042]ＨＥＶＣ規格は、ＣＵごとに異なり得るＴＵに従う変換を可能にする。ＴＵは、一般に、区分されたＬＣＵについて定義された所与のＣＵ内のＰＵのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。ＴＵは、一般にＰＵと同じサイズであるかまたはＰＵよりも小さい。いくつかの例では、ＣＵに対応する残差サンプルは、「残差４分木」（ＲＱＴ：residual quad tree）として知られる４分木構造を使用してより小さいユニットに再分割され得る。ＲＱＴのリーフノードは変換ユニット（ＴＵ）と呼ばれることがある。ＴＵに関連するピクセル差分値は、変換されて変換係数が生成され得、その変換係数は量子化され得る。

[0043]一般に、ＰＵは、予測プロセスに関連したデータを含む。たとえば、ＰＵがイントラモード符号化されるとき、ＰＵは、ＰＵのイントラ予測モードを記述するデータを含み得る。別の例として、ＰＵがインターモード符号化されるとき、ＰＵは、ＰＵのための動きベクトルを定義するデータを含み得る。ＰＵについての動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度（たとえば、１／４ピクセル精度もしくは１／８ピクセル精度）、動きベクトルが指す参照ピクチャ、および／または動きベクトル用の参照ピクチャリスト（たとえば、ＲｅｆＰｉｃＬｉｓｔ０（Ｌ０）もしくはＲｅｆＰｉｃＬｉｓｔ１（Ｌ１））を記述し得る。

[0044]ＴＵは、変換プロセスと量子化プロセスとのために使用され得る。１つまたは複数のＰＵを有する所与のＣＵは、１つまたは複数の変換ユニット（ＴＵ）も含み得る。予測の後に、ビデオエンコーダ２０は、ＰＵに対応する残差値を計算し得る。残差値は、エントロピーコーディングのためのシリアル化変換係数（serialized transform coefficient）を生成するために、ＴＵを使用して変換係数に変換され、量子化され、走査され得るピクセル差分値を備える。本開示では、一般に、ＣＵのコーディングノードを指すために「ビデオブロック」という用語を使用する。いくつかの特定の場合において、本開示では、コーディングノードならびにＰＵおよびＴＵを含む、ツリーブロック、すなわち、ＬＣＵまたはＣＵを指す「ビデオブロック」という用語も使用し得る。

[0045]たとえば、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格に従うビデオコーディングでは、ビデオピクチャがコーディングユニット（ＣＵ）と予測ユニット（ＰＵ）と変換ユニット（ＴＵ）とに区分され得る。ＣＵは、概して、ビデオ圧縮のために様々なコーディングツールが適用される基本ユニットとして働く画像領域を指す。ＣＵは、一般に正方形の形状を有し、たとえば、ＩＴＵ−ＴＨ．２６４などの他のビデオコーディング規格の下でのいわゆる「マクロブロック」と同様であると見なされ得る。

[0046]より良いコーディング効率を達成するために、ＣＵは、それが含んでいるビデオデータに応じて可変サイズを有し得る。すなわち、ＣＵは、より小さいブロックまたはサブＣＵに区分または「分割」され得、その各々はＣＵと呼ばれることもある。さらに、サブＣＵに分割されない各ＣＵは、それぞれ、ＣＵの予測および変換のために１つまたは複数のＰＵとＴＵとにさらに区分され得る。

[0047]ＰＵは、Ｈ．２６４などの他のビデオコーディング規格の下でのいわゆるブロックのパーティションと同様であると見なされ得る。ＰＵは、「残差」係数を生成するためにブロックについての予測が実行されるベースである。ＣＵの残差係数は、ＣＵのビデオデータと、ＣＵの１つまたは複数のＰＵを使用して判断されたＣＵについての予測データとの間の差を表す。詳細には、１つまたは複数のＰＵは、ＣＵが予測のためにどのように区分されるかを指定し、ＣＵの各パーティション内に含まれているビデオデータを予測するためにどの予測モードが使用されるかを指定する。

[0048]ＣＵの１つまたは複数のＴＵは、ＣＵのための残差変換係数のブロックを生成するために、ブロックにどの変換が適用されるかに基づいて、ＣＵの残差係数のブロックのパーティションを指定する。１つまたは複数のＴＵはまた、適用される変換のタイプに関連し得る。変換は、残差係数をピクセルまたは空間領域から周波数領域などの変換領域に変換する。さらに、１つまたは複数のＴＵは、量子化残差変換係数のブロックを生成するために残差変換係数の得られたブロックにどの量子化が適用されるかに基づいてパラメータを指定し得る。残差変換係数は、場合によっては、係数を表すために使用されるデータの量を低減するために量子化され得る。

[0049]ＣＵは、一般に、Ｙとして示される１つのルミナンス成分とＵおよびＶとして示される２つのクロミナンス成分とを含む。言い換えれば、サブＣＵにさらに分割されない所与のＣＵは、Ｙ成分とＵ成分とＶ成分とを含み得、その各々は、前に説明したように、ＣＵの予測および変換のために１つまたは複数のＰＵとＴＵとにさらに区分され得る。たとえば、ビデオサンプリングフォーマットに応じて、サンプルの数で表されるＵ成分およびＶ成分のサイズは、Ｙ成分のサイズと同じであるかまたはそれとは異なり得る。したがって、予測、変換、および量子化に関して上記で説明した技法は、所与のＣＵのＹ成分とＵ成分とＶ成分との各々について実行され得る。

[0050]ＣＵを符号化するために、ＣＵの１つまたは複数のＰＵに基づいて、ＣＵのための１つまたは複数の予測子が最初に導出される。予測子は、ＣＵについての予測データを含んでいる参照ブロックであり、前に説明したように、ＣＵのための対応するＰＵに基づいて導出される。たとえば、ＰＵは、それについて予測データが判断されるべきＣＵのパーティションと、予測データを判断するために使用される予測モードとを示す。予測子は、イントラ（Ｉ）予測（すなわち、空間的予測）モードまたはインター（ＰまたはＢ）予測（すなわち、時間的予測）モードのいずれかを通して導出され得る。したがって、いくつかのＣＵは、同じフレーム中の隣接参照ブロックまたはＣＵに対する空間的予測を使用してイントラコーディング（Ｉ）され得るが、他のＣＵは、他のフレーム中の参照ブロックまたはＣＵに対してインターコーディング（ＰまたはＢ）され得る。

[0051]ＣＵの１つまたは複数のＰＵに基づいて１つまたは複数の予測子を識別するときに、１つまたは複数のＰＵに対応するＣＵの元のビデオデータと１つまたは複数の予測子中に含まれているＣＵについての予測データとの間の差が計算される。予測残差とも呼ばれるこの差は、残差係数を備え、前に説明したように、１つまたは複数のＰＵと１つまたは複数の予測子とによって指定されたＣＵの部分間のピクセル差分を指す。残差係数は、概して、１つまたは複数のＰＵｏＣＵに対応する２次元（２Ｄ）アレイで構成される。

[0052]さらなる圧縮を達成するために、予測残差は、概して、たとえば、離散コサイン変換（ＤＣＴ）、整数変換、カルーネンレーベ（Karhunen-Loeve）（Ｋ−Ｌ）変換、または別の変換を使用して変換され得る。変換は、同じく前に説明したように、空間領域中の予測残差、すなわち、残差係数を変換領域、たとえば、周波数領域中の残差変換係数に変換する。変換係数はまた、概してＣＵの１つまたは複数のＴＵに対応する２Ｄアレイに配列される。さらなる圧縮のため、残差変換係数は、同じく前に説明したように、場合によっては、係数を表すために使用されるデータの量を低減するために量子化され得る。

[0053]またさらなる圧縮を達成するために、エントロピーコーダは、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：Context Adaptive Variable Length Coding）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、確率間隔区分エントロピーコーディング（ＰＩＰＥ：Probability Interval Partitioning Entropy Coding）、または別のエントロピーコーディング方法を使用して、得られた残差変換係数を後で符号化する。エントロピーコーディングは、他のＣＵと比較して、係数によって表される、ＣＵのビデオデータに固有の統計的冗長を低減または削除することによって、このさらなる圧縮を達成し得る。

[0054]ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ（ＧＯＰ）は、一般に、ビデオピクチャのうちの一連の１つまたは複数を備える。ＧＯＰは、ＧＯＰ中に含まれるいくつかのピクチャを記述するシンタックスデータを、ＧＯＰのヘッダ中、ピクチャのうちの１つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスのための符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ２０は、通常、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックはＣＵ内のコーディングノードに対応し得る。ビデオブロックは、サイズを固定することも変更することもでき、指定のコーディング規格に応じてサイズが異なることがある。

[0055]一例として、ＨＭは、様々なＰＵサイズでの予測をサポートする。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ＨＭは、２Ｎ×２ＮまたはＮ×ＮのＰＵサイズでのイントラ予測をサポートし、２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、またはＮ×Ｎの対称的なＰＵサイズでのインター予測をサポートする。ＨＭはまた、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズでのインター予測のための非対称区分をサポートする。非対称区分では、ＣＵの一方向は区分されないが、他の方向は２５％と７５％とに区分される。２５％の区分に対応するＣＵの部分は、「ｎ」とその後ろに付く「Ｕｐ」、「Ｄｏｗｎ」、「Ｌｅｆｔ」、または「Ｒｉｇｈｔ」という表示によって示される。したがって、たとえば、「２Ｎ×ｎＵ」は、上部の２Ｎ×０．５ＮＰＵと下部の２Ｎ×１．５ＮＰＵとで水平方向に区分された２Ｎ×２ＮＣＵを指す。

[0056]本開示では、「Ｎ×Ｎ（NxN）」および「Ｎ×Ｎ（N by N）」は、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、たとえば、１６×１６（16x16）ピクセルまたは１６×１６（16 by 16）ピクセルを指すために互換的に使用され得る。一般に、１６×１６ブロックは、垂直方向に１６ピクセルを有し（ｙ＝１６）、水平方向に１６ピクセルを有する（ｘ＝１６）。同様に、Ｎ×Ｎブロックは、一般に、垂直方向にＮピクセルを有し、水平方向にＮピクセルを有し、ただし、Ｎは非負整数値を表す。ブロック中のピクセルは行と列に構成され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要があるとは限らない。たとえば、ブロックはＮ×Ｍピクセルを備えてよく、ただし、Ｍは必ずしもＮに等しいとは限らない。

[0057]ＣＵのＰＵを使用するイントラ予測またはインター予測のコーディングに続いて、ビデオエンコーダ２０は、ＣＵのＴＵ用の残差データを計算し得る。ＰＵは、（ピクセル領域とも呼ばれる）空間領域においてピクセルデータを備え得、ＴＵは、残差ビデオデータへのある変換、たとえば、離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、ＰＵに対応する予測値との間のピクセル差分に対応する場合がある。ビデオエンコーダ２０は、ＣＵのための残差データを含むＴＵを形成し、次いで、ＴＵを変換して、ＣＵの変換係数を生成し得る。

[0058]変換係数を生成するための任意の変換の後に、ビデオエンコーダ２０は、変換係数の量子化を実行し得る。量子化は、概して、さらなる圧縮を提供する、係数を表すために使用されるデータの量をできるだけ低減するために変換係数を量子化するプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。たとえば、量子化中にｎビット値がｍビット値に切り捨てられ得、ｎはｍよりも大きい。

[0059]いくつかの例では、ビデオエンコーダ２０は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ２０は適応走査を実行し得る。量子化変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２０は、たとえば、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディング、または別のエントロピー符号化方法に従って、１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２０はまた、ビデオデータを復号する際にビデオデコーダ３０が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。

[0060]ＣＡＢＡＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、たとえば、シンボルの隣接値が非０であるか否かに関係し得る。ＣＡＶＬＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボル用の可変長コードを選択することができる。ＶＬＣにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、ＶＬＣの使用は、たとえば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率判断は、シンボルに割り当てられるコンテキストに基づく場合がある。

[0061]ビデオエンコーダ２０およびビデオデコーダ３０は、本開示の技法に従って構成され得る。たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は、ピクチャがコーディングされるインスタンスにおいて、各ピクチャの参照ピクチャに対する参照ステータス情報を記憶するように構成され得る。例として、参照ステータス情報は、参照ピクチャが、「短期参照に使用される」、「長期参照に使用される」、または「参照に使用されない」として識別されるかどうかを示す。より詳細に説明するように、ビデオエンコーダ２０およびビデオデコーダ３０は、後続のピクチャのブロックをインター予測するために、ピクチャがコーディングされたインスタンスにおける、ピクチャの参照ピクチャに対する参照ステータス情報に依存し得る。

[0062]たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は、現在ピクチャの現在ブロックをインター予測するために、マージ／スキップモードまたは拡張型動きベクトル予測（ＡＭＶＰ）モードを実施するように構成され得る。技法はマージ／スキップモードおよびＡＭＶＰモードに関して説明されているが、技法は、マージ／スキップモードおよびＡＭＶＰモードだけに適用することに限定されないことを理解されたい。ビデオエンコーダ２０およびビデオデコーダ３０は、マージ／スキップモードまたはＡＭＶＰモードがインター予測のために利用されない例においても、本開示で説明する技法を実施するように構成され得る。

[0063]マージ／スキップモードまたはＡＭＶＰモードでは、現在ブロックの実際の動きベクトルに対する情報を、ビデオエンコーダ２０は通知せず、ビデオデコーダ３０は受信しない。そうではなく、ビデオデコーダ３０が現在ブロックの動きベクトルを導出する情報を、ビデオエンコーダ２０は通知し、ビデオデコーダ３０は受信する。

[0064]たとえば、マージ／スキップモードまたはＡＭＶＰモードでは、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれ、候補動きベクトル予測子のリストを構築する。動きベクトル予測子は、インター予測されるブロック以外のブロック（すなわち、現在ブロック以外のブロック）に対する動きベクトルである。たとえば、ビデオデコーダ３０は、現在ブロックに空間的に隣接するブロック（すなわち、現在ブロックに隣接する現在ピクチャ内のブロック）が、インター予測されるかどうか、および候補動きベクトル予測子のリスト内に空間的に隣接するブロックの１つまたは複数の動きベクトルを含むかどうかを判断し得る。

[0065]別の例として、ビデオデコーダ３０は、現在ブロックに時間的に隣接するブロック（すなわち、現在ピクチャ以外のピクチャ内のブロック）が、インター予測されるかどうか、および候補動きベクトル予測子のリスト内に時間的に隣接するブロックに対する１つまたは複数の動きベクトルを含むかどうかを判断し得る。時間的ピクチャは、現在ピクチャがコーディングまたは表示される時間と異なる時間においてコーディングまたは表示されるので、時間的隣接ブロックを含むピクチャは、時間的ピクチャと呼ばれる。たとえば、時間的ピクチャは、現在ピクチャより前にコーディングされるピクチャであるが、現在ピクチャより前にまたは後で表示されることがある。

[0066]いくつかのマルチビューコーディング技法では、時間的ピクチャは、現在ブロックを含むピクチャと異なるビュー内のピクチャであることがある。この例では、時間的ピクチャおよび現在ピクチャは、同時に表示されることがある。しかしながら、異なるビュー内のピクチャは、現在ピクチャがコーディングされる時間と異なる時間においてコーディングされることがある。したがって、時間的ピクチャは、現在ピクチャと同じビュー内のピクチャであってよく、または現在ピクチャと異なるビュー内のピクチャであってもよい。いずれの例においても、時間的ピクチャは、現在ピクチャと異なる（すなわち、予測されるべき現在ブロックを含むピクチャと異なる）ピクチャである。

[0067]いくつかの例では、時間的隣接ブロックは、現在ブロックが現在ピクチャ内で包含する時間的ピクチャ内のエリアと同じエリアを包含し得る。この例では、時間的隣接ブロックは、現在ブロックとコロケートされていると見なされ得る。

[0068]いくつかの例では、時間的隣接ブロックは、現在ブロックが時間的ピクチャ内に位置する場所の右下に位置することがある。たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は、現在ブロックの右下に位置する現在ピクチャ内のブロックのロケーションを決定し得る。ビデオエンコーダ２０およびビデオデコーダ３０は、時間的ピクチャ内のブロックを識別するために、現在ピクチャ内の右下のブロックの決定されたロケーション情報を利用し得る。時間的ピクチャ内のこの識別されたブロックは、時間的隣接ブロックの別の例である。

[0069]現在ブロックに対する動きベクトル予測子を形成する空間的隣接ブロックに対する動きベクトルは、空間的動きベクトル予測子（ＳＭＶＰ）と呼ばれることがある。現在ブロックに対する１つまたは複数の動きベクトル予測子を形成する時間的隣接ブロックに対する１つまたは複数の動きベクトルは、１つまたは複数の時間的動きベクトル予測子（１つまたは複数のＴＭＶＰ）と呼ばれることがある。したがって、ビデオデコーダ３０は、ＳＭＶＰおよび／またはＴＭＶＰを含む候補動きベクトル予測子のリストを構築し得る。ビデオエンコーダ２０は、ソースデバイス１２の側に候補動きベクトル予測子のリストを同様に構築するために、類似の技法を利用し得る。

[0070]ビデオエンコーダ２０は、候補動きベクトル予測子のリストにインデックスを通知し得、ビデオデコーダ３０は、候補動きベクトル予測子のリストに通知されたインデックスに基づいて、１つまたは複数の動きベクトル予測子を選択し得る。ビデオデコーダ３０は、現在ブロックに対する１つまたは複数の動きベクトルを導出するために、１つまたは複数の動きベクトル予測子を利用する。

[0071]たとえば、マージ／スキップモードでは、ビデオデコーダ３０は、選択された１つまたは複数の動きベクトル予測子に等しい現在ブロックの１つまたは複数の動きベクトルを設定する。ＡＭＶＰモードにおいて、候補動きベクトル予測子のリストにインデックス値を通知することに加えて、ビデオエンコーダ２０はまた、選択された１つまたは複数の動きベクトル予測子と現在ブロックの実際の１つまたは複数の動きベクトルとの間の動きベクトル差分（ＭＶＤ）を通知し得る。この例では、ビデオデコーダ３０は、ＭＶＤを受信し、ＭＶＤと選択された１つまたは複数の動きベクトル予測子とに基づいて現在ブロックの１つまたは複数の動きベクトルを判断することができる。

[0072]いくつかの例では、マージ／スキップモードまたはＡＭＶＰモードを実施するために、ビデオエンコーダ２０およびビデオデコーダ３０は、ピクチャがコーディングされたインスタンスにおける、ピクチャの参照ピクチャの参照ステータスを判断することを必要とすることがある。たとえば、ＴＭＶＰを利用するために、ビデオエンコーダ２０およびビデオデコーダ３０は、時間的ピクチャの参照ピクチャの参照ステータスを判断することを必要とすることがある。

[0073]たとえば、時間的ピクチャをコーディングするとき、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれ、１つまたは２つの参照ピクチャリスト（すなわち、時間的ピクチャに対するＲｅｆＰｉｃＬｉｓｔ０および時間的ピクチャに対するＲｅｆＰｉｃＬｉｓｔ１）を構築していることがある。時間的ピクチャに対するＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１は、時間的隣接ブロックをインター予測するために使用される参照ピクチャを含む、時間的ピクチャのブロックをインター予測するために使用され得る参照ピクチャを識別する。時間的隣接ブロックが単予測される（uni-predicted）（すなわち、１つの動きベクトルを用いて予測される）場合、時間的隣接ブロックに対する動きベクトルは、ＲｅｆＰｉｃＬｉｓｔ０内の参照ピクチャまたはＲｅｆＰｉｃＬｉｓｔ１内の参照ピクチャを指すことがある。時間的隣接ブロックが双予測される（bi-predicted）（すなわち、２つの動きベクトルを用いて予測される）場合、時間的隣接ブロックに対する第１の動きベクトルはＲｅｆＰｉｃＬｉｓｔ０内の参照ピクチャを指し、時間的隣接ブロックに対する第２の動きベクトルはＲｅｆＰｉｃＬｉｓｔ１内の参照ピクチャを指すことがある。

[0074]ビデオエンコーダ２０およびビデオデコーダ３０が、時間的隣接ブロックに対する１つまたは複数の動きベクトルが現在ブロックに対する候補動きベクトル予測子のリストに含まれるべきであると判断するか、または時間的隣接ブロックに対する１つまたは複数の動きベクトルが現在ブロックの１つまたは複数の動きベクトルを導出するために使用されるべきであると判断する場合、ビデオエンコーダ２０およびビデオデコーダ３０は、時間的ピクチャがコーディングされたインスタンスにおける、時間的隣接ブロックの１つまたは複数の動きベクトルが参照した１つまたは複数の参照ピクチャの参照ステータスを判断することを必要とすることがある。たとえば、時間的隣接ブロックが、時間的ピクチャのＲｅｆＰｉｃＬｉｓｔ０内の第３のピクチャを指す動きベクトルを用いて単予測されると仮定する。この例では、ビデオエンコーダ２０およびビデオデコーダ３０は、ビデオエンコーダ２０およびビデオデコーダ３０が時間的ピクチャをコーディングしたインスタンスにおける、時間的ピクチャのＲｅｆＰｉｃＬｉｓｔ０内の第３のピクチャの参照ステータスを判断することを必要とすることがある。

[0075]たとえば、ＨＥＶＣＷＤ９は、従属節８．５．３．１において、関数ＬｏｎｇＴｅｒｍＲｅｆＰｉｃを定義している。ＨＥＶＣＷＤ９は、従属節８．５．３．１において下記のように述べている。

[0076]Ｘが０または１のいずれかである関数ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ（ｐｉｃＸ、ｒｅｆＩｄｘ、ＬＸ）は、次のように定義される。ｐｉｃＸが現在ピクチャであった時点で、ピクチャｐｉｃＸの参照ピクチャリストＬＸからのインデックスｒｅｆＩｄｘを伴うピクチャが「長期参照に使用される」と標識された場合、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ（ｐｉｃＸ，ｒｅｆＩｄｘ，ＬＸ）は１に等しく、それ以外の場合、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ（ｐｉｃＸ，ｒｅｆＩｄｘ，ＬＸ）は０に等しい。

[0077]前の例（たとえば、時間的隣接ブロックが、時間的ピクチャのＲｅｆＰｉｃＬｉｓｔ０内の第３のピクチャを指す動きベクトルを用いて単予測される）に従って、現在ピクチャ内の現在ブロックに対するＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数を実施するために、ｐｉｃＸは時間的ピクチャに等しく、ｒｅｆＩｄｘは（第１の参照ピクチャに対するインデックスが０であると仮定して）２に等しく、ＬＸはＲｅｆＰｉｃＬｉｓｔ０に等しい。言い換えれば、この例では、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数はＬｏｎｇＴｅｒｍＲｅｆＰｉｃ（時間的ピクチャ、２、ＲｅｆＰｉｃＬｉｓｔ０）と見なされ得る。この例では、時間的ピクチャに対するＲｅｆＰｉｃＬｉｓｔ０内の第３のピクチャが、ビデオエンコーダ２０およびビデオデコーダ３０が時間的ピクチャをコーディングしたインスタンスにおいて「長期参照に使用される」と識別されていた場合、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数は１に等しい。同じく、この例では、時間的ピクチャに対するＲｅｆＰｉｃＬｉｓｔ０内の第３のピクチャが、ビデオエンコーダ２０およびビデオデコーダ３０が時間的ピクチャをコーディングしたインスタンスにおいて「長期参照に使用される」と識別されていなかった場合、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数は０に等しい。

[0078]上記の例によれば、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数は、時間的ピクチャがコーディングされたインスタンスにおける（すなわち、ＨＥＶＣＷＤ９において記述される「ｐｉｃＸが現在ピクチャであった時点における」）時間的ピクチャの参照ピクチャの参照ステータスに基づく。時間的ピクチャがコーディングされたインスタンスにおける時間的ピクチャの参照ピクチャの参照ステータスが失われた場合、ビデオエンコーダ２０およびビデオデコーダ３０は、ＨＥＶＣ規格の要件に準拠することはできないことがある。たとえば、時間的ピクチャがコーディングされたインスタンスにおける時間的ピクチャの参照ピクチャの参照ステータスが失われた場合、ビデオエンコーダ２０およびビデオデコーダ３０は、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数を実施することはできないことがある。

[0079]ＨＥＶＣＷＤ９におけるＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数の記述は、例示のために提供されているにすぎなく、限定するものと見なされるべきではないことを理解されたい。本開示で説明する技法は、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数以外の目的に適用可能であるとともに、ＨＥＶＣ規格以外の規格に対しても適用可能である。

[0080]本開示で説明する技法によれば、ビデオエンコーダ２０およびビデオデコーダ３０は、ピクチャがコーディングされるインスタンスにおいて各ピクチャの参照ピクチャに対する参照ステータス情報を記憶する。このようにして、ピクチャのブロックの１つまたは複数の動きベクトルが、現在ピクチャの現在ブロックに対する１つまたは複数のＴＭＶＰとして後で利用される場合、ピクチャの参照ピクチャに対する参照ステータス情報が利用可能である。

[0081]ビデオエンコーダ２０およびビデオデコーダ３０が、ピクチャの参照ピクチャに対する参照ステータス情報を記憶し得る様々な方法が存在し得る。一例として、ビデオエンコーダ２０およびビデオデコーダ３０は、ピクチャの参照ピクチャリストの各々に対するフラグのリストを記憶し得る。参照ピクチャが、ピクチャがコーディングされるインスタンスにおいて「長期参照に使用される」と識別される場合、フラグの値は１であり得る。参照ピクチャが、ピクチャがコーディングされるインスタンスにおいて「長期参照に使用される」と識別されない場合、フラグの値は０であり得る。

[0082]たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれ、ＲｅｆＰｉｃＬｉｓｔＸに対してｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸと呼ばれるフラグのリストを維持することができ、ここでＸは０または１に等しい。たとえば、ピクチャをコーディングするために、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれ、ピクチャに対するＲｅｆＰｉｃＬｉｓｔ０および／またはピクチャに対するＲｅｆＰｉｃＬｉｓｔ１を構築し得る。この例では、ｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ０は、「長期参照に使用される」と識別されるＲｅｆＰｉｃＬｉｓｔ０内の参照ピクチャに対して１のフラグ値を含み得、「長期参照に使用される」と識別されないＲｅｆＰｉｃＬｉｓｔ０内の参照ピクチャに対して０のフラグ値を含み得る。同様に、ｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ１は、「長期参照に使用される」と識別されるＲｅｆＰｉｃＬｉｓｔ１内の参照ピクチャに対して１のフラグ値を含み得、「長期参照に使用される」と識別されないＲｅｆＰｉｃＬｉｓｔ１内の参照ピクチャに対して０のフラグ値を含み得る。

[0083]言い換えれば、ビデオエンコーダ２０およびビデオデコーダ３０がピクチャに対してＲｅｆＰｉｃＬｉｓｔＸを構築した後、ビデオエンコーダ２０およびビデオデコーダ３０は、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］と識別されたピクチャが「長期参照に使用される」と標識されている場合は、ｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値を１に等しく設定し、そうでない場合は０に等しく設定し得る。いくつかの例では、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれの復号されたピクチャバッファ（ＤＰＢ）にフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストを記憶し得るが、ビデオエンコーダ２０およびビデオデコーダ３０がそれぞれのＤＰＢ以外のロケーションにフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストを記憶することも可能である。概して、フラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストは、それぞれのＤＰＢ内の各ピクチャに対する参照ピクチャリストの各々に対して利用可能であり得る。

[0084]ビデオエンコーダ２０のＤＰＢおよびビデオデコーダ３０のＤＰＢは、復号されたピクチャ、ならびに復号されたピクチャに関連する情報を記憶し得る。たとえば、ピクチャの符号化プロセスの一部として、ビデオエンコーダ２０は、ピクチャの符号化されたブロックを復号し、ビデオエンコーダ２０が後続のピクチャをインター予測するために復号されたピクチャを利用できるようにビデオエンコーダ２０のＤＰＢ内に復号されたピクチャを記憶する。ビデオデコーダ３０は、ピクチャを復号し、ビデオデコーダ３０が後続のピクチャをインター予測するために復号されたピクチャを利用できるようにそのＤＰＢ内に復号されたピクチャを記憶することができる。したがって、ビデオエンコーダ２０のＤＰＢおよびビデオデコーダ３０のＤＰＢは、ピクチャがコーディングされる（すなわち、場合に応じて符号化されるかまたは復号される）インスタンスにおいて、ピクチャの参照ピクチャに対する参照ステータス情報を記憶するのに好適なロケーションであり得る。

[0085]本開示で説明する技法では、ビデオエンコーダ２０およびビデオデコーダ３０は、ピクチャがコーディングされるインスタンスにおける、ピクチャに対して記憶された参照ステータス情報を使用してＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数を実施し得る。たとえば、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ（ｐｉｃＸ、ｒｅｆＩｄｘ、ＬＸ）は、ｐｉｃＸのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｒｅｆＩｄｘ］の値を返す。たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は、ｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｒｅｆＩｄｘ］に記憶された値に基づいて、ピクチャがコーディングされたインスタンスにおける参照ピクチャのピクチャの参照ステータスを判断し得る。

[0086]一例として、ｐｉｃＸが、時間的隣接ブロックを含む時間的ピクチャであり、時間的隣接ブロックの１つまたは複数の動きベクトルが、現在ブロックの１つまたは複数の動きベクトルを判断するために使用されると仮定する。同じく、時間的隣接ブロックが、時間的ピクチャのＲｅｆＰｉｃＬｉｓｔ０内の第２の参照ピクチャ（すなわち、ＲｅｆＰｉｃＬｉｓｔ０に対するｒｅｆＩｄｘが１）を指す１つの動きベクトルと、時間的ピクチャのＲｅｆＰｉｃＬｉｓｔ１内の第４の参照ピクチャ（すなわち、ＲｅｆＰｉｃＬｉｓｔ１に対するｒｅｆＩｄｘが３）を指す別の動きベクトルとを用いて双予測されると仮定する。この例では、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ（時間的ピクチャ、１、ＲｅｆＰｉｃＬｉｓｔ０）関数を実施するために、ビデオエンコーダ２０およびビデオデコーダ３０は、時間的ピクチャに対するｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ０［１］に記憶された値を判断する。ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ（時間的ピクチャ、３、ＲｅｆＰｉｃＬｉｓｔ１）関数を実施するために、ビデオエンコーダ２０およびビデオデコーダ３０は、時間的ピクチャに対するｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ１［３］に記憶された値を判断する。このようにして、ビデオエンコーダ２０およびビデオデコーダ３０は、現在ピクチャをコーディングするときに、時間的ピクチャがコーディングされたインスタンスにおける時間的ピクチャの参照ピクチャの参照ステータスを判断することができる。

[0087]ピクチャがコーディングされるインスタンスにおける、ピクチャの参照ピクチャの参照ステータス情報は、ビデオエンコーダ２０およびビデオデコーダ３０が場合によっては実行し得るピクチャの一般的ステータス標識（general status marking）と混同されるべきではない。たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は、「長期参照に使用される」、「短期参照に使用される」、または「参照に使用されない」としてピクチャを指定する（すなわち、標識する）ことと、それぞれのＤＰＢにそのような指定を記憶することとを行うように、すでに構成されていることがある。これらのピクチャの指定は変わることがある。たとえば、ＤＰＢに現在記憶されているピクチャは、「短期参照に使用される」として標識されているが、「長期参照に使用される」に変わることがある。この場合、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれのＤＰＢ内にピクチャの指定「長期参照に使用される」を記憶することがある。

[0088]「長期参照に使用される」、「短期参照に使用される」、または「参照に使用されない」としてのピクチャの標識は、ピクチャの現在のステータスを示し得る。しかしながら、ピクチャの現在のステータスは、ピクチャの前のステータスに関する情報を与えず、ましてピクチャが参照ピクチャとして使用されたときのピクチャのステータスを与えない。

[0089]上記で説明したように、一例としてフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストは、参照ピクチャがピクチャをインター予測するために使用されたときの参照ピクチャのステータスを記憶し得る。このようにして、各ピクチャに関連するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストが存在し得る。たとえば、第１のピクチャのコーディングの間、ビデオエンコーダ２０およびビデオデコーダ３０は、第１のピクチャに関連するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ０リストおよび／またはｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ１リストを記憶し得る。第２のピクチャのコーディングの間、ビデオエンコーダ２０およびビデオデコーダ３０は、第２のピクチャに関連するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ０リストおよび／またはｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ１リストを記憶し得、以下同様である。

[0090]第１のピクチャに関連するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ０リストおよび／またはｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ１リストは、第２のピクチャに関連するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ０リストおよび／またはｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ１リストと異なることがある。たとえば、第１のピクチャおよび第２のピクチャが、インター予測のために同じ参照ピクチャのうちの１つまたは複数を使用した場合でも、第１のピクチャと第２のピクチャの両方によって使用された参照ピクチャに対する参照ステータスは、ビデオエンコーダ２０およびビデオデコーダ３０が第１のピクチャをコーディングしたときからビデオエンコーダ２０およびビデオデコーダ３０が第２のピクチャをコーディングしたときまでに変わっていることが起こりうる。ピクチャに対するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ０リストおよび／またはｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ１リストは、そのピクチャに対して一意であり、ビデオエンコーダ２０およびビデオデコーダ３０は、コーディングされる各ピクチャに対するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ０リストおよび／またはｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ１リストを記憶し得る。

[0091]したがって、本開示で説明する技法では、ビデオエンコーダ２０およびビデオデコーダ３０は、ピクチャの現在のステータスだけでなく、そのピクチャが、別のピクチャがコーディングされたインスタンスにおいて別のピクチャに対する参照ピクチャであったときの、そのピクチャのステータスをも記憶するように構成され得る。１つまたは複数のＴＭＶＰを使用するようないくつかの場合には、現在ブロックをコーディングすることは、時間的隣接ブロックに対する参照ピクチャであったピクチャの現在のステータスに依存すべきではない。そうではなく、そのピクチャが時間的隣接ブロックに対する参照ピクチャとして機能したときのピクチャのステータスは、適切であり得る。本開示で説明する技法は、時間的ピクチャがコーディングされたインスタンスにおける、時間的ピクチャの参照ピクチャに対する参照ステータス情報を、ビデオエンコーダ２０およびビデオデコーダ３０が記憶することを可能にする。

[0092]上記で説明したように、１つまたは複数のＴＭＶＰは、時間的隣接ブロックの１つまたは複数の動きベクトルである。いくつかの例では、時間的隣接ブロックの１つまたは複数の動きベクトルは、時間的ピクチャおよび現在ピクチャと同じビュー内の１つまたは複数のピクチャを指すことができる。しかしながら、本開示で説明する技法は、そのように限定されない。

[0093]本開示で説明する技法は、マルチビューコーディングに拡張され得る。マルチビューコーディングでは、各々がピクチャを含む複数のビューが存在する。たとえば、第１のビューはピクチャの第１のセットを含み、第２のビューはピクチャの第２のセットを含むことができる。第１および第２のビューより多いビューが存在してもよい。ピクチャの第１のセットおよびピクチャの第２のセットは、実質的に類似するが水平視差を有するビデオコンテンツを含み得る。ビューアがピクチャの第１と第２の両方セットを同時に見るとき、ビューアは、ディスプレイデバイス３２の２Ｄエリアに制約されるのではなく、３Ｄの体積を包含する３Ｄビデオを知覚する。

[0094]非マルチビューコーディングでは、１つのみのビューが存在し得る。これらの例では、時間的隣接ブロックの１つまたは複数の動きベクトルは、時間的ピクチャと同じビュー内のピクチャを指すことができる。しかしながら、マルチビューコーディングでは、時間的隣接ブロックの１つまたは複数の動きベクトルは、時間的ピクチャを含むビューとは別のビュー内のピクチャを指すことができる。たとえば、マルチビューコーディングでは、時間的ピクチャおよび現在ピクチャは同じビュー内にあり得るが、時間的ピクチャに対する１つまたは複数の動きベクトルは、時間的ピクチャと現在ピクチャとを含むビュー以外のビュー内のピクチャを指す。

[0095]別のビュー内のピクチャを指す動きベクトルは、視差動きベクトルと呼ばれることがある。したがって、時間的隣接ブロックの１つまたは複数の動きベクトルが別のビュー内のピクチャを指す例では、１つまたは複数のＴＭＶＰは、１つまたは複数の視差動きベクトルであり得る。

[0096]いくつかの例では、マルチビューコーディングは、現在ビューにおいて現在ピクチャ内のブロックをインター予測するために使用される他のビュー内のピクチャが現在ピクチャと同時に表示されることを必要とすることがある。たとえば、現在ピクチャおよび時間的ピクチャが現在ビューのピクチャであると仮定する。同じく、時間的ピクチャに対する動きベクトルが別のビュー内のピクチャを指すと仮定する。この例では、マルチビューコーディングは、時間的ピクチャおよび他のビュー内のピクチャが同時に表示されることを必要とすることがある。

[0097]ピクチャが表示される時点は、ピクチャのピクチャ順序カウント（ＰＯＣ）値によって定義され得る。たとえば、より小さいＰＯＣ値を有するピクチャは、より大きいＰＯＣ値を有するピクチャよりも早く表示され得る。ピクチャの表示時間は、ピクチャのコーディング時間と混同されるべきではない。たとえば、より小さいＰＯＣ値を有するピクチャは、より大きいＰＯＣ値を有するピクチャより早く表示され得るが、より小さいＰＯＣを有するピクチャは、より大きいＰＯＣ値を有するピクチャがコーディングされるときより後でコーディングされることがある。

[0098]マルチビューコーディングでは、同時に表示されるべき異なるビュー内のピクチャが、同じＰＯＣ値を割り当てられ得る。たとえば、時間的ピクチャのＰＯＣ値と、時間的隣接ブロックの１つまたは複数の動きベクトルが参照する他のビュー内のピクチャのＰＯＣ値とは、同じであり得る。同じく、マルチビューコーディングでは、第１のビュー内のピクチャがインター予測のために第２のビュー内のピクチャを利用するとき、第２のビュー内のピクチャは、第１のビュー内のピクチャがコーディングされるインスタンスにおける「長期参照に使用される」と見なされ得る。

[0099]本開示で説明する技法では、ビデオエンコーダ２０およびビデオデコーダ３０がピクチャに対するＲｅｆＰｉｃＬｉｓｔ０および／またはＲｅｆＰｉｃＬｉｓｔ１を構築するとき、ビデオエンコーダ２０およびビデオデコーダ３０は、参照ピクチャリストのいずれかまたは両方の中の異なるビューからのピクチャを含み得る。たとえば、ＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１は、参照ピクチャのＰＯＣ値を識別し得る。ＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１内で識別された参照ピクチャに対するＰＯＣ値が、コーディングされるピクチャのＰＯＣ値と異なる場合、参照ピクチャは、ピクチャがコーディングされるビューと同じビューに属する。ＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１内で識別された参照ピクチャに対するＰＯＣ値が、コーディングされるピクチャのＰＯＣ値と同じである場合、参照ピクチャは、ピクチャがコーディングされるビューと異なるビューに属する。

[0100]上記で説明したように、ピクチャがコーディングされるビューと異なるビューに属する参照ピクチャは、ピクチャがコーディングされるインスタンスにおいて「長期参照に使用される」として指定され得る。いくつかの例では、ビデオエンコーダ２０およびビデオデコーダ３０は、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別されたピクチャがコーディングされるピクチャと同じＰＯＣ値を有する場合、１に等しいｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値を設定し得る。これらの例では、ビデオエンコーダ２０およびビデオデコーダ３０は、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別されたピクチャがコーディングされるピクチャと同じＰＯＣ値を有さない場合、０に等しいｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値を設定し得る。

[0101]たとえば、いくつかの例では、ビデオエンコーダ２０およびビデオデコーダ３０は、ピクチャをコーディングするとき、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別された参照ピクチャが「長期参照に使用される」として指定される場合、１に等しいｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値を設定し得、そうでない場合、０に等しいｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値を設定し得る。これらの例は、マルチビューコーディングと非マルチビューコーディングの両方に適用され得る。

[0102]いくつかの代替例では、ビデオエンコーダ２０およびビデオデコーダ３０は、ピクチャをコーディングするとき、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別された参照ピクチャがコーディングされるピクチャと同じＰＯＣ値を有する場合、１に等しいｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値を設定し得、そうでない場合、０に等しいｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値を設定し得る。これらの代替例では、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別された参照ピクチャが「長期参照に使用される」として指定されるが、コーディングされるピクチャと同じＰＯＣ値を有さない場合、ビデオエンコーダ２０およびビデオデコーダ３０は、０に等しいｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値を設定し得る。たとえば、これらの代替例では、ピクチャがコーディングされているときに参照ピクチャが「長期参照に使用される」として指定される場合でも、ビデオエンコーダ２０およびビデオデコーダ３０は、参照ピクチャのＰＯＣ値がコーディングされるピクチャのＰＯＣ値と異なる場合、参照ピクチャに対応するｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸのエントリを０に等しく設定し得る。これらの代替例は、マルチビューコーディングに対してより適用可能であるが、非マルチビューコーディングにも有用であり得る。

[0103]言い換えれば、いくつかの例では、ｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値は、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別された参照ピクチャが「長期参照に使用される」と標識されているか、または「長期参照に使用される」と標識されていないかに基づく。いくつかの代替例では、ｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］の値は、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別された参照ピクチャがコーディングされるピクチャと同じＰＯＣ値を有するか、またはコーディングされるピクチャと同じＰＯＣ値を有さないかに基づく。いずれの例においても、ビデオエンコーダ２０およびビデオデコーダ３０は、そのピクチャに関連するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストの値に基づいてピクチャに対するＬｏｎｇＴｅｒｍＲｅｆＰｉｃ関数を実施し得る。

[0104]上記で説明したように、いくつかの例では、（１つの非限定的な例として）ＨＥＶＣ規格の要件に準拠するために、技法は、時間的ピクチャがコーディングされたインスタンスにおける時間的ピクチャの参照ピクチャのステータス情報を、ビデオエンコーダ２０およびビデオデコーダ３０が判断することを可能にする。下記は、ビデオエンコーダ２０およびビデオデコーダ３０が、時間的ピクチャがコーディングされたインスタンスにおける、時間的ピクチャの参照ピクチャのステータス情報を判断し得る理由の一例を、以下で説明する。この説明は例示の目的で提供されているにすぎず、限定的と見なされるべきでないことを理解されたい。やはり、本開示で説明する技法は、ＨＥＶＣ規格に限定されず、またはマージモードもしくはＡＭＶＰモードに限定されない。

[0105]マージモードまたはＡＭＶＰモードの間、ビデオエンコーダ２０およびビデオデコーダ３０が、マージ候補リストまたはＡＭＶＰ候補リスト内に空間的候補動きベクトルまたは時間的候補動きベクトル（すなわち、ＳＭＶＰまたはＴＭＶＰ）を含むかどうかを判断するとき、ビデオエンコーダ２０およびビデオデコーダ３０は、ターゲット参照ピクチャ（たとえば、時間的ピクチャの参照ピクチャ）の長期または短期のステータスと、候補動きベクトルの参照ピクチャ（たとえば、時間的ピクチャの参照ピクチャ）の長期または短期のステータスとを比較し得る。いくつかの場合には、これらのピクチャの両方のステータスが（時間的ピクチャのコーディングの時点において）同じであるときだけ、候補動きベクトルが候補リストに追加される。そのようなプロセスが必要とされ、同じプロセスが、ビデオエンコーダ２０とビデオデコーダ３０の両方に対して存在し得る。

[0106]本開示で説明する技法によれば、時間的候補動きベクトルが参照する参照ピクチャ（たとえば、時間的ピクチャの参照ピクチャ）のステータスにアクセスするために、ｐｉｃＸのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｒｅｆＩｄｘ］が使用され得、ここにおいてｐｉｃＸはコロケートされたピクチャ（たとえば、時間的ピクチャ）である。たとえば、ｐｉｃＸのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｒｅｆＩｄｘ］が１である場合、それは、ｐｉｃＸのＲｅｆＰｉｃＬｉｓｔＸのｒｅｆＩｄｘを有する参照ピクチャが長期参照ピクチャであり、そうでない場合は短期参照ピクチャであることを意味する。この例では、ＲｅｆＰｉｃＬｉｓｔＸのｒｅｆＩｄｘを有する参照ピクチャは、ｐｉｃＸに対する参照ピクチャであり、ｐｉｃＸは時間的ピクチャを指す。時間的ピクチャは、時間的隣接ブロックを含み、時間的隣接ブロックの動きベクトル情報は、潜在的に、現在ブロックに対する動きベクトル情報を判断するために使用され得る。

[0107]このようにして、ビデオコーダ（たとえば、ビデオエンコーダ２０またはビデオデコーダ３０）は、技法を実施するように構成され得る。たとえば、ビデオコーダは、第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶し得、ここで参照ステータス情報は、第１のピクチャがコーディングされるインスタンスにおける１つまたは複数の参照ピクチャの参照ステータス情報を示す。ビデオコーダは、第１のピクチャの１つまたは複数の参照ピクチャの、第１のピクチャがコーディングされたインスタンスにおける記憶された参照ステータス情報に基づいて、第２の異なるピクチャ内のビデオブロックをコーディングし得る。いくつかの例では、第１のピクチャがコーディングされるインスタンスにおける、１つまたは複数の参照ピクチャのうちの１つの参照ピクチャの参照ステータスは、第２のピクチャがコーディングされるインスタンスにおける、参照ピクチャの参照ステータスとは異なる。

[0108]ビデオコーダは、第１のピクチャに対して少なくとも１つの参照ピクチャリストを構築し得る。ビデオコーダは、少なくとも１つの参照ピクチャリスト内で識別された参照ピクチャの各々に対する参照ステータス情報を記憶し得る。たとえば、ビデオコーダは、第１のピクチャに対するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストを記憶し得る。いくつかの例では、フラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストは、参照ピクチャが「長期参照に使用される」として指定されるか、または「長期参照に使用される」として指定されないかを示す第１のピクチャの参照ピクチャのうちの１つの参照ピクチャに対する値を記憶し得る。いくつかの例では、フラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストは、参照ピクチャのピクチャ順序カウント（ＰＯＣ）値が第１のピクチャのＰＯＣ値と同じＰＯＣ値であるか、または参照ピクチャのＰＯＣ値が第１のピクチャのＰＯＣ値と異なるかを示す第２のピクチャの参照ピクチャのうちの１つの参照ピクチャに対する値を記憶し得る。

[0109]いくつかの例では、ビデオコーダは、第２のピクチャ内のビデオブロックに対する動きベクトルが、第１のピクチャ内のビデオブロックの動きベクトルから導出されるべきである（たとえば、ＴＭＶＰがマージ／スキップモードまたはＡＭＶＰモードにおいて使用されるべきである）かどうかを判断し得る。第２のピクチャ内のビデオブロックに対する動きベクトルが、第１のピクチャ内のビデオブロックの動きベクトルから導出されるべきであるとき、ビデオコーダは、第１のピクチャ内のビデオブロックの動きベクトルが参照する、第１のピクチャの１つまたは複数の参照ピクチャのうちの１つの参照ピクチャを判断し得る。ビデオコーダは、記憶された参照ステータス情報に基づいて、第１のピクチャがコーディングされるインスタンスにおける、判断された参照ピクチャの参照ステータスを判断し得る。これらの例では、ビデオコーダは、判断された参照ステータスに基づいて第２のピクチャ内のビデオブロックをコーディングする（たとえば、符号化または復号する）ことができる。

[0110]図２は、本開示で説明する技法を実装し得る例示的なビデオエンコーダ２０を示すブロック図である。ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディング（すなわち、イントラ予測またはインター予測）を実行し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去するために時間的予測に依拠する。イントラモード（Ｉモード）は、いくつかの空間ベースの圧縮モードのいずれかを指し得る。単方向予測（Ｐモード）または双予測（Ｂモード）などのインターモードは、いくつかの時間ベースの圧縮モードのいずれかを指し得る。

[0111]図２に示すように、ビデオエンコーダ２０は、符号化されるべきビデオピクチャ内の現在ビデオブロックを受信する。図２の例では、ビデオエンコーダ２０は、モード選択ユニット４０と、参照ピクチャメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化ユニット５４と、エントロピー符号化ユニット５６とを含む。モード選択ユニット４０は、同様に、動き推定ユニット４２と、動き補償ユニット４４と、イントラ予測ユニット４６と、パーティションユニット４８とを含む。ビデオブロック復元のために、ビデオエンコーダ２０はまた、逆量子化ユニット５８と、逆変換ユニット６０と、加算器６２とを含む。ブロック境界をフィルタ処理して、復元されたビデオからブロッキネスアーティファクトを除去するデブロッキングフィルタ（図２に図示せず）も含むことができる。必要な場合、デブロッキングフィルタは、通常、加算器６２の出力をフィルタ処理することになる。デブロッキングフィルタに加えて、（ループ内またはループ後の）追加フィルタも使用することができる。そのようなフィルタは、簡潔のために示されていないが、所望される場合、（ループ内フィルタとして）加算器５０の出力をフィルタ処理し得る。

[0112]いくつかの例では、モード選択ユニット４０またはビデオエンコーダ２０の他のユニットと関連するモード選択ユニット４０は、本開示で説明する技法を実装し得る。たとえば、モード選択ユニット４０は、ビデオエンコーダ２０が第１のピクチャを符号化したインスタンスにおける、第１のピクチャの参照ピクチャに対する参照ステータス情報を記憶し得る。モード選択ユニット４０は、ビデオエンコーダ２０が第１のピクチャを符号化したインスタンスにおける、第１のピクチャの参照ピクチャに対する参照ステータス情報に基づいて、第２のピクチャのブロックをインター予測し得る。

[0113]一例として、第２のピクチャ内のブロックをインター予測するために、モード選択ユニット４０は、第２のピクチャ内のブロックの動きベクトルが第１のピクチャ内のブロックの動きベクトルから判断されるべきであると判断し得る。この例では、モード選択ユニット４０は、第２のピクチャ内のブロックの動きベクトルを判断するために、第２のピクチャの参照ピクチャに対する参照ステータス情報を利用し得る。モード選択ユニット４０は、参照ピクチャメモリ６４に、第１のピクチャがコーディングされるインスタンスにおいて第１のピクチャの参照ピクチャの参照ステータス情報を記憶し得る。参照ピクチャメモリ６４は、ビデオエンコーダ２０の復号ピクチャバッファ（ＤＰＢ）の一例である。

[0114]本開示の態様は、本開示で説明する技法を実装するモード選択ユニット４０に限定されない。いくつかの例では、プロセッサまたは処理ユニット（具体的に示されていない）が、本開示において説明する技法を実装してもよい。同じく、参照ピクチャメモリ６４以外のバッファが、ピクチャの参照ピクチャの参照ステータス情報を記憶してもよい。

[0115]符号化プロセス中に、ビデオエンコーダ２０は、コーディングされるべきビデオピクチャまたはスライスを受信する。ピクチャまたはスライスは複数のビデオブロックに分割され得る。動き推定ユニット４２および動き補償ユニット４４は、時間圧縮を行うために、１つまたは複数の参照ピクチャ中の１つまたは複数のブロックに対する受信したビデオブロックのインター予測コーディングを実施する。イントラ予測ユニット４６は、代替的に、空間圧縮を行うために、コーディングされるべきブロックと同じピクチャまたはスライス中の１つまたは複数の隣接ブロックに対する受信したビデオブロックのイントラ予測コーディングを実施し得る。ビデオエンコーダ２０は、たとえば、ビデオデータのブロックごとに適切なコーディングモードを選択するために、複数のコーディングパスを実行し得る。

[0116]その上、パーティションユニット４８は、前のコーディングパスにおける前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分し得る。たとえば、パーティションユニット４８は、初めにピクチャまたはスライスをＬＣＵに区分し、レートひずみ分析（たとえば、レートひずみ最適化）に基づいてＬＣＵの各々をサブＣＵに区分し得る。モード選択ユニット４０は、ＬＣＵをサブＣＵに区分することを示す４分木データ構造をさらに生成し得る。４分木のリーフノードＣＵは、１つまたは複数のＰＵおよび１つまたは複数のＴＵを含み得る。

[0117]モード選択ユニット４０は、たとえば、誤り結果に基づいて、複数のコーディングモード、すなわちイントラまたはインターのうちの１つを選択して、得られたイントラコード化ブロックまたはインターコード化ブロックを、残差ブロックデータを生成するために加算器５０に与え、参照ピクチャとして使用するための符号化ブロックを再構成するために加算器６２に与え得る。モード選択ユニット４０はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報など、シンタックス要素をエントロピー符号化ユニット５６に与える。

[0118]動き推定ユニット４２は、ビデオシーケンスの所定のパターンに従ってビデオスライスのためのインター予測モードを判断するように構成され得る。動き推定ユニット４２と動き補償ユニット４４とは、高度に統合され得るが、概念的な目的のために別々に示されている。動き推定ユニット４２によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照ピクチャ内の予測ブロックに対する現在ビデオフレームまたはピクチャ内のビデオブロックのＰＵの変位を示し得る。

[0119]上記で説明したように、動きベクトル予測子は、現在ブロック以外のブロックに対する動きベクトルであってよく、隣接ブロックに対する動きベクトルであることもあり得る。動き推定ユニット４２はまた、動きベクトル差分（ＭＶＤ）を決定し得る。たとえば、動き推定ユニット４２は、現在ブロックに対する動きベクトルと動きベクトル予測子との間の差分（たとえば、Ｘ座標の差分（delta）およびＹ座標の差分）を決定し得る。

[0120]予測ブロックは、絶対値差分和（ＳＡＤ）、差分２乗和（ＳＳＤ）、または他の差分尺度によって決定され得るピクセル差分に関して、コード化されるべきビデオブロックのＰＵに厳密に一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ２０は、参照ピクチャメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット４２は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。

[0121]動き推定ユニット４２は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス中のビデオブロックのＰＵについての動きベクトルを計算する。参照ピクチャは、第１の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０）または第２の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ１）から選択され得、それらの参照ピクチャリストの各々は、参照ピクチャメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する。動き推定ユニット４２は、計算された動きベクトルをエントロピー符号化ユニット５６と動き補償ユニット４４とに送る。

[0122]動き補償ユニット４４によって実行される動き補償は、動き推定ユニット４２によって判断された動きベクトルに基づいて予測ブロックをフェッチまたは生成することに関与し得る。この場合も、いくつかの例では、動き推定ユニット４２と動き補償ユニット４４とは機能的に統合され得る。現在ビデオブロックのＰＵのための動きベクトルを受信すると、動き補償ユニット４４は、参照ピクチャリストのうちの１つにおいて動きベクトルが指す予測ブロックの位置を特定し得る。加算器５０は、以下で説明するように、コーディングされている現在ビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。概して、動き推定ユニット４２はルーマ成分に対して動き推定を実行し、動き補償ユニット４４は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット４０はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ３０が使用するための、ビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。

[0123]イントラ予測ユニット４６は、上記で説明したように、動き推定ユニット４２と動き補償ユニット４４とによって実行されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測ユニット４６は、現在ブロックを符号化するために使用すべきイントラ予測モードを決定し得る。いくつかの例では、イントラ予測ユニット４６は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測ユニット４６（または、いくつかの例では、モード選択ユニット４０）は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。

[0124]たとえば、イントラ予測ユニット４６は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ（または誤差）の量、ならびに符号化ブロックを生成するために使用されるビットレート（すなわち、ビット数）を判断する。イントラ予測ユニット４６は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを判断するために、様々な符号化ブロックのひずみおよびレートから比を計算し得る。

[0125]いずれの場合も、ブロックのイントラ予測モードを選択した後に、イントラ予測ユニット４６は、ブロックについての選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット５６に提供し得る。エントロピー符号化ユニット５６は、選択されたイントラ予測モードを示す情報を符号化し得る。

[0126]ビデオエンコーダ２０は、コーディングされている元のビデオブロックから、モード選択ユニット４０からの予測データを減算することによって残差ビデオブロックを形成する。加算器５０は、この減算演算を実行する１つまたは複数の構成要素を表す。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット５２は、ＤＣＴと概念的に同様である他の変換を実施し得る。ウェーブレット変換、整数変換、サブバンド変換または他のタイプの変換も使用され得る。

[0127]いずれの場合も、変換処理ユニット５２は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、ピクセル値領域からの残差情報を周波数領域などの変換領域に変換し得る。変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送り得る。量子化ユニット５４は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減することができる。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化ユニット５４は、次いで、量子化された変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット５６がエントロピーコーディングの間、走査を実行し得る。

[0128]量子化の後、エントロピー符号化ユニット５６は、量子化変換係数をエントロピー符号化する。たとえば、エントロピー符号化ユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディングまたは別のエントロピー符号化方法または技法を実行し得る。エントロピー符号化ユニット５６によるエントロピー符号化の後に、符号化ビットストリームは、ビデオデコーダ３０に送信されるか、あるいはビデオデコーダ３０が後で送信するかまたは取り出すためにアーカイブされ得る。エントロピー符号化ユニット５６はまた、コード化されている現在ビデオスライスのための動きベクトルと他のシンタックス要素とをエントロピー符号化し得る。

[0129]逆量子化ユニット５８および逆変換ユニット６０は、それぞれ逆量子化および逆変換を適用して、たとえば、参照ブロックとして後で使用するために、ピクセル領域において残差ブロックを再構成する。動き補償ユニット４４は、残差ブロックを参照ピクチャメモリ６４のピクチャのうちの１つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット４４はまた、再構成された残差ブロックに１つまたは複数の補間フィルタを適用して、動き推定において使用するサブ整数ピクセル値を計算し得る。加算器６２は、再構成された残差ブロックを動き補償ユニット４４によって生成された動き補償予測ブロックに加算して、参照ピクチャメモリ６４に記憶するための再構成されたビデオブロックを生成する。再構成されたビデオブロックは、後続のビデオピクチャ中のブロックをインターコード化するために、動き推定ユニット４２および動き補償ユニット４４によって参照ブロックとして使用され得る。

[0130]図３は、本開示で説明する技法を実装し得る例示的なビデオデコーダ３０を示すブロック図である。図３の例では、ビデオデコーダ３０は、エントロピー復号ユニット８０と、モード選択ユニット８１と、逆量子化ユニット８６と、逆変換ユニット８８と、加算器９０と、参照ピクチャメモリ９２とを含む。モード選択ユニット８１は、動き補償ユニット８２と、イントラ予測ユニット８４とを含む。ビデオデコーダ３０は、いくつかの例では、図２のビデオエンコーダ２０に関して説明した符号化パスとは概して逆の復号パスを実行し得る。

[0131]いくつかの例では、モード選択ユニット８１またはビデオエンコーダ３０の他のユニットと関連するモード選択ユニット８１は、本開示で説明する技法を実施し得る。たとえば、モード選択ユニット８１は、ビデオデコーダ３０が第１のピクチャを復号したインスタンスにおける、第１のピクチャの参照ピクチャに対する参照ステータス情報を記憶し得る。モード選択ユニット８１は、ビデオデコーダ３０が第１のピクチャを復号したインスタンスにおける、第１のピクチャの参照ピクチャに対する参照ステータス情報に基づいて、第２のピクチャのブロックをインター予測し得る。

[0132]一例として、第２のピクチャ内のブロックをインター予測するために、モード選択ユニット８１は、第２のピクチャ内のブロックの動きベクトルが第１のピクチャ内のブロックの動きベクトルから判断されるべきであると判断し得る。この例では、モード選択ユニット８１は、第２のピクチャ内のブロックの動きベクトルを判断するために、第２のピクチャの参照ピクチャに対する参照ステータス情報を利用し得る。モード選択ユニット８１は、参照ピクチャメモリ９２に、第１のピクチャがコーディングされるインスタンスにおいて、第１のピクチャの参照ピクチャの参照ステータス情報を記憶し得る。参照ピクチャメモリ９２は、ビデオデコーダ３０の復号ピクチャバッファ（ＤＰＢ）の一例である。

[0133]本開示の態様は、本開示で説明する技法を実装するモード選択ユニット81に限定されない。いくつかの例では、プロセッサまたは処理ユニット（具体的に示されていない）が、本開示において説明する技法を実施してもよい。同じく、参照ピクチャメモリ９２以外のバッファが、ピクチャの参照ピクチャの参照ステータス情報を記憶してもよい。

[0134]復号プロセス中に、ビデオデコーダ３０は、ビデオエンコーダ２０から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ３０のエントロピー復号ユニット８０は、量子化係数、動きベクトル、および他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット８０は、モード選択ユニット８１に動きベクトルと他のシンタックス要素とを転送する。ビデオデコーダ３０は、ビデオスライスレベルおよび／またはビデオブロックレベルでシンタックス要素を受信し得る。

[0135]ビデオスライスがイントラコード化（Ｉ）スライスとしてコード化されたとき、モード選択ユニット８１のイントラ予測ユニット８４は、シグナリングされたイントラ予測モードと、現在フレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロックのための予測データを生成し得る。ビデオピクチャがインターコード化（すなわち、Ｂ、またはＰ）スライスとしてコード化されるとき、モード選択ユニット８１の動き補償ユニット８２は、エントロピー復号ユニット８０から受信された動きベクトルおよび他のシンタックス要素に基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つから生成され得る。ビデオデコーダ３０は、参照ピクチャメモリ９２に記憶された参照ピクチャに基づいて、デフォルト構成技法または任意の他の技法を使用して参照ピクチャリストＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１を構成し得る。

[0136]動き補償ユニット８２は、動きベクトルと他のシンタックス要素とを解析することによって現在ビデオスライスのビデオブロックについての予測情報を判断し、予測情報を使用して、復号されている現在ビデオブロックのための予測ブロックを生成する。たとえば、動き補償ユニット８２は、ビデオスライスのビデオブロックをコード化するために使用される予測モード（たとえば、イントラまたはインター予測）と、インター予測スライスタイプ（たとえば、ＢスライスまたはＰスライス）と、スライスの参照ピクチャリストのうちの１つまたは複数についての構成情報と、スライスの各インター符号化ビデオブロックについての動きベクトルと、スライスの各インターコード化ビデオブロックについてのインター予測ステータスと、現在ビデオスライス中のビデオブロックを復号するための他の情報とを判断するために、受信されたシンタックス要素のいくつかを使用する。

[0137]動き補償ユニット８２はまた、補間フィルタに基づいて補間を実施し得る。動き補償ユニット８２は、ビデオブロックの符号化中にビデオ符号器２０によって使用される補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。この場合、動き補償ユニット８２は、受信されたシンタックス要素からビデオ符号器２０によって使用された補間フィルタを判断し、その補間フィルタを使用して予測ブロックを生成し得る。

[0138]逆量子化ユニット８６は、ビットストリーム中で与えられ、エントロピー復号ユニット８０によって復号された、量子化変換係数を逆量子化（inverse quantize）、（すなわち、逆量子化（de-quantize））する。逆量子化プロセスは、ビデオスライス中の各ビデオブロックについてビデオエンコーダ２０によって計算される量子化パラメータを使用して量子化の程度を判断し、同様に、適用すべき逆量子化の程度を判断することを含み得る。逆変換ユニット８８は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆ＤＣＴ、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。

[0139]動き補償ユニット８２が、動きベクトルおよび他のシンタックス要素に基づいて現在のビデオブロックのための予測ブロックを生成した後、ビデオデコーダ３０は、逆変換ユニット８８からの残差ブロックを動き補償ユニット８２によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器９０は、この加算演算を実行する１つまたは複数のコンポーネントを表す。所望される場合、ブロッキネスアーティファクトを除去するために、復号ブロックをフィルタリングするためのデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するか、またはさもなければビデオ品質を改善するために、（コーディングループ内またはコーディングループ後の）他のループフィルタも使用され得る。次いで、所与のフレームまたはピクチャ内の復号されたビデオブロックは、その後の動き補償に使用される参照ピクチャを記憶する参照ピクチャメモリ９２に記憶される。参照ピクチャメモリ９２はまた、図１のディスプレイデバイス３２などのディスプレイデバイス上に後で提示するための、復号されたビデオを記憶する。

[0140]図４は、本開示で説明する１つまたは複数の例示的な技法による例示的な動作を示すフローチャートである。ビデオコーダは、図４に示される例示的な技法を実装するように構成され得る。ビデオコーダの例は、ビデオエンコーダ２０またはビデオデコーダ３０を含む。

[0141]図４に示すように、ビデオコーダは、第１のピクチャに対する参照ピクチャリスト（たとえば、第１のピクチャに対するＲｅｆＰｉｃＬｉｓｔ０および／またはＲｅｆＰｉｃＬｉｓｔ１）を構築し得る（９４）。ビデオコーダは、参照ピクチャリスト内で識別された参照ピクチャに対する参照ステータス情報を記憶し得る（９６）。たとえば、ビデオコーダは、フラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］リストを記憶し得る。

[0142]いくつかの例では、ビデオコーダは、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別された参照ピクチャが、第１のピクチャがコーディングされるインスタンスにおいて、「長期参照に使用される」として指定されるか、または「長期参照に使用される」として指定されないかを示すｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］内の値を記憶する。いくつかの例では、ビデオコーダは、第１のピクチャのピクチャ順序カウント（ＰＯＣ）値が、ＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別された参照ピクチャのＰＯＣと同じであるか、またはＲｅｆＰｉｃＬｉｓｔＸ［ｉ］によって識別された参照ピクチャのＰＯＶ値と同じでないかを示すｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸ［ｉ］内の値を記憶する。

[0143]ビデオコーダは、第１のピクチャをコーディングし得る（１００）。いくつかの例では、ビデオコーダは、構築された参照ピクチャリスト内で識別された参照ピクチャに基づいて、第１のピクチャのビデオブロックに対するインター予測を実行し得る。第１のピクチャをコーディングした後、ビデオコーダは、第２の異なるピクチャをコーディングし得る。

[0144]たとえば、ビデオコーダは、第１のピクチャ内のビデオブロックの動きベクトルが第２のピクチャ内のビデオブロックの動きベクトルを導出するために使用されるかどうかを判断し得る（１０２）。一例として、ビデオコーダは、第１のピクチャ内のビデオブロックの動きベクトルが第２のピクチャ内のビデオブロックに対するＴＭＶＰを形成するべきであるかどうかを判断し得る。別の例として、ビデオコーダは、ＴＭＶＰが、第２のピクチャ内のビデオブロックに対する動きベクトルを導出するために使用されるべきであるかどうかを判断し得る。

[0145]第１のピクチャ内のビデオブロックの動きベクトルが、第２のピクチャ内のビデオブロックの動きベクトルを導出するために使用されるべきでない場合（１０２のノー）、ビデオコーダは次のブロックに進み、次に、予測されている現在ブロックを形成し得る（１０４）。次に、ビデオコーダは、第１のピクチャ内のビデオブロックの動きベクトルが第２のピクチャ内の現在ブロックの動きベクトルを導出するために使用されるかどうかを判断することを繰り返すことができる。

[0146]第１のピクチャ内のビデオブロックの動きベクトルが、第２のピクチャ内のビデオブロックの動きベクトルを導出するために使用されるべきである場合（１０２のイエス）、ビデオコーダは、第１のピクチャのビデオブロックの動きベクトルが参照する参照ピクチャを判断し得る（１０６）。たとえば、ビデオコーダは、動きベクトルの構築された参照ピクチャリストへの参照インデックスを判断し得る。ビデオコーダは、動きベクトルが参照した参照ピクチャを判断するために参照インデックスを使用し得る。

[0147]ビデオコーダは、記憶された参照ステータス情報に基づいて判断された参照ピクチャの参照ステータスを判断し得る（１０８）。たとえば、ビデオコーダは、第１のピクチャに対するフラグのｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍＸリストへの入力として第１のブロックの動きベクトルの参照インデックスを利用し得る。たとえば、第１のピクチャに対して構築された参照ピクチャリストが、ＲｅｆＰｉｃＬｉｓｔ０であると仮定する。同じく、ＲｅｆＰｉｃＬｉｓｔ０への参照インデックスが、ｒｅｆＩｄｘ０であると仮定する。この例では、ビデオコーダは、第１のピクチャに対してＲｅｆＰｉｃＬｉｓｔ０［ｒｅｆＩｄｘ０］によって識別された参照ピクチャの参照ステータスを判断するために、ｕｓｅｄＦｏｒＬｏｎｇＴｅｒｍ０［ｒｅｆＩｄｘ０］内に記憶された値を判断し得る。

[0148]ビデオコーダは、それ（the）に基づいて第２のピクチャのビデオブロックをコーディングし、参照ステータスを判断し得る（１１０）。このようにして、本開示で説明する技法は、ビデオエンコーダ２０およびビデオデコーダ３０が、ＨＥＶＣ規格の要件に準拠することを可能にし得る。しかしながら、上記で説明したように、本開示で説明する技法は、ＨＥＶＣ規格に限定されると見なされるべきではなく、他の規格ならびに任意のビデオコーディング技法に拡張可能である。

[0149]１つまたは複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアに実装される場合、機能は、１つもしくは複数の命令もしくはコードとしてコンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行することができる。コンピュータ可読媒体は、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含むデータ記憶媒体または通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、（１）非一時的である有形コンピュータ可読記憶媒体、あるいは（２）信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび／またはデータ構造を取り出すために１つまたは複数のコンピュータあるいは１つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。

[0150]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびブルーレイディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。

[0151]命令は、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）などの１つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、あるいは他の等価な集積回路またはディスクリート論理回路によって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明する技法の実装に好適な他の構造のいずれかを指す。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用のハードウェアおよび／またはソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素中に十分に実装され得る。

[0152]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）、またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび／またはファームウェアとともに、上記で説明した１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。

[0153]様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。

[0153]様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。
以下に、出願当初の特許請求の範囲を付記する。
[付記１]
ビデオデータをコーディングするための方法であって、
第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶することと、前記参照ステータス情報が、前記第１のピクチャがコーディングされるインスタンスにおける、前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示す、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、第２の異なるピクチャ内のビデオブロックをコーディングすることとを備える、方法。
[付記２]
前記第１のピクチャ内のビデオブロックと、前記第１のピクチャ内の前記ビデオブロックの動きベクトルとを判断することと、ここにおいて、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックに対する前記動きベクトルの参照インデックスに基づいて、前記第１のピクチャの前記１つまたは複数の参照ピクチャからの１つの参照ピクチャを指す、
前記第２のピクチャ内の前記ビデオブロックに対する動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるかどうかを判断することと、
前記第２のピクチャ内の前記ビデオブロックに対する前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるとき、前記記憶された参照ステータス情報に基づいて、前記第１のピクチャがコーディングされた前記インスタンスにおける前記参照ピクチャの参照ステータスを判断することとをさらに備え、
前記第２のピクチャ内の前記ビデオブロックをコーディングすることが、前記参照ステータスに基づいて前記第２のピクチャ内の前記ビデオブロックをコーディングすることを備える、付記１に記載の方法。
[付記３]
前記第１のピクチャに対して少なくとも１つの参照ピクチャリストを構築することをさらに備え、ここにおいて、前記少なくとも１つの参照ピクチャリストが、前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの少なくとも１つを識別し、
前記参照ステータス情報を記憶することが、前記少なくとも１つの参照ピクチャリスト内で識別された前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの前記少なくとも１つに対する参照ステータス情報を記憶することを備える、付記１に記載の方法。
[付記４]
前記第１のピクチャに対して少なくとも１つの参照ピクチャリストを構築することをさらに備え、ここにおいて、前記少なくとも１つの参照ピクチャリストが、前記第１のピクチャの前記１つまたは複数の参照ピクチャを識別し、
前記参照ステータス情報を記憶することが、前記少なくとも１つの参照ピクチャリスト内で識別された前記第１のピクチャの前記１つまたは複数の参照ピクチャのすべてに対する参照ステータス情報を記憶することを備える、付記１に記載の方法。
[付記５]
前記参照ステータス情報を記憶することが、前記参照ピクチャが長期参照に使用されるとして指定されるかまたは長期参照に使用されるとして指定されないかを示す前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャに対する値を記憶することを備える、付記１に記載の方法。
[付記６]
前記参照ステータス情報を記憶することが、前記参照ピクチャのピクチャ順序カウント（ＰＯＣ）値が前記第１のピクチャのＰＯＣ値と同じＰＯＣ値であるかまたは前記参照ピクチャの前記ＰＯＣ値が前記第１のピクチャの前記ＰＯＣ値と異なるかを示す前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャに対する値を記憶することを備える、付記１に記載の方法。
[付記７]
前記第１のピクチャがコーディングされた前記インスタンスにおける前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャの参照ステータスが、前記第２のピクチャがコーディングされるインスタンスにおける前記参照ピクチャの参照ステータスとは異なる、付記１に記載の方法。
[付記８]
前記第１のピクチャのビデオブロックの動きベクトルが、前記第１のピクチャの前記参照ステータスが前記第１のピクチャ内の前記ビデオブロックによって示される前記第１のピクチャの前記参照ピクチャの前記記憶された参照ステータスとは異なる場合、前記第２のピクチャの前記ビデオブロックの動きベクトルを予測するために使用されない、付記１に記載の方法。
[付記９]
前記第１のピクチャの前記ビデオブロックの前記動きベクトルが前記第２のピクチャの前記ビデオブロックの前記動きベクトルを予測するために使用されないことが、前記第２のピクチャの前記ビデオブロックの前記動きベクトルの予測のために拡張型動きベクトル予測（ＡＭＶＰ）候補リストまたはマージ候補リスト内の候補として、前記第１のピクチャの前記ビデオブロックの前記動きベクトルを追加しないことを備える、付記８に記載の方法。
[付記１０]
記憶することが、前記第１のピクチャの１つまたは複数の参照ピクチャの前記参照ステータス情報をビデオエンコーダを用いて記憶することを備え、前記参照ステータス情報が、前記第１のピクチャが符号化される前記インスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示し、
コーディングすることが、前記第１のピクチャが符号化された前記インスタンスにおける、前記第１のピクチャの前記１つまたは複数の参照ピクチャの前記記憶された参照ステータス情報に基づいて、前記第２のピクチャ内の前記ビデオブロックを前記ビデオエンコーダを用いて符号化することを備える、付記１に記載の方法。
[付記１１]
記憶することが、前記第１のピクチャの１つまたは複数の参照ピクチャの前記参照ステータス情報をビデオデコーダを用いて記憶することを備え、前記参照ステータス情報が、前記第１のピクチャが復号される前記インスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示し、
コーディングすることが、前記第１のピクチャが復号された前記インスタンスにおける、前記第１のピクチャの前記１つまたは複数の参照ピクチャの前記記憶された参照ステータス情報に基づいて、前記第２のピクチャ内の前記ビデオブロックを前記ビデオデコーダを用いて復号することを備える、付記１に記載の方法。
[付記１２]
ビデオデータをコーディングするための装置であって、
第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶することと、前記参照ステータス情報が、前記第１のピクチャがコーディングされるインスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示す、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、第２の異なるピクチャ内のビデオブロックをコーディングすることとを行うように構成されたビデオコーダを備える、装置。
[付記１３]
前記ビデオコーダが、
前記第１のピクチャ内のビデオブロックと、前記第１のピクチャ内の前記ビデオブロックの動きベクトルとを判断することと、ここにおいて、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックに対する前記動きベクトルの参照インデックスに基づいて、前記第１のピクチャの前記１つまたは複数の参照ピクチャからの１つの参照ピクチャを指す、
前記第２のピクチャ内の前記ビデオブロックに対する動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきかどうかを判断することと、
前記第２のピクチャ内の前記ビデオブロックに対する前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるとき、前記記憶された参照ステータス情報に基づいて、前記第１のピクチャがコーディングされた前記インスタンスにおける前記参照ピクチャの参照ステータスを判断することとを行うように構成され、
前記第２のピクチャ内の前記ビデオブロックをコーディングするために、前記ビデオコーダが、前記参照ステータスに基づいて前記第２のピクチャ内の前記ビデオブロックをコーディングするように構成される、付記１２に記載の装置。
[付記１４]
前記ビデオコーダが、
前記第１のピクチャに対して少なくとも１つの参照ピクチャリストを構築するように構成され、ここにおいて、前記少なくとも１つの参照ピクチャリストが、前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの少なくとも１つを識別し、
前記参照ステータス情報を記憶するために、前記ビデオコーダが、前記少なくとも１つの参照ピクチャリスト内で識別された前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの前記少なくとも１つに対する参照ステータス情報を記憶するように構成される、付記１２に記載の装置。
[付記１５]
前記ビデオコーダが、
前記第１のピクチャに対して少なくとも１つの参照ピクチャリストを構築するように構成され、ここにおいて、前記少なくとも１つの参照ピクチャリストが、前記第１のピクチャの前記１つまたは複数の参照ピクチャを識別し、
前記参照ステータス情報を記憶するために、前記ビデオコーダが、前記少なくとも１つの参照ピクチャリスト内で識別された前記第１のピクチャの前記１つまたは複数の参照ピクチャのすべてに対する参照ステータス情報を記憶するように構成される、付記１２に記載の装置。
[付記１６]
前記参照ステータス情報を記憶するために、前記ビデオコーダが、前記参照ピクチャが長期参照に使用されるとして指定されるかまたは長期参照に使用されるとして指定されないかを示す前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャに対する値を記憶するように構成される、付記１２に記載の装置。
[付記１７]
前記参照ステータス情報を記憶するために、前記ビデオコーダが、前記参照ピクチャのピクチャ順序カウント（ＰＯＣ）値が前記第１のピクチャのＰＯＣ値と同じＰＯＣ値であるかまたは前記参照ピクチャの前記ＰＯＣ値が前記第１のピクチャの前記ＰＯＣ値と異なるかを示す前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャに対する値を記憶するように構成される、付記１２に記載の装置。
[付記１８]
前記第１のピクチャがコーディングされた前記インスタンスにおける前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャの参照ステータスが、前記第２のピクチャがコーディングされるインスタンスにおける前記参照ピクチャの参照ステータスとは異なる、付記１２に記載の装置。
[付記１９]
前記第１のピクチャのビデオブロックの動きベクトルが、前記第１のピクチャの前記参照ステータスが前記第１のピクチャ内の前記ビデオブロックによって示される前記第１のピクチャの前記参照ピクチャの前記記憶された参照ステータスとは異なる場合、前記第２のピクチャの前記ビデオブロックの動きベクトルを予測するために使用されない、付記１２に記載の装置。
[付記２０]
前記第１のピクチャの前記ビデオブロックの前記動きベクトルが、前記第２のピクチャの前記ビデオブロックの前記動きベクトルを予測するために使用されないことが、前記ビデオコーダが、前記第２のピクチャの前記ビデオブロックの前記動きベクトルの予測のために、拡張型動きベクトル予測（ＡＭＶＰ）候補リストまたはマージ候補リスト内の候補として、前記第１のピクチャの前記ビデオブロックの前記動きベクトルを追加しないことを備える、付記１９に記載の装置。
[付記２１]
前記ビデオコーダがビデオデコーダを備え、前記ビデオデコーダが、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの前記参照ステータス情報を記憶することと、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、前記第２の異なるピクチャ内の前記ビデオブロックを復号することとを行うように構成される、付記１２に記載の装置。
[付記２２]
前記ビデオコーダがビデオエンコーダを備え、前記ビデオエンコーダが、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの前記参照ステータス情報を記憶することと、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、前記第２の異なるピクチャ内の前記ビデオブロックを符号化することとを行うように構成される、付記１２に記載の装置。
[付記２３]
前記装置が、
ワイヤレス通信デバイスと、
マイクロプロセッサと、
集積回路とのうちの１つを備える、付記１２に記載の装置。
[付記２４]
ビデオデータをコーディングするための装置であって、
第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶するための手段と、前記参照ステータス情報が、前記第１のピクチャがコーディングされるインスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示す、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、第２の異なるピクチャ内のビデオブロックをコーディングするための手段とを備える、装置。
[付記２５]
前記第１のピクチャ内のビデオブロックと、前記第１のピクチャ内の前記ビデオブロックの動きベクトルとを判断するための手段と、ここにおいて、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックに対する前記動きベクトルの参照インデックスに基づいて、前記第１のピクチャの前記１つまたは複数の参照ピクチャからの１つの参照ピクチャを指す、
前記第２のピクチャ内の前記ビデオブロックに対する動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるかどうかを判断するための手段と、
前記第２のピクチャ内の前記ビデオブロックに対する前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるとき、前記記憶された参照ステータス情報に基づいて、前記第１のピクチャがコーディングされた前記インスタンスにおける前記参照ピクチャの参照ステータスを判断するための手段とをさらに備え、
前記第２のピクチャ内の前記ビデオブロックをコーディングするための手段が、前記参照ステータスに基づいて前記第２のピクチャ内の前記ビデオブロックをコーディングするための手段を備える、付記２４に記載の装置。
[付記２６]
命令を記憶されたコンピュータ可読記憶媒体であって、前記命令が、実行されると１つまたは複数のプロセッサに、
第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶することと、前記参照ステータス情報が、前記第１のピクチャがコーディングされるインスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示す、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、第２の異なるピクチャ内のビデオブロックをコーディングすることとを行わせる、コンピュータ可読記憶媒体。
[付記２７]
前記１つまたは複数のプロセッサに、
前記第１のピクチャ内のビデオブロックと、前記第１のピクチャ内の前記ビデオブロックの動きベクトルとを判断することと、ここにおいて、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックに対する前記動きベクトルの参照インデックスに基づいて、前記第１のピクチャの前記１つまたは複数の参照ピクチャからの１つの参照ピクチャを指す、
前記第２のピクチャ内の前記ビデオブロックに対する動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるかどうかを判断することと、
前記第２のピクチャ内の前記ビデオブロックに対する前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるとき、前記記憶された参照ステータス情報に基づいて、前記第１のピクチャがコーディングされた前記インスタンスにおける前記参照ピクチャの参照ステータスを判断することとを行わせる命令をさらに備え、
前記１つまたは複数のプロセッサに前記第２のピクチャ内の前記ビデオブロックをコーディングさせる前記命令が、前記１つまたは複数のプロセッサに、前記参照ステータスに基づいて前記第２のピクチャ内の前記ビデオブロックをコーディングさせる命令を備える、付記２６に記載のコンピュータ可読記憶媒体。

Claims

ビデオデータをコーディングするための方法であって、
第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶することと、前記参照ステータス情報が、前記第１のピクチャがコーディングされるインスタンスにおける、前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示す、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、第２の異なるピクチャ内のビデオブロックをコーディングすることとを備える、方法。
前記第１のピクチャ内のビデオブロックと、前記第１のピクチャ内の前記ビデオブロックの動きベクトルとを判断することと、ここにおいて、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックに対する前記動きベクトルの参照インデックスに基づいて、前記第１のピクチャの前記１つまたは複数の参照ピクチャからの１つの参照ピクチャを指す、
前記第２のピクチャ内の前記ビデオブロックに対する動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるかどうかを判断することと、
前記第２のピクチャ内の前記ビデオブロックに対する前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるとき、前記記憶された参照ステータス情報に基づいて、前記第１のピクチャがコーディングされた前記インスタンスにおける前記参照ピクチャの参照ステータスを判断することとをさらに備え、
前記第２のピクチャ内の前記ビデオブロックをコーディングすることが、前記参照ステータスに基づいて前記第２のピクチャ内の前記ビデオブロックをコーディングすることを備える、請求項１に記載の方法。
前記第１のピクチャに対して少なくとも１つの参照ピクチャリストを構築することをさらに備え、ここにおいて、前記少なくとも１つの参照ピクチャリストが、前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの少なくとも１つを識別し、
前記参照ステータス情報を記憶することが、前記少なくとも１つの参照ピクチャリスト内で識別された前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの前記少なくとも１つに対する参照ステータス情報を記憶することを備える、請求項１に記載の方法。
前記第１のピクチャに対して少なくとも１つの参照ピクチャリストを構築することをさらに備え、ここにおいて、前記少なくとも１つの参照ピクチャリストが、前記第１のピクチャの前記１つまたは複数の参照ピクチャを識別し、
前記参照ステータス情報を記憶することが、前記少なくとも１つの参照ピクチャリスト内で識別された前記第１のピクチャの前記１つまたは複数の参照ピクチャのすべてに対する参照ステータス情報を記憶することを備える、請求項１に記載の方法。
前記参照ステータス情報を記憶することが、前記参照ピクチャが長期参照に使用されるとして指定されるかまたは長期参照に使用されるとして指定されないかを示す前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャに対する値を記憶することを備える、請求項１に記載の方法。
前記参照ステータス情報を記憶することが、前記参照ピクチャのピクチャ順序カウント（ＰＯＣ）値が前記第１のピクチャのＰＯＣ値と同じＰＯＣ値であるかまたは前記参照ピクチャの前記ＰＯＣ値が前記第１のピクチャの前記ＰＯＣ値と異なるかを示す前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャに対する値を記憶することを備える、請求項１に記載の方法。
前記第１のピクチャがコーディングされた前記インスタンスにおける前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャの参照ステータスが、前記第２のピクチャがコーディングされるインスタンスにおける前記参照ピクチャの参照ステータスとは異なる、請求項１に記載の方法。
前記第１のピクチャのビデオブロックの動きベクトルが、前記第１のピクチャの前記参照ステータスが前記第１のピクチャ内の前記ビデオブロックによって示される前記第１のピクチャの前記参照ピクチャの前記記憶された参照ステータスとは異なる場合、前記第２のピクチャの前記ビデオブロックの動きベクトルを予測するために使用されない、請求項１に記載の方法。
前記第１のピクチャの前記ビデオブロックの前記動きベクトルが前記第２のピクチャの前記ビデオブロックの前記動きベクトルを予測するために使用されないことが、前記第２のピクチャの前記ビデオブロックの前記動きベクトルの予測のために拡張型動きベクトル予測（ＡＭＶＰ）候補リストまたはマージ候補リスト内の候補として、前記第１のピクチャの前記ビデオブロックの前記動きベクトルを追加しないことを備える、請求項８に記載の方法。
記憶することが、前記第１のピクチャの１つまたは複数の参照ピクチャの前記参照ステータス情報をビデオエンコーダを用いて記憶することを備え、前記参照ステータス情報が、前記第１のピクチャが符号化される前記インスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示し、
コーディングすることが、前記第１のピクチャが符号化された前記インスタンスにおける、前記第１のピクチャの前記１つまたは複数の参照ピクチャの前記記憶された参照ステータス情報に基づいて、前記第２のピクチャ内の前記ビデオブロックを前記ビデオエンコーダを用いて符号化することを備える、請求項１に記載の方法。
記憶することが、前記第１のピクチャの１つまたは複数の参照ピクチャの前記参照ステータス情報をビデオデコーダを用いて記憶することを備え、前記参照ステータス情報が、前記第１のピクチャが復号される前記インスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示し、
コーディングすることが、前記第１のピクチャが復号された前記インスタンスにおける、前記第１のピクチャの前記１つまたは複数の参照ピクチャの前記記憶された参照ステータス情報に基づいて、前記第２のピクチャ内の前記ビデオブロックを前記ビデオデコーダを用いて復号することを備える、請求項１に記載の方法。
ビデオデータをコーディングするための装置であって、
第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶することと、前記参照ステータス情報が、前記第１のピクチャがコーディングされるインスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示す、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、第２の異なるピクチャ内のビデオブロックをコーディングすることとを行うように構成されたビデオコーダを備える、装置。
前記ビデオコーダが、
前記第１のピクチャ内のビデオブロックと、前記第１のピクチャ内の前記ビデオブロックの動きベクトルとを判断することと、ここにおいて、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックに対する前記動きベクトルの参照インデックスに基づいて、前記第１のピクチャの前記１つまたは複数の参照ピクチャからの１つの参照ピクチャを指す、
前記第２のピクチャ内の前記ビデオブロックに対する動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきかどうかを判断することと、
前記第２のピクチャ内の前記ビデオブロックに対する前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるとき、前記記憶された参照ステータス情報に基づいて、前記第１のピクチャがコーディングされた前記インスタンスにおける前記参照ピクチャの参照ステータスを判断することとを行うように構成され、
前記第２のピクチャ内の前記ビデオブロックをコーディングするために、前記ビデオコーダが、前記参照ステータスに基づいて前記第２のピクチャ内の前記ビデオブロックをコーディングするように構成される、請求項１２に記載の装置。
前記ビデオコーダが、
前記第１のピクチャに対して少なくとも１つの参照ピクチャリストを構築するように構成され、ここにおいて、前記少なくとも１つの参照ピクチャリストが、前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの少なくとも１つを識別し、
前記参照ステータス情報を記憶するために、前記ビデオコーダが、前記少なくとも１つの参照ピクチャリスト内で識別された前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの前記少なくとも１つに対する参照ステータス情報を記憶するように構成される、請求項１２に記載の装置。
前記ビデオコーダが、
前記第１のピクチャに対して少なくとも１つの参照ピクチャリストを構築するように構成され、ここにおいて、前記少なくとも１つの参照ピクチャリストが、前記第１のピクチャの前記１つまたは複数の参照ピクチャを識別し、
前記参照ステータス情報を記憶するために、前記ビデオコーダが、前記少なくとも１つの参照ピクチャリスト内で識別された前記第１のピクチャの前記１つまたは複数の参照ピクチャのすべてに対する参照ステータス情報を記憶するように構成される、請求項１２に記載の装置。
前記参照ステータス情報を記憶するために、前記ビデオコーダが、前記参照ピクチャが長期参照に使用されるとして指定されるかまたは長期参照に使用されるとして指定されないかを示す前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャに対する値を記憶するように構成される、請求項１２に記載の装置。
前記参照ステータス情報を記憶するために、前記ビデオコーダが、前記参照ピクチャのピクチャ順序カウント（ＰＯＣ）値が前記第１のピクチャのＰＯＣ値と同じＰＯＣ値であるかまたは前記参照ピクチャの前記ＰＯＣ値が前記第１のピクチャの前記ＰＯＣ値と異なるかを示す前記第１のピクチャの前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャに対する値を記憶するように構成される、請求項１２に記載の装置。
前記第１のピクチャがコーディングされた前記インスタンスにおける前記１つまたは複数の参照ピクチャのうちの１つの参照ピクチャの参照ステータスが、前記第２のピクチャがコーディングされるインスタンスにおける前記参照ピクチャの参照ステータスとは異なる、請求項１２に記載の装置。
前記第１のピクチャのビデオブロックの動きベクトルが、前記第１のピクチャの前記参照ステータスが前記第１のピクチャ内の前記ビデオブロックによって示される前記第１のピクチャの前記参照ピクチャの前記記憶された参照ステータスとは異なる場合、前記第２のピクチャの前記ビデオブロックの動きベクトルを予測するために使用されない、請求項１２に記載の装置。
前記第１のピクチャの前記ビデオブロックの前記動きベクトルが、前記第２のピクチャの前記ビデオブロックの前記動きベクトルを予測するために使用されないことが、前記ビデオコーダが、前記第２のピクチャの前記ビデオブロックの前記動きベクトルの予測のために、拡張型動きベクトル予測（ＡＭＶＰ）候補リストまたはマージ候補リスト内の候補として、前記第１のピクチャの前記ビデオブロックの前記動きベクトルを追加しないことを備える、請求項１９に記載の装置。
前記ビデオコーダがビデオデコーダを備え、前記ビデオデコーダが、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの前記参照ステータス情報を記憶することと、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、前記第２の異なるピクチャ内の前記ビデオブロックを復号することとを行うように構成される、請求項１２に記載の装置。
前記ビデオコーダがビデオエンコーダを備え、前記ビデオエンコーダが、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの前記参照ステータス情報を記憶することと、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、前記第２の異なるピクチャ内の前記ビデオブロックを符号化することとを行うように構成される、請求項１２に記載の装置。
前記装置が、
ワイヤレス通信デバイスと、
マイクロプロセッサと、
集積回路とのうちの１つを備える、請求項１２に記載の装置。
ビデオデータをコーディングするための装置であって、
第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶するための手段と、前記参照ステータス情報が、前記第１のピクチャがコーディングされるインスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示す、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、第２の異なるピクチャ内のビデオブロックをコーディングするための手段とを備える、装置。
前記第１のピクチャ内のビデオブロックと、前記第１のピクチャ内の前記ビデオブロックの動きベクトルとを判断するための手段と、ここにおいて、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックに対する前記動きベクトルの参照インデックスに基づいて、前記第１のピクチャの前記１つまたは複数の参照ピクチャからの１つの参照ピクチャを指す、
前記第２のピクチャ内の前記ビデオブロックに対する動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるかどうかを判断するための手段と、
前記第２のピクチャ内の前記ビデオブロックに対する前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるとき、前記記憶された参照ステータス情報に基づいて、前記第１のピクチャがコーディングされた前記インスタンスにおける前記参照ピクチャの参照ステータスを判断するための手段とをさらに備え、
前記第２のピクチャ内の前記ビデオブロックをコーディングするための手段が、前記参照ステータスに基づいて前記第２のピクチャ内の前記ビデオブロックをコーディングするための手段を備える、請求項２４に記載の装置。
命令を記憶されたコンピュータ可読記憶媒体であって、前記命令が、実行されると１つまたは複数のプロセッサに、
第１のピクチャの１つまたは複数の参照ピクチャの参照ステータス情報を記憶することと、前記参照ステータス情報が、前記第１のピクチャがコーディングされるインスタンスにおける前記１つまたは複数の参照ピクチャの前記参照ステータス情報を示す、
前記第１のピクチャの前記１つまたは複数の参照ピクチャの、前記第１のピクチャがコーディングされた前記インスタンスにおける前記記憶された参照ステータス情報に基づいて、第２の異なるピクチャ内のビデオブロックをコーディングすることとを行わせる、コンピュータ可読記憶媒体。
前記１つまたは複数のプロセッサに、
前記第１のピクチャ内のビデオブロックと、前記第１のピクチャ内の前記ビデオブロックの動きベクトルとを判断することと、ここにおいて、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックに対する前記動きベクトルの参照インデックスに基づいて、前記第１のピクチャの前記１つまたは複数の参照ピクチャからの１つの参照ピクチャを指す、
前記第２のピクチャ内の前記ビデオブロックに対する動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるかどうかを判断することと、
前記第２のピクチャ内の前記ビデオブロックに対する前記動きベクトルが、前記第１のピクチャ内の前記ビデオブロックの前記動きベクトルから導出されるべきであるとき、前記記憶された参照ステータス情報に基づいて、前記第１のピクチャがコーディングされた前記インスタンスにおける前記参照ピクチャの参照ステータスを判断することとを行わせる命令をさらに備え、
前記１つまたは複数のプロセッサに前記第２のピクチャ内の前記ビデオブロックをコーディングさせる前記命令が、前記１つまたは複数のプロセッサに、前記参照ステータスに基づいて前記第２のピクチャ内の前記ビデオブロックをコーディングさせる命令を備える、請求項２６に記載のコンピュータ可読記憶媒体。