JP7658922B2

JP7658922B2 - 参照ピクチャリスト内の参照ピクチャの種類

Info

Publication number: JP7658922B2
Application number: JP2021577989A
Authority: JP
Inventors: ワン，イエクォイ; ヘンドリー，フヌ
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2019-07-03
Filing date: 2020-07-02
Publication date: 2025-04-08
Anticipated expiration: 2040-07-02
Also published as: WO2021003447A1; BR112021026826A2; CN114208173A; EP3977727A1; EP3977727A4; JP2023129442A; US12323578B2; JP2022538889A; JP7631655B2; WO2021003446A1; US20220166970A1; KR20220024879A

Description

関連出願の相互参照
本特許出願は、Ｙｅ－ＫｕｉＷａｎｇらにより２０１９年７月３日に出願された、「参照ピクチャリスト内の参照ピクチャーの種類」と題する米国特許仮出願第６２／８７０５８８号の利益を主張し、参照により本願に組み込まれる。

本開示は概してビデオコーディングにおける参照ピクチャ管理に関し、具体的には参照ピクチャリストが特定の種類の参照ピクチャを含むことから制限することに関する。

比較的短い映像を描写するのに必要とされるビデオデータの量は相当な量であり、データが帯域幅容量が限られた通信ネットワークに亘ってストリーミングされるか又はさもなければ通信される場合に困難が生じ得る。そのため、ビデオデータは、現代の電気通信ネットワークに亘って通信される前に圧縮されるのが一般的である。ビデオが記憶装置に記憶される場合には、メモリリソースが限られ得るあるためビデオのサイズも問題となり得る。ビデオ圧縮装置は、多くの場合、伝送又は記憶の前にビデオデータをコード化するためにソースでソフトウェア及び／又はハードウェアが用いられるため、デジタルビデオ画像を表すのに必要なデータ量を減少される。次いで、圧縮されたデータは、ビデオデータをデコードするビデオ解凍装置によって宛先で受信される。ネットワーク資源が限られており、より高いビデオ品質の要求が絶えず増加しているため、画像品質にほとんど犠牲を払わずに圧縮比を改善する改良された圧縮及び解凍技術が望ましい。

第１の態様は、ビデオデコーダによって実施されるデコーディングの方法に関する。本方法は、前記ビデオデコーダにより、現在のピクチャを含むコード化されたビデオビットストリームを受信することと、前記ビデオデコーダにより、前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることと、前記ビデオデコーダにより、前記現在のピクチャがクリーンランダムアクセス（ＣＲＡ）ピクチャであると判定することであって、該ＣＲＡピクチャは、出力順序又はデコーディング順序において、該デコーディング順序で先行する任意のイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行する、前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとすることを表す、ことと、前記ビデオデコーダにより、前記第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの一方又は両方に基づいて、前記ＣＲＡピクチャの各スライスをデコードすることと、を含む。

本方法は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する技術を提供する。このように参照ピクチャリストを制限することにより、コーディングエラー及び／又はコーディングに必要な帯域幅及びネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記先行するＩＲＡＰピクチャは、前記出力順序又は前記デコーディング順序において前記ＣＲＡピクチャに先行することを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記先行するＩＲＡＰピクチャは、前記ＣＲＡピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始することを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記ＣＲＡピクチャは、イントラ予測を用いてデコードされることを提供する。

任意で、前述の態様のいずれかにおいて、アスペクトの別の実装は、前記デコーディング順序において前記ＣＲＡピクチャに後続する１つ以上のピクチャは、インター予測を用いてデコードされることを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記第１の参照ピクチャリストはＲｅｆＰｉｃＬｉｓｔ［０］に指定され、前記第２の参照ピクチャリストはＲｅｆＰｉｃＬｉｓｔ［１］に指定されていることを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記ビデオデコーダのディスプレイ上に、前記ＣＲＡピクチャに基づいて生成された画像を表示することをさらに含むことを提供する。

第２の態様は、ビデオエンコーダにより実施されるエンコーディングの方法に関する。当該方法は、現在のピクチャがクリーンランダムアクセス（ＣＲＡ）ピクチャを含む場合に、前記ビデオエンコーダにより、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、出力順序又はデコーディング順序において、該デコーディング順序で先行する任意のイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行する、該第１の参照ピクチャリスト又は該第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとする、ことと、前記ビデオエンコーダにより、前記ＣＲＡピクチャと、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストの一方又は両方をビデオビットストリームにエンコードすることと、前記ビデオエンコーダにより、ビデオデコーダへの伝送が保留されている前記ビデオビットストリームを記憶することと、を含む。

本方法は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する技術を提供する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記ＣＲＡピクチャは、イントラ予測を用いてエンコードされることを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記デコーディング順序において前記ＣＲＡピクチャに後続する１つ以上のピクチャを、インター予測を用いてエンコードすることをさらに含むことを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記ビデオビットストリームを前記ビデオデコーダに向けて送信することをさらに含むことを提供する。

第３の態様はデコーディング装置に関する。デコーディング装置は、現在のピクチャを含むコード化されたビデオビットストリームを受信するように構成された受信器と、前記受信器に連結されたメモリであって、該メモリは命令を記憶する、メモリと、前記メモリに連結されたプロセッサであって、該プロセッサは前記命令を実行して、当該デコーディング装置に、前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることと、前記現在のピクチャがクリーンランダムアクセス（ＣＲＡ）ピクチャであると判定することであって、該ＣＲＡピクチャは、出力順序又はデコーディング順序において、該デコーディング順序で先行する任意のイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行する、前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとすることを表す、ことと、前記第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの一方又は両方に基づいて、前記ＣＲＡピクチャの各スライスをデコードすることと、を行わせるように構成されている、プロセッサと、を含む。

デコーディング装置は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する技術を提供する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記先行するＩＲＡＰピクチャは、前記ＣＲＡピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始し、前記ＣＲＡピクチャはイントラ予測を用いてデコードされ、前記デコーディング順序において前記ＣＲＡピクチャに後続する１つ以上のピクチャはインター予測を用いてデコードされることを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、デコードされた前記ＣＲＡピクチャに基づいて、画像を表示するように構成されたディスプレイをさらに含むことを提供する。

第４の態様はエンコーディング装置に関する。エンコーディング装置は命令を含むメモリと、
前記メモリに連結されたプロセッサであって、該プロセッサは、前記命令を実施して、当該エンコーディング装置に、現在のピクチャがクリーンランダムアクセス（ＣＲＡ）ピクチャを含む場合に、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、出力順序又はデコーディング順序において、該デコーディング順序で先行する任意のイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行する、該第１の参照ピクチャリスト又は該第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとする、ことと、前記ＣＲＡピクチャと、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストの一方又は両方をビデオビットストリームにエンコードすることと、を行わせるように構成されている、プロセッサと、
前記プロセッサに連結された送信器であって、該送信器はビデオデコーダに向けて前記ビデオビットストリームを送信するように構成されている、送信器と、を含む。

エンコーディング装置は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する技術を提供する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記先行するＩＲＡＰピクチャは、前記出力順序又は前記デコーディング順序において前記ＣＲＡピクチャに先行し、前記ＣＲＡピクチャは、イントラ予測を用いてエンコードされ、前記デコーディング順序において前記ＣＲＡピクチャに後続する１つ以上のピクチャは、インター予測を用いてデコードされることを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記メモリは、前記送信器が前記ビデオデコーダに向けて前記ビットストリームを送信する前に、前記ビデオビットストリームを記憶することを提供する。

第５の態様は、ビデオデコーダにより実施されるデコーディングの方法に関する。当該方法は、前記ビデオデコーダにより、現在のピクチャを含むコード化されたビデオビットストリームを受信することと、前記ビデオデコーダにより、前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることと、前記ビデオデコーダにより、現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャであると判定することであって、該トレーリングピクチャは、前記現在のピクチャに関連する前記ＩＲＡＰピクチャのための利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成された前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとすることを表す、ことと、前記ビデオデコーダにより、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストの一方又は両方に基づいて、前記トレーリングピクチャの各スライスをデコードすることと、を含む。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、利用不能な参照画像を生成するための前記デコーディングプロセスは、ＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいクリーンランダムアクセス（ＣＲＡ）ピクチャ又はＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しい漸進的デコーディングリフレッシュ（ＧＤＲ）ピクチャについて、コード化ピクチャ毎に１度呼び出されることを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記同じＩＲＡＰピクチャは、前記トレーリングピクチャ及び前記１つ以上のリーディングピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始することを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記同じＩＲＡＰピクチャはイントラ予測を用いてデコードされ、前記トレーリングピクチャ及び前記１つ以上のリーディングピクチャは、インター予測を用いてデコードされることを提供する。

第６の態様は、ビデオエンコーダにより実施されるエンコーディングの方法に関する。当該方法は、前記ビデオエンコーダにより、現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャである場合に、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、前記現在のピクチャに関連する前記ＩＲＡＰピクチャのための利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成された前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとする、ことと、前記ビデオエンコーダにより、前記トレーリングピクチャ及び前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストの一方又は両方をビデオビットストリームにエンコードすることと、前記ビデオエンコーダにより、ビデオデコーダに向けた伝送が保留されている前記ビデオビットストリームを記憶することと、を含む。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、利用不能な参照画像を生成するための前記デコーディングプロセスは、ＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいクリーンランダムアクセス（ＣＲＡ）ピクチャ又はＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しい漸進的デコーディングリフレッシュ（ＧＤＲ）ピクチャについて、コード化されたピクチャ毎に１度呼び出されることを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記同じＩＲＡＰピクチャは、イントラ予測を用いてデコードされ、前記トレーリングピクチャ及び前記１つ以上のリーディングピクチャは、インター予測を用いてデコードされることを提供する。

第７の態様は、デコーディング装置に関する。デコーディング装置は、現在のピクチャを含むコード化されたビデオビットストリームを受信するように構成された受信器と、前記受信器に連結されたメモリであって、該メモリは命令を記憶する、メモリと、前記メモリに連結されたプロセッサであって、該プロセッサは前記命令を実行して、前記デコーディング装置に、前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることと、前記現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャであると判定することであって、該トレーリングピクチャは、前記現在のピクチャに関連する前記ＩＲＡＰピクチャのための利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成された前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとすることを表す、ことと、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストの一方又は両方に基づいて、前記トレーリングピクチャの各スライスをデコードすることと、を行わせるように構成されている、プロセッサと、を含む。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、利用不能な参照ピクチャを生成するための前記デコーディングプロセスは、ＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいクリーンランダムアクセス（ＣＲＡ）ピクチャ又はＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しい漸進的デコーディングリフレッシュ（ＧＤＲ）ピクチャについて、コード化ピクチャ毎に１度呼び出されることを提供する。

任意で、先行する態様のいずれかにおいて、前記同じＩＲＡＰピクチャはイントラ予測を用いてデコードされ、前記トレーリングピクチャ及び前記１つ以上のリーディングピクチャは、インター予測を用いてデコードされていることを提供する。

第８の態様は、エンコーディング装置に関する。エンコーディング装置は、命令を含むメモリと、前記メモリに連結されたプロセッサであって、該プロセッサは前記命令を実施して当該エンコーディング装置に、現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャである場合に、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、前記現在のピクチャに関連する前記ＩＲＡＰピクチャのための利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成された前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとする、ことと、前記トレーリングピクチャ及び前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストの一方又は両方をビデオビットストリームにエンコードすることと、を行わせるように構成されている、プロセッサと、前記プロセッサに連結された送信器であって、該送信器は、ビデオデコーダに向けて前記ビデオビットストリームを送信するように構成されている、送信器と、を含む。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記同じＩＲＡＰピクチャは、イントラ予測を用いて前記ビデオビットストリームにエンコードされ、前記トレーリングピクチャ及び前記１つ以上のトレーリングピクチャは、インター予測を用いてエンコードされることを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記ビデオデコーダに向けて前記送信器が前記ビットストリームを送信する前に前記メモリは前記ビデオビットストリームを記憶することを提供する。

第９の態様は、ビデオデコーダにより実施されるデコーディングの方法に関する。当該方法は、前記ビデオデコーダにより、現在のピクチャを含むコード化されたビデオビットストリームを受信することと、前記ビデオデコーダにより、前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることと、前記ビデオデコーダにより、前記現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャであると判定することであって、該トレーリングピクチャは、前記出力順序又は前記デコーディング順序において前記同じＩＲＡＰピクチャに先行する、前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとすることを表す、ことと、前記ビデオデコーダにより、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストの一方又は両方に基づいて、前記トレーリングピクチャの各スライスをデコードすることと、を含む。

デコーディングの方法は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する技術を提供する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

第１０の態様は、ビデオエンコーダにより実施されるエンコーディングの方法に関する。当該方法は、現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャである場合に、前記ビデオエンコーダにより、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、前記出力順序又は前記デコーディング順序において前記同じＩＲＡＰピクチャに先行する、前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとする、ことと、前記ビデオエンコーダにより、前記トレーリングピクチャと、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストのうちの一方又は両方とを前記ビデオビットストリームにエンコードすることと、前記ビデオエンコーダにより、ビデオデコーダに向けた伝送が保留されている前記ビデオビットストリームを記憶することと、を含む。

エンコーディングの方法は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する技術を提供する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

任意で、先行する態様のいずれかにおいて、前記同じＩＲＡＰピクチャは、イントラ予測を用いて前記ビデオビットストリームにエンコードされ、前記トレーリングピクチャ及び前記１つ以上のリーディングピクチャは、インター予測を用いてエンコードされていることを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記ビデオデコーダに向けて前記ビデオビットストリームを送信することをさらに含むことを提供する。

第１１の態様は、デコーディング装置に関する。デコーディング装置は、現在のピクチャを含むコード化されたビデオビットストリームを受信するように構成された受信器と、前記受信器に連結されたメモリであって、該メモリは命令を記憶する、メモリと、前記メモリに連結されたプロセッサであって、該プロセッサは前記命令を実行して、前記デコーディング装置に、前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることと、前記現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャであると判定することであって、該トレーリングピクチャは、前記出力順序又は前記デコーディング順序において前記同じＩＲＡＰピクチャに先行する、前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとすることを表す、ことと、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストの一方又は両方に基づいて、前記トレーリングピクチャの各スライスをデコードすることと、を行わせるように構成されている、プロセッサと、を含む。

第１２の態様は、エンコーディング装置に関する。エンコーディング装置は、命令を含むメモリと、前記メモリに連結されたプロセッサであって、該プロセッサは前記命令を実施して、前記エンコーディング装置に、現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャである場合に、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、前記出力順序又は前記デコーディング順序において前記同じＩＲＡＰピクチャに先行する、前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとする、ことと、前記トレーリングピクチャと、前記第１の参照ピクチャ及び前記第２の参照ピクチャのうちの一方又は両方とをビデオビットストリームにエンコードすることと、を行わせるように構成されている、プロセッサと、前記プロセッサに連結された送信器であって、ビデオデコーダに向けて前記ビデオビットストリームを送信するように構成されている、送信器と、を含む。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、同じ前記同じＩＲＡＰピクチャは、前記トレーリングピクチャ及び前記１つ以上のリーディングピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始することを提供する。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、前記同じＩＲＡＰピクチャは、イントラ予測を用いて前記ビデオビットストリームにエンコードされ、前記トレーリングピクチャ及び前記１つ以上のリーディングピクチャは、インター予測を用いてエンコードされることを提供する。

第１３の態様は、デコーディングの方法に冠する。当該方法は、前記ビデオデコーダにより、現在のピクチャを含むコード化されたビデオビットストリームを受信することと、前記ビデオデコーダにより、前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることと、前記ビデオデコーダにより、前記現在のピクチャがランダムアクセスデコーダブルリーディング（ＲＡＤＬ）ピクチャであると判定することであって、該ＲＡＤＬピクチャは、ランダムアクセススキップリーディング（ＲＡＳＬ）ピクチャ、利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成されるピクチャ、及びデコーディング順序において関連するイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行するピクチャ、のうちのいずれかであるアクティブエントリが前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内に存在しないものとすることを表す、ことと、前記ビデオデコーダにより、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストのうちの一方又は両方に基づいて前記ＲＡＤＬピクチャの各スライスをデコードすることと、を含む。

任意で、先行する態様のいずれかにおいて、本態様の別の実施は、利用不能な参照ピクチャを生成するための前記デコーディングプロセスは、ＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいクリーンランダムアクセス（ＣＲＡ）ピクチャ又はＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しい漸進的デコーディングリフレッシュ（ＧＤＲ）ピクチャについて、コード化されたピクチャ毎に１度呼び出されることを提供する。

第１４の態様は、エンコーディングの方法に冠する。当該方法は、現在のピクチャがランダムアクセスデコーダブルリーディング（ＲＡＤＬ）ピクチャの場合に、前記ビデオエンコーダにより、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、ランダムアクセススキップリーディング（ＲＡＳＬ）ピクチャ、利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成されるピクチャ、及びデコーディング順序において関連するイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行するピクチャ、のうちのいずれかであるアクティブエントリが前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内に存在しないものとする、ことと、前記ビデオエンコーダにより、前記ＲＡＤＬピクチャと、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストのうちの一方又は両方とをビデオビットストリームにエンコードすることと、前記ビデオエンコーダにより、ビデオデコーダに向けた伝送が保留されている前記ビデオビットストリームを記憶することと、を含む。

第１５の態様はデコーディング装置に関する。デコーディング装置は、現在のピクチャを含むコード化されたビデオビットストリームを受信するように構成された受信器と、前記受信器に連結されたメモリであって、該メモリは命令を記憶する、メモリと、前記メモリに連結されたプロセッサであって、該プロセッサは前記命令を実行して、当該デコーディング装置に、前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることと、前記現在のピクチャがランダムアクセスデコーダブルリーディング（ＲＡＤＬ）ピクチャであると判定することであって、該ＲＡＤＬピクチャは、ランダムアクセススキップリーディング（ＲＡＳＬ）ピクチャ、利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成されたピクチャ、及びデコーディング順序において関連するイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行するピクチャのうちのいずれかであるアクティブエントリが前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内の存在しないものとすることを表す、ことと、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストのうちの一方又は両方に基づいて前記ＲＡＤＬピクチャの各スライスをデコードすることと、を行わせるように構成されている、プロセッサと、を含む。

第１６の態様は、エンコーディング装置に関する。エンコーディング装置は、命令を含むメモリと、前記メモリに連結されたプロセッサであって、該プリセッサは前記命令を実施して当該エンコーディング装置に、現在のピクチャがランダムアクセスデコーダブルリーディング（ＲＡＤＬ）ピクチャの場合に、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、ランダムアクセススキップリーディング（ＲＡＳＬ）ピクチャ、利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成されるピクチャ、及びデコーディング順序において関連するイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行するピクチャ、のうちのいずれかであるアクティブエントリが前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内に存在しないものとする、ことと、前記ＲＡＤＬピクチャと、前記第１の参照ピクチャリスト及び前記第２の参照ピクチャリストのうちの一方又は両方とをビデオビットストリームにエンコードすることと、を行わせるように構成されている、プロセッサと、前記プロセッサに連結された送信器であって、該送信器はビデオデコーダに向けて前記ビデオビットストリームを送信するように構成されている、送信器と、を含む。

第１７の態様は、コーディング装置に関する。コーディング装置は、エンコードするためにピクチャを受信するか又はデコードするためにビットストリームを受信するように構成された受信器と、前記受信器に連結された送信器であって、該送信器はデコーダに前記ビットストリームを送信するか又はディスプレイにデコードされた画像を送信するように構成されている、送信器と、前記受信器又は前記送信器のうちの少なくとも１つに連結されたメモリであって、該メモリは命令を記憶するように構成されている、メモリと、メモリに連結されたプロセッサであって、該プロセッサは、本明細書で開示の方法のいずれかを行うために、前記メモリに記憶された命令を実行するように構成されている、プロセッサと、を含む。

コーディング装置は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する技術を提供する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

第１８の態様は、システムに関する。システムは、エンコーダと、エンコーダと通信するデコーダとを含み、エンコーダ又はデコーダは、本明細書に開示のデコーディング装置、エンコーディング装置又はコーディング装置を含む。

本システムは、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する技術を提供する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

第１９の態様は、コーディングのための手段に関する。コーディングのための手段は、エンコードするためにピクチャを受信するか又はデコードするためにビットストリームを受信するように構成された受信手段と、前記受信手段に連結された送信手段であって、該送信手段はデコーディング手段に前記ビットストリームを送信するか又は表示手段にデコードされた画像を送信するように構成されている、送信手段と、前記受信手段又は前記送信手段のうちの少なくとも１つに連結された記憶手段であって、該記憶手段は命令を記憶するように構成されている、記憶手段と、メモリに連結された処理手段であって、該処理手段は、本明細書に開示の方法のいずれかを行うために、前記記憶手段に記憶された命令を実行するように構成されている、処理手段と、を含む。

コーディングのための手段は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する技術を提供する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

明確にするために、前述の実施形態のいずれか１つを、他の前述の実施形態のいずれか１つ以上と組み合わせて、本開示の範囲内で新たな実施形態を作り出され得る。

これらの及び他の特徴は、添付の図面及び特許請求の範囲に関連して考慮される以下の詳細な説明から、より明確に理解されるであろう。

本開示のより完全な理解のために、添付の図面及び詳細な説明に関連して、以下の簡単な説明を参照する。同様の参照符号は同様の部分を表す。
図１は、ビデオ信号をコーディングする例示の方法のフローチャートである。図２は、ビデオコーディングのための例示のコーディング及びデコーディング（コーデック）システムの概略図である。図３は、例示のビデオエンコーダを示す概略図である。図４は、例示のビデオデコーダを示す概略図である。図５は、デコーディング順序及びプレゼンテーション順序において、リーディングピクチャ及びトレーリングピクチャに対するイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャの間の関係を示すコード化されたビデオシーケンスである。図６は、漸進的デコーディングリフレッシュ（ＧＤＲ）技術を実施するように構成されたビデオビットストリームを示す。図７は、ＧＤＲをサポートするためにエンコーダ制限を用いる場合の望ましくないモーションサーチを示す概略図である。図８は、クリーンランダムアクセス（ＣＲＡ）技術を実施するように構成されたビデオビットストリームを示す。図９は、一方向インター予測の一例を示す概略図である。図１０は、双方向相インター予測の一例を示す概略図である。図１１は、例示の参照ピクチャリスト構造の例を示す概略図である。図１２Ａ～図１２Ｃは、インターレースビデオコーディングの一例を集合的に示す概略図である。図１３は、インターレースビデオコーディング及びリーディングピクチャの両方を用いる例示のコード化されたビデオシーケンス（ＣＶＳ）の例を示す概略図である。図１４は、ピクチャのための分割技術を示す。図１５は、デコーディングの方法の一実施形態である。図１６は、エンコーディングの方法の一実施形態である。図１７は、デコーディングの一実施形態である。図１８は、エンコーディングの方法の一実施形態である。図１９は、デコーディングの方法の一実施形態である。図２０は、エンコーディングの方法の一実施形態である。図２１は、デコーディングの方法の一実施形態である。図２２は、エンコーディングの方法の一実施形態である。図２３は、例示のビデオコーディング装置の概略図である。図２４は、コーディングのための手段の実施形態の概略図である。

最初に、１つ以上の実施形態の例示的な実施が以下で提供されるが、開示するシステム及び／又は方法は、現在知られているか又は存在するかを問わず、任意の数の技術を用いて実施され得ることを理解すべきである。本開示は、本明細書で示し且つ説明される例示の設計及び実施を含む、以下に示す例示の形態、図面及び技術に決して限定されす、添付の特許請求の範囲の範囲と共にそれらの均等物の全範囲内で変更され得る。

以下の用語は、本明細書において反義的に文脈で用いられない限り、以下のように定義される。具体的には、以下の定義は本開示をさらに明確にすることを意図している。しかしながら、異なる文脈で用語が異なるように記述され得る。したがって、以下の定義は、補足とみなされるべきであり、本明細書においてそのような用語のために提供される説明の定義を制限するものとみなすべきではない。

ビットストリームは、エンコーダとデコーダとの間で伝送するために圧縮されるビデオデータを含む一連のビットである。エンコーダは、ビデオデータをビットストリームに圧縮するためのエンコーディングプロセスを用いるように構成された装置である。デコーダは、ビットストリームから表示のためにビデオデータを再構成するためにデコーディングプロセスを用いるように構成された装置である。ピクチャは、フレーム又はそのフィールドを生成する一連のルーマサンプル及び／又は一連のクロマサンプルである。エンコード又はデコードされているピクチャは、議論を明確にするために現在のピクチャと呼ぶことができる。参照ピクチャは、他のピクチャをコーディングする場合に、インター予測及び／又はインターレイヤー予測に従って参照により用いることができる参照サンプルを含むピクチャである。参照ピクチャリストは、インター予測及び／又はインターレイヤー予測のために用いられる参照ピクチャのリストである。一部のビデオコーディングシステムは、参照ピクチャリスト１及び参照ピクチャリスト０として示すことができる、２つの参照ピクチャリストを用いる。参照ピクチャリスト構造は、複数の参照ピクチャリストを含むアドレス指定可能な構文構造である。インター予測は、現在のピクチャのサンプルを、現在のピクチャとは異なる参照ピクチャ内の表示されたサンプルを参照することによりコーディングするメカニズムであり、参照ピクチャ及び現在のピクチャは同じ層内にある。参照ピクチャリスト構造エントリは、参照ピクチャリストに関連する参照ピクチャを示す参照ピクチャリスト構造内のアドレス可能な位置である。スライスヘッダはコード化されたスライスの一部であり、スライス内で表されるタイル内の全てのビデオデータに関連するデータ要素を含む。シーケンスパラメータセット（ＳＰＳ）は、ピクチャのシーケンスに関連するデータを含むパラメータセットである。アクセスユニット（ＡＵ）は、（例えば、ユーザに表示するための）デコードピクチャバッファ（ＤＰＢ）からの出力のために、同じ表示時間（例えば、同じピクチャーオーダーカウント）に関連する１つ以上のコード化されたピクチャのセットである。デコードされたビデオシーケンスは、ユーザへの表示の準備でデコーダによって再構成された一連のピクチャである。

双方向インター予測のための２つの参照ピクチャリストのそれぞれにおいて、現在のピクチャのインター予測のために用いられ得る参照ピクチャは、リストの先頭にある多数のエントリによってのみ参照され得る。これらのエントリはリスト内のアクティブエントリと呼ばれる一方で、他のエントリはリスト内の非アクティブエントリと呼ばれる。リスト内の全エントリの数及びアクティブなエントリの数の両方を得ることができる。参照ピクチャリスト内の非アクティブエントリによって参照されるピクチャは、参照ピクチャリスト内の他のエントリ又は他の参照ピクチャリスト内の任意のエントリによっても参照されることが許可されていない。

本明細書では以下の頭字語を用いる：コード化されたビデオシーケンス（ＣＶＳ）、デコードピクチャバッファ（ＤＰＢ）、瞬時デコーディングリフレッシュ（ＩＤＲ）、イントラランダムアクセスポイント（ＩＲＡＰ）、ジョイントビデオエキスパートチーム（ＪＶＥＴ）、最下位ビット（ＬＳＢ）、最上位ビット（ＭＳＢ）、ネットワーク抽象レイヤ（ＮＡＬ）、ピクチャオーダカウント（ＰＯＣ）、ローバイトシーケンスペイロード（ＲＢＳＰ）、リアルタイムトランスポートプロトコル（ＲＴＰ）、シーケンスパラメタセット（ＳＰＳ）、汎用ビデオコーディング（ＶＶＣ）、ワーキングドラフト（ＷＤ）、ウェーブレットパラレル処理（ＷＰＰ）。

図１は、ビデオ信号をコーディングする例示の動作方法１００のフローチャートである。具体的には、ビデオ信号はエンコーダでエンコードされる。エンコーディングプロセスは、ビデオファイルサイズを低減するために、様々なメカニズムを用いることによりビデオ信号を圧縮する。ファイルサイズがより小さいと、関連する帯域幅オーバーヘッドを低減しながら、圧縮されたビデオファイルをユーザに送信することを可能となる。次いで、デコーダは、圧縮されたビデオファイルをデコードして、エンドユーザに表示するために元のビデオ信号を再構成する。デコーディングプロセスは、一般に、エンコーディングプロセスに酷似し、デコーダがビデオ信号を一貫して再構成できるようにする。

ステップ１０１では、ビデオ信号がエンコーダに入力される。例えば、ビデオ信号はメモリに記憶された非圧縮ビデオファイルであり得る。別の例として、ビデオファイルは、ビデオカメラ等のビデオキャプチャ装置によってキャプチャされてもよく、ビデオのライブストリーミングをサポートするようにエンコードされ得る。ビデオファイルは、オーディオコンポーネント及びビデオコンポーネントの両方を含み得る。ビデオコンポーネントは、連続で見た場合に、動きの視覚的な印象を与える一連の画像フレームを含む。フレームは、本明細書でルーマ成分（又はルーマサンプル）と呼ばれる光及びクロマ成分（又はカラーサンプル）と呼ばれる色の観点で表されるピクセルを含む。一部の例では、フレームは、三次元表示をサポートするために深度値も含み得る。

ステップ１０３で、ビデオはブロックに分割される。分割は、圧縮のために各フレーム内のピクセルを正方形及び／又は長方形のブロックにさらに分割することを含む。例えば、ハイエフィシエンシービデオコーディング（ＨＥＶＣ）（Ｈ.２６５及びＭＰＥＧ－ＨＰａｒｔ２としても知られている）では、フレームは先ず所定のサイズ（例えば、６４ピクセル×６４ピクセル）のブロックである、コーディングツリー単位（ＣＴＵ）に分割することができる。ＣＴＵにはルーマ及びクロマサンプルの両方が含む。コーディングツリーを用いてＣＴＵをブロックに分割し、次いで、さらなるエンコーディングをサポートする構成が得られるまでブロックが再帰的にさらに分割される。例えば、フレームのルーマコンポーネントは、個々のブロックが比較的均一な照明値を含むまでさらに分割され得る。また、フレームのクロマコンポーネントは、個々のブロックが比較的均一な色値を含むまでさらに分割され得る。したがって、分割メカニズムはビデオフレームの内容によって変化する。

ステップ１０５では、ステップ１０３で分割された画像ブロックを圧縮するために、様々な圧縮メカニズムが用いられる。例えば、インター予測及び／又はイントラ予測が用いられ得る。イントラ予測は、共通のシーン内のオブジェクトが連続するフレームに現れる傾向があるという事実を利用するように設計されている。したがって、参照フレーム内のオブジェクトを描くブロックを隣接するフレーム内で繰り返し記述する必要あない。具体的には、テーブル等のオブジェクトは、複数のフレームにわたって一定の位置に留まり得る。そのため、テーブルは一度記述され、隣接するフレームは参照フレームに戻って参照できる。複数フレームにわたってオブジェクトをマッチングするためにパターンマッチングメカニズムが用いられ得る。また、移動するオブジェクトは、例えば、オブジェクトの動き又はカメラの動きにより複数のフレームに亘って表現され得る。特定の例として、ビデオは、複数のフレームに亘ってスクリーンを横切って移動する自動車を表示し得る。そのような動きを記述するために動きベクトルを用いることができる。動きベクトルは、フレーム内のオブジェクトの座標から参照フレーム内のオブジェクトの座標へのオフセットを提供する二次元ベクトルである。そのため、インター予測は、参照フレーム内の対応するブロックからのオフセットを示す動き一組の動きベクトルとして、現在のフレーム内の画像ブロックをエンコードすることができる。

イントラ予測は共通フレーム内のブロックをエンコードする。イントラ予測は、ルーマ及びクロマコンポーネントがフレームに集中する傾向があるという事実を利用する。例えば、樹木の一部の緑色の斑点は、同様の緑色の斑点に隣接して位置する傾向がある。イントラ予測は、多方向予測モード（例えば、ＨＥＶＣにおける３３）、平面モード及び直流（ＤＣ）モードを用いる。方向モードは、現在のブロックが、対応する方向の隣接ブロックのサンプルと類似／同じであることを示す。平面モードは、行／列に沿った一連のブロック（例えば、平面）が、行の端における隣接ブロックに基づいて補間できることを示す。平面モードは、事実上、値を変化する際に比較的一定の傾斜を用いることによって、行／列に亘る光／色の滑らかな遷移を示す。ＤＣモードは境界平滑化のために用いられ、方向予測モードの角度方向に関連する隣接ブロックの全てのサンプルに関連する平均値とブロックが同様／同じであることを示す。したがって、イントラ予測ブロックは、実際の値の代わりに、様々な関係予測モード値として画像ブロックを表すことができる。また、インター予測ブロックは、実際の値の代わりに、動きベクトル値として画像ブロックを表わすことができる。いずれの場合も、予測ブロックは、場合によっては、画像ブロックを厳密に表さない場合がある。差異は残差ブロックに記憶される。ファイルをさらに圧縮するために残差ブロックに変換が適用され得る。

ステップ１０７で、様々なフィルタリング技術が適用され得る。ＨＥＶＣでは、インループフィルタリングスキームに従ってフィルタが適用される。上述のブロックベースの予測は、デコーダにおいてブロック状画像の生成がもたらされ得る。また、ブロックベースの予測スキームはブロックをエンコードし、次いで、エンコードしたブロックを後で参照ブロックとして用いるために再構成し得る。インループフィルタリングスキームは、ノイズ抑制フィルタ、デブロックフィルタ、アダプティブループフィルタ及びサンプルアダプティブオフセット（ＳＡＯ）フィルタをブロック／フレームに逐次適用する。これらのフィルタは、エンコードされたファイルを正確に再構成することができるように、そのようなブロッキングアーチファクトを軽減する。また、これらのフィルタは、再構成された参照ブロック内のアーチファクトを軽減するため、アーチファクトが、再構成された参照ブロックに基づいてエンコードされる後続ブロック内に追加のアーチファクトを生成する可能性が低い。

ビデオ信号が分割、圧縮及びフィルタリングされると、結果として得られるデータがステップ１０９でビットストリームにエンコードされる。ビットストリームは、上述したデータに加えて、デコーダでの適切なビデオ信号再構成をサポートするのに望ましい任意の信号データを含む。例えば、そのようなデータは、パーティションデータ、予測データ、残差ブロック及びデコーダにコーディング命令を提供する様々なフラグを含む。ビットストリームは、要求に応じてデコーダに向けて送信するためにメモリに記憶され得る。ビットストリームは、複数のデコーダに向けてブロードキャスト及び／又はマルチキャストされ得る。ビットストリームの生成は反復プロセスである。したがって、ステップ１０１、１０３、１０５、１０７及び１０９は、多くのフレーム及びブロックにわたって連続的に及び／又は同時に生じ得る。図１に示す順序は、説明の明確さ及び容易さのために示されており、ビデオコーディングプロセスを特定の順序に限定することを意図していない。

デコーダはビットストリームを受信し、ステップ１１１でデコーディングプロセスを開始する。具体的には、デコーダは、ビットストリームを対応する構文及びビデオデータに変換するためにエントロピーデコーディングスキームを用いる。デコーダは、ステップ１１１で、フレームの分割を決定するためにビットストリームからの構文データを用いる。分割は、ステップ１０３におけるブロック分割の結果と一致するはずである。ステップ１１１で用いられるエントロピーエンコーディング／デコーディングを今から説明する。エンコーダは、入力画像内の値の空間的位置に基づくいくつかの可能な選択肢からブロック分割スキームを選択する等、圧縮プロセスの間に多くの選択を行う。厳密な選択肢の伝達には、多数のビンが用いられ得る。本明細書で用いるように、ビンは、変数として扱われるバイナリ値である（例えば、コンテキストに応じて変化し得るビット値）である。エントロピーコーディングは、エンコーダが特定の場合にとって明らかに実行可能でない任意のオプションを捨てることを可能にするため、許容可能なオプションのセットが残る。各許容可能なオプションにはコードワードが割り当てられる。コードワードの長さは、許容可能なオプションの数（例えば、２つのオプションに対して１つのビン、３～４つのオプションに対して２つのビン等）に基づく。そして、エンコーダは、選択されたオプションに対してコードワードをエンコードする。このスキームは、コードワードが、全ての可能な選択肢の潜在的に大きなセットからの選択を一意的に示すのとは反対に、許可可能な選択肢の小さなサブセットからの選択を一意的に示すのに望ましい大きさであるため、コードワードのサイズを小さくする。次いで、デコーダは、エンコーダと同様の方法で許容可能な選択肢のセットを決定することにより、選択をデコードする。許容可能な選択肢のセットを決定することにより、デコーダはコードワードを読み取り、エンコーダによってなされる選択を特定できる。

ステップ１１３で、デコーダはブロックデコーディングを行う。具体的には、デコーダは、残差ブロックを生成するために逆変換を用いる。次いで、デコーダは、残差ブロック及び対応する予測ブロックを用いて、分割に従って画像ブロックを再構成する。予測ブロックは、ステップ１０５でエンコーダで生成されたイントラ予測ブロック及びインター予測ブロックの両方を含み得る。次いで、再構成された画像ブロックは、ステップ１１１で決定された分割データに従って、再構成されたビデオ信号のフレーム内に配置される。ステップ１１３のための構文も、上述したようにエントロピーコーディングを通じてビットストリーム内で伝達され得る。

ステップ１１５で、エンコーダにおけるステップ１０７と同様の方法で、再構成されたビデオ信号のフレームに対してフィルタリングが行われる。例えば、ノイズ抑制フィルタ、デブロッキングフィルタ、アダプティブループフィルタ及びＳＡＯフィルタをフレームに適用して、ブロッキングアーチファクトを取り除く。フレームがフィルタリングされると、エンドユーザによる閲覧のために、ステップ１１７でビデオ信号をディスプレイに出力できる。

図２は、ビデオコーディングのための例示のコーディング及びデコーディング（コーデック）システム２００の概略図である。具体的には、コーデックシステム２００は、動作方法１００の実施をサポートするための機能を提供する。コーデックシステム２００は、エンコーダ及びデコーダの両方で用いられるコンポーネントを示すために一般化されている。コーデックシステム２００は、動作方法１００のステップ１０１及び１０３に関して説明したように、ビデオ信号を受信及び分割し、これにより分割されたビデオ信号２０１が得られる。次に、コーデックシステム２００は、エンコーダとしての機能を果たす場合は、方法１００のステップ１０５、１０７及び１０９に関して説明したように、分割されたビデオ信号２０１をコード化されたビットストリームに圧縮する。デコーダとしての機能を果たす場合、コーデックシステム２００は、動作方法１００におけるステップ１１１、１１３、１１５及び１１７に関して説明したように、ビットストリームから出力ビデオ信号を生成する。コーデックシステム２００は、一般コーダ制御コンポーネント２１１、変換スケーリング及び量子化コンポーネント２１３、イントラピクチャ推定コンポーネント２１５、イントラピクチャ予測コンポーネント２１７、動き補償コンポーネント２１９、動き推定コンポーネント２２１、スケーリング及び逆変換コンポーネント２２９、フィルタ制御分析コンポーネント２２７、インループフィルタコンポーネント２２５、デコードピクチャバッファコンポーネント２２３及びヘッダフォーマット化及びコンテキストアダプティブバイナリ算術コーディング（ＣＡＢＡＣ）コンポーネント２３１を含む。そのようなコンポーネントは図示のように連結されている。図２では、黒色の線はエンコード／デコードすべきデータの動きを示すのに対して、破線は他のコンポーネントの動作を制御する制御データの動きを示す。コーデックシステム２００のコンポーネントの全てはエンコーダ内に存在し得る。デコーダは、コーデックシステム２００のコンポーネントのサブセットを含み得る。例えば、デコーダは、イントラピクチャ予測コンポーネント２１７、動き補償コンポーネント２１９、スケーリング及び逆変換コンポーネント２２９、インループフィルタコンポーネント２２５及びデコードピクチャバッファコンポーネント２２３を含み得る。これらのコンポーネントを今から説明する。

分割されたビデオ信号２０１は、コーディングツリーによりピクセルのブロックに分割されているキャプチャされたビデオシーケンスである。コーディングツリーは、ピクセルのブロックをさらに小さいピクセルのブロックにさらに分割するために、様々な分割モードを用いる。そして、これらのブロックは、より小さいブロックにさらに分割することができる。ブロックは、コーディングツリー上のノードと呼ばれ得る。大きな親ノードは、小さな子ノードに分割される。ノードが分割される回数は、ノード／コーディングツリーの深さと呼ばれる。場合によっては、分割されたブロックはコーディングユニット（ＣＵ）に含めることができる。例えば、ＣＵは、ルーマブロック、赤色差クロマ（Ｃｒ）ブロック及び青色差クロマ（Ｃｂ）ブロックと共にＣＵのための対応する構文命令を含むＣＴＵのサブ部分であり得る。分割モードは、ノードを、用いられる分割モードに応じて異なる形状の２つ、３つ又は４つの子ノードに分割するためにそれぞれ用いられるバイナリツリー（ＢＴ）、トリプルツリー（ＴＴ）及びクワッドツリー（ＱＴ）を含み得る。分割されたビデオ信号２０１は、圧縮のために、一般コーダ制御コンポーネント２１１、変換スケーリング及び量子化コンポーネント２１３、イントラピクチャ推定コンポーネント２１５、フィルタ制御分析コンポーネント２２７及び動き推定コンポーネント２２１に転送される。

一般コーダ制御コンポーネント２１１は、アプリケーションの制約に従って、ビデオシーケンスの画像をビットストリームにコーディングすることに関連する決定を行うように構成されている。例えば、一般コーダ制御コンポーネント２１１は、再構成品質に対するビットレート／ビットストリームサイズの最適化を管理する。そのような決定は、記憶領域／帯域幅の可用性及び画像解像度要求に基づいて行われ得る。一般コーダ制御コンポーネント２１１は、バッファのアンダーラン及びオーバーランの問題を緩和するために、送信速度に照らしてバッファの利用も管理する。これらの問題を管理するために、一般コーダ制御コンポーネント２１１は、他のコンポーネントによる分割、予測及びフィルタリングを管理する。例えば、一般コーダ制御コンポーネント２１１は、解像度を高め且つ帯域幅の使用を増やすために圧縮の複雑さを動的に高め得るか又は解像度及び帯域幅の使用を減らすために圧縮の複雑さを低減し得る。そのため、一般コーダ制御コンポーネント２１１は、ビットレートの懸念とビデオ信号再構成品質とのバランスを取るために、コーデックシステム２００の他のコンポーネントを制御する。一般コーダ制御コンポーネント２１１は、他のコンポーネントの動作を制御する制御データを生成する。制御データも、デコーダでのデコーディングのためにパラメータを伝達するためにビットストリームにエンコードされるようにヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１に転送される。

分割されたビデオ信号２０１は、インター予測のために、動き推定コンポーネント２２１及びモ動き補償コンポーネント２１９にも送信される。分割されたビデオ信号２０１のフレーム又はスライスは複数のビデオブロックに分割され得る。動き推定コンポーネント２２１及び動き補償コンポーネント２１９は、時間的な予測を提供するために、１つ以上の参照フレーム内の１つ以上のブロックに対して、受信したビデオブロックのインター予測コーディングを行う。コーデックシステム２００は、例えばビデオデータの各ブロックのための適切なコーディングモードを選択するために、複数のコーディングパスを行い得る。

動き推定コンポーネント２２１及び動き補償コンポーネント２１９は高度に統合され得るが、概念的な目的のために別個に図示されている。動き推定コンポーネント２２１によって行われる動き推定は、ビデオブロックのための動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、例えば、予測ブロックに対するコード化されたオブジェクトの変位を示し得る。予測ブロックは、ピクセル差の観点で、コード化すべきブロックに密接に一致することが見出されるブロックである。予測ブロックは参照ブロックとも呼ばれる。このようなピクセル差は、絶対差の合計（ＳＡＤ）、二乗差の合計（ＳＳＤ）又は他の差分メトリックによって求められ得る。ＨＥＶＣは、ＣＴＵ、コーディングツリーブロック（ＣＴＢ）及びＣＵを含むいくつかのコード化されたオブジェクトを用いる。例えば、ＣＴＵはＣＴＢに分割でき、ＣＴＢはＣＵに含めるためにＣＢに分割される。ＣＵは、予測データを含む予測ユニット（ＰＵ）及び／又はＣＵの変換残差データを含む変換ユニット（ＴＵ）としてエンコードできる。動き推定コンポーネント２２１は、レート歪み最適化プロセスの一部としてレート歪み解析を用いることにより、動きベクトル、ＰＵ及びＴＵを生成する。例えば、動き推定コンポーネント２２１は、現在のブロック／フレームのために複数の参照ブロック、複数の動きベクトル等を特定し、レート歪み特性が最良の参照ブロック、動きベクトル等を選択し得る。最良のレート歪み特性は、ビデオ再構成の品質（例えば、圧縮によるデータ損失量）とコーディング効率（例えば、最終エンコーディングのサイズ）の両方のバランスを取る。

一部の例では、コーデックシステム２００は、デコードピクチャバッファコンポーネント２２３に記憶された参照ピクチャのサブ整数ピクセル位置の値を算出し得る。例えば、ビデオコーデックシステム２００は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置又は他の部分的ピクセル位置の値を補間し得る。したがって、動き推定コンポーネント２２１は、全ピクセル位置及び部分的ピクセル位置に対する動きサーチを行い、部分的ピクセル精度を有する動きベクトルを出力し得る。動き推定コンポーネント２２１は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することにより、インターコード化されたスライス内のビデオブロックのＰＵのための動きベクトルを計算する。動き推定コンポーネント２２１は、エンコーディングのためにヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１に計算した動きベクトルを動きデータとして出力し、動きを動き補償コンポーネント２１９に出力する。

動き補償コンポーネント２１９によって行われる動き補償は、動き推定コンポーネント２２１によって決定された動きベクトルに基づいて予測ブロックをフェッチ又は生成することを含み得る。再び、一部の例では、動き推定コンポーネント２２１及び動き補償コンポーネント２１９は機能的に統合され得る。現在のビデオブロックのＰＵのための動きベクトルを受信すると、動き補償コンポーネント２１９は、動きベクトルが指す予測ブロックを特定し得る。次いで、コード化されている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算することにより、残差ビデオブロックが形成されて、ピクセル差値が形成される。一般に、動き推定コンポーネント２２１はルーマコンポーネントに対して動き推定を行い、動き補償コンポーネント２１９は、ルーマコンポーネントに基づいて計算された動きベクトルをクロマコンポーネント及びルーマコンポーネントの両方のために用いる。予測ブロック及び残差ブロックは、変換スケーリング及び量子化コンポーネント２１３に転送される。

分割されたビデオ信号２０１も、イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７に送信される。動き推定コンポーネント２２１及び動き補償コンポーネント２１９と同様に、イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７は高度に統合され得るが、概念的な目的のために別個に図示されている。イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７は、上述した、動き推定コンポーネント２２１及び動き補償コンポーネント２１９によって行われるフレーム間のインター予測に代えて、現在のフレーム内のブロックに対する現在のブロックをイントラ予測する。とりわけ、イントラピクチャ推定コンポーネント２１５は、現在のブロックをエンコードするために用いるイントラ予測モードを決定する。一部の例では、イントラピクチャ推定コンポーネント２１５は、複数のテストされたイントラ予測モードから、現在のブロックをエンコードするために、適切なイントラ予測モードを選択する。次いで、選択されたイントラ予測モードが、エンコーディングのためにヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１に転送される。

例えば、イントラピクチャ推定コンポーネント２１５は、様々なテストされたイントラピクチャ予測モードについて、レート歪み分析を用いてレート歪み値を計算し、テストされたモードの中で最良のレート歪み特性を有するイントラ予測モードを選択する。レート歪み分析は、エンコードされたブロックと、該エンコードされたブロックを生成するためにエンコードされた元のエンコードされていないブロックとの間の歪み（又は誤差）の量及びエンコードされたブロックを生成するために用いられるビットレート（例えば、ビットの数）を概して特定する。イントラピクチャ推定コンポーネント２１５は、様々なエンコードされたブロックのための歪み及びレートから比率を計算して、ブロックのために最良のレート歪み値を示すイントラ予測モードを特定する。加えて、イントラピクチャ推定コンポーネント２１５は、レート歪み最適化（ＲＤＯ）に基づく深度モデリングモード（ＤＭＭ）を用いて深度マップの深度ブロックをコード化するように構成され得る。

イントラピクチャ予測コンポーネント２１７は、エンコーダで実施された場合にはイントラピクチャ予測コンポーネント２１５によって特定される選択されたイントラピクチャ予測モードに基づく予測ブロックから残差ブロックを生成し、デコーダで実施される場合にはビットストリームから残差ブロックを読み出し得る。残差ブロックは、行列として表される予測ブロックと元のブロックとの間の値の差を含む。次いで、残差ブロックは、変換スケーリング及び量子化コンポーネント２１３に転送される。イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７は、ルーマコンポーネント及びクロマコンポーネントの両方に対して動作し得る。

変換スケーリング及び量子化コンポーネント２１３は、残差ブロックをさらに圧縮するように構成されている。変換スケーリング及び量子化コンポーネント２１３は、離散コサイン変換（ＤＣＴ）、離散正弦変換（ＤＳＴ）又は概念的に同様の変換等の変換を残差ブロックに適用し、残差変換係数値を含むビデオブロックを生成する。ウェーブレット変換、整数変換、サブバンド変換又は他の種類の変換も用いられ得る。変換は、残差情報をピクセル値ドメインから変換ドメイン、例えば周波数ドメインに変換し得る。変換スケーリング及び量子化コンポーネント２１３は、変換された残差情報を例えば周波数に基づいてスケーリングするようにも構成されている。そのようなスケーリングは、異なる周波数情報が異なる粒度で量子化されるように、残差情報に倍率を適用することを含み、これは、再構成されたビデオの最終的な視覚品質に影響を及ぼし得る。変換スケーリング及び量子化コンポーネント２１３は、ビットレートをさらに低下させるために変換係数を量子化するようにも構成されている。量子化プロセスは、係数の一部又は全てに関するビット深さを低減し得る。量子化の程度は、量子化パラメータを調整することによって修正され得る。一部の例では、変換スケーリング及び量子化コンポーネント２１３は、次いで、量子化された変換係数を含む行列の走査を行い得る。量子化された変換係数は、ヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１に転送され、ビットストリームにエンコードされる。

スケーリング及び逆変換コンポーネント２２９は、動き推定をサポートするために変換スケーリング及び量子化コンポーネント２１３の逆演算を適用する。スケーリング及び逆変換コンポーネント２２９は、例えば、後に別の現在のブロックの予測ブロックとなり得る参照ブロックとして後で用いるために、逆スケーリング、変換及び／又は量子化を適用して、ピクセルドメイン内の残差ブロックを再構成する。動き推定コンポーネント２２１及び／又は動き補償コンポーネント２１９は、後のブロック／フレームの動き推定で用いるために、残差ブロックを対応する予測ブロックに加算することにより参照ブロックを計算し得る。スケーリング、量子化及び変換の間に生成されるアーチファクトを軽減するために、再構成された参照ブロックにフィルタが適用される。そうでなければ、そのようなアーチファクトは、後続のブロックが予測されたときに不正確な予測（及び追加のアーチファクト）をもたらし得る。

フィルタ制御解析コンポーネント２２７及びインループフィルタコンポーネント２２５は、残差ブロック及び／又は再構成された画像ブロックにフィルタを適用する。例えば、スケーリング及び逆変換コンポーネント２２９からの変換された残差ブロックが、イントラピクチャ予測コンポーネント２１７及び／又は動き補償コンポーネント２１９からの対応する予測ブロックと組み合わせられて、元の画像ブロックが再構成され得る。次いで、再構成された画像ブロックにフィルタが適用され得る。一部の例では、フィルタは、代わりに、残差ブロックに適用され得る。図２の他のコンポーネントと同様に、フィルタ制御解析コンポーネント２２７及びインループフィルタコンポーネント２２５は高度に統合され、共に実施され得るが、概念的な目的のために別々に示されている。再構成された参照ブロックに適用されるフィルタは特定の空間領域に適用され、そのようなフィルタをどのように適用するかを調整するために複数のパラメータを含む。フィルタ制御解析コンポーネント２２７は再構成された参照ブロックを解析して、そのようなフィルタを適用すべき場所を決定し、対応するパラメータを設定する。そのようなデータは、エンコーディングのためのフィルタ制御データとしてヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１に転送される。インループフィルタコンポーネント２２５は、フィルタ制御データに基づいてそのようなフィルタを適用する。フィルタはデブロッキングフィルタ、ノイズ抑制フィルタ、ＳＡＯフィルタ及びアダプティブループフィルタを含み得る。そのようなフィルタは、例に応じて、空間／ピクセル領域（例えば、再構成されたピクセルブロック）又は周波数領域に適用され得る。

エンコーダとして動作する場合、フィルタリングされ、再構成された画像ブロック、残差ブロック及び／又は予測ブロックは、上述したように、後で動き推定に使用するために、デコードピクチャバッファコンポーネント２２３に記憶される。デコーダとして動作する場合、デコードピクチャバッファコンポーネント２２３は再構成されフィルタリングされたブロックを記憶し、出力ビデオ信号の一部としてディスプレイに向けて転送する。デコードピクチャバッファコンポーネント２２３は、予測ブロック、残差ブロック及び／又は再構成された画像ブロックを記憶可能な任意のメモリ装置であってもよい。

ヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１は、コーデックシステム２００の様々なコンポーネントからデータを受信し、そのようなデータをデコーダに向けて伝送するためにコード化されたビットストリームにエンコードする。具体的には、ヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１は、一般的な制御データ及びフィルタ制御データ等の制御データをエンコードするために様々なヘッダを生成する。また、イントラ予測及び動きデータを含む予測データに加えて、量子化された変換係数データの形態の残差データの全てがビットストリーム内にエンコードされる。最終ビットストリームは、元の分割されたビデオ信号２０１を再構成するためにデコーダによって望まれる全ての情報を含む。そのような情報は、イントラ予測モードインデックステーブル（コードワードマッピングテーブルとも呼ばれる）、様々なブロックのためのエンコーディングコンテキストの定義、最も可能性の高いイントラ予測モードの表示、分割情報の表示等を含み得る。そのようなデータは、エントロピーコーディングを用いることによりエンコードされ得る。例えば、コンテキストアダプティブ可変長コーディング（ＣＡＶＬＣ）、ＣＡＢＡＣ、構文ベースのコンテキストアダプティブバイナリ演算コーディング（ＳＢＡＣ）、確率間隔分割エントロピー（ＰＩＰＥ）コーディング又は別のエントロピーコーディング技術を用いることによって、情報がエンコードされ得る。エントロピーコーディングに続いて、コード化されたビットストリームは別の装置（例えば、ビデオデコーダ）に送信され得るか又は後での送信又は検索のためにアーカイブされ得る。

図３は、例示のビデオエンコーダ３００を示すブロック図である。ビデオエンコーダ３００は、コーデックシステム２００のエンコード機能を実施及び／又は動作方法１００のステップ１０１、１０３、１０５、１０７及び／又は１０９を実施するために用いられ得る。エンコーダ３００は、入力ビデオ信号を分割し、その結果として分割されたビデオ信号３０１が得られる。これは、分割されたビデオ信号２０１と実質的に同様である。次いで、分割されたビデオ信号３０１は、エンコーダ３００のコンポーネントによって圧縮され、ビットストリームにエンコードされる。

具体的には、分割されたビデオ信号３０１は、イントラ予測のためにイントラピクチャ予測コンポーネント３１７に転送される。イントラピクチャ予測コンポーネント３１７は、イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７と実質的に同様であり得る。分割されたビデオ信号３０１は、デコードピクチャバッファコンポーネント３２３内の参照ブロックに基づくインター予測のために、動き補償コンポーネント３２１に転送される。動き補償コンポーネント３２１は、動き推定コンポーネント２２１及び動き補償コンポーネント２１９と実質的に同様であり得る。イントラピクチャ予測コンポーネント３１７及び動き補償コンポーネント３２１からの予測ブロック及び残差ブロックは、残差ブロックの変換及び量子化のために変換及び量子化コンポーネント３１３に転送される。変換及び量子化コンポーネント３１３は、変換スケーリング及び量子化コンポーネント２１３と実質的に同様であり得る。変換され且つ量子化された残差ブロック及び対応する予測ブロックは、ビットストリームにコーディングするためにエントロピーコーディングコンポーネント３３１に転送される。エントロピーコーディングコンポーネント３３１は、ヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１と実質的に同様であり得る。

変換され且つ量子化された残差ブロック及び／又は対応する予測ブロックも、動き補償コンポーネント３２１による使用のための参照ブロックへの再構成のために、変換及び量子化コンポーネント３１３から逆変換及び量子化コンポーネント３２９に転送される。逆変換及び量子化コンポーネント３２９は、スケーリング及び逆変換コンポーネント２２９と実質的に同様であり得る。インループフィルタコンポーネント３２５内のインループフィルタも、例に応じて、残差ブロック及び／又は再構成された参照ブロックにも適用される。インループフィルタコンポーネント３２５は、フィルタ制御解析コンポーネント２２７及びインループフィルタコンポーネント２２５と実質的に同様であり得る。インループフィルタコンポーネント３２５は、インループフィルタコンポーネント２２５に関して説明したように複数のフィルタを含み得る。次に、フィルタリングされたブロックは、動き補償コンポーネント３２１により参照ブロックとして用いられるために、デコードピクチャバッファコンポーネント３２３に記憶される。デコードピクチャバッファコンポーネント３２３は、デコードピクチャバッファコンポーネント２２３と実質的に同様であり得る。

図４は、例示のビデオデコーダ４００を示すブロック図である。ビデオデコーダ４００は、コーデックシステム２００のデコーディング機能を実施するため及び／又は動作方法１００のステップ１１１、１１３、１１５及び／又は１１７を実施するために用いられ得る。デコーダ４００は、例えばエンコーダ３００からビットストリームを受信し、エンドユーザへの表示のために、ビットストリームに基づいて再構成された出力ビデオ信号を生成する。

ビットストリームはエントロピーデコーディングコンポーネント４３３によって受信される。エントロピーデコーディングコンポーネント４３３は、ＣＡＶＬＣ、ＣＡＢＡＣ、ＳＢＡＣ、ＰＩＰＥコーディング又は他のエントロピーコーディング技術等のエントロピーコーディングスキームを実施するように構成されている。例えば、エントロピーコーディングコンポーネント４３３は、ビットストリーム内にコードワードとしてエンコードされた追加のデータを解釈するためのコンテキストを提供するために、ヘッダ情報を用いり得る。デコードされた情報は、一般的な制御データ、フィルタ制御データ、分割情報、動きデータ、予測データ及び残差ブロックからの量子化変換係数等の、ビデオ信号をデコードするための任意の所望の情報を含む。量子化変換係数は、残差ブロックに再構成するために、逆変換及び量子化コンポーネント４２９に転送される。逆変換及び量子化コンポーネント４２９は、逆変換及び量子化コンポーネント３２９と同様であり得る。

再構成された残差ブロック及び／又は予測ブロックは、イントラ予測動作に基づいて画像ブロックに再構成するために、イントラピクチャ予測コンポーネント４１７に転送される。イントラピクチャ予測コンポーネント４１７は、イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７と同様であり得る。具体的には、イントラピクチャ予測コンポーネント４１７は予測モードを用いてフレーム内の参照ブロックの場所を特定し、残差ブロックを結果に適用してイントラ予測画像ブロックを再構成する。再構成されたイントラ予測画像ブロック及び／又は残差ブロックと、対応するインター予測データとは、デコードピクチャバッファコンポーネント４２３にインループフィルタコンポーネント４２５を介して転送され、それらはデコードピクチャバッファコンポーネント２２３及びインループフィルタコンポーネント２２５とそれぞれ実質的に同様であり得る。インループフィルタコンポーネント４２５は、再構成された画像ブロック、残差ブロック及び／又は予測ブロックをフィルタリングし、そのような情報はデコードピクチャバッファコンポーネント４２３に記憶される。デコードピクチャバッファコンポーネント４２３からの再構成された画像ブロックは、インター予測のために動き補償コンポーネント４２１に転送される。動き補償コンポーネント４２１は、動き推定コンポーネント２２１及び／又は動き補償コンポーネント２１９と実質的に同様であり得る。具体的には、動き補償コンポーネント４２１は、参照ブロックからの動きベクトルを用いて予測ブロックを生成し、残差ブロックを結果に適用して画像ブロックを再構成する。結果として得られた再構成されたブロックは、インループフィルタコンポーネント４２５を介してデコードピクチャバッファコンポーネント４２３に転送され得る。デコードピクチャバッファコンポーネント４２３は、分割情報を介してフレームに再構成可能な追加の再構成された画像ブロックの記憶を続ける。このようなフレームはシーケンスに配置され得る。シーケンスは、再構成された出力ビデオ信号としてディスプレイに向けて出力される。

上記に留意して、ビデオ圧縮技術は、ビデオシーケンスに固有の冗長性を低減又は取り除くために、空間的（イントラピクチャ）予測及び／又は時間的（インターピクチャ）予測を行う。ブロックベースのビデオコーディングの場合、ビデオスライス（すなわち、ビデオピクチャ又はビデオピクチャの一部）はビデオブロックに分割されてもよく、それはツリーブロック、コーディングツリーブロック（ＣＴＢ）、コーディングツリーユニット（ＣＴＵ）、コーディングユニット（ＣＵ）及び／又はコーディングノードとも呼ばれ得る。ピクチャのイントラコード化（Ｉ）スライス内のビデオブロックは、同じピクチャ内の隣接ブロックにおける参照サンプルに関する空間的予測を用いてエンコードされる。ピクチャのインターコード化（Ｐ又はＢ）されたスライス内のビデオブロックは、同じピクチャ内の隣接ブロック内の参照サンプルに関する空間的予測又は他の参照ピクチャ内の参照サンプルに関する時間的予測を用いり得る。ピクチャはフレームとも呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

空間的又は時間的予測は、コード化すべきブロックのための予測ブロックをもたらす。残差データは、コード化すべき元のブロックと予測ブロックとのピクセル差を表す。インターコード化されたブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル及びコード化されたブロックと予測ブロックとの差を示す残差データに従ってエンコードされる。イントラコード化されたブロックは、イントラコーディングモード及び残差データに従ってエンコードされる。さらなる圧縮のために、残差データはピクセルドメインから変換ドメインに変換されてもよく、残差変換係数がもたらされ、それは次に量子化され得る。量子化された変換係数は先ず二次元アレイに配置され、変換係数の一次元ベクトルを生成するために走査され、よりさらなる圧縮を実現するためにエントロピーコーディングが適用され得る。

画像及びビデオ圧縮は急速な成長を経験し、様々なコーディング規格がもたらされた。このようなビデオコーディング規格には、ＩＴＵ－ＴＨ.２６１、国際標準化機構／国際電気標準会議（ＩＳＯ/ＩＥＣ）ＭＰＥＧ－１Ｐａｒｔ２、ＩＴＵ－ＴＨ.２６２又はＩＳＯ／ＩＥＣＭＰＥＧ－２Ｐａｒｔ２、ＩＴＵ－ＴＨ.２６３、ＩＳＯ／ＩＥＣＭＰＥＧ－４Ｐａｒｔ２、ＩＴＵ－ＴＨ.２６４又はＩＳＯ／ＩＥＣＭＰＥＧ－４Ｐａｒｔ１０としても知られるアドバンストビデオコーディング（ＡＶＣ）及びＩＴＵ－ＴＨ.２６５又はＭＰＥＧ－ＨＰａｒｔ２としても知られるハイエフィシエンシービデオコーディング（ＨＥＶＣ）を含む。ＡＶＣは、スケーラブルビデオコーディング（ＳＶＣ）、マルチビュービデオコーディング（ＭＶＣ）及びマルチビュービデオコーディング＋深度（ＭＶＣ＋Ｄ）及び３ＤＡＶＣ（３Ｄ－ＡＶＣ）等の拡張機能を含む。ＨＥＶＣはスケーラブルＨＥＶＣ（ＳＨＶＣ）、マルチビューＨＥＶＣ（ＭＶ－ＨＥＶＣ）及び３ＤＨＥＶＣ（３Ｄ－ＨＥＶＣ）等の拡張機能を含む。

ＩＴＵ－Ｔ及びＩＳＯ／ＩＥＣのジョイントビデオエキスパートチーム（ＪＶＥＴ）によって開発された、多目的ビデオコーディング（ＶＶＣ）という名の新たなビデオコーディング規格もある。ＶＶＣ規格にはいくつかの作業草案があるが、ＶＶＣの１つの作業草案、とりわけ、Ｂ．Ｂｒｏｓｓ、Ｊ．Ｃｈｅｎ及びＳ．Ｌｉｕの「ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（Ｄｒａｆｔ５）」、ＪＶＥＴ－Ｎ１００１－ｖ３、第１３回ＪＶＥＴ会議、２０１９年３月２７日（ＶＶＣ草案５）を本明細書で参照する。

本明細書に開示の技術の説明は、ＩＴＵ－Ｔ及びＩＳＯ／ＩＥＣのジョイントビデオエキスパートチーム（ＪＶＥＴ）による開発中のビデオコーディング規格である多目的ビデオコーディング（ＶＶＣ）に基づく。しかしながら、この技術は、他のビデオコーデックの仕様にも適用される。

ＡＶＣ、ＨＥＶＣ及びＶＶＣについて、ビデオコーディングにおける参照ピクチャ管理を説明する。

ビデオコーデックの仕様では、インター予測における参照ピクチャとしての使用、デコードピクチャバッファ（ＤＰＢ）からのピクチャの出力、動きベクトルのスケーリング、重み付き予測等を含む、複数の目的のためにピクチャが識別される必要がある。

ＡＶＣ及びＨＥＶＣでは、ピクチャオーダカウント（ＰＯＣ）でピクチャを識別できる。

ＡＶＣ及びＨＥＶＣでは、ＤＰＢ内の画像は「短期参照用」、「長期参照用」又は「参照のために非使用」とマークすることができる。ひとたびピクチャが「参照のために非使用」とマークされると、もはや予測のために用いることができず、出力のためにもはや必要でなくなった場合には、ＤＰＢから削除することができる。

ＡＶＣでは、短期及び長期の２種類の参照ピクチャがある。参照ピクチャは、予測参照のためにもはや不要となった場合、「参照のために非使用」とマークされ得る。これら３つの状態（短期、長期及び参照のために非使用）間の変換は、デコード参照ピクチャマーキングプロセスによって制御される。暗示的スライディングウインドウプロセス及び明示的メモリ管理制御オペレーション（ＭＭＣＯ）プロセスという２つの代替的なデコード参照画像マーキングメカニズムがある。スライディングウィンドウプロセスは、参照フレームの数が所与の最大数（ＳＰＳにおけるｍａｘ＿ｎｕｍ＿ｒｅｆ＿ｆｒａｍｅｓ）と等しい場合、短期参照ピクチャを「参照のために非使用」とマークする。短期参照ピクチャは、最新のデコード短期ピクチャがＤＰＢで維持されるように、先入れ先出しで記憶される。

明示的ＭＭＣＯプロセスは、複数のＭＭＣＯコマンドを含み得る。ＭＭＣＯコマンドは、１つ以上の短期又は長期参照ピクチャを「参照のために非使用」とマークし得るか、全てのピクチャを「参照のために非使用」とマークし得るか又は現在の参照ピクチャ若しくは既存の短期参照ピクチャを長期とマークし、その長期参照ピクチャに長期ピクチャインデックスを割り当て得る。

ＡＶＣでは、参照ピクチャマーキング動作に加えてＤＰＢからのピクチャの出力及び除去のプロセスは、画像がデコードされた後に行われる。

ＨＥＶＣは、参照ピクチャセット（ＲＰＳ）と呼ばれる参照ピクチャ管理のための異なるアプローチを導入する。ＡＶＣのＭＭＣＯ／スライディングウィンドウと比較した場合、ＲＰＳの概念と最も基本的な違いは、各特定のスライスに対して、現在のピクチャ又はそれに続くピクチャによって用いられる参照ピクチャの完全なセットが提供されることである。そのため、現在又は将来のピクチャによって用いるためにＤＰＢで保持すべき全てのピクチャの完全なセットが伝達される。これは、ＤＰＢに対する相対的な変化のみが伝達されるＡＶＣスキーのムとは異なる。ＲＰＳ概念では、ＤＰＢ内の参照ピクチャの正確な状態を維持するために、デコーディング順序における以前のピクチャからの情報は必要とされない。

ＲＰＳの利点を活用し、誤差弾力性を改善するために、ＨＥＶＣにおけるピクチャのデコーディング及びＤＰＢ動作の順序はＡＶＣに比べて変更されている。ＡＶＣのピクチャマーキング及びバッファ動作（ＤＰＢからのデコードされたピクチャの出力及び除去の両方）では概して、現在のピクチャがデコードされた後に適用される。ＨＥＶＣでは、ＲＰＳは先ず現在のピクチャのスライスヘッダからデコードされ、次いで、現在のピクチャをデコードする前に、ピクチャマーキング及びバッファ動作が概して適用される。

最新のＶＶＣのＷＤは、参照ピクチャリスト０及び参照ピクチャリスト１という２つの参照ピクチャリストに基づく参照ピクチャ管理のためのアプローチを含む。このアプローチでは、参照ピクチャリスト初期化プロセス及び参照ピクチャリスト変更プロセスを用いることなく、ピクチャのための参照ピクチャリストが直接構築される。さらに、参照ピクチャマーキングは、２つの参照ピクチャリストに直接基づく。

ＶＶＣにおける参照ピクチャ管理に関連する構文及びセマンティクスは以下の通りである。

シーケンスパラメータセットＲＢＳＰは以下の通りである。

ピクチャパラメータセットＲＢＳＰは以下の通りである。

一般的なスライスヘッダの構文は次のとおりである。

参照ピクチャリストの構文は以下の通りである。

シーケンスパラメータセットＲＢＳＰの意味は以下の通りである。

log２_max_pic_order_cnt_lsb_minus４は、ピクチャ順序カウントのためのデコーディング処理で用いられる変数MaxPicOrderCntLsbの値を次のように規定する。

MaxPicOrderCntLsb
= ２(^{log２_max_pic_order_cnt_lsb_minus４ + ４}) (７-７)(７-７)
Log2_max_pic_order_cnt_lsb_minus４の値は０～１２の範囲とする
。

sps_max_dec_pic_buffering_minus１ plus １は、ＣＶＳのためのデコードされたピクチャバッファの最大必要サイズを、ピクチャ記憶バッファの単位で指定する。sps_max_dec_pic_buffering_minus１の値は０～MaxDpbSize
- １の範囲とし、MaxDpbSizeが他で指定されている。

long_term_ref_pics_flag equal to 0は、ＣＶＳにおけるコード化されたピクチャのインター予測に長期参照ピクチャ（ＬＴＲＰ）が用いられないことを規定する。long_term_ref_pics_flag equal to 1は、ＣＶＳにおける１つ以上のコード化されたピクチャのインター予測にＬＴＲＰが用いられ得ることを規定する。

sps_idr_rpl_present_flag equal to 1は、参照ピクチャリスト構文要素がＩＤＲ画像のスライスヘッダに存在することを規定する。sps_idr_rpl_present_flag equal to 0はＩＤＲピクチャのスライスヘッダに参照ピクチャリスト構文要素が存在しないことを規定する。

rpl１_same_as_rp10_flag equal to 1は、構文構造num_ref_pic_lists_in_sps[1]及びref_pic_list_struct(1, rplsidx)が存在しないことを規定し、次のように適用される。

－ num_ref_pic_lists_in_sps[1]の値は、num_ref_pic_lists_in_sps[0]の値と等しいと推定される。

－ ref_pic_list_struct(1,
rplsIdx)の各構文要素の値は、０からnum_ref_pic_lists_in_sps[0] - 1の範囲のrplsIdxのref_pic_list_struct(0, rplsIdx)における対応する構文要素の値と等しいと推定される。

num_ref_pic_lists_in_sps[i]は0、ＳＰＳに含まれる、listIdxがiに等しいref_pic_list_struct(listIdx, rplsIdx)構文構造体の数を規定する。num_ref_pic_lists_in_sps[i]の値は０～６４の範囲とする。

注３－listIdxの各値(０又は１に等しい)について、デコーダは、num_ref_pic_lists_in_sps[i] + １ ref_pic_list_struct(listIdx,
rplsIdx)構文構造体の総数に対してメモリを割り当てるべきである。何故なら、現在のピクチャのスライスヘッダに直接伝達される１つのref_pic_list_struct(listIdx, rplsIdx)構文構造体があり得るからである。

ピクチャパラメータセットＲＢＳＰの意味は以下の通りである。

num_ref_idx_default_active_minus１[i] plus １は、ｉが０と等しい場合、num_ref_idx_active_override_flagが０に等しい、Ｐ又はＢスライスのための変数NumRefIdxActive[0]の推定値を規定し、ｉが１と等しい場合、num_ref_idx_active_override_flagが０に等しい、Ｂスライスのための変数NumRefIdxActive[1]の推定値を規定する。num_ref_idx_default_active_minus１[i]の値は０～１４の範囲とする。

rpl１_idx_present_flag equal
to 0は、ref_pic_list_sps_flag[1]及びref_pic_list_idx[1]がスライスヘッダにないことを規定する。rpl１_idx_present_flag equal
to １は、ref_pic_list_sps_flag[1]及びref_pic_list_idx[1]がスライスヘッダに存在し得ることを規定する。

一般的なスライスヘッダの意味は以下の通りである。

slice_pic_order_cnt_lsbは現在のピクチャのためのピクチャオーダカウントモジュロMaxPicOrderCntLsbを規定する。slice_pic_order_cnt_lsb構文要素の長さは、log2_max_pic_order_cnt_lsb_minus４ + ４ビットである。slice_pic_order_cnt_lsbの値は０～MaxPicOrderCntLsb - １までの範囲とする。

ref_pic_list_sps_flag[i] equal to 1は、現在のスライスの参照ピクチャリストｉが、アクティブＳＰＳにおいてlistIdxがiに等しいref_pic_list_struct(listIdx,
rplsIdx)構文構造の１つに基づいて得られることを規定する。ref_pic_list_sps_flag[i]
equal to 0は、現在のスライスの参照ピクチャリストｉが、現在のピクチャのスライスヘッダに直接含まれるlistIdxがｉに等しいref_pic_list_struct(listIdx, rplsIdx)構文構造に基づいて得られることを規定する。num_ref_pic_lists_in_sps[i] が０と等しい場合、ref_pic_list_sps_flag[i]の値は０に等しいと推定されるrpl１_idx_present_flagが０と等しい場合、ref_pic_list_sps_flag[1]の値はref_pic_list_sps_flag[0]と等しいと推定される。

ref_pic_list_idx[i]は、現在のピクチャの参照ピクチャリストｉを得るのに用いられる、listIdx がｉと等しいref_pic_list_struct(listIdx,
rplsIdx) 構文構造のアクティブＳＰＳに含まれる、listIdxがｉと等しいref_pic_list_struct(listIdx, rplsIdx) 構文構造のリスト内へのインデックスを規定する。構文要素ref_pic_list_idx[i]は、Ceil(Log２(num_ref_pic_lists_in_sps[i]))ビットで表される。存在しない場合、ref_pic_list_idx[i]の値は０に等しいと推定される。ref_pic_list_idx[i]の値は、０～num_ref_pic_lists_in_sps[i] - １の範囲とする。ref_pic_list_sps_flag[i]が１と等しく、num_ref_pic_lists_in_sps[i]が１と等しい場合、ref_pic_list_idx[i]の値は０と推定される。ref_pic_list_sps_flag[i]が１と等しく、rpl１_idx_present_flagが０と等しい場合、ref_pic_list_idx[1]の値はref_pic_list_idx[0]と等しいと推定される。

変数RplsIdx[i]は次のように得られる。

RplsIdx[i]
= ref_pic_list_sps_flag[i] ?ref_pic_list_idx[i] : num_ref_pic_lists_in_sps[i] (７-４０)
slice_poc_lsb_lt[i][j]は、ｉ番目の参照ピクチャリストのｊ番目のＬＴＲＰエントリのピクチャオーダカウントモジュロMaxPicOrderCntLsbの値を規定する。slice_poc_lsb_lt[i][j]構文要素の長さは、log２_max_pic_order_cnt_lsb_minus４+４ビットである。

変数PocLsbLt[i][j]は次のように得られる。

PocLsbLt[i][j]
= ltrp_in_slice_header_flag[i][RplsIdx[i]] ? (７-４１)
slice_poc_lsb_lt[i][j] : rpls_poc_lsb_lt[listIdx][RplsIdx[i]][j]
delta_poc_msb_present_flag[i][j] equal
to 1は、delta_poc_msb_cycle_lt[i][j]が存在することを規定する。delta_poc_msb_present_flag[i][j] equal to 0は、delta_poc_msb_cycle_lt[i][j]が存在しないことを規定する。

prevTid０Picは、TemporalIdが０と等しく、ランダムアクセススキップリーディング（ＲＡＳＬ）又はランダムアクセスデコーダブルリーディング（ＲＡＤＬ）ピクチャではないデコーディング順序における先のピクチャとする。setOfPrevPocValsは以下からなるセットとする。

－ prevTid0PicのPicOrderCntVal、
－ prevTid0PicのRefPicList[0]及びRefPicList[1]のエントリによって参照される各ピクチャのPicOrderCntVal、
－デコーディング順序においてprevTid０Picに後続し、デコーディング順序において現在のピクチャに先行する各ピクチャのPicOrderCntVal
値モジュロMaxPicOrderCntLsbがPocLsbLt[i][j]と等しい値がsetOfPrevPocValsに２つ以上ある場合、delta_poc_msb_present_flag[i][j]の値は１と等しいものとする。

delta_poc_msb_cycle_lt[i][j]は、変数FullPocLt[i][j]の値を次のように規定する。

if(j
= = ０)
deltaMsbCycle[i][j]
= delta_poc_msb_cycle_lt[i][j]
else (７-４２)
deltaMsbCycle[i][j]
= delta_poc_msb_cycle_lt[i][j] + deltaMsbCycle[i][j－1]
FullPocLt[i][RplsIdx[i]][j]
= PicOrderCntVal － deltaMsbCycle[i][j] *
MaxPicOrderCntLsb － (PicOrderCntVal &
(MaxPicOrderCntLsb－1)) + PocLsbLt[i][j]
delta_poc_msb_cycle_lt[i][j]の値は、０～2(³²‐^{log2_max_pic_order_cnt_lsb_minus4}
^{- 4})の範囲とする。存在しない場合、delta_poc_msb_cycle_lt[i][j]の値は０と等しいと推定される。

num_ref_idx_active_override_flag equal
to 1は、Ｐ及びＢスライスのために構文要素num_ref_idx_active_minus1[0が存在し、Ｂスライスのために構文要素num_ref_idx_active_minus1[1]が存在することを規定する。num_ref_idx_active_override_flag
equal to 0は構文要素num_ref_idx_active_minus1[0]及びnum_ref_idx_active_minus1[1]が存在しないことを規定する。存在しない場合、num_ref_idx_active_override_flagの値は１と等しいと推定される。

num_ref_idx_active_minus１[i]は、式７-４３で規定する変数NumRefIdxActive[i]を得るために用いられる。num_ref_idx_active_minus１[i]の値は０～１４の範囲とする。

ｉが０又は１と等しい場合について、現在のスライスがＢスライスで、num_ref_idx_active_override_flagが１と等しく、num_ref_idx_active_minus１[i]が存在しない場合、num_ref_idx_active_minus１[i]は０と等しいと推定される。

現在のスライスがＰスライスであり、num_ref_idx_active_override_flagが１と等しく、num_ref_idx_active_minus1[0]が存在しない場合、num_ref_idx_active_minus１[0]は0と等しいと推定される。

変数NumRefIdxActive[i]は以下のように得られる。

for
(i = ０; i < ２; i++) {
if(slice_type
= = B ||(slice_type = = P && i = = ０)) {
if(num_ref_idx_active_override_flag)
NumRefIdxActive[i] = num_ref_idx_active_minus１[i] + １ (７-４３)
else
{}
if(num_ref_entries[i][RplsIdx[i]] >=
num_ref_idx_default_active_minus１[i] + １)
NumRefIdxActive[i] =
num_ref_idx_default_active_minus1[i]
+ 1
else
NumRefIdxActive[i] = num_ref_entries[i][RplsIdx[i]]
}
} else // slice_type = = I ||(slice_type = = P && i = = １)
NumRefIdxActive[i] = ０
}

NumRefIdxActive[i]
- １の値は、スライスをデコードするために用いられ得る参照ピクチャリストｉのための最大参照インデックスを規定する。NumRefIdxActive[i]の値が０と等しい場合、参照ピクチャリストｉのために参照インデックスがスライスをデコードするために用いられない。

現在のデコードされたピクチャは現在のスライスの唯一の参照ピクチャであることを規定する変数CurrPicIsOnlyRefは以下のように得られる。

CurrPicIsOnlyRef
= sps_cpr_enabled_flag && (slice_type = = P) && （７－４４）
(num_ref_idx_active_minus１[０]
= = ０)
参照ピクチャリスト構造セマンティクスが提供される。

ref_pic_list_struct(listIdx,
rplsIdx)構文構造は、ＳＰＳ又はスライスヘッダ内に存在し得る。構文構造がスライスヘッダに含まれるのか又は文構造に含まれるのかに応じて、以下が適用される。

－スライスヘッダに存在する場合、ref_pic_list_struct(listIdx, rplsIdx)構文構造は、現在のピクチャ（スライスを含むピクチャ）の参照ピクチャリストリストlistIdxを規定する。

－さもなければ（ＳＰＳに存在する場合)、ref_pic_list_struct(listIdx, rplsIdx)構文構造は参照ピクチャリストlistIdxの候補を規定し、この節の残りの部分で規定される意味における「現在のピクチャ」という用語は、１）ＳＰＳに含まれるref_pic_list_struct(listIdx, rplsIdx)構文構造のリスト内のインデックスと等しいref_pic_list_idx[listIdx]を含む１つ以上のスライスを有し、２）ＳＰＳをアクティブＳＰＳとしてＣＶＳ内にある各ピクチャを意味する。

num_ref_entries [listIdx] [rplsIdx]は、ref_pic_list_struct(listIdx, rplsIdx)構文構造のエントリの数を規定する。num_ref_entries[listIdx][rplsidx]の値は０～sps_max_dec_pic_buffering_minus１+１４の範囲とする。

ltrp_in_slice_header_flag [listIdx]
[rplsIdx] equal to 0は、ref_pic_list_struct(listIdx,
rplsIdx)構文構造のＬＴＲＰエントリのＰＯＣＬＳＢがref_pic_list_struct(listIdx,
rplsIdx)構文構造に存在することを規定する。ltrp_in_slice_header_flag
[listIdx] [rplsIdx] equal to 1は、ref_pic_list_struct(listIdx,
rplsIdx)構文構造のＬＴＲＰエントリのＰＯＣＬＳＢがref_pic_list_struct(listIdx,
rplsIdx)構文構造に存在しないことを規定する。

st_ref_pic_flag[listIdx] [rplsIdx] [i] equal
to 1 は、ref_pic_list_struct(listIdx, rplsIdx)構文構造のｉ番目のエントリが安全なリアルタイムトランスポートプロトコル（ＳＴＲＰ）エントリであることを規定する。st_ref_pic_flag[listIdx] [rplsIdx] [i] equal to 0は、ref_pic_list_struct(listIdx, rplsIdx)構文構造のｉ番目のエントリがＬＴＲＰエントリであることを規定する。存在しない場合、st_ref_pic_flag[listIdx][rplsIdx][i]の値は１と等しいと推定される。

変数NumLtrpEntries[listIdx][rplsIdx]は以下のように得られる。

for(i
= ０, NumLtrpEntries[listIdx][rplsIdx] = ０; i < num_ref_entries[listIdx][rplsIdx]; i++)
if(!st_ref_pic_flag[listIdx][rplsIdx][i]) （７－８６）
NumLtrpEntries[listIdx][rplsIdx]++

abs_delta_poc_st
[listIdx] [rplsIdx] [i] は、ｉ番目のエントリがref_pic_list_struct(listIdx,
rplsIdx)構文構造の第１のＳＴＲＰエントリの場合に、現在のピクチャとｉ番目のエントリが参照するピクチャとのピクチャオーダカウント値間の絶対差を規定するか又はｉ番目のエントリがref_pic_list_struct(listIdx, rplsIdx)構文構造内のＳＴＲＰエントリであるが、第１のＳＴＲＰエントリではない場合に、ref_pic_list_struct(listIdx, rplsIdx)構文構造内のｉ番目のエントリによって及びそれに先行するＳＴＲＰエントリによって参照されるピクチャのピクチャオーダカウント値間の絶対差を規定する。

abs_delta_poc_st
[listIdx][rplsIdx][i]の値は、０～２^１５－１の範囲であるものとする。

strp_entry_entry_sign_flag[listIdx][rplsIdx][i]
equal to 1は、構文構造ref_pic_list_struct(listIdx, rplsIdx)内のｉ番目のエントリの値が０以上であることを規定する。strp_entry_sign_flag[listIdx] [rplsIdx] equal to 0は、構文構造ref_pic_list_struct(listIdx, rplsIdx)内のｉ番目のエントリは０未満の値を有することを規定する。存在しない場合、strp_entry_sign_flag[i][j]の値は１と等しいと推定される。

リストDeltaPocSt[listIdx][rplsIdx]は、以下のように得られる。

for(i
= ０; i < num_ref_entries[listIdx][rplsIdx]; i++) {
if(st_ref_pic_flag[listIdx][rplsIdx][i]) { (７－８７)
DeltaPocSt[listIdx][rplsIdx][i] =
(strp_entry_sign_flag[listIdx][rplsIdx][i])
?
abs_delta_poc_st[listIdx][rplsIdx][i] : ０－
abs_delta_poc_st[listIdx][rplsIdx][i]
}
}

rpls_poc_lsb_lt [listIdx] [rplsIdx] [i] は、ref_pic_list_struct(listIdx, rplsIdx)構文構造のｉ番目のエントリによって参照されるピクチャのピクチャオーダカウントモジュロMaxPicOrderCntLsbの値を規定する。rpls_poc_lsb_lt
[listIdx][rplsIdx][i]構文要素の長さは、log2_max_pic_order_cnt_lsb_minus4+4ビットである。

既存の解決策の問題を説明する。

参照ピクチャリストが許可された参照ピクチャのみを含むことを確実にするために、ビットストリーム適合制約を規定する必要がある。ＨＥＶＣでは、参照ピクチャセット（ＲＰＳ）内に存在し得る参照ピクチャの種類について、以下の制約が規定された。

－現在のピクチャがＣＲＡピクチャの場合、出力順序又はデコーディング順序において、デコーディング順序において先行する任意のＩＲＡＰ画像（もし存在する場合）に先行するピクチャがＲＰＳに含まれないものとする。

－現在のピクチャがトレーリングピクチャの場合、８.３.３節で規定されるように、利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成されたピクチャがRefPicSetStCurrBefore、RefPicSetStCurrAfter又はRefPicSetLtCurr内に存在しないものとする。
－現在のピクチャがトレーリングピクチャの場合、出力順序又はデコーディング順序において関連するＩＲＡＰピクチャに先行するピクチャがＲＰＳ内に存在しないものとする。

－現在のピクチャがＲＡＤＬピクチャの場合、RefPicSetStCurrBefore、RefPicSetStCurrAfter又はRefPicSetLtCurrに以下のいずれかのピクチャが含まれないものとする。
－ＲＡＳＬ画像
－８.３.３節に規定される利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成されたピクチャ
－デコーディング順序において関連するＩＲＡＰピクチャに先行するピクチャ

参照ピクチャリスト（ＲＰＬ）アプローチの場合、以下の問題が特定される。

１．一般に、参照ピクチャリスト内に存在し得る参照ピクチャの種類に関するビットストリーム適合制約は規定されていない。

２．インターレースコーディングが用いられる場合、ＩＲＡＰピクチャの２つのフィールドの両方がＩＲＡＰピクチャとしてマークされないことがあり、代わり、第１のフィールドのみがＩＲＡＰピクチャとしてマークされ、他方のフィールドはトレーリングピクチャとしてマークされる。したがって、これは「現在のピクチャがトレーリングピクチャの場合、出力順序又はデコーディング順序において関連するＩＲＡＰピクチャに先行するピクチャがＲＰＳ内に存在しないものとする」という上記の同様の制約はこの状況では機能しないことを意味する。制約を変更する必要がある。

本明細書で開示する技術は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。そのため、ビデオコーディングにおけるコーダ／デコーダ（別称「コーデック」）は、現在のコーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送信、受信及び／又は閲覧される際にユーザにより良好なユーザ体験を提供する。

図５は、デコーディング順序５０８及び提示順序５１０（別名、出力順序）におけるリーディングピクチャ５０４及びトレーリングピクチャ５０６に対する内部ランダムアクセスポイント（ＩＲＡＰ）ピクチャ５０２の関係を示すコード化されたビデオシーケンス５００である。一実施形態では、ＩＲＡＰピクチャ５０２は、クリーンランダムアクセス（ＣＲＡ）ピクチャ又はランダムアクセスデコーダブル（ＲＡＤＬ）ピクチャを有する瞬時デコーダリフレッシュ（ＩＤＲ）ピクチャと呼ばれる。ＨＥＶＣでは、ＩＤＲピクチャ、ＣＲＡピクチャ及びブロークンリンクアクセス（ＢＬＡ）ピクチャの全てがＩＲＡＰピクチャ５０２とみなされる。ＶＶＣについては、２０１８年１０月の第１２回ＪＶＥＴ会合の間に、ＩＤＲ画像及びＣＲＡ画像の両方をＩＲＡＰ画像とすることが合意された。一実施形態では、ブロークンリンクアクセス（ＢＬＡ）及び漸進的デコーダリフレッシュ（ＧＤＲ）ピクチャもＩＲＡＰ画像とみなされ得る。コード化されたビデオシーケンスのデコーディングプロセスは常にＩＲＡＰピクチャから始まる。

ＣＲＡピクチャは、各ビデオコーディングレイヤ（ＶＣＬ）ネットワーク抽象レイヤ（ＮＡＬ）ユニットのnal_unit_typeがＣＲＡ_ＮＵＴと等しいＩＲＡＰピクチャである。ＣＲＡピクチャは、そのデコーディングプロセスにおけるインター予測のために自身以外のピクチャを参照せず、デコーディング順序におけるビットストリームの第１のピクチャであり得るか又はビットストリームの後半に現れ得る。ＣＲＡピクチャは関連するＲＡＤＬ又はランダムアクセススキップリーディング（ＲＡＳＬ）ピクチャを有し得る。ＣＲＡピクチャのNoOutputBeforeRecoveryFlagが１と等しい場合、関連するＲＡＳＬピクチャはデコーダによって出力されない。何故なら、それらはビットストリームに存在しないピクチャへの参照を含み得るため、デコードできない可能性があるからである。

図５に示すように、リーディングピクチャ５０４（例えば、ピクチャ２及び３）は、デコーディング順序５０８においてＩＲＡＰピクチャ５０２に後続するが、提示順序５１０においてＩＲＡＰピクチャ５０２に先行する。トレーリングピクチャ５０６は、デコーディング順序５０８及び提示順序５１０の両方において、ＩＲＡＰピクチャ５０２に後続する。２つのリーディングピクチャ５０４及び１つのトレーリングピクチャ５０６を図５に示しているが、当業者であれば、実際の用途において、より多くの又はより少ない数のリーディングピクチャ５０４及び／又はトレーリングピクチャ５０６がデコーディング順序５０８及び提示順序５１０に存在し得ることを理解するであろう。

図５のリーディングピクチャ５０４は、ランダムアクセススキップリーディング及びＲＡＤＬの２種類に分割されている。ＩＲＡＰピクチャ５０２（例えば、ピクチャ１）からデコーディングが開始する場合、ＲＡＤＬピクチャ（例えば、ピクチャ３）を適切にデコードできるが、ＲＡＳＬピクチャ（例えば、ピクチャ２）を適切にデコードすることができない。そのため、ＲＡＳＬピクチャは破棄される。ＲＡＤＬピクチャとＲＡＳＬピクチャとの区別に照らして、ＩＲＡＰピクチャ５０２に関連するリーディングピクチャ５０４の種類は、効率的且つ適切なコーディングのためにＲＡＤＬ又はＲＡＳＬのいずれかとして特定されるべきである。ＨＥＶＣでは、ＲＡＳＬ及びＲＡＤＬピクチャが存在する場合、同じＩＲＡＰピクチャ５０２に関連するＲＡＳＬ及びＲＡＤＬピクチャについて、提示順序５１０においてＲＡＳＬピクチャがＲＡＤＬピクチャに先行するものと制約される。

ＩＲＡＰ画像５０２は以下の２つの重要な機能／利点を提供する。第１に、ＩＲＡＰピクチャ５０２の存在は、デコーディングプロセスがそのピクチャから開始可能であることを示す。この機能は、ＩＲＡＰピクチャ５０２がその位置に存在する限り、デコーディングプロセスが必ずしもビットストリームの最初ではなく、ビットストリームのその位置から開始される、ランダムアクセス機能を可能にする。第２に、ＩＲＡＰピクチャ５０２の存在は、ＲＡＳＬピクチャを除くＩＲＡＰピクチャ５０２で始まるコード化されたピクチャが、先行するピクチャを参照することなくコード化されるように、デコーディングプロセスを更新する。その結果、ビットストリーム内に存在するＩＲＡＰピクチャ５０２を有することで、ＩＲＡＰピクチャ５０２に先行するコード化されたピクチャのデコーディングの間に発生し得るエラーが、ＩＲＡＰピクチャ５０２及びデコーディング順序５０８においてＩＲＡＰピクチャ５０２に後続するそれらのピクチャに伝搬するのを止め得る。

ＩＲＡＰピクチャ５０２は重要な機能を提供するが、圧縮効率に不利益をもたらす。ＩＲＡＰ画像５０２の存在はビットレートの上昇をもたらす。圧縮効率に対するこの不利益は２つの理由による。第１に、ＩＲＡＰピクチャ５０２はイントラ予測ピクチャであるため、インター予測ピクチャである他のピクチャ（例えば、リーディングピクチャ５０４、トレーリングピクチャ５０６）に比べて、ピクチャを表すのに比較的多くのビットを必要とし得る。第２に、ＩＲＡＰピクチャ５０２の存在は時間的予測を中断するため（これは、デコーダがデコーディングプロセスをリフレッシュするからであり、これのためのデコーディングプロセスの動作の１つは、デコーディングピクチャバッファ（ＤＰＢ）内の先の参照ピクチャを除去するためのものである)、ＩＲＡＰピクチャ５０２は、デコーディング順序５０８においてＩＲＡＰピクチャ５０２に後続するピクチャのコーディングの効率を低下させる（すなわち、表わすためにより多くのビットを必要とする）。何故なら、それらは、それらのインター予測コーディングのための参照ピクチャが少ないからである。

ＩＲＡＰピクチャ５０２と見なされるピクチャの種類のうち、ＨＥＶＣにおけるＩＤＲピクチャは、他のピクチャの種類と比べた場合に、異なる伝達及び導出を有する。相違点のうちのいくつかは以下の通りである。

ＩＤＲピクチャのピクチャオーダカウント（ＰＯＣ）値の伝達及び導出の場合、ＰＯＣの最上位ビット（ＭＳＢ）部分は、先のキーピクチャから導出されず、単に０に等しいものとして設定される。

参照ピクチャ管理に必要な伝達情報に関して、ＩＤＲピクチャのスライスヘッダは、参照ピクチャ管理を補助するために伝達する必要がある情報を含まない。他のピクチャの種類（すなわち、ＣＲＡ、トレーリング、時間的サブレイヤアクセス（ＴＳＳ）等）については、参照ピクチャマーキングプロセス（すなわち、参照のために用いられるか又は参照のために用いられないという、デコードピクチャバッファ（ＤＰＢ）内の参照ピクチャの状態を特定するプロセス)のために、以下で説明する参照ピクチャセット（ＲＰＳ）又は他の形態の同様の情報（例えば、参照ピクチャリスト）等の情報を必要とする。しかしながら、ＩＤＲピクチャの場合、ＩＤＲの存在は、ＤＰＢ内の全ての参照ピクチャを参照のために用いられないとデコーディングプロセスがマークすべきであることを示すため、そのような情報を伝達する必要がない。

ＨＥＶＣ及びＶＶＣでは、ＩＲＡＰピクチャ５０２及びリーディングピクチャ５０４のスライスのそれぞれは、単一のネットワーク抽象化層（ＮＡＬ）ユニット内に含まれ得る。ＮＡＬユニットのセットはアクセスユニットと呼ばれ得る。ＩＲＡＰピクチャ５０２及びリーディングピクチャ５０４は、それらがシステムレベルのアプリケーションによって容易に識別できるように、異なるＮＡＬユニットタイプが与えられる。例えば、ビデオスプライサは、コード化されたビットストリーム内の構文要素の詳細を理解しすぎることなしに、コード化されたピクチャの種類を理解する必要があり、とりわけ、非ＩＲＡＰ画像からＩＲＡＰ画像５０２を識別し、トレーリングピクチャ５０６から、ＲＡＳＬ及びＲＡＤＬピクチャの特定を含むリーディングピクチャ５０４を識別する必要がある。トレーリングピクチャ５０６は、ＩＲＡＰピクチャ５０２に関連し、提示順序５１０においてＩＲＡＰピクチャ５０２に後続するピクチャである。ピクチャは、デコーディング順序５０８において特定のＩＲＡＰピクチャ５０２に後続し、デコーディング順序５０８において他のＩＲＡＰピクチャ５０２に先行し得る。このために、ＩＲＡＰピクチャ５０２及びリーディングピクチャ５０４にそれら自身のＮＡＬユニットタイプを与えることが、このようなアプリケーションを助ける。

ＨＥＶＣの場合、ＩＲＡＰピクチャのためのＮＡＬユニットの種類は以下のものを含む。
リーディングピクチャを有するＢＬＡ（ＢＬＡ＿Ｗ＿ＬＰ）：デコーディング順序において１つ以上のリーディングピクチャによって後続され得るブロークンリンクアクセス（ＢＬＡ）ピクチャのＮＡＬユニット
ＲＡＤＬを有するＢＬＡ（ＢＬＡ＿Ｗ＿ＲＡＤＬ）：デコーディング順序においてＲＡＳＬピクチャがなく、１つ以上のＲＡＤＬピクチャによって後続され得るＢＬＡピクチャのＮＡＬユニット
リーディングピクチャなしのＢＬＡ（ＢＬＡ＿Ｎ＿ＬＰ）：デコーディング順序においてリーディングピクチャによって後続されないＢＬＡピクチャのＮＡＬユニット
ＲＡＤＬを有するＩＤＲ（ＩＤＲ＿Ｗ＿ＲＡＤＬ）：デコーディング順序においてＲＡＳＬピクチャがなく、１つ以上のＲＡＤＬピクチャによって後続され得るＩＤＲピクチャのＮＡＬユニット
リーディングピクチャなしのＩＤＲ（ＩＤＲ＿Ｎ＿ＬＰ）：デコーディング順序においてリーディングピクチャによって後続されないＩＤＲピクチャのＮＡＬユニット
ＣＲＡ：リーディングピクチャ（すなわち、ＲＡＳＬピクチャ又はＲＡＤＬピクチャのいずれか又はその両方）によって後続され得るクリーンランダムアクセス（ＣＲＡ）ピクチャのＮＡＬユニット
ＲＡＤＬ：ＲＡＤＬピクチャのＮＡＬユニット
ＲＡＳＬ：ＲＡＳＬ画像のＮＡＬユニット

ＶＶＣの場合、ＩＲＡＰピクチャ５０２及びリーディングピクチャ５０４のＮＡＬユニットの種類は以下のとおりである。
ＲＡＤＬを有するＩＤＲ（ＩＤＲ＿Ｗ＿ＲＡＤＬ）：デコーディング順序においてＲＡＳＬピクチャがなく、１つ以上のＲＡＤＬピクチャによって後続され得るＩＤＲピクチャのＮＡＬユニット
リーディングピクチャなしのＩＤＲ（ＩＤＲ＿Ｎ＿ＬＰ）：デコーディング順序においてリーディングピクチャによって後続されないＩＤＲピクチャのＮＡＬユニット
ＣＲＡ：リーディングピクチャ（すなわち、ＲＡＳＬピクチャ又はＲＡＤＬピクチャのいずれか又はその両方）によって後続され得るクリーンランダムアクセス（ＣＲＡ）ピクチャのＮＡＬユニット
ＲＡＤＬ：ＲＡＤＬピクチャのＮＡＬユニット
ＲＡＳＬ：ＲＡＳＬ画像のＮＡＬユニット

図６は、漸進的デコーディングリフレッシュ（ＧＤＲ）技術６００を実施するように構成されたビデオビットストリーム６５０を示す。本明細書で用いるように、ビデオビットストリーム６５０は、コード化されたビデオビットストリーム、ビットストリーム又はそれらのバリュエーションとも呼ばれ得る。図６に示すように、ビットストリーム６５０は、シーケンスパラメータセット（ＳＰＳ）６５２、ピクチャパラメータセット（ＰＰＳ）６５４、スライスヘッダ６５６及び画像データ６５８を含む。

ＳＰＳ６５２は、ピクチャシーケンス（ＳＯＰ）内の全てのピクチャに共通のデータを含む。これとは対照的に、ＰＰＳ６５４はピクチャ全体に共通するデータを含む。スライスヘッダ６５６は、例えば、スライスの種類、どの参照ピクチャを用いるか等の現在のスライスに関する情報を含む。ＳＰＳ６５２及びＰＰＳ６５４は総称的にパラメータセットと呼ばれ得る。ＳＰＳ６５２、ＰＰＳ６５４及びスライスヘッダ６５６はネットワーク抽象化層（ＮＡＬ）ユニットの種類である。ＮＡＬユニットは、データの種類が後続するための表示（例えば、コード化されたビデオデータ）を含む構文構造です。ＮＡＬユニットは、ビデオコーディング層（ＶＣＬ）及び非ＶＣＬＮＡＬユニットに分類される。ＶＣＬＮＡＬユニットは、ビデオピクチャ内のサンプルの値を表すデータを含み、非ＶＣＬＮＡＬユニットは、パラメータセット（多数のＶＣＬＮＡＬユニットに適用可能な重要なヘッダデータ）及び補足的な強化情報（デコードされたビデオ信号の有用性を高め得るが、ビデオピクチャ内のサンプルの値をデコードするために必要ではないタイミング情報及び他の補足データ）を含む。当業者であれば、ビットストリーム６５０は、実際の用途における他のパラメータ及び情報を含み得ることを理解するであろう。

図６の画像データ６５８は、エンコード又はデコードされた画像又はビデオに関連するデータを含む。画像データ６５８は、単に、ビットストリーム６５０内で運ばれるペイロード又はデータと呼ばれ得る。一実施形態では、画像データ６５８は、ＧＤＲピクチャ６０２、１つ以上のトレーリングピクチャ６０４及びリカバリポイントピクチャ６０６を含むＣＶＳ６０８（又はＣＬＶＳ）を含む。一実施形態では、ＧＤＲピクチャ６０２はＣＶＳスタート（ＣＶＳＳ）ピクチャと呼ばれる。ＣＶＳ６０８は、ビデオビットストリーム６５０内の各コード化されたレイヤービデオシーケンス（ＣＬＶＳ）のためのコード化されたビデオシーケンスである。注目すべきことに、ビデオビットストリーム６５０が単一層を含む場合、ＣＶＳ及びＣＬＶＳは同じである。ＣＶＳ及びＣＬＶＳは、ビデオビットストリーム６５０が複数の層を含む場合にのみ異なる。一実施形態では、トレーリングピクチャ６０４は、それらがＧＤＲ期間においてリカバリポイントピクチャ６０６に先行するため、ＧＤＲピクチャの一形態であると考えられ得る。

一実施形態では、ＧＤＲピクチャ６０２、トレーリングピクチャ６０４及びリカバリポイントピクチャ６０６は、ＣＶＳ６０８内でＧＤＲ期間を定義し得る。一実施形態では、デコーディング順序はＧＤＲピクチャ６０２で始まり、トレーリングピクチャ６０４に続き、次いでリカバリーピクチャ６０６に進む。

ＣＶＳ６０８は、ＧＤＲピクチャ６０２から始まる一連のピクチャ（又はその一部）であり、次のＧＤＲピクチャまで(但し、これを含まない)又はビットストリームの最後までの全てのピクチャ（又はその一部）を含む。ＧＤＲ期間はＧＤＲピクチャ６０２から始まる一連のピクチャであり、リカバリポイントピクチャ６０６までの及びリカバリポイントピクチャ６０６を含む全てのピクチャを含む。ＣＶＳ６０８のためのデコーディングプロセスは常にＧＤＲピクチャ６０２で始まる。

図６に示すように、ＧＤＲ技術６００又は原理は、ＧＤＲピクチャ６０２から始まり、リカバリポイントピクチャ６０６で終わる一連のピクチャに対して機能する。ＧＤＲピクチャ６０２は、イントラ予測を用いて全てがコード化されたブロック（すなわち、イントラ予測ブロック）を含むリフレッシュ／クリーン領域６１０と、インター予測を用いて全てがコード化されたブロック（すなわち、インター予測ブロック）を含む未リフレッシュ／不潔領域６１２とを含む。

ＧＤＲピクチャ６０２にすぐ隣接するトレーリングピクチャ６０４は、イントラ予測を用いてコード化された第１の部分６１０Ａと、インター予測を用いてコード化された第２の部分６１０Ｂとを有するリフレッシュ／クリーン領域６１０を含む。第２の部分６１０Ｂは、例えば、ＣＶＳ６０８のＧＤＲ期間内の先行ピクチャのリフレッシュ／クリーン領域６１０を参照することによってコード化される。図示のように、トレーリングピクチャ６０４のリフレッシュ／クリーン領域６１０は、コーディングプロセスが一貫した方向（例えば、左から右へ）に移動又は進むにつれて拡張し、それに対応して未リフレッシュ／不潔領域６１２を収縮させる。最終的に、リフレッシュ／クリーン領域６１０のみを含むリカバリポイントピクチャ６０６がコーディングプロセスから得られる。注目すべきことに且つ以下でさらに説明するように、インター予測ブロックとしてコード化されたリフレッシュ／クリーン領域６１０の第２の部分６１０Ｂは、参照ピクチャ内のリフレッシュ／クリーン領域６１０のみを参照し得る。

図６に示すように、ＣＶＳ６０８内のＧＤＲピクチャ６０２、トレーリングピクチャ６０４及びリカバリポイントピクチャ６０６のそれぞれは、それら自身のＶＣＬＮＡＬユニット６３０内に含まれる。ＣＶＳ６０８内のＶＣＬＮＡＬユニット６３０のセットは、アクセスユニットと呼ばれ得る。

一実施形態では、ＣＶＳ６０８内のＧＤＲピクチャ６０２を含むＶＣＬＮＡＬユニット６３０はＧＤＲＮＡＬユニットタイプ（ＧＤＲ＿ＮＵＴ）を有する。すなわち、一実施形態では、ＣＶＳ６０８内のＧＤＲピクチャ６０２を含むＶＣＬＮＡＬユニット６３０は、トレーリングピクチャ６０４及びリカバリポイントピクチャ６０６に対して独自のＮＡＬユニットタイプを有する。一実施形態では、ＧＤＲ＿ＮＵＴは、ビットストリーム６５０がＩＲＡＰピクチャで開始するのに代えて、ビットストリーム６５０がＧＤＲピクチャ６０２で開始することを可能にする。ＧＤＲピクチャ６０２のＶＣＬＮＡＬユニット６３０をＧＤＲ＿ＮＵＴとして指定することは、例えば、ＣＶＳ６０８内の初期ＶＣＬＮＡＬユニット６３０がＧＤＲピクチャ６０２を含むことをデコーダに示し得る。一実施形態では、ＧＤＲピクチャ６０２はＣＶＳ６０８内の初期ピクチャである。一実施形態では、ＧＤＲピクチャ６０２はＧＤＲ期間の初期ピクチャである。

図７は、ＧＤＲをサポートするためにエンコーダ制限を用いた場合の望ましくないモーションサーチ７００を示す概略図である。図示のように、モーションサーチ７００は現在のピクチャ７０２及び参照ピクチャ７０４を示す。現在のピクチャ７０２及び参照ピクチャ７０４のそれぞれはイントラ予測でコード化されたリフレッシュ領域７０６、インター予測でコード化されたリフレッシュ領域７０８及び未リフレッシュ領域７１０を含む。リフレッシュ領域７０６、リフレッシュ領域７０８及び未リフレッシュ領域７１０は、図６のリフレッシュ／クリーン領域６１０の第１の部分６１０Ａ、リフレッシュ／クリーン領域６１０の第２の部分６１０Ｂ及び未リフレッシュ/不潔領域６１２と同様である。

モーションサーチプロセスの間、エンコーダは、リフレッシュ領域７０６の外に位置する参照ブロック７１４のサンプルの一部をもたらす動きベクトル７１２の選択することが制約されるか又は防止される。これは、参照ブロック７１４が、現在のピクチャ７０２内の現在のブロック７１６を予測する際に、最良のレート歪みコスト基準を提供する場合であっても起こる。そのため、図７は、ＧＤＲをサポートするためにエンコーダ制限を用いる場合に、モーションサーチ７００において最適でない理由を示す。

図８は、クリーンランダムアクセス（ＣＲＡ）技術８００を実施するように構成されたビデオビットストリーム８５０を示す。本明細書で用いるように、ビデオビットストリーム８５０は、コード化されたビデオビットストリーム、ビットストリーム又はそのバリエーションとも呼ばれ得る。図８に示すように、ビットストリーム８５０は、シーケンスパラメータセット（ＳＰＳ）８５２、ピクチャパラメータセット（ＰＰＳ）８５４、スライスヘッダ８５６及び画像データ８５８を含む。図８のビットストリーム８５０、ＳＰＳ８５２、ＰＰＳ８５４及びスライスヘッダ８５６は、図６のビットストリーム６５０、ＳＰＳ６５２、ＰＰＳ６５４及びスライスヘッダ６５６と同様である。したがって、簡潔性のために、これらの要素の説明は繰り返さない。

図８の画像データ８５８は、エンコード又はデコードされている画像又はビデオに関連するデータを含む。画像データ８５８は、単に、ビットストリーム８５０内で運ばれるペイロード又はデータと呼ばれ得る。一実施形態では、画像データ８５８は、ＣＲＡピクチャ８０２、１つ以上のトレーリングピクチャ８０４及びシーケンスピクチャピクチャ８０６の終端を含むＣＶＳ８０８（又はＣＬＶＳ）を含む。一実施形態では、ＣＲＡピクチャ８０２はＣＶＳＳピクチャと呼ばれる。ＣＶＳ８０８のためのデコーディングプロセスは常にＣＲＡピクチャ８０２から始まる。

図８に示すように、ＣＶＳ８０８内のＣＲＡピクチャ８０２、トレーリングピクチャ８０４及びシーケンスピクチャ８０６の終端のそれぞれは、それら自身のＶＣＬＮＡＬユニット８３０内に含まれる。ＣＶＳ８０８内のＶＣＬＮＡＬユニット８３０のセットはアクセスユニットと呼ばれ得る。

図９は、一方向インター予測９００の一例を示す概略図である。一方向インター予測９００は、ピクチャを分割する際に生成されるエンコード及び／又はデコードされたブロックの動きベクトルを決定するために用いることができる。

一方向インター予測９００は、現在のフレーム９１０内の現在のブロック９１１を予測するために参照ブロック９３１を有する参照フレーム９３０を用いる。参照フレーム９３０は、図示のように、現在のフレーム９１０の後に（例えば、後続の参照フレームとして）時間的に位置し得るが、一部の例では、現在のフレーム９１０の前に（例えば、先行する参照フレームとして）時間的に位置していてもよい。現在のフレーム９１０は特定の時間にエンコード／デコードされる例示のフレーム／ピクチャである。現在のフレーム９１０は、参照フレーム９３０の参照ブロック９３１内のオブジェクトと一致する、現在のブロック９１１内のオブジェクトを含む。参照フレーム９３０は、現在のフレーム９１０をエンコードするための参照として用いられるフレームであり、参照ブロック９３１は、現在のフレーム９１０の現在のブロック９１１にも含まれるオブジェクトを含む、参照フレーム９３０内のブロックである。

現在のブロック９１１は、コーディングプロセスにおける特定の時点でエンコード／デコードされる任意のコーディングユニットである。現在のブロック９１１は、分割されたブロックの全体であり得るか又はアフィン相互予測モードを用いた場合のサブブロックであり得る。現在のフレーム９１０は、ある時間的距離（ＴＤ）９３３によって基準フレーム９３０から分離されている。ＴＤ９３３は、ビデオシーケンスにおける現在のフレーム９１０と参照フレーム９３０との間の時間を示し、フレーム単位で測定され得る。現在のブロック９１１のための予測情報は、方向及びフレーム間の時間的距離を示す参照インデックスにより参照フレーム９３０及び／又は参照ブロック９３１を参照し得る。ＴＤ９３３によって表される期間にわたって、現在のブロック９１１内のオブジェクトは現在のフレーム９１０内の位置から参照フレーム９３０内の別の位置（例えば、参照ブロック９３１の位置）に移動する。例えば、オブジェクトは、オブジェクトの経時的な移動の方向である動き軌道９１３に沿って移動し得る。動きベクトル９３５は、ＴＤ９３３に亘る動き起動９１３に沿ったオブジェクトの動きの方向及び大きさを記述する。したがって、エンコードされた動きベクトル９３５、参照ブロック９３１及び現在のブロック９１１と参照ブロック９３１と差を含む残差は、現在のブロック９１１を再構成し、現在のフレーム９１０内に現在のブロック９１１を位置決めするのに十分な情報を提供する。

図１０は、双方向インター予測１０００の一例を示す概略図である。双方向インター予測１０００は、ピクチャを分割する際に生成されるエンコード及び／又はデコードされたブロックのための動きベクトルを決定するために用いることができる。

双方向インター予測１０００は一方向インター予測９００と同様であるが、現在のフレーム１０１０内の現在のブロック１０１１を予測するために一対の参照フレームを用いる。そのため、現在のフレーム１０１０及び現在のブロック１０１１は、それぞれ現在のフレーム７１０及び現在のブロック７１１と実質的に同様である。現在のフレーム１０１０は、ビデオシーケンスの現在のフレーム１０１０の前に現れる先行参照フレーム１０２０と、ビデオシーケンスの現在のフレーム１０１０の後に現れる後続参照フレーム１０３０との間に時間的に位置し得る。先行参照フレーム１０２０及び後続参照フレーム１０３０は、他の点では参照フレーム９３０と実質的に同様である。

現在のブロック１０１１は、先行参照フレーム１０２０内の先行参照ブロック１０２１と及び後続参照フレーム１０３０内の後続参照ブロック１０３１とマッチングされる。このような一致は、ビデオシーケンスにわたって、オブジェクトが先行参照ブロック１０２１における位置から後続参照ブロック１０３１における位置に、動き軌道１０１３に沿って且つ現在のブロック１０１１を介して移動することを示す。現在のフレーム１０１０は、ある先行する時間的距離（ＴＤ０）１０２３先行参照フレーム１０２０から分離され、ある後続時間的距離（ＴＤ１）１０３３後続参照フレーム１０３０から分離されている。ＴＤ０１０２３は、ビデオシーケンスにおける先行参照フレーム１０２０と現在のフレーム１０１０との間の時間をフレーム単位で示す。ＴＤ１１０３３は、ビデオシーケンスにおける現在のフレーム１０１０と後続参照フレーム１０３０との間の時間をフレーム単位で示す。そのため、オブジェクトは、ＴＤ０１０２３によって示される期間にわたって、動き軌道１０１３に沿って、先行参照ブロック１０２１から現在のブロック１０１１に移動する。また、オブジェクトは、ＴＤ１１０３３によって示される期間にわたって、動き軌道１０１３に沿って現在のブロック１０１１から後続参照ブロック１０３１に移動する。現在のブロック１０１１のための予測情報は、方向及びフレーム間の時間的距離を示す一対の参照インデックスにより、先行参照フレーム１０２０及び／又は先行参照ブロック１０２１と、後続参照フレーム１０３０及び／又は後続参照ブロック１０３１を参照し得る。

先行動きベクトル（ＭＶ０）１０２５は、ＴＤ０１０２３にわたる（例えば、先行参照フレーム１０２０と現在のフレーム１０１０との間）、動き軌道１０１３に沿ったオブジェクトの移動の方向及び大きさを記述する。後続動きベクトル１０３５は、ＴＤ１１０３３にわたる（例えば、現在のフレーム１０１０と後続参照フレーム１０３０との間）、動き軌道１０１３に沿ったオブジェクトの移動の方向及び大きさを記述する。そのため、双方向インター予測１０００では、現在のブロック１０１１は、先行参照ブロック１０２１及び／又は後続参照ブロック１０３１、ＭＶ０１０２５及びＭＶ１１０３５を用いることによりコード化及び再構成することができる。

一実施形態では、ブロック毎ではなく、サンプル毎（例えば、ピクセル毎）にインター予測及び／又は双方向インター予測が行われ得る。すなわち、先行参照ブロック１０２１及び／又は後続参照ブロック１０３１内の各サンプルを指す動きベクトルは、現在のブロック１０１１内の各サンプルに対して決定され得る。そのような実施形態では、図１０に示す動きベクトル１０２５及び動きベクトル１０３５は、現在のブロック１０１１、先行参照ブロック１０２１及び後続参照ブロック１０３１内の複数のサンプルに対応する複数の動きベクトルを表す。

マージモード及びアドバンスト動きベクトル予測（ＡＭＶＰ）モードの両方において、候補リスト決定パターンによって定義された順序で候補動きベクトルを候補リストに追加することによって候補リストが生成される。そのような候補動作ベクトルは、一方向インター予測９００、双方向インター予測１０００又はそれらの組み合わせに従った動きベクトルを含み得る。具体的には、動きベクトルは、そのようなブロックがエンコードされた場合に、隣接するブロックのために生成される。そのような動きベクトルは、現在のブロックのための候補リストに追加され、現在のブロックのための動きベクトルが候補リストから選択される。次いで、動きベクトルは、候補リスト内の選択された動きベクトルのインデックスとして伝達され得る。デコーダは、エンコーダと同じプロセスを用いて候補リストを構築でき、伝達されたインデックスに基づいて、候補リストから選択された動きベクトルを決定することができる。そのため、候補動きベクトルは、そのような隣接ブロックがエンコードされる場合にどのアプローチが用いられるかに応じて、一方向インター予測９００及び／又は双方向インター予測１０００に従って生成される動きベクトルを含む。

図１１は、例示の参照ピクチャリスト構造１１００を示す概略図である。参照ピクチャリスト構造１１００は、一方向インター予測９００及び／又は双方向インター予測１０００で用いられる参照ピクチャ及び／又はインターレイヤー参照ピクチャの表示を記憶するために用いることができる。そのため、参照ピクチャリスト構造１１００は、方法１００を行う際に、コーデックシステム２００、エンコーダ３００及び／又はデコーダ４００によって用いることができる。

ＲＰＬ構造としても知られる参照ピクチャリスト構造１１００は、ＲＰＬ０１１１１及びＲＰＬ１１１２等の複数の参照ピクチャリストを含むアドレス可能な構文構造である。参照ピクチャリスト構造１１００は、例に応じて、ＳＰＳ、ピクチャヘッダ及び／又はビットストリームのスライスヘッダに記憶され得る。ＲＰＬ０１１１１及びＲＰＬ１１１１等の参照ピクチャリストは、インター予測及び／又はインターレイヤー予測のために用いられる参照ピクチャのリストである。具体的には、一方向インター予測９００によって用いられる参照ピクチャはＲＰＬ０１１１１に記憶され、双方向インター予測１０００によって用いられる参照ピクチャは、ＲＰＬ０１１１１及びＲＰＬ１１１１２の両方に記憶される。例えば、双方向インター予測１０００は、ＲＰＬ０１１１１からの１つの参照ピクチャ及びＲＰＬ１１１１２からの１つの参照ピクチャを用いり得る。ＲＰＬ０１１１１およびＲＰＬ１１１１２のそれぞれは複数のエントリ１１１５を含み得る。参照ピクチャリスト構造エントリ１１１５は、ＲＰＬ０１１１１及び／又はＲＰＬ１１１１２等の参照ピクチャリストに関連する参照ピクチャを示す、参照ピクチャリスト構造１１００内のアドレス指定可能な位置である。

特定の例では、参照ピクチャリスト構造１１００はref_pic_list_struct(listIdx、rplsIdx)と表記することができ、listIdx１１２１は参照ピクチャリストＲＰＬ０１１１１及び／又はＲＰＬ１１１１２を特定し、rplsIdx１１２５は参照ピクチャリスト内のエントリ１１１５を特定する。したがって、ref_pic_list_structは、listIdx１１２１及びrplsIdx１１２５に基づいてエントリ１１１５を返す構文構造である。エンコーダは、ビデオシーケンス内の各非イントラコード化スライスのために参照ピクチャリスト構造１１００の一部をエンコードできる。次いで、デコーダは、コード化されたビデオシーケンス内の各非コード化スライスをデコードする前に、参照ピクチャリスト構造１１００の対応する部分を解決することができる。一実施形態では、本明細書で説明する参照ピクチャリストは、エンコーダ又はデコーダに記憶される情報を用いて、エンコーダ又はデコーダによってコード化、構築、導出又はさもなければ取得され、ビットストリームから少なくとも部分的に得られる。

図１２Ａ～図１２Ｃは、インターレースビデオコーディングの一例を集合的に示す概略図である。インターレースビデオコーディングは、図１２Ａ及び図１２Ｂに示す第１のピクチャ１２０１及び第２のピクチャ１２０２から、図１２Ｃに示すようにインターレースビデオフレーム１２００を生成する。例えば、インターレースビデオコーディングは、インターレースビデオフレーム１２００を含むビデオをエンコードする場合に、方法１００の一部としてコーデックシステム２００及び／又はエンコーダ３００等のエンコーダによって用いられ得る。また、コーデックシステム２００及び／又はデコーダ４００等のデコーダは、インターレースビデオフレーム１２００を含むビデオをデコードし得る。加えて、インターレースビデオフレーム１２００は、図１３に関して以下でより詳細に説明するように、図５のＣＶＳ５００等のＣＶＳにコーディングされ得る。

インターレースビデオコーディングを行う場合、第１のフィールド１２１０は、図１２Ａに示すように第１の時間に取り込まれ、第１のピクチャ１２０１にエンコードされる。第１のフィールド１２１０はビデオデータの水平線を含む。具体的には、第１のフィールド１２１０内のビデオデータの水平線は、第１のピクチャ１２０１の左側境界から第１のピクチャ１２０１の右側境界に延びる。しかしながら、第１のフィールド１２１０はビデオデータの交互の行を省略する。例示の実施では、第１のフィールド１２１０は、第１の時間にビデオキャプチャ装置によって取り込まれたビデオデータの半分を含む。

図１２Ｂに示すように、第２のフィールド１２１２は、第２の時間に取り込まれ、第２のピクチャ１２０２にエンコードされる。例えば、第２の時間は、ビデオのために設定されたフレームレートに基づいて設定された値だけ第１の時間の直後にあり得る。例えば、毎秒１５フレーム（ＦＰＳ）のフレームレートで表示されるよう設定されたビデオでは、第２の時間は、第１の時間の１５分の１秒後に起こり得る。図示のように、第２のフィールド１２１２は、第１のピクチャ１２０１の第１のフィールド１２１０の水平線に相補的なビデオデータの水平線を含む。具体的には、第２のフィールド１２１２内のビデオデータの水平線は、第２のピクチャ１２０２の左側境界から第２のピクチャ１２０２の右側境界に延びる。第２のフィールド１２１２は、第１のフィールド１２１０によって省略される水平線を含む。加えて、第２のフィールド１２１２は、第１のフィールド１２１０に含まれる水平線を省略する。

第１のピクチャ１２０１の第１のフィールド１２１０及び第２のピクチャ１２０２の第２のフィールド１２１２は、図１２Ｃに示すように、インターレースビデオフレーム１２００としてデコーダで表示するために組み合わせることができる。具体的には、インターレースビデオフレーム１２００は、第１の時間に取り込まれた第１のピクチャ１２０１の第１のフィールド１２１０と、第２の時間に取り込まれた第２のピクチャ１２０２の第２のフィールド１２１２とを含む。そのような組み合わせは、強調及び／又は誇張された動きの視覚的効果を有する。ビデオの一部として表示された場合、一連のインターレースビデオフレーム１２００は、追加フレームを実際にエンコードする必要なしに、高められたフレームレートでビデオがエンコードされた印象を作り出す。このように、インターレースビデオフレーム１２００を用いるインターレースビデオコーディングは、ビデオデータサイズを付随的に増加することなしに、ビデオの有効フレームレートを高めることができる。そのため、インターレースビデオコーディングは、エンコードされたビデオシーケンスのコーディング効率を高め得る。

図１３は、例えば、インターレースビデオフレーム１２００を生成するために、インターレースビデオコーディングと、リーディングピクチャと両方を用いる例示のＣＶＳ１３００を示す概略図である。ＣＶＳ１３００はＣＶＳ５００に実質的に同様であるが、第１のピクチャ１２０１及び第２のピクチャ１２０２等のフィールドを有するピクチャをエンコードするように変更されている一方で、リーディングピクチャを保持する。例えば、ＣＶＳ１３００は、方法１００に従ってコーデックシステム２００及び／又はエンコーダ３００等のエンコーダによりエンコードされ得る。また、ＣＶＳ１３００は、コーデックシステム２００及び／又はデコーダ４００等のデコーダによりデコードされ得る。

ＣＶＳ１３００は、それぞれデコーディング順序５０８及び提示順序５１０と実質的に同様の方法で動作する、デコーディング順序１３０８及び提示順序１３１０（別名、出力順序）を有する。ＣＶＳ１３００は、ＩＲＡＰピクチャ１３０２、リーディングピクチャ１３０４及びトレーリングピクチャ１３０６を含み、これらは、ＩＲＡＰピクチャ５０２、リーディングピクチャ５０４及びトレーリングピクチャ５０６と同様である。相違点は、ＩＲＡＰピクチャ１３０２、リーディングピクチャ１３０４及びトレーリングピクチャ１３０６の全ては、図１２Ａ～図１２Ｃに関して説明した第１のフィールド１２１０及び第２のフィールド１２１２と実質的に同様の方法でフィールドを用いることによりコード化されることである。そのため、各フレームは２つのピクチャを含む。したがって、ＣＶＳ１３００はＣＶＳ５００の２倍のピクチャを含む。しかしながら、ＣＶＳ１３００は、ＣＶＳ１３００のピクチャのそれぞれがフレームの半分を省略しているため、ＣＶＳ５００とほぼ同じ量のデータを含む。

ＣＶＳ１３００の問題は、イントラ予測コード化データの第１のフィールドを含むことによってＩＲＡＰピクチャ１３０２がエンコードされていることである。そして、イントラ予測コード化データの第２のフィールドは非リーディングピクチャ１３０３に含まれる。デコーダがＣＶＳ１３００のデコーディングを非リーディングピクチャ１３０３で開始できないため、非リーディングピクチャ１３０３はＩＲＡＰピクチャ１３０２ではない。これは、そうすることで、ＩＲＡＰピクチャ１３０２に関連するフレームの半分が省略され得るからである。これは、ＶＶＣを用いるビデオコーディングシステムは、デコーディング順序１３０８においてＩＲＡＰピクチャ１３０２の直後にリーディングピクチャ１３０４を位置決めするように制約され得るため問題を生じる。

一実施形態では、単一の非リーディングピクチャ１３０３がＩＲＡＰピクチャ１３０２とリーディングピクチャ１３０４との間に配置されることが許容される場合を示すために、フラグが伝達され得る。ビデオシステムは、非リーディングピクチャ１３０３及び／又はトレーリングピクチャ１３０６がリーディングピクチャ１３０４の間に配置されるのを防止するよう依然として制約され得る。したがって、フラグは、デコーディング順序１３０８が、ＩＲＡＰピクチャ１３０２、単一の非リーディングピクチャ１３０３、任意のリーディングピクチャ１３０４（例えば、リーディングピクチャ１３０４は任意であり、一部の例では省略され得る）、そして１つ以上のトレーリングピクチャ１３０６を含むことを示し得る。そのため、フラグは、ＣＶＳ５００又はＣＶＳ１３００のいずれを予期するかをデコーダに示すことができる。

図１４は、ピクチャ１４１０のための分割技術１４００を示す。ピクチャ１４１０は、本明細書で説明した任意のピクチャ（例えば、ピクチャ５０２～５０６、６０２～６０６、７０２～７０４及び８０２～８０６）と同様であり得る。図示のように、ピクチャ１４１０は複数のスライス１４１２に分割され得る。スライスは、同一フレーム内の任意の他の領域から別々にエンコードされる、フレーム（例えば、ピクチャ）の空間的に区別可能な領域である。３つのスライス１４１２を図１４に示しているが、より多くの又はより少ないスライスが実際の用途で用いられ得る。各スライス１４１２は複数のブロック１４１４に分割され得る。図１４のブロック１４１４は、図１０の現在のブロック１０１１、先行参照ブロック１０２１及び後続参照ブロック１０３１と同様であり得る。ブロック１４１４はＣＵを表し得る。４つのブロック１４１４を図１４に示しているが、より多くの又はより少ないブロックが実際の用途で用いられ得る。

図１５はデコーディングの方法１５００の一実施形態である。方法１５００は、ビデオデコーダ（例えば、デコーダ４００）によって用いることができる。方法１５００は、ビデオエンコーダ（例えば、ビデオエンコーダ３００）からコード化されたビデオビットストリームが直接又は間接的に受信された後で行われ得る。方法１５００は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限することにより、デコーディングプロセスを改善する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。したがって。実際問題として、コーデックの性能が改善され、より良好なユーザ体験につながる。

ブロック１５０２では、ビデオデコーダは、現在のピクチャを含むコード化されたビデオビットストリームを受信する。ブロック１５０４では、ビデオデコーダは、現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得る。一実施形態では、参照ピクチャリストは、デコーダに記憶された情報、少なくとも部分的にビットストリームから得られる情報を用いてデコーダによってコード化、構成又はさもなければ得られる。

ブロック１５０６では、ビデオデコーダは、現在のピクチャがクリーンランダムアクセス（ＣＲＡ）ピクチャであることを判定する。ＣＲＡピクチャは、出力順序又はデコーディング順序において、該デコーディング順序で先行する任意のイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行する、第１の参照ピクチャリスト又は第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとすることを表す。

一実施形態では、先行するＩＲＡＰピクチャは、出力順序又はデコーディング順序においてＣＲＡピクチャに先行する。一実施形態では、先行するＩＲＡＰピクチャは、ＣＲＡピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始する。一実施形態では、第１の参照ピクチャリストはＲｅｆＰｉｃＬｉｓｔ［０］に指定され、第２の参照ピクチャリストはＲｅｆＰｉｃＬｉｓｔ［１］に指定されている。

ブロック１５０８で、ビデオデコーダは、第１の参照ピクチャリスト及び第２の参照ピクチャリストの一方又は両方に基づいて、ＣＲＡピクチャの各スライスをデコードする。一実施形態では、デコーディング順序におけてＣＲＡピクチャに後続する１つ以上のピクチャは、インター予測を用いてデコードされる。一実施形態では、方法１５００は、ビデオデコーダのディスプレイ上に、ＣＲＡピクチャに基づいて生成された画像を表示することをさらに含む。

図１６は、エンコーディングの方法１６００の一実施形態である。方法１６００は、ビデオエンコーダ（例えば、ビデオエンコーダ３００）によって用いることができる。この方法は、（例えば、ビデオからの）ピクチャがビデオビットストリームにエンコードされ、次いでビデオデコーダ（例えば、ビデオデコーダ４００）に向けて送信されるときに行われ得る。方法１６００は、ビデオエンコーダ（例えば、ビデオエンコーダ３００）からコード化されたビデオビットストリームが直接又は間接的に受信された後で行われ得る。方法１５００は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限することにより、エンコーディングプロセスを改善する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。したがって。実際問題として、コーデックの性能が改善され、より良好なユーザ体験につながる。

ブロック１６０２では、現在のピクチャがクリーンランダムアクセス（ＣＲＡ）ピクチャを含む場合に、ビデオエンコーダは第１の参照ピクチャリスト及び第２の参照ピクチャリストを得る。一実施形態では、出力順序又はデコーディング順序において、該デコーディング順序で先行する任意のイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行する、該第１の参照ピクチャリスト又は該第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとする。一実施形態では、参照ピクチャリストは、デコーダに記憶された情報、少なくとも部分的にビットストリームから得られる情報等を用いてデコーダによってコード化、構成又はさもなければ得られる。

ブロック１６０４では、ビデオエンコーダは、ＣＲＡピクチャと、第１の参照ピクチャリスト及び第２の参照ピクチャリストの一方又は両方をビデオビットストリームにエンコードする。

ブロック１６０６では、ビデオエンコーダは、ビデオデコーダに向けた伝送が保留されているビデオビットストリームを記憶する。一実施形態では、ビデオエンコーダは、ビデオデコーダに向けてビデオビットストリームを送信する。

図１７は、デコーディングの方法１７００の一実施形態である。方法１７００は、ビデオデコーダ（例えば、デコーダ４００）によって用いることができる。方法１７００は、ビデオエンコーダ（例えば、ビデオエンコーダ３００）からコード化されたビデオビットストリームが直接又は間接的に受信された後で行われ得る。方法１７００は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限することにより、デコーディングプロセスを改善する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。したがって。実際問題として、コーデックの性能が改善され、より良好なユーザ体験につながる。

ブロック１７０２では、ビデオデコーダは、現在のピクチャを含むコード化されたビデオビットストリームを受信する。ブロック１７０４では、ビデオデコーダは、現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得る。一実施形態では、参照ピクチャリストは、デコーダに記憶された情報、少なくとも部分的にビットストリームから得られる情報等を用いてデコーダによってコード化、構成又はさもなければ得られる。

ブロック１７０６では、ビデオデコーダは、ビデオデコーダは、現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャであると判定する。トレーリングピクチャは、現在のピクチャに関連するＩＲＡＰピクチャのための利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成された第１の参照ピクチャリスト又は第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとすることを表す。一実施形態では、同じＩＲＡＰピクチャは、トレーリングピクチャ及び１つ以上のリーディングピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始する。

場合によっては、ピクチャはＤＰＢを更新することなくランダムアクセスポイントとして用いられる。例えば、ＧＤＲピクチャ及びＣＲＡピクチャをランダムアクセスポイントとして用いてもよく、ＤＰＢを更新しない場合がある。したがって、ＧＤＲピクチャ及び／又はＣＲＡピクチャに関連するＧＤＲピクチャ及びインターコード化されたピクチャは、ＧＤＲ／ＣＲＡピクチャに先行するＤＰＢ内の参照ピクチャを参照し得る。ＧＤＲ／ＣＲＡピクチャがランダムアクセスポイントとして用いられる場合、ＧＤＲ／ＣＲＡピクチャはビデオシーケンスを表示するための開始点として用いられるため、デコーダにおけるＤＰＢで空であり得る。そのため、現在のピクチャは、エンコーディングの間にエンコーダで利用可能であるが、参照ピクチャが送信されていないためデコーダでは利用可能でないビデオシーケンス内の先行するピクチャを参照し得る。そのような参照ピクチャは利用不能な参照ピクチャと呼ばれる。そのような場合、利用不能な参照ピクチャを生成するためのプロセスをデコーダで呼び出すことができる。利用不能な参照ピクチャを生成するプロセスは、利用不能な参照ピクチャの大まかな近似値を生成するためにビットストリームパラメータを用いる。生成された利用不能な参照ピクチャの品質は表示には不十分なため、生成された利用不能な参照ピクチャは表示されなくてもよい。しかしながら、生成された利用不能な参照ピクチャは、利用不能な参照ピクチャを参照する現在のピクチャのデコードをサポートするのに十分なデータを提供する。

一実施形態では、利用不能な参照画像を生成するためのデコーディングプロセスは、ＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいクリーンランダムアクセス（ＣＲＡ）ピクチャ又はＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しい漸進的デコーディングリフレッシュ（ＧＤＲ）ピクチャについて、コード化ピクチャ毎に１度呼び出される。

利用不能な参照ピクチャを生成するためのデコーディングプロセスが呼び出された場合、以下が適用される。

－「参照ピクチャなし」に等しい各RefPicList[i][j]（ｉは０～１の範囲であり、ｊは０～num_ref_entries[i][RplsIdx[i]]－１の範囲である）の場合、ＶＶＣ規格の第８.３.４.２項「１つの利用不能なピクチャの生成」で規定されているようにピクチャが生成され、以下が適用される。

－生成されたピクチャのnuh_layer_idの値は、現在のピクチャのnuh_layer_idに等しく設定される。

－もし、st_ref_pic_flag[i][RplsIdx[i]][j]が１と等しく、inter_layer_ref_pic_flag[i]
[RplsIdx[i]][j]が０と等しい場合、生成されたピクチャのPicOrderCntValの値はRefPicPocList[i][j]と等しく設定され、生成されたピクチャは「短期の参照のために使用」とマークされる。

－さもなければ、st_ref_pic_flag[i][RplsIdx[i]][j]が０と等しくinter_layer_ref_pic_flag[i][RplsIdx[i]][j]が０と等しい場合、生成されたピクチャのPicOrderCntValの値はRefPicLtPocList[i][j]と等しく設定され、生成されたピクチャのph_pic_order_cnt_lsbの値は(RefPicLtPocList[i][j]
& (MaxPicOrderCntLsb -１))と等しいと推測され、生成されたピクチャは「長期の参照のために使用」とマークされる。

－生成された参照ピクチャのPictureOutputFlagの値は０と等しく設定される。

－RefPicList[i][j]は、生成された参照ピクチャに設定される。

１つの利用不能なピクチャの生成は以下の通りである。

このプロセスが呼び出されると、利用不能なピクチャは以下のように生成される。

ピクチャのサンプルアレイＳＬの各要素の値は１<<(BitDepth－１)に等しく設定される。

ChromaArrayTypeが０と等しくない場合、ピクチャのサンプルアレイＳＣｂ及びＳＣｒの各要素の値は１<<(BitDepth－１)に等しく設定される。

予測モードCuPredMode[0][x][y]はＭＯＤＥ＿ＩＮＴＲＡに等しく設定され、ｘは０～pps_pic_width_in_luma_samples-１の範囲であり、ｙは０～pps_pi_height_in_luma_samples-１の範囲である。

注記－出力順序及びデコーディング順序において、NoOutputBeforeRecoveryFlagが１に等しいＧＤＲピクチャに後続するリカバリポイントピクチャ及びそのリカバリポイントピクチャに後続するピクチャの出力は、SL、SCb、SCr、CuPredMode[0][x][y]の要素に設定された値とは無関係である。

nuh_layer_idは、ＶＣＬＮＡＬユニットが属する層の識別子又は非ＶＣＬＮＡＬユニットが適用される層の識別子を規定する。RplsIdxは参照ピクチャリストインデックスである。st_ref_pic_flagは、参照ピクチャリストが短期参照ピクチャエントリであるかどうかを示す、参照ピクチャリスト構文構造におけるフラグである。PicOrderCntValは、ピクチャオーダーカウント（ＰＯＣ）の値を表す。MaxPicOrderCntLsbは、最大ピクチャオーダカウントの最下位ビットを表す。PictureOutputFlagは、ピクチャが出力されるかどうかを示すフラグである。

ブロック１７０８では、ビデオデコーダは、第１の参照ピクチャリスト及び第２の参照ピクチャリストの一方又は両方に基づいて、トレーリングピクチャの各スライスをデコードする。一実施形態では、同じＩＲＡＰピクチャはイントラ予測を用いてデコードされ、トレーリングピクチャ及び１つ以上のリーディングピクチャは、インター予測を用いてデコードされる。一実施形態では、方法１７００は、ビデオデコーダのディスプレイ上に、トレーリングピクチャに基づいて生成された画像を表示することをさらに含む。

図１８は、エンコーディングの方法１８００の一実施形態である。方法１８００は、ビデオエンコーダ（例えば、ビデオエンコーダ３００）によって用いることができる。この方法は、（例えば、ビデオからの）ピクチャがビデオビットストリームにエンコードされ、次いでビデオデコーダ（例えば、ビデオデコーダ４００）に向けて送信されるときに行われ得る。方法１８００は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限することにより、エンコーディングプロセスを改善する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。したがって。実際問題として、コーデックの性能が改善され、より良好なユーザ体験につながる。

ブロック１８０２では、ビデオエンコーダは、現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャである場合に、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得る。一実施形態では、現在のピクチャに関連するＩＲＡＰピクチャのための利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成された第１の参照ピクチャリスト又は第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとする。一実施形態では、参照ピクチャリストは、デコーダに記憶された情報、少なくとも部分的にビットストリームから得られる情報等を用いてデコーダによってコード化、構成又はさもなければ得られる。

一実施形態では、利用不能な参照画像を生成するためのデコーディングプロセスは、ＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいクリーンランダムアクセス（ＣＲＡ）ピクチャ又はＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しい漸進的デコーディングリフレッシュ（ＧＤＲ）ピクチャについて、コード化されたピクチャ毎に１度呼び出される。

一実施形態では、ビデオエンコーダは、ＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１と等しい度にチェックを行って、参照ピクチャリストが先のＣＶＳからの参照ピクチャを参照しないよう確実にすることができる。ＣＲＡ又はＧＤＲピクチャがランダムアクセスポイントとして選択された場合に、ビデオデコーダにおいてそのようなピクチャは利用できない場合があるからである。そのような場合、ビデオデコーダもこのチェックを行うため、ビデオエンコーダはこのチェックを行う。

一実施形態では、同じＩＲＡＰピクチャは、トレーリングピクチャ及び１つ以上のリーディングピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始する。一実施形態では、同じＩＲＡＰピクチャは、イントラ予測を用いてビデオビットストリームにエンコードされ、トレーリングピクチャ及び１つ以上のリーディングピクチャは、インター予測を用いてエンコードされる。

ブロック１８０４では、ビデオエンコーダは、トレーリングピクチャ及び第１の参照ピクチャリスト及び第２の参照ピクチャリストの一方又は両方をビデオビットストリームにエンコードする。

ブロック１８０６では、ビデオエンコーダは、ビデオデコーダに向けた伝送が保留されているビデオビットストリームを記憶する。一実施形態では、ビデオエンコーダは、ビデオデコーダに向けてビデオビットストリームを送信する。

図１９は、デコーディングの方法１９００の一実施形態である。方法１９００は、ビデオデコーダ（例えば、デコーダ４００）によって用いることができる。方法１９００は、ビデオエンコーダ（例えば、ビデオエンコーダ３００）からコード化されたビデオビットストリームが直接又は間接的に受信された後で行われ得る。方法１９００は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限することにより、デコーディングプロセスを改善する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。したがって。実際問題として、コーデックの性能が改善され、より良好なユーザ体験につながる。

ブロック１９０２では、ビデオデコーダが、現在のピクチャを含むコード化されたビデオビットストリームを受信する。ブロック１９０４では、ビデオデコーダは、現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得る。一実施形態では、参照ピクチャリストは、デコーダに記憶された情報、少なくとも部分的にビットストリームから得られる情報等を用いてデコーダによってコード化、構成又はさもなければ得られる。

ブロック１９０６では、ビデオデコーダは、現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャであると判定する。トレーリングピクチャは、出力順序又はデコーディング順序において同じＩＲＡＰピクチャに先行する、第１の参照ピクチャリスト又は第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとすることを表す。

一実施形態では、同じＩＲＡＰピクチャは、トレーリングピクチャ及び１つ以上のリーディングピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始する。

ブロック１９０８では、ビデオデコーダは、第１の参照ピクチャリスト及び第２の参照ピクチャリストの一方又は両方に基づいて、トレーリングピクチャの各スライスをデコードする。一実施形態では、同じＩＲＡＰピクチャはイントラ予測を用いてデコードされ、トレーリングピクチャ及び１つ以上のリーディングピクチャは、インター予測を用いてデコードされる。一実施形態では、方法１９００は、ビデオデコーダのディスプレイ上に、トレーリングピクチャに基づいて生成された画像を表示することをさらに含む。

図２０は、エンコーディングの方法２０００の一実施形態である。方法２０００は、ビデオエンコーダ（例えば、ビデオエンコーダ３００）によって用いることができる。この方法は、（例えば、ビデオからの）ピクチャがビデオビットストリームにエンコードされ、次いでビデオデコーダ（例えば、ビデオデコーダ４００）に向けて送信されるときに行われ得る。方法２０００は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限することにより、エンコーディングプロセスを改善する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。したがって。実際問題として、コーデックの性能が改善され、より良好なユーザ体験につながる。

ブロック２００２では、現在のピクチャが、デコーディング順序及び出力順序の両方において、同じイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャである場合に、ビデオエンコーダは第１の参照ピクチャリスト及び第２の参照ピクチャリストを得る。一実施形態では、出力順序又はデコーディング順序において同じＩＲＡＰピクチャに先行する、第１の参照ピクチャリスト又は第２の参照ピクチャリスト内のエントリによってピクチャが参照されないものとする。一実施形態では、参照ピクチャリストは、デコーダに記憶された情報、少なくとも部分的にビットストリームから得られる情報等を用いてデコーダによってコード化、構成又はさもなければ得られる。

一実施形態では、同じＩＲＡＰピクチャは、トレーリングピクチャ及び１つ以上のリーディングピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始する。一実施形態では、同じＩＲＡＰピクチャは、イントラ予測を用いてビデオビットストリームにエンコードされ、トレーリングピクチャ及び１つ以上のリーディングピクチャは、インター予測を用いてエンコードされている。

ブロック２００４では、ビデオエンコーダは、トレーリングピクチャと、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの一方又は両方とをビデオビットストリームにエンコードする。

ブロック２００６では、ビデオエンコーダは、ビデオデコーダに向けた伝送が保留されているビデオビットストリームを記憶する。一実施形態では、ビデオエンコーダは、ビデオデコーダに向けてビデオビットストリームを送信する。

図２１は、デコーディングの方法２１００の一実施形態である。方法２１００は、ビデオデコーダ（例えば、デコーダ４００）によって用いることができる。方法２１００は、ビデオエンコーダ（例えば、ビデオエンコーダ３００）からコード化されたビデオビットストリームが直接又は間接的に受信された後で行われ得る。方法２１００は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限することにより、デコーディングプロセスを改善する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。したがって。実際問題として、コーデックの性能が改善され、より良好なユーザ体験につながる。

ブロック２１０２では、ビデオデコーダは、現在のピクチャを含むコード化されたビデオビットストリームを受信する。ブロック２１０４では、ビデオデコーダは、現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得る。一実施形態では、参照ピクチャリストは、デコーダに記憶された情報、少なくとも部分的にビットストリームから得られる情報等を用いてデコーダによってコード化、構成又はさもなければ得られる。

ブロック２１０６では、ビデオデコーダは、現在のピクチャがランダムアクセスデコーダブルリーディング（ＲＡＤＬ）ピクチャであると判定する。ＲＡＤＬピクチャは、ランダムアクセススキップリーディング（ＲＡＳＬ）ピクチャ、利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成されるピクチャ及びデコーディング順序において関連するイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行するピクチャ、のうちのいずれかであるアクティブエントリが第１の参照ピクチャリスト又は第２の参照ピクチャリスト内に存在しないものとすることを表す。一実施形態では、以下のいずれかは、以下のいずれか１つを意味し得る。

一実施形態では、利用不能な参照ピクチャを生成するためのデコーディングプロセスは、ＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいクリーンランダムアクセス（ＣＲＡ）ピクチャ又はＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しい漸進的デコーディングリフレッシュ（ＧＤＲ）ピクチャについて、コード化されたピクチャ毎に１度呼び出される。

ブロック２１０８では、ビデオデコーダは、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの一方又は両方に基づいてＲＡＤＬピクチャの各スライスをデコードする。一実施形態では、方法２１００は、ビデオデコーダのディスプレイ上に、ＲＡＤＬピクチャに基づいて生成された画像を表示することをさらに含む。

図２２は、エンコーディングの方法２２００の一実施形態である。方法２２００は、ビデオエンコーダ（例えば、ビデオエンコーダ３００）によって用いることができる。この方法は、（例えば、ビデオからの）ピクチャがビデオビットストリームにエンコードされ、次いでビデオデコーダ（例えば、ビデオデコーダ４００）に向けて送信されるときに行われ得る。方法２２００は、現在のピクチャが特定の種類のピクチャ（例えば、ＣＲＡピクチャ、トレーリングピクチャ、デコーディング順序及び出力順序の両方において、同じＩＲＡＰピクチャに関連する１つ以上のリーディングピクチャに後続するトレーリングピクチャ及びＲＡＤＬピクチャ）の場合に、参照ピクチャリストが特定のピクチャを参照するエントリを含むことを制限することにより、エンコーディングプロセスを改善する。このように参照ピクチャリストを制限することにより、コーディングエラー及びコーディングに必要な帯域幅及び／又はネットワークリソースの量が従来のコーディング技術に比べて低減され得る。したがって。実際問題として、コーデックの性能が改善され、より良好なユーザ体験につながる。

ブロック２２０２では、現在のピクチャがランダムアクセスデコーダブルリーディング（ＲＡＤＬ）ピクチャの場合に、ビデオエンコーダは、第１の参照ピクチャリスト及び第２の参照ピクチャリストを得る。ランダムアクセススキップリーディング（ＲＡＳＬ）ピクチャ、利用不能な参照ピクチャを生成するためのデコーディングプロセスによって生成されるピクチャ及びデコーディング順序において関連するイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに先行するピクチャのうちのいずれかであるアクティブエントリが第１の参照ピクチャリスト又は第２の参照ピクチャリスト内に存在しないものとする。一実施形態では、利用不能な参照ピクチャを生成するためのデコーディングプロセスは、ＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいクリーンランダムアクセス（ＣＲＡ）ピクチャ又はＮｏＯｕｔＰｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しい漸進的デコーディングリフレッシュ（ＧＤＲ）ピクチャについて、コード化されたピクチャ毎に１度呼び出される。一実施形態では、参照ピクチャリストは、デコーダに記憶された情報、少なくとも部分的にビットストリームから得られる情報等を用いてデコーダによってコード化、構成又はさもなければ得られる。

ブロック２２０４では、ビデオエンコーダは、ＲＡＤＬピクチャと、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの一方又は両方とをビデオビットストリームにエンコードする。

ブロック２２０６では、ビデオエンコーダは、ビデオデコーダに向けた伝送が保留されているビデオビットストリームを記憶する。一実施形態では、ビデオエンコーダは、ビデオデコーダに向けてビデオビットストリームを送信する。

図２３は、例示のビデオコーディング装置２３００の概略図である。ビデオコーディング装置２３００は、本明細書で説明した開示の例／実施形態を実施するのに適している。ビデオコーディング装置２３００は、下流ポート２３１０、上流ポート２３５０及び／又は、ネットワークにわたってデータを上流及び／又は下流に通信するための送信機及び／又は受信機を含むトランシーバユニット（Ｔｘ／Ｒｘ）２３２０、２３４０を含む。ビデオコーディング装置２３００は、データを処理するための論理ユニット及び／又は中央処理装置（ＣＰＵ）を含むプロセッサ２３３０と、データを記憶するためのメモリ２３６０とを含む。ビデオコーディング装置２３００は、電気、光又は無線通信ネットワークを介してデータを通信するために、上流ポート２３５０及び／又は下流ポート２３１０に連結される、光／電気（ＯＥ）コンポーネント、電気／光(ＥＯ)コンポーネント及び／又は無線通信コンポーネントも含み得る。ビデオコーディング装置２３００は、ユーザとの間でデータを通信するための入力及び／又は出力（Ｉ／Ｏ）装置２３８０も含み得る。Ｉ／Ｏ装置２３８０は、ビデオデータを表示するためのディスプレイ、オーディオデータを出力するためのスピーカ等の出力装置を含み得る。Ｉ／Ｏ装置２３８０は、キーボード、マウス、トラックボール等の入力装置及び／又はそのような出力装置とやりとりするための対応するインターフェースも含み得る。

プロセッサ２３３０は、ハードウェア及びソフトウェアによって実施される。プロセッサ２３３０は、１つ以上のＣＰＵチップ、コア（例えば、マルチコアプロセッサ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）及びデジタル信号プロセッサ（ＤＳＰ）として実施され得る。プロセッサ２３３０は、下流ポート２３１０、Ｔｘ／Ｒｘ２３２０、２３４０、上流ポート２３５０及びメモリ２３６０と通信する。プロセッサ２３３０はコーディングモジュール２３１４を含む。コーディングモジュール２３７０は、本明細書で説明した開示の実施形態を実施し、本明細書で説明した任意の他の方法／メカニズムも実施し得る。また、コーディングモジュール２３７０は、コーデックシステム２００、エンコーダ３００及び／又はデコーダ４００を実施し得る。例えば、コーディングモジュール２３７０は、上述したように、参照ピクチャを管理してインターレイヤー予測をサポートするために、参照ピクチャ構造内のインターレイヤー残差予測（ＩＬＲＰ）フラグ及び／又はＩＬＲＰ層インジケータをコーディングするために用いられ得る。そのため、コーディングモジュール２３７０は、ビデオデータをコーディングする際に、ビデオコーディング装置２３００に付加の機能及び／又はコーディング効率を提供させる。そのため、コーディングモジュール２３１４は、ビデオコーディング装置２３００の機能を改善するとともに、ビデオコーディング技術に特有の問題に対処する。また、コーディングモジュール２３７０は、ビデオコーディング装置２３００の異なる状態への変換を及ぼす。あるいは、コーディングモジュール２３７０は、メモリ２３６０に記憶された命令として実施され、プロセッサ２３３０によって実行され得る（例えば、非一時的媒体に記憶されたコンピュータプログラム製品として）。

メモリ２３６０は、ディスク、テープドライブ、ソリッドステートドライブ、リードオンリーメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、フラッシュメモリ、三値コンテンツアドレス指定可能メモリ（ＴＣＡＭ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）等の１つ以上のメモリタイプを含む。メモリ２３６０は、プログラムが実行のために選択された場合にそのようなプログラムを記憶し、プログラム実行の間に読み出された命令及びデータを記憶するためにオーバーフローデータ記憶装置として用いられ得る。

図２４は、コーディングのための手段２４００の実施形態の概略図である。一実施形態では、コーディングのための手段２４００は、ビデオコーディング装置２４０２（例えば、ビデオエンコーダ３００又はビデオデコーダ４００)で実施される。ビデオコーディング装置２４０２は受信手段２４０１を含む。受信手段２４０１は、エンコードのために画像を受信するか又はデコードのためにビットストリームを受信するように構成されている。ビデオコーディング装置２４０２は、受信手段２４０１に連結された送信手段２４０７を含む。送信手段２４０７はデコーダにビットストリームを送信するか又はデコードされた画像を表示手段（例えば、Ｉ／Ｏ装置２３８０のうちの１つ）に送信するように構成されている。

ビデオコーディング装置２４０２は記憶手段２４０３を含む。記憶手段２４０３は、受信手段２４０１又は送信手段２４０７のうちの少なくとも１つに連結されている。記憶手段２４０３は命令を記憶するように構成されている。ビデオコーディング装置２４０２は、処理手段２４０５も含む。処理手段２４０５は記憶手段２４０３に連結されている。処理手段２４０５は、本明細書に開示の方法を行うために、記憶手段２４０３に記憶された命令を実行するように構成されている。

本明細書に記載の例示の方法のステップは、必ずしも説明した順序で実施される必要はなく、そのような方法のステップの順序は例示にすぎないと理解すべきである。同様に、追加のステップがそのような方法に含まれてもよく、本開示の様々な実施形態と一致して特定のステップが方法において省略され得るか又は組み合わされ得る。

本開示においていくつかの実施形態を提供してきたが、開示したシステム及び方法は、本開示の精神又は範囲から逸脱することなく、多くの他の特定の形態で実施され得ることを理解されたい。本願の例は例示的なものであり、限定的なものと考えるべきでなく、その意図は、本明細書に与えられた詳細を限定されない。例えば、様々な要素又はコンポーネントを別のシステムに組み合わせ又は統合してもいいし、特定の特徴を省略するか又は実施しなくてもよい。

加えて、様々な実施形態で個別又は別個のものとして説明及び例示した技術、システム、サブシステム及び方法は、本開示の範囲から逸脱することなく、他のシステム、モジュール、技術又は方法と組み合わせてもいいし、統合してもよい。互いに連結されるか又は直接連結されるか又は通信すると図示又は説明した他のアイテムは、電気的、機械的又は他の方法で、いくつかのインターフェース、装置又は中間コンポーネントを介して間接的に連結されるか又は通信され得る。変更、置換及び改変の他の例は当業者によって確認可能であり、本明細書に開示の精神及び範囲から逸脱することなく行うことができる。

Claims

ビデオデコーダにより実施されるデコーディングの方法であって、
前記ビデオデコーダにより、現在のピクチャを含むコード化されたビデオビットストリームを受信することと、
前記ビデオデコーダにより、前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、該第１の参照ピクチャリスト及び該第２の参照ピクチャリストは、前記ビデオデコーダに記憶された情報及び前記ビデオビットストリームからの情報を用いて前記ビデオデコーダによりコード化又は構成され、前記ビデオデコーダに記憶された情報は、前記ビデオデコーダで利用可能でない先行するピクチャのために、前記ビデオデコーダによって生成された利用不能な参照ピクチャを含む、ことと、
前記ビデオデコーダにより、前記現在のピクチャがクリーンランダムアクセス（ＣＲＡ）ピクチャであると判定することであって、該ＣＲＡピクチャは、デコーディング順序における任意の先行するイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに対して出力順序又はデコーディング順序で先行する前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによって参照されるピクチャが存在しないことを示し、前記先行するＩＲＡＰピクチャは、前記ＣＲＡピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始する、ことと、
前記ビデオデコーダにより、前記ＣＲＡピクチャの各スライスをデコードすることと、
を含む方法。
前記デコーディング順序において前記ＣＲＡピクチャに後続する１つ以上のピクチャは、インター予測を用いてデコードされる、請求項１に記載の方法。
前記第１の参照ピクチャリストはＲｅｆＰｉｃＬｉｓｔ［０］に指定され、前記第２の参照ピクチャリストはＲｅｆＰｉｃＬｉｓｔ［１］に指定されている、請求項１又は２に記載の方法。
デコーディング装置であって、
現在のピクチャを含むコード化されたビデオビットストリームを受信するように構成された受信器と、
前記受信器に連結されたメモリであって、該メモリは命令を記憶する、メモリと、
前記メモリに連結されたプロセッサであって、該プロセッサは前記命令を実行して、当該デコーディング装置に、
前記現在のピクチャの各スライスのための第１の参照ピクチャリスト及び第２の参照ピクチャリストを得ることであって、該第１の参照ピクチャリスト及び該第２の参照ピクチャリストは、前記デコーディング装置に記憶された情報及び前記ビデオビットストリームからの情報を用いて前記デコーディング装置によりコード化又は構成され、前記デコーディング装置に記憶された情報は、前記デコーディング装置で利用可能でない先行するピクチャのために、前記デコーディング装置によって生成された利用不能な参照ピクチャを含む、ことと、
前記現在のピクチャがクリーンランダムアクセス（ＣＲＡ）ピクチャであると判定することであって、該ＣＲＡピクチャは、デコーディング順序における任意の先行するイントラランダムアクセスポイント（ＩＲＡＰ）ピクチャに対して出力順序又はデコーディング順序で先行する前記第１の参照ピクチャリスト又は前記第２の参照ピクチャリスト内のエントリによって参照されるピクチャが存在しないことを示し、前記先行するＩＲＡＰピクチャは、前記ＣＲＡピクチャを含むコード化されたビデオシーケンス（ＣＶＳ）を開始する、ことと、
前記ＣＲＡピクチャの各スライスをデコードすることと、
を行わせるように構成されている、プロセッサと、
を含む、デコーディング装置。
前記ＣＲＡピクチャはイントラ予測を用いてデコードされ、前記デコーディング順序において前記ＣＲＡピクチャに後続する１つ以上のピクチャはインター予測を用いてデコードされる、請求項４に記載のデコーディング装置。
コーディングのための手段であって、
デコードするためにビットストリームを受信するように構成された受信手段と、
前記受信手段に連結された送信手段であって、該送信手段はデコーディング手段に前記ビットストリームを送信するように構成されている、送信手段と、
前記受信手段又は前記送信手段のうちの少なくとも１つに連結された記憶手段であって、該記憶手段は命令を記憶するように構成されている、記憶手段と、
メモリに連結された処理手段であって、該処理手段は、請求項１乃至３のいずれか一項に記載の方法を行うために、前記記憶手段に記憶された命令を実行するように構成されている、処理手段と、
を含む、コーディングのための手段。
コンピュータ読み取り可能記憶媒体であって、当該コンピュータ読み取り可能記憶媒体は、プロセッサにより実行可能なコンピュータプログラムを記憶し、前記コンピュータプログラムが前記プロセッサによって実行された場合、前記プロセッサは、請求項１乃至３のいずれか一項に記載の方法を行う、コンピュータ読み取り可能記憶媒体。
命令を含むコンピュータプログラムであって、前記命令がコンピュータによって実行された場合、前記コンピュータに、請求項１乃至３のいずれか一項に記載の方法を行わせる、コンピュータプログラム。