JP7239697B2

JP7239697B2 - エンコーダ、デコーダ、インター予測のための対応する方法

Info

Publication number: JP7239697B2
Application number: JP2021528442A
Authority: JP
Inventors: ミハイロヴィッチソロヴィエフ、ティモフェイ; エセンリク、セミ; チェン、ジアンレ; メハーコトラ、アナンド; ガオ、ハン; ワン、ビャオ; イゴレヴィッチチェーンヤク、ロマン; アレクサンドロヴィッチカラブトフ、アレキサンダー; ユリエビッチイコニン、セルゲイ
Original assignee: ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date: 2018-11-22
Filing date: 2019-11-22
Publication date: 2023-03-14
Anticipated expiration: 2039-11-22
Also published as: EP3884670B9; AU2019384016A1; BR112021009848A2; HUE062487T2; SG11202105354YA; PT3884670T; CN113727101A; KR20240025062A; KR102638710B1; US20230125381A1; CN113727101B; KR20210089776A; IL283359A; AU2019384016B2; MX2021006039A; EP4221205A1; CA3120877A1; AU2023203444A1; PL3884670T3; MX2024009655A

Description

本発明は、参照によって内容が全体として本明細書に組み込まれる、２０１８年１１月２２日に出願された米国仮特許出願第６２／７７０，８２６号、２０１９年１月２日に出願された米国仮特許出願第６２／７８７，６７８号、２０１９年３月１１日に出願された米国仮特許出願第６２／８１６，８９７号、および、２０１９年９月２４日に出願された米国仮特許出願第６２／９０５，３６７号の優先権を主張する。
本願の実施形態は概して、画像処理、より具体的にはインター予測の分野に関する。

ビデオコーディング（ビデオエンコーディングおよびデコーディング）は、例えば、放送デジタルＴＶ、インターネットおよびモバイルネットワークを介したビデオ送信、またはビデオチャット、ビデオ会議、ＤＶＤおよびブルーレイディスク、ビデオコンテンツの取得と編集システム、セキュリティアプリケーションのカムコーダーなどのリアルタイムの会話型アプリケーションなど、幅広いデジタルビデオアプリケーションで使用される。

比較的短いビデオを描画するのであっても、必要とされるビデオデータの量は、かなりのものであり得、その結果、限定的な帯域幅容量を有する通信ネットワークを介してデータがストリームされるかまたは別の形で通信されることになる場合に困難が生じる場合がある。したがって、ビデオデータは一般に、現代の遠隔通信ネットワークを介して通信される前に圧縮される。ビデオのサイズは、メモリリソースが限定的である場合があるので、ビデオがストレージデバイス上に保存される場合にも問題となり得る。ビデオ圧縮デバイスは、しばしば、ソースにおけるソフトウェアおよび／またはハードウェアを用いて、送信または保存の前にビデオデータをコードし、それによりデジタルビデオイメージを表現するのに必要なデータの量を低減させる。その後、圧縮データは、デスティネーションにおいて、ビデオデータをデコードするビデオ解凍デバイスによって受信される。限定的なネットワークリソースおよび増大し続ける高ビデオ品質の需要に鑑みて、画像品質をほとんどまたは全く犠牲にせずに圧縮比を改善する、改善された圧縮および解凍技術が望まれている。

本願の実施形態は、独立請求項に記載のエンコーディングおよびデコーディングのための装置および方法を提供する。

本願の第１態様において、現在のブロックが第１予測サブブロックおよび第２予測サブブロックを含む、イメージブロックのための予測方法は、ビットストリームから第１インデックスを解析する段階であって、第１インデックスは、第１予測サブブロックの予測情報を取得するために使用される、段階と、ビットストリームから第２インデックスを解析する段階と、第１インデックスを第２インデックスと比較する段階と、第２インデックスが第１インデックス以上である場合に第２インデックスを調節する段階と、調節された第２インデックスに従って第２予測サブブロックの予測情報を取得する段階とを備える。

実現可能な実装において、第２インデックスの調節は、第２インデックスをｍだけインクリメントすることを含み、ｍは正の整数である。実現可能な実装において、ｍは１である。

実現可能な実装において、ビットストリームから第１インデックスを解析する前に、予測方法は更に、少なくとも１つのインジケータを解析して現在のブロックの予測モードを決定する段階であって、予測モードは三角形予測モードまたは幾何予測モードである、段階を備える。予測モードは、矩形または非矩形（台形）モードを含む予測モードに基づく他のサブブロックであり得る。そして、三角形予測モードおよび幾何予測モードは片予測モードとして統合され得る。これも実現可能な実装に関与し得る。

実現可能な実装において、予測方法は更に、現在のブロックについての候補リストを取得する段階を備える。

実現可能な実装において、第１予測サブブロックの予測情報は、第１インデックスに従って候補リストから取得される。

実現可能な実装において、第２予測サブブロックの予測情報は、調節された第２インデックスに従って候補リストから取得される。実現可能な実装において、候補リストはマージモードの候補リストである。

実現可能な実装において、予測方法は更に、第１の数を解析して、候補リストにおける最大許容候補インデックスを決定する段階と、最大許容候補インデックスに基づいて最大インデックスを取得する段階であって、第１インデックスは最大インデックスより大きくない、段階とを備える。

実現可能な実装において、最大許容候補インデックスに基づいて最大インデックスを取得する段階は、最大許容候補インデックスと予め定められた数との間の計算によって最大インデックスを取得する段階を含む。

実現可能な実装において、最大許容候補インデックスに基づいて最大インデックスを取得する段階は、第２の数を解析して、最大許容候補インデックスと最大インデックスとの間の差を導出する段階と、最大許容候補インデックスと差との間の計算によって最大インデックスを取得する段階とを含む。

実現可能な実装において、予測方法は更に、第３の数を解析して最大インデックスを決定する段階を備える。

実現可能な実装において、最大許容候補インデックスは、最大インデックス以上である。

実現可能な実装において、調節された第２インデックスに従って第２予測サブブロックの予測情報を取得した後に、予測方法は更に、第１予測サブブロックの予測情報および第２予測サブブロックの予測情報に基づいて現在のブロックの予測値を取得する段階を備える。

実現可能な実装において、第１インデックスまたは第２インデックスは、切り捨てられた単進符号に従って二値化される。

実現可能な実装において、二値化された第１インデックスまたは第２インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用してコーディングされる。

実現可能な実装において、二値化された第１インデックスまたは第２インデックスの非第１ｂｉｎは、ＣＡＢＡＣのバイパスコーディングモードを使用してコーディングされる。

実現可能な実装において、予測方法は更に、ビットストリームから方向インジケータを解析する段階を備え、方向インジケータは、現在のブロックの分割方向を示すために使用される。

本願の第２態様において、画像のブロックのインター予測のための方法は、予測インジケータを取得する段階と、サブブロック予測を示す予測インジケータがブロックに適用されるかどうかを決定する段階と、サブブロック予測がブロックに適用されることを予測インジケータが示すとき、２つの異なるインジケータを取得する段階であって、２つの異なるインジケータは、ブロックにおける２つのサブブロックについての動き情報候補リストにおける２つの異なるエントリを個別に示す、段階と、２つの異なるインジケータに基づいてブロックのためのインター予測を実行する段階とを備える。

実現可能な実装において、２つの異なるインジケータを取得する段階は更に、初期第１インジケータおよび初期第２インジケータを含む２つの初期インジケータを取得する段階と、初期第２インジケータを初期第１インジケータと比較する段階と、初期第２インジケータが初期第１インジケータ以上であるとき、初期第２インジケータを調節して、更新された第２インジケータを取得する段階であって、更新された第２インジケータは、初期第１インジケータと異なる、段階と、初期第１インジケータおよび更新された第２インジケータを２つの異なるインジケータとして決定する段階とを含む。

実現可能な実装において、初期第２インジケータを調節して、更新された第２インジケータを取得する段階は更に、初期第２インジケータをｍだけインクリメントする段階であって、ｍは予め定義された数であり、好ましくは１に設定される、段階を含む。

実現可能な実装において、方法は更に、初期第１インジケータの最大値をＭに設定する段階と、初期第２インジケータの最大値をＭ－ｍに設定する段階とを備え、ＭはＮより大きくなく、Ｎは動き情報候補リストのサイズである。

実現可能な実装において、Ｎは、受信されたビットストリームにおけるインジケータシグナリングに基づいて決定される正の整数である。

実現可能な実装において、方法は更に、ブロックのサイズを指定された閾値と比較して、ブロックのサイズが指定された閾値より大きくない場合、初期第１インジケータの最大値をＭに設定し、初期第２インジケータの最大値をＭ－ｍに設定する段階であって、ＭはＮより大きくなく、Ｎは動き情報候補リストのサイズである、段階と、ブロックのサイズが指定された閾値より大きい場合、初期第１インジケータの最大値をＰに設定し、初期第２インジケータの最大値をＰ－ｍに設定する段階であって、ＰはＭより大きく、Ｎより大きくなく、Ｎは動き情報候補リストのサイズである、段階とを備える。実現可能な実装において、ＭおよびＰは予め定義された正の整数である。

実現可能な実装において、ＰがＮより大きいと決定される場合、ＰはＮに等しくなるように更新され、または、ＭがＮより大きいと決定される場合、ＭはＮに等しくなるように更新される。

実現可能な実装において、方法は更に、サブブロック予測がブロックに適用されないことを予測インジケータが示すとき、単一のインジケータを取得する段階であって、単一のインジケータは、ブロックについてのマージ候補リストにおけるエントリを示す、段階と、単一のインジケータに基づいてブロックについてのインター予測を実行する段階とを備える。

実現可能な実装において、方法は更に、初期第１インジケータの最大値をＭに設定する段階であって、Ｎは、動き情報候補リストと同一でないマージ候補リストのサイズである。段階を備える。

実現可能な実装において、方法は更に、分割方向インジケータを決定する段階であって、分割方向インジケータはブロックについての分割方向を示す、段階を備える。

実現可能な実装において、２つの異なるインジケータを取得する段階は更に、分割方向インジケータが第１分割方向を示すとき、初期第２インジケータを調節して、更新された第２インジケータを取得する段階であって、更新された第２インジケータは初期第１インジケータと異なる、段階と、初期第１インジケータおよび更新された第２インジケータを２つの異なるインジケータとして決定する段階、または、分割方向インジケータが第２分割方向を示すとき、初期第１インジケータを調節して、更新された第１インジケータを取得する段階であって、更新された第１インジケータは、初期第２インジケータと異なる、段階と、更新された第１インジケータおよび初期第２インジケータを２つの異なるインジケータとして決定する段階とを含む。

実現可能な実装において、方法は更に、２つの異なるインジケータに基づいて動き情報候補リストから動き情報を選択する段階と、選択された動き情報に基づいて現在のブロックについてのサブブロック予測を実行する段階とを備える。

実現可能な実装において、方法は更に、２つの異なるインジケータに従って、動き情報候補リストから第１動き情報および第２動き情報を選択する段階と、第１動き情報に基づいて第１サブブロックについてのサブブロック予測を実行する段階と、第２動き情報に基づいて第２サブブロックについてのサブブロック予測を実行する段階とを備える。

実現可能な実装において、第１サブブロックは、幾何学的中心が現在のブロックの左の境界に近い部分に割り当てられる。

実現可能な実装において、方法は更に、切り捨てられた単進符号に従って、２つの異なるインジケータを二値化する段階を備える。

実現可能な実装において、方法は更に、コンテキスト適応バイナリ算術コーディング（ＣＡＢＡＣ）のコーディングモードを使用して、２つの異なるインジケータのうちのインジケータの第１ｂｉｎをコーディングする段階と、ＣＡＢＡＣのバイパスモードを使用して、２つの異なるインジケータうちのインジケータの他のｂｉｎをコーディングする段階とを備える。

本願の第３態様において、現在のブロックが第１サブユニットおよび第２サブユニットを含む、ブロックのためのデコーディング方法は、第１インジケータを解析する段階であって、第１インジケータは、現在のブロックの区分パターンを決定するために使用される、段階と、第２インジケータおよび第３インジケータを解析する段階と、第２インジケータの値に基づいて、第１サブユニットの予測情報を決定する段階と、第３インジケータの値を決定する段階であって、第３インジケータの値が第２インジケータ以上である場合、第３インジケータの値は目標値だけ加算される、段階と、第３インジケータの決定された値に基づいて、第２サブユニットの予測情報を決定する段階とを備える。

実現可能な実装において、第２インジケータの最大許容値はＭであり、第３インジケータの最大許容値はＭ－ｍであり、Ｍは正の整数であり、ｍは予め設定された正の整数である。

実現可能な実装において、予測情報候補リストにおけるエントリの数はＮである。実現可能な実装において、ＭはＮ以下である。実現可能な実装において、ＭはＮ以上である。

第４インジケータを解析することを更に含む実現可能な実装において、第４インジケータはＮの値を示すために使用される。実現可能な実装において、Ｎは予め定められた値である。

第５インジケータを解析することを更に含む実現可能な実装において、第５インジケータは、Ｍの値を示すために使用される。実現可能な実装において、Ｍの値は、Ｎの値によって決定される。

本願の第４態様において、現在のブロックが第１予測サブブロックおよび第２予測サブブロックを含む、インター予測のための装置は、ビットストリームから第１インデックスを解析し、ビットストリームから第２インデックスを解析するよう構成される解析モジュールであって、第１インデックスは、第１予測サブブロックの予測情報を取得するために使用される、解析モジュールと、第１インデックスを第２インデックスと比較し、第２インデックスが第１インデックス以上である場合に第２インデックスを調節するよう構成される位置特定モジュールと、調節された第２インデックスに従って第２予測サブブロックの予測情報を取得するよう構成される取得モジュールとを備える。

実現可能な実装において、位置特定モジュールは、第２インデックスをｍだけインクリメントするよう構成され、ｍは正の整数である。実現可能な実装において、ｍは１である。

実現可能な実装において、ビットストリームから第１インデックスを解析する前に、解析モジュールは更に、少なくとも１つのインジケータを解析して、現在のブロックの予測モードを決定するよう構成され、予測モードは三角形予測モードまたは幾何予測モードである。予測モードは、矩形または非矩形（台形）モードを含む予測モードに基づく他のサブブロックであり得る。そして、三角形予測モードおよび幾何予測モードは片予測モードとして統合され得る。これも実現可能な実装に関与し得る。

実現可能な実装において、位置特定モジュールは更に、現在のブロックについての候補リストを取得するよう構成される。

実現可能な実装において、解析モジュールは、第１の数を解析して、候補リストにおける最大許容候補インデックスを決定し、最大許容候補インデックスに基づいて最大インデックスを取得するよう構成され、第１インデックスは最大インデックスより大きくない。

実現可能な実装において、解析モジュールは、最大許容候補インデックスと予め定められた数との間の計算によって最大インデックスを取得するよう構成される。

実現可能な実装において、解析モジュールは、第２の数を解析して、最大許容候補インデックスと最大インデックスとの間の差を導出し、最大許容候補インデックスと差との間の計算によって最大インデックスを取得するよう構成される。

実現可能な実装において、解析モジュールは、第３の数を解析して最大インデックスを決定するよう構成される。

実現可能な実装において、最大許容候補インデックスは最大インデックス以上である。

実現可能な実装において、調節された第２インデックスに従って第２予測サブブロックの予測情報を取得した後に、取得モジュールは更に、第１予測サブブロックの予測情報および第２予測サブブロックの予測情報に基づいて現在のブロックの予測値を取得するよう構成される。

実現可能な実装において、解析モジュールは、ビットストリームから方向インジケータを解析するよう構成され、方向インジケータは現在のブロックの分割方向を示すために使用される。

本願の第５態様において、コンピュータプログラム製品は、コンピュータまたはプロセッサ上で実行されるときに第１態様から第４態様のいずれか１つに記載の方法を実行するためのプログラムコードを備える。

本願の第６態様において、デコーダは、１または複数のプロセッサと、プロセッサに連結され、プロセッサによって実行されるプログラムを格納する非一時的コンピュータ可読記憶媒体とを備え、プログラムは、プロセッサによって実行されるとき、第１態様から第４態様のいずれか一項に記載の方法を実行するようデコーダを構成する。

本願の第７態様において、エンコーダは、１または複数のプロセッサと、プロセッサに連結され、プロセッサによって実行されるプログラムを格納する非一時的コンピュータ可読記憶媒体とを備え、プログラムは、プロセッサによって実行されるとき、第１態様から第４態様のいずれか一項に記載の方法を実行するようエンコーダを構成する。

本願の第８態様において、非一時的コンピュータ可読媒体は、コンピュータデバイスによって実行されるときに第１態様から第４態様のいずれか１つの方法をコンピュータデバイスに実行させるプログラムコードを保持する。

上述の目的および他の目的が独立請求項の主題により達成される。従属請求項、明細書および図からは更なる実装形態が明らかになる。

特定の実施形態は、従属請求項における他の実施形態と共に、添付の独立請求項において概説される。

１または複数の実施形態の詳細は、添付の図面および以下の説明に記載されている。他の特徴、目的、および利点は、明細書、図面、および特許請求の範囲から明らかになるであろう。

本願において、三角形予測モードの場合、全体のブロックが統一予測情報を有する予測モードと比較するので、上記ブロックにおける２つの予測サブブロックが同一の予測情報を有する場合は冗長であることに留意されたい。本願は、冗長な場合を回避するために予測インデックスコーディング方法を設計する。予測インデックスをシグナリングするためのビットが節約され、コーディング効率が改善される。そして、三角形予測モードについての候補予測情報の最大数は、マージモードについての候補予測情報の最大数に基づいて導出される。コーディングビットも節約され、三角形予測モードについての候補予測情報の最大数との比較が別個にシグナリングされる。

以下の実施形態において、添付の図および図面を参照して、本発明がより詳細に説明される。
本発明の実施形態を実装するよう構成されるビデオコーディングシステムの例を示すブロック図である。本発明の実施形態を実装するよう構成されるビデオコーディングシステムの別の例を示すブロック図である。本発明の実施形態を実装するよう構成されるビデオエンコーダの例を示すブロック図である。本発明の実施形態を実装するよう構成されるビデオデコーダの構造の例を示すブロック図である。エンコーディング装置またはデコーディング装置の例を示すブロック図である。エンコーディング装置またはデコーディング装置の別の例を示すブロック図である。空間マージ候補の位置の例を示す図である。空間マージ候補の冗長チェックについて考慮される候補ペアの例を示す図である。時間的マージ候補についての動きベクトルスケーリングの例を示す図である。時間的候補についての位置の例を示す図である。２つの三角形予測ユニットへのブロックの分割の例示である。２つの三角形予測ユニットへのブロックの分割の別の例示である。他のサブブロック区分方式の例である。マージ候補リストからの片予測動きベクトルの導出の例示である。ブレンドフィルタを適用するブロックの例である。ＣＡＢＡＣの処理を示す概略ブロック図である。予測方法の例を示すブロック図である。予測方法の別の例を示すブロック図である。本願の実施形態を実装するよう構成される予測装置の例を示すブロック図である。エンコーディング装置またはデコーディング装置の例を示すブロック図である。コンテンツ配信サービスを実現するコンテンツ供給システム３１００の構造の例を示すブロック図である。端末デバイスの例の構造を示すブロック図である。以下、別途明示的に指定されていない限り、同一の参照符号は、同一または少なくとも機能的に同等の機能を指す。

以下の説明では、本開示の一部をなし、本発明の実施形態の具体的態様または本発明の実施形態が使用され得る具体的態様を例示として示す、添付図面が参照される。本発明の実施形態は他の態様で使用されてもよく、図に示されない構造的または論理的変更を含んでもよいことが理解される。したがって、以下の詳細な説明は、限定する意味で解釈されず、本発明の範囲は、添付の特許請求の範囲によって規定される。

例えば、記載されている方法に関連する開示が、この方法を実行するように構成されている対応するデバイスまたはシステムについても適用され得ること、および、その逆もまた同様であることが解る。例えば、特定の方法の段階のうちの１または複数が説明される場合、対応するデバイスは、説明された１または複数の方法の段階（例えば、上記１または複数の段階を実行する１つのユニット、または、それぞれ複数の段階のうちの１または複数を実行する複数のユニット）を実行するために、１または複数のユニットが明示的に説明もまたは図面に示しもされていない場合であっても、そのような１または複数のユニット、例えば、機能ユニットを含んでよい。他方で、例えば、特定の装置が１または複数のユニット、例えば機能ユニットに基づいて説明される場合、対応する方法は、上記１または複数のユニットの機能を実行するために、１または複数の段階が明示的に説明もまたは図面に示しもされていない場合であっても、そのような１つの段階（例えば、１または複数のユニットの機能を実行する１つの段階、またはそれぞれ複数のユニットのうちの１または複数の機能を実行する複数の段階）を含んでよい。さらに、別途特に注記されない限り、本明細書で説明する様々な例示的な実施形態および／または態様の特徴が互いに組み合わされ得ることが理解される。

ビデオコーディングは典型的には、ビデオまたはビデオシーケンスを形成する一連の画像の処理を指す。「画像」という用語の代わりに、「フレーム」または「イメージ」という用語がビデオコーディングの分野での同義語として用いられる場合がある。ビデオコーディング（または一般にコーディング）は、ビデオエンコーディングおよびビデオデコーディングの２つの部分を含む。ビデオエンコーディングは、ソース側で実行され、典型的には、（より効率的な保存および／または送信のために）ビデオ画像を表現するために要求されるデータ量を低減させるように、元のビデオ画像を処理（例えば、圧縮による）することを含む。ビデオデコーディングは、デスティネーション側で実行され、典型的には、ビデオ画像を再構築するように、エンコーダと比較して逆の処理を含む。ビデオ画像（または一般に画像）の「コーディング」に言及する実施形態は、ビデオ画像またはそれぞれのビデオシーケンスの「エンコーディング」または「デコーディング」に関すると理解されるものとする。エンコーディング部分とデコーディング部分との組み合わせは、コーデック（コーディングおよびデコーディング）とも称される。

無損失ビデオコーディングの場合、元のビデオ画像を再構築でき、すなわち、再構築されたビデオ画像は元のビデオ画像と同じ品質である（保存中または送信中に伝送損失またはその他のデータ損失がないと仮定）。不可逆ビデオコーディングの場合、ビデオ画像を表現するデータ量を低減するために、例えば量子化による更なる圧縮が実行されるが、これはデコーダにおいて完全には再構築できない、すなわち、再構築されたビデオ画像の品質は、元のビデオ画像の品質に比較して低下または劣化する。

いくつかのビデオコーディング規格は、「不可逆ハイブリッドビデオコーデック」のグループに属する（すなわち、サンプル領域における空間的および時間的予測と、変換領域における量子化を適用するための２Ｄ変換コーディングとを組み合わせる）。ビデオシーケンスの各画像は、典型的には、非重複ブロックのセットへと区分化され、コーディングは、典型的には、ブロックレベルで実行される。換言すれば、エンコーダにおいて、ビデオは、例えば、空間的（画像内）予測および／または時間的（画像間）予測を使用して予測ブロックを生成し、現在のブロック（現在処理されている／処理されることになるブロック）から予測ブロックを減算して残差ブロックを取得し、残差ブロックを変換するとともに変換領域における残差ブロックを量子化して、送信されることになるデータ量を低減（圧縮）することによって、典型的にはブロック（ビデオブロック）レベルで処理される、すなわちエンコードされ、一方で、デコーダにおいて、現在のブロックを表現のために再構築するために、エンコーダと比較して逆の処理がエンコードまたは圧縮されたブロックに適用される。さらに、エンコーダがデコーダの処理ループを繰り返すことにより、後続のブロックの処理のために、すなわちコーディングのために、両方が同一の予測（例えば、イントラおよびインター予測）および／または再構築物を生成することになる。

以下、ビデオコーディングシステム１０、ビデオエンコーダ２０、およびビデオデコーダ３０の実施形態が、図１Ａ～図３に基づいて説明される。

図１Ａは、本願の技術を使用し得る例示的なコーディングシステム１０、例えばビデオコーディングシステム１０（または略してコーディングシステム１０）を示す概略ブロック図である。ビデオコーディングシステム１０のビデオエンコーダ２０（または略してエンコーダ２０）およびビデオデコーダ３０（または略してデコーダ３０）は、本願において説明される様々な例に従って技術を実行するように構成され得るデバイスの例を表す。

図１Ａに示すように、コーディングシステム１０は、エンコード済みの画像データ２１を、例えば、このエンコード済みの画像データ１３をデコードするためにデスティネーションデバイス１４に提供するように構成されているソースデバイス１２を備える。

ソースデバイス１２は、エンコーダ２０を備え、加えて、すなわち任意選択で、画像ソース１６と、プリプロセッサ（または前処理ユニット）１８と、例えば画像プリプロセッサ１８と、通信インタフェースまたは通信ユニット２２とを備えてよい。

画像ソース１６は、任意の種類の画像捕捉デバイス、例えば、現実世界の画像を捕捉するカメラ、および／または、任意の種類の画像生成デバイス、例えば、コンピュータアニメーション化画像を生成するコンピュータグラフィックプロセッサ、または、現実世界の画像、コンピュータ生成画像（例えば、スクリーンコンテンツ、仮想現実（ＶＲ）画像）、および／またはそれらの任意の組み合わせ（例えば、拡張現実（ＡＲ）画像）を取得および／または提供する任意の種類の他のデバイスを含むかまたはそれらのデバイスであってよい。画像ソースは、上述の画像の任意のものを保存する任意の種類のメモリまたはストレージであってよい。

プリプロセッサ１８および前処理ユニット１８によって実行される処理と区別するように、画像または画像データ１７は、生画像または生画像データ１７とも称され得る。

プリプロセッサ１８は、（生）画像データ１７を受信するとともに、画像データ１７に対して前処理を実行して、前処理済みの画像１９または前処理済みの画像データ１９を取得するように構成されている。プリプロセッサ１８によって実行される前処理は、例えば、トリミング、カラーフォーマット変換（例えば、ＲＧＢからＹＣｂＣｒ）、色補正、またはノイズ除去を含んでよい。前処理ユニット１８は任意選択のコンポーネントでもよいことが理解され得る。

ビデオエンコーダ２０は、前処理済みの画像データ１９を受信するとともに、エンコード済みの画像データ２１を提供するように構成されている（更なる詳細は、例えば図２に基づいて下記で説明される）。

ソースデバイス１２の通信インタフェース２２は、通信チャネル１３を介して、エンコード済みの画像データ２１を受信するとともに、エンコード済みの画像データ２１（またはその任意の更なる処理バージョン）を、保存または直接の再構築のために、別のデバイス、例えばデスティネーションデバイス１４または任意の他のデバイスに送信するよう構成されてよい。

デスティネーションデバイス１４は、デコーダ３０（例えばビデオデコーダ３０）を備え、加えて、すなわち任意選択で、通信インタフェースまたは通信ユニット２８と、ポストプロセッサ３２（または後処理ユニット３２）と、ディスプレイデバイス３４とを備えてよい。

デスティネーションデバイス１４の通信インタフェース２８は、エンコード済みの画像データ２１（またはその任意の更なる処理バージョン）を、例えばソースデバイス１２から直接または任意の他のソース、例えばストレージデバイス、例えばエンコード済みの画像データストレージデバイスから受信するとともに、エンコード済みの画像データ２１をデコーダ３０に提供するように構成されている。

通信インタフェース２２および通信インタフェース２８は、ソースデバイス１２とデスティネーションデバイス１４との間で、直接的な通信リンク、例えば、直接的な有線もしくは無線接続を介して、または、任意の種類のネットワーク、例えば、有線もしくは無線ネットワークもしくはそれらの任意の組み合わせ、もしくは、任意の種類のプライベートおよびパブリックネットワークもしくはそれらの任意の種類の組み合わせを介して、エンコード済みの画像データ２１またはエンコード済みのデータ１３を送信または受信するように構成されてよい。

通信インタフェース２２は、例えば、エンコード済みの画像データ２１を適切なフォーマットに、例えばパケットにパッケージ化する、および／または、通信リンクまたは通信ネットワークを介した送信のための任意の種類の送信エンコーディングまたは処理を用いて、エンコード済みの画像データを処理するように構成されてよい。

通信インタフェース２２のカウンターパートをなす通信インタフェース２８は、例えば、送信されたデータを受信するとともに、任意の種類の対応する送信デコーディングまたは処理および／またはデパッケージングを用いて送信データを処理して、エンコード済みの画像データ２１を取得するように構成されてよい。

通信インタフェース２２および通信インタフェース２８は両方とも、図１Ａにおいてソースデバイス１２からデスティネーションデバイス１４に向く通信チャネル１３の矢印で示すように単方向通信インタフェースとして、または、双方向通信インタフェースとして構成されてよく、例えば、メッセージを送信および受信する、例えば、接続を設定し、通信リンクおよび／またはデータ送信、例えばエンコード済みの画像データ送信に関連する任意の他の情報を確認およびやりとりするように構成されてよい。

デコーダ３０は、エンコード済みの画像データ２１を受信するとともに、デコード済みの画像データ３１またはデコード済みの画像３１を提供するように構成されている（更なる詳細は、例えば図３または図５に基づいて下記で説明される）。

デスティネーションデバイス１４のポストプロセッサ３２は、デコード済みの画像データ３１（再構築画像データとも呼ばれる）、例えばデコード済みの画像３１を後処理して、後処理済みの画像データ３３、例えば後処理済みの画像３３を取得するように構成されている。後処理ユニット３２により行われる後処理は、例えば、デコード済みの画像データ３１を、例えば、ディスプレイデバイス３４による表示のために準備する目的で、例えば、カラーフォーマット変換（例えば、ＹＣｂＣｒからＲＧＢへ）、色補正、トリミング、もしくは再サンプリング、または任意の他の処理を含んでよい。

デスティネーションデバイス１４のディスプレイデバイス３４は、画像を例えばユーザまたは視聴者に表示するために、後処理済みの画像データ３３を受信するように構成されている。ディスプレイデバイス３４は、再構築画像を表現するための任意の種類のディスプレイ、例えば、一体型または外付けのディスプレイまたはモニタであってもよく、これを含んでもよい。ディスプレイは、例えば、液晶ディスプレイ（ＬＣＤ）、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、プラズマディスプレイ、プロジェクタ、マイクロＬＥＤディスプレイ、液晶オンシリコン（ＬＣｏＳ）、デジタル光プロセッサ（ＤＬＰ）、または任意の種類の他のディスプレイを含んでよい。

図１Ａはソースデバイス１２とデスティネーションデバイス１４とを別個のデバイスとして示しているが、デバイスの実施形態は、それらの両方または両方の機能、すなわち、ソースデバイス１２または対応する機能と、デスティネーションデバイス１４または対応する機能とを備えてもよい。そのような実施形態では、ソースデバイス１２または対応する機能およびデスティネーションデバイス１４または対応する機能は、同じハードウェアおよび／またはソフトウェアを使用して、または別個のハードウェアおよび／またはソフトウェアまたはそれらの任意の組み合わせによって実装され得る。

本説明に基づいて当業者には明らかであるように、図１Ａに示すような、異なるユニットの機能またはソースデバイス１２および／またはデスティネーションデバイス１４内の機能の存在および（正確な）分割は、実際のデバイスおよびアプリケーションに応じて変わり得る。

エンコーダ２０（例えば、ビデオエンコーダ２０）またはデコーダ３０（例えば、ビデオデコーダ３０）またはエンコーダ２０およびデコーダ３０の両方は、１または複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリートロジック、ハードウェア、ビデオコーディング専用またはそれらの任意の組み合わせ等の、図１Ｂに示すような処理回路を介して実装されてよい。エンコーダ２０は、図２のエンコーダ２０および／または本明細書に記載の任意の他のエンコーダシステムまたはサブシステムに関連して説明される様々なモジュールを具現するために処理回路４６を介して実装されてよい。デコーダ３０は、図３のデコーダ３０および／または本明細書に記載の任意の他のデコーダシステムまたはサブシステムに関連して説明される様々なモジュールを具現するために処理回路４６を介して実装されてよい。処理回路は、後で説明されるように様々な操作を実行するように構成されてよい。図５に示すように、本技術がソフトウェアにおいて部分的に実装される場合、デバイスは、好適な非一時的コンピュータ可読記憶媒体にソフトウェアのための命令を保存してよく、ハードウェア内で１または複数のプロセッサを用いて命令を実行して、本開示の技術を実現してよい。ビデオエンコーダ２０およびビデオデコーダ３０のいずれかは、図１Ｂに示すように、例えば、単一のデバイス内の組み合わされたエンコーダ／デコーダ（コーデック）の一部として統合されてよい。

ソースデバイス１２およびデスティネーションデバイス１４は、任意の種類のハンドヘルドまたはステーショナリデバイス、例えば、ノートブックまたはラップトップコンピュータ、携帯電話、スマートフォン、タブレットまたはタブレットコンピュータ、カメラ、デスクトップコンピュータ、セットトップボックス、テレビ、ディスプレイデバイス、デジタルメディアプレイヤ、ビデオゲーミングコンソール、ビデオストリーミングデバイス（コンテンツサービスサーバまたはコンテンツ配信サーバ等）、ブロードキャスト受信機デバイス、ブロードキャスト送信機デバイス等を含む、広範なデバイスのいずれかを備えてよく、オペレーティングシステムを用いないまたは任意の種類のオペレーティングシステムを用いてよい。いくつかの場合、ソースデバイス１２およびデスティネーションデバイス１４は、無線通信に対応してよい。したがって、ソースデバイス１２およびデスティネーションデバイス１４は、無線通信デバイスとしてよい。

いくつかの場合、図１Ａに示すビデオコーディングシステム１０は、単に例であり、本願の技術は、エンコーディングデバイスとデコーディングデバイスとの間の任意のデータ通信を必ずしも含まないビデオコーディング設定（例えば、ビデオエンコーディングまたはビデオデコーディング）に適用されてよい。他の例において、データは、ローカルメモリから取得され、ネットワークを介してストリーム等される。ビデオエンコーディングデバイスは、データをメモリにエンコードして格納してよく、および／または、ビデオデコーディングデバイスは、データをメモリからデコードして取得してよい。いくつかの例において、エンコーディングおよびデコーディングは、互いに通信しないが単にデータをメモリにエンコードするおよび／またはデータをメモリから取得するとともにデコードするデバイスによって実行される。

説明の便宜上、例えば、ＩＴＵ－Ｔビデオコーディング専門家グループ（ＶＣＥＧ）およびＩＳＯ／ＩＥＣ動画像専門家グループ（ＭＰＥＧ）のビデオコーディングに関する共同作業チーム（ＪＣＴ－ＶＣ）によって開発された次世代ビデオコーディング規格である、高効率ビデオコーディング（ＨＥＶＣ）または多目的ビデオコーディング（ＶＶＣ）のリファレンスソフトウェアを参照して、本発明の実施形態が本明細書で説明される。当業者であれば、本発明の実施形態がＨＥＶＣまたはＶＶＣに限定されないことを理解するであろう。

［エンコーダおよびエンコーディング方法］
図２は、本願の技術を実装するように構成されている例示のビデオエンコーダ２０の概略ブロック図を示している。図２の例において、ビデオエンコーダ２０は、入力２０１（または入力インタフェース２０１）と、残差計算ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、ループフィルタユニット２２０と、デコード済みの画像バッファ（ＤＰＢ）２３０と、モード選択ユニット２６０と、エントロピーエンコーディングユニット２７０と、出力２７２（または出力インタフェース２７２）とを備える。モード選択ユニット２６０は、インター予測ユニット２４４と、イントラ予測ユニット２５４と、区分化ユニット２６２とを備えてよい。インター予測ユニット２４４は、動き推定ユニットおよび動き補償ユニット（図示せず）を備えてよい。図２に示されるビデオエンコーダ２０は、ハイブリッドビデオエンコーダ、またはハイブリッドビデオコーデックによるビデオエンコーダとも称され得る。

残差計算ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、モード選択ユニット２６０とは、エンコーダ２０の順方向信号経路を形成するものとして言及されてよく、一方、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、バッファ２１６と、ループフィルタ２２０と、デコード済みの画像バッファ（ＤＰＢ）２３０と、インター予測ユニット２４４と、イントラ予測ユニット２５４とは、ビデオエンコーダ２０の逆方向信号経路を形成するものとして言及されてよい。ビデオエンコーダ２０の逆方向信号経路は、デコーダの信号経路に対応する（図３のビデオデコーダ３０を参照）。逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、ループフィルタ２２０と、デコード済みの画像バッファ（ＤＰＢ）２３０と、インター予測ユニット２４４と、イントラ予測ユニット２５４とは、ビデオエンコーダ２０の「内蔵デコーダ」を形成するものとも言及される。

［画像および画像区分化（画像およびブロック）］
エンコーダ２０は、例えば、入力２０１を介して、画像１７（または画像データ１７）、例えば、ビデオまたはビデオシーケンスを形成する一連の画像のうちの画像を受信するように構成されてよい。受信された画像または画像データは、前処理済みの画像１９（または前処理済みの画像データ１９）であってもよい。簡潔さのために、以下の説明では画像１７が参照される。画像１７は、現在の画像またはコードされる画像とも称され得る（特に、ビデオコーディングにおいて、現在の画像を他の画像、例えば、同じビデオシーケンス、すなわち現在の画像も含むビデオシーケンスの、以前にエンコード済みおよび／またはデコード済みの画像から区別するために）。

（デジタル）画像は、強度値を持つサンプルの二次元アレイまたはマトリックスであるか、それとみなされ得る。アレイ内のサンプルは、画素（画像要素の略称）またはペルとも称され得る。アレイまたは画像の水平および垂直方向（または軸）のサンプル数は、画像のサイズおよび／または解像度を定義する。色を表現するために、典型的には３つの色成分が使用され、すなわち、画像は、３つのサンプルアレイで表されてもまたはこれを含んでもよい。ＲＢＧ形式または色空間では、画像は対応する赤、緑、および青のサンプルアレイを含む。しかしながら、ビデオコーディングでは、各画素は、典型的には輝度およびクロミナンス形式または色空間、例えばＹＣｂＣｒで表され、これには、Ｙ（代わりにＬが用いられる場合もある）で示される輝度成分と、ＣｂおよびＣｒで示される２つのクロミナンス成分とが含まれる。輝度（または略してルマ（ｌｕｍａ））成分Ｙは、明るさまたは（例えば、グレースケール画像でのような）グレーレベルの強度を表し、２つのクロミナンス（または略してクロマ（ｃｈｒｏｍａ））成分であるＣｂおよびＣｒは、色度または色情報成分を表す。したがって、ＹＣｂＣｒ形式の画像は、輝度サンプル値（Ｙ）の輝度サンプルアレイと、クロミナンス値（ＣｂおよびＣｒ）の２つのクロミナンスサンプルアレイとを含む。ＲＧＢ形式の画像は、ＹＣｂＣｒ形式に転換または変換され得、その逆もまた同様であり、このプロセスは、色変換または転換としても知られている。画像がモノクロの場合、画像は輝度サンプルアレイのみを含んでよい。したがって、画像は、例えば、モノクロ形式におけるルマサンプルのアレイ、または、４：２：０、４：２：２、および４：４：４のカラー形式におけるルマサンプルのアレイおよびクロマサンプルの２つの対応するアレイであってよい。

ビデオエンコーダ２０の実施形態は、画像１７を複数の（典型的には非重複）画像ブロック２０３に区分化するように構成されている画像区分化ユニット（図２には示されない）を備えてよい。これらのブロックは、ルートブロック、マクロブロック（Ｈ．２６４／ＡＶＣ）またはコーディングツリーブロック（ＣＴＢ）またはコーディングツリーユニット（ＣＴＵ）（Ｈ．２６５／ＨＥＶＣおよびＶＶＣ）とも称され得る。画像区分化ユニットは、ビデオシーケンスのすべての画像およびブロックサイズを定義する対応するグリッドに同じブロックサイズを使用するか、または、画像または画像のサブセットもしくはグループ間でブロックサイズを変化させて、各画像を対応するブロックに区分化するように構成されてよい。

更なる実施形態において、ビデオエンコーダは、画像１７のブロック２０３、例えば、画像１７を形成する１つ、いくつか、またはすべてのブロックを直接受信するように構成されてよい。画像ブロック２０３は、現在の画像ブロックまたはコーディングされる画像ブロックとも称され得る。

画像１７と同様にここでも、画像ブロック２０３は、画像１７よりも寸法が小さいが、強度値（サンプル値）を持つサンプルの二次元アレイまたはマトリックスであるか、または、それとみなすことができる。換言すれば、ブロック２０３は、例えば、１つのサンプルアレイ（例えば、モノクロ画像１７の場合はルマアレイ、または、カラー画像の場合はルマもしくはクロマアレイ）、または３つのサンプルアレイ（例えば、カラー画像１７の場合はルマおよび２つのクロマアレイ）、または、適用されるカラーフォーマットに応じた任意の他の数および／または種類のアレイを備えてよい。ブロック２０３の水平および垂直方向（または軸）のサンプル数は、ブロック２０３のサイズを定義する。したがって、ブロックは、例えば、サンプルのＭ×Ｎ（Ｍ列×Ｎ行）アレイ、または変換係数のＭ×Ｎアレイであってよい。

図２に示すビデオエンコーダ２０の実施形態は、画像１７をブロック毎にエンコードするように構成されてよく、例えば、エンコーディングおよび予測がブロック２０３毎に実行される。

図２に示されるビデオエンコーダ２０の実施形態は更に、スライス（ビデオスライスとも称される）を使用することによって画像を区分化および／またはエンコードするよう構成されてよく、画像は、１または複数のスライス（典型的には非重複）を使用して区分化またはエンコードされてよく、各スライスは、１または複数のブロック（例えばＣＴＵ）、または、ブロックの１または複数のグループ（例えば、タイルＨ．２６５／ＨＥＶＣおよびＶＶＣ）またはブリック（ＶＶＣ）を含んでよい。

図２に示されるビデオエンコーダ２０の実施形態は更に、スライス／タイルグループ（ビデオタイルグループとも称される）および／またはタイル（ビデオタイルとも称される）を使用することによって画像を区分化および／またはエンコードするよう構成されてよく、画像は、１または複数のスライス／タイルグループ（典型的には非重複）を使用して区分化またはエンコードされてよく、各スライス／タイルグループは、例えば１または複数のブロック（例えばＣＴＵ）または１または複数のタイルを含んでよく、各タイルは例えば、矩形形状であってよく、１または複数のブロック（例えば、ＣＴＵ）、例えば完全または部分的ブロックを含んでよい。

［残差計算］
残差計算ユニット２０４は、例えば、サンプル毎（画素毎）に画像ブロック２０３のサンプル値から予測ブロック２６５のサンプル値を減算し、サンプル領域における残差ブロック２０５を取得することによって、画像ブロック２０３および予測ブロック２６５に基づいて（予測ブロック２６５に関する更なる詳細は後で提供される）、残差ブロック２０５（残差２０５とも称される）を計算するように構成されてよい。

［変換］
変換処理ユニット２０６は、残差ブロック２０５のサンプル値に対して変換、例えば、離散コサイン変換（ＤＣＴ）または離散サイン変換（ＤＳＴ）を適用し、変換領域における変換係数２０７を取得するように構成されてよい。変換係数２０７は、変換残差係数とも称されてよく、変換領域における残差ブロック２０５を表す。

変換処理ユニット２０６は、Ｈ．２６５／ＨＥＶＣに指定された変換等のＤＣＴ/ＤＳＴの整数近似を適用するように構成されてよい。直交ＤＣＴ変換に比較して、そのような整数近似は、典型的には特定の係数によってスケーリングされる。順変換および逆変換によって処理される残差ブロックのノルムを保存するべく、変換プロセスの一部として追加のスケーリング係数が適用される。スケーリング係数は、典型的には、シフト演算に関して２のべき乗であるスケーリング係数、変換係数のビット深度、確度と実装コストとの間のトレードオフ等のような特定の制約に基づいて選択される。例えば、特定のスケーリング係数が、例えば、逆変換処理ユニット２１２による逆変換（および、例えばビデオデコーダ３０における逆変換処理ユニット３１２による対応する逆変換）に指定され、例えば、エンコーダ２０における変換処理ユニット２０６による順方向変換のための対応するスケーリング係数が、相応に指定されてよい。

ビデオエンコーダ２０の実施形態は（それぞれ変換処理ユニット２０６）は、変換パラメータ、例えば単数または複数の変換のタイプを、例えば、直接またはエントロピーエンコーディングユニット２７０を介してエンコードもしくは圧縮してから出力するように構成されてよく、それにより、例えば、ビデオデコーダ３０は、デコーディングのための変換パラメータを受信して使用してよい。

［量子化］
量子化ユニット２０８は、例えば、スカラ量子化またはベクトル量子化を適用することによって、変換係数２０７を量子化して、量子化係数２０９を取得するように構成されてよい。量子化係数２０９は、量子化変換係数２０９または量子化残差係数２０９とも称され得る。

量子化プロセスは、変換係数２０７のいくつかまたはすべてに関連付けられたビット深度を減少させ得る。例えば、ｎビット変換係数は、量子化中にｍビット変換係数に丸められてよく、ここでｎはｍよりも大きい。量子化の程度は、量子化パラメータ（ＱＰ）を調整することによって変更されてよい。例えば、スカラ量子化の場合、より細かいまたはより粗い量子化を達成するために、異なるスケーリングが適用されてよい。量子化ステップサイズが小さいほど細かい量子化に対応し、一方で、量子化ステップサイズが大きいほど粗い量子化に対応する。適用可能な量子化ステップサイズは、量子化パラメータ（ＱＰ）によって示され得る。量子化パラメータは、例えば、適用可能な量子化ステップサイズの予め定義されたセットへのインデックスであり得る。例えば、小さな量子化パラメータは細かい量子化（小さな量子化ステップサイズ）に対応し得、大きな量子化パラメータは粗い量子化（大きな量子化ステップサイズ）に対応し得るか、または逆もまた同様である。量子化は、量子化ステップサイズによる除算を含んでよく、例えば逆量子化ユニット２１０による対応するおよび／または逆の量子化解除は、量子化ステップサイズによる乗算を含んでよい。いくつかの規格、例えばＨＥＶＣに従った実施形態は、量子化ステップサイズを決定するのに量子化パラメータを使用するように構成されてよい。概して、量子化ステップサイズは、除算を含む方程式の固定小数点近似を使用する量子化パラメータに基づいて算出され得る。残差ブロックのノルムを復元するために、量子化および量子化解除に追加のスケーリング係数を導入し得、これは、量子化ステップサイズおよび量子化パラメータの方程式の固定小数点近似で使用されるスケーリングに起因して変更され得る。一例の実装では、逆変換および量子化解除のスケーリングは組み合わされ得る。代替的には、カスタマイズされた量子化テーブルが使用され、例えばビットストリームにおいてエンコーダからデコーダにシグナリングされてよい。量子化は不可逆演算であり、損失は量子化ステップサイズの増加に伴って増加する。

ビデオエンコーダ２０の実施形態（それぞれ量子化ユニット２０８）は、量子化パラメータ（ＱＰ）、例えば直接かまたはエントロピーエンコーディングユニット２７０を介してエンコードしてから出力するように構成されてよく、それにより、例えば、ビデオデコーダ３０は、デコーディングのための量子化パラメータを受信して適用してよい。

［逆量子化］
逆量子化ユニット２１０は、例えば、量子化ユニット２０８と同じ量子化ステップサイズに基づいてまたはそれを使用して量子化ユニット２０８によって適用された量子化スキームの逆を適用することによって、量子化係数に対して量子化ユニット２０８の逆量子化を適用し、量子化解除係数２１１を取得するように構成されている。量子化解除係数２１１は、量子化解除残差係数２１１とも称され得、典型的には量子化による損失に起因して変換係数とは同一でないが、変換係数２０７に対応する。

［逆変換］
逆変換処理ユニット２１２は、変換処理ユニット２０６によって適用された変換の逆変換、例えば、逆離散コサイン変換（ＤＣＴ）または逆離散サイン変換（ＤＳＴ）または他の逆変換を適用し、サンプル領域における再構築残差ブロック２１３（または対応する量子化解除係数２１３）を取得するように構成されている。再構築残差ブロック２１３は、変換ブロック２１３とも称され得る。

［再構築］
再構築ユニット２１４（例えば、加算器または合算器２１４）は、例えば、サンプル毎に、再構築残差ブロック２１３のサンプル値と予測ブロック２６５のサンプル値とを加算することによって、変換ブロック２１３（すなわち、再構築残差ブロック２１３）を予測ブロック２６５に加算し、サンプル領域における再構築ブロック２１５を取得するように構成されている。

［フィルタリング］
ループフィルタユニット２２０（または、略して「ループフィルタ」２２０）は、再構築ブロック２１５をフィルタして、フィルタリング済みのブロック２２１を取得する、または、一般に、再構築サンプルをフィルタして、フィルタリング済みのサンプル値を取得するように構成されている。ループフィルタユニットは、例えば、画素遷移を滑らかにする、または、別様にビデオ品質を改善するように構成されている。ループフィルタユニット２２０は、デブロッキングフィルタ、サンプル適応型オフセット（ＳＡＯ）フィルタ、または、１または複数の他のフィルタ、例えば、適応ループフィルタ（ＡＬＦ）、ノイズ抑制フィルタ（ＮＳＦ）、またはそれらの任意の組み合わせなど、１または複数のループフィルタを含み得る。例において、ループフィルタユニット２２０はデブロッキングフィルタ、ＳＡＯフィルタ、およびＡＬＦフィルタを含み得る。フィルタリング処理の順序は、非ブロック化フィルタ、ＳＡＯ、およびＡＬＦであり得る。別の例において、クロマスケーリングを伴うルママッピング（ＬＭＣＳ）（すなわち、適応インループリシェーパ）と呼ばれる処理が追加される。この処理は非ブロック化の前に実行される。別の例において、非ブロック化フィルタ処理はまた、内部サブブロックエッジ、例えば、アフィンサブブロックエッジ、ＡＴＭＶＰサブブロックエッジ、サブブロック変換（ＳＢＴ）エッジ、およびイントラサブパーティション（ＩＳＰ）エッジに適用され得る。ループフィルタユニット２２０が、ループフィルタ内にあるものとして図２に示されているが、他の構成では、ループフィルタユニット２２０はポストループフィルタとして実装されてもよい。フィルタリング済みのブロック２２１は、フィルタリング済みの再構築ブロック２２１とも称され得る。

ビデオエンコーダ２０の実施形態（それぞれループフィルタユニット２２０）は、ループフィルタパラメータを（ＳＡＯフィルタパラメータまたはＡＬＦフィルタパラメータまたはＬＭＣＳパラメータなど）、例えば、直接またはエントロピーエンコーディングユニット２７０を介してエンコードしてから出力するように構成されてよく、それにより、例えば、デコーダ３０は、デコーディングのために同じループフィルタパラメータまたはそれぞれのループフィルタを受信して適用してよい。

［デコード済みの画像バッファ］
デコード済みの画像バッファ（ＤＰＢ）２３０は、ビデオエンコーダ２０によってビデオデータをエンコードするための参照画像、または一般に参照画像データを保存するメモリであってよい。ＤＰＢ２３０は、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗ＲＡＭ（ＲＲＡＭ（登録商標））、または他のタイプのメモリデバイスを含む、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）等の様々なメモリデバイスのうちの任意のものによって形成されてよい。デコード済みの画像バッファ（ＤＰＢ）２３０は、１または複数のフィルタリング済みのブロック２２１を保存するように構成されてよい。デコード済みの画像バッファ２３０は、同じ現在の画像または異なる画像、例えば、以前の再構築画像の他の以前にフィルタリング済みのブロック、例えば、以前に再構築され且つフィルタリング済みのブロック２２１を保存するようにさらに構成されてよく、例えば、インター予測のために、以前に再構築された、すなわちデコード済みの、完全な画像（並びに、対応する参照ブロックおよびサンプル）、および／または、部分的に再構築された現在の画像（並びに、対応する参照ブロックおよびサンプル）を提供してよい。デコード済みの画像バッファ（ＤＰＢ）２３０は、例えば、再構築ブロック２１５がループフィルタユニット２２０によってフィルタリングされていない場合、１または複数のフィルタリングされていない再構築ブロック２１５、または一般に、フィルタリングされていない再構築サンプル、または、再構築ブロックもしくはサンプルの任意の他のさらに処理されたバージョンを保存するように構成されてもよい。

［モード選択（区分化および予測）］
モード選択ユニット２６０は、区分化ユニット２６２と、インター予測ユニット２４４と、イントラ予測ユニット２５４とを備え、元の画像データ、例えば元のブロック２０３（現在の画像１７の現在のブロック２０３）、および再構築画像データ、例えば、同じ（現在の）画像のおよび／または１または複数の以前のデコード済みの画像からの、例えばデコード済みの画像バッファ２３０もしくは他のバッファ（例えば、図示しないラインバッファ）からのフィルタリング済みおよび／またはフィルタリングされていない再構築サンプルもしくはブロックを受信または取得するように構成されている。再構築画像データは、予測ブロック２６５または予測因子２６５を得るために、予測、例えばインター予測またはイントラ予測のための参照画像データとして使用される。

モード選択ユニット２６０は、現在のブロック予測モード（区分化を含まない）のための区分化および予測モード（例えば、イントラまたはインター予測モード）を決定または選択し、対応する予測ブロック２６５を生成するように構成されてよく、予測ブロック２６５は、残差ブロック２０５の計算のためおよび再構築ブロック２１５の再構築のために使用される。

モード選択ユニット２６０の実施形態は、区分化および予測モード（例えば、モード選択ユニット２６０によってサポートされているものまたはモード選択ユニット２６０に利用可能なものから）選択するように構成されてよく、これにより、最良のマッチ、または換言すれば、最小残差（最小残差は、送信または保存のための圧縮率がより良好であることを意味する）、または、最小シグナリングオーバヘッド（最小シグナリングオーバヘッドは、送信または保存のための圧縮率がより良好であることを意味する）、またはこれらの両方を考慮したもしくはバランスを取ったものを提供する。モード選択ユニット２６０は、レート歪み最適化（ＲＤＯ）に基づいて区分化および予測モードを決定する、すなわち、最小レート歪みを提供する予測モードを選択するように構成されてよい。この文脈において「最良」、「最小」、「最適」等のような用語は、全般的な「最良」、「最小」、「最適」等を必ずしも指さず、値が閾値または他の制約を超過または下回り、潜在的に「最適未満選択」につながるが複雑性および処理時間を低減するような、終了または選択基準の達成を指してもよい。

換言すれば、区分化ユニット２６２は、ビデオシーケンスからの画像を一連のコーディングツリーユニット（ＣＴＵ）に区分するよう構成されてよく、ＣＴＵ２０３は、例えば、四分木区分化（ＱＴ）、二分木区分化（ＢＴ）、もしくは三分木区分化（ＴＴ）、またはそれらの任意の組み合わせを繰り返し用いて、より小さいブロック区分または（やはりブロックを形成する）サブブロックに更に区分化されてよく、また、例えば、ブロック区分またはサブブロックのそれぞれのための予測を実行するように構成されてよく、モード選択は、区分化されたブロック２０３のツリー構造の選択を含み、予測モードは、ブロック区分またはサブブロックのそれぞれに適用される。

以下では、例示のビデオエンコーダ２０によって実行される、区分化（例えば、区分化ユニット２６０による）および予測処理（インター予測ユニット２４４およびイントラ予測ユニット２５４による）をより詳細に説明する。

［区分化］
区分化ユニット２６２は、ビデオシーケンスからの画像を一連のコーディングツリーユニット（ＣＴＵ）に区分化するよう構成されてよく、区分化ユニット２６２は、コーディングツリーユニット（ＣＴＵ）２０３をより小さい区分、例えば、正方形または矩形サイズのより小さいブロックに区分化（または分割）してよい。３つのサンプルアレイを有する画像の場合、ＣＴＵは、クロマサンプルの２つの対応するブロックと共に、ルマサンプルのＮ×Ｎブロックから成る。ＣＴＵにおけるルマブロックの最大許容サイズは、開発中の多目的ビデオコーディング（ＶＶＣ）において、１２８×１２８に指定されるが、将来は１２８×１２８以外の値、例えば２５６×２５６に指定されてよい。画像のＣＴＵは、スライス／タイルグループ、タイルまたはブリックとしてクラスター化／グループ化されてよい。タイルは、画像の矩形領域をカバーし、タイルは、１または複数のブリックに分割されてよい。ブリックは、タイル内の多くのＣＴＵ行から成る。複数のブリックに区分化されないタイルはブリックと称されてよい。しかしながら、ブリックは、タイルの真のサブセットであり、タイルと称されない。ＶＶＣにおいてサポートされるタイルグループには２つのモードがある。すなわち、ラスタースキャンスライス／タイルグループモードおよび矩形スライスモードである。ラスタースキャンタイルグループモードにおいて、スライス／タイルグループは、画像のタイルラスタースキャンにおける一連のタイルを含む。矩形スライスモードにおいて、スライスは、まとめて画像の矩形領域を形成する画像の多くのブリックを含む。矩形スライス内のブリックは、スライスのブリックラスタースキャンの順序である。これらのより小さいブロック（サブブロックとも称され得る）は、さらにより小さい区分にさらに区分化されてよい。これは、ツリー区分化もしくは階層的ツリー区分化とも称され、ここで、例えばルートツリーレベル０（階層レベル０、深度０）にあるルートブロックは、再帰的に区分化、例えば、次に低いツリーレベル、例えばツリーレベル１（階層レベル１、深度１）にあるノードの２または２より多いブロックに区分化されてよく、これらのブロックは、例えば終了基準が達成されたことで、例えば最大ツリー深度または最小ブロックサイズに達したことで、区分化が終了するまで、次に低いレベル、例えばツリーレベル２（階層レベル２、深度２）の２または２より多いブロックに再度区分化される等してよい。さらに区分化されないブロックは、ツリーのリーフブロックまたはリーフノードとも称される。２つの区分への区分化を用いるツリーは、二分木（ＢＴ）と称され、３つの区分への区分化を用いるツリーは、三分木（ＴＴ）と称され、４つの区分への区分化を用いるツリーは、四分木（ＱＴ）と称される。

例えば、コーディングツリーユニット（ＣＴＵ）は、３つのサンプルアレイを有する画像のルマサンプルのＣＴＢ、クロマサンプルの２つの対応するＣＴＢ、または、モノクロ画像のもしくはサンプルをコードするために使用された３つの別個の色平面およびシンタックス構造を用いてコードされた画像のサンプルのＣＴＢであるか、またはそれらを含んでよい。対応して、コーディングツリーブロック（ＣＴＢ）は、ＣＴＢへの構成要素の分割が区分化であるように、或るＮの値に関してサンプルのＮ×Ｎのブロックであってよい。コーディングユニット（ＣＵ）は、ルマサンプルのコーディングブロック、３つのサンプルアレイを有する画像のクロマサンプルの２つの対応するコーディングブロック、または、モノクロ画像のもしくはサンプルをコードするために使用された３つの別個の色平面およびシンタックス構造を用いてコードされた画像のサンプルのコーディングブロックであるか、またはそれらを含んでよい。対応して、コーディングブロック（ＣＢ）は、コーディングブロックへのＣＴＢの分割が区分化であるように、或るＭおよびＮの値に関してサンプルのＭ×Ｎのブロックであってよい。

例えばＨＥＶＣに従う実施形態において、コーディングツリーユニット（ＣＴＵ）は、コーディングツリーとして表される四分木構造を用いることによってＣＵに分割されてよい。画像エリアを、インター画像（時間）予測を用いてコードするのかまたはイントラ画像（空間）予測を用いてコードするのかの決定は、リーフＣＵレベルで行われる。各リーフＣＵはさらに、ＰＵの分割タイプに従って、１つ、２つ、または４つのＰＵに分割することができる。１つのＰＵの内部では、同じ予測処理が適用され、関連情報はＰＵベースでデコーダに送信される。ＰＵの分割タイプに基づいて予測処理を適用することによって残差ブロックを取得した後、リーフＣＵは、ＣＵのコーディングツリーと同様の別の四分木構造に従って変換ユニット（ＴＵ）に区分化できる。

実施形態において、例えば、多目的ビデオコーディング（ＶＶＣ）と称される現在開発中の最新のビデオコーディング規格によれば、組み合わされた四分木が、例えばコーディングツリーユニットを区分化するのに使用される２および３分割セグメンテーション構造を使用して、マルチタイプツリーをネストした。コーディングツリーユニット中のコーディングツリー構造において、ＣＵは、正方形または矩形形状のいずれかを有することができる。例えば、コーディングツリーユニット（ＣＴＵ）は、最初に四分木によって区分化される。次に、四分木リーフノードは更に、マルチタイプツリー構造によって区分化され得る。マルチタイプツリー構造には４つの分割タイプ、すなわち、垂直２分割（ＳＰＬＩＴ＿ＢＴ＿ＶＥＲ）、水平２分割（ＳＰＬＩＴ＿ＢＴ＿ＨＯＲ）、垂直３分割（ＳＰＬＩＴ＿ＴＴ＿ＶＥＲ）および水平３分割（ＳＰＬＩＴ＿ＴＴ＿ＨＯＲ）がある。マルチタイプツリーリーフノードは、コーディングユニット（ＣＵ）と呼ばれ、ＣＵが最大変換長に対して大きすぎない限り、このセグメンテーションは、任意の更なる区分化なしで、予測および変換処理に使用される。このことは、ほとんどの場合において、ＣＵ、ＰＵ、およびＴＵは、ネストされたマルチタイプツリーコーディングブロック構造を有する四分木において同一のブロックサイズを有することを意味する。サポートされる最大変換長がＣＵのカラーコンポーネントの幅または高さより小さいとき、例外が発生する。ＶＶＣは、ネストされたマルチタイプツリーコーディングツリー構造を有する四分木における区分分割情報の独自のシグナリング機構を発展させる。シグナリング機構において、コーディングツリーユニット（ＣＴＵ）は、四分木のルートとして扱われ、最初に四分木構造によって区分化される。そして、各四分木リーフノードは（それを可能とするのに十分大きいとき）更にマルチタイプツリー構造によって区分化される。マルチタイプツリー構造において、ノードが更に区分化されるかどうかを示すために第１フラグ（ｍｔｔ＿ｓｐｌｉｔ＿ｃｕ＿ｆｌａｇ）がシグナリングされ、ノードが更に区分化されるとき、分割方向を示すために第２フラグ（ｍｔｔ＿ｓｐｌｉｔ＿ｃｕ＿ｖｅｒｔｉｃａｌ＿ｆｌａｇ）がシグナリングされ、次に、分割が２分割であるか、または、３分割であるかを示すために第３フラグ（ｍｔｔ＿ｓｐｌｉｔ＿ｃｕ＿ｂｉｎａｒｙ＿ｆｌａｇ）がシグナリングされる。ｍｔｔ＿ｓｐｌｉｔ＿ｃｕ＿ｖｅｒｔｉｃａｌ＿ｆｌａｇおよびｍｔｔ＿ｓｐｌｉｔ＿ｃｕ＿ｂｉｎａｒｙ＿ｆｌａｇの値に基づいて、ＣＵのマルチタイプツリースリッティングモード（ＭｔｔＳｐｌｉｔＭｏｄｅ）が、予め定義された規則または表に基づいてデコーダによって導出され得る。特定の設計、例えば、ＶＶＣハードウェアデコーダにおける６４×６４ルマブロックおよび３２×３２クロマパイプライン設計では、図６に示されるように、ルマコーディングブロックの幅または高さのいずれかが６４より大きいとき、ＴＴ分割が禁止されることを留意すべきである。ＴＴ分割はまた、クロマコーディングブロックの幅または高さのいずれかが３２より大きいとき、禁止される。パイプライン設計は、画像における非重複ユニットとして規定される仮想パイプラインデータユニット（ＶＰＤＵ）に画像を分割する。ハードウェアデコーダにおいて、連続するＶＰＤＵが複数のパイプラインステージによって同時に処理される。ＶＰＤＵサイズは、大部分のパイプラインステージにおいてバッファサイズに概ね比例するので、ＶＰＤＵサイズを小さく維持することは重要である。大部分のハードウェアデコーダにおいて、ＶＰＤＵサイズは、最大変換ブロック（ＴＢ）サイズに設定され得る。しかしながら、ＶＶＣにおいて、三分木（ＴＴ）および二分木（ＢＴ）区分は、ＶＰＤＵサイズの増加につながり得る。

加えて、ツリーノードブロックの部分が、下または右の画像の境界を超える場合、すべてのコーディングＣＵのすべてのサンプルが画像境界内で位置特定されるまで、ツリーノードブロックは強制的に分割されることに留意すべきである。

例として、イントラサブパーティション（ＩＳＰ）ツールは、ブロックサイズに応じて、ルマイントラ予測ブロックを垂直または水平に２または４つのサブ区分に分割し得る。

一例において、ビデオエンコーダ２０のモード選択ユニット２６０は、本明細書に記載の区分化技術の任意の組み合わせを実行するように構成されてよい。

上述したように、ビデオエンコーダ２０は、（例えば、事前決定された）予測モードのセットから最良または最適な予測モードを決定または選択するように構成されている。予測モードのセットは、例えば、イントラ予測モードおよび／またはインター予測モードを含んでよい。

［イントラ予測］
イントラ予測モードのセットは、３５の異なるイントラ予測モード、例えば、ＤＣ（またはミーン）モードおよび平面モードのような無方向性モード、もしくは、例えばＨＥＶＣにおいて定義されているような、方向性モードを含んでよく、または、６７の異なるイントラ予測モード、例えば、ＤＣ（またはミーン）モードおよび平面モードのような無方向性モード、もしくは、例えばＶＶＣに定義されている、方向性モードを含んでよい。例として、いくつかの従来の角度イントラ予測モードは、例えばＶＶＣにおいて規定される非正方形ブロックについての広角イントラ予測モードと適応的に置き換えられる。別の例として、ＤＣ予測についての分割操作を回避するべく、長辺のみが、非正方形ブロックについての平均を計算するのに使用される。そして、平面モードのイントラ予測の結果は更に、位置依存イントラ予測組み合わせ（ＰＤＰＣ）法によって修正され得る。

イントラ予測ユニット２５４は、同じ現在の画像の隣接ブロックの再構築サンプルを使用して、イントラ予測モードのセットのうちのイントラ予測モードに従って、イントラ予測ブロック２６５を生成するように構成されている。

イントラ予測ユニット２５４（または一般にモード選択ユニット２６０）は、イントラ予測パラメータ（または一般に、ブロックのために選択されたイントラ予測モードを示す情報）を、エンコード済みの画像データ２１に含まれるようにシンタックス要素２６６の形態でエントロピーエンコーディングユニット２７０に出力するようにさらに構成され、それにより、例えば、ビデオデコーダ３０は、デコーディングのための予測パラメータを受信して使用してよい。

［インター予測］
インター予測モードのセット（または可能なインター予測モード）は、利用可能な参照画像（すなわち、例えばＤＢＰ２３０に保存された、以前の少なくとも部分的にデコード済みの画像）および他のインター予測パラメータ、例えば、最良にマッチする参照ブロックの検索に使用されたのは、参照画像の全体なのかもしくは参照画像の一部のみ、例えば、現在のブロックのエリアの周りの検索窓エリアなのか、および／または、例えば、画素補間、例えばハーフ／セミペルおよび／またはクオータペルおよび／または１／１６ペル補間が適用されたか否かに依拠する。

上の予測モードに加えて、スキップモード、ダイレクトモードおよび／または他のインター予測モードが適用され得る。

例えば、拡張マージ予測では、そのようなモードのマージ候補リストは、以下の５種類の候補、すなわち、空間近傍ＣＵからの空間的ＭＶＰ、コロケートＣＵからの時間的ＭＶＰ、ＦＩＦＯテーブルからの履歴ベースのＭＶＰ、ペアワイズ平均ＭＶＰ、およびゼロＭＶを順に含めることによって構築される。そして、バイラテラルマッチングをベースとしてデコーダ側動きベクトル洗練化（ＤＭＶＲ）が、マージモードのＭＶの正確度を増加させるために適用され得る。動きベクトル差を伴うマージモードに由来するＭＶＤを伴うマージモード（ＭＭＶＤ）。ＭＭＶＤフラグは、スキップフラグおよびマージフラグを送信し直後にシグナリングされ、ＭＭＶＤモードがＣＵに使用されるかどうかを指定する。そして、ＣＵレベル適応型動きベクトル解像度（ＡＭＶＲ）方式が適用され得る。ＡＭＶＲは、ＣＵのＭＶＤが異なる精度でコーディングされることを可能にする。現在のＣＵの予測モードに応じて、現在のＣＵのＭＶＤは適応的に選択され得る。ＣＵがマージモードにおいてコーディングされるとき、組み合されたインター／イントラ予測（ＣＩＩＰ）モードが現在のＣＵに適用され得る。インター／イントラ予測信号の加重平均化が、ＣＩＩＰ予測を取得するために実行される。アフィン動き補償予測、ブロックのアフィン動きフィールドは、２つの制御点（４パラメータ）または３つの制御点動きベクトル（６パラメータ）の動き情報によって記述される。ＨＥＶＣにおける時間的動きベクトル予測（ＴＭＶＰ）と同様であるが、現在のＣＵにおけるサブＣＵの動きベクトルを予測するサブブロックベースの時間的動きベクトル予測（ＳｂＴＭＶＰ）。以前はＢＩＯと称されていた双方向オプティカルフロー（ＢＤＯＦ）は、特に乗算の数および乗数のサイズに関して、はるかに少ない計算を要求する、より単純なバージョンである。そのようなモードにおける三角形区分モードでは、ＣＵは、対角線分割または反対角線分割のいずれかを使用して、２つの三角形形状の区分に均等に分割される。また、双予測モードは、単純な平均化を超えて拡張され、２つの予測信号の加重平均化を可能にする。

インター予測ユニット２４４は、動き推定（ＭＥ）ユニットおよび動き補償（ＭＣ）ユニット（両方とも図２には図示せず）を備えてよい。動き推定ユニットは、動き推定のために、画像ブロック２０３（現在の画像１７の現在の画像ブロック２０３）およびデコード済みの画像２３１、または、少なくとも１または複数の以前の再構築ブロック、例えば１または複数の他の／異なる以前のデコード済みの画像２３１の再構築ブロックを受信または取得するように構成されてよい。例えば、ビデオシーケンスは、現在の画像および以前のデコード済みの画像２３１を含んでよく、または換言すれば、現在の画像および以前のデコード済みの画像２３１は、ビデオシーケンスを形成する一連の画像の一部であるかまたはそれを形成してよい。

エンコーダ２０は、例えば、複数の他の画像のうちの同じまたは異なる画像の複数の参照ブロックから参照ブロックを選択し、インター予測パラメータとして参照画像（または参照画像インデックス）および／または参照ブロックの位置（ｘ、ｙ座標）と現在のブロックの位置との間のオフセット（空間的オフセット）を動き推定ユニットに提供するように構成してよい。このオフセットは、動きベクトル（ＭＶ）とも呼ばれる。

動き補償ユニットは、インター予測パラメータを取得、例えば受信するとともに、そのインター予測パラメータに基づいてまたはそれを使用してインター予測を実行して、インター予測ブロック２６５を取得するように構成されている。動き補償ユニットによって実行される動き補償は、動き推定によって決定された動き/ブロックベクトルに基づいて予測ブロックをフェッチまたは生成し、場合によって副画素精度までの補間を実行することを伴ってよい。補間フィルタリングは、既知の画素サンプルから更なる画素サンプルを生成してよく、したがって、画像ブロックをコードするのに用いられ得る候補予測ブロックの数を潜在的に増加させる。現在の画像ブロックのＰＵのための動きベクトルを受信すると、動き補償ユニットは、参照画像リストのうちの１つにおいて動きベクトルが指し示す予測ブロックを位置特定してよい。

動き補償ユニットは、ビデオスライスの画像ブロックをデコードする際にビデオデコーダ３０によって用いられる、ブロックおよびビデオスライスに関連付けられるシンタックス要素を生成してもよい。スライスおよびそれぞれのシンタックス要素に追加的に、または代替的に、タイルグループおよび／またはタイル、ならびに、それぞれのシンタックス要素が生成または使用され得る。

［エントロピーコーディング］
エントロピーエンコーディングユニット２７０は、例えば、エントロピーエンコーディングアルゴリズムまたはスキーム（例えば、可変長コーディング（ＶＬＣ）スキーム、コンテキスト適応ＶＬＣスキーム（ＣＡＶＬＣ）、算術コーディングスキーム、二値化、コンテキスト適応バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースのコンテキスト適応バイナリ算術コーディング（ＳＢＡＣ）、確率インターバル区分化エントロピー（ＰＩＰＥ）コーディング、または、別のエントロピーエンコーディング方法もしくは技術）、またはバイパス（無圧縮）を、量子化係数２０９、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ、および／または他のシンタックス要素に適用し、例えばエンコード済みのビットストリーム２１の形態で出力２７２を介して出力できるエンコード済みの画像データ２１を取得するように構成され、それにより、例えば、ビデオデコーダ３０は、デコーディングのためのパラメータを受信して使用してよい。エンコード済みのビットストリーム２１は、ビデオデコーダ３０に送信、または、後でビデオデコーダ３０によって送信または取得するためにメモリに保存されてよい。

ビデオエンコーダ２０の他の構造上のバリエーションを、ビデオストリームをエンコードするのに用いてよい。例えば、非変換ベースのエンコーダ２０は、特定のブロックまたはフレームのための変換処理ユニット２０６を用いずに直接的に残差信号を量子化できる。別の実装において、エンコーダ２０は、単一のユニットに組み合わされた量子化ユニット２０８および逆量子化ユニット２１０を有することができる。

［デコーダおよびデコーディング方法］
図３は、本願の技術を実装するように構成されているビデオデコーダ３０の例を示している。ビデオデコーダ３０は、例えばエンコーダ２０によってエンコードされた、エンコード済みの画像データ２１（例えば、エンコード済みのビットストリーム２１）を受信して、デコード済みの画像３３１を取得するように構成されている。エンコード済みの画像データまたはビットストリームは、エンコード済みの画像データをデコードするための情報、例えば、エンコード済みのビデオスライス（および／またはタイルグループまたはタイル）の画像ブロックおよび関連するシンタックス要素を表すデータを含む。

図３の例において、デコーダ３０は、エントロピーデコーディングユニット３０４、逆量子化ユニット３１０、逆変換処理ユニット３１２、再構築ユニット３１４（例えば、合算器３１４）、ループフィルタ３２０、モード適用ユニット３６０、デコード済みの画像バッファ（ＤＢＰ）３３０、インター予測ユニット３４４、およびイントラ予測ユニット３５４を備える。インター予測ユニット３４４は、動き補償ユニットであるかまたはこれを備えてよい。ビデオデコーダ３０は、いくつかの例では、図２のビデオエンコーダ１００に関して説明されたエンコーディングパスに対して概ね逆のデコーディングパスを実行してよい。

エンコーダ２０に関して説明したように、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構築ユニット２１４、ループフィルタ２２０、デコード済みの画像バッファ（ＤＰＢ）２３０、インター予測ユニット３４４、およびイントラ予測ユニット３５４も、ビデオエンコーダ２０の「内蔵デコーダ」を形成するものとして言及される。したがって、逆量子化ユニット３１０は、逆量子化ユニット１１０と機能的に同一であってよく、逆変換処理ユニット３１２は、逆変換処理ユニット２１２と機能的に同一であってよく、再構築ユニット３１４は、再構築ユニット２１４と機能的に同一であってよく、ループフィルタ３２０は、ループフィルタ２２０と機能的に同一であってよく、デコード済みの画像バッファ３３０は、デコード済みの画像バッファ２３０と機能的に同一であってよい。したがって、ビデオエンコーダ２０のそれぞれのユニットおよび機能について提供された説明は、ビデオデコーダ３０のそれぞれのユニットおよび機能に対応するように当てはまる。

［エントロピーデコーディング］
エントロピーデコーディングユニット３０４は、ビットストリーム２１（または一般にエンコード済みの画像データ２１）を解析し、例えば、エンコード済みの画像データ２１にエントロピーデコーディングを実行して、例えば量子化係数３０９および／またはデコードされたコーディングパラメータ（図３には図示せず）、例えば、インター予測パラメータ（例えば、参照画像インデックスおよび動きベクトル）、イントラ予測パラメータ（例えば、イントラ予測モードまたはインデックス）、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、および／または他のシンタックス要素のいずれかまたはすべてを取得するように構成されている。エントロピーデコーディングユニット３０４は、エンコーダ２０のエントロピーエンコーディングユニット２７０に関して記載されたエンコーディングスキームに対応するデコーディングアルゴリズムまたはスキームを適用するように構成されてよい。エントロピーデコーディングユニット３０４は、インター予測パラメータ、イントラ予測パラメータ、および／または他のシンタックス要素をモード適用ユニット３６０に、また他のパラメータをデコーダ３０の他のユニットに提供するようにさらに構成されてよい。ビデオデコーダ３０は、ビデオスライスレベルでおよび／またはビデオブロックレベルで、シンタックス要素を受信してよい。スライスおよびそれぞれのシンタックス要素に追加的に、または代替的に、タイルグループおよび／またはタイル、ならびに、それぞれのシンタックス要素が受信および／または使用され得る。

［逆量子化］
逆量子化ユニット３１０は、エンコード済みの画像データ２１から量子化パラメータ（ＱＰ）（または一般に逆量子化に関連する情報）および量子化係数を受信する（例えばエントロピーデコーディングユニット３０４によって、例えば解析および／またはデコードすることによって）とともに、量子化パラメータに基づいて、デコード済みの量子化係数３０９に逆量子化を適用し、変換係数３１１とも称され得る量子化解除係数３１１を取得するように構成されてよい。逆量子化プロセスは、量子化の程度、また同様に適用されるべき逆量子化の程度を決定するために、ビデオスライス（またはタイルもしくはタイルグループ）内のビデオブロック毎にビデオエンコーダ２０によって決定される量子化パラメータの使用を含んでよい。

［逆変換］
逆変換処理ユニット３１２は、変換係数３１１とも称される量子化解除係数３１１を受信するとともに、サンプル領域における再構築残差ブロック２１３を取得するべく、量子化解除係数３１１に変換を適用するように構成されてよい。再構築残差ブロック２１３は、変換ブロック３１３とも称され得る。変換は、逆変換、例えば、逆ＤＣＴ、逆ＤＳＴ、逆整数変換、または概念的に同様の逆変換プロセスであってよい。逆変換処理ユニット３１２は、エンコード済みの画像データ２１から変換パラメータまたは対応する情報を受信し（例えばエントロピーデコーディングユニット３０４によって、例えば解析および／またはデコードすることによって）、量子化解除係数３１１に適用されるべき変換を決定するようにさらに構成されてよい。

［再構築］
再構築ユニット３１４（例えば、加算器または合算器３１４）は、再構築残差ブロック３１３を予測ブロック３６５に加算し、例えば、再構築残差ブロック３１３のサンプル値と予測ブロック３６５のサンプル値とを加算することによって、サンプル領域における再構築ブロック３１５を取得するように構成されてよい。

［フィルタリング］
ループフィルタユニット３２０（コーディングループ内またはコーディングループの後のいずれかにある）は、例えば、画素遷移を滑らかにするようにまたはビデオ品質を別様に改善するように、再構築ブロック３１５をフィルタして、フィルタリング済みのブロック３２１を取得するように構成されている。ループフィルタユニット３２０は、デブロッキングフィルタ、サンプル適応型オフセット（ＳＡＯ）フィルタ、または、１または複数の他のフィルタ、例えば、適応ループフィルタ（ＡＬＦ）、ノイズ抑制フィルタ（ＮＳＦ）、またはそれらの任意の組み合わせなど、１または複数のループフィルタを含み得る。例において、ループフィルタユニット２２０はデブロッキングフィルタ、ＳＡＯフィルタ、およびＡＬＦフィルタを含み得る。フィルタリング処理の順序は、非ブロック化フィルタ、ＳＡＯ、およびＡＬＦであり得る。別の例において、クロマスケーリングを伴うルママッピング（ＬＭＣＳ）（すなわち、適応インループリシェーパ）と呼ばれる処理が追加される。この処理は非ブロック化の前に実行される。別の例において、非ブロック化フィルタ処理はまた、内部サブブロックエッジ、例えば、アフィンサブブロックエッジ、ＡＴＭＶＰサブブロックエッジ、サブブロック変換（ＳＢＴ）エッジ、およびイントラサブパーティション（ＩＳＰ）エッジに適用され得る。ループフィルタユニット３２０が、ループフィルタ内にあるものとして図３に示されているが、他の構成では、ループフィルタユニット３２０はポストループフィルタとして実装されてもよい。

［デコード済みの画像バッファ］
画像のデコード済みのビデオブロック３２１は、その後、デコード済みの画像バッファ３３０に保存され、デコード済みの画像バッファ３３０は、デコード済みの画像３３１を他の画像の後続の動き補償のためのおよび／またはそれぞれ表示を出力するための参照画像として保存する。

デコーダ３０は、例えば出力３１２を介して、ユーザに提示または閲覧させるために、デコード済みの画像３１１を出力するように構成されている。

［予測］
インター予測ユニット３４４は、インター予測ユニット２４４（特に、動き補償ユニット）と同一であってよく、イントラ予測ユニット３５４は、インター予測ユニット２５４と機能的に同一であってよく、エンコード済みの画像データ２１から受信（例えば、エントロピーデコーディングユニット３０４によって、例えば、解析および／またはデコードすることによって）された区分化および／または予測パラメータまたはそれぞれの情報に基づいて分割または区分化の決定および予測を実行する。モード適用ユニット３６０は、再構築画像、ブロック、またはそれぞれのサンプル（フィルタリング済みまたはフィルタリングされていない）に基づいてブロック毎に予測（イントラまたはインター予測）を実行し、予測ブロック３６５を取得するように構成されてよい。

ビデオスライスがイントラコード済み（Ｉ）スライスとしてコードされている場合、モード適用ユニット３６０のイントラ予測ユニット３５４は、シグナリングされたイントラ予測モードおよび現在の画像の以前にデコード済みのブロックからのデータに基づいて、現在のビデオスライスの画像ブロックのための予測ブロック３６５を生成するように構成されている。ビデオ画像がインターコード済みの（すなわち、ＢまたはＰ）スライスとしてコードされている場合、モード適用ユニット３６０のインター予測ユニット３４４（例えば、動き補償ユニット）は、動きベクトルおよびエントロピーデコーディングユニット３０４から受信された他のシンタックス要素に基づいて、現在のビデオスライスのビデオブロックのための予測ブロック３６５を生成するように構成されている。インター予測では、予測ブロックは、複数の参照画像リストのうちの１つに含まれる複数の参照画像のうちの１つから生成されてよい。ビデオデコーダ３０は、リスト０およびリスト１という参照フレームリストを、デフォルトの構築技法を用いて、ＤＰＢ３３０に保存された参照画像に基づいて構築してよい。同一または同様のことが、スライス（例えばビデオスライス）に追加的または代替的にタイルグループ（例えばビデオタイルグループ）および／またはタイル（例えばビデオタイル）を使用する実施形態について、または、それによって適用され得る。例えば、ビデオは、Ｉ、Ｐ、またはＢタイルグループおよび／またはタイルを使用してコーディングされ得る。

モード適用ユニット３６０は、動きベクトルまたは関連情報および他のシンタックス要素を解析することによって、現在のビデオスライスのビデオブロックのための予測情報を決定するように構成され、デコードされている現在のビデオブロックのための予測ブロックを生成するために上記予測情報を用いる。例えば、モード適用ユニット３６０は、受信されたシンタックス要素のいくつかを用いて、ビデオスライスのビデオブロックをコードするのに用いられた予測モード（例えば、イントラまたはインター予測）、インター予測スライスタイプ（例えば、Ｂスライス、Ｐスライス、またはＧＰＢスライス）、スライスのための参照画像リストのうちの１もしくは複数に関する構築情報、スライスの各インターエンコード済みのビデオブロック毎の動きベクトル、スライスのインターコード済みのビデオブロック毎のインター予測ステータス、および現在のビデオスライス内のビデオブロックをデコードするための他の情報を決定する。同一または同様のことが、スライス（例えばビデオスライス）に追加的または代替的にタイルグループ（例えばビデオタイルグループ）および／またはタイル（例えばビデオタイル）を使用する実施形態について、または、それによって適用され得る。例えば、ビデオは、Ｉ、Ｐ、またはＢタイルグループおよび／またはタイルを使用してコーディングされ得る。

図３に示されるビデオデコーダ３０の実施形態は、スライス（ビデオスライスとも称される）を使用することによって画像を区分化および／またはデコードするよう構成されてよく、画像は、１または複数のスライス（典型的には非重複）を使用して区分化またはデコードされてよく、各スライスは、１または複数のブロック（例えばＣＴＵ）、または、ブロックの１または複数のグループ（例えば、タイルＨ．２６５／ＨＥＶＣおよびＶＶＣ）またはブリック（ＶＶＣ）を含んでよい。

図３に示されるビデオデコーダ３０の実施形態は、スライス／タイルグループ（ビデオタイルグループとも称される）および／またはタイル（ビデオタイルとも称される）を使用することによって画像を区分化および／またはデコードするよう構成されてよく、画像は、１または複数のスライス／タイルグループ（典型的には非重複）を使用して区分化またはデコードされてよく、各スライス／タイルグループは、例えば１または複数のブロック（例えばＣＴＵ）または１または複数のタイルを含んでよく、各タイルは例えば、矩形形状であってよく、１または複数のブロック（例えば、ＣＴＵ）、例えば完全または部分的ブロックを含んでよい。

ビデオデコーダ３０の他のバリエーションを、エンコード済みの画像データ２１をデコードするのに用いてよい。例えば、デコーダ３０は、ループフィルタリングユニット３２０を用いずに、出力ビデオストリームを生成することができる。例えば、非変換ベースのデコーダ３０は、特定のブロックまたはフレームのための逆変換処理ユニット３１２を用いずに、残差信号を直接的に逆量子化することができる。別の実装において、ビデオデコーダ３０は、単一のユニットに組み合わされた逆量子化ユニット３１０および逆変換処理ユニット３１２を有することができる。

エンコーダ２０およびデコーダ３０において、現在の段階の処理結果は、さらに処理されて、その後、次の段階に出力されてよいことが理解されるべきである。例えば、補間フィルタリング、動きベクトル導出またはループフィルタリングの後に、クリップまたはシフト等の更なる操作を、補間フィルタリング、動きベクトル導出またはループフィルタリングの処理結果に対して実行してよい。

更なる操作を、現在のブロックの導出された動きベクトル（限定しないが、アフィンモードの制御点動きベクトル、アフィン、平面、ＡＴＭＶＰモードにおけるサブブロック動きベクトル、時間的な動きベクトル等を含む）に適用してよいことに留意すべきである。例えば、動きベクトルの値は、その表現ビットに従って予め定義された範囲に制限される。動きベクトルの表現ビットがｂｉｔＤｅｐｔｈである場合、その範囲は、－２＾（ｂｉｔＤｅｐｔｈ－１）～２＾（ｂｉｔＤｅｐｔｈ－１）－１であり、ここで、「＾」はべき乗を意味する。例えば、ｂｉｔＤｅｐｔｈが１６に等しく設定されている場合、その範囲は－３２７６８～３２７６７であり、ｂｉｔＤｅｐｔｈが１８に等しく設定されている場合、その範囲は－１３１０７２～１３１０７１である。例えば、導出された動きベクトル（例えば、１つの８×８ブロックにおける４つの４×４サブブロックのＭＶ）の値は、４つの４×４サブブロックＭＶの整数部分の間の最大差が、１画素以下など、Ｎ画素以下であるように制限される。以下、ＢｉｔＤｅｐｔｈに従って動きベクトルを制限する２つの方法を提供する。

図４は、本開示の一実施形態に係るビデオコーディングデバイス４００の概略図である。ビデオコーディングデバイス４００は、本明細書に記載の開示される実施形態を実装するのに好適なものである。一実施形態において、ビデオコーディングデバイス４００は、図１Ａのビデオデコーダ３０等のデコーダ、または、図１Ａのビデオエンコーダ２０等のエンコーダであってよい。

ビデオコーディングデバイス４００は、データを受信するための入口ポート４１０（または、入力ポート４１０）および受信器ユニット（Ｒｘ）４２０と、データを処理するためのプロセッサ、ロジックユニット、または中央演算処理装置（ＣＰＵ）４３０と、データを送信するための送信器ユニット（Ｔｘ）４４０および出口ポート４５０（または出力ポート４５０）と、データを保存するためのメモリ４６０とを備える。ビデオコーディングデバイス４００は、入口ポート４１０、受信器ユニット４２０、送信器ユニット４４０、および、光または電気信号の出入りのための出口ポート４５０に連結されている、光／電気（ＯＥ）構成要素および電気／光（ＥＯ）構成要素を備えてもよい。

プロセッサ４３０は、ハードウェアおよびソフトウェアによって実装される。プロセッサ４３０は、１または複数のＣＰＵチップ、コア（例えば、マルチコアプロセッサとして）、ＦＰＧＡ、ＡＳＩＣ、およびＤＳＰとして実装されてよい。プロセッサ４３０は、入口ポート４１０、受信器ユニット４２０、送信器ユニット４４０、出口ポート４５０、およびメモリ４６０と通信する。プロセッサ４３０は、コーディングモジュール４７０を備える。コーディングモジュール４７０は、上述した開示される実施形態を実装する。例えば、コーディングモジュール４７０は、様々なコーディング操作を実装、処理、準備、または提供する。したがって、コーディングモジュール４７０を含むことにより、ビデオコーディングデバイス４００の機能のかなりの改善が提供され、ビデオコーディングデバイス４００の異なる状態への変換がもたらされる。代替的に、コーディングモジュール４７０は、メモリ４６０に格納され、プロセッサ４３０により実行される命令として実装される。

メモリ４６０は、１または複数のディスク、テープドライブ、およびソリッドステートドライブを備え得、オーバーフローデータ格納デバイスとして使用され、そのようなプログラムが実行のために選択された場合にプログラムを格納して、プログラムを実行している間に読み取られる命令およびデータを格納し得る。メモリ４６０は、例えば、揮発性および／または不揮発性であってよく、リードオンリメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、三値連想メモリ（ＴＣＡＭ）、および／または、スタティックランダムアクセスメモリ（ＳＲＡＭ）であってよい。

図５は、例示的な実施形態に係る図１Ａによるソースデバイス１２およびデスティネーションデバイス１４のいずれかまたは両方として使用されてよい装置５００の概略ブロック図である。

装置５００におけるプロセッサ５０２は、中央演算処理装置としてよい。代替的には、プロセッサ５０２は、現在既存のまたは今後開発される情報の操作または処理が可能な任意の他のタイプのデバイス、または複数のデバイスとしてよい。開示の実装は、図示のような単一のプロセッサ、例えばプロセッサ５０２で実施してよいが、１つより多いプロセッサを用いて、速度および効率の利益を実現してよい。

装置５００におけるメモリ５０４は、一実装において、リードオンリメモリ（ＲＯＭ）デバイスまたはランダムアクセスメモリ（ＲＡＭ）デバイスとしてよい。任意の他の好適なタイプのストレージデバイスを、メモリ５０４として使用してよい。メモリ５０４は、バス５１２を用いてプロセッサ５０２によってアクセスされるコードおよびデータ５０６を備えることができる。メモリ５０４は、オペレーティングシステム５０８およびアプリケーションプログラム５１０をさらに備えることができ、アプリケーションプログラム５１０は、プロセッサ５０２が本明細書に記載の方法を実行することを可能にする少なくとも１つのプログラムを含む。例えば、アプリケーションプログラム５１０は、アプリケーション１～Ｎを含むことができ、アプリケーション１～Ｎは、本明細書に記載の方法を実行するビデオコーディングアプリケーションをさらに含む。

装置５００は、ディスプレイ５１８等の、１または複数の出力デバイスも備えることができる。ディスプレイ５１８は、一例において、ディスプレイと、タッチ入力を検知するように動作可能なタッチセンサ素子とを組み合わせたタッチセンサ式ディスプレイであってよい。ディスプレイ５１８は、バス５１２を介してプロセッサ５０２に連結してよい。

単一のバスとして本明細書に示したが、装置５００のバス５１２は、複数のバスから構成されてよい。さらに、セカンダリストレージ５１４は、装置５００の他の構成要素に直接連結してよく、または、ネットワークを介してアクセスでき、メモリカード等の単一の一体型ユニットまたは複数のメモリカード等の複数のユニットを含んでよい。したがって、装置５００は、多種多様な構成で実装することができる。

本願の現在の解決手段で実装されてよい一部の技法を以下で紹介する。

［マージ候補リスト］
マージ動き候補リストを構築する処理が、ＩＴＵ‐ＴＨ．２６５規格によって導入される。別の実施形態において、マージ動き候補リストは、多目的ビデオコーディング（ＶＶＣ）の拡張マージ予測によって使用される。

ブロックマージ操作は、動きデータコーディングのための特殊モード（「マージモード」とも呼ばれる）である。ブロックマージ操作は、隣接ブロックの同一の動き情報を使用して、現在のブロックを可能にする。動き情報は動きデータを含み、動きデータは、１つまたは２つの参照画像リストが使用されているかどうかについての情報、ならびに、各参照画像リストについての参照インデックスおよび動きベクトルを含む。ブロックマージ操作は特に、２つの隣接ブロックが画像フレームにおける同一の非変形可能オブジェクトに対応する場合に有用である。この場合、２つのブロックは、同一の動きベクトルおよび同一の参照画像を使用して予測されてよく、したがって、動き情報全体が両方のブロックで同一である。

実装において、隣接ブロックが利用可能であり動き情報を含むかどうかをチェックした後に、隣接ブロックのすべての動きデータを動き情報候補として取得する前に追加の冗長チェックが実行される。

実装において、マージ候補リストは、以下の５種類の候補を順に含めることによって構築される。
１）空間近傍ＣＵからの空間的ＭＶＰ
２）コロケートＣＵからの時間的ＭＶＰ
３）ＦＩＦＯテーブルからの履歴ベースのＭＶＰ
４）ペアワイズ平均ＭＶＰ
５）ゼロＭＶ

マージリストのサイズは、スライスヘッダにおいてシグナリングされ、マージリストの最大許容サイズは例えば６である。マージモードにおける各ＣＵコードについて、最良のマージ候補のインデックスがエンコードされる。マージ候補の各カテゴリの生成処理が提供される。

［空間候補導出］
実装において、図６に示される位置に位置する候補の中から最大４つのマージ候補が選択される。導出の順序は、Ｂ１、Ａ１、Ｂ０、Ａ０およびＢ２である。位置Ｂ２は、位置Ａ０、Ｂ０、Ｂ１、Ａ１の任意のＣＵが利用可能でない（例えば、別のスライスまたはタイルに属するという理由で）、または、イントラコーディングされるときのみ考慮される。位置Ｂ１における候補が追加された後に、残りの候補の追加が冗長チェックを受ける。これにより、同一の動き情報を有する候補がリストから除外されることを確実にでき、その結果、コーディング効率が改善される。計算の複雑性を低減するべく、すべての可能な候補ペアが上述の冗長チェックにおいて考慮されるわけではない。代わりに、図７における矢印で連結されたペアのみが考慮され、候補は、冗長チェックに使用される対応する候補が同一の動き情報を有しない場合にリストに追加されるのみである。

実装中、上述の例において変更可能とみなされる空間近傍の順序、位置、および数は、制限とみなされなくてよい。

［時間候補導出］
実装において、１つの候補のみがリストに追加される。特に、この時間的マージ候補の導出において、スケーリングされた動きベクトルが、コロケート参照画像に属するコロケートＣＵに基づいて導出される。コロケートＣＵの導出に使用される参照画像リストは、スライスヘッダにおいて明示的にシグナリングされる。時間的マージ候補についてのスケーリングされた動きベクトルは、図８において点線で示されるように取得され、ＰＯＣ距離ｔｂおよびｔｄを使用してコロケートＣＵの動きベクトルからスケーリングされ、ｔｂは、現在の画像の参照画像と現在の画像との間のＰＯＣ差分として規定され、ｔｄは、コロケートされた画像の参照画像とコロケートされた画像との間のＰＯＣ差分として規定される。時間的マージ候補の参照画像インデックスはゼロに等しく設定される。

時間的候補の位置は、図９に示されるように、候補Ｃ０およびＣ１の間から選択される。位置Ｃ０におけるＣＵが利用可能でない、イントラコーディングされる、または、ＣＴＵの現在の行の外にある場合、位置Ｃ１が使用される。そうでなければ、位置Ｃ０が時間的マージ候補の導出において使用される。

［履歴ベースのマージ候補導出］
履歴ベースのＭＶＰ（ＨＭＶＰ）マージ候補は、空間的ＭＶＰおよびＴＭＶＰの後にマージリストに追加される。実装において、前にコーディングされたブロックの動き情報は、テーブルに格納され、現在のＣＵのためのＭＶＰとして使用される。複数のＨＭＶＰ候補を有するテーブルは、エンコーディング／デコーディング処理中に維持される。テーブルは、新しいＣＴＵ行に遭遇するときにリセットされる（空になる）。非サブブロックインターコーディングＣＵがあるときは常に、関連する動き情報がテーブルの最後のエントリに新しいＨＭＶＰ候補として追加される。

ＨＭＶＰテーブルサイズＳは５に設定される。このことは、例えば最大５つの履歴ベースのＭＶＰ（ＨＭＶＰ）候補がテーブルに追加され得ることを示す。新しい動き候補をテーブルに挿入するとき、制限のある先入先出（ＦＩＦＯ）規則が利用され、テーブルに同一のＨＭＶＰがあるかどうかを見つけるために冗長チェックが最初に適用される。見つかった場合、同一のＨＭＶＰがテーブルから削除され、その後のすべてのＨＭＶＰ候補が前に動かされる。

ＨＭＶＰ候補がマージ候補リスト構築プロセスにおいて使用され得る。テーブルにおける最新のいくつかのＨＭＶＰ候補が順番にチェックされ、ＴＭＶＰ候補の後に候補リストに挿入される。ＨＭＶＰ候補から空間または時間的マージ候補に対して冗長チェックが適用される。

冗長チェック操作の数を低減するべく、異なる単純化が導入されてよい。概して、利用可能のマージ候補の総数が最大許容マージ候補－１に到達すると、ＨＭＶＰからのマージ候補リスト構築プロセスが終了される。

［ペアワイズ平均マージ候補導出］
ペアワイズ平均候補は、既存のマージ候補リストにおける候補の予め定義されたペアを平均化することによって生成され、予め定義されたペアは（０，１）と規定され、例えば、当該数は、マージ候補リストへのマージインデックスを示す。平均化された動きベクトルは、各参照リストについて個別に算出される。１つのリストにおいて両方の動きベクトルが利用可能である場合、これら２つの動きベクトルは、異なる参照画像を指すときでも平均化される。１つの動きベクトルが利用可能でありさえすれば、その１つを直接使用する。利用可能な動きベクトルが無い場合、このリストを無効に維持する。

動き情報候補のリストがマージ候補リスト構築プロセス中に出力される。「動き情報」という用語は、インター予測処理を実行するのに必要な収集された情報を指す。動き情報は通常、以下の情報を指す。
１）ブロックが片予測または双予測のどちらを適用するか（予測方向）
２）動きベクトル（ブロックが双予測を適用する場合、２つの動きベクトル）
３）予測において使用される参照画像インデックス（ブロックが双予測を適用する場合、２インデックスであり、各インデックスは１つの参照画像リスト、第１参照画像リスト（Ｌ０）または第２参照画像リスト（Ｌ１）に対応する）。

いくつかの実現可能な実装において、動き情報はまた、インター予測ユニットの動き補償についての特定の補間フィルタを示すのに使用される切り替え可能な補間フィルタインデックスを指してよい。

本願において、動き情報は、１または複数の上の項目、または、種々の実施形態に記載のインター予測処理を実行するのに必要な任意の他の情報であってよい。

参照画像インデックスは、コーディングブロックの予測処理において使用される参照画像リストにおけるエントリを示すために使用される。例えば、第１動きベクトルは、Ｌ０における第１画像を指してよく、第２動きベクトルは、Ｌ１における第１画像を指してよい。２つの参照画像リストが維持されてよく、第１動きベクトルが指す画像はＬ０から選択され、第２動きベクトルが指す画像はＬ１から選択される。

参照画像リストＬ０およびＬ１の各々は、１または複数の参照画像を含んでよく、その各々は、画像順序カウント（ＰＯＣ）で識別される。各参照インデックスおよびＰＯＣ値との関連は、ビットストリームにおいてシグナリングされてよい。例として、Ｌ０およびＬ１参照画像リストは以下の参照画像を含み得る。

上の例において、参照画像リストＬ１における第１エントリ（参照インデックス０によって示される）は、ＰＯＣ値１３を有する参照画像である。

ＰＯＣは、各画像に関連する変数であり、コーディングビデオシーケンス（ＣＶＳ）におけるすべての画像のうち関連付けられた画像を一意に識別し、関連付けられた画像がデコード済みの画像バッファから出力されるとき、デコード済みの画像バッファから出力される同一のＣＶＳにおける他の画像の出力順の位置に対する出力順で、関連付けられた画像の位置を示す。

［三角形予測モード］
三角形予測モード（ＴＰＭ）が使用されるとき、ＣＵは、図１０Ａまたは図１０Ｂに示されるように、対角線分割または反対角線分割のいずれかを使用して、２つの三角形形状区分に均等に分割される。図１０Ａまたは図１０Ｂのいずれかは例であることに留意されたい。ＰＵ_１およびＰＵ_２の位置は本願において限定されるものではない。ＣＵにおける各三角形区分は、自身の動きを使用してインター予測される。片予測のみが各区分に許容される。すなわち、各区分は、１つの動きベクトルおよび１つの参照インデックスを有する。片予測動きの制約は、従来の双予測と同じように、各ＣＵについて２つの動き補償予測のみが必要であることを確実にするために適用される。各区分についての片予測動きは、上で説明された拡張マージ予測について構築されたマージ候補リストから直接導出される。

三角形区分モードが現在のＣＵについて使用される場合、三角形区分の方向（対角線または反対角線）を示すフラグ、および、２つのマージインデックス（各区分に１つ）が更にシグナリングされる。三角形区分の各々を予測した後に、対角線または反対角線エッジに沿ったサンプル値が、適応型の重みを伴うブレンド処理を使用して調節される。これは、完全なＣＵについての予測信号であり、他の予測モードのように、変換および量子化プロセスが完全なＣＵに適用される。最後に、三角形区分モードを使用して予測されるＣＵの動きフィールドが４×４ユニットに格納される。

ＴＰＭは、サブブロック区分化の特殊な場合であり、ブロックが２つのブロックに分割される。上述の例において、２つのブロック分割方向が示される（４５度および１３５度の区分）。しかしながら、図１１に例示されるように、他の区分角度および区分比率も可能であることに留意されたい。例として、サブブロックは、区分角度に応じて、矩形（例えば、図１１の中央および右の図）または非矩形（台形、例えば図１１の左の図）であってよい。いくつかの例において、現在のブロックは、２つの予測ユニットから成り、２つの予測ユニットは仮想分割線によって分割される。この場合、現在のブロックが幾何予測モードによって予測されると呼ばれる。そして、例として、仮想分割線は、第１サブブロックと第２サブブロックとの間の境界である直線であってよい。より具体的には、ＴＰＭを使用する予測の手順は以下を含む。

［片予測候補リスト構築］
図１２に例示されるように、マージ候補インデックスを与えられると、片予測動きベクトルは、拡張マージ予測について構築されたマージ候補リストから導出される。リストにおける候補について、そのＬＸ動きベクトル（Ｘはマージ候補インデックス値のパリティに等しい）は、三角形区分モードについての片予測動きベクトルとして使用される。これらの動きベクトルは、図１２において、「ｘ」で示される。対応するＬＸ動きベクトルが存在しない場合、拡張マージ予測候補リストにおける同一の候補のＬ（１－Ｘ）動きベクトルは、三角形区分モードについての片予測動きベクトルとして使用される。

実現可能な実装において、特殊な別の片予測候補リストを明示的に構築することなく、片予測動きベクトルは、通常のマージモード（ＭｅｒｇｅＭｏｄｅ）に使用されるマージ候補リストから直接導出できることに留意されたい。

［三角形区分エッジに沿ったブレンド］
各三角形区分を、それ自体の動きを使用して予測した後に、ブレンドが２つの予測信号に適用され、対角線または反対角線エッジの周りのサンプルが導出される。図１３に示されるように、以下の重み、すなわち、ルマの場合は｛７／８，６／８，５／８，４／８，３／８，２／８，１／８｝、クロマの場合は｛６／８，４／８，２／８｝がブレンド処理において使用される。

通常の予測モードと比較して、異なるサブブロックの動き情報がブロックについてシグナリングされる必要がある。したがって、サブブロック予測モードにおいて、動き情報を表すために使用されるサイド情報のオーバヘッドはより高い。サブブロック予測モードについてのサイド情報をコーディングする効率を改善するために、種々の実施形態が本願において導入される。

実施形態１
サブブロック予測がブロックに適用されると決定される場合：
１．初期第１インデックスが、最大値Ｍ（Ｍは整数であり、Ｍ≦Ｎ、Ｎは動き情報候補リストにおける候補の数である）を有し得る（エンコーダ側における）ビットストリームに含まれる。
２．初期第２インデックスが、最大値Ｍ－ｍ（ｍは整数であり、ｍ＜Ｍ、ｍは予め定義された値である）を有し得る（エンコーダ側における）ビットストリームに含まれる。
３．初期第２インデックスの値が初期第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数だけインクリメントされ、更新された第２インデックスが取得される（例えば、予め定義された数は１であり得る）。
４．ブロックの第１サブブロック部分は、初期第１インデックスに基づいて決定される動き候補情報の適用によって予測される。
５．ブロックの第２サブブロック部分は、更新された第２インデックスに基づいて決定される動き候補情報の適用によって予測される。

実現可能な実装において、初期第１インデックスおよび初期第２インデックスは、エンコーダによってビットストリームに含められてよく、デコーダによって解析されてよい。

実現可能な実装において、初期第２インデックスをｍだけインクリメントする操作は、エンコーダ側およびデコーダ側の両方において実行され、この操作は、エンコーダ側とデコーダ側との間の一貫性を維持することを目的としている。

実現可能な実装において、初期第１インデックスおよび更新された第２インデックスは、動き情報候補リストにおけるエントリを選択するために使用され（エントリとしての初期第１インデックスおよび更新された第２インデックスに基づいて、対応する動き情報候補が選択されてよい）、選択された動き情報候補は、ブロックの第１サブブロック部分（例えば、図１０Ａまたは図１０ＢにおけるＰＵ_１）および第２サブブロック部分（例えば、図１０Ａまたは図１０ＢにおけるＰＵ_２）について使用され、予測が実行される。

実現可能な実装において、動き情報候補リストは、片予測動き情報候補のみから構成されてよい。マージ候補リスト（ＩＴＵ‐ＴＨ．２６５のマージ候補リストなど）は、片予測および双予測動き情報候補から構成されてよいことに留意されたい。したがって、実施形態において使用される動き情報候補リストは、ＩＴＵ‐ＴＨ．２６５のマージ候補リストと異なり得る。

動き情報候補リストはマージ候補リストと同一でなくてよい。なぜなら、マージ候補リストは、サブブロック（例えば三角形）予測を適用するためにブロックが決定されるときに使用されることが禁止される双予測候補を含んでよいからである。この場合、各サブブロックは、片予測動き情報を適用する必要があり、したがって、初期第１インデックスおよび更新された第２インデックスは、片予測候補のみを含む動き情報候補リストにおけるエントリを指す。動き情報候補リストは、マージ候補リストの構築において使用される同一の空間および時間隣接ブロックを使用することによって構築されてよい。別の例において、動き情報候補リストは、マージ候補リストにおける双予測候補を片予測候補に変換することによって、マージ候補リストに基づいて構築されてよい。

初期第１および初期第２インデックスは、ビットストリーム構造における特定の順序に従う必要はないことに留意されたい。

初期第１インデックスと初期第２インデックスとの間の比較操作は、エンコーダおよびデコーダの両方において実行されることに留意されたい。エンコーダ側の場合、インジケータ（例えば初期第１インデックスおよび初期第２インデックス）がビットストリーム内に含まれる。デコーダ側の場合、インジケータ（例えば初期第１インデックスおよび初期第２インデックス）がビットストリームから解析される。

初期第２インデックスの値が初期第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数（例えば１）だけインクリメントされる。概して、同一の動き情報候補リスト（動き情報候補から構成される）が使用され、２つのインデックスが動き情報候補リストにおける同一の動き情報を指す場合、これは、全体のブロックについて単一の動き情報を有することに対応する。したがって、同一のインデックスを取得することを防止するために、初期第２インデックスは１だけインクリメントされる。初期第２インデックスがインクリメントされない場合、第１および第２インデックスは、動き情報候補リストにおける同一の動き候補を指してよい（なぜなら、同一のリストが両方のサブブロック部分の動き情報を選択するために使用されるからである）。この場合、各サブブロック部分は、予測のために同一の動き情報を適用する。このことは、ブロックを２つのサブブロックに分割する意味がないことを意味する。初期第２インデックスの値が初期第１インデックス以上である場合、初期第２インデックスをインクリメントすることによる冗長な表現は回避される。したがって、動き情報候補リストは少なくとも２つのセットの動き情報を含むことに留意されたい。本発明によってサブブロックの冗長な動き情報表現を除去する結果として、圧縮効率が改善される。

インクリメント操作の結果が動き情報候補リストにおける候補の数を超えない場合でも、初期第２インデックスは、予め定義された数（例えば１、２、３、など）だけインクリメントされてよいことに留意されたい。

第１実施形態の具体的な実装において、動き情報候補リストは、６エントリを有する動き情報候補を含むと想定する。更に、動き情報候補リストにおける第１動き候補は、予測のためにブロックの第１サブブロック部分に適用され、動き情報候補リストにおける第５動き候補は、予測のためにブロックの第２サブブロック部分に適用されると想定する。

エンコーダ側：
１．初期第１インデックスの値を示すために、０の値がビットストリームに含まれる（またはシグナリングされる）。（インデックス値０は動き情報候補リストにおける第１エントリに対応し、値１は第２エントリに対応し、以降も同様である。）
２．初期第２インデックスの値を示すために、３の値がビットストリームに含まれる（またはシグナリングされる）。
３．更新された第２インデックスの値は、初期第２インデックスの値を、例えば１だけインクリメントすることによって算出され、このようにして値４が取得される。
４．初期第１インデックスは、動き情報候補リストにおける第１動き候補を指すように決定される。それは、ブロックの第１サブブロック部分を予測するために適用される。
５．更新された第２インデックスは、動き情報候補リストにおける第５動き候補を指すように決定される。それは、ブロックの第２サブブロック部分を予測するために適用される。

デコーダ側：
１．初期第１インデックスの値を示すために、０の値がビットストリームから解析される。
２．初期第２インデックスの値を示すために、３の値がビットストリームから解析される。
３．更新された第２インデックスの値は、その値を例えば１（３は０より大きいため）だけインクリメントすることによって算出され、そのようにして、値４が取得される。
４．初期第１インデックスは、動き情報候補リストにおける第１動き候補を指すように決定される。それは、ブロックの第１サブブロック部分を予測するために適用される。
５．更新された第２インデックスは、動き情報候補リストにおける第５動き候補を指すように決定される。それは、ブロックの第２サブブロック部分を予測するために適用される。

この実装から、エンコーダ側において、初期第２インデックスはまた、１だけインクリメントすることによって更新され、この操作は、デコーダ側における同様の操作との一貫性を維持することを目的とする。

インクリメント操作の結果が動き情報候補リストにおける候補の数を超えない場合でも、インクリメント数は、予め定義された数、例えば１、２、３などであってよいことが理解される。

第１実施形態の別の具体的な実装において、動き情報候補リストは、以下の３つのエントリを含むと想定する。
（１）第１動き情報候補（第１候補）
（２）第２動き情報候補（第２候補）
（３）第３動き情報候補（第３候補）
第１および第２インデックスの値は以下の通りである。

上の表から、第１インデックスの最大値は３、第２インデックスの最大値は２である。表から、初期第２インデックスが初期第１インデックスより大きい場合、初期第２インデックスはなお１だけインクリメントされる。これは、初期第２インデックスが初期第１インデックス以上であるときのシナリオについて、統一操作（例えば１だけインクリメントする）を維持するためである。上の表における第１～第３行を例にとると、第１および第３行については、初期第１インデックスおよび初期第２インデックスは等しく、それらを異ならせるために、初期第２インデックスが１だけインクリメントされる。第２行については、初期第２インデックスは初期第１インデックスより大きく、インクリメント操作が実行されない場合、これは例外となり、複雑性を改善する。単純にするために、初期第２インデックスが初期第１インデックスより大きいと決定するとき、初期第２インデックスはなお１だけインクリメントされる。

実施形態２
サブブロック予測をブロックに適用すると決定される場合：
１．分割方向を示すインジケータがビットストリームに含まれる。
２．初期第１インデックスが、最大値Ｍ（Ｍは整数であり、Ｍ≦Ｎ、Ｎは動き情報候補リストにおける候補の数である）を有し得るビットストリームに含まれる。
３．初期第２インデックスが、最大値Ｍ－ｍ（ｍは整数であり、ｍ＜Ｍ、ｍは予め定義された値である）を有し得るビットストリームに含まれる。
４．初期第２インデックスの値が初期第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数だけインクリメントされ、更新された第２インデックスが取得される（例えば、予め定義された数は１であり得る）。
５．ブロックの第１サブブロック部分は、初期第１インデックスに基づいて決定される動き候補情報の適用によって予測される。
６．ブロックの第２サブブロック部分は、更新された第２インデックスに基づいて決定される動き候補情報の適用によって予測される。

分割方向インジケーション、初期第１インデックス、および初期第２インデックスは、ビットストリーム構造における特定の順序に従う必要はないことに留意されたい。

実現可能な実装において、以下のようであってよい２つの分割方向があってよい。
（１）ブロックの左上隅から右下隅に分割する（図１０Ａまたは図１０Ｂにおける左の図を参照されたい）
（２）右上隅からブロックの左下隅に分割する（図１０Ａまたは図１０Ｂにおける右の図を参照されたい）

実現可能な実装において、以下の通りであってよい４つの分割方向があってよい。
（１）ブロックの左上隅から右下隅に分割する
（２）ブロックの右上隅から左下隅に分割する
（３）ブロックの中央上ポイントから中央下ポイントに分割する
（４）ブロックの中央左ポイントから中央右ポイントに分割する

実施形態３
サブブロック予測をブロックに適用すると決定される場合：
１．分割方向を示すインジケータがビットストリームに含まれる。
２．インジケータが特定の分割方向を示す場合（例えば、ブロックの左上隅から右下隅に分割する。図１０Ａまたは図１０Ｂにおける左の図を参照されたい）
２．１初期第１インデックスが、最大値Ｍ（Ｍは整数であり、Ｍ≦Ｎ、Ｎは動き情報候補リストにおける候補の数である）を有し得るビットストリームに含まれる。
２．２初期第２インデックスが、最大値Ｍ－ｍ（ｍは整数であり、ｍ＜Ｍ、ｍは予め定義された値である）を有し得るビットストリームに含まれる。
２．３．初期第２インデックスの値が初期第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数だけインクリメントされ、更新された第２インデックスが取得される（例えば、予め定義された数は１であり得る）。
３．そうでない場合（インジケータが異なる分割方向、例えば、ブロックの右上隅から左下隅への分割を示す場合（図１０Ａまたは図１０Ｂにおける右の図を参照））
３．１初期第１インデックスが、最大値Ｍ－ｍ（ｍは整数であり、ｍ＜Ｍ、ｍは予め定義された値である）を有し得るビットストリームに含まれる。
３．２．初期第２インデックスが、最大値Ｍ（Ｍは整数であり、Ｍ≦Ｎ、Ｎは動き情報候補リストにおける候補の数である）を有し得るビットストリームに含まれる。
３．３．初期第２インデックスの値が初期第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数だけインクリメントされ、更新された第２インデックスが取得される（例えば、予め定義された数は１であり得る）。
４．ブロックの第１サブブロック部分は、第１インデックスに基づいて決定される動き情報候補の適用によって予測される。
５．ブロックの第２サブブロック部分は、第２インデックスに基づいて決定される動き情報候補の適用によって予測される。

実現可能な実装において、以下の通りであってよい２つの分割方向があってよい。
（１）ブロックの左上隅から右下隅に分割する
（２）ブロックの右上隅から左下隅に分割する

実施形態４
サブブロック予測をブロックに適用すると決定される場合
１．分割方向を示すインジケータがビットストリームに含まれる。
２．初期第１インデックスが、最大値Ｍ（Ｍは整数であり、Ｍ≦Ｎ、Ｎは動き情報候補リストにおける候補の数である）を有し得るビットストリームに含まれる。
３．初期第２インデックスが、最大値Ｍ－ｍ（ｍは整数であり、ｍ＜Ｍ、ｍは予め定義された値である）を有し得るビットストリームに含まれる。
４．初期第２インデックスの値が初期第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数だけインクリメントされ、更新された第２インデックスが取得される（例えば、予め定義された数は１であり得る）。
５．ブロックの第１サブブロック部分は、初期第１インデックスに基づいて決定される動き候補情報の適用によって予測される。
６．ブロックの第２サブブロック部分は、更新された第２インデックスに基づいて決定される動き候補情報の適用によって予測される。

第１サブブロック部分が、幾何学的中心がブロックの左の境界に近い部分に割り当てられる場合。図１０Ａまたは図１０Ｂを例にとると、ＰＵ_１は第１サブブロック部分を示し、ＰＵ_２は第２サブブロック部分を示す。

実施形態４において、ブロックの左の境界に近い幾何学的中心を有するサブブロック部分に対応するインデックスが最初にビットストリームに含まれる。動き情報候補リストの構築は典型的には、左ブロックの動き情報、上ブロックの動き情報、右上ブロックの動き情報...の順序で隣接ブロックの動き情報を考慮する。上の空間近傍順序は、例としてＨＥＶＣからとられる。左近傍の動き情報が最初に考慮されるので、左近傍の動き情報を示すインデックスは典型的には、より少ないビットを有する。左近傍に（幾何学的な意味で）近いサブブロック部分は最初にコーディングされ、第２インデックスは同一の動き情報（すなわち、マージリストにおける同一エントリ）を指すことができないので、第１インデックスおよび第２インデックスを表すビットの総数は典型的には低い。別の実現可能な実装において、ブロックの上の境界に近い幾何学的中心を有するサブブロック部分に対応するインデックスは最初にビットストリームに含まれる。順序は本願によって限定されるものではない。

特定の実施形態において、動き情報候補リストは３のサイズを有し、以下の動き情報候補、すなわち、左隣接ブロックの動き情報（第１エントリ）、上隣接ブロックの動き情報（第２エントリ）、および、コロケートブロックの動き情報（第３エントリ、時間隣接ブロック）を含むと想定する。

更に、分割方向ならびに第１サブブロック（ＰＵ_１）および第２サブブロック（ＰＵ_２）は図１０Ａまたは図１０Ｂにおける左の図のように与えられると想定する。概して、空間的近接性に起因して、ＰＵ_１は、（左隣接ブロックの動き情報に対応する）動き情報候補リストにおける第１エントリに基づいて予測され、ＰＵ_２は、（上隣接ブロックの動き情報に対応する）動き情報候補リストにおける第２エントリに基づいて予測される可能性がより高い。

本発明によれば、第１インデックスを表すために、０の値がビットストリームに含められ（デコーダにおいて解析され）、第２インデックス（インデックスがとり得る最小値）を表すために、０の値がビットストリームに含められ（デコーダにおいて解析され）、第２インデックスは第１インデックスに等しいので、動き情報候補リストから動き候補を選択する前に、第２インデックスが１だけインクリメントされる。ある場合において、第１および第２インデックスは、本発明による最小の可能な値を有し、ビットストリームにおける第１インデックスおよび第２インデックスを表すために最小数の合計ビットが要求される。

分割方向インジケーション、第１インデックスおよび第２インデックスは、ビットストリーム構造における特定の順序に従う必要はないことに留意されたい。具体的な実装において、サブブロック予測モードは三角形予測モードである。

第１インデックス（例えば初期第１インデックス）および第２インデックス（例えば更新された第２インデックス）は、第１サブブロックおよび第２サブブロックに適用される動き情報を選択するために使用される。動き情報は同一の動き情報候補リストから選択される。両方のサブブロック部分について同一の動き情報を選択すること（サブブロック区分を有しないことと同一である）を回避するべく、第２インデックスは、第１インデックス以上である場合、予め定義された数（例えば１）だけインクリメントされる。

実施形態１から４は、サブブロック予測を適用するブロックの各サブブロックについて、動き情報をシグナリングする異なる効率的方法を提供する。

実施形態５
第１インデックスおよび第２インデックスの最大値（実施形態１から４においてＭとして表される）は、動き情報候補リストのサイズＮ以下である。

第１および第２インデックスの最大値はまた、動き情報候補リストにおけるエントリの数を記述することに留意されたい。例えば、第１インデックスの最大値が６である場合（カウントが１から開始し、インデックスは１、２、３、４、５、６の値をとり得ると想定する）、動き情報候補リストのサイズは６である。

マージ候補リストは、ＩＴＵ‐ＴＨ．２６５またはＶＶＣにおける方法に従って構築され得る。ＨＥＶＣおよびＶＶＣにおけるマージリスト構築プロセスについての上述の例および開示を参照されたい。

第１インデックスおよび第２インデックスの最大値（Ｍで与えられ、動き情報候補リストのサイズと同等である）は、マージ候補リストのサイズＮ以下である。サブブロック予測モードを適用しないようにブロックが決定される場合、ブロックは、マージ候補リストにおけるエントリの１つに基づいて予測されてよいことに留意されたい。しかしながら、サブブロック予測モードを使用してブロックが予測される場合、動き情報候補リストのエントリは、ブロックを予測するために使用される。

例えば、ビットストリームから解析された予測インジケータが、サブブロック予測がブロックに適用されることを示すとき、２つの異なるインジケータが取得され、これら２つの異なるインジケータは、ブロックにおける２つのサブブロックについて、動き情報候補リストにおける２つの異なるエントリを個別に示し、インター予測が２つの異なるインジケータに基づいてブロックに実行される。ビットストリームから解析された予測インジケータが、サブブロック予測がブロックに適用されないことを示すとき、単一のインジケータが取得され、単一のインジケータは、ブロックについてのマージ候補リスト（例えば、ＩＴＵ‐ＴＨ．２６５およびＶＶＣにおける方法に従って構築されてよい）におけるエントリを示し、単一のインジケータに基づいて、インター予測（例えば非サブブロック予測）がブロックについて実行される。

ＭがＮ以下である場合、第１インデックスの最大値は、Ｍに等しくなるように設定される。Ｎはマージ候補リストのサイズ（候補の数）である。そうでなければ（ＮがＭ未満である場合）、第１マージインデックスの最大値はＮに等しくなるように設定される。

実現可能な実装において、Ｎは、ビットストリームに含まれるインジケータから導出されてよく、Ｍは予め定義された数であってよい。

例として、値Ｍ（第１インデックスの最大値を記述する）は５であってよく、予め定められる。そして、Ｎの値（マージ候補リストのサイズ）は、シーケンスパラメータセット（ＳＰＳ）においてシグナリングされてよい。Ｎの値が６としてシグナリングされる場合、ＮがＭより大きいので、第１インデックスの最大値は５（カウントが０から開始する場合、４）に等しい。別のシナリオにおいて、ＮがＳＰＳにおいて３としてシグナリングされる場合、第１インデックスの最大値は３に等しい（カウントが０から開始する場合、２）。

Ｎは、ＩＴＵ‐ＴＨ．２６５およびＶＶＣにおける方法に従って構築され得るマージ候補リストのサイズであることに留意されたい。実施形態において使用される第１インデックスおよび第２インデックスは、異なるリスト、すなわち、片予測候補のみから構成される動き情報候補リストを指す。動き情報候補リストはマージ候補リストと同一でなくてよい。なぜなら、マージ候補リストは、サブブロック（または三角形）予測を適用するためにブロックが決定されるときに使用されることが禁止される双予測候補を含んでよいからである。この場合、各サブブロックは、片予測動き情報を適用する必要があり、したがって、第１インデックスおよび第２インデックスは、片予測候補のみを含む動き情報候補リストにおけるエントリを指す。動き情報候補リストは、マージ候補リストの構築において使用される同一の空間および時間隣接ブロックを使用することによって構築されてよい。代替的に、動き情報候補リストは、マージ候補リストのエントリに基づいて構築されてよい。実現可能な実装において、動き情報候補リストは、明示的に構築されないことがあり得る。例えば片予測候補は、マージ候補リストから直接導出できる。

ブロックベースの予測については、１セットの動き情報のみが（一実装においてマージインデックスの形式で）シグナリングされる。サブブロック予測の場合、２セットの動き情報が必要であるので（シグナリングオーバヘッドを増加させる）、インデックスの値は、マージインデックスの最大値より大きくないことが期待される（マージインデックスの最大値はマージ候補リストのサイズと同等である）。

動き情報候補リストが、マージ候補リストを構築するのに使用される候補に基づいて、または、マージ候補リストのエントリに基づいて構築されること期待されるので、動き情報候補リストは、マージ候補リストのサイズより大きいサイズを有しない。

したがって、動き情報候補リストのサイズ（したがって、第１および第２インデックスの最大値）は、マージ候補リスト以下に設定される。

別の実現可能な実装において、Ｎは、ビットストリームに含まれるインジケータから導出されてよく、Ｍは、ビットストリームに含まれるインジケータから導出されてよい。この場合、Ｍの値を導出するために使用されるインジケータは、Ｎより大きいＭ値を示すことができない。

ＨＥＶＣにおいて、動き情報候補リストのサイズはＮであり、Ｎはビットストリームに含まれるシンタックス要素に基づいて修正されてよい。Ｎの値は、正の整数（典型的には２から５の間）でよく、ＳＰＳにおいてシグナリングされる。マージリストのサイズは、ビデオシーケンス全体で固定である。

第１インデックスおよび第２インデックスの最大値は、動き情報候補リストのサイズより大きくなることができない。第１インデックスおよび第２インデックスは、異なるリスト（マージ候補リストと同一でない動き情報候補リスト）から動き情報を選択するために使用されるが、動き情報候補リストは典型的には、同一の空間および時間隣接ブロックを使用して構築されてよい（しかし、動き情報候補リストとは異なる構築規則を適用する）。

特定の実装において、動き情報候補リストは、マージ候補リストにおける双予測候補を片予測候補に変換することによって構築されてよい。したがって、第１および第２インデックスの最大値をマージ候補リストのサイズ未満に設定することにより、マージ候補リストに基づいて構築された動き情報候補リストが、現在のブロックの各サブブロックの動き情報を選択するために使用されてよいことを保証する。

実施形態６
第１および第２インデックスは、切り捨てられた単進バイナリコードを使用して、インデックスの最大値に基づいて二値化される（十進表現から二進表現に変換される）。インデックスの最大値は、インデックスの十進値を二進表現にマッピングする処理において使用される。切り捨てられた単進バイナリコード（最大十進値が４である、切り捨てられた単進符号）についての値コードワード割り当てが以下に与えられる。

上の表において、各十進値は、前の十進値（十進数において１小さい）と比較して、二進表現において１ビット多く必要とするが、インデックスの最大値に対応する最後の十進値を除く。この場合（インデックスの値が、最大値である４のとき）、二進表現において前の十進値（３）と同一の量のビットで表される。

第１インデックスが最大値４（＝Ｍ）を有し、第２インデックスが最大値３（＝Ｍ－１）を有する場合、以下の二進表現が適用される。

実施形態７
第１インデックスの第１ｂｉｎは、コンテキストベース適応型バイナリ算術コーディング（ＣＡＢＡＣ）の通常のコーディングモードを使用して（第１インデックスのすべての発生のコーディングの後に更新される確率推定を使用して）コーディングされ、他のｂｉｎは、ＣＡＢＡＣのバイパスモードを使用して（更新されない等しい確率を使用して）コーディングされる。ＣＡＢＡＣの通常のコーディングモードは、図１４の「通常の算術エンコーダ」分岐によって示される。バイパスモードは、図１４の「バイパス算術エンコーダ」分岐によって示される。

例として、第２インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用して（第２インデックスのすべての発生のコーディングの後に更新される確率推定を使用して）コーディングされ、他のｂｉｎは、ＣＡＢＡＣのバイパスモードを使用して（更新されない等しい確率を使用して）コーディングされる。この場合、第１インデックスはＣＡＢＡＣによってビットストリームに含められ（または、ビットストリームからデコーダによって解析され）、二値化された第１インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用する第１確率推定モデルを使用してＣＡＢＡＣによってコーディングされる。二値化された第１インデックスの残りのｂｉｎは、ＣＡＢＡＣのバイパスモードを使用してコーディングされる。第２インデックスは、ＣＡＢＡＣによってビットストリームに含められ（または、ビットストリームからデコーダによって解析され）、二値化第２インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用する第２確率推定モデルを使用してＣＡＢＡＣによってコーディングされる。二値化第２インデックスの残りのｂｉｎは、ＣＡＢＡＣのバイパスモードを使用してコーディングされる。

別の例として、第１インデックスの第１ｂｉｎおよび第２インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用してコーディングされ、同一の確率推定モデルが使用される。確率推定モデルは、第１インデックスをコーディングした後、および第２インデックスをコーディングした後に更新される。この場合、第１インデックスはＣＡＢＡＣによってビットストリームに含められ（または、ビットストリームからデコーダによって解析され）、二値化された第１インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用する第１確率推定モデルを使用してＣＡＢＡＣによってコーディングされる。二値化された第１インデックスの残りのｂｉｎは、ＣＡＢＡＣのバイパスモードを使用してコーディングされる。第２インデックスは、ＣＡＢＡＣによってビットストリームに含められ（または、ビットストリームからデコーダによって解析され）、二値化第２インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用する第１確率推定モデルを使用してＣＡＢＡＣによってコーディングされる。二値化第２インデックスの残りのｂｉｎは、ＣＡＢＡＣのバイパスモードを使用してコーディングされる。

確率推定モデルは、ｂｉｎが「０」の代わりに「１」の値を有する確率を記述する。確率推定モデルは、統計に適合するべく更新される。例えば、「１」を観察する確率が０．８である（「０」が０．２であることを意味する）場合、「１」の値を有するｂｉｎは、ＣＡＢＡＣによって、「０」より小さい実際のビットを使用してコーディングされる。

第１ｂｉｎは、二進表現の第１シンボルであり、例が以下の表に示される。

実施形態８
サブブロック予測をブロックに適用すると決定される場合
１．分割方向を示すインジケータがビットストリームに含まれる。
２．ブロックのサイズが、指定された閾値以下である場合
２．１初期第１インデックスが、最大値Ｍ（Ｍは正の整数、Ｍ≦Ｎ、Ｎはマージ候補リストにおける候補の数）を有し得るビットストリームに含まれる。
２．２初期第２インデックスが、最大値Ｍ－ｍ（ｍは正の整数、ｍ＜Ｍ、ｍは予め定義される値）を有し得るビットストリームに含まれる。
３．そうでない場合（ブロックのサイズが指定された閾値より大きい場合）
３．１第１インデックスが、最大値Ｐ（Ｐは正の整数であり、Ｍ＜Ｐ≦Ｎ、Ｎは動き情報候補リストにおける候補の数）を有し得るビットストリームに含まれる。
３．２第２インデックスが、最大値Ｐ－ｍ（ｍは正の整数、ｍ＜Ｐ、ｍは予め定義された値）を有し得るビットストリームに含まれる。
４．初期第２インデックスの値が初期第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数だけインクリメントされ、更新された第２インデックスが取得される（例えば、予め定義された数は１であり得る）。
５．ブロックの第１サブブロック部分は、初期第１インデックスに基づいて決定される動き情報候補の適用によって予測される。
６．ブロックの第２サブブロック部分は、更新された第２インデックスに基づいて決定される動き情報候補の適用によって予測される。

ＰおよびＭは正の整数値であり、Ｍ＜Ｐ≦Ｎである。初期第１インデックスおよび初期第２インデックスは、以下のように二値化されてよい。
ブロックのサイズが、指定された閾値以下である場合：
（１）最大値Ｍに基づいて、切り捨てられたバイナリコーディングを適用することによって、第１インデックスは十進数から二進表現に変換される。
（２）最大値Ｍ―１に基づいて、切り捨てられたバイナリコーディングを適用することによって、第２インデックスは十進数から二進表現に変換される。
ブロックのサイズが、指定された閾値より大きい場合：
（１）最大値Ｐに基づいて、切り捨てられたバイナリコーディングを適用することによって、第１インデックスは十進数から二進表現に変換される。
（２）最大値Ｐ―１に基づいて、切り捨てられたバイナリコーディングを適用することによって、第２インデックスは十進数から二進表現に変換される。

閾値は、ビットストリームにおいてシグナリングされる正の整数であってよく、または、予め定義された数であってよく。

ブロックが閾値より大きいかどうかを決定するべく、ブロックの幅および高さの乗算が、閾値と比較されてよい（幅×高さ＞閾値）。別の例において、幅および高さの両方が閾値と比較されてよく、その両方が閾値より大きい場合（幅＞閾値ＡＮＤ高さ＞閾値）、ブロックは閾値より大きいとみなされてよい。別の例において、幅および高さのいずれかが閾値より大きい場合（幅＞閾値ＯＲ高さ＞閾値）、ブロックは閾値より大きいとみなされてよい。

分割方向インジケーション、第１インデックスおよび第２インデックスは、ビットストリーム構造における特定の順序に従う必要はないことに留意されたい。

別の実現可能な実装において、以下の通りであってよい４つの分割方向があってよい。
（１）ブロックの左上隅から右下隅に分割する
（２）ブロックの右上隅から左下隅に分割する
（３）ブロックの中央上ポイントから中央下ポイントに分割する
（４）ブロックの中央左ポイントから中央右ポイントに分割する

実現可能な実装において、分割方向インジケーションはビットストリームに含まれない（または、それから解析されない）ことに留意されたい。

実施形態９
サブブロック予測をブロックに適用することが決定される場合
１．初期第１インデックスが、最大値Ｍを有し得るビットストリームに含まれる。（Ｍは整数、Ｍ≦Ｎ、Ｎは動き情報候補リストにおける候補の数）
２．初期第２インデックスが、最大値Ｍを有し得るビットストリームに含まれる。
３．初期第２インデックスの値が第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数だけインクリメントされ、更新された第２インデックスが取得される（例えば、予め定義された数は１であり得る）。
４．ブロックの第１サブブロック部分は、初期第１インデックスに基づいて決定される動き候補情報の適用によって予測される。
５．ブロックの第２サブブロック部分は、更新された第２インデックスに基づいて決定される動き候補情報の適用によって予測される。

ＭがＮ－１以下である場合、初期第１インデックスおよび第２インデックスの最大値は、Ｍに等しくなるように設定される。Ｎは動き情報候補リストのサイズ（動き候補の数）である。そうでない場合、第１インデックスおよび第２インデックスの最大値はＮ－１に等しくなるように設定される。

Ｎは、ＩＴＵ‐ＴＨ．２６５およびＶＶＣにおける方法に従って構築され得るマージ候補リストのサイズであることに留意されたい。実施形態において使用される第１インデックスおよび第２インデックスは、片予測候補のみから構成される異なる動き情報候補リストを指す。動き情報候補リストはマージ候補リストと同一でない。なぜなら、マージ候補リストは、サブブロック（または三角形）予測を適用するためにブロックが決定されるときに使用されることが禁止される双予測候補を含んでよいからである。この場合、各サブブロックは、片予測動き情報を適用する必要があり、したがって、第１インデックスおよび第２インデックスは、片予測候補のみを含む動き情報候補リストにおけるエントリを指す。動き情報候補リストは、マージ候補リストの構築において使用される同一の空間および時間隣接ブロックを使用することによって構築されてよい。別の例において、動き情報候補リストは、マージ候補リストにおける双予測候補を片予測候補に変換することによって、マージ候補リストに基づいて構築され得る。

別の実現可能な実装において、Ｎは、ビットストリームに含まれるインジケータから導出されてよく、Ｍは、ビットストリームに含まれるインジケータから導出されてよい。この場合、Ｍの値を導出するために使用されるインジケータは、Ｎ－１より大きいＭ値を示すことができない。

具体例において、動き情報候補リストは、第１動き情報候補（第１候補）、第２動き情報候補（第２候補）および第３動き情報候補（第３候補）である３エントリを含むと想定する。第１および第２インデックスの値は、以下のような下の表に例として示される。

第３動き情報候補は、ブロックの第１サブブロックにおいて適用されるために選択されることができないことに留意されたい。利点は、ビットストリームに含まれる第１インデックスおよび第２インデックスの最大値が同一であることである（上述の例では１）。したがって、同一の二値化方式（最大値１に基づく、切り捨てられたバイナリコーディング）が、第１インデックスおよび第２インデックスの両方を二値化するために適用されてよい。

第１および第２インデックスの最大値は同一となるように設定される。この特徴は、切り捨てられたバイナリコーディングが使用されるときに、第１および第２マージインデックスの両方について同一の二値化方式を使用する追加の利益を有する。

実施形態１０
サブブロック予測をブロックに適用すると決定される場合
１．初期第１インデックスが、最大値Ｍを有し得るビットストリームに含まれる。（Ｍは整数、Ｍ≦Ｎ、Ｎは動き情報候補リストにおける候補の数）
２．初期第２インデックスが、最大値Ｍを有し得るビットストリームに含まれる。
３．ブロックの第１サブブロック部分は、初期第１インデックスに基づいて決定される動き候補情報の適用によって予測される。
４．ブロックの第２サブブロック部分は、初期第２インデックスに基づいて決定される動き候補情報の適用によって予測される。

実現可能な実装において、第１インデックスおよび第２インデックスは、動き情報候補リストにおけるエントリを選択するために使用され（同一リストが、第１インデックスおよび第２インデックスによって動き情報を選択するために使用される）、選択された動き情報候補はブロックの第１サブブロックおよび第２サブブロックに適用され、ブロックが予測される。
実現可能な実装において、動き情報候補リストは、片予測動き情報候補のみから構成されてよい。マージ候補リスト（ＩＴＵ‐ＴＨ．２６５のマージ候補リストなど）は、片予測および双予測動き情報候補から構成されてよいことに留意されたい。したがって、実施形態において使用される動き情報候補リストは、ＩＴＵ‐ＴＨ．２６５のマージ候補リストと異なり得る。

動き情報候補リストはマージ候補リストと同一でない。なぜなら、マージ候補リストは、サブブロック（または三角形）予測を適用するためにブロックが決定されるときに使用されることが禁止される双予測候補を含んでよいからである。この場合、各サブブロックは、片予測動き情報を適用する必要があり、したがって、第１インデックスおよび第２インデックスは、片予測候補のみを含む動き情報候補リストにおけるエントリを指す。動き情報候補リストは、マージ候補リストの構築において使用される同一の空間および時間隣接ブロックを使用することによって構築されてよい。別の例において、動き情報候補リストは、マージ候補リストにおける双予測候補を片予測候補に変換することによって、マージ候補リストに基づいて構築され得る。

第１および第２インデックスは、ビットストリーム構造における特定の順序に従う必要がないことに留意されたい。

インジケータ（インデックス）をビットストリームに含めることを除く同一の操作がエンコーダおよびデコーダにおいて実行されることに留意されたい。デコーダにおいて、ビットストリームからインジケータが解析され、インジケータはエンコーダによってビットストリームに含められる。

具体例において、６エントリを有する動き情報候補を含む動き情報候補リストを想定する。更に、動き情報候補リストにおける第１動き候補は、予測のために第１サブブロックに適用され、動き情報候補リストにおける第５動き候補は、予測のために第２サブブロックに適用されると想定する。

エンコーダ側：
１．第１インデックスの値を示すために、０の値がビットストリームに含まれる。（インデックス値０は動き情報候補リストにおける第１エントリに対応し、値１は第２エントリに対応し、以降も同様である。）
２．第２インデックスの値を示すために、３の値がビットストリームに含まれる。
３．第１インデックスは、動き情報候補リストにおける第１動き候補を指すと決定される。それは、ブロックの第１サブ部分を予測するために適用される。
４．第２インデックスは、動き情報候補リストにおける第４動き候補を指すと決定される。それは、ブロックの第２サブ部分を予測するために適用される。

デコーダ側：
１．第１インデックスの値を示すために、ビットストリームから０の値が解析される。
２．第２インデックスの値を示すために、ビットストリームから３の値が解析される。
３．第１インデックスは、動き情報候補リストにおける第１動き候補を指すと決定される。それは、ブロックの第１サブ部分を予測するために適用される。
４．第２インデックスは、動き情報候補リストにおける第４動き候補を指すと決定される。それは、ブロックの第２サブ部分を予測するために適用される。

別の具体例において、動き情報候補リストは、第１動き情報候補（第１候補）、第２動き情報候補（第２候補）および第３動き情報候補（第３候補）である３エントリを含むと想定する。第１および第２インデックスの値は以下の通りである。

実施形態１１
サブブロック予測をブロックに適用することが決定される場合
１．分割方向を示すインジケータがビットストリームに含まれる。
２．初期第１インデックスが、最大値Ｍ（Ｍは整数であり、Ｍ≦Ｎ、Ｎは動き情報候補リストにおける候補の数である）を有し得るビットストリームに含まれる。
３．初期第２インデックスが、最大値Ｍ－ｍ（ｍは整数であり、ｍ＜Ｍ、ｍは予め定義された値である）を有し得るビットストリームに含まれる。
４．初期第２インデックスの値が第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数だけインクリメントされ、更新された第２インデックスが取得される（例えば、予め定義された数は１であり得る）。
５．ブロックの第１サブブロック部分は、初期第１インデックスに基づいて決定される動き候補情報の適用によって予測される。
６．ブロックの第２サブブロック部分は、更新された第２インデックスに基づいて決定される動き候補情報の適用によって予測される。

Ｎは、ＩＴＵ‐ＴＨ．２６５およびＶＶＣにおける方法に従って構築され得るマージ候補リストのサイズであることに留意されたい。実施形態において使用される第１インデックスおよび第２インデックスは、片予測候補のみから構成される異なる動き情報候補リストを指す。動き情報候補リストはマージ候補リストと同一でない。なぜなら、マージ候補リストは、サブブロック（または三角形）予測を適用するためにブロックが決定されるときに使用されることが禁止される双予測候補を含んでよいからである。この場合、各サブブロックは、片予測動き情報を適用する必要があり、したがって、第１インデックスおよび第２インデックスは、片予測候補のみを含む動き情報候補リストにおけるエントリを指す。動き情報候補リストは、マージ候補リストの構築において使用される同一の空間および時間隣接ブロックを使用することによって構築されてよい。別の例において、動き情報候補リストは、マージ候補リストにおける双予測候補を片予測候補に変換することによって、マージ候補リストに基づいて構築されてよい。初期第１インデックスの最大値はＭに等しくなるように設定される。

別の実現可能な実装において、Ｎは、ビットストリームに含まれるインジケータから導出されてよく、ＭはＮから導出されてよい。例えば、Ｍは以下のようにＮから導出されてよい。

Ｎが１に等しい場合、Ｍは０に等しい（サブブロック予測は使用されず、サブブロック予測に対応するシンタックス要素はシグナリングされない）。Ｎ≧２である場合、ＭはＮに等しい。例えば、Ｍは、以下の表に従ってＮから導出されてよい。

Ｎが１に等しい場合、Ｍは０に等しい（サブブロック予測は使用されず、サブブロック予測に対応するシンタックス要素はシグナリングされない）。

Ｎ≧２かつＮ≦Ｋである場合、ＭはＮに等しく、Ｋは予め定義された値の整数である（例えば、Ｋは５に等しくてよい）。Ｎ＞Ｋである場合、ＭはＫに等しい。例えば、Ｍは、以下の表に従ってＮから導出されてよい（Ｋは５に等しい）。

実施形態１２
サブブロック予測をブロックに適用すると決定される場合
１．分割方向を示すインジケータがビットストリームに含まれる。
２．初期第１インデックスが、最大値Ｍを有してよいビットストリームに含まれる（Ｍは整数）。

３．初期第２インデックスが、最大値Ｍ－ｍ（ｍは整数であり、ｍ＜Ｍ、ｍは予め定義された値である）を有し得るビットストリームに含まれる。

４．初期第２インデックスの値が第１インデックスの値以上である場合、初期第２インデックスの値は、予め定義された数だけインクリメントされ、更新された第２インデックスが取得される（例えば、予め定義された数は１であり得る）。

５．ブロックの第１サブブロック部分は、初期第１インデックスに基づいて決定される動き候補情報の適用によって予測される。

６．ブロックの第２サブブロック部分は、更新された第２インデックスに基づいて決定される動き候補情報の適用によって予測される。

実施形態において使用される第１インデックスおよび第２インデックスは、片予測候補のみから構成される異なる動き情報候補リストを指す。動き情報候補リストはマージ候補リストと同一でない。なぜなら、マージ候補リストは、サブブロック（または三角形）予測を適用するためにブロックが決定されるときに使用されることが禁止される双予測候補を含んでよいからである。この場合、各サブブロックは、片予測動き情報を適用する必要があり、したがって、第１インデックスおよび第２インデックスは、片予測候補のみを含む動き情報候補リストにおけるエントリを指す。動き情報候補リストは、マージ候補リストの構築において使用される同一の空間および時間隣接ブロックを使用することによって構築されてよい。別の例において、動き情報候補リストは、マージ候補リストにおける双予測候補を片予測候補に変換することによって、マージ候補リストに基づいて構築され得る。初期第１インデックスの最大値はＭである。

実現可能な実装において、Ｍは、ビットストリームに含まれるインジケータから導出されてよい。

Ｍは、ＩＴＵ‐ＴＨ．２６５およびＶＶＣにおける方法に従って構築され得るマージ候補リストのサイズである整数値Ｎに依存してよい。

別の実現可能な実装において、Ｎは、ビットストリームに含まれるインジケータから導出されてよく、Ｍは、予め定義された数であってよい。

Ｎが１に等しい場合、Ｍは２に等しい（いくつかの例では、サブブロックモードは、更新された第２インデックスに等しくない初期第１インデックスを必要としてよい）。Ｎ≧２である場合、ＭはＮに等しい。例えば、Ｍは、以下の表に従ってＮから導出されてよい。

Ｎが１に等しい場合、Ｍは２に等しい（いくつかの例では、サブブロックモードは、更新された第２インデックスに等しくない初期第１インデックスを必要としてよい）。

Ｎの値（マージ候補リストのサイズ）は、Ｍ（初期第１インデックスの最大値）の値未満であってよいことに留意されたい。

図１５は本願のインター予測方法を示す。インター予測方法は、予測方法、例えば三角形予測モードなど、サブブロックベースのイメージブロックについて実行される。

三角形予測モードにおいて、現在のブロックは、第１予測サブブロックおよび第２予測サブブロック、例えば、図１０Ａまたは図１０ＢにおけるＰＵ_１およびＰＵ_２を含む。本願はまた、異なるサブブロックベースの予測方法、例えば、図１１に示される予測モードに基づいて実装されてよいことに留意されたい。

Ｓ１５０１：少なくとも１つのインジケータを解析して現在のブロックの予測モードを決定する。
概して、インター予測はいくつかのインター予測モードを含む。目標インター予測モードは、異なる基準、例えば、ＲＤＯ手順を使用してエンコーダ側において選択され、ビットストリームにおいて１または複数のインジケータとしてエンコードされる。デコーダ側は、ビットストリームを解析して、１または複数のインジケータの値を取得し、１または複数のインジケータの値に従って目標インター予測モードを決定する。実現可能な実装において、インジケータは予測モードインデックスであってよい。別の実現可能な実装において、いくつかのインジケータが組み合わされて予測モードが決定される。現在のブロックの決定された予測モードが三角形予測モードである場合、本方法の手順が継続する。

Ｓ１５０２：現在のブロックについての候補リストを取得する。
候補リストはマージモード候補リストから取得される。例として、マージモード候補リストの構築、および、現在のブロックの三角形予測についての片予測候補リストの構築については、上の章を参照してよい。三角形予測についての候補リストはマージモード候補リストから導出されるからであることに留意されたい。実現可能な実装において、候補リストは独立のリストでなくてよい。候補リストにおける候補は、マージモード候補リストにおける候補を指すインジケータによって表されてよい。段階Ｓ１５０２は、第１予測サブブロックおよび／または第２予測サブブロックの予測情報インデックスを解析した後に実装されてよいことに留意されたい。それは本願において限定されるものではない。

Ｓ１５０３：ビットストリームから第１インデックスを解析する。
第１インデックスは、第１予測サブブロックの予測情報を取得するために使用される。例として、ビットストリームから第１インデックスを表すシンタックス要素を解析し、第１インデックスに従って候補リストにおいて項目を位置特定し、第１予測サブブロックの予測情報として項目を取得する。

Ｓ１５０４：ビットストリームから第２インデックスを解析する。第２インデックスは、第２予測サブブロックの予測情報を取得するために使用される。例として、ビットストリームから第２インデックスを表す別のシンタックス要素を解析する。

Ｓ１５０５：第１インデックスを第２インデックスと比較する。

Ｓ１５０６Ａ：第２インデックスが第１インデックス未満である場合、第２インデックスに従って候補リストにおいて項目を位置特定し、第２予測サブブロックの予測情報として項目を取得する。

Ｓ１５０６Ｂ：第２インデックスが第１インデックス以上である場合、第２インデックスを調節し、次に、調節された第２インデックスに従って第２予測サブブロックの予測情報を取得する。

段階Ｓ１５０６Ａと同様に、調節された第２インデックスに従って第２予測サブブロックの予測情報を取得することは、調節された第２インデックスに従って候補リストにおける項目を位置特定し、第２予測サブブロックの予測情報として項目を取得することを含む。

実現可能な実装において、第２インデックスを調節することは、第２インデックスをｍだけインクリメントすることであってよく、ｍは正の整数である。実現可能な実装において、ｍは１であってよい。

別の実現可能な実装において、第２インデックスを調節することは、第２インデックスの解析された値に基づく他の計算であってよく、第２インデックスの調節された値は解析された値とは異なる。

具体的な実装において、段階Ｓ１５０５、Ｓ１５０６Ａ、およびＳ１５０６Ｂは、以下のように説明されてよい。それぞれ、第１予測サブブロックおよび第２予測サブブロックについて、（調節された）第１インデックスおよび第２インデックスである変数ｉｄｘｍおよびｉｄｘｎが、第１インデックス（ｍｅｒｇｅ＿ｔｒｉａｎｇｌｅ＿ｉｄｘ０）の解析された値および第２インデックス（ｍｅｒｇｅ＿ｔｒｉａｎｇｌｅ＿ｉｄｘ１）の解析された値を使用して、
ｉｄｘｍ＝ｍｅｒｇｅ＿ｔｒｉａｎｇｌｅ＿ｉｄｘ０
ｉｄｘｎ＝ｍｅｒｇｅ＿ｔｒｉａｎｇｌｅ＿ｉｄｘ１＋（ｍｅｒｇｅ＿ｔｒｉａｎｇｌｅ＿ｉｄｘ１＞＝ｉｄｘｍ）？１：０
のように導出されると想定する。

別の実装において、ｉｄｘｎはまた、ｍｅｒｇｅ＿ｔｒｉａｎｇｌｅ＿ｉｄｘ１＋（ｍｅｒｇｅ＿ｔｒｉａｎｇｌｅ＿ｉｄｘ１＞ｉｄｘｍ）？１：０のように導出されてよいことに留意されたい。同様に、第２インデックスが第１インデックスに等しい場合、Ｓ１５０６ＡまたはＳ１５０６Ｂにおけるアクションは代替的に、種々の実施形態に基づいて実行されてよいが、本願において限定されるものではない。

切り捨てられた単進符号に従って第１インデックスが二値化される実現可能な実装において、第２インデックスは、切り捨てられた単進符号に従って二値化される。

二値化された第１インデックスの第１ｂｉｎが、ＣＡＢＡＣの通常のコーディングモードを使用してコーディングされる実現可能な実装において、二値化第２インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用してコーディングされる。

二値化された第１インデックスの非第１ｂｉｎが、ＣＡＢＡＣのバイパスコーディングモードを使用してコーディングされる実現可能な実装において、二値化第２インデックスの非第１ｂｉｎは、ＣＡＢＡＣのバイパスコーディングモードを使用してコーディングされる。非第１ｂｉｎとは、第１ｂｉｎを除く、二値化された第１インデックス（または二値化第２インデックス）の任意の他のｂｉｎを意味する。

Ｓ１５０７：第１予測サブブロックの予測情報および第２予測サブブロックの予測情報に基づいて現在のブロックの予測値を取得する。

第１予測サブブロックの予測情報および第２予測サブブロックの予測情報を取得した後に、現在のブロックの予測値が、上の章で説明されたような三角形予測方法の構築方法に基づいて取得されてよい。

実現可能な実装において、予測方法は更に、ビットストリームから方向インジケータを解析する段階を備え、方向インジケータは、現在のブロックの分割方向を示すために使用される。例えば、方向インジケータが０であるとき、ＰＵ_１およびＰＵ_２は、図１０Ａまたは図１０Ｂの左の図として示される分割方向によって分割され、方向インジケータが１であるとき、ＰＵ_１およびＰＵ_２は、図１０Ａまたは図１０Ｂの右の図として示される分割方向によって分割される。

実現可能な実装においては、ビットストリームから第１インデックスを解析する前にビットストリームから方向インジケータを解析し、別の実現可能な実装においては、調節された第２インデックスを導出した後にビットストリームから方向インジケータを解析することに留意されたい。実装される順序は、本願に限定されるものではない。このことは、方向インジケータが、ビットストリームによって異なる位置に保持されてよいことを意味する。

図１６は本願の別のインター予測方法を示す。第１インデックスおよび／または第２インデックスのコードワード設計は、第１インデックスおよび／または第２インデックスの最大許容値に基づくことに留意されたい。デコーダ側は、第１インデックスおよび／または、第２インデックスの最大許容値を取得することなく、第１インデックスおよび／または第２インデックスを正常に解析することができない。

実現可能な実装において、第１インデックスおよび／または第２インデックスの最大許容値は、予め設定されたプロトコル、例えば、規格における予め設定された値に従って、エンコーダ側およびデコーダ側の両方によって取得される。この場合、最大許容値を表すためのインジケータがシグナリングされない。

別の実現可能な実装において、最大許容値を表すための１または複数のインジケータがビットストリームにおいてシグナリングされる。そのため、デコーダ側は、ビットストリームを解析することによって、エンコーダ側と同一の値を取得できる。

例として、第１予測サブブロックおよび第２予測サブブロックは、同一の候補リストを共有し、第１インデックスおよび／または第２インデックスの最大許容値は、候補リストの長さとみなされてよいことに留意されたい。

候補リストの長さは、高レベルシンタックスとしてビットストリームにおいてエンコードされてよく、例えば、シーケンスパラメータセット、画像パラメータセット、画像ヘッダ、またはスライスヘッダなどに含まれてよいことに留意されたい。この場合、候補リストの長さは、段階Ｓ１５０１の前に決定されてよい。

候補リストの長さはまた、ブロックまたはＰＵレベルでエンコードされてよい。この場合、候補リストの長さは、段階Ｓ１５０２と段階Ｓ１５０１との間に決定されてよい。候補リストの長さは以下のように決定される。

Ｓ１５０８：第１の数を解析して候補リストの第１の長さを決定する。実現可能な実装において、第１の数はビットストリームから直接解析される。

別の実現可能な実装において、いくつかのシンタックスがビットストリームから解析され、解析されたシンタックスは組み合わされて第１の数が決定される。

例として、第１の長さは、候補リストにおけるマージモードについての候補予測情報の最大数である。

上の章で説明されたように、三角形予測モードの候補リストはマージモードの候補リストから導出される。マージモードインデックスはまた、第１インデックスおよび／または第２インデックスとして使用されてよい。この場合、三角形予測モードの候補リストは、マージモードの候補リストの一部とみなされてよい。例えば図１２に示されるように、三角形予測モードの候補リストにおける各候補は、マージモードの候補リストにおける片予測動き情報に対応する。そして、マージモードおよび三角形予測モードの候補予測情報の最大数は異なってよい。

Ｓ１５０９：第１の数に基づいて候補リストの第２の長さを導出する。

第２の長さは、候補リストにおけるサブブロックベースの予測モードの候補予測情報の最大数である。サブブロックベースの予測モードは三角形予測モードまたは幾何予測モードである。予測モードは、矩形または非矩形（台形）モードを含む予測モードに基づく他のサブブロックであり得る。そして、三角形予測モードおよび幾何予測モードは片予測モードとして統合され得る。これも実現可能な実装に関与し得る。

三角形予測モードの候補リストはマージモードの候補リストから導出されるので、第１の長さは第２の長さ以上である。

実現可能な実装において、第２の長さは、予め設定されたデルタ値を第１の数から減算することによって取得されてよい。

別の実現可能な実装において、第２の長さは、デルタ値を第１の数から減算することによって取得されてよく、デルタ値はビットストリームから解析される。

図１２に示されるように、片予測候補リストは三角形予測モードについて構築され、双予測候補リストはマージモードについて構築されることに留意されたい。本願において、インデックスによって示される片予測候補リストにおける各動き情報は、ＴＰＭについての候補である。インデックスによって示される双予測候補リストにおける各動き情報セット（Ｌｉｓｔ０の動き情報、および、Ｌｉｓｔ１の動き情報）は、マージモードについての候補である。実施形態はまた、以下のように説明されてよい。

候補リストはマージモードの候補リストであり、したがって、マージモードインデックスが、候補リストにおける候補を示すために使用されると想定する。

Ｓ１５０８'：第１の数を解析して、候補リストにおける最大許容候補インデックスを決定する。

最大許容候補インデックスは、マージモードについての最大インデックスであってよい。換言すれば、それはマージモードインデックスの最大許容値である。

Ｓ１５０９'：最大許容候補インデックスに基づいて最大値インデックスを取得する。
最大値インデックスは、第１インデックスおよび第２インデックス（図１５の実施形態において説明されるものと同一のインデックス）についての最高限度を示すために使用される。

本願によれば、第１インデックスおよび第２インデックスが同一である場合、それは、サブブロックベースの予測モードについて冗長であることに留意されたい。したがって、第１インデックスが最高限度ＭＡＸを有する場合、第２インデックスがビットストリームから解析されるとき、第２インデックスは、最高限度ＭＡＸ－ｍを有する。ｍは正の整数であり、例えば、ｍは本実施形態において１であってよい。そして、本実施形態における調節された第２インデックスは、最高限度と同一であってよいことにも留意されたい。

実現可能な実装において、最大許容候補インデックスと予め定められた数との間の計算によって最大インデックスを取得する。例えば、最大インデックスは、最大許容候補インデックス－予め定められた数に等しい。別の例において、最大インデックスは、予め定められた数－最大許容候補インデックス＋オフセット値に等しい。

別の実現可能な実装において、第２の数を解析して、最大許容候補インデックスと最大インデックスとの間の差を導出し、最大許容候補インデックスと差との間の計算によって最大インデックスを取得する。例えば、最大インデックスは、最大許容候補インデックス－当該差に等しい。別の例において、最大インデックスは、当該差－最大許容候補インデックス＋オフセット値に等しい。

別の実施形態において、最大インデックスおよび最大許容候補インデックスは別個にシグナリングされる。例えば、Ｓ１５０８またはＳ１５０８'と同様に、第３の数を解析して最大インデックスを決定する。

そして、最大インデックスおよび最大許容候補インデックスが別個にシグナリングされるか、または、従属的にシグナリングされるかに関らず、実現可能な実装において、マージモードの最大インデックスである最大許容候補インデックスは、最大インデックス以上である。

具体的な実装において、ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄは、ＭａｘＮｕｍＭｅｒｇｅＣａｎｄから減算されたスライスにおいて（または、種々の実施形態によれば、画像において）サポートされる三角形マージモード候補の最大数を指定する。ｓｉｘ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄは、６から減算されたスライスにおいてサポートされるマージ動きベクトル予測（ＭＶＰ）候補の最大数を指定する。マージＭＶＰ候補の最大数、ＭａｘＮｕｍＭｅｒｇｅＣａｎｄは、ＭａｘＮｕｍＭｅｒｇｅＣａｎｄ＝６－ｓｉｘ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄとして導出される。三角形マージモード候補の最大数、ＭａｘＮｕｍＴｒｉａｎｇｌｅＭｅｒｇｅＣａｎｄは、ＭａｘＮｕｍＴｒｉａｎｇｌｅＭｅｒｇｅＣａｎｄ＝ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄとして導出される。

ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄは、ビットストリームによって保持されて（存在して）よいので、ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄの値を解析できる。ＭａｘＮｕｍＴｒｉａｎｇｌｅＭｅｒｇｅＣａｎｄの値は、２からＭａｘＮｕｍＭｅｒｇｅＣａｎｄの範囲にあるものとすることに留意されたい。

異なる条件に基づいて、ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄは、ビットストリームによって保持されない（存在しない）ことがあってよい。この場合、ｓｐｓ＿ｔｒｉａｎｇｌｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しい、または、ＭａｘＮｕｍＭｅｒｇｅＣａｎｄが２未満であるとき、ＭａｘＮｕｍＴｒｉａｎｇｌｅＭｅｒｇｅＣａｎｄは、０に等しくなるように設定される。このことは、三角形マージモードが現在のスライス（または、種々の実施形態によれば、現在の画像）に許容されないことを意味する。ｓｐｓ＿ｔｒｉａｎｇｌｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、ＭａｘＮｕｍＭｅｒｇｅＣａｎｄが２以上であるとき、ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄは、ｐｐｓ＿ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄ＿ｐｌｕｓ１－１に等しいと推論される。ここで、ｓｐｓ＿ｔｒｉａｎｇｌｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、シーケンスパラメータセットに含まれ、ＴＰＭが許容されるかどうかを示すシンタックス要素であり、ｐｐｓ＿ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄ＿ｐｌｕｓ１は、画像パラメータセットに含まれるシンタックス要素である。ｐｐｓ＿ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄ＿ｐｌｕｓ１が０に等しいことは、ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄが、画像パラメータセットを参照するスライス（または種々の実施形態によれば画像の画像ヘッダ）のスライスヘッダに存在することを指定する。ｐｐｓ＿ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄ＿ｐｌｕｓ１が０より大きいことは、ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄが、画像パラメータセットを参照するスライス（または種々の実施形態によれば画像の画像ヘッダ）のスライスヘッダに存在しないことを指定する。ｐｐｓ＿ｍａｘ＿ｎｕｍ＿ｍｅｒｇｅ＿ｃａｎｄ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿ｔｒｉａｎｇｌｅ＿ｃａｎｄ＿ｐｌｕｓ１の値は、０からＭａｘＮｕｍＭｅｒｇｅＣａｎｄ－１の範囲にあるものとする。

代替的に、第１の長さおよび第２の長さは、別個にシグナリングされてよく、このことは、段階Ｓ１５０９が第２の数を解析して候補リストの第２の長さを決定することであってよいことを意味する。

同様に、実現可能な実装において、第２の数は、ビットストリームから直接解析される。そして、別の実現可能な実装において、いくつかのシンタックスがビットストリームから解析され、解析されたシンタックスが組み合わされて第２の数が決定される。

ビットストリームから解析されて、第１の長さおよび／または第２の長さを直接的または間接的に示す任意の情報（例えば、２つの長さの間の差の値）は、シーケンスパラメータセット、画像パラメータセット、画像ヘッダ、またはスライスヘッダなどにおけるビットストリームによって保持できることに留意されたい。図１７は本願のインター予測装置１７００を示す。

現在のブロックが第１予測サブブロックおよび第２予測サブブロックを含む装置１７００は、ビットストリームから第１インデックスを解析することであって、第１インデックスは、第１予測サブブロックの予測情報を取得するために使用される、ことと、ビットストリームから第２インデックスを解析することとを行うよう構成される解析モジュール１７０１と、第１インデックスを第２インデックスと比較し、第２インデックスが第１インデックス以上である場合に第２インデックスを調節するよう構成される位置特定モジュール１７０２と、調節された第２インデックスに従って第２予測サブブロックの予測情報を取得するよう構成される取得モジュール１７０３とを備える。

実現可能な実装において、位置特定モジュール１７０２は、第２インデックスをｍだけインクリメントするよう構成され、ｍは正の整数である。実現可能な実装において、ｍは１である。

実現可能な実装において、ビットストリームから第１インデックスを解析する前に、解析モジュール１７０１は、少なくとも１つのインジケータを解析して、現在のブロックの予測モードを決定するよう更に構成され、予測モードは三角形予測モードまたは幾何予測モードである。予測モードは、矩形または非矩形（台形）モードを含む予測モードに基づく他のサブブロックであり得る。そして、三角形予測モードおよび幾何予測モードは片予測モードとして統合され得る。これも実現可能な実装に関与し得る。

実現可能な実装において、位置特定モジュール１７０２は更に、現在のブロックについての候補リストを取得するよう構成される。

実現可能な実装において、解析モジュール１７０１は、第１の数を解析して、候補リストにおける最大許容候補インデックスを決定し、最大許容候補インデックスに基づいて最大インデックスを取得するよう構成され、第１インデックスは最大インデックスより大きくない。

実現可能な実装において、解析モジュール１７０１は、最大許容候補インデックスと予め定められた数との間の計算によって最大インデックスを取得するよう構成される。

実現可能な実装において、解析モジュール１７０１は、第２の数を解析して、最大許容候補インデックスと最大インデックスとの間の差を導出し、最大許容候補インデックスと差との間の計算によって最大インデックスを取得するよう構成される。

実現可能な実装において、解析モジュール１７０１は、第３の数を解析して最大インデックスを決定するよう構成される。

実現可能な実装において、調節された第２インデックスに従って第２予測サブブロックの予測情報を取得した後に、取得モジュール１７０３は更に、第１予測サブブロックの予測情報および第２予測サブブロックの予測情報に基づいて現在のブロックの予測値を取得するよう構成される。

実現可能な実装において、解析モジュール１７０１は、ビットストリームから方向インジケータを解析するよう構成され、方向インジケータは、現在のブロックの分割方向を示すために使用される。

図１８は、本願のインター予測装置１８００を示し、装置１８００はデコーダまたはエンコーダであってよい。装置１８００は、１または複数のプロセッサ１８０１と、プロセッサに連結されて、プロセッサによって実行するためのプログラムを格納する非一時的コンピュータ可読記憶媒体１８０２とを備え、プログラムは、プロセッサによって実行されるとき、図１５または図１６における方法を実行するようデコーダを構成する。

別の実施形態において、コンピュータプログラム製品は、コンピュータまたはプロセッサ上で実行されるときに図１５または図１６における方法を実行するためのプログラムコードを備える。

別の実施形態において、非一時的コンピュータ可読媒体はプログラムコードを保持し、プログラムコードはコンピュータデバイスによって実行されるとき、コンピュータデバイスに図１５または図１６における方法を実行させる。

以下は、上述の実施形態に示されるようなエンコーディング方法およびデコーディング方法のアプリケーションおよびそれらを用いたシステムの説明である。

図１９は、コンテンツ配布サービスを実現するためのコンテンツ供給システム３１００を示すブロック図である。このコンテンツ供給システム３１００は、キャプチャデバイス３１０２、端末デバイス３１０６を含み、任意で、ディスプレイ３１２６を含む。キャプチャデバイス３１０２は、通信リンク３１０４を介して端末デバイス３１０６と通信する。通信リンクは、上述した通信チャネル１３を含んでよい。通信リンク３１０４は、限定されるものではないが、ＷＩＦＩ（登録商標）、イーサネット（登録商標）、ケーブル、無線（３Ｇ／４Ｇ／５Ｇ）、ＵＳＢまたはこれらの任意の種類の組み合わせなどを含む。

キャプチャデバイス３１０２は、データを生成し、上記の実施形態に示されるようなエンコーディング方法により、データをエンコードしてよい。代わりに、キャプチャデバイス３１０２は、データをストリーミングサーバ（図には示されていない）に配信してよく、サーバは、データをエンコードして、エンコード済みのデータを端末デバイス３１０６に伝送する。キャプチャデバイス３１０２は、限定されるものではないが、カメラ、スマートフォンまたはパッド、コンピュータまたはラップトップ、ビデオ会議システム、ＰＤＡ、車載デバイスまたはこれらのいずれかの組み合わせなどを含む。例えば、上述したように、キャプチャデバイス３１０２はソースデバイス１２を含んでよい。データがビデオを含む場合、キャプチャデバイス３１０２に含まれるビデオエンコーダ２０は、ビデオエンコーディング処理を実際に実行してよい。データがオーディオ（すなわち、音声）を含む場合、キャプチャデバイス３１０２に含まれるオーディオエンコーダは、オーディオエンコーディング処理を実際に実行してよい。いくつかの実際のシナリオについて、キャプチャデバイス３１０２は、これらを一緒に多重化することにより、エンコードされたビデオおよびオーディオデータを配信する。他の実際のシナリオについて、例えば、ビデオ会議システムにおいて、エンコードされたオーディオデータおよびエンコードされたビデオデータは多重化されない。キャプチャデバイス３１０２は、エンコードされたオーディオデータおよびエンコードされたビデオデータを別個に端末デバイス３１０６に配信する。

コンテンツ供給システム３１００において、端末デバイス３１０は、エンコード済みのデータを受信および再生する。端末デバイス３１０６は、データ受信および復元機能を有するデバイス、例えば、上述したエンコード済みのデータをデコードすることが可能なスマートフォンまたはパッド３１０８、コンピュータまたはラップトップ３１１０、ネットワークビデオレコーダ（ＮＶＲ）／デジタルビデオレコーダ（ＤＶＲ）３１１２、ＴＶ３１１４、セットトップボックス（ＳＴＢ）３１１６、ビデオ会議システム３１１８、ビデオ監視システム３１２０、パーソナルデジタルアシスタント（ＰＤＡ）３１２２、車載デバイス３１２４またはこれらのいずれかの組み合わせなどであってよい。例えば、上述したように、端末デバイス３１０６はデスティネーションデバイス１４を含んでよい。エンコード済みのデータがビデオを含む場合、端末デバイスに含まれるビデオデコーダ３０は、ビデオデコーディングを実行することを優先させる。エンコード済みのデータがオーディオを含む場合、端末デバイスに含まれるオーディオデコーダは、オーディオデコーディング処理を実行することを優先させる。

ディスプレイを有する端末デバイス、例えば、スマートフォンまたはパッド３１０８、コンピュータまたはラップトップ３１１０、ネットワークビデオレコーダ（ＮＶＲ）／デジタルビデオレコーダ（ＤＶＲ）３１１２、ＴＶ３１１４、パーソナルデジタルアシスタント（ＰＤＡ）３１２２または車載デバイス３１２４について、端末デバイスは、デコードされたデータをそのディスプレイに入力できる。ディスプレイを搭載していない端末デバイス、例えば、ＳＴＢ３１１６、ビデオ会議システム３１１８またはビデオ監視システム３１２０について、外部ディスプレイ３１２６は、デコードされたデータを受信および示すために、内部でコンタクトされる。

このシステムにおける各デバイスがエンコーディングまたはデコーディングを実行するとき、上述の実施形態に示されるような画像エンコーディングデバイスまたは画像デコーディングデバイスが使用されてよい。

図２０は、端末デバイス３１０６の例の構造を示す図である。端末デバイス３１０６がキャプチャデバイス３１０２からストリームを受信した後に、プロトコル処理ユニット３２０２は、ストリームの伝送プロトコルを解析する。プロトコルは、限定されるものではないが、リアルタイムストリーミングプロトコル（ＲＴＳＰ）、ハイパーテキストトランスファープロトコル（ＨＴＴＰ）、ＨＴＴＰライブストリーミングプロトコル（ＨＬＳ）、ＭＰＥＧ－ＤＡＳＨ、リアルタイムトランスポートプロトコル（ＲＴＰ）、リアルタイムメッセージングプロトコル（ＲＴＭＰ）、または、これらの任意の種類の組み合わせなどを含む。

プロトコル処理ユニット３２０２がストリームを処理した後に、ストリームファイルが生成される。当該ファイルは、逆多重化ユニット３２０４に出力される。逆多重化ユニット３２０４は、多重化されたデータをエンコードされたオーディオデータおよびエンコードされたビデオデータに分離できる。上述したように、いくつかの実際のシナリオについて、例えば、ビデオ会議システムでは、エンコードされたオーディオデータおよびエンコードされたビデオデータは多重化されていない。この状況において、エンコード済みのデータは、逆多重化ユニット３２０４を介することなくビデオデコーダ３２０６およびオーディオデコーダ３２０８へ送信される。

逆多重化処理を介して、ビデオエレメンタリストリーム（ＥＳ）、オーディオＥＳおよび任意で字幕が生成される。上述の実施形態において説明したように、ビデオデコーダ３０を含むビデオデコーダ３２０６は、上述の実施形態に示されるようなデコーディング方法により、ビデオＥＳをデコードしてビデオフレームを生成し、このデータを同期ユニット３２１２に入力する。オーディオデコーダ３２０８は、オーディオＥＳをデコードしてオーディオフレームを生成し、このデータを同期ユニット３２１２に入力する。代わりに、ビデオフレームは、それを同期ユニット３２１２に入力する前に、（図２０には示されていない）バッファに格納されてよい。同様に、オーディオフレームは、それを同期ユニット３２１２に入力する前に、（図２０には示されていない）バッファに格納されてよい。

同期ユニット３２１２は、ビデオフレームおよびオーディオフレームを同期させて、ビデオ／オーディオをビデオ／オーディオディスプレイ３２１４に供給する。例えば、同期ユニット３２１２は、ビデオおよびオーディオ情報の提示を同期させる。情報は、コードされたオーディオおよびビジュアルデータの提示に関するタイムスタンプ、および、データストリームそのものの配信に関するタイムスタンプを用いて構文でコードしてよい。

ストリームに字幕が含まれている場合、字幕デコーダ３２１０は、字幕をデコードし、それをビデオフレームおよびオーディオフレームと同期させ、ビデオ／オーディオ／字幕をビデオ／オーディオ／字幕ディスプレイ３２１６に供給する。

本発明は、上記のシステムに限定されるものではなく、上述の実施形態における画像エンコーディングデバイスまたは画像デコーディングデバイスのいずれかは、他のシステム、例えば車載システムに組み込まれてよい。

［数学演算子］
本願において使用される数学演算子は、Ｃプログラミング言語において使用されるものと同様である。しかしながら、整数除算および算術シフト演算の結果はより厳密に定義され、べき乗および実数値除算などの追加の演算が定義される。番号およびカウントの方式は概して０から始まり、例えば「第１」は０番目と同等であり、「第２」は１番目と同等であり、以降も同様である。

［算術演算子］

［論理演算子］
以下の論理的演算子が次のように定義される。
ｘ＆＆ｙｘおよびｙのブール論理「ａｎｄ」
ｘ｜｜ｙｘおよびｙのブール論理「ｏｒ」
！ブール論理「ｎｏｔ」
ｘ？ｙ：ｚｘが真であるかまたは０に等しくない場合、ｙの値を評価し、そうでない場合、ｚの値を評価する。

［関係演算子］
以下の関係演算子を次のように定義する。
＞より大きい
＞＝以上
＜より小さい
＜＝以下
＝＝に等しい
！＝に等しくない

関係演算子が、値「ｎａ」（非該当）を割り当てられているシンタックス要素または変数に適用される場合、値「ｎａ」は、そのシンタックス要素または変数の区別的な値として扱われる。値「ｎａ」は、任意の他の値に等しくないとみなされる。

［ビット単位演算子］
以下のビット単位演算子が次のように定義される。
＆ビット単位の「ａｎｄ」。整数項に対して演算を行う場合、整数値の２の補数表現に対して演算を行う。別の項より少ないビットを含む二進項に対して演算を行う場合、そのより短い項は、０に等しいより上位のビットを追加することによって拡張される。
｜ビット単位の「ｏｒ」。整数項に対して演算を行う場合、整数値の２の補数表現に対して演算を行う。別の項より少ないビットを含む二進項に対して演算を行う場合、そのより短い項は、０に等しいより上位のビットを追加することによって拡張される。
＾ビット単位の「排他的ｏｒ」。整数項に対して演算を行う場合、整数値の２の補数表現に対して演算を行う。別の項より少ないビットを含む二進項に対して演算を行う場合、そのより短い項は、０に等しいより上位のビットを追加することによって拡張される。
ｘ＞＞ｙｙの二進数だけの、ｘの２の補数整数表現の算術右シフト。この関数は、ｙの非負の整数値に関してのみ定義される。右シフトの結果として最上位ビット（ＭＳＢ）にシフトされたビットは、シフト演算前のｘのＭＳＢに等しい値を有する。
ｘ＜＜ｙｙの二進数だけの、ｘの２の補数整数表現の算術左シフト。この関数は、ｙの非負の整数値に関してのみ定義される。左シフトの結果として最下位ビット（ＬＳＢ）にシフトされたビットは、０に等しい値を有する。

［代入演算子］
以下の算術演算子は以下のように定義される。
＝代入演算子
＋＋インクリメント、すなわち、ｘ＋＋は、ｘ＝ｘ＋１と同等であり、配列インデックスにおいて使用されるとき、インクリメント演算の前の変数の値を評価する。
――デクリメント、すなわち、ｘ――は、ｘ＝ｘ－１と同等であり、配列インデックスにおいて使用されるとき、デクリメント演算の前の変数の値を評価する。
＋＝指定された量のインクリメント、すなわち、ｘ＋＝３は、ｘ＝ｘ＋３と同等である。
ｘ＋＝（－３）は、ｘ＝ｘ＋（－３）と同等である。
－＝指定された量だけデクリメント、すなわち、ｘ－＝３は、ｘ＝ｘ－３と同等である。
ｘ－＝（－３）は、ｘ＝ｘ－（－３）と同等である。

［範囲表記］
値の範囲を指定するために以下の表記が使用される。
ｘ＝ｙ．．ｚｘはｙから始まるｚまで（境界を含む）の整数値を取り、ｘ、ｙ、ｚは整数であり、ｚはｙより大きい。

［数学関数］
以下の数学関数が定義される。

Ａｓｉｎ（ｘ）－１．０から１．０の範囲（境界を含む）にある引数ｘを操作する正弦の逆三角関数であり、出力値は、－π÷２からπ÷２の範囲（境界を含む）にある（単位はラジアン）。
Ａｔａｎ（ｘ）引数ｘを操作する正接の逆三角関数であり、出力値は、－π÷２からπ÷２の範囲（境界を含む）にある（単位はラジアン）。

Ｃｅｉｌ（ｘ）ｘ以上の最小の整数
Ｃｌｉｐ１_Ｙ（ｘ）＝Ｃｌｉｐ３（０，（１＜＜ＢｉｔＤｅｐｔｈ_Ｙ）－１，ｘ）
Ｃｌｉｐ１_Ｃ（ｘ）＝Ｃｌｉｐ３（０，（１＜＜ＢｉｔＤｅｐｔｈ_Ｃ）－１，ｘ）

Ｃｏｓ（ｘ）ラジアンの単位である引数ｘに対して操作する余弦の三角関数
Ｆｌｏｏｒ（ｘ）ｘ以下の最大の整数

Ｌｎ（ｘ）ｘの自然対数（底をｅとする対数、ｅは自然対数底定数２．７１８２８１８２８...）
Ｌｏｇ２（ｘ）底を２とするｘの対数
Ｌｏｇ１０（ｘ）底を１０とするｘの対数

Ｒｏｕｎｄ（ｘ）＝Ｓｉｇｎ（ｘ）＊Ｆｌｏｏｒ（Ａｂｓ（ｘ）＋０．５）

Ｓｉｎ（ｘ）ラジアンの単位である引数ｘを操作する正弦の三角関数

Ｓｗａｐ（ｘ，ｙ）＝（ｙ，ｘ）
Ｔａｎ（ｘ）ラジアンの単位である引数ｘを操作する正接の三角関数

［演算の優先度の順位］
数式における優先度の順位が、括弧の使用によって明示的に示されないとき、以下の規則が適用される。
より高い優先度の演算は、より低い優先度の任意の操作の前に評価される。
同一の優先度の演算は、左から右に順に評価される。

下の表は、演算の優先度を最高から最低まで指定し、表においてより高い位置は、より高い優先度を示す。

Ｃプログラミング言語においても使用される演算子の場合、この明細書において使用される優先度の順序は、Ｃプログラミング言語において使用されるものと同一である。
表：最高（表の一番上）から最低（表の一番下）までの演算優先度

［論理演算のテキストの説明］
テキストにおいて、論理演算のステートメントは、以下の形式で数学的に記載される。
ｉｆ（条件０）
ステートメント０
ｅｌｓｅｉｆ（条件１）
ステートメント１
...
ｅｌｓｅ／＊残りの条件の情報についての記述＊／
ステートメントｎ
以下の方式で記載されてよい。
...以下の通りである／...以下を適用する
－ｉｆ条件０，ステートメント０
－Ｏｔｈｅｒｗｉｓｅ，ｉｆ条件１，ステートメント１
－ ...
－Ｏｔｈｅｒｗｉｓｅ（残りの条件の情報についての記述），ステートメントｎ

テキストにおける「ｉｆ...Ｏｔｈｅｒｗｉｓｅ，ｉｆ...Ｏｔｈｅｒｗｉｓｅ」ステートメントの各々は、直後に「ｉｆ...」が続く「...以下の通りである」または「...以下を適用する」を用いて導入される。「ｉｆ...Ｏｔｈｅｒｗｉｓｅ，ｉｆ...Ｏｔｈｅｒｗｉｓｅ」の最後の条件は常に、「Ｏｔｈｅｒｗｉｓｅ，...」である。挟まれた「ｉｆ...Ｏｔｈｅｒｗｉｓｅ，ｉｆ...Ｏｔｈｅｒｗｉｓｅ」ステートメントは、「...以下の通りである」または「...以下を適用する」を最後の「Ｏｔｈｅｒｗｉｓｅ，...」とマッチさせることによって識別されてよい。

テキストにおいて、論理演算のステートメントは、以下の形式で数学的に記載される。
ｉｆ（条件０ａ＆＆条件０ｂ）
ステートメント０
ｅｌｓｅｉｆ（条件１ａ｜｜条件１ｂ）
ステートメント１
...
ｅｌｓｅ
ステートメントｎ
以下の方式で記載されてよい。
...以下の通りである／...以下を適用する
－以下の条件のすべてが真である場合、ステートメント０：
－条件０ａ
－条件０ｂ
そうでなければ、以下の条件の１または複数が真である場合、ステートメント１：
－条件１ａ
－条件１ｂ
－...
そうでなければ、ステートメントｎ

テキストにおいて、論理演算のステートメントは、以下の形式で数学的に記載される。
ｉｆ（条件０）
ステートメント０
ｉｆ（条件１）
ステートメント１
以下の方式で記載され得る。
条件０であるとき、ステートメント０
条件１であるとき、ステートメント１

例えばエンコーダ２０およびデコーダ３０の実施形態、並びに、例えばエンコーダ２０およびデコーダ３０を参照して本明細書に記載された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせで実装されてよい。ソフトウェアにおいて実装される場合、機能は、コンピュータ可読媒体上に保存されるか、または、通信媒体を介して１または複数の命令もしくはコードとして送信され、ハードウェアベースの処理ユニットによって実行されてよい。コンピュータ可読媒体は、データ記憶媒体等の有形の媒体に対応するコンピュータ可読記憶媒体、または、例えば通信プロトコルに従った、コンピュータプログラムの１つの場所から別の場所への移動を容易にする任意の媒体を含む通信媒体を含んでよい。このように、コンピュータ可読媒体は、一般に、（１）非一時的な有形コンピュータ可読記憶媒体、または、（２）信号もしくは搬送波等の通信媒体に対応してよい。データ記憶媒体は、本開示に記載された技術の実装のための命令、コード、および／またはデータ構造を取得するために、１もしくは複数のコンピュータまたは１もしくは複数のプロセッサによってアクセスできる任意の利用可能な媒体であってよい。コンピュータプログラム製品は、コンピュータ可読媒体を含んでよい。

限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭもしくは他の光ディスクストレージ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、フラッシュメモリ、または、命令もしくはデータ構造の形の所望のプログラムコードを保存するのに使用でき、コンピュータによってアクセスできる、任意の他の媒体を含むことができる。また、任意の接続が、適宜コンピュータ可読媒体と称される。例えば、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者線（ＤＳＬ）、または、赤外線、無線、およびマイクロ波等の無線技術を用いて、ウェブサイト、サーバ、または他のリモートソースから命令が送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、または、赤外線、無線、およびマイクロ波等の無線技術が媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まず、その代わりに、非一時的な有形の記憶媒体を指すことが理解されるべきである。本明細書で使用されるディスク（Ｄｉｓｋａｎｄｄｉｓｃ）は、コンパクトディスク（ＣＤ）、レーザディスク、光ディスク、デジタル多用途ディスク（ＤＶＤ）、フロッピディスク、およびブルーレイディスクを含み、ここで、通例、ディスク（ｄｉｓｋ）はデータを磁気的に再現するものであり、ディスク（ｄｉｓｃ）はデータをレーザによって光学的に再現するものである。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるべきである。

命令は、１または複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルロジックアレイ（ＦＰＧＡ）、または他の同等の一体型もしくはディスクリートロジック回路等の１または複数のプロセッサによって実行されてよい。したがって、本明細書で使用される「プロセッサ」という用語は、前述の構造のいずれか、または、本明細書に記載の技術の実装に好適な任意の他の構造を指してよい。加えて、いくつかの態様では、本明細書に記載の機能は、エンコーディングおよびデコーディングのために構成されている専用ハードウェアおよび／またはソフトウェアモジュール内に提供されるか、または、組み合わされたコーデックに組み込まれてよい。また、本技術は、１もしくは複数の回路またはロジック要素において完全に実装することができる。

本開示の技術は、無線ハンドセット、集積回路（ＩＣ）またはＩＣのセット（例えば、チップセット）を含む、多種多様なデバイスまたは装置において実装してよい。様々な構成要素、モジュール、またはユニットが、開示された技術を実行するように構成されているデバイスの機能的態様を強調するように本開示において記載されているが、異なるハードウェアユニットによる実現は必ずしも要求されない。むしろ、上述したように、好適なソフトウェアおよび／またはファームウェアと連動して、様々なユニットがコーデックハードウェアユニットにして組み合わされるか、または、上述したように、１または複数のプロセッサを含む相互運用ハードウェアユニットの集合によって提供されてよい。

Claims

現在のブロックが第１予測サブブロックおよび第２予測サブブロックを含む、イメージブロックのための予測方法であって、
ビットストリームから第１インデックスを解析する段階であって、前記第１インデックスは、前記第１予測サブブロックの予測情報を取得するために使用される、段階と、
前記ビットストリームから第２インデックスを解析する段階と、
前記第１インデックスを前記第２インデックスと比較する段階と、
前記第２インデックスが前記第１インデックス以上である場合に前記第２インデックスを調節する段階と、
調節された前記第２インデックスに従って前記第２予測サブブロックの予測情報を取得する段階と
を備える予測方法。
前記第２インデックスを調節する段階は、
前記第２インデックスをｍだけインクリメントする段階であって、ｍは正の整数である、段階
を含む、請求項１に記載の予測方法。
ｍが１である、請求項２に記載の予測方法。
ビットストリームから第１インデックスを解析する前に、前記予測方法は更に、
少なくとも１つのインジケータを解析して、前記現在のブロックの予測モードを決定する段階であって、前記予測モードは三角形予測モードまたは幾何予測モードである、段階
を備える、請求項１から３のいずれか一項に記載の予測方法。
前記予測方法は更に、
前記現在のブロックについての候補リストを取得する段階
を備える、請求項１から４のいずれか一項に記載の予測方法。
前記第１予測サブブロックの前記予測情報は、前記第１インデックスに従って前記候補リストから取得される、請求項５に記載の予測方法。
前記第２予測サブブロックの前記予測情報は、調節された前記第２インデックスに従って前記候補リストから取得される、請求項５または６に記載の予測方法。
前記候補リストはマージモードの候補リストである、請求項５から７のいずれか一項に記載の予測方法。
前記予測方法は更に、
前記ビットストリームに含まれる少なくとも１つのインジケータにより示される第１の数に基づいて、前記候補リストにおける最大許容候補インデックスを決定する段階と、
前記最大許容候補インデックスに基づいて最大インデックスを取得する段階であって、前記第１インデックスは前記最大インデックスより大きくない、段階と
を備える、請求項８に記載の予測方法。
前記最大許容候補インデックスに基づいて前記最大インデックスを取得する段階は、
前記最大許容候補インデックスと予め定められた数との間の計算によって前記最大インデックスを取得する段階
を含む、請求項９に記載の予測方法。
前記最大許容候補インデックスに基づいて前記最大インデックスを取得する段階は、
前記ビットストリームに含まれる少なくとも１つのインジケータにより示される第２の数に基づいて、前記最大許容候補インデックスと前記最大インデックスとの間の差を導出する段階と、
前記最大許容候補インデックスと前記差との間の計算によって前記最大インデックスを取得する段階と
を備える、請求項９に記載の予測方法。
前記予測方法は更に、
前記ビットストリームに含まれる少なくとも１つのインジケータにより示される第３の数に基づいて、最大インデックスを決定する段階
を備える、請求項１から８のいずれか一項に記載の予測方法。
前記最大許容候補インデックスは、前記最大インデックス以上である、請求項９から１１のいずれか一項に記載の予測方法。
調節された前記第２インデックスに従って前記第２予測サブブロックの予測情報を取得した後に、前記予測方法は更に、
前記第１予測サブブロックの前記予測情報および前記第２予測サブブロックの前記予測情報に基づいて前記現在のブロックの予測値を取得する段階
を備える、請求項１から１３のいずれか一項に記載の予測方法。
前記第１インデックスまたは前記第２インデックスは、切り捨てられた単進符号に従って二値化される、請求項１から１４のいずれか一項に記載の予測方法。
二値化された前記第１インデックスまたは前記第２インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用してコーディングされる、請求項１５に記載の予測方法。
二値化された前記第１インデックスまたは前記第２インデックスの非第１ｂｉｎは、ＣＡＢＡＣのバイパスコーディングモードを使用してコーディングされる、請求項１５または１６に記載の予測方法。
前記ビットストリームから方向インジケータを解析する段階であって、前記方向インジケータは、前記現在のブロックの分割方向を示すために使用される、段階を更に備える、請求項１から１７のいずれか一項に記載の予測方法。
現在のブロックが第１予測サブブロックおよび第２予測サブブロックを含む、インター予測のための装置であって、
ビットストリームから第１インデックスを解析することであって、前記第１インデックスは、前記第１予測サブブロックの予測情報を取得するために使用される、ことと、
前記ビットストリームから第２インデックスを解析することと
を行うよう構成される解析モジュールと、
前記第１インデックスを前記第２インデックスと比較し、
前記第２インデックスが前記第１インデックス以上である場合に前記第２インデックスを調節する
よう構成される位置特定モジュールと、
調節された前記第２インデックスに従って前記第２予測サブブロックの予測情報を取得するよう構成される取得モジュールと
を備える装置。
前記位置特定モジュールは、前記第２インデックスをｍだけインクリメントするよう構成され、ｍは正の整数である、請求項１９に記載の装置。
ｍは１である、請求項２０に記載の装置。
ビットストリームから第１インデックスを解析する前に、前記解析モジュールは更に、
少なくとも１つのインジケータを解析して、前記現在のブロックの予測モードを決定するよう構成され、前記予測モードは三角形予測モードまたは幾何予測モードである、請求項１９から２１のいずれか一項に記載の装置。
前記位置特定モジュールは更に、前記現在のブロックについての候補リストを取得するよう構成される、請求項１９から２２のいずれか一項に記載の装置。
前記第１予測サブブロックの前記予測情報は、前記第１インデックスに従って前記候補リストから取得される、請求項２３に記載の装置。
前記第２予測サブブロックの前記予測情報は、調節された前記第２インデックスに従って前記候補リストから取得される、請求項２３または２４に記載の装置。
前記候補リストはマージモードの候補リストである、請求項２３から２５のいずれか一項に記載の装置。
前記解析モジュールは、
前記ビットストリームに含まれる少なくとも１つのインジケータに示される第１の数に基づいて、前記候補リストにおける最大許容候補インデックスを決定し、
前記最大許容候補インデックスに基づいて最大インデックスを取得する
よう構成され、前記第１インデックスは前記最大インデックスより大きくない、
請求項２６に記載の装置。
前記解析モジュールは、前記最大許容候補インデックスと予め定められた数との間の計算によって前記最大インデックスを取得するよう構成される、請求項２７に記載の装置。
前記解析モジュールは、
前記ビットストリームに含まれる少なくとも１つのインジケータに示される第２の数に基づいて、前記最大許容候補インデックスと前記最大インデックスとの間の差を導出し、
前記最大許容候補インデックスと前記差との間の計算によって前記最大インデックスを取得する
よう構成される、請求項２７に記載の装置。
前記解析モジュールは、前記ビットストリームに含まれる少なくとも１つのインジケータに示される第３の数に基づいて、最大インデックスを決定するよう構成される、請求項１９から２６のいずれか一項に記載の装置。
前記最大許容候補インデックスは前記最大インデックス以上である、請求項２７から２９のいずれか一項に記載の装置。
調節された前記第２インデックスに従って前記第２予測サブブロックの予測情報を取得した後に、前記取得モジュールは更に、
前記第１予測サブブロックの前記予測情報および前記第２予測サブブロックの前記予測情報に基づいて前記現在のブロックの予測値を取得するよう構成される、請求項１９から３１のいずれか一項に記載の装置。
前記第１インデックスまたは前記第２インデックスは、切り捨てられた単進符号に従って二値化される、請求項１９から３２のいずれか一項に記載の装置。
二値化された前記第１インデックスまたは前記第２インデックスの第１ｂｉｎは、ＣＡＢＡＣの通常のコーディングモードを使用してコーディングされる、請求項３３に記載の装置。
二値化された前記第１インデックスまたは前記第２インデックスの非第１ｂｉｎは、ＣＡＢＡＣのバイパスコーディングモードを使用してコーディングされる、請求項３３または３４に記載の装置。
前記解析モジュールは、前記ビットストリームから方向インジケータを解析するよう構成され、前記方向インジケータは、前記現在のブロックの分割方向を示すために使用される、請求項１９から３５のいずれか一項に記載の装置。
請求項１から１８のいずれか一項に記載の予測方法をコンピュータに実行させるプログラム。
１または複数のプロセッサと、
前記１または複数のプロセッサに連結され、前記１または複数のプロセッサによって実行されるプログラムを格納する非一時的コンピュータ可読記憶媒体と
を備えるデコーダであって、前記プログラムは、前記１または複数のプロセッサによって実行されるとき、請求項１から１８のいずれか一項に記載の予測方法を実行するよう前記デコーダを構成する、
デコーダ。
１または複数のプロセッサと、
前記１または複数のプロセッサに連結され、前記１または複数のプロセッサによって実行されるプログラムを格納する非一時的コンピュータ可読記憶媒体と
を備えるエンコーダであって、前記プログラムは、前記１または複数のプロセッサによって実行されるとき、請求項１から１８のいずれか一項に記載の予測方法を実行するよう前記エンコーダを構成する、
エンコーダ。
コンピュータデバイスによって実行されるとき、前記コンピュータデバイスに、請求項１から１８のいずれか一項に記載の予測方法を実行させるプログラムを格納する非一時的コンピュータ可読媒体。