JP2022523697A

JP2022523697A - 適応的な数の領域を伴う幾何学的分割におけるインター予測

Info

Publication number: JP2022523697A
Application number: JP2021543478A
Authority: JP
Inventors: ボリヴォイェファート，; ハリカルバ，; ヴェリボールアジッチ，
Original assignee: オーピーソリューションズ，エルエルシー
Priority date: 2019-01-28
Filing date: 2020-01-28
Publication date: 2022-04-26
Also published as: WO2020159989A1; US20200396448A1; EP3918794A1; CN113647104A; MX2021009026A; US20220182607A1; BR112021014788A2; SG11202108103WA; US20230308640A1; EP3918794A4; KR20210118154A; US11259014B2; US11695922B2

Abstract

デコーダは、回路を含み、回路は、ビットストリームを受信することと、カレントブロックを幾何学的分割モードを介して第１の領域、第２の領域、および第３の領域に分割することと、第１の領域、第２の領域、または第３の領域と関連付けられる動きベクトルを決定することであって、決定することは、候補リストを構築することを含む、ことと、決定された動きベクトルを使用してカレントブロックをデコードすることとを行うように構成される。関連する装置、システム、技法、および物品もまた、説明される。

Description

本願は、２０１９年１月２８日に出願され「ＩＮＴＥＲＰＲＥＤＩＣＴＩＯＮＩＮＧＥＯＭＥＴＲＩＣＰＡＲＴＩＴＩＯＮＩＮＧＷＩＴＨＡＮＡＤＡＰＴＩＶＥＮＵＭＢＥＲＯＦＲＥＧＩＯＮＳ」と題された米国仮特許出願第６２／７９７，８２０号の優先権の利益を主張し、その出願は、参照することによってその全体として本明細書に援用される。

本発明は、概して、ビデオ圧縮の分野に関する。具体的には、本発明は、適応的な数の領域を伴う幾何学的分割におけるインター予測を対象とする。

ビデオコーデックは、デジタルビデオを圧縮または解凍する電子回路またはソフトウェアを含み得る。それは、圧縮されていないビデオを圧縮されたフォーマットに変換することができ、逆もまた同様である。ビデオ圧縮の文脈において、ビデオを圧縮する（および／またはそのうちのいくつかの機能を実施する）デバイスは、典型的には、エンコーダと呼ばれ得、ビデオを解凍する（および／またはそのうちのいくつかの機能を実施する）デバイスは、デコーダと呼ばれ得る。

圧縮されたデータのフォーマットは、標準的なビデオ圧縮仕様に適合することができる。圧縮は、圧縮されたビデオが元のビデオの中に存在するある情報を欠く点で非可逆的であり得る。この結果は、元のビデオを正確に再構築するために不十分な情報しか存在しないので、解凍されたビデオが元の圧縮されていないビデオより低い品質を有し得ることを含み得る。

ビデオ品質と、ビデオを表現するために使用される（例えば、ビットレートによって決定される）データ量と、エンコーディングアルゴリズムおよびデコーディングアルゴリズムの複雑性と、データ損失ならびに誤差に対する感度と、編集のし易さと、ランダムアクセスと、エンドツーエンド遅延（例えば、待機時間）と、同等物との間に、複雑な関係が存在し得る。

ある側面では、デコーダは、回路を含み、回路は、ビットストリームを受信することと、カレントブロックを幾何学的分割モードを介して第１の領域、第２の領域、および第３の領域に分割することと、第１の領域、第２の領域、および第３の領域のうちのある領域と関連付けられる動きベクトルを決定することであって、決定することはさらに、候補リストを構築することを含む、ことと、決定された動きベクトルを使用してカレントブロックをデコードすることとを行うように構成される。

別の側面では、方法は、デコーダがビットストリームを受信することを含む。方法は、デコーダがカレントブロックを幾何学的分割モードを介して第１の領域、第２の領域、および第３の領域に分割することを含む。方法は、デコーダが第１の領域、第２の領域、および第３の領域のうちのある領域と関連付けられる動きベクトルを決定することを含み、決定することは、候補リストを構築することを含む。方法は、デコーダが決定された動きベクトルを使用してカレントブロックをデコードすることを含む。

本明細書に説明される主題の１つ以上の変形例の詳細が、付随の図面および下記の説明に記載される。本明細書に説明される主題の他の特徴および利点が、説明および図面から、ならびに請求項から明白となるであろう。

本発明を例証する目的のために、図面は、本発明の１つ以上の実施形態の側面を示す。しかしながら、本発明が図面に示される精密な配列および手段に限定されないことを理解されたい。

図１は、３つの領域が存在する幾何学的分割を用いた残差ブロック（例えば、カレントブロック）のある例を示す例証である。

図２は、幾何学的分割に従って分割されたある例示的カレントブロックの第１の領域（領域Ｓ０）に関する潜在的空間動きベクトル候補の例示的位置を例証する略図である。

図３は、第１の領域Ｓ０の最も左上のルマ場所を含むルマ場所を示す注釈を伴う図２を例証する。

図４は、幾何学的分割に従って分割されたある例示的カレントブロックの第２の領域Ｓ１に関する潜在的動きベクトル候補の例示的位置を例証する略図である。

図５は、第３の領域Ｓ２の最も左下のルマ場所と、第２の領域Ｓ１の最も右上のルマ場所とを含むルマ場所を示す注釈を伴う図４を例証する。

図６は、幾何学的分割に従って分割されたある例示的カレントブロックの第３の領域（領域Ｓ２）に対する潜在的空間動きベクトル候補の例示的位置を例証する略図である。

図７は、第３の領域Ｓ２の最も左下のルマ場所と、第２の領域Ｓ１の最も右上のルマ場所とを含むルマ場所を示す注釈を伴う図６を例証する。

図８は、適応的な数の領域を伴う幾何学的分割を用いたインター予測を使用してビデオをエンコードすることが可能なある例示的ビデオエンコーダを例証するシステムブロック図である。

図９は、圧縮効率を増加させながらエンコーディング複雑性を低減させることができる、本主題のいくつかの側面による適応的な数の領域を伴う幾何学的分割およびインター予測を用いてビデオをエンコードするある例示的プロセスを例証するプロセスフロー図である。

図１０は、ビデオエンコーディングおよびデコーディングに関する複雑性および処理性能を改良することができる、インター予測および適応的な数の領域を伴う幾何学的分割を使用してビットストリームをデコードすることが可能なある例示的デコーダを例証するシステムブロック図である。

図１１は、ビデオエンコーディングおよびデコーディングに関する複雑性および処理性能を改良することができる、適応的な数の領域を伴う幾何学的分割においてインター予測を使用してビットストリームをデコードするある例示的プロセスを例証するプロセスフロー図である。

図１２は、本明細書に開示される方法のうちのいずれか１つ以上およびそのいずれか１つ以上の部分を実装するために使用されることができるコンピューティングシステムのブロック図である。

図面は、必ずしも縮尺通りではなく、想像線、図式表現、および部分図によって例証され得る。ある事例では、実施形態の理解のためには必要ではない詳細、または他の詳細を知覚困難にする詳細が、省略されている場合がある。種々の図面内の同様の参照記号は、同様の要素を示す。

本主題のいくつかの実装は、長方形ブロックが３つ以上の非長方形領域に分けられ得る、適応的な数の領域を伴う幾何学的分割モードを用いて分割された領域を用いてインター予測を実施することを含む。適応的な数の領域を伴う幾何学的分割を用いて分割された非長方形ブロックを用いてインター予測を実施することは、分割がオブジェクト境界のより近くを辿ることを可能にし、より低い動き補償予測誤差、より小さい残差、したがって、改良された圧縮効率をもたらし得る。インター予測の間、動き補償が、幾何学的分割モードに従って決定されたブロック（例えば、コーディングユニット、予測ユニット等）に関して予測された動きベクトルを使用して実施され得る。動きベクトルは、高度動きベクトル予測（ＡＭＶＰ）を使用して、および／またはマージモードを介して予測され得、動きベクトルは、動きベクトル差をエンコードすることなく、動きベクトル候補のリストから選択される。

本主題は、例えば、１２８×１２８または６４×６４のサイズを有するブロック等の比較的大きいブロックに適用され得る。いくつかの実装では、幾何学的分割は、カレントブロックを所与のカレントブロックに関する３つ以上の領域等の適応的な数の領域に分割することを伴い得、動き情報が、領域毎に決定されることができる。

動き補償は、ビデオにおけるカメラおよび／またはオブジェクトの動きを考慮することによって、以前および／または将来のフレームを前提として、ビデオフレームまたはその一部を予測するためのアプローチを含み得る。これは、ビデオ圧縮のためのビデオデータのエンコーディングおよびデコーディングにおいて、例えば、動画専門家集団（ＭＰＥＧ）－２（アドバンスドビデオコーディング（ＡＶＣ）とも称される）規格を使用するエンコーディングおよびデコーディングにおいて採用され得る。動き補償は、参照ピクチャのカレントピクチャへの変換の観点からピクチャを記述し得る。参照ピクチャは、カレントピクチャと比較したとき、時間的に以前のもの、または将来からのものであり得る。画像が、以前に伝送および／または記憶された画像から正確に合成されることができると、圧縮効率が改良され得る。

ブロック分割は、同様の動きの領域を見出すためのビデオコーディングにおける方法を指し得る。ある形態のブロック分割が、ＭＰＥＧ－２、Ｈ．２６４（ＡＶＣまたはＭＰＥＧ－４Ｐａｒｔ１０とも称される）、およびＨ．２６５（高効率ビデオコーディング（ＨＥＶＣ）とも称される）を含むビデオコーデック規格において見出され得る。例示的ブロック分割アプローチでは、ビデオフレームの非重複ブロックが、同様の動きを有するピクセルを含有するブロック分割を見出すために、長方形サブブロックに分割され得る。本アプローチは、ブロック分割の全てのピクセルが同様の動きを有するときに良好に機能することができる。ブロック内のピクセルの動きは、以前にコーディングされたフレームに対して決定され得る。

動きベクトル予測が、適応的な数の領域を伴う幾何学的分割において効果的に実装され得る。より詳細には、適応的な数の領域を伴う幾何学的分割は、長方形ブロックが非長方形であり得る２つ以上の領域にさらに分けられるビデオエンコーディングおよびデコーディングのための技法を含み得る。例えば、図１は、３つのセグメントＳ０、Ｓ１、およびＳ２が存在する幾何学的分割を用いた残差ブロック（例えば、カレントブロック）１００の例を示す例証である。カレントブロック１００は、６４×６４または１２８×１２８等、Ｍ×Ｎピクセルとして表されるＭピクセルの幅およびＮピクセルの高さを有し得る。カレントブロックは、２つの線セグメント（Ｐ１Ｐ２およびＰ３Ｐ４）に従って幾何学的に分割され得、これは、カレントブロックを３つの領域Ｓ０、Ｓ１、およびＳ２に分け得る。Ｓ０内のピクセルが同様の動きを有するとき、動きベクトルが、その領域内の全てのピクセルの動きを記述し得る。下記により完全に説明されるように、それぞれの動きベクトルが、ＡＭＶＰモードまたはマージモードに従って決定され得る。動きベクトルは、領域Ｓ０を圧縮するために使用され得る。同様に、領域Ｓ１内のピクセルが同様の動きを有するとき、関連付けられる動きベクトルが、領域Ｓ１内のピクセルの動きを記述し得る。同様に、領域Ｓ２内のピクセルが同様の動きを有するとき、関連付けられる動きベクトルが、領域Ｓ２内のピクセルの動きを記述し得る。そのような幾何学的分割は、ビデオビットストリーム内の位置Ｐ１、Ｐ２、Ｐ３、Ｐ４（または極座標、所定のテンプレートの中へのインデックス、または分割の他の特徴付け等を使用したこれらの位置の表現）をエンコードすることによって受信機（例えば、デコーダ）に信号伝達され得る。

継続して図１を参照すると、ピクセルレベルにおける幾何学的分割を利用してビデオデータをエンコードするとき、線セグメントＰ１Ｐ２（またはより具体的には、点Ｐ１およびＰ２）が、決定され得る。ピクセルレベルにおける幾何学的分割を利用するときにブロックを最良に分ける線セグメントＰ１Ｐ２（またはより具体的には、点Ｐ１およびＰ２）を決定するために、点Ｐ１およびＰ２の可能な組み合わせは、ブロック幅および高さであるＭおよびＮに依存する。サイズＭ×Ｎのブロックに関して、（Ｍ－１）×（Ｎ－１）×３の可能な分割が存在する。正しい分割を識別することは、したがって、全ての可能な分割に関する動き推定を評価する演算的に高価なタスクになり得、これは、（例えば、ピクセルレベルにおける幾何学的分割を伴わない）長方形分割を使用するエンコーディングと比較して、ビデオをエンコードするために要求される時間および／または処理能力の量を増加させ得る。最良または正しい分割を成すものは、メトリックに従って決定され得、実装毎に変化し得る。

いくつかの実装では、引き続き図１を参照すると、分割は、２つの領域を形成する第１の分割が決定され得（例えば、線Ｐ１Ｐ２および関連付けられる領域を決定する）、次いで、それらの領域のうちの１つがさらに分割され得る点において、反復的に行われる。例えば、図１を参照して説明される分割は、ブロックを２つの領域に分割するために実施され得る。それらの領域のうちの１つは、（例えば、新しい領域Ｓ１および領域Ｓ２を形成するために）さらに分割され得る。プロセスは、停止基準が達せられるまで、ブロックレベル幾何学的分割を実施し続け得る。

継続して図１を参照すると、インター予測が、幾何学的に分割された領域を使用して実施され得る。動き補償に関する動きベクトルが、ＡＭＶＰまたはマージモードを使用して導出され得る。ＡＭＶＰでは、動きベクトル予測が、動きベクトル候補リストへのインデックスを信号伝達することによって行われ、動きベクトル差（例えば、残差）が、エンコードされ、ビットストリーム内に含まれる。マージモードでは、動きベクトルは、動きベクトル差をエンコードすることなく、動きベクトル候補のリストから選択され、それによって、カレントブロックが、別の以前にデコードされたブロックの動き情報を採用することを可能にする。ＡＭＶＰおよびマージモードの両方において、候補リストが、エンコーダおよびデコーダの両方によって構築され得、候補リストへのインデックスが、ビットストリーム内で信号伝達される。

図２は、幾何学的分割に従って分割されたある例示的カレントブロック２００の第１の領域（領域Ｓ０）に関する潜在的空間動きベクトル候補の位置の非限定的な例を例証する略図である。潜在的空間動きベクトル候補は、ＡＭＶＰモードまたはマージモード中に動きベクトル候補リストを構築するために考慮され得る。カレントブロック２００が、それぞれ、点Ｐ０と点Ｐ１との間、および点Ｐ２と点Ｐ３との間の直線によって、３つの領域Ｓ０、Ｓ１、およびＳ２に分割され得る。領域Ｓ０、領域Ｓ１、および領域Ｓ２の各々は、一方向性または双方向性で予測され得る。例えば図２に例証されるような第１の領域（領域Ｓ０）に関する空間的候補は、左下候補Ａ０、左候補Ａ１、左上候補Ｂ２、上候補Ｂ１、および右上候補Ｂ０を含み得る。

引き続き図２を参照すると、例証されるように、いくつかの実装では、各場所（Ａ０、Ａ１、Ｂ２、Ｂ１、およびＢ０）は、それぞれの場所におけるブロックを表し得る。例えば、左上候補Ｂ２は、領域Ｓ０のすぐ左かつ真上にある場所に存在するブロックであり得、例えば、Ｓ０の左上角のルマ場所が（０，０）である場合、左上候補Ｂ２は、場所（－１，－１）に存在し得る。左下候補Ａ０は、Ｐ１のすぐ左かつ下方に位置し得、例えば、Ｐ１のルマ場所が（Ｐ１ｘ，Ｐ１ｙ）である場合、左下候補Ａ０は、場所（Ｐ１ｘ－１，Ｐ１ｙ＋１）に存在し得る。左候補Ａ１は、Ｐ１のすぐ左に位置し得、例えば、左候補Ａ１は、場所（Ｐ１ｘ－１，Ｐ１ｙ）に存在し得る。上候補Ｂ１は、Ｐ０の真上に位置し得、例えば、Ｐ０のルマ場所が（Ｐ０ｘ，Ｐ０ｙ）である場合、上候補Ｂ１は、（Ｐ０ｘ，Ｐ０ｙ－１）に位置し得る。右上候補Ｂ０は、Ｐ０の真上かつ右に位置し得、例えば、右上候補Ｂ０は、場所（Ｐ０ｘ＋１，Ｐ０ｙ－１）に存在し得る。本開示の全体を精査することで当業者に明白であるように、他の場所が可能である。図３は、第１の領域Ｓ０の最も左上のルマ場所を含むルマ場所を示す注釈を伴う図２を例証する。

いくつかの実装では、引き続き図３を参照すると、領域Ｓ０に関する候補リストを構築するとき、幾何学的分割が存在する場合、そのような分割は異なる動き情報を有するフレーム内の領域（またはオブジェクト）を分割するために実施され得るので、いくつかの潜在的候補が、利用不可能として自動的にマーキングされ、候補リストから除去され得る。故に、それらの候補と関連付けられるブロックは異なる動きを有する別のオブジェクトを表す可能性が高いと推測され得、したがって、これらの候補は、利用不可能として自動的にマーキングされ得る（例えば、さらに考慮されない、候補リストから除去される等）。上記に図２を参照して例証される例では、領域Ｓ０に関して、領域Ｓ０が左下候補Ａ０に位置するブロックと動き情報を共有しない可能性が高くあり得るため、左下候補Ａ０は、利用不可能として自動的にマーキングされ得る。同様に、領域Ｓ０に関して、領域Ｓ０が右上候補Ｂ０に位置するブロックと動き情報を共有しない可能性が高いので、右上候補Ｂ０は、利用不可能として自動的にマーキングされ得る。いくつかの実装では、線セグメントＰ０Ｐ１（または点Ｐ０、Ｐ１）を査定することによって、例えば、線セグメントＰ０Ｐ１の傾きを決定し、線セグメントを左下候補Ａ０ブロックおよび／または右上候補Ｂ０ブロック内へ伸ばし、左下候補Ａ０および／または右上候補Ｂ０が伸ばされた線セグメントの第１の領域Ｓ０と同一の側に存在するかどうかを決定することによって、左下候補Ａ０および／または右上候補Ｂ０が動き情報を共有する可能性が高いかどうかが、決定され得る。

図４は、幾何学的分割に従って分割されたある例示的カレントブロック４００の第２の領域（領域Ｓ１）に関する潜在的空間動きベクトル候補の非限定的な例示的位置を例証する略図である。潜在的空間動きベクトル候補は、ＡＭＶＰモードまたはマージモード中に動きベクトル候補リストを構築するために考慮され得る。カレントブロック４００が、それぞれ、点Ｐ０と点Ｐ１との間、および点Ｐ２と点Ｐ３との間の直線によって、３つの領域Ｓ０、Ｓ１、およびＳ２に分割され得る。領域Ｓ０、領域Ｓ１、および領域Ｓ２の各々は、一方向性または双方向性で予測され得る。第２の領域（領域Ｓ１）に関する空間的候補の非限定的な例が、図４に例証され、左下候補Ａ０、左候補Ａ１、左上候補Ｂ２、上候補Ｂ１、および右上候補Ｂ０を含む。

例証されるように、引き続き図４を参照すると、各場所（Ａ０、Ａ１、Ｂ２、Ｂ１、およびＢ０）は、それぞれの場所におけるブロックを表し得る。例えば、左上候補Ｂ２は、領域Ｓ１の最も左上の場所のすぐ左かつ真上にあるルマ場所に存在するブロックであり得、例えば、Ｓ１の左上角のルマ場所がルマ場所座標（Ｐ０ｘ＋１，Ｐ０ｙ）を有するＰ０に隣接する場合、左上候補Ｂ２は、場所（Ｐ０ｘ，Ｐ０ｙ－１）に存在し得る。左下候補Ａ０は、第３の領域（領域Ｓ２）の最も左下の場所の真下に位置し、例えば、第３の領域（領域Ｓ２）の最も左下の場所が（０，Ｎ－１）に位置する場合、左下候補Ａ０は、場所（０，Ｎ）に存在し得る。左候補Ａ１は、第３の領域（領域Ｓ２）の最も左下の場所のすぐ左に位置し得、例えば、左候補Ａ１は、場所（０，Ｎ－１）に存在し得る。上候補Ｂ１は、領域Ｓ１の最も右上の場所の真上に位置し得、例えば、領域Ｓ１の最も右上の場所が（Ｍ－１，０）に位置する場合、Ｂ１は、場所（Ｍ－１，－１）に存在し得る。右上候補Ｂ０は、領域Ｓ１の最も右上の場所の真上かつ右に位置し得、例えば、右上候補Ｂ０は、場所（Ｍ，－１）に存在し得る。図５は、第３の領域Ｓ２の最も左下のルマ場所と、第２の領域Ｓ１の最も右上のルマ場所とを含むルマ場所を示す注釈を伴う図４を例証する。

いくつかの実装では、引き続き図５を参照すると、領域Ｓ１に関する候補リストを構築するとき、幾何学的分割が存在する場合、そのような分割は、異なる動き情報を有するフレーム内の領域（またはオブジェクト）を分割するために実施され得るので、いくつかの潜在的候補は、利用不可能として自動的にマーキングされ、候補リストから除去され得る。故に、それらの候補と関連付けられるブロックは異なる動きを有する別のオブジェクトを表す可能性が高いと推測され得、したがって、これらの候補は、利用不可能として自動的にマーキングされ得る（例えば、さらに考慮されない、候補リストから除去される等）。上記で図４を参照して例証される非限定的な例では、領域Ｓ１に関して、領域Ｓ１が左上候補Ｂ２に位置するブロックと動き情報を共有しない可能性が高くあり得るので、左上候補Ｂ２は、利用不可能として自動的にマーキングされ得る。同様に、いくつかの実装では、領域Ｓ１に関して、領域Ｓ１が第３の領域Ｓ２であり得る左候補Ａ１に位置するブロックと動き情報を共有しない可能性が高くあり得るので、左候補Ａ１は、利用不可能として自動的にマーキングされ得る。同様に、いくつかの実装では、領域Ｓ１に関して、領域Ｓ１が第３の領域Ｓ２の下方にあり得る左下候補Ａ０に位置するブロックと動き情報を共有しない可能性が高いので、左下候補Ａ０は、利用不可能として自動的にマーキングされ得る。

図６は、幾何学的分割に従って分割されたある例示的カレントブロック６００の第３の領域（領域Ｓ２）に関する潜在的空間動きベクトル候補の例示的位置を例証する略図である。潜在的空間動きベクトル候補は、ＡＭＶＰモードまたはマージモード中に動きベクトル候補リストを構築するために考慮され得る。カレントブロック６００は、それぞれ、点Ｐ０と点Ｐ１との間、および点Ｐ２とＰ３との間の直線によって、３つの領域Ｓ０、Ｓ１、ならびにＳ２に分割され得る。領域Ｓ０、領域Ｓ１、および領域Ｓ２の各々は、一方向性または双方向性で予測され得る。第３の領域（領域Ｓ２）に関する空間的候補の非限定的な例が、図６に例証され、左下候補Ａ０、左候補Ａ１、左上候補Ｂ２、上候補Ｂ１、および右上候補Ｂ０を含み得る。

例証されるように、引き続き図６を参照すると、各場所（Ａ０、Ａ１、Ｂ２、Ｂ１、およびＢ０）は、それぞれの場所におけるブロックを表し得る。例えば、左上候補は、領域Ｓ２の上方かつ左にあるルマ場所に存在するブロックであり得、例えば、左上候補Ｂ２は、第１の領域Ｓ０であり得る。Ｓ０が（０，０）に位置する場合、左上候補Ｂ２は、（０，０）に位置し得る。左下候補Ａ０は、領域Ｓ２の最も左下の場所のすぐ左かつ真下に位置し得、例えば、領域Ｓ２の最も左下の場所が（０，Ｎ－１）に位置する場合、左下候補Ａ０は、（－１，Ｎ）に存在し得る。左候補Ａ１は、領域Ｓ２の最も左下の場所のすぐ左に位置し得、例えば、左候補Ａ１は、（－１，Ｎ－１）に存在し得る。上候補Ｂ１は、領域Ｓ２の上方かつ左に位置し得、点Ｐ１に隣接し得、例えば、Ｐ１が（Ｐ１ｘ，Ｐ１ｙ）に位置する場合、上候補Ｂ１は、（Ｐ１ｘ－１，Ｐ１ｙ）に位置し得る。右上候補Ｂ０は、領域Ｓ２の上方かつ右にあるルマ場所に存在するブロックであり得、例えば、右上候補Ｂ０は、第２の領域Ｓ１であり得る。例えば、右上候補は、（Ｍ－１，０）に存在し得るＳ１の最も右上の場所に位置し得る。図７は、第３の領域Ｓ２の最も左下のルマ場所と、第２の領域Ｓ１の最も右上のルマ場所とを含むルマ場所を示す注釈を伴う図６を例証する。

いくつかの実装では、引き続き図７を参照すると、領域Ｓ２に関する候補リストを構築するとき、幾何学的分割が存在する場合、そのような分割は、異なる動き情報を有するフレーム内の領域（またはオブジェクト）を分割するために実施され得るので、いくつかの潜在的候補は、利用不可能として自動的にマーキングされ、候補リストから除去され得る。故に、それらの候補と関連付けられるブロックは異なる動きを有する別のオブジェクトを表す可能性が高いと推測され得、したがって、これらの候補は、利用不可能として自動的にマーキングされ得る（例えば、さらに考慮されない、候補リストから除去される等）。図６において上記で提供される非限定的な例では、領域Ｓ２に関して、領域Ｓ２が左上候補Ｂ２（例えば、Ｓ０）に位置するブロックと動き情報を共有しない可能性が高いので、左上候補Ｂ２は、利用不可能として自動的にマーキングされ得る。同様に、いくつかの実装では、領域Ｓ２に関して、領域Ｓ２が第２の領域Ｓ１であり得る左候補Ｂ０に位置するブロックと動き情報を共有しない可能性が高いので、右上候補Ａ０は、利用不可能として自動的にマーキングされ得る。同様に、いくつかの実装では、領域Ｓ２に関して、領域Ｓ２が第１の領域Ｓ０の左にある上候補Ｂ１に位置するブロックと動き情報を共有しない可能性が高いので、上候補Ｂ１は、利用不可能として自動的にマーキングされ得る。

図８は、適応的な数の領域を伴う幾何学的分割を用いたインター予測を使用してビデオをエンコードすることが可能なある例示的ビデオエンコーダ８００を例証するシステムブロック図である。例示的ビデオエンコーダ８００は、入力ビデオ８０５を受信し、入力ビデオ８０５は、最初に、ツリー構造化マクロブロック分割スキーム（例えば、クアッドツリープラスバイナリツリー）等の処理スキームに従って、セグメント化されるかまたは分けられ得る。ツリー構造化マクロブロック分割スキームのある例は、ピクチャフレームをコーディングツリーユニット（ＣＴＵ）と呼ばれる大きいブロック要素に分割することを含み得る。いくつかの実装では、各ＣＴＵは、コーディングユニット（ＣＵ）と呼ばれるいくつかのサブブロックに１回以上さらに分割され得る。この分割の最終結果は、予測ユニット（ＰＵ）と呼ばれ得るサブブロックの群を含み得る。変換ユニット（ＴＵ）もまた、利用され得る。そのような分割スキームは、本主題のいくつかの側面に従って適応的な数の領域を伴う幾何学的分割を実施することを含み得る。

引き続き図８を参照すると、例示的ビデオエンコーダ８００は、イントラ予測プロセッサ８１５と、ＡＭＶＰモードおよびマージモードを含む適応的な数の領域を伴う幾何学的分割を支援することが可能な動き推定／補償プロセッサ８２０（インター予測プロセッサとも称される）と、変換／量子化プロセッサ８２５と、逆量子化／逆変換プロセッサ８３０と、ループ内フィルタ８３５と、デコード済ピクチャバッファ８４０と、エントロピーコーディングプロセッサ８４５とを含み得る。いくつかの実装では、動き推定／補償プロセッサ８２０は、ＡＭＶＰモードおよびマージモードの使用を含む適応的な数の領域を伴う幾何学的分割を実施し得る。幾何学的分割モード、ＡＭＶＰモード、およびマージモードを信号伝達するビットストリームパラメータが、出力ビットストリーム８５０内での包含のために、エントロピーコーディングプロセッサ８４５に入力され得る。

動作時、引き続き図８を参照すると、入力ビデオ８０５のフレームのブロック毎に、イントラピクチャ予測を介して、または動き推定／補償を使用して、ブロックを処理すべきかどうかが、決定され得る。ブロックは、イントラ予測プロセッサ８１０または動き推定／補償プロセッサ８２０に提供され得る。ブロックがイントラ予測を介して処理されるべきである場合、イントラ予測プロセッサ８１０は、処理を実施し、予測子を出力し得る。ブロックが、動き推定／補償を介して処理されるべきである場合、動き推定／補償プロセッサ８２０は、ＡＭＶＰモードおよびマージモードを用いた幾何学的分割の使用を含む処理を実施し、予測子を出力し得る。

継続して図８を参照すると、残差が、入力ビデオから予測子を減算することによって形成され得る。残差は、変換／量子化プロセッサ８２５によって受信され得、これは、変換処理（例えば、離散コサイン変換（ＤＣＴ））を実施して係数を生成し得、係数は、量子化され得る。量子化された係数および任意の関連付けられる信号伝達情報が、エントロピーエンコーディングおよび出力ビットストリーム８５０内での包含のために、エントロピーコーディングプロセッサ８４５に提供され得る。エントロピーエンコーディングプロセッサ８４５は、幾何学的分割モード、ＡＭＶＰモード、およびマージモードに関連する信号伝達情報のエンコーディングを支援し得る。加えて、量子化された係数は、逆量子化／逆変換プロセッサ８３０に提供され得、逆量子化／逆変換プロセッサ８３０は、ピクセルを再現し得、ピクセルは、予測子と組み合わせられ、ループ内フィルタ８３５によって処理され得、その出力は、幾何学的分割モード、ＡＭＶＰモード、およびマージモードを支援することが可能である動き推定／補償プロセッサ８２０による使用のために、デコード済ピクチャバッファ８４０内に記憶され得る。

図９は、圧縮効率を増加させながらエンコーディング複雑性を低減させ得る本主題のいくつかの側面による幾何学的分割インター予測を用いてビデオをエンコードするある例示的プロセス３００を例証するプロセスフロー図である。ステップ９１０において、ビデオフレームが、例えば、ピクチャフレームをＣＴＵおよびＣＵに分割することを含み得るツリー構造化マクロブロック分割スキームを使用して、初期ブロックセグメント化を受け得る。ステップ９２０において、ブロックが、適応的な数の領域を伴う幾何学的分割のために選択され得る。選択は、ブロックが幾何学的分割モードに従って処理されるべきであることをメトリックルールに従って識別することを含み得る。

ステップ９３０において、引き続き図９を参照すると、３つ以上の領域を伴う幾何学的分割が、決定され得る。それぞれの領域の各々の中のピクセル（例えば、ルマサンプル）が、同様の動きを有し、他の領域（例えば、領域１）内のピクセルの動きと異なり得るように、それらのフレーム間の動きに従ってブロック内に含有されるピクセルを３つ以上の領域（例えば、領域０、領域１、および領域２）に分離する少なくとも２つの線セグメントが、決定され得る。

ステップ９４０において、継続して図９を参照すると、各領域の動き情報が、ＡＭＶＰモードまたはマージモードを使用して決定および処理され得る。ＡＭＶＰモードを使用して領域を処理するとき、候補リストが、上記に説明される空間的候補を含み得る空間的候補および時間的候補の両方を考慮することによって構築され得、これは、利用不可能としていくつかの候補をマーキングすることを含み得る。動きベクトルが、動きベクトル予測として動きベクトル候補のリストから選択され得、動きベクトル差（例えば、残差）が、算出され得る。候補リストへのインデックスが、決定され得る。マージモードでは、候補リストが、上記に説明されるような空間的候補を含み得る空間的候補および時間的候補の両方を考慮することによって構築され得、これは、利用不可能としていくつかの候補をマーキングすることを含み得る。動きベクトルは、領域が別のブロックの動き情報を採用するために、動きベクトル候補のリストから選択され得る。候補リストへのインデックスが、決定され得る。

ステップ９５０において、引き続き図９を参照すると、決定された幾何学的分割および動き情報が、ビットストリーム内で信号伝達され得る。ビットストリーム内で幾何学的分割を信号伝達することは、例えば、Ｐ０、Ｐ１、Ｐ２、Ｐ３の場所、１つ以上の所定のテンプレートへのインデックス、および同等物を含めることを含み得る。ＡＭＶＰを使用して領域を処理するときの動き情報の信号伝達は、ビットストリーム内に動きベクトル差（例えば、残差）および動きベクトル候補へのインデックスを含めることを含み得る。マージモードを使用して領域を処理するときの動き情報を信号伝達することは、ビットストリーム内に動きベクトル候補へのインデックスを含めることを含み得る。

図１０は、ビデオエンコーディングおよびデコーディングに関する複雑性および処理性能を改良し得る、インター予測および適応的な数の領域を伴う幾何学的分割を使用してビットストリーム１０７０をデコードすることが可能なある例示的デコーダ１０００を例証するシステムブロック図である。デコーダ１０００は、エントロピーデコーダプロセッサ１０１０と、逆量子化および逆変換プロセッサ１０２０と、デブロッキングフィルタ１０３０と、フレームバッファ１０４０と、動き補償プロセッサ１０５０と、イントラ予測プロセッサ１０６０とを含み得る。いくつかの実装では、ビットストリーム１０７０は、幾何学的分割モード、ＡＭＶＰモード、および／またはマージモードを信号伝達するパラメータを含み得る。動き補償プロセッサ１０５０は、本明細書に説明されるような幾何学的分割を使用してピクセル情報を再構築し得る。

動作時、引き続き図１０を参照すると、ビットストリーム１０７０が、デコーダ１０００によって受信され、エントロピーデコーダプロセッサ１０１０に入力され得、エントロピーデコーダプロセッサ１０１０は、ビットストリームを量子化された係数にエントロピーデコードし得る。量子化された係数は、逆量子化および逆変換プロセッサ１０２０に提供され得、逆量子化および逆変換プロセッサ１０２０は、逆量子化および逆変換を実施し、残差信号を作成し得る。残差信号は、処理モードに従って、動き補償プロセッサ１０５０またはイントラ予測プロセッサ１０６０の出力に追加され得る。動き補償プロセッサ１０５０およびイントラ予測プロセッサ１０６０の出力は、以前にデコードされたブロックに基づくブロック予測を含み得る。予測および残差の合計が、デブロッキングフィルタ１０３０によって処理され、フレームバッファ１０４０内に記憶され得る。所与のブロック（例えば、ＣＵまたはＰＵ）に関して、ビットストリーム１０７０が、分割モードが幾何学的分割であることを信号伝達するとき、動き補償プロセッサ１０５０は、本明細書に説明される幾何学的分割アプローチに基づいて、予測を構築し得る。

図１１は、ビデオエンコーディングおよびデコーディングに関する複雑性および処理性能を改良し得る、適応的な数の領域を伴う幾何学的分割におけるインター予測を使用してビットストリームをデコードするある例示的プロセス１１００を例証するプロセスフロー図である。ステップ１１１０において、カレントブロック（例えば、ＣＴＵ、ＣＵ、ＰＵ）を含み得るビットストリームが、受信される。受信することは、ビットストリームからカレントブロックおよび関連付けられる信号伝達情報を抽出および／または解析することを含み得る。デコーダは、幾何学的分割を特徴付ける１つ以上のパラメータを抽出または決定し得る。これらのパラメータは、例えば、線セグメント（例えば、Ｐ０、Ｐ１、Ｐ２、Ｐ３）の始点および終点のインデックスを含み得る。抽出または決定は、ビットストリームからパラメータを識別し、読み出すこと（例えば、ビットストリームを解析すること）を含み得る。

ステップ１１２０において、引き続き図１１を参照すると、カレントブロックの第１の領域、第２の領域、および第３の領域が、幾何学的分割モードに従って決定され得る。決定することは、幾何学的分割モードがカレントブロックに関して有効化される（例えば、真である）かどうかを決定することを含むことができる。幾何学的分割モードが有効化されない（例えば、偽である）場合、デコーダは、代替分割モードを使用してブロックを処理し得る。幾何学的分割モードが有効化される（例えば、真である）場合、３つ以上の領域が、決定および／または処理され得る。

ステップ１１３０において、引き続き図１１を参照すると、第１の領域、第２の領域、および第３の領域のうちのある領域と関連付けられる動きベクトルが、決定され得る。動きベクトルを決定することは、領域の動き情報がＡＭＶＰモードを使用して決定されるべきであるか、またはマージモードを使用して決定されるべきであるかを決定することを含み得る。ＡＭＶＰモードを使用して領域を処理するとき、候補リストが、上記に説明される空間的候補を含み得る空間的候補および時間的候補の両方を考慮することによって構築され得、これは、利用不可能としていくつかの候補をマーキングすることを含み得る。動きベクトルが、動きベクトル予測として動きベクトル候補のリストから選択され得、動きベクトル差（例えば、残差）が算出され得る。マージモードでは、決定することは、領域毎に空間的候補および時間的候補の候補リストを構築することを含み得る。候補リストを構築することは、利用不可能として候補を自動的にマーキングし、候補リストから利用不可能な候補を除去することを含み得る。構築された候補リストへのインデックスが、ビットストリームから解析され、候補リストから最終候補を選択するために使用され得る。カレント領域に関する動き情報が、最終候補の動き情報と同一であると決定されることができる（例えば、領域に関する動きベクトルは、最終候補から採用されることができる）。

引き続き図１１を参照すると、ステップ１１４０において、カレントブロックが、決定された動きベクトルを使用してデコードされ得る。

いくつかの変形例が、上記に詳細に説明されたが、他の修正または追加が可能である。例えば、幾何学的分割は、エンコーダにおけるレート歪み決定に基づいて、ビットストリーム内で信号伝達され得る。コーディングは、通常の所定の分割（例えば、テンプレート）、分割の時間的予測および空間的予測、ならびに／または付加的オフセットの組み合わせに基づき得る。各々の幾何学的に分割された領域は、動き補償された予測またはイントラ予測を利用し得る。予測された領域の境界は、残差が追加される前に平滑化され得る。

いくつかの実装では、クアッドツリープラスバイナリディシジョンツリー（ＱＴＢＴ）が、実装され得る。ＱＴＢＴでは、コーディングツリーユニットレベルにおいて、ＱＴＢＴの分割パラメータが、いかなるオーバーヘッドも伝送することなく、局所的特性に適合するように動的に導出され得る。続けて、コーディングユニットレベルにおいて、ジョイント分類器ディシジョンツリー構造が、不必要な反復を排除し、誤った予測のリスクを制御し得る。いくつかの実装では、適応的な数の領域を伴う幾何学的分割は、ＱＴＢＴの全てのリーフノードにおいて利用可能な付加的分割オプションとして利用可能であり得る。

いくつかの実装では、デコーダは、分割プロセッサを含み、分割プロセッサは、カレントブロックに関する幾何学的分割を発生させ、従属するプロセスに関する全ての分割関連情報を提供し得る。動き補償は、ブロックが幾何学的に分割される場合にセグメント毎に実施され得るので、分割プロセッサは、動き補償に直接影響を及ぼし得る。さらに、分割プロセッサは、形状情報をイントラ予測プロセッサおよび変換コーディングプロセッサに提供し得る。

いくつかの実装では、付加的シンタックス要素が、ビットストリームの異なる階層レベルにおいて信号伝達され得る。シーケンス全体に関して適応的な数の領域を伴う幾何学的分割を有効化するために、有効化フラグが、シーケンスパラメータセット（ＳＰＳ）においてコーディングされ得る。さらに、任意のコーディングユニット（ＣＵ）が適応的な数の領域を伴う幾何学的分割を使用するかどうかを示すために、ＣＴＵフラグが、コーディングツリーユニット（ＣＴＵ）レベルにおいてコーディングされることができる。カレントコーディングユニットが適応的な数の領域を伴う幾何学的分割を利用するかどうかを示すために、ＣＵフラグがコーディングされることができる。ブロック上の線セグメントを規定するパラメータが、コーディングされ得る。領域毎に、カレント領域がインター予測されるかまたはイントラ予測されるかを規定し得るフラグが、デコードされ得る。

いくつかの実装では、最小領域サイズが、規定されることができる。

本明細書に説明される主題は、多くの技術的利点を提供する。例えば、本主題のいくつかの実装は、圧縮効率を増加させながら複雑性を低減させるブロックの分割を提供することができる。いくつかの実装では、オブジェクト境界におけるブロッキングアーチファクトが、低減させられることができる。

本明細書に説明される側面および実施形態のうちの任意の１つ以上のものが、コンピュータ技術分野の当業者に明白であるように、本明細書の教示に従ってプログラムされた１つ以上の機械（例えば、電子ドキュメントのためのユーザコンピューティングデバイスとして利用される１つ以上のコンピューティングデバイス、ドキュメントサーバ等の１つ以上のサーバデバイス等）において実現および／または実装されるデジタル電子回路、集積回路、専用に設計された特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）コンピュータハードウェア、ファームウェア、ソフトウェア、および／またはそれらの組み合わせを使用して、便宜的に実装され得ることに留意されたい。これらの種々の側面または特徴は、少なくとも１つのプログラム可能なプロセッサを含むプログラム可能なシステム上で実行可能かつ／または解読可能である１つ以上のコンピュータプログラムおよび／またはソフトウェア内での実装を含み得、少なくとも１つのプログラム可能なプロセッサは、専用目的もしくは汎用目的であり得、専用目的もしくは汎用目的であり得、データおよび命令を、ストレージシステム、少なくとも１つの入力デバイス、および少なくとも１つの出力デバイスから受信し、データおよび命令をそれらに伝送するように結合される。適切なソフトウェアコーディングが、ソフトウェア技術分野の当業者に明白であるように、本開示の教示に基づいて、熟練のプログラマによって容易に準備され得る。ソフトウェアおよび／またはソフトウェアモジュールを採用する上記に議論される側面および実装もまた、ソフトウェアおよび／またはソフトウェアモジュールの機械実行可能命令の実装を補助するために適切なハードウェアを含み得る。

そのようなソフトウェアは、機械可読記憶媒体を採用するコンピュータプログラム製品であり得る。機械可読記憶媒体は、機械（例えば、コンピューティングデバイス）による実行のための命令のシーケンスを記憶および／またはエンコードすることが可能であり、かつ機械に本明細書に説明される方法および／または実施形態の任意の１つを実施させる任意の媒体であり得る。機械可読記憶媒体の例は、限定ではないが、磁気ディスク、光ディスク（例えば、ＣＤ、ＣＤ－Ｒ、ＤＶＤ、ＤＶＤ－Ｒ等）、光磁気ディスク、読取専用メモリ「ＲＯＭ」デバイス、ランダムアクセスメモリ「ＲＡＭ」デバイス、磁気カード、光学カード、ソリッドステートメモリデバイス、ＥＰＲＯＭ、ＥＥＰＲＯＭ、プログラマブル論理デバイス（ＰＬＤ）、および／またはそれらの任意の組み合わせを含む。機械可読媒体は、本明細書で使用される場合、単一の媒体、ならびに、例えばコンピュータメモリとの組み合わされたコンパクトディスクもしくは１つ以上のハードディスクドライブの集合等の物理的に分離した媒体の集合を含むように意図されている。本明細書で使用される場合、機械可読記憶媒体は、信号伝送の一過性形態を含まない。

そのようなソフトウェアはまた、搬送波等のデータキャリア上のデータ信号として搬送される情報（例えば、データ）を含み得る。例えば、機械実行可能情報は、信号が機械（例えば、コンピューティングデバイス）による実行のために命令のシーケンスまたはその一部をエンコードするデータキャリアにおいて具現化されるデータ搬送信号、ならびに機械に本明細書に説明される方法および／または実施形態の任意の１つを実施させる任意の関連する情報（例えば、データ構造およびデータ）として含まれ得る。

コンピューティングデバイスの例は、限定ではないが、電子書籍読書デバイス、コンピュータワークステーション、端末コンピュータ、サーバコンピュータ、ハンドヘルドデバイス（例えば、タブレット型コンピュータ、スマートフォン等）、ウェブ装置、ネットワークルータ、ネットワークスイッチ、ネットワークブリッジ、機械よってとられるべきアクションを規定する命令のシーケンスを実行することが可能である任意の機械、およびそれらの任意の組み合わせを含む。一例では、コンピューティングデバイスは、キオスクを含み、かつ／またはその中に含まれ得る。

図１２は、コントロールシステムに本開示の側面および／または方法のうちの任意の１つ以上のものを実施させるための命令のセットが実行され得るコンピュータシステム１２００の例示的形態としてのコンピューティングデバイスの一実施形態の図式表現を示す。複数のコンピューティングデバイスが、デバイスのうちの１つ以上に、本開示の側面および／または方法のうちの任意の１つ以上を実施させるために専用に構成された命令のセットを実装するために利用され得ることも、考えられる。コンピュータシステム１２００は、プロセッサ１２０４と、メモリ１２０８とを含み、プロセッサ１２０４およびメモリ１２０８は、バス１２１２を介して相互に、および他の構成要素と通信する。バス１２１２は、限定ではないが、種々のバスアーキテクチャのうちのいずれかを使用するメモリバス、メモリコントローラ、周辺バス、ローカルバス、およびそれらの任意の組み合わせを含むいくつかのタイプのバス構造のうちのいずれかを含み得る。

メモリ１２０８は、限定ではないが、ランダムアクセスメモリ構成要素、読取専用構成要素、およびそれらの任意の組み合わせを含む種々の構成要素（例えば、機械可読媒体）を含み得る。一例では、起動中等にコンピュータシステム１２００内の要素間で情報を転送することに役立つ基本ルーチンを含む基本入力／出力システム１２１６（ＢＩＯＳ）が、メモリ１２０８の中に記憶され得る。メモリ１２０８はまた、本開示の側面および／または方法のうちの任意の１つ以上を具現化する命令（例えば、ソフトウェア）１２２０を含み得る（例えば、１つ以上の機械可読媒体上に記憶されている）。別の例では、メモリ１２０８はさらに、限定ではないが、オペレーティングシステム、１つ以上のアプリケーションプログラム、他のプログラムモジュール、プログラムデータ、およびそれらの任意の組み合わせを含む任意の数のプログラムモジュールを含み得る。

コンピュータシステム１２００はまた、記憶デバイス１２２４を含み得る。記憶デバイス（例えば、記憶デバイス１２２４）の例は、限定ではないが、ハードディスクドライブ、磁気ディスクドライブ、光学媒体と組み合わせられた光ディスクドライブ、ソリッドステートメモリデバイス、およびそれらの任意の組み合わせを含む。記憶デバイス１２２４は、適切なインターフェース（図示せず）によってバス１２１２に接続され得る。例示的インターフェースは、限定ではないが、ＳＣＳＩ、アドバンスト・テクノロジー・アタッチメント（ＡＴＡ）、シリアルＡＴＡ、ユニバーサルシリアルバス（ＵＳＢ）、ＩＥＥＥ１３９４（ＦＩＲＥＷＩＲＥ（登録商標））、およびそれらの任意の組み合わせを含む。一例では、記憶デバイス１２２４（または１つ以上のその構成要素）は、（例えば、外部ポートコネクタ（図示せず）を介して）コンピュータシステム１２００と除去可能にインターフェース接続され得る。特に、記憶デバイス１２２４および関連付けられた機械可読媒体１２２８は、コンピュータシステム１２００のための機械可読命令、データ構造、プログラムモジュール、ならびに／または、他のデータの不揮発性記憶装置および／または揮発性記憶装置を提供し得る。一例では、ソフトウェア１２２０は、完全に、または部分的に、機械可読媒体１２２８内に常駐し得る。別の例では、ソフトウェア１２２０は、完全に、または部分的に、プロセッサ１２０４内に常駐し得る。

コンピュータシステム１２００はまた、入力デバイス１２３２を含み得る。一例では、コンピュータシステム１２００のユーザは、入力デバイス１２３２を介してコンピュータシステム１２００内にコマンドおよび／または他の情報を打ち込み得る。入力デバイス１２３２の例は、限定ではないが、英数字入力デバイス（例えば、キーボード）、ポインティングデバイス、ジョイスティック、ゲームパッド、オーディオ入力デバイス（例えば、マイクロホン、音声応答システム等）、カーソル制御デバイス（例えば、マウス）、タッチパッド、光学スキャナ、ビデオ捕捉デバイス（例えば、静止カメラ、ビデオカメラ）、タッチスクリーン、およびそれらの任意の組み合わせを含む。入力デバイス１２３２は、限定ではないが、シリアルインターフェース、パラレルインターフェース、ゲームポート、ＵＳＢインターフェース、ＦＩＲＥＷＩＲＥ（登録商標）インターフェース、バス１２１２への直接的インターフェース、およびそれらの任意の組み合わせを含む種々のインターフェース（図示せず）のうちのいずれかを介して、バス１２１２にインターフェース接続され得る。入力デバイス１２３２は、タッチスクリーンインターフェースを含み得、タッチスクリーンインターフェースは、さらに下記に議論されるディスプレイ１２３６の一部であるか、またはそれと別個であり得る。入力デバイス１２３２は、上記に説明されるようなグラフィカルインターフェースにおいて１つ以上のグラフィック表現を選択するためのユーザ選択デバイスとして利用され得る。

ユーザはまた、記憶デバイス１２２４（例えば、リムーバブルディスクドライブ、フラッシュドライブ等）および／またはネットワークインターフェースデバイス１２４０を介してコマンドおよび／または他の情報をコンピュータシステム１２００に入力し得る。ネットワークインターフェースデバイス１２４０等のネットワークインターフェースデバイスは、ネットワーク１２４４等の種々のネットワークのうちの１つ以上、およびそれに接続される１つ以上の遠隔デバイス１２４８にコンピュータシステム１２００を接続するために利用され得る。ネットワークインターフェースデバイスの例は、限定ではないが、ネットワークインターフェースカード（例えば、モバイルネットワークインターフェースカード、ＬＡＮカード）、モデム、およびそれらの任意の組み合わせを含む。ネットワークの例は、限定ではないが、ワイドエリアネットワーク（例えば、インターネット、企業ネットワーク）、ローカルエリアネットワーク（例えば、オフィス、建物、キャンパス、または他の比較的小さい地理的空間に関連付けられたネットワーク）、電話ネットワーク、電話／音声プロバイダと関連付けられたデータネットワーク（例えば、モバイル通信プロバイダのデータおよび／または音声ネットワーク）、２つのコンピューティングデバイス間の直接的接続、ならびにそれらの任意の組み合わせを含む。ネットワーク１２４４等のネットワークは、有線モードおよび／または無線のモードの通信を採用し得る。概して、任意のネットワークトポロジが使用され得る。情報（例えば、データ、ソフトウェア１２２０等）が、ネットワークインターフェースデバイス１２４０を介して、コンピュータシステム１２００に、および／またはコンピュータシステム１２００から通信され得る。

コンピュータシステム１２００はさらに、ディスプレイデバイス１２３６等のディスプレイデバイスに表示可能な画像を通信するためのビデオディスプレイアダプタ１２５２を含み得る。ディスプレイデバイスの例は、限定ではないが、液晶ディスプレイ（ＬＣＤ）、陰極線管（ＣＲＴ）、プラズマディスプレイ、発光ダイオード（ＬＥＤ）ディスプレイ、およびそれらの任意の組み合わせを含む。ディスプレイアダプタ１２５２およびディスプレイデバイス１２３６は、本開示の側面のグラフィック表現を提供するためにプロセッサ１２０４と組み合わせて利用され得る。ディスプレイデバイスに加えて、コンピュータシステム１２００は、限定ではないが、オーディオスピーカ、プリンタ、およびそれらの任意の組み合わせを含む１つ以上の他の周辺出力デバイスを含み得る。そのような周辺出力デバイスは、周辺インターフェース１２５６を介してバス１２１２に接続され得る。周辺インターフェースの例は、限定ではないが、シリアルポート、ＵＳＢ接続、ＦＩＲＥＷＩＲＥ（登録商標）接続、パラレル接続、およびそれらの任意の組み合わせを含む。

前述は、本発明の例証的実施形態の詳細な説明である。種々の修正および追加が、本発明の精神および範囲から逸脱することなく成され得る。上記に説明される種々の実施形態の各々の特徴が、関連付けられた新しい実施形態において複数の特徴の組み合わせを提供するために、適宜、他の説明される実施形態の特徴と組み合わせられ得る。さらに、前述は、いくつかの別個の実施形態を説明するが、本明細書に説明されているものは、本発明の原理の適用を例証するにすぎない。加えて、本明細書における特定の方法は、具体的な順序で実施されるものとして例証および／または説明され得るが、順序は、本明細書に開示されるような実施形態を達成するために、通常の技術内で大いに変更可能である。故に、本説明は、例としてのみ捉えられることを意図されており、別様に本発明の範囲を限定するようには意図されていない。

上記の説明において、および請求項において、「～のうちの少なくとも１つ」または「～のうちの１つ以上」等の語句が生じ、要素または特徴の接続的列挙が後に続き得る。用語「および／または」もまた、２つ以上の要素または特徴の列挙内に生じ得る。そのような語句が使用される文脈によって別様に暗示的または明示的に否定されない限り、これは、個々に列挙される要素もしくは特徴のいずれか、または他の記載される要素もしくは特徴のいずれかと組み合わせて記載される要素もしくは特徴のいずれかを意味することが意図されている。例えば、語句「ＡおよびＢのうちの少なくとも一方」、「ＡおよびＢのうちの１つ以上」、ならびに「Ａおよび／またはＢ」は、各々、「Ａのみ、Ｂのみ、またはＡおよびＢともに」を意味することが意図されている。同様の解釈が、３つ以上のアイテムを含む列挙に関しても意図されている。例えば、語句「Ａ、Ｂ、およびＣのうちの少なくとも１つ」、「Ａ、Ｂ、およびＣのうちの１つ以上」、ならびに「Ａ、Ｂ、および／またはＣ」は、各々、「Ａのみ、Ｂのみ、Ｃのみ、ＡおよびＢともに、ＡおよびＣともに、ＢおよびＣともに、またはＡおよびＢおよびＣともに」を意味することが意図されている。加えて、上記および請求項内での用語「～に基づいて」の使用は、記載されていない特徴または要素も許容可能であるように、「少なくとも、～に基づいて」を意味することが意図されている。

本明細書に説明される主題は、所望の構成に応じて、システム、装置、方法、および／または物品として具現化されることができる。前述の説明に記載される実装は、本明細書に説明される主題と一貫した全実装を表すわけではない。代わりに、それらは、単に説明される主題に関連する側面と一貫するいくつかの例にすぎない。いくつかの変更が、上記で詳細に説明されているが、他の修正または追加も、可能である。特に、さらなる特徴および／または変更が、本明細書に記載されるものに加えて提供され得る。例えば、上記で説明される実装は、開示される特徴の種々の組み合わせおよび副次的組み合わせおよび／または上記に開示されるいくつかのさらなる特徴の組み合わせおよび副次的組み合わせを対象とし得る。加えて、付随の図に描写され、かつ／または本明細書に説明される論理フローは、望ましい結果を達成するために、必ずしも、示される特定の順序または連続的順序を要求しない。他の実装も、以下の請求項の範囲内にあり得る。

Claims

デコーダであって、前記デコーダは、回路を備え、前記回路は、
ビットストリームを受信することと、
カレントブロックを幾何学的分割モードを介して第１の領域、第２の領域、および第３の領域に分割することと、
前記第１の領域、前記第２の領域、および前記第３の領域のうちのある領域と関連付けられる動きベクトルを決定することであって、決定することはさらに、候補リストを構築することを含む、ことと、
前記決定された動きベクトルを使用して、前記カレントブロックをデコードすることと
を行うように構成される、デコーダ。
前記候補リストを構築することは、左下候補、左候補、左上候補、上候補、および右上候補を評価することを含む、請求項１に記載のデコーダ。
前記決定された動きベクトルは、前記第１の領域に関しており、
前記幾何学的分割モードは、第１のルマ場所と第２のルマ場所との間の線セグメントを含み、
前記左下候補は、前記第２のルマ場所のすぐ左かつ真下の第３のルマ場所に位置し、
前記左候補は、前記第２のルマ場所のすぐ左の第４のルマ場所に位置し、
前記左上候補は、前記第１の領域の最も左上のルマ場所の真上かつすぐ左の第５のルマ場所に位置し、
前記上候補は、前記第１のルマ場所の真上の第６のルマ場所に位置し、
前記右上候補は、前記第１のルマ場所の真上かつ右の第７のルマ場所に位置する、請求項２に記載のデコーダ。
前記決定された動きベクトルは、前記第２の領域に関しており、
前記幾何学的分割モードは、第１のルマ場所と第２のルマ場所との間の線セグメントを含み、
前記左下候補は、前記第３の領域の最も左下のルマ場所のすぐ左かつ真下の第３のルマ場所に位置し、
前記左候補は、前記第３の領域の最も左下のルマ場所のすぐ左の第４のルマ場所に位置し、
前記左上候補は、前記第１の場所の真上の第５のルマ場所に位置し、
前記上候補は、前記第２の領域の最も右上のルマ場所の真上の第６のルマ場所に位置し、
前記右上候補は、前記第２の領域の最も右上のルマ場所の真上かつ右の第７のルマ場所に位置する、請求項２に記載のデコーダ。
前記決定された動きベクトルは、前記第３の領域に関しており、
前記幾何学的分割モードは、第１のルマ場所と第２のルマ場所との間の線セグメントを含み、
前記左下候補は、前記第３の領域の最も左下のルマ場所のすぐ左かつ真下の第３のルマ場所に位置し、
前記左候補は、前記第３の領域の最も左下のルマ場所のすぐ左の第４のルマ場所に位置し、
前記左上候補は、前記第１の領域と同一位置にある第５のルマ場所に位置し、
前記上候補は、前記第２の場所のすぐ左の第６のルマ場所に位置し、
前記右上候補は、前記第２の領域と並列させられた第７のルマ場所に位置する、請求項２に記載のデコーダ。
前記決定された動きベクトルは、前記第２の領域に関しており、前記デコーダはさらに、候補が前記第３の領域と同一位置にあることを決定することに応答して、前記候補を利用不可能としてマーキングするように構成される、請求項２に記載のデコーダ。
前記決定された動きベクトルは、前記第２の領域に関しており、
前記デコーダはさらに、前記幾何学的分割モードが有効化されることを決定することに応答して、前記左上候補を利用不可能として自動的にマーキングするように構成される、請求項２に記載のデコーダ。
前記決定された動きベクトルは、前記第３の領域に関しており、
前記デコーダはさらに、前記幾何学的分割モードが有効化されることを決定することに応答して、前記右上候補を利用不可能として自動的にマーキングするように構成される、請求項２に記載のデコーダ。
前記決定された動きベクトルは、前記第３の領域に関しており、
前記デコーダはさらに、前記幾何学的分割モードが有効化されることを決定することに応答して、前記左上候補を自動的に利用不可能としてマーキングするように構成される、請求項２に記載のデコーダ。
マージモードが前記第１の領域に関して有効化されることを決定するようにさらに構成される、請求項１に記載のデコーダ。
高度動きベクトル予測モードが前記第１の領域に関して有効化されることを決定するようにさらに構成される、請求項１に記載のデコーダ。
前記カレントブロックのピクセルデータを再構築するようにさらに構成される、請求項１に記載のデコーダ。
前記第１の領域および前記第２の領域は、非長方形である、請求項１２に記載のデコーダ。
前記幾何学的分割モードは、前記ビットストリーム内で信号伝達される、請求項１に記載のデコーダ。
前記カレントブロックを前記幾何学的分割モードを介して前記第１の領域、前記第２の領域、および前記第３の領域に分割することは、第１のルマ場所および第２のルマ場所によって特徴付けられる線セグメントを用いて前記カレントブロックを分割することを含む、請求項１に記載のデコーダ。
前記幾何学的分割モードが有効化されるかどうかを決定することと、
前記カレントブロックに関する第１の線セグメントを決定することと、
前記カレントブロックに関する第２の線セグメントを決定することと
を行うようにさらに構成され、
前記カレントブロックのデコーディングは、前記第１の線セグメントおよび前記第２の線セグメントを使用してピクセルデータを再構築することを含み、
前記第１の線セグメントおよび前記第２の線セグメントが、前記カレントブロックを前記第１の領域、前記第２の領域、および前記第３の領域に分割する、請求項１に記載のデコーダ。
前記幾何学的分割モードは、６４×６４ルマサンプル以上、または１２８×１２８ルマサンプル以上のブロックサイズに関して利用可能である、請求項１に記載のデコーダ。
前記ビットストリームを受信し、前記ビットストリームを量子化された係数にデコードするように構成されるエントロピーデコーダプロセッサと、
逆離散コサイン変換を実施することを含め、前記量子化された係数を処理するように構成される逆量子化および逆変換プロセッサと、
デブロッキングフィルタと、
フレームバッファと、
イントラ予測プロセッサと
をさらに備える、請求項１に記載のデコーダ。
前記ビットストリームは、前記幾何学的分割モードが前記カレントブロックに関して有効化されるかどうかを示すパラメータを含む、請求項１に記載のデコーダ。
前記カレントブロックは、クアッドツリープラスバイナリディシジョンツリーの一部を形成する、請求項１に記載のデコーダ。
前記カレントブロックは、前記クアッドツリープラスバイナリディシジョンツリーの非リーフノードである、請求項２０に記載のデコーダ。
前記カレントブロックは、コーディングツリーユニットまたはコーディングユニットである、請求項１に記載のデコーダ。
前記第１の領域は、コーディングユニットまたは予測ユニットである、請求項１に記載のデコーダ。
方法であって、前記方法は、
デコーダが、ビットストリームを受信することと、
前記デコーダが、カレントブロックを幾何学的分割モードを介して第１の領域、第２の領域、および第３の領域に分割することと、
前記デコーダが、前記第１の領域、前記第２の領域、および前記第３の領域のうちのある領域と関連付けられる動きベクトルを決定することであって、前記決定することは、候補リストを構築することを含む、ことと、
前記デコーダが、前記決定された動きベクトルを使用して、前記カレントブロックをデコードすることと
を含む、方法。
前記候補リストを構築することは、左下候補、左候補、左上候補、上候補、および右上候補を評価することを含む、請求項２４に記載の方法。
前記決定された動きベクトルは、前記第１の領域に関しており、
前記幾何学的分割モードは、第１のルマ場所と第２のルマ場所との間の線セグメントを含み、
前記左下候補は、前記第２のルマ場所のすぐ左かつ真下の第３のルマ場所に位置し、
前記左候補は、前記第２のルマ場所のすぐ左の第４のルマ場所に位置し、
前記左上候補は、前記第１の領域の最も左上のルマ場所の真上かつすぐ左の第５のルマ場所に位置し、
前記上候補は、前記第１のルマ場所の真上の第６のルマ場所に位置し、
前記右上候補は、前記第１のルマ場所の真上かつ右の第７のルマ場所に位置する、請求項２５に記載の方法。
前記決定された動きベクトルは、前記第２の領域に関しており、
前記幾何学的分割モードは、第１のルマ場所と第２のルマ場所との間の線セグメントを含み、
前記左下候補は、前記第３の領域の最も左下のルマ場所のすぐ左かつ真下の第３のルマ場所に位置し、
前記左候補は、前記第３の領域の最も左下のルマ場所のすぐ左の第４のルマ場所に位置し、
前記左上候補は、前記第１の場所の真上の第５のルマ場所に位置し、
前記上候補は、前記第２の領域の最も右上のルマ場所の真上の第６のルマ場所に位置し、
前記右上候補は、前記第２の領域の最も右上のルマ場所の真上かつ右の第７のルマ場所に位置する、請求項２５に記載の方法。
前記決定された動きベクトルは、前記第３の領域に関しており、
前記幾何学的分割モードは、第１のルマ場所と第２のルマ場所との間の線セグメントを含み、
前記左下候補は、前記第３の領域の最も左下のルマ場所のすぐ左かつ真下の第３のルマ場所に位置し、
前記左候補は、前記第３の領域の最も左下のルマ場所のすぐ左の第４のルマ場所に位置し、
前記左上候補は、前記第１の領域と同一位置にある第５のルマ場所に位置し、
前記上候補は、前記第２の場所のすぐ左の第６のルマ場所に位置し、
前記右上候補は、前記第２の領域と同一位置にある第７のルマ場所に位置する、請求項２５に記載の方法。
前記決定された動きベクトルは、前記第２の領域に関しており、候補が前記第３の領域と同一位置にあることを決定することに応答して、前記候補を利用不可能としてマーキングすることをさらに含む、請求項２５に記載の方法。
前記決定された動きベクトルは、前記第２の領域に関しており、前記幾何学的分割モードが有効化されることを決定することに応答して、前記左上候補を利用不可能として自動的にマーキングすることをさらに含む、請求項２５に記載の方法。
前記決定された動きベクトルは、前記第３の領域に関しており、前記幾何学的分割モードが有効化されることを決定することに応答して、前記右上候補を利用不可能として自動的にマーキングすることをさらに含む、請求項２５に記載の方法。
前記決定された動きベクトルは、前記第３の領域に関しており、前記幾何学的分割モードが有効化されることを決定することに応答して、前記左上候補を利用不可能として自動的にマーキングすることをさらに含む、請求項２５に記載の方法。
マージモードが前記第１の領域に関して有効化されることを決定することをさらに含む、請求項２４に記載の方法。
高度動きベクトル予測モードが前記第１の領域に関して有効化されることを決定することをさらに含む、請求項２４に記載の方法。
前記カレントブロックのピクセルデータを再構築することをさらに含む、請求項２４に記載の方法。
前記第１の領域および前記第２の領域の各々は、非長方形である、請求項２４に記載の方法。
前記幾何学的分割モードは、前記ビットストリーム内で信号伝達される、請求項２４に記載の方法。
前記カレントブロックを前記幾何学的分割モードを介して前記第１の領域、前記第２の領域、および前記第３の領域に分割することは、第１のルマ場所および第２のルマ場所によって特徴付けられる線セグメントを用いて前記カレントブロックを分割することを含む、請求項２４に記載の方法。
前記幾何学的分割モードが有効化されるかどうかを決定することと、
前記カレントブロックに関する第１の線セグメントを決定することと、
前記カレントブロックに関する第２の線セグメントを決定することと
をさらに含み、
前記カレントブロックのデコーディングは、前記第１の線セグメントおよび前記第２の線セグメントを使用してピクセルデータを再構築することを含み、
前記第１の線セグメントおよび前記第２の線セグメントは、前記カレントブロックを前記第１の領域、前記第２の領域、および前記第３の領域に分割する、請求項２４に記載の方法。
前記幾何学的分割モードは、６４×６４ルマサンプル以上、または１２８×１２８ルマサンプル以上のブロックサイズに関して利用可能である、請求項２４に記載の方法。
前記デコーダはさらに、
前記ビットストリームを受信し、前記ビットストリームを量子化された係数にデコードするように構成されるエントロピーデコーダプロセッサと、
逆離散コサイン変換を実施することを含め、前記量子化された係数を処理するように構成される逆量子化および逆変換プロセッサと、
デブロッキングフィルタと、
フレームバッファと、
イントラ予測プロセッサと
を備える、請求項２４に記載の方法。
前記ビットストリームは、前記幾何学的分割モードが前記カレントブロックに関して有効化されるかどうかを示すパラメータを含む、請求項２４に記載の方法。
前記カレントブロックは、クアッドツリープラスバイナリディシジョンツリーの一部を形成する、請求項２４に記載の方法。
前記カレントブロックは、前記クアッドツリープラスバイナリディシジョンツリーの非リーフノードである、請求項４３に記載の方法。
前記カレントブロックは、コーディングツリーユニットまたはコーディングユニットである、請求項２４に記載の方法。
前記第１の領域は、コーディングユニットまたは予測ユニットである、請求項２４に記載の方法。