JP7303894B2

JP7303894B2 - エンコーダ、デコーダ、及び対応するインター予測方法

Info

Publication number: JP7303894B2
Application number: JP2021552986A
Authority: JP
Inventors: セードゥラマン，スリイラム; コテチャ，セイガー; ラジア，ジーヴァ
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2019-03-08
Filing date: 2020-02-28
Publication date: 2023-07-05
Anticipated expiration: 2040-02-28
Also published as: JP2022524357A; CN113508592A; US20240259583A1; AU2020234595A1; US20220014776A1; CA3131311A1; US11968387B2; BR112021016896A2; KR20250004165A; EP3915262A1; KR20240000636A; EP3915262A4; KR102746971B1; WO2020181997A1; ZA202107479B; MX2021010504A; KR20210122854A; KR102616680B1

Description

本出願は、２０１９年３月８日に出願されたインド仮特許出願第ＩＮ２０１９３１００９１８４号に対する優先権を主張するものであり、その内容をその全体にてここに援用する。

本出願の実施形態は、概してピクチャ処理の分野に関し、より具体的にはインター予測に関する。

映像コーディング（映像符号化及び復号）は、例えば、放送デジタルＴＶ、インターネット及びモバイルネットワーク上での映像伝送、例えばビデオチャットなどのリアルタイム会話アプリケーション、ビデオ会議、ＤＶＤ及びＢｌｕ－ｒａｙディスク、ビデオコンテンツ収集・編集システム、並びにセキュリティ用途のビデオカメラといった、広範囲のデジタル映像アプリケーションで使用されている。

比較的短い映像であってもそれを描写するために必要とされる映像データの量はかなりになり得るものであり、それが、限られた帯域幅容量を持つ通信ネットワークを介してデータをストリーミングする又はその他の方法で通信するときに困難をもたらし得る。従って、映像データは一般に、今日の遠隔通信ネットワークを介して通信される前に圧縮される。映像のサイズはまた、メモリリソースが限られ得るために、映像がストレージ装置に格納されるときにも問題となり得る。映像圧縮装置は、しばしば、伝送又は記憶に先立って、ソースにてソフトウェア及び／又はハードウェアを用いて映像データを符号化し、それにより、デジタル映像画像を表すのに必要なデータの量を減少させる。そして、圧縮されたデータが、送り先で、映像データを復号する映像解凍装置によって受信される。限られたネットワークリソースと、増加の一途をたどるいっそう高い映像品質の要求とに伴い、ピクチャ品質の犠牲を殆ど乃至は全く払わずに圧縮比を向上させる改良された圧縮及び解凍技術が望ましい。

本出願の実施形態は、独立請求項に従った符号化及び復号のための装置及び方法を提供する。

本出願の第１の態様において、双方向オプティカルフロー予測方法は、現在ブロックについて当初動きベクトルペアを取得し、当該当初動きベクトルペアは、前方動きベクトルと後方動きベクトルとを有し、前記前方動きベクトルに従った前方予測ブロックと、前記後方動きベクトルに従った後方予測ブロックとを取得し、前記現在ブロック内の現在サンプルについての勾配パラメータを、前記現在サンプルに対応する前方予測サンプル及び後方予測サンプルに基づいて計算し、前記前方予測サンプルは前記前方予測ブロック内にあり、前記後方予測サンプルは前記後方予測ブロック内にあり、前記勾配パラメータに基づいて、前記現在サンプルについての少なくとも２つのサンプルオプティカルフローパラメータを取得し、当該サンプルオプティカルフローパラメータは、第１パラメータ及び第２パラメータを有し、前記現在ブロック内のサンプルのサンプルオプティカルフローパラメータに基づいて、ブロックオプティカルフローパラメータを取得し、当該ブロックオプティカルフローパラメータのうち１つは、前記第１パラメータの値と前記第２パラメータの符号関数の値とを乗算することを含む演算によって取得され、前記符号関数は、少なくとも３つのサブインターバルを有する区分関数であり、前記前方予測ブロック、前記後方予測ブロック、前記ブロックオプティカルフローパラメータ、及び前記サンプルオプティカルフローパラメータに基づいて、前記現在ブロックの予測値を取得する、ことを有する。

実現可能な一実装において、前記符号関数は、

であり、Ｔは非負の実数である。

実現可能な一実装において、Ｔは０であり、対応して、前記符号関数は、

である。

実現可能な一実装において、前記当初動きベクトルペアは、前記現在ブロックの少なくとも１つの空間隣接ブロック及び／又は時間隣接ブロックの動き情報に従って取得される。

実現可能な一実装において、前記現在ブロックは、コーディングユニット又は該コーディングユニットのサブブロックである。

実現可能な一実装において、勾配パラメータは、前方水平勾配、後方水平勾配、前方垂直勾配、及び後方垂直勾配を有する。

実現可能な一実装において、前記前方水平勾配は、前記前方予測サンプルに隣接する右サンプルと左サンプルとの差である。

実現可能な一実装において、前記後方水平勾配は、前記後方予測サンプルに隣接する右サンプルと左サンプルとの差である。

実現可能な一実装において、前記前方垂直勾配は、前記前方予測サンプルに隣接する下サンプルと上サンプルとの差である。

実現可能な一実装において、前記後方垂直勾配は、前記後方予測サンプルに隣接する下サンプルと上サンプルとの差である。

実現可能な一実装において、前記サンプルオプティカルフローパラメータは、サンプル差、水平平均勾配、及び垂直平均勾配を有する。

実現可能な一実装において、前記第１パラメータは、前記サンプル差、前記水平平均勾配、又は前記垂直平均勾配である。

実現可能な一実装において、前記第２パラメータは、前記サンプル差、前記水平平均勾配、又は前記垂直平均勾配であり、前記第２パラメータは前記第１パラメータではない。

本出願の第２の態様において、双方向オプティカルフロー予測装置は、現在ブロックについて当初動きベクトルペアを取得するように構成された取得モジュールであり、前記当初動きベクトルペアは、前方動きベクトルと後方動きベクトルとを有する、取得モジュールと、前記前方動きベクトルに従った前方予測ブロックと、前記後方動きベクトルに従った後方予測ブロックとを取得するように構成されたパッチングモジュールと、前記現在ブロック内の現在サンプルについての勾配パラメータを、前記現在サンプルに対応する前方予測サンプル及び後方予測サンプルに基づいて計算するように構成された勾配モジュールであり、前記前方予測サンプルは前記前方予測ブロック内にあり、前記後方予測サンプルは前記後方予測ブロック内にある、勾配モジュールと、前記勾配パラメータに基づいて、前記現在サンプルについての少なくとも２つのサンプルオプティカルフローパラメータを取得するように構成された計算モジュールであり、前記サンプルオプティカルフローパラメータは、第１パラメータ及び第２パラメータを有する、計算モジュールと、前記現在ブロック内のサンプルのサンプルオプティカルフローパラメータに基づいて、ブロックオプティカルフローパラメータを取得するように構成された訓練モジュールであり、前記ブロックオプティカルフローパラメータのうち１つは、前記第１パラメータの値と前記第２パラメータの符号関数の値とを乗算することを含む演算によって取得され、前記符号関数は、少なくとも３つのサブインターバルを有する区分関数である、訓練モジュールと、前記前方予測ブロック、前記後方予測ブロック、前記ブロックオプティカルフローパラメータ、及び前記サンプルオプティカルフローパラメータに基づいて、前記現在ブロックの予測値を取得するように構成された予測モジュールと、を有する。

実現可能な一実装において、前記符号関数は、

であり、Ｔは非負の実数である。

である。

本出願の第３の態様において、双方向オプティカルフロー予測装置は、１つ以上のプロセッサと、前記プロセッサに結合され、前記プロセッサによる実行のためのプログラミングを格納する非一時的なコンピュータ読み取り可能記憶媒体と、を有し、前記プログラミングは、前記プロセッサによって実行されるときに、本出願の第１の態様の実装のうちのいずれか１つに従った方法を実行するように当該装置を構成する。

本出願の第４の態様において、コンピュータプログラムプロダクトは、本出願の第１の態様の実装のうちのいずれか１つに従った方法を実行するためのプログラムコードを有する。

本出願の第５の態様において、デコーダは、１つ以上のプロセッサと、前記プロセッサに結合され、前記プロセッサによる実行のためのプログラミングを格納する非一時的なコンピュータ読み取り可能記憶媒体と、を有し、前記プログラミングは、前記プロセッサによって実行されるときに、本出願の第１の態様の実装のうちのいずれか１つに従った方法を実行するように当該デコーダを構成する。

本出願の第６の態様において、エンコーダは、１つ以上のプロセッサと、前記プロセッサに結合され、前記プロセッサによる実行のためのプログラミングを格納する非一時的なコンピュータ読み取り可能記憶媒体と、を有し、前記プログラミングは、前記プロセッサによって実行されるときに、本出願の第１の態様の実装のうちのいずれか１つに従った方法を実行するように当該エンコーダを構成する。

本出願の第７の態様において、ビットストリームは、本出願の第１の態様の実装のうちのいずれか１つに従って生成される。

上述の目的及び他の目的が、独立請求項に係る事項によって達成される。更なる実装形態が、従属請求項、明細書及び図面から明らかである。

特定の実施形態が、添付の独立請求項にて要点をまとめられ、他の実施形態が従属請求項にて要点をまとめられる。

１つ以上の実施形態の詳細が、添付の図面及び以下の説明に記載される。他の特徴、目的、及び利点が、明細書、図面、及び特許請求の範囲から明らかになる。

以下、添付の図及び図面を参照して、出願の実施形態をより詳細に説明する。
出願の実施形態を実装するように構成された映像コーディングシステムの一例を示すブロック図である。出願の実施形態を実装するように構成された映像コーディングシステムの他の一例を示すブロック図である。出願の実施形態を実装するように構成されたビデオエンコーダの一例を示すブロック図である。出願の実施形態を実装するように構成されたビデオデコーダの一構成例を示すブロック図である。符号化装置又は復号装置の一例を示すブロック図である。符号化装置又は復号装置の他の一例を示すブロック図である。三値出力関数の一例を示している。五値出力関数の一例を示している。本出願の双方向オプティカルフロー予測プロセスの一例を示すブロック図である。本出願の双方向オプティカルフロー予測プロセスの他の一例を示すブロック図である。本出願の双方向オプティカルフロー予測装置の一例を示すブロック図である。本出願の双方向オプティカルフロー予測装置の他の一例を示すブロック図である。本出願に従ったインター予測のための装置の一例を示すブロック図である。本出願に従ったインター予測のための装置の他の一例を示すブロック図である。

以下において、明示的に別段の定めがない限り、同じ参照符号は、同じ機構又は少なくとも機能的に等価な機構を指す。

以下の説明では、開示の一部を形成するものであるとともに、出願の実施形態の特定の態様又は本出願の実施形態が使用され得る特定の態様を例示によって示すものである添付図面を参照する。理解されることには、出願の実施形態は、他の態様で使用されることができ、また、図に示されない構造的又は論理的な変更を含むことができる。従って、以下の詳細な説明は、限定的な意味で解釈されるべきでなく、本出願の範囲は、添付の特許請求の範囲によって定められる。

例えば、理解されることには、記載される方法に関する開示は、その方法を実行するように構成される対応する装置又はシステムにも当てはまり得るものであり、その逆もまた然りである。例えば、１つ又は複数の特定の方法ステップが記載される場合、対応する装置は、たとえそのような１つ又は複数のユニットが明示的に記載されたり図に示されたりしていなくても、記載された１つ又は複数の方法ステップを実行するための例えば機能ユニットといった１つ又は複数のユニット（例えば、該１つ又は複数のステップを実行する１つのユニット、又は各々がそれら複数のステップのうちの１つ以上を実行する複数のユニット）を含み得る。その一方で、例えば、特定の装置が、例えば機能ユニットといった１つ又は複数のユニットに基づいて記載される場合、対応する方法は、たとえそのような１つ又は複数のステップが明示的に記載されたり図に示されたりしていなくても、該１つ又は複数のユニットの機能を実行するためのステップ（例えば、該１つ又は複数のユニットの機能を実行する１つのステップ、又は各々がそれら複数のユニットのうちの１つ以上の機能を実行する複数のステップ）を含み得る。さらに、理解されることには、ここに記載される様々な例示的な実施形態及び／又は態様の特徴は、具体的に別段の断りがない限り、互いに組み合わされてもよい。

映像コーディングは、典型的に、映像又は映像シーケンスを形成するものである一連のピクチャの処理を指す。“ピクチャ”という用語の代わりに、“フレーム”又は“画像”という用語が、映像コーディングの分野における同義語として使用されることがある。映像コーディング（又は、一般に、コーディング）は、映像符号化及び映像復号という２つの部分を有する。映像符号化は、ソース側で実行され、典型的に、（より効率的な記憶及び／又は伝送のために）映像ピクチャを表現するのに必要なデータ量を削減するように、元の映像ピクチャを（例えば圧縮によって）処理することを有する。映像復号は、デスティネーション側で実行され、典型的に、映像ピクチャを再構成するためにエンコーダに対して逆の処理を有する。映像ピクチャ（又は、一般に、ピクチャ）の“コーディング”を参照する実施形態は、映像ピクチャ又はそれぞれの映像シーケンスの“符号化”又は“復号”に関係するように理解されるものとする。符号化部分と復号部分との組み合わせは、ＣＯＤＥＣ（Coding and Decoding）とも呼ばれている。

可逆映像コーディングの場合、元の映像ピクチャを再構成することができ、すなわち、再構成された映像ピクチャは、（記憶又は伝送の間に伝送損失又は他のデータ損失がないと仮定して）元の映像ピクチャと同じ品質を有する。非可逆映像コーディングの場合には、映像ピクチャを表現するデータの量を減らすために、例えば量子化によって、更なる圧縮が行われ、デコーダで映像ピクチャを完全に再構成することはできず、すなわち、再構成された映像ピクチャの品質が、元の映像ピクチャの品質と比較して低い又は悪いものとなる。

幾つかの映像コーディング標準は、“非可逆ハイブリッド映像コーデック”のグループに属する（すなわち、サンプルドメインにおける空間及び時間予測と、変換ドメインにおいて量子化を適用する２Ｄ変換コーディングとを組み合わせる）。映像シーケンスの各ピクチャは典型的に一組の重なり合わないブロックに分割され、コーディングは典型的にブロックレベルで実行される。換言すれば、エンコーダで、映像は典型的にブロック（映像ブロック）レベルで、例えば、空間（イントラピクチャ）予測及び／又は時間（インターピクチャ）予測を用いて予測ブロックを生成し、予測ブロックを現在ブロック（現在処理されている／処理対象のブロック）から減算して残差ブロックを取得し、残差ブロックを変換し且つ変換ドメインで残差ブロックを量子化して、伝送されるデータの量を削減すること（圧縮）によって、処理すなわち符号化され、一方、デコーダでは、表現用に現在ブロックを再構成するために、符号化又は圧縮されたブロックに、エンコーダに対して逆の処理が適用される。さらに、エンコーダはデコーダ処理ループを複製しており、それにより、後続ブロックを処理すなわちコーディングするために両者が同じ予測（例えば、イントラ予測及びインター予測）及び／又は再構成を生成することになる。

映像コーディングシステム１０の以下の実施形態にて、ビデオエンコーダ２０及びビデオデコーダ３０を図１－図３に基づいて説明する。

図１Ａは、本出願の技術を利用し得るコーディングシステム１０の一例、例えば映像コーディングシステム１０（又は略してコーディングシステム１０）、を示す概略ブロック図である。映像コーディングシステム１０のビデオエンコーダ２０（又は略してエンコーダ２０）及びビデオデコーダ３０（又は略してデコーダ３０）は、本出願に記載される様々な例に従った技術を実行するように構成され得る装置の例を表す。

図１Ａに示すように、コーディングシステム１０は、符号化ピクチャデータ２１を、例えば符号化ピクチャデータ１３を復号するデスティネーション装置１４に、提供するように構成されたソース装置１２を有している。

ソース装置１２は、エンコーダ２０を有しており、付加的に、すなわち、オプションで、ピクチャ源１６、例えばピクチャプリプロセッサ１８といったプリプロセッサ（又は前処理ユニット）１８、及び通信インタフェース若しくは通信ユニット２２を有してもよい。

ピクチャ源１６は、例えば実世界ピクチャをキャプチャするためのカメラといった任意の種類のピクチャキャプチャ装置、及び／又は、例えばコンピュータアニメーションピクチャを生成するためのコンピュータグラフィックスプロセッサといった任意の種類のピクチャ生成装置、又は、実世界ピクチャ、コンピュータ生成ピクチャ（例えば、スクリーンコンテンツ、仮想現実（ＶＲ）ピクチャ）及び／又はそれらの任意の組み合わせ（例えば、拡張現実（ＡＲ）ピクチャ）を取得及び／又は提供するための任意の種類の他の装置を有することができ、あるいはそれであることができる。ピクチャ源は、上述のピクチャのうちのいずれかを格納する任意の種類のメモリ又はストレージとし得る。

プリプロセッサ１８、及び前処理ユニット１８によって実行される処理とは区別して、ピクチャ又はピクチャデータ１７をロー（raw）ピクチャ又はローピクチャデータ１７としても参照され得る。

プリプロセッサ１８は、（ロー）ピクチャデータ１７を受け取り、ピクチャデータ１７上で前処理を行って、前処理済みピクチャ１９又は前処理済みピクチャデータ１９を得るように構成される。プリプロセッサ１８によって実行される前処理は、例えば、トリミング、カラーフォーマット変換（例えば、ＲＧＢからＹＣｂＣｒへ）、カラー補正、又はノイズ除去を有し得る。理解され得ることには、前処理ユニット１８はオプションコンポーネントとし得る。

ビデオエンコーダ２０は、前処理済みピクチャデータ１９を受け取り、符号化ピクチャデータ２１を提供するように構成される（更なる詳細については、例えば図２に基づいて後述する）。ソース装置１２の通信インタフェース２２は、符号化ピクチャデータ２１を受け取り、符号化ピクチャデータ２１（又はその更に処理した任意のバージョン）を、記憶又は直接的な再構成のために、通信チャネル１３上で、例えばデスティネーション装置１４又は任意の他の装置といった他の装置に送信するように構成され得る。

デスティネーション装置１４は、デコーダ３０（例えば、ビデオデコーダ３０）を有しており、付加的に、すなわち、オプションで、通信インタフェース若しくは通信ユニット２８、ポストプロセッサ３２（又は後処理ユニット３２）、及び表示装置３４を有してもよい。

デスティネーション装置１４の通信インタフェース２８は、符号化ピクチャデータ２１（又はその更に処理した任意のバージョン）を、例えば、ソース装置１２から直接的に、あるいは例えば符号化ピクチャデータストレージ装置などのストレージ装置といった任意の他のソースから、受信して、符号化ピクチャデータ２１をデコーダ３０に提供するように構成される。

通信インタフェース２２及び通信インタフェース２８は、ソース装置１２とデスティネーション装置１４との間の、例えば直接的な有線若しくは無線接続といった直接的な通信リンクを介して、あるいは、例えば、有線若しくは無線ネットワーク又はこれらの任意の組み合わせ、又は任意の種類の私的及び公的ネットワーク、又はこれらの任意の種類の組み合わせといった任意の種類のネットワークを介して、符号化ピクチャデータ２１又は符号化データ１３を送信又は受信するように構成され得る。

通信インタフェース２２は、例えば、符号化ピクチャデータ２１を例えばパケットといった適切なフォーマットにパッケージ化し、且つ／或いは任意の種類の伝送符号化又は通信リンク若しくは通信ネットワーク上での伝送のための処理を用いて符号化ピクチャデータを処理するように構成され得る。

通信インタフェース２８は、通信インタフェース２２に対応する物を形成し、例えば、伝送されたデータを受信し、任意の種類の対応する伝送復号若しくは処理及び／又は脱パッケージ化を用いて伝送データを処理して、符号化ピクチャデータ２１を得るように構成され得る。

通信インタフェース２２及び通信インタフェース２８はどちらも、ソース装置１２からデスティネーション装置１４を指す図１Ａの通信チャネル１３の矢印によって示される単方向通信インタフェースとして構成されてもよいし、あるいは双方向通信インタフェースとして構成されてもよく、例えば、通信リンク及び／又は例えば符号化ピクチャデータ伝送といったデータ伝送に関係する他の情報を受信確認及び交換するために接続をセットアップするためなどで、メッセージを送受信するように構成され得る。

デコーダ３０は、符号化ピクチャデータ２１を受け取り、復号ピクチャデータ３１又は復号ピクチャ３１を提供するように構成される（更なる詳細については、例えば図３又は図５に基づいて後述する）。

デスティネーション装置１４のポストプロセッサ３２は、例えば復号ピクチャ３１といった復号ピクチャデータ３１（再構成された映像データとも呼ばれる）を後処理して、例えば後処理済みピクチャ３３といった後処理済みのピクチャデータ３３を得るように構成される。後処理ユニット３２によって実行される後処理は、例えば、カラーフォーマット変換（例えば、ＹＣｂＣｒからＲＧＢへ）、カラー補正、トリミング、若しくは再サンプリング、又は、例えば表示装置３４による表示のために復号ピクチャデータ３１を準備するためなどの任意の他の処理を有し得る。

デスティネーション装置１４の表示装置３４は、ピクチャを例えばユーザ又はビューアに表示するために、後処理済みピクチャデータ３３を受け取るように構成される。表示装置３４は、例えば一体化された又は外付けのディスプレイ又はモニタといった、再構成ピクチャを表現するための任意の種類のディスプレイである又はそれを有するとし得る。ディスプレイは、例えば、液晶ディスプレイ（ＬＣＤ）、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、プラズマディスプレイ、プロジェクタ、マイクロＬＥＤディスプレイ、液晶・オン・シリコン（ＬＣｏＳ）、デジタルライトプロセッサ（ＤＬＰ）、又は任意の種類の他のディスプレイを有し得る。

図１Ａは、ソース装置１２及びデスティネーション装置１４を別々の装置として描いているが、装置の実施形態はまた、ソース装置１２又は対応する機能と、デスティネーション装置１４又は対応する機能との、両方又は両方の機能を有してもよい。そのような実施形態では、ソース装置１２又は対応する機能と、デスティネーション装置１４又は対応する機能とが、同一のハードウェア及び／又はソフトウェアを用いて、又は別々のハードウェア及び／又はソフトウェアによって、又はこれらの任意の組み合わせにて実装され得る。

説明に基づいて当業者に明らかなになるように、図１Ａに示したようなソース装置１２及び／又はデスティネーション装置１４内の複数の異なるユニット又は機能の存在及び（正確な）機能分割は、実際の装置及び用途に応じて変わり得る。

エンコーダ２０（例えば、ビデオエンコーダ２０）若しくはデコーダ３０（例えば、ビデオデコーダ３０）、又はエンコーダ２０とデコーダ３０との両方は、例えば、１つ以上のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリートロジック、ハードウェア、映像コーディング専用、又はこれらの任意の組み合わせなどの、図１Ｂに示すような処理回路によって実装され得る。エンコーダ２０は、図２のエンコーダ２０及び／又はここに記載されるいずれかの他のエンコーダシステム若しくはサブシステムに関して説明されるような様々なモジュールを具体化するように、処理回路４６によって実装され得る。デコーダ３０は、図３のデコーダ３０及び／又はここに記載されるいずれかの他のデコーダシステム若しくはサブシステムに関して説明されるような様々なモジュールを具体化するように、処理回路４６によって実装され得る。処理回路は、後述する様々な演算を実行するように構成され得る。図５に示すように、当該技術が部分的にソフトウェアで実装される場合、装置が、好適な非一時的なコンピュータ読み取り可能記憶媒体にソフトウェアの命令を格納し、それらの命令を、１つ以上のプロセッサを用いてハードウェアにて実行することで、この開示の技術を実行することができる。ビデオエンコーダ２０及びビデオデコーダ３０のいずれかが、例えば図１Ｂに示すように、単一の装置内の結合されたエンコーダ／デコーダ（ＣＯＤＥＣ）の部分として一体化されてもよい。

ソース装置１２及びデスティネーション装置１４は、例えば、ノートブック若しくはラップトップコンピュータ、携帯電話、スマートフォン、タブレット若しくはタブレットコンピュータ、カメラ、デスクトップコンピュータ、セットトップボックス、テレビジョン、ディスプレイ装置、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミング装置（例えばコンテンツサービスサーバ又はコンテンツ配信サーバなど）、放送受信器装置、放送送信器装置など、又はこれらに類するものといった、任意の種類のハンドヘルド装置又は固定装置を含め、広範囲の装置うちのいずれかを有することができ、また、オペレーティングシステムを使用しなくてもよいし、あるいは任意の種類のオペレーティングシステムを使用してもよい。一部のケースにおいて、ソース装置１２及びデスティネーション装置１４は無線通信向けに装備されてもよい。従って、ソース装置１２及びデスティネーション装置１４は無線通信装置であってもよい。

一部のケースにおいて、図１Ａに示した映像コーディングシステム１０は、単に一例に過ぎず、本出願の技術は、必ずしも符号化装置と復号装置との間で如何なるデータ通信も含まない映像コーディング設定（例えば、映像符号化又は映像復号）に適用されてもよい。他の例において、データがローカルメモリから取り出されてネットワーク上でストリーミングされるなどする。映像符号化装置が、データを符号化してメモリに格納することができ、且つ／或いは映像復号装置が、メモリからデータを取り出して復号することができる。一部の例において、符号化及び復号は、互いに通信せずに単にデータをメモリにエンコードする及び／又はメモリからデータを取り出して復号する装置によって実行される。

説明の便宜のため、出願の実施形態は、ここでは、例えば、ハイエフィシェンシビデオコーディング（ＨＥＶＣ）、又はＩＴＵ－Ｔビデオコーディングエキスパートグループ（ＶＣＥＧ）とＩＳＯ／ＩＥＣモーションピクチャエキスパートグループ（ＭＰＥＧ）とのジョイントコラボレーションチーム・オン・ビデオコーディング（ＪＣＴ－ＶＣ）によって開発された次世代映像コーディング標準であるバーサタイルビデオコーディング（ＶＶＣ）のリファレンスソフトウェアを参照して説明される。当業者が理解することには、出願の実施形態はＨＥＶＣ又はＶＶＣに限定されるものではない。

エンコーダ及び符号化方法
図２は、本出願の技術を実装するように構成されたビデオエンコーダ２０の一例の概略ブロック図を示している。図２の例において、ビデオエンコーダ２０は、入力２０１（又は入力インタフェース２０１）、残差計算ユニット２０４、変換処理ユニット２０６、量子化ユニット２０８、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、ループフィルタユニット２２０、復号ピクチャバッファ（decoded picture buffer；ＤＰＢ）２３０、モード選択ユニット２６０、エントロピー符号化ユニット２７０、及び出力２７２（又は出力インタフェース２７２）を有している。モード選択ユニット２６０は、インター予測ユニット２４４、イントラ予測ユニット２５４、及び分割ユニット２６２を含み得る。インター予測ユニット２４４は、動き推定ユニット及び動き補償ユニット（図示せず）を含み得る。図２に示すビデオエンコーダ２０は、ハイブリッドビデオエンコーダ、又はハイブリッドビデオコーデックに従ったビデオエンコーダとしても参照され得る。

残差計算ユニット２０４、変換処理ユニット２０６、量子化ユニット２０８、モード選択ユニット２６０は、エンコーダ２０の前方信号経路を形成するとして参照され得るものであるのに対し、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、バッファ２１６、ループフィルタ２２０、復号ピクチャバッファ（ＤＰＢ）２３０、インター予測ユニット２４４、及びイントラ予測ユニット２５４は、ビデオエンコーダ２０の後方信号経路を形成するとして参照され得るものであり、ビデオエンコーダ２０の後方信号経路は、デコーダ（図３のビデオデコーダ３０を参照）の信号経路に一致する。逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、ループフィルタ２２０、復号ピクチャバッファ（ＤＰＢ）２３０、インター予測ユニット２４４、及びイントラ予測ユニット２５４はまた、ビデオエンコーダ２０の“内蔵デコーダ”を形成するとしても参照される。

ピクチャ＆ピクチャ分割（ピクチャ＆ブロック）
エンコーダ２０は、例えば入力２０１を介して、例えば映像又は映像シーケンスを形成する一連のピクチャのうちのピクチャといった、ピクチャ１７（又はピクチャデータ１７）を受信するように構成され得る。受信されるピクチャ又はピクチャデータはまた、前処理済みピクチャ１９（又は前処理済みピクチャデータ１９）であってもよい。単純にするため、以下の説明はピクチャ１７を参照する。ピクチャ１７はまた、現在ピクチャ又はコーディング対象のピクチャとしても参照され得る（特に、映像コーディングでは、現在ピクチャを、例えば同一の映像シーケンスすなわち現在ピクチャをも含む映像シーケンスのうち先行して符号化及び／又は復号されたピクチャといった他のピクチャから区別するため）。

（デジタル）ピクチャは、強度値を有するサンプルの二次元アレイ又はマトリクスとみなされ、あるいはそうみなされてもよい。アレイ内のサンプルは、ピクセル（ピクチャエレメントの短縮形）又はペルとしても参照され得る。アレイ又はピクチャの水平及び垂直方向（又は軸）のサンプルの数が、ピクチャのサイズ及び／又は解像度を定める。色の表現のため、典型的に３つの色成分が使用され、すなわち、ピクチャは、３つのサンプルアレイで表現され、あるいはそれらを含み得る。ＲＢＧフォーマット又は色空間では、ピクチャは、対応する赤、緑及び青のサンプルアレイを有する。しかしながら、映像コーディングにおいて、各ピクセルは典型的に、例えば、Ｙによって示されるルミナンス成分（代わりにＬが使用されることもある）と、Ｃｂ及びＣｒによって示される２つのクロミナンス成分とを有するものであるＹＣｂＣｒといった、ルミナンス及びクロミナンスのフォーマット又は色空間で表現される。ルミナンス（又は略してルマ）成分Ｙは輝度又は（例えば、グレースケールピクチャにおいてのような）グレーレベル強度を表し、２つのクロミナンス（又は略してクロマ）成分Ｃｂ及びＣｒは色度又は色情報成分を表す。従って、ＹＣｂＣｒフォーマットのピクチャは、ルミナンスサンプル値（Ｙ）のルミナンスサンプルアレイと、クロミナンス値（Ｃｂ及びＣｒ）の２つのクロミナンスサンプルアレイとを有する。ＲＧＢフォーマットのピクチャはＹＣｂＣｒフォーマットに変換される（converted又はtransformed）ことができ、その逆もまた然りであり、このプロセスは、カラー変換（transformation又はconversion）としても知られている。ピクチャがモノクロである場合、そのピクチャはルミナンスサンプルアレイのみを有し得る。従って、ピクチャは、例えば、モノクロフォーマットにおいてはルマサンプルのアレイであることができ、あるいは４：２：０、４：２：２、及び４：４：４カラーフォーマットにおいてはルマサンプルのアレイとクロマサンプルの２つの対応するアレイとであることができる。

ビデオエンコーダ２０の実施形態は、ピクチャ１７を複数の（典型的には重なり合わない）ピクチャブロック２０３に分割するように構成されたピクチャ分割ユニット（図２には示さず）を有し得る。これらのブロックは、ルートブロック、マクロブロック（Ｈ．２６４／ＡＶＣ）、又はコーディングツリーブロック（ＣＴＢ）若しくはコーディングツリーユニット（ＣＴＵ）（Ｈ．２６５／ＨＥＶＣ及びＶＶＣ）として参照されることもある。ピクチャ分割ユニットは、映像シーケンスの全てのピクチャ及びブロックサイズを定める対応するグリッドに対して同じブロックサイズを使用して、又はピクチャ間で、又はピクチャのサブセット若しくはグループ間でブロックサイズを変更して、各ピクチャを対応するブロックに分割するように構成され得る。

更なる実施形態において、ビデオエンコーダは、例えばピクチャ１７を形成する１つの、幾つかの、又は全てのブロックといった、ピクチャ１７のブロック２０３を直接受信するように構成され得る。ピクチャブロック２０３は、現在ピクチャブロック又はコーディング対象のピクチャブロックとして参照されることもある。

ピクチャ１７と同様に、ピクチャブロック２０３もやはり、強度値（サンプル値）を有するサンプルの二次元アレイ又はマトリクスとみなされ、あるいはそうみなされてもよいが、ピクチャ１７よりも小さい寸法のものである。換言すれば、ブロック２０３は、例えば、１つのサンプルアレイ（例えば、モノクロピクチャ１７の場合のルマアレイ、又はカラーピクチャの場合のルマアレイ若しくはクロマアレイ）、又は３つのサンプルアレイ（例えば、カラーピクチャ１７の場合のルマアレイ及び２つのクロマアレイ）、又は適用されるカラーフォーマットに応じた何らかの他の数及び／又は種類のアレイを有し得る。ブロック２０３の水平及び垂直方向（又は軸）のサンプルの数が、ブロック２０３のサイズを定める。従って、ブロックは、例えば、サンプルのＭ×Ｎ（Ｍ列×Ｎ行）アレイ、又は変換係数のＭ×Ｎアレイとし得る。

図２に示すビデオエンコーダ２０の実施形態は、ブロック毎にピクチャ１７を符号化するように構成されることができ、例えば、符号化及び予測がブロック２０３毎に実行される。

図２に示すビデオエンコーダ２０の実施形態は更に、スライス（映像スライスとしても参照される）を使用することによってピクチャを分割及び／又は符号化するように構成されることができ、ピクチャが、１つ以上のスライス（典型的に重なり合わない）に分割され又は１つ以上のスライス（典型的に重なり合わない）を用いて符号化され得るとともに、各スライスが、１つ以上のブロック（例えば、ＣＴＵ）又はブロックの１つ以上のグループ（例えば、タイル（Ｈ．２６５／ＨＥＶＣ及びＶＶＣ）又はブリック（ＶＶＣ））を有し得る。

図２に示すビデオエンコーダ２０の実施形態は更に、スライス／タイルグループ（映像タイルグループとしても参照される）及び／又はタイル（映像タイルとしても参照される）を使用することによってピクチャを分割及び／又は符号化するように構成されることができ、ピクチャが、１つ以上のスライス／タイルグループ（典型的に重なり合わない）に分割され又は１つ以上のスライス／タイルグループ（典型的に重なり合わない）を用いて符号化され得るとともに、各スライス／タイルグループが、例えば、１つ以上のブロック（例えば、ＣＴＵ）又は１つ以上のタイルを有することができ、各タイルは、例えば、矩形の形状のものとし得るとともに、例えば完全なるブロック又は部分的なブロックといった、１つ以上のブロック（例えば、ＣＴＵ）を有し得る。

残差計算
残差計算ユニット２０４は、ピクチャブロック２０３及び予測ブロック２６５（予測ブロック２６５に関する更なる詳細については後に提供する）に基づいて、例えば、予測ブロック２６５のサンプル値をピクチャブロック２０３のサンプル値からサンプル毎（ピクセル毎）に差し引くことにより、残差ブロック２０５（残差２０５としても参照される）を計算して、サンプルドメインにおける残差ブロック２０５を得るように構成され得る。

変換
変換処理ユニット２０６は、残差ブロック２０５のサンプル値に対して例えば離散コサイン変換（ＤＣＴ）又は離散サイン変換（ＤＳＴ）といった変換を適用して、変換ドメインにおける変換係数２０７を得るように構成され得る。変換係数２０７は、変換残差係数として参照されることもあり、変換ドメインでの残差ブロック２０５を表し得る。

変換処理ユニット２０６は、例えばＨ．２６５／ＨＥＶＣに対して規定された変換など、ＤＣＴ／ＤＳＴの整数近似を適用するように構成されてもよい。直交ＤＣＴ変換と比較して、そのような整数近似は、典型的に、ある特定の係数によってスケーリングされる。順変換及び逆変換によって処理される残差ブロックのノルムを保存するために、変換プロセスの一部として追加のスケーリング係数が適用される。スケーリング係数は、典型的に、スケーリング係数はシフト演算のために２のべき乗であること、変換係数のビット深度、精度と実装コストとの間のトレードオフなどのような、特定の制約に基づいて選択される。特定のスケーリング係数が、例えば逆変換処理ユニット２１２による逆変換に関して（及び、ビデオデコーダ３０における例えば逆変換処理ユニット３１２による対応する逆変換に関して）指定され、また、それに従って、エンコーダ２０における例えば変換処理ユニット２０６による順変換に関する対応するスケーリング係数が指定され得る。

ビデオエンコーダ２０（それぞれ変換処理ユニット２０６）の実施形態は、エントロピー符号化ユニット２７０を介して、例えば１つ以上の変換のタイプといった変換パラメータを、例えば直接又は符号化若しくは圧縮して出力するように構成されることができ、その結果、例えば、ビデオデコーダ３０が復号のために変換パラメータを受信して使用し得る。

量子化
量子化ユニット２０８は、例えばスカラー量子化又はベクトル量子化を適用することによって、変換係数２０７を量子化して、量子化された係数２０９を得るように構成され得る。量子化された係数２０９は、量子化された変換係数２０９又は量子化された残差係数２０９として参照されることもある。

量子化プロセスは、変換係数２０７の一部又は全てに関連するビット深度を減少させ得る。例えば、ｎはｍより大きいとして、ｎビットの変換係数が量子化の間にｍビットの変換係数に丸められ得る。量子化の程度は、量子化パラメータ（ＱＰ）を調節することによって変更され得る。例えば、スカラー量子化の場合、より細かい又はより粗い量子化を達成するために、異なるスケーリングが適用され得る。より小さい量子化ステップサイズは、より細かい量子化に対応し、より大きい量子化ステップサイズは、より粗い量子化に対応する。適用可能な量子化ステップサイズは、量子化パラメータ（ＱＰ）によって指し示され得る。量子化パラメータは、例えば、予め定められた一組の適用可能な量子化ステップサイズに対するインデックスとし得る。例えば、小さい量子化パラメータが細かい量子化（小さい量子化ステップサイズ）に対応することができるとともに、大きい量子化パラメータが粗い量子化（大きい量子化ステップサイズ）に対応するとすることができ、その逆もまた然りである。量子化は、量子化ステップサイズによる除算を含むことができ、例えば逆量子化ユニット２１０による、対応する且つ／或いは逆の、量子化解除は、量子化ステップサイズによる乗算を含むことができる。例えばＨＥＶＣといった一部の標準に従った実施形態は、量子化パラメータを用いて量子化ステップサイズを決定するように構成され得る。一般に、量子化ステップサイズは、除算を含む式の固定小数点近似を用いて、量子化パラメータに基づいて計算され得る。残差ブロックのノルムを復元するために追加のスケーリング係数を量子化及び量子化解除に対して導入してもよく、量子化ステップサイズ及び量子化パラメータについての式の固定小数点近似に使用されるスケーリングに起因して、残差ブロックのノルムが変更され得る。一実装例において、逆変換及び量子化解除のスケーリングを組み合わせてもよい。あるいは、カスタマイズされた量子化テーブルを使用し、それをエンコーダからデコーダへ例えばビットストリーム内でシグナリングしてもよい。量子化は、非可逆演算であり、量子化ステップサイズを大きくするのに伴って損失が増加する。

ビデオエンコーダ２０の実施形態（それぞれ量子化ユニット２０８）は、エントロピー符号化ユニット２７０を介して、量子化パラメータ（ＱＰ）を、例えば直接又は符号化して出力するように構成されることができ、その結果、例えば、ビデオデコーダ３０が復号のために量子化パラメータを受信して適用し得る。

逆量子化
逆量子化ユニット２１０は、例えば、量子化ユニット２０８と同じ量子化ステップサイズに基づいて又はそれを用いて、量子化ユニット２０８によって適用された量子化スキームの逆を適用することによって、量子化された係数に対して量子化ユニット２０８の逆量子化を適用して、量子化解除された係数２１１を得るように構成される。量子化解除された係数２１１は、量子化解除された残差係数２１１として参照されることもあり、変換係数２０７に対応するが、典型的には量子化による損失のために変換係数と同じではない。

逆変換
逆変換処理ユニット２１２は、例えば、逆の離散コサイン変換（ＤＣＴ）、逆の離散サイン変換（ＤＳＴ）、又は他の逆変換といった、変換処理ユニット２０６によって適用された変換の逆変換を適用して、サンプルドメインにおける再構成残差ブロック２１３（又は対応する量子化解除された係数２１３）を得るように構成される。再構成残差ブロック２１３は、変換ブロック２１３として参照されることもある。

再構成
再構成ユニット２１４（例えば、加算器（adder又はsummer）２１４）は、例えば再構成残差ブロック２１３のサンプル値と予測ブロック２６５のサンプル値とをサンプル毎に足し合わせることによって、変換ブロック２１３（すなわち、再構成残差ブロック２１３）を予測ブロック２６５に足し合わせて、サンプルドメインにおける再構成ブロック２１５を得るように構成される。

フィルタリング
ループフィルタユニット２２０（又は略して“ループフィルタ”２２０）は、再構成ブロック２１５をフィルタリングして、フィルタリングされたブロック２２１を得るように構成され、又は一般に、再構成サンプルをフィルタリングして、フィルタリングされたサンプル値を得るように構成される。ループフィルタユニットは、例えば、ピクセル遷移を平滑化するように構成され、又はその他の方法で映像品質を向上させるように構成される。ループフィルタユニット２２０は、例えば、デブロッキングフィルタ、サンプル適応オフセット（sample-adaptive offset；ＳＡＯ）フィルタ、又は例えば適応ループフィルタ（adaptive loop filter；ＡＬＦ）、ノイズ抑制フィルタ（noise suppression filter；ＮＳＦ）若しくはこれらの任意の組み合わせといった１つ以上の他のフィルタなどの、１つ以上のループフィルタを有し得る。一例において、ループフィルタユニット２２０は、デブロッキングフィルタ、ＳＡＯフィルタ、及びＡＬＦフィルタを有し得る。フィルタリングプロセスの順序は、デブロッキングフィルタ、ＳＡＯ及びＡＬＦとし得る。他の一例では、クロマスケーリング付きルママッピング（luma mapping with chroma scaling；ＬＭＣＳ）と呼ばれるプロセス（すなわち、適応インループリシェイパ）が追加される。このプロセスは、デブロッキングの前に実行される。他の一例において、デブロッキングフィルタプロセスは、例えば、アフィンサブブロックエッジ、ＡＴＭＶＰサブブロックエッジ、サブブロック変換（sub-block transform；ＳＢＴ）エッジ、及びイントラサブパーティション（intra sub-partition；ＩＳＰ）エッジといった、内部のサブブロックエッジにも適用され得る。ループフィルタユニット２２０は、図２ではインループフィルタとして示されているが、他の構成では、ループフィルタユニット２２０は、ポストループフィルタとして実装されてもよい。フィルタリングされたブロック２２１は、フィルタリングされた再構成ブロック２２１として参照されることもある。

ビデオエンコーダ２０の実施形態（それぞれループフィルタユニット２２０）は、エントロピー符号化ユニット２７０を介して、ループフィルタパラメータ（例えば、ＳＡＯフィルタパラメータ又はＡＬＦフィルタパラメータ又はＬＭＣＳパラメータなど）を、例えば直接又は符号化して出力するように構成されることができ、その結果、例えば、デコーダ３０が復号のために同じループフィルタパラメータ又はそれぞれのループフィルタを受信して適用使用し得る。

復号ピクチャバッファ
復号ピクチャバッファ（ＤＰＢ）２３０は、ビデオエンコーダ２０によって映像データを符号化するための参照ピクチャ又は一般に参照ピクチャデータを格納するメモリとし得る。ＤＰＢ２３０は、例えば、同期ＤＲＡＭ（ＳＤＲＡＭ）を含めたダイナミックランダムアクセスメモリ（ＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗ＲＡＭ（ＲＲＡＭ）、又は他のタイプのメモリデバイスなどの、多様なメモリデバイスのうちのいずれかによって形成され得る。復号ピクチャバッファ（ＤＰＢ）２３０は、フィルタリングされた１つ以上のブロック２２１を格納するように構成され得る。復号ピクチャバッファ２３０は更に、同じ現在ピクチャの又は例えば先行再構成ピクチャなどの異なるピクチャの、先行して再構成されてフィルタリングされたブロック２２１といった、他の先行したフィルタリングされたブロックを格納するように構成されてもよく、また、例えばインター予測のために、完全な先行した再構成すなわち復号されたピクチャ（並びに対応する参照ブロック及びサンプル）、及び／又は部分的に再構成された現在ピクチャ（並びに対応する参照ブロック及びサンプル）を提供し得る。復号ピクチャバッファ（ＤＰＢ）２３０はまた、例えば再構成ブロック２１５がループフィルタユニット２２０によってフィルタリングされない場合に、１つ以上のフィルタリングされていない再構成ブロック２１５、又は一般に、フィルタリングされていない再構成サンプルを格納するように構成されてもよく、あるいは、再構成ブロック又は再構成サンプルの任意の他の更に処理されたバージョンを格納するように構成されてもよい。

モード選択（分割＆予測）
モード選択ユニット２６０は、分割ユニット２６２、インター予測ユニット２４４、及びイントラ予測ユニット２５４を有し、例えば元のブロック２０３（現在ピクチャ１７の現在ブロック２０３）といった、元のピクチャデータと、例えば復号ピクチャバッファ２３０又は他のバッファ（例えば、ラインバッファ、図示せず）からの、例えば同一（現在）ピクチャの及び／又は１つ若しくは複数の先行復号ピクチャからのフィルタリングされた及び／又はフィルタリングされていない再構成サンプル若しくはブロックといった、再構成ピクチャデータと、を受信又は取得するように構成される。再構成ピクチャデータは、予測ブロック２６５又は予測子２６５を得るために、例えばインター予測又はイントラ予測である予測のための参照ピクチャデータとして使用される。

モード選択ユニット２６０は、現在ブロック予測モードについての分割（分割なしを含む）及び予測モード（例えば、イントラ又はインター予測モード）を決定又は選択し、対応する予測ブロック２６５を生成するように構成されることができ、該予測ブロック２６５が、残差ブロック２０５の計算のため及び再構成ブロック２１５の再構成のために使用される。

モード選択ユニット２６０の実施形態は、最良の一致若しくは換言して最小の残差（最小の残差は、伝送又は記憶のためにより良い圧縮を意味する）又は最小のシグナリングオーバヘッド（最小のシグナリングオーバヘッドは、伝送又は記憶のためにより良い圧縮を意味する）を提供するものである、あるいは両方を考慮するかバランスさせるかするものである分割及び予測モードを（例えば、モード選択ユニット２６０によってサポートされているもの又はモード選択ユニット２６０に利用可能なものから）選択するように構成され得る。モード選択ユニット２６０は、レート歪み最適化（rate distortion optimization；ＲＤＯ）に基づいて分割及び予測モードを決定するように、すなわち、最小のレート歪みを提供する予測モードを選択するように構成されてもよい。この文脈における“最良”、“最小”、“最適”のような用語は、必ずしも全体的な“最良”、“最小”、“最適”などを意味するわけではなく、値が閾値又は他の制約を上回るか下回るかして、“準最適な選択”ではあるが複雑さ及び処理時間を減少させることにつながる可能性があるといったような、終了基準又は選択基準の達成をも意味し得る。

換言すれば、分割ユニット２６２は、映像シーケンスからのピクチャを一連のコーディングツリーユニット（ＣＴＵ）へと分割するように構成されることができ、ＣＴＵ２０３は更に、例えば、四分木分割（ＱＴ）、二分木分割（ＢＴ）若しくは三分木分割（ＴＴ）、又はこれらの任意の組み合わせを繰り返し用いて、より小さいブロックパーティション又はサブブロック（これらもやはりブロックを形成する）へと分割されることができ、また、分割ユニット２６２は、例えば、ブロックパーティション又はサブブロックの各々について予測を実行するように構成されることができ、モード選択は、分割されるブロック２０３のツリー構造の選択を有し、予測モードは、ブロックパーティション又はサブブロックの各々に適用される。

以下、ビデオエンコーダ２０の一例によって行われる分割（例えば、分割ユニット２６０による）及び予測処理（インター予測ユニット２４４及びイントラ予測ユニット２５４による）を更に詳細に説明する。

分割
分割ユニット２６２は、映像シーケンスからのピクチャを一連のコーディングツリーユニット（ＣＴＵ）に分割するように構成されることができ、また、分割ユニット２６２は、コーディングツリーユニット２０３を、例えば正方形又は長方形のいっそう小さいサイズのブロックといった、より小さいパーティションに分割する（又はスプリットする）ことができる。３つのサンプルアレイを持つピクチャでは、ＣＴＵは、ルマサンプルのＮ×Ｎブロックを対応する２つのクロマサンプルのブロックと共に備えて構成される。ＣＴＵでのルマブロックの最大許容サイズは、開発中のバーサタイルビデオコーディング（ＶＶＣ）では１２８×１２８であるように指定されているが、将来的には、例えば２５６×２５６など、１２８×１２８ではない値であるように指定されるかもしれない。ピクチャのこれらＣＴＵが、スライス／タイルグループ、タイル又はブリックとしてクラスタ化／グループ化され得る。タイルはピクチャの長方形領域をカバーし、タイルは１つ以上のブリックへと分けられ得る。ブリックは、タイル内のある数のＣＴＵ行で構成される。複数のブリックへと分割されないタイルは、ブリックとして参照されることがある。しかし、ブリックは、タイルのうちの真のサブセットであり、タイルとして参照されることはない。ＶＶＣでは、ラスタスキャンスライス／タイルグループモードと矩形スライスモードという、タイルグループの２つのモードがサポートされている。ラスタスキャンタイルグループモードにおいて、スライス／タイルグループは、ピクチャのタイルラスタスキャンにおける一連のタイルを含む。矩形スライスモードでは、スライスは、ピクチャの矩形領域を集団で形成する、ピクチャのある数のブリックを含む。矩形スライス内のブリックは、スライスのブリックラスタスキャンの順である。より小さいこれらのブロック（これらはサブブロックとして参照されることもある）が、さらに小さいパーティションへと更に分割されてもよい。これは、ツリー分割又は階層ツリー分割とも呼ばれ、例えばルートツリーレベル０（階層レベル０、深さ０）にあるルートブロックを再帰的に分割することができ、例えば、ツリーレベル１（階層レベル１、深さ１）にあるノードといった次の下位ツリーレベルの２つ以上のブロックに分割され、これらのブロックが再び、例えばツリーレベル２（階層レベル２、深さ２）といった次の下位レベルの２つ以上のブロックに分割される等々、例えば最大ツリー深さ又は最小ブロックサイズに到達するといった終了基準が満たされるなどによって分割が終了するまで続けられ得る。それ以上分割されないブロックは、ツリーのリーフブロック又はリーフノードとも呼ばれる。２つのパーティションへの分割を用いるツリーは二分木（ＢＴ）と呼ばれ、３つのパーティションへの分割を用いるツリーは三分木（ＴＴ）と呼ばれ、そして、４つのパーティションへの分割を用いるツリーは四分木（ＱＴ）と呼ばれる。

例えば、コーディングツリーユニット（ＣＴＵ）は、３つのサンプルアレイを有するピクチャの、ルマサンプルのＣＴＢ、２つの対応するクロマサンプルのＣＴＢ、又はモノクロピクチャの若しくは３つの別々のカラープレーンを用いてコーディングされるピクチャのサンプルのＣＴＢと、サンプルをコーディングするのに使用される構文構造、であるとすることができ、あるいはそれらを有することができる。対応して、コーディングツリーブロック（ＣＴＢ）は、何らかの値ＮでのサンプルのＮ×Ｎブロックとすることができ、ある成分を複数のＣＴＢへと分けることが分割である。コーディングユニット（ＣＵ）は、３つのサンプルアレイを有するピクチャの、ルマサンプルのコーディングブロック、２つの対応するクロマサンプルのコーディングブロック、又はモノクロピクチャの若しくは３つの別々のカラープレーンを用いてコーディングされるピクチャのサンプルのコーディングブロックと、サンプルをコーディングするのに使用される構文構造、であるとすることができ、あるいはそれらを有することができる。対応して、コーディングブロック（ＣＢ）は、何らかの値Ｍ及びＮでのサンプルのＭ×Ｎブロックとすることができ、ＣＴＢを複数のコーディングブロックへと分けることが分割である。

実施形態において、例えばＨＥＶＣによれば、コーディングツリーユニット（ＣＴＵ）は、コーディングツリーと表記される四分木構造を用いることによってＣＵにスプリットされ得る。ピクチャ領域をインターピクチャ（時間）予測を用いてコーディングするか、それともイントラピクチャ（空間）予測を用いてコーディングするかの決定が、リーフＣＵレベルで為される。各リーフＣＵが更に、ＰＵスプリットタイプに従って、１つ、２つ、又は４つのＰＵにスプリットされ得る。１つのＰＵ内では、同じ予測プロセスが適用され、関連情報がＰＵベースでデコーダに伝送される。ＰＵスプリット型に基づいて予測プロセスを適用することによって残差ブロックを得た後に、リーフＣＵが、ＣＵに対するコーディングツリーと同様の別の四分木構造に従って変換ユニット（ＴＵ）に分割され得る。

実施形態において、例えばバーサタイルビデオコーディング（ＶＶＣ）と称される現在開発中の最新の映像コーディング標準によれば、二分割及び三分割セグメンテーション構造を用いるコンバインド四分木ネスト化マルチタイプツリーが、例えば、コーディングツリーユニットを分割するために使用される。コーディングツリーユニット内のコーディングツリー構造において、ＣＵは正方形又は長方形のいずれかの形状を持つことができる。例えば、コーディングツリーユニット（ＣＴＵ）は先ず四分木によって分割される。次いで、四分木リーフノードが更にマルチタイプツリー構造によって分割され得る。マルチタイプツリー構造には、垂直二分割（SPLIT_BT_VER）、水平二分割（SPLIT_BT_HOR）、垂直三分割（SPLIT_TT_VER)、水平三分割（SPLIT_TT_HOR）という４つのスプリットタイプが存在する。マルチタイプツリーリーフノードはコーディングユニット（ＣＵ）と呼ばれ、ＣＵが最大変換長に対して大きすぎない限り、このセグメンテーションが、更なる分割なしで予測及び変換処理に使用される。これが意味することは、ほとんどのケースで、ネスト化マルチタイプツリーコーディングブロック構造を持つ四分木においてＣＵ、ＰＵ、及びＴＵは同じブロックサイズを持つということである。例外が、サポートされる最大変換長がＣＵの色成分の幅又は高さよりも小さいときに発生する。ＶＶＣは、ネスト化マルチタイプツリーコーディングツリー構造を有する四分木におけるパーティションスプリット情報の、独特なシグナリング機構を開発している。そのシグナリング機構において、コーディングツリーユニット（ＣＴＵ）は四分木のルートとして扱われ、先ず四分木構造によって分割される。次いで、各四分木ツリーリーフノード（それを許すのに十分な大きさである場合）が更にマルチタイプツリー構造によって分割される。マルチタイプツリー構造では、ノードが更に分割されるかを指し示すために第１のフラグ（mtt_split_cu_flag）がシグナリングされ、ノードが更に分割される場合、スプリット方向を指し示すために第２のフラグ（mtt_split_cu_vertical_flag）がシグナリングされ、そして、スプリットが二分割であるのか三分割であるのかを指し示すために第３のフラグ（mtt_split_cu_binary_flag）がシグナリングされる。mtt_split_cu_vertical_flag及びmtt_split_cu_binary_flagの値に基づき、ＣＵのマルチタイプツリースプリットモード（MttSplitMode）が、予め定められたルール又はテーブルに基づいてデコーダによって導出され得る。なお、例えばＶＶＣハードウェアデコーダにおける６４×６４ルマブロック及び３２×３２クロマパイプライン設計といった、ある特定の設計では、図６に示すように、ルマコーディングブロックの幅又は高さのいずれかが６４よりも大きい場合にＴＴスプリットが禁止される。ＴＴスプリットはまた、クロマコーディングブロックの幅又は高さのいずれかが３２よりも大きい場合にも禁止される。このパイプライン設計は、ピクチャを、ピクチャ内の重なり合わないユニットとして画成される仮想パイプラインデータユニット（Virtual pipeline data unit；ＶＰＤＵ）へと分けることになる。ハードウェアデコーダにて、連続したＶＰＤＵが複数のパイプライン段によって同時に処理される。ＶＰＤＵサイズは、ほとんどのパイプライン段におけるバッファサイズにおおよそ比例し、それ故に、ＶＰＤＵサイズを小さく保つことが重要である。ほとんどのハードウェアデコーダでは、ＶＰＤＵサイズは最大の変換ブロック（ＴＢ）サイズに設定され得る。しかしながら、ＶＶＣでは、三分木（ＴＴ）及び二分木（ＢＴ）パーティションが、ＶＰＤＵサイズの増大につながり得る。

さらに、留意すべきことには、ツリーノードブロックの一部が下又は右のピクチャ境界を越える場合、そのツリーノードブロックは、コーディングされる全ＣＵの全てのサンプルがピクチャ境界の内側に位置するまでスプリットされることを強いられる。

一例として、イントラサブパーティション（Intra Sub-Partitions；ＩＳＰ）ツールは、ルマイントラ予測ブロックを、ブロックサイズに応じて、垂直方向又は水平方向に２つ又は４つのサブパーティションへと分け得る。

一例において、ビデオエンコーダ２０のモード選択ユニット２６０は、ここに記載される分割技術の任意の組み合わせを実行するように構成されてもよい。

上述のように、ビデオエンコーダ２０は、（例えば、所定の）予測モードのセットから最良又は最適な予測モードを決定又は選択するように構成される。予測モードのセットは、例えば、複数のイントラ予測モード及び／又は複数のインター予測モードを有し得る。

イントラ予測
イントラ予測モードのセットは、例えばＨＥＶＣで規定されるように、３５個の異なるイントラ予測モード、例えば、ＤＣ（又は平均）モード及びプレーナモードのような非方向モード、又は方向モード、を有することができ、あるいは、ＶＶＣ向けに規定されるように、６７個の異なるイントラ予測モード、例えば、ＤＣ（又は平均）モード及びプレーナモードのような非方向モード、又は方向モード、を有することができる。一例として、幾つかの従来の角度イントラ予測モードが、例えばＶＶＣで規定されるように、非正方形ブロック向けの広角イントラ予測モードに適応的に置き換えられる。他の一例として、ＤＣ予測での除算演算を回避するために、非正方形ブロックについての平均を計算するのに、長辺側のみが使用される。また、プレーナモードのイントラ予測の結果が、位置依存イントラ予測組み合わせ（position dependent intra prediction combination；ＰＤＰＣ）法によって更に修正され得る。

イントラ予測ユニット２５４は、同じ現在ピクチャの隣接ブロックの再構成サンプルを用いて、イントラ予測モードのセットのうちのあるイントラ予測モードに従ってイントラ予測ブロック２６５を生成するように構成される。

イントラ予測ユニット２５４（又は、一般に、モード選択ユニット２６０）は更に、イントラ予測パラメータ（又は、一般に、そのブロックに対して選択されたイントラ予測モードを指し示す情報）を、符号化ピクチャデータ２１に含める構文要素２６６の形態で、エントロピー符号化ユニット２７０に出力するように構成され、その結果、例えば、ビデオデコーダ３０が復号のために予測パラメータを受信して使用し得る。

インター予測
インター予測モード（又は取り得るインター予測モード）のセットは、利用可能な参照ピクチャ（すなわち、先行する少なくとも部分的に復号されたピクチャ、例えば、ＤＢＰ２３０に格納されている）、及び他のインター予測パラメータ、例えば、最良一致の参照ブロックを探索するために使用されるのが、参照ピクチャのうち、参照ピクチャ全体であるのか、それとも、例えば現在ブロックの領域の周りのサーチウィンドウ領域といった一部のみであるのか、及び／又は、例えば、例えば二分の一／半ペル、四分の一ペル、及び／又は１／１６ペル補間といったピクセル補間が適用されるか否か、に依存する。

上の予測モードに加えて、スキップモード、直接モード、及び／又は他のインター予測モードが適用されてもよい。

例えば、拡張マージ予測では、そのようなモードのマージ候補リストが、次の５種類の候補を順に含めることによって構築される：空間隣接ＣＵからの空間ＭＶＰ、コロケートＣＵからの時間ＭＶＰ、ＦＩＦＯテーブルからの履歴ベースＭＶＰ、ペア平均ＭＶＰ、及びゼロＭＶ。また、マージモードのＭＶの精度を高めるために、バイラテラルマッチングベースのデコーダ側動きベクトル精緻化（decoder side motion vector refinement；ＤＭＶＲ）が適用されてもよい。動きベクトル差を使用するマージモードに由来するものであるＭＶＤ付きマージモード（Merge mode with MVD；ＭＭＶＤ）では、スキップフラグ及びマージフラグを送った直後に、ＣＵに対してＭＭＶＤモードが使用されるのかを指定するために、ＭＭＶＤフラグがシグナリングされる。また、ＣＵレベルの適応動きベクトルレゾリューション（adaptive motion vector resolution；ＡＭＶＲ）スキームが適用されてもよい。ＡＭＶＲは、ＣＵのＭＶＤが異なるか精度でコーディングされることを可能にする。現在ＣＵに対する予測モードに応じて、現在ＣＵのＭＶＤが適応的に選択され得る。ＣＵがマージモードでコーディングされるとき、コンバインドイントラ／インター予測（combined inter/intra prediction；ＣＩＩＰ）モードが現在ＣＵに適用されてもよい。ＣＩＩＰ予測を得るために、インター予測信号及びイントラ予測信号の加重平均が行われる。アフィン運動補償予測では、ブロックのアフィン動きフィールドが、２つの制御点（４パラメータ）又は３つの制御点（６パラメータ）の動きベクトルの動き情報によって記述される。サブブロックベース時間動きベクトル予測（subblock-based temporal motion vector prediction；ＳｂＴＭＶＰ）は、ＨＥＶＣにおける時間動きベクトル予測（temporal motion vector prediction；ＴＭＶＰ）と同様であるが、現在ＣＵ内のサブＣＵの動きベクトルを予測するものである。以前はＢＩＯと呼ばれていた双方向オプティカルフロー（bi-directional optical flow；ＢＤＯＦ）は、特に乗算の数及び乗数のサイズに関して遥かに少ない計算のみを必要とするいっそう単純なバージョンである。三角パーティションモードでは、そのようなモードにおいて、対角スプリット又は逆対角スプリットのいずれかを用いてＣＵが２つの三角形パーティションに等分される。その他にも、双予測モードは、２つの予測信号の加重平均を可能にするために、単純平均を超えるものに拡張されている。

インター予測ユニット２４４は、動き推定（ＭＥ）ユニット及び動き補償（ＭＣ）ユニット（どちらも図２には示さず）を含み得る。動き推定ユニットは、動き推定のために、ピクチャブロック２０３（現在ピクチャ１７の現在ピクチャブロック２０３）と、復号ピクチャ２３１、又は例えば１つ又は複数の他の／異なる先行復号ピクチャ２３１の再構成ブロックといった少なくとも１つ又は複数の先行再構成ブロックと、を受信又は取得するように構成され得る。例えば、映像シーケンスは現在ピクチャと先行復号ピクチャ２３１とを有することができ、すなわち換言すれば、現在ピクチャ及び先行復号ピクチャ２３１は、映像シーケンスを形成する一連のピクチャの一部であることができ、あるいはそれを形成することができる。

エンコーダ２０は、例えば、複数の他のピクチャの中の同一ピクチャ又は複数の異なるピクチャの複数の参照ブロックから参照ブロックを選択し、参照ピクチャ（又は参照ピクチャインデックス）及び／又は参照ブロックの位置（ｘ，ｙ座標）と現在ブロックの位置との間のオフセット（空間オフセット）を、インター予測パラメータとして、動き推定ユニットに提供するように構成され得る。このオフセットは、動きベクトル（ＭＶ）とも呼ばれる。

動き補償ユニットは、インター予測パラメータを例えば受信するなどして取得し、インター予測パラメータに基づいて又はそれを用いてインター予測を実行して、インター予測ブロック２６５を得るように構成される。動き補償ユニットによって実行される動き補償は、動き推定によって決定された動き／ブロックベクトルに基づいて、予測ブロックをフェッチ又は生成することを含むことができ、場合により、サブピクセル精度への補間を実行する。補間フィルタリングは、既知のピクセルサンプルから追加のピクセルサンプルを生成することができ、それ故に、ピクチャブロックを符号化するのに使用され得る候補予測ブロックの数を増やせる可能性がある。現在ピクチャブロックのＰＵに関する動きベクトルを受信すると、動き補償ユニットは、動きベクトルが指す予測ブロックを参照ピクチャリストのうちの１つ内で位置特定し得る。

動き補償ユニットはまた、映像スライスのピクチャブロックを復号する際にビデオデコーダ３０によって使用される、ブロック及び映像スライスに関連する構文要素を生成し得る。スライス及びそれぞれの構文要素に加えて、又はこれらの代わりとして、タイルグループ及び／又はタイル並びにそれぞれの構文要素が生成されるか使用されるかしてもよい。

エントロピーコーディング
エントロピー符号化ユニット２７０は、例えば、量子化された係数２０９、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ、及び／又は他の構文要素に対して、エントロピー符号化アルゴリズム若しくはスキーム（例えば、可変長コーディング（variable length coding；ＶＬＣ）スキーム、コンテキスト適応ＶＬＣスキーム（context adaptive VLC；ＣＡＶＬＣ）、算術コーディングスキーム、二値化、コンテキスト適応バイナリ算術コーディング（context adaptive binary arithmetic coding；ＣＡＢＡＣ）、構文スベースコンテキスト適応バイナリ算術コーディング（syntax-based context-adaptive binary arithmetic coding；ＳＢＡＣ）、確率インターバルパーティショニングエントロピー（probability interval partitioning entropy；ＰＩＰＥ）コーディング、又は他のエントロピー符号化方法若しくは技術）又はバイパス（圧縮なし）を適用して、出力２７２を用いて出力され得る符号化ピクチャデータ２１を例えば符号化ビットストリーム２１の形態で得るように構成され、その結果、例えば、ビデオデコーダ３０が復号のためにこれらのパラメータを受信して使用し得る。符号化ビットストリーム２１は、ビデオデコーダ３０に送信されてもよいし、あるいは、後の送信又はビデオデコーダ３０による取り出しのためにメモリに格納されてもよい。

映像ストリームを符号化するために、ビデオエンコーダ２０が他の構成バリエーションが使用されてもよい。例えば、非変換ベースのエンコーダ２０は、特定のブロック又はフレームに対して、変換処理ユニット２０６を用いずに直接的に残差信号を量子化することができる。他の一実装において、エンコーダ２０は、単一のユニットへと組み合わされた量子化ユニット２０８及び逆量子化ユニット２１０を有することができる。

デコーダ及び復号方法
図３は、この本出願の技術を実装するように構成されたビデオデコーダ３０の一例を示している。ビデオデコーダ３０は、例えばエンコーダ２０によって符号化された、符号化ピクチャデータ２１（例えば、符号化ビットストリーム２１）を受信して、復号ピクチャ３３１を得るように構成される。符号化ピクチャデータ又はビットストリームは、例えば、符号化映像スライス（及び／又はタイルグループ若しくはタイル）のピクチャブロックを表すデータ及び付随する構文要素といった、符号化ピクチャデータを復号するための情報を有する。

図３の例において、デコーダ３０は、エントロピー復号ユニット３０４、逆量子化ユニット３１０、逆変換処理ユニット３１２、再構成ユニット３１４（例えば、加算器３１４）、ループフィルタ３２０、復号ピクチャバッファ（ＤＢＰ）３３０、モード適用ユニット３６０、インター予測ユニット３４４、及びイントラ予測ユニット３５４を有している。インター予測ユニット３４４は、動き補償ユニットとすることができ、あるいはそれを含むことができる。ビデオデコーダ３０は、一部の例において、図２からのビデオエンコーダ１００に関して説明した符号化パスに対して概して逆の復号パスを実行し得る。

エンコーダ２０に関して説明したように、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、ループフィルタ２２０、復号ピクチャバッファ（ＤＰＢ）２３０、インター予測ユニット３４４、及びイントラ予測ユニット３５４はまた、ビデオエンコーダ２０の“内蔵デコーダ”を形成するとしても参照される。従って、逆量子化ユニット３１０は、機能において逆量子化ユニット１１０に同じであるとすることができ、逆変換処理ユニット３１２は、機能において逆変換処理ユニット２１２に同じであるとすることができ、再構成ユニット３１４は、機能において再構成ユニット２１４に同じであるとすることができ、ループフィルタ３２０は、機能においてループフィルタ２２０に同じであるとすることができ、復号ピクチャバッファ３３０は、機能において復号ピクチャバッファ２３０に同じであるとすることができる。従って、ビデオエンコーダ２０のそれぞれのユニット及び機能についての説明は、対応して、ビデオデコーダ３０のそれぞれのユニット及び機能に当てはまる。

エントロピー復号
エントロピー復号ユニット３０４は、ビットストリーム２１（又は、一般に、符号化ピクチャデータ２１）を構文解析し、例えば、符号化ピクチャデータ２１に対してエントロピー復号を実行して、例えば、量子化された係数３０９、及び／又は復号されたコーディングパラメータ（図３には示さず）、例えば、インター予測パラメータ（例えば、参照ピクチャインデックス及び動きベクトル）、イントラ予測パラメータ（例えば、イントラ予測モード又はインデックス）、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、及び／又は他の構文要素のうちのいずれか又は全て、を得るように構成される。エントロピー復号ユニット３０４は、エンコーダ２０のエントロピー符号化ユニット２７０に関して説明した符号化スキームに対応する復号アルゴリズム又はスキームを適用するように構成され得る。エントロピー復号ユニット３０４は更に、インター予測パラメータ、イントラ予測パラメータ及び／又は他の構文要素をモード適用ユニット３６０に提供するとともに、他のパラメータをデコーダ３０の他のユニットに提供するように構成され得る。ビデオデコーダ３０は、映像スライスレベル及び／又は映像ブロックレベルで構文要素を受信し得る。スライス及びそれぞれの構文要素に加えて、又はこれらの代わりとして、タイルグループ及び／又はタイル並びにそれぞれの構文要素が受信及び／又は使用されてもよい。

逆量子化
逆量子化ユニット３１０は、符号化ピクチャデータ２１から量子化パラメータ（ＱＰ）（又は、一般に、逆量子化に関する情報）及び量子化された係数を受け取り（例えばエントロピー復号ユニット３０４により、例えば構文解析及び／又は復号することによって）、復号した量子化された係数３０９に対して量子化パラメータに基づいて逆量子化を適用して、変換係数３１１としても参照され得るものである量子化解除された係数３１１を得るように構成され得る。逆量子化プロセスは、量子化の程度、及び同様に、適用されるべき逆量子化の程度を決定するために、映像スライス（又はタイル若しくはタイルグループ）内の各映像ブロックに対してビデオエンコーダ２０によって決定された量子化パラメータを使用することを含み得る。

逆変換
逆変換処理ユニット３１２は、変換係数３１１とも称される量子化解除された係数３１１を受け取り、そして、サンプルドメインにおける再構成残差ブロック２１３を得るために、量子化解除された係数３１１に変換を適用するように構成され得る。再構成残差ブロック２１３は、変換ブロック３１３として参照されることもある。この変換は、例えば逆ＤＣＴ、逆ＤＳＴ、逆整数変換、又は概念的に類似した逆変換プロセスといった、逆変換とし得る。逆変換処理ユニット３１２は更に、符号化ピクチャデータ２１から変換パラメータ又は対応する情報を受け取り（例えばエントロピー復号ユニット３０４により、例えば構文解析及び／又は復号することによって）、量子化解除された係数３１１に適用すべき変換を決定するように構成され得る。

再構成
再構成ユニット３１４（例えば、加算器（adder又はsummer）３１４）は、例えば再構成残差ブロック３１３のサンプル値と予測ブロック３６５のサンプル値とを足し合わせることによって、再構成残差ブロック３１３を予測ブロック３６５に足し合わせて、サンプルドメインにおける再構成ブロック３１５を得るように構成され得る。

フィルタリング
ループフィルタユニット３２０（コーディングループ内又はコーディングループ後のいずれか）は、例えば、ピクセル遷移を平滑化するために、又はその他の方法で映像品質を向上させるために、再構成ブロック３１５をフィルタリングして、フィルタリングされたブロック３２１を得るように構成される。ループフィルタユニット３２０は、例えば、デブロッキングフィルタ、サンプル適応オフセット（sample-adaptive offset；ＳＡＯ）フィルタ、又は例えば適応ループフィルタ（adaptive loop filter；ＡＬＦ）、ノイズ抑制フィルタ（noise suppression filter；ＮＳＦ）若しくはこれらの任意の組み合わせといった１つ以上の他のフィルタなどの、１つ以上のループフィルタを有し得る。一例において、ループフィルタユニット２２０は、デブロッキングフィルタ、ＳＡＯフィルタ、及びＡＬＦフィルタを有し得る。フィルタリングプロセスの順序は、デブロッキングフィルタ、ＳＡＯ及びＡＬＦとし得る。他の一例では、クロマスケーリング付きルママッピング（luma mapping with chroma scaling；ＬＭＣＳ）と呼ばれるプロセス（すなわち、適応インループリシェイパ）が追加される。このプロセスは、デブロッキングの前に実行される。他の一例において、デブロッキングフィルタプロセスは、例えば、アフィンサブブロックエッジ、ＡＴＭＶＰサブブロックエッジ、サブブロック変換（sub-block transform；ＳＢＴ）エッジ、及びイントラサブパーティション（intra sub-partition；ＩＳＰ）エッジといった、内部のサブブロックエッジにも適用され得る。ループフィルタユニット３２０は、図３ではインループフィルタとして示されているが、他の構成では、ループフィルタユニット３２０は、ポストループフィルタとして実装されてもよい。

復号ピクチャバッファ
そして、ピクチャの復号映像ブロック３２１は、他のピクチャの後の動き補償のための参照ピクチャとして及び／又はそれぞれの表示の出力のために復号ピクチャ３３１を格納するものである復号ピクチャバッファ３３０に格納される。

デコーダ３０は、復号ピクチャ３１１を、ユーザへの提示又は表示のために例えば出力３１２を介して出力するように構成される。

予測
機能において、インター予測ユニット３４４はインター予測ユニット２４４（特に、動き補償ユニット）に同じであるとすることができ、イントラ予測ユニット３５４はイントラ予測ユニット２５４と同じであるとすることができ、符号化ピクチャデータ２１から受信した（例えばエントロピー復号ユニット３０４により、構文解析及び／又は復号することによって）分割及び／又は予測パラメータ若しくはそれぞれの情報に基づいて、スプリット若しくは分割の決定及び予測を実行する。モード適用ユニット３６０は、再構成ピクチャ、ブロック又はそれぞれのサンプル（フィルタリングされた又はフィルタリングされていない）に基づいてブロック毎に予測（イントラ予測又はインター予測）を実行して、予測ブロック３６５を得るように構成され得る。

映像スライスがイントラコーディング（Ｉ）スライスとしてコーディングされるとき、モード適用ユニット３６０のイントラ予測ユニット３５４は、シグナリングされたイントラ予測モードと、現在ピクチャの先行復号ブロックからのデータとに基づいて、現在映像スライスのピクチャブロックについての予測ブロック３６５を生成するように構成される。映像ピクチャが、インターコーディング（すなわち、Ｂ又はＰ）スライスとしてコーディングされるとき、モード適用ユニット３６０のインター予測ユニット３４４（例えば、動き補償ユニット）は、エントロピー復号ユニット３０４から受信した動きベクトル及び他の構文要素に基づいて、現在映像スライスの映像ブロックについての予測ブロック３６５を生成するように構成される。インター予測では、参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つから予測ブロックが生成され得る。ビデオデコーダ３０は、ＤＰＢ３３０に格納された参照ピクチャに基づいて、デフォルトの構築技術を使用して、リスト０及びリスト１なる参照フレームリストを構築し得る。スライス（例えば、映像スライス）に加えて又は代えてタイルグループ（例えば、映像タイルグループ）及び／又はタイル（例えば、映像タイル）を使用する実施形態に対しても、又はそのような実施形態によっても、同じ又は同様のものを適用することができ、例えば、Ｉ、Ｐ又はＢタイルグループ及び／又はタイルを用いて映像がコーディングされ得る。

モード適用ユニット３６０は、動きベクトル又は関連情報と他の構文要素とを構文解析することによって、現在映像スライスの映像ブロックについての予測情報を決定するように構成され、該予測情報を使用して、復号している現在映像ブロックについての予測ブロックを生成する。例えば、モード適用ユニット３６０は、受け取った構文要素の一部を用いて、映像スライスの映像ブロックをコーディングするのに使用された予測モード（例えば、イントラ予測又はインター予測）、インター予測スライスタイプ（例えば、Ｂスライス、Ｐスライス、又はＧＰＢスライス）、スライスに関する参照ピクチャリストのうちの１つ以上の構築情報、スライスの各インター符号化映像ブロックについての動きベクトル、スライスの各インターコーディング映像ブロックについてのインター予測ステータス、及び現在映像スライス内の映像ブロックを復号するための他の情報を決定する。スライス（例えば、映像スライス）に加えて又は代えてタイルグループ（例えば、映像タイルグループ）及び／又はタイル（例えば、映像タイル）を使用する実施形態に対しても、又はそのような実施形態によっても、同じ又は同様のものを適用することができ、例えば、Ｉ、Ｐ又はＢタイルグループ及び／又はタイルを用いて映像がコーディングされ得る。

図３に示すビデオデコーダ３０の実施形態は、スライス（映像スライスとしても参照される）を使用することによってピクチャを分割及び／又は復号するように構成されることができ、ピクチャが、１つ以上のスライス（典型的に重なり合わない）に分割され又は１つ以上のスライス（典型的に重なり合わない）を用いて復号され得るとともに、各スライスが、１つ以上のブロック（例えば、ＣＴＵ）又は１つ以上のグループのブロック（例えば、タイル（Ｈ．２６５／ＨＥＶＣ及びＶＶＣ）又はブリック（ＶＶＣ））を有し得る。

図３に示すビデオデコーダ３０の実施形態は更に、スライス／タイルグループ（映像タイルグループとしても参照される）及び／又はタイル（映像タイルとしても参照される）を使用することによってピクチャを分割及び／又は復号するように構成されることができ、ピクチャが、１つ以上のスライス／タイルグループ（典型的に重なり合わない）に分割され又は１つ以上のスライス／タイルグループ（典型的に重なり合わない）を用いて復号され得るとともに、各スライス／タイルグループが、例えば、１つ以上のブロック（例えば、ＣＴＵ）又は１つ以上のタイルを有することができ、各タイルは、例えば、矩形の形状のものとし得るとともに、例えば完全なるブロック又は部分的なブロックといった、１つ以上のブロック（例えば、ＣＴＵ）を有し得る。

符号化ピクチャデータ２１を復号するために、ビデオデコーダ３０の他のバリエーションが使用されてもよい。例えば、デコーダ３０は、ループフィルタリングユニット３２０を用いずに出力映像ストリームを生成することができる。例えば、非変換ベースのデコーダ３０は、特定のブロック又はフレームに対して、逆変換処理ユニット３１２を用いずに直接的に残差信号を逆量子化することができる。他の一実装において、ビデオデコーダ３０は、単一のユニットへと組み合わされた逆量子化ユニット３１０及び逆変換処理ユニット３１２を有することができる。

理解されるべきことには、エンコーダ２０及びデコーダ３０において、現在ステップの処理結果が更に処理されてから次ステップに出力されてもよい。例えば、補間フィルタリング、動きベクトル導出、又はループフィルタリングの後に、その補間フィルタリング、動きベクトル導出、又はループフィルタリングの処理結果に対して、例えばクリップ又はシフトなどの更なる操作が実行されてもよい。

なお、現在ブロックの導出される動きベクトル（以下に限られないが、アフィンモードの制御点動きベクトル、アフィン、プレーナ、ＡＴＭＶＰモードにおけるサブブロック動きベクトル、時間動きベクトルなどを含む）に対して、更なる操作が適用されてもよい。例えば、動きベクトルの値は、その表現ビットに従った予め定められた範囲に制約される。動きベクトルの表現ビットがbitDepthである場合、範囲は、－２＾（bitDepth－１）～２＾（bitDepth－１）－１であり、ここで“＾”は指数を意味する。例えば、bitDepthが１６に等しく設定される場合、範囲は、－３２７６８～３２７６７であり、bitDepthが１８に等しく設定される場合には、範囲は、－１３１０７２～１３１０７１である。例えば、導出される動きベクトル（例えば、１つの８×８ブロック内の４つの４×４サブブロックのＭＶ）の値は、それら４つの４×４サブブロックのＭＶの整数部の間の最大の差が、例えば１ピクセル以下など、Ｎピクセル以下であるように制約される。ここでは、bitDepthに従って動きベクトルを制約する２つの方法を提供する。

図４は、開示の一実施形態に従った映像コーディング装置４００の概略図である。映像コーディング装置４００は、ここに記載される開示実施形態を実装するのに適している。一実施形態において、映像コーディング装置４００は、例えば図１Ａのビデオデコーダ３０などのデコーダ又は例えば図１Ａのビデオエンコーダ２０などのエンコーダとし得る。

映像コーディング装置４００は、データを受信するための入口ポート４１０（又は入力ポート４１０）及び受信器ユニット（Ｒｘ）４２０と、データを処理するプロセッサ、論理ユニット、又は中央演算処理ユニット（ＣＰＵ）４３０と、データを送信するための送信器ユニット（Ｔｘ）４４０及び出口ポート４５０（又は出力ポート４５０）と、データを格納するためのメモリ４６０とを含んでいる。映像コーディング装置４００はまた、光信号又は電気信号の出口又は入口のために、入口ポート４１０、受信器ユニット４２０、送信器ユニット４４０、及び出口ポート４５０に結合された、光－電気（ＯＥ）コンポーネント及び電気－光（ＥＯ）コンポーネントを有し得る。

プロセッサ４３０は、ハードウェア及びソフトウェアによって実装される。プロセッサ４３０は、１つ以上の、ＣＰＵチップ、コア（例えば、マルチコアプロセッサとして）、ＦＰＧＡ、ＡＳＩＣ、及びＤＳＰとして実装され得る。プロセッサ４３０は、入口ポート４１０、受信器ユニット４２０、送信器ユニット４４０、出口ポート４５０、及びメモリ４６０と連通している。プロセッサ４３０は、コーディングモジュール４７０を有する。コーディングモジュール４７０は、上述の開示実施形態を実装する。例えば、コーディングモジュール４７０は、様々なコーディング演算を実装し、処理し、準備し、又は提供する。コーディングモジュール４７０を含むことは、それ故に、映像コーディング装置４００の機能への実質的な改良を提供し、異なる状態への映像コーディング装置４００の変換を実現する。あるいは、コーディングモジュール４７０は、メモリ４６０に格納されてプロセッサ４３０によって実行される命令として実装される。

メモリ４６０は、１つ以上のディスク、テープドライブ、及びソリッドステートドライブを有することができ、また、オーバーフローデータ記憶デバイスとして使用されて、プログラムが実行のために選択されるときにそのようなプログラムを格納するとともに、プログラム実行中に読み出される命令及びデータを格納し得る。メモリ４６０は、例えば、揮発性及び／又は不揮発性とすることができ、読み出し専用メモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、三値連想メモリ（ternary content-addressable memory、ＴＣＡＭ）、及び／又はスタティックランダムアクセスメモリ（ＳＲＡＭ）とし得る。

図５は、例示的な一実施形態に従った、図１からのソース装置１２及びデスティネーション装置１４のいずれか又は双方として使用され得る装置５００の簡略ブロック図である。

装置５００内のプロセッサ５０２は、中央演算処理ユニットとし得る。あるいは、プロセッサ５０２は、現存の又は今後開発される情報を操作又は処理することが可能な任意の他のタイプのデバイス又は複数のデバイスであってもよい。開示される実装は、例えばプロセッサ５０２といった、図示のような単一のプロセッサで実施され得るものの、２つ以上のプロセッサを使用して速度及び効率における利点を達成してもよい。

装置５００内のメモリ５０４は、一実装において、読み出し専用メモリ（ＲＯＭ）デバイス又はランダムアクセスメモリ（ＲＡＭ）デバイスとし得る。何らかの他の好適タイプの記憶デバイスがメモリ５０４として使用されてもよい。メモリ５０４は、バス５１２を用いてプロセッサ５０２によってアクセスされるコード及びデータ５０６を含むことができる。メモリ５０４は更に、オペレーティングシステム５０８及びアプリケーションプログラム５１０を含むことができ、アプリケーションプログラム５１０は、ここに記載される方法をプロセッサ５０２が実行することを可能にする少なくとも１つのプログラムを含む。例えば、アプリケーションプログラム５１０はアプリケーション１乃至Ｎを含むことができ、それらは更に、ここに記載される方法を実行する映像コーディングアプリケーションを含む。

装置５００はまた、例えばディスプレイ５１８などの１つ以上の出力装置を含むことができる。ディスプレイ５１８は、一例において、タッチ入力をセンシングするように動作可能なタッチ感知素子とディスプレイを組み合わせたタッチ感知ディスプレイとし得る。ディスプレイ５１８は、バス５１２を介してプロセッサ５０２に結合され得る。

ここでは単一のバスとして描かれているが、装置５００のバス５１２は複数のバスで構成されてもよい。さらに、二次ストレージ５１４が、装置５００の他のコンポーネントに直接的に結合されてもよいし、あるいは、ネットワークを介してアクセスされてもよく、また、例えばメモリカードなどの単一の集積ユニット、又は例えば複数のメモリカードなどの複数のユニットを有することができる。装置５００は、従って、広範な多様な構成で実装されることができる。

この出願の現行ソリューションで実装され得る一部の技術は、以下のように導入される。なお、それらの技術の説明は、文書ＪＶＥＴ－Ｐ２００１－ｖ１４及びＪＶＥＴ－Ｐ２００２－ｖ２を参照しており、これらは、ウェブサイトhttp://phenix.int-evry.fr/jvet/からダウンロードすることができる。特定の実装は、ＪＶＥＴ－Ｐ２００１－ｖ１４及びＪＶＥＴ－Ｐ２００２－ｖ２によって導入された技術に基づく様々な異形を有してもよく、それは本出願によって限定されることではない。

双予測オプティカルフロー精緻化
双予測オプティカルフロー精緻化は、双予測のために一般的にシグナリングされる情報以外の情報をビットストリーム内で明示的にシグナリングすることなく、双予測の正確さを向上させるプロセスである。

双予測では、２つの動きベクトルに従って２つのインター予測が取得され、その後、加重平均を適用することによって、それらの予測が結合される。２つの参照パッチ（Prediction1、Prediction2）における量子化ノイズが相殺され、それにより、片予測と比較してコーディング効率を向上させるので、結合された予測は、低減された残差エネルギーをもたらすことができる。双予測における重み付けた結合は、式：
Bi-prediction=Prediction1*W1+Prediction2*W2+K
によって行われることができ、ここで、Ｗ１及びＷ２は、シグナリングされるか予め定められるかし得る重み係数である。Ｋは、これもシグナリングされるか予め定められるかし得る付加係数である。一例として、双予測は、Ｗ１及びＷ２を０．５に設定し、Ｋを０に設定して、
Bi-prediction=(Prediction1+Prediction2)/2
を用いて取得され得る。

オプティカルフロー精緻化の目標は、双予測の正確さを向上させることである。オプティカルフローは、２つの連続したフレーム間でオブジェクト又はカメラの動きによって生じる画像オブジェクトの見かけの動きのパターンである。オプティカルフロー精緻化プロセスは、オプティカルフロー方程式を適用することにより、双予測の正確さを向上させる。

第１のフレーム内のピクセルＩ（ｘ，ｙ，ｔ）を考える（ｘ及びｙは空間座標に対応し、ｔは時間次元に対応する）。それが、ｄｔ時間後に撮影される次のフレームでは距離（ｖ_ｘ，ｖ_ｙ）だけ移動する。これらのピクセルは同じであり、強度は変化しないので、オプティカルフロー方程式は：

によって与えられ、Ｉ（ｘ，ｙ，ｔ）は、（ｘ，ｙ，ｔ）の座標にあるピクセルの強度（サンプル値）を規定する。

小さい変位と、テイラー級数展開における高次項が無視できることとを仮定すると、オプティカルフロー方程式は：

とも記述され得る。

ここで、∂Ｉ／∂ｘ及び∂Ｉ／∂ｙは、位置（ｘ，ｙ）における水平方向及び垂直方向の空間サンプル勾配であり、∂Ｉ／∂ｔは、（ｘ，ｙ）における時間偏微分係数である。

オプティカルフロー精緻化は、双予測の品質を向上させるために、上の原理を利用する。

オプティカルフロー精緻化の実装は、典型的に以下のステップを含む：
１．サンプル勾配を計算する；
２．第１予測と第２予測との間の差を計算する；
３．オプティカルフロー方程式を用いて得られた２つの参照パッチ間の誤差Δ：

を最小化するピクセル又はピクセルのグループの変位を計算し、ここで、Ｉ^（０）は、第１予測におけるサンプル値に対応し、Ｉ^（１）は、第２予測におけるサンプル値であり、ｖ_ｘ及びｖ_ｙは、－ｘ方向及び－ｙ方向に計算される変位であり、そして、∂Ｉ^（０）／∂ｘ及び∂Ｉ^（０）／∂ｙは、ｘ方向及びｙ方向における勾配である。τ_１及びτ_０は、そこで第１予測及び第２予測が得られた参照ピクチャまでの距離を表す。一部のアプローチは二乗誤差の和を最小化し、一部のアプローチは絶対誤差の和を最小化する。この最小化問題を解くために、所与の位置（ｘ，ｙ）の周りのサンプルのパッチが利用される；
４．例えば以下：

など、オプティカルフロー方程式の具体的な実装を使用する。ここで、pred_BIOは、オプティカルフロー精緻化プロセスの出力である修正予測を規定する。

サンプル勾配は、次式：

によって取得され得る。

一部の実施形態では、各ピクセルについて変位を推定することの複雑さを減らすために、ピクセルのグループについて変位が推定される。一部の例において、４×４ルマサンプルのブロックについての改善された双予測を計算するために、その中心にあるサンプルの４×４ブロックを有する８×８ルマサンプルのブロックのサンプル値を用いて変位が推定される。

オプティカルフロー精緻化プロセスの入力は、２つの参照ピクチャからの予測サンプルであり、オプティカルフロー精緻化の出力は、オプティカルフロー方程式に従って計算される結合予測（pred_BIO）である。

一部の実施形態において、より高次のビット深さ項が関与する乗算を排除するために、オプティカルフロー（ｖ_ｘ，ｖ_ｙ）は、以下の式を用いて決定される。推定に使用されるサンプル（すなわち、ｉ及びｊスパン）は、オプティカルフローが推定されるサンプルの現在サンプル又は現在ブロックの近傍にある各リファレンスからの予測サンプルのセットである。一例において、４×４サンプルの現在ブロックに対して、その中心にあるサンプルの４×４ブロックを有する各リファレンスにおける予測サンプルの６×６ブロックが使用される。

一具体例にて、双方向オプティカルフロー予測プロセスが導入される。

このプロセスへの入力は以下である：
－現在コーディングブロックの幅及び高さを規定する２つの変数nCbW及びnCbH、
－２つの（nCbW＋２）×（nCbH＋２）ルマ予測サンプルアレイpredSamplesL0及びpredSamplesL1、
－予測リスト利用フラグpredFlagL0及びpredFlagL1、
－参照インデックスrefIdxL0及びrefIdxL1、
－ xIdx=0..(nCbW>>2)-1、yIdx=0..(nCbH>>2)-1での、双方向オプティカルフロー利用フラグbdofUtilizationFlag[xIdx][yIdx]。

このプロセスの出力は、ルマ予測サンプル値の（nCbW）×（nCbH）アレイpbSamplesである。

変数bitDepth、shift1、shift2、shift3、shift4、offset4、及びmvRefineThresが、次のように導出される：
－変数bitDepthは、BitDepth_Yに等しく設定される。
－変数shift1は、Max(2,14-bitDepth)に等しく設定される。
－変数shift2は、Max(8,bitDepth-4)に等しく設定される。
－変数shift3は、Max(5,bitDepth-7)に等しく設定される。
－変数shift4は、Max(3,15-bitDepth)に等しく設定され、変数offset4は、1<<(shift4-1)に等しく設定される。
－変数mvRefineThresは、Max(2,1<<(13-bitDepth))に等しく設定される。

xIdx=0..(nCbW>>2)-1、且つyIdx=0..(nCbH>>2)-1に対し、以下が適用される：
－変数xSbは、(xIdx<<2)+1に等しく設定され、ySbは、(yIdx<<2)+1に等しく設定される。
－ bdofUtilizationFlag[xSbIdx][yIdx]がFALSEに等しい場合、x=xSb-1..xSb+2、y=ySb-1..ySb+2に対し、現在サブブロックの予測サンプル値が、次のように導出される：
pbSamples[x][y]=Clip3(0,(2^bitDepth)-1,(predSamplesL0[x+1][y+1]+offset2+predSamplesL1[x+1][y+1])>>shift2)
－それ以外の場合（bdofUtilizationFlag[xSbIdx][yIdx]がTRUEに等しい）、現在サブブロックの予測サンプル値が、次のように導出される：
－ x=xSb-1..xSb+4、y=ySb-1..ySb+4に対し、以下の順序付けられたステップが適用される：
１．予測サンプルアレイ内の対応するサンプル位置（ｘ，ｙ）の各々に対する位置（h_x，v_y）が、以下のように導出される：
h_x=Clip3(1,nCbW,x)
v_y=Clip3(1,nCbH,y)
２．変数gradientHL0[x][y]、gradientVL0[x][y]、gradientHL1[x][y]及びgradientVL1[x][y]が、次のように導出される：
gradientHL0[x][y]=(predSamplesL0[h_x+1][v_y]-predSampleL0[h_x-1][v_y])>>shift1
gradientVL0[x][y]=(predSampleL0[h_x][v_y+1]-predSampleL0[h_x][v_y-1])>>shift1
gradientHL1[x][y]=(predSamplesL1[h_x+1][v_y]-predSampleL1[h_x-1][v_y])>>shift1
gradientVL1[x][y]=(predSampleL1[h_x][v_y+1]-predSampleL1[h_x][v_y-1])>>shift1
３．変数temp[x][y]、tempH[x][y]及びtempV[x][y]が、次のように導出される：
diff[x][y]=(predSamplesL0[h_x][v_y]>>shift2)-(predSamplesL1[h_x][v_y]>>shift2))
tempH[x][y]=(gradientHL0[x][y]+gradientHL1[x][y])>>shift3
tempV[x][y]=(gradientVL0[x][y]+gradientVL1[x][y])>>shift3
－変数sGx2、sGy2、sGxGy、sGxdI及びsGydIが、次のように導出される：
i,j=-1..4で、sGx2=Σ_iΣ_j(tempH[xSb+i][ySb+j]*tempH[xSb+i][ySb+j])
i,j=-1..4で、sGy2=Σ_iΣ_j(tempV[xSb+i][ySb+j]*tempV[xSb+i][ySb+j])
i,j=-1..4で、sGxGy=Σ_iΣ_j(tempH[xSb+i][ySb+j]*tempV[xSb+i][ySb+j])
i,j=-1..4で、sGxdI=Σ_iΣ_j(-tempH[xSb+i][ySb+j]*diff[xSb+i][ySb+j])
i,j=-1..4で、sGydI=Σ_iΣ_j(-tempV[xSb+i][ySb+j]*diff[xSb+i][ySb+j])
－現在サブブロックの水平及び垂直動きオフセットが：
v_x=sGx2>0? Clip3(-mvRefineThres,mvRefineThres,-(sGxdI<<3)>>Floor(Log2(sGx2))):0
v_y=sGy2>0? Clip3(-mvRefineThres,mvRefineThres,((sGydI<<3)-((v_x*sGxGym)<<12+v_x*sGxGys)>>1)>>Floor(Log2(sGx2))):0
として導出される
－ x=xSb-1..xSb+2、y=ySb-1..ySb+2に対し、現在サブブロックの予測サンプル値が、次のように導出される：
bdofOffset=Round((v_x*(gradientHL1[x+1][y+1]-gradientHL0[x+1][y+1]))>>1)+Round((v_y*(gradientVL1[x+1][y+1]-gradientVL0[x+1][y+1]))>>1)
pbSamples[x][y]=Clip3(0,(2^bitDepth)-1,(predSamplesL0[x+1][y+1]+offset4+predSamplesL1[x+1][y+1]+bdofOffset)>>shift4)

オプティカルフローを推定するための伝統的な方法は、オプティカルフロー方程式を用いて、２つの予測パッチ間の誤差Δを二乗した値の和を最小化しようとするものである。これらの方法は、サンプル勾配の和のために二乗した値を計算し、サンプル差にサンプル勾配の和を乗算することを必要とする。これらの乗算は、積の項のビット深度を増加させ、双予測オプティカルフローに基づく精緻化のために計算上の複雑さ及び積算器を増加させる。オプティカルフロー推定法の代替法は、以下により、如何なる乗算の必要性も排除する：
（ａ）二乗値の和に代えて、２つのリファレンスにおける勾配の和の絶対値の和を使用する；
（ｂ）サンプル差の乗算をサンプルの勾配の和で置き換え、サンプルの差の乗算をサンプルの勾配の和の符号で置き換える；後者は、サンプルの勾配の和の符号に基づいて累積値にサンプル差の値を加算又は減算することにより、乗算なしで行われることができる。

しかしながら、この方法は、二乗誤差の和を最小化していた方法と比較すると、圧縮効率の低下を被る。従って、このような方法によって提供される計算上の単純化を維持しながら、この圧縮効率の低下を抑制することができる方法に対するニーズが存在する。

本出願の実施形態は、水平サンプル勾配の和及び垂直サンプル勾配の和の符号を計算する方法を改良する。従来のｓｉｇｎ（ｘ）評価は、正の値のｘに対して１という値を返し、負の値のｘに対して－１という値を返し、ｘが０のときに０という値を返す。本出願では、サンプル勾配の和のビット深度に依存する所定の閾値Ｔが使用される。Ｔより大きい値のｘに対して１という値を返し、－Ｔより小さい値のｘに対して－１という値を返し、それ以外の場合に０という値を返すように、ｓｉｇｎ（ｘ）が修正される。このような変更があっても、オプティカルフロー推定法は乗算フリーであり続ける。

本出願の代替実施形態は、先ず、水平勾配の和及び垂直勾配の和を、（例えば、値を所定数のビット位置だけ右にシフトさせることによって）減少されたビット深度値に量子化し得る。続いて、所定の閾値も、それに従って、ｓｉｇｎ（ｘ）出力値を得る前に量子化され得る。

特定の実施形態において、本出願は、ｓｉｇｎ（ｘ）を、３よりも多いレベルを有する出力で置き換え得る。一例において、出力レベルの数は５である。所定の第２の閾値Ｔ’を用いて、Ｔ’よりも大きい勾配の和に対する出力値が２となり、－Ｔ’よりも小さい勾配の和に対する出力値が－２となるようにする。サンプル差に対して１ビットの算術左シフトを用いることにより、なおも乗算を回避することができる。

出願の実施形態は、－ＴとＴとの間に入るサンプル勾配値を持つサンプルに関連するサンプル差を抑圧することによってコーディング効率を向上させる。乗算フリーの方法の低い計算複雑さの側面が維持される。

本出願の第１の例示的実施形態によれば、現在コーディングブロックの双予測のためのステップは、以下のステップを含む。

ステップ０：現在コーディングブロックについて動きベクトルのペアを取得する；
一部の実現可能な実装において、２つの動きベクトルが入力として取得される。当初の動きベクトルを、ビットストリーム内の指示情報に基づいて決定することができる。例えば、候補動きベクトルのリスト内の位置を指し示すインデックスがビットストリーム内でシグナリングされ得る。他の一例において、動きベクトル予測子インデックス及び動きベクトル差分値をビットストリーム内でシグナリングすることができる。他の一例において、これらの動きベクトルは、ビットストリーム内で指し示される動きベクトルの当初ペアから始めて、動きベクトル精緻化を用いて、精緻化動きベクトルとして導出されることができる。他の一例において、取得された動きベクトルペアにおける所与の動きベクトルが関連付けられた参照ピクチャを指し示す参照ピクチャインジケーションを、ビットストリームから得ることができる。

ステップ１：動きベクトルのペアを用いて、２つの参照ピクチャから中間ビット深度にて第１の予測サンプルのブロックを取得する；
一部の実現可能な実装において、取得された動きベクトルペア及びＫタップ補間フィルタに従って、各参照フレームにおいて第１の片方向予測が取得される。より具体的には、この予測は、動きベクトルが整数サンプル位置に対応する場合、再構成参照サンプル値を得る。動きベクトルが非ゼロの水平成分とゼロの垂直成分とを持つ場合、それは、水平Ｋタップ補間を行って予測サンプル値を得る。動きベクトルが非ゼロの垂直成分とゼロの水平成分とを持つ場合、それは、垂直Ｋタップ補間を行って予測サンプル値を得る。動きベクトルが水平成分及び垂直成分の両方に対して非ゼロの値を持つ場合、２Ｄ分離可能なＫタップ補間が実行され、最初に水平補間を行い、続いて垂直補間を行って、予測サンプル値を得る。

ステップ２：各リファレンスにおける対応する第１の予測サンプルの間のサンプル差、各リファレンスにおける水平サンプル勾配、及び各リファレンスにおける垂直サンプル勾配を用い、オプティカルフロー方程式を使用して、オプティカルフローを計算する；
このオプティカルフロー計算は、２つのリファレンスにわたる水平サンプル勾配の和又は２つのリファレンスにわたる垂直サンプル勾配の和のいずれかを入力としてとり、Ｎ個の取り得る値のうちの１つを出力として返す関数を使用し、ここで、Ｎは３以上の正の奇数である。関数の戻り値は、入力値の符号と、第１の所定の閾値Ｔに対する入力の絶対値の比較とに基づく。

一部の実現可能な実装において、各リファレンスについてステップ１で取得された第１の予測サンプルのセットを用いて、所与の現在コーディングユニット内の各サブブロックについてオプティカルフローが推定される。

一例において、参照される第１のリファレンスについての予測サンプルがＩ^（０）として表され、参照される第２のリファレンスについての予測サンプルがＩ^（１）として表されると仮定して、各リファレンスにおける水平及び垂直サンプル勾配（以下では、第１のリファレンスではＧｘ０、Ｇｙ０、そして、第２のリファレンスではＧｘ１、Ｇｙ１と表して参照する）が、現在符号化サブブロック内の一組の位置について計算される。位置（ｘ，ｙ）における水平サンプル勾配は、この位置の右側のサンプル値とこの位置の左側のサンプル値との間の差をとることによって計算される。位置（ｘ，ｙ）における垂直サンプル勾配は、この位置の下のサンプル値とこの位置の上のサンプル値との間の差をとることによって計算される。すると、オプティカルフローは、次のように推定される：

関数ｆ（ｘ）は、水平勾配の和又は垂直勾配の和を入力としてとり、Ｎ個の取り得る値のうちの１つをとる出力を生成する。ここで、Ｎは、３以上の正の奇整数値である。出力値は、入力値及び第１の所定の閾値Ｔに依存する。一例において、Ｎは値３をとる。出力値は、－１、０、及び１なる３つの取り得る値のうちの１つである。これは、次のように決定される：

あるいは、これは：

のように記述されることができる。

図６に、入力値（これは、水平方向又は垂直方向における２つのリファレンス間の対応するサンプル勾配の和である）と、第１の所定の閾値Ｔに基づく３つの取り得る値のうちの１つをとる出力値との関係を示している。この出力は、入力のダイナミックレンジの、第１の所定の閾値Ｔに基づく３つの部分への、一種の量子化又は分割であって、関数が、各パーティションに対して、取り得る出力値のうちの１つをとるようにするもの、として見ることができる。

第１の所定の閾値Ｔは、サンプル勾配の和のビット深度を用いて決定される。一部の例において、サンプル勾配の和は、予測サンプルのサンプルビット深度に依存する値をとる。他の一例において、サンプル勾配の和は、サンプルビット深度及び所望のビット深度に基づいて、該所望のビット深度にあるように調節される（例えば、ビットセットを通じて右シフト又は左シフトされる）。一例において、入力ビット深度が１０ビットである場合、Ｔは３なる値をとる。

ｓ３及びｓ４の式は、和の各項についての乗算を示しているが、理解されることには、非ゼロの出力値の場合に、所与の（ｉ，ｊ）の組み合わせについてのサンプル差を積算器に条件付きで加算又は減算することによって、この総和を乗算なしで実装することができる。具体的には、出力値が１であるときにはサンプル差が加算され、出力値が－１であるときにはサンプル差が減算される。

他の一例において、ｆ（ｘ）は、図７に示すように、Ｎ＝５の取り得る値、すなわち、－２、－１、０、１、２、のうちの１つをとることができる出力を生成してもよい。図中の第２の所定の閾値Ｔ’は、入力のダイナミックレンジと、所望の出力レベルの数とに依存する。

一例において、入力のダイナミックレンジは４等分に分割される。換言すれば、入力が符号付きの１０ビット値である場合、ダイナミックレンジは－５１２と５１１との間とすることができる。これが、（－５１２から－２５７）、（－２５６から－１）、（０，２５５）、及び（２５６，５１２）という範囲に分割される。従って、第２の所定の閾値Ｔ’は、この例では２５６である。範囲（－５１２から－２５７）内の入力に対する出力値は－２である。範囲（－２５６から－１）は、（－２５６から－Ｔ－１）と（－Ｔから－１）とにスプリットされる。範囲（－２５６から－Ｔ－１）内の入力に対する出力値は－１である。範囲（０，２５５）は、範囲（０からＴ）と範囲（Ｔ＋１から２５５）とにスプリットされる。範囲（－ＴからＴ）内の入力に対する出力値は０である。範囲（Ｔ＋１から２５５）内の入力に対する出力値は１である。範囲（２５６から５１１）内の入力に対する出力値は２である。従って、出力値は、－２、－１、０、１、及び２なる５つの取り得る値をとることができる。

ステップ３：各リファレンスにおける第１の予測サンプルと、計算されたオプティカルフローと、各リファレンスにおける水平及び垂直サンプル勾配値とを用いて、現在コーディングブロックについての最終的なインター双方向予測サンプルを取得する。

図８は、本出願の処理を例示している。ブロック８１０は、ステップ０に対応し、現在コーディングブロックについての参照ピクチャのペアに関してＭＶペアが取得される。ブロック８２０は、ステップ１に対応し、取得されたＭＶペアと、リファレンスのペアの再構成参照ルマサンプルとを用いて、各リファレンスにおいて第１の予測が取得される。ブロック８３０は、ステップ２に対応し、各リファレンスにおいて取得された第１の予測に基づいてオプティカルフローが計算される。オプティカルフロー計算は、サンプル差と、水平方向と垂直方向におけるサンプル勾配の和とに依存する。オプティカルフロー計算は関数を使用し、この関数は、水平方向又は垂直方向におけるサンプル勾配の和をとり、入力値の符号と、出力値を生成するための第１の所定の閾値とに依存する出力値を生成する。出力値は、Ｎ個の取り得る値のうちの１つをとることができ、ここで、Ｎは、３以上の値をとる小さい正の奇整数である。ブロック８４０は、ステップ３に対応し、第１の予測サンプルと、計算されたオプティカルフローとに基づいて、現在コーディングブロックについての双予測サンプルが取得される。

図９は、本出願の別の処理を例示している。

Ｓ９０１：現在ブロックについての双予測の当初動きベクトルペアを取得する。

当初動きベクトルペアは、例えばマージモード、アドバンスト動きベクトル予測（ＡＭＶＰ）モード、アフィンモードなどの伝統的な双予測法によって取得され得る。一般に、当初動きベクトルペアは、現在ブロックの少なくとも１つの空間隣接ブロック及び／又は時間隣接ブロックの動き情報に従って取得される。現在ブロックは、コーディングユニット、又はコーディングユニットのサブブロックとし得る。

Ｓ９０２：当初動きベクトルペアを用いて前方予測ブロック及び後方予測ブロックを取得する。

理解可能なことには、現在ブロック内の全てのサンプルについて、そのサンプルに対応する前方予測サンプル及び後方予測サンプルが、それぞれ、前方予測ブロック及び後方予測ブロック内で決定される。

Ｓ９０３：現在ブロック内のサンプルについての勾配パラメータを、対応する前方予測サンプル及び後方予測サンプルに基づいて計算する。

例えば、勾配パラメータは、前方水平勾配、後方水平勾配、後方水平勾配、及び後方水平勾配を有し得る。サンプルがpbSamples[x][y]であり、前方予測サンプルがpreSamplesL0[x][y]であり、後方予測サンプルがpreSamplesL1[x][y]であると仮定する。前方水平勾配：
gradientHL0[x][y]=predSamplesL0[x+1][y]-predSamplesL0[x-1][y];
前方垂直勾配：
gradientVL0[x][y]=predSamplesL0[x][y+1]-predSamplesL0[x][y-1];
後方水平勾配：
gradientHL1[x][y]=predSamplesL1[x+1][y]-predSamplesL1[x-1][y];
後方垂直勾配：
gradientVL1[x][y]=predSamplesL1[x][y+1]-predSamplesL1[x][y-1]。

Ｓ９０４：勾配パラメータに基づいて、サンプルについてのサンプルオプティカルフローパラメータを取得する。

例えば、サンプルオプティカルフローパラメータは、サンプル差、水平平均勾配、及び垂直平均勾配を有し得る。
サンプル差：
diff[x][y]=predSamplesL0[x][y]-predSamplesL1[x][y]；
水平方向の平均勾配：
TempH[x][y]=(gradientHL0[x][y]+gradientHL1[x][y])/2；
垂直平均勾配：
TempV[x][y]=(gradientVL0[x][y]+gradientVL1[x][y])/2。

Ｓ９０５：現在ブロック内のサンプルについてのサンプルオプティカルフローパラメータのうちの少なくとも一部に基づいて、ブロックオプティカルフローパラメータを取得する；
ブロックオプティカルフローパラメータのうち少なくとも１つは、第１のサンプルオプティカルフローパラメータと第２のサンプルオプティカルフローパラメータの符号関数の出力値との間の乗算によって取得される。

一例において、符号関数は、

である。

他の一例において、Ｔは０であり、従って、符号関数は、

である。

一例において、符号関数は、

である。

また、この例において、理解可能であることには、２の乗算は、１ビットの左シフト演算で置き換えられることができ、それ故に乗算を回避することもできる。

例えば、現在ブロックが４×４ブロックであり、現在ブロックの左上サンプルの座標が（ｘＳｂ，ｙＳｂ）であると仮定すると、ブロックオプティカルフローパラメータは：
i,j=-1..4で、sGx2=Σ_iΣ_jAbs(tempH[xSb+i][ySb+j])
i,j=-1..4で、sGy2=Σ_iΣ_jAbs(tempV[xSb+i][ySb+j])
i,j=-1..4で、sGxGy=Σ_iΣ_j(Sign(tempV[xSb+i][ySb+j])*tempH[xSb+i][ySb+j])
sGxGym=sGxGy>>12
sGxGys=sGxGy&((1<<12)-1)
i,j=-1..4で、sGxdI=Σ_iΣ_j(-Sign(tempH[xSb+i][ySb+j])*diff[xSb+i][ySb+j])
i,j=-1..4で、sGydI=Σ_iΣ_j(-Sign(tempV[xSb+i][ySb+j])*diff[xSb+i][ySb+j])
を有し得る。

Ｓ９０６：前方予測ブロック、後方予測ブロック、ブロックオプティカルフローパラメータ、及びサンプルオプティカルフローパラメータに基づいて、現在ブロックの予測値を取得する。

図９に示した実施形態によれば、別の具体例が導入される。

このプロセスへの入力は以下である：
－現在コーディングブロックの幅及び高さを規定する２つの変数nCbW及びnCbH、
－２つの（nCbW＋２）×（nCbH＋２）ルマ予測サンプルアレイpredSamplesL0及びpredSamplesL1、
－予測リスト利用フラグpredFlagL0及びpredFlagL1、
－参照インデックスrefIdxL0及びrefIdxL1、
－双方向オプティカルフロー利用フラグsbBdofFlag。

変数shift1、shift2、shift3、shift4、offset4、及びmvRefineThresが、次のように導出される：
－変数shift1は６に等しく設定される。
－変数shift2は４に等しく設定される。
－変数shift3は１に等しく設定される。
－変数shift4は、Max(3,15-BitDepth)に等しく設定され、変数offset4は、1<<(shift4-1)に等しく設定される。
－変数mvRefineThresは、1<<5に等しく設定される。

xIdx=0..(nCbW>>2)-1、且つyIdx=0..(nCbH>>2)-1に対し、以下が適用される：
－変数xSbは、(xIdx<<2)+1に等しく設定され、ySbは、(yIdx<<2)+1に等しく設定される。
－ sbBdofFlagがFALSEに等しい場合、x=xSb-1..xSb+2、y=ySb-1..ySb+2に対し、現在サブブロックの予測サンプル値が、次のように導出される：
pbSamples[x][y]=Clip3(0,(2^BitDepth)-1,(predSamplesL0[x+1][y+1]+offset4+predSamplesL1[x+1][y+1])>>shift4)
－それ以外の場合（sbBdofFlagがTRUEに等しい）、現在サブブロックの予測サンプル値が、次のように導出される：
－ x=xSb-1..xSb+4、y=ySb-1..ySb+4に対し、以下の順序付けられたステップが適用される：
４．予測サンプルアレイ内の対応するサンプル位置（ｘ，ｙ）の各々に対する位置（h_x，v_y）が、以下のように導出される：
h_x=Clip3(1,nCbW,x)
v_y=Clip3(1,nCbH,y)
５．変数gradientHL0[x][y]、gradientVL0[x][y]、gradientHL1[x][y]及びgradientVL1[x][y]が、次のように導出される：
gradientHL0[x][y]=(predSamplesL0[hx+1][vy]>>shift1)-(predSamplesL0[hx-1][vy])>>shift1)
gradientVL0[x][y]=(predSamplesL0[hx][vy+1]>>shift1)-(predSamplesL0[hx][vy-1])>>shift1)
gradientHL1[x][y]=(predSamplesL1[hx+1][vy]>>shift1)-(predSamplesL1[hx-1][vy])>>shift1)
gradientVL1[x][y]=(predSamplesL1[hx][vy+1]>>shift1)-(predSamplesL1[hx][vy-1])>>shift1)
６．変数diff[x][y]、tempH[x][y]及びtempV[x][y]が、次のように導出される：
diff[x][y]=(predSamplesL0[h_x][v_y]>>shift2)-(predSamplesL1[h_x][v_y]>>shift2))
tempH[x][y]=(gradientHL0[x][y]+gradientHL1[x][y])>>shift3
tempV[x][y]=(gradientVL0[x][y]+gradientVL1[x][y])>>shift3
－変数sGx2、sGy2、sGxGy、sGxdI及びsGydIが、次のように導出される：
i,j=-1..4で、sGx2=Σ_iΣ_jAbs(tempH[xSb+i][ySb+j])
i,j=-1..4で、sGy2=Σ_iΣ_jAbs(tempV[xSb+i][ySb+j])
i,j=-1..4で、sGxGy=Σ_iΣ_j(Sign(tempV[xSb+i][ySb+j])*tempH[xSb+i][ySb+j])
sGxGym=sGxGy>>12
sGxGys=sGxGy&((1<<12)-1)
i,j=-1..4で、sGxdI=Σ_iΣ_j(-Sign(tempH[xSb+i][ySb+j])*diff[xSb+i][ySb+j])
i,j=-1..4で、sGydI=Σ_iΣ_j
(-Sign(tempV[xSb+i][ySb+j])*diff[xSb+i][ySb+j])
－現在サブブロックの水平及び垂直動きオフセットが：
vx=sGx2>0?Clip3(-mvRefineThres+1,mvRefineThres-1,-(sGxdI<<2)>>Floor(Log2(sGx2))):0
vy=sGy2>0?Clip3(-mvRefineThres+1,mvRefineThres-1,((sGydI<<2)-((vx*sGxGym)<<12+vx*sGxGys)>>1)>>Floor(Log2(sGy2))):0
として導出される
－ x=xSb-1..xSb+2、y=ySb-1..ySb+2に対し、現在サブブロックの予測サンプル値が、次のように導出される：
bdofOffset=vx*(gradientHL0[x+1][y+1]-gradientHL1[x+1][y+1])+vy*(gradientVL0[x+1][y+1]-gradientVL1[x+1][y+1])
pbSamples[x][y]=Clip3(0,(2^BitDepth)-1,(predSamplesL0[x+1][y+1]+offset4+predSamplesL1[x+1][y+1]+bdofOffset)>>shift4)

他の一実施形態において、図１０は、本出願の装置を例示している。双方向オプティカルフロー予測装置１０００は、現在ブロックについて当初動きベクトルペアを取得するように構成された取得モジュール１００１であり、当初動きベクトルペアは、前方動きベクトルと後方動きベクトルとを有する、取得モジュール１００１と、前方動きベクトルに従った前方予測ブロックと、後方動きベクトルに従った後方予測ブロックとを取得するように構成されたパッチングモジュール１００２と、現在ブロック内の現在サンプルについての勾配パラメータを、現在サンプルに対応する前方予測サンプル及び後方予測サンプルに基づいて計算するように構成された勾配モジュール１００３であり、前方予測サンプルは前方予測ブロック内にあり、後方予測サンプルは後方予測ブロック内にある、勾配モジュール１００３と、勾配パラメータに基づいて、現在サンプルについての少なくとも２つのサンプルオプティカルフローパラメータを取得するように構成された計算モジュール１００４であり、サンプルオプティカルフローパラメータは、第１パラメータ及び第２パラメータを有する、計算モジュール１００４と、現在ブロック内のサンプルのサンプルオプティカルフローパラメータに基づいて、ブロックオプティカルフローパラメータを取得するように構成された訓練モジュール１００５であり、ブロックオプティカルフローパラメータのうち１つは、第１パラメータの値と第２パラメータの符号関数の値とを乗算することを含む演算によって取得され、符号関数は、少なくとも３つのサブインターバルを有する区分関数である、訓練モジュール１００５と、前方予測ブロック、後方予測ブロック、ブロックオプティカルフローパラメータ、及びサンプルオプティカルフローパラメータに基づいて、現在ブロックの予測値を取得するように構成された予測モジュール１００６と、を有する。

実現可能な一実装において、符号関数は、

であり、Ｔは非負の実数である。

実現可能な一実装において、Ｔは０であり、対応して、符号関数は、

である。

実現可能な一実装において、当初動きベクトルペアは、現在ブロックの少なくとも１つの空間隣接ブロック及び／又は時間隣接ブロックの動き情報に従って取得される。

実現可能な一実装において、現在ブロックは、コーディングユニット又は該コーディングユニットのサブブロックである。

実現可能な一実装において、前方水平勾配は、前方予測サンプルに隣接する右サンプルと左サンプルとの差である。

実現可能な一実装において、後方水平勾配は、後方予測サンプルに隣接する右サンプルと左サンプルとの差である。

実現可能な一実装において、前方垂直勾配は、前方予測サンプルに隣接する下サンプルと上サンプルとの差である。

実現可能な一実装において、後方垂直勾配は、後方予測サンプルに隣接する下サンプルと上サンプルとの差である。

実現可能な一実装において、サンプルオプティカルフローパラメータは、サンプル差、水平平均勾配、及び垂直平均勾配を有する。

実現可能な一実装において、第１パラメータは、サンプル差、水平平均勾配、又は垂直平均勾配である。

実現可能な一実装において、第２パラメータは、サンプル差、水平平均勾配、又は垂直平均勾配であり、第２パラメータは第１パラメータではない。

他の一実施形態において、図１１は、本出願の他の装置を例示している。双方向オプティカルフロー予測装置１１００は、１つ以上のプロセッサ１１０１と、プロセッサに結合され、プロセッサによる実行のためのプログラミングを格納する非一時的なコンピュータ読み取り可能記憶媒体１１０２と、を有し、プログラミングは、プロセッサによって実行されるときに、図９にて例示した方法のうちのいずれか１つを実行するように当該装置を構成する。

本出願の他の一実施形態において、コンピュータプログラムプロダクトは、図９にて例示した方法のうちのいずれか１つを実行するためのプログラムコードを有する。

以下は、上述の実施形態に示される符号化方法及ぶ復号方法の用途、並びにそれらを使用するシステムの説明である。

図１２は、コンテンツ配信サービスを実現するためのコンテンツ供給システム３１００を示すブロック図である。このコンテンツ供給システム３１００は、キャプチャ装置３１０２、端末装置３１０６を含んでおり、オプションでディスプレイ３１２６を含む。キャプチャ装置３１０２は、通信リンク３１０４上で端末装置３１０６と通信する。該通信リンクは、上述の通信チャネル１３を含み得る。通信リンク３１０４は、以下に限られないが、ＷＩＦＩ、イーサネット、ケーブル、無線（３Ｇ／４Ｇ／５Ｇ）、ＵＳＢ、若しくはこれらの任意の種類の組み合わせ、又はこれらに類するものを含む。

キャプチャ装置３１０２は、データを生成し、上述の実施形態に示される符号化方法によってデータを符号化し得る。あるいは、キャプチャ装置３１０２は、ストリーミングサーバ（図には示さず）にデータを配信してもよく、サーバが、データを符号化して、符号化データを端末装置３１０６に送信する。キャプチャ装置３１０２は、以下に限られないが、カメラ、スマートフォン若しくはパッド、コンピュータ若しくはラップトップ、ビデオ会議システム、ＰＤＡ、車載装置、若しくはこれらのいずれかの組み合わせ、又はこれらに類するものを含む。例えば、キャプチャ装置３１０２は、上述のソース装置１２を含み得る。データが映像を含む場合、キャプチャ装置３１０２に含まれるビデオエンコーダ２０が実際に映像符号化処理を実行し得る。データが音声（すなわち、音）を含む場合、キャプチャ装置３１０２に含まれるオーディオエンコーダが実際に音声符号化処理を実行し得る。一部の実際的なシナリオでは、キャプチャ装置３１０２は、符号化された映像及び音声データを、それらを一緒に多重化することによって配信する。例えばビデオ会議システムにおいてといった他の実際的なシナリオでは、符号化された音声データと符号化された映像データとを多重化しない。キャプチャ装置３１０２は、符号化された音声データと符号化された映像データとを別々に端末装置３１０６に配信する。

コンテンツ供給システム３１００において、端末装置３１０は、符号化データを受信して再生する。端末装置３１０６は、例えばスマートフォン若しくはパッド３１０８、コンピュータ若しくはラップトップ３１１０、ネットワークビデオレコーダ（ＮＶＲ）／デジタルビデオレコーダ（ＤＶＲ）３１１２、ＴＶ３１１４、セットトップボックス（ＳＴＢ）３１１６、ビデオ会議システム３１１８、ビデオ監視システム３１２０、携帯情報端末（ＰＤＡ）３１２２、車載装置３１２４、若しくはこれらのうちのいずれかの組み合わせ、又は上述の符号化データを復号することが可能なこれらに類するものなど、データ受信及び復元能力を有する装置とし得る。例えば、端末装置３１０６は、上述のデスティネーション装置１４を含み得る。符号化データが映像を含む場合、端末装置に含まれるビデオデコーダ３０が優先されて映像復号を実行する。符号化データが音声を含む場合、端末装置に含まれるオーディオデコーダが優先されて音声復号処理を実行する。

例えばスマートフォン若しくはパッド３１０８、コンピュータ若しくはラップトップ３１１０、ネットワークビデオレコーダ（ＮＶＲ）／デジタルビデオレコーダ（ＤＶＲ）３１１２、ＴＶ３１１４、携帯情報端末（ＰＤＡ）３１２２、又は車載装置３１２４など、自身のディスプレイを備えた端末装置では、当該端末装置が、復号したデータをそのディスプレイに送ることができる。例えば、ＳＴＢ３１１６、ビデオ会議システム３１１８、又はビデオ監視システム３１２０など、ディスプレイを備えない端末装置では、その中に外付けディスプレイ３１２６が接触されて、復号データを受信して示す。

このシステム内の各装置が符号化又は復号を行うとき、上述の実施形態に示したようなピクチャ符号化装置又はピクチャ復号装置が使用され得る。

図１３は、端末装置３１０６の一例の構成を示す図である。端末装置３１０６がキャプチャ装置３１０２からストリームを受信した後、プロトコル手順ユニット３２０２が、ストリームの伝送プロトコルを解析する。プロトコルは、以下に限られないが、リアルタイムストリーミングプロトコル（ＲＴＳＰ）、ハイパーテキスト転送プロトコル（ＨＴＴＰ）、ＨＴＴＰライブストリーミングプロトコル（ＨＬＳ）、ＭＰＥＧ－ＤＡＳＨ、リアルタイムトランスポートプロトコル（ＲＴＰ）、リアルタイムメッセージングプロトコル（ＲＴＭＰ）、若しくはこれらの任意の種類の組み合わせ、又はこれらに類するものを含む。

プロトコル手順ユニット３２０２がストリームを処理した後、ストリームファイルが生成される。ファイルは、逆多重化ユニット３２０４に出力される。逆多重化ユニット３２０４は、多重化されたデータを符号化音声データと符号化映像データとに分離することができる。上述のように、例えばビデオ会議システムにおいてといった一部の実際的なシナリオでは、符号化音声データと符号化映像データとが多重化されない。この状況では、符号化データは、逆多重化ユニット３２０４を介することなくビデオデコーダ３２０６及びオーディオデコーダ３２０８に伝送される。

逆多重化処理を介して、映像エレメンタリストリーム（ＥＳ）、音声ＥＳ、及びオプションとして字幕が生成される。上述の実施形態で説明したようなビデオデコーダ３０を含むものであるビデオデコーダ３２０６が、上述の実施形態で示したような復号方法によって映像ＥＳを復号して映像フレームを生成し、このデータを同期ユニット３２１２に送る。オーディオデコーダ３２０８が、音声ＥＳを復号して音声フレームを生成し、このデータを同期ユニット３２１２に送る。あるいは、映像フレームは、同期ユニット３２１２に送られる前に、バッファ（図１３には示さず）に格納されてもよい。同様に、音声フレームは、同期ユニット３２１２に送られる前に、バッファ（図１３には示さず）に格納されてもよい。

同期ユニット３２１２は、映像フレーム及び音声フレームを同期させ、映像／音声を映像／音声ディスプレイ３２１４に供給する。例えば、同期ユニット３２１２は、映像情報及び音声情報の提示を同期させる。情報は、コーディングされたオーディオ・ビジュアルデータの提示に関するタイムスタンプと、データストリーム自体の送達に関するタイムスタンプとを用いて、構文内のコードとなり得る。

字幕がストリームに含まれる場合、字幕デコーダ３２１０が、字幕を復号し、それを映像フレーム及び音声フレームと同期させ、映像／音声／字幕を映像／音声／字幕ディスプレイ３２１６に供給する。

本出願は、上述のシステムに限定されるものではなく、上述の実施形態におけるピクチャ符号化装置又はピクチャ復号装置はいずれも、例えば自動車システムといった他のシステムに組み込まれてもよい。

数学演算子
この出願で使用される数学演算子は、Ｃプログラミング言語で使用されるものと同様である。しかし、整数除算及び算術シフト演算の結果をいっそう正確に定義し、例えば指数化及び実数値除算などの更なる演算を定義する。番号付ける及びカウントすることの慣習は一般に０から始まり、例えば、“１番目（the first）”は０番（0-th）、“２番目（the second）”は１番（1-th）、等々である。

算術演算子
以下の算術演算子は、次のように定義される：

論理演算子
以下の論理演算子は次のように定義される：
ｘ＆＆ｙｘ及びｙのブール論理“ａｎｄ”
ｘ｜｜ｙｘ及びｙのブール論理“ｏｒ”
！ブール論理“ｎｏｔ”
ｘ？ｙ：ｚｘがＴＲＵＥである又は０に等しくない場合、ｙの値の方を評価し、そうでない場合、ｚの値の方を評価する。

関係演算子
以下の関係演算子は次のように定義される：
＞より大きい
＞＝以上
＜より小さい
＜＝以下
＝＝等しい
！＝等しくない。

関係演算子が、値“ｎａ”（非該当）が割り当てられた構文要素又は変数に適用される場合、値“ｎａ”は、その構文要素又は変数に関する独特な値として扱われる。値“ｎａ”は、他の値とは等しくないとみなされる。

ビット単位演算子
以下のビット単位演算子は次のように定義される：
＆ビット単位の“ａｎｄ”。整数の引数について演算するとき、整数値の２の補数表現について演算する。別の引数よりも少ないビットを含むバイナリ引数について演算するとき、短い方の引数が、０に等しい上位ビットを付加することによって延ばされる。
｜ビット単位の“ｏｒ”。整数の引数について演算するとき、整数値の２の補数表現について演算する。別の引数よりも少ないビットを含むバイナリ引数について演算するとき、短い方の引数が、０に等しい上位ビットを付加することによって延ばされる。
＾ビット単位の“排他的ｏｒ”。整数の引数について演算するとき、整数値の２の補数表現について演算する。別の引数よりも少ないビットを含むバイナリ引数について演算するとき、短い方の引数が、０に等しい上位ビットを付加することによって延ばされる。
ｘ＞＞ｙｘの２の補数の整数表現の、バイナリでｙ桁の算術右シフト。この関数は、負でない整数値のｙに対してのみ定義される。右シフトの結果として最上位ビット（ＭＳＢ）にシフトされたビットは、シフト演算前のｘのＭＳＢに等しい値を持つ。
ｘ＜＜ｙｘの２の補数の整数表現の、バイナリでｙ桁の算術左シフト。この関数は、負でない整数値のｙに対してのみ定義される。左シフトの結果として最下位ビット（ＬＳＢ）にシフトされたビットは、０に等しい値を持つ。

割当て演算子
以下の算術演算子は次のように定義される：
＝割当て演算子
＋＋インクリメント、すなわち、ｘ＋＋は、ｘ＝ｘ＋１と等価である；アレイインデックスで使用される場合、インクリメント演算前の変数の値の方を評価する。
－－デクリメント、すなわち、ｘ－－は、ｘ＝ｘ－１と等価である；アレイインデックスで使用される場合、デクリメント演算前の変数の値の方を評価する。
＋＝指定量分のインクリメント、すなわち、ｘ＋＝３は、ｘ＝ｘ＋３と等価であり、ｘ＋＝（－３）は、ｘ＝ｘ＋（－３）と等価である。
－＝指定量分のデクリメント、すなわち、ｘ－＝３は、ｘ＝ｘ－３と等価であり、ｘ－＝（－３）は、ｘ＝ｘ－（－３）と等価である。

範囲表記
値の範囲を規定するために以下の表記が使用される：
ｘ＝ｙ．．ｚｘは、ｙから始まってｚまでの整数値を、ｙ、ｚを含めてとり、ｘ、ｙ、及びｚは整数であり、且つｚはｙより大きい。

数学関数
以下の数学関数が定義される：

演算優先順位の序列
式の中で優先順位の序列が括弧を用いて明示的に示されない場合、次の規則が適用される：
－より高い優先順位の演算が、任意のより低い優先順位の演算の前に評価される。
－同じ優先順位の演算が、左から右に順に評価される。

下の表は、最高から最低までの演算の優先順位を規定しており、表中の高い位置ほど高い優先順位を指し示す。

Ｃプログラミング言語でも使用される演算子については、この明細書で使用される優先順位の序列は、Ｃプログラミング言語で使用されるものと同じである。

論理演算のテキスト記述
テキストにおいて、次の形式で数学的に記述される論理演算のステートメント：
if(condition 0)
statement 0
else if(condition 1)
statement 1
...
else /* 残りの条件についての情報の言及 */
Statement n
は、以下のように記述され得る：
...以下のとおりである／...以下が適用される：
－ If condition 0, statement 0
－ Otherwise, if condition 1, statement 1
－ ...
－ Otherwise (残りの条件についての情報の言及), statement n。

テキスト内の各“If．．．otherwise, if...otherwise, ．．．”ステートメントが直後に“If...”が続く“...以下のとおりである”又は“...以下が適用される”を用いて導入される。“If...otherwise, if...otherwise, ．．．”の最後の条件は、常に“Otherwise, ．．．”である。インターリーブされる“If...otherwise, if...otherwise, ．．．”ステートメントは、“...以下のとおりである”又は“...以下が適用される”を終わりとなる“Otherwise, ．．．”と合わせることによって識別される。

テキストにおいて、次の形式で数学的に記述される論理演算のステートメント：
if(condition 0a && condition 0b)
statement 0
else if(condition 1a || condition 1b)
statement 1
...
else
statement n
は、以下のように記述され得る：
...以下のとおりである／...以下が適用される：
－ If 以下の条件の全てがtrueである, statement 0:
－ condition 0a
－ condition 0b
－ Otherwise, if 以下の条件のうち１つ以上がtrueである, statement 1:
－ condition 1a
－ condition 1b
－ ...
－ Otherwise, statement n。

テキストにおいて、次の形式で数学的に記述される論理演算のステートメント：
if(condition 0)
statement 0
if(condition 1)
statement 1
は、以下のように記述され得る：
Condition 0である場合, statement 0
Condition 1である場合, statement 1。

例えばエンコーダ２０及びデコーダ３０の実施形態、並びに、例えばエンコーダ２０及びデコーダ３０を参照してここに記載された機能は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの任意の組み合わせで実装され得る。ソフトウェアで実装される場合、機能は、１つ以上の命令又はコードとして、コンピュータ読み取り可能媒体に記憶され、又は通信媒体上で伝送され、そして、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ読み取り可能媒体は、例えばデータ記憶媒体などの有形媒体に対応するコンピュータ読み取り可能記憶媒体、又は、例えば通信プロトコルに従って１つの場所から別の場所へのコンピュータプログラムの転送を支援する任意の媒体を含む通信媒体を含み得る。斯くして、コンピュータ読み取り可能媒体は、一般に、（１）非一時的である有形のコンピュータ読み取り可能記憶媒体、又は（２）例えば信号又は搬送波などの通信媒体に対応し得る。データ記憶媒体は、この開示に記載された技術の実装のための命令、コード及び／又はデータ構造を取り出すために１つ以上のコンピュータ又は１つ以上のプロセッサによってアクセスされ得る任意の利用可能な媒体とし得る。コンピュータプログラムプロダクトがコンピュータ読み取り可能媒体を含み得る。

例として、限定することなく、そのようなコンピュータ読み取り可能記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭ若しくは他の光ディスクストレージ、磁気ディスクストレージ若しくは他の磁気記憶装置、フラッシュメモリ、又は、命令若しくはデータ構造の形態で所望のプログラムコードを格納するために使用され且つコンピュータによってアクセスされ得る任意の他の媒体を有することができる。また、任意の接続が適切にコンピュータ読み取り可能媒体と呼ばれる。例えば、命令が、ウェブサイト、サーバ、又は他のリモートソースから、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、又は例えば赤外線、無線、及びマイクロ波などの無線技術を用いて伝送される場合、その同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、又は例えば赤外線、無線、及びマイクロ波などの無線技術は、媒体の定義に含まれる。しかしながら、理解されるべきことには、コンピュータ読み取り可能記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時的媒体を含まず、代わりに非一時的で有形の記憶媒体に向けられる。ディスク（ｄｉｓｋ及びｄｉｓｃ）は、ここで使用されるとき、コンパクトディスク（ＣＤ）、レーザディスク、光ディスク、デジタル多用途ディスク（ＤＶＤ）、フロッピーディスク及びＢｌｕ－ｒａｙディスクを含み、ｄｉｓｋは、通常、磁気的にデータを再生し、ｄｉｓｃはレーザを用いて光学的にデータを再生する。上述のものの組み合わせも、コンピュータ読み取り可能媒体の範囲内に含まれるべきである。

命令は、例えば１つ以上のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルロジックアレイ（ＦＰＧＡ）、又は他の同等の集積論理回路若しくはディスクリート論理回路などの、１つ以上のプロセッサによって実行され得る。従って、用語“プロセッサ”は、ここで使用されるとき、上述の構造のいずれか、又はここに記載された技術の実装に適した任意の他の構造を指し得る。さらに、一部の態様において、ここに記載された機能は、符号化及び復号のために構成された専用のハードウェア及び／又はソフトウェアモジュール内で提供されてもよいし、あるいは、組み合わされたコーデックに組み込まれてもよい。また、これらの技術は、１つ以上の回路又は論理素子にて完全に実装されてもよい。

この開示の技術は、無線ハンドセット、集積回路（ＩＣ）、又は一組のＩＣ（例えば、チップセット）を含め、広範で多様なデバイス又は装置にて実装され得る。この開示においては、開示された技術を実行するように構成されたデバイスの機能的側面を強調するために、様々なコンポーネント、モジュール、又はユニットが説明されているが、必ずしも、複数の異なるハードウェアユニットによる実現を必要とするわけではない。むしろ、上述のように、様々なユニットが、コーデックハードウェアユニットに組み合わされてもよいし、あるいは、上述の１つ以上のプロセッサを含め、好適なソフトウェア及び／又はファームウェアと併せられた相互動作ハードウェアユニットの集合によって提供されてもよい。

Claims

双方向オプティカルフロー予測方法であって、
現在ブロックについて当初動きベクトルペアを取得し、当該当初動きベクトルペアは、前方動きベクトルと後方動きベクトルとを有し、
前記前方動きベクトルに従った前方予測ブロックと、前記後方動きベクトルに従った後方予測ブロックとを取得し、
前記現在ブロック内の現在サンプルについての、前方水平勾配、後方水平勾配、前方垂直勾配、及び後方垂直勾配を有する勾配パラメータを、前記現在サンプルに対応する前方予測サンプル及び後方予測サンプルに基づいて計算し、前記前方予測サンプルは前記前方予測ブロック内にあり、前記後方予測サンプルは前記後方予測ブロック内にあり、前記前方予測サンプルはpredSamplesL0[x][y]によって表され、前記後方予測サンプルはpredSamplesL1[x][y]によって表され、前記前方水平勾配はgradientHL0[x][y]によって表され、前記後方水平勾配はgradientHL1[x][y]によって表され、前記前方垂直勾配はgradientVL0[x][y]によって表され、前記後方垂直勾配はgradientVL1[x][y]によって表され、
前記勾配パラメータに基づいて、前記現在サンプルについての少なくとも２つのサンプルオプティカルフローパラメータを取得し、当該サンプルオプティカルフローパラメータは、第１パラメータ及び第２パラメータを有し、
前記現在ブロック内のサンプルのサンプルオプティカルフローパラメータに基づいて、ブロックオプティカルフローパラメータを取得し、当該ブロックオプティカルフローパラメータのうち１つは、前記第１パラメータの値と前記第２パラメータの符号関数の値とを乗算することを含む演算によって取得され、前記符号関数は、少なくとも３つのサブインターバルを有する区分関数であり、
前記前方予測ブロック、前記後方予測ブロック、前記ブロックオプティカルフローパラメータ、及び前記サンプルオプティカルフローパラメータに基づいて、前記現在ブロックの予測値を取得する、
ことを有し、
前記サンプルオプティカルフローパラメータは、サンプル差、水平平均勾配、及び垂直平均勾配を有し、
前記サンプル差は、diff[x][y] = predSamplesL0[x][y] - predSamplesL1[x][y]によって表され、
前記水平平均勾配は、TempH[x][y] = (gradientHL0[x][y] + gradientHL1[x][y])/2によって表され、
前記垂直平均勾配は、TempV[x][y] = (gradientVL0[x][y] + gradientVL1[x][y])/2によって表され、
前記第１パラメータは前記水平平均勾配であり、前記第２パラメータは前記垂直平均勾配であり、
前記符号関数は、

であり、Ｔは非負の実数である、
方法。
Ｔは０であり、対応して、前記符号関数は、

である、請求項１に記載の方法。
前記現在ブロックは、コーディングユニット又は該コーディングユニットのサブブロックである、請求項１又は２に記載の方法。
前記前方水平勾配は、前記前方予測サンプルに隣接する右サンプルと左サンプルとの差であり、
前記後方水平勾配は、前記後方予測サンプルに隣接する右サンプルと左サンプルとの差であり、
前記前方垂直勾配は、前記前方予測サンプルに隣接する下サンプルと上サンプルとの差であり、
前記後方垂直勾配は、前記後方予測サンプルに隣接する下サンプルと上サンプルとの差である、
請求項１乃至３のいずれか一項に記載の方法。
双方向オプティカルフロー予測装置であって、
現在ブロックについて当初動きベクトルペアを取得するように構成された取得モジュールであり、前記当初動きベクトルペアは、前方動きベクトルと後方動きベクトルとを有する、取得モジュールと、
前記前方動きベクトルに従った前方予測ブロックと、前記後方動きベクトルに従った後方予測ブロックとを取得するように構成されたパッチングモジュールと、
前記現在ブロック内の現在サンプルについての、前方水平勾配、後方水平勾配、前方垂直勾配、及び後方垂直勾配を有する勾配パラメータを、前記現在サンプルに対応する前方予測サンプル及び後方予測サンプルに基づいて計算するように構成された勾配モジュールであり、前記前方予測サンプルは前記前方予測ブロック内にあり、前記後方予測サンプルは前記後方予測ブロック内にあり、前記前方予測サンプルはpredSamplesL0[x][y]によって表され、前記後方予測サンプルはpredSamplesL1[x][y]によって表され、前記前方水平勾配はgradientHL0[x][y]によって表され、前記後方水平勾配はgradientHL1[x][y]によって表され、前記前方垂直勾配はgradientVL0[x][y]によって表され、前記後方垂直勾配はgradientVL1[x][y]によって表される、勾配モジュールと、
前記勾配パラメータに基づいて、前記現在サンプルについての少なくとも２つのサンプルオプティカルフローパラメータを取得するように構成された計算モジュールであり、前記サンプルオプティカルフローパラメータは、第１パラメータ及び第２パラメータを有する、計算モジュールと、
前記現在ブロック内のサンプルのサンプルオプティカルフローパラメータに基づいて、ブロックオプティカルフローパラメータを取得するように構成された訓練モジュールであり、前記ブロックオプティカルフローパラメータのうち１つは、前記第１パラメータの値と前記第２パラメータの符号関数の値とを乗算することを含む演算によって取得され、前記符号関数は、少なくとも３つのサブインターバルを有する区分関数である、訓練モジュールと、
前記前方予測ブロック、前記後方予測ブロック、前記ブロックオプティカルフローパラメータ、及び前記サンプルオプティカルフローパラメータに基づいて、前記現在ブロックの予測値を取得するように構成された予測モジュールと、
を有し、
前記サンプルオプティカルフローパラメータは、サンプル差、水平平均勾配、及び垂直平均勾配を有し、
前記サンプル差は、diff[x][y] = predSamplesL0[x][y] - predSamplesL1[x][y]によって表され、
前記水平平均勾配は、TempH[x][y] = (gradientHL0[x][y] + gradientHL1[x][y])/2によって表され、
前記垂直平均勾配は、TempV[x][y] = (gradientVL0[x][y] + gradientVL1[x][y])/2によって表され、
前記第１パラメータは前記水平平均勾配であり、前記第２パラメータは前記垂直平均勾配であり、
前記符号関数は、

であり、Ｔは非負の実数である、
装置。
Ｔは０であり、対応して、前記符号関数は、

である、請求項５に記載の装置。
前記現在ブロックは、コーディングユニット又は該コーディングユニットのサブブロックである、請求項５又は６に記載の装置。
前記前方水平勾配は、前記前方予測サンプルに隣接する右サンプルと左サンプルとの差であり、
前記後方水平勾配は、前記後方予測サンプルに隣接する右サンプルと左サンプルとの差であり、
前記前方垂直勾配は、前記前方予測サンプルに隣接する下サンプルと上サンプルとの差であり、
前記後方垂直勾配は、前記後方予測サンプルに隣接する下サンプルと上サンプルとの差である、
請求項５乃至７のいずれか一項に記載の装置。
双方向オプティカルフロー予測装置であって、
１つ以上のプロセッサと、
前記プロセッサに結合され、前記プロセッサによる実行のためのプログラミングを格納する非一時的なコンピュータ読み取り可能記憶媒体と、
を有し、
前記プログラミングは、前記プロセッサによって実行されるときに、請求項１乃至４のいずれか一項に記載の方法を実行するように当該装置を構成する、
装置。
請求項１乃至４のいずれか一項に記載の方法を実行するためのプログラムコードを有するコンピュータプログラム。