JP2023501298A

JP2023501298A - 単一カラー値を有するストリング照合

Info

Publication number: JP2023501298A
Application number: JP2022525765A
Authority: JP
Inventors: シュイ，シアオジョォン; リィウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2020-06-08
Filing date: 2021-04-28
Publication date: 2023-01-18
Anticipated expiration: 2041-04-28
Also published as: US11496731B2; WO2021252094A1; JP7410288B2; EP4000260A1; CN114503358A; KR20220039819A; US20210385433A1; EP4000260A4

Abstract

少なくとも１つのプロセッサを用いて符号化ビデオビットストリームを復号する方法は、前記符号化ビデオビットストリームに基づき、単一値ストリング照合モードが有効であると決定するステップと、前記符号化ビデオビットストリームから、複数の参照サンプルを含むセットの中の参照サンプルを示すインデックスを取得するステップと、前記インデックスにより示される参照サンプルに基づき、現在ブロックの現在ストリングに含まれるサンプルのために使用されるべきカラー値を決定するステップと、前記決定されたカラー値に基づき、前記現在ストリングに含まれるサンプルを再構成するステップと、前記再構成された現在ストリングを用いて、前記現在ブロックを再構成するステップと、を含む。

Description

［関連出願］
本願は、参照により開示の全体が本願明細書に組み込まれる、米国特許商標庁において３５U.S.C.§１１９の下で米国仮出願番号第６３/０３６,３５４号、「STRING MATCHING WITH SINGLE COLOR VALUE」、２０２０年６月８日出願の優先権を主張する米国特許出願番号第１７/２３１,７３７号、「STRING MATCHING WITH SINGLE COLOR VALUE」、２０２１年４月５日出願の優先権の利益を主張する。

［技術分野］
開示の主題は、ビデオコーディング及び復号に関し、より具体的には、コーディングビデオストリーム内のピクチャヘッダのシグナリングに関する。

ITU-T VCEG(Q６/１６) 及びISO/IEC MPEG (JTC１/SC２９/WG１１)の発行したH.２６５/HEVC (High Efficiency Video Coding)規格、２０１３ (version １) ２０１４ (version ２) ２０１５ (version ３) 及び２０１６ (version ４)。２０１５年に、これらの２つの標準化組織は、一緒にJVET（Joint Video Exploration Team）を形成して、HEVC以後の次世代ビデオコーディング規格を開発する可能性を探索した。２０１７年１０月、彼らは、Joint Call for Proposals on Video Compression with Capability beyond HEVC(CfP)を発表した。２０１８年２月１５日までに、標準ダイナミックレンジ（standard dynamic range(SDR)）に関する２２個のCfP応答、高ダイナミックレンジ（high dynamic range(HDR)）に関する１２個のCfP応答、及び３６０個のビデオカテゴリに関する１２個のCfP応答がそれぞれ提出された。２０１８年４月、全部の受信されたCfP応答は、１２２MPEG/１０th JVET会議で評価された。この会議の結果として、JVETは、HEVC以後の次世代ビデオコーディングの標準化プロセスを正式に発表した。新たな規格は、VVC（Versatile Video Coding）と名付けられ、JVETはJoint Video Expert Teamに改名した。

実施形態では、少なくとも１つのプロセッサを用いて符号化ビデオビットストリームを復号する方法は、
前記符号化ビデオビットストリームに基づき、単一値ストリング照合モードが有効であると決定するステップと、
前記符号化ビデオビットストリームから、複数の参照サンプルを含むセットの中の参照サンプルを示すインデックスを取得するステップと、
前記インデックスにより示される参照サンプルに基づき、現在ブロックの現在ストリングに含まれるサンプルのために使用されるべきカラー値を決定するステップと、
前記決定されたカラー値に基づき、前記現在ストリングに含まれるサンプルを再構成するステップと、
前記再構成された現在ストリングを用いて、前記現在ブロックを再構成するステップと、
を含む方法が提供される。

実施形態では、符号化ビデオビットストリームを復号する装置であって、前記装置は、
プログラムコードを格納するよう構成される少なくとも１つのメモリと、
前記プログラムコードを読み出し、前記プログラムコードにより指示されるように動作するよう構成される少なくとも１つのプロセッサと、
を含み、前記プログラムコードは、
前記少なくとも１つのプロセッサに、前記符号化ビデオビットストリームに基づき、単一値ストリング照合モードが有効であると決定させるよう構成される第１決定コードと、
前記少なくとも１つのプロセッサに、前記符号化ビデオビットストリームから、複数の参照サンプルを含むセットの中の参照サンプルを示すインデックスを取得させるよう構成される取得コードと、
前記少なくとも１つのプロセッサに、前記インデックスにより示される参照サンプルに基づき、現在ブロックの現在ストリングに含まれるサンプルのために使用されるべきカラー値を決定させるよう構成される第２決定コードと、
前記少なくとも１つのプロセッサに、前記決定されたカラー値に基づき、前記現在ストリングに含まれるサンプルを再構成させるよう構成される第１再構成コードと、
前記少なくとも１つのプロセッサに、前記再構成された現在ストリングを用いて、前記現在ブロックを再構成させる第２再構成コードと、
を含む、装置が提供される。

実施形態では、命令を格納する非一時的コンピュータ可読媒体であって、前記命令は、符号化ビデオビットストリームを復号する装置の１つ以上のプロセッサにより実行されると、前記１つ以上のプロセッサに、
前記符号化ビデオビットストリームに基づき、単一値ストリング照合モードが有効であると決定させ、
前記符号化ビデオビットストリームから、複数の参照サンプルを含むセットの中の参照サンプルを示すインデックスを取得させ、
前記インデックスにより示される参照サンプルに基づき、現在ブロックの現在ストリングに含まれるサンプルのために使用されるべきカラー値を決定させ、
前記決定されたカラー値に基づき、前記現在ストリングに含まれるサンプルを再構成させ、
前記再構成された現在ストリングを用いて、前記現在ブロックを再構成させる、
非一時的コンピュータ可読媒体が提供される。

開示の主題の更なる特徴、特性、及び種々の利点は、以下の詳細な説明及び添付の図面から一層明らかになるだろう。

実施形態による、通信システムの簡易ブロック図の概略図である。

実施形態による、デコーダの簡易ブロック図の概略図である。

実施形態による、エンコーダの簡易ブロック図の概略図である。

実施形態による、イントラピクチャブロック補償の図である。

実施形態による、１つのCTUサイズ探索範囲によるイントラピクチャブロック補償の図である。実施形態による、１つのCTUサイズ探索範囲によるイントラピクチャブロック補償の図である。実施形態による、１つのCTUサイズ探索範囲によるイントラピクチャブロック補償の図である。実施形態による、１つのCTUサイズ探索範囲によるイントラピクチャブロック補償の図である。

実施形態による、空間マージ候補の位置の図である。

実施形態による、ストリング照合モードの図である。

実施形態による、近隣参照サンプルを用いる単一値ストリング照合の図である。

実施形態による、符号化ビデオビットストリームを復号する例示的な処理のフローチャートである。

一実施形態による、コンピュータシステムの概略図である。

図１は、本開示の実施形態による通信システム（１００）の簡易ブロック図を示す。システム（１００）は、ネットワーク（１５０）を介して相互接続される少なくとも２つの端末（１１０～１２０）を含んでよい。データの一方向送信では、第１端末（１１０）は、ネットワーク（１５０）を介して他の端末（１２０）へ送信するために、ビデオデータをローカル位置でコーディングしてよい。第２端末（１２０）は、ネットワーク（１５０）から他の端末のコーディングビデオデータを受信し、コーディングデータを復号して、復元したビデオデータを表示してよい。単方向データ伝送は、メディアサービングアプリケーション等で共通であってよい。

図１は、例えばビデオ会議中に生じ得る、コーディングビデオの双方向送信をサポートするために適用される第２の端末ペア（１３０、１４０）を示す。データの双方向送信では、各端末（１３０、１４０）は、ネットワーク（１５０）を介して他の端末へ送信するために、ローカルでキャプチャしたビデオデータをコーディングしてよい。各端末１３０、１４０は、また、他の端末により送信されたコーディングビデオデータを受信してよく、コーディングデータを復号してよく、及び復元したビデオデータをローカルディスプレイ装置で表示してよい。

図１では、端末装置（１１０～１４０）は、サーバ、パーソナルコンピュータ、及びスマートフォンとして示されてよいが、本開示の原理はこれらに限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレイヤ、及び／又は専用ビデオ会議設備による適用がある。ネットワーク（１５０）は、端末（１１０～１４０）の間でコーディングビデオデータを運ぶ任意の数のネットワークを表し、例えば有線及び／又は無線通信ネットワークを含む。通信ネットワーク（１５０）は、回線切り替え及び／又はパケット切り替えチャネルでデータを交換してよい。代表的なネットワークは、電子通信ネットワーク、ローカルエリアネットワーク、広域ネットワーク、及び／又はインターネットを含む。本発明の議論の目的で、ネットワーク（１５０）のアーキテクチャ及びトポロジは、以下で特に断りの無い限り、本開示の動作にとって重要でないことがある。

図２は、開示の主題の適用の一例として、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダの配置を示す。開示の主題は、例えばビデオ会議、デジタルＴＶ、ＣＤ、ＤＶＤ、メモリスティック、等を含むデジタル媒体への圧縮ビデオの格納、他のビデオ可能アプリケーション、等に等しく適用可能である。

ストリーミングシステムは、例えば非圧縮ビデオサンプルストリーム（２０２）を生成するビデオソース（２０１）、例えばデジタルカメラを含み得るキャプチャサブシステム（２１３）を含んでよい。サンプルストリーム（２０２）は、符号化ビデオビットストリームと比べるとき高データ容量を強調するために太線で示され、カメラ（２０１）に結合されるエンコーダ（２０３）により処理できる。エンコーダ（２０３）は、ハードウェア、ソフトウェア、又はそれらの組み合わせを含み、以下に詳述するように開示の主題の態様を可能にし又は実装することができる。符号化ビデオビットストリーム（２０４）は、サンプルストリームと比べたとき、低データ容量を強調するために細線で示され、将来の使用のためにストリーミングサーバ（２０５）に格納できる。１つ以上のストリーミングクライアント（２０６、２０８）は、ストリーミングサーバ（２０５）にアクセスして、符号化ビデオビットストリーム（２０４）のコピー（２０７、２０９）を読み出すことができる。クライアント（２０６）は、ビデオデコーダ（２１０）を含むことができる。ビデオデコーダ（３１０）は、符号化ビットストリーム（２０７）の入来するコピーを復号し、ディスプレイ（２１２）又は他のレンダリング装置（図示しない）においてレンダリング可能な出力ビデオサンプルストリーム（２１１）を生成する。幾つかのストリーミングシステムでは、ビデオビットストリーム（２０４、２０７、２０９）は、特定のビデオコーディング／圧縮規格に従い符号化できる。これらの規格の例は、ITU-T Recommendation H.２６５を含む。策定中のビデオコーディング規格は、略式にVVC（Versatile Video Coding）として知られている。開示の主題は、VVCの文脈で使用されてよい。

図３は、本開示の実施形態によるビデオデコーダ（２１０）の機能ブロック図であり得る。

受信機（３１０）は、ビデオデコーダ（２１０）により復号されるべき１つ以上のコーディングビデオシーケンス、同じ又は別の実施形態では、一度に１つのコーディングビデオシーケンスを受信してよい。ここで、各コーディングビデオシーケンスの復号は、他のコーディングビデオシーケンスと独立している。コーディングビデオシーケンスは、符号化ビデオデータを格納する記憶装置へのハードウェア／ソフトウェアリンクであってよいチャネル（３１２）から受信されてよい。受信機（３１０）は、他のデータ、例えば、それぞれの使用エンティティ（図示しない）へと転送され得るコーディング音声データ及び／又は補助データストリームと共に、符号化ビデオデータを受信してよい。受信機（３１０）は、他のデータからコーディングビデオシーケンスを分離してよい。ネットワークジッタを除去するために、バッファメモリ（３１５）は、受信機（３１０）とエントロピーデコーダ／パーサ（３２０）（以後、「パーサ」）との間に接続されてよい。受信機（３１０）が、十分な帯域幅の記憶／転送装置から制御可能に、又はアイソクロナス（isosynchronous）ネットワークから、データを受信しているとき、バッファ（３１５）は、必要なくてよく又は小さくできる。インターネットのようなベストエフォート型パケットネットワークで使用する場合、バッファ（３１５）が必要であってよく、比較的大きくすることができ、有利なことに適応サイズにすることができる。

ビデオデコーダ（２１０）は、エントロピーコーディングビデオシーケンスからシンボル（３２１）を再構成するために、パーサ（３２０）を含んでよい。これらのシンボルのカテゴリは、デコーダ（２１０）の動作を管理するために使用される情報、及び場合によっては図３に示したようにデコーダの統合部分ではないがデコーダに接続され得るディスプレイ（２１２）のようなレンダリング装置を制御するための情報を含む。レンダリング装置のための制御情報は、SEI（Supplementary Enhancement Information）メッセージ又はVUI（Video Usability Information）パラメータセットフラグメント（図示しない）の形式であってよい。パーサ（３２０）は、受信された符号かビデオシーケンスをパース／エントロピー復号してよい。コーディングビデオシーケンスのコーディングは、ビデオコーディング技術又は規格に従うことができ、可変長コーディング、ハフマンコーディング、コンテキスト依存関係を有する又は有しない算術的コーディング、等を含む、当業者によく知られた原理に従うことができる。パーサ（３２０）は、コーディングビデオシーケンスから、ビデオデコーダの中のピクセルのサブグループのうちの少なくとも１つについて、該グループに対応する少なくとも１つのパラメータに基づき、サブグループパラメータのセットを抽出してよい。サブグループは、GOP（Groups of Picture）、ピクチャ、サブピクチャ、タイル、スライス、ブリック、マクロブロック、コーディングツリーユニット（Coding Tree Unit ：CTU）、コーディングユニット（Coding Unit：CU）、ブロック、変換ユニット（Transform Unit：TU）、予測ユニット（Prediction Unit：PU）、等を含み得る。タイルは、ピクチャ内の特定のタイル列及び行の中で長方形領域のＣＵ／CTUを示してよい。ブリックは、特定のタイル内の長方形領域のＣＵ/CTU行を示してよい。スライスは、NALユニットに含まれる、ピクチャの１つ以上のブリックを示してよい。サブピクチャは、ピクチャ内の１つ以上のスライスの長方形領域を示してよい。エントロピーデコーダ／パーサは、コーディングビデオシーケンスから、変換係数、量子化パラメータ値、動きベクトル、等のような情報も抽出してよい。

パーサ（３２０）は、バッファ（３１５）から受信したビデオシーケンスに対してエントロピー復号／パース動作を実行して、シンボル（３２１）を生成してよい。

シンボル（３２１）の再構成は、コーディングビデオピクチャ又はその部分の種類（例えば、インター及びイントラピクチャ、インター及びイントラブロック）及び他の要因に依存して、複数の異なるユニットを含み得る。どのユニットがどのように含まれるかは、パーサ（３２０）によりコーディングビデオシーケンスからパースされたサブグループ制御情報により制御できる。パーサ３２０と以下の複数のユニットとの間のこのようなサブグループ制御情報のフローは、明確さのために示されない。

既に言及した機能ブロックを超えて、デコーダ（２１０）は、後述のように、多数の機能ユニットに概念的に細分化できる。商用的制約の下で動作する実際の実装では、これらのユニットの多くは、互いに密に相互作用し、少なくとも部分的に互いに統合され得る。しかしながら、開示の主題を説明する目的で、機能ユニットへの以下の概念的細分化は適切である。

第１ユニットは、スケーラ／逆変換ユニット３５１である。スケーラ／逆変換ユニット（３５１）は、量子化された変換係数、及び、どの変換が使用されるべきか、ブロックサイズ、量子化係数、量子化スケーリングマトリクス、等を含む制御情報を、パーサ（３２０）からのシンボル（３２１）として受信する。これは、アグリゲータ（３５５）に入力され得るサンプル値を含むブロックを出力できる。

幾つかの例では、スケーラ／逆変換ユニット（３５１）の出力サンプルは、イントラコーディングブロック、つまり、前に再構成されたピクチャからの予測情報を使用しないが現在ピクチャの前に再構成された部分からの予測情報を使用可能なブロック、に属することができる。このような予測情報は、イントラピクチャ予測ユニット（３５２）により提供できる。幾つかの場合には、イントラピクチャ予測ユニット（３５２）は、再構成中のブロックと同じサイズ及び形状のブロックを、現在（部分的に再構成された）ピクチャ（３５８）からフェッチした周囲の既に再構成された情報を用いて、生成する。アグリゲータ（３５５）は、幾つかの場合には、サンプル毎に、イントラ予測ユニット（３５２）の生成した予測情報を、スケーラ／逆変換ユニット（３５１）により提供された出力サンプル情報に追加する。

他の場合には、スケーラ／逆変換ユニット（３５１）の出力サンプルは、インターコーディングされた、場合によっては動き補償されたブロックに関連し得る。このような場合には、動き補償予測ユニット（３５３）は、参照ピクチャメモリ（３５７）にアクセスして、予測のために使用されるサンプルをフェッチできる。ブロックに関連するシンボル（３２１）に従いフェッチしたサンプルを動き補償した後に、これらのサンプルは、アグリゲータ（３５５）により、出力サンプル情報を生成するために、スケーラ／逆変換ユニットの出力に追加され得る（この場合、残差サンプル又は残差信号と呼ばれる）。動き補償予測ユニットが予測サンプルをフェッチする参照ピクチャメモリ内のアドレスは、例えばＸ、Ｙ及び参照ピクチャコンポーネントを有し得るシンボル（３２１）の形式で、動き補償予測ユニットの利用可能な動きベクトルにより制御できる。動き補償は、サブサンプルの正確な動きベクトルが使用中であるとき参照ピクチャメモリからフェッチされたサンプル値の補間、動きベクトル予測メカニズム、等も含み得る。

アグリゲータ（３５５）の出力サンプルは、ループフィルタユニット（３５６）において種々のループフィルタリング技術を受け得る。ビデオ圧縮技術は、コーディングビデオビットストリームに含まれ且つパーサ（３２０）からのシンボル（３２１）としてループフィルタユニット（３５６）に利用可能にされたパラメータにより制御されるが、コーディングピクチャ又はコーディングビデオシーケンスの（復号順序で）前の部分の復号中に取得されたメタ情報にも応答し、前に再構成されループフィルタリングされたサンプル値にも応答し得るインループフィルタ技術を含み得る。

ループフィルタユニット（３５６）の出力は、レンダー装置（２１２）へと出力でき及び将来のインターピクチャ予測で使用するために参照ピクチャメモリに格納され得るサンプルストリームであり得る。

特定のコーディングピクチャは、一旦完全に再構成されると、将来の予測のための参照ピクチャとして使用できる。コーディングピクチャが完全に再構成され、コーディングピクチャが（例えばパーサ（３２０）により）参照ピクチャとして識別されると、現在参照ピクチャ（３５８）は、参照ピクチャバッファ（３５７）の一部になることができ、後続のコーディングピクチャの再構成を開始する前に、新鮮な現在ピクチャメモリを再割り当てできる。

ビデオデコーダ（２１０）は、ITU-T Rec. H.２６５のような規格で策定され得る所定のビデオ圧縮技術に従い復号動作を実行してよい。コーディングビデオシーケンスが、ビデオ圧縮技術又は規格で、具体的にはその中のプロファイル文書で指定された、ビデオ圧縮技術又は規格のシンタックスに従うという意味で、コーディングビデオシーケンスは、使用中のビデオ圧縮技術又は規格により指定されたシンタックスに従ってよい。また、遵守のために必要なことは、コーディングビデオシーケンスの複雑さが、ビデオ圧縮技術又は規格のレベルにより定められる限界の範囲内であることであり得る。幾つかの場合には、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート（例えばメガサンプル／秒で測定される）、最大参照ピクチャサイズ、等を制限する。レベルにより設定される限界は、幾つかの場合には、HRD（Hypothetical Reference Decoder）仕様及びコーディングビデオシーケンスの中でシグナリングされるHRDバッファ管理のためのメタデータを通じて更に制限され得る。

実施形態では、受信機（３１０）は、符号化ビデオと共に追加（冗長）データを受信してよい。追加データは、コーディングビデオシーケンスの部分として含まれてよい。追加データは、データを正しく復号するため及び／又は元のビデオデータをより正確に再構成するために、ビデオデコーダ２１０により使用されてよい。追加データは、例えば、時間的、空間的、又はSNR拡張レイヤ、冗長スライス、冗長ピクチャ、前方誤り訂正符号、等の形式であり得る。

図４は、本開示の一実施形態によるビデオエンコーダ（２０３）の機能ブロック図であり得る。

エンコーダ（２０３）は、ビデオサンプルを、エンコーダ（２０３）によりコーディングされるべきビデオ画像をキャプチャし得るビデオソース（２０１）（エンコーダの部分ではない）から受信してよい。

ビデオソース（２０１）は、エンコーダ（２０３）によりコーディングされるべきソースビデオシーケンスを、任意の適切なビット深さ（例えば、８ビット、１０ビット、１２ビット、．．．）、任意の色空間（例えば、BT.６０１ Y CrCb, RGB,．．．）、及び任意の適切なサンプリング構造（例えば、Y CrCb ４:２:０, Y CrCb ４:４:４）のデジタルビデオサンプルストリームの形式で、提供してよい。メディア提供システムでは、ビデオソース（２０１）は、前に準備されたビデオを格納する記憶装置であってよい。ビデオ会議システムでは、ビデオソース（２０３）は、ビデオシーケンスとしてローカル画像情報をキャプチャするカメラであってよい。ビデオデータは、続けて閲覧されると動きを与える複数の個別ピクチャとして提供されてよい。ピクチャ自体は、ピクセルの空間的配列として組織化されてよい。各ピクセルは、使用中のサンプリング構造、色空間、等に依存して、１つ以上のサンプルを含み得る。当業者は、ピクセルとサンプルとの間の関係を直ちに理解できる。以下の説明はサンプルに焦点を当てる。

実施形態によると、エンコーダ（２０３）は、ソースビデオシーケンスのピクチャを、コーディングビデオシーケンス（４４３）へと、リアルタイムに又はアプリケーションにより要求される任意の他の時間制約の下でコーディングし圧縮してよい。適切なコーディング速度の実施は、制御部（４５０）の１つの機能である。制御部は、後述するように他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。結合は、明確さのために図示されない。制御部により設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化器、レート歪み最適化技術のラムダ値、．．．）、ピクチャサイズ、GOP（group of pictures）レイアウト、最大動きベクトル探索範囲、等を含み得る。当業者は、特定のシステム設計のために最適化されたビデオエンコーダ（２０３）に関連し得るとき、制御部４５０の他の機能を直ちに識別できる。

幾つかのビデオエンコーダは、当業者が「コーディングループ」として直ちに認識する中で動作する。非常に簡略化した説明として、コーディングループは、エンコーダ（４３０）（以後、「ソースコーダ」）（コーディングされるべき入力ピクチャと参照ピクチャとに基づき、シンボルを生成する）及びエンコーダ（２０３）内に組み込まれ、シンボルを再構成して、（シンボルとコーディングビデオビットストリームとの間の任意の圧縮が開示の主題において考慮されるビデオ圧縮技術の中で無損失であるとき）（リモート）デコーダが生成し得るサンプルデータを生成する（ローカル）デコーダ（４３３）の符号化部分を含むことができる。再構成されたサンプルストリームは、参照ピクチャメモリ４３４に入力される。シンボルストリームの復号が、デコーダ位置（ローカル又はリモート）と独立にビット正確な結果をもたらすとき、参照ピクチャバッファの内容も、ローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えると、エンコーダの予測部分が、復号中に予測を用いるときデコーダが「見る」のと正確に同じサンプル値を、参照ピクチャサンプルとして「見る」。参照ピクチャ同期性のこの基本原理（及び、例えばチャネルエラーのために同期性が維持できない場合には、結果として生じるドリフト）は、当業者によく知られている。

「ローカル」デコーダ（４３３）の動作は、図３と関連して以上に詳述した「リモート」デコーダ（２１０）のものと同じであり得る。簡単に図４も参照すると、しかしながら、シンボルが利用可能であり、エントロピーコーダ（４４５）及びパーサ（３２０）によるコーディングビデオシーケンスへのシンボルの符号化／復号が無損失であり得るので、チャネル（３１２）、受信機（３１０）、バッファ（３１５）、及びパーサ（３２０）を含むデコーダ（２１０）のエントロピー復号部分は、ローカルデコーダ（４３３）に完全に実装されなくてよい。

この点で行われる考察は、デコーダ内に存在するパース／エントロピー復号を除く任意のデコーダ技術も、対応するエンコーダ内と実質的に同一の機能形式で存在する必要があるということである。この理由から、開示の主題は、デコーダ動作に焦点を当てる。エンコーダ技術の説明は、それらが包括的に説明されるデコーダ技術の逆であるので、省略できる。特定の領域においてのみ、より詳細な説明が必要であり、以下に提供される。

動作中、幾つかの例では、ソースコーダ（４３０）は、動き補償された予測コーディングを実行してよい。これは、「参照フレーム」として指定されたビデオシーケンスからの１つ以上の前にコーディングされたフレームを参照して予測的に入力フレームをコーディングする。この方法では、コーディングエンジン（４３２）は、入力フレームのピクセルブロックと、入力フレームに対する予測基準として選択されてよい参照フレームのピクセルブロックとの間の差分をコーディングする。

ローカルビデオデコーダ（４３３）は、ソースコーダ（４３０）により生成されたシンボルに基づき、参照フレームとして指定されてよいフレームのコーディングビデオデータを復号してよい。コーディングエンジン（４３２）の動作は、有利なことに、損失処理であってよい。コーディングビデオデータがビデオデコーダ（図４に図示されない）において復号され得るとき、再構成ビデオシーケンスは、標準的に、幾つかのエラーを有するソースビデオシーケンスの複製であってよい。ローカルビデオデコーダ（４３３）は、参照フレームに対してビデオデコーダにより実行され得る復号処理を複製し、参照ピクチャキャッシュ（４３４）に格納されるべき再構成参照フレームを生じ得る。このように、エンコーダ（２０３）は、（伝送誤りが無ければ）遠端ビデオデコーダにより取得される再構成参照フレームと共通の内容を有する再構成参照フレームのコピーをローカルに格納してよい。

予測器（４３５）は、コーディングエンジン（４３２）のために予測探索を実行してよい。つまり、コーディングされるべき新しいフレームについて、予測器（４３５）は、新しいピクチャのための適切な予測基準として機能し得る（候補参照ピクセルブロックのような）サンプルデータ又は参照ピクチャ動きベクトル、ブロック形状、等のような特定のメタデータについて、参照ピクチャメモリ（４３４）を検索してよい。予測器（４３５）は、適切な予測基準を見付けるために、サンプルブロック－ピクセルブロック毎に動作してよい。幾つかの例では、予測器（４３５）により取得された検索結果により決定されるように、入力ピクチャは、参照ピクチャメモリ（４３４）に格納された複数の参照ピクチャから引き出された予測基準を有してよい。

制御部（４５０）は、例えば、ビデオデータの符号化のために使用されるパラメータ及びサブグループパラメータの設定を含む、ビデオコーダ（４３０）のコーディング動作を管理してよい。

全ての前述の機能ユニットの出力は、エントロピーコーダ（４４５）におけるエントロピーコーディングを受けてよい。エントロピーコーダは、ハフマンコーディング、可変長コーディング、算術コーディング、等のような当業者によく知られた技術に従いシンボルを無損失圧縮することにより、種々の機能ユニットにより生成されたシンボルを、コーディングビデオシーケンスへと変換する。

送信機（４４０）は、コーディングビデオデータを格納し得る記憶装置へのハードウェア／ソフトウェアリンクであってよい通信チャネル（４６０）を介する伝送のために準備するために、エントロピーコーダ（４４５）により生成されたコーディングビデオシーケンスをバッファリングしてよい。送信機（４４０）は、ビデオコーダ（４３０）からのコーディングビデオデータを、送信されるべき他のデータ、例えばコーディング音声データ及び／又は補助データストリーム（図示されないソース）とマージ（merge）してよい。

制御部（４５０）は、エンコーダ（２０３）の動作を管理してよい。コーディング中、制御部（４５０）は、それぞれのピクチャに適用され得るコーディング技術に影響し得る特定のコーディングピクチャタイプを、各コーディングピクチャに割り当ててよい。例えば、ピクチャは、多くの場合、以下のピクチャタイプのうちの１つとして割り当てられてよい。

イントラピクチャ（Iピクチャ）は、予測のソースとしてシーケンス内の任意の他のフレームを使用せずにコーディング及び復号され得るピクチャであってよい。幾つかのビデオコーデックは、例えばIDR（Independent Decoder Refresh）ピクチャを含む異なる種類のイントラピクチャを許容する。当業者は、Iピクチャの変形、及びそれらの個々の適用及び特徴を認識する。

予測ピクチャ（Pピクチャ）は、殆どの場合、各ブロックのサンプル値を予測するために１つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測を用いてコーディング及び復号され得るピクチャであってよい。

双方向予測ピクチャ（Bピクチャ）は、各ブロックのサンプル値を予測するために最大２つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測を用いてコーディング及び復号され得るピクチャであってよい。同様に、マルチ予測ピクチャは、単一のブロックの再構成のために、２つより多くの参照ピクチャ及び関連付けられたメタデータを使用できる。

ソースピクチャは、共通に、複数のサンプルブロック（例えば、それぞれ４×４、８×８、４×８、又は１６×１６個のサンプルのブロック）に空間的に細分化され、ブロック毎にコーディングされてよい。ブロックは、ブロックのそれぞれのピクチャに適用されるコーディング割り当てにより決定される他の（既にコーディングされた）ブロックへの参照により予測的にコーディングされてよい。例えば、Iピクチャのブロックは、非予測的にコーディングされてよく、又はそれらは同じピクチャの既にコーディングされたブロックを参照して予測的にコーディングされてよい（空間予測又はイントラ予測）。Pピクチャのピクセルブロックは、１つの前にコーディングされた参照ピクチャを参照して、空間予測を介して又は時間予測を介して、予測的にコーディングされてよい。Bピクチャのブロックは、１つ又は２つの前にコーディングされた参照ピクチャを参照して、空間予測を介して又は時間予測を介して、非予測的にコーディングされてよい。

ビデオコーダ（２０３）は、ITU-T Rec. H.２６５のような所定のビデオコーディング技術又は規格に従いコーディング動作を実行してよい。その動作において、ビデオコーダ（２０３）は、入力ビデオシーケンスの中の時間的及び空間的冗長性を利用する予測コーディング動作を含む種々の圧縮動作を実行してよい。コーディングビデオデータは、従って、使用されているビデオコーディング技術又は規格により指定されたシンタックスに従ってよい。

一実施形態では、送信機（４４０）は、符号化ビデオと共に追加データを送信してよい。ビデオコーダ（４３０）は、このようなデータをコーディングビデオシーケンスの部分として含んでよい。追加データは、時間／空間／SNR拡張レイヤ、冗長ピクチャ及びスライスのような他の形式の冗長データ、SEI（Supplementary Enhancement Information）メッセージ、VUI（Visual Usability Information）パラメータセットフラグメント、等を含んでよい。

イントラブロックコピー（Intra Block Copy）
異なるピクチャからのブロックに基づく補償は、動き補償と呼ばれる。同様に、ブロック補償は、同じピクチャ内の前に再構成された領域からも実行できる。これは、イントラピクチャブロック補償、現在ピクチャ参照（current picture referencing (CPR)）、又はイントラブロックコピー（intra block copy (IBC)）と呼ばれる。現在ブロックと参照ブロックとの間のオフセット示す変位ベクトルは、ブロックベクトル（block vector (BV)）と呼ばれる。任意の値（ｘ又はｙ方向のいずれかにおいて正又は負）であり得る動き補償における動きベクトルと異なり、ブロックベクトルは、ポイントされる参照ブロックが利用可能であり既に再構成されていることを保証するために、幾つかの制約を有してよい。また、並列処理を考慮するために、タイル境界又は波面はしご形状境界である特定の参照領域は、IBCでは排除される。

ブロックベクトルのコーディングは、明示的又は暗示的であり得る。インターコーディングで高度移動ベクトル予測（advanced motion vector prediction (AMVP)）モードと呼ばれる）明示的モードでは、ブロックベクトルとその予測子との間の差分がシグナリングされる。暗示的モードでは、ブロックベクトルは、マージモードで動きベクトルと同様の方法で、その予測子から純粋に復元される。ブロックベクトルの分解能は、幾つかの実装では整数位置に制限され、他のシステムでは分数位置を指すことが許容されてよい。

ブロックレベルにおけるイントラブロックコピーの使用は、ブロックレベルフラグ、例えばIBCフラグを用いてシグナリングできる。実施形態では、現在ブロックがマージモードでコーディングされないとき、このフラグがシグナリングされる。或いは、それは、参照インデックスアプローチによりシグナリングできる。これは、現在復号されるピクチャを参照ピクチャとして扱うことにより行われる。HEVCSCCでは、そのような参照ピクチャは、リストの最後の位置に置かれる。この特別な参照ピクチャは、また、DPB内の他の時間的参照ピクチャと一緒にマージされる。

イントラブロックコピーを第３のモードとして取り扱うような、イントラブロックコピーの幾つかの変形も存在し、これはイントラ又はインター予測モードのいずれとも異なる。こうすることにより、マージモード及びAMVPモードにおけるブロックベクトル予測は、通常のインターモードと分けられる。例えば、イントラブロックコピーモードのために別個のマージ候補リストが定義され、リスト内の全部のエントリが全部ブロックベクトルである。同様に、イントラブロックコピーAMVPモードにおけるブロックベクトル予測リストは、ブロックベクトルのみで構成される。両方のリストに適用される一般的ルールは、それらが候補導出処理の観点でインターマージ候補リスト又はAMVP予測子リストと同じロジックに従ってよいことである。例えば、HEVC又はVVCインターマージモードにおける５個の空間的近隣位置は、自身のマージ候補リストを導出するために、イントラブロックコピーのためにアクセスされる。

イントラブロックコピーの例は、図５に示される。図５は、現在ブロック５０２が参照ブロック５０４に基づき復号される現在ピクチャ５００を示す。参照ブロック５０４の位置はブロックベクトル５０６により示される。

現在、VVCでは、CPRモードの探索範囲は、現在CTU内であるよう制約される。CPRモードの参照サンプルを格納するための効率的なメモリ要件は、１CTUサイズのサンプルである。

この例は、図６A～６Dに示される。例えば、図６Aでは、参照サンプル６１２aは、Xでマークされ、現在サンプル６１１のために利用できない。同様に図６Bでは、参照サンプル６２２a及び６２２ｂは、現在サンプル６２１のために利用できない。図６Cでは、参照サンプル６３２a、６３２b、６３２cは、現在サンプル６３１のために利用できない。図６Dでは、参照サンプル６４２a、６４２b、６４２c、６２４dは、現在サンプル６４１のために利用できない。

現在６４×６４領域の中の再構成サンプルを格納するために既存の参照サンプルメモリを考えると、更に３個の６４×６４サイズの参照サンプルメモリが必要である。従って、以下に更に詳述される幾つかの実施形態は、CPRモードの効率的な探索範囲を、左CTUの何らかの部分にまで拡張してよく、一方で、参照ピクセルを格納するための合計メモリ要件は不変のままである（１CTUサイズ、全部で４個の６４×６４参照サンプルメモリ）。

有効なブロックベクトル（mvL、１/１pel解像度）が従ってよいビットストリーム適合条件の例が以下に列挙される：

ビットストリーム適合の要件は、ルマ動きベクトルmvLが以下の制約に従うことである：
A１：条項６.４.X［近隣グロック利用可能性チェック処理］で指定されるようなブロック利用可能性の導出処理が、(xCb,yCb)に等しく設定された現在ルマ位置(xCurr,yCurr)、及び近隣ルマ位置(xCb+(mvL[０]>>４),yCb+(mvL[１]>>４))を入力として呼び出されるとき、出力はTRUEに等くなければならない。
A２：条項６.４.X［近隣グロック利用可能性チェック処理］で指定されるようなブロック利用可能性の導出処理が、(xCb,yCb)に等しく設定された現在ルマ位置(xCurr,yCurr)、及び近隣ルマ位置(xCb+(mvL[０]>>４)+cbWidth－１,yCb+(mvL[１]>>４)+cbHeight－１)を入力として呼び出されるとき、出力はTRUEに等しくなければならない。
B１：以下の条件のうちの一方又は両方が真であるべきである。
・(mvL[０]>>４)+cbWidthの値が０以下である。
・(mvL[１]>>４)+cbHeightの値が０以下である。
C１：以下の条件が真であるべきである。

C２：(xCb+(mvL[０]>>４))>>CtbLog２SizeYが(xCb>>CtbLog２SizeY)－１に等しいとき、条項６.４.X［近隣グロック利用可能性チェック処理］で指定されるようなブロック利用可能性の導出処理は、(xCb,yCb)に等しく設定された現在ルマ位置(xCurr,yCurr)、及び近隣ルマ位置(((xCb+(mvL[０]>>４)+CtbSizeY)>>(CtbLog２SizeY－１))<<(CtbLog２SizeY－１),((yCb+(mvL[１]>>４))>>(CtbLog２SizeY－１))<<(CtbLog２SizeY－１))を入力として呼び出され、出力はFALSE（偽）に等しくなければならない。

VVC/HEVC空間マージ候補
図７は、HEVC及びVVCのための５個の空間マージ候補の位置を示す。候補リストを形成する順序は、A０->B０->B１->A１->B２である。

履歴に基づく動きベクトル予測
動きベクトル予測（motion vector prediction (MVP)）を実行するとき、履歴に基づく動きベクトル予測（history-based motion vector prediction (HMVP)）マージ候補は、空間MVP及び時間MVP（TMVP）の後に、マージリストに追加されてよい。この方法では、前のコーディングブロックの動き情報は、テーブルに格納され、現在ＣＵのMVPとして使用される。複数のHMVP候補を有するテーブルは、符号化/復号処理の間、維持される。テーブルは、新しいCTU行に遭遇するとリセットされる（空にされる）。サブブロックインターコーディングCUが存在しないときは常に、関連する動き情報は、新しいHMVP候補として、テーブルの最後のエントリに追加される。

VTM３では、HMVPテーブルのサイズＳは、６に設定される。これは、最大６個の履歴に基づくMVP（History-based MVP (HMVP)）候補がテーブルに追加されてよいことを示す。新しい動き候補をテーブルに挿入するとき、制約された先入れ先出し（first-in-first-out (FIFO)）ルールが利用される。ここで、冗長性チェックが先ず適用されて、テーブル内に同一のHMVPが存在するか否かを見付ける。見付かった場合、同一のＨＭＶＰはテーブルから削除され、以降の全部のＨＭＶＰ候補が前方に移動される。

ＨＭＶＰ候補は、マージ候補リスト構成処理で使用され得る。テーブル内の最後の幾つかのHMVP候補は、順番にチェックされ、TMVP候補の後に候補リストに挿入される。冗長性チェックは、空間又は時間マージ候補に対して、ＨＭＶＰ候補に適用される。

冗長性チェック演算の数を削減するために、以下の簡略化が導入されてよい：
１）マージリスト生成のために使用されるＨＭＶＰ候補の数は(N<=４)?M:(８－N)として設定される。ここで、Ｎは、マージリスト内に存在する候補の数を示し、Mは、テーブル内の利用可能なHMVP候補の数を示す。
２）利用可能なマージ候補の合計数が最大許容候補数－１に達すると、ＨＭＶＰからのマージ候補リスト構成処理は終了する。

イントラブロックコピーがインターモードと別のモードとして動作するとき、HBVPと呼ばれる別のヒストリバッファが、前にコーディングされたイントラブロックコピーブロックベクトルを格納するために使用される。

インター予測と別個のモードとして、それは、イントラブロックコピーモードの簡略化されたブロックベクトル導出処理を有することが望ましい。同予の履歴に基づくブロックベクトル予測子バッファは、BV予測を実行するために使用できる。以下では、そのようなHBVPの幾つかの特定の使用のために幾つかの情報が提供される。

クラスに基づく、履歴に基づくブロックベクトル予測
HBVPバッファは、ブロックサイズ、ブロック位置、等のような幾つかの他の副情報を含む前のIBCコーディングブロックのBV情報を記録するために確立される。

記録された情報に基づき、現在ブロック毎に、以下の条件を満たすHBVP内のBVは、対応するカテゴリに分類される：

クラス０：コーディングブロックの領域（幅＊高さ）が閾値（６４ピクセル）以上である。

クラス１：BVの頻度（frequency）が２以上である。

クラス２：コーディングブロック候補（左上角）が現在ブロックの左にある。

クラス３：コーディングブロック候補（左上角）が現在ブロックの上にある。

クラス４：コーディングブロック候補（左上角）が現在ブロックの左側上にある。

クラス５：コーディングブロック候補（左上角）が現在ブロックの右側上にある。

クラス６：コーディングブロック候補（左上角）が現在ブロックの左側下にある。

カテゴリ毎に、最近のコーディングブロックのBVが、BV予測子候補として導出される。CBVPリストは、０～６の範囲の各カテゴリのBV予測子を付加することにより構成される。

ストリング照合（ストリングコピー）
コーディングブロックは、幾つかの連続するストリングに分割されてよく、各ストリングの後に走査順に沿って次のストリングが続く。走査順は、ラスタスキャン又はトラバーススキャンであることができる。スキャン方向は、垂直又は水平方向であることができる。ストリング毎に、ストリングオフセットベクトル（string offset vector (SV)）及びストリングの長さ（length of the string (SL)）がシグナリングされる。SVは、参照ストリングが参照領域内のどこからであるかを示すために使用される。長さは、現在／参照ストリングがどれくらい長いかを示すために使用される。

ストリング照合又はストリングコピーモードの例は、図８に示される。ここで、８×８CUであってよいCU８０２は、ラスタスキャン順序を用いて、２つのストリング、例えばストリング８０４及びストリング８０６に分割される。ストリング８０４は最初の２９個のサンプルを含み、ストリング８０６は最後の３５個のサンプルを含む。ストリング８０４及びストリング８０６の参照は、対応するストリングオフセットベクトルにより示される。例えば、参照ストリング８０８は、ストリングオフセットベクトル８１０により示され、参照ストリング８１２は、ストリングオフセットベクトル８１４により示される。図８の点線領域は、参照のために使用できる既に再構成された領域である。現在ブロック内のサンプルが参照領域内で自身に一致するものを見付けることができない場合、エスケープサンプルがシグナリングされ、その値は直接コーディングされる。

幾つかの従前の方法では、単一値ストリングと呼ばれる空間ストリング照合モードが、コーディング効率を向上するために使用され得る。このモードではSV及びSLが依然としてシグナリングされる。しかし、ストリング全体の中のサンプルは、同じカラー値を共有する。従って、SVは、参照領域からサンプル毎にコピーする代わりに、参照領域内のどの値をこのストリングが使用するかをポイントするために使用される。

単一値ストリングモードでは、SVコーディングのシグナリングコストは、コーディング効率を更に向上するために低減できる。

パレットモード
スクリーンコンテンツの特定の特性により、HEVC及びVVCのスクリーンコーディング拡張のためのコーディングツールが開発された。ツールは、コーディング効率における有意な利得を示した。特に、パレットモードは、パレット（主要カラー）へのインデックスを用いてピクセルのブロックを表し、空間的冗長性を利用することにより、パレット及びインデックスを符号化する。標準的なパレットモードコーディング方法は、２つの部分から成る：つまり、パレットのコーディング方法と、パレットを用いるサンプルのためのコーディング方法である。後者の部分は、パレットインデックスコーディング、ラン長コーディング、及びエスケープピクセルコーディングで構成される。ここで、パレットコーディング処理に関する要約を提供する。詳細は、ここに全体が組み込まれるバーサタイルビデオコーディング（ドラフト２）、ISO/IEC JTC１/SC２９/WG１１ JVET-K１００１で得られる。

主要カラー（Major Colors）の選択
非常に簡易だが効率的なヒストグラムに基づくアルゴリズムが、ピクセルを分類するために使用される。具体的に、ヒストグラムの中の最上位Lピーク値が主要カラーとして選択される。主要カラーに近いピクセル値は、主要カラーに量子化される。任意の主要カラーセットに属さない他のピクセルは、コーディングの前に量子化されるエスケープピクセルである。無損失コーディングでは、量子化処理は使用されない。ピクセル毎に、どのカラーセットに属するかを示すために、カラーインデックスが割り当てられる。カラーインデックスは、用語が混乱を生じないとき、便宜上インデックスとも呼ばれてよい。L個の主要カラーが使用される場合、０～（L-１）の値の主要カラーは、L個の主要カラーのセットについてシグナリングされ、主要カラーNの値はエスケープピクセルセットについてシグナリングされる。パレットは、通常、各カラーエントリがインデックスに関連付けられるカラールックアップテーブルとして実装される。ルマ及びクロマコンポーネントの両方をコーディングするために、単一のパレットが使用される。各エントリは、特定のRGB（YUV）カラーを表す。例えば、(R,G,B)=(０,０,０)を有するエントリ１は、純粋な黒色を表し、(R,G,B)=(２,１０,２００)を有するエントリ０は、青みを帯びた色を表す。ビデオフォーマットが４２０であるとき、クロマ平面はアップサンプリングされ、カラーパレットを生成する。

パレットモードコーディング
パレットに基づくコーディングは、CUに基づき実行される。

パレットエントリの符号化
参照としてパレット予測子リストを用いて現在パレットをコーディングするために、パレット予測子リスト内の各エントリが現在パレットの中で再利用されるかどうかを示すバイナリベクトルが使用される。再利用されるエントリは、現在パレットの始めに置かれ、パレット予測子リスト内のそれらの順序を維持する。これの後に、パレット予測子リスト内に存在しない新しいパレットエントリが続く。所定のエントリを有するパレットイニシャライザが、任意で、パレット予測子リストを初期化するために使用でき、結果としてそのようなシナリオでコーディング効率の向上をもたらす。パレットイニシャライザは、ピクチャパラメータセット（picture parameter set (PPS)）又はシーケンスパラメータセット（sequence parameter set (SPS)）内でシグナリングできる。

最大許容パレット予測子サイズ及びパレットサイズは、高レベルシンタックス（例えばSPS内）で、又はエンコーダ及びデコーダの両方により合意された定義された値として、シグナリングされる。

例えば、SPS内で、最大予測子パレットサイズは６３であるとシグナリングされ、最大パレットサイズは３１であるとシグナリングされる。別の例では、これらの２つの値は、シグナリング無しに、エンコーダ及びデコーダにより仮定される。

カラーインデックスの符号化
分類の後に、ブロックのピクセルは、選択された主要カラーセットに従いカラーインデックスに変換できる。予測コーディング方法がインデックスに適用される。ここで、ピクセルラインは、水平モード（つまり、コピーインデックスモード）、垂直モード（つまり、コピー上モード）、及び通常モード（つまり、エスケープモード）を含む３つの異なるモードにより予測できる。文献では、カラーインデックスをコーディングするとき、２つのインデックス走査順序が使用される。つまり、水平トラバーススキャン、及び垂直トラバーススキャンである。インデックス循環フラグは、どのスキャン順序が使用されるかを示すためにシグナリングされる。

コピーインデックスモード
コピーインデックスモードでは、最初のピクセルから開始して、１つ以上の連続するインデックスが最初のピクセルからコピーされる。最初のピクセルのインデックスがシグナリングされる。

コピー上モード
このモードでは、１つ以上の連続するインデックスが、上のピクセルラインからコピーされる。

エスケープモード
次に、エスケープピクセルに遭遇し（主要カラーセット内の最大インデックスによりシグナリングされる）、その対応するピクセル値がインデックスの直後にコーディングされる。CUでは異なるカラー値で、１つより多くのエスケープピクセルが存在してよい。異なるエスケープピクセル位置では、エスケープピクセルのピクセル値は異なってよい。

各コピーインデックスモードについて、インデックス値がシグナリングされる。インデックスシグナリングは、CABACスループットを向上するために、前にグループ化される。エスケープ値は、同じ理由で、後でシグナリングされる。コピーインデックスモード及びコピー上モードは、インデックスコーディングとエスケープコーディングとの間にシグナリングされる。

ルマ及びクロマコンポーネントのための別個のコーディングツリー構造
伝統的に、コーディングユニットは、ルマ及びクロマコンポーネントの両方のサンプルを含む。JVETでは、クロマコンポーネントのサンプルが、ルマコンポーネントと比べて独立した又は別個の分割ツリー構造を有してよい（デュアルツリーとも呼ばれる）。標準的に、そのような別個のコーディングツリー構造は、CTUレベルから開始する。従って、クロマCU（２つのクロマコンポーネントのみを含むCU）は、対応するサンプル位置におけるそのルマ相対物より大きくなる可能性がある。別の場合には、小さなクロマブロック（例えば、４×４クロマサンプッルより小さいCU）の使用を回避するために、ルマ及びクロマコーディングの分離が、デュアルツリーでCTUベレルより下のコーディングツリーレベルから開始するように、「ローカルデュアルツリー」が提案された。幾つかの条件が満たされると（例えば、親CUサイズが特定の閾値以下である）、ローカルデュアルツリーがトリガされ、そこから、ルマ及びクロマコーディングが、CTUレベルでデュアルツリーと同様に分離される。

単一カラー値を有するストリング照合
以下では、用語「ブロック」は、予測ブロック、コーディングブロック、又はコーディングユニット、つまりCUを表してよい。ストリングは、ブロック、単一サンプル、又はブロック全体の中の走査方向に沿って連続するサンプルのセットを表してよい。

実施形態は、単一値ストリングモードでの予測のために選択されたサンプルのセット又は所定の位置を有するサンプルを使用することに関連する。どのカラーが使用されるべきかの指示のためにSVをシグナリングする代わりに、セット内の１つのエントリをポイントするインデックスがシグナリングされる。

特定の例１～３が以下で議論されるが、これらの実施形態は単なる例であり、限定を意図しない。

＜例１＞
実施形態では、現在ブロックの空間的近隣再構成サンプルが、単一値ストリングを予測するためのセットを形成するために使用されてよい。例えば、図９に示すように、M×Nのサイズを有する現在ブロック９０２の上部参照サンプル（TL～TM）及び左参照サンプル（TL～LN）のセットが示される。図９に示す例では、M=N=８であるが、これは限定を意図しない。更に、図９に示す例では、インデックス９０４は、現在ストリング９０６の参照としてT１が使用されることを示す。

実施形態では、イントラ予測を実行するために使用される、現在ブロックの左の列及び上の行が、候補セットとして使用されてよい。インデックスは、それらから１つを選択するために使用できる。図９では、このセットは、TL、Tx(x=０,１,…M,M+１,…)、及びLy(y=０,１,…,N,N+１,…)にあるサンプルを表してよい。

実施形態では、それらの上／左近隣からの位置を表すサブセットが、予測セットを形成するために選択されてよい。図９では、このサブセットは、TL、T_０、T_[M/２](又はT_[M/２-１])、T_M(又はT_[M-１])、及びL_０、L_[N/２](又はL_[N/２-１])、L_N(又はL_[N-１])等の位置にあるサンプルを表してよい。

実施形態では、近隣位置は、現在ブロックに直接隣接する必要がなくてよく、それらは、例えば、図９のT_Xの上の行、図９のL_Yの左の列、等からのものであってよい。

実施形態では、順序ルールは、予測セットを形成するために選択されるサンプルについて確立されてよい。実施形態では、上から選択されたサンプルが最初であり、左から右への順であり、左から選択されたサンプルが２番目であり、上から下への順序である、等である。

実施形態では、選択されたサンプルの位置について、それが利用可能ではない場合、その値を示すために、幾つかのルールが適用できる。そのようなルールの例は以下の通りである：
・イントラ予測参照サンプルに適用されるルールを使用する。
・有効な参照をその近隣から拡張する（例えば、図５におけるように、T_[M]が利用できない場合に、T_[M]=T_[M-１]i）。
・特定のデフォルト値を割り当てる。

実施形態では、選択されたサンプルセットのインデックスが、どのサンプルが現在単一値ストリングを予測するために使用されるかの指示のためにシグナリングされてよい。

実施形態では、固定長コーディング（Nビットを有する）が、使用されてよく、予測セットの中のサンプルの数は、２^N以下であってよい（ここで、Nは整数値である）。上述の一例では、T_０,T_[M/２-１],T_[M/２],T_[M-１],L_０,L_[N/２-１],L_[N/２-１],及びL_[N-１]が選択されてよく、別の例では、CCLM近隣サンプル選択における同様のルールが適用できる。つまり、上近隣ブロックが利用できないとき、上のサンプルは選択されなくてよく、代わりに、２倍の量のサンプルが左近隣列から選択されてよい。左近隣ブロックが利用できないとき、左サンプルは選択されなくてよく、代わりに、２倍の量のサンプルが上近隣行から選択される。２つの近隣のいずれも利用できないとき、このモードは使用されなくてよい。

＜例２＞
実施形態では、前のストリングの最後のサンプルは、現在単一値ストリングで予測サンプルとして使用されてよい。これは、前のストリングが単一値ストリングではないとき、役立つ。従って、そのような条件は、そのようなサンプルの使用を可能にするために課されてよい。

実施形態では、現在ストリングがブロック内の最初のものである場合、最後のサンプルは、図９のTL,T_０,L_０を表してよい。特に、水平スキャン順序が使用されるとき、L_０が使用されてよく、垂直スキャン順序が使用されるとき、T_０が使用されてよい。

実施形態では、セットを形成するために他の予測サンプルと結合される場合、予測サンプルセット内のエントリは、このサンプルのために予約されてよい。例えば、予測セットの最初のエントリ又は最後のエントリ。

＜例３＞
実施形態では、固定サイズを有するバッファが、単一値ストリングを予測するためのセットを形成するために、前の再構成サンプルを格納するために使用されてよい。

実施形態では、それらの再構成サンプルは、現在コーディングブロック内からであってよい。

実施形態では、それらの再構成サンプルは、現在コーディングブロックの外部からであってよい。

実施形態では、それらの再構成サンプルは、パレット予測子と同様の方法で導出されてよい。

図１０は、符号化ビデオビットストリームを復号する例示的な処理１０００のフローチャートである。幾つかの実装では、図１０の１つ以上の処理ブロックは、デコーダ２１０により実行されてよい。幾つかの実装では、図１０の１つ以上の処理ブロックは、エンコーダ２０３のような、デコーダ２１０と別個の又はそれを含む別の装置又は装置のグループにより実行されてよい。

図１０に示すように、処理１０００は、符号化ビデオビットストリームに基づき、単一値ストリング照合モードが有効であると決定するステップを含んでよい（ブロック６１１）。

図１０に更に示すように、処理１０００は、符号化ビデオビットストリームから、複数の参照サンプルを含むセット内の参照サンプルを示すインデックスを取得するステップを含んでよい（ブロック６１２）。

図１０に更に示すように、処理１０００は、インデックスにより示された参照サンプルに基づき、現在ブロックの現在ストリングに含まれるサンプルのために使用されるべきカラー値を決定するステップを含んでよい（ブロック６１３）。

図１０に更に示すように、処理１０００は、決定されたカラー値に基づき、現在ストリングに含まれるサンプルを再構成するステップを含んでよい（ブロック６１４）。

図１０に更に示すように、処理１０００は、再構成現在ストリングを用いて現在ブロックを再構成するステップを含んでよい（ブロック６１４）。

実施形態では、現在ストリングは、現在ブロックの中で走査ラインに沿って連続的に配置された複数のサンプルを含んでよい。

実施形態では、セットは、空間的に現在ブロックの近隣の再構成サンプルを含んでよい。

実施形態では、再構成サンプルは現在ブロックの上、又は現在ブロックの左、のうちの少なくとも１つに位置する代表位置から選択されてよい。

実施形態では、代表位置は、現在ブロックに直接隣接しなくてよい。

実施形態では、セットは、現在ブロックの前のストリングの最後のサンプルを含んでよい。

実施形態では、前のストリングの最後のサンプルは、セットの中の、セットの所定の位置に含まれてよい。

実施形態では、セットは、固定サイズを有するバッファに格納されてよい。

図１０は処理１０００の例示的なブロックを示すが、処理１０００は、幾つかの実装では、図１０に示されたブロックより多数のブロック、少数のブロック、又は異なる配置のブロックを含んでよい。追加又は代替として、処理１０００のブロックのうちの２つ以上は、並列に実行されてよい。

さらに、提案した方法は、処理回路（例えば、１つ以上のプロセッサ又は１つ以上の集積回路）により実施されてよい。一例では、１つ以上のプロセッサは、提案した方法のうちの１つ以上を実行するための、非一時的コンピュータ可読媒体に格納されたプログラムを実行する。

上述の技術は、コンピュータ可読命令を用いてコンピュータソフトウェアとして実装でき１つ以上のコンピュータ可読媒体に物理的に格納でる。例えば、図１１は、本開示の主題の特定の実施形態を実装するのに適するコンピュータシステム１１００を示す。

コンピュータソフトウェアは、アセンブリ、コンパイル、リンク等のメカニズムにより処理されて、コンピュータ中央処理ユニット（CPU）、グラフィック処理ユニット（GPU）、等により直接又はインタープリット、マイクロコード実行、等を通じて実行可能な命令を含むコードを生成し得る、任意の適切な機械コード又はコンピュータ言語を用いてコーディングできる。

命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム装置、モノのインターネット装置、等を含む種々のコンピュータ又はそのコンポーネントで実行できる。

コンピュータシステム１１００の図１１に示すコンポーネントは、本来例示であり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能の範囲に対するようないかなる限定も示唆しない。さらに、コンポーネントの構成も、コンピュータシステム１１００の例示的な実施形態に示されたコンポーネントのうちのいずれか又は組み合わせに関連する任意の依存関係又は要件を有すると解釈されるべきではない。

コンピュータシステム１１００は、特定のヒューマンインタフェース入力装置を含んでよい。このようなヒューマンインタフェース入力装置は、例えば感覚入力（例えば、キーストローク、スワイプ、データグラブ動作）、音声入力（例えば、音声、クラッピング）、視覚的入力（例えば、ジェスチャ）、嗅覚入力（示されない）を通じた１人以上の人間のユーザによる入力に応答してよい。ヒューマンインタフェース装置は、必ずしも人間による意識的入力に直接関連する必要のない特定の媒体、例えば音声（例えば、会話、音楽、環境音）、画像（例えば、スキャンされた画像、デジタルカメラから取得された写真画像）、ビデオ（例えば、２次元ビデオ、３次元ビデオ、立体ビデオを含む）をキャプチャするためにも使用できる。

入力ヒューマンインタフェース装置は、キーボード１１０１、マウス１１０２、トラックパッド１１０３、タッチスクリーン１１１０及び関連するグラフィックアダプタ１１５０、データグラブ、ジョイスティック１１０５、マイクロフォン１１０６、スキャナ１１０７、カメラ１１０８、のうちの１つ以上を含んでよい（そのうちの１つのみが示される）。

コンピュータシステム１１００は、特定のヒューマンインタフェース出力装置も含んでよい。このようなヒューマンインタフェース出力装置は、例えば感覚出力、音声、光、及び匂い／味を通じて１人以上の人間のユーザの感覚を刺激してよい。このようなヒューマンインタフェース出力装置は、感覚出力装置を含んでよい（例えば、タッチスクリーン１１１０、データグラブ、又はジョイスティック１１０５による感覚フィードバック、しかし入力装置として機能しない感覚フィードバック装置も存在し得る）、音声出力装置（例えば、スピーカ１１０９、ヘッドフォン（図示しない）、視覚的出力装置（例えば、スクリーン１１１０、陰極線管（CRT）スクリーン、液晶ディスプレイ（LCD）スクリーン、プラズマスクリーン、有機発光ダイオード（OLED）スクリーンを含み、それぞれタッチスクリーン入力能力を有し又は有さず、それぞれ感覚フィードバック能力を有し又は有さず、これらのうちの幾つかは例えば立体出力、仮想現実眼鏡（図示しない）、ホログラフィックディスプレイ、及び発煙剤タンク（図示しない）、及びプリンタ（図示しないより多くの出力を出力可能であってよい））。

コンピュータシステム１１００は、人間のアクセス可能な記憶装置、及び、例えばCD/DVD等の媒体１１２１を備えるCD/DVDROM/RW１１２０のような光学媒体、サムドライブ１１２２、取り外し可能ハードドライブ又は個体状態ドライブ１１２３、テープ及びフロッピディスク（図示しない）のようなレガシー磁気媒体、セキュリティドングル（図示しない）等のような専用ROM/ASIC/PLDに基づく装置のような関連する媒体も含み得る。

当業者は、本開示の主題と関連して使用される用語「コンピュータ可読媒体」が伝送媒体、搬送波、又は他の一時的信号を包含しないことも理解すべきである。

コンピュータシステム１１００は、１つ以上の通信ネットワークへのインタフェース(１１５５)も含み得る。ネットワークは、例えば無線、有線、光であり得る。ネットワークへは、更に、ローカル、広域、都市域、車両及び産業、リアルタイム、耐遅延性、等であり得る。ネットワークの例は、イーサネットのようなローカルエリアネットワーク、無線LAN、GSM（global systems for mobile communications）、第３世代（３G）、第４世代（４G）、第５世代（５G）、LTE（Long-Term Evolution）等を含むセルラネットワーク、ケーブルTV、衛星TV、地上波放送TVを含むTV有線又は無線広域デジタルネットワーク、CANBusを含む車両及び産業、等を含む。特定のネットワークは、一般に、特定の汎用データポート又は周辺機器バス（１１４９）（例えば、コンピュータシステム１１００のユニバーサルシリアルバス（USB）ポート））に取り付けられる外部ネットワークインタフェースアダプタ（１１５４）を必要とする。他のものは、一般に、後述するようなシステムバスへの取り付けによりコンピュータシステム１１００のコアに統合される（例えば、イーサネットインタフェースをＰＣコンピュータシステムへ、又はセルラネットワークインタフェースをスマートフォンコンピュータシステムへ）。例として、ネットワーク１１５５は、ネットワークインタフェース１１５４を用いて周辺機器バス１１４９に接続されてよい。これらのネットワークを用いて、コンピュータシステム１１００は、他のエンティティと通信できる。このような通信は、単方向受信のみ（例えば、放送TV）、単方向送信のみ（例えば、特定のCANBus装置へのCANBus）、又は例えばローカル又は広域デジタルネットワークを用いて他のコンピュータシステムへの双方向であり得る。特定のプロトコル及びプロトコルスタックが、それらのネットワーク及びネットワークインタフェース（１１５４）の各々で使用され得る。

前述のヒューマンインタフェース装置、人間のアクセス可能な記憶装置、及びネットワークインタフェースは、コンピュータシステム１１００のコア１１４０に取り付け可能である。

コア１１４０は、１つ以上の中央処理ユニット（CPU）１１４１、グラフィック処理ユニット（GPU）１１４２、ＦPGAの形式の専用プログラマブル処理ユニット１１４３、特定タスクのためのハードウェアアクセラレータ１１４４、等を含み得る。これらの装置は、読み出し専用メモリ（ROM）１１４５、ランダムアクセスメモリ（RAM）１１４６、内部のユーザアクセス不可能なハードドライブ、SSD、等のような内蔵大容量記憶装置１１４７と共に、システムバス１１４８を通じて接続されてよい。幾つかのコンピュータシステムでは、追加CPU、GPU、等による拡張を可能にするために、システムバス１１４８は、１つ以上の物理プラグの形式でアクセス可能である。周辺機器は、コアのシステムバス１１４８に直接に、又は周辺機器バス１１４９を通じて、取り付け可能である。周辺機器バスのアーキテクチャは、周辺機器相互接続（peripheral component interconnect (PCI)）、USB、等を含む。

CPU１１４１、GPU１１４２、FPGA１１４３、及びアクセラレータ１１４４は、結合されて前述のコンピュータコードを生成可能な特定の命令を実行できる。該コンピュータコードは、ROM１１４５又はRAM１１４６に格納できる。一時的データもRAM１１４６に格納でき、一方で、永久的データは例えば内蔵大容量記憶装置１１４７に格納できる。メモリ装置のうちのいずれかへの高速記憶及び読み出しは１つ以上のCPU１１４１、GPU１１４２、大容量記憶装置１１４７、ROM１１４５、RAM１１４６等に密接に関連付けられ得るキャッシュメモリの使用を通じて可能にできる。

コンピュータ可読媒体は、種々のコンピュータにより実施される動作を実行するためのコンピュータコードを有し得る。媒体及びコンピュータコードは、本開示の目的のために特別に設計され構成されたものであり得、又は、コンピュータソフトウェア分野の当業者によく知られ利用可能な種類のものであり得る。

例として及び限定ではなく、アーキテクチャを有するコンピュータシステム１１００、及び具体的にはコア１１４０は、プロセッサ（CPU、GPU、FPGA、アクセラレータ、等を含む）が１つ以上の有形コンピュータ可読媒体内に具現化されたソフトウェアを実行した結果として、機能を提供できる。このようなコンピュータ可読媒体は、コア内蔵大容量記憶装置１１４７又はROM１１４５のような非一時的特性のコア１１４０の特定の記憶装置、及び上述のようなユーザアクセス可能な大容量記憶装置と関連付けられた媒体であり得る。本開示の種々の実施形態を実装するソフトウェアは、このような装置に格納されコア１１４０により実行できる。コンピュータ可読媒体は、特定の必要に従い、１つ以上のメモリ装置又はチップを含み得る。ソフトウェアは、コア１１４０及び具体的にはその中のプロセッサ（CPU、GPU、FPGA、等を含む）に、ソフトウェアにより定義された処理に従うRAM１１４６に格納されたデータ構造の定義及び該データ構造の変更を含む、ここに記載した特定の処理又は特定の処理の特定の部分を実行させることができる。追加又は代替として、コンピュータシステムは、ここに記載の特定の処理又は特定の処理の特定の部分を実行するためにソフトウェアと一緒に又はそれに代わって動作可能な論理ハードワイヤド又は他の回路内の実装（例えば、アクセラレータ１１４４）の結果として機能を提供できる。ソフトウェアへの言及は、ロジックを含み、適切な場合にはその逆も同様である。コンピュータ可読媒体への言及は、適切な場合には、実行のためにソフトウェアを格納する（集積回路（IC）のような）回路、実行のためにロジックを実装する回路、又はそれらの両方を含み得る。本開示は、ハードウェア及びソフトウェアの任意の適切な組み合わせを含む。

本開示は、幾つかの例示的な実施形態を記載したが、代替、置換、及び種々の代用の均等物が存在し、それらは本開示の範囲に包含される。当業者に明らかなことに、ここに明示的に示され又は説明されないが、本開示の原理を実施し、従って、本開示の精神及び範囲に含まれる多数のシステム及び方法を考案可能である。

Claims

デコーダが実行する符号化ビデオビットストリームを復号する方法であって、前記方法は、
前記符号化ビデオビットストリームに基づき、単一値ストリング照合モードが有効であると決定するステップと、
前記符号化ビデオビットストリームから、複数の参照サンプルを含むセットの中の参照サンプルを示すインデックスを取得するステップと、
前記インデックスにより示される参照サンプルに基づき、現在ブロックの現在ストリングに含まれるサンプルのために使用されるべきカラー値を決定するステップと、
前記決定されたカラー値に基づき、前記現在ストリングに含まれるサンプルを再構成するステップと、
前記再構成された現在ストリングを用いて、前記現在ブロックを再構成するステップと、
を含む方法。
前記現在ストリングは、前記現在ブロックの中で走査ラインに沿って連続的に配置された複数のサンプルを含む、請求項１に記載の方法。
前記セットは、前記現在ブロックの空間的に近隣にある再構成されたサンプルを含む、請求項１又は２に記載の方法。
前記再構成されたサンプルは前記現在ブロックの上、又は前記現在ブロックの左、のうちの少なくとも１つに位置する代表位置から選択される、請求項３に記載の方法。
前記再構成されたサンプルは、前記現在ブロックの上にある複数の行のうち前記現在ブロックに隣接しない行、又は前記現在ブロックの左にある複数の列のうち前記現在ブロックに隣接しない列、のうちの少なくとも１つに位置する代表位置から選択される、請求項３に記載の方法。
前記セットは、前記現在ブロックの前のストリングの最後のサンプルを含む、請求項１～５のいずれか一項に記載の方法。
前記前のストリングの最後のサンプルは、前記セットの中の、前記セットの所定の位置に含まれる、請求項６に記載の方法。
前記セットは、固定サイズを有するバッファに格納される、請求項１～６のいずれか一項に記載の方法。
符号化ビデオビットストリームを復号する装置であって、前記装置は、
プログラムコードを格納するよう構成される少なくとも１つのメモリと、
前記プログラムコードを読み出し、前記プログラムコードにより指示されるように動作するよう構成される少なくとも１つのプロセッサと、
を含み、前記プログラムコードは、
前記少なくとも１つのプロセッサに、前記符号化ビデオビットストリームに基づき、単一値ストリング照合モードが有効であると決定させるよう構成される第１決定コードと、
前記少なくとも１つのプロセッサに、前記符号化ビデオビットストリームから、複数の参照サンプルを含むセットの中の参照サンプルを示すインデックスを取得させるよう構成される取得コードと、
前記少なくとも１つのプロセッサに、前記インデックスにより示される参照サンプルに基づき、現在ブロックの現在ストリングに含まれるサンプルのために使用されるべきカラー値を決定させるよう構成される第２決定コードと、
前記少なくとも１つのプロセッサに、前記決定されたカラー値に基づき、前記現在ストリングに含まれるサンプルを再構成させるよう構成される第１再構成コードと、
前記少なくとも１つのプロセッサに、前記再構成された現在ストリングを用いて、前記現在ブロックを再構成させる第２再構成コードと、
を含む、装置。
前記現在ストリングは、前記現在ブロックの中で走査ラインに沿って連続的に配置された複数のサンプルを含む、請求項９に記載の装置。
前記セットは、前記現在ブロックの空間的に近隣にある再構成されたサンプルを含む、請求項９又は１０に記載の装置。
前記再構成されたサンプルは前記現在ブロックの上、又は前記現在ブロックの左、のうちの少なくとも１つに位置する代表位置から選択される、請求項１１に記載の装置。
前記再構成されたサンプルは、前記現在ブロックの上にある複数の行のうち前記現在ブロックに隣接しない行、又は前記現在ブロックの左にある複数の列のうち前記現在ブロックに隣接しない列、のうちの少なくとも１つに位置する代表位置から選択される、請求項１１に記載の装置。
前記セットは、前記現在ブロックの前のストリングの最後のサンプルを含む、請求項９～１３のいずれか一項に記載の装置。
前記前のストリングの最後のサンプルは、前記セットの中の、前記セットの所定の位置に含まれる、請求項１４に記載の装置。
前記セットは、固定サイズを有するバッファに格納される、請求項９～１５のいずれか一項に記載の装置。
命令を格納する非一時的コンピュータ可読媒体であって、前記命令は、符号化ビデオビットストリームを復号する装置の１つ以上のプロセッサにより実行されると、前記１つ以上のプロセッサに、
前記符号化ビデオビットストリームに基づき、単一値ストリング照合モードが有効であると決定させ、
前記符号化ビデオビットストリームから、複数の参照サンプルを含むセットの中の参照サンプルを示すインデックスを取得させ、
前記インデックスにより示される参照サンプルに基づき、現在ブロックの現在ストリングに含まれるサンプルのために使用されるべきカラー値を決定させ、
前記決定されたカラー値に基づき、前記現在ストリングに含まれるサンプルを再構成させ、
前記再構成された現在ストリングを用いて、前記現在ブロックを再構成させる、
非一時的コンピュータ可読媒体。
前記セットは、前記現在ブロックの空間的に近隣にある再構成されたサンプルを含む、請求項１７に記載の非一時的コンピュータ可読媒体。
前記セットは、前記現在ブロックの前のストリングの最後のサンプルを含む、請求項１７又は１８に記載の非一時的コンピュータ可読媒体。
前記セットは、固定サイズを有するバッファに格納される、請求項１７に記載の非一時的コンピュータ可読媒体。
エンコーダが実行するビデオビットストリームを符号化する方法であって、前記方法は、
符号化ビデオビットストリームに基づき、単一値ストリング照合モードが有効であると決定するステップと、
符号化ビデオビットストリームから、複数の参照サンプルを含むセットの中の参照サンプルを示すインデックスを取得するステップと、
前記インデックスにより示される参照サンプルに基づき、現在ブロックの現在ストリングに含まれるサンプルのために使用されるべきカラー値を決定するステップと、
前記決定されたカラー値に基づき、前記現在ストリングに含まれるサンプルを再構成するステップと、
前記再構成された現在ストリングを用いて、前記現在ブロックを再構成するステップと、
前記再構成された前記現在ブロックに基づく参照ピクチャと、前記ビデオビットストリームに含まれる入力ピクチャとに基づき、前記ビデオビットストリームを符号化するステップと、
を含む方法。