JP2022537090A

JP2022537090A - ビデオ符号化及び復号化の単一インデックス量子化行列設計

Info

Publication number: JP2022537090A
Application number: JP2021560100A
Authority: JP
Inventors: ラグランジュ，フィリップド; ルレアネック，ファブリス; ネイザー，カラム; フランソワ，エドゥアール; アンドリヴォン，ピエール; チェン，ヤ
Original assignee: インターデジタルブイシーホールディングスフランス，エスアーエス
Priority date: 2019-06-21
Filing date: 2020-06-16
Publication date: 2022-08-24
Also published as: TW202106017A; EP3987786A1; US20230232003A1; AU2020295684A1; CN114026857A; WO2020254317A1; MX2021015582A; KR20220024716A

Abstract

異なるブロックサイズ、色成分、及び予測モードに対応する異なる量子化行列を送信し得る。量子化行列の係数をより効率的にシグナリングするために、一実施では、最初に列記されるより大きなサイズのＣＵサイズに関連するサイズ識別子（sizeId）と、輝度ＱＭが最初に列記される行列タイプ（matrixTypeId）に基づいて、統一行列識別子行列Ｉｄが使用される。例えば、統一識別子は、matrixId=N*sizeId+matrixTypeIdとして導出され、式中、Ｎは可能なタイプ識別子の数であり、例えば、Ｎ１０＝６である。この単一識別子は、予測（コピー）を使用する際、任意の先に送信された行列を参照できるようにし、最初に大きな行列を送信することにより、予測プロセスでの補間が回避される。ブロックがイントラブロックコピー予測モードを使用する場合、ＱＭ識別子は、まるでブロックがインター予測モードを使用するかのように導出し得る。

Description

技術分野
[1] 本実施形態は一般的には、ビデオ符号化及び復号化における量子化行列設計の方法及び装置に関する。

背景
[2] 高圧縮効率を達成するために、画像及びビデオ符号化方式は通常、予測及び変換を利用して、ビデオコンテンツにおける空間的及び時間的冗長性を利用する。一般に、イントラ又はインターピクチャ相関を利用するために、イントラ及びインター予測が使用され、その場合、予測誤差又は予測残差と呼ばれることが多い元ブロックと予測ブロックとの間の差分が変換、量子化、エントロピー符号化される。ビデオを再構築するために、圧縮データは、エントロピー符号化、量子化、変換、及び予測に対応する逆プロセスによって復号化される。

概要
[3] 一実施形態によれば、ビデオ復号化方法が提供され、本方法は、ピクチャ内の復号化するブロックのブロックサイズ、色成分、及び予測モードに基づいて量子化行列の単一識別子を取得することと、基準量子化行列を示すシンタックス要素を復号化することであって、上記シンタックス要素は、上記基準量子化行列の識別子と上記量子化行列の上記取得された識別子との間の差分を指定する、復号化することと、上記基準量子化行列に基づいて上記量子化行列を取得することと、上記量子化行列に応答して上記ブロックの変換係数を逆量子化することと、上記逆量子化された変換係数に応答して上記ブロックを復号化することとを含む。

[4] 別の実施形態によれば、ビデオ符号化方法が提供され、本方法は、ピクチャ内の符号化するブロックにアクセスすることと、上記ブロックの量子化行列にアクセスすることと、上記ブロックのブロックサイズ、色成分、及び予測モードに基づいて上記量子化行列の単一識別子を取得することと、基準量子化行列を示すシンタックス要素を符号化することであって、上記シンタックス要素は、上記基準量子化行列の識別子と上記量子化行列の上記取得された識別子との間の差分を指定する、符号化することと、上記量子化行列に応答して上記ブロックの変換係数を量子化することと、上記量子化された変換係数をエントロピー符号化することとを含む。

[5] 別の実施形態によれば、ビデオ復号化装置が提供され、本装置は１つ又は複数のプロセッサを備え、前記１つ又は複数のプロセッサは、ピクチャ内の復号化するブロックのブロックサイズ、色成分、及び予測モードに基づいて量子化行列の単一識別子を取得することと、基準量子化行列を示すシンタックス要素を復号化することであって、上記シンタックス要素は、上記基準量子化行列の識別子と上記量子化行列の上記取得された識別子との間の差分を指定する、復号化することと、上記基準量子化行列に基づいて上記量子化行列を取得することと、上記量子化行列に応答して上記ブロックの変換係数を逆量子化することと、上記逆量子化された変換係数に応答して上記ブロックを復号化することとを行うように構成される。

[6] 別の実施形態によれば、ビデオ符号化装置が提供され、本装置は１つ又は複数のプロセッサを備え、前記１つ又は複数のプロセッサは、ピクチャ内の符号化するブロックにアクセスすることと、上記ブロックの量子化行列にアクセスすることと、上記ブロックのブロックサイズ、色成分、及び予測モードに基づいて上記量子化行列の単一識別子を取得することと、基準量子化行列を示すシンタックス要素を符号化することであって、上記シンタックス要素は、上記基準量子化行列の識別子と上記量子化行列の上記取得された識別子との間の差分を指定する、符号化することと、上記量子化行列に応答して上記ブロックの変換係数を量子化することと、上記量子化された変換係数をエントロピー符号化することとを行うように構成される。

[7] 別の実施形態によれば、ビデオ復号化装置が提供され、本装置は、ピクチャ内の復号化するブロックのブロックサイズ、色成分、及び予測モードに基づいて量子化行列の単一識別子を取得する手段と、基準量子化行列を示すシンタックス要素を復号化することであって、上記シンタックス要素は、上記基準量子化行列の識別子と上記量子化行列の上記取得された識別子との間の差分を指定する、復号化する手段と、上記基準量子化行列に基づいて上記量子化行列を取得する手段と、上記量子化行列に応答して上記ブロックの変換係数を逆量子化する手段と、上記逆量子化された変換係数に応答して上記ブロックを復号化する手段とを備える。

[8] 別の実施形態によれば、ビデオ符号化装置が提供され、本装置は、ピクチャ内の符号化するブロックにアクセスする手段と、上記ブロックの量子化行列にアクセスする手段と、上記ブロックのブロックサイズ、色成分、及び予測モードに基づいて上記量子化行列の単一識別子を取得する手段と、基準量子化行列を示すシンタックス要素を符号化することであって、上記シンタックス要素は、上記基準量子化行列の識別子と上記量子化行列の上記取得された識別子との間の差分を指定する、符号化する手段と、上記量子化行列に応答して上記ブロックの変換係数を量子化する手段と、上記量子化された変換係数をエントロピー符号化する手段とを備える。

[9] １つ又は複数の実施形態は、１つ又は複数のプロセッサにより実行されると、上述した実施形態の何れかによる符号化方法又は復号化方法を１つ又は複数のプロセッサに実行させる命令を含むコンピュータプログラムも提供する。本実施形態の１つ又は複数は、上述した方法によりビデオデータを符号化又は復号化する命令を記憶したコンピュータ可読記憶媒体も提供する。１つ又は複数の実施形態は、上述した方法により生成されたビットストリームを記憶したコンピュータ可読記憶媒体も提供する。１つ又は複数の実施形態は、上述した方法により生成されたビットストリームを送信又は受信する方法及び装置も提供する。

図面の簡単な説明
[10]本実施形態の態様を実施し得るシステムのブロック図を示す。 [11]ビデオエンコーダの一実施形態のブロック図を示す。 [12]ビデオデコーダの一実施形態のブロック図を示す。 [13]ＶＶＣドラフト５における３２よりも大きいブロックサイズの場合、変換係数はゼロと推測されることを示す。 [14]ＪＣＴＶＣ－Ｈ０３１４に記載のような固定予測木を示す。 [15]一実施形態によるより大きいサイズからの予測（デシメーション）を示す。 [16]一実施形態による、より大きなサイズからの予測と矩形ブロックのデシメーションとの組合せを示す。 [17]一実施形態による、クロマでの矩形ブロックのＱＭ導出プロセスを示す。 [18]一実施形態による、クロマでの矩形ブロックのＱＭ導出プロセス（４：２：２フォーマットへの適合）を示す。 [19]クロマでの矩形ブロックのＱＭ導出プロセス（４：４：４フォーマットへの適合）を示す。 [20]一実施形態によるスケーリングリストデータシンタックス構造をパーズするフローチャートを示す。 [21]一実施形態によるスケーリングリストデータシンタックス構造を符号化するフローチャートを示す。 [22]一実施形態によるＱＭ導出プロセスのフローチャートを示す。

詳細な説明
[23] 図１は、種々の態様及び実施形態を実施することができるシステムの一例のブロック図を示す。システム１００は、後述する種々の構成要素を含むデバイスとして実施し得、本願に記載の態様の１つ又は複数を実行するように構成される。そのようなデバイスの例には、限定ではなく、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビジョン受像機、パーソナルビデオ記録システム、接続された家電、及びサーバ等の種々の電子デバイスがある。システム１００の要素は、単独で又は組み合わせて、１つの集積回路、複数のＩＣ、及び／又は離散構成要素で実施し得る。例えば、少なくとも１つの実施形態では、システム１００の処理及びエンコーダ／デコーダ要素は、複数のＩＣ及び／又は離散構成要素にわたり分散する。種々の実施形態では、システム１００は、例えば、通信バスを介して又は専用入力及び／又は出力ポートを通して他のシステム又は他の電子デバイスに通信可能に結合される。種々の実施形態では、システム１００は、本願に記載の態様の１つ又は複数を実施するように構成される。

[24] システム１００は、例えば、本願に記載の種々の態様を実施するためにロードされた命令を実行するように構成された少なくとも１つのプロセッサ１１０を含む。プロセッサ１１０は、組み込みメモリ、入出力インターフェース、及び当技術分野で既知の種々の他の回路を含み得る。システム１００は少なくとも１つメモリ１２０（例えば、揮発性メモリデバイス及び／又は不揮発性メモリデバイス）を含む。システム１００は記憶装置１４０を含み、これは、限定ではなく、ＥＥＰＲＯＭ、ＲＯＭ、ＰＲＯＭ、ＲＡＭ、ＤＲＡＭ、ＳＲＡＭ、フラッシュ、磁気ディスクドライブ、及び／又は光ディスクドライブを含め、不揮発性メモリ及び／又は揮発性メモリを含み得る。記憶装置１４０は、非限定的な例として、内部記憶装置、取り付けられた記憶装置、及び／又はネットワークアクセス可能記憶装置を含み得る。

[25] システム１００は、データを処理して、例えば符号化ビデオ又は復号化ビデオを提供するように構成されたエンコーダ／デコーダモジュール１３０を含み、エンコーダ／デコーダモジュール１３０はそれ自体のプロセッサ及びメモリを含み得る。エンコーダ／デコーダモジュール１３０は、符号化及び／又は復号化機能を実行するためにデバイス内に含まれ得るモジュールを表す。既知のように、デバイスは符号化モジュール及び復号化モジュールの一方又は両方を含み得る。さらに、エンコーダ／デコーダモジュール１３０は、システム１００の別個の要素として実施されてもよく、又は当業者に既知のように、ハードウェアとソフトウェアとの組合せとしてプロセッサ１１０内に組み込まれてもよい。

[26] 本願に記載の種々の態様を実行するためにプロセッサ１１０又はエンコーダ／デコーダ１３０にロードされるプログラムコードは、記憶装置１４０に記憶し得、プロセッサ１１０による実行に向けてメモリ１２０に続けてロードし得る。種々の実施形態によれば、プロセッサ１１０、メモリ１２０、記憶装置１４０、及びエンコーダ／デコーダモジュール１３０の１つ又は複数は、本願に記載のプロセスの実行中、種々の項目の１つ又は複数を記憶し得る。そのような記憶される項目は、限定ではなく、入力ビデオ、復号化ビデオ又は復号化ビデオの部分、ビットストリーム、行列、変数、及び方程式、公式、演算、及び演算論理の中間又は最終結果を含み得る。

[27] 幾つかの実施形態では、プロセッサ１１０及び／又はエンコーダ／デコーダモジュール１３０内部のメモリは、命令を記憶し、符号化又は復号化中に必要な処理に作業メモリを提供するのに使用される。しかしながら、他の実施形態では、処理デバイス外部のメモリ（例えば、処理デバイスはプロセッサ１１０又はエンコーダ／デコーダモジュール１３０であり得る）がこれらの機能の１つ又は複数に使用される。外部メモリはメモリ１２０及び／又は記憶装置１４０であり得、例えば、動的揮発性メモリ及び／又は不揮発性フラッシュメモリであり得る。幾つかの実施形態では、外部不揮発性フラッシュメモリが、テレビジョンのオペレーティングシステムの記憶に使用される。少なくとも１つの実施形態では、ＲＡＭ等の高速外部動的揮発性メモリが、ＭＰＥＧ－２、ＨＥＶＣ、又はＶＶＣ等でのビデオ符号化及び復号化動作の作業メモリとして使用される。

[28] システム１００の要素への入力は、ブロック１０５に示される種々の入力デバイスを通して提供し得る。そのような入力デバイスには、限定ではなく、（ｉ）例えばブロードキャスターにより無線で送信されたＲＦ信号を受信するＲＦ部、（ｉｉ）複合入力端子、（ｉｉｉ）ＵＳＢ入力端子、及び／又は（ｉｖ）ＨＤＭＩ入力端子がある。

[29] 種々の実施形態では、ブロック１０５の入力デバイスには当技術分野で既知の各入力処理要素が関連付けられる。例えば、ＲＦ部は、（ｉ）所望の周波数を選択し（信号の選択又は周波数帯域への信号の帯域制限とも呼ばれる）、（ｉｉ）選択された信号をダウンコンバートし、（ｉｉｉ）より狭い周波数帯域に再び帯域制限して、（例えば）特定の実施形態においてチャネルと呼ばれ得る信号周波数帯域を選択し、（ｉｖ）ダウンコンバートされ帯域制限された信号を復調し、（ｖ）誤り修正を実行し、（ｖｉ）逆多重化してデータパケットの所望のストリームを選択するのに適した要素と関連付けられ得る。種々の実施形態のＲＦ部は、これらの機能を実行する１つ又は複数の要素、例えば、周波数セレクタ、信号セレクタ、帯域制限器、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り修正器、及びデマルチプレクサを含む。ＲＦ部は、例えば、受信信号の低周波数（例えば、中間周波数若しくはベースバンド近傍周波数）又はベースバンドへのダウンコンバートを含め、種々のこれらの機能を実行するチューナを含み得る。１つのセットトップボックス実施形態では、ＲＦ部及びそれに関連付けられた入力処理要素は、有線（例えばコード）媒体を経由して送信されたＲＦ信号を受信し、フィルタリング、ダウンコンバート、及び再び所望の周波数帯域へのフィルタリングを行うことにより周波数選択を実行する。種々の実施形態は、上述した（及び他の）要素の順序の並べ替え、これらの要素のうちの幾つかの除去、及び／又は同様又は異なる機能を実行する他の要素の追加を行う。要素の追加は、要素を既存の要素間に挿入すること、例えば、増幅器及びアナログ／デジタル変換器を挿入することを含み得る。種々の実施形態では、ＲＦ部はアンテナを含む。

[30] さらに、ＵＳＢ及び／又はＨＤＭＩ端子は、ＵＳＢ及び／又はＨＤＭＩ接続を介してシステム１００を他の電子デバイスに接続する各インターフェースプロセッサを含み得る。入力処理の種々の態様、例えばリードソロモン誤り修正が必要に応じて、別個の入力処理ＩＣ内又はプロセッサ１１０内で実施されてもよいことを理解されたい。同様に、ＵＳＢ又はＨＤＭＩインターフェース処理の態様は、必要に応じて別個のインターフェースＩＣ又はプロセッサ１１０内で実施し得る。復調、誤り修正、及び逆多重化が行われたストリームは、例えば、出力デバイスに提示するために、メモリ及び記憶要素と組み合わせて動作して必要に応じてデータストリームを処理するプロセッサ１１０及びエンコーダ／デコーダ１３０を含め、種々の処理要素に提供される。

[31] システム１００の種々の要素は、統合された筐体内に提供し得る、統合された筐体内で、種々の要素は、適した接続設備１１５、例えば、Ｉ２Ｃバス、配線、及びプリント回路基板を含む当技術分野で既知の内部バスを使用して相互接続され得、間でデータを伝送し得る。

[32] システム１００は、通信チャネル１９０を介して他のデバイスと通信できるようにする通信インターフェース１５０を含む。通信インターフェース１５０は、限定ではなく、通信チャネル１９０を介してデータを送受信するように構成された送受信機を含み得る。通信インターフェース１５０は、限定ではなく、モデム又はネットワークカードを含み得、通信チャネル１９０は、例えば、有線及び／又は無線媒体内で実施し得る。

[33] データは、種々の実施形態では、ＩＥＥＥ８０２．１１等のWi-Fiネットワークを使用してシステム１００にストリーミングされる。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合された通信チャネル１９０及び通信インターフェース１５０を介して受信される。これらの実施形態の通信チャネル１９０は通常、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続されて、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にする。他の実施形態は、入力ブロック１０５のＨＤＭＩ通信を介してデータを配信するセットトップボックスを使用してシステム１００にストリーミングデータを提供する。さらに他の実施形態は、入力ブロック１０５のＲＦ接続を使用してシステム１００にストリーミングデータを提供する。

[34] システム１００は、ディスプレイ１６５、スピーカ１７５、及び他の周辺機器１８５を含め、種々の出力デバイスに出力信号を提供し得る。他の周辺機器１８５は、実施形態の種々の例では、スタンドアロンＤＶＲ、ディスクプレーヤ、ステレオシステム、照明システム、及びシステム１００の出力に基づいて機能を提供する他のデバイスの１つ又は複数を含む。種々の実施形態では、制御信号が、ＡＶリンク、ＣＥＣ、又はユーザ介入あり又はなしでのデバイス間制御を可能にする他の通信プロトコル等のシグナリングを使用してシステム１００とディスプレイ１６５、スピーカ１７５、又は他の周辺機器１８５との間で通信される。出力デバイスは、各インターフェース１６０、１７０、及び１８０を通して専用接続を介してシステム１００に通信可能に結合し得る。代替的には、出力デバイスは、通信インターフェース１５０を介して通信チャネル１９０を使用してシステム１００に接続し得る。ディスプレイ１６５及びスピーカ１７５は、電子デバイス、例えばテレビジョン内のシステム１００の他の構成要素と単一ユニットに統合し得る。種々の実施形態では、ディスプレイインターフェース１６０はディスプレイドライバ、例えばタイミングコントローラ（ＴＣｏｎ）チップを含む。

[35] ディスプレイ１６５及びスピーカ１７５は代替的には、例えば、入力１０５のＲＦ部が別個のセットトップボックスの一部である場合、他の構成要素の１つ又は複数と別個であり得る。ディスプレイ１６５及びスピーカ１７５が外部構成要素である種々の実施形態では、出力信号は、例えば、ＨＤＭＩポート、ＵＳＢポート、又はＣＯＭＰ出力を含む専用出力接続を介して提供し得る。

[36] 図２は、高効率ビデオ符号化（ＨＥＶＣ）エンコーダ等の一例のビデオエンコーダ２００を示す。図２は、ＨＥＶＣ規格に改良が行われたエンコーダ又はＪＶＥＴ（Joint Video Exploration Team）により開発中のＶＶＣ（Versatile Video Coding）エンコーダ等のＨＥＶＣと同様の技術を利用したエンコーダを示すこともできる。

[37] 本願では、用語「再構築された」及び「復号化された」は同義で使用し得、用語「符号化された」又は「コード化された」は同義で使用し得、用語「画像」、「ピクチャ」、及び「フレーム」は同義で使用し得る。必須ではないが通常、用語「再構築された」はエンコーダ側で使用され、一方、「復号化された」はデコーダ側で使用される。

[38] 符号化前、ビデオシーケンスは、圧縮に対してより高い回復力を有する信号分布を得る（例えば、色成分の１つのヒストグラム等化を使用して）ために、符号化前処理（２０１）、例えば、色変換（例えば、ＲＧＢ４：４：４からＹＣｂＣｒ４：２：０への変換）を入力カラーピクチャに適用し、又は入力ピクチャ成分のリマッピングを実行することを受け得る。メタデータを前処理に関連付け、ビットストリームに添付することができる。

[39] エンコーダ２００では、ピクチャが、後述のようにエンコーダ要素によって符号化される。符号化するピクチャは、例えば、ＣＵというユニットに分割され（２０２）、そのユニットで処理される。各ユニットは、例えば、イントラモード又はインターモードの何れかを使用して符号化される。ユニットがイントラモードで符号化される場合、イントラ予測を実行する（２６０）。インターモードでは、動き推定（２７５）及び補償（２７０）が実行される。エンコーダは、ユニットの符号化にイントラモード又はインターモードのどちらを使用するかを決定し（２０５）、例えば、予測モードフラグによってイントラ／インター決定を示す。予測残差は、例えば、元画像ブロックから予測ブロックを減算する（２１０）ことによって計算される。

[40] 次に、予測残差は変換（２２５）、量子化（２３０）される。量子化された変換係数並びに動きベクトル及び他のシンタックス要素は、エントロピー符号化されて（２４５）、ビットストリームを出力する。エンコーダは、変換をスキップし、変換されていない残差信号に直接、量子化を適用することができる。エンコーダは変換及び量子化の両方を迂回することができ、すなわち、残差は、変換又は量子化プロセスを適用せずに直接コード化される。

[41] エンコーダは符号化ブロックを復号化して、更なる予測の基準を提供する。量子化された変換係数は逆量子化され（２４０）、逆変換されて（２５０）、予測残差を復号化する。復号化された予測残差と予測ブロックとを組み合わせて（２５５）、画像ブロックが再構築される。インループフィルタ（２６５）が再構築されたピクチャに適用されて、例えば、デブロッキング／ＳＡＯ（サンプル適応オフセット）フィルタリングを実行し、符号化アーチファクトを低減する。フィルタリングされた画像は、基準ピクチャバッファに記憶される（２８０）。

[42] 図３は、一例のビデオデコーダ３００のブロック図を示す。デコーダ３００では、ビットストリームが後述のデコーダ要素によって復号化される。ビデオデコーダ３００は一般に、図２に記載の符号化パスと相互的な復号化パスを実行する。エンコーダ２００はまた、ビデオデータ符号化の一環としてビデオ復号化も実行する。

[43] 特に、デコーダの入力は、ビデオエンコーダ２００によって生成することができるビデオビットストリームを含む。ビットストリームはまず、エントロピー復号化（３３０）されて、変換係数、動きベクトル、及び他のコード化情報を取得する。ピクチャ分割情報は、ピクチャがいかに分割されたかを示す。したがって、デコーダは、復号化されたピクチャ分割情報に従ってピクチャを分割し得る（３３５）。変換係数は逆量子化（３４０）、逆変換（３５０）されて、予測残差を復号化する。復号化された予測残差と予測ブロックとを組み合わせて（３５５）、画像ブロックが再構築される。予測ブロックは、イントラ予測（３６０）又は動き補償予測（すなわち、インター予測）（３７５）から取得することができる（３７０）。インループフィルタ（３６５）が、再構築された画像に適用される。フィルタリングされた画像は基準ピクチャバッファに記憶される（３８０）。

[44] 復号化されたピクチャは、復号化後処理（３８５）をさらに受けることができ、例えば、色逆変換（例えば、ＹＣｂＣｒ４：２：０からＲＧＢ４：４：４への変換）又は符号化前処理（２０１）で実行されたリマッピングプロセスの逆を実行する逆リマッピングを受けることができる。復号化後処理は、符号化前処理で導出され、ビットストリームでシグナリングされたメタデータを使用することができる。

[45] ＨＥＶＣ仕様では、逆量子化プロセスで量子化行列を使用することができ、変換された係数は、現在の量子化ステップによってスケーリングされ、以下のように量子化行列（ＱＭ）によってさらにスケーリングされ：
d[ x ][ y ] = Clip3( coeffMin, coeffMax, ( ( TransCoeffLevel[ xTbY ][ yTbY ][ cIdx ][ x ][ y ] * m[ x ][ y ] * levelScale[ qP%6 ] << (qP / 6 ) ) + ( 1 << ( bdShift - 1 ) ) ) >> bdShift )
式中、
・TransCoeffLevel［…］は、空間座標ｘＴｂＹ、ｙＴｂＹ及び成分インデックスｃＩｄｘによって識別される現在ブロックの変換係数絶対値である。
・ｘ及びｙは水平／垂直周波数インデックスである。
・ｑＰは現在量子化パラメータである。
・levelScale[qP%6]による乗算及び（ｑＰ／６）による左シフトは、量子化ステップqStep=(levelScale[qP%6]<<(qP/6))による乗算に等しい。
・ｍ［…］［…］は二次元量子化行列である。ここでは、量子化行列はスケーリングに使用されるため、スケーリング行列と呼ばれることもある。
・bdShiftは、画像サンプルビット深度を説明する追加のスケーリングファクタである。項(1<<(bdShift-1))は、最近傍整数に丸める役割を果たす。
・ｄ［…］は、結果としての逆量子化された変換係数絶対値である。

[46] 量子化行列の送信にＨＥＶＣによって使用されるシンタックスを以下に記載する：

[47] 以下に留意することができる。
・各変換サイズ（ｓｉｚｅＩｄ）に異なる行列が指定される。スケーリングリストデータシンタックス構造では、スケーリング行列は一次元スケーリングリスト（例えば、ScalingList）にスキャンされる。
・所与の変換サイズで、イントラ／インター符号化及びＹ／Ｃｂ／Ｃｒ成分の６つの行列が指定される。
・行列は以下の何れかであることができる。
・scaling_list_pred_mode_flagがゼロである（基準matrixIdはmatrixId - scaling_list_pred_matrix_id_deltaとして得られる）場合、同じサイズの先に送信された行列からコピーすることができる。
・規格で指定されるデフォルト値からコピーすることができる（scaling_list_pred_mode_flag及びscaling_list_pred_matrix_id_deltaの両方がゼロである場合）。
・右上対角走査順に、指数ゴロムエントロピー符号化を使用してＤＰＣＭ符号化モードで完全に指定することができる。
・８×８よりも大きいブロックサイズの場合、コード化ビットを節減するために、量子化行列のシグナリングに８×８係数のみが送信される。次に、係数は、明示的に送信されるＤＣ係数を除き、ゼロホールド（すなわち、反復）を使用して補間される。

[48] ＨＥＶＣと同様の量子化行列の使用は、寄稿ＪＶＥＴ－Ｎ０８４７（O. Chubach, et al., “CE7-related: Support of quantization matrices for VVC,” JVET-N0847, Geneva, CH, March 2019参照）に基づいてＶＶＣドラフト５に採用されている。scaling_list_dataシンタックスは、以下に示すＶＶＣコーデックに適合されている。

[49] ＪＶＥＴ－Ｎ０８４７を用いたＶＶＣドラフト５の設計では、ＨＥＶＣでのように、ＱＭは２つのパラメータmatrixId及びsizeIdによって識別される。これを以下の２つの表に示す。

[50] 両識別子の組合せを以下の表に示す。

[51] ＨＥＶＣでのように、８×８よりも大きいブロックサイズの場合、８×８係数及びＤＣ係数のみが送信される。正しいサイズのＱＭはゼロホールド補間を使用して再構築される。例えば、１６×１６ブロックの場合、あらゆる係数は両方向で２回繰り返され、ＤＣ係数は送信されたもので置換される。

[52] 矩形ブロックの場合、ＱＭ選択（sizeId）に保持されるサイズはより大きな寸法、すなわち、幅及び高さのうち大きい方である。例えば、４×１６ブロックの場合、１６×１６ブロックサイズのＱＭが選択される。次に、再構築された１６×１６行列はファクタ４で垂直にデシメートされて、最終的な４×１６量子化行列（すなわち、４線のうち３つはスキップされる）を得る。

[53] 以下、sizeId及び使用される正方形ブロックサイズに関連して、所与のファミリのブロックサイズ（正方形又は矩形）のＱＭをサイズ－Ｎと呼ぶ。例えば、ブロックサイズ１６×１６又は１６×４の場合、ＱＭはサイズ－１６（ＶＶＣドラフト５ではｓｉｚｅＩｄ４）として識別される。サイズ－Ｎ表記は、厳密なブロック形状及びシグナリングされるＱＭ係数の数（表３に示すように、８×８に制限される）から区別するために使用される。

[54] さらに、ＶＶＣドラフト５では、サイズ－６４の場合、右下象限のＱＭ係数は送信されない（０と推測され、以下、これを「ゼロアウト」と呼ぶ）。これは、scaling_list_dataシンタックス中の“ｘ＞＝４＆＆ｙ＞＝４”条件によって実施される。これは、変換／量子化プロセスで決して使用されないＱＭ係数の送信を回避する。実際に、ＶＶＣでは、任意の寸法で３２を超えるブロックサイズを変換する場合（６４×Ｎ、Ｎ×６４、Ｎ≦６４）、３２以上のｘ／ｙ周波数座標を有するあらゆる変換係数は送信されず、ゼロと推測され、したがって、その量子化に量子化行列係数は必要ない。これを図４に示し、図４では、斜線エリアはゼロと推測される変換係数に対応する。

[55] ＨＥＶＣと比較して、ＶＶＣでは、ブロックサイズ数がより多いことに起因してより多くの量子化行列を必要である。しかしながら、ＶＶＣドラフト５では、ＱＭ予測はなお、同じブロックサイズ行列のコピーに制限されており、ビットの無駄に繋がり得る。さらに、ＶＶＣではクロマにブロックサイズ２×２のみ及び輝度にブロックサイズ６４×６４のみを使用することにより、ＱＭに関連するシンタックスはより複雑である。また、ＪＶＥＴ－Ｎ０８４７は、ＨＥＶＣと同様に、各ブロックサイズに特定の行列導出プロセスを記述している。

[56] ＨＥＶＣ規格化中、例えば、ＪＣＴＶＣ－Ｅ０７３（J. Tanaka, et al., “Quantization Matrix for HEVC,” JCTVC-E073, Geneva, CH, March 2011参照）及びＪＣＴＶＣ－Ｈ０３１４（Y. Wang, et al., “Layered quantization matrices representation and compression,” JCTVC-H0314, San Jose, CA, USA, February 2012参照）において、幾つかのＱＭ予測技法が探索されてきた。

[57] ＪＣＴＶＣ－Ｅ０７３：ＱＭは特定のパラメータセット（ＱＭＰＳ）で送信される。ＱＭＰＳ内で、ＱＭはサイズ増大順に送信される（ＨＥＶＣと同様にsizeId/matrixId）。先のＱＭＰＳを含め、任意の先に符号化されたＱＭ係数からの予測（＝コピー）が提案されている。線形補間を用いたアップコンバージョンが、より小さな基準ＱＭからの適合に使用され、一方、単純なダウンサンプリングがより大きな基準ＱＭからの適合に使用される。ＨＥＶＣ規格化中、これは最終的に拒絶された。

[58] ＪＣＴＶＣ－Ｈ０３１４：ＱＭは大きくなる順又は小さくなる順に送信される。図５に示すように、固定された予測木を使用して（明示的な基準インデックスなし）、新しいＱＭを送信する代わりに先に送信されたＱＭをコピーすることが可能である。基準ＱＭがより大きい場合、単純なダウンサンプリングが使用される。ＨＥＶＣ規格化中、これは最終的に拒絶された。

[59] これらの２つの提案はＨＥＶＣに関連し、ＶＶＣによって導入される複雑さに対処しない。

[60] 本願は、以下の１つ又は複数を組み込むことにより、任意のＱＭを任意の先にシグナリングされたものから予測することができるように量子化行列シグナリング及び予測プロセスを強化しながら、ＶＶＣドラフト５（ＪＶＥＴ－Ｎ０８４７の採用後）の量子化行列シグナリング及び予測プロセスを簡易化することを提案する。
－基準インデックス差分が任意の先に送信されたものに対処することができるように、サイズ及びタイプの両方を包含するようＱＭインデックスを統一する。
－量子化行列をブロックサイズ低下順に送信する。
－必要に応じてコピー又はデシメーションプロセスの何れかとして予測プロセスを指定する。
－サイズ－６４ＱＭを予測子として使用することができるように、サイズ－６４で全てのＱＭ係数を送信する。

[61] その上、８×８よりも大きいブロックのアップサンプリング及び矩形ブロックのダウンサンプリングを包含するＱＭ導出プロセスは、ブロックパラメータに応じてＱＭインデックスを選択し、ＱＭシグナリングサイズを実際のブロックサイズに適合させると記述される。

[62] 表記を容易にするために、デフォルト値から又は先に送信されたものから量子化行列を予測するプロセスをＱＭ予測プロセスと見なし、送信又は予測されたＱＭを変換ブロックのサイズ及びクロマフォーマットに適合させるプロセスをＱＭ導出プロセスと見なす。ＱＭ予測プロセスは、例えばピクチャレベルでのスケーリングリストデータパーズプロセスの一環であることができる。導出プロセスは通常、より低いレベルであり、例えば、変換ブロックレベルである。種々の態様を以下にさらに詳細に提示し、その後、ドラフトテキスト例及び性能結果が続く。
・ＱＭを識別する１つの行列インデックスの導出及び使用。１つの識別子で、予測（コピー）を使用する場合、任意の先に送信された行列を参照することができ、より大きな行列を最初に送信することで、予測プロセスでの補間が回避される。
・送信された、予測された、又はデフォルトの基準ＱＭである先にシグナリングされたＱＭ（基準ＱＭ）をコピー又はデシメートすることを含むＱＭ予測プロセス。
・所与の変換ブロックの場合、ブロックサイズ、色成分、及び予測モードに基づいてＱＭインデックスを選択し、次に、選択されたＱＭのサイズをブロックのサイズに適合させることを含むＱＭ導出プロセス。リサイズプロセスは、選択されたＱＭの係数をインデックス付ける変換ブロック内のｘ及びｙ座標のビットシフトに基づく。
・サイズ－６４ＱＭの全係数の送信。

[63] ＶＶＣドラフト５と比較して、これらの態様は仕様を簡易化し（ＪＶＥＴ－Ｎ０８４７と比較してテキスト変更を半減し）、大きなビット制限をもたらす（scaling_list_dataのビットコストを半減することができる）。

[64]統一ＱＭインデックス
[65] 変換ブロックの量子化／逆量子化に使用されるＱＭは、１つのパラメータmatrixIdによって識別される。一実施形態では、統一matrixId（ＱＭインデックス）は以下の複合である。
－ブロックサイズではなく、ＣＵサイズ（すなわち、正方形サイズ行列のみが送信されるため、正方形を囲むＣＵ）に関連するサイズ識別子。なお、ここでは、輝度又はクロマの何れかについて、サイズ識別子は輝度ブロックサイズによって制御され、例えばｍａｘ（輝度ブロック幅，輝度ブロック高さ）である。輝度及びクロマツリーが分けられる場合、クロマでは、「ＣＵサイズ」は輝度平面に投射されるブロックのサイズを指す。
－輝度ＱＭはクロマよりも大きいことができる（例えば、４：２：０クロマフォーマットの場合）ため、輝度ＱＭを最初に列記する行列タイプ。

[66] この実施形態によれば、ＱＭインデックス導出を表４、表５、及び式（１）に示す。

[67] 統一matrixIdは以下のように導出される：
matrixId=N^*sizeId+matrixTypeId (1)
式中、Ｎは可能なタイプの識別子の数であり、例えば、Ｎ＝６である。

[68] 別の実施形態では、７つ以上のＱＭタイプが定義される場合、sizeIdは、量子化行列タイプの数である正しい数で乗算されるべきである。他の実施形態では、他のパラメータ、例えば、特定のブロックサイズ、シグナリングされる行列サイズ（ここでは８×８に制限される）、又はＤＣ係数の有無が異なることもできる。なお、ここでは、ＱＭはブロックサイズが低下する順に列記され、表６に示すように、１つのインデックスによって識別される。

[69]ＱＭ予測プロセス
[70] ＱＭ係数を送信する代わりに、デフォルト値から又は任意の先に送信されたＱＭ係数からＱＭを予測することが可能である。一実施形態では、基準ＱＭが同じサイズである場合、ＱＭはコピーされ、その他の場合、図６の一例に示すように、関連する比率でデシメートされ、図６では、サイズ－４輝度ＱＭがサイズ－８から予測される。

[71] デシメーションは以下の式によって記述され：
ScalingMatrix[ matrixId ][ x ][ y ] = refScalingMatrix[ i ][ j ] (2)
式中、matrixSize = (matrixId < 20) ? 8 : (matrixId < 26) ? 4 : 2 )
x = 0 .. matrixSize - 1, y = 0 .. matrixSize - 1,
i = x << ( log2(refMatrixSize) - log2( matrixSize ) ),且つ
j = y << ( log2(refMatrixSize) - log2( matrixSize ) ).
式中、refMatrixSizeはrefScalingMatrixのサイズ（ひいてはｉ及びｊ変数の範囲）に一致する。

[72] 図６に示す例では、輝度サイズ－４ＱＭ（４×４アレイ：matrixSizeは４である）は、８×８アレイ（refMatrixSizeは８である）である輝度サイズ－８ＱＭから予測され；２線のうちの１つ及び２列のうちの１つをドロップして４×４アレイを生成する（すなわち、基準ＱＭ内の要素（２ｘ，２ｙ）は現在ＱＭ内の要素（ｘ，ｙ）にコピーされる）。

[73] 式（３）は以下の形態をとる：
ScalingMatrix[ matrixId ][ x ][ y ] = refScalingMatrix[ i ][ j ] (3)
x = 0 .. 3, y = 0 .. 3, i = x << 1, 且つ j = y << 1.

[74] 基準ＱＭがＤＣ値を有する場合、現在ＱＭがＤＣ値を必要とするとき、基準ＱＭはＤＣ値としてコピーされ、現在ＱＭがＤＣ値を必要としないとき、基準ＱＭは左上ＱＭ係数にコピーされる。

[75] このＱＭ予測プロセスは、好ましい実施形態ではＱＭ復号化プロセスの一環であるが、別の実施形態ではＱＭ導出プロセスまで延期することができ、その場合、予測目的でのデシメーションはＱＭリサイズサブプロセスとマージされる。

[76]ＱＭ導出プロセス
[77] 量子化行列の提案される導出プロセスはまず、上述した（統一ＱＭインデックス）ようにブロックパラメータに応じて右ＱＭインデックスを選択し、次に、矩形ブロックでのデシメーション、あるサイズ、例えば８×８よりも大きいブロックでの反復、及びクロマフォーマット適合のプロセスを１つのプロセスに統一する。提案されるプロセスは、ｘ及びｙ出力座標のビットシフトに基づく。選択されたＱＭの右線／列を選択するために、以下の式に示すように、ｘ／ｙ出力座標の右シフトが後に続く左シフトのみが必要とされ：
m[ x ][ y ] = ScalingMatrix[ matrixId ][ i ][ j ] (4)
式中、i = ( x << log2MatrixSize ) >> log2( blkWidth ), 且つ
j = ( y << log2MatrixSize ) >> log2( blkHeight ).
式中、log2MatrixSizeはScalingMatrix[matrixId]（正方形２Ｄアレイ）のサイズのｌｏｇ２であり、blkWidth及びblkHeightはそれぞれ現在の変換ブロックの幅及び高さであり、ｘは０からblkWidth-1の範囲であり、ｙは０からblkHeight－１の範囲である。

[78] 以下、ＱＭ導出プロセスを示すために、幾つかの例を提供する。図７に示す例では、輝度１６×８ブロックのＱＭは、実際には８×８アレイにＤＣ係数を加えたものである輝度サイズ－１６ＱＭから導出される。この例では、blkWidthは１６に等しく、blkHeightは８に等しく、log2MatrixSizeは3に等しく、したがって、式（５）は以下の形態をとる：
m[ x ][ y ] = ScalingMatrix[ matrixId ][ i ][ j ] (5)
式中、i = ( x << 3 ) >> 4, 且つ j = ( y << 3 ) >> 3, ここで、x = 0..15 且つ y = 0..7.
ここで、ｘは１だけ右シフトし、ｙは変わらず（すなわち、選択されたＱＭ内の列ｉは現在ＱＭ内の列２^＊ｉ及び２^＊ｉ＋１にコピーされる）。さらに、選択されたＱＭがＤＣ係数を有するため、ｍ［０］［０］にコピーされる。

[79] 図８に示す別の例では、８×４ＣＵのクロマ４×２ブロックのＱＭ（４：２：０フォーマット）が生成される。これは、囲む正方形が８×８である８×４ＣＵサイズに一致する。したがって、選択されるＱＭはサイズ－８のＱＭであり、ここで、クロマＱＭは４×４アレイとして符号化される。ここで、blkWidthは４に等しく、blkHeightは２に等しく、log2MatrixSizeは2に等しく、したがって、式（６）は以下の形態をとる：
m[ x ][ y ] = ScalingMatrix[ matrixId ][ i ][ j ] (6)
式中、i = ( x << 2 ) >> 2, 且つ j = ( y << 2 ) >> 1 ここで、x = 0..3 且つ y = 0..1.
ここで、ｘは変わらず、ｙは１だけ左シフトする（すなわち、基準ＱＭ内の行２ｙが現在ＱＭ内の行ｙにコピーされる）。

[80] 以下の例では、４：２：２及び４：４：４フォーマットへの提案される適合はＶＶＣドラフト５と異なる。クロマブロックサイズに一致するＱＭを探す（クロマ行列が存在しない６４×６４の場合を除く）代わりに、サイズ一致は同じ（輝度）ＣＵサイズ（すなわち、輝度平面に投射されたブロックのサイズ）に基づき、必要な場合、係数は繰り返される。これは、ＱＭ設計をクロマフォーマットから独立させる。

[81] 図９に示す例では、８×４ＣＵのクロマ８×２ブロックのＱＭ（４：２：２フォーマット）が生成される。選択されるＱＭは、図８に示す上記例と同じであるが、４：２：２クロマフォーマットは２倍の列を必要とする。ここで、列は繰り返され、したがって、ｘは１だけ右シフトし、ｙはなお１だけ左シフトする。特に、blkWidthは８に等しく、blkHeightは２に等しく、log2MatrixSizeは２に等しく、したがって、式（７）は以下の形態をとる：
m[ x ][ y ] = ScalingMatrix[ matrixId ][ i ][ j ] (7)
式中、i = ( x << 2 ) >> 3, 且つj = ( y << 2 ) >> 1,ここで、x = 0..7 且つ y = 0..1.

[82] 図１０に示す例では、８×４ＣＵのクロマ８×４ブロックのＱＭ（４：４：４フォーマット）が生成される。選択されるＱＭはなお、図８及び図９に示す例と同じであるが、４：４：４クロマフォーマットは、４：２：０クロマフォーマットの２倍の行及び列を必要とする。ここで、列は繰り返されなければならず、したがって、ｘは１だけ右シフトするが、行のデシメーション（矩形のため）はスキップすることができ、したがって、ｙはシフトしない。特に、blkWidthは８に等しく、blkHeightは４に等しく、log2MatrixSizeは２に等しく、したがって、式（８）は以下の形態をとる：
m[ x ][ y ] = ScalingMatrix[ matrixId ][ i ][ j ] (8)
式中、i = ( x << 2 ) >> 3, 且つj = ( y << 2 ) >> 2,ここで、x = 0..7 且つ y = 0..3.

[83]サイズ－６４の場合に送信される係数の数
[84] 一実施形態では、右下象限がＶＶＣ変換及び量子化プロセスによって決して使用されなくとも、サイズ－６４からより小さなＱＭを予測できるように、サイズ－６４の全係数がスケーリングリストシンタックスで送信される。一般に、本発明では、最大ＱＭの全係数を送信し得る。

[85] しかしながら、予測子として使用されない場合、サイズ－６４ＱＭの右下象限ではシンタックス要素scaling_list_delta_coefはゼロに設定することができるため、前の仕事（ＪＶＥＴ－Ｎ０８４７）と比較した送信される係数の数のこの増大に関連するオーバーヘッドが、最悪事例で２×１６ビット：右下象限では、４×４＝１６のデルタ係数がシグナリングされ、ゼロに強制される（指数ゴロムを用いて符号化される）場合、それぞれ１ビットをとり、２つのサイズ－６４ＱＭ（輝度イントラ／インター）がある：に制限することができることに留意することに価値がある。

[86] テストについて表８に説明し、表８は、このオーバーヘッドが予測改良によってもたらされる利得と比較して些細であることを示す。

[87] 別の実施形態では、サイズ－６４ＱＭの右下象限の係数は、サイズ－６４ＱＭシグナリングの一環として送信されず、より小さなＱＭが所与のサイズ－６４ＱＭから最初に予測されるとき、補足パラメータとして送信される。

[88] 表７は、ＪＶＥＴ－Ｎ０８４７に記載の方法と提案される方法とのいくらかの比較を提供する。

[89] 以下、一実施形態による幾つかのシンタックス及びセマンティクスについて説明する。

[90]ＰＰＳシンタックス及びセマンティクス（マイナー適合）

１に等しいpps_scaling_list_data_present_flagは、ＰＰＳと呼ばれるピクチャに使用されたスケーリングリストデータが、アクティブＳＰＳによって指定されたスケーリングリスト及びＰＰＳによって指定されたスケーリングリストに基づいて導出されることを指定する。０に等しいpps_scaling_list_data_present_flagは、ＰＰＳと呼ばれるピクチャに使用されたスケーリングリストデータが、アクティブＳＰＳによって指定されたものに等しいと推測されることを指定する。scaling_list_enabled_flagがゼロに等しい場合、pps_scaling_list_data_present_flagの値は０に等しい値であるものとする。scaling_list_enabled_flagが１に等しい場合、sps_scaling_list_data_present_flagは０に等しく、pps_scaling_list_data_present_flagは０に等しく、デフォルトスケーリング行列が、７．４．５節で指定されるように、スケーリングリストデータセマンティクスに記載のようにアレイScalingMatrixを導出するのに使用される。

[91] このシンタックス／セマンティクスがＨＥＶＣ規格又はＶＶＣドラフトに近いことが意図される一例であり、限定ではないことに留意されたい。例えば、scaling_list_data搬送はＳＰＳ又はＰＰＳに限定されず、他の手段によって送信することもできる。

[92]シグナリングリストデータシンタックス／セマンティクス（簡易化）

０に等しいscaling_list_pred_mode_flag[matrixId]は、スケーリング行列が基準スケーリング行列の値から導出されることを指定する。基準スケーリング行列は、scaling_list_pred_matrix_id_delta[matrixId]によって指定される。１に等しいscaling_list_pred_mode_flag[matrixId]は、スケーリングリストの値が明示的にシグナリングされることを指定する。
scaling_list_pred_matrix_id_delta[matrixId]は、以下のように、スケーリング行列の導出に使用される基準スケーリング行列を指定する。scaling_list_pred_matrix_id_delta[matrixId]の値は、０からmatrixIdの範囲（端数を含む）内であるものとする。
scaling_list_pred_mode_flag[matrixId]がゼロに等しい場合：
－変数refMatrixSize及びアレイrefScalingMatrixはまず、以下のように導出される：
・scaling_list_pred_matrix_id_delta[matrixId]がゼロに等しい場合、以下が設定デフォルト値に適用される：
・refMatrixSizeは８に等しく設定され、
・matrixIdが偶数である場合、
refScalingMatrix = (9)
{
{ 16, 16, 16, 16, 16, 16, 16, 16 } // イントラデフォルト値のプレースホルダ
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
},
・その他の場合
refScalingMatrix = (10)
{
{ 16, 16, 16, 16, 16, 16, 16, 16 } // インターデフォルト値のプレースホルダ
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
{ 16, 16, 16, 16, 16, 16, 16, 16 }
},
・その他の場合(scaling_list_pred_matrix_id_delta[matrixId]がゼロよりも大きい場合）、以下が適用される：
refMatrixId = matrixId - scaling_list_pred_matrix_id_delta[ matrixId ] (11)
refMatrixSize = (refMatrixId < 20) ? 8 : (refMatrixId < 26) ? 4 : 2 ) (12)
refScalingMatrix = ScalingMatrix[ refMatrixId ] (13)
－次に、アレイScalingMatrix[matrixId]が以下のように導出される：
ScalingMatrix[ matrixId ][ x ][ y ] = refScalingMatrix[ i ][ j ] (14)
式中、matrixSize = (matrixId < 20) ? 8 : (matrixId < 26) ? 4 : 2 )
x = 0 .. matrixSize - 1, y = 0 .. matrixSize - 1,
i = x << ( log2(refMatrixSize) - log2( matrixSize ) ), 且つ
j = y << ( log2(refMatrixSize) - log2( matrixSize ) )
scaling_list_dc_coef_minus8[matrixId]＋８は、ｘｘｘ節に記載のように、関連する場合、スケーリング行列の最初の値を指定する。scaling_list_dc_coef_minus8[matrixId]の値は－７から２４７の範囲（端数を含む）であるものとする。
scaling_list_pred_mode_flag[matrixId]がゼロに等しい場合、scaling_list_pred_matrix_id_delta[matrixId]はゼロよりも大きく、且つrefMatrixId<14であり、以下が適用される：
－matrixId<14の場合、scaling_list_dc_coef_minus8[matrixId]はscaling_list_dc_coef_minus8[refMatrixId]に等しいと推測され、
－その他の場合、ScalingMatrix[matrixId][0][0]はscaling_list_dc_coef_minus8[refMatrixId]＋８に等しく設定される。
scaling_list_pred_mode_flag[matrixId]がゼロに等しい場合、scaling_list_pred_matrix_id_delta[matrixId]はゼロに等しく（デフォルト値を示す）、且つmatrixId<14であり、scaling_list_dc_coef_minus8[matrixId]は８に等しいと推測される。
scaling_list_delta_coefは、現在行列係数ScalingList[matrixId][i]と前の行列係数ScalingList[matrixId][i-1]との間の差分を指定し、scaling_list_pred_mode_flag[matrixId]が１に等しい場合。scaling_list_delta_coefの値は－１２８から１２７の範囲（端数を含む）であるものとする。ScalingList[matrixId][i]の値は、０よりも大きいものとする。
存在する（すなわち、scaling_list_pred_mode_flag[matrixId]が１に等しい）場合、アレイScalingMatrix[matrixId]は以下のように導出される：
ScalingMatrix[ matrixId ][ i ][ j ] = ScalingList[ matrixId ][ k ] (15)
式中、k = 0 .. coefNum - 1,
i = diagScanOrder[ log2(coefNum)/2 ][ log2(coefNum)/2 ][ k ][ 0 ], 且つ
j = diagScanOrder[ log2(coefNum)/2 ][ log2(coefNum)/2 ][ k ][ 1 ]

[93] ＪＶＥＴ－Ｎ０８４７シンタックスと比較した主な簡易化は、１つのｆｏｒ（）ループの除去及び[sizeId][matrixId]から[matrixId]のインデックス簡易化である。

[94] 「ｘｘｘ節」は、本文書のスケーリング行列導出プロセスに一致する、ＶＶＣ仕様において紹介される不確定セクション番号を指す。

[95] このシンタックス／セマンティクスが、ＨＥＶＣ規格又はＶＶＣドラフト５に近いことが意図される一例であり、限定ではないことに留意されたい。例えば、係数範囲は１、・・・、２５５に限定されず、例えば、１、・・・、１２７（７ビット）又は－６４、・・・、６３であってもよい。また、６タイプ×５サイズとして編成される３０のＱＭに限定されない（８つのタイプ及びより少数又は多数のサイズがあり得る。適合することができる表５参照。その場合、ｃｏｅｆＮｕｍへの単純な適合及びＤＣ係数の存在についての条件が必要とされる）。ＱＭ予測のタイプ（ここではコピーのみ）も限定ではない。例えば、スケーリングファクタ又はオフセットを追加することができ、明示的な符号化を残差として予測の上に追加することができる。同じことが、係数送信に使用される方法（ここではＤＰＣＭ）、ＤＣ係数の存在、及び固定される係数の数（サブセットのみを送信することができる）にも言える。

[96] デフォルト値に関して、MODE_INTRA及びMODE_INTERに関連付けられた２つのデフォルトＱＭに限定されず、ここでのように、関連するデフォルト値が一致するまで（例えば、ＨＥＶＣと同じデフォルトＱＭを選択することができる）、１６全ての値で埋められる。

[97] また、シグナリングする係数の数ｃｏｅｆＮｕｍは、一連の比較の代わりに数学的に表すこともでき、結果は同じであり：coefNum=Min(64,4096>>((matrixId+4)/6)^*2)、これはＨＥＶＣ又は現在のＶＶＣドラフト様式に近いが、歓迎されないことがある除法を導入する。

[98] なお、ここでは、より大きな行列が最初に送信され、１つのインデックスが使用され、それにより、予測基準（scaling_list_pred_matrix_id_deltaによって示される）が、意図されたブロックサイズ又はタイプに関係なく、任意の先に送信された行列又はデフォルト値（例えば、scaling_list_pred_matrix_id_deltaがゼロである場合）であることができることに留意する。

[99] 図１１は、一実施形態によりスケーリングリストデータシンタックス構造をパーズするプロセス（１１００）を示す。この実施形態では、入力はコード化ビットストリームであり、出力はScalingMatrixのアレイである。明確にするために、ＤＣ値についての詳細は省く。特に、ステップ１１１０において、ＱＭ予測モードがビットストリームから復号化される。ＱＭが予測される（１１２０）場合、デコーダは、上記フラグに応じて、ＱＭが推測（予測）されるか、それともビットストリームにおいてシグナリングされるかをさらに判断する。ステップ１１３０において、デコーダは、ビットストリームからＱＭ予測データを復号化し、これは、例えばＱＭインデックス差分scaling_list_pred_matrix_id_deltaがシグナリングされない場合、ＱＭを推測するのに必要である。次に、デコーダは、ＱＭがデフォルト値から（例えば、scaling_list_pred_matrix_id_deltaがゼロである場合）又は先に復号化されたＱＭから予測されるか否かを判断する（１１４０）。基準ＱＭがデフォルトＱＭである場合、デコーダはデフォルトＱＭを基準ＱＭとして選択する（１１５０）。例えば、matrixIdのパリティに応じて、選択元として幾つかのデフォルトＱＭがあり得る。その他の場合、デコーダは先に復号化されたＱＭを基準ＱＭとして選択する（１１５５）。基準ＱＭのインデックスは、matrixId及び上記インデックス差分から導出される。ステップ１１６０において、デコーダは基準ＱＭからＱＭを予測する。予測は、基準ＱＭが現在ＱＭと同じサイズである場合、簡単なコピーからなり、又は予期したよりも大きい場合、デシメーションからなる。結果はScalingMatrix[matrixId]に記憶される。

[100] ＱＭが予測されない（１１２０）場合、デコーダは、matrixIdに応じてビットストリームから復号化されるＱＭ係数の数を決定する（１１７０）。例えば、matrixIdが２０より低い場合、６４であり、matrixIdが２０～２５である場合、１６であり、その他の場合、４である。ステップ１１７５において、デコーダはビットストリームからＱＭ係数の関連する数を復号化する。ステップ１１８０において、デコーダは、走査順、例えば対角走査に従って、復号化されたＱＭ係数を２Ｄ行列に編成する。結果はScalingMatrix[matrixId]に記憶される。ScalingMatrix[matrixId]を使用して、デコーダはＱＭ導出プロセスを使用して、非正方形及び／又は異なるクロマフォーマットであり得る変換ブロックを逆量子化する量子化行列ｍ［］［］を取得することができる。

[101] ステップ１１９０において、デコーダは、現在ＱＭがパーズする最後のＱＭであるか否かをチェックする。最後ではない場合、制御はステップ１１１０に戻り、その他の場合、全てのＱＭがビットストリームからパーズされたとき、ＱＭパーズプロセスは停止する。

[102] 図１２は、一実施形態による、エンコーダ側でのスケーリングリストデータシンタックス構造を符号化するプロセス（１２００）を示す。エンコーダ側では、ＱＭは記載の順序で、大きいブロックサイズから小さいブロックサイズに（例えば、ｍａｔｒｉｘＩｄ０から３０に）走査される。ステップ１２１０において、エンコーダは予測嗜好をサーチして、現在ＱＭが先にコード化されたもののコピー（又はデシメーション）であるか否かを判断する。ＱＭは、ＱＭ予測の効率を最適化するように設計することができ、例えば、幾つかのＱＭが最初に十分に近い、又はデフォルトＱＭから近い場合、強制的に等しくすることができる（又はサイズが異なる場合、強制的にデシメートすることができる）。さらに、サイズ－６４ＱＭの右下象限における係数は、後続ＱＭをよりよく予測するように又は予測に決して再使用されない場合、ＱＭビットコストを低減するように最適化することができる。決定されると、ＱＭ予測モードはビットストリームに符号化される。

[103] 特に、エンコーダが予測を使用すると決定した場合（１２２０）、ステップ１２３０において、予測モードが符号化される（例えば、scaling_list_pred_mode_flag=0）。ステップ１２４０において、予測パラメータ（例えば、ＱＭインデックス差分scaling_list_pred_matrix_id_delta)が符号化される：デフォルトＱＭ値の場合、ゼロインデックス差分、又は先のＱＭが予測基準として選ばれた場合、関連するインデックス差分。他方、明示的なシグナリングが決定された場合、ステップ１２５０において、予測モードが符号化される（例えば、scaling_list_pred_mode_flag=0）。次に対角走査（１２６０）が実行され、次にＱＭ係数符号化（１２７０）が実行される。

[104] ステップ１２８０において、エンコーダは、現在ＱＭが符号化する最後のＱＭであるか否かをチェックする。最後ではない場合、制御はステップ１２１０に戻り、その他の場合、全てのＱＭがビットストリームに符号化されたとき、ＱＭ符号化プロセスは停止する。

[105] 図１３は、一実施形態によるＱＭ導出プロセス１３００を示す。入力はScalingMatrixアレイを含み、サイズ（幅／高さ）、予測モード（イントラ／インター／ＩＢＣ、・・・）、及び色成分（Ｙ／Ｕ／Ｖ）等のブロックパラメータを変換することができる。出力は、変換ブロックと同じサイズを有するＱＭである。明確にするために、ＤＣ値についての詳細は省く。特に、ステップ１３１０において、デコーダは、上述したように（統一ＱＭインデックス）、現在の変換ブロックサイズ（幅／高さ）、予測モード（イントラ／インター／ＩＢＣ、・・・）、及び色成分（Ｙ／Ｕ／Ｖ）に応じてＱＭインデックスmatrixIdを決定する。ステップ１３２０において、デコーダは、上述したように、変換ブロックサイズに一致するように選択されたＱＭ（ScalingMatrix[matrixId]）をリサイズする。一変形では、ステップ１３２０は予測に必要なデシメーションを含むことができる。

[106] ＱＭ導出プロセスは、エンコーダ側で同様である。量子化は変換係数をＱＭ値で除算し、一方、逆量子化は乗算する。しかし、ＱＭは同じである。特に、エンコーダにおいて再構築に必要なＱＭは、ビットストリームでシグナリングされるものに一致する。

[107] 概念上、変換係数ｄ［ｘ］［ｙ］は以下のように量子化することができ、ここで、ｑＳｔｅｐは量子化ステップサイズであり、ｍ［］［］は量子化行列である：
TransCoeffLevel[xTbY][yTbY][cIdx][x][y] = d[x][y] / qStep / m[x][y]

[108] しかし、整数計算の場合、除法を回避するために、通常、
TransCoeffLevel[xTbY][yTbY][cIdx][x][y] = ( ( d[x][y] * im[x][y] * ilevelScale[ qP%6 ] >>
(qP / 6 ) ) + ( 1 << ( bdShift - 1 ) ) ) >> bdShift )
のように見え、例えば、im[x][y]≒65536/m[x][y]であり、ilevelScale[0..5]=65536/levelScale[0..5]であり、ｂｄＳｈｉｆｔは適切な値である。実際に、ソフトウェアコーダの場合、im^*ilevelScaleは通常、予め計算され、テーブルに記憶される。

[109] 上記では、ＱＭ予測プロセス及びＱＭ導出プロセスは別個に実行される。別の実施形態では、ＱＭ予測はＱＭ導出プロセスまで延期することができる。この実施形態はＱＭシグナリングシンタックスを変えない。この実施形態は、連続リサイズにより機能的に異なることができ、予測部分（基準ＱＭ取得＋コピー／ダウンスケール）及び対角走査を後述する「ＱＭ導出プロセス」まで延期する。

[110] その場合、一実施形態では、スケーリングリストデータパーズプロセス１１００の出力は、予測フラグ及び有効予測パラメータと共に、ScalingMatrixの代わりにScalingList()のアレイである：ScalingMatrixPredIdアレイは常に、定義されたScalingListのインデックスを含む（デフォルト又はシグナリング）。このアレイは、scaling_list_pred_matrix_id_deltaを解釈することによりＱＭ復号化中、再帰的に構築され、それにより、ＱＭ導出プロセスはこのインデックスを直接使用して、現在の変換ブロックの逆量子化に使用されるＱＭを構築するための実際の値を取得することができる。

[111] 以下、一実施形態によるスケーリングリストセマンティクスを示すために、一例を提供する。

スケーリング行列導出プロセス（新：スケーリングリストセマンティクスでの説明を部分的に置き換える；これはセクションｘｘｘ）
[112] このプロセスへの入力は予測モードpredMode、色成分変数ｃＩｄｘ、ブロック幅blkWidth、及びブロック高さblkHeightである。
このプロセスの出力は、（blkWidth）×（blkHeight）アレイｍ［ｘ］［ｙ］（スケーリング行列）であり、ｘ及びｙは水平及び垂直係数位置である。なお、SubWidthC及びSubHeightCはクロマフォーマットに依存し、輝度成分及びクロマ成分におけるサンプル数の比率を示す。
変数matrixIdは以下のように導出される：
matrixId = 6 * sizeId + matrixTypeId (xxx-1)
式中、subWidth = (cIdx > 0) ? SubWidthC : 1,
subHeight = (cIdx > 0) ? SubHeightC : 1,
sizeId = 6 - max( log2( blkWidth * subWidth ), log2( blkHeight * subHeight ) ), 且つ
matrixTypeId = ( 2 * cIdx + ( predMode = = MODE_INTER ? 1 : 0 ) )
変数log2MatrixSizeは以下のように導出される：
log2MatrixSize = (matrixId < 20) ? 3 : (matrixId < 26) ? 2 : 1 (xxx-2)
出力アレイｍ［ｘ］［ｙ］は、以下を適用することによって導出され、ｘは端数を含めて０からblkWidth－１の範囲であり、ｙは端数を含めて０からblkHeight－１の範囲である：
m[ x ][ y ] = ScalingMatrix[ matrixId ][ i ][ j ] (xxx-3)
式中、i = ( x << log2MatrixSize ) >> log2( blkWidth ), 且つ
j = ( y << log2MatrixSize ) >> log2( blkHeight )
matrixIdが１４よりも低い場合、ｍ［０］［０］は以下のようにさらに変更される：
m[ 0 ][ 0 ] = scaling_list_dc_coef_minus8[ matrixId ] + 8 (xxx-4)

[113] scaling_list_dataシンタックス及びセマンティクスとの同様に、これが一例であり、限定ではないことに留意されたい。例えば、MODE_INTRA及びMODE_INTERに関連付けられた２つのデフォルトＱＭに限定されず、ここでのように、関連するデフォルト値が一致するまで（例えば、ＨＥＶＣと同じデフォルトＱＭを選択することができる）、１６全ての値で埋められる。１つのデフォルトＱＭがあってもよく、又は３つ以上のデフォルトＱＭがあってもよい。matrixId算出は、例えば、ブロックサイズ毎に６よりも多数又は少数のタイプがある場合、困難であり得る。重要なのは、選択されたＱＭと異なるブロックサイズに適合するための水平及び垂直ダウンスケール及びアップスケールが、好ましくは簡単な（ここでは、左シフトに続く右シフト）１つのプロセスで行われることである。

[114] 矩形ブロックの場合、正方形を囲む現在ブロックのＱＭ識別子の選択に限定されない：式xxx-1におけるsizeIdの導出は異なるルールに従い得る。

[115] また、選択されたＱＭサイズlog2MatrixSizeは、一連の比較の代わりに数学的に表すこともでき、結果は同じである：log2MatrixSize=min(3,6-(matrixId+4)/6)が、これは歓迎されないことがある除法を導入する。

[116] 以下、一実施形態によるスケーリングプロセスのセマンティクスを説明するために、一例を提供する。

（適合された）変換係数のスケーリングプロセス
[117] ［…］
x=0,...,nTbW-1、y=0,...,nTbH-1であるスケーリングされた変換係数ｄ［ｘ］［ｙ］の導出のために、以下が適用される：
－(nTbW)×(nTbH)中間スケーリングファクタアレイｍが以下のように導出される：
－以下の条件の１つ又は複数が真である場合、ｍ［ｘ］［ｙ］は１６に等しくて設定される：
－scaling_list_enabled_flagが０に等しい。
－transform_skip_flag[xTbY][yTbY]が１に等しい。
－その他の場合、ｍは、予測モードCuPredMode[xTbY][yTbY]、色成分変数ｃＩｄｘ、ブロック幅ｎＴｂＷ、及びブロック高さｎＴｂＨを入力として用いて呼び出される、ｘｘｘ節で指定されるスケーリング行列導出プロセスの出力である。
－スケーリングファクタｌｓ［ｘ］［ｙ］は以下のように導出される：
［…］

[118] ＶＶＣドラフト５と比較した主な変更は、scaling_list_dataセマンティクスに記載されるアレイの部分をコピーする代わりに、ｘｘｘ節を呼び出すことである。

[119] 上記のように、これが、現在のＶＶＣドラフトへの変更を最小することを目的とした一例であり、限定ではないことに留意されたい。例えば、スケーリング行列導出プロセスの色成分入力は、ｃＩｄｘと異なってもよい。また、ＱＭはスケーリングファクタとしての使用に限定されず、例えばＱＰオフセットとして使用することもできる。

[120] ＨＥＶＣ規格化中に使用したものと同じテストセットを、一般的な規格（ＪＰＥＧ、ＭＰＥＧ２、ＡＶＣ、ＨＥＶＣ）の推奨又はデフォルトＱＭから導出されるＱＭと、実際のブロードキャストで見られるＱＭとで増補して使用して、ＱＭコード化性能をテストした。全てのテストで、幾つかのＱＭはあるタイプから別のタイプに（例えば、輝度からクロマへ又はイントラからインターへ）、及び／又はあるサイズから別のサイズにコピーされる。

[121] 以下の表は、３つの異なる方法：ＨＥＶＣ、ＪＶＥＴ－Ｎ０８４７、及び本提案を使用してscaling_list_dataを符号化するために必要なビット数を報告している。特に、ＨＥＶＣはＨＥＶＣテストセット（テスト毎に２４個のＱＭ）を使用し、他の２つは導出されたテストセット（テスト毎に３０個のＱＭ、追加のサイズあり：クロマの場合サイズ－２、輝度の場合にサイズ－６４；サイズ－２ＱＭはサイズ－４からダウンサンプリングされ、サイズ－６４はサイズ－３２からコピーされ、サイズ－３２はサイズ－１６からコピーされ、サイズ１６、８、４はそのまま維持される）を使用する。

[122] このテストでは、ＨＥＶＣと比較した場合であっても、提案された技法が大量のビットを節減し、その一方で、提案された方法はより多くのＱＭを符号化することが分かる。

[123] ＪＣＴＶＣ－Ｅ０７３での手法を再び参照すると、ＪＣＴＶＣ－Ｅ０７３における基準インデックス付け（三つ組み：ＱＭＰＳ、サイズ、タイプ）は、ここで提案されるものよりも複雑であり、何故ならば、先のＱＭＰＳインデックス付けでは先のＱＭＰＳの記憶が必要なためである。線形補間は複雑性を導入する。ダウンサンプリングはここで提案されるものと同様である。

[124] ＪＣＴＶＣ－Ｈ０３１４での手法を再び参照すると、大きなものから小さなものへの送信はここで提案されるものに近いが、ＪＣＴＶＣ－Ｈ０３１４での固定予測木は、ここで提案される統一インデックス付け及び明示的な基準よりも柔軟性に劣る。

[125]イントラブロックコピーモードでのＱＭ
[126] 上記では、２つのブロック予測モード、すなわち、イントラ及びインターに異なるＱＭが指定される。しかしながら、イントラ及びインターに加えて、ＶＶＣでは新しい予測モード：ＩＢＣ（イントラブロックコピー）があり、ＩＢＣでは、ブロックは、適切な変位ベクトルを用いて、同じピクチャの再構築されたサンプルから予測することができる。ＩＢＣ予測モードでのＱＭ選択では、ＪＶＥＴ－Ｎ０８４７及び上記実施形態は両方とも、イントラモードと同じＱＭを使用する。

[127] ＩＢＣモードはイントラよりもインターに近いため、一実施形態では、インターモード（イントラの代わりに）でシグナリングされたＱＭを再使用することが提案される。しかしながら、ＩＢＣは、インター予測に近い一方で、異なる：変位ベクトルは物体又はカメラの動きに一致せず、テクスチャコピーに使用される。これは、異なる実施形態では、特定のＱＭがＩＢＣブロックのコピー最適化に役立ち得る特定のアーチファクトに繋がり得る。以下、ＩＢＣ予測モードでのＱＭ選択を変えることを提案する。
・好ましい実施形態は、インターモード（イントラの代わりに）と同じＱＭを選択することであり、その理由は、ＩＢＣがイントラ予測よりもインター予測に近いためである。
・別の選択肢は、ＩＢＣモードに特定のＱＭを有することである。
・これらはシンタックスで明示的にシグナリングされてもよく、又は推測されてもよい（例えば、イントラＱＭ及びインターＱＭの平均）。

[128] 好ましい実施形態では、特定の変換ブロックのＱＭ選択又は導出プロセスは、ブロックがＩＢＣ予測モードを有する場合、インターＱＭを選択する。図１２を再び参照すると、ＱＭ導出プロセスのステップ１２１０は後述のように調整する必要がある。

[129] 先に提案されたドラフトテキストでは、ＱＭ選択は式（ｘｘｘ－１）に記載されており、これは以下のように変えることができる。

[130] なお、ブロックはイントラモード(MODE_INTRA)、インターモード(MODE_inter)、又はイントラブロックコピーモード(MODE_IBC)で符号化し得る。matrixTypeIdが表６又はmatrixTypeId=(2^*cIdx+(predMode==MODE_INTER?1:0)))のように設定される場合、MODE_IBCブロックは、まるでMODE_INTRAブロックであるかのようにmatrixTypeIdを選択する。(xxx-1)における変更：matrixTypeId=(2^*cIdx+(predMode==MODE_INTRA?0:1))を用いて、MODE_IBCブロックは、まるでMODE_INTERブロックであるかのようにmatrixTypeIdを選択する。

[131] JVET-N0847によって提案されるドラフトテキストでは、ＱＭ選択は表７－１４に記載され、以下のように変更することができる。特に、MODE_IBCのmatrixIdは、ＪＶＥＴ－Ｎ０８４７でのようにMODE_INTRAと同じではなく、MODE_INTERと同じように割り当てられる。

[132]変形１：ＩＢＣのＱＭを明示的にシグナリング
[133] この変形では、特定のＱＭ（イントラＱＭ及びインターＱＭと異なる）がＩＢＣブロックに使用され、これらのＱＭはビットストリームにおいて明示的にシグナリングされる。これはより多くのＱＭを作成し、scaling_list_dataシンタックス及びmatrixIdマッピングの適合を必要とし、ビットコストへの影響を有する。この変形によれば、式（ｘｘｘ－１）に記載のＱＭ選択は、以下のように変更することができる。

[134] ＪＶＥＴ－Ｎ０８４７では、ＱＭ選択表は以下のように変更することができる：

[135]変形２：ＩＢＣモードのＱＭを推測
[136] この変形では、特定のＱＭ（イントラＱＭ及びインターＱＭと異なる）がＩＢＣブロックに使用される。しかしながら、それらのＱＭはビットストリームでシグナリングされず、推測される：例えば、スケーリング及びオフセットのように、イントラＱＭ及びインターＱＭの平均、特定のデフォルト値、又はインターＱＭへの特定の変更として。

[137]変形３：輝度のみでの明示的なＩＢＣＱＭ
[138] この変形では、ＩＢＣ用の追加のＱＭは輝度のみに制限され、ＩＢＣ用のクロマＱＭは、変形１でのようにインターＱＭを再使用するか、又は変形２でのように新しいＱＭを推測することができる。

[139] 種々の方法が本明細書に記載され、各方法は、上述した方法を達成する１つ又は複数のステップ又は動作を含む。ステップ又は動作の特定の順序が方法の適切な動作に求められる場合を除き、特定のステップ及び／又は動作の順序及び／又は使用は変更又は結合し得る。さらに、「第１」、「第２」等の用語、例えば、「第１の復号化」及び「第２の復号化」は、種々の実施形態では、要素、構成要素、ステップ、動作等を修飾するのに使用し得る。そのような用語の使用は、特に必要とされる場合を除き、修飾された動作への順序を暗示しない。したがって、この例では、第１の復号化は第２の復号化の前に実行される必要はなく、例えば、第２の復号化の前、第２の復号化中、又は第２の復号化と重なる時間期間中に行われ得る。

[140] 本願に記載の種々の方法及び他の態様は、図２及び図３に示すビデオエンコーダ２００及びデコーダ３００のモジュール、例えば量子化及び逆量子化モジュール（２３０、２４０、３４０）を変更するのに使用することができる。さらに、各態様はＶＶＣ又はＨＥＶＣに限定されず、例えば他の規格及び推奨並びに任意のそのような規格及び推奨の拡張に適用することができる。別記される場合又は技術的に除外される場合を除き、本願に記載の態様は個々に又は組み合わせて使用することができる。

[141] 種々の数値が本願で使用される。具体的な値は例を目的とし、記載の態様はこれらの具体的な値に限定されない。

[142] 種々の実施は復号化を含む。「復号化」は、本願で使用される場合、表示に適した最終出力を生成するために、例えば、受信した符号化シーケンスに対して実行されるプロセスの全て又は部分を包含し得る。種々の実施形態では、そのようなプロセスは、通常、デコーダによって実行されるプロセス、例えば、エントロピー復号化、逆量子化、逆変換、及び差動復号化の１つ又は複数を含む。句「復号化プロセス」が特に動作のサブセットを指すことが意図されるか、それとも全般的により広い復号化プロセスを指すことが意図されるかは、具体的な説明の文脈に基づいて明らかになり、当業者によってよく理解されると考えられる。

[143] 種々の実施は符号化を含む。「復号化」についての上記論考と同様に、本願で使用される「符号化」は、符号化ビットストリームを生成するために、例えば入力ビデオシーケンスに対して実行されるプロセスの全て又は部分を包含し得る。

[144] なお、本明細書で使用されるシンタックス要素は記述用語である。したがって、他のシンタックス要素名の使用を除外しない。上記では、種々の実施形態を説明するために、ＰＰＳ及びスケーリングリストのシンタックス要素が主に使用されている。これらのシンタックス要素が他のシンタックス構造に配置されてもよいことに留意されたい。

[145] 本明細書に記載の実施及び態様は、例えば、方法若しくはプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号で実施し得る。実施の一形態の状況でのみ論じられる（例えば、方法としてのみ論じられる）場合であっても、論じられた特徴の実施は他の形態（例えば、装置又はプログラム）で実施することも可能である。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアで実施し得る。方法は、例えば装置、例えばコンピュータ、マイクロプロセッサ、集積回路、又はプログラマブル論理デバイスを含め、例えば一般に処理デバイスと呼ばれるプロセッサで実施し得る。プロセッサは通信デバイス、例えば、コンピュータ、携帯電話、ポータブル／個人情報端末（「ＰＤＡ」）、及びエンドユーザ間の情報の通信を促進する他のデバイスも含む。

[146] 「一実施形態」、「実施形態」、「一実施」、又は「実施」、並びにそれらの他の変形への言及は、その実施形態に関連して記載された特定の特徴、構造、特性等が、少なくとも１つの実施形態に含まれることを意味する。したがって、句「一実施形態では」、「実施形態では」、「一実施では」、又は「実施では」の出現並びに本願を通して種々の場所に現れる任意の他の変形は、必ずしも全てが同じ実施形態を指す訳ではない。

[147] さらに、本願は種々の情報を「決定する」ことに言及し得る。情報の決定は、例えば、情報の推定、情報の算出、情報の予測、又はメモリからの情報の検索の１つ又は複数を含み得る。

[148] さらに、本願は、種々の情報への「アクセス」に言及し得る。情報へのアクセスは、例えば、情報の受信、情報の検索（例えばメモリからの）、情報の記憶、情報の移動、情報のコピー、情報の算出、情報の決定、情報の予測、又は情報の推定の１つ又は複数を含み得る。

[149] さらに、本願は種々の情報の「受信」に言及し得る。受信は、「アクセス」と同様に、広義の用語であることが意図される。情報の受信は、例えば、情報へのアクセス又は情報の検索（例えばメモリからの）の１つ又は複数を含み得る。さらに、「受信」は通常、何らかの形で、動作中、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を算出すること、情報を決定すること、情報を予測すること、又は情報を推定すること関わる。

[150] 例えば、「Ａ／Ｂ」、「Ａ及び／又はＢ」、及び「Ａ及びＢの少なくとも１つ」の場合での以下「／」、「及び／又は」、及び「少なくとも１つの」の何れかの使用が、最初に列記された選択肢（Ａ）のみの選択、２番目に列記された選択肢（Ｂ）のみの選択、又は両選択肢（Ａ及びＢ）の選択の包含を意図することを理解されたい。更なる例として、「Ａ、Ｂ、及び／又はＣ」及び「Ａ、Ｂ、及びＣの少なくとも１つ」の場合、そのような句は、最初に列記された選択肢（Ａ）のみの選択、２番目に列記された選択肢（Ｂ）のみの選択、３番目に列記された選択肢（Ｃ）のみの選択、１番目及び２番目に列記された選択肢（Ａ及びＢ）のみの選択、１番目及び３番目に列記された選択（Ａ及びＣ）のみの選択、２番目及び３番目に列記された選択肢（Ｂ及びＣ）のみの選択、又は３つ全ての選択肢（Ａ及びＢ及びＣ）の選択の包含が意図される。これは、当業者には明らかなように、列記されるだけの数の項目に拡張し得る。

[151] また、本明細書で使用される場合、言葉「シグナリング」は、特に、対応するデコーダへの何かを指す。例えば、特定の実施形態では、エンコーダは、逆量子化のために量子化行列をシグナリングする。このように、実施形態では、同じパラメータがエンコーダ側及びデコーダ側の両方で使用される。したがって、例えば、エンコーダはデコーダに特定のパラメータを、デコーダが同じ特定のパラメータを使用することができるように、送信する（明示的なシグナリング）ことができる。逆に、デコーダが既に特定のパラメータ等を有している場合、シグナリングは送信なしで使用されて（暗黙的なシグナリング）、デコーダが単に特定のパラメータを知り選択できるようにする。いかなる実際の機能の送信も回避することにより、種々の実施形態でビット節減が実現する。シグナリングが多種多様な方法で達成可能なことを理解されたい。種々の実施形態では、例えば、１つ又は複数のシンタックス要素、フラグ等が、対応するデコーダへの情報のシグナリングに使用される。上記は言葉「信号」の動詞形に関連するが、言葉「信号」は本明細書では名詞として使用することもできる。

[152] 当業者には明らかになるように、実施は、例えば、記憶又は伝送し得る情報を搬送するようにフォーマットされた多種多様な信号を生成し得る。情報は、例えば、方法を実行する命令又は記載の実施の１つによって生成されるデータを含み得る。例えば、信号は、記載の実施形態のビットストリームを搬送するようにフォーマットし得る。そのような信号は、例えば、電磁波（例えば、スペクトルの無線周波数部分を使用する）又はベースバンド信号としてフォーマットし得る。フォーマットすることは、例えば、データストリームを符号化し、符号化データストリームを用いて搬送波を変調することを含み得る。信号が搬送する情報は、例えば、アナログ又はデジタル情報であり得る。信号は、既知のように、多種多様な異なる有線又は無線リンクを介して伝送し得る。信号はプロセッサ可読媒体に記憶し得る。

Claims

ピクチャ内の復号化するブロックのブロックサイズ、色成分、及び予測モードに基づいて量子化ブロックの単一識別子を取得することと、
基準量子化行列を示すシンタックス要素を復号化することであって、前記シンタックス要素は、前記基準量子化行列の識別子と前記量子化行列の前記取得された識別子との間の差分を指定する、復号化することと、
前記基準量子化行列に基づいて前記量子化行列を取得することと、
前記量子化行列に応答して前記ブロックの変換係数を逆量子化することと、
前記逆量子化された変換係数に応答して前記ブロックを復号化することと、
を含む方法。
１つ又は複数のプロセッサを備えた装置であって、前記１つ又は複数のプロセッサは、
ピクチャ内の復号化するブロックのブロックサイズ、色成分、及び予測モードに基づいて量子化行列の単一識別子を取得することと、
基準量子化行列を示すシンタックス要素を復号化することであって、前記シンタックス要素は、前記基準量子化行列の識別子と前記量子化行列の前記取得された識別子との間の差分を指定する、復号化することと、
前記基準量子化行列に基づいて前記量子化行列を取得することと、
前記量子化行列に応答して前記ブロックの変換係数を逆量子化することと、
前記逆量子化された変換係数に応答して前記ブロックを復号化することと、
を行うように構成される、装置。
前記ブロックのサイズは、前記基準量子化行列が逆量子化のために適用されるブロックのサイズと異なる、請求項１に記載の方法又は請求項２に記載の装置。
前記量子化行列の要素は、前記ブロックの各変換係数を逆量子化する際、スケーリングファクタとして使用される、請求項１若しくは３に記載の方法又は請求項２若しくは３に記載の装置。
前記量子化行列の要素は、前記ブロックの各変換係数を逆量子化する際、オフセットとして使用される、請求項１～４の何れか１項に記載の方法又は請求項２～４の何れか１項に記載の装置。
ピクチャ内の符号化するブロックにアクセスすることと、
前記ブロックの量子化行列にアクセスすることと、
前記ブロックのブロックサイズ、色成分、及び予測モードに基づいて前記量子化行列の単一識別子を取得することと、
基準量子化行列を示すシンタックス要素を符号化することであって、前記シンタックス要素は、前記基準量子化行列の識別子と前記量子化行列の前記取得された識別子との間の差分を指定する、符号化することと、
前記量子化ブロックに応答して前記ブロックの変換係数を量子化することと、
前記量子化された変換係数をエントロピー符号化することと、
を含む方法。
１つ又は複数のプロセッサを備えた装置であって、前記１つ又は複数のプロセッサは、ピクチャ内の符号化するブロックにアクセスすることと、
前記ブロックの量子化行列にアクセスすることと、
前記ブロックのブロックサイズ、色成分、及び予測モードに基づいて前記量子化行列の単一識別子を取得することと、
基準量子化行列を示すシンタックス要素を符号化することであって、前記シンタックス要素は、前記基準量子化行列の識別子と前記量子化行列の前記取得された識別子との間の差分を指定する、符号化することと、
前記量子化行列に応答して前記ブロックの変換係数を量子化することと、
前記量子化された変換係数をエントロピー符号化することと、
を行うように構成される、装置。
前記ブロックのサイズは、前記基準量子化行列が量子化のために適用されるブロックのサイズと異なる、請求項６に記載の方法又は請求項７に記載の装置。
前記量子化行列の要素は、前記ブロックの各変換係数を量子化する際、スケーリングファクタとして使用される、請求項６若しくは８に記載の方法又は請求項７若しくは８に記載の装置。
前記量子化行列の要素は、前記ブロックの各変換係数を量子化する際、オフセットとして使用される、請求項６若しくは８に記載の方法又は請求項７若しくは８に記載の装置。
前記基準量子化行列は先にシグナリングされる、請求項１及び３～６の何れか１項に記載の方法又は請求項２～５及び７～１０の何れか１項に記載の装置。
前記量子化行列は、コピー又はデシメーションを通して前記基準量子化行列から取得される、請求項１、３～６、及び８～１１の何れか１項に記載の方法又は請求項２～５及び７～１１の何れか１項に記載の装置。
前記量子化行列は、前記量子化行列が前記基準量子化行列と同じサイズを有することに応答して、コピーを通して前記基準量子化行列から取得される、請求項１２に記載の方法又は請求項１２に記載の装置。
前記量子化行列は、前記量子化行列が前記基準量子化行列と異なるサイズを有することに応答して、対応する比率によるデシメーションを通して前記基準量子化行列から取得される、請求項１２に記載の方法又は請求項１２に記載の装置。
前記ブロックサイズはＭ×Ｎであり、ここで、Ｍは幅であり、Ｎは高さであり、前記ブロックの前記識別子は、ｍａｘ（Ｍ，Ｎ）のサイズに基づき、ｍａｘ（Ｍ，Ｎ）はＭ及びＮの大きい方として定義される、請求項１、３～６、及び８～１４の何れか１項に記載の方法又は請求項２～５及び７～１４の何れか１項に記載の装置。
１組の量子化行列が、識別子の増大順にシグナリングされ、最大ブロックサイズの量子化行列が最初にシグナリングされる、請求項１、３～６、及び８～１５の何れか１項に記載の方法又は請求項２～５及び７～１５の何れか１項に記載の装置。
前記１組の量子化行列をシグナリングする際、輝度色成分の量子化行列は、クロマ色成分の量子化行列の前にシグナリングされる、請求項１６に記載の方法又は請求項１６に記載の装置。
前記１組の量子化行列をシグナリングする際、より大きなブロックサイズの量子化行列は、より小さなブロックサイズの量子化行列の前にシグナリングされる、請求項１、３～６、及び８～１７の何れか１項に記載の方法又は請求項２～５及び７～１７の何れか１項に記載の装置。
前記識別子は、matrixId=N^*sizeId+matrixTypeIdとして導出され、式中、Ｎは可能なタイプ識別子の数であり、ｓｉｚｅＩＤは前記ブロックサイズを示し、matrixTypeIdは前記色成分及び前記予測モードを示す、請求項１、３～６、及び８～１８の何れか１項に記載の方法又は請求項２～５及び７～１８の何れか１項に記載の装置。
前記１つ又は複数のプロセッサは、前記ブロックサイズへの前記基準量子化行列の適合を実行するようにさらに構成される、請求項１、３～６、及び８～１９の何れか１項に記載の方法又は請求項２～５及び７～１９の何れか１項に記載の装置。
前記１つ又は複数のプロセッサは、デフォルトクロマフォーマットと異なる前記ブロックのクロマフォーマットに、前記ブロックの前記クロマフォーマットへの前記基準量子化行列の適合を実行するようにさらに構成される、請求項１、３～６、及び８～２０の何れか１項に記載の方法又は請求項２～５及び７～２０の何れか１項に記載の装置。
前記デフォルトクロマフォーマットは４：２：０である、請求項２０に記載の方法又は請求項２０に記載の装置。
前記適合は、前記量子化行列内のｘ及びｙ座標の前記基準量子化行列のインデックス係数へのビットシフトに基づく、請求項２０～２２の何れか１項に記載の方法又は請求項２０～２２の何れか１項に記載の装置。
前記識別子は、前記ブロックの前記予測モードがイントラ予測モードであるか、それともインター予測モードであるかに基づいて取得される、請求項１、３～６、及び８～２３の何れか１項に記載の方法又は請求項２～５及び７～２３の何れか１項に記載の装置。
イントラブロックコピー予測モードは、前記識別子を取得する際、インター予測モードとして見なされる、請求項１、３～６、及び８～２４の何れか１項に記載の方法又は請求項２～５及び７～２４の何れか１項に記載の装置。
前記予測モードはイントラブロックコピーであり、量子化行列は前記ブロックの輝度成分についてシグナリングされ、クロマ成分の量子化行列は、前記予測モードをインター予測モードとして解釈することにより導出される、請求項１、３～６、及び８～２５の何れか１項に記載の方法又は請求項２～５及び７～２５の何れか１項に記載の装置。
前記予測モードはイントラブロックコピーであり、前記基準量子化行列は、前記予測モードをイントラモードとして見なすことにより取得され、別の基準量子化行列が、前記予測モードをインターモードとして見なすことにより取得され、前記量子化行列は、前記基準量子化行列と前記別の基準量子化行列との平均として取得される、請求項１、３～６、及び８～２６の何れか１項に記載の方法又は請求項２～５及び７～２６の何れか１項に記載の装置。
請求項６及び８～２７の何れか１項に記載の方法を実行することによって形成される符号化ビデオを含む信号。
請求項１、３～６、及び８～２７の何れか１項に記載の方法によりビデオデータを符号化又は復号化する命令を記憶したコンピュータ可読記憶媒体。