JP2022549773A - 映像データの可逆符号化 - Google Patents

映像データの可逆符号化 Download PDF

Info

Publication number
JP2022549773A
JP2022549773A JP2022516282A JP2022516282A JP2022549773A JP 2022549773 A JP2022549773 A JP 2022549773A JP 2022516282 A JP2022516282 A JP 2022516282A JP 2022516282 A JP2022516282 A JP 2022516282A JP 2022549773 A JP2022549773 A JP 2022549773A
Authority
JP
Japan
Prior art keywords
flag
coding
control information
transform
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022516282A
Other languages
English (en)
Other versions
JPWO2021061318A5 (ja
Inventor
サーヴァー,モハメッド,ゴラム
ルオ,ジャンコン
イエ,ヤン
Original Assignee
アリババ グループ ホウルディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホウルディング リミテッド filed Critical アリババ グループ ホウルディング リミテッド
Publication of JP2022549773A publication Critical patent/JP2022549773A/ja
Publication of JPWO2021061318A5 publication Critical patent/JPWO2021061318A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本開示は、映像データの残差符号化を行うためのシステム及び方法を提供する。特定の開示の実施形態によれば、方法は、映像シーケンスを符号化するための制御情報を受け取ることと、制御情報に基づいて、映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することとを含む。符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である。

Description

関連出願の相互参照
[0001] 本開示は、全体として本明細書に援用される、2019年9月23日に出願された米国仮特許出願第62/904,574号に対する優先権の利益を主張するものである。
技術分野
[0002] 本開示は、概して、映像処理に関し、特に、映像データの可逆符号化を行い、及び可逆符号化のための残差符号化技術を選択するための方法及び装置に関する。
背景
[0003] 映像は、視覚情報を捕捉する一連の静止ピクチャ(又は「フレーム」)である。記憶メモリ及び伝送帯域幅を減少させるために、映像は、記憶又は伝送前に圧縮され、表示前に復元され得る。圧縮プロセスは、通常、エンコーディングと呼ばれ、復元プロセスは、通常、デコーディングと呼ばれる。最も一般的には、予測、変換、量子化、エントロピー符号化及びインループフィルタリングに基づく、標準化映像符号化技術を用いる様々な映像符号化フォーマットが存在する。特定の映像符号化フォーマットを指定する、HEVC(High Efficiency Video Coding)/H.265標準規格、VVC(Versatile Video Coding)/H.266標準規格、AVS標準規格などの映像符号化標準規格が、標準化機関によって開発されている。一層高度な映像符号化技術が、映像標準規格に採用されるにつれて、新しい映像符号化標準規格の符号化効率は、一層高くなる。
開示の概要
[0004] 本開示の実施形態は、映像シーケンスを符号化するための制御情報を受け取ることと、制御情報に基づいて、映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することであって、符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である、決定することとを含む残差符号化方法を提供する。
[0005] 本開示の実施形態は、残差符号化で映像信号を処理するためのシステムも提供する。システムは、命令セットを保存するためのメモリと、少なくとも1つのプロセッサとを含み、少なくとも1つのプロセッサは、映像シーケンスを符号化するための制御情報を受け取ることと、制御情報に基づいて、映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することであって、符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である、決定することとをシステムに行わせるように、命令セットを実行するように構成される。
[0006] 本開示の実施形態は、コンピュータシステムの少なくとも1つのプロセッサによって実行可能な命令を保存する非一時的コンピュータ可読媒体であって、命令の実行は、映像シーケンスを符号化するための制御情報を受け取ることと、制御情報に基づいて、映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することであって、符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である、決定することとを含む方法をコンピュータシステムに行わせる、非一時的コンピュータ可読媒体も提供する。
図面の簡単な説明
[0007] 本開示の実施形態及び様々な態様は、以下の詳細な説明及び添付の図面に示される。図面に示される様々な特徴は、一定の縮尺で描かれていない。
[0008]本開示の実施形態と一致した例示的映像シーケンスの構造を示す。 [0009]本開示の実施形態と一致した、ハイブリッド映像符号化システムの例示的エンコーディングプロセスの概略図を示す。 [0010]本開示の実施形態と一致した、ハイブリッド映像符号化システムの別の例示的エンコーディングプロセスの概略図を示す。 [0011]本開示の実施形態と一致した、ハイブリッド映像符号化システムの例示的デコーディングプロセスの概略図を示す。 [0012]本開示の実施形態と一致した、ハイブリッド映像符号化システムの別の例示的デコーディングプロセスの概略図を示す。 [0013]本開示の実施形態と一致した、映像をエンコード又はデコードするための例示的装置のブロック図である。 [0014]本開示の実施形態と一致した、例示的変換ユニットシンタックスを示す。 [0015]本開示の実施形態と一致した、sps_bdpcm_transform_residual_coding_flagを使用するための例示的SPSシンタックスを示す。 [0016]本開示の実施形態と一致した、例示的スライスヘッダシンタックスを示す。 [0017]本開示の実施形態と一致した、例示的変換ブロックシンタックスを示す。 [0018]本開示の実施形態と一致した、例示的変換残差符号化シンタックスを示す。 [0018]本開示の実施形態と一致した、例示的変換残差符号化シンタックスを示す。 [0018]本開示の実施形態と一致した、例示的変換残差符号化シンタックスを示す。 [0018]本開示の実施形態と一致した、例示的変換残差符号化シンタックスを示す。 [0018]本開示の実施形態と一致した、例示的変換残差符号化シンタックスを示す。 [0019]本開示の実施形態と一致した、残差符号化で映像信号を処理するための例示的コンピュータ実施方法のフローチャートである。
詳細な説明
[0020] ここで、例が添付の図面に示される例示的実施形態に詳細に言及する。以下の説明は、別段の記載のない限り、異なる図面の同じ番号が同じ又は類似の要素を表す、添付の図面を参照する。例示的実施形態の以下の説明に記載する実装形態は、本発明と一致した全ての実装形態を表すわけではない。代わりに、それらは、添付の特許請求の範囲に記載される本発明に関連する態様と一致した装置及び方法の例に過ぎない。特に別段の記載のない限り、「又は」という用語は、実行不可能でない限り、全ての可能な組み合わせを網羅する。例えば、コンポーネントがA又はBを含み得ると記載される場合、特に別段の記載のない限り又は実行不可能でない限り、コンポーネントは、A、又はB、又はA及びBを含み得る。第2の例として、コンポーネントがA、B又はCを含み得ると記載される場合、特に別段の記載のない限り又は実行不可能でない限り、コンポーネントは、A、又はB、又はC、又はA及びB、又はA及びC、又はB及びC、又はA及びB及びCを含み得る。
[0021] 映像符号化システムは、例えば、消費される記憶空間を減らすか、又はデジタル映像信号に関連する伝送帯域幅の消費を減らすために、デジタル映像信号を圧縮するために使用されることが多い。オンライン映像ストリーミング、ビデオ会議又は映像モニタリングなどの映像圧縮の様々な適用において人気を得ている(例えば、1920×1080ピクセルの解像度を有する)高精細(HD)映像では、映像データの圧縮効率を向上させることが可能な映像符号化ツールを開発する継続的な必要性がある。
[0022] 例えば、映像モニタリング適用は、多くの適用状況(例えば、セキュリティ、交通又は環境モニタリングなど)において、一層及び広範囲に使用されており、モニタリングデバイスの数及び解像度は、急速に増大し続けている。多くの映像モニタリング適用状況は、より多くの情報を捕捉するためにHD映像をユーザに提供することを好み、HD映像は、より多くの情報を捕捉するために、1フレーム当たりでより多くのピクセルを有する。しかしながら、HD映像ビットストリームは、伝送のための高帯域幅及び記憶のための大きい空間を要求する高ビットレートを有し得る。例えば、平均1920×1080解像度を有するモニタリング映像ストリームは、リアルタイム伝送のために4Mbpsもの帯域幅を必要とし得る。また、映像モニタリングは、一般に、継続的に7×24をモニタリングし、これは、映像データが保存される場合、記憶システムにとって大きい課題となり得る。したがって、HD映像の高帯域幅及び大容量記憶に対する要求は、映像モニタリングにおける大規模展開に対する主な制限となっている。
[0023] 映像は、視覚情報を保存するために時系列で配置された一連の静止ピクチャ(又は「フレーム」)である。映像キャプチャデバイス(例えば、カメラ)を使用して、これらのピクチャを時系列で捕捉及び保存することができ、映像再生デバイス(例えば、テレビ、コンピュータ、スマートフォン、タブレットコンピュータ、ビデオプレーヤー又は表示機能を備えた任意のエンドユーザ端末)を使用して、このようなピクチャを時系列で表示することができる。また、用途によっては、監視、会議の開催又は生放送などのために、映像キャプチャデバイスは、捕捉された映像を映像再生デバイス(例えば、モニタを備えたコンピュータ)にリアルタイムで伝送することができる。
[0024] このような用途で必要とされる記憶空間及び伝送帯域幅を減少させるために、映像は、記憶及び伝送前に圧縮され、表示前に復元され得る。圧縮及び復元は、プロセッサ(例えば、汎用コンピュータのプロセッサ)又は専用ハードウェアによって実行されるソフトウェアによって実施され得る。圧縮のためのモジュールは、一般に「エンコーダ」と呼ばれ、復元のためのモジュールは、一般に「デコーダ」と呼ばれる。エンコーダ及びデコーダは、まとめて「コーデック」と呼ばれることがある。エンコーダ及びデコーダは、様々な適切なハードウェア、ソフトウェア又はこれらの組み合わせの何れかとして実装され得る。例えば、エンコーダ及びデコーダのハードウェア実装は、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、離散論理又はこれらの任意の組み合わせなどの回路網を含み得る。エンコーダ及びデコーダのソフトウェア実装は、プログラムコード、コンピュータ実行可能命令、ファームウェア又はコンピュータ可読媒体に固定された、任意の適切なコンピュータ実施アルゴリズム若しくはプロセスを含み得る。映像圧縮及び復元は、MPEG-1、MPEG-2、MPEG-4、H.26x系などの様々なアルゴリズム又は標準規格によって実施され得る。用途によっては、コーデックが、第1の符号化標準規格から映像を復元し、第2の符号化標準規格を用いて復元映像を再圧縮することができ、この場合、コーデックは、「トランスコーダ」と呼ばれることがある。
[0025] 映像エンコーディングプロセスは、ピクチャの再構成のために使用することができる有用な情報を識別及び保持し、再構成にとって重要ではない情報を無視することができる。無視された重要ではない情報を完全に再構成することができない場合、このようなエンコーディングプロセスは、「不可逆」と呼ばれることがある。そうでなければ、それは、「可逆」と呼ばれることがある。ほとんどのエンコーディングプロセスは、不可逆であり、これは、必要とされる記憶空間及び伝送帯域幅を減少させるためのトレードオフである。
[0026] エンコードされているピクチャ(「現在のピクチャ」と呼ぶ)の有用な情報は、参照ピクチャ(例えば、前にエンコードされ、及び再構成されたピクチャ)に対する変化を含む。このような変化は、ピクセルの位置変化、輝度変化又は色変化を含む場合があり、中でも、位置変化は、最も重要である。物体を表すピクセル群の位置変化は、参照ピクチャ及び現在のピクチャ間の物体の動きを反映し得る。
[0027] 別のピクチャを参照することなく符号化されたピクチャ(すなわち、それは、それ自体の参照ピクチャである)は、「Iピクチャ」と呼ばれる。前のピクチャを参照ピクチャとして使用して符号化されたピクチャは、「Pピクチャ」と呼ばれる。前のピクチャ及び未来のピクチャの両方を参照ピクチャとして使用して(すなわち、参照が「双方向」である)符号化されたピクチャは、「Bピクチャ」と呼ばれる。
[0028] 先述の通り、HD映像を使用する映像モニタリングは、高帯域幅及び大容量記憶の要求の課題に直面する。このような課題に対処するために、エンコード映像のビットレートを減少させることができる。Iピクチャ、Pピクチャ及びBピクチャの中で、Iピクチャは、最も高いビットレートを有する。ほとんどのモニタリング映像の背景は、ほぼ静止しているため、エンコード映像の総ビットレートを減少させる方法の1つは、映像エンコーディングのために、より少ない数のIピクチャを使用することであり得る。
[0029] しかしながら、より少ないIピクチャを使用するという改良は、一般的にエンコード映像においてIピクチャの割合は小さいため、ささいなものとなり得る。例えば、一般的な映像ビットストリームにおいて、Iピクチャ、Bピクチャ及びPピクチャの比率は、1:20:9の場合があり、この場合、Iピクチャは、総ビットレートの10%未満を占め得る。すなわち、このような例では、全てのIピクチャを除去した場合でも、減少したビットレートは、10%以下となり得る。
[0030] 図1は、本開示の実施形態と一致する、映像シーケンス例100の構造を示す。映像シーケンス100は、ライブ映像又は捕捉及びアーカイブされた映像であり得る。映像100は、実際の映像、コンピュータ生成された映像(例えば、コンピュータゲーム映像)又はそれらの組み合わせ(例えば、拡張現実効果を有した実際の映像)であり得る。映像シーケンス100は、映像キャプチャデバイス(例えば、カメラ)、前に捕捉された映像を包含する映像アーカイブ(例えば、記憶デバイスに保存された映像ファイル)又は映像コンテンツプロバイダから映像を受信するための映像フィードインタフェース(例えば、映像ブロードキャストトランシーバ)から入力され得る。
[0031] 図1に示されるように、映像シーケンス100は、ピクチャ102、104、106及び108を含む、タイムラインに沿って時間的に配置された一連のピクチャを含み得る。ピクチャ102~106は連続しており、ピクチャ106と108との間には、さらに多くのピクチャが存在する。図1では、ピクチャ102は、Iピクチャであり、その参照ピクチャは、ピクチャ102自体である。ピクチャ104は、Pピクチャであり、その参照ピクチャは、矢印によって示されるように、ピクチャ102である。ピクチャ106は、Bピクチャであり、その参照ピクチャは、矢印によって示されるように、ピクチャ104及び108である。幾つかの実施形態では、あるピクチャ(例えば、ピクチャ104)の参照ピクチャは、そのピクチャの直前又は直後に存在しなくてもよい。例えば、ピクチャ104の参照ピクチャは、ピクチャ102に先行するピクチャであり得る。ピクチャ102~106の参照ピクチャは単なる例であり、本開示は、参照ピクチャの実施形態を図1に示される例のように限定しないことに留意されたい。
[0032] 一般的に、映像コーデックは、ピクチャ全体のエンコーディング又はデコーディングを、そのようなタスクの計算の複雑さゆえに、一度に行わない。より正確に言えば、それらは、ピクチャを基本セグメントに分割し、セグメントごとにピクチャをエンコード又はデコードし得る。このような基本セグメントは、本開示では、基本処理ユニット(「BPU」)と呼ばれる。例えば、図1の構造110は、映像シーケンス100のあるピクチャ(例えば、ピクチャ102~108の何れか)の構造例を示す。構造110では、ピクチャは、4×4の基本処理ユニットに分割され、それらの境界は、破線で示されている。幾つかの実施形態では、基本処理ユニットは、一部の映像符号化標準規格(例えば、MPEG系統、H.261、H.263若しくはH.264/AVC)では「マクロブロック」と呼ばれることがあるか、又は一部の他の映像符号化標準規格(例えば、H.265/HEVC若しくはH.266/VVC)では、「符号化ツリーユニット」(「CTU」)と呼ばれることがある。基本処理ユニットは、ピクチャにおいて、128×128、64×64、32×32、16×16、4×8、16×32又はピクセルの任意の形状及びサイズなどの可変サイズを有し得る。基本処理ユニットのサイズ及び形状は、符号化効率と、基本処理ユニットにおいて維持されるべき詳細のレベルとのバランスに基づいて、ピクチャごとに選択することができる。
[0033] 基本処理ユニットは、コンピュータメモリに(例えば、映像フレームバッファに)保存された異なる複数のタイプの映像データの群を含み得る論理ユニットであり得る。例えば、カラーピクチャの基本処理ユニットは、無彩色の明度情報を表すルマ成分(Y)、色情報を表す1つ又は複数のクロマ成分(例えば、Cb及びCr)並びに関連のシンタックス要素を含み得る(ここで、ルマ成分及びクロマ成分は、同じサイズの基本処理ユニットを有し得る)。ルマ成分及びクロマ成分は、一部の映像符号化標準規格(例えば、H.265/HEVC又はH.266/VVC)では、「符号化ツリーブロック」(「CTB」)と呼ばれることがある。基本処理ユニットに対して行われるどのような演算も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。
[0034] 映像符号化は、複数の演算ステージを有し、これらの例を図2A~2B及び3A~3Bに詳細に示す。各ステージで、基本処理ユニットのサイズが、処理するにはまだ大き過ぎる場合があり、したがって、本開示では「基本処理サブユニット」と呼ばれるセグメントへとさらに分割され得る。幾つかの実施形態では、基本処理サブユニットは、一部の映像符号化標準規格(例えば、MPEG系統、H.261、H.263若しくはH.264/AVC)では「ブロック」と呼ばれることがあるか、又は一部の他の映像符号化標準規格(例えば、H.265/HEVC若しくはH.266/VVC)では、「符号化ユニット」(「CU」)と呼ばれることがある。基本処理サブユニットは、基本処理ユニットと同じ又はより小さいサイズを有し得る。基本処理ユニットと同様に、基本処理サブユニットも、コンピュータメモリに(例えば、映像フレームバッファに)保存された異なる複数のタイプの映像データ(例えば、Y、Cb、Cr及び関連のシンタックス要素)の群を含み得る論理ユニットである。基本処理サブユニットに対して行われるどのような演算も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。このような分割は、処理のニーズに応じてさらなるレベルに対して行われ得ることに留意されたい。異なるステージが異なるスキームを用いて基本処理ユニットを分割し得ることにも留意されたい。
[0035] 例えば、モード決定ステージ(その一例を図2Bに詳細に示す)において、エンコーダは、基本処理ユニットに対してどの予測モード(例えば、ピクチャ内予測又はピクチャ間予測)を使用すべきかを決定することができ、基本処理ユニットは、このような決定を下すには大き過ぎる場合がある。エンコーダは、基本処理ユニットを複数の基本処理サブユニット(例えば、H.265/HEVC又はH.266/VVCの場合のCU)に分割し、及び個々の基本処理サブユニットごとに予測タイプを決定することができる。
[0036] 別の例として、予測ステージ(その一例を図2Aに詳細に示す)において、エンコーダは、基本処理サブユニット(例えば、CU)のレベルで予測演算を行うことができる。しかしながら、場合により、基本処理サブユニットは、処理するにはまだ大き過ぎる場合がある。エンコーダは、基本処理サブユニットを(例えば、H.265/HEVC又はH.266/VVCにおいて「予測ブロック」又は「PB」と呼ばれる)より小さいセグメントにさらに分割することができ、このセグメントのレベルで、予測演算を行うことができる。
[0037] 別の例として、変換ステージ(その一例を図2Aに詳細に示す)では、エンコーダは、残差基本処理サブユニット(例えば、CU)に対して変換演算を行うことができる。しかしながら、場合により、基本処理サブユニットは、処理するにはまだ大き過ぎる場合がある。エンコーダは、基本処理サブユニットを(例えば、H.265/HEVC又はH.266/VVCにおいて「変換ブロック」又は「TB」と呼ばれる)より小さいセグメントにさらに分割することができ、このセグメントのレベルで、変換演算を行うことができる。同じ基本処理サブユニットの分割スキームが予測ステージ及び変換ステージで異なり得ることに留意されたい。例えば、H.265/HEVC又はH.266/VVCでは、同じCUの予測ブロック及び変換ブロックが異なるサイズ及び数を有し得る。
[0038] 図1の構造110では、基本処理ユニット112は、3×3の基本処理サブユニットにさらに分割され、それらの境界は、点線で示される。同じピクチャの異なる基本処理ユニットが、異なるスキームで基本処理サブユニットに分割され得る。
[0039] 幾つかの実装形態では、並列処理能力並びに映像エンコーディング及びデコーディングに対する誤り耐性を提供するために、ピクチャの領域ごとに、エンコーディング又はデコーディングプロセスがピクチャの他のどの領域からの情報にも依存しないことが可能であるように、ピクチャは、処理のために複数の領域に分割され得る。すなわち、ピクチャの各領域は、独立して処理することができる。そうすることで、コーデックは、ピクチャの異なる複数の領域を並列に処理することができ、したがって、符号化効率が向上される。また、ある領域のデータが処理時に壊れた場合又はネットワーク伝送時に失われた場合、コーデックは、壊れたデータ又は失われたデータに依存することなく、同じピクチャの他の領域を正確にエンコード又はデコードすることができ、したがって、誤り耐性能力が提供される。一部の映像符号化標準規格では、ピクチャは、異なる複数のタイプの領域に分割することができる。例えば、H.265/HEVC及びH.266/VVCは、2つの領域タイプ:「スライス」及び「タイル」を提供する。映像シーケンス100の異なる複数のピクチャが、ピクチャを領域に分割するための異なるパーティションスキームを有し得ることにも留意されたい。
[0040] 例えば、図1において、構造110は、3つの領域114、116及び118に分割され、それらの境界は、構造110内の実線として示されている。領域114は、4つの基本処理ユニットを含む。領域116及び118のそれぞれは、6つの基本処理ユニットを含む。図1の構造110の基本処理ユニット、基本処理サブユニット及び領域は、単なる例であり、本開示は、それらの実施形態を限定しないことに留意されたい。
[0041] 図2Aは、本開示の実施形態と一致したエンコーディングプロセス例200Aの概略図を示す。例えば、エンコーディングプロセス200Aは、エンコーダによって行うことができる。図2Aに示されるように、エンコーダは、プロセス200Aに従って、映像シーケンス202を映像ビットストリーム228へとエンコードすることができる。図1の映像シーケンス100と同様に、映像シーケンス202は、時間的順序で配置されたピクチャ(「オリジナルピクチャ」と呼ぶ)のセットを含み得る。図1の構造110と同様に、映像シーケンス202の各オリジナルピクチャは、エンコーダにより、基本処理ユニット、基本処理サブユニット又は処理のための領域に分割することができる。幾つかの実施形態では、エンコーダは、映像シーケンス202のオリジナルピクチャごとに、基本処理ユニットのレベルでプロセス200Aを行うことができる。例えば、エンコーダは、反復的方法でプロセス200Aを行い得、プロセス200Aの1回の反復で1つの基本処理ユニットをエンコードすることができる。幾つかの実施形態では、エンコーダは、映像シーケンス202の各オリジナルピクチャの領域(例えば、領域114~118)に対してプロセス200Aを並列に行うことができる。
[0042] 図2Aでは、エンコーダは、予測データ206及び予測BPU208を生成するために、映像シーケンス202のオリジナルピクチャの基本処理ユニット(「オリジナルBPU」と呼ばれる)を予測ステージ204に送ることができる。エンコーダは、オリジナルBPUから予測BPU208を減算することにより、残差BPU210を生成することができる。エンコーダは、量子化変換係数216を生成するために、残差BPU210を変換ステージ212及び量子化ステージ214に送ることができる。エンコーダは、映像ビットストリーム228を生成するために、予測データ206及び量子化変換係数216を二進符号化ステージ226に送ることができる。コンポーネント202、204、206、208、210、212、214、216、226及び228は、「順方向経路」と呼ばれることがある。プロセス200A中に、エンコーダは、量子化ステージ214後、再構成残差BPU222を生成するために、量子化変換係数216を逆量子化ステージ218及び逆変換ステージ220に送ることができる。エンコーダは、再構成残差BPU222を予測BPU208に加算することにより、プロセス200Aの次の反復のために予測ステージ204において使用される予測参照224を生成することができる。プロセス200Aのコンポーネント218、220、222及び224は、「再構成経路」と呼ばれることがある。再構成経路は、エンコーダ及びデコーダが共に予測のために同じ参照データを使用することを確実にするために使用することができる。
[0043] エンコーダは、(順方向経路において)オリジナルピクチャの各オリジナルBPUをエンコードし、及び(再構成経路において)オリジナルピクチャの次のオリジナルBPUをエンコードするための予測参照224を生成するために、反復的にプロセス200Aを行うことができる。オリジナルピクチャの全てのオリジナルBPUをエンコードした後、エンコーダは、映像シーケンス202の次のピクチャのエンコーディングに進むことができる。
[0044] プロセス200Aを参照すると、エンコーダは、映像キャプチャデバイス(例えば、カメラ)によって生成された映像シーケンス202を受け取ることができる。本明細書で使用される「受け取る」という用語は、受け取ること、入力すること、獲得すること、取り出すこと、取得すること、読み出すこと、アクセスすること又はデータを入力するためのあらゆる方法のあらゆるアクションを指し得る。
[0045] 予測ステージ204において、現在の反復では、エンコーダは、オリジナルBPU及び予測参照224を受け取ることができ、並びに予測データ206及び予測BPU208を生成するために予測演算を行うことができる。予測参照224は、プロセス200Aの前の反復の再構成経路から生成することができる。予測ステージ204の目的は、予測データ206を抽出することにより、情報の冗長性を減少させることであり、予測データ206は、予測データ206及び予測参照224から予測BPU208としてオリジナルBPUを再構成するために使用することができる。
[0046] 理想的には、予測BPU208は、オリジナルBPUと同一となり得る。しかしながら、非理想的な予測及び再構成演算により、予測BPU208は、一般に、オリジナルBPUとは僅かに異なる。このような差を記録するために、予測BPU208を生成した後、エンコーダは、それをオリジナルBPUから減算することにより、残差BPU210を生成することができる。例えば、エンコーダは、予測BPU208のピクセルの値(例えば、グレースケール値又はRGB値)をオリジナルBPUの対応するピクセルの値から減算することができる。残差BPU210の各ピクセルは、オリジナルBPU及び予測BPU208の対応するピクセル間のこのような減算の結果として残差値を有し得る。オリジナルBPUと比較して、予測データ206及び残差BPU210は、より少ないビットを有し得るが、それらを使用して、大きい品質の劣化なしにオリジナルBPUを再構成することができる。したがって、オリジナルBPUは、圧縮される。
[0047] 残差BPU210をさらに圧縮するために、変換ステージ212において、エンコーダは、それを2次元「基底パターン」のセットに分解する(各基底パターンは、「変換係数」に関連付けられる)ことにより、残差BPU210の空間冗長性を減少させることができる。基底パターンは、同じサイズ(例えば、残差BPU210のサイズ)を有し得る。各基底パターンは、残差BPU210の変動周波数(例えば、明度変動の周波数)成分を表し得る。どの基底パターンも、他の基底パターンの何れの結合(例えば、線形結合)からも再現することができない。すなわち、この分解は、残差BPU210の変動を周波数領域に分解することができる。このような分解は、関数の離散フーリエ変換に類似し、ここで、基底パターンは、離散フーリエ変換の基底関数(例えば、三角法関数)に類似し、変換係数は、基底関数に関連付けられた係数に類似する。
[0048] 異なる変換アルゴリズムは、異なる基底パターンを使用することができる。例えば、離散コサイン変換又は離散サイン変換などの様々な変換アルゴリズムを変換ステージ212において使用することができる。変換ステージ212における変換は、可逆である。すなわち、エンコーダは、(「逆変換」と呼ばれる)変換の逆演算によって残差BPU210を復元することができる。例えば、残差BPU210のピクセルを復元するために、逆変換は、基底パターンの対応するピクセルの値をそれぞれの関連付けられた係数で乗算すること及びそれらの積を加算することによって加重和を生成することであり得る。映像符号化標準規格のために、エンコーダ及びデコーダは共に、同じ変換アルゴリズム(したがって、同じ基底パターン)を使用することができる。したがって、エンコーダは、変換係数のみを記録することができ、デコーダは、基底パターンをエンコーダから受け取ることなく、変換係数から残差BPU210を再構成することができる。残差BPU210と比較して、変換係数は、より少ないビットを有し得るが、それらを使用して、大きい品質の劣化なしに残差BPU210を再構成することができる。したがって、残差BPU210は、さらに圧縮される。
[0049] エンコーダは、量子化ステージ214において変換係数をさらに圧縮することができる。変換プロセスにおいて、異なる基底パターンは、異なる変動周波数(例えば、明度変動周波数)を表し得る。人間の目は、一般に、低周波変動を認識することが得意であるため、エンコーダは、デコーディングにおいて大きい品質の劣化を生じさせることなく、高周波変動の情報を無視することができる。例えば、量子化ステージ214において、エンコーダは、各変換係数を(「量子化パラメータ」と呼ばれる)整数値で除算し、及びその商を最も近い整数に丸めることにより、量子化変換係数216を生成することができる。このような演算後、高周波基底パターンの幾つかの変換係数がゼロに変換され得、低周波基底パターンの変換係数が、より小さい整数に変換され得る。エンコーダは、ゼロ値の量子化変換係数216を無視することができ、それにより変換係数がさらに圧縮される。量子化プロセスも可逆であり、ここで、量子化変換係数216は、(「逆量子化」と呼ばれる)量子化の逆演算で変換係数に再構成され得る。
[0050] エンコーダは、丸め演算においてこのような除算の余りを無視するため、量子化ステージ214は、不可逆となり得る。一般的に、量子化ステージ214は、プロセス200Aにおいて、最も多くの情報損失に寄与し得る。情報損失が大きくなるほど、量子化変換係数216が必要とし得るビットが少なくなる。異なる情報損失レベルを得るために、エンコーダは、量子化パラメータ又は量子化プロセスの他のパラメータの異なる値を使用し得る。
[0051] 二進符号化ステージ226では、エンコーダは、例えば、エントロピー符号化、可変長符号化、算術符号化、ハフマン符号化、コンテキスト適応的二進算術符号化又は他の可逆若しくは不可逆圧縮アルゴリズムなどの二進符号化技術を使用して、予測データ206及び量子化変換係数216をエンコードすることができる。幾つかの実施形態では、予測データ206及び量子化変換係数216の他にも、エンコーダは、例えば、予測ステージ204で使用される予測モード、予測演算のパラメータ、変換ステージ212における変換タイプ、量子化プロセスのパラメータ(例えば、量子化パラメータ)又はエンコーダ制御パラメータ(例えば、ビットレート制御パラメータ)などの他の情報を二進符号化ステージ226においてエンコードすることができる。エンコーダは、二進符号化ステージ226の出力データを使用して、映像ビットストリーム228を生成することができる。幾つかの実施形態では、映像ビットストリーム228は、ネットワーク伝送のためにさらにパケット化され得る。
[0052] プロセス200Aの再構成経路を参照すると、逆量子化ステージ218において、エンコーダは、量子化変換係数216に対して逆量子化を行うことにより、再構成変換係数を生成することができる。逆変換ステージ220では、エンコーダは、再構成変換係数に基づいて、再構成残差BPU222を生成することができる。エンコーダは、再構成残差BPU222を予測BPU208に加算することにより、プロセス200Aの次の反復で使用される予測参照224を生成することができる。
[0053] 映像シーケンス202をエンコードするために、プロセス200Aの他のバリエーションが使用され得ることに留意されたい。幾つかの実施形態では、プロセス200Aのステージは、異なる順序でエンコーダによって行うことができる。幾つかの実施形態では、プロセス200Aの1つ又は複数のステージは、単一のステージに統合され得る。幾つかの実施形態では、プロセス200Aの単一のステージが複数のステージに分割され得る。例えば、変換ステージ212及び量子化ステージ214が単一のステージに統合され得る。幾つかの実施形態では、プロセス200Aは、さらなるステージを含み得る。幾つかの実施形態では、プロセス200Aは、図2Aの1つ又は複数のステージを省略し得る。
[0054] 図2Bは、本開示の実施形態と一致した別のエンコーディングプロセス例200Bの概略図を示す。プロセス200Bは、プロセス200Aから変更され得る。例えば、プロセス200Bは、ハイブリッド映像符号化標準規格(例えば、H.26x系)に準拠したエンコーダによって使用され得る。プロセス200Aと比較して、プロセス200Bの順方向経路は、モード決定ステージ230をさらに含み、予測ステージ204を空間予測ステージ2042及び時間予測ステージ2044に分割する。プロセス200Bの再構成経路は、ループフィルタステージ232及びバッファ234をさらに含む。
[0055] 一般に、予測技術は、2つのタイプ:空間予測及び時間予測に分類することができる。空間予測(例えば、ピクチャ内予測又は「イントラ予測」)は、同じピクチャ内の1つ又は複数の既に符号化された隣接BPUからのピクセルを使用することにより、現在のBPUを予測することができる。すなわち、空間予測における予測参照224は、隣接BPUを含み得る。空間予測は、ピクチャの固有の空間冗長性を減少させることができる。時間予測(例えば、ピクチャ間予測又は「インター予測」)は、1つ又は複数の既に符号化されたピクチャからの領域を使用することにより、現在のBPUを予測することができる。すなわち、時間予測における予測参照224は、符号化されたピクチャを含み得る。時間予測は、ピクチャの固有の時間冗長性を減少させることができる。
[0056] プロセス200Bを参照すると、順方向経路において、エンコーダは、空間予測ステージ2042及び時間予測ステージ2044において予測演算を行う。例えば、空間予測ステージ2042において、エンコーダは、イントラ予測を行うことができる。エンコードされているピクチャのオリジナルBPUに関して、予測参照224は、同じピクチャ内の(順方向経路において)エンコードされ、及び(再構成経路において)再構成された1つ又は複数の隣接BPUを含み得る。エンコーダは、隣接BPUを外挿することによって予測BPU208を生成することができる。外挿技術には、例えば、線形外挿若しくは補間又は多項式外挿若しくは補間などが含まれ得る。幾つかの実施形態では、エンコーダは、例えば予測BPU208のピクセルごとに、対応するピクセルの値を外挿することにより、ピクセルレベルで外挿を行い得る。外挿に使用される隣接BPUは、垂直方向(例えば、オリジナルBPUの上)、水平方向(例えば、オリジナルBPUの左)、対角線方向(例えば、オリジナルBPUの左下、右下、左上若しくは右上)又は使用した映像符号化標準規格において定義される任意の方向などの様々な方向からオリジナルBPUに対して位置し得る。イントラ予測の場合、予測データ206は、例えば、使用された隣接BPUの場所(例えば、座標)、使用された隣接BPUのサイズ、外挿のパラメータ又はオリジナルBPUに対する使用された隣接BPUの方向などを含み得る。
[0057] 別の例として、時間予測ステージ2044では、エンコーダは、インター予測を行うことができる。現在のピクチャのオリジナルBPUに関して、予測参照224は、(順方向経路において)エンコードされ、及び(再構成経路において)再構成された1つ又は複数のピクチャ(「参照ピクチャ」と呼ばれる)を含み得る。幾つかの実施形態では、参照ピクチャは、BPUごとにエンコードされ、及び再構成され得る。例えば、エンコーダは、再構成残差BPU222を予測BPU208に加算することにより、再構成BPUを生成することができる。同じピクチャの全ての再構成BPUが生成されると、エンコーダは、参照ピクチャとして再構成ピクチャを生成することができる。エンコーダは、参照ピクチャの(「探索窓」と呼ばれる)範囲内のマッチング領域を探索するために、「動き推定」の演算を行い得る。参照ピクチャにおける探索窓の場所は、現在のピクチャにおけるオリジナルBPUの場所に基づいて決定することができる。例えば、探索窓は、参照ピクチャ内において、現在のピクチャのオリジナルBPUと同じ座標を有する場所を中心とし得、所定の距離だけ外に延在され得る。エンコーダが(例えば、ペル再帰アルゴリズム又はブロックマッチングアルゴリズムなどを使用して)探索窓内のオリジナルBPUに類似した領域を識別すると、エンコーダは、そのような領域をマッチング領域として決定することができる。マッチング領域は、オリジナルBPUとは異なる寸法(例えば、より小さい、等しい、より大きい又は異なる形状)を有し得る。参照ピクチャ及び現在のピクチャは、(例えば図1に示されるように)タイムラインにおいて時間的に分離されるため、時間が経過するにつれて、マッチング領域がオリジナルBPUの場所に「移動する」と見なすことができる。エンコーダは、そのような動きの方向及び距離を「動きベクトル」として記録し得る。(例えば、図1のピクチャ106のように)複数の参照ピクチャが使用される場合、エンコーダは、参照ピクチャごとに、マッチング領域を探索し、それに関連付けられた動きベクトルを決定することができる。幾つかの実施形態では、エンコーダは、それぞれのマッチング参照ピクチャのマッチング領域のピクセル値に重みを割り当てることができる。
[0058] 動き推定を使用して、例えば、平行移動、回転又はズーミングなどの様々なタイプの動きを識別することができる。インター予測の場合、予測データ206は、例えば、マッチング領域の場所(例えば、座標)、マッチング領域に関連付けられた動きベクトル、参照ピクチャの数又は参照ピクチャに関連付けられた重みを含み得る。
[0059] 予測BPU208を生成するために、エンコーダは、「動き補償」の演算を行い得る。動き補償を用いて、予測データ206(例えば、動きベクトル)及び予測参照224に基づいて予測BPU208を再構成することができる。例えば、エンコーダは、エンコーダが現在のピクチャのオリジナルBPUを予測することができる動きベクトルに従って、参照ピクチャのマッチング領域を移動させることができる。(例えば、図1のピクチャ106のように)複数の参照ピクチャが使用される場合、エンコーダは、それぞれの動きベクトルに従って参照ピクチャのマッチング領域を移動させ、及びマッチング領域のピクセル値を平均することができる。幾つかの実施形態では、エンコーダがそれぞれのマッチング参照ピクチャのマッチング領域のピクセル値に重みを割り当てた場合、エンコーダは、移動されたマッチング領域のピクセル値の加重和を加えることができる。
[0060] 幾つかの実施形態では、インター予測は、単方向又は双方向であり得る。単方向インター予測は、現在のピクチャに対して同じ時間方向の1つ又は複数の参照ピクチャを使用し得る。例えば、図1のピクチャ104は、参照ピクチャ(例えば、ピクチャ102)がピクチャ104に先行する単方向インター予測ピクチャである。双方向インター予測は、現在のピクチャに対して両時間方向にある1つ又は複数の参照ピクチャを使用し得る。例えば、図1のピクチャ106は、参照ピクチャ(すなわち、ピクチャ104及び108)がピクチャ104に対して両時間方向にある双方向インター予測ピクチャである。
[0061] プロセス200Bの順方向経路をさらに参照すると、空間予測2042及び時間予測ステージ2044後、モード決定ステージ230において、エンコーダは、プロセス200Bの現在の反復に関する予測モード(例えば、イントラ予測又はインター予測の一方)を選択することができる。例えば、エンコーダは、レート歪み最適化技術を行うことができ、かかる技術では、エンコーダは、候補予測モードのビットレート及び上記候補予測モード下の再構成参照ピクチャの歪みに応じて、コスト関数の値を最小にするために予測モードを選択することができる。選択された予測モードに応じて、エンコーダは、対応する予測BPU208及び予測データ206を生成することができる。
[0062] プロセス200Bの再構成経路では、順方向経路においてイントラ予測モードが選択されていた場合、予測参照224(例えば、現在のピクチャ内でエンコードされ、及び再構成された現在のBPU)の生成後、エンコーダは、(例えば、現在のピクチャの次のBPUの外挿のために)後で使用するために、予測参照224を空間予測ステージ2042に直接送ることができる。順方向経路においてインター予測モードが選択されていた場合、予測参照224(例えば、全てのBPUがエンコードされ、及び再構成された現在のピクチャ)の生成後、エンコーダは、ループフィルタステージ232に予測参照224を送ることができ、ループフィルタステージ232では、エンコーダは、インター予測によって導入される歪み(例えば、ブロッキングアーチファクト)を低減又は無くすためにループフィルタを予測参照224に適用することができる。エンコーダは、ループフィルタステージ232において、例えば、非ブロック化、サンプル適応オフセット又は適応ループフィルタなどの様々なループフィルタ技術を適用することができる。ループフィルタリングが行われた参照ピクチャは、後に使用するために(例えば、映像シーケンス202の未来ピクチャのためのインター予測参照ピクチャとして使用されるように)、バッファ234(又は「デコードピクチャバッファ」)に保存され得る。エンコーダは、時間予測ステージ2044で使用される1つ又は複数の参照ピクチャをバッファ234に保存し得る。幾つかの実施形態では、エンコーダは、量子化変換係数216、予測データ206及び他の情報と共に、ループフィルタのパラメータ(例えば、ループフィルタ強度)を二進符号化ステージ226においてエンコードし得る。
[0063] 図3Aは、本開示の実施形態と一致したデコーディングプロセス例300Aの概略図を示す。プロセス300Aは、図2Aの圧縮プロセス200Aに対応する解凍プロセスであり得る。幾つかの実施形態では、プロセス300Aは、プロセス200Aの再構成経路に類似し得る。デコーダは、プロセス300Aに従って、映像ビットストリーム228を映像ストリーム304へとデコードすることができる。映像ストリーム304は、映像シーケンス202に非常に類似し得る。しかしながら、圧縮及び解凍プロセス(例えば、図2A~2Bの量子化ステージ214)における情報損失により、一般に、映像ストリーム304は、映像シーケンス202と同一ではない。図2A~2Bのプロセス200A及び200Bと同様に、デコーダは、映像ビットストリーム228においてエンコードされたピクチャごとに、基本処理ユニット(BPU)のレベルでプロセス300Aを行うことができる。例えば、デコーダは、プロセス300Aの1回の反復でデコーダが1つの基本処理ユニットをデコードすることができる反復的方法でプロセス300Aを行い得る。幾つかの実施形態では、デコーダは、映像ビットストリーム228においてエンコードされた各ピクチャの領域(例えば、領域114~118)に対してプロセス300Aを並行して行うことができる。
[0064] 図3Aでは、デコーダは、エンコードされたピクチャの基本処理ユニット(「エンコードBPU」と呼ばれる)に関連付けられた映像ビットストリーム228の部分を二進デコーディングステージ302に送ることができる。二進デコーディングステージ302では、デコーダは、上記部分を予測データ206及び量子化変換係数216へとデコードすることができる。デコーダは、再構成残差BPU222を生成するために、量子化変換係数216を逆量子化ステージ218及び逆変換ステージ220に送ることができる。デコーダは、予測BPU208を生成するために、予測データ206を予測ステージ204に送ることができる。デコーダは、再構成残差BPU222を予測BPU208に加算することにより、予測参照224を生成することができる。幾つかの実施形態では、予測参照224は、バッファ(例えば、コンピュータメモリのデコードピクチャバッファ)に保存することができる。デコーダは、プロセス300Aの次の反復において予測演算を行うための予測ステージ204に予測参照224を送ることができる。
[0065] デコーダは、エンコードされたピクチャの各エンコードBPUをデコードし、及びエンコードされたピクチャの次のエンコードBPUをエンコードするための予測参照224を生成するために、プロセス300Aを反復して行うことができる。エンコードされたピクチャの全てのエンコードBPUのデコーディング後、デコーダは、表示のために上記ピクチャを映像ストリーム304に出力し、映像ビットストリーム228の次のエンコードされたピクチャのデコーディングに進み得る。
[0066] 二進デコーディングステージ302では、デコーダは、エンコーダによって使用された二進符号化技術(例えば、エントロピー符号化、可変長符号化、算術符号化、ハフマン符号化、コンテキスト適応的二進算術符号化又は他の可逆圧縮アルゴリズム)の逆演算を行うことができる。幾つかの実施形態では、予測データ206及び量子化変換係数216の他にも、デコーダは、例えば、予測モード、予測演算のパラメータ、変換タイプ、量子化プロセスのパラメータ(例えば、量子化パラメータ)又はエンコーダ制御パラメータ(例えば、ビットレート制御パラメータ)などの他の情報を二進デコーディングステージ302においてデコードすることができる。幾つかの実施形態では、映像ビットストリーム228がネットワーク上でパケット伝送される場合、デコーダは、映像ビットストリーム228を二進デコーディングステージ302に送る前に、それをパケット化解除することができる。
[0067] 図3Bは、本開示の実施形態と一致した別のデコーディングプロセス例300Bの概略図を示す。プロセス300Bは、プロセス300Aから変更され得る。例えば、プロセス300Bは、ハイブリッド映像符号化標準規格(例えば、H.26x系)に準拠したデコーダによって使用され得る。プロセス300Aと比較して、プロセス300Bは、予測ステージ204を空間予測ステージ2042及び時間予測ステージ2044にさらに分割し、ループフィルタステージ232及びバッファ234をさらに含む。
[0068] プロセス300Bでは、デコード中の(「現在のピクチャ」と呼ばれる)エンコードされたピクチャの(「現在のBPU」と呼ばれる)エンコード基本処理ユニットに関して、デコーダによって二進デコーディングステージ302からデコードされた予測データ206は、エンコーダによって現在のBPUをエンコードするためにどの予測モードが使用されたかに応じて、様々なタイプのデータを含み得る。例えば、現在のBPUをエンコードするためにイントラ予測がエンコーダによって使用された場合、予測データ206は、イントラ予測を示す予測モードインジケータ(例えば、フラグ値)又はイントラ予測演算のパラメータなどを含み得る。イントラ予測演算のパラメータは、例えば、基準として使用される1つ又は複数の隣接BPUの場所(例えば、座標)、隣接BPUのサイズ、外挿のパラメータ又はオリジナルBPUに対する隣接BPUの方向などを含み得る。別の例として、現在のBPUをエンコードするためにインター予測がエンコーダによって使用された場合、予測データ206は、インター予測を示す予測モードインジケータ(例えば、フラグ値)又はインター予測演算のパラメータなどを含み得る。インター予測演算のパラメータは、例えば、現在のBPUに関連付けられた参照ピクチャの数、参照ピクチャにそれぞれ関連付けられた重み、それぞれの参照ピクチャにおける1つ若しくは複数のマッチング領域の場所(例えば、座標)又はマッチング領域にそれぞれ関連付けられた1つ若しくは複数の動きベクトルなどを含み得る。
[0069] 予測モードインジケータに基づいて、デコーダは、空間予測ステージ2042において空間予測(例えば、イントラ予測)を行うか、又は時間予測ステージ2044において時間予測(例えば、インター予測)を行うかを決めることができる。このような空間予測又は時間予測を行う詳細は、図2Bに示され、以下では繰り返さない。そのような空間予測又は時間予測を行った後、デコーダは、予測BPU208を生成することができる。デコーダは、図3Aに示されるように、予測BPU208及び再構成残差BPU222を加算することにより、予測参照224を生成することができる。
[0070] プロセス300Bでは、デコーダは、プロセス300Bの次の反復において予測演算を行うための空間予測ステージ2042又は時間予測ステージ2044に予測参照224を送ることができる。例えば、現在のBPUが空間予測ステージ2042においてイントラ予測を用いてデコードされる場合、予測参照224(例えば、デコードされた現在のBPU)の生成後、デコーダは、後に使用するために(例えば、現在のピクチャの次のBPUの外挿のために)予測参照224を空間予測ステージ2042に直接送ることができる。現在のBPUが時間予測ステージ2044においてインター予測を用いてデコードされる場合、予測参照224(例えば、全てのBPUがデコードされた参照ピクチャ)の生成後、エンコーダは、歪み(例えば、ブロッキングアーチファクト)を低減又は無くすために、予測参照224をループフィルタステージ232に送ることができる。デコーダは、図2Bに示した方法でループフィルタを予測参照224に適用することができる。ループフィルタリングが行われた参照ピクチャは、後に使用するために(例えば、映像ビットストリーム228の未来にエンコードされるピクチャのためのインター予測参照ピクチャとして使用されるように)、バッファ234(例えば、コンピュータメモリのデコードピクチャバッファ)に保存され得る。デコーダは、時間予測ステージ2044で使用される1つ又は複数の参照ピクチャをバッファ234に保存し得る。幾つかの実施形態では、現在のBPUをエンコードするためにインター予測が使用されたことを予測データ206の予測モードインジケータが示す場合、予測データは、ループフィルタのパラメータ(例えば、ループフィルタ強度)をさらに含み得る。
[0071] 図4は、本開示の実施形態による、映像をエンコード又はデコードするための装置例400のブロック図である。図4に示されるように、装置400は、プロセッサ402を含み得る。プロセッサ402が本明細書に記載される命令を実行すると、装置400は、映像エンコーディング又はデコーディングのための専用マシンになることができる。プロセッサ402は、情報の操作又は処理を行うことが可能な任意のタイプの回路網であり得る。例えば、プロセッサ402は、幾つかの中央処理装置(すなわち「CPU」)、グラフィック処理ユニット(すなわち「GPU」)、ニューラル処理ユニット(「NPU」)、マイクロコントローラユニット(「MCU」)、光プロセッサ、プログラマブル論理コントローラ、マイクロコントローラ、マイクロプロセッサ、デジタル信号プロセッサ、知的財産(IP)コア、プログラマブル論理アレイ(PLA)、プログラマブルアレイロジック(PAL)、汎用アレイロジック(GAL)、複合プログラマブル論理デバイス(CPLD)、フィールドプログラマブルゲートアレイ(FPGA)、システムオンチップ(SoC)又は特定用途向け集積回路(ASIC)などの任意の組み合わせを含み得る。幾つかの実施形態では、プロセッサ402は、単一の論理コンポーネントとしてグループ化されたプロセッサのセットであり得る。例えば、図4に示されるように、プロセッサ402は、プロセッサ402a、プロセッサ402b及びプロセッサ402nを含む複数のプロセッサを含み得る。
[0072] 装置400は、データ(例えば、命令セット、コンピュータコード又は中間データなど)を保存するように構成されたメモリ404も含み得る。例えば、図4に示されるように、保存されたデータは、プログラム命令(例えば、プロセス200A、200B、300A又は300Bのステージを実装するためのプログラム命令)及び処理用データ(例えば、映像シーケンス202、映像ビットストリーム228又は映像ストリーム304)を含み得る。プロセッサ402は、(例えば、バス410を介して)プログラム命令及び処理用データにアクセスし、処理用データに対して演算又は操作を行うために、プログラム命令を実行することができる。メモリ404は、高速ランダムアクセス記憶デバイス又は不揮発性記憶デバイスを含み得る。幾つかの実施形態では、メモリ404は、幾つかのランダムアクセスメモリ(RAM)、読出し専用メモリ(ROM)、光ディスク、磁気ディスク、ハードドライブ、ソリッドステートドライブ、フラッシュドライブ、セキュリティデジタル(SD)カード、メモリスティック又はコンパクトフラッシュ(登録商標)(CF)カードなどの任意の組み合わせを含み得る。メモリ404も、単一の論理コンポーネントとしてグループ化されたメモリの群(図4では図示せず)であり得る。
[0073] バス410は、内部バス(例えば、CPUメモリバス)又は外部バス(例えば、ユニバーサルシリアルバスポート、周辺コンポーネント相互接続エクスプレスポート)などの、装置400内のコンポーネント間でデータを転送する通信デバイスであり得る。
[0074] 曖昧さを生じさせずに説明を簡単にするために、本開示では、プロセッサ402及び他のデータ処理回路はまとめて「データ処理回路」と呼ばれる。データ処理回路は、完全にハードウェアとして又はソフトウェア、ハードウェア若しくはファームウェアの組み合わせとして実装され得る。さらに、データ処理回路は、単一の独立したモジュールであり得るか、又は装置400の任意の他のコンポーネントと完全に若しくは部分的に統合され得る。
[0075] 装置400は、ネットワーク(例えば、インターネット、イントラネット、ローカルエリアネットワーク又はモバイル通信ネットワークなど)との有線又は無線通信を提供するために、ネットワークインタフェース406をさらに含み得る。幾つかの実施形態では、ネットワークインタフェース406は、幾つかのネットワークインタフェースコントローラ(NIC)、無線周波数(RF)モジュール、トランスポンダ、トランシーバ、モデム、ルータ、ゲートウェイ、有線ネットワークアダプタ、無線ネットワークアダプタ、ブルートゥース(登録商標)アダプタ、赤外線アダプタ、近距離無線通信(「NFC」)アダプタ又はセルラーネットワークチップなどの任意の組み合わせを含み得る。
[0076] 幾つかの実施形態では、任意選択的に、装置400は、1つ又は複数の周辺デバイスに対する接続を提供するために、周辺インタフェース408をさらに含み得る。図4に示されるように、周辺デバイスは、カーソル制御デバイス(例えば、マウス、タッチパッド若しくはタッチスクリーン)、キーボード、ディスプレイ(例えば、陰極線管ディスプレイ、液晶ディスプレイ若しくは発光ダイオードディスプレイ)又は映像入力デバイス(例えば、カメラ若しくは映像アーカイブに結合された入力インタフェース)などを含み得る(ただし、これらに限定されない)。
[0077] 映像コーデック(例えば、プロセス200A、200B、300A又は300Bを行うコーデック)は、装置400内の任意のソフトウェア又はハードウェアモジュールの任意の組み合わせとして実装され得ることに留意されたい。例えば、プロセス200A、200B、300A又は300Bの一部又は全てのステージが、メモリ404にロードされ得るプログラム命令などの、装置400の1つ又は複数のソフトウェアモジュールとして実装され得る。別の例として、プロセス200A、200B、300A又は300Bの一部又は全てのステージは、専用データ処理回路など(例えば、FPGA、ASIC又はNPUなど)の、装置400の1つ又は複数のハードウェアモジュールとして実装され得る。
[0078] JVETアドホックグループ(AHG)可逆及びほぼ可逆符号化ツール(AHG18)は、VVCテストモデル6.0(VTM-6.0)に基づいた可逆ソフトウェアをリリースした。このソフトウェアは、cu_transquant_bypass_flagと呼ばれる符号化ユニット(CU)レベルフラグを導入した。cu_transquant_bypass_flag=1の場合、それは、そのCUの予測残差信号の変換及び量子化がスキップされ、そのCUの残差が可逆的に直接符号化されることを意味する。
[0079] 不可逆VVCに類似して、現在の可逆コーデックは、2種類の残差符号化技術である変換スキップ(TS)残差符号化及び変換残差符号化を使用する。TS残差符号化は、以下の2つの条件の一方が満たされた場合に選択される:1)intra_bdpcm_flagが1に等しい値を有するか、又は2)transform_skip_flagが1に等しい値を有する。変換残差符号化は、上述の条件の両方が偽である場合に使用される。
[0080] また、現在の可逆コーデックでは、BDPCM(block differential pulse code modulation)が選択された場合、変換スキップ(TS)残差符号化が使用される。そうでない場合、変換残差符号化が使用される。
[0081] しかしながら、従来、VVC6では、変換残差符号化技術及びTS残差符号化技術の両方が非可逆コーデックのために設計される。残差係数の統計的特性は、不可逆符号化が使用されるか、又は可逆符号化が使用されるかに応じて異なる。したがって、符号化効率を向上させるために、可逆符号化のための既存の残差符号化方法を向上させることが望ましい。本開示は、可逆符号化を行うための適切な残差符号化技術を選択するための様々な方法を提供する。
[0082] 幾つかの実施形態によれば、映像信号に対する残差符号化方法は、TS残差符号化及び変換残差符号化を含み得る。
[0083] TS残差符号化は、以下の2つの条件が共に満たされた場合に選択することができる。2つの条件は、映像信号がルマ成分であること及びintra_bdpcm_flag又はtransform_skip_flagの何れか一方が1であることを含み得る。
[0084] 変換残差符号化は、上記2つの条件の何れか一方が偽である場合に選択することができる。
[0085] 幾つかの実施形態では、変換スキップ及びBDPCMブロックは、TS残差符号化及び変換残差符号化の一方を選択することを許可され得る。この選択は、さらなるフラグをシグナリングすることによって制御され得る。さらなるフラグは、CUレベル、スライスレベル、ピクチャレベル又はピクチャパラメータセット(PPS)若しくはSPSにおいてシグナリングされ得る。
[0086] 例えば、cu_transquant_bypass_flagは、CUレベルでシグナリングされ得、可逆符号化のための2種類の残差符号化技術の一方を選択するために使用することができる。cu_transquant_bypass_flagが1である場合、intra_bdpcm_flag又はtransform_skip_flagの値にかかわらず、変換残差符号化が使用される。図5の表1は、開示の実施形態を実装するために、破線ボックス内に示されるシンタックス要素が提案される、例示的変換ユニットシンタックス表を示す。
[0087] 幾つかの実施形態によれば、ルマBDPCMブロックによって使用される残差符号化技術をシグナリングするために、シーケンスパラメータセット(SPS)レベルフラグ「sps_bdpcm_transform_residual_coding_flag」が使用される。具体的には、1に等しいsps_bdpcm_transform_residual_coding_flagは、BDPCMが現在のルマブロックに適用される場合(例えば、intra_bdpcm_flag=1)、現在のルマブロックが変換残差符号化を使用することを指定する。また、0に等しいsps_bdpcm_transform_residual_coding_flagは、BDPCMが現在のルマブロックに適用される場合(例えば、intra_bdpcm_flag=1)、現在のルマブロックがTS残差符号化を使用することを指定する。さらに、sps_bdpcm_transform_residual_coding_flagが存在しない場合、それは、0に等しいと推論される。
[0088] これらの実施形態では、sps_bdpcm_transform_residual_coding_flagは、予め設定された条件に基づいてシグナリングされる。一例として、sps_bdpcm_enabled_flagが1である場合、sps_bdpcm_transform_residual_coding_flagがシグナリングされる。
[0089] 別の例として、sps_bdpcm_enabled_flag及びtransquant_bypass_enabled_flagが共に1である場合、sps_bdpcm_transform_residual_coding_flagがシグナリングされる。図6の表2は、sps_bdpcm_enabled_flag及びtransquant_bypass_enabled_flagの両方に基づいて、sps_bdpcm_transform_residual_coding_flagをシグナリングするための例示的SPSシンタックス表を示し、表では、開示の実施形態を実装するために、破線ボックス内に示されるシンタックス要素が提案される。表2(図6)に示されるように、1に等しいsps_bdpcm_transform_residual_coding_flagは、BDPCMが現在のルマブロックに適用され(例えば、intra_bdpcm_flag=1)、並びに現在のブロックが変換及び量子化バイパスモードにある(例えば、cu_transquant_bypass_flag=1)場合、現在のルマブロックが変換残差符号化を使用することを指定する。また、0に等しいsps_bdpcm_transform_residual_coding_flagは、BDPCMが現在のルマブロックに適用され(例えば、intra_bdpcm_flag=1)、並びに現在のブロックが変換及び量子化バイパスモードにある(例えば、cu_transquant_bypass_flag=1)場合、現在のルマブロックがTS残差符号化を使用することを指定する。
[0090] 上記の記載は、残差符号化プロセスを説明するために一例としてルマブロックを使用するが、開示の方法は、クロマブロックの残差符号化にも同様に容易に適用可能であることが企図される。
[0091] 幾つかの実施形態では、残差符号化方法の選択は、PPS、ピクチャヘッダ又はスライスヘッダなどの他のレベルでシグナリングすることもできる。例えば、TS残差符号化の選択は、スライスレベルで制御することができる。その場合、TS残差符号化方法を有効/無効にするために、スライスレベルフラグが提供される。スライスレベルフラグの意味論は、以下で与えられる。
[0092] 1に等しいslice_ts_residual_coding_disabled_flagは、現在のスライスの変換スキップ及びBDPCMブロックの残差サンプルをパースするために、residual_coding( )シンタックス構造が使用されることを指定する。0に等しいslice_ts_residual_coding_disabled_flagは、現在のスライスの変換スキップブロックの残差サンプルをパースするために、residual_ts_coding( )シンタックス構造が使用されることを指定する。slice_ts_residual_coding_disabled_flagが存在しない場合、それは、0に等しいことが推論される。
[0093] 図7の表3は、例示的スライスヘッダシンタックスを示し、そこでは、開示の実施形態を実装するために、破線ボックス内に示されるシンタックス要素が提案される。図8の表4は、例示的変換ブロックシンタックスを示し、そこでは、開示の実施形態を実装するために、破線ボックス内に示されるシンタックス要素が提案される。幾つかの実施形態では、slice_ts_residual_coding_disabled_flagの値が1に等しい場合、変換スキップ及びBDPCMブロックは、TS残差符号化方法の代わりに変換残差符号化方法を使用する。
[0094] 本開示の幾つかの実施形態によれば、変換残差符号化に関して、最後の有意な係数の位置のシグナリングが省かれ得る。VVC6の変換残差符号化方法では、変換ブロックの残差符号化の最初に、最後の有意な係数の位置がシグナリングされる。対照的に、開示の方法では、cu_transquant_bypass_flag=1の場合、最後の有意な係数の位置は、シグナリングされず、代わりに、その位置は、変換ブロックの右下の位置であると推論される。cu_transquant_bypass_flag=0の場合、最後の有意な係数の位置は、VVC6の場合と同じ方法でシグナリングされる。
[0095] VVC6の変換残差符号化では、最初のサブブロック及び最後のサブブロックのcoded_sub_block_flagは、シグナリングされず、1であると推論される。開示の方法では、cu_transquant_bypass_flag=1の場合、全てのサブブロックのcoded_sub_block_flagがシグナリングされる。しかしながら、前に符号化された全てのサブブロックのcoded_sub_block_flagがゼロである場合、最初のサブブロックのcoded_sub_block_flagは、1であると推論される。VVC6と同様に、開示の方法では、cu_transquant_bypass_flag=0の場合、最初のサブブロック及び最後のサブブロックは、シグナリングされず、1であると推論される。
[0096] VVC6の変換残差符号化では、最後の有意な係数の位置が常にシグナリングされ、最後の有意な係数が常に非ゼロ値であるため、最後の有意な係数のsig_coeff_flagは、シグナリングされることを必要とされず、1であると推論される。対照的に、開示の方法では、cu_transquant_bypass_flag=1の場合、最後の有意な係数は、常に右下の係数であり、それは、ゼロ又は非ゼロ値の何れか一方となり得る。したがって、cu_transquant_bypass_flag=1の場合、開示の方法は、最後の有意な係数の位置のsig_coeff_flagをシグナリングし得る。しかしながら、cu_transquant_bypass_flag=0の場合、開示の方法は、VVC6の変換残差符号化と同じ方法でsig_coeff_flagをシグナリングし得る。
[0097] 図9の表5は、開示の方法による、最後の有意な係数の位置をシグナリングするための例示的変換残差符号化シンタックス表を示す。表5(図9)では、破線ボックス内に示されるシンタックス要素は、VVC6の変換残差符号化シンタックスに対する提案される変更である。
[0098] 本開示の幾つかの実施形態によれば、変換残差符号化に関して、cu_transquant_bypass_flagの値にかかわらず、最後の有意な係数の位置のシグナリングが省かれ得る。
[0099] 図10は、本開示の実施形態と一致した、残差符号化で映像信号を処理するための例示的コンピュータ実施方法1000のフローチャートである。幾つかの実施形態では、方法1000は、コーデック(例えば、図2A~2Bのエンコーディングプロセス200A若しくは200Bを使用するエンコーダ又は図3A~3Bのデコーディングプロセス300A若しくは300Bを使用するデコーダ)によって行うことができる。例えば、コーデックは、映像シーケンスをエンコード又はトランスコードするための装置(例えば、装置400)の1つ又は複数のソフトウェア又はハードウェアコンポーネントとして実装され得る。幾つかの実施形態では、映像シーケンスは、非圧縮映像シーケンス(例えば、映像シーケンス202)又はデコードされた圧縮映像シーケンス(例えば、映像ストリーム304)であり得る。幾つかの実施形態では、映像シーケンスは、装置のプロセッサ(例えば、プロセッサ402)に関連付けられたモニタリングデバイス(例えば、図4の映像入力デバイス)によって捕捉することができるモニタリング映像シーケンスであり得る。映像シーケンスは、複数のピクチャを含み得る。装置は、ピクチャレベルで方法1000を行うことができる。例えば、装置は、方法1000において、一度に1つのピクチャを処理することができる。別の例として、装置は、方法1000において、一度に複数のピクチャを処理することができる。方法1000は、以下のようなステップを含み得る。
[00100] ステップ1002では、映像シーケンスを符号化するための制御情報を受け取ることができる。制御情報は、映像シーケンスの異なるレベルでシグナリングされ得るフラグを含み得る。例えば、フラグは、CUレベル、スライスレベル、ピクチャレベル又はピクチャパラメータセット(PPS)若しくはSPSにおいてシグナリングされ得る。
[00101] ステップ1004では、映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法は、制御情報に基づいて、変換残差符号化及び変換スキップ残差符号化の一方であると決定することができる。
[00102] 幾つかの実施形態では、制御情報は、映像シーケンスの符号化ユニットレベルでシグナリングすることができ、制御情報は、符号化ブロックの予測残差信号の変換及び量子化をスキップするか否かを示す第1のフラグを含む。例えば、第1のフラグは、cu_transquant_bypass_flagであり得る。第1のフラグが第1の条件を満たすことに応答して、符号化方法は、変換残差符号化であると決定することができる。表1(図5)に示されるように、cu_transquant_bypass_flagの値が「1」である場合、intra_bdpcm_flag又はtransform_skip_flagの値にかかわらず、変換残差符号化が使用される。したがって、第1の条件は、第1のフラグの値が「1」であることを含み得る。変換残差符号化が可逆コーデックによって行われることが理解される。cu_transquant_bypass_flagの値が「0」である場合、変換スキップ及びBDPCMブロックは、共にTS残差符号化を使用し得る。
[00103] 幾つかの実施形態では、制御情報は、第2のフラグ及び第3のフラグをさらに含み得る。例えば、第2のフラグは、intra_bdpcm_flagであり得、第3のフラグは、transform_skip_flagであり得る。第1のフラグが第1の条件を満たさない場合、符号化方法は、第2のフラグ又は第3のフラグの値に基づいて決定することができる。intra_bdpcm_flagが「1」に等しい場合、符号化方法は、BDPCMであり得る。transform_skip_flagが「1」に等しい場合、符号化方法は、変換スキップ符号化であり得る。
[00104] 幾つかの実施形態では、符号化ユニットレベルでシグナリングされる以外として、制御情報は、映像シーケンスのシーケンスパラメータセット(SPS)においてシグナリングされ得、制御情報は、第4のフラグ及び第5のフラグを含み得る。例えば、第4のフラグは、sps_bdpcm_transform_residual_coding_flagであり得、第5のフラグは、intra_bdpcm_flagであり得る。表2(図6)を参照して述べたように、第4のフラグ及び第5のフラグが第1の値(例えば、「1」)に等しいことに応答して、符号化方法は、変換残差符号化であると決定することができる。また、第4のフラグが第2の値(例えば、「0」)に等しく、及び第5のフラグが第1の値(例えば、「1」)に等しいことに応答して、符号化方法は、変換スキップ残差符号化であると決定することができる。
[00105] 幾つかの実施形態では、第4のフラグは、映像シーケンスについてBDPCM(block differential pulse code modulation)が有効にされる場合、制御情報においてシグナリングすることができる。幾つかの実施形態では、第4のフラグは、映像シーケンスについてBDPCMが有効にされ、並びに符号化ブロックについて変換及び量子化バイパスモードが有効にされる場合、制御情報においてシグナリングすることができる。
[00106] 幾つかの実施形態では、制御情報は、映像シーケンスのスライスについてスライスレベルでシグナリングすることができる。また、制御情報は、第6のフラグ(例えば、slice_ts_residual_coding_disabled_flag)を含み得る。表3(図7)及び表4(図8)を参照して述べたように、符号化ブロックの予測残差信号を符号化するための符号化方法は、第6のフラグの値が第1の値である場合、変換スキップ残差符号化であると決定することができる。符号化ブロックは、制御情報がスライスレベルでシグナリングされるスライスに関連付けられると理解される。
[00107] 幾つかの実施形態では、命令を含む非一時的コンピュータ可読記憶媒体も提供され、命令は、上記の方法を行うために、デバイス(開示のエンコーダ及びデコーダなど)によって実行され得る。非一時的媒体の一般的な形態には、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ又は他の磁気データ記憶媒体、CD-ROM、他の光学データ記憶媒体、孔のパターンを有する任意の物理媒体、RAM、PROM及びEPROM、FLASH(登録商標)-EPROM又は他のフラッシュメモリ、NVRAM、キャッシュ、レジスタ、他のメモリチップ又はカートリッジ並びに上記のネットワーク化バージョンが含まれる。デバイスは、1つ若しくは複数のプロセッサ(CPU)、入出力インタフェース、ネットワークインタフェース及び/又はメモリを含み得る。
[00108] 実施形態は、以下の条項を用いてさらに説明することができる。
1.映像シーケンスを符号化するための制御情報を受け取ることと、
制御情報に基づいて、映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することであって、符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である、決定することと
を含むコンピュータ実施方法。
2.制御情報は、映像シーケンスの符号化ユニットレベルでシグナリングされ、
制御情報は、符号化ブロックの予測残差信号の変換及び量子化をスキップするか否かを示す第1のフラグを含む、条項1に記載の方法。
3.制御情報に基づいて符号化方法を決定することは、第1のフラグが第1の条件を満たすことに応答して、符号化方法を変換残差符号化に決定することをさらに含む、条項2に記載の方法。
4.第1の条件は、第1のフラグの値が「1」であることを含み、及び
変換残差符号化は、可逆コーデックによって行われる、条項3に記載の方法。
5.制御情報は、第2のフラグ及び第3のフラグをさらに含み、及び
制御情報に基づいて符号化方法を決定することは、第1のフラグが第1の条件を満たさないことに応答して、第2のフラグ又は第3のフラグの値に基づいて符号化方法を決定することをさらに含む、条項2に記載の方法。
6.制御情報は、映像シーケンスのシーケンスパラメータセットにおいてシグナリングされ、
制御情報は、第4のフラグ及び第5のフラグを含み、及び
制御情報に基づいて符号化方法を決定することは、
第4のフラグ及び第5のフラグが同じ値を有することに応答して、符号化方法を変換残差符号化に決定することと、
第4のフラグ及び第5のフラグが異なる値を有することに応答して、符号化方法を変換スキップ残差符号化に決定することと
をさらに含む、条項1に記載の方法。
7.映像シーケンスについてBDPCM(block differential pulse code modulation)が有効にされることに応答して、制御情報において第4のフラグをシグナリングすることをさらに含む、条項6に記載の方法。
8.映像シーケンスについてBDPCMが有効にされ、並びに符号化ブロックについて変換及び量子化バイパスモードが有効にされることに応答して、制御情報において第4のフラグをシグナリングすることをさらに含む、条項6に記載の方法。
9.制御情報は、映像シーケンスのスライスについてスライスレベルでシグナリングされ、
制御情報は、第6のフラグを含み、及び
制御情報に基づいて符号化方法を決定することは、第6のフラグの値が第1の値であることに応答して、符号化方法を変換スキップ残差符号化に決定することをさらに含む、条項1に記載の方法。
10.符号化ブロックは、スライスに関連付けられる、条項9に記載の方法。
11.残差符号化で映像信号を処理するためのシステムであって、
命令セットを保存するためのメモリと、
少なくとも1つのプロセッサとを含み、少なくとも1つのプロセッサは、
映像シーケンスを符号化するための制御情報を受け取ることと、
制御情報に基づいて、映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することであって、符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である、決定することと
をシステムに行わせるように、命令セットを実行するように構成される、システム。
12.制御情報は、映像シーケンスの符号化ユニットレベルでシグナリングされ、
制御情報は、符号化ブロックの予測残差信号の変換及び量子化をスキップするか否かを示す第1のフラグを含む、条項11に記載のシステム。
13.制御情報に基づいて符号化方法を決定する場合、少なくとも1つのプロセッサは、
第1のフラグが第1の条件を満たすことに応答して、符号化方法を変換残差符号化に決定すること
をシステムにさらに行わせるように、命令セットを実行するように構成される、条項12に記載のシステム。
14.第1の条件は、第1のフラグの値が「1」であることを含み、及び
変換残差符号化は、可逆コーデックによって行われる、条項13に記載のシステム。
15.制御情報は、第2のフラグ及び第3のフラグをさらに含み、及び
制御情報に基づいて符号化方法を決定する場合、少なくとも1つのプロセッサは、
第1のフラグが第1の条件を満たさないことに応答して、第2のフラグ又は第3のフラグの値に基づいて符号化方法を決定すること
をシステムにさらに行わせるように、命令セットを実行するように構成される、条項12に記載のシステム。
16.制御情報は、映像シーケンスのシーケンスパラメータセットにおいてシグナリングされ、
制御情報は、第4のフラグ及び第5のフラグを含み、及び
制御情報に基づいて符号化方法を決定する場合、少なくとも1つのプロセッサは、
第4のフラグ及び第5のフラグが同じ値を有することに応答して、符号化方法を変換残差符号化に決定することと、
第4のフラグ及び第5のフラグが異なる値を有することに応答して、符号化方法を変換スキップ残差符号化に決定することと
をシステムにさらに行わせるように、命令セットを実行するように構成される、条項11に記載のシステム。
17.少なくとも1つのプロセッサは、
映像シーケンスについてBDPCMが有効にされることに応答して、制御情報において第4のフラグをシグナリングすること
をシステムにさらに行わせるように、命令セットを実行するように構成される、条項16に記載のシステム。
18.少なくとも1つのプロセッサは、
映像シーケンスについてBDPCMが有効にされ、並びに符号化ブロックについて変換及び量子化バイパスモードが有効にされることに応答して、制御情報において第4のフラグをシグナリングすること
をシステムにさらに行わせるように、命令セットを実行するように構成される、条項16に記載のシステム。
19.制御情報は、映像シーケンスのスライスについてスライスレベルでシグナリングされ、
制御情報は、第6のフラグを含み、及び
制御情報に基づいて符号化方法を決定する場合、少なくとも1つのプロセッサは、
第6のフラグの値が第1の値であることに応答して、符号化方法を変換スキップ残差符号化に決定すること
をシステムにさらに行わせるように、命令セットを実行するように構成される、条項11に記載のシステム。
20.コンピュータシステムの少なくとも1つのプロセッサによって実行可能な命令を保存する非一時的コンピュータ可読媒体であって、命令の実行は、
映像シーケンスを符号化するための制御情報を受け取ることと、
制御情報に基づいて、映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することであって、符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である、決定することと
を含む方法をコンピュータシステムに行わせる、非一時的コンピュータ可読媒体。
[00109] 「第1の」及び「第2の」などの本明細書の関係語は、あるエンティティ又は動作を別のエンティティ又は動作と区別するためにのみ使用されるものであり、これらのエンティティ又は動作間の実際の関係又は順序を必要とするもの又は暗示するものではないことに留意されたい。また、「含む」、「有する」、「含有する」及び「包含する」という語並びに他の類似の形態は、意味が同等であることと、これらの語の何れか1つに続く1つ又は複数の項が、そのような1つ若しくは複数の項の網羅的列挙ではない点又は列挙された1つ若しくは複数の項のみに限定されない点でオープンエンド形式であることとが意図される。
[00110] 上記の実施形態は、ハードウェア若しくはソフトウェア(プログラムコード)又はハードウェア及びソフトウェアの組み合わせによって実施され得ることが理解される。ソフトウェアによって実施される場合、それは、上記のコンピュータ可読媒体に保存され得る。ソフトウェアは、プロセッサによる実行時に、開示の方法を行うことができる。本開示に記載したコンピューティングユニット及び他の機能ユニットは、ハードウェア若しくはソフトウェア又はハードウェア及びソフトウェアの組み合わせによって実装され得る。当業者は、上記のモジュール/ユニットの内の複数が、1つのモジュール/ユニットとして統合され得ることと、上記のモジュール/ユニットのそれぞれが、複数のサブモジュール/サブユニットにさらに分割され得ることとも理解するであろう。
[00111] 上述の本明細書では、実装形態によって異なり得る多数の具体的詳細に関して、実施形態を説明した。記載した実施形態の特定の適応及び変更が行われ得る。ここに開示した本発明の本明細書及び実施を考慮して、他の実施形態が当業者には明らかとなり得る。上記の本明細書及び例は、単なる例示と見なされることが意図され、本発明の真の範囲及び趣旨は、以下の特許請求の範囲によって示される。また、図面に示されるステップの順序は、単に、説明のためのものであることが意図され、ステップの何れの特定の順序にも限定されることは意図されない。そのため、同じ方法を実施しながら、これらのステップが異なる順序で行われ得ることを当業者は理解できる。
[00112] 図面及び本明細書では、例示的実施形態を開示した。しかしながら、これらの実施形態に対して多くの変形形態及び変更形態を作ることができる。したがって、特定の用語が使用されるが、それらは、単に一般的及び説明的な意味で使用されるものであり、限定を意図したものではない。

Claims (20)

  1. 映像シーケンスを符号化するための制御情報を受け取ることと、
    前記制御情報に基づいて、前記映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することであって、前記符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である、決定することと
    を含むコンピュータ実施方法。
  2. 前記制御情報は、前記映像シーケンスの符号化ユニットレベルでシグナリングされ、
    前記制御情報は、前記符号化ブロックの前記予測残差信号の変換及び量子化をスキップするか否かを示す第1のフラグを含む、請求項1に記載の方法。
  3. 前記制御情報に基づいて前記符号化方法を決定することは、前記第1のフラグが第1の条件を満たすことに応答して、前記符号化方法を前記変換残差符号化に決定することをさらに含む、請求項2に記載の方法。
  4. 前記第1の条件は、前記第1のフラグの値が「1」であることを含み、及び
    前記変換残差符号化は、可逆コーデックによって行われる、請求項3に記載の方法。
  5. 前記制御情報は、第2のフラグ及び第3のフラグをさらに含み、及び
    前記制御情報に基づいて前記符号化方法を決定することは、前記第1のフラグが第1の条件を満たさないことに応答して、前記第2のフラグ又は前記第3のフラグの値に基づいて前記符号化方法を決定することをさらに含む、請求項2に記載の方法。
  6. 前記制御情報は、前記映像シーケンスのシーケンスパラメータセットにおいてシグナリングされ、
    前記制御情報は、第4のフラグ及び第5のフラグを含み、及び
    前記制御情報に基づいて前記符号化方法を決定することは、
    前記第4のフラグ及び前記第5のフラグが同じ値を有することに応答して、前記符号化方法を前記変換残差符号化に決定することと、
    前記第4のフラグ及び前記第5のフラグが異なる値を有することに応答して、前記符号化方法を前記変換スキップ残差符号化に決定することと
    をさらに含む、請求項1に記載の方法。
  7. 前記映像シーケンスについてBDPCM(block differential pulse code modulation)が有効にされることに応答して、前記制御情報において前記第4のフラグをシグナリングすることをさらに含む、請求項6に記載の方法。
  8. 前記映像シーケンスについてBDPCMが有効にされ、並びに前記符号化ブロックについて変換及び量子化バイパスモードが有効にされることに応答して、前記制御情報において前記第4のフラグをシグナリングすることをさらに含む、請求項6に記載の方法。
  9. 前記制御情報は、前記映像シーケンスのスライスについてスライスレベルでシグナリングされ、
    前記制御情報は、第6のフラグを含み、及び
    前記制御情報に基づいて前記符号化方法を決定することは、前記第6のフラグの値が第1の値であることに応答して、前記符号化方法を前記変換スキップ残差符号化に決定することをさらに含む、請求項1に記載の方法。
  10. 前記符号化ブロックは、前記スライスに関連付けられる、請求項9に記載の方法。
  11. 残差符号化で映像信号を処理するためのシステムであって、
    命令セットを保存するためのメモリと、
    少なくとも1つのプロセッサとを含み、前記少なくとも1つのプロセッサは、
    映像シーケンスを符号化するための制御情報を受け取ることと、
    前記制御情報に基づいて、前記映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することであって、前記符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である、決定することと
    を前記システムに行わせるように、前記命令セットを実行するように構成される、システム。
  12. 前記制御情報は、前記映像シーケンスの符号化ユニットレベルでシグナリングされ、
    前記制御情報は、前記符号化ブロックの前記予測残差信号の変換及び量子化をスキップするか否かを示す第1のフラグを含む、請求項11に記載のシステム。
  13. 前記制御情報に基づいて前記符号化方法を決定する場合、前記少なくとも1つのプロセッサは、
    前記第1のフラグが第1の条件を満たすことに応答して、前記符号化方法を前記変換残差符号化に決定すること
    を前記システムにさらに行わせるように、前記命令セットを実行するように構成される、請求項12に記載のシステム。
  14. 前記第1の条件は、前記第1のフラグの値が「1」であることを含み、及び
    前記変換残差符号化は、可逆コーデックによって行われる、請求項13に記載のシステム。
  15. 前記制御情報は、第2のフラグ及び第3のフラグをさらに含み、及び
    前記制御情報に基づいて前記符号化方法を決定する場合、前記少なくとも1つのプロセッサは、
    前記第1のフラグが第1の条件を満たさないことに応答して、前記第2のフラグ又は前記第3のフラグの値に基づいて前記符号化方法を決定すること
    を前記システムにさらに行わせるように、前記命令セットを実行するように構成される、請求項12に記載のシステム。
  16. 前記制御情報は、前記映像シーケンスのシーケンスパラメータセットにおいてシグナリングされ、
    前記制御情報は、第4のフラグ及び第5のフラグを含み、及び
    前記制御情報に基づいて前記符号化方法を決定する場合、前記少なくとも1つのプロセッサは、
    前記第4のフラグ及び前記第5のフラグが同じ値を有することに応答して、前記符号化方法を前記変換残差符号化に決定することと、
    前記第4のフラグ及び前記第5のフラグが異なる値を有することに応答して、前記符号化方法を前記変換スキップ残差符号化に決定することと
    を前記システムにさらに行わせるように、前記命令セットを実行するように構成される、請求項11に記載のシステム。
  17. 前記少なくとも1つのプロセッサは、
    前記映像シーケンスについてBDPCMが有効にされることに応答して、前記制御情報において前記第4のフラグをシグナリングすること
    を前記システムにさらに行わせるように、前記命令セットを実行するように構成される、請求項16に記載のシステム。
  18. 前記少なくとも1つのプロセッサは、
    前記映像シーケンスについてBDPCMが有効にされ、並びに前記符号化ブロックについて変換及び量子化バイパスモードが有効にされることに応答して、前記制御情報において前記第4のフラグをシグナリングすること
    を前記システムにさらに行わせるように、前記命令セットを実行するように構成される、請求項16に記載のシステム。
  19. 前記制御情報は、前記映像シーケンスのスライスについてスライスレベルでシグナリングされ、
    前記制御情報は、第6のフラグを含み、及び
    前記制御情報に基づいて前記符号化方法を決定する場合、前記少なくとも1つのプロセッサは、
    前記第6のフラグの値が第1の値であることに応答して、前記符号化方法を前記変換スキップ残差符号化に決定すること
    を前記システムにさらに行わせるように、前記命令セットを実行するように構成される、請求項11に記載のシステム。
  20. コンピュータシステムの少なくとも1つのプロセッサによって実行可能な命令を保存する非一時的コンピュータ可読媒体であって、前記命令の実行は、
    映像シーケンスを符号化するための制御情報を受け取ることと、
    前記制御情報に基づいて、前記映像シーケンスの符号化ブロックの予測残差信号を符号化するための符号化方法を決定することであって、前記符号化方法は、変換残差符号化及び変換スキップ残差符号化の一方である、決定することと
    を含む方法を前記コンピュータシステムに行わせる、非一時的コンピュータ可読媒体。
JP2022516282A 2019-09-23 2020-08-24 映像データの可逆符号化 Pending JP2022549773A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962904574P 2019-09-23 2019-09-23
US62/904,574 2019-09-23
PCT/US2020/047602 WO2021061318A1 (en) 2019-09-23 2020-08-24 Lossless coding of video data

Publications (2)

Publication Number Publication Date
JP2022549773A true JP2022549773A (ja) 2022-11-29
JPWO2021061318A5 JPWO2021061318A5 (ja) 2023-08-15

Family

ID=74881384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022516282A Pending JP2022549773A (ja) 2019-09-23 2020-08-24 映像データの可逆符号化

Country Status (6)

Country Link
US (1) US12047578B2 (ja)
EP (1) EP4035069A4 (ja)
JP (1) JP2022549773A (ja)
KR (1) KR20220062655A (ja)
CN (1) CN114731440A (ja)
WO (1) WO2021061318A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020354148B2 (en) * 2019-09-25 2024-02-15 Lg Electronics Inc. Image encoding/decoding method and apparatus for signaling residual coding method used for encoding block to which BDPCM is applied, and method for transmitting bitstream
US11973983B2 (en) * 2019-10-11 2024-04-30 Qualcomm Incorporated Signaling coding scheme for residual values in transform skip for video coding
CN115336274B (zh) * 2020-02-05 2023-05-26 Lg电子株式会社 与残差编码关联的图像解码方法以及用于其的装置
WO2021170058A1 (en) * 2020-02-27 2021-09-02 Beijing Bytedance Network Technology Co., Ltd. Transform skip residual coding

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100763181B1 (ko) * 2005-04-19 2007-10-05 삼성전자주식회사 기초계층과 향상계층의 데이터를 바탕으로 예측 정보를코딩하여 코딩율을 향상시키는 방법 및 장치
CN102137263B (zh) 2011-05-09 2013-07-03 松日数码发展(深圳)有限公司 基于cnm关键帧分类的分布式视频编码及解码方法
US9521410B2 (en) * 2012-04-26 2016-12-13 Qualcomm Incorporated Quantization parameter (QP) coding in video coding
US9264713B2 (en) 2012-07-11 2016-02-16 Qualcomm Incorporated Rotation of prediction residual blocks in video coding with transform skipping
WO2014071439A1 (en) * 2012-11-08 2014-05-15 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
KR20140081681A (ko) 2012-12-14 2014-07-01 한국전자통신연구원 영상의 부호화 방법 및 이를 이용하는 장치
US20140169452A1 (en) 2012-12-14 2014-06-19 Electronics And Telecommunications Research Institute Video encoding method and apparatus using the same
GB2512658B (en) 2013-04-05 2020-04-01 British Broadcasting Corp Transmitting and receiving a composite image
US11323747B2 (en) 2013-06-05 2022-05-03 Qualcomm Incorporated Residual differential pulse code modulation (DPCM) extensions and harmonization with transform skip, rotation, and scans
US11470339B2 (en) 2013-08-27 2022-10-11 Qualcomm Incorporated Residual prediction for intra block copying
CA2923439C (en) * 2013-10-14 2018-08-21 Mediatek Singapore Pte. Ltd. Method of residue differential pulse-code modulation for hevc range extension
US20150195574A1 (en) * 2013-11-06 2015-07-09 Arris Enterprises, Inc. Modification of picture parameter set (pps) for hevc extensions
KR20220024711A (ko) * 2019-06-20 2022-03-03 인터디지털 브이씨 홀딩스 프랑스 에스에이에스 다목적 비디오 코딩을 위한 무손실 모드
EP4032289A4 (en) * 2019-09-19 2023-09-13 HFI Innovation Inc. RESIDUAL CODING SELECTION METHOD AND APPARATUS FOR LOSSLESS CODING MODE IN VIDEO CODING

Also Published As

Publication number Publication date
WO2021061318A1 (en) 2021-04-01
US12047578B2 (en) 2024-07-23
EP4035069A1 (en) 2022-08-03
KR20220062655A (ko) 2022-05-17
US20210092388A1 (en) 2021-03-25
CN114731440A (zh) 2022-07-08
EP4035069A4 (en) 2023-10-11

Similar Documents

Publication Publication Date Title
JP2022548825A (ja) 映像処理における量子化パラメータのシグナリング
US12047578B2 (en) Lossless coding of video data
WO2021055114A1 (en) Method and system for signaling chroma quantization parameter offset
KR20220045045A (ko) 비디오 신호의 행렬 가중된 인트라 예측
US11889091B2 (en) Methods for processing chroma signals
JP2023519216A (ja) ループフィルタの高レベルシンタックス制御
JP2023509838A (ja) サブピクチャ分割情報をシグナリングするための方法及び機器
US11638019B2 (en) Methods and systems for prediction from multiple cross-components
CN114788284B (zh) 用于在调色板模式下对视频数据进行编码的方法和装置
JP2022548204A (ja) 変換スキップモードで映像データを符号化するための方法及び装置
JP2023515321A (ja) 最大変換サイズ及び残差符号化方法のシグナリング
JP2022548555A (ja) 映像符号化のための動き補償方法
JP2022548521A (ja) 参照ダウンサンプリングありの動き補償補間のためのフィルタ
JP2022548203A (ja) サブブロック変換情報を信号化するための方法及び装置
US20240357119A1 (en) Lossless coding of video data
US20210084293A1 (en) Method and apparatus for coding video data
CN115443655A (zh) 用于处理视频编码中自适应颜色变换和低频不可分离变换的方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230804

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230804

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240910