JP2024522138A - ビデオを符号化/復号するための方法及び装置 - Google Patents

ビデオを符号化/復号するための方法及び装置 Download PDF

Info

Publication number
JP2024522138A
JP2024522138A JP2023574423A JP2023574423A JP2024522138A JP 2024522138 A JP2024522138 A JP 2024522138A JP 2023574423 A JP2023574423 A JP 2023574423A JP 2023574423 A JP2023574423 A JP 2023574423A JP 2024522138 A JP2024522138 A JP 2024522138A
Authority
JP
Japan
Prior art keywords
resolution
picture
decoded picture
alf
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023574423A
Other languages
English (en)
Inventor
ボルド、フィリップ
ガルピン、フランク
デュマ、ティエリー
ナセル、カラム
Original Assignee
インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ filed Critical インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
Publication of JP2024522138A publication Critical patent/JP2024522138A/ja
Pending legal-status Critical Current

Links

Images

Abstract

Figure 2024522138000001
ビデオを符号化/復号するための方法及び装置が提供される。ビデオからのピクチャがビットストリームから復号され、ピクチャは、ピクチャの元の解像度よりも低い解像度でビットストリーム内に符号化される。ピクチャを復号することは、復号されたピクチャを元の解像度にアップサンプリングすることと、アップサンプリングされた復号されたピクチャのうち少なくとも1つの成分に適応フィルタを適用することとを更に含む。いくつかの実施形態によれば、適応フィルタは、復号/符号化プロセスのループ内又はループ外で実行され得る。

Description

本実施形態は、概して、ビデオの符号化又は復号のための方法及び装置に関する。いくつかの実施形態は、元のピクチャ及び再構成されたピクチャが符号化のために動的にリスケーリングされる、ビデオの符号化又は復号のための方法及び装置に関する。
高い圧縮効率を実現するために、画像及びビデオのコーディング方式は、通常、ビデオコンテンツ内の空間冗長性及び時間冗長性を活用するために予測及び変換を採用している。概して、イントラピクチャ又はインターピクチャ相関を利用するために、イントラ予測又はインター予測が使用され、次いで、予測誤差又は予測残差と呼ばれることが多い、原ブロックと予測ブロックとの間の差が、変換、量子化、及びエントロピコーディングされる。ビデオを再構成するには、エントロピ符号化、量子化、変換、及び予測に対応する逆プロセスによって、圧縮データを復号する。
一態様によれば、ビデオから第1の解像度で第1のピクチャを復号するための方法が提供され、第1のピクチャを復号することは、復号されたピクチャを第1の解像度にアップサンプリングすることであって、復号されたピクチャが第2の解像度で符号化され、第2の解像度が第1の解像度より低い、アップサンプリングすることと、アップサンプリングされた復号されたピクチャの少なくとも1つの成分に適応フィルタを適用することと、を含む。
別の態様によれば、ビデオを復号するための装置が提供され、この装置は、1つ以上のプロセッサを備え、当該1つ以上のプロセッサは、ビデオから第1の解像度で第1のピクチャを復号するように構成されており、第1のピクチャを復号することは、復号されたピクチャを第1の解像度にアップサンプリングすることであって、復号されたピクチャが第2の解像度で符号化され、第2の解像度が第1の解像度より低い、アップサンプリングすることと、アップサンプリングされた復号されたピクチャの少なくとも1つの成分に適応フィルタを適用することと、を含む。
別の態様によれば、ビデオの第1のピクチャを符号化するための方法が提供され、第1のピクチャは第1の解像度を有し、第1のピクチャを符号化することは、第1のピクチャを第1の解像度よりも低い第2の解像度にダウンサンプリングすることと、ダウンサンプリングされたピクチャを符号化及び再構築することと、再構築されたピクチャを第1の解像度にアップサンプリングすることと、アップサンプリングされた復号されたピクチャの少なくとも1つの成分に適応フィルタを適用することとを含む。
別の態様によれば、ビデオを符号化するための装置が提供され、この装置は、1つ以上のプロセッサを備え、当該1つ以上のプロセッサは、第1のピクチャは第1の解像度を有し、第1の解像度を有するビデオを符号化するように、第1の解像度より低い第2の解像度へ第1のピクチャをダウンサンプリングすることを含む第1のピクチャを符号化するように、ダウンサンプリングされたピクチャを符号化して再構成するように、再構成されたピクチャを第1の解像度にアップサンプリングするように、アップサンプリングされた復号されたピクチャの少なくとも1つの成分に適応フィルタを適用するように、構成される。
一実施形態によれば、フィルタリングされた復号/再構成ピクチャは、第1の解像度で復号されたピクチャバッファに記憶される。
1つ以上の実施形態によりまた、1つ以上のプロセッサによって実行されるとき、1つ以上のプロセッサに、本明細書に述べた実施形態のいずれかによる符号化方法又は復号方法を行わせる命令を含む、コンピュータプログラムを提供する。本実施形態のうちの1つ以上はまた、上で説明された方法に従って、ビデオデータを符号化するか、又は復号するための命令を記憶したコンピュータ可読記憶媒体を提供する。1つ以上の実施形態はまた、これまで述べた方法により起こされたビットストリームを記憶しているコンピュータ可読記憶媒体を提供する。1つ以上の実施形態によりまた、上で説明された方法に従って生成されたビットストリームを送信又は受信するための方法及び装置を提供する。
本実施形態の態様が実装され得るシステムのブロック図を示す。 ビデオエンコーダの一実施形態のブロック図を示す。 ビデオデコーダの一実施形態のブロック図を示す。 一実施形態によるビデオを符号化するための例示的な方法を示す。 一実施形態によるビデオを再構成するための例示的な方法を示す。 リサンプリングフィルタに関連付けられたサンプル位置(位相)の例を示す。 一実施形態による、デコーダの例を示す。 対称フィルタ及びフィルタ回転の例を示す。 ある実施形態による再構成されたピクチャをフィルタリングする方法の一例を示す。 一実施形態による、ALFパラメータ送信のためのビットストリームの構造一例を示す。 一実施形態による、RPRが有効化され、ALFが低解像度ピクチャに適用されるデコーダの一例を示す。 一実施形態によるビデオを符号化/復号するための方法のブロック図を示す。 一実施形態による、アップサンプリング後にRPRが有効化され、ALFが高解像度ピクチャに適用されるデコーダの一例を示す。 一実施形態による、RPRが有効化され、ALFが高解像度ピクチャ及び低解像度ピクチャに適用されるデコーダの一例を示す。 高解像度ピクチャのブロック内のサンプル位置(位相)の例を示す。 一実施形態による、アップサンプリング前に位相0で適用された低解像度ALFと、アップサンプリング後の高解像度ALFとの一例を示す。 一実施形態による、仮想境界におけるルーマ成分のための修正されたALFフィルタリングの一例を示す。 本原理の例による通信ネットワークを介して通信する2つのリモートデバイスを示す。 本原理の例による信号のシンタックスを示す。
本出願では、ツール、特徴、実施形態、モデル、手法などを含む様々な態様について説明している。これらの態様のうちの多くは、具体的に説明され、少なくとも個々の特性を示すために、しばしば限定的に聞こえ得るように説明される。しかしながら、これは、説明を明確にすることを目的としており、それらの態様の適用又は範囲を限定するものではない。実際には、異なる態様の全てを組み合わせ、かつ置き換えて、更なる態様を提供することができる。更に、これらの態様はまた同様に、以前の出願に記載の態様と組み合わせ、かつ置き換えすることができる。
本出願において説明され、企図される態様は、多くの異なる形態で実装することができる。以下の図1、図2、及び図3は、いくつかの実施形態を提供するが、他の実施形態が意図され、図1、図2、及び図3の考察は、実装形態の間口を限定するものではない。態様のうちの少なくとも1つは、概して、ビデオ符号化及び復号に関し、少なくとも1つの他の態様は、概して、生成又は符号化されたビットストリームを送信することに関する。これら及び別の態様は、方法、装置、説明した方法のいずれかに従ってビデオデータを符号化又は復号するための命令を自体に記憶したコンピュータ可読記憶媒体、及び/又は、説明した方法のいずれかに従って生成されたビットストリームを自体に記憶したコンピュータ可読記憶媒体、として実装することができる。
本出願では、「再構成された(reconstructed)」及び「復号された(decoded)」という用語は、交換可能に使用され得、「ピクセル(pixel)」及び「サンプル(sample)」という用語は、交換可能に使用され得、「画像(image)」、「ピクチャ(picture)」、及び「フレーム(frame)」という用語は、交換可能に使用され得る。
様々な方法が本明細書に説明されており、本方法の各々は、説明された方法を達成するための1つ以上のステップ又はアクションを含む。ステップ又はアクションの特定の順序が方法の適切な動作のために必要とされない限り、特定のステップ及び/又はアクションの順序及び/又は使用は、修正又は組み合わされ得る。加えて、「第1の(first)」、「第2の(second)」などの用語は、様々な実施形態において、例えば、「第1の復号(first decoding)」及び「第2の復号(second decoding)」などの要素、コンポーネント、ステップ、動作などを修正するために使用され得る。かかる用語の使用は、具体的に必要とされない限り、修正された動作に対する順序付けを意味するものではない。そのため、この実施例では、第1の復号は、第2の復号の前に実施される必要はなく、例えば、第2の復号の前、第2の復号の間、又は第2の復号と重複する時間中に発生し得る。
本出願に記載の様々な方法及び他の態様は、図2及び図3に示すように、ビデオエンコーダ200及びデコーダ300のモジュールを修正するために使用することができる。更に、本開示の態様は、VVC又はHEVCに限定されず、例えば、既存のものであれ将来進展するものであれ、他の規格及び勧告、またこのようないかなる規格及び勧告(VVC及びHEVCを含む)の拡張にも適用することができる。特に断りのない限り、又は技術上除外されない限り、本出願に記載の態様は、個々に、又は組み合わせて使用することができる。
図1は、様々な態様及び実施形態が実装され得るシステムの一例のブロック図を示す。システム100は、以下に記載の様々なコンポーネントを含むデバイスとして具現化され得、本明細書に記載の態様のうちの1つ以上を実行するように構成されている。かかるデバイスの実施例としては、これらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ記録システム、コネクテッド家電、及びサーバなどの様々な電子デバイスが挙げられる。システム100の要素は、単独で、又は組み合わせて、単一の集積回路、複数のIC、及び/又は個別のコンポーネントで具現化され得る。例えば、少なくとも1つの実施形態では、システム100の処理要素及びエンコーダ要素/デコーダ要素は、複数のIC及び/又は別個のコンポーネントにわたって分散している。様々な実施形態では、システム100は、例えば、通信バスを介して、又は専用の入力ポート及び/若しくは出力ポートを通じて、他のシステム、又は他の電子デバイスに通信可能に結合される。様々な実施形態では、システム100は、本出願に記載された態様のうちの1つ以上を実装するように構成される。
システム100は、例えば、本出願に記載された様々な態様を実装するために、内部にロードされた命令を実行するように構成された、少なくとも1つのプロセッサ110を含む。プロセッサ110は、埋め込み型メモリ、入力出力インターフェース、及び当該技術分野で既知であるように様々な他の回路を含み得る。システム100は、少なくとも1つのメモリ120(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム100は、記憶デバイス140を含み、この記憶デバイスは、限定されるものではないが、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、及び/若しくは光ディスクドライブを含む、不揮発性メモリ並びに/又は揮発性メモリを含み得る。記憶デバイス140は、非限定的な例として、内部記憶デバイス、取り付け型記憶デバイス、及び/又はネットワークアクセス可能な記憶デバイスを含み得る。
システム100は、例えば、データを処理して、符号化ビデオ又は復号ビデオを提供するように構成されたエンコーダ/デコーダモジュール130を含み、そのエンコーダ/デコーダモジュール130は、それ自体のプロセッサ及びメモリを含み得る。エンコーダ/デコーダモジュール130は、符号化機能及び/又は復号機能を実施するためにデバイス内に含まれ得るモジュールを表す。既知であるように、デバイスは、符号化及び復号モジュールのうちの一方又は両方を含み得る。加えて、エンコーダ/デコーダモジュール130は、システム100の個別の要素として実装され得るか、又は当業者に知られているように、ハードウェアとソフトウェアの組み合わせとしてプロセッサ110内に組み込まれ得る。
本出願に記載の様々な態様を実行するためにプロセッサ110又はエンコーダ/デコーダ130上にロードされるプログラムコードは、記憶デバイス140内に記憶され、その後、プロセッサ110による実行のためにメモリ120上にロードされ得る。様々な実施形態によれば、プロセッサ110、メモリ120、記憶デバイス140、及びエンコーダ/デコーダモジュール130のうちの1つ以上は、本出願に記載されるプロセスの実行中に、様々な項目のうちの1つ以上を記憶し得る。かかる記憶された項目は、限定されるものではないが、入力ビデオ、復号ビデオ、又は復号ビデオの一部分、ビットストリーム、行列、変数、並びに、方程式、式、動作、及び動作論理の処理からの中間結果又は最終結果を含み得る。
いくつかの実施形態では、プロセッサ110及び/又はエンコーダ/デコーダモジュール130の内部のメモリは、命令を記憶し、符号化又は復号中に必要とされる処理のための作業メモリを提供するために使用される。しかしながら、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ110又はエンコーダ/デコーダモジュール130のいずれかであり得る)の外部のメモリが、これらの機能のうちの1つ以上のために使用される。外部メモリは、メモリ120及び/又は記憶デバイス140、例えば、ダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリであり得る。いくつかの実施形態では、外部不揮発性フラッシュメモリが、テレビのオペレーティングシステムを記憶するために使用される。少なくとも1つの実施形態では、RAMなどの高速な外部の動的揮発性メモリは、MPEG-2(MPEGはMoving Picture Experts Groupを指し、MPEG-2はまたISO/IEC13818を指し、13818-1はまたH.222として既知であり、13818-2はまたH.262として既知である)、HEVC(HEVCはHigh Efficiency Video Codingを指し、H.265及びMPEG-H Part2はまた既知である)、又はVVC(Joint Video Experts Team(JVET)によって開発中の新しい標準である多用途ビデオコーディング)などのビデオのコーディング動作及び復号動作のための作業メモリとして使用される。
システム100の要素への入力は、ブロック105に示されるように、様々な入力デバイスを通して提供され得る。このような入力デバイスには、(i)例えば、放送事業者による放送全体にわたり送信されるRF信号を受信する無線周波数(radio frequency、RF)部分、(ii)コンポーネント(Component、COMP)入力端子(又はCOMP入力端子セット)、(iii)ユニバーサルシリアルバス(Universal Serial Bus、USB)入力端子、及び/又は(iv)高解像度マルチメディアインターフェース(High Definition Multimedia Interface、HDMI)入力端子が含まれるが、これらに限定されない。他の実施例には、図1には示されていないが、コンポジットビデオが含まれる。
様々な実施形態では、ブロック105の入力デバイスは、当該技術分野において知られているように、関連付けられたそれぞれの入力処理要素を有する。例えば、RF部分は、(i)所望の周波数を選択する(信号を選択する、又は信号を周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートする、(iii)特定の実施形態で、(例えば)チャネルと称され得る信号周波数帯域を選択するために、再びより狭い周波数帯域に帯域制限する、(iv)ダウンコンバート及び帯域制限された信号を復調する、(v)誤り訂正を実施する、及び(vi)データパケットの所望のストリームを選択するために多重分離する、ために適切な要素と関連付けられ得る。様々な実施形態のRF部分は、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤差訂正器、及びデマルチプレクサを含む。RF部分は、これらの様々な機能を実行するチューナを含み得、例えば、受信した信号をより低い周波数(例えば、中間周波数、若しくは近接ベースバンド周波数)に、又はベースバンドにダウンコンバートすることが含まれる。セットトップボックスの一実施形態では、RF部とその関連する入力処理要素は、有線(例えば、ケーブル)媒体上で送信されたRF信号を受信し、フィルタ処理し、ダウンコンバートし、また所望の周波数帯域に再びフィルタ処理することによって、周波数選択を行う。様々な実施形態では、上で説明される(及び他の)要素の順序を並べ替える、これらの要素の一部を削除する、並びに/又は、類似若しくは異なる機能を実行する他の要素を追加する。要素を追加することは、既存の要素の間に要素を挿入すること、例えば、増幅器及びアナログ-デジタル変換器を挿入することを含み得る。様々な実施形態において、RF部分は、アンテナを含む。
加えて、USB及び/又はHDMI端末は、USB及び/又はHDMI接続全体にわたって、システム100を他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含み得る。入力処理の様々な態様、例えば、リードソロモン誤り訂正は、例えば、必要に応じて、個別の入力処理IC内又はプロセッサ110内に実装され得ることを理解されたい。同様に、USB又はHDMIインターフェース処理の態様は、必要に応じて、個別のインターフェースIC内又はプロセッサ110内に実装され得る。例えば、プロセッサ110、並びにメモリ及び記憶要素と組み合わせて動作するエンコーダ/デコーダ130を含む様々な処理要素に、復調され、エラー訂正され、逆多重化されたストリームを提供して、出力デバイス上に提示するために必要に応じてデータストリームを処理する。
システム100の様々な要素は、統合されたハウジング内に提供され得、統合されたハウジング内では、様々な要素は、好適な接続構成115、例えば、I2Cバス、配線、及びプリント回路基板を含む、当該技術分野で既知の内部バスを使用して相互に接続され、互いの間でデータを送信し得る。
システム100は、通信チャネル190を介して他のデバイスとの通信を可能にする通信インターフェース150を含む。通信インターフェース150は、限定されるものではないが、通信チャネル190を介してデータを送信及び受信するように構成された送受信機を含み得る。通信インターフェース150は、限定されるものではないが、モデム又はネットワークカードを含み得、通信チャネル190は、例えば、有線及び/又は無線媒体内に実装され得る。
データは、様々な実施形態では、IEEE802.11(IEEEは、米国電気電子技術者協会(Institute of Electrical and Electronics Engineers)を指す)などのWi-Fiネットワークを使用して、システム100にストリーミングされる。これらの実施形態のWi-Fi信号は、Wi-Fi通信用に適合された通信チャネル190及び通信インターフェース150によって受信される。これらの実施形態の通信チャネル190は、典型的には、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするためにインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施形態では、入力ブロック105のHDMI接続によってデータを配信するセットトップボックスを使用して、システム100にストリーミングされたデータを提供する。更に他の実施形態では、入力ブロック105のRF接続を使用して、システム100にストリーミングされたデータを提供する。上で示されるように、様々な実施形態は、データを非ストリーミングの様式で提供する。追加的に、様々な実施形態は、Wi-Fi以外の無線ネットワーク、例えば、セルラネットワーク又はBluetoothネットワークを使用する。
システム100は、出力信号を、ディスプレイ165、スピーカ175、及び他の周辺デバイス185を含む、様々な出力デバイスに提供し得る。様々な実施形態のディスプレイ165は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード(OLED)ディスプレイ、湾曲ディスプレイ、及び/又は折り畳み式ディスプレイのうちの1つ以上を含む。ディスプレイ165は、テレビ、タブレット、ラップトップ、携帯電話(移動電話)、又は他のデバイス用とすることができる。また、ディスプレイ165を、他の構成要素と統合することができ(例えば、スマートフォン内のように)、又は別個にする(例えば、ラップトップ用の外部モニタ)こともできる。他の周辺デバイス185は、実施形態の様々な例において、スタンドアロンのデジタルビデオディスク(又はデジタル多用途ディスク)(両方の用語でDVR)、ディスクプレーヤ、ステレオシステム、及び/又は照明システムのうちの1つ以上を含む。様々な実施形態は、システム100の出力に基づいて機能を提供する1つ以上の周辺デバイス185を使用する。例えば、ディスクプレーヤは、システム100の出力を再生する機能を実施する。
様々な実施形態では、制御信号は、AV.Link、CEC、又はユーザ介入あり若しくはユーザ介入なしでデバイス間制御を可能にする他の通信プロトコルなどのシグナリングを使用して、システム100とディスプレイ165、スピーカ175、又は他の周辺デバイス185との間で通信される。出力デバイスは、それぞれのインターフェース160、170、及び180を通じた専用接続を介してシステム100に通信可能に結合され得る。代替的に、出力デバイスは、通信インターフェース150を介し、通信チャネル190を使用して、システム100に接続され得る。ディスプレイ165及びスピーカ175は、例えば、テレビなどの電子デバイスにおいて、システム100の他のコンポーネントとともに単一ユニットに統合され得る。様々な実施形態では、ディスプレイインターフェース160は、ディスプレイドライバ、例えば、タイミングコントローラ(timing controller、TCon)チップを含む。
ディスプレイ165及びスピーカ175は、代替的に、例えば、入力105のRF部分が個別のセットトップボックスの一部である場合、他のコンポーネントのうちの1つ以上から分離され得る。ディスプレイ165及びスピーカ175が外部コンポーネントである様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む、専用の出力接続を介して提供され得る。
実施形態は、プロセッサ110によって実装されるコンピュータソフトウェアによって、又はハードウェアによって、又はハードウェアとソフトウェアとの組み合わせによって、実行することができる。非限定的な例として、1つ以上の集積回路によって実施形態を実装することができる。メモリ120は、技術環境に適切な任意のタイプのものとすることができ、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、及びリムーバブルメモリデバイスなど、任意の適切なデータ記憶技術を使用して実装することができる。プロセッサ110は、技術環境に適切な任意のタイプのものとすることができ、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を包含することができる。
一態様によれば、ビデオを符号化/復号するための方法が開示され、符号化すべき元のピクチャ及び復号から取得されたピクチャは、より良いコーディング効率のトレードオフのために動的にリスケーリングされ得る。図4及び図5は、VVCの参照ピクチャリサンプリング(Reference Picture Resampling、RPR)ツールのように、符号化する画像を符号化のためにリスケーリングすることができる一実施形態によるビデオをそれぞれ符号化(400)及び復号(500)する方法の例を示す。例えば、そのようなエンコーダ及びデコーダは、VVC規格に準拠することができる。
サイズ(picWidth×picHeight)のピクチャから構成される元のビデオシーケンスが与えられると、エンコーダは、元のピクチャごとに、フレームをコーディングするための解像度(すなわち、ピクチャサイズ)を選択する。異なるPPS(Picture Parameter Set)は、ピクチャのサイズを有するビットストリームにおいてコーディングされ、復号するピクチャのスライス/ピクチャヘッダは、ピクチャを復号するためにデコーダ側でどのPPSを使用するかを示す。
前処理又は後処理としてそれぞれ使用されるダウンサンプラ(440)及びアップサンプラ(540)機能は、HEVCやVVCのような既存の一部の規格によって指定されていない。
各フレームについて、エンコーダは、元の解像度で符号化するか、ダウンサイズされた解像度(例えば、ピクチャの幅/高さを2で割ったもの)で符号化するかを選択する。この選択は、2パス符号化を用いて、又は元のピクチャにおける空間的及び時間的アクティビティを考慮して行うことができる。
エンコーダがダウンサイズされた解像度で元のピクチャを符号化することを選択するとき、元のピクチャは、ビットストリームを生成するためにコアエンコーダ(410)に入力される前にダウンスケールされる(440)。一実施形態によると、次に、ダウンスケールされた解像度で再構成されたピクチャは、後続のピクチャをコーディングするために復号されたピクチャバッファ(decoded picture buffer、DPB)に記憶される(420)。その結果、復号されたピクチャバッファ(DPB)は、現在のピクチャサイズとは異なるサイズのピクチャを含むことができる。
デコーダでは、ビットストリームからピクチャが復号され(510)、ダウンスケールされた解像度で再構成されたピクチャが、後続のピクチャを復号するために復号されたピクチャバッファ(DPB)に記憶される(520)。一実施形態によれば、再構成されたピクチャは、その元の解像度にアップサンプリングされ(540)、例えばディスプレイに送信される。
一実施形態によれば、符号化される現在のピクチャが、現在のピクチャとは異なるサイズを有するDPBからの参照ピクチャを使用する場合、予測ブロックを構築するための参照ブロックのリスケーリング(430/530)(アップスケール又はダウンスケール)は、明示的に(動き補償の前に)又は動き補償プロセス中に暗黙的に行われる。
アップサンプリングフィルタ及びダウンサンプリングフィルタ
従来のビデオコーデックでは、リサンプリングプロセス(ダウンサンプリング及びアップサンプリング)は、線形フィルタを使用して実行される。フィルタは、複雑さを低減するために連続して適用される2つの1Dリサンプリングフィルタ(水平及び垂直)から構成されることが好ましい。
リサンプリングフィルタ係数は、リサンプリングされたピクチャ内の再構成されたサンプル位置(サンプル位相としても既知である)に依存する。例えば、図6は、水平アップサンプリングフィルタの2つの位相が描かれている一方、ダウンサンプリングは1つの位相を有し、元のサンプルは、上に示された元のサンプルに適用されるフィルタ係数の例とともに、上の行に正方形として示され、リサンプリングされたサンプルは、サンプルの0、1の位相を示す内部の番号とともに、下の行に示される。一般に、エイリアシングを回避するために、ダウンサンプルの位置を元のサンプルの位置の中間に選択するのが好ましいが、一方、いくつかのアップサンプル位置は、過度の平滑化を回避するために元の位置と同じ場所に配置され得る。
係数のセットが各サンプル位相に関連付けられている。リサンプリングされた値が入力サンプルと同じであることが起こり得る。これは、通常、アップサンプリングの場合に起こり得る。図6では、VVC基準ソフトウェアの例において、ダウンサンプリング及びアップサンプリングの場合に、各位相に使用される係数を示す。この例では、位相0のアップサンプリングは入力と同じである。
ダウンサンプリング係数:ph0={2,-3,-9,6,39,58,39,6,-9,-3,2,0}
アップサンプリング係数:ph0={0、0、0、64、0、0、0、0}
ph1={-1,4,-11,40,40,-11,4,-1}
VVCでは、4つのループ内フィルタ、すなわち、ルーママッピングクロマスケーリング(luma-mapping chroma scaling、LMCS)、非ブロッキングフィルタ(deblocking filter、DBF)、サンプル適応オフセット(sample adaptive offset、SAO)、及び適応ループフィルタリング(Adaptive Loop Filtering、ALF)がある。
図7は、ビットストリームをエントロピ復号し、逆量子化(invQ)し、逆変換(T-1)し、再構成された残差を提供し、イントラ予測又はインター予測し、再構成された残差を加算した後に得られる再構成されたピクチャに、これらのループ内フィルタが適用されることを示すデコーダの例を示す。
ループ内ALFフィルタ(適応ループフィルタリング)は線形フィルタであり、その目的は、再構成されたサンプルに対するコーディングアーチファクトを低減することである。
図9には、一実施形態による再構成されたピクチャをフィルタリングするための方法900の一例を示す。フィルタの係数「c」は、元のサンプル「s(r)」とフィルタリングされたサンプル「f(r)」との間の平均二乗誤差を最小化するために、ウィナー(Wiener)ベースの適応フィルタ技法を使用することによって、エンコーダ側で判定される(ルーマ成分については920、クロマ成分については930)。
Figure 2024522138000002
ここで、
r=(x,y)は、フィルタリングする領域「R」に属するサンプル場所である。
元のサンプル:s(r)
フィルタリングするサンプル:t(r)
N個の係数を有するFIRフィルタ:c=[c,...cN-1
フィルタタップ位置オフセット:{p,p,...pN-1}、ここでpは、n番目のフィルタタップのrに対するサンプル場所オフセットを示す。以下のようにタップ位置のセットは、フィルタ「形状」とも呼ぶ。
フィルタリングされたサンプル:f(r)
s(r)とf(r)との間の最小二乗和誤差(sum of squared error、SSE)を求めるために、SSEの導関数をcに関して計算することができ、導関数は0に等しく設定される。次に、係数値「c」は、次式(図9より920、930を参照)を解くことによって得られる。
[Tc].c=v(式2)
ここで、
Figure 2024522138000003
VVCの基準によれば、再構成されたルーマサンプル「t(r)」は、K個のクラス(例えば、ルーマサンプルの場合はK=25、クロマサンプルの場合はK=1)に分類され(910)、各クラスのサンプルを用いてK個の異なるフィルタが判定される。分類は、局所勾配を用いて導出された方向性(Directionality)値及びアクティビティ(Activity)値を用いて行われる。
VVCにおいて、ALFの係数は、それらがビデオコンテンツに動的に適応することができるように、ビットストリームにおいてコーディングされ得る。いくつかのデフォルト係数も存在する。940において、エンコーダは、920、930において導出された係数とデフォルト係数との間で、又はCTUがフィルタリングされない場合に、CTUごとにどの係数のセットが使用されるべきかを選択し、示す。950において、選択された係数が再構成されたピクチャに適用される。
VVCでは、対称フィルタを使用することができ(図8の上部)、回転によって他のフィルタからいくつかのフィルタが取得され得る(図8の下部)。
CC-ALF
一実施形態によれば、追加のクロス成分間フィルタ(cross-component filter、CC-ALF)が、クロマサンプルを補正することができる。960において、補正CC-ALF係数が判定される。補正は、再構成され同じ場所に配置されたルーマサンプルの線形結合として行われる。(式1、2)において、s(r)の値はターゲット(元の)クロマサンプル値であり、t(r)はALF前のルーマサンプル値(901)であり、f(r)はクロマ補正である。一変形形態では、t(r)は、ALF後のルーマサンプル値(902)である。ALF係数に関しては、970において、エンコーダは、例えば、レート歪み基準に基づいて、CC-ALF係数を選択し、次に、CC-ALF係数は、980においてクロマ成分に適用される。
このようにして、フィルタリングされたピクチャが990で取得される。
エンコーダ側では、係数選択の情報が、必要であればフィルタ係数とともにビットストリームで送信される。デコーダ側では、再構成されたピクチャをフィルタリングする方法が、最終的にステップ910、950、及び980に対応する。係数は、ビットストリームから送信された情報を使用して取得される。
ALFパラメータ
VVC規格によれば、所与のピクチャについて、ALF係数は、1つのAPS nalユニットにおいてコーディングされ得る。CTUレベルでは、ALF係数は、前の適応パラメータセット(Adaptive Parameters Set、APS)から、又はいくつかのデフォルトから取り出され得る。ALF処理は、CTU単位で行われる。ALFパラメータは3重である(ALFパラメータのビットストリームの構造の例が図10に示されている):
- Alf_ph_param:ピクチャ又はスライスヘッダ内:ALF及びCC-ALFが各成分に対してアクティブ化されるかどうかを示す5つのフラグ:sh_alf_enabled[i=0,1,2],sh_alf_cc_cb_enabled_flag,sh_alf_cc_cr_enabled_flag.
- Alf_aps_param:APSでは、いくつかのALF及びCC-ALF係数フィルタがコーディングされる:alf_data()
- Alf_ctu_param:各CTUについて、CTUヘッダ(コーディングされたピクチャ)において、成分ごとにシグナリングされる:
○ ALFが有効化されている場合:alf_ctb_flag[i=0,1,2][ctu].
○ 及び、有効化されている場合に各成分に対してどのフィルタインデックスを使用するか:alf_luma_fixed_filter_idx(luma),alf_ctb_filter_alt_idx[0,1][ctu],alf_ctb_cc_cb_idc[ctu],alf_ctb_cc_cr_idc[ctu]
他のパラメータ/シンタックス要素もシグナリングされ得る。
VVCにおいて、Alf_ph_param及びAlf_aps_paramは、可変長コーディング(variable length coding、VLC)コーディングを使用し、Alf_ctu_paramは、エントロピコーディング(CABAC)を使用する。
VVCにおけるALFフィルタの設計は、ターゲット参照として使用されるエンコーダ入力ピクチャ(元のピクチャとしても既知である)と再構築/復号されたピクチャとの間のコーディング歪みを低減するために採用されている。しかしながら、RPRが有効化されるとき、入力ピクチャは、高解像度(高解像度用)の元のピクチャをダウンスケーリングした(低解像度用の低解像度)バージョンであるが、表示に望ましいターゲットは依然として高解像度の画像である。
したがって、上述の実施形態によれば、ALF係数は、低解像度ピクチャにおけるコーディングアーチファクトを低減するように最適化され、一方、図11に示されるように、表示のために送信され再構成されたピクチャは、アップサンプリングされた(高解像度)ピクチャである。図11に示されるように、「通常の」ALFが、送信されたALFデータを使用してダウンスケールされ再構成されたピクチャに適用され、フィルタリングされた低解像度ピクチャは、次に、表示のために高解像度ピクチャにアップサンプリングされる。
現在のVVC設計では、RPRがいくつかのピクチャに対して有効化されているとき、これらのピクチャに対してRPRがアクティブ化されているか否かに応じて、再構成されたピクチャは低い空間解像度(以下、低解像度)であり得、又は高い空間解像度(以下、高解像度)であり得る。しかしながら、同じALF係数は再構成されたピクチャに対して、どのような解像度であっても適用されてしまう。
したがって、この状況を改善する必要性がある。
再構成されアップサンプリングされたフレームの歪みを低減するための適応フィルタパラメータをシグナリング及び符号化する方法が提供される。また、適応ポストフィルタを用いてアップサンプリングを実行するいくつかの方法が提供される。
ビデオを符号化/復号するための方法及び装置が提供される。ビデオからのピクチャがビットストリームから復号され、ピクチャは、ピクチャの元の解像度よりも低い解像度でビットストリーム内に符号化される。換言すれば、ピクチャは符号化の前にダウンサンプリングされている。ピクチャを復号することは、復号されたピクチャを元の解像度にアップサンプリングすることと、アップサンプリングされた復号されたピクチャのうち少なくとも1つの第1の成分に適応フィルタを適用することとを更に含む。いくつかの実施形態では、適応フィルタは、復号/符号化プロセスのループ内又はループ外で実行することができる。
図12は、一実施形態によるビデオをそれぞれ符号化、復号するための方法1200のブロック図を示す。再構成されたピクチャが入力として取り込まれる。ビデオを復号するための方法において、再構成されたピクチャは、受信されたビットストリームからのビデオの現在のピクチャの復号から取得される。ビデオを符号化するための方法において、再構成されたピクチャは、ビデオの現在のピクチャの符号化から取得される。再構成されたピクチャは、元のピクチャ解像度からダウンスケールされたバージョンでビットストリームにおいて符号化されている。換言すれば、符号化の前に、第1の空間解像度を有する現在のピクチャ(高解像度)が、第2の空間解像度にダウンサンプリングされ、第2の空間解像度は第1の空間解像度よりも低い。ダウンスケーリングされた(低解像度)ピクチャは、その後、例えば、VVC規格からのRPR技術に従って、ビットストリーム内で符号化されるか、又はビットストリームから復号される。
1210において、再構成されたピクチャは、第1の解像度にアップサンプリングされ、1220において、適応フィルタが、再構成されアップサンプリングされたピクチャの少なくとも1つの成分(ルーマ、クロマ)に適用される。
いくつかの実施形態では、再構成されアップサンプリングされたピクチャは、他のピクチャを符号化/復号するときにインター予測用で将来使用するために復号されたピクチャバッファに記憶されてもよく、及び/又は再構成されアップサンプリングされたピクチャはディスプレイに送信されてもよい。
以下では、解像度が何であれ、再構成されたピクチャに適用される、VVCで説明されているような通常のALF(適応ループフィルタ)及びCC-ALF(クロス成分間適応ループフィルタ)処理を「通常のALF」と呼ぶことにする。
以下では、実施形態は、VVC規格に記載されているようなALF及びCC-ALFを使用する文脈で説明されるが、本明細書に記載される基本方式は、現在のピクチャがダウンスケールされたバージョンで符号化され得るピクチャの符号化と組み合わされたときに、再構築されたピクチャの後処理におけるループ内又はループ外の任意の種類の適応フィルタリングに適用されることを理解されたい。
以下では、復号する方法のみを記載する。符号化が復号(ループ内処理のためのピクチャの再構成)の一部を含むので、同様の処理が符号化方法においても実施される。
アップサンプリングフィルタ後のALF
一実施形態では、再構成されアップサンプリングされたピクチャを改善するために、図13に示すように、アップサンプリングプロセスの後にALFプロセス(高解像度ALF)を適用することができる。図13は、一実施形態によるビデオを復号するための方法1300のブロック図を示す。図13に示されるように、「通常の」ALF(1310)が、送信されたALFデータを使用してダウンスケールされ再構成されたピクチャに適用され、フィルタリングされた低解像度ピクチャは、次に、表示のために高解像度ピクチャにアップサンプリングされる(1320)。アップサンプリングされたピクチャにALF又は適応フィルタが適用される(1330)。一変形形態では、「通常の」ALFによってフィルタリングされた低解像度ピクチャは、後続のピクチャインター予測のためにDPBに記憶される。
別の変形形態では、これは、後続のピクチャインター予測のためにDPB(図13の破線によって表される)に記憶される、1330においてフィルタリングされた高解像度ピクチャである。
一変形形態では、符号化側において、高解像度ピクチャのフィルタリングに使用される係数及びフィルタインデックスは、元の高解像度ピクチャをターゲットとして選択されている。
一変形形態によれば、通常のALFプロセスで補正されたルーマサンプル(図9の990で取得された、フィルタリングされたピクチャ)を使用して別の分類(図9の910)を実行することができる。あるいは、別の変形形態では、通常のALFプロセスによって行われる分類(910)が、複雑さを低減するために再使用される。
アップサンプリングプロセス(アップサンプリングフィルタ)は、仕様によって指定されてもよいし、指定されなくてもよい。上記で説明した変形形態に応じて、アップサンプリングは、符号化ループ内又は符号化ループ外で実行され得る。
通常のALFパラメータ(例:alf_ctb_flags)の一部を再利用し、他の高解像度ALFパラメータをコーディングすることも、完全な高解像度ALFパラメータをコーディングすることもできる(以下で更に説明する)。
alf_ctu_paramはCTUベースである。通常のCTUサイズとは異なるCTUサイズを選択することができる。それは、アップスケーリングプロセスと同じ割合で再スケーリングされた通常のCTUサイズから導出され得る。
高解像度ALFがそれ自体のパラメータを有する場合、適切なシンタックスを用いて通常のALF及び高解像度ALFを別々に有効化又は無効化することを選択することができる。一変形形態では、通常のALFプロセス及び高解像度ALFプロセスは、互いに排他的である(通常のALFプロセス及び高解像度ALFプロセスは、同じスライス又はピクチャに対して一緒にアクティブ化することができない)。この場合、ALFパラメータのための通常のシンタックスを最大限に再利用することができ、ALFパラメータの1つのセットのみがビットストリーム中に存在する。
別の変形形態では、DPBがアップサンプリング後の高解像度ピクチャ及び場合によっては高解像度ALFを含むことができるように、高解像度ピクチャがDPBに記憶される。別の変形形態では、フラグがピクチャごとにコーディングされ、高解像度ピクチャがDPBに記憶されるべきか否かを指示する。
別の変形形態では、アップサンプリングモジュールへの入力は、通常のALFの前に再構成されたサンプルである。次に、低解像度ピクチャは通常のALFで表示され、高解像度ピクチャは高解像度ALFで表示されるが、ALFフィルタの1つのレベルのみ適用される。
単一位相ALF補正のみ行った後のアップサンプリング
実験結果によると、通常のRPR方式の性能は、特にクロマに対して低い可能性がある。
別の実施形態では、高解像度適応フィルタリングは、CC-ALFのみである。図14は、一実施形態によるビデオを復号するための方法1400のブロック図を示す。
一変形形態では、ALFは、アップサンプリング(1430)の前、通常のALFの後、又は通常のALF(1410)の前に、再構成された低解像度ピクチャ(1420)に対して実行され、CC-ALF(1440)は、アップサンプリング(1430)の後、高解像度ピクチャに対して実行される。この変形形態では、低解像度ALF(1420)は、係数を導出するために異なるターゲットサンプルを使用するので、通常のALF(1410)とは異なり、その場合、低解像度ALFの係数と通常のALFの係数とは異なり得る。通常のALFは、元のピクチャのダウンサンプリングされたバージョンを使用して係数を導出する。一方、例えば、低解像度のALF係数は、高解像度の元のピクチャサンプルの1つの特定の位相-X(例えば、図15において灰色の四角形で示される位相-0サンプル)をターゲットとして導出され得る。図16に示されるように、低解像度ALFは、低解像度再構築サンプルに適用される。有利なことに、アップサンプリングプロセスは、低解像度ALFで補正された低解像度サンプルを位相-Xサンプルに使用し、他の位相サンプルは、この補正された(低解像度ALFフィルタリングされた)位相-Xサンプル(水平及び垂直フィルタリングを伴う)を用いて導出され、高解像度画像を提供する。次に、高解像度CC-ALFがアップサンプリングされた(高解像度)ピクチャに適用される。
一変形形態では、1440において、ALF+CC-ALFが実行され得る。
別の変形形態では、1410における通常のALFは実行されなくてもよい。
仮想境界
VVC規格では、ALFプロセスは仮想境界に適合する。仮想境界は、スライス又はタイル境界に対応する。並列性の理由から、仮想境界の外側のサンプルはアクセスされない。ALFフィルタリングの場合、フィルタパターンにおける対称性を保つために、図17に示されるように、仮想境界の外側のフロンティアサンプルと対称なサンプルは使用されない。
しかしながら、アップサンプリングされたピクチャがDPBに記憶されない場合、アップサンプリングプロセスはオプションであり(標準ではない)、外部モジュールによって実行されてもよい。デコーダ側では、上記の実施形態のいずれか1つにおいて記載されたようなALFフィルタプロセスに続くアップサンプリングプロセスは、計算能力をあまり必要とせず、もはや並列処理を必要としない場合がある。したがって、別の実施形態によれば、仮想境界制限プロセスは、本明細書で提供される高解像度適応フィルタリングプロセスに対して無効化される。
ハイレベルシンタックス(HLS)
一実施形態では、追加のシンタックス要素により、提案された高解像度(又は低解像度)ALFパラメータのシグナリングとコーディングとが可能になる。
例えば、(以下の表1及び表2によって例示されるように)新しいAPSタイプ「ALF_RPR_APS」が作成される。関連するALFデータalf_data_rpr()のタイプ及びシンタックスは、それらが新しい高解像度(又は低解像度)ALFパラメータ及び通常のALFパラメータをそれぞれ参照することを除いて、alf_data()と同じである。
一変形形態では、新しいAPSタイプは作成されず、ALFパラメータのためにVVC規格において使用される「ALF_APS」のタイプは、高解像度ALFのために引き続き使用されるが、通常のALFがaps_id(aps_adaptation_parameter_set_id)にいくつかの値を使用するのに対し、高解像度ALFは他の値を使用し得る。
Figure 2024522138000004
Figure 2024522138000005
SPSでは、ピクチャがRPRを使用してコーディングされるときに、高解像度ALFがシーケンスレベルで有効化されるかどうかを示す追加のシンタックス要素sps_alf_rpr_enabled_flagが(以下の表3に示されるように)追加される。一変形形態では、図14~図16に関連して以下に説明するように、ピクチャがRPRを使用してコーディングされるときに、高解像度ピクチャでCC_ALFが有効であるかどうかをシグナリングするためにシンタックス要素sps_ccalf_rpr_enabled_flagも追加される。
Figure 2024522138000006
SPSと同様に、Alf_ph_paramのためのスライス又はピクチャヘッダにおいて、及びAlf_ctu_paramのためのCTUヘッダにおいて、追加のシンタックス要素が、高解像度ALFパラメータをコーディングするために追加され得る。
VVCと互換性のあるHLS
別の実施形態では、新しいAPSをシグナリング及びコーディングするために、現在のVVCと互換性のあるHLSを定義する。新しいAPSタイプ「ALF_RPR_APS」の使用は、通常のVVCデコーダによって破棄されるので、VVCと互換性があるという利点を有する。一変形形態では、Alf_aps_paramに加えて、APSは、いくつかのAlf_ph_param又はAlf_ctu_paramパラメータを含み得る。
別の変形形態では、APSタイプ「ALF_APS」が高解像度ALFのために再使用されるが、aps_idの値が異なる場合、通常のVVCデコーダは、このaps_idがAlf_ph_paramパラメータによってもAlf_ctu_paramパラメータによっても(ブロックのために使用すべきaps_idを示すsh_alf_aps_id_luma及びsh_alf_aps_id_chromaシンタックス要素などによって)参照されないので、高解像度ALFに対応するaps_idを有するAPSを使用しない。
別の変形形態では、Alf_ph_param及びAlf_ctu_param(及びALF_RPR_APS又はALF_APS内にない場合は、Alf_aps_param)を実行する専用の新しいSEI NALユニットタグ(SEI_RPR_ALF)を設計することもできる。これは、関連付けられたピクチャに対する対応するALFパラメータ、又はピクチャPOCで参照されるいくつかのピクチャに対するALFパラメータのリストをグループ化することができる。このSEIは、通常のVVCデコーダによって破棄される。
いくつかの変形形態では、これらのAPS及びSEIは、SEIネストされたメッセージにグループ化されてもよいし、1つのSEIにグループ化されてもよい。
以下の表4は、RPRコーディングピクチャのための高解像度ALFをサポートし、Alf_ph_param及びAlf_ctu_paramのうちの一部と、いくつかの付加的で有用なパラメータとを含む、SEIのシンタックスの一例を示す。この例では、SEIは、いくつかのピクチャに関係する情報を含むが、一変形形態では、SEIは、1つのピクチャのみについての情報を含んでいてもよい。他の例は、いくつかのパラメータを再配置、除去、又は追加することによって導出することができる。
Figure 2024522138000007
Figure 2024522138000008
この例では、Alf_ctu_paramのコーディングは、エントロピコーディング(CABAC)を使用する。一変形形態において、それらは可変長コーディング(VLC)コーディングを使用する。
シンタックス要素XXXX[h]は、インデックスh及びpoc[h]を有するピクチャに関連付けられる。
これらのシンタックス要素の意味は以下の通りである。
alf_rpr_enabled_flag及びccalf_rpr_enabled_flagは、それぞれVVC仕様におけるsps_alf_enabled_flag及びsps_ccalf_enabled_flagと同じセマンティクスを有し、高解像度ALFに適用される。
log2_ctu_size_minus5に5を加えた値は、アップサンプリング後にALFブロックサイズalfCtbSizeYを導出することを可能にする。log2_ctu_size_minus5の値は、例えば両端を含む0~2の範囲であることがある。変数alfCtbLog2SizeY及びalfCtbSizeYは、以下のように導出される:
alfCtbLog2SizeY=log2_ctu_size_minus5+5
alfCtbSizeY=1<<alfCtbLog2SizeY
nb_rpr_ctu_x_minus1+1及びnb_rpr_ctu_y_minus1+1は、アップサンプリング後のALFブロックサイズの水平方向及び垂直方向の数をそれぞれ指定する。
num_alf_rpr_param_minus1+1は、SEIに含まれるピクチャベースのALFパラメータの数を指定する。
pocBase及びdelta_poc[h]は、インデックスhに関連付けられたピクチャのpoc[h]を以下のように導出することを可能にする:
poc[h]=pocBase+delta_poc[h]
他のシンタックス要素XXXX[h]は、VVC仕様に対応するシンボルXXXXと同じセマンティクスを使用するが、ピクチャがRPRを使用してコーディングされるとき、本明細書で提案される高解像度ALFプロセスに適用される。
別の実施形態によれば、VVCスケーラブルシンタックスを利用して、アップスケーリングされたピクチャのポストフィルタリングをエミュレートすることができる。この実施形態では、拡張レイヤ(EL)は、最大ピクチャサイズと現在のピクチャサイズとをそれぞれ含むSPSとPPSを有し、高解像度ピクチャと等しくすることができる。ベースレイヤ(base layer、BL)ピクチャが低解像度でコーディングされるとき、現在のピクチャのEL復号には、動き補償段階中にRPRプロセスを介して暗黙的アップサンプリングを使用し、CUがインター予測でコーディングされ、レイヤ間参照ピクチャ(ILRP)を動きがゼロに等しい一方向参照ピクチャとして使用する場合、レイヤ間参照ピクチャはベースレイヤから再構成された低解像度ピクチャである。
したがって、全てのCUがILRPを用いて予測され、0に等しい残差を有する特定の場合(例:スキップモードでコーディングされたCU、cu_skip_flag=1)、ELにおけるCUの再構成は、暗黙的なRPRアップサンプリングにポストフィルタリングプロセスを加えたものとなる。次いで、EL内のALFパラメータが、上述した実施形態のいずれか1つにおいて説明したように判定されている場合、再構成されアップサンプリングされた低解像度(ベースレイヤピクチャ)にALFが適用される。
しかしながら、既存のVVCシンタックスを再利用するこの手法の1つの欠点は、表示には拡張レイヤの解像度のみが望ましいのに、復号デバイスが2つのデコーダ(レイヤごとに1つのデコーダ)及び関連するリソース(メモリなど)をインスタンス化する必要があることである。付加的に、復号は、アップサンプリング(RPRによる動き補償)及びポストフィルタリング段階を実際に実行する必要があるだけである。
一実施形態では、これらの欠点は、全てのCUがコーディングモードのサブセット(例えば、インタースキップモード)でコーディングされるなど、ELコーディングレイヤビデオシーケンス(CLVS)において使用されるコーディングモードのいくつかの制限をシグナリングする高レベルシンタックスによって活用され得る。このシグナリングは、スライス又はピクチャレベル(例:ピクチャヘッダ、スライスヘッダ)、又は特定のNALユニット(例:SEI、VPS)において実行され、次のピクチャ(ピクチャユニット、PU)又はピクチャのグループ、又はレイヤの全てのピクチャが、ある特定のコーディングモード(例:「スキップモード」)でコーディングされることを示すが、ポストフィルタリングは有効化されてもよい。DBF(非ブロッキングフィルタ)又はSAOが無効化にされるなど、他の制限が、このシグナリングに適用され得る。一変形形態では、SPS及びPPSの無用なシンタックス要素(例えば、使用されない他のコーディングモードパラメータ)は存在しない。
上記では、様々な方法とシンタックス、例えば、(スケーラビリティに関連する)VVCシンタックスを利用して、アップスケールされたピクチャのポストフィルタリングをエミュレートする方法について、ピクチャレベルで説明した。より一般的には、提案されたシグナリングは、領域レベルで適用することができ、領域は、1つ以上のブロック、例えば、1つ以上のサブピクチャ、タイル、及びスライスから構成される。
付加的に、様々な方法及びシンタックスが、ALFフィルタについて上述されている。より一般的には、これらの方法及びシンタックスは、例えば、リスケーリングされたピクチャにSAOフィルタリングを適用するために追加のSAOパラメータを含む、SAOフィルタ及び非ブロッキングフィルタのような他のポストフィルタに適用することができる。
図2は、上述した実施形態のいずれか1つが実施されるエンコーダ200を示す。このエンコーダ200の変形形態も企図されるが、以下では、分かりやすいように、予想される全ての変形形態を説明せずに、エンコーダ200について説明される。
いくつかの実施形態では、図2はまた、HEVC規格に改良を加えたエンコーダ、又はJVET(Joint Video Exploration Team)によって開発中のVVC(Versatile Video Coding)エンコーダなど、HEVCに類似する技術を採用したエンコーダを示す。
符号化される前に、ビデオシーケンスは、符号化前処理(201)、例えば、カラー変換を入力カラーピクチャに適用すること(例えば、RGB4:4:4からYCbCr4:2:0への変換)、又は圧縮に対してより弾力的な信号分布を得るために入力ピクチャ成分の再マッピングを実施する(例えば、色成分のうちの1つのヒストグラム等化を使用して)ことを経ることができる。
一実施形態によれば、符号化前処理(201)は、VVC規格のRPRプロセスなどにおいて、符号化のために入力ピクチャをダウンサンプリングすることを含む。
メタデータは、前処理に関連付けられ、ビットストリームに添付され得る(290)。このようなメタデータは、例えばSEI又はAPS Nalユニットにおいて、上記で説明した高解像度ALFパラメータなど、後処理のためのパラメータを含むことができる。
エンコーダ200では、以下に記載のように、ピクチャは、エンコーダ要素によって符号化される。符号化されるピクチャは、例えば、CUという単位に分割され(202)、処理される。各ユニットは、例えば、イントラモード又はインターモードのいずれかを使用して符号化される。ユニットがイントラモードで符号化されるとき、そのユニットは、イントラ予測(260)を実施する。インターモードでは、動き推定(275)及び動き補償(270)が実施される。エンコーダは、ユニットを符号化するためにイントラモード又はインターモードのうちのどちらを使用すべきかを決定し(205)、例えば、予測モードフラグによってイントラ/インターの決定を示す。エンコーダはまた、イントラ予測結果とインター予測結果を混合(263)してもよいし、又は異なるイントラ/インター予測方法からの結果を混合してもよい。予測残差は、例えば、原画像ブロックから予測されたブロックを減算することによって(210)計算される。
動き改良モジュール(272)は、元のブロックを参照せずにブロックの動きフィールドを改良するために、既に利用可能な参照ピクチャを使用する。ある領域についての動きフィールドは、その領域を有する全てのピクセルについての動きベクトルの集合とみなすことができる。動きベクトルがサブブロックベースである場合、動きフィールドは、領域内の全てのサブブロック動きベクトルの集合として表すこともできる(サブブロック内の全てのピクセルは同じ動きベクトルを有し、動きベクトルはサブブロックごとに異なり得る)。単一の動きベクトルが領域に対して使用される場合、領域に対する動きフィールドもまた、単一の動きベクトル(領域内の全てのピクセルに対して同じ動きベクトル)によって表すことができる。
その予測残差は、次いで、変換され(225)、量子化される(230)。量子化された変換係数、並びに動きベクトル及び他のシンタックス要素は、ビットストリームを出力するためにエントロピコーディングされる(245)。エンコーダは、変換をスキップし、量子化を非変換残差信号に直接適用することができる。エンコーダは、変換及び量子化の両方をバイパスすることができ、すなわち、残差は、変換プロセス又は量子化プロセスを適用することなく直接コーディングされる。
エンコーダは、符号化されたブロックを復号して、更なる予測のための参照を提供する。量子化された変換係数は、予測残差を復号するために逆量子化され(240)、逆変換される(250)。デコードされた予測残差と予測されたブロックとを組み合わせて(255)、画像ブロックが再構成される。ループ内フィルタ(265)は、例えば、符号化アーチファクトを低減するための非ブロック化/サンプル適応オフセット(Sample Adaptive Offset、SAO)又は適応ループフィルタ(Adaptive Loop filter、ALF)フィルタリングを実施するために、再構成されたピクチャに適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
一変形形態では、入力ピクチャが符号化前にダウンサンプリングされている場合、エンコーダ(200)は、一実施形態で上述したように、再構成画像のアップサンプリングを含む。非ブロッキングなどのループ内フィルタリング、SAO(又はALF)は、再構成されダウンサンプリングされたピクチャに適用され、ALFは、アップサンプリングされたピクチャに適用され、場合によってはDPBに記憶され得る。
別の変形形態では、入力ピクチャが符号化の前にダウンサンプリングされているとき、適応フィルタリングは、その後、低解像度バージョンでDPBに記憶され得る再構成ピクチャのダウンサンプリングされたバージョンに対して実行される。
図3は、上述した実施形態のいずれか1つが実施されるビデオデコーダ300のブロック図を示す。デコーダ300では、以下に説明するように、ビットストリームが、デコーダ要素によって復号される。ビデオデコーダ300は、概して、図2に記載の符号化パスとは逆の復号パスを実施する。エンコーダ200もまた、概して、ビデオデータを符号化することの一部としてビデオ復号を実施する。
特に、デコーダの入力は、ビデオビットストリームを含み、このビデオビットストリームは、ビデオエンコーダ200によって生成され得るものである。
一実施形態によれば、ビットストリームは、符号化前にピクチャに対して実行される前処理に関連付けられたメタデータを含む。このようなメタデータ(301)は、上で説明された高解像度ALFパラメータなど、後処理のためのパラメータを含む。
ビットストリームは、最初に、変換係数、動きベクトル、及び他のエンコーディングされた情報を取得するために、エントロピ復号される(330)。ピクチャ分割情報は、ピクチャがどのように分割されているかを示す。デコーダは、したがって、復号されたピクチャ分割情報に従ってピクチャを分割し得る(335)。変換係数は、予測残差を復号するために、逆量子化され(340)、逆変換される(350)。デコードされた予測残差と予測されたブロックとを組み合わせて(355)、画像ブロックが再構成される。
イントラ予測(360)又は動き補償予測(すなわち、インター予測)(375)から、予測ブロックを得ることができる(370)。デコーダは、イントラ予測結果とインター予測結果を混合(373)してもよいし、又は複数のイントラ/インター予測方法からの結果を混合してもよい。動き補償の前に、動きフィールドは、既に利用可能な参照ピクチャを使用することによって改良され得る(372)。ループ内フィルタ(365)は、再構成された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(380)に記憶される。
復号されたピクチャは、復号後処理(385)、例えば、逆カラー変換(例えば、YCbCr4:2:0からRGB4:4:4への変換)、又は符号化前処理(201)において実施された再マッピングプロセスの逆を実施する逆再マッピング、又は復号されたピクチャのアップサンプリングなど、を更に経ることができる。復号後処理は、符号化前処理において導出され、ビットストリームにおいてシグナリングされたメタデータ(301)を使用することができる。
一変形形態では、復号されたピクチャが、符号化前にダウンサンプリングされた入力ピクチャの符号化から得られる場合、デコーダ(300)は、一実施形態で上述したように、復号された画像のアップサンプリングを含む。次いで、非ブロッキング、SAO、又はALFなどのループ内フィルタリングが、ダウンサンプリング及び/又はアップサンプリングされたピクチャに適用され、場合によってはDPBに記憶される。
別の変形形態では、復号されたピクチャが、符号化の前にダウンサンプリングされた入力ピクチャの符号化から取得されるとき、適応フィルタリングが、その後、低解像度バージョンでDPBに記憶され得る再構成ピクチャのダウンサンプリングされたバージョンに対して実行される。
図18に示される一実施形態では、通信ネットワークNETを介した2つの遠隔デバイスAとBとの間の送信コンテキストにおいて、デバイスAは、図1~図17に説明されるようなビデオを符号化するための方法を実装するように構成されたメモリRAM及びROMに関連するプロセッサを備え、デバイスBは、図1~図17に関連して説明されるようなビデオを復号するための方法を実装するように構成されたメモリRAM及びROMに関連するプロセッサを備える。
一実施例によれば、ネットワークは、デバイスAからデバイスBを含む復号デバイスにビデオを表す符号化データをブロードキャスト/送信するように適合されたブロードキャストネットワークである。
デバイスAによって送信されることが意図された信号は、ビデオを表すコーディングされたデータを含む少なくとも1つのビットストリームを搬送する。ビットストリームは、本原理の任意の実施形態から生成されてもよい。
図19は、パケットベースの伝送プロトコル上で送信されるそのような信号のシンタックスの一例を示す。各送信パケットPは、ヘッダH及びペイロードPAYLOADを含む。いくつかの実施形態では、ペイロードPAYLOADは、上述した実施形態のいずれか1つに従って符号化された、コーディングされたビデオデータを含み得る。いくつかの実施形態では、信号は、上記で判定されたアップサンプリングフィルタ係数を含む。
様々な実装形態は、復号することを含む。本出願で使用する際、「復号」は、例えば、ディスプレイに好適な最終出力をもたらすために、受信した符号化されたシーケンスに対して実施されるプロセスの全て又は一部を包含することができる。様々な実施形態において、このようなプロセスには、例えば、エントロピ復号、逆量子化、逆変換、及び差動復号など、通常、デコーダによって行われるプロセスのうちの1つ以上が含まれる。様々な実施形態では、そのようなプロセスにはまた、又は代替的に、本出願に記載される、例えば、アップサンプリングフィルタ係数を復号する、復号されたピクチャをアップサンプリングするなどの様々な実装形態のデコーダによって実施されるプロセスも含まれる。
更なる例として、一実施形態では、「復号」とは、エントロピ復号のみを指し、別の実施形態では、「復号」とは、差動復号のみを指し、別の実施形態では、「復号」とは、エントロピ復号と差動復号との組み合わせを指す。「復号プロセス」という句が、具体的に作業部分集合を指すことを目的とするものであるか、又は全体としてより広範な復号プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
様々な実装形態は、符号化を伴う。「復号(decoding)」に関する上記の考察と同様に、本出願で使用される「符号化(encoding)」は、例えば、符号化されたビットストリームを作り出すために入力ビデオシーケンスに対して実施されるプロセスの全て又は一部を包含することができる。様々な実施形態において、このようなプロセスは、例えば、分割、差動符号化、変換、量子化、及びエントロピ符号化など、エンコーダによって典型的に実行されるプロセスのうちの1つ以上を含む。様々な実施形態では、そのようなプロセスにはまた、又は代替的に、本出願に記載される、例えば、入力ピクチャのダウンサンプリング、アップサンプリングフィルタ係数の判定、復号されたピクチャをアップサンプリングなどの、様々な実装形態のエンコーダによって実施されるプロセスも含まれる。
更なる例として、一実施形態では、「符号化」とは、エントロピ符号化のみを指し、別の実施形態では、「符号化」とは、差動符号化のみを指し、別の実施形態では、「符号化」とは、差動符号化とエントロピ符号化との組み合わせを指す。「符号化プロセス」という句が、具体的に作業部分集合を指すこと目的とするものであるか、又は全体としてより広範な符号化プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
本明細書で使用する際のシンタックス要素が、説明上の用語であることに留意されたい。したがって、これらは他のシンタックス要素名の使用を排除するものではない。
本開示では、例えば、送信又は記憶することができるシンタックスなどの様々な情報を説明してきた。この情報は、様々な様式でパッケージ化又は配置することができ、例えば、情報をSPS、PPS、NALユニット、ヘッダ(例えば、NALユニットヘッダ、又はスライスヘッダ)、又はSEIメッセージに入れるなど、ビデオ規格において一般的な様式を含む。他の様式も利用可能であり、例えば、情報を以下のうちの1つ以上に入れるなどのシステムレベル又はアプリケーションレベルの規格において一般的な様式を含む。
a.SDP(セッション記述プロトコル(session description protocol))、例えば、RFCに説明され、RTP(リアルタイム輸送プロトコル(Real-time Transport Protocol))送信と連動して使用されるような、セッション告知及びセッション招待の目的のためのマルチメディア通信セッションを記述するためのフォーマット。
b.例えば、DASHに説明され、HTTPを介して送信されるようなDASH MPD(Media Presentation Description)記述子であり、記述子は、コンテンツ表現に追加の特性を提供するために、表現又は表現の集合に関連付けられる。
c.例えば、RTPストリーミング中に使用されるような、RTPヘッダ拡張子。
d.例えば、OMAFで使用され、いくつかの仕様では、「atoms」としても既知である一意のタイプ識別子及び長さによって画定されるオブジェクト指向構築ブロックであるボックスを使用するような、ISOベースメディアファイルフォーマット(ISO Base Media File Format)。
e.HTTPを介して送信されるHLS(HTTPライブストリーミング(HTTP Live Streaming))マニフェスト。マニフェストは、例えば、バージョン又はバージョンの集合の特性を提供するために、コンテンツのバージョン又はバージョンの集合に関連付けることができる。
図がフローチャートとして提示されている場合、その図は対応する装置のブロック図も提供するものと理解されたい。同様に、図がブロック図として提示されている場合、その図は対応する方法/プロセスのフローチャートも提供するものと理解されたい。
いくつかの実施形態は、レート歪み最適化を指す。特に、符号化プロセス中に、しばしば計算複雑性の制約ゆえに、レートと歪みとの間のバランス又はトレードオフが通常考慮される。レート歪み最適化は、通常、レートと歪みの加重和であるレート歪み関数を最小化するように定式化される。レート歪み最適化問題を解くには、異なる手法がある。例えば、これらの手法は、全ての考慮されるモード又は符号化パラメータ値を含む全ての符号化オプションの広範なテストに基づき得るが、それらの符号化コスト、並びに符号化及び復号後の再構成された信号の関連する歪みの完全な評価を伴う。符号化複雑性を抑えるために、特に、再構成された信号ではなく、予測又は予測残差信号に基づく近似歪みの計算とともに、より素早い手法を使用することもできる。考えられる符号化選択肢の一部のみに対して近似歪みを使用し、他の符号化選択肢に対しては完全な歪みを使用することなどによって、これらの2つの手法の混合を使用することもできる。他の手法では、考えられる符号化選択肢部分集合のみを評価する。より一般的には、多くの手法は、最適化を実行するために様々な技術のいずれかを採用するが、最適化は、必ずしも符号化コスト及び関連する歪みの両方の完全な評価ではない。
本明細書に記載の実装形態及び態様は、例えば、方法若しくはプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装することができる。たとえ単一の形態の実装形態の文脈でのみ考察される場合でも(例えば、方法としてのみ考察される)、考察された特徴の実装形態は、他の形態(例えば、装置又はプログラム)でも実装することができる。例えば、適切なハードウェア、ソフトウェア、及びファームウェアにおいて装置を実装することができる。この方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブル論理デバイスを含む、一般に処理デバイスを指すプロセッサで実装され得る。プロセッサには、例えば、エンドユーザ間の情報の通信を容易にする、コンピュータ、携帯電話、ポータブル/携帯情報端末(Personal Digital Assistant、「PDA」)などのデバイスなどの通信デバイスも含まれる。
「一実施形態」若しくは「ある実施形態」又は「一実装形態」若しくは「ある実装形態」、並びにそれらの他の変形形態への言及は、その実施形態に関連して説明する特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本出願全体を通して様々な場所に現れる「一実施形態では」若しくは「ある実施形態では」又は「一実装形態では」若しくは「ある実装形態では」、並びに他の変形形態という句が現れるとき、必ずしも全てが同じ実施形態を指しているのではない。
加えて、本出願は、様々な情報を「判定する」ことに言及し得る。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから取り出すことのうちの1つ以上を含むことができる。
更に、本出願は、様々な情報に「アクセスすること」に言及する場合がある。情報にアクセスすることは、例えば、情報を受信すること、(例えば、メモリから)情報を取得すること、情報を記憶すること、情報を移動すること、情報をコピーすること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することのうちの1つ以上を含むことができる。
加えて、本出願は、様々な情報を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報にアクセスすること、又は(例えば、メモリから)情報を取得することのうちの1つ以上を含むことができる。更に、「受信すること」は、一般には、例えば、情報を記憶する、情報を処理する、情報を送信する、情報を移動する、情報をコピーする、情報を消去する、情報を計算する、情報を判定する、情報を予測する、又は情報を推定するなどの操作時に、何らかの形で関与する。
例えば、「A/B」、「A及び/又はB(A and/or B)」及び「A及びBのうちの少なくとも1つ(at least one of A and B)」の場合、次の「/」、「及び/又は(and/or)」、及び「のうちの少なくとも1つ(at least one of)」のいずれかの使用は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することが意図されていることを理解されるべきである。更なる実施例として、「A、B、及び/又はC(A,B,and/or C)」及び「A、B、及びCのうちの少なくとも1つ(at least one of A,B,and C)」の場合、かかる表現は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は第3のリストされた選択肢(C)のみの選択、又は第1及び第2のリストされた選択肢(A及びB)のみの選択、又は第1及び第3のリストされた選択肢(A及びC)のみの選択、又は第2及び第3のリストされた選択肢のみの選択(B及びC)のみ、又は3つ全ての選択肢の選択(A及びB及びC)を包含することが意図される。このことは、当該技術分野及び関連技術分野の当業者に明らかであるように、リストされたアイテムの数だけ拡張され得る。
また、本明細書で使用されるとき、「シグナリングする」という語は、特に、対応するデコーダに対して何かを示すことを意味する。例えば、特定の実施形態では、エンコーダは、再構成されたピクチャの適応フィルタリングに関する1つ以上のシンタックス要素をシグナリングする。このように、ある実施形態では、同じパラメータが、エンコーダ側でもデコーダ側でも使用される。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用することができるように、特定のパラメータをデコーダに送信することができる(明確なシグナリング)。これに対し、デコーダが既にその特定のパラメータとともに他のパラメータも有する場合は、単にデコーダがその特定のパラメータを知ること、及びそれを選択することを可能にするように、送信を行わないシグナリング(暗黙的なシグナリング)を使用することができる。いかなる実際の機能の送信も回避することにより、様々な実施形態において、ビットの節約が実現される。シグナリングは、様々な方法で達成することができることが理解されよう。例えば、1つ以上のシンタックス要素、フラグなどが、様々な実施形態において、対応するデコーダに情報をシグナリングするために使用される。上記は、「信号」という語の動詞形に関連し、「信号」という語は、本明細書では名詞としても使用されることがある。
当業者には明白であるように、実装形態は、例えば、記憶され得る、又は送信され得る情報を搬送するようにフォーマットされた様々な信号をもたらすことができる。情報は、例えば、方法を実施するための命令、又は説明されている実装形態の1つによって生成されるデータを含むことができる。例えば、記載の実施形態のビットストリームを搬送するように、信号をフォーマットすることができる。例えば、電磁波として(例えば、スペクトルの無線周波数部分を使用して)、又はベースバンド信号として、このような信号をフォーマットすることができる。フォーマットすることは、例えば、データストリームを符号化することと、符号化されたデータストリームで搬送波を変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログ情報又はデジタル情報とすることができる。既知であるように、様々な異なる有線リンク又は無線リンク上で信号を送信することができる。信号は、プロセッサ可読媒体に記憶することができる。
いくつかの実施形態について述べる。これらの実施形態の特徴は、様々な特許請求の範疇及びタイプにわたって単独でも、いかなる組み合わせでも提供され得る。更に、実施形態は、様々な特許請求のカテゴリ及びタイプにわたる、以下の特徴、デバイス、又は態様のうちの1つ以上を、単独で、又は任意の組み合わせにおいて、含むことができる。
● 記載の実施形態のいずれかによる、元のピクチャ/領域を高分解能又はより低分解能で符号化することができる、ビデオを符号化/復号すること。
● 記載の実施形態のいずれかによる、ダウンスケールされた復号されたピクチャ/領域からピクチャ/領域を再構成すること。
● ビットストリーム又は信号は、記載されるシンタックス要素、又はその変形形態のうちの1つ以上を含む。
● ビットストリーム又は信号は、記載される実施形態のうちのいずれかに従って生成される情報を運ぶシンタックスを含む。
● 記載されるシンタックス要素、又はその変形形態のうちの1つ以上を含むビットストリーム又は信号を、創出及び/若しくは送信し、かつ/又は受信及び/若しくは復号する。
● 説明された実施形態のいずれかによって、ビットストリーム又は信号を、創出及び/若しくは送信し、かつ/又は受信及び/若しくは復号する。
● 説明された実施形態のいずれかによって、方法、プロセス、装置、命令を記憶する媒体、データ又は信号を記憶する媒体を提供する。
● 記載の実施形態のいずれかによるビデオの復号を実行する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
● 記載される実施形態のいずれかによるビデオの復号を実行し、結果として生じる画像を表示する(例えば、モニタ、スクリーン、又は他のタイプのディスプレイを使用して)表示する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
● 符号化された画像を含む信号を受信するためにチャネルを(例えば、チューナを使用して)選択し、記載の実施形態のいずれかによるビデオの復号を実行する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
● 符号化された画像を含む無線上の信号を(例えば、アンテナを使用して)受信し、記載の実施形態のうちのいずれかによるビデオの復号を実行する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。

Claims (33)

  1. ビデオから第1の解像度で第1のピクチャを復号することを含む方法であって、前記第1のピクチャを復号することが、
    - 復号されたピクチャを前記第1の解像度にアップサンプリングすることであって、前記復号されたピクチャが第2の解像度で符号化され、前記第2の解像度が前記第1の解像度よりも低い、アップサンプリングすることと、
    - アップサンプリングされた前記復号されたピクチャの少なくとも1つの成分に適応フィルタを適用することと、を含む、方法。
  2. 1つ以上のプロセッサを備える装置であって、前記1つ以上のプロセッサが、ビデオから第1の解像度で第1のピクチャを復号するように構成されており、前記第1のピクチャを復号することが、
    - 復号されたピクチャを前記第1の解像度にアップサンプリングすることであって、前記復号されたピクチャが第2の解像度で符号化され、前記第2の解像度が前記第1の解像度よりも低い、アップサンプリングすることと、
    - アップサンプリングされた前記復号されたピクチャの少なくとも1つの成分に適応フィルタを適用することと、を含む、装置。
  3. 前記1つ以上のプロセッサが、
    - 適応ループフィルタの適用が有効化されるとき、前記第2の解像度の前記復号されたピクチャの少なくとも1つの成分に前記適応ループフィルタを適用するように更に構成されている、更に含む、請求項1に記載の方法、又は請求項2に記載の装置。
  4. 前記1つ以上のプロセッサが、
    - 前記適応ループフィルタの前記適用が有効化されるとき、前記第2の解像度のフィルタリングされた前記復号されたピクチャを、復号されたピクチャバッファに記憶するように更に構成されている、更に含む、請求項3に記載の方法、又は請求項3に記載の装置。
  5. 前記適応フィルタの係数が、前記第1の解像度の前記第1のピクチャに基づいて判定される、請求項1又は3若しくは4のいずれか一項に記載の方法、あるいは請求項2~4のいずれか一項に記載の装置。
  6. 前記適応フィルタが、前記アップサンプリングされた復号されたピクチャに対して実行される分類に基づいて、適応フィルタのセットの中から選択される、請求項1若しくは3~5のいずれか一項に記載の方法、又は請求項2~5のいずれか一項に記載の装置。
  7. 前記適応フィルタが、前記第2の解像度の前記フィルタリングされた復号されたピクチャに対して実行される分類に基づいて、適応フィルタのセットの中から選択される、請求項3~6のいずれか一項に記載の方法、又は請求項3~6のいずれか一項に記載の装置。
  8. - 前記第2の解像度の前記復号されたピクチャへの前記適応ループフィルタの前記適用を有効化することが、前記第1の解像度のアップサンプリングされた前記復号されたピクチャへの前記適応フィルタの前記適用を無効化するか、又は
    - 前記第1の解像度の前記アップサンプリングされた復号されたピクチャへの前記適応フィルタの前記適用を有効化することが、前記第2の解像度の前記復号されたピクチャへの前記適応ループフィルタの前記適用を無効化する、請求項3~7のいずれか一項に記載の方法、又は請求項3~7のいずれか一項に記載の装置。
  9. 前記1つ以上のプロセッサが、
    - 前記第1の解像度のフィルタリングされたアップサンプリングされた前記復号されたピクチャを、復号されたピクチャバッファに記憶するように更に構成されている、更に含む、請求項1若しくは3~8のいずれか一項に記載の方法、又は請求項2~8のいずれか一項に記載の装置。
  10. 前記1つ以上のプロセッサが、
    - 前記第1の解像度のフィルタリングされたアップサンプリングされた前記復号されたピクチャが前記復号されたピクチャバッファに記憶されているかどうかを示すインジケータを復号するように更に構成されている、更に含む、請求項9に記載の方法、又は請求項9に記載の装置。
  11. 前記第1の解像度の前記アップサンプリングされた復号されたピクチャに前記適応フィルタを適用することが、クロミナンス成分のみに対して実行される、請求項3~9のいずれか一項に記載の方法又は装置。
  12. 前記第2の解像度の前記復号されたピクチャに適応ループフィルタを適用することが、輝度成分のみに対して実行される、請求項11に記載の方法又は装置。
  13. 前記第2の解像度の前記復号されたピクチャに前記適応ループフィルタを適用することが、前記復号されたピクチャを前記第1の解像度にアップサンプリングする前に実行される、請求項12に記載の方法又は装置。
  14. 前記1つ以上のプロセッサが、
    - 前記第1の解像度の前記アップサンプリングされた復号されたピクチャに前記適応フィルタを適用し、前記第2の解像度の前記復号されたピクチャに適応ループフィルタを適用する前に、前記第2の解像度の前記復号されたピクチャに第2の適応ループフィルタを適用するように更に構成されている、更に含む、請求項11~13のいずれか一項に記載の方法、又は請求項11~13のいずれか一項に記載の装置。
  15. 前記適応ループフィルタの係数が、前記第2の解像度の前記第1のピクチャのサンプルに対応する、前記第1の解像度の前記第1のピクチャのサンプルに基づいて判定される、請求項12~14のいずれか一項に記載の方法又は装置。
  16. 前記適応フィルタのためのパラメータがビットストリームから取得される、請求項1若しくは3~15のいずれか一項に記載の方法、又は請求項2~15のいずれか一項に記載の装置。
  17. ビットストリームであって、
    - ビデオの第1のピクチャであって、前記第1のピクチャは第1の解像度を有し、前記第1のピクチャは第2の解像度で符号化され、前記第2の解像度は前記第1の解像度よりも低い、第1のピクチャを表すコーディングされたデータと、
    - 前記コーディングされたデータから復号された、アップサンプリングされたピクチャの少なくとも1つの成分をフィルタリングするための適応フィルタの少なくとも1つのパラメータと、を含む、ビットストリーム。
  18. 前記適応フィルタの少なくとも1つのパラメータが、前記適応ループフィルタのために使用される同じシンタックス要素においてコーディングされる、請求項16に記載の方法若しくは装置、又は請求項17に記載のビットストリーム。
  19. 前記適応フィルタのパラメータが、
    - 少なくとも1つの成分に対して前記適応フィルタを有効化又は無効化するための少なくとも1つの第1のインジケータ、
    - 少なくとも1つのフィルタ係数、
    - 前記第1のピクチャのブロックに対して前記適応フィルタを有効化又は無効化するための少なくとも1つの第2のインジケータ、
    - 前記第1のピクチャのブロックのためのフィルタインデックスを示す少なくとも1つの第3のインジケータ、のうち少なくとも1つを含む、請求項16若しくは18のいずれか一項に記載の方法又は装置、あるいは請求項17又は18に記載のビットストリーム。
  20. 前記少なくとも1つの第2のインジケータ及び/又は前記少なくとも1つの第3のインジケータが、前記第2の解像度の前記復号されたピクチャのブロックに対して、又は前記第1の解像度の前記第1のピクチャのブロックに対してコーディングされる、請求項19に記載の方法若しくは装置、又はビットストリーム。
  21. コーディングされる前記パラメータのうちの少なくとも一部が、専用適応パラメータセットNALユニット又は専用SEI NALユニットである、請求項16若しくは18~20のいずれか一項に記載の方法又は装置、あるいは請求項17~20のいずれか一項に記載のビットストリーム。
  22. 前記適応フィルタを有効化することが、シーケンスパラメータセットにおいてシグナリングされる、請求項1~21のいずれか一項に記載の方法若しくは装置、又は請求項17~21のいずれか一項に記載のビットストリーム。
  23. 前記少なくとも1つの第1のインジケータが、スライス又はピクチャヘッダ中でシグナリングされる、請求項19~22のいずれか一項に記載の方法又は装置又はビットストリーム。
  24. 前記少なくとも1つの第2のインジケータ及び/又は前記少なくとも1つの第3のインジケータが、前記復号されたピクチャのブロックヘッダ中でシグナリングされる、請求項20~23のいずれか一項に記載の方法若しくは装置、又はビットストリーム。
  25. 復号することを更に含む、請求項1若しくは3_18又は20~24のいずれか一項に記載の方法、又は前記1つ以上のプロセッサが、復号するように更に構成されている、請求項2~18若しくは20~24のいずれか一項に記載の装置、あるいは
    第1のピクチャの全てのブロックがスキップブロックとしてコーディングされ、前記第2の解像度で符号化された前記ピクチャからレイヤ間予測によって予測されることを示すシンタックス要素を更に含む、請求項19~24のいずれか一項に記載のビットストリーム。
  26. 請求項17~25のいずれか一項に記載のビットストリームを含む信号。
  27. 請求項26に記載のビットストリームを含むコンピュータ可読媒体。
  28. 1つ以上のプロセッサに、請求項1又は3~25のいずれか一項に記載の方法を実行させるための命令を記憶しているコンピュータ可読記憶媒体。
  29. 命令を含むコンピュータプログラム製品であって、前記命令は、前記プログラムが1つ以上のプロセッサによって実行されるときに、前記1つ以上のプロセッサに、請求項1又は3~25のいずれか一項に記載の方法を行わせる、コンピュータプログラム製品。
  30. デバイスであって、
    - 請求項2~25のいずれか一項に記載の装置と、
    - (i)ビデオを表すデータを含む信号を受信するように構成されたアンテナ、(ii)受信された前記信号を、ビデオを表す前記データを含む周波数帯域に制限するように構成された帯域制限器、又は(iii)少なくとも1つの第1の画像の少なくとも一部分を表示するように構成されたディスプレイ、のうちの少なくとも1つと、を備える、デバイス。
  31. TV、携帯電話、タブレット又はセットトップボックスを含む、請求項30に記載のデバイス。
  32. 装置であって、
    ○ 請求項26に記載の信号を含むデータにアクセスするように構成されたアクセスユニットと、
    ○ アクセスされた前記データを送信するように構成された送信機と、を備える、装置。
  33. 請求項26に記載の信号を含むデータにアクセスし、かつ前記アクセスされたデータを送信することを含む方法。
JP2023574423A 2021-06-24 2022-06-16 ビデオを符号化/復号するための方法及び装置 Pending JP2024522138A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21305869.6 2021-06-24
EP21305886.0 2021-06-28
EP21305939.7 2021-07-08

Publications (1)

Publication Number Publication Date
JP2024522138A true JP2024522138A (ja) 2024-06-11

Family

ID=

Similar Documents

Publication Publication Date Title
WO2022221374A9 (en) A method and an apparatus for encoding/decoding images and videos using artificial neural network based tools
EP4122202A1 (en) Signaling chroma offset presence in video coding
JP2024522138A (ja) ビデオを符号化/復号するための方法及び装置
WO2022268627A1 (en) Methods and apparatuses for encoding/decoding a video
US20240137504A1 (en) Methods and apparatuses for encoding/decoding a video
CN117813817A (zh) 用于对视频进行编码/解码的方法和装置
US20230141577A1 (en) Method and apparatus for video encoding and decoding
US20230262268A1 (en) Chroma format dependent quantization matrices for video encoding and decoding
US20230379482A1 (en) Spatial resolution adaptation of in-loop and post-filtering of compressed video using metadata
US20220224902A1 (en) Quantization matrices selection for separate color plane mode
KR20240018650A (ko) 픽처 리샘플링을 위한 고급 신택스
CN117280683A (zh) 用于对视频进行编码/解码的方法和装置
WO2023222521A1 (en) Sei adapted for multiple conformance points
WO2023099249A1 (en) Downsample phase indication
WO2023041317A1 (en) Method and apparatus for video encoding and decoding with chroma residuals sampling
CN117716688A (zh) 用于视频编码的外部增强预测
WO2023046463A1 (en) Methods and apparatuses for encoding/decoding a video
CN117880531A (zh) 用于具有交叉分量缩放的亮度映射的方法和设备
WO2023062014A1 (en) ALF APSs FOR MULTILAYER CODING AND DECODING
WO2023072554A1 (en) Video encoding and decoding using reference picture resampling
EP4309368A1 (en) A method or an apparatus for generating film grain parameters, a method or an apparatus for generating a block of pixels with film grain pattern
TW202106017A (zh) 用於視訊編碼及解碼的單一索引量化矩陣設計
CN118077198A (zh) 用于对视频进行编码/解码的方法和装置
CN114788275A (zh) 用于联合Cb-Cr编码的量化矩阵的推导
CN114128275A (zh) 亮度到色度量化参数表信令