JP7201820B2 - ビデオコーディング方法及び機器 - Google Patents

ビデオコーディング方法及び機器 Download PDF

Info

Publication number
JP7201820B2
JP7201820B2 JP2021534733A JP2021534733A JP7201820B2 JP 7201820 B2 JP7201820 B2 JP 7201820B2 JP 2021534733 A JP2021534733 A JP 2021534733A JP 2021534733 A JP2021534733 A JP 2021534733A JP 7201820 B2 JP7201820 B2 JP 7201820B2
Authority
JP
Japan
Prior art keywords
tile
tile group
tiles
group
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021534733A
Other languages
English (en)
Other versions
JP2022513980A (ja
Inventor
ヘンドリー,フヌ
ワーン,イエ-クイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2022513980A publication Critical patent/JP2022513980A/ja
Priority to JP2022205201A priority Critical patent/JP2023029423A/ja
Application granted granted Critical
Publication of JP7201820B2 publication Critical patent/JP7201820B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Auxiliary Devices For And Details Of Packaging Control (AREA)

Description

[技術分野]
本開示は、概して、ビデオコーディングに関し、具体的には、ビデオコーディングにおける増大した圧縮をサポートするために画像をタイルグループにパーティションするメカニズムに関する。
比較的短いビデオでも描写するために必要なビデオデータの量は相当なものになり得る。これは、データが限られた帯域幅能力を有する通信ネットワークに渡りストリーミングされる又はその他の場合に通信されるとき、困難をもたらすことがある。したがって、ビデオデータは、通常、今日の電気通信ネットワークに渡り通信される前に、圧縮される。ビデオが記憶装置に格納されるとき、メモリリソースが限られていることがあるので、ビデオのサイズも問題になり得る。ビデオ圧縮装置は、送信又は記憶の前に、ソースにおいてビデオデータをコーディングするためにソフトウェア及び/又はハードウェアを度々使用し、それによりデジタルビデオ画像を表現するために必要なデータの量を削減する。圧縮されたデータは、次に、ビデオデータを復号するビデオ伸長装置により宛先において受信される。限られたネットワークリソース及びより高いビデオ品質の増え続ける要求に伴い、画像品質を僅かしか又は全く犠牲にせずに圧縮率を向上する改良された圧縮及び伸長技術が望ましい。
実施形態では、本開示は、エンコーダにおいて実施される方法を含み、前記方法は、
前記エンコーダのプロセッサにより、ピクチャを複数のタイルにパーティションするステップと、
前記プロセッサにより、前記タイルの数をタイルグループに割り当てるステップと、
前記プロセッサにより、前記タイルグループがラスタスキャンタイルグループであるとき第1値に、前記タイルグループが長方形タイルグループであるとき第2値に設定されたフラグを符号化するステップであって、前記フラグはビットストリームのパラメータセットに符号化される、ステップと、
前記プロセッサにより、前記タイルグループに基づき、前記タイルを前記ビットストリームに符号化するステップと、
デコーダへの通信のために、前記エンコーダのメモリに前記ビットストリームを格納するステップと、を含む。幾つかのビデオコーディングシステムは、ラスタスキャン順序で指定されたタイルを含むタイルグループを利用する。他のシステムは、仮想現実(virtual reality (VR))、遠隔会議、及びコーディング方式に基づく他の関心領域において、サブピクチャ抽出をサポートするために、長方形タイルグループを利用する。更に他のシステムは、ビデオコーディングアプリケーションのタイプに依存して、どのタイプのタイルグループを使用すべきかを、エンコーダが選択することを可能にする。本発明の態様は、対応するタイルグループがラスタスキャンか又は長方形かを示すフラグを含む。このアプローチは、適正な復号をサポートするための適正なタイルグループコーディング方式をデコーダに警告する。従って、開示のフラグは、エンコーダ/デコーダ(コーデック)が、異なる使用ケースのために複数のタイルグループ方式をサポートすることを可能にし、従ってエンコーダ及びデコーダの両方の機能を向上する。更に、開示のフラグのシグナリングは、コーディング効率を向上し、従って、エンコーダ及び/又はデコーダにおけるメモリリソース使用、処理リソース使用、及び/又はネットワークリソース使用を削減する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記フラグが長方形タイルグループフラグであることを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記フラグが符号化される前記パラメータセットが、シーケンスパラメータセットであることを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記フラグが符号化される前記パラメータセットが、ピクチャパラメータセットであることを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記プロセッサにより、前記タイルグループに含まれる前記タイルを示すために、前記タイルグループの最初のタイルの識別子と、前記タイルグループの最後のタイルの識別子と、を前記ビットストリームに符号化するステップ、を更に含むことを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記タイルグループの前記最初のタイルの前記識別子、及び前記タイルグループの前記最後のタイルの前記識別子は、前記ビットストリーム内のタイルグループヘッダに符号化されることを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記タイルグループが前記ラスタスキャンタイルグループであるとき、前記タイルグループへのタイルの包含は、
前記タイルグループの前記最初のタイルと前記タイルグループの前記最後のタイルとの間のタイルの数を、前記タイルグループ内のタイルの数として決定するステップと、
前記タイルグループ内の前記タイルの数に基づき、タイルの包含を決定するステップと、
により決定されることを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記タイルグループが前記長方形タイルグループであるとき、前記タイルグループへのタイルの包含は、
前記タイルグループの前記最初のタイルと前記タイルグループの前記最後のタイルとの間のデルタ値を決定するステップと、
前記デルタ値及び前記ピクチャ内のタイル列の数に基づき、タイルグループ行の数を決定するステップと、
前記デルタ値及び前記ピクチャ内の前記タイル列の数に基づき、タイルグループ列の数を決定するステップと、
前記タイルグループ行の数及び前記タイルグループ列の数に基づき、前記タイルの包含を決定するステップと、
により決定されることを提供する。
実施形態では、本開示は、デコーダにおいて実施される方法を含み、前記方法は、
前記デコーダのプロセッサにより、受信機を介して、複数のタイルにパーティションされたピクチャを含むビットストリームを受信するステップであって、前記タイルの数はタイルグループに含まれる、ステップと、
前記プロセッサにより、前記ビットストリームのパラメータセットからフラグを取得するステップと、
前記プロセッサにより、前記フラグが第1値に設定されているとき、前記タイルグループがラスタスキャンタイルグループであると決定するステップと、
前記プロセッサにより、前記フラグが第2値に設定されているとき、前記タイルグループが長方形タイルグループであると決定するステップと、
前記プロセッサにより、前記タイルグループが前記ラスタスキャンタイルグループか又は長方形タイルグループかに基づき、前記タイルグループについてタイルの包含を決定するステップと、
前記プロセッサにより、前記タイルグループに基づき、前記タイルを復号して復号タイルを生成するステップと、
前記プロセッサにより、前記復号タイルに基づき、表示のために再構成ビデオシーケンスを生成するステップと、
を含む。幾つかのビデオコーディングシステムは、ラスタスキャン順序で指定されたタイルを含むタイルグループを利用する。他のシステムは、VR、遠隔会議、及びコーディング方式に基づく他の関心領域において、サブピクチャ抽出をサポートするために、長方形タイルグループを利用する。更に他のシステムは、ビデオコーディングアプリケーションのタイプに依存して、どのタイプのタイルグループを使用すべきかを、エンコーダが選択することを可能にする。本発明の態様は、対応するタイルグループがラスタスキャンか又は長方形かを示すフラグを含む。このアプローチは、適正な復号をサポートするための適正なタイルグループコーディング方式をデコーダに警告する。従って、開示のフラグは、コーデックが、異なる使用ケースのために複数のタイルグループ方式をサポートすることを可能にし、従ってエンコーダ及びデコーダの両方の機能を向上する。更に、開示のフラグのシグナリングは、コーディング効率を向上し、従って、エンコーダ及び/又はデコーダにおけるメモリリソース使用、処理リソース使用、及び/又はネットワークリソース使用を削減する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記フラグが長方形タイルグループフラグであることを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記フラグを含む前記パラメータセットが、シーケンスパラメータセットであることを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記フラグを含む前記パラメータセットが、ピクチャパラメータセットであることを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記プロセッサにより、前記タイルグループに含まれる前記タイルを決定するために、前記タイルグループの最初のタイルの識別子と、前記タイルグループの最後のタイルの識別子と、を取得するステップ、を更に含むことを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記タイルグループの前記最初のタイルの前記識別子、及び前記タイルグループの前記最後のタイルの前記識別子は、前記ビットストリーム内のタイルグループヘッダにから取得することを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記タイルグループが前記ラスタスキャンタイルグループであるとき、前記タイルグループへのタイルの包含は、
前記タイルグループの前記最初のタイルと前記タイルグループの前記最後のタイルとの間のタイルの数を、前記タイルグループ内のタイルの数として決定するステップと、
前記タイルグループ内の前記タイルの数に基づき、タイルの包含を決定するステップと、
により決定されることを提供する。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記タイルグループが前記長方形タイルグループであるとき、前記タイルグループへのタイルの包含は、
前記タイルグループの前記最初のタイルと前記タイルグループの前記最後のタイルとの間のデルタ値を決定するステップと、
前記デルタ値及び前記ピクチャ内のタイル列の数に基づき、タイルグループ行の数を決定するステップと、
前記デルタ値及び前記ピクチャ内の前記タイル列の数に基づき、タイルグループ列の数を決定するステップと、
前記タイルグループ行の数及び前記タイルグループ列の数に基づき、前記タイルの包含を決定するステップと、
により決定されることを提供する。
実施形態では、本開示は、ビデオコーディング装置であって、
プロセッサと、前記プロセッサに接続された受信機と、前記プロセッサに接続された送信機と、を含み、前記プロセッサ、受信機、及び送信機は、上述の態様のいずれかの法を実行するよう構成される、ビデオコーディング装置を含む。
一実施形態では、本開示は、ビデオコーディング装置による使用のためのコンピュータプログラムプロダクトを含む非一時的コンピュータ可読媒体であって、前記コンピュータプログラムプロダクトは、プロセッサにより実行されると前記ビデオコーディング装置に前述の態様のいずれかの法を実行させる、前記非一時的コンピュータ可読媒体に記憶されたコンピュータ実行可能命令を含む、非一時的コンピュータ可読媒体を含む。
実施形態では、本開示は、エンコーダであって、
ピクチャを複数のタイルにパーティションするパーティション手段と、
前記タイルの数をタイルグループに含める包含手段と、
符号化手段であって、
前記タイルグループがラスタスキャンタイルグループであるとき第1値に、前記タイルグループが長方形タイルグループであるとき第2値に設定されたフラグを符号化し、前記フラグはビットストリームのパラメータセットに符号化され、
タイルの包含に基づき、前記タイルを前記ビットストリームに符号化する、符号化手段と、
デコーダへの通信のために、前記ビットストリームを格納する格納手段と、
を含むエンコーダを含む。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記エンコーダが、上述の態様のいずれかの法を実行するよう更に構成されることを提供する。
実施形態では、本開示は、デコーダであって、
複数のタイルにパーティションされたピクチャを含むビットストリームを受信する受信手段であって、前記タイルの数はタイルグループに含まれる、受信手段と、
前記ビットストリームのパラメータセットからフラグを取得する取得手段と、
決定手段であって、
前記フラグが第1値に設定されているとき、前記タイルグループがラスタスキャンタイルグループであると決定し、
前記フラグが第2値に設定されているとき、前記タイルグループが長方形タイルグループであると決定し、
前記タイルグループが前記ラスタスキャンタイルグループか又は長方形タイルグループかに基づき、前記タイルグループについてタイルの包含を決定する、決定手段と
前記タイルグループに基づき、前記タイルを復号して復号タイルを生成する復号手段と、
前記復号タイルに基づき、表示のために再構成ビデオシーケンスを生成する生成手段と、
を含むデコーダを含む。
任意で、上述の態様のいずれかにおいて、本態様の別の実装は、前記デコーダが、上述の態様のいずれかの方法を実行するよう更に構成されることを提供する。
明確さを目的として、前述の実施形態のうちのいずれか1つは、他の前述の実施形態のうちの任意の1つ以上と結合されて、本開示の範囲内にある新しい実施形態を生成してよい。
上述及び他の特徴は、添付の図面及び請求の範囲と関連して取り入れられる以下の詳細な説明から一層明確に理解されるだろう。
本開示のより完全な理解のために、ここで、添付の図面及び詳細な説明と関連して以下の簡単な説明を参照する。ここで同様の参照符号は同様の部分を表す。
ビデオ信号をコーディングする例示的な方法のフローチャートである。
ビデオコーディングのための例示的なコーディング及び復号(コーデック)システムの概略図である。
例示的なビデオエンコーダを示す概略図である。
例示的なビデオデコーダを示す概略図である。
符号化ビデオシーケンスを含む例示的なビットストリームを示す概略図である。
ラスタスキャンタイルグループにパーティションされた例示的なピクチャを示す概略図である。
長方形タイルグループにパーティションされた例示的なピクチャを示す概略図である。
例示的なビデオコーディング装置の概略図である。
ピクチャをビットストリームに符号化する例示的な方法のフローチャートである。
ビットストリームからピクチャを復号する例示的な方法のフローチャートである。
ビットストリーム内のビデオピクチャシーケンスをコーディングする例示的なシステムの概略図である。
初めに理解されるべきことに、1つ以上の実施形態の説明的実装が以下に提供されるが、開示のシステム及び/又は方法は、現在知られているか又は既存かに関わらず、任意の数の技術を用いて実装されてよい。本開示は、ここに図示され説明される例示的な設計及び実装を含む以下に説明する説明的実装、図面、及び技術に決して限定されるべきではなく、添付の請求の範囲の範囲内で、それらの均等物の全範囲と共に、変更されてよい。
コーディング木ブロック(coding tree block (CTB))、コーディング木単位(coding tree unit (CTU))、コーディング単位(coding unit (CU))、コーディングビデオシーケンス(coded video sequence (CVS))、共同ビデオ専門家チーム(Joint Video Experts Team (JVET))、動き制約タイルセット(motion constrained tile set (MCTS))、最大転送単位(maximum transfer unit (MTU))、ネットワーク抽象化レイヤ(network abstraction layer (NAL))、ピクチャ順序カウント(picture order count (POC))、生バイトシーケンスペイロード(raw byte sequence payload (RBSP))、シーケンスパラメータセット(sequence parameter set (SPS))、バーサタイルビデオコーディング(versatile video coding (VVC))、及びワーキングドラフト(working draft (WD))のような種々の略語がここで利用される。
多くのビデオ圧縮技術が、最小限のデータ損失によりビデオファイルのサイズを削減するために利用され得る。例えば、ビデオ圧縮技術は、ビデオシーケンスの中のデータ冗長性を低減又は除去するために、空間(例えば、イントラピクチャ)予測及び/又は時間(例えば、インターピクチャ)予測を実行することを含み得る。ブロックに基づくビデオコーディングでは、ビデオスライス(例えば、ビデオピクチャ又はビデオピクチャの部分)は、木ブロック、コーディング木ブロック(coding tree block (CTB))、コーディング木単位(coding tree unit (CTU))、コーディング単位(coding unit (CU))、及び/又はコーディングノードとも呼ばれてよいビデオブロックにパーティションされてよい。ピクチャのイントラコーディング(I)スライス内のビデオブロックは、同じピクチャ内の近隣ブロックの中の参照サンプルに対して空間予測を用いてコーディングされる。ピクチャのインターコーディング片方向予測(P)又は双方向予測(B)スライス内のビデオブロックは、同じピクチャ内の近隣ブロックの中の参照サンプルに対する空間予測、又は他の参照ピクチャ内の参照サンプルに対する時間予測を利用してコーディングされてよい。ピクチャは、フレーム及び/又は画像と呼ばれてよく、参照ピクチャは、参照フレーム及び/又は参照画像と呼ばれてよい。空間又は時間予測は、画像ブロックを表す予測ブロックを生じる。残差データは、元の画像ブロックと予測ブロックとの間のピクセル差を表す。従って、インターコーディングブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、及びコーディングブロックと予測ブロックとの間の差を示す残差データに従い符号化される。イントラコーディングブロックは、イントラコーディングモード及び残差データに従い符号化される。更なる圧縮のために、残差データは、ピクセルドメインから変換ドメインへと変換されてよい。これらは、量子化されてよい残差変換係数を生じる。量子化済み変換係数は、最初に、2次元アレイに構成されてよい。量子化済み変換係数は、1次元ベクトルの変換係数を生成するためにスキャンされてよい。エントロピーコーディングは、更に多くの圧縮を達成するために適用されてよい。このようなビデオ圧縮技術は、以下に更に詳細に議論される。
符号化ビデオが正確に復号されることを保証するために、ビデオは、対応するビデオコーディング規格に従い符号化及び復号される。ビデオコーディング規格は、国際電気通信連合(International Telecommunication Union (ITU))標準化部門(ITU-T)H.261、国際標準化機構/国際電気標準会議(International Organization for Standardization/International Electrotechnical Commission (ISO/IEC))動画専門家グループ(Motion Picture Experts Group (MPEG))-1 Part2、ITU-T H.262、又はISO/IEC MPEG-2 Part2、ITU-T H.263、ISO/IEC MPEG-4 Part2、ITU-T H.264又はISO/IEC MPEG-4 Part10としても知られている高度ビデオコーディング(Advanced Video Coding (AVC))、及びITU-T H.265又はMPEG-H Part2としても知られている高効率ビデオコーディング(High Efficiency Video Coding (HEVC))を含む。AVCは、スケーラブル映像コーディング(Scalable Video Coding (SVC))、多視点映像コーディング(Multiview Video Coding (MVC))、及び多視点映像コーディング及び奥行き(Multiview Video Coding plus Depth (MVC+D))、並びに3次元(three dimensional (3D))AVC(3D-AVC)のような拡張を含む。HEVCは、スケーラブルHEVC(Scalable HEVC (SHVC))、多視点HEVC(Multiview HEVC (MV-HEVC))、及び3D HEVC(3D-HEVC)のような拡張を含む。ITU-T及びISO/IECの共同ビデオ専門家チーム(joint video experts team (JVET))は、バーサタイルビデオコーディング(Versatile Video Coding (VVC))と呼ばれるビデオコーディング規格を開発し始めている。VVCは、JVET-L1001-v5を含むワーキングドラフト(Working Draft (WD))に含まれる。
ビデオ画像をコーディングするために、画像は先ずパーティションされ、パーティションはビットストリームにコーディングされる。種々のピクチャパーティション方式が利用可能である。例えば、画像は、通常スライス、依存スライス、タイルに、及び/又は波面並列処理(Wavefront Parallel Processing (WPP))に従い、パーティションできる。簡単のために、HEVCは、ビデオコーディングのためにスライスをCTBのグループにパーティションするとき、通常スライス、依存スライス、タイル、WPP、及びそれらの組合せのみが使用できるように、エンコーダを制約する。このようなパーティションは、最大転送単位(Maximum Transfer Unit (MTU))サイズ適合、並列処理、及び削減されたエンドツーエンド遅延をサポートするために適用できる。MTUは、単一パケットの中で送信できる最大データ量を示す。パケットペイロードがMTUを超える場合、該ペイロードは、フラグメント化と呼ばれる処理を通じて2個のパケットに分割される。
単にスライスとも呼ばれる通常スライスは、ループフィルタリング動作による何からの相互依存性にも拘わらず、同じピクチャ内の他の通常スライスと独立に再構成可能な画像のパーティションされた部分である。各々の通常スライスは、送信のために、それ自体のネットワーク抽象化層(Network Abstraction Layer (NAL))単位の中にカプセル化される。更に、ピクチャ内予測(イントラサンプル予測、動き情報予測、コーディングモード予測)、及びスライス境界に跨がるエントロピーコーディング依存性は、独立した再構成をサポートするために無効にされてよい。このような独立した再構成は、並列化をサポートする。例えば、通常スライスに基づく並列化は、最小限のインタープロセッサ及びインターコア通信を利用する。しかしながら、各々の通常スライスは独立なので、各スライスは、個別のスライスヘッダに関連付けられる。通常スライスの使用は、スライス毎のスライスヘッダのビットコストにより、及びスライス境界に跨がる予測の欠如により、相当なコーディングオーバヘッドを生じ得る。更に、通常スライスは、MTUサイズ要件の適合をサポートするために利用されてよい。具体的に、通常スライスは別個のNAL単位にカプセル化され、独立にコーディングされ得るので、スライスを複数のパケットに分解することを防ぐために、各々の通常スライスは、MTU方式におけるMTUよりも小さいべきである。このように、並列化の目的と、MTUサイズ適合の目的とは、ピクチャ内のスライスレイアウトに対して矛盾する要求を課すことがある。
依存スライスは、通常スライスと同様であるが、短縮されたスライスヘッダを有し、ピクチャ内予測を壊すことなく、画像木ブロック境界のパーティションを可能にする。従って、依存スライスは、通常スライスが複数のNAL単位にフラグメント化されることを可能にし、これは、通常スライス全体の符号化が完了する前に、通常スライスの部分を送出可能にすることにより、削減されたエンドツーエンド遅延をもたらす。
タイルは、タイルの列及び行を生成する水平及び垂直境界により生成される画像のパーティションされた部分である。タイルはラスタスキャン順序(右から左へ、及び上から下へ)でコーディングされてよい。CTBのスキャン順序はタイル内でローカルである。従って、第1タイル内のCTBは、次のタイル内のCTBに進む前に、ラスタスキャン順序でコーディングされる。通常スライスと同様に、タイルは、ピクチャ内予測依存性、並びにエントロピー復号依存性を壊す。しかしながら、タイルは、個々のNAL単位に含まれなくてよく、従って、タイルはMTUサイズ適合のために使用されなくてよい。各タイルは1つのプロセッサ/コアにより処理でき、近隣タイルを復号する処理ユニットの間でピクチャ内予測のために利用されるインタープロセッサ/インターコア通信は、(隣接タイルが同じスライス内にあるとき)共有スライスヘッダを運ぶこと、及びループフィルタリングに関連する再構成サンプル及びメタデータの共有を実行することに限定され得る。1つより多くのタイルがスライスに含まれるとき、スライス内の最初のエントリポイントオフセット以外の各タイルのエントリポイントバイトオフセットは、スライスヘッダの中でシグナリングされてよい。スライス及びタイル毎に、以下の条件のうちの少なくとも1つが満たされるべきである。1)スライス内の全部のコーディング木ブロックが同じタイルに属する、及び、2)タイル内の全部のコーディング木ブロックが同じスライスに属する。
WPPでは、画像はCTBの単一の行にパーティションされる。エントロピー復号及び予測メカニズムは、他の行の中のCTBからのデータを使用してよい。並列処理は、CTB行の並列復号を通じて可能にされる。例えば、現在の行は、先行する行と並列に復号されてよい。しかしながら、現在の行の復号は、2CTBだけ、先行する行の復号処理から遅れる。この遅延は、現在の行の中の現在CTBの上のCTB及び右上のCTBに関連するデータが、現在CTBがコーディングされる前に利用可能になることを保証する。このアプローチは、図式的に表すと波面として現れる。この時差のある開始は、最大で画像が含むCTB行と同じ数のプロセッサ/コアによる並列化を可能にする。ピクチャ内の近隣木ブロック行の間のピクチャ内予測が許可されるので、ピクチャ内予測を可能にするインタープロセッサ/インターコア通信が重要になり得る。WPPパーティションは、NAL単位サイズを考慮する。従って、WPPは、MTUサイズ適合をサポートしない。しかしながら、通常スライスは、特定のコーディングオーバヘッドを伴い、WPPと関連して使用でき、所望のMTUサイズ適合を実施する。
タイルは、動き制約タイルセットも含んでよい。動き制約タイルセット(motion constrained tile set (MCTS))は、関連する動きベクトルがMCTSの内部にあるフルサンプル位置を、及び補間のためにMCTS内のフルサンプル位置のみを必要とする分数サンプル位置を指すよう制限されるように設計されたタイルセットである。更に、MCTSの外部のブロックから導出される時間動きベクトル予測のための動きベクトル候補の使用は、許されない。このように、各MCTSは、MCTSに含まれないタイルの存在無しに、独立に復号されてよい。時間MCTS補足強化情報(supplemental enhancement information (SEI))メッセージは、ビットストリーム内のMCTSの存在を示すために、及びMCTSをシグナリングするために、使用されてよい。MCTS SEIメッセージは、MCTSの確認ビットストリームを生成するためにMCTSサブビットストリーム抽出(SEIメッセージのセマンティクスの部分として指定される)で使用できる補足情報を提供する。情報は、抽出情報セットの数を含み、それぞれが、MCTSの数を定義し、MCTSサブビットストリーム抽出処理の間に使用されるべき置換ビデオパラメータセット(replacement video parameter set (VPS))、シーケンスパラメータセット(sequence parameter set (SPS))、及びピクチャパラメータセット(picture parameter set (PPS))の生バイトシーケンスペイロード(raw bytes sequence payload (RBSP))バイトを含む。MCTSサブビットストリーム抽出処理に従いサブビットストリームを抽出するとき、スライスアドレスに関連するシンタックス要素(first_slice_segment_in_pic_flag及びslice_segment_addressを含む)の1つ又は全ては抽出されたサブビットストリームの中で異なる値を利用し得るので、パラメータセット(VPS、SPS、及びPPS)は書き換えられ又は置き換えられてよく、スライスヘッダは更新されてよい。
本開示は、種々のタイリング方式に関連する。具体的に、画像がタイルにパーティションされるとき、このようなタイルはタイルグループに割り当てられることができる。タイルグループは、例えば関心領域の表示をサポートするために及び/又は並列処理をサポートするために別個に抽出されコーディングされることのできる関連するタイルのセットである。タイルは、タイルグループに割り当てられることができ、対応するパラメータ、関数、コーディングツール、等のグループ毎の適用を可能にする。例えば、タイルグループはMCTSを含んでよい。別の例として、タイルグループは、別個に処理され及び/又は抽出されてよい。幾つかのシステムは、ラスタスキャンメカニズムを利用して、対応するタイルグループを生成する。ここで使用されるとき、ラスタスキャンタイルグループは、ラスタスキャン順序でタイルを割り当てることにより生成されるタイルグループである。ラスタスキャン順序は、最初のタイル及び最後のタイルの間で、右から左へ及び上から下へと連続的に進行する。ラスタスキャンタイルグループは、例えば並列処理をサポートするために幾つかのアプリケーションにとって有用であり得る。
しかしながら、ラスタスキャンタイルグループは、幾つかの場合には効率的でない場合がある。例えば、仮想現実(virtual reality (VR))アプリケーションでは、環境は、ピクチャに符号化された球として記録される。ユーザは、次に、ピクチャのユーザの選択したサブピクチャを閲覧することにより、環境を経験できる。ユーザの選択したサブピクチャは、関心領域と呼ばれてよい。環境の部分をユーザが選択的に知覚することを可能にすることは、ユーザが該環境内に存在するという感覚を生成する。このように、ピクチャのうちの非選択部分は、見えなくてよく、従って破棄される。従って、ユーザの選択したサブピクチャは、非選択サブピクチャと異なる方法で扱われてよい(例えば、非選択サブピクチャは、より低い解像度でシグナリングされてよく、レンダリングの間に、より簡易なメカニズムを用いて処理されてよい、等である)。タイルグループは、サブピクチャの間でこのような異なる扱いを可能にする。しかしながら、ユーザの選択したサブピクチャは、通常、長方形及び/又は正方形領域である。従って、ラスタスキャンタイルグループは、そのような使用例には有用でない場合がある。
これらの問題を克服するために、幾つかのシステムは長方形タイルグループを利用する。長方形タイルグループは、全体として見ると長方形形状を生じるタイルセットを含むタイルグループである。長方形形状は、ここで使用されるとき、各辺がそれぞれ90°の角度で2つの他の辺に接続されるように正確に4辺が接続された形状である。両方のタイルグループアプローチ(例えば、ラスタスキャンタイルグループ、及び長方形タイルグループ)は、利点及び欠点を有し得る。従って、ビデオコーディングシステムは、両方のアプローチをサポートすることを望み得る。しかしながら、ビデオコーディングシステムは、両方のアプローチが利用可能であるとき、タイルグループの使用を効率的にシグナリングすることができない場合がある。例えば、これらのアプローチのシグナリングの単純なマージは、エンコーダ及び/又はデコーダにおいて非効率であり及び/又はプロセッサ集中的な複雑なシンタックス構造をもたらし得る。本開示は、ビデオコーディング技術におけるこれら及び他の問題を解決するためのメカニズムを提示する。
ここに開示されるのは、簡易且つコンパクトなシグナリングを利用することによりラスタスキャンタイルグループ及び長方形タイルグループの使用を調和させる種々のメカニズムである。このようなシグナリングは、コーディング効率を向上し、従って、エンコーダ及び/又はデコーダにおけるメモリリソース使用、処理リソース使用、及び/又はネットワークリソース使用を削減する。これらのアプローチを調和させるために、エンコーダは、タイルグループのどのタイプが利用されるかを示すフラグをシグナリングできる。例えば、フラグは、SPS及び/又はPPSのようなパラメータセットの中でシグナリングされてよい長方形タイルグループフラグであってよい。フラグは、エンコーダがラスタスキャンタイルグループ又は長方形タイルグループを使用しているかを示すことができる。エンコーダは、従って、タイルグループの中の最初及び最後のタイルを単にシグナリングすることにより、タイルグループメンバシップを示すことができる。最初のタイル、最後のタイル、及びタイルグループタイプの指示に基づき、デコーダは、どのタイルがタイルグループに含まれているかを決定できる。従って、各タイルグループ内の全部のタイルの完全なリストは、ビットストリームから省略されることができ、このことがコーディング効率を向上させる。例えば、タイルグループがラスタスキャンタイルグループである場合、タイルグループに割り当てられたタイルは、タイルグループの最初のタイルと最後のタイルとの間のタイルの数を決定し、及び最初のタイルと最後のタイルとの間の識別子を有する該多数のタイルをタイルグループに追加することにより、決定できる。タイルグループが長方形タイルグループである場合、異なるアプローチが使用できる。例えば、タイルグループの最初のタイルと最後のタイルとの間のデルタ値が決定できる。次に、タイルグループの行の数、及びタイルグループの列の数が、デルタ値及びピクチャ内のタイル列の数に基づき決定できる。タイルグループ内のタイルは、次に、タイルグループの行の数及びタイルグループの列の数に基づき決定できる。これら及び他の例は、以下に詳細に説明される。
図1は、ビデオ信号のコーディングの例示的な動作方法100のフローチャートである。具体的に、ビデオ信号はエンコーダで符号化される。符号化処理は、ビデオファイルサイズを削減するために、種々のメカニズムを利用することにより、ビデオ信号を圧縮する。小さなファイルサイズほど、関連する帯域幅オーバヘッドを削減しながら、ユーザに向けて圧縮されたビデオファイルを送信することを可能にする。デコーダは、次に、エンドユーザに表示するために、圧縮されたビデオガイルを復号して元のビデオ信号を再構成する。復号処理は、通常、符号化処理のミラーであり、デコーダがビデオ信号を矛盾無く再構成することを可能にする。
ステップ101で、ビデオ信号はエンコーダに入力される。例えば、ビデオ信号は、メモリに格納された非圧縮ビデオファイルであってよい。別の例として、ビデオファイルは、ビデオカメラのようなビデオキャプチャ装置によりキャプチャされ、ビデオのライブストリーミングをサポートするために符号化されてよい。ビデオファイルは、オーディオコンポーネント及びビデオコンポーネントの両方を含んでよい。ビデオコンポーネントは、シーケンスの中で閲覧されるとき、動きの視覚的印象を与える一連の画像フレームを含む。フレームは、ここではルマ成分(又はルマサンプル)と呼ばれる光、及びクロマ成分(又はクロマサンプル)と呼ばれる色、の観点で表現されるピクセルを含む。幾つかの例では、フレームは、3次元表示をサポートするために、深さ値も含んでよい。
ステップ103で、ビデオはブロックにパーティションされる。パーティションは、圧縮のために、各フレーム内のピクセルを正方形及び/又は長方形ブロックに細分化することを含む。例えば、高効率ビデオコーディング(High Efficiency Video Coding(HEVC))(H.265及びMPEG-H Part2としても知られる)では、フレームは、先ず、所定のサイズ(例えば、64ピクセル×64ピクセル)のブロックであるコーディング木単位(coding tree unit(CTU))に分割できる。CTUは、ルマ及びクロマサンプルの両方を含む。コーディング木は、CTUをブロックに分割し、次に、更なる符号化をサポートする構成が達成されるまで、ブロックを繰り返し細分化するために利用されてよい。例えば、フレームのルマ成分は、個々のブロックが比較的同種の光の値を含むまで、細分化されてよい。さらに、フレームのクロマ成分は、個々のブロックが比較的同種の色の値を含むまで、細分化されてよい。したがって、パーティションメカニズムは、ビデオフレームの内容に依存して変化する。
ステップ105で、ステップ103でパーティションされた画像ブロックを圧縮するために、種々の圧縮メカニズムが利用される。例えば、インター予測及び/又はイントラ予測が利用されてよい。インター予測は、共通のシーンの中のオブジェクトは連続フレームで現れる傾向があるという事実を利用するよう設計される。したがって、参照フレーム内のオブジェクトを描写するブロックは、隣接フレーム内で繰り返し示される必要がない。具体的には、テーブルのようなオブジェクトは、複数のフレームに渡り、一定の位置に留まってよい。したがって、テーブルは一度示され、隣接フレームは参照フレームに戻り参照できる。複数のフレームに渡りオブジェクトを一致させるために、パターンマッチングメカニズムが利用されてよい。さらに、例えばオブジェクトの動き又はカメラの動きにより、動くオブジェクトが複数のフレームに渡り表示されてよい。特定の例として、ビデオは、複数のフレームに渡りスクリーンを横に移動する自動車を示してよい。このような動きを示すために、動きベクトルが利用できる。動きベクトルは、フレーム内のオブジェクトの座標から参照フレーム内の該オブジェクトの座標へのオフセットを提供する2次元ベクトルである。したがって、インター予測は、現在フレーム内の画像ブロックを、参照フレーム内の対応するブロックからのオフセットを示す動きベクトルのセットとして、符号化できる。
イントラ予測は、共通フレーム内のブロックを符号化する。イントラ予測は、ルマ及びクロマ成分がフレーム内で密集する傾向があるという事実を利用する。例えば、木の一部の緑のパッチは、同様の緑のパッチに隣接して位置する傾向がある。イントラ予測は、複数の方向予測モード(例えば、HEVCでは33個)、平面モード、及び直流(direct current(DC))モードを利用する。方向モードは、現在ブロックが対応する方向の近隣ブロックのサンプルと同様/同じであることを示す。平面モードは、行/列(例えば、平面)に沿う一連のブロックが行の端にある近隣ブロックに基づき補間できることを示す。平面モードは、事実上、変化する値の比較的一定の勾配を利用することにより、行/列に渡る光/色の円滑な遷移を示す。DCモードは、境界円滑化のために利用され、ブロックが方向予測モードの角度方向に関連する全部の近隣ブロックのサンプルに関連する平均値と同様/同じであることを示す。したがって、イントラ予測ブロックは、実際の値の代わりに、種々の関係予測モードとして、画像ブロックを表すことができる。さらに、インター予測ブロックは、実際の値の代わりに、動きベクトル値として、画像ブロックを表すことができる。いずれの場合にも、予測ブロックは、幾つかの場合に画像を正確に表さないことがある。任意の差が残差ブロックに格納される。ファイルを更に圧縮するために、変換が残差ブロックに適用されてよい。
ステップ107で、種々のフィルタリング技術が適用されてよい。HEVCでは、フィルタは、インループフィルタリング方式に従い適用される。上述のブロックに基づく予測は、デコーダにおいて濃淡のむらのある画像の生成をもたらし得る。さらに、ブロックに基づく予測方式は、ブロックを符号化し、次に、参照ブロックとして後に使用するために、符号化したブロックを再構成し得る。インループフィルタリング方式は、ノイズ抑制フィルタ、デブロッキングフィルタ、適応型ループフィルタ、及びサンプル適応型オフセット(sample adaptive offset(SAO))フィルタをブロック/フィルタに繰り返し適用する。これらのフィルタは、このような濃淡のむらのアーチファクトを緩和し、その結果、符号化されたファイルは正確に再構成できる。さら、これらのフィルタは、再構成された参照ブロック内のアーチファクトを緩和し、その結果、再構成された参照ブロックに基づき符号化される後のブロック内で追加アーチファクトを生じる可能性が低い。
ビデオ信号がパーティションされ、圧縮され、及びフィルタリングされると、結果として生じるデータは、ステップ109でビットストリーム内に符号化される。ビットストリームは、上述のデータ、及びデコーダにおける適正なビデオ信号再構成をサポートするための任意の所望のシグナリングデータを含む。例えば、このようなデータは、パーティションデータ、予測データ、残差ブロック、及びデコーダにコーディング指示を提供する種々のフラグを含んでよい。ビットストリームは、要求によりデコーダへ向けて送信するために、メモリに格納されてよい。ビットストリームは、複数のデコーダへ向けてブロードキャスト及び/又はマルチキャストされてもよい。ビットストリームの生成は反復処理である。したがって、ステップ101、103、105、107、及び109は、多数のフレーム及びブロックに渡り連続して及び/又は同時に生じてよい。図1に示す順序は明確さ及び議論の容易さのために提示され、ビデオコーディング処理を特定の順序に限定することを意図しない。
ステップ111で、デコーダは、ビットストリームを受信し、復号処理を開始する。具体的に、デコーダは、エントロピー復号方式を利用して、ビットストリームを対応するシンタックス及びビデオデータに変換する。ステップ111で、デコーダは、ビットストリームからのシンタックスを利用して、フレームのパーティションを決定する。パーティションは、ステップ103におけるブロックパーティションの結果と一致するべきである。ステップ111で利用されるようなエントロピー符号化/復号は、以下に説明される。エンコーダは、圧縮処理の間に、入力画像内の値の空間的位置に基づき幾つかの可能な選択肢からブロックパーティション方式を選択するような、多くの選択肢を生成する。正確な選択肢をシグナリングすることは、膨大な数のビンを利用し得る。ここで使用されるように、ビンは、変数として扱われる2進値である(例えば、コンテキストに依存して変化し得るビット値)。エントロピーコーディングは、許容可能な選択肢のセットを残して、エンコーダが特定の場合に明らかに実行可能ではない任意の選択肢を廃棄することを可能にする。各々の許容可能な選択肢は、次にコードワードを割り当てられる。コードワードの長さは、許容可能な選択肢の数に基づく(例えば、2個の選択肢に対して1つのビン、3~4個の選択肢に対して2つのビン、等)。エンコーダは、次に、選択された選択肢についてコードワードを符号化する。この方式は、全ての可能な選択肢の潜在的に大きな集合からの選択をユニークに示すのとは反対に、可能な選択肢の小さな部分集合からの選択をユニークに示すために望ましい程度の大きさなので、コードワードのサイズを削減する。デコーダは、次に、エンコーダと同様の方法で許容可能な選択肢の集合を決定することにより、選択を復号する。許容可能な選択肢の集合を決定することにより、デコーダは、コードワードを読み出し、エンコーダにより行われた選択を決定できる。
ステップ113で、デコーダは、ブロック復号を実行する。具体的に、デコーダは、逆変換を利用して残差ブロックを生成する。次に、デコーダは、残差ブロック及び対応する予測ブロックを利用して、パーティションに従い画像ブロックを再構成する。予測ブロックは、エンコーダにおいてステップ105で生成されたイントラ予測ブロック及びインター予測ブロックの両方を含んでよい。再構成画像ブロックは、次に、ステップ111で決定されたパーティションデータに従い再構成ビデオ信号のフレームへと位置付けられる。ステップ113のシンタックスも、上述のようなエントロピーコーディングによりビットストリームの中でシグナリングされてよい。
ステップ115で、エンコーダにおけるステップ107と同様の方法で、再構成ビデオ信号のフレームに対してフィルタリングが実行される。例えば、ノイズ抑制フィルタ、デブロッキングフィルタ、適応型ループフィルタ、及びSAOフィルタが、ブロッキングアーチファクトを除去するためにフレームに適用されてよい。フレームがフィルタリングされると、ビデオ信号は、エンドユーザによる閲覧のためにステップ117においてディスプレイへと出力できる。
図2は、ビデオコーディングのための例示的なコーディング及び復号(コーデック)システム200の概略図である。具体的に、コーデックシステム200は、動作方法100の実装をサポートするための機能を提供する。コーデックシステム200は、エンコーダ及びデコーダの両方の中で利用されるコンポーネントを示すために一般化される。コーデックシステム200は、パーティションされたビデオ信号201を生じる、動作方法100におけるステップ101及び103に関して上述したビデオ信号を受信しパーティションする。コーデックシステム200は、次に、方法100におけるステップ105、107、及び109に関して上述したエンコーダとして動作するとき、パーティションされたビデオ信号201をコーディングビットストリームへと圧縮する。デコーダとして動作するとき、コーデックシステム200は、動作方法100におけるステップ111、113、115、及び117に関して上述したようにビットストリームから出力ビデオ信号を生成する。コーデックシステム200は、汎用コーダ制御コンポーネント211、変換スケーリング及び量子化コンポーネント213、イントラピクチャ推定コンポーネント215、イントラピクチャ予測コンポーネント217、動き補償コンポーネント219、動き推定コンポーネント221、スケーリング及び逆変換コンポーネント229、フィルタ制御分析コンポーネント227、インループフィルタコンポーネント225、復号ピクチャバッファコンポーネント223、及びヘッダフォーマット及びコンテキスト適応型2進算術コーディング(ontext adaptive binary arithmetic coding(CABAC))コンポーネント231を含む。このようなコンポーネントは図示のように結合される。図2では、黒線は符号化/復号されるべきデータの動きを示し、一方で、破線は他のコンポーネントの動作を制御する制御データの動きを示す。コーデックシステム200のコンポーネントは、エンコーダ内に全て存在してよい。デコーダは、コーデックシステム200のコンポーネントの一部を含んでよい。例えば、デコーダは、イントラピクチャ予測コンポーネント217、動き補償コンポーネント219、スケーリング及び逆変換コンポーネント229、インループフィルタコンポーネント225、及び復号ピクチャバッファコンポーネント223を含んでよい。これらのコンポーネントはここで説明される。
パーティションされたビデオ信号201は、コーディング木によりピクセルのブロックへとパーティションされた、キャプチャされたビデオシーケンスである。コーディング木は、種々の分割モードを利用して、ピクセルのブロックをより小さなピクセルのブロックへと細分化する。これらのブロックは、次に、より小さなブロックへと更に細分化できる。ブロックは、コーディング木上のノードと呼ばれてよい。より大きな親ノードは、より小さな子ノードへと分割される。ノードが細分化される回数は、ノード/コーディング木の深さと呼ばれる。分割されたブロックは、幾つかの場合にはコーディング単位(coding unit(CU))に含まれ得る。例えば、CUは、ルマブロック、赤色差分クロマ(Cr)ブロック、及び青色差分クロマ(Cb)ブロック、ならびにCUの対応するシンタックス命令を含むCTUの副部分であり得る。分割モードは、利用される分割モードに依存して変化する形状のそれぞれ2、3、又は4個の子ノードにノードをパーティションするために利用される2分木(binary tree(BT))、3分木(triple tree(TT))、及び4分木(quad tree(QT))を含んでよい。パーティションされたビデオ信号201は、汎用コーダ制御コンポーネント211、変換スケーリング及び量子化コンポーネント213、イントラピクチャ推定コンポーネント215、フィルタ制御分析コンポーネント227、及び動き推定コンポーネント221へと圧縮のために転送される。
汎用コーダ制御コンポーネント211は、アプリケーション制約に従いビットストリームへのビデオシーケンスの画像のコーディングに関連する決定を行うよう構成される。例えば、汎用コーダ制御コンポーネント211は、再構成品質に対するビットレート/ビットストリームサイズの最適化を管理する。このような決定は、記憶空間/帯域幅の利用可能性、及び画像解像度要求に基づき行われてよい。汎用コーダ制御コンポーネント211は、また、バッファアンダーラン及びオーバラン問題を緩和するために、変換速度の観点でバッファ利用を管理する。これらの問題に対応するために、汎用コーダ制御コンポーネント211は、他のコンポーネントによるパーティション、予測、及びフィルタリングを管理する。例えば、汎用コーダ制御コンポーネント211は、解像度を増大するために圧縮複雑性を動的に増大させ、解像度及び帯域幅使用を低減するために帯域幅使用を増大し又は圧縮複雑性を減少させてよい。したがって、汎用コーダ制御コンポーネント211は、コーデックシステム200の他のコンポーネントを制御して、ビデオ信号再構成品質とビットレート関心事とのバランスをとる。汎用コーダ制御コンポーネント211は、他のコンポーネントの動作を制御する制御データを生成する。制御データも、デコーダにおける復号のためのパラメータをシグナリングするためにビットストリーム内に符号化されるようヘッダフォーマット及びCABACコンポーネント231へ転送される。
パーティションされたビデオ信号201は、インター予測のために、動き推定コンポーネント221及び動き補償コンポーネント219へも送信される。パーティションされたビデオ信号201のフレーム又はスライスは、複数のビデオブロックに分割されてよい。動き推定コンポーネント221及び動き補償コンポーネント219は、1つ以上の参照フレームの中の1つ以上のブロックに関連して、受信したビデオブロックのインター予測コーディングを実行し、一時的予測を提供する。コーデックシステム200は、例えばビデオデータの各ブロックについて適切なコーディングモードを選択するために、複数のコーディングパスを実行してよい。
動き推定コンポーネント221及び動き補償コンポーネント219は、高度に統合されてよいが、概念的目的のために別個に示される。動き推定コンポーネント221により実行される動き推定は、ビデオブロックについて動きを推定する動きベクトルを生成する処理である。動きベクトルは、例えば、予測ブロックに関連してコーディングオブジェクトの配置を示してよい。予測ブロックは、ピクセル差分の観点で、コーディングされるべきブロックに厳密に一致すると分かったブロックである。予測ブロックは、参照ブロックとも呼ばれてよい。このようなピクセル差分は、絶対値差分の和(sum of absolute difference(SAD))、平方差分の和(sum of square difference(SSD))、又は他の差分メトリックにより決定されてよい。HEVCは、CTU、コーディング木ブロック(coding tree block(CTB))、及びCUを含む幾つかのコーディングオブジェクトを利用する。例えば、CTUは、CTBに分割でき、CTBは次にCUに含むためにCBに分割できる。CUは、予測データを含む予測単位(prediction unit(PU))及び/又はCUの変換された残差データを含む変換単位(transform unit(TU))として符号化できる。動き推定コンポーネント221は、レート歪み最適化処理の部分としてレート歪み分析を用いて、動きベクトル、PU及びTUを生成する。例えば、動き推定コンポーネント221は、現在ブロック/フレームについて複数の参照ブロック、複数の動きベクトル、等を決定してよく、最適なレート歪み特性を有する参照ブロック、動きベクトル、等を選択してよい。最適なレート歪み特性は、ビデオ再構成の品質(例えば、圧縮によるデータ損失の量)及びコーディング効率(例えば、最終的な符号化のサイズ)の両方のバランスをとる。
幾つかの例では、コーデックシステム200は、復号ピクチャバッファコンポーネント223に格納された参照ピクチャのサブ整数ピクチャ位置の値を計算してよい。例えば、ビデオコーデックシステム200は、参照ピクチャの4分の1ピクセル位置、8分の1ピクセル位置、又は他の分数ピクセル位置の値を補間してよい。したがって、動き推定コンポーネント221は、完全ピクセル位置及び分数ピクセル位置に関連して動き探索を実行し、分数ピクセル精度で動きベクトルを出力してよい。動き推定コンポーネント221は、PUの位置を参照ピクチャの予測ブロックの位置と比較することにより、インターコーディングスライスの中のビデオブロックのPUについて、動きベクトルを計算する。動き推定コンポーネント221は、計算した動きベクトルを動きデータとして、符号化のためにヘッダフォーマット及びCABACコンポーネント231へ、動きを動き補償コンポーネント219へ出力する。
動き補償コンポーネント219により実行される動き補償は、動き推定コンポーネント221により決定された動きベクトルに基づき、予測ブロックをフェッチする又は生成することを含んでよい。ここでも、動き推定コンポーネント221及び動き補償コンポーネント219は、幾つかの例では機能的に統合されてよい。現在ビデオブロックのPUの動きベクトルを受信すると、動き補償コンポーネント219は、動きベクトルの指す予測ブロックの位置を特定してよい。次に、コーディングされている現在ビデオブロックのピクセル値から予測ブロックのピクセル値を減算してピクセル差分値を形成することにより、残差ビデオブロックが形成される。一般に、動き推定コンポーネント221は、ルマ成分に関連して動き推定を実行し、動き補償コンポーネント219は、クロマ成分及びルマ成分の両方についてルマ成分に基づき計算された動きベクトルを使用する。予測ブロック及び残差ブロックは、変換スケーリング及び量子化コンポーネント213へ転送される。
パーティションされたビデオ信号201は、イントラピクチャ推定コンポーネント215及びイントラピクチャ予測コンポーネント217へも送信される。動き推定コンポーネント221及び動き補償コンポーネント219と同様に、イントラピクチャ推定コンポーネント215及びイントラピクチャ予測コンポーネント217は、高度に統合されてよいが、概念的目的のために別個に示される。上述のようなフレーム間の動き推定コンポーネント221及び動き補償コンポーネント219により実行されるインター予測の代わりに、イントラピクチャ推定コンポーネント215及びイントラピクチャ予測コンポーネント217は、現在フレーム内のブロックに関連して現在ブロックをイントラ予測する。特に、イントラピクチャ推定コンポーネント215は、現在ブロックを符号化するために使用すべきイントラ予測モードを決定する。幾つかの例では、イントラピクチャ推定コンポーネント215は、複数のテストされたイントラ予測モードから、現在ブロックを符号化するための適切なイントラ予測モードを選択する。選択したイントラ予測モードは、次に、符号化のためにヘッダフォーマット及びCABACコンポーネント231へ転送される。
例えば、イントラピクチャ推定コンポーネント215は、種々のテストされたイントラ予測モードについてレート歪み分析を用いてレート歪み値を計算し、テストしたモードの中で最適なレート歪み特性を有するイントラ予測モードを選択する。レート歪み分析は、一般に、符号化ブロックと、符号化されて該符号化ブロックを生成した元の未符号化ブロックとの間の歪み(又は誤差)の量、並びに符号化ブロックを生成するために使用されたビットレート(例えば、ビット数)を決定する。イントラピクチャ推定コンポーネント215は、種々の符号化ブロックについて歪み及びレートから比を計算して、ブロックについて、どのイントラ予測モードが最適なレート歪み値を示すかを決定する。さらに、イントラピクチャ推定コンポーネント215は、レート歪み最適化(rate-distortion optimization(RDO))に基づき、深さモデル化モード(depth modeling mode(DMM))を用いて深さマップの深さブロックをコーディングするよう構成されてよい。
イントラピクチャ予測コンポーネント217は、エンコーダに実装されるとき、イントラピクチャ推定コンポーネント215により決定された、選択されたイントラ予測モードに基づき、予測ブロックから残差ブロックを生成し、又は、デコーダに実装されるとき、ビットストリームから残差ブロックを読み出してよい。残差ブロックは、行列として表現される、予測ブロックと元のブロックとの間の値の差分を含む。残差ブロックは、次に、変換スケーリング及び量子化コンポーネント213へ転送される。イントラピクチャ推定コンポーネント215及びイントラピクチャ予測コンポーネント217は、ルマ及びクロマ成分の両方に対して動作してよい。
変換スケーリング及び量子化コンポーネント213は、残差ブロックを更に圧縮するよう構成される。変換スケーリング及び量子化コンポーネント213は、離散コサイン変換(discrete cosine transform(DCT))、離散サイン変換(discrete sine transform(DST))、又は概念的に類似する変換のような変換を残差ブロックに適用して、残差変換係数値を含むビデオブロックを生成する。ウェーブレット変換、整数変換、サブバンド変換、又は他の種類の変換も使用され得る。変換は、残差情報を、ピクセル値ドメインから周波数ドメインのような変換ドメインへと変換してよい。変換スケーリング及び量子化コンポーネント213は、また、例えば周波数に基づき、変換された残差情報をスケーリングするよう構成される。このようなスケーリングは、倍率を残差情報に適用することを含む。その結果、異なる周波数情報は異なる粒度で量子化され、これは再構成ビデオの最終的な視覚的品質に影響を与え得る。変換スケーリング及び量子化コンポーネント213は、また、ビットレートを更に低減するために、変換係数を量子化するよう構成される。量子化処理は、係数の一部又は全部に関連するビット深さを低減してよい。量子化の程度は、量子化パラメータを調整することにより、変更されてよい。幾つかの例では、変換スケーリング及び量子化コンポーネント213は、次に、量子化された変換係数を含む行列のスキャンを実行してよい。量子化された変換係数は、ビットストリーム内に符号化されるために、ヘッダフォーマット及びCABACコンポーネント231へ転送される。
スケーリング及び逆変換コンポーネント229は、動き推定をサポートするために、変換スケーリング及び量子化コンポーネント213の逆処理を適用する。スケーリング及び逆変換コンポーネント229は、逆スケーリング、変換、及び/又は量子化を適用して、例えば別の現在ブロックのための予測ブロックになり得る参照ブロックとして後に使用するために、ピクセルドメインの残差ブロックを再構成する。動き推定コンポーネント221及び/又は動き補償コンポーネント219は、後のブロック/フレームの動き推定で使用するために、残差ブロックを対応する予測ブロックに加算して戻すことにより、参照ブロックを計算してよい。スケーリング、量子化、及び変換の間に生成されたアーチファクトを低減するために、再構成された参照ブロックにフィルタが適用される。このようなアーチファクトは、そうでなければ、後続のブロックが予測されるときに不正確な予測を生じ(及び追加アーチファクトを生成し)得る。
フィルタ制御分析コンポーネント227及びインループフィルタコンポーネント225は、残差ブロックに及び/又は再構成画像ブロックにフィルタを適用する。例えば、スケーリング及び逆変換コンポーネント229からの変換された残差ブロックは、元の画像ブロックを再構成するために、イントラピクチャ予測コンポーネント217及び/又は動き補償コンポーネント219からの対応する予測ブロックと結合されてよい。フィルタは、次に、再構成画像ブロックに適用されてよい。幾つかの例では、フィルタは、代わりに、残差ブロックに適用されてよい。図2の他のコンポーネントと同様に、フィルタ制御分析コンポーネント227及びインループフィルタコンポーネント225は、高度に統合され一緒に実装されてよいが、概念的目的のために別個に示される。再構成された参照ブロックに適用されるフィルタは、特定の空間領域に適用され、このようなフィルタがどのように適用されるかを調整するための複数のパラメータを含む。フィルタ制御分析コンポーネント227は、再構成された参照ブロックを分析して、このようなフィルタが適用されるべき場合を決定し、対応するパラメータを設定する。このようなデータは、ヘッダフォーマット及びCABACコンポーネント231へ、符号化のためのフィルタ制御データとして転送される。インループフィルタコンポーネント225は、フィルタ制御データに基づき、このようなフィルタを適用する。フィルタは、デブロッキングフィルタ、ノイズ抑制フィルタ、SAOフィルタ、及び適応型ループフィルタを含んでよい。このようなフィルタは、例に依存して、(例えば、再構成されたピクセルブロック上の)空間/ピクセルドメインにおいて、又は周波数ドメインにおいて、適用されてよい。
エンコーダとして動作するとき、フィルタリングされた再構成画像ブロック、残差ブロック、及び/又は予測ブロックは、上述のように動き推定において後に使用するために、復号ピクチャバッファコンポーネント223に格納される。デコーダとして動作するとき、復号ピクチャバッファコンポーネント223は、出力ビデオ信号の部分として、再構成されフィルタリングされたブロックを格納しディスプレイへ向けて転送する。復号ピクチャバッファコンポーネント223は、予測ブロック、残差ブロック、及び/又は再構成画像ブロックを格納することの可能な任意のメモリ装置であってよい。
ヘッダフォーマット及びCABACコンポーネント231は、コーデックシステム200の種々のコンポーネントからデータを受信し、デコーダへ向けて送信するためにこのようなデータをコーディングビットストリームに符号化する。具体的に、ヘッダフォーマット及びCABACコンポーネント231は、一般制御データ及びフィルタ制御データのような制御データを符号化するために種々のヘッダを生成する。さらに、イントラ予測及び動きデータを含む予測データ、並びに量子化された変換係数データの形式の残差データは、全てビットストリーム内に符号化される。最終的なビットストリームは、元のパーティションされたビデオ信号201を再構成するためにデコーダにより所望される全ての情報を含む。このような情報は、イントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)、種々のブロックの符号化コンテキストの定義、最も有望なイントラ予測モードの指示、パーティション情報の指示、等も含んでよい。このようなデータは、エントロピーコーディングを利用することにより、符号化されてよい。例えば、情報は、コンテキスト適応型可変長コーディング(context adaptive variable length coding(CAVLC))、シンタックスに基づくコンテキスト適応型2進算術コーディング(syntax-based context-adaptive binary arithmetic coding(SBAC))、確率区間パーティショニングエントロピー(probability interval partitioning entropy(PIPE))コーディング、又は別のエントロピーコーディング技術を利用することにより、符号化されてよい。エントロピーコーディングに従い、コーディングされたビットストリームは、別の装置(例えば、ビデオデコーダ)へ送信され、又は後の送信又は読み出しのために保存されてよい。
図3は、例示的なビデオエンコーダ300を示すブロック図である。ビデオエンコーダ300は、コーデックシステム200の符号化機能を実装するために、及び/又は動作方法100のステップ101、103、105、107及び/又は109を実装するために、利用されてよい。エンコーダ300は、入力ビデオ信号をパーティションして、実質的にパーティションされたビデオ信号201と同様であるパーティションされたビデオ信号301を生じる。パーティションされたビデオ信号301は、次に、エンコーダ300のコンポーネントにより圧縮されビットストリームに符号化される。
具体的に、パーティションされたビデオ信号301は、イントラ予測のためにイントラピクチャ予測コンポーネント317へ転送される。イントラピクチャ予測コンポーネント317は、イントラピクチャ推定コンポーネント215及びイントラピクチャ予測コンポーネント217と実質的に同様であってよい。パーティションされたビデオ信号301は、復号ピクチャバッファコンポーネント323の中の参照ブロックに基づくインター予測のために動き補償コンポーネント321へも転送される。動き補償コンポーネント321は、動き推定コンポーネント221及び動き補償コンポーネント219と実質的に同様であってよい。イントラピクチャ予測コンポーネント317及び動き補償コンポーネント321からの予測ブロック及び残差ブロックは、残差ブロックの変換及び量子化のために、変換及び量子化コンポーネント313へ転送される。変換及び量子化コンポーネント313は、変換スケーリング及び量子化コンポーネント213と実質的に同様であってよい。変換され量子化された残差ブロック及び対応する予測ブロックは(関連する制御データと一緒に)、ビットストリームへのコーディングのためにエントロピーコーディングコンポーネント313へ転送される。エントロピーコーディングコンポーネント331は、ヘッダフォーマット及びCABACコンポーネント231と実質的に同様であってよい。
変換され量子化された残差ブロック及び/又は対応する予測ブロックは、また、動き補償コンポーネント321による使用のために参照ブロックへと再構成するために、変換及び量子化コンポーネント313から逆変換及び量子化コンポーネント329へ転送される。逆変換及び量子化コンポーネント329は、スケーリング及び逆変換コンポーネント229と実質的に同様であってよい。インループフィルタコンポーネント325の中のインループフィルタも、例に依存して、残差ブロック及び/又は再構成された参照ブロックに適用される。インループフィルタコンポーネント325は、フィルタ制御分析コンポーネント227及びインループフィルタコンポーネント225と実質的に同様であってよい。インループフィルタコンポーネント325は、インループフィルタコンポーネント225に関して議論したような複数のフィルタを含んでよい。フィルタリングされたブロックは、次に、動き補償コンポーネント321により参照ブロックとして使用するために、復号ピクチャバッファコンポーネント323に格納される。復号ピクチャバッファコンポーネント323は、復号ピクチャバッファコンポーネント223と実質的に同様であってよい。
図4は、例示的なビデオデコーダ400を示すブロック図である。ビデオエンコーダ400は、コーデックシステム200の復号機能を実装するために、及び/又は動作方法100のステップ111、113、115及び/又は117を実装するために、利用されてよい。デコーダ400は、例えばエンコーダ300からビットストリームを受信し、エンドユーザに表示するためにビットストリームに基づき再構成された出力ビデオ信号を生成する。
ビットストリームは、エントロピー復号コンポーネント433により受信される。エントロピー復号コンポーネント433は、CAVLC、CABAC、SBAC、PIPEコーディングのようなエントロピー復号方式、又は他のエントロピーコーディング技術を実装するよう構成される。例えば、エントロピー復号コンポーネント433は、ビットストリーム内にコードワードとして符号化された追加データを解釈するために、ヘッダ情報を利用してコンテキストを提供してよい。復号された情報は、一般制御データ、フィルタ制御データ、パーティション情報、動きデータ、予測データ、及び残差ブロックからの量子化済み変換係数のような、ビデオ信号を復号するための任意の所望の情報を含む。量子化済み変換係数は、残差ブロックへと再構成するために、逆変換及び量子化コンポーネント429へ転送される。逆変換及び量子化コンポーネント429は、逆変換及び量子化コンポーネント329と同様であってよい。
再構成残差ブロック及び/又は予測ブロックは、イントラ予測動作に基づき画像ブロックへと再構成するために、イントラピクチャ予測コンポーネント417へ転送される。イントラピクチャ予測コンポーネント417は、イントラピクチャ推定コンポーネント215及びイントラピクチャ予測コンポーネント217と同様であってよい。具体的に、イントラピクチャ予測コンポーネント417は、フレーム内の参照ブロックの位置を特定するために予測モードを利用し、結果に残差ブロックを適用して、イントラ予測された画像ブロックを再構成する。再構成されたイントラ予測された画像ブロック及び/又は残差ブロック、及び対応するインター予測データは、それぞれ復号ピクチャバッファコンポーネント223及びインループフィルタコンポーネント225と実質的に同様であってよいインループフィルタコンポーネント425を介して復号ピクチャバッファコンポーネント423へ転送される。インループフィルタコンポーネント425は、再構成画像ブロック、残差ブロック、及び/又は予測ブロックをフィルタリングし、そのような情報は復号ピクチャバッファコンポーネント423に格納される。復号ピクチャバッファコンポーネント423からの再構成画像ブロックは、インター予測のために動き補償コンポーネント421へ転送される。動き補償コンポーネント421は、動き推定コンポーネント221及び/又は動き補償コンポーネント219と実質的に同様であってよい。具体的に、動き補償コンポーネント421は、参照ブロックからの動きベクトルを利用して、予測ブロックを生成し、結果に残差ブロックを提供して、画像ブロックを再構成する。結果として生じた再構成ブロックは、インループフィルタコンポーネント425を介して、復号ピクチャバッファコンポーネント423へ転送されてもよい。復号ピクチャバッファコンポーネント423は、パーティション情報によりフレームへと再構成できる、追加再構成画像ブロックを格納し続けてよい。このようなフレームは、シーケンス内に配置されてもよい。シーケンスは、再構成された出力ビデオ信号としてディスプレイに向けて出力される。
図5は、符号化ビデオシーケンスを含む例示的なビットストリーム500を示す概略図である。例えば、ビットストリーム500は、コーデックシステム200及び/又はデコーダ400による復号のために、コーデックシステム200及び/又はエンコーダ300により生成できる。別の例として、ビットストリーム500は、デコーダによりステップ111で使用するために、方法100のステップ109でエンコーダにより生成されてよい。
ビットストリーム500は、シーケンスパラメータセット(sequence parameter set (SPS))510、複数のピクチャパラメータセット(picture parameter set (PPS))512、タイルグループヘッダ514、及び画像データ520を含む。SPS510は、ビットストリーム500に含まれるビデオシーケンス内の全部のピクチャに共通のシーケンスデータを含む。このようなデータは、ピクチャサイジング、ビット深さ、コーディングツールパラメータ、ビットレート制約、等を含み得る。PPS512は、1つ以上の対応するピクチャに固有のパラメータを含む。従って、ビデオシーケンス内の各ピクチャは、1つのPPS512を参照してよい。PPS512は、対応するピクチャ内のタイルについて利用可能なコーディングツール、量子化パラメータ、オフセット、ピクチャ固有コーディングツールパラメータ(例えば、フィルタ制御)、等を示すことができる。タイルグループヘッダ514は、ピクチャ内の各タイルグループに固有のパラメータを含む。従って、ビデオシーケンス内のタイルグループ毎に1個のタイルグループヘッダ514があってよい。タイルグループヘッダ514は、タイルグループ情報、ピクチャ順序カウント(picture order count (POC))、参照ピクチャリスト、予測重み、タイルエントリポイント、デブロッキングパラメータ、等を含んでよい。留意すべきことに、幾つかのシステムは、スライスヘッダとしてタイルグループヘッダ514を参照し、このような情報を、タイルグループの代わりにスライスをサポートするために使用する。
画像データ520は、インター予測及び/又はイントラ予測に従い符号化されたビデオデータ、並びに対応する変換された量子化済み残差データを含む。このような画像データ520は、符号化の前に画像をパーティションするために使用されたパーティションに従いソートされる。例えば、画像データ520内の画像は、1つ以上のタイルグループ521に分割される。各タイルグループ521は、1つ以上のタイル523を含む。タイル523は、コーディング木単位(coding tree unit (CTU))に更に分割される。CTUは、コーディング木に基づきコーディングブロックに更に分割される。コーディングブロックは、次に、予測メカニズムに従い符号化/復号できる。画像/ピクチャは、1つ以上のタイルグループ521及び1つ以上のタイル523を含み得る。
タイルグループ521は、例えば関心領域の表示をサポートするために及び/又は並列処理をサポートするために別個に抽出されコーディングされることのできる関連するタイル523のセットである。ピクチャは、1つ以上のタイルグループ521を含んでよい。各タイルグループ521は、対応するタイルグループヘッダ514内のコーディングツールを参照する。従って、現在タイルグループ521は、対応するタイルグループヘッダ514内のデータを変更することにより、他のタイルグループ521と異なるコーディングツールを用いてコーディングできる。タイルグループ521は、タイル523をタイルグループ521に割り当てるために使用されたメカニズムの観点で説明され得る。ラスタスキャン順序で割り当てられたタイル523を含むタイルグループ521は、ラスタスキャンタイルグループと呼ばれてよい。長方形(又は正方形)を生成するために割り当てられたタイル523を含むタイルグループ521は、長方形タイルグループと呼ばれてよい。図6~7は、それぞれ、以下により詳細に議論されるラスタスキャンタイルグループ及び長方形タイルグループの例を含む。
タイル523は、水平及び垂直境界により生成されるピクチャのパーティションされた部分である。タイル523は、長方形及び/又は正方形であってよい。ピクチャは、タイル523の行及び列にパーティションされてよい。タイル523の行は、水平方向に隣接するように位置付けられて、ピクチャの左境界から右境界までの連続ライン(逆も同様である)を生成するタイル523のセットである。タイル523の列は、垂直方向に隣接するように位置付けられて、ピクチャの上境界から下境界までの連続ライン(逆も同様である)を生成するタイル523のセットである。タイル523は、例に依存して、他のタイル523に基づく予測を可能にしてよく、又はそうでなくてよい。例えば、タイルグループ521は、MCTSとして指定されたタイル523のセットを含んでよい。MCTSの中のタイル523は、MCTSの外部のタイル523によってではなく、MCTSの中の他のタイル523からの予測によりコーディングできる。タイル523は、更にCTUにパーティションできる。コーディング木は、CTUをコーディングブロックにパーティションするために利用でき、コーディングブロックはイントラ予測又はインター予測に従いコーディングできる。
各タイル523は、ピクチャ内でユニークなタイルインデックス524を有してよい。タイルインデックス524は、あるタイル523を別のものと区別するために使用できる、手順通りに選択された数値識別子である。例えば、タイルインデックス524は、ラスタスキャン順序で数値的に増大してよい。ラスタスキャン順序は、左から右へ及び上から下へである。留意すべきことに、幾つかの例では、タイル523は、タイル識別子(identifier (ID))も割り当てられてよい。タイルIDは、あるタイル523を別のものと区別するために使用できる、割り当てられた識別子である。幾つかの例では、計算は、タイルインデックス524の代わりにタイルIDを利用してよい。幾つかの例では、更に、タイルIDは、タイルインデックス524と同じ値を有するよう割り当てられることができる。幾つかの例では、タイルインデックス524及び/又はIDは、タイル523を含むタイルグループ521の境界を示すためにシグナリングされてよい。更に、タイルインデックス524及び/又はIDは、タイル523に関連付けられた画像データ520を、表示のための正しい位置にマッピングするために利用されてよい。
上述のように、タイルグループ521は、ラスタスキャンタイルグループ又は長方形タイルグループであってよい。本開示は、コーディング効率の向上及び複雑性の低減をサポートする方法で、コーデックが両方のタイルグループ521のタイプをサポートすることを可能にするための、シグナリングメカニズムを含む。タイルグループフラグ531は、対応するタイルグループ521がラスタスキャンか長方形かをシグナリングするために利用できるデータ単位である。タイルグループフラグ531は、例に依存して、SPS510又はPPS512でシグナリングできる。タイルグループ521に割り当てられたタイル523は、最初のタイル532及び最後のタイル533をビットストリーム500の中で示すことにより、シグナリングできる。例えば、最初のタイル532は、タイルグループ521の中の最初の位置にあるタイル523のタイルインデックス524又はIDを含んでよい。最初の位置は、長方形タイルグループでは左上角であり、ラスタスキャンタイルグループでは最小インデックス/IDである。更に、最後のタイル533は、タイルグループ521の中の最後の位置にあるタイル523のタイルインデックス524又はIDを含んでよい。最後の位置は、長方形タイルグループでは右下角であり、ラスタスキャンタイルグループでは最大インデックス/IDである。
タイルグループフラグ531、最初のタイル532、及び最後のタイル533は、デコーダがタイルグループ521内のタイル523を決定することを可能にするための十分な情報を提供する。例えば、ラスタスキャンメカニズムは最初のタイル532及び最後のタイル533に基づき、ラスタスキャンタイルグループの中のタイル523を決定できる。更に、長方形メカニズムは最初のタイル532及び最後のタイル533に基づき、長方形タイルグループの中のタイル523を決定できる。これは、対応するタイルグループ521の中の他のタイル523のタイルインデックス524を、ビットストリーム500から省略することを可能にする。これは、ビットストリーム500のサイズを削減し、従って、コーディング効率を向上させる。このように、タイルグループフラグ531は、どのタイル523がタイルグループ521に割り当てられているかを決定するためにどのメカニズムを利用すべきかをデコーダが決定することを可能にするための十分な情報を提供する。
従って、エンコーダは、ビットストリーム500又はそのサブ部分についてラスタスキャンを使用すべきか又は長方形タイルグループを使用すべきかを決定できる。エンコーダは、次に、従って、タイルグループフラグ531を設定できる。更に、エンコーダは、タイル523をタイルグループ521に割り当て、最初のタイル532及び最後のタイル533をビットストリーム500に含めることができる。エンコーダにおける仮説参照デコーダ(hypothetical reference decoder (HRD))は、次に、タイルグループフラグ531、最初のタイル532、及び最後のタイル533に基づき、タイルグループ521へのタイル523の割り当てを決定できる。HRDは、RDOの間に最適コーディングアプローチを選択することの部分として、デコーダにおいて復号結果を予測するエンコーダ側モジュールのセットである。更に、デコーダは、ビットストリーム500を受信し、タイルグループフラグ531、最初のタイル532、及び最後のタイル533に基づき、タイルグループ521の割り当てを決定できる。具体的に、エンコーダにおけるHRD及びデコーダにおけるHRDは両方とも、タイルグループフラグ531に基づきラスタスキャンメカニズム又は長方形メカニズムを選択し得る。HRD及びデコーダは、次に、選択したメカニズムを利用して、最初のタイル523及び最後のタイル533に基づき、タイル523のタイルグループ521への割り当てを決定できる。
以下は、上述のメカニズムの特定の例である。
Figure 0007201820000001
この例では、タイルグループフラグ531は、rectangular_tile_group_flagとして示され、長方形メカニズム(例えば、if文)又はラスタスキャンメカニズム(例えば、else文)を選択するために利用できる。長方形メカニズムは、タイルグループの最初のタイルとタイルグループの最後のタイルとの間のデルタ値を決定する。タイルグループの行の数は、ピクチャ内のタイルの列の数に1を加算したものにより、デルタ値を除算することにより、決定される。タイルグループの列の数は、ピクチャ内のタイルの列の数に1を加算したものを法とするデルタ値により決定される。タイル割り当ては、次に、タイルグループの行の数及びタイルグループの列の数に基づき決定できる(例えば、if文の中のfor loop)。一方で、ラスタスキャンメカニズムは、タイルグループの最初のタイルとタイルグループの最後のタイルとの間のタイルの数を決定する。タイルはラスタスキャン順序でインデックスされるので、ラスタスキャンメカニズムは、次に、決定したタイルの数を、ラスタスキャン順序でタイルグループに加算できる(例えば、else文の中のfor loop)。
図6は、ラスタスキャンタイルグループ621にパーティションされた例示的なピクチャ600を示す概略図である。例えば、ピクチャ600は、例えばコーデックシステム200、エンコーダ300、及び/又はデコーダ400により、ビットストリーム500に符号化され、それから復号できる。更に、ピクチャ600は、方法100に従い符号化及び復号をサポートするためにパーティションされることができる。
ピクチャ600は、ラスタスキャンタイルグループ621、624、及び625に割り当てられたタイル623を含み、これらはそれぞれタイルグループ521及びタイル523と実質的に同様であってよい。タイル623は、タイル623毎に、ラスタスキャン順序でラスタスキャンタイルグループ621、624、及び625に割り当てられる。ラスタスキャンタイルグループ621、624、及び625の間の境界を明確に示すために、各タイルグループは、太字体の輪郭で囲まれる。更に、タイルグループ621は、タイルグループ境界の間を更に区別するために、影により示される。更に留意すべきことに、ピクチャ600は、任意の数のラスタスキャンタイルグループ621、624、及び625にパーティションされてよい。議論の明確化のために、以下の説明は、ラスタスキャンタイルグループ621に関連する。しかしながら、タイル623は、ラスタスキャンタイルグループ621と同様の方法でラスタスキャンタイルグループ624及び625に割り当てられる。
示されるように、最初のタイル623a、最後のタイル623b、及び最初のタイル623a及び最後のタイル623bの間の影付きタイルの全ては、ラスタスキャン順序でタイルグループ621に割り当てられる。示されるように、ラスタスキャン順序に従い進行するメカニズム(例えば、プロセッサ上で動作する方法)は、最初のタイル623aをタイルグループ621に割り当て、次に、(左から右へ)右ピクチャ600境界に達するまで(最後のタイル623bに達しない限り)各タイル623をタイルグループ621に割り当てるよう進行する。ラスタスキャン順序は、次に、タイル623の次の行に(例えば、上の行から下の行へ向かって)進む。本ケースでは、最初のタイル623aは最初の行にあり、従って、次の行は2番目の行である。具体的に、ラスタスキャン順序は、左ピクチャ600境界にある2番目の行の最初のタイルへと進み、次に、右ピクチャ600境界に達するまで、左から右へ2番目の行を横に進む。ラスタスキャンは、次に、この場合には3番目の行である次の行へ移動し、左のピクチャ600の境界にある3番目の行の最初のタイルからの割り当てに進む。ラスタスキャンは、次に、3番目の行を横に右へ移動する。この順序は、最後のタイル623bに達するまで続く。この時点で、タイルグループ621は完了する。タイルグループ621の下及び/又は右の追加のタイル623は、同様の方法でラスタスキャン順序でタイルグループ625に割り当てることができる。タイルグループ621の上及び/又は左のタイル623は、同様の方法でタイルグループ624に割り当てられる。
図7は、長方形タイルグループ721にパーティションされた例示的なピクチャ700を示す概略図である。例えば、ピクチャ700は、例えばコーデックシステム200、エンコーダ300、及び/又はデコーダ400により、ビットストリーム500に符号化され、それから復号できる。更に、ピクチャ700は、方法100に従い符号化及び復号をサポートするためにパーティションされることができる。
ピクチャ700は、長方形タイルグループ721に割り当てられたタイル723を含み、これらはそれぞれタイルグループ521及びタイル523と実質的に同様であってよい。長方形タイルグループ721に割り当てられたタイル723は、太字体の輪郭により囲まれるように図7に示される。更に、選択された長方形タイルグループ721は、長方形タイルグループ721の間を明確に描写するために影を付けられる。示されるように、長方形タイルグループ721は、長方形形状を作るタイル723のセットを含む。留意すべきことに、正方形は長方形の特定の場合であるので、長方形タイルグループ721は正方形であってもよい。示されるように、長方形は4辺を有し、各辺は直角(例えば、90°の角度)により2つの他の辺に接続される。長方形タイルグループ721aは、最初のタイル723a及び最後のタイル723bを含む。最初のタイル723aは、長方形タイルグループ721aの左上角であり、最後のタイルは、長方形タイルグループ721aの右下角にある。最初のタイル723a及び最後のタイル723bを含む行及び列の中又はそれらの間に含まれるタイル723も、タイル毎に、長方形タイルグループ721aに割り当てられる。示されるように、この方式はラスタスキャンと異なる。例えば、タイル723cは、ラスタスキャン順序では最初のタイル723aと最後のタイル723bとの間にあるが、同じ長方形タイルグループ721aに含まれない。長方形タイルグループ721aは、関連するジオメトリにより、ラスタスキャンタイルグループ621よりも計算上複雑になることがある。しかしながら、長方形タイルグループ721はより柔軟である。例えば、長方形タイルグループ721aは、最初のタイル723とピクチャ700の右境界との間の(例えば、タイル723cのような)全てのタイルを含まずに、異なる行からのタイル723を含んでよい。長方形タイルグループ721aは、左ピクチャ境界と最後のタイル723bとの間の選択されたタイルを除外してもよい。例えば、タイル723dは、タイルグループ721aから除外される。
従って、長方形タイルグループ721及びラスタスキャンタイルグループ621は、それぞれ異なる利点を有し、従って、それぞれ異なる使用例により適してよい。例えば、ラスタスキャンタイルグループ621は、ピクチャ600全体が表示されるときにより有利であってよく、長方形タイルグループ721は、サブピクチャのみが表示されるときにより有利であってよい。しかしながら、上述のように、最初のタイルインデックスと最後のタイルインデックスのみがビットストリームの中でシグナリングされるとき、どのタイルがタイルグループに割り当てられるかを決定するために、異なるメカニズムが利用されてよい。従って、どのタイルグループタイプが利用されるかを示すフラグが、適切なラスタスキャン又は長方形メカニズムを選択するためにデコーダ又はHRDにより使用できる。タイルグループへのタイルの割り当ては、次に、タイルグループ内の最初のタイル及び最後のタイルを利用することにより、決定できる。
以上を利用することにより、ビデオコーディングシステムが改良できる。従って、本開示は、ビデオコーディングにおけるタイルのグループ化に対する種々の改良を説明する。より具体的には、本開示は、2つの異なるタイルグループ概念、ラスタスキャンに基づくタイルグループ、及び長方形タイルグループをサポートするためのシグナリング及び導出処理を説明する。一例では、対応するタイルグループにより直接又は間接に参照されるパラメータセットの中で、フラグが利用される。フラグは、どのタイルグループアプローチが使用されるかを指定する。フラグは、シーケンスパラメータセット、ピクチャパラメータセット、又はタイルグループにより直接又は間接に参照される別のタイプのパラメータセットのようなパラメータセットの中でシグナリングできる。特定の例として、フラグはrectangular_tile_group_flagであってよい。幾つかの例では、2以上のビットを有する指示が定義され、対応するタイルグループにより直接又は間接に参照されるパラメータセットの中でシグナリングされてよい。指示は、どのタイルグループアプローチが使用されるかを指定してよい。このような指示を用いて、2つ以上のタイルグループアプローチがサポートできる。指示をシグナリングするためのビットの数は、サポートされるべきタイルグループアプローチの数に依存する。幾つかの例では、フラグ又は指示は、タイルグループヘッダの中でシグナリングできる。
タイルグループに含まれる最初のタイル及び最後のタイルを示す情報をシグナリングすることは、どのタイルがラスタスキャンタイルグループ又は長方形タイルグループに含まれるかを示すのに十分であってよい。タイルグループに含まれるタイルの導出は、(フラグ又は指示により示されてよい)使用されるタイルグループアプローチ、タイルグループの中の最初のタイルの情報、及びタイルグループの中の最後のタイルの情報に依存してよい。特定のタイルを識別するための情報は、以下:タイルインデックス、タイルID(タイルインデックスと異なる場合)、タイルに含まれるCTU(例えば、タイルに含まれる最初のCTU)、又はタイルに含まれるルマサンプル(例えば、タイルに含まれる最初のルマサンプル)、のうちのいずれかであり得る。
以下は、上述のメカニズムの特定の実施形態である。ピクチャパラメータセットRBSPシンタックスは以下の通りであってよい。
Figure 0007201820000002
tile_id_len_minus1に1を加えたものは、存在するときPPSの中のシンタックス要素tile_id_val[i][j]、及びPPSを参照するタイルグループヘッダの中のシンタックス要素first_tile_id及びlast_tile_idを表すために使用されるビットの数を指定する。tile_id_len_minus1の値は、Ceil(Log2(NumTilesInPic)~15の両端を含むその範囲内であってよい。rectangular_tile_group_flagは、1に等しく設定されるとき、PPSを参照するタイルグループがピクチャの長方形領域を形成する1つ以上のタイルを含むものであることを指定してよい。rectangular_tile_group_flagは、0に等しく設定されるとき、PPSを参照するタイルグループがピクチャのラスタスキャン順序で連続する1つ以上のタイルを含むものであることを指定してよい。
タイルグループヘッダシンタックスは、以下の通りであってよい。
Figure 0007201820000003
single_tile_in_tile_group_flagは、1に等しく設定されるとき、タイルグループ内に1つのタイルのみがあることを指定してよい。single_tile_in_tile_group_flagは、0に等しく設定されるとき、タイルグループ内に1つより多くのタイルがあることを指定してよい。first_tile_idは、タイルグループの最初のタイルのタイルIDを指定してよい。first_tile_idの長さは、tile_id_len_minus1+1個のビットであってよい。first_tile_idの値は、同じコーディングピクチャの任意の他のコーディングタイルグループのfirst_tile_idの値と等しくてはならない。ピクチャ内に1つより多くのタイルグループがあるとき、ピクチャ内のタイルグループの復号順は、first_tile_id.の値の昇順であってよい。last_tile_idは、タイルグループの最後のタイルのタイルIDを指定してよい。last_tile_idの長さは、tile_id_len_minus1+1個のビットであってよい。存在しないとき、last_tile_idの値はfirst_tile_idに等しいと推定されてよい。
タイルグループ内のタイルの数を指定する変数NumTilesInTileGroup、及びタイルグループ内のi番目のタイルのタイルインデックスを指定するTgTileIdx[i]は、以下のように導出されてよい。
Figure 0007201820000004
一般的なタイルグループデータシンタックスは、以下の通りであってよい。
Figure 0007201820000005
図8は、例示的なビデオコーディング装置800の概略図である。ビデオコーディング装置800は、ここに説明したような開示の例/実施形態を実施するのに適する。ビデオコーディング装置800は、ダウンストリームポート820、アップストリームポート850、及び/又は、ネットワークを介してデータアップストリーム及び/又はダウンストリームを通信する送信機及び/又は受信機を含むトランシーバユニット(Tx/Rx)810を含む。ビデオコーディング装置800は、データを処理する論理ユニット及び/又は中央処理ユニット(central processing unit(CPU))を含むプロセッサ830、及びデータを格納するメモリ832も含む。ビデオコーディング装置800は、電気、光-電気(optical-to-electrical(OE))コンポーネント、電気-光(electrical-to-optical(EO))コンポーネント、及び/又は、電気、光又は無線通信ネットワークを介するデータの通信のためにアップストリームポート850及び/又はダウンストリームポート820に接続される無線通信コンポーネント、も含んでよい。ビデオコーディング装置800は、データをユーザに及びから通信する入力及び/又は出力(input and/or output(I/O))装置860も含んでよい。I/O装置860は、ビデオデータを表示するディスプレイ、オーディオデータを出力するスピーカ、等のような出力装置を含んでよい。I/O装置860は、キーボード、マウス、トラックボール、等のような入力装置、及び/又は、そのような出力装置とインタフェースする対応するインタフェースも含んでよい。
プロセッサ830は、ハードウェア及びソフトウェアにより実装される。プロセッサ830は、1つ以上のCPUチップ、コア(例えば、マルチコアプロセッサ)、フィールドプログラマブルゲートアレイ(field-programmable gate array(FPGA))、特定用途向け集積回路(application specific integrated circuit (ASIC))、及びデジタル信号プロセッサ(digital signal processor(DSP))として実装されてよい。プロセッサ830は、ダウンストリームポート820、Tx/Rx810、アップストリームポート850、及びメモリ832と通信する。プロセッサ830は、コーディングモジュール814を含む。コーディングモジュール814は、ビットストリーム500、ピクチャ600、及び/又はピクチャ700を利用してよい方法100、900、及び1000のような、ここに説明した開示の実施形態を実施する。コーディングモジュール814は、ここに説明した任意の他の方法/メカニズムも実施してよい。さらに、コーディングモジュール814は、コーデックシステム200、エンコーダ300、及び/又はデコーダ400を実装してよい。例えば、コーディングモジュール814は、画像をタイルグループ及び/又はタイルに、タイルをCTUに、CTUをブロックにパーティションし、エンコーダとして動作するときブロックを符号化できる。更に、コーディングモジュール814は、ラスタスキャン又は長方形タイルグループを選択し、このような選択をビットストリームの中でシグナリングできる。コーディングモジュール814は、タイルグループへのタイルの割り当ての決定をサポートするために、最初のタイル及び最後のタイルもシグナリングしてよい。デコーダ又はHRDとして動作するとき、コーディングモジュール814は、使用されるタイルグループのタイプを決定し、最初のタイル及び最後のタイルに基づきタイルグループに割り当てられたタイルを決定できる。従って、コーディングモジュール814は、ビデオデータをパーティションし及びコーディングするとき、ビデオコーディング装置800に追加の機能及び/又はコーディング効率を提供させる。従って、コーディングモジュール814は、ビデオコーディング装置800の機能を向上し、並びに、ビデオコーディング技術に特有の問題を解決する。更に、コーディングモジュール814は、ビデオコーディング装置800の異なる状態への変換を実施する。代替として、コーディングモジュール814は、メモリ832に格納されプロセッサ830により実行される命令として(例えば、非一時的媒体に格納されたコンピュータプログラムプロダクトとして)実装できる。
メモリ832は、ディスク、テープドライブ、個体ドライブ、読み出し専用メモリ(read only memory(ROM))、ランダムアクセスメモリ(random access memory(RAM))、フラッシュメモリ、三値連想メモリ(ternary content-addressable memory(TCAM))、静的ランダムアクセスメモリ(static random-access memory (SRAM))、等のような1つ以上のメモリ種類を含む。メモリ832は、プログラムが実行のために選択されるとき該プログラムを格納するため、及びプログラムの実行中に読み出される命令及びデータを格納するための、オーバフローデータ記憶装置として使用されてよい。
図9は、ピクチャ600及び/又は700のようなピクチャを、ビットストリーム500のようなビットストリームに符号化する例示的な方法900のフローチャートである。方法900は、方法100を実行するとき、コーデックシステム200、エンコーダ300、及び/又はビデオコーディング装置800のようなエンコーダにより利用されてよい。
方法900は、エンコーダが複数のピクチャを含むビデオシーケンスを受信し、例えばユーザ入力に基づき該ビデオシーケンスをビットストリームに符号化することを決定するとき、開始してよい。ビデオシーケンスは、符号化の前に更なるパーティションのためにピクチャ/画像/フレームにパーティションされる。ステップ901で、ピクチャは、複数のタイルにパーティションされる。更に、タイルは、複数のタイルグループに割り当てられ、従って、タイルのサブセットがタイルグループに割り当てられる。幾つかの例では、タイルグループはラスタスキャンタイルグループである。他の例では、タイルグループは長方形タイルグループである。
ステップ903で、フラグはビットストリームに符号化される。フラグは、タイルグループがラスタスキャンタイルグループであるとき第1値に、タイルグループが長方形タイルグループであるとき第2値に設定できる。フラグは、ビットストリームのパラメータセットに符号化されてよい。例えば、フラグが符号化されるパラメータセットは、シーケンスパラメータセット又はピクチャパラメータセットであってよい。幾つかの例では、フラグは長方形タイルグループフラグである。
ステップ905で、タイルグループの最初のタイルの識別子及びタイルグループの最後のタイルの識別子が、ビットストリームに符号化される。タイルグループの最初のタイル及びタイルグループの最後のタイルは、タイルグループに割り当てられるタイルを示すために使用されてよい。幾つかの例では、タイルグループの最初のタイルの識別子、及びタイルグループの最後のタイルの識別子は、ビットストリームの中のタイルグループヘッダに符号化される。
フラグ、タイルグループの最初のタイル及びタイルグループの最後のタイルは、タイルグループに対するタイルの割り当てを決定するために、デコーダにより及び/又はエンコーダにおけるHRDにより使用できる。フラグにより示されるように、タイルグループがラスタスキャンタイルグループであるとき、タイルグループに対するタイルの割り当ては、以下のように決定できる。タイルグループの最初のタイルとタイルグループの最後のタイルとの間のタイルの数は、タイルグループ内のタイルの数として決定できる。タイルの割り当ては、次に、タイルグループ内のタイルの数に基づき決定できる。フラグにより示されるように、タイルグループが長方形タイルグループであるとき、タイルグループに対するタイルの割り当ては、以下のように決定できる。タイルグループの最初のタイルとタイルグループの最後のタイルとの間のデルタ値が決定できる。タイルグループの行の数は、デルタ値及びピクチャ内のタイル列の数に基づき決定できる。タイルグループの列の数も、デルタ値及びピクチャ内のタイル列の数に基づき決定できる。タイルの割り当ては、次に、タイルグループの行の数及びタイルグループの列の数に基づき決定できる。
ステップ907で、タイルは、タイルの割り当てに基づき、ビットストリームに符号化される。ステップ909で、ビットストリームは、デコーダへ向けた通信のために格納されてもよい。
図10は、ピクチャ600及び/又は700のようなピクチャを、ビットストリーム500のようなビットストリームから復号する例示的な方法1000のフローチャートである。方法1000は、方法100を実行するとき、コーデックシステム200、デコーダ400、及び/又はビデオコーディング装置800のようなデコーダにより利用されてよい。例えば、方法1000は、方法900に応答して利用されてよい。
方法1000は、例えば方法900の結果として、デコーダがビデオシーケンスを表すコーディングデータのビットストリームを受信し始めるときに、開始してよい。ステップ1001で、ビットストリームがデコーダにおいて受信される。ビットストリームは、複数のタイルにパーティションされたピクチャを含む。タイルは、複数のタイルグループに割り当てられ、従って、タイルのサブセットがタイルグループに割り当てられる。幾つかの例では、タイルグループはラスタスキャンタイルグループである。他の例では、タイルグループは長方形タイルグループである。
ステップ1003で、ビットストリームのパラメータセットから、フラグが取得される。フラグが第1値に設定されるとき、タイルグループは、ラスタスキャンタイルグループであると決定される。フラグが第2値に設定されるとき、タイルグループは長方形タイルグループであると決定される。例えば、フラグを含むパラメータは、シーケンスパラメータセット又はピクチャパラメータセットであってよい。幾つかの例では、フラグは長方形タイルグループフラグである。
ステップ1005で、タイルグループに割り当てられるタイルの決定をサポートするために、タイルグループの最初のタイルの識別子及びタイルグループの最後のタイルの識別子が、取得される。幾つかの例では、タイルグループの最初のタイルの識別子、及びタイルグループの最後のタイルの識別子は、ビットストリームの中のタイルグループヘッダから取得される。
ステップ1007で、タイルグループのタイルの割り当ては、タイルグループがラスタスキャンタイルグループか又は長方形タイルグループかに基づき決定される。例えば、フラグ、タイルグループの最初のタイル及びタイルグループの最後のタイルは、タイルグループについてタイルの割り当てを決定するために使用できる。フラグにより示されるように、タイルグループがラスタスキャンタイルグループであるとき、タイルグループに対するタイルの割り当ては、以下のように決定できる。タイルグループの最初のタイルとタイルグループの最後のタイルとの間のタイルの数は、タイルグループ内のタイルの数として決定できる。タイルの割り当ては、次に、タイルグループ内のタイルの数に基づき決定できる。フラグにより示されるように、タイルグループが長方形タイルグループであるとき、タイルグループに対するタイルの割り当ては、以下のように決定できる。タイルグループの最初のタイルとタイルグループの最後のタイルとの間のデルタ値が決定できる。タイルグループの行の数は、デルタ値及びピクチャ内のタイル列の数に基づき決定できる。タイルグループの列の数も、デルタ値及びピクチャ内のタイル列の数に基づき決定できる。タイルの割り当ては、次に、タイルグループの行の数及びタイルグループの列の数に基づき決定できる。
ステップ1009で、タイルグループに対するタイルの割り当てに基づき復号タイルを生成するために、タイルが復号される。再構成ビデオシーケンスも、復号タイルに基づき表示のために生成され得る。
図11は、ビットストリーム500のようなビットストリームの中の、ピクチャ600及び/又は700のようなピクチャのビデオシーケンスをコーディングする例示的なシステム1100の概略図である。システム1100は、コーデックシステム200のようなエンコーダ及びデコーダ、エンコーダ300、デコーダ400、及び/又はビデオコーディング装置800により実装されてよい。更に、システム1100は、方法100、900、及び/又は1000を実施するとき、利用されてよい。
システム1100は、ビデオエンコーダ1102を含む。ビデオエンコーダ1102は、ピクチャを複数のタイルにパーティションするパーティションモジュール1101を含む。ビデオエンコーダ1102は、タイルグループにタイルの数を含める包含モジュール1103を更に含む。ビデオエンコーダ1102は、タイルグループがラスタスキャンタイルグループであるとき第1値に、タイルグループが長方形タイルグループであるとき第2値に設定されたフラグを符号化し、フラグはビットストリームのパラメータセットに符号化され、タイルグループに基づきビットストリームにタイルを符号化する符号化モジュール1105を更に含む。ビデオエンコーダ1102は、デコーダへ向けた通信のためにビットストリームを格納する格納モジュール1107を更に含む。ビデオエンコーダ1102は、使用されるタイルグループのタイプ及びタイルグループに含まれるタイルを決定することをサポートするために、ビットストリームを送信する送信モジュール1109を更に含む。ビデオエンコーダ1102は、方法900のステップのうちのいずれかを実行するよう更に構成されてよい。
システム1100は、ビデオデコーダ1110も含む。ビデオデコーダ1110は、複数のタイルにパーティションされたピクチャを含むビットストリームを受信する受信モジュール1111を含む。ここで、タイルの数がタイルグループに含まれる。ビデオデコーダ1110は、ビットストリームのパラメータセットからフラグを取得する取得モジュール1113を更に含む。ビデオデコーダ1110は、フラグが第1値に設定されているときタイルグループがラスタスキャンタイルグループであることを決定し、フラグが第2値に設定されているときタイルグループが長方形タイルグループであることを決定し、タイルグループがラスタスキャンタイルグループか又は長方形タイルグループかに基づきタイルグループについてタイルの包含を決定する決定モジュール1115を更に含む。ビデオデコーダ1110は、タイルを復号してタイルグループに基づき復号タイルを生成する復号モジュール1117を更に含む。ビデオデコーダ1110は、復号タイルに基づき表示のために再構成ビデオシーケンスを生成する生成モジュール1119を更に含む。ビデオデコーダ1110は、方法1000のステップのうちのいずれかを実行するよう更に構成されてよい。
第1コンポーネントと第2コンポーネントとの間に線、トレース、又は別の媒体を除き仲介コンポーネントが存在しないとき、第1コンポーネントは、第2コンポーネントに直接接続される。第1コンポーネントと第2コンポーネントとの間に線、トレース、又は別の媒体以外の仲介コンポーネントが存在するとき、第1コンポーネントは、第2コンポーネントに間接接続される。用語「接続される」及びその変形は、直接接続及び間接接続の両方を含む。用語「約」の使用は、特に断りのない限り、後続の数値の±10%を含む範囲を意味する。
更に理解されるべきことに、ここに説明された例示的な方法のステップは、必ずしも説明された順に実行される必要はなく、このような方法のステップの順は、単なる例であると理解されるべきである。同様に、追加ステップがこのような方法に含まれてよく、特定のステップは、本開示の種々の実施形態に従う方法において、省略され又は結合されてよい。
幾つかの実施形態が本開示において提供されたが、開示のシステム及び方法は、本開示の精神又は範囲から逸脱することなく、多くの他の特定の形式で実施され得ることが理解され得る。本発明の例は、説明のためであり限定的ではないと考えられるべきであり、ここに与えられた詳細事項に限定されることを意図しない。例えば、種々の要素又はコンポーネントは、結合され、又は別のシステムに統合されてよく、或いは、特定の機能は、省略され又は実施されなくてよい。
さらに、種々の実施形態において説明され示された技術、システム、サブシステム、及び方法は、本開示の範囲から逸脱することなく、他のシステム、コンポーネント、技術、又は方法と結合され又は統合されてよい。変更、代用、及び改造の他の例は、当業者により確認され、ここに開示した精神及び範囲から逸脱することなく行われてよい。

Claims (18)

  1. エンコーダにおいて実施される方法であって、前記方法は、
    前記エンコーダのプロセッサにより、ピクチャを複数のタイルにパーティションするステップと、
    前記プロセッサにより、前記タイルの数をタイルグループに含めるステップと、
    前記プロセッサにより、前記タイルグループがラスタスキャンタイルグループであるとき第1値に、前記タイルグループが長方形タイルグループであるとき第2値に設定されたフラグを符号化するステップであって、前記フラグはビットストリームのパラメータセットに符号化され、前記ラスタスキャンタイルグループは、前記ピクチャのラスタスキャン順序で連続するタイルを含み、前記長方形タイルグループは、集合的に前記ピクチャの長方形領域を形成するタイルを含む、ステップと、
    前記プロセッサにより、前記タイルグループに基づき、前記タイルを前記ビットストリームに符号化するステップと、
    を含む方法。
  2. 前記方法は、デコーダへの通信のために、前記エンコーダのメモリに前記ビットストリームを格納するステップを更に含む請求項1に記載の方法。
  3. 前記フラグが符号化される前記パラメータセットは、シーケンスパラメータセットである、請求項1~2のいずれかに記載の方法。
  4. 前記フラグが符号化される前記パラメータセットは、ピクチャパラメータセットである、請求項1~2のいずれかに記載の方法。
  5. 前記プロセッサにより、前記タイルグループに含まれる前記タイルを示すために、前記タイルグループの最初のタイルの識別子と、前記タイルグループの最後のタイルの識別子と、を前記ビットストリームに符号化するステップ、を更に含む請求項1~4のいずれかに記載の方法。
  6. 前記タイルグループの前記最初のタイルの前記識別子、及び前記タイルグループの前記最後のタイルの前記識別子は、前記ビットストリーム内のタイルグループヘッダに符号化される、請求項5に記載の方法。
  7. デコーダにおいて実施される方法であって、前記方法は、
    前記デコーダのプロセッサにより、受信機を介して、複数のタイルにパーティションされたピクチャを含むビットストリームを受信するステップであって、前記タイルの数はタイルグループに含まれる、ステップと、
    前記プロセッサにより、前記ビットストリームのパラメータセットからフラグを取得するステップであって、
    前記フラグは、前記フラグが第1値に設定されているとき、前記タイルグループラスタスキャンタイルグループであり、前記フラグが第2値に設定されているとき、前記タイルグループ長方形タイルグループであることを示し、前記ラスタスキャンタイルグループは、前記ピクチャのラスタスキャン順序で連続するタイルを含み、前記長方形タイルグループは、集合的に前記ピクチャの長方形領域を形成するタイルを含む、ステップと、
    前記プロセッサにより、前記タイルグループが前記ラスタスキャンタイルグループか又は長方形タイルグループかに基づき、前記タイルグループのタイルを復号するステップと、
    を含む方法。
  8. 前記方法は、前記プロセッサにより、前記復号されたタイルに基づき、表示のために再構成ビデオシーケンスを生成するステップを更に含む請求項7に記載の方法。
  9. 前記フラグを含む前記パラメータセットは、シーケンスパラメータセットである、請求項7~8のいずれかに記載の方法。
  10. 前記フラグを含む前記パラメータセットは、ピクチャパラメータセットである、請求項7~8のいずれかに記載の方法。
  11. 前記プロセッサにより、前記タイルグループに含まれる前記タイルを決定するために、前記タイルグループの最初のタイルの識別子と、前記タイルグループの最後のタイルの識別子と、を取得するステップ、を更に含む請求項7~10のいずれかに記載の方法。
  12. 前記タイルグループの前記最初のタイルの前記識別子、及び前記タイルグループの前記最後のタイルの前記識別子は、前記ビットストリーム内のタイルグループヘッダから取得される、請求項11に記載の方法。
  13. 前記タイルグループが前記ラスタスキャンタイルグループであるとき、前記タイルを復号する前記ステップは、
    前記タイルグループの前記最初のタイルと前記タイルグループの前記最後のタイルとの間のタイルの数を、前記タイルグループ内のタイルの数として決定するステップと、
    前記タイルグループ内の前記タイルの数に基づき、タイルを復号するステップと、
    により決定される、請求項11又は12に記載の方法。
  14. 前記タイルグループが前記長方形タイルグループであるとき、前記タイルを復号する前記ステップは、
    前記タイルグループの前記最初のタイルと前記タイルグループの前記最後のタイルとの間のデルタ値を決定するステップと、
    前記デルタ値及び前記ピクチャ内のタイル列の数に基づき、タイルグループ行の数を決定するステップと、
    前記デルタ値及び前記ピクチャ内の前記タイル列の数に基づき、タイルグループ列の数を決定するステップと、
    前記タイルグループ行の数及び前記タイルグループ列の数に基づき、前記タイルを復号するステップと、
    により決定される、請求項11~13のいずれかに記載の方法。
  15. ビデオコーディング装置であって、
    プロセッサと、前記プロセッサに接続された受信機と、前記プロセッサに接続された送信機と、を含み、前記プロセッサ、受信機、及び送信機は、請求項1~14のいずれかに記載の方法を実行するよう構成される、ビデオコーディング装置。
  16. 請求項1~14のいずれかに記載の方法を実行する処理回路を含むビデオ符号化装置。
  17. コンピュータ又はプロセッサで実行されると請求項1~14のいずれかに記載の方法を実行するためのプログラムコードを含むコンピュータプログラム。
  18. コンピュータ装置により実行されると、前記コンピュータ装置に請求項1~14のいずれかに記載の方法を実行させるプログラムコードを記憶している非一時的コンピュータ可読媒体。
JP2021534733A 2018-12-17 2019-12-17 ビデオコーディング方法及び機器 Active JP7201820B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022205201A JP2023029423A (ja) 2018-12-17 2022-12-22 ビデオコーディング方法及び機器

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862780771P 2018-12-17 2018-12-17
US62/780,771 2018-12-17
US201962848149P 2019-05-15 2019-05-15
US62/848,149 2019-05-15
PCT/US2019/066884 WO2020131891A1 (en) 2018-12-17 2019-12-17 Harmonization of raster scan and rectangular tile groups in video coding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022205201A Division JP2023029423A (ja) 2018-12-17 2022-12-22 ビデオコーディング方法及び機器

Publications (2)

Publication Number Publication Date
JP2022513980A JP2022513980A (ja) 2022-02-09
JP7201820B2 true JP7201820B2 (ja) 2023-01-10

Family

ID=71101946

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2021534734A Active JP7201821B2 (ja) 2018-12-17 2019-12-17 ビデオコーディング方法及び機器
JP2021534733A Active JP7201820B2 (ja) 2018-12-17 2019-12-17 ビデオコーディング方法及び機器
JP2022205201A Pending JP2023029423A (ja) 2018-12-17 2022-12-22 ビデオコーディング方法及び機器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021534734A Active JP7201821B2 (ja) 2018-12-17 2019-12-17 ビデオコーディング方法及び機器

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022205201A Pending JP2023029423A (ja) 2018-12-17 2022-12-22 ビデオコーディング方法及び機器

Country Status (11)

Country Link
US (5) US11653005B2 (ja)
EP (2) EP3891986A4 (ja)
JP (3) JP7201821B2 (ja)
KR (2) KR20210095949A (ja)
CN (6) CN113330746B (ja)
AU (1) AU2019405497B2 (ja)
BR (2) BR112021011398A2 (ja)
CA (1) CA3123575A1 (ja)
MX (1) MX2021007198A (ja)
SG (2) SG11202106486XA (ja)
WO (2) WO2020131891A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7307168B2 (ja) * 2018-11-30 2023-07-11 シャープ株式会社 符号化されたビデオのピクチャ用のタイル構造をシグナリングするシステム及び方法
US20200236377A1 (en) * 2019-01-22 2020-07-23 Tencent America LLC Method for tile group identification
CN110650357B (zh) * 2019-09-27 2023-02-10 腾讯科技(深圳)有限公司 视频解码方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013063094A1 (en) 2011-10-24 2013-05-02 Qualcomm Incorporated Grouping of tiles for video coding

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009033432A1 (en) * 2007-09-14 2009-03-19 Huawei Technologies Co., Ltd. A method and apparatus for video encoding and decoding
GB0823468D0 (en) * 2008-12-23 2009-01-28 Imagination Tech Ltd Display list control stream grouping in tile based 3D computer graphics systems
MX336707B (es) * 2011-03-10 2016-01-28 Sharp Kk Metodo de decodificacion de video.
US9398307B2 (en) * 2011-07-11 2016-07-19 Sharp Kabushiki Kaisha Video decoder for tiles
IN2014CN03712A (ja) 2011-10-31 2015-09-04 Mitsubishi Electric Corp
US10349077B2 (en) * 2011-11-21 2019-07-09 Canon Kabushiki Kaisha Image coding apparatus, image coding method, image decoding apparatus, image decoding method, and storage medium
US9270994B2 (en) * 2012-06-29 2016-02-23 Cisco Technology, Inc. Video encoder/decoder, method and computer program product that process tiles of video data
JP6214235B2 (ja) * 2012-07-02 2017-10-18 キヤノン株式会社 ファイル生成方法、ファイル生成装置、及びプログラム
KR101835802B1 (ko) * 2012-09-18 2018-03-08 브이아이디 스케일, 인크. 타일 및 타일 그룹을 이용한 관심 영역 비디오 코딩
WO2014049210A1 (en) * 2012-09-28 2014-04-03 Nokia Corporation An apparatus, a method and a computer program for video coding and decoding
US9749627B2 (en) * 2013-04-08 2017-08-29 Microsoft Technology Licensing, Llc Control data for motion-constrained tile set
US9648335B2 (en) * 2013-07-12 2017-05-09 Qualcomm Incorporated Bitstream restrictions on picture partitions across layers
US10419768B2 (en) * 2016-03-30 2019-09-17 Qualcomm Incorporated Tile grouping in HEVC and L-HEVC file formats
EP3422724B1 (en) * 2017-06-26 2024-05-01 Nokia Technologies Oy An apparatus, a method and a computer program for omnidirectional video
CN115955562A (zh) * 2017-11-29 2023-04-11 韩国电子通信研究院 采用环内滤波的图像编码/解码方法和装置
CN112292855B (zh) * 2018-04-09 2024-06-04 Sk电信有限公司 用于对图像进行编码/解码的方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013063094A1 (en) 2011-10-24 2013-05-02 Qualcomm Incorporated Grouping of tiles for video coding

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Rickard Sjoberg, Mitra Damghanian, and Martin Pettersson,Tile groups for VVC,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-L0415-v1,12th Meeting: Macao, CN,2018年09月,pp.1-4
Sachin Deshpande, and Yukinobu Yasugi,On Tile Information Signaling for VVC,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-l0374-v2,12th Meeting: Macao, CN,2018年10月,pp.1-8
Y.-K. Wang, et al.,Spec text for agreed starting point on slicing and tiling,JVET-L0686-v2.zipに含まれるJVET-L0686-v2-SpecText.docx,JVET-L0686 (version 2),2018年10月,pp.1-6,16-17,20-22,27-29,44-46,https://jvet-experts.org/doc_end_user/current_document.php?id=4800
Ye-Kui Wang, et al.,On tile grouping,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-M0130-v1,13th Meeting: Marrakech, MA,2019年01月,pp.1-7
Yong He, and Ahmad Hamza,AHG12: On Rectangular Tile Group,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-M0121r1,13th Meeting: Marrakech, MA,2019年01月,pp.1-9

Also Published As

Publication number Publication date
WO2020131891A1 (en) 2020-06-25
EP3891985A1 (en) 2021-10-13
JP7201821B2 (ja) 2023-01-10
MX2021007198A (es) 2021-07-21
CN114710668A (zh) 2022-07-05
CN115665412A (zh) 2023-01-31
EP3891986A1 (en) 2021-10-13
CA3123575A1 (en) 2020-06-25
JP2022513980A (ja) 2022-02-09
EP3891985A4 (en) 2022-03-30
CN115665410A (zh) 2023-01-31
CN113196767A (zh) 2021-07-30
CN114710668B (zh) 2023-05-12
US20230108222A1 (en) 2023-04-06
JP2023029423A (ja) 2023-03-03
US20210321110A1 (en) 2021-10-14
CN113196767B (zh) 2024-07-05
JP2022513981A (ja) 2022-02-09
SG11202106486XA (en) 2021-07-29
WO2020131900A1 (en) 2020-06-25
US11653005B2 (en) 2023-05-16
SG11202106484UA (en) 2021-07-29
US20210314577A1 (en) 2021-10-07
US20230247208A1 (en) 2023-08-03
CN113330746B (zh) 2022-09-16
KR20210095949A (ko) 2021-08-03
EP3891986A4 (en) 2022-03-30
CN113330746A (zh) 2021-08-31
CN115665411A (zh) 2023-01-31
AU2019405497A1 (en) 2021-07-22
BR112021011413A2 (pt) 2021-08-31
KR20210095948A (ko) 2021-08-03
US20240129494A1 (en) 2024-04-18
BR112021011398A2 (pt) 2021-08-31
US11553191B2 (en) 2023-01-10
AU2019405497B2 (en) 2023-06-01
US11889087B2 (en) 2024-01-30

Similar Documents

Publication Publication Date Title
JP7401554B2 (ja) エンコーダ、デコーダ及び対応する方法
JP7384902B2 (ja) 映像符号化におけるスライシング及びタイリング
JP7210748B2 (ja) ビデオエンコーダ、ビデオデコーダ、および対応する方法
JP7368477B2 (ja) ビデオエンコーダ、ビデオデコーダ、及び対応する方法
US11889087B2 (en) Tile group assignment for raster scan and rectangular tile groups in video coding
US11425377B2 (en) Arbitrary and wrap-around tile grouping
JP2023090749A (ja) ビデオエンコーダ、ビデオデコーダ、および対応する方法
JP2024084810A (ja) サブピクチャベースのビデオコーディングにおけるサブピクチャごとの1つのスライスの指示
JP2022540397A (ja) 識別子シグナリングを用いたビデオコーディングビットストリーム抽出

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210813

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221222

R150 Certificate of patent or registration of utility model

Ref document number: 7201820

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150