JP7490068B2 - ビデオコーディングおよびデコーディング - Google Patents

ビデオコーディングおよびデコーディング Download PDF

Info

Publication number
JP7490068B2
JP7490068B2 JP2022545938A JP2022545938A JP7490068B2 JP 7490068 B2 JP7490068 B2 JP 7490068B2 JP 2022545938 A JP2022545938 A JP 2022545938A JP 2022545938 A JP2022545938 A JP 2022545938A JP 7490068 B2 JP7490068 B2 JP 7490068B2
Authority
JP
Japan
Prior art keywords
aps
unit
nal
picture
nal unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022545938A
Other languages
English (en)
Other versions
JP2023518925A (ja
Inventor
ナエル ウエドラオゴ,
パトリス オンノ,
ギローム ラロシュ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2023518925A publication Critical patent/JP2023518925A/ja
Application granted granted Critical
Publication of JP7490068B2 publication Critical patent/JP7490068B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)

Description

本発明は、ビデオコーディング及びデコーディングに関し、特に、適応パラメータセット(APS)を用いたビデオコーディング及びデコーディングに関する。
最近、MPEGとITU-T Study Group 16のVCEGにより形成された協力チームであるJoint Video Experts Team(JVET)は、VVC(Versatile Video Coding)と呼ばれる新しいビデオコーディング規格の研究を開始した。VVCの目標は、既存のHEVC規格を上回る(すなわち、典型的には、前の2倍の)圧縮性能の著しい改善を提供し、2020年に完了することである。主なターゲットアプリケーションおよびサービスは、360度およびハイダイナミックレンジ(HDR)ビデオを含むが、これらに限定されない。全体として、JVETは、32の組織からの応答を、独立した試験機関によって実施された正式な主観的試験を用いて評価した。いくつかの提案は、HEVCを使用する場合と比較して、典型的には40%以上の圧縮効率の向上を実証した。超高精細(UHD)ビデオ試験材料について特に有効性を示した。したがって、最終規格の目標50%をはるかに超える圧縮効率の向上が期待できる。
VVCは、コード化ビデオシーケンスの1つまたは複数のスライスによって共有され得るパラメータを搬送するための適応パラメータセットまたはAPSを与える。VVCドラフト8は、スライスまたはピクチャヘッダ中に見出される0個以上のシンタックス要素によって決定される、0個以上のスライスに適用するシンタックス要素を含むシンタックス構造としてAPSを定義する。2つ以上のAPSは、同じコード化ピクチャに属するスライスに適用され得る。ピクチャユニットは、正確に1つのコード化ピクチャに対応する。ピクチャユニットは次に、ネットワーク抽象化レイヤ(NAL)ユニットのセットである。VVCドラフト8では、ピクチャユニット内に存在する任意のAPSが同じAPSタイプおよび同じAPS識別子を有するとき、同じコンテンツを共有するように制約される。また、ピクチャユニットがスライスNALユニットの前に送られたAPSを参照し得る複数のスライスを使用してコーディングされるとき、複数の構成は使用中のAPSをメモリ中に維持するための追加のデコーディング動作、および/またはコーディングされたビデオシーケンス中の特定のタイミングでランダムアクセスデコーディングを実行するときのビットストリーム書き換え動作を必要とし得る。
APSのコーディングおよびそれらの参照を改善することが望ましい。
本発明の第1の態様によれば、ビットストリーム内に一連の画像を符号化する方法であって、ビットストリーム内に一連のピクチャユニットを提供することと、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つそれぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、ピクチャユニットに、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含めることを禁止することと、を含むことを特徴とする方法が提供される。
これは、VVC8において、APSの2つのバージョンが同じピクチャユニットの異なるスライスに適用され得るという問題を解決することができる。次いで、ビットストリームをデコードするために、デコーダは、APS識別子およびAPSタイプの値の所与のペアについてAPSの2つのバージョンをメモリに記憶しなければならない。最悪の場合の例では、デコーダがピクチャユニットをデコードするために必要とされるAPSを記憶するために、(各APSの2つのバージョンを維持するために)メモリサイズを2倍にしなければならないことがある。さらに、デコーダはどのVCL NALユニットがAPS NALユニットの第1のバージョンまたは第2のバージョンを参照するかを決定するために、APS NALユニットに対するVCL NALユニットの順序を維持しなければならない。ピクチャユニットに、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含めることを禁止することにより、APSの2つのバージョンが必要とされるいくつかの状況を排除することができる。
本発明の第2の態様によれば、第1の態様のように、関連するピクチャユニットの最初のNALユニットの後のプレフィックスAPS NALユニットをピクチャユニットに含めることを禁止する代わりに、第2の態様は、関連するピクチャユニットの最後のNALユニットの前のサフィックスAPS NALユニットをピクチャユニットに含めることを禁止することを含むことを除いて、第1の態様と同じである画像のシーケンスを符号化する方法が提供される。
この方法は第1の態様の方法と相補的であり、同じ問題に対処する。ピクチャユニットに、関連するピクチャユニットの最後のNALユニットの前のサフィックスAPS NALユニットを含めることを禁止することによって、APSの2つのバージョンが必要とされるいくつかの状況を排除することができる。
また、関連するピクチャユニットの最後のNALユニットの前のサフィックスAPS NALユニットをピクチャユニットに含めることを禁止することと、関連するピクチャユニットの最初のNALユニットの後のプレフィックスAPS NALユニットをピクチャユニットに含めることを禁止することと、の両方を行うことも可能である。次に、APSの2つのバージョンが必要とされる状況の排除がさらに強化される。
本発明の第3の態様によれば、ビットストリーム内に一連の画像を符号化する方法であって、ビットストリーム内に一連のピクチャユニットを提供することと、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つそれぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSは、プレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、それぞれの前記APS NALユニットはAPSタイプおよびAPS識別子を有し、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが、異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを可能にすることと、を含むことを特徴とする方法が提供される。
同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが、異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを可能にすることは、VVC8における制約に対する新しい自由度が得られる。VVC8では、APS NALユニットが異なる(プレフィックスおよびサフィックス)タイプであっても、それらは1つのピクチャユニット内に存在することができない。
アプリケーションが、あるピクチャユニット(ランダムアクセスポイント)において復号を開始するためにビットストリームへのランダムアクセスを実行するとき、アプリケーションは、ピクチャユニットのVCL NALユニットの前に、あるAPS NALユニットを与えなければならないことがある。例えば、アプリケーションは、ピクチャユニットの先頭に必要なAPS NALユニットを挿入することができる。しかし、結果として生じるビットストリームは、VVC8の特定の制約を破る可能性が高い。これは、復号がエラー状態に入る結果となり得る。
1つの制約は、PUの最初のVCL NALの前にAPSが送信されるときにエンコーダがプレフィックスAPS NALユニットを使用しなければならないという制約に反して、サフィックスAPS NALユニットがPUの最初のVCL NALユニットの前に挿入され得ることである。また、挿入は同じ識別子およびタイプを有するが、VVC8では許可されていない異なるコンテンツを有するAPSを含む、サフィックスおよびプレフィックスAPS NALユニットを有するピクチャユニットをもたらし得る。
したがって、アプリケーションは、新しいプレフィックスAPS NALユニットを生成するために、APS NALユニットのAPSタイプ(nal_unit_type)を書き換えなければならないことがある。さらに、アプリケーションは、次のPUの先頭に、新しいプレフィックスAPS NALユニットとして、サフィックスAPS NALユニットを移動し、書き換えなければならない場合がある。この次のPUもまた、新しいプレフィックスAPS NALユニットと同じ識別子およびタイプを有するAPS NALユニットを含む場合、アプリケーションは、それを移動し、書き換えなければならないこともある。
ビットストリームをVVC8に準拠させるためのこれらの移動動作は、最悪の場合、ランダムアクセスされたピクチャユニットの後にPUのすべてのAPS NALユニットを書き換える必要があるため、コストがかかる。
本発明の第3の態様の方法は、シンタックス構造に制約を課すか、削除するか、または変更して、書き換え動作がより少ないか、またはまったくないことを保証する。
一実施形態は、特定のVCL NALユニットに関連付けられたサフィックスAPS NALユニットの使用を、サフィックスAPS NALユニットを含むピクチャユニットのVCL NALユニットによって禁止することと、該サフィックスAPS NALユニットの使用を、復号順序で該サフィックスAPS NALユニットに続くピクチャユニットのVCL NALユニットによって許可することと、をさらに含む。
別の実施形態は、プレフィックスAPS NALユニットが、関連するピクチャユニット内の任意のサフィックスAPS NALユニットの前および関連するピクチャユニットの最後のVCL NALユニットの前でなければならず、サフィックスAPS NALユニットが、関連するピクチャユニット内の任意のプレフィックスAPS NALユニットの後および関連するピクチャユニットの最初のVCL NALユニットの後でなければならないように、ピクチャユニットに含まれるAPS NALユニットを制約することをさらに含む。
別の実施形態は、関連するピクチャユニットの最後のNALユニットの前にサフィックスAPS NALユニットをピクチャユニットに含めることを禁止することをさらに含む。
別の実施形態は、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットをピクチャユニットに含めることを禁止することをさらに含む。
別の実施形態は、ピクチャユニットにおいて、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットの後に、同じAPSタイプおよび同じAPS識別子を有するAPSを含むプレフィックスAPS NALユニットが続くことを禁止することをさらに含む。この方法(measure)は、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが、異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを許可することなく(第3の態様と同様に)、本発明の第2の態様にも適用することができる。
別の実施形態は、ピクチャユニットにおいて、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットが、同じAPSタイプおよび同じAPS識別子を有するAPSを含むサフィックスAPS NALユニットに先行されることを禁止することをさらに含む。この方法(measure)は、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが、異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを許可することなく(第3の態様と同様に)、本発明の第1の態様にも適用することができる。
また、最後の2つの方法は、ピクチャユニットに、関連するピクチャユニットの最初のNALユニットの後のプレフィックスAPS NALユニットを含めることを禁止せず(第1の態様のように)、ピクチャユニットに、関連するピクチャユニットの最後のNALユニットの前のサフィックスAPS NALユニットを含めることを禁止せず(第2の態様のように)、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを許可せず(第3の態様のように)に、使用することができる。したがって、本発明の別の態様によれば、ビットストリーム内に一連の画像を符号化する方法であって、ビットストリーム内に一連のピクチャユニットを提供することと、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含む一連のピクチャユニットに含まれ、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含み、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSは、プレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、それぞれの前記APS NALユニットはAPSタイプおよびAPS識別子を有し、ピクチャユニットにおいて、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットの後に、同じAPSタイプおよび同じAPS識別子を有するAPSを含むプレフィックスAPS NALユニットが続くことを禁止することと、ピクチャユニットにおいて、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットが、同じAPSタイプおよび同じAPS識別子を有するAPSを含むサフィックスAPS NALユニットに先行されることを禁止することと、の一方または両方を行うことと、を含むことを特徴とする方法が提供される。
本発明の第4の態様によれば、一連の符号化された画像を復号する方法であって、一連のピクチャユニットを有するビットストリームを受信することと、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含む一連のピクチャユニットに含まれ、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含み、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、受信されたビットストリームの1つまたは複数の適合性基準との適合性をチェックすることとを含み、ここで、前記または1つの前記適合性基準は、ピクチャユニット内に、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含めることを禁止する制約である、ことを特徴とする方法が提供される。
本発明の第5の態様によれば、一連の符号化された画像を復号する方法であって、受信されたビットストリームの、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットをピクチャユニットに含めることを禁止する制約との適合性をチェックする(第4の様態のように)代わりに、受信したビットストリームの、関連するピクチャユニットの最後のNALユニットの前のサフィックスAPS NALユニットがピクチャユニットに含まれることを禁止する制約との適合性をチェックする、ことを特徴とする方法が提供される。
一実施形態では、チェックすることは、関連するピクチャユニットの最後のNALユニットの前のサフィックスAPS NALユニットのピクチャユニットに含めることを禁止する制約と、関連するピクチャユニットの最初のNALユニットの後のプレフィックスAPS NALユニットをピクチャユニットに含めることを禁止する制約と、の両方との適合性をチェックすることを含む。
本発明の第6の態様によれば、一連の符号化された画像を復号する方法であって、一連のピクチャユニットを有するビットストリームを受信することと、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、それぞれの前記APS NALユニットは、APSタイプとAPS識別子とを有し、前記受信されたビットストリームの、1つまたは複数の適合性基準との適合性をチェックすることと、を含み、前記または1つの前記適合性基準は、同じピクチャユニット内に、同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることは許可される、ことを特徴とする方法が提供される。
一実施形態では、適合性基準は、特定のVCL NALユニットを含むピクチャユニットのVCL NALユニットによる特定のVCL NALユニットに関連付けられたサフィックスAPS NALユニットの使用を禁止することと、該サフィックスAPS NALユニットの、復号順序において該サフィックスAPS NALユニットに後続するピクチャユニットのVCL NALユニットによる使用を可能にすることとを含む。
別の実施形態では、適合性基準は、プレフィックスAPS NALユニットが、関連するピクチャユニット内の任意のサフィックスAPS NALユニットの前および関連するピクチャユニットの最後のVCL NALユニットの前でなければならず、サフィックスAPS NALユニットが、関連するピクチャユニット内の任意のプレフィックスAPS NALユニットの後および関連するピクチャユニットの最初のVCL NALユニットの後でなければならないように、ピクチャユニットに含まれるAPS NALユニットを制約することを含む。
別の実施形態では、適合性基準は、ピクチャユニット内に、関連するピクチャユニットの最後のNALユニットの前にサフィックスAPS NALユニットを含めることを禁止する制約を含む。
別の実施形態では、適合性基準は、関連するピクチャユニットの最初のNALユニットの後のプレフィックスAPS NALユニットの、ピクチャユニットへの包含を禁止することを含む。
別の実施形態では、適合性基準は、ピクチャユニット内で、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットの後に、同じAPSタイプおよび同じAPS識別子を有するAPSを含むプレフィックスAPS NALユニットが続くことを禁止する、ことを含む。この方法(measure)は、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが、異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを許可することなく(第6の態様と同様に)、本発明の第5の態様にも適用することができる。
別の実施形態では、適合性基準は、ピクチャユニット内に、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットが、同じAPSタイプおよび同じAPS識別子を有するAPSを含むサフィックスAPS NALユニットに先行されることを禁止することを含む。この方法(measure)は、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを許可することなく(第6の態様と同様に)、本発明の第4の態様にも適用することができる。
また、最後の2つの方法は、ピクチャユニットに、関連するピクチャユニットの最初のNALユニットの後のプレフィックスAPS NALユニットを含めることを禁止せず(第4の態様のように)、ピクチャユニットに、関連するピクチャユニットの最後のNALユニットの前のサフィックスAPS NALユニットを含めることを禁止せず(第5の態様のように)、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを許可せず(第6の態様のように)に、使用することができる。したがって、本発明の別の態様によれば、一連の符号化された画像を復号する方法であって、一連のピクチャユニットを有するビットストリームを受信することと、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、それぞれのAPS NALユニットは、APSタイプとAPS識別子とを有し、受信されたビットストリームの、1つまたは複数の適合性基準との適合性をチェックすることと、を含み、ここで、適合性基準は、ピクチャユニット内で、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットの後に、同じAPSタイプおよび同じAPS識別子を有するAPSを含むプレフィックスAPS NALユニットが続くことを禁止する基準、ピクチャユニット内に、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットが、同じAPSタイプおよび同じAPS識別子を有するAPSを含むサフィックスAPS NALユニットに先行されることを禁止する基準、の一方もしくは両方を含む。
本発明の前述の第1~第6の態様およびさらなる態様を具現化する方法では、NALユニットは、VCL NALユニットおよびAPS NALユニットに限定されない。たとえば、一連のピクチャユニットに含まれるNALユニットは、VCL NALユニットでもAPS NALユニットでもなく、ピクチャユニット中に存在する場合、関連するピクチャユニットの最初のVCL NALユニットに先行するピクチャヘッダNALユニットをさらに備え得る。その場合、このPHで参照されるAPS NALユニットは、最初のVCL NALユニットよりも前であるだけでなく、PH NALユニットよりも前でなければならない。PH NALユニットの代わりに、より一般的な定式化は、1つまたは複数のVCL NALユニットのためのAPSへの参照を通知するVCL NALユニットでもAPS NALユニットでもない非VCL NALユニットである。APS NALユニットの順序付けのための制約は、ここで、これらの非VCL NALユニットと相対的であるべきである。例えば、プレフィックスAPS NALユニットは、最初の非VCL NALユニットおよび最初のVCL NALユニットの前にあるべきである。
本発明の第7の態様によれば、ビットストリーム内に画像のシーケンスを符号化するための装置であって、ビットストリーム内に一連のピクチャユニットを提供する手段と、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含み、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、ピクチャユニットに、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含めることを禁止する手段とを備えることを特徴とする装置が提供される。
本発明の第8の態様によれば、ビットストリーム内に画像のシーケンスを符号化するための装置であって、ビットストリーム内に一連のピクチャユニットを提供する手段と、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、ピクチャユニットに、関連するピクチャユニットの最後のNALユニットの前にサフィックスAPS NALユニットを含めることを禁止する手段とを備えることを特徴とする装置が提供される。
本発明の第9の態様によれば、ビットストリーム内に画像のシーケンスを符号化するための装置であって、ビットストリーム内に一連のピクチャユニットを提供する手段と、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSは、プレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、それぞれの前記APS NALユニットは、APSタイプとAPS識別子とを有し、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが、異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを可能にする手段とを備えることを特徴とする装置が提供される。
本発明の第10の態様によれば、符号化された画像のシーケンスを復号するための装置であって、一連のピクチャユニットを有するビットストリームを受信する手段を備え、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、受信されたビットストリームの、1つまたは複数の適合性基準との適合性をチェックする手段と、を備え、ここで、前記または1つの前記適合性基準は、ピクチャユニット内に、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含めることを禁止する制約であることを特徴とする装置が提供される。
本発明の第11の態様によれば、符号化された画像のシーケンスを復号するための装置であって、一連のピクチャユニットを有するビットストリームを受信する手段を備え、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、受信されたビットストリームの、1つまたは複数の適合性基準との適合性をチェックする手段を備え、ここで、前記または1つの前記適合性基準は、ピクチャユニット内に、関連する前記ピクチャユニットの最後のNALユニットの前にサフィックスAPS NALユニットを含めることを禁止する制約であることを特徴とする装置が提供される。
本発明の第12の態様によれば、符号化された画像のシーケンスを復号するための装置であって、一連のピクチャユニットを有するビットストリームを受信する手段を備え、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、それぞれの前記APS NALユニットは、APSタイプとAPS識別子とを有し、受信されたビットストリームの、1つまたは複数の適合性基準との適合性をチェックする手段と、を備え、前記または1つの前記適合性基準は、同じピクチャユニット内に、同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることは許可することを特徴とする装置が提供される。
第4~第6の態様およびさらなる態様の方法、ならびに第10~第12の態様のデバイスでは、適合性チェックにより適合しないビットストリームが明らかになった場合、ビットストリームの復号は全体的または部分的に放棄される可能性がある。また、デコーダのユーザに誤差を通知するなどのアクションが行われてもよい。デコーダはまた、ビットストリームが非準拠であり、復号に不適切であることをエンコーダに通知し得る。エンコーダは、画像のシーケンスを再符号化して適合ビットストリームを生成することで応答する場合がある。後に述べるように、適合性検査は、本発明を実施するすべての復号方法またはすべてのデコーダにおいて必須ではない。
本発明の第13の態様によれば、プロセッサまたはコンピュータによって実行されると、本発明の第1~第6の態様のいずれか1つの方法をプロセッサまたはコンピュータに実行させるプログラムが提供される。
プログラムはそれ自体で提供されてもよいし、キャリア媒体上、キャリア媒体によって、またはキャリア媒体中で搬送されてもよい。キャリア媒体は非一時的な、例えば、記憶媒体、特にコンピュータ可読記憶媒体であってもよい。キャリア媒体はまた、一時的なもの、例えば、信号または他の伝送媒体であってもよい。信号は、インターネットを含む任意の適切なネットワークを介して送信され得る。本発明のさらなる特徴は、独立請求項および従属請求項によって特徴付けられる
本発明の第14の態様によれば、一連の符号化された画像を表し且つ一連のピクチャユニットを有するビットストリームであって、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、前記NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる前記画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む前記一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、ここで、一連のピクチャユニットのピクチャユニットのいずれも、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含まないことを特徴とするビットストリームが提供される。
先行するビットストリーム特性を表現する代替的な方法は、ピクチャユニットにおいて、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含めることが禁止されることである。
本発明の第15の態様によれば、一連の符号化された画像を表し且つ一連のピクチャユニットを有するビットストリームであって、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる前記画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、ここで、一連のピクチャユニットのピクチャユニットのいずれも、関連するピクチャユニットの最後のNALユニットの前にサフィックスAPS NALユニットを含まないことを特徴とするビットストリームが提供される。
先行するビットストリーム特性を表現する代替的な方法は、関連するピクチャユニットの最後のNALユニットの前にサフィックスAPS NALユニットをピクチャユニットに含めることが禁止されることである。
好ましくは、一連のピクチャユニットのうちのいずれのピクチャユニットも、関連するピクチャユニットの最後のNALユニットの前にサフィックスAPS NALユニットを含まず、一連のピクチャユニットのうちのいずれのピクチャユニットも、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含まない。
先行するビットストリーム特性を表現する代替的な方法は、ピクチャユニットに、関連するピクチャユニットの最後のNALユニットの前のサフィックスAPS NALユニットを含めることが禁止され、ピクチャユニットに、関連するピクチャユニットの最初のNALユニットの後のプレフィックスAPS NALユニットを含めることが禁止されることである。
本発明の第16の態様によれば、一連の符号化された画像を表し且つビットストリーム内に一連のピクチャユニットを有する該ビットストリームであって、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、それぞれの前記APS NALユニットは、APSタイプとAPS識別子とを有し、ここで、一連のピクチャユニットのうちの少なくとも1つのピクチャユニットは、同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む、
ことを特徴とするビットストリームが提供される。
先行するビットストリーム特性を表現する代替的な方法は、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることが許可されることである。
一実施形態では、サフィックスAPS NALユニットがある一連のピクチャユニットのそれぞれにおいて、該サフィックスユニットは、特定のVCL NALユニットを含むピクチャユニットのVCL NALユニットによって使用されず、特定のVCL NALユニットを含むピクチャユニットのVCL NALユニットによって使用されないそのようなサフィックスAPS NALユニットを有する少なくとも1つのピクチャユニットについて、該サフィックスAPS NALユニットは、復号順序において該サフィックスAPS NALユニットに後続する1つまたは複数のピクチャユニットの1つまたは複数のVCL NALユニットによって使用される。
先行するビットストリーム特性を表現する代替的な方法は、特定のVCL NALユニットを含むピクチャユニットのVCL NALユニットによるサフィックスAPS NALユニットの使用が禁止され、復号順序においてサフィックスAPS NALユニットに続くピクチャユニットのVCL NALユニットによる該サフィックスAPS NALユニットの使用が許可されることである。
一実施形態では、プレフィックスAPS NALユニットを含む各ピクチャユニットにおいて、プレフィックスAPS NALユニットは、関連するピクチャユニット内の任意のサフィックスAPS NALユニットの前であって、関連するピクチャユニットの最後のVCL NALユニットの前であり、サフィックスAPS NALユニットを含む各ピクチャユニットにおいて、サフィックスAPS NALユニットは、関連するピクチャユニット内の任意のプレフィックスAPS NALユニットの後であって、関連するピクチャユニットの最初のVCL NALユニットの後でなければならない。
先行するビットストリーム特性を表現する代替的な方法は、一連のピクチャユニットに含まれるAPS NALユニットが、プレフィックスAPS NALユニットが、関連するピクチャユニット内の任意のサフィックスAPS NALユニットの前であって且つ関連するピクチャユニットの最後のVCL NALユニットの前であり、サフィックスAPS NALユニットが、関連するピクチャユニット内の任意のプレフィックスAPS NALユニットの後であって且つ関連するピクチャユニットの最初のVCL NALユニットの後であるように制約されることである。
一実施形態では、一連のピクチャユニットのいずれも、関連するピクチャユニットの最後のNALユニットの前にサフィックスAPS NALユニットを含まない。
先行するビットストリーム特性を表現する代替的な方法は、ピクチャユニットにおいて、関連するピクチャユニットの最後のNALユニットの後にサフィックスAPS NALユニットを含めることが禁止されることである。
一実施形態では、一連のピクチャユニットのいずれも、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含まない。
先行するビットストリーム特性を表現する代替的な方法は、ピクチャユニットにおいて、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含めることが禁止されることである。
一実施形態では、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットを含む任意のピクチャユニットにおいて、参照するVCL NALユニットは、同じAPSタイプおよび同じAPS識別子を有するAPSを含むプレフィックスAPS NALユニットにより後続されない。この方法(measure)は、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを許可することなく(第16の態様と同様に)、本発明の第15の態様にも適用することができる。
先行するビットストリーム特性を表現する代替的な方法は、ピクチャユニットにおいて、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットの後に、同じAPSタイプおよび同じAPS識別子を有するAPSを含むプレフィックスAPS NALユニットが続くことが禁止されることである。
一実施形態では、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットを含む任意のピクチャユニットにおいて、参照するVCL NALユニットは、同じAPSタイプおよび同じAPS識別子を有するAPSを含むサフィックスAPS NALユニットにより先行されない。この方法(measure)は、同じピクチャユニットに、同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含めることを許可することなく(第16の態様と同様に)、本発明の第14の態様にも適用することができる。
先行するビットストリーム特性を表現する代替的な方法は、ピクチャユニットにおいて、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットが同じAPSタイプおよび同じAPS識別子を有するAPSを含むサフィックスAPS NALユニットが先行することが禁止されることである。
また、最後の2つの方法は、一連のピクチャユニットにおけるピクチャユニットのいずれもが、関連するピクチャユニットの最初のNALユニットの後にプレフィックスAPS NALユニットを含まない(第14の様態の)ビットストリーム特性無しに、一連のピクチャユニットにおけるピクチャユニットのいずれもが、関連するピクチャユニットの最後のNALユニットの前にサフィックスAPS NALユニットを含まない(第15の態様の)ビットストリーム特性無しに、一連のピクチャユニットの少なくとも1つのピクチャユニットが同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む(第16の態様の)ビットストリーム特性無しに、使用可能である。したがって、本発明の別の態様によれば、一連の符号化された画像を表し且つビットストリーム内に一連のピクチャユニットを有する該ビットストリームであって、それぞれの前記ピクチャユニットは、1つの符号化された画像に対応し、且つ1つまたは複数のネットワーク抽象化レイヤ(NAL)ユニットを含み、NALユニットは、それぞれが、符号化された画像データを含むビデオコーディングレイヤ(VCL)NALユニットを含み、且つ、それぞれが、1つまたは複数のVCL NALユニットに含まれる画像データに対して1つまたは複数のタイプの処理動作を実行するためのパラメータを有する適応パラメータセット(APS)を含む適応パラメータセットNALユニットも含む一連のピクチャユニットに含まれ、APS NALユニットは、プレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを含む一連のピクチャユニットに含まれ、ここで、APSが、関連するピクチャユニットの最初のVCL NALの前のピクチャユニットに存在する場合、該APSはプレフィックスAPS NALユニットに含まれなければならず、APSが、関連するピクチャユニットの最後のVCL NALの後のピクチャユニットに存在する場合、該APSは、サフィックスAPS NALユニットに含まれなくてはならず、それぞれの前記APS NALユニットは、APSタイプとAPS識別子とを有し、ビットストリームは、以下の特性の一方または両方を有する:特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットを含む任意のピクチャユニットにおいて、参照するVCL NALユニットの後に、同じAPSタイプおよび同じAPS識別子を有するAPSを含むプレフィックスAPS NALユニットは続かない、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットを含む任意のピクチャユニットにおいて、参照するVCL NALユニットは、同じAPSタイプおよび同じAPS識別子を有するAPSを含むサフィックスAPS NALユニットにより先行されない、ことを特徴とするビットストリームが提供される。
第14の態様~第16の態様、および上記のさらなる態様のビットストリームがどのように使用されるかは、特に限定されない。本発明の第17の態様は、第14~第16の態様およびさらなる態様のいずれか1つによる、ビットストリーム中の画像のシーケンスを符号化する方法を提供する。
本発明の第18の態様は、符号化画像のシーケンスを復号する方法であって、第14~第16の態様のいずれか1つによるビットストリームを受信することを含む方法を提供する。
この態様では、ビットストリームを受信するのに十分である。適合性チェックは不要である。例えば、デコーダは単に、第14~第16の態様のいずれか1つのビットストリームを受信し、それを復号することができる。例えば、一実施形態は、NALユニットを復号することと、VCL NALユニットに含まれる画像データおよびAPS NALユニットに含まれるAPSのパラメータを取得することと、取得されたAPSパラメータを使用して、取得された画像データを処理することと、をさらに含む。
本発明の第19の態様によれば、本発明の第1~第3の態様のいずれか1つの符号化の方法によって生成されるビットストリームが提供される。
ビットストリームは、通常、一時的な信号の形態である。しかしながら、非一時的な形態では、ビットストリームが例えば、媒体記憶装置などの記録媒体またはコンピュータ可読記憶装置に記憶され得る。DVD、ブルーレイディスク、または他の光学記憶媒体は、ビットストリームのための記憶媒体の一例である。したがって、本発明の第20の態様によれば、本発明の第14~第16および第19の態様のいずれか1つのビットストリームを記憶するコンピュータ可読記憶媒体が提供される。
本発明の一態様における任意の特徴は、任意の適切な組み合わせで、本発明の他の態様に適用され得る。特に、方法の態様は、装置の態様に適用されてもよく、逆もまた同様である。
さらに、ハードウェアで実装される特徴は、ソフトウェアで実装されてもよく、逆もまた同様である。本明細書におけるソフトウェアおよびハードウェア特徴へのいかなる参照も、それに応じて解釈されるべきである。
本明細書に記載される任意の装置特徴は、方法特徴として提供されてもよく、逆もまた同様である。本明細書で使用される場合、ミーンズプラスファンクション特徴は、適切にプログラムされたプロセッサおよび関連するメモリなど、それらの対応する構造に関して代替的に表現され得る。
また、本発明の任意の態様に記載および定義された様々な特徴の特定の組み合わせが、独立して実装および/または供給および/または使用され得ることが理解されるべきである。
次に、本発明の実施形態を、単なる例として、以下の図面を参照して説明する。
図1は、本発明の実施形態による、ピクチャのタイルおよびスライスへの分割を示す。 図2は、例示的なVVCビットストリームを示す。 図3は、本発明の1つまたは複数の実施形態が実施され得るデータ通信システムを概略的に示すブロック図である。 図4は、本発明の1つまたは複数の実施形態が実装され得る処理デバイスの構成要素を示すブロック図である。 図5は、本発明の1つまたは複数の実施形態が実装され得るエンコーダの構成要素を示すブロック図である。 図6は、本発明の1つまたは複数の実施形態が実装され得るデコーダの構成要素を示すブロック図である。 図7は、本発明の実施形態による符号化プロセスを示すフローチャートである。 図8は、本発明の実施形態によるデコード処理を示すフローチャートである。 図9は、図8の復号処理の部分をより詳細に示すフローチャートである。 図10は、図8の復号処理のさらなる部分をより詳細に示すフローチャートである。 図11Aは、VVC8に準拠したビットストリームの例を示す。 図11Bは、本発明の一実施形態によるビットストリームを示す。 図12Aは、VVC8に準拠するビットストリームの別の例を示す。 図12Bは、ランダムアクセスが必要とされる場合の図12Aのビットストリームの第1の変形例を示す。 図12Cは、ランダムアクセスが必要とされる場合の図12Aのビットストリームの第2の変形例を示す。 図12Dは、本発明の一実施形態による、図12Aの例に対応するビットストリームを示す。 図13は、本発明の別の実施形態によるビットストリームを示す。 図14は、本発明の1つまたは複数の実施形態が実装され得るネットワークカメラシステムを示す図である。 図15は、本発明の1つまたは複数の実施形態が実装され得るスマートフォンを示す図である。
以下に説明する本発明の実施形態は、画像(又はピクチャ)の符号化及び復号の改善に関する。
本明細書では、「通知(signalling)」は、1つまたは複数のパラメータまたはシンタックス要素に関するビットストリーム情報、たとえば、サブピクチャの識別子、サブピクチャのサイズ/幅/高さ、単一の画像部分(たとえば、スライス)のみがサブピクチャに含まれるかどうか、スライスが長方形スライスであるかどうか、および/またはサブピクチャに含まれるスライスの数のうちのいずれか1つまたは複数を決定するための情報に挿入すること(提供すること/含むこと/符号化すること)、または該情報から抽出すること/取得すること(復号すること)を指し得る。
本明細書では、「処理(processing)」は、データに対して実行されている任意の種類の動作、たとえば、1つまたは複数の画像/ピクチャのための画像データを符号化または復号することを指し得る。
本明細書では、用語「スライス」が画像部分の例(そのような画像部分の他の例が1つまたは複数のコーディングツリーユニットを含む画像部分である)として使用される。本発明の実施形態はまた、スライスの代わりに画像部分と、(スライスヘッダまたはスライスセグメントヘッダの代わりに)画像部分のためのヘッダなどの適切に修正されたパラメータ/値/シンタックスとに基づいて実装され得ることが理解される。スライスヘッダ、スライスセグメントヘッダ、シーケンスパラメータセット(SPS:sequence parameter set)、またはピクチャパラメータセット(PPS:Picture Parameter Set)中で通知されるものとして本明細書で説明する様々な情報は、それらをそれらのメディア中で通知することによって提供される同じ機能を提供することが可能である限り、それらが他の場所でシグナリングされ得ることも理解されたい。スライス、タイルグループ、タイル、コーディングツリーユニット(CTU)/最大コーディングユニット(LCU)、コーディングツリーブロック(CTB)、コーディングユニット(CU)、予測ユニット(PU)、変換ユニット(TU)、またはピクセル/サンプルのブロックのうちのいずれかを画像部分と呼ぶことができることも理解されたい。
また、構成要素またはツールが「アクティブ」として記述される場合、構成要素/ツールは「有効(enabled)」、または「利用可能(available for use)」、または「使用される(used)」、であり、「非アクティブ」として記述される場合、構成要素/ツールは、「無効(disabled)」、または「利用不可能(unavailable for use)」、または「使用されない(not used)」、であり、「推測可能(can be inferred)」は、ビットストリーム内でそれを明示的に通知することなく、関連する値またはパラメータを他の情報から決定/取得できることを指すことが理解される。さらに、フラグが「アクティブ」と記述されるとき、フラグは関連する構成要素/ツールが「アクティブ」(すなわち、「有効(effective)」)であることを示すことを意味することも理解されたい。
本明細書において、特に明記しない限り、関連する用語は、以下に示す最新のVVCドラフト8、VVC8におけるものと同じ定義を有する。イタリック体の用語は、それら独自のVVC8定義を有する。
スライス:単一のNALユニットに排他的に含まれるピクチャのタイル内の整数個の完了タイルまたは整数個の連続する完了CTU行
スライスヘッダ:スライス内に表されるタイル内のすべてのタイルまたはCTU行に関係するデータ要素を含む符号化スライスの一部
タイル:ピクチャ内の特定のタイル列および特定のタイル行内のCTUの矩形領域
サブピクチャ:ピクチャ内の1つまたは複数のスライスの矩形領域
ピクチャ(または画像):モノクロフォーマットのルマサンプルのアレイ、または4:2:0、4:2:2、および4:4:4カラーフォーマットのクロマサンプルの2つの対応するアレイとルマサンプルのアレイ
符号化ピクチャ:AU内のnuh_layer_idの特定の値を有するVCL NALユニットを備え、ピクチャのすべてのCTUを含むピクチャの符号化表現
符号化表現:その符号化形式で表されるデータ要素
ラスタ走査:1次元パターン内の最初のエントリが左から右に走査される2次元パターンの一番上の行からであり、同様に、各々が左から右に走査されるパターンの2番目、3番目などの行(下に行く)が後に続くような、矩形の2次元パターンの1次元パターンへのマッピング
ブロック:サンプルのMxN(M列×N行)アレイ、または変換係数のMxNアレイ
符号化ブロック:符号化ブロックへのCTBの分割が区分(partitioning)であるような、MおよびNのいくつかの値のためのサンプルのMxNブロック
コーディングツリーブロック(CTB):構成要素のCTBへの分割が区分であるような、Nのいくつかの値に対するサンプルのNxNブロック
コーディングツリーユニット(CTU):ルマサンプルのCTB、3つのサンプルアレイを有するピクチャのクロマサンプルの2つの対応するCTB、または、サンプルを符号化するために使用される3つの別個のカラープレーンおよびシンタックス構造を使用して符号化されるモノクロピクチャまたはピクチャのサンプルのCTB
コーディングユニット(CU):ルマサンプルのコーディングブロック、3つのサンプルアレイを有するピクチャのクロマサンプルの2つの対応するコーディングブロック、または、サンプルを符号化するために使用される3つの別個のカラープレーンおよびシンタックス構造を使用して符号化されるモノクロピクチャまたはピクチャのサンプルのコーディングブロック
構成要素:4:2:0、4:2:2、または4:4:4カラーフォーマットのピクチャを構成する3つのアレイ(ルマと2つのクロマ)のうちの1つからのアレイまたは単一サンプル、またはモノクロフォーマットのピクチャを構成するアレイまたはアレイの単一サンプル
ピクチャパラメータセット(PPS):ピクチャヘッダまたはスライスヘッダ内で見つかったシンタックス要素によって決定される、0個以上の符号化ピクチャ全体に適用されるシンタックス要素を含むシンタックス構造
シーケンスパラメータセット(SPS):ピクチャヘッダ中に見出されるシンタックス要素によって参照されるPPS中に見出されるシンタックス要素の内容によって決定される、0個以上のCLV全体に適用されるシンタックス要素を含むシンタックス構造
適応パラメータセット(APS):スライスまたはピクチャヘッダ中に見出される0個以上のシンタックス要素によって決定される、0個以上のスライスに適用されるシンタックス要素を含むシンタックス構造
ネットワーク抽象化レイヤ(NAL)ユニット:後続すべきデータのタイプの指示と、エミュレーション防止バイトと共に必要に応じて散在されるRBSPの形態のそのデータを含むバイトとを含むシンタックス構造
ビデオコーディングレイヤ(VCL)NALユニット:本明細書においてVCL NALユニットとして分類されるnal_unit_typeの予約値を有する、符号化スライスNALユニットおよびNALユニットのサブセットのための総称
ピクチャヘッダ(PH):符号化ピクチャのすべてのスライスに適用されるシンタックス要素を含むシンタックス構造
スライスヘッダ:スライス内に表されるタイル内のすべてのタイルまたはCTU行に関係するデータ要素を含む符号化スライスの一部
適応ループフィルタ(ALF):復号処理の一部として適用され、APSにおいて伝達されるパラメータによって制御されるフィルタリングプロセス
クロマスケーリングを用いたルママッピング(LMCS):ルマサンプルを特定の値にマッピングし、スケーリング演算をクロマサンプルの値に適用し得る、復号処理の一部として適用されるプロセス
スケーリングリスト:各頻度インデックスをスケーリングプロセスのスケールファクターに関連付けるリスト
ピクチャユニット(PU):指定された分類ルールに従って互いに関連付けられたNALユニットのセットは復号順序で連続しており、正確に1つの符号化ピクチャを含む
アクセスユニット(AU):異なるレイヤに属し、DPBからの出力のために同時に関連付けられた符号化ピクチャを含む、PUのセット
図1は、VVC8と互換性のある、本発明の実施形態による、ピクチャをタイルおよびスライスに分割(partitioning)することを示す。ピクチャ101および102は、点線によって表されるコーディングツリーユニット(CTU)に分割される。CTUは、VVC8のための符号化および復号の基本単位である。たとえば、VVC8では、CTUが128×128画素のエリアを符号化することができる。
コーディングツリーユニット(CTU)は、(ピクセルまたは構成要素サンプル(値)のブロック、マクロブロック、またはコーディングブロックと呼ばれることさえもある。それは、ピクチャの異なる画像構成要素を同時に符号化/復号するために使用することができ、またはピクチャの異なる画像構成要素を別々に/個別に符号化/復号することができるように、1つの画像構成要素のみに限定することができる。画像のデータが各構成要素のための別個のデータを備えるとき、CTUは、構成要素ごとに1つのCTBをもつコーディングツリーブロック(CTB)のグループである。
図1に示すように、ピクチャはタイルの格子に従って(すなわち、タイルの1つまたは複数の格子に)分割(partitioned)することもでき、タイル境界は細い実線によって表される。タイルは、CTU分割とは無関係に定義することができる(ピクセル/構成要素サンプルの)矩形領域であるピクチャ部分(ピクチャの部分(parts)/部分(portions))である。タイルはまた、例えばVVC8におけるCTUのシーケンスに対応してもよく、そのため、図1に示される例では、分割技術がタイルの境界をCTUの境界と一致/整列するように制限することができる。
タイルは、タイル境界が符号化/復号プロセスの空間依存性を破るように定義される。言い換えれば、所与のピクチャにおいて、タイルは、同じピクチャの別の空間的に「隣接する」タイルとは無関係に符号化/復号され得るように定義/指定される。これは、タイル中のCTUの符号化/復号が、同じピクチャ中の別のタイルからのピクセル/サンプルまたはリファレンスデータに基づかない、ことを意味する。
いくつかの符号化/復号システム、例えば、本発明の実施形態またはVVC8の実施形態はスライスの概念を提供する(すなわち、1つまたは複数のスライスに基づく分割技術も使用する)。このメカニズムは、ピクチャを1つのグループに、またはタイルのいくつかのグループに、まとめてスライスと呼ばれるタイルのグループの分割を可能にする。各スライスは、1つのタイル、またはいくつかのタイル、または部分的なタイルから構成される。ピクチャ101および102によって示されるように、2つの異なる種類のスライスが提供される。第1の種類のスライスはピクチャ101内の太い実線で表されるように、ピクチャ内の長方形のエリア/領域を形成するスライスに制限される。ピクチャ101は、ピクチャを6つの異なる矩形スライス(0)~(5)に分割する。第2の種類のスライスは、ピクチャ102内の太い実線で表されるラスタ走査順序で連続するタイル(タイルのシーケンスを形成するように)に制限される。ピクチャ102は、ラスタ走査順序で連続するタイルから構成される3つの異なるスライス(0)~(2)へのピクチャの分割を有する。
多くの場合、矩形スライスは、ビデオ内の注目領域(RoI)を扱うための選択の構造/アレンジメント/構成である。
スライスは、1つまたはいくつかのネットワーク抽象化レイヤ(NAL)ユニットとしてビットストリーム内で符号化(またはビットストリームから復号)され得る。NALユニットは、符号化/復号ビットストリーム中のデータのカプセル化のためのデータの論理ユニットである(たとえば、整数のバイト数を含むパケットであって、複数のパケットが集合的に符号化ビデオデータを形成する)。
VVC8の符号化/復号システムでは、スライスが通常、単一のNALユニットとして符号化される。スライスがいくつかのNALユニットとしてビットストリーム中で符号化されるとき、スライスのための各NALユニットは、スライスセグメントと呼ばれる。スライスセグメントは、そのスライスセグメントの符号化パラメータを含むスライスセグメントヘッダを含む。変形例によれば、スライスの最初のスライスセグメントNALユニットのヘッダは、スライスのためのすべての符号化パラメータを含む。スライスの後続のNALユニットのスライスセグメントヘッダは、最初のNALユニットよりも少ないパラメータを含み得る。そのような場合、最初のスライスセグメントは独立したスライスセグメントであり、後続のセグメントは、(最初のスライスセグメントのNALユニットからの符号化パラメータに依存するので)依存するスライスセグメントである。
図2は、VVC8のための符号化システムの要件に適合する、本発明の一実施形態によるビットストリームの構成(すなわち、アレンジメント、構成、または配置)を示す。ビットストリーム200は、シンタックス要素の順序付けられたシーケンスを表す/示すデータと、符号化(画像)データとから構成される。シンタックス要素および符号化(画像)データは、一連のNALユニット201~209に配置される(すなわち、パッケージ化/グループ化される)。異なるNALユニットのタイプがある。ネットワーク抽象化レイヤ(NAL)は、リアルタイムプロトコル/インターネットプロトコル(RTP/IP)、ISOベースメディアファイルフォーマットなどのような、異なるプロトコルのパケットにビットストリームをカプセル化する能力を提供する。ネットワーク抽象化レイヤはまた、パケット損失回復力のためのフレームワークを提供する。
NALユニットは、ビデオコーディングレイヤ(VCL)NALユニットと非VCL NALユニットとに分割される。VCL NALユニットは、実際の符号化ビデオデータを含む。非VCL NALユニットには、追加情報が含まれる。この追加情報は、復号されたビデオデータの有用性を高めることができる、符号化ビデオデータまたは補足データの復号に必要なパラメータであり得る。図2のNALユニット206は、スライスに対応し(すなわち、それらは、スライスの実際の符号化ビデオデータを含む)、図2の例示的なビットストリームのVCL NALユニットを構成する。
単一の符号化ピクチャを符号化するすべてのNALユニット(VCLおよび関連する非VCL NALユニット)は、1つのピクチャユニットを形成する。この例では、非VCL NALユニット208は2つのVCL NALユニット206に関連付けられ、これらの3つのNALユニットは一緒に1つのピクチャユニットを形成し得る。
異なるNALユニット201~205および209は、異なるパラメータセットに対応し、これらのNALユニットは非VCL NALユニットである。
DCIは、Decoding Capability Informationの略である。DCI NALユニット201は、所与の復号プロセスに対して一定であるパラメータを含む。
VPSはVideo Parameter Setの略である。VPS NALユニット202は、ビデオ全体について定義されたパラメータを含み(たとえば、ビデオ全体がピクチャ/画像の1つまたは複数のシーケンスを含む)、したがって、ビットストリーム全体の符号化ビデオデータを復号するときに適用可能である。
DCI NALユニットは、VPS NALユニット内のパラメータよりも静的な(それらが安定しており、復号プロセス中にそれほど変化しないという意味で)パラメータを定義することができる。言い換えれば、DCI NALユニットのパラメータは、VPS NALユニットのパラメータよりも頻繁に変化しない。
SPSは、Sequence Parameter Setの略である。SPS NALユニット203は、ビデオシーケンス(すなわち、ピクチャまたは画像のシーケンス)のために定義されたパラメータを含む。特に、SPS NALユニットは、ビデオシーケンスのサブピクチャレイアウトおよび関連するパラメータを定義することができる。各サブピクチャに関連するパラメータは、サブピクチャに適用される符号化制約を指定する。一変形例によれば、SPS NALユニットは、同じサブピクチャから来るデータのみが時間予測プロセス中に使用するために利用可能であるように、サブピクチャ間の時間予測が制限されることを示すフラグを備える。別のフラグは、サブピクチャ境界にわたってループフィルタ(すなわち、ポストフィルタリング)を有効または無効にし得る。
PPSは、Picture Parameter Setの略である。PPS NALユニット204は、ピクチャまたはピクチャのグループに対して定義されたパラメータを含む。VVC8において指定されるPPSのシンタックスは、ルマサンプル中のピクチャのサイズを指定するシンタックス要素と、タイルおよびスライス中の各ピクチャの分割を指定するためのシンタックス要素も、備える。PPSは、ピクチャ/フレーム内のスライス位置を決定することを可能にするシンタックス要素を含む。
APSは、Adaptation Parameter Setの略である。APSはループフィルタ、典型的には、スライスレベルで使用される適応ループフィルタ(ALF)またはリシェーパモデル(またはクロマスケーリングを用いたルママッピング(LMCS)モデル)またはスケーリング行列、のパラメータを含む。
APSは、APSに存在するパラメータのタイプを記述するaps_params_typeシンタックス要素を含む。例えば、ALF_APSに等しいaps_params_typeは,APSがALFパラメータを含むことを示し、LMCS_APSに等しいaps_params_typeはLMCSパラメータを含むことを示し、最後に、SCALING_APSに等しいとき、それは、スケーリングリストパラメータの存在を示す。
第2(second)のシンタックス要素adaptation_parameter_set_idは、APSの識別子を提供する。
2種類のNALユニット、プレフィックスAPS NALユニット205およびサフィックスAPS NALユニット209が、APSをカプセル化し得る。VVC8明細書によれば、プレフィックスAPS NALユニットがPU中に存在するとき、それらは、PUの最後のVCL NALユニットに従わない。サフィックスAPS NALユニットがPU中に存在するとき、それらは、PUの最初のVCL NALユニットに先行しない。最初のVCL NALユニットと最後のVCL NALユニットとの間には、プレフィックスおよびサフィックスAPS NALユニットが任意の順序で存在し得る。たとえば、最初のサフィックスAPS NALの後に、1つのプレフィックスNALユニット、次いでVCL NALユニット、および別のサフィックスAPS NALユニットが続き得る。
SEIは、Supplemental Enhancement Informationの略である。ビットストリームは、また、SEI NALユニット(図3には図示せず)を含み得る。
ビットストリームにおける様々なパラメータセット(またはNALユニット)の出現頻度(または包含頻度)は可変である。ビットストリーム全体に対して定義されるVPSは、ビットストリーム内で1回だけ発生することができる。対照的に、スライスについて定義されるAPSは、各ピクチャ中の各スライスについて1回生じ得る。実際には、異なるスライスが同じAPSに依存する(たとえば、それを参照する)ことができ、したがって、一般的には、ピクチャのためのビットストリーム中のスライスよりも少ないAPS NALユニットが存在する。
AUD NALユニット207は、2つのアクセスユニットを分離するアクセスユニットデリミタNALユニットである。アクセスユニットは同じデコーディングタイムスタンプをもつ1つまたは複数の符号化ピクチャ(すなわち、同じタイムスタンプを有する1つまたは複数の符号化ピクチャに関係するNALユニットのグループ)を備え得るNALユニットのセットである。
PH NALユニット208は、単一の符号化ピクチャのスライスのセットに共通するパラメータをグループ化するピクチャヘッダNALユニットである。ピクチャは、ピクチャのスライスによって使用されるスケーリング行列、リシェーパモデル、およびALFパラメータを示すために、1つまたは複数のAPSを指し得る。
VCL NALユニット206の各々は、スライスのためのビデオ/画像データを含む。スライスは、ピクチャ全体またはサブピクチャ、単一のタイルもしくは複数のタイル、またはタイルの一部(部分タイル)に対応し得る。例えば、図2のスライスは、いくつかのタイル220を含む。スライスは、スライスヘッダ210と、符号化ブロック240として符号化された符号化画素/構成要素サンプルデータを含む生バイトシーケンスペイロード(RBSP)211とから構成される。スライスがピクチャ全体に対応するとき、PH NALユニット208は存在しなくてもよく、そのコンテンツはスライスヘッダ210の最初に挿入される。
スライスヘッダ210(VCL NALユニット206の一部である)およびピクチャヘッダ(PH NALユニット208の一部である)は、参照されたAPSを含むAPS NALユニットまたは各々のAPS NALユニットの識別子およびタイプを通知することによって、1つまたは複数のAPS中のパラメータを参照し得る。APSを含むNALユニットが、APSを参照するPHまたはVCL NALユニットの前であることが、VVC8明細書の要件である。
図3は、本発明の1つ以上の実施形態が実装され得るデータ通信システムを示す。データ通信システムは、データ通信ネットワーク300を介して、受信装置、この場合クライアント端末302にデータストリームのデータパケットを送信するように動作可能な送信装置、この場合サーバ301を備える。データ通信ネットワーク300は、ワイドエリアネットワーク(WAN)またはローカルエリアネットワーク(LAN)であってよい。このようなネットワークは例えば、無線ネットワーク(Wifi/802.11aまたはbまたはg)、イーサネットネットワーク、インターネットネットワーク、または幾つかの異なるネットワークから構成される混合ネットワーク、であってもよい。本発明の特定の実施形態では、データ通信システムがサーバ301が同じデータコンテンツを複数のクライアントに送信するデジタルテレビ放送システムであってもよい。
サーバ301によって提供されるデータストリーム304は、ビデオおよびオーディオデータを表すマルチメディアデータから構成され得る。オーディオおよびビデオデータストリームは、本発明のいくつかの実施形態では、それぞれマイクロフォンおよびカメラを使用してサーバ301によってキャプチャされ得る。いくつかの実施形態では、データストリームがサーバ301に格納されてもよく、または別のデータプロバイダからサーバ301によって受信されてもよく、またはサーバ301において生成されてもよい。サーバ301は特に、エンコーダへの入力として提示されるデータのよりコンパクトな表現である、伝送のための圧縮ビットストリームを提供するために、ビデオおよびオーディオストリームを符号化するためのエンコーダを提供される。
送信されたデータの品質と送信されたデータの量とのより良好な比を得るために、ビデオデータの圧縮はたとえば、HEVCフォーマットまたはH.264/AVCフォーマットまたはVVC(Versatile Video Coding)フォーマットによる。
クライアント302は、送信されたビットストリームを受信し、再構成されたビットストリームを復号して、表示装置上のビデオ画像およびラウドスピーカによるオーディオデータを再生する。
図2の例では、ストリーミングシナリオが考慮されるが、本発明のいくつかの実施形態ではエンコーダとデコーダとの間のデータ通信が例えば、光ディスクなどの媒体記憶装置を使用して実行され得ることが理解されよう。
図4は、本発明の少なくとも1つの実施形態を実施するように構成された処理装置400を概略的に示す。処理装置400は、マイクロコンピュータ、ワークステーション、またはライトポータブルデバイスなどのデバイスであってもよい。装置400は、以下に接続される通信バス413を備える。
-CPUと示されるマイクロプロセッサなどの中央処理ユニット411;
-本発明を実施するためのコンピュータプログラムを格納するための、ROMと示される読み出し専用メモリ406;
-本発明の実施形態の方法の実行可能コード、ならびに本発明の実施形態によるデジタル画像のシーケンスを符号化する方法および/またはビットストリームを復号する方法を実施するために必要な変数およびパラメータを記録するように適合されたレジスタを格納するための、RAMと示されるランダムアクセスメモリ412;
-処理対象のデジタルデータが送受信される通信ネットワーク403に接続された通信インターフェース402
任意選択的に、装置400は、以下の構成要素も含むことができる。
-本発明の1つまたは複数の実施形態の方法を実施するためのコンピュータプログラム、および本発明の1つまたは複数の実施形態の実施中に使用または生成されるデータを格納するための、ハードディスクなどのデータ記憶手段404;
-ディスク406のためのディスクドライブ405であって、ディスクドライブは、ディスク406からデータを読み取るか、または前記ディスクにデータを書き込むように適合される;
-キーボード410または任意の他のポインティング手段の手段によって、ユーザとのグラフィカルインターフェースとしての役割を果たす、および/またはデータを表示するための画面409
装置400は例えば、デジタルカメラ420またはマイクロフォン408などの様々な周辺機器に接続することができ、それぞれが、装置400にマルチメディアデータを供給するように入出力カード(図示せず)に接続される。
通信バスは、装置400に含まれるかまたはそれに接続される様々な要素間の通信および相互運用性を提供する。バスの表現は限定的ではなく、特に、中央処理ユニットは装置400の任意の要素に直接的に、または装置400の別の要素の手段によって命令を通信するように動作可能である。
ディスク406は例えば、コンパクトディスク(CD-ROM)、書き換え可能または書き換え不可能、ZIPディスクまたはメモリカードなどの任意の情報媒体に置き換えることができ、一般的には、マイクロコンピュータまたはマイクロプロセッサによって読み取ることができる情報記憶手段によって置き換えることができ、装置に組み込まれるもしくは組み込まれず、場合によっては、リムーバブルであって且つ1つまたは複数のプログラムを格納するように適合され、その実行により、一連のディジタル画像を符号化する方法および/または本発明のビットストリームを復号する方法を実行可能にする。
実行可能コードは、読み出し専用メモリ406、ハードディスク404、または前述のような例えばディスク406などのリムーバブルデジタル媒体のいずれかに格納され得る。変形例によれば、プログラムの実行可能コードは、ハードディスク404などの実行される以前に装置400の格納手段の1つに格納されるために、インターフェース402を介して、通信ネットワーク403の手段によって受信され得る。
中央処理ユニット411は、上述の格納手段のうちの1つに格納された命令で、本発明によるプログラムまたはプログラム群の命令またはソフトウェアコードの一部の実行を制御し、指示するように適合される。電源投入時に、不揮発性メモリ、例えばハードディスク404または読み出し専用メモリ406に格納されたプログラムまたはプログラム群は、ランダムアクセスメモリ412に転送され、このランダムアクセスメモリはプログラムまたはプログラム群の実行可能コード、ならびに本発明を実施するために必要な変数およびパラメータを格納するためのレジスタを含む。
この実施形態では、装置が本発明を実施するためにソフトウェアを使用するプログラマブル装置である。しかし、代替的には、本発明はハードウェア(例えば、特定用途向け集積回路またはASICの形態で)で実現されてもよい。
図5は、本発明の少なくとも1つの実施形態によるエンコーダのブロック図を示す。エンコーダは、接続されたモジュールによって表され、各モジュールは例えば、装置400のCPU411によって実行されるプログラム命令の形態で実装されるように適合され、方法の少なくとも1つの対応するステップは、本発明の1つまたは複数の実施形態による、一連の画像の画像を符号化する少なくとも1つの実施形態を実装する。
デジタル画像i0~in501のオリジナルのシーケンスは、エンコーダ500によって入力として受信される。各デジタル画像は、ピクセルとも呼ばれることもあるサンプルのセットによって表される。
ビットストリーム510は、符号化プロセスの実施後にエンコーダ500によって出力される。ビットストリーム510は、スライスなどの複数の画像部分または複数の符号化ユニットのデータを含み、各スライスは、スライスを符号化するために使用される符号化パラメータの符号化値を送信するためのスライスヘッダを含み、スライス本体は符号化ビデオデータを含む。
入力デジタル画像i0~in501は、モジュール502によって画素のブロックに分割される。ブロックは画像部分に対応し、可変サイズであり得る(たとえば、4x4、8x8、16x16、32x32、64x64、128x128ピクセル、およびいくつかの矩形ブロックサイズも考慮され得る)。入力ブロックごとに符号化モードが選択される。符号化モードの2つのファミリ、すなわち空間予測符号化に基づく符号化モード(イントラ予測)と、時間予測に基づく符号化モード(インター符号化、マージ、SKIP)が提供される。可能な符号化モードがテストされる。
モジュール503は、符号化される所与のブロックが符号化される前記ブロックの近隣の画素から計算された予測子によって予測されるイントラ予測プロセスを実施する。イントラ符号化が選択された場合、選択されたイントラ予測子および所与のブロックとその予測子との間の差分の指示は、残差を提供するために符号化される。
時間予測は、動き推定モジュール504および動き補償モジュール505によって実施される。まず、参照画像のセット516の中から参照画像を選択し、符号化する所与のブロックに最も近い領域(画素値類似度で最も近い)である、参照領域または画像部分とも呼ばれる参照画像の部分を、動き推定モジュール504で選択する。次いで、動き補償モジュール505は、選択された領域を使用して符号化されるブロックを予測する。選択された参照領域と残差ブロックとも呼ばれる所与のブロックとの間の差分は、動き補償モジュール505によって計算される。選択された参照領域は、動き情報(例えば、動きベクトル)によって示される。
したがって、両方の場合(空間予測および時間予測)において、残差は、オリジナルのブロックから予測を減算することによって計算される。SKIPモードは例外である。この場合、いかなる残差も無視される。
モジュール503によって実施されるINTRA予測では、予測方向が符号化される。時間予測では、少なくとも1つの動きベクトルが符号化される。モジュール504、505、516、518、517によって実施されるインター予測では、そのような動きベクトルを識別するための少なくとも1つの動きベクトルまたは情報(データ)が時間予測のために符号化される。
インター予測が選択される場合、動きベクトルおよび残差ブロックに関する情報が符号化される。ビットレートをさらに低減するために、動きが均一であると仮定すると、動きベクトルは、動きベクトル予測子に対する差分によって符号化される。動き情報予測子のセットの動きベクトル予測子は、動きベクトル予測符号化モジュール517によって動きベクトルフィールド518から取得される。
エンコーダ500は、レート歪み基準などの符号化コスト基準を適用することによって符号化モードを選択するための選択モジュール506をさらに備える。冗長性をさらに低減するために、変換モジュール507によって変換(DCTなど)が残差ブロックに適用され、次いで、得られた変換されたデータが量子化モジュール508によって量子化され、エントロピー符号化モジュール509によってエントロピー符号化される。最後に、SKIPモードを除いて、符号化されている現在のブロックの符号化された残差ブロックがビットストリーム510に挿入される。
エンコーダ500はまた、後続の画像の動き推定のための参照画像を生成するために、符号化された画像の復号を実行する。参照画像のセット516がメモリに格納される。これは、エンコーダと、ビットストリームを受信するデコーダと、が同じ参照フレームを有することを可能にする。逆量子化モジュール511は、量子化されたデータの逆量子化(逆量子化)を実行し、その後、逆変換モジュール512によって逆変換を実行する。逆イントラ予測モジュール513は、予測情報を使用して、所与のブロックのためにどの予測子を使用すべきかを決定し、逆動き補償モジュール514は、モジュール512によって取得された残差を、参照画像のセット516から取得された参照領域に実際に加算する。
次いで、後フィルタリングは画素の再構成されたフレーム(画像または画像部分)をフィルタリングするために、モジュール515によって適用される。結果として得られるフィルタリングされ再構成されたフレームは、セット516内に別の参照画像として追加される。
図6は、本発明の一実施形態による、エンコーダからデータを受信するために使用され得るデコーダ600のブロック図を示す。デコーダは、接続されたモジュールによって表され、各モジュールは例えば、デバイス400のCPU411によって実行されるプログラム命令の形で、デコーダ600によって実施される方法の対応するステップを実施するように適合される。
デコーダ600は、符号化ユニット(たとえば、画像オプション、ブロック、またはコーディングユニットCUに対応するデータ)を含むビットストリーム601を受信し、各符号化ユニットは、符号化パラメータに関する情報を含むヘッダと、符号化ビデオデータを含む本体と、から構成される。VVCにおけるビットストリームの例示的な構造は、図2を参照して上述された。図5に関して説明されたように、符号化ビデオデータはエントロピー符号化され、動きベクトル予測子のインデックスは、所定のビット数で、所与の画像部分(例えば、ブロックまたはCU)について符号化される。受信された符号化ビデオデータは、モジュール602によってエントロピー復号される。残差データは、次いで、モジュール603によって逆量子化され、次いで、逆変換がピクセル値を取得するためにモジュール604によって適用される。
符号化モードを示すモードデータもエントロピー復号され、そのモードに基づいて、画像データの符号化ブロック(ユニット/セット/グループ)に対してINTRAタイプ復号またはインタータイプ復号が行われる。
INTRAモードの場合、INTRA予測子は、ビットストリームにおいて指定されたイントラ予測モードに基づいて、イントラ逆予測モジュール605によって決定される。
モードがインターである場合、エンコーダによって使用される参照領域を見つける(識別する)ために、動き予測情報がビットストリームから抽出される。動き予測情報は、参照フレームインデックスと動きベクトル残差とから構成される。動きベクトル予測子は、動きベクトルを得るために、動きベクトル復号モジュール610によって動きベクトル残差に加算される。
動きベクトル復号モジュール610は、動き予測によって符号化された画像部分(たとえば、現在のブロックまたはCU)ごとに動きベクトル復号を適用する。現在のブロックCUの動きベクトル予測子のインデックスが取得されると、画像部分(たとえば、現在のブロックまたはCU)に関連付けられた動きベクトルの実際の値が復号され、モジュール606によって逆動き補償を適用するために使用され得る。復号された動きベクトルによって示される参照画像部分は、モジュール606が動き補償を実行できるように、参照画像/ピクチャのセット608内の参照画像から抽出される。動きベクトルフィールドデータ611は、後続の復号された動きベクトルの逆予測に使用されるために、復号された動きベクトルで更新される。
最後に、復号されたブロックが得られる。適切な場合、ポストフィルタリングは、ポストフィルタリングモジュール607によって適用される。復号されたビデオ信号609は、最終的にデコーダ600によって提供される。
図7は、本発明の一実施形態による、ビデオのピクチャをビットストリームに符号化するためにエンコーダ500によって実行される符号化方法の一部を示す。処理ループ701は、符号化される各ピクチャにステップ702~705を連続的に適用する。ピクチャの符号化は、典型的にはスライスである部分へのピクチャサンプルの圧縮によって開始される。ステップ702において、ピクチャは1つ以上のスライスに分割され、スライスは連続的に圧縮される。スライスを圧縮することは、スライスをコーディングユニットに分割することを伴い、各コーディングユニットはたとえば、INTRA予測またはINTER予測を使用して符号化される。ステップ703では、適応ループフィルタ(ALF)またはLMCSフィルタなどのループフィルタを構成するパラメータのセットが決定される。別の例では、残差の量子化のためのスケーリングパラメータが決定される。これらのパラメータは、通常、APSにおいて符号化される。
各APSは、APSタイプ(例えば、ALF_APS、LMCS_APSまたはSCALING_APS)およびAPS識別子を有する。ステップ704において、APSタイプは、APSコンテナの内容に従って設定される。エンコーダは、APSタイプごとに使用中の識別子のリストを維持する。これらのリストの各々は、関連するAPSタイプのAPSパラメータがステップ703において決定されたAPSのAPS識別子を含む。処理ループ701の最初の反復の前に、各リストは空の状態で初期化される。
所与のタイプのAPSについて、ステップ704は、以前に決定されたAPSおよびそれらの識別子値に基づいて、現在のAPSに関連付けるための識別子値を決定する。
例えば、APSのタイプごとに以下が適用される。現在のAPSのAPSコンテンツ(APSパラメータ)が、同じタイプのAPSの以前の識別子のリストに存在する既存の識別子を有する以前のAPSと同じであるかどうかが決定される。そうである場合、既存の識別子は、現在のAPSに関連付けられる。
そわない場合、リスト内に存在する既存の識別子を有するすべてのAPSは、現在のAPSとは異なるコンテンツを有するので、新しい識別子が現在のAPSに関連付けられ、次いでリスト内に挿入されなければならない。任意の所与の時間に利用可能な有限数の可能な識別子値があり、すべての可能な識別された値がすでに使用されている場合、リスト内の既存のAPS識別子が決定され、現在のAPSがリスト内で置き換えられる。たとえば、決定されたAPSは、使用頻度が最も低いAPS、または代替的に最も古いAPSであり得る。
ステップ705において、エンコーダはそのとき、符号化されたデータを含むNALユニットを生成する。特に、それは、APS、スライスNALユニット、および任意選択でピクチャヘッダNALユニットを含むNALユニットを生成する。
APS NALユニットは、APSのタイプおよび識別子を通知する。たとえば、APSのシンタックス要素は、以下のものであり得る。
Figure 0007490068000001
adaptation_parameter_set_idシンタックス要素は、APSの識別子値であり、aps_params_typeは、APSのタイプである。APSタイプALFパラメータalf_data()に応じて、LMCSパラメータlmcs_data())またはスケーリングリストデータscaling_list_data()を提供できる。
所与のピクチャユニットにおいて、エンコーダは、APSが最初のVCL NALユニットの前に存在するときにプレフィックスAPS NALユニットを使用しなければならず、APSがPUの最後のVCLに続くときにサフィックスNALユニットを使用しなければならない。最初のVCL NALユニットと最後のVCL NALユニットとの間で、エンコーダは、プレフィックスまたはサフィックスAPS NALユニットのいずれかを使用することができる(本発明のいくつかの実施形態において別段に述べられていない限り)。
スライスNALユニットのヘッダまたはピクチャヘッダは、APSのタイプおよび識別子を参照することによって、それらのAPS NALユニットを参照し得る。しかしながら、スライスNALユニットのヘッダまたはピクチャヘッダは、APS識別子のための所定のセマンティクスを有するシンタックス要素を有し、APSタイプごとに、APS識別子のセマンティクスが異なるので、APSタイプはセマンティクスにおいて暗黙的であり、デコーダによって推論され得る。
エンコーダは、ピクチャヘッダがループフィルタパラメータのための特定のAPSを参照することを通知する。たとえば、VVC8において現在企図されている実施形態では、ピクチャヘッダが以下のシンタックス要素を含む。
Figure 0007490068000002
この考えられる実装におけるピクチャヘッダは、PUのスライスに対してALFフィルタリングを適用するためのいくつかのALF APS識別子を含む。これらの識別子は例えばph_alf_aps_id_luma[i]シンタックス要素で指定され、iは0~ph_num_alf_aps_ids_lumaの範囲にある。ph_num_alf_aps_ids_lumaは,ルマ成分のALFフィルタリングのためにピクチャヘッダに通知されるAPS識別子の数を指定する。さらに、ph_alf_aps_id_chroma、ph_cc_alf_cb_aps_id、およびph_cc_alf_cr_aps_idシンタックス要素は、クロマ成分のためのALF APS識別子を指定する。
この考えられる実装におけるピクチャヘッダはまた、現在のPUに適用されるLMCSパラメータを含むLMCS_APSタイプ(すなわち、aps_params_type)をもつAPSの識別子を示すph_lmcs_aps_idシンタックス要素を含む。
同様に、ピクチャヘッダは、現在のPUのために使用されるスケーリングリストデータを定義するSCALING_APSに等しいaps_params_typeを有するAPSの識別子を指定するph_scaling_list_aps_idを含む。
本発明の実施形態では、すべての異なるAPSタイプが使用される必要はなく、APSタイプのうちの1つまたは2つのみを用いて代替の実装が想定され得る。また、特定のAPSタイプが何であるかは関係ない。ALF以外のフィルタのためのパラメータが例えば、考え得る。また、パラメータはフィルタリングパラメータに限定されない。
使用中のAPSがPUのそれぞれのスライスについて、またはPUの2つ以上のスライスについて異なるとき、APS識別子は、ピクチャヘッダ中の1つまたは複数のスライスについて通知され得る。代替的に、APS識別子は、ピクチャヘッダNALユニット内の代わりに(またはオーバーライド値として)、スライスヘッダで通知され得る。たとえば、VVC8において考えられる1つの実装では、スライスヘッダが以下のシンタックス要素を含み得る。
Figure 0007490068000003
スライスヘッダはたとえば、ルマ成分のためにスライスによって使用されるi番目のALF APS識別子であるslice_alf_aps_id_luma[i]を定義し得る。ピクチャヘッダに関して、slice_alf_aps_id_chroma、slice_cc_alf_cb_aps_id、およびslice_cc_alf_cr_aps_idは、クロマ成分のためのALF APSの識別子を示し得る。
図8は、本発明の一実施形態による符号化ビデオシーケンスの一般的な復号プロセスを示す。符号化ビデオシーケンスを構成するNALユニットの復号プロセスは、ループ801を使用して、符号化ビデオシーケンスのピクチャユニットのNALユニットを連続的に処理することを伴う。各NALユニットについて、ステップ802において、デコーダは、NALユニットヘッダを構文解析することによって、NALユニットのタイプを決定する。例えば、VVCでは、NALユニットヘッダが2バイト長であり、以下の順序で5つのシンタックス要素を含む。
Figure 0007490068000004
最初のforbidden_zero_bitは、通常0に等しくなければならないビットである。1に等しいとき、NALユニットの内容は指定されず、適合デコーダによって無視されるべきである。そして、nuh_reserved_zero_bitは、0に等しいビットである。nuh_layer_idは6ビットで表される整数値である。それは、符号化ビデオシーケンス中のレイヤの識別子を指定する。このシンタックス要素の後には、5ビットで符号化された整数であり、NALユニットのタイプを表すnal_unit_typeが続く。異なるタイプのNALユニットごとに一意の値が割り当てられる。たとえば、プレフィックスAPS NALユニットの場合、nal_unit_typeは17に等しくなり得、サフィックスAPS NALユニットの場合、nal_unit_typeは18に等しくなり得る。最後に、2バイトのNALユニットヘッダの最後の3ビットは、nuh_temporal_id_plus1シンタックス要素をコーディングする。それは、NALユニットの時間レベルを示す。
次いで、復号プロセスは、ステップ803において、NALユニットのタイプに応じたNALユニットデータの復号を継続する。
特に、ここで図9を参照すると、ステップ901において、NALユニットがAPSを含むかどうかがチェックされる。そのような場合、プレフィックスおよびサフィックスAPS NALユニット(VVC8について17または18に等しいnal_unit_type)は以下のように復号される:最初に、デコーダは、ステップ902においてAPSのタイプ(APSのaps_params_typeシンタックス要素において指定される)と、ステップ903においてAPS NALユニットの識別子(adaptation_parameter_set_idシンタックス要素)とを構文解析する。
ステップ904において、デコーダは、NALユニットに含まれるAPSデータをメモリに格納する。APSデータは、ステップ902および903で構文解析されたタイプおよび識別子に対応する値のペアに関連付けられる。さらに、デコーダは、現在のAPSがサフィックスまたはプレフィックスNALユニットとして提供されるかどうかを指定するブール値を、格納されたAPSデータに関連付けることもできる。
さらに、デコーダは、他のNALユニットに対する現在のAPS NALユニットの位置を表す位置データを格納することができる。例えば、現在のAPS NALユニットの位置は、符号化ビデオシーケンスの最初からのNALユニットのインデックスと、それが属するPUのインデックスと、の組合せによって表され得る。この情報は、スライスまたはピクチャヘッダNALユニットがAPSタイプとAPS識別子値とのペアを有するAPSを参照するときに使用するAPSデータをデコーダが決定することを可能にする。
APSデータが格納されるメモリの部分は、APSバッファと呼ばれることがある。
VCL (すなわち、スライスヘッダを含む)およびピクチャヘッダ(PH)NALユニットの復号プロセスを図10に示す。
ステップ1001において、デコーダは、NALユニットタイプがVCLまたはPH NALユニットに対応するかどうかを最初にチェックする。VVC8の場合、それは、0から12までの範囲内のnal_unit_typeに対応し、またはピクチャヘッダの場合、19に等しい。NALユニットがVCL/PH NALユニットであることが検証されると、デコーダは、ステップ1002~1006を適用する。ステップ1002において、NALユニットに含まれるスライスまたはピクチャヘッダが構文解析されて、APSへの参照が決定される。APSタイプごとに、デコーダは、APS識別子を使用して参照のリストを維持する。
先ず、NALユニットがピクチャヘッダを含むとき、APSへの参照は、PUのすべてのスライスに適用され得る。ピクチャヘッダに存在するAPS識別子およびAPSタイプが抽出され、APSタイプごとに、ステップ1003において、関連するAPSタイプのAPSへの参照のリストが更新される。
ステップ1003は、存在する場合、以下のシンタックス要素の値を構文解析することを伴う。
- ph_lmcs_aps_idシンタックス要素 APSタイプLMCS_APSのAPSのAPS識別子を示す。存在しない場合、LMCSフィルタリングは適用されず、このAPSタイプのAPSへの参照のリストに何も挿入されない。それ以外の場合、構文解析された値は、LMCS_APSタイプに関連付けられたリストに追加される。
- ph_scaling_list_aps_idシンタックス要素 SCALING_APSに等しいタイプのAPSの識別子を指定する。存在しない場合、スケーリングリストはデフォルト値を使用することができ、このAPSタイプのAPSへの参照のリストは変更されない。それ以外の場合、デコーダは、構文解析された値をSCALING_APSタイプに関連付けられたリストに追加する。
- iが0からph_num_alf_aps_ids_lumaおよび/またはph_cc_alf_cb_aps_idおよび/またはph_cc_alf_cr_aps_idおよび/またはph_alf_aps_id_chromaシンタックス要素の範囲内にあるph_alf_aps_id_luma[i]。これらのシンタックス要素は、ALF_APSに等しいタイプを有するAPSの識別子を示す。構成要素について存在しない場合、それは、ALFが関連する構成要素に適用されないこと、またはそれがデフォルト値を使用することを示し得る。このAPSタイプのリストは変更されずに維持される。それ以外の場合、構文解析された値のそれぞれが、ALF_APSタイプに関連付けられたリストに追加される。
NALユニットがVCL NALユニット(nal_unit_typeがVVC8では0~12の範囲内)の場合、それはスライスヘッダを含む。このスライスヘッダは、ステップ1002においてスライスヘッダを構文解析することによって見つけられたAPSへの参照を含み得る。たとえば、スライスヘッダのslice_alf_aps_id_luma[i]、slice_alf_aps_id_chroma、slice_cc_alf_cb_aps_id、およびslice_cc_alf_cr_aps_idシンタックス要素は、VVC8中のALF APSへの参照を示す。スライスヘッダ内に存在する場合、デコーダは、ステップ1003において、構文解析された識別子値を、ALF_APSタイプに関連する参照APSのリスト内に格納する。
次いで、ステップ1004で、デコーダは、ステップ904で埋められたAPSバッファから、ステップ1003で決定されたAPS参照のリストに存在するタイプおよび識別子を有するAPSを取り出す。これらのAPSは、現在のPUのVCL NALユニットの復号のために使用中とマークされる。任意選択で、ステップ1005において、デコーダは、ピクチャヘッダまたはスライスヘッダに含まれるAPSへの参照が有効であることを確認する。例えば、ステップ1003において参照のリストを更新した後、APSバッファ内に存在しないAPSへの参照をリストが含む場合、APSバッファ内に同じAPSタイプおよびAPS識別子を有するAPSが存在しないという意味で、デコーダはエラーを返すことができ、デコーダはスライスまたはPUの復号を停止することができる。実際、1つのピクチャユニットのスライスまたはピクチャヘッダを復号するために必要なすべてのAPSは、APSへの参照を行うNALユニットの前に提供されなければならない。
ステップ1006において、NALユニットが復号される。PH NALユニットの場合、ピクチャヘッダの復号は主に、NALユニットにおいて提供されるパラメータを構文解析することからなる。それらは、PHが属するPUのVCL NALユニットの復号のためにメモリに格納される。VCL NALユニットの復号は、符号化ユニットを復号することを伴う。デコーダは典型的には、ピクチャヘッダNALユニット(および他の非VCL NALユニットも)中で構文解析されたパラメータを使用して、ピクセル値を復号する。特に、それは、APSバッファ内のAPSにアクセスするために、ステップ1003において更新されたAPSへの参照のリストを使用し、次いで、参照されたAPSのAPSパラメータを使用して、LMCS、スケーリング変換、およびALFフィルタリングを適用する。
ステップ802において図8に戻ると、デコーダは、APS、PH、およびVCL NALユニット以外の他のNALユニットタイプ、たとえばパラメータセットNALユニットおよびSEIメッセージを決定することができる。その場合、ステップ803におけるNALユニットの復号は、NALユニット内に存在するパラメータを構文解析することと、それらを参照し得るVCL NALユニットの復号のためにそれらをメモリに格納することと、を伴う。
第1の実施形態群
上述の提案されたVVC8シンタックス構造は、実際にはいくつかの問題をもたらし得る。例えば、使用中のAPSを格納するために必要なAPSバッファのサイズは過剰であり得る。また、APSを管理するために必要な処理量も過剰になることがある。これらの問題は、図11Aを参照して以下に説明される。
図11Aは、VVC8に準拠する例示的なビットストリームを示す。VVC8に準拠するためには、所与のピクチャユニットにおいてそれが必要である。
(a) APSが関連するピクチャユニットの最初のVCL NALの前にピクチャユニット内に存在する場合、APSは、プレフィックスAPS NALユニット内に含まれなければならない。
(b) APSが関連するピクチャユニットの最後のVCL NALの後にピクチャユニット内に存在する場合、APSは、サフィックスAPS NALユニット内に含まれなければならない。
一方、PUの最初のVCL NALユニットと最後のVCL NALユニットとの間で、エンコーダは、プレフィックスまたはサフィックスAPS NALユニットのいずれかを使用し得る。
さらなる制約がある。
(c) 特定のVCL NALユニットに関連付けられたプレフィックスまたはサフィックスAPS NALユニットは、特定のVCL NALユニットによる使用のためではなく、復号順序においてプレフィックスまたはサフィックスAPS NALユニットに続くVCL NALユニットによる使用のためのものである。
VVC8は以下のように、VCLと非VCL NALユニットとの間の関連付けを定義する。
(1) 関連する非VCL NALユニット:VCL NALユニットが非VCL NALユニットの関連するVCL NALユニットであるVCL NALユニットのための非VCL NALユニット(存在する場合)。
(2) 関連するVCL NALユニット:EOS_NUT、EOB_NUT、SUFFIX_APS_NUT、SUFFIX_SEI_NUT、FD_NUT、RSV_NVCL_27に等しい、またはUNSPEC_30、、UNSPEC_31の範囲内、のnal_unit_typeを有する非VCL NALユニットの、復号順序における先行するVCL NALユニット、または、そうでなければ、復号順序における次のVCL NALユニット。
これらの定義の効果は、サフィックスNALユニットに関連付けられたVCL NALユニットが復号順序において関連するサフィックスAPS NALユニットに先行するVCL NALユニットであり、プレフィックスNALユニットに関連付けられたVCL NALユニットが復号順序において関連するサフィックスAPS NALユニットに後続するVCL NALユニットであることである。
図11Aの準拠ビットストリームは、3つのピクチャユニットPU-01、PU-02、およびPU-03のNALユニットを有する。
最初のピクチャユニットPU-01は、プレフィックスAPS NALユニットであるNALユニットNAL-01が後続するPH NALユニットを有する。このプレフィックスAPS NALユニットは、0に等しい識別子をもつ第1のAPSタイプ(たとえば、ALFタイプ)のAPSを与える。図11Aにおいて、第1のAPSタイプは、水平ハッチングによって示される。PU-01において、単一スライスNALユニットNAL-02は、プレフィックスAPS NALユニットNAL-01に続く。このスライスは、APS識別子が0(たとえば、slice_alf_aps_luma[0]が0に等しい)であるAPSを参照する。
2番目のピクチャユニットPU-02では、最初のNALユニットNAL-03が0に等しいが異なるタイプを有する(たとえば、それはLCMSパラメータを含む)識別子も有するプレフィックスNALユニットである。この第2のAPSタイプ(例えば、LMCSタイプ)は、垂直ハッチングによって示される。次いで、ピクチャヘッダ(PH)NALユニットNAL-04は、0に等しいph_lmcs_aps_idを示すことによって、LMCSパラメータのためのこのAPSを参照する。後続のスライスNALユニットNAL-05は、前のピクチャユニットPU-01のNALユニットNAL-01において提供された、識別子が0に等しいALF APSを参照する。なお、スライスNALユニットNAL-05は、復号順序においてそれに先行するため、サフィックスAPS NALユニットNAL-06に関連付けられている。それは、制約(c)のもとでは、VCL NALユニットNAL-05がサフィックスAPS NALユニットNAL-06のAPSを使用することができなかった。
ピクチャユニットPU-02は、識別子が0に等しいALF APSを含むサフィックスAPS NALユニットNAL-06も含む。このAPSは、NALユニットNAL-01のAPSと同じタイプ(ALF、水平ハッチング)および同じ識別子(0)を有する。したがって、エンコーダは、ALFタイプおよび識別子0のAPSを、NALユニットNAL-06のAPSに更新する。スライスNALユニットNAL-07は、識別子が0に等しいALF APSを参照し、したがって、NAL-06のALF APSを参照する。これは、NAL-07が復号順序においてNAL-06に後続するので、制約(c)と一致する。したがって、NAL-07は、APS NALユニットNAL-06に関連付けられたVCL NALユニットではない。
この例示的なビットストリームでは、PU-02のスライスNAL-05およびNAL-07が同じ識別子値を使用する2つの異なるALF APSをそれぞれ参照するが、ビットストリーム中のAPS NALユニットの順序は、関連する2つのスライスのために使用されるALF APSパラメータが異なる(または異なることが許可され、エンコーダがNAL-01およびNAL-06の内容を同一にすることを排除することはない)ことを暗示する。結果として、図11Aのビットストリームを復号するために、デコーダは、APS識別子とAPSタイプの値の所与のペアについてAPSの2つのバージョンをメモリに(図9のステップ904において)格納しなければならない。最悪の場合の例では、デコーダが、ピクチャユニットを復号するために必要とされるAPSを格納するために、(各APSの2つのバージョンを維持するために)メモリサイズを2倍にしなければならないことがある。さらに、デコーダは、どのVCL NALユニットがAPS NALユニットの第1のバージョンまたは第2のバージョンを参照するかを決定するために、APS NALユニットに対するVCL NALユニットの順序を維持しなければならない。
これらの問題を解決するために、実施形態の第1のグループは、PUのスライスがAPSの単一のバージョンを参照することを保証するために、シンタックス構造にさらなる制約を課す。
なお、VVC8では、ALFパラメータ(LMCSパラメータやスケーリングリストではない)のみが、同じピクチャユニット内でスライス毎に変化することが許可される。しかしながら、VVCの将来のバージョンは一般にAPSパラメータを変更することを可能にし得、以下の実施形態は、PUのスライスのためのALF APSパラメータの2つ以上のバージョンの問題を解決することに限定されない。
第1実施形態
第1の実施形態では、(VVC8制約に加えて)ビットストリーム符号化のさらなる制約が
(d1) プレフィックスAPS NALユニットがPUのVCL NALユニット(すなわち、ピクチャユニットの最初のスライスNALユニット)の前でなければならない
ことである。
言い換えれば、VVC8の自由度は、PUの最初のVCL NALユニットと最後のVCL NALユニットとの間で、エンコーダがプレフィックスAPS NALユニットを使用しないように制約される。その結果、それは、最初のVCL NALユニットの後の前のピクチャユニットにおいて送信されたAPSの更新を防止する。更新は、最初のVCL NALユニットの前に行われ、したがって、最初のVCL NALユニット(またはピクチャユニットの任意の後続のVCL NALユニット)は、現在のピクチャユニットにおいて更新されたAPSの前のバージョンを参照することができない。
デコーダは、ステップ1005において、ビットストリームの制約が有効であることをチェックする。そわない場合、デコーダは、復号プロセスを中止することができる。
エンコーダは、ステップ705において、ビットストリーム制約が有効であるようにNALユニットを生成する。たとえば、エンコーダは、各PU中の最初のVCL NALユニットの前にのみプレフィックスNALユニットを生成する。
第2の実施形態
第2の実施形態では、それは(VVC8制約に加えて)ビットストリーム符号化のさらなる制約が
(d2) サフィックスAPS NALユニットは、(最後の)VCL NALユニットの後にある
ことである。
第1の実施形態で課されたプレフィックスNALユニットに対する制約(d1)と同様に、最後のVCL NALユニットの前の前のPUで送信されたAPSの更新を防止する。サフィックス中のAPSは、前のPU中で送信されたAPSを更新することができない。例えば、図11Aのビットストリームは、サフィックスAPS NAL-06がピクチャユニットPU-02の最後のVCL NALユニットNAL-07の前に送信されるので、適合していない。したがって、デコーダは、ステップ1005において、ビットストリームが適合しておらず、問題を通知するために復号警告またはエラーを返すことができると考えることができる。
第3の実施形態
もちろん、第1および第2の実施形態のさらなる制約(d1)および(d2)は、両方とも組み合わせて課されてもよい。
図11Bは、本発明の第2または第3の実施形態に係るエンコーダで生成されるビットストリームの一例である。この例では、ピクチャユニットPU-01、PU-02、およびPU-03は、図11Aのピクチャユニットに相当する。主な違いは、エンコーダが(ステップ704において)PU-02内のAPS NALユニットNAL-07の順序を制約することである:図11AのピクチャユニットPU-02のサフィックスAPS NAL-06の均等物が、図11BのピクチャユニットPU-02内の最後のVCL NALユニット(現在はNAL-06)の後にNAL-07として送信される。2つのNALユニットNAL-05およびNAL-06中のスライスは、識別子0およびタイプがALFに等しいALF APS:現在のPUの開始時または前のPU中で送信されたプレフィックスAPS中で送信されたAPS、または前のPU中でのみ送信されたサフィックスAPS中で送信されたAPSを参照する。
復号904は、PUのすべてのスライスを復号するために単一バージョンのAPSが必要とされるので、メモリ消費に関してより効果的である。
さらに、これらのAPSは、APSバッファの更新プロセスを簡略化する、前のPU中または現在のPUの開始時のいずれかに提供される。PUの最初のVCL NALユニットを復号することは、APSバッファ状態が復号の準備ができていることの確認であり、これはVVC8準拠のビットストリームの場合ではない。さらに、所与の識別子およびタイプを有するAPSの適切なバージョンを選択しなければならないステップ1004は、本発明がPUのすべてのスライスがAPSの一意のバージョンを使用することを保証するので、簡略化される。
図11Bは、第2/第3の実施形態の例を示すが、第1の実施形態では同じまたは対応する利点が達成されることが理解されるのであろう。第1および第2の実施形態の制約(d1)および(d2)が組み合わせて使用される場合、最良の利点が達成される。
第2の実施形態群
VVC8シンタックス構造から生じる別の問題は、以下で説明される第2の実施形態のグループによって対処される。
VVC8におけるAPSは、ビットストリームの1つまたは複数のスライスのためのパラメータを再利用することを可能にする。これらの1つまたは複数のスライスは、異なるピクチャユニットに属し得る。例えば、図12Aのビットストリームは、3つのピクチャユニットPU-01、PU-02、およびPU-03を有する。PU-01は、2つのプレフィックスAPS NALユニットNAL-02およびNAL-06と、2つのサフィックスAPS NALユニットNAL-04およびNAL-08とを含む。この例では、それらは、ピクチャユニットPU-01のVCL NALユニットNAL-03、NAL-05、およびNAL-08とインターリーブされる。NAL-02、NAL-04、およびNAL-06のAPSは、異なるAPSタイプ、たとえば、それぞれALF、スケーリングリスト、およびLMCSであるが、同じ識別子0を有する。NAL-08のAPSは、NAL-02のAPSと同様にALFタイプであり、識別子1を有する。
ピクチャユニットPU-02は、2つのスライスNALユニットNAL-09およびNAL-10を含む。エンコーダは、ステップ703において、PU-01のAPSが次のPU PU-02に対して有効であると判定する。スライスNAL-09はたとえば、NAL-06を参照し、スライスNAL-10からNAL-08を参照し得る。PU PU-02を符号化している間、エンコーダは、0に等しい識別子を有するタイプLMCSのAPSがスライスNAL-10のコンテンツに基づいて更新を必要とすると決定する。この理由から、それは、識別子0を有するタイプLMCSのAPSのための新しいパラメータを生成した。サフィックスAPS NALユニットNAL-11は、NALユニットNAL-11が最後のVCL NALユニットNAL-10の後にあるので(プレフィックスAPS NALユニットが、PUの最後のVCL NALユニットに続くことができないという上の制約(a)に従って)、
このAPSを含む。
アプリケーションがピクチャユニットPU-02において復号を開始するためにビットストリームへのランダムアクセスを実行するとき(PU-02がランダムアクセスポイントであると仮定すると)、アプリケーションは、PU PU-02のスライスNALユニットの前にNALユニットNAL-06およびNAL-08を提供しなければならない。その結果、図12Bに示すように、NALユニットNAL-09の前のPU PU-02の先頭にNAL-06およびNAL-08が挿入される。図12Bに示されるこの結果として生じるビットストリームは、VVC8の2つの制約を破る。それは、復号のステップ1005をエラー状態にする。
最初に、NAL-08は、PUの最初のVCL NALユニットの前のサフィックスAPS NALユニットであり、上記の制約(a)に従って、APSがPUの最初のVCL NALの前に送信される場合、エンコーダはプレフィックスAPS NALユニットを使用しなければならない。図12Bの例では、サフィックスNALユニットNAL-08がVVCに適合しないPU PU-02の最初のVCL NALユニットの前に挿入される。
第2に、PU-02は同じ識別子(0)およびタイプ(LMCS)を有するが、VVC8では許可されていない異なるコンテンツを有するAPSを含む、サフィックスおよびプレフィックスAPS NALユニットNAL-11およびNAL-06を有する。
したがって、アプリケーションは、図12Cに示すように、プレフィックスAPS NALユニットNAL-08のタイプ(nal_unit_type)を書き換えて、新しいプレフィックスAPS NALユニットNAL-23(nal_unit_typeは18に設定される)を生成しなければならない。さらに、アプリケーションはPU PU-03の最初に、新しいプレフィックスAPS NALユニットNAL-24として、図12BのサフィックスAPS NALユニットNAL-11を移動し、書き換えなければならない。このPU-03 PUもまた、NAL-24と同じ識別子およびタイプを有するAPS NALユニットを含む場合、アプリケーションはそれらを移動し、書き換えなければならないこともある。
ビットストリームをVVC8に準拠させるためのこれらの移動動作は、最悪の場合、ランダムアクセスされたピクチャユニットの後にPUのすべてのAPS NALユニットを書き換えることを必要とし得るので、コストがかかる。
これらの問題を解決するために、第2の実施形態のグループは、書き換え動作がより少ないか、またはまったくないことを保証するために、シンタックス構造に制約を課し、除去し、または修正する。
第4の実施形態
VVC8では、(上述の制約(a)および(b)に加えて)同じAPSタイプおよび同じ識別子を有する任意のAPSが同じコンテンツを有さなければならないという制約である。この制約は、APSが異なるAPS NALユニットタイプ(サフィックスとプレフィックス)の意味で異なる場合でも適用される。言い換えれば、既存のAPSパラメータとは異なる新しいAPSパラメータが必要とされる場合、エンコーダは新しいAPSパラメータを担持するAPS NALユニットに異なるAPSタイプおよび識別子の組合せを割り当てなければならず、または使用する自由な組合せが残っていない場合、エンコーダは最も古い既存のAPSなどの既存のAPSを置き換えなければならない。
第4の実施形態では、デコーダが同じタイプおよび識別子を有するサフィックスおよびプレフィックスAPS NALユニットが異なるコンテンツを有することを可能にする。その結果、次のステートメントが第4の実施形態に適合するビットストリームに対して有効である場合、ビットストリームは有効である(すなわち、ステップ1005において適合性チェックに通過する)。
(e) 特定のNALユニットタイプ(nal_unit_type)と、adaptation_parameter_set_idの特定の値と、PU内のaps_params_typeの特定の値と、を有するすべてのAPS NALユニットは、同じ内容を有する。
その結果、NALユニットNAL-06(プレフィックスAPS NALユニット)は、NALユニットNAL-11(サフィックスAPS NALユニット)とは異なるNALユニットタイプを有するため、NALユニットNAL-11の移動動作は不要である。図12Dは、NALユニットNAL-11の移動動作を伴わないビットストリームを表す。
第5の実施形態
上述の第4の実施形態は、同じ識別子およびタイプのAPSを有するプレフィックスおよびサフィックスAPS NALユニットが異なる内容を有することを可能にする。しかしながら、この変更の1つの結果は、APSを提供するための異なるタイプのNALユニットを使用することによって、2つのスライス間のAPSを更新することを可能にすることである。例えば、ここで図13を参照すると、PU PU-01は、ピクチャヘッダNALユニットNAL-01から始まる。このPUは、同じ識別子および同じタイプであるが異なる内容を有するAPSを含む2つのAPS NALユニットNAL-02およびNAL-04を含む。NAL-02は、プレフィックスNALユニットであり、NAL-04はサフィックスNALユニットである。その結果、スライスNAL-03はNAL-02APS NALユニット内のAPSパラメータを参照し、スライスNAL-05は、NAL-04APS NALユニット内のパラメータを参照することができる。その結果、PU PU-01の復号は、タイプおよび識別子値の同じ組合せをもつAPSの2つのバージョンを格納するために追加のメモリを必要とする。
第5の実施形態では、エンコーダが、現在のPUのNALユニットがPU内のサフィックスAPS NALユニットの位置にかかわらず、サフィックスAPS NALユニット内のAPSを参照しないという制約を有する、所与のPU内のサフィックスAPS NALユニットを生成し得る。サフィックスAPS NALユニットを含むビットストリームは、次の制約に従う必要がある。
(f) サフィックスAPS NALユニットは、サフィックスAPS NALユニットを含むPUのVCL NALユニットによって使用されるためではなく、復号順序においてサフィックスAPS NALユニットに続くPUのVCL NALユニットによって使用されるためのものである。
図13の例を参照すると、サフィックスAPS NALユニットNAL-04は、第5の実施形態における後続のPUにおけるNALユニットによる使用のためにのみ利用可能である。したがって、スライスNAL-05は、サフィックスAPS NALユニットNAL-04内のパラメータを参照することができない。次のPU PU-02のスライスNAL-09およびNAL-10は、サフィックスAPS NALユニットNAL-04中のAPSを参照し得る。しかしながら、NAL-04のAPSは、NAL-02のAPSと同じ識別子およびタイプを有するので、これらのスライス(NAL-09およびNAL-10)はNAL-02のAPSの初期バージョンを参照することができない。
第6の実施形態
PUのNALユニットがPUのサフィックスAPS NALユニット内のAPSを参照しないという第5の実施形態の制約に加えて、第6の実施形態は、所与のPU中のプレフィックスおよびサフィックスNALユニットの特定の混合を禁止する。それは、
(g1) PREFIX APS NALユニットがPU中に存在するとき、それらはPUの最後のVCL NALユニット、またはSUFFIX APS NALユニットに後続しない、および
(g2) SUFFIX APS NALユニットがPU中に存在するとき、それらはPUの最初のVCL NALユニット、またはPREFIX APS NALユニットに先行しない
ことを意味する。
言い換えれば、APSがPUの最初のVCL NALの前に送信されるときにエンコーダがプレフィックスAPS NALユニットを使用しなければならないという制約(a)、およびAPSがPUの最後のVCLに続くときにエンコーダがサフィックスNALユニットを使用しなければならないという制約(b)が依然として適用される。しかしながら、PUの最初のVCL NALユニットと最後のVCL NALユニットとの間で、エンコーダは、任意の混合においてプレフィックスまたはサフィックスAPS NALユニットのいずれかを使用することができるという自由が制約される。順序がプレフィックスAPS NALユニット、つぎにサフィックスAPS NALユニットである混合のみが許可される。この制約は、APSタイプおよびAPS識別子とは無関係である。変形例では、制約が1つのAPSタイプに適用され得るが、別のAPSタイプには適用されない。
これは、デコーダが、ビットストリームの最初のサフィックスAPS NALユニットを構文解析するとすぐに、デコーダが所与のPUにおいて参照され得るAPSのリストが完了すると決定することができるので、復号プロセスを単純化する。
第7の実施形態
第4の実施形態と同様に、第7の実施形態は、同じタイプおよび識別子を有するサフィックスおよびプレフィックスAPS NALユニットが異なるコンテンツを有することを可能にする。したがって、制約(e)は、第7の実施形態に準拠するビットストリームに適用される。
(e) 特定のNALユニットタイプ、adaptation_parameter_set_idの特定の値、およびPU内のaps_params_typeの特定の値を有するすべてのAPS NALユニットは、同じコンテンツを有する。
第2の実施形態のさらなる制約も課される。
(d2) サフィックスAPS NALユニットは、最後のVCL NALユニットの後になければならない。
この制約は、APSタイプおよびAPS識別子とは無関係である。変形例では、制約が1つのAPSタイプに適用され得るが、別のAPSタイプには適用されない。
VVC8の制約(a)および(b)は、依然として適用される。PUの最初のVCL NALユニットと最後のVCL NALユニットとの間で、エンコーダが任意の混合においてプレフィックスまたはサフィックスAPS NALユニットのいずれかを使用し得るという自由は、制約(d2)によって制約される。それは、任意のVCL NALユニットまたはPUのピクチャヘッダがサフィックスAPS NALユニットにおいて定義されたAPSを参照することを防止する。実際、参照されるべきAPSは、それを参照するNALユニットの前に提供されるべきである。この最後の制約は、SUFFIX APS NALユニット中のAPSが所与のPU中のAPSを参照し得るすべてのNALユニットの後にあることを暗示する。復号順序において次のPUからのVCL NALユニットのみが、これらのAPSを参照し得る。
第8の実施形態
第8の実施形態は、第4から第6の実施形態のいずれか1つを基礎とし、第1の実施形態のさらなる制約を加える。
(d1) プレフィックスAPS NALユニットは、最初のVCL NALユニットの前にある必要がある。
VVC8の制約(a)および(b)は、依然として適用される。PUの最初のVCL NALユニットと最後のVCL NALユニットとの間で、エンコーダが任意の混合においてプレフィックスまたはサフィックスAPS NALユニットのいずれかを使用し得るという自由は、制約(d1)によって制約される。
これは、複雑な書き換え動作を防ぐだけでなく、第1の実施形態に関して説明したように、デコーダが所与のPUのスライスを復号するためにAPSの2つのバージョンをバッファリングする必要がないことも保証する。
第9の実施形態
第9の実施形態は、第7の実施形態を基礎とし、このプレフィックスAPS NALユニットが最初のVCL NALユニットの前でなければならないという上のさらなる制約(d1)を追加する。
VVC8の制約(a)および(b)は、依然として適用される。PUの最初のVCL NALユニットと最後のVCL NALユニットとの間で、エンコーダが任意の混合においてプレフィックスまたはサフィックスAPS NALユニットのいずれかを使用し得るという自由は、制約(d1)によって制約される。
これは、複雑な書き換え動作を防ぐだけでなく、第1の実施形態に関して説明したように、デコーダが所与のPUのスライスを復号するためにAPSの2つのバージョンをバッファリングする必要がないことも保証する。
第10実施形態
第10の実施形態では、エンコーダが、APSの同じタイプおよび識別子を共有するとき、サフィックスおよびプレフィックスAPS NALユニットが異なるコンテンツを有することを可能にする。また、準拠ビットストリームには、以下のような制約が必要である。
(h1) PU内の、特定の識別子値および特定のタイプ値をもつAPSを参照するVCL NALユニットの後に、識別子およびタイプのこれらの特定の値をもつAPSを含むプレフィックスAPS NALユニットが続くことはない。
この実施形態は、2つのVCL NALユニット間にプレフィックスおよびサフィックスAPS NALユニットを提供することを可能にする。エンコーダは、次のPUのAPSを有する新しいAPS NALユニットを生成する必要がある場合、いくつかのVCL NALユニットのためにAPSをバッファリングする必要がない。
制約(h1)は、同じ識別子およびタイプ値を使用するとき、同じPUの2つのスライスが(プレフィックスAPS NALユニット中で提供される)異なるAPSを参照しないことを保証する。
変形例では、エンコーダが、PPSまたはSPSなどのパラメータセットヘッダ中のフラグを用いて、インターリーブされたAPSが許可されるか、または許可されないか、を、SPSで通知し得る。
第11実施形態
第11の実施形態では、エンコーダがAPSの同じタイプおよび識別子を共有するとき、サフィックスおよびプレフィックスAPS NALユニットが異なるコンテンツを有することを可能にする。また、準拠ビットストリームには、以下のような制約が必要である。
(h2) PU内の、特定の識別子値および特定のタイプ値を有するAPSを参照するVCL NALユニットは、識別子およびタイプのこれらの特定の値を有するAPSを含むサフィックスAPS NALユニットによって先行されない。
この実施形態は、2つのVCL NALユニット間にプレフィックスおよびサフィックスAPS NALユニットを提供することを可能にする。エンコーダは、次のPUのAPSを有する新しいAPS NALユニットを生成する必要がある場合、いくつかのVCL NALユニットのAPSをバッファリングする必要がない。
制約(h2)は、サフィックスAPS NALユニットが所与のPU中のNALユニットのために使用されないが、後続のPUのVCL NALユニットによってのみ使用されることを保証する。
変形例では、エンコーダが、PPSまたはSPSなどのパラメータセットヘッダ中のフラグを用いて、インターリーブされたAPSが許可されるか、または許可されないのか、を、SPSにおいて通知し得る。
第12の実施形態
第12の実施形態では、エンコーダが、APSの同じタイプおよび識別子を共有するとき、サフィックスおよびプレフィックスAPS NALユニットが異なるコンテンツを有することを可能にする。さらに、第10および第11の実施形態でそれぞれ適用される制約(h1)および(h2)は共に、準拠ビットストリームに必要とされる。
この実施形態は、2つのVCL NALユニット間にプレフィックスおよびサフィックスAPS NALユニットを提供することを可能にする。エンコーダは、次のPUのAPSを有する新しいAPS NALユニットを生成する必要がある場合、いくつかのVCL NALユニットのAPSをバッファリングする必要がない。
変形例では、エンコーダが、PPSまたはSPSなどのパラメータセットヘッダ中のフラグを用いて、インターリーブされたAPSが許可されるか、または許可されないのか、を、SPSにおいて通知し得る。
第1の実施形態のグループのさらなる実施形態
第2の実施形態のグループの実施形態において使用される特定の方法(Certain measures)は、第1の実施形態のグループによって対処される問題を解決するためにも有用である。したがって、第1の実施形態のグループのさらなる実施形態は、以下のように考えられる。これらのさらなる実施形態は、ランダムアクセス問題を解決するために必要とされず、したがって、PU内の特定のNALユニットタイプ(nal_unit_type)とadaptation_parameter_set_idの特定の値とaps_params_typeの特定の値とを有するすべてのAPS NALユニットが同じコンテンツを有するべきであるという第4~第12の実施形態の制約(e)を伴わない。
第13の実施形態
この実施形態は、制約:
(h1) PU内で、特定の識別子値および特定のタイプ値を有するAPSを参照するVCL NALユニットの後に、識別子およびタイプのこれらの特定の値を有するAPSを含むプレフィックスAPS NALユニットが続くことはない;および
(d2) サフィックスAPS NALユニットは、最後のVCL NALユニットの後になければならない
を組み合わせる。
第14の実施形態
この実施形態は、制約:
(h2) PU内の、特定の識別子値および特定のタイプ値を有するAPSを参照するVCL NALユニットは、識別子およびタイプのこれらの特定の値を有するAPSを含むサフィックスAPS NALユニットによって先行されないものとし;および
(d1) プレフィックスAPS NALユニットは、最初のVCL NALユニットの前でなければならない
を組み合わせる。
第15の実施形態
この実施形態は、制約:
(h1) PU内の、特定の識別子値および特定のタイプ値を有するAPSを参照するVCL NALユニットの後に、識別子およびタイプのこれらの特定の値を有するAPSを含むプレフィックスAPS NALユニットが続かないものとし、;および
(h2) PU内で、特定の識別子値および特定のタイプ値を有するAPSを参照するVCL NALユニットは、識別子およびタイプのこれらの特定の値を有するAPSを含むサフィックスAPS NALユニットによって先行されないものとする
を組み合わせる。
この実施形態では、制約(d1)も制約(d2)も必要とされない。
本発明の実施形態の実施
また、本発明の他の実施形態によれば、前述の実施形態/変形例によるデコーダは、ユーザにコンテンツを提供/表示することができるコンピュータ、携帯電話(携帯電話)、タブレット、または任意の他のタイプのデバイス(例えば、ディスプレイ装置)などのユーザ端末において提供されることも理解される。さらに別の実施形態によれば、前述の実施形態/変形例によるエンコーダは、エンコーダがエンコードするコンテンツをキャプチャおよび提供する、カメラ、ビデオカメラ、またはネットワークカメラ(たとえば、閉回路テレビジョンまたはビデオ監視カメラ)も含む画像キャプチャ装置において提供される。2つのそのような実施形態が、図14および図15を参照して以下に提供される。
図14は、ネットワークカメラ1402およびクライアント装置1404を含むネットワークカメラシステム1400を示す図である。
ネットワークカメラ1402は、撮像ユニット1406と、符号化ユニット1408と、通信ユニット1410と、制御ユニット1412と、を備える。ネットワークカメラ1402とクライアント装置1404とは、ネットワーク300を介して互いに通信可能に相互に接続されている。
撮像ユニット1406は、レンズ及び撮像素子(例えば、CCD(charge coupled device)又はCMOS(complementary metal oxide semiconductor))を備え、被写体の画像を撮像し、画像に基づいて画像データを生成する。この画像は、静止画像またはビデオ画像とすることができる。撮像ユニットはまた、それぞれ(光学的に又はデジタル的に)ズーム又はパンするように適合されたズーム手段及び/又はパン手段を含むことができる。
符号化ユニット1408は、前述の実施形態/変形例のうちの1つまたは複数において説明された前記符号化方法を使用することによって、画像データを符号化する。符号化ユニット1408は、上記の実施形態/変形例で説明した符号化方法の少なくとも1つを用いる。別の例として、符号化ユニット1408は、前述の実施形態/変形例で説明した符号化方法の組合せを使用することができる。
ネットワークカメラ1402の通信ユニット1410は、符号化ユニット1408で符号化された符号化画像データをクライアント装置1404に送信する。
また、通信ユニット1410は、クライアント装置1404からコマンドを受信してもよい。コマンドは、符号化ユニット1408による符号化のためのパラメータを設定するためのコマンドを含む。
制御ユニット1412は、通信ユニット1410が受信したコマンドやユーザ入力に応じて、ネットワークカメラ1402内の他のユニットを制御する。
クライアント装置1404は、通信ユニット1414と、復号ユニット1416と、制御ユニット1418とを備える。
クライアント装置1404の通信ユニット1414は、ネットワークカメラ1402にコマンドを送信してもよい。また、クライアント装置1404の通信ユニット1414は、ネットワークカメラ1402から符号化画像データを受信する。
復号ユニット1416は、上述の実施形態/変形例のうちの1つまたは複数で説明した前記復号方法を用いて、符号化画像データを復号する。別の例として、復号ユニット1416は、前述の実施形態/変形例で説明された復号方法の組合せを使用することができる。
クライアント装置1404の制御ユニット1418は、通信ユニット1414が受信したユーザ操作やコマンドに応じて、クライアント装置1404内の他のユニットを制御する。また、クライアント装置1404の制御ユニット1418は、復号ユニット1416で復号された画像を表示するように表示装置1420を制御してもよい。
また、クライアント装置1404の制御ユニット1418は、GUI(Graphical User Interface)を表示するように表示装置1420を制御し、ネットワークカメラ1402のパラメータ、例えば符号化ユニット1408による符号化のためのパラメータの値を指定してもよい。また、クライアント装置1404の制御ユニット1418は、表示装置1420が表示するGUIに対するユーザ操作入力に応じて、クライアント装置1404内の他のユニットを制御してもよい。
また、クライアント装置1404の制御ユニット1418は、表示装置1420が表示するGUIに対するユーザ操作入力に応じて、ネットワークカメラ1402のパラメータの値を指定するコマンドをネットワークカメラ1402に送信するようにクライアント装置1404の通信ユニット1414を制御してもよい。
図15は、スマートフォン1500を示す図である。
スマートフォン1500は、通信ユニット1502と、復号/符号化ユニット1504と、制御ユニット1506と、表示ユニット1508とを備える。
通信ユニット1502は、ネットワーク9200を介して符号化画像データを受信する。
復号/符号化ユニット1504は、通信ユニット1502により受信された符号化画像データを復号する。復号/符号化ユニット1504は、前述の実施形態/変形例のうちの1つまたは複数において説明された前記復号方法を使用することによって、符号化画像データを復号する。復号/符号化ユニット1504はまた、前述の実施形態/変形例において説明された符号化方法または復号方法のうちの少なくとも1つを使用することができる。別の例として、復号/符号化ユニット1504は、前述の実施形態/変形例で説明した復号または符号化方法の組合せを使用することができる。
制御ユニット1506は、通信ユニット1502によって受信されたユーザ操作またはコマンドに従って、スマートフォン1500内の他のユニットを制御する。例えば、制御ユニット1506は、復号/符号化ユニット1504により復号された画像を表示するように表示ユニット1508を制御する。
スマートフォンは、画像またはビデオを記録するための画像記録デバイス1510(例えば、デジタルカメラおよび関連する回路)をさらに備えてもよい。このように記録された画像やビデオは、制御ユニット1506の指示のもと、復号/符号化ユニット1504で符号化されてもよい。
スマートフォンは、モバイルデバイスの向きを感知するように適合されたセンサ1512をさらに備え得る。そのようなセンサは、加速度計、ジャイロスコープ、コンパス、全地球測位(GPS)ユニット、または同様の位置センサ、を含むことができる。そのようなセンサ1512は、スマートフォンが向きを変えるかどうかを判定することができ、そのような情報は、ビデオストリームを符号化するときに使用され得る。
本発明は、実施形態およびその変形を参照して説明されてきたが、本発明は開示された実施形態/変形例に限定されないことを理解されたい。添付の特許請求の範囲に定義されるように、本発明の範囲から逸脱することなく、様々な変更および修正を行うことができることが、当業者によって理解されるのであろう。この明細書(任意の添付の特許請求の範囲、要約、および図面を含む)に開示される特徴のすべて、および/またはそのように開示される任意の方法またはプロセスのステップのすべては、そのような特徴および/またはステップの少なくともいくつかが相互に排他的である組合せを除いて、任意の組合せで組み合わせることができる。本明細書(任意の添付の特許請求の範囲、要約、および図面を含む)に開示される各特徴は、別段の明示的な記載がない限り、同じ、同等、または類似の目的を果たす代替の特徴によって置き換えられ得る。したがって、特に明記しない限り、開示される各特徴は、一般的な一連の同等または同様の特徴の一例に過ぎない。
上述の比較、決定、推論、評価、選択、実行、実行、または検討の任意の結果、例えば、符号化、プロセッシング、または区分化プロセス中に行われた選択は、ビットストリーム内のデータ、例えば、結果を示すフラグまたは情報に示され得るか、またはそれから決定可能/推論可能であり、したがって、示されたまたは決定された/推論された結果は例えば、復号または区分化プロセス中に、比較、決定、評価、選択、実行、実行、または検討を実際に実行する代わりに、プロセッシングにおいて使用され得ることも理解されたい。「テーブル」または「ルックアップテーブル」が使用されるとき、アレイなどの他のデータタイプも、そのデータタイプが同じ機能を実行することができる(たとえば、異なる要素間の関係/マッピングを表す)限り、同じ機能を実行するために使用され得ることを理解されたい。
請求項において、単語「有する(comprising)」は他の要素又はステップを除外せず、不定冠詞「a」又は「an」は複数を除外しない。異なる特徴が相互に異なる従属請求項に記載されているという単なる事実は、これらの特徴の組合せが有利に使用され得ないことを示すものではない。特許請求の範囲に現れる参照符号は、例示のためだけのものであり、特許請求の範囲に限定的な効果を有するものではない。
前述の実施形態/変形例では、説明される機能がハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとして、コンピュータ可読媒体上に格納され、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。
コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応するコンピュータ可読記憶媒体、または、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。このように、コンピュータ可読媒体は、一般的には、(1)非一時的である有形のコンピュータ可読記憶媒体、または(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明する技法を実施するための命令、コード、および/またはデータ構造を取り出すために1つまたは複数のコンピュータまたは1つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。
限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM、CD-ROMまたは他の光ディスク記憶装置、磁気ディスク記憶装置、または他の磁気記憶デバイス、フラッシュメモリ、または命令またはデータ構造の形で所望のプログラムコードを格納するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を含み得る。また、任意のコネクションは、コンピュータ可読媒体と適切に呼ばれる。たとえば、命令が同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まず、代わりに非一時的な有形記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク(Disk)およびディスク(disc)は、コンパクトディスク(CD)、レーザディスク、光ディスク、デジタル多用途ディスク(DVD)、フロッピーディスクおよびブルーレイディスクを含み、ディスク(disks)は通常、データを磁気的に再生し、ディスク(discs)は、データをレーザで光学的に再生する。上記の組合せも、コンピュータ可読媒体の範囲内に含まれるべきである。
命令は、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲート/論理アレイ(FPGA)、または他の同等の集積または個別論理回路など、1つまたは複数のプロセッサによって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造のいずれか、または本明細書で説明する技法の実装に適した任意の他の構造を指すことがある。加えて、いくつかの態様では、本明細書で説明する機能が符号化および復号のために構成された専用ハードウェアおよび/またはソフトウェアモジュール内に提供され得るか、または組み合わされたコーデックに組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素において完全に実装され得る。
本発明による方法/プロセスの任意のステップまたは本明細書で説明される機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実現される場合、ステップ/機能は、1つ以上の命令またはコードもしくはプログラム、またはコンピュータ可読媒体として格納または伝送され、PC(「パーソナルコンピュータ」)、DSP(「デジタル信号プロセッサ」)、回路(circuit)、回路(circuitry)、プロセッサおよびメモリ、汎用マイクロプロセッサまたは中央処理ユニット、マイクロコントローラ、ASIC(「特定用途向け集積回路」)、フィールドプログラマブルロジックアレイ(FPGA)、または他の同等の集積またはディスクリートロジック回路であり得るプログラマブル計算機などの1つまたは複数のハードウェアベースの処理ユニットによって実行されてもよい。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造のいずれか、または本明細書で説明する技術の実装に適した任意の他の構造を指すことがある。
本発明の実施形態はまた、ワイヤレスハンドセット、集積回路(IC)、またはJCのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置によって実現され得る。本明細書では様々な構成要素、モジュール、またはユニットがそれらの実施形態を実行するように構成されたデバイス/装置の機能的態様を示すために説明されるが、必ずしも異なるハードウェアユニットによる実現を必要としない。むしろ、種々モジュール/ユニットは、コーデックハードウェアユニットにおいて組み合わされてもよく、または適切なソフトウェア/ファームウェアと併せて1つまたは複数のプロセッサを含む、相互運用ハードウェアユニットの集合によって提供されてもよい。
本発明の実施形態は、記憶媒体に記録されたコンピュータ実行可能命令(例えば、1つまたは複数のプログラム)を読み出して実行し、1つ以上の上述の実施形態のモジュール/ユニット/機能を実行する、及び/又は1つ以上の上述の実施形態の機能を実行するための1つ以上の中央処理ユニット又は回路を含むシステム又は装置のコンピュータによって、及び、例えば、1つ以上の上述の実施形態の機能を実行するために記憶媒体からコンピュータ実行可能命令を読み出して実行する、及び/又は1つ以上の上述の実施形態の機能を実行するために1つ以上のプロセッシングユニット又は回路を制御することによって、システム又は装置のコンピュータによって実行される方法によって、実現することができる。コンピュータは、コンピュータ実行可能命令を読み出して実行するために、別個のコンピュータまたは別個のプロセッシングユニットのネットワークを含むことができる。コンピュータ実行可能命令はたとえば、ネットワークまたは有形記憶媒体を介した通信媒体などのコンピュータ可読媒体からコンピュータに提供され得る。通信媒体は、信号/ビットストリーム/搬送波であり得る。有形記憶媒体は例えば、ハードディスク、ランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、分散コンピューティングシステムの記憶装置、光ディスク(コンパクトディスク(CD)、デジタル多用途ディスク(DVD)、またはブルーレイディスク(BD)TMなど)、フラッシュメモリデバイス、メモリカードなどのうちの1つまたは複数を含み得る「非一時的コンピュータ可読記憶媒体」である。ステップ/機能の少なくともいくつかはまた、FPGA(「フィールドプログラマブルゲートアレイ」)またはASIC(「特定用途向け集積回路」)などの機械または専用構成要素によってハードウェアで実装され得る。

Claims (17)

  1. ビットストリーム内に画像のシーケンスを符号化する方法であって、
    前記ビットストリーム内に一連のピクチャユニットを提供することを有し、
    前記ピクチャユニットの各々は、1つの符号化された画像に対応し、且つ一または複数のネットワーク抽象化レイヤ(NALユニットを含み、
    前記一連のピクチャユニットに含まれうる複数のNALユニットは、符号化された画像データを各々が含む複数のビデオコーディングレイヤ(VCL)NALユニット、および適応パラメータセット(APS)を各々が含む複数の適応パラメータセット(APS NALユニットを含み、
    前記複数のAPS NALユニットは、プレフィックスAPS NALユニットサフィックスAPS NALユニットとを含み
    プレフィックスAPS NALユニットがピクチャユニットにおいて存在する場合、当該プレフィックスAPS NALユニットは当該ピクチャユニットの最初のVCL NALユニットの前でなければならず
    サフィックスAPS NALユニットがピクチャユニットにおいて存在する場合、当該サフィックスAPS NALユニットは当該ピクチャユニットの最後のVCL NALユニットの後でなければならず
    前記APS NALユニットは、APSタイプとAPS識別子とを有し、
    同じAPSタイプおよび同じAPS識別子を有するが、異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを同じピクチャユニットに含めることが許容される
    ことを特徴とする方法。
  2. 前記サフィックスAPS NALユニットを含む前記ピクチャユニットの前記VCL NALユニットによるサフィックスAPS NALユニットの使用を禁止し、
    該サフィックスAPS NALユニットを、復号順序で該サフィックスAPS NALユニットに続くピクチャユニットのVCL NALユニットにより使用することを可能にする
    ことを特徴とする請求項1に記載の方法。
  3. ピクチャユニットに、前記ピクチャユニットの前記最後のVCL NALユニットの前にサフィックスAPS NALユニットを含めること禁止される、ことを含むことを特徴とする請求項1に記載の方法。
  4. ピクチャユニットに、前記ピクチャユニットの前記最初のVCL NALユニットの後にプレフィックスAPS NALユニットを含めること禁止される、ことを含むことを特徴とする請求項1ないしのいずれか一項に記載の方法。
  5. ピクチャユニットにおいて、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットの後に、同じAPSタイプおよび同じAPS識別子を有するAPSを含むプレフィックスAPS NALユニットが続くことを禁止する、ことを含むことを特徴とする請求項1に記載の方法。
  6. ピクチャユニットにおいて、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットが、同じAPSタイプおよび同じAPS識別子を有するAPSを含むサフィックスAPS NALユニットに先行されることを禁止する、ことを含むことを特徴とする、請求項1に記載の方法。
  7. 一連の符号化された画像を復号する方法であって、
    一連のピクチャユニットを有するビットストリームを受信することを含み、
    前記ピクチャユニットの各々は、1つの符号化された画像に対応し、且つ一または複数のネットワーク抽象化レイヤ(NALユニットを含み、
    前記一連のピクチャユニットに含まれうる複数のNALユニットは、符号化された画像データを各々が含む複数のビデオコーディングレイヤ(VCL)NALユニット、および適応パラメータセット(APS)を各々が含む複数の適応パラメータセット(APS NALユニットを含み、
    前記複数のAPS NALユニットは、プレフィックスAPS NALユニットサフィックスAPS NALユニットとを含み
    プレフィックスAPS NALユニットがピクチャユニットにおいて存在する場合、当該プレフィックスAPS NALユニットは当該ピクチャユニットの最初のVCL NALユニットの前でなければならず
    サフィックスAPS NALユニットがピクチャユニットにおいて存在する場合、当該サフィックスAPS NALユニットは当該ピクチャユニットの最後のVCL NALユニットの後でなければならず
    前記APS NALユニットは、APSタイプとAPS識別子とを有し、
    同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを同じピクチャユニットに含めることは許容される、
    ことを特徴とする方法。
  8. 所与のピクチャユニット内のプレフィックスNALユニットタイプであり特定のAPS識別子および特定のAPSタイプである全てのAPS NALユニットは、同じコンテンツを有し、
    所与のピクチャユニット内のサフィックスNALユニットタイプであり特定のAPS識別子および特定のAPSタイプを有するすべてのAPS NALユニットは同じコンテンツを有することを特徴とする請求項に記載の方法。
  9. 特定のVCL NALユニットを含む前記ピクチャユニットの前記VCL NALユニットによるサフィックスAPS NALユニットの使用を禁止することと、
    該サフィックスAPS NALユニットの、復号順序において該サフィックスAPS NALユニットに後続するピクチャユニットのVCL NALユニットによる使用を可能にすることと
    を含むことを特徴とする請求項に記載の方法。
  10. ピクチャユニットに、前記ピクチャユニットの前記最後のVCL NALユニットの前にサフィックスAPS NALユニットを含めること禁止されることを特徴とする請求項に記載の方法。
  11. ピクチャユニットに、前記ピクチャユニットの前記最初のVCL NALユニットの後のプレフィックスAPS NALユニットを含めることが禁止されることを特徴とする請求項に記載の方法。
  12. ピクチャユニット内で、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットの後に、同じAPSタイプおよび同じAPS識別子を有するAPSを含むプレフィックスAPS NALユニットが続くことを禁止する、ことを含む、ことを特徴とする請求項に記載の方法。
  13. ピクチャユニット内に、特定のAPSタイプおよび特定のAPS識別子を有するAPSを参照するVCL NALユニットが、同じAPSタイプおよび同じAPS識別子を有するAPSを含むサフィックスAPS NALユニットに先行されることを禁止することを含む、ことを特徴とする、請求項に記載の方法。
  14. ビットストリーム内に画像のシーケンスを符号化するための装置であって、
    前記ビットストリーム内に一連のピクチャユニットを提供する手段を有し、
    前記ピクチャユニットの各々は、1つの符号化された画像に対応し、且つ一または複数のネットワーク抽象化レイヤ(NALユニットを含み、
    前記一連のピクチャユニットに含まれうる複数のNALユニットは、符号化された画像データを各々が含む複数のビデオコーディングレイヤ(VCL)NALユニット、および適応パラメータセット(APS)を各々が含む複数の適応パラメータセット(APS NALユニットを含み、
    前記複数のAPS NALユニットは、プレフィックスAPS NALユニットサフィックスAPS NALユニットとを含み
    プレフィックスAPS NALユニットがピクチャユニットにおいて存在する場合、当該プレフィックスAPS NALユニットは当該ピクチャユニットの最初のVCL NALユニットの前でなければならず
    サフィックスAPS NALユニットがピクチャユニットにおいて存在する場合、当該サフィックスAPS NALユニットは当該ピクチャユニットの最後のVCL NALユニットの後でなければならず
    前記APS NALユニットは、APSタイプとAPS識別子とを有し、
    同じAPSタイプおよび同じAPS識別子を有するが、異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを同じピクチャユニットに含めることが許容される
    ことを特徴とする装置。
  15. 符号化された画像のシーケンスを復号するための装置であって、
    一連のピクチャユニットを有するビットストリームを受信する手段を備え、
    前記ピクチャユニットの各々は、1つの符号化された画像に対応し、且つ一または複数のネットワーク抽象化レイヤ(NALユニットを含み、
    前記一連のピクチャユニットに含まれうる複数のNALユニットは、符号化された画像データを各々が含む複数のビデオコーディングレイヤ(VCL)NALユニット、および適応パラメータセット(APS)を各々が含む複数の適応パラメータセット(APS NALユニットを含み、
    前記複数のAPS NALユニットは、プレフィックスAPS NALユニットサフィックスAPS NALユニットとを含み
    プレフィックスAPS NALユニットがピクチャユニットにおいて存在する場合、当該プレフィックスAPS NALユニットは当該ピクチャユニットの最初のVCL NALユニットの前でなければならず
    サフィックスAPS NALユニットがピクチャユニットにおいて存在する場合、当該サフィックスAPS NALユニットは当該ピクチャユニットの最後のVCL NALユニットの後でなければならず
    前記APS NALユニットは、APSタイプとAPS識別子とを有し、
    同じAPSタイプおよび同じAPS識別子を有するが異なるコンテンツを有するプレフィックスAPS NALユニットおよびサフィックスAPS NALユニットを同じピクチャユニットに含めることは許容される、
    ことを特徴とする装置。
  16. コンピュータに、請求項1に記載の方法を実行させるプログラム。
  17. コンピュータに、請求項7に記載の方法を実行させるプログラム。
JP2022545938A 2020-03-27 2021-03-22 ビデオコーディングおよびデコーディング Active JP7490068B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB2004540.7 2020-03-27
GB2004540.7A GB2593543B (en) 2020-03-27 2020-03-27 Video coding and decoding
GB2004958.1A GB2593549B (en) 2020-03-27 2020-04-03 Video coding and decoding
GB2004958.1 2020-04-03
PCT/EP2021/057302 WO2021191159A1 (en) 2020-03-27 2021-03-22 Video coding and decoding

Publications (2)

Publication Number Publication Date
JP2023518925A JP2023518925A (ja) 2023-05-09
JP7490068B2 true JP7490068B2 (ja) 2024-05-24

Family

ID=70553452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022545938A Active JP7490068B2 (ja) 2020-03-27 2021-03-22 ビデオコーディングおよびデコーディング

Country Status (10)

Country Link
US (1) US20230121486A1 (ja)
EP (1) EP4128785A1 (ja)
JP (1) JP7490068B2 (ja)
KR (1) KR20220160029A (ja)
CN (1) CN115362684A (ja)
BR (1) BR112022016463A2 (ja)
CL (6) CL2022002565A1 (ja)
GB (2) GB2593543B (ja)
TW (1) TWI817099B (ja)
WO (1) WO2021191159A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115428463A (zh) * 2020-04-02 2022-12-02 抖音视界有限公司 变换跳过模式下的系数编解码

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013031315A1 (ja) * 2011-08-30 2013-03-07 ソニー株式会社 画像処理装置及び画像処理方法
AU2020332558A1 (en) * 2019-08-19 2022-03-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Usage of access unit delimiters and adaptation parameter sets

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BROSS, Benjamin et al.,Versatile Video Coding (Draft 8),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 17th Meeting: Brussels, BE, 7-17 January 2020, [JVET-Q2001-vE],JVET-Q2001 (version 15),ITU-T,2020年01月18日,<URL:https://jvet-experts.org/doc_en_user/documents/17_Brussels/wg11/JVET-Q2001-v15.zip>: JVET-Q2001-vE.docx: pp.8,46-47,88-93,118-119
OUEDRAOGO, Nael et al.,AHG9: On prefix and suffix APSs,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 18th Meeting: by teleconference, 15-24 April 2020, [JVET-R0201],JVET-R0201 (version 1),ITU-T,2020年04月03日,<URL:https://jvet-experts.org/doc_end_user/documents/18_Alpbach/wg11/JVET-R0201-v1.zip>: JVET-R0201.docx: pp.1-4, JVET-R0201_Spec_from_JVET-Q2001-vE.docx: pp.93,118-119

Also Published As

Publication number Publication date
CL2022003212A1 (es) 2023-07-21
US20230121486A1 (en) 2023-04-20
GB202004958D0 (en) 2020-05-20
GB2593543A (en) 2021-09-29
BR112022016463A2 (pt) 2022-10-04
CL2022003218A1 (es) 2023-06-23
JP2023518925A (ja) 2023-05-09
GB2593549B (en) 2022-12-14
GB2593549A (en) 2021-09-29
EP4128785A1 (en) 2023-02-08
CN115362684A (zh) 2022-11-18
CL2022003214A1 (es) 2023-06-23
KR20220160029A (ko) 2022-12-05
TWI817099B (zh) 2023-10-01
TW202137768A (zh) 2021-10-01
CL2022002565A1 (es) 2023-05-12
GB2593543B (en) 2023-04-19
WO2021191159A1 (en) 2021-09-30
CL2022003216A1 (es) 2023-06-23
GB202004540D0 (en) 2020-05-13
CL2022003217A1 (es) 2023-06-23

Similar Documents

Publication Publication Date Title
JP7403633B2 (ja) ビデオの符号化及び復号のための高レベルシンタックス
TW202139701A (zh) 用於視頻編碼及解碼之高階語法
JP7345051B2 (ja) サブピクチャ、スライス、およびタイルをサポートするビデオ符号化
TWI827919B (zh) 用於視頻編碼及解碼的高階語法
TWI811651B (zh) 用於視頻編碼及解碼的高階語法
JP7475455B2 (ja) ビデオの符号化および復号のためのハイレベルシンタックス
JP7490068B2 (ja) ビデオコーディングおよびデコーディング
JP7497441B2 (ja) ビデオの符号化及び復号のための高レベルシンタックス
JP7383808B2 (ja) ビデオコーディング及び復号のための高レベルシンタックス

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221026

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240415

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240514

R150 Certificate of patent or registration of utility model

Ref document number: 7490068

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150