JP2022547877A - ストリームマージのためのコンフィギュラブルnal及びスライスコードポイント機構 - Google Patents

ストリームマージのためのコンフィギュラブルnal及びスライスコードポイント機構 Download PDF

Info

Publication number
JP2022547877A
JP2022547877A JP2022514617A JP2022514617A JP2022547877A JP 2022547877 A JP2022547877 A JP 2022547877A JP 2022514617 A JP2022514617 A JP 2022514617A JP 2022514617 A JP2022514617 A JP 2022514617A JP 2022547877 A JP2022547877 A JP 2022547877A
Authority
JP
Japan
Prior art keywords
coding unit
video
data stream
picture
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022514617A
Other languages
English (en)
Other versions
JP7400084B2 (ja
Inventor
デ ラ フエンテ ヤゴ サンチェス
カルステン ズーリング
コーネリアス ヘルゲ
トーマス ツェル
ロベルト スクピン
トーマス ウィーガンド
Original Assignee
フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2022547877A publication Critical patent/JP2022547877A/ja
Priority to JP2023205885A priority Critical patent/JP2024026283A/ja
Application granted granted Critical
Publication of JP7400084B2 publication Critical patent/JP7400084B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビデオデータストリームからの複数のピクチャを含むビデオを、ピクチャの各々に関連するビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位からの各ピクチャを復号化することによって、復号化し、ビデオデータストリームのパラメータセット単位から代替的な符号化単位タイプを読み、所定の各ビデオ符号化単位に対して、ビデオ符号化単位の各々から符号化単位タイプ識別子(100)を読み、符号化単位の識別子が1つ以上の符号化単位タイプの第1のサブセット(102)又は符号化単位タイプの第2のサブセット(104)からの符号化単位タイプを識別するか確認し、符号化単位の識別子が1つ以上の符号化単位タイプの第1のサブセットからの符号化単位タイプを識別する場合、所定のビデオ符号化単位の各々を代替的な符号化単位タイプにし、符号化単位の識別子が符号化単位タイプの第2のサブセットからの符号化単位タイプを識別する場合、所定のビデオ符号化単位の各々を符号化単位識別子によって識別される符号化単位タイプの第2のサブセットからの前記符号化単位タイプにする、よう構成されるビデオデコーダ。

Description

本願は、ビデオデータストリームのビデオ符号化単位の符号化単位タイプ及び特性を示すデータ構造に関する。
ピクチャタイプは、ピクチャのスライスを搬送するNAL単位のNAL単位ヘッダに示されることが知られている。それによって、NAL単位ペイロードの本質的な特性は、アプリケーションによる使用のための非常に高いレベルで利用可能である。
ピクチャタイプは、以下を含む。
-ランダムアクセスポイント(RAP)ピクチャ:そこにおいて、デコーダは符号化されたビデオシーケンスの復号化を開始しうる。これらは、Intra Random Access Picture(IRAP)として参照される。3つのIRAPピクチャタイプ、すなわち、Instantaneous Decoder Refresh(IDR)、Clean Random Access(CRA)及びBroken Link Access(BLA)が存在する。符号化されたビデオシーケンスの復号化処理は、常にIRAPから開始される。
-リーディングピクチャ:それは、出力順においてランダムアクセスポイントピクチャに先行するが、符号化されたビデオシーケンスにおいてランダムアクセスポイントピクチャの後に符号化される。符号化順においてランダムアクセスポイントに先行するピクチャから独立したリーディングピクチャは、ランダムアクセス復号化可能先行(Random Access Decodable Leading:RADL)ピクチャと呼ばれる。予測のために符号化順でランダムアクセスポイントに先行するピクチャを使用するリーディングピクチャは、復号化が対応するIRAPにおいて開始される場合、破損する可能性がある。これらは、ランダムアクセススキップ先行(Random Access Skipped Leading:RASL)ピクチャと呼ばれる。
-トレイリング(TRAIL)ピクチャ:それは、IRAPピクチャチとリーディングピクチャとに出力順と表示順の双方で後続する。
-符号化されたビデオシーケンスの時間解像度がデコーダによって切り替えられうるピクチャ:時間サブレイヤアクセス(Temporal Sublayer Access)及びステップ単位時間サブレイヤアクセス(STSA)
従って、NAL単位のデータ構造は、ストリームマージの重要なファクタである。
本願の主題の課題は、代替的な符号化単位タイプを示す識別子を読むことによって、ビデオデータストリームのビデオ符号化単位の必要な情報を導出するデコーダと、ビデオデータストリームの特性を導出するデコーダとを提供することである。
本願の主題の更なる課題は、識別子を利用することによってビデオ符号化単位の代替的な符号化単位タイプを示すエンコーダと、ビデオデータストリームの特性を示すエンコーダとを提供することである。
本課題は、本願の請求項の主題によって達成される。
本願の実施例によると、ビデオデータストリームからの複数のピクチャを含むビデオを、前記ピクチャの各々に関連する前記ビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位からの各ピクチャを復号化することによって、復号化し、前記ビデオデータストリームのパラメータセット単位から代替的な符号化単位タイプを読み、所定の各ビデオ符号化単位に対して、前記ビデオ符号化単位の各々から、nal単位ヘッダに含まれるシンタックス要素などの符号化単位タイプ識別子(100)を読み、前記符号化単位の識別子が、例えば、nal単位がマッピング可能なVCL(Video Coding Layer)単位タイプであるか否かを示すなど、1つ以上の符号化単位タイプの第1のサブセット(102)であるか、又は、例えば、nal単位タイプを示すなど、符号化単位タイプの第2のサブセット(104)からの符号化単位タイプを識別するか確認し、前記符号化単位の識別子が前記1つ以上の符号化単位タイプの第1のサブセットからの符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々を前記代替的な符号化単位タイプにし、前記符号化単位の識別子が前記符号化単位タイプの第2のサブセットからの符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々を前記符号化単位識別子によって識別される符号化単位タイプの第2のサブセットからの前記符号化単位タイプにする、よう構成されるビデオデコーダ。すなわち、nal単位タイプの各々は、識別子、第1の符号化単位タイプのサブセット及び第2の符号化単位タイプのサブセットによって示され、すなわち、nal単位タイプは、第1及び第2の符号化単位タイプの通知に従って書き換えられる。従って、マージ効率を向上させることができる。
本開示の実施例によると、各ビデオ符号化単位から、ビデオ符号化単位の各々に付された符号化単位タイプに依存した方法でビデオ符号化単位の各々に関連する領域を符号化するよう構成されるビデオデコーダ。ビデオデコーダは、代替的な符号化単位タイプがビデオ符号化タイプの第2のサブセットからとなるように構成されてもよい。ビデオデコーダは、代替的な符号化単位タイプが、ビデオ符号化タイプの第2のサブセットによって含まれない少なくとも1つのビデオ符号化タイプを含む、非VCL単位タイプなどのビデオ符号化タイプの第3のサブセットからとなるように構成されてもよい。
本開示の実施例によると、所定のビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ及び予測残差データを搬送する。ピクチャが、例えば、第1のサブセットの符号化単位タイプを有するスライスと、第2のサブセットの符号化単位タイプを有するスライスなど、1つ以上のビデオ符号化ユニットの双方を含むとき、後者のビデオ符号化単位は、代替的な符号化単位タイプに等しい符号化単位タイプを有する。代替的な符号化単位タイプは、ランダムアクセスポイント(RAP)符号化タイプである。代替的な符号化単位タイプは、ランダムアクセスポイント(RAP)符号化タイプ以外の符号化タイプである。すなわち、代替符号化単位型が特定され、同一の代替的な符号化単位タイプを有するビデオ符号化単位がマージされ、従って、マージ効率が適切に向上する。
本出願の実施例によると、所定のビデオ符号化単位の各々は、所定のビデオ符号化単位の各々が内部に存在するアクセス単位が関連付されるピクチャの異なる領域に関連付けられる。ビデオデータストリームのパラメータセット単位は、ピクチャのシーケンス、1つのピクチャ又は1つのピクチャからのスライスのセットをカバーする範囲を有する。パラメータセット単位は、ビデオデータストリームのプロファイルに固有の方法で、代替的な符号化単位タイプを示す。すなわち、スライスを効率的にマージすることができ、従って、符号化効率を向上させることができる。
本出願の実施例によると、ビデオデータストリームのパラメータセット単位は、ピクチャの順序をカバーする範囲を有するパラメータセット単位、又は、アクセス単位に関連する1つ以上のピクチャをカバーする範囲を有するアクセス単位デリミッタの何れかである。すなわち、ピクチャの順序が適切に示され、従って、レンダリングが必要とされるピクチャを効率的に復号化することができる。
本出願の実施例によると、パラメータセット単位は、ビデオデータストリームにおける代替的な符号化単位タイプを示し、所定のビデオ符号化単位が、ビデオを復号化するためのリフレッシュされたビデオシーケンスの開始点、例えば、RAPタイプとして使用されるか、すなわち、即時的復号化リフレッシュ(IDR)を含むか、又は、ビデオを復号化するためのビデオシーケンスの連続的開始点、例えば、非RAPタイプとして使用されるか、すなわち、IDRを含まないかを示す。すなわち、パラメータセット単位を用いることによって、符号化単位がビデオシーケンスの最初のピクチャであるか否かを示すことができる。
本出願の実施例によると、ビデオデータストリームからの複数のピクチャを含むビデオを、各ピクチャに関連するビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位からの各ピクチャを復号化することによって、復号化するように構成されるビデオデコーダであって、各ビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ及び予測残差データを搬送し、所定のビデオ符号化単位の各々が内部に存在するアクセス単位が関連するピクチャの異なる領域に関連付けされ、所定のビデオ符号化単位の各々から、1つ以上のシンタックス要素のn項セット、例えば、各々が2項であり、ペアが4項である2つのフラグなどから、マップ(200)を読み、例えば、当該マッピングはデフォルトで固定されてもよく、あるいは、それは、1つ以上のシンタックス要素のn項セットを、3つのバイナリ特性などの値域を1つ以上の特性のm項セットに分割することによって、データストリームにおいて通知され、従って、各々はトリプレットが8項になるように2項であり、各特性は所定のビデオ符号化単位における対応するデータと重複する方法で記述し、すなわち、特性は、所定のビデオ符号化単位が内部に存在するアクセス単位が関連付けされるピクチャに関してビデオデータストリームにビデオがどのように符号化されるかに関して、より深い符号化データを調べることから推定されてもよく(m>n)、あるいは、所定のビデオ符号化単位の各々から、各々が2項であるN=2のフラグ(N>0)などのN個のシンタックス要素(210)を読み、ビデオデータストリームから関連情報を読み、関連情報に応じて関連する特性の変数としてそれらを扱うなど、N個のシンタックス要素の各々をM個の特性の1つに関する情報と関連付けし、例えば、M=3個のバイナリ特性の各々は2項→であり、関連情報は、3個、すなわち、
Figure 2022547877000002
個の特性から2個と2つのフラグとを関連付ける3つの可能性を有し、各特性は、所定のビデオ符号化単位が内部に存在するアクセス単位が関連付けされるピクチャに関してビデオがどのようにビデオデータストリームに符号化されるかに関して所定のビデオ符号化単位における対応するデータと重複した方法で記述する(M>N)。すなわち、例えば、ビデオデータストリーム状態、すなわち、ビデオがアクセス単位におけるピクチャに関してビデオデータストリームにどのように符号化されるかが、マップ及びフラグによって示され、更なる情報を効率的に提供することができる。
本出願の実施例によると、マップは、パラメータセット単位に含まれ、マッピングされた特性の位置を示す。マップは、データストリームにおいて通知され、マッピングされた特性の位置を示す。N個のシンタックス要素が、特性の有無を示す。すなわち、フラグとマッピングとを組み合わせて、パラメータセットにおいてフラグを示すフレキシビリティがある。
本出願の実施形態によると、ビデオエンコーダは、各ピクチャを、各ピクチャに関連するビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位に各ピクチャを符号化することによって、複数のピクチャを有するビデオをビデオデータストリームに符号化し、ビデオデータストリームのパラメータセット単位における代替的な符号化単位タイプを示し、所定の各ビデオ符号化単位について、各ビデオ符号化単位の符号化単位タイプ識別子(100)をビデオデータストリームに符号化するよう構成され、符号化単位識別子は、1つ以上の符号化単位タイプの第1のサブセット(102)から、又は符号化単位タイプの第2のサブセット(104)から符号化単位タイプを識別し、符号化単位識別子が、1つ以上の符号化単位タイプの第1のサブセットから符号化単位タイプを識別する場合、所定の各ビデオ符号化単位は、代替的な符号化単位タイプに帰属されるべきであり、符号化単位識別子が、符号化単位タイプの第2のサブセットから符号化単位タイプを識別する場合、所定の各ビデオ符号化単位は、符号化単位識別子によって識別される符号化単位タイプの第2のサブセットのうちの符号化単位タイプに帰属されるべきであり、代替的な符号化単位タイプは、RAPタイプであり、ビデオエンコーダは、RAPピクチャのビデオ符号化単位を所定のビデオ符号化単位として識別し、例えば、RAPタイプを識別する非RAPピクチャの純粋にイントラ符号化されたビデオ符号化単位のための符号化単位タイプ識別子を直接符号化するよう構成される。すなわち、符号化単位タイプは、ビデオデータストリームのパラメータセット単位において示され、従って、符号化効率を向上させることができ、すなわち、各セグメントをIDRピクチャによって符号化する必要はない。
本出願の実施例によると、ビデオコンポーザは、複数のピクチャを含むビデオが符号化されたビデオデータストリームを構成し、各ピクチャは、ピクチャが分割される各タイルに対して1つ以上のビデオ符号化単位が各ピクチャに関連付けされるビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位内にあり、非RAPタイプを示すようRAPタイプを示すことから、ビデオデータストリームのパラメータセット単位における代替的な符号化単位タイプを変更し、ビデオデータストリームに符号化される識別子(100)である符号化単位タイプがRAPピクチャを識別する排他的に符号化されたビデオ符号化単位をビデオデータストリームのピクチャにおいて識別し、ビデオデータストリームの所定の各ビデオ符号化ユニットについて、符号化単位タイプであるビデオデータストリームに符号化される各ビデオ符号化単位の識別子(100)は、1つ以上の符号化単位タイプの第1のサブセット(102)から、又は符号化単位タイプの第2のサブセット(104)から符号化単位タイプを識別し、ここで、符号化単位識別子が、1つ以上の符号化単位タイプの第1のサブセットから符号化単位タイプを識別する場合、所定の各ビデオ符号化単位は、代替的な符号化単位タイプに帰属されるべきであり、符号化単位識別子が、符号化単位タイプの第2のサブセットから符号化単位タイプを識別する場合、所定の各ビデオ符号化単位は、符号化単位識別子によって識別される符号化単位タイプの第2のサブセット(104)からの符号化単位タイプに帰属されるべきである。ビデオ符号化単位のタイプは、識別子を利用することによって識別され、符号化単位タイプの第1及び第2のサブセット、及び、例えば、複数のタイルによって構成されるビデオのピクチャが効率的に構成される。
本出願の実施例によると、ビデオエンコーダは、各ピクチャに関連するビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位に各ピクチャを符号化することによって、複数のピクチャを含むビデオをビデオデータストリームに符号化し、各ビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ、及び予測残差データを搬送し、アクセス単位が関連し、所定の各ビデオ符号化単位が内部に存在するピクチャの異なる領域に関連付けされ、所定のビデオ符号化単位の各々に、1つ以上のシンタックス要素のn項セット、例えば、各々が2項である2つのフラグを示し、その結果、ペアは4項マップ(200)であり、マッピングは、デフォルトで固定されてもよいし、あるいは、それはデータストリームにおいて通知されるか、あるいは、値の範囲を分割することによって双方が通知され、1つ以上のシンタックス要素のn項セットが、1つ以上の特性のm項セットに分割され、例えば、3つのバイナリ特性の各々は、2項であり、この結果、トリプレットは8項であり、各特性は、所定のビデオ符号化単位における対応するデータと冗長な方法で記述し、すなわち、アクセス単位が関連付けされ、所定のビデオ符号化単位が内部に存在するピクチャに関してビデオがビデオデータストリームにどのように符号化されるかに関して、特性はより深い符号化データの検査から推定されてもよく、ここで、m>nであるか、又は、所定のビデオ符号化単位の各々においてN個のシンタックス要素(210)を示し、例えば、N=2のフラグの各々が2項であり(N>0)、ビデオデータストリームへの関連付け情報を示し、すなわち、関連付け情報に応じて、関連付けられた特性の変数としてそれらを関連付け、すなわち、扱い、N個のシンタックス要素の各々が、M個の特性のうちの1つに関する情報、例えば、M=3個のバイナリ特性のうちの1つに関する情報を有し、従って、各々が2項であり、2つのフラグを3つから2つに関連付けるための3つの可能性を有し、すなわち、
Figure 2022547877000003
個の特性の各々は、アクセス単位が関連付けされ、所定のビデオ符号化単位が内部に存在するピクチャに関してビデオがビデオデータストリームにどのように符号化されるかに関して、所定のビデオ符号化単位における対応するデータと冗長な方法で記述し、M>Nである。すなわち、例えば、符号化されたビデオシーケンスの各ビデオ符号化単位の特性は、フラグを利用することによって示され、従って、追加的な情報を効率的に提供することができる。
本出願の実施例によると、方法は、各ピクチャに関連するビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位から各ピクチャを復号化することによって、ビデオデータストリームから複数のピクチャを含むビデオ復号化することと、ビデオデータストリームのパラメータセット単位から代替的な符号化単位タイプを読み出すことと、所定の各ビデオ符号化単位に対して、各符号化単位から符号化単位タイプ識別子を読み出すことと、符号化単位識別子が、1つ以上の符号化単位タイプの第1のサブセットから又は符号化単位タイプの第2のサブセットから符号化単位タイプを識別するか否かを確認することと、符号化単位識別子が、1つ以上の符号化単位タイプの第1のサブセットから符号化単位タイプを識別する場合、各ビデオ符号化単位を代替的な符号化単位タイプに帰属させることと、符号化単位識別子が、符号化単位識別子によって識別される符号化単位タイプの第2のサブセットから符号化単位タイプの第2のサブセットからの符号化ユニットタイプに帰属されることと、を含む。
本出願の実施例によると、方法は、各ピクチャに関連するビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位から各ピクチャを復号化することによって、ビデオデータストリームから複数のピクチャを含むビデオを復号化することを含み、各ビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ、及び予測残差データを搬送し、アクセス単位が関連し、所定の各ビデオ符号化単位が内部に存在するピクチャの異なる領域に関連付けられ、所定の各ビデオ符号化単位から、1つ以上のシンタックス要素のn項セットを読み、例えば、2つのフラグの各々は2項であり、従って、ペアは4項であり、マッピングは、デフォルトで固定されてもよいし、あるいは、それはデータストリームにおいて通知されるか、あるいは、値の範囲を分割することによって双方が通知され、1つ以上のシンタックス要素のn項セットが、1つ以上の特性のm項セットに分割され、例えば、3つのバイナリ特性の各々は、2項であり、この結果、トリプレットは8項であり、各特性は、所定のビデオ符号化単位における対応するデータと冗長な方法で記述し、すなわち、アクセス単位が関連付けされ、所定のビデオ符号化単位が内部に存在するピクチャに関してビデオがビデオデータストリームにどのように符号化されるかに関して、特性はより深い符号化データの検査から推定されてもよく、ここで、m>nであるか、又は、所定のビデオ符号化単位の各々からN個のシンタックス要素(210)を読み、例えば、N=2のフラグの各々が2項であり(N>0)、ビデオデータストリームへの関連付け情報を示し、すなわち、関連付け情報に応じて、関連付けられた特性の変数としてそれらを関連付け、すなわち、扱い、N個のシンタックス要素の各々が、M個の特性のうちの1つに関する情報、例えば、M=3個のバイナリ特性のうちの1つに関する情報を有し、従って、各々が2項であり、2つのフラグを3つから2つに関連付けるための3つの可能性を有し、すなわち、
Figure 2022547877000004
個の特性の各々は、アクセス単位が関連付けされ、所定のビデオ符号化単位が内部に存在するピクチャに関してビデオがビデオデータストリームにどのように符号化されるかに関して、所定のビデオ符号化単位における対応するデータと冗長な方法で記述し、M>Nである。
本出願の実施例によると、方法は、各ピクチャに関連するビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位に各ピクチャを符号化することによって、複数のピクチャを含むビデオをビデオデータストリームに符号化することと、ビデオデータストリームのパラメータセット単位内の代替的な符号化単位タイプを示すことと、所定の各ビデオ符号化単位に対して、各符号化単位タイプ識別子(100)を定義することと、を含み、符号化単位識別子は、1つ以上の符号化単位タイプの第1のサブセット(102)から、又は、符号化単位タイプの第2のサブセット(104)から符号化単位タイプを識別し、符号化単位識別子が、1つ以上の符号化単位タイプの第1のサブセットから符号化単位タイプを識別する場合、各ビデオ符号化単位を符号化単位タイプに帰属させ、符号化単位識別子が、符号化単位タイプの第2のサブセットから符号化単位タイプを識別する場合、符号化ユニット識別子によって識別される符号化単位タイプの第2のサブセットからの符号化単位タイプに各ビデオ符号化単位を帰属させる。
本願の実施例によると、方法は、複数のピクチャを含むビデオが符号化されたビデオデータストリームを構成し、各ピクチャは、ピクチャが分割される各タイルに対して1つ以上の符号化単位が各ピクチャに関連付けされるビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位にあり、非RAPタイプを示すためRAPタイプを示すことから、ビデオデータストリームのパラメータセット単位における代替的な符号化単位タイプを変更し、ビデオデータストリームに符号化される識別子(100)である符号化単位タイプがRAPピクチャを識別する排他的に符号化されたビデオ符号化単位をビデオデータストリームのピクチャにおいて識別し、ビデオデータストリームの所定の各ビデオ符号化単位について、ビデオデータストリームに符号化された各ビデオ符号化単位の識別子(100)は、1つ以上の符号化単位タイプの第1のサブセット(102)から、又は、符号化単位タイプの第2のサブセット(104)から符号化単位タイプを識別し、符号化単位識別子が、1つ以上の符号化単位タイプの第1のサブセットから符号化単位タイプを識別する場合、所定の各ビデオ符号化単位は、代替的な符号化単位タイプに帰属されるべきであり、符号化単位識別子が、符号化単位タイプの第2のサブセットから符号化単位タイプを識別する場合、所定の各ビデオ符号化単位は、符号化単位識別子によって識別される符号化単位タイプの第2のサブセットからの符号化単位タイプに帰属されるべきである。
本出願の実施例によると、方法は、各ピクチャに関連するビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位に各ピクチャを符号化することによって、複数のピクチャを含むビデオをビデオデータストリームに符号化することを含み、各ビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ、及び予測残差データを搬送し、アクセス単位が関連し、所定の各ビデオ符号化単位が内部に存在するピクチャの異なる領域に関連付けられ、所定の各ビデオ符号化単位に1つ以上のシンタックス要素のn項セットを示し、例えば、2つのフラグの各々は2項であり、従って、ペアは4項であり、マッピング(200)は、デフォルトで固定されてもよいし、あるいは、それはデータストリームにおいて通知されるか、あるいは、値の範囲を分割することによって双方が通知され、1つ以上のシンタックス要素のn項セットが、1つ以上の特性のm項セット(20)に分割され、例えば、3つのバイナリ特性の各々は、2項であり、この結果、トリプレットは8項であり、各特性は、所定のビデオ符号化単位における対応するデータと冗長な方法で記述し、すなわち、アクセス単位が関連付けされ、所定のビデオ符号化単位が内部に存在するピクチャに関してビデオがビデオデータストリームにどのように符号化されるかに関して、特性はより深い符号化データの検査から推定されてもよく、ここで、m>nであるか、又は、所定のビデオ符号化単位の各々からN個のシンタックス要素(210)を読み、例えば、N=2のフラグの各々が2項であり(N>0)、ビデオデータストリームへの関連付け情報を示し、すなわち、関連付け情報に応じて、関連付けられた特性の変数としてそれらを関連付け、すなわち、扱い、N個のシンタックス要素の各々が、M個の特性のうちの1つに関する情報、例えば、M=3個のバイナリ特性のうちの1つに関する情報を有し、従って、各々が2項であり、2つのフラグを3つから2つに関連付けるための3つの可能性を有し、すなわち、
Figure 2022547877000005
個の特性の各々は、アクセス単位が関連付けされ、所定のビデオ符号化単位が内部に存在するピクチャに関してビデオがビデオデータストリームにどのように符号化されるかに関して、所定のビデオ符号化単位における対応するデータと冗長な方法で記述し、M>Nである。
本出願の好適な実施例が、図面に関連して以下で説明される。
以下の図に与えられる実施例が効果的に利用されうる具体例として仮想現実アプリケーションのためのクライアントおよびサーバのシステムを示す概略図を示す。 図1のシステムに適合されうる6×4のタイルにタイリングされる2つの解像度のキューブマッププロジェクションにおける360度のビデオの具体例を示す概略図を示す。 図2に示されるような360度のビデオストリーミングのためのユーザ視点及びタイル選択の具体例を示す概略図を示す。 マージング処理後のジョイントビットストリームにおける図3に示される取得されるタイルの配置(パッキング)の具体例を示す概略図を示す。 360度のビデオストリーミングのための単一のタイルとしての低解像度フォールバックによるタイリングの具体例を示す概略図を示す。 タイルベースストリーミングにおけるタイル選択の具体例を示す概略図を示す。 タイル毎の不均一なRAP(Random Access Point)期間によるタイルベースストリーミングにおけるタイル選択の他の具体例を示す概略図を示す。 本出願の実施例によるNAL(Network Adaptive Layer)ユニットヘッダの具体例を示す概略図を示す。 本出願の実施例によるNAL単位に含まれるRBSP(Row Byte Sequence Payload)データ構造のタイプを示すテーブルの具体例を示す。 本出願の実施例によるNAL単位タイプがマッピングされることを示すシーケンスパラメータセットの具体例を示す概略図を示す。 スライスヘッダに示されるスライスの特性の具体例を示す概略図を示す。 本出願の実施例によるシーケンスパラメータセットにおけるスライスの特性を示すマップの具体例を示す概略図を示す。 本出願の実施例による図12のシーケンスパラメータセットにおいてマップによって示される特性の具体例を示す概略図を示す。 本出願の実施例によるシンタックス構造を利用することによって示される関連付け情報の具体例を示す概略図を示す。 本出願の実施例によるシーケンスパラメータセットにおけるスライスの特性を示すマップの他の具体例を示す概略図を示す。 本出願の実施例による図15のパラメータセットにおいてマップによって示される特性の他の具体例を示す概略図を示す。 本出願の実施例によるスライスセグメントヘッダにおけるスライスの特性を示すマップの更なる具体例を示す概略図を示す。 本出願の実施例による図17のスライスセグメントヘッダにおいてマップによって示される特性の更なる具体例を示す概略図を示す。
以下の説明では、等しい又は等価な機能を有する等しい又は等価な要素は、等しい又は等価な参照番号によって示される。
以下の説明において、本出願の実施例のより完全な説明を提供するため、複数の詳細が記載される。しかしながら、本出願の実施例は、これらの具体的な詳細なしに実施されうることは、当業者に明らかであろう。他の例では、周知の構造及びデバイスは、本出願の実施例を曖昧にすることを避けるため、詳細にではなくブロック図形式により示される。また、以下に示す実施例の特徴は、特に断らない限り、互いに組み合わされてもよい。
序論
以下において、ここに説明される個別の態様は、個別に又は組み合わせて使用されうることに留意されたい。従って、詳細は、当該態様の他の1つに詳細を追加することなく、個別の態様の各々に追加することができる。
本開示は、ビデオデコーダ(符号化された表現に基づいてビデオ信号の復号化された表現を提供するための装置)において使用可能な特徴を明示的又は暗黙的に説明することにまた留意されたい。従って、ここに説明される特徴の何れもビデオデコーダのコンテクストにおいて利用可能である。
さらに、方法に関連してここで開示される特徴及び機能はまた、(そのような機能を実行するように構成された)装置において利用可能である。さらに、装置に関してここに開示される何れかの特徴及び機能はまた、対応する方法において利用可能である。言い換えれば、ここに開示される方法は、装置に関して説明される特徴及び機能の何れかによって補足されうる。
本出願の各種態様に関する本出願の実施例の説明の理解を容易にするため、図1は、本出願の後述される実施例が適用され、効果的に利用されうる環境の一例を示す。特に、図1は、適応ストリーミングを介してやりとりするクライアント10及びサーバ20から構成されるシステムを示す。例えば、クライアント10とサーバ20との間の通信22に対してHTTPを介したダイナミックアダプティブストリーミング(DASH)が、利用されてもよい。しかしながら、以降において概説される実施例は、DASHの使用に限定されるものとして解釈されるべきではなく、同様に、メディアプレゼンテーション記述(MPD)のような用語が、DASHとは異なって定義されるマニフェストファイルも含むよう広義であると理解されるべきである。
図1は、仮想現実アプリケーションを実現するよう構成されるシステムを示す。すなわち、システムは、ヘッドアップディスプレイ24を装着したユーザに、すなわち、ヘッドアップディスプレイ24の内部ディスプレイ26を介し、ヘッドアップディスプレイ24の慣性センサのような内部の方位センサ32によって例示的に測定されるヘッドアップディスプレイ24の向きに対応する部分28である時間的に変化する空間シーン30からのビュー部分28を提示するよう構成される。すなわち、ユーザに提示される部分28は、ヘッドアップディスプレイ24の向きに対応する空間位置の空間シーン30の部分を形成する。図1のケースでは、時間的に変化する空間シーン30は、全方向性ビデオ又は球面ビデオとして描かれているが、図1の説明及び後述する実施例は、フェースアクセス又はアイアクセスと仮想又は現実のプロジェクタウォールなどとの交点によって決定される部分28の空間位置を有するビデオからの部分を提示するなど、他の例にも容易に移行可能である。さらに、センサ32及びディスプレイ26は、例えば、それぞれ、リモコン及び対応するテレビジョンなどの異なるデバイスによって構成されてもよく、又は、それらは、タブレット又は携帯電話機などのモバイルデバイスなどの携帯デバイスの一部であってもよい。最後に、後述する実施例の一部は、ユーザに提示される領域28が時間的に変化する空間シーンを提示する際に、例えば、空間シーンにわたる質の不均等な分布に関連する不均一性を伴って、時間的に変化する空間シーン30全体を常にカバーするシナリオにも適用されうることに留意されたい。
サーバ20、クライアント10及びサーバ20において空間コンテンツ30が提供される方法に関する更なる詳細が、図1に示され、以下に説明される。しかしながら、これらの詳細はまた、後述する実施例を限定するものとして扱われるべきではなく、むしろ、後述する実施例の何れかを実施する方法の具体例として役立つべきである。
特に、図1に示すように、サーバ20は、適切にプログラムされたコンピュータ、特定用途向け集積回路などのコントローラ36などのストレージ34及びコントローラ36を備えてもよい。ストレージ34は、時間的に変化する空間シーン30を表すメディア部分が記憶される。具体例は、図1の図に関して以下により詳細に概説される。コントローラ36は、クライアント10が要求したメディア部分にメディアプレゼンテーション記述を再送信することによってクライアント10によって送信されたリクエストに応答し、クライアント10にそれ自体の更なる情報を送信してもよい。この点に関する詳細が以下に説明される。コントローラ36は、要求されたメディア部分をストレージ34からフェッチしてもよい。このストレージ内において、メディアプレゼンテーション記述又はその一部などの他の情報が、サーバ20からクライアント10に送られる他の信号に格納されてもよい。
図1に示されるように、サーバ20は、後者からの要求に応答してサーバ20からクライアント10に送られるメディア部分を修正するストリーム修正装置38を任意選択的に更に含んでもよく、これにより、例えば、クライアント10によってこのように検索されたメディア部分が、実際にはいくつかのメディアストリームから集約されるが、1つの関連するデコーダによって復号化可能な1つの単一のメディアストリームを形成するメディアデータストリームをクライアント10において生じさせる。しかしながら、このようなストリーム修正装置38の存在は任意である。
図1のクライアント10は、クライアントデバイス又はコントローラ40又はより多くのデコーダ42及びリプロジェクタ44を含むものとして例示的に示される。クライアントデバイス40は、適切にプログラムされたコンピュータ、マイクロプロセッサ、FPGAなどのプログラムされたハードウエアデバイス、又はアプリケーション特有集積回路などであってもよい。クライアントデバイス40は、サーバ20において提供される複数の46のメディア部分のうちサーバ20から抽出される部分を選択するための責任を想定する。このため、クライアントデバイス40は、最初にサーバ20からマニフェスト又はメディアプレゼンテーション説明を抽出する。同じものから、クライアントデバイス40は、空間シーン30の特定の必要とされる空間部分に対応する複数のメディア部分46からメディア部分のアドレスを計算するための計算ルールを取得する。このようにして選択されたメディア部分は、各リクエストをサーバ20に送ることによって、クライアントデバイス40によってサーバ20から抽出される。これらのリクエストは、計算されたアドレスを含む。
このようにしてクライエントデバイス40によって抽出されたメディア部分は、復号化のため後者によって1つ以上のデコーダ42に転送される。図1の例では、このように抽出及び復号化されたメディア部分は、時間的な各時間単位に対して、時間的に変化する空間シーン30からの空間部分48のみを表すが、既に上述したように、これは、例えば、提示されるビュー部分28がシーン全体を常にカバーする他の態様に従って異なってもよい。リプロジェクタ44は、任意選択的には、選択、抽出及び復号化されたメディア部分の抽出及び復号化されたシーンコンテンツから、ユーザに表示されるビュー部分28を再投影及び切り出してもよい。このため、図1に示すように、クライアントデバイス40は、例えば、センサ32からのユーザ方位データに応答してビュー部分28の空間位置を連続的に追跡及び更新し、例えば、シーン部分28の当該現在の空間位置と、ビュー部分28を形成する領域にマッピングされるように、抽出及び復号化されたメディアコンテンツに適用される再投影マッピングとをリプロジェクタ44に通知してもよい。これに応じて、リプロジェクタ44は、例えば、ディスプレイ26上に表示されるように、正規のピクセルグリッド上へのマッピング及び補間を適用してもよい。
図1は、空間シーン30をタイル50上にマッピングするため立方体マッピングが使用されたケースを示す。従って、タイルは、球体の形式を有するシーン30が投影された立方体の矩形のサブ領域として描かれる。リプロジェクタ44は、この投影を逆にする。しかしながら、他の例も同様に適用されうる。例えば、立方投影の代わりに、トランケートされたピラミッド又はトランケーションなしのピラミッドへの投影が、利用されてもよい。さらに、図1のタイルは、空間シーン30のカバレッジに関してオーバラップしないものとして示されるが、タイルへの分割は、相互的なタイルオーバラップを含みうる。また、以下でより詳細に概説するように、後述される1つの表現を形成する各タイルによるシーン30のタイル50への空間的な分割はまた、必須ではない。
従って、図1に描かれるように、空間シーン30全体は、タイル50に空間的に細分化される。図1の例では、立方体の6つの面の各々が、4つのタイルに細分される。例示の目的のため、タイルが列挙されている。各タイル50に対して、サーバ20は、図1に示すようなビデオ52を提供する。より正確には、サーバ20は、タイル50毎に複数のビデオ52を提供し、これらのビデオは品質Q#が異なる。さらに、ビデオ52は、時間セグメント54に時間的に細分される。全てのタイルT#の全てのビデオ52の時間セグメント54は、サーバ20のストレージ34に記憶された複数のメディア部分46の1つを形成するか、又はそれぞれ符号化される。
図1に示されるタイルベースのストリーミングの具体例でさえ、多くの変形例が可能な具体例を単に形成することが再び強調される。例えば、図1は、より高品質のシーン30の表現に関連するメディア部分が、品質Q1によりシーン30が符号化されるメディア部分が属するタイルに一致するタイルに関連することを示唆しているように思われるが、この一致は必ずしも必要ではなく、異なる品質のタイルがシーン30の異なるプロジェクションのタイルに対応することもある。さらに、これまで論じられていないが、図1に描かれた異なる品質レベルに対応するメディア部分は、空間分解能、信号対雑音比及び/又は時間分解能などにおいて異なってもよい。
最後に、サーバ20からデバイス40によって個々に抽出されうるメディア部分が、シーン30が空間的に細分されるタイル50に関連するタイルベースのストリーミングコンセプトとは異なって、サーバ20において提供されるメディア部分は、あるいは、例えば、それぞれが空間的に変化するサンプリング解像度によって空間的に完全な方法でそこに符号化されたシーン30を有するが、シーン30における異なる空間位置での最大限のサンプリング解像度を有することもある。例えば、これは、サーバ20においてトランケートされたピラミッド上へのシーン30の投影に関連するセグメント54のシーケンスを提供することによって達成することができ、トランケートされたピラミッドの先端は、相互に異なる方向に向けられ、それによって、異なる方向に向けられた解像度ピークにつながる。
さらに、任意選択的に現在のストリーム修正装置38に関して、クライアント10とサーバ20がここに記載された信号をやり取りするネットワークデバイス内において、同じものがクライアント10の一部とすることもできるし、同じものがその間に配置されてもよいことに留意されたい。
複数の符号化されたビデオビットストリームがジョイント復号化される、すなわち、ジョイントビットストリームにマージされ、以下のように単一のデコーダに供給される特定のビデオベースのアプリケーションが存在する。
・マルチパーティカンファレンス:複数の参加者からの符号化されたビデオストリームが単一のエンドポイント上で処理される。
・又は、タイルベースストリーミング:例えば、VRアプリケーションにおける360度のタイル化されたビデオ再生
後者では、360度のビデオが空間的にセグメント化され、各空間部分が、図2に示すように、様々な空間解像度の複数の表現でストリーミングクライアントに提供される。図2(a)は高解像度タイルを示し、図2(b)は低解像度タイルを示す。図2、すなわち、図2(a)及び(b)は、2つの解像度で6×4の空間部分に分割された360度のビデオを投影したキューブマップを示す。簡単化のため、これらの独立した復号化可能な空間部分は、本明細書ではタイルと呼ばれる。
ユーザは、典型的には、図3(a)に示すように、最新技術のヘッドマウントディスプレイを使用するとき、90×90度の視野を表すソリッドビューポート境界80を介し360度のビデオ全体を構成するタイルのサブセットのみを見る。対応するタイルは、図3(b)の参照番号82によって示され、最高解像度でダウンロードされる。
しかしながら、クライアントアプリケーションはまた、ユーザの突然の向きの変更に対処するため、図3(c)の参照番号84によって示される現在のビューポートの外側の他のタイルの表現をダウンロード及び復号化しなければならない。従って、このようなアプリケーションのクライアントは、図3(c)に示すように、最高解像度の現在のビューポートをカバーするタイルと、比較的低解像度の現在のビューポートの外側のタイルとをダウンロードする一方、タイル解像度の選択はユーザの向きに常に適応される。クライアントサイドでのダウンロードの後、ダウンロードされたタイルを単一のデコーダによって処理される単一のビットストリームにマージすることは、限られた計算及び電力リソースを有する典型的なモバイルデバイスの制約に対処する手段である。図4は、上記の例のためのジョイントビットストリームにおける可能なタイル配置を示す。ジョイントビットストリームを生成するためのマージ処理は、圧縮領域処理、すなわち、符号変換によるピクセル領域上の処理を回避することによって実行される必要がある。
図4からの例は、全てのタイル(高解像度及び低解像度)が360度空間全体をカバーし、何れのタイルも同じ領域を繰り返しカバーしないケースを示しているが、図5に示すように、別のタイルグループ化もまた利用可能である。それは、図5(b)に示すように、ビデオの低解像度部分全体を“低解像度フォールバック”レイヤとして定義し、これは、360度ビデオのサブセットをカバーする図5(a)の高解像度タイルとマージすることができる。低解像度フォールバックビデオ全体は、図5(c)に示すように単一のタイルとして符号化することができ、一方、高解像度タイルは、レンダリング処理の最終段階におけるビデオの低解像度部分のオーバレイとしてレンダリングされる。
クライアントは、図6に示すように、所望される全てのタイルトラックをダウンロードすることによって、ユーザのタイル選択に従ってストリーミングセッションを開始し、ここで、クライアントは、図6(a)の参照番号90によって示されるタイル0と、参照番号92によって示されるタイル1とのセッションを開始する。ビューポートの変更がおこなわれる(すなわち、ユーザが頭を回転させて他の方向を見る)ときはいつでも、タイル選択は、次に行われる時間部分、すなわち、図6(a)の参照番号94によって示されるタイル0及びタイル2において変更され、次に利用可能なセグメントにおいて、クライアントは、図6(b)に示されるように、タイル2の位置を変更し、タイル0をタイル1に置き換える。全てのセグメントは、IDR(Instantaneous Decoder Refresh)ピクチャ、すなわち、予測チェーンリセットピクチャから開始される必要があり、新たなタイル選択及びタイルの位置変化について、そうでなければ、予測ミスマッチ、アーチファクト及びドリフトを引き起こすことに留意することが重要である。
各部分をIDRピクチャによって符号化することは、ビットレートの点でコストがかかる。部分は、潜在的に、例えば、向き変更に迅速に反応するため、持続時間が非常に短い可能性があり、これは、図7に示されるように、変化するIDR(又はRAP:ランダムアクセスポイント)期間を用いて複数の変形例を符号化することが望ましい理由である。例えば、図7(b)に示すように、時刻tでは、タイル0はすでに時刻tのためにダウンロードされており、サーバで入手可能なRAPから始まらない部分をクライアントが選択できるのと同じ位置に配置されているため、タイル0の予測チェーンを破る理由はない。
しかしながら、残りの1つの問題は、符号化されたピクチャ内のスライス(タイル)が特定の制約に従うことである。そのうちの1つは、ピクチャが、RAP及び非RAP NAL単位タイプのNAL(Network Abstract Layer)単位を同時に含まないかもしれないことである。従って、アプリケーションでは、上記の問題に対処するために、あまり望ましくない2つのオプションしか存在しない。第1に、クライアントは、非RAP NAL単位とピクチャにマージされる際、RAPピクチャのNAL単位タイプを書き換えることができる。第2に、サーバは、最初から非RAPを使用することによって、これらのピクチャのRAP特性を不明瞭にすることができる。しかしながら、これは、例えば、ファイルフォーマットパッケージングのため、これら符号化されたビデオを処理すべきシステムにおけるRAP特性の検出を妨げる。
本発明は、容易に書き換え可能なシンタックス構造を介して1つのNAL単位タイプを別のNAL単位タイプにマッピングすることを可能にするNAL単位タイプのマッピングである。
本発明の一実施例では、NAL単位タイプは、マッピング可能として指定され、マッピングされたタイプは、例えば、ハイライトされた編集を伴うVVC(Versatile Video Coding)仕様のドラフト6 V14に基づいて、以下のように、パラメータセットにおいて指定される。
図8は、NAL単位ヘッダシンタックスを示す。シンタックスnal_unit_type、すなわち、識別子100は、NAL単位タイプ、すなわち、図9に示されるテーブルに指定されるようなNAL単位に含まれるRBSP(Row Byte Sequence Payload)データ構造のタイプを指定する。
変数NalUnitTypeは、以下のように定義される。
Figure 2022547877000006
仕様におけるシンタックス要素nal_unit_typeの全ての参照は、以下の制約と同様に、変数NalUnitTypeの参照と置換される。
NalUnitTypeの値は、ピクチャの全ての符号化されたスライスNAL単位について同じである。ピクチャ又はレイヤアクセス単位は、ピクチャ又はレイヤアクセス単位の符号化されたスライスNAL単位と同じNAL単位タイプを有するものとして参照される。すなわち、図9に示されるように、符号化単位タイプ102の第1のサブセットは、“nal_unit_type”12、すなわち、“MAP_NUT”及び“VCL”をNAL単位タイプクラスとして示す。従って、符号化単位タイプの第2のサブセット104は、NAL単位タイプクラスとして“VCL”を示し、すなわち、識別子100の数0~15によって示されるピクチャの全ての符号化スライスNAL単位は、符号化単位タイプの第1のサブセット102、すなわち、VCLの符号化単位タイプの同じNAL単位タイプクラスを有する。
図10は、参照符号106によって示されるようなmapped_nutを含むシーケンスパラメータセットRBSPシンタックスを示し、これは、nal_unit_typeがMAP_NUTに等しいNALユニットのNalUnitTypeを示す。
他の実施例では、mapped_nutシンタックス要素は、アクセス単位デリミタAUDにおいて搬送される。
他の実施例では、mapped_nutの値はVCL NAL単位タイプでなければならないことは、ビットストリーム適合性の要件である。
他の実施例では、nal_unit_typeがMAP_NUTに等しいNAL単位のNalUnitTypeのマッピングは、プロファイリング情報によって実行される。このようなメカニズムは、単一のMAP_NUTを有する代わりにマッピング可能なNAL単位タイプ以上を有することを可能にし、シンプルなプロファイリングメカニズム又は単一のシンタックス要素mapped_nut_space_idc内においてマッピング可能なNAL単位のNALUnitTypesの必要とされる解釈を示すことができる。
他の実施例では、マッピングメカニズムは、現在32に制限されているNAL単位タイプの値域を拡張するため使用される(例えば、図10に示されるように、それはu(5)であるため)。マッピングメカニズムは、必要とされるNAL単位タイプの数が、マッピング可能なNAL単位のために予約された値の数を超えない限り、何れか制限のない値を示すことができる。
一実施例では、ピクチャが代替的な符号化単位タイプのスライスと、通常の符号化単位タイプのスライス(例えば、VCLカテゴリの既存のNAL単位)とを同時に含むとき、マッピングは、効果的に同じ符号化単位タイプ特性を有するピクチャの全てのスライスを生じさせるように実行され、すなわち、代替的な符号化単位タイプは、通常の符号化タイプの非代替的なスライスの符号化単位タイプに等しい。さらに、上記の実施例は、ランダムアクセス性質を有するピクチャ、又はランダムアクセス性質を有さないピクチャにのみ成り立つ。
マージシナリオにおけるNAL単位タイプ及びNAL単位タイプの拡張性及び対応する解決策に関する説明された問題に加えて、on-the-fly-適応化など、ビデオに関連する情報及びビデオがどのように符号化されたかが、システム統合及び送信又は操作のために必要とされる、いくつかのビデオアプリケーションが存在する。
産業において広く利用され、明確に指定される直近数年以内に確定されたいくつかの共通の情報があり、特定のビット値がそのような目的のために利用される。その具体例は、
・NAL単位ヘッダにおける一時的なID
・IDR、CRA、TRAIL、・・・又はSPS(Sequence Parameter Set)、PPS(Picture Parameter Set)などを含むNAL単位タイプ
である。
しかしながら、追加的な情報が役に立ちうるいくつかのシナリオがある。広く使用されていないが、いくつかのケースでは、例えば、BLA、サブピクチャ用の部分RAP NAL単位、サブレイヤ非参照NAL単位など、いくつかの有用性が見出されている。上述の拡張性メカニズムが使用される場合、これらのNAL単位タイプのいくつかが実現可能である。しかしながら、別の方法として、スライスヘッダ内の一部のフィールドを使用することもできる。
従来、追加的な情報が、スライスの特定の特性の通知のために利用されるスライスヘッダにおいて確保されている。
・破棄可能なフラグ:符号化されたピクチャがインター予測のためのリファレンスピクチャとして利用され、レイヤ間予測のためのソースピクチャとして利用されないことを示す。
・cross_layer_bla_flag:階層化符号化のための出力ピクチャの導出に影響を及ぼし、上位レイヤにおいてRAPに先行するピクチャが出力されない可能性がある。
近い将来のビデオコーデック規格に対して、同様のメカニズムが想定される可能性がある。しかしながら、これらのメカニズムの1つの制約は、定義されたフラグがスライスヘッダ内の特定の位置を占有することである。以下において、HEVCにおけるこれらのフラグの利用が図11に示される。
上述したように、このような解決策の問題は、余分なスライスヘッダビットの位置が段階的に割り当てられ、より稀な情報を利用するアプリケーションに対して、おそらくフラグが後の位置に来て、余分なビット(例えば、HEVCの場合、“discardable_flag”と“cross_layer_bla_flag”)で送信される必要があるビット数が増えるだろう。
あるいは、NAL単位タイプのために説明された同様のメカニズムに従って、スライスヘッダの余分なスライスヘッダビットにおけるフラグのマッピングが、パラメータセットにおいて定義することができる。一例が図12として示される。
図12は、“extra_slice_header_bits_mapping_space_idc”を利用する関連付け情報を示すマップ、すなわち、スライスヘッダの余分なビットのためのマッピング空間を示す参照符号200によって示されるマップを含むシーケンスパラメータセットの一例を示す。
図13は、図12の“extra_slice_header_bits_mapping_space_idc”200によって示されるフラグに対するビットのマッピングを示す。図13に示すように、バイナリ特性202は、所定のビデオ符号化単位における対応するデータと冗長で記述する。図13において、3つのバイナリ特性202、すなわち、“0”、“1”及び“2”が示される。バイナリ特性の数は、フラグの数に応じて可変である。
他の実施例では、当該マッピングは、(例えば、図11に示されるように)スライスヘッダにおける余分なビット内のシンタックス要素の有無を示すシンタックス構造(例えば、図14に示される)において実行される。すなわち、例えば、図11に示されるように、存在フラグ上の条件は、スライスヘッダ内の追加ビットにおけるシンタックス要素、すなわち、“num_extra_slice_header_bits>i”及びおよび“i<num_extra_slice_header_bits i++”の存在を制御する。図11において、上述したように、追加ビット内の各シンタックス要素がスライスヘッダ内の特定の位置に配置されるが、本実施例では、シンタックス要素、例えば、“discardable_flag”、“cross_layer_bla_flag”又は“slice_reserved_flag[i]”が特定の位置を占有することは不要である。代わりに、特定の存在フラグ(例えば、図14における“discardable_flag_present_flag”)の値に関する条件をチェックする際、第1のシンタックス要素(例えば、図11における“discardable_flag”)が存在しないことが示されるとき、以下の第2のシンタックス要素は、存在するとき、スライスヘッダにおける第1のシンタックス要素の位置を取る。また、追加ビットにおけるシンタックス要素は、フラグを示すことによって、例えば、“sps_extra_ph_bit_present_flag[i]”を示すことによって、ピクチャヘッダに存在しうる。また、シンタックス構造、例えば、複数のシンタックス要素、すなわち、提示されたフラグの数は、特定の特性の存在/有無、又は追加ビットにおける提示されたシンタックス要素の数を示す。すなわち、追加ビットにおける提示された特定の特性又はシンタックス要素の数は、提示されたシンタックス要素(フラグ)の数を数えることによって示される。図14において、各シンタックス要素の存在がフラグ210によって示される。すなわち、210における各フラグは、所定のビデオ符号化単位の特定の特性に対するスライスヘッダ指示の存在を示す。さらに、図14に示され、図11のスライスヘッダにおける“slice_reserved_flag[i]”シンタックス要素に対応する更なるシンタックス“[...]//追加フラグ”が、追加ビット内のシンタックス要素の存在/有無を示すプレースホルダとして使用されるか、又は追加フラグの存在/有無の指示として使用される。
他の実施例では、フラグタイプマッピングは、例えば、図15に示すように、パラメータセットにおけるエキストラスライスヘッダビット毎に通知される。図15に示すように、シンタックス“extra_slice_header_bit_mapping_idc”、すなわち、マップ200は、シーケンスパラメータセットにおいて通知され、マッピングされた特性の位置を示す。
図16は、図15の“extra_slice_header_bits_mapping_space_idc”によって示されるフラグに対するビットのマッピングを示す。すなわち、図15に示すマップ200に対応するバイナリ特性202が、図16に示される。
他の実施例では、スライスヘッダ拡張ビットは、例えば、図17に示すように、特定のフラグ値の組み合せを表すidcシグナリングによって置き換えられる。図17に示されるように、マップ200、すなわち、“extra_slice_header_bit_idc”は、スライスセグメントヘッダに示され、すなわち、マップ200は、図18に示されるような特性の存在を示す。
図18は、“extra_slice_header_bit_idc”の特定の値によって表されるフラグ値、すなわち、バイナリ特性202が、パラメータセットにおいて通知されるか、あるいは、仕様(事前に知られる)において予め規定されるかのいずれかであることを示す。
一実施例では、“extra_slice_header_bit_idc”の値の空間、すなわち、マップ200の値の空間は、2つの範囲に分割される。1つの範囲は、事前に知られているフラグ値の組み合わせを表し、1つの範囲は、パラメータセットにおいて通知されるフラグ値の組み合わせを表す。
いくつかの態様が装置のコンテクストにおいて説明されたが、これらの態様は、対応する方法の説明もまた表し、ブロック又はデバイスは、方法ステップ又は方法ステップの特徴に対応することは明らかである。同様に、方法ステップのコンテクストにおいて説明される態様は、対応する装置の対応するブロック、アイテム又は特徴の説明もまた表す。方法ステップの一部又は全ては、例えば、マイクロプロセッサ、プログラマブルコンピュータ又は電子回路などのハードウェア装置によって(又は使用して)実行されてもよい。いくつかの実施例では、最も重要な方法ステップの1つ以上が、そのような装置によって実行されてもよい。
本発明のデータストリームは、デジタル記憶媒体に記憶されてもよいし、あるいは、無線伝送媒体又はインターネットのような有線伝送媒体などの伝送媒体上で伝送することができる。
特定の実装要求に応じて、本出願の実施例は、ハードウェア又はソフトウェアにより実現可能である。当該実現は、それぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する(又は協働することができる)電子的に読み取り可能な制御信号が記憶された、例えば、フロッピーディスク(登録商標)、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROM又はフラッシュメモリなどのデジタル記憶媒体を利用して実行可能である。従って、デジタル記憶媒体は、コンピュータ読み取り可能であってもよい。
本発明によるいくつかの実施例は、ここに説明される方法の1つが実行されるように、プログラマブルコンピュータシステムと協働することができる、電子的に読み取り可能な制御信号を有するデータキャリアを備える。
一般に、本出願の実施例は、プログラムコードを有するコンピュータプログラムプロダクトとして実現可能であり、プログラムコードは、コンピュータプログラムプロダクトがコンピュータ上で実行されるときに方法の1つを実行するように動作可能である。プログラムコードは、例えば、機械可読キャリア上に記憶されてもよい。
他の実施例は、機械可読キャリアに記憶された、ここに記載された方法の1つを実行するためのコンピュータプログラムを含む。
言い換えれば、本発明の方法の実施例は、従って、コンピュータプログラムがコンピュータ上で実行されるときに、ここに説明される方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
従って、本発明の方法の更なる実施例は、ここに説明される方法の1つを実行するためのコンピュータプログラムをその上に記録して備えるデータキャリア(又はデジタル記憶媒体又はコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体又は記録された媒体は、典型的には、有形及び/又は非一時的である。
従って、本発明の方法の更なる実施例は、ここに記載される方法の1つを実行するためのコンピュータプログラムを表すデータストリーム又は信号系列である。データストリーム又は信号系列は、例えば、インターネットなどのデータ通信接続を介して転送されるように構成されてもよい。
更なる実施例は、ここに記載された方法の1つを実行するように構成又は適応された、例えば、コンピュータ又はプログラマブル論理デバイスなどの処理手段を備える。
更なる実施例は、ここに記載された方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
本発明のよる更なる実施例は、ここに記載された方法の1つを実行するためのコンピュータプログラムを受信機に(例えば、電子的又は光学的に)伝達するよう構成された装置又はシステムを含む。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであってもよい。装置又はシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを含むことができる。
いくつかの実施例では、プログラマブル論理デバイス(例えば、フィールドプログラマブルゲートアレイ)が、ここに説明される方法の機能の一部又は全てを実行するため利用されてもよい。いくつかの実施例では、フィールドプログラマブルゲートアレイは、ここに説明される方法の1つを実行するため、マイクロプロセッサと連携してもよい。一般に、方法は、好ましくは、任意のハードウェア装置によって実行される。
ここに説明される装置は、ハードウェア装置を使用して、コンピュータを使用して、又はハードウェア装置とコンピュータとの組み合せを使用して実現されてもよい。
ここに説明される装置又はここに説明される装置の何れかのコンポーネントは、ハードウェア及び/又はソフトウェアで少なくとも部分的に実現されてもよい。

Claims (28)

  1. ビデオデータストリームからの複数のピクチャを含むビデオを、前記ピクチャの各々に関連する前記ビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位からの各ピクチャを復号化することによって、復号化し、
    前記ビデオデータストリームのパラメータセット単位から代替的な符号化単位タイプを読み、
    所定の各ビデオ符号化単位に対して、
    前記ビデオ符号化単位の各々から符号化単位タイプ識別子(100)を読み、
    前記符号化単位の識別子が1つ以上の符号化単位タイプの第1のサブセット(102)又は符号化単位タイプの第2のサブセット(104)からの符号化単位タイプを識別するか確認し、
    前記符号化単位の識別子が前記1つ以上の符号化単位タイプの第1のサブセットからの符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々を前記代替的な符号化単位タイプにし、
    前記符号化単位の識別子が前記符号化単位タイプの第2のサブセットからの符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々を前記符号化単位識別子によって識別される符号化単位タイプの第2のサブセットからの前記符号化単位タイプにする、
    よう構成されるビデオデコーダ。
  2. 各ビデオ符号化単位から、前記ビデオ符号化単位の各々に付される前記符号化単位タイプに応じて、前記ビデオ符号化単位の各々に関連する領域を復号化するよう構成される、請求項1に記載のビデオデコーダ。
  3. 前記代替的な符号化単位タイプが前記ビデオ符号化タイプの第2のサブセットからになるよう構成される、請求項1又は2に記載のビデオデコーダ。
  4. 前記代替的な符号化単位タイプが、前記ビデオ符号化タイプの第2のサブセットによって含まれない少なくとも1つのビデオ符号化タイプを含むビデオ符号化タイプの第3のサブセットからになるよう構成される、請求項1から3の何れか一項に記載のビデオデコーダ。
  5. 前記所定のビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ及び予測残差データを搬送する、請求項1から4の何れか一項に記載のビデオデコーダ。
  6. ピクチャは、前記第1のサブセットの符号化単位タイプによる1つ以上のビデオ符号化単位と、前記第2のサブセットの符号化単位タイプによる1つ以上のビデオ符号化単位との双方を含み、後者の前記ビデオ符号化単位は、前記代替的な符号化単位タイプに等しい符号化単位タイプを有する、請求項5に記載のビデオデコーダ。
  7. 前記代替的な符号化単位タイプは、RAP(Random Access Point)符号化タイプである、請求項6に記載のビデオデコーダ。
  8. 前記代替的な符号化単位タイプは、RAP(Random Access Point)符号化タイプ以外の符号化タイプである、請求項6に記載のビデオデコーダ。
  9. 前記所定のビデオ符号化単位の各々は、前記所定のビデオ符号化単位が内部に存在し、前記アクセス単位が関連する前記ピクチャの異なる領域と関連する、請求項1から5の何れか一項に記載のビデオデコーダ。
  10. 前記ビデオデータストリームのパラメータセット単位は、ピクチャのシーケンス、1つのピクチャ又は1つのピクチャからのスライスのセットをカバーする範囲を有する、請求項1から9の何れか一項に記載のビデオデコーダ。
  11. 前記パラメータセット単位は、ビデオデータストリームのプロファイルに固有の方法で前記代替的な符号化単位タイプを示す、請求項1から10の何れか一項に記載のビデオデコーダ。
  12. 前記ビデオデータストリームの前記パラメータセット単位は、
    ピクチャのシーケンスをカバーする範囲を有する前記パラメータセット単位、又は、
    前記アクセス単位に関連するピクチャの1つ以上をカバーする範囲を有するアクセス単位デリミッタ、の何れか一方である、請求項1から11の何れか一項に記載のビデオデコーダ。
  13. 前記所定のビデオ符号化単位がビデオを復号化するための前記ビデオシーケンスのリフレッシュされたスタートポイント又はビデオを復号化するための前記ビデオシーケンスの連続的なスタートポイントであってもなくても、前記パラメータセット単位は、ビデオデータストリームにおける前記代替的な符号化単位タイプを示す、請求項1から12の何れか一項に記載のビデオデコーダ。
  14. ビデオデータストリームからの複数のピクチャを含むビデオを、前記ピクチャの各々に関連する前記ビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位からの各ピクチャを復号化することによって、復号化し、各ビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ及び予測残差データを搬送し、所定のビデオ符号化単位の各々が内部に存在し、アクセス単位が関連付けされる前記ピクチャの異なる領域に関連付けされ、
    所定のビデオ符号化単位の各々から1つ以上のシンタックス要素のn項セットを読み、前記1つ以上のシンタックス要素のn項セットを1つ以上の特性のm項セットにマッピングし、各特性は、前記所定のビデオ符号化単位が内部に存在する前記アクセス単位が関連する前記ピクチャに関して前記ビデオが前記ビデオデータストリームにどのように符号化されるかに関して前記所定のビデオ符号化単位における対応するデータと冗長的な方法で記述し、m>nである、又は、
    所定のビデオ符号化単位の各々からN個(N>0)のシンタックス要素を読み、前記ビデオデータストリームから関連情報を読み、前記関連情報に応じて前記N個のシンタックス要素の各々をMこの特性の1つに関する情報と関連付けし、各特性は、前記所定のビデオ符号化単位が内部に存在する前記アクセス単位が関連する前記ピクチャに関して前記ビデオが前記ビデオデータストリームにどのように符号化されるかに関して前記所定のビデオ符号化単位における対応するデータと冗長的な方法で記述し、m>nである、
    よう構成されるビデオデコーダ。
  15. マップは、前記パラメータセット単位に含まれ、前記マッピングされる特性の位置を示す、請求項14に記載のビデオデコーダ。
  16. マップは、前記データストリームにおいて通知され、前記マッピングされる特性の位置を示す、請求項14に記載のビデオデコーダ。
  17. 前記N項シンタックス要素は、前記特性の有無を示す、請求項14に記載のビデオデコーダ。
  18. 提供されるシンタックス要素Nの数は、エキストラビットにおける提供されるシンタックス要素の数又は前記特性の有無を示す、請求項14に記載のビデオデコーダ。
  19. 複数のピクチャを含むビデオをビデオデータストリームに、前記ピクチャの各々に関連する前記ビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位に各ピクチャを符号化することによって、符号化し、
    前記ビデオデータストリームのパラメータセット単位において代替的な符号化単位タイプを示し、
    所定のビデオ符号化単位の各々に対して、
    前記ビデオ符号化単位の各々の符号化単位タイプ識別子(100)を前記ビデオデータストリームに符号化し、前記符号化単位の識別子は、1つ以上の符号化単位タイプの第1のサブセット(102)又は符号化単位タイプの第2のサブセット(104)からの符号化単位タイプを識別し、
    前記符号化単位の識別子が前記1つ以上の符号化単位タイプの第1のサブセットから符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々は、前記代替的な符号化単位タイプにされ、
    前記符号化単位の識別子が前記符号化単位タイプの第2のサブセットから符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々は、前記符号化単位の識別子によって識別される前記符号化単位タイプの第2のサブセットからの符号化単位タイプにされ、
    前記代替的な符号化単位タイプは、RAPタイプであり、ビデオエンコーダは、RAPピクチャのビデオ符号化単位を前記所定のビデオ符号化単位として識別するよう構成される、
    よう構成されるビデオエンコーダ。
  20. 符号化された複数のピクチャを含むビデオを有するビデオデータストリームを構成し、各ピクチャは、前記ピクチャが分割されるタイルの各々に対して1つ以上のビデオ符号化単位が各々のピクチャと関連する前記ビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位内にあり、
    非RAPタイプを指示するため、指示されたRAPタイプから前記ビデオデータストリームのパラメータセット単位における代替的な符号化単位タイプを変更し、
    前記ビデオデータストリームにおいて符号化単位タイプがRAPピクチャを識別する前記ビデオデータストリームに符号化される識別子を有する排他的に符号化されたビデオ符号化単位を識別するよう構成され、
    前記ビデオデータストリームの所定のビデオ符号化単位の各々に対して、
    前記ビデオデータストリームに符号化された前記ビデオ符号化単位の各々の識別子は、1つ以上の符号化単位タイプの第1のサブセット又は符号化単位タイプの第2のサブセットからの符号化単位タイプを識別し、
    前記符号化単位の識別子が前記1つ以上の符号化単位タイプの第1のサブセットからの符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々は前記代替的な符号化単位タイプとされ、
    前記符号化単位の識別子が前記符号化単位タイプの第2のサブセットからの符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々は、前記符号化単位の識別子によって識別される前記符号化単位タイプの第2のサブセットからの符号化単位タイプとされる、ビデオコンポーザ。
  21. 複数のピクチャを含むビデオをビデオデータストリームに、前記ピクチャの各々に関連する前記ビデオデータストリームのアクセス単位内に1つ以上のビデオ符号化単位に各ピクチャを符号化することによって符号化し、各ビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ及び予測残差データを搬送し、前記所定のビデオ符号化単位の各々が内部に存在する前記アクセス単位が関連する前記ピクチャの異なる領域に関連し、
    所定のビデオ符号化単位の各々に1つ以上のシンタックス要素のn項セットを指定し、前記1つ以上のシンタックス要素のn項セットを1つ以上の特性のm項セットにマッピングし(m>n)、各特性は、前記所定のビデオ符号化単位が内部に存在する前記アクセス単位が関連するピクチャに関して前記ビデオがどのように前記ビデオデータストリームに符号化されるかを、前記所定のビデオ符号化単位における対応するデータと冗長な方法で記述するか、又は、
    所定のビデオ符号化単位の各々にN個(N>0)のシンタックス要素を指定し、関連情報を前記ビデオデータストリームに指定し、前記関連情報に依存して前記N個のシンタックス要素の各々をM個の特性の1つに関する情報と関連付けし、各特性は、前記所定のビデオ符号化単位が内部に存在する前記アクセス単位が関連するピクチャに関して前記ビデオがどのように前記ビデオデータストリームに符号化されるかを、前記所定のビデオ符号化単位における対応するデータと冗長な方法で記述する、
    よう構成されるビデオエンコーダ。
  22. ビデオデータストリームからの複数のピクチャを含むビデオを、前記ピクチャの各々に関連する前記ビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位からの各ピクチャを復号化することによって、復号化することと、
    前記ビデオデータストリームのパラメータセット単位から代替的な符号化単位タイプを読むことと、
    所定の各ビデオ符号化単位に対して、
    前記ビデオ符号化単位の各々から符号化単位タイプ識別子を読むことと、
    前記符号化単位の識別子が1つ以上の符号化単位タイプの第1のサブセット又は符号化単位タイプの第2のサブセットからの符号化単位タイプを識別するか確認することと、
    前記符号化単位の識別子が前記1つ以上の符号化単位タイプの第1のサブセットからの符号化単位タイプを識別する場合、前記ビデオ符号化単位の各々を前記代替的な符号化単位タイプにすることと、
    前記符号化単位の識別子が前記符号化単位タイプの第2のサブセットからの符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々を前記符号化単位の識別子によって識別される符号化単位タイプの第2のサブセットからの前記符号化単位タイプにすることと、
    を有する方法。
  23. ビデオデータストリームからの複数のピクチャを含むビデオを、前記ピクチャの各々に関連する前記ビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位からの各ピクチャを復号化することによって、復号化することであって、各ビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ及び予測残差データを搬送し、所定のビデオ符号化単位の各々が内部に存在し、アクセス単位が関連付けされる前記ピクチャの異なる領域に関連付けされる、復号化することと、
    所定のビデオ符号化単位の各々から1つ以上のシンタックス要素のn項セットを読み、前記1つ以上のシンタックス要素のn項セットを1つ以上の特性のm項セットにマッピングすることであって、各特性は、前記所定のビデオ符号化単位が内部に存在する前記アクセス単位が関連する前記ピクチャに関して前記ビデオが前記ビデオデータストリームにどのように符号化されるかを前記所定のビデオ符号化単位における対応するデータと冗長的な方法で記述し、m>nである、マッピングすること、又は、
    所定のビデオ符号化単位の各々からN個(N>0)のシンタックス要素を読み、前記ビデオデータストリームから関連情報を読み、前記関連情報に応じて前記N個のシンタックス要素の各々をM個の特性の1つに関する情報と関連付けすることであって、各特性は、前記所定のビデオ符号化単位が内部に存在する前記アクセス単位が関連する前記ピクチャに関して前記ビデオが前記ビデオデータストリームにどのように符号化されるかを前記所定のビデオ符号化単位における対応するデータと冗長的な方法で記述し、m>nである、関連付けすること、
    を有する方法。
  24. 複数のピクチャを含むビデオをビデオデータストリームに、前記ピクチャの各々に関連する前記ビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位に各ピクチャを符号化することによって、符号化することと、
    前記ビデオデータストリームのパラメータセット単位において代替的な符号化単位タイプを示すことと、
    所定のビデオ符号化単位の各々に対して、
    前記ビデオ符号化単位の各々の符号化単位タイプ識別子(100)を規定することであって、前記符号化単位の識別子は、1つ以上の符号化単位タイプの第1のサブセット(102)又は符号化単位タイプの第2のサブセット(104)からの符号化単位タイプを識別する、規定することと、
    前記符号化単位の識別子が前記1つ以上の符号化単位タイプの第1のサブセットから符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々を前記代替的な符号化単位タイプにすることと、
    前記符号化単位の識別子が前記符号化単位タイプの第2のサブセットから符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々を前記符号化単位の識別子によって識別される前記符号化単位タイプの第2のサブセットからの符号化単位タイプにすることと、
    を有する方法。
  25. 符号化された複数のピクチャを含むビデオを有するビデオデータストリームを構成することであって、各ピクチャは、前記ピクチャが分割されるタイルの各々に対して1つ以上のビデオ符号化単位が各々のピクチャと関連する前記ビデオデータストリームのアクセス単位内の1つ以上のビデオ符号化単位内にある、構成することと、
    非RAPタイプを指示するため、指示されたRAPタイプから前記ビデオデータストリームのパラメータセット単位における代替的な符号化単位タイプを変更することと、
    前記ビデオデータストリームにおいて符号化単位タイプがRAPピクチャを識別する前記ビデオデータストリームに符号化される識別子(100)を有する排他的に符号化されたビデオ符号化単位を識別することと、
    を有し、
    前記ビデオデータストリームの所定のビデオ符号化単位の各々に対して、
    前記ビデオデータストリームに符号化された前記ビデオ符号化単位の各々の識別子(100)は、1つ以上の符号化単位タイプの第1のサブセット(102)又は符号化単位タイプの第2のサブセット(104)からの符号化単位タイプを識別し、
    前記符号化単位の識別子が前記1つ以上の符号化単位タイプの第1のサブセットからの符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々は前記代替的な符号化単位タイプとされ、
    前記符号化単位の識別子が前記符号化単位タイプの第2のサブセットからの符号化単位タイプを識別する場合、前記所定のビデオ符号化単位の各々は、前記符号化単位の識別子によって識別される前記符号化単位タイプの第2のサブセットからの符号化単位タイプとされる、方法。
  26. 複数のピクチャを含むビデオをビデオデータストリームに、前記ピクチャの各々に関連する前記ビデオデータストリームのアクセス単位内に1つ以上のビデオ符号化単位に各ピクチャを符号化することによって符号化することであって、各ビデオ符号化単位は、ピクチャブロックパーティショニングデータ、ブロック関連予測パラメータ及び予測残差データを搬送し、前記所定のビデオ符号化単位の各々が内部に存在する前記アクセス単位が関連する前記ピクチャの異なる領域に関連する、符号化することと、
    所定のビデオ符号化単位の各々に1つ以上のシンタックス要素のn項セットを指定し、前記1つ以上のシンタックス要素のn項セット(200)を1つ以上の特性のm項セット(202)にマッピングすることであって(m>n)、各特性は、前記所定のビデオ符号化単位が内部に存在する前記アクセス単位が関連するピクチャに関して前記ビデオがどのように前記ビデオデータストリームに符号化されるかを、前記所定のビデオ符号化単位における対応するデータと冗長な方法で記述するか、マッピングすること、又は、
    所定のビデオ符号化単位の各々にN個(N>0)のシンタックス要素(210)を指定し、関連情報を前記ビデオデータストリームに指定し、前記関連情報に依存して前記N個のシンタックス要素の各々をM個の特性の1つに関する情報と関連付けすることであって、各特性は、前記所定のビデオ符号化単位が内部に存在する前記アクセス単位が関連するピクチャに関して前記ビデオがどのように前記ビデオデータストリームに符号化されるかを、前記所定のビデオ符号化単位における対応するデータと冗長な方法で記述する、関連付けすること、
    を有する方法。
  27. 請求項22から25の何れか一項に記載の方法をコンピュータ上で実行すると実行するプログラムコードを有するコンピュータプログラム。
  28. 請求項24から26の何れか一項に記載の方法によって生成されるデータストリーム。
JP2022514617A 2019-09-03 2020-09-03 ストリームマージのためのコンフィギュラブルnal及びスライスコードポイント機構 Active JP7400084B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023205885A JP2024026283A (ja) 2019-09-03 2023-12-06 ストリームマージのためのコンフィギュラブルnal及びスライスコードポイント機構

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19195198.7 2019-09-03
EP19195198 2019-09-03
PCT/EP2020/074619 WO2021043914A1 (en) 2019-09-03 2020-09-03 Configurable nal and slice code point mechanism for stream merging

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023205885A Division JP2024026283A (ja) 2019-09-03 2023-12-06 ストリームマージのためのコンフィギュラブルnal及びスライスコードポイント機構

Publications (2)

Publication Number Publication Date
JP2022547877A true JP2022547877A (ja) 2022-11-16
JP7400084B2 JP7400084B2 (ja) 2023-12-18

Family

ID=67850958

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022514617A Active JP7400084B2 (ja) 2019-09-03 2020-09-03 ストリームマージのためのコンフィギュラブルnal及びスライスコードポイント機構
JP2023205885A Pending JP2024026283A (ja) 2019-09-03 2023-12-06 ストリームマージのためのコンフィギュラブルnal及びスライスコードポイント機構

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023205885A Pending JP2024026283A (ja) 2019-09-03 2023-12-06 ストリームマージのためのコンフィギュラブルnal及びスライスコードポイント機構

Country Status (11)

Country Link
US (1) US12028552B2 (ja)
EP (1) EP4026320A1 (ja)
JP (2) JP7400084B2 (ja)
KR (1) KR20220053014A (ja)
CN (1) CN114600458A (ja)
AU (1) AU2020340538B2 (ja)
BR (1) BR112022003991A2 (ja)
CA (1) CA3153225A1 (ja)
IL (1) IL291050A (ja)
MX (1) MX2022002644A (ja)
WO (1) WO2021043914A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003060652A (ja) * 2001-04-27 2003-02-28 Matsushita Electric Ind Co Ltd 無線伝送装置
US20140301485A1 (en) * 2013-04-05 2014-10-09 Qualcomm Incorporated Irap access units and bitstream switching and splicing
JP2017123645A (ja) * 2016-01-08 2017-07-13 サムスン エレクトロニクス カンパニー リミテッド 参照イメージをプロセシングするための方法、アプリケーションプロセッサおよびモバイル端末

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9762882B2 (en) * 2013-01-11 2017-09-12 Hfi Innovation Inc. Method and apparatus for efficient coding of depth lookup table
JP6437096B2 (ja) 2014-08-20 2018-12-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ビデオ合成
CN109691103B (zh) * 2016-07-14 2023-02-28 皇家Kpn公司 视频编码
WO2018043905A1 (ko) 2016-08-29 2018-03-08 엘지전자 주식회사 360 비디오를 전송하는 방법, 360 비디오를 수신하는 방법, 360 비디오 전송 장치, 360 비디오 수신 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003060652A (ja) * 2001-04-27 2003-02-28 Matsushita Electric Ind Co Ltd 無線伝送装置
US20140301485A1 (en) * 2013-04-05 2014-10-09 Qualcomm Incorporated Irap access units and bitstream switching and splicing
JP2016519509A (ja) * 2013-04-05 2016-06-30 クゥアルコム・インコーポレイテッドQualcomm Incorporated Irapアクセスユニットおよびビットストリーム切替えおよびスプライシング
JP2017123645A (ja) * 2016-01-08 2017-07-13 サムスン エレクトロニクス カンパニー リミテッド 参照イメージをプロセシングするための方法、アプリケーションプロセッサおよびモバイル端末

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BROSS, BENJAMIN: "Versatile Video Coding (Draft 1)", JVET-J1001 (VERSION 2), JPN6023024439, 15 June 2018 (2018-06-15), pages 23 - 25, ISSN: 0005087856 *
SUEHRING, KARSTEN ET AL.: "AHG9: On Extra Picture Header Bits in VVC", JVET-Q0400 (VERSION 2), JPN6023024440, 11 January 2020 (2020-01-11), pages 1 - 3, ISSN: 0005087855 *

Also Published As

Publication number Publication date
KR20220053014A (ko) 2022-04-28
EP4026320A1 (en) 2022-07-13
IL291050A (en) 2022-05-01
MX2022002644A (es) 2022-04-06
JP2024026283A (ja) 2024-02-28
AU2020340538A1 (en) 2022-03-24
CN114600458A (zh) 2022-06-07
BR112022003991A2 (pt) 2022-05-31
CA3153225A1 (en) 2021-03-11
JP7400084B2 (ja) 2023-12-18
AU2020340538B2 (en) 2023-11-30
WO2021043914A1 (en) 2021-03-11
US20220329865A1 (en) 2022-10-13
US12028552B2 (en) 2024-07-02

Similar Documents

Publication Publication Date Title
JP7506077B2 (ja) 映像の符号化および復号のための装置、方法、およびコンピュータプログラム
US12088847B2 (en) Apparatus, a method and a computer program for video encoding and decoding
KR102521495B1 (ko) 인터-계층 종속성을 인코딩하기 위한 방법, 디바이스, 및 컴퓨터 프로그램
GB2550912B (en) Method, device and computer program for encapsulating and parsing timed media data
US10666863B2 (en) Adaptive panoramic video streaming using overlapping partitioned sections
US11483475B2 (en) Adaptive panoramic video streaming using composite pictures
CN110035331B (zh) 一种媒体信息的处理方法及装置
CN113574903B (zh) 针对媒体内容中的后期绑定的方法和装置
TW202406340A (zh) 沉浸式視訊編解碼中之冗餘資料減少
CN113766235B (zh) 一种全景视频传输方法及设备
TWI789662B (zh) 有關子圖像之視訊寫碼技術
JP7400084B2 (ja) ストリームマージのためのコンフィギュラブルnal及びスライスコードポイント機構
EP3029940B1 (en) Method and device for post processing of a video stream
WO2019038433A1 (en) SIGNALING CHARACTERISTICS FOR OMNIDIRECTIONAL CONTENT
KR20230079184A (ko) 몰입형 비디오의 인코딩 및 디코딩
Kammachi‐Sreedhar et al. Omnidirectional video delivery with decoder instance reduction
EP4207764A1 (en) An apparatus, a method and a computer program for volumetric video

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220502

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220502

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231206

R150 Certificate of patent or registration of utility model

Ref document number: 7400084

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150