JP2023526460A - サブピクチャ関連のビデオコード化の概念 - Google Patents

サブピクチャ関連のビデオコード化の概念 Download PDF

Info

Publication number
JP2023526460A
JP2023526460A JP2022570632A JP2022570632A JP2023526460A JP 2023526460 A JP2023526460 A JP 2023526460A JP 2022570632 A JP2022570632 A JP 2022570632A JP 2022570632 A JP2022570632 A JP 2022570632A JP 2023526460 A JP2023526460 A JP 2023526460A
Authority
JP
Japan
Prior art keywords
layer
data stream
video data
sub
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022570632A
Other languages
English (en)
Other versions
JPWO2021234125A5 (ja
Inventor
デ ラ フエンテ ヤゴ サンチェス
カルステン ズーリング
コーネリアス ヘルゲ
トーマス ツェル
ロベルト スクピン
トーマス ウィーガンド
Original Assignee
フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2023526460A publication Critical patent/JP2023526460A/ja
Publication of JPWO2021234125A5 publication Critical patent/JPWO2021234125A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

独立してコード化されたサブピクチャに細分されるようにエンコードされたピクチャを有するビデオデータストリームのエンコード、デコード、抽出、及びミキシングに関するビデオコード化の概念が説明される。この概念は、細分されたピクチャのレイヤと細分されていないピクチャのレイヤとを有するサブピクチャ別ビデオデータストリームの抽出、レイヤ間予測ツールの処理、及びそのようなビデオデータのレイヤ間予測のためのスケーリングウィンドウの処理、そのようなデータストリームに対するデコーダ機能要件の決定、そのようなデータストリームに対するレイヤ固有の制約、及び独立してコード化された異なるタイプでエンコードされたサブピクチャの混合に関する。【選択図】図1

Description

本開示の実施形態は、ビデオコンテンツをビデオデータストリームにエンコードするためのエンコーダに関する。さらなる実施形態は、マルチレイヤビデオデータストリームからサブピクチャ別ビデオデータストリームを抽出するための装置に関する。さらなる実施形態は、ビデオデータストリームをデコードするためのデコーダに関する。さらなる実施形態は、ビデオコンテンツをビデオデータストリームにエンコードする方法、ビデオデータストリームをデコードする方法、及びマルチレイヤビデオデータストリームからサブピクチャ別ビデオデータストリームを抽出する方法に関する。さらなる実施形態は、ビデオデータストリームに関する。
ビデオコード化では、ビデオシーケンスのピクチャは、それぞれがピクチャの一部を構成する複数のサブピクチャによって、ビデオデータストリームにコード化することができる。換言すれば、ビデオデータストリームは、等しい提示時間に関連付けられた複数のサブピクチャを含むことができる。デコードまたは提示のためにサブピクチャの1つ以上を選択することにより、そうした提示されるビデオコンテンツがデコーダ側で選択され得る。例えば、そのようなビデオデータストリームは、ビューポート依存のストリーミングシナリオで利用され得る。ピクチャ全体ではなく、サブピクチャの1つ以上が表示される場合と同様に、ビデオデータストリーム全体ではなく、その一部のみをデコードすることが好ましい場合がある。その方が、提示されるビデオコンテンツのレート対歪みの関係を、所与のデコードコストで、より良くすることができる。この目的のために、ビデオデータストリームの一部が、デコードの前に抽出され得る。
したがって、サブピクチャ別ビデオデータストリームの正確な抽出と低い信号オーバヘッドとの間の良好なトレードオフを提供する方法で、複数のサブピクチャを含むビデオデータストリームをエンコードし取り扱うための概念を持つことが望ましい。
本発明の第1の態様による実施形態は、マルチレイヤビデオデータストリームのサブピクチャ別ビデオデータストリームの抽出または定義または記述において、サブピクチャに分割されるようにビデオがエンコードされるレイヤと、2つ以上のサブピクチャに細分されるようにビデオがエンコードされるレイヤとを区別するという考えに依存する。非サブピクチャ分割方式でエンコードされるレイヤと、サブピクチャ分割方式でエンコードされるレイヤとを区別することにより、サブピクチャ別ビデオデータストリームによって表されるサブピクチャを超えて広がるピクチャを構成する、そのサブピクチャ別ビデオデータストリームの抽出または記述が可能になる。したがって、実施形態は、例えば、サブピクチャに細分されるようにエンコードされるレイヤのサブピクチャが、サブピクチャに細分されないようにエンコードされるレイヤのピクチャに依存する、サブピクチャ別ビデオデータストリームの抽出または記述を可能にする。さらに、ビューポートに依存するストリーミングなどのアプリケーションでは、細分されないようにエンコードされたサブピクチャ別ビデオデータストリームピクチャを利用できるようにすることで、ビューポートが変更された場合に、少なくともその細分されないようにエンコードされたピクチャの画質のピクチャをすぐに利用できるようにすることが可能になり得る。
本発明の第1の態様による実施形態は、マルチレイヤビデオデータストリームからサブピクチャ別ビデオデータストリームを抽出するための装置を提供する。マルチレイヤビデオデータストリームは、複数のレイヤを含み、NALユニットなどのビットストリーム部分で構成され(またはビットストリーム部分を含み)、そのビットストリーム部分のそれぞれがレイヤの1つに属する。「~で構成される」とは、本明細書で使用される場合は常に、主題が構成の対象を排他的に含むことを要求しているものとしては理解されないことに留意されたい。むしろ、データストリームは、ビットストリーム部分に加えて、本明細書で説明する他の部分も含むことができ、データストリーム内のビットストリーム部分の配置は、1つのアクセスユニット内の特定のタイムスタンプに属するビットストリーム部分の一群であるなど、特定の規則に準拠している。第1の態様によれば、例えば、サブピクチャ別ビデオデータストリームを抽出するための装置によって、マルチレイヤビデオデータストリームからサブピクチャ別ビデオデータストリームを抽出することは、レイヤセットの各レイヤについて、例えば出力レイヤセットをチェックすることであって、ビデオのピクチャが、それぞれのレイヤに相互に独立してエンコードされる2つ以上のサブピクチャに細分されることによって、ビデオの各ピクチャについて、それぞれのピクチャのサブピクチャが、それぞれのレイヤの相互に異なるビットストリーム部分にエンコードされるように、それぞれのレイヤにビデオがエンコードされているかどうか、またはサブピクチャに細分されないようにそれぞれのレイヤにビデオがエンコードされているかどうか、出力レイヤセットをチェックすることを含む。サブピクチャに細分されないようにそれぞれのレイヤにビデオがエンコードされている場合、抽出することは、それぞれのレイヤに属するビットストリーム部分を、マルチレイヤビデオデータストリームから、サブピクチャ別ビデオデータストリームに引き継いで、サブピクチャ別ビデオデータストリームに、それぞれのレイヤのビデオが完全にエンコードされているようにすることを含む。サブレイヤ別ビデオデータストリームを抽出することは、ビデオのピクチャが2つ以上のサブピクチャに細分されるように、それぞれのレイヤにビデオがエンコードされている場合、それぞれのレイヤに属する各ビットストリーム部分について、ビットストリーム部分から、それぞれのビットストリーム部分に2つ以上のサブピクチャのうちのどのサブピクチャがエンコードされているかを明らかにする情報を読み出すことと、それぞれのビットストリーム部分に、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている場合には、それぞれのレイヤのそれぞれのビットストリーム部分を、マルチレイヤビデオデータストリームから、サブピクチャ別ビデオデータストリームに引き継ぐことと、を行うように構成されている。
さらなる実施形態は、マルチレイヤビデオデータストリーム、及びこれをエンコードするためのエンコーダによって提供され、マルチレイヤビデオデータストリームは、サブピクチャ別ビデオデータストリームを抽出するための説明された装置によって実行される、マルチレイヤビデオデータストリームから抽出可能なサブピクチャ別ビデオデータストリームに関するデコーダ機能要件情報を含む。ビデオデータストリーム内のデコーダ機能要件情報をシグナリングすることで、デコーダ機能のより効率的な活用、及び/または、デコードに使用されるデコーダの機能を考慮して、デコードに最適なビデオデータストリームの選択が可能になる。
本発明の第2の態様の実施形態によれば、マルチレイヤビデオデータストリームは、第1のレイヤのビットストリーム部分に相互に独立してエンコードされることによって、第1のビデオの各ピクチャについて、第1のビデオのそれぞれのピクチャのサブピクチャが、第1のレイヤの相互に異なるビットストリーム部分にエンコードされる、2つ以上のサブピクチャに、第1のビデオのピクチャが細分されるように、ビットストリーム部分に第1のビデオがエンコードされている、第1のレイヤを含む。マルチレイヤビデオデータストリームは、ビットストリーム部分が第2のビデオを有する第2のレイヤをさらに含む。第1のレイヤのビットストリーム部分には、基準ピクチャからのベクトルベース予測を使用して第1のビデオがエンコードされている。さらに、第1のレイヤのビットストリーム部分には、第1のビデオが、第2のビデオのピクチャを基準ピクチャとして含めるようにして、かつ第1のレイヤのビットストリーム部分がエンコードされるベクトルを使用して、第1のレイヤのビットストリーム部分によって構成されるベクトルが、ベクトルベース予測での使用のために、第1のビデオのピクチャ及び基準ピクチャに対して、それぞれマルチレイヤビデオデータストリームでのスケーリングウィンドウのサイズ及び位置に従ってスケーリング及びオフセットが行われるようにして、エンコードされている。第2の態様による概念は、マルチレイヤビデオデータストリームからサブピクチャ別ビデオデータストリームを抽出する際に、第2のレイヤに属するビットストリーム部分を、マルチレイヤビデオデータストリームから、サブピクチャ別ビデオデータストリームに引き継いで、サブピクチャ別ビデオデータストリームに、それぞれのレイヤのビデオが完全にエンコードされているようにすることを含む。サブピクチャ別ビデオデータストリームの抽出は、第1のレイヤに属し、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている各ビットストリーム部分を、マルチレイヤビデオデータストリームから、サブピクチャ別ビデオデータストリームに引き継ぐことをさらに含む。さらに、サブピクチャ別ビデオデータストリームの抽出は、第2のビデオのピクチャに対するスケーリングウィンドウの空間領域が、1つ以上のサブピクチャの所定のセットに対するスケーリングウィンドウの空間領域に空間的に対応するように、サブピクチャ別ビデオデータストリームにおける第1のレイヤ及び/または第2のレイヤにスケーリングウィンドウシグナル伝達を適応させることを含む。
第2の態様による実施形態は、サブピクチャの抽出により第1のレイヤのピクチャのサイズが変化する間にサブピクチャ別ビデオデータストリームを抽出した後で、スケーリングウィンドウを使用したベクトルベース予測のためにベクトルをスケーリングすることが、マルチレイヤビデオデータストリームで提供されるスケーリングウィンドウによって意図された位置及びサイズに応じた位置及びサイズにベクトルがスケーリングされるように実行されることを保証することができる。したがって、第2の態様の実施形態は、サブピクチャ抽出によってピクチャとそのレイヤ間基準ピクチャとの間の相対的なピクチャサイズが変化する場合に、例えば、基準レイヤのピクチャが(例えば、第1の態様に関して説明したように)サブピクチャ別ビデオデータストリームに完全に転送される場合にも、ベクトルベースのレイヤ間予測の使用とサブピクチャ抽出とを組み合わせることができるようにする。
本発明の第3の態様による実施形態は、マルチレイヤビデオデータストリームのエンコード及び/またはデコードにおいて、マルチレイヤビデオデータストリームの第1のレイヤから/第1のレイヤへ、ビデオの第1のバージョンをコード化するためにレイヤ間予測ツールが使用される。レイヤ間予測ツールは、マルチレイヤビデオデータストリームの第2のレイヤからの予測に使用される。第の1バージョンはエンコードされ、第1のレイヤは、サブピクチャ単位の独立したコード化のための第1の構成設定を使用する。さらに、サブピクチャ単位の独立したコード化のための第2の構成設定が、ビデオの第2のバージョンをマルチレイヤビデオデータストリームの第2のレイヤから/第2のレイヤへコード化するために使用される。第1の構成設定及び第2の構成設定が所定の関係を有するかどうかに応じて、1つ以上のレイヤ間予測ツールの所定のサブセットが、第2のレイヤからのレイヤ間予測において無効にされる。
したがって、第3の態様による実施形態は、レイヤ間予測ツールの使用を正確に制御することを可能にするので、特に、マルチレイヤビデオデータストリームの異なるレイヤのピクチャが異なる数のサブピクチャに分割されるシナリオ、例えば、あるレイヤのピクチャがサブピクチャに分割される一方で、別のレイヤのピクチャがサブピクチャに分割されない場合など、マルチレイヤビットストリームのピクチャがサブピクチャに細分される場合にもレイヤ間予測が使用できる。
本発明の第4の態様による実施形態は、1つ以上の第1のレイヤにおいて独立してコード化されたサブピクチャに細分されるように、かつ1つ以上の第2のレイヤにおいては細分されないようにして、ピクチャがエンコードされるマルチレイヤビデオビットストリームのエンコードまたは処理を提供する。マルチレイヤビデオビットストリームは、レイヤセットをデコードするのに十分ないくつかの基準デコーダ機能要件をエンコードしており、各レイヤセットには、少なくとも1つの第1のレイヤと少なくとも1つの第2のレイヤとが含まれている。基準デコーダ機能要件のそれぞれについて、マルチレイヤビデオデータストリームは、少なくとも1つの第1レイヤに帰属するそれぞれの基準デコーダ機能要件の第1の割合に関する情報と、少なくとも1つの第2のレイヤに帰属するそれぞれの基準デコーダ機能要件の第2の割合に関する情報とを含む。
第1の割合及び第2の割合に関する情報を有することにより、サブピクチャ別ビデオデータストリームなどのマルチレイヤビデオデータストリームから抽出され得る、いくつかのビデオデータストリームのそれぞれに関連するデコーダ機能要件の正確な決定が可能になる。
本発明の第5の態様による実施形態は、マルチレイヤビデオデータストリームで示されるレイヤセットのレイヤに、基準デコーダ機能要件に関連する制約、例えばレイヤ固有の制約を選択的に適用することを提供し、そのレイヤは、独立してコード化されたサブピクチャに細分されるように、そのレイヤにビデオピクチャがエンコードされる。サブピクチャ別ビデオデータストリームの抽出時、ピクチャサイズの減少により制約が厳しくなる可能性がある場合、ピクチャサイズが維持されるレイヤ、例えば、ピクチャが細分されていないレイヤへの制約の適用を省略することにより、細分されていないレイヤに過度な制約を課すことを回避することができる。
本発明の第6の態様による実施形態は、ビデオデータストリームにおける表示を提供し、この表示は、ビデオデータストリームにエンコードされたピクチャが1つ以上の独立してコード化されたサブピクチャの方法によってエンコードされているかどうかを示し、表示は、1つ以上の独立してコード化されたサブピクチャの間の異なるタイプのコード化の独立性と1つ以上の独立してデコードされたサブピクチャの周囲とを識別する。第6の態様による実施形態は、異なるタイプのNALユニットなどのビットストリーム部分を合成ビットストリームの1つのピクチャ、すなわち1つのアクセスユニットに混合することを可能にする。したがって、第6の態様による実施形態は、ビデオビットストリームの混合においてより高い柔軟性を可能にする。
本開示の実施形態及び有利な実施態様は、図に関して以下に、さらに詳細に説明される。
実施形態によるエンコーダ、エクストラクタ及びデコーダの例を示す。 実施形態によるエンコーダ、ビデオデータストリーム、及びエクストラクタの例を示す。 ビデオデータストリームの例と、サブピクチャ別ビデオデータストリームの誤った抽出の例とを示す。 サブピクチャ別ビデオデータストリームの例を示す。 本発明の第2の態様によるエンコーダ、エクストラクタ、及びマルチレイヤビデオデータストリームの例を示す。 実施形態によるスケーリングウィンドウの適応を示す。 サブピクチャ別ビデオデータストリームの抽出の別の例を示す。 サブピクチャ別ビデオデータストリームの出力ピクチャ領域割合の例を示す。 基準デコーダ機能要件の細分割レイヤ及び非細分割レイヤの割合の例を示す。 エンコーダ、ビデオデータストリーム、ビデオデータストリームをミキシング及び/または抽出するための装置、及びデコーダの例を示す。 デコーダ側の境界処理とエンコーダ側の境界処理とを混在させたビットストリームの例を示す。 デコーダ側とエンコーダ側との境界処理を混合した単一レイヤビットストリームの例を示す。 独立性のタイプに応じたビットストリーム部分の例を示す。
以下では、実施形態を詳細に説明するが、実施形態は、多種多様なビデオコード化の概念で具現化できる多くの適用可能な概念を提供することを理解されたい。説明した特定の実施形態は、本概念を実施及び使用するための具体的な方法を単に例示するものであり、実施形態の範囲を限定するものではない。以下の説明では、本発明の実施形態のより完全な説明を提供するために複数の詳細を述べる。しかしながら、これらの具体的な詳細を伴わずに他の実施形態を実施できることは、当業者には明らかであろう。他の例では、本明細書で説明する例を不明瞭にすることを避けるために、周知の構造及びデバイスを詳細ではなくブロック図の形で示している。さらに、本明細書に記載された異なる実施形態の特徴は、特に断りのない限り、互いに組み合わせることができる。
以下の実施形態の説明では、同一または類似の要素、あるいは同じ機能を有する要素には、同じ参照符号が付けられるか、または同じ名前で識別され、同じ参照番号が付けられるか、または同じ名前で識別される要素の繰り返しの説明は、通常、省略される。したがって、同じまたは類似の参照番号を有し、あるいは同じ名前で識別される要素について提供される説明は、相互に交換可能であり、または異なる実施形態において互いに適用され得る。
以下の図の説明は、図1に関するエンコーダ、エクストラクタ、及びデコーダの提示から開始する。図1のエンコーダ及びエクストラクタは、本発明の実施形態を組み込むことができるフレームワークの例を提供する。以下、本発明の概念の実施形態の説明を、そのような概念が図1のエンコーダ及びエクストラクタにどのように組み込まれ得るかについての説明とともに提示する。しかし、図2及びそれに続くものに関して説明した実施形態は、図1に関して説明したフレームワークに従って動作しないエンコーダ及びエクストラクタを形成するために使用されてもよい。さらに、エンコーダ、エクストラクタ、及びデコーダは、図1では例示のために一緒に説明されているが、互いに別々に実装されてもよいことに留意されたい。
0.図1によるエンコーダ40、エクストラクタ10、デコーダ50及びビデオデータストリーム14
図1は、エンコーダ40、エクストラクタ20及びデコーダ50の例を示す。エンコーダ40は、ビデオ24をビデオデータストリーム14にエンコードする。ビデオデータストリーム14(ビデオデータストリームは、本明細書ではビットストリームと呼ばれることもある)を、例えば、送信することができ、またはデータキャリアに格納することができる。ビデオ24は、ピクチャのシーケンスを含むことができ、そのそれぞれは、提示時間順の提示時間に関連付けることができる。ビデオ24は、図1のピクチャ26及び26によって表される複数のピクチャ26を含むことができる。ピクチャ26のそれぞれは、図1における第1のレイヤL1または第2のレイヤL0などのレイヤに関連付けることができる。例えば、図1では、ピクチャ26は第2のレイヤL0に関連付けられており、ピクチャ26は第1のレイヤL1に関連付けられている。レイヤL0のピクチャ26は、ビデオシーケンス24を形成することができる。レイヤL1のピクチャ26は、ビデオシーケンス24を形成することができる。例では、ビデオ24のビデオシーケンス24、24は、等しいコンテンツを表し、等しい提示時間に関連付けられているが異なる解像度を有するピクチャを含むことができる。ただし、ビデオ24のレイヤL0及びL1に関連するビデオシーケンス24、24は、異なるフレームレートを有し得ることに留意されたい。したがって、例えば、ビデオシーケンス24は、ビデオシーケンス24がピクチャ26を含む提示時間のそれぞれについて、必ずしもピクチャ26を含むわけではない。エンコーダ40は、ビデオシーケンス24のピクチャ26を、ピクチャ26と時間的に同じ位置にある、すなわち、同じ提示時間に関連付けられているビデオシーケンス24のピクチャ26(例えば、レイヤ間予測のための基準ピクチャと呼ばれる)に依存して、すなわち関連して、ビデオデータストリーム14にエンコードすることができる。換言すれば、レイヤL0のピクチャは、レイヤL1のピクチャのための基準ピクチャであり得る。したがって、ビデオデータストリーム14からのピクチャ26のデコードには、ビデオデータストリーム14にエンコードされたピクチャ26が必要となり得る。これらの例では、レイヤL0はベースレイヤと呼ばれることがあり、レイヤL0に関連付けられたピクチャは第1の解像度を有することがある。エンハンスメントレイヤと呼ばれることがある第1のレイヤL1に関連するピクチャ26は、第1の解像度よりも高い第2の解像度を有することができる。例えば、エンコーダ40は、第1の解像度のビデオ24を表すレイヤL0が、レイヤL1とは独立してビデオデータストリーム14からデコードされて、第1の解像度のビデオとなり得るように、ビデオ24をビデオデータストリーム14にエンコードすることができる。レイヤL1のピクチャ26がレイヤL0のピクチャ26に依存する場合、ビデオシーケンス24、24を任意選択で共にデコードすることができ、その結果、第1の解像度よりも高い解像度、例えば第2の解像度を有するビデオをもたらすことができる。したがって、ビデオデータストリーム14のデコードに関する複数の選択肢が存在し得、個々の選択肢は、デコードされることになるデータストリームの異なるデータレートを伴い、異なる解像度を有するビデオをもたらす。
図1に示されているレイヤの数は例示的なものであり、ビデオデータストリーム14は3つ以上のレイヤを有し得ることが指摘される。ビデオデータストリーム14は、必ずしも複数のレイヤを含むわけではないが、セクション6で説明される実施形態の例のように、いくつかの例では、単一のレイヤのみを含む場合があることにも留意されたい。
エクストラクタ10は、ビデオデータストリーム12を抽出するために、ビデオデータストリーム14を受信することができ、そこからビデオデータストリーム14のビットストリーム部分の必ずしも適切ではないサブセットを抽出することができる。換言すれば、抽出ビデオデータストリーム12は、ビデオデータストリーム14に対応し得るか、またはビデオデータストリーム14の配分を含み得る。エクストラクタ10は、抽出ビデオデータストリーム12内のビットストリーム部分を転送するときに、ビデオデータストリーム14のビットストリーム部分のコンテンツを任意選択で修正できることが指摘される。例えば、エクストラクタ10は、抽出ビデオデータストリーム12のコード化されたビデオデータをどのようにデコードするかについての情報を含む記述データを修正することができる。エクストラクタ10は、ビデオデータストリーム14から抽出される出力レイヤセット(OLS)に基づいて、抽出ビデオデータストリーム12に転送すべきビデオデータストリーム14のビットストリーム部分を選択することができる。例えば、エクストラクタ10は、抽出すべきまたは提示すべきOLSを示すOLS表示を受信することができる。ビデオデータストリーム14は、ビデオデータストリーム14から抽出可能なOLSのセットを示すOLS表示を含み得る。OLSは、抽出ビデオデータストリーム12に全体的または部分的に転送すべきビデオデータストリーム14の1つ以上または全てのレイヤを示し得る。
言い換えれば、OLSは、例えば、マルチレイヤビデオデータストリーム14のレイヤの(必ずしも適切ではない)サブセットを示し得る。OLSは、ビットストリーム14のビデオパラメータセット(VPS)に含まれる可能性があるOLS表示18などのマルチレイヤデータストリーム自体で示され得る。実際、抽出に使用されるものは、外部手段によって、例えばAPI20を介して決定されて、データストリーム14内に2つ以上のそのようなOLSが示される場合がある。OLS表示18は、出力または提示されるビデオの1つ以上のレイヤを主に示しているが、1つ以上の出力レイヤが直接的または間接的に(別の基準レイヤを介して)レイヤに依存するという点で1つ以上の出力に属する、出力/提示されない非出力基準レイヤをも示し得ることに留意されたい。OLS表示18は、1つ以上のOLSを示し得る。
任意選択で、OLS表示18は、例えばビデオパラメータセット(VPS)におけるOLSのビデオパラメータを示すことができる。例えば、ビデオパラメータは、OLSによって記述されたビットストリームをデコードできるようにするためのデコーダの要件を提起する基準デコーダ機能要件(デコーダ機能要件、(基準)レベル情報、または(基準)レベル表示とも呼ばれる)を示すことができる。ビデオパラメータは、OLSによって記述されたビットストリームが、エクストラクタ10による抽出後も、OLSの1つ以上の時間サブレイヤ及び/または1つ以上のレイヤの選択/抽出によって依然としてスケーラブルである可能性があるため、1つのOLSに対する1つ以上の基準デコーダ機能要件を示し得ることに留意されたい。例えば、ミキサもしくはマージャ(例えば、図10の装置100)は、抽出ビデオデータストリーム12を使用してビットストリームを形成することができ、またはデコーダは、デコードのために抽出ビデオデータストリーム12のサブビットストリームを選択することができる。
抽出ビデオデータストリーム12は、デコーダ50に転送され、デコーダ50は、デコードされたビデオ24′を取得するために、抽出ビデオデータストリーム12をデコードする。デコードされたビデオ24′は、必ずしもビデオ24のコンテンツ全体を含むとは限らないという点で、ビデオ24とは異なる可能性があり、及び/または別の解像度を有する可能性があり、及び/またはビデオ24に関して、例えば量子化損失に基づく歪みを有する可能性がある。
ビデオデータストリーム14のレイヤのうちの1つのレイヤのピクチャ26は、1つ以上のサブピクチャ28を含み得るか、または複数のサブピクチャ28に細分され得る。以下では、レイヤのピクチャを参照するために参照符号26が使用されることに留意されたい。ピクチャ26は、例えば、レイヤL1のピクチャ26またはレイヤL0のピクチャ26を指すことができる。エンコーダ40は、ピクチャ26のサブピクチャ28を相互に独立してエンコードすることができる。すなわち、ピクチャ26のサブピクチャ28の1つは、ピクチャ26の別のサブピクチャ28を必要とせずにデコードされ得る。例えば、エクストラクタ10は、レイヤの全サブピクチャ28を転送する必要はなく、レイヤの各ピクチャ26のサブピクチャ28のサブセットまたは1つのみを転送することができる。したがって、この場合、サブピクチャ別ビデオデータストリーム12と呼ぶことができる抽出ビデオデータストリーム12のデータレートは、抽出ビデオデータストリーム12のデコードに必要なデコーダ資源を少なくすることができるように、ビデオデータストリーム14のデータレートよりも低くてもよい。図1の例では、エクストラクタ10は、レイヤL0のピクチャ24と、レイヤL1のピクチャ26のサブピクチャ28とを転送する。このシナリオでは、デコードビデオ24′は、ビデオシーケンス24のデコードピクチャを表すデコードビデオシーケンス24′を含む。さらに、この例によるデコードビデオシーケンス24′は、ビデオシーケンス24のピクチャ26のサブピクチャ28を含むデコードピクチャ26′を表すデコードビデオシーケンス24′を含む。
エンコーダは、OLS表示で1つ以上の有効な/抽出可能なレイヤセットを示すだけでなく、実施形態によれば、例えば、DPB及び/またはCPBのために利用可能なバッファメモリ、カーネルの処理、所望のデコード遅延などに関して、示されている特定のOLSがデコーダによってデコード可能であるかどうかをデコーダが決定するために使用できる情報をデータストリームに提供する。この情報は、デコーダ機能要件情報に含まれる場合がある。
マルチレイヤビデオデータストリーム、サブピクチャ、ビットストリームスケーラビリティ、及び基準ピクチャの概念を極一般的に説明した後、以下では、抽出ビデオデータストリーム12のビデオデータストリーム14からの抽出プロセス、ビデオデータストリーム14内の関連表示及び/またはビデオデータストリーム14のエンコード法を実施するためのいくつかの実施形態について説明する。抽出プロセスに関して説明される特徴はまた、抽出ビデオデータストリームが抽出される対応するビデオデータストリームの説明、及びビデオデータストリームの対応するエンコードプロセスの説明に相当することに留意されたい。例えば、ビデオデータストリーム14から情報を導出するようにエクストラクタ10を規定する特徴は、ビデオデータストリームから情報の導出が可能であるというビデオデータストリーム14の特徴としても理解されるべきであり、ビデオデータストリーム14を適切にエンコードすることの観点からはエンコーダ40の特徴としても理解されるべきである。
1.第1の態様によるエンコーダ40、エクストラクタ10及びビデオデータストリーム14
このセクションでは、図1を参照して第1の態様による実施形態を説明する。第1の態様による実施形態には、セクション0で説明した詳細を任意選択で適用することができる。
第1の態様の実施形態によれば、サブピクチャ別ビデオデータストリームを抽出するための装置10とも呼ばれる図1のエクストラクタ10は、マルチレイヤビデオデータストリーム14からサブピクチャ別ビデオデータストリーム12を抽出するように構成される。すなわち、第1の態様によれば、ビデオデータストリーム14は、複数のレイヤを含むとともに、ビットストリーム部分16を含み、ビットストリーム部分16のそれぞれは、マルチレイヤビデオデータストリーム14のレイヤのうちの1つ、例えばレイヤL0、L1に属する。例えば、ビットストリーム部分16のそれぞれは、それぞれのビットストリーム部分16が属するレイヤを示すレイヤIDなどの表示を含むことができる。第1の態様の実施形態によれば、エクストラクタ10は、レイヤセットからの各レイヤについて、ビデオのピクチャ(例えばピクチャ26、26、すなわちそれぞれのレイヤにエンコードされたピクチャ)が、それぞれのレイヤに相互に独立してエンコードされる2つ以上のサブピクチャ28に細分されることによって、ビデオ24の各ピクチャ26、26について、それぞれのピクチャのサブピクチャ28が、それぞれのレイヤの相互に異なるビットストリーム部分16にエンコードされるように、それぞれのレイヤにビデオ24がエンコードされているかどうか、またはサブピクチャに細分されないように、それぞれのレイヤにビデオ24がエンコードされているかどうかをチェックするように構成される。
例えば、レイヤセットは、例えば図1に関して説明したように、OLSエクストラクタ10が、API20などの外部手段によって抽出するよう指示されたOLS、またはOLSエクストラクタが、例えばそれぞれの指示がない場合に抽出されると推測したOLSによって示されるレイヤセットである。
例えば、サブピクチャ28が相互に独立してエンコードされているということは、各サブピクチャ28が(サブピクチャが属するピクチャの)他の任意のサブピクチャから独立してエンコードされ、各ビットストリーム部分16が、そこにエンコードされた1つのみ(1つを超えることはなく、あるいは1つの一部のみ)のサブピクチャを有することを意味し得る。言い換えれば、独立してコード化されたサブピクチャ28は、サブピクチャ28が属するピクチャがコード化されるビットストリーム部分16のうちから、独立してコード化されたサブピクチャ28がコード化されるビットストリーム部分以外のビットストリーム部分を必要としない場合がある。ビデオ24をサブピクチャに細分されないようにエンコードしたということは、例えば、それぞれのレイヤがコード化されるサブ部分の数が1であること、またはそれぞれのレイヤにコード化されるサブ部分の数が1であることを意味し得る。換言すれば、サブピクチャに細分されないようにエンコードされることは、各ピクチャが1つのサブピクチャとしてエンコードされるようにエンコードされることを意味し得る。
サブピクチャに細分されないようにそれぞれのレイヤにビデオがエンコードされている例えば図1のレイヤL0の場合、エクストラクタ10は、それぞれのレイヤに属するビットストリーム部分16(図1のビデオデータストリーム14及び12におけるドット状のビットストリーム部分16)を、マルチレイヤビデオデータストリーム14から、サブピクチャ別ビデオデータストリーム12に引き継いで、サブピクチャ別ビデオデータストリーム12に、それぞれのレイヤのビデオ24、例えば図1のビデオシーケンス24が完全にエンコードされているようにすることができる。それぞれのレイヤのビデオが完全にエンコードされていることは、例えば、それぞれのレイヤ、例えば、マルチレイヤビデオデータストリーム14のレイヤL0のビットストリーム部分16の全てがサブピクチャ別ビデオデータストリーム12に含まれることを意味し得る。代替的または追加的に、それぞれのレイヤのビデオ24がサブピクチャ別ビデオデータストリームに完全にエンコードされていることは、サブピクチャ別ビデオデータストリーム12に引き継がれたビットストリーム部分16が、サブピクチャ別ビデオデータストリーム12において、別のレイヤの2つ以上のサブピクチャのうちのどれが、転送されるのか、すなわち、後述する1つ以上のサブピクチャの所定のセットに属するのかの選択と無関係であることを意味し得る。
レイヤのビデオのピクチャ26、例えばレイヤL1のピクチャ26が2つ以上のサブピクチャ28に細分されるように、それぞれのレイヤ、つまり現在チェックされているレイヤにビデオ24、例えばレイヤL1のビデオシーケンス24がエンコードされていることをエクストラクタが見つけた場合、エクストラクタ10は、図1のレイヤL1などのそれぞれのレイヤに属する各ビットストリーム部分16について、ビットストリーム部分16から、2つ以上のサブピクチャのうちのどのサブピクチャがそれぞれのビットストリーム部分16にエンコードされているかを明らかにする情報を読み出すことができる。エクストラクタは、それぞれのビットストリーム部分16に、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている場合には、それぞれのレイヤのそれぞれのビットストリーム部分16を、マルチレイヤビデオデータストリーム14から、サブピクチャ別ビデオデータストリーム12に引き継ぐことができる。例えば、図1では、サブピクチャの所定のセットは、クロスハッチングで示されるサブピクチャ28のみを含む。例えば、エクストラクタ10は、それぞれのレイヤに属するが、1つ以上のサブピクチャの所定のセットに属さないサブピクチャがエンコードされている各ビットストリーム部分を、ドロップする、または残す、または除去する、すなわち、転送しないことがある。
図2は、図1に示されるシナリオに関して、本発明の第1の態様の実施形態による、ビデオデータストリーム14及びサブピクチャ別ビデオデータストリーム12においてシグナリングされる情報をより詳細に示す。図2の例示的な図によれば、サブピクチャの所定のセットは、1つのサブピクチャ28、すなわちレイヤL1のピクチャ26のクロスハッチングされたサブピクチャ28のみを含む。図2に示されるように、レイヤL0にビデオ、すなわちビデオシーケンス24が、サブピクチャに細分されないようにエンコードされているという発見に基づいて、エクストラクタ10は、レイヤL0に関連付けられている全てのビットストリーム部分16(ドット状部分16)を転送するまたは引き継ぐ。レイヤL1に関連するビットストリーム部分は、サブピクチャ分割方式でビデオデータストリーム14にエンコードされる。図2の例では、レイヤL1のピクチャ26のサブピクチャ28がコード化されるビットストリーム部分はクロスハッチングで示され、ピクチャ26のさらなるサブピクチャがコード化されるビットストリーム部分は単純にハッチングで示される。図2に示されるように、等しい提示時間のピクチャに属するビットストリーム部分は、共通アクセスユニット(AU)の一部であり得る。さらに、各ピクチャ26またはサブピクチャ28は、1つ以上のビットストリーム部分16にコード化され得ることに留意されたい。例えば、ピクチャ26またはサブピクチャ28は、スライスにさらに細分され得、そのそれぞれは、1つ以上のビットストリーム部分にコード化され得る。図2の例示的な例では、サブピクチャ28の所定のセット、すなわちデコードのためにサブピクチャ別ビデオデータストリーム12で転送される1つ以上のサブピクチャのセットは、1つのサブピクチャ、すなわちクロスハッチングされたサブピクチャ28のみを有する。したがって、レイヤL1のピクチャ26に関連付けられたビットストリーム部分のうち、サブピクチャ28のクロスハッチングされたビットストリーム部分のみが、サブピクチャ別ビデオデータストリーム12で転送される。
言い換えれば、装置10は、レイヤのビットストリーム部分16をサブストリーム12に引き継ぐ際に、レイヤが、2つ以上の独立してコード化されたサブピクチャ28の単位でコード化されているか否かに敏感であり得る。
例えば、1つ以上のサブピクチャの所定のセットは、API20などの外部手段によってエクストラクタ10に提供され得る。すなわち、エクストラクタ10は、マルチレイヤビデオデータストリーム14のレイヤのピクチャ26のどのサブピクチャがデコーダ50に転送されるべきかについての情報を受信し得る。
例えば、サブピクチャに細分されるようにエンコードされたレイヤの2つ以上のサブピクチャのサブピクチャ28がどのビットストリーム部分に属するかを明らかにする情報は、サブピクチャ識別子、例えば、SH_subpic_IDによって提供され得る。例えば、この情報、すなわちサブピクチャ識別子は、それぞれのビットストリーム部分のヘッダ、例えばスライスされたヘッダに提供され得る。換言すれば、ピクチャ26またはサブピクチャ28のうちの一方のピクチャのビデオデータがエンコードされたビットストリーム部分16は、そのビットストリーム部分の記述データにおいて、例えばインデックスによって、そのビットストリーム部分が属するサブピクチャを示すサブピクチャ識別子が関連付けられ得る。
例では、ビデオデータストリーム14は、ビットストリーム部分内のサブピクチャ識別子をビデオ24のピクチャ内のサブ部分の空間位置と関連付けるために使用されるsubpicIDValなどの関連表30を備え得る。
実施形態によれば、エクストラクタ10は、それぞれのレイヤについてビデオデータストリーム14においてシグナリングされたシンタックス要素を評価することにより、サブピクチャに細分されないようにして、またはサブピクチャに細分されるようにして、レイヤにビデオがエンコードされたかどうかのチェックを実行することができる。例えば、それぞれのシンタックス要素は、それぞれのレイヤが関連付けられているシーケンスパラメータセットでシグナリングされ得る。例えば、シンタックス要素は、それぞれのレイヤにコード化されたいくつかのサブピクチャまたはサブ部分を明らかにすることができる。シンタックス要素は、ピクチャまたはサブピクチャ構成データ22に含まれてもよく、例では、ビデオデータストリーム14、例えばシーケンスパラメータセット(SPS)でシグナリングされてもよい。例えば、それぞれのシンタックス要素は、sps_num_subpics_minus1シンタックス要素であってもよい。
図2に示されるように、ビデオデータストリーム14は、OLS表示18を任意選択で含むことができ、これは、レイヤセット、例えばOLS、例えばサブピクチャ別ビデオデータストリーム12において少なくとも部分的に転送されるように示されるレイヤセットを示す。前述のように、OLS表示18は、例えば、サブピクチャ別ビデオデータストリーム12で転送されるように示されたレイヤセットを含むOLSのセットを含むことができる。例えば、API20は、例えば、OLS表示18のOLSの1つを提示するインデックスを示すことにより、OLS表示18のOLSのうちのどれがサブピクチャ別ビデオデータストリーム12で転送されるべきかをエクストラクタ10に示す。
ビデオデータストリーム14は、デコーダ機能要件情報60を任意選択でさらに含むことができ、これは、例えば、ピクチャサイズ、CPB及び/またはDPBのバッファサイズなどのバッファサイズ、及び同様の情報、例えば、HRD、DPD及びTPL情報に関する情報を含むことができる。情報は、ビデオデータストリーム14において、その様々なバージョンのリストの形で与えることができ、特定のOLSに適用されるバージョンは、索引付けによって参照される。すなわち、特定の抽出可能なOLS、例えば、OLS表示18によって示されるOLSについて、対応するHRD、DPD、及び/またはTPL情報を提示するインデックスがシグナリングされ得る。
デコーダ機能要件情報60は、マルチレイヤビデオデータストリーム14から抽出可能なサブピクチャ別ビデオデータストリーム12に関する情報であり得る。例えば、デコーダ機能要件情報60またはその一部は、エクストラクタ10が、それぞれの抽出可能なサブピクチャ別ビデオデータストリーム12を抽出するための抽出プロセスを実行するようにして、実際に抽出プロセスを実行することにより、エンコーダ40によって決定され得る。エンコーダ40は、デコーダ機能要件情報60の特定のパラメータを決定するために、少なくともある程度抽出プロセスを実行することができる。
エクストラクタ10は、データストリーム12からデータストリーム14を形成するときに、いくつかのデータを適応させることができることに留意されたい。図1では、ビデオデータストリーム12のビットストリーム部分の参照符号16にアポストロフィを使用することによって、この可能性が示されている。図2に示されるストリーム12の成分についても同様であり、これはまた、任意選択で、図1のビデオデータストリーム12の一部であってもよい。これらの成分はまた、本明細書で説明されるさらなる態様によるビデオデータストリーム14及び12の実施形態にも存在し得る。例えば、ストリーム14内のピクチャ構成データ22は、データストリーム14にコード化されたフルピクチャ26のピクチャサイズを示し、ストリーム12内のピクチャ構成データ22′は、データストリーム14にコード化され次にサブピクチャに細分されないストリーム12にコード化されたピクチャ26’、すなわち1つのサブピクチャ28からのピクチャ26’のピクチャサイズを示す。VCL NALユニットなど、実際のピクチャコンテンツがエンコードされたビットストリームパケット16は、その少なくとも算術的にコード化された部分に関しては、何の修正もなしにそのまま引き継ぐことができる。図からわかるように、OLS表示18′でさえ、ストリーム14からストリーム12に引き継がれる可能性がある。ストリーム14のままにしておくこともできる。関連表30もそれに応じて修正されていてもよい。データ項目18、20、及び22のいずれかの修正バージョンは、ストリーム12に隠されている/ネストされている場合があり、つまり、エンコーダ40によってその中に提供されている場合があり、したがって、ストリーム14を形成するときにストリーム12に生じる、対応する却下されたバージョンを置き換えるために、エクストラクタによって単に使用される場合があり、またはストリーム14内の全体的な情報に基づいてオンザフライでエクストラクタ10によって解釈され、ストリーム12に配置される場合がある。デコーダ50は、ストリーム12を受信するかまたは供給されるとき、サブピクチャ細分レイヤL1のピクチャ26がストリーム14でかつてどのように見えたかに関して、もはや見ることができない場合がある。
チェックに依存して、エクストラクタ10はさらに、PPS及びSPSなどの特定のレイヤ別パラメータセットが、スクラッチから適宜に、適応されるか、または新たに生成されるかどうかを決定し、その結果、その中の特定のパラメータがサブピクチャ別データストリーム12に適応されることに留意されたい。このようなパラメータは、ピクチャまたはサブピクチャ構成データ22における前述のピクチャサイズ及びサブピクチャ構成、クロッピングウィンドウオフセット、レベルインジケータを含む。したがって、ピクチャサイズ及びサブピクチャ構成の観点からのデータストリーム12におけるピクチャまたはサブピクチャ構成データ22の適応など、適応は、サブピクチャに細分されていないレイヤ、すなわち「サブピクチャに細分されないように、それぞれのレイヤにビデオがエンコードされている場合」に対しては行われず、「ビデオのピクチャ(26)が2つ以上のサブピクチャ(28)に細分されるように、それぞれのレイヤにビデオ(24)がエンコードされている場合」に行われる。
例えば、ピクチャ26がサブピクチャ別ビデオデータストリーム12で転送されるとき、これらのピクチャは、例えばレイヤL1のサブピクチャ28のための基準レイヤとして利用可能である。例えば、図1に関して説明したように、マルチレイヤビデオデータストリーム14は、例えばデータストリームのデータレートのスケーラビリティを可能にすることができる。この目的のために、ベースレイヤ、例えばレイヤL0には、ビデオが第1の解像度でエンコードされ得、エンハンスメントレイヤ、例えばレイヤL1は、第1の解像度よりも高い第2の解像度のビデオに関する情報がエンコードされ得るレイヤであり得る。例えば、エンハンスメントレイヤにエンコードされたピクチャ26のデコードには、ベースレイヤの時間的に配列されたピクチャの情報を必要とし得る。換言すれば、ベースレイヤは、エンハンスメントレイヤの基準レイヤであり得る。したがって、このシナリオでは、ベースレイヤとエンハンスメントレイヤの両方がレイヤセットの一部である場合に、エンハンスメントレイヤのサブピクチャの、ベースレイヤの一部である基準ピクチャが、サブピクチャ別ビデオデータストリームで利用可能であることを保証することができる。さらに、低解像度ビデオが、サブピクチャに細分されないようにベースレイヤにコード化される例では、その結果として、提示された概念によれば、ベースレイヤのビットストリーム部分がサブピクチャ別ビデオデータストリームに引き継がれる。したがって、ビデオコンテンツ全体の少なくとも低解像度ビデオがサブピクチャ別ビデオデータストリームで利用可能であることを保証することができ、その結果、提示すべき、したがってデコードすべきサブピクチャが変更された場合に、ベースレイヤの少なくとも低解像度ピクチャが直ちにデコーダで利用可能であり、サブピクチャをすばやく変更することを可能にする。
言い換えると、スケーラブルなコード化がサブピクチャと組み合わされて使用される場合、例えば、ビューポートに依存する360度ビデオストリーミングのシナリオでは、1つの一般的なセットアップは、360度ビデオシーン全体を描写する低解像度のベースレイヤと、より高い忠実度または空間解像度でシーンを含むエンハンスメントレイヤとを持つことであるが、エンハンスメントレイヤ画像は、いくつかの独立してコード化されたサブピクチャに細分される。このようなセットアップでは、エンハンスメントレイヤと非サブピクチャベースレイヤとから単一のサブピクチャ、例えばクライアントの視線方向に対応するピクチャ部分を抽出し、これをフル360度ビデオベースレイヤと共にデコードすることが可能である。
上記のようなビットストリーム構成(非サブピクチャ基準レイヤを含むサブピクチャ)の場合、VVC仕様などの最先端の抽出プロセスでは、適合したビットストリームにはならない。例えば(例えば、OLS表示18からOLS表示18′を導き出すために)inBitstreamのそのままのコピーから一時的なoutBitstreamを作成した後、インデックスsubpicIdxでサブピクチャを抽出するときに、現在のVVCドラフト仕様のサブピクチャサブビットストリーム抽出プロセスでは、抽出されたOLSの各レイヤiに対して次のステップが実行される。
-nuh_layer_idがi番目のレイヤのnuh_layer_idに等しく、sh_subpic_idがSubpicIdVal[subpicIdx]に等しくない、全てのVCL NALユニットをoutBitstreamから削除する。すなわち、nuh_layer_idがi番目のレイヤのnuh_layer_idと等しく、sh_subpic_idがSubpicIdVal[subpicIdx]と等しいVCL NALユニットのみを、抽出されたビットストリームに引き継ぐ。
抽出すべきサブピクチャとは異なるサブピクチャIDを持つ全てのVCL NALユニットが削除されることに注意されたい。
ここで、SubpicIdValは、サブピクチャがビットストリーム及び関連するシグナリング構造に現れるサブピクチャのインデックスIdx順序からのAU別マッピングであり、サブピクチャに属するスライスのスライスヘッダにシンタックス要素sh_subpic_idとして持ち込まれ、抽出中にサブピクチャを識別するために、例えばエクストラクタによって役立てられる識別子ID値である。
図3は、マルチレイヤビデオデータストリーム14の例を示しており、これは、図1及び図2に関して説明したビデオデータストリーム14の例であり得る。図3によれば、ビデオの4つのアクセスユニットのシーケンスが示されている。レイヤL1のピクチャ26のそれぞれは、2つのサブピクチャ、インデックス0でインデックス付けされた第1のサブピクチャと、インデックス1でインデックス付けされた第2のサブピクチャとに細分され、一方レイヤL0のピクチャ26は、細分されないようにしてコード化される。
従来、図3の上部に示されているオリジナルビットストリームが、サブピクチャ、例えばsubpicIdx 1の抽出の対象となる場合、図3の下部に示すように、L1がL0からのレイヤ間基準ピクチャ(ILRP)を欠いているため、非適合ビットストリーム12*が作成される。サブピクチャIDはビットストリームの過程で変化する可能性があるため、抽出はインデックスベースであることに注意されたい。このようなステップを実行すると、サブピクチャインデックスが0であるため、非サブピクチャレイヤから全てのNALユニット、例えばビットストリーム部分が削除される結果になるのは明らかである。
したがって、第1の態様による実施形態は、サブピクチャ別ビデオデータストリームが非サブピクチャレイヤを含むシナリオにおいて、サブピクチャ別ビデオデータストリームの抽出を可能にすることができる。換言すれば、実施形態は、サブピクチャが非サブピクチャレイヤへの参照を有することができるサブピクチャ別ビデオデータストリームの抽出を可能にすることができる。
換言すれば、対照的に、本発明の第1の態様による実施形態は、そのサブピクチャ構成に応じて、OLS内の各レイヤからNALユニットを抽出(すなわち除去)することを可能にすることができる。例えば、一実施形態では、上記の除去ステップは、サブピクチャの存在、例えばレイヤSPS内のサブピクチャの数を通じて、以下のように条件付けられる。
-sps_num_subpics_minus1が0より大きい場合、nuh_layer_idがi番目のレイヤのnuh_layer_idに等しく、sh_subpic_idがSubpicIdVal[subpicIdx]に等しくない、全てのVCL NALユニットをoutBitstreamから削除する。
特に、VCL NALユニットの削除を、少なくとも2つのサブピクチャを持つレイヤまたはピクチャに制限する、「sps_num_subpics_minus1が0より大きい場合」の部分に注意されたい。
別の実施形態では、各レイヤの非VCL NALユニットに関する上記の抽出プロセスの追加ステップ、例えばピクチャサイズ、クロッピングウィンドウオフセット、レベルidc及びサブピクチャ構成に関するSPS/PPS調整などは、以下のように、サブピクチャの存在に基づいて省略される。
出力サブビットストリームoutBitstreamは次のように導出される。
-添付書類C.6に規定されているサブビットストリーム抽出プロセスが、inBitstream、targetOlsIdx、及びtIdTargetを入力として呼び出され、プロセスの出力がoutBitstreamに割り当てられる。
-サブビットストリームoutBitstreamの置換パラメータセットを提供するための本明細書に規定されていない外部手段が利用できる場合、全てのパラメータセットを置換パラメータセットで置き換える。
-それ以外の場合、サブピクチャレベル情報SEIメッセージがinBitstreamに存在する場合、以下が適用される。
[…]
NumLayersInOls[targetOlsIdx]-1から0の範囲のiを持つi番目のレイヤに対して以下が適用される。
- sps_num_subpics_minus1が0より大きい場合、以下が適用される。
[…]レベル、ピクチャサイズ、//適合ウィンドウ、及びサブピクチャパラメータに関するSPS/PPSの調整、VCL NALユニットの削除などの//レイヤ別タスク
この場合もやはり、レイヤ別タスクを、少なくとも2つのサブピクチャを持つレイヤまたはピクチャに制限する、「sps_num_subpics_minus1が0より大きい場合」の部分に注意されたい。
図4は、適合ビットストリームをもたらす抽出プロセスにおいて上記の実施形態が使用されるときの、サブピクチャ別ビデオデータストリーム12の抽出の例示的な結果を示す。
2.第2の態様によるエンコーダ40、エクストラクタ10及びビデオデータストリーム14
このセクションでは、本発明の第2の態様によるエンコーダ40、エクストラクタ10、及びビデオデータストリーム14の実施形態について説明する。第2の態様によるエンコーダ40、エクストラクタ10、及びビデオデータストリーム14は、図1に関して説明したエンコーダ40、エクストラクタ10、及びビデオデータストリーム14に従ってもよく、任意選択で、セクション1の図2に関して説明した第1の態様に従ってもよい。
図5は、エンコーダ40、エクストラクタ10、デコーダ50、及びビデオデータストリーム14の実施形態を示しており、ビデオデータストリーム14は、例えば、図1及び図2に関して説明したように、少なくとも第1のレイヤL1及び第2のレイヤL0を含む。図5に例示的に示されるシナリオのビデオシーケンス24、ピクチャ26及びサブピクチャ28は、図1及び図2に示されるシナリオの説明に従うことができる。
第2の態様の実施形態によれば、マルチレイヤビデオデータストリーム14は、ビットストリーム部分16、例えばNALユニットで構成されるか、またはそれらを含み、そのそれぞれは、例えば、それぞれのビットストリーム部分に関連付けられたレイヤIDによって示されるように、マルチレイヤビデオデータストリーム14のレイヤの1つに属する。マルチレイヤビデオデータストリーム14は、第1のレイヤ、例えば図5のレイヤL1を含み、その左側のビットストリーム部分16には、第1のビデオ24のピクチャ26が、2つ以上のサブピクチャ28、例えば、レイヤL1のピクチャ26の単純ハッチングとクロスハッチングとの半分に細分されるように、第1のビデオ24がエンコードされている。サブピクチャ28は、第1のレイヤL1のビットストリーム部分16に相互に独立してエンコードされることによって、第1のビデオ24の各ピクチャ26について、第1のビデオのそれぞれのピクチャのサブピクチャ28が、第1のレイヤL1の相互に異なるビットストリーム部分16にエンコードされる。例えば、図2に関して既に説明したように、単純ハッチングされたサブピクチャ28は、ビデオデータストリーム14の単純ハッチングされたビットストリーム部分にエンコードされ、クロスハッチングされたサブピクチャ28は、ビデオデータストリーム14のクロスハッチングされたビットストリーム部分にエンコードされる。マルチレイヤビデオデータストリーム14は、第2のレイヤ、例えば図5のレイヤL0をさらに含み、その左側のビットストリーム部分には、第2のビデオ24がエンコードされている。例えば、第2のビデオ24は、少なくとも第1のビデオ24のビデオコンテンツをカバーし、時間的に整列されるビデオコンテンツに関連するので、第2のビデオに基づく第1のビデオのレイヤ間予測が実行可能である。例えば、レイヤL0のピクチャ26のビデオコンテンツは、レイヤL1の時間的に整列されたピクチャ26のビデオコンテンツをカバーすることができる。第2のビデオ24は、例では、第1のビデオ24に空間的に対応する第2のビデオ24の空間ピクチャ領域に関して、サブピクチャに細分されないように、ビデオデータストリーム14の第2のレイヤL0にエンコードされるが、必ずしもそうではない。換言すれば、第2のレイヤL0にコード化されるサブ部分の数は1つであってもよい。さらに言い換えると、第2のレイヤL0の各ピクチャは1つのサブピクチャとしてエンコードすることができ、または例えば代わりに、サブ部分に細分される場合、1つのサブ部分が第1のビデオのフットプリントを完全にカバーすることもできる。第1のレイヤのビットストリーム部分、すなわちクロスハッチング部分及び単純ハッチング部分には、基準ピクチャからのベクトルベースの予測を使用して、第1のビデオ24がエンコードされている。さらに、第1のレイヤのビットストリーム部分には、第1のビデオ24が、第2のビデオ24の(例えば、少なくとも)ピクチャを基準ピクチャとして含めるようにして、かつ第1のレイヤのビットストリーム部分がエンコードされるベクトルを使用して、第1のレイヤのビットストリーム部分によって構成され、またはシグナリングされるベクトルが、ベクトルベースのユーザ予測での使用のために、第1のビデオのピクチャ26及び基準ピクチャ26に対して、それぞれマルチレイヤビデオデータストリーム14でのスケーリングウィンドウ72のサイズ及び位置に従ってスケーリング及びオフセットが行われるようにして、エンコードされている。
例えば、第2のビデオ24のピクチャは、第1のレイヤのビットストリーム部分がベクトルベースの予測を使用してエンコードされた基準ピクチャを使用して少なくとも基準ピクチャに含まれる。例えば、図5のピクチャ26は、ピクチャ26の基準ピクチャであり得る。換言すれば、第2のビデオ24のピクチャ26は、第1のビデオ24のピクチャ26をエンコードするためのレイヤ間基準ピクチャとして機能することができる。例えば、ベクトルベース予測は、動きベクトルベースの予測フレームワークに含まれる場合があり、「動き」という用語は、一般に、ある基準ピクチャから予測される第1のビデオ24内のピクチャコンテンツが、それが予測される基準ピクチャ内のその対応するピクチャコンテンツから、何らかのベクトルによって空間的に移動される事実を意味する。すなわち、ピクチャコンテンツが動かされ、基準ピクチャは、例えば、第1のビデオ24の以前にコード化されたピクチャ、または第2のビデオ24の同時時間的または時間的に整列されたピクチャであり得る。例えば、図5の第1のビデオ24及び第2のビデオ24の図で重なり合って描かれたピクチャ26は、そのようなピクチャであり得る。
スケーリングウィンドウ72のサイズ及び位置に応じたベクトル70のオフセットは、スケールウィンドウ間、例えば、レイヤL0のスケールウィンドウ72とレイヤL1のスケーリングウィンドウ72との間の位置オフセットに従って実行され得る。さらに、例えば、スケーリングウィンドウ72のサイズ及び位置に応じたベクトル70のスケーリングは、スケーリングウィンドウ間、例えば、スケーリングウィンドウ72及び72間のサイズ比に従って実行され得る。
例えば、スケーリングウィンドウ72のサイズ及び位置は、例えば、ピクチャごとに、スケーリングウィンドウ表示72によってマルチレイヤビデオデータストリーム14内でシグナリングされ得る。例えば、スケーリングウィンドウ72のサイズ及び位置は、スケーリングウィンドウの対向する2つの角の位置、または1つの角の位置ならびにx及びyにおけるスケーリングウィンドウの寸法の表示によってシグナリングされ得る。スケーリングウィンドウの特定の位置を、1または複数の座標及びその寸法を使用するのとは異なる方法で、例えば、スケーリングウィンドウがピクチャ境界と一致することを対応するフラグを使用して示すなどにより、シグナリングすることも実行可能であることに留意されたい。後者の場合、例では、スケーリングウィンドウの位置がピクチャ境界と一致していないことをフラグが示している場合にのみ、スケーリングウィンドウの位置が座標などを使用して示される。
第2の態様によるエクストラクタ10は、第2のレイヤL0に属するビットストリーム部分を、マルチレイヤビデオデータストリーム14から、サブピクチャ別ビデオデータストリーム12に引き継いで、サブピクチャ別ビデオデータストリーム12に、それぞれのレイヤのビデオ24が完全にエンコードされているようにするように構成される。例えば、エクストラクタ10は、レイヤL0のビットストリーム部分16の全てを転送するか、または第1のレイヤL1の2つ以上のサブピクチャのうちのどれがサブピクチャ別ビデオデータストリーム12に転送されるかに関係なく、すなわち、第1のレイヤL1のうちのどのサブピクチャが、以下に説明する1つ以上のサブピクチャの所定のセットに属するかに関係なく、レイヤL0に関連するビットストリーム部分を転送することができる。言い換えれば、第2の態様による装置10は、例えば、サブピクチャに細分されないようにエンコードされるレイヤL0の場合について図1及び図2に関して説明したように、第2のレイヤL0のビットストリーム部分を引き継ぐことができる。
第2の態様によるエクストラクタ10は、さらに、第1のレイヤL1に属し、1つ以上のサブピクチャの所定のセットに属するサブピクチャ28がエンコードされている各ビットストリーム部分を、マルチレイヤビデオデータストリーム14から、サブピクチャ別ビデオデータストリーム12に引き継ぐように構成される。例えば、エクストラクタ10は、それぞれのレイヤ、例えば、レイヤL1に属するが、1つ以上のサブピクチャの所定のセットに属さないサブピクチャ28がエンコードされている各ビットストリーム部分を、ドロップする、または残す、または除去する、すなわち、転送しないことがある。換言すれば、第2の態様によるエクストラクタ10は、第1の態様に関して説明したように、サブピクチャの所定のセットのセットに属する第1のレイヤL1のビットストリーム部分を選択的に転送することができる(図1及び図2参照)。図1及び図2に関して説明したように、1つ以上のサブピクチャの所定のセットは、APIによってエクストラクタ10に提供される情報によって示され得る。
エクストラクタ10は、さらに、第2のビデオのピクチャに対するスケーリングウィンドウ72’の空間領域が、1つ以上のサブピクチャの所定のセットに対するスケーリングウィンドウ72’の空間領域に空間的に対応するように、サブピクチャ別ビデオデータストリーム12における第1のレイヤL1及び/または第2のレイヤL0にスケーリングウィンドウシグナル伝達74を適応させるように構成される。
図5に示すように、サブピクチャ別ビデオデータストリーム12の抽出後、1つ以上のサブピクチャの所定のセットによって定義されるサブピクチャは、抽出の結果、1つ以上のサブピクチャの所定のセットのサブピクチャ、例えば図5のサブピクチャ28に適応させて、データストリーム12の第1のレイヤL1のピクチャ26’になるか、またはそれらを構成する。エクストラクタ10は、スケーリングウィンドウ72’、72’を使用してスケーリングした後のサブピクチャ別ビデオデータストリーム12の第2のレイヤL0のベクトル70のスケーリングが、サブピクチャ別ビデオデータストリーム12の第1のレイヤL1の配列ピクチャ26’におけるサイズ及び位置を有するベクトル70に関連付けられ、またはマッピングされるように、スケーリングウィンドウシグナル伝達を適応させることができ、そのサイズ及び位置は、マルチレイヤビデオデータストリーム14において第2のレイヤL0のピクチャのベクトル70がスケーリングウィンドウ72、72を使用して関連付けられ、またはマッピングされるベクトル70のサイズ及び位置に対応する。換言すれば、エクストラクタ10は、スケーリングウィンドウ72′、72′がデータストリーム12の第1のレイヤL1のピクチャ26′内の所与の位置のベクトル70を決定するように、スケーリングウィンドウシグナル伝達74を適応させることができる。この決定の結果、マルチレイヤビデオデータストリーム14のレイヤL1のピクチャ26内の対応する位置(ピクチャの境界に対してではなく内容的にピクチャ26’内の位置へ対応する対応位置)のベクトル70に対応するサイズ及び位置のベクトルとなる。しかしながら、ピクチャ26′のサイズはピクチャ26に対して変化している可能性があるため、スケーリングウィンドウは、ピクチャの境界に対して定義される場合、ピクチャの境界26′に対するそれらの位置に関して適応されまたはシフトされる必要がある可能性がある。
実施形態によれば、エクストラクタ10は、第1のレイヤL1のスケーリングウィンドウ72′が位置及びサイズにおいて第2のレイヤのスケーリングウィンドウ72′に対応するように、第1のレイヤL1のスケーリングウィンドウシグナル伝達74を適応させることができる。この例は、実線で描かれたスケーリングウィンドウ72′、72′によって図5に示されている。
あるいは、エクストラクタ10は、図5に破線で示され、または図6にも示されているスケーリングウィンドウ72’、72’によって示されるように、1つ以上のサブピクチャの所定のセットの外周と一致するように、第2のレイヤL0のスケーリングウィンドウ72′を定義することによって、スケーリングウィンドウシグナル伝達74を適応させることができる。
さらなる実施形態によれば、エクストラクタ10は、第1のレイヤ及び第2のレイヤの両方に対してスケーリングウィンドウシグナル伝達を適応させることができ、すなわち、スケーリングウィンドウ72’及び72’の外周が一致するようにスケーリングウィンドウ72’及び72’を適応させることができる。
例えば、エクストラクタ10は、データストリーム14内のサブピクチャ構成データ22を使用することによって、スケーリングウィンドウシグナル伝達74を適応させることができる。言い換えれば、エクストラクタ10は、データストリーム12内のサブピクチャ構成データ22’を提供するように、データストリーム14内のサブピクチャ構成データ22を適応させることができる。例えば、サブピクチャ構成データ22は、スケーリングウィンドウの位置及びサイズの表示を含むことができる。エクストラクタ10は、サブピクチャ構成データ22′を得るために、構成データ22内のスケーリングウィンドウの位置及びサイズを適応させることができる。
図2に関して提供されたエクストラクタ10によるビットストリーム部分の隠蔽された方法での適応もしくは組み込み、または新たな生成に関する同じ注記が、図5にも適用されることに留意されたい(データストリームのビットストリーム部分に使用されるアポストロフィを参照)。ここで、情報74は、エンコーダによって隠された形で含まれるか、またはオンザフライでエクストラクタによって新たに適応もしくは生成される情報の別の例である。
図6は、第2のレイヤL0のスケーリングウィンドウ72’がエクストラクタ10によって適応される上記の例を示す。換言すれば、図6は、レイヤL1及びレイヤL0の右側のサブピクチャを抽出する場合のスケーリングウィンドウの調整の例を示している。
スケーリングウィンドウを適応させるための実施態様の例示的な仕様を以下に示す。
出力サブビットストリームoutBitstreamは次のように導出される。
- 添付書類C.6に規定されているサブビットストリーム抽出プロセスが、inBitstream、targetOlsIdx、及びtIdTargetを入力として呼び出され、プロセスの出力がoutBitstreamに割り当てられる。
- サブビットストリームoutBitstreamの置換パラメータセットを提供するための本明細書に規定されていない外部手段が利用できる場合、全てのパラメータセットを置換パラメータセットで置き換える。
- それ以外の場合、サブピクチャレベル情報SEIメッセージがinBitstreamに存在する場合、以下が適用される。
[…]
NumLayersInOls[targetOlsIdx]-1から0の範囲のiを持つi番目のレイヤに対して以下が適用される。
- sps_num_subpics_minus1が0より大きい場合、以下が適用される。
[…]レベル、ピクチャ//サイズ、適合ウィンドウ、及びサブピクチャパラメータに関するSPS/PPSの調整、VCL NALユニットの削除などの//他のレイヤ別タスクj- 変数subPicLeftPos、subPicRightPos、subPicTopPos、及びsubPicBottomPosは、次のように導出される。
subPicLeftPos=sps_subpic_ctu_top_left_x[subpicIdx]*CtbSizeY (C.XX)
subPicRightPos=subPicLeftPos+(sps_subpic_width_minus1[subpicIdx]+1)*CtbSizeY (C.XX)
subPicTopPos=sps_subpic_ctu_top_left_y[subpicIdx]*CtbSizeY (C.XX)
subPicBottomPos=subPicTopPos+(sps_subpic_height_minus1[subpicIdx]+1)*CtbSizeY (C.XX)
[…]//レベル、ピクチャサイズ、適合ウィンドウ、及びサブピクチャパラメータに関するSPS/PPSの調整、//VCL NALユニットの削除などの//残り他のレイヤ別タスク
- それ以外の場合(sps_num_subpics_minus1が0の場合、以下が適用される。
- 参照される全てのPPSNALユニットのpps_scaling_win_left_offset、pps_scaling_win_right_offset、pps_scaling_win_top_offset、及びpps_scaling_win_bottom_offsetの値をそれぞれsubPicLeftPos、(ppsPicWidth-subPicRightPos)、subPicTopPos、及び(ppsPicHeight-subPicBottom)と等しくなるように書き換える。
図5及び図6に関して説明された第2の態様による実施形態は、ベクトルベース予測で使用されるベクトル17が、抽出されたサブピクチャ別ビデオデータストリーム12のデコードで正しくマッピングされ得るので、レイヤ間予測とデータストリーム12などのサブピクチャ別ビデオデータストリームの抽出とを組み合わせて行うことを可能にする。
言い換えると、オリジナルビットストリームには、それぞれのPPSのいわゆるスケーリングウィンドウを介して正しいアップスケールフィルタとMVオフセットとを適用するようにレイヤ間予測を誘導する制御情報が含まれているが、1つのELサブピクチャ+フルBLを抽出した結果のサブビットストリームでは、このような上位のパラメータを正しくデコードできるように調整することが重要である。したがって、この章の態様の一部として、スケーリングウィンドウオフセットパラメータは、MVオフセット及びスケーリングファクタの導出に関してエンハンスメントレイヤのドロップされたサブピクチャを補償するために調整される。図6では、エンハンスメントレイヤに2つのサブピクチャを含む例が示されている。ベースレイヤL0及びエンハンスメントレイヤL1のスケーリングウィンドウがどのように調整され、エンコーダ側で最初に実行されたように、デコーダ側で正しいレイヤ間予測が行われるか、つまり、サブピクチャ(L1)を含むレイヤのスケーリングウィンドウは、図6の右側に示すように、抽出されたサブピクチャにのみ対応する抽出後の完全なコード化画像領域を包含するように書き換えられる。その一方でサブピクチャのないレイヤ(L0)は、上位レイヤの抽出されたサブピクチャに対応するピクチャ領域のみを含むように書き換えられる。つまり、残りのL1コード化ピクチャ領域またはサブピクチャの予測に必要なサンプルを含む。同様のことが上記の例にも当てはまり、それに従って、1つ以上のサブピクチャの所定のセットによって定義される1つ以上のサブピクチャがエクストラクタ10によって抽出される第1のレイヤL1のスケーリングウィンドウ72’が適応される。
3.第3の態様によるエンコーダ40及びデコーダ50
このセクションでは、図1を参照して第3の態様による実施形態を説明する。第3の態様による実施形態には、セクション0で説明した詳細を任意選択で適用することができる。また、図2及び図5に示されるデータストリーム12、14の詳細は、第3の態様の実施形態に含まれてもよく、その場合、セクション1及び2の対応する説明が適宜適用される。
前述のように、エンコーダ40は、ビデオ24のピクチャ26のエンコードにレイヤ間予測を適用することができる。例えば、エンコーダ14は、レイヤL1のピクチャ26のエンコードのためにレイヤ間予測を使用することができる。エンコーダ40は、例えば、ピクチャ26のエンコードにおけるレイヤ間予測のために、ピクチャ26と時間的に配置されたピクチャ26を使用することができる。例えば、エンコーダ40は、時間動きベクトル予測(TMVP)を使用して、ピクチャ26のエンコードのための動きベクトルを予測することができる。レイヤ間予測に使用できる方法の他の例は、オプティカルフローによる予測の精緻化(PROF)または動きベクトルラップアラウンドである。これについては、以下でより正確に説明する。前述のように、エンコードすべきピクチャの予測に使用されるピクチャは、エンコードすべきピクチャの基準ピクチャと呼ばれることがある。
TMVPが基準ピクチャ動きベクトル(MV)ストレージのリサンプリングを必要とする場合、例えば、単レイヤ解像度の変更またはマルチレイヤ空間スケーラビリティ(マルチレイヤビデオシーケンス24によって提供される場合があるため)、ゲーティング変数RprConstraintsActive[currentPic][refPic]は、次のようにTMVPの使用を無効にするために使用される。
sh_collocated_ref_idxによって参照されるピクチャは、コード化されたピクチャの全てのスライスで同じであるとし、RprConstraintsActive[sh_collocated_from_l0_flag?0:1][sh_collocated_ref_idx]が0に等しいことは、ビットストリーム適合の要件とする。
注-上記の制約では、配列ピクチャが現在のピクチャと同じ空間解像度と同じスケーリングウィンドウオフセットを持つ必要がある。
図7は、マルチレイヤビットストリームからのサブピクチャ別ビデオデータストリームの抽出の例を示しており、第1のレイヤL1のピクチャ26がサブピクチャ28に細分され、第2のレイヤL0の配列ピクチャ26は細分されず、つまり、単一のサブピクチャにコード化される。前述のように、セクション内の実施形態は、図1の要素の説明及び対応する参照符号が適用されるように、図1に関して説明される。さらに、図2に関する対応する要素の説明は、第3の態様による実施形態にも適用することができる。
上で説明したように(セクション1及び2など)、OLSでサブピクチャを含むレイヤがサブピクチャを含まないレイヤと組み合わされ、図7の左側のオリジナルビットストリームを介して示されているように、空間スケーラビリティが使用されない場合、エンコーダもTMVPを使用できるようになる。
ただし、図7の右側に示すようにサブピクチャが抽出され、抽出プロセス中にスケーリングウィンドウが調整されて、サンプル値のレイヤ間予測が適切に動作できるようになると、問題が発生する。抽出後、RprConstraintsActive[currentPic][refPic]の導出条件が変更され、TMVPが禁止されたことは、現在のVVCドラフト仕様の次のセクション、特に「RprConstraintsActive[i][j]」が定義された部分からわかる。
それ以外の場合、基準ピクチャリストRefPicList[0]及びRefPicList[1]、基準ピクチャのスケーリング比RefPicScale[i][j][0]及びRefPicScale[i][j][1]、ならびに基準ピクチャのスケーリングフラグRprConstraintsActive
[j]及びRprConstraintsActive[1][j]は、次のように導出される。
for(i=0;i<2;i++){
for(j=0,k=0,pocBase=PicOrderCntVal;j<num_ref_entries[i][RplsIdx[i]];j++){
[…]
fRefWidthは基準ピクチャRefPicList[i][j]のPicOutputWidthLと等しく設定される
fRefHeightは基準ピクチャRefPicList[i][j]のPicOutputHeightLと等しく設定される
refPicWidth、refPicHeight、refScalingWinLeftOffset、refScalingWinRightOffset、refScalingWinTopOffset、
及びrefScalingWinBottomOffsetは、基準ピクチャ
RefPicList[i][j]のpps_pic_width_in_luma_samples、
pps_pic_height_in_luma_samples、pps_scaling_win_left_offset、pps_scaling_win_right_offset、
pps_scaling_win_top_offset、及びpps_scaling_win_bottom_offsetの値とそれぞれ等しく設定される

RefPicScale[i][j][0]=((fRefWidth<<14)+(PicOutputWidthL>>1))/PicOutputWidthL
RefPicScale[i][j][1]=((fRefHeight<<14)+(PicOutputHeightL>>1))/PicOutputHeightL
RprConstraintsActive[i][j]=( pps_pic_width_in_luma_samples!=refPicWidth|||
pps_pic_height_in_luma_samples!=refPicHeight|||
pps_scaling_win_left_offset!=refScalingWinLeftOffset|||
pps_scaling_win_right_offset!=refScalingWinRightOffset|||
pps_scaling_win_top_offset!=refScalingWinTopOffset|||
pps_scaling_win_bottom_offset!=refScalingWinBottomOffset)


RprConstraintsActive[i][j]が定義されている部分は、本セクションで前述した「上記の制約(基準ピクチャの制約)は、配列ピクチャが現在のピクチャと同じ空間解像度及び同じスケーリングウィンドウオフセットを持つことを必要とする」という注記に対応する条件を定義する。TMVPなどの任意のシンタックスベースの予測は、現在のピクチャと基準ピクチャとのサイズが異なる場合、例えば、CVS(コード化ビデオシーケンス)の単一レイヤ解像度変更または空間スケーラブルビットストリームのレイヤ間予測では、関係する予測機構に特別な予防措置が必要となるため、禁止されている。例えば、MV候補などのシンタックスは、シンタックス予測の目的で、16×16サンプルなどの特別な通常のストレージグリッドに格納され、解像度を変更せずに、現在のピクチャの(CTU-)ブロック境界がこの通常のストレージの境界と合わせられる。したがって、同じ場所にあるMVストレージ位置を見つけることは比較的簡単であるが、1に等しくないサンプリング比(つまり、参照及び現在のピクチャの間の解像度の変化)が発生した場合、または任意の位置オフセットが(参照及び現在のピクチャの間の異なるスケーリングウィンドウ位置を介して)使用された場合には、上記の境界はもはや合わなくっている可能性がある。予測に使用するための正しいMVストレージ位置の導出は、追加の実装負担となる。VVCの場合、単一レイヤ解像度変更の主なユースケースではめったに発生しないと想定されるため、この場合の特別な予防措置を組み込まないように設計上のトレードオフが取られた。マルチレイヤアプリケーションは、コーデックの主要なターゲットではない。
また、現在、動きベクトル予測では、スケーリングウィンドウを使用していないことに注意されたい。スケーリングウィンドウは、ブロックに使用される動きベクトルに基づくサンプル予測にのみ使用される。つまり、スケーリングウィンドウは、動きベクトルをオフセットする方法を定義する。ただし、動きベクトル予測ではスケーリングウィンドウは無視され、ピクチャの左上のブロックは別のピクチャの左上のブロック(同じ場所に配置されたブロック)にマッピングされる。そのため、図示の例では、抽出が実行されると、抽出前と比較して、まったく異なるブロックが同じ場所に配置されることになる。
TMVPと同様に影響を受けるもう1つのツールは、オプティカルフローによる予測の精緻化(PROF)である。これは、VVCのアフィン動き予測モデルの一部であり、特定のタイプの動き(例えばズームインまたはズームアウト、回転)をより効率的に表現するために導入される。このモードが選択されている場合、CUベースのアフィン動き補償予測が適用される。CUのアフィン動きモデルは、左上隅と右上隅にある2つの制御点のMV(4パラメータモデル)、または左上、右上、及び下の隅にある3つの制御点のMV(6パラメータモデル)によって記述される。動き補償のより細かい粒度を実現するために、サンプル単位の動き補償の効果を目的にして、オプティカルフローによる予測の精緻化(PROF)を使用して、各輝度予測サブブロックを精緻化する。輝度サブブロック内の予測サンプルは、勾配に基づいて導出された差とサンプルベースの動きベクトル差とを追加することによって精緻化される。PROFはクロマサンプルには適用されない。
ただし、アフィン動き予測処理では、RprConstraintsActive[i][j]に基づいてPROFに関連するフラグcbProfFlagLXが導出され、サブピクチャの抽出前後の導出の違いがエンコーダ/デコーダのミスマッチにつながることになる。
影響を受けるもう1つのツールは、特定のタイプのコンテンツ(エクイレクタングラー投影形式の360度ビデオ)に使用される動きベクトルラップアラウンドである。例えば、オブジェクトがピクチャの垂直境界でコード化されたピクチャ平面を離れると、通常、下層の投影の性質から、反対側の垂直境界で再びピクチャ平面に入る。この事実は、動きベクトルがピクチャの外側を指している場合、サンプルパディングに反対の境界を使用することにより、動きベクトルラップアラウンドを促進する。
しかし、サンプル予測処理では、RprConstraintsActive[i][j]に基づいて動きベクトルラップアラウンドを制御するフラグ(refWraparoundEnabledFlag)が導出されるので、サブピクチャの抽出前後で導出に差が生じた場合、TMVPまたはPROFの場合と同様に、エンコーダ/デコーダのミスマッチを引き起こすことになる。
第3の態様は、TMVP、PROF、及びMVラップアラウンドなどのレイヤ間予測ツールの使用を制御するための概念を提供して、サブピクチャ別ビデオデータストリームが抽出されるときに発生する可能性がある上記の問題を回避することができるようにする。第3の態様による実施形態は、サブピクチャの抽出の前後で異なる動作を避けるように、オリジナルビットストリーム、すなわちマルチレイヤビデオデータストリーム14のエンコードにおけるこれらのレイヤ間予測ツールの使用を制御することによって、これらの問題を回避することができる。
第3の態様の実施形態によれば、ビデオ24をマルチレイヤビデオデータストリーム14にエンコードするためのエンコーダ40は、サブピクチャ単位の独立したコード化をサポートする。さらに、エンコーダ40は、マルチレイヤビデオデータストリーム14の第2のレイヤL0のためのレイヤ間予測ツールのセットを使用して、かつサブピクチャ単位の独立したコード化のための第1の構成設定を使用して、マルチレイヤビデオデータストリーム14の第1のレイヤL1に、ビデオ24の第1のバージョン24をエンコードするように構成される。第3の態様によるエンコーダ40はさらに、サブピクチャ単位の独立したコード化のための第2の構成設定を使用して、マルチレイヤビデオデータストリーム14の第2のレイヤL0に、ビデオ24の第2のバージョン24をエンコードするように構成される。エンコーダ40は、第1の構成設定及び第2の構成設定が所定の関係を有するかどうかをチェックするように構成されている。第1の構成設定及び第2の構成設定が所定の関係を有しない場合、エンコーダ40は、1つ以上のレイヤ間予測ツールの所定のサブセットを無効にするか、またはその使用を控える。
例えば、第1のレイヤL1及び第2のレイヤL0の第1の構成設定及び第2の構成設定は、それぞれのレイヤが、サブピクチャに細分されるようにエンコードされるかどうか(否か)を考慮に入れることができる。換言すれば、第1の構成設定及び第2の構成設定は、いくつかのサブピクチャに関する情報を含むことができる(例えば、1つと複数とを識別し、1つのサブピクチャの数は、ピクチャが細分されないようにコード化されていることを意味する)。例えば、第1のレイヤL1及び第2のレイヤL0の第1の構成設定及び第2の構成設定は、サブピクチャの境界、サブピクチャ識別子、及びサブピクチャの境界処理のうちの1つ以上についての情報を含み得る。
例えば、所定の関係とは、以下の条件の1つ以上または全てのセットが満たされる場合に、第1の構成設定と第2の構成設定とが所定の関係を有する関係であり得る。
- 第1のビデオ及び第2のビデオは、それぞれ複数のサブピクチャに細分されるようにして、第1のレイヤ及び第2のレイヤにエンコードされる。
- 第1のビデオ及び第2のビデオは、第1のビデオ及び第2のビデオの間で等しい数のサブピクチャにそれぞれ細分されるようにして、第1のレイヤ及び第2のレイヤにエンコードされる。
- 第1のビデオ及び第2のビデオは、第1のビデオ及び第2のビデオの間で等しい数のサブピクチャにそれぞれ細分されるようにして、第1のレイヤ及び第2のレイヤにエンコードされ、サブピクチャの境界が空間的に一致するように変化する。
- 第1のビデオ及び第2のビデオは、いくつかのサブピクチャにそれぞれ細分されるようにして、第1のレイヤ及び第2のレイヤにエンコードされ、マルチレイヤビデオデータストリームでサブピクチャにシグナリングされるサブピクチャIDが一致している。
- 第1のビデオ及び第2のビデオは、いくつかのサブピクチャにそれぞれ細分されるようにして、第1のレイヤ及び第2のレイヤにエンコードされ、サブピクチャの境界処理が一致する。
例えば、1つ以上のレイヤ間予測の所定のサブセットは、レイヤ間動きベクトル予測、例えばTMVP、ベクトルベースのレイヤ間予測のオプティカルフロー精緻化、及びベクトルベースのレイヤ間予測における動きベクトルラップアラウンドのうちの1つ以上を含む。
例えば、エンコーダ40は、マルチレイヤビデオデータストリームに第1の構成設定及び第2の構成設定をシグナリングすることができる。
例では、エンコーダ40は、第1の構成設定及び第2の構成設定が所定の関係を有する場合、1つ以上のレイヤ間予測ツールの所定のサブセット、またはそのサブセットを有効化または利用することができる。
第3の態様の実施形態によれば、マルチレイヤビデオデータストリームをデコードするためのデコーダ50は、マルチレイヤビデオデータストリームの第2のレイヤL0からの予測のためのレイヤ間予測ツールのセットを使用して、かつサブピクチャ単位の独立したコード化のための第1の構成設定を使用して、マルチレイヤビデオデータストリームの第1のレイヤL1から、ビデオ24の第1のバージョン24をデコードするように構成される。マルチレイヤビデオデータストリームは、サブピクチャ別ビデオデータストリーム12またはマルチレイヤビデオデータストリーム14であり得ることに留意されたい。言い換えれば、図1では、デコーダ50は、サブピクチャ別ビデオデータストリーム12をデコードするように示されているが、デコーダ50はまた、例えば、図1に示されるシナリオのように、別のOLSの選択時にエクストラクタ10によって転送され得るので、マルチレイヤビデオデータストリーム14をデコードすることもできる。デコーダ50によってデコードされたマルチレイヤビデオデータストリームがサブピクチャ別ビデオデータストリーム12に対応し得るとき、マルチレイヤビデオデータストリームは、図1~図7に関して説明したように、抽出プロセスを受けていた可能性があるので、ビデオ24の第1のバージョン24は、エンコーダ40に関して述べたバージョンと異なる場合がある。したがって、デコーダ50に関して言及されたビデオの第1のバージョン24は、例では、1つ以上のサブピクチャの省略により、エンコーダ40に関して言及されたものとは異なり得る。同じことが、デコーダ50を参照して、デコーダ50によってデコードされるデータストリームの抽出された/残りの/通常除去された部分にコード化されたピクチャのピクチャ領域に関連する第1の構成設定にも当てはまる。例えば、デコーダに入るマルチレイヤビデオデータストリームが、ピクチャを含む以前の2つのサブピクチャのうちの1つのサブピクチャ28のみに関連する場合、第1の構成データは非サブピクチャ細分割を示すのみとなる。
第3の態様によるデコーダ50は、サブピクチャ単位の独立したコード化のための第2の構成設定を使用して、マルチレイヤビデオデータストリーム、すなわちデコーダ50に提供されるビデオデータストリームの第2のレイヤL0から、ビデオ24’の第2のバージョン24’をデコードするように構成され得る。デコーダ50は、第1の構成設定及び第2の構成設定が所定の関係を有するかどうかをチェックするように構成されている。デコーダ50は、第1の構成設定及び第2の構成設定が所定の関係を有する場合、エンコーダ40に関して説明した、1つ以上のレイヤ間予測ツールの所定のサブセットを無効にすることができる。
実施形態によれば、デコーダ50は、サブピクチャ境界でのベクトルクリッピング及び/またはサブピクチャ境界での境界パディングを含む、サブピクチャ単位の独立したデコードのために構成され得る。
例えば、上記で導入された変数RprConstrainsActiveは、第1の構成設定及び第2の構成設定の比較を表し得る。例えば、エンコーダ40及びデコーダ50は、第1の構成設定及び第2の構成設定が所定の関係を有するかどうかに基づいて、この変数を導出することができ、すなわち、適宜に変数を設定し、レイヤ間予測ツールの所定のサブセットを使用するかどうかを決定するために、この変数を使用することができる。
一実施形態では、RprConstraintsActive[i][j]の導出は、以下のように調整される。
それ以外の場合、基準ピクチャリストRefPicList[0]及びRefPicList[1]、基準ピクチャのスケーリング比RefPicScale[i][j][0]及びRefPicScale[i][j][1]、ならびに基準ピクチャのスケーリングフラグRprConstraintsActive
[j]及びRprConstraintsActive[1][j]は、次のように導出される。
for(i=0;i<2;i++){
for(j=0,k=0,pocBase=PicOrderCntVal;j<num_ref_entries[i][RplsIdx[i]];j++){
[…]
fRefWidthは基準ピクチャRefPicList[i][j]のPicOutputWidthLに等しく設定される
fRefHeightは基準ピクチャRefPicList[i][j]のPicOutputHeightLに等しく設定される
refPicWidth、refPicHeight、refScalingWinLeftOffset、refScalingWinRightOffset、refScalingWinTopOffset、
及びrefScalingWinBottomOffsetは基準ピクチャ
RefPicList[i][j]のpps_pic_width_in_luma_samples、
pps_pic_height_in_luma_samples、pps_scaling_win_left_offset、pps_scaling_win_right_offset、
pps_scaling_win_top_offset、及びpps_scaling_win_bottom_offsetの値にそれぞれ等しく設定される
fRefSubpicsEnabledは基準ピクチャRefPicList[i][j]のsps_subpic_info_present_flagに等しく設定される(つまり、ここでは、ILMVPの基準ピクチャがサブピクチャに細分されているか否かがチェックされる)
RefPicScale[i][j]
=((fRefWidth<<14)+(PicOutputWidthL>>1))/PicOutputWidthL
RefPicScale[i][j]
=((fRefHeight<<14)+(PicOutputHeightL>>1))/PicOutputHeightL
RprConstraintsActive[i][j]=( pps_pic_width_in_luma_samples!=refPicWidth||
pps_pic_height_in_luma_samples!=refPicHeight||
pps_scaling_win_left_offset!=refScalingWinLeftOffset||
pps_scaling_win_right_offset!=refScalingWinRightOffset||
pps_scaling_win_top_offset!=refScalingWinTopOffset||
pps_scaling_win_bottom_offset!=refScalingWinBottomOffset||
sps_subpic_info_present_flag!=fRefSubpicsEnabled(したがって基準ピクチャ及びコード化対象ピクチャの一方が細分されている場合、または基準ピクチャ及びコード化対象ピクチャの両方が細分されていない場合、ILMVPは無効になる)


あるいは、一実施形態では、異なるサブピクチャ構成(有効対無効)を有する現在のピクチャと基準ピクチャとの間の予測において、ビットストリームがTMVP、PROF、またはMvWrapAroundを有効にしないことがビットストリーム適合の要件であり、ビットストリームは上記の制約の表示を搬送する。
TMVPの場合、上記の導出の影響は、例では、デコーダには影響を与えないが、PROF及びMvWrapAroundの場合、デコーダは、上記の修正された導出を実行し、それぞれのツールが実行/チェックされると異なる動作をする可能性がある。
あるいは、そのようなチェックは、現在のピクチャ及び基準ピクチャ内のサブピクチャの数または識別子、そのようなサブピクチャの境界処理の特性、またはさらなる特徴に応じて実行することができる。
4.第4の態様によるエンコーダ40及びエクストラクタ10
このセクションでは、図1を参照して第4の態様による実施形態を説明する。第4の態様による実施形態には、セクション0で説明した詳細を任意選択で適用することができる。また、図2及び図5に示されるデータストリーム12、14の詳細は、第3の態様の実施形態に任意選択で含まれてもよく、その場合、セクション1及び2の対応する説明が適宜適用される。最適には、第1、第2及び第3の態様に関して記載された特徴を、第4の態様と組み合わせることもできる。
ビデオデータストリーム14などのマルチレイヤビデオデータストリームからサブピクチャが抽出されるとき、例えば前のセクション1~3の実施形態の例では、抽出されたサブビットストリームの特定のレベル(例えば、ビットレート、(コード化されたピクチャバッファ)CPBサイズ、タイルの数など)の制限を決定する際に使用される割合(例えば、ref_level_fraction_minus1によって示される)がシグナリングされるか、または導出され得る。例えば、これらのレベル制約は、デコーダがビデオデータストリーム、または機能要件が基準とするOLSによって記述されたビデオシーケンスをデコードすることができるように満たさなければならないデコーダ機能要件を提起するか、またはそれに関連し得る。
従来、この割合が存在しない場合、次のように、そのレイヤ内の完全なピクチャのサイズに関して、サブピクチャのサイズに等しいと推定される。
存在しない場合、ref_level_fraction_minus1[i][j]の値はCeil(256*SubpicSizeY[j]÷PicSizeInSamplesY*MaxLumaPs(general_level_idc)÷MaxLumaPs(ref_level_idc[i])-1に等しいと推測される。
ただし、このメカニズムにはいくつかの問題がある。第一に、上記の推定は、ビットストリームが複数のレイヤをホストできる事実を考慮していない。例えば、あるレベル制限はビットストリーム範囲(例えば、ビットレート及びCPBサイズ)を有するが、他のレベル制限はレイヤ範囲(例えば、タイル数)を有するので、比SubpicSizeY[j]÷PicSizeInSamplesYに関して十分でない。
したがって、これは本態様の一部であり、一実施形態では、推定は、OLS内の全てのレイヤを考慮する方式で実行され、すなわち、導出ビットストリーム別である。
したがって、本態様の一部として、一実施形態では、以下のように、サブピクチャのない基準レイヤのレベルの影響も組み込むように、サブピクチャ当たりの割合の推定が変更される。
存在しない場合、ref_level_fraction_minus1[i][j]の値はmax(255,Ceil(256*SumOfSubpicSizeY[j]÷SumOfPicSizeInSamplesY*MaxLumaPs(general_level_idc)÷MaxLumaPs(ref_level_idc[i])-1))に等しいと推定される。最大関数が省略されると、Ceil(256*SumOfSubpicSizeY[j]÷SumOfPicSizeInSamplesY*MaxLumaPs(general_level_idc)÷MaxLumaPs(ref_level_idc[i])-1)になり得る。
ここで、SumOfSubpicSizeY及びSumOfPicSizeInSamplesYは、OLS内の全てのレイヤのそれぞれのサブピクチャに関連付けられた全てのサンプルの合計である。
図8は、例えば、図1、図2、図5に示されるシナリオに従う、サブピクチャ別ビデオデータストリーム14の抽出の例を示す。図8は、オリジナルデータストリーム、例えば、抽出前のデータストリーム14のビデオ24と、抽出後のサブピクチャ別データストリーム12のビデオシーケンス24′との間の出力ピクチャ領域の相対的な変化を示す。
第2の問題は、L0がサブピクチャを持たない図8に示されるように、対応するサブピクチャを含まない基準レイヤと組み合わせてサブピクチャを使用できるという事実に関する。
このケースをカバーするため、またはより正確なレベル制限を提供するために、別の実施形態では、例えばref_level_fraction_minus1の推定が次のように実行される。
ここで、SumOfSubpicSizeY及びSumOfPicSizeInSamplesYは、OLS内の全てのレイヤ、及びOLS内のサブピクチャのない全てのレイヤの、それぞれのサブピクチャに関連付けられた全てのサンプルの合計である。
別の実施形態では、ref_level_fraction_minus1[i][j]の推定は、技術の状態に対して不変である(サブピクチャを含むレイヤのレイヤ固有の割合のままである)。代わりに、上記の変更の代わりに、次のように、レイヤごとの特定の割合からOLS別割合変数が導出される。
Ols_fraction_nominator[i][j][k]=0
Ols_fraction_denominator[i][j][k]=0
k-Ols{
Ols_fraction_nominator[i][j][k]=+PicSizeInSamplesY[layer]*(sps_subpic_info_present_flag[layer]?ref_level_fraction_minus1[i][j]:255)
Ols_fraction_denominator[i][j][k]=+PicSizeInSamplesY[レイヤ]

OlsRefLevelFraction[i][j][k]=Ols_fraction_nominator[i][j][k]/Ols_fraction_denominator[i][j][k]
ここで、kはOLSのインデックス、iは基準レベルのインデックス、jはサブピクチャのインデックスである。
上記の実施形態は、全てのレイヤの間の等しいレート分布を期待することができる。エンコーダが、サブピクチャレイヤと非サブピクチャレイヤとの間のレート分布についても自由に決定できるようにするために、本発明の別の実施形態では、ビットストリームのOLS内のサブピクチャを含まないレイヤの割合が明示的にシグナリングされる。つまり、所与の基準レベルで、非サブピクチャレイヤを全て合わせて、ビットストリームのOLSの何割に相当するかがシグナリングされる。
Figure 2023526460000002
non_subpic_layers_fraction[i]は、sps_num_subpics_minus1が0に等しいビットストリーム/OLSのレイヤに関連付けられたビットストリーム/OLS別レベル制限の割合を規定する。vps_max_layers_minus1が0に等しい場合、non_subpic_layers_fraction[i]、またはビットストリーム/OLSにsps_num_subpics_minus1が0に等しいレイヤがない場合、non_subpic_layers_fraction[i]は0に等しくなる。
i番目のref_level_idcのj番目のサブピクチャの変数OlsRefLevelFraction[i][j]は、non_subpic_layers_fraction[i]+(255-non_subpic_layers_fraction[i])÷255*ref_level_fraction_minus1[i][j]+1に等しく設定される。
OlsRefLevelFraction[i][j]は、セクション5で説明したように、OLS別に使用される。
第4の態様の実施形態によれば、マルチレイヤビデオデータストリーム14は、レイヤのセット、例えば、デコードのために選択されたOLSなどのOLSを含む。例えば、OLSは、図1に示されるようにレイヤL0及びL1を含むことができる。エンコーダ40によってエンコードされたマルチレイヤビデオデータストリームは、レイヤのこのセット、すなわち、レイヤのこの1セットだけでなく、さらなるOLSから構成されてもよく、図1に示すレイヤL0及びレイヤL1以外のさらなるレイヤから構成されてもよいことが留意される。第4の態様によるエンコーダ40は、マルチレイヤビデオデータストリーム14に、レイヤのセット、例えば、レイヤL0及びL1の非縮小バージョンをエンコードするように構成される。ビデオバージョン、例えば、ビデオシーケンス24及びビデオシーケンス24は、レイヤごとに1つ以上の独立にコード化されたサブピクチャの単位でレイヤのセットの非縮小バージョンにコード化される。「1つの独立してコード化されたサブピクチャの単位で」という表現は、例えば、サブピクチャに細分されずにコード化されたレイヤを意味する。すなわち、ビデオバージョン24のピクチャ26などのピクチャは、1つのサブピクチャを形成する。例えば、1つ以上のそのような細分化されていないレイヤがレイヤセットに存在し、1つ以上のサブピクチャ分割レイヤがレイヤセットに存在し得る。
第4の態様によるエンコーダ40は、レイヤのセットの非縮小バージョンのデコードに関連する基準デコーダ機能要件をマルチレイヤビデオデータストリーム14にエンコードするようにさらに構成される。さらに、第4の態様によるエンコーダ14は、マルチレイヤビデオデータストリーム(14)に、レイヤのセットの各レイヤについて、レイヤのセットの非縮小バージョンのそれぞれのレイヤにコード化されたピクチャのピクチャサイズに関する情報(図2に示す情報22など)と、それぞれのレイヤの1つ以上の独立してコード化されたサブピクチャのそれぞれについて、サブピクチャサイズとをエンコードするように構成される。第4の態様によるエンコーダ40は、少なくとも1つのレイヤのサブピクチャ関連部分が除去されたレイヤの集合の、1つ以上の縮小バージョン、例えば、サブピクチャ別ビデオデータストリーム12または必ずしもマルチレイヤビデオデータストリーム14全体を構成しないビデオデータストリーム12のさらなるバージョンのそれぞれに対して、レイヤの集合のそれぞれの縮小バージョンをデコードすることに関係するデコーダ機能要件、例えばOlsRefLevelFraction[i][j]を決定するように構成される(OlsRefLevelFraction[i][j]は、j番目のサブピクチャに関連する縮小バージョンに固有であることに注意されたい)。
エンコーダ40は、レイヤのセットのそれぞれの縮小バージョンに含まれる独立してコード化されたサブピクチャのサブピクチャサイズにわたる合計をピクチャサイズにわたる合計で割った商を使用して決定される係数で基準デコーダ機能要件をスケーリングすることによって、それぞれの縮小バージョンに対するデコーダ機能要件を決定する。換言すれば、レイヤのセットの縮小バージョンは、抽出されないサブピクチャなどの他のサブピクチャに関連するビットストリーム部分、すなわち、サブピクチャ別ビデオデータストリーム14において転送されるべきサブレイヤの所定のセットの一部ではないビットストリーム部分が除去されたレイヤのセットのバージョンを意味する。
例えば、エンコーダ40は、マルチレイヤビデオデータストリーム14におけるデコーダ機能要件を提供し、例えば、図2に示されるようなデコーダ機能要件60と比較することができる。
デコーダ機能要件情報は、抽出されたビットストリームが、ビットストリームを受信するデコーダによってデコード可能であるかどうかを示す指標として使用され得る。例えば、デコーダ機能要件情報は、デコーダをセットアップまたは初期化するためにビットストリームを受信するデコーダによって使用され得る。
再利用されるバージョンのそれぞれについて、特定のデコーダ機能要件を決定することにより、デコーダ機能要件をより正確に提供することができるので、不必要に高いデコーダ機能要件を示す情報を回避することができ、例えば、デコーダが、その能力に応じた最高品質のOLSを選択することができる。
したがって、第4の態様によるエクストラクタ10の実施形態は、レイヤのセットを構成するマルチレイヤビデオデータストリーム14から、サブピクチャ別ビデオデータストリーム12を抽出するためのエクストラクタ10であって、マルチレイヤビデオデータストリーム14は、そこにエンコードされたレイヤのセットの非縮小バージョンを有し、ビデオバージョン24、24が、レイヤごとに1つ以上の独立してコード化されたサブピクチャの単位でレイヤのセットの非縮小バージョンにエンコードされることは、マルチレイヤビデオデータストリーム14から、レイヤのセットの非縮小バージョンをデコードすることに関連する基準デコーダ機能要件を導出するように構成される。この実施形態によれば、エクストラクタ10は、マルチレイヤビデオデータストリームから、レイヤのセットの各レイヤについて、レイヤのセットの非縮小版のそれぞれのレイヤにコード化されたピクチャのピクチャサイズに関する図2に例示される情報22などの情報、及び、それぞれのレイヤの1つ以上の独立してコード化されたサブピクチャのそれぞれについて、サブピクチャサイズを導出可能に構成される。さらに、この実施形態によれば、エクストラクタ10は、少なくとも1つのレイヤのサブピクチャ関連部分が除去されたレイヤのセットの所定の(例えば、APIによって提供されるOLS表示20によって予め決定された)縮小バージョンについて、レイヤのセットの所定の縮小バージョンのデコードに関連するデコーダ機能要件を、レイヤのセットの所定の縮小バージョンに含まれる独立してコード化されたサブピクチャのサブピクチャサイズにわたる合計をピクチャサイズにわたる合計で割った商を用いて決定される係数によって基準デコーダ機能要件をスケーリングすることによって決定するように構成されている。
以下では、第4の態様の代替の実施形態が、依然として図1及び図2を参照しながら説明される。
これらの代替実施形態によれば、マルチレイヤビデオデータストリーム14は、レイヤL0及びレイヤL1などの複数のレイヤを含む。さらに、エンコーダ40は、マルチレイヤビデオデータストリームのレイヤに、ピクチャ26及びピクチャ26などのビデオピクチャ26を、図1のレイヤL1などの1つ以上の第1のレイヤに関して独立にコード化されたサブピクチャに細分されるように、かつレイヤL0などの1つ以上の第2のレイヤに関しては細分されないように、エンコードするように構成されている。言い換えれば、エンコーダ14は、独立にコード化されたサブピクチャに細分されるようにビデオ24のピクチャを第1のレイヤL1などの第1のタイプのレイヤにコード化してもよく、第2のレイヤL0などの第2のタイプの1または複数のレイヤに細分されないようにピクチャをエンコードしてもよい。マルチレイヤビデオデータストリーム14は、第1のタイプの1つ以上のレイヤ及び第2のタイプの1つ以上のレイヤを含むことができることに留意されたい。これらの代替実施形態によるエンコーダ40は、マルチレイヤビデオデータストリーム14に、少なくとも1つの第1のレイヤがレイヤセットに含まれ、少なくとも1つの第2のレイヤがレイヤセットに含まれるようなレイヤセットの、図2に示される表示18などの表示をエンコードするように構成される。例えば、レイヤのセットの表示は、OLS表示18であってもよい。マルチレイヤビデオデータストリーム14は、図1に関して説明したように、レイヤの複数のセットの表示を含み得る。
これらの代替実施形態によるエンコーダ40は、マルチレイヤビデオデータストリーム14に、レイヤのセットをデコードするのに十分な複数の基準デコーダ機能要件のそれぞれについて、少なくとも1つの第1のレイヤに帰属するそれぞれの基準デコーダ機能要件の第1の割合(例えば図9の第1の割合134)、及び少なくとも1つの第2のレイヤに帰属するそれぞれの基準デコーダ機能要件のセクション割合132(例えば図9の第2の割合134)の情報をエンコードするように構成される。例えば、第1の部分134は、上記で導入されたシンタックス要素ref_level_fraction_minus1[i][j]によって示され得、第2の部分132は、上記で導入されたシンタックス要素non_subpic_layer_fraction[i][j]によって示され得る。
例えば、レイヤセットをデコードするのに十分な基準デコーダ機能要件は、基準デコーダ機能要件のそれぞれが、少なくとも、最小CPBサイズによって定義されることを意味し得る。いくつかの基準デコーダ機能要件は、その示された最小CPBサイズに関して相互に異なる可能性がある。基準デコーダ能力要件のいくつかについては、レイヤセットは全体ではほんの一部しか消費しない可能性があり、例えば、全体で利用可能なCPBサイズのほんの一部しか消費しない可能性があるので、図10に関して説明されるミキサ100のようなミキサは、レベル/基準デコーダ機能要件を満たしているにもかかわらず、異なるストリームのいくつのOLSが共に混合されるかを決定するために、そのような情報、すなわち、基準デコーダ機能要件を使用する場合があることに留意されたい。
例えば、デコーダ機能情報(DCI)とも呼ばれるデコーダ機能要件は、デコーダ機能要件が関連付けられているレイヤセットをデコードするためのデコーダの要件を示すことができる。例えば、レイヤセットは、いくつかの基準デコーダ機能要件を関連付けている場合がある。例えば、レイヤセットに関連する基準デコーダ機能要件のそれぞれは、異なるサブピクチャを含むビデオの異なるバージョンがコード化される異なるサブピクチャ別ビデオデータストリームなど、レイヤセットにコード化されるビデオ24の異なるバージョンを参照することができる。
第4の態様の実施形態は、マルチレイヤビデオデータストリーム14を処理するための装置を含み、この装置は、エンコーダ40のちょうど説明した代替実施形態によって提供されるビデオデータストリームを処理することができる。例えば、マルチレイヤビデオデータストリーム14を処理するための装置は、以下に説明するミキサ100などのミキサ、図1、図2及び図5のエクストラクタ10などのエクストラクタ、デコーダ50などのデコーダ、またはそれらの組み合わせである。したがって、データストリームを処理するための装置は、装置10、100と呼ばれる。例えば、デコーダ50とエクストラクタ10とを組み合わせてもよいし、一方が他方を含んでいてもよい。これらの実施形態によるマルチレイヤビデオデータストリームを処理するための装置は、マルチレイヤビデオデータストリーム14から、前に説明したように、少なくとも1つの第1のレイヤと1つの第2のレイヤとを含むレイヤのレイヤセットの表示をデコードするように構成される。装置は、複数の基準デコーダ機能要件のそれぞれについて、少なくとも1つの第1のレイヤに帰属するそれぞれの基準デコーダ機能要件の第1の割合と、少なくとも1つの第2のレイヤに帰属するそれぞれの基準デコーダ機能要件の第2の割合とに関する情報を、マルチレイヤビデオデータストリーム14から、デコードするように構成される。
図9は、第4の態様のちょうど説明した代替実施形態に従ってビデオデータストリーム14で信号化され得る、第1のレイヤのピクチャ26及び第2のレイヤのピクチャ26と、帰属する第1の割合134及び第2の割合132の例をそれぞれ示す。図9の例では、第1のレイヤのピクチャ26は、2つのサブピクチャ28に細分される。図9aは、図9に示されるように、第1の基準レベルに関連付けられ得る、第1の基準デコーダ機能要件に対する第1の割合134及び第2の割合132の決定を示す。図9の例示的な例では、第1の基準レベルは、例示的に1000の値を有する第1のCPB130(図9では、デコーダ機能要件の例示的な例を表すことができる)に関連付けられる。図9では、ピクチャまたはサブピクチャのそれぞれについて、それぞれの基準デコーダ機能要件に関連するビデオストリームの全ピクチャサイズに対するその相対的シェアが示されている。例えば、図9aによれば、ピクチャ26のピクチャサイズは、ビデオストリームの全ピクチャサイズの20%のシェアを有する。換言すれば、図9aは、両方のサブピクチャが含まれるピクチャ26及び26を含むビデオデータストリームに対する基準デコーダ機能要件の決定を示す。第2の部分132は、それぞれのデコーダ機能要件に対して示された全CPBに対する第2のレイヤのピクチャ26のシェアとして決定される。図9aに示されるビデオデータストリームのデコーダ機能要件に関連する第1の割合134は、CPBの残りの割合、すなわち、第1のレイヤのピクチャ26上のサブピクチャ上に分配された、第2のレイヤのピクチャ26によって使用されないシェアである。
図9bは、図9aに示されるものと同様であるが、第1のレイヤのピクチャ26のサブピクチャ28のうちの1つのみを含むビデオデータストリームの例を示す。したがって、対応するCPBレベルは、図9aのサブピクチャ28のうちの1つの割合のサイズのみ小さくなる。図9bの例では、ビデオデータストリームが第1のレイヤのサブピクチャの1つだけを含むので、ビデオデータストリームでシグナリングされる全ピクチャ領域に対するピクチャ260のシェアはより高く、すなわち20%に代わり、33%である。図9bの例の基準デコーダ機能要件に関連する第2の割合132及び第1の割合134は、図9aに関して説明したように、図9bの場合のピクチャ26が2つのサブピクチャ28のうちの一方のみを含むことを考慮して、それに応じて決定される。
実施形態によれば、エンコーダ40は、一方ではマルチレイヤビデオデータストリームに第1の割合を書き込み、他方では第2の割合を1マイナス第1の割合で割ったものを書き込むことにより、第1の割合及び第2の割合に関する情報をエンコードすることができる。したがって、装置10、100は、データストリームから第1の割合、及びさらに第2の割合を読み出すことによって、第1の割合及び第2の割合の情報をデコードすることができる。あるいは、装置10、100は、データストリームから第1の割合及びさらなる割合を読み出し、1から第1の割合を差し引いた差をさらなる割合に乗算することによって第2の割合を導き出すことによって、第1及び第2の割合に関する情報をデコードすることができる。
いくつかの例によれば、エンコーダ40は、例えば図1に示されるデコーダ機能要件60など、いくつかの基準デコーダ機能要件のうちの1つ以上に関する情報をマルチレイヤビデオデータストリームにエンコードすることができる。換言すれば、エンコーダ40は、必ずしも全てではないが、いくつかの基準デコーダ機能要件のうちの1つ以上に関する情報をマルチレイヤビデオデータストリームにエンコードすることができる。例えば、いくつかの基準デコーダ機能要件の他のものに関する情報は、デフォルト規則によって導出可能である場合がある。例えば、図9の例では、第1のレイヤのピクチャ26が細分されるサブピクチャの相対的なサイズに関する情報に基づいて、図9a及び図9bのデコーダ機能要件のうちの1つに関する情報が他方から導出され得る。
例えば、エンコーダ40は、いくつかの基準デコーダ機能要件のうちの少なくとも1つについて、第1の割合134及び第2の割合132がマルチレイヤビデオデータストリームの縮小バージョン、例えば、図9bの第1の割合134及び第2の割合132に関連するような情報をエンコードするように構成され得る。エンコーダは、縮小バージョンに存在する1つ以上の独立してコード化されたサブピクチャのそれぞれについて、第1の割合がマルチレイヤビデオデータストリームから導出可能であるように、情報をエンコードすることができる。例えば、図9aを参照すると、エンコーダ40によってデータストリーム14にエンコードされたビデオ内のパラメータ、例えばサブピクチャの幅及びまたは高さ、例えばサンプルまたはタイルで測定されたものから導出可能であり得るピクチャ26の2つのサブピクチャ間の比率、例えば図9aの50%を認識して、装置10、100は、左サブピクチャに対する第1の割合からピクチャ26の右サブピクチャに対する第1の割合を導出してもよい。
さらにまたは代替的に、エンコーダ14は、複数の基準デコーダ機能要件の少なくともさらなる1つについて、第1の割合及び第2の割合が、マルチレイヤビデオデータストリームの非縮小バージョン、例えば図9aの第1の割合134及び第2の割合132に関連し、第1の割合134が、少なくとも1つの第1のレイヤの独立してコード化されたサブピクチャのそれぞれに対して、マルチレイヤビデオデータストリーム14から導出されるように、情報をデコードするように構成され得る。
図9に示すように、装置10、100は、第1の割合134と第2の割合132とを合計して、それぞれのレイヤセットについてCPBなどの実際のデコーダ機能要件を得ることができる。図示されるように、実際のデコーダ機能要件は、サブピクチャ別ビデオデータストリームに固有のものであってもよい。
上述のように、装置10、100はミキサであってもよい。すなわち、装置10、100は、マルチレイヤビデオデータストリーム14を別のビデオデータストリームとミキシングしてもよい。この目的のために、装置10、100は、例えば図10に関して説明したように、データストリーム14及びさらなる入力ビデオデータストリームに基づいてさらなるデータストリームを形成するために、第1及び第2の割合に関する情報を使用し得る。
5.第5の態様によるエンコーダ40及びエクストラクタ10
本セクションでは、図1を参照して第5の態様による実施形態を説明し、セクション0で説明された詳細は、第5の態様による実施形態に任意選択で適用され得る。また、図2及び図5に示されるデータストリーム12、14の詳細は、第3の態様の実施形態に任意選択で含まれてもよく、その場合、セクション1及び2の対応する説明が適宜適用される。任意選択で、第1、第2、第3、特に第4の態様に関して説明した特徴も、第5の態様と組み合わせることができる。特に、セクション5に記載された実施形態の例は、セクション4に記載された実施形態に、特にデコーダ機能要件ならびに第1及び第2の割合に関して関連し得る。
第5の態様の実施形態は、OLSのレイヤへの制約の選択的適用に関連し得る。
前述のように、上記のシンタックス要素ref_level_fraction_minus1[i][j]は、明示的にシグナリングされるか推定されるかにかかわらず、最新技術でタイル数などの特定のレイヤ別制約を課すために使用される。ただし、サブピクチャのない(参照)レイヤの場合、これらの制約は不必要に厳しくなるか、エンコーダの観点からは満たすのが難しい場合もある。これは、抽出プロセスがそれぞれのレイヤに影響を与えるのではなく、レイヤが満たす必要がある制約を強化するためである。
したがって、別の実施形態では、サブピクチャを含むOLS内のレイヤ、すなわち、抽出プロセスからピクチャサイズの縮小を受けるレイヤに対してのみ、以下の制約を選択的に課すことが本態様の一部である。したがって、エンコーダは、非サブピクチャ細分割レイヤの制限がより少ないことを利用することができる。
第5の態様の実施形態によれば、エンコーダ10は、1つ以上の第1のレイヤ、例えば第1のレイヤL1に、独立してコード化されたサブピクチャ28に細分されるように、ピクチャ26をエンコードし、1つ以上の第2のレイヤ、例えばレイヤL0に、例えば図1または図2に示されたような、細分されないようにして、ピクチャ26をエンコードし得る。エンコーダは、レイヤセット、例えばOLS、またはOLS表示18で示された1つ以上のOLSのそれぞれのレイヤセットについて、レイヤセットの最初のレイヤ、すなわちサブピクチャに細分された形でピクチャをそこにエンコードしており、すなわち少なくとも2つのサブピクチャに細分されたピクチャをそこにエンコードしているレイヤについて選択的にレイヤ固有の制約をチェックしてもよい。換言すれば、ピクチャが細分化されてエンコードされているレイヤについてはチェックを行い、ピクチャが非細分化されてエンコードされているレイヤについてはチェックを省略してもよい。換言すれば、チェックは、サブピクチャ細分化方式でピクチャにエンコードされたレイヤに対してのみ実行され得る。
第1のレイヤに対して選択的にチェックされる制約は、それぞれの第1のレイヤのサブピクチャに対するパラメータの所定のセットに関連する。換言すれば、エンコーダは、それぞれの第1層のサブピクチャのそれぞれについて、制約が固有である1つ以上の基準デコーダ機能要件のそれぞれについての制約をチェックしてもよい。例えば、それぞれのサブピクチャについて制約がチェックされる1つ以上の基準デコーダ機能要件は、それぞれの第1のレイヤからそれぞれのサブピクチャを抽出した結果のサブピクチャシーケンスを参照してもよく、または、それぞれの第1のレイヤからそれぞれのサブピクチャを抽出した結果のビデオシーケンスまたはビデオデータストリームへのこのサブピクチャシーケンスの寄与を参照してもよい。セクション0で述べたように、OLSによって記述されたビットストリームは、エクストラクタ10による抽出後も、OLSの1つ以上の時間サブレイヤ及び/または1つ以上のレイヤの選択/抽出によってスケーラブルである可能性がある。エクストラクタ10がサブピクチャ別ビデオデータストリームを抽出する場合にも同じことが適用され、エンコーダによってシグナリングされた1つ以上の基準デコーダ機能要件は、ビデオデータストリーム内の各サブピクチャに対して、基準デコーダ機能要件のそれぞれについて、サブピクチャに固有であるそれぞれの基準デコーダ機能要件の割合、例えばセクション4で述べた第1の割合によって定義される範囲で適用されてもよい。言い換えれば、1つ以上の基準デコーダ機能要件がそれぞれのサブピクチャに関連付けられ、基準デコーダ機能要件のそれぞれは、それぞれのサブピクチャ別ビデオデータストリームから抽出可能なサブビットストリームに適用し、基準デコーダ機能要件のそれぞれは、基準デコーダ機能要件に固有の制約を提起することができる。
例えば、制約が課されるパラメータは、
- サンプル数、例えばLUMAサンプル、例えばMaxLumaPs、
- ピクチャサイズ、例えばピクチャ幅及び/またはピクチャ高さ、例えばサンプル数、
- 行のタイル数及び/または列のタイル数、例えばMaxTileRows及び/またはMaxTileCols、
- タイルの総数、の1つ以上または全てを含んでもよい。
例えば、エンコーダ10は、それぞれのサブピクチャに帰属するそれぞれの基準デコーダ機能要件の割合、例えば、セクション4で説明したような第1の割合134、例えば以下の例ではRefLevelFraction[i][j](ここでiはそれぞれの基準デコーダ能力要求を示し、jはそれぞれのサブピクチャを示す)、を使用して、個々のサブピクチャのパラメータまたはプロパティを決定してもよい。
以下は、現在のVVCドラフト仕様に関して、強調表示された変更を含む仕様の例である。
j番目のサブピクチャを0からsps_num_subpics_minus1までの範囲のjと0より大きいsps_num_subpics_minus1で抽出したビットストリーム中の各層は、ビットストリーム適合性の要件である。また、general_tier_flagが0、levelがref_level_idc[i]で、iが0からnum_ref_level_minus1までのプロファイルに適合する場合、VVC仕様書の付録Cで規定する各ビットストリーム適合性テストにおいて、以下の制約に従わなければならない。
- Ceil(256*SubpicSizeY[j]÷RefLevelFraction[i][j])は、MaxLumaPs以下である必要がある。ここで、MaxLumaPsは、レベルref_level_idc[i]について(VVCの)表A.1で指定される。
- Ceil(256*(sps_subpic_width_minus1[j]+1)*CtbSizeY÷RefLevelFraction[i][j])の値は、Sqrt(MaxLumaPs*8)以下でなければならない。
- Ceil(256*(sps_subpic_height_minus1[j]+1)*CtbSizeY÷RefLevelFraction[i][j])の値は、Sqrt(MaxLumaPs*8)以下でなければならない。
- SubpicWidthInTiles[j]の値はMaxTileCols以下であり、SubpicHeightInTiles[j]の値はMaxTileRows以下である必要がある。ここで、MaxTileColsとMaxTileRowsとは、レベルref_level_idc[i]の(VVCの)表A.1に規定されるものとする。
- SubpicWidthInTiles[j]*SubpicHeightInTiles[j]の値は、MaxTileCols*MaxTileRows*RefLevelFraction[i][j]以下とし、MaxTileColsとMaxTileRowsはレベルref_level_idc[i]の(VVCの)表A.1に規定するものとする。
別の実施形態では、sps_num_subpics_minus1が0に等しいOLSのレイヤに対して、RefLevelFraction[i][j]は255に等しい(例えば、100%の割合を有する)ように導出される。
別の実施形態では、MaxLumaPs、最大及び最小アスペクト比、またはタイルの列若しくは行、スライス若しくはサブピクチャの数に関する制限は、レイヤ固有であり、レイヤ固有のref_level_fraction(すなわち、サブピクチャなしのレイヤについては255)を用いるのに対し、以下のようにCPBサイズ、ビットレート及びMinCRに関するレイヤ固有の制限は、(例えばセクション4で上記導出にあるように)OLS_fraction[k]に相当するOLS固有のOLSRefLevelFractionに基づいて適用される。
変数SubpicCpbSizeVcl[i][j]及びSubpicCpbSizeNal[i][j]は、以下のように導出される。
SubpicCpbSizeVcl[i][j]=Floor(CpbVclFactor*MaxCPB*OLSRefLevelFraction[i][j]÷256) (D.5)
SubpicCpbSizeNal[i][j]=Floor(CpbNalFactor*MaxCPB*OLSRefLevelFraction[i][j]÷256) (D.6)
A.4.2節に規定するref_level_idc[i]から導出されたMaxCPBを使用する。
変数SubpicBitRateVcl[i][j]及びSubpicBitRateNal[i][j]は、以下のように導出される。
SubpicBitRateVcl[i][j]=Floor(CpbVclFactor*ValBR*OLSRefLevelFraction[i][j]÷256) (D.7)
SubpicBitRateNal[i][j]=Floor(CpbNalFactor*ValBR*OLSRefLevelFraction[i][j]÷256) (D.8)
注1-サブピクチャが抽出されると、得られるビットストリームは、SubpicCpbSizeVcl[i][j]及びSubpicCpbSizeNal[i][j]以上のCpbSize(SPSに示される、または推定される)とSubpicBitRateVcl[i][j]及びSubpicBitRateNal[i][j]以上のBitRate(SPSに示される、または推定される)とである。
j番目のサブピクチャに対応するAU0のNumBytesInNalUnit変数の和は、AU0のSubpicSizeInSamplesYの値に対してFormatCapabilityFactor*(Max(SubpicSizeY[j],fR*MaxLumaSr*OLSRefLevelFraction[i][j]÷256)+MaxLumaSr*(AuCpbRemovalTime[0]-AuNominalRemovalTime[0])*OLSRefLevelFraction[i][j])÷(256*MinCr)以下でなければならない。ここで、MaxLumaSrとFormatCapabilityFactorは、それぞれ表A.2と表A.3に示す値であり、AU0、レベルref_level_idc[i]に適用され、MinCrはA.4.2(VVCドラフト)に示されるように導かれる。
j番目のサブピクチャに対応するAUn(nは0より大きい)のNumBytesInNalUnit変数の和がFormatCapabilityFactor*MaxLumaSr*(AuCpbRemovalTime[n]-AuCpbRemovalTime[n-1])*OLSRefLevelFraction[i][j]÷(256*MinCr)以下でなければならない。ここで、MaxLumaSrとFormatCapabilityFactorは、それぞれ表A.2と表A.3に示す値であり、AUnのレベルref_level_idc[i]に適用され、MinCrはA.4.2(VVCドラフト)に示すように導出する。
第5の態様によるエンコーダ40、エクストラクタ10、及びマルチレイヤビデオデータストリーム14の実施形態を以下に説明する。
第5の態様によれば、マルチレイヤビデオデータストリームは複数のレイヤを含む。マルチレイヤビデオデータストリーム14は、例えば、エンコーダ40によって、1つ以上の第1のレイヤ、例えば、レイヤL1に関して独立してコード化されたサブピクチャに細分されるようにして、かつ1つ以上の第2のレイヤ、例えば、レイヤL1に関して細分されないようにして、ビデオピクチャ26をマルチレイヤビデオデータストリームのレイヤにエンコードしている。さらに、マルチレイヤビデオデータストリーム14は、前のセクションで説明したようなOLSなどのレイヤセットの表示を含み、第5の態様によれば、レイヤセットは、少なくとも1つの第1のレイヤ、すなわち、ピクチャが独立してコード化されたサブピクチャに細分されるようにエンコードされているレイヤを含む。第5の態様によれば、マルチレイヤビデオデータストリームには、例えば、セクション4で説明したように、基準デコーダ機能要件情報がその中にエンコードされており、基準デコーダ機能要件情報は、レイヤセットの非縮小バージョンのデコードに関連しており、レイヤセットの各レイヤに対する第1のデコーダ機能要件パラメータと、レイヤセットに対する第2のデコーダ機能要件パラメータとを含む。セクション4で説明したように、非縮小バージョンは、レイヤセットにエンコードされた全てのビデオデータ、すなわちレイヤセットの少なくとも1つの第1のレイヤの全てのサブピクチャを含む、レイヤセットにエンコードされたビデオデータストリームのバージョンを参照できる。例えば、第1のデコーダ機能要件パラメータは、レイヤのピクチャが細分されるタイルの数であり得る。例えば、タイルはピクチャの相互に独立したコード化された部分である。例えば、第2のデコーダ機能要件パラメータは、ACPB及び/またはデコードピクチャバッファ(DPB)サイズ及び/または最小圧縮比(minCR)などの必須または必要なピクチャバッファサイズを参照し得る。
第5の態様によれば、エンコーダ40は、少なくとも1つの第1のレイヤのサブピクチャ関連部分が除去されたレイヤセットの1つ以上の縮小バージョンのそれぞれについて、レイヤセットのそれぞれの非縮小バージョン、または縮小バージョンをデコードすることに関連する基準デコーダ機能要求情報をさらに決定するために構成される。レイヤセットの縮小バージョンは、レイヤセットのビデオデータを全ては含まないビデオデータストリーム、例えば、サブピクチャ関連ビデオデータストリーム12、すなわち、レイヤセットのそれぞれの縮小バージョンを抽出する際に、サブピクチャ関連部分、すなわち図1、2、5に関して説明したサブピクチャの所定のセットに関連しない部分が省略されたビデオデータストリームを指し得る。エンコーダ40は、レイヤセットの各レイヤに対して第3のデコーダ機能要件パラメータを得るために、第1の割合を用いて第1のデコーダ機能要件パラメータをスケーリングすることによって、さらなる基準デコーダ機能要件情報を決定するように構成される。例えば、第1の割合は、レイヤセット内の各レイヤのピクチャと、そのレイヤセットの縮小バージョン内のピクチャとの間のピクチャサイズの比率に基づいて決定されてもよい。エンコーダ40は、任意選択で、第1の割合をマルチレイヤビデオデータストリーム14にエンコードすることができる。したがって、エクストラクタ10は、任意選択で、マルチレイヤビデオデータストリーム14から第1の割合を導き出すことができ、あるいは、エンコーダ40によって実行されるように第1の割合を代替的に決定することができる。
エンコーダ40は、レイヤセットのそれぞれの縮小バージョンに対する第4のデコーダ機能要件パラメータを得るために、第2の割合を用いて第2のデコーダ機能要件パラメータをスケーリングすることによって、さらなる基準デコーダ機能要件情報を決定するようにさらに構成される。第2の割合は、例えば、第1の割合とは異なっていてもよい。
第2の割合は、割合132の割合134など、セクション4への比率コード化に基づいて決定され得る。エンコーダ40は、任意選択で、第2の割合をマルチレイヤビデオデータストリーム14にエンコードすることができる。したがって、エクストラクタ10は、任意選択で、マルチレイヤビデオデータストリーム14から第2の割合を導出することができ、またはエンコーダ40によって実行されるのと同様の第2の割合を決定することができる。
エンコーダ10は、マルチレイヤビデオデータストリーム14の少なくとも1つの第1のレイヤのサブピクチャ関連部分を除去し、第3のデコーダ機能要件パラメータ及び第4のデコーダ機能要件パラメータを、サブピクチャ別ビデオデータストリーム12に提供することによって、マルチレイヤビデオデータストリーム14に基づいて、サブピクチャ別ビデオデータストリーム12を形成する。あるいは、エンコーダ10は、少なくとも1つの第1のレイヤのサブピクチャ関連部分を除去し、デコーダによるレイヤのレイヤセットの所定の非縮小バージョンのデコードに関連するさらなる基準デコーダ機能要件情報の決定のための第1の割合及び第2の割合を、サブピクチャ別ビデオデータストリーム12に提供することによって、マルチレイヤビデオデータストリーム14に基づいて、サブピクチャ別ビデオデータストリーム12を形成してもよい。
6.図10によるエンコーダ40及びデコーダ110
図10は、第1のエンコーダ40及び第2のエンコーダ40を示し、これらのそれぞれは、図1及びセクション1~5に関して説明したエンコーダ40に任意選択的に対応することができる。エンコーダ40はビデオデータストリーム12をコード化するように構成され、エンコーダ40はビデオデータストリーム12をコード化するように構成される。ビデオデータストリーム12、12は、任意選択であるが、必ずしも複数のレイヤを含む必要はない。換言すれば、図10によるビデオデータストリーム12、12は、任意選択として、ビデオデータストリーム14などのマルチレイヤビデオデータストリームであってもよいが、例では、単一レイヤを1つだけ含み得る。それとは別に、図10によるビデオデータストリーム12、12は、任意選択として、前のセクションで説明したビデオデータストリーム14に対応することができる。
エンコーダ40は、ピクチャ26をビデオデータストリーム12にエンコードするように構成される。エンコーダ40は、ピクチャ26をビデオデータストリーム12にエンコードするように構成される。ピクチャ26及びピクチャ26は、任意選択として、1つ以上の独立してコード化されたサブピクチャ28によって、それぞれのビデオストリーム12、12にエンコードされ得る。エンコーダ40、40は、それぞれのビデオデータストリーム12、12に、ピクチャ26、26が1つ以上の独立してコード化されたサブピクチャによって、それぞれのビデオデータストリームにエンコードされているかどうかを示す表示80をエンコードするように構成される。表示80は、1つ以上の独立してコード化されたサブピクチャ28と、1つ以上の独立してコード化されたサブピクチャの周囲との間のコード化の独立性の異なるタイプを識別するものである。例えば、1つ以上の独立してコード化されたサブピクチャの周囲は、それぞれのサブピクチャの周囲のピクチャ領域を指し得る。
例えば、表示80は、m>1のm配列シンタックス要素であってもよいし、そのような独立してコード化されたサブピクチャが存在するかどうかを示すように2以上のシンタックス要素を含んでもよく、もしそうなら、デコードの独立性のタイプを明らかにするさらなるシンタックス要素であってもよい。
図10は、ビデオデータストリーム12及びビデオデータストリーム12などの1つ以上の入力ビデオデータストリーム12に基づいてビデオデータストリーム20を提供するための装置100をさらに示す図である。例えば、装置100は、ビデオデータストリーム20を決定するために、ビデオデータストリーム121、12を混合することができる。したがって、装置100は、ミキサ100と呼ばれることがある。任意選択で、装置100は、ビデオデータストリーム12及び/またはビデオデータストリーム12などの1つ以上の入力ビデオデータストリームからビデオデータストリーム20を抽出するようにさらに構成されてもよい。例えば、ミキサ100は、その入力ビデオデータストリームの1つ以上のそれぞれから、ビデオデータの一部または全部を抽出し、その入力ビデオデータストリームの異なるものから抽出されたビデオデータを、ビデオデータストリーム20に提供してもよい。例えば、図10に示されるように、装置100は、ビデオデータストリーム12、12のそれぞれから、サブピクチャのうちの1つ以上を抽出し、次いで、ビデオデータストリーム20を得るために、同じ提示時間に関連付けられたサブピクチャのうちの1つ以上と結合することができる。
図10は、さらに、任意選択で前のセクションに関して説明したようなデコーダ50に対応し得るデコーダ110を示す。デコーダ110は、表示80において、ビデオデータストリーム20からデコードするように構成される。
例では、エンコーダ40、40、及びデコーダ110は、表示80が示す異なるタイプのコード化の独立性のいずれとも無関係に、ビデオデータストリームにエンコードされたピクチャが1つ以上の独立してコード化されるサブピクチャの方式でエンコードされていることを示す表示80に応答して(例えば、そうでない場合のみ実行する、またはそうでない場合は実行しない)、以下の動作のうちの1つ以上を実行し得る。
- ビデオデータストリームの各ビットストリームパケットから、1つ以上の独立してコード化されたサブピクチャのいずれがそれぞれのビットストリームパケットにエンコードされているかを示すサブピクチャ識別子を読み出すこと、及び/または
- ループ内フィルタリングがサブピクチャの境界を越えるのを防止すること、及び/または
- ピクチャのブロックのブロックアドレスからピクチャ位置を導出することであって、このブロックアドレスは、1つ以上の独立してコード化されたサブピクチャのいずれが所定のビットストリームパケットにエンコードされるかに依存して、ビデオデータストリームの所定のビットストリーム部分にコード化される、導出すること(及び、例えば、それ以外では、必然的にその左上隅のような所定のピクチャ位置を参照することにより、ブロックアドレスからそのようなピクチャ位置を導出すること)、及び/または
- ビデオデータストリームの1つのアクセスユニットに発生する異なるNALユニットタイプを許容すること。例えば図10のミキサ100は、混合データストリーム90において、あるサブピクチャ28が1つのNALユニットタイプを有し、同じピクチャ内の別のサブピクチャ28が別のNALユニットタイプを使用してコード化されるように、ビットストリーム121,2を混合することが許容されている。NALユニットタイプはビットストリームパケット16にコード化され、ストリーム90のパケット16′になったときにも修正されずにそこに残る。デコーダ110は、デコードされた(混合された)ピクチャ26′のサブピクチャ28に使用されるコード化の独立性が何のタイプであれ、それを使用してピクチャが完全にコード化されるので、競合を見出さない。及び/また
- エンコーダ側で、1つ以上の独立してコード化されたサブピクチャのそれぞれについて、デコーダ機能要件情報を導出すること。
例えば、ピクチャのサブピクチャ間のコード化の独立性の異なるタイプは、
- エンコーダ制約型エンコードタイプであって、デコーダが、独立してコード化されたサブピクチャに関して、表示によって、エンコーダ制約型エンコードタイプが指示された場合、独立してコード化されたサブピクチャの境界における独立性処理を行わないように構成される、エンコーダ制約型エンコードタイプと、
- デコーダ認識型エンコードタイプであって、デコーダが、独立してコード化されたサブピクチャに関して、表示によって、デコーダ認識型エンコードタイプが指示された場合、ベクトルベース予測のためのベクトルクリッピング及び/または独立してコード化されたサブピクチャの境界における境界パディングによって、独立してコード化されたサブピクチャの境界における独立性処理を行なうように構成される、デコーダ認識型エンコードタイプと、を含む。
言い換えると、第6の態様による実施形態は、サブピクチャまたはMCTSの混合を可能にすることができる。
現在のVVCドラフト仕様には、サブピクチャへの分割を有効にして、抽出及びマージ機能を有効にするための多数の対策が含まれている。例えば、
・スライスヘッダでのサブピクチャ識別子のキャリッジ、または
・サブピクチャ識別子に依存するブロックアドレス指定スキーム、または
・個々のサブピクチャの適合情報、または
・ピクチャ内のNALユニットタイプの混合(例えばIRAPとTRAIL)。
ただし、これら全ての測定は、サブピクチャの境界処理特性に依存する。つまり、サブピクチャの境界の外側では、ピクチャの境界と同じ方法でサンプル値とシンタックス予測が外挿され、すなわち、デコーダ側の特別な境界パディング処理に依存している。これにより、サブピクチャの独立したコード化と、その後の抽出及びマージとが可能になっている。この特性はまた、抽出及びマージ機能の上記の全ての手段を有効にするためにも使用される。図11は、そのようなデコーダ側で処理されたサブピクチャをビットストリームの最初の2つのアクセスユニットにのみ使用するビットストリームを示す。すなわち、図6は、独立してコード化されたサブピクチャにおいて、デコーダ側境界処理とエンコーダ側境界処理とを混在させたビットストリームの例を示す。
しかしながら、そのような矩形領域の独立したコード化、すなわちコード化時に従う動きの制約、言い換えれば、エンコーダ側の境界処理については、さらなる方法が存在する。エンコーダは、各サブピクチャの円周の外側を指さないようにすることで、抽出またはマージ後に再構築エラーにつながる参照を簡単に回避できる。最先端のシグナリングに基づいて、エンコーダは、図11の2番目のIRAP以降、デコーダ側の境界処理が発生しないため、L1の右側サブピクチャは独立してコード化されていないことを示す必要があり、したがって、上記の抽出及びマージ機能に関するいくつかの対策を効率的に使用することができる。最も重要なことは、適合情報がデコーダ側の境界処理に関連付けられていることである。しかしながら、独立したコード化のための他の手段の単なる表示が、エンコーダを有効にし、ネットワークデバイスまたはデコーダが上記の手段を促進することを可能にするべきである。
図12に示すように、隣接するサブピクチャ間で異なるタイプの独立したコード化で混合するビットストリームは、必ずしも複数のレイヤを含む必要はないことに注意することが重要である。図12は、サブピクチャ独立性のタイプの単一レイヤ混合の例を示す。
したがって、特定のサブピクチャの制約されたエンコードによって領域が独立してコード化されることをビットストリームに示すことによって、境界パディングがないにもかかわらず、独立領域コード化のための全ての既述の方策(アドレス方式、適合情報)が使用できることをデコーダが認識できるようにすることは、本態様の一部である。本態様の一実施形態では、デコーダ側パディング手順の指示に使用されるフラグ(1に等しいsps_subpic_treated_as_pic_flag[i])は、新しい状態(2に等しい)が、i番目のサブピクチャがエンコーダ側境界処理制約によって独立してコード化されることを示すsps_subpic_treated_as_pic_mode[i]へと変更される。
以下に例を示す。
Figure 2023526460000003
sps_subpic_treated_as_pic_mode[i]が12に等しい場合、CLVSの各コード化ピクチャのi番目のサブピクチャを、ループ内フィルタリング動作を除くデコード処理においてピクチャとして扱うことを規定する。sps_subpic_treated_as_pic_mode[i]が0または1に等しい場合、CLVSの各コード化ピクチャのi番目のサブピクチャを、ループ内フィルタリング動作を除くデコード処理においてピクチャとして扱わないことを規定する。存在しない場合、sps_subpic_treated_as_pic_mode[i]の値は12に等しいと推定される。sps_subpic_treated_as_pic_mode[i]の値3は、ITU-T|ISO/IECで将来使用するために予約されている。
そして、サブピクチャがエンコーダ側の制約またはデコーダ側の境界処理でない限り、異なるタイプのNALユニットを混在させることはできないという制約が実行される。
ピクチャ内の任意の2つのサブピクチャのNALユニットタイプが異なる場合、少なくとも1つのPスライスまたはBスライスを含むピクチャ内の全てのサブピクチャについて、sps_subpic_treated_as_pic_mode[]の値は0に等しくならないものとする。
図13は、エンコーダ側の制約とデコーダ側の境界処理とに依存しないサブピクチャによって、NALユニットの混在が許容される例と禁止される例とを示す。
7.さらなる実施形態
前のセクション0~6では、いくつかの態様を装置の文脈における特徴として説明したが、そのような説明はまた、方法の対応する特徴の説明とみなすこともできることは明らかである。いくつかの態様を方法の文脈における特徴として説明したが、そのような説明はまた、装置の機能に関する対応する特徴の説明とみなすこともできることは明らかである。
方法ステップの一部または全部は、例えば、マイクロプロセッサ、プログラマブルコンピュータまたは電子回路などのハードウェア装置によって(またはそれを使用して)実行され得る。いくつかの実施形態では、最も重要な方法ステップのうちの1つ以上は、そのような装置によって実行され得る。
発明のエンコード画像信号は、デジタル記憶媒体に記憶されてもよく、またはインターネットなどの無線伝送媒体または有線伝送媒体などの伝送媒体上で伝送されてもよい。
ある特定の実装要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアまたは少なくとも部分的にハードウェアまたは少なくとも部分的にソフトウェアに実装され得る。この実装は、電子的に可読な制御信号を有する、フロッピーディスク、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROMまたはFLASH(登録商標)メモリなどのデジタル記憶媒体を使用して実行され得、これらの制御信号は、その上に格納され得、プログラム可能なコンピュータシステムと協働する(または協働することができる)ことで、それぞれの方法が実行される。したがって、デジタル記憶媒体は、コンピュータ可読であり得る。
本発明による、いくつかの実施形態は、電子的に可読な制御信号を有するデータキャリアを含み、これらの制御信号がプログラム可能なコンピュータシステムと協働することができることで、本明細書に記載の方法のうちの1つが実行される。
概して、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装され得、このプログラムコードは、コンピュータプログラム製品がコンピュータ上で実行するときに方法のうちの1つを実行するように動作可能である。プログラムコードは、例えば、機械可読キャリアに格納され得る。
他の実施形態は、本明細書に記載の方法のうちの1つを実行し、機械可読キャリアに格納される、コンピュータプログラムを含む。
換言すれば、本発明の方法の一実施形態は、したがって、コンピュータプログラムがコンピュータ上で実行するときに、本明細書に記載の方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
本発明の方法のさらなる実施形態は、したがって、データキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)であり、このデータキャリアは、その上に記録される、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを含む。データキャリア、デジタル記憶媒体、または記録された媒体は、通常、有形及び/または非一時的である。
本発明の方法のさらなる実施形態は、したがって、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを表す、データストリームまたは信号シーケンスである。データストリームまたは信号シーケンスは、例えば、インターネットを介してなど、データ通信接続を介して転送されるように構成され得る。
さらなる実施形態は、例えば、本明細書に記載の方法のうちの1つを実行するように構成される、または適合されるコンピュータ、またはプログラマブルロジックデバイスなどの処理手段を含む。
さらなる実施形態は、コンピュータを含み、その上には、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムがインストールされている。
本発明による、さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを受信器に転送する(例えば、電子的に、または光学的に)ように構成される、装置またはシステムを含む。受信器は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであってよい。装置またはシステムは、例えば、コンピュータプログラムを受信器に転送するためのファイルサーバを含み得る。
いくつかの実施形態では、プログラマブルロジックデバイス(例えば、フィールドプログラマブルゲートアレイ)は、本明細書に記載の方法の機能の一部またはすべてを実行するために使用され得る。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法のうちの1つを実行するためにマイクロプロセッサと協働し得る。概して、方法は、いずれかのハードウェア装置によって好ましくは実行される。
本明細書に記載の装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置及びコンピュータの組み合わせを使用して実装され得る。
本明細書に記載の方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置及びコンピュータの組み合わせを使用して実行され得る。
上述した詳細な説明では、開示を合理化する目的により様々な特徴が例にグループ化されていることがわかる。開示の本方法は、特許請求の範囲に記載された例がそれぞれの請求項に明示的に述べられるよりも多くの特徴を必要とするという意図を反映するものとして解釈されるべきではない。むしろ、以下の特許請求の範囲が反映するように、主題は、単一の開示された例の全てよりも少ない特徴にあり得る。したがって、以下の特許請求の範囲は、本明細書によって詳細な説明内に組み込まれ、それぞれの請求項は、別個の例として独立することができる。各請求項は個別の例として独立し得ると同時に、従属請求項は請求項において1つ以上の他の請求項との特定の組み合わせに言及している場合があるが、他の例には、従属請求項と他の各従属請求項の主題との組み合わせ、または各特徴と他の従属または独立請求項との組み合わせも含まれる得ることに留意されたい。そのような組み合わせは、特定の組み合わせが意図されていないと述べられていない限り、本明細書で提案される。さらに、請求項が独立請求項に直接従属していなくても、他の独立請求項に対する請求項の特徴も含むことを意図している。
上記の実施形態は、本開示の原理の例示に過ぎない。本明細書に記載の構成及び詳細の修正形態及び変形形態が当業者には明らかであろうことが理解される。したがって、本明細書の実施形態の記述及び説明として提示された具体的な詳細によってではなく、係属中の特許請求の範囲によってのみ限定されることが意図される。

Claims (68)

  1. ビットストリーム部分(16)で構成され、そのそれぞれがマルチレイヤビデオデータストリームのレイヤ(L0、L1)の1つに属する、前記マルチレイヤビデオデータストリーム(14)から、サブピクチャ別ビデオデータストリーム(12)を抽出する装置(10)であって、前記装置が、
    前記マルチレイヤビデオデータストリーム(14)のレイヤセット(OLS)からの各レイヤについて、
    ビデオのピクチャ(26、26)が、それぞれの前記レイヤに相互に独立してエンコードされる2つ以上のサブピクチャ(28)に細分されることによって、前記ビデオ(24)の各ピクチャ(26、26)について、それぞれのピクチャの前記サブピクチャ(28)が、それぞれのレイヤの相互に異なるビットストリーム部分(16)にエンコードされるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうか、またはサブピクチャに細分されないように前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうかをチェックして、
    サブピクチャに細分されないように前記それぞれのレイヤに前記ビデオがエンコードされている場合、
    前記それぞれのレイヤに属する前記ビットストリーム部分(16)を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、前記それぞれのレイヤの前記ビデオ(24)が完全にエンコードされているようにすることと、
    前記ビデオのピクチャ(26)が、2つ以上のサブピクチャ(28)に細分されるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされている場合、
    前記それぞれのレイヤに属する各ビットストリーム部分について、
    前記ビットストリーム部分(16)から、それぞれのビットストリーム部分に前記2つ以上のサブピクチャのうちのどのサブピクチャがエンコードされているかを明らかにする情報を読み出すことと、
    前記それぞれのビットストリーム部分に、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている場合には、前記それぞれのレイヤの前記それぞれのビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、を行うように構成されている、前記装置。
  2. 前記ビデオのピクチャ(26)が、2つ以上のサブピクチャ(28)に細分されるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされている場合、
    前記それぞれのレイヤに属する各ビットストリーム部分について、
    前記それぞれのレイヤに属するが、前記1つ以上のサブピクチャの所定のセットに属さないサブピクチャがエンコードされている各ビットストリーム部分をドロップするように構成される、請求項1に記載の装置。
  3. 前記レイヤセットは、前記マルチレイヤビデオデータストリーム(14)のレイヤのサブセットであり、前記レイヤセットは、マルチレイヤデータストリーム内の出力レイヤセット(OLS)表示(18)で示される、請求項1または請求項2に記載の装置。
  4. 前記マルチレイヤビデオデータストリーム(14)は、複数のレイヤセットのためのOLS表示を含み、
    前記装置は、APIを介して受信した表示に基づいて、前記複数のレイヤセットから前記レイヤセットを決定するように構成される、請求項1~3のいずれかに記載の装置。
  5. 前記ビデオのピクチャ(26)が、前記それぞれのレイヤにコード化されたサブ部分の数を明らかにするシンタックス要素に基づいて、2つ以上のサブピクチャ(28)に細分されるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうかのチェックを実行するように構成される、請求項1~4のいずれかに記載の装置。
  6. 前記それぞれのビットストリーム部分に、前記2つ以上のサブピクチャのうちのどのサブピクチャがエンコードされているかを明らかにする前記情報は、サブピクチャ識別子によって、前記それぞれのビットストリーム部分の記述データ、例えばスライスヘッダに示される、請求項1~5のいずれかに記載の装置。
  7. 前記1つ以上のサブピクチャの所定のセットの表示をAPIを介して受信するように構成される、請求項1~6のいずれかに記載の装置。
  8. ビットストリーム部分(16)で構成され、そのそれぞれがマルチレイヤビデオデータストリーム(14)のレイヤ(L0、L1)の1つに属する、前記マルチレイヤビデオデータストリーム(14)であって、
    前記マルチレイヤビデオデータストリーム(14)のレイヤセット(OLS)を示すOLS表示(18)と、
    前記マルチレイヤビデオデータストリーム(14)から抽出可能なサブピクチャ別ビデオデータストリーム(12)に関するデコーダ機能要件情報(60)であって、
    ビデオのピクチャ(26)が、それぞれの前記レイヤに相互に独立してエンコードされる2つ以上のサブピクチャ(28)に細分されることによって、前記ビデオ(24)の各ピクチャ(26)について、それぞれのピクチャの前記サブピクチャ(28)が、それぞれのレイヤの相互に異なるビットストリーム部分(16)にエンコードされるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうか、またはサブピクチャに細分されないように前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうかをチェックして、
    サブピクチャに細分されないように前記それぞれのレイヤに前記ビデオがエンコードされている場合、
    前記それぞれのレイヤに属する前記ビットストリーム部分(16)を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、前記それぞれのレイヤの前記ビデオ(24)が完全にエンコードされているようにすることと、
    前記ビデオのピクチャ(26)が、2つ以上のサブピクチャ(28)に細分されるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされている場合、
    前記それぞれのレイヤに属する各ビットストリーム部分について、
    前記ビットストリーム部分(16)から、それぞれのビットストリーム部分に前記2つ以上のサブピクチャのうちのどのサブピクチャがエンコードされているかを明らかにする情報を読み出すことと、
    前記それぞれのビットストリーム部分に、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている場合には、前記それぞれのレイヤの前記それぞれのビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、を行うことによって、前記サブピクチャ別ビデオデータストリーム(12)が前記マルチレイヤビデオデータストリーム(14)から抽出可能である、前記デコーダ機能要件情報(60)とを含む、前記マルチレイヤビデオデータストリーム。
  9. ビットストリーム部分(16)で構成され、そのそれぞれがマルチレイヤビデオデータストリーム(14)のレイヤ(L0、L1)の1つに属する、前記マルチレイヤビデオデータストリーム(14)を形成するためのエンコーダ(40)であって、
    前記マルチレイヤビデオデータストリーム(14)に、前記マルチレイヤビデオデータストリーム(14)のレイヤセット(OLS)を示すOLS表示(18)を提供することと、
    前記マルチレイヤビデオデータストリーム(14)に、前記マルチレイヤビデオデータストリーム(14)から抽出可能なサブピクチャ別ビデオデータストリーム(12)に関するデコーダ機能要件情報(60)を提供することであって、
    ビデオのピクチャ(26)が、それぞれの前記レイヤに相互に独立してエンコードされる2つ以上のサブピクチャ(28)に細分されることによって、前記ビデオ(24)の各ピクチャ(26)について、それぞれのピクチャの前記サブピクチャ(28)が、それぞれのレイヤの相互に異なるビットストリーム部分(16)にエンコードされるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうか、またはサブピクチャに細分されないように前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうかをチェックして、
    サブピクチャに細分されないように前記それぞれのレイヤに前記ビデオがエンコードされている場合、
    前記それぞれのレイヤに属する前記ビットストリーム部分(16)を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、前記それぞれのレイヤの前記ビデオ(24)が完全にエンコードされているようにすることと、
    前記ビデオのピクチャ(26)が、2つ以上のサブピクチャ(28)に細分されるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされている場合、
    前記それぞれのレイヤに属する各ビットストリーム部分について、
    前記ビットストリーム部分(16)から、それぞれのビットストリーム部分に前記2つ以上のサブピクチャのうちのどのサブピクチャがエンコードされているかを明らかにする情報を読み出すことと、
    前記それぞれのビットストリーム部分に、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている場合には、前記それぞれのレイヤの前記それぞれのビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、を行うことによって、前記サブピクチャ別ビデオデータストリーム(12)が前記マルチレイヤビデオデータストリーム(14)から抽出可能である、前記デコーダ機能要件情報(60)を提供することとを含む、前記エンコーダ。
  10. ビットストリーム部分(16)(例えばNALユニット)で構成され、そのそれぞれがマルチレイヤビデオデータストリーム(14)のレイヤの1つに属する、前記マルチレイヤビデオデータストリーム(14)から、サブピクチャ別ビデオデータストリーム(12)を抽出する装置(10)であって、前記マルチレイヤビデオデータストリーム(14)が、
    第1のレイヤの前記ビットストリーム部分(16)に相互に独立してエンコードされることによって、第1のビデオの各ピクチャについて、前記第1のビデオのそれぞれのピクチャのサブピクチャが、前記第1のレイヤの相互に異なるビットストリーム部分にエンコードされる、2つ以上のサブピクチャ(28)に、前記第1のビデオのピクチャ(26)が細分されるように、前記ビットストリーム部分に前記第1のビデオ(24)がエンコードされている、前記第1のレイヤ(L1)と、
    ビットストリーム部分に第2のビデオ(24)がエンコードされている、第2のレイヤ(L0)とを含み、
    前記第1のレイヤのビットストリーム部分には、前記第1のビデオが、
    基準ピクチャ(26)からのベクトルベース予測を使用して、
    前記第2のビデオ(24)のピクチャ(26)を前記基準ピクチャとして含むようにして、
    前記第1のレイヤのビットストリーム部分がエンコードされるベクトル(70)を使用して、前記第1のレイヤのビットストリーム部分によって構成されるベクトル(70)が、ベクトルベース予測での使用のために、前記第1のビデオの前記ピクチャ及び前記基準ピクチャに対して、それぞれ前記マルチレイヤビデオデータストリーム(14)でシグナリングされたスケーリングウィンドウ(72)のサイズ及び位置に従ってスケーリング及びオフセットが行われるようにして、エンコードされており、
    前記装置は、
    前記第2のレイヤ(L0)に属する前記ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、それぞれのレイヤ(L0)の前記ビデオが完全にエンコードされているようにすることと、
    前記第1のレイヤ(L1)に属し、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている各ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、
    前記第2のビデオの前記ピクチャに対する前記スケーリングウィンドウ(720′)の空間領域が、前記1つ以上のサブピクチャの所定のセットに対する前記スケーリングウィンドウ(721′)の空間領域に空間的に対応するように、前記サブピクチャ別ビデオデータストリーム(12)における前記第1のレイヤ及び/または前記第2のレイヤにスケーリングウィンドウシグナル伝達(74)を適応させることと、を行うように構成される、前記装置。
  11. 前記第1のレイヤの前記スケーリングウィンドウ(72’)が位置及びサイズにおいて前記第2のレイヤの前記スケーリングウィンドウ(72’)に対応するように、前記第1のレイヤの前記スケーリングウィンドウシグナル伝達を適応させるように構成される、請求項10に記載の装置。
  12. 前記第1のレイヤに属するが、前記1つ以上のサブピクチャの所定のセットに属さないサブピクチャがエンコードされている各ビットストリーム部分をドロップするように構成される、請求項10~11のいずれかに記載の装置。
  13. 前記1つ以上のサブピクチャの所定のセットの表示をAPIを介して受信するように構成される、請求項10~12のいずれかに記載の装置。
  14. 前記ベクトルベース予測は、動きベクトルベース予測フレームワークに含まれる、請求項10~13のいずれかに記載の装置。
  15. ビットストリーム部分(16)で構成され、そのそれぞれがマルチレイヤビデオデータストリーム(14)のレイヤ(L0、L1)の1つに属する、前記マルチレイヤビデオデータストリーム(14)であって、前記マルチレイヤビデオデータストリーム(14)が、
    第1のレイヤの前記ビットストリーム部分(16)に相互に独立してエンコードされることによって、第1のビデオの各ピクチャについて、前記第1のビデオのそれぞれのピクチャのサブピクチャが、前記第1のレイヤの相互に異なるビットストリーム部分にエンコードされる、2つ以上のサブピクチャ(28)に、前記第1のビデオのピクチャが細分されるように、前記ビットストリーム部分に前記第1のビデオ(24)がエンコードされている、前記第1のレイヤ(L1)と、
    ビットストリーム部分に第2のビデオ(24)がエンコードされている、第2のレイヤ(L0)とを含み、
    前記第1のレイヤのビットストリーム部分には、前記第1のビデオ(24)が、
    基準ピクチャ(26)からのベクトルベース予測を使用して、
    前記第2のビデオのピクチャ(26)を前記基準ピクチャとして含むようにして、
    前記第1のレイヤのビットストリーム部分がエンコードされるベクトル(70)を使用して、前記第1のレイヤのビットストリーム部分によって構成されるベクトル(70)が、ベクトルベース予測での使用のために、前記第1のビデオの前記ピクチャ及び前記基準ピクチャに対して、それぞれ前記マルチレイヤビデオデータストリーム(14)でシグナリングされたスケーリングウィンドウ(72)のサイズ及び位置に従ってスケーリング及びオフセットが行われるようにして、エンコードされており、
    サブピクチャ別ビデオデータストリーム(12)が、
    前記第2のレイヤに属する前記ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、それぞれのレイヤの前記ビデオが完全にエンコードされているようにすることと、
    前記第1のレイヤに属し、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている各ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、
    前記第2のビデオの前記ピクチャに対する前記スケーリングウィンドウ(72’)の空間領域が、前記1つ以上のサブピクチャの所定のセットに対する前記スケーリングウィンドウ(72’)の空間領域に空間的に対応するように、前記サブピクチャ別ビデオデータストリーム(12)における前記第1のレイヤ及び/または前記第2のレイヤにスケーリングウィンドウシグナル伝達(74)を適応させることとによって、前記マルチレイヤビデオデータストリーム(14)から抽出可能である、前記マルチレイヤビデオデータストリーム。
  16. ビットストリーム部分(16)で構成され、そのそれぞれがマルチレイヤビデオデータストリーム(14)のレイヤ(L0、L1)の1つに属する、前記マルチレイヤビデオデータストリーム(14)を形成するためのエンコーダ(40)であって、前記マルチレイヤビデオデータストリーム(14)が、
    第1のレイヤの前記ビットストリーム部分(16)に相互に独立してエンコードされることによって、第1のビデオの各ピクチャについて、前記第1のビデオのそれぞれのピクチャのサブピクチャが、前記第1のレイヤの相互に異なるビットストリーム部分にエンコードされる、2つ以上のサブピクチャ(28)に、前記第1のビデオのピクチャが細分されるように、前記ビットストリーム部分に前記第1のビデオがエンコードされている、前記第1のレイヤと、
    ビットストリーム部分に第2のビデオがエンコードされている、第2のレイヤとを含み、
    前記第1のレイヤのビットストリーム部分には、前記第1のビデオが、
    基準ピクチャからのベクトルベース予測を使用して、
    前記第2のビデオのピクチャを前記基準ピクチャとして含むようにして、
    前記第1のレイヤのビットストリーム部分がエンコードされるベクトル(70)を使用して、前記第1のレイヤのビットストリーム部分によって構成されるベクトル(70)が、ベクトルベース予測での使用のために、前記第1のビデオの前記ピクチャ及び前記基準ピクチャに対して、それぞれ前記マルチレイヤビデオデータストリーム(14)でシグナリングされたスケーリングウィンドウ(72)のサイズ及び位置に従ってスケーリング及びオフセットが行われるようにして、エンコードされており、
    前記エンコーダは、サブピクチャ別ビデオデータストリーム(12)が、
    前記第2のレイヤに属する前記ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、それぞれのレイヤの前記ビデオが完全にエンコードされているようにすることと、
    前記第1のレイヤに属し、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている各ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、
    前記第2のビデオの前記ピクチャに対する前記スケーリングウィンドウ(72’)の空間領域が、前記1つ以上のサブピクチャの所定のセットに対する前記スケーリングウィンドウ(72’)の空間領域に空間的に対応するように、前記サブピクチャ別ビデオデータストリーム(12)における前記第1のレイヤ及び/または前記第2のレイヤにスケーリングウィンドウシグナル伝達(74)を適応させることとによって、前記マルチレイヤビデオデータストリーム(14)から抽出可能であるように、前記マルチレイヤビデオデータストリーム(14)を形成するように構成される、前記エンコーダ。
  17. ビデオ(24)をマルチレイヤビデオデータストリーム(14)にエンコードするためのエンコーダ(40)であって、前記エンコーダは、サブピクチャ単位の独立コード化をサポートし、
    前記マルチレイヤビデオデータストリーム(14)の第2のレイヤ(L0)からの予測のためのレイヤ間予測ツールのセットを使用して、かつ前記サブピクチャ単位の独立コード化のための第1の構成設定を使用して、前記マルチレイヤビデオデータストリーム(14)の第1のレイヤ(L1)に、前記ビデオの第1のバージョン(24)をエンコードすることと、
    前記サブピクチャ単位の独立コード化のための第2の構成設定を使用して、前記マルチレイヤビデオデータストリーム(14)の前記第2のレイヤ(L0)に、前記ビデオの第2のバージョン(24)をエンコードすることと、
    前記第1の構成設定及び前記第2の構成設定が所定の関係を有するかどうかをチェックすることと、
    前記第1の構成設定及び前記第2の構成設定が前記所定の関係を有しない場合、1つ以上のレイヤ間予測ツールの所定のサブセットを無効にするか、またはその使用を控えることと、を行うように構成される、前記エンコーダ。
  18. 前記所定の関係は、
    第1のビデオ及び第2のビデオが、それぞれ複数のサブピクチャに細分されるようにして、前記第1のレイヤ及び前記第2のレイヤにエンコードされる場合、及び/または
    前記第1のビデオ及び前記第2のビデオが、前記第1のビデオ及び前記第2のビデオの間で等しい数のサブピクチャにそれぞれ細分されるようにして、前記第1のレイヤ及び前記第2のレイヤにエンコードされる場合、及び/または
    前記第1のビデオ及び前記第2のビデオが、前記第1のビデオ及び前記第2のビデオの間で等しい数のサブピクチャにそれぞれ細分されるようにして、前記第1のレイヤ及び前記第2のレイヤにエンコードされ、前記サブピクチャの境界が空間的に一致する場合、及び/または
    前記第1のビデオ及び前記第2のビデオが、いくつかのサブピクチャにそれぞれ細分されるようにして、前記第1のレイヤ及び前記第2のレイヤにエンコードされ、前記マルチレイヤビデオデータストリーム(14)で前記サブピクチャにシグナリングされるサブピクチャIDが一致している場合、及び/または
    前記第1のビデオ及び前記第2のビデオが、いくつかのサブピクチャにそれぞれ細分されるようにして、前記第1のレイヤ及び前記第2のレイヤにエンコードされ、前記サブピクチャの境界処理が一致する場合、前記第1の構成設定及び前記第2の構成設定が前記所定の関係を有する関係である、請求項17に記載のエンコーダ。
  19. 前記1つ以上のレイヤ間予測ツールの所定のサブセットが、
    レイヤ間動きベクトル予測、
    ベクトルベースのレイヤ間予測のオプティカルフロー精緻化、及び/または
    ベクトルベースのレイヤ間予測における動きベクトルラップアラウンド、を含む、請求項17~18のいずれかに記載のエンコーダ。
  20. 前記マルチレイヤビデオデータストリーム(14)に前記第1の構成設定及び前記第2の構成設定をシグナリングするように構成される、請求項17~19のいずれかに記載のエンコーダ。
  21. 前記第1の構成設定及び前記第2の構成設定が前記所定の関係を有する場合、前記1つ以上のレイヤ間予測ツールの所定のサブセットを有効化するまたは利用するように構成される、請求項17~20のいずれかに記載のエンコーダ。
  22. マルチレイヤビデオデータストリーム(12、14)をデコードするためのデコーダ(50)であって、前記デコーダは、
    前記マルチレイヤビデオデータストリームの第2のレイヤからの予測のためのレイヤ間予測ツールのセットを使用して、かつサブピクチャ単位の独立コード化のための第1の構成設定を使用して、前記マルチレイヤビデオデータストリームの第1のレイヤ(L1)から、ビデオの第1のバージョン(24)をデコードすることと、
    前記サブピクチャ単位の独立コード化のための第2の構成設定を使用して、前記マルチレイヤビデオデータストリームの前記第2のレイヤ(L0)から、前記ビデオ(24)の第2のバージョン(24)をデコードすることと、
    前記第1の構成設定及び前記第2の構成設定が所定の関係を有するかどうかをチェックすることと、
    前記第1の構成設定及び前記第2の構成設定が前記所定の関係を有する場合、1つ以上のレイヤ間予測ツールの所定のサブセットを無効にすることと、を行うように構成される、前記デコーダ。
  23. サブピクチャ境界でのベクトルクリッピング及び/またはサブピクチャ境界での境界パディングを含む、サブピクチャ単位の独立デコードのために構成される、請求項22に記載のデコーダ。
  24. 前記所定の関係は、
    第1のビデオ及び第2のビデオが、それぞれ複数のサブピクチャに細分されるようにして、前記第1のレイヤ及び前記第2のレイヤにエンコードされる場合、及び/または
    前記第1のビデオ及び前記第2のビデオが、前記第1のビデオ及び前記第2のビデオの間で等しい数のサブピクチャにそれぞれ細分されるようにして、前記第1のレイヤ及び前記第2のレイヤにエンコードされる場合、及び/または
    前記第1のビデオ及び前記第2のビデオが、いくつかのサブピクチャにそれぞれ細分されるようにして、前記第1のレイヤ及び前記第2のレイヤにエンコードされ、前記マルチレイヤビデオデータストリームで前記サブピクチャにシグナリングされるサブピクチャIDが一致している場合、及び/または
    前記第1のビデオ及び前記第2のビデオが、いくつかのサブピクチャにそれぞれ細分されるようにして、前記第1のレイヤ及び前記第2のレイヤにエンコードされ、前記サブピクチャの境界処理が一致する場合、前記第1の構成設定及び前記第2の構成設定が前記所定の関係を有する関係である、請求項22または請求項23に記載のデコーダ。
  25. 前記1つ以上のレイヤ間予測ツールの所定のサブセットが、
    レイヤ間動きベクトル予測、
    ベクトルベースのレイヤ間予測のオプティカルフロー精緻化、及び/または
    ベクトルベースのレイヤ間予測における動きベクトルラップアラウンド、を含む、請求項22~24のいずれかに記載のデコーダ。
  26. レイヤのセットを含むマルチレイヤビデオデータストリーム(14)をエンコードするためのエンコーダ(40)であって、
    前記マルチレイヤビデオデータストリーム(14)に、前記レイヤのセットの非縮小バージョンをエンコードすることであって、ビデオバージョンは、レイヤごとに1つ以上の独立してコード化されるサブピクチャの単位で、前記レイヤのセットの前記非縮小バージョンにエンコードされる、エンコードすることと、
    前記レイヤのセットの前記非縮小バージョンのデコードに関連する基準デコーダ機能要件を、前記マルチレイヤビデオデータストリーム(14)にエンコードすることと、
    前記マルチレイヤビデオデータストリーム(14)に、前記レイヤのセットの各レイヤについて、前記レイヤのセットの前記非縮小バージョンのそれぞれのレイヤにコード化されたピクチャのピクチャサイズに関する情報(22)と、前記それぞれのレイヤの前記1つ以上の独立してコード化されたサブピクチャのそれぞれについて、サブピクチャサイズとをエンコードすることと、
    少なくとも1つのレイヤのサブピクチャ関連部分が除去された前記レイヤのセットの1つ以上の縮小バージョンのそれぞれについて、前記レイヤのセットのそれぞれの縮小バージョンのデコードに関連するデコーダ機能要件(60)を、前記レイヤのセットの前記それぞれの縮小バージョンに含まれる独立してコード化されたサブピクチャのサブピクチャサイズにわたる合計をピクチャサイズにわたる合計で割った商を用いて決定される係数によって前記基準デコーダ機能要件をスケーリングすることによって、決定することと、を行うように構成される、前記エンコーダ。
  27. レイヤのセットを含むマルチレイヤビデオデータストリーム(14)からサブピクチャ別ビデオデータストリーム(12)を抽出するための装置(40)であって、前記マルチレイヤビデオデータストリーム(14)には、前記レイヤのセットの非縮小バージョンがエンコードされ、ビデオバージョンは、レイヤごとに1つ以上の独立してコード化されるサブピクチャの単位で、前記レイヤのセットの前記非縮小バージョンにエンコードされ、前記装置は、
    前記レイヤのセットの前記非縮小バージョンのデコードに関連する基準デコーダ機能要件を、前記マルチレイヤビデオデータストリーム(14)から導出することと、
    前記マルチレイヤビデオデータストリーム(14)から、前記レイヤのセットの各レイヤについて、前記レイヤのセットの前記非縮小バージョンのそれぞれのレイヤにコード化されたピクチャのピクチャサイズに関する情報(22)と、前記それぞれのレイヤの前記1つ以上の独立してコード化されたサブピクチャのそれぞれについて、サブピクチャサイズとを導出することと、
    少なくとも1つのレイヤのサブピクチャ関連部分が除去された前記レイヤのセットの所定の縮小バージョンについて、前記レイヤのセットの前記所定の縮小バージョンのデコードに関連するデコーダ機能要件(60)を、前記レイヤのセットの前記所定の縮小バージョンに含まれる独立してコード化されたサブピクチャのサブピクチャサイズにわたる合計をピクチャサイズにわたる合計で割った商を用いて決定される係数によって前記基準デコーダ機能要件をスケーリングすることによって、決定することと、を行うように構成される、前記装置。
  28. 複数のレイヤ(L0、L1)を含むマルチレイヤビデオデータストリーム(14)をエンコードするためのエンコーダ(40)であって、
    1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャに細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)のレイヤに、ビデオピクチャ(26)をエンコードすることと、
    少なくとも1つの第1のレイヤがレイヤセットに含まれ、少なくとも1つの第2のレイヤが前記レイヤセットに含まれるような前記レイヤのレイヤセットの表示(18)を、前記マルチレイヤビデオデータストリーム(14)に、エンコードすることと、
    前記レイヤのレイヤセットをデコードするのに十分な複数の基準デコーダ機能要件(130)のそれぞれについて、前記少なくとも1つの第1のレイヤに帰属するそれぞれの基準デコーダ機能要件の第1の割合(134)と、前記少なくとも1つの第2のレイヤに帰属する前記それぞれの基準デコーダ機能要件の第2の割合(132)とに関する情報を、前記マルチレイヤビデオデータストリーム(14)に、エンコードすることと、を行うように構成される、前記エンコーダ。
  29. 一方では前記マルチレイヤビデオデータストリーム(14)に前記第1の割合を書き込み、他方(136)では前記第2の割合を1マイナス前記第1の割合で割ったものを書き込むことにより、前記第1の割合及び前記第2の割合に関する情報をエンコードするように構成される、請求項28に記載のエンコーダ。
  30. 前記複数の基準デコーダ機能要件のうちの1つ以上に関する情報を前記マルチレイヤビデオデータストリーム(14)にエンコードするように構成される、請求項28~29のいずれかに記載のエンコーダ。
  31. 前記複数の基準デコーダ機能要件の少なくとも1つについて、前記第1の割合及び前記第2の割合が、前記マルチレイヤビデオデータストリーム(14)の縮小バージョンに関連し、前記第1の割合が、前記縮小バージョンに存在する1つ以上の独立してコード化されたサブピクチャのそれぞれに対して、前記マルチレイヤビデオデータストリーム(14)から導出可能であるように、情報をエンコードするように構成される、請求項28~30のいずれかに記載のエンコーダ。
  32. 前記複数の基準デコーダ機能要件の少なくともさらなる1つについて、前記第1の割合及び前記第2の割合が、前記マルチレイヤビデオデータストリーム(14)の非縮小バージョンに関連し、前記第1の割合が、前記少なくとも1つの第1のレイヤの前記独立してコード化されたサブピクチャのそれぞれに対して、前記マルチレイヤビデオデータストリーム(14)から導出可能であるように、情報をエンコードするように構成される、請求項28~31のいずれかに記載のエンコーダ。
  33. 複数のレイヤを含むマルチレイヤビデオデータストリーム(14)を処理するための装置(10、100)であって、1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャに細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)の前記レイヤに、ビデオピクチャがエンコードされており、
    少なくとも1つの第1のレイヤがレイヤセットに含まれ、少なくとも1つの第2のレイヤが前記レイヤセットに含まれるような前記レイヤのレイヤセットの表示(18)を、前記マルチレイヤビデオデータストリーム(14)から、デコードすることと、
    前記レイヤのセットをデコードするのに十分な複数の基準デコーダ機能要件のそれぞれについて、前記少なくとも1つの第1のレイヤに帰属するそれぞれの基準デコーダ機能要件の第1の割合と、前記少なくとも1つの第2のレイヤに帰属する前記それぞれの基準デコーダ機能要件の第2の割合とに関する情報を、前記マルチレイヤビデオデータストリーム(14)から、デコードすることと、を行うように構成される、前記装置。
  34. 一方では前記マルチレイヤビデオデータストリーム(14)から前記第1の割合を読み出し、他方では前記第2の割合を1マイナス前記第1の割合で割ったものを読み出すことにより、前記第1の割合及び前記第2の割合に関する情報をデコードするように構成される、請求項33に記載の装置。
  35. 前記マルチレイヤビデオデータストリーム(14)から前記第1の割合及びさらなる割合を読み出すことにより、前記第1の割合及び前記第2の割合に関する情報をデコードすることと、1から前記第1の割合を引いた差を前記さらなる割合に掛けることによって前記第2の割合を導出することと、を行うように構成される、請求項33~34のいずれかに記載の装置。
  36. 前記第1の割合及び前記第2の割合を合計して、前記レイヤセットの実際のデコーダ機能要件を取得するように構成される、請求項33~35のいずれかに記載の装置。
  37. 前記複数の基準デコーダ機能要件のうちの1つ以上に関する情報を前記マルチレイヤビデオデータストリーム(14)からデコードするように構成される、請求項33~36のいずれかに記載の装置。
  38. 前記複数の基準デコーダ機能要件の少なくとも1つについて、前記第1の割合及び前記第2の割合が、前記マルチレイヤビデオデータストリーム(14)の縮小バージョンに関連し、前記第1の割合が、前記縮小バージョンに存在する1つ以上の独立してコード化されたサブピクチャのそれぞれに対して、前記マルチレイヤビデオデータストリーム(14)から導出可能であるように、情報をデコードするように構成される、請求項33~37のいずれかに記載の装置。
  39. 前記複数の基準デコーダ機能要件の少なくともさらなる1つについて、前記第1の割合及び前記第2の割合が、前記マルチレイヤビデオデータストリーム(14)の非縮小バージョンに関連し、前記第1の割合が、前記少なくとも1つの第1のレイヤの前記独立してコード化されたサブピクチャのそれぞれに対して、前記マルチレイヤビデオデータストリーム(14)から導出可能であるように、情報をデコードするように構成される、請求項33~38のいずれかに記載の装置。
  40. 前記情報を使用して、前記マルチレイヤビデオデータストリーム(14)またはその縮小バージョンを別のビデオデータストリームと混合することに基づいて、さらなるデータストリームを形成することを決定するように構成される、請求項33~39のいずれかに記載の装置。
  41. 複数のレイヤを含むマルチレイヤビデオデータストリーム(14)をエンコードするためのエンコーダ(40)であって、
    1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャに細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)のレイヤに、ビデオピクチャをエンコードすることと、
    少なくとも1つの第1のレイヤがレイヤセットに含まれるような前記レイヤのレイヤセットの表示を、前記マルチレイヤビデオデータストリーム(14)に、エンコードすることと、
    前記マルチレイヤビデオデータストリーム(14)に、前記レイヤセットの各レイヤに対する第1のデコーダ機能要件パラメータと、前記レイヤセットに対する第2のデコーダ機能要件パラメータとを含む、前記レイヤのレイヤセットの非縮小バージョンのデコードに関連する基準デコーダ機能要件情報をエンコードすることと、
    少なくとも1つの第1のレイヤのサブピクチャ関連部分が除去された前記レイヤのレイヤセットの1つ以上の縮小バージョンのそれぞれについて、前記レイヤのレイヤセットのそれぞれの非縮小バージョンのデコードに関連するさらなる基準デコーダ機能要件情報を、
    第1の割合を用いて前記第1のデコーダ機能要件パラメータをスケーリングして、前記レイヤセットの各レイヤの第3のデコーダ機能要件パラメータを取得することと、
    第2の割合を用いて前記第2のデコーダ機能要件パラメータをスケーリングして、前記レイヤセットのそれぞれの縮小バージョンに対する第4のデコーダ機能要件パラメータを取得することと、によって決定することと、を行うように構成される、前記エンコーダ。
  42. 複数のレイヤを含むマルチレイヤビデオデータストリーム(14)から、サブピクチャ別ビデオデータストリーム(12)を抽出するための装置(10)であって、1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャに細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)の前記レイヤに、ビデオピクチャがエンコードされており、
    少なくとも1つの第1のレイヤがレイヤセットに含まれるような前記レイヤのレイヤセットの表示を、前記マルチレイヤビデオデータストリーム(14)から、デコードすることと、
    前記マルチレイヤビデオデータストリーム(14)から、前記レイヤセットの各レイヤに対する第1のデコーダ機能要件パラメータと、前記レイヤセットに対する第2のデコーダ機能要件パラメータとを含む、前記レイヤのレイヤセットの非縮小バージョンのデコードに関連する基準デコーダ機能要件情報をデコードすることと、
    少なくとも1つの第1のレイヤのサブピクチャ関連部分が除去される前記レイヤのレイヤセットの所定の縮小バージョンについて、前記レイヤのレイヤセットの前記所定の非縮小バージョンのデコードに関連するさらなる基準デコーダ機能要件情報を、
    第1の割合を用いて前記第1のデコーダ機能要件パラメータをスケーリングして、前記レイヤセットの各レイヤの第3のデコーダ機能要件パラメータを取得することと、
    第2の割合を用いて前記第2のデコーダ機能要件パラメータをスケーリングして、前記レイヤセットの前記所定の縮小バージョンに対する第4のデコーダ機能要件パラメータを取得することと、によって決定することと、
    少なくとも1つの第1のレイヤの前記サブピクチャ関連部分を除去し、前記第3のデコーダ機能要件パラメータ及び前記第4のデコーダ機能要件パラメータを、前記サブピクチャ別ビデオデータストリーム(12)に提供することによって、前記マルチレイヤビデオデータストリーム(14)に基づいて、前記サブピクチャ別ビデオデータストリーム(12)を形成すること、または
    少なくとも1つの第1のレイヤの前記サブピクチャ関連部分を除去し、デコーダによる前記レイヤのレイヤセットの前記所定の非縮小バージョンのデコードに関連するさらなる基準デコーダ機能要件情報の決定のための前記第1の割合及び前記第2の割合を、前記サブピクチャ別ビデオデータストリーム(12)に提供することによって、前記マルチレイヤビデオデータストリーム(14)に基づいて、前記サブピクチャ別ビデオデータストリーム(12)を形成することと、を行うように構成される、前記装置。
  43. 複数のレイヤを含むマルチレイヤビデオデータストリーム(14)をエンコードするためのエンコーダ(40)であって、
    1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャ(28)に細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)のレイヤに、ビデオピクチャ(26、26)をエンコードすることと、
    少なくとも1つの第1のレイヤがレイヤセットに含まれるような前記レイヤのレイヤセットの表示を、前記マルチレイヤビデオデータストリーム(14)に、エンコードすることと、
    前記マルチレイヤビデオデータストリーム(14)において、前記レイヤのレイヤセットをデコードするのに十分な1つ以上の基準デコーダ機能要件を示すことと、
    前記レイヤセットの前記第1のレイヤのそれぞれについて、前記基準デコーダ機能要件のそれぞれについて、それぞれの第1のレイヤにコード化された前記サブピクチャのそれぞれについて、選択的に、それぞれの基準デコーダ機能要件に固有の、所定のパラメータのセットについての制約が満たされるかどうかをチェックすることと、を行うように構成される、前記エンコーダ。
  44. 前記エンコーダは、それぞれのサブピクチャに帰属する前記それぞれの基準デコーダ機能要件の割合に関する情報を使用して、前記パラメータのセットの前記パラメータを決定するように構成される、請求項43に記載のエンコーダ。
  45. 前記パラメータのセットが、それぞれのサブピクチャについて、サンプル数、ピクチャ幅、ピクチャ高さ、行内のタイル数、列内のタイル数、タイルの総数のうちの1つ以上または全てを含む、請求項43または44に記載のエンコーダ。
  46. 複数のレイヤを含むマルチレイヤビデオデータストリーム(14)であって、前記マルチレイヤビデオデータストリームは、
    1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャ(28)に細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)のレイヤに、ビデオピクチャ(26、26)をエンコードしており、
    少なくとも1つの第1のレイヤがレイヤセットに含まれるような前記レイヤのレイヤセットの表示を、前記マルチレイヤビデオデータストリーム(14)に、エンコードしており、
    前記マルチレイヤビデオデータストリーム(14)において、前記レイヤのレイヤセットをデコードするのに十分な1つ以上の基準デコーダ機能要件(130)を示しており、
    前記レイヤセットの前記第1のレイヤのそれぞれについて、前記基準デコーダ機能要件のそれぞれについて、それぞれの第1のレイヤにコード化された前記サブピクチャのそれぞれについて、選択的に、それぞれの基準デコーダの能力要件に固有の、所定のパラメータのセットについての制約が満たされるように、前記マルチレイヤビデオデータストリームに、前記ビデオピクチャがエンコードされている、前記マルチレイヤビデオデータストリーム。
  47. ビデオデータストリーム(20)をデコードするためのデコーダ(110)であって、
    前記ビデオデータストリームから、前記ビデオデータストリームにエンコードされたピクチャが、1つ以上の独立してコード化されたサブピクチャ(28)によってエンコードされているかどうかを示す表示(80)をデコードするように構成されており、前記表示は、前記1つ以上の独立してコード化されたサブピクチャと、前記1つ以上の独立してコード化されたサブピクチャの周囲との間のコード化の独立性の異なるタイプを識別するものである、前記デコーダ。
  48. 前記表示(80)が示す前記コード化の独立性の異なるタイプがどれであるかとは無関係に、前記ビデオデータストリームにエンコードされたピクチャが、1つ以上の独立してコード化されたサブピクチャによってエンコードされていることを示す前記表示に応答して、
    前記ビデオデータストリームの各ビットストリームパケットから、前記1つ以上の独立してコード化されたサブピクチャのいずれがそれぞれのビットストリームパケットにエンコードされているかを示すサブピクチャ識別子を読み出すこと、及び/または
    ループ内フィルタリングがサブピクチャの境界を越えるのを防止すること、及び/または
    前記ピクチャのブロックのブロックアドレスからピクチャ位置を導出することであって、このブロックアドレスは、前記1つ以上の独立してコード化されたサブピクチャのいずれが所定のビットストリームパケットにエンコードされるかに依存して、前記ビデオデータストリームの所定のビットストリーム部分にコード化される、前記導出すること、及び/または
    前記ビデオデータストリームの1つのアクセスユニットに発生する異なるNALユニットタイプを許容すること、を実行するように構成される、請求項47に記載のデコーダ。
  49. 前記ピクチャの前記サブピクチャ間の前記コード化の独立性の異なるタイプは、
    エンコーダ制約型エンコードタイプであって、前記デコーダが、前記独立してコード化されたサブピクチャに関して、前記表示によって、前記エンコーダ制約型エンコードタイプが指示された場合、前記独立してコード化されたサブピクチャの境界における独立性処理を行わないように構成される、前記エンコーダ制約型エンコードタイプと、
    デコーダ認識型エンコードタイプであって、前記デコーダが、前記独立してコード化されたサブピクチャに関して、前記表示によって、前記デコーダ認識型エンコードタイプが指示された場合、ベクトルベース予測のためのベクトルクリッピング及び/または前記独立してコード化されたサブピクチャの境界における境界パディングによって、前記独立してコード化されたサブピクチャの境界における独立性処理を行なうように構成される、前記デコーダ認識型エンコードタイプと、を含む、請求項47~48のいずれかに記載のデコーダ。
  50. ビデオデータストリーム(12;12)をエンコードするためのエンコーダ(40,401,,40)であって、
    前記ビデオデータストリーム(12;12)に、前記ビデオデータストリーム(12;12)にエンコードされたピクチャ(26;26)が、1つ以上の独立してコード化されたサブピクチャ(28)によってエンコードされているかどうかを示す表示(80)をエンコードするように構成されており、前記表示(80)は、前記1つ以上の独立してコード化されたサブピクチャ(28)と、前記1つ以上の独立してコード化されたサブピクチャの周囲との間のコード化の独立性の異なるタイプを識別するものである、前記エンコーダ。
  51. 前記表示が示すコード化の独立性の異なるタイプがどれであるかとは無関係に、ビデオデータストリームにエンコードされたピクチャが、1つ以上の独立してコード化されたサブピクチャによってエンコードされていることを前記表示が示す場合、
    前記ビデオデータストリームの各ビットストリームパケットに、前記1つ以上の独立してコード化されたサブピクチャのいずれがそれぞれのビットストリームパケットにエンコードされているかを示すサブピクチャ識別子(82)を書き込むこと、及び/または
    ループ内フィルタリングがサブピクチャの境界(84)を越えるのを防止すること、及び/または
    前記ピクチャのブロックのブロックアドレスからピクチャ位置を導出することであって、このブロックアドレスは、前記1つ以上の独立してコード化されたサブピクチャのいずれが所定のビットストリームパケットにエンコードされるかに依存して、前記ビデオデータストリームの所定のビットストリーム部分にコード化される、前記導出すること、及び/または
    前記ビデオデータストリームの1つのアクセスユニットに発生する異なるNALユニットタイプを許容すること、及び/または
    前記1つ以上の独立してコード化されたサブピクチャのそれぞれについて、デコーダ機能要件情報を導出すること、を実行するように構成される、請求項50に記載のエンコーダ。
  52. 前記ピクチャの前記サブピクチャ間の前記コード化の独立性の異なるタイプは、
    エンコーダ制約型エンコードタイプであって、エンコーダが、前記独立してコード化されたサブピクチャに関して、前記表示によって、前記エンコーダ制約型エンコードタイプが指示された場合、サブピクチャの境界を越えてコード化の依存性が発生しないように、コード化オプションを制限するように構成される、前記エンコーダ制約型エンコードタイプと、
    デコーダ認識型エンコードタイプであって、デコーダが、前記独立してコード化されたサブピクチャに関して、前記表示によって、前記デコーダ認識型エンコードタイプが指示された場合、ベクトルベース予測のためのベクトルクリッピング及び/またはデコーダ側で模倣すべき、前記独立してコード化されたサブピクチャの境界における境界パディングによって、前記独立してコード化されたサブピクチャの境界における独立性処理を行なうように構成される、前記デコーダ認識型エンコードタイプと、を含む、請求項50~51のいずれかに記載のエンコーダ。
  53. ビットストリーム部分(16)で構成され、そのそれぞれがマルチレイヤビデオデータストリームのレイヤ(L0、L1)の1つに属する、前記マルチレイヤビデオデータストリーム(14)から、サブピクチャ別ビデオデータストリーム(12)を抽出する方法(10)であって、
    前記マルチレイヤビデオデータストリーム(14)のレイヤセット(OLS)からの各レイヤについて、
    ビデオのピクチャ(26、26)が、それぞれの前記レイヤに相互に独立してエンコードされる2つ以上のサブピクチャ(28)に細分されることによって、前記ビデオ(24)の各ピクチャ(26、26)について、それぞれのピクチャの前記サブピクチャ(28)が、それぞれのレイヤの相互に異なるビットストリーム部分(16)にエンコードされるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうか、またはサブピクチャに細分されないように前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうかをチェックして、
    サブピクチャに細分されないように前記それぞれのレイヤに前記ビデオがエンコードされている場合、
    前記それぞれのレイヤに属する前記ビットストリーム部分(16)を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、前記それぞれのレイヤの前記ビデオ(24)が完全にエンコードされているようにすることと、
    前記ビデオのピクチャ(26)が、2つ以上のサブピクチャ(28)に細分されるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされている場合、
    前記それぞれのレイヤに属する各ビットストリーム部分について、
    前記ビットストリーム部分(16)から、それぞれのビットストリーム部分に前記2つ以上のサブピクチャのうちのどのサブピクチャがエンコードされているかを明らかにする情報を読み出すことと、
    前記それぞれのビットストリーム部分に、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている場合には、前記それぞれのレイヤの前記それぞれのビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、を含む、前記方法。
  54. ビットストリーム部分(16)で構成され、そのそれぞれがマルチレイヤビデオデータストリーム(14)のレイヤ(L0、L1)の1つに属する、前記マルチレイヤビデオデータストリーム(14)を形成するための方法(40)であって、
    前記マルチレイヤビデオデータストリーム(14)に、前記マルチレイヤビデオデータストリーム(14)のレイヤセット(OLS)を示すOLS表示(18)を提供することと、
    前記マルチレイヤビデオデータストリーム(14)に、前記マルチレイヤビデオデータストリーム(14)から抽出可能なサブピクチャ別ビデオデータストリーム(12)に関するデコーダ機能要件情報(60)を提供することであって、
    ビデオのピクチャ(26)が、それぞれの前記レイヤに相互に独立してエンコードされる2つ以上のサブピクチャ(28)に細分されることによって、前記ビデオ(24)の各ピクチャ(26)について、それぞれのピクチャの前記サブピクチャ(28)が、それぞれのレイヤの相互に異なるビットストリーム部分(16)にエンコードされるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうか、またはサブピクチャに細分されないように前記それぞれのレイヤに前記ビデオ(24)がエンコードされているかどうかをチェックして、
    サブピクチャに細分されないように前記それぞれのレイヤに前記ビデオがエンコードされている場合、
    前記それぞれのレイヤに属する前記ビットストリーム部分(16)を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、前記それぞれのレイヤの前記ビデオ(24)が完全にエンコードされているようにすることと、
    前記ビデオのピクチャ(26)が、2つ以上のサブピクチャ(28)に細分されるように、前記それぞれのレイヤに前記ビデオ(24)がエンコードされている場合、
    前記それぞれのレイヤに属する各ビットストリーム部分について、
    前記ビットストリーム部分(16)から、それぞれのビットストリーム部分に前記2つ以上のサブピクチャのうちのどのサブピクチャがエンコードされているかを明らかにする情報を読み出すことと、
    前記それぞれのビットストリーム部分に、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている場合には、前記それぞれのレイヤの前記それぞれのビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、を含む、前記方法。
  55. ビットストリーム部分(16)で構成され、そのそれぞれがマルチレイヤビデオデータストリーム(14)のレイヤの1つに属する、前記マルチレイヤビデオデータストリーム(14)から、サブピクチャ別ビデオデータストリーム(12)を抽出する方法(10)であって、前記マルチレイヤビデオデータストリーム(14)が、
    第1のレイヤの前記ビットストリーム部分(16)に相互に独立してエンコードされることによって、第1のビデオの各ピクチャについて、前記第1のビデオのそれぞれのピクチャのサブピクチャが、前記第1のレイヤの相互に異なるビットストリーム部分にエンコードされる、2つ以上のサブピクチャ(28)に、前記第1のビデオのピクチャ(26)が細分されるように、前記ビットストリーム部分に前記第1のビデオ(24)がエンコードされている、前記第1のレイヤ(L1)と、
    ビットストリーム部分に第2のビデオ(24)がエンコードされている、第2のレイヤ(L0)とを含み、
    前記第1のレイヤのビットストリーム部分には、前記第1のビデオが、
    基準ピクチャ(26)からのベクトルベース予測を使用して、
    前記第2のビデオ(24)のピクチャ(26)を前記基準ピクチャとして含むようにして、
    前記第1のレイヤのビットストリーム部分がエンコードされるベクトル(70)を使用して、前記第1のレイヤのビットストリーム部分によって構成されるベクトル(70)が、ベクトルベース予測での使用のために、前記第1のビデオの前記ピクチャ及び前記基準ピクチャに対して、それぞれ前記マルチレイヤビデオデータストリーム(14)でシグナリングされたスケーリングウィンドウ(72)のサイズ及び位置に従ってスケーリング及びオフセットが行われるようにして、エンコードされており、
    前記方法が、
    前記第2のレイヤ(L0)に属する前記ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、それぞれのレイヤ(L0)の前記ビデオが完全にエンコードされているようにすることと、
    前記第1のレイヤ(L1)に属し、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている各ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、
    前記第2のビデオの前記ピクチャに対する前記スケーリングウィンドウ(720′)の空間領域が、前記1つ以上のサブピクチャの所定のセットに対する前記スケーリングウィンドウ(721′)の空間領域に空間的に対応するように、前記サブピクチャ別ビデオデータストリーム(12)における前記第1のレイヤ及び/または前記第2のレイヤにスケーリングウィンドウシグナル伝達(74)を適応させることと、を含む、前記方法。
  56. ビットストリーム部分(16)で構成され、そのそれぞれがマルチレイヤビデオデータストリーム(14)のレイヤ(L0、L1)の1つに属する、前記マルチレイヤビデオデータストリーム(14)を形成する方法(40)であって、前記マルチレイヤビデオデータストリーム(14)が、
    第1のレイヤの前記ビットストリーム部分(16)に相互に独立してエンコードされることによって、第1のビデオの各ピクチャについて、前記第1のビデオのそれぞれのピクチャのサブピクチャが、前記第1のレイヤの相互に異なるビットストリーム部分にエンコードされる、2つ以上のサブピクチャ(28)に、前記第1のビデオのピクチャが細分されるように、前記ビットストリーム部分に前記第1のビデオがエンコードされている、前記第1のレイヤと、
    ビットストリーム部分に第2のビデオがエンコードされている、第2のレイヤとを含み、
    前記第1のレイヤのビットストリーム部分には、前記第1のビデオが、
    基準ピクチャからのベクトルベース予測を使用して、
    前記第2のビデオのピクチャを前記基準ピクチャとして含むようにして、
    前記第1のレイヤのビットストリーム部分がエンコードされるベクトル(70)を使用して、前記第1のレイヤのビットストリーム部分によって構成されるベクトル(70)が、ベクトルベース予測での使用のために、前記第1のビデオの前記ピクチャ及び前記基準ピクチャに対して、それぞれ前記マルチレイヤビデオデータストリーム(14)でシグナリングされたスケーリングウィンドウ(72)のサイズ及び位置に従ってスケーリング及びオフセットが行われるようにして、エンコードされており、
    前記方法は、サブピクチャ別ビデオデータストリーム(12)が、
    前記第2のレイヤに属する前記ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継いで、前記サブピクチャ別ビデオデータストリーム(12)に、それぞれのレイヤの前記ビデオが完全にエンコードされているようにすることと、
    前記第1のレイヤに属し、1つ以上のサブピクチャの所定のセットに属するサブピクチャがエンコードされている各ビットストリーム部分を、前記マルチレイヤビデオデータストリーム(14)から、前記サブピクチャ別ビデオデータストリーム(12)に引き継ぐことと、
    前記第2のビデオの前記ピクチャに対する前記スケーリングウィンドウ(72’)の空間領域が、前記1つ以上のサブピクチャの所定のセットに対する前記スケーリングウィンドウ(72’)の空間領域に空間的に対応するように、前記サブピクチャ別ビデオデータストリーム(12)における前記第1のレイヤ及び/または前記第2のレイヤにスケーリングウィンドウシグナル伝達(74)を適応させることとによって、前記マルチレイヤビデオデータストリーム(14)から抽出可能であるように、前記マルチレイヤビデオデータストリーム(14)を形成する、前記方法。
  57. サブピクチャ単位の独立したコード化を使用して、ビデオ(24)をマルチレイヤビデオデータストリーム(14)にエンコードする方法(40)であって、
    前記マルチレイヤビデオデータストリーム(14)の第2のレイヤ(L0)からの予測のためのレイヤ間予測ツールのセットを使用して、かつ前記サブピクチャ単位の独立コード化のための第1の構成設定を使用して、前記マルチレイヤビデオデータストリーム(14)の第1のレイヤ(L1)に、前記ビデオの第1のバージョン(24)をエンコードすることと、
    前記サブピクチャ単位の独立コード化のための第2の構成設定を使用して、前記マルチレイヤビデオデータストリーム(14)の前記第2のレイヤ(L0)に、前記ビデオの第2のバージョン(24)をエンコードすることと、
    前記第1の構成設定及び前記第2の構成設定が所定の関係を有するかどうかをチェックすることと、
    前記第1の構成設定及び前記第2の構成設定が前記所定の関係を有しない場合、1つ以上のレイヤ間予測ツールの所定のサブセットを無効にするか、またはその使用を控えることと、を含む、前記方法。
  58. マルチレイヤビデオデータストリーム(12、14)をデコードする方法(50)であって、
    前記マルチレイヤビデオデータストリームの第2のレイヤからの予測のためのレイヤ間予測ツールのセットを使用して、かつサブピクチャ単位の独立コード化のための第1の構成設定を使用して、前記マルチレイヤビデオデータストリームの第1のレイヤ(L1)から、ビデオ(24)の第1のバージョン(24)をデコードすることと、
    前記サブピクチャ単位の独立コード化のための第2の構成設定を使用して、前記マルチレイヤビデオデータストリームの前記第2のレイヤ(L0)から、前記ビデオ(24)の第2のバージョン(24)をデコードすることと、
    前記第1の構成設定及び前記第2の構成設定が所定の関係を有するかどうかをチェックすることと、
    前記第1の構成設定及び前記第2の構成設定が前記所定の関係を有する場合、1つ以上のレイヤ間予測ツールの所定のサブセットを無効にすることと、を含む、前記方法。
  59. レイヤのセットを含むマルチレイヤビデオデータストリーム(14)をエンコードする方法(40)であって、
    前記マルチレイヤビデオデータストリーム(14)に、前記レイヤのセットの非縮小バージョンをエンコードすることであって、ビデオバージョンは、レイヤごとに1つ以上の独立してコード化されるサブピクチャの単位で、前記レイヤのセットの前記非縮小バージョンにエンコードされる、エンコードすることと、
    前記レイヤのセットの前記非縮小バージョンのデコードに関連する基準デコーダ機能要件を、前記マルチレイヤビデオデータストリーム(14)にエンコードすることと、
    前記マルチレイヤビデオデータストリーム(14)に、前記レイヤのセットの各レイヤについて、前記レイヤのセットの前記非縮小バージョンのそれぞれのレイヤにコード化されたピクチャのピクチャサイズに関する情報(22)と、前記それぞれのレイヤの前記1つ以上の独立してコード化されたサブピクチャのそれぞれについて、サブピクチャサイズとをエンコードすることと、
    少なくとも1つのレイヤのサブピクチャ関連部分が除去された前記レイヤのセットの1つ以上の縮小バージョンのそれぞれについて、前記レイヤのセットのそれぞれの縮小バージョンのデコードに関連するデコーダ機能要件(60)を、前記レイヤのセットの前記それぞれの縮小バージョンに含まれる独立してコード化されたサブピクチャのサブピクチャサイズにわたる合計をピクチャサイズにわたる合計で割った商を用いて決定される係数によって前記基準デコーダ機能要件をスケーリングすることによって、決定することと、を含む、前記方法。
  60. レイヤのセットを含むマルチレイヤビデオデータストリーム(14)からサブピクチャ別ビデオデータストリーム(12)を抽出するための方法(40)であって、前記マルチレイヤビデオデータストリーム(14)には、前記レイヤのセットの非縮小バージョンがエンコードされ、ビデオバージョンは、レイヤごとに1つ以上の独立してコード化されるサブピクチャの単位で、前記レイヤのセットの前記非縮小バージョンにエンコードされ、前記方法は、
    前記レイヤのセットの前記非縮小バージョンのデコードに関連する基準デコーダ機能要件を、前記マルチレイヤビデオデータストリーム(14)から導出することと、
    前記マルチレイヤビデオデータストリーム(14)から、前記レイヤのセットの各レイヤについて、前記レイヤのセットの前記非縮小バージョンのそれぞれのレイヤにコード化されたピクチャのピクチャサイズに関する情報(22)と、前記それぞれのレイヤの前記1つ以上の独立してコード化されたサブピクチャのそれぞれについて、サブピクチャサイズとを導出することと、
    少なくとも1つのレイヤのサブピクチャ関連部分が除去された前記レイヤのセットの所定の縮小バージョンについて、前記レイヤのセットの前記所定の縮小バージョンのデコードに関連するデコーダ機能要件(60)を、前記レイヤのセットの前記所定の縮小バージョンに含まれる独立してコード化されたサブピクチャのサブピクチャサイズにわたる合計をピクチャサイズにわたる合計で割った商を用いて決定される係数によって前記基準デコーダ機能要件をスケーリングすることによって、決定することと、を含む、前記方法。
  61. 複数のレイヤ(L0、L1)を含むマルチレイヤビデオデータストリーム(14)をエンコードする方法(40)であって、
    1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャに細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)のレイヤに、ビデオピクチャ(26)をエンコードすることと、
    少なくとも1つの第1のレイヤがレイヤセットに含まれ、少なくとも1つの第2のレイヤが前記レイヤセットに含まれるような前記レイヤのレイヤセットの表示(18)を、前記マルチレイヤビデオデータストリーム(14)に、エンコードすることと、
    前記レイヤのセットをデコードするのに十分な複数の基準デコーダ機能要件(130)のそれぞれについて、前記少なくとも1つの第1のレイヤに帰属するそれぞれの基準デコーダ機能要件の第1の割合(134)と、前記少なくとも1つの第2のレイヤに帰属する前記それぞれの基準デコーダ機能要件の第2の割合(132)とに関する情報を、前記マルチレイヤビデオデータストリーム(14)に、エンコードすることと、を含む、前記方法。
  62. 複数のレイヤを含むマルチレイヤビデオデータストリーム(14)を処理するための方法(10、100)であって、1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャに細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)の前記レイヤに、ビデオピクチャがエンコードされており、
    少なくとも1つの第1のレイヤがレイヤセットに含まれ、少なくとも1つの第2のレイヤが前記レイヤセットに含まれるような前記レイヤのレイヤセットの表示(18)を、前記マルチレイヤビデオデータストリーム(14)から、デコードすることと、
    前記レイヤのセットをデコードするのに十分な複数の基準デコーダ機能要件のそれぞれについて、前記少なくとも1つの第1のレイヤに帰属するそれぞれの基準デコーダ機能要件の第1の割合と、前記少なくとも1つの第2のレイヤに帰属する前記それぞれの基準デコーダ機能要件の第2の割合とに関する情報を、前記マルチレイヤビデオデータストリーム(14)から、デコードすることと、を含む、前記方法。
  63. 複数のレイヤを含むマルチレイヤビデオデータストリーム(14)をエンコードする方法(40)であって、
    1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャに細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)のレイヤに、ビデオピクチャをエンコードすることと、
    少なくとも1つの第1のレイヤがレイヤセットに含まれるような前記レイヤのレイヤセットの表示を、前記マルチレイヤビデオデータストリーム(14)に、エンコードすることと、
    前記マルチレイヤビデオデータストリーム(14)に、前記レイヤセットの各レイヤに対する第1のデコーダ機能要件パラメータと、前記レイヤセットに対する第2のデコーダ機能要件パラメータとを含む、前記レイヤのレイヤセットの非縮小バージョンのデコードに関連する基準デコーダ機能要件情報をエンコードすることと、
    少なくとも1つの第1のレイヤのサブピクチャ関連部分が除去された前記レイヤのレイヤセットの1つ以上の縮小バージョンのそれぞれについて、前記レイヤのレイヤセットのそれぞれの非縮小バージョンのデコードに関連するさらなる基準デコーダ機能要件情報を、
    第1の割合を用いて前記第1のデコーダ機能要件パラメータをスケーリングして、前記レイヤセットの各レイヤの第3のデコーダ機能要件パラメータを取得することと、
    第2の割合を用いて前記第2のデコーダ機能要件パラメータをスケーリングして、前記レイヤセットのそれぞれの縮小バージョンに対する第4のデコーダ機能要件パラメータを取得することと、によって決定することと、を含む、前記方法。
  64. 複数のレイヤを含むマルチレイヤビデオデータストリーム(14)から、サブピクチャ別ビデオデータストリーム(12)を抽出するための方法(10)であって、1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャに細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)の前記レイヤに、ビデオピクチャがエンコードされており、
    少なくとも1つの第1のレイヤがレイヤセットに含まれるような前記レイヤのレイヤセットの表示を、前記マルチレイヤビデオデータストリーム(14)から、デコードすることと、
    前記マルチレイヤビデオデータストリーム(14)から、前記レイヤセットの各レイヤに対する第1のデコーダ機能要件パラメータと、前記レイヤセットに対する第2のデコーダ機能要件パラメータとを含む、前記レイヤのレイヤセットの非縮小バージョンのデコードに関連する基準デコーダ機能要件情報をデコードすることと、
    少なくとも1つの第1のレイヤのサブピクチャ関連部分が除去される前記レイヤのレイヤセットの所定の縮小バージョンについて、前記レイヤのレイヤセットの前記所定の非縮小バージョンのデコードに関連するさらなる基準デコーダ機能要件情報を、
    第1の割合を用いて前記第1のデコーダ機能要件パラメータをスケーリングして、前記レイヤセットの各レイヤの第3のデコーダ機能要件パラメータを取得することと、
    v2の割合を用いて前記第2のデコーダ機能要件パラメータをスケーリングして、前記レイヤセットの前記所定の縮小バージョンに対する第4のデコーダ機能要件パラメータを取得することと、によって決定することと、
    少なくとも1つの第1のレイヤの前記サブピクチャ関連部分を除去し、前記第3のデコーダ機能要件パラメータ及び前記第4のデコーダ機能要件パラメータを、前記サブピクチャ別ビデオデータストリーム(12)に提供することによって、前記マルチレイヤビデオデータストリーム(14)に基づいて、前記サブピクチャ別ビデオデータストリーム(12)を形成すること、または
    少なくとも1つの第1のレイヤの前記サブピクチャ関連部分を除去し、デコーダによる前記レイヤのレイヤセットの前記所定の非縮小バージョンのデコードに関連するさらなる基準デコーダ機能要件情報の決定のための前記第1の割合及び第2の割合を、前記サブピクチャ別ビデオデータストリーム(12)に提供することによって、前記マルチレイヤビデオデータストリーム(14)に基づいて、前記サブピクチャ別ビデオデータストリーム(12)を形成することと、を含む、前記方法。
  65. 複数のレイヤを含むマルチレイヤビデオデータストリーム(14)をエンコードする方法(40)であって、
    1つ以上の第1のレイヤ(L1)に関して独立してコード化されたサブピクチャ(28)に細分されるようにして、かつ1つ以上の第2のレイヤ(L0)に関して細分されないようにして、前記マルチレイヤビデオデータストリーム(14)のレイヤに、ビデオピクチャ(26、26)をエンコードすることと、
    少なくとも1つの第1のレイヤがレイヤセットに含まれるような前記レイヤのレイヤセットの表示を、前記マルチレイヤビデオデータストリーム(14)に、エンコードすることと、
    前記マルチレイヤビデオデータストリーム(14)において、前記レイヤのレイヤセットをデコードするのに十分な1つ以上の基準デコーダ機能要件を示すことと、
    前記レイヤセットの前記第1のレイヤのそれぞれについて、それぞれの第1のレイヤにコード化された前記サブピクチャのそれぞれについて、前記基準デコーダ機能要件の1つ以上について、選択的に、それぞれの基準デコーダ機能要件に固有の、所定のパラメータのセットについての制約が満たされるかどうかをチェックすることと、を含む、前記方法。
  66. ビデオデータストリーム(20)をデコードする方法(110)であって、
    前記ビデオデータストリームから、前記ビデオデータストリームにエンコードされたピクチャが、1つ以上の独立してコード化されたサブピクチャ(28)によってエンコードされているかどうかを示す表示(80)をデコードすることを含み、前記表示は、前記1つ以上の独立してコード化されたサブピクチャと、前記1つ以上の独立してコード化されたサブピクチャの周囲との間のコード化の独立性の異なるタイプを識別するものである、前記方法。
  67. ビデオデータストリーム(12;12)をエンコードする方法(40、40、40)であって、
    前記ビデオデータストリーム(12;12)に、前記ビデオデータストリーム(12;12)にエンコードされたピクチャ(26;26)が、1つ以上の独立してコード化されたサブピクチャ(28)によってエンコードされているかどうかを示す表示(80)をエンコードすることを含み、前記表示(80)は、前記1つ以上の独立してコード化されたサブピクチャ(28)と、前記1つ以上の独立してコード化されたサブピクチャの周囲との間のコード化の独立性の異なるタイプを識別するものである、前記方法。
  68. コンピュータまたはシグナルプロセッサ上で実行されるときに請求項53~67に記載の方法のいずれかを実施するためのコンピュータプログラム。
JP2022570632A 2020-05-22 2021-05-20 サブピクチャ関連のビデオコード化の概念 Pending JP2023526460A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20176208.5 2020-05-22
EP20176208 2020-05-22
PCT/EP2021/063553 WO2021234125A1 (en) 2020-05-22 2021-05-20 Subpicture-related video coding concepts

Publications (2)

Publication Number Publication Date
JP2023526460A true JP2023526460A (ja) 2023-06-21
JPWO2021234125A5 JPWO2021234125A5 (ja) 2024-06-25

Family

ID=70977328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022570632A Pending JP2023526460A (ja) 2020-05-22 2021-05-20 サブピクチャ関連のビデオコード化の概念

Country Status (9)

Country Link
US (1) US20230199202A1 (ja)
EP (1) EP4154535A1 (ja)
JP (1) JP2023526460A (ja)
KR (1) KR20230015447A (ja)
CN (1) CN115868166A (ja)
AU (1) AU2021275492A1 (ja)
CA (1) CA3184462A1 (ja)
TW (1) TWI801882B (ja)
WO (1) WO2021234125A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116530083A (zh) * 2020-09-25 2023-08-01 抖音视界有限公司 视频比特流中的嵌套的和非嵌套的sei消息

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080006609A (ko) * 2005-04-13 2008-01-16 노키아 코포레이션 스케일링가능성 정보의 코딩, 저장, 및 시그널링

Also Published As

Publication number Publication date
WO2021234125A1 (en) 2021-11-25
TW202147848A (zh) 2021-12-16
US20230199202A1 (en) 2023-06-22
EP4154535A1 (en) 2023-03-29
TWI801882B (zh) 2023-05-11
AU2021275492A1 (en) 2022-12-15
CN115868166A (zh) 2023-03-28
CA3184462A1 (en) 2021-11-25
KR20230015447A (ko) 2023-01-31

Similar Documents

Publication Publication Date Title
EP3026900B1 (en) Image processing device and method
RU2653299C2 (ru) Способ и устройство для кодирования и декодирования видеоданных
KR101524146B1 (ko) 다운샘플링된 기준 화상을 이용한 인터-뷰 예측
JP7472292B2 (ja) ビデオ符号化およびビデオ復号のための方法、装置、およびコンピュータプログラム製品
KR20170136654A (ko) 효율적인 확장가능한 코딩 개념
JP7345051B2 (ja) サブピクチャ、スライス、およびタイルをサポートするビデオ符号化
JP2017521964A (ja) サブブロックパレットモード
CN113767625A (zh) 基于mpm列表的帧内预测方法及其设备
CN115023954A (zh) 用于控制环路滤波的图像编码装置和方法
JP2023526460A (ja) サブピクチャ関連のビデオコード化の概念
CN115104318A (zh) 基于子画面的图像编码设备和方法
TWI798714B (zh) 時間移動向量預測、層間參考及時間子層指示的視訊寫碼技術
US11985333B2 (en) Indicating which video data units represent a target picture-in-picture region
US20230007210A1 (en) Signaling the Purpose of Preselection
JP2022531117A (ja) ビデオデータをコーディングするための方法、装置、およびコンピュータプログラム
CN114946191A (zh) 基于用于滤波的信息的信令的图像编码设备和方法
CN114375573A (zh) 使用合并候选推导预测样本的图像解码方法及其装置
CN116325723B (zh) 用于视频解码的方法、计算机设备及介质
CN115152214A (zh) 基于画面划分的图像编码装置和方法
CN115136608A (zh) 基于虚拟边界的图像编码装置和方法
CN115152237A (zh) 图像编码装置和方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240520

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240617