JP2021078156A - 効率的なスケーラブル符号化概念 - Google Patents
効率的なスケーラブル符号化概念 Download PDFInfo
- Publication number
- JP2021078156A JP2021078156A JP2021020886A JP2021020886A JP2021078156A JP 2021078156 A JP2021078156 A JP 2021078156A JP 2021020886 A JP2021020886 A JP 2021020886A JP 2021020886 A JP2021020886 A JP 2021020886A JP 2021078156 A JP2021078156 A JP 2021078156A
- Authority
- JP
- Japan
- Prior art keywords
- layer
- image
- spatial
- syntax element
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/187—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/156—Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
またはスライスに再分割される空間セグメントにおけるビデオの画像の並列復号化を可能にする。空間イントラ画像予測のように、インターレイヤ予測は、インターレイヤ予測を介して互いに従属しているレイヤを復号化する際の並列化の度合を制限する。より正確には、空間イントラレイヤ予測は、単一レイヤの画像を復号化する際に並列化の程度を制限するが、課題は、異なる方法で解決される。例えば、空間セグメントとしてタイルを使用するときに、空間イントラレイヤ予測は、タイル境界と交差しないように制限される。WPPサブストリームの場合、その並列処理は、波面を適当にチルト処理することに結果としてなるように、千鳥状に実行される。インターレイヤ予測の場合、従属するレイヤを復号化することは、リファレンスレイヤの同じ位置に配置された部分に依存しているようになる。従って、リファレンスレイヤの同じ位置に配置された部分がすでに処理された/復号化された所で、従属するレイヤの空間セグメントを復号化することは、その時に可及的速やかに開始され得る。「同じ位置に配置された部分」の領域は、「動き補償」を可能にする場合、異なるレイヤとしての異なるビューの場合のインターレイヤ予測の例のように、または、より低いレイヤからより高いレイヤまでアップサンプリングすることのために拡大される。すなわち、ビデオデコーダが、短期シンタックス要素がこれら相互依存するレイヤの画像の空間セグメントへの再分割を定義する、これら相互依存しているレイヤに関する短期シンタックス要素から相互依存するレイヤを並列処理する際に並列化の度合を導出するインターレイヤ予測および並列復号化を使用しているスケーラブル復号化をサポートすることを実行可能にする。しかしながら、着実にそうすることは、扱いにくく、かつ、計算量的に複雑である。それを越えて、そうするときに、ビデオデコーダは適切に、マルチレイヤビデオデータストリームを復号化するために並列に実行される復号化スレッドをスケジュールし得ない。したがって、本発明の第1の態様によれば、マルチレイヤビデオデータストリームの相互依存しているレイヤの並列復号化は、特定の値を仮定するときに、ビデオデコーダに、短期シンタックス要素の時間間隔より大きい所定期間の間、第2のレイヤの画像の空間セグメント間の境界が第1のレイヤの空間セグメントのあらゆる境界と重畳するように、従属するレイヤの画像が再分割されることを保証する長期シンタックス要素構造を導入することにより改善される。この指標によれば、相互依存しているレイヤの画像の空間セグメントへの再分割がこれら相互依存しているレイヤの間で可能な並列化の度合を不注意に減らさないように、ビデオデコーダは、マルチレイヤビデオデータストリームが適切にエンコードされたという事実に依存し得る。むしろ、デコーダは、所定期間の間、異なるレイヤの空間セグメントの境界が示された態様における各々と重畳する制約を利用することによって、前もってビデオデコーダの並列処理スレッド上への空間セグメントの配布をスケジュールし得る。しかし、長期シンタックス要素構造は、この保証をオフすることを可能にし、それにより、他の応用シナリオにおいて、または、ハイエンドビデオデコーダのために、短期シンタックス要素のみに応じて短期ベース上の並列処理スケジューリングを実行するために、すなわち相互依存しているレイヤの空間セグメントの境界の間の相対的な位置に関するいかなる保証も利用しないことを可能にする。オポチュニスティックな復号化の決定のために、長期シンタックス要素も、使用され得る。
によって生じるこの種の相互依存は、相互依存しているレイヤの並列処理において達成可能な並列性の度合に悪影響を及ぼす。本出願のこの第2の態様によれば、シンタックス要素が導入され、それは、ベースレイヤの分割に沿った補間が、ベースレイヤ画像の隣接した分割、ベースレイヤ画像の分割およびエンハンスメントレイヤ画像または例えばベースおよびエンハンスメントレイヤの双方の空間セグメントに依存したそのアップサンプリングされたバージョンのピクセル/ペルの混同を生じないように修正される旨を、デコーダに通知する。この種のシンタックス要素を導入することにより、エンコーダは、2つのモードの間で切替わり得る:補間がベースレイヤ画像の部分を自己充足的なままにするために制限される場合、すなわち、制限がオンされる場合、最大限に達成可能である相互依存しているレイヤの並列復号化の並列性の度合は、ベースレイヤ画像の分割端に沿ってわずかに補間品質を減少させると共に増加する、そして、補間を制限しない場合、並列度は、しかしながら、分割端で補間品質の増加と共に減少する。
ティ配置間のマッピングは、可変に適合され得て、しかしながら管理上のオーバーヘッドが増加する欠点とともに、スケーラビリティ空間の多数が実現されるのを可能にする。タイプインジケータフィールドに第2の状態がある場合、レイヤインジケータフィールドは、複数の部分に分割される、そして、それぞれのNALユニットが関連している動作点は、スケーラビリティ空間内のベクトルの座標としてこれらの部分の値を用いて設置される。この測定によって、レイヤおよびスケーラビリティ配列間のマッピングは、少数のスケーラビリティ空間を実現されるのを可能にするが、ネットワーク実体のための管理オーバーヘッドは減少する。レイヤインジケータフィールドは、アプリケーションシナリオに関係なくどちらの場合においても同じであり得るが、レイヤインジケータフィールドがレイヤのNALユニットを、スケーラビリティ空間を介して通過させる方法は、本出願およびその明細書に適合し得る。適合効果は、タイプインジケータフィールドに対する付加的な費用の必要性を過度に補償する。
ができるマルチレイヤビデオ符号化、すなわちスケーラブルビデオ符号化に関連する。連
続したレイヤについて様々なコーデック/規格を使用できるようにすることで、いくつか
のエンハンスメントレイヤのコーデック/規格を理解し得ないネットワークシンクも、下
位レイヤを処理することが可能になる。
が、存在し得る。空間予測モードも、ブロック39がいずれに同じ画像12、隣接ブロック39の以前に符号化された部分に基づいて予測されるかに従って存在し得る。画像15のブロック41は、画像15が分割される他のブロックのいずれかに対し代表的であるために、図1にも実例として示される。ブロック41のために、予測器18は、ちょうど述べられた予測モード、すなわち時間および空間予測モードをサポートし得る。加えて、予測器18は、ブロック41が下位レイヤの画像12の対応する部分に基づいて予測されるインターレイヤ予測モードを提供し得る。「対応する部分」において「対応する」ことは、空間対応、すなわち、画像12の範囲内の部分は、画像15において予測されるべきボック41としてのシーンの同じ部分を示す、ことを意味する。
うにして得られた残差信号を、結合器56に転送する。結合器56も、次に、予測信号66および残差信号65を結合することにより結合器56で決定される再構成された信号68に基づき符号化パラメータ64を使用して予測信号66を順次形成する予測器60から、予測信号66を受信する。予測は、最後に選択された予測が予測器18であることを反映する、すなわち、同じ予測モードが利用でき、そして、これらのモードは画像12および15の個々のブロックのために選択されて、予測パラメータに従って進められる。図1に関してすでに上記で説明したように、予測器60は、再構成された信号68のフィルタ処理バージョンまたはいくつかの中間バージョンを代わりにまたは加えて使用し得る。最後に再生されデコーダ50の出力70で出力されるべき様々なレイヤの画像は、組合せ信号68のフィルタ処理されてないバージョンまたはその若干フィルタ処理されたバージョンを同様に決定され得る。
制限されないことを意味する。同様に、ブロック41の空間予測モードは、同じタイルだけの以前に符号化されたデータを使用するために制限されるが、時間およびインターレイヤ予測モードは、制限されない。6枚のタイルへの画像15および12の再分割は、それぞれ、単に説明の便宜上選択されただけである。それぞれ、タイルへの再分割は、選択され得て、個々に画像12'、12および15、15'のためのビットストリーム40の範囲内で示され得る。画像12および15当たりのタイルの数は、それぞれ、1、2、3、4、6のいずれかおよびその他でもよく、タイルの分割は、タイルだけの行および列への通常の分割に制限され得る。完全性のために、別々にタイルを符号化する方法は、イントラ予測または空間予測に制限され得るのではなく、タイル境界全体の符号化パラメータのいかなる予測も含み得て、エントロピー符号化におけるコンテキスト選択が同じタイルのデータだけに依存しているために制限され得ることに注意されたい。このように、デコーダは、ちょうど言及された動作を並列に、すなわちタイルを単位に、実行し得る。
に、すなわち同時に、符号化/復号化され、左から右に傾けられた様態で画像を横切って移動する一種の波面108を同時に形成する。
おいて、依然周期的に決定する、しかし、配列上の知識は、並列処理作業負荷割当を予定する際にすでに役立つ。図1の実線84は、例えば、タイル境界84がレイヤ0のタイル境界86に完全に空間的に整列配置される実施例を表す。ちょうど言及された保証は、しかしながら、レイヤ1の分割が、レイヤ0の任意のタイル境界86と空間的に重畳しない、付加的なタイル境界をさらに含むように、レイヤ0のタイル分割よりも微細であるようにレイヤ1のタイル分割を可能にする。いずれにせよ、レイヤ1およびレイヤ0間のタイル登録についての知識は、並列に同時処理される空間セグメントの間で利用可能な作業負荷または処理パワーを割当てる際にデコーダを支援する。長期シンタックス要素構造なしで、デコーダは、より小さい時間間隔で、すなわち画像につき、作業負荷配分を実行しなければならず、それにより、作業負荷配分を実行するためのコンピュータパワーを浪費する。他の態様は、「オポチュニスティック型復号化」である:複数のCPUコアを有するデコーダは、より大きい複雑さの、すなわちより高い空間分解能またはレイヤのより多い個数の、レイヤを復号化しようとするか復号化しようとしないかを決めるレイヤの並列性についての知識を利用し得る。シングルコアの能力を上回るビットストリームは、同じデコーダのすべてのコアを利用することにより復号化可能であり得る。プロファイルおよびレベル表示器が最小限の並列性に関するこの種の表示を含まない場合、この情報は特に有用である。
オデコーダ600はイントラピクチャ空間予測を使用してレイヤ0および1の画像12お
よび15を復号化するように構成されると共に、ビデオデコーダ600は、そのタイル境
界で各タイルに対しイントラピクチャ空間予測を中断させる、タイルへの画像12および
15の再分割は、例えば個々に各画像12および15が関連する、すなわち特定の時間枠
604に属する画像12および15の一対ごとに、時間枠604の短期ベース、例えば時
間間隔を単位として、に関する短期シンタックス要素として、データストリーム40内で
示される。上述の通り、タイルへの画像12および15の再分割は、矩形の規則的な再分
割のみに、すなわちタイルの行および列に、制限され得る。短期シンタックス要素602
は、このようにタイル再分割の行の個数および列の個数を、両方のレイヤの各画像12の
ためにおよび各画像15のために個々に設定する。インバウンドマルチレイヤビデオデー
タストリーム40を復号化する際に、ビデオデコーダ600は、空間予測および潜在的に
時間予測を適用するように構成される。任意には、ビデオデコーダ600は、タイルの各
々を別々にエントロピー復号化する。各タイルを復号化する間に確率適合が使用される場
合、タイルが並列にエントロピー復号化可能であるように、ビデオデコーダ600は、タ
イルごとにエントロピー確率を別々に初期化する。空間予測および任意には時間予測に加
え、レイヤ1の画像15のタイルの復号化に関する限り、ビデオデコーダ600はインタ
ーレイヤ予測をサポートする。上述の通り、インターレイヤ予測は、復号化レイヤ1に含
まれる異なるパラメータに関係し得る:インターレイヤ予測は、レイヤ1の予測残差、例
えば、それは変換係数、復号化レイヤ1において使用される予測モード、復号化レイヤ1
において使用される予測パラメータ、エンハンスメントレイヤ1、画像のサンプル等を予
測し得る。インターレイヤ予測は、レイヤ0の画像12のすでに復号化した部分、−直接
(中央に)同じ位置に配置されたものまたは、同じシーンの、例えば、様々なビューに関
してレイヤ0および1の場合に、インターレイヤ予測を制御している不同性ベクトル予測
パラメータを例えば、経由して直接同じ位置に配置された位置から、わずかに空間的に逸
脱したものに基づき、レイヤ1の画像15のタイルの範囲内で、部分を予測する。
、ビデオデコーダ600は、保証の利点を享受することはないが、画像12および15の
タイルの並列復号化のために短期シンタックス要素602を短期ベースで使用するととも
に、タイムアライメントを合わせた画像12と15とのペアの少なくともいくつかについ
て、ベースレイヤおよびエンハンスメントレイヤのタイルの並列符号化を計画し、予定す
る。この場合、ビデオデコーダ600は、短期ベースで、レイヤ0とレイヤ1の間での並
列復号化における最小のインターレイヤオフセットまたはインターレイヤ空間処理オフセ
ット、すなわちレイヤ0とレイヤ1の間の並列度を決定するが、これは煩雑な処理である
。少なくとも短期シンタックス要素の可能な値のセットのサブセットについて、第1のレ
イヤの空間セグメントのどの境界にも重畳しない第2のレイヤの画像の空間セグメント間
の境界が存在する。しかし、第2のレイヤの画像の空間セグメント間の境界が第1のレイ
ヤの空間セグメントの各境界に重畳する、短期シンタックス要素のための可能な値のセッ
トのさらなるサブセットが存在する。後者のサブセットは、ベースレイヤとエンハンスメ
ントレイヤとの間のタイル境界のアライメントを示す長期シンタックス要素の場合にのみ
使用される。
化を実行しようとする、という事実を使用あるいは利用し得る。その場合、特に電池駆動
装置のために、有益な計算パワーは、時間内、すなわち、実時間内におけるエンハンスメ
ントレイヤ1を復号化することにおける成果または成功が、理論的である場合において節
約される。抑制が第4の態様に関して下記で述べられたレベル表示器に基づいて選択され
得ることは、言及する価値がある。
れらの画像のいくつかの符号化ブロック、例えばLCU、への再分割に関する画像12お
よび15のサブストリームの位置を定義するように選択し得る。サブストリームは、従っ
て、この種の符号化ブロックの一つ以上の行の一まとまりであり得る。タイルを再分割化
している場合のように、時間間隔604は、短期シンタックス要素602が画像12およ
び15の再分割を画像基礎(画像ベース)につき、すなわち画像枠604基礎につき、サ
ブストリームに示すように存在し得る。保証が長期シンタックス要素構造606によって
設けられていない場合、ビデオデコーダ600は、それにもかかわらず、一般の時間枠の
異なるレイヤのサブストリームを並列に復号化しようとし得る、しかし、そうするために
、ビデオデコーダ600は、短期シンタックス要素602を検査することを要する。
な配列を実施することは必要ではない。特に、空間スケーラビリティにおいて、ベースレイヤにおいてよりエンハンスメントレイヤにおいてより多くのタイルを許容することは、有用かも知れない。例えば、2つの空間スケーラビリティの要素において、4倍の画素数が、対応するベースレイヤ画像エリアに比べエンハンスメントレイヤ画像エリアにおいて含まれる。それで、ベースレイヤタイルごとに、エンハンスメントレイヤにおける4つのタイルを許容することは、有用であるかもしれない。空間スケーラビリティを有する整列配置されたタイル境界のための実施例を示す図7を参照されたい。すべての垂直境界は、ベースおよびエンハンスメントレイヤにおいて整列配置される。エンハンスレイヤにおける付加的なタイル(水平境界)は、ベースレイヤタイル分割におけるものとしてエンハンスメントレイヤタイルにつき画素の同数を使用し並列化を可能にするのに使用される。
いtile_boundaries_aligned_flagは、対応するベースレイヤおよび所与のエンハンスメントレイヤの間のタイル構成に関して制限が存在しないことを示す。
囲内で、図11において示される。分割622は、例えば、下記で更に詳細に概説されるように、画像12および15の空間セグメントの境界の空間オーバレイの論理積または論理和の組合せに対応し得るまたはエンハンスメントレイヤ画像15の空間セグメントによって定義された分割と空間的に一致し得る。いずれにせよ、シンタックス要素616に応じて、デコーダ610は、分割622にかかわりなく、または、分割622を考慮して補間620を実行する。分割を考慮するときに、アップサンプリングされた部分618の範囲内のすべてのサンプルが、単に開始するだけであるか、または従属するだけであるか、または影響されるだけであるように、デコーダ610は、補間620を実行する一方、分割の他の部分から独立している。例えば、分割622が、画像12および15の空間セグメントの境界のローカル論理積の組合せまたはそれらのローカル論理和の組合せである場合、これは、補間部分618のすべてのサンプルが単にベースレイヤ画像12の1つの分割だけから生じることを意味する。しかしながら、シンタックス要素616が、デコーダ610に分割622に反応しないように指示する場合、補間部分618の範囲内の様々なサンプルが分割622の隣接した分割から生じることは、起こり得る。
を無視するか否かのみならず分割622を選択する様々な方法を区別させることが、可能でもあって、以下で更に詳細に概説されもする。例えば、図9参照。ここで、タイルは空間セグメントとして手本として使用された。シンタックス要素616がデコーダ610に分割622のために別々に補間620を実行する旨を示す場合、それらがエンハンスメントレイヤ画像15のタイルへのより微細な再分割と一致した時から、デコーダ610は、例えば、分割622の境界としてベースレイヤ画像12の境界を使用し得る。従って、エンハンスメントレイヤ画像15の最上行の第2のタイルの復号化を開始するために、「補間分離」がベースレイヤ画像12の最上行の最初の2つのタイルの再構成された試料のいかなる混成も禁止するので、デコーダ610は、ベースレイヤ画像12の最上行における第2のタイルの復号化の終了を待つ必要はない。エンハンスメントレイヤ画像15のタイルへの完全な再分割を採用する場合、分割622を決定するために、補間分離は、図9の点線でも実行される、そして、デコーダ610は、以前でさえ、すなわちベースレイヤ画像12の第1のタイルのそれぞれの同じ位置に配置されたサブ部分を復号化するのを達成するとすぐに、エンハンスメントレイヤ画像15の左上タイルを復号化するのを開始し得る。この点に関し、タイルを復号化する際でさえ、デコーダ610は、例えば、行方向態様のそれぞれのタイルの左上角からそれぞれのタイルの右下角まで進行する例えば若干のラスタースキャン順序を含み得る若干の復号化順序を使用し得る点に注意されたい。
いる。さらに、また、本出願の実施例によるデコーダが、図4および図10の両方に関して上記に提供された説明および機能と一致し得ることに注意されたい。この点に関し、図4に関して上記を提供した説明が、短期シンタックス要素および画像12および15の空間セグメントの位置の信号伝送は、図10から13までに関して記述された実施例に等しく当てはまるとみなされることに注意されたい。最後に、図10のデコーダがレイヤ0および1の画像を復号化する画像デコーダである場合、第2の態様も有利であろうことに注意されたい。時間要素は、任意である。
:2に等しいindependent_tile_upsampling_idcは、アップサンプリングフィルタがいかなるエンハンスメントレイヤタイル境界と交差しないように制限する。破線の単純な点線400を参照されたい。independent_tile_upsampling_idcが1に等しい場合、制限は、ベースレイヤタイル境界と整合されるエンハンスメントレイヤタイル境界だけに適用される。二点鎖線402を参照されたい。0に等しいindependent_tile_upsampling_idcは、この制限を意味しない。
構造606の存在に関する機能は、ビデオデコーダ640にとって任意である。しかしながら、ビデオデコーダ600に関して上記に述べられる説明は、ビデオデコーダ640に等しく適用される。すなわち、ビデオデコーダ640は、マルチレイヤビデオデータストリーム40を復号化し得て、シーンは、第1のレイヤ、レイヤ0、から第2のレイヤ、レイヤ1、までインターレイヤ予測を使用するレイヤの階層において符号化される。ビデオデコーダ40は、空間セグメントにおけるマルチレイヤビデオデータストリームの並列復号化をサポートし、レイヤの画像は、第2のレイヤの画像の空間セグメントの横断と関連して第1のレイヤの画像の空間セグメントの横断との間にインターレイヤオフセットを有する時間重畳態様における空間セグメントを順次横断することにより分割される。軽微な注釈として、空間セグメントがタイル、サブストリームまたはスライスであり得ることが表され、しかし、ちょうど言及されたセグメントユニットの混合物さえ実現可能である。スライス概念をタイルおよび/またはサブストリーム概念と結合することにおいて、「空間セグメント」が実際に何であるかという定義は、異なり得る。
42に基づいて、インターレイヤオフセットの解釈を表す。
PP処理のために、上記の通り、画像12のサブストリームの中で定義される復号化順序が存在し、そして、画像15のサブストリームは、それぞれ復号化順序648および650が、上端から下端まで進行する。図17aの場合と同様に、デコーダ640は、長期シンタックス要素構造642から画像15の最初のサブストリームを復号化開始すべき前に進行するサブストリームの数を決定するように構成される。この場合、ベースレイヤ画像12の第1のサブストリームを完全に復号化することは、必要な基礎をエンハンスメントレイヤ画像15の第1のサブストリームのいかなるインターレイヤ予測に提供するために十分であるので、長期シンタックス要素構造642は、1であるべきインターレイヤオフセットを示す。
15の第1の空間セグメントを始める前にすでに復号化されるべきベースレイヤ画像12
の空間セグメントの数に関連するインターレイヤオフセットについて長期シンタックス要
素の構造を基礎としてデコーダに知らせることにより、図16から17cまでに対する説
明は、長期シンタックス要素構造642の使用が、エンコーダが時間整列配置された画像
12および15も任意に並列復号化することを予定する際のデコーダをサポートするのを
助けることを明らかにした。ビデオデコーダ640が、短期シンタックス要素602の検
査/評価に基づいてさえ長期シンタックス要素642により示されたインターレイヤオフ
セットを決定し得て、かつ、潜在的オプションに関する更なるシンタックス要素は、ベー
スレイヤからエンハンスメントレイヤまでインターレイヤ予測におけるまさに概説された
ぶれをオンあるいはオフに切り替えるこれらのオプションとともにインターレイヤ予測に
関連する点に注意すべきである。しかしながら、ビデオデコーダ640は、長期シンタッ
クス要素構造642によって設けられているので、同じ情報を導出するためにシンタック
ス要素の多数を検査しなければならない、そして、ビデオデコーダ640は、単に長い所
定期間608よりむしろ前もって短期ベース上の同じ情報を導出し得るのみである。
が、以下に記載される。
タイルまたはスライスのような他の分割技術を有する並列処理は、画像の空間セグメント、すなわちタイルまたはスライス、への分割に基づく復号化遅延を示すビットストリームの範囲内で、ヒントから利益になり得る。ベースレイヤ(例えば再構成された画像データ)の情報は、エンハンスメントレイヤ復号化プロセスのために必要であり得る。
ない)、以下の状況のうちのちょうど1つが真であることは、ビットストリーム一致の要件である:
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、0に等しい、そして、entropy_coding_sync_enabled_flagは、0(すなわち、タイルもWPPも、ビデオシーケンスにおいて使用されない)に等しい、そして、ビットストリーム順序におけるベースレイヤの第1のmin_spatial_segment_delayスライスが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第1のスライスの復号化プロセスのためのすべてのベースレイヤ資源が、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、1に等しい、そして、entropy_coding_sync_enabled_flagは、0(すなわち、タイルが、ビデオシーケンスにおいて使用される)に等しい、そして、同じ画像エリアを覆う第1のmin_spatial_segment_delayタイルが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第1のタイルの復号化プロセスのためのすべてのベースレイヤ資源が、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、0に等しい、そして、entropy_coding_sync_enabled_flagは、1(すなわち、WPPが、符号化ビデオシーケンスにおいて使用される)に等しい、そして、ベースレイヤの第1のmin_spatial_segment_delay CTB行が完了されるときに、現在のレイヤの第1のCTB行の復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの間で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、0に等しく、かつ、entropy_coding_sync_enabled_flagは、0(すなわち、タイルもWPPも、ビデオシーケンスにおいて使用されない)に等しい、そして、ビットストリーム順序におけるベースレイヤの第1のmin_spatial_segment_delayスライスが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第1のスライスの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの間で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、1に等しく、entropy_coding_sync_enabled_flagは、0(すなわち、タイルが、ビデオシーケンスにおいて使用される)に等しい、そして、同じ画像エリアを覆う第1のmin_spati
al_segment_delayタイルが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第1のタイルの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、0に等しく、entropy_coding_sync_enabled_flagは、1(すなわち、WPPが、符号化ビデオシーケンスにおいて使用される)に等しい、そして、ベースレイヤの第1のmin_spatial_segment_delay CTB行が完了されるときに、現在のレイヤにおける第1のCTB行の復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
れ得ない。より正確に言えば、そして、図32の右側で示せば、1つの画像の範囲内の連続的なスライス94aおよび94bは、符号化ブロック、すなわちブロック90のうちの1つの再分割のリーフブロック、のようなより小さいブロックの境界で、互いに接し得る。
された部分、例えば現行ブロック90、の主に左に、そして、主に上端に位置する。予測の混乱およびタイル境界全体のエントロピーコンテキスト派生のため、1つの画像のタイルは、並列に処理され得る。1つの画像のタイルの符号化/復号化は、並行して開始さえし得る。同上がタイル境界を横切り得る場合、制限は、前述のインループフィルタリングから生じる。次に、WPPサブストリームの符号化/復号化を始めることは、上端から下端までスタガー態様で実行される。連続的なWPPサブストリーム間のイントラピクチャ遅延は、ブロック90、2つのブロック90において測定される。
している。両方のレイヤの2つの時間整列配置された画像12および15は、図35において手本として示される。ベースレイヤ0の画像12は、第1のブロック722の配列に再分割され、そして、エンハンスメントレイヤ1の画像は、第2のブロック724の配列に再分割される。ラスタースキャン復号化順序726は、ブロック722の中で定義され、そして、同様に、ラスタースキャン復号化順序728は、ブロック724の中で定義される。
クを結果として生じることに伴い、インターレイヤ予測が、−ビデオデータストリーム40中に示される。
)を含み、ctp_delay_enabled_flag=0およびmin_spatial_segment_delay≠0は、サブセット736のケースに対応し、min_spatial_segment_delay=0は、第2のサブセット738に対応し、かつ、ctp_delay_enabled_flag=1およびmin_spatial_segment_delay≠0は、第3のサブセット740に対応する。
れたいずれかのインターレイヤオフセットが、エンハンスメントレイヤ画像15の第1の
ブロックまたは空間セグメントの復号化開始に関するインターレイヤオフセットなだけで
はなく、これに従うと、画像12と15をそれぞれ、コンフリクトなしで並列復号化する
ことができる、連続的なインターレイヤオフセットであると解釈するように構成すること
ができることが示されている。図38に示すように、カウンタ732は、ベースレイヤ画
像12のすでに復号化されたブロック722の数を依然カウントしているが、追加のカウ
ンタ744も同様に、復号化順序728に沿ってエンハンスメントレイヤ画像15の既に
復号化されたブロック724を同様にカウントしており、ここで減算器746は、両方の
カウント、すなわちsおよびt−1から差分を形成する、すなわちs−t+1を計算する
。この差分値は、コンパレータ734によって、シンタックス要素構造730から導出さ
れたインターレイヤオフセット値と比較され、両方の値、すなわち導出されたインターレ
イヤオフセットおよびカウントの差分値に、例えば差分値が等しいまたは導出されたイン
ターレイヤオフセットを上回っている等の所定の関係があれば直ちに、エンハンスメント
レイヤブロック724の中の復号化順序728のブロックtの復号化が開始される。
クス要素構造730は、ビデオエンコーダによってビットストリームに挿入されて、ベー
スレイヤ画像およびエンハンスメントレイヤ画像の並列復号化をたがいに対してどのよう
に制御するかについてデコーダに明確なヒントを提供するようにすることができる。シン
タックス要素構造により明確にシグナリングされるインターレイヤオフセットは、活性化
あるいは不活性化することができる。活性化された場合、表示は、CTB等のブロック単
位、またはより正確なシグナリングによって、かかるブロック単位や空間セグメント単位
のうちのシグナリングされたものであり得る。例えば、各画像12/15の左上角から右
下角まで1行ごとに上から下に行方向に進むベースレイヤブロックおよびエンハンスメン
トレイヤブロックの中でのラスタースキャン順序の使用により、明示的にシグナリングさ
れたインターレイヤオフセットは、単にエンハンスメントレイヤ画像15の第1のブロッ
クの復号化に着手/開始するための「トリガー」として、またはエンハンスメントレイヤ
画像15の各ブロックの復号化のためのトリガーを決定するための「トリガー」として解
釈することができる。第6の態様に関して行われた記載は、少なくとも空間セグメントと
してのタイルの記載に関連する限り、第3の様態の記載および実施例に転嫁することがで
き、シグナリングされたインターレイヤオフセットの解釈と準拠チェックが関連し、図3
6および38の実施例を使用することができる、すなわち、ラスタースキャンタイル復号
化順序に沿ってのベースレイヤ画像およびエンハンスメントレイヤ画像内の復号化された
タイルの横断は、図36および38の記載に対応して制御することができる。
スへのオフセットとして解釈されるべきである。
・CtbSizeYA、PicWidthInCtbsYAおよびctbAddrRsAは、CtbSizeYおよびベースレイヤAのPicWidthInCtbsYおよびラスタースキャン順序におけるベースレイヤAにおけるCtbのCtb Addressであり、CtbSizeYB、PicWidthInCtbsYBおよびctbAddrRsBは、CtbSizeYおよび従属レイヤ/ビューBのPicWidthInCtbs
Yおよびラスタースキャン順序における従属レイヤBのCtbのCtb Addressであり、かつ、CtbScalingFactorBA、CtbRowBA(ctbAddrRsB)およびCtbColBA(ctbAddrRs)は次のように定義される。
CtbScalingFactorBA=(PicWidthInCtbsYA/PicW
idthInCtbsYB)
CtbRowBA(ctbAddrRs)=
Ceil((Floor(ctbAddrRs/PicWidthInCtbsYB)+
1)*CtbScalingFactorBA)−1
CtbColBA(ctbAddrRs)=
Ceil(((ctbAddrRs%PicWidthInCtbsYB)+1)*Ct
bScalingFactorBA)−1
現在のエンハンスメントレイヤ/ビューBのctbAddrRsBを有するCTBを復
号化するとき、PicWidthInCtbsYA*CtbRowBA(ctbAddrRsB)+CtbColBA(ctbAddrRsB)+min_spatial_segment_delayに等しいctbAddrRsAを有するベースレイヤCTBが完全に復号
化されるときに、すべての必要なベースレイヤ資源が、利用し得る。
さもなければ(min_spatial_segment_delayは、0に等しくなく、かつ、ctb_based_delay_enabledは、0に等しい)、以下の状況のうちの1つが正確に真であることは、ビットストリーム一致の要件である:
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、0に等しい、そして、entropy_coding_sync_enabled_flagは、0に等しい(すなわち、タイルもWPPも、ビデオシーケンスにおいて使用されない)、そして、ビットストリーム順序におけるベースレイヤの第1のmin_spatial_segment_delayスライスが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第1のスライスの復号化プロセスのための全てのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、1に等しい、そして、entropy_coding_sync_enabled_flagは、0(すなわち、タイルが、ビデオシーケンスにおいて使用される)に等しい、そして、同じ画像エリアを覆う第1のmin_spatial_segment_delayタイルが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第1のタイルの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、0に等しく、かつ、entropy_coding_sync_enabled_flagは、1に等しい(すなわち、WPPが、符号化ビデオシーケンスにおいて使用される)、そして、ベースレイヤの第1のmin_spatial_segment_delay CTB行が完了されるときに、現在のレイヤにおける第1のCTB行の復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
min_spatial_segment_delayの値に応じて、以下が、適用される:
min_spatial_segment_delayが0に等しい場合、レイヤの復号化間の最小遅延に関する制限は、示されない。
さもなければ(min_spatial_segment_delayは、0に等しくない)、以下の条件のちょうど1つが真であることは、ビットストリーム一致の要件である:
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、0に等しい、そして、entropy_coding_sync_enabled_flagは、0(すなわち、タイルもWPPも、ビデオシーケンスにおいて使用されない)に等しい、そして、現在のレイヤにおけるスライスAに関して同じ画像エリアの少なくとも一部を含むビットストリーム順序における最後のスライスセグメントBの後でベースレイヤにおけるビットストリーム順序における(m
in_spatial_segment_delay−1)スライスに続く第1のスライスセグメントCが、完全に復号化されるときに、ビットストリーム順序における現在のレイヤの任意のスライスセグメントAの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンス内で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、1に等しい、そして、entropy_coding_sync_enabled_flagは、0(すなわち、タイルが、ビデオシーケンスにおいて使用される)に等しい、そして、タイルAに関して同じ画像エリアの少なくとも一部を含むビットストリーム順序における最後のタイルBの後でビットストリーム順序における(min_spatial_segment_delay−1)タイルに続く第1のタイルCが完全に復号化されたときに、ビットストリーム順序における現在のレイヤの任意のタイルAの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、tiles_enabled_flagは、0に等しい、そして、entropy_coding_sync_enabled_flagは、1に等しい(すなわち、WPPが、符号化ビデオシーケンスにおいて使用される)、そして、ビットストリーム順序におけるエンハンスメントレイヤのCTB行Aに関する同じ画像エリアの少なくとも一部を覆うベースレイヤの最後のCTB行Bの後の(min_spatial_segment_delay−1)CTB行に続く第1のCTB行Cが完全に復号化されたときに、現在のレイヤにおける任意のCTB行Aの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
上がCTBベース表示を示す場合、更なるシンタックス要素は、他の次元において、ちょうど言及されたトリガとして作用しているベースレイヤ画像のCTBの位置を示すデータストリームにおいて送信される。
1に等しいctu_based_offset_enabled_flag[i][j]は、CTUsを単位にして、第iのレイヤの第jのダイレクトリファレンスレイヤの各画像において、空間領域が第iのレイヤのいかなる画像の復号化のためのインターレイヤ予測のためにも使われないことが、min_spatial_segment_offset_plus1[i][j]およびmin_horizontal_ctu_offset_plus1[i][j]によってともに示されることを記述している。0に等しいctu_based_offset_enabled_flag[i][j]は、スライス部分、タイルまたはCTU行を単位にして、第iのレイヤの第jのダイレクトリファレンスレイヤの各画像において、第iのレイヤのいかなる画像の復号化のためのインターレイヤ予測のために使用されないことが、min_spatial_segment_offset_plus1[i]のみによって示されることを記述している。存在しないときに、ctu_based_offset_enabled_flag[i]の値は、0に等しいと推測される。
ctu_based_offset_enabled_flag[i][j]が1に等しいときに、min_horizontal_ctu_offset_plus1[i][j]は、下記で特定されるように、空間領域が、第iのレイヤの第jのダイレクトリファレンスレイヤの各画像において、min_spatial_segment_offset_plus1[i][j]と共に、第iのレイヤのいかなる画像の復号化のためのインターレイヤ予測のために使用されないことを示す。min_horizontal_ctu_offset_plus1[i][j]の値は、0からrefPicWidthInCtbsY[i][j]までの範囲を含んでいる。
変数curPicWidthInSamplesL[i],curPicHeight
InSamplesL[i],curCtbLog2SizeY[i],curPicW
idthInCtbsY[i]およびcurPicHeightInCtbsY[i]は、i番目のレイヤのPicWidthInSamplesL、PicHeightInS
amplesL、CtbLog2SizeY、PicWidthInCtbsYおよびP
icHeightInCtbsYにそれぞれ等しくセットされる。
変数refPicWidthInSamplesL[i][j],refPicHei
ghtInSamplesL[i][j],refCtbLog2SizeY[i][j
],refPicWidthInCtbsY[i][j]およびrefPicHeightInCtbsY[i][j]は、第iのレイヤの第jのダイレクトリファレンスレイヤのPicWidthInSamplesL、PicHeightInSamplesL、
CtbLog2SizeY、PicWidthInCtbsYおよびPicHeightInCtbsYにそれぞれ等しくセットされる。
変数curScaledRefLayerLeftOffset[i][j],curScaledRefLayerTopOffset[i][j],curScaledRefLayerRightOffset[i][j]およびcurScaledRefLayerBottomOffset[i][j]は、第iのレイヤの第jのダイレクトリファレンスレイヤのscaled_ref_layer_left_offset[j]<<1,scaled_ref_layer_top_offset[j]<<1,scaled_ref_layer_right_offset[j]<<1,scaled_ref_layer_bottom_offset[j]<<1にそれぞれ等しく設定される。
第iのレイヤの第jのダイレクトリファレンスレイヤの画像において、第iのレイヤの画像におけるctbAddrに等しいラスタースキャンアドレスを有するCTUの配置されたCTUのラスタースキャンアドレスを意味する変数colCtbAddr[i][j]は、以下の通りに導出される:
第iのレイヤの画像における左上輝度 輝度サンプルと関連してctbAddrに等しいラスタースキャンアドレスを有するCTUの左上輝度サンプルの位置を特定している変数(xP、yP)は、以下の通りに導出される:
xP=(ctbAddr%curPicWidthInCtbsY[i])<<curCtbLog2SizeY
yP=(ctbAddr/curPicWidthInCtbsY[i])<<curCtbLog2SizeY
−変数scaleFactorX[i][j]およびscaleFactorY[i][j]は、以下の通りに導出される:
curScaledRefLayerPicWidthInSamplesL[i][
j]=curPicWidthInSamplesL[i]−curScaledRef
LayerLeftOffset[i][j]−curScaledRefLayerRightOffset[i][j]
curScaledRefLayerPicHeightInSamplesL[i][j]=curPicHeightInSamplesL[i]−curScaledRe
fLayerTopOffset[i][j]−curScaledRefLayerBottomOffset[i][j]
scaleFactorX[i][j]=((refPicWidthInSamplesL[i][j]<<16)+(curScaledRefLayerPicWidt
hInSamplesL[i][j]>>1))/curScaledRefLayer
PicWidthInSamplesL[i][j]
scaleFactorY[i][j]=((refPicHeightInSamplesL[i][j]<<16)+(curScaledRefLayerPicHei
ghtInSamplesL>>1))/curScaledRefLayerPicH
eightInSamplesL[i][j]
xCol[i][j]=Clip3(0,(refPicWidthInSamplesL[i][j]−1),((xP−curScaledRefLayerLeftOf
fset[i][j])*scaleFactorX[i][j]+(1<<15))>>16))
yCol[i][j]=Clip3(0,(refPicHeightInSamplesL[i][j]−1),((yP−curScaledRefLayerTopOf
fset[i][j])*scaleFactorY[i][j]+(1<<15))>>16))
−変数colCtbAddr[i][j]は、以下の通りに導出される:
xColCtb[i][j]=xCol[i][j]>>refCtbLog2SizeY[i][j]
yColCtb[i][j]=yCol[i][j]>>refCtbLog2SizeY[i][j]
colCtbAddr[i][j]=xColCtb[i][j]+(yColCtb[i][j]*refPicWidthInCtbsY[i][j])
min_spatial_segment_offset_plus1[i][j]が0より大きいとき、以下が適用されることは、ビットストリーム一致の要件である:
−ctu_based_offset_enabled_flag[i][j]が0に等しいとき、以下のちょうど1つが適用される:
・第iのレイヤの第jのダイレクトリファレンスレイヤの画像によって関連される各PPSにおいて、tiles_enabled_flagは、0に等しい、そして、entropy_coding_sync_enabled_flagは、0に等しい、そして、以下が適用される:
・スライスセグメントAを、第iのレイヤの画像の任意のスライスセグメントとし、ctbAddrをスライスセグメントAにおける最後のCTUのラスタースキャンアドレスとする。スライスセグメントBを、スライスセグメントAとして同じアクセスユニットに属し、第iのレイヤの第jのダイレクトリファレンスレイヤに属し、かつラスタースキャンアドレスcolCtbAddr[i][j]を有するCTUを含むスライスセグメントとする。スライスセグメントCを、スライスセグメントBとして同じ画像内に存在し、復号化順序におけるスライスセグメントBに続き、そして、スライスセグメントBおよびそのスライスセグメントの間に復号化順序におけるmin_spatial_segment_offset_plus1[i]−1スライスセグメントが存在するスライスセグメントとする。スライスセグメントCが存在するとき、サンプルまたはスライスセグメントCの値または復号化順序におけるCに続く同じ画像のいかなるスライスセグメントが、スライスセグメントAの範囲内でいかなるサンプルの復号化プロセスにおけるインターレイヤ予測のためにも使用されないように、スライスセグメントAのシンタックス要素は、
拘束される。
・第iのレイヤの第jのダイレクトリファレンスレイヤにおける画像によって参照される各PPSにおいて、tiles_enabled_flagは、1に等しく、かつ、entropy_coding_sync_enabled_flagは、0に等しい、そして、以下が適用される:
・タイルAを、第iのレイヤの任意の画像picAにおける任意のタイルであるとし、ctbAddrをタイルAにおける最後のCTUのラスタースキャンアドレスであるとする。タイルBを、picAとして同じアクセスユニットに属しかつ第iのレイヤの第jのダイレクトリファレンスレイヤに属しかつラスタースキャンアドレスcolCtbAddr[i][j]を有するCTUを含む画像picBに存在するものとする。タイルCを、picBにおいても存在し、復号化順序におけるタイルBに続くタイルであるものとする、そして、タイルBおよびそのタイルの間に、復号化順序におけるmin_spatial_segment_offset_plus1[i]が存在する。スライスセグメントCが存在するとき、サンプルまたはタイルCにおけるシンタックス要素値または復号化順序におけるCに続く同じ画像のいかなるタイルも、タイルAの範囲内でいかなるサンプルの復号化プロセスにおけるインターレイヤ予測のためにも使用されないように、タイルAのシンタックス要素は、拘束される。
・第iのレイヤの第jのダイレクトリファレンスレイヤにおける画像によって参照される各PPSにおいて、tiles_enabled_flagは、0に等しく、かつ、entropy_coding_sync_enabled_flagは、1に等しい、そして、以下が適用される:
・CTU行Aを、第iのレイヤのいかなる画像picAにおけるいかなるCTU行とし、ctbAddrをCTU行Aにおける最後のCTUのラスタースキャンアドレスとする。CTU行Bを、picAとして同じアクセスユニットに属しかつ第iのレイヤの第jのダイレクトリファレンスレイヤに属しかつラスタースキャンアドレスcolCtbAddr[i][j]を有するCTUを含む画像picBに存在するものとする。CTU行Cを、picBにおいても存在し、復号化順序におけるCTU行Bに続くCTU行であるものとする、そして、CTU行BおよびそのCTU行の間に、復号化順序におけるmin_spatial_segment_offset_plus1[i]−1CTU行が存在する。CTU行Cが存在するとき、サンプルまたはCTU行Cにおけるシンタックス要素値またはCに続く同じ画像の行も、CTU行Aの範囲内でいかなるサンプルの復号化プロセスにおけるインターレイヤ予測のためにも使用されないように、CTU行CにおけるCTU行Aのシンタックス要素は、拘束される。
−さもなければ(ctu_based_offset_enabled_flag[i][j]は、1に等しい)、以下が、適用される:
・変数refCtbAddr[i][j]は、以下の通りに導出される:
xOffset[i][j]=((xColCtb[i][j]+minHorizontalCtbOffset[i][j])>(refPicWidthInCtbsY[i][j]−1))?
(refPicWidthInCtbsY[i][j]−1―xColCtb[i][j]):
(minHorizontalCtbOffset[i][j])
yOffset[i][j]=(min_spatial_segment_offset_plus1[i][j]−1)*refPicWidthInCtbsY[i][j]
refCtbAddr[i][j]=colCtbAddr[i][j]+xOffset[i][j]+yOffset[i][j]
・CTUAを、第iのレイヤのいかなる画像picAにおける任意のCTUとし、ctbAddrをCTUAのラスタースキャンアドレスctbAddrであるとする。CTUBは、picAとして同じアクセスユニットに属しかつi番目のレイヤのj番目のダイ
レクトリファレンスレイヤに属しかつrefCtbAddr[i][j]より大きいラスタースキャンアドレスを有する画像において存在するCTUとする。CTUBが存在するとき、サンプルまたはCTU行Bにおけるシンタックス要素値が、CTUAの範囲内でいかなるサンプルの復号化プロセスにおけるインターレイヤ予測のためにも使用されないように、CTUAのシンタックス要素は、拘束される。
・スケーラビリティ次元識別子に関するNALユニットヘッダにおけるレイヤ識別子の値の解釈は、間接指定またはルックアップを必要としない。
・マッピング方法のために必要なVPS拡張シンタックス要素は、送信される必要はなく、それは、スケーラビリティ信号伝送のためのVSP拡張ビットの有意部分を構成する。
・中間のユニットは、通過するビデオビットストリームごとにマッピングテーブルを格納する必要はない。
リームの転送を含み得る。
リティ空間の異なる動作点において符号化されるように、シーンは、レイヤにおけるマル
チレイヤビデオデータストリームに符号化され、そこにおいて、マルチレイヤビデオデー
タストリームは、第1のNALユニットを含み、そして、それぞれは、レイヤの1つに関
連し、かつ、第2のNALユニットは、第1のNALユニットマルチレイヤ内に組込まれ
て、マルチレイヤビデオデータストリームに関する一般の情報を示す。換言すれば、第1
のNALユニット684は、マルチレイヤビデオデータストリーム682のレイヤのいず
れかに対応する「画像」とともに、ビデオ画像の一つ以上のスライスを運送し得る。前記
実施例において、説明を簡単にするために、レイヤ0およびレイヤ1の単に2つのレイヤ
だけが述べられる。当然、レイヤの数は2より大きくてもよく、そして、レイヤが以前の
レイヤのいずれかに貢献する情報の種類でさえ、レイヤごとに異なり得る。第1のNAL
ユニット684に加えて、NALユニット686は、NALユニット684に組込まれて
いることを示す、しかし、それらの伝送は、第1のNALユニット684と比較して別々
のチャネルを経由して実行され得る。第2のNALユニットは、以下で更に詳細に述べら
れる方法のマルチレイヤビデオデータストリームに関する一般的な情報を示する。
ために、図24は、例えば、空間スケーラビリティおよびSNRスケーラビリティに対応する2つのスケーラビリティ次元700および702により渡される二次元スケーラビリティ空間698を示す。レイヤおよび空間698によるその拡張の典型的なツリーは、図24に示される。図24も、セット694の可能なレイヤの全てがデータストリーム682に存在し得るというわけではないことを示す。図24の典型的なケースにおいて、例えば、単に5つのレイヤだけが、実際にデータストリーム682において使用される。
。それによって、26=64の可能な状態またはセット694の可能なレイヤを区別する
。それは、第2のNALユニット686を経由して下記でより詳細に記載されている方法
で調整され得るスケーラビリティ空間698における動作点上へのセット694のこれら
可能な値またはレイヤからのマッピングである。マッピングは、参照符号704を使用し
ている図24において示される。「動作点」は、スケーラビリティ空間698の範囲内で
セット694の中で少なくとも実際に存在するレイヤの位置を意味する。例えば、スケー
ラビリティ空間698の起源は、ベースレイヤまたはツリールートと関係し得る、その一
方で、スケーラビリティ空間698の軸700および702のいずれかに沿った各分岐は
、1の固定長を有し得る。スケーラビリティ空間698の動作点を示しているベクトルは
、このように整数値を有する座標を有し得る。
固定ビット長のフィールドとして、レイヤインジケータフィールド690を示す。いずれ
にせよ、フィールド690の長さは、タイプインジケータフィールド696の値から独立
している。しかしながら、タイプインジケータフィールドが第1の状態を有する場合、レ
イヤインジケータフィールド690は、全体として扱われる、すなわちそのnビットの全
てが、その可能な値を区別するためにすべて共通に扱われる。タイプインジケータフィー
ルド696が、第1の状態を仮定する場合、好ましくは、n−ビット整数は、ネットワー
ク実体680によってレイヤインジケータフィールド690より導出される。第1の状態
を仮定しているタイプインジケータフィールド696の場合、ネットワーク実体680は
、第2のNALユニット686の範囲内で伝達されるマッピング情報を用いて操作上の位
置上へm−ビットフィールド690の可能な値のマッピング704を実行する、そして、
マッピング情報は、参照符号708を使用して図25において示される。図25に示され
るように、マッピング情報708は、例えば、それぞれの可能な値の関連する動作点を示
しているベクトルをレイヤインジケータフィールド690の各実際に使用される可能な値
に割当てているテーブルを含む。すなわち、第1の状態を仮定しているタイプインジケー
タフィールド696の場合には、ネットワーク実体680は、第2のNALユニット68
6からマッピング情報708を導出し得て、空間698におけるそれぞれの/関連する動
作点を決めるために、関連するベクトルを検索するために各レイヤインジケータフィール
ド690に対しマッピング情報またはテーブル708への検索を実行し得る。マッピング
情報708におけるあり得る値に関連するベクトルの次元の数pは、デフォルトでセット
され得るかまたはデータストリーム、例えば第2のNALユニット686、の中で示され
得る。後ほど、以下の情報がマッピング情報708について伝達するために示され得るこ
とが示されるであろう:vps_max_layers_minus1は、M−ビットフ
ィールド690の実際に使用される可能な値の数Mを決定し得る。num_dimens
ions_minus1は、次元の数を決定し得る。後の2つの変数は、シンタックス要
素scalability_maskを使用して送信され得る。テーブル自体は、それか
ら一方では、一対の可能な値、すなわち、layer_id_in_nuhを介して、お
よびp次元ベクトル、すなわち、dimension_id[i][j]により示され得
る。マッピング704は、それから、p次元ベクトル、すなわち、レイヤインジケータフ
ィールド690を有するNALユニットのレイヤと関連した空間698の間の動作点を示
しているこのそれぞれのベクトル710上へマッピング情報708を介してマップされる
もの、に通じる。
ッピング704は異なって実行される。特に、マッピングは、レイヤインジケータフィー
ルド690を複数の部分に分割することによって、すなわちフィールド690のm−ビッ
トの数列をビットの連続した部分列の数nに分割することによって、その場合実行される
。このように得られた各部分が、n次元ベクトル712の座標x1…xnとして使用され、
そして、それはレイヤインジケータフィールド690を構成するNALユニットのレイヤ
と関連したスケーラビリティ空間698内の動作点を次々に示している。例えば、レイヤ
インジケータフィールド690のm−ビットは、フィールド690の最初の(最も重要な
)m1ビットからの第1の部分、フィールド690の次のm2(次により重要な)ビットか
らの第2の部分、m1+…+mn=mを満たす第nの部分までその他を形成することにより
、n部分に分割される。各部分のThビットは、整数値表現と直接みなされ得る。
、mnは、シンタックス要素dimension_id_len_minus1を介して
も手本として示される、しかし、また、再分割は、明確な伝送のないデフォルトによって達成され得る。
RTP、例えばウェブ会議、に基づく大量の会話サービスシナリオにおいて、複数の関係者間の転送されたビデオは、それぞれのビデオビットストリームのパラメータセットを知っていなければならない多点制御ユニット(MCU)において適している。各関係者は、サムネイルビットストリームおよび2つのビットストリームに話者の強化された空間分解能、例えば720pおよび4K、を提供する。MCUは、どの関係者にどのストリームを与えるべきかという決定をする。スケーラビリティパラメータの簡単な分析は、従って、MCUに対する重要な救済である。分割ベースの方法は、スケーラビリティ信号伝送のマッピングベースアプローチと比較して、計算およびメモリ資源が少なくて済む。
トランスポートシステム、例えばRTPまたはMPEG2−TS、において、スケーラビリティ関連のコーデック情報をそれぞれの要素にマップすることは、マッピングベース法と比較して分割等のより少ない複雑さおよびビット節約機構から利益を享受し得る。転送システムがマッピングアプローチの仕方のスケーラビリティ信号伝送を採用するが、むしろマッピング間接指定を分解して、分割法で例えば次々に明確に示される各スケーラビリティ次元ごとに専用のスケーラビリティ識別子を生じさせることは、ありそうにない。
タは、「splitting_flag」によって示され、一方、提出されるレイヤイン
ジケータは、nuh_layer_idと呼ばれている。「splitting_fla
g」に応じて、マッピング概念または分割概念が、nuh_layer_idからスケー
ラビリティ空間におけるそれぞれのNALユニットのレイヤの動作点を導出するために使
用される。分割概念は、1に等しいsplitting_flagによって手本として示
される。それから、スケーラブル識別子、すなわちスケーラビリティ空間のスケーラビリ
ティ次元に関するベクトル成分、は、ビットマスクされたコピーによってNALユニット
ヘッダにおけるnuh_layer_idシンタックス要素より導出され得る。第iのス
ケーラブル次元のためのそれぞれのビットマスク、図25におけるベクトル712の第i
の構成要素、は、以下の通りに定義される。特に、1に等しいsplitting_fl
agは、dimension_id[i][j]シンタックス要素が存在せず(すなわち
、マッピング情報708は、存在せず)、かつ、NALユニットヘッダにおけるnuh_
layer_idvalueのバイナリ表現は、一連のNumScalabilityT
ypesに分割される、すなわち、dimension_id_len_minus1[
j]の値によれば、n、セグメント、長さを有するベクトルx1…n、ビットにおけるおよ
びdimension_id[LayerIdxInVps[nuh_layer_id
]][j]の値によれば、すなわち、ベクトル712の構成要素x1…nは、フィールド6
90のNumScalabilityTypesセグメントから推定されることを示す。
意味論的な意味およびスケーラビリティ空間のスケーラビリティ軸の数は、それぞれのス
ケーラビリティタイプがそれぞれのスケーラビリティ空間698のスケーラビリティ次元
のいずれかに属するか否かに関してこの手本として所定の定数の各々を示す一連のフラグ
scalability_mask_flagによって示される。特に、ネットワーク実
体680は、スケーラビリティ空間、すなわちスケーラビリティ軸NumScalabi
lityTypesの意味論的な意味および数、を、図31におけるforループによる
フラグscalability_mask_flagのシーケンスから導出され得る。
scalability_mask_flag[ i ]
NumScalabilityTypes += scalability_mask_flag[ i ]
]
labilityTypes]の値は、6に等しく設定される。
よって各々の最初のNALユニットを関連することと関係している:
2) scalability_mask_flag、すなわち空間698のうちのスケ
ーラビリティ軸700、702の数および意味、およびそれ故にフィールドの部分xiの
数nを明らかにしている情報、のシーケンス
3) dimension_id_len_minus1、すなわち軸の各々のためのフ
ィールド690の各部分xiのビット長、(1つを除く全て、その理由は、フィールド6
90のすべての残りのビット706を含むために推定され得る
るような方法で設計される。スケーラブルビットストリームがノンスケーラブルデコーダに入力される場合、それは依然パケットタイプを検出し得て、未知のパケットを廃棄し得る。
2.出力を読込んでいるビデオデコーダは、ベースおよびエンハンスメントレイヤを復号化し得る、そして、ベースおよびエンハンスメントレイヤは、同じビデオ符号化規格を使用して符号化される。
3.出力を読込んでいるビデオデコーダは、ベースおよびエンハンスメントレイヤを復号化し得る、そして、ベースおよびエンハンスメントレイヤは、異なるビデオ符号化規格を使用して符号化される。
ムからH.264/AVC NALユニットを抽出するトランスポートストリームデコーダである。そのストリームタイプがストリームタイプ"AVC video stream conforming to one or more profiles defined in Annex A of ITU-T Rec. H.264 | ISO/IEC 14496-10 or AVC video sub-bit stream"と等しくないストリームに属するNALユニットは、トラ
ンスポートストリームデコーダ内で廃棄される。図28は、特定の実施例の具体例を与える。
NALユニットを抽出し得る。様々なレイヤのNALユニットは、H.264/AVC仕様書の付録Bにおいて定義されたバイトストリームフォーマットにマルチプレックスされ、H.264/AVC SVCビデオデコーダに入力される。図29は、特定の実施例の具体例を与える。
エンハンスメントレイヤ規格パケットフォーマットは、ベースレイヤパケットを運ぶことを可能にする場合、ベースレイヤパケットは、エンハンスメントレイヤフォーマットに要約される。これは、ヘッダがエンハンスメントレイヤ規格ビデオデコーダによって理解され得る各ベースレイヤパケットに加えられ、そして、エンハンスメントレイヤビデオデコーダが様々なビデオ符号化規格のベースレイヤとしてパッケージを確認し得ることを可能にする。
異なるチャンネルは、スケーラブルなビットストリームの各レイヤのために使用される。ビデオ符号化規格は、チャンネル選択によりデコーダにおいて決定される。
イヤパケット(またはアネックスBバイトストリーム)の用途にのみ、使用される。
イヤにおいて使用された予測パラメータに関連し得るか、または様々な時間整列配置されたレイヤの画像サンプルに言及し得る。これは、他の態様および実施例に関して上記ですでに記載されていた。
るレイヤインジケータフィールドを、例えば、検査することによって関連しているレイヤ
を確認する。
・データストリーム40のそれぞれの高水準シンタックスの調査に基づきトランスポ
ートレイヤデコーダ770により導出された、一方ではデータストリーム40のレイヤお
よび同上のコーデック/規格の間の関連、に基づき、トランスポートレイヤデコーダ40
は、現在検査されたNALユニットが2つの基準を満たすか否かを決定する:NALユニ
ットレイヤは、デコーダ772に転送されるべきレイヤのサブセットに属し、どのサブセ
ットがスケーラビリティ空間内における現在検査されたNALユニットレイヤの動作点に
より決定され、スケーラビリティ空間内におけるいずれの動作点がマルチレイヤマルチ規
格デコーダ772に転送され得るか、そして、そうでないかに関する院外処方が、決定さ
れる。更に、トランスポートレイヤデコーダ770は、現在検査されたNALユニットレ
イヤコーデックが、マルチレイヤマルチ規格デコーダ772が扱い得るコーデック/規格
のセットに属するかどうかを調べる。
・チェックで両方の基準が現在検査されたNALユニットによって満足されることが
分かる場合、トランスポートレイヤデコーダ770は、復号化するためのデコーダ772
に現在のNALユニットを転送する。
わち、理解の容易のための図44に示されない、下記にあるトランスポートレイヤによって設けられているように、様々なチャネル間の識別は、異なるチャネル識別子間を区別することによって実現され得る。
、同時にビューの概念もカバーするために使用された。
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造(606;例えばtile_boundaries_aligned_flag)を以下のために検査し、
前記第2のレイヤの前記画像の前記空間セグメントの間の境界が前記第1のレイヤの前記画像(12)の前記空間セグメントの各境界を覆い、かつ、前記マルチレイヤビデオデータストリームの短期シンタックス要素(例えば602;column_width_minus1[i]およびcolumn_width_minus1[i])に基づく前記空間セグメントへの前記第1のレイヤおよび前記第2のレイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔(604)で、周期的に決定するように、前記所定期間(608)の間、前記第2のレイヤの前記画像(608)が再分割される保証として第1のあり得る値のセット(例えばtile_boundaries_aligned_flag=1)から値を仮定する前記長期シンタックス要素構造を解釈し、
前記長期シンタックス要素構造が、第2のあり得る値のセット(例えばtile_boundaries_aligned_flag=0)から値を仮定した場合、少なくとも前記短期シンタックス要素の第1のあり得る値に対し、前記第1のレイヤの前記空間セグメントの前記境界のいずれかを覆わない前記第2のレイヤの前記画像の前記空間セグメントの間に境界が存在し、かつ、少なくとも前記短期シンタックス要素の第2のあり得る値に対し、前記第1のレイヤの前記空間セグメントの各境界を覆う前記第2のレイヤの前記画像の前記空間セグメントの間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記空間セグメントへの前記レイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔で、周期的に決定する、ように構成されているビデオデコーダに関する。
前記第1のレイヤの前記画像の前記空間セグメントの境界と交差していて、前記第1のレイヤの前記画像の前記空間セグメントの前記復号化の間の復号化遅延に従っている前記イントラピクチャ空間予測をサポートすることと並行して前記第1のレイヤの画像の前記空間セグメントを復号化することにより、および前記第2のレイヤの前記画像の前記空間セグメントの境界を交差していて、前記第2のレイヤの前記画像の前記空間セグメントの前記復号化の間の復号化遅延に従っている前記イントラピクチャ空間予測をサポートすることと並行して前記第2のレイヤの画像の前記空間セグメントを復号化することにより、イントラピクチャ空間予測を使用している前記レイヤの前記画像を復号化するように構成された、第1の態様に記載のビデオデコーダに関する。
前記デコーダは、
前記第1のあり得る値のセットから値を仮定している長期シンタックス要素を、前記第2のレイヤの前記画像の前記タイル間の境界が前記第1のレイヤの前記タイルの各境界を覆い、かつ前記短期シンタックス要素に基づき前記第1のレイヤと関連して前記第2のレイヤの前記画像の再分割のタイル改良を、所定期間より短い時間間隔において、周期的に決定するように、所定期間の間、前記第2のレイヤの前記画像が再分割される保証として、解釈し、かつ、
前記長期シンタックス要素が前記第2のあり得る値のセットから前記値を仮定した場合、少なくとも前記短期シンタックス要素の第1のあり得る値に対し、前記第1のレイヤの前記タイルの前記境界のいずれも覆っていない前記第2のレイヤの前記画像の前記タイル間で境界が存在し、かつ、少なくとも前記短期シンタックス要素の第2のあり得る値に対し、前記第1のレイヤの前記タイルの各境界を覆う前記第2のレイヤの前記画像の前記タイル間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記レイヤの前記画像の前記タイルへの前記再分割を、前記所定期間より短い時間間隔において、周期的に決定するように構成された、第1の態様または第2の態様に記載のビデオデコーダに関する。
前記長期シンタックス要素が第2のあり得る値のセットの中の値にセットされる場合、前記所定期間よりも短い期間において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく前記所定期間内に前記インターレイヤオフセットを周期的に決定するように構成された、第1または第2の態様に記載のビデオデコーダに関する。
長期シンタックス要素構造(606)および短期シンタックス要素(602)を前記マルチレイヤビデオデータストリームに挿入し、かつ、前記短期シンタックス要素は、前記時間間隔において、前記第1のレイヤおよび前記第2のレイヤの前記画像の前記空間セグメントへの前記再分割を定義し、かつ
前記長期シンタックス要素構造を設定する間で切替え、
前記時間間隔より長い所定期間(608)の間、第1のあり得る値のセットからの値は、前記短期シンタックス要素をあり得る設定のセットからの適切なサブセットに設定しながら、前記第2のレイヤの前記画像の前記空間セグメントの間の境界は前記第1のレイヤの前記空間セグメントの各境界に重畳するように、前記適切なサブセットは、前記所定期間の間に、前記第2のレイヤの前記画像が再分割されるように選択され、
前記所定期間の間、第2のあり得る値のセットからの値は、あり得る設定の前記セットのいずれかに前記短期シンタックス要素を設定しながら、前記あり得る設定のセットは、前記第1のレイヤの前記空間セグメントの前記境界のいずれかに重畳しない前記第2のレイヤの前記画像の前記空間セグメントの間に境界が存在することにより、少なくとも1つの設定を、および、前記第2のレイヤの前記画像の前記空間セグメントの間の境界が前記第1のレイヤの前記空間セグメントの各境界に重畳することによる少なくとも他の設定を含む、ように切替えるように構成された、ビデオエンコーダに関する。
前記第1のレイヤの画像の前記空間セグメントの境界を横断する前記イントラピクチャ空間予測をサポートすることにより、および、前記第1のレイヤの前記画像の前記空間セグメントの前記サブセットの前記エントロピー符号化に対する前記エントロピーコンテキスト確率を初期化することにより、または、前記直接適合状態で前記第1のレイヤの前記画像の前記空間セグメントの以前のサブセットの、前記サブセット間の順序に従って、前記エントロピーコンテキスト確率を採用する状況下で、および前記第2のレイヤの画像の前記空間セグメントの境界と交差する前記イントラピクチャ空間予測をサポートすることにより、および、前記第2のレイヤの前記画像の前記空間セグメントの前記サブセットの前記エントロピー符号化に対する前記エントロピーコンテキスト確率を初期化することにより、または、前記直接適合状態で前記第2のレイヤの前記画像の前記空間セグメントの以前のサブセットの、前記サブセット間の順序に従い、前記エントロピーコンテキスト確率を採用する状況下で、イントラピクチャ空間予測を使用して前記レイヤの前記画像を符号化しかつエントロピーコンテキスト確率に適合するエントロピー符号化を行うように構成されている、第8の態様に記載のビデオエンコーダに関する。
前記長期シンタックス要素構造を設定する場合、
前記第1のあり得る値のセット(tile_boundaries_aligned_flag=1)からの値は、前記時間間隔より大きい所定期間の間に、前記短期シンタックス要素を一組のあり得る設定から適当なサブセットに設定され、前記所定期間の間に、タイルへの前記第2のレイヤの画像の再分割が一致するかまたはタイルへの前記第1のレイヤの画像の再分割を精緻化するように前記適当なサブセットが選択されている、あるいは、
第2のあり得る値のセット(tile_boundaries_aligned_flag=0)からの値は、前記所定期間の間に、前記第1のレイヤの前記タイルの前記境界のいずれかに重畳しない前記第2のレイヤの前記画像の前記タイルの間に境界が存在することにより、前記短期シンタックス要素は、前記所定期間の間少なくとも一回間隔で、あり得る設定の前記セットの第1のあり得る値にセットされるように設定され、前記所定期間の間、少なくとも他の時間間隔に対し、前記第2のレイヤの前記画像の前記タイルが前記第1のレイヤの前記タイルの各境界に重畳する間境界に従って、あり得る設定の前記セットの第2のあり得る値に設定する、ように構成された第8または第9の態様に記載のビデオエンコーダに関する。
前記長期シンタックス要素構造を、
前記第1のあり得る値からの値に設定する場合、前記時間間隔より長い前記所定期間を使用して、前記短期シンタックス要素を一連のあり得るセットからの適切なサブセットに設定し、所定期間の間、前記第1のレイヤの前記画像の各空間セグメントが前記長期シンタックス要素構造の前記値に依存してnを有する第2のレイヤの前記画像のn空間セグメントから正確に成立つように前記適切なサブセットが選択されているように構成されている、第8または第9の態様に記載のビデオエンコーダに関する。
前記第1の空間セグメントに依存する前記アップサンプリングされた基準画像の分割(622)の任意の部分が、前記分割の他の任意の分割により覆われた前記第1の空間レイヤの前記画像の部分から独立であるように、あるいは、
前記アップサンプリングされた基準画像の前記分割(622)の任意の部分が、前記それぞれの分割に空間的に隣接する分割の他の分割により覆われた前記第1の空間レイヤの前記画像の部分に従属するように、
アップサンプリングされた基準画像を得て前記アップサンプリングされた基準画像を使用して第2の空間レイヤを予測するために第1の空間レイヤの画像(12)をアップサンプリングし、そして、前記デコーダは、前記シンタックス要素に依存して、前記第1の空間レイヤの前記画像を補間(620)するために、前記空間スケーラブルビットストリームにおいてシンタックス要素(616;例えばindependent_tile_upsampling_idc)に応答する、ように構成されているデコーダに関する。
前記第1の空間セグメントのいずれかによって空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分も、前記それぞれの空間セグメントに隣接して、前記第1の空間セグメントの他のいかなる空間セグメントによって覆われた前記第1の空間レイヤの前記画像の部分に依存しているように、シンタックス要素に応じて、前記第1の空間レイヤの前記画像を補間(620)するために、前記空間スケーラブルビットストリームにおける前記シンタックス要素(616)に応答する、第13または第14の態様によるデコーダに関する。
前記それぞれの第1の空間セグメントの境界で各第1の空間セグメントに対する前記イントラピクチャ空間予測を中断させながら、または、
前記第1の空間セグメントの境界と交差する前記イントラピクチャ空間予測をサポートしながら、エントロピーコンテキスト確率の適合を使用して最初の各空間セグメントをエントロピー復号化しながら、かつ第1の空間セグメントその他から独立して前記第1の空間セグメントの前記エントロピーコンテキスト確率を初期化しながら、または、前記以前の第1の空間セグメントの中間位置まで適合するように、前記第1のレイヤの前記画像の前記空間セグメントの以前の第1の空間セグメントの、前記第1の空間セグメントの間の順序に従って、前記エントロピーコンテキスト確率を採用する状況下で、イントラピクチャ空間予測を使用して前記復号化を実行するように構成された、第13〜第16の態様のいずれかの態様に記載のデコーダに関する。
(例えばindependent_tile_upsampling_idc=1)前記第1および第2のタイルの空間的に同位置に配置された境界により空間的に限定された前記アップサンプリングされた基準ピクチャの任意の部分は、前記第1および第2のタイルの空間的に同位置に配置された境界により空間的に限定された、前記アップサンプリングされた基準ピクチャの他のいずれかの部分により覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、あるいは、
(例えばindependent_tile_upsampling_idc=0)前記第2のタイルのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャの任意の部分が、前記それぞれのタイルに隣接している第2のタイルの他のいずれかによって覆われた前記第1の空間レイヤの前記画像の部分に依存しているように、
前記空間スケーラブルビットストリームが前記第1の空間セグメントにおいてその中に符号化された前記第1の空間レイヤの前記画像を有し、前記第2の空間セグメントにおいてその中に符号化された前記第2の空間レイヤの前記画像を有し、前記デコーダは、前記シンタックス要素に依存して、前記第1の空間レイヤの前記画像を補間するために、前記空間スケーラブルビットストリームにおいて前記シンタックス要素(606)に応答する、第13または第14の態様に記載のデコーダに関する。
トにおいてその中に符号化される前記第1の空間レイヤの前記画像を有し、前記空間スケーラブルビットストリームは、第2の空間セグメントに符号化された前記第2の空間レイヤの前記画像を有し、前記分割の境界は、前記第1および第2の空間セグメントの境界の空間重畳の論理積にあるいは前記第2の空間セグメントの前記境界に対応し、前記デコーダは、前記第1の空間レイヤの前記画像の前記補間において使用されたフィルタカーネルの断片を、前記シンタックス要素に依存して、満たすために応答し、前記断片が前記フィルタカーネルが突出する前記第1の空間レイヤの前記画像の前記それぞれの部分から独立してあるいは前記フィルタカーネルが突出する前記第1の空間レイヤの前記画像の前記それぞれの部分を使用して前記断片が充填されることに従って前記代替規則を使用する前記分割の隣接する分割に1つの分割から突出する、第13ないし第21のいずれかの態様に記載のデコーダに関する。
前記第1の空間セグメントに依存する前記アップサンプリングされた基準画像の分割のいかなる分割が、前記分割の前記他のいかなる分割により覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、または
前記アップサンプリングされた基準画像の前記分割のいかなる分割が、前記それぞれの分割に空間的に隣接している前記分割の他の分割により覆われた前記第1の空間レイヤの前記画像の部分に従属しているように、
アップサンプリングされた基準画像を得るためにおよび前記アップサンプリングされた基準画像を使用して第2の空間レイヤの画像を予測するために、第1の空間レイヤの画像をアップサンプリングし、前記エンコーダは、シンタックス要素(606)を空間スケーラブルビットストリームにセットしかつ挿入し、かつ前記シンタックス要素に依存して、前記第1の空間レイヤの前記画像を補間するよう構成されている、エンコーダに関する。
前記第1の空間セグメントのいずれかによって空間的に覆われたアップサンプリングされた基準画像のいかなる部分が、前記第1の空間セグメントの他のいずれかにより覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第1の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分が、前記第1の空間セグメントの他のいかなる空間セグメントによって覆われる前記第1の空間レイヤの前記画像の部分に従属して、前記それぞれの第1の空間セグメントに隣接するように、
前記シンタックス要素を空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に応じて、前記第1の空間レイヤの前記画像を補間するように構成されている、第25の態様に記載のデコーダに関する。
ンコードするように構成されている、第25または第26の態様に記載のエンコーダに関する。
前記第1および第2の空間セグメントの空間的に同位置に配置された境界により空間的に限定された前記アップサンプリングされた基準ピクチャの任意の部分は、前記第1および第2の空間セグメントの空間的に同位置に配置された境界により空間的に制限された、前記アップサンプリングされた基準画像の他のいずれかの部分により覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第2の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準画像の任意の部分は、前記それぞれの空間セグメントに隣接する第2の空間セグメントの他のいずれかにより覆われた前記第1の空間レイヤの前記画像の部分に従属するように、
前記エンコーダは、前記第2の空間レイヤの前記画像を前記第2の空間セグメントにおける前記空間スケーラブルビットストリームに符号化されるように構成され、前記エンコーダは、前記シンタックス要素を前記空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に依存して前記第1の空間レイヤの前記画像を補間するように構成されている、第27または第28の態様に記載のエンコーダに関する。
するためのビデオデコーダであって、前記ビデオデコーダは、前記第2のレイヤの画像の空間セグメントの前記横断に関連して前記第1のレイヤの画像の空間セグメントの前記横断の間インターレイヤ遅延を有する時間重畳態様における前記空間セグメントを順次横断することにより分割された前記レイヤの画像への空間セグメントにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、
前記ビデオデコーダは、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造(642;例えばmin_spatial_segment_delay)を検査し、
前記長期シンタックス要素構造(例えばmin_spatial_segment_delay≠0)があり得る値の第1のセットの値にセットされた場合、所定期間に対し前もって前記インターレイヤオフセットを決定するために前記長期シンタックス要素の前記値を使用し、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントのサイズおよび位置を、および、前記所定期間よりも短い時間間隔で、および前記マルチレイヤビデオデータストリームの短期シンタックス要素(602)にそれぞれ基づき前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度を、周期的に決定し、
前記長期シンタックス要素があり得る値の前記第1のセットと素なあり得る値の第2のセット(例えばmin_spatial_segment_delay=0)の値にセットされた場合、前記所定期間よりも短い時間間隔で、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づき前記所定期間内で前記インターレイヤオフセットを周期的に決定する、ように構成されているビデオデコーダに関する。
トを単位として前記インターレイヤオフセットを測定するため前記長期シンタックス要素の前記値を使用して前記インターレイヤオフセットを決定する際に前記長期シンタックス要素の前記値を使用するように構成されている、第34〜第38の態様のいずれかに記載のビデオデコーダに関する。
長期シンタックス要素構造(min_spatial_segment_delay)および短期シンタックス要素を前記マルチレイヤビデオデータストリームに挿入およびセットし、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素は、定期的に、それぞれ前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの時間間隔、サイズ、位置において定義し、かつ、前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度を定義し、
前記エンコーダは、セットの間を切替えるように構成され、
前記所定期間の間、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度が、前記第2のレイヤの画像の空間セグメントの前記横断に関連して前記第1のレイヤの画像の空間セグメントの前記横断の間前記長期シンタックス要素により示された前記インターレイヤオフセットより短いまたは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより、それぞれ前記マルチレイヤビデオデータストリームの復号化を可能にするように、前記時間間隔より長い所定期間に対し前記インターレイヤオフセットを示す前記値を有し、所定期間に対し、あり得る一連のセットから適切なサブセットへ前記短期シンタックス要素を、セットして、前記適切なサブセットが選択され、あり得る値の第1のセットの値への前記長期シンタックス要素構造(min_spatial_segment_delay≠0)をセットし、
前記所定期間の間、あり得る値の第2のセット(min_spatial_segment_delay=0)の値への前記長期シンタックス要素は、あり得る値の前記第1のセットと素であり、前記短期シンタックス要素を可能な一連のセットのいずれかにセットし、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも1つのセットを含むあり得る一連のセットは、それぞれ、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を
不可にし、かつ、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも1つの他のセットは、それぞれ、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を可能にするようにセットすることを含む、ビデオエンコーダに関する。
前記同じ画像の直接連続した前記横断の間のサブストリームのイントラピクチャイントラサブストリーム遅延および前記第2のレイヤの画像のサブストリームの前記横断に関連した前記第1のレイヤの画像のサブストリームの前記横断の間の前記インターレイヤオフセットを有する時間重畳態様における前記サブストリームを順次横断することにより波面並列処理を使用して前記サブストリームにおける前記マルチレイヤビデオデータストリームを並列に復号化可能にする態様で、前記空間セグメントは、前記レイヤが分割されかつ前記レイヤの前記画像が通常再分割されるサブストリームであるように、符号化を実行するように構成されている、第41の態様に記載のビデオエンコーダに関する。
前記サブストリームの境界を横断する前記イントラピクチャ空間予測をサポートし、かつ前記サブストリームを個々にエントロピー符号化する、または中間適応状態で以前の、前記サブストリーム間の順序に従い、サブストリームの前記エントロピーコンテキスト確率を採用するために、前記エントロピーコンテキスト確率を初期化することにより、イントラピクチャ空間予測を使用し、かつエントロピーコンテキスト確率に適合するエントロピー符号化を行うことにより、前記サブストリームを符号化するように構成されている、第42の態様に記載のビデオエンコーダに関する。
前記第1および第2のレイヤの前記画像の各々の範囲内で前記タイル間のタイル順序で前記タイルを横断することにより、前記マルチレイヤビデオデータストリームが前記タイルに復号化可能とする態様で、前記空間セグメントは前記レイヤの画像が分割されるタイルであるように、符号化を実行し、かつ、前記第2のレイヤの前記画像のタイルの前記横断に関連して前記第1のレイヤの前記画像の前記タイルの前記横断の間に前記インターレイヤオフセットに並行して前記第1のレイヤの画像の直接続行するタイルおよび前記第2のレイヤの画像の直接続行するタイルの復号化を実行するように構成されている、第41の態様に記載のビデオエンコーダに関する。
セグメントを復号化することが、前記第1のレイヤの前記画像の前記復号化および横断を開始することに対し遅れるべきであることにより前記第1のレイヤの前記画像の空間セグメントの数を示すために前記長期シンタックス要素の前記値をセットするように構成されている、第41ないし第46の態様のいずれかに記載のビデオデコーダに関する。
定されるスケーラビリティ空間の異なる動作点において符号化されるように、シーンがレ
イヤにおいて符号化されるマルチレイヤビデオデータストリームを処理するためのネット
ワーク実体であって、前記マルチレイヤビデオデータストリームは、その各々が前記レイ
ヤの1つと関連した第1のNALユニット、および、前記第1のNALユニット内で散在
して、前記マルチレイヤビデオデータストリームに関する一般情報を表す第2のNALユ
ニットを含み、前記ネットワーク実体は、
前記第2のNALユニットにおいて、タイプインジケータフィールド(696、例えばd
edicated_scalability_ids_flag)を検査し;
前記タイプインジケータフィールドに第1の状態(例えばdedicated_scal
ability_ids_flag=0)がある場合、前記第2のNALユニットから前
記動作点まで前記第1のNALユニットヘッダにおけるレイヤインジケータフィールド(
例えばlayer_id)のあり得る値をマップしているマッピング情報(例えばlay
er_id_in_nuh[i],dimension_id[i][j])を読み込ん
で、前記レイヤインジケータフィールドおよび前記マッピング情報を介して前記第1のN
ALユニットを前記第1のNALユニットの動作点と関連させ;
前記タイプインジケータフィールドに第2の状態(dedicated_scalabi
lity_ids_flag=1)がある場合、前記第1のNALユニットにおける前記
レイヤインジケータフィールドを1つ以上の部分に分割することにより、および、前記ス
ケーラビリティ空間内でベクトルの座標として前記部分の前記値を使用することにより、
前記第1のNALユニットの前記動作点を配置することで、前記第1のNALユニットを
前記動作点に関連させる、ように構成されたネットワーク実体に関する。
前記タイプインジケータフィールドには、前記第2の状態(dedicated_sc
alability_ids_flag=1)がある場合、前記第2のNALユニットに
おけるシンタックス要素(dimension_id_len_minus1)に従って
1つ以上の部分に前記第1のNALユニットにおける前記レイヤインジケータフィールド
を分割することにより、前記第1のNALユニットを前記動作点に関連付け、前記スケー
ラビリティ空間内におけるベクトルの座標として前記部分の前記値を使用することにより
前記第1のNALユニットの前記動作点を配置して、前記第2のNALユニットにおける
更なるシンタックス要素(scalability_mask)に従って前記スケーラビ
リティ次元を意味論的に決定するように構成された、第48の態様に記載のネットワーク
実体に関する。
前記タイプインジケータフィールドは、前記第1の状態(dedicated_sca
lability_ids_flag=0)がある場合、前記第2のNALユニットにお
ける更なるシンタックス要素(scalability_mask)から前記スケーラビ
リティ次元の数pおよび意味論的意味を決定し、かつ前記第2のNALユニットからp次
元ベクトルのリスト(708)を読込むことにより前記レイヤインジケータフィールドの
前記あり得る値を前記動作点に関連付けるように構成されている、請求項48または第4
9に記載のネットワーク実体に関する。
記ネットワーク実体は、前記第2のNALユニットからリストを読込むことをスキップするように構成されている、第50の態様に記載のネットワーク実体に関する。
れたスケーラビリティ空間の様々な動作点において符号化されるように、シーンをレイヤ
におけるマルチレイヤビデオデータストリームに符号化するためのビデオエンコーダであ
って、前記マルチレイヤビデオデータストリームは、前記レイヤの1つと各々が関連した
第1のNALユニットおよび前記第1のNALユニット内に散在し前記マルチレイヤビデ
オデータストリームに関する一般情報を示す第2のNAL情報を含み、前記ビデオエンコ
ーダは、
タイプインジケータフィールドを前記第2のNALユニットに挿入しかつ、
同上が前記動作点への前記第1のNALユニットヘッダにおけるレイヤインジケータフ
ィールドのあり得る値を前記第2のNALユニットにマッピングするマップ情報を挿入し
て第1の状態を有するように前記タイプインジケータフィールドをセットし、かつ、前記
第1のNALユニットの動作点は、前記マップ情報により、前記それぞれのレイヤインジ
ケータフィールドに関連するように、前記第1のNALユニットにおける前記レイヤイン
ジケータフィールドをセットし、
同上が前記第1のNALユニットにおける前記レイヤインジケータフィールドを1つ以
上の部分に分割することにより前記第1のNALユニットにおける前記レイヤインジケー
タフィールドをセットして第2の状態(dedicated_scalability_
ids_flag=1)を有するように前記タイプインジケータフィールドをセットし、
かつ、前記スケーラビリティの範囲内で、ベクトルの座標に対応する前記部分の前記値が
、前記それぞれの第1のNALユニットに関連する前記動作点を示すように前記以上の部
分をセットする、
間で切替えるように構成された、ビデオエンコーダに関する。
同上には第2の状態があるように前記タイプインジケータフィールドを設定する際に、前記第1のNALユニットにおける前記レイヤインジケータフィールドが1つ以上の部分に分割されるものに関して定義する前記第2のNALユニットにシンタックス要素をセットしかつ挿入し、前記スケーラビリティ次元を意味論的に定義する前記第2のNALユニットに更なるシンタックス要素をセットしかつ挿入するように構成されている、第54の態様に記載のビデオエンコーダに関する。
されたスケーラビリティ空間の様々な動作点において符号化されるように、シーンがレイ
ヤにおいて符号化されるマルチレイヤビデオデータストリームであって、前記マルチレイ
ヤビデオデータストリームは、各々第1のNALユニットを含み、各々は前記レイヤの1
つと関連し、かつ前記第2のNALユニットは、前記第1のNALユニット内に散在し、
かつ前記マルチレイヤビデオデータストリームに関する一般情報を表し、タイプインジケ
ータフィールド(696、例えばdedicated_scalability_ids
_flag=0)は、
前記タイプインジケータフィールドには第1の状態(例えばdedicated_sc
alability_ids_flag=0)がある場合、前記第2のNALユニットに
おけるマッピング情報は、前記第1のNALユニットヘッダにおけるレイヤインジケータ
フィールド(例えばlayer_id)のあり得る値を前記動作点にマップすることに応
じて;
前記タイプインジケータフィールドには第2の状態(dedicated_scala
bility_ids_flag=1)がある場合、前記第1のNALユニットにおける
前記レイヤインジケータフィールドは、前記スケーラビリティ空間内のベクトルの座標と
して前記部分の前記値により定義された前記第1のNALユニットの前記動作点を有する
1つ以上の部分に分割されることに応じて、
前記第2のNALユニットの中で存在する、マルチレイヤビデオデータストリームに関
する。
各NALユニットに対し、どのコーデックが関係しているかを確認し、かつ、
前記マルチレイヤビデオデータストリームの前記NALユニットを、前記マルチレイヤビデオデータストリームを復号化するために様々なコーデックと関連したレイヤの間にインターレイヤ予測を使用する前記マルチ規格マルチレイヤデコーダに手渡す、トランスポートレイヤデコーダに関する。
キャン復号化順序が、前記第1のブロックおよび前記第2のブロックの間でそれぞれ定義されるように復号化するためのビデオデコーダであって、前記ビデオデコーダは、
マルチレイヤビデオデータストリームのシンタックス要素構造(例えばctb_delay_enabled_flag、min_spatial_segment_delay)に応じて、前記第2のレイヤの画像の空間的な第2のブロックの前記横断と関連して前記第1のレイヤの画像の第1のブロックの前記横断との間で、インターレイヤオフセットを有する時間重畳態様で前記第1および第2のブロックを順次横断することにより前記第1および第2のレイヤの前記画像の並列復号化のために、前記第1のブロックを単位として測定されたインターレイヤオフセットを決定するように構成された、ビデオデコーダに関する。
所定期間を予め決定し、かつ、
前記所定期間より短い時間間隔において、前記マルチレイヤビデオデータストリームの短期シンタックス要素に基づき、前記第1のレイヤの前記画像の前記第1のブロックおよび前記第2のレイヤの前記画像の前記第2のブロックのサイズおよび位置、および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度をそれぞれ周期的に決定するように構成された、第62の態様に記載のビデオデコーダ。
前記長期シンタックス要素(例えばctb_delay_enabled_flag=0、min_spatial_segment_delay≠0)があり得る値の第1のセットの値にセットされる場合、前記第1のレイヤの前記画像の空間セグメントを単位として前記インターレイヤオフセットを測定する所定期間に対し予め前記インターレイヤオフセットを決定するために前記長期シンタックス要素構造の前記値を使用し、前記マルチレイヤビデオデータストリームの短期シンタックス要素に基づき、前記所定期間よりも短い時間間隔において、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントのサイズおよび位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度をそれぞれ周期的に決定し、
前記長期シンタックス要素構造があり得る値の前記第1のセットに素なあり得る値の第2のセット(例えばmin_spatial_segment_delay=0)の値にセットされる場合、前記所定期間よりも短い時間間隔において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく前記所定期間内に前記インターレイヤオフセットを周期的に決定し、
前記長期シンタックス要素構造があり得る値の前記第1および第2のセットに素なあり得る値の第3のセット(例えばctb_delay_enabled_flag=1、min_spatial_segment_delay≠0)の値にセットされる場合、前記第1のブロックを単位とした前記インターレイヤオフセットの前記決定を実行し、前記第1のレイヤの前記画像の前記第1のブロックおよび前記第2のレイヤの前記画像の前記第2のブロックの前記サイズおよび位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度の周期的な決定をそれぞれ実行する、
ように、前記マルチレイヤビデオデータストリームの前記長期シンタックス要素を検査する、第63の態様に記載のビデオデコーダに関する。
前記遅延インジケータを、同上がゼロまたはそれ以外にセットされるかに関して決定するために調査し、
前記遅延インジケータがゼロにセットされた場合、前記長期シンタックス要素構造の値が前記第2のセットの値にセットされ、かつ、
前記遅延インジケータがゼロ以外の値にセットされた場合、前記長期シンタックス要素構造の前記値を決定するために前記ゼロ以外の値を使用し、かつ前記ユニットフラグがゼロの場合、前記長期シンタックス要素構造の前記値が前記第1のセットの値にセットされ、かつ前記ユニットフラグが1の場合、前記長期シンタックス要素構造の前記値が前記第3のセットの値にセットされることを決定する、第64ないし第65の態様のいずれかに記載のビデオデコーダに関する。
用してレイヤの階層において符号化されたマルチレイヤビデオデータストリーム(40)を復号化する方法であって、
前記ビデオデコーダは、前記レイヤの画像(12、15)が再分割される空間セグメント(80)における前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記方法は、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造(606;例えばtile_boundaries_aligned_flag)を検査し、
前記第2のレイヤの前記画像の前記空間セグメントの間の境界が前記第1のレイヤの前記画像(12)の前記空間セグメントの各境界に重畳し、かつ、前記マルチレイヤビデオデータストリームの短期シンタックス要素(602;例えば、column_width_minus1[i]およびcolumn_width_minus1[i])に基づく前記空間セグメントへの前記第1のレイヤおよび前記第2のレイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔(604)で、周期的に決定するように、前記所定期間(608)の間、前記第2のレイヤの前記画像(608)が再分割される保証として第1のあり得る値のセット(例えばtile_boundaries_aligned_flag=1)から値を仮定する前記長期シンタックス要素構造を解釈し、かつ、
前記長期シンタックス要素構造が、第2のあり得る値のセット(例えばtile_boundaries_aligned_flag=0)から値を仮定した場合、少なくとも前記短期シンタックス要素の第1のあり得る値に対し、前記第1のレイヤの前記空間セグメントの前記境界のいずれかを覆わない前記第2のレイヤの前記画像の前記空間セグメントの間の境界、および、少なくとも前記短期シンタックス要素の第2のあり得る値に対し、前記第1のレイヤの前記空間セグメントの各境界に重畳する前記第2のレイヤの前記画像の前記空間セグメントの間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記空間セグメントへの前記レイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔で、周期的に決定する、方法に関する。
長期シンタックス要素構造(606)および短期シンタックス要素(602)を前記マルチレイヤビデオデータストリームに挿入し、前記短期シンタックス要素は、前記第1のレイヤおよび前記第2のレイヤの前記画像の前記空間セグメントへの前記再分割を、時間間隔において、定義しており、かつ、
前記長期シンタックス要素構造を設定する間で切替え、
前記時間間隔より長い所定期間(608)の間、第1のあり得る値のセットからの値は、前記短期シンタックス要素をあり得る設定のセットからの適切なサブセットに設定しながら、前記第2のレイヤの前記画像の前記空間セグメントの間の境界は前記第1のレイヤの前記空間セグメントの各境界に重畳するように、前記適切なサブセットは、前記所定期間の間に、前記第2のレイヤの前記画像が再分割されるように選択され、
前記所定期間の間、第2のあり得る値のセットからの値は、あり得る設定の前記セットのいずれかに前記短期シンタックス要素を設定しながら、前記あり得る設定のセットは、前記第1のレイヤの前記空間セグメントの前記境界のいずれかに重畳しない前記第2のレイヤの前記画像の前記空間セグメントの間に境界が存在することにより、少なくとも1つの設定を、および、前記第2のレイヤの前記画像の前記空間セグメントの間の境界が前記第1のレイヤの前記空間セグメントの各境界に重畳することによる少なくとも他の設定を含む、ように切替えることを含む、方法に関する。
トリーム(40)を復号化するための方法であって、
前記方法は、
前記第1の空間セグメントに依存する、前記アップサンプリングされた基準画像の分割(622)の任意の分割は、前記分割の任意の他の分割により覆われた前記第1の空間レイヤの前記画像の部分から独立するように、あるいは、
前記アップサンプリングされた基準ピクチャの前記分割(622)の任意の部分は、前記それぞれの分割に空間的に隣接する前記分割の他の分割により覆われた前記第1の空間レイヤの前記画像の部分に従属するように、
アップサンプリングされた基準画像を得るために第1の空間レイヤの画像(12)をアップサンプリングし、かつ前記アップサンプリングされた基準画像を使用して第2の空間レイヤの画像(15)を予測し、前記復号化のための方法は、前記シンタックス要素に従属して、前記第1の空間レイヤの前記画像を補間(620)するために、空間スケーラブルビットストリームにおけるシンタックス要素(616;例えばindependent_tile_upsampling_idc)に応答することを含む方法に関する。
前記方法は、
前記第1の空間セグメントに依存する、前記アップサンプリングされた基準画像の分割の任意の部分は、前記分割の前記他の部分のいずれかにより覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、
前記アップサンプリングされた基準画像の前記分割の任意の部分は、前記それぞれの部分に空間的に隣接する前記分割の他の部分により覆われた前記第1の空間レイヤの前記画像の部分に従属しているように、
アップサンプリングされた基準画像を得るために第1の空間レイヤの画像をアップサンプリングし、前記アップサンプリングされた基準画像を使用して第2の空間レイヤの画像を予測し、前記方法は、シンタックス要素(606)を空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に依存して前記第1の空間レイヤの前記画像を補間することを含む、方法に関する。
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造(642;例えばmin_spatial_segment_delay)を検査し、
前記長期シンタックス要素構造(例えばmin_spatial_segment_delay≠0)があり得る値の第1のセットの値にセットされた場合、所定期間に対し前もって前記インターレイヤオフセットを決定するために前記長期シンタックス要素の前記値を使用し、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントのサイズおよび位置を、および、前記所定期間よりも短い時間間隔で、および前記マルチレイヤビデオデータストリームの短期シンタックス要素(602)にそれぞれ基づき前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度を、周期的に決定し、
前記長期シンタックス要素があり得る値の第1のセットと素なあり得る値の第2のセット(例えばmin_spatial_segment_delay=0)の値にセットさ
れるとき、前記所定期間より短い時間間隔において、所定の時間より小さい時間間隔において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく所定期間内で前記インターレイヤオフセットを周期的に決定することを含む方法に関する。
長期シンタックス要素構造(min_spatial_segment_delay)および短期シンタックス要素を前記マルチレイヤビデオデータストリームに挿入およびセットし、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素は、定期的に、それぞれ前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの時間間隔、サイズ、位置において定義し、かつ、前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度を定義し、
前記方法は、セットの間を切替えるように構成され、
前記所定期間の間、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度が、前記第2のレイヤの画像の空間セグメントの前記横断に関連して前記第1のレイヤの画像の空間セグメントの前記横断の間前記長期シンタックス要素により示された前記インターレイヤオフセットより短いまたは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより、それぞれ前記マルチレイヤビデオデータストリームの復号化を可能にするように、前記時間間隔より長い所定期間に対し前記インターレイヤオフセットを示す前記値を有し、所定期間に対し、あり得る一連のセットから適切なサブセットへ前記短期シンタックス要素を、セットして、前記適切なサブセットが選択され、あり得る値の第1のセットの値への前記長期シンタックス要素構造(min_spatial_segment_delay≠0)をセットし、
前記所定期間の間、あり得る値の第2のセット(min_spatial_segment_delay=0)の値への前記長期シンタックス要素は、あり得る値の前記第1のセットと素であり、前記短期シンタックス要素を可能な一連のセットのいずれかにセットし、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも1つのセットを含むあり得る一連のセットは、それぞれ、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を不可にし、かつ、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも1つの他のセットは、それぞれ、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を可能にする
ようにセットすることを含む、方法に関する。
されるスケーラビリティ空間の異なる動作点において符号化されるように、シーンがレイ
ヤにおいて符号化されるマルチレイヤビデオデータストリームを処理するための方法であ
って、前記マルチレイヤビデオデータストリームは、その各々が前記レイヤの1つと関連
した第1のNALユニット、および、前記第1のNALユニット内で散在して、前記マル
チレイヤビデオデータストリームに関する一般情報を表す第2のNALユニットを含む方
法であって、前記方法は、
前記第2のNALユニットにおいて、タイプインジケータフィールド(696、例えば
dedicated_scalability_ids_flag)を検査し;
前記タイプインジケータフィールドに第1の状態(例えばdedicated_sca
lability_ids_flag=0)がある場合、前記第2のNALユニットから
前記動作点まで前記第1のNALユニットヘッダにおけるレイヤインジケータフィールド
(例えばlayer_id)のあり得る値をマップしているマッピング情報(例えばla
yer_id_in_nuh[i],dimension_id[i][j])を読み込
んで、前記レイヤインジケータフィールドおよび前記マッピング情報を介して前記第1の
NALユニットを前記第1のNALユニットの前記動作点と関連させ;
前記タイプインジケータフィールドに第2の状態(dedicated_scalab
ility_ids_flag=1)がある場合、前記第1のNALユニットにおける前
記レイヤインジケータフィールドを1つ以上の部分に分割することにより、および、前記
スケーラビリティ空間内でベクトルの座標として前記部分の前記値を使用することにより
、前記第1のNALユニットの前記動作点を配置することで、前記第1のNALユニット
を前記動作点に関連させることを含む方法。
されたスケーラビリティ空間の様々な動作点において符号化されるように、シーンをレイ
ヤにおけるマルチレイヤビデオデータストリームに符号化するための方法であって、前記
マルチレイヤビデオデータストリームは、前記レイヤの1つと各々が関連した第1のNA
Lユニットおよび前記第1のNALユニット内に散在し前記マルチレイヤビデオデータス
トリームに関する一般の情報を表す第2のNALユニットを含み、前記方法は、
タイプインジケータフィールドを前記第2のNALユニットに挿入しかつ、
同上が前記動作点への前記第1のNALユニットヘッダにおけるレイヤインジケータフ
ィールドのあり得る値を前記第2のNALユニットにマッピングするマップ情報を挿入し
て第1の状態を有するように前記タイプインジケータフィールドをセットし、かつ、前記
第1のNALユニットの動作点は、前記マップ情報により、前記それぞれのレイヤインジ
ケータフィールドに関連するように、前記第1のNALユニットにおける前記レイヤイン
ジケータフィールドをセットし、
同上が前記第1のNALユニットにおける前記レイヤインジケータフィールドを1つ以
上の部分に分割することにより前記第1のNALユニットにおける前記レイヤインジケー
タフィールドをセットして第2の状態(dedicated_scalability_
ids_flag=1)を有するように前記タイプインジケータフィールドをセットし、
かつ、前記スケーラビリティの範囲内で、ベクトルの座標に対応する前記部分の前記値が
、前記それぞれの第1のNALユニットに関連する前記動作点を示すように前記以上の部
分をセットする、
間で切替えることを含む、方法に関する。
レイヤは、前記それぞれのレイヤが関連する様々なコーデックを使用して前記それぞれのレイヤに関連したNALユニットが符号化されるように様々なコーデックと関連する方法であって、前記方法は、
各NALユニットごとに、どのコーデックが関連しているかを確認し、かつ、
前記マルチレイヤビデオデータストリームのNALユニットを、前記マルチレイヤビデオデータストリームを復号化するために様々なコーデックと関連したレイヤの間にインターレイヤ予測を使用する前記マルチ規格マルチレイヤデコーダに渡すこと、を含む方法に関する。
前記マルチレイヤビデオデータストリームのシンタックス要素構造(例えばctb_delay_enabled_flag、min_spatial_segment_delay)に応じて、前記第2のレイヤの画像の空間的な第2のブロックの前記横断に関連して前記第1のレイヤの画像の第1のブロックの前記横断の間前記インターレイヤオフセットを有する時間重畳態様における前記第1および第2のブロックを順次横断することにより、前記第1および第2のレイヤの前記画像を並列復号化するための、前記第1のブロックを単位として測定されたインターレイヤオフセットを決定することを含む、方法に関する。
Claims (81)
- 第1のレイヤから第2のレイヤまでインターレイヤ予測を使用してレイヤの階層においてシーンが符号化されるマルチレイヤビデオデータストリーム(40)を復号化するためのビデオデコーダであって、前記ビデオデコーダは、前記レイヤの画像(12,15)が再分割される空間セグメント(80)における前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記ビデオデコーダは、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造(606;例えばtile_boundaries_aligned_flag)を以下のために検査し、
前記第2のレイヤの前記画像の前記空間セグメントの間の境界が前記第1のレイヤの前記画像(12)の前記空間セグメントの各境界を覆い、かつ、前記マルチレイヤビデオデータストリームの短期シンタックス要素(例えば602;column_width_minus1[i]およびcolumn_width_minus1[i])に基づく前記空間セグメントへの前記第1のレイヤおよび前記第2のレイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔(604)で、周期的に決定するように、前記所定期間(608)の間、前記第2のレイヤの前記画像(608)が再分割される保証として第1のあり得る値のセット(例えばtile_boundaries_aligned_flag=1)から値を仮定する前記長期シンタックス要素構造を解釈し、
前記長期シンタックス要素構造が、第2のあり得る値のセット(例えばtile_boundaries_aligned_flag=0)から値を仮定した場合、少なくとも前記短期シンタックス要素の第1のあり得る値に対し、前記第1のレイヤの前記空間セグメントの前記境界のいずれかを覆わない前記第2のレイヤの前記画像の前記空間セグメントの間に境界が存在し、かつ、少なくとも前記短期シンタックス要素の第2のあり得る値に対し、前記第1のレイヤの前記空間セグメントの各境界を覆う前記第2のレイヤの前記画像の前記空間セグメントの間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記空間セグメントへの前記レイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔で、周期的に決定する、ように構成されているビデオデコーダ。 - それぞれの前記空間セグメントの境界で各空間セグメントごとに前記イントラピクチャ空間予測を中断させることを伴うイントラピクチャ空間予測を使用している前記レイヤの前記画像を復号化する;または、
前記第1のレイヤの前記画像の前記空間セグメントの境界と交差していて、前記第1のレイヤの前記画像の前記空間セグメントの前記復号化の間の復号化遅延に従っている前記イントラピクチャ空間予測をサポートすることと並行して前記第1のレイヤの画像の前記空間セグメントを復号化することにより、および前記第2のレイヤの前記画像の前記空間セグメントの境界を交差していて、前記第2のレイヤの前記画像の前記空間セグメントの前記復号化の間の復号化遅延に従っている前記イントラピクチャ空間予測をサポートすることと並行して前記第2のレイヤの画像の前記空間セグメントを復号化することにより、イントラピクチャ空間予測を使用している前記レイヤの前記画像を復号化するように構成された、請求項1に記載のビデオデコーダ。 - 前記レイヤの画像が再分割されるタイルにおける前記マルチレイヤビデオデータストリームのタイル並列復号化をサポートし、
前記デコーダは、
前記第1のあり得る値のセットから値を仮定している長期シンタックス要素を、前記第2のレイヤの前記画像の前記タイル間の境界が前記第1のレイヤの前記タイルの各境界を覆い、かつ前記短期シンタックス要素に基づき前記第1のレイヤと関連して前記第2のレイヤの前記画像の再分割のタイル改良を、所定期間より短い時間間隔において、周期的に
決定するように、所定期間の間、前記第2のレイヤの前記画像が再分割される保証として、解釈し、かつ、
前記長期シンタックス要素が前記第2のあり得る値のセットから前記値を仮定した場合、少なくとも前記短期シンタックス要素の第1のあり得る値に対し、前記第1のレイヤの前記タイルの前記境界のいずれも覆っていない前記第2のレイヤの前記画像の前記タイル間で境界が存在し、かつ、少なくとも前記短期シンタックス要素の第2のあり得る値に対し、前記第1のレイヤの前記タイルの各境界を覆う前記第2のレイヤの前記画像の前記タイル間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記レイヤの前記画像の前記タイルへの前記再分割を、前記所定期間より短い時間間隔において、周期的に決定するように構成された、請求項1または2に記載のビデオデコーダ。 - 前記ビデオデコーダは、それぞれの前記タイルの境界線で各タイルのイントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用しているレイヤの画像を復号化するように構成されている、請求項3に記載のビデオデコーダ。
- 前記デコーダは、所定期間の間、前記第1のレイヤの前記画像の各空間セグメントが前記長期シンタックス要素構造の前記値に依存するnでもって第2のレイヤの前記画像の正確にnの空間セグメントを占めるように、前記第2のレイヤの前記画像が再分割される保証として、第1のあり得る値からの値であることを仮定する前記長期シンタックス要素構造を解釈し、
前記長期シンタックス要素が第2のあり得る値のセットの中の値にセットされる場合、前記所定期間よりも短い期間において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく前記所定期間内に前記インターレイヤオフセットを周期的に決定するように構成された、請求項1または2に記載のビデオデコーダ。 - 前記デコーダは、前記第1のあり得る値であるか否かの中から前記値を仮定する前記長期シンタックス要素構造に依存する前記マルチレイヤビデオデータストリームの前記第2のレイヤを復号化するための検査を開始するか開始しないかを決定するように構成されている、請求項1または2に記載のビデオデコーダ。
- 前記ビデオデコーダは、ハイブリッドビデオデコーダである、請求項1ないし6のいずれかに記載のビデオデコーダ。
- 前記マルチレイヤビデオデータストリームが、前記レイヤの画像が再分割される空間セグメントにおいて、並列に復号化可能であるように、第1のレイヤから第2のレイヤまでインターレイヤ予測を使用しているレイヤの階層においてマルチレイヤビデオデータストリームにシーンを符号化するためのビデオエンコーダであって、前記エンコーダは、
長期シンタックス要素構造(606)および短期シンタックス要素(602)を前記マルチレイヤビデオデータストリームに挿入し、かつ、前記短期シンタックス要素は、前記時間間隔において、前記第1のレイヤおよび前記第2のレイヤの前記画像の前記空間セグメントへの前記再分割を定義し、かつ
前記長期シンタックス要素構造を設定する間で切替え、
前記時間間隔より長い所定期間(608)の間、第1のあり得る値のセットからの値は、前記短期シンタックス要素をあり得る設定のセットからの適切なサブセットに設定しながら、前記第2のレイヤの前記画像の前記空間セグメントの間の境界は前記第1のレイヤの前記空間セグメントの各境界に重畳するように、前記適切なサブセットは、前記所定期間の間に、前記第2のレイヤの前記画像が再分割されるように選択され、
前記所定期間の間、第2のあり得る値のセットからの値は、あり得る設定の前記セットのいずれかに前記短期シンタックス要素を設定しながら、前記あり得る設定のセットは、
前記第1のレイヤの前記空間セグメントの前記境界のいずれかに重畳しない前記第2のレイヤの前記画像の前記空間セグメントの間に境界が存在することにより、少なくとも1つの設定を、および、前記第2のレイヤの前記画像の前記空間セグメントの間の境界が前記第1のレイヤの前記空間セグメントの各境界に重畳することによる少なくとも他の設定を含む、ように切替えるように構成された、ビデオエンコーダ。 - 前記ビデオエンコーダは、前記それぞれの空間セグメントの境界で各空間セグメントに対し前記イントラピクチャ空間予測を中断させるとともにイントラピクチャ空間予測を使用している前記レイヤの前記画像を符号化し;あるいは、
前記第1のレイヤの画像の前記空間セグメントの境界を横断する前記イントラピクチャ空間予測をサポートすることにより、および、前記第1のレイヤの前記画像の前記空間セグメントの前記サブセットの前記エントロピー符号化に対する前記エントロピーコンテキスト確率を初期化することにより、または、前記直接適合状態で前記第1のレイヤの前記画像の前記空間セグメントの以前のサブセットの、前記サブセット間の順序に従って、前記エントロピーコンテキスト確率を採用する状況下で、および前記第2のレイヤの画像の前記空間セグメントの境界と交差する前記イントラピクチャ空間予測をサポートすることにより、および、前記第2のレイヤの前記画像の前記空間セグメントの前記サブセットの前記エントロピー符号化に対する前記エントロピーコンテキスト確率を初期化することにより、または、前記直接適合状態で前記第2のレイヤの前記画像の前記空間セグメントの以前のサブセットの、前記サブセット間の順序に従い、前記エントロピーコンテキスト確率を採用する状況下で、イントラピクチャ空間予測を使用して前記レイヤの前記画像を符号化しかつエントロピーコンテキスト確率に適合するエントロピー符号化を行うように構成されている、請求項8に記載のビデオエンコーダ。 - 前記空間セグメントはタイルであり、前記エンコーダは、
前記長期シンタックス要素構造を設定する場合、
前記第1のあり得る値のセット(tile_boundaries_aligned_flag=1)からの値は、前記時間間隔より大きい所定期間の間に、前記短期シンタックス要素を一組のあり得る設定から適当なサブセットに設定され、前記所定期間の間に、タイルへの前記第2のレイヤの画像の再分割が一致するかまたはタイルへの前記第1のレイヤの画像の再分割を精緻化するように前記適当なサブセットが選択されている、あるいは、
第2のあり得る値のセット(tile_boundaries_aligned_flag=0)からの値は、前記所定期間の間に、前記第1のレイヤの前記タイルの前記境界のいずれかに重畳しない前記第2のレイヤの前記画像の前記タイルの間に境界が存在することにより、前記短期シンタックス要素は、前記所定期間の間少なくとも一回間隔で、あり得る設定の前記セットの第1のあり得る値にセットされるように設定され、前記所定期間の間、少なくとも他の時間間隔に対し、前記第2のレイヤの前記画像の前記タイルが前記第1のレイヤの前記タイルの各境界に重畳する間境界に従って、あり得る設定の前記セットの第2のあり得る値に設定する、ように構成された請求項8または9に記載のビデオエンコーダ。 - 前記ビデオエンコーダは、それぞれの前記タイルの境界で各タイルに対し前記イントラピクチャ空間予測を中断させつつ、イントラピクチャ空間予測を使用している前記レイヤの前記画像を符号化するように構成されている、請求項10に記載のビデオエンコーダ。
- 前記エンコーダは、
前記長期シンタックス要素構造を、
前記第1のあり得る値からの値に設定する場合、前記時間間隔より長い前記所定期間を使用して、前記短期シンタックス要素を一連のあり得るセットからの適切なサブセットに
設定し、所定期間の間、前記第1のレイヤの前記画像の各空間セグメントが前記長期シンタックス要素構造の前記値に依存してnを有する第2のレイヤの前記画像のn空間セグメントから正確に成立つように前記適切なサブセットが選択されているように構成されている、請求項8または9に記載のビデオエンコーダ。 - 画像が異なる空間レイヤにおいておよび、前記空間レイヤの少なくとも1つのために、第1の空間セグメントにおいて符号化される空間スケーラブルビットストリーム(40)を復号化するためのデコーダであって、前記デコーダは、
前記第1の空間セグメントに依存する前記アップサンプリングされた基準画像の分割(622)の任意の部分が、前記分割の他の任意の分割により覆われた前記第1の空間レイヤの前記画像の部分から独立であるように、あるいは、
前記アップサンプリングされた基準画像の前記分割(622)の任意の部分が、前記それぞれの分割に空間的に隣接する分割の他の分割により覆われた前記第1の空間レイヤの前記画像の部分に従属するように、
アップサンプリングされた基準画像を得て前記アップサンプリングされた基準画像を使用して第2の空間レイヤを予測するために第1の空間レイヤの画像(12)をアップサンプリングし、そして、前記デコーダは、前記シンタックス要素に依存して、前記第1の空間レイヤの前記画像を補間(620)するために、前記空間スケーラブルビットストリームにおいてシンタックス要素(616;例えばindependent_tile_upsampling_idc)に応答する、ように構成されているデコーダ。 - 前記デコーダは、異なる空間レイヤを並列に復号化するように構成されている、請求項13に記載のデコーダ。
- 前記デコーダは、前記第1の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分が、前記第1の空間セグメントの他のいずれかによって覆われる前記第1の空間レイヤの前記画像の部分から独立しているように、または、
前記第1の空間セグメントのいずれかによって空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分も、前記それぞれの空間セグメントに隣接して、前記第1の空間セグメントの他のいかなる空間セグメントによって覆われた前記第1の空間レイヤの前記画像の部分に依存しているように、シンタックス要素に応じて、前記第1の空間レイヤの前記画像を補間(620)するために、前記空間スケーラブルビットストリームにおける前記シンタックス要素(616)に応答する、請求項13または14によるデコーダ。 - 前記空間スケーラブルビットストリームは、前記第1の空間セグメントにおいてそこに符号化される第2の空間レイヤの前記画像を有する、請求項13〜15のいずれかに記載のデコーダ。
- 前記デコーダは、
前記それぞれの第1の空間セグメントの境界で各第1の空間セグメントに対する前記イントラピクチャ空間予測を中断させながら、または、
前記第1の空間セグメントの境界と交差する前記イントラピクチャ空間予測をサポートしながら、エントロピーコンテキスト確率の適合を使用して最初の各空間セグメントをエントロピー復号化しながら、かつ第1の空間セグメントその他から独立して前記第1の空間セグメントの前記エントロピーコンテキスト確率を初期化しながら、または、前記以前の第1の空間セグメントの中間位置まで適合するように、前記第1のレイヤの前記画像の前記空間セグメントの以前の第1の空間セグメントの、前記第1の空間セグメントの間の順序に従って、前記エントロピーコンテキスト確率を採用する状況下で、イントラピクチ
ャ空間予測を使用して前記復号化を実行するように構成された、請求項13〜16のいずれかに記載のデコーダ。 - (例えばindependent_tile_upsampling_idc=2)前記第2のタイルのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャの任意の部分が、前記第2のタイルの他のいずれかにより空間的に覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、あるいは、
(例えばindependent_tile_upsampling_idc=1)前記第1および第2のタイルの空間的に同位置に配置された境界により空間的に限定された前記アップサンプリングされた基準ピクチャの任意の部分は、前記第1および第2のタイルの空間的に同位置に配置された境界により空間的に限定された、前記アップサンプリングされた基準ピクチャの他のいずれかの部分により覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、あるいは、
(例えばindependent_tile_upsampling_idc=0)前記第2のタイルのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャの任意の部分が、前記それぞれのタイルに隣接している第2のタイルの他のいずれかによって覆われた前記第1の空間レイヤの前記画像の部分に依存しているように、
前記空間スケーラブルビットストリームが前記第1の空間セグメントにおいてその中に符号化された前記第1の空間レイヤの前記画像を有し、前記第2の空間セグメントにおいてその中に符号化された前記第2の空間レイヤの前記画像を有し、前記デコーダは、前記シンタックス要素に依存して、前記第1の空間レイヤの前記画像を補間するために、前記空間スケーラブルビットストリームにおいて前記シンタックス要素(606)に応答する、請求項13または14に記載のデコーダ。 - 前記デコーダは、前記独立を達成するために、前記フィルタカーネルが突出する前記第1の空間レイヤの前記画像の前記それぞれの部分から独立して断片が満たされたことに従う代替規則を使用して、前記分割する前記他の分割のいずれかにより覆われ、前記第1の空間レイヤの前記画像のいずれの種類の部分に突出する、前記第1の空間レイヤの前記画像の前記補間において使用されたフィルタカーネルの断片を満たすように構成されている、請求項13〜18のいずれかに記載のデコーダ。
- 前記デコーダは、前記第1の空間レイヤの前記画像の外側境界から突出している前記フィルタカーネルの断片を満たしている前記代替規則を使用するように構成されている、請求項19に記載のデコーダ。
- 前記デコーダは、ビデオデコーダであって、画像ごとにまたは画像−シーケンスの基礎ごとに前記空間スケーラブルなビットストリームにおける前記シンタックス要素(606)に応答するように構成されている、請求項13〜20のいずれかに記載のデコーダ。
- 前記空間スケーラブルビットストリームは、前記第1の空間セグメントにおいてその中に符号化される前記第1の空間レイヤの前記画像を有し、前記空間スケーラブルビットストリームは、第2の空間セグメントに符号化された前記第2の空間レイヤの前記画像を有し、前記分割の境界は、前記第1および第2の空間セグメントの境界の空間重畳の論理積にあるいは前記第2の空間セグメントの前記境界に対応し、前記デコーダは、前記第1の空間レイヤの前記画像の前記補間において使用されたフィルタカーネルの断片を、前記シンタックス要素に依存して、満たすために応答し、前記断片が前記フィルタカーネルが突出する前記第1の空間レイヤの前記画像の前記それぞれの部分から独立してあるいは前記フィルタカーネルが突出する前記第1の空間レイヤの前記画像の前記それぞれの部分を使用して前記断片が充填されることに従って前記代替規則を使用する前記分割の隣接する分割に1つの分割から突出する、請求項13ないし21のいずれかに記載のデコーダ。
- 前記デコーダは、シンタックス要素(606)に依存するインターレイヤオフセットを用いて並列に前記第1および第2のレイヤを復号化するように構成されている、請求項13〜22のいずれかに記載のデコーダ。
- 前記デコーダは、前記シンタックス要素に従属する前記第1および第2の空間セグメントの境界、または、前記第2の空間セグメントの境界、の空間重畳の論理積に対応するように、前記分割の境界を設置するように構成されている、請求項13または23に記載のデコーダ。
- 様々な空間レイヤにおいて、および前記空間レイヤの少なくとも1つに対し第1の空間セグメントにおいて、画像を空間スケーラブルなビットストリームに符号化するエンコーダであって、前記エンコーダは、
前記第1の空間セグメントに依存する前記アップサンプリングされた基準画像の分割のいかなる分割が、前記分割の前記他のいかなる分割により覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、または
前記アップサンプリングされた基準画像の前記分割のいかなる分割が、前記それぞれの分割に空間的に隣接している前記分割の他の分割により覆われた前記第1の空間レイヤの前記画像の部分に従属しているように、
アップサンプリングされた基準画像を得るためにおよび前記アップサンプリングされた基準画像を使用して第2の空間レイヤの画像を予測するために、第1の空間レイヤの画像をアップサンプリングし、前記エンコーダは、シンタックス要素(606)を空間スケーラブルビットストリームにセットしかつ挿入し、かつ前記シンタックス要素に依存して、前記第1の空間レイヤの前記画像を補間するよう構成されている、エンコーダ。 - 前記エンコーダは、
前記第1の空間セグメントのいずれかによって空間的に覆われたアップサンプリングされた基準画像のいかなる部分が、前記第1の空間セグメントの他のいずれかにより覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第1の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分が、前記第1の空間セグメントの他のいかなる空間セグメントによって覆われる前記第1の空間レイヤの前記画像の部分に従属して、前記それぞれの第1の空間セグメントに隣接するように、
前記シンタックス要素を空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に応じて、前記第1の空間レイヤの前記画像を補間するように構成されている、請求項25に記載のデコーダ。 - 前記エンコーダは、前記第1の空間レイヤを、前記第1の空間セグメントにおける前記空間スケーラブルビットストリームに前記第1の空間レイヤの画像をエンコードするように構成されている、請求項25または26に記載のエンコーダ。
- 前記エンコーダは、前記それぞれの第1の空間セグメントの境界で各第1の空間セグメントに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用している前記第1の空間レイヤの画像を符号化するように構成されている、請求項27に記載のエンコーダ。
- 前記第2の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準画像の任意の部分は、前記第2の空間セグメントの他のいずれかにより空間的に覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第1および第2の空間セグメントの空間的に同位置に配置された境界により空間的
に限定された前記アップサンプリングされた基準ピクチャの任意の部分は、前記第1および第2の空間セグメントの空間的に同位置に配置された境界により空間的に制限された、前記アップサンプリングされた基準画像の他のいずれかの部分により覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第2の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準画像の任意の部分は、前記それぞれの空間セグメントに隣接する第2の空間セグメントの他のいずれかにより覆われた前記第1の空間レイヤの前記画像の部分に従属するように、
前記エンコーダは、前記第2の空間レイヤの前記画像を前記第2の空間セグメントにおける前記空間スケーラブルビットストリームに符号化されるように構成され、前記エンコーダは、前記シンタックス要素を前記空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に依存して前記第1の空間レイヤの前記画像を補間するように構成されている、請求項27または28に記載のエンコーダ。 - 前記エンコーダは、前記それぞれの第2の空間セグメントの境界で各第2の空間セグメントに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間画像を使用している前記第2の空間レイヤの前記画像を符号化するように構成されている、請求項29に記載のエンコーダ。
- 前記エンコーダは、前記第1の空間レイヤの前記画像の任意の部分からの前記独立を成し遂げるために、前記第1の空間レイヤの前記画像の前記補間において使用されるフィルタカーネルの断片を満たすために、前記第1の空間レイヤの前記画像のそのような部分に突出し、前記フィルタカーネルがその中に突出する前記第1の空間レイヤの前記画像の各部から独立して前記断片が満たされることに従って代替規則を使用するように構成されている、請求項25〜30のいずれかに記載のエンコーダ。
- 前記エンコーダは、前記第1の空間レイヤの前記画像の外側境界から突出しているフィルタカーネルの断片を満たしている代替規則をも使用するように構成される、請求項31に記載のエンコーダ。
- 前記エンコーダは、ビデオエンコーダであって、前記シンタックス要素を画像ごとにまたは画像シーケンスの基礎ごとに前記空間スケーラブルビットストリームにセットしかつ挿入するように構成されている、請求項25〜32のいずれかに記載のエンコーダ。
- シーンが第1のレイヤから第2のレイヤまでインターレイヤ予測を使用してレイヤの階層において符号化されたマルチレイヤビデオデータストリームを復号化するためのビデオデコーダであって、前記ビデオデコーダは、前記第2のレイヤの画像の空間セグメントの前記横断に関連して前記第1のレイヤの画像の空間セグメントの前記横断の間インターレイヤ遅延を有する時間重畳態様における前記空間セグメントを順次横断することにより分割された前記レイヤの画像への空間セグメントにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、
前記ビデオデコーダは、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造(642;例えばmin_spatial_segment_delay)を検査し、
前記長期シンタックス要素構造(例えばmin_spatial_segment_delay≠0)があり得る値の第1のセットの値にセットされた場合、所定期間に対し前もって前記インターレイヤオフセットを決定するために前記長期シンタックス要素の前記値を使用し、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントのサイズおよび位置を、および、前記所定期間よりも短い時間間隔で、および前記マルチレイヤビデオデータストリームの短期シンタックス要素
(602)にそれぞれ基づき前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度を、周期的に決定し、
前記長期シンタックス要素があり得る値の前記第1のセットと素なあり得る値の第2のセット(例えばmin_spatial_segment_delay=0)の値にセットされた場合、前記所定期間よりも短い時間間隔で、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づき前記所定期間内で前記インターレイヤオフセットを周期的に決定する、ように構成されているビデオデコーダ。 - 前記ビデオデコーダは、前記第2のレイヤの画像のサブストリームの前記横断に関して、前記第1のレイヤの画像のサブストリームの前記横断の間に、前記同じ画像および前記インターレイヤオフセットの直接的に連続したサブストリームの前記横断の間にイントラピクチャインターサブストリーム遅延を伴って時間重畳態様における前記サブストリームを順次横断することにより波面並列処理を使用して、前記レイヤの画像が分割され、前記レイヤの前記画像が定期的に再分割されるブロックの行からなるサブストリームにおける前記マルチレイヤビデオデータストリームを並列に復号化するように構成されている、請求項34に記載のビデオデコーダ。
- 前記ビデオデコーダは、前記サブストリームの境界と交差するイントラピクチャ空間予測をサポートする、前記サブストリームを並列に復号化するように構成されている、請求項35に記載のビデオデコーダ。
- 前記ビデオデコーダは、前記レイヤの画像が分割されるタイルにおける前記マルチレイヤビデオデータストリームを復号化するように構成されており、前記第1および第2のレイヤの前記画像の各々の中で前記タイルの間のタイル順序で前記タイルを横断して、前記第2のレイヤの前記画像のタイルの前記横断と関連して前記第1のレイヤの前記画像の前記タイルの前記横断との間に前記インターレイヤオフセットと並列に前記第1のレイヤの画像の直ちに後続するタイルおよび前記第2のレイヤの画像の直ちに後続するタイルを復号化するように構成されている、請求項34に記載のビデオデコーダ。
- 前記ビデオデコーダは、前記それぞれのタイルの境界で各タイルに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用して前記第1および第2のレイヤの前記画像を復号化するように構成されている、請求項37に記載のビデオデコーダ。
- 前記ビデオ復号化器は、前記第1のレイヤの前記画像の空間セグメントを単位として前記インターレイヤオフセットを測定するため前記長期シンタックス要素の前記値を使用して前記インターレイヤオフセットを決定する際に前記長期シンタックス要素の前記値を使用するように構成されている、請求項34〜38のいずれかに記載のビデオデコーダ。
- 前記ビデオ復号器は、前記第1のレイヤの前記画像の前記復号化および横断を開始するのに対し遅れるべき前記第2のレイヤの前記画像の第1の空間セグメントの前記復号化により前記第1のレイヤの前記画像の空間セグメントの数として前記長期シンタックス要素の前記値を使用することにより、前記インターレイヤオフセットを決定する際の前記長期シンタックス要素の前記値を使用するように構成されている、請求項34ないし39のいずれかに記載のビデオデコーダ。
- マルチレイヤビデオデータストリームが、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間にインターレイヤオフセットを有する時間重畳態様において前記空間セグメントを順次横断することにより前記レイヤの画像が分割された空間セグメントに復号化可能なように第1のレイヤ
から第2のレイヤにインターレイヤ予測を使用してレイヤの階層においてシーンをマルチレイヤビデオデータストリームに符号化するビデオエンコーダであって、前記ビデオエンコーダは、
長期シンタックス要素構造(min_spatial_segment_delay)および短期シンタックス要素を前記マルチレイヤビデオデータストリームに挿入およびセットし、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素は、定期的に、それぞれ前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの時間間隔、サイズ、位置において定義し、かつ、前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度を定義し、
前記エンコーダは、セットの間を切替えるように構成され、
前記所定期間の間、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度が、前記第2のレイヤの画像の空間セグメントの前記横断に関連して前記第1のレイヤの画像の空間セグメントの前記横断の間前記長期シンタックス要素により示された前記インターレイヤオフセットより短いまたは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより、それぞれ前記マルチレイヤビデオデータストリームの復号化を可能にするように、前記時間間隔より長い所定期間に対し前記インターレイヤオフセットを示す前記値を有し、所定期間に対し、あり得る一連のセットから適切なサブセットへ前記短期シンタックス要素を、セットして、前記適切なサブセットが選択され、あり得る値の第1のセットの値への前記長期シンタックス要素構造(min_spatial_segment_delay≠0)をセットし、
前記所定期間の間、あり得る値の第2のセット(min_spatial_segment_delay=0)の値への前記長期シンタックス要素は、あり得る値の前記第1のセットと素であり、前記短期シンタックス要素を可能な一連のセットのいずれかにセットし、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも1つのセットを含むあり得る一連のセットは、それぞれ、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を不可にし、かつ、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも1つの他のセットは、それぞれ、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を可能にするようにセットすることを含む、ビデオエンコーダ。 - 前記ビデオエンコーダは、
前記同じ画像の直接連続した前記横断の間のサブストリームのイントラピクチャイントラサブストリーム遅延および前記第2のレイヤの画像のサブストリームの前記横断に関連した前記第1のレイヤの画像のサブストリームの前記横断の間の前記インターレイヤオフセットを有する時間重畳態様における前記サブストリームを順次横断することにより波面並列処理を使用して前記サブストリームにおける前記マルチレイヤビデオデータストリー
ムを並列に復号化可能にする態様で、前記空間セグメントは、前記レイヤが分割されかつ前記レイヤの前記画像が通常再分割されるサブストリームであるように、符号化を実行するように構成されている、請求項41に記載のビデオエンコーダ。 - 前記ビデオエンコーダは、
前記サブストリームの境界を横断する前記イントラピクチャ空間予測をサポートし、かつ前記サブストリームを個々にエントロピー符号化する、または中間適応状態で以前の、前記サブストリーム間の順序に従い、サブストリームの前記エントロピーコンテキスト確率を採用するために、前記エントロピーコンテキスト確率を初期化することにより、イントラピクチャ空間予測を使用し、かつエントロピーコンテキスト確率に適合するエントロピー符号化を行うことにより、前記サブストリームを符号化するように構成されている、請求項42に記載のビデオエンコーダ。 - 前記ビデオエンコーダは、
前記第1および第2のレイヤの前記画像の各々の範囲内で前記タイル間のタイル順序で前記タイルを横断することにより、前記マルチレイヤビデオデータストリームが前記タイルに復号化可能とする態様で、前記空間セグメントは前記レイヤの画像が分割されるタイルであるように、符号化を実行し、かつ、前記第2のレイヤの前記画像のタイルの前記横断に関連して前記第1のレイヤの前記画像の前記タイルの前記横断の間に前記インターレイヤオフセットに並行して前記第1のレイヤの画像の直接続行するタイルおよび前記第2のレイヤの画像の直接続行するタイルの復号化を実行するように構成されている、請求項41に記載のビデオエンコーダ。 - 前記ビデオエンコーダは、それぞれのタイルの境界で各タイルに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用して前記第1および第2のレイヤの前記画像を符号化するように構成された、請求項44に記載のビデオエンコーダ。
- 前記ビデオエンコーダは、前記長期シンタクックス要素の前記値が前記第1のレイヤの前記画像の空間要素を単位として前記インターレイヤオフセットのための測定を定義するように構成されている、請求項41ないし45のいずれかに記載のビデオエンコーダ。
- 前記ビデオエンコーダが、前記第2のレイヤの前記画像の第1の空間セグメントを復号化することが、前記第1のレイヤの前記画像の前記復号化および横断を開始することに対し遅れるべきであることにより前記第1のレイヤの前記画像の空間セグメントの数を示すために前記長期シンタックス要素の前記値をセットするように構成されている、請求項41ないし46のいずれかに記載のビデオデコーダ。
- 各レイヤにおいて、前記シーンが、スケーラビリティ次元により測定されるスケーラビリティ空間の異なる運転点において符号化されるように、シーンがレイヤにおいて符号化されるマルチレイヤビデオデータストリームを処理するためのネットワーク実体であって、前記マルチレイヤビデオデータストリームは、その各々が前記レイヤの1つと関連した第1のNALユニット、および、前記第1のNALユニット内で散在して、前記マルチレイヤビデオデータストリームに関する一般情報を表す第2のNALユニットを含み、前記ネットワーク実体は、
前記第2のNALユニットにおいて、タイプインジケータフィールド(696、例えばdedicated_scalability_ids_flag)を検査し;
前記タイプインジケータフィールドに第1の状態(例えばdedicated_scalability_ids_flag=0)がある場合、前記第2のNALユニットから前記運転点まで前記第1のNALユニットヘッダにおけるレイヤインジケータフィールド(例えばlayer_id)のあり得る値をマップしているマッピング情報(例えばla
yer_id_in_nuh[i],dimension_id[i][j])を読み込んで、前記レイヤインジケータフィールドおよび前記マッピング情報を介して前記第1のNALユニットを前記第1のNALユニットの運転点と関連させ;
前記タイプインジケータフィールドに第2の状態(dedicated_scalability_ids_flag=1)がある場合、前記第1のNALユニットにおける前記レイヤインジケータフィールドを1つ以上の部分に分割することにより、および、前記スケーラビリティ空間内でベクトルの座標として前記部分の前記値を使用することにより、前記第1のNALユニットの前記運転点を配置することで、前記第1のNALユニットを前記運転点に関連させる、ように構成されたネットワーク実体。 - 前記ネットワーク実体は、
前記タイプインジケータフィールドには、前記第2の状態(dedicated_scalability_ids_flag=1)がある場合、前記第2のNALユニットにおけるシンタックス要素(dimension_id_len_minus1)に従って1つ以上の部分に前記第1のNALユニットにおける前記レイヤインジケータフィールドを分割することにより、前記第1のNALユニットを前記運転点に関連付け、前記スケーラビリティ空間内におけるベクトルの座標として前記部分の前記値を使用することにより前記第1のNALユニットの前記運転点を配置して、前記第2のNALユニットにおける更なるシンタックス要素(scalability_mask)に従って前記スケーラビリティ次元を意味論的に決定するように構成された、請求項48に記載のネットワーク実体。 - 前記ネットワーク実体は、
前記タイプインジケータフィールドは、前記第1の状態(dedicated_scalability_ids_flag=0)がある場合、前記第2のNALユニットにおける更なるシンタックス要素(scalability_mask)から前記スケーラビリティ次元の数pおよび意味論的意味を決定し、かつ前記第2のNALユニットからp次元ベクトルのリスト(708)を読込むことにより前記レイヤインジケータフィールドの前記あり得る値を前記運転点に関連付けるように構成されている、請求項48または49に記載のネットワーク実体。 - 前記タイプインジケータフィールドに前記第2の状態がある場合、前記ネットワーク実体は、前記第2のNALユニットからリストを読込むことをスキップするように構成されている、請求項50に記載のネットワーク実体。
- 前記ネットワーク実体は、前記第1のまたは前記第2の状態を有する前記タイプインジケータフィールドにかかわりなく前記第2のNALユニットから前記さらなるシンタックス要素を読込み、前記レイヤインジケータフィールドの前記サイズは、前記第1のまたは前記第2の状態を有する前記タイプインジケータフィールドにかかわりなく同じであるように構成されている、請求項49または51のいずれかに記載のネットワーク実体。
- 前記ネットワーク実体が、ビデオデコーダから構成されている、請求項48または52のいずれかに記載のネットワーク実体。
- 各レイヤにおいて、前記シーンはスケーラビリティ次元により測定されたスケーラビリティ空間の様々な運転点において符号化されるように、シーンをレイヤにおけるマルチレイヤビデオデータストリームに符号化するためのビデオエンコーダであって、前記マルチレイヤビデオデータストリームは、前記レイヤの1つと各々が関連した第1のNALユニットおよび前記第1のNALユニット内に散在し前記マルチレイヤビデオデータストリームに関する一般情報を示す第2のNAL情報を含み、前記ビデオエンコーダは、 タイプ
インジケータフィールドを前記第2のNALユニットに挿入しかつ、
同上が前記運転点への前記第1のNALユニットヘッダにおけるレイヤインジケータフィールドのあり得る値を前記第2のNALユニットにマッピングするマップ情報を挿入して第1の状態を有するように前記タイプインジケータフィールドをセットし、かつ、前記第1のNALユニットの運転点は、前記マップ情報により、前記それぞれのレイヤインジケータフィールドに関連するように、前記第1のNALユニットにおける前記レイヤインジケータフィールドをセットし、
同上が前記第1のNALユニットにおける前記レイヤインジケータフィールドを1つ以上の部分に分割することにより前記第1のNALユニットにおける前記レイヤインジケータフィールドをセットして第2の状態(dedicated_scalability_ids_flag=1)を有するように前記タイプインジケータフィールドをセットし、かつ、前記スケーラビリティの範囲内で、ベクトルの座標に対応する前記部分の前記値が、前記それぞれの第1のNALユニットに関連する前記運転点を示すように前記以上の部分をセットする、
間で切替えるように構成された、ビデオエンコーダ。 - 前記ビデオエンコーダは、
同上には第2の状態があるように前記タイプインジケータフィールドを設定する際に、前記第1のNALユニットにおける前記レイヤインジケータフィールドが1つ以上の部分に分割されるものに関して定義する前記第2のNALユニットにシンタックス要素をセットしかつ挿入し、前記スケーラビリティ次元を意味論的に定義する前記第2のNALユニットに更なるシンタックス要素をセットしかつ挿入するように構成されている、請求項54に記載のビデオエンコーダ。 - 各レイヤにおいて、前記シーンがスケーラビリティ次元によって測定されたスケーラビリティ空間の様々な運転点において符号化されるように、シーンがレイヤにおいて符号化されるマルチレイヤビデオデータストリームであって、前記マルチレイヤビデオデータストリームは、各々第1のNALユニットを含み、各々は前記レイヤの1つと関連し、かつ前記第2のNALユニットは、前記第1のNALユニット内に散在し、かつ前記マルチレイヤビデオデータストリームに関する一般情報を表し、タイプインジケータフィールド(696、例えばdedicated_scalability_ids_flag=0)は、
前記タイプインジケータフィールドには第1の状態(例えばdedicated_scalability_ids_flag=0)がある場合、前記第2のNALユニットにおけるマッピング情報は、前記第1のNALユニットヘッダにおけるレイヤインジケータフィールド(例えばlayer_id)のあり得る値を前記運転点にマップすることに応じて;
前記タイプインジケータフィールドには第2の状態(dedicated_scalability_ids_flag=1)がある場合、前記第1のNALユニットにおける前記レイヤインジケータフィールドは、前記スケーラビリティ空間内のベクトルの座標として前記部分の前記値により定義された前記第1のNALユニットの前記運転点を有する1つ以上の部分に分割されることに応じて、
前記第2のNALユニットの中で存在する、マルチレイヤビデオデータストリーム。 - シーンがレイヤに符号化されるマルチレイヤビデオデータストリームを対象とし、マルチ規格マルチレイヤデコーダによって復号化し、前記マルチレイヤビデオデータストリームは、各々がレイヤの1つと関連したNALユニットを含み、前記レイヤは、各レイヤに対し、前記それぞれのレイヤが関連する様々なコーデックを使用してそれぞれのレイヤに関連したNALユニットが符号化されるように、様々なコーデックに関連し、前記トランスポートレイヤデコーダは、 各NALユニットに対し、どのコーデックが関係している
かを確認し、かつ、
前記マルチレイヤビデオデータストリームの前記NALユニットを、前記マルチレイヤビデオデータストリームを復号化するために様々なコーデックと関連したレイヤの間にインターレイヤ予測を使用する前記マルチ規格マルチレイヤデコーダに手渡す、トランスポートレイヤデコーダ。 - それぞれのレイヤのコーデックを示している状態に設定されるNALユニットタイプインジケータを有する前記所定のコーデックのNALユニットヘッダを使用して、所定のコーデックと異なる任意のコーデックとも関連しているレイヤと関連しているとして確認されていたNALユニットをカプセル化するようにさらに構成されている、請求項57に記載のビデオデコーダ。
- 前記NALユニットがそれぞれ到着するチャネルに応じて、識別を実行するようにさらに構成された、請求項57または58に記載のビデオデコーダ。
- 様々なコーデックと関連した前記NALユニットが、様々なチャネル上の前記マルチ規格マルチレイヤデコーダに手渡されるように手渡しを実行するようにさらに構成された、請求項57または59のいずれかに記載のビデオデコーダ。
- 前記それぞれのNALユニットが関連する前記レイヤが関連する前記コーデックを示しているメタデータを各NALユニットに提供するようにさらに構成されている、請求項57または60に記載のビデオデコーダ。
- マルチレイヤビデオデータストリームを、シーンが第1のレイヤの部分から第2のレイヤの同じ位置に配置された部分までインターレイヤ予測を使用してレイヤの階層において符号化され、前記第1のレイヤの画像が第1のブロックの配列に再分割され、かつ、前記第2のレイヤの画像が第2のブロックの配列に再分割され、ラスタースキャン復号化順序が、前記第1のブロックおよび前記第2のブロックの間でそれぞれ定義されるように復号化するためのビデオデコーダであって、前記ビデオデコーダは、
マルチレイヤビデオデータストリームのシンタックス要素構造(例えばctb_delay_enabled_flag、min_spatial_segment_delay)に応じて、前記第2のレイヤの画像の空間的な第2のブロックの前記横断と関連して前記第1のレイヤの画像の第1のブロックの前記横断との間で、インターレイヤオフセットを有する時間重畳態様で前記第1および第2のブロックを順次横断することにより前記第1および第2のレイヤの前記画像の並列復号化のために、前記第1のブロックを単位として測定されたインターレイヤオフセットを決定するように構成された、ビデオデコーダ。 - 前記シンタックス要素構造は、長期シンタックス要素構造であり、前記ビデオデコーダは、
所定期間を予め決定し、かつ、
前記所定期間より短い時間間隔において、前記マルチレイヤビデオデータストリームの短期シンタックス要素に基づき、前記第1のレイヤの前記画像の前記第1のブロックおよび前記第2のレイヤの前記画像の前記第2のブロックのサイズおよび位置、および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度をそれぞれ周期的に決定するように構成された、請求項62に記載のビデオデコーダ。 - 前記ビデオデコーダは、前記ラスタースキャン復号化順序に沿って順次配置された空間セグメントにおける前記マルチレイヤビデオデータストリームの、および、前記第2のレイヤの画像の空間セグメントの前記横断に関連して前記第1のレイヤの画像の空間セグメ
ントの前記横断の間前記インターレイヤオフセットとともに時間重畳態様における前記空間セグメントを順次横断することにより、前記レイヤの画像が分割される並列復号化をサポートし、前記ビデオデコーダは、
前記長期シンタックス要素(例えばctb_delay_enabled_flag=0、min_spatial_segment_delay≠0)があり得る値の第1のセットの値にセットされる場合、前記第1のレイヤの前記画像の空間セグメントを単位として前記インターレイヤオフセットを測定する所定期間に対し予め前記インターレイヤオフセットを決定するために前記長期シンタックス要素構造の前記値を使用し、前記マルチレイヤビデオデータストリームの短期シンタックス要素に基づき、前記所定期間よりも短い時間間隔において、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントのサイズおよび位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度をそれぞれ周期的に決定し、
前記長期シンタックス要素構造があり得る値の前記第1のセットに素なあり得る値の第2のセット(例えばmin_spatial_segment_delay=0)の値にセットされる場合、前記所定期間よりも短い時間間隔において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく前記所定期間内に前記インターレイヤオフセットを周期的に決定し、
前記長期シンタックス要素構造があり得る値の前記第1および第2のセットに素なあり得る値の第3のセット(例えばctb_delay_enabled_flag=1、min_spatial_segment_delay≠0)の値にセットされる場合、前記第1のブロックを単位とした前記インターレイヤオフセットの前記決定を実行し、前記第1のレイヤの前記画像の前記第1のブロックおよび前記第2のレイヤの前記画像の前記第2のブロックの前記サイズおよび位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度の周期的な決定をそれぞれ実行する、
ように、前記マルチレイヤビデオデータストリームの前記長期シンタックス要素を検査する、請求項63に記載のビデオデコーダ。 - 前記ビデオデコーダは、前記レイヤの画像が分割され前記第1および第2のブロックの行から構成された以外のサブストリームにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記第2のレイヤの画像のサブストリームの前記横断と関連して前記第1のレイヤの画像のサブストリームの前記横断の間に前記同じ画像およびインターレイヤオフセットの直接連続したサブストリームの前記横断の間にイントラピクチャインターサブストリーム遅延を有する時間重畳態様における前記サブストリームを順次横断することによって、波面並列処理を使用する、請求項63または64に記載のビデオデコーダ。
- 前記長期シンタックス要素構造がユニットフラグ(手本としてctb_delay_enabled_flagと比較)および遅延インジケータ(手本としてmin_spatial_segment_delayと比較)を含み、前記ビデオデコーダは、前記長期シンタックス要素構造を調査する際に、
前記遅延インジケータを、同上がゼロまたはそれ以外にセットされるかに関して決定するために調査し、
前記遅延インジケータがゼロにセットされた場合、前記長期シンタックス要素構造の値が前記第2のセットの値にセットされ、かつ、
前記遅延インジケータがゼロ以外の値にセットされた場合、前記長期シンタックス要素構造の前記値を決定するために前記ゼロ以外の値を使用し、かつ前記ユニットフラグがゼロの場合、前記長期シンタックス要素構造の前記値が前記第1のセットの値にセットされ、かつ前記ユニットフラグが1の場合、前記長期シンタックス要素構造の前記値が前記第3のセットの値にセットされることを決定する、請求項64ないし65のいずれかに記載
のビデオデコーダ。 - 第1および第2のレイヤの並列復号化を開始する際に前記インターレイヤオフセットに依存するように構成されている、請求項65ないし66のいずれかに記載のビデオデコーダ。
- 前記第1のレイヤの空間セグメントの数sまたは符号化ブロックが前記シンタックス要素構造に一意的に従属して数sによって完全に復号化されるかに関してチェックし、かつ、前記第1のレイヤの空間セグメントまたは符号化ブロックの間で、少なくともsが完全に復号化されたことが前記チェックで判明しない限り、前記第1のレイヤを復号化する間、前記第2のレイヤを復号化するのを開始することを延期するように構成されている、請求項62ないし67のいずれかに記載のビデオデコーダ。
- 開始する際にインターレイヤオフセットに依存し、かつ第1および第2のレイヤの並列復号化を完全に処理するように構成された、請求項62ないし68のいずれかに記載のビデオデコーダ。
- 前記第1のレイヤの空間セグメントの数sまたは符号化ブロックが前記シンタックス要素構造に一意的に従属して数sによって、および、前記第2のレイヤの既に復号化された空間セグメントまたは符号化ブロックの数t−1によって完全に復号化されるかに関してチェックし、前記第1のレイヤの空間セグメントまたは符号化ブロックの第1のレイヤの間で、少なくともsが完全に復号化されたことが判明しない限り、第1のレイヤを復号化することの間、第2のレイヤの第tの空間セグメントまたは符号化ブロックを復号化するのを開始することを延期するように構成されている、請求項62ないし69のいずれかに記載のビデオデコーダ。
- シーンが第1のレイヤから第2のレイヤまでインターレイヤ予測を使用してレイヤの階層において符号化されたマルチレイヤビデオデータストリーム(40)を復号化する方法であって、
前記ビデオデコーダは、前記レイヤの画像(12、15)が再分割される空間セグメント(80)における前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記方法は、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造(606;例えばtile_boundaries_aligned_flag)を検査し、
前記第2のレイヤの前記画像の前記空間セグメントの間の境界が前記第1のレイヤの前記画像(12)の前記空間セグメントの各境界に重畳し、かつ、前記マルチレイヤビデオデータストリームの短期シンタックス要素(602;例えば、column_width_minus1[i]およびcolumn_width_minus1[i])に基づく前記空間セグメントへの前記第1のレイヤおよび前記第2のレイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔(604)で、周期的に決定するように、前記所定期間(608)の間、前記第2のレイヤの前記画像(608)が再分割される保証として第1のあり得る値のセット(例えばtile_boundaries_aligned_flag=1)から値を仮定する前記長期シンタックス要素構造を解釈し、かつ、
前記長期シンタックス要素構造が、第2のあり得る値のセット(例えばtile_boundaries_aligned_flag=0)から値を仮定した場合、少なくとも前記短期シンタックス要素の第1のあり得る値に対し、前記第1のレイヤの前記空間セグメントの前記境界のいずれかを覆わない前記第2のレイヤの前記画像の前記空間セグメントの間の境界、および、少なくとも前記短期シンタックス要素の第2のあり得る値に対し、前記第1のレイヤの前記空間セグメントの各境界に重畳する前記第2のレイヤの前記画像の前記空間セグメントの間の境界が存在するように、前記マルチレイヤビデオデータス
トリームの前記短期シンタックス要素から前記空間セグメントへの前記レイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔で、周期的に決定する、方法。 - 前記マルチレイヤビデオデータストリームが前記レイヤの画像が再分割される空間セグメントにおいて並列に復号化可能であるように、第1のレイヤから第2のレイヤまでインターレイヤ予測を使用してレイヤの階層におけるマルチレイヤビデオデータストリームにシーンを符号化する方法であって、前記方法は、
長期シンタックス要素構造(606)および短期シンタックス要素(602)を前記マルチレイヤビデオデータストリームに挿入し、前記短期シンタックス要素は、前記第1のレイヤおよび前記第2のレイヤの前記画像の前記空間セグメントへの前記再分割を、時間間隔において、定義しており、かつ、
前記長期シンタックス要素構造を設定する間で切替え、
前記時間間隔より長い所定期間(608)の間、第1のあり得る値のセットからの値は、前記短期シンタックス要素をあり得る設定のセットからの適切なサブセットに設定しながら、前記第2のレイヤの前記画像の前記空間セグメントの間の境界は前記第1のレイヤの前記空間セグメントの各境界に重畳するように、前記適切なサブセットは、前記所定期間の間に、前記第2のレイヤの前記画像が再分割されるように選択され、
前記所定期間の間、第2のあり得る値のセットからの値は、あり得る設定の前記セットのいずれかに前記短期シンタックス要素を設定しながら、前記あり得る設定のセットは、前記第1のレイヤの前記空間セグメントの前記境界のいずれかに重畳しない前記第2のレイヤの前記画像の前記空間セグメントの間に境界が存在することにより、少なくとも1つの設定を、および、前記第2のレイヤの前記画像の前記空間セグメントの間の境界が前記第1のレイヤの前記空間セグメントの各境界に重畳することによる少なくとも他の設定を含む、ように切替えることを含む、方法。 - 画像がさまざまな空間レイヤにおいてかつ前記空間レイヤの少なくとも1つに対し、第1の空間セグメントにおいて、符号化される空間スケーラブルビットストリーム(40)を復号化するための方法であって、
前記方法は、
前記第1の空間セグメントに依存する、前記アップサンプリングされた基準画像の分割(622)の任意の分割は、前記分割の任意の他の分割により覆われた前記第1の空間レイヤの前記画像の部分から独立するように、あるいは、
前記アップサンプリングされた基準ピクチャの前記分割(622)の任意の部分は、前記それぞれの分割に空間的に隣接する前記分割の他の分割により覆われた前記第1の空間レイヤの前記画像の部分に従属するように、
アップサンプリングされた基準画像を得るために第1の空間レイヤの画像(12)をアップサンプリングし、かつ前記アップサンプリングされた基準画像を使用して第2の空間レイヤの画像(15)を予測し、前記復号化のための方法は、前記シンタックス要素に従属して、前記第1の空間レイヤの前記画像を補間(620)するために、空間スケーラブルビットストリームにおけるシンタックス要素(616;例えばindependent_tile_upsampling_idc)に応答することを含む方法。 - 第1の空間セグメントにおいて、画像をさまざまな空間レイヤにおけるかつ空間レイヤの少なくとも1つに対しスケーラブルビットストリームに符号化するための方法であって、
前記方法は、
前記第1の空間セグメントに依存する、前記アップサンプリングされた基準画像の分割の任意の部分は、前記分割の前記他の部分のいずれかにより覆われた前記第1の空間レイヤの前記画像の部分から独立しているように、
前記アップサンプリングされた基準画像の前記分割の任意の部分は、前記それぞれの部
分に空間的に隣接する前記分割の他の部分により覆われた前記第1の空間レイヤの前記画像の部分に従属しているように、
アップサンプリングされた基準画像を得るために第1の空間レイヤの画像をアップサンプリングし、前記アップサンプリングされた基準画像を使用して第2の空間レイヤの画像を予測し、前記方法は、シンタックス要素(606)を空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に依存して前記第1の空間レイヤの前記画像を補間することを含む、方法。 - シーンが第1のレイヤから第2のレイヤまでインターレイヤ予測を使用してレイヤの階層において符号化されたマルチレイヤビデオデータストリームを復号化する方法であって、前記ビデオデコーダは、前記第2のレイヤの画像の空間セグメントの前記横断に関連して前記第1のレイヤの画像の空間セグメントの前記横断の間インターレイヤ遅延を有する時間重畳態様における前記空間セグメントを順次横断することによりレイヤの画像が分割された空間セグメントにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記方法は、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造(642;例えばmin_spatial_segment_delay)を検査し、
前記長期シンタックス要素構造(例えばmin_spatial_segment_delay≠0)があり得る値の第1のセットの値にセットされた場合、所定期間に対し前もって前記インターレイヤオフセットを決定するために前記長期シンタックス要素の前記値を使用し、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントのサイズおよび位置を、および、前記所定期間よりも短い時間間隔で、および前記マルチレイヤビデオデータストリームの短期シンタックス要素(602)にそれぞれ基づき前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の空間サンプリング解像度を、周期的に決定し、
前記長期シンタックス要素があり得る値の第1のセットと素なあり得る値の第2のセット(例えばmin_spatial_segment_delay=0)の値にセットされるとき、前記所定期間より短い時間間隔において、所定の時間より小さい時間間隔において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく所定期間内で前記インターレイヤオフセットを周期的に決定するのことを含む方法。 - マルチレイヤビデオデータストリームが、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間にインターレイヤオフセットを有する時間重畳態様において前記空間セグメントを順次横断することにより前記レイヤの画像が分割された空間セグメントに復号化可能なように第1のレイヤから第2のレイヤにインターレイヤ予測を使用してレイヤの階層においてシーンをマルチレイヤビデオデータストリームに符号化する方法であって、前記方法は、
長期シンタックス要素構造(min_spatial_segment_delay)および短期シンタックス要素を前記マルチレイヤビデオデータストリームに挿入およびセットし、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素は、定期的に、それぞれ前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの時間間隔、サイズ、位置において定義し、かつ、前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度を定義し、
前記方法は、セットの間を切替えるように構成され、
前記所定期間の間、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度が、前記第2のレイヤの画像の空間セグメントの前記横断に関連して前記第1のレイヤの画像の空間セグメントの前記横断の間前記長期シンタックス要素により示された前記インター
レイヤオフセットより短いまたは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより、それぞれ前記マルチレイヤビデオデータストリームの復号化を可能にするように、前記時間間隔より長い所定期間に対し前記インターレイヤオフセットを示す前記値を有し、所定期間に対し、あり得る一連のセットから適切なサブセットへ前記短期シンタックス要素を、セットして、前記適切なサブセットが選択され、あり得る値の第1のセットの値への前記長期シンタックス要素構造(min_spatial_segment_delay≠0)をセットし、
前記所定期間の間、あり得る値の第2のセット(min_spatial_segment_delay=0)の値への前記長期シンタックス要素は、あり得る値の前記第1のセットと素であり、前記短期シンタックス要素を可能な一連のセットのいずれかにセットし、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも1つのセットを含むあり得る一連のセットは、それぞれ、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を不可にし、かつ、前記第1のレイヤの前記画像の前記空間セグメントおよび前記第2のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第1のレイヤの前記画像および前記第2のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも1つの他のセットは、それぞれ、前記第2のレイヤの画像の空間セグメントの前記横断に関連する前記第1のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を可能にするようにセットすることを含む、方法。 - 各レイヤにおいて、前記シーンがスケーラビリティ次元によって測定されるスケーラビリティ空間の異なる運転点において符号化されるように、シーンがレイヤにおいて符号化されるマルチレイヤビデオデータストリームを処理するための方法であって、前記マルチレイヤビデオデータストリームは、その各々が前記レイヤの1つと関連した第1のNALユニット、および、前記第1のNALユニット内で散在して、前記マルチレイヤビデオデータストリームに関する一般情報を表す第2のNALユニットを含む方法であって、前記方法は、
前記第2のNALユニットにおいて、タイプインジケータフィールド(696、例えばdedicated_scalability_ids_flag)を検査し;
前記タイプインジケータフィールドに第1の状態(例えばdedicated_scalability_ids_flag=0)がある場合、前記第2のNALユニットから前記運転点まで前記第1のNALユニットヘッダにおけるレイヤインジケータフィールド(例えばlayer_id)のあり得る値をマップしているマッピング情報(例えばlayer_id_in_nuh[i],dimension_id[i][j])を読み込んで、前記レイヤインジケータフィールドおよび前記マッピング情報を介して前記第1のNALユニットを前記第1のNALユニットの前記運転点と関連させ;
前記タイプインジケータフィールドに第2の状態(dedicated_scalability_ids_flag=1)がある場合、前記第1のNALユニットにおける前記レイヤインジケータフィールドを1つ以上の部分に分割することにより、および、前記スケーラビリティ空間内でベクトルの座標として前記部分の前記値を使用することにより、前記第1のNALユニットの前記運転点を配置することで、前記第1のNALユニットを前記運転点に関連させることを含む方法。 - 各レイヤにおいて、前記シーンはスケーラビリティ次元によって測定されたスケーラビリティ空間の様々な運転点において符号化されるように、シーンをレイヤにおけるマルチレイヤビデオデータストリームに符号化するための方法であって、前記マルチレイヤビデオデータストリームは、前記レイヤの1つと各々が関連した第1のNALユニットおよび前記第1のNALユニット内に散在し前記マルチレイヤビデオデータストリームに関する一般の情報を表す第2のNALユニットを含み、前記方法は、
タイプインジケータフィールドを前記第2のNALユニットに挿入しかつ、
同上が前記運転点への前記第1のNALユニットヘッダにおけるレイヤインジケータフィールドのあり得る値を前記第2のNALユニットにマッピングするマップ情報を挿入して第1の状態を有するように前記タイプインジケータフィールドをセットし、かつ、前記第1のNALユニットの運転点は、前記マップ情報により、前記それぞれのレイヤインジケータフィールドに関連するように、前記第1のNALユニットにおける前記レイヤインジケータフィールドをセットし、
同上が前記第1のNALユニットにおける前記レイヤインジケータフィールドを1つ以上の部分に分割することにより前記第1のNALユニットにおける前記レイヤインジケータフィールドをセットして第2の状態(dedicated_scalability_ids_flag=1)を有するように前記タイプインジケータフィールドをセットし、かつ、前記スケーラビリティの範囲内で、ベクトルの座標に対応する前記部分の前記値が、前記それぞれの第1のNALユニットに関連する前記運転点を示すように前記以上の部分をセットする、
間で切替えることを含む、方法。 - シーンがレイヤに符号化されるマルチレイヤビデオデータストリームを対象とし、マルチ規格マルチレイヤデコーダにより復号化し、前記マルチレイヤビデオデータストリームは、レイヤの1つと各々が関連したNALユニットより構成され、前記レイヤは、前記それぞれのレイヤが関連する様々なコーデックを使用して前記それぞれのレイヤに関連したNALユニットが符号化されるように様々なコーデックと関連する方法であって、前記方法は、
各NALユニットごとに、どのコーデックが関連しているかを確認し、かつ、
前記マルチレイヤビデオデータストリームのNALユニットを、前記マルチレイヤビデオデータストリームを復号化するために様々なコーデックと関連したレイヤの間にインターレイヤ予測を使用する前記マルチ規格マルチレイヤデコーダに渡すこと、を含む方法。 - マルチレイヤビデオデータストリームを、シーンが第1のレイヤの部分から第2のレイヤの同じ位置に配置された部分までインターレイヤ予測を使用してレイヤの階層において符号化され、前記第1のレイヤの画像が第1のブロックの配列に再分割され、かつ、前記第2のレイヤの画像が第2のブロックの配列に再分割され、ラスタースキャン復号化順序が、前記第1のブロックおよび前記第2のブロックの間でそれぞれ定義されるように復号化する方法であって、前記方法は、
前記マルチレイヤビデオデータストリームのシンタックス要素構造(例えばctb_delay_enabled_flag、min_spatial_segment_delay)に応じて、前記第2のレイヤの画像の空間的な第2のブロックの前記横断に関連して前記第1のレイヤの画像の第1のブロックの前記横断の間前記インターレイヤオフセットを有する時間重畳態様における前記第1および第2のブロックを順次横断することにより、前記第1および第2のレイヤの前記画像を並列復号化するための、前記第1のブロックを単位として測定されたインターレイヤオフセットを決定することを含む、方法。 - コンピュータが請求項71〜80のいずれかに記載の方法で動くときに、実行するためのプログラムコードを有するコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022128875A JP7524259B2 (ja) | 2013-01-04 | 2022-08-12 | 効率的なスケーラブル符号化概念 |
JP2024084028A JP2024116170A (ja) | 2013-01-04 | 2024-05-23 | 効率的なスケーラブル符号化概念 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361749042P | 2013-01-04 | 2013-01-04 | |
US61/749,042 | 2013-01-04 | ||
US201361809605P | 2013-04-08 | 2013-04-08 | |
US61/809,605 | 2013-04-08 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018206897A Division JP6839158B6 (ja) | 2013-01-04 | 2018-11-01 | 効率的なスケーラブル符号化概念 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022128875A Division JP7524259B2 (ja) | 2013-01-04 | 2022-08-12 | 効率的なスケーラブル符号化概念 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021078156A true JP2021078156A (ja) | 2021-05-20 |
JP7126332B2 JP7126332B2 (ja) | 2022-08-26 |
Family
ID=51062164
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015551183A Active JP6430961B2 (ja) | 2013-01-04 | 2014-01-04 | 効率的なスケーラブル符号化概念 |
JP2018206897A Active JP6839158B6 (ja) | 2013-01-04 | 2018-11-01 | 効率的なスケーラブル符号化概念 |
JP2021020886A Active JP7126332B2 (ja) | 2013-01-04 | 2021-02-12 | 効率的なスケーラブル符号化概念 |
JP2022128875A Active JP7524259B2 (ja) | 2013-01-04 | 2022-08-12 | 効率的なスケーラブル符号化概念 |
JP2024084028A Pending JP2024116170A (ja) | 2013-01-04 | 2024-05-23 | 効率的なスケーラブル符号化概念 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015551183A Active JP6430961B2 (ja) | 2013-01-04 | 2014-01-04 | 効率的なスケーラブル符号化概念 |
JP2018206897A Active JP6839158B6 (ja) | 2013-01-04 | 2018-11-01 | 効率的なスケーラブル符号化概念 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022128875A Active JP7524259B2 (ja) | 2013-01-04 | 2022-08-12 | 効率的なスケーラブル符号化概念 |
JP2024084028A Pending JP2024116170A (ja) | 2013-01-04 | 2024-05-23 | 効率的なスケーラブル符号化概念 |
Country Status (6)
Country | Link |
---|---|
US (5) | US10104386B2 (ja) |
EP (3) | EP3809707B1 (ja) |
JP (5) | JP6430961B2 (ja) |
KR (5) | KR20230080500A (ja) |
CN (8) | CN116320392A (ja) |
WO (1) | WO2014106651A1 (ja) |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103718553B (zh) * | 2011-08-11 | 2017-03-01 | 太阳专利托管公司 | 图像编码方法、图像解码方法、图像编码装置、图像解码装置及图像编码解码装置 |
EP2868094A1 (en) * | 2012-06-29 | 2015-05-06 | Telefonaktiebolaget LM Ericsson (PUBL) | Apparatus and methods thereof for video processing |
US9294776B2 (en) * | 2013-03-05 | 2016-03-22 | Qualcomm Incorporated | Parallel processing for video coding |
KR102309086B1 (ko) * | 2013-03-21 | 2021-10-06 | 소니그룹주식회사 | 화상 부호화 장치 및 방법과, 화상 복호 장치 및 방법 |
KR20140122191A (ko) * | 2013-04-05 | 2014-10-17 | 삼성전자주식회사 | 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치 |
JP6261215B2 (ja) * | 2013-07-12 | 2018-01-17 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
US9628792B2 (en) * | 2013-07-15 | 2017-04-18 | Qualcomm Incorporated | Cross-layer parallel processing and offset delay parameters for video coding |
CA2916892A1 (en) * | 2013-07-22 | 2015-01-29 | Sony Corporation | Information processing apparatus and method |
WO2015014773A1 (en) | 2013-07-29 | 2015-02-05 | Koninklijke Kpn N.V. | Providing tile video streams to a client |
CN105519115A (zh) | 2013-09-10 | 2016-04-20 | 株式会社Kt | 用于对可扩展视频信号进行编码/解码的方法及装置 |
WO2015047162A1 (en) * | 2013-09-26 | 2015-04-02 | Telefonaktiebolaget L M Ericsson (Publ) | Hybrid codec scalable video |
CN105723712B (zh) | 2013-10-14 | 2019-06-28 | 韩国电子通信研究院 | 基于多层的图像编码/解码方法和设备 |
US9706228B2 (en) * | 2013-10-15 | 2017-07-11 | Qualcomm Incorporated | Support for large numbers of views in multi-layer coding |
US9794626B2 (en) * | 2014-05-01 | 2017-10-17 | Qualcomm Incorporated | Partitioning schemes in multi-layer video coding |
WO2015168581A1 (en) * | 2014-05-01 | 2015-11-05 | Arris Enterprises, Inc. | Reference layer and scaled reference layer offsets for scalable video coding |
KR101953679B1 (ko) | 2014-06-27 | 2019-03-04 | 코닌클리즈케 케이피엔 엔.브이. | Hevc-타일드 비디오 스트림을 기초로 한 관심영역 결정 |
EP3162075B1 (en) | 2014-06-27 | 2020-04-08 | Koninklijke KPN N.V. | Hevc-tiled video streaming |
JP6555263B2 (ja) * | 2014-06-30 | 2019-08-07 | ソニー株式会社 | 情報処理装置および方法 |
US20160014415A1 (en) * | 2014-07-08 | 2016-01-14 | Mediatek Inc. | Method and apparatus for performing wave-front parallel encoding procedure with constraint on coding mode and/or quantization parameter selection |
US10523957B2 (en) * | 2014-10-08 | 2019-12-31 | Vid Scale, Inc. | Optimization using multi-threaded parallel processing framework |
GB2532420A (en) * | 2014-11-18 | 2016-05-25 | Sony Corp | Data encoding and decoding |
US10444931B2 (en) | 2017-05-09 | 2019-10-15 | Google Llc | Vantage generation and interactive playback |
US10440407B2 (en) | 2017-05-09 | 2019-10-08 | Google Llc | Adaptive control for immersive experience delivery |
US10412373B2 (en) | 2015-04-15 | 2019-09-10 | Google Llc | Image capture for virtual reality displays |
US10567464B2 (en) | 2015-04-15 | 2020-02-18 | Google Llc | Video compression with adaptive view-dependent lighting removal |
US10419737B2 (en) | 2015-04-15 | 2019-09-17 | Google Llc | Data structures and delivery methods for expediting virtual reality playback |
US10546424B2 (en) * | 2015-04-15 | 2020-01-28 | Google Llc | Layered content delivery for virtual and augmented reality experiences |
US10469873B2 (en) | 2015-04-15 | 2019-11-05 | Google Llc | Encoding and decoding virtual reality video |
US10540818B2 (en) | 2015-04-15 | 2020-01-21 | Google Llc | Stereo image generation and interactive playback |
WO2016180486A1 (en) * | 2015-05-12 | 2016-11-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Composite scalable video streaming |
US10715843B2 (en) | 2015-08-20 | 2020-07-14 | Koninklijke Kpn N.V. | Forming one or more tile streams on the basis of one or more video streams |
CN114697679A (zh) | 2015-09-11 | 2022-07-01 | 株式会社Kt | 图像解码方法、图像编码方法和包括比特流的设备 |
WO2017060423A1 (en) * | 2015-10-08 | 2017-04-13 | Koninklijke Kpn N.V. | Enhancing a region of interest in video frames of a video stream |
US10467006B2 (en) * | 2015-12-20 | 2019-11-05 | Intel Corporation | Permutating vector data scattered in a temporary destination into elements of a destination register based on a permutation factor |
CA3013111C (en) * | 2016-02-02 | 2022-08-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Scene section and region of interest handling in video streaming |
CN113347442B (zh) * | 2016-02-09 | 2022-08-23 | 弗劳恩霍夫应用研究促进协会 | 用于对编码有图片的数据流进行解码的方法 |
CN109076216B (zh) * | 2016-03-30 | 2023-03-31 | 韩国电子通信研究院 | 使用画面划分信息对视频进行编码和解码的方法和设备 |
US10171825B1 (en) * | 2016-04-27 | 2019-01-01 | Matrox Graphics Inc. | Parallel compression of image data in a compression device |
CN109565611B (zh) * | 2016-05-26 | 2021-12-21 | 弗劳恩霍夫应用研究促进协会 | 针对交互式客户端的全景视频的广播流 |
JP2018107500A (ja) * | 2016-12-22 | 2018-07-05 | キヤノン株式会社 | 符号化装置、符号化方法及びプログラム、復号装置、復号方法及びプログラム |
US10602239B2 (en) * | 2017-03-23 | 2020-03-24 | Mediatek Inc. | Method and apparatus for track composition |
CA3059870A1 (en) * | 2017-04-11 | 2018-10-18 | Vid Scale, Inc. | 360-degree video coding using face continuities |
US10474227B2 (en) | 2017-05-09 | 2019-11-12 | Google Llc | Generation of virtual reality with 6 degrees of freedom from limited viewer data |
CN116248863A (zh) * | 2017-07-03 | 2023-06-09 | 汉阳大学校产学协力团 | 利用包含追加区域的分割单位的影像解码方法以及装置 |
US11297339B2 (en) * | 2017-12-06 | 2022-04-05 | V-Nova International Limited | Methods and apparatuses for hierarchically encoding and decoding a bytestream |
CN112640455B (zh) | 2018-06-21 | 2024-06-14 | 瑞典爱立信有限公司 | 视频编码中具有子图块的图块分区 |
CN118590646A (zh) * | 2018-06-21 | 2024-09-03 | 瑞典爱立信有限公司 | 灵活图块分区 |
KR102695519B1 (ko) | 2018-07-02 | 2024-08-14 | 삼성전자주식회사 | 영상 모델 구축 장치 및 방법 |
CN110677645B (zh) * | 2018-07-02 | 2022-06-10 | 华为技术有限公司 | 一种图像预测方法及装置 |
CN112352421A (zh) * | 2018-07-25 | 2021-02-09 | 麦克赛尔株式会社 | 自动影像编导装置、自动影像编导方法和用于其的影像存储介质 |
US10375416B1 (en) * | 2018-09-05 | 2019-08-06 | Tencent America LLC | Segment types in video coding |
EP4422175A2 (en) * | 2018-09-14 | 2024-08-28 | Huawei Technologies Co., Ltd. | Slicing and tiling in video coding |
GB201817781D0 (en) * | 2018-10-31 | 2018-12-19 | V Nova Int Ltd | Mehods, apparatuses, computer programs and computer-readable media |
EP3891994A1 (en) * | 2018-12-07 | 2021-10-13 | InterDigital VC Holdings, Inc. | Managing coding tools combinations and restrictions |
US11606555B2 (en) * | 2018-12-20 | 2023-03-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for video coding using uniform segment split in pictures |
US11310516B2 (en) * | 2018-12-21 | 2022-04-19 | Hulu, LLC | Adaptive bitrate algorithm with cross-user based viewport prediction for 360-degree video streaming |
CN109819272B (zh) * | 2018-12-26 | 2022-09-16 | 平安科技(深圳)有限公司 | 视频发送方法、装置、计算机可读存储介质及电子设备 |
KR20210107128A (ko) | 2019-01-09 | 2021-08-31 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 비디오 인코더, 비디오 디코더 및 대응하는 방법 |
JP7285857B2 (ja) * | 2019-01-16 | 2023-06-02 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | リマインダをもつ均一なタイルスプリットを含むビデオコーディング |
CN113491117A (zh) | 2019-03-08 | 2021-10-08 | 北京达佳互联信息技术有限公司 | 用于处理不同图片尺寸的视频编解码 |
CN114666596A (zh) * | 2019-03-11 | 2022-06-24 | 杜比实验室特许公司 | 帧速率可伸缩视频编码 |
US10924751B2 (en) * | 2019-03-18 | 2021-02-16 | Tencent America LLC | Data unit and parameter set design for point cloud coding |
CN113785575A (zh) * | 2019-03-21 | 2021-12-10 | 佳稳电子有限公司 | 处理图片分割的影像编码方法、影像解码方法及其装置 |
BR112021022307A2 (pt) | 2019-05-13 | 2021-12-28 | Beijing Bytedance Network Tech Co Ltd | Método de processamento de dados de vídeo, aparelho para processamento de dados de vídeo, meios de armazenamento e de gravação não transitórios legíveis por computador |
CN118678086A (zh) * | 2019-05-15 | 2024-09-20 | 现代自动车株式会社 | 用于运动图像数据的并行编码和解码的方法 |
CN113853787B (zh) | 2019-05-22 | 2023-12-22 | 北京字节跳动网络技术有限公司 | 基于子块使用变换跳过模式 |
US11523185B2 (en) | 2019-06-19 | 2022-12-06 | Koninklijke Kpn N.V. | Rendering video stream in sub-area of visible display area |
WO2021027774A1 (en) | 2019-08-10 | 2021-02-18 | Beijing Bytedance Network Technology Co., Ltd. | Subpicture dependent signaling in video bitstreams |
JP7411787B2 (ja) * | 2019-09-23 | 2024-01-11 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | セグメント存在情報を提供すること |
WO2021063420A1 (en) | 2019-10-02 | 2021-04-08 | Beijing Bytedance Network Technology Co., Ltd. | Slice level signaling in video bitstreams that include sub-pictures |
CN114631317B (zh) | 2019-10-18 | 2024-03-15 | 北京字节跳动网络技术有限公司 | 子图片的参数集信令中的语法约束 |
US12058335B2 (en) | 2019-11-22 | 2024-08-06 | Lg Electronics Inc. | Image coding method based on entry point-related information in video or image coding system |
CN114930855A (zh) | 2019-11-28 | 2022-08-19 | Lg 电子株式会社 | 用于图像/视频编译的切片和拼块配置 |
US20230041024A1 (en) * | 2019-12-23 | 2023-02-09 | Lg Electronics Inc. | Image coding device and method |
KR20220100048A (ko) * | 2019-12-23 | 2022-07-14 | 엘지전자 주식회사 | 가상 경계 기반 영상 코딩 장치 및 방법 |
KR102477310B1 (ko) * | 2020-12-29 | 2022-12-12 | 재단법인 경주스마트미디어센터 | Drm 콘텐츠 병렬 패키징 장치 및 이를 포함하는 drm 콘텐츠 병렬 패키징 시스템 및 drm 콘텐츠 병렬 패키징 방법 |
KR102302755B1 (ko) * | 2019-12-30 | 2021-09-16 | 재단법인 경주스마트미디어센터 | Drm 콘텐츠 병렬 패키징 장치 및 이를 포함하는 drm 콘텐츠 병렬 패키징 시스템 및 drm 콘텐츠 병렬 패키징 방법 |
CN115280768A (zh) * | 2020-01-13 | 2022-11-01 | 抖音视界有限公司 | 视频编解码中的子图片边界滤波 |
US20230139792A1 (en) * | 2020-03-20 | 2023-05-04 | Hfi Innovation Inc. | Method and Apparatus for Signaling Tile and Slice Partition Information in Image and Video Coding |
CN111901610B (zh) * | 2020-08-03 | 2021-09-21 | 西北工业大学 | 一种基于多层编码器的并行图像描述方法 |
EP4209009A1 (en) * | 2020-09-04 | 2023-07-12 | Telefonaktiebolaget LM ERICSSON (PUBL) | Split rendering to improve tolerance to delay variation in extended reality applications with remote rendering |
GB2628070A (en) * | 2021-11-22 | 2024-09-11 | V Nova Int Ltd | Processing a multi-layer video stream |
GB2613015B (en) * | 2021-11-22 | 2024-10-23 | V Nova Int Ltd | Decoding a multi-layer video stream using a joint packet stream |
US20230224347A1 (en) * | 2022-01-11 | 2023-07-13 | Tencent America LLC | Splitter and merger functions for multidimensional segmented media data |
US20240089510A1 (en) * | 2022-09-02 | 2024-03-14 | Sharp Kabushiki Kaisha | Systems and methods for signaling neural network post-filter characteristics information in video coding |
WO2024161288A1 (en) * | 2023-01-30 | 2024-08-08 | Six Impossible Things Before Breakfast Limited | Systems and methods for creating efficient progressive images |
CN116723333B (zh) * | 2023-08-02 | 2023-10-31 | 清华大学 | 基于语义信息的可分层视频编码方法、装置及产品 |
CN117520471B (zh) * | 2024-01-06 | 2024-05-03 | 深圳市城市规划设计研究院股份有限公司 | 一种空间要素信息查询方法、系统、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007067552A (ja) * | 2005-08-29 | 2007-03-15 | Nippon Telegr & Teleph Corp <Ntt> | 階層間予測処理方法,階層間予測処理装置,階層間予測処理プログラムおよびその記録媒体 |
WO2007064347A2 (en) * | 2005-03-18 | 2007-06-07 | Sharp Laboratories Of America | Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding |
WO2008047300A2 (en) * | 2006-10-16 | 2008-04-24 | Nokia Corporation | System and method for using parallelly decodable slices for multi-view video coding |
WO2012167711A1 (en) * | 2011-06-10 | 2012-12-13 | Mediatek Inc. | Method and apparatus of scalable video coding |
WO2012167712A1 (en) * | 2011-06-10 | 2012-12-13 | Mediatek Inc. | Method and apparatus of scalable video coding |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69331174T2 (de) | 1992-06-29 | 2002-06-06 | Canon K.K., Tokio/Tokyo | Bildverarbeitungsvorrichtung |
JPH10336668A (ja) | 1997-06-02 | 1998-12-18 | Sharp Corp | 動きベクトル検出装置 |
JP4118049B2 (ja) | 2001-12-28 | 2008-07-16 | 株式会社リコー | 画像処理装置及び方法 |
ITMI20041971A1 (it) * | 2004-10-15 | 2005-01-15 | Uni Degli Studi Brescia | Metodo di codifica video scalabile |
KR100678907B1 (ko) * | 2005-07-12 | 2007-02-06 | 삼성전자주식회사 | 하위 계층의 복원 데이터를 사용하여 fgs 계층을 인코딩및 디코딩하는 방법 및 장치 |
KR100772868B1 (ko) * | 2005-11-29 | 2007-11-02 | 삼성전자주식회사 | 복수 계층을 기반으로 하는 스케일러블 비디오 코딩 방법및 장치 |
CN104125464A (zh) | 2005-12-08 | 2014-10-29 | 维德约股份有限公司 | 用于视频通信系统中的差错弹性和随机接入的系统和方法 |
BRPI0706362B1 (pt) | 2006-01-09 | 2019-10-01 | Interdigital Madison Patent Holdings | Método e aparelho para proporcionar modo de atualização de resolução reduzida para codificação de vídeo multivisão |
CN101371584B (zh) | 2006-01-09 | 2011-12-14 | 汤姆森特许公司 | 提供用于多视图视频编码的降低分辨率的更新模式的方法和装置 |
WO2008007006A2 (fr) * | 2006-07-10 | 2008-01-17 | France Telecom | Dispositif et procede de codage et de decodage echelonnables de flux de donnees d'images, signal et programme d'ordinateur correspondants |
US7535383B2 (en) * | 2006-07-10 | 2009-05-19 | Sharp Laboratories Of America Inc. | Methods and systems for signaling multi-layer bitstream data |
JP4956304B2 (ja) | 2006-08-08 | 2012-06-20 | キヤノン株式会社 | 画像符号化装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 |
US7756348B2 (en) | 2006-10-30 | 2010-07-13 | Hewlett-Packard Development Company, L.P. | Method for decomposing a video sequence frame |
US8054885B2 (en) * | 2006-11-09 | 2011-11-08 | Lg Electronics Inc. | Method and apparatus for decoding/encoding a video signal |
KR100896289B1 (ko) | 2006-11-17 | 2009-05-07 | 엘지전자 주식회사 | 비디오 신호의 디코딩/인코딩 방법 및 장치 |
KR20080066522A (ko) | 2007-01-11 | 2008-07-16 | 삼성전자주식회사 | 다시점 영상의 부호화, 복호화 방법 및 장치 |
CN103281563B (zh) | 2007-04-18 | 2016-09-07 | 汤姆森许可贸易公司 | 解码方法 |
BRPI0817420A2 (pt) | 2007-10-05 | 2013-06-18 | Thomson Licensing | mÉtodos e aparelho para incorporar informaÇço de usabilidade de vÍdeo (vui) em um sistema de codificaÇço de vÍdeo de méltiplas visualizaÇÕes (mvc) |
KR101436671B1 (ko) * | 2007-10-15 | 2014-09-02 | 톰슨 라이센싱 | 스케일러블 비디오에 대한 계층간 레시듀 예측을 위한 방법들 및 장치들 |
US8249142B2 (en) * | 2008-04-24 | 2012-08-21 | Motorola Mobility Llc | Method and apparatus for encoding and decoding video using redundant encoding and decoding techniques |
KR20110117075A (ko) * | 2009-01-29 | 2011-10-26 | 엘지전자 주식회사 | 경계 인트라 코딩을 이용한 비디오 신호 처리 방법 및 장치 |
JP5115498B2 (ja) | 2009-03-05 | 2013-01-09 | 富士通株式会社 | 画像符号化装置、画像符号化制御方法およびプログラム |
EP2499829B1 (en) | 2009-10-14 | 2019-04-17 | Dolby International AB | Methods and devices for depth map processing |
US8705624B2 (en) * | 2009-11-24 | 2014-04-22 | STMicroelectronics International N. V. | Parallel decoding for scalable video coding |
FR2955730A1 (fr) | 2010-01-25 | 2011-07-29 | Thomson Licensing | Procedes de codage et de decodage |
KR101584480B1 (ko) | 2010-04-13 | 2016-01-14 | 지이 비디오 컴프레션, 엘엘씨 | 평면 간 예측 |
US20110293004A1 (en) | 2010-05-26 | 2011-12-01 | Jicheng An | Method for processing motion partitions in tree-based motion compensation and related binarization processing circuit thereof |
KR101781254B1 (ko) * | 2010-08-11 | 2017-09-26 | 지이 비디오 컴프레션, 엘엘씨 | 멀티-뷰 신호 코덱 |
US20130162774A1 (en) * | 2010-09-14 | 2013-06-27 | Dong Tian | Compression methods and apparatus for occlusion data |
JP5738434B2 (ja) | 2011-01-14 | 2015-06-24 | ヴィディオ・インコーポレーテッド | 改善されたnalユニットヘッダ |
JP5747559B2 (ja) | 2011-03-01 | 2015-07-15 | 富士通株式会社 | 動画像復号方法、動画像符号化方法、動画像復号装置、及び動画像復号プログラム |
WO2013038679A1 (ja) * | 2011-09-13 | 2013-03-21 | パナソニック株式会社 | 符号化装置、復号装置、再生装置、符号化方法、及び復号方法 |
WO2013068564A1 (en) * | 2011-11-11 | 2013-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Effective wedgelet partition coding using spatial prediction |
US9294776B2 (en) * | 2013-03-05 | 2016-03-22 | Qualcomm Incorporated | Parallel processing for video coding |
US20160088305A1 (en) | 2013-04-17 | 2016-03-24 | Wilus Institute Of Standards And Technology Inc. | Method and apparatus for processing video signal |
-
2014
- 2014-01-04 KR KR1020237018023A patent/KR20230080500A/ko not_active Application Discontinuation
- 2014-01-04 CN CN202310265075.1A patent/CN116320392A/zh active Pending
- 2014-01-04 CN CN201811477939.1A patent/CN110062240B/zh active Active
- 2014-01-04 CN CN202310263865.6A patent/CN116347068A/zh active Pending
- 2014-01-04 EP EP20196003.6A patent/EP3809707B1/en active Active
- 2014-01-04 CN CN202310275945.3A patent/CN116366835A/zh active Pending
- 2014-01-04 KR KR1020207024491A patent/KR102331649B1/ko active IP Right Grant
- 2014-01-04 EP EP14700048.3A patent/EP2941891B1/en active Active
- 2014-01-04 CN CN202310271109.8A patent/CN116320393A/zh active Pending
- 2014-01-04 CN CN201480012232.7A patent/CN105144720B/zh active Active
- 2014-01-04 CN CN202310268467.3A patent/CN116708768A/zh active Pending
- 2014-01-04 JP JP2015551183A patent/JP6430961B2/ja active Active
- 2014-01-04 KR KR1020217038166A patent/KR102539065B1/ko active IP Right Grant
- 2014-01-04 KR KR1020177034815A patent/KR102149959B1/ko active IP Right Grant
- 2014-01-04 EP EP24174629.6A patent/EP4425922A2/en active Pending
- 2014-01-04 KR KR1020157020813A patent/KR101806216B1/ko active IP Right Grant
- 2014-01-04 CN CN202310265965.2A patent/CN116708767A/zh active Pending
- 2014-01-04 WO PCT/EP2014/050065 patent/WO2014106651A1/en active Application Filing
-
2015
- 2015-06-29 US US14/753,144 patent/US10104386B2/en active Active
-
2018
- 2018-09-06 US US16/123,184 patent/US10609396B2/en active Active
- 2018-11-01 JP JP2018206897A patent/JP6839158B6/ja active Active
-
2020
- 2020-02-20 US US16/795,632 patent/US11025928B2/en active Active
-
2021
- 2021-02-12 JP JP2021020886A patent/JP7126332B2/ja active Active
- 2021-04-27 US US17/241,855 patent/US11677966B2/en active Active
-
2022
- 2022-08-12 JP JP2022128875A patent/JP7524259B2/ja active Active
-
2023
- 2023-06-08 US US18/207,470 patent/US20230396782A1/en active Pending
-
2024
- 2024-05-23 JP JP2024084028A patent/JP2024116170A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007064347A2 (en) * | 2005-03-18 | 2007-06-07 | Sharp Laboratories Of America | Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding |
JP2007067552A (ja) * | 2005-08-29 | 2007-03-15 | Nippon Telegr & Teleph Corp <Ntt> | 階層間予測処理方法,階層間予測処理装置,階層間予測処理プログラムおよびその記録媒体 |
WO2008047300A2 (en) * | 2006-10-16 | 2008-04-24 | Nokia Corporation | System and method for using parallelly decodable slices for multi-view video coding |
WO2012167711A1 (en) * | 2011-06-10 | 2012-12-13 | Mediatek Inc. | Method and apparatus of scalable video coding |
WO2012167712A1 (en) * | 2011-06-10 | 2012-12-13 | Mediatek Inc. | Method and apparatus of scalable video coding |
Non-Patent Citations (3)
Title |
---|
C. ANDREW SEGALL, AND GARY J. SULLIVAN: "Spatial Scalability Within the H.264/AVC ScalableVideo Coding Extension", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 17, no. 9, JPN6020017865, September 2007 (2007-09-01), pages 1121 - 1135, XP011193020, ISSN: 0004732075, DOI: 10.1109/TCSVT.2007.906824 * |
H. SCHWARZ ET AL.: "Description of scalable video coding technology proposal by Fraunhofer HHI(Configuration A)", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-K0042, JPN6020017867, October 2012 (2012-10-01), pages 1 - 37, ISSN: 0004732076 * |
KARSTEN SUHRING ET AL.: "Indication of tile boundary alignment", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JCTVC-L0197, JPN6020017868, January 2013 (2013-01-01), pages 1 - 2, ISSN: 0004732077 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6839158B6 (ja) | 効率的なスケーラブル符号化概念 | |
JP7485639B2 (ja) | 効率的なマルチビュー/レイヤ符号化を可能とする符号化コンセプト | |
US9712837B2 (en) | Level definitions for multi-layer video codecs | |
CN116325759A (zh) | 用于处理媒体文件的方法及其设备 | |
CN116210223B (zh) | 媒体文件处理方法及其装置 | |
CN116210223A (zh) | 媒体文件处理方法及其装置 | |
CN116210225A (zh) | 生成媒体文件的方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210315 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7126332 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |