JP2021182742A - ベース層からの予測のためのサブブロックのサブ分割の導出を使用するスケーラブルビデオ符号化 - Google Patents

ベース層からの予測のためのサブブロックのサブ分割の導出を使用するスケーラブルビデオ符号化 Download PDF

Info

Publication number
JP2021182742A
JP2021182742A JP2021113786A JP2021113786A JP2021182742A JP 2021182742 A JP2021182742 A JP 2021182742A JP 2021113786 A JP2021113786 A JP 2021113786A JP 2021113786 A JP2021113786 A JP 2021113786A JP 2021182742 A JP2021182742 A JP 2021182742A
Authority
JP
Japan
Prior art keywords
prediction
base layer
block
signal
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021113786A
Other languages
English (en)
Other versions
JP7323578B2 (ja
Inventor
トビアス ヒンツ
Tobias Hinz
ハリチャラン ラクシュマン
Lakshman Haricharan
ヤン シュテーゲマン
Stegemann Jan
フィリップ ヘレ
Helle Philipp
ミーシャ ジークマン
Siekmann Mischa
カルステン ズューリング
Suehring Karsten
デトレフ マルペ
Detlev Marpe
ハイコ シュヴァルツ
Heiko Schwarz
クリスティアン バルトニク
Bartnik Christian
アブデルハミド アリ アテフ イブラヒム ハイラト
Atef Ibrahim Khairat Abdelhamid Ali
ハイナー キルヒホッファー
Kirchhoffer Heiner
トーマス ウィーガント
Thomas Wiegand
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GE Video Compression LLC
Original Assignee
GE Video Compression LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GE Video Compression LLC filed Critical GE Video Compression LLC
Publication of JP2021182742A publication Critical patent/JP2021182742A/ja
Priority to JP2023122307A priority Critical patent/JP2023159098A/ja
Application granted granted Critical
Publication of JP7323578B2 publication Critical patent/JP7323578B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • H04N19/865Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness with detection of the former encoding block subdivision in decompressed video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission

Abstract

【課題】より高い符号化効率を実現するスケーラブルビデオ符号化方法及びプルグラム並びにスケーラブルビデオエンコード及びデコーダを提供する。【解決手段】スケーラブルビデオ符号化は、ベース層信号200上でベース層符号化パラメータの空間的な変化を評価することによって、エンハンスメント層ブロックの可能なサブブロックのサブ分割のセットの中で、エンハンスメント層予測のために使用されるべきサブブロックのサブ分割の導出/選択をより効率的にする。少ない信号化オーバーヘッドが、エンハンスメント層データストリームの中で、このサブブロックのサブ分割にシグナリングするために費やされる。このようにして選択されたサブブロックのサブ分割を、エンハンスメント層信号を予測的に符号化/復号化する際に使用する。【選択図】図14

Description

本発明は、スケーラブルビデオ符号化に関する。
非スケーラブル(non−scalable)符号化において、イントラ符号化は、既に符号化された画像の参照データでなく、現在の画像の既に符号化された部分のデータ(例えば、再構築サンプル、符号化モード、またはシンボル統計)だけを利用する符号化技術を参照する。例えば、イントラ符号化された画像(イントラ画像)は、いわゆるランダムアクセスポイントで、デコーダをビットストリームに同調させるために、放送ビットストリーム内で使用される。また、イントラ画像は、エラー傾向がある環境内で、エラー伝播を制限するために使用される。一般に、参照画像として使用される画像は、ここでは入手できないので、符号化映像系列の最初の画像は、イントラ画像として符号化されなければならない。また、イントラ画像は、時間予測が適した予測信号を通常提供できない場面カットで使用される。
さらに、イントラ符号化モードは、いわゆるインター画像内で特定の領域/ブロックのために使用される。そこでは、それらは、レート歪み効率に対してインター符号化モードより良く実行する。これは、時間予測が相当不十分に行われる領域(オクルージョン、部分的にディソルブしたりフェードするオブジェクト)と同様に、平坦な領域内でよくある場合である。
スケーラブル(scalable)符号化において、イントラ符号化の概念(イントラ画像の符号化とインター画像内のイントラブロックの符号化)は、同じアクセスユニットまたは時刻に属する全ての画像に拡張される。従って、空間または品質エンハンスメント(enhancement)層のためのイントラ符号化モードは、符号化効率を増加させると同時に瞬時に、下位層画像から層間予測の使用をすることができる。それは、現在のエンハンスメント層の画像内で既に符号化された部分がイントラ予測のために使用できるだけではなく、同じ時刻に既に符号化された下位層画像も利用できることを意味する。また、後者の概念は、層間イントラ予測とも称される。
最先端のハイブリッドビデオ符号化規格(H.264/AVCまたはHEVCなど)において、ビデオ系列の画像はサンプルのブロックに区分される。ブロックのサイズは、固定されるか、または、符号化手法はブロックをさらに小さいブロックのサイズにサブ分割されることを許す階層構造を提供される。通常、ブロックの再構成は、ブロックの予測信号を発生させて、送信された残差信号を付加することによって得られる。通常、残差信号は、変換符号化を使用して、送信される。それは、変換係数のための量子化インデックスリスト(変換係数レベルとも称される)が、エントロピー符号化技術を使用して、送信されることを意味する。そして、デコーダ側では、予測信号に追加される残差信号を得るために、これら送信された変換係数レベルが、スケーリングされ、逆変換される。残差信号は、(現在の時刻のための既に送信されたデータのみを使用する)イントラ予測によって、または、(異なる時刻のために既に送信されたデータを使用する)インター予測によって発生する。
仮にインター予測が使用されるならば、予測ブロックは、既に再構成されたフレームのサンプルを使用して、動き補償予測によって得られる。これは、(1つの参照画像と1セットの動きパラメータを使用して、)単方向の予測によって行うことができる。あるいは、予測信号は、マルチ仮説予測によって発生することができる。後者の場合、2つ以上の予測信号が重畳される。すなわち、各サンプルに対して、重み付け平均が、最終予測信号を形成するために構成される。(重畳された)多重予測信号は、異なる仮説(例えば、異なる参照画像または動きベクトル)毎に異なる動きパラメータを使用して発生される。また、単方向の予測に対して、動き補償予測信号のサンプルに定数因子を掛けて、最終予測信号を形成するために一定のオフセットを加えることも可能である。また、このようなスケーリングとオフセット補正が、マルチ仮説予測において、全ての仮説に、または、選択された仮説にも使用される。
現在の技術レベルのビデオ符号化技術において、ブロックのためのイントラ予測信号が、現在のブロックの空間的近傍(それは、順に処理しているブロックに従って現在のブロックの前で再構成されたブロック)からサンプルを予測することによって得られる。最新の規格において、空間領域で予測を実行する様々な予測手法が、利用される。隣接ブロックのサンプルをフィルタにかけた、または、フィルタにかけなかった、精密な粒状の方向性予測モードが、予測信号を発生させるために、特定の角度に拡張される。更に、平坦な予測平面またはDC予測ブロックを発生させるために、隣接するブロックのサンプルを使用する平面に基づいたおよびDCに基づいた予測モードもある。
古いビデオ符号化規格(例えば、H.263、MPEG−4)において、イントラ予測は変換領域内で実行された。この場合、送信係数は逆量子化された。そして、変換係数のサブセット(subset)に対して、変換係数値は、隣接するブロックの対応する再構成された変換係数を使用して、予測された。逆量子化変換係数は、予測変換係数値に追加され、そして、再構成された変換係数は、逆変換に入力として使用された。逆変換の出力は、ブロックのための最終再構成信号を形成した。
スケーラブルビデオ符号化においても、ベース層情報は、エンハンスメント層のための予測過程を補助するために利用される。スケーラブル符号化のための最先端のビデオ符号化規格(H.264/AVCのSVC拡張)において、エンハンスメント層内でイントラ予測過程の符号化効率を向上させるための1つの追加モードがある。このモードは、マクロブロックレベル(16×16個のルマ(luma)のサンプルのブロック)でシグナリングされる。このモードは、下位層内の併置されたサンプルが、イントラ予測モードを使用して、符号化される場合にだけ、補助される。仮に、このモードが、品質エンハンスメント層内でマクロブロックのために選択されるならば、予測信号は、非ブロッキングフィルタ操作の前に、再構成された下位層信号の併置されたサンプルによって組み立てられる。仮に、層間イントラ予測モードが、空間エンハンスメント層内で選択されるならば、予測信号は、(非ブロッキングフィルタ操作の後で、)併置された再構成されたベース層信号を抽出することによって発生する。抽出するために、FIRフィルタが使用される。一般に、層間イントラ予測モードのためには、追加残差信号が変換符号化によって送信される。また、仮に、それがビットストリーム内で対応してシグナリングされるならば、残差信号の送信は省略できる(ゼロに等しいと推論される)。最終再構成信号が、(送信された変換係数レベルをスケーリングして、逆空間変換を適用することによって得られる)再構成された残差信号を予測信号に追加することによって得られる。
しかしながら、スケーラブルビデオ符号化において、より高い符号化効率を達成できることが好ましい。
従って、本発明の目的は、より高い符号化効率を実現するスケーラブルビデオ符号化のための概念を提供することである。
この目的は同時期に提出の書類に記載の独立請求項の内容によって達成される。
本発明の1つの実施の形態は、スケーラブルビデオ符号化が、ベース層信号の上でベース層符号化パラメータの空間的な変化を評価することによって、エンハンスメント層ブロックの可能なサブブロックのサブ分割のセット内で、エンハンスメント層予測のために使用されるべきサブブロックのサブ分割の導出/選択によって、より効率的にされる、ということである。このため、仮に、そうならば、少ない信号化オーバーヘッドが、エンハンスメント層データストリーム内で、このサブブロックのサブ分割にシグナリングするために費やされなければならない。このようにして選択されたサブブロックのサブ分割は、エンハンスメント層信号を予測的に符号化/復号化する際に使用される。
本発明の1つの実施の形態は、スケーラブルビデオ符号化内で、エンハンスメント層信号を予測的に符号化するための、より良い予測器(predictor)が、エンハンスメント層予測信号を得るために、異なる空間周波数成分に対して異なる重み付けの方法で、層間予測信号とエンハンスメント層イントラ予測信号とから、エンハンスメント層予測信号を形成することによって(すなわち、現在再構成されるべき部分で、層間予測信号とエンハンスメント層イントラ予測信号との重み付け平均を形成することによって)達成されるので、層間予測信号とエンハンスメント層イントラ予測信号がエンハンスメント層予測信号に寄与する重み付けが、異なる空間周波数成分を変化する、ということである。このため、個別の寄与成分(すなわち、一方で層間予測信号および他方でエンハンスメント層イントラ予測信号)のスペクトル特性に対して最適化された方法で、層間予測信号およびエンハンスメント層イントラ予測信号から、エンハンスメント層予測信号を解釈することが可能である。例えば、解像度または品質の改良に基づいて、層間予測信号が、再構成されたベース層信号から得られる。層間予測信号は、高周数波と比較して低周波数で、より正確である。エンハンスメント層イントラ予測信号に関する限り、特性は逆である。すなわち、その精度は、低周波数と比較して高周数波に対して増加する。この例では、低周波数では、層間予測信号のエンハンスメント層予測信号への寄与が、それぞれの重み付けで、エンハンスメント層イントラ予測信号のエンハンスメント層予測信号への寄与を超える。そして、高周波に関する限り、エンハンスメント層イントラ予測信号のエンハンスメント層予測信号への寄与を超えない。このため、より正確なエンハンスメント層予測信号が達成される。その結果、符号化効率が増加して、より高い圧縮率がもたらされる。
様々な実施の形態によって、異なる可能性が、ちょうど概説された概念を、概念に基づいたどんなスケーラブルビデオ符号化にも組み込むために説明される。例えば、重み付け平均の形成は空間領域または変換領域内のいずれかで形成される。スペクトル重み付け平均の実行は、個別の寄与(すなわち、層間予測信号とエンハンスメント層イントラ予測)で実行されるべき変換を必要とする。しかし、例えば、FIRまたはIIRフィルタリングを含む空間領域内の層間予測信号とエンハンスメント層イントラ予測信号とのいずれかをスペクトル的にフィルタにかけることを避ける。しかしながら、空間領域内のスペクトル重み付け平均の形成を実行することは、変換領域を経由して重み付け平均への個別の寄与の迂回路は避ける。領域が実際にスペクトル重み付け平均の形成を実行するために選択される決定は、スケーラブルビデオデータストリームが、エンハンスメント層信号内で現在構成されるべき部分に対して、変換係数の形式で残差信号を含んでいるか否かに依存している。仮に、含んでいなければ、変換領域を経由する迂回路は止められる。一方、残差信号が存在する場合、変換領域を経由する迂回路は、変換領域内の送信された残差信号に対して、変換領域内のスペクトル重み付け平均に直接に加算することを許容するので、更に有利である。
本発明の1つの実施の形態は、ベース層の符号化/復号化から利用可能な情報(すなわち、ベース層ヒント)が、より効率的にエンハンスメント層動き(motion)パラメータを符号化することによって、エンハンスメント層の動き補償予測をより効率的にすることに利用される、ということである。特に、エンハンスメント層信号のフレームの隣接する既に再構成されたブロックから集められた動きパラメータ候補セットは、おそらくベース層信号(エンハンスメント層のフレームのブロックに併置されたベース層信号)のブロックの1つ以上のベース層動きパラメータセットによって拡大される。その結果、動きパラメータ候補セットの利用可能な品質が、エンハンスメント層信号のブロックの動き補償予測が、拡張された動きパラメータ候補セットの動きパラメータ候補の1つを選択して、その選択された動きパラメータ候補を予測のために使用して、実行されることに基づいて向上する。追加的に、または、二者択一的に、エンハンスメント層信号の動きパラメータ候補リストが、ベース層の符号化/復号化に関わるベース層動きパラメータに依存して順序付けされる。このため、順序付けされた動きパラメータ候補リストからエンハンスメント層動きパラメータを選択するための確率分布は、例えば、明らかにシグナリングされたインデックス構文要素が、少ないビットを使用して、(例えば、エントロピー符号化などを使用して、)符号化されるように圧縮される。さらに、付加的に、または、二者択一的に、ベース層の符号化/復号化内で使用されたインデックスが、エンハンスメント層のための動きパラメータ候補リスト内にインデックスを決定する基礎として補助する。このため、エンハンスメント層のためのインデックスのどんなシグナリングも、完全に避けられる。または、単にインデックスに対して、このようにして決定した予測の偏差が、エンハンスメント層サブストリーム内で送信される。その結果、符号化効率が向上する。
本発明の1つの実施の形態は、仮に、それぞれの変換係数ブロックのサブブロックのサブ分割が、ベース層残差信号またはベース層信号に基づいて制御されるならば、エンハンスメント層の変換係数ブロックのサブブロックに基づいた符号化が、より効率的にされる、ということである。特に、それぞれのベース層ヒントを利用することによって、サブブロックは、ベース層残差信号またはベース層信号から観察可能なエッジ拡張に対して水平な空間周波数軸に沿って、より長くなる。このため、サブブロックの形状を、増加する確率では、各サブブロックが、ほぼ完全に重要な変換係数(すなわち、ゼロに量子化されていない変換係数)、または、重要でない変換係数(すなわち、ゼロに量子化された変換係数のみ)のいずれかで充填され、一方、減少する確率では、どんなサブブロックも、一方に重要な変換係数の数と他方に重要でない変換係数の数を同数有するように、エンハンスメント層変換係数ブロックの変換係数のエネルギーの推定分布に適合させることが可能である。しかしながら、重要な変換係数を有さないサブブロックが、単に1つのフラグ(flag)の使用などによって、データストリーム内で効率的にシグナリングされるという事実のため、そして、重要な変換係数で殆んど完全に充填されたサブブロックが、そこに点在する非重要な変換係数を符号化するための信号化量の浪費を必要としないという事実のため、エンハンスメント層の変換係数ブロックを符号化するための符号化効率が増加する。
本発明の1つの実施の形態は、スケーラブルビデオ符号化の符号化効率が、ベース層信号の併置されたブロックのイントラ予測パラメータの使用によって、エンハンスメント層の現在のブロックの空間的近傍部内の失われている空間イントラ予測パラメータ候補を代用することによって増加する、ということである。このため、空間イントラ予測パラメータを符号化するための符号化効率は、エンハンスメント層のイントラ予測パラメータのセットの改良された予測品質のために増加する、または、より正確に述べると、増加する見込みである。エンハンスメント層のイントラ予測されたブロックのためのイントラ予測パラメータのための適切な予測器が、有用であり、その結果、それぞれのエンハンスメント層ブロックのイントラ予測パラメータのシグナリングが、平均的に少ないビットで実行される、という見込みを増加させる。
更なる有利な実現は従属クレームで説明される。
好ましい実施の形態が、図面に関して以下に詳細に説明される。
スケーラブルビデオエンコーダの一実施の形態を示すブロック図である。 図1のスケーラブルビデオエンコーダに合うスケーラブルビデオデコーダの一実施の形態を示すブロック図である。 スケーラブルビデオエンコーダのより特定した実施の形態を示すブロック図である。 図3のスケーラブルビデオエンコーダに合うスケーラブルビデオデコーダのブロック図である。 符号化/復号化の順序付けを更に説明する、ビデオ、そのベース層およびエンハンスメント層のバージョンを示す模式図である。 エンハンスメント層のための可能な予測モードを説明するために階層にされたビデオ信号の一部分を示す模式図である。 エンハンスメント層イントラ予測信号と層間予測信号との間の重み付けをスペクトル的に変えて使用して、エンハンスメント層予測信号の形成を示す構成図である。 エンハンスメント層のサブストリーム内におそらく含まれた構文要素の模式図である。 形成/結合が空間領域内で実行された実施の形態に従って、図7の形成の可能な実現を示す模式図である。 形成/結合がスペクトル領域内で実行された実施の形態に従って、図7の形成の実現を説明するための模式図である。 ベース層からエンハンスメント層信号への空間イントラ予測パラメータ導出を説明するために、階層化されたビデオ信号から取り出した一部分を示す模式図である。 図11の導出の拡張を説明する模式図である。 ベース層から得られた1つ空間イントラ予測パラメータが挿入される1セットの空間イントラ予測パラメータ候補を示す模式図である。 ベース層からの予測パラメータ粒状導出を説明するために、階層化されたビデオ信号から取り出した一部分を示す模式図である。 図15aと図15bは、ベース層内で2つの異なるサンプルに従って、ベース層動きパラメータの空間的な変化を使用して、現在のブロックのために適切なサブ分割の選択方法を示す模式図である。 現在のエンハンスメント層のブロックのために可能なサブブロックのサブ分割内で最も粗い選択方法の第1の可能性を説明するための模式図である。 現在のエンハンスメント層のブロックのために可能なサブブロックのサブ分割内で最も粗い選択方法の第2の可能性を説明するための模式図である。 現在のエンハンスメント層のブロックのためにサブブロックのサブ分割の導出の使用を説明するために、階層化されたビデオ信号から取り出した一部分を示す模式図である。 エンハンスメント層動きパラメータデータを効率的に符号化するためのベース層ヒントの利用を説明するために階層化されたビデオ信号から取り出した一部分を示す模式図である。 エンハンスメント層動きパラメータ信号化の効率を増加させる第1の可能性を説明するための模式図である。 エンハンスメント層動きパラメータ信号化をより効率的にするためのベース層ヒントを利用する方法の第2の可能性を示す模式図である。 エンハンスメント層動きパラメータ候補のリストに載っている順にベース層を転送する第1の可能性を説明するための模式図である。 エンハンスメント層動きパラメータ候補のリストに載っている順にベース層を転送する第2の可能性を説明するための模式図である。 エンハンスメント層動きパラメータのシグナリングをより効率的にするためのベース層ヒントを利用する別の可能性を説明するための模式図である。 変換係数ブロックのサブブロックのサブ分割が、適切にベース層から得られたヒントに調整される実施の形態を説明するために、階層化されたビデオ信号から取り出した一部分を説明するための模式図である。 ベース層からの変換係数ブロックの適切なサブブロックのサブ分割の取得方法の異なる可能性を説明する模式図である。 スケーラブルビデオデコーダのためのさらに詳細な実施の形態を示すブロック図である。 図24は、図23のスケーラブルビデオデコーダに合うスケーラブルビデオエンコーダを示すブロック図である。 図24は、図23のスケーラブルビデオデコーダに合うスケーラブルビデオエンコーダを示すブロック図である。 (抽出された/フィルタにかけられた)ベース層再構成信号(BL Reco)と、既に符号化された隣接ブロックの差(difference)信号(EH Diff)を使用する空間イントラ予測との合計によって、層間イントラ予測信号の生成を説明するための模式図である。 (抽出された/フィルタにかけられた)ベース層残差信号(BL Resi)と、既に符号化された隣接ブロックの再構成されたエンハンスメント層のサンプル(EH Reco)を使用する空間イントラ予測との合計によって、層間のイントラ予測信号の生成を説明するための模式図である。 (抽出された/フィルタにかけられた)ベース層再構成信号(BL Reco)と、既に符号化された隣接ブロックの再構成されたエンハンスメント層のサンプル(EH Reco)を使用する空間イントラ予測とを、周波数で重み付けした合計によって、層間イントラ予測信号の生成を説明するための模式図である。 明細書中で使用されるベース層信号とエンハンスメント層信号とを説明するための模式図である。 エンハンスメント層の動き補償予測を説明する模式図である。 ベース層残差とエンハンスメント層再構成とを使用する予測を説明するための模式図である。 BL再構成とEL差分信号とを使用する予測を説明するための模式図である。 BL再構成とEL差分信号の第2仮説とを使用する予測を説明するための模式図である。 BL再構成とEL再構成とを使用する予測を説明するための模式図である。 一例として、画像を正方形ブロックに分解することと、対応する四分木構造を説明するための模式図である。 好ましい実施の形態において、サブブロック内に正方形ブロックの許容された分解を説明するための模式図である。 動きベクトル予測の位置を説明するための模式図である。(a)は空間候補の位置を表現し、(b)は時間候補の位置を表現する。 アルゴリズムとマージするブロック(a)と、空間候補のための冗長検査(b)とを説明するための模式図である。 アルゴリズムとマージするブロック(a)と、空間候補のための冗長検査(b)とを説明するための模式図である。 4×4変換ブロックのための走査方向(対角線、垂直、水平)を説明するための模式図である。 8×8変換ブロックのための走査方向(対角線、垂直、水平)を説明するための模式図である。斜線の領域は重要なサブグループを定義する。 対角線の走査だけが定義されている、16×16変換図である。 JCTVC−G703で提案されるように、16×16変換のための垂直走査を説明するための模式図である。 16×16変換ブロックのための垂直かつ水平な走査の実現を説明するための模式図である。係数サブグループは、それぞれ一つの行または一つの列と定義される。 16×16変換ブロックのための垂直かつ水平な走査を説明するための模式図である。 隣接する再構成されたエンハンスメント層のサンプルと再構成されたベース層のサンプルとを使用する後方に適応したエンハンスメント層イントラ予測を説明するための模式図である。 差分信号の空間的な挿入を説明するために、エンハンスメント層の画像/フレームを示す模式図である。
図1は、以下に概説された実施の形態が組み込まれる、スケーラブルビデオエンコーダのための実施の形態を一般的な方法で示す。図1のスケーラブルビデオエンコーダは、一般に、参照符号2を使用して示され、ビデオ4を受信して符号化する。スケーラブルビデオエンコーダ2は、スケーラブル方法で、ビデオ4をデータストリーム6内に符号化するように構成されている。すなわち、データストリーム6は、第1の情報内容量でその中に符号化されたビデオ4を有している第1の部分6aと、第1の部分6aより大きい情報内容量でその中に符号化されたビデオ4を有している別の部分6bと、を含む。例えば、部分6aと6bの情報内容量は、品質または忠実度において、すなわち、オリジナルビデオ4からの画素単位の偏差量および/または空間解像度において異なる。しかしながら、また、情報内容量の異なる他の形式が、例えば、色忠実度などに適用される。部分6aはベース層データストリームまたはベース層サブストリームと呼ばれる。一方、部分6bはエンハンスメント層データストリームまたはエンハンスメント層サブストリームと呼ばれる。
スケーラブルビデオエンコーダ2は、一方でエンハンスメント層サブストリーム6b無しでベース層サブストリーム6aから、他方でサブストリーム6aと6bの両方から、再構成可能なビデオ4のバージョン8aと8bとの間の冗長を利用するように構成されている。そうするために、スケーラブルビデオエンコーダ2は層間予測を使用する。
図1に示すように、スケーラブルビデオエンコーダ2は、二者択一的に、ビデオ4の2つのバージョン4aと4bを受信する。両方のバージョン4aと4bは、ちょうどベース層サブストリーム6aとエンハンスメント層サブストリーム6bとがするように、情報内容量が互いに異なる。従って、例えば、スケーラブルビデオエンコーダ2は、サブストリーム6aと6bを発生させるように構成される。その結果、ベース層サブストリーム6aは、その中に符号化されたバージョン4aを有する。一方、エンハンスメント層データストリーム(サブストリーム)6bは、ベース層サブストリーム6bに基づいた層間予測を使用して、その中に符号化されたバージョン4bを有する。サブストリーム6aと6bの符号化は共に損失する。
仮に、スケーラブルビデオエンコーダ2が、単に、ビデオ4のオリジナルバージョンを受信するのみであっても、スケーラブルビデオエンコーダ2は、例えば、空間ダウンスケーリング、および/または、より高いビット深さからより低いビット深さへのトーンマッピング(写像)によって、ベース層バージョン4aを得ることによって、そこからイントラ的に2つのバージョン4aと4bを導出するように構成されている。
図2は、図1のスケーラブルビデオエンコーダ2に合うスケーラブルビデオデコーダを、以下に概説された実施の形態を取り入れるのに適した同様な方法で示す。図2のスケーラブルビデオデコーダは、一般に、参照符号10を使用して示される。スケーラブルビデオデコーダは、一般的に、仮に、完全な方法で、データストリーム6の両方の部分6aと6bがスケーラブルビデオデコーダ10に達するならば、そこからビデオのエンハンスメント層バージョン8bを再構成するように、または、仮に、例えば、部分6bが送信損失などのために利用できないならば、そこからビデオのベース層バージョン8aを再構成するように、符号化データストリーム6をデコード(復号化)するように構成されている。すなわち、スケーラブルビデオデコーダ10は、ベース層サブストリーム6aだけからバージョン8aを再構成でき、かつ、部分6aと6bの両方から層間予測を使用して、バージョン8bを再構成できるように構成されている。
より詳細な以下の本発明の実施の形態(すなわち、実施の形態は、図1と図2の実施の形態を示す)が明確に詳細に説明される前に、図1と図2のスケーラブルビデオエンコーダとデコーダのより詳しい実現が、図3と図4に対して説明される。図3は、ベース層符号化器12、エンハンスメント層符号化器14およびマルチプレクサ16を備えたスケーラブルビデオエンコーダ2を示す。ベース層符号化器12は、入力ビデオのベース層バージョン4aを符号化するように構成されている。エンハンスメント層符号化器14は、ビデオのエンハンスメント層バージョン4bを符号化するように構成されている。従って、マルチプレクサ16は、ベース層符号化器12からのベース層サブストリーム6aとエンハンスメント層符号化器14からのエンハンスメント層サブストリーム6bとを受信して、出力する際に符号化データストリーム6中に両者を多重化して送信する。
図3に示されているように、両方の符号化器12と14は、それぞれの入力バージョン4aと4bを、それぞれのサブストリーム6aと6b内に符号化するために、例えば、空間予測および/または時間予測を使用する予測符号化器である。特に、符号化器12と14はそれぞれ、ハイブリッドビデオブロック符号化器である。すなわち、符号化器12と14のそれぞれは、例えば、ビデオバージョン4aと4bの画像またはフレームが、それぞれサブ分割されるブロックの各ブロックのための異なる予測モードの間で選択されている間、ブロックごとに基づいて、ビデオのそれぞれの入力バージョンを符号化するように構成されている。ベース層符号化器12の異なる予測モードは、空間および/または時間予測モードを含む。一方、エンハンスメント層符号化器14は、追加して、層間予測モードをサポートする。ブロック内のサブ分割は、ベース層とエンハンスメント層の間で異なっている。予測モード、様々なブロックのために選択された予測モードのための予測パラメータ、予測残差、そして、任意に、それぞれのビデオバージョンのブロックサブ分割は、エントロピー符号化を使用して、順番にそれぞれのサブストリーム6a,6b内に符号化される構文要素を含むそれぞれの構文を使用して、それぞれの符号化器12,14によって記述される。層間予測は、2,3の例で言及したように、エンハンスメント層ビデオ、予測モード、予測パラメータ、および/または、ブロックのサブ分割のサンプルを予測するために、例えば1回以上利用される。従って、ベース層符号化器12とエンハンスメント層符号化器14の両方が、それぞれ、エントロピー符号化器19a,19bが後に続く予測符号化器18a,18bを含む。一方、予測符号化器18a,18bは、それぞれ入力(inbound)バージョン4aと4bから、予測符号化を使用して、構文要素ストリームを形成する。エントロピー符号化器19a,19bは、それぞれの予測符号化器18a,18bによって出力された構文要素をエントロピー符号化する。ちょうど言及するように、エンコーダ2の層間予測は、エンハンスメント層の符号化手順内で異なる時に関連する。従って、予測符号化器18bは、予測符号化器18a、それの出力、およびエントロピー符号化器19aの1つ以上に接続されるように示される。同様に、エントロピー符号化器19bは、例えば、ベース層からのエントロピー符号化のために使用された文脈を予測することによって、任意に層間予測を利用する。従って、エントロピー符号化器19bは、任意に、ベース層符号化器12の要素のどれかに接続されるように示される。
図1に対する図2と同じ方法で、図4は、図3のスケーラブルビデオエンコーダに適合するスケーラブルビデオデコーダ10の可能な実現を示す。従って、図4のスケーラブルビデオデコーダ10は、サブストリーム6aと6bを得るためにデータストリーム6を受信するデマルチプレクサ40と、ベース層サブストリーム6aを復号するように構成されたベース層デコーダ80と、エンハンスメント層サブストリーム6bを復号するように構成されたエンハンスメント層デコーダ60と、を備えている。図示されているように、デコーダ60は、層間予測を利用するためにそこから情報を受信するためにベース層デコーダ80に接続されている。これにより、ベース層デコーダ80は、ベース層サブストリーム6aからベース層バージョン8aを再構成できる。そして、エンハンスメント層デコーダ60は、エンハンスメント層サブストリーム6bを使用して、ビデオのエンハンスメント層バージョン8bを再構成するように構成されている。図3のスケーラブルビデオエンコーダと類似して、それぞれエンハンスメント層デコーダ60とベース層デコーダ80は、エントロピーデコーダ100,320、続いて、予測デコーダ102,322を内部に含む。
以下の実施の形態の理解を簡素化するために、図5は、ビデオ4の異なるバージョン、すなわち、符号化損失によって互いから逸れているベース層バージョン4aと8aとを例示的に示す。同様に、エンハンスメント層バージョン4bと8bとは、それぞれ符号化損失によって互いから逸れている。ベース層信号とエンハンスメント層信号は、それぞれ画像22aと22bの系列で構成される。それらは、時間軸24に沿って互い(すなわち、エンハンスメント層信号の時間的に対応する画像22bの他にも、ベース層バージョンの画像22a)に登録されるように、図5内に示されている。前述のように、画像22bは、より高い空間解像度を有し、および/または、より高い忠実度などで(例えば、画像のサンプル値の、より高いビット深さで)ビデオ4を表す。実線および点線を使用して、符号化/復号化の順序が、画像22a,22bの間で定義されるために示される。図5内で示された例に従って、符号化/復号化の順序が、所定の時間の時刻/瞬間のベース層画像22aは、エンハンスメント層信号の同じ時間の時刻のエンハンスメント層画像22bの前に横断されるような方法で、画像22aと22bを横断する。時間軸24に対して、画像22a,22bは、提供時間の順序で符号化/復号化の順序26によって横断される。しかし、画像22a,22bの提供時間の順序から逸れる順序も、可能である。エンコーダ2もデコーダ10も、符号化/復号化の順序26に沿って連続して符号化/復号化する必要はない。むしろ、符号化/復号化は平行して使用される。符号化/復号化の順序26は、空間的、時間的、および/または、層間の意味で、互いに隣接するベース層信号とエンハンスメント層信号の部分の間の利用性を定義する。その結果、エンハンスメント層の現在の部分を符号化/復号化する時に、その現在のエンハンスメント層部分の利用可能な部分が、符号化/復号化の順序を通して定義される。従って、この符号化/復号化の順序26に従って利用可能である単に隣接する部分が、予測のためにエンコーダによって使用されるので、デコーダは、予測を手直しするために、同じ情報源にアクセスする。
以下の図に対して、図1〜図4に対して前述したスケーラブルビデオエンコーダまたはデコーダが、1つの実施例に従って、本発明の実施の形態をどのように形成するかが説明される。以下で説明される実施例の可能な実例が、表示「実施例C」を使用して議論される。
特に、図6は、参照符号360を使用して示されたエンハンスメント層信号の画像22bと、参照符号200を使用して示されたベース層信号の画像22aを説明する。異なる層の時間的に対応する画像は、時間軸24に対して互いに示された方法で示される。斜線を使用して、符号化/復号化の順序に従って既に符号化/復号化されているベースとエンハンスメント層信号内の部分200とが、図5に示された符号化/復号化の順序に従って未だ符号化または復号化されていない部分36と区別される。また、図6は、現在符号化/復号化されるエンハンスメント層信号360の一部分28を示す。
現在説明されている実施の形態に従って、部分28の予測は、部分28を予測するために、エンハンスメント層自体内のイントラ層予測とベース層からの層間予測の両方を使用する。しかしながら、予測は、これらの予測がスペクトル的に変化する方法で、部分28の最終予測に寄与するように結合される。その結果、特に、両方の寄与の間の比率は、スペクトル的に変化する。
特に、部分28は、エンハンスメント層信号400の既に再構成された部分(すなわち、図6でエンハンスメント層信号400内の斜線によって示された部分)から、空間的または時間的に予測される。空間予測は矢印30を使用して説明される。一方、時間予測は矢印32を使用して説明される。時間予測は、例えば、動きベクトルの情報が、現在の部分28のために、エンハンスメント層サブストリーム内で送信されるに従って、動き補償予測を含む。動きベクトルは、現在の部分28の時間予測を得るために、コピーされるべきエンハンスメント層信号400の参照画像の一部分の置き換えを示す。空間予測30は、現在の部分28内に、推定する空間的に隣接する部分、画像22bの既に符号化/復号化された部分、空間的に隣接する現在の部分28を含む。このために、推定(または角度)方向のようなイントラ予測情報が、現在の部分28のために、エンハンスメント層サブストリーム内でシグナリングされる。また、空間予測30および時間予測32の組み合わせが、同様に使用される。どのような場合でも、その結果、エンハンスメント層のイントラ予測信号34が、図7で説明されるように得られる。
現在の部分28の別の予測を得るために、層間予測が使用される。このために、ベース層信号200は、エンハンスメント層信号400の現在の部分28に空間的かつ時間的に対応する部分36で、現在の部分28のための層間予測信号が、増加する潜在的解像度を得るために、解像度または品質の改良を受ける。改良手順は図6の矢印38を使用して説明され、図7に示すように層間予測信号39をもたらす。
従って、2つの予測寄与34と39が、現在の部分28のために存在する。そして、両方の寄与の重み付け平均が、現在の部分28に対して、層間予測信号とエンハンスメント層イントラ予測信号とが、エンハンスメント層予測信号42に寄与する重み付けが、図7に44で図式的に示すように、空間周波数成分を異なって変化する方法で、エンハンスメント層予測信号42を得るために形成される。図7は、例示的に、あらゆる空間周波数成分に対して、予測信号34と38が最終予測信号に寄与する重み付けが、全てのスペクトル的成分に対して、しかしながら、予測信号34に適用された重み付けと予測信号39に適用された重み付けとの間の比をスペクトル的に変化する状態で、同じ値46を加算する場合を示す。
一方、予測信号42が、現在の部分28に、エンハンスメント層信号400によって直接使用される。あるいはまた、残差信号は、現在の部分28の再構成されたバージョン54内で、例えば図7で示される加算のように予測信号42との結合50によって、もたらされる現在の部分28のエンハンスメント層サブストリーム6b内に提供される。中間的な注意として、スケーラブルビデオエンコーダとデコーダの両方は、予測残差を符号化/復号化するために、変換符号化を使用して、予測的符号化を使用するハイブリッドビデオデコーダ/エンコーダである、ことが注意される。
図6,7の記述をまとめると、エンハンスメント層サブストリーム6bが、現在の部分28に対して、空間的および/または時間的予測30,32を制御するためのイントラ予測パラメータ56と、任意に、スペクトル重み付け平均の形成41を制御するための重み付けパラメータ58と、残差信号48にシグナリングするための残差情報59とを含む。一方、スケーラブルビデオエンコーダは、それに従って、これらのパラメータ56,58,59の全てを決定し、エンハンスメント層サブストリーム6b内に、パラメータ56,58,59を差し込む。スケーラブルビデオデコーダは、上に概説したように、現在の部分28を再構成するためにパラメータ56,58,59を使用する。これらの要素56,58,59の全てが、量子化(すなわち、量子化として比/歪コスト関数を使用する)のいくつかを受ける。そして、それに従って、スケーラブルビデオエンコーダは、これらのパラメータ/要素を決定する。興味深いことに、エンコーダ2は、現在の部分28に対して再構成されたバージョン54を得るために、例えば、符号化/復号化の順序で続く、エンハンスメント層信号400の部分のためのどんな予測の基礎としても役立つように、このようにして決められたパラメータ/要素56,58,59を使用する。
異なる可能性が、重み付けパラメータ58と、それらがスペクトル重み付け平均の形成41を制御する方法とのために存在する。例えば、重み付けパラメータ58が、現在の部分28に対して、2つの状態(すなわち、今までに説明したスペクトル重み付け平均の形成を活性化する一方の状態、および、層間予測信号38の寄与を非活性化する他方の状態)の1つにのみシグナリングする。その結果、最終エンハンスメント層予測信号42は、その場合、エンハンスメント層イントラ予測信号34によってのみ作成される。現在の部分28のための重み付けパラメータ58は、一方のスペクトル的重み付け平均形成の活性化と、他方の単独でエンハンスメント層予測信号42を形成する層間予測信号39との間を切り換わる。また、重み付けパラメータ58は、言及した3つの状態/二者択一の1つにシグナリングするように設計される。あるいはまた、重み付けパラメータ58は、さらに、現在の部分28に対して、予測信号34と39が最終予測信号42に寄与する重み付けの間の比率のスペクトル変化に関して、スペクトル重み付け平均形成41を制御する。後で、ペクトル重み付け平均形成41が、予測信号34と39を加算する前の予測信号34と39の1つまたは両方を、例えば、ハイパスフィルタおよび/またはローパスフィルタを使用して、フィルタにかけることを伴う、ことが説明される。その場合、重み付けパラメータ58は、現在の部分28の予測に対して使用されるべきフィルタのためのフィルタ特性にシグナリングする。二者択一として、重み付けパラメータ58は、スペクトル重み付け平均形成41におけるスペクトル重み付けが、変換領域内のスペクトル成分の個々の重み付けによって達成され、従って、この場合、重み付けパラメータ58は、これらのスペクトル成分の個々の重み付けの値をシグナリング/設定できる、ということが以下で説明される。
追加的に、または、二者択一的に、現在の部分28のための加重(重み付け)パラメータは、ステップ41内であるスペクトル加重が、変換領域または空間領域内で実行されるか否かをシグナリングできる。
図9は空間領域内のスペクトル重み付け平均構成を実行するための実施の形態を説明する。予測信号39と34は、現在の部分28の画素ラスタ(raster)と一致しているそれぞれの画素配列の形式で得られるように図示されている。スペクトル重み付け平均構成を実行するために、予測信号34と39の両方の画素配列は、フィルタリングを受けるように示される。図9は、例えばFIRフィルタリングを実行するために、予測信号34と39の画素配列を移動しているフィルタ核(kernel)62と64を示すことによって、実例としてフィルタリングを図示する。しかしながら、また、IIRフィルタリングも可能である。さらに、予測信号34と39の1つのみが、フィルタリングを受けてもよい。両方のフィルタ62と64の伝達関数は異なっているので、予測信号39と34の画素配列のフィルタリングの結果の加算66は、スペクトル重み付け平均構成の結果、すなわち、エンハンスメント層予測信号42をもたらす。換言すれば、加算66は、それぞれフィルタ62と64を使用して、フィルタがかけられた予測信号39と34の中の併置されたサンプルを容易に加算する。その結果、62〜66はスペクトル重み付け平均構成41をもたらす。図9は、変換係数の形式で存在している残差情報59の場合、変換領域内の残差信号48にシグナリングし、逆変換68が画素配列70の形式で空間領域をもたらすために使用され、その結果、再構成されたバージョン55をもたらしている結合52が、残差信号アレイ70とエンハンスメント層予測信号42との簡単な画素的付加によって実現されることを図示する。
再び、予測が、デコーダとエンコーダ内でそれぞれ再構成のための予測を使用して、スケーラブルビデオエンコーダとデコーダによって実行されることを想起されたい。
図10は、変換領域内でどのようにスペクトル重み付け平均構成が実行されるかを例示的に示す。ここで、予測信号39と34の画素配列は、それぞれ変換72と74を受ける。その結果、それぞれスペクトル分解76と78をもたらす。各スペクトル分解76と78は、1スペクトル成分当たり1つの変換係数で、変換係数アレイが作成される。それぞれの変換係数ブロック76と78は、重み付けの対応するブロック、つまり、ブロック82と84に掛けられる。その結果、スペクトル成分毎に、ブロック76と78の変換係数は個別に重み付けされる。スペクトル成分毎に、ブロック82と84の加重値は、全てのスペクトル成分に共通の値を加算する。しかし、これは義務的ではない。事実上、ブロック76と82との間の乗数86と、ブロック78とブロック84の間の乗数88とは、それぞれ変換領域内のスペクトルフィルタリングを表す。そして、変換係数/スペクトル成分単位加算90は、変換係数の1ブロックの形式でエンハンスメント層予測信号42の変換領域バージョンをもたらすために、スペクトル重み付け平均形成41を終了する。図10に示すように、変換係数ブロックの形式で残差信号48にシグナリングする残差信号59の場合、残差信号59は、変換領域内の現在の部分28の再構成されたバージョンをもたらすために、エンハンスメント層予測信号42を表す変換係数ブロックと、容易に変換係数的加算結合(または別の結合)52がなされる。従って、結合52の付加結果に適用される逆変換84は、現在の部分28を再構成している画素配列、すなわち、再構成されたバージョン54をもたらす。
前述したように、現在の部分28のためのエンハンスメント層サブストリーム6b内の現在のパラメータが、平均形成41が図10に示した変換領域、または、図9に従った空間領域内で実行されるかどうかのためにシグナリングする。例えば、仮に、残差情報59は、現在の部分28のためのどんな変換係数ブロックの欠如も示す。また、空間領域が使用される。あるいは、加重パラメータ58は、変換係数を含む残差情報59または変換係数を含まない残差情報59の如何に関係なく両方の領域を切り換える。
その後、層間エンハンスメント層予測信号を得るために、差分信号が、エンハンスメント層信号の既に再構成された部分と層間予測信号との間で、計算されて管理されることが、説明される。第1の部分の差分信号に関する空間予測はエンハンスメント層信号の一部分に併置された第1の部分で差分信号の空間予測は、現在、差分信号の第2の部分から再構成される。エンハンスメント層信号の第1の部分に空間的に隣接して、かつ、既に再構成された部分に属して、その時、差分信号を空間的に予測するために使用される。あるいはまた、第1の部分の差分信号の時間予測はエンハンスメント層信号の部分に併置されて、現在、エンハンスメント層信号の以前に再構成されたフレームに属しながら差分信号の第2の部分から再構成されるのは、時間的に予測された差分信号を得るために使用される。層間予測信号と予測された差分信号とは、エンハンスメント層イントラ予測信号を得るために使用され、次に、層間予測信号と結合される。
以下の図に対して、図1〜図4に対して前述したようなスケーラブルビデオエンコーダまたはデコーダが、どのように出願の別の形態に従って本出願の実施の形態を形成するために実行されるかが記載される。
この内容について説明するために、図11を参照する。図11は現在の部分28の空間予測30を実行する可能性を示す。その結果、図11の以下の記述は、図6〜図10に関する記述と組み合わされる。特に、以下に説明される内容は、「実施例」XとYに言及することによって、図示された実現の例に対して後に説明される。
図11に示された状況は、図6に示されたものに対応する。すなわち、ベース層信号200とエンハンスメント層信号400が示される。既に符号化/復号化された部分が、斜線を使用して示されている。エンハンスメント層信号400内で、現在、符号化/復号化されるべき部分は、隣接するブロック92と94を有している。ここで、例示的に、現在のブロック28と同じサイズを有している両方のブロック92と94に対して、現在の部分28の上側にブロック92が描かれ、左側にブロック94が描かれている。しかしながら、サイズの一致は義務的ではない。むしろ、エンハンスメント層信号400の画像22bがサブ分割されているブロックの部分は、異なるサイズを有している。それらは四角形に制限さえされていない。それらは、長方形または他の形であってもよい。さらに、現在のブロック28は、図11に明確に表現されていない隣接ブロックを有している。しかしながら、隣接ブロックは、まだ復号化/符号化されていない。すなわち、隣接ブロックは、符号化/復号化の順序で続き、その結果、予測のために利用できない。これを超えて、符号化/復号化の順序に従って既に符号化/復号化されたブロック92と94より別のブロック(現在のブロック28に隣接する、例えば現在のブロック28の左上隅で斜めに隣接するブロック96のようなブロック)が存在する。しかし、ブロック92と94は、ここで考慮された例におけるイントラ予測30の対象となる現在のブロック28のためのイントラ予測パラメータを予測する役割を果たす、予め決められた隣接するブロックである。そのような予め決められた隣接するブロックの数は、2つに制限されない。それは、より多くても、または1つでもよい。
スケーラブルビデオエンコーダとスケーラブルビデオデコーダは、既に符号化された隣接するブロックのセットから、予め決められた隣接するブロックのセット(ここでは、ブロック92,94)を決定する。ここに、ブロック92〜96は、例えば、その左上のサンプルのように現在の部分28内の予め決められたサンプル位置98に依存する。例えば、現在の部分28のそれらの既に符号化された隣接するブロックのみが、予め決められたサンプル位置98に直ぐに隣接するサンプル位置を含む「予め決められた隣接するブロック」のセットを形成する。どのような場合でも、隣接する既に符号化/復号化されたブロックは、現在のブロック28の領域が空間的に予測されるべきサンプル値に基づいた現在のブロック28に隣接するサンプル102を含む。このために、56などの空間予測パラメータは、エンハンスメント層サブストリーム6b内でシグナリングされる。例えば、現在のブロック28のための空間予測パラメータは、サンプル102のサンプル値が現在のブロック28の領域内にコピーされるべき空間的方向を指示する。
どのような場合でも、少なくとも、時間的に対応する画像22aの関連する空間的に対応する領域に関する限り、上で説明したように、ブロック的な予測を使用し、例えば、空間予測モードと時間予測モードとの間のブロック的な選択を使用して、現在のブロック28を空間的に予測する時、スケーラブルビデオデコーダ/エンコーダは、ベース層サブストリーム6aを使用して、ベース層200を既に再構成している(エンコーダの場合には、符号化されている)。
図11において、ベース層信号200の時間で並べられた画像22aがサブ分割されるいくつかのブロック104は、例示的に表現された現在の部分28に局所的に対応する領域内、および、その周りにある。それはちょうどエンハンスメント層信号400内の空間的に予測されたブロックの場合である。空間予測パラメータは、ベース層信号200内で、それらのブロック104のためのベース層サブストリーム内に含まれる、または、シグナリングされる。空間予測モードの選択は、ベース層信号に対してシグナリングされる。
ここで、例示的に、空間的なイントラ層予測30が選択されたブロック28に関する符号化データストリームから、エンハンスメント層信号の再構成を可能にするために、イントラ予測パラメータが、以下のビットストリーム内で使用され、符号化される。
イントラ予測パラメータは、全ての可能なイントラ予測パラメータのかなり小さいサブセットである「最尤イントラ予測パラメータ」の概念を使用してしばしば符号化される。「最尤イントラ予測パラメータ」は、例えば、最尤イントラ予測パラメータのセットは、1つ、2つまたは3つのイントラ予測パラメータを含む。一方、例えば、全ての可能なイントラ予測パラメータのセットは、35個のイントラ予測パラメータを含むことができる。仮に、イントラ予測パラメータが、最尤イントラ予測パラメータのセットに含まれているならば、それは、ビットストリーム内で、少ない数のビットで、シグナリングされる。仮に、イントラ予測パラメータが、最尤イントラ予測パラメータのセットに含まれていないならば、ビットストリーム内のそのシグナリングは、より多くのビットを必要とする。従って、現在のイントラ予測されたブロックのためのイントラ予測パラメータにシグナリングするために、構文要素に費やされるべきビットの量は、最尤、または、おそらく有利なイントラ予測パラメータのセットの品質に依存する。この概念を使用して、最尤イントラ予測パラメータのセットを適切に導出できると仮定した場合、イントラ予測パラメータを符号化するために平均してより少ないビット数が必要とされる。
通常、最尤イントラ予測パラメータのセットは、それが、直接に隣接するブロックのイントラ予測パラメータを含む、および/または、追加的に、例えば初期設定パラメータの形でイントラ予測パラメータをしばしば使用する方法で選択される。例えば、隣接するブロックの主な勾配方向が同じであるので、最尤イントラ予測パラメータのセット内の隣接するブロックのイントラ予測パラメータを含むことは、一般に有利である。
しかしながら、仮に、隣接するブロックが、空間イントラ予測モードで符号化されないならば、それらのパラメータは、デコーダ側で利用できない。
スケーラブル符号化において、併置されたベース層ブロックのイントラ予測パラメータを使用することは、しかしながら可能である。従って、以下に概説される実施例に従って、この状況が、空間イントラ予測モード内の符号化されない隣接するブロックの場合に、併置されたベース層ブロックのイントラ予測パラメータを使用して利用される。
その結果、図11に従って、現在のエンハンスメント層ブロックのためのおそらく有利なイントラ予測パラメータのセットは、予め決められた隣接するブロックのイントラ予測パラメータを検査することによって、そして、例えば、それぞれの予め決められた隣接するブロックが、イントラ予測モードで符号化されないので、予め決められた隣接するブロックが、それに関連した適当なイントラ予測パラメータを有さない場合に、ベース層内に併置されたブロックに例外的に再分割することによって、構成される。
先ず、現在のブロック28のブロック92または94などの予め決められた隣接するブロックが、空間イントラ予測モードを使用して予測されたか否かをチェックされる。すなわち、空間イントラ予測モードが、その隣接するブロックのために選択されたか否かをチェックされる。それによって、その隣接するブロックのイントラ予測パラメータが、現在のブロック28のためのおそらく有利なイントラ予測パラメータのセット、または、もしあれば、代替として、ベース層の併置されたブロック108のイントラ予測パラメータ内に含まれる。この過程は、予め決められた隣接するブロック92と94のそれぞれに対して実行できる。
例えば、仮に、それぞれの予め決められた隣接するブロックが、空間イントラ予測ブロックでないならば、初期設定予測等を使用する代わりに、ベース層信号200のブロック108のイントラ予測パラメータが、現在のブロック28に併置されている、現在のブロック28のためのおそらく有利な予測パラメータのセット内に含まれる。例えば、併置されたブロック108は、現在のブロック28の予め決められたサンプル位置98を使用して決定される。つまり、ブロック108は、ベース層信号200の時間的に並べられた画像22a内の予め決められたサンプル位置98に局所的に対応している位置106をカバーする。当然に、予めベース層信号200内のこの併置されたブロック108が、実際に空間イントラ予測ブロックであるか否か、の更なるチェックが実行される。図11の場合において、これがその場合であることが例示的に説明される。しかしながら、仮に、併置されたブロックも、イントラ予測モード内で符号化されないならば、おそらく有利なイントラ予測パラメータのセットが、その予め決められた隣接するブロックのために少しの寄与も無く残される。または、初期設定イントラ予測パラメータが、代替として代わりに使用される。すなわち、初期設定イントラ予測パラメータは、おそらく有利なイントラ予測パラメータのセットに挿入される。
従って、仮に、現在のブロック28に併置されたブロック108が、空間的にイントラ予測であれば、ベース層サブストリーム6a内でシグナリングされたそのイントラ予測パラメータは、一種の代替として、イントラ予測パラメータが時間予測モードのような別の予測モードを使用して符号化されるため、どんなイントラ予測パラメータも有していない、現在のブロック28の予め決められた隣接するブロック92または94のために使用される。
別の実施の形態に従って、所定の場合、仮に、それぞれの予め決められた隣接するブロックが、イントラ予測モードのものであっても、予め決められた隣接するブロックのイントラ予測パラメータは、併置されたベース層ブロックのイントラ予測パラメータによって代替される。例えば、イントラ予測パラメータが所定の基準を満たしているか否かのような更なるチェックが、イントラ予測モードのどんな予め決められた隣接するブロックに対しても実行される。仮に、所定の基準が、隣接するブロックのイントラ予測パラメータによって満たされていない、しかし、同じ基準が、併置されたベース層ブロックのイントラ予測パラメータによって満たされているならば、代替が、イントラ符号化された非常に隣接するブロックにも関わらず実行される。例えば、仮に、隣接するブロックのイントラ予測パラメータが、角度(angular)イントラ予測モード(しかし、例えばDCまたは平面イントラ予測モード)を表わさない、しかし、併置されたベース層ブロックのイントラ予測パラメータが角度イントラ予測モードを表わすならば、隣接するブロックのイントラ予測パラメータが、ベース層ブロックのイントラ予測パラメータによって置換される。
現在のブロック28のためのインター予測パラメータは、その時、現在のブロック28のためのエンハンスメント層サブストリーム6b、および、おそらく有利なイントラ予測パラメータのセットなどの符号化データストリーム内に存在する構文要素に基づいて決定される。すなわち、構文要素は、おそらく有利なイントラ予測パラメータのセットのメンバーである現在のブロック28のためのインター予測パラメータの場合に、おそらく有利なイントラ予測パラメータのセットに繋がらない、可能なイントラ予測パラメータのセットの残りのメンバーの場合より、少ないビットを使用して符号化される。
可能なイントラ予測パラメータのセットは、現在のブロックが、それぞれのモード/パラメータの角度方向に沿ってコピーすることによって、既に符号化/復号化された隣接するサンプルからコピーすることによって満たされることに従ういくつかの角度方向のモードと、現在のブロックのサンプルが、例えばいくつかの平均によって、既に符号化/復号化された隣接するサンプルなどに基づいて決められた一定値にセットされることに従う1つのDCモードと、現在のブロックのサンプルが、例えば、既に符号化/復号化された隣接するサンプルに基づいて決められる、xとyのスロープおよび遮断の一次関数をフォローする値分布にセットされることに従う平面モードとを含む。
図12は、ベース層の併置されたブロック108から得られた空間予測パラメータの代替が、エンハンスメント層サブストリーム内でシグナリングされた構文要素と共に、どのように使用されるかについての可能性を示す。図12は、隣接する既に符号化/復号化されたサンプル102と予め決められた隣接するブロック92および94と共に、現在のブロック28を拡大して示す。また、図12は、併置されたブロック108の空間予測パラメータによって示される角度の方向112を例示的に示す。
現在のブロック28のためにエンハンスメント層サブストリーム6b内でシグナリングされた構文要素114は、例えば図13に示されるように、条件付きで符号化されたインデックス118を、ここに例示的に、角度方向124として図示された、可能な有利なイントラ予測パラメータの結果であるリスト122内にシグナリングすることができる。または、仮に、実際のイントラ予測パラメータ116が、最尤セット122内になく、127に示されるように、可能性として除外される可能なイントラ予測モードのリスト125内のインデックス123であるならば、リスト122の候補は、その結果、実際のイントラ予測パラメータ116を特定する。構文要素の符号化は、リスト122内に属する実際のイントラ予測パラメータの場合、ビットの消費がより少ない。例えば、構文要素はフラグ(flag)とインデックス部とを含む。フラグは、リスト122のメンバーを含めるか、または、除外するか、インデックスがリスト122またはリスト125のいずれかを指すのか、つまり、リスト122のメンバーに含めるかまたは除外するかを示す。構文要素は、リスト122のメンバー124またはエスケープコードの一つを特定する分野を含む。そして、構文要素は、エスケープコードの場合、リスト122のメンバーを含むまたは除外するリスト125からメンバーを特定する第2の分野を含む。リスト122内のメンバー124内の順序は、例えば、初期設定規則に基づいて決定される。
従って、スケーラブルビデオデコーダは、エンハンスメント層サブストリーム6bから構文要素114を得る、または、検索する。そして、スケーラブルビデオエンコーダは、構文要素114をエンハンスメント層サブストリーム6bに挿入する。そして、次に、例えば、構文要素114は、リスト122から1つの空間予測パラメータを索引するために使用される。リスト122を形成する際に、前述の代替は、予め決められた隣接ブロック92と94が、空間予測符号化モードタイプであるか否かがチェックされて実行される。そうでなければ、前述したように、併置されたブロック108は、順に空間的に予測されたブロックであるか否かがチェックされ、そうであれば、この併置されたブロック108を空間的に予測するために使用される角度方向112のような、同じ空間予測パラメータがリスト122に含まれる。また、仮に、ベース層ブロック108が、適したイントラ予測パラメータを含まないならば、リスト122はそれぞれの予め決められた隣接ブロック92または94から寄与無しで残される。なぜなら、リスト122が空であることを避けるために、例えば、予め決められた隣接ブロック92、98の両方が、イントラ予測されているので、適したイントラ予測パラメータを欠いている併置されたブロック108と同様に、少なくともメンバー124の1つは初期設定イントラ予測パラメータを使用して、無条件に決定される。あるいはまた、リスト122が空であることが許容される。
当然、図11〜図13に対して説明した実施例は、図6〜図10に対して概説した実施例と繋がることができる。特に、図11〜図13に従ってベース層を迂回して引き出された空間イントラ予測パラメータを使用して得られたイントラ予測は、スペクトル的に重み付けされた方法で、上述したように層間予測信号38に結合されるために、図6〜図10の実施例のエンハンスメント層インター予測信号34を表わす。
以下の図面に対して、図1〜図4に対して記載したように、スケーラブルビデオエンコーダまたはデコーダが、どのようにして出願の別の実施例に従って本出願の実施の形態を形成するかが説明される。後で、以下に記載された実施例のために、追加の実現例が実施例TとUを参照して提示される。
図14は、エンハンスメント層信号400とベース層信号200の画像22bと22aを、それぞれ時間的登録方法で示す。現在、符号化/復号化されるべき部分は28で示されている。現在の実施例に従って、ベース層信号200は、ベース層信号を空間的に変化させているベース層符号化パラメータを使用して、スケーラブルビデオエンコーダによって予測的に符号化され、スケーラブルビデオデコーダによって予測的に再構成されている。空間的な変化は、非斜線領域によって囲まれた斜線部分132を使用して、図14に示されている。斜線部分132内では、ベース層信号200を予測的に符号化/再構成化するために使用されるベース層符号化パラメータが一定である。斜線部分132から非斜線領域に移行するとき、ベース層符号化パラメータが変化する。上で概説された実施例によると、エンハンスメント層信号400は、ブロックのユニット内で符号化/再構成化されている。現在の部分28はそのようなブロックである。上で概説された実施例に従って、現在の部分28のためのサブブロックのサブ分割は、ベース層信号200の併置された部分134内で、すなわち、ベース層信号200の時間的に対応する画像22aの空間的に併置された部分内で、ベース層符号化パラメータの空間的変化に基づいて1セットの可能なサブブロックのサブ分割から選択される。
特に、現在の部分28のために、エンハンスメント層サブストリーム6bのサブ分割情報内でシグナリングする代わりに、上の記述が、選択されたサブブロックのサブ分割が、可能なサブブロックのサブ分割のセット内で最も粗いように、現在の部分28の可能なサブブロックのサブ分割のセット内でサブブロックのサブ分割を選択すること、を提示する。そこでは、ベース層信号の併置された部分134の上に移されたとき、ベース層符号化パラメータは、それぞれのサブブロックのサブ分割の各サブブロック内で、互いに十分同様であるように、ベース層信号200をサブ分割する。理解し易くするために、図15aを参照する。図15aは併置された部分134内で、ベース層符号化パラメータの空間的な変化を、斜線を使用して、記載している部分28を示す。特に、部分28は、ブロック28に適用されている異なるサブブロックのサブ分割が、3回示されている。特に、四分木のサブ分割が、図15aの場合に例示的に使用されている。すなわち、可能なサブブロックのサブ分割のセットは、四分木のサブ分割である(あるいは、それによって定義される)。そして、図15aに表現された部分28のサブブロックのサブ分割の3つの具体例が、ブロック28の四分木のサブ分割の異なる階層のレベルに属する。下から上まで、サブブロック内のブロック28のサブ分割のレベルまたは粗さは増加する。最高レベルでは、部分28はそのまま残される。次の下のレベルでは、ブロック28は4つのサブブロックにサブ分割される。そして、少なくとも後者の1つは、次の下のレベルなどでさらに4つのサブブロックにサブ分割される。図15a内で、各レベルにおいて、四分木のサブ分割は、サブブロックの数が最も小さい場所、それでも、ベース層符号化パラメータ変化境界と重複しているサブブロックでない場所が選択される。すなわち、図15aの場合、ブロック28をサブ分割するために選択されるべきブロック28の四分木のサブ分割は、図15aに示されている中で最も低いものであると認められる。ここで、ベース層のベース層符号化パラメータは、サブブロックのサブ分割のそれぞれのサブブロックに併置された各部分の中で一定である。
従って、ブロック28のためのサブ分割情報は、エンハンスメント層サブストリーム6b内でシグナリングされる必要はない。その結果、符号化効率が増加する。そのうえ、概説されているように、サブ分割を得る方法は、どんなグリッド(格子)に関する現在の部分28の位置、または、ベース層信号200のサンプルアレイのどんな登録にも関係なく適切である。また、特に、サブ分割導出は、ベース層とエンハンスメント層との間の断片的な空間分解比率の場合に働く。
このようにして決定された部分28のサブブロックのサブ分割に基づいて、部分28は、予側的に再構成/符号化される。上の記述に対して、異なる可能性が、現在のブロック28の異なる利用可能なサブブロックのサブ分割の粗さを「測る」ために存在することに注意するべきである。例えば、粗さの大きさはサブブロックの数に基づいて決定される。それぞれのサブブロックのサブ分割が有しているサブブロックが多いほど、レベルはより低くなる。この定義は、それぞれのサブブロックのサブ分割のサブブロックの数と、それぞれのサブブロックのサブ分割の全てのサブブロックの最も小さいサイズとの組み合わせによって、「粗さの大きさ」が決定される図15aの場合において、明らかに適用されない。
完全を期すために、図15bは、利用可能なセットとして、図35のサブ分割を例示的に使用するとき、現在のブロック28のために利用可能なサブブロックのサブ分割の1セットから一つの可能なサブブロックのサブ分割を選択する場合を例示的に示す。異なる斜線(および非斜線)は、ベース層信号内のそれぞれに併置された領域が、それらに関連した同じベース層符号化パラメータを有している領域を示す。
前述したように、概説された選択は、粗さの増加するレベルまたは減少するレベルの順序のように、ある連続した順序に従って、可能なサブブロックのサブ分割を横断し、かつ、それぞれのサブブロックのサブ分割の各サブブロック内で、ベース層符号化パラメータが互いに十分同様である状況で、可能なサブブロックのサブ分割からその可能なサブブロックのサブ分割を選択することによって実行される。(増加する粗さのレベルに従う横断を使用する場合において)もはや適用されない。あるいは、(減少する粗さのレベルに従う横断を使用する場合において)最初にたまたま適用する。二者択一的に、全ての可能なサブ分割がテストされる。
図14と図15a、図15bの記述において、広義語「ベース層符号化パラメータ」は、好ましい実施の形態の中で使用されるけれども、これらのベース層符号化パラメータは、ベース層予測パラメータ、すなわち、ベース層信号の予測の形成に関するけれども、予測残差の構成に関連しないパラメータを表す。従って、例えば、ベース層符号化パラメータは、空間予測(角度方向などの空間予測に割り当てられたベース層信号のブロック/部分のための予測パラメータ)と時間予測(動きパラメータなどの時間予測に割り当てられたベース層信号のブロック/部分のための予測パラメータ)との間を区別する予測モードを含む。
しかしながら、所定のサブブロック内で、ベース層符号化パラメータの類似性の「十分」の定義は、ベース層符号化パラメータのサブセットを決定/定義するだけである。例えば、類似性は、予測モードだけに基づいて決定される。あるいはまた、さらに空間予測および/または時間予測を調整する予測パラメータは、所定のサブブロック内でベース層符号化パラメータの類似性が依存するパラメータを形成する。
さらに、既に概説したように、互いに十分に類似になるために、所定のサブブロック内で、ベース層符号化パラメータは、それぞれのサブブロック内で互いに完全に等しい必要がある。あるいはまた、使用される類似性の大きさは、「類似性」の基準を満たすために、所定の間隔の範囲内であることが必要である。
上に概説したように、選択されたサブブロックのサブ分割は、ベース層信号から予測される、または、転送される量だけではない。むしろ、ベース層符号化パラメータ自体が、それに基づいて、ベース層信号からエンハンスメント層信号に、選択されたサブブロックのサブ分割を転送することによって得られたサブブロックのサブ分割のサブブロックのためのエンハンスメント層符号化パラメータを得るために、エンハンスメント層信号に転送される。動きパラメータに関する限り、例えば、スケーリングは、ベース層からエンハンスメント層へ転送するために使用される。好ましくは、ベース層の予測パラメータのそれらの部分または構文要素のみが、類似性の大きさに影響するベース層から得られた現在の部分のサブブロックのサブ分割のサブブロックを設定するために使用される。この大きさによって、選択されたサブブロックのサブ分割の各サブブロック内の予測パラメータのこれらの構文要素が、どうにか互いに同様であるという事実は、現在の部分308のサブブロックの対応する予測パラメータを予測するために使用されるベース層予測パラメータの構文要素が、同様である、または、互いと等しくさえあることを保証する。その結果、いくつかの変化を可能にする最初の場合に、それぞれのサブブロックによってカバーされたベース層信号の部分に対応するベース層予測パラメータの構文要素のいくつかの重要な「意味」が、対応するサブブロックのための予測因子として使用される。しかしながら、また、類似性の大きさに寄与する構文要素の部分のみが、モード特定ベース層予測パラメータが類似性の大きさ決定に参加するけれども、現在の部分28のサブブロックのモードを推測または予め設定するように、サブ分割の転写自体だけを追加してエンハンスメント層のサブ分割のサブブロックの予測パラメータを予測するために使用されることもある。
ベース層からエンハンスメント層へのサブ分割層間予測だけを使用しないというそのような1つの可能性は、現在、次の図(図16)に対して説明される。図16は、プレゼンテーション時間軸24に沿って登録された方法で、エンハンスメント層信号400の画像22bと、ベース層信号200の画像22aを示す。
図16の実施の形態に従って、ベース層信号200は、ベース層信号200の画像22aを、イントラブロックおよびインターブロック内にサブ分割することによって、スケーラブルビデオデコーダによって予測的に再構成され、そして、スケーラブルビデオエンコーダの使用によって予測的に符号化される。図16の例に従って、後者のサブ分割は2ステージ法でなされる。まず、フレーム22aは、正規に、図16内で参照符号302によって示された、最も大きいブロックまたは最も大きい符号化ユニットに、その周辺に沿って二重線を使用して、サブ分割される。それから、それぞれの最も大きいブロック302が、前述のイントラブロックおよびインターブロックを形成している符号化ユニット内の階層的四分木のサブ分割に従属させられる。その結果、それらは、最も大きいブロック302の四分木のサブ分割の葉である。図16では、参照符号304は、これらの葉のブロックまたは符号化ユニットを示すために使用される。通常、実線は、これらの符号化ユニットの周辺を示すために使用される。一方、空間イントラ予測はイントラブロックのために使用される。時間インター予測はインターブロックのために使用される。空間イントラ予想と時間インター予測とに関連した予測パラメータは、それぞれ、より小さいブロックのユニット内にセットされる。しかしながら、イントラおよびインターブロックまたは符号化ユニット304は、サブ分割される。そのようなサブ分割は、より小さいブロックを示すために参照符号306を使用して、符号化ユニット304の1つに対して、図16で例示的に示される。より小さいブロック304は、点線を使用して輪郭が描かれる。すなわち、図16の実施の形態の場合、空間的なビデオエンコーダは、ベース層のそれぞれの符号化ユニット304に対して、一方の空間予測と他方の時間予測との間で選択する機会を有している。しかしながら、エンハンスメント層信号に関する限り、自由度は増加する。ここで、特に、エンハンスメント層信号400のフレーム22bは、エンハンスメント層信号400のフレーム22bがサブ分割される符号化ユニット内で、空間イントラ予測と時間インター予測だけではなく、以下に詳細に概説されるような層間予測も含む1セットの予測モードのそれぞれの1つに割り当てられる。これらの符号化ユニット内のサブ分割は、ベース層信号に対して説明されるように同じ方法でなされる。先ず、フレーム22bは正規に、階層的な四分木のサブ分割過程内で、通常の実線を使用して、外形が形成された符号化ユニット内に、サブ分割される二重線を使用して、輪郭が描かれた最も大きいブロックの行と列にサブ分割される。
エンハンスメント層信号400の現在の画像22bの1つの符号化ユニット308は、例示的に、層間予測モードに割り当てられると推論され、斜線を使用して示される。図14、図15aおよび図15bと同様の方法で、図16は、312で、符号化ユニット308のサブ分割が、ベース層信号から局所転送によって予測的にどのように得られるかを示す。特に、符号化ユニット308によって重畳された局部領域が、312に示されている。この領域内では、点線はベース層信号の隣接しているブロックの間の境界、または、より一般的にベース層のベース層符号化パラメータが経由しておそらく変化する境界を示す。その結果、これらの境界は、ベース層信号200の予測ブロック306の境界であり、そして、それぞれベース層信号200の隣接している符号化ユニット304、または、等しく隣接している最も大きい符号化ユニット302の間の境界と部分的に一致する。312における点線は、ベース層信号200からの局部転送によって導出された/選択された予測ブロック内の現在の符号化ユニット308のサブ分割を示す。局部転送に関する詳細は、前述した。
図16の実施の形態に従って、既に説明したように、予測ブロック内のサブ分割だけでなくベース層からも採用される。むしろ、領域312内で使用されたベース層信号の予測パラメータが、エンハンスメント層信号400の符号化ユニット308の予測ブロックに対して、予測を実行するために使用されるべき予測パラメータを得るために使用される。
特に、図16の実施の形態に従って、予測ブロック内のサブ分割が、ベース層信号から得られるだけでなく、予測モードも、得られたサブ分割のそれぞれのサブブロックによって局所的にカバーされたそれぞれの領域を符号化/再構成化するために、ベース層信号200内で使用される。1つの例が以下である。前述に従って符号化ユニット308のサブ分割を得るために、予測モードが、関連しているベース層信号200と繋がって使用される。モード特有の予測パラメータは、上で議論した「類似性」を決定するために使用される。従って、図16で示された異なる斜線は、ベース層の異なる予測ブロック306に対応する。異なる予測ブロック306の各々は、イントラまたはインター予測モード(すなわち、それらに関連した空間または時間予測モード)を有している。上で説明したように、「十分に類似」になるために、符号化ユニット308のサブ分割のそれぞれのサブブロックに併置された領域内で使用された予測モードと、サブエリア内でそれぞれの予測モードのために特定の予測パラメータとは、互いに完全に等しくなければならない。あるいはまた、多少の変化には耐えられるかも知れない。
特に、図16の実施の形態に従って、左上から右下に延びる斜線によって示された全てのブロックは、ベース層信号の局所的に対応する部分が、それらに関連した空間イントラ予測モードを有している予測ブロック306によってカバーされているので、符号化ユニット308のイントラ予測ブロックにセットされ得る。一方、他のブロック(すなわち、左下から右上に延びる斜線によって示されたブロック)は、ベース層信号の局所的に対応する部分が、それらに関連した時間インター予測モードを有している予測ブロック306によってカバーされているので、インター予測ブロックにセットされ得る。
一方、代替の実施の形態に対して、予測の導出が、符号化ユニット308内中で、予測を実行するための詳細がここで停止さられる。すなわち、予測ブロック内の符号化ユニット308のサブ分割の導出と、非時間予測または空間予測を使用して符号化された予測ブロック内および時間予測を使用して符号化された予測ブロック内のこれらの予測ブロックの割り当てと、が制限でき。それは図16の実施の形態に従わない。
後者の実施の形態に従って、それに割り当てられた非時間予測モードを有する符号化ユニット308の全ての予測ブロックは、これらの非時間モードのブロックのエンハンスメント層予測パラメータとして、ベース層信号200の局所的に一致しているイントラブロックの予測パラメータから導出された予測パラメータを使用している間、空間イントラ予測などの非時間予測を受ける。その結果、そのような導出は、ベース層信号200の局所的に併置されたイントラブロックの空間予測パラメータに関連する。例えば、そのような空間予測パラメータは、空間予測が実行される角度方向の指示であってもよい。上に概説したように、空間ベース層予測パラメータが、符号化ユニット308のそれぞれの非時間予測ブロックが、互いに同じであることによって重畳する、または、符号化ユニット308のそれぞれの非時間予測ブロックに対して、空間ベース層予測パラメータの平均が、それぞれの非時間予測ブロックが、それぞれの非時間予測ブロックの予測パラメータを導出するために使用されることによって重畳する、といういずれか一方の自身による類似性の定義が必要である。
あるいはまた、割り当てられた非時間予測モードを有している符号化ユニット308の全ての予測ブロックは、以下の方法で、層間予測を受ける。先ず、ベース層信号が、少なくとも符号化ユニット308の非時間予測モード予測ブロックに空間的に併置されたそれらの領域内で、層間予測信号を得るために分解または品質改良を受ける。そして、次に、符号化ユニット308のこれらの予測ブロックが、層間予測信号を使用して、予測される。
スケーラブルビデオデコーダとエンコーダは、初期設定によって、符号化ユニット308の全てに、空間予測または層間予測を受けさせる。あるいはまた、スケーラブルビデオエンコーダ/デコーダは、両方の代替をサポートし、符号化ビデオデータストリーム信号内でシグナリングする。そのバージョンは、符号化ユニット308の非時間予測モード予測ブロックに関する限り使用される。特に、両方の代替間での決定は、例えば、個別的に符号化ユニット308のどんな大きさでも、データストリーム内でシグナリングされる。
符号化ユニット308の別の予測ブロックに関する限り、符号化ユニット308は、ちょうどそれが非時間予測モード予測ブロックの場合であるとして、局所的に一致しているインターブロックの予測パラメータから導出される予測パラメータを使用して、時間インター予測を受ける。その結果、導出は、順に、ベース層信号の対応している部分に割り当てられた動きベクトルに関連する。
それに割り当てられた空間イントラ予測モードと時間インター予測モードのいずれも有している全ての別の符号化ユニットに対して、別の符号化ユニットは、空間予測または時間予測を、以下の方法で受ける。特に、別の符号化ユニットは、それに割り当てられた予測モードを有している予測ブロック内に更にサブ分割される。予測モードは、符号化ユニット内で、予測ブロックの全てに対して共通し、特に、それぞれの符号化ユニットに割り当てられる同じ予測モードである。すなわち、符号化ユニット308などの符号化ユニットと異なっていて、それに関連した空間イントラ予測モードを有している、または、それに関連した時間インター予測モードを有している符号化ユニットが、同じ予測モードの予測ブロックにサブ分割される。すなわち、予測モードは、それらがそれぞれの符号化ユニットのサブ分割によって導出したそれぞれの符号化ユニットから受け継ぐのみである。
308を含む全ての符号化ユニットのサブ分割は、予測ブロック内の四分木のサブ分割であり得る。
符号化ユニット308のような層間予測モードの符号化ユニットと、空間イントラ予測モードまたは時間的インター予測モードの符号化ユニットとの間の更なる差は、空間イントラ予測モード符号化ユニットまたは時間インター予測モード符号化ユニットの予測ブロックに、空間予測および時間予測をそれぞれ受けさせるときである。予測パラメータは、例えば、エンハンスメント層サブストリーム6b内でシグナリングする方法によって、ベース層信号200などに依存することなくセットされる。符号化ユニット308のようなそれらに関連する層間予測モードを有しているそれら以外の符号化ユニットのサブ分割でさえ、エンハンスメント層信号6b内でシグナリングされる。すなわち、308などの層間予測モード符号化ユニットは、低いビット伝送速度の信号化の必要性の利点がある。実施の形態に従って、符号化ユニット308自体のモード指標は、エンハンスメント層サブストリーム内でシグナリングされる必要がない。任意に、別のパラメータは、個々の予測ブロックのために、予測パラメータ残差などの符号化ユニット308に対して送信される。追加的に、または、二者択一的に、符号化ユニット308ための予測残差が、エンハンスメント層サブストリーム6b内で送信され/シグナリングされる。一方、スケーラブルビデオデコーダは、エンハンスメント層サブストリームからのこの情報を検索し、現在の実施の形態に従ったスケーラブルビデオエンコーダは、これらのパラメータを決定して、これらのパラメータをエンハンスメント層サブストリーム6b内に挿入する。
換言すれば、ベース層信号200の予測は、ベース層符号化パラメータを使用して、ベース層符号化パラメータが、ベース層ブロック304のユニット内で、ベース層信号200を空間的に変化するという方法でなされる。ベース層について利用可能な予測モードは、例えば、空間および時間予測を含む。ベース層符号化パラメータは、さらに、角度方向(空間的に予測されたブロック304に関連する限り)、および、動きベクトル(時間的に予測されたブロック304に関する限り)のような予測モードの個別の予測パラメータを含む。後者の予測モードの個別の予測パラメータは、ベース層ブロック304より小さいユニット内で、すなわち、前述の予測ブロック306内で、ベース層信号を変化する。十分な類似性の前に概説した要件を満足させるために、それぞれ可能なサブブロックのサブ分割の領域を重複している全てのベース層ブロック304の予測モードが、互いに等しい、ということが必要である。そして、それぞれのサブブロックのサブ分割のみが、選択されたサブブロックのサブ分割を得るために選抜候補リストに入れられる。しかしながら、要件は更に厳しい。それは、それぞれのサブブロックのサブ分割の共通領域を重複している、予測ブロックの予測モード個別予測パラメータも、互いに等しくなければならないということである。ベース層信号内で、このそれぞれのサブブロックのサブ分割および対応する領域の各サブブロックに対して、この要件を満足するサブブロックのサブ分割のみが、最終選択されたサブブロックのサブ分割を得るために選抜候補リストに入れられる。
特に、上に簡潔に概説したように、可能なサブブロックの分割のセット内で、選択を実行する方法に対して様々な可能性がある。更に詳細にこれについて概説するために、図15cと図15dを参照する。セット352が、現在のブロック28の全ての可能なサブブロックのサブ分割354を取り囲むと仮定する。当然、図15cは単に一例を示す。現在のブロック28の可能な、または、利用可能なサブブロックのサブ分割のセット352は、初期設定によってスケーラブルビデオデコーダとスケーラブルビデオエンコーダに知られている、または、例えば画像または同様のものの系列などの符号化データストリーム内でシグナリングされる。図15cの例に従って、セット352の各メンバー、すなわち、それぞれの利用可能なサブブロックのサブ分割354は、チェック356を受け、それぞれのサブブロックのサブ分割354をエンハンスメント層からベース層に転送することによって、サブ分割されるベース層信号の併置された部分108内の領域が、予測ブロック306および符号化ユニット304によって単に重畳されるか否かをチェックされる。そして、ベース層符号化パラメータが、十分な類似性の要件を満たしているか否かをチェックする。例えば参照番号354が付いている例示的なサブ分割を参照されたい。この例示的に利用可能なサブブロックのサブ分割に従って、現在のブロック28は、4つの四分円/サブブロック358にサブ分割される。そして、左上のサブブロックは、ベース層内で、領域362に対応している。明らかに、この領域362は、ベース層の4つブロック(すなわち、予測ブロック内の別のサブ分割でなくて、その結果、予測ブロック自身を表わす、2つの予測ブロック306と2つの符号化ユニット304)に重複する。従って、仮に、領域362を重複しているこれらの予測ブロックの全てのベース層符号化パラメータが、類似性の基準を満足し、そして、これが更に可能なサブブロックのサブ分割354の全てのサブブロック/四分円、および、それらの対応する領域を重複しているベース層符号化パラメータの場合であるならば、この可能なサブブロックのサブ分割354は、それぞれのサブブロックのサブ分割のサブブロックによってカバーされた全ての領域に対して十分な要件を満たして、サブブロックのサブ分割のセット364に属する。それから、このセット364内で、最も粗いサブ分割は矢印366によって示されるように選択され、その結果、セット352から、選択されたサブブロックのサブ分割368が得られる。
明らかに、セット352の全てのメンバーに対してチェック356を実行することを避けようとすることは好ましい。従って、図15dに示すように、かつ、前述したように、可能なサブ分割354が大きさを増加または減少するために横断される。横断は、双頭矢印372を使用して示される。図15dは、少なくとも利用可能なサブブロックのサブ分割のいくつかに対して、大きさのレベルまたは大きさが互いに等しいことを示す。換言すれば、大きさの増加または減少するレベルに従った順序付けはあいまいである。しかしながら、そのような等しく粗い可能なサブブロックのサブ分割の1つが、セット364に属するだけなので、これは、セット364に属する「最も大きいサブブロックのサブ分割」の検索を妨げない。従って、選択されるべきサブブロックのサブ分割354である2番目から最後へ横断された可能なサブブロックのサブ分割で、大きさが増加するレベルの方向に横断するときには、基準チェック356の結果が、充填されるから充填されないへと変わると直ぐに、最も大きい可能なサブブロックのサブ分割368が発見できる。または、サブブロックのサブ分割368である大部分が最近横断されたサブブロックのサブ分割で、大きさが減少するレベルの方向に横断するときには、基準チェック356の結果が、充填されないから充填されるへと切り替わる。
以下の図に対して、図1〜図4に対して前述したようなスケーラブルビデオエンコーダまたはデコーダが、本願の別の実施の態様に従って本願の実施の形態を形成するために実施される。以下で記載された実施例の可能な実施の形態が、実施例K、A、およびMを参照しながら提示される。
実施例について説明するために、図17を参照する。図17は現在の部分28の時間予測32に対する可能性を示す。その結果、図17の以下の記述は、層間予測信号との組み合わせに関連する限り、図6〜図10に関する記述に組み合わされる。あるいは、時間層間予測モードとの組み合わせに関連する限り、図11〜図13に関する記述に組み合わされる。
図17に示された状況は、図6に示された状況に対応する。すなわち、ベース層信号200とエンハンスメント層信号400とは、斜線を使用して示されている既に符号化/復号化された部分と共に、示されている。エンハンスメント層信号400内で、現在、符号化/復号化されるべき部分は、ここで、例示的に、現在の部分28の上のブロック92と左の94として記載された、隣接するブロック92と94とを有している。両方のブロック92と94は、例示的に、現在のブロック28と同じサイズを持っている。しかしながら、サイズの一致は必須ではない。むしろ、サブ分割されているエンハンスメント層信号400の画像22b内のブロックの部分は、異なるサイズを有する。それらは矩形にさえ制限されない。それらは、長方形、または、他の形でもよい。別の隣接しているブロックを有する現在のブロック28は、図17に明確に記載されていない。しかしながら、別の隣接しているブロックは、未だ符号化/復号化されていない。すなわち、それらは、符号化/復号化の順序で続き、その結果、予測のために利用できない。これ以外に、既に符号化/復号化の順序に従って符号化/復号化されたブロック92および94より他のブロック、例示的に、現在のブロック28の隣の、現在のブロック28の左上斜めにあるブロック96が存在する。しかし、ブロック92と94は、ここで考慮された例において、インター予測30を受ける現在のブロック28のためのインター予測パラメータを予測する役割をする、隣接するブロックを予め決められる。そのような予め決められた隣接するブロックの数は、2つに制限されない。それは、1より大きくてもよいし、単に1でもよい。可能な実施の形態の議論は図36〜図38に対して提示される。
スケーラブルビデオエンコーダとスケーラブルビデオデコーダは、その左上のサンプルなどの現在の部分28内に、例えば、予め決められたサンプル位置98に依存している、既に符号化された隣接しているブロック(ここでは、ブロック92〜96)のセットから、予め決められた隣接しているブロック(ここでは、ブロック92,94)のセットを決定する。例えば、現在の部分28のそれらの既に符号化された隣接しているブロックのみが、予め決められたサンプル位置98に直接隣接したサンプル位置を含む「予め決められた隣接しているブロック」のセットを形成する。さらなる可能性は図36〜図38に対して説明される。
どのような場合でも、復号化/符号化の順序に従って、動きベクトル504によって現在のブロック28の併置された位置から置き換えられた、エンハンスメント層信号400の以前に符号化/復号化された画像22bの部分502が、単なるコピーや補間などによって予測される部分28のサンプル値に基づいて再構成されたサンプル値を含む。このために、動きベクトル504は、エンハンスメント層サブストリーム6b内でシグナリングされる。例えば、現在のブロック28のための時間予測パラメータは、部分28のサンプル上にコピーされるために、任意に補間によって参照画像22b内の部分28の併置された位置から部分502の置換を示している変位ベクトル506を示す。
どのような場合でも、現在のブロック28を時間的に予測する時に、スケーラブルビデオデコーダ/エンコーダは、ベース層サブストリーム6aを使用して、ベース層200を既に再構成している(そして、エンコーダの場合は、既に符号化している)。少なくとも、時間的に対応する画像22aの関連する空間的に対応する領域がそのように関連する限り、前述したように、ブロック的な予測を使用し、そして、例えば、空間予測モードと時間予測モードとの間のブロック的な選択を使用する。
図17において、ベース層信号200の画像22aを併置された時間が、数ブロック104にサブ分割されている。ブロック104は、例示的に表わされる現在の部分28に局所的に対応している領域で、周りに位置する。ちょうどそれは、エンハンスメント層信号400内の空間的に予測されたブロックを有する場合である。空間予測パラメータは、ベース層信号200内でそれらのブロック104に対してベース層サブストリーム6a内に含まれ、またはシグナリングされる。空間予測モードの選択は、ベース層信号200に対してシグナリングされる。
ここで、例示的に、時間イントラ層予測32が選択されたブロック28に対して、符号化データストリームからエンハンスメント層信号の再構成を可能にするために、動きパラメータのようなインター予測パラメータが、以下の方法のどれかを使用して決定される。
最初の可能性は図18に対して説明される。特に、先ず、動きパラメータ候補514のセット512が、予め決められたブロック92と94のようなフレームの隣接する既に再構成されたブロックから集められる、または、発生される。動きパラメータは動きベクトルである。ブロック92と94の動きベクトルは、(その中に、)それぞれ1と2が記された矢印516と518を使用して、表わされる。図示されているように、これらの動きパラメータ516と518は、直接に候補514を形成する。いくつかの候補は図18に示すように、518や516のような動きベクトルを結合することによって形成される。
さらに、部分28に併置された、ベース層信号200のブロック108の1つ以上のベース層動きパラメータ524のセット522は、ベース層動きパラメータから集められ、または、生成される。換言すれば、ベース層内で併置されたブロック108に関連した動きパラメータは、1つ以上のベース層動きパラメータ524を得るために使用される。
その時は、1つ以上のベース層動きパラメータ524、または、それのスケーリングされたバージョンが、動きパラメータ候補の拡張動きパラメータ候補セット528を得るために、動きパラメータ候補514のセット512に加算526される。これは、候補514のリストの終わりでベース層動きパラメータ524を単に追加するような多様な方法で、または、一例が図19aに対して概説される異なる方法でなされる。
少なくとも拡張動きパラメータ候補セット528の動きパラメータ候補532の一つが、次に、選択される。部分28の動き補償予測によって、時間予測32が、拡張動きパラメータ候補セットの動きパラメータ候補の選択された一つを使用して、実行される。選択534は、リスト/セット528内のインデックス536の方法によって、部分28のためのサブストリーム6bのようなデータストリーム内でシグナリングされる、または、図19aに対して説明される別の方法で実行される。
前述したように、ベース層動きパラメータ523が、マージを使用して、ベース層サブストリーム6aのような符号化データストリーム内で符号化されたか否かがチェックされる。そして、仮に、ベース層動きパラメータ523が、マージを使用して、符号化データストリーム内で符号化されるならば、加算526は抑制される。
図18に従って述べた動きパラメータは、動きベクトル(動きベクトル予測)だけに、または、ブロック、参照インデックスリスト、パーティショニング情報(マージ)毎に、動き仮説の数を含む動きパラメータの完全なセットに関連する。従って、「スケーリングされたバージョン」は、空間スケーラビリティの場合に、ベース層信号とエンハンスメント層信号との間の空間解像度比率に従ってベース層信号内で使用される動きパラメータのスケーリングから由来する。符号化データストリームの方法によって、ベース層信号のベース層動きパラメータの符号化/復号化が、例えば空間的または時間的な動きベクトル予測、または、マージ化に関わる。
マージ/動きベクトル候補532のセット528内のベース層信号の併置された部分108で使用された動きパラメータ523の編入526は、イントラ層候補514と1つ以上の層間候補524との中で、非常に有効な索引を可能にする。選択534は、予測ブロック毎に、符号化ユニットまたは同様のもの毎に、エンハンスメント層信号6b内の動きパラメータ候補の拡張されたセット/リスト内のインデックスの明白なシグナリングに関わる。あるいはまた、選択インデックス536は、エンハンスメント層信号6bの別の情報、または、層間の情報から推論される。
図19aの可能性に従って、部分28のためのエンハンスメント層信号のための最終動きパラメータ候補リストの形成542は、図18に関して概説されているように、任意に実行されるだけである。すなわち、形成542は、528または512でもよい。しかしながら、リスト528/512は、例えば、併置されたベース層ブロック108の(動きベクトル523によって表わされた)動きパラメータなどのベース層動きパラメータに依存して順序付け544される。例えば、メンバー(すなわち、リスト528/512の動きパラメータ候補532または514)のランクが、動きパラメータ523の潜在的にスケーリングされたバージョンに対して、それぞれのメンバーの偏差に基づいて決定される。偏差が大きいほど、順序付けリスト528/512´内のそれぞれのメンバー532/512のランクが低い。その結果、順序付け544は、リスト528/512のメンバー532/514毎に、偏差の大きさの決定に関わる。順序付けリスト528/512´内の1つの候補532/512の選択534は、エンハンスメント層信号の部分28に対して、順序付けられた動きパラメータ候補リスト528/512´からエンハンスメント層動きパラメータを得るために、符号化データストリーム内の明らかにシグナリングされたインデックス構文要素536を経由して実行され、制御される。そして、次に、時間予測32は、エンハンスメント層信号の部分28の動き補償予測によって、インデックス536が534を指す、選択された動きパラメータを使用して実行される。
図19aで言及された動きパラメータに対して、上で図18に関して述べられた動きパラメータが適用される。符号化データストリームからのベース層動きパラメータ520の復号化は、(任意に)空間的または時間的動きベクトル予測、または、マージに関わる。順序付けが、ちょうど、エンハンスメント層信号の現在のブロックに併置されたベース層信号のブロックに関連して、それぞれのエンハンスメント層動きパラメータ候補とベース層信号のベース層動きパラメータとの間の差を大きくする大きさに従ってなされる。すなわち、エンハンスメント層信号の現在のブロックに対して、エンハンスメント層動きパラメータ候補のリストが、最初に決定される。次に、順序付けが実行されることが、説明される。以下に、選択は明白なシグナリングで実行される。
あるいはまた、順序付け544が、エンハンスメント層信号の現在のブロック28に併置されたベース層信号のブロック108に関連しているベース層信号のベース層動きパラメータ523と、ベース層内の空間的および/または時間的に隣接するブロック548のベース層動きパラメータ546との間の差を大きくする大きさに従ってなされる。次に、ベース層内の決定された順序付けが、エンハンスメント層に転送される。その結果、エンハンスメント層動きパラメータ候補が、対応するベース層候補に対して、決定された順序付けと同じ方法で、順序付けされる。この点で、関連ベース層ブロック548が、考慮されたエンハンスメント層動きパラメータに関連する、隣接するエンハンスメント層ブロック92と94に空間的/時間的に併置されるとき、ベース層動きパラメータ546が、隣接しているエンハンスメント層ブロック92,94のエンハンスメント層動きパラメータに対応すると言われる。あるいはまた、関連ベース層ブロック548と現在のエンハンスメント層ブロック28に併置されたブロック108との間の隣接関係(左隣、上隣、A1,A2,B1,B2,B0、または、更なる例に対して図36〜図38を参照)が、現在のエンハンスメント層ブロック28とそれぞれエンハンスメント層隣接ブロック92,94との間の隣接関係と同じであるとき、ベース層動きパラメータ546は、エンハンスメント層隣接ブロック92,94のエンハンスメント層動きパラメータに対応すると言われる。ベース層順序付けに基づいて、選択534が、その時、明白なシグナリングによって実行される。
さらに詳細にこれについて説明するために、図19bを参照する。図19bは、ベース層ヒントを使用して、動きパラメータ候補のリストのために順序付けされるエンハンスメント層を得るための概説される代替の1番目を示す。図19bは、代替の現在のブロック28と、3つの異なる予め決められたサンプル(すなわち、例示的に、左上のサンプル581、左下のサンプル583および右上のサンプル585)の位置とを示す。例は、説明としてのみ挿入される。予め決められた隣接するブロックのセットが、例示的に隣接の4つのタイプを含む。隣接するブロック94aは、サンプル位置581の直上に隣接するサンプル位置587をカバーする。隣接するブロック94bは、サンプル位置585の直上に隣接して位置するサンプル位置589を含む、またはカバーする。同様に、隣接するブロック92aと92bは、サンプル位置581と583の直ぐ左側に隣接して位置するサンプル位置591と593を含む。また、図36〜図38に対して説明されるように、予め決められた数の決定規則にもかかわらず、予め決められた隣接するブロックの数は変化する。それにもかかわらず、予め決められた隣接するブロック92a,92b,94a,94bは、それらの決定規則によって区別できる。
図19bの代替に従って、それぞれ予め決められた隣接するブロック92a,92b,94a,94bに対して、ベース層内の併置されたブロックが決定される。例えば、このために、それぞれ隣接するブロックの左上のサンプル595が使用される。ちょうどそれは、図19a内で正式に言及された左上のサンプル581に関して、現在のブロック28を有する場合である。これは、図19b内で、点線の矢印を使用して説明される。この手段によって、予め決められた隣接するブロックのそれぞれに対して、対応するブロック597が、併置されたブロック108、併置された現在のブロック28に加えて発見される。併置されたベース層ブロック597の動きパラメータm1,m2,m3,m4と、併置されたベース層ブロック108のベース層動きパラメータmに対するそれらのそれぞれの差とを使用して、予め決められた隣接するブロック92a,92b,94a,94bのエンハンスメント層M1,M2,M3,M4が、リスト528または512内で順序付けされる。例えば、m1〜m4のどれかの距離が大きければ大きいほど、対応するエンハンスメント層動きパラメータM1〜M4はより高い。すなわち、より高いインデックスリストが、リスト528/512´から同じ状態で索引を付けるために必要である。距離の大きさに対して、絶対差が使用される。同様にして、動きパラメータ候補532または514は、エンハンスメント層動きパラメータM1〜M4の結合であるそれらのランクに対して、リスト内で再配列される。
図19cは、ベース層内の対応するブロックが、別の方法で決定される代替を示す。特に、図19cは、現在のブロック28の予め決められた隣接ブロック92a,92b,94a,94b、および、現在のブロック28の併置されたブロック108を示す。図19cの実施の形態に従って、現在のブロック28のこれらに対応するベース層ブロック(すなわち、92a,92b,94a,94b)が、これらのベース層ブロックが、これらのベース層隣接ブロックを決定するために同じ隣接決定規則を使用して、エンハンスメント層隣接ブロック92a,92b,94a,94bに関連付けられるような方法で決定される。特に、図19cは、併置されたブロック108の予め決められたサンプル位置、すなわち、左上、左下、および右上のサンプル位置601を示す。これらのサンプル位置に基づいて、ブロック108の4つの隣接ブロックが、現在のブロック28の予め決められたサンプル位置581,583,585に関するエンハンスメント層隣接ブロック92a,92b,94a,94bに関して記述されたのと同じ方法で決定される。4つのベース層隣接ブロック603a,603b,605a,605bは、この様にして見つけられる。603aは、明らかにエンハンスメント層隣接ブロック92aに対応する。ベース層ブロック603bは、エンハンスメント層隣接ブロック92bに対応する。ベース層ブロック605aは、エンハンスメント層隣接ブロック94aに対応する。ベース層ブロック605bは、エンハンスメント層隣接ブロック94bに対応する。以前説明したのと同じ方法で、ベース層ブロック903a,903b,905a,905bのベース層動きパラメータM1〜M4と、併置されたベース層ブロック108のベース層動きパラメータmに対するそれらの距離とが、エンハンスメント層ブロック92a,92b,94a,94bの動きパラメータM1〜M4から形成されたリスト528/512内で動きパラメータ候補を順序付けるために使用される。
図20の可能性に従って、部分28のためのエンハンスメント層信号のための最終動きパラメータ候補リストの形成562は、図18および/または図19に対して概説されているように、単に任意に実行される。すなわち、形成562は、528または512または528/512´である。参照符号564は図20で使用される。図20に従って、動きパラメータ候補リスト564内で指摘するインデックス566は、例えば、併置されたブロック108に対して、ベース層信号を符号化/復号化するために使用された、動きパラメータ候補リスト568内のインデックス567に依存して決定される。例えば、ブロック108でベース層信号を再構成する際、動きパラメータ候補のリスト568は、予め決められた隣接するエンハンスメント層ブロック92,94と現在のブロック28との間の隣接関係と同じであるブロック108に対して、隣接関係(左側に隣接、上側に隣接、A1,A2,B1,B2,B0、または、別の例に対しては図36〜38参照)を有しているブロック108の隣接するブロック548の動きパラメータ548に基づいて決定される。ここで、リスト567の決定572は、リスト568と564のリストメンバー内の順序付けなどの形成562内で使用されるのと同じ構成規則を潜在的に使用する。より一般的に、エンハンスメント層のためのインデックス566は、その隣接するエンハンスメント層ブロック92,94が、索引をつけられたベース層候補(すなわち、インデックス567が指摘するもの)に関連したベース層ブロック548と併置されたインデックス566によって指摘される方法で決定される。その結果、インデックス567は、インデックス566の重要な予測として機能する。エンハンスメント層動きパラメータは、その時、動きパラメータ候補リスト564内のインデックス566を使用して決定され、そして、ブロック28の動き補償予測は、決定された動きパラメータを使用して実行される。
図20で言及した動きパラメータに対して、図18と図19に関して上述したと同じことが適用される。
以下の図に関して、図1〜図4に対して上述したそれらのように、スケーラブルビデオエンコーダまたはデコーダが、応用の別の実施例に従って、本応用の実施の形態を形成するためにどのようにして実行できるかが記載される。以下に説明される実施例の詳細な実現は、以下で実施例Vを参照して説明される。
本実施例は、エンハンスメント層内の残差符号化に関する。特に、図21は、例示的に、エンハンスメント層信号400の画像22bと、ベース層信号200の画像22aとを、時間的に登録された方法で示す。図21は、スケーラブルビデオデコーダ内で再構成する、または、スケーラブルビデオエンコーダ内で符号化する方法、およびエンハンスメント層信号を示し、エンハンスメント層信号400を表わす変換係数402の予め決められた変換係数ブロックと予め決められた部分404とに集中する。換言すれば、変換係数ブロック402は、エンハンスメント層信号400の部分404の空間分解を表わす。符号化/復号化の順序付けに従って既に上で説明したように、ベース層信号200の対応する部分406は、変換係数ブロック402を復号化/符号化する時に、既に復号化/符号化されている。ベース層信号200に関する限り、予測の符号化/復号化は、ベース層サブストリーム6aなどの符号化データストリーム内のベース層残差信号の信号化を含めて、使用されている。
図21に対して記載された実施例に従って、スケーラブルビデオデコーダ/エンコーダは、ベース層信号またはベース層残差信号の評価408が、部分404に併置された部分406にて、サブブロック412内の変換係数ブロック402のサブ分割の有利な選択をもたらすという事実を利用する。特に、変換係数ブロック402をサブブロックにサブ分割するためのいくつかの可能なサブブロックのサブ分割が、スケーラブルビデオデコーダ/エンコーダによってサポートされる。これらの可能なサブブロックのサブ分割は、規則的に矩形のサブブロック412内の変換係数ブロック402をサブ分割する。すなわち、変換係数ブロック402の変換係数414が、列と行に配置され、そして、可能なサブブロックのサブ分割に従って、これらの変換係数414が、規則的にサブブロック412内に密集させられるので、サブブロック412自身が行と列に並べられる。評価408は、このようにして選択されたサブブロックのサブ分割を使用して、変換係数ブロック402の符号化が、最も効率的であるような方法で、サブブロック412の行の数と列の数との間の比(すなわち、それらの幅と高さとの間の比)を設定可能にする。仮に、例えば、評価408が、併置された部分406内の再構成されたベース層信号200、または少なくとも対応する部分406内のベース層残差信号が、空間領域内の水平なエッジで主として構成される、ということを判明するならば、変換係数ブロック402は、有意さ(すなわち、変換係数レベルが非ゼロである、すなわち、量子化された変換係数が、変換係数ブロック402のゼロ水平周波数側の近くである)を有して、おそらく存在する。垂直なエッジの場合、変換係数ブロック402は、変換係数ブロック402のゼロ垂直周波数側の近くの位置で、非ゼロの変換係数レベルを有して、おそらく存在する。従って、先ず、サブブロック412が、垂直方向に沿ってより長く、かつ、水平方向に沿ってより小さくなるように選択される。そして、2番目に、サブブロックは、水平方向により長く、かつ、垂直方向により小さくされる。後者の場合が模式的に図40に示されている。
すなわち、スケーラブルビデオデコーダ/エンコーダは、ベース層残差信号またはベース層信号に基づいて、可能なサブブロックのサブ分割のセット内で、1つのサブブロックのサブ分割を選択する。その時、変換係数ブロック402の符号化414または復号化が、選択されたサブブロックのサブ分割を適用しながら実行される。特に、変換係数414の位置が、サブブロック412のユニット内で横断されるので、1つのサブブロック内の全ての位置は、サブブロック内で定義されたサブブロックの順序付けの中で、次のサブブロックに直ぐに連続して続く方法で横断される。サブブロック412などの現在訪問されたサブブロックが、図40に例示的に示されている、構文要素は、現在訪問されたサブブロックが有意な変換係数を有するか否かを示す、エンハンスメント層サブストリーム6bなどのデータストリーム内でシグナリングされる。図21では、構文要素416が、2つの例示的なサブブロックに対して説明される。仮に、それぞれのサブブロックのそれぞれの構文要素が、有意でない変換係数を示すならば、他には何も、データストリームまたはエンハンスメント層サブストリーム6b内で送信される必要がない。むしろ、スケーラブルビデオデコーダは、そのサブブロック内の変換係数をゼロに設定する。しかしながら、仮に、それぞれのサブブロックの構文要素416が、このサブブロックは有意な変換係数を有する、ことを示すならば、そのサブブロック内で変換係数に関連する別の情報が、データストリームまたはサブストリーム6b内でシグナリングされる。復号化側では、スケーラブルビデオデコーダが、データストリームまたはサブストリーム6bから、それぞれのサブブロック内の変換係数のレベルを示す構文要素418を復号化する。構文要素418は、それぞれのサブブロック内のこれらの変換係数内の走査順序、および、任意に、それぞれのサブブロック内の変換係数内の走査順序に従って、そのサブブロック内の有意な変換係数の位置を示す。
図22は、評価408内の可能なサブブロックのサブ分割内での選択を実行するためにそれぞれ存在する、異なる可能性を示す。図22は、変換係数ブロック402が部分404のスペクトル分解を表すことに関連する、エンハンスメント層信号の部分404を再び記載する。例えば、変換係数ブロック402は、エンハンスメント層信号を予測的に符号化/復号化するスケーラブルビデオデコーダ/エンコーダを伴う、エンハンスメント層残差信号のスペクトル分解を表わす。特に、変換の符号化/復号化は、エンハンスメント層残差信号を符号化するために、スケーラブルビデオデコーダ/エンコーダによって使用される。変換の符号化/復号化は、ブロック単位の(すなわち、エンハンスメント層信号の画像22bがサブ分割されるブロック内の)方法で実行される。図22は、ベース層信号の、対応するまたは併置された部分406を示す。ここに、スケーラブルビデオデコーダ/エンコーダは、ベース層信号の予測残差に対して(すなわち、ベース層残差信号に対して)変換の符号化/復号化を使用しながら、予測的な符号化/復号化をベース層信号に適用する。特に、ブロック単位の変換は、ベース層残差信号に対して使用される。すなわち、ベース層残差信号は、図22に点線で記載されている個別に変換されたブロックで、ブロック単位で変換される。図22に記載されているように、ベース層の変換ブロックのブロック境界は、併置された部分406の外形と一致する必要はない。
それにもかかわらず、評価408を実行するために、以下のオプションA〜Cの1つまたは組み合わせが使用される。
特に、スケーラブルビデオデコーダ/エンコーダは、符号化/復号化されるべき変換係数ブロック402にサイズで一致する変換係数の変換係数ブロック424を得るために、部分406内で、ベース層残差信号または再構成されたベース層信号に、変換422を実行する。変換係数ブロック424,426内の変換係数の値の分布の検査は、水平周波数の方向428に沿ってサブブロック412の寸法を適切に設定し、かつ、垂直周波数の方向432に沿ってサブブロック412の寸法を適切に設定するために使用される。
追加して、あるいは、二者択一的に、スケーラブルビデオデコーダ/エンコーダは、少なくとも併置された部分406を部分的に重ねる、図22の異なる斜線によって記載されたベース層変換ブロック434の全ての変換係数ブロックを検査する。図22の例示的な場合において、4つのベース層変換ブロックが存在し、次に、それらの変換係数ブロックが検査される。特に、これらのベース層変換ブロックの全ては、互いに異なるサイズであり、変換係数ブロック412に対してさらにサイズが異なる。スケーリング436は、部分406内でベース層残差信号のスペクトル分解の変換係数ブロック438の近似をもたらすために、ベース層変換ブロック434を重ねるこれらの変換係数ブロックに対して実行される。その変換係数ブロック438内の変換係数の値の分布(すなわち、442)は、サブブロックの寸法428と432を適切に設定するために、評価408内で使用される。その結果、変換係数ブロック402のサブブロックのサブ分割が選択される。
さらに、評価408が、追加して、あるいは、二者択一的に、実行される。評価408とは、空間領域内で、エッジ検出444の使用または主な勾配方向の決定(例えば、サブブロックの寸法428と432を適切に設定するために、検出されたエッジの拡大方向に基づいた決定、または、併置された部分406内で決定された勾配)によって、ベース層残差信号または再構成されたベース層信号を検査することである。
上で明確に説明されていないけれども、変換係数の位置とサブブロック412のユニットとを横断することにおいて、変換係数ブロックのゼロ周波数角部(図21の左上隅部)から出発して、ブロック402の最も高い周波数角部(図21の右下隅部)に至る順序で、サブブロック412を横断することが好ましい。さらに、エントロピー符号化が、データストリーム6b内で構文要素にシグナリングするために使用される。すなわち、構文要素416と418は、演算、可変長符号化または別の形式のエントロピー符号化などの、符号化された都合の良いエントロピー符号化である。サブブロック412を横断する順序付けは、408に従って選択されたサブブロック形状にも依存している。それらの高さより広くなるように選択されたサブブロックに対して、縦断の順序は、最初列的にサブブロックを横断して、次に、次の列などに進行する。これを超えて、サブブロックの寸法を選択するために使用されるベース層情報が、ベース層残差信号または自身再構成されたベース層信号自体である、ということに再び注意すべきである。
以下では、上で説明された実施例に組み合わせられる、異なる実施の形態が説明される。以下で記載された実施の形態は、スケーラブルビデオ符号化を更に効率的にするための多くの異なる実施例または手段に関連する。部分的に、上の実施例は、それの別の導出した実施の形態を提示するために、一般概念を保持した状態で、以下で詳細に説明される。これらの以下に提示された記述は、上の実施の形態/実施例の代替または拡張を得るために使用される。しかしながら、以下で記載された実施の形態の大部分は、任意に、上で既に説明された実施例に組み合わされる。すなわち、それらは、同時に1つのスケーラブルビデオデコーダ/エンコーダ内で、上の実施の形態と共に実行される。しかし、その必要はない。
前の記述をより容易に理解するために、実施の形態や実施の形態の組み合わせを取り込んだ適切なスケーラブルビデオエンコーダ/デコーダを実行のためのより詳細な実施の形態が、次に提示される。以下で記載された異なる実施例は、英数字の符号の使用によって列挙される。これらの実施例は、今説明した図面中のこれらの実施例の参照要素のいくつかの記述を、ここでは1つの実施の形態に従って、一般的に実行する。しかしながら、個々の実施例が関する限り、スケーラブルビデオデコーダ/エンコーダの実現内の要素の提供が、あらゆる実施例に関する限り、必要ではない。問題の実施例に依存して、いくつかの要素といくつかの相互接続とが、次に記載された図面内で省略される。それぞれの実施例に対して参照された要素のみが、それぞれの実施例の記述で言及した仕事または関数を実行するために提供される。しかしながら、特に、いくつかの要素が1つの機能に挙げられているとき、代替が存在することもある。
しかしながら、スケーラブルビデオデコーダ/エンコーダの機能の概観を提供するために、次に記載された実施例が実行される。以下の図に示された要素は、今、簡潔に説明される。
図23は、符号化データストリーム6の主のサブ部分(すなわち、6a)が第1の解像度または品質レベルで映像を表わすような方法で、映像が符号化される符号化データストリーム6を復号化するためのスケーラブルビデオデコーダを示す。符号化データストリームの追加部分6bは、増加する解像度または品質レベルで映像の表現に対応している。符号化データストリーム6のデータ量を低く保つために、サブストリーム6aと6bの間の層間の冗長が、サブストリーム6bを形成する際に利用される。以下で記載された実施例のいくつかが、サブストリーム6aが関連するベース層からの層間の予測に向けられ、そして、サブストリーム6bが関連するエンハンスメント層に向けられる。
スケーラブルビデオデコーダは、並行に稼働する2つのブロックベースの予測デコーダ80、60を含み、サブストリーム6aと6bをそれぞれ受信する。図に示すように、デマルチプレクサ40は、別々に復号化ステージ80と60を、対応するサブストリーム6aと6bと共に提供する。
ブロックベースの予測符号化ステージ80と60の内部構造は、図示されているように、同じである。エントロピーがモジュール100を復号化して、復号化ステージ80,60のそれぞれの入力から、エントロピー符号化モジュール100;320、逆変換器560;580、加算器180;340、任意のフィルタ120;300および140;280が、この記述の順序に直列に接続されている。その結果、この直列接続の最後に、再構成されたベース層信号600と再構成されたエンハンスメント層信号360が、それぞれ得られる。一方、加算器180,340とフィルタ120,140,300,280の出力が、それぞれベース層信号とエンハンスメント層信号の再構成の異なるバージョンを提供する。そうすれば、それぞれの予測プロバイダ160;260は、これらのバージョンのサブセットまたは全てを受信して、それに基づいて、予測信号を加算器180;340の残差入力へ提供するために提供する。エントロピー復号化ステージ100;320は、それぞれの入力信号6aと6bから復号化し、変換係数ブロックは逆変換器560;580に入り、予測プロバイダ160;260のための予測パラメータを含むパラメータを符号化する。
従って、予測プロバイダ160と260は、それぞれの解像度/品質レベルで映像のフレームのブロックを予測する。そして、このために、予測プロバイダ160と260は、空間イントラ予測モードや時間インター予測モードのような所定の予測モード内で選択される。両方のモードは、イントラ層予測モード(すなわち、それぞれのレベルが入っているサブストリーム内のデータに唯一依存する予測モード)である。
しかしながら、前述の層間の冗長を利用するために、エンハンスメント層復号化ステージ60は、符号化パラメータ層間予測器240、解像度/品質改良器220、および/または、予測プロバイダ160と比較される予測プロバイダ260を付加的に含む。さらに、/あるいはまた、エンハンスメント層復号化ステージ60は、ベース層復号化ステージ80のイントラステージから得られたデータに基づいたエンハンスメント層予測信号420を提供できる層間予測モードを補助する。解像度/品質改良器220は、層間予測信号380を得るために、再構成されたベース層信号200a,200b,200cまたはベース層残差信号480のどれかに、解像度または品質の改良を受けさせる。符号化パラメータ層間予測器240は、それぞれ予測パラメータや動きパラメータのような符号化パラメータを何らかの形で予測することである。予測プロバイダ260は、例えば、さらに、200a,200b,200cのようなベース層信号の再構成された部分に従って、層間予測モードを補助する。あるいは、増加する解像度/品質レベルに潜在的に改良されたベース層残差信号640の再構成された部分が、参照/基礎として使用される。
前述したように、復号化ステージ60と80は、ブロックベースの方法で操作される。すなわち、映像のフレームは、ブロックのような部分にサブ分割される。異なる粗さレベルは、予測プロバイダ160,260によって実行される予測モード、逆変換器560,580による局所変換、フィルタ120,140によるフィルタ係数選択、および、予測プロバイダ160,260による予測モードのための予測パラメータ設定を割り当てるために使用される。すなわち、フレームを予測ブロックにサブパーティショニングすることは、順に、予測モードが選択されているブロック(例えば、いわゆる符号化ユニットまたは予測ユニット)へのフレームのサブパーティションの続きになる。変換符号化のためにブロックへのフレームのサブパーティション(いわゆる変換ユニット)は、予測ユニットへのパーティションと異なる。予測プロバイダ260によって使用される層間予測モードのいくつかは、以下で実施例に対して説明される。予測プロバイダ260は、いくつかのイントラ層予測モード、すなわち、それぞれの加算器180,340に入力されるそれぞれの予測信号を内部的に導出する予測モード、すなわち、それぞれ、現在のレベルの符号化ステージ60,80に関わる状態に唯一基づいて適用される。
図示されたブロックのいくつかの別の詳細が、以下の個々の実施例の記述から明らかになる。そのような記述が提供された実施例に明確に関連しない限り、これらの記述は、等しく一般に別の実施例と図の記述に転載可能であることに注意されたい。
特に、図23のスケーラブルビデオデコーダのための実施の形態は、図2と図4に従って、スケーラブルビデオデコーダの可能な実現を表す。図23に従ったスケーラブルビデオデコーダは前述されているけれども、図23は、対応するスケーラブルビデオエンコーダを示し、同じ参照符号が図23と図24内の予測符号化/復号方式のイントラ要素のために使用される。理由は前出のとおりである。また、エンコーダとデコーダとの間の一般的な予測基礎を維持する目的のために、ベースとエンハンスメント層信号の再構成可能バージョンは、エンコーダで使用され、また、スケーラブルビデオの再構成可能バージョンを得るために、この終わりまで既に符号化された部分を再構成する。従って、図23の記述との唯一の差は、符号化パラメータ層間予測器240と同様に、予測プロバイダ160と予測プロバイダ260とが、データストリームから予測パラメータを受信するよりむしろ、何らかの比率/歪最適化の過程内で予測パラメータを決定する、ということである。むしろ、プロバイダは、このようにして決定された予測パラメータを、エントロピーデコーダ19aと19bに送信する。エントロピーデコーダ19aと19bは、データストリーム6内に含めるために、マルチプレクサ16を経由して、それぞれのベース層サブストリーム6aとエンハンスメント層サブストリーム6bを順番に送信する。同様の方法で、これらのエントロピーエンコーダ19aと19bが、そのような残差のエントロピー復号化結果を出力するよりもむしろ、変換モジュール724,726が後続の減算器720と722を経由して得られるように、再構成されたベース層信号200および再構成されたエンハンスメント層信号400と、オリジナルのベース層およびエンハンスメント層バージョン4a,4bの間の予測残差を受信する。しかしながら、この他、図24のスケーラブルビデオエンコーダの構造は、図23のスケーラブルビデオデコーダの構造と一致する。従って、これらの問題に関して、図23の上の記述が参照される。ここでは、ちょうど概説されているように、どんなデータストリームからのどんな導出も、それぞれのデータストリーム内へのその後の挿入を有するそれぞれの要素のそれぞれの決定に変えられなければならない。
次に記載された実施の形態に使用されるエンハンスメント層信号のイントラ符号化のための技術は、エンハンスメント層ブロックのために、イントラ予測信号を(ベース層データを使用して)発生させるための複数の方法を含む。これらの方法は、再構成されたエンハンスメント層のサンプルだけに基づいてイントラ予測信号を発生させる方法に追加して提供される。
イントラ予測は、イントラ符号化されたブロックの再構成の過程の一部である。最終再構成ブロックは、変換で符号化された残差信号(ゼロであるかもしれない)をイントラ予測信号に追加することによって得られる。残差信号は、逆変換が後に続いたビットストリーム内で送信された変換係数レベルの逆量子化(スケーリング)によって発生する。
以下の記述は、(ベース層と同じ解像度を有するけれども、より高い品質または忠実度を有する入力ビデオを表わす)品質エンハンスメント層を有するスケーラブル符号化と、(ベース層より高い解像度、つまり、より多くのサンプル数を有する)空間エンハンスメント層を有するスケーラブル符号化とに適用される。品質エンハンスメント層の場合には、ベース層信号の抽出は、ブロック220などの中で必要でないけれども、再構成されたベース層のサンプルのフィルタリング500などには適用される。空間エンハンスメント層の場合には、一般に、ベース層信号の抽出が、例えばブロック220内で要求される。
次に記載された実施例は、エンハンスメント層ブロックのイントラ予測に対して、再構成されたベース層サンプル(200と比べて)またはベース層残差サンプル(640と比べて)を使用するために、異なる方法をサポートする。以下に記載された方法の1つ以上は、イントラ層イントラ符号化(そこでは再構成されたエンハンスメント層サンプル(400と比べて)だけがイントラ予測のために使用される)に加えて、サポートすることができる。特定の方法の使用が、最も大きいサポートされたブロックサイズ(HEVC内のH.264/AVCまたは符号化ツリーのブロック/最も大きい符号化ユニット内のマクロブロックなどのサイズ)のレベルにて、シグナリングされる。または、それは、全てのサポートされたブロックサイズにてシグナリングされる。あるいは、それは、サポートされたブロックサイズのサブセットに対してシグナリングされる。
以下に記載される全ての方法に対して、予測信号が、ブロックのための再構成信号として直接に使用される。すなわち、残差は全く送信されない。または、層間イントラ予測のための選択された方法は、残差符号化と組み合わされる。特定の実施の形態において、残差信号は、変換符号化を経由して送信される。すなわち、量子化された変換係数(変換係数レベル)は、エントロピー符号化技術(例えば、可変長符号化または算術符号化(19bと比べて))を使用して、送信される。そして、残差は、送信された変換係数レベルを逆量子化(スケーリング)して、逆変換(580と比べて)を適用することによって得られる。特定のバージョンでは、層間イントラ予測信号が発生するブロックに対応する完全な残差ブロックが、一つの変換を使用して変換される(726と比べて)。すなわち、全体のブロックが、予測ブロックと同じサイズの一つの変換を使用して変換される。別の実施の形態では、予測ブロックが、(例えば、階層的な分解を使用して、)より小さいブロックにさらにサブ分割される。そして、小さいブロック(また、異なるブロックサイズを有することができる)のそれぞれに対して、別々の変換が適用される。別の実施の形態では、符号化ユニットが、より小さい予測ブロックに分割される。そして、予測ブロックのゼロ以上に対して、予測信号が、層間イントラ予測のための方法の1つを使用して発生する。そして、次に、全体の符号化ユニットの残差が、一つの変換(726と比べて)を使用して変換される。または、符号化ユニットが、異なる変換ユニットにサブ分割される。ここで、変換ユニット(一つの変換が適用されるブロック)を形成するためのサブ分割は、符号化ユニットを予測ブロックに分解するためのサブ分割とは異なる。
特定の実施の形態において、(抽出される/フィルタにかけられる)再構成されたベース層信号(380と比べて)は、予測信号として直接に使用される。エンハンスメント層をイントラ予測するためにベース層を使うための多重方法は、以下の方法を含む。(抽出される/フィルタにかけられる)再構成されたベース層信号(380と比べて)は、エンハンスメント層予測信号として直接に使用される。この方法は、周知のH.264/SVCの層間イントラ予測モードと同様である。この方法において、エンハンスメント層についての予測ブロックは、エンハンスメント層の対応するサンプル位置に整合するために抽出(220と比べて)され、かつ、抽出の前または後に任意にフィルタにかけられた、ベース層再構成信号の併置されたサンプルによって形成される。SVC層間イントラ予測モードと対照して、このモードは、マクロブロックレベル(または、最も大きいサポートされたブロックサイズ)にてサポートされるだけでなく、任意のブロックサイズにてサポートされる。それは、モードは、最も大きいサポートされたブロックサイズに対してシグナリングされるだけではなく、最も大きいサポートされたブロックサイズのブロック(MPEG4,H.264内のマクロブロックと、HEVC内の符号化ツリーブロック/最も大きい符号化ユニット)が、より小さいブロック/符号化ユニットに階層的にサブ分割され、そして、層間イントラ予測モードの使用が、(対応するブロックに対して)どんなサポートさられたブロックサイズにてもシグナリングされることを意味する。特定の実施の形態では、このモードは選択されたブロックサイズのためにサポートされるだけである。次に、このモードの使用をシグナリングする構文要素が、対応するブロックサイズに対してだけ送信される。または、このモードの使用を(別の符号化パラメータ内で)シグナリングする構文要素の値が、別のブロックサイズに対して、対応して制限される。H.264/AVCのSVC拡張内の層間イントラ予測モードとの別の差は、層間イントラ予測モードが、ベース層内の併置された領域がイントラ符号化される場合にサポートされるだけではなく、併置されたベース層領域がインター符号化または一部インター符号化される場合にもサポートされるということである。
特定の実施の形態において、差分信号(実施例A参照)の空間イントラ予測が実行される。多重方法は以下の方法を含む。(潜在的に抽出される/フィルタにかけられる)再構成されたベース層信号(380と比べて)は、空間イントラ予測信号と組み合わされる。そこでは、空間イントラ予測(420と比べて)が、隣接するブロックのための差分サンプルに基づいて得られる(260と比べて)。差分サンプルは、再構成されたエンハンスメント層信号(400と比べて)と、(潜在的に抽出される/フィルタにかけられる)再構成されたベース層信号(380と比べて)との差を表わす。
図25は、(抽出される/フィルタにかけられる)ベース層再構成信号380(BL Reco)と、既に符号化された隣接ブロック736の差分信号734(EH Diff)を使用する空間イントラ予測との合計732によって、層間イントラ予測信号の発生を示す。そこでは、既に符号化されたブロック736のための差分信号(EH Diff)が、再構成されたエンハンスメント層信号(EH Reco)(400と比べて)から、(抽出される/フィルタにかけられる)ベース層再構成信号380(BL Reco)を引き算すること738によって発生する。現在の符号化された/復号化された、ブロック/領域/部分は28である。すなわち、図25に記載された層間イントラ予測方法は、予測ブロックを発生させるために、2つの重畳された入力信号を使用する。この方法のために、差分信号734が必要である。差分信号734は、再構成されたエンハンスメント層信号400と併置された再構成されたベース層信号200との差である。前記ベース層信号200は、エンハンスメント層の対応するサンプル位置に整合するために抽出220され、抽出の前または後に任意にフィルタにかけられる(それが品質スケーラブル符号化の場合であるとき、仮に、抽出が適用されないならば、それはフィルタにかけられる)。特に、空間スケーラブル符号化のために、通常、差分信号734は、主として高周波成分を含む。差分信号734は、全ての既に再構成されたブロック(すなわち、既に符号化/復号化された全てのエンハンスメント層ブロック)に利用可能である。既に符号化/復号化されたブロック736の隣接するサンプル742のための差分信号734は、空間イントラ予測技術(H.264/AVCまたはHEVC内で指定された空間イントラ予測モードなど)への入力として使用される。矢印744によって示された空間イントラ予測によって、予測されるべきブロック28の異なる成分ための予測信号746が発生する。特定の実施の形態では、空間イントラ予測の過程(H.264/AVCまたはHEVCから周知であるように)のどんなクリップ機能も、差分信号734の動的範囲と整合するために変更される、あるいは無効にされる。実際に使用されたイントラ予測方法(複数の提供された方法の1つであり、どんな特定の角度も有する平面イントラ予測、DCイントラ予測、または、方向イントラ予測744を含むことができる)は、ビットストリーム6b内でシグナリングされる。H.264/AVCとHEVCに提供された方法と異なる空間イントラ予測技術(既に符号化された隣接するブロックのサンプルを使用して、予測信号を発生させるための方法)を使用することが可能である。(隣接するブロックの差分サンプルを使用して、)得られた予測ブロック746は、最終予測ブロック420の最初の部分である。
予測信号の第2の部分が、ベース層の再構成された信号200内の併置された領域28を使用して発生する。品質エンハンスメント層に対して、併置されたベース層のサンプルが、直接に使用される、または、例えば、ローパスフィルタまたは高周波成分を減衰させるフィルタ500によって、任意にフィルタにかけられる。空間エンハンスメント層に対して、併置されたベース層のサンプルが抽出される。抽出220のために、FIRフィルタまたはFIRフィルタのセットが使用される。IIRフィルタも使用できる。任意に、再構成されたベース層のサンプル200が、抽出前にフィルタにかけられる。または、ベース層予測信号(ベース層を抽出した後に得られた信号)が、抽出段の後にフィルタにかけられる。ベース層の再構成の過程は、非ブロック化フィルタ(120と比べて)や適応型のループフィルタ(140と比べて)などの1個以上の追加フィルタを含むことができる。抽出のために使用されるベース層再構成200は、いずれかのループフィルタの前の再構成信号である(200cと比べて)。あるいは、それは、非ブロック化フィルタの後、しかし、いずれかの別のフィルタの前の再構成信号である(200bと比べて)。あるいはそれは、特定のフィルタの後の再構成信号、または、ベース層復号化過程で使用される全てのフィルタを適用した後の再構成信号である(200aと比べて)。
予測信号の2つの発生した部分(空間的に予測された差分信号746と潜在的にフィルタにかけられた/抽出されたベース層再構成380)が、最終予測信号420を形成するために、サンプルごとに追加732される。
ちょうど概説した実施例を図6〜図10の実施の形態に転用することは、エンハンスメント層信号の現在のブロックを予測することのちょうど概説された可能性が、図6〜図10に関して概説された予測スキームに代わるものとして、それぞれのスケーラブルビデオデコーダ/エンコーダによってサポートされるということである。使用されるモードが、図8に示されないそれぞれの予測モード識別子を経由して、エンハンスメント層サブストリーム6b内でシグナリングされる。
特定の実施の形態において、イントラ予測は層間残差予測に続く(実施例B参照)。ベース層データを使用してイントラ予測信号を発生させるための複数の方法は、以下の方法を含む。(隣接する再構成されたエンハンスメント層のサンプルを使用して得られた)従来の空間イントラ予測信号は、(抽出された/フィルタにかけられた)ベース層残差信号(ベース層変換係数の逆変換、または、ベース層再構成とベース層予測との間の差)に結合される。
図26は、(抽出された/フィルタにかけられた)ベース層残差信号754(BL Resi)と、点線762で記載された既に符号化された隣接ブロックの再構成されたエンハンスメント層のサンプル758(EH Reco)を使用する空間イントラ予測756との合計752による、層間イントラ予測信号420の発生を示す。
図26に示された概念は、予測ブロック420を形成するために、2つの予測信号を重ねる。そこでは、一方の予測信号764が、既に再構成されたエンハンスメント層サンプル758から発生し、他方の予測信号754が、ベース層残差サンプル480から発生する。予測信号420の第1の部分764が、再構成されたエンハンスメント層サンプル758を使用して、空間イントラ予測756を適用することによって得られる。空間イントラ予測756は、H.264/AVC内で指定された方法の1つである。または、HEVC内で指定された方法の1つである。あるいは、それは、隣接するブロック762のサンプル758を形成する現在のブロック18のために、予測信号764を発生する別の空間イントラ予測技術である。実際に使用されたイントラ予測方法756(複数の提供された方法の1つであり、平面イントラ予測、DCイントラ予測、または、どんな特定の角度も有する方向イントラ予測を含むことができる)は、ビットストリーム6b内でシグナリングされる。H.264/AVCとHEVCとに提供された方法と異なる空間イントラ予測技術(既に符号化された隣接するブロックのサンプルを使用して、予測信号を発生させるための方法)を使用することは、可能である。予測信号420の第2の部分754が、ベース層の併置された残差信号480を使用して発生する。品質エンハンスメント層に対して、残差信号が、ベース層内で再構成されるように使用できる。または、残差信号は、追加してフィルタにかけることができる。空間エンハンスメント層480に対して、残差信号は、それが予測信号の第2の部分として使用される前に、(ベース層サンプル位置をエンハンスメント層サンプル位置に写像するために、)抽出220される。また、ベース層残差信号480は、抽出ステージの前または後に、フィルタにかけることができる。残差信号を抽出220するために、FIRフィルタが適用される。抽出過程は、抽出の目的のために適用されるベース層内の変換ブロック境界を横切ってフィルタにかけられない方法で、構成される。
層間予測のために使用されるベース層残差信号480は、スケーリングおよび逆変換560によって、ベース層の変換係数レベルが得られる残差信号である。または、ベース層残差信号480は、再構成されたベース層信号200(非ブロック化および追加フィルタリングの前または後、あるいは、どんなフィルタリング操作の間でも)と、ベース層内で使用された予測信号660との間の差である。
2つの発生した信号要素(空間イントラ予測信号764と層間残差予測信号754)は、最終エンハンスメント層イントラ予測信号を形成するために、追加752される。
これは、図26に関してちょうど概説した予測モードが、現在の符号化/復号化された部分28に対して、図6〜図10に関して上で記述した代替の予測モードを形成するために、図6〜図10に従ってどんなスケーラブルビデオデコーダ/エンコーダでも使用される、または、サポートされる、という意味である。
特定の実施の形態において、空間イントラ予測とベース層再構成との重み付けされた予測(実施例C参照)が、使用される。これは、図6〜図10に関して上で概説された実施の形態の特定の実現を発表した明細書を、従って、上の実施の形態の代替えとしてだけでなく、所定の実施例と異なって図6〜図10に関して上で概説された実施の形態を実行する方法の可能性の記述としても解釈された、そのような重み付けされた予測に関する記述を、実際に表わす。
ベース層データを使用して、イントラ予測信号を発生させるための多重方法は、以下の方法を含む。(抽出された/フィルタにかけられた)再構成されたベース層信号は、空間イントラ予測信号に結合される。そこでは、空間イントラ予測が、隣接するブロックの再構成されたエンハンスメント層のサンプルに基づいて得られる。最終予測信号は、異なる周波数成分が異なる重み付けを使用する方法で、空間予測信号とベース層予測信号とが重み付け(41と比べて)されることによって、得られる。これは、例えば、ローパスフィルタでベース層予測信号(38と比べて)にフィルタをかけ(62と比べて)、かつ、ハイパスフィルタで空間イントラ予測信号(34と比べて)にフィルタをかけ(64と比べて)て、そして、得られたフィルタにかけられた信号を追加する(66と比べて)ことによって、実現される。または、周波数に基づいた重み付けが、変換ブロックを重ねるベース層予測信号(38と比べて)とエンハンスメント層予測信号(34と比べて)とを変換(72、74と比べて)し、得られた変換ブロック(76、78と比べて)を重ねることによって、実現される。そこでは、異なる重み付け係数(82、84と比べて)は、異なる周波数位置に対して使用される。次に、得られた変換ブロック(図10の42と比べて)は、逆変換(84と比べて)され、エンハンスメント層予測信号(54と比べて)として使用される。あるいは、得られた変換係数は、スケーリングされた送信された変換係数レベル(59と比べて)に追加(52と比べて)され、そして、非ブロック化およびループ内過程の前に、再構成されたブロック(54と比べて)を得るために、逆変換(84と比べて)される。
図27は、(抽出された/フィルタにかけられた)ベース層再構成信号(BL Reco)と、既に符号化された隣接するブロックの再構成されたエンハンスメント層のサンプル(EH Reco)を使用する空間イントラ予測との周波数重み付けされた合計による、層間イントラ予測信号の生成を示す。
図27の概念は、予測ブロック420を形成するために、2つの重畳信号772、774を使用する。信号420の第1の部分774が、エンハンスメント層内の既に構成された隣接するブロックの再構成されたサンプル778を使用して、図6の30に対応している空間イントラ予測776を適用することによって得られる。予測信号420の第2の部分772が、ベース層の併置された再構成された信号200を使用して生成される。品質エンハンスメント層に対して、併置されたベース層サンプル200が、直接に使用される。または、それらは、例えば、ローパスフィルタまたは高周波成分を減衰させるフィルタによって、任意にフィルタにかけられる。空間エンハンスメント層に対して、併置されたベース層のサンプルが、抽出220される。抽出のために、FIRフィルタまたはFIRフィルタのセットが使用される。また、IIRフィルタを使用することも可能である。任意で、再構成されたベース層のサンプルが、抽出の前にフィルタにかけられる。あるいは、ベース層予測信号(ベース層を抽出した後に得られた信号)が、抽出段階の後にフィルタにかけられる。ベース層の再構成の過程は、非ブロック化フィルタ120や適応型ループフィルタ140などの1つ以上の追加フィルタを含むことができる。抽出のために使用されるベース層再構成200は、いずれかのループフィルタ120、140の前の再構成信号200cである。あるいは、それは、非ブロック化フィルタ120の後、しかし、別のフィルタの前の再構成信号200bである。あるいは、それは、特定のフィルタの後の再構成信号200a、または、ベース層復号化過程で使用される全てのフィルタ120、140を適用した後の再構成信号である。
図23と図24で使用された参照符号と、図6〜図10に関連して使用された参照符号とが比較されるとき、ブロック220は、図6で使用された参照符号38に対応している。39は、380の部分に対応している。少なくとも、現在の部分28に併置された部分に関する限り、現在の部分28に併置された420は、42に対応している。空間予測776は、32に対応する。
2つの予測信号(潜在的に抽出された/フィルタにかけられたベース層再構成386とエンハンスメント層イントラ予測782)が、最終予測信号420を形成するために結合される。これらの信号を結合するための方法は、異なる重み付け因子が異なる周波数成分のために使用されるという特性を有することができる。特定の実施の形態では、抽出されたベース層再構成は、ローパスフィルタ(62と比べて)でフィルタにかけられる(また、抽出220の前にベース層再構成をフィルタにかけることも可能である)。イントラ予測信号(30によって得られた34と比べて)は、ハイパスフィルタ(64と比べて)でフィルタにかけられる。両方のフィルタにかけられた信号は、最終予測信号420を形成するために、追加784(66と比べて)される。ローパスフィルタとハイパスフィルタの一対は、直交ミラーフィルタ対を表わすけれども、これは必ずしも必要ではない。
別の特定の実施の形態(図10と比べて)において、2つの予測信号380と782との結合過程は、空間変換を介して実現される。(潜在的に抽出された/フィルタにかけられた)ベース層再構成380とイントラ予測信号782との両方が、空間変換を使用して変換(72、74と比べて)される。次に、両方の信号の変換係数(76、78と比べて)は、適切な重み付け係数(82、84と比べて)でスケーリングされて、次に、最終予測信号の変換係数ブロック(42と比べて)を形成するために、追加(90と比べて)される。1つのバージョンにおいて、重み付け係数(82、84と比べて)は、それぞれの変換係数位置に対して、両方の信号の成分のための重み付け係数の合計が1と等しい方法で選択される。別のバージョンにおいて、いくつかのまたは全ての変換係数位置に対して、重み付け係数の合計が1に等しくない。特定のバージョンにおいて、重み付け係数が、低周波数成分を表わす変換係数に対して、ベース層再構成のための重み付け係数は、エンハンスメント層イントラ予測信号のための重み付け係数より大きく、そして、高周波成分を表す変換係数に対して、ベース層再構成のための重み付け係数が、エンハンスメント層イントラ予測信号のための重み付け係数より少なくなる方法で選択される。
1つの実施の形態において、(両方の成分に対して、重み付けされた変換された信号をまとめることによって)得られた変換係数ブロック(42と比べて)は、最終予測信号420(54と比べて)を形成するために、逆変換(84と比べて)される。別の実施の形態において、予測は変換領域内で直接になされる。すなわち、符号化された変換係数レベル(59と比べて)は、スケーリングされ(すなわち、逆量子化され)て、(両方の成分のための重み付けされた変換信号を加算することによって得られた)予測信号の変換係数(42と比べて)、および、次に、(図10では示されていないけれども、(潜在的非ブロック化120とさらにループ内フィルタリング段階140の前に、)現在のブロックのための再構成された信号420を得るために、逆変換(84と比べて)される)変換係数の結果として起こるブロックに追加(52と比べて)される。換言すれば、最初の実施の形態では、両方の成分のための重み付けされた変換信号を加算することによって得られた変換ブロックは、逆変換されてエンハンスメント層予測信号として使用される。あるいは、2番目の実施の形態では、スケーリングされた送信された変換係数レベルに追加されて、非ブロック化とループ内過程との前に再構成されたブロックを得るために、逆変換される。
ベース層再構成と残差信号との選択(実施例D参照)も使用される。再構成されたベース層信号を使用する(上で記述した)方法のために、以下のバージョンが使用される。
・非ブロック化120とさらにループ内過程140(サンプルとして適応型オフセットフィルタまたは適応型ループフィルタなど)の前の再構成されたベース層サンプル200c。
・非ブロック化120の後、しかし、別のループ内過程140(サンプルとして適応型オフセットフィルタまたは適応型ループフィルタなど)の前の再構成されたベース層サンプル200b。
・非ブロック化120とさらにループ内過程140(サンプルとして適応型オフセットフィルタまたは適応型ループフィルタなど)後の、または、複数のループ内過程段階の間の再構成されたベース層サンプル200a。
対応するベース層信号200a、b、cの選択は、特定のデコーダ(そして、エンコーダ)の実現のために固定される。または、それは、ビットストリーム6内でシグナリングされる。後者の場合に対して、異なるバージョンが使用される。ベース層信号の特定のバージョンの使用が、系列レベルにおいて、または、画像レベルにおいて、または、スライスレベルにおいて、または、最も大きい符号化ユニットレベルにおいて、または、符号化ユニットレベル、または、予測ブロックレベルにおいて、または、変換ブロックレベルにおいて、または、いかなる別のブロックレベルにおいてもシグナリングされる。別のバージョンでは、選択は、(符号化モードのような)別の符号化パラメータに、または、ベース層信号の特性に依存するようにすることができる。
別の実施の形態では、(抽出された/フィルタにかけられた)ベース層信号200を使用する方法の複数のバージョンが、使用される。例えば、抽出されたベース層信号(すなわち、200a)を直接に使用する2つの異なるモードが、提供される。そこでは、2つのモードは、異なる補間フィルタを使用する。または、1つのモードが、(抽出された)ベース層再構成信号の追加フィルタリング500を使用する。同様に、前述した別の他のモードのための複数の異なるバージョンが、提供される。モードの異なるバージョンのための採用された抽出された/フィルタにかけられたベース層信号380が、使用された補間フィルタ(整数サンプル位置もフィルタにかける補間フィルタを含む)内で異なり得る。または、第2のバージョンのための抽出された/フィルタにかけられたベース層信号380が、第1のバージョンのための抽出された/フィルタにかけられたベース層500をフィルタにかけることによって、得られる。異なるバージョンの1つの選択が、系列、画像、スライス、最も大きい符号化ユニット、符号化ユニットレベル、予測ブロックレベル、または変換ブロックレベルでシグナリングされる。あるいは、それは、対応する再構成されたベース層信号または送信された符号化パラメータの特性から推論される。
同様のことが、480を経由して、再構成されたベース層残差信号を使用するモードに適用される。ここで、使用された補間フィルタまたは追加フィルタリングステップと異なるバージョンも使用される。
異なるフィルタが、再構成されたベース層信号とベース層残差信号とを抽出する/フィルタにかけるために使用される。それは、ベース層残差信号を抽出するために、異なるアプローチが、ベース層再構成信号の抽出より使用されることを意味する。
ベース層ブロックに対して、残差信号はゼロである(すなわち、変換係数レベルは、全くブロックに送信されない)。対応するベース層残差信号は、ベース層から得られた別の信号と置き替えられる。例えば、これは、再構成されたベース層ブロックのハイパスフィルタバージョン、または、隣接するブロックの再構成されたベース層残差のサンプルから得られた異なる類似の信号である。
エンハンスメント層内の空間イントラ予測のために使用されるサンプル(実施例H参照)に関する限り、以下の特別な処理が提供される。空間イントラ予測を使用するモードに対して、エンハンスメント層内の利用できない隣接するサンプル(隣接するブロックは、現在のブロックの後に符号化されるので、隣接するサンプルは利用できない)が、抽出された/フィルタにかけられたベース層信号の対応するサンプルに置き替えられる。
イントラ予測モードの符号化(実施例X参照)に関する限り、以下の特別なモードと機能性が提供される。30aのような空間イントラ予測を使用するモードに対して、イントラ予測モードの符号化は、(仮に、利用可能であるならば、)ベース層内のイントラ予測モードについての情報が、エンハンスメント層内のイントラ予測モードをより効率的に符号化するために使用される方法で変更される。これは、例えば、パラメータ56のために使用される。仮に、ベース層内の併置された領域(36と比べて)が、特定の空間イントラ予測モードを使用して、イントラ符号化されるならば、同様のイントラ予測モードが、エンハンスメント層ブロック(28と比べて)内で使用されそうである。イントラ予測モードは、通常、可能なイントラ予測モードのセット内で、1つ以上のモードが、最尤モードとして分類される方法でシグナリングされる。そこでは、より短いワードでシグナリングされる。あるいは、算術符号化が短ければ短いほど、二者択一はより少ないビットをもたらす。HEVCのイントラ予測内で、(仮に、利用可能であるならば)上のブロックのイントラ予測モードと、(仮に、利用可能であるならば)左のブロックのイントラ予測モードとは、最尤モードのセット内に含まれる。これらのモードに追加して、1つ以上の追加モード(しばしば使用される)が、最尤モードのリスト内に含められる。そこでは、実際の追加モードが、現在のブロックの上のブロックおよび現在のブロックの左のブロックのイントラ予測モードの有用性に依存する。HEVC内で、3つのモードが、最尤モードとして正確に分類される。H.264/AVC内で、1つのモードが、最尤モードとして分類される。このモードは、現在のブロックの上のブロックおよび現在のブロックの左のブロックのために使用されるイントラ予測モードに基づいて得られる。イントラ予測モードを分類するためのいかなる他の概念(H.264/AVCとHEVCとから異なる)も可能であり、以下の拡張のために使用される。
エンハンスメント層内のイントラ予測モードの効率的符号化に対してベース層データを使用するために、1つ以上の最尤モードを使用する概念が、(仮に、対応するベース層ブロックが、イントラ符号化されるならば、)最尤モードが併置されたベース層ブロック内で使用されたイントラ予測モードを含む方法で、変更される。特定の実施の形態において、以下のアプローチが使用される。現在のエンハンスメント層ブロックが与えられると、併置されたベース層ブロックは決定される。特定のバージョンでは、併置されたベース層ブロックは、エンハンスメントブロックの左上サンプルの併置された位置をカバーするベース層ブロックである。別のバージョンでは、併置されたベース層ブロックが、エンハンスメントブロックの中央部のサンプルの併置された位置をカバーするベース層ブロックである。他のバージョンでは、エンハンスメント層ブロック内の別のサンプルが、併置されたベース層ブロックを決定するために使用される。仮に、決定された併置されたベース層ブロックがイントラ符号化され、ベース層イントラ予測モードが角度イントラ予測モードを指定して、現在のエンハンスメント層ブロックの左側のエンハンスメント層ブロックから得られたイントラ予測モードが、角度イントラ予測モードを使用しないならば、左のエンハンスメント層ブロックから得られたイントラ予測モードは、対応するベース層イントラ予測モードに取り替えられる。さもなければ、仮に、決定された併置されたベース層ブロックは、イントラ符号化され、ベース層イントラ予測モードは、角度イントラ予測モードを指定し、現在のエンハンスメント層ブロックの上のエンハンスメント層ブロックから得られたイントラ予測モードは、角度イントラ予測モードを使用しないならば、上記のエンハンスメント層ブロックから得られたイントラ予測モードは、対応するベース層イントラ予測モードに取り替えられる。他のバージョンでは、ベース層イントラ予測モードを使用して、(単一要素から成る)最尤モードのリストを変更するための異なるアプローチが使用される。
空間かつ品質のエンハンスメント層のためのインター符号化技術が、次に、提供される。
最先端のハイブリッドビデオ符号化規格(H.264/AVCまたは今度のHEVCなど)において、画像系列の画像が、サンプルのブロックに分割される。ブロックサイズは、固定される、または、符号化手法が、ブロックを、より小さいブロックサイズを有するブロックに更にサブ分割することを許容する階層構造を提供する。ブロックの再構成は、通常、ブロックのための予測信号を発生させて、送信された残差信号を追加されることによって得られる。残差信号は、通常、変換符号化を使用して送信される。それは、変換係数(また、変換係数レベルとも呼ばれる)のための量子化インデックスリストが、エントロピー符号化技術を使用して送信されることを意味する。そして、デコーダ側では、これらの送信された変換係数レベルは、予測信号に追加される残差信号を得るために、スケーリングされ、そして、逆変換される。残差信号は、(現在の時刻のために既に送信されたデータのみを使用して)イントラ予測によって、または、(異なる時刻のために既に送信されたデータを使用して)インター予測のいずれかによって発生する。
インター予測において、予測ブロックは、既に再構成されたフレームのサンプルを使用して、動き補償予測によって得られる。これは、(1つの参照画像と1セットの動きパラメータを使用して)単方向の予測によってなされる。または、予測信号は、多重仮説予測によって発生させることができる。後者の場合、2つ以上の予測信号が重畳される。すなわち、各サンプルに対して、重み付け平均が、最終予測信号を形成するために構成される。(重畳される)多重予測信号は、異なる仮説のための異なる動きパラメータ(例えば、異なる参照画像または動きベクトル)を使用して、発生される。また、単方向の予測に対して、一定の係数を有する動き補償予測信号のサンプルを掛けて、最終予測信号を形成するために一定のオフセットを追加することも可能である。また、そのようなスケーリングとオフセット補正が、多重仮説予測内の全てのまたは選択された仮説のために使用される。
スケーラブルビデオ符号化内でも、ベース層情報が、エンハンスメント層のためのインター予測過程をサポートするために利用される。スケーラブル符号化のための最先端のビデオ符号化規格、H.264/AVCのSVC拡張は、エンハンスメント層内のインター予測過程の符号化効率を向上させるための1つの追加モードである。このモードは、マクロブロックレベル(16×16個のlumaサンプルのブロック)でシグナリングされる。このモード内で、低層内の再構成された残差サンプルは、エンハンスメント層内の動き補償予測信号を改良するために使用される。このモードは、層間の残差予測とも呼ばれる。仮に、このモードが、品質エンハンスメント層内のマクロブロックのために選択されるならば、層間の予測信号は、再構成された低層残差信号の併置されたサンプルによって組み立てられる。仮に、層間残差予測モードが、空間エンハンスメント層内で選択されるならば、予測信号は、併置された再構成されたベース層残差信号を抽出することによって発生する。抽出に対して、FIRフィルタが使用される。しかし、フィルタリングは、変換ブロック境界を横切って適用されない。再構成されたベース層残差のサンプルから発生する予測信号は、エンハンスメント層ブロックのための最終予測信号を形成するために、従来の動き補償予測信号に追加される。一般的に、層間残差予測モードに対して、追加残差信号が、変換符号化によって送信される。残差信号の送信は、仮に、それがビットストリーム内で対応してシグナリングされるならば、省略される(ゼロに等しいと推論される)。最終再構成信号は、送信された変換係数レベルをスケーリングして、逆空間変換を適用することによって得られる再構成された残差信号を、予測信号に追加することによって得られる。そこでは、層間残差予測信号を動き補償予測信号に追加することによって得られる。
次に、エンハンスメント層信号のインター符号化のための技術が説明される。このセクションは、スケーラブルビデオ符号化シナリオ内で符号化されるべきエンハンスメント層信号をイントラ予測するために、既に再構成されたエンハンスメント層信号に加えて、ベース層信号を採用するための方法を説明する。符号化されるべきエンハンスメント層信号をインター予測するためのベース層信号を採用することによって、予測誤差が十分に抑えられる。それは、エンハンスメント層の符号化に対して節約する総合的なビット伝送速度をもたらす。このセクションの主な焦点は、ベース層からの追加信号を有する既に符号化されたエンハンスメント層のサンプルを使用して、エンハンスメント層のサンプルのブロックベースの動き補償を増大させることである。以下の記述は、符号化されたベース層から様々な信号を使用するための可能性を提供する。四分木ブロックパーティションが、好ましい実施の形態として、一般に採用されるけれども、提示された例は、どんな特定のブロックパーティションも仮定することなく、一般的なブロックベースのハイブリッド符号化アプローチに応用される。現在の時間インデックスのベース層再構成、現在の時間インデックスのベース層残差、または、符号化されるべきエンハンスメント層ブロックのインター予測のための既に符号化された画像のベース層再構成の使用さえ説明される。また、現在のエンハンスメント層のための、より良い予測を得るために、ベース層信号が既に符号化されたエンハンスメント層信号と結合する方法が説明される。
最先端の主な技術の1つは、H.264/SVC内の層間残差予測である。H.264/SVC内の層間残差予測は、それらがベースモードフラグまたは従来のマクロブロックタイプのどれかを使用することによってシグナリングされたSVCマクロブロックタイプを使用して、符号化されるか否かに関係なく、全てのインター符号化されたマクロブロックに対して採用される。フラグは、空間かつ品質のエンハンスメント層のためのマクロブロック構文(層間残差予測の用法をシグナリングする)に追加される。この残差予測フラグが1と等しいとき、参照層内の対応する領域の残差信号が、双線型フィルタを使用してブロック的に抽出され、エンハンスメント層マクロブロックの残差信号のための予測として使用される。その結果、対応する差分信号だけが、エンハンスメント層内で符号化される必要がある。
このセクションの記述において、以下の記法が使用される。
0:=現在の画像の時間インデックス
1:=既に再構成された画像の時間インデックス
EL:=エンハンスメント層
BL:=ベース層
EL(t0):=符号化されるべき現在のエンハンスメント層画像
EL_reco:=エンハンスメント層再構成
BL_reco:=ベース層再構成
BL_resi:=ベース層残差信号(ベース層変換係数の逆変換、または、ベース層再構成とベース層予測との間の差)
EL_diff:=エンハンスメント層再構成と、抽出された/フィルタにかけられたベース層再構成との間の差
異なるベース層信号とエンハンスメント層信号とは、図28内で説明された記載内で使用される。
記述に対して、フィルタの以下の特性が使用される。
・直線性:記述内で言及した多くのフィルタが直線的であるけれども、非線形のフィルタも使用される。
・出力サンプルの数:抽出操作において、出力サンプルの数は、入力サンプルの数より大きい。ここで、入力データのフィルタリングは、入力値より多いサンプルを作り出す。従来のフィルタリングでは、出力サンプルの数は、入力のサンプルの数と等しい。そのようなフィルタリング操作は、例えば、高品質スケーラブル符号化内で使用される。
・位相遅延:整数位置でのサンプルのフィルタリングに対して、位相遅延は、通常、ゼロ(または、サンプル内の整数値の遅延)である。断片的な位置(例えば、半ペルの位置または4分の1ペルの位置)のサンプルの発生に対して、通常、(サンプルのユニット内の)断片的な遅延を有するフィルタが、整数格子のサンプルに適用される。
全てのハイブリッドビデオ符号化規格(例えば、MPEG−2、H.264/AVC、または、今度のHEVC規格)に使用された従来の動き補償予測は、図29で説明される。現在のブロックの信号を予測するために、既に再構成された画像の領域は、予測信号として置き換えられて、使用される。置き換えのシグナリングのために、動きベクトルが、ビットストリーム内で、通常、符号化される。整数サンプルの精度動きベクトルに対して、予測信号を形成するために参照画像内の参照領域が直接にコピーされる。しかしながら、分数サンプルの精度動きベクトルを送信することも可能である。この場合、予測信号が、断片的なサンプル遅延を有するフィルタで、参照信号をフィルタリングすることによって得られる。使用された参照画像は、通常、参照画像インデックスを、ビットストリーム構文に含めることによって指定される。一般に、最終予測信号を形成するために、2つ以上の予測信号を重ねることも可能である。概念は、例えば、2つの動き仮説で、Bスライス内でサポートされる。この場合、多重予測信号は、異なる仮説に対する異なる動きパラメータ(例えば、異なる参照画像または動きベクトル)を使用して発生する。単一方向の予測に対して、一定の要因を有する動き補償予測信号のサンプルを掛けて、最終予測信号を形成するために一定のオフセットを加えることも可能である。そのようなスケーリングとオフセット補正が、また、マルチ仮説予測内の全てまたは選択された仮説のために使用される。
以下の記述は、品質エンハンスメント層を有するスケーラブル符号化(エンハンスメント層は、ベース層と同じ解像度を持っているけれども、より高い品質または忠実度を有する入力ビデオを表わす)、および、空間エンハンスメント層を有するスケーラブル符号化(エンハンスメント層は、ベース層より高い解像度、すなわち、サンプルのより大きな数を持っている)に適用される。品質エンハンスメント層に対して、ベース層信号の抽出は必要でないけれども、再構成されたベース層のサンプルのフィルタリングは適用される。空間エンハンスメント層の場合、ベース層信号の抽出が一般に必要である。
実施の形態は、エンハンスメント層ブロックのインター予測のために、再構成されたベース層サンプルまたはベース層残差サンプルを使用するための異なる方法をサポートする。従来のインター予測とイントラ予測とを追加して、以下に記載された1つ以上の方法を支持することが可能である。特定の方法の使用法が、最も大きいサポートされたブロックサイズ(H.264/AVC内のマクロブロック、または、HEVC内の符号化ツリーブロック/最も大きい符号化ユニットなど)のレベルでシグナリングされる。それは、シグナリングされた全てのサポートされたブロックサイズにシグナリングされる。または、それは、サポートされたブロックサイズのサブセットのためにシグナリングされる。
以下で記載された全ての方法に対して、予測信号が、ブロックのための再構成信号として、直接に使用される。あるいは、層間インター予測のための選択された方法が、残差符号化と結合される。特定の実施の形態において、残差信号は、変換符号化を経由して送信される。そして、すなわち、量子化変換係数(変換係数レベル)は、エントロピー符号化技術(例えば、可変長符号化または算術符号化)を使用して送信され、そして、残差が、送信された変換係数レベルを逆量子化(スケーリング)して、逆変換を適用することによって得られる。特定のバージョンでは、層間インター予測信号が発生するブロックに対応する完全な残差ブロックが、単一の変換を使用して変換される。すなわち、全体のブロックが、予測ブロックと同じサイズの単一の変換を使用して変換される。別の実施の形態では、予測ブロックが、例えば、階層的な分解を使用して、より小さいブロックに更にサブ分割される。そして、それぞれの異なるブロックサイズを有する、より小さいブロックに対して、別々の変換が適用される。別の実施の形態では、符号化ユニットは、より小さい予測ブロックに分割される。そして、予測ブロックのゼロ以上に対して、予測信号が、層間インター予測のための方法の1つを使用して発生する。そして、次に、全体の符号化ユニットの残差が、単一の変換を使用して変換される。または、符号化ユニットは、異なる変換ユニットにサブ分割される。そこでは、変換ユニット(単一の変換が適用されるブロック)を形成するためのサブ分割が、符号化ユニットを予測ブロックに分解するためのサブ分割とは異なる。
以下では、ベース層残差とエンハンスメント層再構成を使用して、予測を実行する可能性が説明される。多重方法は以下の方法を含む。(既に再構成されたエンハンスメント層の画像の動き補償された補間によって得られた)従来のインター予測信号は、(抽出された/フィルタにかけられた)ベース層残差信号(ベース層変換係数の逆変換、または、ベース層再構成とベース層予測との間の差)に結合される。この方法は「BL_resi」モード(図30に例えて)とも呼ばれる。
要するに、エンハンスメント層のサンプルのための予測が、以下に記載される。
EL prediction=filter(BL_resi(t0))+MCP_filter(EL_reco(t1))
エンハンスメント層再構成信号の2つ以上仮説が使用されることも、可能である。例えば、
EL prediction=filter(BL_resi(t0))+MCP_filter1(EL_reco(t1))+MCP_filter2(EL_reco(t2))
エンハンスメント層(EL)参照画像の上で使用される動き補償予測(MCP)フィルタは、整数または断片的なサンプル精度のものである。EL参照画像の上で使用されるMCPフィルタは、BL復号化過程の間に、BL参照画像の上で使用されるMCPフィルタと同じである、または、異なる。
動きベクトルMV(x、y、t)は、EL参照画像内の特定の位置を示すために定義される。パラメータxとyが、画像内の空間位置を示す。パラメータtは、参照画像の時間インデックスを記述するために使用され、参照インデックスとも呼ばれる。しばしば、動きベクトルという用語は、2つの空間要素(x、y)だけについて言及するために使用される。MVの整数部分は、参照画像からの1セットのサンプルを取ってくるために使用される。そして、MVの分数部分は、1セットのフィルタからMCPフィルタを選択するために使用される。取得された参照サンプルは、フィルタにかけられた参照サンプルを作り出すために、フィルタにかけられる。動きベクトルは、一般に、異なる予測を使用して符号化される。それは、動きベクトル予測器が、既に符号化された動きベクトル(そして、構文要素が、潜在的動きベクトル予測器のセットの使用された1つを、潜在的に示す)に基づいて得られ、そして、異なるベクトルが、ビットストリーム内に含まれていることを意味する。最終動きベクトルは、送信された動きベクトル差を、動きベクトル予測器に加えることによって得られる。通常、ブロックのための動きパラメータを完全に得ることも可能である。従って、通常、潜在的動きパラメータ候補のリストは、既に符号化されたデータに基づいて構成される。このリストは、参照フレーム内の併置されたブロック内の動きパラメータに基づいて得られる動きパラメータと同様に、空間的に隣接するブロックの動きパラメータを含むことができる。
ベース層(BL)残差信号は、以下の1つと定義できる。
変換係数の逆変換、または、
・BL再構成とBL予測との間の差、または、
・BL変換係数の逆変換がゼロであるBLブロックに対して、それは、BL(例えば、再構成されたBLブロックのハイパスフィルタにかけられたバージョン)から得られた別の信号に取り替えることができる、または、
・上の方法の組み合わせ。
現在のBL残差からEL予測要素を計算するために、ELの画像内の考慮される領域と併置されたBL画像内の領域が特定され、そして、残差信号が、特定されたBL領域から取り出される。併置された領域の定義は、それが、BL解像度の整数のスケーリング係数(例えば、2×スケーラビリティ)、または、BL解像度の断片的なけたスケーリング係数(例えば、1.5×スケーラビリティ)を説明するように作られる。または、BL解像度と同じEL解像度(例えば、品質スケーラビリティ)を生み出すことさえできる。品質スケーラビリティの場合、BL画像内の併置されたブロックは、予測されるべきELブロックと同じ座標を有する。
併置されたBL残差は、フィルタにかけられたBL残差サンプルを発生させるために抽出される/フィルタにかけられることができる。
最終EL予測は、フィルタにかけられたEL再構成サンプルと、フィルタにかけられたBL残差サンプルとを加えることによって得られる。
ベース層再構成とエンハンスメント層差分信号(実施例J参照)を使用する予測に関する多重方法は、以下の方法を含む。(抽出された/フィルタにかけられた)再構成されたベース層信号は、動き補償予測信号に結合される。そこでは、動き補償予測信号が、動作補償差分画像によって得られる。差分画像は、参照画像に対して、再構成されたエンハンスメント層信号と、(抽出された/フィルタにかけられた)再構成されたベース層信号との差を表わす。この方法は、BL_recoモードとも呼ばれる。
この概念は図31で説明される。要するに、ELサンプルのための予測が、以下に記載される。
EL prediction=filter(BL_reco(t0))+MCP_filter(EL_diff(t1))
EL差分信号の2つ以上の仮説が使用されることも可能である。例えば、
EL prediction=filter(BL_resi(t0))+MCP_filter1(EL_diff(t1))+MCP_filter2(EL_diff(t2))
EL差分信号に対して、以下のバージョンが使用される。
・EL再構成と抽出された/フィルタにかけられたBL再構成との間の差分、または、
・(非ブロック化、SAO、ALFのような)ループフィルタリング段階の前または間のEL再構成と、抽出された/フィルタにかけられたBL再構成との間の差分。
特定のバージョンの使用法は、デコーダ内で固定される、または、それは、系列レベルで、画像レベルで、スライスレベルで、最も大きい符号化ユニットレベルで、符号化ユニットレベルで、または、別のパーティションレベルでシグナリングされる。あるいは、それは、別の符号化パラメータに依存することができる。
EL差分信号が、EL再構成と抽出された/フィルタにかけられたBL再構成との間の差を使用して定義されるとき、これにより、EL再構成とBL再構成を保存し、予測(sprediction)モードを使用しているブロックのEL差分信号をその場で計算することが可能になる。その結果、EL差分信号を収納するために必要なメモリを節約できる。しかしながら、それはわずかな計算量のオーバーヘッドを招く。
EL差分画像の上で使用されるMCPフィルタは、整数または分数のサンプル精度のものであることができる。
・差分画像のMCPに対して、再構成された画像のMCPと異なる補間フィルタが使用できる。
・差分画像のMCPに対して、補間フィルタが、差分画像内の対応する領域の特性に基づいて、(または、ビットストリーム内の符号化パラメータに基づいて、または、送信された情報に基づいて、)選択される。
動きベクトルMV(x,y,t)は、EL差分画像内の特定の位置を指すために定義される。パラメータxとyは、画像内で空間位置を指し、そして、パラメータtが、フィルタにかけられた差分画像の時間インデックスを記述するために使用される。
MVの整数部分は、差分画像から1セットのサンプルを取得するために使用され、MVの断片的な部分は、1セットのフィルタからMCPフィルタを選択するために使用される。取得された差分サンプルは、フィルタにかけられた差分サンプルを作り出すためにフィルタにかけられる。
差分画像のダイナミック(能動)範囲は、理論的にオリジナル画像のダイナミック範囲を超えることができる。範囲[0 255]内の像の8ビット表現を仮定する場合、差分画像は範囲[−255 255]を持つことができる。しかしながら、実際には、振幅の大部分は、0の±付近の周りに分布される。差分画像を格納する好ましい実施の形態において、128の一定のオフセットが加えられ、結果は、範囲[0 255]にクリップされ、正規の8ビット像として格納される。その後、符号化および復号化過程内で、128のオフセットが、差分画像から読み込まれた差分振幅から引き算される。
再構成されたBL信号を使用する方法に対して、以下のバージョンを使用できる。これは、固定される、または、それは、系列レベルで、画像レベルで、スライスレベルで、最大符号化ユニットレベルで、符号化ユニットレベルで、または、別のパーティションレベルでシグナリングされる。あるいは、それは、別の符号化パラメータに依存することができる。
・非ブロック化および更にループ内過程の前の再構成されたベース層サンプル(そのようなサンプルとして、適応型オフセットフィルタまたは適応型ループフィルタ)。
・非ブロック化の後、しかし、更にループ内過程の前の再構成されたベース層サンプル(そのようなサンプルとして、適応型オフセットフィルタまたは適応型ループフィルタ)。
・非ブロック化および更にループ内過程の後の再構成されたベース層サンプル(そのようなサンプルとして、適応型オフセットフィルタまたは適応型ループフィルタ)、あるいは、複数のループ内過程ステップの間の再構成されたベース層サンプル。
現在のBL再構成からEL予測成分を計算するために、EL画像内で考慮された領域に併置されたBL画像内の領域が特定される。そして、再構成信号が、特定されたBL領域から取り出される。併置された領域の定義は、それが、BL解像度の整数スケーリング係数(例えば、2×スケーラビリティ)、または、BL解像度の端数のスケーリング係数(例えば、1.5×スケーラビリティ)、または、BL解像度(例えば、SNRスケーラビリティ)と同じEL解像度を生み出すことさえ説明するように作られる。SNRスケーラビリティの場合、BL画像内の併置されたブロックは、予測されるべきELブロックと同じ座標を有する。
最終EL予測は、フィルタにかけられたEL差分サンプルとフィルタにかけられたBL再構成サンプルとを追加することによって得られる。
(抽出された/フィルタにかけられた)ベース層再構成信号と動き補償されたエンハンスメント層差分信号とを結合するモードのいくつかの可能な変化が、以下に記載される。
・(抽出された/フィルタにかけられた)BL信号を使用する方法の複数のバージョンが、使用される。これらのバージョンのために採用された抽出された/フィルタにかけられたBL信号が、使用された(整数サンプル位置もフィルタにかける補間フィルタを含む)補間フィルタと異なることができる、または、2番目のバージョンのために抽出された/フィルタにかけられたBL信号が、最初のバージョンのために抽出された/フィルタにかけられたBL信号を、フィルタにかけることによって得られる。異なるバージョンの1つの選択が、系列で、画像で、スライスで、最も大きい符号化ユニットで、符号化ユニットレベルで、または、画像パーティションの別のレベルでシグナリングされる。あるいは、それは、対応する再構成されたBL信号、または、送信された符号化パラメータの特性から推論される。
・異なるフィルタは、BL_recoモードの場合の抽出された/フィルタにかけられたBL再構成された信号と、BL_resiモードの場合のBL残差信号とのために使用される。
・抽出された/フィルタにかけられたBL信号は、動き補償された差分信号の2つ以上の仮説に結合されることも可能である。これは図32で説明される。
上記を考慮すると、予測は、ベース層再構成とエンハンスメント層再構成の組み合わせを使用して実行される(実施例C参照)。図11、図12、図13に関する上の記述との1つの大きな相違は、空間的というよりむしろ時間的に実行されるイントラ層予測34を得るための符号化モードである。すなわち、空間予測30の代わりに、時間予測32が、イントラ層予測信号34を形成するために使用される。従って、以下で記載されたいくつかの実施例が、図6〜図10と図11〜図13とのそれぞれの上の実施の形態に容易に転用可能である。多重方法は以下の方法を含む。(抽出された/フィルタにかけられた)再構成されたベース層信号は、インター予測信号に結合される。そこでは、インター予測が、再構成されたエンハンスメント層の画像を使用して、動き補償予測によって得られる。最終予測信号は、異なる周波数成分が、異なる重み付けを使用する方法で、インター予測信号とベース層予測信号とを重み付けすることによって得られる。例えば、これは、以下のいずれかによって実現できる。
・ローパスフィルタでベース層予測信号をフィルタにかけて、ハイパスフィルタでインター予測信号をフィルタにかけて、得られたフィルタにかけられた信号を合計すること。
・ベース層予測信号とインター予測信号とを変換して、得られた変換ブロックを重畳すること。そこでは、異なる重み付け係数が、異なる周波数位置のために使用される。次に、得られた変換ブロックは、逆変換され、エンハンスメント層予測信号として使用される。あるいは、得られた変換係数は、スケーリングされた送信された変換係数レベルに追加され、非ブロック化およびループ内過程の前に再構成されたブロックを得るために逆変換される。
このモードは、図33で記載された「BL_comb」モードとも呼ばれる。
要するに、EL予測は、以下に示される。
EL prediction=BL_weighting(BL_reco(t0))+EL_weighting(MCP_filter(EL_reco(t1)))
好ましい実施の形態では、重み付けは、EL解像度対BL解像度の比率に依存してなされる。例えば、BLが、範囲[1 1.25]内で係数によってスケーリングアップされるべきとき、ELおよびBL再構成のための所定のセットの重み付けが使用される。BLが、範囲[1.25 1.75]内で係数によってスケーリングアップされるべきとき、異なるセットの重み付けが使用される。BLが、1.75以上の係数によってスケーリングアップされるべきとき、別の異なるセットの重み付けなどが使用される。
スケーリング因子分離ベース層とエンハンスメント層とに依存する特定の重み付けをすることも、空間イントラ層予測に関する他方の実施の形態で可能である。
別の好ましい実施の形態では、重み付けが、予測されるためにELブロックサイズに依存してなされる。例えば、EL内での4×4ブロックに対して、EL再構成変換係数のための重み付けを指定する重み付けマトリックスが、定義される。そして、BL再構成変換係数のための重み付けを指定する別の重み付けマトリックスが、定義される。BL再構成変換係数のための重み付けマトリックスは、例えば、以下の通りである。
64,63,61,49,
63,62,57,40,
61,56,44,28,
49,46,32,15,
そして、EL再構成変換係数のための重み付けマトリックスは、例えば、以下の通りである。
0,2,8,24,
3,7,16,32,
9,18,20,26,
22,31,30,23,
同様に、8×8、16×16、32×32などのようなブロックサイズに対して、分離重み付けマトリックスが定義される。
周波数領域の重み付けに使用される実際の変換は、予測残差を符号化するために使用される変換と同じ、あるいは、異なり得る。例えば、DCTのための整数近似は、周波数領域の重み付けと、周波数領域内で符号化されるべき予測残差の変換係数を計算することの両方に使用できる。
別の好ましい実施の形態では、最大の変換サイズは、計算量を制限するために、周波数領域の重み付けのために定義される。仮に、考慮されているELブロックサイズが、最大の変換サイズより大きいならば、EL再構成とBL再構成とは、一連の隣接するサブブロックに空間的に分離される。周波数領域の重み付けは、サブブロック上に実行され、最終予測信号は、重み付けされた結果を組み立てることによって形成される。
その上、重み付けは、輝度と色差成分、または、色成分の選択されたサブセットを実行できる。
以下では、エンハンスメント層符号化パラメータを得るための異なる可能性が、説明される。エンハンスメント層ブロックを再構成するために使用されるべき符号化(または、予測)パラメータは、ベース層内の併置された符号化パラメータから多重方法によって得られる。ベース層とエンハンスメント層とは、異なる空間解像度を持つことができる、または、それらは同じ空間解像度を持つことができる。
H.264/AVCのスケーラブルビデオ拡張において、層間動き予測が、構文要素ベースモードフラグによってシグナリングされるマクロブロック型に対して実行される。仮に、ベースモードフラグが1と等しく、ベース層内の対応する参照マクロブロックがインター符号化されるならば、エンハンスメント層マクロブロックも、インター符号化される、そして、全ての動きパラメータが、併置されたベース層ブロックから推論される。さもなければ(ベースモードフラグは0と等しい)、各動きベクトル、いわゆる「動き予測フラグ」に対して、構文要素は送信され、ベース層動きベクトルが、動きベクトル予測器として使用されるか否かを指定される。仮に、「動き予測フラグ」が1と等しいならば、ベース層の併置された参照ブロックの動きベクトル予測器は、解像度比率に従ってスケーリングされて、動きベクトル予測器として使用される。仮に、「動き予測フラグ」が0と等しいならば、動きベクトル予測器は、H.264/AVC内で指定されたように計算される。
以下では、エンハンスメント層符号化パラメータを得るための方法が説明される。ベース層の画像に関連しているサンプルアレイは、ブロックに分解され、各ブロックは、符号化(または、予測)パラメータが関連する。換言すれば、特定のブロック内の全てのサンプル位置は、特定の関連符号化(または、予測)パラメータを有する。符号化パラメータは、動き仮説、参照インデックスリスト、動きベクトル、動きベクトル予測器識別子、およびマージ識別子の数を含む動き補償予測のためのパラメータを含む。符号化パラメータは、イントラ予測方向などのイントラ予測パラメータも含む。
エンハンスメント層内のブロックが、ベース層からの併置された情報を使用して符号化されることは、ビットストリーム内でシグナリングされる。
例えば、エンハンスメント層符号化パラメータの導出(実施例T参照)は、以下の通りに作られる。併置されたベース層情報を使用してシグナリングされるエンハンスメント層のN×Mブロックに対して、ブロック内のサンプル位置に関連した符号化パラメータは、ベース層サンプルアレイ内の併置されたサンプル位置に関連した符号化パラメータに基づいて得られる。
特定の実施の形態において、この過程は以下のステップによってなされる。
1.ベース層符号化パラメータに基づいて、N×Mエンハンスメント層ブロック内の各サンプル位置のための符号化パラメータの導出。
2.特定のサブブロック内の全てのサンプル位置が、同一の関連した符号化パラメータを持つように、サブブロック中のN×Mエンハンスメント層ブロックのパーティションの導出。
また、2番目のステップは省略できる。
ステップ1は、エンハンスメント層サンプル位置pelの関数fcを使用し、符号化パラメータcを与えて実行される。すなわち、
c=fc(pel
Figure 2021182742
2つの水平または垂直の隣接するベース層のサンプル位置ベース層の間の距離は、その結果、1に等しい。最も左上のベース層のサンプルと、最も左上のエンハンスメント層のサンプルの両方が、p=(0,0)の位置を持つ。
別の例として、関数fc(pel)は、ベース層サンプル位置pelに最も近い、ベース層サンプル位置pblに関連した符号化パラメータcに戻すことができる。
また、関数fc(pel)は、特定のエンハンスメント層サンプル位置が、ベース層サンプル位置の間の距離のユニット内の断片的な成分を有する場合において、符号化パラメータを補間できる。
動きパラメータを戻す前に、関数fcは、エンハンスメント層サンプリンググリッド内で最も近い利用可能な値に対して、動きパラメータの空間置換成分を丸める。
各サンプル位置が、ステップ1の後に予測パラメータに関連するので、ステップ1の後に、それぞれのエンハンスメント層のサンプルが予測される。それにもかかわらず、ステップ2では、ブロックパーティションが、より大きいブロックのサンプルの予測操作を実行するために、または、導出したパーティションのブロック内で予測残差を変換符号化するために得られる。
ステップ2は、エンハンスメント層サンプル位置を、正方形または長方形のブロックに分類することによって実行される。それぞれは、サブブロック内の可能な分解の1セットの1つに分解される。正方形または長方形のブロックは、それらが図34内で表現された異なるレベルに存在できる四分木構造内の葉に相当する。
それぞれの正方形または長方形のブロックのレベルと分解は、以下の順序付けされたステップを実行することによって決定される。
a)最高レベルをサイズN×Mのブロックに対応するレベルに設定すること。現在のレベルを、最も低いレベル(すなわち、正方形または長方形のブロックが、最小のブロックサイズの単一ブロックを含むレベル)に設定すること。ステップb)に行く。
b)現在のレベルでそれぞれの正方形または長方形のブロックに対して、仮に、正方形または長方形のブロックの許された分解が存在するならば、それぞれのサブブロック内の全てのサンプル位置が、同じ符号化パラメータに関連する、または、(何らかの差の大きさに従って、)小さい差で符号化パラメータに関連する。その分解は、候補分解である。全ての候補分解のうち、正方形または長方形のブロックを、サブブロックの最少の数に分解するものを選択する。仮に、現在のレベルが最高レベルであれば、ステップc)に行く。さもなければ、現在のレベルを、次のより高いレベルに設定して、ステップb)に行く。 c)終了
関数fcは、ステップb)内のあるレベルで、常に、少なくとも1つの候補分解が存在するような方法で選択される。
同じ符号化パラメータを有するブロックのグループ分けは、正方形ブロックに制限されないけれども、ブロックを矩形ブロックにまとめることができる。さらに、グループ分けは四分木構造に制限されない。ブロックが2つの同じサイズの矩形ブロックに、または、2つの異なるサイズの矩形ブロックに分解される分解構造を使用することも可能である。四分木分解を特定のレベルまで使用して、次に2つの矩形ブロックへの分解を使用する分解構造を使用することも可能である。また、いかなる他のブロック分解も可能である。
SVC層間の動きパラメータ予測モードと対照して、記載されたモードは、マクロブロックレベル(または、最も大きく支持されたブロックサイズ)で支持されているだけではなく、任意のブロックサイズでも支持されている。それは、モードは、最も大きく支持されたブロックサイズのためにシグナリングされるだけではなく、最も大きく支持されたブロックサイズのブロック(MPEG4、H.264内のマクロブロック、および、HEVC内の符号化ツリーブロック/最も大きい符号化ユニット)が、階層的により小さいブロック/符号化ユニットにサブ分割され、層間動きモードの使用法が、(対応するブロックに対して)どんな支持されたブロックサイズにもシグナリングされるということを意味している。特定の実施の形態では、このモードは、選択されたブロックサイズだけを支持する。次に、このモードの使用法をシグナリングする構文要素は、対応するブロックサイズのためだけに送信される。または、このモードの使用法を(別の符号化パラメータ内で)シグナリングする構文要素の値は、別のブロックサイズに対応して制限される。また、H.264/AVCのSVC拡張内の層間動きパラメータ予測モードとの違いは、このモードで符号化されたブロックが、完全にインター符号化されていないということである。ブロックは、併置されたベース層信号に依存して、イントラ符号化されたサブブロックを含むことができる。
上の記載された方法によって得られた符号化パラメータを使用して、M×Mエンハンスメント層ブロックのサンプルを再構成するためのいくつかの方法の1つが、ビットストリーム内でシグナリングされる。得られた符号化パラメータを使用して、エンハンスメント層ブロックを予測するためのそのような方法は、以下を含む。
・動き補償のために、得られた動きパラメータと、再構成されたエンハンスメント層参照画像とを使用して、エンハンスメント層ブロックのための予測信号を得ること。
・(抽出された/フィルタにかけられた)ベース層再構成を、再構成されたエンハンスメント層の画像から引き算することによって発生する、得られた動きパラメータとエンハンスメント層参照画像を使用して、(a)現在の画像のための(抽出された/フィルタにかけられた)ベース層再構成と、(b)動き補償信号との組み合わせ。
・(a)(抽出された/フィルタにかけられた)ベース層残差電流画像(再構成された信号と予測との間の差、または、符号化された変換係数値の逆変換)と、(b)得られた動きパラメータと再構成されたエンハンスメント層参照画像を使用する動き補償信号との組み合わせ。
別のサブブロックが、インター符号化されるとして、分類されている間、現在のブロックに対してより小さいブロック内のパーティションを得て、サブブロックに対して符号化パラメータを得るための過程が、イントラ符号化されるとして、いくつかのサブブロックに分類できる。インター符号化されたサブブロックに対して、動きパラメータが、併置されたベース層ブロックから得られる。しかし、仮に、併置されたベース層ブロックが、イントラ符号化されるならば、エンハンスメント層内の対応するサブブロックは、イントラ符号化されるとして分類される。そのようなイントラ符号化されたサブブロックのサンプルに対して、エンハンスメント層信号が、ベース層から情報を使用することによって、予測される。例えば、
・対応するベース層再構成の(抽出された/フィルタにかけられた)バージョンは、イントラ予測信号として使用される。
・得られたイントラ予測パラメータは、エンハンスメント層内に空間イントラ予測のために使用される。
予測信号の重み付けされた組み合わせを使用して、エンハンスメント層ブロックを予測するために以下の実施の形態は、(a)再構成されたエンハンスメント層のサンプルを使用して、空間的または時間的(すなわち、動き補償)予測によって得られたエンハンスメント層イントラ予測信号と、(b)現在の画像のための(抽出された/フィルタにかけられた)ベース層再構成であるベース層予測信号とを結合することによって、エンハンスメント層ブロックのための予測信号を発生させるための方法を含む。最終予測信号は、各サンプルに対して、重み付け関数に従った重み付けが使用される方法で、エンハンスメント層イントラ予測信号とベース層予測信号との重み付けによって得られる。
例えば、重み付け関数は、以下の方法によって実現される。オリジナルのエンハンスメント層イントラ予測信号vのローパスフィルタにかけられたバージョンを、ベース層再構成uのローパスフィルタにかけられたバージョンと比較する。その比較から、オリジナルのインター予測信号と(抽出された/フィルタにかけられた)ベース層再構成とを結合するために、使用されるべき各サンプル位置のための重み付けを得る。例えば、重み付けは、伝達関数tを使用して、重み付けwに対して差u−vを写像することによって得られる。すなわち、
t(u−v)=w
異なる重み付け関数が、予測されるべき現在のブロックの異なるブロックサイズのために使用される。また、重み付け関数が、インター予測仮説が得られる参照画像の時間的距離に従って変更される。
イントラ予測信号であるエンハンスメント層イントラ予測信号の場合、重み付け関数が、例えば、予測されるべき現在のブロック内の位置に依存する異なる重み付けを使用して、実現される。
好ましい実施の形態において、エンハンスメント層符号化パラメータを得るための方法が使用される。そして、方法のステップ2が、図35に記載されたように、正方形ブロックの可能な分解のセットを使用している。
好ましい実施の形態において、関数fc(pel)は、上でm=4、n=4で記載された関数fp,m×n(pel)によって与えられたベース層サンプル位置に関連した符号化パラメータを戻す。
実施の形態において、関数fc(pel)は、以下の符号化パラメータcを戻す。
・最初に、ベース層サンプル位置は、pbl=fp,4×4(pel)として得る。
・仮に、pblが、以前に符号化されたベース層ブロックとマージすることによって得られた関連したインター予測パラメータを持つ(または、同じ動きパラメータを持つ)ならば、cは、ベース層内でマージするために使用される、ベース層ブロックに対応するエンハンスメント層ブロックの動きパラメータと等しい(すなわち、動きパラメータは、対応するエンハンスメント層ブロックからコピーされる)。
・さもなければ、cはpblに関連した符号化パラメータと等しい。
また、上の実施の形態の組み合わせも可能である。
別の実施の形態では、併置されたベース層情報を使用して、シグナリングされるべきエンハンスメント層ブロックに対して、動きパラメータの初期設定セットから得られたイントラ予測パラメータとそれらのエンハンスメント層サンプル位置に関連するので、ブロックは、これらのサンプル(すなわち、動きパラメータの初期設定セットのコピー)を含むブロックとマージされる。動きパラメータの初期設定セットは、1つまたは2つの仮説を使用するための指示器、参照画像のリスト内の最初の画像を参照する参照インデックスリスト、および、ゼロ空間置き換えを有する動きベクトルからなる。
別の実施の形態では、併置されたベース層情報を使用して、シグナリングされるべきエンハンスメント層ブロックに対して、得られた動きパラメータを有するエンハンスメント層サンプルが、ある順序付けで最初に、予測されて、再構成される。その後に、得られたイントラ予測パラメータを有するサンプルが、イントラ再構成順序で予測される。その結果、イントラ予測は、(a)隣接するインター予測ブロックと、(b)イントラ再構成順序内の前任の隣接するイントラ予測ブロックとから、既に再構成されたサンプル値を使用できる。
別の実施の形態では、マージされている(すなわち、別のインター予測ブロックから得られた動きパラメータを取る)エンハンスメント層ブロックに対して、マージ候補のリストは、追加的に、対応するベース層ブロックから候補を含む。そして、仮に、エンハンスメント層が、ベース層より高い空間抽出比率を有するならば、追加して、空間置換成分をエンハンスメント層内の利用可能な隣接する値のみを改良することによって、ベース層候補から得られた最大4つの候補を含む。
別の実施の形態では、ステップ2b)で使用された差の大きさは、仮に差が全てなくなるなる場合にだけ、サブブロック内に小さい差があると主張する。すなわち、全ての含まれたサンプル位置が、同じ得られた符号化パラメータを持つときだけ、サブブロックは形成される。
別の実施の形態において、仮に、(a)全ての含まれたサンプル位置が、得られた動きパラメータを持ち、そして、ブロック内のサンプル位置のセットが、対応する動きベクトルに適用されたベクトルノルムに従って特定の値より多く異なる導出された動きパラメータを持っていないならば、あるいは、(b)全ての含まれたサンプル位置が、得られたイントラ予測パラメータを持ち、そして、ブロック内のサンプル位置のセットが、方向のイントラ予測の特定の角度より大きく異なる得られたイントラ予測パラメータを持っていないならば、ステップ2b)で使用された差の大きさは、サブブロック内に小さい差があると主張する。サブブロックのためにもたらされたパラメータは、平均、または、メジアンの操作によって計算される。
別の実施の形態では、ベース層から符号化パラメータを推論することによって得られたパーティションは、ビットストリーム内でシグナリングされたサイド情報に基づいてさらに改良される。
別の実施の形態では、符号化パラメータがベース層から推論されるブロックのための残差符号化は、ベース層から推論されるブロック内のパーティションから独立している。例えば、それは、ベース層からの符号化パラメータの推論が、ブロックを、符号化パラメータの別々のセットを有してそれぞれいくつかのサブブロックに仕切るけれども、単一の変換がブロックに適用されることを意味する。または、サブブロックのためのパーティションと符号化パラメータとがベース層から推論されるブロックが、残差を変換符号化する目的のために、より小さいブロックに分割される。そこでは、変換ブロックへの分割が、異なる符号化パラメータを有するブロック内の推論されたパーティションから独立している。
別の実施の形態では、符号化パラメータがベース層から推論されるブロックのための残差符号化が、ベース層から推論されるブロック内のパーティションに依存している。例えば、それは、変換符号化に対して、変換ブロック内のブロックの分割が、ベース層から推論されるパーティションに依存することを意味する。あるバージョンでは、単一の変換が、異なる符号化パラメータを有するそれぞれのサブブロックに適用される。別のバージョンでは、パーティションが、ビットストリーム内に含むサイド情報に基づいて改良される。別のバージョンでは、いくつかのサブブロックが、残差信号を変換符号化の目的のために、ビットストリーム内でシグナリングされるように、より大きなブロックにまとめられる。
また、前述の実施の形態の組み合わせによって得られた実施の形態も可能である。
エンハンスメント層動きベクトル符号化に関連して、この次の部分は、エンハンスメント層の動き情報を効率的に符号化するために、複数のエンハンスメント層予測器を提供して、ベース層内で符号化された動き情報を使うことによって、スケーラブルビデオ符号化アプリケーション内で動き情報を減少するための方法を説明する。この考えは、空間、時間および品質のスケーラビリティを含むスケーラブルビデオ符号化のために適切である。
H.264/AVC層間のスケーラブルビデオ拡張において、動き予測は、構文要素「ベースモードフラグ」によってシグナリングされるマクロブロックタイプのために実行される。
仮に、「ベースモードフラグ」が1に等しく、かつ、ベース層内の対応する参照マクロブロックがインター符号化されるならば、エンハンスメント層マクロブロックも、インター符号化される。そして、全ての動きパラメータが、併置されたベース層ブロックから推論される。さもなければ(「ベースモードフラグ」が0に等しいならば)、各動きベクトル(いわゆる「動き予測フラグ」の構文要素)は、ベース層動きベクトルが動きベクトル予測器として使用されるか否かに関係なく、送信され、指定される。仮に、「動き予測フラグ」が1に等しいならば、ベース層の併置された参照ブロックの動きベクトル予測器は、解像度比率に従ってスケーリングされて、動きベクトル予測器として使用される。仮に、「動き予測フラグ」が0に等しいならば、動きベクトル予測器は、H.264/AVCで規定されるように計算される。
HEVCにおいて、動きパラメータは、適応動きベクトル予測(AMVP)を適用することによって予測される。AMVPは互いに競争する2つの空間動きベクトル予測器と1つの時間動きベクトル予測器とを特色とする。空間候補は、現在の予測ブロックの左または上に位置した、隣接する予測ブロックの位置から選択される。時間候補は、前に符号化された画像の併置された位置の中で選択される。全ての空間的で時間的候補の位置は、図36内で表示される。
空間的および時間的候補が推論された後に、ゼロ動きベクトルを候補としてリストに導入する冗長検査が、実行される。インデックスを記述する候補リストは、動き補償予測のために、動きベクトル差と共に使用される動きベクトル予測器を特定するために送信される。
HEVCは、更に、符号化構成に基づいた四分木から生じる符号化冗長動きパラメータの減少を狙うブロックマージアルゴリズムを用いる。これは、特定動きパラメータを共有する多重予測ブロックから成る領域を、作成することによって達成される。これらの動きパラメータは、新しい動き情報の種を蒔いている各領域の最初の予測ブロックのために、一度符号化される必要があるだけである。AMVPと同様に、ブロックマージアルゴリズムは、それぞれの予測ブロックのために、可能なマージ候補を含むリストを構成する。候補の数は、スライスヘッダー内でシグナリングされて1から5までの範囲がある「NumMergeCands」によって定義される。候補は、空間的近傍予測ブロックと併置された時間画像内の予測ブロックとから推論される。候補であるとみなされる予測ブロックのための可能なサンプル位置は、図36に示された位置と等しい。HEVC内の可能な予測ブロックのパーティションを有するブロックマージアルゴリズムの例は、図37で説明される。図37(a)内の太線は、1つの領域にマージされて特定の動きデータを保持する予測ブロックを全て定義する。この動きデータはブロックSだけに送られる。符号化されるべき現在の予測ブロックは、「X」によって示される。縞模様領域内の予想ブロックは、ブロック走査順序内で予測ブロックXの後継者であるので、関連した予測データをまだ有さない。ドットは、可能な空間マージ候補である隣接するブロックのサンプル位置を示す。可能な候補が予測器リストに挿入される前に、空間候補のための冗長検査が、図37(b)内で示されるように実行される。
空間的で時間的な候補の数が、「NumMergeCands」より少ない場合、追加候補が、既存の候補と結合することによって、または、ゼロ動きベクトル候補を挿入することによって提供される。仮に、候補がリストに追加されるならば、それは候補を特定するために使用されるインデックスを備えている。新しい候補がリストへ追加されると、リストが、インデックス「NumMergeCands」−1によって特定された最後の候補で完成するマージインデックスは(0からスタートして)増加する。固定長符号ワードは、候補リストの導出およびビットストリームの構文解析の独立操作を確実にするために、マージ候補インデックスを符号化するために使用される。
以下のセクションは、エンハンスメント層の動きパラメータを符号化するために、ベース層から得られた予測器を含む、多重エンハンスメント層予測器を使用するための方法を説明する。ベース層のために既に符号化された動き情報は、エンハンスメント層を符号化している間、動きデータ速度をかなり減少させるために用いることができる。この方法は、ベース層から予測ブロックの全ての動きデータを直接に得る可能性を含む。この場合、追加動きデータは、符号化される必要がない。以下の記述において、予測ブロックという用語は、HEVC内の予測ユニット(H.264/AVC内のM×Nブロック)を示し、画像内のサンプルの一般的なセットとして理解される。
現在のセクションの最初の部分は、ベース層動きベクトル予測器(実施例K参照)によって動きベクトル予測候補のリストを拡張することに関するものである。ベース層動きベクトルは、エンハンスメント層符号化の間、動きベクトル予測器リストに追加される。これは、ベース層からの併置された予測ブロックの1つまたは多重の動きベクトル予測器を推論し、そして、動き補償予測のための予測器のリスト内の候補としてそれらを使用することによって達成される。ベース層の併置された予測ブロックは、現在のブロックの中央、左、上、右または下部に位置している。仮に、選択された位置のベース層の予想ブロックが、動き関連データを含まない、または、現在の範囲の外に存在して、それ故に現在アクセス可能でないならば、二者択一の位置が、動きベクトル予測器を推論するために使用できる。これらの二者択一の位置は図38に表現される。
ベース層の推論された動きベクトルは、予測器候補としてそれらが使用される前に、解像度比率に従ってスケーリングされる。動きベクトル差と同様に、動きベクトル予測器の候補リストを記述するインデックスが、動き補償予測のために使用される最終動きベクトルを指定する予測ブロックに送信される。H.264/AVC規格のスケール可能な拡張と対照して、ここに提示された実施の形態は、参照画像内の併置されたブロックの動きベクトル予測器の使用法を構成しない−むしろそれは、別の予測器内のリスト内で利用可能であり、送信されるインデックスによって記述される。
実施の形態において、動きベクトルは、ベース層の併置された予測ブロック内心位置C1から得られ、最初のエントリーとして候補リストの先頭に加えられる。動きベクトル予測器の候補リストは、1つの項目によって拡張される。仮に、サンプル位置C1のために利用可能なベース層内に動きデータが全くなければ、リスト構造は触れられない。別の実施の形態では、ベース層内のサンプル位置のどんな系列も、動きデータに対してチェックされる。動きデータが見つけられた場合において、対応する位置の動きベクトル予測器は、候補リストに挿入され、エンハンスメント層の動き補償予測のために利用可能である。その上、ベース層から得られた動きベクトル予測器は、リストのいかなる他の位置の候補リストにも挿入される。別の実施の形態では、仮に、所定の規制が認められるならば、ベース層動き予測器は候補リストに挿入されるだけである。これらの制約は、ゼロと等しくなければならない、併置された参照ブロックのマージフラグの値を含む。別の制約は、解像度比率に対してベース層の併置された予測ブロックの広さと等しいエンハンスメント層内の予測ブロックの広さである。例えば、K×空間スケーラビリティの応用において、仮に、ベース層内の併置されたブロックの幅がNと等しく、エンハンスメント層内の符号化されるべき予測ブロックの幅がK*Nと等しい場合のみ、動きベクトル予測器が推論される。
別の実施の形態では、ベース層の数個のサンプル位置からの1個以上の動きベクトル予測器が、エンハンスメント層の候補リストに追加される。別の実施の形態では、併置されたブロックから推論された動きベクトル予測器を有する候補が、リストを拡張することよりむしろ、リスト内の空間的で時間的な候補に置き代わる。また、動きベクトル予測器候補リスト内のベース層データから得られた多重動きベクトル予測器を含むことも可能である。
第2の部分は、ベース層候補によってマージ候補のリストを拡張することに関するものである(実施例K参照)。ベース層の1つ以上の併置されたブロックの動きデータは、マージ候補リストに追加される。この方法は、ベース層とエンハンスメント層とを横切って特定の動きパラメータを共有するマージ領域を作成する可能性を可能にする。前のセクションと同様、図38に表現されるように、中央位置で併置されたサンプルをカバーするベース層ブロックは、この中央位置に制限されるのではなく、直ぐ近傍のどんな位置からも得られる。どんな動きデータも、所定の位置に対して利用可能でなく、または、アクセス可能でない場合、二者択一の位置が、可能なマージ候補を推論するために選択できる。得られた動きデータが、マージ候補リストに挿入される前に、それは、解像度比率に従ってスケーリングされる。マージ候補リストを記述するインデックスは、送信され、動きベクトルを定義する。それは、動き補償予測のために使用される。しかしながら、また、方法は、ベース層内の予測ブロックの動きデータに依存する可能な動き予測器候補を抑制できる。
実施の形態において、図38のサンプル位置C1をカバーするベース層内の併置されたブロックの動きベクトル予測器は、エンハンスメント層内の現在予測ブロックを符号化するための可能なマージ候補であるとみなされる。しかしながら、仮に、参照ブロックの「merge_flag」(マージフラグ)が1と等しい、または、併置された参照ブロックが動きデータを全く含んでいないならば、動きベクトル予測器はリストに挿入されない。いかなる他の場合でも、得られた動きベクトル予測器は、2番目のエントリーとしてマージ候補リストに追加される。この実施の形態では、マージ候補リストの長さが保有され、拡張されないことに注意されたい。別の実施の形態では、図38に表現されているように、1個以上の動きベクトル予測器が、候補リストをマージするために加えられるように、サンプル位置のいずれもカバーする予測ブロックから得られる。別の実施の形態では、ベース層の1個または数個の動きベクトル予測器が、どんな位置にてもマージ候補リストに追加される。別の実施の形態では、仮に、特定の制約を満たすならば、1個または複数個の動きベクトル予測器が、マージ候補リストに追加されるだけである。そのような制約は、(動きベクトル予測のために前の実施の形態のセクション内で記載された解像度比率に関する)ベース層の併置されたブロックの広さに整合するエンハンスメント層の予測ブロックの広さを含む。別の実施の形態内の別の制約は、1に等しい「merge_flag」の値である。別の実施の形態では、マージ候補リストの長さが、ベース層の併置された参照ブロックから推論された動きベクトル予測器の数によって拡張される。
この明細書の3番目の部分は、ベース層データ(実施例L参照)を使用して、動きパラメータ(または、マージ)候補リストを再順序付けすることに対してであって、ベース層内の既に符号化された情報に従って、マージ候補リストを再順序付けする過程について説明する。仮に、現在のブロックのサンプルをカバーする併置されたベース層ブロックが、特定のオリジナルから得られた候補を有する動き補償予測であれば、(仮に存在するならば)同等のオリジナルからの対応するエンハンスメント層候補が、最初のエントリーとして、マージ候補リストの先頭に置かれる。このステップは、最も低いインデックスを有するこの候補を記述することに等しい。最も低いインデックスは、最も簡素な符号ワードをこの候補に割り当てる。
実施の形態では、併置されたベース層ブロックは、図38に表現されるように、サンプル位置A1をカバーする予測ブロックから発生する候補と共に動き補償予測される。仮に、エンハンスメント層内の予測ブロックのマージ候補リストが、動きベクトル予測器がエンハンスメント層内に対応するサンプル位置A1から発生する候補を含むならば、この候補は、最初のエントリーとしてリスト内に置かれる。その結果、この候補は、インデックス0によって索引付けられ、従って、最も短い固定長符号ワードを割り当てられる。この実施の形態において、このステップは、エンハンスメント層内のマージ候補リストに対して、併置されたベース層ブロックの動きベクトル予測器の導出の後に実行される。従って、再順序付け過程は、併置されたベース層ブロックの動きベクトル予測器として、対応するブロックから発生する候補に最も低いインデックスを割り当てる。2番目に低いインデックスは、このセクションの2番目の部分で説明されているように、ベース層内の併置されたブロックから導出する候補に割り当てられる。その上、再順序付けの過程は、ベース層内の併置されたブロックの「merge_flag」が1と等しい場合にだけ、行われる。別の実施の形態では、再順序付けの過程は、ベース層内の併置された予測ブロックの「merge_flag」の値の如何に関わらず実行される。別の実施の形態において、対応するオリジナルの動きベクトル予測器を有する候補は、マージ候補リストのどんな位置にも置かれる。別の実施の形態では、再順序付けの過程は、マージ候補リスト内の他の全ての候補を取り除く。ここに、動きベクトル予測器が、ベース層内の併置されたブロックの動き補償予測のために使用される動きベクトル予測器と同じオリジナルを有している候補だけが、リスト内に留まる。この場合、単独の候補が利用され、そして、インデックスは全く送信されない。
この明細書の4番目の部分は、ベース層データを使用して、動きベクトル予測器候補リストを再順序付けすること(実施例L参照)に対してであって、ベース層ブロックの動きパラメータを使用して、動きベクトル予測の候補リストを再順序付けする過程を実施の形態とする。仮に、現在の予測ブロックのサンプルをカバーする併置されたベース層ブロックが、特定のオリジナルからの動きベクトルを使用するならば、エンハンスメント層内の対応するオリジナルからの動きベクトル予測器は、最初のエントリーとして、現在の予測ブロックの動きベクトル予測器リスト内で使用される。これは、最も安い符号ワードを、この候補に割り当てることをもたらす。
実施の形態において、併置されたベース層ブロックは、図38に表わされるように、サンプル位置A1をカバーする予測ブロックから発生する候補と共に、動き補償予測される。仮に、エンハンスメント層内のブロックの動きベクトル予測器候補リストが、動きベクトル予測器がエンハンスメント層内に対応するサンプル位置A1から発生する候補を含むならば、この候補は最初のエントリーとしてリスト内に置かれる。その結果、この候補は、インデックス0によって索引付けられ、従って、最も短い固定長符号ワードを割り当てられる。この実施の形態において、このステップは、エンハンスメント層内の動きベクトル予測器リストに対して、併置されたベース層ブロックの動きベクトル予測器の導出の後に実行される。従って、再順序付け過程は、併置されたベース層ブロックの動きベクトル予測器として、対応するブロックから発生する候補に最も低いインデックスを割り当てる。2番目に低いインデックスは、このセクションの最初の部分で説明されているように、ベース層内の併置されたブロックから導出する候補に割り当てられる。その上、再順序付けの過程は、ベース層内の併置されたブロックの「merge_flag」が0と等しい場合にだけ、行われる。別の実施の形態では、再順序付けの過程は、ベース層内の併置された予測ブロックの「merge_flag」の値の如何に関わらず実行される。別の実施の形態において、対応するオリジナルの動きベクトル予測器を有する候補は、動きベクトル予測器候補リストのどんな位置にも置かれる。
以下は変換係数のエンハンスメント層符号化に関するものである。
最先端のビデオと画像符号化において、予測信号の残差は、前に変換され、結果の量子化された変換係数が、ビットストリーム内でシグナリングされる。この係数符号化は固定されたスキームに続く。
変換サイズ(ルマ(luma)残差に対して:4×4,8×8,16×16,32×32)に依存して、異なる走査方向が定義される。走査順に最初と最後の位置が与えられ、これらの走査は、どの係数位置が有意である場合があるかを唯一決定して、その結果、符号化される必要がある。全ての走査内で、最後の位置はビットストリーム内でシグナリングされなければならないけれども、最初の係数は位置(0,0)におけるDC係数であるように設定される。ビットストリームは、変換ブロック内で(水平な)xと(垂直な)yの位置を符号化することによって行われる。最後の位置からスタートして、有意な係数のシグナリングが、DC位置に達するまで、逆の走査順でなされる。
変換サイズ16×16と32×32に対して、1つの走査、すなわち、「対角線走査」だけが定義される。ところが、サイズ2×2と4×4と8×8の変換ブロックは、さらに、「垂直」で「水平」な走査を利用できる。しかしながら、垂直および水平な走査の使用は、イントラ予測符号化ユニットの残差に制限される。そして、実際に使用された走査が、そのイントラ予測の指示モードから得られる。インデックスが6と14の範囲にある指示モードは、垂直な走査をもたらす。インデックスが22と30の範囲にある指示モードは、水平な走査をもたらす。全ての残差指示モードが、対角線の走査をもたらす。
図39は、4×4変換ブロックに対して定義される対角線の走査、垂直な走査および水平な走査を示す。より大きい変換の係数は、16の係数のサブグループにサブ分割される。これらのサブグループは重要な係数位置の階層的な符号化を可能にする。有意でないとしてシグナリングされたサブグループは、有意な係数を含まない。8×8と16×16に対しての変換は、走査と図40と図41のそれらが関連したサブグループ区分と共にそれぞれ表わされる。大きい矢印は係数サブグループの走査順を表する。
ジグザグの走査において、4×4より大きいサイズのブロックに対して、サブグループは、ジグザグの走査で走査された4×4画素のブロックからなる。サブグループはジグザグな方法で走査される。図42は、JCTVC−G703内で提案されるように、16×16変換のための垂直な走査を示す。
以下の段落は変換係数符号化のための拡張について説明する。これらは新しい走査モード(変換ブロックへの走査と重要な係数位置の変更された符号化を割り当てる方法)の導入を含む。これらの拡張は、変換ブロック内に異なる係数分布の、より良い適合を許し、その結果、レート歪関数内で符号化利得を達成する。
垂直で水平な走査パターンのための新しい実現は、16×16と32×32変換ブロックのために導入される。以前に提案された走査パターンと対照して、走査サブグループのサイズは、水平な走査に対して16×1で、垂直な走査に対して1×16である。また、8×2と2×8のサイズを有するサブグループは、それぞれ選択される。サブグループ自体は同じ方法で走査される。
垂直な走査は、行方向の拡がりの中に位置している変換係数のために効率的である。これは、水平なエッジを含む画像内で見出される。
水平な走査は、拡げられた列のようなものの中に位置している変換係数のために効率的である。これは、垂直なエッジを含む画像内で認められる。
図43は、16×16変換ブロックのための垂直水平走査の実現を示す。係数サブグループは、それぞれ一つの行または一つの列として定義される。垂直水平走査は、導入された走査パターンである。その走査パターンは、列のような走査によって、行内に係数の符号化を可能にする。4×4ブロックに対して、最初の行は、最初の列の残りに続いて走査され、次に、2番目の行の残りに続いて走査され、次に、2番目の列の係数の残りに続いて走査される。次に、3番目の行の残りが走査され、最後に4番目の列と行の残りが走査される。
より大きいブロックに対しては、ブロックは4×4のサブグループに区分される。これらの4×4ブロックは、垂直水平走査で走査され、サブグループは垂直水平走査自体で走査される。
垂直水平走査は、係数がブロック内の最初の行と列に位置している場合に使用される。このように、係数は、別の走査(例えば対角線走査)を使用する場合より早く走査される。これは、水平なエッジと垂直なエッジとを両方を含む画像に対して見出される。
図44は16×16変換ブロックに対して垂直および水平な走査を示す。
別の走査も同様に可能である。例えば、走査とサブグループとの間の全ての組み合わせが使用できる。例えば、4×4ブロックに対して水平走査を使用して、サブグループに対して対角線走査を使用して、走査の適切な選択が、各サブグループに対して異なる走査を選択することによって適用される。
変換係数がエンコーダ側での量子化の後に並び替えられて、従来の符号化が使用される方法で、異なる走査が実現できる、ということを述べるべきである。デコーダ側で、変換係数は、従来の復号化が行われて、スケーリングと逆変換との前に(または、スケーリングの後と逆の変換の前に)並び替えられる。
ベース層信号の異なる部分は、ベース層信号から符号化パラメータを得るために利用される。ベース層信号内には以下がある。
・併置された再構成されたベース層信号
・併置された残差ベース層信号
・エンハンスメント層予測信号を再構成されたベース層信号から引き算することによって得られた、推定されたエンハンスメント層の残差信号
・ベース層フレームの画像パーティション
[勾配パラメータ]
勾配パラメータは以下の通り得られる:
調査されたブロックの各画素に対して、勾配が計算される。これらの勾配から、大きさと角度が計算される。ブロック内で最も発生した角度は、ブロックに関連する(ブロック角度)。角度は、3つの方向のみ、水平(0°)、垂直(90°)、対角(45°)を使用するように丸められる。
[エッジ検出]
エッジ検出器は、以下のような調査されたブロックに適用される:
最初に、ブロックが、n×n平滑化フィルタ(例えば、ガウシアン)によって平滑化される。
サイズm×mの勾配マトリクスが、各画素の勾配を計算するために使用される。あらゆる画素の大きさと角度が計算される。角度は、3つの方向のみ、水平(0°)、垂直(90°)、対角(45°)を使用するように向く。
所定の閾値1より大きい大きさを有するあらゆる画素に対して、隣接する画素がチェックされる。仮に、隣接する画素が閾値2より大きい大きさを有し、そして、現在の画素と同じ角度を有しているならば、この角度の計数器が増加する。全体のブロックに対して、最高値の計数器がブロックの角度として選択される。
[前の変換によってベース層係数を得ること]
特定のTUに対して、ベース層信号の周波数領域から符号化パラメータを得るために、調査され併置された信号(再構成されたベース層信号/残差ベース層信号/推定されたエンハンスメント層信号)は、周波数領域内で変換される。好ましくは、これは、その特定のエンハンスメント層TUによって使用される同じ変換を使用して、実行される。
結果としてもたらされるベース層変換係数は、量子化されても、されなくてもよい。
エンハンスメント層ブロックと比較可能な係数分布を得るために、変更されたラムダによるレート歪量子化が使用される。
[特定の分布および走査の走査有効スコア]
特定の重要な係数分布の走査有効スコアが、以下の通り定義される:
調査されたブロックの各位置を、調査された走査の順にインデックスによって表わせてください。次に、重要な係数位置のインデックス値の合計が、この走査の有効スコアと定義される。その結果、より小さいスコアを有する走査であればあるほど、特定の分布は、より良い効率性を表わす。
[変換係数符号化に対して適切な走査パターン選択]
仮に、いくつかの走査が、特定のTUに対して利用可能であるならば、走査の1つを唯一選択する規則が、定義される必要がある。
[走査パターン選択のための方法]
選択された走査が、(どんな追加データも送信されること無く)既に復号化された信号から直接得ることができる。これは、併置されたベース層信号の特性に基づいて、または、エンハンスメント層信号だけを利用することによってのどちらかによって可能である。
走査パターンが、以下によって、EL信号から得ることができる。
・前述された最先端の導出規則。
・併置された輝度残差のために選択された色差残差のための走査パターンを使用すること。
・符号化モードと使用した走査パターンとの間の固定写像を定義すること。
・最後の重要な係数位置から走査パターンを得ること(推定された固定走査パターンに比例して)。
・好ましい実施の形態において、走査パターンが、以下の通り既に復号化された最後の位置に依存して選択される:
最後の位置は、変換ブロック内のxとy座標として表わされ、既に復号化される(符号化される最後に依存する走査に対して、固定走査パターンが、最後の位置の復号化過程のために推定される。それは、そのTUの最先端の走査パターンである)。Tを特定の変換サイズに依存する、定義された閾値であるとしよう。仮に、最後の重要な位置のx座標もy座標も、Tを超えないならば、対角線走査が選択される。
さもなければ、xはyと比較される。仮に、xがyを超えるならば、水平走査が選択され、垂直走査は選択されない。4×4TUのためのTの好ましい値は1である。4×4より大きいTUのためのTの好ましい値は4である。
別の好ましい実施の形態において、前の実施の形態内で説明される走査パターンの導出は、サイズ16×16と32×32のTUのためだけにされるべく制限される。それは、さらに輝度信号だけに制限される。
また、走査パターンは、BL信号から得られる。ベース層信号から選択された走査パターンを得るために、前述したどのような符号化パラメータも使用できる。特に、併置されたベース層信号の勾配が、計算され、事前に定義された閾値と比較される、および/または、潜在的に発見されたエッジが利用できる。
好ましい実施の形態において、走査方向が、以下の通り、ブロック勾配角度に依存して得られる。水平方向において量子化された勾配に対して、垂直な走査が使用される。垂直方向において量子化された勾配に対して、水平走査が使用される。さもなければ、対角線走査が選択される。
別の好ましい実施の形態において、走査パターンは、前の実施の形態で記載されたように得られる。しかし、ブロック角度の発生数が閾値を超えている、それらの変換ブロックだけに対して得られる。残っている変換ユニットは、TUの最先端の走査パターンを使用して、復号化される。
仮に、併置されたブロックのベース層係数が有効であり、明らかに、ベース層データストリーム内でシグナリングされる、または、前の変換によって計算されるならば、ベース層係数は以下の方法で利用できる。
・それぞれの利用可能な走査に対して、ベース層係数を符号化するためのコストが評価される。最低コストを有する走査は、エンハンスメント層係数を復号化のために使用される。
・それぞれの利用可能な走査の有効スコアは、ベース層係数分布のために計算される。最小のスコアを有する走査は、エンハンスメント層係数を復号化するために使用される。
・変換ブロック内のベース層係数の分布は、特定の走査パターンに関連している分布の事前に定義されたセットの1つに分類される。
・走査パターンは、最後の重要なベース層係数に依存して選択される。
仮に、併置されたベース層ブロックが、イントラ予測を使用して、予測されたならば、その予測のイントラ方向が、エンハンスメント層走査パターンを得るために使用される。
その上、併置されたベース層ブロックの変換サイズは、走査パターンを得るために利用される。
好ましい実施の形態において、走査パターンが、INTRA_COPYモード予測ブロックの残差を表わすTUだけに対して、BL信号から得られる。そして、それらの併置されたベース層ブロックは、イントラ予測されている。それらのブロックに対して、変更された最先端技術の走査選択が使用される。最先端技術の走査選択と対照して、併置されたベース層ブロックのイントラ予測方向は、走査パターンを選択するために使用される。
ビットストリーム内で走査パターンインデックスにシグナリングすること(実施例R参照)。
変換ブロックの走査パターンが、エンコーダによってレート歪の意味で選択され、次に、ビットストリーム内でシグナリングされる。
特定の走査パターンが、利用できる走査パターン候補のリストにインデックスをシグナリングすることによって、符号化できる。このリストは、特定の変換サイズのために定義された走査パターンの固定リストであるか、または、復号化過程内の能動的に満たすことができる。能動的にリストを満たすことは、それらの走査パターンの適した選択を可能にする。走査パターンは、おそらく最も効率的に、特定の係数分布を符号化する。そうすることによって、特定のTUのための利用可能な走査パターンの数は減少できる。そして、その結果、そのリスト内のインデックスのシグナリングは、より低コストである。仮に、特定のリストの走査パターンの数が、1つまで減少するならば、シグナリングは必要ない。
特定のTUに対して、走査パターン候補を選択する過程は、前述した、どんな符号化パラメータも利用してよい、および/または、その特定のTUの特定の特性を利用する所定の規則に従う。それらの中には、以下が存在する。
・TUは輝度/色差分信号の残差を表わす。
・TUは、特定のサイズを有する。
・TUは特定の予測モードの残差を表わす。
・TU内の最後の重要な位置は、デコーダによって知られ、TUの特定のサブ分割内に属する。
・TUは1つのI/B/P−スライス(Slice)の部分である。
・TUの係数は、特定の量子化パラメータを使用して、量子化される。
好ましい実施の形態において、走査パターン候補のリストは、全てのTUに対して、3つの走査を含む:「対角線走査」、「垂直走査」および「水平走査」。
別の実施の形態が、候補リストに、走査パターンの任意の組み合わせを含ませることによって、得られる。
特定の好ましい実施の形態の中で、走査パターン候補のリストは、「対角線走査」、「垂直走査」および「水平走査」のどれかを含む。
ところが、(前述の)最先端の走査導出によって選択された走査パターンが、最初に、リスト内にあるように設定される。特定のTUが16×16または32×32のサイズを有する場合にだけ、別の候補がリストに追加される。残っている走査パターンの順序は、最後の重要な係数位置に依存する。
(注意:対角線の走査は、いつも、16×16と32×32変換を推定するリスト内での最初のパターンである)
仮に、x座標の大きさがy座標の大きさを超えるならば、水平走査が次に選ばれる。そして、垂直走査が最後の位置に置かれる。さもなければ、垂直走査は、水平走査が後に続く、2番目の位置に置かれる。
別の好ましい実施の形態が、リスト内に1つ以上の候補を有しているために、更に条件を制限することによって得られる。
別の実施の形態において、仮に、変換ブロックの係数が、輝度信号の残差を表わすならば、垂直および水平走査は、16×16と32×32変換ブロックの候補リストに追加されるだけである。
別の実施の形態において、仮に、最後の重要な位置のxとy座標の両方が、特定の閾値より大きいならば、垂直で水平な走査は、変換ブロックの候補リストに追加される。この閾値はサイズに依存するモードおよび/またはTUである。好ましい閾値は、4×4より大きい全てのサイズに対して3であり、4×4TUに対しては1である。
別の実施の形態において、仮に、最後の重要な位置のxとy座標のいずれかが、特定の閾値より大きいならば、垂直で水平な走査は、変換ブロックの候補リストに追加されるだけである。この閾値はサイズに依存するモードおよび/またはTUである。好ましい閾値は、4×4より大きい全てのサイズに対して3であり、4×4TUに対しては1である。
別の実施の形態において、仮に、最後の重要な位置のxとy座標の両方が、特定の閾値より大きいならば、垂直で水平な走査は、16×16と32×32変換ブロックの候補リストに追加されるだけである。この閾値はサイズに依存するモードおよび/またはTUである。好ましい閾値は、4×4より大きい全てのサイズに対して3であり、4×4TUに対しては1である。
別の実施の形態において、仮に、最後の重要な位置のxとy座標のいずれかが、特定の閾値より大きいならば、垂直で水平な走査は、16×16と32×32変換ブロックの候補リストに追加されるだけである。この閾値はサイズに依存するモードおよび/またはTUである。好ましい閾値は、4×4より大きい全てのサイズに対して3であり、4×4TUに対しては1である。
記載された実施の形態のいずれかに対して、特定の走査パターンが、ビットストリーム内でシグナリングされる。シグナリング自体は、異なるシグナリングレベルでなされる。特に、シグナリングは、残差四分木のどんな節(ノード)(その節の全てのサブTU、それはシグナリングされた走査を使用し、同じ候補リストインデックスを使用する)で、CU/LCUレベルで、または、スライスレベルで、シグナリングされた走査パターンを有したTUのサブグループ内で低下する各TUに対してなされる。
候補リスト内のインデックスが、固定長さ符号化、可変長さ符号化、算術符号化(文脈に適した2進の算術符号化を含む)、または、PIPE符号化を使用して、送信される。仮に、文脈に適した符号化が使用されるならば、文脈は、隣接するブロック、前述した符号化モード、および/または、特定のTU自身の特性のパラメータに基づいて得られる。
好ましい実施の形態において、文脈に適した符号化は、TUの走査パターン候補リスト内のインデックスにシグナリングするために使用される。しかし、文脈モデルは、TU内で、最後の重要な位置の変換サイズおよび/または位置に基づいて得られる。
走査パターンを得るために前述したいずれかの方法が、特定のTUに対して、明白な走査パターンにシグナリングするための文脈モデルを得るために使用される。
最後の重要な走査位置を符号化するために、以下の変更がエンハンスメント層内で使用される。
・別々の文脈モデルが、ベース層情報を使用して、全てのまたはサブセットの符号化モードに対して使用される。また、異なる文脈モデルを、ベース層情報を有する異なるモードに対して使用することも可能である。
・文脈モデルは、併置されたベース層ブロック内のデータに依存できる(例えば、ベース層内の変換係数分布、ベース層の勾配情報、併置されたベース層ブロック内の最後のキャン位置)。
・最後の走査位置が、最後のベース層走査位置との差として符号化できる。
・仮に、最後の走査位置が、TU内で、xとy位置にシグナリングすることによって符号化されるならば、2番目のシグナリングされた座標の文脈モデルは、最初のシグナリングの値に依存できる。
・最後の重要な位置から独立している走査パターンを得るために、前述のいずれかの方法が、最後の重要な位置にシグナリングするために、文脈モデルを得るために使用される。
特定のバージョンにおいて、走査パターン導出は、最後の重要な位置に依存する:
・仮に、最後の走査位置が、TU内で、そのxとy位置にシグナリングすることによって符号化されるならば、2番目の座標の文脈モデルは、既に最初の座標を知るとき、まだ可能な候補であるそれらの走査パターンに依存できる。
・仮に、最後の走査位置が、TU内で、そのxとy位置にシグナリングすることによって符号化されるならば、2番目の座標の文脈モデルは、既に最初の座標を知るとき、走査パターンが既に唯一選択されるかどうかに依存できる。
別のバージョンにおいて、走査パターン導出は、最後の重要な位置から独立している。
・文脈モデルは、特定のTU内の使用された走査パターンに依存できる。
・走査パターンを得るために前述した方法のいずれかが、最後の重要な位置にシグナリングするために文脈モデルを得るために使用される。
TU内の重要な位置と重要なフラグ(一つの変換係数のためのサブグループフラグおよび/または重要なフラグ)を符号化するために、それぞれ、以下の変更がエンハンスメント層内で使用される:
・別々の文脈モデルは、ベース層情報を使用する全てのまたはサブセットの符号化モードに対して使用される。また、ベース層情報を有する異なるモードに対して異なる文脈モデルを使用することも可能である。
・文脈モデルは、併置されたベース層ブロック内のデータ(例えば、特定の周波数位置対して、重要な変換係数の数)に依存できる。
・走査パターンを得るために前述した方法のいずれかが、重要な位置および/またはそれらのレベルにシグナリングするために、文脈モデルを得るために使用される。
・符号化されるべき係数の空間的近傍内の既に符号化された変換係数レベルの重要な数、および、同様の周波数位置の併置されたベース層信号内の重要な変換係数の数の両方を評価する一般化されたテンプレートが、使用される。
・符号化されるべき係数の空間的近傍内の既に符号化された変換係数レベルの重要な数、および、同様の周波数位置の併置されたベース層信号内の重要な変換係数のレベルの両方を評価する一般化されたテンプレートが、使用される。
・サブグループフラグのためにモデル化される文脈は、使用された走査パターンおよび/または特定の変換サイズに依存する。
ベース層とエンハンスメント層のための異なる文脈初期化テーブルの使用法が使用される。エンハンスメント層のための文脈モデル初期化は、以下の方法で変更される。
・エンハンスメント層は、初期化値の別々のセットを使用する。
・エンハンスメント層は、異なる操作モード(空間的/時間的、または、品質のスケーラビリティ)に対して、初期化値の別々のセットを使用する。
・ベース層内の計数部分を有するエンハンスメント層文脈モデルが、初期化状態として、それらの計数部分の状態を使用する。
・文脈の初期状態を得るためのアルゴリズムが、ベース層QPおよび/またはデルタQPに依存する。
次に、ベース層データを使用して、後方の適切なエンハンスメント層の符号化の可能性が説明される。以下の部分は、スケーラブルビデオ符号化システム内で、エンハンスメント層予測信号を生成する方法を説明する。その方法は、予測パラメータの値を推論するために画像のサンプル情報を復号化したベース層を使用する。予測パラメータの値は、符号化映像ビットストリーム内に送信されないけれども、エンハンスメント層のための予測信号を形成するために使用される。従って、エンハンスメント層信号を符号化するために必要な総合的なビットレートは減少する。
最先端のハイブリッドビデオエンコーダは、原初(ソース)イメージを、通常、階層構造に従って、異なるサイズのブロックに分解する。各ブロックに対して、ビデオ信号は、空間的に隣接するブロックから予測される(イントラ予測)、または、以前に時間的に符号化された画像から予測される(インター予測)。予測と実際のイメージとの間の差は、変換と量子化である。結果としてもたらされる予測パラメータと変換係数は、符号化映像ビットストリームを形成するためにエントロピー符号化される。整合しているデコーダは、逆の順序のステップに従う…
ビットストリームを符号化するスケーラブルビデオは、異なる層で構成される:完全な復号化可能ビデオを提供するベース層と、復号化のために追加して使用されるエンハンスメント層とである。エンハンスメント層は、より高い空間解像度(空間的スケーラビリティ)、時間解像度(時間的スケーラビリティ)または品質(SNRスケーラビリティ)を提供できる。
H.264/AVC SVCのような以前の規格では、動きベクトル、参照画像インデックスまたはイントラ予測モードのような構文要素は、符号化されたベース層内の対応する構文要素から直接に予測される。
エンハンスメント層内では、メカニズムは、ブロックレベルで、ベース層構文要素から得られた、あるいは、別のエンハンスメント層構文要素または復号化されたエンハンスメント層サンプルから予測された予測信号を使用して、その間において切り換えるために存在する。
以下の部分では、ベース層データが、デコーダ側でエンハンス層パラメータを得るために使用される。
[方法1:動きパラメータ候補導出]
空間的または品質的エンハンスメント層の画像のブロック(a)に対して、ベース層の画像の対応するブロック(b)が決定される。それは同じ画像領域をカバーする。
エンハンスメント層のブロック(a)のためのインター予測信号は、以下の方法を使用して形成される:
1.動き補償パラメータセット候補は、例えば、時間的または空間的に隣接するエンハンスメント層ブロックまたはそれの導出物から決定される。
2.動き補償は、各候補の動き補償パラメータセットに対して、エンハンスメント層内でインター予測信号を形成するために実行される。
3.最も良い動き補償パラメータセットは、エンハンスメント層ブロック(a)のための予測信号と、ベース層ブロック(b)の再構成信号との間の誤差の大きさを最小にすることによって選択される。空間的スケーラビリティにおいて、ベース層ブロック(b)は、補間フィルタを使用して、空間的に抽出される。
動き補償パラメータセットは、動き補償パラメータの特定の組み合わせを含む。
動き補償パラメータは、動きベクトル、参照画像インデックス、1つおよび2つの予測と別のパラメータとの間の選択である。
二者択一の実施の形態において、ベース層ブロックから、動き補償パラメータセットの候補が使用される。また、インター予測は、(ベース層の参照画像を使用して、)ベース層内で実行される。誤差の大きさを適用するために、ベース層ブロック(b)再構成信号が、抽出されることなく、直接に使用される。選択された最適動き補償パラメータセットは、ブロック(a)の予測信号を形成するためにエンハンスメント層の参照画像に適用される。動きベクトルが空間エンハンスメント層内で適用されるとき、動きベクトルは解像度変化に従ってスケーリングされる。
エンコーダとデコーダの両方が、利用可能な候補内で、最適動き補償パラメータセットを選択して、同じ予測信号を作成するために、同じ予測ステップを実行できる。これらのパラメータは、符号化映像ビットストリーム内ではシグナリングされない。
予測方法の選択は、ビットストリーム内でシグナリングされ、エントロピー符号化を使用して、符号化される。階層的なブロックサブ分割構造内で、この符号化方法は、あらゆるサブレベル、または、代わりに符号化階層構造のサブセットだけで選択できる。代わりの実施の形態において、エンコーダは、改良動きパラメータセット予測信号をデコーダに送信できる。改良信号は動きパラメータの符号化された値を差動的に含む。改良信号は、エントロピー符号化される。
代替の実施の形態において、デコーダは最良候補のリストを生成する。使用された動きパラメータセットのインデックスは、符号化映像ビットストリーム内でシグナリングされる。インデックスは、エントロピー符号化される。実施例において、リストは誤差の大きさを増加させることによって順序付けされる。
実施例は、動き補償パラメータセット候補を生成させるために、HEVCの適応動きベクトル予測(AMVP)候補リストを使用する。
別の実施例は、動き補償パラメータセット候補を生成させるために、HEVCのマージモード候補リストを使用する。
[方法2:動きベクトル導出]
空間的または品質のエンハンスメント層の画像のブロック(a)に対して、同じ画像領域をカバーするベース層の画像の対応するブロック(b)が決定される。
エンハンスメント層のブロック(a)のためのインター予測信号は、以下の方法を使用して形成される:
1.動きベクトル予測が選択される。
2.検索位置の定義されたセットの動きの推定が、エンハンスメント層の参照画像で実行される。
3.それぞれの検索位置に対して、誤差の大きさが決定され、最も小さい誤差を有する動きベクトルが選択される。
4.ブロック(a)の予測信号が、選択された動きベクトルを使用して形成される。
替わりの実施の形態において、検索が、再構成されたベース層信号で実行される。空間スケーラビリティに対して、選択された動きベクトルは、ステップ4内で予測信号を生成する前に、空間解像度変化に従って、スケーリングされる。
検索位置は、完全な解像度またはサブペル(sub−pel)の解像度でできる。また、検索は複数のステップ内で、例えば、選択された完全なペル位置に基づいた別のセットの候補が後に続く、最良の完全なペル位置を最初に決定することを実行できる。例えば、誤差の大きさが、定義された閾値の下であるとき、検索が早く終了できる。
エンコーダとデコーダの両方が、候補内で最適動きベクトルを選択して、同じ予測信号を生成するために、同じ予測ステップを実行できる。これらのベクトルは、符号化映像ビットストリーム内ではシグナリングされない。
予測方法の選択は、ビットストリーム内でシグナリングして、エントロピー符号化を使用して、符号化される。階層的なブロックサブ分割構造内で、この符号化方法が、あらゆるサブレベル内で、または、代わりの符号化階層のサブセットだけで選択される。替りの実施の形態において、エンコーダは、改良動きベクトル予測信号をデコーダに送信できる。改良信号は、エントロピー符号化される。
実施例は、動きベクトル予測器を選ぶために、方法1で記載されたアルゴリズムを使用する。
別の実施例は、エンハンスメント層の時間的または空間的に隣接するブロックから動きベクトル予測器を選ぶために、HEVCの適応動きベクトル予測(AMVP)方法を使用する。
[方法3:イントラ予測モード導出]
エンハンスメント層(n)画像内の各ブロック(a)に対して、再構成されたベース層(n−1)の画像内の同じ領域をカバーする、対応するブロック(b)が決定される。
スケーラブルビデオデコーダにおいて、それぞれのベース層ブロック(b)に対して、イントラ予測信号が、以下のアルゴリズムによって推論されるイントラ予測モード(p)を使用して、形成される。
1)イントラ予測信号は、エンハンスメント層のイントラ予測のための規則に従い、しかし、ベース層からサンプル値を使用して、それぞれの利用可能なイントラ予測モードのために生成される。
2)最も良い予測モード(pbest)は、イントラ予測信号と復号化されたベース層ブロック(b)との間の誤差の大きさ(例えば、絶対差の合計)を最小にすることによって決定される。
3)ステップ2)内で選択された予測(pbest)モードは、エンハンスメント層のためのイントラ予測規則をサポートして、エンハンスメント層ブロック(a)のための予測信号を生成するために使用される。
エンコーダとデコーダの両方が、最も良い予測モード(pbest)を選択して、整合している予測信号を形成するために、同じステップを実行できる。従って実際のイントラ予測モード(pbest)は、符号化映像ビットストリーム内でシグナリングされない。
予測方法の選択は、ビットストリーム内でシグナリングされて、エントロピー符号化を使用して、符号化される。階層的なブロックサブ分割構造内で、この符号化モードは、あらゆるサブレベル内で、または、替りに符号化階層のサブセットだけで選択される。代わりの実施の形態は、イントラ予測信号を生成するために、ステップ2)内でエンハンスメント層からサンプルを使用する。空間スケーラブルエンハンスメント層に対して、ベース層は、誤差の大きさを適用するために、補間フィルタを使用して、抽出される。
代替の実施の形態は、エンハンスメント層ブロックを、より小さいブロックサイズ(ai)の複数のブロックに分ける(例えば、16×16ブロック(a)は16個の4×4ブロック(ai)に分けられる)。前述したアルゴリズムは、それぞれのサブブロック(ai)と、対応するベース層ブロック(bi)とに適用される。ブロック(ai)の予測の後に、残差符号化が適用される、そして、結果は、ブロック(ai+1)を予測するために使用される。
代替の実施の形態は、予測されたイントラ予測モード(pbest)を決定するために、(b)または(bi)の周囲のサンプル値を使用する。例えば、空間エンハンスメント層(n)の4×4ブロック(ai)が、対応する2×2ベース層ブロック(bi)を有するとき、(bi)の周囲のサンプルが、予測されたイントラ予測モード(pbest)の決定のために使用される4×4ブロック(ci)を形成するために使用される。
代替の実施の形態において、エンコーダは、改良イントラ予測方向信号をデコーダに送信できる。例えば、HEVCのような映像コーデックにおいて、ほとんどのイントラ予測モードが、境界画素が予測信号を形成するために使用される角度に対応している。最適モードへのオフセットが、(上で説明されているように決定されている)予測されたイントラ予測モード(pbest)に対する差として送信される。改良モードは、エントロピー符号化される。
イントラ予測モードは、通常、それらの確率に依存して符号化される。H.264/AVCにおいて、最尤モードは、ブロックの(空間的)近傍で使用されるモードに基づいて決定される。HEVCリストにおいて、最尤モードが作成される。これらの最尤モードは、全体のモード数が必要とするより少ない、ビットストリーム内の記号を使用して選択される。代替の実施の形態は、最尤モード、または、最尤モードのリストのメンバーとして、ブロック(a)(前述のアルゴリズムで説明されているように決定されている)に対して、予測されたイントラ予測モード(pbest)を使用する。
[方法4:境界領域を使用するイントラ予測]
スケーラブルまたは品質のエンハンスメント層のブロック(a)(図45参照)のためのイントラ予測信号を形成するためのスケーラブルビデオデコーダにおいて、同じ層の周囲領域からのサンプル(b)のラインは、ブロック領域内に満たされるように使用される。これらのサンプルは、既に符号化された領域から取得される(通常、しかし、上側と左側の境界上には必要ない)。
これらの画素を選択する以下の代替の変形が使用される。
a)仮に、周囲領域内の画素が、まだ符号化されていないならば、画素値は、現在のブロックを予測するために使用されない。
b)仮に、周囲領域内の画素が、まだ符号化されていないならば、画素値は、既に符号化された隣接する画素から得られる(例えば、反復によって)。
c)仮に、周囲領域内の画素が、まだ符号化されていないならば、画素値は、復号化されたベース層の画像の対応する領域内で画素から得られる。
ブロック(a)のイントラ予測を形成するために、上で説明されるように得られる画素(b)の隣接するラインが、ブロック(a)のそれぞれのライン(aj)内を満たすためのテンプレートとして、使用される。
ブロック(a)のライン(aj)は、x軸に沿って一つ一つ満たされる。可能な限り良い予測信号を達成するために、テンプレートサンプル(b)の列は、関連ライン(aj)のための予測信号(b´j)を形成するためにy軸に沿って移行する。
各ライン内で最適の予測を見付けるために、移行オフセット(oj)が、結果として得られた予測信号(aj)とベース層内の対応するラインのサンプル値との間の誤差の大きさを最小にすることによって、決定される。
仮に、(oj)が非整数値であれば、補間フィルタが、(b´7)内に示されているように、(aj)の整数サンプル位置に(b)の値を写像するために使用される。
仮に、空間スケーラビリティが使用されるならば、補間フィルタが、ベース層の対応するラインのサンプル値の整合する数を作成するために使用される。
充填方向(x軸)は、水平(左右)、垂直(上下)、対角またはいかなる他の角度にもできる。テンプレートライン(b)のために使用されるサンプルは、x軸に沿ったブロックの直接に隣接するサンプルである。テンプレートライン(b)は、x軸に対して90°の角度を形成するy軸に沿って移行する。
x軸の最適な方向を見付けるために、充填イントラ予測信号が、ブロック(a)のために生成される。予測信号と対応するベース層ブロックとの間の最小の誤差大きさを有する角度が選択される。
可能な角度の数は制限される。
エンコーダとデコーダの両方が、最も良い予測角度とオフセットとを決定するために、同じアルゴリズムを実行する。どんな明白な角度情報またはオフセット情報も、ビットストリーム内でシグナリングされる必要はない。
代替の実施の形態では、ベース層の画像のサンプルだけが、オフセット(oi)を決定するために使用される。
代替の実施の形態では、予測されたオフセット(oi)の改良(例えば、差の値)が、ビットストリーム内でシグナリングされる。エントロピー符号化が、改良オフセット値を符号化するために使用される。
代替の実施の形態では、予測された方向の改良(例えば、差の値)が、ビットストリーム内で、シグナリングされる。エントロピー符号化が、改良方向値を符号化するために使用される。
仮に、ライン(b´j)が予測のために使用されるならば、代替の実施の形態は、選択するために閾値を使用する。仮に、最適なオフセット(oj)のための誤差大きさが、閾値未満であるならば、ライン(ci)は、ブロックライン(aj)の値を決定するために使用される。仮に、最適なオフセット(oj)のための誤差の大きさが、閾値以上であるならば、(抽出された)ベース層信号は、ブロックライン(aj)の値を決定するために使用される。
[方法5:別の予測パラメータ]
別の予測情報が、例えば、サブブロック内のブロックのパーティションのために、方法1〜3と同様にして推論される。
空間または品質のエンハンスメント層の画像のブロック(a)に対して、ベース層の画像の対応するブロック(b)が決定される。それは、同じ画像領域をカバーする。
エンハンスメント層のブロック(a)のための予測信号は、以下の方法を使用して形成される。
1)予測信号は、テストされたパラメータのそれぞれの可能な値のために生成される。
2)最も良い予測モード(pbest)が、予測信号と復号化されたベース層ブロック(b)との間の誤差大きさ(例えば、絶対差の合計)を最小にすることによって決定される。
3)ステップ2)で選択された予測(pbest)モードが、エンハンスメント層ブロック(a)のための予測信号を生成するために使用される。
エンコーダとデコーダの両方が、可能な候補内で最適な予測モードを選択して同じ予測信号を生成するために、同じ予測ステップを実行できる。実際の予測モードは、符号化映像ビットストリーム内でシグナリングされない。
予測方法の選択が、ビットストリーム内でシグナリングされて、エントロピー符号化を使用して符号化される。階層的なブロックサブ分割構造内で、この符号化方法は、あらゆるサブレベル内で、または、符号化階層のサブセットのみに対して二者択一的に選択される。
以下の記述は、簡潔に、上の実施の形態のいくつかをまとめる。
[再構成されたベース層のサンプルを使用して、イントラ予測信号を生成するための多重方法を有するエンハンスメント層符号化]
主な実施例:エンハンスメント層内のブロックを符号化することに対して、再構成されたベース層のサンプルを使用してイントラ予測信号を生成するための多重方法が、再構成されたエンハンスメント層のサンプルだけに基づく予測信号を生成する方法に加えて、提供される。
サブ実施例:
・多重方法は以下の方法を含む。(抽出された/フィルタにかけられた)再構成されたベース層信号は、エンハンスメント層予測信号として直接に使用される。
・多重方法は以下の方法を含む。(抽出された/フィルタにかけられた)再構成されたベース層信号は、空間イントラ予測信号に結合される。そこでは、空間イントラ予測が、隣接するブロックに対して差分サンプルに基づいて得られる。差分サンプルは、再構成されたエンハンスメント層信号と(抽出された/フィルタにかけられた)再構成されたベース層信号との差を表わす(実施例A参照)。
・多重方法は以下の方法を含む。(隣接する再構成されたエンハンスメント層のサンプルを使用して得られた)従来の空間イントラ予測信号は、(抽出された/フィルタにかけられた)ベース層残差信号(ベース層変換係数の逆変換、または、ベース層再構成とベース層予測の差)に結合される(実施例B参照)。
・多重方法は以下の方法を含む。(抽出された/フィルタにかけられた)再構成されたベース層信号は、空間イントラ予測信号に結合される。そこでは、空間イントラ予測が、隣接するブロックの再構成されたエンハンスメント層のサンプルに基づいて得られる。最終予測信号が、異なる周波数成分が異なる重み付けを使用する方法で、空間予測信号とベース層予測信号とに重み付けすることによって得られる(実施例C1参照)。
これは、例えば、以下のどれかによって実現される。
○ベース層予測信号を、ローパスフィルタによってフィルタにかけ、空間イントラ予測信号を、ハイパスフィルタによってフィルタにかけ、得られたフィルタにかけられた信号を加算すること(実施例C2参照)。
○ベース層予測信号とエンハンスメント層予測信号を変換し、得られた変換ブロックを重ねる。そこでは、異なる重み付け係数が、異なる周波数位置に対して使用される(実施例C3参照)。得られた変換ブロックは、逆変換され、エンハンスメント層予測信号として使用される。あるいは、得られた変換係数は、スケーリングされた送信された変換係数レベルに追加され、次に、非ブロック化およびループ内過程の前に再構成されたブロックを得るために、逆変換される(実施例C4参照)。
・再構成されたベース層信号を使用する方法に対して、以下のバージョンが使用される。これは固定される、または、それは、系列レベル、画像レベル、スライスレベル、最も大きい符号化ユニットレベル、符号化ユニットレベルでシグナリングされる。または、それは、別の符号化パラメータに依存して作成される。
○非ブロック化およびループ内過程の前の再構成されたベース層のサンプル(サンプルとして、適応型オフセットフィルタまたは適応型ループフィルタ)。
○非ブロック化の後で、ループ内過程の前の再構成されたベース層のサンプル(サンプルとして、適応型オフセットフィルタまたは適応型ループフィルタ)。
○非ブロック化およびループ内過程の後の再構成されたベース層のサンプル(サンプルとして、適応型オフセットフィルタまたは適応型ループフィルタ)、または、多重ループ内過程ステップの間の再構成されたベース層のサンプル(実施例D参照)。
・(抽出された/フィルタにかけられた)ベース層信号を使用する方法の多重バージョンが使用される。これらのバージョンのために採用された、抽出された/フィルタにかけられたベース層信号が、使用された補間フィルタ(整数サンプル位置をフィルタにかける補間フィルタを含む)内で異なる。または、2番目のバージョンのために抽出された/フィルタにかけられたベース層信号が、最初のバージョンのために抽出された/フィルタにかけられたベース層信号をフィルタにかけることによって得られる。異なるバージョンの1つの選択が、系列レベル、画像レベル、スライスレベル、最も大きい符号化ユニットレベル、符号化ユニットレベルでシグナリングされる。それは、対応する再構成されたベース層信号、または、送信された符号化パラメータの特性から推論される(実施例E参照)。
・異なるフィルタが、再構成されたベース層信号(実施例E参照)およびベース層残差信号(実施例F参照)を、抽出する/フィルタにかけるために使用される。
・残差信号がゼロであるベース層ブロックに対して、それは、ベース層から得られた別の信号(例えば、再構成されたベース層ブロックのハイパスフィルタにかけられたバージョン)に取り替えられる、(実施例G参照)。
・空間イントラ予測を使用するモードに対して、(特定の符号化順序による)エンハンスメント層内の利用できない隣接するサンプルが、抽出された/フィルタにかけられたベース層信号の対応するサンプルに取り替えられる(実施例H参照)。
・空間イントラ予測を使用するモードに対して、イントラ予測モードの符号化が変更される。最尤モードのリストは、併置されたベース層信号のイントラ予測モードを含む。
・特定のバージョンにおいて、エンハンスメント層の画像は、2段階の過程内で復号化される。最初の段階では、予測のために、ベース層信号を使用するブロックだけ(隣接するブロックを使用しない)が、または、インター予測信号が、復号化され、再構成される。2番目の段階では、予測のための隣接するサンプルを使用する残差ブロックは、再構成される。2番目の段階で再構成されたブロックに対して、空間イントラ予測概念が拡張される(実施例I参照)。既に再構成されたブロックの有用性に基づいて、現在のブロックの上側や左側に隣接するサンプルだけではなく、下側や右側に隣接するサンプルも、空間イントラ予測のために使用される。
[再構成されたベース層のサンプルを使用して、インター予測信号を発生させるための多重方法を有するエンハンスメント層符号化]
主な実施例:エンハンスメント層内のブロックを符号化することに対して、再構成されたベース層のサンプルを使用して、インター予測信号を発生させるための多重方法が、再構成されたエンハンスメント層のサンプルだけに基づいて予測信号を発生させる方法に追加して提供される。
サブ実施例:
・多重方法は以下の方法を含む。(既に再構成されたエンハンスメント層の画像の動き補償された補間によって得られる)従来のインター予測信号は、(抽出された/フィルタにかけられた)ベース層残差信号(ベース層変換係数の逆変換、または、ベース層再構成とベース層予測との間の差)に結合される。
・多重方法は以下の方法を含む。(抽出された/フィルタにかけられた)再構成されたベース層信号は、動き補償予測信号に結合される。そこでは、動き補償予測信号が、動き補償差分画像によって得られる。差分画像は、参照画像に対して、再構成されたエンハンスメント層信号と(抽出された/フィルタにかけられた)再構成されたベース層信号との間の差を表わす(実施例J参照)。
・多重方法は以下の方法を含む。(抽出された/フィルタにかけられた)再構成されたベース層信号は、インター予測信号に結合される。そこでは、インター予測が、再構成されたエンハンスメント層の画像を使用して、動き補償予測によって得られる。最終予測信号が、異なる周波数成分が異なる重み付け付けを使用する方法で、インター予測信号およびベース層予測信号を重み付けすることによって得られる(実施例C参照)。
これは、例えば、以下のどれかによって実現できる。
○ローパスフィルタでベース層予測信号をフィルタにかけ、ハイパスフィルタでインター予測信号をフィルタにかけ、得られたフィルタにかけられた信号を加算すること。
○ベース層予測信号およびインター予測信号を変換し、得られた変換ブロックを重ねる。そこでは、異なる重み付け係数が、異なる周波数位置に対して使用される。得られた変換ブロックは、非ブロック化およびループ内過程の前に再構成されたブロックを得るために、逆変換され、エンハンスメント層予測信号として使用される、あるいは、得られた変換係数が、スケーリングされた送信された変換係数レベルに追加され、次に、逆変換される。
・再構成されたベース層信号を使用する方法に対して、以下のバージョンが使用される。これが固定される、または、それが、系列レベル、画像レベル、スライスレベル、最も大きい符号化ユニットレベル、符号化ユニットレベルでシグナリングされる。または、それが、別の符号化パラメータに依存して作成される。
○非ブロック化およびループ内過程の前の再構成されたベース層のサンプル(サンプルとして、適応型オフセットフィルタまたは適応型ループフィルタ)。
○非ブロック化の後で、ループ内過程の前の再構成されたベース層のサンプル(サンプルとして、適応型オフセットフィルタまたは適応型ループフィルタ)。
○非ブロック化およびループ内過程の後の再構成されたベース層のサンプル(サンプルとして、適応型オフセットフィルタまたは適応型ループフィルタ)、または、多重ループ内過程ステップの間の再構成されたベース層のサンプル(実施例D参照)。
・残差信号がゼロであるベース層ブロックに対して、それは、ベース層から得られた別の信号(例えば、再構成されたベース層ブロックのハイパスフィルタにかけられたバージョン)に取り替えられる、(実施例G参照)。
・(抽出された/フィルタにかけられた)ベース層信号を使用する方法の多重バージョンが使用される。これらのバージョンのために採用された、抽出された/フィルタにかけられたベース層信号が、使用された補間フィルタ(整数サンプル位置をフィルタにかける補間フィルタを含む)内で異なる。または、2番目のバージョンのために抽出された/フィルタにかけられたベース層信号が、最初のバージョンのために抽出された/フィルタにかけられたベース層信号をフィルタにかけることによって得られる。異なるバージョンの1つの選択が、系列レベル、画像レベル、スライスレベル、最も大きい符号化ユニットレベル、符号化ユニットレベルでシグナリングされる。それは、対応する再構成されたベース層信号、または、送信された符号化パラメータの特性から推論される(実施例E参照)。
・異なるフィルタが、再構成されたベース層信号(実施例E参照)およびベース層残差信号(実施例F参照)を、抽出する/フィルタにかけるために使用される。
・差分画像(エンハンスメント層再構成と、抽出された/フィルタにかけられたベース層信号との間の差)の動き補償予測に対して(実施例J参照)、異なる補間フィルタが、再構成された画像の動き補償予測に対して使用される。
・差分画像(エンハンスメント層再構成と、抽出された/フィルタにかけられたベース層信号との間の差)の動き補償予測に対して(実施例J参照)、補間フィルタが、差分画像内の対応する領域の特性に基づいて(または、符号化パラメータに基づいて、または、ビットストリーム内で送信された情報に基づいて)選択される。
[エンハンスメント層動きパラメータ符号化]
主な実施例:エンハンスメント層動きパラメータ符号化のために、複数のエンハンスメント層予測器と、ベース層から得られた少なくとも1つの予測器との使用。
サブ実施例:
・(スケーリングされた)ベース層動きベクトルを、動きベクトル予測器リストに追加すること(実施例K参照)。
○現在のブロックの中央位置の併置されたサンプルをカバーするベース層ブロックの使用(可能な別の導出)。
○解像度比率に従うスケール動きベクトル。
・併置されたベース層ブロックの動きデータをマージ候補リストに加えること(実施例K参照)。
○現在のブロックの中央位置の併置されたサンプルをカバーするベース層ブロックの使用(可能な別の導出)。
○解像度比率に従うスケール動きベクトル。
○仮に、ベース層内で「マージ_フラグ」が1と等しいならば、加算しない。
・ベース層マージ情報に基づくマージ候補リストの再順序付け(実施例L参照)
○仮に、併置されたベース層ブロックが、特定の候補にマージされるならば、対応するエンハンスメント層候補が、エンハンスメント層マージ候補リスト内で、最初のエントリーとして使用される。
・ベース層動き予測器情報に基づく動き予測器候補リストの再順序付け(実施例L参照)
○仮に、併置されたベース層ブロックが、特定の動きベクトル予測器を使用するならば、対応するエンハンスメント層動きベクトル予測器が、エンハンスメント層動きベクトル予測器候補リスト内で、最初のエントリーとして使用される。
・マージインデックスの導出(すなわち、現在のブロックがマージされる候補)は、併置されたブロック内のベース層情報に基づく(実施例M参照)。例として、仮に、ベース層ブロックが、特定の隣接するブロックにマージされ、そして、それが、エンハンスメント層ブロックもマージするビットストリーム内でシグナリングされるならば、マージインデックスは、全く送信されないけれども、代わりに、エンハンスメント層ブロックが、併置されたベース層ブロックとして、同じ隣接するブロック(しかし、エンハンスメント層内の)にマージされる。
[エンハンスメント層パーティションと動きパラメータ推論]
主な実施例:ベース層パーティションおよび動きパラメータに基づいた、エンハンスメント層パーティションおよび動きパラメータの推論(おそらく、この実施例をサブ実施例のどれかに結合することが要求される)。
サブ実施例:
・併置されたベース層動きデータに基づくエンハンスメント層のN×Mサブブロックのための動きパラメータを得ること。同じ得られたパラメータ(または、小さい差を有するパラメータ)を有するブロックを、より大きいブロックに纏めること。予測と符号化ユニットを決定すること。(実施例T参照)
・動きパラメータは、動き仮説、参照インデックスリスト、動きベクトル、動きベクトル予測器識別子、マージ識別子の数を含む。
・エンハンスメント層予測信号を発生させるための多重方法の1つにシグナリングすること。そのような方法は以下を含む。
○得られた動きパラメータおよび再構成されたエンハンスメント層の参照画像を使用する動き補償。
○(a)現在の画像のための(抽出された/フィルタにかけられた)ベース層再構成と、(b)得られた動きパラメータを使用する動き補償信号と、再構成されたエンハンスメント層の画像から、(抽出された/フィルタにかけられた)ベース層再構成を引き算することによって発生するエンハンスメント層の参照画像とを結合すること。
○(a)現在の画像のための(抽出された/フィルタにかけられた)ベース層残差(再構成された信号と予測との間の差、または、符号化された変換係数値の逆変換)と、(b)得られた動きパラメータを使用する動き補償信号と、再構成されたエンハンスメント層の参照画像とを結合すること。
・仮に、ベース層内の併置されたブロックが、イントラ符号化されているならば、対応するエンハンスメント層M×Nブロック(または、CU)も、また、イントラ符号化される。そこでは、イントラ予測信号が、ベース層情報を使用して得られる(実施例U参照)。例えば、
○対応するベース層再構成の(抽出された/フィルタにかけられた)バージョンは、イントラ予測信号として使用される(実施例U参照)。
○イントラ予測モードは、ベース層内で使用されたイントラ予測モードに基づいて得られる。そして、このイントラ予測モードは、エンハンスメント層内の空間イントラ予測のために使用される。
・仮に、M×Nエンハンスメント層ブロック(サブブロック)のための併置されたベース層ブロックが、以前に符号化されたベース層ブロックにマージされる(または、同じ動きパラメータを有する)ならば、M×Nエンハンスメント層(サブ)ブロックも、また、ベース層内でマージするために使用されるベース層ブロックに対応するエンハンスメント層ブロックにマージされる(すなわち、動きパラメータは、対応するエンハンスメント層ブロックからコピーされる)(実施例M参照)。
[変換係数レベルの符号化/文脈モデル化]
主な実施例:異なる走査パターンを使用して、変換係数を符号化すること。エンハンスメント層に対して、符号化モードおよび/またはベース層データに基づいて文脈をモデル化すること、そして、文脈モードに対して異なる初期化をすること。
サブ実施例:
・1つ以上の追加走査パターン、例えば、水平で垂直な走査パターンを導入すること。追加走査パターンのためにサブブロックを再定義すること。4×4サブブロックの代わりに、例えば16×1または1×16サブブロックが使用される。または、8×2や8×2サブブロックが使用される。追加走査パターンは、特定のサイズ、例えば8×8または16×16より大きいまたは等しいブロックに対してのみ導入される(実施例V参照)。
・(仮に、符号化されたブロックフラグが1と等しいならば、)選択された走査パターンは、ビットストリーム内でシグナリングされる(実施例N参照)。対応する構文要素にシグナリングするために、固定文脈が使用される。または、対応する構文要素のための文脈導出は、以下のどれかに依存できる。
○併置された再構成されたベース層信号または再構成されたベース層残差の勾配。または、ベース層信号内で検出されたエッジ。
○併置されたベース層ブロック内の変換係数分布。
・選択された走査は、併置されたベース層信号の特性に基づいて、ベース層信号(どんな追加データも送信されることなく)から直接に得られる(実施例N参照)。
○併置された再構成されたベース層信号または再構成されたベース層残差の勾配。または、ベース層信号内で検出されたエッジ。
○併置されたベース層ブロック内の変換係数分布。
・異なる走査が、変換係数がエンコーダ側で量子化の後に再順序付けされ、かつ、従来の符号化が使用される方法で実現される。デコーダ側では、変換係数は、従来通り復号化され、スケーリングおよび逆変換前に(または、スケーリング後および逆変換前に)、再順序付けされる。
・重要なフラグ(単一の変換係数のためのサブグループフラグおよび/または重要なフラグ)を符号化するために、以下の変更が、エンハンスメント層内で使用される。
○分離文脈モデルが、ベース層情報を使用する符号化モードの全てまたはサブセットのために使用される。また、ベース層情報を有する異なるモードに対して、異なる文脈モデルを使用することも可能である。
○文脈モデル化は、併置されたベース層ブロックのデータ(例えば、特定の周波数位置のための重要な変換係数の数)に依存できる(実施例O参照)。
○符号化されるべき係数の空間的近傍内の既に符号化された重要な変換係数レベルの数、および、同じ周波数位置の併置されたベース層信号内の重要な変換係数の数の両方を評価した一般化されたテンプレートが使用される(実施例O参照)。
・最後の重要な走査位置を符号化するために、以下の変更がエンハンスメント層内で使用される。
○分離文脈モデルが、ベース層情報を使用する符号化モードの全てまたはサブセットのために使用される。また、ベース層情報を有する異なるモードに対して、異なる文脈モデルを使用することも可能である(実施例P参照)。
○文脈モデル化は、併置されたベース層ブロック内のデータに依存できる(例えば、ベース層内の変換係数分布、ベース層の勾配情報、併置されたベース層ブロック内の最後の走査位置)。
○最後の走査位置は、最後のベース層走査位置に対する差として符号化される(実施例S参照)。
・ベース層およびエンハンスメント層のための異なる文脈初期化テーブルの使用方法。
[ベース層データを使用する、後方の適応エンハンスメント層の符号化]
主な実施例:エンハンスメント層符号化パラメータを得るためのベース層データの使用。
サブ実施例:
・(潜在的に抽出される)ベース層再構成に基づいたマージ候補を得ること。エンハンスメント層内では、マージの使用のみがシグナリングされる。しかし、実際には、現在のブロックをマージするために使用される候補が、再構成されたベース層信号に基づいて得られる。従って、全てのマージ候補に対して、現在のエンハンスメント層ブロックのための(潜在的に抽出される)ベース層信号と、(マージ候補に動きパラメータを使用して得られた)対応する予測信号との間の誤差の大きさが、全てのマージ候補(または、そのサブセット)に対して評価される。そして、最も小さい誤差の大きさに関連するマージ候補が選択される。また、誤差の大きさが、再構成されたベース層信号とベース層の参照画像とを使用して、ベース層内で計算される(実施例Q参照)。
・(潜在的に抽出される)ベース層再構成に基づいたマージ候補を得ること。動きベクトル差は、符号化されないけれども、再構成されたベース層に基づいて推論される。現在のブロックのために、動きベクトル予測器を決定し、動きベクトル予測器の周囲に位置する定義された検索のセットを評価すること。それぞれの検索位置に対して、現在のエンハンスメント層ブロックのための(潜在的に抽出される)ベース層信号と、置き換えられた参照フレーム(置き換えは、検索位置によって与えられる)との間の誤差の大きさを決定すること。最も小さい誤差の大きさをもたらす検索位置/動きベクトルを選択すること。検索は、いくつかの段階に分けられる。例えば、完全なペル検索が最初に行われる。続いて、半分ペル検索が、完全なペルベクトルの周囲で行われる。続いて、4分の1ペル検索が、最も良い全/半ペルベクトルの周囲でおこなわれる。また、検索は、再構成されたベース層信号とベース層の参照画像とを使用して、ベース層内で行われる。見つけられた動きベクトルは、次に、ベース層とエンハンスメント層との間の解像度変化に従ってスケーリングされる(実施例Q参照)。
・(潜在的に抽出される)ベース層再構成に基づいたイントラ予測モードを得ること。イントラ予測モードは、符号化されないけれども、再構成されたベース層に基づいて推論される。それぞれの可能なイントラ予測モード(または、そのサブセット)に対して、(テストされた予測節(ノード)を使用して、)現在のエンハンスメント層ブロックのための(潜在的に抽出される)ベース層信号と、イントラ予測信号との間の誤差の大きさを決定すること。最も小さい誤差の大きさをもたらす予測モードを選択すること。また、誤差の大きさの計算は、ベース層内の再構成されたベース層信号とイントラ予測信号とを使用して、ベース層内でされる。さらに、イントラブロックは、4×4ブロック(または、別のブロックサイズ)に分解できる。そして、各4×4ブロックに対して、分離イントラ予測モードが決定される(実施例Q参照)。
・イントラ予測信号は、再構成されたベース層信号を有する境界サンプルの列の整合または列の整合によって決定される。隣接するサンプルと現在の行/列との間の導出を得るために、誤差の大きさは、隣接するサンプルの移行された行/列と再構成されたベース層信号との間で計算される。そして、最も小さい誤差の大きさをもたらすシフトが、選択される。隣接するサンプルとして、(抽出された)ベース層のサンプル、または、エンハンスメント層のサンプルが使用される。また、誤差の大きさが、ベース層内で直接に計算される(実施例W参照)。
・ブロックパーティションなどの別の符号化パラメータの導出のために、後方適応法を使用すること。
前記実施の形態の更なる簡潔な概要が、以下に提示される。特に、前記実施の形態が説明される。
A1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200a,200b,200c)を再構成(80)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
層間予測信号(380)を得るために、再構成されたベース層信号(200a,200b,200c)に解像度または品質改良を受け(220)させ、
エンハンスメント層信号の既に再構成された部分(400aまたは400b)と層間予測信号(380)との間の差分信号を計算(260)し、
空間イントラ予測信号を得るために、現在再構成されるべきエンハンスメント層信号(360)の部分に併置された第1の部分(440、図46に例えて)で、空間的に前記第1の部分に隣接し、かつ、エンハンスメント層信号(360)の既に再構成された部分に属する、差分信号の第2の部分(460)から差分信号を空間的に予測(260)し、
エンハンスメント層予測信号(420)を得るために、層間予測信号(380)と空間イントラ予測信号とを結合(260)し、
エンハンスメント層予測信号(420)を使用して、エンハンスメント層信号(360)を予測的に再構成(320,580,340,300,280)することを含む、ように構成されている。
実施例A1に従って、ベース層信号は、例えば、ベース層残差信号640/480が関連する限り、変換復号化を有する前述したブロックに基づいた予測方法で、符号化データストリーム6またはサブストリーム6aから、ベース層復号化ステージ80によってそれぞれ再構成される。しかし、別の代替の再構成も可能である。
エンハンスメント層復号化ステージ60によるエンハンスメント層信号360の再構成に関する限り、再構成されたベース層信号200a,200bまたは200cが受ける解像度または品質の改良は、例えば、解像度の改良の場合には抽出、または、品質の改良の場合にはコピー、または、ビット深さの改良の場合にはnビットからmビットへのトーン写像(m>n)を意味する。
差分信号の計算は、画素的になされる。すなわち、一方にエンハンスメント層信号および他方に予測信号380が併置された画素が、互いからを引き算される。そして、これは画素位置毎になされる。
差分信号の空間予測は、符号化データストリーム6内で、または、サブストリーム6b内で、イントラ予測方向のようなイントラ予測パラメータを送信して、そして、エンハンスメント層信号の現在の部分内のこのイントラ予測方向に沿って、現在再構成されるべきエンハンスメント層信号360の部分に接する既に再構成された画素をコピー/補間するような、何らかの方法によってなされる。組み合わせは、周波数領域内の寄与を異なって重み付けする組み合わせのように、加算、重み付けされた合計または更に精巧な組み合わせを意味する。
エンハンスメント層予測信号420を使用するエンハンスメント層信号360の予測再構成は、図に示されているように、エンハンスメント層残差信号540のエントロピー復号化および逆変換と、エンハンスメント層予測信号420および後者540の組み合わせ340とを意味する。
B1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層残差信号(480)を復号化(100)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
層間残差予測信号(380)を得るために、再構成されたベース層残差信号(480)に、解像度または品質の改良を受け(220)させ、
エンハンスメント層イントラ予測信号を得るために、エンハンスメント層信号(360)の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号(360)の部分を空間的に予測(260)し、
エンハンスメント層予測信号(420)を得るために、層間残差予測信号とエンハンスメント層イントラ予測信号とを結合(260)して、
エンハンスメント層予測信号(420)を使用して、エンハンスメント層信号(360)を予測的に再構成(340)することを含む、ように構成されている。
符号化データストリームからのベース層残差信号の復号化は、図に示すように、エントロピー復号化と逆変換とを使用して実行される。さらに、スケーラブルビデオデコーダは、任意に、ベース層予測信号660を得て、この信号とベース層残差信号480とを結合することによって、予測的に復号化することによって、ベース層信号自体の再構成を実行する。ちょうど言及するように、これは単に任意である。
エンハンスメント層信号の再構成に関する限り、解像度または品質の改良が、実施例A)に対して前記指示したように実行される。
また、エンハンスメント層信号の部分の空間的予測に関する限り、この空間的予測は、異なる信号に関するA)に例示的に概説されているように実行される。組み合わせと予測的再構成に関する限り、同様の注意は有効である。
しかしながら、実施例B)内のベース層残差信号480が、ベース層残差信号480の明らかにシグナリングされたバージョンと等しいように制限されないということが言及される。むしろ、スケーラブルビデオデコーダが、ベース層予測信号660を有するどんな再構成されたベース層信号バージョン200も引き算すること、は可能である。その結果、フィルタ120または140のようなフィルタ関数から食い止めている偏差によって明らかにシグナリングされたものから逸れるベース層残差信号480を得る。また、後者の状態は、ベース層残差信号が層間予測に関わる別の実施例に対して有効である。
C1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200a,200b,200c)を再構成(80)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
層間予測信号(380)を得るために、再構成されたベース層信号(200)に、解像度または品質の改良を受け(220)させ、
エンハンスメント層イントラ予測信号を得るために、エンハンスメント層信号(360)の既に再構成された部分(「空間的」の場合は400a,b;「時間的」の場合は400a,b,c)から現在再構成されるべきエンハンスメント層信号(360)の部分を空間的または時間的に予測(260)し、
層間予測信号とエンハンスメント層イントラ予測信号(380)がエンハンスメント層予測信号(420)に寄与する重み付けが、異なる空間周波数成分に亘って変化させるように、エンハンスメント層予測信号(420)を得るために、現在再構成されるべき部分で、層間予測信号とエンハンスメント層イントラ予測信号(380)との重み付け平均を形成(260)して、
エンハンスメント層予測信号(420)を使用して、エンハンスメント層信号(360)を予測的に再構成(340)することを含む、ように構成されている。
C2)ここで、重み付け平均の形成(260)は、現在再構成されるべき部分で、フィルタがかけられた信号を得るために、ローパスフィルタで層間予測信号(380)をフィルタ(260)にかけ、かつ、ハイパスフィルタでエンハンスメント層イントラ予測信号をフィルタ(260)にかけて、得られたフィルタにかけられた信号を合計することを含む。
C3)ここで、重み付け平均の形成(260)は、現在再構成されるべき部分で、変換係数を得るために、層間予測信号とエンハンスメント層イントラ予測信号とを変換(260)し、そして、重畳された変換係数を得るために、得られた変換係数に、異なる空間周波数成分に対して異なる重み付け係数を使用して重畳(260)し、そして、エンハンスメント層予測信号を得るために、重畳された変換係数を逆変換することを含む。
C4)ここで、エンハンスメント層予測信号(420)を使用して、エンハンスメント層信号の予測再構成(320,340)は、符号化データストリーム(6)からエンハンスメント層信号のための変換係数レベルを引き出し(320)、エンハンスメント層信号の変換バージョンを得るために、変換係数レベルと重畳された変換係数の合計を実行(340)して、エンハンスメント層信号(360)を得るために、エンハンスメント層信号の変換バージョンに逆変換を受けさせる(すなわち、図中の逆変換T-1が、少なくともその符号化モードのために、加算器340の下流に置かれる)ことを含む。
ベース層信号の再構成に関する限り、参照が、一般的には図に対して、そして、実施例A)およびB)に対するように、前述に対してなされる。
同じことが、空間予測と同様に、C)内で言及された解像度または品質の改良に適用される。
C)で言及された時間予測は、動き予測パラメータを、符号化データストリーム6とサブストリーム6aからそれぞれ得ている予測プロバイダ160に関わる。動きパラメータは、動きベクトル、引用フレームインデックスを含む。あるいは、動きパラメータは、現在再構成された部分のサブブロック毎に、動きサブ分割情報と動きベクトルの組み合わせを含む。
前述したように、重み付け平均の形成は、空間領域または変換領域内で終わる。従って、加算器340での加算は、空間領域または変換領域内で実行される。後者の場合、逆変換器580は逆変換を重み付け平均に適用する。
D1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200a,200b,200c)を再構成(80)し、
エンハンスメント層信号(380)を再構成(60)し、
再構成(60)は、
層間予測信号(380)を得るために、再構成されたベース層信号に、解像度または品質の改良を受け(220)させ、
層間予測信号(380)を使用して、エンハンスメント層信号(360)を予測的に再構成(320、340)し、
ここで、エンハンスメント層信号の再構成(60)は、層間予測信号(380)が発展するように実行され、ベース層信号とエンハンスメント層信号それぞれによってスケール的に表わされたビデオの異なる部分に対して、非ブロック化およびループ内のフィルタリング(140)の何も無い(200a)、または、1つまたは全て(200b,200c)のうちの異なる1つから、符号化ビットストリーム内のサイド情報を経由して制御される、ように構成されている。
ベース層信号の再構成に関する限り、参照が、一般的には図に対して、そして、実施例A)およびB)に対するように、前述に対してなされる。同じことが、解像度または品質の改良に適用される。
D)で言及された予測再構成は、前述したように、予測プロバイダ160に関わる。そして、予測再構成は、
エンハンスメント層イントラ予測信号を得るために、エンハンスメント層信号(380)の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号(360)の部分を空間的または時間的に予測(260)し、
エンハンスメント層予測信号(420)を得るために、層間予測信号(380)とエンハンスメント層イントラ予測信号とを結合(260)することに関わる。
層間予測信号(380)が発展するという事実は、符号化されたビットストリーム(360)内のサイド情報を経由して、非ブロック化の何も無い(200a)、または、1つまたは全て(200b,200c)の異なる1つから制御され、以下に意味するビデオの異なる部分に対して、ループ内のフィルタ(140)がかけられるということがある。
当然、ベース層サブストリーム6a自体は、全てのフィルタ120,140をバイパスするように、最終ベース層信号600をもたらすために異なる手段の使用(非ブロック化のみの使用、または、ループ内フィルタリングのみの使用、または、非ブロック化およびループ内フィルタリングの両方の使用)を(任意に)シグナリングする。フィルタ伝達関数さえ、ベース層サブストリーム6a内のサイド情報によってシグナリングされ、変化される。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化ユニット、予測ブロックまたはいかなる他の大きさによっても定義される。その結果、スケーラブルビデオデコーダ(符号化ステージ80)は、仮に、ベース層信号のみが再構成されるのであれば、これらの変化を適用する。しかしながら、そこから独立して(すなわち、ベース層信号6a内のちょうど言及されたサイド情報から独立して)、サブストリーム6bは、フィルタリングの組み合わせが、ベース層信号を得るために使用される新しい変化をシグナリングするサイド情報を含む。そこでは、全てのフィルタ120,140をバイパスさせて、エンハンスメント信号の予測的再構成内で使用(非ブロック化のみの使用、または、ループ内フィルタリングのみの使用、または、非ブロック化およびループ内フィルタリングとの両方の使用)される。すなわち、フィルタ伝達関数さえ、サブストリーム6b内のサイド情報によってシグナリングされ、変化される。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化ユニット、または、予測ブロック、または、いかなる別の大きさによっても定義され、このシグナリングがベース層信号6a内で使用される大きさと異なる。
E1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200a,200b,200c)を再構成(80)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
層間予測信号(380)を得るために、再構成されたベース層信号に、解像度または品質の改良を受け(220)させ、
層間予測信号(380)を使用して、エンハンスメント層信号(60)を予測的に再構成(320、340)し、
ここで、エンハンスメント層信号(360)の再構成(60)は、層間予測信号が発展するように実行され、符号化されたビットストリーム(6)内のサイド情報を経由して、または、シグナリングに依存して、ベース層信号とエンハンスメント層信号それぞれによってスケール的に表わされたビデオの異なる部分に対して、抽出補間フィルタ(220)のための異なるフィルタ伝達関数から制御されることを含む、ように構成されている。
ベース層信号の再構成に関する限り、参照が、一般的には図に対して、そして、実施例A)およびB)に対するように、前述に対してなされる。同じことが、解像度または品質の改良に適用される。
言及された予測再構成は、前述したように、予測プロバイダ160に関わる。そして、予測再構成は、
エンハンスメント層イントラ予測信号を得るために、エンハンスメント層信号(360)の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号(360)の部分を空間的または時間的に予測(260)し、
エンハンスメント層予測信号(420)を得るために、層間予測信号(380)とエンハンスメント層イントラ予測信号とを結合(260)することに関わる。
層間予測信号が発展するという事実は、符号化されたビットストリーム(6)内のサイド情報を経由して、または、シグナリングに依存して、以下のビデオ手段の異なる部分に対して、抽出補間フィルタ(220)のための異なるフィルタ伝達関数から制御されるということである。
当然、ベース層サブストリーム6a自体は、全てのフィルタ120,140をバイパスするように、最終ベース層信号600をもたらすために異なる手段の使用(非ブロック化のみの使用、または、ループ内フィルタリングのみの使用、または、非ブロック化およびループ内フィルタリングとの両方の使用)を(任意に)シグナリングする。フィルタ伝達関数さえ、ベース層サブストリーム6a内のサイド情報によってシグナリングされ、変化される。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化ユニット、予測ブロックまたはいかなる別の大きさによっても定義される。その結果、スケーラブルビデオデコーダ(符号化ステージ80)は、仮に、ベース層信号のみが再構成されるのであれば、これらの変化を適用する。しかしながら、そこから独立して(すなわち、ベース層信号6a内のちょうど言及されたサイド情報から独立して)、サブストリーム6bは、改良された信号380を得るために、改良器220内で使用されるフィルタ伝達関数の変化を追加的にシグナリングするサイド情報を含む。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化ユニット、または、予測ブロック、または、いかなる別の大きさによっても定義され、ベース層信号6aの前述の大きさと異なる。
前述のように、使用されるべき変化は、追加サイド情報の使用の有る無しに関わらず、ベース層信号またはベース層残差信号またはサブストリーム6a内の符号化パラメータから、信号に依存して推論される。
F1)スケーラブルビデオデコーダは、
符号化データストリームからベース層残差信号(480)を復号化(100)し、
層間残差予測信号(380)を得るために、再構成されたベース層残差信号(480)に、解像度または品質の改良を受け(220)させることによって、エンハンスメント層信号(360)を再構成(60)し、そして、層間残差予測信号(380)を使用して、エンハンスメント層信号(360)を予測的に再構成(320,340、および任意に260)し、
ここで、エンハンスメント層信号(360)の再構成(60)は、層間残差予測信号が展開するように実行され、符号化されたビットストリーム(6)内のサイド情報を経由して、または、シグナリングに依存して、ベース層信号とエンハンスメント層信号それぞれによってスケール的に表わされたビデオの異なる部分に対して、異なるフィルタ伝達関数から制御されるように構成されている。
ベース層残差信号の再構成に関する限り、参照が、一般的には図に対して、そして、実施例B)に対するように、前述に対してなされる。同じことが、解像度または品質の改良に適用される。
言及された予測再構成は、前述したように、予測プロバイダ160に関わる。そして、予測再構成は、
エンハンスメント層イントラ予測信号を得るために、エンハンスメント層信号(360)の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号(360)の部分を空間的または時間的に予測(260)し、
エンハンスメント層残差信号を、符号化されたデータストリームから復号化(320)し、
エンハンスメント層信号(360)を得るために、エンハンスメント層イントラ予測信号と層間残差予測信号(380)とエンハンスメント層残差信号とを結合(340と260とに関わる)することに関わる。
層間残差予測信号が発展するという事実は、符号化されたビットストリーム内のサイド情報を経由して、以下のビデオ手段の異なる部分に対して、異なるフィルタ伝達関数から制御されるということである。
当然、ベース層サブストリーム6a自体は、全てのフィルタ120,140をバイパスするように、最終ベース層信号600をもたらすために異なる手段の使用に(任意に)シグナリングする。前述のD)とE)を参照されたい。しかしながら、そこから独立して(すなわち、ベース層信号6a内のちょうど言及されたサイド情報から独立して)、サブストリーム6bは、改良された残差信号380を得るために、改良器220内で使用されるフィルタ伝達関数の変化を追加的にシグナリングするサイド情報を含む。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化ユニット、または、予測ブロック、または、いかなる別の大きさによっても定義され、ベース層信号6aの前述の大きさと異なる。
前述のように、使用されるべき変化は、追加サイド情報の使用の有無に関わらず、ベース層信号またはベース層残差信号またはサブストリーム6a内の符号化パラメータから、信号に依存して推論される。
G1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200)のベース層残差信号(480)を復号化(100)し、
層間残差予測信号(380)を得るために、再構成されたベース層残差信号(480)に、解像度または品質の改良を受け(220)させることによって、エンハンスメント層信号(360)を再構成(60)し、そして、層間残差予測信号(480)を使用して、エンハンスメント層信号(360)を予測的に再構成(320,340、および任意で260)し、
ここで、エンハンスメント層信号(360)の再構成(60)は、全てをゼロにされたベース層残差信号(480)のブロックを識別(260)して、識別されたブロックを、ベース層信号(200)の部分から導出された置換信号に取り替えることを含む、
ように構成されている。
ベース層残差信号の復号化に関する限り、参照が、一般的に対して、そして、実施例B)に対するように、前述に対してなされる。同じことが、解像度または品質の改良に適用される。
言及された予測再構成は、前述したように、予測プロバイダ160に関わる。そして、予測再構成は、
エンハンスメント層イントラ予測信号を得るために、エンハンスメント層信号(360)の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号(360)の部分を空間的または時間的に予測(260)し、
エンハンスメント層残差信号を、符号化されたデータストリームから復号化(320)し、
エンハンスメント層信号(360)を得るために、エンハンスメント層イントラ予測信号と層間残差予測信号(380)とエンハンスメント層残差信号とを結合(340と260とに関わる)することに関わる。
好ましくは、識別は、ベース層ストリーム(6a)内の構文要素をチェックし、それぞれの変換ブロックが全てゼロであるか否かに対して、例えば、前述の符号化ユニットの別のサブ分割である変換ブロックの大きさで示すプロバイダ260に関わる。
前述するように、交換に使用されるベース層信号の部分は、例えば、ベース層信号200a,b,cのハイパスフィルタにかけられたバージョンである。
H1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200a,b,c)を再構成(80)し、
エンハンスメント層信号を再構成(60)し、
再構成(60)は、
層間予測信号(380)を得るために、再構成されたベース層信号(200)に解像度または品質の改良を受け(220)させ、
エンハンスメント層予測信号(420)を得るために、エンハンスメント層信号(360)の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号(360)の部分を空間予測(260)し、
エンハンスメント層予測信号(420)を使用して、エンハンスメント層信号(360)を予測的に再構成(340)し、
ここで、空間予測(260)は、現在再構成されるべき部分の予め決められた隣接部分内の非利用可能な部分を、層間予測信号(380)の非利用可能な部分に併置された、併置された部分と取り替えて、層間予測信号(380)の併置された部分に依存する空間予測も実行することを含む、
ように構成されている。
ベース層信号の再構成に関する限り、参照が、一般的には図に対して、そして、実施例A)およびB)に対するように、前述に対してなされる。同じことが、前述された空間予測と予測的再構成と同様に、解像度または品質の改良に適用される。
非利用可能性は以下の事実から生じる。予め決められた隣接部分が、その右に更に拡がるサンプルと同様に、現在再構成されるべき部分/ブロックの上側エッジの上に隣接しているサンプルと、その下方に更に拡がるサンプルと同様に、再構成されるべき現在のブロック/部分の左側エッジの左に隣接しているサンプルとを含む、と仮定されたい。さらに、空間予測が、サブ分割に基づいた多分木の葉であるブロック/部分に適用され、そして、これらのブロックが、深く最初にジグザグに横断する順序で、予測再構成過程内を横断される、と仮定する。次に、あるブロックでは、問題のあるすべての隣接するサンプルが
利用できる。すなわち、それらは既に再構成されている。しかしながら、いくつかのブロックは、これらのいくつかのサンプルを欠いている。すなわち、それらは完全には再構成されていない。そして、説明されるように、初期設定サンプルが取り替えられる。潜在的に交換を必要とする別の事実は、どんなフレームに対してもイントラ内のスライス境界の位置である。交換自体は、初期設定サンプルに対して、層間予測信号(380)の併置されたサンプルをコピーすることによって行われる。次に、空間予測が、層間予測信号(380)からコピーされたサンプルと再構成されたエンハンスメント層信号からのサンプルとを含んでいる完全な(完成された)予め決められた隣接部分を使用して行われる。
I1)スケーラブルビデオデコーダは、
フレームの異なるブロックに対して、層間予測モード、時間インター予測モードおよび空間イントラ予測モードのうちの異なる1つを使用して、エンハンスメント層信号(360)を再構成(60)するように構成され、
ここで、ケーラブルビデオデコーダは、エンハンスメント層信号(360)を再構成(60)する中で、最初の走査と、次の、2番目の走査との中で、ブロックを横断することによってブロックを再構成(60)し、最初の走査内で、空間イントラ予測モードを使用して、再構成されるべきブロックを跳ばし、層間予測モードおよびインター予測モードの1つを使用して、再構成されるべきブロックを再構成し、そして、2番目の走査内で、空間イントラ予測モードを使用して、再構成されるべきブロックを再構成するように構成されている。
「空間イントラ予測モード」と「時間インター予測モード」に関する限り、参照が、可能な実現のための前述の議論に対してなされる。「層間予測モード」に関する限り、そのようなモードのための例のいずれも、今までのところまたは以下で説明されるように、使用される。既に再構成されたサンプルによって囲まれたエンハンスメント層信号の空間的イントラ予測モードブロックの完全な外形を持つ増加する機会のために、現在予測された空間イントラ予測モードブロックのイントラが充填されるべき隣接するサンプルのテンプレートは、外形を完全に囲むために増加する。
J1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200a,b,c)を再構成(80)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
参照フレームと現在のフレームに対して、層間予測信号(380)を得るために、再構成されたベース層信号(200a,b,c)に、解像度または品質の改良を受け(220)させ、
参照フレームの層間予測信号(380)と参照フレームの既に再構成されたエンハンスメント層信号(360)との間の差分信号を形成(260)し、
現在のフレームの差分信号予測を得るために、差分信号に動き補償予測を受け(260)させ、
エンハンスメント層予測信号(420)を得るために、現在のフレームの層間予測信号(380)と現在のフレームの差分信号予測とを結合(260)し、
エンハンスメント層予測信号(420)を使用して、エンハンスメント層信号(360)を予測的に再構成(320,340,300,280)することを含む、
ように構成されている。
J2)ここで、参照フレームの差分信号の形成において、使用された再構成されたエンハンスメント層信号は、非ブロック化の前、または、非ブロック化の後で任意のループ内フィルタリングの前、または、非ブロック化および任意のループ内フィルタリングの後のエンハンスメント層再構成である。
J3)ここで、参照フレームの差分信号を形成するために使用されるエンハンスメント層信号の選択は、系列、画像、またはブロックレベルで、ビットストリーム内でシグナリングされる。
動き補償予測は、エンハンスメント信号(デコーダ320に関わる導出)の現在再構成されたブロックに対して、動き予測パラメータを、それぞれ符号化データストリーム6とサブストリーム6bとか得ている予測プロバイダ260に関わる。動きベクトルは、現在再構成されるべきエンハンスメント層信号の部分の位置に適用される。そして、それぞれ置き換えられた部分は、差分信号から、(断片的なサンプル補間の有る無しに関わらず)コピーされる。このようにしてコピーされた部分は、例えば、画素的な組み合わせの中で、現在再構成されるべき部分に併置された層間予測信号(380)の部分に加算される。
K1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層動きパラメータ(520)を復号し、
エンハンスメント層信号(260)を再構成(60)し、
再構成(60)は、
エンハンスメント層信号(360)のフレームのブロックに対して、フレームの隣接する既に再構成されたブロックから動きパラメータ候補のセットを集め(260)、
ベース層動きパラメータ(520)から、エンハンスメント層信号(360)のフレームのブロックに併置されたベース層信号のブロックのベース層動きパラメータを集め(260)、
動きパラメータ候補の拡張動きパラメータ候補セットを得るために、ベース層動きパラメータまたはベース層動きパラメータのスケーリングされたバージョンを、動きパラメータ候補のセットに加算(260)し、
少なくとも拡張動きパラメータ候補セットの動きパラメータ候補の1つを選択(260)し、
動き補償予測によって、拡張動きパラメータ候補セットの動きパラメータ候補の選択された1つを使用して、エンハンスメント層信号を予測(260)することを含む、ように構成されている。
K2)ここで、スケーラブルビデオデコーダは、ベース層動きパラメータのスケーリングされたバージョンを得るために、ベース層信号とエンハンスメント層信号との間の空間解像度比率に従って、ベース層動きパラメータをスケーリングするように構成されている。
K3)ここで、スケーラブルビデオデコーダは、ベース層動きパラメータが、マージを使用して、符号化データストリーム内で符号化されるか否かをチェックし、仮に、ベース層動きパラメータが、マージを使用して、符号化データストリーム内で符号化されるならば、加算を抑圧するように構成されている。
この実施例で言及された動きパラメータは、動きベクトル(動きベクトル予測)のみに、または、ブロック毎の動き仮説、参照インデックスリスト、パーティショニング情報(マージ化)の数を含む動きパラメータの完全なセットに関連する。
従って、「スケーリングされたバージョン」は、空間スケーラビリティの場合において、ベース層信号とエンハンスメント層信号との間の空間解像度比率に従って、ベース層信号内で使用された動きパラメータのスケーリングから由来してもよい。
符号化データストリームからのベース層動きパラメータ520の復号化は、動きベクトル予測またはマージ化にも関わる。
マージ化/動きベクトル候補のセット内のベース層信号の併置された部分で、使用された動きパラメータの補間は、イントラ層候補および層間候補内で、非常に有効な索引を可能にする。
選択は、予測ブロックや符号化ユニットのようなエンハンスメント層信号内の、動きパラメータ候補の拡張されたセット/リスト内のインデックスの明白なシグナリングに関わる。あるいはまた、選択インデックスはエンハンスメント層信号6bまたは層間情報の別の情報から推論される。
L1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層動きパラメータ(520)を復号(100)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
ベース層動きパラメータに依存するエンハンスメント層信号のための動きパラメータ候補リストを順序付け(240)し、
符号化データストリーム(6)内の明らかにシグナリングされたインデックス構文要素を経由して制御された、エンハンスメント層信号のための順序付けされた動きパラメータ候補リストからエンハンスメント層動きパラメータを選択(240)し、
動き補償パラメータによって、決められた動きパラメータを使用して、エンハンスメント層信号を予測(260)することを含む、ように構成されている。
この実施例で言及された動きパラメータに関する限り、実施例Kに関して上で述べたと同じことが適用される。
符号化データストリームからのベース層動きパラメータ520の復号化は、(任意に)動きベクトル予測またはマージにも関わる。
順序付けは、それぞれのエンハンスメント層動きパラメータ候補と、エンハンスメント層信号の現在のブロックに併置されたベース層信号のブロックに関連するベース層信号のベース層動きパラメータとの間の差を測る大きさに従ってなされる。すなわち、エンハンスメント層信号の現在のブロックに対して、エンハンスメント層動きパラメータ候補のリストが、最初に決定される。次に、順序付けが、ちょうど述べられるように実行される。以下に、選択が明白なシグナリングで実行される。
また、順序付けは、エンハンスメント層信号の現在のブロックと、ベース層内の空間的および/または時間的に隣接するブロックのベース層動きパラメータに併置されたベース層信号のブロックに関連するベース層信号のベース層動きパラメータとの間の差を測る大きさに従ってもなされる。次に、ベース層内の決められた順序付けが、エンハンスメント層に転送される。その結果、エンハンスメント層動きパラメータ候補が、対応するベース層候補に対して決められた順序付けと同じ方法で順序付けされる。ここで、関連したベース層ブロックが、考慮されたエンハンスメント層動きパラメータ候補に関連しているエンハンスメント層ブロックに、空間的/時間的に併置されるとき、ベース層動きパラメータ候補は、エンハンスメント層動きパラメータ候補に対応すると言われる。順序付けに基づいて、選択は明白なシグナリングによって実行される。
M1)スケーラブルビデオデコーダは、
ベース層信号(200)ための動きパラメータ候補リスト内のインデックスを使用して、符号化データストリーム(6)からベース層動きパラメータ(520)を復号(100)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
ベース層信号のための動きパラメータ候補リスト内のインデックスに依存するエンハンスメント層信号のための動きパラメータ候補リスト内のインデックスを決定(240)し、
エンハンスメント層信号のための動きパラメータ候補リスト内のインデックスを使用して、エンハンスメント層動きパラメータを決定(240)して、
動き補償予測によって、決められた動きパラメータを使用して、エンハンスメント層信号を予測(260)することを含む、ように構成されている。
この実施例で言及された動きパラメータに関する限り、実施例Kに関して上で述べたと同じことが適用される。
ベース層動きパラメータ520の復号化は、ベース層信号のブロックに対して、
現在のブロックのための動きパラメータが、マージまたはマージ無しの方法(予測的にまたは非予測的に符号化される方法)で、ベース層サブストリーム6a内でシグナリングされるか否かに対してシグナリングするフラグを点検し、
仮に、マージを使用して、符号化される、または、予測的に符号化されるならば、ベース層動きパラメータ(例えば、ベース層動きパラメータは、決定のために使用されるベース層信号の隣接するブロックのために使用/選択される)のリストを決定し、
それぞれのリスト内のインデックスは、ベース層信号6aから得られ、リスト内のベース層動きパラメータの1つを選択するために使用され、
エンハンスメント層のためのインデックスは、インデックスされたベース層候補に関連するベース層ブロックに併置されたエンハンスメント層ブロックが、選択される方法で決定されること、を含む。
エンハンスメント層信号の現在のブロックに対して、エンハンスメント層動きパラメータのリストが決定される。例えば、エンハンスメント層信号の隣接するブロックのために使用/選択される動きパラメータは、決定のために使用される。
エンハンスメント層内の動きパラメータインデックスの選択は、それぞれのエンハンスメント層動きパラメータと、エンハンスメント層信号の現在のブロックに併置されたベース層信号のブロックに関連するベース層信号の(中で使用/選択される)ベース層動きパラメータとの間の差を測る大きさに従って実行される。
また、エンハンスメント層内の動きパラメータインデックスの選択は、エンハンスメント層信号の現在のブロックに併置されたベース層信号のブロックに関連するベース層信号のベース層動きパラメータと、ベース層内の空間的および/または時間的に隣接するブロックのベース層動きパラメータとの間の差を測る大きさに従って実行される。次に、ベース層のための選択が、エンハンスメント層に移される。その結果、選択されたベース層候補に対応するエンハンスメント層動きパラメータ候補が、選ばれる。関連ベース層ブロックが、考慮されるエンハンスメント層動きパラメータ候補に関連しているエンハンスメント層ブロックに空間的/時間的に併置されるとき、ベース層動きパラメータ候補は、エンハンスメント層動きパラメータ候補に対応すると言われる。
N1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層残差信号(480)を復号(100)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
走査予測器(520)を得るために、ベース層残差信号(480)またはベース層信号の、スペクトル分解の勾配または情報を決定(240)し、
走査予測器(520)に依存する走査パターンを使用して、符号化データストリーム(6)から、エンハンスメント層残差信号(540)の変換係数を復号(320)することを含む、ように構成されている。
すなわち、変換係数の復号化は、そのすべてが変換ブロックを完全にカバーする、可能な走査パターンのセットからの走査パターンの選択に関わる。好ましくは、選択された走査パターンが、ベース層残差信号の重要なスペクトル成分を、可能な走査パターンのセットの別の走査パターンよりも早く横断するように、選択される。
R1)ビデオデコーダは、
そのすべてが変換ブロックを完全にカバーする、可能な走査パターンのセットからの走査パターンの選択によって、符号化データストリーム(6)から残差信号(540または100の出力)の変換ブロックの変換係数を復号(320)し、選択は、符号化データストリーム内の明白なシグナリングに依存するように構成されている。
R2)ここで、復号(320)は、走査パターンの(520と240を経由した)選択に依存する変換係数に関連する構文要素のための文脈モデルを使用する。
R2a)ここで、変換係数に関連する構文要素は、変換係数が、特定の走査位置に対して、ゼロに等しいか、または、ゼロに等しくないか指示する構文要素を含む。
R2b)ここで、変換係数に関連する構文要素は、特定の走査順序における最後のゼロでない変換係数の位置を指示する構文要素を含む。
R2c)ここで、変換係数に関連する構文要素は、変換ブロックのサブブロックが、ゼロに等しくない変換係数を含むか否かを指示する構文要素を含む。
R3)ここで、明白なシグナリングが、ベース層残差信号(480)またはベース層信号の勾配、またはスペクトル的分解の情報に依存する、文脈モデルを使用して、可能な走査パターンのセット内のインデックスをエントロピー復号化(320)することに関わる。
R4)ここで、変換係数レベルの復号化(320)に対して、変換ブロックはサブブロックにサブ分割され、サブブロックがゼロでない変換係数を含むか否かをシグナリングする構文要素は送信され、そして、サブブロックのサイズまたは形状は、または、サブブロック内の変換ブロックのパーティションは、選択された走査パターンに依存する。
S1)スケーラブルビデオデコーダは、
ベース層残差信号の変換ブロックの最後の重要な変換係数の位置を指示する符号化データストリームから最初の構文要素を復号化することを含む、符号化データストリーム(6)からベース層残差信号の変換ブロックの変換係数を復号(100)し、
符号化データストリームから2番目の復号化構文要素を含み、最初の構文要素と2番目の構文要素に基づくエンハンスメント層残差信号の位置を計算する、エンハンスメント層残差信号の変換ブロックの変換係数を復号(100)するように構成されている。
O1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号のベース層残差信号(480)を復号(100)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
ベース層残差信号(480)またはベース層信号に(520と240を経由して)依存する文脈モデルまたは予測器を使用して、符号化データストリーム(6)から、エンハンスメント層残差信号(540)の変換係数ブロックに関連する構文要素を復号(320)することを含む、ように構成されている。
例えば、テンプレートは、現在訪問された変換係数位置での所定の変換係数を符号化するための文脈を決定するために使用される。そして、また、テンプレートは、(ベース層とエンハンスメント層内の変換ブロックのサイズの大きさでの)位置、および、スペクトル周波数の観点から、所定の変換係数位置に対応するベース層残差信号内の1つ以上の変換ブロック内の位置に関わる。
または、ベース層残差信号(480)またはベース層信号の勾配またはスペクトル分解の情報が、文脈モデルを決定するために使用される。
P1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号のベース層残差信号(480)を復号(100)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
エンハンスメント層信号(360)の部分と異なる予測モードに従って、エンハンスメント層信号(360)、ベース層残差信号およびベース層信号の既に再構成された部分から、エンハンスメント層信号(360)の部分を予測(260)し、
変換係数ブロックが属するエンハンスメント層信号(360)が、ベース層残差信号とベース層信号とのいずれかに基づいた層間予測に関わるか否かに(520と240を経由して)依存する文脈モデルを使用して、符号化データストリーム(6)から、エンハンスメント層残差信号(540)の変換係数ブロックに関連する構文要素を復号(320)し、
そして、エンハンスメント層予想信号(420)を使用して、エンハンスメント層信号(360)を予測的に再構成(340)することを含む、
ように構成されている。
Q1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200a,b,c)を再構成(80)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
層間予測信号(380)を得るために、再構成されたベース層信号(200)に解像度または品質の改良を受け(220)させ、
符号化パラメータのセットの各符号化パラメータ候補に対して、それぞれの試験的な再構成または部分的な再構成の結果を得るために、それぞれの符号化パラメータ候補を使用して、エンハンスメント層信号(360)の再構成または部分的な再構成を試験的に実行(260)し、
各符号化パラメータ候補に対して、層間予測信号(380)とそれぞれの試験的な再構成または部分的再構成の結果との間の差の大きさを決定(260)し、
各符号化パラメータ候補に対して大きさに依存して、符号化パラメータ候補のセット内で選択(260)し、
そして、選択された符号化パラメータ候補を使用して、エンハンスメント層信号(360)を等しく再構成(320,340,260)することを含む、
ように構成されている。
Q2)ここで、エンハンスメント層に対して決定された符号化パラメータは、イントラ予測モードに関連する。
Q3)ここで、エンハンスメント層に対して決定された符号化パラメータは、参照画像または動きベクトルなどの動きパラメータに関連する。
Q4)ここで、エンハンスメント層に対して決定された符号化パラメータは、マージ候補に関連する。
Z1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200a,b,c)を再構成(80)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
符号化パラメータのセットの各符号化パラメータ候補に対して、それぞれの試験的な再構成または部分的な再構成の結果を得るために、それぞれの符号化パラメータ候補を使用して、ベース層信号(360)の再構成または部分的な再構成を試験的に実行(260)し、
各符号化パラメータ候補に対して、実際に復号化されたベース層再構成とそれぞれの実験的な再構成または部分的な再構成の結果との間の差の大きさを決定(260)し、
各符号化パラメータ候補に対して大きさに依存して、符号化パラメータ候補のセット内で選択(260)し、
選択された符号化パラメータ候補をエンハンスメント層に転送し、転送は解像度の差に従うスケーリングを含み、
そして、転送された符号化パラメータ候補を使用して、エンハンスメント層信号(360)を等しく再構成(320,340,260)することを含む、
ように構成されている。
T1)スケーラブルビデオデコーダは、
イントラブロックのための空間イントラ予測およびインターブロックのための時間インター予測を使用して、イントラブロックおよびインターブロック内のサブ分割フレームによって、ベース層信号を予測的に再構成(100,180,160)し、
エンハンスメント層信号(360)を予測的に再構成(320,340,260)し、 再構成(320,340,260)は、
現在再構成されるべきエンハンスメント層信号(360)の部分のサブ部分を得るために、現在再構成されるべきエンハンスメント層信号(360)の部分に併置されたベース層信号のブロックのブロックサブ分割を、現在再構成されるべきエンハンスメント層信号(360)の部分に局所的に転送し、そして、関連するエンハンスメント層動きベクトルを、ベース層動きベクトルに基づくサブ部分に局所的に転送し、
ベース層動きベクトルに基づくサブ部分に関連するエンハンスメント層動きベクトルを使用して、エンハンスメント層信号(360)の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号(360)の部分を、動き補償予測によって予測(260)することを含む、
ように構成されている。
T2)スケーラブルビデオデコーダは、
ベース層信号を空間的に変化させるベース層符号化パラメータを使用して、ベース層信号を予測的に再構成(10,18,16)し、
ブロックのユニット内でエンハンスメント層信号(36)を再構成(32,34,26)し、
再構成(32,34,26)は、
ブロックの予め決められたブロックに対して、ベース層信号の併置された部分に転送されたとき、選択されたサブブロックのサブ分割が、サブ分割される可能なサブブロックのサブ分割のセット内で最も粗いように、可能なサブブロックのサブ分割のセット内のサブブロックのサブ分割を選択し、その結果、ベース層信号は、それぞれのサブブロックのサブ分割の各サブブロック内で、ベース層符号化パラメータは互いに十分同じであり、
選択されたサブブロックのサブ分割を使用して、予め決められたブロックを予測的に再構成することを含む、
ように構成されている。
U1)スケーラブルビデオデコーダは、
イントラブロックのための空間イントラ予測とインターブロックのための時間インター予測を使用して、イントラブロックとインターブロック内のベース層信号のフレームをサブ分割して、そして、イントラブロックとインターブロックがサブ分割されるブロックのユニット内で、それぞれ空間イントラ予測と時間インター予測に関連した予測パラメータをセットすることによって、ベース層信号を予測的にそれぞれ再構成(100,180,160)し、
エンハンスメント層信号(360)を予測的に再構成(320,340,260)し、
再構成(320,340,260)は、
符号化データストリーム内の予測モード構文を経由して制御され、エンハンスメント信号のフレームが、空間イントラ予測モード、時間インター予測モードおよび層間予測モードを含む予測モードのセットのそれぞれの1つにサブ分割される符号化ユニット内のエンハンスメント信号のフレームを割り当て、
それぞれの符号化ユニットが割り当てられたそれぞれの予測モードを使用して、各符号化ユニットを予測的に再構成し、
割り当てられた空間イントラ予測モードおよび時間インター予測モードのいずれかを有する符号化ユニットに対して、
更に予測ブロック内の符号化ユニットをサブ分割して、それぞれの符号化ユニットが予測ブロックのユニット内で割り当てられたそれぞれの予測モードに関連する予測パラメータをセットし、
割り当てられた空間イントラ予測を有するそれぞれの符号化ユニットの場合には、予測パラメータセットを使用して、全ての予測ブロックに空間イントラ予測を受けさせ、そして、割り当てられた時間インター予測を有するそれぞれの符号化ユニットの場合には、予測パラメータセットを使用して、全ての予測ブロックに時間インター予測を受けさせ、
割り当てられた層間予測モードを有するそれぞれの符号化ユニットに対して、
イントラブロックおよびインターブロックの両方に局所的に重なる符号化ユニットが、非時間的モードに関連しかつイントラブロックに局所的に一致する少なくとも1つの予測ブロックと、時間インター予測モードに関連しかつインターブロックに局所的に一致する少なくとも1つの予測ブロックとにサブ分割されるように、ベース層信号のイントラブロックとインターブロックとのサブ分割を、それぞれ符号化ユニットに局所的に転送し、
割り当てられた非時間的予測モードを有するそれぞれの符号化ユニットの全ての予測ブロックに、局所的に一致するイントラブロックの予測パラメータから得られた予測パラメータを使用して、空間イントラ予測を受けさせ、あるいは、層間予測の場合には、層間予測信号(380)を得るために、ベース層信号に、解像度または品質の改良を受け(220)させ、
層間予測信号(380)を使用して、割り当てられた非時間的予測モードを有するそれぞれの符号化ユニットの予測ブロックを予測(260)し、
そして、割り当てられた時間インター予測モードを有するそれぞれの符号化ユニットの全ての予測ブロックに、局所的に一致するインターブロックの予測パラメータから得られた予測パラメータを使用して、時間インター予測を受けさせることを含む、ように構成されている。
V1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200)のベース層残差信号(480)を復号(100)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
以下の構成によって、符号化データストリームからエンハンスメント層信号を表す変換係数の変換係数ブロックを復号し、
ベース層残差信号またはベース層信号に基づいて、可能なサブブロックのサブ分割のセット内でサブブロックのサブ分割を選択し、
1つのサブブロック内の全ての位置が、サブブロック内で定義されたサブブロックの順序で次のサブブロックに続く直ぐに連続した方法で、横断されるように、変換係数ブロックが、選択されたサブブロックのサブ分割に従って規則的にサブ分割される、サブブロックのユニット内の変換係数の位置を横断し、
現在訪問されたサブブロックに対して、
データストリームから、現在訪問されたサブブロックが重要な変換係数を有するか否かを示す構文要素を復号し、
仮に、構文要素が、現在訪問されたサブブロックは重要な変換係数を有さないことを示すならば、現在訪問されたサブブロック内の変換係数をゼロにセットし、
仮に、構文要素が、現在訪問されたサブブロックは重要な変換係数を有することを示すならば、データストリームから、現在訪問されたサブブロック内の変換係数のレベルを示す構文要素を復号することを含む、
ように構成されている。
W1)スケーラブルビデオデコーダは、
符号化データストリーム(6)からベース層信号(200)を再構成(80)し、
エンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
以下の構成によって、エンハンスメント層信号のブロックを空間的に予測し、
層間予測信号(380)を得るために、再構成されたベース層信号(200a,200b,200c)に、解像度または品質の改良を受け(220)させ、
層間予測信号(380)の第1のラインを登録(260)し、エンハンスメント層信号の既に再構成された部分の第2のラインでブロックを局所的に重ね、第1のラインと第2のラインが両方ともライン方向に平行であるブロックを隣接させ、それによってシフト値を得て、
第1のラインの内容で、第1のラインに併置されたブロックのラインを充填(260)し、シフト値によってシフトすることを含む、ように構成されている。
例えば、ライン方向は水平または垂直である。その結果、予測は、それぞれ、列ごとに、または、行ごとになされる。
X1)スケーラブルビデオデコーダは、
ブロック的予測と、空間イントラ予測モードと時間インター予測モードとの間のブロック的選択と、空間イントラ予測モードが選択されたベース層信号のブロックのためのイントラ予測パラメータを使用することによって、符号化データストリーム(6)からベース層信号(200)を再構成(80)し、
ブロック的予測と、空間イントラ予測モードと時間インター予測モードとの間のブロック的選択と、空間イントラ予測モードが選択されたエンハンスメント層信号のブロックのためのイントラ予測パラメータを使用することによって、符号化データストリーム(6)からエンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
エンハンスメント層信号の現在のブロックに隣接する、エンハンスメント層信号の隣接するブロックが、空間イントラ予測モードを使用して予測されたか否かのために、エンハンスメント層信号の隣接するブロックをチェックし、
仮に、そうであるならば、現在のブロックのためのおそらく有利なイントラ予測パラメータを、隣接するブロックのイントラ予測パラメータと選定し、
仮に、そうでなければ、現在のブロックのためのおそらく有利なイントラ予測パラメータを、現在のブロックに併置されたベース層信号のブロックのイントラ予測パラメータと選定し、
現在のブロックのための符号化データストリーム内に存在する構文要素に基づいた現在のブロックのためのイントラ予測パラメータと、おそらく有利なイントラ予測パラメータとを決定することを含む、ように構成されている。
Y1)スケーラブルビデオデコーダは、
ブロック的予測と、空間イントラ予測モードと時間インター予測モードとの間のブロック的選択と、空間イントラ予測モードが選択されたベース層信号のブロックのサブセットのための角度イントラ予測パラメータを使用することによって、符号化データストリーム(6)からベース層信号(200)を再構成(80)し、
ブロック的予測と、空間イントラ予測モードと時間インター予測モードとの間のブロック的選択と、空間イントラ予測モードが選択されたベース層信号のブロックのサブセットのための角度イントラ予測パラメータを使用することによって、符号化データストリーム(6)からエンハンスメント層信号(360)を再構成(60)し、
再構成(60)は、
エンハンスメント層信号の現在のブロックに隣接する、エンハンスメント層信号の隣接するブロックが、角度イントラ予測パラメータを有する空間イントラ予測モードを使用して予測されたか否かのために、エンハンスメント層信号の隣接するブロックをチェックし、
仮に、そうであるならば、現在のブロックのためのおそらく有利なイントラ予測パラメータを、隣接するブロックの角度イントラ予測パラメータと指摘し、
仮に、そうではないけれども、現在のブロックに併置されたベース層信号のブロックが、角度イントラ予測パラメータで符号化されるならば、現在のブロックのためのおそらく有利なイントラ予測パラメータを、現在のブロックに併置されたベース層信号のブロックの角度イントラ予測パラメータと指摘し、
現在のブロックのための符号化データストリーム内に存在する構文要素に基づいた現在のブロックためのイントラ予測パラメータと、おそらく有利なイントラ予測パラメータと決定することを含む、ように構成されている。
いくつかの実施例が装置の文脈内で説明されているけれども、これらの実施例が、対応する方法の記述を表わすことも明確である。そこでは、ブロックまたはデバイスが、方法ステップまたは方法ステップの特徴に対応する。また、類似して、方法ステップの文脈内で記載された実施例は、対応する装置の対応するブロックまたは項目または特徴の記述を表わす。方法ステップのいくつかまたは全てが、ハードウェア装置、例えば、マイクロプロセッサのようなプログラム可能なコンピュータまたは電子回路によって(または、使用して)実行される。いくつかの実施の形態内で、最も重要な方法ステップの1つ以上が、そのような装置によって実行される。
所定の実現の要求に依存して、本発明の実施の形態が、ハードウェアまたはソフトウェア内で実現することができる。実現が、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協働する(または、協働できる)、保存された電子的に読み込み可能な制御信号を有するデジタル保存媒体、例えば、フロッピー(登録商標)ディスク、DVD、ブルーレイ(登録商標)、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを使用して実行される。従って、デジタル保存媒体は、コンピュータ読み込み可能である。
本発明に従ったいくつかの実施の形態が、ここに記載された方法の1つが実行されるように、プログラム可能なコンピュータシステムと協働できる電子的に読み込み可能な制御信号を有するデータキャリアを含む。
一般に、本発明の実施の形態が、プログラムコードを有するコンピュータプログラム製品として実行される。コンピュータプログラム製品がコンピュータで稼働するとき、プログラムコードが、方法の1つを実行するために操作される。例えば、プログラムコードは、機械読み込み可能なキャリアに格納され得る。
別の実施の形態は、機械読み込み可能なキャリアに保存された、ここに記載された方法の1つを実行するためのコンピュータプログラムを含む。
換言すれば、発明の方法の実施の形態は、コンピュータプログラムがコンピュータで稼働するとき、コンピュータプログラムは、方法の1つを実行するためのプログラムコードを有する。
従って、発明の方法の更なる実施の形態は、データキャリア(または、デジタル保存媒体、または、コンピュータ読み込み可能な媒体)は、その上に記録された、ここに記載された方法の1つを実行するためのコンピュータプログラムを含む。データキャリア、デジタル保存媒体または記録媒体は、通常、有形および/または非一時的なものである。
従って、発明の方法の更なる実施の形態は、ここに記載された方法の1つを実行するためのコンピュータプログラムを表わすデータストリームまたは信号の系列である。例えば、データストリームまたは信号の系列が、データ通信接続経由で(例えば、インターネット経由で)転送されるように構成される。
更なる実施の形態は、プロセス手段(例えば、コンピュータまたはプログラム可能な論理回路)が、ここに記載された方法の1つが実行されるように構成される、または、適合される。
更なる実施の形態は、ここに記載された方法の1つが実行するためのコンピュータプログラムをインストールしたコンピュータを含む。
本発明に係る更なる実施の形態は、ここに記載された方法の1つを実行するためのコンピュータプログラムを、レシーバに(例えば、電子的または光学的に)転送するように構成された装置またはシステムを含む。例えば、レシーバは、コンピュータ、モバイル機器、メモリ素子または同様のものである。例えば、装置またはシステムは、コンピュータプログラムをレシーバに転送するためにファイルサーバーを含む。
いくつかの実施の形態において、プログラム可能な論理回路(例えば、フィールドプログラマブルゲートアレイ)は、ここに記載された方法の機能のいくつかまたは全てを実行するために使用される。いくつかの実施の形態において、フィールドプログラマブルゲートアレイは、ここに記載された方法の1つを実行するためにマイクロプロセッサと協働する。一般に、好ましくは、方法はどんなハードウェア装置によっても実行される。
上述の実施の形態は、本発明の原理のためにのみ例示するだけである。配置および本明細書において記載される詳細の修正および変更は、他の当業者にとって明らかであるものと理解される。従って、差し迫った本発明の特許請求の範囲の概要のみに制限され、本実施の形態の記述および説明の目的により特定の詳細な表現によっては制限されないことを意図している。

Claims (15)

  1. ベース層信号(200)にわたって空間的に変化するベース層符号化パラメータを使用して前記ベース層信号を予測的に再構成し、
    エンハンスメント層信号(400)をブロック単位で再構成する
    ように構成されるスケーラブルビデオデコーダであって、
    前記エンハンスメント層信号の前記再構成は、
    前記ブロックの予め決められたブロック(28)について、前記ベース層信号の併置された部分(134)上に移送されたときに、ベース層符号化パラメータがそれぞれの領域において互いに十分類似するように、前記ベース層信号を前記領域にサブ分割する可能なサブブロックサブ分割のセットの中で、選択されたサブブロックサブ分割が最も粗くなるように、前記可能なサブブロックサブ分割のセットの中からサブブロックサブ分割を選択すること、および
    選択された前記サブブロックのサブ分割を使用して、前記予め決められたブロック(28)を予測的に再構成すること
    を含むように構成されていることを特徴とする、スケーラブルビデオデコーダ。
  2. 前記ベース層符号化パラメータは、ベース層ブロック(304)単位で前記ベース層信号にわたって変化する予測モードを含むことを特徴とする、請求項1に記載のスケーラブルビデオデコーダ。
  3. 前記ベース層符号化パラメータは、前記ベース層ブロック(304)もしくはそのサブブロック(306)であるベース層予測ブロックのユニットの単位で前記ベース層信号にわたって変化する予測モード個別予測パラメータを更に含むことを特徴とする、請求項2に記載のスケーラブルビデオデコーダ。
  4. 互いに十分に類似するために、少なくとも、それぞれの前記領域をオーバーラップするベース層ブロックの前記予測モードは互いに等しくなければならないように構成されることを特徴とする、請求項3に記載のスケーラブルビデオデコーダ。
  5. 互いに十分に類似するために、それぞれの前記領域をオーバーラップするいずれのベース層ブロックもしくはベース層ブロックのサブブロックの前記予測モード個別予測パラメータは、互いに等しくなければならないように構成されることを特徴とする、請求項3または請求項4に記載のスケーラブルビデオデコーダ。
  6. 選択された前記サブ分割を前記ベース層信号の前記併置された部分上に移送することによって前記ベース層信号がサブ分割される、前記ベース層信号の各領域について、それぞれの前記領域をオーバーラップする前記ベース層信号の予測ブロックの前記ベース層符号化パラメータが、互いに等しい、もしくは予め決められた類似性大きさ基準を満たすか否かをチェックするように構成されることを特徴とする、請求項3〜請求項5のいずれかに記載のスケーラブルビデオデコーダ。
  7. 前記可能なサブブロックサブ分割のセットのそれぞれについて、前記ベース層信号の併置された部分(134)上に移送されたときに、前記ベース層符号化パラメータがそれぞれの領域の中で互いに十分類似するように前記ベース層信号を前記領域にサブ分割するか否かをチェックし、
    前記サブブロックサブ分割の中で最も粗いものを選択する、あるいは
    粗さの昇順または降順で順序付けされた前記可能なサブブロックサブ分割のセットを横断するとともに、現在横断されているサブブロックサブ分割のそれぞれについて、前記ベース層信号の併置された部分(134)上に移送されたときに、前記ベース層符号化パラメータが各領域内で互いに十分類似するように、前記ベース層信号を領域にサブ分割するか否かをチェックし、
    前記チェックの結果、前記現在横断されているサブブロックサブ分割と直前に横断されたサブブロックサブ分割との結果が異なる場合、前記横断を停止し、前記現在横断されているサブブロックサブ分割と直前に横断されたサブブロックサブ分割の中で、前記ベース層信号の併置された部分(134)上に移送されたときに、前記ベース層符号化パラメータがそれぞれの領域において互いに十分類似するように、前記ベース層信号を領域にサブ分割するものを選択する
    ように構成されることを特徴とする、請求項1〜請求項5のいずれかに記載のスケーラブルビデオデコーダ。
  8. 前記選択されたサブブロックサブ分割を使用して前記予め決められたブロック(28)を予測的に再構成する際に、前記選択されたサブブロックサブ分割を使用して前記予め決められたブロック(28)をエンハンスメント層予測ブロックにサブ分割し、エンハンスメント層予測ブロックのそれぞれについて、それぞれの前記エンハンスメント層予測ブロックに併置された前記ベース層符号化パラメータに基づいてエンハンスメント層符号化パラメータを予測するように構成されることを特徴とする、請求項1〜請求項7のいずれかに記載のスケーラブルビデオデコーダ。
  9. 前記エンハンスメント層信号を前記ブロック単位で再構成するとともに、エンハンスメント層データストリームにおける信号伝達に応答して、前記予め決められたブロックが割り当てられた層間予測モードと、前記ベース層符号化パラメータによってシグナリングされる前記予測モードと一致する層内予測モードとを含むエンハンスメント層予測モードのセットの中の予測モードを前記ブロック単位で変化させるように構成されることを特徴とする、請求項1〜請求項8のいずれかに記載のスケーラブルビデオデコーダ。
  10. いずれかの前記層間予測モードが割り当てられた前記エンハンスメント層信号の前記ブロックを予測ブロックにサブ分割するとともに、前記それぞれの予測ブロックに、予測モード個別予測パラメータを前記予測ブロックの単位で変化させながらサブ分割された前記ブロックに割り当てられた前記層内予測モードを割り当てるように構成されることを特徴とする、請求項9に記載のスケーラブルビデオデコーダ。
  11. イントラブロックについては空間イントラ予測を使用しインターブロックについては時間インター予測を使用してベース信号のフレームを前記イントラブロックと前記インターブロックにサブ分割し、前記イントラブロックおよび前記インターブロックがサブ分割されているブロック単位で、前記空間イントラ予測と前記時間インター予測とにそれぞれ関連付けられた予測パラメータを設定することによって、前記ベース層信号を予測的に再構成(100,180,160)し、
    エンハンスメント層信号(360)を予測的に再構成(320,340,260)する、
    ように構成されるスケーラブルビデオデコーダであって、
    前記エンハンスメント信号の予測的な再構成(320,340,260)は、
    前記エンハンスメント層信号のフレームが、空間イントラ予測モード、時間インター予測モードおよび層間予測モードを含む予測モードのセットのそれぞれにサブ分割される符号化ユニットを、符号化ストリーム内の予測モード構文によって制御して割り当てることと、
    それぞれの前記符号化ユニットが割り当てられたそれぞれの前記予測モードを使用して、各符号化ユニットを予測的に再構成するとともに、
    前記空間イントラ予測モードおよび前記時間インター予測モードのいずれかが割り当てられた符号化ユニットについては、
    前記符号化ユニットを予測ブロックにさらにサブ分割して、それぞれの前記符号化ユニットが割り当てられたそれぞれの前記予測モードに関連付けられた予測パラメータを前記予測ブロック単位で設定し、
    それぞれの前記符号化ユニットに前記空間イントラ予測が割り当てられた場合には、予測パラメータのセットを使用して、全ての予測ブロックに前記空間イントラ予測を受けさせ、また、それぞれの前記符号化ユニットに前記時間インター予測が割り当てられた場合には、前記予測パラメータのセットを使用して、全ての予測ブロックに前記時間インター予測を受けさせることと、
    前記層間予測モードが割り当てられたそれぞれの前記符号化ユニットについては、
    イントラブロックおよびインターブロックの両方に局所的に重なる符号化ユニットが、非時間予測モードに関連付けられかつイントラブロックに局所的に一致する少なくとも1つの予測ブロックと、前記時間インター予測モードに関連付けられかつ前記インターブロックに局所的に一致する少なくとも1つの予測ブロックとにサブ分割されるように、前記ベース層信号の前記イントラブロックと前記インターブロックのサブ分割を、それぞれの前記符号化ユニットに局所的に移送し、
    前記非時間予測モードが割り当てられたそれぞれの符号化ユニットの全ての予測ブロックに、
    前記局所的に一致するイントラブロックの前記予測パラメータから導出される予測パラメータを使用して、空間内部予測を受けさせる、あるいは、
    前記ベース層信号に解像度または品質の改良を受け(220)させて解像度/品質改良層間予測信号(380)を得て、
    前記解像度/品質改良層間予測信号(380)を使用して、前記非時間予測モードが割り当てられたそれぞれの前記符号化ユニットの前記予測ブロックを予測(260)することによって、
    層間予測を受けさせ、
    そして、前記時間インター予測モードが割り当てられたそれぞれの前記符号化ユニットの全ての予測ブロックに、前記局所的に一致するインターブロックの前記予測パラメータから導出された前記予測パラメータを使用して、時間インター予測を受けさせること
    を含むように構成されることを特徴とする、スケーラブルビデオデコーダ。
  12. ベース層信号にわたって空間的に変化するベース層符号化パラメータを使用して、前記ベース層信号を予測的に再構成するステップと、
    エンハンスメント層信号をブロック単位で再構成するステップと、
    を含むスケーラブルビデオ復号化方法であって、
    前記再構成するステップは、
    ブロックの予め決められたブロックについて、ベース層信号の併置された部分上に移送されたときに、ベース層符号化パラメータがそれぞれの領域において互いに十分類似するように前記ベース層信号を領域にサブ分割する可能なサブブロックサブ分割のセットの中で、選択されたサブブロックサブ分割が最も粗くなるように、前記可能なサブブロックのサブ分割のセットの中からサブブロックサブ分割を選択するステップと、
    選択された前記サブブロックサブ分割を使用して、前記予め決められたブロックを予測的に再構成するステップと、
    を含むことを特徴とする、スケーラブルビデオ復号化方法。
  13. ベース層信号にわたって空間的に変化するベース層符号化パラメータを使用して、前記ベース層信号を予測的に符号化し、
    エンハンスメント層信号をブロック単位で符号化する
    ように構成されるスケーラブルビデオエンコーダであって、
    前記エンハンスメント層信号の前記符号化は、
    前記ブロックのうちの予め決められたブロックについて、前記ベース層信号の併置された部分上に移送されたときに、ベース層符号化パラメータがそれぞれの領域において互いに十分類似するように前記ベース層信号を前記領域にサブ分割する可能なサブブロックサブ分割のセットの中で、選択されたサブブロックサブ分割が最も粗くなるように、前記可能なサブブロックサブ分割のセットの中からサブブロックサブ分割を選択すること、および
    選択された前記サブブロックサブ分割を使用して、前記予め決められたブロックを予測的に再構成すること
    を含むように構成されることを特徴とする、スケーラブルビデオエンコーダ。
  14. ベース層信号にわたって空間的に変化するベース層符号化パラメータを使用して、前記ベース層信号を予測的に符号化するステップと、
    エンハンスメント層信号をブロック単位で符号化するステップと、
    を含むスケーラブルビデオ符号化方法であって、
    前記符号化するステップは、
    前記ブロックのうちの予め決められたブロックについて、前記ベース層信号の併置された部分上に移送されたときに、ベース層符号化パラメータがそれぞれの領域において互いに十分類似するように、前記ベース層信号を前記領域にサブ分割する可能なサブブロックサブ分割のセットの中で、選択されたサブブロックサブ分割が最も粗くなるように、前記可能なサブブロックサブ分割のセットの中からサブブロックサブ分割を選択するステップと、
    選択された前記サブブロックサブ分割を使用して、前記予め決められたブロックを予測的に再構成するステップと、
    を含むことを特徴とする、スケーラブルビデオ符号化方法。
  15. プログラムコードがコンピュータ上で実行されると、前記コンピュータが請求項12に記載のスケーラブルビデオ復号化方法または請求項14に記載のスケーラブルビデオ符号化方法を実行する、前記プログラムコードを有するコンピュータプログラム。
JP2021113786A 2012-10-01 2021-07-08 ベース層からの予測のためのサブブロックのサブ分割の導出を使用するスケーラブルビデオ符号化 Active JP7323578B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023122307A JP2023159098A (ja) 2012-10-01 2023-07-27 ベース層からの予測のためのサブブロックのサブ分割の導出を使用するスケーラブルビデオ符号化

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261708201P 2012-10-01 2012-10-01
US61/708,201 2012-10-01
JP2018193886A JP6912438B2 (ja) 2012-10-01 2018-10-12 ベース層からの予測のための副ブロックの副分割の派生を使用するスケーラブルビデオ符号化

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018193886A Division JP6912438B2 (ja) 2012-10-01 2018-10-12 ベース層からの予測のための副ブロックの副分割の派生を使用するスケーラブルビデオ符号化

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023122307A Division JP2023159098A (ja) 2012-10-01 2023-07-27 ベース層からの予測のためのサブブロックのサブ分割の導出を使用するスケーラブルビデオ符号化

Publications (2)

Publication Number Publication Date
JP2021182742A true JP2021182742A (ja) 2021-11-25
JP7323578B2 JP7323578B2 (ja) 2023-08-08

Family

ID=49274661

Family Applications (18)

Application Number Title Priority Date Filing Date
JP2015535000A Active JP6301933B2 (ja) 2012-10-01 2013-10-01 空間内部予測パラメータの中間層予測を使用するスケーラブルビデオ符号化
JP2015534997A Active JP6763664B2 (ja) 2012-10-01 2013-10-01 エンハンスメント層作動パラメータのためのベース層ヒントを使用するスケーラブルビデオ符号化
JP2015534996A Active JP6636802B2 (ja) 2012-10-01 2013-10-01 エンハンスメント層予測に中間層の予測寄与を使用するスケーラブルビデオ符号化
JP2015534999A Active JP6301932B2 (ja) 2012-10-01 2013-10-01 エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化
JP2015534998A Active JP6788346B2 (ja) 2012-10-01 2013-10-01 ベース層からの予測のための副ブロックの副分割の派生を使用するスケーラブルビデオ符号化
JP2017198961A Active JP6760911B2 (ja) 2012-10-01 2017-10-13 エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化
JP2017240170A Active JP6693940B2 (ja) 2012-10-01 2017-12-15 空間内部予測パラメータの中間層予測を使用するスケーラブルビデオ符号化
JP2018122462A Active JP7030025B2 (ja) 2012-10-01 2018-06-27 エンハンスメント層予測に中間層の予測寄与を使用するスケーラブルビデオ符号化
JP2018193252A Active JP6912437B2 (ja) 2012-10-01 2018-10-12 エンハンスメント層作動パラメータのためのベース層ヒントを使用するスケーラブルビデオ符号化
JP2018193886A Active JP6912438B2 (ja) 2012-10-01 2018-10-12 ベース層からの予測のための副ブロックの副分割の派生を使用するスケーラブルビデオ符号化
JP2020148098A Pending JP2020205618A (ja) 2012-10-01 2020-09-03 エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化
JP2021113490A Active JP7323577B2 (ja) 2012-10-01 2021-07-08 エンハンスメント層動きパラメータのためのベース層ヒントを使用するスケーラブルビデオ符号化
JP2021113786A Active JP7323578B2 (ja) 2012-10-01 2021-07-08 ベース層からの予測のためのサブブロックのサブ分割の導出を使用するスケーラブルビデオ符号化
JP2021125888A Active JP7284221B2 (ja) 2012-10-01 2021-07-30 エンハンスメント層予測に層間予測寄与を使用するスケーラブルビデオ符号化
JP2023081951A Pending JP2023116468A (ja) 2012-10-01 2023-05-18 エンハンスメント層予測に層間予測寄与を使用するスケーラブルビデオ符号化
JP2023122201A Pending JP2023159095A (ja) 2012-10-01 2023-07-27 エンハンスメント層動きパラメータのためのベース層ヒントを使用するスケーラブルビデオ符号化
JP2023122307A Pending JP2023159098A (ja) 2012-10-01 2023-07-27 ベース層からの予測のためのサブブロックのサブ分割の導出を使用するスケーラブルビデオ符号化
JP2023146612A Pending JP2023164991A (ja) 2012-10-01 2023-09-11 エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化

Family Applications Before (12)

Application Number Title Priority Date Filing Date
JP2015535000A Active JP6301933B2 (ja) 2012-10-01 2013-10-01 空間内部予測パラメータの中間層予測を使用するスケーラブルビデオ符号化
JP2015534997A Active JP6763664B2 (ja) 2012-10-01 2013-10-01 エンハンスメント層作動パラメータのためのベース層ヒントを使用するスケーラブルビデオ符号化
JP2015534996A Active JP6636802B2 (ja) 2012-10-01 2013-10-01 エンハンスメント層予測に中間層の予測寄与を使用するスケーラブルビデオ符号化
JP2015534999A Active JP6301932B2 (ja) 2012-10-01 2013-10-01 エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化
JP2015534998A Active JP6788346B2 (ja) 2012-10-01 2013-10-01 ベース層からの予測のための副ブロックの副分割の派生を使用するスケーラブルビデオ符号化
JP2017198961A Active JP6760911B2 (ja) 2012-10-01 2017-10-13 エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化
JP2017240170A Active JP6693940B2 (ja) 2012-10-01 2017-12-15 空間内部予測パラメータの中間層予測を使用するスケーラブルビデオ符号化
JP2018122462A Active JP7030025B2 (ja) 2012-10-01 2018-06-27 エンハンスメント層予測に中間層の予測寄与を使用するスケーラブルビデオ符号化
JP2018193252A Active JP6912437B2 (ja) 2012-10-01 2018-10-12 エンハンスメント層作動パラメータのためのベース層ヒントを使用するスケーラブルビデオ符号化
JP2018193886A Active JP6912438B2 (ja) 2012-10-01 2018-10-12 ベース層からの予測のための副ブロックの副分割の派生を使用するスケーラブルビデオ符号化
JP2020148098A Pending JP2020205618A (ja) 2012-10-01 2020-09-03 エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化
JP2021113490A Active JP7323577B2 (ja) 2012-10-01 2021-07-08 エンハンスメント層動きパラメータのためのベース層ヒントを使用するスケーラブルビデオ符号化

Family Applications After (5)

Application Number Title Priority Date Filing Date
JP2021125888A Active JP7284221B2 (ja) 2012-10-01 2021-07-30 エンハンスメント層予測に層間予測寄与を使用するスケーラブルビデオ符号化
JP2023081951A Pending JP2023116468A (ja) 2012-10-01 2023-05-18 エンハンスメント層予測に層間予測寄与を使用するスケーラブルビデオ符号化
JP2023122201A Pending JP2023159095A (ja) 2012-10-01 2023-07-27 エンハンスメント層動きパラメータのためのベース層ヒントを使用するスケーラブルビデオ符号化
JP2023122307A Pending JP2023159098A (ja) 2012-10-01 2023-07-27 ベース層からの予測のためのサブブロックのサブ分割の導出を使用するスケーラブルビデオ符号化
JP2023146612A Pending JP2023164991A (ja) 2012-10-01 2023-09-11 エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化

Country Status (6)

Country Link
US (17) US10212419B2 (ja)
EP (11) EP2904786B1 (ja)
JP (18) JP6301933B2 (ja)
KR (25) KR102095504B1 (ja)
CN (8) CN105052134B (ja)
WO (5) WO2014053512A1 (ja)

Families Citing this family (128)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101269116B1 (ko) * 2010-12-14 2013-05-29 엠앤케이홀딩스 주식회사 인터 예측 부호화된 동영상 복호화 방법
SI2658263T1 (sl) * 2010-12-22 2023-03-31 Lg Electronics Inc. Postopek notranjega napovedovanja in naprava, ki uporablja ta postopek
JP5950541B2 (ja) * 2011-11-07 2016-07-13 キヤノン株式会社 動きベクトル符号化装置、動きベクトル符号化方法及びプログラム、動きベクトル復号装置、動きベクトル復号方法及びプログラム
TWI580264B (zh) * 2011-11-10 2017-04-21 Sony Corp Image processing apparatus and method
CN104429071B (zh) * 2012-07-09 2019-01-18 Vid拓展公司 用于多层视频编码的编解码器架构
KR102028244B1 (ko) 2012-09-28 2019-10-02 브이아이디 스케일, 인크. 비디오 코딩에서 크로마 신호 향상을 위한 교차-평면 필터링
JPWO2014050948A1 (ja) * 2012-09-28 2016-08-22 シャープ株式会社 画像復号装置、画像復号方法及び画像符号化装置
US9826229B2 (en) * 2012-09-29 2017-11-21 Google Technology Holdings LLC Scan pattern determination from base layer pixel information for scalable extension
CN105052134B (zh) 2012-10-01 2019-09-03 Ge视频压缩有限责任公司 一种可伸缩视频编解码方法及计算机可读存储介质
CN108111846B (zh) * 2012-11-15 2021-11-19 联发科技股份有限公司 用于可伸缩视频编码的帧间层预测方法及装置
US20140185671A1 (en) * 2012-12-27 2014-07-03 Electronics And Telecommunications Research Institute Video encoding and decoding method and apparatus using the same
US9596465B2 (en) 2013-01-04 2017-03-14 Intel Corporation Refining filter for inter layer prediction of scalable video coding
US20140198846A1 (en) * 2013-01-16 2014-07-17 Qualcomm Incorporated Device and method for scalable coding of video information
KR20140121315A (ko) * 2013-04-04 2014-10-15 한국전자통신연구원 참조 픽처 리스트를 이용한 다 계층 기반의 영상 부호화/복호화 방법 및 그 장치
JP6514197B2 (ja) 2013-07-15 2019-05-15 ジーイー ビデオ コンプレッション エルエルシー ネットワーク装置およびエラー処理の方法
FR3008840A1 (fr) * 2013-07-17 2015-01-23 Thomson Licensing Procede et dispositif de decodage d'un train scalable representatif d'une sequence d'images et procede et dispositif de codage correspondants
US10148971B2 (en) 2013-09-24 2018-12-04 Vid Scale, Inc. Inter-layer prediction for scalable video coding
US9712834B2 (en) * 2013-10-01 2017-07-18 Dolby Laboratories Licensing Corporation Hardware efficient sparse FIR filtering in video codec
EP2938084A4 (en) * 2013-12-27 2016-10-26 Sony Corp IMAGE PROCESSING DEVICE AND IMAGE PROCESSING METHOD
EP3128754B1 (en) * 2014-03-31 2020-11-11 Samsung Electronics Co., Ltd. Interlayer video decoding method for performing sub-block-based prediction and apparatus therefor, and interlayer video encoding method for performing sub-block-based prediction and apparatus therefor
WO2015168581A1 (en) * 2014-05-01 2015-11-05 Arris Enterprises, Inc. Reference layer and scaled reference layer offsets for scalable video coding
US10015525B2 (en) 2014-10-27 2018-07-03 Dolby Laboratories Licensing Corporation Content mapping using extended color range
KR20170078682A (ko) * 2014-11-04 2017-07-07 삼성전자주식회사 에지 타입의 오프셋을 적용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
EP3026913A1 (en) * 2014-11-27 2016-06-01 Thomson Licensing Scalable encoding and decoding methods and corresponding devices with combined intraprediction and interlayer prediction
FR3029333A1 (fr) * 2014-11-27 2016-06-03 Orange Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
BR112017013624B1 (pt) 2015-02-17 2019-10-29 Dolby Laboratories Licensing Corp predição intercamada para sinais com uma faixa dinâmica aprimorada
EP3292687A4 (en) * 2015-05-06 2019-07-03 NGCodec Inc. INTRA PREDICTION PROCESSOR WITH PARTITIONING OF REDUCED COST BLOCKS AND PERFECTED SELECTION OF INTRA MODES
KR20230128138A (ko) * 2015-07-08 2023-09-01 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 교차 평면 필터링을 이용한 향상된 크로마 코딩
WO2017030062A1 (ja) * 2015-08-19 2017-02-23 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
EP3343926A4 (en) 2015-08-28 2019-01-30 KT Corporation METHOD AND DEVICE FOR PROCESSING A VIDEO SIGNAL
US10080038B2 (en) * 2015-09-01 2018-09-18 Telefonaktiebolaget Lm Ericsson (Publ) Spatial improvement of transform blocks
US20180249156A1 (en) * 2015-09-10 2018-08-30 Lg Electronics Inc. Method for processing image based on joint inter-intra prediction mode and apparatus therefor
KR20170031643A (ko) 2015-09-11 2017-03-21 주식회사 케이티 비디오 신호 처리 방법 및 장치
CN106612433B (zh) * 2015-10-22 2019-11-26 中国科学院上海高等研究院 一种层析式编码译码方法
US20170150176A1 (en) * 2015-11-25 2017-05-25 Qualcomm Incorporated Linear-model prediction with non-square prediction units in video coding
WO2017121549A1 (en) * 2016-01-12 2017-07-20 Telefonaktiebolaget Lm Ericsson (Publ) Frequency based prediction
US10778987B2 (en) * 2016-03-24 2020-09-15 Intellectual Discovery Co., Ltd. Method and apparatus for encoding/decoding video signal
ES2853700T3 (es) 2016-04-15 2021-09-17 Magic Pony Tech Limited Compensación de movimiento utilizando interpolación de imagen temporal
EP3298786A1 (en) * 2016-04-15 2018-03-28 Magic Pony Technology Limited In-loop post filtering for video encoding and decoding
CN116962721A (zh) 2016-05-04 2023-10-27 微软技术许可有限责任公司 利用样本值的非相邻参考线进行帧内图片预测的方法
CN114222137A (zh) * 2016-05-28 2022-03-22 世宗大学校产学协力团 构成预测运动矢量列表的方法
US20170374369A1 (en) * 2016-06-24 2017-12-28 Mediatek Inc. Methods and Apparatuses of Decoder Side Intra Mode Derivation
US10440366B2 (en) 2016-07-01 2019-10-08 Intel Corporation Method and system of video coding using content based metadata
US10666946B2 (en) 2016-07-01 2020-05-26 Intel Corporation Method and system of video coding using display modification input
CN116708785A (zh) * 2016-07-12 2023-09-05 韩国电子通信研究院 图像编码/解码方法以及用于该方法的记录介质
US11095892B2 (en) * 2016-09-20 2021-08-17 Kt Corporation Method and apparatus for processing video signal
EP3301925A1 (en) * 2016-09-30 2018-04-04 Thomson Licensing Method for local inter-layer prediction intra based
CN117176966A (zh) * 2016-10-04 2023-12-05 有限公司B1影像技术研究所 图像编码/解码方法和传输比特流的方法
WO2018097669A1 (ko) * 2016-11-24 2018-05-31 한국전자통신연구원 스케일러블 비디오를 처리하기 위한 방법 및 장치
US10869049B2 (en) 2016-11-29 2020-12-15 Research & Business Foundation Sungyunwan University Image encoding/decoding method and device, and recording medium in which bitstream is stored
US10694202B2 (en) * 2016-12-01 2020-06-23 Qualcomm Incorporated Indication of bilateral filter usage in video coding
CN110115034B (zh) * 2016-12-23 2023-01-13 华为技术有限公司 一种用于扩展预定定向帧内预测模式集合的帧内预测装置
CN110692250B (zh) * 2017-01-05 2022-07-01 弗劳恩霍夫应用研究促进协会 图像的基于块的预测编码和解码的装置
US10715827B2 (en) * 2017-01-06 2020-07-14 Mediatek Inc. Multi-hypotheses merge mode
WO2018131986A1 (ko) * 2017-01-16 2018-07-19 세종대학교 산학협력단 영상의 부호화/복호화 방법 및 장치
WO2018190595A1 (ko) * 2017-04-13 2018-10-18 엘지전자(주) 비디오 신호를 엔트로피 인코딩, 디코딩하는 방법 및 장치
CN117014629A (zh) * 2017-04-27 2023-11-07 松下电器(美国)知识产权公司 解码方法、编码方法以及发送方法
CN110574375B (zh) 2017-04-28 2023-06-02 苹果公司 视频流水线
US10979685B1 (en) 2017-04-28 2021-04-13 Apple Inc. Focusing for virtual and augmented reality systems
CN107172386B (zh) * 2017-05-09 2018-06-29 西安科技大学 一种基于计算机视觉的非接触式数据传输方法
US10531085B2 (en) * 2017-05-09 2020-01-07 Futurewei Technologies, Inc. Coding chroma samples in video compression
TWI678917B (zh) * 2017-06-07 2019-12-01 聯發科技股份有限公司 用於視訊編解碼的畫面內-畫面間預測的方法及裝置
US11252464B2 (en) 2017-06-14 2022-02-15 Mellanox Technologies, Ltd. Regrouping of video data in host memory
US20200014918A1 (en) * 2018-07-08 2020-01-09 Mellanox Technologies, Ltd. Application accelerator
US20200014945A1 (en) * 2018-07-08 2020-01-09 Mellanox Technologies, Ltd. Application acceleration
US10861142B2 (en) * 2017-07-21 2020-12-08 Apple Inc. Gaze direction-based adaptive pre-filtering of video data
CN107580224B (zh) * 2017-08-08 2019-11-22 西安理工大学 一种面向hevc熵编码的自适应扫描方法
EP3451665A1 (en) 2017-09-01 2019-03-06 Thomson Licensing Refinement of internal sub-blocks of a coding unit
EP3457695A1 (en) * 2017-09-18 2019-03-20 Thomson Licensing Method and apparatus for motion vector predictor adaptation for omnidirectional video
US10986360B2 (en) * 2017-10-16 2021-04-20 Qualcomm Incorproated Various improvements to FRUC template matching
FR3072850B1 (fr) 2017-10-19 2021-06-04 Tdf Procedes de codage et de decodage d'un flux de donnees representatif d'une video omnidirectionnelle
WO2019111012A1 (en) * 2017-12-06 2019-06-13 V-Nova International Ltd Method and apparatus for decoding a received set of encoded data
US10445762B1 (en) 2018-01-17 2019-10-15 Yaoshiang Ho Online video system, method, and medium for A/B testing of video content
WO2019154936A1 (en) * 2018-02-09 2019-08-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Partition-based intra coding concept
US10771781B2 (en) * 2018-03-12 2020-09-08 Electronics And Telecommunications Research Institute Method and apparatus for deriving intra prediction mode
KR20200138804A (ko) * 2018-03-29 2020-12-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 변환 세트
CN112088532A (zh) * 2018-05-07 2020-12-15 交互数字Vc控股公司 编码/解码中的数据依赖性
WO2019234600A1 (en) 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Interaction between pairwise average merging candidates and intra-block copy (ibc)
CN110636298B (zh) 2018-06-21 2022-09-13 北京字节跳动网络技术有限公司 对于Merge仿射模式和非Merge仿射模式的统一约束
GB2589223B (en) 2018-06-21 2023-01-25 Beijing Bytedance Network Tech Co Ltd Component-dependent sub-block dividing
SG11202013015PA (en) 2018-07-02 2021-01-28 Huawei Tech Co Ltd Apparatus and method for filtering in video coding
US10645380B2 (en) * 2018-07-09 2020-05-05 Tencent America LLC Method and apparatus for video coding
US10715812B2 (en) * 2018-07-13 2020-07-14 Tencent America LLC Method and apparatus for video coding
WO2020015706A1 (en) 2018-07-18 2020-01-23 Mediatek Inc. Method and apparatus of motion compensation bandwidth reduction for video coding system utilizing multi-hypothesis
JP6978633B2 (ja) 2018-07-26 2021-12-08 グーグル エルエルシーGoogle LLC 空間層レート割り当て
CN108982521A (zh) * 2018-08-04 2018-12-11 石修英 可视化土壤健康水平检测设备
KR20240013897A (ko) * 2018-08-29 2024-01-30 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 서브블록 기반 시간적 모션 벡터 예측을 사용한 비디오 코딩의 방법 및 장치
JP2022500916A (ja) * 2018-09-13 2022-01-04 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. アフィン線形加重イントラ予測
WO2020055288A2 (en) 2018-09-16 2020-03-19 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding with look-up table selected based on bitstream information
GB2577339A (en) * 2018-09-24 2020-03-25 Sony Corp Image data encoding and decoding
CN110944170B (zh) 2018-09-24 2023-05-02 北京字节跳动网络技术有限公司 扩展Merge预测
US11006150B2 (en) 2018-09-24 2021-05-11 Tencent America LLC Method and apparatus for video coding
US11184461B2 (en) 2018-10-23 2021-11-23 At&T Intellectual Property I, L.P. VR video transmission with layered video by re-using existing network infrastructures
CN109660794B (zh) * 2018-11-07 2020-07-07 北京达佳互联信息技术有限公司 帧内预测模式的决策方法、决策装置和计算机可读存储介质
WO2020094150A1 (en) 2018-11-10 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Rounding in current picture referencing
KR102127846B1 (ko) * 2018-11-28 2020-06-29 주식회사 카이 영상을 처리하는 방법, 영상을 재생하는 방법 및 그 장치들
MX2021007537A (es) 2018-12-21 2021-09-28 Huawei Tech Co Ltd Metodo y aparato de filtrado de interpolacion para la codificacion predictiva.
JP7288964B2 (ja) * 2018-12-28 2023-06-08 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 動きベクトル予測因子リストを生成すること
EP3888363B1 (en) 2018-12-28 2023-10-25 Huawei Technologies Co., Ltd. Method and apparatus of sharpening interpolation filtering for predictive coding
US11032560B2 (en) * 2019-01-17 2021-06-08 Tencent America LLC Method and apparatus for video coding without updating the HMVP table
CN109672690B (zh) * 2019-01-29 2021-02-19 哈尔滨工业大学 一种针对数据幅值范围已知的数据流进行编码的方法
CA3128424C (en) 2019-02-01 2024-04-16 Beijing Bytedance Network Technology Co., Ltd. Interactions between in-loop reshaping and inter coding tools
AU2020213583B2 (en) 2019-02-01 2023-06-01 Beijing Bytedance Network Technology Co., Ltd. Signaling of in-loop reshaping information using parameter sets
MX2021009355A (es) 2019-02-05 2021-09-14 Beijing Dajia Internet Information Tech Co Ltd Codificacion de video que utiliza el modo de codificacion de subparticion.
US11012701B2 (en) * 2019-02-22 2021-05-18 Tencent America LLC Residual coding for transform skip mode and block differential pulse-code modulation
US11323731B2 (en) * 2019-03-08 2022-05-03 Tencent America LLC Method and apparatus for video coding
CN113597759B (zh) * 2019-03-11 2022-09-13 北京字节跳动网络技术有限公司 视频编解码中的运动矢量细化
CN117499644A (zh) 2019-03-14 2024-02-02 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
WO2020192613A1 (en) * 2019-03-23 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Restrictions on in-loop reshaping parameter sets
EP3989547A4 (en) * 2019-06-21 2023-04-19 Samsung Electronics Co., Ltd. VIDEO ENCODING METHOD AND DEVICE, AND VIDEO DECODER METHOD AND DEVICE
US20220360787A1 (en) * 2019-06-21 2022-11-10 Telefonaktiebolaget Lm Ericsson (Publ) Video coding layer up-switching indication
JP7397172B2 (ja) 2019-08-20 2023-12-12 北京字節跳動網絡技術有限公司 位置に基づく係数のスケーリング
CN110662071B (zh) * 2019-09-27 2023-10-24 腾讯科技(深圳)有限公司 视频解码方法和装置、存储介质及电子装置
US11323732B2 (en) * 2020-04-13 2022-05-03 Tencent America LLC Method and apparatus for video coding
US20230209041A1 (en) * 2020-05-22 2023-06-29 Lg Electronics Inc. Multilayer-based image coding method in video or image coding system
US20210385485A1 (en) * 2020-06-06 2021-12-09 Alibaba Group Holding Limited Angular weighted prediction for inter prediction
US11330296B2 (en) * 2020-09-14 2022-05-10 Apple Inc. Systems and methods for encoding image data
US20220141459A1 (en) * 2020-11-05 2022-05-05 Alibaba Group Holding Limited Offset-based refinement of intra prediction (orip) of video coding
KR20220096624A (ko) * 2020-12-31 2022-07-07 엘지디스플레이 주식회사 표시 장치
US11595665B2 (en) 2021-02-11 2023-02-28 Qualcomm Incorporated Upsampling reference pixels for intra-prediction in video coding
US20220279185A1 (en) * 2021-02-26 2022-09-01 Lemon Inc. Methods of coding images/videos with alpha channels
US20220286666A1 (en) * 2021-02-26 2022-09-08 Lemon Inc. Methods of coding images/videos with alpha channels
CN113271467B (zh) * 2021-07-19 2021-10-22 成都索贝数码科技股份有限公司 一种支持高效编辑的超高清视频分层编解码方法
GB2603559B (en) 2021-07-22 2023-08-09 Imagination Tech Ltd Coding blocks of pixels
GB2609218B (en) * 2021-07-22 2023-08-30 Imagination Tech Ltd Coding blocks of pixels
WO2023164020A2 (en) * 2022-02-25 2023-08-31 Op Solutions, Llc Systems, methods and bitstream structure for video coding and decoding for machines with adaptive inference
US20230396799A1 (en) * 2022-06-06 2023-12-07 Tencent America LLC Signaling method for scaling parameter in chroma from luma intra prediction mode
WO2024010635A1 (en) * 2022-07-05 2024-01-11 Innopeak Technology, Inc. System and method for multiple-hypothesis prediction for video coding

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009522981A (ja) * 2006-01-09 2009-06-11 エルジー エレクトロニクス インコーポレイティド 映像信号のエンコーディング/デコーディング方法

Family Cites Families (256)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62145988A (ja) * 1985-12-20 1987-06-30 Fujitsu Ltd 適応的走査線変換画像伝送方式
JPS631932A (ja) 1986-06-23 1988-01-06 Toshiba Corp 振動検出器の断線検出回路
US5933538A (en) 1990-07-31 1999-08-03 Fujitsu Limited Image data processing method and apparatus
JPH05208631A (ja) 1992-01-30 1993-08-20 Aisin Seiki Co Ltd スライドレールの取付ブラケツト
JP3032088B2 (ja) 1992-03-03 2000-04-10 株式会社東芝 動画像符号化装置
JPH06153180A (ja) 1992-09-16 1994-05-31 Fujitsu Ltd 画像データ符号化方法及び装置
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US6252909B1 (en) * 1992-09-21 2001-06-26 Aware, Inc. Multi-carrier transmission system utilizing channels of different bandwidth
US5553277A (en) 1992-12-29 1996-09-03 Fujitsu Limited Image search method for searching and retrieving desired image from memory device
JP3189258B2 (ja) 1993-01-11 2001-07-16 ソニー株式会社 画像信号符号化方法および画像信号符号化装置、並びに画像信号復号化方法および画像信号復号化装置
EP0607484B1 (en) 1993-01-20 1998-09-09 Samsung Electronics Co. Ltd. Method and device for encoding and decoding image data
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JPH06301932A (ja) 1993-04-15 1994-10-28 Sumitomo Metal Ind Ltd 薄膜磁気ヘッド及びその製造方法
CA2127151A1 (en) 1993-09-21 1995-03-22 Atul Puri Spatially scalable video encoding and decoding
JP3627870B2 (ja) * 1995-02-28 2005-03-09 ソニー株式会社 動きベクトル検出方法及び装置
US5619256A (en) * 1995-05-26 1997-04-08 Lucent Technologies Inc. Digital 3D/stereoscopic video compression technique utilizing disparity and motion compensated predictions
DE19526366A1 (de) * 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
JPH0951504A (ja) 1995-08-03 1997-02-18 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像復号化装置
KR100308627B1 (ko) 1995-10-25 2001-11-02 마찌다 가쯔히꼬 중첩블럭이동보상및제로트리웨이브릿코딩을이용한저비트레이트비디오엔코더
US6957350B1 (en) * 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US5852565A (en) * 1996-01-30 1998-12-22 Demografx Temporal and resolution layering in advanced television
JPH09208631A (ja) 1996-02-07 1997-08-12 Mitsubishi Chem Corp 塩化ビニル系重合体
JPH09238350A (ja) 1996-03-01 1997-09-09 Matsushita Electric Ind Co Ltd 動画像符号化装置
US6233017B1 (en) 1996-09-16 2001-05-15 Microsoft Corporation Multimedia compression system with adaptive block sizes
US6545687B2 (en) 1997-01-09 2003-04-08 Canon Kabushiki Kaisha Thumbnail manipulation using fast and aspect ratio zooming, compressing and scaling
US6728775B1 (en) 1997-03-17 2004-04-27 Microsoft Corporation Multiple multicasting of multimedia streams
EP0905978A3 (en) 1997-09-29 2000-04-12 Canon Kabushiki Kaisha An encoding method and apparatus
AUPO951397A0 (en) 1997-09-29 1997-10-23 Canon Information Systems Research Australia Pty Ltd A method for digital data compression
WO1999039303A1 (en) 1998-02-02 1999-08-05 The Trustees Of The University Of Pennsylvania Method and system for computing 8x8 dct/idct and a vlsi implementation
US8050329B2 (en) 1998-06-26 2011-11-01 Mediatek Inc. Method and apparatus for generic scalable shape coding
JP3691393B2 (ja) 1998-11-04 2005-09-07 三菱電機株式会社 画像復号化装置、画像復号化方法及び画像符号化・復号化システム
US6480547B1 (en) * 1999-10-15 2002-11-12 Koninklijke Philips Electronics N.V. System and method for encoding and decoding the residual signal for fine granular scalable video
US6476805B1 (en) 1999-12-23 2002-11-05 Microsoft Corporation Techniques for spatial displacement estimation and multi-resolution operations on light fields
US8117313B2 (en) * 2001-03-19 2012-02-14 International Business Machines Corporation System and method for adaptive formatting of image information for efficient delivery and presentation
ATE337683T1 (de) * 2001-09-12 2006-09-15 Matsushita Electric Ind Co Ltd Bildkodierungsverfahren und bilddekodierungsverfahren
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US20030118113A1 (en) * 2001-12-20 2003-06-26 Comer Mary Lafuze Fine-grain scalable video decoder with conditional replacement
KR100931915B1 (ko) 2002-01-23 2009-12-15 노키아 코포레이션 비디오 코딩시 이미지 프레임들의 그루핑
AU2002951574A0 (en) * 2002-09-20 2002-10-03 Unisearch Limited Method of signalling motion information for efficient scalable video compression
EP1597919A1 (en) * 2003-02-17 2005-11-23 Koninklijke Philips Electronics N.V. Video coding
US8107535B2 (en) * 2003-06-10 2012-01-31 Rensselaer Polytechnic Institute (Rpi) Method and apparatus for scalable motion vector coding
US6900748B2 (en) 2003-07-17 2005-05-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for binarization and arithmetic coding of a data value
US20050013498A1 (en) * 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
JP2005135249A (ja) 2003-10-31 2005-05-26 Kddi Corp 映像の領域分割装置
US7346111B2 (en) * 2003-12-10 2008-03-18 Lsi Logic Corporation Co-located motion vector storage
EP1558039A1 (en) * 2004-01-21 2005-07-27 Deutsche Thomson-Brandt Gmbh Method and apparatus for generating/evaluating prediction information in picture signal encoding/decoding
US7227894B2 (en) 2004-02-24 2007-06-05 Industrial Technology Research Institute Method and apparatus for MPEG-4 FGS performance enhancement
US7627037B2 (en) * 2004-02-27 2009-12-01 Microsoft Corporation Barbell lifting for multi-layer wavelet coding
CA2499163A1 (en) * 2004-03-03 2005-09-03 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communication Research Centre Canada Curved wavelet transform for image and video compression
JP2007533188A (ja) * 2004-04-06 2007-11-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 映像データを受信するための送信及び方法
KR100586882B1 (ko) * 2004-04-13 2006-06-08 삼성전자주식회사 모션 스케일러빌리티를 지원하는 코딩 방법 및 장치
US8442108B2 (en) * 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
KR100679011B1 (ko) * 2004-07-15 2007-02-05 삼성전자주식회사 기초 계층을 이용하는 스케일러블 비디오 코딩 방법 및 장치
KR100678949B1 (ko) 2004-07-15 2007-02-06 삼성전자주식회사 비디오 코딩 및 디코딩 방법, 비디오 인코더 및 디코더
CN100466735C (zh) * 2004-07-15 2009-03-04 三星电子株式会社 视频编码和解码方法以及视频编码器和解码器
DE102004041664A1 (de) 2004-08-27 2006-03-09 Siemens Ag Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung
KR101407748B1 (ko) * 2004-10-13 2014-06-17 톰슨 라이센싱 복잡도 스케일러블 비디오 인코딩 및 디코딩을 위한 방법 및 장치
KR100703740B1 (ko) * 2004-10-21 2007-04-05 삼성전자주식회사 다 계층 기반의 모션 벡터를 효율적으로 부호화하는 방법및 장치
KR100679025B1 (ko) 2004-11-12 2007-02-05 삼성전자주식회사 다 계층 기반의 인트라 예측 방법, 및 그 방법을 이용한비디오 코딩 방법 및 장치
KR100679031B1 (ko) * 2004-12-03 2007-02-05 삼성전자주식회사 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치
EP1817911A4 (en) * 2004-12-03 2015-05-20 Samsung Electronics Co Ltd METHOD AND DEVICE FOR MULTILAYER VIDEO ENCODING AND DECODING
EP1694074A1 (en) 2005-02-18 2006-08-23 Thomson Licensing Process for scalable coding of images
KR100888962B1 (ko) * 2004-12-06 2009-03-17 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
KR100888963B1 (ko) * 2004-12-06 2009-03-17 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
CA2590705A1 (en) 2005-01-14 2006-07-20 Sungkyunkwan University Methods of and apparatuses for adaptive entropy encoding and adaptive entropy decoding for scalable video encoding
US7792385B2 (en) * 2005-01-25 2010-09-07 Globalfoundries Inc. Scratch pad for storing intermediate loop filter data
KR100703748B1 (ko) 2005-01-25 2007-04-05 삼성전자주식회사 다 계층 기반의 비디오 프레임을 효율적으로 예측하는 방법및 그 방법을 이용한 비디오 코딩 방법 및 장치
US8576924B2 (en) * 2005-01-25 2013-11-05 Advanced Micro Devices, Inc. Piecewise processing of overlap smoothing and in-loop deblocking
CN101213840B (zh) * 2005-02-18 2011-02-02 汤姆森许可贸易公司 从低分辨率图像导出高分辨率图像的编码信息的方法以及实现该方法的编码和解码设备
EP1894412A1 (en) 2005-02-18 2008-03-05 THOMSON Licensing Method for deriving coding information for high resolution images from low resoluton images and coding and decoding devices implementing said method
KR100703770B1 (ko) 2005-03-25 2007-04-06 삼성전자주식회사 가중 예측을 이용한 비디오 코딩 및 디코딩 방법, 이를위한 장치
US8199816B2 (en) * 2005-04-06 2012-06-12 Thomson Licensing Method and apparatus for encoding enhancement layer video data
EP1711018A1 (en) * 2005-04-08 2006-10-11 Thomson Licensing Method and apparatus for encoding video pictures, and method and apparatus for decoding video pictures
US7876833B2 (en) 2005-04-11 2011-01-25 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive up-scaling for spatially scalable coding
EP1878257A1 (en) 2005-04-12 2008-01-16 Nokia Corporation Method and system for motion compensated fine granularity scalable video coding with drift control
KR100896279B1 (ko) * 2005-04-15 2009-05-07 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
US8619860B2 (en) * 2005-05-03 2013-12-31 Qualcomm Incorporated System and method for scalable encoding and decoding of multimedia data using multiple layers
US8059608B2 (en) * 2005-06-14 2011-11-15 Qualcomm Incorporated Transmit spatial diversity for cellular single frequency networks
US7965773B1 (en) * 2005-06-30 2011-06-21 Advanced Micro Devices, Inc. Macroblock cache
US8320453B2 (en) * 2005-07-08 2012-11-27 Lg Electronics Inc. Method for modeling coding information of a video signal to compress/decompress the information
KR100878826B1 (ko) 2005-07-08 2009-01-14 엘지전자 주식회사 영상 신호의 코딩정보를 압축/해제하기 위해 모델링하는방법
MX2008000522A (es) 2005-07-11 2008-03-06 Thomson Licensing Metodo y aparato para la prediccion adaptable de intra-textura entre capas de macrobloque.
JP4486560B2 (ja) * 2005-07-14 2010-06-23 日本電信電話株式会社 スケーラブル符号化方法および装置,スケーラブル復号方法および装置,並びにそれらのプログラムおよびその記録媒体
US7562021B2 (en) 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
CN101253774B (zh) 2005-07-18 2011-04-06 韩国电子通信研究院 使用视角时间参考图像缓冲器的预测编码/解码装置及使用其的方法
US8289370B2 (en) * 2005-07-20 2012-10-16 Vidyo, Inc. System and method for scalable and low-delay videoconferencing using scalable video coding
MX2008000906A (es) 2005-07-21 2008-03-18 Thomson Licensing Metodo y aparato para la prediccion ponderada para la codificacion escalable de video.
KR100678911B1 (ko) 2005-07-21 2007-02-05 삼성전자주식회사 방향적 인트라 예측의 적용을 확장하여 비디오 신호를인코딩하고 디코딩하는 방법 및 장치
US20070025444A1 (en) 2005-07-28 2007-02-01 Shigeyuki Okada Coding Method
KR100746011B1 (ko) * 2005-08-24 2007-08-06 삼성전자주식회사 잔차 예측의 성능 개선 방법, 상기 방법을 이용한 비디오인코더 및 비디오 디코더
JP4490351B2 (ja) * 2005-08-29 2010-06-23 日本電信電話株式会社 階層間予測処理方法,階層間予測処理装置,階層間予測処理プログラムおよびその記録媒体
KR100736086B1 (ko) 2005-09-06 2007-07-06 삼성전자주식회사 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치
JP4663792B2 (ja) 2005-09-21 2011-04-06 サムスン エレクトロニクス カンパニー リミテッド 多視点動映像を符号化及び復号化する装置及び方法
WO2007035148A2 (en) * 2005-09-23 2007-03-29 Telefonaktiebolaget Lm Ericsson (Publ) Successively refinable lattice vector quantization
US7348903B2 (en) * 2005-09-26 2008-03-25 Samsung Electronics Co., Ltd. Method and apparatus for enhancing performance of entropy coding, and video coding method and apparatus using the entropy coding performance enhancing method
US20070126853A1 (en) 2005-10-03 2007-06-07 Nokia Corporation Variable length codes for scalable video coding
KR100891662B1 (ko) * 2005-10-05 2009-04-02 엘지전자 주식회사 비디오 신호 디코딩 및 인코딩 방법
US8180826B2 (en) * 2005-10-31 2012-05-15 Microsoft Corporation Media sharing and authoring on the web
FR2894421B1 (fr) * 2005-12-07 2008-01-18 Canon Kk Procede et dispositif de decodage d'un flux video code suivant un codage hierarchique
KR100772870B1 (ko) * 2005-12-12 2007-11-02 삼성전자주식회사 Fgs 계층의 블록에 포함되는 계수의 특성에 따라 비디오신호를 부호화하고 복호화하는 방법 및 장치
JP4565392B2 (ja) * 2005-12-22 2010-10-20 日本ビクター株式会社 映像信号階層復号化装置、映像信号階層復号化方法、及び映像信号階層復号化プログラム
GB0600141D0 (en) * 2006-01-05 2006-02-15 British Broadcasting Corp Scalable coding of video signals
ZA200805337B (en) 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
US20070201550A1 (en) * 2006-01-09 2007-08-30 Nokia Corporation Method and apparatus for entropy coding in fine granularity scalable video coding
US20070160137A1 (en) 2006-01-09 2007-07-12 Nokia Corporation Error resilient mode decision in scalable video coding
US8315308B2 (en) * 2006-01-11 2012-11-20 Qualcomm Incorporated Video coding with fine granularity spatial scalability
US8340179B2 (en) * 2006-03-21 2012-12-25 Canon Kabushiki Kaisha Methods and devices for coding and decoding moving images, a telecommunication system comprising such a device and a program implementing such a method
BRPI0608004B1 (pt) 2006-03-22 2019-08-27 Fraunhofer Ges Forschung esquema de codificação permitindo escalabilidade de precisão
US20070230567A1 (en) 2006-03-28 2007-10-04 Nokia Corporation Slice groups and data partitioning in scalable video coding
WO2007114611A1 (en) * 2006-03-30 2007-10-11 Lg Electronics Inc. A method and apparatus for decoding/encoding a video signal
KR100781525B1 (ko) 2006-04-06 2007-12-03 삼성전자주식회사 가중 평균합을 이용하여 fgs 계층을 인코딩 및디코딩하는 방법 및 장치
US8275037B2 (en) * 2006-05-05 2012-09-25 Thomson Licensing Simplified inter-layer motion prediction for scalable video coding
WO2007136094A1 (ja) * 2006-05-24 2007-11-29 Panasonic Corporation 動画像復号装置
US7773672B2 (en) * 2006-05-30 2010-08-10 Freescale Semiconductor, Inc. Scalable rate control system for a video encoder
EP2039171B1 (en) 2006-07-07 2016-10-05 Telefonaktiebolaget LM Ericsson (publ) Weighted prediction for video coding
ZA200900032B (en) * 2006-07-07 2010-03-31 Ericsson Telefon Ab L M Video data management
US8059714B2 (en) * 2006-07-10 2011-11-15 Sharp Laboratories Of America, Inc. Methods and systems for residual layer scaling
EP2044773A4 (en) * 2006-07-10 2011-10-12 Sharp Kk METHODS AND SYSTEMS FOR COMBINING LAYERS IN A MULTI-LAYER BINARY TRAIN
US7885471B2 (en) * 2006-07-10 2011-02-08 Sharp Laboratories Of America, Inc. Methods and systems for maintenance and use of coded block pattern information
US8422555B2 (en) 2006-07-11 2013-04-16 Nokia Corporation Scalable video coding
JP5021739B2 (ja) 2006-07-12 2012-09-12 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
US8253752B2 (en) * 2006-07-20 2012-08-28 Qualcomm Incorporated Method and apparatus for encoder assisted pre-processing
US8155454B2 (en) * 2006-07-20 2012-04-10 Qualcomm Incorporated Method and apparatus for encoder assisted post-processing
US9001899B2 (en) 2006-09-15 2015-04-07 Freescale Semiconductor, Inc. Video information processing system with selective chroma deblock filtering
US9014280B2 (en) * 2006-10-13 2015-04-21 Qualcomm Incorporated Video coding with adaptive filtering for motion compensated prediction
JP2008099045A (ja) 2006-10-13 2008-04-24 Nippon Telegr & Teleph Corp <Ntt> スケーラブル符号化方法,復号方法,これらの装置,およびこれらのプログラム並びにその記録媒体
US8942292B2 (en) * 2006-10-13 2015-01-27 Qualcomm Incorporated Efficient significant coefficients coding in scalable video codecs
JP5134001B2 (ja) 2006-10-18 2013-01-30 アップル インコーポレイテッド 下層のフィルタリングを備えたスケーラブルビデオ符号化
WO2008051755A2 (en) * 2006-10-20 2008-05-02 Motorola, Inc. Method and apparatus for intra-frame spatial scalable video coding
US20080095228A1 (en) 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
US20080095235A1 (en) * 2006-10-20 2008-04-24 Motorola, Inc. Method and apparatus for intra-frame spatial scalable video coding
JP5039142B2 (ja) * 2006-10-25 2012-10-03 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 品質スケーラブルな符号化方法
US8054885B2 (en) * 2006-11-09 2011-11-08 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal
MY146880A (en) 2006-11-09 2012-10-15 Invenpro M Sdn Bhd Method for drying a substrate
US7545293B2 (en) * 2006-11-14 2009-06-09 Qualcomm Incorporated Memory efficient coding of variable length codes
US7573407B2 (en) * 2006-11-14 2009-08-11 Qualcomm Incorporated Memory efficient adaptive block coding
EP2098077A2 (en) 2006-11-15 2009-09-09 QUALCOMM Incorporated Systems and methods for applications using channel switch frames
US9445128B2 (en) * 2006-12-08 2016-09-13 Freescale Semiconductor, Inc. System and method of determining deblocking control flag of scalable video system for indicating presentation of deblocking parameters for multiple layers
US9961372B2 (en) * 2006-12-08 2018-05-01 Nxp Usa, Inc. Adaptive disabling of deblock filtering based on a content characteristic of video information
EP1933563A1 (en) * 2006-12-14 2008-06-18 Thomson Licensing Method and apparatus for encoding and/or decoding bit depth scalable video data using adaptive enhancement layer residual prediction
US8331448B2 (en) 2006-12-22 2012-12-11 Qualcomm Incorporated Systems and methods for efficient spatial intra predictabilty determination (or assessment)
CN101622877A (zh) * 2006-12-22 2010-01-06 高通股份有限公司 用于有效空间帧内可预测性确定(或评估)的系统和方法
BRPI0721077A2 (pt) 2006-12-28 2014-07-01 Nippon Telegraph & Telephone Método de codificação e método de decodificação de vídeo, aparelhos para os mesmos, programas para os mesmos, e meio de armazenamento o qual armazena os programas
US8577168B2 (en) * 2006-12-28 2013-11-05 Vidyo, Inc. System and method for in-loop deblocking in scalable video coding
RU2426267C2 (ru) 2007-01-08 2011-08-10 Нокиа Корпорейшн Усовершенствованное межуровневое предсказание для расширенной пространственной масштабируемости при кодировании видеосигнала
US8335261B2 (en) * 2007-01-08 2012-12-18 Qualcomm Incorporated Variable length coding techniques for coded block patterns
US8199812B2 (en) * 2007-01-09 2012-06-12 Qualcomm Incorporated Adaptive upsampling for scalable video coding
KR20080066522A (ko) 2007-01-11 2008-07-16 삼성전자주식회사 다시점 영상의 부호화, 복호화 방법 및 장치
US8135071B2 (en) 2007-01-16 2012-03-13 Cisco Technology, Inc. Breakpoint determining for hybrid variable length coding using relationship to neighboring blocks
US20080170611A1 (en) * 2007-01-17 2008-07-17 Srikrishna Ramaswamy Configurable functional multi-processing architecture for video processing
PT2123052E (pt) * 2007-01-18 2011-03-02 Fraunhofer Ges Forschung Corrente de dados de vídeo de qualidade escalonável
US20080205508A1 (en) 2007-02-22 2008-08-28 Streaming Networks (Pvt.) Ltd. Method and apparatus for low complexity video encoding and decoding
US20080225952A1 (en) * 2007-03-15 2008-09-18 Nokia Corporation System and method for providing improved residual prediction for spatial scalability in video coding
US8204129B2 (en) 2007-03-27 2012-06-19 Freescale Semiconductor, Inc. Simplified deblock filtering for reduced memory access and computational complexity
CN101690220B (zh) 2007-04-25 2013-09-25 Lg电子株式会社 用于解码/编码视频信号的方法和装置
KR20080107965A (ko) * 2007-06-08 2008-12-11 삼성전자주식회사 객체 경계 기반 파티션을 이용한 영상의 부호화, 복호화방법 및 장치
BRPI0811458A2 (pt) 2007-06-28 2014-11-04 Thomson Licensing Métodos e dispositivo em um codificador e decodificador para suportar decodificação de ciclo simples de vídeo codificado em imagem multivista
EP2143279B1 (en) * 2007-06-29 2010-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Scalable video coding supporting pixel value refinement scalability
US8265144B2 (en) * 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
WO2009011492A1 (en) 2007-07-13 2009-01-22 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding stereoscopic image format including both information of base view image and information of additional view image
JP5646994B2 (ja) 2007-08-15 2014-12-24 トムソン ライセンシングThomson Licensing 多視点符号化ビデオにおける領域視差ベクトルを使用したモーションスキップモードのための方法及び装置
US8938009B2 (en) 2007-10-12 2015-01-20 Qualcomm Incorporated Layered encoded bitstream structure
KR101345287B1 (ko) * 2007-10-12 2013-12-27 삼성전자주식회사 스케일러블 영상 부호화 방법 및 장치와 그 영상 복호화방법 및 장치
CN101415115B (zh) 2007-10-15 2011-02-02 华为技术有限公司 基于运动跳跃模式的视频编解码方法及其编解码器
KR101509070B1 (ko) * 2007-10-16 2015-04-06 톰슨 라이센싱 비트 깊이 크기 조정 능력에 관한 아티팩트 제거 방법 및 장치
US7777654B2 (en) 2007-10-16 2010-08-17 Industrial Technology Research Institute System and method for context-based adaptive binary arithematic encoding and decoding
KR100918862B1 (ko) 2007-10-19 2009-09-28 광주과학기술원 참조영상을 이용한 깊이영상 생성방법 및 그 장치, 생성된깊이영상을 부호화/복호화하는 방법 및 이를 위한인코더/디코더, 그리고 상기 방법에 따라 생성되는 영상을기록하는 기록매체
CN101836457B (zh) 2007-10-25 2012-07-11 日本电信电话株式会社 活动图像可分级编码方法及解码方法及其装置
KR20090055803A (ko) 2007-11-29 2009-06-03 광주과학기술원 다시점 깊이맵 생성 방법 및 장치, 다시점 영상에서의변이값 생성 방법
CN101198064A (zh) * 2007-12-10 2008-06-11 武汉大学 一种分辨率分层技术中的运动矢量预测方法
US8175158B2 (en) * 2008-01-04 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction parameter determination
KR101560182B1 (ko) 2008-01-07 2015-10-15 삼성전자주식회사 다시점 비디오 부호화 방법과 그 장치 및 다시점 비디오 복호화 방법과 그 장치
US8126054B2 (en) * 2008-01-09 2012-02-28 Motorola Mobility, Inc. Method and apparatus for highly scalable intraframe video coding
CN101911700A (zh) 2008-01-11 2010-12-08 汤姆逊许可证公司 视频和深度编码
BRPI0907748A2 (pt) * 2008-02-05 2015-07-21 Thomson Licensing Métodos e aparelhos para segmentação implícita de blocos em codificação e decodificação de vídeo
US8861598B2 (en) * 2008-03-19 2014-10-14 Cisco Technology, Inc. Video compression using search techniques of long-term reference memory
ES2527932T3 (es) * 2008-04-16 2015-02-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Escalabilidad de profundidad de bits
EP2269378A2 (en) 2008-04-25 2011-01-05 Thomson Licensing Multi-view video coding with disparity estimation based on depth information
JP2011519227A (ja) 2008-04-25 2011-06-30 トムソン ライセンシング 奥行き信号の符号化
US8421840B2 (en) 2008-06-09 2013-04-16 Vidyo, Inc. System and method for improved view layout management in scalable video and audio communication systems
CN102124742B (zh) 2008-08-20 2013-09-11 汤姆逊许可公司 精制深度图
US8660176B2 (en) * 2008-09-26 2014-02-25 Qualcomm Incorporated Resolving geometric relationships among video data units
US8634457B2 (en) * 2008-09-26 2014-01-21 Qualcomm Incorporated Determining availability of video data units
US8724697B2 (en) * 2008-09-26 2014-05-13 Qualcomm Incorporated Locating motion vectors for video data units
US8634456B2 (en) 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
EP2338281A4 (en) 2008-10-17 2012-08-15 Nokia Corp SHARING THE MOTION VECTOR IN 3D VIDEO CODING
US8913657B2 (en) 2008-10-27 2014-12-16 Lg Electronics Inc. Virtual view image synthesis method and apparatus
KR101590511B1 (ko) 2009-01-23 2016-02-02 에스케이텔레콤 주식회사 움직임 벡터 부호화/복호화 장치 및 방법과 그를 이용한 영상 부호화/복호화 장치 및 방법
WO2010090749A1 (en) * 2009-02-06 2010-08-12 Thomson Licensing Methods and apparatus for implicit and semi-implicit intra mode signaling for video encoders and decoders
KR20100095992A (ko) * 2009-02-23 2010-09-01 한국과학기술원 비디오 부호화에서의 분할 블록 부호화 방법, 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
KR20120015443A (ko) * 2009-04-13 2012-02-21 리얼디 인크. 향상된 해상도의 스테레오스코픽 비디오의 엔코딩, 디코딩 및 배포
US8780999B2 (en) * 2009-06-12 2014-07-15 Qualcomm Incorporated Assembling multiview video coding sub-BITSTREAMS in MPEG-2 systems
US8411746B2 (en) 2009-06-12 2013-04-02 Qualcomm Incorporated Multiview video coding over MPEG-2 systems
EP2265026A1 (en) * 2009-06-16 2010-12-22 Canon Kabushiki Kaisha Method and device for deblocking filtering of SVC type video streams during decoding
US8665964B2 (en) 2009-06-30 2014-03-04 Qualcomm Incorporated Video coding based on first order prediction and pre-defined second order prediction mode
KR20110001990A (ko) * 2009-06-30 2011-01-06 삼성전자주식회사 영상 데이터의 인 루프 필터링 장치 및 방법과 이를 이용한 영상 부호화/복호화 장치
WO2011005624A1 (en) * 2009-07-04 2011-01-13 Dolby Laboratories Licensing Corporation Encoding and decoding architectures for format compatible 3d video delivery
CN102726043B (zh) * 2009-11-06 2016-03-02 弗劳恩霍夫应用研究促进协会 混合视频编码
US20130010863A1 (en) * 2009-12-14 2013-01-10 Thomson Licensing Merging encoded bitstreams
WO2011092639A1 (en) 2010-01-29 2011-08-04 Nokia Corporation Systems, methods, and apparatuses for providing context-based navigation services
US20110194613A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
US9973768B2 (en) * 2010-03-16 2018-05-15 Texas Instruments Incorporated CABAC decoder with decoupled arithmetic decoding and inverse binarization
US8410959B2 (en) * 2010-04-09 2013-04-02 Qualcomm, Incorporated Variable length codes for coding of video data
EP2375747B1 (en) * 2010-04-12 2019-03-13 Sun Patent Trust Filter positioning and selection
FI3435674T3 (fi) 2010-04-13 2023-09-07 Ge Video Compression Llc Merkitsevyyskarttojen ja muunnoskerroinlohkojen koodaus
WO2011142817A1 (en) 2010-05-12 2011-11-17 Thomson Licensing Methods and apparatus for unified significance map coding
US9510009B2 (en) * 2010-05-20 2016-11-29 Thomson Licensing Methods and apparatus for adaptive motion vector candidate ordering for video encoding and decoding
US20120130801A1 (en) 2010-05-27 2012-05-24 Victor Baranov System and method for mobile advertising
US8930562B2 (en) 2010-07-20 2015-01-06 Qualcomm Incorporated Arranging sub-track fragments for streaming video data
KR20120012385A (ko) * 2010-07-31 2012-02-09 오수미 인트라 예측 부호화 장치
JP5703781B2 (ja) 2010-09-03 2015-04-22 ソニー株式会社 画像処理装置および方法
GB2483294B (en) 2010-09-03 2013-01-02 Canon Kk Method and device for motion estimation of video data coded according to a scalable coding structure
US8780991B2 (en) 2010-09-14 2014-07-15 Texas Instruments Incorporated Motion estimation in enhancement layers in video encoding
US20120075436A1 (en) * 2010-09-24 2012-03-29 Qualcomm Incorporated Coding stereo video data
EP2622744B1 (en) * 2010-10-01 2019-11-06 BlackBerry Limited Methods and devices for parallel encoding and decoding using a bitstream structured for reduced delay
CN103141099B (zh) * 2010-10-01 2016-10-26 杜比实验室特许公司 用于参考图片处理的优化的滤波器的选择
US8923395B2 (en) * 2010-10-01 2014-12-30 Qualcomm Incorporated Video coding using intra-prediction
US8861617B2 (en) * 2010-10-05 2014-10-14 Mediatek Inc Method and apparatus of region-based adaptive loop filtering
US20120082235A1 (en) * 2010-10-05 2012-04-05 General Instrument Corporation Coding and decoding utilizing context model selection with adaptive scan pattern
US9532059B2 (en) * 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US9525884B2 (en) * 2010-11-02 2016-12-20 Hfi Innovation Inc. Method and apparatus of slice boundary filtering for high efficiency video coding
EP3962088B1 (en) 2010-11-04 2023-06-21 GE Video Compression, LLC Picture coding supporting block merging and skip mode
US20120114036A1 (en) 2010-11-10 2012-05-10 Hong Kong Applied Science and Technology Research Institute Company Limited Method and Apparatus for Multiview Video Coding
US9497472B2 (en) 2010-11-16 2016-11-15 Qualcomm Incorporated Parallel context calculation in video coding
US9042440B2 (en) 2010-12-03 2015-05-26 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US20120163448A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Coding the position of a last significant coefficient of a video block in video coding
EP2661893B1 (en) * 2011-01-04 2020-11-25 BlackBerry Limited Coding of residual data in predictive compression
CA2822929C (en) * 2011-01-04 2016-07-12 Research In Motion Limited Coding of residual data in predictive compression
US9635382B2 (en) * 2011-01-07 2017-04-25 Texas Instruments Incorporated Method, system and computer program product for determining a motion vector
GB2487197B (en) * 2011-01-11 2015-06-17 Canon Kk Video encoding and decoding with improved error resilience
WO2012096164A1 (ja) 2011-01-12 2012-07-19 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
JP2012149982A (ja) 2011-01-19 2012-08-09 Fujifilm Corp 放射線画像撮影用格子ユニット及び放射線画像撮影システム、並びに格子体の製造方法
US8553769B2 (en) * 2011-01-19 2013-10-08 Blackberry Limited Method and device for improved multi-layer data compression
JP2012169762A (ja) 2011-02-10 2012-09-06 Sony Corp 画像符号化装置と画像復号化装置およびその方法とプログラム
US9001883B2 (en) * 2011-02-16 2015-04-07 Mediatek Inc Method and apparatus for slice common information sharing
US9288501B2 (en) * 2011-03-08 2016-03-15 Qualcomm Incorporated Motion vector predictors (MVPs) for bi-predictive inter mode in video coding
US9338449B2 (en) 2011-03-08 2016-05-10 Qualcomm Incorporated Harmonized scan order for coding transform coefficients in video coding
US20120236115A1 (en) 2011-03-14 2012-09-20 Qualcomm Incorporated Post-filtering in full resolution frame-compatible stereoscopic video coding
US9071848B2 (en) * 2011-03-15 2015-06-30 Broadcom Corporation Sub-band video coding architecture for packet based transmission
US9247249B2 (en) 2011-04-20 2016-01-26 Qualcomm Incorporated Motion vector prediction in video coding
EP2719184B1 (en) * 2011-06-10 2018-09-12 HFI Innovation Inc. Method and apparatus of scalable video coding
CN103891291A (zh) 2011-08-30 2014-06-25 诺基亚公司 用于视频编码和解码的设备、方法和计算机程序
EP2777267B1 (en) 2011-11-11 2019-09-04 GE Video Compression, LLC Efficient multi-view coding using depth-map estimate and update
JP2013110518A (ja) * 2011-11-18 2013-06-06 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
WO2013072484A1 (en) 2011-11-18 2013-05-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-view coding with efficient residual handling
WO2013145021A1 (ja) * 2012-03-30 2013-10-03 株式会社日立製作所 画像復号方法及び画像復号装置
EP2853096A4 (en) * 2012-05-21 2016-07-06 Mediatek Singapore Pte Ltd METHOD AND APPARATUS FOR FILTERING BETWEEN LAYERS FOR SCALABLE VIDEO CODING
JP2015167267A (ja) * 2012-07-03 2015-09-24 シャープ株式会社 画像復号装置、および画像符号化装置
US9906786B2 (en) 2012-09-07 2018-02-27 Qualcomm Incorporated Weighted prediction mode for scalable video coding
JP2015530805A (ja) * 2012-09-28 2015-10-15 インテル コーポレイション レイヤ間画素サンプル予測
CN105052134B (zh) 2012-10-01 2019-09-03 Ge视频压缩有限责任公司 一种可伸缩视频编解码方法及计算机可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009522981A (ja) * 2006-01-09 2009-06-11 エルジー エレクトロニクス インコーポレイティド 映像信号のエンコーディング/デコーディング方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHANG, WENHAO ET AL.: "A Novel Fast Mode Decision Scheme for Spatial Scalable Video Coding", 2009 THIRD INTERNATIONAL CONFERENCE ON MULTIMEDIA AND UBIQUITOUS ENGINEERING, JPN6022040454, 10 November 2009 (2009-11-10), pages 1 - 6, ISSN: 0004882253 *

Also Published As

Publication number Publication date
KR20220165285A (ko) 2022-12-14
CN108401157B (zh) 2022-06-24
KR20190033657A (ko) 2019-03-29
KR102211196B1 (ko) 2021-02-02
EP2904803A1 (en) 2015-08-12
KR20220131366A (ko) 2022-09-27
CN110996100B (zh) 2022-11-25
CN104904207A (zh) 2015-09-09
KR102194749B1 (ko) 2020-12-23
US10687059B2 (en) 2020-06-16
JP6763664B2 (ja) 2020-09-30
KR20200138425A (ko) 2020-12-09
KR20150064163A (ko) 2015-06-10
KR102367210B1 (ko) 2022-02-24
WO2014053512A1 (en) 2014-04-10
US20200322603A1 (en) 2020-10-08
EP3474546A3 (en) 2019-07-03
CN104904207B (zh) 2018-06-01
EP2904785B1 (en) 2018-06-13
KR20210063454A (ko) 2021-06-01
US20160014412A1 (en) 2016-01-14
KR102187179B1 (ko) 2020-12-04
JP2020205618A (ja) 2020-12-24
KR20210013361A (ko) 2021-02-03
KR101962442B1 (ko) 2019-03-26
KR102095504B1 (ko) 2020-04-01
JP7284221B2 (ja) 2023-05-30
US20190058882A1 (en) 2019-02-21
US20230262241A1 (en) 2023-08-17
KR101835358B1 (ko) 2018-03-08
US20200244959A1 (en) 2020-07-30
CN110267035B (zh) 2023-07-14
CN105052134B (zh) 2019-09-03
CN110996100A (zh) 2020-04-10
CN105052132A (zh) 2015-11-11
JP2015537413A (ja) 2015-12-24
EP2904801A1 (en) 2015-08-12
WO2014053518A1 (en) 2014-04-10
JP2018042257A (ja) 2018-03-15
US20150195566A1 (en) 2015-07-09
JP2019036986A (ja) 2019-03-07
US20220400271A1 (en) 2022-12-15
CN105052132B (zh) 2019-12-24
US10212419B2 (en) 2019-02-19
CN105052133A (zh) 2015-11-11
JP2015536104A (ja) 2015-12-17
JP7323577B2 (ja) 2023-08-08
JP2023159095A (ja) 2023-10-31
KR20220028160A (ko) 2022-03-08
US20200260077A1 (en) 2020-08-13
EP3618436A1 (en) 2020-03-04
KR102534713B1 (ko) 2023-05-30
US11477467B2 (en) 2022-10-18
US20230262242A1 (en) 2023-08-17
KR20150076184A (ko) 2015-07-06
EP3846468A1 (en) 2021-07-07
EP2904786B1 (en) 2018-12-05
EP2904786A1 (en) 2015-08-12
EP3429203A2 (en) 2019-01-16
EP2904783B1 (en) 2019-07-24
EP3588947A1 (en) 2020-01-01
US10218973B2 (en) 2019-02-26
EP3429203A3 (en) 2019-04-17
KR20220044367A (ko) 2022-04-07
EP4054188A1 (en) 2022-09-07
EP2904785A1 (en) 2015-08-12
JP6301932B2 (ja) 2018-03-28
KR20200144160A (ko) 2020-12-28
JP7030025B2 (ja) 2022-03-04
US20210409739A1 (en) 2021-12-30
KR20230074301A (ko) 2023-05-26
JP6301933B2 (ja) 2018-03-28
CN105009577B (zh) 2019-05-03
CN105009577A (zh) 2015-10-28
KR102472484B1 (ko) 2022-11-30
EP2904783A1 (en) 2015-08-12
KR20150070205A (ko) 2015-06-24
JP2021177644A (ja) 2021-11-11
JP6760911B2 (ja) 2020-09-23
JP2019068424A (ja) 2019-04-25
US20160014416A1 (en) 2016-01-14
KR102503114B1 (ko) 2023-02-24
KR20180026797A (ko) 2018-03-13
US10681348B2 (en) 2020-06-09
JP6636802B2 (ja) 2020-01-29
KR20230031984A (ko) 2023-03-07
US20160014425A1 (en) 2016-01-14
KR102447521B1 (ko) 2022-09-26
KR20200004450A (ko) 2020-01-13
JP2018186532A (ja) 2018-11-22
EP3474546A2 (en) 2019-04-24
US20190116360A1 (en) 2019-04-18
US10694182B2 (en) 2020-06-23
CN105052134A (zh) 2015-11-11
JP7323578B2 (ja) 2023-08-08
US11575921B2 (en) 2023-02-07
KR20150070210A (ko) 2015-06-24
KR20240034863A (ko) 2024-03-14
EP2904801B8 (en) 2021-03-10
CN110267035A (zh) 2019-09-20
EP3474546B1 (en) 2022-01-19
US20200404266A1 (en) 2020-12-24
US10212420B2 (en) 2019-02-19
JP6693940B2 (ja) 2020-05-13
KR102257542B1 (ko) 2021-05-31
KR102643661B1 (ko) 2024-03-05
KR20150076180A (ko) 2015-07-06
KR101835360B1 (ko) 2018-03-08
KR20190091377A (ko) 2019-08-05
KR20180005749A (ko) 2018-01-16
CN108401157A (zh) 2018-08-14
JP2023116468A (ja) 2023-08-22
EP2904801B1 (en) 2020-12-02
CN105052133B (zh) 2020-02-07
JP2015537412A (ja) 2015-12-24
KR102657912B1 (ko) 2024-04-15
JP6788346B2 (ja) 2020-11-25
KR20210062738A (ko) 2021-05-31
JP6912438B2 (ja) 2021-08-04
US10477210B2 (en) 2019-11-12
JP2018082447A (ja) 2018-05-24
JP2023164991A (ja) 2023-11-14
US20160014430A1 (en) 2016-01-14
US10694183B2 (en) 2020-06-23
KR102063306B1 (ko) 2020-01-07
WO2014053519A1 (en) 2014-04-10
JP2021185677A (ja) 2021-12-09
JP2023159098A (ja) 2023-10-31
KR102379609B1 (ko) 2022-03-28
US11134255B2 (en) 2021-09-28
KR20180026796A (ko) 2018-03-13
US20210266563A9 (en) 2021-08-26
KR20200035484A (ko) 2020-04-03
US11589062B2 (en) 2023-02-21
US20200007869A1 (en) 2020-01-02
KR102445274B1 (ko) 2022-09-20
KR102005915B1 (ko) 2019-08-01
WO2014053514A1 (en) 2014-04-10
JP6912437B2 (ja) 2021-08-04
WO2014053517A1 (en) 2014-04-10
JP2015536105A (ja) 2015-12-17
US20190110046A1 (en) 2019-04-11
JP2015536106A (ja) 2015-12-17
KR20220129118A (ko) 2022-09-22

Similar Documents

Publication Publication Date Title
JP6912438B2 (ja) ベース層からの予測のための副ブロックの副分割の派生を使用するスケーラブルビデオ符号化

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220927

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230727

R150 Certificate of patent or registration of utility model

Ref document number: 7323578

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R154 Certificate of patent or utility model (reissue)

Free format text: JAPANESE INTERMEDIATE CODE: R154

R154 Certificate of patent or utility model (reissue)

Free format text: JAPANESE INTERMEDIATE CODE: R154