JP2017513426A - 類型情報を利用した、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法 - Google Patents

類型情報を利用した、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法 Download PDF

Info

Publication number
JP2017513426A
JP2017513426A JP2016575281A JP2016575281A JP2017513426A JP 2017513426 A JP2017513426 A JP 2017513426A JP 2016575281 A JP2016575281 A JP 2016575281A JP 2016575281 A JP2016575281 A JP 2016575281A JP 2017513426 A JP2017513426 A JP 2017513426A
Authority
JP
Japan
Prior art keywords
layer
video
unit
encoding
reference picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016575281A
Other languages
English (en)
Inventor
チェー,ビョン−ドゥ
リ,ジン−ヨン
チョウ,ヨン−ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017513426A publication Critical patent/JP2017513426A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

マルチレイヤビデオ復号方法に係り、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報をビットストリームから獲得する段階、依存性情報が、第1レイヤが第2レイヤを参照するということを示す場合、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得する段階、及び参照ピクチャセットに基づいて、第1レイヤに含まれた現在映像の符号化データを復号する段階を含むことを特徴とするマルチレイヤビデオ復号方法である。

Description

本発明は、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法に関する。
高解像度または高画質のビデオコンテンツを再生、保存することができるハードウェアの開発及び普及によって、高解像度または高画質のビデオコンテンツを効果的に符号化したり復号したりするビデオコーデックの必要性が増大している。既存のビデオコーデックによれば、ビデオは、ツリー構造の符号化単位に基づいて制限された符号化方式によって符号化されている。
周波数変換を利用して、空間領域の映像データは、周波数領域の係数に変換される。ビデオコーデックは、周波数変換の迅速な演算のために、映像を所定サイズのブロックに分割し、ブロックごとにDCT変換を行い、ブロック単位の周波数係数を符号化する。空間領域の映像データに比べ、周波数領域の係数が、圧縮しやすい形態を有する。特に、ビデオコーデックのインター予測またはイントラ予測を介して、空間領域の映像画素値は、予測誤差によって表現されるので、予測誤差に対して周波数変換が行われれば、多くのデータが0に変換されてしまう。ビデオコーデックは、連続的に反復的に発生するデータを小サイズのデータに置き換えることにより、データ量を節減している。
マルチレイヤビデオコーデックは、第1レイヤビデオと、1以上の第2レイヤビデオとを符号化/復号する。第1レイヤビデオと第2レイヤビデオとの時間的/空間的重複性(redundancy)、及びレイヤ間の重複性除去する方式で、第1レイヤビデオと第2レイヤビデオとのデータ量が節減される。
本発明は、レイヤの類型情報を利用した、効率的なマルチレイヤビデオ符号化方法及び該復号方法を提供する。
前述の技術的課題を達成するための技術的手段として、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報をビットストリームから獲得する段階、前記依存性情報が、前記第1レイヤが前記第2レイヤを参照するということを示す場合、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得する段階、及び前記参照ピクチャセットに基づいて、前記第1レイヤに含まれた現在映像の符号化データを復号する段階を含むことを特徴とするマルチレイヤビデオ復号方法を提供する。
類型情報を利用した効率的なマルチレイヤビデオ符号化/復号方法を使用することにより、符号化/復号の効率の向上するという効果がある。
一実施形態によるマルチレイヤビデオ符号化装置のブロック図である。 一実施形態によるマルチレイヤビデオ符号化方法のフローチャートである。 一実施形態によるマルチレイヤビデオ復号装置のブロック図である。 一実施形態によるマルチレイヤビデオ復号方法のフローチャートである。 一実施形態によるインターレイヤ予測構造を図示図面である。 一実施形態によるマルチレイヤビデオを示す図面である。 本発明の一実施形態によるディスパリティ補償について説明するための図面である。 時間的サブレイヤを利用する、符号化/復号方式によるマルチレイヤ予測構造を図示する図面である。 一実施形態による、マルチレイヤビデオの符号化されたデータを含むNALユニットを示す図面である。 一実施形態による類型情報を利用した、参照ピクチャセット及び/または参照ピクチャリストを構成する方法を図示する図面である。 一実施形態による、ツリー構造による符号化単位に基づいたビデオ符号化装置のブロック図を図示する図面である。 一実施形態による、ツリー構造による符号化単位に基づいたビデオ復号装置のブロック図である。 本発明の一実施形態による符号化単位の概念を図示する図面である。 本発明の一実施形態による、符号化単位に基づいたビデオ符号化部のブロック図である。 本発明の一実施形態による、符号化単位に基づいたビデオ復号部のブロック図である。 本発明の一実施形態による、符号化単位及びパーティションを図示する図面である。 本発明の一実施形態による、符号化単位及び変換単位の関係を図示する図面である。 本発明の一実施形態による符号化情報を図示する図面である。 本発明の一実施形態による符号化単位を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 表2の符号化モード情報による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 一実施形態による、プログラムが保存されたディスクの物理的構造を例示する図面である。 ディスクを利用して、プログラムを記録して判読するためのディスクドライブを図示する図面である。 コンテンツ流通サービス(content distribution service)を提供するためのコンテンツ供給システム(content supply system)の全体的構造を図示する図面である。 一実施形態による本発明のビデオ符号化方法及びビデオ復号方法が適用される携帯電話の外部構造を図示する図面である。 一実施形態による本発明のビデオ符号化方法及びビデオ復号方法が適用される携帯電話の内部構造を図示する図面である。 本発明による通信システムが適用されたデジタル放送システムを図示する図面である。 本発明の一実施形態による、ビデオ符号化装置及びビデオ復号装置を利用するクラウドコンピューティングシステムのネットワーク構造を図示する図面である。
本発明の第1側面は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報をビットストリームから獲得する段階、前記依存性情報が、前記第1レイヤが前記第2レイヤを参照するということを示す場合、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得する段階、及び前記参照ピクチャセットに基づいて、前記第1レイヤに含まれた現在映像の符号化データを復号する段階を含むことを特徴とするマルチレイヤビデオ復号方法を提供する。
また、前記第1レイヤの類型情報は、前記第1レイヤに含まれた映像がデプス映像であるか否かということを示し、前記第2レイヤの類型情報は、前記第2レイヤに含まれた映像がデプス映像であるか否かということを示すことができる。
また、前記第1レイヤの参照ピクチャセットを獲得する段階は、前記第1レイヤの類型情報値と、前記第2レイヤの類型情報値とが同一である場合、前記第2レイヤのピクチャを、前記第1レイヤの参照ピクチャセットに含める。
また、前記第1レイヤに含まれた現在映像の符号化データを復号する段階は、前記参照ピクチャセットに基づいて、ディスパリティ補償を行うことができる。
また、前記マルチレイヤビデオ復号方法は、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報を、前記ビットストリームから獲得することができる。
また、第2側面は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報を生成する段階、前記依存性情報が、前記第1レイヤが前記第2レイヤを参照するということを示す場合、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得する段階、及び前記参照ピクチャセットに基づいて、前記第1レイヤに含まれた現在映像を符号化する段階を含むことを特徴とするマルチレイヤビデオ符号化方法を提供する。
また、前記第1レイヤの類型情報は、前記第1レイヤに含まれた映像がデプス映像であるか否かということを示し、前記第2レイヤの類型情報は、前記第2レイヤに含まれた映像がデプス映像であるか否かということを示すことができる。
また、前記第1レイヤの参照ピクチャセットを獲得する段階は、前記第1レイヤの類型情報値と、前記第2レイヤの類型情報値とが同一である場合、前記第2レイヤのピクチャを、前記第1レイヤの参照ピクチャセットに含める。
また、前記第1レイヤに含まれた現在映像を符号化する段階は、前記参照ピクチャセットに基づいて、ディスパリティ補償を行うことができる。
また、前記マルチレイヤビデオ符号化方法は、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報を生成する段階をさらに含んでもよい。
また、第3側面は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報をビットストリームから獲得する獲得部、及び前記依存性情報が、前記第1レイヤが前記第2レイヤを参照するということを示す場合、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得し、前記参照ピクチャセットに基づいて、前記第1レイヤに含まれた現在映像の符号化データを復号する復号部を含むことを特徴とするマルチレイヤビデオ復号装置を提供する。
また、前記第1レイヤの類型情報は、前記第1レイヤに含まれた映像がデプス映像であるか否かということを示し、前記第2レイヤの類型情報は、前記第2レイヤに含まれた映像がデプス映像であるか否かということを示すことができる。
また、第4側面は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報を生成し、前記依存性情報が、前記第1レイヤが前記第2レイヤを参照するということを示す場合、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得し、前記参照ピクチャセットに基づいて、前記第1レイヤに含まれた現在映像を符号化する符号化部を含むことを特徴とするマルチレイヤビデオ符号化装置を提供する。
また、前記マルチレイヤビデオ符号化装置は、前記依存性情報、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報をビットストリームに含めるビットストリーム生成部をさらに含んでもよい。
以下、図1Aないし図7を参照し、一実施形態による、類型情報を利用した、マルチレイヤビデオ符号化技法及びマルチレイヤビデオ復号技法を提案する。
また、図8ないし図20を参照し、先に提案したインターレイヤビデオ符号化技法及び該復号技法に適用可能な一実施形態による、ツリー構造の符号化単位に基づいたビデオ符号化技法及びビデオ復号技法を開示する。
また、図21ないし図27を参照し、先に提案したビデオ符号化方法、ビデオ復号方法が適用可能な一実施形態を開示する。
以下、「映像」は、ビデオの静止映像や動画、すなわち、ビデオそれ自体を示すことができる。
以下、「サンプル」は、映像のサンプリング位置に割り当てられたデータであり、プロセッシング対象になるデータを意味する。例えば、空間領域の映像において、ピクセル値、またはブロックのレジデュアルがサンプルでもある。
以下、現在ブロック(current block)は、符号化または復号する映像のブロックを意味する。
以下、周辺ブロック(neighboring block)は、現在ブロックに隣接する符号化されたか、あるいは復号された少なくとも1つのブロックを示す。例えば、周辺ブロックは、現在ブロックの上端、現在ブロックの右側上端、現在ブロックの左側、または現在ブロックの左側上端に位置することができる。また、空間的に隣接するブロックだけではなく、時間的に隣接するブロックを含んでもよい。例えば、時間的に隣接する周辺ブロックは、参照ピクチャの現在ブロックと同一位置(co-located)ブロック、あるいは同一位置ブロックの周辺ブロックを含んでもよい。
以下、「レイヤ(layer)映像」は、特定視点または同一類型の映像を示す。多視点ビデオにおいて、1つのレイヤ映像は、特定視点に入力されたテクスチャ映像またはデプス映像を示す。例えば、三次元ビデオにおいて、左視点テクスチャ映像、右視点テクスチャ映像及びデプス映像は、それぞれ1つのレイヤ映像を構成する。左視点テクスチャ映像は、第1レイヤ映像を構成し、右視点テクスチャ映像は、第2レイヤ映像を構成し、デプス映像は、第3レイヤ映像を構成することができる。
図1Aは、一実施形態によるマルチレイヤビデオ符号化装置のブロック図である。図1Aを参照すれば、ビデオ符号化装置10は、符号化部12及びビットストリーム生成部14を含んでもよい。
一実施形態によるビデオ符号化装置10は、スケーラブルビデオコーディング(scalable video coding)方式によって、多数の映像シーケンスをレイヤ別に分類してそれぞれ符号化し、レイヤ別に符号化されたデータを含む別個のストリームを出力することができる。ビデオ符号化装置10は、第1レイヤ映像シーケンス及び第2レイヤ映像シーケンスを互いに異なるレイヤに符号化することができる。
例えば、符号化部12は、第1レイヤ映像を符号化し、第1レイヤ映像の符号化データを含む第1レイヤストリームを出力することができる。また、符号化部12は、第2レイヤ映像を符号化し、第2レイヤ映像の符号化データを含む第2レイヤストリームを出力することができる。
また、例えば、空間的スケーラビリティ(spatial scalability)に基づいたスケーラブルビデオコーディング方式によれば、低解像度映像が第1レイヤ映像として符号化され、高解像度映像が第2レイヤ映像として符号化される。第1レイヤ映像の符号化結果が、第1レイヤストリームに出力され、第2レイヤ映像の符号化結果が、第2レイヤストリームに出力される。
一実施形態によるビデオ符号化装置10は、第1レイヤストリーム及び第2レイヤストリームを、マルチプレクサ(multiplexer)を介して、1つのビットストリームに表現して符号化することができる。
他の例として、多視点ビデオが、スケーラブルビデオコーディング方式によって符号化される。左視点映像は、第1レイヤ映像として符号化され、右視点映像は、第2レイヤ映像として符号化される。または、中央視点映像、左視点映像及び右視点映像がそれぞれ符号化され、このうち中央視点映像は、第1レイヤ映像として符号化され、左視点映像は、第2レイヤ映像として符号化され、右視点映像は、第3レイヤ映像として符号化される。または、中央視点のテクスチャ映像、中央視点デプス映像、左視点テクスチャ映像、左視点デプス映像、右視点テクスチャ映像、右視点デプス映像は、それぞれ第1レイヤ映像、第2レイヤ映像、第3レイヤ映像、第4レイヤ映像、第5レイヤ映像、第6レイヤ映像に符号化される。
さらに他の例として、中央視点テクスチャ映像、中央視点デプス映像、左視点デプス映像、左視点テクスチャ映像、右視点デプス映像、右視点テクスチャ映像がそれぞれ第1レイヤ映像、第2レイヤ映像、第3レイヤ映像、第4レイヤ映像、第5レイヤ映像、第6レイヤ映像に符号化されてもよい。
他の例として、時間的スケーラビリティに基づいた時間階層的予測(temporal hierarchical prediction)によって、スケーラブルビデオコーディング方式が遂行される。基本フレームレートの映像を符号化して生成された符号化情報を含む第1レイヤストリームが出力される。フレームレート別に、時間的階層(temporal level)が分類され、各時間的階層が各レイヤに符号化される。基本フレームレートの映像を参照し、さらに高いフレームレートの映像をさらに符号化し、高いフレームレートの符号化情報を含む第2レイヤストリームが出力される。
また、第1レイヤ、及び多数の拡張レイヤ(第2レイヤ、第3レイヤ、…、第Kレイヤ)に対するスケーラブルビデオコーディングが行われる。拡張レイヤが3以上である場合、第1レイヤ映像とK番目レイヤ映像とが符号化される。それによって、第1レイヤ映像の符号化結果が、第1レイヤストリームとして出力され、最初,2番目,…,K番目レイヤ映像の符号化結果が、それぞれ最初,2番目,…,K番目レイヤストリームとして出力される。
一実施形態によるビデオ符号化装置10は、単一レイヤ内の映像を参照し、現在映像を予測するインター予測(inter prediction)を行うことができる。インター予測を介して、現在映像と参照映像との動き情報を示すモーションベクトル(motion vector)、及び現在映像と参照映像とのレジデュアル成分(residual)などを第1レイヤ(基本レイヤ)の対応する領域から予測することができる。
また、一実施形態によるビデオ符号化装置10が、第1レイヤ、第2レイヤ、第3レイヤなど3以上のレイヤを許容する場合には、マルチレイヤ予測構造によって、1つの第1レイヤ映像と第3レイヤ映像とのインターレイヤ予測、第2レイヤ映像と第3レイヤ映像とのインターレイヤ予測を行うこともできる。
インターレイヤ予測において、現在映像のレイヤと参照映像のレイヤとが視点が異なる場合、現在映像と異なるレイヤの参照映像間の視差ベクトル(disparity vector)を誘導し、他レイヤの参照映像を利用して生成された予測映像と、現在映像との差成分であるレジデュアル成分が生成される。
インターレイヤ予測構造は、追って図3Aを参照して詳細に説明する。
一実施形態によるビデオ符号化装置10は、各レイヤごとに、ビデオのそれぞれの映像ブロック別に符号化する。ブロックのタイプは、正方形または長方形でもあり、任意の幾何学的形態でもある。一定サイズのデータ単位に制限されるものではない。ブロックは、ツリー構造による符号化単位においては、最大符号化単位、符号化単位、予測単位、変換単位などでもある。ツリー構造の符号化単位を含む最大符号化単位は、コーディングツリーユニット(coding tree unit)、コーディングブロックツリー(coding block tree)、ブロックツリー、ルートブロックツリー(root block tree)、コーディングツリー、コーディングルートまたはツリートランク(tree trunk)などと多様に命名されたりする。ツリー構造による符号化単位に基づいたビデオ符号化/復号方式は、図8ないし図20を参照して後述する。
インター予測及びインターレイヤ予測は、符号化単位、予測単位または変換単位のデータ単位を基に行われる。
一実施形態による符号化部12は、第1レイヤ映像に対して、インター予測またはイントラ予測を含むソースコーディング動作を遂行し、シンボルデータを生成することができる。該シンボルデータは、各符号化パラメータの値、及びレジデュアルのサンプル値を示す。
例えば、符号化部12は、第1レイヤ映像のデータ単位のサンプルに対して、インター予測またはイントラ予測、変換、量子化を行ってシンボルデータを生成し、シンボルデータに対して、エントロピー符号化を行い、第1レイヤストリームを生成することができる。
符号化部12は、ツリー構造の符号化単位に基づいて、第2レイヤ映像を符号化することができる。符号化部12は、第2レイヤ映像の符号化単位のサンプルに対して、インタ/イントラ予測、変換、量子化を行ってシンボルデータを生成し、シンボルデータに対して、エントロピー符号化を行い、第2レイヤストリームを生成することができる。
一実施形態による符号化部12は、第1レイヤ映像の予測情報を利用して第2レイヤ映像を予測するインターレイヤ予測を行うことができる。符号化部12は、インターレイヤ予測構造を介して、第2レイヤ映像シーケンスにおいて、第2レイヤ原本映像を符号化するために、第1レイヤ復元映像の動き情報を利用して第2レイヤ現在映像の動き情報を決定し、決定された動き情報に基づいて、第2レイヤ予測映像を生成し、第2レイヤ原本映像と第2レイヤ予測映像との予測誤差を符号化することができる。
一方、符号化部12は、第2レイヤ映像を、符号化単位または予測単位別に、インターレイヤ予測を行い、第2レイヤ映像のブロックが参照する第1レイヤ映像のブロックを決定することができる。例えば、第2レイヤ映像において、現在ブロックの位置に相応して位置する第1レイヤ映像の復元ブロックが決定される。符号化部12は、第2レイヤブロックに相応する第1レイヤ復元ブロックを、第2レイヤの予測ブロックとして利用することができる。このとき、符号化部12は、第2レイヤブロックに対応する地点に位置する第1レイヤ復元ブロックを利用して、第2レイヤ予測ブロックを決定することができる。
符号化部12は、インターレイヤ予測構造によって、第1レイヤ復元ブロックを利用して決定された第2レイヤ予測ブロックを、第2レイヤ原本ブロックのインターレイヤ予測のための参照映像として利用することができる。符号化部12は、第1レイヤ復元映像を利用して、第2レイヤ予測ブロックのサンプル値と、第2レイヤ原本ブロックのサンプル値との誤差、すなわち、インターレイヤ予測によるレジデュアル成分を変換及び量子化し、エントロピー符号化することができる。
一方、前述のビデオ符号化装置10は、レイヤ間の依存性情報、及び/または各レイヤの類型情報を利用して、現在映像を符号化することができる。
本発明の多様な実施形態によれば、第1レイヤは、第2レイヤを参照することができる。例えば、符号化部12が、第1レイヤに含まれた現在映像を符号化するとき、第2レイヤに含まれた映像の符号化に係わる所定情報を利用することができる。
符号化部12は、レイヤ間の参照いかんを示す依存性情報を生成することができる。
符号化部12は、各レイヤに含まれた映像の類型を認識することができる。例えば、ビデオ符号化装置10は、各レイヤに含まれた映像がテクスチャ映像であるか否かということを認識することができる。また、ビデオ符号化装置10は、各レイヤに含まれた映像がデプス映像であるか否かということを認識することができる。
符号化部12は、各レイヤに含まれた映像の類型情報を生成することができる。類型情報は、各レイヤに含まれた映像の類型を示す情報を意味する。例えば、第1レイヤ類型情報の値が1である場合、第1レイヤに含まれた映像は、デプス映像でもある。また、第1レイヤ類型情報の値が0である場合、第1レイヤに含まれた映像は、テクスチャ映像でもある。
符号化部12は、参照ピクチャセットを獲得することができる。参照ピクチャセットは、復元ピクチャバッファ(DPB:decoded picture buffer)を管理するときに利用される情報である。例えば、符号化部12は、参照ピクチャセットに含まれたピクチャを、参照ピクチャとして復元ピクチャバッファに保存し、参照ピクチャセットに含まれていないピクチャは、非参照ピクチャとして、一定時間後、復元ピクチャバッファから除去することができる。参照ピクチャセットは、現在ピクチャに対する参照ピクチャ、未来ピクチャに対する参照ピクチャ、非参照ピクチャであり、画面出力のためのピクチャ、またはそれらの組み合わせを含んでもよい。
符号化部10は、レイヤそれぞれに対して、参照ピクチャセットを獲得することができる。例えば、符号化部10は、第1レイヤの符号化に利用される第1参照ピクチャセットを獲得することができ、第2レイヤの符号化に利用される第2参照ピクチャセットを獲得することができる。
また、符号化部10は、レイヤそれぞれに対して、複数個の参照ピクチャセットを獲得することができる。例えば、符号化部10は、第1レイヤに対して、複数個の参照ピクチャセットを獲得し、獲得した複数個の参照ピクチャセットを利用して、第1レイヤの映像を符号化することができる。
また、符号化部10は、複数のレイヤに対する参照ピクチャセットを獲得することができる。例えば、符号化部10は、第1レイヤ及び第2レイヤの符号化に利用される参照ピクチャセットを獲得することができる。
符号化部10は、参照ピクチャセットに含まれたピクチャの一部または全体を利用して、参照ピクチャリストを構成することができる。例えば、ビデオ符号化装置10は、参照ピクチャセットに含まれたピクチャのうち現在ピクチャに対する参照ピクチャを参照ピクチャリストに含める。
符号化部10は、レイヤそれぞれに対する参照ピクチャリストを獲得することができる。例えば、符号化部10は、第1レイヤの符号化に利用される第1参照ピクチャリストを獲得することができ、第2レイヤの符号化に利用される第2参照ピクチャリストを獲得することができる。
また、符号化部10は、レイヤそれぞれに対して、複数個の参照ピクチャリストを獲得することができる。例えば、符号化部10は、第1レイヤに対して、複数個の参照ピクチャリストを獲得し、獲得した複数個の参照ピクチャセットを利用して、第1レイヤの映像を符号化することができる。
また、符号化部10は、複数のレイヤに対する参照ピクチャリストを獲得することができる。例えば、符号化部10は、第1レイヤ及び第2レイヤの符号化に利用される参照ピクチャセットを獲得することができる。
符号化部12は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得することができる。
例えば、符号化部12は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が1であるとき、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が0である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
符号化部12は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型、及び第2レイヤの類型が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得することができる。
例えば、符号化部12は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がテクスチャ映像として同一であるとき、符号化部12は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がデプス映像として同一であるとき、符号化部12は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
符号化部12は、第1レイヤが第2レイヤを参照し、第1レイヤの類型情報と、第2レイヤの類型情報とが異なる場合、第2レイヤのピクチャを、第1レイヤの参照ピクチャセットに含めない。その場合、符号化部12は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の復号に係わる所定情報を利用することができる。
例えば、符号化部12は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の動きベクトルを利用することができる。
符号化部12は、第1レイヤの参照ピクチャセットに含まれたピクチャの一部または全体を利用して、第1レイヤに含まれた現在映像の参照ピクチャリストを構成することができる。例えば、符号化部12は、第1レイヤの参照ピクチャセットに含まれたピクチャのうち一部を含め、第1レイヤに含まれた現在映像の参照ピクチャリストを構成することができる。
他の実施形態によれば、符号化部12は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャリストを生成することができる。
例えば、符号化部12は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が1であるとき、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が0である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
他の実施形態によれば、符号化部12は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型、及び第2レイヤの類型が同一であるか否かということに基づいて、第1レイヤの参照ピクチャリストを獲得することができる。
例えば、符号化部12は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がテクスチャ映像として同一であるとき、符号化部12は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がデプス映像として同一であるとき、符号化部12は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
ビットストリーム生成部14は、符号化されたビデオ、及びインターレイヤ予測と係わって決定されたインターレイヤ予測情報を含むビットストリームを生成し、生成されたビットストリームを復号装置に伝送ことができる。また、ビットストリーム生成部14は、生成された依存性情報、及び/または各レイヤの類型情報をビットストリームに含める。
以下、インターレイヤ予測のためのビデオ符号化装置10の動作について、図1Bを参照して詳細に説明する。
図1Bは、一実施形態によるマルチレイヤビデオ符号化方法のフローチャートである。
段階S11において、ビデオ符号化装置10は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報を生成することができる。
本発明の多様な実施形態によれば、第1レイヤは、第2レイヤを参照することができる。例えば、ビデオ符号化装置10は、第1レイヤに含まれた現在映像を符号化するとき、第2レイヤに含まれた映像の符号化に係わる所定情報を利用することができる。
また、ビデオ符号化装置10は、第1レイヤに含まれた現在映像を符号化するとき、第2レイヤに含まれた映像の動き情報を利用することができる。
ビデオ符号化装置10は、第2レイヤに含まれたブロックの動き情報に基づいて、第1レイヤに含まれた現在ブロックの動き情報を決定し、決定された動き情報が示すブロックを、現在ブロックの予測ブロックとして決定することができる。また、ビデオ符号化装置10は、決定された予測ブロックを利用して、現在ブロックを符号化することができる。
また、ビデオ符号化装置10は、第1レイヤに含まれた現在映像を符号化するとき、第2レイヤに含まれたピクチャを現在映像の参照ピクチャセットに含める。
ビデオ符号化装置10は、現在映像の参照ピクチャセットに含まれたピクチャの一部または全部を含めて現在映像の参照ピクチャリストを構成し、現在映像の参照ピクチャリストに含まれたピクチャを利用して、インター予測またはインターレイヤ予測を行うことにより、現在映像を符号化することができる。
ビデオ符号化装置10は、レイヤ間の参照いかんを示す依存性情報を生成することができる。
例えば、ビデオ符号化装置10は、第1レイヤが第2レイヤを参照する場合、1の値を有する依存性情報を生成することができる。また、ビデオ符号化装置10は、第1レイヤが第2レイヤを参照しない場合、0の値を有する依存性情報を生成することができる。
ビデオ符号化装置10は、複数個の依存性情報を生成することができる。例えば、ビデオ符号化装置10は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報を生成することができ、第1レイヤが第3レイヤを参照するか否かということを示す依存性情報を生成することができる。
前述の依存性情報は、一実施形態に過ぎず、ビデオ符号化装置10は、それに限定されず、複数のレイヤのうち一部レイヤの参照いかんを示す多様な形態の依存性情報を生成することができる。また、ビデオ符号化装置10は、生成した依存性情報をビットストリームに含める。
段階S13において、ビデオ符号化装置10は、依存性情報が第1レイヤが第2レイヤを参照するということを示す場合、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得することができる。
ビデオ符号化装置10は、各レイヤに含まれた映像の類型を認識することができる。例えば、ビデオ符号化装置10は、第1レイヤに含まれた映像がテクスチャ映像であるか否かということを認識することができる。また、ビデオ符号化装置10は、第1レイヤに含まれた映像がデプス映像であるか否かということを認識することができる。
ビデオ符号化装置10は、各レイヤに含まれた映像の類型情報を生成することができる。該類型情報は、各レイヤに含まれた映像の類型を示す情報を意味する。
該類型情報は、各レイヤに含まれた映像がデプス映像であるか否かということを示すことができる。また、該類型情報は、各レイヤに含まれた映像がテクスチャ映像であるか否かということを示すことができる。
例えば、第1レイヤ類型情報の値が1である場合、第1レイヤに含まれた映像は、デプス映像でもある。また、第1レイヤ類型情報の値が0である場合、第1レイヤに含まれた映像は、テクスチャ映像でもある。
ビデオ符号化装置10は、参照ピクチャセットを獲得することができる。参照ピクチャセットは、復元ピクチャバッファ(DPB:decoded picture buffer)を管理するときに利用される情報である。例えば、ビデオ符号化装置10は、参照ピクチャセットに含まれたピクチャを、参照ピクチャとして復元ピクチャバッファに保存し、参照ピクチャセットに含まれていないピクチャは、非参照ピクチャとして、一定時間後、復元ピクチャバッファから除去することができる。参照ピクチャセットは、現在ピクチャに対する参照ピクチャ、未来ピクチャに対する参照ピクチャ、非参照ピクチャであり、画面出力のためのピクチャ、またはそれらの組み合わせを含んでもよい。
ビデオ符号化装置10は、レイヤそれぞれに対して、参照ピクチャセットを獲得することができる。例えば、ビデオ符号化装置10は、第1レイヤの符号化に利用される第1参照ピクチャセットを獲得することができ、第2レイヤの符号化に利用される第2参照ピクチャセットを獲得することができる。
また、ビデオ符号化装置10は、レイヤそれぞれに対して、複数個の参照ピクチャセットを獲得することができる。例えば、ビデオ符号化装置10は、第1レイヤに対して、複数個の参照ピクチャセットを獲得し、獲得した複数個の参照ピクチャセットを利用して、第1レイヤの映像を符号化することができる。
また、ビデオ符号化装置10は、複数のレイヤに対する参照ピクチャセットを獲得することができる。例えば、ビデオ符号化装置10は、第1レイヤ及び第2レイヤの符号化に利用される参照ピクチャセットを獲得することができる。
ビデオ符号化装置10は、参照ピクチャセットに含まれたピクチャの一部または全体を利用して、参照ピクチャリストを構成することができる。例えば、ビデオ符号化装置10は、参照ピクチャセットに含まれたピクチャのうち現在ピクチャに対する参照ピクチャを参照ピクチャリストに含める。
ビデオ符号化装置10は、レイヤそれぞれに対する参照ピクチャリストを獲得することができる。例えば、ビデオ符号化装置10は、第1レイヤの符号化に利用される第1参照ピクチャリストを獲得することができ、第2レイヤの符号化に利用される第2参照ピクチャリストを獲得することができる。
また、ビデオ符号化装置10は、レイヤそれぞれに対して、複数個の参照ピクチャリストを獲得することができる。例えば、ビデオ符号化装置10は、第1レイヤに対して、複数個の参照ピクチャリストを獲得し、獲得した複数個の参照ピクチャリストを利用して、第1レイヤの映像を符号化することができる。
また、ビデオ符号化装置10は、複数のレイヤに対する参照ピクチャリストを獲得することができる。例えば、ビデオ符号化装置10は、第1レイヤ及び第2レイヤの符号化に利用される参照ピクチャリストを獲得することができる。
ビデオ符号化装置10は、第1レイヤが第2レイヤを参照する場合、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得することができる。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が1である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が0である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
ビデオ符号化装置10は、第1レイヤが第2レイヤを参照する場合、第1レイヤの類型、及び第2レイヤの類型が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得することができる。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がテクスチャ映像として同一である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がデプス映像として同一である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
ビデオ符号化装置10は、第1レイヤが第2レイヤを参照し、第1レイヤと、第2レイヤの類型情報とが異なる場合、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値が1であり、第2レイヤの類型情報値が0である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値が0であり、第2レイヤの類型情報値が1である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
第1レイヤが第2レイヤを参照し、第1レイヤの類型情報と、第2レイヤの類型情報とが異なる場合、ビデオ符号化装置10は、第1レイヤに含まれた現在映像を符号化するとき、第2レイヤに含まれた映像の符号化に係わる所定情報を利用することができる。
例えば、ビデオ符号化装置10は、第1レイヤに含まれた現在映像を符号化するとき、第2レイヤに含まれた映像の動きベクトルを利用することができる。ビデオ符号化装置10は、第2レイヤに含まれたブロックの動きベクトルに基づいて、第1レイヤに含まれた現在ブロックの動きベクトルを決定し、決定された動きベクトルが示すブロックを、現在ブロックの予測ブロックとして決定することができる。また、ビデオ符号化装置10は、決定された予測ブロックを利用して、現在ブロックを符号化することができる。
ビデオ符号化装置10は、第1レイヤが第2レイヤを参照し、第1レイヤと第2レイヤとの類型が異なる場合、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型がテクスチャ映像であり、第2レイヤの類型がディプス映像である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型がディプス映像であり、第2レイヤの類型がテクスチャ映像である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
第1レイヤが第2レイヤを参照し、第1レイヤの類型と第2レイヤの類型とが異なる場合、ビデオ符号化装置10は、第1レイヤに含まれた現在映像を符号化するとき、第2レイヤに含まれた映像の符号化に係わる所定情報を利用することができる。
例えば、ビデオ符号化装置10は、第1レイヤに含まれた現在映像を符号化するとき、第2レイヤに含まれた映像の動きベクトルを利用することができる。ビデオ符号化装置10は、第2レイヤに含まれたブロックの動きベクトルに基づいて、第1レイヤに含まれた現在ブロックの動きベクトルを決定し、決定された動きベクトルが示すブロックを、現在ブロックの予測ブロックとして決定することができる。また、ビデオ符号化装置10は、決定された予測ブロックを利用して、現在ブロックを符号化することができる。
ビデオ符号化装置10は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が0である場合、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含めない。
段階S15において、ビデオ符号化装置10は、第1レイヤの参照ピクチャセットに基づいて、第1レイヤに含まれた現在映像を符号化することができる。
ビデオ符号化装置10は、第1レイヤの参照ピクチャセットに含まれたピクチャの一部または全体を利用して、第1レイヤに含まれた現在映像の参照ピクチャリストを構成することができる。例えば、ビデオ符号化装置10は、第1レイヤの参照ピクチャセットに含まれたピクチャのうち一部を含め、第1レイヤに含まれた現在映像の参照ピクチャリストを構成することができる。
他の実施形態によれば、ビデオ符号化装置10は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャリストを獲得することができる。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が1である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が0である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
他の実施形態によれば、ビデオ符号化装置10は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型、及び第2レイヤの類型が同一であるか否かということに基づいて、第1レイヤの参照ピクチャリストを獲得することができる。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がテクスチャ映像として同一である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がデプス映像として同一である場合、ビデオ符号化装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
ビデオ符号化装置10は、第1レイヤの参照ピクチャリストに含まれたピクチャを利用して、第1レイヤに含まれた現在映像を符号化することができる。例えば、ビデオ符号化装置10は、第1レイヤの参照ピクチャリストに含まれたピクチャのうち現在映像に対応するピクチャを検出し、動き補償、インターレイヤ予測またはディスパリティ補償を行うことにより、現在映像を符号化することができる。ビデオ符号化装置10は、それに限定されず、多様な方法で、第1レイヤの参照ピクチャリストに含まれたピクチャを利用して、第1レイヤに含まれた現在映像を符号化することができる。
本発明の一実施形態によるマルチレイヤビデオ符号化装置10は、符号化部12及びビットストリーム生成部14を総括的に制御する中央プロセッサ(図示せず)を含んでもよい。または、符号化部12及びビットストリーム生成部14がそれぞれの自体プロセッサ(図示せず)によって作動し、プロセッサ(図示せず)が相互有機的に作動することにより、マルチレイヤビデオ符号化装置10が全体的に作動することもできる。または、マルチレイヤビデオ符号化装置10の外部プロセッサ(図示せず)の制御によって、符号化部12及びビットストリーム生成部14が制御されてもよい。
マルチレイヤ符号化装置10は、符号化部12及びビットストリーム生成部14の入出力データが保存される1以上のデータ保存部(図示せず)を含んでもよい。マルチレイヤビデオ符号化装置10は、データ保存部(図示せず)のデータ入出力を管轄するメモリ制御部(図示せず)を含んでもよい。
マルチレイヤビデオ符号化装置10は、ビデオ符号化結果を出力するために、内部に搭載されたビデオエンコーディングプロセッサまたは外部ビデオエンコーディングプロセッサと連繋して作動することにより、変換を含んだビデオ符号化動作を遂行することができる。マルチレイヤビデオ符号化装置10の内部ビデオエンコーディングプロセッサは、別個のプロセッサとしてビデオ符号化動作を具現することができる。また、マルチレイヤビデオ符号化装置10または中央演算装置、グラフィック演算装置がビデオエンコーディングプロセッシングモジュールを含むことにより、基本的なビデオ符号化動作を具現する場合も可能である。
図2Aは、一実施形態によるマルチレイヤビデオ復号装置のブロック図である。図2Aを参照すれば、マルチレイヤビデオ復号装置20は、獲得部22及び復号部24を含んでもよい。
一実施形態によるマルチレイヤビデオ復号装置20において、1つのビットストリームから、レイヤ別にシンボルがパージングされる。
空間的スケーラビリティに基づいたマルチレイヤビデオ復号装置20は、互いに異なる解像度の映像シーケンスが、互いに異なるレイヤに符号化されたストリームを受信することができる。第1レイヤストリームを復号して低解像度映像シーケンスが復元され、第2レイヤストリームを復号して高解像度映像シーケンスが復元される。
他の例として、多視点ビデオがスケーラブルビデオコーディング方式によって復号される。ステレオスコピックビデオストリームが多数レイヤに復号される場合、第1レイヤストリームを復号して左視点映像が復元される。第1レイヤストリームに第2レイヤストリームをさらに復号し、右視点映像が復元される。
または、多視点ビデオストリームが多数レイヤで復号される場合、第1レイヤストリームを復号し、中央視点映像が復元される。第1レイヤストリームに第2レイヤストリームをさらに復号し、左視点映像が復元される。第1レイヤストリームに第3レイヤストリームをさらに復号して右視点映像が復元される。
他の例として、時間的スケーラビリティに基づいたスケーラブルビデオコーディング方式が遂行される。第1レイヤストリームを復号し、基本フレームレートの映像が復元される。第1レイヤストリームに第2レイヤストリームをさらに復号し、高速フレームレートの映像が復元される。
また、第2レイヤが3以上である場合、第1レイヤストリームから第1レイヤ映像が復元され、第1レイヤ復元映像を参照し、第2レイヤストリームをさらに復号すれば、第2レイヤ映像がさらに復元される。第2レイヤ復元映像を参照し、K番目レイヤストリームをさらに復号すれば、K番目レイヤ映像がさらに復元される。
マルチレイヤビデオ復号装置20は、第1レイヤストリーム及び第2レイヤストリームから、第1レイヤ映像及び第2レイヤ映像の符号化されたデータを獲得し、さらにインター予測によって生成されたモーションベクトル、及びインターレイヤ予測によって生成された予測情報をさらに獲得することができる。
例えば、マルチレイヤビデオ復号装置20は、各レイヤ別にインター予測されたデータを復号し、多数レイヤ間に、インターレイヤ予測されたデータを復号することができる。符号化単位または予測単位を基に、動き補償(motion compensation)、及びインターレイヤビデオ復号を介した復元が行われる。
各レイヤストリームについては、同一レイヤのインター予測を介して予測された復元映像を参照し、現在映像のための動き補償を行うことにより、映像を復元することができる。動き補償は、現在映像のモーションベクトルを利用して決定された参照映像と、現在映像のレジデュアル成分とを合成し、現在映像の復元映像を再構成する動作を意味する。
また、マルチレイヤビデオ復号装置20は、インターレイヤ予測を介して予測された第2レイヤ映像を復号するために、第1レイヤ映像の予測情報を参照し、インターレイヤビデオ復号を行うこともできる。インターレイヤビデオ復号は、現在映像の動き情報を決定するために、他レイヤの参照ブロックの予測情報を利用して、現在映像の動き情報を再構成する動作を意味する。
一実施形態によるマルチレイヤビデオ復号装置20は、第2レイヤ映像を利用して予測された第3レイヤ映像を復元するためのインターレイヤビデオ復号を行うこともできる。インターレイヤ予測構造は、追って図3Aを参照して詳細に説明する。
ただし、一実施形態による復号部24が、第1レイヤ映像シーケンスを参照せず、第2レイヤストリームを復号することもできる。従って、復号部24が第2レイヤ映像シーケンスを復号するために、インターレイヤ予測を行うと制限的に解釈しないように留意しなければならない。
マルチレイヤビデオ復号装置20は、ビデオのそれぞれの映像ブロック別に復号する。ブロックは、ツリー構造による符号化単位においては、最大符号化単位、符号化単位、予測単位、変換単位などでもある。
獲得部22は、ビットストリームを受信し、受信されたビットストリームから、符号化された映像についての情報を獲得することができる。
復号部24は、ビットストリームからパージングされた第1レイヤ映像のシンボルを利用して、第1レイヤ映像を復号することができる。マルチレイヤビデオ復号装置20が、ツリー構造の符号化単位を基に符号化されたストリームを受信するならば、復号部24は、第1レイヤストリームの最大符号化単位ごとに、ツリー構造の符号化単位を基に、復号を行うことができる。
復号部24は、最大符号化単位ごとにエントロピー復号を行い、符号化情報と、符号化されたデータとを獲得することができる。復号部24は、ストリームから獲得した符号化されたデータに対して、逆量子化、逆変換を行い、レジデュアル成分を復元することができる。他の実施形態による復号部24は、量子化された変換係数のビットストリームを直接受信することもできる。量子化された変換係数に対して、逆量子化、逆変換を行った結果、映像のレジデュアル成分が復元される。
復号部24は、同一レイヤ映像間に、動き補償を介して予測映像を決定し、予測映像とレジデュアル成分とを結合し、第1レイヤ映像を復元することができる。
復号部24は、インターレイヤ予測構造によれば、第1レイヤ復元映像のサンプルを利用して、第2レイヤ予測映像を生成することができる。復号部24は、第2レイヤストリームを復号し、インターレイヤ予測による予測誤差を獲得することができる。復号部24は、第2レイヤ予測映像に予測誤差を結合することにより、第2レイヤ復元映像を生成することができる。
復号部24は、復号部24で復号された第1レイヤ復元映像を利用して、第2レイヤ予測映像を決定することができる。復号部24は、インターレイヤ予測構造によって、第2レイヤ映像の符号化単位または予測単位が参照する第1レイヤ映像のブロックを決定することができる。例えば、第2レイヤ映像において、現在ブロックの位置に相応して位置する第1レイヤ映像の復元ブロックが決定される。復号部24は、第2レイヤブロックに相応する第1レイヤ復元ブロックを利用して、第2レイヤ予測ブロックを決定することができる。復号部24は、第2レイヤブロックと同一地点に位置(co-located)する第1レイヤ復元ブロックを利用して、第2レイヤ予測ブロックを決定することができる。
復号部24は、インターレイヤ予測構造によって、第1レイヤ復元ブロックを利用して決定された第2レイヤ予測ブロックを、第2レイヤ原本ブロックのインターレイヤ予測のための参照映像として利用することもできる。その場合、復号部24は、第1レイヤ復元映像を利用して決定された第2レイヤ予測ブロックのサンプル値と、インターレイヤ予測によるレジデュアル成分とを合成することにより、第2レイヤブロックを復元することができる。
一方、前述のビデオ復号装置20は、レイヤ間の依存性情報、及び/または各レイヤの類型情報を利用して、現在映像を復号することができる。
獲得部22は、レイヤ間の依存性情報を獲得することができる。依存性情報は、レイヤ間の参照いかんを示す情報を意味する。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報の値が1である場合、第1レイヤは、第2レイヤを参照して復号される。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報の値が0である場合、第1レイヤは、第2レイヤを参照しないで復号される。
他の実施形態によれば、第1レイヤが第2レイヤを参照する場合、復号部24は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の復号に係わる所定情報を利用することができる。
復号部24は、各レイヤに含まれた映像の類型情報を獲得することができる。類型情報は、各レイヤに含まれた映像の類型を示す情報を意味する。例えば、第1レイヤ類型情報の値が1である場合、第1レイヤに含まれた映像は、デプス映像でもある。また、第1レイヤ類型情報の値が0である場合、第1レイヤに含まれた映像は、テクスチャ映像でもある。
復号部24は、参照ピクチャセットを獲得することができる。参照ピクチャセットは、復元ピクチャバッファ(DPB:decoded picture buffer)を管理するときに利用される情報である。例えば、復号部24は、参照ピクチャセットに含まれたピクチャを、参照ピクチャとして復元ピクチャバッファに保存し、参照ピクチャセットに含まれていないピクチャは、非参照ピクチャとして、一定時間後、復元ピクチャバッファから除去することができる。参照ピクチャセットは、現在ピクチャに対する参照ピクチャ、未来ピクチャに対する参照ピクチャ、非参照ピクチャであり、画面出力のためのピクチャ、またはそれらの組み合わせを含んでもよい。
復号部24は、レイヤそれぞれに対して、参照ピクチャセットを獲得することができる。例えば、復号部24は、第1レイヤの復号に利用される第1参照ピクチャセットを獲得することができ、第2レイヤの復号に利用される第2参照ピクチャセットを獲得することができる。
また、復号部24は、レイヤそれぞれに対して、複数個の参照ピクチャセットを獲得することができる。例えば、復号部24は、第1レイヤに対して、複数個の参照ピクチャセットを獲得し、獲得した複数個の参照ピクチャセットを利用して、第1レイヤの映像を復号することができる。
また、復号部24は、複数のレイヤに対する参照ピクチャセットを獲得することができる。例えば、復号部24は、第1レイヤ及び第2レイヤの復号に利用される参照ピクチャセットを獲得することができる。
復号部24は、参照ピクチャセットに含まれたピクチャの一部または全体を利用して、参照ピクチャリストを構成することができる。例えば、ビデオ復号装置10は、参照ピクチャセットに含まれたピクチャのうち現在ピクチャに対する参照ピクチャを参照ピクチャリストに含める。
復号部24は、レイヤそれぞれに対する参照ピクチャリストを獲得することができる。例えば、復号部24は、第1レイヤの復号に利用される第1参照ピクチャリストを獲得することができ、第2レイヤの復号に利用される第2参照ピクチャリストを獲得することができる。
また、復号部24は、レイヤそれぞれに対して、複数個の参照ピクチャリストを獲得することができる。例えば、復号部24は、第1レイヤに対して、複数個の参照ピクチャリストを獲得し、獲得した複数個の参照ピクチャリストを利用して、第1レイヤの映像を復号することができる。
また、復号部24は、複数のレイヤに対する参照ピクチャリストを獲得することができる。例えば、復号部24は、第1レイヤ及び第2レイヤの復号に利用される参照ピクチャリストを獲得することができる。
復号部24は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得することができる。
例えば、復号部24は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が1であるとき、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が0である場合、復号部24は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
復号部24は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型、及び第2レイヤの類型が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得することができる。
例えば、復号部24は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がテクスチャ映像として同一であるとき、復号部24は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がデプス映像として同一であるとき、復号部24は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
復号部24は、第1レイヤが第2レイヤを参照し、第1レイヤの類型情報と、第2レイヤの類型情報とが異なる場合、第2レイヤのピクチャを、第1レイヤの参照ピクチャセットに含めない。その場合、復号部24は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の復号に係わる所定情報を利用することができる。
例えば、復号部24は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の動きベクトルを利用することができる。
復号部24は、第1レイヤの参照ピクチャセットに含まれたピクチャの一部または全体を利用して、第1レイヤに含まれた現在映像の参照ピクチャリストを構成することができる。例えば、復号部24は、第1レイヤの参照ピクチャセットに含まれたピクチャのうち一部を含め、第1レイヤに含まれた現在映像の参照ピクチャリストを構成することができる。
他の実施形態によれば、復号部24は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャリストを生成することができる。
例えば、復号部24は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が1であるとき、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が0である場合、ビデオ復号装置10は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
他の実施形態によれば、復号部24は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型、及び第2レイヤの類型が同一であるか否かということに基づいて、第1レイヤの参照ピクチャリストを獲得することができる。
例えば、復号部24は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がテクスチャ映像として同一であるとき、復号部24は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がデプス映像として同一であるとき、復号部24は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
復号部24は、第1レイヤの参照ピクチャリストに含まれたピクチャを利用して、第1レイヤに含まれた現在映像を復元することができる。例えば、復号部24は、第1レイヤの参照ピクチャリストに含まれたピクチャのうち現在映像に対応するピクチャを検出し、動き補償、インターレイヤ予測またはディスパリティ補償を行うことにより、現在映像を復元することができる。復号部24は、それに限定されず、多様な方法で、第1レイヤの参照ピクチャリストに含まれたピクチャを利用して、第1レイヤに含まれた現在映像を復元することができる。
以下、インターレイヤ予測のためのマルチレイヤビデオ復号装置20の動作について、図2Bを参照して詳細に説明する。
図2Bは、一実施形態によるマルチレイヤビデオ復号方法のフローチャートである。
段階S21において、ビデオ復号装置20は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報を、ビットストリームから獲得することができる。
本発明の多様な実施形態によれば、ビデオ復号装置20は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤを参照することができる。
例えば、ビデオ復号装置20は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の復号に係わる所定情報を利用することができる。また、ビデオ復号装置20は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の動き情報を利用することができる。
ビデオ復号装置20は、第1レイヤに含まれたブロックの動き情報に基づいて、第2レイヤに含まれたブロックの動き情報を決定し、決定された動き情報が示すブロックを、現在ブロックの予測ブロックとして決定することができる。また、ビデオ復号装置20は、決定された予測ブロックを利用して、現在ブロックを復号することができる。
また、例えば、ビデオ復号装置20が、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれたピクチャを、現在映像の参照ピクチャセットに含める。
ビデオ復号装置20は、現在映像の参照ピクチャセットに含まれたピクチャの一部または全部を含め、現在映像の参照ピクチャリストを構成し、現在映像の参照ピクチャリストに含まれたピクチャを利用して、インター予測またはインターレイヤ予測を行うことにより、現在映像を復号することができる。
ビデオ復号装置20は、ビットストリームから、依存性情報を獲得することができる。該依存性情報は、レイヤの参照いかんを示すことができる。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報の値が1である場合、第1レイヤは、第2レイヤを参照して復号される。また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報の値が0である場合、第1レイヤは、第2レイヤを参照しないで復号される。
ビデオ復号装置20は、複数個の依存性情報を獲得することができる。例えば、ビデオ復号装置20は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報を獲得することができ、第1レイヤが第3レイヤを参照するか否かということを示す依存性情報を獲得することができる。
前述の依存性情報は、一実施形態に過ぎず、ビデオ復号装置20は、それに限定されず、複数のレイヤのうち一部レイヤの参照いかんを示す多様な形態の依存性情報を獲得することができる。
段階S23において、ビデオ復号装置20は、依存性情報が第1レイヤが第2レイヤを参照するということを示す場合、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得することができる。
ビデオ復号装置20は、第1レイヤの類型情報、及び第2レイヤの類型情報を獲得することができる。類型情報は、各レイヤに含まれた映像がデプス映像であるか否かということを示すことができる。また、類型情報は、各レイヤに含まれた映像がテクスチャ映像であるか否かということを示すことができる。
例えば、第1レイヤ類型情報の値が1である場合、第1レイヤに含まれた映像は、デプス映像でもある。また、第1レイヤ類型情報の値が0である場合、第1レイヤに含まれた映像は、テクスチャ映像でもある。
ビデオ復号装置20は、参照ピクチャセットを獲得することができる。参照ピクチャセットは、復元ピクチャバッファ(DPB:decoded picture buffer)を管理するときに利用される情報である。例えば、ビデオ復号装置20は、参照ピクチャセットに含まれたピクチャを、参照ピクチャとして復元ピクチャバッファに保存し、参照ピクチャセットに含まれていないピクチャは、非参照ピクチャとして、一定時間後、復元ピクチャバッファから除去することができる。参照ピクチャセットは、現在ピクチャに対する参照ピクチャ、未来ピクチャに対する参照ピクチャ、非参照ピクチャであり、画面出力のためのピクチャ、またはそれらの組み合わせを含んでもよい。
ビデオ復号装置20は、レイヤそれぞれに対して、参照ピクチャセットを獲得することができる。例えば、ビデオ復号装置20は、第1レイヤの復号に利用される第1参照ピクチャセットを獲得することができ、第2レイヤの復号に利用される第2参照ピクチャセットを獲得することができる。
また、ビデオ復号装置20は、レイヤそれぞれに対して、複数個の参照ピクチャセットを獲得することができる。例えば、ビデオ復号装置20は、第1レイヤに対して、複数個の参照ピクチャセットを獲得し、獲得した複数個の参照ピクチャセットを利用して、第1レイヤの映像を復号することができる。
また、ビデオ復号装置20は、複数のレイヤに対する参照ピクチャセットを獲得することができる。例えば、ビデオ復号装置20は、第1レイヤ及び第2レイヤの復号に利用される参照ピクチャセットを獲得することができる。
ビデオ復号装置20は、参照ピクチャセットに含まれたピクチャの一部または全体を利用して、参照ピクチャリストを構成することができる。例えば、ビデオ復号装置10は、参照ピクチャセットに含まれたピクチャのうち現在ピクチャに対する参照ピクチャを参照ピクチャリストに含める。
ビデオ復号装置20は、レイヤそれぞれに係わる参照ピクチャリストを獲得することができる。例えば、ビデオ復号装置20は、第1レイヤの復号に利用される第1参照ピクチャリストを獲得することができ、第2レイヤの復号に利用される第2参照ピクチャリストを獲得することができる。
また、ビデオ復号装置20は、レイヤそれぞれに対して、複数個の参照ピクチャリストを獲得することができる。例えば、ビデオ復号装置20は、第1レイヤに対して、複数個の参照ピクチャリストを獲得し、獲得した複数個の参照ピクチャリストを利用して、第1レイヤの映像を復号することができる。
また、ビデオ復号装置20は、複数のレイヤに係わる参照ピクチャリストを獲得することができる。例えば、ビデオ復号装置20は、第1レイヤ及び第2レイヤの復号に利用される参照ピクチャリストを獲得することができる。
ビデオ復号装置20は、第1レイヤが第2レイヤを参照する場合、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得することができる。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が1である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が0である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
ビデオ復号装置20は、第1レイヤが第2レイヤを参照する場合、第1レイヤの類型、及び第2レイヤの類型が同一であるか否かということに基づいて、第1レイヤの参照ピクチャセットを獲得することができる。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型テクスチャ映像として同一である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がデプス映像として同一である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含める。
ビデオ復号装置20は、第1レイヤが第2レイヤを参照し、第1レイヤと、第2レイヤの類型情報とが異なる場合、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値が1であり、第2レイヤの類型情報値が0である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値が0であり、第2レイヤの類型情報値が1である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
第1レイヤが第2レイヤを参照し、第1レイヤの類型情報と、第2レイヤの類型情報とが異なる場合、ビデオ復号装置20は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の復号に係わる所定情報を利用することができる。
例えば、ビデオ復号装置20は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の動きベクトルを利用することができる。ビデオ復号装置20は、第2レイヤに含まれたブロックの動きベクトルに基づいて、第1レイヤに含まれた現在ブロックの動きベクトルを決定し、決定された動きベクトルが示すブロックを、現在ブロックの予測ブロックとして決定することができる。また、ビデオ復号装置20は、決定された予測ブロックを利用して、現在ブロックを復号することができる。
ビデオ復号装置20は、第1レイヤが第2レイヤを参照し、第1レイヤと第2レイヤとの類型が異なる場合、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型がテクスチャ映像であり、第2レイヤの類型がディプス映像である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型がディプス映像であり、第2レイヤの類型がテクスチャ映像である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセット及び参照ピクチャリストに含めない。
第1レイヤが第2レイヤを参照し、第1レイヤの類型と第2レイヤの類型とが異なる場合、ビデオ復号装置20は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の復号に係わる所定情報を利用することができる。
例えば、ビデオ復号装置20は、第1レイヤに含まれた現在映像を復号するとき、第2レイヤに含まれた映像の動きベクトルを利用することができる。ビデオ復号装置20は、第2レイヤに含まれたブロックの動きベクトルに基づいて、第1レイヤに含まれた現在ブロックの動きベクトルを決定し、決定された動きベクトルが示すブロックを、現在ブロックの予測ブロックとして決定することができる。また、ビデオ復号装置20は、決定された予測ブロックを利用して、現在ブロックを復号することができる。
ビデオ復号装置20は、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が0である場合、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャセットに含めない。
段階S25において、ビデオ復号装置20は、第1レイヤの参照ピクチャセットに基づいて、第1レイヤに含まれた現在映像の符号化データを復号することができる。
ビデオ復号装置20は、第1レイヤの参照ピクチャセットに含まれたピクチャの一部または全体を利用して、第1レイヤに含まれた現在映像の参照ピクチャリストを構成することができる。例えば、ビデオ復号装置20は、第1レイヤの参照ピクチャセットに含まれたピクチャのうち一部を含め、第1レイヤに含まれた現在映像の参照ピクチャリストを構成することができる。
他の実施形態によれば、ビデオ復号装置20は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型情報、及び第2レイヤの類型情報が同一であるか否かということに基づいて、第1レイヤの参照ピクチャリストを獲得することができる。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が1である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型情報値、及び第2レイヤの類型情報値が0である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
他の実施形態によれば、ビデオ復号装置20は、第1レイヤが第2レイヤを参照するとき、第1レイヤの類型、及び第2レイヤの類型が同一であるか否かということに基づいて、第1レイヤの参照ピクチャリストを獲得することができる。
例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がテクスチャ映像として同一である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
また、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報値が1であり、第1レイヤの類型、及び第2レイヤの類型がデプス映像として同一である場合、ビデオ復号装置20は、第2レイヤに含まれたピクチャを、第1レイヤの参照ピクチャリストに含める。
ビデオ復号装置20は、第1レイヤの参照ピクチャリストに含まれたピクチャを利用して、第1レイヤに含まれた現在映像を復元することができる。例えば、ビデオ復号装置20は、第1レイヤの参照ピクチャリストに含まれたピクチャのうち現在映像に対応するピクチャを検出し、動き補償、インターレイヤ予測またはディスパリティ補償を行うことにより、現在映像を復元することができる。ビデオ復号装置20は、それに限定されず、多様な方法で、第1レイヤの参照ピクチャリストに含まれたピクチャを利用して、第1レイヤに含まれた現在映像を復元することができる。
本発明の一実施形態によるマルチレイヤビデオ復号装置20は、獲得部22及び復号部24を総括的に制御する中央プロセッサ(図示せず)を含んでもよい。または、獲得部22及び復号部24がそれぞれの自体プロセッサ(図示せず)によって作動し、プロセッサ(図示せず)が相互有機的に作動することにより、マルチレイヤビデオ復号装置20が全体的に作動することもできる。または、マルチレイヤビデオ復号装置20の外部プロセッサ(図示せず)の制御によって、獲得部22及び復号部24が制御されてもよい。
マルチレイヤ復号装置20は、獲得部22及び復号部24の入出力データが保存される1以上のデータ保存部(図示せず)を含んでもよい。マルチレイヤビデオ復号装置20は、データ保存部(図示せず)のデータ入出力を管轄するメモリ制御部(図示せず)を含んでもよい。
マルチレイヤビデオ復号装置20は、ビデオ符号化結果を出力するために、内部に搭載されたビデオエンコーディングプロセッサまたは外部ビデオエンコーディングプロセッサと連繋して作動することにより、変換を含んだビデオ符号化動作を遂行することができる。マルチレイヤビデオ復号装置20の内部ビデオエンコーディングプロセッサは、別個のプロセッサとしてビデオ符号化動作を具現することができる。また、マルチレイヤビデオ復号装置20または中央演算装置、グラフィック演算装置がビデオエンコーディングプロセッシングモジュールを含むことにより、基本的なビデオ符号化動作を具現する場合も可能である。
図3Aは、一実施形態によるインターレイヤ予測構造を図示している。
一実施形態によるマルチレイヤビデオ符号化装置10は、図3Aに図示された多視点ビデオ予測構造の再生順序50によって、基本視点映像、左視点映像及び右視点映像を予測符号化することができる。
一実施形態によれば、基本視点、左視点、右視点の映像は、それぞれ異なるレイヤの映像に対応する。例えば、基本視点は、第1レイヤに対応し、左視点は、第2レイヤに対応し、右視点は、第3レイヤに対応する。
関連技術による多視点ビデオ予測構造の再生順序50によれば、横方向に同一視点(view)の映像が配列されている。従って、「left」と表記された左視点映像が、横方向に一列に配列され、「center」と表記された基本視点映像が、横方向に一列に配列され、「right」と表記された右視点映像が、横方向に一列に配列されている。基本視点映像は、左視点/右視点映像に対して、中央視点映像でもある。
また、縦方向にPOC順序が同一である映像が配列される。映像のPOC順序は、ビデオを構成する映像の再生順序を示す。多視点ビデオ予測構造50で表示されている「POC X」は、当該列に位置した映像の相対的な再生順序を示し、Xの数字が小さいほど、再生順序が先であり、大きくなるほど、再生順序が後になる。
従って、関連技術による多視点ビデオ予測構造の再生順序50によれば、「left」と表記された左視点映像が、POC順序(再生順序)によって横方向に配列され、「center」と表記された基本視点映像が、POC順序(再生順序)によって横方向に配列され、「right」と表記された右視点映像が、POC順序(再生順序)によって横方向に配列されている。また、基本視点映像と同一列(column)に位置した左視点映像及び右視点映像は、全ての視点が異なるにしても、POC順序(再生順序)は、同一映像である。
各視点別に、4個の連続映像が1つのGOP(group of picture)を構成している。各GOPは、連続するアンカーピクチャ間の映像と、1つのアンカーピクチャ(key picture)とを含む。
アンカーピクチャは、ランダムアクセスポイント(random access point)であり、ビデオを再生するとき、映像の再生順序、すなわち、POC順序によって配列された映像のうちから、任意に再生位置が選択されれば、再生位置でPOC順序が最も隣接するアンカーピクチャが再生される。基本視点映像は、基本視点アンカーピクチャ51,52,53,54,55を含み、左視点映像は、左視点アンカーピクチャ131,132,133,134,135を含み、右視点映像は、右視点アンカーピクチャ231,232,233,234,235を含む。
多視点映像は、GOP順に再生されて予測(復元)される。まず、多視点ビデオ予測構造の再生順序50によれば、各視点別に、GOP 0に含まれた映像が再生された後、GOP 1に含まれた映像が再生される。すなわち、GOP 0、GOP 1、GOP 2、GOP 3の順序で、各GOPに含まれた映像が再生される。また、多視点ビデオ予測構造のコーディング順序によれば、各視点別に、GOP 0に含まれた映像が予測(復元)された後、GOP 1に含まれた映像が予測(復元)される。すなわち、GOP 0、GOP 1、GOP 2、GOP 3の順序で、各GOPに含まれた映像が予測(復元)される。
多視点ビデオ予測構造の再生順序50によれば、映像に対して、視点間予測(インターレイヤ予測)及びインター予測がいずれも行われる。多視点ビデオ予測構造において、矢印が始める映像が参照映像であり、矢印が終わる映像が参照映像を利用して予測される映像である。
基本視点映像の予測結果は、符号化された後、基本視点映像ストリーム形態で出力され、付加視点映像の予測結果は、符号化された後、レイヤビットストリーム形態で出力される。また、左視点映像の予測符号化結果は、第1レイヤビットストリームとして出力されで、右視点映像の予測符号化結果は、第2レイヤビットストリームとして出力される。
基本視点映像については、インター予測だけが行われる。すなわち、Iピクチャタイプであるアンカーピクチャ51,52,53,54,55は、他の映像を参照しないが、Bピクチャタイプ及びbピクチャタイプである残りの映像は、他の基本視点映像を参照して予測される。Bピクチャタイプ映像は、POC順序が先になるIピクチャタイプアンカーピクチャと、後になるIピクチャタイプアンカーピクチャとを参照して予測される。bピクチャタイプ映像は、POC順序が先になるIピクチャタイプアンカーピクチャと、後になるBピクチャタイプ映像とを参照するか、あるいはPOC順序が先になるBピクチャタイプ映像と、後になるIピクチャタイプアンカーピクチャとを参照して予測される。
左視点映像及び右視点映像については、それぞれ、異なる視点映像を参照する視点間予測(インターレイヤ予測)、及び同一視点映像を参照するインター予測が行われる。
左視点アンカーピクチャ131,132,133,134,135について、それぞれPOC順序が同一である基本視点アンカーピクチャ51,52,53,54,55を参照し、視点間予測(インターレイヤ予測)が行われる。右視点アンカーピクチャ231,232,233,234,235については、それぞれPOC順序が同一である基本視点映像51,52,53,54,55または左視点アンカーピクチャ131,132,133,134,135を参照し、視点間予測が行われる。また、左視点映像及び右視点映像のうちアンカーピクチャ131,132,133,134,135,231,232,233,234,235ではない残りの映像についても、POCが同一である他視点映像を参照する視点間予測(インターレイヤ予測)が行われる。
左視点映像及び右視点映像のうちアンカーピクチャ131,132,133,134,135,231,232,233,234,235ではない残りの映像は、同一視点映像を参照して予測される。
ただし、左視点映像及び右視点映像は、それぞれ、同一視点の付加視点映像のうち再生順序が先行するアンカーピクチャを参照して予測されないこともある。すなわち、現在左視点映像のインター予測のために、現在左視点映像より再生順序が先行する左視点アンカーピクチャを除いた左視点映像が参照されもする。同様に、現在右視点映像のインター予測のために、現在右視点映像より再生順序が先行する右視点アンカーピクチャを除いた右視点映像が参照されもする。
また、現在左視点映像のインター予測のために、現在左視点映像が属した現在GOPより先行する以前GOPに属する左視点映像は、参照せず、現在GOPに属するが、現在左視点映像より先に復元される左視点映像を参照して予測が行われることが望ましい。右視点映像の場合も、同様である。
一実施形態によるマルチレイヤビデオ復号装置20は、図3Aに図示された多視点ビデオ予測構造の再生順序50によって、基本視点映像、左視点映像及び右視点映像を復元することができる。
左視点映像は、基本視点映像を参照する視点間ディスパリティ補償と、左視点映像を参照するインター動き補償とを介して復元される。右視点映像は、基本視点映像及び左視点映像を参照する視点間ディスパリティ補償と、右視点映像を参照するインター動き補償とを介して復元される。左視点映像及び右視点映像のディスパリティ補償及び動き補償のために、参照映像が先に復元されなければならない。
左視点映像のインター動き補償のために、復元された左視点の参照映像を参照するインター動き補償を介して、左視点映像が復元される。右視点映像のインター動き補償のために、復元された右視点の参照映像を参照するインター動き補償を介して、右視点映像が復元される。
また、現在左視点映像のインター動き補償のために、現在左視点映像が属した現在GOPより先行する以前GOPに属する左視点映像は、参照せず、現在GOPに属するが、現在左視点映像より先に復元される左視点映像だけ参照されることが望ましい。右視点映像の場合も同様である。
また、一実施形態によるマルチレイヤビデオ復号装置20は、多視点映像を符号化/復号するために、ディスパリティ予測(または、インターレイヤ予測)を行うだけでなく、視点間動きベクトル予測を介した映像間動き補償(または、インターレイヤ動き予測)を行うこともできる。
図3Bは、一実施形態によるマルチレイヤビデオを示している。
多様なネットワーク環境、及び多様な端末機において、最適のサービスを提供するために、マルチレイヤビデオ符号化装置10は、多様な空間的解像度(spatial resolution)、多様な画質(quality)、多様なフレーム率(frame-rate)、互いに異なる視点を有するマルチレイヤ映像シーケンスを符号化し、スケーラブルなビットストリームを出力することができる。すなわち、マルチレイヤビデオ符号化装置10は、多様なスケーラビリティ類型によって入力映像を符号化し、スケーラブルビデオビットストリームを生成して出力することができる。スケーラビリティは、時間的,空間的,画質的,多視点的スケーラビリティ、及びかようなスケーラビリティの組み合わせを含む。かようなスケーラビリティは、各類型によって区分される。また、スケーラビリティは、各類型内において、次元識別子として区分される。
例えば、スケーラビリティは、時間的,空間的,画質的及び多視点的スケーラビリティのようなスケーラビリティ類型を有する。そして、各類型によって、スケーラビリティ次元識別子として区分される。例えば、互いに異なるスケーラビリティを有するならば、互いに異なる次元識別子を有することができる。例えば、当該スケーラビリティ類型に係わる高次元的なスケーラビリティであればあるほど、スケーラビリティ次元を高く割り当てることもできる。
ビットストリームから、有効な(valid)サブストリームに分離される場合、ビットストリームは、スケーラブル(scalable)であると呼ばれる。空間的にスケーラブルなビットストリームは、多様な解像度のサブストリームを含む。同一スケーラビリティ類型において、互いに異なるスケーラビリティを区別するために、スケーラビリティ次元を利用する。スケーラビリティ次元は、スケーラビリティ次元識別子によって表現される。
例えば、空間的にスケーラブルなビットストリームは、QVGA、VGA、WVGAのような互いに異なる解像度を有するサブストリームに分離される。例えば、互いに異なる解像度を有する各レイヤは、次元識別子を利用して区別される。例えば、QVGAサブストリームは、空間的スケーラビリティ次元識別子値として0を有することができ、VGAサブストリームは、空間的スケーラビリティ次元識別子値として1を有することができ、WVGAサブストリームは、空間的スケーラビリティ次元識別子値として2を有することができる。
時間的にスケーラブルなビットストリームは、多様なフレーム率を有するサブストリームを含む。例えば、時間的にスケーラブルなビットストリームは、7.5Hzのフレーム率、15Hzのフレーム率、30Hzのフレーム率、60Hzのフレーム率を有するサブストリームに分離される。画質的にスケーラブルなビットストリームは、CGS(coarse-grained scalability)方式、MGS(medium-grained scalability)方式、FGS(fine-grained scalability)方式によって、互いに異なる画質(quality)を有するサブストリームに分離される。時間的スケーラビリティも、互いに異なるフレーム率によって、互いに異なる次元に区分され、画質的スケーラビリティも、互いに異なる方式によって、互いに異なる次元に区分される。
多視点スケーラブルビットストリームは、1つのビットストリーム内において互いに異なる視点のサブストリームを含む。一例として、ステレオスコピック(stereo scopic)映像の場合、ビットストリームは、左側映像と右側映像とを含む。また、スケーラブルビットストリームは、多視点映像及びデプスマップ(depth map)の符号化されたデータについてのサブストリームを含んでもよい。視点的スケーラビリティも、それぞれの視点によって、互いに異なる次元に区分される。
互いに異なるスケーラブル拡張類型は、互いに結合される。すなわち、スケーラブルビデオビットストリームは、時間的,空間的,画質的,多視点的スケーラビリティのうち少なくとも一つが互いに異なる映像で構成されたマルチレイヤの映像シーケンスを符号化したサブストリームを含んでもよい。
図3Bでは、互いに異なるスケーラブル拡張類型を有する映像シーケンス3010,3020,3030を図示している。第1レイヤの映像シーケンス3010、第2レイヤの映像シーケンス3020及び第n(nは整数)レイヤの映像シーケンス3030は、解像度、画質、視点のうち少なくとも一つが互いに異なる映像シーケンスでもある。また、第1レイヤの映像シーケンス3010、第2レイヤの映像シーケンス3020、及び第n(nは整数)レイヤの映像シーケンス3030のうち1つのレイヤの映像シーケンスは、基本レイヤの映像シーケンスであり、他レイヤの映像シーケンスは、向上レイヤの映像シーケンスでもある。
一例として、第1レイヤの映像シーケンス3010は、第1視点の映像であり、第2レイヤの映像シーケンス3020は、第2視点の映像であり、第nレイヤの映像シーケンス3030は、第n視点の映像でもある。他の例として、第1レイヤの映像シーケンス3010は、基本レイヤの左視点映像であり、第2レイヤの映像シーケンス3020は、基本レイヤの右視点映像であり、第nレイヤの映像シーケンス3030は、向上レイヤの右視点映像でもある。前述の例に限定されず、互いに異なるスケーラブル拡張類型を有する映像シーケンス3010,3020,3030は、それぞれ互いに異なる映像属性(attribute)を有する映像シーケンスでもある。
図4は、本発明の一実施形態によるディスパリティ補償について説明するための図面である。
本発明の一実施形態によれば、マルチレイヤビデオ復号装置20は、現在ブロック42が含まれた第1レイヤの参照ピクチャリストを制限することができる。例えば、マルチレイヤビデオ復号装置20は、現在ブロック42が含まれた第1レイヤと異なる類型のピクチャを、参照ピクチャリストに含めない。
例えば、第1レイヤがテクスチャ映像を含むとき、ビデオ復号装置20は、第1レイヤの参照ピクチャリストに、デプス映像を含めない。
また、第1レイヤがデプス映像を含むとき、ビデオ復号装置20は、第1レイヤの参照ピクチャリストに、テクスチャ映像を含めない。
本発明の一実施形態によれば、マルチレイヤビデオ復号装置20は、現在ブロック42が含まれた第1レイヤの参照ピクチャリストに含まれたピクチャのうち現在ピクチャ41に対応する第2レイヤピクチャ43を検出することができる。
図4を参照するとき、マルチレイヤビデオ復号装置20は、ディスパリティベクトルを利用して、現在ブロックにディスパリティ補償を行うことができる。ディスパリティ補償は、現在映像が含まれたレイヤと異なるレイヤに含まれた映像を参照し、現在映像に、動き補償を行うということを意味する。
例えば、マルチレイヤビデオ復号装置20は、現在ブロック42の位置と、ディスパリティベクトル45とを利用して、現在ピクチャ41に対応する第2レイヤピクチャ43内において、現在ブロック42に対応する第2レイヤブロック44を検出することができる。
マルチレイヤビデオ復号装置20は、検出された第2レイヤブロック44を利用して、予測ブロックを獲得することができる。また、ビットストリームから獲得したレジデュアルデータと予測ブロックとを合成することにより、第1レイヤ現在ブロックを復元することができる。
マルチレイヤビデオ復号装置20は、前述の実施形態に限定されず、多様な方式で、現在レイヤと異なるレイヤに含まれた映像を参照し、現在映像を復元することができる。
図5は、時間的サブレイヤを利用する符号化/復号方式によるマルチレイヤ予測構造を図示している。
時間的階層構造50によって、スケーラブルビデオコーディング方式が遂行される。時間的階層構造50によれば、階層的Bタイプ映像55,56,57,58,59,60,61,62,63の予測構造を含む。レベル0の予測構造において、Iタイプ映像51,54のインター予測と、Pタイプ映像52,53のインター予測とが行われる。レベル1の予測構造では、I,Pタイプ映像51,52,53,54を参照するBタイプ映像55,56,57のインター予測が行われる。レベル2の予測構造では、I,Pタイプ映像51,52,53,54と、レベル1のBタイプ映像55,56,57とを参照するインター予測が行われる。
時間的インデックス(「temporal_id」)は、予測レベルを識別するための番号であり、各レベル映像が出力されることにより、フレームレートが上昇する。例えば、レベル0映像51,52,53,54は、復号され、フレームレート15Hzで出力され、レベル1映像55,56,57まで復号されて出力されれば、フレームレートが30Hzに上昇し、レベル2映像58,59,60,61,62,63まで復号されて出力されれば、フレームレートが60Hzに上昇する。
一実施形態によって、時間的階層構造50を、スケーラブルビデオコーディング方式で具現すれば、レベル0映像が基本レイヤ映像として符号化され、レベル1映像は、第1向上レイヤ映像として符号化され、レベル2映像は、第2向上レイヤ映像として符号化される。
図6は、一実施形態によるマルチレイヤビデオの符号化されたデータを含むNALユニットを示す。
前述のように、ビットストリーム生成部18は、符号化されたマルチレイヤビデオデータ及び付加情報を含むNAL(network abstraction layer)ユニットを出力する。ビデオパラメータセット(VPS:video parameter set)は、マルチレイヤビデオに含まれたマルチレイヤ映像シーケンス3120,3130,3140に適用される情報を含む。VPSについての情報を含むNALユニットを、VPS NALユニット3110という。
VPS NALユニット3110は、マルチレイヤ映像シーケンス3120,3130,3140によって共有される共通したシンタックスエレメント(syntax element)、不要な情報の伝送を防ぐために、動作点(operation point)についての情報、プロファイル(profile)やレベルのように、セッション論議(session negotiation)段階で必要な動作点についての必須情報などを含む。特に、一実施形態によるVPS NALユニット3110には、マルチレイヤビデオでのスケーラビリティの具現のためのスケーラビリティ識別子に係わるスケーラビリティ情報が含まれる。スケーラビリティ情報は、マルチレイヤビデオに含まれたマルチレイヤ映像シーケンス3120,3130,3140に適用されるスケーラビリティを決定するための情報である。
スケーラビリティ情報は、マルチレイヤビデオに含まれたマルチレイヤ映像シーケンス3120,3120,3140に適用されるスケーラビリティ類型及びスケーラビリティ次元に係わる情報を含む。本発明の第1実施形態による符号化/復号方法において、スケーラビリティ情報は、NALユニットヘッダに含まれた階層識別子の値から直接に得られる。階層識別子は、VPSに含まれた多数のレイヤを区分するための識別子である。VPSは、各レイヤに係わる階層識別子を、VPSエクステンション(VPS extension)を介して、シグナリングすることができる。VPSの各レイヤに係わる階層識別子は、VPS NALユニットに含まれてシグナリングされる。例えば、VPSの特定レイヤに属するNALユニットの階層識別子は、VPS NALユニットに含まれる。例えば、VPSに属するNALユニットの階層識別子は、VPSエクステンション(VPS extension)を介して、シグナリングされる。従って、一実施形態による符号化/復号方法において、VPSを利用して、当該VPSに属するNALユニットのレイヤに係わるスケーラビリティ情報を、当該NALユニットの階層識別子値を利用して、得ることができる。
本発明の一実施形態によれば、レイヤ間の依存性情報、及び各レイヤの類型情報は、VPS NALユニット3110またはVPSエクステンション(VPS extension)に含まれる。
図7は、一実施形態による類型情報を利用した,参照ピクチャセット及び/または参照ピクチャリストを構成する方法を図示している。
マルチレイヤビデオ復号装置20は、複数のレイヤのうち一部レイヤ間の参照いかんを示す依存性情報(direct_dependency_flag)を獲得することができる。
例えば、マルチレイヤビデオ復号装置20は、第1レイヤが第2レイヤを参照するか否かということを示す第1依存性情報(direct_dependency_flag[1][2])を獲得することができる。また、マルチレイヤビデオ復号装置20は、第1レイヤと第3レイヤとの依存性いかんを示す第2依存性情報(direct_dependency_flag[1][3])を獲得することができる。
マルチレイヤビデオ復号装置20は、レイヤそれぞれについて、類型情報(VpsDepthFlag)を獲得することができる。マルチレイヤビデオ復号装置20は、類型情報(VpsDepthFlag)をビットストリームから獲得することができる。また、マルチレイヤビデオ復号装置20は、ビットストリームから獲得した所定情報に基づいて、類型情報(VpsDepthFlag)を誘導することができる。
マルチレイヤビデオ復号装置20は、参照リストレイヤ情報(IdRefListLayer)を生成することができる。参照リストレイヤ情報(IdRefListLayer)は、参照ピクチャセット(reference picture set)または/及び参照ピクチャリスト(referenc picture list)を生成するときに利用される情報を意味する。
例えば、マルチレイヤビデオ復号装置20は、現在映像が含まれたレイヤの参照リストレイヤ情報(IdRefListLayer)が含むレイヤに含まれたピクチャを、現在映像が含まれたレイヤの参照ピクチャセット(reference picture set)または/及び参照ピクチャリスト(referenc picture list)に含める。
マルチレイヤビデオ復号装置20は、参照リストレイヤ情報(IdRefListLayer)を、レイヤ間の依存性情報(direct_dependency_flag)、及び各レイヤの類型情報(VpsDepthFlag)が同一であるか否かということに基づいて、生成することができる。
例えば、第1レイヤが2レイヤを参照するか否かということを示す依存性情報(direct_dependency_flag)値が1であり、第1レイヤの類型情報(VpsDepthFlag[1])値と、第2レイヤの類型情報(VpsDepthFlag[2])値とが同一であるとき、マルチレイヤビデオ復号装置20は、第1レイヤの参照リストレイヤ情報(IdRefListLayer)に第2レイヤを含める。その場合、マルチレイヤビデオ復号装置20は、第1レイヤの参照ピクチャセットまたは/及び参照ピクチャリストを生成するとき、第2レイヤに含まれたピクチャを参照ピクチャセットまたは/及び参照ピクチャリストに含める。
また、例えば、第1レイヤが第2レイヤを参照するか否かということを示す依存性情報(direct_dependency_flag)値が1であり、第1レイヤの類型情報(VpsDepthFlag[1])値と、第2レイヤの類型情報(VpsDepthFlag[2])値とが異なるとき、マルチレイヤビデオ復号装置20は、第1レイヤの参照リストレイヤ情報(IdRefListLayer)に第2レイヤを含めない。その場合、マルチレイヤビデオ復号装置20は、第1レイヤの参照ピクチャセットまたは/及び参照ピクチャリストを生成するとき、第2レイヤに含まれたピクチャを、参照ピクチャセットまたは/及び参照ピクチャリストに含めない。
多様な実施形態によるマルチレイヤビデオ符号化装置10、及び多様な実施形態によるマルチレイヤビデオ復号装置20において、ビデオデータが分割されるブロックが、ツリー構造の符号化単位に分割され、符号化単位に対するインターレイヤ予測またはインター予測のために、符号化単位、予測単位、変換単位が利用される場合があるということは、前述の通りである。以下、図8ないし図20を参照し、多様な実施形態による、ツリー構造の符号化単位及び変換単位に基づいた、ビデオ符号化方法及びその装置、ビデオ復号方法及びその装置を開示する。
原則的に、マルチレイヤビデオのための符号化/復号過程において、第1レイヤ映像のための符号化/復号過程と、第2レイヤ映像のための符号化/復号過程とが別途に遂行される。すなわち、マルチレイヤビデオにおいて、インターレイヤ予測が発生する場合には、シングルレイヤビデオの符号化/復号結果が相互参照されるが、シングルレイヤビデオごとに、別途の符号化/復号過程が発生する。
従って、説明の便宜のために、図8ないし図20を参照して説明する、ツリー構造の符号化単位に基づいたビデオ符号化過程及びビデオ復号過程は、シングルレイヤビデオに係わるビデオ符号化過程及びビデオ復号過程であるので、インター予測及び動き補償について詳細に説明する。しかし、図1Aないし図7を参照して説明したように、ビデオストリーム符号化/復号のために、基本視点映像と第2レイヤ映像とのインターレイヤ予測及び補償が行われる。
従って、多様な実施形態によるマルチレイヤビデオ符号化装置10の符号化部12が、ツリー構造の符号化単位に基づいて、マルチレイヤビデオを符号化するためには、それぞれのシングルレイヤビデオごとに、ビデオ符号化を行うために、図8のビデオ符号化装置100を、マルチレイヤビデオのレイヤ個数ほど含み、各ビデオ符号化装置100ごとに割り当てられたシングルレイヤビデオの符号化を行うように制御することができる。また、マルチレイヤビデオ符号化装置10は、各ビデオ符号化装置100の別個単一視点の符号化結果を利用して、視点間予測を行うことができる。それによって、マルチレイヤビデオ符号化装置10の符号化部12は、レイヤ別に符号化結果を収録した基本視点ビデオストリームと、第2レイヤビデオストリームとを生成することができる。
それと類似して、多様な実施形態によるマルチレイヤビデオ復号装置20の復号部24が、ツリー構造の符号化単位に基づいて、マルチレイヤビデオを復号するためには、受信した第1レイヤビデオストリーム及び第2レイヤビデオストリームに対して、レイヤ別にビデオ復号を行うために、図9のビデオ復号装置200を、マルチレイヤビデオのレイヤ個数ほど含み、各ビデオ復号装置200ごとに割り当てられたシングルレイヤビデオの復号を行うように制御することができる。そして、マルチレイヤビデオ復号装置20が、各ビデオ復号装置200の別個シングルレイヤの復号結果を利用して、インターレイヤ補償を行うことができる。それによって、マルチレイヤビデオ復号装置20の復号部24は、レイヤ別に復元された第1レイヤ映像と第2レイヤ映像とを生成することができる。
図8は、本発明の一実施形態によって、ツリー構造による符号化単位に基づいたビデオ符号化装置100のブロック図を図示している。
一実施形態によって、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ符号化装置100は、符号化単位決定部120及び出力部130を含む。以下、説明の便宜のために、一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ符号化装置100は、「ビデオ符号化装置100」と縮約して呼ぶ。
符号化単位決定部120は、映像の現在ピクチャのための最大サイズの符号化単位である最大符号化単位に基づいて、現在ピクチャを区画することができる。現在ピクチャが最大符号化単位より大きければ、現在ピクチャの映像データは、少なくとも1つの最大符号化単位に分割される。多様な実施形態による最大符号化単位は、サイズ32x32,64x64,128x128,256x256のようなデータ単位であり、縦横に大きさが2の累乗である正方形のデータ単位でもある。
多様な実施形態による符号化単位は、最大サイズ及び深度で特徴づけられる。深度とは、最大符号化単位から、符号化単位が空間的に分割された回数を示し、深度が深くなるほど、深度別符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が、最上位深度であり、最小符号化単位が、最下位符号化単位と定義される。最大符号化単位は、深度が深くなるにつれ、深度別符号化単位の大きさは小さくなるので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含んでもよい。
前述のように、符号化単位の最大サイズによって、現在ピクチャの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含んでもよい。多様な実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが、深度によって階層的に分類される。
最大符号化単位の高さ及び幅を階層的に分割することができる総回数を制限する最大深度、及び符号化単位の最大サイズがあらかじめ設定されている。
符号化単位決定部120は、深度ごとに、最大符号化単位の領域が分割された少なくとも1つの分割領域を符号化し、少なくとも1つの分割領域別に最終符号化結果が出力される深度を決定する。すなわち、符号化単位決定部120は、現在ピクチャの最大符号化単位ごとに、深度別符号化単位で映像データを符号化し、最小の符号化誤差が発生する深度を選択し、最終深度として決定する。決定された最終深度及び最大符号化単位別映像データは、出力部130に出力される。
最大符号化単位内の映像データは、最大深度以下の少なくとも1つの深度によって、深度別符号化単位に基づいて符号化され、それぞれの深度別符号化単位に基づいた符号化結果が比較される。深度別符号化単位の符号化誤差の比較結果、符号化誤差が最小である深度が選択される。それぞれの最大化符号化単位ごとに、少なくとも1つの最終深度が決定される。
最大符号化単位の大きさは、深度が深くなるにつれ、符号化単位が階層的に分割されて分割され、符号化単位の個数は増加する。また、1つの最大符号化単位に含まれる同一深度の符号化単位であるとしても、それぞれのデータに係わる符号化誤差を測定し、下位深度への分割いかんが決定される。従って、1つの最大符号化単位に含まれるデータであるとしても、位置によって深度別符号化誤差が異なるので、位置によって最終深度が異なって決定されもする。従って、1つの最大符号化単位について、最終深度が1以上設定され、最大符号化単位のデータは、1以上の最終深度の符号化単位によって区画されもする。
従って、多様な実施形態による符号化単位決定部120は、現在最大符号化単位に含まれるツリー構造による符号化単位が決定される。多様な実施形態による「ツリー構造による符号化単位」は、現在最大符号化単位に含まれる全ての深度別符号化単位において、最終深度と決定された深度の符号化単位を含む。最終深度の符号化単位は、最大符号化単位内において、同一領域では、深度によって階層的に決定され、他の領域については、独立して決定される。同様に、現在領域に係わる最終深度は、他の領域に係わる最終深度と独立して決定される。
多様な実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数に係わる指標である。多様な実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの全分割回数を示すことができる。多様な実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を示すことができる。例えば、最大符号化単位の深度が0であるとするとき、最大符号化単位が1回分割された符号化単位の深度は、1に設定され、2回分割された符号化単位の深度は、2に設定される。その場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であるならば、深度0,1,2,3及び4の深度レベルが存在するので、第1最大深度は、4に設定され、第2最大深度は、5に設定される。
最大符号化単位の予測符号化及び変換が行われる。予測符号化及び変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別符号化単位を基に行われる。
最大符号化単位が深度別に分割されるたびに、深度別符号化単位の個数が増加するので、深度が深くなるにつれて生成される全ての深度別符号化単位に対して、予測符号化及び変換を含んだ符号化が行われなければならない。以下、説明の便宜のために、少なくとも1つの最大符号化単位のうち、現在深度の符号化単位を基に、予測符号化及び変換について説明する。
多様な実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位の大きさまたは形態を多様に選択することができる。映像データの符号化のためには、予測符号化、変換、エントロピー符号化などの段階を経るが、全ての段階にわたって同一データ単位が利用され、段階別にデータ単位が変更されてもよい。
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択することができる。
最大符号化単位の予測符号化のためには、多様な実施形態による最終深度の符号化単位、すなわち、それ以上分割されない符号化単位を基に予測符号化が行われる。以下、予測符号化の基盤になるそれ以上分割されない符号化単位を「予測単位」とする。予測単位が分割されたパーティションは、予測単位、並びに予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位を含んでもよい。パーティションは、符号化単位の予測単位が分割された形態のデータ単位であり、予測単位は、符号化単位と同一サイズのパーティションでもある。
例えば、サイズ2Nx2N(ただし、Nは正の整数)の符号化単位が、それ以上分割されない場合、サイズ2Nx2Nの予測単位になり、パーティションの大きさは、2Nx2N、2NxN、Nx2N、NxNなどでもある。多様な実施形態によるパーティションモードは、予測単位の高さまたは幅が対称的な比率に分割された対称的パーティションだけではなく、1:nまたはn:1のように、非対称的な比率に分割されたパーティション、幾何学的な形態に分割されたパーティション、任意的形態のパーティションなどを選択的に含んでもよい。
予測単位の予測モードは、イントラモード、インタモード及びスキップモードのうち少なくとも一つでもある。例えば、イントラモード及びインタモードは、2Nx2N,2NxN,Nx2N,NxNサイズのパーティションに対して遂行される。また、スキップモードは、2Nx2Nサイズのパーティションに対してのみ遂行される。符号化単位以内の1つの予測単位ごとに、独立して符号化が行われ、符号化誤差が最小である予測モードが選択される。
また、多様な実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位と異なるデータ単位を基に、符号化単位の映像データの変換を行うことができる。符号化単位の変換のためには、符号化単位より小さいか、あるいは同じ大きさの変換単位を基に変換が行われる。例えば、変換単位は、イントラモードのためのデータ単位、及びインタモードのための変換単位を含んでもよい。
多様な実施形態によるツリー構造による符号化単位と類似した方式で、符号化単位内の変換単位も、再帰的にさらに小サイズの変換単位に分割されながら、符号化単位のレジデュアルデータが、変換深度によって、ツリー構造による変換単位によって区画される。
多様な実施形態による変換単位についても、符号化単位の高さ及び幅が分割され、変換単位に至るまでの分割回数を示す変換深度が設定される。例えば、サイズ2Nx2Nの現在符号化単位の変換単位の大きさが2Nx2Nであるならば、変換深度0に設定さr、変換単位の大きさがNxNであるならば、変換深度1に設定され、変換単位の大きさがN/2xN/2であるならば、変換深度2に設定される。すなわち、変換単位についても、変換深度によって、ツリー構造による変換単位が設定される。
深度別分割情報は、深度だけでなく、予測関連情報及び変換関連情報が必要である。従って、符号化単位決定部120は、最小符号化誤差を発生させた深度だけではなく、予測単位をパーティションに分割したパーティションモード、予測単位別予測モード、変換のための変換単位の大きさなどを決定することができる。
多様な実施形態による最大符号化単位のツリー構造による符号化単位及び予測単位/パーティション、及び変換単位の決定方式については、図17ないし図19を参照して詳細に後述する。
符号化単位決定部120は、深度別符号化単位の符号化誤差をラグランジュ乗数(Lagrangian multiplier)基盤の率・歪曲最適化技法(rate-distortion optimization)を利用して測定することができる。
出力部130は、符号化単位決定部120で決定された少なくとも1つの深度に基づいて、符号化された最大符号化単位の映像データ及び深度別分割情報を、ビットストリーム形態で出力する。
符号化された映像データは、映像のレジデュアルデータの符号化結果でもある。
深度別分割情報は、深度情報、予測単位のパーティションモード情報、予測モード情報、変換単位の分割情報などを含んでもよい。
最終深度情報は、現在深度で符号化せず、下位深度の符号化単位で符号化するか否かということを示す深度別分割情報を利用して定義される。現在符号化単位の現在深度が深度であるならば、現在符号化単位は、現在深度の符号化単位で符号化されるので、現在深度の分割情報は、それ以上下位深度に分割されないように定義される。反対に、現在符号化単位の現在深度が、深度ではないなら下位深度の符号化単位を利用した符号化を試みなければならないので、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
現在深度が深度ではないならば、下位深度の符号化単位に分割された符号化単位に対して符号化が行われる。現在深度の符号化単位内に、下位深度の符号化単位が1以上存在するので、それぞれの下位深度の符号化単位ごとに、反復的に符号化が行われ、同一深度の符号化単位ごとに、再帰的(recursive)符号化が行われる。
1つの最大符号化単位内で、ツリー構造の符号化単位が決定され、深度の符号化単位ごとに、少なくとも1つの分割情報が決定されなければならないので、1つの最大符号化単位については、少なくとも1つの分割情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画され、位置別に深度が異なるので、データについて、深度及び分割情報が設定される。
従って、多様な実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つについて、当該深度及び符号化モードに係わる符号化情報を割り当てられる。
多様な実施形態による最小単位は、最下位深度である最小符号化単位が4分割された大きさの正方形のデータ単位である。多様な実施形態による最小単位は、最大符号化単位に含まれる全ての符号化単位、予測単位、パーティション単位及び変換単位内に含まれもよい最大サイズの正方形データ単位でもある。
例えば、出力部130を介して出力される符号化情報は、深度別符号化単位別符号化情報と、予測単位別符号化情報とに分類される。深度別符号化単位別符号化情報は、予測モード情報、パーティションサイズ情報を含んでもよい。予測単位別に伝送される符号化情報は、インタモードの推定方向についての情報、インタモードの参照映像インデックスについての情報、動きベクトルについての情報、イントラモードのクロマ成分についての情報、イントラモードの補間方式についての情報などを含んでもよい。
ピクチャ別、スライス別またはGOP別に定義される符号化単位の最大サイズについての情報、及び最大深度についての情報は、ビットストリームのヘッダ、シーケンスパラメータセットまたはピクチャパラメータセットなどに挿入される。
また、現在ビデオについて許容される変換単位の最大サイズについての情報、及び変換単位の最小サイズについての情報も、ビットストリームのヘッダ、シーケンスパラメータセットまたはピクチャパラメータセットなどを介して出力される。出力部130は、予測に係わる参照情報、動き情報、スライスタイプ情報などを符号化して出力することができる。
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別符号化単位は、1階層上位深度の符号化単位の高さ及び幅を半分にした大きさの符号化単位である。すなわち、現在深度の符号化単位の大きさが2Nx2Nであるならば、下位深度の符号化単位の大きさは、NxNである。また、2Nx2Nサイズの現在符号化単位は、NxNサイズの下位深度符号化単位を最大4個含んでもよい。
従って、ビデオ符号化装置100は、現在ピクチャの特性を考慮して決定された最大符号化単位の大きさ及び最大深度を基に、それぞれの最大符号化単位ごとに、最適の形態及び大きさの符号化単位を決定し、ツリー構造による符号化単位を構成することができる。また、それぞれの最大符号化単位ごとに、多様な予測モード、変換方式などによって符号化することができるので、多様な映像サイズの符号化単位の映像特性を考慮して最適の符号化モードが決定される。
従って、映像の解像度が非常に高いか、あるいはデータ量が非常に多い映像を、既存マクロブロック単位に符号化するならば、ピクチャ当たりマクロブロックの数が過度に多くなる。それによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下するという傾向がある。従って、多様な実施形態によるビデオ符号化装置は、映像の大きさを考慮し、符号化単位の最大サイズを増大させながら、映像特性を考慮して符号化単位を調節することができるので、映像圧縮効率が上昇する。
図1Aを参照して説明したマルチレイヤビデオ符号化装置10は、マルチレイヤビデオのレイヤごとに、シングルレイヤ映像の符号化のために、レイヤ個数ほどのビデオ符号化装置100を含んでもよい。
ビデオ符号化装置100が第1レイヤ映像を符号化する場合、符号化単位決定部120は、最大符号化単位ごとに、ツリー構造による符号化単位別に、映像間予測のための予測単位を決定し、予測単位ごとに映像間予測を行うことができる。
ビデオ符号化装置100が第2レイヤ映像を符号化する場合にも、符号化単位決定部120は、最大符号化単位ごとに、ツリー構造による符号化単位及び予測単位を決定し、予測単位ごとにインター予測を行うことができる。
ビデオ符号化装置100は、第1レイヤ映像と第2レイヤ映像との輝度差を補償するために、輝度差を符号化することができる。ただし、符号化単位の符号化モードによって、輝度遂行いかんが決定される。例えば、サイズ2Nx2Nの予測単位に対してのみ輝度補償が行われる。
図9は、多様な実施形態による、ツリー構造による符号化単位に基づいたビデオ復号装置200のブロック図を図示している。
一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ復号装置200は、受信部210、映像データ及び符号化情報抽出部220及び映像データ復号部230を含む。以下、説明の便宜のために、一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ復号装置200は、「ビデオ復号装置200」と縮約して呼ぶ。
多様な実施形態によるビデオ復号装置200の復号動作のための符号化単位、深度、予測単位、変換単位、各種分割情報など各種用語の定義は、図8及びビデオ符号化装置100を参照して説明したところと同一である。
受信部210は、符号化されたビデオに対するビットストリームを受信してパージングする。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位によって符号化単位ごとに符号化された映像データを抽出し、映像データ復号部230に出力する。映像データ及び符号化情報抽出部220は、現在ピクチャに係わるヘッダ、シーケンスパラメータセットまたはピクチャパラメータセットから、現在ピクチャの符号化単位の最大サイズについての情報を抽出することができる。
また、映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位に係わる最終深度及び分割情報を抽出する。抽出された最終深度及び分割情報は、映像データ復号部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割し、映像データ復号部230が、最大符号化単位ごとに、映像データを復号させる。
最大符号化単位別深度及び分割情報は、1以上の深度情報に対して設定され、深度別分割情報は、当該符号化単位のパーティションモード情報、予測モード情報及び変換単位の分割情報などを含んでもよい。また、深度情報として、深度別分割情報が抽出されてもよい。
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別深度及び分割情報は、多様な実施形態によるビデオ符号化装置100のように符号化端で、最大符号化単位別深度別符号化単位ごとに反復的に符号化を行い、最小符号化誤差を発生させると決定された深度及び分割の情報である。従って、ビデオ復号装置200は、最小符号化誤差を発生させる符号化方式によって、データを復号して映像を復元することができる。
多様な実施形態による深度及び符号化モードに係わる符号化情報は、当該符号化単位、予測単位及び最小単位のうち所定データ単位に対して割り当てられているので、映像データ及び符号化情報抽出部220は、所定データ単位別に、深度及び分割情報を抽出することができる。所定データ単位別に、当該最大符号化単位の深度及び分割情報が記録されているならば、同一深度及び分割情報を有している所定データ単位は、同一最大符号化単位に含まれるデータ単位と類推される。
映像データ復号部230は、最大符号化単位別深度及び分割情報に基づいて、それぞれの最大符号化単位の映像データを復号し、現在ピクチャを復元する。すなわち、映像データ復号部230は、最大符号化単位に含まれるツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、判読されたパーティションモード、予測モード、変換単位に基づいて、符号化された映像データを復号することができる。復号過程は、イントラ予測及び動き補償を含む予測過程及び逆変換過程を含んでもよい。
映像データ復号部230は、深度別符号化単位の予測単位のパーティションモード情報及び予測モード情報に基づいて、符号化単位ごとに、それぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行うことができる。
また、映像データ復号部230は、最大符号化単位別逆変換のために、符号化単位別に、ツリー構造による変換単位情報を判読し、符号化単位ごとに、変換単位に基づいた逆変換を行うことができる。逆変換を介して、符号化単位の空間領域の画素値が復元される。
映像データ復号部230は、深度別分割情報を利用して、現在最大符号化単位の深度を決定することができる。もし分割情報が現在深度において、それ以上分割されないということを示しているならば、現在深度が深度である。従って、映像データ復号部230は、現在最大符号化単位の映像データについて、現在深度の符号化単位を、予測単位のパーティションモード、予測モード及び変換単位サイズ情報を利用して、復号することができる。
すなわち、符号化単位、予測単位及び最小単位のうち所定データ単位に対して設定されている符号化情報を観察し、同一分割情報を含んだ符号化情報を保有しているデータ単位が集まり、映像データ復号部230によって、同一符号化モードで復号する1つのデータ単位と見なされる。かように決定された符号化単位ごとに、符号化モードに係わる情報を獲得し、現在符号化単位の復号が行われる。
図2Aを参照して説明したマルチレイヤビデオ復号装置20は、受信された第1レイヤ映像ストリーム及び第2レイヤ映像ストリームを復号し、第1レイヤ映像及び第2レイヤ映像を復元するために、ビデオ復号装置200を視点個数ほど含んでもよい。
第1レイヤ映像ストリームが受信された場合には、ビデオ復号装置200の映像データ復号部230は、抽出部220によって、第1レイヤ映像ストリームから抽出された第1レイヤ映像のサンプルを、最大符号化単位のツリー構造による符号化単位に分けることができる。映像データ復号部230は、第1レイヤ映像のサンプルのツリー構造による符号化単位ごとに、映像間予測のための予測単位別に動き補償を行い、第1レイヤ映像を復元することができる。
第2レイヤ映像ストリームが受信された場合には、ビデオ復号装置200の映像データ復号部230は、抽出部220によって、第2レイヤ映像ストリームから抽出された第2レイヤ映像のサンプルを、最大符号化単位のツリー構造による符号化単位に分けることができる。映像データ復号部230は、第2レイヤ映像のサンプルの符号化単位ごとに、映像間予測のための予測単位別に動き補償を行い、第2レイヤ映像を復元することができる。
抽出部220は、第1レイヤ映像と第2レイヤ映像との輝度差を補償するために、輝度誤差に係わる情報をビットストリームから獲得することができる。ただし、符号化単位の符号化モードによって、輝度遂行いかんが決定される。例えば、サイズ2Nx2Nの予測単位に対してのみ輝度補償が行われる。
結局、ビデオ復号装置200は、符号化過程において、最大符号化単位ごとに再帰的に符号化を行い、最小符号化誤差を発生させた符号化単位に係わる情報を獲得し、現在ピクチャに係わる復号に利用することができる。すなわち、最大符号化単位ごとに、最適符号化単位と決定されたツリー構造による符号化単位の符号化された映像データの復号が可能になる。
従って、高い解像度の映像、またはデータ量が過度に多い映像でも、符号化端から伝送された最適分割情報を利用して、映像の特性に適応的に決定された符号化単位の大きさ及び符号化モードによって、効率的に映像データを復号して復元することができる。
図10は、多様な実施形態による符号化単位の概念を図示している。
符号化単位の例は、符号化単位の大きさは、幅x高さで表現され、サイズ64x64である符号化単位から、サイズ32x32,16x16,8x8を含んでもよい。サイズ64x64の符号化単位は、サイズ64x64,64x32,32x64,32x32のパーティションに分割され、サイズ32x32の符号化単位は、サイズ32x32,32x16,16x32,16x16のパーティションに分割され、サイズ16x16の符号化単位は、サイズ16x16,16x8,8x16,8x8のパーティションに分割され、サイズ8x8の符号化単位は、サイズ8x8,8x4,4x8,4x4のパーティションに分割される。
ビデオデータ310については、解像度が1920x1080に設定され、符号化単位の最大サイズが64に設定され、最大深度が2に設定されている。ビデオデータ320については、解像度が1920x1080に設定され、符号化単位の最大サイズが64に設定され、最大深度が3に設定されている。ビデオデータ330については、解像度が352x288に設定され、符号化単位の最大サイズが16に設定され、最大深度が1に設定されている。図10に図示された最大深度は、最大符号化単位から最小符号化単位までの全分割回数を示す。
解像度が高いか、あるいはデータ量が多い場合、符号化効率の向上だけではなく、映像特性を正確に反映させるために、符号化サイズの最大サイズが相対的に大きいことが望ましい。従って、ビデオデータ330に比べ、解像度が高いビデオデータ310,320は、符号化サイズの最大サイズが64に選択される。
ビデオデータ310の最大深度が2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64である最大符号化単位から、2回分割されて深度が2階層深くなり、長軸サイズが32、16である符号化単位まで含んでもよい。一方、ビデオデータ330の最大深度が1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16である符号化単位から、1回分割されて深度が1階層深くなり、長軸サイズが8である符号化単位まで含んでもよい。
ビデオデータ320の最大深度が3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、3回分割されて深度が3階層深くなり、長軸サイズが32、16、8である符号化単位まで含んでもよい。深度が深くなるほど、細部情報の表現能が向上する。
図11は、多様な実施形態による、符号化単位に基づいた映像符号化部400のブロック図を図示している。
多様な実施形態による映像符号化部400は、ビデオ符号化装置100のピクチャ符号化部120において、映像データを符号化するのに経る作業を遂行する。すなわち、イントラ予測部420は、現在映像405において、イントラモードの符号化単位に対して予測単位別にイントラ予測を行い、インター予測部415は、インターモードの符号化単位に対して、予測単位別に現在映像405及び復元ピクチャバッファ410から獲得された参照映像を利用して、インター予測を行う。現在映像405は、最大符号化単位に分割された後、順次にエンコーディングが行われる。このとき、最大符号化単位がツリー構造に分割される符号化単位に対して、エンコーディングを行う。
イントラ予測部420またはインター予測部415から出力された各モードの符号化単位に係わる予測データを、現在映像405のエンコーディングされる符号化単位に係わるデータから取り除くことによってレジデューデータを生成し、レジデューデータは、変換部425及び量子化部430を経て、変換単位別に量子化された変換係数として出力される。量子化された変換係数は、逆量子化部445、逆変換部450を介して、空間領域のレジデューデータに復元される。復元された空間領域のレジデューデータは、イントラ予測部420またはインター予測部415から出力された各モードの符号化単位に係わる予測データと加えられることにより、現在映像405の符号化単位に係わる空間領域のデータに復元される。復元された空間領域のデータは、デブロッキング部455及びSAO遂行部460を経て復元映像に生成される。生成された復元映像は、復元ピクチャバッファ410に保存される。復元ピクチャバッファ410に保存された復元映像は、他の映像のインター予測のための参照映像として利用される。変換部425及び量子化部430で量子化された変換係数は、エントロピー符号化部435を経て、ビットストリーム440として出力される。
多様な実施形態による映像符号化部400が、ビデオ符号化装置100に適用されるために、映像符号化部400の構成要素である、インター予測部415、イントラ予測部420、変換部425、量子化部430、エントロピー符号化部435、逆量子化部445、逆変換部450、デブロッキング部455及びSAO遂行部460が、最大符号化単位ごとに、ツリー構造による符号化単位のうちそれぞれの符号化単位に基づいた作業を遂行することができる。
特に、イントラ予測部420及びインター予測部415は、現在最大符号化単位の最大サイズ及び最大深度を考慮し、ツリー構造による符号化単位のうちそれぞれの符号化単位のパーティションモード及び予測モードを決定し、変換部425は、ツリー構造による符号化単位のうちそれぞれの符号化単位内の四分木(quadtree)による変換単位の分割いかんを決定することができる。
図12は、多様な実施形態による、符号化単位に基づいた映像復号部500のブロック図を図示している。
エントロピー復号部515は、ビットストリーム505から、復号対象である符号化された映像データ、及び復号のために必要な符号化情報をパージングする。符号化された映像データは、量子化された変換係数であり、逆量子化部520及び逆変換部525は、量子化された変換係数からレジデューデータを復元する。
イントラ予測部540は、イントラモードの符号化単位に対して、予測単位別に、イントラ予測を行う。インター予測部535は、現在映像のうちインターモードの符号化単位に対して、予測単位別に、復元ピクチャバッファ530から獲得された参照映像を利用してインター予測を行う。
イントラ予測部540またはインター予測部535を経た各モードの符号化単位に係わる予測データと、レジデューデータとが加えられることにより、現在映像405の符号化単位に係わる空間領域のデータが復元され、復元された空間領域のデータは、デブロッキング部545及びSAO遂行部550を経て、復元映像560として出力される。また、復元ピクチャバッファ530に保存された復元映像は、参照映像として出力される。
ビデオ復号装置200のピクチャ復号部230において、映像データを復号するために、多様な実施形態による映像復号部500のエントロピー復号部515以後の段階別作業が遂行される。
映像復号部500が、多様な実施形態によるビデオ復号装置200に適用されるために、映像復号部500の構成要素である、エントロピー復号部515、逆量子化部520、逆変換部525、イントラ予測部540、インター予測部535、デブロッキング部545及びSAO遂行部550が、最大符号化単位ごとに、ツリー構造による符号化単位のうちそれぞれの符号化単位に基づいて作業を遂行することができる。
特に、イントラ予測部540及びインター予測部535は、ツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、パーティションモード及び予測モードを決定し、逆変換部525は、符号化単位ごとに、四分木構造による変換単位の分割いかんを決定することができる。
図11の符号化動作、及び図12の復号動作は、それぞれ単一レイヤでのビデオストリーム符号化動作及び復号動作について詳細に説明したものである。従って、図1Aの符号化部12が2層以上のレイヤのビデオストリームを符号化するならば、レイヤ別に映像符号化部400を含んでもよい。類似して、図2Aの復号部24が2層以上のレイヤのビデオストリームを復号するならば、レイヤ別に映像復号部500を含んでもよい。
図13は、多様な実施形態による、深度別符号化単位及びパーティションを図示している。
多様な実施形態による、ビデオ符号化装置100、及び多様な実施形態によるビデオ復号装置200は、映像特性を考慮するために、階層的な符号化単位を利用する。符号化単位の最大高及び最大幅、最大深度は、映像の特性によって適応的に決定され、ユーザの要求によって、多様に設定されてもよい。既設定の符号化単位の最大サイズによって、深度別符号化単位の大きさが決定される。
多様な実施形態による符号化単位の階層構造600は、符号化単位の最大高及び最大幅が64であり、最大深度が3である場合を図示している。このとき、最大深度は、最大符号化単位から最小符号化単位までの全分割回数を示す。多様な実施形態による符号化単位の階層構造600の縦軸に沿って深度が深くなるので、深度別符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別符号化単位の予測符号化の基盤になる予測単位及びパーティションが図示されている。
すなわち、符号化単位610は、符号化単位の階層構造600において最大符号化単位であって、深度が0であり、符号化単位の大きさ、すなわち、高さ及び幅が64x64である。縦軸に沿って深度が深くなり、サイズ32x32である深度1の符号化単位620、サイズ16x16である深度2の符号化単位630、サイズ8x8である深度3の符号化単位640が存在する。サイズ8x8である深度3の符号化単位640は、最小符号化単位である。
それぞれの深度別に横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64x64の符号化単位610が予測単位であるならば、予測単位は、サイズ64x64の符号化単位610に含まれるサイズ64x64のパーティション610、サイズ64x32のパーティション612、サイズ32x64のパーティション614、サイズ32x32のパーティション616に分割される。
同様に、深度1のサイズ32x32の符号化単位620の予測単位は、サイズ32x32の符号化単位620に含まれるサイズ32x32のパーティション620、サイズ32x16のパーティション622、サイズ16x32のパーティション624、サイズ16x16のパーティション626に分割される。
同様に、深度2のサイズ16x16の符号化単位630の予測単位は、サイズ16x16の符号化単位630に含まれるサイズ16x16のパーティション630、サイズ16x8のパーティション632、サイズ8x16のパーティション634、サイズ8x8のパーティション636に分割される。
同様に、深度3のサイズ8x8の符号化単位640の予測単位は、サイズ8x8の符号化単位640に含まれるサイズ8x8のパーティション640、サイズ8x4のパーティション642、サイズ4x8のパーティション644、サイズ4x4のパーティション646に分割される。
多様な実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の深度を決定するために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに符号化を行わなければならない。
同一範囲及び同一サイズのデータを含むための深度別符号化単位の個数は、深度が深くなるほど、深度別符号化単位の個数も増加する。例えば、深度1の符号化単位一つを含むデータについて、深度2の符号化単位は、四つが必要である。従って、同一データの符号化結果を深度別に比較するために、1つの深度1の符号化単位、及び4つの深度2の符号化単位を利用して、それぞれ符号化されなければならない。
それぞれの深度別符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別符号化単位の予測単位ごとに符号化を行い、当該深度において最小の符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って深度が深くなり、それぞれの深度ごとに符号化を行い、深度別代表符号化誤差を比較し、最小符号化誤差が検索される。最大符号化単位610において、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の深度及びパーティションモードに選択される。
図14は、多様な実施形態による、符号化単位及び変換単位の関係を図示している。
多様な実施形態によるビデオ符号化装置100、または多様な実施形態によるビデオ復号装置200は、最大符号化単位ごとに、最大符号化単位より小さいか、あるいは同じ大きさの符号化単位で映像を符号化したり復号したりする。符号化過程において、変換のための変換単位の大きさは、それぞれの符号化単位ほど大きくないデータ単位を基に選択される。
例えば、多様な実施形態によるビデオ符号化装置100、または多様な実施形態によるビデオ復号装置200において、現在符号化単位710が64x64サイズであるとき、32x32サイズの変換単位720を利用して変換が行われる。
また、64x64サイズの符号化単位710のデータを、64x64サイズ以下の32x32,16x16,8x8,4x4サイズの変換単位でそれぞれ変換を行って符号化した後、原本との誤差が最小である変換単位が選択される。
図15は、多様な実施形態による符号化情報を図示している。
多様な実施形態によるビデオ符号化装置100の出力部130は、分割情報として、それぞれの深度の符号化単位ごとに、パーティションモードについての情報800、予測モードについての情報810、変換単位サイズに係わる情報820を符号化して伝送することができる。
パーティションモードに係わる情報800は、現在符号化単位の予測符号化のためのデータ単位であり、現在符号化単位の予測単位が分割されたパーティションの形態に係わる情報を示す。例えば、サイズ2Nx2Nの現在符号化単位CU_0は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806、サイズNxNのパーティション808のうちいずれか1つのタイプに分割されて利用される。その場合、現在符号化単位のパーティションモードについての情報800は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806及びサイズNxNのパーティション808のうち一つを示すように設定される。
予測モードについての情報810は、それぞれのパーティションの予測モードを示す。例えば、予測モードについての情報810を介して、パーティションモードについての情報800が示すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち一つで予測符号化が行われるかということが設定される。
また、変換単位サイズについての情報820は、現在符号化単位をいかなる変換単位を基に変換を行うかということを示す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インター変換単位サイズ826、第2インター変換単位サイズ828のうち一つである。
多様な実施形態によるビデオ復号装置200の映像データ及び符号化情報抽出部210は、それぞれの深度別符号化単位ごとに、パーティションモードについての情報800、予測モードについての情報810、変換単位サイズに係わる情報820を抽出し、復号に利用することができる。
図16は、多様な実施形態による深度別符号化単位を図示している。
深度の変化を示すために、分割情報が利用される。該分割情報は、現在深度の符号化単位が、下位深度の符号化単位に分割されるか否かということをを示す。
深度0及び2N_0x2N_0サイズの符号化単位900の予測符号化のための予測単位910は、2N_0x2N_0サイズのパーティションモード912、2N_0xN_0サイズのパーティションモード914、N_0x2N_0サイズのパーティションモード916、N_0xN_0サイズのパーティションモード918を含んでもよい。予測単位が対称的な比率に分割されたパーティション912,914,916,918だけが例示されているが、前述のように、パーティションモードは、それに限定されるものではなく、非対称的パーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含んでもよい。
パーティションモードごとに、1つの2N_0x2N_0サイズのパーティション、2つの2N_0xN_0サイズのパーティション、2つのN_0x2N_0サイズのパーティション、4つのN_0xN_0サイズのパーティションごとに、反復的に予測符号化が行われなければならない。サイズ2N_0x2N_0、サイズN_0x2N_0、サイズ2N_0xN_0及びサイズN_0xN_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ2N_0x2N_0のパーティションについてのみ予測符号化が行われる。
サイズ2N_0x2N_0、2N_0xN_0及びN_0x2N_0のパーティションモード912,914,916のうち一つによる符号化誤差が最小であるならば、それ以上下位深度に分割される必要はない。
サイズN_0xN_0のパーティションモード918による符号化誤差が最小であるならば、深度0を1に変更しながら分割され(920)、深度2及びサイズN_0xN_0のパーティションモードの符号化単位930に対して反復的に符号化を行い、最小符号化誤差を検索していく。
深度1及びサイズ2N_1x2N_1(=N_0xN_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1x2N_1のパーティションモード942、サイズ2N_1xN_1のパーティションモード944、サイズN_1x2N_1のパーティションモード946、サイズN_1xN_1のパーティションモード948を含んでもよい。
また、サイズN_1xN_1のパーティションモード948による符号化誤差が最小であるならば、深度1を深度2に変更しながら分割され(950)、深度2及びサイズN_2xN_2の符号化単位960に対して反復的に符号化を行い、最小符号化誤差を検索していく。
最大深度がdである場合、深度別符号化単位は、深度d−1であるまで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2から分割され(970)、深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)x2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)x2N_(d−1)のパーティションモード992、サイズ2N_(d−1)xN_(d−1)のパーティションモード994、サイズN_(d−1)x2N_(d−1)のパーティションモード996、サイズN_(d−1)xN_(d−1)のパーティションモード998を含んでもよい。
パーティションモードのうち、1つのサイズ2N_(d−1)x2N_(d−1)のパーティション、2つのサイズ2N_(d−1)xN_(d−1)のパーティション、2つのサイズN_(d−1)x2N_(d−1)のパーティション、4つのサイズN_(d−1)xN_(d−1)のパーティションごとに、反復的に予測符号化を介した符号化が行われ、最小符号化誤差が発生するパーティションモードが検索される。
サイズN_(d−1)xN_(d−1)のパーティションモード998による符号化誤差が最小であるとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、それ以上下位深度への分割過程を経ず、現在最大符号化単位900に対する深度が深度d−1に決定され、パーティションモードは、N_(d−1)xN_(d−1)に決定される。また、最大深度がdであるので、深度d−1の符号化単位980に対して、分割情報は設定されない。
データ単位999は、現在最大符号化単位に対する「最小単位」とされる。多様な実施形態による最小単位は、最下位深度である最小符号化単位が4分割された大きさの正方形のデータ単位でもある。かような反復的符号化過程を介して、多様な実施形態によるビデオ符号化装置100は、符号化単位900の深度別符号化誤差を比較し、最小符号化誤差が発生する深度を選択して深度を決定し、当該パーティションモード及び予測モードが深度の符号化モードと設定される。
かように、深度0,1,…,d−1,dの全ての深度別最小符号化誤差を比較し、誤差が最小である深度が選択されて深度に決定される。深度、並びに予測単位のパーティションモード及び予測モードは、分割情報として符号化されて伝送される。また、深度0から深度に至るまで符号化単位が分割されなければならないので、深度の分割情報だけが「0」に設定され、深度を除いた深度別分割情報は、「1」に設定されなければならない。
多様な実施形態によるビデオ復号装置200の映像データ及び符号化情報抽出部220は、符号化単位900に係わる深度及び予測単位についての情報を抽出し、符号化単位912の復号に利用することができる。多様な実施形態によるビデオ復号装置200は、深度別分割情報を利用して、分割情報が「0」である深度を深度と把握し、当該深度に係わる分割情報を利用して、復号に利用することができる。
図17、図18及び図19は、多様な実施形態による、符号化単位、予測単位及び変換単位の関係を図示している。
符号化単位1010は、最大符号化単位に対して、多様な実施形態によるビデオ符号化装置100が決定した深度別符号化単位である。予測単位1060は、符号化単位1010において、それぞれの深度別符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの深度別符号化単位の変換単位である。
深度別符号化単位1010は、最大符号化単位の深度が0であるとすれば、符号化単位1012,1054は、深度が1であり、符号化単位1014,1016,1018、1028,1050,1052は、深度が2であり、符号化単位1020,1022,1024,1026,1030,1032,1048は、深度が3であり、符号化単位1040,1042,1044,1046は、深度が4である。
予測単位1060のうち一部パーティション1014,1016,1022,1032,1048,1050,1052,1054は、符号化単位が分割された形態である。すなわち、パーティション1014,1022,1050,1054は、2NxNのパーティションモードであり、パーティション1016,1048,1052は、Nx2Nのパーティションモードであり、パーティション1032は、NxNのパーティションモードである。深度別符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位より小さいか、あるいはそれと同じである。
変換単位1070のうち一部変換単位1052の映像データについては、符号化単位に比べ、小サイズのデータ単位で変換または逆変換が行われる。また、変換単位1014,1016,1022,1032,1048,1050,1052,1054は、予測単位1060のうち当該予測単位及びパーティションと比較すればと、互いに異なる大きさまたは形態のデータ単位である。すなわち、多様な実施形態によるビデオ符号化装置100、及び一実施形態に他のビデオ復号装置200は、同一符号化単位に対するイントラ予測/動き推定/動き補償作業、及び変換/逆変換作業であるとしても、それぞれ別個のデータ単位を基に遂行する。
それによって、最大符号化単位ごとに、領域別に、階層的な構造の符号化単位ごとに、再帰的に符号化が行われ、最適符号化単位が決定されることにより、再帰的ツリー構造による符号化単位が構成される。符号化情報は、符号化単位に係わる分割情報、パーティションモード情報、予測モード情報、変換単位サイズ情報を含んでもよい。以下、表1は、多様な実施形態によるビデオ符号化装置100、及び多様な実施形態によるビデオ復号装置200で設定することができる一例を示している。
多様な実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位に係わる符号化情報を出力し、多様な実施形態によるビデオ復号装置200の符号化情報抽出部220は、受信されたビットストリームから、ツリー構造による符号化単位に係わる符号化情報を抽出することができる。
分割情報は、現在符号化単位が、下位深度の符号化単位に分割されるか否かということをを示す。現在深度dの分割情報が0であるならば、現在符号化単位が、現在符号化単位が下位符号化単位にそれ以上分割されない深度が深度であるので、深度に対してパーティションモード情報、予測モード、変換単位サイズ情報が定義される。分割情報によって、さらに1段階分割されなければならない場合には、分割された4個の下位深度の符号化単位ごとに、独立して符号化が行われなければならない。
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで示すことができる。イントラモード及びインターモードは、全てのパーティションモードでもって定義され、スキップモードは、パーティションモード2Nx2Nでもってのみ定義される。
パーティションモード情報は、予測単位の高さまたは幅が対称的な比率に分割された対称的パーティションモード2Nx2N,2NxN,Nx2N及びNxNと、非対称的な比率に分割された非対称的パーティションモード2NxnU,2NxnD,nLx2N,nRx2Nとを示すことができる。非対称的パーティションモード2NxnU及び2NxnDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的パーティションモードnLx2N及びnRx2Nは、それぞれ幅が1:3及び3:1に分割された形態を示す。
変換単位サイズは、イントラモードで、二種の大きさ、インターモードで、二種の大きさに設定される。すなわち、変換単位分割情報が0であるならば、変換単位の大きさは、現在符号化単位のサイズ2Nx2Nに設定される。変換単位分割情報が1であるならば、現在符号化単位が分割された大きさの変換単位が設定される。また、サイズ2Nx2Nである現在符号化単位に係わるパーティションモードが対称形パーティションモードであるならば、変換単位の大きさは、NxNに設定され、非対称形パーティションモードであるならば、N/2xN/2に設定される。
多様な実施形態によるツリー構造による符号化単位の符号化情報は、深度の符号化単位、予測単位及び最小単位単位のうち少なくとも一つに対して割り当てられる。深度の符号化単位は、同一符号化情報を保有している予測単位及び最小単位を1以上含んでもよい。
従って、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一深度の符号化単位に含まれるか否かということが確認される。また、データ単位が保有している符号化情報を利用すれば、当該深度の符号化単位を確認することができるので、最大符号化単位内の深度の分布が類推される。
従って、その場合、現在符号化単位が周辺データ単位を参照して予測する場合、現在符号化単位に隣接する深度別符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
他の実施形態において、現在符号化単位が周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別符号化単位の符号化情報を利用して、深度別符号化単位内において、現在符号化単位に隣接するデータが検索されることにより、周辺符号化単位が参照される。
図20は、表1の符号化モード情報による、符号化単位、予測単位及び変換単位の関係を図示している。
最大符号化単位1300は、深度の符号化単位1302,1304,1306,1312,1314,1316,1318を含む。このうち1つの符号化単位1318は、深度の符号化単位であるので、分割情報が0に設定される。サイズ2Nx2Nの符号化単位1318のパーティションモード情報は、パーティションモード2Nx2N 1322,2NxN 1324,Nx2N 1326,NxN 1328,2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定される。
変換単位分割情報TU size flagは、変換インデックスの一種であり、変換インデックスに対応する変換単位の大きさは、符号化単位の予測単位タイプまたはパーティションモードによって変更される。
例えば、パーティションモード情報が、対称形パーティションモード2Nx2N 1322,2NxN 1324,Nx2N 1326及びNxN1328のうち一つに設定されている場合、変換単位分割情報が0であるならば、サイズ2Nx2Nの変換単位1342が設定され、変換単位分割情報が1であるならば、サイズNxNの変換単位1344が設定される。
パーティションモード情報が、非対称形パーティションモード2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定された場合、変換単位分割情報TU size flagが0であるならば、サイズ2Nx2Nの変換単位1352が設定され、変換単位分割情報が1であるならば、サイズN/2xN/2の変換単位1354が設定される。
図20を参照して説明した変換単位分割情報TU size flagは、0または1の値を有するフラグであるが、多様な実施形態による変換単位分割情報は、1ビットのフラグに限定されるものではなく、設定によって、0、1、2、3、…などに増加し、変換単位が階層的に分割されてもよい。変換単位分割情報は、変換インデックスの一実施形態として利用される。
その場合、多様な実施形態による変換単位分割情報を、変換単位の最大サイズ、変換単位の最小サイズと共に利用すれば、実際に利用された変換単位の大きさが表現される。多様な実施形態によるビデオ符号化装置100は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を符号化することができる。符号化された最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報は、SPSに挿入される。多様な実施形態によるビデオ復号装置200は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を利用して、ビデオ復号に利用することができる。
例えば、(a)現在符号化単位がサイズ64x64であり、最大変換単位サイズが32x32であるならば、(a−1)変換単位分割情報が0であるとき、変換単位の大きさは、32x32に設定され、(a−2)変換単位分割情報が1であるとき、変換単位の大きさは、16x16に設定され、(a−3)変換単位分割情報が2であるとき、変換単位の大きさは、8x8に設定される。
他の例として、(b)現在符号化単位がサイズ32x32であり、最小変換単位サイズが32x32であるならば、(b−1)変換単位分割情報が0であるとき、変換単位の大きさは、32x32に設定され、変換単位の大きさは、32x32より小さいことがないので、それ以上の変換単位分割情報が設定されることがない。
さらに他の例として、(c)現在符号化単位がサイズ64x64であり、最大変換単位分割情報が1であるならば、変換単位分割情報は、0または1であり、他の変換単位分割情報が設定されることがない。
従って、最大変換単位分割情報を「MaxTransformSizeIndex」と定義し、最小変換単位サイズを「MinTransformSize」と定義し、変換単位分割情報が0である場合の変換単位サイズを「RootTuSize」と定義するとき、現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」は、下記数式(1)のように定義される。
CurrMinTuSize
=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) (1)
現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」と比較し、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、システム上採択可能な最大変換単位サイズを示すことができる。すなわち、数式1によれば、「RootTuSize/(2^MaxTransformSizeIndex)」は、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」を最大変換単位分割情報に相応する回数ほど分割した変換単位サイズであり、「MinTransformSize」は、最小変換単位サイズであるので、それらのうち小さい値が、現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」でもある。
多様な実施形態による最大変換単位サイズ「RootTuSize」は、予測モードによって異なる。
例えば、現在予測モードがインターモードであるならば、「RootTuSize」は、下記数式(2)によって決定される。数式(2)において、「MaxTransformSize」は、最大変換単位サイズを示し、「PUSize」は、現在予測単位サイズを示す。
RootTuSize=min(MaxTransformSize,PUSize) (2)
すなわち、現在予測モードがインターモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在予測単位サイズのうち小さい値に設定される。
現在パーティション単位の予測モードがイントラモードであるならば、「RootTuSize」は、下記数式(3)によって決定される。「PartitionSize」は、現在パーティション単位の大きさを示す。
RootTuSize=min(MaxTransformSize,PartitionSize) (3)
すなわち、現在予測モードがイントラモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在パーティション単位サイズのうち小さい値に設定される。
ただし、パーティション単位の予測モードによって変動する多様な実施形態による現在最大変換単位サイズ「RootTuSize」は、一実施形態であるのみ、現在最大変換単位サイズを決定する要因は、それに限定されるものではないということに留意しなければならない。
図8ないし図20を参照して説明したツリー構造の符号化単位に基づいたビデオ符号化技法によって、ツリー構造の符号化単位ごとに、空間領域の映像データが符号化され、ツリー構造の符号化単位に基づいたビデオ復号技法によって、最大符号化単位ごとに復号が行われながら、空間領域の映像データが復元され、ピクチャ及びピクチャシーケンスであるビデオが復元される。復元されたビデオは、再生装置によって再生されるか、保存媒体に保存されるか、あるいはネットワークを介して伝送される。
一方、前述の本発明の実施形態は、コンピュータで実行されるプログラムによって作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。前記コンピュータで読み取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM(read only memory)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD(compact disc)−ROM、DVD(digital versatile disc)など)のような記録媒体を含む。
説明の便宜のために、先に図1Aないし図20を参照して説明したインターレイヤビデオ符号化方法及び/またはビデオ符号化方法は、「本発明のビデオ符号化方法」と総称する。また、先に図1Aないし図20を参照して説明したインターレイヤビデオ復号方法及び/またはビデオ復号方法は、「本発明のビデオ復号方法」と呼ぶ。
また、先に図1Aないし図20を参照して説明したマルチレイヤビデオ符号化装置10、ビデオ符号化装置100、または映像符号化部400で構成されたビデオ符号化装置は、「本発明のビデオ符号化装置」と総称する。また、先に図1Aないし図20を参照して説明したマルチレイヤビデオ復号装置20、ビデオ復号装置200、または映像復号部500で構成されたビデオ復号装置は、「本発明のビデオ復号装置」と総称する。
多様な実施形態によるプログラムが保存されるコンピュータで判読可能な記録媒体がディスク26000である実施形態について、以下で詳細に説明する。
図21は、多様な実施形態による、プログラムが保存されたディスク26000の物理的構造を例示している。記録媒体として説明されたディスク26000は、ハードドライブ、CD−ROMディスク、ブルーレイ(登録商標(Blu-ray)ディスク、DVDディスクでもある。ディスク26000は、多数の同心円のトラックTrから構成され、トラックTrは、円周方向に沿って、所定個数のセクタSeに分割される。前述の多様な実施形態によるプログラムを保存するディスク26000において特定領域に、前述の量子化パラメータ決定方法、ビデオ符号化方法及びビデオ復号方法を具現するためのプログラムが割り当てられて保存される。
前述のデオ符号化方法及びビデオ復号方法を具現するためのプログラムを保存する記録媒体を利用して達成されたコンピュータシステムについて、図22を参照して説明する。
図22は、ディスク26000を利用して、プログラムを記録して判読するためのディスクドライブ26800を図示している。コンピュータシステム26700は、ディスクドライブ26800を利用して、本発明のビデオ符号化方法及びビデオ復号方法のうち少なくとも一つを具現するためのプログラムを、ディスク26000に保存することができる。ディスク26000に保存されたプログラムを、コンピュータシステム26700上で実行するために、ディスクドライブ26800によって、ディスク26000からプログラムが判読され、該プログラムがコンピュータシステム26700に伝送される。
図21及び図22で例示されたディスク26000だけではなく、メモリカード、ROMカセット、SSD(solid state drive)にも、本発明のビデオ符号化方法及びビデオ復号方法のうち少なくとも一つを具現するためのプログラムが保存される。
前述の実施形態によるビデオ符号化方法及びビデオ復号方法が適用されたシステムについて説明する。
図23は、コンテンツ流通サービス(content distribution service)を提供するためのコンテンツ供給システム(content supply system)11000の全体的構造を図示している。通信システムのサービス領域は、所定サイズのセルに分割され、各セルに、ベースステーションになる無線基地局11700,11800,11900,12000が設けられる。
コンテンツ供給システム11000は、多数の独立デバイスを含む。例えば、コンピュータ12100、PDA(personal digital assistant)12200、ビデオカメラ12300及び携帯電話12500のような独立デバイスが、インターネットサービス・プロバイダ11200、通信網11400、及び無線基地局11700,11800,11900,12000を経て、インターネット11100に連結される。
しかし、コンテンツ供給システム11000は、図24に図示された構造にのみ限定されるものではなく、デバイスが選択的に連結されてもよい。独立デバイスは、無線基地局11700,11800,11900,12000を経ず、通信網11400に直接連結されもする。
ビデオカメラ12300は、デジタルビデオカメラのように、ビデオ映像を撮影することができる撮像デバイスである。携帯電話12500は、PDC(personal digital communications)方式、CDMA(code division multiple access)方式、W−CDMA(wideband code division multiple access)方式、GSM(登録商標(global system for mobile communications))方式及びPHS(personal handyphone system)方式のような多様なプロトコルのうち少なくとも1つの通信方式を採択することができる。
ビデオカメラ12300は、無線基地局11900及び通信網11400を経て、ストリーミングサーバ11300に連結される。ストリーミングサーバ11300は、ユーザが、ビデオカメラ12300を利用して伝送したコンテンツを、リアルタイム放送でストリーミング伝送することができる。ビデオカメラ12300から受信されたコンテンツは、ビデオカメラ12300またはストリーミングサーバ11300によって符号化される。ビデオカメラ12300によって撮影されたビデオデータは、コンピュータ12100を経て、ストリーミングサーバ11300に伝送されてもよい。
カメラ12600によって撮影されたビデオデータも、コンピュータ12100を経て、ストリーミングサーバ11300に伝送されてもよい。カメラ12600は、デジタルカメラのように、静止映像とビデオ映像とをいずれも撮影することができる撮像装置である。カメラ12600から受信されたビデオデータは、カメラ12600またはコンピュータ12100によって符号化される。ビデオ符号化及びビデオ復号のためのソフトウェアは、コンピュータ12100がアクセスすることができるCD−ROMディスク、フロッピーディスク、ハードディスクドライブ、SSD、メモリカードのようなコンピュータで判読可能な記録媒体に保存される。
また、携帯電話12500に搭載されたカメラによってビデオが撮影された場合、ビデオデータが携帯電話12500から受信される。
該ビデオデータは、ビデオカメラ12300、携帯電話12500またはカメラ12600に搭載されたLSI(large scale integrated circuit)システムによって符号化される。
多様な実施形態によるコンテンツ供給システム11000において、例えば、コンサートの現場録画コンテンツのように、ユーザがビデオカメラ12300、カメラ12600、携帯電話12500、または他の撮像デバイスを利用して録画されたコンテンツが符号化され、ストリーミングサーバ11300に伝送される。ストリーミングサーバ11300は、コンテンツデータを要請した他のクライアントに、コンテンツデータをストリーミング伝送することができる。
該クライアントは、符号化されたコンテンツデータを復号することができるデバイスであり、例えば、コンピュータ12100、PDA 12200、ビデオカメラ12300または携帯電話12500でもある。従って、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信して再生させる。また、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信してリアルタイムに復号して再生させ、個人放送(personal broadcasting)が可能にさせる。
コンテンツ供給システム11000に含まれた独立デバイスの符号化動作及び復号動作に、本発明のビデオ符号化装置及びビデオ復号装置が適用される。
図24及び図25を参照し、コンテンツ供給システム11000における携帯電話12500の一実施形態について詳細に説明する。図24は、多様な実施形態による、本発明のビデオ符号化方法及びビデオ復号方法が適用される携帯電話12500の外部構造を図示している。携帯電話12500は、機能が制限されておらず、応用プログラムを介して、相当部分の機能を変更したり拡張したりすることができるスマートフォンでもある。
携帯電話12500は、無線基地局12000とRF信号を交換するための内蔵アンテナ12510を含み、カメラ12530によって撮影された映像、またはアンテナ12510によって受信されて復号された映像をディスプレイするためのLCD(liquid crystal display)画面、OLED(organic light emitting diodes)画面のようななディスプレイ画面12520を含む。スマートフォン12510は、制御ボタン、タッチパネルを含む動作パネル12540を含む。ディスプレイ画面12520がタッチスクリーンである場合、動作パネル12540は、ディスプレイ画面12520のタッチ感知パネルをさらに含む。スマートフォン12510は、音声、音響を出力するためのスピーカ12580、または他の形態の音響出力部;及び音声、音響が入力されるマイクロフォン12550、または他の形態の音響入力部;を含む。スマートフォン12510は、ビデオ及び静止映像を撮影するためのCCDカメラのようなカメラ12530をさらに含む。また、スマートフォン12510は、カメラ12530によって撮影されたり、電子メール(E−mail)でもって受信されるか、あるいは他の形態によって獲得されたりするビデオや静止映像のように、符号化されたり復号されたりするデータを保存するための記録媒体12570;及び記録媒体12570を携帯電話12500に装着するためのスロット12560;を含んでもよい。記録媒体12570は、SDカード、またはプラスチックケースに内蔵されたEEPROM(electrically erasable and programmable read only memory)のような他の形態のフラッシュメモリでもある。
図25は、携帯電話12500の内部構造を図示している。ディスプレイ画面12520及び動作パネル12540で構成された携帯電話12500の各パートを組織的に制御するために、電力供給回路12700、動作入力制御部12640、映像符号化部12720、カメラ・インターフェース12630、LCD制御部12620、映像復号部12690、マルチプレクサ/デマルチプレクサ(MUX/DEMUX:multiplexer/demultiplexer)12680、記録/判読部12670、変調/復調(modulation/demodulation)部12660及び音響処理部12650が、同期化バス12730を介して、中央制御部12710に連結される。
ユーザが電源ボタンを動作させ、「電源オフ」状態から「電源オン」状態に設定すれば、電力供給回路12700は、バッテリパックから携帯電話12500の各パートに電力を供給することにより、携帯電話12500が動作モードにセッティングされる。
中央制御部12710は、CPU、ROM及びRAM(random access memory)を含む。
携帯電話12500が、外部に通信データを送信する過程では、中央制御部12710の制御によって、携帯電話12500でデジタル信号が生成される、例えば、音響処理部12650では、デジタル音響信号が生成され、映像符号化部12720では、デジタル映像信号が生成され、動作パネル12540及び動作入力制御部12640を介して、メッセージのテキストデータが生成される。中央制御部12710の制御によって、デジタル信号が変調/復調部12660に伝達されれば、変調/復調部12660は、デジタル信号の周波数帯域を変調し、通信回路12610は、帯域変調されたデジタル音響信号に対して、D/A変換(digital-analog conversion)及び周波数変換(frequency conversion)処理を行う。通信回路12610から出力された送信信号は、アンテナ12510を介して、音声通信基地局または無線基地局12000に送出される。
例えば、携帯電話12500が通話モードであるとき、マイクロフォン12550によって獲得された音響信号は、中央制御部12710の制御によって、音響処理部12650でデジタル音響信号に変換される。生成されたデジタル音響信号は、変調/復調部12660及び通信回路12610を経て送信信号に変換され、アンテナ12510を介して送出される。
データ通信モードにおいて、電子メールのようなテキストメッセージが伝送される場合、動作パネル12540を利用して、メッセージのテキストデータが入力され、テキストデータが動作入力制御部12640を介して、中央制御部12610に伝送される。中央制御部12610の制御によって、テキストデータは、変調/復調部12660及び通信回路12610を介して、送信信号に変換され、アンテナ12510を介して、無線基地局12000に送出される。
データ通信モードで映像データを伝送するために、カメラ12530によって撮影された映像データが、カメラ・インターフェース12630を介して、映像符号化部12720に提供される。カメラ12530によって撮影された映像データは、カメラ・インターフェース12630及びLCD制御部12620を介して、ディスプレイ画面12520に直ちにディスプレイされる。
映像符号化部12720の構造は、前述の本発明のビデオ符号化装置の構造と相応する。映像符号化部12720は、カメラ12530から提供された映像データを、前述の本発明のビデオ符号化方式によって符号化し、圧縮符号化された映像データに変換し、符号化された映像データを多重化/逆多重化部12680に出力することができる。カメラ12530の録画中、携帯電話12500のマイクロフォン12550によって獲得された音響信号も、音響処理部12650を経てデジタル音響データに変換され、デジタル音響データは、多重化/逆多重化部12680に伝達される。
多重化/逆多重化部12680は、音響処理部12650から提供された音響データと共に、映像符号化部12720から提供された符号化された映像データを多重化する。多重化されたデータは、変調/復調部12660及び通信回路12610を介して送信信号に変換され、アンテナ12510を介して送出される。
携帯電話12500が、外部から通信データを受信する過程では、アンテナ12510を介して受信された信号を、周波数復元(frequency recovery)処理及びA/D変換(analog-digital conversion)処理を介して、デジタル信号を変換する。変調/復調部12660は、デジタル信号の周波数帯域を復調する。帯域復調されたデジタル信号は、種類によってビデオ復号部12690、音響処理部12650またはLCD制御部12620に伝達される。
携帯電話12500は、通話モードであるとき、アンテナ12510を介して、受信された信号を増幅して周波数変換及びA/D変換(analog-digital conversion)処理を介して、デジタル音響信号を生成する。受信されたデジタル音響信号は、中央制御部12710の制御によって、変調/復調部12660及び音響処理部12650を経て、アナログ音響信号に変換され、アナログ音響信号が、スピーカ12580を介して出力される。
データ通信モードにおいて、インターネットのウェブサイトからアクセスされたビデオファイルのデータが受信される場合、アンテナ12510を介して、無線基地局12000から受信された信号は、変調/復調部12660の処理結果、多重化されたデータを出力し、多重化されたデータは、多重化/逆多重化部12680に伝達される。
アンテナ12510を介して受信した多重化されたデータを復号するために、多重化/逆多重化部12680は、多重化されたデータを逆多重化して符号化されたビデオデータストリームと、符号化されたオーディオデータストリームとを分離する。同期化バス12730によって、符号化されたビデオデータストリームは、ビデオ復号部12690に提供され、符号化されたオーディオデータストリームは、音響処理部12650に提供される。
映像復号部12690の構造は、前述の本発明のビデオ復号装置の構造と相応する。映像復号部12690は、前述の本発明のビデオ復号方法を利用して、符号化されたビデオデータを復号し、復元されたビデオデータを生成し、復元されたビデオデータを、LCD制御部12620を経て、ディスプレイ画面1252に、復元されたビデオデータを提供することができる。
それによって、インターネットのウェブサイトからアクセスされたビデオファイルに含まれたオーディオデータも、スピーカ12580で再生される。
携帯電話12500、または他の形態の通信端末機は、本発明のビデオ符号化装置及びビデオ復号装置をいずれも含む送受信端末機であるか、前述の本発明のビデオ符号化装置のみを含む送信端末機であるか、あるいは本発明のビデオ復号装置のみを含む受信端末機でもある。
本発明の通信システムは、図24及び図25を参照して説明した構造に限定されるものない。例えば、図26は、多様な実施形態による、通信システムが適用されたデジタル放送システムを図示している。図26の多様な実施形態によるデジタル放送システムは、本発明のビデオ符号化装置及びビデオ復号装置を利用して、衛星ネットワークまたは地上波ネットワークを介して伝送されるデジタル放送を受信することができる。
具体的に見れば、放送局12890は、電波を介して、ビデオデータストリームを、通信衛星または放送衛星12900に伝送する。放送衛星12900は、放送信号を伝送し、放送信号は、家庭にあるアンテナ12860によって、衛星放送受信機に受信される。各家庭において、符号化されたビデオストリームは、TV(television)受信機12810、セットトップボックス(set-top box)12870、または他のデバイスによって復号されて再生される。
再生装置12830において、本発明のビデオ復号装置が具現されることにより、再生装置12830が、ディスク及びメモリカードのような記録媒体12820に記録された符号化されたビデオストリームを判読して復号することができる。それによって、復元されたビデオ信号は、例えば、モニタ12840で再生される。
衛星/地上波放送のためのアンテナ12860、またはケーブルTV受信のためのケーブルアンテナ12850に連結されたセットトップボックス12870にも、本発明のビデオ復号装置が搭載される。セットトップボックス12870の出力データも、TVモニタ12880で再生される。
他の例として、セットトップボックス12870の代わりに、TV受信機12810自体に、本発明のビデオ復号装置が搭載されてもよい。
適切なアンテナ12910を具備した自動車12920が、衛星12800または無線基地局11700から送出される信号を受信することもできる。自動車12920に搭載された自動車ナビゲーションシステム12930のディスプレイ画面に、復号されたビデオが再生される。
ビデオ信号は、本発明のビデオ符号化装置によって符号化され、記録媒体に記録されて保存される。具体的に見れば、DVDレコーダによって、映像信号がDVDディスク12960に保存されるか、あるいはハードディスクレコーダ12950によって、ハードディスクに映像信号が保存される。他の例として、ビデオ信号は、SDカード12970に保存されてもよい。ハードディスクレコーダ12950が、多様な実施形態による本発明のビデオ復号装置を具備すれば、DVDディスク12960、SDカード12970または他の形態の記録媒体に記録されたビデオ信号が、モニタ12880で再生される。
自動車ナビゲーションシステム12930は、図25のカメラ12530、カメラ・インターフェース12630及び映像符号化部12720を含まないこともある。例えば、コンピュータ12100及びTV受信機12810も、図25のカメラ12530、カメラ・インターフェース12630及び映像符号化部12720を含まないこともある。
図27は、多様な実施形態による、ビデオ符号化装置及びビデオ復号装置を利用するクラウドコンピューティングシステムのネットワーク構造を図示している。
本発明のクラウドコンピューティングシステムは、クラウドコンピューティングサーバ14100、ユーザDB 14100、コンピューティング資源14200及びユーザ端末機を含んでなる。
クラウドコンピューティングシステムは、ユーザ端末機の要請によって、インターネットのような情報通信網を介して、コンピューティング資源のオンデマンド・アウトソーシングサービスを提供する。クラウドコンピューティング環境において、サービスプロバイダは、互いに異なる物理的な位置に存在するデータセンターのコンピューティング資源を仮想化技術で統合し、ユーザが必要とするサービスを提供する。サービスユーザは、アプリケーション(application)、ストレージ(storage)、運用体制(OS)、保安(security)などのコンピューティング資源を、各ユーザ所有の端末にインストールして利用するのではなく、仮想化技術を介して、生成された仮想空間上のサービスを、所望の時点に所望するほど選んで利用することができる。
特定サービスユーザのユーザ端末機は、インターネット及び移動通信網を含む情報通信網を介して、クラウドコンピューティングサーバ14100に接続する。ユーザ端末機は、クラウドコンピューティングサーバ14100から、クラウドコンピューティングサービス、特に、動画再生サービスを提供される。ユーザ端末機は、デスクトップPC(personal computer)14300、スマートTV 14400、スマートフォン14500、ノート型パソコン14600、PMP(portable multimedia player)14700、テブレットPC 14800など、インターネット接続が可能な全ての電子機器にもなる。
クラウドコンピューティングサーバ14100は、クラウド網に分散している多数のコンピューティング資源14200を統合し、ユーザ端末機に提供することができる。多数のコンピューティング資源14200は、さまざまなデータサービスを含み、ユーザ端末機からアップロードされたデータを含んでもよい。かように、クラウドコンピューティングサーバ14100は、多くのところに分散している動画データベースを、仮想化技術で統合し、ユーザ端末機が要求するサービスを提供する。
ユーザDB 14100には、クラウドコンピューティングサービスに加入しているユーザ情報が保存される。ここで、ユーザ情報は、ログイン情報や、住所、氏名など個人信用情報を含んでもよい。また、ユーザ情報は、動画のインデックス(index)を含んでもよい。ここで、該インデックスは、再生を完了した動画リストや、再生中の動画リストや、再生中の動画の停止時点などを含んでもよい。
ユーザDB 14100に保存された動画に係わる情報は、ユーザデバイス間に共有される。従って、例えば、ノート型パソコン14600から再生要請され、ノート型パソコン14600に所定動画サービスを提供した場合、ユーザDB 14100に、所定動画サービスの再生ヒストリーが保存される。スマートフォン14500から、同一動画サービスの再生要請が受信される場合、クラウドコンピューティングサーバ14100は、ユーザDB 14100を参照し、所定動画サービスを探して再生する。スマートフォン14500が、クラウドコンピューティングサーバ14100を介して、動画データストリームを受信する場合、動画データストリームを復号してビデオを再生する動作は、先に図24を参照して説明した携帯電話12500の動作と類似している。
クラウドコンピューティングサーバ14100は、ユーザDB 14100に保存された所定動画サービスの再生ヒストリーを参照することもできる。例えば、クラウドコンピューティングサーバ14100は、ユーザ端末機から、ユーザDB 14100に保存された動画に対する再生要請を受信する。動画が、それ以前に再生中であったならば、クラウドコンピューティングサーバ14100は、ユーザ端末機からの選択によって、初めから再生するか、あるいは以前停止時点から再生するかということによって、ストリーミング方法が異なる。例えば、ユーザ端末機が、初めから再生するように要請した場合には、クラウドコンピューティングサーバ14100は、ユーザ端末機に当該動画を最初のフレームからストリーミング伝送する。一方、端末機が、以前停止時点から続けて再生するように要請した場合には、クラウドコンピューティングサーバ14100は、ユーザ端末機に、当該動画を、停止時点のフレームからストリーミング伝送する。
このとき、ユーザ端末機は、図1Aないし図20を参照して説明した本発明のビデオ復号装置を含んでもよい。他の例として、ユーザ端末機は、図1Aないし図20を参照して説明した本発明のビデオ符号化装置を含んでもよい。また、ユーザ端末機は、図1Aないし図20を参照して説明した本発明のビデオ符号化装置及びビデオ復号装置をいずれも含んでもよい。
図1Aないし図20を参照して説明したビデオ符号化方法及びビデオ復号方法、ビデオ符号化装置及びビデオ復号装置が活用される多様な実施形態について、図21ないし図27で説明した。しかし、図1Aないし図20を参照して説明したビデオ符号化方法及びビデオ復号方法が、記録媒体に保存されたり、ビデオ符号化装置及びビデオ復号装置がデバイスで具現されたりする多様な実施形態は、図21ないし図27の実施形態に限定されるものではない。
以上で開示された多様な実施形態が属する技術分野において当業者であるならば、本明細書で開示された実施形態の本質的な特性から外れない範囲で変形された形態に具現されるということを理解することができるであろう。従って、開示された実施形態は、限定的な観点ではなく、説明的な観点から考慮されなければならない。本明細書の開示範囲は、前述の説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にある全ての差異は、本明細書の開示範囲に含まれたものであると解釈されなければならないのである。

Claims (15)

  1. マルチレイヤビデオ復号方法において、
    第1レイヤが第2レイヤを参照するか否かということを示す依存性情報をビットストリームから獲得する段階と、
    前記依存性情報が、前記第1レイヤが前記第2レイヤを参照するということを示す場合、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得する段階と、
    前記参照ピクチャセットに基づいて、前記第1レイヤに含まれた現在映像の符号化データを復号する段階と、を含むことを特徴とするマルチレイヤビデオ復号方法。
  2. 前記第1レイヤの類型情報は、前記第1レイヤに含まれた映像がデプス映像であるか否かということを示し、前記第2レイヤの類型情報は、前記第2レイヤに含まれた映像がデプス映像であるか否かということを示すことを特徴とする請求項1に記載のマルチレイヤビデオ復号方法。
  3. 前記第1レイヤの参照ピクチャセットを獲得する段階は、
    前記第1レイヤの類型情報値と、前記第2レイヤの類型情報値とが同一である場合、前記第2レイヤのピクチャを、前記第1レイヤの参照ピクチャセットに含めることを特徴とする請求項1に記載のマルチレイヤビデオ復号方法。
  4. 前記第1レイヤに含まれた現在映像の符号化データを復号する段階は、
    前記参照ピクチャセットに基づいて、ディスパリティ補償を行うことを特徴とする請求項1に記載のマルチレイヤビデオ復号方法。
  5. 前記マルチレイヤビデオ復号方法は、
    前記第1レイヤの類型情報、及び前記第2レイヤの類型情報を、前記ビットストリームから獲得することを特徴とする請求項1に記載のマルチレイヤビデオ復号方法。
  6. マルチレイヤビデオ符号化方法において、
    第1レイヤが第2レイヤを参照するか否かということを示す依存性情報を生成する段階と、
    前記依存性情報が、前記第1レイヤが前記第2レイヤを参照するということを示す場合、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得する段階と、
    前記参照ピクチャセットに基づいて、前記第1レイヤに含まれた現在映像を符号化する段階と、を含むことを特徴とするマルチレイヤビデオ符号化方法。
  7. 前記第1レイヤの類型情報は、前記第1レイヤに含まれた映像がデプス映像であるか否かということを示し、前記第2レイヤの類型情報は、前記第2レイヤに含まれた映像がデプス映像であるか否かということを示すことを特徴とする請求項6に記載のマルチレイヤビデオ符号化方法。
  8. 前記第1レイヤの参照ピクチャセットを獲得する段階は、
    前記第1レイヤの類型情報値と、前記第2レイヤの類型情報値とが同一である場合、前記第2レイヤのピクチャを、前記第1レイヤの参照ピクチャセットに含めることを特徴とする請求項6に記載のマルチレイヤビデオ符号化方法。
  9. 前記第1レイヤに含まれた現在映像を符号化する段階は、
    前記参照ピクチャセットに基づいて、ディスパリティ補償を行うことを特徴とする請求項6に記載のマルチレイヤビデオ符号化方法。
  10. 前記マルチレイヤビデオ符号化方法は、
    前記第1レイヤの類型情報、及び前記第2レイヤの類型情報を生成する段階をさらに含むことを特徴とする請求項6に記載のマルチレイヤビデオ符号化方法。
  11. マルチレイヤビデオ復号装置において、
    第1レイヤが第2レイヤを参照するか否かということを示す依存性情報をビットストリームから獲得する獲得部と、
    前記依存性情報が、前記第1レイヤが前記第2レイヤを参照するということを示す場合、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得し、前記参照ピクチャセットに基づいて、前記第1レイヤに含まれた現在映像の符号化データを復号する復号部と、を含むことを特徴とするマルチレイヤビデオ復号装置。
  12. 前記第1レイヤの類型情報は、前記第1レイヤに含まれた映像がデプス映像であるか否かということを示し、前記第2レイヤの類型情報は、前記第2レイヤに含まれた映像がデプス映像であるか否かということを示すことを特徴とする請求項11に記載のマルチレイヤビデオ復号装置。
  13. マルチレイヤビデオ符号化装置において、
    第1レイヤと第2レイヤとが依存的であるか否かということを示す依存性情報を生成し、前記依存性情報の値が1である場合、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報が同一であるか否かということに基づいて、前記第1レイヤの参照ピクチャセットを獲得し、前記参照ピクチャセットに基づいて、前記第1レイヤに含まれた現在映像を符号化する符号化部と、を含むことを特徴とするマルチレイヤビデオ符号化装置。
  14. 前記マルチレイヤビデオ符号化装置は、
    前記依存性情報、前記第1レイヤの類型情報、及び前記第2レイヤの類型情報をビットストリームに含めるビットストリーム生成部をさらに含むことを特徴とする請求項13に記載のマルチレイヤビデオ符号化装置。
  15. 請求項1ないし10のうちいずれか1項に記載の方法を具現するためのプログラムが記録されたコンピュータで判読可能な記録媒体。
JP2016575281A 2014-03-14 2015-03-16 類型情報を利用した、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法 Pending JP2017513426A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461953156P 2014-03-14 2014-03-14
US61/953,156 2014-03-14
PCT/KR2015/002506 WO2015137780A1 (ko) 2014-03-14 2015-03-16 유형 정보를 이용한 멀티 레이어 비디오 부호화 방법 및 멀티 레이어 비디오 복호화 방법

Publications (1)

Publication Number Publication Date
JP2017513426A true JP2017513426A (ja) 2017-05-25

Family

ID=54072129

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016575281A Pending JP2017513426A (ja) 2014-03-14 2015-03-16 類型情報を利用した、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法

Country Status (4)

Country Link
US (1) US20170085890A1 (ja)
JP (1) JP2017513426A (ja)
KR (1) KR20160135760A (ja)
WO (1) WO2015137780A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11595652B2 (en) 2019-01-28 2023-02-28 Op Solutions, Llc Explicit signaling of extended long term reference picture retention
US11665365B2 (en) * 2018-09-14 2023-05-30 Google Llc Motion prediction coding with coframe motion vectors
CN113597768A (zh) * 2019-01-28 2021-11-02 Op方案有限责任公司 扩展长期参考图片保留的在线和离线选择
WO2023089340A1 (en) * 2021-11-22 2023-05-25 V-Nova International Ltd Processing a multi-layer video stream
GB2613015A (en) * 2021-11-22 2023-05-24 V Nova Int Ltd Decoding a multi-layer video stream using a joint packet stream

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010126612A2 (en) * 2009-05-01 2010-11-04 Thomson Licensing Reference picture lists for 3dv
CN103299619A (zh) * 2010-09-14 2013-09-11 汤姆逊许可公司 遮挡数据的压缩方法和装置
US10027957B2 (en) * 2011-01-12 2018-07-17 Sun Patent Trust Methods and apparatuses for encoding and decoding video using multiple reference pictures
US9258559B2 (en) * 2011-12-20 2016-02-09 Qualcomm Incorporated Reference picture list construction for multi-view and three-dimensional video coding
WO2014008402A1 (en) * 2012-07-05 2014-01-09 Vid Scale, Inc. Layer dependency and priority signaling design for scalable video coding
US9325990B2 (en) * 2012-07-09 2016-04-26 Qualcomm Incorporated Temporal motion vector prediction in video coding extensions

Also Published As

Publication number Publication date
KR20160135760A (ko) 2016-11-28
WO2015137780A1 (ko) 2015-09-17
US20170085890A1 (en) 2017-03-23

Similar Documents

Publication Publication Date Title
KR102329126B1 (ko) 인터 레이어 비디오의 복호화 및 부호화를 위한 머지 후보 리스트 구성 방법 및 장치
KR102290420B1 (ko) 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
KR102281282B1 (ko) 서브블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치
KR102270787B1 (ko) 휘도차를 보상하기 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
KR102149827B1 (ko) 인터 레이어 비디오 복호화 방법 및 그 장치 및 인터 레이어 비디오 부호화 방법 및 그 장치
KR102246545B1 (ko) 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
KR102246546B1 (ko) 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
KR102216128B1 (ko) 움직임 벡터 결정 방법 및 그 장치
JP2017523682A (ja) インターレイヤビデオ符号化/復号のためのデプス映像の予測モード伝送方法及びその装置
KR20160132893A (ko) 서브블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치
JP6742243B2 (ja) 輝度補償を利用したインターレイヤビデオ符号化方法及びその装置、該ビデオ復号化方法及びその装置
KR20150105264A (ko) 서브 블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브 블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치
KR20130116832A (ko) 트리 구조의 부호화 단위에 기초한 다시점 비디오 부호화 방법 및 그 장치, 트리 구조의 부호화 단위에 기초한 다시점 비디오 복호화 방법 및 그 장치
KR102212211B1 (ko) 멀티 레이어 비디오의 복호화 및 부호화를 위한 버퍼 관리 방법 및 장치
KR102199461B1 (ko) 적응적 휘도 보상을 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
JP2016528792A (ja) インターレイヤビデオ復号化装置及びインターレイヤビデオ符号化装置、並びにその方法のためのブロック基盤ディスパリティベクトル予測方法
KR102248848B1 (ko) 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
JP2017518706A (ja) デプスブロックを利用する、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法
KR20150106380A (ko) 인터 레이어 비디오 부복호화를 위한 깊이 영상의 예측 모드 전송 방법 및 장치
KR102047501B1 (ko) 인터-레이어 예측을 이용한 멀티 레이어 영상 부호화 또는 복호화 방법 및 장치
JP6374605B2 (ja) 映像を復号する方法、装置及び記録媒体
JP2017505037A (ja) デプス符号化方法及びその装置、デプス復号化方法及びその装置
JP2017513426A (ja) 類型情報を利用した、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法
KR20140122673A (ko) 휘도차를 보상하기 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
KR20160138129A (ko) 뎁스 블록을 이용한 멀티 레이어 비디오 부호화 방법 및 멀티 레이어 비디오 복호화 방법.