JP2010530160A - 符号化されたステレオスコピック映像データファイルのフォーマット - Google Patents

符号化されたステレオスコピック映像データファイルのフォーマット Download PDF

Info

Publication number
JP2010530160A
JP2010530160A JP2010511112A JP2010511112A JP2010530160A JP 2010530160 A JP2010530160 A JP 2010530160A JP 2010511112 A JP2010511112 A JP 2010511112A JP 2010511112 A JP2010511112 A JP 2010511112A JP 2010530160 A JP2010530160 A JP 2010530160A
Authority
JP
Japan
Prior art keywords
information
encoded
video data
stereoscopic video
stereoscopic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010511112A
Other languages
English (en)
Inventor
ホン キム,キュ
ジン イ,ユン
フン パク,クァン
ヨン ソ,トク
ムン チョン,スン
ヒョプ オ,ヨン
ソプ チョン,テ
ソプ ピョン,テ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industry Academy Cooperation Foundation Of Kyunghee Uiversity
Enhanced Chip Technology Inc
Original Assignee
Industry Academy Cooperation Foundation Of Kyunghee Uiversity
Enhanced Chip Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industry Academy Cooperation Foundation Of Kyunghee Uiversity, Enhanced Chip Technology Inc filed Critical Industry Academy Cooperation Foundation Of Kyunghee Uiversity
Publication of JP2010530160A publication Critical patent/JP2010530160A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/139Format conversion, e.g. of frame-rate or size
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/178Metadata, e.g. disparity information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/189Recording image signals; Reproducing recorded image signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

符号化されたステレオスコピック映像データファイルのフォーマットを提供する。符号化されたステレオスコピック映像データファイルのフォーマットは、当該ファイルがステレオスコピック映像に関するものであるか否かを指示するためのフィイルタイプ宣言部と、符号化されたステレオスコピック映像データのメタデータを含ませるための一つまたはそれ以上のトラックコンテナを含むメタデータ部と、そして、符号化されたステレオスコピック映像データのイメージ情報を含ませるための一つまたはそれ以上のステレオスコピック映像データコンテナを含む映像データ部と、を含む。

Description

本発明は、データファイルフォーマット(Data File Format)に係り、より具体的に、符号化されたステレオスコピック映像データ(Encoded Stereoscopic Image Data)を保存または伝送するためのファイルフォーマットまたはファイルの構成方法に関する。
両眼式ステレオスコピック映像(以下、‘ステレオスコピック映像’と言う)は、一定の距離ほど離隔している左側カメラと右側カメラとで同一の被写体を撮影して、それぞれ獲得した一対の左映像と右映像とを言う。左映像と右映像は、同一の被写体を撮影したものであるが、視点(view point)が異なるために、被写体の表面特性や光源の位置などによってイメージ情報に多少の差が発生しうる。このような同一被写体に対する左映像と右映像とのイメージ情報の差をディスパリティ(Disparity)と言う。
そして、ステレオスコピック映像は、一般的には、左側カメラと右側カメラとを用いてそれぞれ獲得した映像を示すが、広い意味では、モノスコピック映像(Monoscopic Image)に所定の変換アルゴリズムを適用して生成した立体映像も含まれる。このようなステレオスコピック映像は、一般的にディスプレイされる被写体に対して立体感を付与するのに利用される。
ステレオスコピック映像を用いてLCD(Liquid Crystal Display)やPDP(Plasma Display Panel)のような平面ディスプレイ装置で再生(Reproduction)される映像に立体感を付与することができる方法は、さまざまである。そのうちの一つの方法は、バリア型(Barrier Type)のディスプレイ装置を用いる方法である。バリア型ディスプレイ装置は、モノスコピック映像とステレオスコピック映像とをいずれもディスプレイすることができるために、次世代ディスプレイ装置中の一つとして大きな注目を集めている。
バリア型ディスプレイ装置は、偏光フィルムや偏光ガラスなどで形成されるバリア偏光板が平面ディスプレイ装置の前面に付着または備えられている装置である。バリア偏光板には、ライン状のバリアパターンが備えられているが、このバリアパターンは、左眼ではディスプレイ映像の左映像部分のみが、そして、右眼では前記ディスプレイ映像の右映像部分のみが見えるようにする。このようなバリアパターンは、さまざまな類型があるが、基本的に垂直ライン状(Vertical Line Type)と水平ライン状(Horizontal Line Type)とがある。そして、前記垂直または水平ラインの微細な形状によってバリアパターンは、1字状、鋸歯状、及び対角線状などに区分されるが、このようなバリアパターンのライン形状は、ディスプレイされる映像の立体感に差を誘発させる。
一方、静止映像(Still Image)や動画(Moving Picture)(本明細書で、単純に‘映像’と言う場合には、静止映像と動画のいずれもを含む)に関する既存の符号化標準によって符号化されたモノスコピック映像データは、大きく2種に区分されて保存された。そのうちの一つは、映像の画素値と直接関連があるイメージ情報(Image Information)であり、他の一つは、前記イメージ情報を復号化してディスプレイするのに必要な付加的な情報であるメタデータ(META Data)である。前記イメージ情報は、映像符号化に関する国際標準の種類によって変わりうるが、一般的に輝度及び色差などのようなテクスチャ情報(Texture Information)と動き情報(Motion Information)などを含み、背景や物体についての情報である形状情報(Shape Information)などをさらに含みうる。そして、前記メタデータは、前記イメージ情報の以外に、前記イメージ情報を再生してディスプレイするのに必要な付加的なデータを含む。
このようなイメージ情報とメタデータの区分は任意的なものであり、国際標準規格の内容やまたはデータの分類基準などによって変わりうる。そして、本明細書で‘映像データ’という用語は、一般的に、前記‘イメージ情報’と‘メタデータ’のいずれもを含む場合を示すが、場合によっては、単純に‘イメージ情報’のみを示すこともできるが、本明細書の各部分で‘映像データ’が何を意味するかは、その文脈に合わせて解析されなければならない。例えば、図1の‘映像データ部(Image Data Unit)’で‘映像データ’は、単に‘イメージ情報’のみを示すが、発明の名称での‘映像データ’は、‘イメージ情報’と‘メタデータ’とをすべて含む。
図1は、符号化されたモノスコピック映像データを保存するための既存のファイルフォーマットを示すブロック図である。図1を参照すれば、既存のファイルフォーマット10は、基本ヘッダ部(Basic Header Unit)12及び映像データ部14を含む。映像データ部14には、テクスチャ情報、形状情報、及び/または動き情報などのような符号化された映像データのイメージ情報が含まれ、基本ヘッダ部12には、映像データ部14に含まれるイメージ情報を除いた残りの付加的なデータが含まれる。ところが、このような既存の映像データファイルフォーマット10は、符号化されたモノスコピック映像データを保存及び/または伝送するためのファイルフォーマットとしては適するが、符号化されたステレオスコピック映像データを保存及び/または伝送するためのファイルフォーマットとしては適しない。なぜならば、ステレオスコピック映像は、モノスコピック映像とは異なって、左右カメラを用いて一対の左右映像を獲得し、該獲得した一対の左右映像を多様な方法で組み合わせて符号化を行い、また映像の再生にバリア型ディスプレイのような特殊なディスプレイ装置が利用されるためである。
ステレオスコピック映像は、既存のモノスコピック映像とは異なって、一対の左右映像で構成されるので、符号化の対象となるフレーム、すなわち、被符号化フレームを多様な方法で構成することができる。例えば、一対の左右映像を組み合わせて一つの被符号化フレームを形成することができるが、左映像と右映像とを組み合わせる方法は、さまざまである。そして、一対の左右映像から2つまたはそれ以上の被符号化フレームを設定することができるが、その設定方法も、さまざまである。このように、一対の左右映像を用いて被符号化フレームを作る方法は多様であるために、符号化の結果、生成される映像データ及びメタデータの値、種類、及び特性なども非常に多様である。しかし、前述した既存のファイルフォーマットは、このような多様な情報及びそれによって派生されるデータを全部、そして、体系的に構成して保存するのに適しない。
したがって、本発明が果たそうとする第1の技術的課題は、符号化されたステレオスコピック映像データを効率的かつ体系的に保存することができるファイルフォーマットまたはファイルの構成方法を提供することである。
そして、符号化されたステレオスコピック映像データは、所定の間隔で離隔している一対の左右カメラを用いて獲得した映像を符号化したものであるが、前記左右カメラの特性、例えば、離隔距離やフレーム率の差などは、再生される立体映像の画質や立体感などに影響を及ぼす。同時に、符号化されたステレオスコピック映像データは、特殊に考案されたディスプレイ装置(例えば、バリア型ディスプレイ装置)を使って再生されるか、またはさまざまな方式でディスプレイすることができるが、前記ディスプレイ装置の特性やディスプレイ方式も、立体映像の画質や立体感などに影響を及ぼす。したがって、ディスプレイ装置に最適化された立体映像を再生するためには、撮影カメラ及び/またはディスプレイ装置とディスプレイ方式に関する情報なども符号化されたステレオスコピック映像データに含まれなければならないが、既存のファイルフォーマットでは、このような要請を充足させにくい。
したがって、本発明が果たそうとする第2の技術的課題は、撮影カメラ及び/またはディスプレイ装置の特性やディスプレイ方式を反映して臨場感ある立体映像をディスプレイすることができる符号化されたステレオスコピック映像データのファイルフォーマットまたはファイルの構成方法を提供することである。
一方、マルチメディア関連の国際標準規格を制定するMPEG(Moving Picture Experts Group)では、多様なマルチメディアデータを保存するための方法として、ISO(International Standardization Organization)ベースメディアファイルフォーマット(Base Media File Format)を定義した。ISOベースメディアファイルフォーマットは、JPEG2000のパート(Part)12、ISO/IEC15444−12に規定されているが、将来のアプリケーションのための基本ファイルフォーマットを提供する。また、MPEGでは、ステレオスコピック映像を含んだ多様なマルチメディアアプリケーションに対して当該アプリケーションの目的に適したマルチメディアアプリケーションファイルフォーマット(Multimedia Application File format、MAF)を定義しているが、MAFがISOベースメディアファイルフォーマットと互換される場合、ステレオスコピック映像を利用したより幅広くて多様なサービスが可能である。
したがって、本発明が果たそうとする第3の技術的課題は、ISOベースメディアファイルフォーマットと互換が可能な符号化されたステレオスコピック映像データファイルフォーマットまたはファイルの構成方法を提供することである。
前記技術的課題を果たすための本発明の一実施形態による符号化されたステレオスコピック映像データファイルのフォーマットは、前記ファイルがステレオスコピック映像に関するものであるか否かを指示するためのフィイルタイプ宣言部と、前記符号化されたステレオスコピック映像データのメタデータを含ませるための一つまたはそれ以上のトラックコンテナを含むメタデータ部と、前記符号化されたステレオスコピック映像データのイメージ情報を含ませるための一つまたはそれ以上のステレオスコピック映像データコンテナを含む映像データ部と、を含む。
前記実施形態の一側面によれば、前記フィイルタイプ宣言部は、前記ファイルがステレオスコピック映像に関するものであるか否かを指示するための第1情報及び前記ファイルを構成する基本ストリーム(Elementary Stream、ES)の個数を指示するための第2情報を含みうる。この場合に、前記トラックコンテナと前記ステレオスコピック映像データコンテナとの個数は、それぞれ前記ESの個数と同一であり得る。
前記実施形態の他の側面によれば、前記トラックコンテナは、当該基本ストリームESの類型を指示するためのハンドラー参照(Handler Reference)コンテナと、前記当該ESのメタデータを含ませるためのメディア情報コンテナと、を含みうる。
この場合に、前記メディア情報コンテナは、被符号化フレームの大きさを指示する情報を含むステレオスコピックヘッダコンテナを含みうる。そして、前記ステレオスコピックヘッダコンテナは、前記ステレオスコピック映像の獲得に用いた左右カメラ間の距離を表わす情報を含ませるためのコンテナを含むか、及び/または前記ステレオスコピック映像のディスプレイに用いられるバリア型ディスプレイ装置のバリアパターンの距離を指示する情報、及び/または前記バリアパターン間の間隔を指示する情報を含ませるためのコンテナを含みうる。
また、前記メディア情報コンテナは、前記当該ESのデスクリプション(Description)を定義するためのサンプルデスクリプションコンテナを含みうる。この場合に、前記サンプルデスクリプションコンテナは、被符号化フレームの構成方法を指示するES類型の情報を含みうる。
例えば、前記フィイルタイプ宣言部の前記第2情報が、前記ESの個数が1つであると指示する場合に、前記ES類型の情報が指示する前記被符号化フレームは、左右映像がフレーム単位で時間方向に交互に配列された第1類型、左映像と右映像とがサイドバイサイド方式で配列された第2類型、左映像と右映像とがトップダウン方式で配列された第3類型、左右映像の垂直ピクセルラインが交互に配列された第4類型、及び左右映像の水平ピクセルラインが交互に配列された第5類型のうち何れか一つであり得る。この場合に、前記ES類型の情報が、前記第2類型ないし第5類型のうち何れか一つを指示し、前記サンプルデスクリプションコンテナは、前記被符号化フレームを構成する左右映像間のフレーム率の関連情報及び/またはディスパリティの関連情報をさらに含みうる。
ここで、前記フレーム率の関連情報は、前記左右映像のフレーム率が同一であるか否かと前記左右映像のフレーム率が異なる場合には、前記ステレオスコピック映像のディスプレイ時にフレーム率を一致させるための情報を含み、前記ディスパリティの関連情報は、前記左右映像のディスパリティがあるか否かと前記左右映像のディスパリティがある場合には、前記ディスパリティを補正するための情報を含みうる。
また、前記フィイルタイプ宣言部の前記第2情報が、前記ESの個数が2つであると指示する場合に、前記ES類型の情報が指示する前記被符号化フレームは、左映像、右映像、基準映像、及び差分映像のうち何れか一つであり得る。
本発明の実施形態によるファイルフォーマットは、階層的な構造を有するだけではなく、既存のメタデータと共にステレオスコピック映像に固有のメタデータを体系的に保存することができる構造を有するために、符号化されたステレオスコピック映像データを効率的に構成して保存することができる。また、本発明によるファイルフォーマットは、ステレオスコピック映像を獲得するための撮影カメラ及び/またはディスプレイ装置の特性に関連した情報も含ませることができる構造を有するために、保存された符号化されたステレオスコピック映像データを用いて臨場感ある立体映像をディスプレイすることができる。同時に、本発明による符号化されたステレオスコピック映像データを保存するためのファイルフォーマットは、多様なマルチメディアアプリケーションに適用可能な国際標準規格であるISOベースメディアファイルフォーマットと互換性を有する。
符号化されたモノスコピック映像データを保存するための既存のファイルフォーマットを示すブロック図である。 被符号化フレームとして左右映像が平行に配された統合合成映像の構成を示す図である。 被符号化フレームとして左映像と右映像とのピクセルラインが交互に配された統合合成映像の構成を示す図である。 被符号化フレームとして左映像と右映像とがそれぞれフレーム単位で順次に配列された統合合成映像の構成を示す図である。 左映像と右映像とからなる被符号化フレームの構成を示す図である。 基準映像と差分映像とからなる被符号化フレームの構成を示す図である。 一つの基準映像と多数の差分映像とからなる被符号化フレームの構成を示す図である。 符号化されたステレオスコピック映像データを保存するための本発明の一実施形態によるファイルフォーマットを示すブロック図である。 図8のステレオスコピックトラックコンテナの構成を示すブロック図である。 図8と図9に示されたファイルフォーマットが有する階層構造を示すための図である。 図8のsstyボックスに対するシンタックスの一例を示す図である。 図9のhdlrボックスに対するシンタックスの一例を示す図である。 図9のステレオスコピックヘッダボックスに対するシンタックスの一例を示す図である。 図9のステレオスコピックカメラ情報ボックスに対するシンタックスの一例を示す図である。 図9のステレオスコピックディスプレイ情報ボックスに対するシンタックスの一例を示す図である。 mpssボックスに対するシンタックスの一例を示す図である。 mpssボックスに対するシンタックスの一例を示す図である。 mpssボックスに対するシンタックスの一例を示す図である。 mpssボックスに対するシンタックスの一例を示す図である。
以下、添付図面を参照して、本発明の望ましい実施形態について詳細に説明する。後述する実施形態は、本発明の技術的思想を説明するための目的であるので、本発明の技術的思想は、本実施形態によって限定されると解析されてはならない。そして、以下の実施形態の説明で、それぞれの構成要素の名称は、当業界で異なる名称と称されうるが、これらの間に機能的類似性と同一性とがあれば、たとえ異なる名称を使っても、本発明の実施形態と均等な構成と見られる。同様に、図面上の構成を一部変形した実施形態が採用されても、機能的類似性と同一性とがあれば、両者は均等な構成と見られる。
本発明の実施形態を説明する前に、本発明の実施形態による符号化されたステレオスコピック映像データファイルフォーマットを定義するために、考慮しなければならない事項に関して先に説明する。このような事項は、モノスコピック映像とは区別されるステレオスコピック映像の固有の特性である。
優先的に考慮しなければならない事項は、左右映像から被符号化フレームを如何に構成するか、すなわち、被符号化フレームの構成方法に関するものである。被符号化フレームの構成方法は、符号化されたステレオスコピック映像データの構造に直接的に影響を及ぼす。例えば、被符号化フレームの構成方法によって符号化された映像データを構成する基本ストリームESの個数が変わり、ESの個数が同じ場合でも被符号化フレームの構成方法は、さまざまであり得る。
まず、左右映像から一つの被符号化フレームを形成することができる。一対の左右映像から生成された一つの被符号化フレームを、以下では、‘統合合成映像’または‘合成映像’と呼ぶ。このような統合合成映像を符号化して生成されるステレオスコピック映像データは、1つのESで構成される。一対の左右映像から統合合成映像を構成する方法は、さまざまであるが、図2ないし図4は、統合合成映像を構成する方法の例を示すための図である。
統合合成映像を構成する一つの方法は、まず左映像と右映像とを平行に配列することであって、図2は、これを示すための図である。図2を参照すれば、統合合成映像22のように被符号化フレームは、左映像と右映像とがサイドバイサイド(Side−by−Side)方式で平行に配列された映像であるか、または統合合成映像24のように被符号化フレームは、左映像と右映像とがトップダウン(Top−Down)方式で平行に配列されたフレームであり得る。この場合に、統合合成映像22または24を構成する左映像と右映像との位置は、互いに変わりうる。
統合合成映像を構成する他の一つの方法は、左映像と右映像とをそれぞれフィールド単位で交互に配列することであって、図3は、これを示すための図である。図3を参照すれば、統合合成映像32は、左映像の垂直ピクセルラインと右映像の垂直ピクセルラインとが交互に配列されたフレームであるか、または統合合成映像34は、左映像の水平ピクセルラインと右映像の水平ピクセルラインとが交互に配列されたフレームであり得る。そして、このような統合合成映像32または34を構成する左映像のピクセルライン(左映像のフィールド)と右映像のピクセルライン(右映像のフィールド)との位置は、互いに変わりうる。
統合合成映像を生成するまた他の一つの方法は、左映像と右映像とをそれぞれフレーム単位で順次に配列することであって、図4は、これを示すための図である。図4を参照すれば、統合合成映像40は、フレーム単位の左映像と右映像とが時間方向に交互に配列して構成されるが、このような統合合成映像40の場合、一つの被符号化フレームには、左映像のピクセルと右映像のピクセルとがともに存在することはない。
次いで、図5及び図6を参照して、一対の左右映像から形成される被符号化フレームが、2つである場合について説明する。被符号化フレームが2つである場合には、これを符号化して生成される映像データは、2つのESで構成される。
図5を参照すれば、左映像52aと右映像52bとがそれぞれそれ自体で被符号化フレームになる。そして、前記被符号化フレーム52a、52bを符号化すれば、該符号化された映像データは、各映像を表わす2つのES1及びES2で構成される。一方、図6を参照すれば、被符号化フレームは、基準映像54aと差分映像54bとで構成することもできる。この場合は、左映像と右映像とのうち何れか一つの映像が基準映像54aとして一つの被符号化フレームになり、前記基準映像との差分(差点)で構成された差分映像54bが他の一つの被符号化フレームになる。
図7は、被符号化フレームが3つ以上である場合を説明するための図である。図7を参照すれば、それぞれ連続した(n+1)/2個(ここで、nは3以上の奇数である)フレームの左映像と右映像とのうち何れか一つの映像が基準映像62として被符号化フレームになり、基準映像を除いた残りの映像が差分映像62a、62b、…、62nとして被符号化フレームになる。このような被符号化フレームを符号化すれば、該符号化された映像データは、総(n+1)個のES、すなわち、ES1、ES2、ES3、…、ES(n+1)で構成される。
前述した一つまたはそれ以上の被符号化フレームまたは被符号化フレームシーケンスは、既存の映像符号化方法を用いて符号化することができる。既存の映像符号化方法としては、例えば、JPEGなどのような静止映像に対する符号化方法や、またはMPEG−1、MPEG−2、MPEG−4、H.264/AVC、VC−1などのような動画に対する符号化方法などがある。そして、このような既存の映像符号化方法を用いて符号化された映像データは、その符号化方式を支援するディスプレイ装置に直ちに伝送されて再生されるか、または記録媒体に保存された後で、以後にディスプレイ装置によって再生される。
前述したように、ステレオスコピック映像の場合には、被符号化フレームを構成する方法が多様である。そして、それによって符号化されたステレオスコピック映像データは、1つのESで構成されるか、2つまたはそれ以上のESで構成することができる。そして、ESの個数が同じ場合でも、左右映像から被符号化フレームを構成する方法は、異なることがあり、それによって派生されるデータまたは再生に必要なデータも異なりうる。したがって、符号化されたステレオスコピック映像データを保存するためのファイルフォーマットは、被符号化フレームの構成方法と各構成方法とによって派生されるデータの保存に適した形式でなければならない。
符号化されたステレオスコピック映像データを保存するためのファイルフォーマットを定義するために、二番目に考慮しなければならない事項は、ステレオスコピック映像を獲得するために所定の間隔で離隔している左右カメラを使うということである。なぜならば、立体映像を効率的に再生するか、及び/または再生される立体映像の画質及び立体感などを向上させるためには、ディスプレイ装置に前記左右カメラと関連した情報が提供されなければならないためである。そのために、符号化されたステレオスコピック映像データには、左右カメラと関連した情報が追加的に含まれることが望ましく、符号化されたステレオスコピック映像データを保存するためのファイルフォーマットを定義するに当たっては、追加的に含まれる左右カメラの関連情報を考慮しなければならない。
左右カメラの関連情報は、さまざまである。例えば、左右カメラ間の距離に関する情報、左右カメラを通じてそれぞれキャプチャされる左映像と右映像との秒当たりフレーム数(frame/sec、fps)、すなわち、フレーム率(Frame Rate)に関する情報、左映像と右映像との同期化に関する情報、及び/または左右カメラの種類に関する情報などが、これに該当する。また、場合によっては、左映像と右映像と間のディスパリティー情報(Disparity Information)も、左右カメラの関連情報に含まれることもできる。
符号化されたステレオスコピック映像データを保存するためのファイルフォーマットを定義するために、三番目に考慮しなければならない事項は、ステレオスコピック映像の再生に既存のディスプレイ装置とは異なる特殊なディスプレイ装置(例えば、バリア型ディスプレイ装置)を使うということである。なぜならば、特殊なディスプレイ装置を使って立体映像を再生するためには、再生される映像データは、このようなディスプレイ装置に適しなければならず、またディスプレイ装置の特性と関連した情報が立体映像の画質や立体感に影響を及ぼすことができるために、符号化されたステレオスコピック映像データファイルフォーマットを定義するに当たっては、このような事実や追加的に必要な情報を考慮しなければならない。
ディスプレイ装置と関連した情報も、さまざまである。例えば、再生装置がバリア型ディスプレイ装置である場合に、符号化されたステレオスコピック映像データの再生に最も適したバリアパターンに関する情報も、そのうちの一つである。前述したように、バリアパターンは、垂直ラインまたは水平ラインの形状でバリア偏光板上に配されるが、前記ラインの微細な形状は、立体映像の画質に影響を及ぼすことができる。また、ディスプレイ装置の位置によるバリアパターンの間隔(位置に構わずに間隔が一定であるか、または位置によって間隔が異なるか)に関する情報も、立体映像の画質に影響を及ぼすことができる。
図8及び図9は、符号化されたステレオスコピック映像データを保存するための本発明の一実施形態によるファイルフォーマットを示すブロック図であって、図9は、図8のステレオスコピックトラックコンテナTrack210の構成を示すブロック図である。そして、図10は、図8と図9とに示されたファイルフォーマットが有する階層構造(Hierarchical Structure)を示すための図である。図8、図9、及び図10に示されたように、本発明の実施形態によるファイルフォーマットは、ISOベースメディアファイルフォーマットを基盤としたものである。
まず、図8及び図10を参照すれば、本発明の一実施形態によるファイルフォーマットは、大きくフィイルタイプ宣言部ftyp100、メタデータ部moov200、及び映像データ部mdat300を含むように構成される。
フィイルタイプ宣言部100は、当該ファイルがステレオスコピック映像のためのファイルであるか否かを知らせるためのものである。そして、当該ファイルがステレオスコピック映像のためのファイルである場合には、これを構成するESの個数に関する情報も、これに含まれる。そのために、図8及び図10に示されたように、ファイルタイプ宣言部100は、ftypコンテナの下位分類であって、ステレオスコピックタイプであるか否かを指示する情報及び/または当該ステレオスコピック映像を構成するESの個数を指示する情報を含ませるためのボックスを含む。このボックスは、例えば、示されたようなステレオスコピックタイプボックスssty110であり得る。そして、ステレオスコピック映像のデコーダは、ステレオスコピックタイプボックス110の情報を通じて、当該ファイルがステレオスコピック映像に対するものであるか、及び/またはステレオスコピック映像である場合には、数個のESで構成された映像であるかが分かる。これを整理すれば、次の通りである。
ssty(Stereoscopic Type)
−Box Type:‘ssty’
−Container:File Type Box(‘ftyp’)
−Mandatory:Yes
−Quantity:Exactly one
以上の内容を通じて分かるように、符号化されたステレオスコピック映像データの場合に、sstyボックス110は必須な構成要素であり、ftypコンテナに一つのみ存在する。このようなsstyボックス110に対するシンタックス(Syntax)の一例は、図11のようである。図11で要素(Element)‘StereoScopic_Type’は、当該ファイルがステレオスコピックファイルであるか否かを表わすものであって、例えば、その値は、表1のように割り当てられる。そして、要素‘StereoScopic_ES_Count’は、当該ステレオスコピックファイルを構成するESの個数を表わす。
Figure 2010530160
次いで、図8及び図10を参照すれば、メタデータ部200であるmoovコンテナは、当該ファイルのメタデータを保存するための1つまたはそれ以上のトラックコンテナ(Track Container)210または220を含む。当該ファイルがステレオスコピック映像ファイルである場合に、moovコンテナは、これを構成するESの個数に対応するステレオスコピックトラックコンテナ210、例えば、ES1のためのtrack1(Stereoscopic)、ES2のためのtrack2(Stereoscopic)、…、ES(n)のためのtrack(n)(Stereoscopic)を含む(ここで、nは1以上の整数)。一方、当該ファイルがステレオスコピック映像ファイルではない場合には、一つのビステレオスコピックトラックコンテナ220、例えば、モノスコピック映像、オーディオ、またはテキストファイルのメタデータのためのtrack(Non−Stereoscopic)を含む。本発明は、ステレオスコピック映像に関するものであるので、以下では、図9及び図10を参照して、ステレオスコピックトラックコンテナ210の構成について詳しく説明する。
ステレオスコピックトラックコンテナ210は、メディアコンテナmedia211を含む。メディアコンテナ211は、トラックというコンテナに保存されるメディアストリームの関連情報を含ませるために定義されたコンテナであって、ハンドラー参照ボックスhdlr212及びメディア情報コンテナminf(図示せず)を含む。そして、前記メディア情報コンテナminfは、当該ESによって表現される映像のサイズ情報を含ませるためのボックス(このボックスは、例えば、ステレオスコピックヘッダボックスsshd213であり、その名称は変更されうる)とサンプルテーブルボックスstbl216とを含む。
ハンドラー参照ボックス212は、当該ESのストリーム類型を定義する情報を含む。当該ESがステレオスコピック映像を符号化したデータである場合には、ハンドラー参照ボックス212に含まれる情報の値を、例えば、‘ssvi’と表示することができる。ハンドラー参照ボックス212に対して整理すれば、次の通りである。
hdlr(Handler Reference)
−Box Type:‘hdlr’
−Container:Media Box(‘media’)
−Mandatory:Yes
−Quantity:Exactly one
以上の内容を通じて分かるように、hdlrボックス212は必須な構成要素であり、mediaコンテナ211にただ一つのみ存在する。hdlrボックス211に対するシンタックスの一例は、図12に示されている。図12で要素‘handler_type’は、メディアデータに対するストリーム状を定義するためのものである。既存のストリームについての定義に、本発明の対象であるステレオスコピック映像ストリームについての定義が含まれたストリーム状の類型に対する一例は、表2のようである。
Figure 2010530160
ステレオスコピックヘッダボックス213は、当該ESによって表現される映像のサイズ情報を含む。例えば、ステレオスコピックヘッダボックス213には、当該ESによって表現されるステレオスコピック統合映像の幅(Width)情報及び/または高さ(Height)情報を含みうる。このようなステレオスコピックヘッダボックス213に対するシンタックスの一例は、図13に示されている。図13でStereoScopic_CompoundImageWidthは、ステレオスコピック統合合成映像の幅を表わし、StereoScopic_CompoundImageHeightは、ステレオスコピック統合合成映像の高さを表わす。このようなステレオスコピックヘッダボックス213を整理すれば、次の通りである。
sshd(StereoScopic Header)
−Box Type:‘sshd’、‘vmhd’、‘smhd’、‘hmhd’
−Container:MediaInformation Box(‘minf’)
−Mandatory:Yes(must be present)
−Quantity:Exactly one
これを通じて分かるように、sshdボックス213は必須な構成要素であり、minfコンテナ(図示せず)に一つのみ存在する。minfコンテナには、sshdボックス213の以外に異なる類型のメディアに対するヘッダボックスをさらに含みうるが、minfコンテナに含まれるヘッダボックスの値に対する一例は、表3に表われている。
Figure 2010530160
次いで、図9及び図10を参照すれば、ステレオスコピックヘッダボックス213は、当該ステレオスコピック映像の獲得に用いた左右カメラと関連した情報を含ませるためのボックスと当該ステレオスコピック映像のディスプレイに用いられるディスプレイ装置と関連した情報を含ませるためのボックスとをさらに含む。前記ボックスは、それぞれステレオスコピックカメラ情報ボックスssci214とステレオスコピックディスプレイ情報ボックスssdi215とであり、その名称は変更されることもある。
ステレオスコピックカメラ情報ボックスssci214には、左右カメラと関連した情報であって、例えば、左側カメラと右側カメラとの距離に関する情報などが含まれうる。次は、ステレオスコピックカメラ情報ボックス214に対する概要を整理したものである。
ssci(StereoScopic Camera Information)
−Box Type:‘ssci’
−Container:Stereoscopic Header Box(‘sshd’)
−Mandatory:No
−Quantity:Zero or One
以上の概要を通じて分かるように、ssciボックス214は任意的な構成要素であり、含まれる場合には、コンテナであるsshdボックス213に一つのみ存在する。ssciボックス214に対するシンタックスの一例は、図14に示されている。図14で要素‘StereoScopicCamera_Left_Right−Distance’は、左右カメラ間の距離を表わす。
そして、ステレオスコピックディスプレイ情報ボックス215には、ディスプレイ装置と関連した情報であって、例えば、バリアパターンの類型に関する情報及び/またはバリアパターンの間隔に関する情報などが含まれうる。次は、ステレオスコピックディスプレイ情報ボックス215の概要を整理したものである。
ssdi(StereoScopic Display Information)
−Box Type:‘ssdi’
−Container:Stereoscopic Header Box(‘sshd’)
−Mandatory:No
−Quantity:Zero or One
これを通じて分かるように、ssdiボックス215は任意的な構成要素であり、含まれる場合には、コンテナであるsshdボックス213に一つのみ存在する。ssdiボックス215に対するシンタックスの一例は、図15に示されている。図15で要素‘StereoScopic_Barrier_Pattern’は、バリアパターンの類型を表わすが、その値は、例えば、表4のように割り当てられる。そして、要素‘StereoScopic_Barrier_Distance’は、バリアパターンの間隔を表わすものであって、その値が‘0’である場合には、非定率を表わし、その値が‘1’である場合には、定率を表わす。ここで、‘定率’とは、バリアパターンの間隔がディスプレイ装置の位置に関係なく一定していることを示し、‘非定率’とは、バリアパターンの間隔がディスプレイ装置に位置(例えば、中心部分と縁部部分)によって異なることを示す。
Figure 2010530160
次いで、図9及び図10を参照すれば、タイム/スペースマップ(time/space map)のためのコンテナであるサンプルテーブルボックス216は、サンプルデスクリプションボックスstsd217を含む。サンプルデスクリプションボックス217は、トラックコンテナ210に定義されたメディアストリームESのデスクリプションを定義するためのものであって、ステレオスコピックビジュアルサンプルエントリー(StereoscopicVisual Sample Entry)を指示するボックスを含む。このボックスは、例えば、mpssボックス218と称することができるが、これに限定されるものではない。サンプルデスクリプションボックス217は、mpssボックス218の以外にもビジュアルサンプルエントリー(Visual Sample Entry)を指示するmp4vボックスとオーディオサンプルエントリー(Audio Sample Entry)を指示するmp4aボックスなどをさらに含みうる。
mpssボックス218は、符号化されたステレオスコピック映像データを構成するESについての詳細情報を記述するためのボックスコンテナである。mpssボックス218に対する主な事項を整理すれば、次の通りである。
mpss(StereoScopic Visual Sample Entry)
−Box Type:‘mpss’、‘mp4v’、‘mp4a’
−Container:Stereoscopic Table Box(‘stbl’)
−Mandatory:Yes
−Quantity:Exactly One
これを通じて分かるように、mpssボックス218は必須な構成要素であり、stblコンテナ217に一つのみ存在する。stblコンテナ217には、mpssボックス218の以外に異なる類型のメディアに対するサンプルエントリーがさらに含まれうるが、stblコンテナ217に含まれるサンプルエントリーの一例は、表5に表われている。
Figure 2010530160
mpssボックス218は、被符号化フレームの構成方法に関する情報及びそれによって派生されるさまざまな情報などを含む。mpssボックス218に含まれる情報は、符号化されたステレオスコピック映像データを構成するESの数及び/または当該ESに対応する被符号化フレームの類型などによって多少変わることもできる。より具体的に、mpssボックス218には、被符号化フレームの類型(構成方法)に関する情報、左映像と右映像とのフレーム率に関する情報、被符号化フレームを構成する映像の大きさ、被符号化フレームを構成するフィールドのライン数、及び/または被符号化フレームを構成する左右映像のディスパリティ情報などが含まれうる。以下、符号化されたステレオスコピック映像データのES個数によってmpssボックス218に含まれる情報の内容について詳しく説明する。
まず、ESが1つのである場合について説明する。ESが1つのである場合に、それによる被符号化フレームの構成方法は、例えば、図2ないし図4に開示されている方法のうちの何れか一つになりうる。図2ないし図4に開示されている被符号化フレームの構成方法は、総5種であって、mpssボックス218に含まれる情報は、前記5種類型をいずれも支援しなければならない。したがって、mpssボックス218には、まず当該ESを構成する被符号化フレームの類型を指示する情報が含まれる。被符号化フレームの類型は、‘StereoScopic_CompositionType’で表現され、その値は3ビットを用いて、次の表6のように割り当てられる。表6は、単に例示的なものである。
Figure 2010530160
そして、被符号化フレームが、図2及び図3に示されたフレーム22、24、32、34である場合に、mpssボックス218には、被符号化フレームの大きさに関する情報がさらに含まれうる。例えば、被符号化フレームが、図2の左側に示されたフレーム22である場合には、映像の幅を表わす情報が含まれ、被符号化フレームが、図2の右側に示されたフレーム24である場合には、映像の高さを表わす情報が含まれうる。そして、被符号化フレームが、図3の左側に示されたフレーム32である場合には、交差された垂直ラインのフィールド単位の幅を表わす情報が含まれ、被符号化フレームが、図3の右側に示されたフレーム34である場合には、交差された水平ラインのフィールド単位の幅を表わす情報が含まれうる。
このような被符号化フレームの大きさに関する情報は、‘width_or_height’で表現することができ、例えば、表6に開示されたStereoScopic_CompositionTypeの値が‘0b001’である場合に、前記‘width_or_height’の値は映像の幅、‘0b010’である場合は、映像の高さ、‘0b011’である場合は、交差された垂直ラインのフィールド単位の幅、または‘0b100’である場合は、交差された水平ラインのフィールド単位の高さを表すことができる。
また、被符号化フレームが、図2及び図3に示されたフレーム22、24、32、34である場合に、mpssボックス218には、被符号化フレームの構成映像である奇数ラインフィールド及び偶数ラインフィールドを構成するラインの数に関する情報が含まれうる。例えば、被符号化フレームが、図2に示されたフレーム22、24である場合には、前記フィールドラインの数が0になるが、図3に示されたフレーム32、34である場合には、奇数ラインフィールドを構成するラインの数及び/または偶数ラインフィールドを構成するラインの数を表わす情報が含まれうる。
このような奇数ラインフィールドを構成するラインの数に関する情報は、‘odd_field_count’で表現し、偶数ラインフィールドを構成するラインの数に関する情報は、‘even_field_count’で表現することができる。例えば、表6に開示されたStereoScopic_CompositionTypeが‘0b001’と‘0b010’である場合に、‘odd_field_count’と‘even_field_count’は、いずれも‘0’になり、‘0b011’と‘0b100’とである場合は、‘odd_field_count’と‘even_field_count’は、それぞれ奇数ラインの数及び偶数ラインの数を表すことができる。
mpssボックス218には、また左映像と右映像と間または奇数ラインフィールドと偶数ラインフィールドと間のフレーム率が同一であるかと、もしフレーム率が異なる場合には、同期化方法を表わす情報がさらに含まれうる(フレーム率の関連情報)。ここで、同期化方法とは、二つの映像のフレーム率が異なる場合に、ディスプレイ時にある映像を基準にしてフレーム率を一致させるかを表わす情報であり得る。すなわち、同期化方法に関する情報は、基準映像をある映像にすることを指示する情報であり得る。このようなフレーム率及び/または同期化方法に関する情報は、‘StereoScopic_ES_FrameSync’で表現し、2ビットを用いて表7のように割り当てられる。表7は、ESが1である場合であって、例示的なものである。
Figure 2010530160
mpssボックス218には、また左映像と右映像と間または奇数ラインフィールドと偶数ラインフィールドと間のイメージ情報(例えば、Y/Cb/Cr値またはR/G/B値)の差、すなわち、ディスパリティがあるかどうかを指示する情報と、もしディスパリティがある場合には、ディスパリティ値がさらに含まれうる(ディスパリティの関連情報)。ここで、ディスパリティ値とは、何れか一つの映像(またはフィールド)を基準にした他の映像(またはフィールド)との差値を表わす情報である。このようなディスパリティの関連情報は、ディスプレイされるステレオスコピック映像の立体感を補正するためのものである。
このようなディスパリティの関連情報中で、ディスパリティがあるかどうかを指示する情報は、‘StereoScopic_ImageInformationDifference’で表現し、2ビットを用いて表8のように割り当てられる。表8も、ESが1である場合であって、例示的なものである。
Figure 2010530160
ディスパリティの関連情報中で、ディスパリティ値は、イメージ情報の差として表現される。イメージ情報を表現する方法は、さまざまであるが、その中で代表的な方法が、Y/Cb/CrまたはR/G/Bである。したがって、ディスパリティ値も、それを用いて次のように表現することができる。
Y_or_R_difference:イメージ情報Y値の差またはR値の差を表わす。
Cb_or_G_difference:イメージ情報Cb値の差またはG値の差を表わす。
Cr_or_B_difference:イメージ情報Cr値の差またはB値の差を表わす。
次いで、ESが2つである場合について説明する。ESが2つである場合に、それによる被符号化フレームの構成方法は、例えば、図5または図6に開示されている方法のうちの何れか一つになりうる。ESが2つである場合には、moovコンテナ200は2つのトラックコンテナ、すなわち、track1コンテナ及びtrack2コンテナを含む。そして、各トラックコンテナには、当該ESに対するメタデータ情報が含まれうる。以下では、前述したESが1つである場合との差点を中心に説明する。
符号化されたステレオスコピック映像データのESが2つである場合に、mpssボックス218には、まず当該ESを構成する被符号化フレームの類型を指示する情報が含まれる。図5及び図6を参照すれば、被符号化フレームの類型は、四種、すなわち、左映像、右映像、基準映像、及び差分映像になりうるので、mpssボックス218には、これを指示する情報が含まれる。被符号化フレームの類型は、‘StereoScopic_ES_Type’で表現され、その値は、2ビットを用いて次の表9のように割り当てられる。表9は、単に例示的なものである。
Figure 2010530160
mpssボックス218には、また左映像と右映像と間のフレーム率が同一であるかと、もしフレーム率が異なる場合には、左映像と右映像とを同期化方法を表わす情報がさらに含まれうる(フレーム率の関連情報)。このようなフレーム率の関連情報は、被符号化フレームが、図5に示されたフレーム(左映像と右映像とで構成されたフレーム)である場合にのみ含まれ、被符号化フレームが、図6に示されたフレームである場合には、含まれない。このようなフレーム率及び/または同期化方法に関する情報は、‘StereoScopic_ES_FrameSync’で表現し、2ビットを用いて表10のように割り当てられる。但し、表10は、ESが2である場合であって、例示的なものである。
Figure 2010530160
mpssボックス218には、また左映像と右映像と間のイメージ情報(例えば、Y/Cb/Cr値またはR/G/B値)の差、すなわち、ディスパリティがあるかどうかを指示する情報と、もしディスパリティがある場合には、ディスパリティ値がさらに含まれうる(ディスパリティの関連情報)。このようなディスパリティの関連情報も、被符号化フレームが図5に示されたフレーム(左映像と右映像とで構成されたフレーム)である場合にのみ含まれ、被符号化フレームが、図6に示されたフレームである場合には、含まれない。ディスパリティの関連情報は、‘StereoScopic_ImageInformationDifference’で表現し、2ビットを用いて表11のように割り当てられる。但し、表11も、ESが2である場合であって、例示的なものである。
Figure 2010530160
そして、イメージ情報の差であるディスパリティ値は、当該ESのmpssボックス218ではない対となる他のESのmpssボックスに含まれる。この場合、ディスパリティがあるかどうかを表わす情報とディスパリティ値を指示する情報は、2つのESに分散されて含まれうる。
被符号化フレームの類型を表わすステレオスコピックESタイプが、図6に示された映像である場合には、被符号化フレーム自体が基準映像と差分映像とに分けられる。したがって、‘StereoScopic_ES_Type’が基準映像または差分映像を指示する場合には、当該ESに対してはフレーム率の関連情報とディスパリティの関連情報とが必要ではない。したがって、ESが2つである場合であって、被符号化フレームが、図6に示された映像である場合には、mpssボックス218には、これら情報が含まれない。
次いで、ESが3つ以上である場合について説明する。ESが3つ以上である場合の被符号化フレームは、図7に示されているが、基準映像と差分映像とで構成されているという点で図6に示された被符号化フレーム構成と同一である。したがって、ESが3つ以上である場合に、mpssボックス218に含まれる情報は、ESが2つであって、被符号化フレーム類型が、図6である場合と同一であるので、以下では、これについての詳細な説明は省略する。
前述した情報を含むmpssボックス218に対するシンタックスの一例は、図16ないし図19に示されている。図16ないし図19に示されたシンタックスは、元々一つに表現されなければならないものや、ここでは、地面の制約によって分離して示す。したがって、図16に示されたシンタックス部分に後続して、図17に示されたシンタックス部分に連結され、その後に、図18及び図19のシンタックス部分が順次に繋がる。そして、前記シンタックスについての説明は、前記で詳細に説明したので、これについての敷衍説明は省略する。
次いで、図8を参照すれば、映像データ部mdat300であるmdatコンテナは、被符号化フレームに対する符号化されたイメージ情報を含む。そのために、mdatコンテナは、一つまたはそれ以上のステレオスコピック映像データコンテナ(Stereoscopic Image Data)310を含むが、それぞれステレオスコピック映像データコンテナ310は、メタデータ部200に含まれるそれぞれのトラックコンテナtrack210に対応する。したがって、映像データ部300は、ESの個数に相応するステレオスコピック映像データコンテナ310を含む。そして、各ステレオスコピック映像データコンテナ310に含まれる映像データの種類は、既存の映像データと大差がないために、以下では、これについての詳細な説明は省略する。
以上、本発明の一実施形態について詳細に説明したが、このような実施形態は、単に例示的なものであって、本発明の技術思想は、さまざまな方法で具現することが可能であるということは、当業者に自明である。
本発明は、ステレオスコピック映像コデックスと関連する。

Claims (14)

  1. 符号化されたステレオスコピック映像データのファイルを構成する方法において、
    前記ファイルは、
    前記ファイルがステレオスコピック映像に関するものであるか否かを指示するためのフィイルタイプ宣言部と、
    前記符号化されたステレオスコピック映像データのメタデータを含ませるための一つまたはそれ以上のトラックコンテナを含むメタデータ部と、
    前記符号化されたステレオスコピック映像データのイメージ情報を含ませるための一つまたはそれ以上のステレオスコピック映像データコンテナを含む映像データ部と、
    を含むことを特徴とする符号化されたステレオスコピック映像データファイルの構成方法。
  2. 前記フィイルタイプ宣言部は、
    前記ファイルがステレオスコピック映像に関するものであるか否かを指示するための第1情報及び前記ファイルを構成する基本ストリームESの個数を指示するための第2情報を含むことを特徴とする請求項1に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  3. 前記トラックコンテナと前記ステレオスコピック映像データコンテナとの個数は、それぞれ前記第2情報の値と同一であることを特徴とする請求項2に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  4. 前記トラックコンテナは、
    当該基本ストリームESの類型を指示するためのハンドラー参照コンテナと、
    前記当該ESのメタデータを含ませるためのメディア情報コンテナと、
    を含むことを特徴とする請求項2に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  5. 前記メディア情報コンテナは、
    被符号化フレームの大きさを指示する情報を含むステレオスコピックヘッダコンテナを含むことを特徴とする請求項4に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  6. 前記ステレオスコピックヘッダコンテナは、
    前記ステレオスコピック映像の獲得に用いた左右カメラ間の距離を表わす情報を含ませるためのコンテナを含むことを特徴とする請求項5に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  7. 前記ステレオスコピックヘッダコンテナは、
    前記ステレオスコピック映像のディスプレイに用いられるバリア型ディスプレイ装置のバリアパターンの距離を指示する情報及び/または前記バリアパターン間の間隔を指示する情報を含ませるためのコンテナを含むことを特徴とする請求項5に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  8. 前記メディア情報コンテナは、
    前記当該ESのデスクリプションを定義するためのサンプルデスクリプションコンテナを含むことを特徴とする請求項4に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  9. 前記サンプルデスクリプションコンテナは、
    被符号化フレームの構成方法を指示するES類型の情報を含むことを特徴とする請求項8に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  10. 前記フィイルタイプ宣言部の前記第2情報が、前記ESの個数が1つであると指示し、
    前記ES類型の情報が指示する前記被符号化フレームは、左右映像がフレーム単位で時間方向に交互に配列された第1類型、左映像と右映像とがサイドバイサイド方式で配列された第2類型、左映像と右映像とがトップダウン方式で配列された第3類型、左右映像の垂直ピクセルラインが交互に配列された第4類型、及び左右映像の水平ピクセルラインが交互に配列された第5類型のうち何れか一つであることを特徴とする請求項9に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  11. 前記ES類型の情報が、前記第2類型ないし第5類型のうち何れか一つを指示し、
    前記サンプルデスクリプションコンテナは、前記被符号化フレームを構成する左右映像間のフレーム率の関連情報及び/またはディスパリティの関連情報をさらに含むことを特徴とする請求項10に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  12. 前記フレーム率の関連情報は、
    前記左右映像のフレーム率が同一であるか否かと前記左右映像のフレーム率が異なる場合には、前記ステレオスコピック映像のディスプレイ時にフレーム率を一致させるための情報を含むことを特徴とする請求項11に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  13. 前記ディスパリティの関連情報は、
    前記左右映像のディスパリティがあるか否かと前記左右映像のディスパリティがある場合には、前記ディスパリティを補正するための情報を含むことを特徴とする請求項11に記載の符号化されたステレオスコピック映像データファイルの構成方法。
  14. 前記フィイルタイプ宣言部の前記第2情報が、前記ESの個数が2つであると指示し、
    前記ES類型の情報が指示する前記被符号化フレームは、左映像、右映像、基準映像、及び差分映像のうち何れか一つであることを特徴とする請求項9に記載の符号化されたステレオスコピック映像データファイルの構成方法。
JP2010511112A 2007-06-07 2008-06-05 符号化されたステレオスコピック映像データファイルのフォーマット Pending JP2010530160A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20070055620 2007-06-07
KR1020070075212A KR100962696B1 (ko) 2007-06-07 2007-07-26 부호화된 스테레오스코픽 영상 데이터 파일의 구성방법
PCT/KR2008/003145 WO2008150111A1 (en) 2007-06-07 2008-06-05 Format for encoded stereoscopic image data file

Publications (1)

Publication Number Publication Date
JP2010530160A true JP2010530160A (ja) 2010-09-02

Family

ID=40368088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010511112A Pending JP2010530160A (ja) 2007-06-07 2008-06-05 符号化されたステレオスコピック映像データファイルのフォーマット

Country Status (6)

Country Link
US (1) US20100171812A1 (ja)
EP (1) EP2174512A4 (ja)
JP (1) JP2010530160A (ja)
KR (2) KR100962696B1 (ja)
CN (1) CN101711483B (ja)
WO (1) WO2008150111A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010130690A (ja) * 2008-11-28 2010-06-10 Korea Electronics Telecommun 多視点映像送受信装置及びその方法
JP2011509552A (ja) * 2007-12-10 2011-03-24 サムスン エレクトロニクス カンパニー リミテッド 2d映像及び3d立体映像を含む映像ファイルの生成及び再生を行うためのシステム及び方法
JP2011511593A (ja) * 2008-02-05 2011-04-07 サムスン エレクトロニクス カンパニー リミテッド メディアファイルを生成してディスプレイする装置及び方法
WO2012029885A1 (ja) * 2010-09-03 2012-03-08 ソニー株式会社 画像処理装置および方法
JP2012512554A (ja) * 2008-12-15 2012-05-31 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像ベースの3dビデオフォーマット
US8644597B2 (en) 2007-06-11 2014-02-04 Samsung Electronics Co., Ltd System and method for generating and regenerating 3D image files based on 2D image media standards
US8842903B2 (en) 2007-12-10 2014-09-23 Samsung Electronics Co., Ltd. System and method for generating and reproducing image file including 2D image and 3D stereoscopic image
JP2016506693A (ja) * 2013-01-04 2016-03-03 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチビューコード化プラス深度のためのトラックにおけるテクスチャビューと深度ビューの存在の指示

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4210330A1 (en) 2007-04-12 2023-07-12 Dolby International AB Tiling in video decoding and encoding
US8400497B2 (en) 2007-09-07 2013-03-19 Samsung Electronics Co., Ltd Method and apparatus for generating stereoscopic file
KR100959534B1 (ko) * 2007-10-08 2010-05-27 엘지전자 주식회사 Maf 파일 포맷을 구성하는 방법 및 이를 이용한 비디오 신호의 디코딩 장치
WO2009099307A1 (en) * 2008-02-05 2009-08-13 Samsung Electronics Co., Ltd Apparatus and method for generating and displaying media files
EP3197155A1 (en) 2008-07-20 2017-07-26 Dolby Laboratories Licensing Corp. Compatible stereoscopic video delivery
US8385404B2 (en) * 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
KR101176065B1 (ko) * 2008-12-22 2012-08-24 한국전자통신연구원 스테레오스코픽 영상에 관한 데이터를 전송하는 방법, 스테레오스코픽 영상을 재생하는 방법, 및 스테레오스코픽 영상 데이터의 파일 생성 방법
KR101547151B1 (ko) * 2008-12-26 2015-08-25 삼성전자주식회사 영상 처리 방법 및 장치
JP5809064B2 (ja) * 2009-01-20 2015-11-10 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 3d画像データの転送
WO2010085361A2 (en) 2009-01-26 2010-07-29 Thomson Licensing Frame packing for video coding
JP4985807B2 (ja) * 2009-04-15 2012-07-25 ソニー株式会社 再生装置および再生方法
EP2422522A1 (en) 2009-04-20 2012-02-29 Dolby Laboratories Licensing Corporation Directed interpolation and data post-processing
GB2470402A (en) * 2009-05-21 2010-11-24 British Broadcasting Corp Transmitting three-dimensional (3D) video via conventional monoscopic (2D) channels as a multiplexed, interleaved data stream
JP5185202B2 (ja) 2009-06-03 2013-04-17 キヤノン株式会社 画像処理装置及び画像処理装置の制御方法
WO2010151555A1 (en) 2009-06-24 2010-12-29 Dolby Laboratories Licensing Corporation Method for embedding subtitles and/or graphic overlays in a 3d or multi-view video data
TW201119353A (en) 2009-06-24 2011-06-01 Dolby Lab Licensing Corp Perceptual depth placement for 3D objects
JP5428697B2 (ja) * 2009-09-16 2014-02-26 ソニー株式会社 受信装置、受信方法、送信装置およびコンピュータプログラム
JP2011087194A (ja) * 2009-10-16 2011-04-28 Sony Corp 画像処理装置および画像処理方法
JP5722349B2 (ja) 2010-01-29 2015-05-20 トムソン ライセンシングThomson Licensing ブロックに基づくインターリーブ
US9426441B2 (en) 2010-03-08 2016-08-23 Dolby Laboratories Licensing Corporation Methods for carrying and transmitting 3D z-norm attributes in digital TV closed captioning
WO2011162474A2 (ko) 2010-06-24 2011-12-29 주식회사 이시티 스트레오스코픽 동영상 파일의 구성 방법
US8817072B2 (en) 2010-03-12 2014-08-26 Sony Corporation Disparity data transport and signaling
IT1399417B1 (it) * 2010-04-12 2013-04-16 Sisvel Technology Srl Metodo per la generazione e ricostruzione di un flusso video stereoscopico compatibile e relativi dispositivi di codifica e decodifica.
JP5512038B2 (ja) * 2010-04-20 2014-06-04 サムスン エレクトロニクス カンパニー リミテッド メディアデータを送受信するためのインターフェース装置及び方法
WO2011155776A2 (ko) 2010-06-09 2011-12-15 삼성전자 주식회사 프래그먼트 기반의 멀티미디어 스트리밍 서비스 제공 방법과 그 장치, 그리고 프래그먼트 기반의 멀티미디어 스트리밍 서비스 수신 방법과 그 장치
CN102959952B (zh) * 2010-06-27 2016-07-06 Lg电子株式会社 数字接收器以及在数字接收器中处理字幕数据的方法
JP5749340B2 (ja) * 2010-07-21 2015-07-15 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
CN102340681A (zh) * 2010-07-26 2012-02-01 深圳市锐取软件技术有限公司 3d立体视频单文件双视频流录制方法
WO2012050758A1 (en) * 2010-10-12 2012-04-19 Dolby Laboratories Licensing Corporation Joint layer optimization for a frame-compatible video delivery
EP2697975A1 (en) 2011-04-15 2014-02-19 Dolby Laboratories Licensing Corporation Systems and methods for rendering 3d images independent of display size and viewing distance
CN102404577A (zh) * 2011-12-01 2012-04-04 无锡太行电子技术有限公司 3d立体视频编码存储方法
US9584793B2 (en) 2012-04-09 2017-02-28 Intel Corporation Signaling three-dimensional video information in communication networks
US11290510B2 (en) 2012-11-29 2022-03-29 Samsung Electronics Co., Ltd. Method and apparatus for encapsulation of motion picture experts group media transport assets in international organization for standardization base media files
WO2019138929A1 (ja) * 2018-01-12 2019-07-18 ソニー株式会社 情報処理装置および方法
US10939086B2 (en) 2018-01-17 2021-03-02 Mediatek Singapore Pte. Ltd. Methods and apparatus for encoding and decoding virtual reality content
US10944977B2 (en) 2018-04-03 2021-03-09 Mediatek Singapore Pte. Ltd. Methods and apparatus for encoding and decoding overlay compositions
US10869016B2 (en) 2018-04-12 2020-12-15 Mediatek Singapore Pte. Ltd. Methods and apparatus for encoding and decoding virtual reality content

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006013760A (ja) * 2004-06-24 2006-01-12 Matsushita Electric Ind Co Ltd 管理ファイルを生成する電子機器、3次元画像データを生成する電子機器、管理ファイル生成方法、3次元画像データ生成方法および管理ファイルのファイル構造
US20070041444A1 (en) * 2004-02-27 2007-02-22 Gutierrez Novelo Manuel R Stereoscopic 3D-video image digital decoding system and method
KR100716142B1 (ko) * 2006-09-04 2007-05-11 주식회사 이시티 스테레오스코픽 영상 데이터의 전송 방법

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3459721B2 (ja) * 1995-05-22 2003-10-27 キヤノン株式会社 立体画像表示方法及びそれを用いた立体画像表示装置
JP2002095018A (ja) * 2000-09-12 2002-03-29 Canon Inc 画像表示制御装置及び画像表示システム、並びに画像データの表示方法
JP3789794B2 (ja) 2001-09-26 2006-06-28 三洋電機株式会社 立体画像処理方法、装置、およびシステム
KR100397511B1 (ko) 2001-11-21 2003-09-13 한국전자통신연구원 양안식/다시점 3차원 동영상 처리 시스템 및 그 방법
JP2003173625A (ja) * 2001-12-04 2003-06-20 Hitachi Ltd ファイル変換方法、ファイル変換装置、及びファイル生成装置
EP1501316A4 (en) * 2002-04-25 2009-01-21 Sharp Kk METHOD FOR GENERATING MULTIMEDIA INFORMATION, AND DEVICE FOR REPRODUCING MULTIMEDIA INFORMATION
JP2005026800A (ja) 2003-06-30 2005-01-27 Konica Minolta Photo Imaging Inc 画像処理方法、撮像装置、画像処理装置及び画像記録装置
WO2005060259A2 (ja) * 2003-12-02 2005-06-30 Matsushita Electric Ind Co Ltd Avコンテンツをダウンロード型のファイル形式で配信する方法および装置
JP4589651B2 (ja) * 2004-04-26 2010-12-01 オリンパス株式会社 画像処理装置、画像加工・編集装置、画像ファイル再生装置、画像処理方法、画像加工・編集方法及び画像ファイル再生方法
JP4529556B2 (ja) * 2004-06-24 2010-08-25 パナソニック株式会社 立体視用の画像ファイルを生成する電子機器、3次元画像データを生成する電子機器、画像ファイル生成方法、3次元画像データ生成方法および画像ファイルのファイル構造
KR100704664B1 (ko) * 2005-06-07 2007-04-09 삼성전자주식회사 프레임송출장치 및 프레임수신장치
JP4630150B2 (ja) * 2005-07-26 2011-02-09 シャープ株式会社 立体画像記録装置及びプログラム
KR100704938B1 (ko) 2006-08-25 2007-04-09 주식회사 이시티 스테레오스코픽 영상의 부호화/복호화 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070041444A1 (en) * 2004-02-27 2007-02-22 Gutierrez Novelo Manuel R Stereoscopic 3D-video image digital decoding system and method
JP2006013760A (ja) * 2004-06-24 2006-01-12 Matsushita Electric Ind Co Ltd 管理ファイルを生成する電子機器、3次元画像データを生成する電子機器、管理ファイル生成方法、3次元画像データ生成方法および管理ファイルのファイル構造
KR100716142B1 (ko) * 2006-09-04 2007-05-11 주식회사 이시티 스테레오스코픽 영상 데이터의 전송 방법

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8644597B2 (en) 2007-06-11 2014-02-04 Samsung Electronics Co., Ltd System and method for generating and regenerating 3D image files based on 2D image media standards
US8842903B2 (en) 2007-12-10 2014-09-23 Samsung Electronics Co., Ltd. System and method for generating and reproducing image file including 2D image and 3D stereoscopic image
JP2011509552A (ja) * 2007-12-10 2011-03-24 サムスン エレクトロニクス カンパニー リミテッド 2d映像及び3d立体映像を含む映像ファイルの生成及び再生を行うためのシステム及び方法
JP2011511593A (ja) * 2008-02-05 2011-04-07 サムスン エレクトロニクス カンパニー リミテッド メディアファイルを生成してディスプレイする装置及び方法
JP2010130690A (ja) * 2008-11-28 2010-06-10 Korea Electronics Telecommun 多視点映像送受信装置及びその方法
JP2012512554A (ja) * 2008-12-15 2012-05-31 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像ベースの3dビデオフォーマット
WO2012029885A1 (ja) * 2010-09-03 2012-03-08 ソニー株式会社 画像処理装置および方法
JP2016506693A (ja) * 2013-01-04 2016-03-03 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチビューコード化プラス深度のためのトラックにおけるテクスチャビューと深度ビューの存在の指示
JP2016507967A (ja) * 2013-01-04 2016-03-10 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチビューコード化プラス深度のためのテクスチャ及び深度ビューの分離トラック記憶
JP2016508335A (ja) * 2013-01-04 2016-03-17 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチビューコード化フォーマットでの参照ビューへの現在ビュー依存性の指示
US10791315B2 (en) 2013-01-04 2020-09-29 Qualcomm Incorporated Signaling of spatial resolution of depth views in multiview coding file format
US10873736B2 (en) 2013-01-04 2020-12-22 Qualcomm Incorporated Indication of current view dependency on reference view in multiview coding file format
US11178378B2 (en) 2013-01-04 2021-11-16 Qualcomm Incorporated Signaling of spatial resolution of depth views in multiview coding file format

Also Published As

Publication number Publication date
KR101288932B1 (ko) 2013-07-22
WO2008150111A1 (en) 2008-12-11
KR20080107955A (ko) 2008-12-11
KR20090127246A (ko) 2009-12-10
US20100171812A1 (en) 2010-07-08
EP2174512A4 (en) 2013-05-01
CN101711483B (zh) 2012-05-30
CN101711483A (zh) 2010-05-19
KR100962696B1 (ko) 2010-06-11
EP2174512A1 (en) 2010-04-14

Similar Documents

Publication Publication Date Title
JP2010530160A (ja) 符号化されたステレオスコピック映像データファイルのフォーマット
US9781403B2 (en) Method and apparatus for generating stereoscopic file
US8396906B2 (en) Metadata structure for storing and playing stereoscopic data, and method for storing stereoscopic content file using this metadata
JP5231563B2 (ja) 立体映像データを記録する方法
EP2757788B1 (en) Metadata structure for storing and playing stereoscopic data, and method for storing stereoscopic content file using this metadata
US8538134B2 (en) Method and apparatus for receiving and generating image data stream including parameters for displaying local three dimensional image
EP2001235B1 (en) MPEG-4 format extension for recording stereoscopic or synthetic 3D video data with related metadata
US20090208119A1 (en) Method for generating and playing image files for slideshows
AU2010250871B2 (en) Entry points for 3D trickplay
US20090148070A1 (en) System and method for generating and reproducing image file including 2d image and 3d stereoscopic image
US20090199100A1 (en) Apparatus and method for generating and displaying media files
JP2009182953A (ja) ステレオスコピック映像の部分データ区間の再生のためのステレオスコピック映像データストリーム生成方法及び装置、ステレオスコピック映像の部分データ区間の再生方法及び装置
RU2462771C2 (ru) Устройство и способ для генерации и отображения медиа-файлов
JP2010503310A (ja) 符号化されたステレオスコピック映像データのファイルフォーマット
KR100959534B1 (ko) Maf 파일 포맷을 구성하는 방법 및 이를 이용한 비디오 신호의 디코딩 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121228

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130423