JP5022443B2 - 立体映像コンテンツ再生に利用されるメタデータの復号化方法 - Google Patents

立体映像コンテンツ再生に利用されるメタデータの復号化方法 Download PDF

Info

Publication number
JP5022443B2
JP5022443B2 JP2009535205A JP2009535205A JP5022443B2 JP 5022443 B2 JP5022443 B2 JP 5022443B2 JP 2009535205 A JP2009535205 A JP 2009535205A JP 2009535205 A JP2009535205 A JP 2009535205A JP 5022443 B2 JP5022443 B2 JP 5022443B2
Authority
JP
Japan
Prior art keywords
stereoscopic video
content
media data
video content
basic stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009535205A
Other languages
English (en)
Other versions
JP2010508752A (ja
Inventor
スク−ヒ チョ
クツ−ジン ユン
ナムホ ホー
ジン−ウン キム
ス−イン イ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Priority claimed from PCT/KR2007/005358 external-priority patent/WO2008054100A1/en
Publication of JP2010508752A publication Critical patent/JP2010508752A/ja
Application granted granted Critical
Publication of JP5022443B2 publication Critical patent/JP5022443B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • H04N21/42607Internal components of the client ; Characteristics thereof for processing the incoming bitstream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Description

本発明は、動画及び立体映像を含むコンテンツを円滑に再生するために必要なメタデータを定義し、メタデータ及びメタデータの復号を利用した保存フォーマット形成する方法と装置とに関するものである。
本発明は、韓国情報部及び情報通信研究振興院のIT次世代核心技術開発事業の一環として行われたものである(プロジェクトナンバー:2005−S−403−02、プロジェクト名:知能型統合情報放送(SmaR TV)技術開発)。
二次元(2D)映像及び動画を分配及び生成するために、aviファイル、MPEG−4 MP4ファイルなどの様々なフォーマットが開発された。しかしながら、立体映像ビデオについては、伝送方式についての研究が主に進められ、2007年1月からMPEGで、立体映像コンテンツの再生のための保存フォーマットに対する標準化が始まった。
ステレオカメラ又はコンピュータグラフィック/アニメーション作成プログラムによって獲得される立体映像及び動画を含むコンテンツのリアルタイム又はリアルタイムでない伝送及び再生をするために、所定の伝送ストリームフォーマット又は保存フォーマットが必要である。コンテンツを再生するために要求されるコンテンツ及びメタデータのメディアデータは、フォーマットのために必要とされる。
本発明は、ステレオカメラ又はCG/アニメーション作成プログラムによって獲得されて生成された立体映像及び動画を含むコンテンツを伝送し、又はそれらを保存した後にコンテンツを再生するために新たに要求されるメタデータを提供し、メタデータを定義して、メタデータがMPEG−4初期客体記述子、客体記述子、及び基礎ストリーム(ES:Elementary Stream)記述子の構造内部に含まれるようにし、立体映像及び動画を含むコンテンツがMPEG−4システムに基づいて伝送されること、又はコンテンツがMP4ファイルの形式で保存されるとき、コンテンツを効率的に再生することを可能にする。
また、本発明は、メタデータを含む新たな記述子も提供し、その記述子は、例えばMPEG−4初期客体記述子、客体記述子及びES記述子などの既存の記述子と互換性を維持するように定義し、その結果、既存のプレイヤを有するユーザは二次元映像を見ることができる。
また、本発明は、本発明によって提供されたメタデータを用いることによって、ユーザが選択することができる二次元、又は様々な立体ディスプレイモードを有するコンテンツを再生することができる機能を有する立体映像プレイヤ構造を提供し、それによってユーザに様々な視聴方法も提供する。
本発明のある態様によると、立体映像コンテンツ再生に利用されるメタデータを保存したコンピュータ可読記録媒体は、メタデータは、受信したコンテンツが立体映像コンテンツであるか、あるいは二次元(2D)コンテンツであるかを識別する識別コードを含む。受信したコンテンツが立体映像コンテンツである場合、メタデータは立体映像コンテンツが1つの基礎ストリームから構成されているか、あるいは2つの基礎ストリームから構成されているかを示す基礎ストリームコードをさらに含む。
メタデータは、立体映像コンテンツが1つの基礎ストリームを含むとき、基礎ストリームから復号化された左右映像のフォーマットがトップダウン(top-down)フォーマット、側面(side-by-side)フォーマット、フィールドシーケンシャルフォーマット又はフレームシーケンシャルフォーマットを含むかどうかを示す基礎ストリームフォーマットコードと、立体映像コンテンツが2つの基礎ストリームを構成する場合、立体映像コンテンツの付加メディアデータが第2視点映像、深さマップまたは双方向視差マップを表すかどうかを示すタイプコードと、立体映像コンテンツのメインメディアデータと付加メディアデータとの映像サイズ比を示すサイズコードと、基礎ストリーム記述子に記述される基礎ストリームが立体映像コンテンツの付加メディアデータであるかどうかを示す基礎ストリームフラグコードとのうち、少なくとも一つ以上を含むことができる。
本発明の他の態様によると、立体映像を復号化する装置を提供し、本装置は、立体映像コンテンツ再生に利用されるメタデータを保存したヘッダ、符号化されたメインメディアデータ、及び付加メディアデータを含むビットストリームを受信する受信部を備える。メタデータは、受信したコンテンツが立体映像コンテンツであるか、あるいは二次元(2D)コンテンツであるかを識別する識別コードを含む。受信したコンテンツが立体映像コンテンツである場合、メタデータは立体映像コンテンツが1つの基礎ストリームを含むか、あるいは2つの基礎ストリームを含むかを示す基礎ストリームコードをさらに含む。
本発明の他の態様によると、立体映像を復号化する装置を提供し、本装置は立体映像コンテンツ再生に利用されるメタデータを保存したヘッダ、符号化されたメインメディアデータ、及び付加メディアデータを含むビットストリームを受信する受信部と、ビットストリームに含まれるメタデータに基づいてユーザが二次元(2D)モード又は三次元(3D)モードのうちの一つを選択することを可能にする視聴モード選択部と、選択されたモードに従ってビットストリームを復号化することによって2D場面または3D場面のようなコンテンツを表示する表示部とを含む。
本発明の他の態様によると、立体映像を復号化する方法を提供し、本方法は、立体映像コンテンツ再生に利用されるメタデータを保存したヘッダ、符号化されたメインメディアデータ、及び付加メディアデータを含むビットストリームを受信するステップと、ビットストリームに含まれるメタデータに基づいてユーザが二次元(2D)モード又は三次元(3D)モードのうちの一つを選択することを可能にするステップと、選択されたモードに従ってビットストリームを復号化することによって2D場面または3D場面のようなコンテンツを表示するステップとを含む。
以下、添付された図面を参照しつつ本発明の好ましい実施形態を説明することによって、本発明が詳細に説明されるであろう。図面中の参照番号などは、構成要素などを示す。下記の説明において、関連した公知機能又は構成に係る詳細な説明は明瞭化の目的で省略される。
本発明によれば、立体映像及び動画を再生するために必要なメタデータを定義し、メタデータを含むMPEG−4基盤の記述子及びその構造を提供し、それによって立体映像コンテンツの伝送及び保存を可能にする。
MPEG−4の客体記述子の構成図である。 MPEG−4の初期客体記述子の構成図である。 MPEG−4のES記述子の構成図である。 本発明のメタデータを記述した記述子の例を示す図である。 本発明のメタデータを記述した記述子の例を示す図である。 本発明の実施形態にかかる立体映像コンテンツ再生のための復号化装置の概略図である。 立体映像コンテンツ処理のために提案したメタデータリストである表1を示す図である。 MPEG−4システムに定義されたDescriptorsに対するClass Tagsリストである表2を示す図である。 立体映像コンテンツ処理のために新たに提案したDescriptorsに対するClass Tagsリストである表3を示す図である。 立体映像コンテンツ処理のために提案したメタデータStereoVisualFormatの分類である表4を示す図である。 立体映像コンテンツ処理のために提案したメタデータStereoAdditionalVisualSizeの分類である表5を示す図である。 立体映像コンテンツ処理のために提案したメタデータStereoAdditionalVisualTypeの分類である表6を示す図である。 立体映像コンテンツ処理のために提案したメタデータStereoAdditionalVisual_ESの分類である表7を示す図である。
立体映像又は動画コンテンツは、左右2視点の映像がペアで構成されるか、又は1視点の映像及び深さマップ又は双方向視差マップで構成されることができる。後者の場合は、深さマップ又は双方向視差マップを利用し、1視点映像のペアになる残りの1視点の映像を仮想的に生成することによって、立体映像コンテンツを作ることになる。
本発明では、1視点の映像をメインメディアデータとして定義し、残りの1視点の映像、深さマップ及び双方向視差マップを付加メディアデータとして定義して説明する。
立体映像コンテンツを表示する方法には、さまざまなものがある。左右映像を重ねて表示する偏光方式、左右映像のフレームを交互に反復して再生するフレームシーケンシャル方式、左右映像のフィールド映像を交互に反復して再生するフィールドシーケンシャル方式、左映像の奇数ライン、右映像の偶数ラインのみをライン単位でインタリービングして再生する方式、左映像の奇数列,右映像の偶数列をピクセル単位でインタリービングして再生する方式が主に利用されている。
本発明で立体映像及び動画を含むコンテンツを伝送したり保存したりした後で再生するために新たに要求されるメタデータは、大きく見て次の通り整理できる。下記表1を参考にして説明すれば、次の通りである。
表1は、立体映像再生に必要なメタデータを整理したリストである。
メタデータは、識別コード、基礎ストリーム(ES)コード、ESフォーマットコード、サイズコード、タイプコード、ESフラグコードを含む。表1で、VisualContentsTypeは識別コード、NumberOFVisualES_mius1はESコードを示す。加えて、StereoVisualFormatはESフォーマットコード、StereoAdditionalVisualSizeはサイズコード、StereoAdditionalVisualTypeはタイプコード及びStereoAdditioanlVisual_ESflagはESフラグコードをそれぞれ示す。
立体映像コンテンツを処理するためには、伝送されてくるか、又は保存されているコンテンツが立体映像コンテンツであるか、既存の二次元コンテンツであるかを識別する情報が必要である。このために、メタデータの識別コード(VisualContentsType)は、受信したコンテンツが立体映像コンテンツであるか、あるいは二次元コンテンツであるかを識別する。
識別コードが受信したコンテンツが立体映像コンテンツであることを示す場合、ESコード(NumberOFVisualES_mius1)は、立体映像コンテンツが1つのESから構成されているか、あるいは2つのESから構成されているかを示す。すなわち、ESコードは、符号化された立体映像ESのメインメディアデータと付加メディアデータとが1つのESから構成されているか、あるいはそれぞれのESから構成されているかを示す。
ESフォーマットコード(StereoVisualFormat)は、立体映像コンテンツが1つのESから構成された場合、1つのESから復号化された左右映像のフォーマットが1フレーム内の上下に区分されているトップダウンフォーマットであるか、1フレーム内の左右に区分されている側面フォーマットであるか、左映像フィールドと右映像フィールドとが交互になっているフィールドシーケンシャルフォーマットであるか、左映像フレームと右映像フレームとが交互になっているフレームシーケンシャルフォーマットであるかを示す。
タイプコード(StereoAdditionalVisualType)は、立体映像コンテンツが2つのESから構成された場合、立体映像コンテンツの付加メディアデータが第2視点映像、深さマップ又は双方向視差マップのうち、いずれに該当するかを示す。
立体映像コンテンツが2つのESから構成される場合は、メインメディアデータと付加メディアデータとの符号化ストリームにそれぞれのES_IDを割り当てることを意味し、付加メディアデータに対するメインメディアデータと一致するESは、復号化後に、2つのメディアデータを利用して立体映像コンテンツを生成するために識別されることができる。
従って、この場合には、付加メディアデータが残りの1視点の映像であるか、深さマップであるか、双方向視差マップであるかを示すメタデータであるタイプコードが必要であり、上記と同様に、付加メディアデータに対する映像サイズを示すメタデータであるサイズコードが必要である。
サイズコード(StereoAdditionalVisualSize)は、立体映像コンテンツのメインメディアデータと付加メディアデータとの映像サイズ比を示す情報であり、立体映像コンテンツの付加メディアデータがメインメディアデータの映像サイズと同じ大きさであるか、水平方向の1/2の大きさであるか、垂直方向の1/2の大きさであるか、水平及び垂直方向の1/2の大きさであるかを示す。
一例を挙げれば、ESフォーマットコード(StereoVisualFormat)がフレームシーケンシャルフォーマットである場合には、付加メディアデータとして分類された残りの1視点の映像(右映像)サイズ情報を示すサイズコードが必要である。なぜならば立体映像ディスプレイ方式において、偏光方式やフレームシーケンシャル方式の場合は、左右映像の本来の大きさの映像がいずれも表示されるが、残りの方式の場合、本来の大きさで水平又は垂直方向に1/2縮少されたサイズの映像のみで立体映像コンテンツを表示するためである。
従って、左映像は、二次元コンテンツ再生を考慮して本来の大きさを維持するものとし、右映像は、立体映像コンテンツ再生時にのみ利用されるので、本来の映像サイズで水平方向に1/2縮少された大きさ、垂直方向に1/2縮少された大きさ、又は水平及び垂直方向にそれぞれ1/2縮少された大きさを有することができる場合をいずれも考慮し、これを示す情報であるサイズコードが要求される。
ESフラッグコード(StereoAdditioanlVisual_ESflag)は、ES記述子(ES_descriptor)に記述されるESが立体映像コンテンツの付加メディアデータであるか否かを示す。
図1Aないし図1Cは、MPEG−4の客体記述子、初期客体記述子、及びES記述子(ES_Descriptor)の構成図である。
図1Aないし図1Cは、MPEG−4の客体記述子、初期客体記述子、及びES記述子(ES_Descriptor)それぞれに含まれている「extDescr」フィールドは、以下に必要な記述子をさらに記述するために、MPEG−4で定義されたフィールドである。
本発明では、MPEG−4初期客体記述子、客体記述子、ES記述子(ES_Descriptor)のextDescrフィールド内部にメタデータを記述した記述子を含まれるように定義し、立体映像及び動画を含むコンテンツがMPEG−4システムに基づいて伝送されたり、又はMP4ファイルに基づいて保存されたりするときに、効率的な再生を可能にする。
図2A及び図2B、本発明で提示するメタデータを記述した記述子の例を図示している。
本発明のメタデータを記述した記述子である「ObjectStereoscopicDescriptor」及び「ES_stereoscopicDescriptor」の2つの記述子は、MPEG−4ですでに定義された客体記述子、初期客体記述子及びES記述子の構造と互換性が維持されるように記述されることを特徴とする。
下記表2は、MPEG−4 パート1 システムに定義されている記述子リストを示し、本発明で提案する2個の記述子は、下記表3に示されているように、「private value」値で割り当てて記述子リストに追加する。
図2Aに示された「ObjectStereoscopicDescriptor」は、初期客体記述子又は客体記述子内に含まれねばならない情報を示す記述子であり、既存の初期客体記述子又は客体記述子の構造と互換性を維持するために、MPEG−4初期客体記述子、客体記述子内の「extDescr」フィールドに含まれる構造を有する。
従って、MPEG−4初期客体記述子、客体記述子内に、「ObjectStereoscopicDescriptor」を含んでいれば、受信したビットストリーム内のコンテンツが立体映像コンテンツであることが分かる。
図2Aは、「ObjectStereoscopicDescriptor」に含まれるメタデータ及び構造の一実施形態を示す。
「ObjectStereoscopicDescriptor」で、NumberOfVisualES_mius1=0である場合(210)は、立体映像メディアデータが1つのESから構成されている場合を示し、ESフォーマットコード(StereoVisualFormat)を介して1つのESから復号化された左右映像のフォーマットがトップダウンフォーマットであるか、側面フォーマットであるか、フィールドシーケンシャルフォーマットであるか、フレームシーケンシャルフォーマットであるかを示す。この場合、使われるESフォーマットコード(StereoVisualFormat)の分類及び値は、下記表4の通り定義する。
また、メタデータ記述子である「ObjectStereoscopicDescriptor」に対して付加メディアデータ量を減らすために、映像サイズを縮少して表現する場合を考慮したメタデータであるESフォーマットコード(StereoVisualFormat)がフレームシーケンシャルフォーマットを示す場合、サイズコード(StereoAdditionalVisualSize)を条件付きで含むことができる。サイズコード(StereoAdditionalVisualSize)は、下記表5に示されているように四種で定義される。「ObjectStereoscopicDescriptor」でNumberOfVisualES_mius1=1である場合(220)は、立体映像メディアデータが1つのオブジェクト内にメインメディアデータと付加メディアデータとに対するESがそれぞれ存在する場合を示し、サイズコード(StereoAdditionalVisualSize)とタイプコード(StereoAdditionalVisualType)とを利用して情報を叙述する。サイズコードは表5に、タイプコードは下記表6に示されているように分類して値を割り当てる。
図2Bは、‘ES_stereoscopicDescriptor’に含まれるメタデータ及び構造の一実施形態を示している。
「ES_stereoscopicDescriptor」は、ES_Descriptor内に含まれねばならない情報を示す記述子であり、既存のES_Descriptorの構造と互換性を維持するために、ES_Descriptor内の「extDescr」フィールドに1つの記述子として含まれる。
1つのオブジェクト内にメインメディアデータと付加メディアデータとに対するESがそれぞれ存在する場合、付加メディアデータに対するESを記述するES_Descriptorでは、‘streamDependenceFlag’を1に設定し、メインメディアデータを記述するES_ID値を含む。
「streamDependenceFlag」を1に設定しても、そのESが立体映像コンテンツ生成のためのメインメディアデータの付加メディアデータに限定できるわけではない。コンテンツが立体映像コンテンツではなくとも、1つのオブジェクト内に複数のESが存在し、「streamDependenceFlag」を1に設定することができるためである。従って、「ObjectStereoscopicDescriptorDescriptor」でNumberOfVisualES_mius1が1に設定され、1つのオブジェクト内の立体映像メディアデータにメインメディアデータと付加メディアデータとに対するESがそれぞれ存在する場合、「ES_stereoscopicDescriptor」を「ES_Descriptor」に追加し、そのESが立体映像コンテンツを生成するための付加メディアデータであることを示す。「ES_stereoscopicDescriptor」は、図2Bに図示されているように、ESフラグコード(StereoAdditionalVisual_ESflag)値を有し、下記表7のように定義される。
ESフラッグコード(StereoAdditionalVisual_ESflag)値が1に設定される場合、立体映像コンテンツは、「ES_Descriptor」内の「DependsOn_ES_ID」に記述されたESがメインメディアデータであり、そのESが付加メディアデータである立体映像コンテンツであると認識する。
図3は、本発明の立体映像コンテンツ再生のための復号化装置の構成を示している。
伝送又は保存される、メタデータを含む立体映像コンテンツのストリームを再生する立体映像プレイヤは、メディアデータを復号化した後、立体映像コンテンツを表示する方式に合うようにメディアデータフォーマットを変換して表示できねばならず、二次元ディスプレイモードと立体映像ディスプレイモードとをユーザが選択できる機能を有していなければならない。
このために、本発明の復号化装置は、受信部310、視聴モード選択部320、コンテンツ生成部330及び表示部340を備える。
受信部310は、立体映像コンテンツ再生に利用されるメタデータを保存したヘッダ、符号化されたメインメディアデータ、及び付加メディアデータを含むビットストリームを受信する。加えて、受信部310は、受信したビットストリームを復号化部で復号してコンテンツ再生部に復号化されたメタデータとメディアデータとを伝送する。
視聴モード選択部320は、メタデータに基づいて、ユーザが2Dモード又は3Dモードのうち、一つを選択することを可能にする。現在受信したビットストリームが立体映像コンテンツである場合、復号化部は復号化された3Dコンテンツを再生する。この場合、表示される画面に3Dコンテンツであることを示すマークやログを挿入する。
すなわちユーザは、3Dコンテンツである場合、視聴モード選択部320を介して2D又は3Dに選択することによって視聴することができる。
コンテンツ生成部330は、復号されたデータと、視聴モード選択部320から入力されたユーザ入力とを利用し、復号化装置の一例であるプレイヤの表示部パネルに合うフォーマットのコンテンツを生成する。一実施形態として、プレイヤに装着されたディスプレイパネルが左右映像を行ごとに(line-by-line)でインタリービングされたフレームを入力として受けて立体映像コンテンツを再生する場合、左右映像は、それぞれの左映像の本来の大きさに比べて、垂直方向に1/2縮少された大きさの左右映像を行ごとにインタリービングした立体映像コンテンツが生成される。
表示部340は、コンテンツ生成部330から出力される映像を受信して再生する。表示部340は、ユーザのモード選択に従ってコンテンツ生成部330から出力されるコンテンツ映像を2D場面又は3D場面で表示する。
この場合、ユーザが3Dディスプレイモードを選択すると、符号化されているメインメディアデータと付加メディアデータは、いずれも復号されて3D場面を生成して出力し、ユーザが2Dディスプレイモードを選択すると、メインメディアデータのみが復号されて2D場面を出力する。
コンテンツ生成部330から視聴モード選択部320を介して入力されたユーザのモード選択が2Dモードである場合、表示部340は、メディアデータからメインメディアデータを抽出して出力する。コンテンツ生成部330から視聴モード選択部320を介して入力されたユーザのモード選択がStereoModeである場合、表示部340は、ObjectStereosocpicDescriptorに含まれたStereoVisualFormat、StereoAdditionalVisualType、StereoAddtionalVisualSizeのメタデータ、及びES_StereoscopicDescriptorに含まれたStereoAdditionalVisual_ESflag情報を利用し、それぞれ左映像の本来の大きさに比べて、垂直方向に1/2縮少された大きさの左右映像に大きさを変換した後、行ごとにインタリービングする。
一例を挙げれば、ObjectStereosocpicDescriptorに含まれたStereoVisualFormat情報がトップダウンフォーマットである場合は、左右映像が1フレーム内で上下に構成されているフォーマットであるので、左右映像が分離されて行ごとにインタリービングして出力し、側面フォーマットである場合は、左右映像が分離して水平方向に2倍拡大し、垂直方向に1/2縮少して映像サイズを変換した後、行ごとにインタリービングして出力する。
また、フィールドシーケンシャルフォーマットである場合は、各左右フィールド映像を、一対に見て行ごとにインタリービングして出力し、フレームシーケンシャルフォーマットである場合は、左映像フレームは垂直方向に1/2縮少し、右映像フレームはStereoAddtionalVisualSize情報を使用して立体映像コンテンツに生成して表示部から出力する。
すなわち、StereoAddtionalVisualSizeが左映像と同一サイズの映像であるならば、左映像は垂直方向に1/2縮少し、左映像サイズの水平方向1/2であるならば、左映像は水平方向に2倍拡大し、垂直方向には1/2縮少する。
また、StereoAddtionalVisualSizeが左映像サイズの垂直方向1/2であるならば、大きさに何らの変化も与えず、StereoAddtionalVisualSizeが左映像サイズの水平及び垂直方向1/2である場合は、水平方向に2倍拡大した後、左右映像を行ごとにインタリービングして出力する、
また、ObjectStereosocpicDescriptorに含まれたStereoAddtionalVisualSize情報に基づいて右映像、深さマップ、及び双方向視差マップのサイズ変換後、StereoAddtionalVisualType情報によって、映像が右映像である場合は行ごとにインタリービングして出力し、深さマップ又は双方向視差マップである場合は、既存の深さ又は双方向視差に基づいて仮想視点映像生成アルゴリズムを利用して右側視点の仮想映像を生成した後、行ごとにインタリービングして再生部に出力する。
本発明はまた、コンピュータ可読記録媒体にコンピュータ可読コードとして具現することが可能である。コンピュータ可読記録媒体は、コンピュータシステムによって可読データが保存されるあらゆる種類の記録装置を含む。
コンピュータ可読記録媒体の例としては、ROM(Read-Only Memory)、RAM(Random-Access Memory)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがあり、また、キャリアウェーブ(例えば、インターネットを介した伝送)のフォーマットで具現されるものも含む。また、コンピュータ可読記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータ可読コードが保存されて実行されることができる。
以上、図面と明細書とで最適な実施形態が開示された。ここで、特定の用語が使われたが、それらは、本発明を説明するための目的で使われたものであって、意味限定及び特許請求の範囲に記載された本発明の範囲を制限するために使われたものではない。
従って、本技術分野の当業者ならば、それらから多様な変形及び均等な他の実施形態が可能であるという点を理解することができるであろう。よって、本発明の真の技術的保護範囲は、特許請求の範囲の技術的思想によって決まる。

Claims (14)

  1. 立体映像を復号化する方法であって、
    立体映像コンテンツ再生に利用されるメタデータを保存したヘッダ、符号化されたメインメディアデータ、及び付加メディアデータを含むビットストリームを受信するステップを含み、
    前記メタデータは、
    受信したコンテンツが立体映像コンテンツであるか、あるいは二次元コンテンツであるかを識別する識別コード
    前記受信したコンテンツが前記立体映像コンテンツである場合、前記立体映像コンテンツが1つの基礎ストリームから構成されているか、あるいは2つの基礎ストリームから構成されているかを示す基礎ストリームコードと、
    前記立体映像コンテンツが1つの基礎ストリームから構成されていることを前記基礎ストリームコードが示す場合、前記1つの基礎ストリームから復号化された左右映像のフォーマットがトップダウン(top-down)フォーマット、側面(side-by-side)フォーマット、フィールドシーケンシャルフォーマット及びフレームシーケンシャルフォーマットのうち、いずれのフォーマットであるかを示す基礎ストリームフォーマットコードと、
    前記立体映像コンテンツが2つの基礎ストリームから構成されていることを前記基礎ストリームコードが示す場合、前記立体映像コンテンツの前記付加メディアデータが第2視点映像、深さマップ又は双方向視差マップのうち、いずれに該当するかを示すタイプコードと、
    基礎ストリーム記述子(ES_descriptor)に記述される前記基礎ストリームが前記立体映像コンテンツの前記付加メディアデータであるか否かを示す基礎ストリームフラッグコードと
    を含むことを特徴とする復号化方法。
  2. 前記メタデータは、前記立体映像コンテンツの前記メインメディアデータと前記付加メディアデータとの映像サイズ比を示すサイズコードをさらに含むことを特徴とする請求項に記載の復号化方法。
  3. 前記メインメディアデータは、前記立体映像コンテンツの第1視点映像を示し、前記付加メディアデータは、前記立体映像コンテンツの第2視点映像、深さマップ及び双方向視差マップのうち、いずれか一つを示すことを特徴とする請求項に記載の復号化方法。
  4. 前記メタデータは、前記基礎ストリームフォーマットコードがフレームシーケンシャルフォーマットに該当することを示す場合、前記サイズコードを含むことを特徴とする請求項に記載の復号化方法。
  5. 前記メタデータを記述した記述子は、MPEG−4に定義された初期客体記述子、客体記述子、及び基礎ストリーム記述子内のextDescrフィールドに含まれ、前記extDescrフィールドは、MPEG−4で今後必要な記述子を追加記述するために定義されたフィールドであることを特徴とする請求項に記載の復号化方法。
  6. 前記識別コードが、受信したコンテンツが前記立体映像コンテンツであることを示す場合、ユーザが受信したコンテンツを二次元に表示する二次元モードと三次元に表示する三次元モードとのうち、いずれのモードで視聴するかを選択するステップと、
    前記メタデータと前記ユーザが選択したモードとを利用し、受信した前記ビットストリームを復号化してコンテンツを生成するコンテンツ生成ステップとを含むことを特徴とする請求項に記載の復号化方法。
  7. 前記選択されたモードが前記三次元モードである場合、符号化された前記メインメディアデータ及び前記付加メディアデータをいずれも復号化し、前記コンテンツを三次元場面に表示するステップをさらに含むことを特徴とする請求項に記載の復号化方法。
  8. 前記選択されたモードが前記二次元モードである場合、符号化された前記メインメディアデータだけ復号化し、前記コンテンツを二次元場面に表示するステップをさらに含むことを特徴とする請求項に記載の復号化方法。
  9. 立体映像を復号化する方法であって、
    立体映像コンテンツ再生に利用されるメタデータを保存したヘッダ、符号化されたメインメディアデータ、及び付加メディアデータを含むビットストリームを受信するステップと、
    前記ビットストリームに含まれた前記メタデータに基づいて、ユーザに二次元モード又は三次元モードのうち選択できる機会を提供する視聴モード選択提供ステップと、
    前記メタデータと前記ユーザが選択したモードとを利用し、受信した前記ビットストリームを復号化してコンテンツを生成するコンテンツ生成ステップと、
    前記ユーザの選択によって、前記ビットストリームを復号化して二次元場面又は三次元場面に表示するステップと
    を含み、
    前記メタデータは、
    受信したコンテンツが立体映像コンテンツであるか、あるいは二次元コンテンツであるかを識別する識別コードと、
    前記受信したコンテンツが前記立体映像コンテンツであることを前記識別コードが示す場合、前記立体映像コンテンツが1つの基礎ストリームから構成されているか、あるいは2つの基礎ストリームから構成されているかを示す基礎ストリームコードと、
    前記立体映像コンテンツが1つの基礎ストリームから構成されていることを前記基礎ストリームコードが示す場合、前記1つの基礎ストリームから復号化された左右映像のフォーマットがトップダウン(top-down)フォーマット、側面(side-by-side)フォーマット、フィールドシーケンシャルフォーマット及びフレームシーケンシャルフォーマットのうち、いずれのフォーマットであるかを示す基礎ストリームフォーマットコードと、
    前記立体映像コンテンツが2つの基礎ストリームから構成されていることを前記基礎ストリームコードが示す場合、前記立体映像コンテンツの前記付加メディアデータが第2視点映像、深さマップ又は双方向視差マップのうち、いずれに該当するかを示すタイプコードと、
    基礎ストリーム記述子(ES_descriptor)に記述される前記基礎ストリームが前記立体映像コンテンツの前記付加メディアデータであるか否かを示す基礎ストリームフラッグコードと
    を含むことを特徴とする復号化方法。
  10. 前記メタデータは、前記立体映像コンテンツの前記メインメディアデータと前記付加メディアデータとの映像サイズ比を示すサイズコードをさらに含むことを特徴とする請求項に記載の復号化方法。
  11. 前記メインメディアデータは、前記立体映像コンテンツの第1視点映像を示し、前記付加メディアデータは、前記立体映像コンテンツの第2視点映像、深さマップ及び双方向視差マップのうち、いずれか一つを示すことを特徴とする請求項に記載の復号化方法。
  12. 前記メタデータを記述した記述子は、MPEG−4に定義された初期客体記述子、客体記述子、及びES記述子内のextDescrフィールドに含まれ、前記extDescrフィールドは、前記MPEG−4で今後必要な記述子を追加記述するために定義されたフィールドであることを特徴とする請求項に記載の復号化方法。
  13. 前記表示するステップが三次元モードである場合、符号化された前記メインメディアデータ及び前記付加メディアデータをいずれも復号化し、前記コンテンツを三次元場面に表示することを特徴とする請求項に記載の復号化方法。
  14. 前記表示するステップが二次元モードである場合、符号化された前記メインメディアデータだけ復号化し、前記コンテンツを二次元場面に表示することを特徴とする請求項に記載の復号化方法。
JP2009535205A 2006-11-01 2007-10-29 立体映像コンテンツ再生に利用されるメタデータの復号化方法 Expired - Fee Related JP5022443B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20060107491 2006-11-01
KR10-2006-0107491 2006-11-01
KR10-2007-0108435 2007-10-26
KR20070108435A KR101362941B1 (ko) 2006-11-01 2007-10-26 스테레오스코픽 콘텐츠 재생에 이용되는 메타 데이터의복호화 방법 및 장치
PCT/KR2007/005358 WO2008054100A1 (en) 2006-11-01 2007-10-29 Method and apparatus for decoding metadata used for playing stereoscopic contents

Publications (2)

Publication Number Publication Date
JP2010508752A JP2010508752A (ja) 2010-03-18
JP5022443B2 true JP5022443B2 (ja) 2012-09-12

Family

ID=39647752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009535205A Expired - Fee Related JP5022443B2 (ja) 2006-11-01 2007-10-29 立体映像コンテンツ再生に利用されるメタデータの復号化方法

Country Status (2)

Country Link
JP (1) JP5022443B2 (ja)
KR (1) KR101362941B1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101539935B1 (ko) * 2008-06-24 2015-07-28 삼성전자주식회사 3차원 비디오 영상 처리 방법 및 장치
CA2691727C (en) 2008-09-30 2016-10-04 Panasonic Corporation Recording medium, playback device, system lsi, playback method, glasses, and display device for 3d images
KR20100040640A (ko) * 2008-10-10 2010-04-20 엘지전자 주식회사 수신 시스템 및 데이터 처리 방법
KR101664419B1 (ko) * 2008-10-10 2016-10-10 엘지전자 주식회사 수신 시스템 및 데이터 처리 방법
US9288470B2 (en) 2008-12-02 2016-03-15 Lg Electronics Inc. 3D image signal transmission method, 3D image display apparatus and signal processing method therein
BRPI1007163A2 (pt) * 2009-01-26 2018-09-25 Thomson Licensing compactação de quadro para codificação de vídeo
WO2010117129A2 (en) 2009-04-07 2010-10-14 Lg Electronics Inc. Broadcast transmitter, broadcast receiver and 3d video data processing method thereof
CN102415101B (zh) 2009-04-27 2014-07-16 Lg电子株式会社 广播发射机、广播接收机及其3d视频数据处理方法
US8773505B2 (en) * 2009-04-27 2014-07-08 Lg Electronics Inc. Broadcast receiver and 3D video data processing method thereof
JP5407957B2 (ja) * 2009-06-29 2014-02-05 ソニー株式会社 立体画像データ送信装置および立体画像データ受信装置
JP5407968B2 (ja) * 2009-06-29 2014-02-05 ソニー株式会社 立体画像データ送信装置および立体画像データ受信装置
KR101647408B1 (ko) * 2010-02-03 2016-08-10 삼성전자주식회사 영상 처리 장치 및 방법
IT1401731B1 (it) * 2010-06-28 2013-08-02 Sisvel Technology Srl Metodo per la decodifica 2d-compatibile di flussi video stereoscopici
KR20130108263A (ko) 2010-09-03 2013-10-02 소니 주식회사 부호화 장치 및 부호화 방법, 및 복호 장치 및 복호 방법
WO2012029885A1 (ja) * 2010-09-03 2012-03-08 ソニー株式会社 画像処理装置および方法
JPWO2012029884A1 (ja) * 2010-09-03 2013-10-31 ソニー株式会社 符号化装置および符号化方法、並びに復号装置および復号方法
US9338430B2 (en) 2010-09-03 2016-05-10 Sony Corporation Encoding device, encoding method, decoding device, and decoding method
CN103354997A (zh) * 2011-02-18 2013-10-16 索尼公司 图像处理设备和图像处理方法
US9235749B2 (en) 2011-02-24 2016-01-12 Sony Corporation Image processing device and image processing method
WO2013056129A1 (en) * 2011-10-14 2013-04-18 Advanced Micro Devices, Inc. Region-based image compression

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4190357B2 (ja) * 2003-06-12 2008-12-03 シャープ株式会社 放送データ送信装置、放送データ送信方法および放送データ受信装置
KR100585966B1 (ko) * 2004-05-21 2006-06-01 한국전자통신연구원 3차원 입체 영상 부가 데이터를 이용한 3차원 입체 디지털방송 송/수신 장치 및 그 방법

Also Published As

Publication number Publication date
KR101362941B1 (ko) 2014-02-17
KR20080039797A (ko) 2008-05-07
JP2010508752A (ja) 2010-03-18

Similar Documents

Publication Publication Date Title
JP5022443B2 (ja) 立体映像コンテンツ再生に利用されるメタデータの復号化方法
WO2008054100A1 (en) Method and apparatus for decoding metadata used for playing stereoscopic contents
JP7399224B2 (ja) メディアコンテンツを送信するための方法、装置及びコンピュータプログラム
JP6960528B2 (ja) メディアコンテンツを生成および処理するための方法、装置、およびコンピュータプログラム
JP4942784B2 (ja) マルチメディア情報生成装置およびマルチメディア情報再生装置
US8878836B2 (en) Method and apparatus for encoding datastream including additional information on multiview image and method and apparatus for decoding datastream by using the same
TWI573425B (zh) 產生三維視訊信號
US8773504B2 (en) Stereoscopic content service system and method
US20080252719A1 (en) Apparatus, method, and system for generating stereo-scopic image file based on media standards
TW201105105A (en) Method and system for transmitting over a video interface and for compositing 3D video and 3D overlays
JP2011525743A (ja) 映像データ出力方法及び装置、並びに映像データ・ディスプレイ方法及び装置
WO2009031872A2 (en) System and method for generating and reproducing 3d stereoscopic image file including 2d image
WO2009075495A1 (en) System and method for generating and reproducing image file including 2d image and 3d stereoscopic image
CN103202021A (zh) 编码装置、解码装置、再现装置、编码方法及解码方法
KR101480186B1 (ko) 2d 영상과 3d 입체영상을 포함하는 영상파일을 생성 및재생하기 위한 시스템 및 방법
KR101390810B1 (ko) 로컬 3차원 영상을 재생하기 위한 파라미터를 포함하는영상 데이터스트림을 수신하는 방법 및 장치, 그리고 로컬3차원 영상을 재생하기 위한 파라미터를 포함하는 영상데이터스트림을 생성하는 방법 및 장치
CN102948154A (zh) 内容分发系统、再现装置、分发服务器、再现方法及分发方法
KR100959534B1 (ko) Maf 파일 포맷을 구성하는 방법 및 이를 이용한 비디오 신호의 디코딩 장치
KR20080092810A (ko) 미디어 표준 기반의 입체영상 파일 생성 장치 및 방법과이를 구현하기 위한 시스템

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110909

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111209

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20120417

TRDD Decision of grant or rejection written
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120615

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees