JP5483205B2 - メディアデータフィールドと前記メディアデータヘッダーとを分析してビデオを生成するための装置、方法及び記録媒体 - Google Patents

メディアデータフィールドと前記メディアデータヘッダーとを分析してビデオを生成するための装置、方法及び記録媒体 Download PDF

Info

Publication number
JP5483205B2
JP5483205B2 JP2010545808A JP2010545808A JP5483205B2 JP 5483205 B2 JP5483205 B2 JP 5483205B2 JP 2010545808 A JP2010545808 A JP 2010545808A JP 2010545808 A JP2010545808 A JP 2010545808A JP 5483205 B2 JP5483205 B2 JP 5483205B2
Authority
JP
Japan
Prior art keywords
view sequence
track
view
sequence
stereoscopic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010545808A
Other languages
English (en)
Other versions
JP2011511593A (ja
Inventor
ソ−ヨン ファン,
ゼ−ヨン ソン,
ゴン−イル リ,
クッ−ヘ リ,
ヨン−テ キム,
ゼ−ソン キム,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority claimed from PCT/KR2009/000568 external-priority patent/WO2009099307A1/en
Publication of JP2011511593A publication Critical patent/JP2011511593A/ja
Application granted granted Critical
Publication of JP5483205B2 publication Critical patent/JP5483205B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/189Recording image signals; Reproducing recorded image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/361Reproducing mixed stereoscopic images; Reproducing mixed monoscopic and stereoscopic images, e.g. a stereoscopic image overlay window on a monoscopic image background

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、メディアデータフィールドと前記メディアデータヘッダーとを分析してビデオを生成するための装置、方法及び記録媒体に関するものである。
マルチメディア関連国際標準化機構であるMPEG(Moving Picture Experts Group)は、その第1の標準化であるMPEG−1を始めとして現在はMPEG−2、MPEG−4、MPEG−7、MPEG−21の標準化作業を進めている。このような様々な標準の開発は、異なる標準技術を組み合わせて一つのプロファイルを生成する必要性をもたらし、このような動きの一つとして、多様なマルチメディアアプリケーションフォーマット(MAF)がMPEG−A(MPEG Multimedia Application Format:ISO/IEC(International Organization for Standardization/International Electrotechnical Commission)23000)マルチメディアアプリケーション標準化活動で作られている。MAFは、既存のMPEG標準だけでなく非MPEG標準も組み合わせて標準の利用価値を高めることを目指している。このように別途の標準を新たに作る努力なしに既に検証された標準技術を組み合わせてMAFを作ることによって、その効用価値を最大限に活用することができる。
最近、より現実的なビデオ情報を表現するために、三次元(3D)ビデオを実現する方式に関連して集中的な研究が行われている。その方法の中で、人間の視覚特性を用いて、様々な面で効果的であると考えられる方法は、左側ビュー(view)と右側ビューが各々ユーザーの左眼と右眼に結像されるようにその該当位置で既存のディスプレイ装置上に左側ビューイメージと右側ビューイメージをスキャンし、それによってユーザーが3D効果を感じるようにする。一例として、バリアLCD(barrier Liquid Crystal Display)を装着した携帯端末は、ステレオスコピックコンテンツを再生してユーザーに写実的なビデオを提供できる。
しかし、2個以上のビューシーケンスで構成されるステレオスコピックコンテンツの場合、構文(syntax)は、ファイルフォーマット上で定義されていない。この構文に基づき、ステレオスコピックコンテンツのビューシーケンスのトラックが相互に関連しているか否かを判定できる。ビューシーケンスは、一つ以上のビデオフレームで構成されたビデオビットストリームであり、基本(elementary)ストリームとして呼ぶこともできる。また、ステレオスコピックビデオとモノスコピックビデオを含み、ステレオスコピックビデオが空間的に二次元(2D)ビデオと結合するか、或いはステレオスコピックビデオとモノスコピックビデオが一つのシーンに共に現れるコンテンツの場合、例えばモノスコピックミュージックビデオの下部に映像字幕があり、その映像字幕が2Dイメージでディスプレイされるサービスの場合、ミュージックビデオと映像字幕が相互に関連しているか否かを判定できる構文は、ファイルフォーマット上に定義されていない。従って、ミュージックビデオと映像字幕が相互に関連しているか否かを示す情報を追加的に提供することが必要である。
本発明は、上記従来の問題点に鑑みてなされたものであって、その目的は、2個以上のビューシーケンスで構成されるステレオスコピックコンテンツ、又は一つのシーンに同時にディスプレイされるステレオスコピックビデオ及びモノスコピックビデオを有するコンテンツに対して、ビューシーケンスのトラックが相互に関連しているか否かを明確に判定するためにメディアデータフィールドと前記メディアデータヘッダーとを分析してビデオを生成するための装置、方法及び記録媒体を提供することにある。
上記目的を達成するためになされた本発明によるコンピュータ読み取り可能な記録媒体は、格納されたデータを有するコンピュータ読み取り可能な記録媒体であって、一つのシーンに同時にディスプレイされるステレオスコピックビューシーケンスである複数のビューシーケンスを含むメディアデータフィールドと、前記複数のビューシーケンスのそれぞれに対応するトラックフィールドを含むメディアヘッダーフィールドと、を含み、
前記トラックフィールドのうち少なくとも一つのトラックフィールドは、トラック基準フィールドを含み、前記トラック基準フィールドは前記少なくとも一つのトラックフィールドが他のトラックフィールドを参照することを示すトラック基準情報を含み、前記複数のビューシーケンスは、第1のビューシーケンスと第2のビューシーケンスとを含み、前記第1のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は基準値に設定され、前記第2のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は前記基準値に相対的な値に設定され、前記相対的な値に設定される前記第2のビューシーケンスの前記ディスプレイ及びカメラ情報は前記第2のビューシーケンスに対応するトラックフィールドに格納され、メディアファイルから前記メディアデータフィールドと前記メディアヘッダーフィールドとを分析してビデオを生成する手段として機能するためのディスプレイプログラムを記録したことを特徴とする。
上記目的を達成するためになされた本発明によるコンピュータ実行方法は、メディアフ
ァイルを受信するステップと、前記メディアファイルから一つのシーンに同時にディスプ
レイされるステレオスコピックビューシーケンスである複数のビューシーケンスを含むメ
ディアデータフィールドと、前記複数のビューシーケンスのそれぞれに対応するトラック
フィールドを含むメディアヘッダーフィールドを分析するステップと、前記トラッ
クフィールドのうち参照するビューシーケンスに該当するトラックフィールドに含まれる
トラック基準フィールドに含まれるトラック基準情報によって、前記参照するビューシー
ケンスと参照されるビューシーケンスに基づいてビデオを生成するステップと、を含み、
前記トラック基準情報は前記参照するビューシーケンスを生成するために参照されるトラ
ックフィールドで他のトラックフィールドを示し、前記複数のビューシーケンスは、第1
のビューシーケンスと第2のビューシーケンスと、を含み、前記第1のビューシーケンス
のディスプレイ及びカメラ情報に対するパラメータ値は基準値に設定され、前記第2のビ
ューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は前記基準値に相対
的な値に設定され、前記相対的な値に設定される前記第2のビューシーケンスの前記ディ
スプレイ及びカメラ情報は前記第2のビューシーケンスに対応するトラックフィールドに
格納されることを特徴とする。
上記目的を達成するためになされた本発明による端末装置は、メディアファイルを受信する受信機と、前記メディアファイルから一つのシーンに同時にディスプレイされるステレオスコピックビューシーケンスである複数のビューシーケンスを含むメディアデータフィールドと前記複数のビューシーケンスのそれぞれに対応するトラックフィールドを含むメディアヘッダーフィールドを分析し、前記トラックフィールドのうち参照するビューシーケンスに該当するトラックフィールドに含まれるトラック基準フィールドに含まれるトラック基準情報によって、前記参照するビューシーケンスと参照されるビューシーケンスとに基づいてビデオを抽出するファイル分析部と、前記抽出されたビデオを表示するディスプレイ部とを含み、前記トラック基準情報は前記参照するビューシーケンスを生成するために参照されるトラックフィールドで他のトラックフィールドを示し、前記複数のビューシーケンスは、第1のビューシーケンスと第2のビューシーケンスとを含み、前記第1のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は基準値に設定され、前記第2のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は前記基準値に相対的な値に設定され、前記相対的な値に設定される前記第2のビューシーケンスの前記ディスプレイ及びカメラ情報は前記第2のビューシーケンスに対応するトラックフィールドに格納されることを特徴とする。
本発明によれば、2個以上のビューシーケンスで構成されたステレオスコピックコンテンツ、又は一つのシーンに同時にディスプレイされるステレオスコピックビデオとモノスコピックビデオを有するコンテンツに含まれるトラックの中から、相互に関連しているトラックを明確に判定でき、また追加的なメタデータに対する冗長性を避けることができる効果を有する。
本発明の上記及び他の様相、特徴、及び利点は、以下のような添付図面と共に続く詳細な説明から、より明白になるだろう。
ISOベースのメディアファイルフォーマットを示す図である。 本発明の第1の実施形態によるファイル構造を示す図である。 本発明の第1の実施形態により、関連したトラックを相互に接続するように設計されたファイル構造を示す図である。 本発明の第1の実施形態により、関連したトラックを相互に接続するように設計されたファイル構造を示す図である。 本発明の第1の実施形態による端末の動作を示す図である。 本発明の第2の実施形態によるファイル構造を示す図である。 本発明の第2の実施形態による第1のビューシーケンスを表現する方法を示す図である。 本発明の第2の実施形態による端末の動作を示す図である。 本発明の第3の実施形態によるファイル構造を示す図である。 本発明の第3の実施形態による第1のビューシーケンスを表現する方法を示す図である。 本発明の第4の実施形態によるファイル構造を示す図である。 本発明の第5の実施形態によるステレオスコピックビデオのファイル構造を示す図である。 本発明の第5の実施形態によるステレオスコピックビデオのファイル構造を示す図である。 本発明の第5の実施形態によるマルチビューコンテンツのファイル構造を示す図である。 本発明の第5の実施形態によるマルチビューコンテンツのファイル構造を示す図である。 本発明の一実施形態によるメディアファイル生成装置を示す図である。 本発明の一実施形態によるメディアファイル再生装置を示す図である。
以下、本発明の望ましい実施形態を添付の図面を参照して詳細に説明する。
下記の説明では、本発明に関連した公知の機能又は構成に関する具体的な説明は、明瞭性及び簡潔さのために省略する。ここで使用される用語は、本発明の機能を考慮して定義されたものであって、ユーザー又は運用者の意図又は慣例によって変更することができる。従って、上記用語は、本明細書の全体内容に基づいて定義されなければならない。
本発明では、先ずISOベースのメディアファイルフォーマットについて説明する。また、本発明は、2個以上のビューシーケンスで構成されるステレオスコピックコンテンツで対をなすトラック間の関係を示す方法、及び一つのシーンで同時にディスプレイされるステレオスコピックビデオとモノスコピックビデオを有するコンテンツで、ステレオスコピックビデオトラックとモノスコピックビデオトラックとの間の関係を示す方法を提供する。
図1は、ISOベースのメディアファイルフォーマットを示す。
図1を参照すると、ISOベースのメディアファイル100は、ファイルタイプボックス(‘ftyp’ボックス;図示せず)、映画データボックス(‘moov’ボックス)110、及びメディアデータボックス(‘mdat’ボックス)120を含む。このファイルタイプボックスは、ファイルタイプと互換タイプの詳細を含む。正常再生は、互換タイプに従って該当デコーダで可能である。’moov’ボックス110は、ファイルフォーマットのヘッダーボックスに該当し、各データは‘atom’と呼ばれるオブジェクトに基づいた構造で形成される。’moov’ボックス110は、フレームレート(rate)、ビットレート、イメージサイズのようなコンテンツ情報及びFF(Fast−Forward)/REW(Rewind)のような再生機能をサポートするのに使用される同期化情報を含む再生ファイルに必要な全ての情報を含む。データボックスであるメディアデータボックス120は、実際のメディアデータを含み、それぞれのトラックにビデオデータ及びオーディオデータがそのフレーム単位で格納される。
ステレオスコピックビデオは、ステレオスコピックビデオ関連情報を含む。ステレオスコピックビデオ関連情報は、ステレオスコピックビデオの構成タイプのような必要な情報であり、カメラパラメータとディスプレイ情報のような追加データであり得る。ステレオスコピックビデオが2個以上のビューシーケンスで構成されている場合、それぞれのビューシーケンスは、同一のステレオスコピックビデオ関連情報を有することができる。例えば、2個のビューシーケンスで構成されるステレオスコピックビデオに対して、ビデオの左側ビューと右側ビューの各々は、同一のカメラ及びディスプレイに関する追加情報を含むことができる。このように各ビューシーケンスが同一のステレオスコピックビデオの関連情報を有する場合、同一の情報がそれぞれのビューシーケンスに重複して格納されることを防止するために、該当情報は一つのビューシーケンスのみに包含され、残りのビューシーケンスは該当ビューシーケンスを参照して該当ビューシーケンスに包含された該当ステレオスコピックビデオ関連情報を使用することができる。しかし、そのために、どの基本ストリームがステレオスコピックビデオ関連情報を含んでいるかを他の基本ストリームに通知し、ステレオスコピックビデオ関連情報を含んでいるビューシーケンスを判別しなければならない。2個以上のビューシーケンスで構成されたステレオスコピックビデオの場合、2個のビューシーケンスは、第1の(primary)ビューシーケンスと第2の(secondary)ビューシーケンスに分けられる。上述したように、ステレオスコピックビデオ関連情報は一つの基本ストリームにのみ包含される場合、第1のビューシーケンスを第2のビューシーケンスと区別して該当情報を確認することができる。本発明で説明した第1のビューシーケンス及び第2のビューシーケンスは、2個以上のビューシーケンスのうちの一つのみが選択されて画面に表示されなければならない場合に、優先順位の高いディスプレイを有するビューシーケンスを区別する。
第1のビューシーケンスを第2のビューシーケンスと区別する方法は、各ビューシーケンスのトラックID(track_ID)を確認する一番目の方法を含む。各ビューシーケンスのトラックヘッダー‘tkhd’ボックスは、各トラックを識別することができる識別子であるトラックID(track_ID)を有する。トラックIDが各ビューシーケンスのトラックに順次に割り当てられる整数(integer)値であるので、トラックIDの最小値を有するトラックのビューシーケンスは第1のビューシーケンスとして決定される。
2番目の方法は、ステレオスコピックビデオの構成タイプ情報の左側ビューシーケンスと右側ビューシーケンス(又は、2個以上のビューシーケンス)のうちのいずれか一つを、最初に符号化したかを示す‘is_left_first’パラメータを確認し、該当パラメータの値によって左側ビューシーケンス及び右側ビューシーケンス(或いは、2個以上のビューシーケンス)のうちのどちらが第1のビューシーケンス又は第2のビューシーケンスであるかを判定する。3番目の方法は、他のトラックを参照する(reference)トラックを第1のビューシーケンス或いは第2のビューシーケンスとして判定する。
トラック基準に関する情報に基づいて第1のビューシーケンスを決定することは、(参照が他のトラックによって遂行される)参照される(referenced)トラックが第1のビューシーケンスとして決定される場合、(他のトラックを参照する)参照トラックは、第2のビューシーケンスとして決定される。他のトラックを参照するトラックはトラック基準(track reference)ボックス(‘tref’ボックス)を有するので、他の側面又は残りのビューのステレオスコピックビデオは、上記の例で第1のビューシーケンスとして決定される。この例において、トラック参照に関する情報を有する‘tref’ボックスの位置は、第1のビューシーケンスを第2のビューシーケンスと区別する方法となることができる。トラック参照を使用することに伴い、2個以上のビデオトラックで構成されたメディアファイル内に相互に関連したビューシーケンスを接続させることができ、それによってどのトラックが相互に関連しているかを決定することが可能になる。また、これは、マルチビュービデオから一つのビデオを作り出すために相互に接続させる方法として使用することができる。トラック参照方法を使用することに伴い、特定トラック、即ち第1のビューシーケンス及び第2のビューシーケンスのうちの一つのみに重複するステレオスコピックビデオ関連情報を挿入することによって、数個のトラックにステレオスコピックビデオ関連情報が重複して挿入されることを防止することができる。
第1のビューシーケンスを第2のビューシーケンスと区別するための他の方法によると、第1のビューシーケンスと第2のビューシーケンスは、上記方法のように一つの情報又は一つのパラメータだけでなく、トラックIDと‘is_left_first’パラメータを含むステレオスコピックビデオの構成を表現するのに要求されるステレオスコピックビデオ情報、‘tref’ボックス情報が識別されるパラメータ、及びハンドラタイプのように、2個以上のステレオスコピックビデオ関連情報、フィールド、パラメータ、及びボックスを組み合わせることによって決定される。次の方法は、2個以上のステレオスコピックビデオ関連情報、フィールド、パラメータ、ボックスを組み合わせて第1のビューシーケンスと第2のビューシーケンスを決定することが可能である。先ず、左側ビューと右側ビューの2つのビューシーケンスで構成されるステレオスコピックビデオの場合、‘is_left_first’フィールドの値と他のトラックのステレオスコピックビデオを参照する‘tref’ボックスの情報を用いて、第1のビューシーケンスを第2のビューシーケンスと区別する基準によって、第1のビューシーケンス又は第2のビューシーケンスとして該当トラックを決定できる。或いは、他のトラックのステレオスコピックビデオを参照する‘tref’ボックスの情報及びトラックIDを用いて、第1のビューシーケンスを第2のビューシーケンスと区別するための基準によって、第1のビューシーケンス又は第2のビューシーケンスとして該当トラックを決定することができる。
更に、2個以上のステレオスコピックビデオ関連情報、フィールド、パラメータ、及びボックスの組み合わせによって、2個以上のビューシーケンス(即ち、多重(multiple)又はマルチビューシーケンス)で構成されるステレオスコピックビデオに対する第1のビューシーケンス及び第2のビューシーケンスを決定する他の方法がある。この他の方法によれば、‘is_left_first’フィールドの値、トラックのID、及びステレオスコピックビデオトラックを参照する‘tref’ボックスを用いて第1のビューシーケンス及び第2のビューシーケンスを決定することができる。
上記に言及した以外のパラメータ又は情報が、上記のように第1のビューシーケンス及び第2のビューシーケンスを決定するためのパラメータ又は情報として使用され、2個以上のステレオスコピックビデオ関連情報、フィールド、パラメータ、及びボックスは多様な方法で拡張又は追加することができる。
以下に、本発明による2個以上のビューシーケンスで構成されたステレオスコピックコンテンツで対をなすビューシーケンスのトラック間の関係を示す方法について説明する。また、次の説明は、本発明によるステレオスコピックビデオとモノスコピックビデオを有するコンテンツでステレオスコピックビューシーケンスとモノスコピックビューシーケンス間の関係を示す方法を更に含む。
<第1の実施形態>
2個以上のビューシーケンスで構成されたステレオスコピックコンテンツを復号化して画面にディスプレイするために、左側ビューシーケンスのトラックと右側ビューシーケンスのトラックが相互に関連することを示す必要がある。しかしながら、トラック間の関係を示すボックス及び情報が現在ステレオスコピックファイルフォーマットに存在しないので、本発明の第1の実施形態ではこの問題を解決するために、次のような方法を提供する。
‘ISO/IEC14496−12 ISOベースのメディアファイルフォーマット’文書に定義されたボックスの中に、ハンドラ基準ボックス(‘hdlr’ボックス)とトラック基準ボックス(‘tref’ボックス)がある。ハンドラ基準ボックス(‘hdlr’ボックス)は、ハンドラタイプ(‘handler_type’)を用いて現在トラックにメディアデータのタイプを表し、<表1>のように定義される。
Figure 0005483205
2個以上のビデオトラックで構成されるステレオスコピックコンテンツに対して2個の関連トラックを相互に接続させるために、本発明の第1の実施形態では、<表2>に示すように、ハンドラ基準ボックス(‘hdlr’ボックス)のハンドラタイプ(‘handler_type’)に、該当トラックのメディアデータのタイプがステレオスコピックビデオであることを示す‘svid’値を追加する。
Figure 0005483205
トラック基準ボックス(‘tref’ボックス)は、基準タイプ(‘reference_type’)とトラックID(track_ID)を用いて現在のトラックが参照する他のトラックを更に接続するのに使用される。現在‘ISO/IEC14496−12 ISOベースのメディアファイルフォーマット’文書に定義されている‘reference_type’を、<表3>に示す。
Figure 0005483205
本発明の第1の実施形態では、2個の関連トラックを接続させるために、<表4>に示すようにトラック基準ボックス(‘tref’ボックス)の‘reference_type’に‘avmi’を追加する。
Figure 0005483205
図2は、本発明の第1の実施形態により、新たに定義された‘handler_type’と‘reference_type’を用いて2個のビューシーケンスで構成されたステレオスコピックコンテンツに対して関連したビューシーケンスのトラックを相互に接続させるファイル構造を示す。
図2を参照すると、ステレオスコピック左側ビューシーケンスのトラックは‘tref’ボックスを含み、該当トラックが参照しようとするステレオスコピック右側ビューシーケンスのトラックをトラック基準ボックス(‘tref’ボックス)210を用いて接続する。ここで、トラック基準ボックス(‘tref’ボックス)のreference_type=‘avmi’に設定することで、該当参照トラックは、ステレオスコピックビデオ関連情報を含むトラックであり、参照しようとするトラック、即ち参照される(referenced)トラックと関連していることに注意する。該当する参照トラックに含まれているステレオスコピックビデオ関連情報は、ステレオスコピックコンテンツを構成するビューシーケンスの各トラックが基本的に含まなければならないステレオスコピックビデオ情報であり、関連した2個のトラックのうちのいずれか一つのみに格納することができる。このトラックが参照されるトラックと関係を有する場合、2個のトラックが対をなすことを意味し、これは2個のトラックの間に従属関係があることを意味する。言い換えれば、参照されるトラックのビューシーケンスが第1のビューシーケンスである場合に、参照するトラックのビューシーケンスは、第2のビューシーケンスとなるので、参照するトラックは、参照されるトラックに従属関係を有する。また、参照されるトラックのハンドラ基準ボックス(‘hdlr’ボックス)220のhandler_type=‘svid’に設定することで、参照されるトラックがステレオスコピックビデオトラックであることがわかる。
トラック基準ボックス(‘tref’ボックス)の有無によって第1のビューシーケンス及び第2のビューシーケンスを決定できるため、トラック基準ボックス(‘tref’ボックス)を有するトラックが第2のビューシーケンスとして決定される場合、図2ではステレオスコピック左側シーケンスのトラックが第2のビューシーケンストラックとなる。第1のビューシーケンス決定方法によって左側ビューシーケンスは第1のビューシーケンスとなることができる。第1のビューシーケンス及び第2のビューシーケンスがトラック基準ボックス(‘tref’ボックス)210を用いて決定される場合、ステレオスコピック右側ビューシーケンスのトラックが第1のビューシーケンスとして決定される際に、ステレオスコピック右側ビューシーケンスのトラックがステレオスコピック左側ビューシーケンスのトラックから参照されるように設定される。この場合、トラック基準ボックス(‘tref’ボックス)を有する参照トラックは、第2のビューシーケンスとして設定されると考えられる。
図3は、本発明の第1の実施形態による多重ビューシーケンスを有するマルチビューコンテンツに対して関連したトラックを相互に接続させるファイル構造を示す。
図3を参照すると、第1の(又はメイン)ビューシーケンスのトラックがトラック基準ボックス(‘tref’ボックス)を有すると仮定し、トラック基準ボックス(‘tref’ボックス)310を用いて第1のビューシーケンスのトラックと、このトラックと関係のある複数のトラックを接続することができる。この場合、第1のビューシーケンスを含むトラックにおいて、トラック基準ボックス(‘tref’ボックス)310の基準タイプをreference_type=‘avmi’に設定し、このトラックによって参照されるトラックのハンドラ基準ボックス(‘hdlr’ボックス)320、330のハンドラタイプ(‘handler_type’は、handler_type=‘svid’に設定される。
上述したように、トラック基準ボックス(‘tref’ボックス)の情報を用いて第1のビューシーケンスを第2のビューシーケンスと区別することができる。図4は、本発明の第1の実施形態によってトラック基準ボックス(‘tref’ボックス)を有していないトラック、即ち参照されるトラックのシーケンスが第1のビューシーケンスと仮定する場合に、関連したトラックを相互に接続するファイル構造を示す。
図5は、本発明の第1の実施形態によってステレオスコピックビデオが2個以上のビューシーケンスで構成されている場合に、関連したビデオトラックを識別して画面にディスプレイするための端末の動作を示す。
図5を参照すると、端末は、ステップ401で、メディアファイルのファイルタイプボックス(‘ftyp’ボックス)を分析する。ステップ402及び403で、端末は、メディアファイルの‘moov’ボックスとトラックボックス(‘trak’ボックス)を分析する。ステップ404では、端末は、トラック基準ボックス(‘tref’ボックス)がトラックボックスに存在するか否かを判定する。トラックがトラック基準ボックス(‘tref’ボックス)を有する場合に、端末は、ステップ405で、トラック基準ボックス(‘tref’ボックス)の基準タイプ(‘reference_type’)を確認する。基準タイプ(‘reference_type’)が‘avmi’であると判定される場合に、端末は、トラック基準ボックス(‘tref’ボックス)の参照するトラックID(‘track_ID’)を確認し、どのステレオスコピックビューシーケンスのトラックが該当トラックと対をなすかを判定する。端末は、ステップ406でメディア情報ボックス(‘mdia’ボックス)を確認し、ステップ407で、端末が該当トラックのメディアデータタイプを決定できるかに基づき、ハンドラボックス(‘hdlr’ボックス)のハンドラタイプ(‘handler_type’)を確認する。ステップ408で、端末は、ステレオスコピック情報を包含する残りのボックスの情報を確認し、ステレオスコピックビューシーケンスのトラックのステレオスコピックビデオ関連情報を分析し、関連ビューシーケンスを画面にディスプレイする。トラックボックス(‘trak’ボックス)を分析する一連のプロセスは、該当トラックがステレオスコピックビューシーケンスのトラックである場合に、メディアファイルの最初のトラックから最後のトラックまで同一に遂行される。
一方、ステップ404で、トラックがトラック基準ボックス(‘tref’ボックス)を有していないと判定される場合に、端末は、ステップ406に進行し、該当トラックのメディア情報ボックス(‘mdia’ボックス)を確認する。その後、端末は、ステップ407で、ハンドラタイプ(‘handler_type’)を確認し、ステップ408で、ステレオスコピック情報を含んでいる残りのボックスを確認してステレオスコピックコンテンツを画面にディスプレイする。
端末は、図5のステップ408で、第1のビューシーケンス及び第2のビューシーケンスを識別するが、この第1のビューシーケンス及び第2のビューシーケンスを識別するステップの順序は、第1のビューシーケンスを第2のビューシーケンスと区別する上述した方法によって変更することができる。
例えば、トラック基準ボックス(‘tref’ボックス)を用いて第1のビューシーケンス及び第2のビューシーケンスを識別する場合に、端末は、図5のステップ405で、トラック基準ボックス(‘tref’ボックス)の基準タイプ(‘reference_type’)とトラックID(‘track_ID’)を確認することによって第1のビューシーケンス及び第2のビューシーケンスを識別する。トラック基準ボックス(‘tref’ボックス)を有するビューシーケンスのトラックが第2のビューシーケンスであると判定される場合、トラック基準ボックス(‘tref’ボックス)の基準タイプ(‘reference_type’)が‘avmi’である際に、参照するトラックID(‘track_ID’)は、第1のビューシーケンスのトラックID(‘track_ID’)である。例えば、トラックID=1(track_ID=1)であるトラックがトラック基準ボックス(‘tref’ボックス)を有し、該当トラック基準ボックスの基準タイプが‘avmi’(reference_type=‘avmi’)であり、参照するトラックIDが2(track_ID=2)である場合に、トラックID=1(track_ID=1)であるトラックは、トラックID=2(track_ID=2)であるトラックと対をなすステレオスコピックビューシーケンスのトラックであり、トラックID=2(track_ID=2)であるトラックのビューシーケンスが第1のビューシーケンスである。
本発明の一実施形態による第1のビューシーケンスを第2のビューシーケンスと区別する他の方法としては、端末が、ステレオスコピックビデオの構成タイプ情報の左側ビューシーケンスと右側ビューシーケンス(又は、2個以上のビューシーケンス)のうちのいずれか一つを先ず符号化するかを示す‘is_left_first’フィールドを確認し、左側ビューシーケンスと右側ビューシーケンス(又は、2個以上のビューシーケンス)のうちのいずれか一つが該当フィールドの値によって第1のビューシーケンス又は第2のビューシーケンスであるかを判定する場合、端末は、図5の動作によって、ステップ408で、‘is_left_first’パラメータを含むステレオスコピック関連情報ボックスを確認することによって第1のビューシーケンス及び第2のビューシーケンスを識別し、その関連ビューシーケンスをディスプレイする。
このように、第1のビューシーケンス及び第2のビューシーケンスを識別するプロセスの動作順序は、本発明による第1のビューシーケンスを第2のビューシーケンスと区別する各々の方法に従って変更することができる。
本発明の一実施形態において、参照されるトラック、即ち‘tref’ボックスを有していない残りのトラックのハンドラタイプがステレオスコピックビデオタイプ(‘svid’)として表示されるが、参照されるトラックはビデオタイプ(‘vide’)となり、参照するトラックはステレオスコピックビデオタイプ(‘svid’)となり得る。また、参照するトラック及び参照されるトラックのハンドラタイプ(‘handler_type’)は、別途の区別なしにビデオタイプ(‘vide’)で表示することができる。
一方、図5で説明したメディアファイルのトラックを確認して画面にディスプレイするプロセスは、端末又はシステムによって順次に提供されないこともある。ここでは、具体的に説明されていないファイルフォーマットの分析プロセス及び該当端末の動作は、ISO/IEC14496−12及びISO/IEC23000−11に従う。
<第2の実施形態>
本発明の第2の実施形態では、ステレオスコピックコンテンツでトラック基準ボックス(‘tref’ボックス)を用いて、追加情報であるカメラパラメータ及びディスプレイ安全情報(display safety information)を含むトラックを参照するためのトラック参照方法について説明する。ステレオスコピックコンテンツに付加的な情報として含まれるカメラパラメータは、ベースライン、focal_length、convergence_distance、変換(translation)、回転などを含み、ディスプレイ安全情報は、ディスプレイサイズ関連情報、視聴距離、及び不一致(disparity)情報などを含む。ここで、カメラパラメータ及びディスプレイ安全情報は追加情報として示したが、これらパラメータ及び安全情報は選択的である。従って、該当情報を含むボックスは、選択的なボックスとして表現することができる。
本発明の第2の実施形態では、ステレオスコピックコンテンツを獲得するために使用されるカメラパラメータ及びディスプレイ安全情報を含むトラックのトラック参照のために、<表5>に示すように‘tref’ボックスのreference_typeに‘cdsi’を追加する。
Figure 0005483205
図6は、本発明の第2の実施形態により、ステレオスコピックコンテンツに対する追加情報であるカメラパラメータとディスプレイ安全情報を含むトラックを参照する方法を示す。
図6を参照すると、ステレオスコピック左側ビューシーケンスのトラックとステレオスコピック右側ビューシーケンスのトラックは、トラック基準ボックス(‘tref’ボックス)510、520を用いて、追加情報が含まれたトラックを参照できる。このような場合に、トラック全てに追加情報を格納する必要がなく、他のトラックが追加情報を含むトラックを参照することによって、同一の情報が複数のトラックに重複して格納されることを防止することができる。
図7は、多重ビューシーケンスを有するマルチビューコンテンツに本発明の第2の実施形態を適用する方法を示す。
この場合でも、図6に示すように、各々のビューシーケンスを含むトラックは、‘tref’ボックス610、620、630を用いて追加情報を含むトラックを参照する。
図8は、本発明の第2の実施形態による端末の動作を示すフローチャートである。
図8を参照すると、端末は、ステップ701で、メディアファイルのファイルタイプボックス(‘ftyp’ボックス)を分析する。端末は、ステップ702及び703で、メディアファイルの‘moov’ボックスとトラックボックス(‘trak’ボックス)を分析する。端末は、ステップ704で、トラック基準ボックス(‘tref’ボックス)がトラックボックスに存在するか否かを判定する。トラックがトラック基準ボックス(‘tref’ボックス)を有する場合に、端末は、ステップ705で、トラック基準ボックス(‘tref’ボックス)の基準タイプ(‘reference_type’)を確認する。基準タイプ(‘reference_type’)が‘cdsi’であると判定される場合に、端末は、トラック基準ボックス(‘tref’ボックス)の参照するトラックID(‘track_ID’)を確認し、該当トラックが参照しようとするステレオスコピックビデオに関する追加情報であるカメラパラメータ及びディスプレイ安全情報を含む追加情報をどのトラックが包含するかを判定する。端末は、ステップ706でメディア情報ボックス(‘mdia’ボックス)を確認し、ステップ707で、端末が該当トラックのどのメディアデータタイプを決定できるかに基づき、ハンドラボックス(‘hdlr’ボックス)のハンドラタイプ(‘handler_type’)を確認する。最後に、ステップ708で、端末は、ステレオスコピック情報を包含する残りのボックスの情報を確認し、ステレオスコピックビューシーケンスのトラックのステレオスコピックビデオ関連情報を分析し、その関連したトラックを画面にディスプレイする。トラックボックス(‘trak’ボックス)を分析する一連のプロセスは、該当トラックがステレオスコピックビューシーケンスのトラックである場合に、メディアファイルの最初のトラックから最後のトラックまで同一に遂行される。
一方、ステップ704で、トラックがトラック基準ボックス(‘tref’ボックス)を有していないと判定される場合には、端末は、ステップ706に進行し、該当トラックのメディア情報ボックス(‘mdia’ボックス)を確認する。その後、端末は、ステップ707で、ハンドラタイプ(‘handler_type’)を確認し、ステップ708で、ステレオスコピック情報を含んでいる残りのボックスを確認してステレオスコピックコンテンツを画面にディスプレイする。
端末は、図8のステップ708で、第1のビューシーケンス及び第2のビューシーケンスを識別するが、この第1のビューシーケンス及び第2のビューシーケンスを識別するプロセスのステップは、本発明の第1の実施形態による図5に説明したように、第1のビューシーケンスを第2のビューシーケンスと区別する上述した方法によって順序を変更することができる。
ステップ707で分析したトラックのハンドラタイプがステレオスコピックビデオタイプ(‘svid’)である場合、該当トラックは、ステレオスコピックビデオに対する追加情報であるカメラパラメータとディスプレイ安全情報を有する選択的情報を含むトラックである。
一方、図8で説明したメディアファイルのトラックを確認して画面にディスプレイするプロセスは、端末又はシステムによって順次に実行されないこともある。ここで、具体的に説明されていないファイルフォーマットの分析プロセス及び該当端末の動作は、ISO/IEC14496−12及びISO/IEC23000−11に従う。
<第3の実施形態>
ステレオスコピックコンテンツとモノスコピックコンテンツが一つのシーンを構成する要素として一つのシーンで同時にディスプレイされるサービスの場合に、一つのシーン内で表現されなければならないステレオスコピックビューシーケンスとモノスコピックビューシーケンスを復号化してディスプレイするために、2個のビューシーケンスのトラックを接続して、ユーザーが相互に関連したトラックであることをわかるようにする必要がある。しかし、現在のステレオスコピックファイルフォーマットにはこのような関係を示す方法がないので、本発明の第3の実施形態ではこの問題を解決するための方法を提案する。
‘ISO/IEC14496−12 ISOベースのメディアファイルフォーマット’文書に定義されたボックスの中に、ハンドラ基準ボックス(‘hdlr’ボックス)とトラック基準ボックス(‘tref’ボックス)がある。上述したように、ハンドラ基準ボックス(‘hdlr’ボックス)は、ハンドラタイプ(‘handler_type’)を用いて現在トラックのメディアデータのタイプを表す。本発明の第3の実施形態では、一つのシーンで表現されなければならないステレオスコピックビューシーケンスのトラックとモノスコピックビューシーケンスのトラックを相互に接続するために、<表6>に示すように、ハンドラ基準ボックス(‘hdlr’ボックス)のハンドラタイプ(‘handler_type’)‘mvid’を追加する。
Figure 0005483205
トラック基準ボックス(‘tref’ボックス)は基準タイプ(‘reference_type’)とトラックID(‘track_ID’)を用いて現在のトラックによって参照されるもう一つのトラックを接続するために使用されるボックスである。本発明の第3の実施形態では、関連した2個のトラックを接続させるために、<表7>に示すようにトラック基準ボックス(‘tref’ボックス)の基準タイプ(‘reference_type’)に‘scmi’を追加する。
Figure 0005483205
図9は、本発明の第3の実施形態により、新たに定義された‘handler_type’と‘reference_type’を用いて一つのシーンに同時にディスプレイされるステレオスコピックビューシーケンスとモノスコピックビューシーケンスを有するコンテンツで、一つのシーンに形成されるステレオスコピックビューシーケンスのトラックとモノスコピックビューシーケンスのトラックを相互に接続するファイル構造を示す。
図9を参照すると、現在トラックは、ステレオスコピックビューシーケンスのトラックであり、ステレオスコピックビューシーケンスと共に一つのシーンでディスプレイされなければならないモノスコピックビューシーケンスのトラックは、トラック基準ボックス(‘tref’ボックス)810を用いて現在トラックに接続される。基準タイプをreference_type=‘scmi’として設定する場合に、参照されるトラックは、参照するトラックであるステレオスコピックビデオトラックと共に一つのシーンでディスプレイされなければならないモノスコピックコンテンツを含むトラック(空間的に組み合わせたメディアトラック)である。更に、参照されるトラックのハンドラ基準ボックス(‘hdlr’ボックス)820のハンドラタイプをhandler_type=‘mvid’として設定する場合に、参照されるトラックは、ステレオスコピックビューシーケンスと共に一つのシーンでディスプレイされなければならないモノスコピックビューシーケンスのトラック(空間的に組み合わせたメディアトラック)である。
図10は、本発明の第3の実施形態によって一つのシーンで同時にディスプレイされるステレオスコピックビューシーケンスとモノスコピックビューシーケンスを有するコンテンツで、2個以上のビューシーケンスで構成されたステレオスコピックビューシーケンスとモノスコピックビューシーケンスを相互に接続するファイル構造を示す。
図10を参照すると、ステレオスコピックビデオを構成するステレオスコピック左側ビューシーケンスのトラックとステレオスコピック右側ビューシーケンスのトラックは、各々トラック基準ボックス(‘tref’ボックス)910、920を用いて一つのシーンで共にディスプレイされなければならないモノスコピックビューシーケンスのトラックを参照するように接続することができる。この場合にも、ステレオスコピック左側ビューシーケンスのトラックとステレオスコピック右側ビューシーケンスのトラックの各々に対して、トラック基準ボックス(‘tref’ボックス)910、920の基準タイプがreference_type=‘scmi’として設定され、この参照されるトラックのハンドラ基準ボックス(‘hdlr’ボックス)930のハンドラタイプがhandler_type=‘mvid’として設定される場合に、参照されるビューシーケンスのトラックは、ステレオスコピックビューシーケンスと共に一つのシーンでディスプレイされなければならないモノスコピックビューシーケンスのトラック(空間的に組み合わせたメディアトラック)である。
<第4の実施形態>
図11は、本発明の第4の実施形態により、新たに定義されたハンドラタイプ(handler_type)‘svid’と基準タイプ(‘reference_type’)‘avmi’を用いて一つのシーンで同時にディスプレイされるステレオスコピックビューシーケンスとモノスコピックビューシーケンスを有するコンテンツで、ステレオスコピックビューシーケンスのトラックとモノスコピックビューシーケンスのトラックを相互に接続する他のファイル構造を更に示す。
本発明の第4の実施形態では、本発明の第1の実施形態で使用されたトラック基準方法と同一の方法でトラックを参照する。しかし、本発明の第4の実施形態では、トラック基準ボックス(‘tref’ボックス)1010は、そのビューシーケンスと対をなすステレオスコピックビューシーケンスとの接続だけでなく、一つのシーンで同時にディスプレイされるモノスコピックビューシーケンスとの接続にも使用される。トラック基準ボックス(‘tref’ボックス)1010のreference_type=‘avmi’、参照されるステレオスコピックビデオトラックのハンドラ基準ボックス(‘hdlr’ボックス)1020のhandler_type=‘svid’、参照されるモノスコピックビデオトラックのハンドラ基準ボックス(‘hdlr’ボックス)1030のhandler_type=‘vide’に設定することによって、第1のビューシーケンスと対をなすステレオスコピックの残りの一つのビューシーケンスを、ステレオスコピックコンテンツと共に一つのシーンで同時にディスプレイされなければならないモノスコピックビューシーケンスと区別することができる。
図11の例において、上述した第1のビューシーケンスを決定する方法によってステレオスコピック右側ビューシーケンスのトラックが第1のビューシーケンストラックとして決定されるので、トラック基準ボックス(‘tref’ボックス)を有するトラックは、第2のビューシーケンスとして設定される。
更に、本実施形態において、2個以上のトラックで構成されるステレオスコピックコンテンツ間の接続関係がreference_type=‘avmi’を用いて示される場合に、第1のビューシーケンストラックのhandler_typeは‘vide’であり、第2のビューシーケンストラックのhandler_typeは‘svid’である。もちろん、このような区別において、参照されるビューシーケンスはビデオタイプ(‘vide’)となり得る。また、全てのビューシーケンスは、別途の区分なしにビデオタイプ(‘vide’)のみを用いて示すことができる。
<第5の実施形態>
本発明の第5の実施形態は、2個以上のビューシーケンスで構成されたステレオスコピック間の関係を本発明の第1の実施形態のようなトラック参照方法を用いて示し、参照するビューシーケンス以外の残りのビューシーケンスに対して参照するビューシーケンスから相対的なディスプレイ及びカメラ情報を格納して生成されたステレオスコピックメディアファイルの構造を提供する。
ステレオスコピックビデオ関連情報において、追加情報は、本発明の第1及び第2の実施形態で説明したようにステレオスコピックコンテンツに含まれる。ステレオスコピックコンテンツに含まれ得る追加情報として、ステレオスコピックビデオを獲得する過程で得られるステレオスコピックビデオ関連情報を含む、ステレオスコピックビデオに対するディスプレイ及びカメラ情報がある。このようなステレオスコピックビデオに対するディスプレイ及びカメラ情報は、ベースライン、focal_length、convergence_distance、変換、回転などを含み、ディスプレイ安全情報は、ディスプレイサイズ関連情報、視聴距離、及び不一致情報などを含むことができる。本発明では追加情報として称しているが、この情報は、選択的な情報である。従って、該当情報を含んでいるボックスは、選択的なボックスとして表現できる。
ステレオスコピックビデオのディスプレイ及びカメラ情報を格納する方法のうちの一つは、参照するビューシーケンスを基にして残りのビューシーケンスに、参照するビューシーケンスのディスプレイ及びカメラ情報に対する相対的な値を各フィールドのパラメータ値として格納する。例えば、参照するビューシーケンスが第1のビューシーケンスであると仮定する場合、第1のビューシーケンスのディスプレイ及びカメラ情報は、全て0として格納され、各フィールドに対して参照するビューシーケンスから相対的なディスプレイ及びカメラ情報のパラメータ値は、第1のビューシーケンスを除いた残りのビューシーケンス、即ち第2のビューシーケンスに格納される。参照するビューシーケンスのステレオスコピックビデオに対するディスプレイ及びカメラ情報は、全て0に設定されるため、該当情報は省略できる。従って、参照するビューシーケンスのディスプレイ及びカメラ情報に対する相対的なディスプレイ及びカメラ情報は、残りのビューシーケンスのみに格納することができる。例えば、ステレオスコピックビデオのディスプレイ及びカメラ情報のうちの一つである2個のビューシーケンスに対するカメラ間の距離が5であると仮定すると、参照するビューシーケンスの該当情報に対するフィールドの値が0であるので、‘0’値は省略され、参照するビューシーケンスのカメラからの距離である5は、残りのビューシーケンスの該当情報に対するフィールドの値として格納される。
図12は、本発明の第5の実施形態によるファイル構造を示す。
図12において、参照するビューシーケンスは、第1のビューシーケンスであると仮定し、2個のビューシーケンスで構成されるステレオスコピックメディアファイル構造において、第1のビューシーケンスから相対的なディスプレイ及びカメラ情報を格納する‘scdi’ボックス1140は、第2のビューシーケンスのトラックに包含され、第1のビューシーケンスのトラックは、本発明の第1の実施形態で使用されたトラック参照方法と同一の方法でハンドラタイプ‘svid’1110及び基準タイプ‘avmi’1120を用いて‘scdi’情報を有する第2のビューシーケンスのトラックに接続される。この場合でも、ビデオタイプ‘vide’は、ステレオスコピックビューシーケンスのハンドラタイプ1110として使用することができる。図12において、第1のビューシーケンスは、トラック基準ボックス(‘tref’ボックス)のない左側ビューシーケンスのように示し、トラック基準ボックス(‘tref’ボックス)を有するステレオスコピックビューシーケンス、即ち基準タイプ(‘reference_type’)=‘avmi’であるビューシーケンスのトラックは、参照するビューシーケンスからの相対的なディスプレイ及びカメラ情報を持っている‘scdi’ボックスを含む。
図13は、トラックを参照するトラック基準ボックス(‘tref’ボックス)1150を有するトラックが‘scdi’ボックス1160を有するトラックとは関係なく提供される場合を示す。ここで、‘scdi’情報の参照するビューシーケンスは左側ビューシーケンスであり、左側ビューシーケンスの相対的‘scdi’情報は、右側ビューシーケンスのトラックに含まれる。
図14は、2個以上のビューシーケンスを有するマルチビューコンテンツに対する本発明の第5の実施形態の方法を拡張して生成されるファイル構造を示す。
図14を参照すると、本発明の第5の実施形態により、第1のビューシーケンスから相対的ディスプレイ及びカメラ情報が格納された‘scdi’ボックス1224及び1234は、第1のビューシーケンス以外の残りの複数のビューシーケンスに包含され、第1のビューシーケンスのトラックは、本発明の第1の実施形態で使用されたトラック参照方法と同一の方法でハンドラタイプ‘svid’1210と基準タイプ‘avmi’1220、1230を用いて‘scdi’情報を有する残りのビューシーケンスのトラックに接続される。この場合でも、ビデオタイプ‘vide’は、ステレオスコピックビデオのハンドラタイプ(1222及び1232)として使用することができる。
図15は、トラックを参照する‘tref’ボックス1250を有するトラックが‘scdi’ボックス1260及び1270を有するトラックと別個に提供される場合を示す。
第1〜第5の実施形態において、基準タイプ及びハンドラタイプのタイトル、名称、及び意味(semantic)は、同一のオブジェクト及び方法に対応する限り、異なるタイトル、名称、及び意味で表現することができる。
次に、本発明の一実施形態によるメディアファイルフォーマットを用いるメディアファイルを生成及び再生するシステムについて説明する。本発明の一実施形態によるシステムは、大きくメディアファイル生成装置とメディアファイル再生装置で構成することができる。
図16は、本発明の一実施形態によるメディアファイル生成装置を示す。
図16を参照すると、本実施形態によるメディアファイル生成装置は、2個以上のカメラ1301〜1304、入力部1310、ビデオ信号プロセッサ1320、格納部1330、エンコーダ1340、及びファイル生成部1350を含む。
カメラ1301〜1304は、各々特定の被写体を左側ビュー又は右側ビューで撮影して相互に異なるビューシーケンスを出力する。モノグラフィックビデオがサービスされる場合には、モノスコピックビデオデータは、ステレオスコピックビデオデータと一緒に入力部1310に入力される。このとき、カメラパラメータのような情報も、入力部1310に伝達することができる。
ビデオ信号プロセッサ1320は、入力部1310を通じて受信された全てのビデオデータを前処理する。ここで、前処理動作は、外部のビデオ値、即ち光とカラー成分をCCD(Charge Coupled Device)又はCMOS(Complementary Metal−Oxide Semiconductor)タイプのセンサーによって認識されて生成されたアナログ値をデジタル値に変換する動作を意味する。
格納部1330は、ビデオ信号プロセッサ1320によって前処理されたビデオデータを格納してエンコーダ1340に提供する。図16は、格納部1330を示しているが、この格納部1330は、図16に示す構成要素間のバッファリングに対する格納構成を別途に示していない。エンコーダ1340は、格納部1330から提供された各ビデオデータを符号化する。エンコーダ1340によって遂行される符号化動作は、必要に応じて省略可能なデータの符号化である。
ファイル生成部1350は、エンコーダ1340によって符号化された各ビデオデータを用いてメディアファイル1300を生成する。このビデオデータは、データ領域、特にメディアデータ領域に格納され、ビデオデータ間の関係を示すトラック基準情報、各ビデオデータのメディアタイプを表すハンドラ情報、ステレオスコピックビデオの構成タイプ、及びカメラとディスプレイ情報は、各ビデオデータのトラックの該当情報に対するボックスに格納される。この生成されたメディアファイル1300は、ステレオスコピックメディアファイル再生装置に入力又は転送され、メディアファイル再生装置は、メディアファイル1300からステレオスコピックサービスビデオを再生してディスプレイする。
次に、本発明の一実施形態によるステレオスコピックメディアファイル再生装置について説明する。
図17は、本発明の一実施形態によるメディアファイル再生装置を示すブロック構成図である。図17に示すように、メディアファイル再生装置は、ファイル分析器1410、デコーダ1420、格納部1430、再生部1440、及びディスプレイ部1450を含む。
ファイル分析器1410は、例えば、メディアファイル生成装置のファイル生成部1350によって生成されたメディアファイル1400を受信して分析する。このとき、ファイル分析器1410は、ファイル、moov、トラック、及びメタデータ領域に各々格納された情報を分析した後に、メディアデータ領域に格納されているビデオデータ1401〜1404を抽出する。図5及び図8に示したファイル分析動作を通じて、ファイル分析器1410は、トラック間の基準情報を含む関連性を示す情報も抽出し、関連したトラックを識別することができる。
デコーダ1420は、抽出されたビデオデータを復号化する。本実施形態において、このデコーダ1420は、メディアファイル生成装置がエンコーダ1340を用いてデータを符号化する場合に使用される。復号化されたデータは、格納部1430に格納される。再生部1440は、識別情報に基づいて格納部1430に格納されたビデオデータを用いて関連したステレオスコピックビューシーケンスを合成して再生し、及び/又は関連したステレオスコピックビューシーケンス及びモノスコピックビューシーケンスを共に再生する。ディスプレイ部1450は、再生されたビューシーケンスをディスプレイする。このディスプレイ部1450には、バリアLCDを採用できる。この場合、バリアLCDは、メディアファイルのモノスコピックビデオに対してオフ状態とし、ステレオスコピックビデオに対してオン状態とすることで、各ビデオを画面にディスプレイすることができる。
以上、本発明を具体的な実施形態に関して図示及び説明したが、添付した特許請求の範囲により規定されるような本発明の精神及び範囲を外れることなく、形式や細部の様々な変更が可能であることは、当該技術分野における通常の知識を持つ者には明らかである。
100、1300、1400 メディアファイル
110 映画データボックス(‘moov’ボックス)
120 メディアデータボックス(‘mdat’ボックス)
210、310、510、520、610、620、630、810、910、920、1010、1150、1250 トラック基準ボックス(‘tref’ボックス)
220、320、330、820、930、1020、1030 ハンドラ基準ボックス(‘hdlr’ボックス)
1110、1210 ハンドラタイプ‘svid’
1120、1220、1230 基準タイプ‘avmi’
1140、1160、1224、1234 ‘scdi’ボックス
1301 各ビデオの関連情報
1302 カメラ(左)
1303 カメラ(右)
1304 マルチビュー又はモノビューカメラ
1310 入力部
1320 ビデオ信号プロセッサ
1330、1430 格納部
1340 エンコーダ
1350 ファイル生成部
1410 ファイル分析器
1420 デコーダ
1440 再生部
1450 ディスプレイ部

Claims (15)

  1. 格納されたデータを有するコンピュータ読み取り可能な記録媒体であって、
    一つのシーンに同時にディスプレイされるステレオスコピックビューシーケンスである複数のビューシーケンスを含むメディアデータフィールドと、
    前記複数のビューシーケンスのそれぞれに対応するトラックフィールドを含むメディアヘッダーフィールドと、を含み、
    前記トラックフィールドのうち少なくとも一つのトラックフィールドは、トラック基準フィールドを含み、前記トラック基準フィールドは前記少なくとも一つのトラックフィールドが他のトラックフィールドを参照することを示すトラック基準情報を含み、
    前記複数のビューシーケンスは、第1のビューシーケンスと第2のビューシーケンスとを含み、
    前記第1のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は基準値に設定され、前記第2のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は前記基準値に相対的な値に設定され、
    前記相対的な値に設定される前記第2のビューシーケンスの前記ディスプレイ及びカメラ情報は前記第2のビューシーケンスに対応するトラックフィールドに格納され、
    メディアファイルから前記メディアデータフィールドと前記メディアヘッダーフィールドとを分析してビデオを生成する手段として機能するためのディスプレイプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
  2. 前記トラックフィールドはパラメータをさらに含み、前記パラメータは前記複数のビューシーケンスのうちどのビューシーケンスが前記第1のビューシーケンスであるかを示すことを特徴とする請求項1に記載のコンピュータ読み取り可能な記録媒体。
  3. 前記第1のビューシーケンスの前記ディスプレイ及びカメラ情報に対する前記基準値は0に設定されることを特徴とする請求項1に記載のコンピュータ読み取り可能な記録媒体。
  4. 前記第1のビューシーケンスに対する前記メディアデータフィールド又はメディアヘッダーフィールドは前記第1のビューシーケンスに対する前記パラメータ値が0に設定され、前記第2のビューシーケンスに対する前記パラメータ値が前記第2のビューシーケンスに対する前記メディアデータフィールド又は前記メディアヘッダーフィールドに含まれることを特徴とする請求項1に記載のコンピュータ読み取り可能な記録媒体。
  5. 前記第1のビューシーケンスは、ステレオスコピック左側ビューシーケンス、ステレオスコピック右側ビューシーケンス、主ビューシーケンス、付加ビューシーケンス、ステレオスコピックコンテンツ、モノスコピックコンテンツのうち一つであり、
    前記第2のビューシーケンスは、ステレオスコピック左側ビューシーケンス、ステレオスコピック右側ビューシーケンス、主ビューシーケンス、付加ビューシーケンス、ステレオスコピックコンテンツ、そしてモノスコピックコンテンツのうち一つであることを特徴とする請求項1に記載のコンピュータ読み取り可能な記録媒体。
  6. メディアファイルを受信するステップと、
    前記メディアファイルから一つのシーンに同時にディスプレイされるステレオスコピックビューシーケンスである複数のビューシーケンスを含むメディアデータフィールドと、前記複数のビューシーケンスのそれぞれに対応するトラックフィールドを含むメディアヘッダーフィールドを分析するステップと、
    前記トラックフィールドのうち参照するビューシーケンスに該当するトラックフィールドに含まれるトラック基準フィールドに含まれるトラック基準情報によって、前記参照するビューシーケンスと参照されるビューシーケンスに基づいてビデオを生成するステップとを含み、
    前記トラック基準情報は前記参照するビューシーケンスを生成するために参照されるトラックフィールドで他のトラックフィールドを示し、
    前記複数のビューシーケンスは、第1のビューシーケンスと第2のビューシーケンスとを含み、
    前記第1のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は基準値に設定され、前記第2のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は前記基準値に相対的な値に設定され
    前記相対的な値に設定される前記第2のビューシーケンスの前記ディスプレイ及びカメラ情報は前記第2のビューシーケンスに対応するトラックフィールドに格納されることを特徴とするコンピュータ実行方法。
  7. 前記トラックフィールドはパラメータをさらに含み、前記パラメータは前記複数のビューシーケンスのうちどのビューシーケンスが前記第1のビューシーケンスであるかを示すことを特徴とする請求項6に記載のコンピュータ実行方法。
  8. 前記第1のビューシーケンスの前記ディスプレイ及びカメラ情報に対する前記基準値は0に設定されることを特徴とする請求項6に記載のコンピュータ実行方法。
  9. 前記第1のビューシーケンスに対する前記メディアデータフィールド又は前記メディアヘッダーフィールドは前記第1のビューシーケンスに対する前記パラメータ値が0に設定され、前記第2のビューシーケンスに対する前記パラメータ値が前記第2のビューシーケンスに対する前記メディアデータフィールド又は前記メディアヘッダーフィールドに含まれることを特徴とする請求項6に記載のコンピュータ実行方法。
  10. 前記第1のビューシーケンスはステレオスコピック左側ビューシーケンス、ステレオスコピック右側ビューシーケンス、主ビューシーケンス、付加ビューシーケンス、ステレオスコピックコンテンツ、モノスコピックコンテンツのうち一つであり、
    前記第2のビューシーケンスはステレオスコピック左側ビューシーケンス、ステレオスコピック右側ビューシーケンス、主ビューシーケンス、付加ビューシーケンス、ステレオスコピックコンテンツ、そしてモノスコピックコンテンツのうち一つであることを特徴とする請求項6に記載のコンピュータ実行方法。
  11. メディアファイルを受信する受信機と、
    前記メディアファイルから一つのシーンに同時にディスプレイされるステレオスコピックビューシーケンスである複数のビューシーケンスを含むメディアデータフィールドと前記複数のビューシーケンスのそれぞれに対応するトラックフィールドを含むメディアヘッダーフィールドを分析し、前記トラックフィールドのうち参照するビューシーケンスに該当するトラックフィールドに含まれるトラック基準フィールドに含まれるトラック基準情報によって、前記参照するビューシーケンスと参照されるビューシーケンスとに基づいてビデオを抽出するファイル分析部と、
    前記抽出されたビデオを表示するディスプレイ部と、を含み、
    前記トラック基準情報は前記参照するビューシーケンスを生成するために参照されるトラックフィールドで他のトラックフィールドを示し、
    前記複数のビューシーケンスは、第1のビューシーケンスと第2のビューシーケンスとを含み、
    前記第1のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は基準値に設定され、前記第2のビューシーケンスのディスプレイ及びカメラ情報に対するパラメータ値は前記基準値に相対的な値に設定され、
    前記相対的な値に設定される前記第2のビューシーケンスの前記ディスプレイ及びカメラ情報は前記第2のビューシーケンスに対応するトラックフィールドに格納されることを特徴とする端末装置。
  12. 前記トラックフィールドはパラメータをさらに含み、前記パラメータは前記複数のビューシーケンスのうちどのビューシーケンスが前記第1のビューシーケンスであるかを示すことを特徴とする請求項11に記載の端末装置。
  13. 前記第1のビューシーケンスの前記ディスプレイ及びカメラ情報に対する前記基準値は0に設定されることを特徴とする請求項11に記載の端末装置。
  14. 前記第1のビューシーケンスに対する前記メディアデータフィールド又は前記メディアヘッダーフィールドは前記第1のビューシーケンスに対する前記パラメータ値が0に設定され、前記第2のビューシーケンスに対する前記パラメータ値が前記第2のビューシーケンスに対する前記メディアデータフィールド又はメディアヘッダーフィールドに含まれることを特徴とする請求項11に記載の端末装置。
  15. 前記第1のビューシーケンスはステレオスコピック左側ビューシーケンス、ステレオスコピック右側ビューシーケンス、主ビューシーケンス、付加ビューシーケンス、ステレオスコピックコンテンツ、モノスコピックコンテンツのうち一つであり、
    前記第2のビューシーケンスはステレオスコピック左側ビューシーケンス、ステレオスコピック右側ビューシーケンス、主ビューシーケンス、付加ビューシーケンス、ステレオスコピックコンテンツ、そしてモノスコピックコンテンツのうち一つであることを特徴とする請求項11に記載の端末装置。
JP2010545808A 2008-02-05 2009-02-05 メディアデータフィールドと前記メディアデータヘッダーとを分析してビデオを生成するための装置、方法及び記録媒体 Active JP5483205B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR10-2008-0011992 2008-02-05
KR20080011992 2008-02-05
KR10-2008-0020744 2008-03-05
KR20080020744 2008-03-05
KR10-2008-0087351 2008-09-04
KR1020080087351A KR101530713B1 (ko) 2008-02-05 2008-09-04 영상 파일을 생성하고 표시하기 위한 장치 및 방법
PCT/KR2009/000568 WO2009099307A1 (en) 2008-02-05 2009-02-05 Apparatus and method for generating and displaying media files

Publications (2)

Publication Number Publication Date
JP2011511593A JP2011511593A (ja) 2011-04-07
JP5483205B2 true JP5483205B2 (ja) 2014-05-07

Family

ID=41205804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010545808A Active JP5483205B2 (ja) 2008-02-05 2009-02-05 メディアデータフィールドと前記メディアデータヘッダーとを分析してビデオを生成するための装置、方法及び記録媒体

Country Status (6)

Country Link
JP (1) JP5483205B2 (ja)
KR (1) KR101530713B1 (ja)
CN (1) CN101971639B (ja)
AU (1) AU2009210926B2 (ja)
CA (1) CA2713857C (ja)
RU (1) RU2462771C2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5652642B2 (ja) * 2010-08-02 2015-01-14 ソニー株式会社 データ生成装置およびデータ生成方法、データ処理装置およびデータ処理方法
KR101045889B1 (ko) * 2010-10-13 2011-07-01 주식회사 쓰리디누리 입체 영상 처리 장치 및 방법
JP2012249137A (ja) * 2011-05-30 2012-12-13 Sony Corp 記録装置、記録方法、再生装置、再生方法、プログラム、および記録再生装置
JP2013090185A (ja) * 2011-10-19 2013-05-13 Sharp Corp 画像ファイル生成装置、画像ファイル読込装置、画像ファイル生成方法、画像ファイル読込方法およびプログラム
US9584792B2 (en) 2013-01-04 2017-02-28 Qualcomm Incorporated Indication of current view dependency on reference view in multiview coding file format
GB2542282B (en) 2013-10-22 2018-08-01 Canon Kk Method, device, and computer program for encapsulating partitioned timed media data in a server
RU2019122989A (ru) * 2014-05-30 2019-09-16 Сони Корпорейшн Устройство обработки информации и способ обработки информации
US10924822B2 (en) 2017-04-04 2021-02-16 Qualcomm Incorporated Segment types as delimiters and addressable resource identifiers
US10992961B2 (en) * 2017-05-25 2021-04-27 Qualcomm Incorporated High-level signaling for fisheye video data
CN110545254B (zh) * 2018-05-29 2021-05-04 北京字节跳动网络技术有限公司 一种元数据容器的解析方法、装置及存储介质
CN110858916B (zh) * 2018-08-24 2020-11-24 上海交通大学 支持大跨度相关性信息编码的标识方法及系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3143365B2 (ja) * 1995-07-28 2001-03-07 三洋電機株式会社 監視用画像記録装置
KR100392256B1 (ko) * 2001-03-30 2003-07-22 한국전자통신연구원 내용기반 멀티채널 감시비디오 색인 및 검색장치와 방법
KR100482836B1 (ko) * 2002-08-14 2005-04-14 엘지전자 주식회사 감시용 디지털 비디오 레코더에서의 데이터 파일 검색방법
RU39987U1 (ru) * 2004-05-05 2004-08-20 Коробков Эдуард Вячеславович Устройство для получения объемного телевизионного изображения
JP2008529367A (ja) * 2005-01-25 2008-07-31 ネロ アーゲー Dvdビデオ形式のデータを作成する方法、dvdビデオ・データおよびdvdビデオ・データ構造を復元するための方法
EP1932315A4 (en) * 2005-09-01 2012-05-09 Nokia Corp METHOD FOR INTEGRATING SVG CONTENT INTO ISO MULTIMEDIA FILE FORMAT FOR PROGRESSIVE DOWNLOAD AND CONTINUOUS TRANSMISSION OF RICH MULTIMEDIA CONTENT
US8761568B2 (en) * 2005-12-20 2014-06-24 Vestel Elektronik Sanayi Ve Ticaret A.S. Method and apparatus for synchronizing subtitles with a video
KR100962696B1 (ko) * 2007-06-07 2010-06-11 주식회사 이시티 부호화된 스테레오스코픽 영상 데이터 파일의 구성방법
WO2008156318A2 (en) * 2007-06-19 2008-12-24 Electronics And Telecommunications Research Institute Metadata structure for storing and playing stereoscopic data, and method for storing stereoscopic content file using this metadata
JP2011502375A (ja) * 2007-10-10 2011-01-20 韓國電子通信研究院 ステレオスコピックデータの保存および再生のためのメタデータ構造ならびにこれを利用するステレオスコピックコンテンツファイルの保存方法
US8922621B2 (en) * 2007-10-19 2014-12-30 Samsung Electronics Co., Ltd. Method of recording three-dimensional image data

Also Published As

Publication number Publication date
RU2462771C2 (ru) 2012-09-27
AU2009210926A1 (en) 2009-08-13
CN101971639B (zh) 2013-04-17
KR20090086017A (ko) 2009-08-10
CA2713857A1 (en) 2009-08-13
AU2009210926B2 (en) 2013-07-11
JP2011511593A (ja) 2011-04-07
CN101971639A (zh) 2011-02-09
CA2713857C (en) 2014-04-22
RU2010132853A (ru) 2012-02-10
KR101530713B1 (ko) 2015-06-23

Similar Documents

Publication Publication Date Title
JP5483205B2 (ja) メディアデータフィールドと前記メディアデータヘッダーとを分析してビデオを生成するための装置、方法及び記録媒体
US9781403B2 (en) Method and apparatus for generating stereoscopic file
US20090199100A1 (en) Apparatus and method for generating and displaying media files
JP5519647B2 (ja) カメラ・パラメータを利用したステレオスコピック映像データ・ストリーム生成方法及びその装置、
US8396906B2 (en) Metadata structure for storing and playing stereoscopic data, and method for storing stereoscopic content file using this metadata
US8259162B2 (en) Method and apparatus for generating stereoscopic image data stream for temporally partial three-dimensional (3D) data, and method and apparatus for displaying temporally partial 3D data of stereoscopic image
KR101310214B1 (ko) 스테레오스코픽 데이터의 저장 및 재생을 위한 메타데이터 구조 및 이를 이용하는 스테레오스코픽 콘텐츠 파일의 저장 방법
US8878836B2 (en) Method and apparatus for encoding datastream including additional information on multiview image and method and apparatus for decoding datastream by using the same
KR101434674B1 (ko) 스테레오스코픽 파일을 생성하기 위한 장치 및 방법
KR101591085B1 (ko) 영상 파일 생성 및 재생 장치 및 방법
KR101176065B1 (ko) 스테레오스코픽 영상에 관한 데이터를 전송하는 방법, 스테레오스코픽 영상을 재생하는 방법, 및 스테레오스코픽 영상 데이터의 파일 생성 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120814

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121114

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121121

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121214

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121228

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130115

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140206

R150 Certificate of patent or registration of utility model

Ref document number: 5483205

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250