JP6040932B2 - 立体視に対応したビデオストリームを生成、再構築する方法、および関連する符号化および復号化デバイス - Google Patents

立体視に対応したビデオストリームを生成、再構築する方法、および関連する符号化および復号化デバイス Download PDF

Info

Publication number
JP6040932B2
JP6040932B2 JP2013504370A JP2013504370A JP6040932B2 JP 6040932 B2 JP6040932 B2 JP 6040932B2 JP 2013504370 A JP2013504370 A JP 2013504370A JP 2013504370 A JP2013504370 A JP 2013504370A JP 6040932 B2 JP6040932 B2 JP 6040932B2
Authority
JP
Japan
Prior art keywords
video stream
metadata
container frame
stereoscopic video
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013504370A
Other languages
English (en)
Other versions
JP2013526145A (ja
Inventor
バロッカ、ジョバーニ
ダマト、パウロ
Original Assignee
エッセ.イ.エスヴィー.エアレ ソシアテ イタリアーナ ピエレ エレオ ヴィルプ デレレトロニカ エッセ.ピー.アー.
エッセ.イ.エスヴィー.エアレ ソシアテ イタリアーナ ピエレ エレオ ヴィルプ デレレトロニカ エッセ.ピー.アー.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エッセ.イ.エスヴィー.エアレ ソシアテ イタリアーナ ピエレ エレオ ヴィルプ デレレトロニカ エッセ.ピー.アー., エッセ.イ.エスヴィー.エアレ ソシアテ イタリアーナ ピエレ エレオ ヴィルプ デレレトロニカ エッセ.ピー.アー. filed Critical エッセ.イ.エスヴィー.エアレ ソシアテ イタリアーナ ピエレ エレオ ヴィルプ デレレトロニカ エッセ.ピー.アー.
Publication of JP2013526145A publication Critical patent/JP2013526145A/ja
Application granted granted Critical
Publication of JP6040932B2 publication Critical patent/JP6040932B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/156Mixing image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/178Metadata, e.g. disparity information

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、デジタル立体ビデオストリーム(つまり、視聴デバイスで適切な処理を受けると、視聴者に3次元画像として認識される画像シーケンスが生成されるビデオストリーム)を生成する方法に関する。
本方法を利用すると、ユーザは、従来からの(立体視ではない)復号器およびテレビ受像機セットを持っていれば、2Dでの画像表示もできる。
本発明はさらに、デジタル形式で立体ビデオストリームを符号化および復号化する符号化デバイスおよび復号化デバイスに関する。
近年、新たなデジタル技術の登場によって新たな製造ツールの開発が盛んになり、映画製造業界は、立体3Dコンテンツの製造に注目して、多大な資源投入を行ってきた。
3Dに対する関心は、今や家庭向け製品(つまりテレビ受像機セットでの画像表示)にも拡大されている。例えば、有料TV運営会社のなかにも、3Dの番組の放映を計画しているものがある。
立体ビデオコンテンツの提示方法として最もよく利用されているものは、それぞれ右目用および左目用の2つの独立したビデオストリームを表示して、人の脳で3次元オブジェクトに再構築する、という方法である。
家庭向け製品用の立体コンテンツは、通常高精細なビデオコンテンツであり、大量生産されるメモリ媒体(DVDまたはブルーレイディスク、光磁気または固体媒体等)で配信されたり、(有線または無線)放送チャネルを介して、または電話通信回線(IP)を介して配信されたりする場合がある。
しかし、既存の構造の製造環境においては、あるシーンを2つの異なる視点から撮像する立体視ビデオカメラが生成する2つのストリームを別個に転送したり処理したりすることが不可能である。
さらに、最終消費者に届いている配信ネットワークは規模が大きすぎて、単一のサービス提供に2つの独立した高精細ストリームを利用すると不経済である。この結果、製造プロセスにおいて幾つかの方策をとり、コンテンツの転送および実現(fruition)のためのビットレートを低減する必要がある。
2次元および3次元画像の詳細認知の差異の実現に関する研究結果によると、立体コンテンツの解像度が2次元コンテンツの解像度より下がっても、ユーザは品質を許容範囲であると認識する傾向があるらしく、立体画像を構成する2つの画像を1つのフレームにパッキングするための様々な方法が開発されてきている。
例えば、単一の高精細フレームC(1920x1080画素)の場合には、左チャネルおよび右チャネル(今後はLおよびRと称する)を構成する2つの画像が、高精細フレームの半分の解像度に等しい水平解像度で取得され、その後、図1aに示すような1つのフレーム(横並びに配置したフォーマット)に横並びに配置される。
このように、1つの高精細ストリームを、2つの独立したビデオチャネルの転送に利用することもでき、復号時には、2つの半分のフレームを分離して、適切な補間技術を利用することにより再度16/9フォーマットにすることができる。
同様に、別の方法としては、水平解像度はそのままに、垂直解像度を半分にして、その後、図1bに示すように、2つのフレームLおよびRを、互いに重ねる(上下に並べるフォーマット)方法もある。
合成フレームからなる立体ビデオストリームは、次に圧縮にかけられ、放送ネットワーク、IPネットワーク、または大容量メモリ媒体での配信前に転送ビットレートを低減される。
高解像度ビデオの配信に現在最もよく利用されている圧縮技術は、H.264/AVC規格が定義している技術である。
現在市販されている高精細テレビ受像機セットは、1080pフォーマットまでの復号が可能なフォーマットをサポートしているH.264/AVC規格の復号器を備えている。
様々なサービスプロバイダ(特に公共放送局)が気にする最も重要な要件の1つが、立体視信号の後方互換性である。
実際、高精細復号器を既に所有しているユーザに放送サービスを楽しんでもらうためには、3Dの番組を2Dの番組としても表示できることが望ましい。同様に、DVD,Blu−ray disc3D、またはインターネットサイト上の3Dコンテンツは、2Dおよび3Dテレビ受像機セットおよびモニタの両方で表示することができることが望ましい。
これは2つの方法での達成が考えられる。1つ目が、1つの番組を2Dおよび3Dバージョン両方で同時放送することであり、2つ目が、相応しい立体ストリームの符号化技術を採用することである。
もちろん、1つ目の方法には、サービスプロバイダが嫌う帯域幅の無駄が伴う。
2つ目の方法に関しては、当技術分野において、後方互換性立体ストリームの生成方法は幾つか公知のものがある。
これら技術の1つが、いわゆる「深度マップ(depth maps)」を利用するものである(例えば、米国特許出願第2002/0048395号、第2004/0101043号明細書に記載されている)。
実際には、2次元カラービデオには、深度マップを含んだ、互いに補う白黒のビデオ(supplementary black and white video)の形態の信号が関連付けられている。適切な復号器であれば、受信したデータから立体ビデオを再構築することができる。しかし、この技術には、同じ番組の2Dおよび3Dの送信について上述したものとまさに同じ問題がある。つまり、2つのビデオ信号を並行して送信する必要があり、送信ビットレートが高くなってしまう、という問題である。
別の後方互換性立体ストリーム符号化技術には、例えば「マルチビュー」と称されるものがある。
立体ビデオストリームを構成する左画像および右画像の対は高度に類似しているという特徴を持っているので、2次元ストリームの符号化に利用される時空冗長性抑制技術(space-time redundancy suppression techniques)を、この場合にも利用することができる。実際、撮影点の間の幾何学的距離(瞳孔間隔:interocular distance)に起因する一定のオフセットが差し引かれた場合、右目画像と左目画像との間の差異は小さくなる。
MPEG2規格は、マルチビュープロファイル(MVP)と称される仕様の補遺によって拡張された。同様に、後続するH.264/AVC規格も、マルチビュー符号化(MVC)仕様を含むことで拡張された。
これら2つの仕様に共通する特徴は、スケーラブル・ビデオ符号化を使用している点である。つまり、立体ビデオストリームを、ベース層(2Dベースストリーム)および強化層(enhanced layer:第2のビューをトランスポートする層)に圧縮する。符号化されたストリームのシンタックスを、MPEG2またはH.264/AVC規格に準拠していさえいれば古い世代の復号器でも、2Dビデオが復号化できるように調整する。
しかし、立体ストリームを上述したフォーマットのいずれかに符号化するために必要となるビットレートは、放送環境での利用を可能とするには高すぎる。
従って、本発明の目的の1つは、2Dストリームに必要なものと同じ帯域幅を利用して放送業者が配信可能な後方互換性デジタル立体ビデオストリームを生成および再構築する方法の提供である。
本発明の別の目的には、左目画像および右目画像を合成画像にパッキングする手法に関わらず常に利用可能であり、合成フレームの利用に基づいている、後方互換性デジタル立体ビデオストリームの生成および再構築方法の提供である。
本発明のこれらおよびその他の目的は、本記載と一体化されている部分である添付請求項に述べる特徴を含む立体ビデオストリームの生成および再構築方法により達成される。
本発明はさらに、立体ビデオストリームの符号化及び復号化のための符号化デバイスおよび復号化デバイス、並びに、立体ビデオストリームを記載する。
本発明の根底にある一般的な構想は、ビデオストリームの復号結果が2D復号器および3D復号器両方で利用可能となるような、あるパッキング技術によってパッキングされた複数のフレームを含むビデオストリームの生成および再構築方法の提供である。
好適な実施形態では、本発明の方法によって、ビデオストリームを、H.264/AVC仕様(復号器になんらの変更も加えず)互換性可能を有する2D復号器により復号化が可能であり、且つ、高精細ディスプレイで表示できるように予め配置しておくことができる。
他方で、立体ディスプレイに連結された適切な復号器によって、立体ストリームを3Dで見ることができるようになる。
立体ビデオストリームの後方互換性は、立体ビデオストリーム内に既に存在しているメタデータを符号化段階中に、これまでとは違う使い方をすることで達成される。
このメタデータは、立体ビデオストリームにおける、右目用であっても左目用であっても、なんらかの画像を含む合成フレームの一領域を定義している。
2D復号器用には、メタデータに、復号器に対して、フレームを復号化したら、復号化した合成画像の一領域(立体ビデオストリームにおける、右目用であっても左目用であってもよい画像を含むもの)のみを出力せよと命令する情報を含ませる。
従って放送業者は、1つの立体ストリームを送信するだけでよく、これが、立体ビデオストリームの復号化ができてもできなくてもよい復号器により適切に処理され、このビデオストリームを、それを処理する復号器の特性に応じて2Dまたは3Dフォーマットで再生することができるようになる。
本発明の更なる目的および利点は、幾つかの実施形態を示した以下の記載からより明らかになるが、これは非制限的な例示である点に留意されたい。
実施形態を、添付する図面を参照して説明する。以下は図面の簡単な説明である。
横並びにある立体ビデオストリームの合成フレームを示している。 上下の並びにある立体ビデオストリームの合成フレームを示している。 別のフォーマットの立体ビデオストリームの合成フレームを示している。 本発明における立体ビデオストリームの生成デバイスのブロック図である。 切り出し矩形を破線で示した、図1aの合成フレームを示している。 切り出し矩形を破線で示した、図1bの合成フレームを示している。 切り出し矩形を破線で示した、図1cの合成フレームを示している。 2D画像の表示のみが可能なデバイスにおいて、デジタルビデオストリームとして受信されるテレビ画像の実現デバイスのブロック図である。 3D画像の表示も可能なデバイスにおいて、デジタルビデオストリームとして受信されるテレビ画像の実現デバイスのブロック図である。
図2を参照すると、本発明の立体ビデオストリーム101を生成するデバイス100のブロック図が示されている。
デバイス100は、それぞれが左目Lおよび右目R用の、2つの画像のシーケンス(102、103)(例えば2つのビデオストリームであってよい)を受信する。
デバイス100は、2つの画像(2つの画像シーケンス102、103)を多重化することができる。デバイス100は、この用途向けに、入力画像の画素を、1つの合成画像Cに入力することのできるアセンブラモジュール105を含む。
以下の記載において、画像を合成フレームまたはコンテナフレームCに入力する、という言い回しは、(ハードウェアおよび/またはソフトウェア手段の利用によって)原画像と同じ画素を含む合成フレームCの一領域を生成する処理を実行する、という意味として捉えられたい。合成画像が図1aまたは図1bに示すタイプである場合、複写ステップで、画素数を水平方向または垂直方向に半分にする必要がある。従って、合成フレームCに入力された2つの左Lおよび右R画像は、変形されて、水平解像度または垂直解像度が半分になる。
図1cに示すような別のフォーマット(a format being alternative to that of Fig. 1c)の立体ビデオストリームの合成フレームでは、入力画像が1280x720画素(いわゆる720pフォーマット)である場合(高品質の画像を送信するために利用されるフォーマットの1つではあるが、高精細画像送信用ではない)、両方の画像を含むのに適した合成フレームとは、1920x1080画素(つまり、1080pビデオストリームからなる1つのフレーム(1920x1080画素のプログレッシブフォーマット))である。
このようなケースの場合、2つの右Rおよび左L画像を、歪曲および/またはサンプリング不足になることなく、合成フレームCに入力することができるが、不利な点は、図1cの例にも示しているように、2つの画像のうちいずれかを少なくとも3つの部分に分割する必要がある、という点である。
図1cの別のフォーマットでは、第1の画像をコンテナフレームの任意の点に入力することができ(後者において、それぞれ異なる領域に分解(disassemble)する必要がないことを条件として)、第2の画像のフレームの分解およびそのコンテナフレームへの挿入は、異なる数多くの技術を利用して達成可能であるが、この特徴は本発明の目的には関連しない。
いずれの場合であっても、左Lおよび右R画像をコンテナフレームCに入力する方法は、本発明の方法の実装には影響がない。
コンテナフレームCのシーケンス101からなる立体ビデオストリームを符号化するときには、立体ビデオストリーム101を受信する2D復号器が復号プロセス後に出力する必要がある合成フレームCの領域に関する情報を含む少なくとも1つのメタデータMが入力される。
メタデータMは、図1cの例の右目画像のように様々な画像に分解されていない左目L画像または右目R画像を含む合成フレームCの一領域を特定するものである。
立体ビデオストリーム101をH.264/AVC規格に従って符号化する場合、メタデータMは、2009年3月発行の「一般オーディオビジュアルサービスの高度ビデオ符号化」におけるITU TH.264ドキュメントのセクション7.3.2.1.1「シーケンス・パラメータ・セット・データ・シンタックス」で既に取り扱われている「クロップ矩形」に関するメタデータの代わりに利用すると好適である。
このメタデータは、当初、H.264/AVC符号化により、画像を16x16画素マクロブロックに分解することができるということに基づいて導入されたが、1080は、16では除算できない数である。従って、符号器が利用する内部シングルフレーム表現フォーマットは、実際のフレームフォーマットと合致しないことがある(1920x1080フレームでは、H.264/AVC符号器は、1920x1088画素を越える表現を利用するので、8つの空のラインが追加される)。しかし、「クロップ矩形」を記述しており、H.264/AVC規格に含まれているメタデータでは、その役割が、復号されたフレームのどの部分を再生用に出力する必要があるかを復号器に教える、というものであるために、表示すべき矩形フレーム部分を、完全に一般的な方法で定義することができる。
実際には、これは、表示すべき部分の範囲を定めるクロップ矩形の水平および垂直方向の辺のフレームエッジ間の距離を定義している(画素数で表される)。
概して、画像クロップ矩形は、他の完全に均等な方法で定義することが可能である。例えば、矩形のある頂点の位置、またはその辺の寸法、または2つの対向する頂点の座標での定義も可能である。
既に標準化されている「クロップ矩形」のメタデータMを従来とは異なる方法で利用して、従って同じシンタックスを利用することで、合成フレームCの任意の領域の再生を、H.264/AVC仕様に準拠した復号器に対して示すことができるようになる。
図3a、図3b、および図3cを参照すると、クロップ矩形により範囲を定められた幾つかの領域が、破線によって示されているが、本発明ではこの情報が少なくとも1つのメタデータMに含まれている必要がある。
例えば図3aのコンテナフレームCに示す横並びのフォーマット、および、図3cのコンテナフレームCの別のフォーマットでは、クロップ矩形が示す領域は、コンテナフレームCの左画像Lが占有している領域と整合している。
更なる例である図3bのコンテナフレームCの上下配置のフォーマットでは、クロップ矩形が示す領域は、コンテナフレームCの右画像Rが占有している領域に整合している。
符号化段階が完了すると、立体ストリームは、通信チャネルを介して送信される、および/または、適切な媒体(例えばCD、DVD,ブルーレイ、大容量メモリ等)に記録されてよい。
図4aは、復号器1100と、表示または視聴デバイス1110とからなる2Dコンテンツを視聴するための通常のシステムを示している。復号器1100は、視聴デバイス1110(例えばテレビ受像機セット)に対して、2つの画像(つまり、右R画像および左L画像)のうちのいずれかを利用可能として、ユーザが、3Dコンテンツを2Dでも視聴することができるようにする。復号器1100は、テレビ受像セットとは別のセットトップボックスであってもよいし、テレビ受像機セット自身に内蔵されていてもよい。
同様のことは、コンテナフレームを読み出して、処理することで2D画像を得るプレーヤ(例えばDVDプレーヤ)にもいえる。
図4aの参照に戻ると、受信機システムは、(ケーブルまたはアンテナを介して)、合成フレームCを含む立体ビデオストリーム1103を受信する。復号器1100は、フレームCのどの部分を利用して、表示または視聴デバイス1110にストリームを表示するか、を示すメタデータMを読み出す。続いて、メタデータMが指定している合成フレームCの部分に含まれる画像を抽出して、ディスプレイ1110に送信する。
復号器1100が出力する画像のフォーマットが、ディスプレイ1110が生来サポートしているものには含まれない、というケースもある。例えば、横並びフォーマットの1080pフレームの場合、復号段階で、受像機1100は、水平方向の長さが高精細のフレームの水平方向の長さの半分であるフレームを出力して、この結果得られるフレームの領域は、960x1080画素となり、そのフォーマットは8/9となる。
これは、ディスプレイが生来サポートしている画像フォーマットではないが、今日のディスプレイであればすべてに含まれているデバイスが実行することができる適切な補間ステップによって、1920x1080フォーマットに変換して戻すことができる。このデバイスは、いわゆるスケーラであり、受信したフォーマットを、ユーザが所望するものに適合させる、という役割を果たす(実際、全ての近年のテレビ受像機セットのリモートコントローラは、4/3、16/9、14/9、および自動フォーマットのなかから選択することができるボタンを含み、生来のもの以外のフォーマットでの視聴が可能である)。
合成フレームが図1cに示すタイプである場合、2D互換性可能を有する画像のフォーマットは、720pタイプである。後者は、全てのHDTVまたはHD準拠(HD Ready)テレビ受像機セットが処理可能な標準的なフォーマットである。従って、スケーラで、準拠している画像を確実に拡張して、フルスクリーンでの表示を行うことができる。
幾つかのテレビ受像機セットに実行したテストの結果、図1aまたは図1bに示すもののような合成フレームを利用した場合であっても、スケーラは、フルスクリーン16/9フォーマットに変換することで、準拠している画像を正確に表示することができることがわかっている。
しかし3Dモードでの立体ビデオの視聴は、立体ビデオストリームに含まれている特殊な信号を認識することのできる手段を備え、クロップ矩形を利用しないでもビデオを復号化できる次世代復号器の利用によってのみ可能である。
これは幾つかの方法で達成可能である。例えば、更なるメタデータNを追加して、クロップ矩形のみが2D復号器/テレビ受像機セットに有効である、と示す、という方法もある。
従って、既存の2D製品は、更新の必要がなく、また、ファームウェア/ハードウェアに変更を加える必要もない。
本発明の好適な実施形態では、原クロップ矩形を利用すべきかすべきでないか、を示すメタデータNは、単に、それが3Dまたは2D送信であるかを示すメタデータであってよい。
このメタデータNの送信は、例えば、少なくとも1つのSI(サービス情報)テーブルまたはH.264SEI(補足強化情報: Supplemental Enhancement Information)メッセージを利用して行われて良い。この代わりに、合成フレームの1以上の行を、3D固有のメタデータの送信専用にすることもできる。
図4bは、3Dコンテンツの表示に適した受像機システムを示す。このシステムは3つの部分からなり、3つの部分は、それぞれ独立した装置であってもよいし、様々な方法でアセンブルされていてもよい。3つの部分は、復号器1100'、デパッカー(depacker)1105、およびディスプレイ1110'である。
図4aと比較すると、更なるコンポーネント(つまりデパッカー1105)が必要であることがわかる。復号器1100'は、合成フレームCシーケンス全体を出力する(つまり、クロップ矩形情報は無視される)。先行技術の標準的な復号器は、フレームの復号後に、クロップ矩形に含まれている画像の部分のみを出力することから、ここで利用されるものは、非標準的な復号器である。デパッカー1105は、画像Lおよび画像Rを合成フレームCから抽出して、ディスプレイ1110'自身が必要とするモードでディスプレイ1110'に出力する。
こうするために、デパッカー1105は、合成フレームの成り立ちを知る必要がある。1つのフォーマットではなく様々なフォーマットを処理するのに適しているデパッカー1105は、これらモードを指定するメタデータPを読み出す必要がある。
このメタデータPは、SIテーブルまたはSEIメッセージに入力されていてもよいし、または、合成フレームの一行に入力されてもよい。前者の場合には、復号器1100'がこのメタデータを読み出して、デパッカー1105に(例えばHDMIインタフェースを介して)送信する必要がある。ここで、このインタフェースの仕様が、まさにこの目的で最近更新された点は、言及に値する。後者の場合には、デパッカー1105が合成フレーム内に直接メタデータPを見つけることができるので、状況はより簡単である。
本発明の特徴および利点が、上述の記載から明らかになった。
本発明の第1の利点は、2D復号器で復号することもできる3D番組の放送を希望する放送業者が、2つの同時ビデオストリームを送信する必要がなくなり、ビデオストリーム配信にまつわる帯域幅を減らすことができる、という点である。
本発明の第2の利点は、本発明の方法が、左画像および右画像を含むフレームがいかなる形態でコンテナフレームにパッキングされていようと利用可能である、という点である。
立体ビデオストリームの生成および再構築方法、および、関連する生成および再構築デバイスは、本発明の構想の新規な精神を逸脱しないで数多くの変形例が可能である。また、本発明の実際に実施に際しては、例示した詳細を変えた形にしてもよいし、他の技術的に均等物である構成要素で置き換えることもできる。
例えば、上述した記述では、特にH.264/AVC規格について言及した。しかし、これに限られず、本方法は、H.264/AVC規格のクロップ矩形の定義に利用されるメタデータに類似したメタデータを利用している他の規格とともに利用されて符号化を実行することもできる。
また、本開示では1080pフォーマットの合成フレームについて特に言及したが、本発明は、合成フレーム、およびフレームを構成する画像のサイズに依存はしない。従って本発明は合成フレームが720pサイズであったり、非常に高い解像度のタイプであったりしたとしても適用可能である(いわゆる2kおよび4kフォーマット、つまり約2,000または4,000個のラインがある)。
本発明は、立体ビデオストリームの生成および再構築方法および関連するデバイスに限定はされず、数多くの変形例、改善例、または均等物である部分および要素による置き換えが、本発明の構想の範囲を逸脱せずに可能であるが、これは以下に示す請求項にも明示されている。

Claims (19)

  1. コンテナフレームを含むデジタル立体ビデオストリームを生成する方法であって、前記コンテナフレームは、右画像および左画像に関する情報を含み、前記デジタル立体ビデオストリームを符号化するときに、前記右画像および前記左画像という2つの画像のいずれか一方のみを含むコンテナフレームの領域を特定するよう適合されている1つのメタデータ(M)が入力され、
    前記デジタル立体ビデオストリームは、クロップ矩形を定義するH.264/AVC規格またはH.264/AVC規格の前記クロップ矩形を定義するために利用されるメタデータに類似するメタデータを使用する規格に従って符号化され、前記1つのメタデータ(M)は、前記規格と同じシンタックスを利用するとき、前記コンテナフレームに含まれている前記2つの画像のいずれか一方のみを参照前記デジタル立体ビデオストリームのフォーマットを示すべく、少なくとも1つの更なるメタデータ(N,P)が前記デジタル立体ビデオストリームに入力される、方法。
  2. 前記コンテナフレームの前記領域のサイズは、前記領域の幅/高さになんら変更を加えずとも表示可能である、請求項1に記載の方法。
  3. 前記コンテナフレームの前記領域は、補間され、フォーマットを変換されることにより、16/9フォーマットでフルスクリーン表示が可能である、請求項1または2に記載の方法。
  4. 立体視復号器に対して、前記1つのメタデータ(M)を無視するべきである旨を伝えるために、前記少なくとも1つの更なるメタデータ(N,P)が前記デジタル立体ビデオストリームに入力され、請求項1から3のいずれか一項に記載の方法。
  5. 前記少なくとも1つの更なるメタデータ(N,P)は、少なくとも1つのSIテーブルで、または、H.264/AVC規格またはH.264/AVC規格の前記クロップ矩形を定義するために利用されるメタデータに類似するメタデータを使用する規格に従って符号化された前記デジタル立体ビデオストリームに関するSEIメッセージで送信される、請求項1から4のいずれか一項に記載の方法。
  6. 前記少なくとも1つの更なるメタデータ(N)は、番組が2Dか3Dかを示すメタデータである、請求項4または5に記載の方法。
  7. 前記少なくとも1つの更なるメタデータ(P)は、前記コンテナフレームの成り立ちを示すメタデータである、請求項4または5に記載の方法。
  8. コンテナフレームを含むデジタル立体ビデオストリームを符号化するデバイスであって、前記コンテナフレームは、右画像および左画像に関する情報を含み、請求項1から7のいずれか一項に記載の方法を実装するよう適合された手段を備えることを特徴とする、デバイス。
  9. コンテナフレームを含むデジタル立体ビデオストリームから1つの2Dに準拠した画像を再構築する方法であって、前記コンテナフレームは、右画像および左画像に関する情報を含み、前記デジタル立体ビデオストリームを復号化するときに、前記右画像および前記左画像という2つの画像のいずれか一方のみを含むコンテナフレームの領域を特定するよう適合されている1つのメタデータ(M)を抽出し、
    前記デジタル立体ビデオストリームは、H.264/AVC規格のクロップ矩形を定義するために利用されるメタデータに類似するメタデータを使用する規格に従って復号化され、前記1つのメタデータ(M)は、前記規格と同じシンタックスを利用するとき、前記コンテナフレームに含まれている前記2つの画像のいずれか一方のみを参照する、方法。
  10. 前記コンテナフレームの前記領域のサイズは、前記領域の幅/高さになんら変更を加えずとも表示可能である、請求項9に記載の方法。
  11. 前記コンテナフレームの前記領域は、補間され、フォーマットを変換されることにより、16/9フォーマットでフルスクリーン表示が可能である、請求項9または10に記載の方法。
  12. コンテナフレームを含む立体ビデオストリームから1つの2D互換性可能を有する画像を再構築する復号器であって、前記コンテナフレームは、右画像および左画像に関する情報を含み、請求項9から11のいずれか一項に記載の方法を実装する手段を備えることを特徴とする、復号器。
  13. デジタル立体ビデオストリームを復号化して、コンテナフレームの右画像および左画像という2つの画像を抽出する方法であって、復号器が、前記ビデオストリームが立体視用か否かを示す少なくとも1つのメタデータ(N,P)を読み出し、前記ビデオストリームが立体視用である場合には、クロップ矩形を定義する1つの更なるメタデータ(M)に含まれる情報を無視し、前記コンテナフレームのシーケンスを一体的に生成して(produced integrally)、前記コンテナフレームのシーケンスを、デパッカーに送って、前記デパッカーが、立体ディスプレイが必要とする前記右画像および前記左画像という2つの画像を生成する、方法。
  14. 前記1つの更なるメタデータ(M)は、H.264/AVC規格に従って定義される、請求項13に記載の方法。
  15. 前記1つの更なるメタデータ(M)は、H.264/AVC規格の前記クロップ矩形を定義するために利用されるメタデータに類似するメタデータを使用する規格に従って定義される、請求項13に記載の方法。
  16. 前記復号器は、前記立体ビデオストリームに関するSIフィールドおよび/またはSEIメッセージのコンテンツで、前記左画像および前記右画像がどのようにパッキングされているかを示す更なるメタデータ(P)を、前記デパッカーに送信する、請求項13から15のいずれか1つに記載の方法。
  17. 前記デパッカーは、コンテナフレームに含まれており前記左画像および前記右画像がどのようにパッキングされているかを示す更なるメタデータ(P)を読み出す、請求項13から16のいずれか1つに記載の方法。
  18. デジタル立体ビデオストリームを復号化して、コンテナフレームの前記右画像および前記左画像という2つの画像を抽出する復号器であって、請求項13から17のいずれか一項に記載の方法を実装する手段を備える、復号器。
  19. 請求項13から17のいずれか1つに記載の方法に従う立体ディスプレイが必要とする立体ビデオストリームの前記右画像および前記左画像を生成するデパッカー。
JP2013504370A 2010-04-12 2011-04-07 立体視に対応したビデオストリームを生成、再構築する方法、および関連する符号化および復号化デバイス Active JP6040932B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
ITTO2010A000282 2010-04-12
ITTO2010A000282A IT1399417B1 (it) 2010-04-12 2010-04-12 Metodo per la generazione e ricostruzione di un flusso video stereoscopico compatibile e relativi dispositivi di codifica e decodifica.
PCT/IB2011/051504 WO2011128818A1 (en) 2010-04-12 2011-04-07 Method for generating and rebuilding a stereoscopic-compatible video stream and related coding and decoding devices

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016148640A Division JP2016197909A (ja) 2010-04-12 2016-07-28 デジタル立体ビデオストリームのデータ構造

Publications (2)

Publication Number Publication Date
JP2013526145A JP2013526145A (ja) 2013-06-20
JP6040932B2 true JP6040932B2 (ja) 2016-12-07

Family

ID=42557522

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013504370A Active JP6040932B2 (ja) 2010-04-12 2011-04-07 立体視に対応したビデオストリームを生成、再構築する方法、および関連する符号化および復号化デバイス
JP2016148640A Pending JP2016197909A (ja) 2010-04-12 2016-07-28 デジタル立体ビデオストリームのデータ構造

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016148640A Pending JP2016197909A (ja) 2010-04-12 2016-07-28 デジタル立体ビデオストリームのデータ構造

Country Status (21)

Country Link
US (1) US9386293B2 (ja)
EP (1) EP2559257B1 (ja)
JP (2) JP6040932B2 (ja)
KR (1) KR101889459B1 (ja)
CN (1) CN102972030B (ja)
AU (1) AU2011241841B2 (ja)
BR (1) BR112012025502B1 (ja)
CA (1) CA2795115A1 (ja)
CL (1) CL2012002849A1 (ja)
IL (1) IL222274A (ja)
IT (1) IT1399417B1 (ja)
MA (1) MA34222B1 (ja)
MX (1) MX2012011847A (ja)
NZ (1) NZ602870A (ja)
PE (1) PE20130819A1 (ja)
RU (1) RU2605368C2 (ja)
SG (2) SG10201502810SA (ja)
TN (1) TN2012000471A1 (ja)
TW (1) TWI527433B (ja)
UA (1) UA109782C2 (ja)
WO (1) WO2011128818A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008106185A (ja) * 2006-10-27 2008-05-08 Shin Etsu Chem Co Ltd 熱伝導性シリコーン組成物の接着方法、熱伝導性シリコーン組成物接着用プライマー及び熱伝導性シリコーン組成物の接着複合体の製造方法
JP5815326B2 (ja) * 2011-08-12 2015-11-17 ルネサスエレクトロニクス株式会社 動画像復号装置及び画像表示装置
ITTO20120134A1 (it) * 2012-02-16 2013-08-17 Sisvel Technology Srl Metodo, apparato e sistema di impacchettamento di frame utilizzanti un nuovo formato "frame compatible" per la codifica 3d.
ITTO20120901A1 (it) * 2012-10-15 2014-04-16 Rai Radiotelevisione Italiana Procedimento di codifica e decodifica di un video digitale e relativi dispositivi di codifica e decodifica
WO2016204481A1 (ko) * 2015-06-16 2016-12-22 엘지전자 주식회사 미디어 데이터 전송 장치, 미디어 데이터 수신 장치, 미디어 데이터 전송 방법, 및 미디어 데이터 수신 방법
US9894342B2 (en) * 2015-11-25 2018-02-13 Red Hat Israel, Ltd. Flicker-free remoting support for server-rendered stereoscopic imaging
EP3249928A1 (en) * 2016-05-23 2017-11-29 Thomson Licensing Method, apparatus and stream of formatting an immersive video for legacy and immersive rendering devices
CN107046637A (zh) * 2017-01-05 2017-08-15 北京大学深圳研究生院 一种针对三维图像的非对称拼接方法
US11074453B2 (en) * 2018-01-31 2021-07-27 Hewlett Packard Enterprise Development Lp Video active region batching
US10922783B2 (en) 2018-03-02 2021-02-16 Mediatek Inc. Cube-based projection method that applies different mapping functions to different square projection faces, different axes, and/or different locations of axis
TWI690728B (zh) * 2018-03-02 2020-04-11 聯發科技股份有限公司 用於處理包括堆疊在具有填充的基於立方體的投影佈局中的投影面的基於投影的圖框的方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030062313A (ko) 2000-08-09 2003-07-23 다이나믹 디지탈 텝스 리서치 피티와이 엘티디 영상 변환 및 부호화 기술
RU2287858C2 (ru) * 2001-11-24 2006-11-20 Тдв Текнолоджиз Корп. Создание последовательности стереоскопических изображений из последовательности двумерных изображений
AU2002952873A0 (en) 2002-11-25 2002-12-12 Dynamic Digital Depth Research Pty Ltd Image encoding system
US7650036B2 (en) * 2003-10-16 2010-01-19 Sharp Laboratories Of America, Inc. System and method for three-dimensional video coding
EP2375675B1 (en) * 2004-03-10 2013-05-01 Qualcomm Incorporated High data rate interface apparatus and method
JP4638784B2 (ja) * 2005-07-19 2011-02-23 オリンパスイメージング株式会社 画像出力装置及びプログラム
DK3399756T3 (da) * 2007-04-12 2020-10-12 Dolby Int Ab Tiling i videokodning og -afkodning
KR100962696B1 (ko) * 2007-06-07 2010-06-11 주식회사 이시티 부호화된 스테레오스코픽 영상 데이터 파일의 구성방법
US8487982B2 (en) * 2007-06-07 2013-07-16 Reald Inc. Stereoplexing for film and video applications
US8749615B2 (en) * 2007-06-07 2014-06-10 Reald Inc. Demultiplexing for stereoplexed film and video applications
EP2393301A1 (en) * 2007-06-11 2011-12-07 Samsung Electronics Co., Ltd. Method and apparatus for generating header information of stereoscopic image
KR101450145B1 (ko) * 2007-06-11 2014-10-13 삼성전자 주식회사 스테레오스코픽 영상 비트스트림 생성 방법 및 장치
KR101506217B1 (ko) * 2008-01-31 2015-03-26 삼성전자주식회사 스테레오스코픽 영상의 부분 데이터 구간 재생을 위한스테레오스코픽 영상 데이터스트림 생성 방법과 장치, 및스테레오스코픽 영상의 부분 데이터 구간 재생 방법과 장치
KR101506219B1 (ko) * 2008-03-25 2015-03-27 삼성전자주식회사 3차원 영상 컨텐츠 제공 방법, 재생 방법, 그 장치 및 그기록매체
WO2011049519A1 (en) * 2009-10-20 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for multi-view video compression
IT1397591B1 (it) 2009-12-21 2013-01-16 Sisvel Technology Srl Metodo per la generazione, trasmissione e ricezione di immagini stereoscopiche e relativi dispositivi.
IT1397588B1 (it) 2009-12-21 2013-01-16 Sisvel Technology Srl Metodo per la programmazione automatica di un ricevitore atto a ricevere segnali radiotelevisivi in almeno due diversi formati e relativo ricevitore.

Also Published As

Publication number Publication date
IL222274A (en) 2016-11-30
KR20130050302A (ko) 2013-05-15
US9386293B2 (en) 2016-07-05
CN102972030A (zh) 2013-03-13
RU2012147829A (ru) 2014-05-20
PE20130819A1 (es) 2013-07-27
ITTO20100282A1 (it) 2011-10-13
BR112012025502B1 (pt) 2021-10-26
AU2011241841A1 (en) 2012-10-25
IL222274A0 (en) 2012-12-31
BR112012025502A2 (pt) 2016-06-21
KR101889459B1 (ko) 2018-08-17
RU2605368C2 (ru) 2016-12-20
CA2795115A1 (en) 2011-10-20
CN102972030B (zh) 2016-07-13
EP2559257B1 (en) 2020-05-13
WO2011128818A1 (en) 2011-10-20
TN2012000471A1 (en) 2014-01-30
SG184396A1 (en) 2012-11-29
SG10201502810SA (en) 2015-05-28
IT1399417B1 (it) 2013-04-16
NZ602870A (en) 2015-02-27
JP2016197909A (ja) 2016-11-24
TWI527433B (zh) 2016-03-21
MA34222B1 (fr) 2013-05-02
AU2011241841B2 (en) 2016-04-21
EP2559257A1 (en) 2013-02-20
MX2012011847A (es) 2012-11-30
UA109782C2 (uk) 2015-10-12
JP2013526145A (ja) 2013-06-20
US20130201282A1 (en) 2013-08-08
TW201204007A (en) 2012-01-16
CL2012002849A1 (es) 2013-11-15

Similar Documents

Publication Publication Date Title
JP6040932B2 (ja) 立体視に対応したビデオストリームを生成、再構築する方法、および関連する符号化および復号化デバイス
EP2537347B1 (en) Apparatus and method for processing video content
TWI520567B (zh) ㄧ種用於視頻處理的方法和系統
KR101858090B1 (ko) 2d-호환성 스테레오스코픽 비디오 플로우들을 디코딩하기 위한 방법
US20110149022A1 (en) Method and system for generating 3d output video with 3d local graphics from 3d input video
CA2772927C (en) Cable broadcast receiver and 3d video data processing method thereof
KR20120114300A (ko) 3d 비디오 신호를 생성하는 방법
EP2337365A2 (en) Method and system for pulldown processing for 3D video
US20110149040A1 (en) Method and system for interlacing 3d video
US9930382B2 (en) Method and apparatus for transmitting/receiving broadcast signal for 3-dimensional (3D) broadcast service
US20110150355A1 (en) Method and system for dynamic contrast processing for 3d video
US20110149021A1 (en) Method and system for sharpness processing for 3d video
KR20130055248A (ko) 3차원 텔레비전 수신기를 위한 영상 포맷 변환 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140327

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140826

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151001

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160728

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20160805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161024

R150 Certificate of patent or registration of utility model

Ref document number: 6040932

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250