JP2016506137A - マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号を符号化する方法 - Google Patents

マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号を符号化する方法 Download PDF

Info

Publication number
JP2016506137A
JP2016506137A JP2015546148A JP2015546148A JP2016506137A JP 2016506137 A JP2016506137 A JP 2016506137A JP 2015546148 A JP2015546148 A JP 2015546148A JP 2015546148 A JP2015546148 A JP 2015546148A JP 2016506137 A JP2016506137 A JP 2016506137A
Authority
JP
Japan
Prior art keywords
view
image
central
video data
data signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015546148A
Other languages
English (en)
Other versions
JP6231125B2 (ja
Inventor
ウィルヘルムス ヘンドリクス アルフォンサス ブリュル
ウィルヘルムス ヘンドリクス アルフォンサス ブリュル
マインダート オンノ ウィルデブール
マインダート オンノ ウィルデブール
ハーン ウィーブ デ
ハーン ウィーブ デ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP13154244.1A external-priority patent/EP2765774A1/en
Priority claimed from EP13154257.3A external-priority patent/EP2765775A1/en
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2016506137A publication Critical patent/JP2016506137A/ja
Application granted granted Critical
Publication of JP6231125B2 publication Critical patent/JP6231125B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/349Multi-view displays for displaying three or more geometrical viewpoints without viewer tracking
    • H04N13/351Multi-view displays for displaying three or more geometrical viewpoints without viewer tracking for displaying simultaneously
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号を符号化する方法と、ビデオデータ信号を復号化する方法と、ビデオデータ信号と、マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号の符号化器と、ビデオデータ信号の復号化器と、ビデオデータ信号を符号化するための命令を含むコンピュータプログラムプロダクトと、ビデオデータ信号を復号化するための命令を含むコンピュータプログラムプロダクトとに関する。符号化方法は、マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号を符号化する方法に関し、当該方法は、入力視点から見たシーンの第1の画像を提供するステップと、第1の画像に関連付けられた奥行きマップを提供するステップと、第1の画像及び奥行きマップに基づいたビューレンダリングに使用する中心ビューの好適な位置を示すインジケータを含むプレファランスデータを提供するステップと、第1の画像、奥行きマップ及びプレファランスデータを表す符号化データを含むビデオデータ信号を生成するステップとを含み、中心ビューの好適な位置及び入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連する。

Description

本発明は、マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号を符号化する方法と、ビデオデータ信号を復号化する方法と、ビデオデータ信号と、マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号の符号化器と、ビデオデータ信号の復号化器と、ビデオデータ信号を符号化するための命令を含むコンピュータプログラムプロダクトと、ビデオデータ信号を復号化するための命令を含むコンピュータプログラムプロダクトとに関する。
過去20年間で、3次元ディスプレイ技術は成熟した。3次元(3D)ディスプレイデバイスは、視聴者の両目に、それぞれ、見ているシーンの異なるビューを提供することによって、視聴経験に第3の次元(奥行き)を追加する。
結果として、今日では、3次元画像/ビデオ信号を視聴するために様々な方法がある。一方で、ユーザがユーザの左目と右目とに別個の画像が提示される眼鏡に基づいた3次元ディスプレイシステムがあり、他方で、視聴者の裸眼にシーンの3次元ビューを提供する自動立体視3次元ディスプレイシステムがある。
眼鏡に基づいたシステムでは、アクティブ/パッシブ眼鏡が、視聴者の対応する目に対し画面上に表示される別個の画像を分離するフィルタを提供する。眼鏡を必要としない、即ち、自動立体視システムでは、デバイスは、通常、左画像を左目に、右画像を右目に向ける例えばバリア又はレンチキュラの形である光方向付け手段を使用するマルチビューディスプレイである。
立体視マルチビューディスプレイデバイスと共に使用するコンテンツを提供するために、長年、様々な入力フォーマットがデザインされてきている。このようなフォーマットの一例は、国際特許公開公報WO2006/137000A1に見出せる。この文書は、奥行き及び/又はオクルージョン奥行きといった更なる情報と組み合わせた画像及び奥行き情報の画像交換フォーマットについて開示している。この方法で提供される情報は、レンチキュラ又はバリア技術に基づいて、自動立体視マルチビューディスプレイと共に使用する画像にレンダリングするように使用される。
P. A. Redert、E. A. Hendriks及びJ. Biemondによる論文「Synthesis of multi viewpoint images at non-intermediate positions」(International Conference on Acoustics, Speech and Signal Processingのプロシーディング、第IV巻、ISBN0−8186−7919−0、2749〜2752頁、IEEE Computer Society、カリフォルニア州ロスアラミトス、1997年)は、奥行き情報を抽出し、入力画像及び奥行きマップに基づいてマルチビュー画像をレンダリングする方法について開示している。
上記の画像に基づいたレンダリング技術の結果を向上させるために、国際特許公開公報WO2006/137000A1に開示されるように、追加のオクルージョンテクスチャ及びオクルージョン奥行きを使用する様々な技術が考案されている。しかし、オクルージョンテクスチャ及びオクルージョン奥行きマップの追加は、レンダリングに使用する追加の画像及び奥行きマップの送信を必要とする点で、比較的費用がかかる。
更なる画像及び奥行きマップの形で追加の画像データを追加すること以外に、画像に基づいたレンダリングの質を向上させるために、追加のメタデータを提供することも知られている。このようなメタデータの一例は、国際特許公開公報WO2011/039679A1に提供されている。この文書は、ビデオデータ信号を符号化し、更なるビューのレンダリングに使用する好適なレンダリング方向インジケータを提供する方法について開示している。
発明者は、レンダリング方向インジケータの符号化は、特に、立体視マルチビューディスプレイ用の画像及び奥行きに基づいたコンテンツのレンダリングを考慮すると、更に向上されることが分かった。
本発明の第1の態様によれば、マルチビュー立体視ディスプレイデバイスにおいて使用するビデオデータ信号を符号化する方法が提供される。当該方法は、入力視点から見たシーンの第1の画像を提供するステップと、第1の画像に関連付けられた奥行きマップを提供するステップと、ビューレンダリングに使用する中心ビューの好適な位置を示すインジケータを含むプレファランスデータを提供するステップと、第1の画像、奥行きマップ及びプレファランスデータを表す符号化データを含むビデオデータ信号を生成するステップとを含み、中心ビューの好適な位置及び入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連している。
このようにビデオデータ信号を符号化する利点は、マルチビューディスプレイ用のビューをレンダリングするためのコンテンツを使用する復号化器が、対応するビューイングコーンの適切な中心ビューを選択できるようにする点である。したがって、ターゲットディスプレイデバイスに依存した方法で、当該ディスプレイデバイスのビューイングコーンの知覚的に好ましい、即ち、好適な中心位置を選択することができる。
本願では、中心ビューを参照する。マルチビュー立体視ディスプレイデバイスは、複数のビューを有するビューイングコーンのビューレンダリングのために構成され、中心ビューは、当該ビューイングコーンの中心位置にある。なお、奇数のビューを有するマルチビュー立体視ディスプレイもあれば、偶数のビューを有するマルチビュー立体視ディスプレイもある。マルチビュー立体視ディスプレイの場合、中心ビューは、ビューイングコーンにおける中間ビュー、即ち、通常は、ディスプレイパネルに対し垂直なビューに対応する。偶数ビューの場合の中心ビューは、ビューイングコーンの中心に最も近い2つのビュー間の中間にある位置に対応する。
任意選択的に、プレファランスデータは、マルチビュー立体視ディスプレイ上での表示のために画像をレンダリングする際に使用する中心ビュー位置の好適な位置を示すインジケータを含む。
任意選択的に、プレファランスデータは、入力視点のベースラインに対する関係に依存するプレファランスデータを含み、基準左ビュー及び基準右ビューが、単一ビューに対する意図する左ビュー位置及び意図する右ビュー位置を表す入力視点を構成する単一ビューしか有さないビデオ信号について、単一ビューに対する好適な位置を示すインジケータとして提供される単一ビュー中心オフセット値を含む。プレファランスデータは更に、当該単一ビュー中心オフセット値が提供されると設定される単一ビュー中心オフセットフラグを含む。
任意選択的に、プレファランスデータは、入力視点のベースラインに対する関係に依存するプレファランスデータを含み、基準左ビュー及び基準右ビューを構成する左ビュー及び右ビューを有するビデオ信号について、基準左ビューと基準右ビューとの間の中心位置に対する好適な位置を示すインジケータとして提供される単一ビュー処理中心オフセット値を含む。プレファランスデータは更に、単一ビュー処理中心オフセット値が提供されると設定される単一ビュー処理中心オフセットフラグと、単一ビュー処理が好適である場合に設定される、単一ビューが好適であることを示すフラグと、基準左ビューが、単一ビュー処理に好適なビューであること、又は、基準右ビューが、単一ビュー処理に好適なビューであることを示す好適なビューインジケータとのうちの少なくとも1つを含む。
任意選択的に、プレファランスデータは、基準左ビューと基準右ビューとの間のベースラインの1/100の精度でベースラインに対する中心ビューの位置の好適な位置を示す。このようにすると、精度とストレージ要件との間の妥協点が見出される。
任意選択的に、プレファランスデータは、左基準ビューと右基準ビューとの間の中心に対するオフセット値によって、中心ビューの位置の好適な位置を示す。0のオフセット値は、入力視点に対応する。このようにすると、中心位置は、選択された入力を、レンダリングに使用する入力視点及びターゲットの好適な位置に関連付ける特異値として表現される。
任意選択的に、中心ビューの好適な位置は、基準ディスプレイに対する複数の異なる中心ビュー位置についてコンテンツをレンダリングした後に知覚される画質の評価に基づいて決定される。このようにすると、知覚的に好ましい中心位置が選択され、これにより、例えばデオクルージョンによってもたらされる誤差が改善又は実質的に低減されるが、他の可能なオーサリング検討事項は把握される。例えば人が、片側で白い壁の前に立ち、もう片側で高度にテクスチャード加工されたカーテンの前に立っているシーンを考える。特定の方向におけるレンダリングを選択することによって、カーテンのデオクルージョンによってもたらされるオクルージョンアーチファクトは減少させることができる。しかし、当該シーン内の人が窓の外を見ている場合、当該方向にシーンを遠くまで広げ過ぎると、当該窓のかなりの関心領域が影響を受ける点で、厄介となる場合がある。
本実施形態による方法によって、上記のような状況が検出され、自動立体視マルチビューディスプレイ上で適切にレンダリング可能な妥協が選択される。
任意選択的に、プレファランスデータは、フレーム毎、フレームグループ毎、ショット/シーン毎のうちの1つに対し設定される。シーン内の中心視点の変更は不必要であるため、フレーム毎、フレームグループ毎、又は、ショット若しくはシーン毎に、プレファランスデータを設定することができる。後者が、実際では、一番目立たないと考えられる。更に、必要に応じて、プレファランスデータのフレーム毎の符号化は、各フレームのデータアップデートを含むことによって直接的に、又は、例えば幾つかの後続フレームに対し一組のプレファランスデータインクリメントを示すことによって若しくは将来の特定フレームに対しターゲット値を設定することによって間接的に、プレファランスデータの経時的に滑らかな遷移を可能にする。
本発明の第2の態様によれば、ビデオデータ信号を復号化する方法が提供される。当該ビデオデータ信号は、入力視点から見たシーンの第1の画像と、第1の画像に関連付けられた奥行きマップと、ビューレンダリングに使用する中心ビューの好適な位置を示すインジケータを含むプレファランスデータとを表す符号化データを含む。中心ビューの好適な位置及び入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連している。当該方法は、ビデオデータ信号を取得するステップと、レンダリングされるビューがビデオデータ信号内に符号化される中心ビューの好適な位置と一致して又は好適な位置の周りにあるように、複数のビューを、第1の画像、奥行きマップ及びプレファランスデータに基づいてレンダリングするステップとを含む。
好適な実施形態では、復号化方法は更に、ターゲット立体視マルチビューディスプレイを駆動する際に使用するレンダリングされたビューをウィービングするステップを含む。
本発明の第3の態様によれば、ビデオデータ信号が提供される。当該ビデオデータ信号は、入力視点から見たシーンの第1の画像と、第1の画像に関連付けられた奥行きマップと、ビューレンダリングに使用する中心ビューの好適な位置を示すインジケータを含むプレファランスデータとを表す符号化データを含み、中心ビューの好適な位置及び入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連している。
任意選択的に、プレファランスデータは更に、複数のビューの好適な位置を含み、各ビューの好適な位置は、入力視点と、基準左ビューと基準右ビューとの間のベースラインとに関連付けられる。
本発明の第4の態様によれば、非一時的な形式のビデオデータ信号を含むデータ担体が提供される。当該データ担体は、光ディスク、ハードディスクドライブ、固体ドライブ又は固体メモリといった既知のデバイスから多種多様であってよい。
本発明の第5の態様によれば、マルチビュー立体視ディスプレイデバイスにおいて使用するビデオデータ信号を符号化する符号化器が提供される。当該符号化器は、入力視点から見たシーンの第1の画像を提供する第1の取得ユニットと、第1の画像に関連付けられた奥行きマップを提供する第2の取得ユニットと、ビューレンダリングに使用する中心ビューの好適な位置を示すインジケータを含むプレファランスデータを提供する第3の取得ユニットと、第1の画像、奥行きマップ及びプレファランスデータを表す符号化データを含むビデオデータ信号を生成する生成器とを含み、中心ビューの好適な位置及び入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連している。
本発明の第6の態様によれば、ビデオデータ信号を復号化する復号化器が提供される。当該ビデオデータ信号は、入力視点から見たシーンの第1の画像と、第1の画像に関連付けられた奥行きマップと、ビューレンダリングに使用する中心ビューの好適な位置を示すインジケータを含むプレファランスデータとを表す符号化データを含み、中心ビューの好適な位置及び入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連している。当該復号化器は、第1の画像、奥行きマップ及びプレファランスデータに多重分離するデマルチプレクサと、レンダリングされるビューがビデオデータ信号内に符号化される中心ビューの好適な位置と一致して又は好適な位置の周りにあるように、複数のビューを、第1の画像、奥行きマップ及びプレファランスデータに基づいてレンダリングするビューレンダラとを含む。
任意選択的に、復号化器は更に、好適な中心位置及びレンダリングに利用可能な視差量に基づいて、マルチビューディスプレイと共に使用するための相互に等距離のビューをレンダリングする。
任意選択的に、プレファランスデータは更に、ターゲットディスプレイのすべてのビューの好適な位置を含み、各ビューの好適な位置は、入力視点と、基準左ビューと基準右ビューとの間のベースラインとに関連付けられる。
本発明の第7の態様によれば、本発明による符号化方法をプロセッサシステムに実行させる命令を含むコンピュータプログラムプロダクトが提供される。
本発明の第8の態様によれば、本発明による復号化方法をプロセッサシステムに実行させる命令を含むコンピュータプログラムプロダクトが提供される。
本発明のこれらの及び他の態様は、以下に説明される実施形態を参照することにより明らかとなろう。
図1Aは、立体視4ビューマルチビューディスプレイの簡略化されたビューイングコーン表現を示す。 図1Bは、立体視5ビューマルチビューディスプレイの簡略化されたビューイングコーン表現を示す。 図2は、本発明による符号化器及び復号化器のブロック図を示す。 図3は、プレファランスデータ表現の概略図を示す。 図4は、プレファランスデータに基づいた可能なレンダリングされるビューの概略図を示す。 図5は、符号化方法のフローチャートを示す。 図6は、好適な位置を選択する好適な方法のフローチャートの詳細を示す。 図7は、復号化方法のフローチャートを示す。
なお、様々な図面において同じ参照符号を有する要素は、同じ構造上の特徴及び同じ機能を有するか、又は、同じ信号である。そのような要素の機能及び/又は構造が説明されている場合には、詳細な説明では、その説明を繰り返す必要はない。
発明の説明に入る前に、まず、マルチビュー自動立体視ディスプレイにおいてよく見られるビューイングコーンの概念を紹介する。このようなマルチビューディスプレイの特に有利な形式については、米国特許第6,801,243B1号を参照されたい。当該特許は、レンチキュラに基づいたマルチビュー自動立体視ディスプレイの一例を示す。
図1Aは、立体視4ビューマルチビューディスプレイの簡略化されたビューイングコーン表現を示す。ビューイングコーン26は、視聴者が見ることになるビューを示す。視聴者が、ディスプレイパネル(図示せず)の中心において、当該ディスプレイパネルの前に着席した場合、視聴者は、その左目でビュー−1を見て、その右目でビュー1を知覚する。適切にレンダリングされたビュー(即ち、左目用にレンダリングされたビューと右目用にレンダリングされたビュー)を提供することによって、視聴者21は、立体画像を知覚する。しかし、視聴者21が、ディスプレイ面と平行な線に沿って右側に、図1Aに示されるような位置に移動すると、視聴者は、ビュー1及びビュー2を知覚する。これは、ビュー1及びビュー2もステレオペアのビューを提示する必要があることを意味する。図1Aに示される状況では、ディスプレイデバイスのビューイングコーンの中心は、ビュー−1とビュー1との間の中間点にある。つまり、ビューの中心は、「仮想」ビュー0にあると言える。ここでは、当該ビューが仮想であるのは、ディスプレイは、当該ビューは見せないからである。
図1Bは、立体視5ビューマルチビューディスプレイの簡略化されたビューイングコーン表現を示す。視聴者23は、ディスプレイパネル24に面している。当該ディスプレイパネルは、ディスプレイパネルから生じた5つのビューを、図1Bに示されるように5つの別個の方向に方向付けるように例えば傾斜されたレンチキュラホイル又はスイッチ可能なバリアが重ねられていてもよい。視聴者23の右目は、ディスプレイパネルの中央において、ディスプレイパネルに面するように位置付けられ、結果として、ディスプレイ画面に垂直な角度に方向付けられているビュー0が、視聴者23の右目に可視である。同様に、ビュー−1が視聴者23の左目に可視である。図1Bに示される場合では、ビューの中心は、ビューイングコーンの中心に位置付けられたビュー0にあると言える。
図2は、本発明による符号化器200及び復号化器300のブロック図を示す。図2の左側に示される符号化器200は、後に送信器70によって送信されるビデオデータ信号50を準備する。送信器70は、上記されたように、ビデオデータ信号50をデータ担体上に記録する記録デバイスによって具現化されるか、或いは、有線媒体73、無線媒体72又はそれらの組み合わせ(図示せず)を介する送信のためにビデオデータ信号を整える。
送信されたデータは、右側に示される復号化器300において受信される。復号化器300は、ビデオデータ信号を受信し、コンテンツを多重分離し、当該コンテンツを使用して、レンダリングユニット90上でビューをレンダリングする。図示されるように、復号化器は、外部マルチビュー立体視ディスプレイを駆動するデバイス105内に具現化されても、マルチビュー立体視ディスプレイを含むデバイス105’内に具現化されてもよい。
デバイス105の復号化器機能は、例えばセットトップボックスに組み込まれてもよく、その場合、ディスプレイデバイスは、当業者には良く知られている、例えばHDMI(登録商標)、DVI又はDisplayPort形式インターフェースを使用して駆動される。或いは、復号化器機能は、レンダリングされインタリーブされたビデオコンテンツをワイヤレスHD又はWiGiGインターフェースを介して送信するラップトップ、タブレット又はスマートホンに組み込まれてもよい。
より詳細には、図2は、マルチビュー立体視ディスプレイデバイス100と共に使用するビデオデータ信号50を符号化する符号化器200を示す。符号化器は、入力視点から見たシーンの第1の画像10を取得する第1の取得ユニット15と、第1の画像10に関連付けられた奥行きマップ20を取得する第2の取得ユニット25と、第1の画像及び奥行きマップに基づいたビューレンダリングに使用する中心ビューの好適な位置を示すプレファランスデータ(preference data)30を取得する第3の取得ユニット35とを含む。中心ビューの好適な位置は、入力視点を、基準左ビューと基準右ビューとの間のベースラインに関連付ける。取得ユニットは、符号化器用の入力を記憶手段又はネットワークから読み出してもよい。
取得後、生成器60が、第1の画像10、奥行きマップ20及びプレファランスデータ30を表す符号化されたデータを含むビデオデータ信号50を生成する。入力データは、後にビデオデータ信号50に多重化される1つ以上のストリームで符号化されてもよい。
また、図2は、有線ネットワーク73、無線ネットワーク72から受信される、又は、場合によっては、データ担体71から読み出されるビデオデータ信号50を復号化する復号化器300を示す。ビデオデータ信号50は、入力視点から見たシーンの第1の画像10、第1の画像10に関連付けられた奥行きマップ20、並びに、第1の画像及び奥行きマップに基づいたビューレンダリングに使用する中心ビューの好適な位置を示すプレファランスデータ30を表す符号化データを含む。中心ビューの好適な位置は、入力視点を、基準左ビューと基準右ビューとの間のベースラインに関連付ける。図示される復号化器は、更なる処理のために第1の画像データ10、奥行きマップ20及びプレファランスデータ30に多重分離するデマルチプレクサ80を含む。次に、レンダリングされるビューがビデオデータ信号50内に符号化された中心ビューの好適な位置と一致して又はその周りにレンダリングされるように、ビューレンダラ90が、第1の画像10、奥行きマップ20及びプレファランスデータ30に基づいて、複数のビューをレンダリングする。
なお、奇数のビューがレンダリングされるディスプレイに対しビューがレンダリングされる場合、レンダリングされる中心ビューは、プレファランスデータ30によって示される好適な位置と一致し、その他のビューは、中心ビューの好適な位置の周りに左右対称に位置付けられる。同様に、偶数のビューを有するディスプレイに対しビューがレンダリングされる場合、すべてのビューは、中心ビューの好適な位置の周りに左右対称に位置付けられ、好適な位置に最も近い2つのビューが、好適な位置の周りに左右対称に位置付けられる。
ビデオにおけるプレファランス位置の符号化
第1の画像及び関連付けられる奥行きマップを使用する現行のビデオデータ信号符号化システムでは、実際のビデオデータは、しばしば、AVC規格又はHEVC規格に基づいて符号化される。
このようなシステムでは、奥行き情報は、しばしば、ビデオデータ信号を、ビデオ及び適用可能なメタデータと組み合わせてレンダリングし、符号化ビデオシーケンスから直接的に利用可能ではないビューを作成しようとするディスプレイデバイスによって使用される。奥行きは、符号化データストリーム中にある場合もない場合もある。符号化ビデオシーケンス中に奥行きがない場合、奥行きマップが、ディスプレイデバイスによってビデオから生成される。
奥行きがある場合、当該奥行きは、ディスプレイデバイスが復号化できる形式に符号化されなければならない。本明細書に提供される例の多くは、平面視ビデオ(1ビュー)から構成されるビデオを示すが、本発明は、ビューのうちの1つのみがビューをレンダリングするために使用される場合、立体視ビデオ(2ビュー)と共に使用されてもよい。立体視ビデオの場合、奥行きは、両方のビュー、又は、2つのビューのうちの1つのビューに提供される。
画像及び奥行き情報は、幾つかのフォーマットにパッケージ化される。そのようなフォーマットの1つは、上記国際特許公開公報WO2006/137000A1に示されるフォーマットである。或いは、データは、別のフレームに適合可能な2Dビデオ及び奥行きフォーマットにパッケージ化されてもよい。
フレームに適合可能な2Dビデオ及び奥行き符号化では、2Dビデオ及び関連付けられる奥行きマップは、幾つかの可能な方法の1つによって、符号化ビデフレームにパックされる。例えばサイドバイサイド構成では、ビデオは、水平方向に、2倍でサブサンプリングされ、画像の左半分に配置される一方で、関連する奥行きは、画像の右半分の輝度に符号化される。この方法の主な利点は、規格化されているAVC/HEVCトランスポートチャネルが分配に利用可能であり、AVC/HEVC復号化器を復号化に使用できる点である。ビデオ及び奥行きは、単一のAVC又はHEVCビデオストリーム内に、復号化器において、復号化された画像の各フレームが2Dビデオ及び関連付けられた奥行き(Z)のスケーリングされたバージョンを有するように含まれる。サイドバイサイド及びトップボトムといったフォーマットが予想される。
或いは、垂直方向及び/又は水平方向に更にスケーリング又はサブサンプリングすることによって、奥行き情報の量を更に減少させることができる。これにより、より多くの帯域幅がもたらされる。
奥行きマップは、次に、例えば8ビット又は16ビット値を使用して符号化される。8ビットの場合、これは、0以上255以下の範囲を表す。奥行きマップが、画像のある領域の一部に格納される場合、奥行き値は、奥行きを格納するために指定された当該画像の領域内の画素のルマ(luma)サンプルに格納される。
プレファランスデータ30は、レンダリングの質を向上させるために、画像及び奥行き情報に加えて提供されるメタデータを表す。このようなメタデータは、AVC又はHEVCベースの符号化ビデオシーケンス内のSEIメッセージ内に含まれる。好適には、このようなメタデータは、ユーザデータ未登録SEIメッセージ内に含まれる。これらのメタデータSEIメッセージは、奥行きを含むエレメンタリストリームに含まれる。これは、選択されたフォーマットに応じて、ビデオ及び奥行きを有する単一のエレメンタリストリームであっても、別個の奥行きエレメンタリストリームであってもよい。

表1:メタデータSEIメッセージコンテナシンタックス
メタデータは、固定値を有する128ビット識別子によって一意に特定される1つ以上のユーザデータ未登録SEIメッセージによって符号化ビデオシーケンスに含まれる。幾つかのタイプのメタデータが定義されている。同じタイプのメタデータが、単一のSEIメッセージに含まれ、当該メッセージについて、タイプはmetadata_typeフィールドによって示される。
複数のメタデータSEIメッセージが単一のアクセスユニットに関連付けられてもよいが、多くても1つの特定のタイプのメタデータSEIメッセージが当該アクセスユニットに関連付けられる。
以下の表2は、上記の表1に記載されるdepth_processing_informationの例示的なシンタックスを示す。


表2:奥行き処理情報シンタックス
様々な要素の更なる説明を以下に述べる。
depth_coding_formatは、複数の奥行き符号化フォーマットが利用可能である場合に、どの特定の奥行き符号化フォーマットが使用されているのかを示すために使用される。
dual_depthは、ステレオコンテンツの場合に、1つ又は2つの奥行きマップが提供されているのかどうかを示すフラグを表し、値1は、2つの奥行きマップが提供されていることを示す。特に、1つの奥行きマップしか利用可能ではない場合、当該1つの奥行きマップに関連付けられるビューに基づいて追加のビューをレンダリングするように本発明が使用される。
preferred_viewは、1に設定されていると、左ビューが、ディスプレイによる単一ビュー処理に好適なビューであることを示す。このフィールドが2に設定されていると、右ビューが、ディスプレイによる単一ビュー処理に好適なビューであることを示す。
この値は、単一のビューから複数のビューを生成するディスプレイデバイスに特に関連する。ビュー生成に複数のビューを使用可能なディスプレイデバイスでは、preferred_viewは、single_depth_preferredが1に設定される場合は、ビューレンダリングに最善のビューを示す。
dual_depthが0である場合、又は、好適なビューがない場合、このフィールドは、0に設定される。
single_view_preferredは、1に設定される場合、ディスプレイデバイスによる単一ビュー処理が好適であることを示す。dual_depthが0である場合、このフィールドは、0に設定される。
single_view_processing_center_offsetは、dual_depth情報を利用しないマルチビューディスプレイデバイスのレンダリングされる中心ビューの推奨される位置を指定する整数値を含む。このフィールドは、dual_depthが1に設定される場合にのみ存在する。表2における条件付き「if」関数によって示されるように、single_view_processing_center_offset_flagは、single_view_processing_center_offsetの値が提供されると設定される。
中心オフセットパラメータは、−128以上127以下の範囲内の値を含み、左ビューと右ビューとの間のベースラインの1/100を単位にして左ビューと右ビューとの間の正確な中心位置(0のオフセット値を表す)に関連している。値は、左から右への位置と共に増加し、−50が元の左ビュー位置を表し、50が元の右ビュー位置を表す。
single_view_center_offsetは、マルチビューディスプレイデバイスのレンダリングされる中心ビューの推奨される位置を指定する整数値を含む。このフィールドは、dual_depthが0に設定される場合にのみ、又は、single_view_preferredが1に設定される場合にのみ存在する。表2における条件付き「if」関数によって示されるように、single_view_center_offset_flagは、single_view_center_offsetの値が提供されると設定される。
単一ビュー中心オフセットパラメータは、−128以上127以下の範囲内の値を含み、意図する左ビューと右ビューとの間のベースラインの1/100を単位にして提供されたビュー(0のオフセット値を表す)に関連している。値は、左から右への位置と共に増加し、−50が意図する左ビュー位置を表し、50が意図する右ビュー位置を表す。
本発明は、第1の画像、奥行きマップ及びプレファランスデータを含むビデオデータ信号を参照して説明されたが、ビデオデータ信号内の他のデータの存在を除外するわけではない。例えば本発明は、左画像及び左奥行きマップ、右画像及び右奥行きマップとして提供されるコンテンツをレンダリングする場合にも存分に使用される。大抵の場合、左及び右からのデータの両方を使用するとより優れたレンダリング結果を達成することができるが、これは、必ずしもそうとは限らない。
したがって、利用可能なステレオデータと2つの奥行きマップがある状況においても、右画像及び右奥行きマップを使用しなくても、第1の画像と関連付けられる奥行きマップだけに基づいて、複数のビューをレンダリングすることができる。
次に、図3及び図4を参照して、中心ビュー位置の符号化について、より詳細に説明する。図3は、8ビット整数表現を使用したsingle_view_processing_center_offset又はsingle_view_center_offset値の可能な整数符号化を図示する。入力視点は、0のオフセットにマッピングされる一方で、−50のオフセットは、通常、左画像がレンダリングされるビューに対応する。50のオフセットは、通常、ステレオペアの右ビューがレンダリングされるビューに対応する。
この符号化の基礎になっている考えは、あらゆるマルチビューディスプレイは、視差の総量がレンダリングされるような方法で立体視コンテンツをレンダリングしなければならないというものである。即ち、最左ビューと最右ビューとの間の視差の差が、視聴者に許容可能にビデオコンテンツをレンダリングするために使用されなければならない。
結果として、高品質の自動立体視ディスプレイデバイスは、左ビューと右ビューとがある立体視コンテンツをレンダリング可能でなければならない。本発明の発明者は、この特徴を利用して、立体視コンテンツのベースラインに関してオフセットを定義できることを認識した。結果として、単一の定義を、広範囲のマルチビュー立体視ディスプレイデバイスに使用できる。この場合、ベースラインは、立体視コンテンツを撮影するために使用されるベースラインと一致するように選択される。
基準左ビュー及び基準右ビュー
しかし、単一の画像と関連付けられた奥行きとに基づいてレンダリングする場合、同じ問題が生じる。つまり、ビューのレンダリングを向上させるためには、中心位置の配置を可能にするベースラインを定義しなければならない。しかし、この場合、左画像及び右画像の厳密な定義はない。
このため、発明者は、ベースライン上に左基準ビューと右基準ビューとを定義し、また、それに基づいて中心位置を定義することが有益であることを認識している。これは、ベースラインの位置を適切に選択可能であるという問題については対処するが、問題を左及び右の基準ビューの定義に移す。
発明者は、これを行うために様々な方法を使用できることを認識している。これを行うための第1の方法は、ディスプレイデバイス自体の特性に基づいてベースラインを定義する方法である。例えばベースラインは、中心ビューのために画像+奥行きに基づいたコンテンツをレンダリングする際に、当該デバイスによって使用されるベースラインに一致するように定義されてもよい。偶数のビューの場合、これは、仮想ビューイングコーンの中心に最も近い2つのビューに対応するベースラインに一致する。このようにすると、−50の値が、ビューイングコーンにおける最も中心のビューペアの左ビューの位置に一致する。この状況では、基準左ビューが、ビューイングコーンにおける最も中心のビューペアの左ビューに一致する。
或いは、ベースラインは、ビューイングコーンの最左ビュー及び最右ビューに基づいて定義されてもよい。このシナリオでは、−50が、ビューイングコーンの最左ビューに対応する。
更に、或いは、ベースラインは、ビューのオンスクリーン視差に関連するメタデータに基づいて、即ち、ディスプレイスクリーンサイズ、好適なビューイング距離及び視聴者の目の距離に基づいて定義されてもよい。
より更に、或いは、ディスプレイが立体視コンテンツもサポートする場合は、左ステレオビューを左基準ビューとして、右ステレオビューを右基準ビューとして選択することも可能である。ステレオコンテンツをレンダリングするマルチビュー自動立体視ディスプレイでは、左と右との間の視差量は、通常、複数のビューに亘って分割される。つまり、ビューイングコーンの2つのビュー間の視差量は、ステレオ入力コンテンツの視差量に比べて大幅に少ない。
しかし、中心を定義するために、元のステレオ左ビュー及び右ビューによって定義されるベースラインを使用することも可能である。
当業者には明らかなように、多くの様々な定義が可能であり、すべて、同じ概念に基づいている。即ち、左及び右基準ビューが定義され、中心がこれらの2つのビュー間のベースラインの一部として定義される。
実際に、どの特定のタイプの基準ビュー定義が選択されるかは、予め決められるか、又は、或いは、ビデオデータ信号自体にメタデータとして符号化される。
再び図3を参照するに、−50のオフセットは、ディスプレイがレンダリングするすべてのビューの中心が、当該マルチビュー立体視ディスプレイデバイスがオフセットなしで立体視画像ペアの左画像をレンダリングする位置に置かれることを意味する。同様に、50のオフセットは、ディスプレイがレンダリングするすべてのビューの中心が、当該マルチビュー立体視ディスプレイデバイスがオフセットなしで立体視画像ペアの右画像をレンダリングする位置に置かれることを意味する。
図4は、ステレオペアの左画像501及び右画像502の位置に対する15個のビュー510〜550のビュー配置の一連の例を示す。入力視点(IV)503は、ビューイングコーンの中心ビューの好適な位置(PP)504に対する入力視点の位置を示す。
ビュー配置510は、0のオフセットに対応し、この状況では、好適な位置504が入力ビュー503に重なる。同様に、ビュー配置520は、−12(12.5%の近似値)のオフセットに対応する。ビュー配置530は、次に、−25のオフセットに対応し、ビュー配置540は、−37(37.5%の近似値)のオフセットに対応し、ビュー配置550は、−50のオフセットに対応する。この状況では、中心ビューは、ビューイングペアの左画像が通常レンダリングされる位置と重なる。
特に、ここに提案されるオフセットの仕様によって、ターゲットディスプレイデバイスは、ビューイングコーンにおける個々のビューの配置を十分に制御することができる。これは、様々なマルチビュー立体視ディスプレイデバイスが様々なビュー割り当て方法を有するので、特に有利である。例えば図4は、隣接するビュー間の視差が変わらない等距離ビュー位置決めを示すが、或いは、視差が最も高いビューイングコーンの中心に人を移動させるようにビューイングコーンの脇に向かってビュー間の視差を減少させることも可能である。
図5を参照するに、図5は、マルチビュー立体視ディスプレイデバイス100と共に使用するビデオデータ信号50を符号化する方法のフローチャートを示す。当該方法は、入力視点から見たシーンの第1の画像10を提供するステップ401と、第1の画像10に関連付けられた奥行きマップ20を提供する第2のステップ402と、第1の画像及び奥行きマップに基づいたビューレンダリングに使用する中心ビューの好適な位置を示すプレファランスデータ30を提供するステップ403と、第1の画像10、奥行きマップ20及びプレファランスデータ30を表す符号化データを含むビデオデータ信号50を生成するステップ404とを含み、中心ビューの好適な位置は、入力視点を、基準左ビューと基準右ビューとの間のベースラインに関連付ける。
オプションとして示されるように、当該方法は更に、ターゲット立体視マルチビューディスプレイ100を駆動する際に使用するレンダリングされたビューをウィービング(weaving)するステップ405を含む。ビューウィービングに関する更なる情報は、例えば米国特許第6,801,243B1号に見出される。
図6を参照するに、図6は、中心ビューの好適な位置を確立する際に使用されるフローチャートを示す。ここに提示される処理は、プレファランスデータ30を取得するために従われる。ステップenc3_0において、レンダリングのための一組のオフセットが決定される。次に、ステップenc3_1において、未評価オフセットが選択され、続いて、ステップenc3_2において、このオフセット設定を使用して、第1の画像及び関連付けられる奥行きマップについてビューがレンダリングされる。ステップenc3_3において、レンダリングされたビューはウィービングされて表示される。次に、ステップenc3_4において、表示されたビューに、人間に支援されて、又は、例えば高度にテクスチャード加工された構造体付近のデオクルージョンの量の計量を求め評価することによってマシンに基づいたランク付け方法によって、ランクが付けられる。
次に、ステップQ?において、すべてのオフセットにランクが付けられたかどうかが評価され、すべてのオフセットにランクが付けられているわけではない場合は、処理は、ステップenc3_6に続き、そうでなければ、処理は、ステップenc3_5に続き、ここでは、ベストランクのオフセットが選択され、プレファランスデータ30を生成するために使用される。
図7を参照するに、図7は、ビデオデータ信号50を復号化する方法のフローチャートを示す。当該ビデオデータ信号50は、入力視点から見たシーンの第1の画像10、第1の画像10に関連付けられた奥行きマップ20、及び、第1の画像及び奥行きマップに基づいたビューレンダリングに使用する中心ビューの好適な位置を示すプレファランスデータ30を表す符号化データを含む。中心ビューの好適な位置は、入力視点を、基準左ビューと基準右ビューとの間のベースラインに関連付ける。当該方法は、ビデオデータ信号50を取得するステップdec1を含む。これは、メモリ、ハードディスク記憶装置からビデオデータ信号を読み出すことであっても、有線又は無線ネットワークから当該データを受信することであってもよい。
次に、ビデオデータ信号は、ステップdec2において、多重分離される。これにより、ビデオデータ信号50内に含まれていた個々の成分が、例えば入力ビデオストリームのコンテナフォーマットを多重分離することによって及び/又はその中に含まれるエレメンタリストリームを続けて多重分離することによって、抽出される。特に、このような多重分離ステップは、必ずしも必要なわけではなく、復号化されるビデオデータ信号の入力フォーマットに依存する。
復号化後、レンダリングステップdec3が適用される。このステップでは、複数のビュー95は、レンダリングされたビュー95がビデオデータ信号50内に符号化された中心ビューの好適な位置と一致して又はその周りにレンダリングされるように、第1の画像10、奥行きマップ20及びプレファランスデータ30に基づいてレンダリングされる。
当業者には明らかであるように、奥行きは、大まかに、視差に反比例する。しかし、奥行きのディスプレイデバイスにおける視差への実際のマッピングは、ディスプレイによって生成される視差の総量、特定の奥行き値をゼロ視差に割り当てる選択、交差視差の許容量等といった様々なデザイン上の選択の影響を受ける。しかし、入力データと共に提供された奥行きデータが、画像を奥行きに依存する方法でワープするために使用される。したがって、ここでは、視差データが、奥行きデータと定性的に解釈される。
当然ながら、本発明は、コンピュータプログラム、特に、本発明を実現するように適応された担体上又は内のコンピュータプログラムにも拡大される。プログラムは、ソースコード、オブジェクトコード、部分的にコンパイルされた形式といったコード中間ソース及びオブジェクトコードの形式、又は、本発明による方法の実施における使用に適した任意の他の形式であってよい。当然ながら、当該プログラムは、多くの異なるアーキテクチャデザインを有する。例えば本発明による方法又はシステムの機能を実施するプログラムコードは、1つ以上のサブルーチンに分割されてもよい。
当業者には、これらのサブルーチン間で機能を分配する多くの様々な方法が明らかであろう。サブルーチンは、自己充足型のプログラムを形成するように1つの実行可能なファイル内にまとめて格納されてもよい。このような実行可能なファイルは、例えばプロセッサ命令及び/又はインタプリタ命令(例えばJava(登録商標)インタプリタ命令)であるコンピュータ実行可能な命令を含む。或いは、サブルーチンの1つ以上又は全部は、少なくとも1つの外部ライブラリファイルに格納され、メインプログラムに静的に又は例えばランタイム時といったように動的にリンクされてもよい。メインプログラムは、サブルーチンの少なくとも1つに対し少なくとも1つの呼び出しを含む。また、サブルーチンは、互いに対する関数呼び出しを含んでもよい。コンピュータプログラムプロダクトに関する一実施形態は、上記された方法の少なくとも1つの方法の処理ステップのそれぞれに対応するコンピュータ実行可能な命令を含む。これらの命令は、サブルーチンに分割されても、及び/又は、静的若しくは動的にリンクされている1つ以上のファイルに格納されてもよい。
コンピュータプログラムプロダクトに関連する別の実施形態は、上記されたシステム及び/又はプロダクトの少なくとも1つの手段のそれぞれに対応するコンピュータ実行可能な命令を含む。これらの命令は、サブルーチンに分割されても、及び/又は、静的若しくは動的にリンクされている1つ以上のファイルに格納されてもよい。
コンピュータプログラムの担体は、プログラムを担持可能である任意のエンティティ又はデバイスであってよい。例えば、担体は、ROM(例えばCD ROM若しくは半導体ROM)、又は、磁気記録媒体(例えばフロッピー(登録商標)ディスク若しくはハードディスク)といった記憶媒体を含む。更に、担体は、電気若しくは光ケーブルを介して、又は、無線若しくは他の手段によって伝送される電気信号又は光信号といった送信可能な媒体であってもよい。プログラムが、そのような信号内に具現化される場合、担体は、そのようなケーブル又は他のデバイス若しくは手段によって構成される。或いは、担体は、その中にプログラムが埋め込まれる集積回路であってもよい。当該集積回路は、関連の方法の実行又は実行における使用に適応される。
なお、上記実施形態は、発明を例示するものであって、限定するものではない。当業者であれば、添付された請求項の範囲から離れることなく、代替実施形態をデザインすることができよう。請求項において、括弧内に置かれた任意の参照符号は、当該請求項を限定するものと解釈されるべきではない。「含む」との動詞及びその活用形の使用は、請求項に記載された要素又はステップ以外の要素又はステップの存在を排除するものではない。また、要素に先行する「a」又は「an」との冠詞は、当該要素が複数存在することを排除するものではない。本発明は、幾つかの別個の要素を含むハードウェア手段によって、また、適切にプログラムされたコンピュータによって実現される。幾つかの手段を列挙する装置クレームにおいて、これらの手段のうちの幾つかは、同一のハードウェアアイテムによって具現化されてもよい。特定の手段が相互に異なる従属請求項に記載されるからといって、これらの手段の組み合わせを有利に使用することができないことを示すものではない。

Claims (16)

  1. 複数のビューを有するビューイングコーンのビューレンダリングのために構成され、中心ビューが前記ビューイングコーンの中心位置にあるマルチビュー立体視ディスプレイデバイスにおいて使用するビデオデータ信号を符号化する方法であって、
    入力視点から見たシーンの第1の画像を提供するステップと、
    前記第1の画像に関連付けられた奥行きマップを提供するステップと、
    前記第1の画像及び前記奥行きマップに基づいたビューレンダリングに使用する前記中心ビューの好適な位置を示すインジケータを含むプレファランスデータを提供するステップと、
    前記マルチビュー立体視ディスプレイデバイスが、前記中心ビューの前記好適な位置と一致して又は前記好適な位置の周りでビューをレンダリングできるように、前記第1の画像、前記奥行きマップ及び前記プレファランスデータを表す符号化データを含む前記ビデオデータ信号を生成するステップと、
    を含み、
    前記中心ビューの前記好適な位置及び前記入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連している、方法。
  2. 前記プレファランスデータは、前記入力視点の前記ベースラインに対する関係に依存するプレファランスデータを含み、前記基準左ビュー及び前記基準右ビューが前記単一ビューに対する意図する左ビュー位置及び意図する右ビュー位置を表す前記入力視点を構成する単一ビューしか有さないビデオ信号について、前記単一ビューに対する前記好適な位置を示す前記インジケータとして提供される、単一ビュー中心オフセット値を含む、請求項1に記載の符号化方法。
  3. 前記プレファランスデータは、前記単一ビュー中心オフセット値が提供されると設定される単一ビュー中心オフセットフラグを含む、請求項2に記載の符号化方法。
  4. 前記プレファランスデータは、前記入力視点の前記ベースラインに対する関係に依存するプレファランスデータを含み、前記基準左ビュー及び前記基準右ビューを構成する左ビュー及び右ビューを有するビデオ信号について、前記基準左ビューと前記基準右ビューとの間の中心位置に対する前記好適な位置を示す前記インジケータとして提供される、単一ビュー処理中心オフセット値を含む、請求項1に記載の符号化方法。
  5. 前記プレファランスデータは、
    前記単一ビュー処理中心オフセット値が提供されると設定される単一ビュー処理中心オフセットフラグと、
    単一ビュー処理が好適である場合に設定される、単一ビューが好適であることを示すフラグと、
    前記基準左ビューが、前記単一ビュー処理に好適なビューであること、又は、前記基準右ビューが、前記単一ビュー処理に好適なビューであることを示す好適なビューインジケータと、
    のうちの少なくとも1つを含む、請求項4に記載の符号化方法。
  6. 前記プレファランスデータは、前記基準左ビューと前記基準右ビューとの間の前記ベースラインの1/100の精度で前記ベースラインに対する前記中心ビューの位置の前記好適な位置を示す、請求項1乃至5の何れか一項に記載の符号化方法。
  7. 前記中心ビューの前記好適な位置は、基準ディスプレイに対する複数の異なる中心ビュー位置についてコンテンツをレンダリングした後に知覚される画質の評価に基づいて決定される、及び/又は、前記プレファランスデータは、フレーム毎、フレームグループ毎、シーン毎のうちの1つに対し設定される、請求項1乃至6の何れか一項に記載の符号化方法。
  8. 複数のビューを有するビューイングコーンのビューレンダリングのために構成され、中心ビューが前記ビューイングコーンの中心位置にあるマルチビュー立体視ディスプレイデバイスにおいて使用するビデオデータ信号を復号化する方法であって、
    前記ビデオデータ信号は、
    入力視点から見たシーンの第1の画像と、
    前記第1の画像に関連付けられた奥行きマップと、
    前記第1の画像及び前記奥行きマップに基づいたビューレンダリングに使用する前記中心ビューの好適な位置を示すインジケータを含むプレファランスデータと、
    を表す符号化データを含み、前記中心ビューの前記好適な位置及び前記入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連し、
    前記方法は、
    前記ビデオデータ信号を取得するステップと、
    レンダリングされるビューが前記ビデオデータ信号内に符号化される前記中心ビューの前記好適な位置と一致して又は前記好適な位置の周りにあるように、複数のビューを、前記第1の画像、前記奥行きマップ及び前記プレファランスデータに基づいてレンダリングするステップと、
    を含む、方法。
  9. 複数のビューを有するビューイングコーンのビューレンダリングのために構成され、中心ビューが前記ビューイングコーンの中心位置にあるマルチビュー立体視ディスプレイデバイスにおいて使用するビデオデータ信号であって、
    入力視点から見たシーンの第1の画像と、
    前記第1の画像に関連付けられた奥行きマップと、
    前記第1の画像及び前記奥行きマップに基づいたビューレンダリングに使用する前記中心ビューの好適な位置を示すインジケータを含むプレファランスデータと、
    を表す符号化データを含み、前記マルチビュー立体視ディスプレイデバイスが、前記中心ビューの前記好適な位置と一致して又は前記好適な位置の周りでビューをレンダリングできるように、前記中心ビューの前記好適な位置及び前記入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連する、ビデオデータ信号。
  10. 前記プレファランスデータは更に、複数のビューの好適な位置を含み、各ビューの前記好適な位置は、前記入力視点と、前記基準左ビューと前記基準右ビューとの間の前記ベースラインとに関連付けられる、請求項9に記載のビデオデータ信号。
  11. 請求項9又は10に記載のビデオデータ信号を含むデータ担体。
  12. 複数のビューを有するビューイングコーンのビューレンダリングのために構成され、中心ビューが前記ビューイングコーンの中心位置にあるマルチビュー立体視ディスプレイデバイスにおいて使用するビデオデータ信号を符号化する符号化器であって、
    入力視点から見たシーンの第1の画像を提供する第1の取得ユニットと、
    前記第1の画像に関連付けられた奥行きマップを提供する第2の取得ユニットと、
    前記第1の画像及び前記奥行きマップに基づいたビューレンダリングに使用する前記中心ビューの好適な位置を示すインジケータを含むプレファランスデータを提供する第3の取得ユニットと、
    前記マルチビュー立体視ディスプレイデバイスが、前記中心ビューの前記好適な位置と一致して又は前記好適な位置の周りでビューをレンダリングできるように、前記第1の画像、前記奥行きマップ及び前記プレファランスデータを表す符号化データを含む前記ビデオデータ信号を生成する生成器と、
    を含み、
    前記中心ビューの前記好適な位置及び前記入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連する、符号化器。
  13. 複数のビューを有するビューイングコーンのビューレンダリングのために構成され、中心ビューが前記ビューイングコーンの中心位置にあるマルチビュー立体視ディスプレイデバイスにおいて使用するビデオデータ信号を復号化する復号化器であって、
    前記ビデオデータ信号は、
    入力視点から見たシーンの第1の画像と、
    前記第1の画像に関連付けられた奥行きマップと、
    前記第1の画像及び前記奥行きマップに基づいたビューレンダリングに使用する前記中心ビューの好適な位置を示すインジケータを含むプレファランスデータと、
    を表す符号化データを含み、前記中心ビューの前記好適な位置及び前記入力視点は、基準左ビューと基準右ビューとの間のベースラインに関連し、
    前記復号化器は、
    前記第1の画像、前記奥行きマップ及び前記プレファランスデータに多重分離するデマルチプレクサと、
    レンダリングされるビューが前記ビデオデータ信号内に符号化される前記中心ビューの前記好適な位置と一致して又は前記好適な位置の周りにあるように、複数のビューを、前記第1の画像、前記奥行きマップ及び前記プレファランスデータに基づいてレンダリングするビューレンダラと、
    を含む、復号化器。
  14. 相互に等距離のビューをレンダリングする、請求項13に記載の復号化器。
  15. 請求項1乃至7のうち何れか一項に記載の方法をプロセッサシステムに実行させる命令を含むコンピュータプログラム。
  16. 請求項8に記載の方法をプロセッサシステムに実行させる命令を含むコンピュータプログラム。
JP2015546148A 2013-02-06 2014-01-27 マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号を符号化する方法 Active JP6231125B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP13154244.1A EP2765774A1 (en) 2013-02-06 2013-02-06 System for generating an intermediate view image
EP13154257.3 2013-02-06
EP13154257.3A EP2765775A1 (en) 2013-02-06 2013-02-06 System for generating intermediate view images
EP13154244.1 2013-02-06
US201361821750P 2013-05-10 2013-05-10
US61/821,750 2013-05-10
PCT/IB2014/058564 WO2014122553A1 (en) 2013-02-06 2014-01-27 Method of encoding a video data signal for use with a multi-view stereoscopic display device

Publications (2)

Publication Number Publication Date
JP2016506137A true JP2016506137A (ja) 2016-02-25
JP6231125B2 JP6231125B2 (ja) 2017-11-15

Family

ID=51299278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015546148A Active JP6231125B2 (ja) 2013-02-06 2014-01-27 マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号を符号化する方法

Country Status (8)

Country Link
US (1) US9596446B2 (ja)
EP (1) EP2949121B1 (ja)
JP (1) JP6231125B2 (ja)
CN (1) CN104335579B (ja)
BR (1) BR112014027678A2 (ja)
RU (1) RU2640357C2 (ja)
TW (1) TWI651960B (ja)
WO (1) WO2014122553A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016204481A1 (ko) * 2015-06-16 2016-12-22 엘지전자 주식회사 미디어 데이터 전송 장치, 미디어 데이터 수신 장치, 미디어 데이터 전송 방법, 및 미디어 데이터 수신 방법
KR102415502B1 (ko) * 2015-08-07 2022-07-01 삼성전자주식회사 복수의 사용자를 위한 라이트 필드 렌더링 방법 및 장치
EP3416381A1 (en) * 2017-06-12 2018-12-19 Thomson Licensing Method and apparatus for providing information to a user observing a multi view content
EP3429210A1 (en) * 2017-07-13 2019-01-16 Thomson Licensing Methods, devices and stream for encoding and decoding volumetric video
EP3432581A1 (en) * 2017-07-21 2019-01-23 Thomson Licensing Methods, devices and stream for encoding and decoding volumetric video
FR3075540A1 (fr) * 2017-12-15 2019-06-21 Orange Procedes et dispositifs de codage et de decodage d'une sequence video multi-vues representative d'une video omnidirectionnelle.
CN108573524B (zh) * 2018-04-12 2022-02-08 东南大学 基于渲染管线的交互式实时自由立体显示方法
CN111664859B (zh) * 2020-05-28 2021-12-24 武汉中海庭数据技术有限公司 一种高精度地图生产过程中的数据采集方法及系统
CN113504862A (zh) * 2021-09-11 2021-10-15 腾讯科技(深圳)有限公司 视图数据处理方法、装置、目标设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010070545A1 (en) * 2008-12-15 2010-06-24 Koninklijke Philips Electronics N.V. Image based 3d video format
WO2011039679A1 (en) * 2009-10-02 2011-04-07 Koninklijke Philips Electronics N.V. Selecting viewpoints for generating additional views in 3d video

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9715397D0 (en) 1997-07-23 1997-09-24 Philips Electronics Nv Lenticular screen adaptor
JP4324435B2 (ja) * 2003-04-18 2009-09-02 三洋電機株式会社 立体視用映像提供方法及び立体映像表示装置
US8879823B2 (en) 2005-06-23 2014-11-04 Koninklijke Philips N.V. Combined exchange of image and related data
JP2007081562A (ja) * 2005-09-12 2007-03-29 Toshiba Corp 立体画像表示装置、立体画像表示プログラムおよび立体画像表示方法
JP4521342B2 (ja) * 2005-09-29 2010-08-11 株式会社東芝 三次元画像表示装置、三次元画像表示方法および三次元画像表示プログラム
CN101313596B (zh) * 2005-11-23 2011-01-26 皇家飞利浦电子股份有限公司 为多视图显示设备呈现视图
CN101895744B (zh) * 2006-01-12 2013-03-20 Lg电子株式会社 处理多视图视频
EP3104603B2 (en) * 2006-03-31 2022-06-08 Koninklijke Philips N.V. Efficient image receiver for multiple views
US8345751B2 (en) 2007-06-26 2013-01-01 Koninklijke Philips Electronics N.V. Method and system for encoding a 3D video signal, enclosed 3D video signal, method and system for decoder for a 3D video signal
EP2201784B1 (en) * 2007-10-11 2012-12-12 Koninklijke Philips Electronics N.V. Method and device for processing a depth-map
US8482654B2 (en) * 2008-10-24 2013-07-09 Reald Inc. Stereoscopic image format with depth information
KR20120013966A (ko) * 2009-05-01 2012-02-15 톰슨 라이센싱 3dv를 위한 기준 화상 리스트
US9124874B2 (en) * 2009-06-05 2015-09-01 Qualcomm Incorporated Encoding of three-dimensional conversion information with two-dimensional video sequence
US8629899B2 (en) * 2009-08-06 2014-01-14 Qualcomm Incorporated Transforming video data in accordance with human visual system feedback metrics
WO2012007867A1 (en) 2010-07-12 2012-01-19 Koninklijke Philips Electronics N.V. Signaling for multiview 3d video
RU2480941C2 (ru) * 2011-01-20 2013-04-27 Корпорация "Самсунг Электроникс Ко., Лтд" Способ адаптивного предсказания кадра для кодирования многоракурсной видеопоследовательности
US9560344B2 (en) 2011-04-20 2017-01-31 Koninklijke Philips N.V. Position indicator for 3D display
KR101807692B1 (ko) 2011-06-01 2017-12-12 삼성전자주식회사 다시점 3차원 영상 디스플레이 장치 및 방법
WO2012176109A1 (en) * 2011-06-22 2012-12-27 Koninklijke Philips Electronics N.V. Method and apparatus for generating a signal for a display
JP5100875B1 (ja) * 2011-08-31 2012-12-19 株式会社東芝 視域調整装置、映像処理装置および視域調整方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010070545A1 (en) * 2008-12-15 2010-06-24 Koninklijke Philips Electronics N.V. Image based 3d video format
WO2011039679A1 (en) * 2009-10-02 2011-04-07 Koninklijke Philips Electronics N.V. Selecting viewpoints for generating additional views in 3d video

Also Published As

Publication number Publication date
BR112014027678A2 (pt) 2017-06-27
EP2949121B1 (en) 2020-07-15
RU2014150963A (ru) 2017-03-15
TWI651960B (zh) 2019-02-21
CN104335579B (zh) 2017-11-14
RU2640357C2 (ru) 2017-12-28
TW201440488A (zh) 2014-10-16
JP6231125B2 (ja) 2017-11-15
EP2949121A1 (en) 2015-12-02
US9596446B2 (en) 2017-03-14
US20150334369A1 (en) 2015-11-19
CN104335579A (zh) 2015-02-04
WO2014122553A1 (en) 2014-08-14

Similar Documents

Publication Publication Date Title
JP6231125B2 (ja) マルチビュー立体視ディスプレイデバイスと共に使用するビデオデータ信号を符号化する方法
US8488869B2 (en) Image processing method and apparatus
TWI644559B (zh) 用於多視角成像裝置的編碼視頻資料信號之方法
KR101468267B1 (ko) 중간 뷰 합성 및 멀티-뷰 데이터 신호 추출
JP5544361B2 (ja) 三次元ビデオ信号を符号化するための方法及びシステム、三次元ビデオ信号を符号化するための符号器、三次元ビデオ信号を復号するための方法及びシステム、三次元ビデオ信号を復号するための復号器、およびコンピュータ・プログラム
US8803948B2 (en) Broadcast receiver and 3D subtitle data processing method thereof
US20140152782A1 (en) Method and device for the creation of pseudo-holographic images
CA2819141C (en) Receiving device and method for receiving multiview three-dimensional broadcast signal
KR20120093243A (ko) 3d 비디오에서 추가 뷰들을 생성하기 위한 뷰포인트들을 선택하는 방법
KR20110129903A (ko) 3d 시청자 메타데이터의 전송
KR20110083650A (ko) 신호에 포함된 시차 정보를 처리하는 방법
KR20140041489A (ko) 스테레오스코픽 이미지의 동시적인 스테레오스코픽 및 모노스코픽 디스플레이를 가능하게 하기 위한 스테레오스코픽 이미지의 자동 컨버전
CH706886A2 (it) Metodo per la generazione, trasmissione e ricezione di immagini stereoscopiche e relativi dispositivi.
EP2982107B1 (en) Re-targeting a three-dimensional image signal
Paradiso et al. A novel interpolation method for 3D view synthesis
KR101289269B1 (ko) 영상 시스템에서 영상 디스플레이 장치 및 방법
WO2013153523A2 (en) Depth signaling data
JP2014132722A (ja) 立体映像符号化装置、立体映像復号化装置、立体映像符号化方法、立体映像復号化方法、立体映像符号化プログラム及び立体映像復号化プログラム
Zhao et al. An overview of 3D-TV system using depth-image-based rendering
KR20090093734A (ko) 다시점 영상을 위한 부가 정보를 포함하는 데이터스트림부호화 방법 및 그 장치, 그리고 이를 이용한 데이터스트림복호화 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160704

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20161003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171018

R150 Certificate of patent or registration of utility model

Ref document number: 6231125

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250