JP2013521686A - 3dtvのための視差分布推定 - Google Patents

3dtvのための視差分布推定 Download PDF

Info

Publication number
JP2013521686A
JP2013521686A JP2012555428A JP2012555428A JP2013521686A JP 2013521686 A JP2013521686 A JP 2013521686A JP 2012555428 A JP2012555428 A JP 2012555428A JP 2012555428 A JP2012555428 A JP 2012555428A JP 2013521686 A JP2013521686 A JP 2013521686A
Authority
JP
Japan
Prior art keywords
disparity
image
sub
image area
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2012555428A
Other languages
English (en)
Inventor
フォルカー フライブルク
ティモ エメリヒ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2013521686A publication Critical patent/JP2013521686A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/32Determination of transform parameters for the alignment of images, i.e. image registration using correlation-based methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • G06T2207/10021Stereoscopic video; Stereoscopic image sequence

Abstract

本発明は、各画像が画素のアレイを有する、立体3D映像の左画像と右画像との間の視差分布を推定するための方法であって、視差の最大範囲(Dmin及びDmax)を提供するステップと、左画像領域(74)と右画像領域(75)との双方の画像のうちの一方が視差シフト値(Δd)だけシフトされた状態で、左画像領域(74)と右画像領域(75)との相関をとるステップと、相関の結果は、双方の画像の間の画像マッチの指標であることと、視差の最大範囲(Dmin、Dmax)内において視差シフト値(Δd)のセットについて相関をとるステップを繰り返すステップと、相関の結果から視差分布を得るステップとを含む方法に関する。本発明は、各画像が画素のアレイを有する、立体3D映像の左画像と右画像との間の視差分布を推定するための装置であって、双方の画像領域のうちの一方が視差シフト値だけシフトされた状態で、左画像領域と右画像領域との相関をとり、当該相関の結果は、双方の画像の間の画素マッチの指標であり、所与の視差の最大範囲内における視差シフト値のセットについて上記相関を繰り返し、相関の結果から視差分布を得て、得られた視差分布を出力することを備える装置にも関する。
【選択図】図6b

Description

本発明は、各画像が画素のアレイを有する、立体3D映像(stereoscopic 3D picture)の左画像と右画像との間の視差分布(display distribution)を推定するための方法に関する。本発明は、視差分布を推定するための装置及び立体3D映像を表示するためのテレビジョン装置にも関する。さらに、本発明は、3D映像を記録し、処理し及び/又は表示するための装置と、コンピュータプログラムプロダクトとに関する。
立体3Dシネマトグラフィの原理は長い間知られているが、近年は大変人気があり、立体3Dコンテンツを表示することが可能な装置への需要は急速に増加している。特に、エンターテインメント産業は、立体3D性能を有するテレビジョン装置の開発を開始している。しかしながら、立体3Dコンテンツの表示に伴う原理的な問題は、視聴者によって知覚される奥行き感(depth impression)に関連する撮影状況と視聴状況との間にしばしば生じる矛盾である。奥行き感についての要因は、テレビ受像機のディスプレイの画面サイズ、ディスプレイの正面の視聴者の距離及び位置、並びに、個人の瞳孔間隔である。目の距離は、成人の間ではあまり変わらないと考えられているが、問題は特に子供について存在する。大抵の場合、コンテンツが制作されるときに視聴状況は知得されていない。一方、撮影状況を記述するメタデータをコンテンツに付加し得るが、これは標準化されていない。映画館における状況と比較して、テレビ受像機の様々な異なるディスプレイ画面のサイズ、視聴者の様々な異なる距離及び位置のために、この問題には特に興味がある。
従って、3Dコンテンツの表示は、視聴者に問題を提示し得る。よくある問題は、シーンの遠い地点をみている場合の目の開散の経験、又は、ディスプレイ画面からの見掛けの距離があまりに大きいオブジェクトを凝視する場合の、目の輻輳と目の調節との間の混乱する印象であり得る。
従来技術において、いわゆる「コンフォートゾーン(comfort zone)」の使用が確立されてきた。「コンフォートゾーン」は、如何なる目の輻輳及び目の調節の問題も無しに視聴者によってオブジェクトの凝視が為され得るテレビ受像機の画面又はディスプレイ面の前方及び後方の領域を定義する。換言すれば、コンフォートゾーンは、オブジェクトを表示するために用いられるべきディスプレイ画面に対する深度を記述する。
このコンフォートゾーンは、画面又はディスプレイ面の周りの深度範囲(depth range)を定義し、左視野(view)と右視野との間の視差に密接に関連する。従って、視聴者についての知覚される深度を変化させるための方法は、左視野と右視野との間の視差を変化させることである。最も簡単な形において、これは、ディスプレイ上に表示される場合の左画像及び右画像のシフト演算(shift operation)と水平目盛とによって達成されることができる。双方の画像に等しく適用されるスケール演算(scale operation)は、視差範囲を同じ量だけスケーリングする。左画像対右画像の水平シフト(horizontal shift)は、ゼロ視差の平面を再配置するであろう。即ち、ディスプレイのコンフォートゾーン内におけるシーンの深度を調節するために、シーンにおける特定の深度平面をディスプレイ画面の平面において位置付けることができる。
換言すると、3Dコンテンツを表示する主な問題の1つは、与えられる(delivered)立体3Dコンテンツにおいて用いられる深度範囲を、例えばテレビ受像機といったディスプレイ装置のコンフォートゾーン内にすることである。これは、与えられるコンテンツの最大深度範囲がコンフォートゾーンの深度範囲に実質的に対応するように深度範囲をスケーリングすることによって達成される。さらに、与えられるコンテンツの深度範囲は、ディスプレイ画面平面に対してシフトされ得る。
3Dコンフォートゾーンのような、3Dシネマトグラフィの原理についてのより詳細な情報は、非特許文献1の特にチャプター5に見出し得る。非特許文献1の内容は、参照することによって本明細書に組み込まれる。
"3D Movie Making, Stereoscopic Digital Cinema from Script to Screen" Bernard Mendiburu, Focal Press, ISBN 978-0-240-81137-6
スケール演算及びシフト演算について適当なパラメータを導くために、視差の範囲は、予め知得されていなければならない。本文脈において、視差の範囲は、コンテンツに存在する少なくとも最小及び最大の視差を表すものとして定義される。好適には、これらの極値間の視差レベルの分布も知得されている。この情報は、通常、コンテンツに付加されたメタデータから入手可能ではく、画像コンテンツ自体からリカバーされ(recovered)なければならない。
視差分布を生成するための単純な(naive)アプローチは、入力画像における各画素位置に視差値が割り当てられる高密度視差マップ(dense disparity map)の推定である。次いで、高密度視差マップからヒストグラムが算出される。この方法の不都合な点は、局所的な(localized)深度情報を最初に探索し、その後、それを破棄することの非効率性である。
本発明の目的は、左視野画像と右視野画像との間の視差のグローバルな分布を推定することが可能な効率的な方法を提供することである。本発明のさらなる目的は、視差のグローバルな分布を効率的に推定することが可能な装置を提供することである。
本発明のある観点によれば、各画像が画素のアレイを有する、立体3D映像の左画像と右画像との間の視差分布を推定するための方法であって、視差の最大範囲を提供するステップと、左画像領域と右画像領域との双方の画像のうちの一方が視差シフト値だけシフトされた状態で、左画像領域と右画像領域との相関をとるステップと、相関の結果は、双方の画像の間の画素マッチの指標であることと、視差の最大範囲内において視差シフト値のセットについて相関をとるステップを繰り返すステップと、相関の結果から視差分布を得るステップとを含む方法が提供される。
つまり、換言すると、双方の画像の間でいくつの画素が一致するかを判定するために、左画像領域及び右画像領域のうちの一方が、視差シフト値だけシフトされる他の画像領域と比較される。例えば、一方の画像領域の全ての画素が、シフトされた他方の画像領域と完全に一致する場合、コンテンツ全体は、用いられる視差シフト値に対応する視差(これは、ディスプレイ平面に対する深度平面の位置の指標である)を有する同じ深度平面に位置する。
この相関をとるステップは、所与の視差の最大範囲内における幾つかの視差シフト値について繰り返される。最後には、用いられる視差シフト値全てについての相関結果が得られ、当該結果は視差分布に結合される。
この視差分布は、立体3D映像をコンフォートゾーンへ移動させるために用いられる、さらなる画像処理に使用されることができる。
従って、提案される発明の方法のコア原則は、左画像と右画像との非線形相関に基づく。2つの画像のうちの一方は、他方に対してd画素列(即ち、視差シフト値)だけ水平にシフトされ、第1の画像及び他方の画像のシフトされたバージョンの同じ領域について相関演算(correlation operation)が行われる。スケーリング及びシフト演算についての適当なパラメータ、即ち、視差分布を適用するためのこの方法は、必要な画素演算が簡単なため、非常に効率的である。
好適な実施形態によれば、視差シフト値のセットは視差の最大範囲内の全ての整数値を含み、視差シフト値及び視差の最大範囲の単位は、画素である。
つまり、換言すると、相関をとるステップは、所与の視差の最大範囲内における全ての視差シフト値について実行される。この視差の最大範囲は、最小の視差値と最大の視差値とによって定義される。双方の視差値は、上記範囲が0に対して対称になるように、異なる符号を有して等しくてもよい。しかしながら、それぞれの情報が入手可能な場合には、双方の値が非対称的に選択されてもよい。一般に、視差の最大範囲は、与えられる立体3Dコンテンツの期待される最大深度範囲、又は、換言すると、コンテンツに含まれる最大の期待される視差を定義する。上記の視差値も、計算資源の制約、又は、期待される視差と計算資源の制約との間の妥協に基づいて定義されてもよい。
好適な実施形態において、相関をとることに用いられる画像領域は、一方の画像領域とシフトされた他方の画像領域とが重複する領域である。より好適には、相関をとることのための左画像領域と右画像領域とは、左境界と右境界とにおいて、好適には視差の最大範囲に対応する値だけトリミングされる。
この方策は、相関領域がいずれかの画像の境界をまたぐことを回避する。
さらなる好適な実施形態において、相関をとるステップは、双方の画像領域を互いに画素単位で比較するステップと、
比較の結果に応じてカウンタを増加させることとを含み、当該カウンタは、双方の画像領域についての画素値の一致を表し、双方の画像領域の一方は、視差シフト値だけシフトされている。より好適には、双方の画像領域を画素単位で比較するステップは、双方の画像領域のうちの一方の各画素の値を他方の画像領域の各画素(each respective pixel)の値から減算するステップを含む。より好適には、比較の結果の絶対値が、好適には1である所定の閾値よりも小さい場合、カウンタが増加される。
換言すれば、相関をとるステップは、2つの画素値の間の簡単な減算演算を含み、この減算の結果の絶対値が所定の閾値よりも小さい場合、カウンタが1だけ増加される。従って、画素が、シフトされた画像におけるそれぞれの画素と一致する度に、カウンタが増加される。従って、カウンタが大きいほど、一致する画素の数は大きくなる。
しかしながら、相関の結果は、一致する画素に関する如何なる空間的な情報も含まないことに留意すべきである。換言すると、相関をとるステップは、ある視差値及び画像領域内のそれぞれの領域(region)に関する如何なる情報も供給しない。このことは、本方法を非常に効率的にする。
さらなる好適な実施形態によれば、画像領域は互いに対して水平にシフトされる。
さらなる好適な実施形態において、左画像領域及び右画像領域は、複数のサブ領域に分割され、相関をとるステップは、視差分布が全ての画像サブ領域について得られるように、各サブ領域について別々に実行される。好適には、サブ領域の視差分布は、単一の分布に結合される。より好適には、サブ領域の数は9である。
発明者は、上述された方法によって得られる視差分布が、非常に滑らかであり、立体的な入力における大きなオブジェクトにピークが対応するという特性を有することに気付いた。異なる深度平面におけるより小さなオブジェクトに対応するピークのマスキングを回避するために、複数の相関領域を用いることが有利であることを発明者は見出した。
さらなる好適な実施形態において、各サブ領域は構造的な要素を含むかが分析される。好適には、各サブ領域についての重み係数(weight factor)は、分析の結果に応じて判定され、重み係数は、視差分布の結合に用いられる。
視差を推定することができるのは、画像コンテンツが幾つかの最小の構造を提示する場合だけであるので、各サブ領域が、構造を含むか、又は、均一な若しくは同一の明度のみを含むかがテストされる。計算効率の良いテストは、相関から取得される分布に行うことができ、コンテンツにおける充分な構造は、鮮明に示される、目立ったピークをもたらすことが観察される。弱い構造のみ又は構造が存在しない場合、ピークも弱くなり、おそらく探索範囲全体を超えて広がる。好適には、ピーク曲線は、後続の結合ステップにおいて用いられる重み係数を判定するための、ピーク曲線の二次導関数を用いて評価される。
さらなる好適な実施形態において、サブ領域視差分布を結合して大きなピークを強調し、小さなピーク及びノイズを低減する前に、非線形伝達関数が各サブ領域視差分布に適用される。
さらなる好適な実施形態において、サブ領域視差分布のセットが結合される。好適には、サブ領域視差分布のセットは、画像境界、好適には上端部画像境界及び下端部画像境界に位置付けられるサブ領域に関連するサブ領域視差分布のみを含む。
従って、提案される方法の別の観点は、サブ領域分布の結合は、画像領域全体の代わりに異なるサブセットを含むことができることである。例えば、上端部画像境界及び下端部画像境界に位置付けられる全てのサブ領域の分布を結合して、境界領域の視差分布を取得することができる。そのような分布は、シーンコンテンツの境界バイオレーション、即ち、視聴者により近い深度平面に位置付けられるオブジェクトが、ディスプレイ平面に位置付けられる画像境界によってカットされる場合を探索するために用いられ得る。
さらなる好適な実施形態において、提案される方法は、修正された(rectified)左視野及び右視野を含む、即ち、固有の視聴時の幾何学的配置のエピポーラ線が画像行と並べられた立体的なマテリアル(material)にも適している。さらに、左視野及び右視野は、等しい露出及び輝度を有するべきである。これらの要件は立体的なディスプレイ上の最良の描写を確保するが、これらは依然として今日のコンテンツの大部分によって侵されている。
従って、提案される方法は、左視野と右視野との間のグローバルイルミネーションの差をまず補償する前処理手段も含むように拡張されることができる。次に、左相関領域と右相関領域との間の垂直シフトは、各相関領域について判定される。最後に、水平分布が上述したように推定され得る。
本発明のさらなる観点によれば、各画像が画素のアレイを有する、立体3D映像の左画像と右画像との間の視差分布を推定するための装置であって、双方の画像領域のうちの一方が視差シフト値だけシフトされた状態で、左画像領域と右画像領域との相関をとり、当該相関の結果は、双方の画像の間の画素マッチの指標であり、所与の視差の最大範囲内における視差シフト値のセットについて相関を繰り返し、相関の結果から視差分布を得て、得られた視差分布を出力するように適合される推定装置を備える装置が提供される。
発明の装置は、発明の方法に関して上述されたものと同じ利点を有する。従って、上記説明のそれぞれが参照され得る。さらに、装置は、方法に関して説明されたものと類似の及び/又は同一の好適な実施形態を有する。従って、これらの実施形態及び対応する利点を繰り返すことは控えてもよい。
最後に、本発明のさらなる観点によれば、上述した発明の装置を含む立体3D映像を再生するための装置、好適にはテレビ受像機が提供される。
まとめると、本発明は、上記の単純なアプローチよりも計算効率が良い方法を提案する。さらに、発明の方法は、単純なアプローチよりも複雑度が低い。従って、発明の方法は、ベクトル化された計算ユニットを有するプロセッサ(例えば、VLIW、CELL)のためのソフトウェア又はハードウェア(例えば、ASIC)に、より簡単に実装されることができる。さらに、発明の方法は、周期的な構造を提示するコンテンツ又は単純なアプローチよりもロバストである。
発明の方法によって提供される視差分布に基づいて実行される、画像ペアの奥行き感(depth impression)を変更することとは別に、特にレンズからリビングルームまであらゆる種類の装置について考えられる、発明の方法についての他の潜在的な用途は、
a)例えば、シーンの前に字幕又は画面上のメニューを適切に配置するために、視聴者に最も近い深度距離(depth distance)を発見するためのオンザフライのメタデータ生成、
b)静止画像カメラ装置又はビデオカメラ装置、
c)ホームビデオ用又は放送会社によって用いられるようなコンテンツポストプロダクションシステム、
d)ブルーレイのようなパッケージ化された媒体又はインターネットからのストリーミングメディアを用いるゲーム機又はコンピュータプロダクトに基づくメディア再生装置、
e)テレビジョン装置に限定されず、立体モニタ装置及びプロジェクションシステムを含むディスプレイ装置、
を含み得る。
ケースe)の用途は、後述されるようにディスプレイ/視聴者の状況に基づく知覚される深度の制御に注目する一方で、ケースb)及びc)の潜在的な用途は、あまりにも高い視差範囲は処理過程(processing chain)の下流において問題を引き起こすことが知得されている、悪い状態の撮影状況を示す、写真家又は製造オペレータへのインタラクティブなフィードバックであり得る。ケースc)、d)及びe)の場合、用途は、キャプション又は字幕の深度位置調整(positioning)、及び、そのような装置を制御する画面上のメニューの位置調整である。ケースc)又はd)の場合、情報を用いて、ストリームの映像品質及び/又は計算量の観点において、インタビュー予測(interview prediction)に関するコーデック効率を改善し得る。
上述された特徴及び以下に説明される特徴は、述べられるそれぞれの組み合わせにおいてだけでなく、本発明の範囲を逸脱することなく、他の組み合わせにおいて又は分離して用いられることができることが理解されるべきである。
本発明のこれら及び他の観点は、以下に記載される実施形態を参照しつつ明らかになり、以下により詳細に説明されるであろう。以下の図面において、
ディスプレイ平面及びオブザーバを有する典型的な視聴時の幾何学的配置(viewing geometry)を示す。 ディスプレイコンフォートゾーンを有する視聴時の幾何学的配置を示す。 視差分布の例を示す。 視差分布の例を示す。 画像分析及び画像変換部を有するブロック図を示す。 本発明のコア原則を説明するためのブロック図を示す。 本発明の相関をとるステップを説明するための処理フロー図を示す。 上記相関をとるステップの間に用いられる画像領域の一例を示す。 本発明のさらなる実施形態において用いられる複数のサブ領域に分割される画像領域を示す。 視差分布の後処理のブロック図を示す。 視差分布の後処理のブロック図を示す。 図8Aにおいて使用される非線形マッピングの入力と出力との関係の一例を示す。 画像境界における視差分布をどのように推定するかの例を示す。 画像境界における視差分布をどのように推定するかの例を示す。
好適な実施形態の詳細な説明に入る前に、図1及び図2に関する立体3D原理についての幾つかの一般的な背景情報、及び、本発明が適用される技術分野が最初に与えられる(図3A,図3B及び図4)。
特に、ある用語が本明細書において異なる意味で用いられるために生じ得る如何なる曖昧さも回避するために、こうした概論は以下で用いられる用語を定義する役割も果たす。
図1は、典型的な視聴時の幾何学的配置(viewing geometry)を概略的に示す。図1の左側にはディスプレイ平面が示され、符号10で表される。ディスプレイ平面は、3D映画を表示するために使用されるテレビ受像機の一部である。
図1の右側にはオブザーバの両目が概略的に示され、左目と右目との目距離はbで表される。オブザーバとディスプレイ平面10との間の距離はZで表され、典型的には1メートルから5メートルの範囲にある。
一般に知られているように、各3D画像は、交互に表示される右画像と左画像とを含む。オブザーバは、典型的には、例えば、ディスプレイ平面と同期されたシャッターメガネをかけて、オブザーバが、左画像を左目のみで、右画像を右目のみで見るようにする。
説明の目的のため、図1は、画像におけるオブジェクトを象徴する長方形を示す。3D知覚を達成するために、右画像におけるオブジェクト11は、左画像における当該オブジェクトに対して距離dだけシフトされ得る。換言すると、オブジェクト11は、右目及び左目についてディスプレイ平面上の異なる位置においてオブザーバに提示され得る。水平方向における右画像中のオブジェクトと左画像中のオブジェクトとの間の距離は、以下、「視差(disparity)」dと呼ばれる。この視差に応じて、オブザーバは、オブジェクトがディスプレイ平面の前方又はディスプレイ平面の後方にあるという印象を有する。
視差がゼロの場合、右画像中のオブジェクトは、左画像中のオブジェクトとディスプレイ上の同じ位置に表示されることを意味し、オブザーバは、ディスプレイ平面10においてオブジェクトを知覚する。
図1に示される例において、左画像中のオブジェクトは、ディスプレイの右半分において表示されるのに対して、右画像中のオブジェクトは、ディスプレイの左半分において表示される。この場合、視差は正であると見なされ、知覚されるオブジェクトはディスプレイ平面の正面に位置し、距離はz(深度範囲)で表される。視差dが小さくなる場合、知覚されるオブジェクトは、ディスプレイ平面に向かって動く。視差dが負になり次第、知覚されるオブジェクトはディスプレイ平面の後ろに位置する。
テレビ受像機のディスプレイは画素ベースであるという事実に起因して、視差の単位は、以下、画素である。これは、換言すると、1つの視差は、左画像が右画像に対して水平方向において1画素だけシフトされることを意味する。
図1から、ディスプレイ平面とオブザーバによって知覚されるオブジェクトとの間の距離zは、視差dの単調関数であることは明らかである。
理論上は、ディスプレイ平面に対する知覚されるオブジェクトの距離zは、正の視差についてはゼロとオブザーバの距離Zとの間の任意の値を、負の視差についてはゼロから無限大の任意の値をとり得る。特に、視差dがあまりにも大きくなる場合、オブザーバは頭痛を起こし得る。
この知識に起因して、いわゆる「コンフォートゾーン」が確立される。コンフォートゾーンは、知覚されるオブジェクトがこのゾーン内にある場合、オブザーバへの如何なる攪乱効果も生じさせない、ディスプレイ平面の前方及び後方の深度範囲を定義する。このコンフォートゾーンは、図2において符号12で表される。コンフォートゾーンは、ディスプレイ平面の前方のzmax及びディスプレイ平面の後方のzminに関する距離又は深度だけ広がる。コンフォートゾーンのより詳細な説明は、参照によって本明細書に組み込まれる上述した非特許文献1のチャプター5において見出し得る。
以下において、zminは負の値であり、zmaxは正の値であると見なされる。さらに、zminの絶対値とzmaxの絶対値とは等しいと見なされ、コンフォートゾーンはディスプレイ平面に対して対称であることを意味する。ただし、zminの絶対値とzmaxの絶対値とは同等でなくてもよいことに留意すべきである。コンフォートゾーンは、視聴時の幾何学的配置に依存し、当該視聴時の幾何学的配置は、ディスプレイサイズのような、使用中のテレビ受像機についてのあるパラメータと、視聴者の位置と、個人の瞳孔間距離とを含む。
コンフォートゾーンとテレビ受像機のパラメータとの間のこの従属関係に起因して、映画放送局が例えばコンフォートゾーンを定義するメタデータによって情報を供給することは殆ど不可能である。それ故に、供給される画像を処理し、視差をコンフォートゾーンに適合させる需要及び必要がある。つまり、換言すると、テレビ受像機は、コンフォートゾーンの外側にある全てのオブジェクトをコンフォートゾーン内へシフトさせるタスクを有する。深度zは視差dの単調関数であるので、そのような画像処理は、入力引数としての視差に基づき得る。特に、左画像と右画像との間の視差分布は、入力引数として用いられる。視差分布は、例えば、画像における最小視差及び最大視差を供給し、それ故に、コンフォートゾーン内へスケーリングされなければならない画像の最大深度範囲を供給する。
図3A及び図3Bにおいて、視差分布の2つの例が示される。図3Aにおいて、視差分布Pin(d)は、dmin及びdmaxによって表されるコンフォートゾーンの境界を越えて広がっている。視差範囲d1からd2がコンフォートゾーンの視差範囲よりも大きいことは明らかである。さらに、分布のメインエリア又は中心は、本例においてはディスプレイ平面であるコンフォートゾーンの中心からずれている(offset)。
それ故に、オブザーバに対する如何なる攪乱効果も回避するために、画像は、視差分布をコンフォートゾーン内に移動させるように処理されなければならない。この処理は、分布の中心をコンフォートゾーンの中心に移動させるシフティングステップと、視差範囲d1からd2をコンフォートゾーンの視差範囲DminからDmaxにスケーリングするスケーリングステップとを必要とする。このような画像処理の結果は、次いで、図3Bにおいて示される。この画像処理又は変換は、オブザーバによって知覚される全てのオブジェクトがコンフォートゾーンにある画像を提供する。
図4において、テレビジョン装置において使用される画像プロセッサの一部のブロック図が示され、符号40によって表される。画像プロセッサ40の1つのタスクは、前述したような画像変換を実行することである。そのために、画像プロセッサは、画像変換手段42を備える。画像変換手段42は、オリジナルの右画像及びオリジナルの左画像を入力として受け取る。画像変換手段42の出力は、変換された左画像及び変換された右画像である。
画像変換のための引数として、画像変換手段42は、視差分布Pin(d)を入力として受け取る。この視差分布を算出するために、画像プロセッサ40は、視差分析手段44を備え、当該視差分析手段44も、オリジナルの左画像及びオリジナルの右画像を入力として受け取る。
本願のテーマは、視差分析手段44によって処理された視差分布Pin(d)の提供である。画像変換は、譲受人の日本特許出願第2009−199139号(ソニー整理番号09900660)の一部であり、その内容は参照することによって本明細書に組み込まれるため、以下、これ以上は説明されないであろう。
以下においては、視差分析手段44、及び、特にその機能性が説明されるであろう。
図5は、視差分析手段44の一部のブロック図である。
視差分析手段44は、複数のセンターカット要素52を備え、1つは左画像を処理するため、1つは右画像を処理するためにある。センターカット要素52は、供給される画像をカットし又はトリミングして、画像幅を削減する機能を果たす。換言すると、センターカット要素52は、画像の左マージン及び右マージンを切除し、このマージンの幅は、Dmaxによって表される。センターカット要素52の出力は、オリジナルの幅Wに対して2×Dmaxだけ削減された画像幅を有する画像である。
視差分析手段44は、図5において右画像の信号経路に割り当てられる水平シフト要素53をさらに備える。シフト要素53は、シフト値Δdを入力引数として受け取り、供給される画像のシフトを水平方向においてΔd画素だけ実行する。Δdの符号に応じて、画像は左又は右へシフトされる。
視差分析手段は、センターカットされた左画像とセンターカットされ水平方向にシフトされた右画像とを入力として受け取る相関要素54も備える。相関要素54は、左画像と右画像とを画素単位で(pixelwise)比較するように適合される。画素単位での比較の結果は、次いで、閾値と比較される。比較結果の絶対値が閾値よりも小さい又は等しい場合、カウンタ信号が生成される。それ以外の場合、つまり、比較結果の絶対値が閾値よりも大きい場合、カウンタ信号は生成されない。カウンタ信号は、カウンタ信号を受け取る場合にカウンタを1だけ増加させるカウンタ要素56に供給される。カウンタ要素56の出力は、特定の視差Δdについての視差分布値である。
図5に示される視差分析手段は、本発明のコア原則を実装するように適合される。視差分析手段は、数個の異なるΔdの値について左画像と右画像とのペアの間の視差分布を推定することを可能とする。換言すると、この視差分析手段は、所定の範囲のΔdの値について画像ペアの画素マッチを判定して、所望の視差分布を得ることを可能とする。
ここで、図6A及び図6Bを参照しつつ、視差分析手段44によって実行される方法の詳細な説明が記載される。
図6Aは、左画像及び右画像のペアについての視差分布を判定するためのコア原則を説明する機能を果たすフロー図である。
まず、幾つかのパラメータが初期値に設定される。ブロック60において、視差シフト値は、Dminに設定される。この値Dminは、一般に負の値であり、画像において期待される最小視差に基づいて選択される。値Dminに並行して、最大視差値Dmaxも提供される。この値は、画像において期待される最大視差に基づいて判定され、通常、正符号を有する。好適な実施形態において、Dmin及びDmaxの絶対値が等しくなり、双方の値Dmin、Dmaxによって定義される範囲がゼロに対して対称となるように、Dminは−Dmaxに設定される。
さらに、カウンタ値はゼロに設定される(ブロック61)。カウンタ値は、カウンタ要素56において用いられる。また、ブロック61において、画像の2次元の画素アレイにおける特定の画素を記述するインデックス値x、yが設定される。yインデックスは、ゼロに設定され、xインデックスは、doffの値に設定される。この値doffは、(図5においてDmaxとして表される)カットオフマージンの幅を判定する。値doffは、Dmin及びDmaxの絶対値よりも大きい又は等しいべきである。好適な実施形態において、doffはDmaxに設定される。
次のステップ(ブロック62)において、相関ステップが実行される。この相関ステップは、左画像の画素値p(x,y)からの右画像の画素値p(x−Δd,y)の減算を含む。差の符号は考慮されるべきではないので、絶対値が算出され、以降のステップで用いられる。減算の差Δpの絶対値は、左画像と右画像との画素マッチの度合い(extent)を表す。換言すると、差Δpがゼロである場合、画像ペアにおける双方の画素は等しい。差Δpの絶対値が所定の閾値THRよりも大きい場合、双方の画素は一致しない。好適な実施形態において、所定の閾値THRは1である。
ブロック63において、差Δpの絶対値が評価され、当該絶対値が閾値THRよりも小さい場合、カウンタが1だけ増加される(ブロック64)。それ以外の場合、即ち、双方の画素が一致しない場合、カウンタは増加されない。
次に、ブロック65において、xインデックスが1だけ増加され、次いで、値W−doffと比較される。ここで、Wは、画像の幅である(ブロック66)。インデックスxがW−doffよりも小さい又は等しい場合、相関ステップは、同じ画素行における次の画素について繰り返される(即ち、yインデックスは不変のままである)。
画素アレイの1つの行における全ての画素を比較した後、上述したのと同じステップは、画像の画素アレイの次の行について繰り返される。従って、xインデックスは、doffに再び設定され、yインデックスは、1だけ増加される(ブロック67)。次いで、新たな行における全ての画素の相関がとられ(correlated)、画素マッチが判定される場合、カウンタは再び1だけ増加される。
図6Aから明らかなように、トリミングされた左画像の全ての画素は、Δdだけシフトされた画像部分の画素と相関がとられる。
画像の画素行の全てが処理されるとすぐに(ブロック68)、カウンタの値がアレイインデックスΔdについて視差分布アレイP(Δd)に記憶される(ブロック69)。次いで、視差シフト値が1だけ増加され、カウンタはゼロにリセットされる。次いで、上述された処理が、新たな視差シフト値Δdについて繰り返される。
DminからDmaxの範囲内におけるあらゆる値Δdについて処理が実行されるとすぐに、処理は終了され(ブロック70)、視差分布アレイP(DminからDmax)がさらなる処理のために出力される(ブロック71)。
図6Bは、画像ペアのどの画像領域の相関がとられる(あるいは、換言すると、一致する、又は比較される)のかを説明するために、3つの異なるシフト値の状況を示す。
第1の例は、視差シフト値Δd=Dmaxの状況を示す。既に前述したように、トリミングされた画像領域のみが相関(correlation)のために処理される(taken)。それ故に、画像のセンターカット領域74のみが使用されるように、左画像はマージン73だけトリミングされる。マージン73の幅は、doffで表される。
相関のために使用される右画像は、Dmaxだけシフトされ、この実施形態においてDmaxは正の値である。従って、左画像74の画像領域と同じサイズを有する画像領域が左へシフトされる。
この図から、マージンdoffの幅は、Dmaxの絶対値よりも大きく又は等しくなければならないのは明らかである。そうでなければ、シフトされた画像領域75の一部が有効領域の外部に位置するであろう。
第2の例において、視差シフト値Δdはゼロである。従って、相関について用いられる左画像領域74と右画像領域75とは、画像全体内における位置に関して同一である(identical)。換言すると、右画像の画像領域75はシフトされない。
第3の例において、視差シフト値ΔdはDminであり、Dminは負の値である。ここで、相関又はマッチングに用いられる画像領域75は、右へDmin画素だけシフトされる。
マージンdoffの幅はDmax及びDminの絶対値よりも大きく又は等しくなければならないことにも留意すべきである。そうでなければ、右画像のシフトされた領域75の一部が有効領域の外部に位置するであろう。
繰り返すが、図6Bは、発明の方法のコア原則、即ち、1つの画像の画像領域と他の画像のシフトされた画像領域とを相関させることを明瞭に説明する。相関(これは、通常、比較又はマッチングである)の結果は、用いられるシフト値について記憶される。次いで、好適には1画素だけさらにシフトされた他の画像の画像領域について、相関は繰り返される。処理は、他の画像の画像領域が視差シフト範囲の左境界(Dmin)から右境界(Dmax)までシフトされるまで繰り返される。
結果は、DminとDmaxとの間の全ての視差値についての視差分布である。
図6Bを参照すると、左画像は参照フレームとしての役割を果たし、相関が右画像において「探索される(searched)」ことに留意すべきである。ただし、他の実施形態において、右画像が参照フレームとしての役割を果たし、相関が左画像において探索されることもあり得る。既に前述したように、DminからDmaxまでの値を対称的な探索範囲を有するように設定することが好適である。
上述の相関の結果は、画像変換手段42に視差分布Pin(d)として供給される視差分布P(d)である(図4を参照)。
前述の詳細な説明から、相関が2つの画素値の減算を用いるだけの画素ベース演算(operation)であることは明らかである。結果として、視差分布を判定するための相関方法が非常に効率的に実装され得る。
相関の精度を増加させるために、上述された相関は、以下のように変更されることができる。
画像領域74、75全体について相関が実行される場合に起こり得る、異なる深度平面におけるより小さなオブジェクトに対応するピークのマスキングを回避するために、画像領域74、75は、複数のサブ領域又はサブウィンドウに分割される。図7において、画像領域74(マージン73無しの画像領域)は、9つの等しいサイズのサブ領域77に分割される。上述された相関は、9つの画像サブ領域の全てに適用される。その結果、相関は、画像サブ領域77ごとに1つずつ、9つの異なる視差分布を提供する。
画像サブ領域を用いることの利点は、例えば、個別のサブ領域視差分布を結合して、画像変換手段42に供給されるトータル視差分布とする場合、個別のサブ領域視差分布に異なる重みづけができることである。
画像サブ領域を用いることのさらなる利点は、いわゆるオブジェクトフレームバイオレーション、即ち、画像平面の正面に位置付けられるが、画像境界によってカットされるオブジェクトは、最上部の行及び/又は最下部の行のサブ領域のそれぞれのサブ領域視差分布に基づいて検出されてもよい。
図8及び図9を参照しつつ、図7に示されるサブ領域の視差分布の後処理が説明される。
図8Aは、図5に示される視差分析手段の一部によって供給される視差分布の後処理に用いられる視差分析手段の一部のブロック図を示す。画像サブ領域についての視差分布PW,k(d)は、正規化(normalizing)要素81に供給される。正規化要素81は、各視差分布PW,k(d)を正規化して、発生値又は疑似確率値(occurrence or pseudo-probability value)Pがインターバル0から1にマッピングされるように適合される。つまり、各画像サブ領域についての視差分布は、0と1との間の値のみを含む。
サブ領域Plin,kについての正規化された視差分布は、次いで、非線形マッピング要素82に供給される。正規化された視差分布は、大きな疑似確率値よりも小さな疑似確率値を効果的に低減させる非線形単調関数によって変換される。
非線形マッピング要素82の出力Pnl,kは、次いで、非正規化要素83に供給される。この要素は、正規化要素81によって行われる正規化の反転によって視差分布Pnl,kを非正規化する。その結果は、各画像サブ領域についての視差分布Pnw,k(d)として出力される。
サブ領域についての後処理された視差分布Pnw,k(d)は、次いで、好適には加算要素86である結合要素85によって結合される。結合要素85によって出力される結果は、立体入力画像ペア(stereoscopic input image pair)についての推定される視差分布を表す単一の分布Pin(d)であり、これは画像変換手段42に供給される。N個のサブ領域視差分布の入力を有する結合要素85は、図8Bに示される。
前述したように、非線形マッピング要素82は、非線形単調関数を用いる。そのような関数の一例は、図9に示される。パラメータQは、マッピング結果を重みづけするために用いることができる。一実施形態において、1の値がQに割り当てられる。別の実施形態において、弱い画像構造のみを有するサブ領域からの測定値を低減し又は排除するために、値Qは、例えば正規化された分布のバリアント(variants)又はその導関数(derivative)に応じて、適応的に判定される。従って、パラメータQについての好適な値の範囲は、値0から値1までの範囲である。図9に示される図から、小さな値Plin,kが0に近い値まで大幅に低減される一方で、1に近いより大きな値が低減されないことが明らかである。
相関のために用いられる画像領域が左境界及び右境界においてトリミングされることを上記で指摘した。さらに、図6Bに関して、探索が画像境界の外側に拡大する可能性に起因して、視差範囲全体を用いることはできないことが示された。特に、図6Bに示される例において、DminとDmaxとの間の全ての視差シフト値について、左画像領域が参照領域として用いられた。しかしながら、境界(左又は右)及び探索視差(search disparity)の符号に応じて、左画像及び右画像における参照領域74及びマッチ領域75の役割を切り替えることも可能である。
図10Aにおいて、参照領域及びマッチ領域は、視差シフト範囲の正のローブに示される。
図10Bにおいて、参照領域及びマッチ領域は、視差探索範囲の負のローブに示され、図10Cは、図10A及び図10Bに従って正のローブ及び負のローブから構築される(assembled)、結果として得られる完全な境界視差分布を表示する。
特に、図10a〜図10cは、Dminが0よりも小さく、且つ、Dmaxが0よりも大きい場合の、DminからDmaxまでの全範囲について左映像境界及び右映像境界における視差分布の算出を表現する。左画像境界及び右画像境界における視差分布を推定するために用いられる有効測定領域(effective measurement area)も示されている。探索が画像境界の外部の領域に拡大する可能性に起因して、図6に示されるアプローチを全視差範囲について用いることはできないため、境界(左又は右)及び探索視差dの符号に応じて、左画像及び右画像における基準領域及び探索領域の役割が切り換えられる。図10aは、視差探索範囲の正のローブについての基準領域及びマッチ領域を示す。図10bは、視差探索範囲の負のローブについての基準領域及びマッチ領域を示し、図10cは、正のローブ及び負のローブから構築される、結果として得られる完全な境界視差分布を示す。
画像ペアの視差分布を推定するための上記の方法は、修正された左視野及び右視野を含む、即ち、固有の視聴の幾何学的配置(inherent view geometry)のエピポーラ線が画像行と並べられた(aligned)、立体的なマテリアルに適する。さらに、左視野及び右視野は、等しい露出及び輝度を有するべきである。これらの要件はステレオスコピックディスプレイ(stereoscopic display)上の最良の描写を確保するが、これらは依然として今日のコンテンツの大部分によって侵されている。
従って、提案され、上述される方法は、左視野と右視野との間のグローバルイルミネーションの差をまず補償する前処理手段も含むことができる。次に、左相関画像と右相関画像との間の垂直シフト(vertical shift)は、各相関領域について判定される。最後に、水平分布が上述したように推定される。
本発明の主な利点をまとめると、上記の単純なアプローチよりも計算的により効率的である。さらに、単純なアプローチよりも複雑度が低い。そのため、ベクトル化された計算ユニット(例えば、VLIW、CELL)を有するプロセッサのためのソフトウェア又はハードウェア(ASIC)に、より簡単に実装することができる。また、発明の方法は、周期的な(periodic)構造を提示する(exposes)コンテンツについて、単純なアプローチよりもロバストである。
本発明は、図面及び前述の説明において詳細に図解され、説明されたが、そのような図解及び説明は実例又は例示的なものとして考慮されるべきであって、限定的なものではない。本発明は、開示される実施形態に限定されない。開示される実施形態の他のバリエーションは、図面、開示内容、及び添付の特許請求の範囲から、請求項に記載された発明の実施をする際に当業者によって理解され、達成されることができる。
特許請求の範囲において、「含む/備える(comprising)」という用語は、他の要素又はステップを排除せず、不定冠詞「a」又は「an」は、複数を排除しない。単一の要素又は他のユニットが、特許請求の範囲に記載される幾つかのアイテムの機能を実現し得る。ある方策(measures)が互いに異なる従属項において記載されるという単なる事実は、これらの方策の組み合わせを有利に用いることができないということを表さない。
特許請求の範囲における如何なる符号も、その範囲を限定するものとして解釈されるべきではない。

Claims (42)

  1. 各画像が画素のアレイを有する、立体3D映像の左画像と右画像との間の視差分布を推定するための方法であって、
    視差の最大範囲(Dmin及びDmax)を提供するステップと、
    左画像領域(74)と右画像領域(75)との双方の画像のうちの一方が視差シフト値(Δd)だけシフトされた状態で、左画像領域(74)と右画像領域(75)との相関をとるステップと、
    前記相関の結果は、双方の画像の間の画像マッチの指標であることと、
    視差の最大範囲(Dmin、Dmax)内における視差シフト値(Δd)のセットについて前記相関をとるステップを繰り返すステップと、
    前記相関の前記結果から前記視差分布を得るステップと、
    を含む、方法。
  2. 前記視差シフト値のセットは、前記視差の最大範囲内の全ての整数値を含み、前記視差シフト値及び前記視差の最大範囲の単位は、画素である、請求項1に記載の方法。
  3. 相関をとることに用いられる前記画像領域(74、75)は、一方の前記画像領域とシフトされた他方の前記画像領域とが重複する領域である、請求項1又は請求項2に記載の方法。
  4. 相関をとることのための前記左画像領域と前記右画像領域とは、これらの左境界と右境界とにおいて、値(doff)だけトリミングされ、当該値(doff)は好適には前記視差の最大範囲に対応する、先行する請求項のいずれか1項に記載の方法。
  5. 前記相関をとるステップは、
    双方の画像領域を互いに画素単位で比較することと、
    前記比較の結果に応じてカウンタを増加させることと、を含み、
    前記カウンタは、双方の画像領域についての画素値の一致を表し、双方の画像領域の一方は、前記視差シフト値だけシフトされている、
    先行する請求項のいずれか1項に記載の方法。
  6. 双方の画像領域を画素単位で比較する前記ステップは、双方の画像領域のうちの一方の各画素の値を他方の前記画像領域の各画素の値から減算するステップを含む、請求項5に記載の方法。
  7. 前記比較の前記結果の絶対値が所定の閾値よりも小さい場合、前記カウンタが増加される、請求項5又は請求項6に記載の方法。
  8. 前記閾値として1が選択される、請求項7に記載の方法。
  9. 前記画像領域は、互いに対して水平にシフトされる、先行する請求項のいずれか1項に記載の方法。
  10. 前記左画像領域及び前記右画像領域(74、75)は、複数のサブ領域(77)に分割され、前記相関をとるステップは、視差分布が全ての画像サブ領域(77)について得られるように、各サブ領域について別々に実行される、先行する請求項のいずれか1項に記載の方法。
  11. 前記サブ領域の前記視差分布は、単一の分布に結合される、請求項10に記載の方法。
  12. 前記サブ領域(77)の数は9である、請求項10又は請求項11に記載の方法。
  13. 各サブ領域が構造化された要素を含むかを分析するステップを含む、請求項10、請求項11又は請求項12に記載の方法。
  14. 前記分析の結果に応じて各サブ領域についての重み係数を判定するステップを含み、当該重み係数は前記視差分布の前記結合に用いられる、請求項13に記載の方法。
  15. 前記サブ領域視差分布を結合する前に非線形伝達関数を各サブ領域視差分布に適用して、大きなピークを強調し、小さなピーク及びノイズを低減するステップ、
    を含む、請求項10〜14のいずれか1項に記載の方法。
  16. 前記視差分布を結合するステップは、前記サブ領域視差分布を加算するステップを含む、請求項11に記載の方法。
  17. サブ領域視差分布のセットが結合される、請求項10〜16のいずれか1項に記載の方法。
  18. 前記サブ領域視差分布のセットは、画像境界に位置付られるサブ領域に関連するサブ領域視差分布のみを含む、請求項17に記載の方法。
  19. 前記サブ領域視差分布のセットは、境界バイオレーションを探索するために用いられる、請求項18に記載の方法。
  20. 左画像と右画像との間のグローバルイルミネーションの差を補償するステップと、及び/又は、
    前記左画像領域と前記右画像領域との間の垂直シフトを判定するステップと、
    双方のステップは前記相関をとるステップの前に実行されることと、
    を含む、請求項1〜19のいずれか1項に記載の方法。
  21. 各画像が画素のアレイを有する、立体3D映像の左画像と右画像との間の視差分布を推定するための装置であって、
    双方の画像領域のうちの一方が視差シフト値だけシフトされた状態で、左画像領域と右画像領域との相関をとり、当該相関の結果は、双方の画像の間の画素マッチの指標であり、
    所与の視差の最大範囲内における視差シフト値のセットについて前記相関を繰り返し、
    前記相関の前記結果から前記視差分布を得て、
    前記得られた視差分布を出力する、
    ように適合される推定装置(44)、
    を備える、装置。
  22. 前記視差シフト値のセットは、前記視差の最大範囲内における全ての整数値を含み、前記視差シフト値及び前記視差の最大範囲の単位は、画素である、請求項21に記載の装置。
  23. 相関をとることに用いられる前記画像領域は、一方の前記画像領域とシフトされた他方の前記画像領域とが重複する領域である、請求項21又は請求項22に記載の装置。
  24. 前記推定装置(44)は、相関をとることのために、前記左画像領域と前記右画像領域とを、これらの左境界と右境界とにおいて、前記の最大範囲に対応する値だけトリミングするように適合される、請求項21〜23のいずれか1項に記載の装置。
  25. 前記推定装置(44)は、
    双方の画像領域を互いに画素単位で比較し、
    前記比較の結果に応じてカウンタを増加させ、前記カウンタは、双方の画像領域についての画素値の一致を表し、双方の画像領域の一方は、前記視差シフト値だけシフトされている、
    ようにさらに適合される、請求項21〜24のいずれか1項に記載の装置。
  26. 前記推定装置(44)は、双方の画像領域のうちの一方の各画素の値を他方の前記画像領域の各画素の値から減算するようにさらに適合される、請求項25に記載の装置。
  27. 前記推定装置(44)は、前記比較の前記結果の絶対値が所定の閾値よりも小さい場合、前記カウンタを増加させるように適合される、請求項25又は請求項26に記載の装置。
  28. 前記閾値として1が選択される、請求項27に記載の装置。
  29. 前記画像領域は、互いに対して水平にシフトされる、請求項21〜28のいずれか1項に記載の装置。
  30. 前記推定装置(44)は、前記左画像領域及び前記右画像領域を複数のサブ領域に分割し、全ての画像サブ領域について視差分布が得られるように、各サブ領域の相関を別々にとるように適合される、請求項21〜29のいずれか1項に記載の装置。
  31. 前記推定装置(44)は、前記サブ領域の前記視差分布を単一の分布に結合させるように適合される、請求項30に記載の装置。
  32. 前記サブ領域の数は9である、請求項30又は請求項31に記載の装置。
  33. 前記推定装置(44)は、各サブ領域が構造化された要素を含むかを分析するように適合される、請求項30、請求項31又は請求項32に記載の装置。
  34. 前記推定装置(44)は、前記分析の結果に応じて各サブ領域についての重み係数を判定するステップを含み、当該重み係数は、前記視差分布の前記結合に用いられるように適合される、請求項33に記載の装置。
  35. 前記推定装置(44)は、前記サブ領域視差分布を結合する前に非線形伝達関数を各サブ領域視差分布に適用して、大きなピークを強調し、小さなピーク及びノイズを低減するように適合される、請求項30〜34のいずれか1項に記載の装置。
  36. 前記推定装置(44)は、前記視差分布を結合するために前記サブ領域視差分布を加算するように適合される、請求項31に記載の装置。
  37. 前記推定装置(44)は、サブ領域視差分布のセットを結合するように適合される、請求項30〜36のいずれか1項に記載の装置。
  38. 前記サブ領域視差分布のセットは、画像境界に位置付られるサブ領域に関連するサブ領域視差分布のみを含む、請求項37に記載の装置。
  39. 前記推定装置(44)は、ASICとして提供される、請求項21〜38のいずれか1項に記載の装置。
  40. 立体3D映像を記録、処理及び/又は表示するための装置であって、請求項21〜39のいずれか1項に記載の装置を備える、装置。
  41. 前記装置は、テレビ受像機、静止画像カメラ装置、ビデオカメラ装置、メディアプレーヤ装置、ゲーム機、コンテンツポストプロダクションシステムのうちの1つである、請求項40に記載の装置。
  42. デジタルシステムの内部メモリにロード可能なコンピュータプログラムプロダクトであって、当該システム上で実行される場合に、当該システムが請求項1〜20のいずれか1項に記載の方法を実行することを可能とするソフトウェアコード部を備える、コンピュータプログラムプロダクト。
JP2012555428A 2010-03-05 2011-03-03 3dtvのための視差分布推定 Withdrawn JP2013521686A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10155576.1 2010-03-05
EP10155576 2010-03-05
PCT/EP2011/053204 WO2011107550A1 (en) 2010-03-05 2011-03-03 Disparity distribution estimation for 3d tv

Publications (1)

Publication Number Publication Date
JP2013521686A true JP2013521686A (ja) 2013-06-10

Family

ID=43733172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012555428A Withdrawn JP2013521686A (ja) 2010-03-05 2011-03-03 3dtvのための視差分布推定

Country Status (5)

Country Link
US (1) US20120307023A1 (ja)
EP (1) EP2543196A1 (ja)
JP (1) JP2013521686A (ja)
CN (1) CN102783161A (ja)
WO (1) WO2011107550A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008106185A (ja) * 2006-10-27 2008-05-08 Shin Etsu Chem Co Ltd 熱伝導性シリコーン組成物の接着方法、熱伝導性シリコーン組成物接着用プライマー及び熱伝導性シリコーン組成物の接着複合体の製造方法
JP2012205267A (ja) * 2011-03-28 2012-10-22 Sony Corp 表示制御装置、表示制御方法、検出装置、検出方法、プログラム、及び表示システム
US8891854B2 (en) * 2011-03-31 2014-11-18 Realtek Semiconductor Corp. Device and method for transforming 2D images into 3D images
KR101275823B1 (ko) * 2011-04-28 2013-06-18 (주) 에투시스템 복수의 카메라를 이용한 3차원 물체 검출장치 및 방법
JP2013005259A (ja) * 2011-06-17 2013-01-07 Sony Corp 画像処理装置、および画像処理方法、並びにプログラム
PL397016A1 (pl) * 2011-11-17 2013-05-27 Politechnika Poznanska Sposób kodowania glebi stereoskopowej
JP6158929B2 (ja) * 2012-09-06 2017-07-05 ノキア テクノロジーズ オーユー 画像処理装置、方法及びコンピュータプログラム
US9681122B2 (en) * 2014-04-21 2017-06-13 Zspace, Inc. Modifying displayed images in the coupled zone of a stereoscopic display based on user comfort
EP3241349A4 (en) * 2014-12-31 2018-08-15 Nokia Corporation Stereo imaging
CN106651833B (zh) * 2016-10-12 2020-07-03 成都西纬科技有限公司 一种确定最大视差的方法
CN106982365B (zh) * 2016-10-26 2019-03-26 万云数码媒体有限公司 一种基于离散概率分布自适应立体深度调整的方法
CN110889866A (zh) * 2019-12-04 2020-03-17 南京美基森信息技术有限公司 一种深度图的背景更新方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5179441A (en) * 1991-12-18 1993-01-12 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Near real-time stereo vision system
US6163337A (en) * 1996-04-05 2000-12-19 Matsushita Electric Industrial Co., Ltd. Multi-view point image transmission method and multi-view point image display method
US5652616A (en) * 1996-08-06 1997-07-29 General Instrument Corporation Of Delaware Optimal disparity estimation for stereoscopic video coding
JP2002223458A (ja) * 2001-01-26 2002-08-09 Nippon Hoso Kyokai <Nhk> 立体映像作成装置
KR100667810B1 (ko) * 2005-08-31 2007-01-11 삼성전자주식회사 3d 영상의 깊이감 조정 장치 및 방법
KR101345303B1 (ko) * 2007-03-29 2013-12-27 삼성전자주식회사 스테레오 또는 다시점 영상의 입체감 조정 방법 및 장치
JP4827866B2 (ja) 2008-02-19 2011-11-30 セイコープレシジョン株式会社 パケット監視装置

Also Published As

Publication number Publication date
CN102783161A (zh) 2012-11-14
WO2011107550A1 (en) 2011-09-09
US20120307023A1 (en) 2012-12-06
EP2543196A1 (en) 2013-01-09

Similar Documents

Publication Publication Date Title
JP2013521686A (ja) 3dtvのための視差分布推定
US8588514B2 (en) Method, apparatus and system for processing depth-related information
US9270970B2 (en) Device apparatus and method for 3D image interpolation based on a degree of similarity between a motion vector and a range motion vector
EP2274920B1 (en) System and method for measuring potential eyestrain of stereoscopic motion pictures
US9338426B2 (en) Three-dimensional image processing apparatus, three-dimensional imaging apparatus, and three-dimensional image processing method
KR20110086079A (ko) 입력 3차원 비디오 신호를 프로세싱하는 방법 및 시스템
JP5663857B2 (ja) 画像表示装置および画像表示方法
TWI491244B (zh) 調整物件三維深度的方法與裝置、以及偵測物件三維深度的方法與裝置
US10554954B2 (en) Stereoscopic focus point adjustment
US9591290B2 (en) Stereoscopic video generation
US9693042B2 (en) Foreground and background detection in a video
Silva et al. A no-reference stereoscopic quality metric
US9674500B2 (en) Stereoscopic depth adjustment
KR101939243B1 (ko) 입체 깊이 조정 및 초점 조정
WO2015191768A1 (en) Stereoscopic video zooming and foreground and background detection in a video
US9661309B2 (en) Stereoscopic video zooming
JP6056459B2 (ja) 奥行き推定データ生成装置、擬似立体画像生成装置、奥行き推定データ生成方法及び奥行き推定データ生成プログラム
Kim Post-processing of multiview images: Depth scaling

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140513