JP4419139B2 - 奥行き信号生成装置、奥行き信号生成プログラム、擬似立体画像生成装置、及び擬似立体画像生成プログラム - Google Patents

奥行き信号生成装置、奥行き信号生成プログラム、擬似立体画像生成装置、及び擬似立体画像生成プログラム Download PDF

Info

Publication number
JP4419139B2
JP4419139B2 JP2004376019A JP2004376019A JP4419139B2 JP 4419139 B2 JP4419139 B2 JP 4419139B2 JP 2004376019 A JP2004376019 A JP 2004376019A JP 2004376019 A JP2004376019 A JP 2004376019A JP 4419139 B2 JP4419139 B2 JP 4419139B2
Authority
JP
Japan
Prior art keywords
image
depth
basic
scaling
depth signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004376019A
Other languages
English (en)
Other versions
JP2006186511A (ja
Inventor
博哉 中村
邦男 山田
晃也 末廣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2004376019A priority Critical patent/JP4419139B2/ja
Publication of JP2006186511A publication Critical patent/JP2006186511A/ja
Application granted granted Critical
Publication of JP4419139B2 publication Critical patent/JP4419139B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は、奥行き信号生成装置、奥行き信号生成プログラム、擬似立体画像生成装置、及び擬似立体画像生成プログラムに係り、特に通常の静止画もしくは動画、即ち奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない画像(非立体画像)から擬似的な奥行き信号を生成する奥行き信号生成装置、奥行き信号生成プログラム、さらに擬似立体画像を生成する擬似立体画像生成装置、擬似立体画像生成プログラムに関する。
奥行き信号生成装置
立体表示システムにおいては、非立体画像の擬似立体視による鑑賞を可能にするために、通常の静止画もしくは動画、即ち立体を表す為の奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない画像(非立体画像)から、擬似的な立体化画像を生成する処理が行われる。
また、立体視に限らず前記非立体画像のシーンから立体構造を推定し、画像の合成や仮想的な視点移動を実現しようというアプローチは数多く研究・検討がなされている(例えば、非特許文献1参照)。この非特許文献1記載のツァー・インツー・ザ・ピクチャ(Tour Into the Picture)法では、撮影済みの画像から近影物を除去し、遠近法における消失点を決定した上で、それを基にシーンの概略的な構成を推定して視点移動を行うことを可能にしている。
また、前記非特許文献1では奥行き構造が長方形を断面とするチューブ状になっているのに対して、奥行きに応じた輪郭線を断面とするチューブを構成することを前提とする遠近法ベースのアプローチによる非立体画像から立体画像への変換方法も従来から知られている(例えば、特許文献1参照)。この特許文献1記載の発明は、メッシュ画像データに輪郭線の距離情報を付加して三次元ポリゴン立体データを形成し、この三次元ポリゴン立体データに写真画像から得たカラー画像データを適用して、三次元ポリゴン立体データにより構成される三次元ポリゴン立体の内側にカラー画像データを貼り付ける態様に、前記三次元ポリゴン立体をレンダリング処理して三次元画像データを得るようにしたものである。
また、古典的な非立体画像から立体画像への変換手法として、シェープ・フロム・モーション("shape from motion")法が知られている(例えば、非特許文献2参照)。これは、動画像の動き情報から画像の奥行き量を推定し、この奥行き量を用いて立体画像を構成するというものである。
さらに、非立体画像をブロック状に分割し、それぞれについて輝度積算、高周波成分積算、輝度コントラスト算出、彩度積算の計算を行うことにより画像の奥行き量を推定する手法も開示されている(例えば、特許文献2参照)。
Y.Horry, K.Anjyo, K.Arai:"Tour Into the Picture:Using a Spidery Mesh Interface to Make Animation from a Single Image",SIGGRAPH'97 Proceedings,pp.225-232(1997) C.Tomasi and T.Kanade: "Shape and Motion from Image Streams under Orthography: A Factorization Method", Int. Journal of Computer Vision.Vol.9,No.2, pp.137-154(1992) 特開平9−185712号公報 特許3005474号
しかしながら、前記非特許文献1のツァー・インツー・ザ・ピクチャ法や特許文献1の手法は、遠近法を基本としており、実際には入力されるさまざまな非立体画像のすべてのシーンに対して遠近法的な構造推定が適合するわけではないので、効果は限定的である。
また遠近法的な構造推定が適合する場合であっても自動的に正しい奥行き構造モデルを構成して違和感の無い立体視を実現させることは容易ではない。
また、前記非特許文献2のような、動画像の動き情報を基本とするシェープ・フロム・モーション法では、連続する動画像間の画像相関性を利用するために、静止画もしくは相対的に動きが停止している動画像の立体化は原理的に困難である。更に、動画像の動き情報から画像の奥行き量を推定する処理は、処理内容が複雑であり、動画像のリアルタイム性を損なわずに立体画像を表示し続けるには高速な処理装置、及び処理プログラムの実現手段が必要となる。
更に特許文献2の手法では、画像の奥行き量をブロック単位で得る構成のため、各ブロックの境界付近で不自然な立体画像となりやすい。そして、この不自然な立体画像は。補正や内挿を施す処理を行ったとしても、ブロック境界を意識しない画素単位での自然な立体映像を得ることは困難である。
本発明は以上の課題を鑑みてなされたものである。
本発明は、高速処理を必要とする動画像間の相関性を用いずに、独立した1枚の画面内の情報のみを用いて、かつ簡便な処理によって、自然な擬似立体画像を生成することを可能とするための、奥行き信号生成装置、及び奥行き信号生成プログラム、擬似立体画像生成装置、擬似立体画像生成プログラムを提供することを目的とする。
そこで上記課題を解決するために本発明は、以下の装置及びプログラムを提供するものである。
(1)奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない非立体画像から擬似立体映像を生成するための奥行き信号を生成する奥行き信号生成装置であって、
基本となる複数のシーン構造のそれぞれについて奥行き値を示す複数の基本奥行きモデルを記憶する、及び/又は所定の計算式より算出して得る複数の基本奥行きモデルを記憶する記憶手段(6、7、8)と、
入力する前記非立体画像の画像サイズを前記基本奥行きモデルの画像サイズと同一になるようにスケーリングする第一のスケーリング手段(2)と、
前記第一のスケーリング手段にてスケーリングした非立体画像の画面内の所定領域における画素値の統計量を算出して、前記複数の基本奥行きモデルの合成比率を決定する合成比率決定手段(3、4、5)と、
前記記憶手段から読み出した前記複数の基本奥行きモデルを、前記合成比率決定手段により決定した値に応じた合成比率で合成して合成基本奥行きモデルを生成する合成手段(9)と、
前記合成手段により合成した合成基本奥行きモデルと、前記第一のスケーリング手段によりスケーリングした非立体画像を用いて奥行き信号を生成する奥行き信号生成手段(10)と、
前記奥行き信号生成手段にて生成した前記奥行き信号の画像サイズを、前記入力する非立体画像の画像サイズと同一になるようにスケーリングする第二のスケーリング手段(11)と、
を有することを特徴とする奥行き信号生成装置。
(2)奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない非立体画像から擬似立体画像を生成する擬似立体画像生成装置であって、
上記(1)に記載の奥行き信号生成装置の第二のスケーリング手段から供給するスケーリングした奥行き信号に応じて前記非立体画像のテクスチャのシフトを対応部分の奥行きに応じた量だけ行うことによって左目用画像および/または右目用画像となる別視点画像を生成する別視点画像生成手段(12、13、14)を有し、
前記別視点画像生成手段により生成した別視点画像と、前記非立体画像との一方を左目用画像とし、他方を右目用画像として出力することを特徴とする擬似立体画像生成装置。
(3)奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない非立体画像から擬似立体映像を生成するための奥行き信号を生成する機能をコンピュータに実現させる奥行き信号生成プログラムであって、
入力する前記非立体画像の画像サイズを前記基本奥行きモデルの画像サイズと同一になるようにスケーリングする第一のスケーリング機能(S2)と、
前記第一のスケーリング機能にてスケーリングした非立体画像の画面内の所定領域における画素値の統計量を算出して、前記複数の基本奥行きモデルの合成比率を決定する合成比率決定機能(S3、S4、S5)と、
擬似立体画像を生成するための基本となり所定の計算式で求められる、複数のシーン構造のそれぞれについて奥行き値を示す複数の基本奥行きモデルを、前記合成比率決定機能により決定した値に応じた合成比率で合成して合成基本奥行きモデルを生成する合成機能(S6)と、
前記合成機能により合成した合成基本奥行きモデルと、前記第一のスケーリング機能によりスケーリングした非立体画像を用いて、奥行き信号を生成する奥行き信号生成機能(S7)と、
前記奥行き信号生成機能にて生成した前記奥行き信号の画像サイズを、前記入力する非立体画像の画像サイズと同一になるようにスケーリングする第二のスケーリング機能(S8)と、
をコンピュータに実現させる奥行き信号生成プログラム。
(4)奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない非立体画像から擬似立体画像を生成する機能をコンピュータに実現させる擬似立体画像生成プログラムであって、
上記(3)に記載の奥行き信号生成プログラムの第二のスケーリング機能から供給するスケーリングした奥行き信号に応じて前記非立体画像のテクスチャのシフトを対応部分の奥行きに応じた量だけ行うことによって左目用画像および/または右目用画像となる別視点画像を生成する別視点画像生成機能(S9、S10、S11)を有し、
前記別視点画像生成機能により生成した別視点画像と前記非立体画像との一方を左目用画像とし、他方を右目用画像として出力する機能をコンピュータに実現させる擬似立体画像生成プログラム。
本発明の奥行き信号生成装置、及び奥行き信号生成プログラムによれば、ツァー・インツー・ザ・ピクチャ法などで用いている遠近法的な推定を行なうことなしに奥行き信号を生成するので、遠近法を適合できないシーンにおいても、違和感の無い擬似立体映像を得るための奥行き信号を生成することができる。
また、高速処理が必要となる動画像間の画像相関性の評価を用いずに、奥行き信号生成の対象となる一枚の非立体画像(静止画像・動画の場合1フレームまたは1フィールド)を基本にして奥行き信号を生成するので、処理が単純になり、動画像のリアルタイム処理の実現に有利となる。
また、基本奥行きモデルを参照して奥行き信号を生成するので、生成処理が簡便となる。
更に、画像を明確なブロックとして分けずに奥行き信号を生成するので、各ブロックの境界付近で不自然な立体画像となること無しに自然な擬似立体映像を得るための奥行き信号を生成することができる。
更に加えて、奥行き信号を生成する際に入力する静止画像のサイズを前記奥行き基本モデルのサイズと同一にスケーリングすることで、前記奥行き基本モデルのサイズを固定でき、入力画像のサイズ毎に奥行き基本モデルを用意する必要が無いのでフレームメモリを削減できる。
また、本発明の擬似立体画像生成装置、擬似立体画像生成プログラムによれば、前記奥行き信号生成装置、及び奥行き信号生成プログラムによって生成した奥行き信号を用いて、どのような非立体画像からも違和感の少ない擬似立体画像を生成することができる。
<装置の構成>
次に、本発明を実施するための最良の形態について図面と共に説明する。図1は本発明の、奥行き信号生成装置、及び前記奥行き信号生成装置を内部に備える擬似立体画像生成装置の一実施の形態のブロック図である。また、図2は本発明の、奥行き信号生成装置を含んだ擬似立体画像生成装置の一実施の形態の処理の流れを示すフローチャートである。
図1において、本実施の形態の奥行き信号生成装置15は、擬似立体化を行う非立体画像が入力される画像入力部1と、画像入力部1からの非立体画像を縮小または拡大するスケーリング部2と、スケーリング部2からの非立体画像の上部約20%の高域成分評価値を計算により求める上部の高域成分評価部3と、スケーリング部2からの非立体画像の下部約20%の高域成分評価値を計算により求める下部の高域成分評価部4と、前記上部の高域成分評価値と前記下部の高域成分評価値とを基に、擬似立体画像を生成する際の基本モデルである3種類の基本奥行きモデルの合成比率を決定する合成比率決定部5と、前記3種類の基本奥行きモデルを記憶する3つのフレームメモリ6、7及び8と、合成比率決定部5で決定した合成比率により、フレームメモリ6、7及び8から読み出す前記3種類の基本奥行きモデル画像を合成する奥行きモデル合成部9と、奥行きモデル合成部9により得られた合成基本奥行きモデル画像に、画像入力部1の基になる画像の三原色信号(RGB信号)のうちの赤色信号(R信号)を重畳し奥行き信号を得る加算器10と、奥行き信号を拡大または縮小し、入力画像と同じサイズにスケーリングし、最終的な奥行き信号を得るスケーリング部11と、より構成している。
また、本実施の形態の擬似立体画像成装置は、前記奥行き信号生成装置15と、前記奥行き信号生成装置15で生成した奥行き信号に応じて、入力される非立体画像のテクスチャをシフトするテクスチャシフト部12と、オクルージョンを補償するオクルージョン補償部13と、ポスト処理をおこなうポスト処理部14と、より構成している。
<基本奥行きモデル>
ここで、基本奥行きモデルについて説明する。
基本奥行きモデルとは、非立体画像から擬似立体画像を生成するための画像の奥行き情報を生成する為に参照する、予め経験知から得られている基本的な奥行き情報を持った複数の画像モデルである。擬似立体画像を生成する対象の非立体画像のシーンを分析して、そのシーンの立体的特徴が、前記複数の基本奥行きモデルにどの程度合致するかの比率を求めて、その比率に従って各基本奥行きモデルの画素毎の奥行き量を合成した合成奥行きモデルを、奥行き信号生成に用いる。ここで言うところのシーンの立体的特徴とは具体的には、前記上部の高域成分評価値と前記下部の高域成分評価値とのことである。
図3は、前記基本奥行きモデルを表すための座標系を示した図である。基本奥行きモデル画像の中心を座標の原点とするxy平面に画素を配置し、z軸方向を各画素毎の奥行き量とする。
本実施例では3種類の基本奥行きモデルを使用している。以下各基本奥行きモデルについて詳細に説明する。
[タイプA]
基本奥行きモデルタイプAは、図3の座標系によれば各画素毎の奥行き量zは数式1で表される。rは球の半径、wは基本奥行きモデルAの画像の水平サイズ、hは基本奥行きモデルAの画像の垂直サイズであるとする。
ここで、画像サイズが水平640画素、垂直480画素の基本奥行きモデルの例では、水平サイズw=640、h=480となり、半径r=1000となる。
前記数式1で算出した奥行き情報を輝度値としてグレイスケールで表した例を図4に示す。ここでは、前記数式1で算出される奥行きzを255−2×zで正規化し、0から255の8ビットで表している。値0(暗い)が最も奥行きが深く、255(明るい)が最も奥行きが浅いことを示す。また図5は奥行き量を加味した立体構造を示した図である。
この基本奥行きモデルタイプAでこのような凹面を使用する理由は、基本的にオブジェクトが存在しないシーンにおいては画面中央を一番遠距離に設定することにより違和感の少ない立体感及び適度な奥行き感が得られるからである。基本奥行きモデルタイプAが使用されるシーン構成の一例として、図6のようなシーンがあげられる。
[タイプB]
基本奥行きモデルタイプBは、図3の座標系によれば各画素毎の奥行き量zは数式2で表される。rは円筒、及び球の半径、wはモデル画像の水平サイズ、hはモデル画像の垂直サイズである。
ここで、画像サイズが水平640画素、垂直480画素の基本奥行きモデルの例では、水平サイズw=640、h=480となり、半径r=1000となる。
前記数式2で算出した奥行き情報を輝度値としてグレイスケールで表した例を図7に示す。ここでは、前記数式2で算出される奥行きzを255−2×zで正規化し、0から255の8ビットで表している。値0(暗い)が最も奥行きが深く、255(明るい)が最も奥行きが浅いことを示す。また図8は奥行き量を加味した立体構造を示した図である。
この基本奥行きモデルタイプBは、前記上部の高域成分評価値が小さい場合に、画面上部に空もしくは平坦な壁が存在するシーンと認識して、画面上部の奥行きを深く設定するものである。基本奥行きモデルタイプBが使用されるシーン構成の一例として、図9のようなシーンがあげられる。
[タイプC]
基本奥行きモデルタイプCは、図3の座標系によれば各画素毎の奥行き量zは数式3で表される。rは円筒の半径、wはモデル画像の水平サイズ、hはモデル画像の垂直サイズである。
ここで、画像サイズが水平640画素、垂直480画素の基本奥行きモデルの例では、水平サイズw=640、h=480となり、半径r=1000としている。
前記数式3で算出した奥行き情報を輝度値としてグレイスケールで表した例を図10に示す。ここでは、前記数式3で算出される奥行きzを255−2×zで正規化し、0から255の8ビットで表している。値0(暗い)が最も奥行きが深く、255(明るい)が最も奥行きが浅いことを示す。また図11は奥行き量を加味した立体構造を示した図である。
この基本奥行きモデルタイプCは前記下部の高域成分評価値が小さい場合に、画面下部に平坦な地面もしくは水面に広がるシーンと認識し、画面上部を遠景として平面近似し、画面下部については下に行くほど奥行きZが小さくなるように設定したものである。基本奥行きモデルタイプCが使用されるシーン構成の一例として、図12のようなシーンがあげられる。
<処理の詳細説明>
<奥行き信号生成装置>
次に、図1の実施の形態の動作について図2のフローチャートと共に詳細に説明する。まず、画像入力部1に擬似立体化を行う対象の非立体画像を入力する(ステップS1)。この非立体画像は、通常の静止画もしくは動画、即ち画像の奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない非立体画像で、例えば、8ビットで量子化されている画像データである。また、この入力画像の画像サイズは、例えば、水平1280画素、垂直960画素とする。
前記画像入力部1に入力した非立体画像の画像データは、スケーリング部2に供給される。ここでは、入力した非立体画像を前記基本奥行きモデルのサイズと同一になるように縮小または拡大(スケーリング・再サンプル)する(ステップS2)。例えば、基本奥行きモデルのサイズが、水平640画素、垂直480画素であり、非立体画像のサイズが、水平1280画素、垂直960画素である場合、非立体画像のサイズを水平1/2倍、垂直1/2倍にスケーリングすると基本奥行きモデルのサイズと一致することになる。
なお再サンプルの方法としては、バイキュービック法、バイリニア法、ニアレストネイバー法などを用いることができるが、それぞれの処理の内容に関しては、本実施例の内容とは直接関係がないので省略する。
前記スケーリング部2でスケーリングした画像データを、上部の高域成分評価部3に供給する。ここで、スケーリングされた画像データの画面の上部約20%、即ち、640×96画素の範囲を水平8画素、垂直8画素のN個のブロックに分割し、各ブロック内の点(i,j)における輝度信号をY(i,j)としたとき、各ブロックについて下記数式4による計算を行う。この計算結果を上部の高域成分評価値(top_act)とする(ステップS3)。
また、前記上部の高域成分評価算出と並行して、前記スケーリング部2でスケーリングした画像データを、下部の高域成分評価部3にも供給する。ここで、スケーリングした画像データの画面の下部約20%を水平8画素、垂直8画素のブロックに分割し、各ブロック内の点(i,j)における輝度信号をY(i,j)としたとき、各ブロックについて前記と同様に数式4による計算を行う。この計算結果を下部の高域成分評価値(bottom_act)とする(ステップS4)。
そして前記上部の高域成分評価部3で計算した上部の高域成分評価値と前記下部の高域成分評価部4で計算した下部の高域成分評価値を合成比率決定部5に供給する。合成比率決定部5では、奥行きモデル合成部9で合成する前記3種類の基本奥行きモデルの合成比率k1, k2, k3 (k1+k2+k3=1)を決定する(ステップS5)。
図13は合成比率決定部5、ステップS5で決定する合成比率の決定条件の一例を示す。図13は上部の高域成分評価値(top_act)を横軸、下部の高域成分評価値(bottom_act)を縦軸とし、予め指定された値tps,tpl,bms,bmlとの兼ね合いにより基本奥行きモデルタイプを選択もしくは合成することを示す。図13において、複数の基本奥行きモデルタイプを記載している部分については、高域成分評価値に応じて線形に合成する。
例えば、TypeA/Bでは
(top_act−tps):(tpl−top_act)
の比率で基本奥行きモデルタイプA(TypeA)と基本奥行きモデルタイプB(TypeB)の合成比率を決定する。すなわち、TypeA/Bの合成比率は、基本奥行きモデルタイプC(TypeC)は使用せず、
TypeA:TypeB:TypeC =
(top_act−tps):(tpl−top_act):0
で合成比率を決定する。
また、TypeB/C、TypeA/Cについては
(bottom_act−bms):(bml−bottom_act)
の比率で基本奥行きモデルタイプBと基本奥行きモデルタイプCの合成比率を決定し、基本奥行きモデルタイプAと基本奥行きモデルタイプCの合成比率を決定する。すなわち、TypeB/Cの合成比率は、基本奥行きモデルタイプA(TypeA)は使用せず、
TypeA:TypeB:TypeC =
0:(bottom_act−bms):(bml−bottom_act)
で合成比率を決定し、TypeA/Cの合成比率は、基本奥行きモデルタイプB(TypeB)は使用せず、
TypeA:TypeB:TypeC =
(bottom_act−bms):0:(bml−bottom_act)
で合成比率を決定する。
更に、TypeA/B/Cにおいては、TypeA/B,TypeA/Cの合成比率の平均を採用しており、
TypeA:TypeB:TypeC =
(top_act−tps)+(bottom_act−bms):
(tpl−top_act):(bml−bottom_act)
で合成比率を決定する。
更に、合成比率k1、k2、k3を
k1= TypeA/(TypeA+TypeB+TypeC)
k2= TypeB/(TypeA+TypeB+TypeC)
k3= TypeC/(TypeA+TypeB+TypeC)
で正規化する。
奥行きモデル合成部9では、合成比率決定部5で決定した合成比率k1,k2,k3に基づいて、下記数式5により、フレームメモリ6、7及び8に格納されている3種類の基本奥行きモデルタイプA、B、Cの各画像da、db、dcをそれぞれ対応する画素毎に合成し、合成基本奥行きモデルcdを得る(ステップS6)。

ここで、pは各基本奥行きモデルの各画素位置を示す水平座標、qは垂直座標である。
なおこのステップ6の奥行きモデル合成処理においては、計算済みの基本奥行きモデルタイプをフレームメモリから呼び出すのでなく、その都度数式1〜3を用いた計算によって生成したものを使用しても構わない。また、その都度数式1〜3を用いた計算によって生成したものをフレームメモリに一旦記憶して、呼び出して使用しても構わない。
このように、本実施の形態では、基本となるシーンの奥行き構造モデルとして3種類の基本奥行きモデルを用意し、基になる画像の輝度信号の高域成分を画面上部及び画面下部について算定する。そしてその算出結果により、画面上部及び下部の高域成分が多い場合は、基本奥行きモデルタイプAの比率を大きくする。また、画面上部の高域成分が少ない場合は、上部に空もしくは平坦な壁が存在するシーンと認識して、上部の奥行きを深くした基本奥行きモデルタイプBの比率を増加する。逆に、画面下部の高域成分が少ない場合は、下部に平坦な地面もしくは水面が手前に連続的に広がるシーンと認識して、上部を遠景として平面近似し、下部については下に行くほど奥行きを浅くした基本奥行きモデルタイプCの比率を増加する。このような処理を行うことにより、より現実に近いシーン構造の推定を行うことが可能になる。
再び図1及び図2に戻って説明する。
奥行きモデル合成部9で生成した合成基本奥行きモデルを加算器10に供給する。ここで、スケーリング部2から出力する画像データの三原色信号(RGB信号)のうちの赤色信号(R信号)と前記合成奥行きモデルとを、下記数式6の算出式を用いて重畳し、奥行き信号を生成する(ステップS7)。ここでは原画のR信号の1/10を重畳している。
R信号を使用する理由の一つは、R信号の大きさが、順光に近い環境で、かつ、テクスチャの明度が大きく異ならないような条件において、被写体の凹凸と一致する確率が高いという経験則によるものである。更にもう一つの理由として、赤色及び暖色は色彩学における前進色であり、寒色系よりも奥行きが手前に認識されるという特徴があり、この奥行きを手前に配置することで立体感を強調することが可能であるということである。
基本奥行きモデルAの一例である図6の手前に人物を配したサンプルである図14に対して、R信号を重畳したときの奥行き信号の画像の例を図15に示す。また図16はその3次元構造を示した図である。
赤色及び暖色が前進色であるのに対し、青色は後退色であり、暖色系よりも奥行きが奥に認識される特徴がある。よって、青色の部分を奥に配置することによっても立体感の強調は可能である。さらに双方を併用して、赤色の部分を手前、青色の部分を奥に配置することによって立体感を強調することも可能である。
加算記10で算出した奥行き信号を、スケーリング部11に供給する。ここでは、算出した奥行き信号を、擬似立体化を行う対象の非立体画像のサイズと同一になるように拡大または縮小(スケーリング・再サンプル)する(ステップS8)。例えば非立体画像のサイズが水平1280画素、垂直960画素であり、基本奥行きモデルのサイズが、水平640画素、垂直480画素であり場合、基本奥行きモデルのサイズを水平2倍、垂直2倍にスケーリングすると非立体画像のサイズと一致することになる。
以上の処理、手順により、入力する非立体画像のサイズにスケーリングした奥行き信号を生成する、奥行き信号生成装置15が実現できる。
<擬似立体画像生成装置>
次に、テクスチャシフト部12では前記奥行き信号生成装置15で生成した前記奥行き信号を用いて、画像入力部1から入力する非立体画像に対して別視点の画像を生成する(ステップS9)。例えば、入力する非立体画像に対して、左に視点移動した視差画像を生成する場合、画面より手前に表示するテクスチャについては、奥行きに応じた量だけ右に移動する。画面より奥に表示するテクスチャについては、奥行きに応じた量だけ左に移動する。このようにして生成した画像を左目画像、原画を右目画像とすることでステレオペアを構成する。ここでは、入力画像に対応する奥行き信号を8ビットの値Ydで表すものとする。このYdについて小さい値すなわち奥に位置するものから順に、その値に対応する部分の入力画像のテクスチャを(Yd-m)/n画素右にシフトする。ここで、mは画面上の奥行きに表示する奥行きデータであり、これより大きなYdに関しては画面より手前に、小さなYdに関しては奥に表示する。また、nは奥行き感を調整するパラメータであり、nを大きくすると、奥行き感が小さくなり、nを小さくすると奥行き感が大きくなる。これらのパラメータの具体例として、m=200, n=20などがあげられる。この場合、奥行き信号の値が200を境にして大きい場合、手前に表示され、奥行き信号の値が200より小さい場合奥に表示される。
前述のステップ9の動作は本発明の「非立体画像のテクスチャのシフト」に対応するものであり、換言するならば、非立体画像の各画素を奥行き信号の値に応じてそれぞれを左右に移動する処理である。
このとき、シフトを行うことによる画像中の位置関係変化によりテクスチャの存在しない部分すなわちオクルージョンが発生する場合がある。このような部分については、オクルージョン補償部13で入力画像の対応部分で充填することによりオクルージョンを補償する(ステップS10)。
その後、ポスト処理部14で平滑化などのポスト処理を行うことにより、それ以前の処理において発生したノイズなどを軽減する(ステップS11)。
以上の処理、手順により、別視点画像信号を生成できる。
そして、生成した別視点画像信号を左目用の画像信号とし、別視点画像信号を生成する基となった入力画像信号を右目用の画像信号としてステレオペアを構成して外部へ出力すると、図1に示す擬似立体画像生成装置が実現できる。
図17に本実施例の擬似立体画像生成装置から出力するステレオペアの画像の一例を示す。但し、ここでは、左右の違いをわかりやすくするための強調がなされている。
また、本実施例においては、右目用の画像を入力画像、左目用の画像を生成した別視点画像とするステレオペアを構成しているが、テクスチャシフト部12で前記の画素の移動を左右反転することで、左目用の画像を入力画像、右目用の画像を生成した別視点画像とするステレオペアを構成することも可能である。また、左右どちらについても別視点画像を用いる、すなわち、右に視点移動した別視点画像と左に視点移動した別視点画像を用いてステレオペアを構成することも可能である。なお、本実施例ではステレオペアを生成する擬似立体画像生成装置として2視点での例を説明しているが、3視点以上の表示が可能な表示装置にて表示する場合、その視点数に応じた数の別視点画像を生成する擬似立体画像生成装置を構成することも可能である。
本実施例の擬似立体画像生成装置と図示していないステレオ表示装置とを組み合わせることにより、擬似立体画像表示システムを構成することができる。
ここにおけるステレオ表示装置とは、偏光メガネを用いたプロジェクションシステム、時分割表示と液晶シャッタメガネを組み合わせたプロジェクションシステムもしくはディスプレイシステム、レンチキュラ方式のステレオディスプレイ、アナグリフ方式のステレオディスプレイ、ヘッドマウントディスプレイなどを含む。特にステレオ画像の各画像に対応した2台のプロジェクタによるプロジェクションシステムを含む。
また、前記のように2視点以上の表示が可能な表示装置を用いた多視点立体映像表示システムの構築も可能である。また、本立体表示システムにおいては音声出力を装備する形態のものも考えられる。この場合、静止画等音声情報を持たない映像コンテンツについては、映像にふさわしい環境音を付加するような態様のものが考えられる。
このように、本実施の形態によれば、基本奥行きモデルの決定において、3種類の基本奥行きモデルの合成を基本にし、経験知に基づき、現実のシーン構造に比較的近いモデルが主体になるように、いわばフェイルセーフに配慮しながら、立体感を見る者に与えるようにし、得られたステレオペア(擬似立体画像)は、左画像について目立った破綻がなく、また立体視した場合、大きな違和感がないため、1枚の画像からシーン内容に応じた奥行きモデルを構築することが可能になり、これを基に違和感の少ない擬似立体画像を生成することができる。
本実施例においては、画像の単位をフレームで説明しているが、フィールドを単位として実現してもよい。
また、本発明は上記した擬似立体画像生成装置の機能をコンピュータに実現させるためのプログラムも含むものである。これらのプログラムは、記録媒体から読み取られてコンピュータに取り込まれてもよいし、通信ネットワークを介して伝送されてコンピュータに取り込まれてもよい。
本発明の奥行き信号生成装置、及び擬似立体画像生成装置の一実施の形態のブロック図である。 本発明の奥行き信号生成プログラム、及び擬似立体画像生成プログラムの一実施の形態のフローチャートである。 基本奥行きモデルの座標系を示す図である。 基本奥行きモデルタイプAの奥行き画像の一例を示す図である。 基本奥行きモデルタイプAの立体構造の一例を示す図である。 基本奥行きモデルタイプAが使用されるシーン構成の一例である。 基本奥行きモデルタイプBの奥行き画像の一例を示す図である。 基本奥行きモデルタイプBの立体構造の一例を示す図である。 基本奥行きモデルタイプBが使用されるシーン構成の一例である。 基本奥行きモデルタイプCの奥行き画像の一例を示す図である。 基本奥行きモデルタイプCの立体構造の一例を示す図である。 基本奥行きモデルタイプCが使用されるシーン構成の一例である。 基本奥行きモデル合成比率決定条件を説明する図である。 画像サンプルの一例を示す図である。 R信号を重畳した奥行き画像の一例を示す図である。 R信号を重畳した奥行きの立体構造を示す図である。 擬似立体化されたステレオペアの一例を示す図である。
符号の説明
1 画像入力部
2 スケーリング部
3 上部の高域成分評価部
4 下部の高域成分評価部
5 合成比率決定部
6 フレームメモリ(基本奥行きモデタイプA)
7 フレームメモリ(基本奥行きモデルタイプB)
8 フレームメモリ(基本奥行きモデルタイプC)
9 奥行きモデル合成部
10 加算部
11 スケーリング部
12 テクスチャシフト部
13 オクルージョン補償部
14 ポスト処理部
15 奥行き信号生成装置







Claims (4)

  1. 奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない非立体画像から擬似立体映像を生成するための奥行き信号を生成する奥行き信号生成装置であって、
    基本となる複数のシーン構造のそれぞれについて奥行き値を示す複数の基本奥行きモデルを記憶する、及び/又は所定の計算式より算出して得る複数の基本奥行きモデルを記憶する記憶手段と、
    入力する前記非立体画像の画像サイズを前記基本奥行きモデルの画像サイズと同一になるようにスケーリングする第一のスケーリング手段と、
    前記第一のスケーリング手段にてスケーリングした非立体画像の画面内の所定領域における画素値の統計量を算出して、前記複数の基本奥行きモデルの合成比率を決定する合成比率決定手段と、
    前記記憶手段から読み出した前記複数の基本奥行きモデルを、前記合成比率決定手段により決定した値に応じた合成比率で合成して合成基本奥行きモデルを生成する合成手段と、
    前記合成手段により合成した合成基本奥行きモデルと、前記第一のスケーリング手段によりスケーリングした非立体画像を用いて奥行き信号を生成する奥行き信号生成手段と、
    前記奥行き信号生成手段にて生成した前記奥行き信号の画像サイズを、前記入力する非立体画像の画像サイズと同一になるようにスケーリングする第二のスケーリング手段と、
    を有することを特徴とする奥行き信号生成装置。
  2. 奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない非立体画像から擬似立体画像を生成する擬似立体画像生成装置であって、
    前記請求項1に記載の奥行き信号生成装置の第二のスケーリング手段から供給するスケーリングした奥行き信号に応じて前記非立体画像のテクスチャのシフトを対応部分の奥行きに応じた量だけ行うことによって左目用画像および/または右目用画像となる別視点画像を生成する別視点画像生成手段を有し、
    前記別視点画像生成手段により生成した別視点画像と、前記非立体画像との一方を左目用画像とし、他方を右目用画像として出力することを特徴とする擬似立体画像生成装置。
  3. 奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない非立体画像から擬似立体映像を生成するための奥行き信号を生成する機能をコンピュータに実現させる奥行き信号生成プログラムであって、
    入力する前記非立体画像の画像サイズを前記基本奥行きモデルの画像サイズと同一になるようにスケーリングする第一のスケーリング機能と、
    前記第一のスケーリング機能にてスケーリングした非立体画像の画面内の所定領域における画素値の統計量を算出して、前記複数の基本奥行きモデルの合成比率を決定する合成比率決定機能と、
    擬似立体画像を生成するための基本となり所定の計算式で求められる、複数のシーン構造のそれぞれについて奥行き値を示す複数の基本奥行きモデルを、前記合成比率決定機能により決定した値に応じた合成比率で合成して合成基本奥行きモデルを生成する合成機能と、
    前記合成機能により合成した合成基本奥行きモデルと、前記第一のスケーリング機能によりスケーリングした非立体画像を用いて、奥行き信号を生成する奥行き信号生成機能と、
    前記奥行き信号生成機能にて生成した前記奥行き信号の画像サイズを、前記入力する非立体画像の画像サイズと同一になるようにスケーリングする第二のスケーリング機能と、
    をコンピュータに実現させる奥行き信号生成プログラム。
  4. 奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない非立体画像から擬似立体画像を生成する機能をコンピュータに実現させる擬似立体画像生成プログラムであって、
    前記請求項3に記載の奥行き信号生成プログラムの第二のスケーリング機能から供給するスケーリングした奥行き信号に応じて前記非立体画像のテクスチャのシフトを対応部分の奥行きに応じた量だけ行うことによって左目用画像および/または右目用画像となる別視点画像を生成する別視点画像生成機能を有し、
    前記別視点画像生成機能により生成した別視点画像と前記非立体画像との一方を左目用画像とし、他方を右目用画像として出力する機能をコンピュータに実現させる擬似立体画像生成プログラム。


JP2004376019A 2004-12-27 2004-12-27 奥行き信号生成装置、奥行き信号生成プログラム、擬似立体画像生成装置、及び擬似立体画像生成プログラム Active JP4419139B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004376019A JP4419139B2 (ja) 2004-12-27 2004-12-27 奥行き信号生成装置、奥行き信号生成プログラム、擬似立体画像生成装置、及び擬似立体画像生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004376019A JP4419139B2 (ja) 2004-12-27 2004-12-27 奥行き信号生成装置、奥行き信号生成プログラム、擬似立体画像生成装置、及び擬似立体画像生成プログラム

Publications (2)

Publication Number Publication Date
JP2006186511A JP2006186511A (ja) 2006-07-13
JP4419139B2 true JP4419139B2 (ja) 2010-02-24

Family

ID=36739309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004376019A Active JP4419139B2 (ja) 2004-12-27 2004-12-27 奥行き信号生成装置、奥行き信号生成プログラム、擬似立体画像生成装置、及び擬似立体画像生成プログラム

Country Status (1)

Country Link
JP (1) JP4419139B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5224352B2 (ja) * 2008-09-29 2013-07-03 Necカシオモバイルコミュニケーションズ株式会社 画像表示装置及びプログラム
JP5565001B2 (ja) * 2010-03-04 2014-08-06 株式会社Jvcケンウッド 立体映像撮像装置、立体映像処理装置および立体映像撮像方法
JP6024110B2 (ja) * 2012-01-26 2016-11-09 ソニー株式会社 画像処理装置、画像処理方法、プログラム、端末装置及び画像処理システム

Also Published As

Publication number Publication date
JP2006186511A (ja) 2006-07-13

Similar Documents

Publication Publication Date Title
JP4214976B2 (ja) 擬似立体画像作成装置及び擬似立体画像作成方法並びに擬似立体画像表示システム
US7262767B2 (en) Pseudo 3D image creation device, pseudo 3D image creation method, and pseudo 3D image display system
US9445072B2 (en) Synthesizing views based on image domain warping
KR101697184B1 (ko) 메쉬 생성 장치 및 그 방법, 그리고, 영상 처리 장치 및 그 방법
JP5402483B2 (ja) 擬似立体画像作成装置及び擬似立体画像表示システム
JP5402504B2 (ja) 擬似立体画像作成装置及び擬似立体画像表示システム
JP4489610B2 (ja) 立体視可能な表示装置および方法
JP2007264722A (ja) 画像処理装置
JP4214529B2 (ja) 奥行き信号生成装置、奥行き信号生成プログラム、擬似立体画像生成装置、及び擬似立体画像生成プログラム
JP2005295004A (ja) 立体画像処理方法および立体画像処理装置
JP4214527B2 (ja) 擬似立体画像生成装置及び擬似立体画像生成プログラム並びに擬似立体画像表示システム
JP5691965B2 (ja) 奥行き推定データの生成装置、生成方法及び生成プログラム、並びに疑似立体画像の生成装置、生成方法及び生成プログラム
JP5692051B2 (ja) 奥行き推定データの生成装置、生成方法及び生成プログラム、並びに疑似立体画像の生成装置、生成方法及び生成プログラム
JP2012060345A (ja) 多視点画像作成装置及び多視点画像作成方法並びに多視点画像表示システム
JP4214528B2 (ja) 擬似立体画像生成装置及び擬似立体画像生成プログラム並びに擬似立体画像表示システム
JP5464129B2 (ja) 画像処理装置および視差情報生成装置
JP4419139B2 (ja) 奥行き信号生成装置、奥行き信号生成プログラム、擬似立体画像生成装置、及び擬似立体画像生成プログラム
US8976175B2 (en) Depth estimation data generating device, computer readable recording medium having depth estimation data generating program recorded thereon, and pseudo-stereo image display device
Knorr et al. From 2D-to stereo-to multi-view video
Knorr et al. Super-resolution stereo-and multi-view synthesis from monocular video sequences
WO2019142794A1 (ja) 画像生成装置、表示処理装置、画像再生システム、画像生成方法、制御プログラム、及び記録媒体
WO2020066008A1 (ja) 画像データ出力装置、コンテンツ作成装置、コンテンツ再生装置、画像データ出力方法、コンテンツ作成方法、およびコンテンツ再生方法
KR100272132B1 (ko) 가상 세계 모델링 언어에 의해 표현된 영상의 입체화방법 및그 장치
JP3992607B2 (ja) 距離画像生成装置および方法並びにそのためのプログラムおよび記録媒体
JP5888140B2 (ja) 奥行き推定データ生成装置、擬似立体画像生成装置、奥行き推定データ生成方法及び奥行き推定データ生成プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4419139

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4