JP5654956B2 - 視差画像生成装置および視差画像生成プログラム - Google Patents

視差画像生成装置および視差画像生成プログラム Download PDF

Info

Publication number
JP5654956B2
JP5654956B2 JP2011155697A JP2011155697A JP5654956B2 JP 5654956 B2 JP5654956 B2 JP 5654956B2 JP 2011155697 A JP2011155697 A JP 2011155697A JP 2011155697 A JP2011155697 A JP 2011155697A JP 5654956 B2 JP5654956 B2 JP 5654956B2
Authority
JP
Japan
Prior art keywords
parallax
image
block
target pixel
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011155697A
Other languages
English (en)
Other versions
JP2013021634A (ja
Inventor
健介 久富
健介 久富
健佑 池谷
健佑 池谷
片山 美和
美和 片山
岩舘 祐一
祐一 岩舘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2011155697A priority Critical patent/JP5654956B2/ja
Publication of JP2013021634A publication Critical patent/JP2013021634A/ja
Application granted granted Critical
Publication of JP5654956B2 publication Critical patent/JP5654956B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は、被写体を撮影した画像から、被写体の奥行きを示す視差画像を生成する視差画像生成装置および視差画像生成プログラムに関する。
従来、同一の被写体を異なる視点位置で撮影した2つの画像において、一方の画像内のブロックと、そのブロックに対応する他方の画像内のブロックとの画像上の位置の差(視差)を求め、画素値に対応付けることで、被写体の奥行きを示す視差画像を生成する技術が種々提案されている。その一つとして、位相相関法(位相相関限定法)を用いた視差推定法がある(非特許文献1参照)。
位相相関法とは、2つ画像について、フーリエ変換された画像信号の位相成分のみに着目して、2つの画像の平行移動量を求める手法である。
すなわち、位相相関法は、図15に示すように、まず、2つの入力画像L(n,n),R(n,n)〔n,nは、画像内の座標〕をそれぞれフーリエ変換(FFT:Fast Fourier Transform)して位相成分(パワースペクトル)を取り出す。そして、位相相関法は、図15および図16に示すように、2つの入力画像から取り出された2つのパワースペクトルを合成し、逆フーリエ変換(IFFT:Inverse FFT)を施すことにより、位相相関関数P(n,n)を求める。そして、位相相関法は、位相相関関数P(n,n)のピーク(最大値)を検出し、座標中心(原点座標)からそのピーク位置までの距離dを求める。この位相相関関数で求められる距離dが、2つの画像L(n,n),R(n,n)の平行移動量を示している。
この位相相関法を用いた視差推定法は、2つの画像の平行移動量を求める位相相関法を、画像内のブロックに適用して、ブロックごとの平行移動量として視差を求める手法である。
すなわち、位相相関法を用いた視差推定法は、図17に示すように、左右の視点位置で撮影した2つの入力画像L(n,n),R(n,n)から切り出した対応する2つのブロックB(p,p),B(p,p)〔p,pは、ブロック内の座標〕をそれぞれフーリエ変換(FFT)して位相成分を取り出し、これらを合成したものに逆フーリエ変換(IFFT)を施すことにより、位相相関関数P(p,p)を求める。そして、この視差推定法は、位相相関関数P(p,p)のピークを検出し、座標中心(原点座標)からそのピーク位置までの距離dを求めることで、2つのブロックの平行移動量、すなわち、視差を求める。
なお、非特許文献1には、それぞれのブロックの画像のエピポーラ線が画像の水平軸と平行になるように画像を平行化し、2次元のブロックを用いる代わりに、1次元のブロックを用いて視差を取得する技術も提案されている。
柴原琢磨、沼徳仁、長嶋聖、青木孝文、中島寛、小林孝次著、「一次元位相限定相関法に基づくステレオ画像の高精度サブピクセル対応付け手法」 電子情報通信学会論文誌D,Vol. J91-D, No. 9, pp. 2343-2356, September 2008
しかし、従来の位相相関法を用いた視差推定法において、2つの画像から切り出したブロックには、奥行きが不連続な部分が存在したり、奥行きが連続であってもその奥行きが大きく異なる部分が存在したりする。そのため、これらのブロックに位相相関法を適用すると、手前の位相成分と奥の位相成分とがブロック内で混合されてしまうため、視差推定の精度が低下してしまうという問題がある。
すなわち、異なる視点位置から被写体を撮影し、それら2つの画像から切り出した2つのブロック内に被写体と背景が映っている場合を例にとると、近いところでは視差が大きく、遠いところでは視差が小さくなる。例えば、被写体がブロックの画像上で5画素ずれており、背景が2画素ずれているということになる。そして、この2つのブロックに図17に示した位相相関法を用いた視差推定法を適用し、位相相関関数のピーク(最大値)を対象画素の視差として求めようとすると、必ずしも対象画素の視差を推定するのではなく、ブロック内で同一視差の画素数が最大となる視差が、対象画素の最終的な視差として取得されてしまうことになる。つまり、従来の手法では、視差を求めたい対象画素が被写体の一部であっても、ブロック内に背景部分が多く写っていると、背景の視差が算出されてしまい、結果として視差推定の精度が低下してしまうという問題がある。
本発明は、以上のような問題点に鑑みてなされたものであり、同一の被写体を異なる視点位置で撮影した画像から高い精度で視差画像を生成することが可能な視差画像生成装置および視差画像生成プログラムを提供することを課題とする。
本発明は、前記課題を解決するために創案されたものであり、まず、請求項1に記載の視差画像生成装置は、同一の被写体を異なる視点位置で撮影した一方の画像である基準画像と他方の画像である参照画像とから、前記被写体の奥行きを示す視差画像を生成する視差画像生成装置であって、ブロック切出手段と、視差候補抽出手段と、視差候補記憶手段と、共通視差候補抽出手段と、類似度算出手段と、視差選択手段と、を備える構成とした。
かかる構成において、視差画像生成装置は、ブロック切出手段によって、基準画像および参照画像から、それぞれ予め定めた同じ大きさのブロックである基準ブロックおよび参照ブロックを、対応する位置で同一方向に切り出し位置を順次ずらして切り出す。視点位置が異なることから、この基準ブロックと対応する参照ブロックとは、画素単位で視差に伴う画像のずれが生じている。
そして、視差画像生成装置は、視差候補抽出手段によって、基準ブロックおよび参照ブロックごとに、位相の相関を示す位相相関関数の極大値の大きい順に、位相相関関数の原点座標から極大値を示す座標までの距離に対応する複数の視差を視差候補として抽出して視差候補記憶手段に記憶する。これによって、ブロック内に前景や背景といった奥行きの異なる画素が含まれている場合であっても、異なる複数の視差として検出されることになる。
そして、視差画像生成装置は、共通視差候補抽出手段によって、視差候補記憶手段に記憶されている基準ブロックごとの視差候補から、基準画像における視差を求める対象画素ごとに、当該対象画素を含む複数の基準ブロックで共通の視差候補を共通視差候補として抽出する。これによって、対象画素の視差の候補は、対象画素を含むブロックで共通する視差(共通視差候補)に絞られることになる。
そして、視差画像生成装置は、類似度算出手段によって、共通視差候補のそれぞれについて、当該対象画素を含んだ基準画像における所定の大きさの画像領域と、参照画像における対象画素の位置から当該共通視差候補で示される視差だけずらした対応画素を含んだ所定の大きさの画像領域との類似度を算出する。なお、この類似度を算出する画像領域は、画像特徴を表した領域であればよく、1画素以上であればよい。
そして、視差画像生成装置は、視差選択手段によって、共通視差候補の中から、類似度算出手段で算出された類似度が最も高い共通視差候補を対象画素における視差として選択する。これによって、画素単位で、複数の視差候補(共通視差候補)の中から最適な視差を求めることができ、対象画素ごとの視差の値で構成される視差画像が生成されることになる。
また、請求項2に記載の視差画像生成装置は、請求項1に記載の視差画像生成装置において、ブロック切出手段が、水平方向においてはブロックの水平画素数の半分ずつ、垂直方向においてはブロックの垂直画素数の半分ずつ、切り出し位置をずらして、基準ブロックおよび参照ブロックを切り出す構成とした。
かかる構成において、視差画像生成装置は、ブロック切出手段によって、基準ブロックおよび参照ブロックを半ブロックずつずらして切り出すことで、視差を求める対象画素が、水平および垂直方向に重なるブロックで共有する画素となる。このため、共通視差候補抽出手段において、視差を求める対象画素の視差の候補が、水平および垂直方向に重なるブロックで共通の視差に限定されることになる。また、対象画素が属するブロックの視差候補であっても、他のブロックと共通する頻度が所定の頻度より低い視差については、当該対象画素の視差としての可能性が低いことから、視差の候補から除外されることになる。
また、請求項に記載の視差画像生成装置は、請求項1または請求項2に記載の視差画像生成装置において、位相相関関数のX座標を視差方向であるブロックの水平方向にとり、Y座標を垂直方向にとったとき、視差候補抽出手段が、位相相関関数の極大値の個数として、当該極大値をとるY座標で示す値の絶対値が予め定めた閾値よりも大きい個数が、ブロックの総画素数に対する予め定めた割合となるまで、当該極大値をとるX座標の値を視差候補として抽出する構成とした。
かかる構成において、視差画像生成装置は、視差候補抽出手段によって、位相相関関数において、極大値をとるY座標の値の絶対値が予め定めた閾値を超える極大値の個数を、割合によって制限することで、視差方向に位相相関の強いX軸近傍の極大値を多く検出することができる。
また、請求項に記載の視差画像生成プログラムは、同一の被写体を異なる視点位置で撮影した一方の画像である基準画像と他方の画像である参照画像とから、前記被写体の奥行きを示す視差画像を生成するために、コンピュータを、ブロック切出手段、視差候補抽出手段、共通視差候補抽出手段、類似度算出手段、視差選択手段、として機能させる構成とした。
かかる構成において、視差画像生成プログラムは、ブロック切出手段によって、基準画像および参照画像から、それぞれ予め定めた同じ大きさのブロックである基準ブロックおよび参照ブロックを、対応する位置で同一方向に切り出し位置を順次ずらして切り出す。
そして、視差画像生成プログラムは、視差候補抽出手段によって、基準ブロックおよび参照ブロックごとに、位相の相関を示す位相相関関数の極大値の大きい順に、位相相関関数の原点座標から極大値を示す座標までの距離に対応する複数の視差を視差候補として抽出して視差候補記憶手段に記憶する。
また、視差画像生成プログラムは、共通視差候補抽出手段によって、視差候補記憶手段に記憶されている基準ブロックごとの視差候補から、基準画像における視差を求める対象画素ごとに、当該対象画素を含む複数の基準ブロックで共通の視差候補を共通視差候補として抽出する。
さらに、視差画像生成プログラムは、類似度算出手段によって、共通視差候補のそれぞれについて、当該対象画素を含んだ基準画像における所定の大きさの画像領域と、参照画像における対象画素の位置から当該共通視差候補で示される視差だけずらした対応画素を含んだ所定の大きさの画像領域との類似度を算出する。
そして、視差画像生成装置は、視差選択手段によって、共通視差候補の中から、類似度算出手段で算出された類似度が最も高い共通視差候補を対象画素における視差として選択する。これによって、対象画素ごとの視差の値で構成される視差画像が生成されることになる。
本発明は、以下に示す優れた効果を奏するものである。
請求項1,4に記載の発明によれば、基準ブロックと参照ブロックとにおいて複数の視差候補から、画素ごとに最も画像特徴が類似する視差を当該画素の視差として選択するため、画素単位で精度よく視差画像を生成することができる。また、これによって、ブロック内に前景や背景が混在している場合であっても、前景と背景との境界で精度よく視差を表すことができる。
さらに、請求項1,に記載の発明によれば、対象画素が属するブロックで抽出した視差候補であっても、対象画素を含んだ複数のブロックで共通に現れる頻度が低い視差の場合は、当該対象画素の視差の可能性の低い候補として除外することができるため、視差ごとの類似度を算出するための演算量を抑えることができ、高速に視差画像を生成することができる。
請求項2に記載の発明によれば、ブロックの切り出し間隔を半ブロックずつとすることで、最も少ないブロックの切り出し数で、複数のブロック間で共通する視差を、対象画素の視差として可能性の高い共通視差候補として抽出することができる。これによって、高速かつ精度よく視差画像を生成することができる。
本発明の実施形態に係る視差画像生成装置の概要を説明するための説明図である。 本発明の実施形態に係る視差画像生成装置に入力される画像を説明するための説明図である。 本発明の実施形態に係る視差画像生成装置の構成を示すブロック構成図である。 本発明の実施形態に係る視差画像生成装置のブロック切出手段において、画像からブロックを切り出す処理を説明するための説明図である。 本発明の実施形態に係る視差画像生成装置の視差候補抽出手段において、位相相関法を用いて複数の視差を抽出する手法を説明するための説明図である。 本発明の実施形態に係る視差画像生成装置の共通視差候補抽出手段において、複数のブロックに共通する共通視差候補を抽出する手法を説明するための説明図である。 本発明の実施形態に係る視差画像生成装置の類似度算出手段において、対象画素と視差に対応した対応画素との類似度を算出する手法を説明するための説明図である。 本発明の実施形態に係る視差画像生成装置の動作を示すフローチャートである。 参考例の実施形態に係る視差画像生成装置の構成を示すブロック構成図である。 参考例の実施形態に係る視差画像生成装置のブロック切出手段において、画像からブロックを切り出す処理を説明するための説明図である。 参考例の実施形態に係る視差画像生成装置の類似度算出手段において、対象画素と視差に対応した対応画素との類似度を算出する手法を説明するための説明図である。 参考例の実施形態に係る視差画像生成装置において、ブロックの切り出し間隔を複数画素としたときの対象画素を説明するための説明図である。 本発明の実施形態に係る視差画像生成装置のブロック切出手段において、画像の周辺のブロックを切り出す処理を説明するための説明図である。 参考例の実施形態に係る視差画像生成装置の動作を示すフローチャートである。 従来の位相相関法を用いた画像の平行移動量を求める手法を説明するための説明図である。 従来の位相相関法を用いた画像の平行移動量を求める手法を説明するための説明図である。 従来の位相相関法を用いた視差推定法を説明するための説明図である。
以下、本発明の実施形態について図面を参照して説明する。
[視差画像推定装置の概要]
まず、図1,図2を参照して、本発明の実施形態に係る視差画像生成装置の概要について説明する。図1に示すように、視差画像生成装置1(1B)は、被写体を撮影した基準画像Isと参照画像Irとを入力し、被写体の奥行き(視差)を示す視差画像Izを生成するものである。
この視差画像生成装置1(1B)は、基準画像Isと参照画像Irとから、位相相関法(位相限定相関法)を用いて画像内のブロックごとに複数の視差候補を求め、画像特徴に基づいて、複数の視差候補を評価して、画素ごとに最も評価の高い視差を求めることで、視差画像Izを生成する。
ここで、基準画像Isとは、図2に示すように、ある被写体Tを撮影した画像であって、位相相関法によって視差を求める際の基準となる画像である。一方、参照画像Irは、基準画像Isに対して、同一の被写体Tを異なる視点位置で撮影した画像である。
すなわち、基準画像Isおよび参照画像Irは、図2に示すように、水平方向(視差方向)において異なる位置に配置されたカメラ(基準カメラCs,参照カメラCr)で撮影された画像である。このとき、基準カメラ(左視点カメラ)Csおよび参照カメラ(右視点カメラ)Crは、カメラの光軸が平行になるように設置され、高さも同じであることが好ましい。もちろん、カメラを厳密な位置に配置することは困難であるため、事前に、基準となるマーカ等を撮影し、撮影される画像を較正することで、基準画像Isおよび参照画像Irを平行化することとしてもよい。
なお、ここでは、基準カメラCsで撮影された画像を基準画像Is、参照カメラCrで撮影された画像を参照画像Irとして説明を行うが、その逆、すなわち、基準カメラCsで撮影された画像を参照画像Ir、参照カメラCrで撮影された画像を基準画像Isとしても構わない。
このように、視差画像生成装置1(1B)は、基準画像Isから切り出したブロック(基準ブロック)を基準に、参照画像Irから切り出したブロック(参照ブロック)の平行移動量(視差)を求めるものである。
以下、本発明の実施形態に係る視差画像生成装置1(1B)の構成および動作について詳細に説明する。
[視差画像生成装置の構成]
まず、図3を参照して、本発明の実施形態に係る視差画像生成装置1の構成について説明する。
図3に示すように、視差画像生成装置1は、ブロック切出手段11と、視差候補抽出手段12と、視差候補記憶手段13と、共通視差候補抽出手段14と、視差候補評価手段15と、を備えている。
ブロック切出手段11は、基準画像Isおよび参照画像Irから、それぞれ予め定めた同じ大きさのブロックである基準ブロックおよび参照ブロックを、同一の切り出し位置で同一方向に切り出し位置を順次ずらして切り出すものである。
なお、ブロックの大きさは、基準ブロックおよび参照ブロックにおいて、被写体の重なり領域を確保して、平行移動量を求めることが可能な大きさとし、例えば、64×64画素(ピクセル)とする。もちろん、事前にこのブロックの大きさでは、ブロック同士の画像のずれが大きいため、平行移動量を求めることができないと分かっているときは、例えば、128×128画素、256×256画素等とブロックの大きさを予め大きくしておけばよい。
また、基準画像Isと参照画像Irの画像全体での平行移動量が分かっているときは、参照ブロックの切り出し位置は、対応する基準ブロックの切り出し位置から画像全体での平行移動量分ずらした位置とすればよい。
ここでは、ブロック切出手段11は、基準ブロック切出手段11aと、参照ブロック切出手段11bと、を備えている。
基準ブロック切出手段11aは、入力された基準画像Isから、予め定めた大きさのブロック(基準ブロック)を、切り出し位置を順次ずらして切り出すものである。この基準ブロック切出手段11aで切り出された基準ブロックは、視差候補抽出手段12に出力される。
この基準ブロック切出手段11aは、図4に示すように、基準画像Isの左上から、水平方向(右方向)に所定の間隔だけ切り出し位置をずらして、基準ブロックBsを順次(Bs,Bs,Bs,Bs,…)切り出す。そして、基準ブロック切出手段11aは、基準画像Isの水平ラインについて切り出しが完了した後、垂直方向(下方向)に所定の間隔だけ切り出し位置をずらして左端から基準ブロックBsを切り出す。このように、基準ブロック切出手段11aは、水平方向および垂直方向に走査状の切り出し処理を行い、基準画像Is全体から複数の基準ブロックBsを順次切り出す。もちろん、この切り出し順序や方向はこれに限定されるものではない。
なお、水平方向および垂直方向の基準ブロックBsの切り出し間隔は、基準画像Isの各画素が、複数の基準ブロックBsに重複して属するように予め定めた間隔とする。すなわち、基準ブロック切出手段11aは、1画素よりも多く、基準ブロックBsの水平画素数の半分(半ブロック)以下の範囲で、水平方向の切り出し間隔を予め定めておき、1画素よりも多く、基準ブロックBsの垂直画素数の半分(半ブロック)以下の範囲で、垂直方向の切り出し間隔を予め定めておく。
ここでは、重複領域を確保しつつ、切り出すブロック数が最も少なくなるように、水平方向においては、基準ブロックBsの水平画素数の半分、垂直方向においては、基準ブロックBsの垂直画素数の半分の切り出し間隔で、基準ブロックBsを切り出すこととする。
参照ブロック切出手段11bは、入力された参照画像Irから、予め定めた大きさのブロック(参照ブロック)を、切り出し位置を順次ずらして切り出すものである。この参照ブロック切出手段11bで切り出された参照ブロックは、視差候補抽出手段12に出力される。この参照ブロック切出手段11bは、入力する画像が、基準ブロック切出手段11aにおける基準画像Isから参照画像Irに代わっただけで、図4に示すように、参照ブロックBrの大きさ、参照ブロックBrの切り出し位置、切り出し順序は、基準ブロック切出手段11aと同じであるため、詳細な説明は省略する。
視差候補抽出手段12は、ブロック切出手段11で切り出された基準ブロックおよび参照ブロックごとに、位相の相関を示す位相相関関数の極大値の大きい順に、位相相関関数の原点座標から極大値を示す座標までの距離に対応する複数の視差を視差候補として抽出するものである。
ここでは、視差候補抽出手段12は、位相相関関数生成手段12aと、極大値視差検出手段12bと、を備えている。
位相相関関数生成手段12aは、基準ブロック切出手段11aで切り出された基準ブロックと、参照ブロック切出手段11bで切り出された参照ブロックとにおいて、位相相関法(位相限定相関法)により、位相相関関数を生成するものである。
ここで、基準ブロックの各画素の画素値(輝度情報または色情報)をBs(p,p)、参照ブロックの各画素の画素値をBr(p,p)とする。なお、p,pは、ブロック(基準,参照)内のX座標およびY座標を示す。
このとき、位相相関関数生成手段12aは、以下の(1),(2)式により、基準ブロックBs(p,p)および参照ブロックBr(p,p)をそれぞれフーリエ変換して、パワースペクトルb(k,k)およびb(k,k)を求める。なお、kおよびkは波数、FFT{}はフーリエ変換演算を示す。
Figure 0005654956
そして、位相相関関数生成手段12aは、(1),(2)式で求められた位相成分を振幅で正規化し、合成することで、以下の(3)式に示す正規化相互パワースペクトルG(k,k)を算出する。なお、上付きバーを付したb(k,k)は、b(k,k)の複素共役を示す。
Figure 0005654956
そして、位相相関関数生成手段12aは、(3)式で求められた正規化相互パワースペクトルG(k,k)を逆フーリエ変換することで位相相関関数P(p,p)を求める。なお、p,pはブロック(基準,参照)内のX座標およびY座標、P,Pはブロックの水平画素数および垂直画素数、IFFT{}は逆フーリエ変換演算を示す。
Figure 0005654956
極大値視差検出手段12bは、位相相関関数生成手段12aで生成された位相相関関数において、複数の極大値を検出し、極大値の大きい順に、位相相関関数の原点座標から極大値を示す座標までの距離に対応する複数の視差を視差候補として抽出するものである。
この極大値視差検出手段12bは、視差方向である水平方向、すなわち、位相相関関数のX軸近傍に現れる極大値から視差候補を抽出する。
ここでは、極大値視差検出手段12bは、極大値を大きい順に検出し、その極大値をとる位相相関関数のX座標の値を視差候補として順次抽出する。このとき、極大値視差検出手段12bは、位相相関関数のY座標の値の絶対値が予め定めた閾値より大きい極大値の個数を累計し、その累計がブロック(基準、参照)の総画素数に対する予め定めた割合となるまで視差候補を抽出することとする。
これによって、Y座標、すなわち、垂直方向に大きな相関を有する極大値に対応する視差を、視差候補から除外することができる。
ここで、図5を参照(適宜図3参照)して、極大値視差検出手段12bにおいて視差候補を抽出する手法について模式的に説明する。
ここでは、説明を簡略化するため、図5(a)に示すように、基準ブロックBsおよび参照ブロックBrには、それぞれ対応する前景Fgと、背景Bg,Bgとが撮影されているものとする。このとき、位相相関関数生成手段12aにおいて、位相相関法によって求められる位相相関関数には、図5(b)に示すように、大きく3個の極大値が検出される。通常、平行に設置されたカメラで撮影された画像(基準ブロック,参照ブロック)、あるいは、事前に平行化された画像(基準ブロック,参照ブロック)から位相相関関数を求めると、正しい視差は、水平方向への移動のみになることから、X軸上(水平方向)に現れる。しかし、基準ブロックBsおよび参照ブロックBrは、3個の極大値以外にも、多くの極大値が存在する(図示せず)。
そこで、極大値視差検出手段12bは、極大値が大きい順に、極大値のY座標で示す値が予め定めた閾値(±ymaxの絶対値)よりも大きい極大値が増加してきた場合、その時点で、視差候補の抽出を終了する。この極大値のY座標で示す値が予め定めた閾値(±ymaxの絶対値)よりも大きい極大値が増加してきたか否かの判定は、Y座標の閾値を超える極大値の個数が、ブロックの総画素数に対して予め定めた割合(例えば、0.2%)以上となったか否かにより判定すればよい。
そして、極大値視差検出手段12bは、その割合を超えるまで、極大値が大きい順に、極大値のX座標に対応する視差d,d,d,…を順次視差候補として抽出する。
なお、極大値視差検出手段12bは、これ以外にも、例えば、極大値の個数の最大数を予め限定し、位相相関関数P(p,p)の極大値の個数がその最大数になるまで、極大値の大きい順に位相相関関数のX座標pの値を視差として検出することとしてもよい。あるいは、極大値視差検出手段12bは、極大値の大きさを閾値で限定し、位相相関関数P(p,p)の極大値が、その閾値を超えるX座標pの値を視差として検出することとしてもよい。
このように極大値視差検出手段12bは、1つの基準ブロックにおいて、奥行きが不連続である部分や、奥行きが大きく異なる部分が存在する場合であっても、位相相関関数において、それぞれ別の視差候補として抽出することができる。
この極大値視差検出手段12bは、抽出した複数の視差候補を、その視差候補を抽出した基準ブロックごとに対応付けて、視差候補記憶手段13に記憶する。
図3に戻って、視差画像生成装置1の構成について説明を続ける。
視差候補記憶手段13は、視差候補抽出手段12で抽出された視差候補を、基準ブロックごとに記憶するものであって、半導体メモリ等の記憶媒体である。
この視差候補記憶手段13には、基準ブロックを特定する情報と、複数の視差候補とを対応付けて記憶する。ここで、基準ブロックを特定する情報は、基準ブロックが、基準画像Isにおいて、どの位置のブロックであるのかを特定する情報であればよい。例えば、基準画像Isにおける切り出し順序番号、切り出し座標(例えば、基準ブロックの左上座標)等である。
共通視差候補抽出手段14は、視差候補記憶手段13に記憶されている基準ブロックごとの視差候補から、基準画像Isにおける視差を求める対象画素ごとに、当該対象画素を含む複数の基準ブロックで共通の視差候補を共通視差候補として抽出するものである。この共通視差候補抽出手段14で抽出された共通視差候補は、視差候補評価手段15に出力される。なお、共通視差候補抽出手段14は、基準画像Isのすべての画素を順次視差を求める対象画素とする。
ここで、図6を参照(適宜図3参照)して、共通視差候補抽出手段14が抽出する共通視差候補の抽出手法について説明する。なお、ここでは、ブロック切出手段11において、ブロックの切り出し間隔を、水平方向において基準ブロックの半分、垂直方向において基準ブロックの半分としている。
図6(a)に示すように、基準画像Isにおいて、視差を求める画素(対象画素Ps)は、4つの基準ブロックBs,Bs,Bs,Bsに含まれている。一方、図6(b)に示すように、基準ブロックBs,Bs,Bs,Bsのそれぞれの視差候補は、視差候補抽出手段12によって抽出され、視差候補記憶手段13に記憶されている。
そこで、共通視差候補抽出手段14は、視差を求める対象画素Psが基準ブロックBs,Bs,Bs,Bsで共通の領域(ブロック重複領域Q)の画素である場合、基準ブロックBs,Bs,Bs,Bsに共通に含まれている視差(図中、d,d)を共通視差候補として抽出する。
なお、対象画素Psの視差は、その画素が含まれる基準ブロックにピークとして現れるが、複数の基準ブロックが重複するブロック重複領域Qの画素については、複数の基準ブロックで共通する視差候補を対象画素Psの視差候補とすることで、ブロック重複領域Q以外の画素の視差候補を排除することができる。これによって、共通視差候補抽出手段14は、対象画素Psの視差候補を抽出する精度を高めることができる。また、対象画素Psの視差候補の数を限定することで、後記する視差候補評価手段15における評価のためにかかる時間を短縮することができる。
図3に戻って、視差画像生成装置1の構成について説明を続ける。
視差候補評価手段15は、視差を求める対象画素ごとに、複数の視差候補を評価して、最適な視差を選択するものである。すなわち、視差候補評価手段15は、基準画像Isの視差を求める対象画素と、視差候補の視差に対応する参照画像Irの画素(対応画素)との画素近傍の画像特徴の類似度(一致度)を評価し、最も類似度の高い視差を選択する。
ここでは、視差候補評価手段15は、類似度算出手段15aと、視差選択手段15bと、を備えている。
類似度算出手段15aは、共通視差候補抽出手段14で抽出された対象画素における共通視差候補のそれぞれについて、当該対象画素を含んだ基準画像Isにおける所定の大きさの画像領域と、参照画像Irにおける対象画素の位置から当該共通視差候補で示される視差だけずらした画素(対応画素)を含んだ所定の大きさの画像領域との類似度を算出するものである。この類似度算出手段15aで算出された類似度は、対象画素を特定する情報(例えば、基準画像上の座標位置)とともに、視差選択手段15bに出力される。
この類似度算出手段15aは、画像領域の類似度として、当該画像領域の輝度情報や色情報において、SSD(Sum of Squared Difference)、正規化相互相関(ZNCC:Zero-mean Normalized Cross-Correlation)等の一般的な類似度の評価式を計算することで、基準画像Isの対象画素と、参照画像Irの対応画素との間で類似度を算出することができる。
なお、類似度を計算する画像領域の大きさは、基準ブロックの大きさと同じである必要はなく、小さく設定することができる。これは、位相相関法により視差を求める場合には、視差を考慮したブロックの大きさが必要であるが、画像特徴はそれよりも狭い範囲で比較することができるからである。例えば、類似度を計算する画像領域の大きさは、1画素であっても類似度を評価することができ、対象画素と対応画素とで類似度を算出することとしてもよい。
このように、類似度を算出するための画像領域を、ブロックの大きさよりも小さくすることで、ブロック内の前景と背景との境界付近においても細かく類似度を求めることができ、視差を選択するための精度を高めることができる。
ここで、図7を参照(適宜図3参照)して、類似度算出手段15aが類似度を算出する際の視差を求める対象画素と、当該対象画素の視差に対応する対応画素について説明する。ここでは、図7(a)に示すように、基準画像Isにおいて、4つの基準ブロックBs,Bs,Bs,Bsに含まれた座標(x1,y1)の画素を、視差を求める画素(対象画素Ps)とする。
このとき、類似度算出手段15aは、図7(b)に示すように、共通視差候補抽出手段14で抽出された基準ブロックBs,Bs,Bs,Bsの共通視差候補のそれぞれについて、対象画素Psに対応する対応画素Prを特定する。すなわち、共通視差候補の1つを視差dとしたとき、類似度算出手段15aは、対象画素Psの座標に対して、視差dだけずらした座標(x1+d,y1)の画素を、対応画素Prとする。
そして、類似度算出手段15aは、基準画像Isにおいて、対象画素Psを含んだ領域、例えば、対象画素Psを中心とした予め定めた大きさの矩形領域(類似度算出用画像領域Rs)と、参照画像Irにおいて、対応画素Prを含んだ領域、例えば、対象画素Psと同様、対応画素Prを中心とした予め定めた大きさの矩形領域(対応画像領域Rr)とで、類似度を算出する。
図3に戻って、視差画像生成装置1の構成について説明を続ける。
視差選択手段15bは、共通視差候補抽出手段14で抽出された共通視差候補の中から、類似度算出手段15aで算出された類似度が最も高い共通視差候補を対象画素における視差として選択するものである。
この視差選択手段15bは、その選択した視差を、基準画像Isの対象画素における視差として、対象画素と同じ座標上において視差を画素値に設定した視差画像Izを生成する。
このように、視差画像生成装置1は、対象画素ごとに、視差候補のうちで最も評価値(画像特徴の類似度)が高い視差を当該対象画素における視差とするため、ブロックに前景と背景が混在している場合であっても、精度のよい視差画像を生成することができる。
なお、視差画像生成装置1には、基準画像Isおよび参照画像Irを、それぞれフレーム(またはフィールド)として連続して入力されることで、動画像から、フレーム(またはフィールド)に対応した視差画像を生成することも可能である。
[視差画像生成装置の動作]
次に、図8を参照(構成については、適宜図3参照)して、本発明の実施形態に係る視差画像生成装置1の動作について説明する。なお、ここでは、基準画像Isおよび参照画像Irが連続する動画が、視差画像生成装置1に入力されるものとして説明を行う。
まず、視差画像生成装置1は、ブロック切出手段11によって、基準画像Isおよび参照画像Irを入力する(ステップS1)。
そして、視差画像生成装置1は、ブロック切出手段11によって、ステップS1で入力された基準画像Isおよび参照画像Irから、予め定めた同じ大きさのブロックである基準ブロックおよび参照ブロックを切り出す(ステップS2)。
すなわち、視差画像生成装置1は、ブロック切出手段11の基準ブロック切出手段11aによって、基準画像Isから、基準ブロックを切り出し、ブロック切出手段11の参照ブロック切出手段11bによって、参照画像Irから、基準ブロックと同じ大きさ、同じ位置で参照ブロックを切り出す。
そして、視差画像生成装置1は、視差候補抽出手段12によって、ステップS2で切り出された基準ブロックと参照ブロックとの間で、複数の視差を視差候補として抽出し、視差候補記憶手段13に記憶する(ステップS3)。
すなわち、視差画像生成装置1は、視差候補抽出手段12の位相相関関数生成手段12aによって、基準ブロックと参照ブロックとにおいて、位相相関法(位相限定相関法)により、位相相関関数を生成する。
そして、視差画像生成装置1は、視差候補抽出手段12の極大値視差検出手段12bによって、位相相関関数において、複数の極大値を求め、極大値の大きい順に、位相相関関数の原点座標から極大値を示す座標までの距離に対応する複数の視差を視差候補として抽出して、ブロック(基準ブロック)に対応付けて視差候補記憶手段13に記憶する。
そして、視差画像生成装置1は、ブロック切出手段11によって、画像全体についてブロックの切り出しが終了したか否かを判定する(ステップS4)。
このステップS4において、画像全体についてブロックの切り出しが終了していない場合(ステップS4でNo)、視差画像生成装置1は、ステップS2に戻って、ブロック切出手段11によって、切り出し位置をずらして、次のブロックを切り出す。
一方、画像全体についてブロックの切り出しが終了した場合(ステップS4でYes)、視差画像生成装置1は、ステップS5に動作を進める。
そして、視差画像生成装置1は、共通視差候補抽出手段14によって、視差候補記憶手段13に記憶されている基準ブロックごとの視差候補から、視差を求める対象画素を含む複数の基準ブロックで共通の視差候補を、対象画素における共通視差候補として抽出する(ステップS5)。
そして、視差画像生成装置1は、視差候補評価手段15によって、対象画素において、共通視差候補を評価し、評価値の最も高い視差を、当該対象画素における視差とする。
すなわち、視差画像生成装置1は、視差候補評価手段15の類似度算出手段15aによって、ステップS5で抽出された対象画素における共通視差候補の視差ごとに、当該対象画素を含んだ基準画像Isにおける所定の大きさの画像領域と、参照画像Irにおける対象画素の位置から当該視差だけずらした画素(対応画素)を含んだ所定の大きさの画像領域との画像の類似度を算出する(ステップS6)。
そして、視差画像生成装置1は、視差候補評価手段15の視差選択手段15bによって、ステップS6で算出された類似度(評価値)が最も高い視差を当該対象画素における視差として選択する(ステップS7)。
これによって、視差画像Izの対象画素位置における画素値が視差の値によって特定されることになる。
そして、視差画像生成装置1は、共通視差候補抽出手段14によって、基準画像Isの全画素について視差を求める対象画素として処理したか、すなわち、視差画像Izの全画素について視差を特定したか否かを判定する(ステップS8)。
このステップS8において、全画素について処理が完了していない場合(ステップS8でNo)、視差画像生成装置1は、ステップS5に戻って、共通視差候補抽出手段14によって、対象画素を変更する。なお、この対象画素の変更は、例えば、画像全体の左上の画素から順に1画素ずつ右に移動させ、最右端まで達した段階で、1画素下の段の最左端の画素を対象画素とするように、走査状に変更すればよい。
一方、全画素について処理が完了した場合(ステップS8でYes)、視差画像生成装置1は、ブロック切出手段11によって、動画におけるフレームのすべてについて処理が完了したか否かを判定する(ステップS9)。
そして、視差画像生成装置1は、全フレームについて処理が完了しておらず、次フレームとして、他の基準画像Isおよび参照画像Irが入力された場合(ステップS9でNo)、ステップS1に動作を戻す。
一方、視差画像生成装置1は、全フレームについて視差画像の生成処理が完了した場合(ステップS9でYes)、動作を終了する。
以上の動作によって、視差画像生成装置1は、異なる視点位置で撮影された基準画像Isおよび参照画像Irから、被写体の奥行きを示す視差画像Izを生成することができる。
このとき、視差画像生成装置1は、ブロックごとに位相相関が最も高い1つの視差によって、対象画素の視差を求めるのではなく、複数の視差候補から、対応する画素の画像特徴が最も類似する視差を特定するため、ブロックに前景と背景が混在している場合であっても、精度のよい視差画像を生成することができる。
[視差画像生成装置の構成]
次に、図9を参照して、参考例の実施形態に係る視差画像生成装置1Bの構成について説明する。
図9に示すように、視差画像生成装置1Bは、ブロック切出手段11Bと、視差候補抽出手段12と、視差候補評価手段15Bと、を備えている。
この視差画像生成装置1Bは、図3で説明した視差画像生成装置1の構成から、ブロックごとに画像全体の視差候補を記憶する視差候補記憶手段13、および、ブロック間で共通する視差候補を抽出する共通視差候補抽出手段14を省き、ブロック切出手段11および視差候補評価手段15を、その機能を変えたブロック切出手段11Bおよび視差候補評価手段15Bに替えて構成している。
視差候補抽出手段12は、図3で説明した視差画像生成装置1と同一の構成であるため、同一の符号を付して説明を省略する。なお、視差候補抽出手段12で抽出されたブロック(基準ブロックおよび参照ブロック)ごとの視差候補は、視差候補評価手段15Bに出力される。
ブロック切出手段11Bは、基準画像Isおよび参照画像Irから、それぞれ予め定めた同じ大きさのブロックである基準ブロックおよび参照ブロックを、同一の切り出し位置で同一方向に切り出し位置を順次ずらして切り出すものである。このブロックの大きさについては、ブロック切出手段11(図3参照)と同様に、基準ブロックおよび参照ブロックにおいて、被写体の重なり領域を確保して、平行移動量を求めることが可能な大きさとし、例えば、64×64画素(ピクセル)とする。もちろん、事前にこのブロックの大きさでは、ブロック同士の画像のずれが大きいため、平行移動量を求めることができないと分かっているときは、例えば、128×128画素、256×256画素等とブロックの大きさを予め大きくしておけばよい。
なお、ブロック切出手段11(図3参照)は、視差を求める対象画素を複数のブロックに含ませるため、水平、垂直方向、それぞれについて、1画素よりも多く、ブロックの水平、垂直画素数の半分(半ブロック)以下の範囲でブロックの切り出し間隔を定めた。しかし、ブロック切出手段11Bは、ブロック間で共通する視差を求めないため、1画素以上、ブロックの水平、垂直画素数以下の範囲で、ブロックの切り出し間隔を定める。ここでは、一例としてブロックの切り出し間隔を1画素とする。
図9に示すように、ブロック切出手段11Bは、基準ブロック切出手段11Baと、参照ブロック切出手段11Bbと、を備えている。
基準ブロック切出手段11Baは、入力された基準画像Isから、予め定めた大きさのブロック(基準ブロック)を、切り出し位置を順次ずらして切り出すものである。この基準ブロック切出手段11Baで切り出された基準ブロックは、視差候補抽出手段12に出力される。
この基準ブロック切出手段11Baは、図10に示すように、基準画像Isの左上から、水平方向(右方向)に所定の間隔(ここでは、1画素)だけ切り出し位置をずらして、基準ブロックBsを順次(Bs,Bs,Bs,Bs,…)切り出す。そして、基準ブロック切出手段11Baは、基準画像Isの水平ラインについて切り出しが完了した後、垂直方向(下方向)に所定の間隔(ここでは、1画素)だけ切り出し位置をずらして左端から基準ブロックBsを切り出す。このように、基準ブロック切出手段11Baは、水平方向および垂直方向に走査状の切り出し処理を行い、基準画像Is全体から複数の基準ブロックBsを順次切り出す。もちろん、この切り出し順序や方向はこれに限定されるものではない。
参照ブロック切出手段11Bbは、入力する画像が、基準ブロック切出手段11Baにおける基準画像Isから参照画像Irに代わっただけで、図10に示すように、参照ブロックBrの大きさ、参照ブロックBrの切り出し位置、切り出し順序は、基準ブロック切出手段11Baと同じであるため、詳細な説明は省略する。
視差候補評価手段15Bは、視差を求める対象画素ごとに、複数の視差候補を評価して、最適な視差を選択するものである。すなわち、視差候補評価手段15Bは、基準画像Isの視差を求める対象画素と、視差候補の視差に対応する参照画像Irの画素(対応画素)との画素近傍の画像特徴の類似度(一致度)を評価し、最も類似度の高い視差を選択する。なお、図3で説明した視差画像生成装置1の視差候補評価手段15は、対象画素を共有する複数のブロックで共通の視差候補について評価(画像特徴の類似度判定)を行った。しかし、視差候補評価手段15Bは、1つのブロック(基準ブロックおよび参照ブロック)について評価(画像特徴の類似度判定)を行う点が視差候補評価手段15とは異なっている。
図9に示すように、視差候補評価手段15Bは、類似度算出手段15Baと、視差選択手段15Bbと、を備えている。
類似度算出手段15Baは、基準画像Isにおける視差を求める対象画素ごとに、視差候補抽出手段12で抽出された視差候補のそれぞれについて、当該対象画素を含んだ基準画像Isにおける所定の大きさの画像領域と、参照画像Irにおける対象画素の位置から当該視差候補で示される視差だけずらした画素(対応画素)を含んだ所定の大きさの画像領域との類似度を算出するものである。この類似度算出手段15Baで算出された類似度は、対象画素を特定する情報(例えば、基準画像上の座標位置)とともに、視差選択手段15Bbに出力される。
この類似度算出手段15Baは、画像領域の類似度として、当該画像領域の輝度情報や色情報において、SSD、ZNCC等の一般的な類似度の評価式を計算することで、基準画像Isの対象画素と、参照画像Irの対応画素との間で類似度を算出することができる。また、類似度を計算する画像領域の大きさは、基準ブロックの大きさと同じである必要はなく、小さく設定することができ、最小1画素とすることができる。
なお、視差を求める対象画素は、基準ブロック内の予め定めた位置に対応する画素とする。例えば、基準ブロックの中心画素とする。ただし、ブロックの水平、垂直画素数が偶数であれば、中心4画素のうちの予め定めた1画素、例えば、左上画素とする。
ここで、図11を参照(適宜図9参照)して、類似度算出手段15Baが類似度を算出する際の視差を求める対象画素と、当該対象画素の視差に対応する対応画素について説明する。ここでは、図11(a)に示すように、基準画像Isにおいて、基準ブロックBsの中心である座標(x1,y1)の画素を、視差を求める画素(対象画素Ps)とする。
このとき、類似度算出手段15Baは、図11(b)に示すように、視差候補抽出手段12で抽出された基準ブロックBsに対応する視差候補のそれぞれについて、対象画素Psに対応する対応画素Prを特定する。すなわち、視差候補の1つを視差dとしたとき、類似度算出手段15Baは、対象画素Psの座標に対して、視差dだけずらした座標(x1+d,y1)の画素を、対応画素Prとする。
そして、類似度算出手段15Baは、基準画像Isにおいて、対象画素Psを含んだ領域、例えば、対象画素Psを中心とした予め定めた大きさの矩形領域(類似度算出用画像領域Rs)と、参照画像Irにおいて、対応画素Prを含んだ領域、例えば、対象画素Psと同様、対応画素Prを中心とした予め定めた大きさの矩形領域(対応画像領域Rr)とで、類似度を算出する。
図9に戻って、視差画像生成装置1Bの構成について説明を続ける。
視差選択手段15Bbは、視差候補抽出手段12で抽出された視差候補の中から、類似度算出手段15Baで算出された類似度が最も高い視差候補を対象画素における視差として選択するものである。
この視差選択手段15Bbは、その選択した視差を、基準画像Isの対象画素における視差として、対象画素と同じ座標上において視差を画素値に設定した視差画像Izを生成する。
このように、視差画像生成装置1Bは、対象画素ごとに、視差候補のうちで最も評価値(画像特徴の類似度)が高い視差を当該対象画素における視差とするため、ブロックに前景と背景が混在している場合であっても、精度のよい視差画像を生成することができる。
この視差画像生成装置1Bは、視差画像生成装置1と同様に、基準画像Isおよび参照画像Irを、それぞれフレーム(またはフィールド)として連続して入力されることで、動画像から、フレーム(またはフィールド)に対応した視差画像を生成することも可能である。
なお、ここでは、ブロック切出手段11Bがブロックを切り出す切り出し間隔を、1画素として説明したが、前記したとおり、最大でブロックの水平、垂直画素数とすることができる。この場合、視差を求める対象画素は、切り出し間隔の水平画素数および垂直画素数で特定される基準ブロックの予め定めた位置の矩形領域の各画素を対象画素とする。
例えば、図12に示すように、ブロックの切り出し間隔が水平、垂直方向ともに2画素である場合、基準ブロックBs内の4画素(水平2画素×垂直2画素)分の矩形領域に含まれる画素を対象画素とする。この場合、類似度算出手段15Baは、図12(a)〜(d)のそれぞれの対象画素Psを基準に類似度算出用画像領域Rsを設定して、視差に対応する参照画像の画像領域との間で、類似度を算出すればよい。
このように、ブロックの切り出し間隔を広げる場合、その間隔に対応させて、基準ブロックBs内の対象画素を増やせば、基準画像Isの全画素について、漏れなく対象画素として視差を求めることができる。
また、ブロック切出手段11Bにおいて、ブロックの切り出し間隔を、ブロックの大きさよりも小さくした場合、例えば、切り出し間隔を1画素とし、ブロック内で視差を求める対象画素を中心画素とした場合、入力画像(基準画像Is,参照画像Ir)からブロックを切り出すと、入力画像の周辺に対象画素として選択されない画素が存在してしまう。
そこで、厳密には、ブロック切出手段11Bは、図13に示すように、ブロックBの視差を求める対象画素が、基準画像Is,参照画像Irの上下左右の両端の画素に存在するように、ブロックBを実際の画像に対してずらした位置から切り出すこととする。その場合、基準画像Is,参照画像Irを超えた画像領域については、予め定めた固定値(例えば、値“0”)や、ブロック内に含まれる基準画像Is,参照画像Irの画像をコピー等することで、仮想的にブロックBを切り出すこととする。これによって、入力画像全体の画素について視差を求め、視差画像を生成することができる。
[視差画像生成装置の動作]
次に、図14を参照(構成については、適宜図9参照)して、参考例の実施形態に係る視差画像生成装置1Bの動作について説明する。なお、ここでは、基準画像Isおよび参照画像Irが連続する動画が、視差画像生成装置1Bに入力されるものとして説明を行う。
まず、視差画像生成装置1Bは、ブロック切出手段11Bによって、基準画像Isおよび参照画像Irを入力する(ステップS11)。
そして、視差画像生成装置1Bは、ブロック切出手段11Bによって、ステップS11で入力された基準画像Isおよび参照画像Irから、予め定めた同じ大きさのブロックである基準ブロックおよび参照ブロックを切り出す(ステップS12)。
すなわち、視差画像生成装置1Bは、ブロック切出手段11Bの基準ブロック切出手段11Baによって、基準画像Isから、基準ブロックを切り出し、ブロック切出手段11Bの参照ブロック切出手段11Bbによって、参照画像Irから、基準ブロックと同じ大きさ、同じ位置で参照ブロックを切り出す。
そして、視差画像生成装置1Bは、視差候補抽出手段12によって、ステップS12で切り出された基準ブロックと参照ブロックとの間で、複数の視差を視差候補として抽出する(ステップS13)。
すなわち、視差画像生成装置1Bは、視差候補抽出手段12の位相相関関数生成手段12aによって、基準ブロックと参照ブロックとにおいて、位相相関法(位相限定相関法)により、位相相関関数を生成する。
そして、視差画像生成装置1Bは、視差候補抽出手段12の極大値視差検出手段12bによって、位相相関関数において、複数の極大値を求め、極大値の大きい順に、位相相関関数の原点座標から極大値を示す座標までの距離に対応する複数の視差を視差候補として抽出する。
そして、視差画像生成装置1Bは、視差候補評価手段15Bによって、視差を求める対象画素において、当該対象画素を含んだブロックの視差候補を評価し、評価値の最も高い視差を、当該対象画素における視差とする。
すなわち、視差画像生成装置1Bは、視差候補評価手段15Bの類似度算出手段15Baによって、ステップS13で抽出された対象画素における複数の視差候補ごとに、当該対象画素を含んだ基準画像Isにおける所定の大きさの画像領域と、参照画像Irにおける対象画素の位置から当該視差だけずらした画素(対応画素)を含んだ所定の大きさの画像領域との画像の類似度を算出する(ステップS14)。
そして、視差画像生成装置1Bは、視差候補評価手段15Bの視差選択手段15Bbによって、ステップS14で算出された類似度(評価値)が最も高い視差を当該対象画素における視差として選択する(ステップS15)。
なお、ブロック切出手段11Bにおいて、ブロックの切り出し間隔が複数画素単位である場合、視差画像生成装置1Bは、このステップS13〜S15の動作を、対象画素分行う(図12参照)。
そして、視差画像生成装置1Bは、視差候補評価手段15Bによって、基準画像Isの全画素について視差を求める対象画素として処理したか、すなわち、視差画像Izの全画素について視差を特定したか否かを判定する(ステップS16)。
このステップS16において、全画素について処理が完了していない場合(ステップS16でNo)、視差画像生成装置1Bは、ステップS12に戻って、ブロック切出手段11Bによって、切り出し位置をずらして、次のブロックを切り出す。
一方、全画素について処理が完了した場合(ステップS16でYes)、視差画像生成装置1Bは、ブロック切出手段11Bによって、動画におけるフレームのすべてについて処理が完了したか否かを判定する(ステップS17)。
そして、視差画像生成装置1Bは、全フレームについて処理が完了しておらず、次フレームとして、他の基準画像Isおよび参照画像Irが入力された場合(ステップS17でNo)、ステップS11に動作を戻す。
一方、視差画像生成装置1Bは、全フレームについて視差画像の生成処理が完了した場合(ステップS17でYes)、動作を終了する。
以上の動作によって、視差画像生成装置1Bは、異なる視点位置で撮影された基準画像Isおよび参照画像Irから、被写体の奥行きを示す視差画像Izを生成することができる。
なお、本発明および参考例の実施形態に係る視差画像生成装置1,1Bは、一般的なCPU、RAM、ROMなどで構成することができ、コンピュータを、前記した各手段として機能させるプログラム(視差画像生成プログラム)で動作させることができる。
以上、本発明および参考例の実施形態に係る視差画像生成装置1,1Bの構成および動作について説明したが、本発明および参考例はこの実施形態に限定されるものではない。
例えば、ここでは、視差画像生成装置1,1Bは、対象画素ごとに1画素単位で視差を求めることとしたが、予め定めた大きさ、例えば、2画素×2画素の範囲についての複数画素を、視差を求める対象画素とし、そのうちの1画素について視差を求め、他の画素についてはその求めた視差と同じとすることとしてもよい。これによって、視差画像の解像度を荒くする代わりに、演算量を減らして高速に視差画像を生成することができる。
また、ここでは、視差画像生成装置1,1Bは、2台のカメラで撮影した画像から、視差画像を生成したが、3台以上のカメラを用いることも可能である。
この場合、視差画像生成装置1,1Bは、ブロック切出手段11,11Bによって、複数のカメラで撮影された画像から、それぞれブロックを切り出すこととし、視差候補抽出手段12が、複数のカメラで撮影された画像のうち、ある基準となるカメラで撮影された画像(基準画像)と他のカメラで撮影された画像(参照画像)とから切り出したブロックをペアとして、それぞれ位相相関関数の極大値を求め、極大値の大きいものから順に視差を抽出すればよい。
あるいは、視差候補抽出手段12が、複数の入力画像(基準画像と複数の参照画像)のうち、基準画像と参照画像との2つの画像のブロックのペアから、それぞれ極大値の大きい視差を抽出し、それぞれのブロックのペアで抽出された視差において、視差候補評価手段15,15Bが、視差に対応する画像の特徴が最も類似する視差を選択することとしてもよい。
また、ここでは、視差画像生成装置1,1Bは、ブロック切出手段11,11Bによって、基準画像と参照画像とから同一の位置でブロック(基準ブロック,参照ブロック)を切り出すこととしたが、予め大まかな視差が既知の場合、必ずしも同一の位置で切り出す必要はない。すなわち、基準ブロックと参照ブロックとを、予め既知の大まかな視差分だけ水平方向にずらして切り出し、求めた視差に予め切り出し位置をずらした視差を加算すればよい。この場合、視差の大きいステレオ画像であっても、位相相関法のブロックのサイズを小さくすることができる。これによって、処理時間を短縮して精度よく視差画像を生成することができる。
1 視差画像生成装置
11 ブロック切出手段
11a 基準ブロック切出手段
11b 参照ブロック切出手段
12 視差候補抽出手段
12a 位相相関関数生成手段
12b 極大値視差検出手段
13 視差候補記憶手段
14 共通視差候補抽出手段
15 視差候補評価手段
15a 類似度算出手段
15b 視差選択手段

Claims (4)

  1. 同一の被写体を異なる視点位置で撮影した一方の画像である基準画像と他方の画像である参照画像とから、前記被写体の奥行きを示す視差画像を生成する視差画像生成装置であって、
    前記基準画像および前記参照画像から、それぞれ予め定めた同じ大きさのブロックである基準ブロックおよび参照ブロックを、対応する位置で同一方向に切り出し位置を順次ずらして切り出すブロック切出手段と、
    このブロック切出手段で切り出された基準ブロックおよび参照ブロックごとに、位相の相関を示す位相相関関数の極大値の大きい順に、前記位相相関関数の原点座標から前記極大値を示す座標までの距離に対応する複数の視差を視差候補として抽出する視差候補抽出手段と、
    この視差候補抽出手段で抽出された視差候補を前記基準ブロックごとに記憶する視差候補記憶手段と、
    前記視差候補記憶手段に記憶されている基準ブロックごとの視差候補から、前記基準画像における視差を求める対象画素ごとに、当該対象画素を含む複数の基準ブロックで共通の視差候補を共通視差候補として抽出する共通視差候補抽出手段と、
    この共通視差候補抽出手段で抽出された対象画素における共通視差候補のそれぞれについて、当該対象画素を含んだ前記基準画像における所定の大きさの画像領域と、前記参照画像における前記対象画素の位置から当該共通視差候補で示される視差だけずらした対応画素を含んだ所定の大きさの画像領域との類似度を算出する類似度算出手段と、
    前記共通視差候補の中から、前記類似度算出手段で算出された類似度が最も高い共通視差候補を前記対象画素における視差として選択する視差選択手段と、
    を備えることを特徴とする視差画像生成装置。
  2. 前記ブロック切出手段は、水平方向においては前記ブロックの水平画素数の半分ずつ、垂直方向においては前記ブロックの垂直画素数の半分ずつ、前記切り出し位置をずらして、前記基準ブロックおよび前記参照ブロックを切り出すことを特徴とする請求項1に記載の視差画像生成装置。
  3. 前記位相相関関数のX座標を視差方向であるブロックの水平方向にとり、Y座標を垂直方向にとったとき、
    前記視差候補抽出手段は、前記位相相関関数の極大値の個数として、当該極大値をとるY座標の値の絶対値が予め定めた閾値よりも大きい個数が、前記ブロックの総画素数に対する予め定めた割合となるまで、当該極大値をとるX座標の値を前記視差候補として抽出することを特徴とする請求項1または請求項2に記載の視差画像生成装置。
  4. 同一の被写体を異なる視点位置で撮影した一方の画像である基準画像と他方の画像である参照画像とから、前記被写体の奥行きを示す視差画像を生成するために、コンピュータを、
    前記基準画像および前記参照画像から、それぞれ予め定めた同じ大きさのブロックである基準ブロックおよび参照ブロックを、対応する位置で同一方向に切り出し位置を順次ずらして切り出すブロック切出手段、
    このブロック切出手段で切り出された基準ブロックおよび参照ブロックごとに、位相の相関を示す位相相関関数の極大値の大きい順に、前記位相相関関数の原点座標から前記極大値を示す座標までの距離に対応する複数の視差を視差候補として抽出して視差候補記憶手段に記憶する視差候補抽出手段、
    前記視差候補記憶手段に記憶されている基準ブロックごとの視差候補から、前記基準画像における視差を求める対象画素ごとに、当該対象画素を含む複数の基準ブロックで共通の視差候補を共通視差候補として抽出する共通視差候補抽出手段、
    この共通視差候補抽出手段で抽出された対象画素における共通視差候補のそれぞれについて、当該対象画素を含んだ前記基準画像における所定の大きさの画像領域と、前記参照画像における前記対象画素の位置から当該共通視差候補で示される視差だけずらした対応画素を含んだ所定の大きさの画像領域との類似度を算出する類似度算出手段、
    前記共通視差候補の中から、前記類似度算出手段で算出された類似度が最も高い共通視差候補を前記対象画素における視差として選択する視差選択手段、
    として機能させることを特徴とする視差画像生成プログラム。
JP2011155697A 2011-07-14 2011-07-14 視差画像生成装置および視差画像生成プログラム Expired - Fee Related JP5654956B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011155697A JP5654956B2 (ja) 2011-07-14 2011-07-14 視差画像生成装置および視差画像生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011155697A JP5654956B2 (ja) 2011-07-14 2011-07-14 視差画像生成装置および視差画像生成プログラム

Publications (2)

Publication Number Publication Date
JP2013021634A JP2013021634A (ja) 2013-01-31
JP5654956B2 true JP5654956B2 (ja) 2015-01-14

Family

ID=47692593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011155697A Expired - Fee Related JP5654956B2 (ja) 2011-07-14 2011-07-14 視差画像生成装置および視差画像生成プログラム

Country Status (1)

Country Link
JP (1) JP5654956B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113205592B (zh) * 2021-05-14 2022-08-05 湖北工业大学 一种基于相位相似性的光场三维重建方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004104425A (ja) * 2002-09-09 2004-04-02 Nippon Hoso Kyokai <Nhk> 視差分布測定方法、視差分布測定装置および視差分布測定プログラム
JP4453976B2 (ja) * 2004-03-30 2010-04-21 正彦 谷内田 画像生成装置、画像データ列生成システム、及び画像伝送システム
JP2009014445A (ja) * 2007-07-03 2009-01-22 Konica Minolta Holdings Inc 測距装置
JP4553071B1 (ja) * 2009-03-31 2010-09-29 コニカミノルタホールディングス株式会社 3次元情報表示装置および3次元情報表示方法
JP2011039801A (ja) * 2009-08-12 2011-02-24 Hitachi Ltd 画像処理装置および画像処理方法
JP5404263B2 (ja) * 2009-09-07 2014-01-29 パナソニック株式会社 視差算出方法、および視差算出装置

Also Published As

Publication number Publication date
JP2013021634A (ja) 2013-01-31

Similar Documents

Publication Publication Date Title
KR100745691B1 (ko) 차폐영역 검출을 이용한 양안 또는 다시점 스테레오 정합장치 및 그 방법
EP2757789A1 (en) Image processing system, image processing method, and image processing program
KR20090055803A (ko) 다시점 깊이맵 생성 방법 및 장치, 다시점 영상에서의변이값 생성 방법
KR101082046B1 (ko) 2차원 영상의 3차원 영상으로의 변환방법 및 그 장치
JP2012181142A (ja) ステレオ画像処理装置及びステレオ画像処理方法
WO2014073670A1 (ja) 画像処理方法及び画像処理装置
JP6052186B2 (ja) 画像処理装置
JP4631973B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
KR100943635B1 (ko) 디지털카메라의 이미지를 이용한 디스패리티 맵 생성 장치 및 방법
JPWO2009096520A1 (ja) 対応点探索装置および対応点探索方法
JP2018036898A (ja) 画像処理装置及びその制御方法
CN108885778B (zh) 图像处理设备和图像处理方法
JP2016099318A (ja) ステレオマッチング装置とステレオマッチングプログラムとステレオマッチング方法
JP6494402B2 (ja) 画像処理装置、撮像装置、画像処理方法、プログラム
JP6655869B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2015019346A (ja) 視差画像生成装置
JP2019120590A (ja) 視差値算出装置、視差値算出方法及びプログラム
JP5654956B2 (ja) 視差画像生成装置および視差画像生成プログラム
US11475233B2 (en) Image processing device and image processing method
JP6456084B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5712810B2 (ja) 画像処理装置、そのプログラム、および画像処理方法
KR20160052256A (ko) 가상 특징점을 이용하는 3차원 공간 매핑장치 및 그 방법
JP5457976B2 (ja) 3次元形状取得装置および3次元形状取得プログラム
KR101804157B1 (ko) 개선된 sgm 기반한 시차 맵 생성 방법
JP2016062447A (ja) 画像処理装置、画像処理方法、および画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140130

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141028

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141121

R150 Certificate of patent or registration of utility model

Ref document number: 5654956

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees