JP4631973B2 - 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム - Google Patents

画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム Download PDF

Info

Publication number
JP4631973B2
JP4631973B2 JP2008537459A JP2008537459A JP4631973B2 JP 4631973 B2 JP4631973 B2 JP 4631973B2 JP 2008537459 A JP2008537459 A JP 2008537459A JP 2008537459 A JP2008537459 A JP 2008537459A JP 4631973 B2 JP4631973 B2 JP 4631973B2
Authority
JP
Japan
Prior art keywords
window
image
edge amount
central portion
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008537459A
Other languages
English (en)
Other versions
JPWO2008041518A1 (ja
Inventor
雄一 川上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Publication of JPWO2008041518A1 publication Critical patent/JPWO2008041518A1/ja
Application granted granted Critical
Publication of JP4631973B2 publication Critical patent/JP4631973B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images

Description

この発明は画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラムに関し、特に基準画像と参照画像との対応関係を演算することができる画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラムに関する。
顔認証や、美容・整形分野において、顔の3次元形状計測のニーズが高い。これらの分野においては、目に強い光を当てるのは好ましくないことや、顔は計測中に動いてしまうことなどから、レーザー光などでスキャンするアクティブ方法よりも、ステレオ方式などのパッシブ方式が適している。
位相限定相関(POC:Phase-Only Correlation)を用いたステレオ対応点探索アルゴリズム(ステレオ画像である基準画像と参照画像とからなる画像における同一点を対応付けるアルゴリズム)は、そのロバスト性・高精度が注目されている。
下記特許文献1は、ステレオカメラに位相限定相関法を応用した貫通穴計測システムを開示している。
下記非特許文献1は、POC演算時におけるウィンドウサイズとノイズの影響について開示している。
特開2006−010392号公報 「位相限定相関法に基づくサブピクセル画像マッチングの高性能化」、計測自動制御学会東北支部、第218回研究集会(2004.10.9)、資料番号218−15
たとえば顔の3次元計測では、頬などの表面を滑らかに再現しつつ、目、鼻、口の周辺など、形状特徴のある部分はその形状を再現したいというニーズがあり、ステレオ3次元計測においてそのニーズを満たすための工夫が必要である。
本発明はそのような課題を解決するためになされたものであり、基準画像と参照画像との対応関係の演算を良好に行なうことができる画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラムを提供することを目的としている。
上記目的を達成するためこの発明のある局面に従うと、画像処理装置は、基準画像と参照画像とを受付ける画像入力手段と、基準画像および参照画像の一方の上に第1のウィンドウを設定する第1のウィンドウ設定手段と、基準画像および参照画像の他方の上に第2のウィンドウを設定する第2のウィンドウ設定手段と第1のウィンドウ内の画像から、少なくとも1つの画像特徴量を抽出する抽出手段と、抽出された画像特徴量に基づいて、第1のウィンドウのサイズおよび形状の少なくとも1つを変更するとともに、第1のウィンドウに対する変更に応じて、第2のウィンドウのサイズまたは形状を変更する変更手段と、変更後の第1のウィンドウ内の画像と変更後の第2のウィンドウ内の画像との対応関係を演算する演算手段とを備える。
好ましくは、画像特徴量は画像のエッジ量を含む。
好ましくは、演算手段は、第1のウィンドウ内の画像と第2のウィンドウ内の画像との相関値に基づいて、基準画像の一点に対応する参照画像の一点を求める。
好ましくは、画像処理装置は、演算手段の演算結果に基づいて、基準画像と参照画像とに含まれる対象物の3次元座標を演算する3次元座標演算部をさらに備える。
好ましくは、抽出手段は、第1のウィンドウ内のエッジ分布を抽出し、変更手段は、エッジ分布に基づいて第1のウィンドウのサイズおよび形状の少なくとも1つを決定する。
好ましくは、抽出手段は、第1のウィンドウの中心部のエッジ量を計測し、変更手段は、第1のウィンドウの中心部のエッジ量が所定量以上であれば、第1のウィンドウのサイズを小さくする。
好ましくは、抽出手段は、第1のウィンドウについての中心部のエッジ量と周辺部のエッジ量とを計測し、変更手段は、第1のウィンドウについての中心部のエッジ量と周辺部のエッジ量との差が所定量以上であれば、第1のウィンドウのサイズを小さくする。
この発明の他の局面に従うと画像処理装置の制御方法は、基準画像と参照画像とを受付けるステップと、基準画像および参照画像の一方の上に第1のウィンドウを設定するステップと、基準画像および参照画像の他方の上に第2のウィンドウを設定するステップと、第1のウィンドウ内の画像から、少なくとも1つの画像特徴量を抽出するステップと、抽出された画像特徴量に基づいて、第1のウィンドウのサイズおよび形状の少なくとも1つを変更するとともに、第1のウィンドウに対する変更に応じて、第2のウィンドウのサイズまたは形状を変更するステップと、変更後の第1のウィンドウ内の画像と変更後の第2のウィンドウ内の画像との対応関係を演算するステップとを備える。
この発明のさらに他の局面に従うとプログラムは、コンピュータに、基準画像と参照画像とを受付けるステップと、基準画像および参照画像の一方の上に第1のウィンドウを設定するステップと、基準画像および参照画像の他方の上に第2のウィンドウを設定するステップと、第1のウィンドウ内の画像から、少なくとも1つの画像特徴量を抽出するステップと、抽出された画像特徴量に基づいて、第1のウィンドウのサイズおよび形状の少なくとも1つを変更するとともに、第1のウィンドウに対する変更に応じて、第2のウィンドウのサイズまたは形状を変更するステップと、変更後の第1のウィンドウ内の画像と変更後の第2のウィンドウ内の画像との対応関係を演算するステップとを実行させる。
この発明のさらに他の局面に従うと画像処理装置は、同一の被写体をそれぞれ撮像して基準画像および参照画像からなるステレオ画像を取得する一対の撮像手段と、基準画像上に第1のウィンドウを設定する第1のウィンドウ設定手段と、参照画像上に第2のウィンドウを設定する第2のウィンドウ設定手段と、演算手段とを備え、演算手段は、第1のウィンドウおよび第2のウィンドウのいずれか一方のウィンドウ内の画像から、少なくとも1つの画像特徴量を抽出する手段と、抽出された画像特徴量に基づいて、一方のウィンドウのサイズおよび形状の少なくとも1つを変更するとともに、一方のウィンドウに対する変更に応じて、他方のウィンドウのサイズまたは形状を変更する手段と、変更後の第1のウィンドウ内の画像と変更後の第2のウィンドウ内の画像との対応関係を演算する手段とを含む。
これらの発明に従うと、基準画像と参照画像との対応関係の演算を良好に行なうことができる画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラムを提供することができる。
本発明の実施の一形態に従う3次元計測装置の構成を示す図である。 図1の演算処理装置200のハードウェア構成を示すブロック図である。 演算処理装置200の機能構成を示すブロック図である。 注目点のスキャンを説明するための図である。 注目点のスキャン処理を示すフローチャートである。 基準画像のウィンドウ設定処理を示す図である。 参照画像のウィンドウ設定処理を示す図である。 位相比較部211の実行する第1の処理を示す図である。 位相比較部211の実行する第2の処理を示す図である。 位相限定相関(POC)関数の具体例を示す図である。 3次元座標演算部215が実行する処理を示す図である。 ウィンドウ設定部201の構成を示す図である。 ウィンドウサイズの決定処理を説明するための図である。 基準画像の具体例とウィンドウサイズの設定例を示す図である。 ウィンドウの設定の第1変形例を示す図であり、図13に対応する図である。 本発明のステレオ3次元計測を利用した車載カメラへの適用を説明するための図である。
符号の説明
100R,100L カメラ、200 演算処理装置、201 ウィンドウ設定部、203 基準画像ウィンドウ設定部、205 参照画像ウィンドウ設定部、207,209 DFT部、211 位相比較部、213 位置ズレ演算部、215 3次元座標演算部、300 表示装置。
図1を参照して、本発明の実施の一形態に従う3次元計測装置は、左右に並べられた2台のカメラ100R,100Lと、カメラに接続される演算処理装置200と、表示装置300とから構成される。
カメラ100R,100Lは、被写体O(ここでは人物の顔を例示している)の2次元画像を撮影する。カメラ100Rとカメラ100Lとは、所定距離左右に離されて設置される。これにより、ステレオ画像を得ることが可能である。
演算処理装置200は、2台のカメラで撮影された画像から、被写体の3次元形状を演算する。表示装置300は、計測された被写体の3次元形状を表示する。なお、表示を行なわずに、得られた3次元形状データ(X、Y、Z座標などからなるデータ)を記憶媒体に記憶するようにしてもよい。
図2を参照して、演算処理装置200は、装置全体の制御を行なうCPU601と、ネットワークに接続したり外部と通信を行なうためのLAN(ローカルエリアネットワーク)カード607(またはモデムカード)と、キーボードやマウスなどにより構成される入力装置609と、フレキシブルディスクドライブ611と、CD−ROMドライブ613と、ハードディスクドライブ615と、RAM617と、ROM619とを備えている。
演算処理装置200は、映像入力部651を介してカメラの画像を受信する。
また演算処理装置200は、表示装置(ディスプレイ)300に接続されている。
フレキシブルディスクドライブ611により、フレキシブルディスクFに記録されたプログラムや画像などのデータを読取ることが可能であり、CD−ROMドライブ613により、CD−ROM613aに記録されたプログラムや画像などのデータを読取ることが可能である。
なお、演算処理装置200にステレオ写真などの画像を入力するためのDVDドライブ、メモリーカードリーダなどを備えさせることも可能である。画像の蓄積のためには、ハードディスクドライブを用いることが好ましい。
また、写真などの画像表示のために、テレビへのビデオ信号出力端子を装備することとしてもよい。
図3を参照して演算処理装置200は、カメラ100Lが撮影した画像である基準画像I1と、カメラ100Rが撮影した画像である参照画像I2とを受信する。
演算処理装置200は、基準画像I1の特徴に基づいて基準画像に対して用いるウィンドウのサイズ(または形状など)を設定するウィンドウ設定部201と、基準画像I1をスキャンするためのウィンドウの位置を設定する基準画像ウィンドウ設定部203と、参照画像I2をスキャンするためのウィンドウの位置を設定する参照画像ウィンドウ設定部205と、基準画像のウィンドウで示される部分に対して2次元離散フーリエ変換(2D DFT)を行なうDFT部207と、参照画像のウィンドウで示される部分に対して2次元離散フーリエ変換を行なうDFT部209と、DFT処理後の2つの画像の位相の比較を行なう位相比較部211と、2つの画像のずれを演算する位置ズレ演算部213と、位置のずれに基づき被写体O表面の3次元座標を演算する3次元座標演算部215とを備える。
なお基準画像のウィンドウ内の画像をf、そのDFT処理後の画像をF、参照画像のウィンドウ内の画像をg、そのDFT処理後の画像をG、位相比較部211の出力である合成位相スペクトルをR、位置ズレ演算部213の出力であるPOC関数をrの記号でそれぞれ表わしている。
次に、図4を参照して、注目点のスキャンについて説明する。
演算処理装置200は、基準画像I1上に注目点Pを設定し、参照画像I2上の注目点Pに対応する位置を見つけることで、注目点における両画像の位置ずれを検出する。さらに、演算処理装置200は、検出された位置ずれに基づいてその注目点における3次元座標を演算する。
図5を参照して、注目点のスキャン処理について説明する。
演算処理装置200は、スキャンが終了するまで(S101でNO)、注目点を移動させつつ3次元座標の演算を行ない(S103)、スキャン終了(S101でYES)とともに演算処理を中止する。これにより、注目点のスキャンに基づく3次元点群を得ることができる。
図6を参照して、基準画像のウィンドウ設定処理について説明する。まず、演算処理装置200は、基準画像I1において注目点Pを中心とするウィンドウW1を設定する。このとき、注目点Pの周辺の画像のエッジ情報に基づいてウィンドウW1のサイズ(または形状)を決定する。この決定処理については、後述する。
図7を参照して、参照画像のウィンドウ設定処理について説明する。演算処理装置200は、参照画像I2上でウィンドウW2(サイズ、形状はウィンドウW1と同じ)を走査し、最も基準画像I1上のウィンドウW1内の画像に近いパターンを参照画像上の対応箇所とする。近さの判定は、それぞれのウィンドウ間の相関演算や、SAD(Sum of Absolute Differences)演算などで実行することができる。これにより、基準画像I1上の注目点Pに対応する点を設定することができる。
なお図7においては、縦方向にもウィンドウを動かすようにしているが、2台のカメラを水平に設置するのであれば、基準画像と参照画像とでの画像ズレは横方向にしか生じないため、横方向のみにウィンドウを動かすようにしてもよい。
さらに参照画像のウィンドウは、広範囲に動かすことで基準画像との対応関係を調べてもよいが、探索の「初期値」を予め決めておき、その初期値から所定範囲内だけ参照画像のウィンドウを動かすことで、基準画像と参照画像との対応を調べるようにしてもよい。すなわち、解像度の低い画像を用いて基準画像と参照画像との対応関係を求め、その結果を用いて解像度の高い画像での初期値を設定するようにしてもよい。
画像サイズN×Nピクセルの2つの画像を、f(n,n)およびg(n,n)とする。定式化の便宜上、離散空間のインデックスをn=−M,…,M、n=−M,…,Mとし、画像サイズをN=2M+1ピクセル、N=2M+1ピクセルとする。これらの画像の2次元離散フーリエ変換(2D DFT)をそれぞれF(k,k)、G(k,k)として、次式で与える。
Figure 0004631973
図8を参照して、位相比較部211の実行する第1の処理について説明する。DFT部207および209が、それぞれF(k,k)およびG(k,k)を算出し、位相比較部211がそれらの合成である、
Figure 0004631973
を算出する。2つのウィンドウ内の画像の位置ズレは(4)式の位相の傾きとして表現される。
図9を参照して、位相比較部211の実行する第2の処理を説明する。
ここでは図8に示される演算結果から、
Figure 0004631973
を算出する処理が実行される。位置ズレ演算部213では、まず、周波数域で位相比較された位相差スペクトルを、逆フーリエ変換することで位相限定相関(POC)関数を演算する。
Figure 0004631973
図10に示されるように、位相限定相関(POC)関数は、画像間(基準ウィンドウと参照ウィンドウとの間)の移動量の座標に急峻な相関ピークを持つ性質があり、画像マッチングにおけるロバスト性と移動量推定精度が高いというという特徴がある。したがって、位置ズレ演算部213は、POCのピークを推定することにより画像の位置ズレ量を演算する。POCは離散的に算出されるため、ピーク位置をサブピクセルで推定することにより、対応点座標を高い分解能で求めることができる。補間を行なう場合には、放物線などの関数をフィッティングする方法などを用いることができる。
図11を参照して、3次元座標演算部215が実行する処理について説明する。ここでは、基準画像を捉えるカメラを基準カメラ、参照画像を捉えるカメラを参照カメラと呼び、図11では、その撮影面と撮影対象物と焦点位置との位置関係を示している。
本実施の形態においては説明の簡素化の為に、ステレオカメラの収差は良好に補正されており、かつ2台のカメラは平行に設置されているものとする。実際のハードがこのような条件に無いとしても、画像処理により同等の画像に変換することが可能である。
図11において、基準カメラと参照カメラとのそれぞれで捉えた画像において、対応する点の位置の差がΔdであった場合に、対象物までの距離Dは、下式で計算される。なおここで、カメラの基線長(2台のカメラの光軸間の距離)をB、カメラレンズの焦点距離をfとする。
Figure 0004631973
このようにして、位置ズレ演算部213で求めた画像間のΔdを用いて、注目点Pまでの距離をもとめ、3次元モデルを作成することができる。
図12を参照して、ウィンドウ設定部201の構成について説明する。ウィンドウ設定部201は、注目点を中心とした所定サイズのウィンドウを設定するデフォルトウィンドウ設定部401と、ウィンドウ内の画像からエッジ成分を抽出するエッジ抽出部403と、ウィンドウの中心部のエッジ量を演算する中心部エッジ量演算部405と、ウィンドウの周辺部のエッジ量を演算する周辺部エッジ量演算部407と、演算結果に基づいて基準画像に用いるウィンドウのサイズを決定するウィンドウサイズ決定部409とから構成される。
ウィンドウ設定部201は、ウィンドウ内のエッジ領域を抽出し、エッジの分布に基づいてウィンドウサイズを変更する。より具体的には、ウィンドウ中央部にエッジ分布がある場合は、ウィンドウを小さくする。また、ウィンドウ中央部にエッジ分布がなく、周辺部にある場合も、ウィンドウを小さくする。なお、エッジ分布に応じてウィンドウ形状を設定するようにしてもよい。たとえばウィンドウの縦横比を変えるなどである。
図13を参照して、ウィンドウサイズの決定処理について説明する。
デフォルトウィンドウ設定部401は、注目点を中心としたデフォルトのウィンドウを設定する。これは、図13中のサイズAで示される最も広い領域をカバーするウィンドウである。
エッジ抽出部403は、サイズAのウィンドウ内の画像にラプラシアンフィルタをかけることで、エッジ画像を得る。
中心部エッジ量演算部405は、サイズAのウィンドウの中心部のエッジ量を演算する。図13においては、サイズCで示される中央部の最も小さいエリアC−1と、エリアC−1を含み、エリアC−1よりも広くサイズAのエリアよりも狭いエリアC−2とのエッジ量が演算される。ここに、C−1およびC−2の各エリアのエッジ量を、L(C−1)およびL(C−2)と表記する。
エッジ量の演算は、たとえば、対象エリア内のエッジ画像の画素値の平均により求めることができる。
周辺部エッジ量演算部407は、サイズAのウィンドウ内の外縁部(周辺部)であるエリアS−1〜S−8それぞれのエッジ量を演算する。ここに、S−1〜S−8それぞれのエリアのエッジ量を、L(S−1)〜L(S−8)と表記する。
ウィンドウサイズ決定部409は、ウィンドウのサイズを以下のように決定する(ここに、th1は所定のしきい値)。
If [L(C−1)>th1] ウィンドウサイズ:サイズC
else If [L(C−1)≒L(S−1)]&[L(C−1)≒L(S−2)]&…&[L(C−1)≒L(S−8)] ウィンドウサイズ:サイズA
else
if [L(C−1)>L(C−2)] ウィンドウサイズ:サイズC
else ウィンドウサイズ:サイズB
すなわち、
(1) 中心のエリアC−1にエッジが多ければ、その位置についての詳細な3次元座標を求めるために、最小のウィンドウを用いる。
(2) 上記(1)でない場合に、中心のエリアC−1と周辺のエリアS1〜S8とでエッジ量の差があまりないときには、平坦な形状であるとして、最大のウィンドウで画像のマッチングを行なう。
(3) 上記(2)でもない場合に、中サイズのエリアC−2のエッジ量よりも、最小サイズのエリアC−1のエッジ量が多いのであれば、最小のウィンドウを用いる。
(4) 上記(3)でもない場合には、エリアC−2にエッジが多いことを示すため、サイズBのウィンドウを用いる。
図14を参照して、基準画像の具体例とウィンドウサイズの設定例を説明する。ここでは、基準画像として人物の顔を撮影した例を示しており、その眼の近くでウィンドウを設定している状態を示している。眼がEで示され、その下にある皺がFで示されている。
Wcで示されるようにデフォルトウィンドウの中央部分に皺などのエッジ成分がしきい値以上あれば、サイズCのウィンドウが選択される。また、Waで示されるように、デフォルトウィンドウ内において、中央部と周辺部のエッジの差があまりない場合には、サイズAのウィンドウが選択される。また、Wbで示されるように、サイズBのウィンドウの周縁部にエッジ成分があれば、サイズBのウィンドウが選択される。
このような処理により、顔の3D復元を例に取ると、頬においては、大きいウィンドウを用いて対応付けして、滑らかな面の形状を再現することができる。また、目の周辺においては、ウィンドウを小さくすることにより、高い分解能で形状計測が出来る。
[第1変形例]
図15は、ウィンドウの設定の第1変形例を示す図であり、図13に対応する図である。図15におけるサイズA、B、Cのウィンドウは、図13おけるそれと同じである。また、エリアC−2,C−1がそれぞれサイズB、Cのウィンドウに相当することも同様であり、エリアS1〜S8が、サイズAのウィンドウの周縁部を構成していることも同様である。
図15においては、縦方向に長い、エリアS−2,C−1,S−6からなるウィンドウをサイズD−1のウィンドウと定義する。また、横方向に長い、エリアS−8,C−1,S−4からなるウィンドウをサイズD−2のウィンドウと定義する。
このように、ウィンドウは、必ずしも正方形に設定する必要はない。
ウィンドウ形状の決定方法として、各ウィンドウのエッジ量をL(*)と表記すると、
If [L(C−1)>th1] ウィンドウサイズ:サイズC
else If [L(C−1)≒L(S−1)]&[L(C−1)≒L(S−2)]&…&[L(C−1)≒L(S−8))] ウィンドウサイズ:サイズA
else
if [L(C−1)≒L(S−8)]&[L(C−1)≒L(S−4)] ウィンドウサイズ:サイズD−2
else if [L(C−1)≒L(S−2)]&[L(C−1)≒L(S−6)] ウィンドウサイズ:サイズD−1
else
if [L(C−1)>L(C−2)] ウィンドウサイズ:サイズC
else ウィンドウサイズ:サイズB
すなわち、
(1) 中心のエリアC−1にエッジが多ければ、その位置についての詳細な3次元座標を求めるために、最小のウィンドウを用いる。
(2) 上記(1)でない場合に、中心のエリアC−1と周辺のエリアS1〜S8とでエッジ量の差があまりないときには、平坦な形状であるとして、最大のウィンドウで画像のマッチングを行なう。
(3) 上記(2)でもない場合に、注目点から見て横方向に似通ったエッジ成分が続くのであれば、横長のウィンドウを設定する。
(4) 上記(3)でもない場合に、注目点から見て縦方向に似通ったエッジ成分が続くのであれば、縦長のウィンドウを設定する。
(5) 上記(4)でもない場合に、中サイズのエリアC−2のエッジ量よりも、最小サイズのエリアC−1のエッジ量が多いのであれば、最小のウィンドウを用いる。
(6) 上記(5)でもない場合には、エリアC−2にエッジが多いことを示すため、サイズBのウィンドウを用いる。
なお、エッジ情報に限らず、テクスチャ情報、輝度分布などの画像特徴量に基づいてウィンドウのサイズや形状を変えるようにしてもよい。
上述の実施の形態においては、ウィンドウ設定部201が基準画像に設定したウィンドウから画像特徴量を抽出する構成について例示したが、画像特徴量を抽出するためのウィンドウは基準画像I1上および参照画像I2のいずれであってもよい。
[第2変形例]
上述の実施の形態においては、ステレオ画像における対応点の探索手法として、位相限定相関(POC)を用いる構成について例示したが、この探索手法に限られることはない。代替的に、例えば、類似度ピーク探索手法などを用いてもよい。以下、この類似度ピーク探索手法を用いてステレオ対応付けを行なう場合の処理について説明する。
再度、図6および図7を参照して、まず、位相限定相関(POC)を用いる場合と同様に、基準画像I1上に注目点Pを中心とするウィンドウW1を設定する(図6)とともに、参照画像I2上に基準画像I1上の注目点に対応するウィンドウW2を設定する(図7)。次に、参照画像I2上でウィンドウW2を走査し、両ウィンドウを互いに比較する。この比較の結果、基準画像I1上のウィンドウW1に最も近いパターン(パターン間距離が最も小さいもの)となるウィンドウW2を参照画像上における対応するウィンドウとする。
ここで、基準画像I1上のウィンドウW1と参照画像I2上のウィンドウW2とのパターン間距離は、両ウィンドウ間の相関演算、SSD演算、SAD演算などに基づいて算出される。具体的には、以下のような演算式に従って、パターン間距離が算出される。
Figure 0004631973
上述のような演算式に従って算出されたパターン間距離は、類似度値へ変換される。この類似度値は、パターン間距離が小さいほど大きな値となるように決定される。一例として、類似度を0〜1の範囲で規格化した場合には、類似度値S(d)は以下のような変換式によって算出される。
Figure 0004631973
この変換式によれば、パターン間距離が「0」の場合に、類似度は「1」をとる。
さらに、以上のような処理によって算出される類似度値に基づいて、ピーク周辺に対して、たとえばパラボラフィッティング法などを用いて、サブピクセル類似演算を行なってもよい。
上述の実施の形態においては、本発明をステレオ3次元計測の顔認証に適用する場合について例示したが、たとえばステレオ3次元計測を利用した車載カメラにも適用することもできる。
図16を参照して、たとえば、前方車両領域などのコントラストが高い部分については、相対的に小さいウィンドウを用いることで、横方向分解能を上げて、距離測定を行なうことができる。また、道路面などのコントラストが低い部分については、相対的に大きなウィンドウを用いて、ロバストな距離測定を行なうことができる。
[実施の形態における効果]
上記実施の形態によると、位相限定相関法(POC)などの探索手法を用いたステレオ対応付けにおいて、対応付けウィンドウ内のテクスチャ分布状態に応じて、相関計算を行なうウィンドウの大きさを適応的に変更することができる。POC処理において、ウィンドウの大きさは、空間分解能と耐ノイズ性に関連し、互いに相反する特性を持つ。空間分解能の必要な部分ではウィンドウサイズを小さく、不必要な部分ではウィンドウサイズを大きくしてノイズの影響を減らしたいというニーズがある。本実施の形態では、ウィンドウ内の画像特徴量(テクスチャ情報、輝度分布、エッジ情報など)の分布に基づいてウィンドウサイズを制御することで、そのような状況に対応することができる。
[その他]
上述の実施の形態における処理は、ソフトウエアによって行なっても、ハードウェア回路を用いて行なってもよい。
また、上述の実施の形態における処理を実行するプログラムを提供することもできるし、そのプログラムをCD−ROM、フレキシブルディスク、ハードディスク、ROM、RAM、メモリカードなどの記録媒体に記録してユーザに提供することにしてもよい。また、プログラムはインターネットなどの通信回線を介して、装置にダウンロードするようにしてもよい。
なお、上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

Claims (8)

  1. 基準画像と参照画像とを受付ける画像入力手段と、
    前記基準画像および前記参照画像の一方の上に第1のウィンドウを設定する第1のウィンドウ設定手段と、
    前記基準画像および前記参照画像の他方の上に第2のウィンドウを設定する第2のウィンドウ設定手段と、
    前記第1のウィンドウ内の画像から、少なくとも1つの画像特徴量を抽出する抽出手段とを備え、前記画像特徴量は画像のエッジ量を含み、
    前記抽出された画像特徴量に基づいて、前記第1のウィンドウのサイズおよび形状の少なくとも1つを変更するとともに、前記第1のウィンドウに対する変更に応じて、前記第2のウィンドウのサイズまたは形状を変更する変更手段と、
    変更後の第1のウィンドウ内の画像と変更後の第2のウィンドウ内の画像との対応関係を演算する演算手段とを備え、
    前記抽出手段は、前記第1のウィンドウを所定の初期サイズに設定した状態において、前記第1のウィンドウ内についての、中心部のエッジ量と周辺部のエッジ量とを計測し、
    前記変更手段は、
    前記中心部のエッジ量が前記周辺部のエッジ量に比較して所定量以上多くなっていれば、前記第1のウィンドウを中心部に対応するサイズまで小さくし、
    前記中心部のエッジ量と前記周辺部のエッジ量とが同程度であれば、前記第1のウィンドウを前記初期サイズに維持する、画像処理装置。
  2. 前記抽出手段は、前記初期サイズに設定された第1のウィンドウについて、中心部および周辺部のいずれかに対応して、同一サイズに区分された各エリアにおけるエッジ量を計測し、
    前記変更手段は、中心部および周辺部にそれぞれ対応するエリア間でエッジ量を比較する、請求項1に記載の画像処理装置。
  3. 前記抽出手段は、中心部に対応するエリアと、中心部より大きくかつ前記初期サイズより小さい拡大中心部に対応するエリアとのそれぞれにおけるエッジ量を計測し、
    前記変更手段は、
    前記中心部のエッジ量が前記周辺部のエッジ量に比較して所定量以上多くなっておらず、かつ、前記中心部のエッジ量と前記周辺部のエッジ量とが同程度でない場合には、中心部に対応するエリアのエッジ量と拡大中心部に対応するエリアのエッジ量とを比較し、
    中心部に対応するエリアのエッジ量が拡大中心部に対応するエリアのエッジ量に比較して多いときに、前記第1のウィンドウを中心部に対応するサイズまで小さくし、
    拡大中心部に対応するエリアのエッジ量が中心部に対応するエリアのエッジ量に比較して多いときに、前記第1のウィンドウを拡大中心部に対応するサイズまで小さくする、請求項1または2に記載の画像処理装置。
  4. 前記演算手段は、前記第1のウィンドウ内の画像と前記第2のウィンドウ内の画像との相関値に基づいて、前記基準画像の一点に対応する前記参照画像の一点を求める、請求項1〜3のいずれか1項に記載の画像処理装置。
  5. 前記演算手段の演算結果に基づいて、前記基準画像と前記参照画像とに含まれる対象物の3次元座標を演算する3次元座標演算部をさらに備える、請求項1〜のいずれか1項に記載の画像処理装置。
  6. 基準画像と参照画像とを受付けるステップと、
    前記基準画像および前記参照画像の一方の上に第1のウィンドウを設定するステップと、
    前記基準画像および前記参照画像の他方の上に第2のウィンドウを設定するステップと、
    前記第1のウィンドウ内の画像から、少なくとも1つの画像特徴量を抽出するステップとを備え、前記画像特徴量は画像のエッジ量を含み、
    前記抽出された画像特徴量に基づいて、前記第1のウィンドウのサイズおよび形状の少なくとも1つを変更するとともに、前記第1のウィンドウに対する変更に応じて、前記第2のウィンドウのサイズまたは形状を変更するステップと、
    変更後の第1のウィンドウ内の画像と変更後の第2のウィンドウ内の画像との対応関係を演算するステップとを備え、
    前記抽出するステップは、前記第1のウィンドウを所定の初期サイズに設定した状態において、前記第1のウィンドウ内についての、中心部のエッジ量と周辺部のエッジ量とを計測するステップを含み、
    前記変更するステップは、
    前記中心部のエッジ量が前記周辺部のエッジ量に比較して所定量以上多くなっていれば、前記第1のウィンドウを中心部に対応するサイズまで小さくするステップと、
    前記中心部のエッジ量と前記周辺部のエッジ量とが同程度であれば、前記第1のウィンドウを前記初期サイズに維持するステップとを含む、画像処理装置の制御方法。
  7. コンピュータに、
    基準画像と参照画像とを受付けるステップと、
    前記基準画像および前記参照画像の一方の上に第1のウィンドウを設定するステップと、
    前記基準画像および前記参照画像の他方の上に第2のウィンドウを設定するステップと、
    前記第1のウィンドウ内の画像から、少なくとも1つの画像特徴量を抽出するステップとを備え、前記画像特徴量は画像のエッジ量を含み、
    前記抽出された画像特徴量に基づいて、前記第1のウィンドウのサイズおよび形状の少なくとも1つを変更するとともに、前記第1のウィンドウに対する変更に応じて、前記第2のウィンドウのサイズまたは形状を変更するステップと、
    変更後の第1のウィンドウ内の画像と変更後の第2のウィンドウ内の画像との対応関係を演算するステップとを実行させえ、
    前記抽出するステップは、前記第1のウィンドウを所定の初期サイズに設定した状態において、前記第1のウィンドウ内についての、中心部のエッジ量と周辺部のエッジ量とを計測するステップを含み、
    前記変更するステップは、
    前記中心部のエッジ量が前記周辺部のエッジ量に比較して所定量以上多くなっていれば、前記第1のウィンドウを中心部に対応するサイズまで小さくするステップと、
    前記中心部のエッジ量と前記周辺部のエッジ量とが同程度であれば、前記第1のウィンドウを前記初期サイズに維持するステップとを含む、プログラム。
  8. 同一の被写体をそれぞれ撮像して基準画像および参照画像からなるステレオ画像を取得する一対の撮像手段と、
    前記基準画像上に第1のウィンドウを設定する第1のウィンドウ設定手段と、
    前記参照画像上に第2のウィンドウを設定する第2のウィンドウ設定手段と、
    演算手段とを備え、
    前記演算手段は、
    前記第1のウィンドウおよび前記第2のウィンドウのいずれか一方のウィンドウ内の画像から、少なくとも1つの画像特徴量を抽出する手段を含み、前記画像特徴量は画像のエッジ量を含み、
    前記抽出された画像特徴量に基づいて、前記一方のウィンドウのサイズおよび形状の少なくとも1つを変更するとともに、前記一方のウィンドウに対する変更に応じて、他方のウィンドウのサイズまたは形状を変更する手段と、
    変更後の第1のウィンドウ内の画像と変更後の第2のウィンドウ内の画像との対応関係を演算する手段とを含み、
    前記抽出する手段は、前記第1のウィンドウを所定の初期サイズに設定した状態において、前記第1のウィンドウ内についての、中心部のエッジ量と周辺部のエッジ量とを計測し、
    前記変更する手段は、
    前記中心部のエッジ量が前記周辺部のエッジ量に比較して所定量以上多くなっていれば、前記第1のウィンドウを中心部に対応するサイズまで小さくし、
    前記中心部のエッジ量と前記周辺部のエッジ量とが同程度であれば、前記第1のウィンドウを前記初期サイズに維持する、画像処理装置。
JP2008537459A 2006-10-02 2007-09-21 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム Active JP4631973B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006270725 2006-10-02
JP2006270725 2006-10-02
PCT/JP2007/068389 WO2008041518A1 (fr) 2006-10-02 2007-09-21 Dispositif de traitement d'images, procédé de commande pour un dispositif de traitement d'images et programme de commande pour un dispositif de traitement d'images

Publications (2)

Publication Number Publication Date
JPWO2008041518A1 JPWO2008041518A1 (ja) 2010-02-04
JP4631973B2 true JP4631973B2 (ja) 2011-02-16

Family

ID=39268380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008537459A Active JP4631973B2 (ja) 2006-10-02 2007-09-21 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム

Country Status (3)

Country Link
US (1) US8164645B2 (ja)
JP (1) JP4631973B2 (ja)
WO (1) WO2008041518A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2013108554A1 (ja) * 2012-01-17 2015-05-11 コニカミノルタ株式会社 画像処理装置、画像処理方法および画像処理プログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8164645B2 (en) 2006-10-02 2012-04-24 Konica Minolta Holdings, Inc. Image processing apparatus, method of controlling image processing apparatus, and program for controlling image processing apparatus
JP5733490B2 (ja) * 2010-05-27 2015-06-10 ジーイー・メディカル・システムズ・グローバル・テクノロジー・カンパニー・エルエルシー 磁気共鳴イメージング装置およびプログラム
CN102859320A (zh) * 2011-04-28 2013-01-02 三洋电机株式会社 信息取得装置以及物体检测装置
JP2013190938A (ja) * 2012-03-13 2013-09-26 Ricoh Co Ltd ステレオ画像処理装置
JPWO2014024655A1 (ja) * 2012-08-09 2016-07-25 コニカミノルタ株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP2016075658A (ja) * 2014-10-03 2016-05-12 株式会社リコー 情報処理システムおよび情報処理方法
US10915782B2 (en) * 2017-12-14 2021-02-09 Pixart Imaging Inc. Image parameter calculating method, object tracking method, and image parameter calculating system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000088523A (ja) * 1998-09-09 2000-03-31 Tech Res & Dev Inst Of Japan Def Agency 特徴ベクトルを利用した物体の認識装置および方法
JP2001194126A (ja) * 2000-01-14 2001-07-19 Sony Corp 三次元形状計測装置および三次元形状計測方法、並びにプログラム提供媒体

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69212035T2 (de) * 1991-04-08 1997-01-09 Matsushita Electric Ind Co Ltd Bildverarbeitungsgerät
US5684890A (en) * 1994-02-28 1997-11-04 Nec Corporation Three-dimensional reference image segmenting method and apparatus
US6269195B1 (en) * 1997-04-04 2001-07-31 Avid Technology, Inc. Apparatus and methods for selectively feathering a composite image
JP3120767B2 (ja) * 1998-01-16 2000-12-25 日本電気株式会社 外観検査装置、外観検査方法及び外観検査プログラムを記録した記録媒体
JP2000209425A (ja) * 1998-11-09 2000-07-28 Canon Inc 画像処理装置及び方法並びに記憶媒体
JP2002071309A (ja) * 2000-08-24 2002-03-08 Asahi Optical Co Ltd 3次元画像検出装置
TWI223780B (en) * 2001-01-24 2004-11-11 Vrex Inc Method for zooming a stereoscopic image, article of manufacture comprising a computer usable medium, computer related product for use with a graphics display device, and program storage device readable by a machine and tangibly embodying a program of iK
US6947607B2 (en) * 2002-01-04 2005-09-20 Warner Bros. Entertainment Inc. Reduction of differential resolution of separations
JP2006010392A (ja) 2004-06-23 2006-01-12 Suzuki Motor Corp 貫通穴計測システム及び方法並びに貫通穴計測用プログラム
US8189100B2 (en) * 2006-07-25 2012-05-29 Qualcomm Incorporated Mobile device with dual digital camera sensors and methods of using the same
JP4821548B2 (ja) * 2006-10-02 2011-11-24 コニカミノルタホールディングス株式会社 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
US8164645B2 (en) 2006-10-02 2012-04-24 Konica Minolta Holdings, Inc. Image processing apparatus, method of controlling image processing apparatus, and program for controlling image processing apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000088523A (ja) * 1998-09-09 2000-03-31 Tech Res & Dev Inst Of Japan Def Agency 特徴ベクトルを利用した物体の認識装置および方法
JP2001194126A (ja) * 2000-01-14 2001-07-19 Sony Corp 三次元形状計測装置および三次元形状計測方法、並びにプログラム提供媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2013108554A1 (ja) * 2012-01-17 2015-05-11 コニカミノルタ株式会社 画像処理装置、画像処理方法および画像処理プログラム

Also Published As

Publication number Publication date
JPWO2008041518A1 (ja) 2010-02-04
US20100007756A1 (en) 2010-01-14
US8164645B2 (en) 2012-04-24
WO2008041518A1 (fr) 2008-04-10

Similar Documents

Publication Publication Date Title
JP4631973B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
CN110998659B (zh) 图像处理系统、图像处理方法、及程序
JP4821548B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
US20120321173A1 (en) Information processing method and information processing apparatus
US20120162220A1 (en) Three-dimensional model creation system
US20160050372A1 (en) Systems and methods for depth enhanced and content aware video stabilization
CN109360235A (zh) 一种基于光场数据的混合深度估计方法
JP2008535116A (ja) 3次元レンダリング用の方法及び装置
US8531505B2 (en) Imaging parameter acquisition apparatus, imaging parameter acquisition method and storage medium
JP5965293B2 (ja) カメラポーズ推定装置、及びカメラポーズ推定プログラム
JP6052186B2 (ja) 画像処理装置
JP2019530059A (ja) 複数の対象とする領域を独立的に処理する方法
WO2009096520A1 (ja) 対応点探索装置および対応点探索方法
Hernandez et al. Near laser-scan quality 3-D face reconstruction from a low-quality depth stream
JP2010152521A (ja) 画像立体化処理装置及び方法
US20230401855A1 (en) Method, system and computer readable media for object detection coverage estimation
WO2019123554A1 (ja) 画像処理装置、画像処理方法、及び、記録媒体
JP2000268161A (ja) 実時間表情検出装置
CN111462337A (zh) 一种图像处理方法、设备及计算机可读存储介质
KR101711307B1 (ko) 깊이정보 기반의 안면인식 휴대장치 또는 컴퓨터 기기 잠금해제시스템
CN111091513A (zh) 图像处理方法、装置、计算机可读存储介质及电子设备
Jonscher et al. Reconstruction of images taken by a pair of non-regular sampling sensors using correlation based matching
JP4775221B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
Lee et al. Fast panoramic image generation method using morphological corner detection
CN115482182A (zh) 人脸深度图像的面部变形补偿方法、成像装置和存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101019

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101101

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4631973

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350