JP2002183732A - パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体 - Google Patents

パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体

Info

Publication number
JP2002183732A
JP2002183732A JP2000378612A JP2000378612A JP2002183732A JP 2002183732 A JP2002183732 A JP 2002183732A JP 2000378612 A JP2000378612 A JP 2000378612A JP 2000378612 A JP2000378612 A JP 2000378612A JP 2002183732 A JP2002183732 A JP 2002183732A
Authority
JP
Japan
Prior art keywords
image
pixels
target
ternary
comparison image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000378612A
Other languages
English (en)
Other versions
JP3819236B2 (ja
Inventor
Osamu Yamaguchi
修 山口
Kazuhiro Fukui
和広 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000378612A priority Critical patent/JP3819236B2/ja
Publication of JP2002183732A publication Critical patent/JP2002183732A/ja
Application granted granted Critical
Publication of JP3819236B2 publication Critical patent/JP3819236B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 変動に強い類似性測度を用いて、計算コスト
を抑えつつ、検出精度のより高いパターン認識方法及び
及びパターン認識を行わせるプログラムを記憶したコン
ピュータ読み取り可能な記憶媒体の提供。 【解決手段】 列方向及び行方向にそれぞれ複数の画素
を配列した第1の画像中の、2個の画素間の濃淡値を比較
し、その大小関係または同値関係を3値で表した基準3値
比較画像を求め、列方向及び行方向にそれぞれ複数の画
素を配列した第2の画像中の、2個の画素間の濃淡値を比
較し、その大小関係または同値関係を3値で表した対象3
値比較画像を求め、前記基準3値比較画像と前記対象3値
比較画像との、それぞれが対応する位置で、前記3値の関
係が一致する個数を求め、前記個数から前記対象3値比
較画像と前記基準3値比較画像との類似性を判定するパ
ターン認識方法である。この様な工程により計算コスト
を抑制しつつ、マッチングの検出精度を向上させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、パターン認識方法
及び及びパターン認識を行わせるプログラムを記憶した
コンピュータ読み取り可能な記憶媒体に関する。
【0002】
【従来の技術】複数の画像間の互いの位置合わせや、画
像中から特定の物体を検出する際に用いられる方法は、
画像マッチングと呼ばれている。
【0003】この画像マッチングには、例えば、ブラウ
ン(L.G.Brown)の"A SURVEY OF IMAGE REGISTRATION TEC
HNIQUES", acm computing surveys, Vol.24,No.4,pp,32
5-376: (白井(訳)「画像の位置合わせ手法の概観」,コ
ンピュータサイエンス acm computing surveys'92 bit
別冊,pp.77-120)に示されたように、複数の画像の画素
ごとの類似性の測度を定義して、この画像間中でその測
度が最も高い場所を決定する方法がある。
【0004】画素ごとの濃淡情報を用いた画像マッチン
グ方法には、類似性測度として、SSD(Sum of Square Di
fference)、SAD(Sum of Absolute Difference)や相互相
関係数といった統計的アプローチが用いられていた。
【0005】例えば、相互相関係数Cの場合には、類似性
測度を以下の式(1)のように表す。
【数1】 ただし、I(k,l)は、画素(k,l)の位置の画素値であり、m
,mは、I,Iの画素の平均値であり、σ
I,Iの画素の分散値である。
【0006】このような相互相関係数Cを用いて、画像
中からあるモデル画像(以下テンプレート画像と称する)
の位置を検出するテンプレートマッチングでは、テンプ
レート画像の平行移動、回転といった幾何学的変換のパ
ラメータの増加に伴って検出のコストが大きくなった。
【0007】また、画素の明るさの変化を制御するため
に、ヒストグラム平坦化処理やエッジ強調フィルタ、エ
ッジ抽出処理といった類似性測度を計算する前の前処理
となる画像処理が必要となる場合が多かった。
【0008】さらに、これらの前処理は、使用する類似
性測度(SSD、SAD、相互相関係数)やテンプレートが有す
る特徴との相性の問題があった。
【0009】例えば、SSDにおいて、濃淡情報を直接用い
て類似性測度を定義する場合には、画素の濃淡値の大き
さがそのまま測度に影響するため、以下に示す性質があ
った。
【0010】図19(a)〜(f)は濃淡値を類似性測度に用い
た場合のテンプレートマッチングを説明する図であり、
(a)は対象画像、(b)は(a)の一部に光が当たった画像、
(c)は(b)をエッジ処理した画像、(d)は(a)とは異なる撮
像された画像、(e)は(d)から抽出領域(手)を抽出した画
像である。
【0011】(a)は説明のため濃淡値が1種類で表示した
対象物の画像である(領域1)。(b)は対象物の右上から光
が照射された時の画像であり、この光が当たった領域を
領域2とし、この領域2の濃淡値は領域1と異なる。よっ
て、濃淡値の違いが類似度に影響を及ぼす。(c)は(b)を
エッジ処理した画像であり、領域1と2の境界の画素だけ
が影響を受けるため、(b)に比べて類似度への影響は小
さいものの、エッジだけの情報を用いてテンプレートマ
ッチングを行うことは汎用的ではなかった。
【0012】また、(d)のような複雑な背景を持つ画像
からテンプレート(手)を抽出した後の(e)は、背景画像
が複雑なため、この背景部分の濃淡値がテンプレートマ
ッチングに大きな影響を及ぼす原因になった。
【0013】したがって、テンプレートマッチングを行
うために、濃淡値を直接類似性測度に用いた場合には、
上述したような濃淡値の変化のため、検出精度を一定以
上に保っていなかった。
【0014】次に、濃淡値をそのまま類似性測度に用い
ないテンプレートマッチングには、ヴノー等(A.Venot,
J.F.Lebruchec, J.C.Roucayrol)の"A New Class of S
imilarity Measures for Robust Image Registration
": Computer Vision, Graphics, Image Processing,2
8,pp.176-184(1984)がある。これは、同じ撮像条件で撮
像された2つの画像を重ねて、それぞれの対応する画素
の画素値(濃淡値)の差を求め、この差が負に変化した
(符号が変化した)数を特徴量(類似性測度)としてマッチ
ングを行った方法である。
【0015】例えば、相互相関係数を用いた相関法で
は、差のある位置における画素の「濃淡値」が類似性測
度に影響をおよぼすが、この符号の変化は、差のある位
置の「個数」に関連するために、濃淡値の変動に対して
影響が少ない。
【0016】しかしながら、この方法は、医用画像処理
に適用されているが、試行のたびに、相関法と同様に、2
つの画像の特徴量の計算が必要となるため、検出コスト
が大きくなるといった問題があった。
【0017】次に、画素間の大小関係を類似性測度とし
て用いた手法に、リプトン等の(P.Lipson, E.Grimson,
P.Sinha)"Configuration Based Scene Classificatio
n and Image Indexing": CVPR'97 pp1007-1013と、シン
ハ(P.Sinha)の"Object Recognition via Image Invar
iants: A Case Study": Investigative Ophthalmology
Visual Science, vol.35,pp.1735-1740,May 1994があ
る。
【0018】P.Lipson等は、類似画像の検索を目的とし
て、画像をいくつかのブロックに分け、そのブロック間
の画像特徴量の大小関係に着目した検索を行い、画像の
構造化を行っている。
【0019】この構造化のもとになったシンハの文献
は、画像中から例えば顔領域を検出するために、画素間
の大小関係を抽出し、その抽出結果をテンプレートとす
る方法が記載されてある。このシンハの方法は、記憶さ
れた大量の画像から定性的な関係を抽出して、この抽出
結果をテンプレートにして保持するという方法である
が、動画像等の画像が時系列的に複数個並んだ画像列に
対して、あるテンプレートの対象領域の追跡を行う方法
(トラッキング)では、テンプレートを逐次更新する必
要があり、更新のための検出コストが大きくなるといっ
た問題があった。
【0020】次に、画素間の濃淡値の増分符号を類似性
測度とするテンプレートマッチングに、“増分符号相関
による自然画像照合":金子俊一、村瀬一郎、福島孝明、
五十嵐悟:電気学会研究会資料IIS-98-58,pp.31-35,1998
がある。金子等は、画素間の濃淡値の増分符号に着目し
て、その符号の数を類似性測度にする考え方を導入して
いる。しかしながら、2つの画像の類似性の判断を行う
時、画素間の濃淡値が同一であって、濃淡値の符号が等
号となるような場合には、濃淡値が増加した場合と同様
に扱われているために、精密なマッチング、画像を分類
するといった観点からはマッチングの精度が低くなると
いった問題点があった。
【0021】
【発明が解決しようとする課題】上述したように、従来
のマッチングは、前処理や特徴量等の照合数の増加にと
もなう計算コストが大きく、また撮像された画像が同一
領域であっても、撮像される環境の変化によって濃淡値
に変動がおきた場合、この変動に対応ができず検出精度
を低下させるといった問題があった。
【0022】そこで本発明は上記従来の問題点に鑑みて
なされたもので、検出精度を向上させた場合であっても
計算コストを大幅に増加させることなく、また、画像に
変動が生じた場合に、この変動の影響を受けにくい類似
性測度を用いて、テンプレートマッチングの検出精度を
向上させるパターン認識方法及びパターン認識を行わせ
るプログラムを記憶したコンピュータ読み取り可能な記
憶媒体の提供を目的とする。
【0023】
【課題を解決するための手段】上記目的を達成するため
に本発明のパターン認識方法は、列方向及び行方向にそ
れぞれ複数の画素を配列した第1の画像中の、2個の画素
間の濃淡値を比較し、その大小関係または同値関係を3値
で表した基準3値比較画像を求める工程と、列方向及び
行方向にそれぞれ複数の画素を配列した第2の画像中の、
2個の画素間の濃淡値を比較し、その大小関係または同値
関係を3値で表した対象3値比較画像を求める工程と、前
記基準3値比較画像と前記対象3値比較画像との、それぞ
れが対応する位置で、前記3値の関係が一致する個数を求
める工程と、前記個数から前記対象3値比較画像と前記
基準3値比較画像との類似性を判定する工程とを有す
る。
【0024】また、本発明のパターン認識方法は、列方向
及び行方向にそれぞれ複数の画素を配列した対象画像に
対し、2×2画素を1つの最小領域として分割し、その複
数の最小領域を上位階層の1つの最小領域として構成す
る複数段階の階層構造によって表現し、列方向及び行方
向にそれぞれ複数の画素を配列した基準画像に対し、2
×2画素を1つの最小領域として分割し、その複数の最小
領域を上位階層の1つの最小領域として構成する複数段
階の階層構造によって表現し、前記対象画像の各前記階
層の前記最小領域ごとに、各最小領域中の、2個の画素間
の濃淡値を比較し、その大小関係または同値関係を3値で
表した対象3値比較画像を求め、前記基準画像の各前記
階層の前記最小領域ごとに、各最小領域中の、2個の画素
間の濃淡値を比較し、その大小関係または同値関係を3値
で表した基準3値比較画像を求め、前記対象画像の、任意
の前記階層中の少なくとも1つの前記最小領域の前記対
象3値比較画像と、この対象3値比較画像に対応する前記
基準3値比較画像との、それぞれが対応する位置で、前
記3値の関係が一致する個数を求め、前記個数から前記
対象3値比較画像と前記基準3値比較画像との類似性を判
定することを特徴とする。
【0025】また、本発明の記憶媒体は、パターン認識
を行うプログラムをコンピュータ読み取り可能なように
記憶させた記憶媒体であって、列方向及び行方向にそれ
ぞれ複数の画素を配列した第1の画像中の、2個の画素間
の濃淡値を比較させ、その大小関係または同値関係を3値
で表した基準3値比較画像を求めさせ、列方向及び行方
向にそれぞれ複数の画素を配列した第2の画像中の、2個
の画素間の濃淡値を比較させ、その大小関係または同値
関係を3値で表した対象3値比較画像を求めさせ、前記基
準3値比較画像と前記対象3値比較画像との、それぞれが
対応する位置で、前記3値の関係が一致する個数を求めさ
せ、前記個数から前記対象3値比較画像と前記基準3値比
較画像との類似性を判定させることを特徴とする。
【0026】また、本発明の記憶媒体は、パターン認識
を行うプログラムをコンピュータ読み取り可能なように
記憶させた記憶媒体であって、列方向及び行方向にそれ
ぞれ複数の画素を配列された対象画像に対し、2×2画素
を1つの最小領域として分割させて、その複数の最小領
域を上位階層の1つの最小領域として構成する複数段階
の階層構造によって表現させ、列方向及び行方向にそれ
ぞれ複数の画素を配列された基準画像に対し、2×2画素
を1つの最小領域として分割させて、その複数の最小領
域を上位階層の1つの最小領域として構成する複数段階
の階層構造によって表現させ、前記対象画像の各前記階
層の前記最小領域ごとに、各最小領域中の、2個の画素間
の濃淡値を比較させて、その大小関係または同値関係を3
値で表した対象3値比較画像を求めさせ、前記基準画像
の各前記階層の前記最小領域ごとに、各最小領域中の、2
個の画素間の濃淡値を比較させて、その大小関係または
同値関係を3値で表した基準3値比較画像を求めさせ、前
記対象画像の、任意の前記階層中の少なくとも1つの前記
最小領域の前記対象3値比較画像と、この対象3値比較画
像に対応する前記基準3値比較画像との、それぞれが対
応する位置で、前記3値の関係が一致する個数を求めさ
せ、前記個数から前記対象3値比較画像と前記基準3値比
較画像との類似性を判定させることを特徴とする。
【0027】また、本発明のコンピュータプログラム
は、コンピュータに、列方向及び行方向にそれぞれ複数
の画素を配列した第1の画像中の、2個の画素間の濃淡値
を比較させ、その大小関係または同値関係を3値で表した
基準3値比較画像を求めさせる機能と、列方向及び行方
向にそれぞれ複数の画素を配列した第2の画像中の、2個
の画素間の濃淡値を比較させ、その大小関係または同値
関係を3値で表した対象3値比較画像を求めさせる機能
と、前記基準3値比較画像と前記対象3値比較画像との、
それぞれが対応する位置で、前記3値の関係が一致する個
数を求めさせる機能と、前記個数から前記対象3値比較
画像と前記基準3値比較画像との類似性を判定させる機
能とを有する。
【0028】また、本発明のコンピュータプログラムは、
コンピュータに、列方向及び行方向にそれぞれ複数の画
素を配列された対象画像に対し、2×2画素を1つの最小
領域として分割させて、その複数の最小領域を上位階層
の1つの最小領域として構成する複数段階の階層構造に
よって表現させる機能と、列方向及び行方向にそれぞれ
複数の画素を配列された基準画像に対し、2×2画素を1
つの最小領域として分割させて、その複数の最小領域を
上位階層の1つの最小領域として構成する複数段階の階
層構造によって表現させる機能と、前記対象画像の各前
記階層の前記最小領域ごとに、各最小領域中の、2個の画
素間の濃淡値を比較させて、その大小関係または同値関
係を3値で表した対象3値比較画像を求めさせる機能と、
前記基準画像の各前記階層の前記最小領域ごとに、各最
小領域中の、2個の画素間の濃淡値を比較させて、その大
小関係または同値関係を3値で表した基準3値比較画像を
求めさせる機能と、前記対象画像の、任意の前記階層中
の少なくとも1つの前記最小領域の前記対象3値比較画像
と、この対象3値比較画像に対応する前記基準3値比較画
像との、それぞれが対応する位置で、前記3値の関係が
一致する個数を求めさせる機能と、前記個数から前記対
象3値比較画像と前記基準3値比較画像との類似性を判定
させる機能とを有する。
【0029】このような構成によれば、隣接する画素間
の濃淡値の大小関係、同一関係といった画像の定性的な
関係を、画像の特徴量とすることで、計算コストの低減
と、より精度の高いマッチングを行うことができる。
【0030】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
【0031】図1乃至図10は第1の実施の形態を示すもの
である。
【0032】図1(a)〜(d)はテンプレートマッチングの
動作を説明するものであり、(a)は対象画像の平面図、
(b)はテンプレート画像の平面図、(c)はテンプレート画
像を対象画像中で移動させることを説明する平面図、
(d)は対象画像中でテンプレート画像を検出した平面図
である。
【0033】パターン認識法なるテンプレートマッチン
グとは、s×t行列の画素からなる対象画像中から、v×w
行列の画素からなるテンプレート画像が略合致する位置
(パターン領域)を検出することである。なお、説明のた
めに、対象画像の面積は、テンプレート画像の面積より
も大きいとする。また、各画像は、2値以上の多値濃淡で
表され、それぞれの画像の濃度分解能は同一である。
【0034】例えば、(a)の対象画像は地形図であり、
(b)のテンプレート画像は池である。より詳しくは、テ
ンプレート画像(太枠)を対象画像全体に、(c)の矢印の
ように移動させてそれぞれの位置での類似性を比較し、
最も類似性の高い位置がテンプレート画像であるとし
て、(d)のように対象画像中の一部分をテンプレート画
像として検出することがテンプレートマッチングであ
る。ここで、図中左右方向が行方向であり、図中上下方向
が列方向である。
【0035】(c)の時、テンプレート画像の、対象画像
中の各位置での類似性を判断するための測度として、以
下の特徴量を用いる。
【0036】まず、m×nの画素からなる画像Iに対し
て、画像I内の位置(x,y)の画素を画素値I(x,y)とす
る。ただし、1≦x≦m,1≦y≦nの関係を有し、濃度分解
能は、2ビットであり、0〜3の4段階で表された数値とす
る。
【0037】図2は、4段階の濃度分解能を有する4×4画
素の画像ISである。
【0038】この任意の画像ISに対して、隣接する画素
間の画素値から以下の2つの3値画像Q,Qを特徴量
として求める。
【0039】これによって、列方向及び行方向に隣接す
る画素間の画素値の大小関係、同値関係を調べる。
【数2】 図3(a)は、画像ISから求められたQの画像(行方向の
基準もしくは対象3値比較画素マトリクス(修正検討
中))あり、(b)はQの画像(列方向の基準もしくは対
象3値比較画素マトリクス)(修正検討中)である。(a)
では、画像ISの最左上の画素00とその右の画素01との関
係は、それぞれの濃度が2と4であり、計算した結果QV
「-2」となるため、記号「<」が表示される。同様に(b)
では、画像00とその下の画素10との関係は、それぞれの濃
度が2と3であり、計算した結果Qhは「-1」となるため、
記号「<」が表示される。
【0040】以降、画像IS全体で、同様の計算を行う。こ
の結果、Qは(m-1)×n画素の画像つまり(3×4)画素の3
値画像が得られ、Qはm×(n-1)画素の画像つまり(4×
3)画素の3値画像が得られる。
【0041】この得られた2つの3値画像を以下のように
表し、以下QT(Qualitative Trinary Representation)
表現と称する。 QT(I)=(Q,Q) また、各画素値pについて(ap+b)倍された画像(aI+b)につ
いては、 QT(I)=QT(aI+b) なる関係が成立する。
【0042】画像の各画素値が(ap+b)倍されたとして
も、各画素間の大小関係は変化しないため、同じQT表現が
得られる。これは、画像全体で行うノルムの正規化、も
しくは平均と分散とを用いた正規化によっても特徴量(Q
T表現)が変化することはないことをあらわす。
【0043】また、3値画像を求める前にヒストグラム平
坦化を予め行った画像HistNorm(I)について、 QT(I)=QT(HistNorm(I)) なる関係が成立する。
【0044】次に、QT表現の間の類似度について図4を参
照して説明する。
【0045】図4(a)は、各画像とその画像から得られた3
値画像とを表すQT表現の説明図であり、(b)は各画像の3
値画像を比較した結果を示すQT表現の説明図である。
【0046】(a)左側の画像1は対象画像であり、画像1
の下には画像1のQT表現(左側が行方向の基準3値比較画
像、右側が列方向の基準3値比較画像)が表示され、右側
の画像2はテンプレート画像であり、画像2の下には画像
2のQT表現(左側が行方向の対象3値比較画像、右側が列
方向の対象3値比較画像)が表示される。画像1のQT表現
をQT(I1)とし、画像2のQT表現をQT(I2)とする。
【0047】各QT表現は、以下のように表すことができ
る。 QT(I1)=(Qv1,Qh1) QT(I2)=(Qv2,Qh2) このQT(I1)の(Qv1,Qh1)とQT(I2)の(Qv2,Qh2)との各成
分を比較し、それぞれ対応する位置での符号が同一であ
る画素の個数Dv、Dh(個数A、個数B)を以下のように求
めていく。
【数3】 それぞれの3値画像の対応する各画素の符号が同じ場合
を1に、それ以外の場合を0として、すべての画素につい
て計算し、同じ符号の画素の個数を求める。
【0048】なお、得られた個数の最大値は、対象画像と
テンプレート画像が同一である画像を比較したときであ
るから、 Dv(I,I)=n(m-1) Dh(I,I)=m(n-1) となる。
【0049】このようにして、(a)から各画素の符号が同
一であるものの個数を計算する。(b)では同一の符号を
有する画素にのみ網掛けをして表示している。この例で
は、以下の様な数が求められる。 Dv(I1,I2)=1 Dh(I1,I2)=6 次に、画像1と画像2との類似度QTSを求める。QTSは以下
に示す式であり、その範囲は0.0〜1.0である。
【数4】 上述したm、n、Dv、Dhの数値をそれぞれ代入すると、類似
度QTS=0.29が求められる。
【0050】また、図5に示すようなQT表現を有した画像
の類似度について説明する。
【0051】画像1、2、3は4×4画素からなる互いに異な
る画像であり、これら画像1、2、3の濃度レベルは4段階と
する。
【0052】上述したような方法により、画像1,2,3の
QT表現と、そのQT表現のおける同一符号の個数を求め、そ
の結果から類似度を計算する。
【0053】なお、画像2,3における同一符号の個数は、 Dv(I2,I3)=12 Dh(I2,I3)=8 であり、そのときの類似度QTSは0.83である。この結果、
画像2に対して、画像3の方が画像1よりも類似度が高いと
判断される。
【0054】なお、テンプレート画像や対象画像の画素
数が同じであれば、類似度QTSの分母は共通となるため、
分子だけを比較して類似度QTSを求めても良い。
【0055】このようにQT表現を用いて類似度を求める
場合、乗算を用いることなく比較演算、及び和演算のみ
で類似度を得るため、従来の方法で同精度を得る場合に
比べて、計算コストを低減できる。また、統計学的な平
均、分散を用いないため、マッチングの際のテンプレート
画像の移動を複数回行うことなく一回で済むことも計算
コストの低減に寄与する。
【0056】また、図6(a)はQT表現と相互関数との関係
を示すグラフであり、(b)は複数の対象画像である。
【0057】グラフ中の各点は、(b)に示すような複数の
対象画像とある一つのテンプレート画像との相関値もし
くはQT表現の結果(QTS)を表している。
【0058】グラフ中、点線で囲まれた範囲、つまり相互
関数では略同一であると判断された画像であっても、QT
表現でみれば類似度が異なっていることが分かる。この
時の対象画像は、(b)に示すような様々は形状の画像が含
まれていた。
【0059】また、従来、金子等による画素間の濃淡値
の増分符号を類似性測度とする画像照合方法もあった
が、この方法は、濃淡値が同じであることを示す等号が増
加符号と同じ定義にしており、更に水平方向の比較しか
行っていない。つまり、画像照合は、大小関係だけで表
現した2値表現を用いて行っており、また、水平方向のみ
の計算結果から画像照合の結果を出力している。
【0060】このような金子等の従来の画像照合方法と
本発明との差異について、図7(a)の従来の画像照合の説
明図、(b)本発明の説明図を用いて説明する。
【0061】(a)、(b)において、各画像は、(4×4)画素
からなり濃淡値は4段階である。また、各画像間に記載さ
れた数値は、画像間の類似度を示しており、1に近いほど
同一画像であることを示す。
【0062】ここで、(a)、(b)中の左側の画像を画像1と
し、右側の画像を画像2とし、中央の画像を画像3とする。
【0063】(a)に示す従来では、画像1の隣接する画素
から求められた符号と、画像2の隣接する画素から求めら
れた符号とを比較した結果、対応する位置での符号が全
て同一であるため類似度は1.0であり、画像1と画像3とは
同一画像と判断する。また、画像1と画像3は、画素(3,1)
〜(3,4)が同一の濃淡値であり、符号は等号であるが、等
号符号は増加符号の扱いと同一であるため、類似度を1.0
とし、その結果同一画像であるとみなす。同様に、画像2
と画像3との間でも画素(2,1)〜(2,4)は同一の濃淡値で
あるが、類似度1.0と判断され、同一の画像であるとみな
す。
【0064】これに対して、(b)に示す本発明では、符
号が等号である画素については、大小関係とは別に定義
しているため、上述したような問題がなくなり、同一な
濃度値を有する画素は同一であると判断され、類似度を
0.5と計算される。
【0065】このように大小関係、同一関係を、3値表現
を使って表現することにより、従来よりも、より精度の高
い類似度計算を行うことができる。
【0066】次に、上述したようなQT表現を用いた類似
度計算の動作について、図8の電子機器のブロック図と、
図9のフローチャートを参照して説明する。なお、テンプ
レート画像、対象画像は予め撮像カメラ等により撮像さ
れる。
【0067】電子機器1は、モニタ2、本体3、キーボード
4、とマウス5を有している。本体2内には、デジタルカ
メラ等の撮像カメラで撮像された画像が記憶されたハー
ドディスク等の記憶装置10と、ROM,RAMからなるメモリ
11と、記憶装置10、メモリ11、各要素(モニタ2、キーボー
ド4、マウス5)が接続され、演算や各要素の制御を行うCP
U12からなる。
【0068】記憶装置10への画像の記憶は、本体2と撮
像カメラを直接接続して行う方法や、インターネット等
の回線を介して、キーボード4及びマウス5を操作して方
法がある。画像を表示する場合には、モニタ2を使用す
る。
【0069】(1)まず、記憶装置10からテンプレート画像
をメモリ11に読み取り、CPU12によってテンプレート画
像のQT表現を求める(S1)。
【0070】(2)次に、CPU12によって記憶装置10から対
象画像をメモリ11に読み取り、この対象画像を拡大した
画像、縮小した複数の対象画像を生成し、記憶装置10も
しくはメモリ11に記憶する(S2)。
【0071】(3)次に、元の対象画像、拡大及び縮小した
複数の対象画像のQT表現を、CPU12によって求め、対象画
像と対応させて記憶装置10もしくはメモリ11に記憶する
(S3)。
【0072】(4)次に、テンプレート画像のQT表現の3値
画像と、ある倍率の対象画像のQT表現の3値画像中のテ
ンプレート画像と同じ大きさの任意の領域との間で、そ
れぞれに対応する位置での同一符号の個数を求め、その
個数から類似度をCPU12によって計算し、記憶装置10もし
くはメモリ11に一時的に記憶する(S4)。
【0073】(5)次に、この対象画像のQT表現の3値画像
内全てに対して、テンプレート画像のQT表現の3値画像
の類似度を計算をしたか否かがCPU12によって判断され
る(S5)。全ての計算が終了していればS9へ進み、未終了
であればS6へ進む。
【0074】(6)未終了である場合には、この任意の領
域の対象画像中の位置を1画素分だけ行もしくは列方向
方向にずらした位置での3値画像と、テンプレート画像の
3値画像と、がそれぞれ対応する位置での類似度をCPU12
によって計算し、記憶装置10もしくはメモリ11に一時的
に記憶する(S6)。なお、類似度の計算は、任意の位置の
行方向の計算を全て行った後、列方向方向に1画素ずら
して、1画素ずらした位置で行方向に全ての計算を行って
いく。
【0075】(7)次に、(6)で記憶した類似度と(4)で記
憶した類似度とをCPU12によって比較する(S7)。比較さ
れた結果、(4)よりも(6)の類似度が大きければ、(8)へ
進み、小さければ(5)へ進む。
【0076】(8)次に、類似度が大きい場合には、(4)の
類似度を記憶装置10もしくはメモリ11から削除する(S
8)。S5へ進む。
【0077】(9)ある倍率の対象画像中における全ての
計算が終了した場合には、他の倍率の対象画像の3値画像
と、テンプレート画像の3値画像と、がそれぞれ対応する
位置での類似度を計算したか否かがCPU12によって判断
される(S9)。全ての他の倍率の対象画像の計算が終わっ
ていれば、(11)へ進み、未終了であれば(10)に進む。
【0078】(10)未終了である場合には、記憶装置10も
しくはメモリ11に記憶される倍率の異なる対象画像をCP
U12によって読み出す(S10)。(4)へ進む。
【0079】(11)終了している場合には、記憶装置10も
しくはメモリ11に記憶された類似度(対象画面の倍率及
び対象画像中の位置を含む)を最大類似度であるとみな
す(S11)。この最大類似度に記憶された位置がテンプレ
ート画像の位置であると判断する。
【0080】以上述べた様な第1の実施の形態では、3値
表現のQT表現を用いることで変動に強い類似性測度を
得、より類似度計算の精度が高く、かつこの精度の向上
に伴う計算コストの増加を抑制する、テンプレート画像
の検索を行うことができる。
【0081】なお、テンプレート画像は、階層的な構造を
持っていても良い。例えば、テンプレート画像(画像に
写る被対象物の構造)が複雑である場合には、全体の構造
と各部分の構成とに分けて、複数のテンプレート画像か
ら構成することができる。
【0082】ここで、図10(a)〜(i)はテンプレート画像
を階層的な構造として有する場合の説明図である。例と
して、人間の顔を考える。
【0083】(a)に示すように、テンプレート画像を、顔
全体、右目、左目、鼻、口の5つのテンプレート画像に分
ける。階層構造は、上段に顔全体のテンプレート画像が
あり、顔全体の下段に右目、左目、鼻、口の各テンプレート
画像が並列にある。各階層間では、テンプレート画像の
解像度は、同じでも、異なっていても良い。
【0084】(b)は、各テンプレート画像の配置と探索範
囲(黒の枠)を示している。一番外側の枠は、顔全体のテ
ンプレート画像の範囲を示している。顔全体の枠の中
で、右目、左目、鼻、口の探索範囲は、各テンプレート画像
を囲む枠で表示されている。各テンプレート画像はこの
枠内でマッチングが行われる。ここで右目と鼻の範囲、
及び左目と鼻の範囲のように、その一部が重複していて
も良い。
【0085】対象画像は(c)であり、この対象画像から上
述した各テンプレート画像を検出する。顔全体のテンプ
レート画像は(d)であり、まず、このテンプレート画像を
対象画像中からQT表現を用いて検出する。検出結果は、
(e)中の枠1,2である。
【0086】次に、枠1,2を対象画像から切り取り、こ
れら枠の大きさを同一にする((f)参照)。これら枠1,2
を顔全体のテンプレート画像とみなして、その画像の中
で(b)の各テンプレート画像(右目、左目、鼻、口)とのマッ
チングを、QT表現を用いて行っていく。
【0087】(g)は、(b)と(f)とを重ね合わせた画像であ
り、マッチングの結果から右側の画像は類似度が低い(な
い)ため、検出対象からはずす。左側の画像は、類似度が
(閾値を超えた)高いため、テンプレート画像であると
判断する。
【0088】したがって、(h)中に、枠で示すように、対象
画像からテンプレート画像が検出される。
【0089】このように、テンプレート画像を階層的な
構造として保持し、マッチングを行うことも可能であ
る。また図10では各階層ごとにマッチングを行ったが、
各階層のマッチングを並行して行い、最も各テンプレー
ト画像の適合が良い位置がテンプレート画像の位置であ
ると判断しても良い。例えば、図10では5つのテンプレー
ト画像があるが、この5つのテンプレート画像の各位置で
の類似度の合計値をその位置の類似度とし、最も大きな
類似度を有した位置がテンプレート画像の位置であると
することもできる。これは以下で述べる第3の実施の形
態にも適用できる。
【0090】次に、本発明の第2の実施の形態の構成に
ついて図11を参照して説明する。
【0091】なお、以下の各実施の形態において同一構
成要素は同一符号を付し重複する説明は省略する。
【0092】第2の実施の形態の特徴は、QT表現に加え
て、従来の定量的な類似度(例えば相関法による類似
度)を併用したことである。
【0093】図11(a)〜(e)は第2の実施の形態の動作の
説明図であり、(a)は対象画像とテンプレート画像、(b)
はQT表現で対象画像中から各閾値でテンプレート画像を
抽出したマッチング結果の図、(c)はQT表現と相関法そ
れぞれのマッチング結果の図、(d)QT表現と相関法とを
組み合わせて求めたマッチング結果の図、(e)対象画像
中のテンプレート画像が一致した場所を示す画像であ
る。
【0094】(a)に示すように、テンプレート画像はモ
ニタであり、対象画像は、このモニタが配置された室内を
撮像した画像である。
【0095】この対象画像中からQT表現を用いてテンプ
レート画像のマッチングを行った結果が、(b)である。
(b)では、マッチングする際のQTSに対する閾値を4つ設定
しており、t1〜t4に向かって大きくなる。したがって、
最上段の閾値t1のマッチング結果では、テンプレート画
像にマッチングする候補は多く、逆に最下段の閾値t4の
マッチング結果では、マッチングする候補は少なくなっ
ている。
【0096】この閾値の中から、例えば、t3のマッチング
結果をQT表現によるマッチング結果とする((c)上段)。
また、同じ対象画像とテンプレート画像とを用いて相関
法によってマッチングした結果が(c)下段である。
【0097】このQT表現によるマッチング結果と、相関
法によるマッチング結果とを、比較して、同時にマッチ
ング結果として検出される場所を、テンプレート画像の
位置とする。ただし、同時にマッチングしている場所が
複数個存在する場合には、複数個の中で相関法による検
出結果のうち最大の類似度を有する場所を真のテンプレ
ート画像の位置とする。この結果、(d)中の実線が真のテ
ンプレート画像の位置であり、破線が同時にマッチング
され検出された位置である。
【0098】このようにして、(e)に示すように、対象画
像中の白枠で囲まれた領域がテンプレート画像であると
判断する。
【0099】以上述べた様な第2の実施の形態では、QT表
現と相関法とを組み合わせてテンプレートマッチングを
行うことで、より検出精度を上げることができる。
【0100】また、類似度の計算コストが相関法に比べ
て低いQT表現を用いて、対象画像中の類似度を求めてお
き、続いて類似度が所望の閾値以上の場所のみ相関法を
用いてマッチングを行うことで、相関法だけ用いた場合
の計算コストよりも低く、かつ精度の高いマッチングを
行うことができる。
【0101】次に、本発明の第3の実施の形態の構成に
ついて図12,13を参照して説明する。
【0102】第3の実施の形態の特徴は、動画像などの
画像が複数個並んだ画像列に対して、あるテンプレート
画像の対象領域の追跡(トラッキング)を行い、その動
画像からテンプレート画像の位置を検出したことであ
る。
【0103】図12は、撮像カメラによって撮像された対
象画像であり、図中上から下に時間軸を持つ。なお、左
側は所定間隔で撮像された対象画像であり、右側はその
対象画像中のテンプレート画像を白枠で示した画像であ
る。
【0104】ここで、テンプレート画像は手の領域であ
り、このテンプレート画像が時間と共に画像内を右から
左へと移動することで、テンプレート画像が検出される
位置が変わっていく。また、時間の経過と共に手の位
置、形状が変わるため対象画像も変わる。
【0105】図13の第3の実施の形態のフローチャート
を参照して、動作を説明する。
【0106】なお、テンプレート画像は、予め記憶装置10
もしくはメモリ11内に記憶されている。また、対象画像
は、撮像カメラ等で撮像された画像であり、この画像は
所定間隔で、記憶装置10もしくはメモリ11内に送られ、
記憶される。本実施の形態の対象画像は、図12に示すよ
うに5つとする。
【0107】(1)まず、記憶装置10もしくはメモリ11から
テンプレート画像を読み出し、CPU12によってテンプレ
ート画像のQT表現を求める(S21)。
【0108】(2)次に、記憶装置10もしくはメモリ11か
ら対象画像(例えば図12の左側最上段の画像)を読み出す
(S22)。
【0109】(3)次に、読み出された対象画像の縮尺を
変化させた複数の対象画像をCPU12によって求め、これら
対象画像を記憶装置10もしくはメモリ11に記憶する(S2
3)。
【0110】(4)次に、対象画像ごとにQT表現を求め、対
象画像に対応させてQT表現を、記憶装置10もしくはメモ
リ11に記憶する(S24)。
【0111】(5)次に、テンプレート画像のQT表現の3値
画像と、ある倍率の対象画像のQT表現の3値画像中のテ
ンプレート画像と同じ大きさの任意の領域との間で、そ
れぞれに対応する位置での同一符号の個数を求め、そし
て類似度をCPU12によって求め、記憶装置10もしくはメモ
リ11に一時的に記憶する(S25)。
【0112】(6)次に、この対象画像のQT表現の3値画像
内全てに対して、テンプレート画像のQT表現の3値画像
の類似度を計算したか否かがCPU12によって判断される
(S26)。全ての計算が終了していればS30へ進み、未終了
であればS27へ進む。
【0113】(7)未終了である場合には、対象画像中の
この任意の領域の位置を1画素分だけ行方向もしくは列
方向にずらした位置での3値画像と、テンプレート画像の
3値画像と、がそれぞれ対応する位置での類似度をCPU12
によって求め、記憶装置10もしくはメモリ11に一時的に
記憶する(S27)。なお、計算は任意の領域の行方向を全て
行った後、列方向を行う。
【0114】(8)次に、(7)で記憶した類似度と(5)で記
憶した類似度とをCPU12によって比較する(S28)。比較さ
れた結果、(5)よりも(7)の類似度が大きければ、(9)へ
進み、小さければ(6)へ進む。
【0115】(9)類似度が大きい場合には、(5)の類似度
を記憶装置10もしくはメモリ11から削除する(S29)。
(6)へ進む。
【0116】(10)ある倍率の対象画像中における全ての
計算が終了した場合には、他の倍率の対象画像の3値画像
と、テンプレート画像の3値画像と、がそれぞれ対応する
位置での類似度を計算したか否かがCPU12によって判断
される(S30)。全ての他の倍率の対象画像の計算が終わ
っていれば、(12)へ進み、未終了であれば(11)に進
む。
【0117】(11)未終了である場合には、記憶装置10も
しくはメモリ11に記憶される倍率の異なる対象画像をCP
U12によって読み出す(S31)。(3)へ進む。
【0118】(12)終了している場合には、記憶装置10も
しくはメモリ11に記憶された類似度(対象画面の倍率及
び対象画像中の位置を含む)が最大類似度であるとみな
す(S32)。この最大類似度に記憶された位置がテンプレ
ート画像の位置であると判断する。
【0119】(13)次に、対象画像中で最大類似度とされ
た領域を、新たなテンプレート画像としてCPU12によって
取り出し、記憶装置10もしくはメモリ11に記憶する。そ
して、この新たなテンプレート画像のQT表現を求め、テ
ンプレート画像に対応させて記憶する(S33)。
【0120】(14)次に、テンプレートマッチングすべき
対象画像が存在するか否かがCPU12によって判断される
(S34)。存在する場合には、(2)に進み、存在しなけれ
ば処理を終了する。
【0121】なお、本実施の形態では、さらにマッチン
グすべき対象画像が存在するため、(2)へ進み、対象画
像を図12左側の上から2番目の画像として、上述したよう
な(2)〜(13)のマッチングを行う。この2番目の画像
を処理した後は、(14)にて対象画像を図12左側の上か
ら3番目、4番目、5番目と変更しながら同様のマッチング
を行っていく。
【0122】以上述べたような第3の実施の形態では、
テンプレート画像が対象画像中で移動し、対象画像、テン
プレート画像が時事変化していく場合であっても、テン
プレート画像を逐次更新し追跡することで、対象画像が
動画像においてもテンプレートマッチングを行うことが
できる。
【0123】次に、本発明の第4の実施の形態の構成に
ついて図14,15を参照して説明する。
【0124】第4の実施の形態の特徴は、QT表現を4分木
(Quadtree)法と組み合わせて適用させたことである。
【0125】図14(a)、(b)は、4分木データ構造の説明図
であり、階層は3層あり、各階層の一つの画像は、2×2画
素から構成される。ノードからの枝が4つある階層構造
示している。階層1が最上層であり、階層3が最下層であ
る(図14(a)参照)。
【0126】階層1の画像は、2×2画素からなる。階層1
の下層である階層2の画像は、階層1の1画素を4つ分割し
た4×4画素からなり、この4つに分割された画素の平均
濃度が、階層1の一つの画素の濃度となる。同様に、階
層2の下層である階層3の画像は、階層2の1画素を4つに
分割した8×8画素からなり、この4つに分割された画素
の平均濃度が、階層2の一つの画素の濃度とする(図14(b)
参照)。また、各階層間の関係を本実施の形態では、より
下層の画素値の平均値をより上層の濃度として各階層を
結び付けていたが、この下層の画素の画素値の最大と最
小の平均や中央値など、関連の仕方に制限はない。
【0127】図15(a)は、各階層の画像であり、(b)は各階
層のQT表現であり、(c)は3値表現の大小、等号関係を所
定の関係を持って数値化したものである。
【0128】各階層の最小単位を2×2画素とすれば、階
層1のQT表現は1組、階層2のQT表現は4組、階層3のQT表現
は8組となる。1組のQT表現は4つの符号値から構成され
る。大小関係、等号関係の3値表現の符号値の組み合わせ
は3=81種類あるが、そのうち実際にはありえない組み
合わせを削除すると57種類となる。
【0129】(b)に示される各組のQT表現を、この57種類
の組み合わせを数値化した番号(0〜56)をつけると、(c)
のように表せる。この数値化した番号をQT-ID番号と称
する。また、各QT表現間の関係は、2×2画素からなるため
4段階で表され、これは対応する画素の符号が同一であ
る個数を用いて求められる。全ての符号が同一であれ
ば、4として、全ての符号が異なっていれば、0とする。
【0130】このように、ある対象画像を得た後、この
対象画像を4分木構造で表現し、各層のQT表現をQT-ID番
号(0〜4で表される類似関係を含んでいる)で表現し直
す。
【0131】2つの画像をそれぞれ図15(c)のような木
構造で表現した際の、2つの画像の類似性の判断法につ
いて述べる。
【0132】すべての階層における各ノードのQT-ID番
号を用いて類似性を判断する場合、それぞれの各階層の
ノードの対応するID番号が同じかどうか、もしくは符号
の対応する数がいくらであるかを求め、構造間の類似性
を、その数によって判断する。
【0133】各画像を階層的に表現することにより、上
位階層では画像の大域的な性質を表現することになり、
第1の実施の形態で述べたような、隣接関係に基づいた
だけのマッチングに加え、大域的な性質の類似性も比較
することになる。
【0134】また、ある階層にのみ着目し、ある階層の
QT-ID番号同士の比較を行って、類似性を判断してもよ
い。
【0135】この方法は、例えば、類似画像を検索する
際に用いることができる。階層が上位であるほど抽象化
された画像になるため、大まかな検索を行う際には上位
の階層で行い、より精度の高い検索を行う際には下位の
階層でマッチングを行う。
【0136】また、画像の検索を行う際には、検索のため
の索引(インデックス)が必要となることがあり、この
QT-ID番号を索引の情報として使用することも可能であ
る。
【0137】以上述べた様な第4の実施の形態では、計
算コストをより抑制するためには上位の階層でマッチン
グを行い、検出精度をより高めるためには、より下位の階
層でマッチングを行うことで、必要に応じてマッチング
を使い分けることができる。
【0138】また、各画像が階層的な構造を有すること
で、各画像から求められたQT表現同士のマッチングだけ
でなく、精緻なマッチングを行うことも可能である。
【0139】次に、本発明の第5の実施の形態の構成に
ついて図16を参照して説明する。
【0140】第5の実施の形態の特徴は、テンプレート
画像中でマッチングの計算に関与しない画素を設定した
ことである。
【0141】図16(a),(b)は第5の実施の形態の説明図で
あり、図中「φ」の画素がテンプレートマッチングを行
う際に無視する部分である。
【0142】(a)に示すように、無視する画素はテンプ
レート画像の四隅であり、この四隅の画素は、予めマッチ
ングする画素からはずす。そして、テンプレート画像の
形状を略十字形に変形する。
【0143】また、(b)に示すように、テンプレート画像
の中央部の複数の画素を無視する画素とする。これは、
例えば、テンプレート画像がドーナツ形状であれば、空
洞部のマッチングは不要であるため、予め無視する領域
とすることができる。また、テンプレート画像が手であ
れば、指と指との隙間に当たる画素は、この無視する領
域として設定することができる。
【0144】このように、予め所定の画素を無視するこ
とにより、計算コストを低減し、かつ検出時間を短時間
にすることができる。また、無視する領域の類似度の計
算を行わないことにより、無意味な領域の影響を受けな
い。
【0145】なお、この無視する画素を一部に含む領域
の位置の指定は、任意に設定することが可能である。
【0146】次に、本発明の第6の実施の形態について図
17を参照して説明する。
【0147】第6の実施の形態の特徴は、複数の対象画像
に対してマッチングを行う際に、複数のテンプレート画
像ごとに分類したことである。
【0148】図17(a)〜(c)はその説明図であり、(a)は3
種類のテンプレート画像であり、(b)は複数の対象画像
であり、(c)は分類結果である。
【0149】テンプレート画像は、(a)に示す通り、3種
類あり、A、B、Cとする。ある記憶領域に複数の対象画像が
混在した状態で保持されている((b)参照)。テンプレー
ト画像、対象画像、それぞれのQT表現を求めて、各テンプ
レート画像を各対象画像とマッチングさせていく。各対
象画像は、3つのテンプレート画像のうちいずれかを画像
中に有する。マッチングを行い、その結果類似度が最大
となるテンプレート画像ごとに対象画像を振り分けてい
き分類を行う((c)参照)。また、この後、分類された対象
画像ごとに更に詳細なマッチングを行っても良い。この
方法は、例えばクラスタリングの前処理として使用した
り、パターン認識のためのマルチカテゴリ辞書の選択の
ために用いたりすることができる。
【0150】なお、本発明は上記各実施の形態には限定
されず、その主旨を逸脱しない範囲で種々変形して実施
できることは言うまでもない。例えば、テンプレート画
像は、複数の画像の平均画像を用いて作成したものであ
っても構わない。この場合に、平均画像は各画素の濃淡
値から平均画素値を作ってQT表現を求めてもよいし、そ
れぞれの画像のQT表現を求め、各画像の対応する画素位
置の最も多い値を用いてテンプレート画像としても良
い。また、変形する物体を検出するために、一つのテンプ
レート画像に対して、種々変形した形状を考慮したテン
プレート画像を複数設定することも可能である。
【0151】また、3値画像を求めるためには隣り合う画
素間で計算を行っていたが、斜め方向に配置された画素
間や、所定距離はなれた画素間で3値画像を求めても良
い。例えば、図18のように隣接していない画素間での大
小関係、同値関係を用いてもよい。
【0152】また、大小関係に段階を持たせてn(nは
自然数)段階として大小関係を表すことで、より検出精
度を向上させることもできる。
【0153】また、テンプレートマッチングやトラッキ
ング(動画像中からテンプレート画像を抽出)は、テン
プレート画像を対象画像中で平行移動させたり、対象画
像を拡大、縮小したりしたが、対象画像を所望角度回転さ
せた各画像をマッチングの対象としても良い。
【0154】また、QT表現で用いられる画素値は、実施例
では4段階でなくとも、64段階(6bit)、128段階(7bit)に
設定することも可能である。また、得られる画像が256
段階(8bit)の画像の場合に、濃淡方向の解像度を落とし
て例えば64段階にし、同様のQT表現を求めるといった処
理を行っても良い。256段階の場合には、大小関係が成
立していた部分が、64段階に解像度が落ちたために同値
関係になるといった別の側面からの情報が得られるよう
になる。もちろん、複数の解像度を使って多重解像度のQ
T表現を用いても良い。
【0155】また、Quadtreeを用いた場合には、2×2画
素からなる画像を一つの単位としているが、この画像単
位を構成する画素数は、適宜設定可能である。
【0156】また、カラー画像に対してマッチングを行
うことも可能である。その場合には、カラー画像の各R,
G,Bの濃淡に対して、同様の処理を行うことによってマ
ッチングを行うことができる。また、別の色表現に変換
し、この色表現から大小関係、等号関係を求めることも
できる。
【0157】また、対象画像としては可視光の下で撮像
された画像でなく、赤外線を照射して撮像(撮影)された
赤外線画像を用いることもできる。一般に、赤外線画像
は、被撮像物によっては画像全体が白っぽくなり、飽和
したような画像が得られる。この場合に、従来の正規化
相関法を用いてマッチングを行うと、明るさに比例して
相関値が大きくなるため、誤認識をおこしやすい。しか
しながら、QT表現を用いたマッチングは、撮像される画像
の性質(波長特有の画像の写り方)に左右されず、誤認識
をせずにマッチングを行うことができる。また、コント
ラストの悪い超音波画像や医用画像、レーダ画像等の各
種画像に対しても誤認識を低減したマッチングを行うこ
とができる。
【0158】また、QT表現を求める際に対象画像及びテ
ンプレート画像の解像度レベルが大きい(例えば128、25
6段階)場合には、同一符号に任意の範囲を持たせるこ
とも可能である。例えば、256段階で濃度を表現する場合
には、等号範囲を±5以内とし、比較した結果この範囲
内であれば同一であるとみなして、等号とする等であ
る。
【0159】また、本発明の実施の形態における処理を
コンピュータで実行可能なプログラムで実現し、このプ
ログラムをコンピュータで読み取り可能な記憶媒体とし
て実現することも可能である。
【0160】なお、本発明における記憶媒体としては、
磁気ディスク、フロッピー(登録商標)ディスク、ハー
ドディスク、光ディスク(CD-ROM,CD-R,DVD等)、光磁
気ディスク(MO等)、半導体メモリ等、プログラムを記憶
でき、かつコンピュータが読み取り可能な記憶媒体であ
れば、その記憶形式は何れの形態であってもよい。
【0161】また、記憶媒体からコンピュータにインス
トールされたプログラムの指示に基づきコンピュータ上
で稼動しているOS(オペレーションシステム)や、データ
ベース管理ソフト、ネットワーク等のMW(ミドルウェア)
等が本実施の形態を実現するための各処理の一部を実行
してもよい。
【0162】さらに、本発明における記憶媒体は、コン
ピュータと独立した媒体に限らず、LANやインターネッ
ト等により伝送されたプログラムをダウンロードして記
憶または一時記憶した記憶媒体も含まれる。
【0163】また、記憶媒体は1つに限らず、複数の媒
体から本実施形態における処理が実行される場合も、本
発明における記憶媒体に含まれ、媒体の構成は何れの構
成であってもよい。
【0164】なお、本発明におけるコンピュータは、記
憶媒体に記憶されたプログラムに基づき、本実施の形態
における各処理を実行するものであって、パソコン等の
1つからなる装置、複数の装置がネットワーク接続され
たシステム等の何れの構成であってもよい。
【0165】また、本発明におけるコンピュータとは、
パソコンに限らず、情報処理機器に含まれる演算処理装
置、マイコン等も含み、プログラムによって本発明の機
能を実現することが可能な機器、装置を総称している。
【0166】
【発明の効果】以上述べた様な本発明によれば、変動に
対して強い類似性測度を用いることで、計算コストを抑
えつつ、検出精度をより高くすることができる。
【図面の簡単な説明】
【図1】 本発明のパターン認識方法の第1の実施の形
態を説明するもので、(a)は対象画像、(b)はテンプレー
ト画像、(c)は対象画像中を移動するテンプレート画像
の説明図、(d)はマッチング結果の説明図。
【図2】 本発明のパターン認識方法の第1の実施の形
態の対象画像の説明図。
【図3】 本発明のパターン認識方法の第1の実施の形
態を説明するもので、(a)は横方向のQT表現の説明図、
(b)は縦方向のQT表現の説明図。
【図4】 本発明のパターン認識方法の第1の実施の形
態を説明するもので、(a)は各画像のQT表現の説明図、
(b)は各画像から得られたQT表現を比較した結果の説明
図。
【図5】 本発明のパターン認識方法の第1の実施の形
態の類似度の説明図。
【図6】 本発明のパターン認識方法の第1の実施の形
態を説明するもので、(a)はQT表現による類似度と相関
法による類似度との関係を示すグラフ、(b)は複数の対象
画像。
【図7】 本発明のパターン認識方法の第1の実施の形
態を説明するもので、(a)は従来のマッチングの説明
図、(b)はQT表現を用いたマッチングの説明図。
【図8】 本発明のパターン認識方法の第1の実施の形
態の電子機器の構成を示すブロック図。
【図9】 本発明のパターン認識方法の第1の実施の形
態の動作を示すフローチャート。
【図10】 本発明のパターン認識方法の第1の実施の
形態を説明するもので、(a)は階層構造を有するテンプレ
ート画像、(b)は各テンプレート画像の配置関係と検出
領域の説明図、(c)は対象画像、(d)はテンプレート画
像、(e)は対象画像中から検出された複数のテンプレー
ト画像(上位階層)の候補の位置の説明図、(f)は対象画
像から切り取られたテンプレート画像の候補の説明図、
(g)テンプレート画像(上位階層)の候補に下位階層のテ
ンプレート画像をマッチングさせた時の説明図、(h)はテ
ンプレート画像が検出された結果を表示する対象画像の
説明図。
【図11】 本発明のパターン認識方法の第2の実施の
形態を説明するもので、(a)は対象画像とテンプレート
画像、(b)は各閾値ごとのマッチング結果の説明図、(c)
はQT表現によるマッチング結果と相関法によるマッチン
グ結果との説明図、(d)はQT表現と相関法とを用いたマッ
チング結果の説明図、(e)は対象画像中で検出されたテ
ンプレート画像。
【図12】 本発明のパターン認識方法の第3の実施の
形態の説明図。
【図13】 本発明のパターン認識方法の第3の実施の
形態の動作を示すフローチャート。
【図14】 本発明のパターン認識方法の第5の実施の
形態を説明するもので、(a)は4分木の構造の説明図、(b)
は各階層における画素の説明図。
【図15】 本発明のパターン認識方法の第5の実施の
形態を説明するもので、(a)は各階層の画素の説明図、(b)
は各階層のQT表現の説明図、(c)は各QT表現をQT-ID番号
で示した時の説明図。
【図16】 本発明のパターン認識方法の対象画像から
QT表現を無視する領域を設定する時の説明図。
【図17】 本発明のパターン認識方法の第4の実施の
形態を説明するもので、(a)は複数のテンプレート画像
の説明図、(b)は複数の対象画像の説明図、(c)はテンプ
レート画像ごとに分類された対象画像の説明図。
【図18】 本発明のパターン認識方法の第1の実施の
形態とは異なるQT表現の説明図。
【図19】 従来のパターン認識方法を説明するもの
で、(a)は対象画像の説明図、(b)は対象画像に光が差し
込んだ場合の説明図、(c)は(b)の画像に背景処理を施し
た対象画像の説明図、(d)は(b)の画像にエッジ処理を施
した対象画像の説明図、(e)は撮像カメラで撮像された実
際の対象画像、(f)は(e)からテンプレート画像を検出す
る説明図。
【符号の説明】
1 電子機器 2 モニタ 3 本体 4 キーボード 5 マウス 10 記憶装置 11 メモリ 12 CPU

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】列方向及び行方向にそれぞれ複数の画素を
    配列した第1の画像中の、2個の画素間の濃淡値を比較し、
    その大小関係または同値関係を3値で表した基準3値比較
    画像を求める工程と、 列方向及び行方向にそれぞれ複数の画素を配列した第2
    の画像中の、2個の画素間の濃淡値を比較し、その大小関
    係または同値関係を3値で表した対象3値比較画像を求め
    る工程と、 前記基準3値比較画像と前記対象3値比較画像との、それ
    ぞれが対応する位置で、前記3値の関係が一致する個数を
    求める工程と、 前記個数から前記対象3値比較画像と前記基準3値比較画
    像との類似性を判定する工程とを有することを特徴とす
    るパターン認識方法。
  2. 【請求項2】前記第1の画像中の2個の前記画素は隣接
    し、また前記第2の画像中の2個の前記画素は隣接するこ
    とを特徴とする請求項1に記載のパターン認識方法。
  3. 【請求項3】列方向及び行方向にそれぞれ複数の画素を
    配列した対象画像に対し、2×2画素を1つの最小領域と
    して分割し、その複数の最小領域を上位階層の1つの最
    小領域として構成する複数段階の階層構造によって表現
    し、 列方向及び行方向にそれぞれ複数の画素を配列した基準
    画像に対し、2×2画素を1つの最小領域として分割し、
    その複数の最小領域を上位階層の1つの最小領域として
    構成する複数段階の階層構造によって表現し、 前記対象画像の各前記階層の前記最小領域ごとに、各最
    小領域中の、2個の画素間の濃淡値を比較し、その大小関
    係または同値関係を3値で表した対象3値比較画像を求
    め、前記基準画像の各前記階層の前記最小領域ごとに、
    各最小領域中の、2個の画素間の濃淡値を比較し、その大
    小関係または同値関係を3値で表した基準3値比較画像を
    求め、前記対象画像の、任意の前記階層中の少なくとも1
    つの前記最小領域の前記対象3値比較画像と、この対象3
    値比較画像に対応する前記基準3値比較画像との、それ
    ぞれが対応する位置で、前記3値の関係が一致する個数
    を求め、 前記個数から前記対象3値比較画像と前記基準3値比較画
    像との類似性を判定することを特徴とするパターン認識
    方法。
  4. 【請求項4】パターン認識を行うプログラムをコンピュ
    ータ読み取り可能なように記憶させた記憶媒体であっ
    て、 列方向及び行方向にそれぞれ複数の画素を配列した第1
    の画像中の、2個の画素間の濃淡値を比較させ、その大小
    関係または同値関係を3値で表した基準3値比較画像を求
    めさせ、 列方向及び行方向にそれぞれ複数の画素を配列した第2
    の画像中の、2個の画素間の濃淡値を比較させ、その大小
    関係または同値関係を3値で表した対象3値比較画像を求
    めさせ、 前記基準3値比較画像と前記対象3値比較画像との、それ
    ぞれが対応する位置で、前記3値の関係が一致する個数を
    求めさせ、 前記個数から前記対象3値比較画像と前記基準3値比較画
    像との類似性を判定させるプログラムを記憶したコンピ
    ュータ読み取り可能な記憶媒体。
  5. 【請求項5】パターン認識を行うプログラムをコンピュ
    ータ読み取り可能なように記憶させた記憶媒体であっ
    て、 列方向及び行方向にそれぞれ複数の画素を配列された対
    象画像に対し、2×2画素を1つの最小領域として分割さ
    せて、その複数の最小領域を上位階層の1つの最小領域
    として構成する複数段階の階層構造によって表現させ、 列方向及び行方向にそれぞれ複数の画素を配列された基
    準画像に対し、2×2画素を1つの最小領域として分割さ
    せて、その複数の最小領域を上位階層の1つの最小領域
    として構成する複数段階の階層構造によって表現させ、 前記対象画像の各前記階層の前記最小領域ごとに、各最
    小領域中の、2個の画素間の濃淡値を比較させて、その大
    小関係または同値関係を3値で表した対象3値比較画像を
    求めさせ、 前記基準画像の各前記階層の前記最小領域ごとに、各最
    小領域中の、2個の画素間の濃淡値を比較させて、その大
    小関係または同値関係を3値で表した基準3値比較画像を
    求めさせ、 前記対象画像の、任意の前記階層中の少なくとも1つの前
    記最小領域の前記対象3値比較画像と、この対象3値比較
    画像に対応する前記基準3値比較画像との、それぞれが
    対応する位置で、前記3値の関係が一致する個数を求め
    させ、 前記個数から前記対象3値比較画像と前記基準3値比較画
    像との類似性を判定させるプログラムを記憶したコンピ
    ュータ読み取り可能な記憶媒体。
  6. 【請求項6】コンピュータに、 列方向及び行方向にそれぞれ複数の画素を配列した第1
    の画像中の、2個の画素間の濃淡値を比較させ、その大小
    関係または同値関係を3値で表した基準3値比較画像を求
    めさせる機能と、 列方向及び行方向にそれぞれ複数の画素を配列した第2
    の画像中の、2個の画素間の濃淡値を比較させ、その大小
    関係または同値関係を3値で表した対象3値比較画像を求
    めさせる機能と、 前記基準3値比較画像と前記対象3値比較画像との、それ
    ぞれが対応する位置で、前記3値の関係が一致する個数を
    求めさせる機能と、 前記個数から前記対象3値比較画像と前記基準3値比較画
    像との類似性を判定させる機能とを実現させるコンピュ
    ータプログラム。
  7. 【請求項7】コンピュータに、 列方向及び行方向にそれぞれ複数の画素を配列された対
    象画像に対し、2×2画素を1つの最小領域として分割さ
    せて、その複数の最小領域を上位階層の1つの最小領域
    として構成する複数段階の階層構造によって表現させる
    機能と、 列方向及び行方向にそれぞれ複数の画素を配列された基
    準画像に対し、2×2画素を1つの最小領域として分割さ
    せて、その複数の最小領域を上位階層の1つの最小領域
    として構成する複数段階の階層構造によって表現させる
    機能と、 前記対象画像の各前記階層の前記最小領域ごとに、各最
    小領域中の、2個の画素間の濃淡値を比較させて、その大
    小関係または同値関係を3値で表した対象3値比較画像を
    求めさせる機能と、 前記基準画像の各前記階層の前記最小領域ごとに、各最
    小領域中の、2個の画素間の濃淡値を比較させて、その大
    小関係または同値関係を3値で表した基準3値比較画像を
    求めさせる機能と、 前記対象画像の、任意の前記階層中の少なくとも1つの前
    記最小領域の前記対象3値比較画像と、この対象3値比較
    画像に対応する前記基準3値比較画像との、それぞれが
    対応する位置で、前記3値の関係が一致する個数を求め
    させる機能と、 前記個数から前記対象3値比較画像と前記基準3値比較画
    像との類似性を判定させる機能とを実現させるコンピュ
    ータプログラム。
JP2000378612A 2000-12-13 2000-12-13 パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体 Expired - Fee Related JP3819236B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000378612A JP3819236B2 (ja) 2000-12-13 2000-12-13 パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000378612A JP3819236B2 (ja) 2000-12-13 2000-12-13 パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体

Publications (2)

Publication Number Publication Date
JP2002183732A true JP2002183732A (ja) 2002-06-28
JP3819236B2 JP3819236B2 (ja) 2006-09-06

Family

ID=18847148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000378612A Expired - Fee Related JP3819236B2 (ja) 2000-12-13 2000-12-13 パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体

Country Status (1)

Country Link
JP (1) JP3819236B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006293632A (ja) * 2005-04-08 2006-10-26 Toshiba Corp 半導体集積回路装置、画像処理システム、及び画像処理方法
US7200270B2 (en) 2001-12-13 2007-04-03 Kabushiki Kaisha Toshiba Pattern recognition apparatus and method using distributed model representation of partial images
JP2007179307A (ja) * 2005-12-28 2007-07-12 Hitachi Computer Peripherals Co Ltd 帳票識別装置
JP2007287006A (ja) * 2006-04-19 2007-11-01 Fujitsu Ltd 移動物体追跡装置及びプログラム
JP2011215716A (ja) * 2010-03-31 2011-10-27 Toyota Motor Corp 位置推定装置、位置推定方法及びプログラム
JP2012099157A (ja) * 2009-03-13 2012-05-24 Nec Corp 画像識別子抽出装置
JP2013519409A (ja) * 2010-02-10 2013-05-30 アイモーフィクス リミテッド 画像解析
US8749658B2 (en) 2009-04-06 2014-06-10 Nec Corporation Data processing device, image matching method, program, and image matching system
US9530077B2 (en) 2010-02-10 2016-12-27 Imorphics Limited Image analysis
CN113643467A (zh) * 2021-06-29 2021-11-12 南京信息工程大学 基于单片机的集成式红外成像闸门系统、终端和检测方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7200270B2 (en) 2001-12-13 2007-04-03 Kabushiki Kaisha Toshiba Pattern recognition apparatus and method using distributed model representation of partial images
JP2006293632A (ja) * 2005-04-08 2006-10-26 Toshiba Corp 半導体集積回路装置、画像処理システム、及び画像処理方法
JP2007179307A (ja) * 2005-12-28 2007-07-12 Hitachi Computer Peripherals Co Ltd 帳票識別装置
JP2007287006A (ja) * 2006-04-19 2007-11-01 Fujitsu Ltd 移動物体追跡装置及びプログラム
JP2012099156A (ja) * 2009-03-13 2012-05-24 Nec Corp 画像識別子抽出装置
JP2012099157A (ja) * 2009-03-13 2012-05-24 Nec Corp 画像識別子抽出装置
US8744193B2 (en) 2009-03-13 2014-06-03 Nec Corporation Image signature extraction device
US8749658B2 (en) 2009-04-06 2014-06-10 Nec Corporation Data processing device, image matching method, program, and image matching system
JP2013519409A (ja) * 2010-02-10 2013-05-30 アイモーフィクス リミテッド 画像解析
US9530077B2 (en) 2010-02-10 2016-12-27 Imorphics Limited Image analysis
US10198662B2 (en) 2010-02-10 2019-02-05 Mako Surgical Corp. Image analysis
JP2011215716A (ja) * 2010-03-31 2011-10-27 Toyota Motor Corp 位置推定装置、位置推定方法及びプログラム
CN113643467A (zh) * 2021-06-29 2021-11-12 南京信息工程大学 基于单片机的集成式红外成像闸门系统、终端和检测方法

Also Published As

Publication number Publication date
JP3819236B2 (ja) 2006-09-06

Similar Documents

Publication Publication Date Title
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
Zhu et al. Robust point cloud classification based on multi-level semantic relationships for urban scenes
CN107316031B (zh) 用于行人重识别的图像特征提取方法
US6691126B1 (en) Method and apparatus for locating multi-region objects in an image or video database
Darwish et al. Image segmentation for the purpose of object-based classification
Lee et al. Fusion of lidar and imagery for reliable building extraction
Xu et al. Hierarchical segmentation using tree-based shape spaces
US20100329556A1 (en) Image conversion method and apparatus, and pattern identification method and apparatus
Varnousfaderani et al. Weighted color and texture sample selection for image matting
CN111738055B (zh) 多类别文本检测系统和基于该系统的票据表单检测方法
Kumar et al. Road network extraction from high resolution multispectral satellite imagery based on object oriented techniques
JP2002183732A (ja) パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体
Karaoglu et al. A novel algorithm for text detection and localization in natural scene images
CN108694411B (zh) 一种识别相似图像的方法
Ivanovici et al. Color image segmentation
Han et al. A shape-based image retrieval method using salient edges
Mehri et al. A pixel labeling approach for historical digitized books
Doggaz et al. Image segmentation using normalized cuts and efficient graph-based segmentation
CN113326790A (zh) 基于异常检测思维的胶囊机器人排水管病害检测方法
Jenicka et al. Fuzzy texture model and support vector machine hybridization for land cover classification of remotely sensed images
Wang Understanding high resolution aerial imagery using computer vision techniques
CN113077410A (zh) 图像检测方法、装置方法、芯片及计算机可读存储介质
Huang et al. Reversed sketch: A scalable and comparable shape representation
Ji et al. Saliency detection using Multi-layer graph ranking and combined neural networks
Vijayashanthi et al. MAGNITUDE-BASED TWIN TEXTON CO-OCCURRENCE MATRIX FOR IMAGE RETRIEVAL

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050621

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050819

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060614

R151 Written notification of patent or utility model registration

Ref document number: 3819236

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090623

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100623

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100623

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110623

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120623

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120623

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130623

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees