JP2002183732A - パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体 - Google Patents
パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体Info
- Publication number
- JP2002183732A JP2002183732A JP2000378612A JP2000378612A JP2002183732A JP 2002183732 A JP2002183732 A JP 2002183732A JP 2000378612 A JP2000378612 A JP 2000378612A JP 2000378612 A JP2000378612 A JP 2000378612A JP 2002183732 A JP2002183732 A JP 2002183732A
- Authority
- JP
- Japan
- Prior art keywords
- image
- pixels
- target
- ternary
- comparison image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
を抑えつつ、検出精度のより高いパターン認識方法及び
及びパターン認識を行わせるプログラムを記憶したコン
ピュータ読み取り可能な記憶媒体の提供。 【解決手段】 列方向及び行方向にそれぞれ複数の画素
を配列した第1の画像中の、2個の画素間の濃淡値を比較
し、その大小関係または同値関係を3値で表した基準3値
比較画像を求め、列方向及び行方向にそれぞれ複数の画
素を配列した第2の画像中の、2個の画素間の濃淡値を比
較し、その大小関係または同値関係を3値で表した対象3
値比較画像を求め、前記基準3値比較画像と前記対象3値
比較画像との、それぞれが対応する位置で、前記3値の関
係が一致する個数を求め、前記個数から前記対象3値比
較画像と前記基準3値比較画像との類似性を判定するパ
ターン認識方法である。この様な工程により計算コスト
を抑制しつつ、マッチングの検出精度を向上させる。
Description
及び及びパターン認識を行わせるプログラムを記憶した
コンピュータ読み取り可能な記憶媒体に関する。
像中から特定の物体を検出する際に用いられる方法は、
画像マッチングと呼ばれている。
ン(L.G.Brown)の"A SURVEY OF IMAGE REGISTRATION TEC
HNIQUES", acm computing surveys, Vol.24,No.4,pp,32
5-376: (白井(訳)「画像の位置合わせ手法の概観」,コ
ンピュータサイエンス acm computing surveys'92 bit
別冊,pp.77-120)に示されたように、複数の画像の画素
ごとの類似性の測度を定義して、この画像間中でその測
度が最も高い場所を決定する方法がある。
グ方法には、類似性測度として、SSD(Sum of Square Di
fference)、SAD(Sum of Absolute Difference)や相互相
関係数といった統計的アプローチが用いられていた。
測度を以下の式(1)のように表す。
1,m2は、I1,I2の画素の平均値であり、σ1,σ2は
I1,I2の画素の分散値である。
中からあるモデル画像(以下テンプレート画像と称する)
の位置を検出するテンプレートマッチングでは、テンプ
レート画像の平行移動、回転といった幾何学的変換のパ
ラメータの増加に伴って検出のコストが大きくなった。
に、ヒストグラム平坦化処理やエッジ強調フィルタ、エ
ッジ抽出処理といった類似性測度を計算する前の前処理
となる画像処理が必要となる場合が多かった。
性測度(SSD、SAD、相互相関係数)やテンプレートが有す
る特徴との相性の問題があった。
て類似性測度を定義する場合には、画素の濃淡値の大き
さがそのまま測度に影響するため、以下に示す性質があ
った。
た場合のテンプレートマッチングを説明する図であり、
(a)は対象画像、(b)は(a)の一部に光が当たった画像、
(c)は(b)をエッジ処理した画像、(d)は(a)とは異なる撮
像された画像、(e)は(d)から抽出領域(手)を抽出した画
像である。
対象物の画像である(領域1)。(b)は対象物の右上から光
が照射された時の画像であり、この光が当たった領域を
領域2とし、この領域2の濃淡値は領域1と異なる。よっ
て、濃淡値の違いが類似度に影響を及ぼす。(c)は(b)を
エッジ処理した画像であり、領域1と2の境界の画素だけ
が影響を受けるため、(b)に比べて類似度への影響は小
さいものの、エッジだけの情報を用いてテンプレートマ
ッチングを行うことは汎用的ではなかった。
からテンプレート(手)を抽出した後の(e)は、背景画像
が複雑なため、この背景部分の濃淡値がテンプレートマ
ッチングに大きな影響を及ぼす原因になった。
うために、濃淡値を直接類似性測度に用いた場合には、
上述したような濃淡値の変化のため、検出精度を一定以
上に保っていなかった。
ないテンプレートマッチングには、ヴノー等(A.Venot,
J.F.Lebruchec, J.C.Roucayrol)の"A New Class of S
imilarity Measures for Robust Image Registration
": Computer Vision, Graphics, Image Processing,2
8,pp.176-184(1984)がある。これは、同じ撮像条件で撮
像された2つの画像を重ねて、それぞれの対応する画素
の画素値(濃淡値)の差を求め、この差が負に変化した
(符号が変化した)数を特徴量(類似性測度)としてマッチ
ングを行った方法である。
は、差のある位置における画素の「濃淡値」が類似性測
度に影響をおよぼすが、この符号の変化は、差のある位
置の「個数」に関連するために、濃淡値の変動に対して
影響が少ない。
に適用されているが、試行のたびに、相関法と同様に、2
つの画像の特徴量の計算が必要となるため、検出コスト
が大きくなるといった問題があった。
て用いた手法に、リプトン等の(P.Lipson, E.Grimson,
P.Sinha)"Configuration Based Scene Classificatio
n and Image Indexing": CVPR'97 pp1007-1013と、シン
ハ(P.Sinha)の"Object Recognition via Image Invar
iants: A Case Study": Investigative Ophthalmology
Visual Science, vol.35,pp.1735-1740,May 1994があ
る。
て、画像をいくつかのブロックに分け、そのブロック間
の画像特徴量の大小関係に着目した検索を行い、画像の
構造化を行っている。
は、画像中から例えば顔領域を検出するために、画素間
の大小関係を抽出し、その抽出結果をテンプレートとす
る方法が記載されてある。このシンハの方法は、記憶さ
れた大量の画像から定性的な関係を抽出して、この抽出
結果をテンプレートにして保持するという方法である
が、動画像等の画像が時系列的に複数個並んだ画像列に
対して、あるテンプレートの対象領域の追跡を行う方法
(トラッキング)では、テンプレートを逐次更新する必
要があり、更新のための検出コストが大きくなるといっ
た問題があった。
測度とするテンプレートマッチングに、“増分符号相関
による自然画像照合":金子俊一、村瀬一郎、福島孝明、
五十嵐悟:電気学会研究会資料IIS-98-58,pp.31-35,1998
がある。金子等は、画素間の濃淡値の増分符号に着目し
て、その符号の数を類似性測度にする考え方を導入して
いる。しかしながら、2つの画像の類似性の判断を行う
時、画素間の濃淡値が同一であって、濃淡値の符号が等
号となるような場合には、濃淡値が増加した場合と同様
に扱われているために、精密なマッチング、画像を分類
するといった観点からはマッチングの精度が低くなると
いった問題点があった。
のマッチングは、前処理や特徴量等の照合数の増加にと
もなう計算コストが大きく、また撮像された画像が同一
領域であっても、撮像される環境の変化によって濃淡値
に変動がおきた場合、この変動に対応ができず検出精度
を低下させるといった問題があった。
なされたもので、検出精度を向上させた場合であっても
計算コストを大幅に増加させることなく、また、画像に
変動が生じた場合に、この変動の影響を受けにくい類似
性測度を用いて、テンプレートマッチングの検出精度を
向上させるパターン認識方法及びパターン認識を行わせ
るプログラムを記憶したコンピュータ読み取り可能な記
憶媒体の提供を目的とする。
に本発明のパターン認識方法は、列方向及び行方向にそ
れぞれ複数の画素を配列した第1の画像中の、2個の画素
間の濃淡値を比較し、その大小関係または同値関係を3値
で表した基準3値比較画像を求める工程と、列方向及び
行方向にそれぞれ複数の画素を配列した第2の画像中の、
2個の画素間の濃淡値を比較し、その大小関係または同値
関係を3値で表した対象3値比較画像を求める工程と、前
記基準3値比較画像と前記対象3値比較画像との、それぞ
れが対応する位置で、前記3値の関係が一致する個数を求
める工程と、前記個数から前記対象3値比較画像と前記
基準3値比較画像との類似性を判定する工程とを有す
る。
及び行方向にそれぞれ複数の画素を配列した対象画像に
対し、2×2画素を1つの最小領域として分割し、その複
数の最小領域を上位階層の1つの最小領域として構成す
る複数段階の階層構造によって表現し、列方向及び行方
向にそれぞれ複数の画素を配列した基準画像に対し、2
×2画素を1つの最小領域として分割し、その複数の最小
領域を上位階層の1つの最小領域として構成する複数段
階の階層構造によって表現し、前記対象画像の各前記階
層の前記最小領域ごとに、各最小領域中の、2個の画素間
の濃淡値を比較し、その大小関係または同値関係を3値で
表した対象3値比較画像を求め、前記基準画像の各前記
階層の前記最小領域ごとに、各最小領域中の、2個の画素
間の濃淡値を比較し、その大小関係または同値関係を3値
で表した基準3値比較画像を求め、前記対象画像の、任意
の前記階層中の少なくとも1つの前記最小領域の前記対
象3値比較画像と、この対象3値比較画像に対応する前記
基準3値比較画像との、それぞれが対応する位置で、前
記3値の関係が一致する個数を求め、前記個数から前記
対象3値比較画像と前記基準3値比較画像との類似性を判
定することを特徴とする。
を行うプログラムをコンピュータ読み取り可能なように
記憶させた記憶媒体であって、列方向及び行方向にそれ
ぞれ複数の画素を配列した第1の画像中の、2個の画素間
の濃淡値を比較させ、その大小関係または同値関係を3値
で表した基準3値比較画像を求めさせ、列方向及び行方
向にそれぞれ複数の画素を配列した第2の画像中の、2個
の画素間の濃淡値を比較させ、その大小関係または同値
関係を3値で表した対象3値比較画像を求めさせ、前記基
準3値比較画像と前記対象3値比較画像との、それぞれが
対応する位置で、前記3値の関係が一致する個数を求めさ
せ、前記個数から前記対象3値比較画像と前記基準3値比
較画像との類似性を判定させることを特徴とする。
を行うプログラムをコンピュータ読み取り可能なように
記憶させた記憶媒体であって、列方向及び行方向にそれ
ぞれ複数の画素を配列された対象画像に対し、2×2画素
を1つの最小領域として分割させて、その複数の最小領
域を上位階層の1つの最小領域として構成する複数段階
の階層構造によって表現させ、列方向及び行方向にそれ
ぞれ複数の画素を配列された基準画像に対し、2×2画素
を1つの最小領域として分割させて、その複数の最小領
域を上位階層の1つの最小領域として構成する複数段階
の階層構造によって表現させ、前記対象画像の各前記階
層の前記最小領域ごとに、各最小領域中の、2個の画素間
の濃淡値を比較させて、その大小関係または同値関係を3
値で表した対象3値比較画像を求めさせ、前記基準画像
の各前記階層の前記最小領域ごとに、各最小領域中の、2
個の画素間の濃淡値を比較させて、その大小関係または
同値関係を3値で表した基準3値比較画像を求めさせ、前
記対象画像の、任意の前記階層中の少なくとも1つの前記
最小領域の前記対象3値比較画像と、この対象3値比較画
像に対応する前記基準3値比較画像との、それぞれが対
応する位置で、前記3値の関係が一致する個数を求めさ
せ、前記個数から前記対象3値比較画像と前記基準3値比
較画像との類似性を判定させることを特徴とする。
は、コンピュータに、列方向及び行方向にそれぞれ複数
の画素を配列した第1の画像中の、2個の画素間の濃淡値
を比較させ、その大小関係または同値関係を3値で表した
基準3値比較画像を求めさせる機能と、列方向及び行方
向にそれぞれ複数の画素を配列した第2の画像中の、2個
の画素間の濃淡値を比較させ、その大小関係または同値
関係を3値で表した対象3値比較画像を求めさせる機能
と、前記基準3値比較画像と前記対象3値比較画像との、
それぞれが対応する位置で、前記3値の関係が一致する個
数を求めさせる機能と、前記個数から前記対象3値比較
画像と前記基準3値比較画像との類似性を判定させる機
能とを有する。
コンピュータに、列方向及び行方向にそれぞれ複数の画
素を配列された対象画像に対し、2×2画素を1つの最小
領域として分割させて、その複数の最小領域を上位階層
の1つの最小領域として構成する複数段階の階層構造に
よって表現させる機能と、列方向及び行方向にそれぞれ
複数の画素を配列された基準画像に対し、2×2画素を1
つの最小領域として分割させて、その複数の最小領域を
上位階層の1つの最小領域として構成する複数段階の階
層構造によって表現させる機能と、前記対象画像の各前
記階層の前記最小領域ごとに、各最小領域中の、2個の画
素間の濃淡値を比較させて、その大小関係または同値関
係を3値で表した対象3値比較画像を求めさせる機能と、
前記基準画像の各前記階層の前記最小領域ごとに、各最
小領域中の、2個の画素間の濃淡値を比較させて、その大
小関係または同値関係を3値で表した基準3値比較画像を
求めさせる機能と、前記対象画像の、任意の前記階層中
の少なくとも1つの前記最小領域の前記対象3値比較画像
と、この対象3値比較画像に対応する前記基準3値比較画
像との、それぞれが対応する位置で、前記3値の関係が
一致する個数を求めさせる機能と、前記個数から前記対
象3値比較画像と前記基準3値比較画像との類似性を判定
させる機能とを有する。
の濃淡値の大小関係、同一関係といった画像の定性的な
関係を、画像の特徴量とすることで、計算コストの低減
と、より精度の高いマッチングを行うことができる。
て図面を参照して説明する。
である。
動作を説明するものであり、(a)は対象画像の平面図、
(b)はテンプレート画像の平面図、(c)はテンプレート画
像を対象画像中で移動させることを説明する平面図、
(d)は対象画像中でテンプレート画像を検出した平面図
である。
グとは、s×t行列の画素からなる対象画像中から、v×w
行列の画素からなるテンプレート画像が略合致する位置
(パターン領域)を検出することである。なお、説明のた
めに、対象画像の面積は、テンプレート画像の面積より
も大きいとする。また、各画像は、2値以上の多値濃淡で
表され、それぞれの画像の濃度分解能は同一である。
(b)のテンプレート画像は池である。より詳しくは、テ
ンプレート画像(太枠)を対象画像全体に、(c)の矢印の
ように移動させてそれぞれの位置での類似性を比較し、
最も類似性の高い位置がテンプレート画像であるとし
て、(d)のように対象画像中の一部分をテンプレート画
像として検出することがテンプレートマッチングであ
る。ここで、図中左右方向が行方向であり、図中上下方向
が列方向である。
中の各位置での類似性を判断するための測度として、以
下の特徴量を用いる。
て、画像I内の位置(x,y)の画素を画素値I(x,y)とす
る。ただし、1≦x≦m,1≦y≦nの関係を有し、濃度分解
能は、2ビットであり、0〜3の4段階で表された数値とす
る。
素の画像ISである。
間の画素値から以下の2つの3値画像Qh,Qvを特徴量
として求める。
る画素間の画素値の大小関係、同値関係を調べる。
基準もしくは対象3値比較画素マトリクス(修正検討
中))あり、(b)はQvの画像(列方向の基準もしくは対
象3値比較画素マトリクス)(修正検討中)である。(a)
では、画像ISの最左上の画素00とその右の画素01との関
係は、それぞれの濃度が2と4であり、計算した結果QVは
「-2」となるため、記号「<」が表示される。同様に(b)
では、画像00とその下の画素10との関係は、それぞれの濃
度が2と3であり、計算した結果Qhは「-1」となるため、
記号「<」が表示される。
の結果、Qvは(m-1)×n画素の画像つまり(3×4)画素の3
値画像が得られ、Qhはm×(n-1)画素の画像つまり(4×
3)画素の3値画像が得られる。
表し、以下QT(Qualitative Trinary Representation)
表現と称する。 QT(I)=(Qv,Qh) また、各画素値pについて(ap+b)倍された画像(aI+b)につ
いては、 QT(I)=QT(aI+b) なる関係が成立する。
も、各画素間の大小関係は変化しないため、同じQT表現が
得られる。これは、画像全体で行うノルムの正規化、も
しくは平均と分散とを用いた正規化によっても特徴量(Q
T表現)が変化することはないことをあらわす。
坦化を予め行った画像HistNorm(I)について、 QT(I)=QT(HistNorm(I)) なる関係が成立する。
照して説明する。
値画像とを表すQT表現の説明図であり、(b)は各画像の3
値画像を比較した結果を示すQT表現の説明図である。
の下には画像1のQT表現(左側が行方向の基準3値比較画
像、右側が列方向の基準3値比較画像)が表示され、右側
の画像2はテンプレート画像であり、画像2の下には画像
2のQT表現(左側が行方向の対象3値比較画像、右側が列
方向の対象3値比較画像)が表示される。画像1のQT表現
をQT(I1)とし、画像2のQT表現をQT(I2)とする。
る。 QT(I1)=(Qv1,Qh1) QT(I2)=(Qv2,Qh2) このQT(I1)の(Qv1,Qh1)とQT(I2)の(Qv2,Qh2)との各成
分を比較し、それぞれ対応する位置での符号が同一であ
る画素の個数Dv、Dh(個数A、個数B)を以下のように求
めていく。
を1に、それ以外の場合を0として、すべての画素につい
て計算し、同じ符号の画素の個数を求める。
テンプレート画像が同一である画像を比較したときであ
るから、 Dv(I,I)=n(m-1) Dh(I,I)=m(n-1) となる。
一であるものの個数を計算する。(b)では同一の符号を
有する画素にのみ網掛けをして表示している。この例で
は、以下の様な数が求められる。 Dv(I1,I2)=1 Dh(I1,I2)=6 次に、画像1と画像2との類似度QTSを求める。QTSは以下
に示す式であり、その範囲は0.0〜1.0である。
度QTS=0.29が求められる。
の類似度について説明する。
る画像であり、これら画像1、2、3の濃度レベルは4段階と
する。
QT表現と、そのQT表現のおける同一符号の個数を求め、そ
の結果から類似度を計算する。
画像2に対して、画像3の方が画像1よりも類似度が高いと
判断される。
数が同じであれば、類似度QTSの分母は共通となるため、
分子だけを比較して類似度QTSを求めても良い。
場合、乗算を用いることなく比較演算、及び和演算のみ
で類似度を得るため、従来の方法で同精度を得る場合に
比べて、計算コストを低減できる。また、統計学的な平
均、分散を用いないため、マッチングの際のテンプレート
画像の移動を複数回行うことなく一回で済むことも計算
コストの低減に寄与する。
を示すグラフであり、(b)は複数の対象画像である。
対象画像とある一つのテンプレート画像との相関値もし
くはQT表現の結果(QTS)を表している。
関数では略同一であると判断された画像であっても、QT
表現でみれば類似度が異なっていることが分かる。この
時の対象画像は、(b)に示すような様々は形状の画像が含
まれていた。
の増分符号を類似性測度とする画像照合方法もあった
が、この方法は、濃淡値が同じであることを示す等号が増
加符号と同じ定義にしており、更に水平方向の比較しか
行っていない。つまり、画像照合は、大小関係だけで表
現した2値表現を用いて行っており、また、水平方向のみ
の計算結果から画像照合の結果を出力している。
本発明との差異について、図7(a)の従来の画像照合の説
明図、(b)本発明の説明図を用いて説明する。
からなり濃淡値は4段階である。また、各画像間に記載さ
れた数値は、画像間の類似度を示しており、1に近いほど
同一画像であることを示す。
し、右側の画像を画像2とし、中央の画像を画像3とする。
から求められた符号と、画像2の隣接する画素から求めら
れた符号とを比較した結果、対応する位置での符号が全
て同一であるため類似度は1.0であり、画像1と画像3とは
同一画像と判断する。また、画像1と画像3は、画素(3,1)
〜(3,4)が同一の濃淡値であり、符号は等号であるが、等
号符号は増加符号の扱いと同一であるため、類似度を1.0
とし、その結果同一画像であるとみなす。同様に、画像2
と画像3との間でも画素(2,1)〜(2,4)は同一の濃淡値で
あるが、類似度1.0と判断され、同一の画像であるとみな
す。
号が等号である画素については、大小関係とは別に定義
しているため、上述したような問題がなくなり、同一な
濃度値を有する画素は同一であると判断され、類似度を
0.5と計算される。
を使って表現することにより、従来よりも、より精度の高
い類似度計算を行うことができる。
度計算の動作について、図8の電子機器のブロック図と、
図9のフローチャートを参照して説明する。なお、テンプ
レート画像、対象画像は予め撮像カメラ等により撮像さ
れる。
4、とマウス5を有している。本体2内には、デジタルカ
メラ等の撮像カメラで撮像された画像が記憶されたハー
ドディスク等の記憶装置10と、ROM,RAMからなるメモリ
11と、記憶装置10、メモリ11、各要素(モニタ2、キーボー
ド4、マウス5)が接続され、演算や各要素の制御を行うCP
U12からなる。
像カメラを直接接続して行う方法や、インターネット等
の回線を介して、キーボード4及びマウス5を操作して方
法がある。画像を表示する場合には、モニタ2を使用す
る。
をメモリ11に読み取り、CPU12によってテンプレート画
像のQT表現を求める(S1)。
象画像をメモリ11に読み取り、この対象画像を拡大した
画像、縮小した複数の対象画像を生成し、記憶装置10も
しくはメモリ11に記憶する(S2)。
複数の対象画像のQT表現を、CPU12によって求め、対象画
像と対応させて記憶装置10もしくはメモリ11に記憶する
(S3)。
画像と、ある倍率の対象画像のQT表現の3値画像中のテ
ンプレート画像と同じ大きさの任意の領域との間で、そ
れぞれに対応する位置での同一符号の個数を求め、その
個数から類似度をCPU12によって計算し、記憶装置10もし
くはメモリ11に一時的に記憶する(S4)。
内全てに対して、テンプレート画像のQT表現の3値画像
の類似度を計算をしたか否かがCPU12によって判断され
る(S5)。全ての計算が終了していればS9へ進み、未終了
であればS6へ進む。
域の対象画像中の位置を1画素分だけ行もしくは列方向
方向にずらした位置での3値画像と、テンプレート画像の
3値画像と、がそれぞれ対応する位置での類似度をCPU12
によって計算し、記憶装置10もしくはメモリ11に一時的
に記憶する(S6)。なお、類似度の計算は、任意の位置の
行方向の計算を全て行った後、列方向方向に1画素ずら
して、1画素ずらした位置で行方向に全ての計算を行って
いく。
憶した類似度とをCPU12によって比較する(S7)。比較さ
れた結果、(4)よりも(6)の類似度が大きければ、(8)へ
進み、小さければ(5)へ進む。
類似度を記憶装置10もしくはメモリ11から削除する(S
8)。S5へ進む。
計算が終了した場合には、他の倍率の対象画像の3値画像
と、テンプレート画像の3値画像と、がそれぞれ対応する
位置での類似度を計算したか否かがCPU12によって判断
される(S9)。全ての他の倍率の対象画像の計算が終わっ
ていれば、(11)へ進み、未終了であれば(10)に進む。
しくはメモリ11に記憶される倍率の異なる対象画像をCP
U12によって読み出す(S10)。(4)へ進む。
しくはメモリ11に記憶された類似度(対象画面の倍率及
び対象画像中の位置を含む)を最大類似度であるとみな
す(S11)。この最大類似度に記憶された位置がテンプレ
ート画像の位置であると判断する。
表現のQT表現を用いることで変動に強い類似性測度を
得、より類似度計算の精度が高く、かつこの精度の向上
に伴う計算コストの増加を抑制する、テンプレート画像
の検索を行うことができる。
持っていても良い。例えば、テンプレート画像(画像に
写る被対象物の構造)が複雑である場合には、全体の構造
と各部分の構成とに分けて、複数のテンプレート画像か
ら構成することができる。
を階層的な構造として有する場合の説明図である。例と
して、人間の顔を考える。
全体、右目、左目、鼻、口の5つのテンプレート画像に分
ける。階層構造は、上段に顔全体のテンプレート画像が
あり、顔全体の下段に右目、左目、鼻、口の各テンプレート
画像が並列にある。各階層間では、テンプレート画像の
解像度は、同じでも、異なっていても良い。
囲(黒の枠)を示している。一番外側の枠は、顔全体のテ
ンプレート画像の範囲を示している。顔全体の枠の中
で、右目、左目、鼻、口の探索範囲は、各テンプレート画像
を囲む枠で表示されている。各テンプレート画像はこの
枠内でマッチングが行われる。ここで右目と鼻の範囲、
及び左目と鼻の範囲のように、その一部が重複していて
も良い。
述した各テンプレート画像を検出する。顔全体のテンプ
レート画像は(d)であり、まず、このテンプレート画像を
対象画像中からQT表現を用いて検出する。検出結果は、
(e)中の枠1,2である。
れら枠の大きさを同一にする((f)参照)。これら枠1,2
を顔全体のテンプレート画像とみなして、その画像の中
で(b)の各テンプレート画像(右目、左目、鼻、口)とのマッ
チングを、QT表現を用いて行っていく。
り、マッチングの結果から右側の画像は類似度が低い(な
い)ため、検出対象からはずす。左側の画像は、類似度が
(閾値を超えた)高いため、テンプレート画像であると
判断する。
画像からテンプレート画像が検出される。
構造として保持し、マッチングを行うことも可能であ
る。また図10では各階層ごとにマッチングを行ったが、
各階層のマッチングを並行して行い、最も各テンプレー
ト画像の適合が良い位置がテンプレート画像の位置であ
ると判断しても良い。例えば、図10では5つのテンプレー
ト画像があるが、この5つのテンプレート画像の各位置で
の類似度の合計値をその位置の類似度とし、最も大きな
類似度を有した位置がテンプレート画像の位置であると
することもできる。これは以下で述べる第3の実施の形
態にも適用できる。
ついて図11を参照して説明する。
成要素は同一符号を付し重複する説明は省略する。
て、従来の定量的な類似度(例えば相関法による類似
度)を併用したことである。
説明図であり、(a)は対象画像とテンプレート画像、(b)
はQT表現で対象画像中から各閾値でテンプレート画像を
抽出したマッチング結果の図、(c)はQT表現と相関法そ
れぞれのマッチング結果の図、(d)QT表現と相関法とを
組み合わせて求めたマッチング結果の図、(e)対象画像
中のテンプレート画像が一致した場所を示す画像であ
る。
ニタであり、対象画像は、このモニタが配置された室内を
撮像した画像である。
レート画像のマッチングを行った結果が、(b)である。
(b)では、マッチングする際のQTSに対する閾値を4つ設定
しており、t1〜t4に向かって大きくなる。したがって、
最上段の閾値t1のマッチング結果では、テンプレート画
像にマッチングする候補は多く、逆に最下段の閾値t4の
マッチング結果では、マッチングする候補は少なくなっ
ている。
結果をQT表現によるマッチング結果とする((c)上段)。
また、同じ対象画像とテンプレート画像とを用いて相関
法によってマッチングした結果が(c)下段である。
法によるマッチング結果とを、比較して、同時にマッチ
ング結果として検出される場所を、テンプレート画像の
位置とする。ただし、同時にマッチングしている場所が
複数個存在する場合には、複数個の中で相関法による検
出結果のうち最大の類似度を有する場所を真のテンプレ
ート画像の位置とする。この結果、(d)中の実線が真のテ
ンプレート画像の位置であり、破線が同時にマッチング
され検出された位置である。
像中の白枠で囲まれた領域がテンプレート画像であると
判断する。
現と相関法とを組み合わせてテンプレートマッチングを
行うことで、より検出精度を上げることができる。
て低いQT表現を用いて、対象画像中の類似度を求めてお
き、続いて類似度が所望の閾値以上の場所のみ相関法を
用いてマッチングを行うことで、相関法だけ用いた場合
の計算コストよりも低く、かつ精度の高いマッチングを
行うことができる。
ついて図12,13を参照して説明する。
画像が複数個並んだ画像列に対して、あるテンプレート
画像の対象領域の追跡(トラッキング)を行い、その動
画像からテンプレート画像の位置を検出したことであ
る。
象画像であり、図中上から下に時間軸を持つ。なお、左
側は所定間隔で撮像された対象画像であり、右側はその
対象画像中のテンプレート画像を白枠で示した画像であ
る。
り、このテンプレート画像が時間と共に画像内を右から
左へと移動することで、テンプレート画像が検出される
位置が変わっていく。また、時間の経過と共に手の位
置、形状が変わるため対象画像も変わる。
を参照して、動作を説明する。
もしくはメモリ11内に記憶されている。また、対象画像
は、撮像カメラ等で撮像された画像であり、この画像は
所定間隔で、記憶装置10もしくはメモリ11内に送られ、
記憶される。本実施の形態の対象画像は、図12に示すよ
うに5つとする。
テンプレート画像を読み出し、CPU12によってテンプレ
ート画像のQT表現を求める(S21)。
ら対象画像(例えば図12の左側最上段の画像)を読み出す
(S22)。
変化させた複数の対象画像をCPU12によって求め、これら
対象画像を記憶装置10もしくはメモリ11に記憶する(S2
3)。
象画像に対応させてQT表現を、記憶装置10もしくはメモ
リ11に記憶する(S24)。
画像と、ある倍率の対象画像のQT表現の3値画像中のテ
ンプレート画像と同じ大きさの任意の領域との間で、そ
れぞれに対応する位置での同一符号の個数を求め、そし
て類似度をCPU12によって求め、記憶装置10もしくはメモ
リ11に一時的に記憶する(S25)。
内全てに対して、テンプレート画像のQT表現の3値画像
の類似度を計算したか否かがCPU12によって判断される
(S26)。全ての計算が終了していればS30へ進み、未終了
であればS27へ進む。
この任意の領域の位置を1画素分だけ行方向もしくは列
方向にずらした位置での3値画像と、テンプレート画像の
3値画像と、がそれぞれ対応する位置での類似度をCPU12
によって求め、記憶装置10もしくはメモリ11に一時的に
記憶する(S27)。なお、計算は任意の領域の行方向を全て
行った後、列方向を行う。
憶した類似度とをCPU12によって比較する(S28)。比較さ
れた結果、(5)よりも(7)の類似度が大きければ、(9)へ
進み、小さければ(6)へ進む。
を記憶装置10もしくはメモリ11から削除する(S29)。
(6)へ進む。
計算が終了した場合には、他の倍率の対象画像の3値画像
と、テンプレート画像の3値画像と、がそれぞれ対応する
位置での類似度を計算したか否かがCPU12によって判断
される(S30)。全ての他の倍率の対象画像の計算が終わ
っていれば、(12)へ進み、未終了であれば(11)に進
む。
しくはメモリ11に記憶される倍率の異なる対象画像をCP
U12によって読み出す(S31)。(3)へ進む。
しくはメモリ11に記憶された類似度(対象画面の倍率及
び対象画像中の位置を含む)が最大類似度であるとみな
す(S32)。この最大類似度に記憶された位置がテンプレ
ート画像の位置であると判断する。
た領域を、新たなテンプレート画像としてCPU12によって
取り出し、記憶装置10もしくはメモリ11に記憶する。そ
して、この新たなテンプレート画像のQT表現を求め、テ
ンプレート画像に対応させて記憶する(S33)。
対象画像が存在するか否かがCPU12によって判断される
(S34)。存在する場合には、(2)に進み、存在しなけれ
ば処理を終了する。
グすべき対象画像が存在するため、(2)へ進み、対象画
像を図12左側の上から2番目の画像として、上述したよう
な(2)〜(13)のマッチングを行う。この2番目の画像
を処理した後は、(14)にて対象画像を図12左側の上か
ら3番目、4番目、5番目と変更しながら同様のマッチング
を行っていく。
テンプレート画像が対象画像中で移動し、対象画像、テン
プレート画像が時事変化していく場合であっても、テン
プレート画像を逐次更新し追跡することで、対象画像が
動画像においてもテンプレートマッチングを行うことが
できる。
ついて図14,15を参照して説明する。
(Quadtree)法と組み合わせて適用させたことである。
であり、階層は3層あり、各階層の一つの画像は、2×2画
素から構成される。ノードからの枝が4つある階層構造
示している。階層1が最上層であり、階層3が最下層であ
る(図14(a)参照)。
の下層である階層2の画像は、階層1の1画素を4つ分割し
た4×4画素からなり、この4つに分割された画素の平均
濃度が、階層1の一つの画素の濃度となる。同様に、階
層2の下層である階層3の画像は、階層2の1画素を4つに
分割した8×8画素からなり、この4つに分割された画素
の平均濃度が、階層2の一つの画素の濃度とする(図14(b)
参照)。また、各階層間の関係を本実施の形態では、より
下層の画素値の平均値をより上層の濃度として各階層を
結び付けていたが、この下層の画素の画素値の最大と最
小の平均や中央値など、関連の仕方に制限はない。
層のQT表現であり、(c)は3値表現の大小、等号関係を所
定の関係を持って数値化したものである。
層1のQT表現は1組、階層2のQT表現は4組、階層3のQT表現
は8組となる。1組のQT表現は4つの符号値から構成され
る。大小関係、等号関係の3値表現の符号値の組み合わせ
は34=81種類あるが、そのうち実際にはありえない組み
合わせを削除すると57種類となる。
の組み合わせを数値化した番号(0〜56)をつけると、(c)
のように表せる。この数値化した番号をQT-ID番号と称
する。また、各QT表現間の関係は、2×2画素からなるため
4段階で表され、これは対応する画素の符号が同一であ
る個数を用いて求められる。全ての符号が同一であれ
ば、4として、全ての符号が異なっていれば、0とする。
対象画像を4分木構造で表現し、各層のQT表現をQT-ID番
号(0〜4で表される類似関係を含んでいる)で表現し直
す。
構造で表現した際の、2つの画像の類似性の判断法につ
いて述べる。
号を用いて類似性を判断する場合、それぞれの各階層の
ノードの対応するID番号が同じかどうか、もしくは符号
の対応する数がいくらであるかを求め、構造間の類似性
を、その数によって判断する。
位階層では画像の大域的な性質を表現することになり、
第1の実施の形態で述べたような、隣接関係に基づいた
だけのマッチングに加え、大域的な性質の類似性も比較
することになる。
QT-ID番号同士の比較を行って、類似性を判断してもよ
い。
際に用いることができる。階層が上位であるほど抽象化
された画像になるため、大まかな検索を行う際には上位
の階層で行い、より精度の高い検索を行う際には下位の
階層でマッチングを行う。
の索引(インデックス)が必要となることがあり、この
QT-ID番号を索引の情報として使用することも可能であ
る。
算コストをより抑制するためには上位の階層でマッチン
グを行い、検出精度をより高めるためには、より下位の階
層でマッチングを行うことで、必要に応じてマッチング
を使い分けることができる。
で、各画像から求められたQT表現同士のマッチングだけ
でなく、精緻なマッチングを行うことも可能である。
ついて図16を参照して説明する。
画像中でマッチングの計算に関与しない画素を設定した
ことである。
あり、図中「φ」の画素がテンプレートマッチングを行
う際に無視する部分である。
レート画像の四隅であり、この四隅の画素は、予めマッチ
ングする画素からはずす。そして、テンプレート画像の
形状を略十字形に変形する。
の中央部の複数の画素を無視する画素とする。これは、
例えば、テンプレート画像がドーナツ形状であれば、空
洞部のマッチングは不要であるため、予め無視する領域
とすることができる。また、テンプレート画像が手であ
れば、指と指との隙間に当たる画素は、この無視する領
域として設定することができる。
とにより、計算コストを低減し、かつ検出時間を短時間
にすることができる。また、無視する領域の類似度の計
算を行わないことにより、無意味な領域の影響を受けな
い。
の位置の指定は、任意に設定することが可能である。
17を参照して説明する。
に対してマッチングを行う際に、複数のテンプレート画
像ごとに分類したことである。
種類のテンプレート画像であり、(b)は複数の対象画像
であり、(c)は分類結果である。
類あり、A、B、Cとする。ある記憶領域に複数の対象画像が
混在した状態で保持されている((b)参照)。テンプレー
ト画像、対象画像、それぞれのQT表現を求めて、各テンプ
レート画像を各対象画像とマッチングさせていく。各対
象画像は、3つのテンプレート画像のうちいずれかを画像
中に有する。マッチングを行い、その結果類似度が最大
となるテンプレート画像ごとに対象画像を振り分けてい
き分類を行う((c)参照)。また、この後、分類された対象
画像ごとに更に詳細なマッチングを行っても良い。この
方法は、例えばクラスタリングの前処理として使用した
り、パターン認識のためのマルチカテゴリ辞書の選択の
ために用いたりすることができる。
されず、その主旨を逸脱しない範囲で種々変形して実施
できることは言うまでもない。例えば、テンプレート画
像は、複数の画像の平均画像を用いて作成したものであ
っても構わない。この場合に、平均画像は各画素の濃淡
値から平均画素値を作ってQT表現を求めてもよいし、そ
れぞれの画像のQT表現を求め、各画像の対応する画素位
置の最も多い値を用いてテンプレート画像としても良
い。また、変形する物体を検出するために、一つのテンプ
レート画像に対して、種々変形した形状を考慮したテン
プレート画像を複数設定することも可能である。
素間で計算を行っていたが、斜め方向に配置された画素
間や、所定距離はなれた画素間で3値画像を求めても良
い。例えば、図18のように隣接していない画素間での大
小関係、同値関係を用いてもよい。
自然数)段階として大小関係を表すことで、より検出精
度を向上させることもできる。
ング(動画像中からテンプレート画像を抽出)は、テン
プレート画像を対象画像中で平行移動させたり、対象画
像を拡大、縮小したりしたが、対象画像を所望角度回転さ
せた各画像をマッチングの対象としても良い。
では4段階でなくとも、64段階(6bit)、128段階(7bit)に
設定することも可能である。また、得られる画像が256
段階(8bit)の画像の場合に、濃淡方向の解像度を落とし
て例えば64段階にし、同様のQT表現を求めるといった処
理を行っても良い。256段階の場合には、大小関係が成
立していた部分が、64段階に解像度が落ちたために同値
関係になるといった別の側面からの情報が得られるよう
になる。もちろん、複数の解像度を使って多重解像度のQ
T表現を用いても良い。
素からなる画像を一つの単位としているが、この画像単
位を構成する画素数は、適宜設定可能である。
うことも可能である。その場合には、カラー画像の各R,
G,Bの濃淡に対して、同様の処理を行うことによってマ
ッチングを行うことができる。また、別の色表現に変換
し、この色表現から大小関係、等号関係を求めることも
できる。
された画像でなく、赤外線を照射して撮像(撮影)された
赤外線画像を用いることもできる。一般に、赤外線画像
は、被撮像物によっては画像全体が白っぽくなり、飽和
したような画像が得られる。この場合に、従来の正規化
相関法を用いてマッチングを行うと、明るさに比例して
相関値が大きくなるため、誤認識をおこしやすい。しか
しながら、QT表現を用いたマッチングは、撮像される画像
の性質(波長特有の画像の写り方)に左右されず、誤認識
をせずにマッチングを行うことができる。また、コント
ラストの悪い超音波画像や医用画像、レーダ画像等の各
種画像に対しても誤認識を低減したマッチングを行うこ
とができる。
ンプレート画像の解像度レベルが大きい(例えば128、25
6段階)場合には、同一符号に任意の範囲を持たせるこ
とも可能である。例えば、256段階で濃度を表現する場合
には、等号範囲を±5以内とし、比較した結果この範囲
内であれば同一であるとみなして、等号とする等であ
る。
コンピュータで実行可能なプログラムで実現し、このプ
ログラムをコンピュータで読み取り可能な記憶媒体とし
て実現することも可能である。
磁気ディスク、フロッピー(登録商標)ディスク、ハー
ドディスク、光ディスク(CD-ROM,CD-R,DVD等)、光磁
気ディスク(MO等)、半導体メモリ等、プログラムを記憶
でき、かつコンピュータが読み取り可能な記憶媒体であ
れば、その記憶形式は何れの形態であってもよい。
トールされたプログラムの指示に基づきコンピュータ上
で稼動しているOS(オペレーションシステム)や、データ
ベース管理ソフト、ネットワーク等のMW(ミドルウェア)
等が本実施の形態を実現するための各処理の一部を実行
してもよい。
ピュータと独立した媒体に限らず、LANやインターネッ
ト等により伝送されたプログラムをダウンロードして記
憶または一時記憶した記憶媒体も含まれる。
体から本実施形態における処理が実行される場合も、本
発明における記憶媒体に含まれ、媒体の構成は何れの構
成であってもよい。
憶媒体に記憶されたプログラムに基づき、本実施の形態
における各処理を実行するものであって、パソコン等の
1つからなる装置、複数の装置がネットワーク接続され
たシステム等の何れの構成であってもよい。
パソコンに限らず、情報処理機器に含まれる演算処理装
置、マイコン等も含み、プログラムによって本発明の機
能を実現することが可能な機器、装置を総称している。
対して強い類似性測度を用いることで、計算コストを抑
えつつ、検出精度をより高くすることができる。
態を説明するもので、(a)は対象画像、(b)はテンプレー
ト画像、(c)は対象画像中を移動するテンプレート画像
の説明図、(d)はマッチング結果の説明図。
態の対象画像の説明図。
態を説明するもので、(a)は横方向のQT表現の説明図、
(b)は縦方向のQT表現の説明図。
態を説明するもので、(a)は各画像のQT表現の説明図、
(b)は各画像から得られたQT表現を比較した結果の説明
図。
態の類似度の説明図。
態を説明するもので、(a)はQT表現による類似度と相関
法による類似度との関係を示すグラフ、(b)は複数の対象
画像。
態を説明するもので、(a)は従来のマッチングの説明
図、(b)はQT表現を用いたマッチングの説明図。
態の電子機器の構成を示すブロック図。
態の動作を示すフローチャート。
形態を説明するもので、(a)は階層構造を有するテンプレ
ート画像、(b)は各テンプレート画像の配置関係と検出
領域の説明図、(c)は対象画像、(d)はテンプレート画
像、(e)は対象画像中から検出された複数のテンプレー
ト画像(上位階層)の候補の位置の説明図、(f)は対象画
像から切り取られたテンプレート画像の候補の説明図、
(g)テンプレート画像(上位階層)の候補に下位階層のテ
ンプレート画像をマッチングさせた時の説明図、(h)はテ
ンプレート画像が検出された結果を表示する対象画像の
説明図。
形態を説明するもので、(a)は対象画像とテンプレート
画像、(b)は各閾値ごとのマッチング結果の説明図、(c)
はQT表現によるマッチング結果と相関法によるマッチン
グ結果との説明図、(d)はQT表現と相関法とを用いたマッ
チング結果の説明図、(e)は対象画像中で検出されたテ
ンプレート画像。
形態の説明図。
形態の動作を示すフローチャート。
形態を説明するもので、(a)は4分木の構造の説明図、(b)
は各階層における画素の説明図。
形態を説明するもので、(a)は各階層の画素の説明図、(b)
は各階層のQT表現の説明図、(c)は各QT表現をQT-ID番号
で示した時の説明図。
QT表現を無視する領域を設定する時の説明図。
形態を説明するもので、(a)は複数のテンプレート画像
の説明図、(b)は複数の対象画像の説明図、(c)はテンプ
レート画像ごとに分類された対象画像の説明図。
形態とは異なるQT表現の説明図。
で、(a)は対象画像の説明図、(b)は対象画像に光が差し
込んだ場合の説明図、(c)は(b)の画像に背景処理を施し
た対象画像の説明図、(d)は(b)の画像にエッジ処理を施
した対象画像の説明図、(e)は撮像カメラで撮像された実
際の対象画像、(f)は(e)からテンプレート画像を検出す
る説明図。
Claims (7)
- 【請求項1】列方向及び行方向にそれぞれ複数の画素を
配列した第1の画像中の、2個の画素間の濃淡値を比較し、
その大小関係または同値関係を3値で表した基準3値比較
画像を求める工程と、 列方向及び行方向にそれぞれ複数の画素を配列した第2
の画像中の、2個の画素間の濃淡値を比較し、その大小関
係または同値関係を3値で表した対象3値比較画像を求め
る工程と、 前記基準3値比較画像と前記対象3値比較画像との、それ
ぞれが対応する位置で、前記3値の関係が一致する個数を
求める工程と、 前記個数から前記対象3値比較画像と前記基準3値比較画
像との類似性を判定する工程とを有することを特徴とす
るパターン認識方法。 - 【請求項2】前記第1の画像中の2個の前記画素は隣接
し、また前記第2の画像中の2個の前記画素は隣接するこ
とを特徴とする請求項1に記載のパターン認識方法。 - 【請求項3】列方向及び行方向にそれぞれ複数の画素を
配列した対象画像に対し、2×2画素を1つの最小領域と
して分割し、その複数の最小領域を上位階層の1つの最
小領域として構成する複数段階の階層構造によって表現
し、 列方向及び行方向にそれぞれ複数の画素を配列した基準
画像に対し、2×2画素を1つの最小領域として分割し、
その複数の最小領域を上位階層の1つの最小領域として
構成する複数段階の階層構造によって表現し、 前記対象画像の各前記階層の前記最小領域ごとに、各最
小領域中の、2個の画素間の濃淡値を比較し、その大小関
係または同値関係を3値で表した対象3値比較画像を求
め、前記基準画像の各前記階層の前記最小領域ごとに、
各最小領域中の、2個の画素間の濃淡値を比較し、その大
小関係または同値関係を3値で表した基準3値比較画像を
求め、前記対象画像の、任意の前記階層中の少なくとも1
つの前記最小領域の前記対象3値比較画像と、この対象3
値比較画像に対応する前記基準3値比較画像との、それ
ぞれが対応する位置で、前記3値の関係が一致する個数
を求め、 前記個数から前記対象3値比較画像と前記基準3値比較画
像との類似性を判定することを特徴とするパターン認識
方法。 - 【請求項4】パターン認識を行うプログラムをコンピュ
ータ読み取り可能なように記憶させた記憶媒体であっ
て、 列方向及び行方向にそれぞれ複数の画素を配列した第1
の画像中の、2個の画素間の濃淡値を比較させ、その大小
関係または同値関係を3値で表した基準3値比較画像を求
めさせ、 列方向及び行方向にそれぞれ複数の画素を配列した第2
の画像中の、2個の画素間の濃淡値を比較させ、その大小
関係または同値関係を3値で表した対象3値比較画像を求
めさせ、 前記基準3値比較画像と前記対象3値比較画像との、それ
ぞれが対応する位置で、前記3値の関係が一致する個数を
求めさせ、 前記個数から前記対象3値比較画像と前記基準3値比較画
像との類似性を判定させるプログラムを記憶したコンピ
ュータ読み取り可能な記憶媒体。 - 【請求項5】パターン認識を行うプログラムをコンピュ
ータ読み取り可能なように記憶させた記憶媒体であっ
て、 列方向及び行方向にそれぞれ複数の画素を配列された対
象画像に対し、2×2画素を1つの最小領域として分割さ
せて、その複数の最小領域を上位階層の1つの最小領域
として構成する複数段階の階層構造によって表現させ、 列方向及び行方向にそれぞれ複数の画素を配列された基
準画像に対し、2×2画素を1つの最小領域として分割さ
せて、その複数の最小領域を上位階層の1つの最小領域
として構成する複数段階の階層構造によって表現させ、 前記対象画像の各前記階層の前記最小領域ごとに、各最
小領域中の、2個の画素間の濃淡値を比較させて、その大
小関係または同値関係を3値で表した対象3値比較画像を
求めさせ、 前記基準画像の各前記階層の前記最小領域ごとに、各最
小領域中の、2個の画素間の濃淡値を比較させて、その大
小関係または同値関係を3値で表した基準3値比較画像を
求めさせ、 前記対象画像の、任意の前記階層中の少なくとも1つの前
記最小領域の前記対象3値比較画像と、この対象3値比較
画像に対応する前記基準3値比較画像との、それぞれが
対応する位置で、前記3値の関係が一致する個数を求め
させ、 前記個数から前記対象3値比較画像と前記基準3値比較画
像との類似性を判定させるプログラムを記憶したコンピ
ュータ読み取り可能な記憶媒体。 - 【請求項6】コンピュータに、 列方向及び行方向にそれぞれ複数の画素を配列した第1
の画像中の、2個の画素間の濃淡値を比較させ、その大小
関係または同値関係を3値で表した基準3値比較画像を求
めさせる機能と、 列方向及び行方向にそれぞれ複数の画素を配列した第2
の画像中の、2個の画素間の濃淡値を比較させ、その大小
関係または同値関係を3値で表した対象3値比較画像を求
めさせる機能と、 前記基準3値比較画像と前記対象3値比較画像との、それ
ぞれが対応する位置で、前記3値の関係が一致する個数を
求めさせる機能と、 前記個数から前記対象3値比較画像と前記基準3値比較画
像との類似性を判定させる機能とを実現させるコンピュ
ータプログラム。 - 【請求項7】コンピュータに、 列方向及び行方向にそれぞれ複数の画素を配列された対
象画像に対し、2×2画素を1つの最小領域として分割さ
せて、その複数の最小領域を上位階層の1つの最小領域
として構成する複数段階の階層構造によって表現させる
機能と、 列方向及び行方向にそれぞれ複数の画素を配列された基
準画像に対し、2×2画素を1つの最小領域として分割さ
せて、その複数の最小領域を上位階層の1つの最小領域
として構成する複数段階の階層構造によって表現させる
機能と、 前記対象画像の各前記階層の前記最小領域ごとに、各最
小領域中の、2個の画素間の濃淡値を比較させて、その大
小関係または同値関係を3値で表した対象3値比較画像を
求めさせる機能と、 前記基準画像の各前記階層の前記最小領域ごとに、各最
小領域中の、2個の画素間の濃淡値を比較させて、その大
小関係または同値関係を3値で表した基準3値比較画像を
求めさせる機能と、 前記対象画像の、任意の前記階層中の少なくとも1つの前
記最小領域の前記対象3値比較画像と、この対象3値比較
画像に対応する前記基準3値比較画像との、それぞれが
対応する位置で、前記3値の関係が一致する個数を求め
させる機能と、 前記個数から前記対象3値比較画像と前記基準3値比較画
像との類似性を判定させる機能とを実現させるコンピュ
ータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000378612A JP3819236B2 (ja) | 2000-12-13 | 2000-12-13 | パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000378612A JP3819236B2 (ja) | 2000-12-13 | 2000-12-13 | パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002183732A true JP2002183732A (ja) | 2002-06-28 |
JP3819236B2 JP3819236B2 (ja) | 2006-09-06 |
Family
ID=18847148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000378612A Expired - Fee Related JP3819236B2 (ja) | 2000-12-13 | 2000-12-13 | パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3819236B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293632A (ja) * | 2005-04-08 | 2006-10-26 | Toshiba Corp | 半導体集積回路装置、画像処理システム、及び画像処理方法 |
US7200270B2 (en) | 2001-12-13 | 2007-04-03 | Kabushiki Kaisha Toshiba | Pattern recognition apparatus and method using distributed model representation of partial images |
JP2007179307A (ja) * | 2005-12-28 | 2007-07-12 | Hitachi Computer Peripherals Co Ltd | 帳票識別装置 |
JP2007287006A (ja) * | 2006-04-19 | 2007-11-01 | Fujitsu Ltd | 移動物体追跡装置及びプログラム |
JP2011215716A (ja) * | 2010-03-31 | 2011-10-27 | Toyota Motor Corp | 位置推定装置、位置推定方法及びプログラム |
JP2012099157A (ja) * | 2009-03-13 | 2012-05-24 | Nec Corp | 画像識別子抽出装置 |
JP2013519409A (ja) * | 2010-02-10 | 2013-05-30 | アイモーフィクス リミテッド | 画像解析 |
US8749658B2 (en) | 2009-04-06 | 2014-06-10 | Nec Corporation | Data processing device, image matching method, program, and image matching system |
US9530077B2 (en) | 2010-02-10 | 2016-12-27 | Imorphics Limited | Image analysis |
CN113643467A (zh) * | 2021-06-29 | 2021-11-12 | 南京信息工程大学 | 基于单片机的集成式红外成像闸门系统、终端和检测方法 |
-
2000
- 2000-12-13 JP JP2000378612A patent/JP3819236B2/ja not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7200270B2 (en) | 2001-12-13 | 2007-04-03 | Kabushiki Kaisha Toshiba | Pattern recognition apparatus and method using distributed model representation of partial images |
JP2006293632A (ja) * | 2005-04-08 | 2006-10-26 | Toshiba Corp | 半導体集積回路装置、画像処理システム、及び画像処理方法 |
JP2007179307A (ja) * | 2005-12-28 | 2007-07-12 | Hitachi Computer Peripherals Co Ltd | 帳票識別装置 |
JP2007287006A (ja) * | 2006-04-19 | 2007-11-01 | Fujitsu Ltd | 移動物体追跡装置及びプログラム |
JP2012099156A (ja) * | 2009-03-13 | 2012-05-24 | Nec Corp | 画像識別子抽出装置 |
JP2012099157A (ja) * | 2009-03-13 | 2012-05-24 | Nec Corp | 画像識別子抽出装置 |
US8744193B2 (en) | 2009-03-13 | 2014-06-03 | Nec Corporation | Image signature extraction device |
US8749658B2 (en) | 2009-04-06 | 2014-06-10 | Nec Corporation | Data processing device, image matching method, program, and image matching system |
JP2013519409A (ja) * | 2010-02-10 | 2013-05-30 | アイモーフィクス リミテッド | 画像解析 |
US9530077B2 (en) | 2010-02-10 | 2016-12-27 | Imorphics Limited | Image analysis |
US10198662B2 (en) | 2010-02-10 | 2019-02-05 | Mako Surgical Corp. | Image analysis |
JP2011215716A (ja) * | 2010-03-31 | 2011-10-27 | Toyota Motor Corp | 位置推定装置、位置推定方法及びプログラム |
CN113643467A (zh) * | 2021-06-29 | 2021-11-12 | 南京信息工程大学 | 基于单片机的集成式红外成像闸门系统、终端和检测方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3819236B2 (ja) | 2006-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
Zhu et al. | Robust point cloud classification based on multi-level semantic relationships for urban scenes | |
CN107316031B (zh) | 用于行人重识别的图像特征提取方法 | |
US6691126B1 (en) | Method and apparatus for locating multi-region objects in an image or video database | |
Darwish et al. | Image segmentation for the purpose of object-based classification | |
Lee et al. | Fusion of lidar and imagery for reliable building extraction | |
Xu et al. | Hierarchical segmentation using tree-based shape spaces | |
US20100329556A1 (en) | Image conversion method and apparatus, and pattern identification method and apparatus | |
Varnousfaderani et al. | Weighted color and texture sample selection for image matting | |
CN111738055B (zh) | 多类别文本检测系统和基于该系统的票据表单检测方法 | |
Kumar et al. | Road network extraction from high resolution multispectral satellite imagery based on object oriented techniques | |
JP2002183732A (ja) | パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体 | |
Karaoglu et al. | A novel algorithm for text detection and localization in natural scene images | |
CN108694411B (zh) | 一种识别相似图像的方法 | |
Ivanovici et al. | Color image segmentation | |
Han et al. | A shape-based image retrieval method using salient edges | |
Mehri et al. | A pixel labeling approach for historical digitized books | |
Doggaz et al. | Image segmentation using normalized cuts and efficient graph-based segmentation | |
CN113326790A (zh) | 基于异常检测思维的胶囊机器人排水管病害检测方法 | |
Jenicka et al. | Fuzzy texture model and support vector machine hybridization for land cover classification of remotely sensed images | |
Wang | Understanding high resolution aerial imagery using computer vision techniques | |
CN113077410A (zh) | 图像检测方法、装置方法、芯片及计算机可读存储介质 | |
Huang et al. | Reversed sketch: A scalable and comparable shape representation | |
Ji et al. | Saliency detection using Multi-layer graph ranking and combined neural networks | |
Vijayashanthi et al. | MAGNITUDE-BASED TWIN TEXTON CO-OCCURRENCE MATRIX FOR IMAGE RETRIEVAL |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050621 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050819 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060613 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060614 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3819236 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090623 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100623 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100623 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110623 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120623 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120623 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130623 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |