JP3724014B2 - 画像認識装置および画像認識方法 - Google Patents

画像認識装置および画像認識方法 Download PDF

Info

Publication number
JP3724014B2
JP3724014B2 JP21185395A JP21185395A JP3724014B2 JP 3724014 B2 JP3724014 B2 JP 3724014B2 JP 21185395 A JP21185395 A JP 21185395A JP 21185395 A JP21185395 A JP 21185395A JP 3724014 B2 JP3724014 B2 JP 3724014B2
Authority
JP
Japan
Prior art keywords
pattern
correlation
eigenvector
standard pattern
norm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21185395A
Other languages
English (en)
Other versions
JPH08212353A (ja
Inventor
真一 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPH08212353A publication Critical patent/JPH08212353A/ja
Application granted granted Critical
Publication of JP3724014B2 publication Critical patent/JP3724014B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Supply And Installment Of Electrical Components (AREA)
  • Character Discrimination (AREA)

Description

【0001】
本発明は、撮像された画像の中に存在する物体の位置と方向を高速で求める画像認識装置および画像認識方法に係るものである。
【0002】
【従来の技術】
部品を組立てる分野においては自動化が進み、組立てる部品等については、人間の目によることなく画像認識処理によってその位置や傾きを確認し、その把握された情報に基いてロボットにより組立て加工が行われている。したがって、画像認識技術には、一層の高速化、高精度化が要望されている。
【0003】
1.従来の画像認識装置の構成
まず、一般に用いられる相関技術に基く画像認識装置について、その概略を図1により説明する。
図1において、画像入力部1は、認識したい画像をカメラ等によって撮像し、その画像入力信号をA/D変換することにより、後段でのデジタル処理ができるように構成されている。
【0004】
画像切出し部2は、先に入力した画像信号から所定の位置に対応する信号を抽出する(切出す)ように構成されている。該切出し部2より切出される情報量は、認識したい標準パターンを表現したベクトル要素数と同一になるようされている。
【0005】
標準パターンメモリ3,3,‥‥は、認識したいパターンであるパターン0〜パターン+2を標準パターンとして記憶するメモリであり、各メモリは夫々、例えば、部品の向きが基準方向である基準の標準パターン0、この基準の標準パターンを正の方向に若干角度回転した標準パターン+1、標準パターン+1を更に正の方向に若干角度回転した標準パターン+2、また基準の標準パターン0を負の方向に若干角度回転した標準パターン−1、標準パターン−1を更に負の方向に若干角度回転した標準パターン−2を記憶している。このように基準となる基準パターン0に対し、夫々正負の方向に回転した標準パターンを含めているのは、撮像された画像が必ずしも同一方向に向いてはいないからである。なお、標準パターンは、その形状の水平方向画素数と垂直方向画素数との乗算で得られる数、即ち標準パターンを構成する全画素数Nの数列で表現されるので、N次元のベクトル値として扱われる。
【0006】
パターン選択部4は、標準パターンメモリ3,3,‥‥に記憶されたパターン0〜パターン+2のうち、いずれか1個のパターンを指定選択できるように構成されている。個々の標準パターンはN次元のベクトルで表現されているので、パターン選択部4の出力もN次元のベクトルで表現される。
【0007】
相関演算部5は、2つの同次元ベクトルについて正規相互相関演算を行う演算部であって、一方の入力に画像切出し部2の出力であるN次元ベクトル情報を、他方の入力にパターン選択部4の出力であるN次元ベクトル情報を受けるように構成されている。
【0008】
2.相関演算の具体的方法
次に相関演算につき、図2を用いてその概略を説明する。
▲1▼ 図2では、分かり易いように標準パターン12をN=5×5=25の画素x1 ,x2 ,‥‥,x25(xj )より成るものとしてある。使用する標準パターンの種類をiとし、標準パターンiに対する標準パターン及びその各画素を夫々xi 及びxijで表す。
【0009】
これに対し、入力画像14はその撮像された領域は広いものであるが、そのうちの一部の領域13を取出し、これを構成する画素を標準パターン12の場合と同様にy1 ,y2 ,‥‥,y25(yj )とする。そして、任意の切出し領域13の数式上の表記をyとする。
▲2▼ さて、xi とyが決まると、次の一般式
【数1】
Figure 0003724014
による演算を行う。この式(1)が正規相互相関の定義式である。
【0010】
しかし、式(1)をそのまま装置に構成すると、多くの項を逐次計算しなければならず高速化を望めない。そこで一般には、この式中に含まれる項ができるだけ少なくなるよう前処理を加える。
【0011】
▲3▼ 具体的にいえば、切出し領域13の全画素情報の平均値を計算し、平均値をオフセット(偏差)量としてこれを各画素から減算する正規化演算を行う(65)。即ち、
【数2】
Figure 0003724014
の計算により切出した領域の画素に係るオフセット値aを得、それから各切出し画素(要素)毎に
【数3】
Figure 0003724014
を計算する。このようにして得られた切出し画素情報を、以下ベクトル表記して
【数4】
Figure 0003724014
とし、これを正規化された切出し領域という。ここまでで、入力画像に対する準備が終了する。
▲4▼ 一方、各標準パターンiについても、濃淡値の平均が0となるように全ベクトル要素からオフセット値を減算する(64)。即ち、
【数5】
Figure 0003724014
により各標準パターンi毎のオフセット値ai を計算し、それから各標準パターンiの要素毎に
【数6】
Figure 0003724014
を計算する。このようにして得られた要素をベクトル表記し、
【数7】
Figure 0003724014
とする。以下、これを正規化された標準パターンという。
【0012】
▲5▼ 上記準備によって、
【数8】
Figure 0003724014
【数9】
Figure 0003724014
となるため、(1)式は、
【数10】
Figure 0003724014
と書換えられ、簡単になる。なお、分母の第1項は、標準パターンについてのみの計算式であるので、予め計算することができる性質のものである。したがって、パターン突合せ(マッチング)処理をするに当たり、実時間で計算しなければならないのは、分子項と分母第2項のみとなる。
【0013】
▲6▼ 次に、(10)式の分子をみると、これは標準パターンiに係るベクトルと入力画像に係るベクトルとの内積を表し、分母は、標準パターンiのノルム(norm)及び切出し領域のノルムを表している。よって、(10)式は、
【数11】
Figure 0003724014
と書くことができる。
なお、(10)式の分子には係数Nが乗じられているが、Nは定数であるから計算を単純にするためこれを無視した。
【0014】
(11)式から分かるように、入力画像に対して行う標準パターンiとの正規相互相関演算は、入力画像の正規化された切出し領域を表現したベクトルの長さと、正規化された標準パターンベクトルとの内積をとることで実現される。
【0015】
▲7▼ 以上の前処理により、相関演算は(11)式に従って行いうることが分かる(66)。
この演算は、先に取出した一部の領域13を入力画像中で順次移動させ、画像全体に対して行う。相互相関では、2つのパターンが全く一致した時に最も高い数値となることが知られている。この性質により、画像全体に対して行われた演算結果のうち最も高い数値を示した座標が、標準パターンと同一(もしくは最も類似)の物品が撮像されている位置である、ということになる。
【0016】
3.相関演算により物品を認識する手順
次に、図1に示した構成において、上記相互相関演算を行う手順を説明する。
画像入力部1で撮像された、認識したい物品を含む画像情報は、画像切出し部2によって切出され、一定範囲内の情報が抽出される。このときの切出し領域の形状は、標準パターンメモリ3,3,‥‥に記憶されている標準パターンの外郭の形状と同一である。即ち、切出し領域及び標準パターンを構成する縦方向の画素数と横方向の画素数とは、夫々一致している。したがって、画像切出しされる情報も、N次元のベクトル情報として取扱われる。
【0017】
一方、パターン選択部4で選択する標準パターンは、まずパターン0とする。そうすると、撮像した画像から切出した位置と標準パターンが決まるので、これら2つのN次元ベクトル情報を対象として正規相互相関演算を行い、この切出し領域の相関値を算出する。
【0018】
次に、パターン選択部4で選択する標準パターンを、次のパターンであるパターン−1とすると共に、先にパターン0を対象として正規相互相関演算を行った切出し領域と同一の切出し領域に対して相関値を算出する。以下同様に、残りの標準パターンすべてについてこの相関演算を繰返す。結局、上記の構成による場合、同一の切出し領域に対して5つの相関演算を行うことになる。
【0019】
次に、切出し領域を入力画像中で順次1画素ステップでシフトする「走査処理」をしてゆき、上述のようなパターン突合せ処理を全入力画像に対して行う。こうした処理の結果、各標準パターンiに対して最も高い数値を得られた切出し位置が、その標準パターンに係る物品が存在した位置ということになる。
【0020】
【発明が解決しようとする課題】
ここで、上述の相関演算によるパターン突合せ処理をする場合、1つの切出し領域において最も演算時間を要する乗算処理の回数を数えると、
【数12】
Figure 0003724014
ではN回、
【数13】
Figure 0003724014
では(N+1)回である。その他にも乗算があるが、Nが大きい場合にはほぼ無視できるので、約2N回の乗算が行われるといえる。結局、1標準パターン当たり2N回の演算が必要になる。いま認識したいパターンの数をPとすると、夫々の標準パターンについて上記演算が行われるので、1つの切出し位置につき2NP回の乗算処理をすることになる。
【0021】
本画像認識装置を部品組立て処理などに利用するためには、標準パターンとして縦100画素、横100画素程度のものが必要である。したがって、この場合には、認識すべき標準パターンを1つ増す毎に20000回の乗算処理が増えることになる。これでは、抽出すべき物品数や傾きの許容度を拡大したとき、満足できる速度で処理することができなくなる。
【0022】
また、上述のような簡単なパターン突合せでは、標準パターン中の全画素について、該パターン中に重要な特徴があるかどうかに拘らず平等に取扱っている。したがって、先の例の如く、撮像された部品が必ずしも一方向に向いていないために標準パターンとして基準となる標準パターンの外に夫々回転した標準パターンを含めなければならない場合において、現実に撮像された物品の回転角が用意された標準パターンのうちの1つと同一でないときには、その相関値の低下が顕著となり抽出に失敗することがある、という問題点があった。
よって、かかる問題点を解決することが本発明の課題である。
【0023】
【課題を解決するための手段】
本発明の骨子は、K−L展開法(Karhunen-Loeve Expansion)を画像処理に用いることにより、特徴を捉えた表現で標準パターンを登録し、現実に撮像された物品の回転角が用意された標準パターンのうちの1つと同一でないときでも、相関値の低下が顕著とならず認識率の向上を期待できるようにした点にある。
【0024】
本発明では更に、K−L展開法で表現された標準パターンのうち、複数の標準パターンにおいて同一の演算をする共通部分を抽出し、かかる演算を1つの切出し領域の演算において共通に利用することにより、従来技術に対して認識率低下を招くことなく飛躍的な高速化を計っている。
【0025】
まず、本発明に用いるK−L展開について説明する。K−L展開については他の文献に詳しく説明されているが、ここでは演算手順についても簡単に述べることにする。
(a) K−L展開による標準パターン表現の性質
K−L展開とは、複数の標準パターンにおいて、各標準パターンに共通の性質がある要素と、各標準パターンに特有の性質がある要素とを分離し、これらの要素を線型結合の形式で表記すると共に、標準パターン毎に対応する係数の組を後者要素に組合せ、前記要素のみから各標準パターンを表現するものである。ここで、標準パターンに特有の性質を表す要素は、各標準パターンについて直交独立のベクトルとなっているという特徴がある。
【0026】
本展開によれば、共通の性質を表す要素が標準パターン群のおよその性質を代表しているために、パターン認識によって類似形態のものを抽出し易くすると共に、標準パターン毎の分離は直交独立のベクトルとのベクトル演算によって行われるので、いわゆる弛緩法(Relaxation Method )を1つの演算中で実現しているのと類似の効果が期待できる。
【0027】
(b) K−L展開による標準パターン表現の具体的演算方法
本発明では、K−L展開を標準パターンに対してのみ適用する。具体的には、以下のような演算を行う。
【0028】
▲1▼ まず、従来の技術においても行っているように、各標準パターンiについて全画素の濃淡値平均が0となるようにオフセット値を減算する。即ち、前記の(5)式
【数14】
Figure 0003724014
により各標準パターンi毎のオフセット値ai を計算し、それから各標準パターンiの要素毎に前記の(6)式
【数15】
Figure 0003724014
を計算する。こうして得られた要素をベクトル表記し、前記の(7)式
【数16】
Figure 0003724014
とする。以下、これを正規化された標準パターンという。
【0029】
▲2▼ 次に、P個ある標準パターンの対応するベクトル要素毎の平均を取る。即ち、
【数17】
Figure 0003724014
を計算する。こうして得られた要素をベクトル表記し、
【数18】
Figure 0003724014
とする。
【0030】
▲3▼ 次に、▲1▼及び▲2▼で得られたベクトルに基いて共分散行列Aを定義する。
【数19】
Figure 0003724014
【0031】
▲4▼ 次に、▲3▼で得られた共分散行列の固有値問題、即ち、
Aej =Aλj ‥‥(20)
を解くことによって固有ベクトルej と固有値λj (j=1,2,‥‥,P−1前記のjとは異なる点に注意)を求める。ただし、固有ベクトルej と固有値λj のj=1,‥‥,P−1への割当ては、
λ1 >λ2 >‥‥>λP-1 ‥‥(21)
となるようにする。
【0032】
ここで、固有値の数がたかだかP−1個しかないのは、共分散行列において共通項であるcを各標準パターンについて演算しているので、独立度が1つ減少するためである。
【0033】
以上のようにして得られた固有値λj は、これに対する固有ベクトルej がどの程度各標準パターンに固有の特徴を有しているかの度合いを示す指標となっており、このため、固有値が大きい程、これに対応する固有ベクトルが各標準パターンを分離するのに重要な意義を有しているといえる。
なお、固有ベクトルej は、夫々N次元の直交基底となっている。
【0034】
▲5▼ 次に、上述の処理で得られた固有ベクトルej を用いて正規化された標準パターンを書換える。
【数20】
Figure 0003724014
ここで、pij
【数21】
Figure 0003724014
によって決定される。
このように、元の標準パターンは式(22)及び(23)のような表記に展開され、これをK−L展開表現という。
【0035】
▲6▼ 各固有ベクトルに対応する固有値は各標準パターンの特徴を表現することに寄与しているとはいえ、固有値が小さい固有ベクトルは、画像識別において余り意味がない。
したがって、K−L展開によれば、(22)式のように全固有ベクトルについて1次結合していなくても、多少の誤差を許容すれば、1次結合する項数を制限することが可能である。
【0036】
例えば、この結合項数をKとして
【数22】
Figure 0003724014
と近似表現してもよいことになる。ここに、pijは(23)式で与えられるものと同じである。
【0037】
なお、K−L展開された標準パターン情報(24)式は、数多くの計算を必要とするが、これらの計算は入力する画像とは無関係である。よって、認識したい標準パターンが予め決まっている限り、事前に計算してその計算結果を記憶しておき、必要に応じてこれを読出せばよい。
また、Kは、固有値及び許容できる認識率を確認しながら決定すればよい。
【0038】
▲7▼ しかし、上記(24)式は標準パターンを単にK−L展開しただけであり、この結果を(11)式に適用したとしても、認識率の差こそあれ、従来と同じ数の演算をしなければならず、演算の高速化は望めない。
【0039】
即ち、1つの切出し位置における1つの標準パターンに関する乗算数は、相関値分子項で約N回、相関値分母項中の
Figure 0003724014
演算で約N回になる。そして、P個の標準パターンがある場合
Figure 0003724014
演算の結果は共通に使えるので、分母項で約PN回の演算が増えることになり、その結果全体として約(P+1)N回の演算が行われることが分かる。
【0040】
▲8▼ そこで、本発明者は、標準パターン毎に計算しなければならない項を減らすと共に、各標準パターンで共通に演算できる項が多くなるように、(11)式を変形し、この変形した式に基いて装置を構成することとした。即ち、(11)式はその分子が線型結合されているので、これに分配法則を適用して
【数23】
Figure 0003724014
とする。
【0041】
なお、
Figure 0003724014
のノルムの項は、(24)式によって得られる近似した
Figure 0003724014
に基く。また、分子第1項と、分子第2項内の
Figure 0003724014
項とは、1つの画像切出しが行われる毎に1回だけ演算すればよいものである。したがって、標準パターンを1つ増しても、それによって単にスカラー演算が1回増すに留まることが示唆されている。
【0042】
【発明の実施の形態】
K−L展開を用いた本発明の実施例を図3を用いて説明する。
画像入力部31は、認識したい画像をカメラ等により撮像し、その入力をA/D変換して、後段でデジタル処理ができるようにする。画像切出し部32は、入力した画像から所定の位置(領域)を切出す(抽出する)ように構成する。該切出し部32より切出される情報量は、認識したい標準パターンを表現したベクトル要素の数と同一とする。
【0043】
濃度正規化部33は、切出した領域の画素の全情報の平均値を計算し、その平均値をオフセット量として各画素から減算する演算を行う。具体的には、前記の(2)式
【数24】
Figure 0003724014
の計算により、切出した領域に係るオフセット値aを得、それから各切出し要素毎に前記の(3)式
【数25】
Figure 0003724014
を計算する。こうして得られた切出し画素情報をベクトル表記して、
【数26】
Figure 0003724014
とする(前記(4)式参照)。この要素情報は、全標準パターンについて共通に利用されるので、1つの切出し毎に保持しておく。
【0044】
固有ベクトル情報メモリ36,36‥‥は、各標準パターンについて予め演算されたK−L展開で得られた固有ベクトル情報を記憶するメモリである。具体的には、(20)式から得られるej (j=1,2,‥‥,K)がこれらのメモリに記憶されている。
【0045】
固有ベクトル重み情報メモリ39,39,‥‥は、上記固有ベクトル情報に対応して各標準パターン毎に決定されるpijを記憶するメモリである。具体的には、前記の(23)式
【数27】
Figure 0003724014
によって決定されたpij(i=1,2,‥‥,P)(j=1,2,‥‥,K)が記憶されている。ここに、pijはスカラー量である。そして、後述する制御用CPU62によりiが指定されたときに、上記メモリ39,39,‥‥は、その指定された標準パターンに対応するpijを出力する。
【0046】
固有ベクトル相関要素計算部37は、上記固有ベクトル情報ej (j=1,2,‥‥K)と濃度正規化された入力画像情報との内積演算を行い、
Figure 0003724014
を算出する。この結果はスカラー値であるが(以下、便宜上vj とする。)、固有ベクトル情報ej (j=1,2,‥‥,K)毎に計算されるものであるから、K種類の数値群が得られることになる。
【0047】
パターン依存相関要素計算部38は、先に得られたvj と固有ベクトル重み情報pijとの乗算を行う。ここで、vj 及びpijは夫々スカラー量であるので、1つの標準パターン毎にK回の乗算が行われる。
【0048】
Σ計算部40は、スカラー加算を行う加算部であって、パターン依存相関要素計算部38で計算されたvj ・pijについてj=1,2,‥‥,Kまで各スカラー値毎に加算する。これによって、
【数28】
Figure 0003724014
を得たことになる。
【0049】
共通パターン情報メモリ34は、標準パターンの共通するパターン情報である前記(18)式によるN次元ベクトル
【数29】
Figure 0003724014
を記憶する部分である。
【0050】
共通パターン相関要素計算部35は、入力画像から抽出した1つの切出し領域に対する、全標準パターンの共通するパターン情報である(18)式のベクトルとの内積演算を行う部分である。この演算により、前記(25)式の分子第1項である
Figure 0003724014
が算出されることになる。
【0051】
加算部44は、Σ計算部40と共通パターン相関要素計算部35の出力をスカラー加算する部分である。この出力は、正規相関値に対応した(25)式の相関値Ci の分子項の値に相当する。
【0052】
Figure 0003724014
計算部41は濃度正規化部33より得られた切出し入力画像ベクトルのノルムを算出する部分であって、1つの切出しに対してN回の掛け算(自乗算)が行われる。したがって、その出力値はスカラー量である。
【0053】
Figure 0003724014
メモリ42は、標準パターンを表現したベクトルのノルムを各標準パターンの種類i毎に記憶しているメモリであり、iが後述する制御用CPU62により指定されたときに、その指定された標準パターンに対応する
Figure 0003724014
のノルムを出力する。その出力値は、スカラー量である。
【0054】
乗算部43は、上記
Figure 0003724014
計算部41の出力値及び
Figure 0003724014
メモリ42の出力値の乗算を行う部分である。この値は、正規相関値に対応した相関値Ci ((25)式)の分母項に相当する。
【0055】
除算部45は、加算部44の出力を乗算部43の出力で除算する部分である。この演算は、1つの切出し領域に対する1つの標準パターン間の演算でただ1回行われ、その出力は正規相関値に対応した相関値Ci ((25)式)に相当する。
【0056】
相関結果バンク63,63,‥‥は、標準パターンの種類i(P個)毎に独立したメモリバンクであって、1つのバンク63の中に入力画像の画素数とほぼ同数の数値を記憶することができ、これらのバンクは、除算部45の出力を、その演算が行われた標準パターン及び切出した領域に対応する番地に格納するようになっている。
【0057】
制御用CPU62は、画像入力の切出し、標準パターンiの指定、相関結果バンクのバンク選択をすると共に、相関結果バンク63内に記憶された情報の読出しを行う。
【0058】
次に、上述した装置の動作を説明する。
画像入力部31から入力された画像はA/D変換され、画像切出し部32の作用により、制御用CPU62から指定された位置(領域)が切出される。切出された画像情報は、濃度正規化部33により平均値が0となるように正規化される。
【0059】
制御用CPU62は標準パターンの種類iを指定し、これによって指定を受けた固有ベクトル重み情報メモリ39は、固有ベクトル重み情報pijを出力する。
【0060】
次いで、濃度正規化部33の出力と共通パターン情報メモリ34に記憶された共通パターン情報
Figure 0003724014
との内積が、共通パターン相関要素計算部35で演算される。この演算によって前記(25)式の分子第1項である
Figure 0003724014
が算出されることになるが、これは、1つの切出し領域についてただ1回行われればよく、したがって1つの切出し領域毎にN回の乗算が行われる。
【0061】
他方、濃度正規化部33の出力は、固有ベクトル相関要素計算部37において
Figure 0003724014
の算出に使用される。その演算は、1つの切出し領域に対する1つの固有ベクトル情報毎にN回行われるので、1つの切出し領域毎に全種類の固有ベクトルについて演算すると、NK回演算が行われることになる。ただし、この演算は、パターン突合せをする標準パターンの種類に拘らずただ1回行えばよいものである。
【0062】
次に、パターン依存相関要素計算部38を通してΣ計算が行われ、前記(25)式の分子第2項が計算される。ここで、パターン依存相関要素計算部38は、制御用CPU62により指定された標準パターンを処理する毎に計算を行う。したがって、1つの切出し領域に対する全標準パターンの突合せ計算のためにKP回の演算が行われることになる。
【0063】
一方
Figure 0003724014
計算部41は、正規化された切出し領域情報のノルム
Figure 0003724014
を計算する。この結果と、制御用CPU62から指定された標準パターンの種類iに対応して
Figure 0003724014
メモリ42から引出された
Figure 0003724014
値とが乗算され(43)、相関値Ci の分母項の演算が行われる。
【0064】
次に、これら分子及び分母の値が除算され(45)、この結果は、指定された標準パターンの種類i及び制御用CPU62から指定を受けた切出し位置に対応する相関結果バンク63の番地に記憶される。
【0065】
次に、制御用CPU62によって相関結果バンク63内が走査され、標準パターン毎にピーク値が検出される。この結果、最も高いピーク値があった番地に対応する切出し位置に、当該標準パターンに登録された物品が検出されたことになる。
【0066】
上述の実施例においては、全標準パターンと1つの切出し位置との間で行われる乗算回数は、共通パターン相関要素計算部35でN回、固有ベクトル相関要素計算部37でNK回、パターン依存相関要素計算部38でPK回、そして
Figure 0003724014
計算部41でN回となり、全体で約N(K+2)+PK回の演算が行われることが分かる。
【0067】
実験により、一般の部品を認識するには、標準パターンとして同一の物品を約4度ずつ回転させたものを用意すれば、満足できる結果が得られることが分かっている。この条件の下では、P=90,K=10,N=10000となる。
【0068】
この条件では、従来の例によれば、全乗算回数が約(P+1)N回であるから約90万回の演算が行われることになる。これに対し上述の実施例によれば、全乗算回数は、約N(K+2)+PK回であることから約10万回となり、ほぼ1/9に減少する。これより、本発明によれば、飛躍的な高速化を期待できることが理解できる。
【0069】
以上の実施例の説明では、標準パターンとして1つの物品を登録した場合を示したが、図4に示すような物品の一部50を登録しても差支えない。図5に示す如く1つの物品51を撮像し、これに図4の標準パターンを突合せた場合、制御用CPU62は、切出し位置53を順次走査する指示を出すことになるが、相関値を手掛かりとしてコーナー部分52でピーク値が検出されるので、その位置検出は可能である。
【0070】
図6は、本発明装置を利用した組立てシステムの例を示す概略図である。例示したシステムは、プリント基板上に部品をマウントする装置である。
プリント基板71は、部品を搭載するためのワーク(加工品)であって、ベルトコンベア72上を搬送される。ベルトコンベア72は、プリント基板71を運ぶための搬送装置であって、部品をマウントする位置で基板71を停止、固定できるように出来ている。
【0071】
マウント治具73は、ロボット等の移送装置の作用端にチャックを具備したもので、部品の移送、供給をするものである。
CCDカメラ74は、撮像装置であって図3の画像入力部31へ信号を供給する情報源となる。この例では、これにより、プリント基板71上の部品をマウントすべき位置を検出するための画像信号を入力する。
【0072】
部品トレイ75は、プリント基板71上にマウントする部品を載置するもので、マウント治具73により部品を取出せる位置に配置される。
マウント治具コントローラ77は、マウント治具の制御及び本発明の画像認識装置の認識開始を制御する制御部であって、ロボット・チャック等を全体的に制御する。
【0073】
画像認識装置76は、本発明に係る認識部であって、CCDカメラ74により撮像したプリント基板71の画像情報から部品供給部分の位置と向きを決定し、マウント治具コントローラ77にその情報を伝達する。
モニタ78は、画像認識装置76の制御用CPU62の状態や撮像結果などを表示するための表示装置である。
【0074】
次に、本システムの動作について説明する。
プリント基板がベルトコンベアによって搬送され、所定のマウント位置に到着すると、CCDカメラによって撮像され、そのプリント基板の画像情報から部品供給部分の位置と向きが決定される。この結果をマウント治具コントローラ77に伝達すると、マウント治具コントローラはマウント治具を制御して所定の部品トレイから必要な部品を取出し、先に決定された部品供給位置にこれを移送、供給し、組立て作業が実行される。
【0075】
必要があれば、標準パターンを入れ換え、即ち、図3の共通パターン情報(34)、固有ベクトル情報(36)、固有ベクトル重み情報(39)、パターン距離情報(42)を入れ換えることにより、他の部品についての処理をすることも可能である。
【0076】
【発明の効果】
以上説明したとおり、本発明によれば、現実に撮像された物品の回転角が用意された標準パターンの1つと同一でないときでも、相関値の低下が顕著とならず、認識率が向上する。
また、複数の標準パターンにおいて同一の演算をする共通部分を抽出し、かかる演算を1つの切出し領域の演算において共通に利用するので、認識率低下を招くことなく飛躍的な高速化が可能である。
【図面の簡単な説明】
【図1】相関演算に基く従来装置の例を示す概略図である。
【図2】相関演算の従来例を示す説明図である。
【図3】本発明の実施例を示すブロック図である。
【図4】本発明に適用可能な標準パターンの例を示す図である。
【図5】図4の標準パターンを用いる場合の入力画像の例を示す図である。
【図6】本発明装置を利用した組立てシステムの例を示す概略図である。
【符号の説明】
31 画像入力部
32 画像切出し部
33 濃度正規化部
34 共通パターン情報記憶部(メモリ)
35 共通パターン相関要素計算部
36 固有ベクトル情報記憶部(メモリ)
37 固有ベクトル相関要素計算部
38,40 パターン依存相関要素計算部
39 固有ベクトル重み情報記憶部(メモリ)
44 相関分子値加算部
41 切出し領域ノルム計算部
42 標準パターンノルム記憶部(メモリ)
43 相関分母値乗算部
45 除算部

Claims (2)

  1. 平面画像から複数の標準パターンを検出する画像認識装置であって、
    上記標準パターンについてK−L展開された共通項cを記憶する共通パターン情報記憶部と、
    上記標準パターンについてK−L展開され、予め決められた数の独立の固有ベクトルを記憶する固有ベクトル情報記憶部と、
    上記各標準パターン毎に、上記固有ベクトルに対応する係数を記憶する固有ベクトル重み情報記憶部と、
    処理されるべき画像の一部領域を切出す画像切出し部と、
    上記画像切出し部によって切出された領域の画素情報の平均濃度を各画素情報から減算する濃度正規化部と、
    上記濃度正規化部より得られる正規化された切出し領域の情報と、上記共通パターン情報記憶部に記憶された共通パターン情報との内積を演算する共通パターン相関要素計算部と、
    上記濃度正規化部より得られる正規化された切出し領域の情報と、上記固有ベクトル情報記憶部に記憶された固有ベクトル情報との内積を演算する固有ベクトル相関要素計算部と、
    上記固有ベクトル相関要素計算部より得られる固有ベクトル相関要素と、上記固有ベクトル重み情報記憶部に記憶された係数とを乗算して加算するパターン依存相関要素計算部と、
    上記共通パターン相関要素計算部により得られる共通パターン相関要素と、上記パターン依存相関要素計算部により得られるパターン依存相関要素とを加算する相関分子値加算部と、
    上記正規化された切出し領域の情報のノルムを計算する切出し領域ノルム計算部と、
    正規化された標準パターンのノルムを記憶する標準パターンノルム記憶部と、
    上記切出し領域ノルム計算部より得られる切出し領域のノルムと、上記標準パターンノルム記憶部より得られる標準パターンのノルムとを乗算する相関分母値乗算部と、
    上記相関分子値加算部より得られる相関分子値を上記相関分母値乗算部より得られる相関分母値で除算する除算部と
    を具えた画像認識装置。
  2. 平面画像から複数の標準パターンを検出する画像認識方法であって、
    上記標準パターンについてK−L展開された共通項cを記憶する共通パターン情報記憶ステップと、
    上記標準パターンについてK−L展開され、予め決められた数の独立の固有ベクトルを記憶する固有ベクトル情報記憶ステップと、
    上記各標準パターン毎に、上記固有ベクトルに対応する係数を記憶する固有ベクトル重み情報記憶ステップと、
    上記標準パターンを正規化するとともに、正規化された標準パターンのノルムを記憶する標準パターンノルム記憶ステップと、
    処理されるべき画像の一部領域を切出す画像切出しステップと、
    上記画像切出しステップによって切出された領域の画素情報の平均濃度を各画素情報から減算する濃度正規化ステップと、
    上記濃度正規化ステップより得られる正規化された切出し領域の情報と、上記共通パターン情報記憶ステップにおいて記憶された共通パターン情報との内積を演算する共通パターン相関要素計算ステップと、
    上記濃度正規化ステップより得られる正規化された切出し領域の情報と、上記固有ベクトル情報記憶ステップにより記憶された固有ベクトル情報との内積を演算する固有ベクトル相関要素計算ステップと、
    上記固有ベクトル相関要素計算ステップより得られる固有ベクトル相関要素と、上記固有ベクトル重み情報記憶ステップにより記憶された係数とを乗算して加算するパターン依存相関要素計算ステップと、
    上記共通パターン相関要素計算ステップにより得られる共通パターン相関要素と、上記パターン依存相関要素計算ステップにより得られるパターン依存相関要素とを加算する相関分子値加算ステップと、
    上記正規化された切出し領域の情報のノルムを計算する切出し領域ノルム計算ステップと、
    上記切出し領域ノルム計算ステップにより得られる切出し領域のノルムと、上記標準パターンノルム記憶ステップにより得られる標準パターンのノルムとを乗算する相関分母値乗算ステップと、
    上記相関分子値加算ステップにより得られる相関分子値を上記相関分母値乗算ステップより得られる相関分母値で除算する除算ステップと
    を具えた画像認識方法。
JP21185395A 1994-08-25 1995-08-21 画像認識装置および画像認識方法 Expired - Fee Related JP3724014B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US29597494A 1994-08-25 1994-08-25
US295974 1994-08-25

Publications (2)

Publication Number Publication Date
JPH08212353A JPH08212353A (ja) 1996-08-20
JP3724014B2 true JP3724014B2 (ja) 2005-12-07

Family

ID=23140030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21185395A Expired - Fee Related JP3724014B2 (ja) 1994-08-25 1995-08-21 画像認識装置および画像認識方法

Country Status (5)

Country Link
US (1) US5790702A (ja)
EP (1) EP0698857B1 (ja)
JP (1) JP3724014B2 (ja)
KR (1) KR100329098B1 (ja)
DE (1) DE69529319T2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3166905B2 (ja) * 1997-07-02 2001-05-14 インターナショナル・ビジネス・マシーンズ・コーポレ−ション パターンマッチングによる画像処理方法およびシステム
IL123858A (en) * 1998-03-27 2003-05-29 Iscar Ltd Drilling head
US6526165B1 (en) * 1998-11-30 2003-02-25 Cognex Corporation Methods and apparatuses for refining a geometric description of an object having a plurality of extensions
US6243494B1 (en) * 1998-12-18 2001-06-05 University Of Washington Template matching in 3 dimensions using correlative auto-predictive search
WO2000046736A1 (en) * 1999-02-05 2000-08-10 Yoav Smith Similarity measurement method for the classification of medical images into predetermined categories
US6477275B1 (en) * 1999-06-16 2002-11-05 Coreco Imaging, Inc. Systems and methods for locating a pattern in an image
US6377206B1 (en) * 2000-04-06 2002-04-23 Lockheed Martin Corporation Method for clutter rejection in digital imagery
US7058221B1 (en) * 2000-07-07 2006-06-06 Tani Electronics Industry Co., Ltd. Method of recognizing object based on pattern matching and medium for recording computer program having same
DE10045360A1 (de) * 2000-09-14 2002-03-28 Giesecke & Devrient Gmbh Verfahren zur Klassifizierung von Dokumenten
JP4161659B2 (ja) 2002-02-27 2008-10-08 日本電気株式会社 画像認識システム及びその認識方法並びにプログラム
US7142718B2 (en) * 2002-10-28 2006-11-28 Lee Shih-Jong J Fast pattern searching
US6943724B1 (en) 2002-10-30 2005-09-13 Lockheed Martin Corporation Identification and tracking of moving objects in detected synthetic aperture imagery
US6864828B1 (en) 2003-02-18 2005-03-08 Lockheed Martin Corporation Method and apparatus for collection and processing of interferometric synthetic aperture radar data
EP1643356B1 (en) * 2003-05-23 2010-01-06 Nippon Telegraph and Telephone Corporation Parallel processing device and parallel processing method
KR100580630B1 (ko) * 2003-11-19 2006-05-16 삼성전자주식회사 적외선을 이용한 사람 식별 장치 및 방법
JP4661319B2 (ja) * 2005-04-18 2011-03-30 パナソニック電工株式会社 画像処理装置及び画像処理方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6273391A (ja) * 1985-09-27 1987-04-04 Toshiba Corp パタ−ン認識学習装置
US5090418A (en) * 1990-11-09 1992-02-25 Del Mar Avionics Method and apparatus for screening electrocardiographic (ECG) data
EP0511400B1 (en) * 1990-11-19 1997-03-12 Olympus Optical Co., Ltd. Device for processing image of endoscope and method thereof
EP0504027A3 (en) * 1991-03-15 1993-04-21 Centro De Neurociencias De Cuba Method and system for three-dimensional tomography of activity and connectivity of brain and heart electromagnetic waves generators
US5283837A (en) * 1991-08-27 1994-02-01 Picker International, Inc. Accurate estimation of surface normals in 3-D data sets
US5432864A (en) * 1992-10-05 1995-07-11 Daozheng Lu Identification card verification system

Also Published As

Publication number Publication date
EP0698857A3 (en) 1996-11-20
DE69529319T2 (de) 2003-10-16
DE69529319D1 (de) 2003-02-13
KR100329098B1 (ko) 2002-08-08
EP0698857B1 (en) 2003-01-08
KR960009591A (ko) 1996-03-22
JPH08212353A (ja) 1996-08-20
US5790702A (en) 1998-08-04
EP0698857A2 (en) 1996-02-28

Similar Documents

Publication Publication Date Title
JP3724014B2 (ja) 画像認識装置および画像認識方法
CN110992356B (zh) 目标对象检测方法、装置和计算机设备
US6278798B1 (en) Image object recognition system and method
EP2387770B1 (en) Method to match images
EP3009961B1 (en) Method and system for representing image patches
EP2153409B1 (en) Camera pose estimation apparatus and method for augmented reality imaging
EP2312472A1 (en) Method and apparatus for representing and searching for an object using shape
US20180336407A1 (en) Image processing system
US11625842B2 (en) Image processing apparatus and image processing method
JP4709668B2 (ja) 3次元物体認識システム
CN108573471B (zh) 图像处理装置、图像处理方法以及记录介质
US4573197A (en) Method for automatic recognition of two-dimensional shapes
JP2002063567A (ja) 物体位置姿勢推定装置及びその方法並びそれを用いた特徴点位置抽出方法及び画像照合方法
Garding Surface orientation and curvature from differential texture distortion
US7113652B2 (en) System and method for using normalized gray scale pattern find
KR20120094102A (ko) 유사도 산출 디바이스, 유사도 산출 방법 및 프로그램
CN111179342A (zh) 物体位姿的估计方法、装置、存储介质和机器人
JP2002140706A (ja) 画像識別装置および画像データ処理装置
KR100888751B1 (ko) 객체 인식 장치 및 방법
JP2649367B2 (ja) 多次元画像相関演算装置
JP5309064B2 (ja) 袋入り製品の位置検出方法及びその装置
Di Stefano et al. Speeding-up NCC-based template matching using parallel multimedia instructions
JP2000306099A (ja) 三次元物体の認識方法及びシステム、記録媒体
JPH05189570A (ja) 濃淡画像パターンマッチング方法及びその装置並びに欠陥検出装置と文字認識装置と位置決め装置
JP3841481B2 (ja) 特徴抽出装置及びそれを用いたパターン識別装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050912

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080930

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090930

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100930

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100930

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110930

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110930

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120930

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120930

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130930

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees