JPH0638274B2 - 画像認識装置および画像認識方法 - Google Patents

画像認識装置および画像認識方法

Info

Publication number
JPH0638274B2
JPH0638274B2 JP1198853A JP19885389A JPH0638274B2 JP H0638274 B2 JPH0638274 B2 JP H0638274B2 JP 1198853 A JP1198853 A JP 1198853A JP 19885389 A JP19885389 A JP 19885389A JP H0638274 B2 JPH0638274 B2 JP H0638274B2
Authority
JP
Japan
Prior art keywords
model
point
input image
directional
movement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1198853A
Other languages
English (en)
Other versions
JPH0363774A (ja
Inventor
博三 山田
山本  和彦
泰一 斉藤
Original Assignee
工業技術院長
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 工業技術院長 filed Critical 工業技術院長
Priority to JP1198853A priority Critical patent/JPH0638274B2/ja
Priority to US07/559,588 priority patent/US5033099A/en
Publication of JPH0363774A publication Critical patent/JPH0363774A/ja
Publication of JPH0638274B2 publication Critical patent/JPH0638274B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、画像認識装置および画像認識方法に関し、詳
しくは入力画像に対し局所並列処理を行なうことによっ
て画像の中から所定の形の特徴を抽出する画像認識装置
および認識方法に関する。
[背景技術] 従来より、画像処理の自動化における問題点の一つとし
て、その処理に要する計算量が多大なものになるという
ことがあった。画像情報の場合、一般に処理すべき点の
数が多いため、汎用のプロセッサによる逐次処理方式を
そのまま用いたのでは、単純な処理演算を一通り行うだ
けでも相当な時間を要する。
このような問題を解決するための方式として、特に画像
処理専用に、均一な処理が各点に対して同時に行う並列
処理方式がとられていた。なお、ここで並列処理という
場合、必ずしも各点に対し完全に同時処理を行なうとい
う訳ではなく、同一の演算をパイプライン処理する場合
も含まれる。すなわち、この方式は、各点に関する演算
をその他の手続きに優先して行うことにより、制御構造
を特殊化かつ単純化し処理効果を高めるというものであ
り、画像処理専用プロセッサは、このような原理に基づ
いて構成されている。
この方式においては、今、ある点での処理と、その隣の
点での処理とは、互いに独立でなければならないという
制約条件が発生する。このような制約のもとで行なう処
理は、特に局所並列処理と呼ばれる。
画像に対する局所並列処理演算でも最も基本になるもの
として、収縮・膨張演算がある。収縮演算は、2値画像
情報において、ある点の値とその周り(近傍)の値との
論理積(AND)によりその点の新しい値を求める演算であ
り、例えば、これらの演算を画像情報の図の部分が
“1”、背景が“0”の2値画像の全面に適用すると、
図の周辺部が削られた図形になる。従ってこれを収縮演
算と呼ぶ。膨張演算は、近傍との論理和(OR)演算を行う
ものであり、これにより図形の周辺部を太らせる。所定
の画像情報に対してこれら収縮・膨張演算を引き続いて
行なうと、最初の収縮演算で画像情報の中の細かい点や
線を消去すると共に、大きな塊部分については、後の膨
張演算で殆ど元に復元することができる。結果として、
収縮・膨張演算という局所並列処理のみで、画像情報の
中の塊と、点や線とを区別して認識することが可能とな
る。この演算は、通常の論理演算の2次元近傍への拡張
であり、画像処理専用プロセッサの一つの核となってい
る。
並列処理のもう一つの特徴は、各点の処理結果を独立に
得ることができるため、結果が安定であり信頼性が高い
ということである。すなわち、ある特徴を逐次的に処理
して求める場合、処理過程のどこかで誤りがあると、そ
の誤りが処理結果の全体に影響を及ぼしてしまう。これ
に対して並列処理の場合、各点独立に処理を行っている
から、処理結果の全体ではその点の誤りはその点だけに
とどまる。その意味で安定な特徴を抽出することができ
る。
並列処理演算は、上述したような特徴を有するものであ
るが、処理できる内容に限界があった。例えば、従来行
なわれていた収縮・膨張演算によって、点と線とを区別
して認識できないということがあった。すなわち、上述
した従来の収縮・膨張演算によれば、最初の収縮演算で
点と線は同時に消えてしまう。
従って、例えば画像情報の中の線特徴だけを抽出したい
場合、従来は処理の途中で専用プロセッサから汎用プロ
セッサへその処理を移行しなければならなかった。この
ように、目的とする処理全体の中で、並列処理演算がこ
ま切れにしか利用できないため、データや処理手続きを
専用プロセッサと汎用プロセッサとの間で往復させなけ
ればならず、専用プロセッサによる高速性の利点が相殺
されてしまっていた。このように、専用プロセッサの利
点をフルに活かすためには、そこで実行できる並列処理
演算の内容を豊富にして処理能力を向上させることが要
請されていた。
この観点から、本願発明者等は、従来の2値画像に対す
る収縮・膨張演算の拡張として、MAP(Multi-Angled Par
allelism,多重方向性並列演算)法を開発した(例え
ば、山田博三,山本和彦:“方向特徴場における2値画
像並列理演算−8近傍による任意方向伝播のためのツイ
スト型演算”,電子情報通信学会論文誌,Vol.J72-DII,
No.5,pp678-685,1989-5,および松井伸二,山田博三,斉
藤泰一,村木茂,山本和彦:“2値画像方向性局所並列
演算を用いた地形図の特徴抽出”電子情報通信学会パタ
ーン認識理解研究会技術報告,PRU88-76,1988-11/18参
照)。
すなわち、従来の収縮・膨張演算では、ある点と、その
回りの点の情報から得られた新しい値をその点の値とし
て更新し、この処理を周りの点全てについて並行に行う
ものである。
これに対して、MAP法では、周りの点の各々を均一に見
なすのではなく、近傍点の各々をある点および近傍点の
各々に対応する画像情報によって定まる方向面という概
念を媒介にして近傍点の各々をとらえ、それと同時に演
算も、各々の方向毎に行なう。このような拡張により、
従来、大きな塊と、小さな点および細い線との区別しか
出来なかったのに対し、点と線の区別も可能となり、並
列演算処理を、画像情報からより広い幾何学的特徴を抽
出する手段として用いることができるようになった。
なお、収縮・膨張演算およびMAP法演算は、基本的には
2値画像に対するものであるが、AND,OR論理演算を、そ
れぞれMIN,MAX数値演算に変える事により多値画像への
拡張が可能である。
ところで、視覚情報処理過程における方向性を有した特
徴抽出の重要性については、視覚生理学的事実の発見の
他、文字認識や各種画像認識における実験的解析から、
多くの確証が得られている。MAP法の開発により、この
ような“線”すなわち方向性を有した特徴抽出が、並列
演算の枠組で可能になる。
ここで、先に述べたように、高速処理を可能とする並列
処理の枠組の中で、可能な処理内容を拡大するという観
点からすると、更に高次な特徴の抽出が要望される。よ
り高次な特徴として考えられるものは、線の集合として
の“形”である。すなわち、それぞれの線の特徴、およ
びそれらの線と線との関係として定義された任意の
“形”を、入力像の中から抽出する事ができれば、任意
のより高次な特徴の抽出機構を構成する事になる。
また、見方を変えると、このような“形”の抽出技術
は、そのまま対象の“認識”の技術となる。すなわち、
予め与えられた形を入力画像情報の中から抽出すること
は、光学的文字認識、ロボットの目としての物体の種類
・位置の認識、医療用画像中の組織・臓器の認識等、画
像の自動認識の中心的な課題である。現在の所、このよ
うな“形”の抽出技術は、機械による“画像認識”技術
のほぼ全体をカバーする技術と言ってもよい。
[発明の目的] 本発明は、上述したような背景からなされたものであ
り、線の集まりとして定義された形(以下、モデルと呼
ぶ)と入力画像情報とを、方向面として定義される特徴
要素において重ね合わせを行なうことにより、並列処理
演算の枠内で入力画像情報の中から当該モデルの形を抽
出することが可能な画像認識装置および画像認識方法を
提供することを目的とする。
[課題を解決するための手段] そのために、本発明では、並列処理により、入力画像の
中から抽出された方向性特徴と予め定義された形のモデ
ルとの対比により画像認識を行なう画像認識装置におい
て、認識すべき形のモデルを、当該モデル形状の輪郭線
上の点における当該輪郭線の方向に関する値と前記輪郭
線上の他の点から当該点までの移動量との組の前記輪郭
線に沿った系列として表現し、前記モデルを前記組の系
列として予め記憶するモデル記憶手段と、入力画像にお
いて前記方向性特徴を抽出することにより、当該入力画
像の各画素毎の方向成分の強さを表現する方向面を複数
の方向について作成する方向面作成手段と、前記方向面
の加算結果を前記入力画像の各画素毎の前記方向成分の
強さの総和として保持することが可能なカウンタ面を記
憶するカウンタ面記憶手段と、前記モデル記憶手段に記
憶された前記組の移動量だけ前記カウンタ面を平行移動
するための移動手段と、該移動手段によって移動した前
記カウンタ面に、当該移動にかかる前記組の前記方向に
関する値によって指示される方向の前記方向面を加算す
る加算手段と、前記移動手段および前記加算手段を制御
し、前記モデル記憶手段に記憶される前記組の系列に従
って、順次前記平行移動および前記加算を実行する反復
手段と、該反復手段による前記平行移動および加算の終
了後、前記カウンタ面における各画素毎の前記方向成分
の強さの総和のそれぞれに応じて、当該画素に前記モデ
ルの前記輪郭線上の所定の点が位置するものとして、前
記モデルに対応する前記形を認識する手段と、を具えた
ことを特徴とする。
また、本発明では、並列処理により、入力画像の中から
抽出された方向性特徴と予め定義された形のモデルとの
対比により画像認識を行なう画像認識方法において、認
識すべき形のモデルを、当該モデル形状の輪郭線上の点
における当該輪郭線の方向に関する値と前記輪郭線上の
他の点から当該点までの移動量との組の前記輪郭線に沿
った系列として表現し、前記モデルを前記組の系列とし
て予め記憶し、入力画像において前記方向性特徴を抽出
することにより、当該入力画像の各画素毎の方向成分の
強さを表現する方向面を複数の方向について作成し、前
記方向面の加算結果を前記入力画像の各画素毎の前記方
向成分の強さの総和として保持することが可能なカウン
タ面を記憶し、前記モデルとして記憶された前記組の移
動量だけ前記カウンタ面を平行移動し、当該移動によっ
て移動した前記カウンタ面に、当該移動にかかる前記組
の前記方向に関する値によって指示される方向の前記方
向面を加算し、前記モデルとして記憶される前記組の系
列に従って、順次前記平行移動および前記加算を実行
し、当該実行による前記平行移動および加算の終了後、
前記カウンタ面における各画素毎の前記方向成分の強さ
の総和のそれぞれに応じて、当該画素に前記モデルの前
記輪郭線上の所定の点が位置するものとして、前記モデ
ルに対応する前記形を認識する各処理を具備したことを
特徴とする。
[作用] 以上の構成によれば、モデルと入力画像情報とを方向面
として定義される形の特徴要素において重ね合わせを行
なうことにより、並列処理演算の枠内で画像情報の中か
らモデルの形を抽出することが可能となる。
[実施例] 以下、図面を参照して本発明の実施例を詳細に説明す
る。
先ず、本発明における中心概念である方向面およびモデ
ルについて説明する。
入力画像情報の各点において、濃度の傾斜をもとにした
N(本例では8)面の方向特徴要素すなわち方向面Uが
演算される。
U={un(i,j)},n=0,1,....,7 1≦i≦I,1≦j≦J…(1) ここで、方向面un(i,j)は、入力画像のメッシュで区切
られた点(i,j)およびその近傍点と第1図に定義される
方向nによって定まるn方向の方向性の強さを示すもの
であり、実際の処理では、第2図(A)にその演算概念が
示されるエッジオペレータEO0〜EO7からの出力(マイナ
スの値はカット)またはそれを2値化したものとして得
られる。例えば、入力画像情報が縦方向(第1図中2,
6の方向)の線であり、その境界から左側が全て“1”
(黒)、右側が全て“0”(白)の場合において、境界
の左側で近傍する“1”の点にエッジオペレータの演算
を行なう場合をn=3の場合で考えると、第2図(B)に
示すように、演算する点にオペレータEO3の中心を合わ
せ、オペレータEO3の各値と画像情報(“1”または
“0”)との積和演算、0×1+(-1)×1+(-1)×0+1×1+0
×1+(-1)×0+1×1+1×1+0×0=+2からu3(i,j)=2を得
る。このような演算を第2図(A)に示す8つの方向面で
行ない、演算の結果が負の場合はその値を0とする。従
って、このエッジオペレータからの出力はその点の濃度
の傾斜を示し、向きは低い方から高い方へとられてい
る。
ただし、このオペレータEO0〜EO7の出力のみでは、特徴
要素が局所的である事と、方向精度が暖いため、傾斜の
直角方向の情報との統合により、その付近に直線成分が
あるという特徴要素に置き換えたほうが、今後の処理に
とって都合が良い。この統合処理は、発明者等がさきに
提案したMAP法により、局所並列演算の繰り返しによっ
て可能である。ただ、表現の形式と特徴要素の意味自身
は、統合の後もエッジオペレータの出力のままでも変わ
らないため、以降の説明では、un(i,j)は、第2図(A)に
示したエッジオペレータEO0〜EO7の出力であるとして説
明する。
一方、抽出すべき形のモデルは、形の輪郭に沿ってとら
れたM(本例では13)個の評価点における法線の方向特
徴(離散化された番号で表される)と、一つ前の評価点
からの移動量で与えられる。この法線方向および移動量
は、モデル評価点の属性、また、mは系列番号と呼ばれ
る。このとき、モデルRは以下の式で与えられる。
R={(rm,pm,qm)|m=1,2,...,M} 0≦rm≦7…(2) (2)式において、rmは、m番目の評価点の方向番号であ
る。第3図に示すモデルの例では、その8角形の内側は
低濃度であり、背景は高濃度とする。従って、rmは、輪
郭の外側の向きを有した法線方向を8方向に離散化した
ものを示すものとなる。このモデルで得られる特徴は、
入力画像から求められた方向特徴要素と比較されるべき
ものであるから、方向性の安定な場所、すなわち輪郭の
曲がりの少ない直線的な点にとるのが望ましい。
また、(2)式において(pm,qm)は、m-1番目の評価点から
m番目の評価点への移動量である。但し、(p1,q1)はM
番目の評価点から1番目の評価点への移動量とする。
M番目の評価点の場所を参照点と呼ぶ時、参照点からm
番目の評価点までの累積の移動量は、以下のように与え
られる。
ここで、このモデルRは、入力画像情報の処理に先だっ
て、処理システム側が知識として有しているものであ
る。その作成方法としては、抽出すべき形を入力してお
き、(a)評価点の位置を操作者が指定する。(b)機械側で
自動的に(例えば輪郭上に等間隔に)評価点とその点の
法線方向を決定する。(c)輪郭の全ての点を評価点にと
り、その点の法線方向を特徴とする(この場合、pm,qm
は±1の範囲となる)、等の方法が考えられる。何れに
しても入力画像の処理に先だってモデル情報は処理装置
の中に定義されている。
次に、処理の途中結果を保持する記憶手段としてのカウ
ンタ面C=c(i,j)について説明する。今ここでは、カウ
ンタ面のメッシュ数は入力面のメッシュ数とは等しいも
のとする。この面には、モデルの評価点mまでの入力の
各点に関した評価値が保持される。ここで、表記法とし
て、Cは、カウンタ面c(i,j)の画像全体を表し、C
[pm,qm]は、画像C全体を(pm,qm)だけシフト(平行移
動)した画像を意味する。
本発明による処理の目的は、モデルによって指定される
評価点の方向性特徴および評価点間の位置関係を有する
形を入力画像情報の中から並列演算によって抽出する事
である。以下、その処理について説明する。
1)初期設定 カウンタ面Cを0でクリアした上でカウンタ面Cを入力
面uに重ねる。このカウンタ面Cの点(i,j)に着目し、
これをのぞき穴Wijと呼ぶと、のぞき穴Wijは入力画像情
報の点(i,j)の位置に置かれる。第4図(A)は、初期設定
時のカウンタ面Cの位置と、参照点に位置するのぞき穴
Wijを小円で示す。このとき、カウンタ面Cと入力面u
は完全に重なっている。
2)モデル評価点m=1,...,Mに関して以下の2種
類の処理を逐次行う。
2-1)移動 カウンタ面C全体を(pm,qm)だけシフト(平行移動)す
る。この処理は以下の式で表わされる。
C:=C[pm,qm] …(4) ここで、記号:=は、右辺で演算された値を左辺に代入
することを意味する。
この平行移動の処理は、面内の各点c(i,j)に対して均一
な処理であり各点独立であるため、並列処理により高速
に実行が可能である。
ここで、初期設定時ののぞき穴Wijは、入力画像の(i
+Σpm,j+Σqm)の位置に移動することになる。すな
わち、第4図(B)はm=1の場合の移動を示し、のぞき
穴Wijは元の破線で示されるモデルのm=1の評価点の
位置まで移動する。
2-2)加算 移動によって得られる新たなカウンタ面Cにおいて、方
向番号rmに基づいて方向面urmを指定し、この値をカウ
ンタ面Cの値に加算する。すなわち、 C:=C+urm …(5) この加算処理も、面内の各点c(i,j)に対して均一に行う
処理であり各点の演算が独立であるため、並列処理によ
り高速に実行が可能である。
上の(4),(5)式の処理によるのぞき穴Wijに着目すると、
新たなのぞき穴Wijは以下の式で更新される。
Wij:Wij+urm(i+Σpm,j+Σqm)…(6) (6)式および第4図(B)から明らかなように実線で示され
るカウンタ面Cと破線で示される入力面Iとがそのまま
の位置で加算される。すなわち、Wijに付加されたi,jに
よって示される位置は、現在の位置ではなく、第4図
(A)に示した初期設定時における位置を示している事に
注目されたい。
なお、第4図(C)は、m=4計算時のカウンタ面Cの位
置を示している。現在ののぞき穴Wijの位置は初期設定
時のm=4の評価点の位置である。この時の入力面uの
位置は、破線で示す位置であり移動していない。
上記2-1)移動および2-2)加算処理をM回行なった後のの
ぞき穴Wijについて着目すると、(p1,q1)の設定の仕方か
ら、i+ΣPM≡i,j+ΣqM≡jであるから、Wijは元
の位置(i,j)に戻る。すなわち、最終的に得られるWij
は、モデルの参照点(終点)を入力像の(i,j)の位置に
置いた時の、モデルの輪郭に沿ったM個の評価点におけ
る上述の評価値、すなわち指定された方向面の総和が含
まれている。この処理が点(i,j)に関して並列に実行さ
れるから、全ての点(i,j)に関してこのような評価量の
総和が、同時に求められる。従ってこの総和がカウンタ
面Cにおいて最大となる値、max{c(i,j)}、を検出す
る事により、この最大値を有する点、すなわちモデルの
形を入力画像のあらゆる場所に置いてみて、その中で最
も良く合致する点(i,j)とその時の評価値c(i,j)を知る
事ができる。
なお、面内にモデルに近い形が複数存在すると考えられ
る場合には、最大値を有する点だけでなく、周りと比べ
て値の大きな点すなわち極大点を検出することによりそ
れらの位置が抽出される。
以上の動きを3次元的に示したのが第5図である。
一番上の面Cがカウンタ面、下側の8面が入力画像情報
から求めた方向面uである。8つの面uにはそれぞれ図
に示す方向成分の特徴が入っている。処理の進行に従っ
て一番上のカウンタ面のみが図に示すように移動する。
この移動は、第4図(A)〜(C)に対応している。各評価点
mにおける加算時に、図中縦線で示したのぞき穴の上で
カウンタ面の値と方向面の値が加算されるが、この時加
算されるのは方向面8面の値全部ではなく、モデルで指
定された8面の内の1面の値である。
第6図は、上述した処理を実行する装置のブロック図で
ある。
同図中、中央の列は処理部を示し、左側はモデルデータ
の記憶部、右側は2次元表現のデータの記憶部を示す。
まず最初に紙等の上にかかれた画像621を、光電変換を
用いたTVカメラ等の観測部611によりディジタル化して
読取り、この画像情報を観測面622に記憶する。次に、
この記憶した情報に基づきエッジ抽出部612のエッジオ
ペレータEO0〜EO7により、8面の方向面uを作成する。
これらの処理に先だってM個の評価点に関するモデル情
報はテーブルの形式でモデルテーブル601に蓄えられて
いる。
次に、初期値部613によりカウンタ面Cを全て0に初期
値設定し、制御部614において、m=1からMの順序で
移動と加算の処理を行うための制御を行う。
すなわち、移動部615では、カウンタ面Cをモデルの移
動量で指定された量だけ平行移動する。この処理は、面
内の各点に対して均一な処理であり各点の独立な処理で
あるため、いわゆる並列処理で高速に実行される。
また、加算部616では、カウンタ面Cとモデルの方向番
号rmによって求められる方向面uとの加算を行う。この
処理も、面内の全点に対して均一に行う処理であり各点
の演算が独立であるため、いわゆる並列演算で高速に実
行される。
上記移動および加算のM回の処理が終了すると、最大値
検出部617で、カウンタ面Cにおける上記した最大値と
その位置を検出し、最大値が所定値より大であることを
もって、モデルまたはそれに近似した形が入力画像の中
に存在することを検知すると共に、その位置を検出す
る。この処理は、カウンタ面Cの内容を逐次読み出し比
較を行うという逐次処理方式で行う。もちろん、この部
分をハードウェア化して、高速化する事は可能である。
以上の処理過程の中で中心となるのは、移動と加算の反
復処理である。
第7図は、m=1からMまでの移動と加算について、詳
細に説明するためのブロック図である。まず、m=1か
ら順にMまで以下の処理が行われる。今、ある特定のm
に関して、モデルテーブルのm行目の値(rm,pm,qm)を
取り出す。移動部615では、(pm,qm)だけカウンタ面
を平行移動しカウンタ面に戻す。移動部615での処理
は(pm,qm)という制御情報によってカウンタ面全点をそ
れだけずらすというものであり、各点に関して独立であ
る。すなわち、移動という処理手順を全面に対して均一
に独立に実行すればよい。この処理は、1台の処理回路
でメモリアクセスをパイプライン化する方式や、各点に
処理回路を配置する完全並列方式により並列化による高
速化が可能である。
次に加算部616で、rmで指定される番号の方向面
と、カウンタ面とを加算し、カウンタ面に戻す。こ
の処理も平行移動処理と同様に各点に関して独立である
ため、並列演算による高速処理が可能である。以上の移
動処理と加算処理をm=1,2,3,…Mの順に行う。
一般に、入力画像の中からモデル画像の形を抽出する問
題は、入力点全点における入力画像とモデル画像の重ね
合わせ(内積計算)によって求められる。しかし、この
ような全面に対するテンプレートマッチングは現実には
殆ど用いられていない。その理由は、全面に対して内積
計算をするのは、計算量が余りにも多すぎるためであ
る。
本発明の実施例によれば、モデルが方向性特徴要素のつ
ながりで表現される。すなわちモデル評価点を全面とす
るのではなく、評価点を特徴要素に絞り込むことにより
全面に対するテンプレートマッチングに比較して、計算
量を減少させることができる。さらに、入力画像全面に
対する処理が平行移動と加算という極めて単純な処理で
あるため、並列処理により高速計算が可能である。この
ようにして、全面に対するマッチングを現実的なものに
している。
本発明による他の重要な特長は、方向性特徴を用いてい
るという点である。方向性特徴の導入により精度の高い
マッチングが行われる。すなわち、方向性特徴により実
効的にその周りの情報も見ていることに相当するから、
評価点の数を減少させても、画像認識の性能は維持さ
れ、なおかつ、方向別面という表現形式を用いているた
め、通常の角度差と強度差からの距離計算を必要とせ
ず、加算演算のみで、同等の認識性能を得ることができ
る。このことが、距離計算を並列処理で実行できる理由
となっている。
以上述べた実施例に加えて、以下に述べるような変形、
および、複数の変形の組み合せによる複合的な変形が可
能である。
1)のぞき穴を移動してその直下の入力の点だけを見るの
ではなく、その周りも見ることにより入力画像の微小な
移動を吸収する。このとき、(6)式は、以下の式で置き
換えられる。
Wij=Wij+max{urm(i+i′+Σpm,j+j′Σqm)} -1≦i,j′≦1 …(7) なお、同等な効果は、マッチングに先だって、入力面に
ついて周りとのmax(和)をとっておくことによって得
られる。この場合は、カウント時に複数の点を見る必要
がなくなる。
2)処理過程2-2)おいてCに加算すべき値(距離)を、単
にuのrm成分そのものではなく、rm±1成分も考慮して
方向性のゆらぎを吸収する。例えば、このときのWij
以下の式によって得られる。
Wij:=Wij+max{urm(i+Σpm,j+Σqm),urm-1(i+Σ
pm,j+Σqm),urm+1(i+Σpm,j+Σqm)} この場合も、上記1)の微小移動吸収の場合と同様にマッ
チングに先だって入力面について周りとのmaxをとって
おくことができる。
3)Cに加算する値を決める時、urmの値そのものではな
く、それから計算される距離d(urm)に置き換える。
例えば、(8)式で、rm−1とrm+1成分にrm成分の1/2の
重みをかける。これにより、より精密な距離評価法とす
る事ができる。
4)上記実施形のままでは、テンプレートすなわちモデル
は剛体であり、上記1),2)の微小移動吸収で述べた変形
も、剛体テンプレートからの微小移動を吸収するための
ものである。これに対して、指定されたテンプレートが
フレキシブルに変形し、許される変形の範囲内で最適な
マッチングを求める弾性テンプレートの考え方が必要な
場合がある。そのために、加算時に、1点のc(i,j)の値
を用いるのではなく、c(i,j)の周りの点の中で最大のも
のを選択する。この時、Wijは以下の式で表わされる。
Wij:=max{wi+i′ J+J′}+urm(i+Σpm,j+
Σqm) -1≦i′,j′≦1 …(9) この演算は、並列演算ではc(i,j)を-1≦i′,j′≦
1、すなわち3×3の範囲でずらして最大値をとり、そ
の値とurmを加算することにより行われる。すなわち、 C:=maxC[i′,j′]+urm -1≦i′,j′≦1 …(10) これにより、Cの選択の範囲内で変形が可能な弾性体モ
デルとなる。なお、移動量が小さく、それに比べて許容
量-1≦i′,j′≦1が大きくなり過ぎる場合には数個
の評価点毎に許容値を持たせる事ができる。
5)上記実施形では、形の内部が背景に比べて常に低濃度
であるとして説明してきたが、背景が不規則である、対
象とする形の濃度が一定でない、等、問題によっては、
モデルで定義した方向と、対応する入力像で発生するエ
ッジの方向とが、180度変化し、なおかつその現象が不
規則に起こる場合がある。この問題に対処するために、
角度差の評価を360度単位ではなく、180度単位で行う。
このとき、Wijは以下の式で表わされる。
Wij:=Wij+max{urm(i+i′+Σpm,j+j′+Σqm), urm+4(i+i′+Σpm,j+j′+Σqm)}…(11) 同等な効果を得るために、予め、0面と4面、1面と5
面、2面と6面、3面と7面、それぞれのOR(最大値)
をとり、その統合した面について加算処理を行うことも
できる。
6)方向面8面について説明してきたが、方向精度を向上
させるためにそれ以上の面数をとることもできる。この
場合、加算時の処理は、上記実施形と同様であるが、入
力面抽出時には、本発明者らが先に提案した8近傍演算
のみで任意方向精度の特徴を抽出するツイスト形演算が
有効である。なお、方向面数を増加させた場合、モデル
で指定した方向と入力面に現れる方向とが食い違う事が
増えるため、上記(2)の項で述べた、距離測定における
方向性の緩和が重要となる。
7)入力表現を各方向毎の面ではなく、方向の数値v(i,j)
と、その強さu(i,j)で表すこともできる。このとき、方
向面Uは以下の式で表わされる。
U=(u(i,j),v(i,j))…(12) この時加算されるべき値は、モデルの方向rmと入力の方
向性の強さuから求められる。このとき、Wijは、 Wij:=Wij +u(i+Σpm,j+Σqm)×d(rm-v(i+Σpm,j
+Σqm))…(13) この場合、モデルおよび入力の方向精度を任意に高くと
る事ができる。また、方向面が1面ですむのも長所であ
るが、各点の演算を並列に行う場合、距離計算の部分が
相当に複雑になる。
8)更に柔軟性のある特徴表現として、入力像は濃度画像
そのままにしておき、モデルの側に評価点の周りの局所
的なテンプレートhを用意する。加算値は、カウンタ面
Cへの加算時にコンボルーションを行なうことにより決
定する。すなわち、このときWijは、 これにより、局所特徴として、単に濃度勾配からのエッ
ジではなく、hで定義される任意の局所的な形を指定で
きる。また、局所テンプレートとのコンボルーション演
算は容易に並列演算可能であるから、上記7)による入力
表現に比べて、並列演算のみで実行できるのも特徴であ
る。
9)上記実施形では、入力面全面から形を抽出する場合に
ついて説明した。しかし、場合によっては、抽出すべき
領域が限られている事がある。そのような場合は、相当
する部分領域の広さのカウンタ面を用意し、その領域の
みについて処理を行う。これにより、少ない記憶量のカ
ウンタ面で処理が可能となる。
10)上記実施形では、移動と加算の繰り返し処理終了
後、カウンタ面Cの最大値を見ることにより、最も良く
マッチングする位置と評価値を得ている。これは、入力
面の中にモデルの形が1個存在する事を前提としてい
る。これに対して、モデルの形が入力面に複数個存在す
る場合には、最大値ではなく、周りと比べて評価値の大
きな点、すなわち極大点を検出する。
11)上記実施では、モデルは閉じた形であったが、方向
性を定義出来さえすれば輪郭である必要はなく、また、
必ずしも閉じている必要はなく例えばトリー状でも良
い。
12)上記実施形で説明した方法では、のぞき穴を逐次移
動した。これを追跡形と呼ぶとすれば、追跡形の場合、
モデル移動量(pm,qm)として、m-1からmへの移動量を指
定した。これに対して、モデル内に別の参照点をとり常
にその点からの移動量(pm,qm)で指定する事もできる。
ここでは、上述の2-1)移動、2-2)加算の処理に加えて、 C:=C[-pm,-qm]…(15) で示される処理を行う。すなわち、この場合は、2-2)の
処理を終った段階では、初期設定時のWijは、入力画像
の(i+pm,j+pm)の位置に移動する。そこで、カウ
ンタ面Cへの加算の後カウンタ面Cを(-pm,-qm)だけ逆
に移動して元の参照点(i,j)の位置に戻し、これを繰り
返す。この方法は、評価結果を常に参照点に集めている
事になるため、これを投票形と呼ぶ。
なお、このとき、m段の最後の移動とm+1段の最初の
移動を統合して(−pm+pm+1,−qm+qm+1)の合成ベク
トルで移動する事は可能であり、このようにすることに
より、各段での処理は追跡形と同じになる。追跡形との
違いは、最終的に求める参照点を、モデルの任意の点に
とれるという点である。
[発明の効果] 以上の効果から明らかなように、本発明によればモデル
と入力画像情報とを方向面として定義される形の特徴要
素において、重ね合わせを行なうことにより、並列処理
演算の枠内で画像情報の中からモデルの形を抽出するこ
とが可能となる。
すなわち、カウンタ面の各点(i,j)にモデルの参照点を
重ねた時の重なりの度合c(i,j)が、すなわち、モデルの
形Rが入力の各点にどの程度存在するかという情報が得
られる。
この結果、モデルの特徴要素表現による計算量の削減、
方向面の導入による距離計算の単純化、および入力面に
対する並列演算の優先的実行により、入力画像全面に対
するマッチングによる形の高速抽出方法およびそのため
の装置を得ることができる。
すなわち、本発明により、線と線の関係として与えられ
る任意の“形”を、入力像の中から高速に抽出すること
ができ、複雑な背景に書かれた文字の認識、ロボットの
目としての物体の種類・位置の認識、医用画像中の各種
組織・臓器の認識等、画像の自動認識に広い応用が可能
である。
【図面の簡単な説明】
第1図は、本発明の一実施例に関し、方向面の方向を定
義するための説明図、 第2図(A)および(B)は、本発明の一実施例に関し、入力
情報の方向性を抽出するためのエッジオペレータを説明
するための概念図、 第3図は、本発明の一実施例において、8角形を13の評
価点で表現したモデルの概念図、 第4図は、本発明の一実施例に関し、カウンタ面の移動
を説明するための概念図、 第5図は、第4図と同様なカウンタ面の移動と、複数の
入力方向面を3次元で表示する概念図、 第6図は、本発明の一実施例による処理過程および処理
構成を示すブロック図、 第7図は、第6図に示した移動と加算の詳細を示すブロ
ック図である。 601…モデルテーブル、 611…観測部、 612…エッジ抽出部、 613…初期値部、 614…制御部、 615…移動部、 616…加算部、 617…最大値検出部、 621…入力画像、 622…観測面、 C…カウンタ面、 U…(入力)方向面、 EO…エッジオペレータ。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】並列処理により、入力画像の中から抽出さ
    れた方向性特徴と予め定義された形のモデルとの対比に
    より画像認識を行なう画像認識装置において、 認識すべき形のモデルを、当該モデル形状の輪郭線上の
    点における当該輪郭線の方向に関する値と前記輪郭線上
    の他の点から当該点までの移動量との組の前記輪郭線に
    沿った系列として表現し、前記モデルを前記組の系列と
    して予め記憶するモデル記憶手段と、 入力画像において前記方向性特徴を抽出することによ
    り、当該入力画像の各画素毎の方向成分の強さを表現す
    る方向面を複数の方向について作成する方向面作成手段
    と、 前記方向面の加算結果を前記入力画像の各画素毎の前記
    方向成分の強さの総和として保持することが可能なカウ
    ンタ面を記憶するカウンタ面記憶手段と、 前記モデル記憶手段に記憶された前記組の移動量だけ前
    記カウンタ面を平行移動するための移動手段と、 該移動手段によって移動した前記カウンタ面に、当該移
    動にかかる前記組の前記方向に関する値によって指示さ
    れる方向の前記方向面を加算する加算手段と、 前記移動手段および前記加算手段を制御し、前記モデル
    記憶手段に記憶される前記組の系列に従って、順次前記
    平行移動および前記加算を実行する反復手段と、 該反復手段による前記平行移動および加算の終了後、前
    記カウンタ面における各画素毎の前記方向成分の強さの
    総和のそれぞれに応じて、当該画素に前記モデルの前記
    輪郭線上の所定の点が位置するものとして、前記モデル
    に対応する前記形を認識する手段と、 を具えたことを特徴とする画像認識装置。
  2. 【請求項2】並列処理により、入力画像の中から抽出さ
    れた方向性特徴と予め定義された形のモデルとの対比に
    より画像認識を行なう画像認識方法において、 認識すべき形のモデルを、当該モデル形状の輪郭線上の
    点における当該輪郭線の方向に関する値と前記輪郭線上
    の他の点から当該点までの移動量との組の前記輪郭線に
    沿った系列として表現し、前記モデルを前記組の系列と
    して予め記憶し、 入力画像において前記方向性特徴を抽出することによ
    り、当該入力画像の各画素毎の方向成分の強さを表現す
    る方向面を複数の方向について作成し、 前記方向面の加算結果を前記入力画像の各画素毎の前記
    方向成分の強さの総和として保持することが可能なカウ
    ンタ面を用意し、 前記モデルとして記憶された前記組の移動量だけ前記カ
    ウンタ面を平行移動し、 当該移動によって移動した前記カウンタ面に、当該移動
    にかかる前記組の前記方向に関する値によって指示され
    る方向の前記方向面を加算し、 前記モデルとして記憶される前記組の系列に従って、順
    次前記平行移動および前記加算を実行し、 当該実行による前記平行移動および加算の終了後、前記
    カウンタ面における各画素毎の前記方向成分の強さの総
    和のそれぞれに応じて、当該画素に前記モデルの前記輪
    郭線上の所定の点が位置するものとして、前記モデルに
    対応する前記形を認識する 各処理を具備したことを特徴とする画像認識方法。
JP1198853A 1989-07-31 1989-07-31 画像認識装置および画像認識方法 Expired - Lifetime JPH0638274B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1198853A JPH0638274B2 (ja) 1989-07-31 1989-07-31 画像認識装置および画像認識方法
US07/559,588 US5033099A (en) 1989-07-31 1990-07-30 Image recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1198853A JPH0638274B2 (ja) 1989-07-31 1989-07-31 画像認識装置および画像認識方法

Publications (2)

Publication Number Publication Date
JPH0363774A JPH0363774A (ja) 1991-03-19
JPH0638274B2 true JPH0638274B2 (ja) 1994-05-18

Family

ID=16397997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1198853A Expired - Lifetime JPH0638274B2 (ja) 1989-07-31 1989-07-31 画像認識装置および画像認識方法

Country Status (2)

Country Link
US (1) US5033099A (ja)
JP (1) JPH0638274B2 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0495481A3 (en) * 1991-01-16 1993-06-02 Ezel Inc. Liquid crystal panel inspection method
KR940007346B1 (ko) * 1991-03-28 1994-08-13 삼성전자 주식회사 화상 처리 시스템의 엣지 검출 장치
US5550933A (en) * 1994-05-27 1996-08-27 Duke University Quadrature shape detection using the flow integration transform
JPH0855188A (ja) * 1994-06-06 1996-02-27 Toshiba Corp 文字認識方式
JPH09138471A (ja) * 1995-09-13 1997-05-27 Fuji Photo Film Co Ltd 特定形状領域の抽出方法、特定領域の抽出方法及び複写条件決定方法
US5768158A (en) * 1995-12-08 1998-06-16 Inventure America Inc. Computer-based system and method for data processing
US6138130A (en) * 1995-12-08 2000-10-24 Inventure Technologies, Inc. System and method for processing data in an electronic spreadsheet in accordance with a data type
US6154566A (en) * 1996-05-15 2000-11-28 Omron Corporation Method and apparatus for determining image similarity and position
EP0880108A1 (fr) * 1997-05-23 1998-11-25 Koninklijke Philips Electronics N.V. Procédé de traitement d'une image incluant une étape de chainage, et appareil d'imagerie médicale incluant des moyens pour mettre en oeuvre ce procédé
US6658145B1 (en) * 1997-12-31 2003-12-02 Cognex Corporation Fast high-accuracy multi-dimensional pattern inspection
US6975764B1 (en) * 1997-11-26 2005-12-13 Cognex Technology And Investment Corporation Fast high-accuracy multi-dimensional pattern inspection
US7016539B1 (en) 1998-07-13 2006-03-21 Cognex Corporation Method for fast, robust, multi-dimensional pattern recognition
WO2001086594A2 (en) * 2000-05-08 2001-11-15 Seatadvisor.Com, Inc. Automated processing of graphical image to make discreet objects pointer-sensitive
US7006694B1 (en) * 2000-10-05 2006-02-28 Coreco Imaging, Inc. System and method for pattern identification
US7149356B2 (en) * 2002-07-10 2006-12-12 Northrop Grumman Corporation System and method for template matching of candidates within a two-dimensional image
US7116823B2 (en) 2002-07-10 2006-10-03 Northrop Grumman Corporation System and method for analyzing a contour of an image by applying a Sobel operator thereto
US7146057B2 (en) * 2002-07-10 2006-12-05 Northrop Grumman Corporation System and method for image analysis using a chaincode
US11208029B2 (en) 2002-07-12 2021-12-28 Yechezkal Evan Spero Adaptive headlight system
US9955551B2 (en) 2002-07-12 2018-04-24 Yechezkal Evan Spero Detector controlled illuminating system
CN1282942C (zh) * 2002-07-26 2006-11-01 松下电工株式会社 用于外表检测的图像处理方法
US7190834B2 (en) 2003-07-22 2007-03-13 Cognex Technology And Investment Corporation Methods for finding and characterizing a deformed pattern in an image
US8081820B2 (en) * 2003-07-22 2011-12-20 Cognex Technology And Investment Corporation Method for partitioning a pattern into optimized sub-patterns
US8437502B1 (en) 2004-09-25 2013-05-07 Cognex Technology And Investment Corporation General pose refinement and tracking tool
JP4558607B2 (ja) * 2005-08-24 2010-10-06 ローレル精機株式会社 硬貨検出装置
US8103085B1 (en) 2007-09-25 2012-01-24 Cognex Corporation System and method for detecting flaws in objects using machine vision
JP2013250768A (ja) * 2012-05-31 2013-12-12 Toshiba Tec Corp 商品認識装置及び商品認識プログラム
US9679224B2 (en) 2013-06-28 2017-06-13 Cognex Corporation Semi-supervised method for training multiple pattern recognition and registration tool models
US9508018B2 (en) * 2014-11-24 2016-11-29 Texas Instruments Incorporated Systems and methods for object detection
JP6333871B2 (ja) * 2016-02-25 2018-05-30 ファナック株式会社 入力画像から検出した対象物を表示する画像処理装置
US10049097B1 (en) * 2017-01-27 2018-08-14 Xerox Corporation Systems and methods for creating multi-layered optical character recognition (OCR) documents

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4783829A (en) * 1983-02-23 1988-11-08 Hitachi, Ltd. Pattern recognition apparatus
DE3515159A1 (de) * 1984-04-27 1985-10-31 Canon K.K., Tokio/Tokyo Bildverarbeitungseinrichtung
IT1190565B (it) * 1986-04-07 1988-02-16 Cselt Centro Studi Lab Telecom Procedimento e dispositivo di codifica di segnali numerizati mediante quantizzazione vettoriale
JPH07107708B2 (ja) * 1986-09-26 1995-11-15 株式会社日立製作所 パタ−ン認識方法
US4959870A (en) * 1987-05-26 1990-09-25 Ricoh Company, Ltd. Character recognition apparatus having means for compressing feature data
JPH07120385B2 (ja) * 1987-07-24 1995-12-20 シャープ株式会社 光学的読取り方法

Also Published As

Publication number Publication date
JPH0363774A (ja) 1991-03-19
US5033099A (en) 1991-07-16

Similar Documents

Publication Publication Date Title
JPH0638274B2 (ja) 画像認識装置および画像認識方法
Preston et al. Basics of cellular logic with some applications in medical image processing
US6366684B1 (en) Image processing method and system involving contour detection steps
US6813373B1 (en) Image segmentation of embedded shapes using constrained morphing
CN109360633B (zh) 医疗影像处理方法及装置、处理设备及存储介质
CN110689548A (zh) 一种医学图像分割方法、装置、设备及可读存储介质
CN109685060A (zh) 图像处理方法和装置
JPH114383A (ja) 連鎖段階を含む画像処理方法及びこの方法を実施する手段を含む医療用撮像装置
CN110648331B (zh) 用于医学图像分割的检测方法、医学图像分割方法及装置
CN111145200B (zh) 结合卷积神经网络与循环神经网络的血管中心线追踪方法
US5550933A (en) Quadrature shape detection using the flow integration transform
CN111340937A (zh) 一种脑肿瘤医学影像三维重建显示交互方法及系统
CN113436173A (zh) 基于边缘感知的腹部多器官分割建模、分割方法及系统
AU2019204365C1 (en) Method and System for Image Segmentation and Identification
Lee et al. Enhancement for automatic extraction of RoIs for bone age assessment based on deep neural networks
CN114596275A (zh) 肺血管分割方法、装置、存储介质及电子设备
CN110533637B (zh) 一种检测对象的方法及装置
CN113780193A (zh) 基于rcnn的牛群目标检测方法及设备
Kapouleas et al. A model based system for the interpretation of MR human brain scans
Xie et al. Pulmonary nodules detection via 3D multi-scale dual path network
CN116894842B (zh) 肿瘤腹腔种植转移病灶图像处理方法及相关装置
CN117274817B (zh) 裂缝自动化识别方法、装置、终端设备及存储介质
JP2619107B2 (ja) 画像認識方法
JP3080097B2 (ja) 平行線図形抽出方法
Neelam et al. FCN Based Deep Learning Architecture for Medical Image Segmentation

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term