JP3183949B2 - パターン認識処理方法 - Google Patents

パターン認識処理方法

Info

Publication number
JP3183949B2
JP3183949B2 JP16156492A JP16156492A JP3183949B2 JP 3183949 B2 JP3183949 B2 JP 3183949B2 JP 16156492 A JP16156492 A JP 16156492A JP 16156492 A JP16156492 A JP 16156492A JP 3183949 B2 JP3183949 B2 JP 3183949B2
Authority
JP
Japan
Prior art keywords
model
graphic
deformation
primitive
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP16156492A
Other languages
English (en)
Other versions
JPH064671A (ja
Inventor
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP16156492A priority Critical patent/JP3183949B2/ja
Publication of JPH064671A publication Critical patent/JPH064671A/ja
Application granted granted Critical
Publication of JP3183949B2 publication Critical patent/JP3183949B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はパターン認識処理分野に
係り、特に手書き文字などのように複雑な変形が起こる
図形(パターン)を認識するために最適なパターン認識
処理方法に関する。
【0002】
【従来の技術】手書き文字などのように複雑な変形が起
こるパターンを正確に認識するためには、変形に強い形
状の解析・記述方式と、対象図形(入力図形)の変形の
程度を定量的に解析する手法が必要である。
【0003】対象図形の変形を定量的に解析するに当た
っては、「モデル図形」の点xと「対象図形」の点x′
とが、ある変換Tによって、 x′=Tx のように関係付けられると考えて解析を進めることは自
然なことである。一般に、手書き文字などの場合、変形
は非剛体・弾性的であるので、Tは非線形であり、一般
的な解析は難しい。さらに、Tを求めるためには、モデ
ル図形と対象図形との間の点の対応を知ることが必要と
なるが、同様な理由で、やはり困難な問題である。
【0004】従来、手書き文字認識においては、変形の
吸収の手段として、変形を解析、記述、評価するという
ことよりも、モーメント特徴や、あるいは、線密度など
を基準とした、「正規化」が前処理として適用されてき
た。変形の「解析、記述、評価」という問題に対して、
動的計画法により、モデル図形と対象図形との間の特徴
点の対応を求め、局所的アフィン変換を用いた変形の漸
近展開の手法が提案されている(例えば、若原、“局所
的Affine変換を用いたオンライン手書き文字認
識,”電子情報通信学会論文誌、vol.J71 −
D,no.2,pp.379−386,1988.)。
さらに、粗から密に局所的アフィン変換を反復すること
による、協調型の画像間のずれの検出法も提案されてい
る(例えば、若原、“局所的Affine変換を用いた
画像間のずれの検出,”電子情報通信学会論文誌、vo
l.J72−D−II,no.12,pp.2070−2
079,1989.)。
【0005】
【発明が解決しようとする課題】上記従来技術において
は、各点で局所的アフィン変換を求め、さらに残差を展
開して行くということから、処理の複雑さは否定できな
い。ここで、点対応の問題と、変換Tの非線形性への対
処として、次のことが考えられる。
【0006】(1)図形を、変形に強い、定性的・大局
的な構造に着目して記述し、やはり同じように記述され
たモデルとの構造的マッチングをとることによって、モ
デルと対象との構成要素(構造記述における単位)との
対応を見つける。そして、構成要素上にいくつかの参照
点を取ることにより、点対応を見つける。 (2)変換Tを、単純な幾何学的変換(座標変換)Tg
と、幾何学的変換では説明の付かない複雑な変動を表す
統計的変換Tsとの組合せとなす。
【0007】まず、(1)に対する具体的な方法として
は、Nishida&Moriによる、準位相的構造と
特異点構造による曲線構造の解析と記述がある(H.N
ishida and S.Mori,“A stru
ctural description of cur
ves by quasitopologicalfe
atures and singuar point
s,”in Proc.IAPR Workshop
on Syntactic Structural P
attern Recognition,Murray
Hill,NJ,pp.310−334,June
1990.)。この方法では、曲線は、プリミティブ系
列と呼ばれる部分曲線と特異点構造により、豊富な特徴
を持つ、少数の構成要素によって記述され、「準位相」
の名が示すとおり、柔軟で、極めて変形に強い記述が可
能である。また、(2)については、甘利や大津らが、
(1)の考え方に基づいて、不変特徴抽出と、特徴空間
の正規化理論を展開しており、理論的基礎が確立されて
いる(甘利、“パターン信号の特徴空間における正規化
理論,”電子通信学会論文誌、vol.49,no.
7,pp.1342−1350 ,1966、及び、大
津、“パターン認識における特徴抽出に関する数理的研
究,”電子技術総合研究所研究報告,第818号,19
81年7月.)。
【0008】本発明の目的は、上記(1)や(2)の考
えをもとに、手書き文字などのような複雑な変形パター
ンの定量的な解析、記述及びそれを利用したパターン認
処理方法を提供することにある。
【0009】
【課題を解決するための手段】本発明は、対象図形を細
線化して曲線構造解析し、大局的な形状構造に着目して
該対象図形の特徴を記述する処理と、前記対象図形の形
状構造記述(形状構造特徴)と同様に記述されたモデル
図形との構造マッチングをとる処理と、前記構造マッチ
ングで整合のとれたモデル図形と対象図形間の構造記述
における構成要素の対応を見つけ、該構成要素上に一つ
あるいは複数の参照点を取って、対象図形とモデル図形
との点対応を検出し、該点対応をもとに、対象図形とモ
デル図形間の変形量を解析する処理と、前記解析結果を
もとに、対象図形とモデル図形との間の変形の要因を定
量化し、変形をその要因ごとの変形量によって記述する
処理とを有することを主要な特徴とする。
【0010】また、本発明は、変形量の記述結果をもと
に、変形をその要因ごとに評価し、該評価結果をもと
に、構造マッチングで整合のとれたモデル図形のクラス
を順序付けすることを特徴とする。
【0011】
【作用】まず、対象図形の特徴を、変形に強い、定性
的、大局的な構造に着目して記述し、やはり同じように
記述されたモデルとの構造的なマッチングをとることに
よって、モデル図形と対象図形の間の構成要素(例えば
プリミティブ系列と特異点)の対応を見つける。そし
て、構成要素上にいくつかの参照点をとることにより、
対象図形とモデル図形の間の点対応を見つけることがで
きる。この点対応をもとに、幾何学的要因と統計的要因
等の観点から、複雑な変形が起こるパターンに対するモ
デル図形から変形(変動)の要因を定量的に解析する。
さらに、変形を要因ごとの変形量によって記述し、評価
する。これにより、柔軟で且つ正確なパターン認識が可
能になる。
【0012】
【実施例】以下、本発明の一実施例について図面により
詳述する。
【0013】図2は本発明を達成するハードウエア構成
図の概略ブロック図である。図2において、画像入力装
置10はスキャナなどからなり、手書き文書などを読み
取る。この読み取られた文書は、黒画素が1、白画素が
0の2値画像情報として画像メモリ20に格納される。
画像処理装置30は、画像メモリ20の画像情報を読み
出して種々の処理を行う。本発明では、後述の図1の処
理を行う。ワークメモリ40は画像処理装置30の作業
用メモリである。ファイルメモリ50は画像処理装置3
0での最終的処理結果や各種の辞書類を格納するのに用
いられる。本発明では、後述の対象図形(文字)の形状
構造/変形量記述51、構造モデル52などがファイル
メモリ50に格納される。
【0014】図1は、本発明の一実施例の全体の処理手
順を示す。ステップ100、110、120の処理は特
に目新しいことではないので、以下ではステップ130
以降の処理について説明する。なお、ステップ120の
細線化処理は輪郭追跡処理に置き換えてもよい。
【0015】形状構造の解析と特徴記述(ステップ13
0) 文字画像は細線化または輪郭追跡アルゴリズムによって
処理され、切片線形近似された曲線として、無向グラフ
の形で表される。曲線形状の構造解析と特徴記述方法の
詳細については、例えば特願平1−245507号に記
載されているが、以下に簡単に説明する。
【0016】(1)特異点分解 次数が3以上である点を「特異点」と呼ぶ。文字画像に
細線化を適用した際には、次数がnの特異点は、その特
異点の周りでの線素の組の方向変化のなめらかさによっ
て、「n/2]個の点に分解される。なお、「r」は、
r以上の最小の整数である。各点に特異点分解を適用す
ることによって、曲線は、それぞれが、単純弧か、ある
いは、単純閉曲線であるような成分(ストローク)に分
解される。たとえば、図3(a)において、点pは次数
3の特異点であり、c1とc3とに分解される。その結
果、図3(a)の曲線は、図3(b)に示すように、2
つのストローク、(c0,c1,c2)と(c3,c
4)に分解される。
【0017】(2)曲線のプリミティブへの分解 xy単調曲線とは、その曲線を辿ったときに、x、y座
標値が、常に、非増加であるか、または、非減少かであ
るような曲線である。あるxy単調曲線の2つの端点
を、それぞれ、P(x0,y0)、Q(x1,y1)とす
る。ここで、x0≠x1ならば、x0<x1であり、もしx
0=x1ならば、y0<y1とする。Pをその曲線のhea
d、Qをtailとよぶ。headとtailのx、y
座標の大小関係により、xy単調曲線は次の4種類に分
類される。 (1)x0<x1かつy0=y1(以下、‘−’と記す) (2)x0<x1かつy0<y1(以下、‘/’と記す) (3)x0=x1かつy0<y1(以下、‘|’と記す) (4)x0<x1かつy0>y1(以下、‘\’と記す) これら4種類のxy単調曲線を曲線のプリミティブとす
る。例えば、図3(c)に示すように、ストローク(c
0,c1,c2)はプリミティブA0(‘/’),A1
(‘\’),A2(‘/’),A3(‘\’)に分解さ
れ、ストローク(c3,c4)は、一つのプリミティブ
A4(‘/’)から成る。
【0018】(3)プリミティブの連結 4種類のプリミティブの連結規則を導入する。2つのプ
リミティブaとbの連結を、
【数1】 のような記号で表すとする。ここで、jは、プリミティ
ブaとbの連結によって作られる凸の方向を示し、j=
0,1,2,3は、それぞれ、下、左、上、右向きに対
応する。aからbへの矢印は、図4のように、aとb
が、連結Pの周りで、右手系をなすように配置されてい
ることを意味する。例えば、図3(c)のプリミティブ
に対して、次のような連結が得られる。
【数2】
【0019】(4)プリミティブ系列 プリミティブの連結をつなぐことにより、次のような列
が生成される。
【数3】
【0020】例えば、図5(a)に示すように、図3
(b)のストローク(c0,c1,c2)において、2
つのプリミティブ系列
【数4】 が生成される。
【0021】プリミティブ系列に対して、次のように、
ラベル(PS−label)<ps,idr>を与え
る。
【数5】
【0022】ここで、cornor( )は、プリミテ
ィブaのタイプが、bと同じときに値1をとり、それ以
外の時には値0を取る関数である。idrは、プリミテ
ィブ系列における最初の凸方向を示し、psは、方向の
差分を足し合わせることによって、回転数を表す。さら
に、プリミティブ系列の端点で、先頭のプリミティブに
あるものをh−pointとよび、最後のプリミティブ
にあるものをt−pointとよぶ。例えば、図5
(a)で、p1とp2は、それぞれ、E0とE1のh−p
ointで、p0とp3はt−pointである。
【0023】プリミティブ系列が無限巡回列であるとき
は、ラベル<0,0>をあたえる(例えば、円)。も
し、列の長さが1の時には、‘−’にラベル<1,0>
を、‘/’に<1,1>、‘\’に<1,2>、そし
て、‘\’に<1,3>を与える。この場合には、h−
pointはプリミティブのhead、t−point
はプリミティブのtailと定義する。
【0024】上記の規則により、数4のプリミティブ系
列E0とE1に対し、それぞれ、ラベル<2,1>,<
3,3>が与えられる。
【0025】(5)プリミティブ系列の接続 図4のプリミティブ系列E0とE1は、それらの先頭のプ
リミティブA1を共有している。このように、プリミテ
ィブ系列の接続には、先頭のプリミティブを共有する場
合(h接続)と、最後のプリミティブを共有する場合
(t接続)の2つの場合がある。例えば、E0とE1
は、h接続している。これを、
【数6】 のように記す。t接続に対しては、上の式の‘h’を
‘t’に起き換える。
【0026】(6)特異点の構造 特異点の記述を与える。図5(b)に示すように、特異
点上の2つのプリミティブ系列の隣接構造には、X型
(交差)、K型(接触)、そして、T型(分岐)の3種
類がある。
【0027】特異点の構造は、その特異点上でのプリミ
ティブ系列の隣接構造により、
【数7】 のように記述される。ここで、iとjは特異点上にある
プリミティブ系列、τ∈{X,T,K}は隣接構造の種
類、p,q∈{hp,h,o,t,tp}は、プリミティ
ブ系列iとj上での特異点の位置を示す。(hp:h−
point、h:先頭のプリミティブ、t:末尾のプリ
ミティブ、tp:t−point、o:その他、ただ
し、hとtは、ラベル<1,*>をもつプリミティブ系
列に対しては定義されない)
【0028】たとえば、図3(a)の特異点pはT型
で、図3(c)に示すようにA0上にあり、かつ、A4
のheadである。したがって、
【数8】 のように記述される。ここで、E2は、1つのプリミテ
ィブA4から成るプリミティブ系列である。
【0029】(8)文字形状構造の記述 以上により、図3(a)の形状は次のように記述され
る。
【数9】
【0030】構成要素の属性パラメータ計算(ステップ
140) 上述した形状の構造的解析と記述は、形の定性的、大局
的、離散的性質を扱うものである。形状記述をより精密
にするために、形状の構造要素であるプリミティブ系列
と特異点は、形の定量的、局所的、連速的性質を記述す
る、いくつかの属性パラメータを持つことができる。こ
れらのパラメータは、スケールのみに関して正規化され
た座標系で計算される。スケールの正規化は、文字のb
ounding box(図形を囲む最小の直立長方
形)に関して行なわれ、縦横比を変えずに、bound
ing boxの長い方の辺が単位長(1)になるよう
に、スケールを変える。bounding boxの中
心を(0.5,0.5)とする。具体的には、次のよう
な属性パラメータを計算する。
【0031】(1)ラベル<ps(≧2),*>をもつ
プリミティブ系列−(cx,cy,dx,dy,xhp
hp,xtp,ytp):(cx,cy)はプリミティブ系
列のbounding boxの中心座標、dxとdy
は、それぞれ、bounding boxの幅と高さ、
(xhp,yhp)はh−pointの位置、(xtp
tp)はt−pointの位置。
【0032】(2)ラベル<1,*>をもつプリミティ
ブ系列−(cx,cy,a,b,fx,fy):(c
x,cy)はプリミティブ系列のbounding b
oxの中心座標。 a=l・cos(2θ),b=l・sin(2θ) ここで、lは弦(プリミティブの2端点を結ぶ線分)の
長さで、θは弦の角度である。そして、P(xp,yp
をプリミティブ系列上の弦からの最遠点、(xF,yF
をPから弦へおろした垂線の足とする。(fx、Fy)
は、 fx=xp−xF,fy=yp−yF のように定義される。
【0033】(3)ラベル<0,0>をもつプリミティ
ブ系列−(cx,cy,dx,dy):cx、cy、d
x、そして、dyは(1)と同じ意味である。
【0034】(4)特異点−(x,y):(x,y)は
特異点の座標。
【0035】構造マッチング(ステップ150) (1)構造モデル 直感的に言うと、構造モデルにおける「クラス」とは、
互いに連続変形によって変換することができる形の集合
である。形式的には、クラスIは次式で与えられる。
【数10】
【0036】もし、mp(i)=0、または、ms
(j)=0ならば、プリミティブ系列i、または、特異
点jは付加的なもので、あってもなくてもよい。もし、
mp(i)=1ならば、プリミティブ系列iは必須で、
必ず存在しなければならない。もし、ms(j)=1な
らば、その点を形成するプリミティブ系列が存在するな
らば、特異点jは必ず存在しなければならない。
【0037】さらに、それぞれのプリミティブ系列と特
異点は、前に述べたような、属性パラメータの統計量
(平均と標準偏差)をもつ。例として、文字画像に細線
化を施す場合の、モデルのいくつかのクラスの例を図
6、図7及び図8に示す。図6は文字「R」、図7は数
字「2」、図8は数字「2」の変形例をそれぞれ意味す
る。
【0038】(2)マッチング オブジェクト(入力図形、対象図形)とモデルのマッチ
ングについて述べる。オブジェクトOの記述も、モデル
のクラスと同様に、次のように与えられる。
【数11】 ここで、記号の意味は、クラスIの場合と同様である。
【0039】オブジェクトとモデルの構造的マッチング
は、以下のように定式化される。もし、以下に挙げる条
件を満足するような全射の組(f,g)
【数12】 が存在するとき、オブジェクトOは、クラスIと整合し
たという。なお、以下では、便宜上、上付きの(I)や
(O)は例えばNp(I)、Np(O)のように並べて表記す
る。
【0040】(1)もし、f(i)=f(j)≠φ
(i,j∈{1,2,…,Np(I)})ならば、i=
jである。
【0041】(2)もし、クラスのプリミティブ系列i
が必須ならば、オブジェクトにそれに対応する要素が存
在しなければならない。もし、mp(I)(i)=1(i
∈{1,2,…,Np(I)})ならば、f(i)=j
であるようなj∈{1,2,…,Np(O)}が存在す
る。
【0042】(3)もし、クラスのプリミティブ系列i
に対して、対応する要素がオブジェクトにあるならば、
f(i)のPS−ラベルはπ(I)(i)の要素である。
もし、f(j)≠φ(i,j∈{1,2,…,Np
(I)})ならば、π(O)(f(i))∈π(I)(i)
である。
【0043】(4)クラスのプリミティブ系列の接続
は、対応fのもとで、オブジェクトにおいても保存され
る。
【数13】
【0044】(5)クラスIのストロークとオブジェク
トOのストロークは、一対一対応する。もし、f(m)
≠φ、かつ、f(n)≠φならば、st(I)(n)になる
のは、st(O)(f(m))=st(O)(f(n))のとき
であり、また、そのときだけに限る。
【0045】(6)もし、g(i)=g(j)≠φ(i,
j∈{1,2,…,Ns(I)})ならば、i=jであ
る。
【0046】(7)もし、クラスの特異点iが必須であ
り、かつ、特異点iを形成するあるプリミティブ系列に
対して、対応する要素がオブジェクトにあるならば、対
応する特異点がオブジェクトに存在しなければならな
い。もし、ms(I)(i)=1(i∈{1,2,…,
Ns(I)})、かつ、ある
【数14】 に対して、f(m)≠φ、かつ、f(n)≠φならば、g
(i)=jであるようなj∈{1,2,…,Ns(O)}
が存在する。
【0047】(8)もし、クラスの特異点iに対して、
オブジェクトに対応する要素が存在するならば、g
(i)の構造は、σ(I)(i)の要素でなければならな
い。もし、g(j)≠φ(i∈{1,2,…,Ns
(I)})ならば、
【数15】 であるような
【数16】 が存在する。
【0048】写像fは、制約(1)から(5)に基づ
く、整合ラベリング(例えば、R.M.Haralic
k and L.G. Shapiro,“The c
onsistent labeling proble
m:part 1,”IEEETrans.Patte
rn Analysis and MachineIn
telligence,vol.PAMI−1,pp.
173 −184,April 1979.)のアルゴ
リズムを用いて見つけることができる。もし、fが見つ
かったならば、写像fのもとで、制約(6)から(8)
に基づいて、gを見つける。例えば、図9の曲線の構造
記述は図10のようになるが、このオブジェクトと、図
6のクラス(Model−R)のマッチングでは、fと
gはつぎのようになる。 f(1)=2,f(2)=1, g(1)=φ,g(2)=2,g(3)=1.
【0049】構文的、または、構造的パターン認識にお
いては、計算の複雑性が重大な問題である。しかし、ス
テップ130の記述方式では、形状が大局的特徴によっ
て記述されるので、要素の数はそれほど多くならない。
たとえば、数字の場合、プリミティブ系列や特異点の数
は高々4である。したがって、計算の複雑性は気にする
こはない。
【0050】変形量の解析(ステップ160) ステップ130,140の処理による曲線の構造記述
は、豊富な特徴を持った少数の要素により、文字形状を
柔軟、かつ、コンパクトに記述し、ステップ150の構
造的なマッチングは、変形の大きいオブジェクトに対し
ても、柔軟にクラスとの構成要素の対応を求めることが
できる。ここで、各々の構成要素(プリミティブ系列と
特異点)には、いくつかの属性パラメータが計算されて
いるので、これを利用して図形上にいくつかの参照点を
選ぶことができる。クラス(モデル図形)での参照点の
座標は、属性パラメータの統計量(平均値)から計算す
る。構造的マッチングによって見出される構成要素間の
対応(f,g)により、モデル図形(クラス)と対象図
形(オブジェクト)の間の点対応を容易に求めることが
できる。
【0051】ここで、モデル図形での参照点x
【数17】 と、対象図形での参照点x′
【数18】 とは、幾何学的変換Tgと、統計学的変換Tsによっ
て,
【数19】 または、TgとTsの逆変換を、それぞれ、Tg′とT
s′として、
【数20】 のように関係付けられていると考えることができる。
【0052】ここで、具体的に、A=(aij)を2次の
正規行列
【数21】 を2次元ベクトルとして、Tgをアフィン変換
【数22】 として考え、そして、ex(X)とey(X)を、平均0、
分散がそれぞれ、σx(x,y)とσy(x,y)である
ような確率変数
【数23】 として、
【数24】 というモデルを考えることにする。したがって、xと
x′の関係は、
【数25】 と陽に表すことができる。
【0053】以下では、幾何学的変換を表す行列Aとベ
クトルbの具体的な計算方法と、パターン変換の幾何学
的要因の評価方法、さらにパターン変形の統計学要因の
評価方法を説明する。
【0054】(1)幾何学的解析(ステップ161) 幾何学的変換を表す行列Aとベクトルbの具体的な計算
方法と、パターン変形の幾何学的要因の評価方法を説明
する。
【0055】a.アフィン変換 幾何学的変換を表す行列Aとベクトルbの具体的な計算
方法を説明する。いま、
【数26】 及び、
【数27】 を、それぞれモデル図形と対象図形での参照点の集合と
する。ここで、参照点としては、プリミティブ系列上の
いくつかの点と、特異点が取られる。
【0056】プリミティブ系列上の特徴点は、そのラベ
ルに応じて、つぎのように選ばれる。 (1)PS−ラベル<PS(≧2),*>−h−poi
nt、t−point、bounding box(直
立長方形)の各辺の中点(計6点) (2)PS−ラベル<1,*>−h−point、t−
point、弦からの最遠点(計3点) (3)PS−ラベル<0,0>−bounding b
oxの各辺の中点(計4点)
【0057】モデルと対象図形の間の参照点の対応は、
構造的マッチングにより決められる、プリミティブ系列
と特異点の対応(f,g)から容易に求められる。ここ
で、xi(i=1,2,…,N)がxi′に対応すると仮
定する。最小二乗法により、
【数28】 となるAとbを求める。数28をaij(i,j=1,
2)、bx、byで偏微分することにより、次の連立線形
方程式を得る。
【数29】 この連立方程式を解くことにより、Aとbが求められ
る。
【0058】b.幾何学的変形量 行列Aとベクトルbを解析することにより、パターン変
形の幾何学的要因を定量化することを考える。アフィン
変換は、次の8つの基本変換に分解することができる。
【数30】
【0059】明らかに、b=T1(bx)+T2(by)で
ある。正方行列Aは、直交行列Qと、半正定値対称行列
Sにより、 A=QS の形に分解できる(例えば、B.K.P.Horn,
H.M.Hilden,and S.Negahdar
iour,“Closed−form solutio
n of absolute orientation
using orthonormal matric
es,”Journal of Optical So
ciety of America ,Vol.5 ,
No.7,pp.1127 −1135 .July
1988.)。さらに、Sは、LDU分解により、対称
性から、
【数31】 の形に分解することができる。したがって、変換行列A
は、
【数32】 とおくことにより、
【数33】 で表わされる。
【0060】先に述べたように、スケールはbound
ing boxによって正規化されているので、T7
パラメータμは1であることができる。ここで、θを回
転角度、γをせん断パラメータ、λxをxスケールパラ
メータ、λyをyスケールパラメータとよぶことにす
る。変形解析の場合、図形の置かれている場所は問題で
ないので、bは特に意味を持たない。したがって、4つ
のパラメータ(θ、γ、λx,λy)により幾何学的変換
を記述することができる。これは、対象図形が、モデル
図形にθの回転、γのせん断、x方向へのλx倍の拡
大、y方向へのλy倍拡大を施すことによって得られる
ことを意味している。なお、γの物理学的意味は図11
に示すとおりで、γ>0ならば図11(a)のように変
形し、γ<0ならば図11(b)のように変形する。
【0061】(2)統計的解析(ステップ162) パターン変形の統計的要因の定量化を考える。先の数2
5より、
【数34】 を得る。これは、モデル図形の参照点xと、それに対応
する対応図形の参照点をモデル図形の座標系へ変換した
点(正規化座標点;右辺第1項)とのずれを表し、統計
的変動を示すものである。ここでは、構造的モデルのク
ラスの要構成要素(プリミティブ系列と特異点)の属性
パラメータの統計量(平均値と標準偏差)を使って、モ
デル図形と対象図形の統計的な変動(変形)を定量化す
る。
【0062】いま、(V1,V2,…,VN)を、全ての
構成要素の属性パラメータを並べたベクトルとする。た
だし、Viは平均μi、標準偏差σiの確率変数で、Vi
j(i≠j)は独立であるとする。対象図形での属性
パラメータViの観測値をvi′とし、それを正規化座標
へ変換して得られる値をviとする。具体的には、も
し、Viが位置を表すパラメータ(プリミティブ系列の
中心、h−point、t−point、特異点)のと
きには、点x′に対する変換
【数35】 を応用すればよく、また、ベクトル(プリミティブ系列
のbounding boxの幅と高さ、長さ1のプリ
ミティブ系列での弦から最遠点へのベクトル)であれ
ば、ベクトルδx′に対する変換
【数36】 を応用すればよい。長さ1のプリミティブ系列でのパラ
メータaとbに対しては、他の計算が必要となるが、容
易にできるのでここでは省略する。
【0063】パターン変換の統計的要因を、マハラノビ
ス距離を使って、
【数37】 で評価する。DNは、自由度NのXの二乗分布に従う。
Nは、パラメータの数Nに依存するので、かわりに、
Fisherの近似
【数38】 により、Nに依存しない量に変換したものを使ってもよ
い。DN=dNに対して、
【数39】 のとき、dは、
【数40】 によって、近似的にDN>dNとなる確率を与える。
【0064】変形量の記述(ステップ170) これまでの解析をまとめると、あるオブジェクトが構造
モデルのあるクラスと構造的に整合したときの、モデル
からの変形量を、 (θ,γ,λX,λY,D) で記述することができる。ただし、θを回転角度、γを
せん断パラメータ、λxをxスケールパラメータ、λy
をyスケールパラメータ、Dは数37と数38から求め
られる統計的変動量である。そして、これらの値から、
変形量(変動量)を評価することができる。変形が小さ
い図形では、θ,γは0に近い値、λX,λYは1に新い
値を取り、また、Dは、負の絶対値が大きい値を取る。
変形が大きい図形では、θ,γは絶対値が大きい値(0
から遠い値)、λX,λYは1から遠い値を取り、また、
Dは、正の絶対値が大きい値を取る。これらのことか
ら、変形の大きさと変形の要因を定量的に評価すること
ができる。
【0065】認識(ステップ180) (1)構造モデルに基づくモデルベースのパターン正規
化 従来のパターン認識、特に、手書き文字認識において
は、パターンの正規化が「前処理」として行なわれてき
た。前処理においては、使える情報が限られているた
め、このような正規化は様々な副作用があることが知ら
れている。本発明においては、対象図形の構造記述と、
モデルの構造記述を基に、形状の大局的、定性的情報に
基づいて、まず、大雑把にマッチングをとり、その認識
結果に基づいて、対象図形を正規化することができる。
具体的には、その認識結果に基づいて、対象図形を正規
化することができる。具体的には、まず、ステップ13
0,140の処理で対象図形の構造記述をもとめ、ステ
ップ150のように、その構造記述と構造モデルとのマ
ッチングを取る。そして、この構造マッチングで求めら
れた、対象図形とモデルとの間の構成要素の対応関係を
もとに、数25の行列Aとベクトルbを、ステップ16
1,162のような方法で求めて、対象図形上の各点
x′を数35に変換することによって、パターンの正規
化ができる。
【0066】(2)最適なマッチングの決定 ある一つのクラスとオブジェクトの構造マッチングにお
いては、プリミティブ系列と特異点の対応(f,g)が
必ずしも一通りに決まるとは限らない。そのような場合
には、Dを最小とするような対応を、そのクラスとオブ
ジェクトのマッチングとして出力すればよい。
【0067】(3)整合したクラスの順位付け 手書き文字認識などの実際の場面では、一つのオブジェ
クトが複数のクラスに構造的に整合することがあるの
で、定量的情報を使って候補となっているクラスを順位
付けすることが必要となる。実際の判断基準の一つの例
としては、つぎのようなものが考えられる。 (a)まず、θ,γ,λX,λYの許される値の範囲に制
限を付けておき、あるクラスに対して、これら4つのう
ち、ひとつでも制限範囲を越えるものがあったならば、
そのクラスを候補から外す。 (b)残ったものについて、Dの小さい順番に順序づけ
する。 (c)もし、第一候補のDが十分小さく、かつ、第一候
補と第二候補のDの差が十分大きければ、第一候補を認
識結果として出力する。さもなければ、「リジェクト」
を出力する。
【0068】図12に処理の具体例を示す。(a)は認
識対象入力文字「H」のデータで、201は原画像、2
02は細線化結果、203は構造解析結果、204は整
合したクラスのリストを示している。(b)と(c)は
モデルHとIで、(a)の入力文字に整合したクラスで
ある。なお、クラスについては、オブジェクトとの構成
要素の対応(f,g)、その対応のもとでの(θ,γ,
λX,λY,D)の値と正規化された図形、そして、構造
のモデルを示している。ただし、θの単位は「度」、ク
ラスの記述において、‘*’のついた要素は、付加的要
素(mpまたはmsの値が0)であるものであり、ま
た、PS−ラベル<ps,idr>を整数10×ps+
idrで示している。
【0069】図12(a)の入力文字「H」は、同図
(b)及び(c)の2つのクラス「H」と「I」に整合
しているが、どちらも正のせん断が加わっており、
「I」には横方向への拡大と縦方向への縮小が加わって
いる。一方、回転は、「H」の方時計周りに8度である
のに対し、「I」の方は反時計周りに58度である。し
たがって、θの許容範囲を例えば−20≦θ≦20とす
ることにより、クラス「I」が除外され、クラス「H」
が候補として残ることになる。
【0070】
【発明の効果】(1)対象図形とモデル図形との点対応
を構造記述を利用して簡単に求めることができ、モデル
図形と対象図形の間の変形を、単純な幾何学的変換と統
計的変換に分けて解析することにより、簡単な処理によ
る変形解析が可能となる。また、変形の要因を単純な要
因に分けて、定量的に記述することが可能である。
【0071】(2)認識に際し、構造的情報と定量的な
変形量(変動量)の両方の情報を利用することによっ
て、柔軟で、しかも、ロバストなパターン認識が可能と
なる。さらに、構造的情報だけでは足りない情報を変形
量で補うことにより、正確な認識が可能となる。
【0072】形状の構造的情報の利用により、対象特有
な情報を利用した正規化が可能となり、少ない情報を用
いた「前処理」としての正規化の副作用を防ぐことがで
きる。
【図面の簡単な説明】
【図1】本発明の処理手順の一例を示す図である。
【図2】図1の処理を実行するハードウエア構成例の概
略ブロック図である。
【図3】特異点の分解と曲線のプリミティブの分解を説
明する図である。
【図4】プリミティブの結合を説明する図である。
【図5】プリミティブ系列の接続と特異点の構造を説明
する図である。
【図6】構造モデルのクラス「R」の一例である。
【図7】構造モデルのクラス「2」の一例である。
【図8】構造モデルのクラス「2」の別の例である。
【図9】細線化された文字画像の一例である。
【図10】図9の例の構造記述である。
【図11】パターン変形のセン断パラメータの意味を説
明する図である。
【図12】処理の具体例である。
【符号の説明】
10 画像入力装置 20 画像メモリ 30 画像処理装置 40 ワークメモリ 50 ファイルメモリ 51 形状構造/変形量記述 52 構造モデル
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭57−159385(JP,A) 特開 昭62−175886(JP,A) 特開 平3−108079(JP,A) 特開 平3−164880(JP,A) 特開 昭51−57143(JP,A) 特開 昭62−130482(JP,A) 特開 昭63−208182(JP,A) 特開 平4−256087(JP,A) 特開 平4−199387(JP,A) 特開 平4−199388(JP,A) 特開 平4−205581(JP,A) 特開 平4−205583(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 - 7/60 G06K 9/46 G06K 9/68

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書画像を入力し,該入力された文書画
    像の文字パターン(以下、図形)を認識処理する画像処
    理装置におけるパターン認識処理方法であって、画像処理装置は、 対象図形を細線化し、該細線化パターンを曲線構造解析
    して、該対象図形の大局的な形状構造特徴を抽出し、 前記対象図形の形状構造特徴と、あらかじめ記憶手段さ
    れたモデル図形の形状構造特徴との構造マッチングを実
    施し、 前記構造マッチングで整合のとれたモデル図形と対象図
    形間の形状構造特徴における構成要素の対応を見つけ、
    該構成要素上に一つあるいは複数の参照点を取って、対
    象図形とモデル図形との点対応を検出し、該点対応をも
    とに、対象図形とモデル図形間の変形量を算出し、 前記算出された変形量をもとに、前記構造マッチングで
    整合のとれたモデル図形のクラスを順序付けする、 ことを特徴とするパターン認識処理方法。
  2. 【請求項2】 前記変形量をもとに、対象図形とモデル
    図形との間の変形をその要因ごとに評価し、該評価結果
    をもとに、構造マッチングで整合のとれたモデル図形
    クラスを順序付けすることを特徴とする請求項1記載の
    パターン認識処理方法。
JP16156492A 1992-06-22 1992-06-22 パターン認識処理方法 Expired - Lifetime JP3183949B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16156492A JP3183949B2 (ja) 1992-06-22 1992-06-22 パターン認識処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16156492A JP3183949B2 (ja) 1992-06-22 1992-06-22 パターン認識処理方法

Publications (2)

Publication Number Publication Date
JPH064671A JPH064671A (ja) 1994-01-14
JP3183949B2 true JP3183949B2 (ja) 2001-07-09

Family

ID=15737515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16156492A Expired - Lifetime JP3183949B2 (ja) 1992-06-22 1992-06-22 パターン認識処理方法

Country Status (1)

Country Link
JP (1) JP3183949B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002298141A (ja) 2001-03-29 2002-10-11 Nec Corp パターン照合装置とそのパターン照合方法、及びパターン照合プログラム
JP4543675B2 (ja) * 2003-12-22 2010-09-15 パナソニック電工株式会社 文字・図形の認識方法
JP5042562B2 (ja) 2006-08-22 2012-10-03 株式会社リコー 画像処理装置、手書き情報認識方法、手書き情報認識プログラム

Also Published As

Publication number Publication date
JPH064671A (ja) 1994-01-14

Similar Documents

Publication Publication Date Title
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
JP3218004B2 (ja) 試験署名検証方法
CN104700087B (zh) 可见光与近红外人脸图像的相互转换方法
CN111160343A (zh) 一种基于Self-Attention的离线数学公式符号识别方法
JP3815704B2 (ja) 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法
JP6612822B2 (ja) モデルを修正するためのシステムおよび方法
CN102341813A (zh) 匹配图像的系统和方法
JP2006523345A (ja) マルチメディアデータに索引付けをし、そして検索するための形状マッチング方法
MX2007010180A (es) Importacion inteligente de informacion de la interfaz de usuario de aplicacion del exterior utilizando inteligencia artificial.
US9256802B2 (en) Object or shape information representation method
US5255354A (en) Comparison of image shapes based on near neighbor data
JPH11232306A (ja) ドキュメント突合せ方法およびシステム
JP3183949B2 (ja) パターン認識処理方法
Anami et al. Combined Hu moments, orientation knowledge, and grid intersections feature based identification of Bharatanatyam mudra images
JP4543675B2 (ja) 文字・図形の認識方法
CN116524403A (zh) 一种基于注意力增强多模态特征的视频拷贝检测方法
Ramel et al. Automatic reading of handwritten chemical formulas from a structural representation of the image
JP4525526B2 (ja) パターンマッチング方法及び装置
JP3753880B2 (ja) 図形分類方法、図形検索方法、図形分類検索システム及び記録媒体
Koutaki et al. Fast and high accuracy pattern matching using multi-stage refining eigen template
JP3278247B2 (ja) 文字認識方法
Delalandre et al. Performance evaluation of symbol recognition and spotting systems: An overview
Bogacz et al. Recovering and Visualizing Deformation in 3D Aegean Sealings.
Körber Improving Camera-based Document Analysis with Deep Learning
Srivastava et al. (Retracted) Robust face recognition using multimodal data and transfer learning

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080427

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090427

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090427

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100427

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100427

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110427

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120427

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 12