JP3183949B2 - パターン認識処理方法 - Google Patents
パターン認識処理方法Info
- Publication number
- JP3183949B2 JP3183949B2 JP16156492A JP16156492A JP3183949B2 JP 3183949 B2 JP3183949 B2 JP 3183949B2 JP 16156492 A JP16156492 A JP 16156492A JP 16156492 A JP16156492 A JP 16156492A JP 3183949 B2 JP3183949 B2 JP 3183949B2
- Authority
- JP
- Japan
- Prior art keywords
- model
- graphic
- deformation
- primitive
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
係り、特に手書き文字などのように複雑な変形が起こる
図形(パターン)を認識するために最適なパターン認識
処理方法に関する。
こるパターンを正確に認識するためには、変形に強い形
状の解析・記述方式と、対象図形(入力図形)の変形の
程度を定量的に解析する手法が必要である。
っては、「モデル図形」の点xと「対象図形」の点x′
とが、ある変換Tによって、 x′=Tx のように関係付けられると考えて解析を進めることは自
然なことである。一般に、手書き文字などの場合、変形
は非剛体・弾性的であるので、Tは非線形であり、一般
的な解析は難しい。さらに、Tを求めるためには、モデ
ル図形と対象図形との間の点の対応を知ることが必要と
なるが、同様な理由で、やはり困難な問題である。
吸収の手段として、変形を解析、記述、評価するという
ことよりも、モーメント特徴や、あるいは、線密度など
を基準とした、「正規化」が前処理として適用されてき
た。変形の「解析、記述、評価」という問題に対して、
動的計画法により、モデル図形と対象図形との間の特徴
点の対応を求め、局所的アフィン変換を用いた変形の漸
近展開の手法が提案されている(例えば、若原、“局所
的Affine変換を用いたオンライン手書き文字認
識,”電子情報通信学会論文誌、vol.J71 −
D,no.2,pp.379−386,1988.)。
さらに、粗から密に局所的アフィン変換を反復すること
による、協調型の画像間のずれの検出法も提案されてい
る(例えば、若原、“局所的Affine変換を用いた
画像間のずれの検出,”電子情報通信学会論文誌、vo
l.J72−D−II,no.12,pp.2070−2
079,1989.)。
は、各点で局所的アフィン変換を求め、さらに残差を展
開して行くということから、処理の複雑さは否定できな
い。ここで、点対応の問題と、変換Tの非線形性への対
処として、次のことが考えられる。
的な構造に着目して記述し、やはり同じように記述され
たモデルとの構造的マッチングをとることによって、モ
デルと対象との構成要素(構造記述における単位)との
対応を見つける。そして、構成要素上にいくつかの参照
点を取ることにより、点対応を見つける。 (2)変換Tを、単純な幾何学的変換(座標変換)Tg
と、幾何学的変換では説明の付かない複雑な変動を表す
統計的変換Tsとの組合せとなす。
は、Nishida&Moriによる、準位相的構造と
特異点構造による曲線構造の解析と記述がある(H.N
ishida and S.Mori,“A stru
ctural description of cur
ves by quasitopologicalfe
atures and singuar point
s,”in Proc.IAPR Workshop
on Syntactic Structural P
attern Recognition,Murray
Hill,NJ,pp.310−334,June
1990.)。この方法では、曲線は、プリミティブ系
列と呼ばれる部分曲線と特異点構造により、豊富な特徴
を持つ、少数の構成要素によって記述され、「準位相」
の名が示すとおり、柔軟で、極めて変形に強い記述が可
能である。また、(2)については、甘利や大津らが、
(1)の考え方に基づいて、不変特徴抽出と、特徴空間
の正規化理論を展開しており、理論的基礎が確立されて
いる(甘利、“パターン信号の特徴空間における正規化
理論,”電子通信学会論文誌、vol.49,no.
7,pp.1342−1350 ,1966、及び、大
津、“パターン認識における特徴抽出に関する数理的研
究,”電子技術総合研究所研究報告,第818号,19
81年7月.)。
えをもとに、手書き文字などのような複雑な変形パター
ンの定量的な解析、記述及びそれを利用したパターン認
識処理方法を提供することにある。
線化して曲線構造解析し、大局的な形状構造に着目して
該対象図形の特徴を記述する処理と、前記対象図形の形
状構造記述(形状構造特徴)と同様に記述されたモデル
図形との構造マッチングをとる処理と、前記構造マッチ
ングで整合のとれたモデル図形と対象図形間の構造記述
における構成要素の対応を見つけ、該構成要素上に一つ
あるいは複数の参照点を取って、対象図形とモデル図形
との点対応を検出し、該点対応をもとに、対象図形とモ
デル図形間の変形量を解析する処理と、前記解析結果を
もとに、対象図形とモデル図形との間の変形の要因を定
量化し、変形をその要因ごとの変形量によって記述する
処理とを有することを主要な特徴とする。
に、変形をその要因ごとに評価し、該評価結果をもと
に、構造マッチングで整合のとれたモデル図形のクラス
を順序付けすることを特徴とする。
的、大局的な構造に着目して記述し、やはり同じように
記述されたモデルとの構造的なマッチングをとることに
よって、モデル図形と対象図形の間の構成要素(例えば
プリミティブ系列と特異点)の対応を見つける。そし
て、構成要素上にいくつかの参照点をとることにより、
対象図形とモデル図形の間の点対応を見つけることがで
きる。この点対応をもとに、幾何学的要因と統計的要因
等の観点から、複雑な変形が起こるパターンに対するモ
デル図形から変形(変動)の要因を定量的に解析する。
さらに、変形を要因ごとの変形量によって記述し、評価
する。これにより、柔軟で且つ正確なパターン認識が可
能になる。
詳述する。
図の概略ブロック図である。図2において、画像入力装
置10はスキャナなどからなり、手書き文書などを読み
取る。この読み取られた文書は、黒画素が1、白画素が
0の2値画像情報として画像メモリ20に格納される。
画像処理装置30は、画像メモリ20の画像情報を読み
出して種々の処理を行う。本発明では、後述の図1の処
理を行う。ワークメモリ40は画像処理装置30の作業
用メモリである。ファイルメモリ50は画像処理装置3
0での最終的処理結果や各種の辞書類を格納するのに用
いられる。本発明では、後述の対象図形(文字)の形状
構造/変形量記述51、構造モデル52などがファイル
メモリ50に格納される。
順を示す。ステップ100、110、120の処理は特
に目新しいことではないので、以下ではステップ130
以降の処理について説明する。なお、ステップ120の
細線化処理は輪郭追跡処理に置き換えてもよい。
0) 文字画像は細線化または輪郭追跡アルゴリズムによって
処理され、切片線形近似された曲線として、無向グラフ
の形で表される。曲線形状の構造解析と特徴記述方法の
詳細については、例えば特願平1−245507号に記
載されているが、以下に簡単に説明する。
細線化を適用した際には、次数がnの特異点は、その特
異点の周りでの線素の組の方向変化のなめらかさによっ
て、「n/2]個の点に分解される。なお、「r」は、
r以上の最小の整数である。各点に特異点分解を適用す
ることによって、曲線は、それぞれが、単純弧か、ある
いは、単純閉曲線であるような成分(ストローク)に分
解される。たとえば、図3(a)において、点pは次数
3の特異点であり、c1とc3とに分解される。その結
果、図3(a)の曲線は、図3(b)に示すように、2
つのストローク、(c0,c1,c2)と(c3,c
4)に分解される。
標値が、常に、非増加であるか、または、非減少かであ
るような曲線である。あるxy単調曲線の2つの端点
を、それぞれ、P(x0,y0)、Q(x1,y1)とす
る。ここで、x0≠x1ならば、x0<x1であり、もしx
0=x1ならば、y0<y1とする。Pをその曲線のhea
d、Qをtailとよぶ。headとtailのx、y
座標の大小関係により、xy単調曲線は次の4種類に分
類される。 (1)x0<x1かつy0=y1(以下、‘−’と記す) (2)x0<x1かつy0<y1(以下、‘/’と記す) (3)x0=x1かつy0<y1(以下、‘|’と記す) (4)x0<x1かつy0>y1(以下、‘\’と記す) これら4種類のxy単調曲線を曲線のプリミティブとす
る。例えば、図3(c)に示すように、ストローク(c
0,c1,c2)はプリミティブA0(‘/’),A1
(‘\’),A2(‘/’),A3(‘\’)に分解さ
れ、ストローク(c3,c4)は、一つのプリミティブ
A4(‘/’)から成る。
リミティブaとbの連結を、
ブaとbの連結によって作られる凸の方向を示し、j=
0,1,2,3は、それぞれ、下、左、上、右向きに対
応する。aからbへの矢印は、図4のように、aとb
が、連結Pの周りで、右手系をなすように配置されてい
ることを意味する。例えば、図3(c)のプリミティブ
に対して、次のような連結が得られる。
が生成される。
(b)のストローク(c0,c1,c2)において、2
つのプリミティブ系列
ラベル(PS−label)<ps,idr>を与え
る。
ィブaのタイプが、bと同じときに値1をとり、それ以
外の時には値0を取る関数である。idrは、プリミテ
ィブ系列における最初の凸方向を示し、psは、方向の
差分を足し合わせることによって、回転数を表す。さら
に、プリミティブ系列の端点で、先頭のプリミティブに
あるものをh−pointとよび、最後のプリミティブ
にあるものをt−pointとよぶ。例えば、図5
(a)で、p1とp2は、それぞれ、E0とE1のh−p
ointで、p0とp3はt−pointである。
は、ラベル<0,0>をあたえる(例えば、円)。も
し、列の長さが1の時には、‘−’にラベル<1,0>
を、‘/’に<1,1>、‘\’に<1,2>、そし
て、‘\’に<1,3>を与える。この場合には、h−
pointはプリミティブのhead、t−point
はプリミティブのtailと定義する。
列E0とE1に対し、それぞれ、ラベル<2,1>,<
3,3>が与えられる。
リミティブA1を共有している。このように、プリミテ
ィブ系列の接続には、先頭のプリミティブを共有する場
合(h接続)と、最後のプリミティブを共有する場合
(t接続)の2つの場合がある。例えば、E0とE1と
は、h接続している。これを、
‘t’に起き換える。
点上の2つのプリミティブ系列の隣接構造には、X型
(交差)、K型(接触)、そして、T型(分岐)の3種
類がある。
ティブ系列の隣接構造により、
プリミティブ系列、τ∈{X,T,K}は隣接構造の種
類、p,q∈{hp,h,o,t,tp}は、プリミティ
ブ系列iとj上での特異点の位置を示す。(hp:h−
point、h:先頭のプリミティブ、t:末尾のプリ
ミティブ、tp:t−point、o:その他、ただ
し、hとtは、ラベル<1,*>をもつプリミティブ系
列に対しては定義されない)
で、図3(c)に示すようにA0上にあり、かつ、A4
のheadである。したがって、
ィブA4から成るプリミティブ系列である。
る。
140) 上述した形状の構造的解析と記述は、形の定性的、大局
的、離散的性質を扱うものである。形状記述をより精密
にするために、形状の構造要素であるプリミティブ系列
と特異点は、形の定量的、局所的、連速的性質を記述す
る、いくつかの属性パラメータを持つことができる。こ
れらのパラメータは、スケールのみに関して正規化され
た座標系で計算される。スケールの正規化は、文字のb
ounding box(図形を囲む最小の直立長方
形)に関して行なわれ、縦横比を変えずに、bound
ing boxの長い方の辺が単位長(1)になるよう
に、スケールを変える。bounding boxの中
心を(0.5,0.5)とする。具体的には、次のよう
な属性パラメータを計算する。
プリミティブ系列−(cx,cy,dx,dy,xhp,
yhp,xtp,ytp):(cx,cy)はプリミティブ系
列のbounding boxの中心座標、dxとdy
は、それぞれ、bounding boxの幅と高さ、
(xhp,yhp)はh−pointの位置、(xtp,
ytp)はt−pointの位置。
ブ系列−(cx,cy,a,b,fx,fy):(c
x,cy)はプリミティブ系列のbounding b
oxの中心座標。 a=l・cos(2θ),b=l・sin(2θ) ここで、lは弦(プリミティブの2端点を結ぶ線分)の
長さで、θは弦の角度である。そして、P(xp,yp)
をプリミティブ系列上の弦からの最遠点、(xF,yF)
をPから弦へおろした垂線の足とする。(fx、Fy)
は、 fx=xp−xF,fy=yp−yF のように定義される。
ブ系列−(cx,cy,dx,dy):cx、cy、d
x、そして、dyは(1)と同じ意味である。
特異点の座標。
互いに連続変形によって変換することができる形の集合
である。形式的には、クラスIは次式で与えられる。
(j)=0ならば、プリミティブ系列i、または、特異
点jは付加的なもので、あってもなくてもよい。もし、
mp(i)=1ならば、プリミティブ系列iは必須で、
必ず存在しなければならない。もし、ms(j)=1な
らば、その点を形成するプリミティブ系列が存在するな
らば、特異点jは必ず存在しなければならない。
異点は、前に述べたような、属性パラメータの統計量
(平均と標準偏差)をもつ。例として、文字画像に細線
化を施す場合の、モデルのいくつかのクラスの例を図
6、図7及び図8に示す。図6は文字「R」、図7は数
字「2」、図8は数字「2」の変形例をそれぞれ意味す
る。
ングについて述べる。オブジェクトOの記述も、モデル
のクラスと同様に、次のように与えられる。
は、以下のように定式化される。もし、以下に挙げる条
件を満足するような全射の組(f,g)
たという。なお、以下では、便宜上、上付きの(I)や
(O)は例えばNp(I)、Np(O)のように並べて表記す
る。
(i,j∈{1,2,…,Np(I)})ならば、i=
jである。
が必須ならば、オブジェクトにそれに対応する要素が存
在しなければならない。もし、mp(I)(i)=1(i
∈{1,2,…,Np(I)})ならば、f(i)=j
であるようなj∈{1,2,…,Np(O)}が存在す
る。
に対して、対応する要素がオブジェクトにあるならば、
f(i)のPS−ラベルはπ(I)(i)の要素である。
もし、f(j)≠φ(i,j∈{1,2,…,Np
(I)})ならば、π(O)(f(i))∈π(I)(i)
である。
は、対応fのもとで、オブジェクトにおいても保存され
る。
トOのストロークは、一対一対応する。もし、f(m)
≠φ、かつ、f(n)≠φならば、st(I)(n)になる
のは、st(O)(f(m))=st(O)(f(n))のとき
であり、また、そのときだけに限る。
j∈{1,2,…,Ns(I)})ならば、i=jであ
る。
り、かつ、特異点iを形成するあるプリミティブ系列に
対して、対応する要素がオブジェクトにあるならば、対
応する特異点がオブジェクトに存在しなければならな
い。もし、ms(I)(i)=1(i∈{1,2,…,
Ns(I)})、かつ、ある
(i)=jであるようなj∈{1,2,…,Ns(O)}
が存在する。
オブジェクトに対応する要素が存在するならば、g
(i)の構造は、σ(I)(i)の要素でなければならな
い。もし、g(j)≠φ(i∈{1,2,…,Ns
(I)})ならば、
く、整合ラベリング(例えば、R.M.Haralic
k and L.G. Shapiro,“The c
onsistent labeling proble
m:part 1,”IEEETrans.Patte
rn Analysis and MachineIn
telligence,vol.PAMI−1,pp.
173 −184,April 1979.)のアルゴ
リズムを用いて見つけることができる。もし、fが見つ
かったならば、写像fのもとで、制約(6)から(8)
に基づいて、gを見つける。例えば、図9の曲線の構造
記述は図10のようになるが、このオブジェクトと、図
6のクラス(Model−R)のマッチングでは、fと
gはつぎのようになる。 f(1)=2,f(2)=1, g(1)=φ,g(2)=2,g(3)=1.
いては、計算の複雑性が重大な問題である。しかし、ス
テップ130の記述方式では、形状が大局的特徴によっ
て記述されるので、要素の数はそれほど多くならない。
たとえば、数字の場合、プリミティブ系列や特異点の数
は高々4である。したがって、計算の複雑性は気にする
こはない。
は、豊富な特徴を持った少数の要素により、文字形状を
柔軟、かつ、コンパクトに記述し、ステップ150の構
造的なマッチングは、変形の大きいオブジェクトに対し
ても、柔軟にクラスとの構成要素の対応を求めることが
できる。ここで、各々の構成要素(プリミティブ系列と
特異点)には、いくつかの属性パラメータが計算されて
いるので、これを利用して図形上にいくつかの参照点を
選ぶことができる。クラス(モデル図形)での参照点の
座標は、属性パラメータの統計量(平均値)から計算す
る。構造的マッチングによって見出される構成要素間の
対応(f,g)により、モデル図形(クラス)と対象図
形(オブジェクト)の間の点対応を容易に求めることが
できる。
て,
s′として、
正規行列
分散がそれぞれ、σx(x,y)とσy(x,y)である
ような確率変数
x′の関係は、
クトルbの具体的な計算方法と、パターン変換の幾何学
的要因の評価方法、さらにパターン変形の統計学要因の
評価方法を説明する。
方法と、パターン変形の幾何学的要因の評価方法を説明
する。
方法を説明する。いま、
する。ここで、参照点としては、プリミティブ系列上の
いくつかの点と、特異点が取られる。
ルに応じて、つぎのように選ばれる。 (1)PS−ラベル<PS(≧2),*>−h−poi
nt、t−point、bounding box(直
立長方形)の各辺の中点(計6点) (2)PS−ラベル<1,*>−h−point、t−
point、弦からの最遠点(計3点) (3)PS−ラベル<0,0>−bounding b
oxの各辺の中点(計4点)
構造的マッチングにより決められる、プリミティブ系列
と特異点の対応(f,g)から容易に求められる。ここ
で、xi(i=1,2,…,N)がxi′に対応すると仮
定する。最小二乗法により、
2)、bx、byで偏微分することにより、次の連立線形
方程式を得る。
る。
形の幾何学的要因を定量化することを考える。アフィン
変換は、次の8つの基本変換に分解することができる。
ある。正方行列Aは、直交行列Qと、半正定値対称行列
Sにより、 A=QS の形に分解できる(例えば、B.K.P.Horn,
H.M.Hilden,and S.Negahdar
iour,“Closed−form solutio
n of absolute orientation
using orthonormal matric
es,”Journal of Optical So
ciety of America ,Vol.5 ,
No.7,pp.1127 −1135 .July
1988.)。さらに、Sは、LDU分解により、対称
性から、
は、
ing boxによって正規化されているので、T7の
パラメータμは1であることができる。ここで、θを回
転角度、γをせん断パラメータ、λxをxスケールパラ
メータ、λyをyスケールパラメータとよぶことにす
る。変形解析の場合、図形の置かれている場所は問題で
ないので、bは特に意味を持たない。したがって、4つ
のパラメータ(θ、γ、λx,λy)により幾何学的変換
を記述することができる。これは、対象図形が、モデル
図形にθの回転、γのせん断、x方向へのλx倍の拡
大、y方向へのλy倍拡大を施すことによって得られる
ことを意味している。なお、γの物理学的意味は図11
に示すとおりで、γ>0ならば図11(a)のように変
形し、γ<0ならば図11(b)のように変形する。
5より、
する対応図形の参照点をモデル図形の座標系へ変換した
点(正規化座標点;右辺第1項)とのずれを表し、統計
的変動を示すものである。ここでは、構造的モデルのク
ラスの要構成要素(プリミティブ系列と特異点)の属性
パラメータの統計量(平均値と標準偏差)を使って、モ
デル図形と対象図形の統計的な変動(変形)を定量化す
る。
構成要素の属性パラメータを並べたベクトルとする。た
だし、Viは平均μi、標準偏差σiの確率変数で、Viと
Vj(i≠j)は独立であるとする。対象図形での属性
パラメータViの観測値をvi′とし、それを正規化座標
へ変換して得られる値をviとする。具体的には、も
し、Viが位置を表すパラメータ(プリミティブ系列の
中心、h−point、t−point、特異点)のと
きには、点x′に対する変換
のbounding boxの幅と高さ、長さ1のプリ
ミティブ系列での弦から最遠点へのベクトル)であれ
ば、ベクトルδx′に対する変換
メータaとbに対しては、他の計算が必要となるが、容
易にできるのでここでは省略する。
ス距離を使って、
DNは、パラメータの数Nに依存するので、かわりに、
Fisherの近似
い。DN=dNに対して、
モデルのあるクラスと構造的に整合したときの、モデル
からの変形量を、 (θ,γ,λX,λY,D) で記述することができる。ただし、θを回転角度、γを
せん断パラメータ、λxをxスケールパラメータ、λy
をyスケールパラメータ、Dは数37と数38から求め
られる統計的変動量である。そして、これらの値から、
変形量(変動量)を評価することができる。変形が小さ
い図形では、θ,γは0に近い値、λX,λYは1に新い
値を取り、また、Dは、負の絶対値が大きい値を取る。
変形が大きい図形では、θ,γは絶対値が大きい値(0
から遠い値)、λX,λYは1から遠い値を取り、また、
Dは、正の絶対値が大きい値を取る。これらのことか
ら、変形の大きさと変形の要因を定量的に評価すること
ができる。
化 従来のパターン認識、特に、手書き文字認識において
は、パターンの正規化が「前処理」として行なわれてき
た。前処理においては、使える情報が限られているた
め、このような正規化は様々な副作用があることが知ら
れている。本発明においては、対象図形の構造記述と、
モデルの構造記述を基に、形状の大局的、定性的情報に
基づいて、まず、大雑把にマッチングをとり、その認識
結果に基づいて、対象図形を正規化することができる。
具体的には、その認識結果に基づいて、対象図形を正規
化することができる。具体的には、まず、ステップ13
0,140の処理で対象図形の構造記述をもとめ、ステ
ップ150のように、その構造記述と構造モデルとのマ
ッチングを取る。そして、この構造マッチングで求めら
れた、対象図形とモデルとの間の構成要素の対応関係を
もとに、数25の行列Aとベクトルbを、ステップ16
1,162のような方法で求めて、対象図形上の各点
x′を数35に変換することによって、パターンの正規
化ができる。
いては、プリミティブ系列と特異点の対応(f,g)が
必ずしも一通りに決まるとは限らない。そのような場合
には、Dを最小とするような対応を、そのクラスとオブ
ジェクトのマッチングとして出力すればよい。
クトが複数のクラスに構造的に整合することがあるの
で、定量的情報を使って候補となっているクラスを順位
付けすることが必要となる。実際の判断基準の一つの例
としては、つぎのようなものが考えられる。 (a)まず、θ,γ,λX,λYの許される値の範囲に制
限を付けておき、あるクラスに対して、これら4つのう
ち、ひとつでも制限範囲を越えるものがあったならば、
そのクラスを候補から外す。 (b)残ったものについて、Dの小さい順番に順序づけ
する。 (c)もし、第一候補のDが十分小さく、かつ、第一候
補と第二候補のDの差が十分大きければ、第一候補を認
識結果として出力する。さもなければ、「リジェクト」
を出力する。
識対象入力文字「H」のデータで、201は原画像、2
02は細線化結果、203は構造解析結果、204は整
合したクラスのリストを示している。(b)と(c)は
モデルHとIで、(a)の入力文字に整合したクラスで
ある。なお、クラスについては、オブジェクトとの構成
要素の対応(f,g)、その対応のもとでの(θ,γ,
λX,λY,D)の値と正規化された図形、そして、構造
のモデルを示している。ただし、θの単位は「度」、ク
ラスの記述において、‘*’のついた要素は、付加的要
素(mpまたはmsの値が0)であるものであり、ま
た、PS−ラベル<ps,idr>を整数10×ps+
idrで示している。
(b)及び(c)の2つのクラス「H」と「I」に整合
しているが、どちらも正のせん断が加わっており、
「I」には横方向への拡大と縦方向への縮小が加わって
いる。一方、回転は、「H」の方時計周りに8度である
のに対し、「I」の方は反時計周りに58度である。し
たがって、θの許容範囲を例えば−20≦θ≦20とす
ることにより、クラス「I」が除外され、クラス「H」
が候補として残ることになる。
を構造記述を利用して簡単に求めることができ、モデル
図形と対象図形の間の変形を、単純な幾何学的変換と統
計的変換に分けて解析することにより、簡単な処理によ
る変形解析が可能となる。また、変形の要因を単純な要
因に分けて、定量的に記述することが可能である。
変形量(変動量)の両方の情報を利用することによっ
て、柔軟で、しかも、ロバストなパターン認識が可能と
なる。さらに、構造的情報だけでは足りない情報を変形
量で補うことにより、正確な認識が可能となる。
な情報を利用した正規化が可能となり、少ない情報を用
いた「前処理」としての正規化の副作用を防ぐことがで
きる。
略ブロック図である。
明する図である。
する図である。
明する図である。
Claims (2)
- 【請求項1】 文書画像を入力し,該入力された文書画
像の文字パターン(以下、図形)を認識処理する画像処
理装置におけるパターン認識処理方法であって、画像処理装置は、 対象図形を細線化し、該細線化パターンを曲線構造解析
して、該対象図形の大局的な形状構造特徴を抽出し、 前記対象図形の形状構造特徴と、あらかじめ記憶手段さ
れたモデル図形の形状構造特徴との構造マッチングを実
施し、 前記構造マッチングで整合のとれたモデル図形と対象図
形間の形状構造特徴における構成要素の対応を見つけ、
該構成要素上に一つあるいは複数の参照点を取って、対
象図形とモデル図形との点対応を検出し、該点対応をも
とに、対象図形とモデル図形間の変形量を算出し、 前記算出された変形量をもとに、前記構造マッチングで
整合のとれたモデル図形のクラスを順序付けする、 ことを特徴とするパターン認識処理方法。 - 【請求項2】 前記変形量をもとに、対象図形とモデル
図形との間の変形をその要因ごとに評価し、該評価結果
をもとに、構造マッチングで整合のとれたモデル図形の
クラスを順序付けすることを特徴とする請求項1記載の
パターン認識処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16156492A JP3183949B2 (ja) | 1992-06-22 | 1992-06-22 | パターン認識処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16156492A JP3183949B2 (ja) | 1992-06-22 | 1992-06-22 | パターン認識処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH064671A JPH064671A (ja) | 1994-01-14 |
JP3183949B2 true JP3183949B2 (ja) | 2001-07-09 |
Family
ID=15737515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16156492A Expired - Lifetime JP3183949B2 (ja) | 1992-06-22 | 1992-06-22 | パターン認識処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3183949B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002298141A (ja) | 2001-03-29 | 2002-10-11 | Nec Corp | パターン照合装置とそのパターン照合方法、及びパターン照合プログラム |
JP4543675B2 (ja) * | 2003-12-22 | 2010-09-15 | パナソニック電工株式会社 | 文字・図形の認識方法 |
JP5042562B2 (ja) | 2006-08-22 | 2012-10-03 | 株式会社リコー | 画像処理装置、手書き情報認識方法、手書き情報認識プログラム |
-
1992
- 1992-06-22 JP JP16156492A patent/JP3183949B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH064671A (ja) | 1994-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
JP3218004B2 (ja) | 試験署名検証方法 | |
CN104700087B (zh) | 可见光与近红外人脸图像的相互转换方法 | |
CN111160343A (zh) | 一种基于Self-Attention的离线数学公式符号识别方法 | |
JP3815704B2 (ja) | 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法 | |
JP6612822B2 (ja) | モデルを修正するためのシステムおよび方法 | |
CN102341813A (zh) | 匹配图像的系统和方法 | |
JP2006523345A (ja) | マルチメディアデータに索引付けをし、そして検索するための形状マッチング方法 | |
MX2007010180A (es) | Importacion inteligente de informacion de la interfaz de usuario de aplicacion del exterior utilizando inteligencia artificial. | |
US9256802B2 (en) | Object or shape information representation method | |
US5255354A (en) | Comparison of image shapes based on near neighbor data | |
JPH11232306A (ja) | ドキュメント突合せ方法およびシステム | |
JP3183949B2 (ja) | パターン認識処理方法 | |
Anami et al. | Combined Hu moments, orientation knowledge, and grid intersections feature based identification of Bharatanatyam mudra images | |
JP4543675B2 (ja) | 文字・図形の認識方法 | |
CN116524403A (zh) | 一种基于注意力增强多模态特征的视频拷贝检测方法 | |
Ramel et al. | Automatic reading of handwritten chemical formulas from a structural representation of the image | |
JP4525526B2 (ja) | パターンマッチング方法及び装置 | |
JP3753880B2 (ja) | 図形分類方法、図形検索方法、図形分類検索システム及び記録媒体 | |
Koutaki et al. | Fast and high accuracy pattern matching using multi-stage refining eigen template | |
JP3278247B2 (ja) | 文字認識方法 | |
Delalandre et al. | Performance evaluation of symbol recognition and spotting systems: An overview | |
Bogacz et al. | Recovering and Visualizing Deformation in 3D Aegean Sealings. | |
Körber | Improving Camera-based Document Analysis with Deep Learning | |
Srivastava et al. | (Retracted) Robust face recognition using multimodal data and transfer learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080427 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090427 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090427 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100427 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100427 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110427 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120427 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130427 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130427 Year of fee payment: 12 |