JPH0385686A - パタン正規化装置 - Google Patents

パタン正規化装置

Info

Publication number
JPH0385686A
JPH0385686A JP1223440A JP22344089A JPH0385686A JP H0385686 A JPH0385686 A JP H0385686A JP 1223440 A JP1223440 A JP 1223440A JP 22344089 A JP22344089 A JP 22344089A JP H0385686 A JPH0385686 A JP H0385686A
Authority
JP
Japan
Prior art keywords
pattern
geometric transformation
unit
distance
feature extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1223440A
Other languages
English (en)
Other versions
JP2570866B2 (ja
Inventor
Takeshi Kamimura
健 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1223440A priority Critical patent/JP2570866B2/ja
Publication of JPH0385686A publication Critical patent/JPH0385686A/ja
Application granted granted Critical
Publication of JP2570866B2 publication Critical patent/JP2570866B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は1パタン認識において文字1パタンの形状を正
規化する1パタン正規化装置に関する。
〔従来の技術〕
1パタン認識の中でも重要分野の1つである文字認識は
、一般に前処理、特徴抽出、識別および後処理の4つの
プロセスに大別される。前処理では入力される文字画像
に対して、雑音の除去や形状の正規化を行い、特徴抽出
においてはマスク処理2輸郭トレースおよび射影等の画
像処理手法を用いて、交点・端点といった特徴点やスト
ロークの配置および濃度分布等に依存した特微量を求め
る。次に、特微量を成分として構成される特徴ベクトル
と、各カテゴリに対応した特徴ベクトルとのマツチング
によってカテゴリを識別し、最後に後処理として識別結
果の確認を行う。
文字認識の難しさの要因の1つとして、同じカテゴリに
属する文字パタンの形状の多様性がある。
これは特に手書き文字やマルチフォントの印刷文字にお
いて顕著に現れる問題であり、これを解決するために既
にいくつかの方式が提案されている。
これらの方式のうち大部分のものは、形状に対しである
正規化基準を設け、その上で最適化がなされるように前
処理プロセスにおいて変形を行うものである。例えばG
、ネイギーとN、ツォンにより、「手書き数字に対する
正規化方法(NormalizationTechni
que for Handprinted Numer
als) J と題して、As5ociation f
or Computing MachineryのCo
mmuni−cation、Vol、13.No、8(
1970)の475ページから481ページに掲載され
た論文においては、手書き数字に対して外接矩形を求め
、これが一定の形状となるような変形を行い形状を正規
化している。また浮雲、田中により「階層的な位置ずれ
補正処理に基づく手書き漢字認識」と題して、電子情報
通信学会の研究会(資料番号PRU87−104゜19
88年2月)に発表された論文においては、手書き漢字
に対して、ストロークの間隔が均等化されるようにスト
ロークの位置の補正を行う方式を提案している。
〔発明が解決しようとする課題〕
以上の1パタン正規化の方式においては、正規化基準に
対する最適な変形が一定の処理により求められるため、
処理量の面からみても効率的である。
どのような正規化基準を設ければよいかという問題は、
特徴抽出や識別のアルゴリズムにも影響を与え、また認
識の対象にも依存することから、これを決定するのは非
常に難しい。しかも文字ごとに基準が変化することも考
えられ、一般には設定される基準によっては、−窓処理
によって最適な− 変形を求めることは困難であり、そり場合に反復収束計
算が必要であると考えられる。
本発明の目的は、最適化計算手法を用いて幾何学変換を
反復することにより、更に汎用性の高い形状正規化装置
を提供することにある。
〔課題を解決するための手段〕
本発明の装置は、1パタン認識処理における入力1パタ
ンと参照パタンとからそれぞれの特徴抽出を行って得ら
れる特徴ベクトル間の距離が最小となるように入力1パ
タンに対する幾何学変換を実行する1パタン正規化装置
において、与えられた変形パラメータに従って入力1パ
タンに対する幾何学変換を実行して変形パタンを求める
幾何学変換部と、この幾何学変換部で求めた変形パタン
に対し特徴抽出を行い変形パタンの特徴ベクトルを求め
る特徴抽出部と、個々の参照1パタンに対しあらかじめ
特徴抽出を行って得られる参照パタンの特徴ベクトルを
貯えておく辞書と、前記変形パタンの特徴ベクトルと前
記参照パタンの特徴ベクトルとの間の距離を計算する計
算部と、この距離計算部で計6一 算する距離の値を最小とする前記変形パラメータの値を
求め、最適化されるまでの反復処理の制御を行う制御部
と、前記各参照パタンごとに最小化された前記距離の値
を貯えてソーティングを行って値が最小のものから順に
上位候補として出力するソータとを含むことをにより、
また前記特徴抽出部は、前記変形パタンに対し細線化処
理を行う細線化処理部と、この細線化処理部から出力さ
れる細線化パタンに対して、局所フィルタリング処理を
実行して得られる値を特徴ベクトルの要素として出力す
る局所フィルタリング処理部とを含むことにより、また
前記幾何学変換部は、前記変形パラメータが水平方向に
関するパラメータと垂直方向に関するパラメータとの2
種類から構成され、水平方向または垂直方向または両方
向に関する幾何学変換を実行して変形パタンを求める幾
何学変換部で、前記制御部は、最適化のための反復処理
を2つのフェーズに分解し、一方のフェーズにおいては
前記変形パラメータのうち水平方向に関するパラメータ
のみを更新し、他方においては垂直方向に関するパラメ
ータのみを更新し、両フェーズを1回ずつ実行して1回
の反復とする制御部であることにより構成される。
〔作用〕
本発明のパタン正規化装置は、入力1パタンと参照1パ
タンとから得られるそれぞれの特徴ベクトル間の距離が
最小となるように、最適化計算手法による反復処理を実
行するものであり、入力1パタンの形状が参照パタンに
より近くなるように幾何学変換が繰り返される。入力1
パタンは全ての参照パタンに対して変形され、その結果
得られる距離値が最小のものから順に幾つかを選択し、
上位候補とする。
〔実施例〕
次に、本発明の実施例について図面を参照して説明する
第1図は本発明の1パタン正規化装置の一実施例を示す
ブロック図である。幾何学変換部10は、入力1パタン
100と変形パラメータ101との2つを入力とし、変
形パラメータ101により与えられる幾何学変換を入力
1パタン100に対して施した結果を、変形パタン10
2として出力する。
次に幾何学変換の方法について説明を行う。まず簡単の
ため1次元のパタンの場合を考える。入力1パタン10
0の変形前のアドレスをx (0≦X≦M)、変形パタ
ン102のアドレスをf(x)ト表す。ここで関数f 
(x)は以下の条件を満たすものとする。
f(o)=o                 (1
)f(M)=M                 (
2)f ’ (x)≧0  (0≦X≦M )    
    (3)この3つの条件により、変形パタンは入
力1パタンと同じ大きさを保つ。特に式(3)により、
関数fは単調増加となるため、パタンの各成分の順序を
保ちながら変形を行うことができる。例えばf (x)
として、 f(x)=a3x3+a2x2+a、x+ao   (
4)と表される3次関数を用いる場合、Xのほかにパラ
メータとしてa3. EL21 alp FLoの4個
が必要である。しかし条件式(1)および(2)を代入
すること9− により次の式(5)が得られるため、実際に与えるパラ
メータは2個でよい。このパラメータが、変形パラメー
タ101に対応している。
f(x)=a3x3+a2x2 + (1−asM2−a2M)x   (5)f (x
)として非線形の関数を用いれば、パタンのある部分の
みを膨張または収縮するといった変形が可能である。
次に2次元の入力1パタンのアドレスを(x ry)、
変形パタンのアドレスを(X、Y)で表t。
上記の条件式(1)〜(3)を満たす関数fとgとによ
り、以下の式(6)、 (7)に従って2次元パタ/の
幾何学変換を実行すると、各方向ごとに独立な変形が行
われる。
X=f(x)                 (6
)Y=g(y)                 (
7)一方、次の式(8)、 (9)のように、他方向の
アドレス値の項を加えると、更に長方形から平行四辺形
への変形や、回転といったことが可能となる。
X=f(x)十b−y           (8)−
l〇− Y= g (y)十c−x            (
9)ノ この場合、変形パラメーター01の個数はX方向とy方
向とに関して各3個の計6個となる。
以上の変形においては関数f(0)、 f(M)の値が
一定であるため、第3図(a)に示すように、0≦X≦
M、0≦y≦Nで表される矩形領域のうち両端の成分は
移動することができない。しかし第3図(b)のように
、パタンの外接正方形の外側に背景部分を加えて正規化
処理領域とすれば、パタンの両端の成分も移動すること
ができる。また更に領域によって異なる関数を用いれば
局所的な変形が実現される。
次に特徴抽出部11は、変形パタン102に対して特徴
抽出処理を行い、得られる特徴ベクトル103を出力す
る。第2図は特徴抽出部11の一実施例を示すブロック
図であり、細線化処理部20は、入力される変形1パタ
ン102に対して細線化処理を行う。これにより入力1
パタンと変形1パタンとのストロークの太さの違いによ
って、距離値が増大することがなく、ストロークの骨格
線の重なり具合いを評価することができる。局所フィル
タリング処理部21は細線化パタンに対して、一定のり
サンプリング点上で局所フィルタリング処理を行い、得
られた値を特徴ベクトル103の要素として出力する。
フィルタリング係数としては、例えば以下に示すような
5×5のガウシアンフィルタを用いる。
次に再び第1図を゛参照して本発明の詳細な説明を行う
と、辞書12は特徴抽出部11において述べた処理を、
あらかじめ全参照パタンに対して実行して得られる特徴
ベクトルを格納し、制御部14からの読出し要求信号1
07に同期して読出し、特徴ベクトル104とする。
距離計算部13は変形1パタンから得られる特徴ベクト
ル103と、参照パタンから得られる特徴ベクトル10
4を入力し、両者の距離値を求め距離値105として出
力する。距離としては、例えばL1ノルム、 Ci=Σ ai−biQG またはL2ノルム、 ci−Σ(a i−b i)2         αp
等を用いることができる。
制御部14は、変形パラメータ101と距離値105と
を入力し、距離値105が最小となるような変形パラメ
ータ101の値を最適化計算手法を用いた反復処理によ
って求める。求まったならば、その収束値と対応する参
照パタンのカテゴリ番号を信号106として出力し、更
に辞書12に対して読出し要求信号107を出力し、次
の参照パタンの特徴ベクトルの読出しを行う。
次に最適化計算手法の1つである最急勾配法に関して説
明を行う。幾何学変換部10 へ入力する変形パラメー
タ101をベクトルx=(kzk 2 h k g r
・・・、kL)で表し、Kを与えたときに距離計算部1
3において得られる距離値105をD (K)−13= とすると、以下の■〜■のようになる。
■ Kの初期値を与える。
■ i=1.2,3.・・・、Lに対して、g i =
D(Ki”)−D(K i  )      Qのを求
める。但しベクトルKi+とKi−とはKの第V成分の
みをそれぞれ正の方向と負の方向とにΔ(〉0)だけ変
化させたベクトルであり、次の弐0■のように表すこと
ができる。
Ki”= (kj”l kj”−kj U≠i)、 k
 i+=k i+Δ)Ki−= (kj−l kj−=
kj (j≠i)、ki−=ki−Δ)(1≦j≦L)
03 ■ ベクトルG” (g l+ g 21 g 3+・
)gL)とし、 D’ =D (K−α・G/ If a II )  
   αΦを最小にするような正のスカラ値αを求める
■ αが充分に小さくなり、Kの値が収束すれば終了。
そうでなければ、 K4−K −a ・G/ II G If      
  Q61として■へ戻る。
ベクトルGが最急勾配方向を表し、スカシαが更14 新量を表す。制御部14は変形パラメータ101と距離
値105とを用いて、上述の■〜■を収束するまで繰り
返す。
この方法では、■においてベクトルにの全ての成分が更
新されるため、水平方向に閃する変形と垂直方向に関す
る変形が同時に行われる。しかし■では変分法により、
他方向の変形を行わない状態でパラメータを変動させて
勾配を求めている。
一般に各方向に対する最適な変形の組合せが、両方向に
対する最適な変形になるとはいえない。そこで制御部1
4は、■〜■の反復処理をX方向とy方向との2つのフ
ェーズに分け、各フェーズで1方向の変形のみに関する
パラメータを更新し、両フェーズを1回ずつ実行して1
回の反復とする。
ソータ15は、制御部14から出力される信号106を
貯えるメモリと、比較演算器等を含んで構成され、信号
106のデータのうち、距離の収束値をメモリ上でソー
トし、その上位候補データを対応するカテゴリ番号と共
に信号108に出力する。
ここでは2つの特徴ベクトル間の距離を最小にする装置
として説明を行ったが、例えば距離ではなく類似度を最
大にするような最適化基準を用いる場合も考えられる。
この場合、類似度をD (K)で表わすと、制御部14
での最適化反復処理は以下のようになる。
■ Kの初期値を与える。
■ i=1.2,3.・・・、Lに対して、g i =
D (Ki”) −D (Ki−)     Qのを求
める。
■ ベクトルG=(g l+ g 21 g 3.・・
・rgL)とし、 D’ =D (K−α・G/IIGII)     Q
41を最大とするような正のスカラ値αを求める。
■ αが十分に小さくなり、Kの値が収束すれば終了。
そうでなければ、 K 4−に−α・a/1lall        Q5
1として■へ戻る。
更にソータ15において収束値を最大値から順にソート
することにより、類似度を最大とするような変形が実現
される。
〔発明の効果〕
以上説明したように、本発明の1パタン正規化装置を用
いることにより、従来に比べ入力1パタンの多様な変形
に対応することができるという効果を持つ。また最適化
の基準を、特徴ベクトル間の距離の最小化だけでなく、
認識対象に応じて設定することにより、汎用性の高い正
規化処理を実現することができる効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は第1
図における特徴抽出部の上側を示すブロック図、第3図
(a)および(b)は正規化領域内の幾何学変換の例を
示す図である。 10・・・・・・幾何学変換部、11・・・・・・特徴
抽出部、12・・・・・・辞書、13・・・・・・距離
計算部、14・・・・・・制御部、15・・・・・・ソ
ータ、20・・・・・・細線化処理部、21・・・・・
・局所フィルタリング処理部。

Claims (1)

  1. 【特許請求の範囲】 1 パタン認識処理における入力パタンと参照パタンと
    からそれぞれの特徴抽出を行って得られる特徴ベクトル
    間の距離が最小となるように入力パタンに対する幾何学
    変換を実行するパタン正規化装置において、与えられた
    変形パラメータに従って入力パタンに対する幾何学変換
    を実行して変形パタンを求める幾何学変換部と、この幾
    何学変換部で求めた変形パタンに対し特徴抽出を行い変
    形パタンの特徴ベクトルを求める特徴抽出部と、個々の
    参照パタンに対しあらかじめ特徴抽出を行って得られる
    参照パタンの特徴ベクトルを貯えておく辞書と、前記変
    形パタンの特徴ベクトルと前記参照パタンの特徴ベクト
    ルとの間の距離を計算する計算部と、この距離計算部で
    計算する距離の値を最小とする前記変形パラメータの値
    を求め、最適化されるまでの反復処理の制御を行う制御
    部と、前記各参照パタンごとに最小化された前記距離の
    値を貯えてソーティング行って値が最小のものから順に
    上位候補として出力するソータとを含むことを特徴とす
    るパタン正規化装置。 2 請求項1記載のパタン正規化装置において、前記特
    徴抽出部は、前記変形パタンに対し細線化処理を行う細
    線化処理部と、この細線化処理部から出力される細線化
    パタンに対して、局所フィルタリング処理を実行して得
    られる値を特徴ベクトルの要素として出力する局所フィ
    ルタリング処理部とを含むことを特徴とするパタン正規
    化装置。 3 請求項2記載のパタン正規化装置において、前記幾
    何学変換部は、前記変形パラメータが水平方向に関する
    パラメータと垂直方向に関するパラメータとの2種類か
    ら構成され、水平方向または垂直方向または両方向に関
    する幾何学変換を実行して変形パタンを求める幾何学変
    換部で、前記制御部は、最適化のための反復処理を2つ
    のフェーズに分解し、一方のフェーズにおいては前記変
    形パラメータのうち水平方向に関するパラメータのみを
    更新し、他方においては垂直方向に関するパラメータの
    みを更新し、両フェーズを1回ずつ実行して1回の反復
    とする制御部であることを特徴とするパタン正規化装置
JP1223440A 1989-08-29 1989-08-29 パタン正規化装置 Expired - Fee Related JP2570866B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1223440A JP2570866B2 (ja) 1989-08-29 1989-08-29 パタン正規化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1223440A JP2570866B2 (ja) 1989-08-29 1989-08-29 パタン正規化装置

Publications (2)

Publication Number Publication Date
JPH0385686A true JPH0385686A (ja) 1991-04-10
JP2570866B2 JP2570866B2 (ja) 1997-01-16

Family

ID=16798179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1223440A Expired - Fee Related JP2570866B2 (ja) 1989-08-29 1989-08-29 パタン正規化装置

Country Status (1)

Country Link
JP (1) JP2570866B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7452167B2 (en) 2004-11-26 2008-11-18 Kyocera Corporation Cutting insert and milling tool
USRE40947E1 (en) 1997-10-14 2009-10-27 Ibiden Co., Ltd. Multilayer printed wiring board and its manufacturing method, and resin composition for filling through-hole
US7999194B2 (en) 1999-10-26 2011-08-16 Ibiden Co., Ltd. Multi-layer printed circuit board and method of manufacturing multi-layer printed circuit board

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE40947E1 (en) 1997-10-14 2009-10-27 Ibiden Co., Ltd. Multilayer printed wiring board and its manufacturing method, and resin composition for filling through-hole
US7999194B2 (en) 1999-10-26 2011-08-16 Ibiden Co., Ltd. Multi-layer printed circuit board and method of manufacturing multi-layer printed circuit board
US7452167B2 (en) 2004-11-26 2008-11-18 Kyocera Corporation Cutting insert and milling tool
US7637700B2 (en) 2004-11-26 2009-12-29 Kyocera Corporation Cutting insert and milling tool

Also Published As

Publication number Publication date
JP2570866B2 (ja) 1997-01-16

Similar Documents

Publication Publication Date Title
Simard et al. Transformation invariance in pattern recognition: Tangent distance and propagation
Baird Feature identification for hybrid structural/statistical pattern classification
EP0649113B1 (en) Multifont optical character recognition using a box connectivity approach
Yamashita et al. Affine-transformation and 2D-projection invariant k-NN classification of handwritten characters via a new matching measure
JP2718485B2 (ja) 文字認識方法
JP2719202B2 (ja) 線図形特徴抽出及び認識方法
Fujisawa et al. Directional pattern matching for character recognition revisited
Ronee et al. Handwritten character recognition using piecewise linear two-dimensional warping
KR0170656B1 (ko) 필기체문자 인식방법 및 장치
JPH0385686A (ja) パタン正規化装置
Ramel et al. Automatic reading of handwritten chemical formulas from a structural representation of the image
JP2893760B2 (ja) パタン正規化装置
Rocha et al. A solution to the problem of touching and broken characters
Ueda et al. Automatic shape model acquisition using multiscale segment matching
JPH0440579A (ja) パタン正規化装置及びパタン識別装置
Banarse et al. The application of a generic neural network to handwritten digit classification
Özuğur et al. Feature extraction in shape recognition using segmentation of the boundary curve
JP3706646B2 (ja) Ocrの制御方法並びに分類方法及び装置
Gavrila et al. Learning shape models from examples
CN113673667B (zh) 一种车辆检测训练中网络结构的设计方法
Lau et al. EDT based tracing maximum thinning algorithm on grey scale images
Wakahara et al. Handwritten Japanese character recognition using adaptive normalization by global affine transformation
JP3164962B2 (ja) 文字認識辞書作成方法および装置
Yamagata et al. A handwritten character recognition system by efficient combination of multiple classifiers
Hasegawa et al. A similarity measurement method robust to background noise

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees