JP2893760B2 - パタン正規化装置 - Google Patents

パタン正規化装置

Info

Publication number
JP2893760B2
JP2893760B2 JP1283829A JP28382989A JP2893760B2 JP 2893760 B2 JP2893760 B2 JP 2893760B2 JP 1283829 A JP1283829 A JP 1283829A JP 28382989 A JP28382989 A JP 28382989A JP 2893760 B2 JP2893760 B2 JP 2893760B2
Authority
JP
Japan
Prior art keywords
pattern
distance
deformation
transformation
deformation parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1283829A
Other languages
English (en)
Other versions
JPH03144788A (ja
Inventor
健 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP1283829A priority Critical patent/JP2893760B2/ja
Publication of JPH03144788A publication Critical patent/JPH03144788A/ja
Application granted granted Critical
Publication of JP2893760B2 publication Critical patent/JP2893760B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明はパタン認識においての形状を正規化する装置
に関する。
(従来の技術) パタン認識の中でも重要な分野の1つである文字認識
は、一般に前処理、特徴抽出、識別、後処理の4つのプ
ロセスに大別される。前処理では入力される文字画像に
対して、雑音の除去や形状の正規化を行い、特徴抽出に
おいてはマスク処理、輪郭トレース、射影等の画像処理
手法を用いて、交点・端点といった特徴点やストローク
の配置、濃度分布等に依存した特徴量を求める。次に特
徴量を成分として構成される特徴ベクトルと、各カテゴ
リに対応した特徴ベクトルとのマッチングによってカテ
ゴリを識別し、最後に後処理として識別結果の認識を行
う。
文字認識の難しさの要因の1つとして、同じカテゴリ
に属する文字パタンの形状の多様性がある。これは特に
手書き文字やマルチフォントの印刷文字において顕著に
現れる問題であり、これを解決するために既にいくつか
の方式が提案されている。これらの方式のうち大部分の
ものは、形状に対してある正規化基準を設け、その上で
最適化がなされるように前処理プロセスにおいて変形を
行うものである。例えばG.ネイギーとN.ツォンにより、
“手書き数字の正規化手法(Normalization Technique
for Handprinted Numerals)”と題して、Association
for Computing MachineryのCommunication,Vol.13,No.8
(1970)の475ページから481ページに掲載された論文に
おいては、手書き数字に対して外接矩形を求め、これが
一定の形状となるような変形を行い形状を正規化してい
る。また津雲,田中により「階層的な位置ずれ補正処理
に基づく手書き漢字認識」と題して、電子情報通信学会
の研究会(資料番号PRU87−104,1988年2月)に発表さ
れた論文においては、手書き漢字に対して、ストローク
の間隔が均等化されるようにストロークの位置の補正を
行う方式を提案している。
(発明が解決しようとする課題) 以上に方式においては、ある正規化基準に対する最適
な変形が一定の処理により求められるから、処理量の面
からみても効率的である。しかし正規化基準の選択は非
常に難しい問題であり、これは特徴抽出や識別のアルゴ
リズムだけでなく認識の対象にも依存している。設定さ
れる正規化基準に対し、一定処理によって最適な変形を
求めることは一般に困難であり、その場合には反復収束
計算が必要であると考えられる。
本発明の目的は、最適化計算手法を用いて幾何学変換
を反復することにより、更に汎用性の高いパタン正規化
装置を提供することにある。
(課題を解決するための手段) 本発明の装置は、 パタン認識処理において、入力パタンと参照パタンか
ら各々特徴抽出を行って得られる特徴ベクトル間の距離
が最小となるように、入力パタンに対する幾何学変換を
実行し、該入力パタンの形状を正規化する装置であっ
て、 入力される2値パタンを、濃淡パタンに変換する多値
化処理部と、 与えられた変形パラメータに従って、濃淡パタンに対
する幾何学変換を実行し、変形パタンを求める幾何学変
換部と、 前記変形パタンに対し特徴抽出を行い、変形パタンの
特徴ベクトルを求める特徴抽出部と、 個々の参照パタンに対し、あらかじめ特徴抽出を行っ
て得られる参照パタンの特徴ベクトルを貯えておく辞書
と、 前記変形パタンの特徴ベクトルと、前記参照パタンの
特徴ベクトルとの間の距離を計算する距離計算部と、 前記辞書内における全参照パタンの各々について、前
記変形パラメータの値を正の方向と負の方向に規定値だ
け変化させ、前記幾何学変換部、前記特徴抽出部、およ
び、前記距離計算部により、前記正の方向に変化させた
変形パラメータに基づいて得られた距離と、前記負の方
向に変化させた変形パラメータに基づいて得られた距離
の差分に基づき変形パラメータの修正方向を求め、該修
正方向に変形パラメータを修正した時に得られる距離が
最小となるように修正量を求め、該修正量が十分小さく
なり変形パラメータの修正が収束しているかどうかを判
定し、収束していると判定された場合は前記収束した変
形パラメータに基づいて得られる距離を最小化された距
離として出力し、収束していないと判定された場合は変
形パラメータの修正を繰り返し行う制御部と、 前記各参照パタン毎に前記最小化された距離の値を貯
えてソーティングを行い、値が最小のものから順に上位
候補として出力するソータと を含んで構成されることを特徴とする。
(作用) 本発明のパタン正規化装置は、入力パタンと参照パタ
ンから各々得られる特徴ベクトル間の距離が最小となる
ように、最適化計算手法による反復処理を実行するもの
であり、入力パタンの形状が参照パタンにより近くなる
ように幾何学変換が繰り返される。入力パタンは全ての
参照パタンに対して変形され、その結果得られる距離値
が最小のものから順に幾つかを選択し、上位候補とす
る。
また幾何学変換部においては、変形前のパタンと変形
後のパタンにおいて、各々の画素値の総和が保存される
ように変形が行なわれる。
(実施例) 本発明の実施例について図面を参照して説明する。
第1図は本発明のパタン正規化装置の一実施例を示す
ブロック図である。以下第1図を参照して、本発明の装
置の説明を行う。
多値化処理部16は、2値画像である入力パタン109に
対し、ガウシアン等のコンボリューションフィルタ処理
を行い、濃淡パタン100を得る。5×5のガウシアンフ
ィルタの係数の一例を以下に示す。
幾何学変換部10は、濃淡パタン100と変形パラメータ101
の2つを入力とし、変形パラメータ101により与えられ
る幾何学変換を濃淡パタン100に対して施した結果を、
変形パタン102として出力する。
次に幾何学変換の方法について説明を行う。
まず簡単のための1次元のパタンの場合を考える。変
形前のパタン100のアドレスをx(0≦x≦M)、変形
後のパタン102のアドレスをf(x)と表す。ここで関
数f(x)は以下の条件を満たすものとする。
f(0)=0 (1) f(M)=M (2) f′(x)≧0 (0≦x≦M) (3) この3つの条件により、パタンは変形前と変形後で同
じ大きさを保つ。特に式(3)により、関数fは単調増
加となるため、パタンの各成分の順序を保ちながら変形
を行うことができる。
例えばf(x)として、 f(x)=a3x3+a2x2+a1x+a0 (4) と表される3次関数を用いる場合、xのほかにパラメー
タとしてa3,a2,a1,a0の4個が必要である。しかし式
(1),(2)を代入することにより次の式(5)が得
られるから、実際に与えるパラメータは2個でよい。こ
のパラメータが、変形パラメータ101に対応している。
f(x)=a3x3+a2x2+(1−a3M2−a2M)x (5) f(x)として非線形の関数を用いれば、パタンのある
部分のみを膨張しまたは収縮するといった変形が可能で
ある。
次に2次元パタンの変形前のアドレスを(x,y)、変
形後のアドレスを(X,Y)で表す。上記の条件(1)〜
(3)を満たす関数fとgにより、以下の式(6),
(7)に従って2次元パタンの幾何学変換を実行する
と、各方向ごとに独立な変形が行なわれる。
X=f(x) (6) Y=g(y) (7) 一方、次の式(8),(9)のように、他方向のアド
レス値の項を加えると、更に長方形から平行四辺形への
変形や、回転といったことが可能となる。
X=F(x,y)=f(x)+b・y (8) Y=G(x,y)=g(y)+c・x (9) この場合、変形パラメータ101の個数はx方向とy方向
に関して各3個の計6個となる。
以上の変形においては関数f(0),f(M)の値が一
定であるから、第2図(a)に示すように、0≦x≦M,
0≦y≦Nで表される矩形領域のうち両端の成分は移動
することができない。しかし第2図(b)のように、パ
タンの外接正方形の外側に背景部分を加えて正規化処理
領域とすれば、パタンの両端の成分も移動することがで
きる。また更に領域によって異なる関数を用いれば局所
的な変形が実現される。
次に画素値の計算方法について説明を行う。変形前の
パタンのアドレス(x,y)に格納されている値をsrc(x,
y)、変形後のパタンのアドレス(x,y)に格納される値
をdst(x,y)で表すとき、次の式(10)に従って画素値
を求める。
すなわち関数FとGによって(X,Y)に対応づけられる
(x,y)が複数存在する場合、言い換えると関数Fまた
はGが多対一対応である場合、対応するsrc(x,y)の総
和を求めてdst(X,Y)に格納する。この変形の意味を次
に第3図を用いて説明を行う。
第3図は1次元のパタンの変形例であり、(a)が変
形前、(b)が参照パタンを表している。
(a)に対して両面から収縮変形を加えると、2つの山
の部分を近ずけることが可能であり、この変形を過剰に
行うと2つの山の位置が一致することが予想される。し
かし式(10)に従って変形を行うと、位置が一致して得
られた山の高さは(c)のように2倍になるから、
(b)のパタンと区別することが出来る。この変形で
は、パタン画素値の総和が保存される。
次に再び第1図を用いて本発明の装置の説明を行う。
特徴抽出部11は、変形パタン102に対して特徴抽出処
理を行い、得られる特徴ベクトルを103として出力す
る。特徴抽出処理の例としては、一定のリサンプリング
点上で以下のような空間微分フィルタとのコンボリュー
ション処理を行い、得られた値を特徴ベクトル103の要
素として出力する。
辞書12は、特徴抽出部11において述べた処理を、あら
かじめ全参照パタンに対して実行して得られる特徴ベク
トルを格納し、制御部14からの読み出し要求信号107に
同期してこれを読み出し104とする。
距離計算部13は、変形パタンから得られる特徴ベクト
ル103と、参照パタンから得られる特徴ベクトル104を入
力し、両者の距離値を求め105として出力する。距離と
しては、例えばL1ノルム、 c1=Σ|a1−b1| (11) またはL2ノルム、 c1=Σ(a1−b1 (12) 等を用いることができる。
制御部14は、変形パラメータ101と距離値105を入力
し、距離値105が最小となるような変形パラメータ101の
値を最適化計算手法を用いた反復処理によって求める。
求まったならば、その収束値と対応する参照パタンのカ
テゴリ番号を信号106として出力し、更に辞書12に対し
て読み出し要求信号107を出力し、次の参照パタンの特
徴ベクトルの読み出しを行う。
次に最適化計算手方の1つである最急勾配法に関して
説明を行う。幾何学変換部10へ入力する変形パラメータ
101をベクトルK={k1,k2,k3,…,kL}で表し、Kを与
えたときに特徴抽出部11において得られる距離値105を
D(K)とすると、以下〜のようになる。
Kの初期値を与える。
i=1,2,3,…Lに対して、 g1=D(K1 +)−D(K1 -) (13) を求める。但しベクトルK1 +とK1 -1はKの第i成分のみ
を、各々正の方向と負の方向にΔ(>0)だけ変化させ
たベクトルであり、次の式(14)のように表すことがで
きる。
K1+{kJ+|kJ +=kJ(j≠i), k1 +=k1 +Δ K1 -={kJ -|kJ -=kJ(j≠i), k1 -=k1−Δ}(1≦j≦L) (14) ベクトルG={g1,g2,g3,…gL} とし、 D′=D(K−α・G/‖G‖) (15) を最小にするような正のスカラ値αを求める。
αが十分に小さくなり、Kの値が収束すれば終了。そ
うでなければ、 K←K−α・G/‖G‖ (16) としてへ。
ベクトルGが最急勾配方向を表し、スカラーαが更新量
を表す。制御部14は、変形パラメータ101と距離値105を
用いて、上述の〜を収束するまで繰り返す。
この方法では、においてベクトルKの全ての成分が
更新されるため、水平方向に関する変形と垂直方向に関
する変形が同時に行なわれる。しかしでは変分法によ
り、他方向の変形を行わない状態でパラメータを変動さ
せて勾配を求めている。一般に各方向に対する最適な変
形の組合せが、両方向に対する最適な変形になるとはい
えない。そこで制御部14は、〜の反復処理をx方向
とy方向の2つのフェーズに分け、各フェーズで1方向
の変形のみに関するパラメーアを更新し、両フェーズを
1回ずつ実行して1回の反復とする。
ソータ15は、制御部14より出力される信号106を貯え
るメモリと、比較演算器等を含んで構成される。信号10
6のデータのうち、距離の収束値をメモリ上でソート
し、その上位候補データを対応するカテゴリ番号と共に
信号108に出力する。
ここでは2つの特徴ベクトル間の距離を最小にする装
置として説明を行ったが、例えば距離ではなく類似度を
最大にするような最適化基準を用いる場合も考えられ
る。この場合、類似度をD(K)で表すとすると、制御
部14での最適化反復処理は以下のようになる。
Kの初期値を与える。
i=1,2,3,…,Lに対して、 g1=D(K1 +)−D(K1 -) (13) を求める。
ベクトルG={g1,g2,g3,…gL} とし、 D'=D(K−α・G/‖G‖) (15) を最大とするような正のスカラ値αを求める。
αが十分に小さくなり、Kの値が収束すれば終了。そ
うでなければ、 K←K−α・G/‖G‖ (16) としてへ。
更にソータ15において収束値を最大値から順にソートす
ることにより、類似度を最大とするような変形が実現さ
れる。
(発明の効果) 以上に説明したように、本発明のパタン正規化装置を
用いることにより、従来に比べ、入力パタンの更に多様
な変形に対応することができる。また最適化の基準を、
特徴ベクトル間の距離の最小化だけでなく、認識対象に
応じて設定することにより、汎用性の高い正規化処理を
実現することができる。
また幾何学変換部においては、画素値の総和が保存さ
れるように変形が行なわれる。これにより例えば入力パ
タンとして漢数字の「二」、参照パタンとして漢数字の
「−」を用いる場合、「二」の両ストロークの位置を上
下方向の収縮変形により一致させても、得られるストロ
ークの高さが倍になるから、特徴ベクトル間の距離が大
きくなり、「−」と識別することができる。本発明には
このような優れた効果がある。
【図面の簡単な説明】
第1図は本発明のパタン正規化装置の一実施例を示すブ
ロック図であり、第2図は正規化領域内の幾何学変換の
例を示す図であり、第3図は幾何学変換における画素値
の計算例を示す図である。 10……幾何学変換部、11……特徴抽出部、12……辞書、
13……距離計算部、14……制御部、15……ソータ、16…
…多値化処理部。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】パタン認識処理において、入力パタンと参
    照パタンから各々特徴抽出を行って得られる特徴ベクト
    ル間の距離が最小となるように、入力パタンに対する幾
    何学的変換を実行し、該入力パタンの形状を正規化する
    装置であって、 入力される2値のパタンを、濃淡パタンに変換する多値
    化処理部と、 与えられた変形パラメータに従って、濃淡パタンに対す
    る幾何学変換を実行し、変形パタンを求める幾何学変換
    部と、 前記変形パタンに対し特徴抽出を行い、変形パタンの特
    徴ベクトルを求める特徴抽出部と、 個々の参照パタンに対し、あらかじめ特徴抽出を行って
    得られる参照パタンの特徴ベクトルを貯えておく辞書
    と、 前記変形パタンの特徴ベクトルと、前記参照パタンの特
    徴ベクトルとの間の距離を計算する距離計算部と、 前記辞書内における全参照パタンの各々について、前記
    変形パラメータの値を正の方向と負の方向に規定値だけ
    変化させ、前記幾何学変換部、前記特徴抽出部、およ
    び、前記距離計算部により、前記正の方向に変化させた
    変形パラメータに基づいて得られた距離と、前記負の方
    向に変化させた変形パラメータに基づいて得られた距離
    の差分に基づき変形パラメータの修正方向を求め、該修
    正方向に変形パラメータを修正した時に得られる距離が
    最小となるように修正量を求め、該修正量が十分小さく
    なり変形パラメータの修正が収束しているかどうかを判
    定し、収束していると判定された場合は前記収束した変
    形パラメータに基づいて得られる距離を最小化された距
    離として出力し、収束していないと判定された場合は変
    形パラメータの修正を繰り返し行う制御部と、 前記参照パタン毎に前記最小化された距離の値を貯えて
    ソーティングを行い、値が最小のものから順に上位候補
    として出力するソータと を含んで構成されることを特徴とするパタン正規化装
    置。
  2. 【請求項2】請求項1に記載のパタン正規化装置におい
    て、 前記幾何学変換部は、パタンの変形前アドレスに対す
    る、変形後アドレスを表す関数が前記変形パラメータに
    より決定され、前記変形後アドレスに対応する前記変形
    前アドレスに格納された値の総和を求め、前記変形後ア
    ドレスに格納する ことを特徴とするパタン正規化装置。
JP1283829A 1989-10-30 1989-10-30 パタン正規化装置 Expired - Lifetime JP2893760B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1283829A JP2893760B2 (ja) 1989-10-30 1989-10-30 パタン正規化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1283829A JP2893760B2 (ja) 1989-10-30 1989-10-30 パタン正規化装置

Publications (2)

Publication Number Publication Date
JPH03144788A JPH03144788A (ja) 1991-06-20
JP2893760B2 true JP2893760B2 (ja) 1999-05-24

Family

ID=17670698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1283829A Expired - Lifetime JP2893760B2 (ja) 1989-10-30 1989-10-30 パタン正規化装置

Country Status (1)

Country Link
JP (1) JP2893760B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5647023A (en) * 1994-07-28 1997-07-08 Lucent Technologies Inc. Method of nonlinear filtering of degraded document images
EP2337163B1 (en) 2008-10-01 2020-07-29 Fujitsu Limited Connector, electronic apparatus, method for removing connector

Also Published As

Publication number Publication date
JPH03144788A (ja) 1991-06-20

Similar Documents

Publication Publication Date Title
Rocha et al. A shape analysis model with applications to a character recognition system
Perwej et al. Machine recognition of hand written characters using neural networks
CN106778739B (zh) 一种曲面化变形文本页面图像矫正方法
JPH06162198A (ja) パターン認識装置
US5479533A (en) Pattern recognition apparatus and method using fuzzy logic
Liou et al. Handprinted character recognition based on spatial topology distance measurement
EP0604687A1 (en) Method for deriving character features in a character recognition system
JP2893760B2 (ja) パタン正規化装置
Ronee et al. Handwritten character recognition using piecewise linear two-dimensional warping
JP2570866B2 (ja) パタン正規化装置
Ramel et al. Automatic reading of handwritten chemical formulas from a structural representation of the image
Ramel et al. A structural representation adapted to handwritten symbol recognition
CN115496784A (zh) 一种基于归一化四维特征向量的点云配准方法
CN112597998A (zh) 一种基于深度学习的扭曲图像矫正方法、装置和存储介质
Cho Recognition of unconstrained handwritten numerals by doubly self-organizing neural network
EP0535786A2 (en) Training system for neural networks
JP3433150B2 (ja) 濃淡画像同定方法、濃淡画像同定装置および濃淡画像同定プログラムを格納する記録媒体、ならびに画像検索方法、画像検索装置および画像検索プログラムを格納する記録媒体
JPH0535871A (ja) 画像処理方法
Rocha et al. New method for word recognition without segmentation
Park et al. Adaptive nonlinear shape matching for unconstrained handwritten character recognition
Yamada et al. Recognition of human kidney ultrasonic organ images by two‐dimensional dp matching method
Mizukami et al. Handwritten digit recognition by hierarchical displacement extraction with gradual prototype elimination
Parker Vector templates and handprinted symbol recognition
Halici et al. Industrial Applications of Hierarchical Neural Networks: Character Recognition and Fingerprint Classification
Singh Shape detection using gradient features for handwritten character recognition