JPH0438587A

JPH0438587A - 入力領域適応型ニューラルネットワーク文字認識装置

Info

Publication number: JPH0438587A
Application number: JP2144414A
Authority: JP
Inventors: Minoru Asogawa; 稔麻生川
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1990-06-04
Filing date: 1990-06-04
Publication date: 1992-02-07
Also published as: US5396565A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野］本発明は、パターンの分類を認識する装置に関し、特に
ノイズを含んだあるいは回転または平行移動した文字パ
ターンの文字認識装置に関する。

〔従来の技術〕

従来、分類問題を扱うことのできる多くの文字認識シス
テムが提案されている。これらについては、例えば「パ
ターン認識」、森健−監修、を子情報通信学会、　（１
９８８）　（以下引用文献１と称す）により詳しく解説
されている。パターン認識の過程は、原パターン信号の
前処理、特徴抽出、識別よりなる。前処理の過程では、
学習したときのパターンと同じくらいになるように、パ
ターンの大きさを拡大縮小してそろえる。また特徴抽出
の過程では、認識を行うのに有効なパターンの性質を特
徴として取り出す。ノイズを含んだあるいは回転または
平行移動した文字パターンが提示された時は、前処理ま
たは特徴抽出の過程が正常に行われず、認識を誤る。

〔発明が解決しようとする課題〕

上述した従来技術では、十分な認識率を達成するために
、前処理または特徴抽出の過程を適切に行う必要がある
。しかしながら適切な、すべての考え得るパターンにつ
いて前処理または特徴抽出の過程を予め決定することは
難しい。

本発明の目的は、ノイズを含んだあるいは入力領域部が
回転または平行移動した文字パターンに対して適応して
ニューラルネットワークを用いて文字認識を行うことに
より、文字認識精度と確度をともに向上することができ
る入力領域適応型ニューラルネットワーク文字認識装置
を提供することにある。

〔課題を解決するための手段〕

本発明の入力領域適応型ニューラルネットワーク文字認
識装置は、標準的な文字パターンおよびその文字パターンのカテゴ
リーを保持する標準文字パターン・カテゴリー・メモリ
部と、ノイズを含んだ回転または平行移動した文字パターンに
対して適応する入力領域部と、標準的な位置に提示され
た文字パターンを認識することのできるパターン連想型
ニューラルネットワークと、パターン連想型ニューラルネットワークを制？１する学
習・認識制御部とを有することを特徴とする。

〔作用〕

本発明では、入力として従来法を用いて大まかに切り出
された文字パターンを用いる。このパターンに対しパタ
ーン連想型ニューラルネットワークを用いて文字認識を
行う。認識結果を用いて入力領域部を文字パターンに対
して適応させる。適応させた入力に対して再度ニューラ
ルネットワークを用いて文字認識を行う。この手続きを
繰り返し文字の認識を行う。前処理は認識結果に基づい
て逐次的に行われ、ノイズを含んだ回転または平行移動
した文字パターンに対しても適切に行われる。また、特
徴抽出の過程は二↓−ラルネットワーク学習によって行
うために、分類する文字パターンに対して適切な特徴抽
出が行われる。

ここで用いるパターン連想型ニューラルネットワークに
は、例えば「日経エレクトロニクス」誌４２７号（１９
８７年８月）のｌ１５頁から１２４頁に［ニューラル・
ネットをパターン認識、信号処理、知識処理に使う」と
題された記事（以下、引用文献２と称す）により詳細に
解説されているパターン連想型ニューラルネットワーク
を用いることができる。

第６図はパターン連想型ニューラルネットワークの構造
の一例を示す構造説明図である。このパターン連想型ニ
ューラルネットワークは入力層５１゜中間層５２．出力
層５３の各層が階層構造になっている。なお中間層５２
は、第６図では１層となっているが、２層以上の多層で
もよい。

パターン連想型ニューラルネットワークの各層のノード
の出力は、そのノードに接続されているノードに重みＷ
を掛けたものの総和の値を、非線形関数により変換した
ものである。この様にパターン連想型ニューラルネット
ワークの変換特性は、重みＷによって決定される。重み
Ｗの値は、学習によって決定される。学習法については
、例えば、引用文献２により詳細に解説されているバッ
クワード・プロパゲーションを用いて実行することがで
きる。

学習が終了したニューラルネットワークに対して、入力
文字パターンＰが提示されたとする。これから入力層５
１の各セルの値が決定する。フォーワード・プロパゲー
ションを用いて出力層５３の各セルの出力値が決定する
。出力層５３の各セルは文字のカテゴリーに対応づけら
れているので、出力値が最大のセルが入力文字パターン
Ｐのカテゴリーとなる。

ノイズを含んだあるいは回転または平行移動した文字パ
ターンが提示された時は、ニューラルネットワークの汎
化能力により、入力文字パターンＰのカテゴリーに対応
する出力層５３のセルの出力が最大となる。

しかしながら、ノイズを含んだあるいは回転または平行
移動しているために、入力文字パターンＰに対応しない
出力層５３のセルにも出力が現れる。

この時に、出力層５３の各セルが出力すべき値を、対応
するカテゴリーのセルは１．０、対応しないカテゴリー
のセルは０．０とする。出力すべき値と出力値を用いて
ニューラルネットワークのエラーを算出する。ここで、
引用文献２により詳細に解説されているバックワード・
プロパゲーションを用いて入力層５１のセルのδ値を求
める。

δ値は、ここで、Ｅは前記のエラー、ｎｅｔは入力層５１のセル
の入力である。

δ値はエラーに対する入力の偏微分係数なので、入力層
５１のセルの入力を一ηδだけ変更すると（但し、０〈
η〈１）、エラーが減少する。

入力層５１のセルの入力の変更は、入力領域にあるセル
の局所的なパターン濃さの勾配を用いて、セルを移動す
ることによって行う。同時に入力領域のセルが、無秩序
に移動しないようにセル間に制約を設ける。

入力領域のセルの移動により、新たに入力層５１の各セ
ルの値が決定する。フォーワード・プロパゲーションを
用いて出力層５３の各セルの出力値が決定する。

以上の手続きを繰り返すことによって、入力領域は出力
層でのエラーが減少するように適応する。

すなわち、学習した時の文字パターンと同じようになる
ように入力領域が適応し、ノイズを含んだあるいは回転
または平行移動した文字パターンに対しても適切な前処
理が行われる。また、特徴抽出の過程はニューラルネッ
トワーク学習によって行うために、分類する文字パター
ンに対して適切な特徴抽出が行われる。

〔実施例〕

本発明の実施例について図面を参照して説明する。

第１図は本発明の人力領域適応型ニューラルネットワー
ク文字認識装置の一実施例を示す構成図である。この入
力領域適応型ニューラルネットワーク文字認識装置は、
標準文字パターン・カテゴリー・　（区分）メモリ部１
１と、パターン連想型ニューラルネットワーク１２と、
学習認識制御部１３と、人力領域部１４と、切換え部１
５とを有している。

標準文字パターン・カテゴリー・メモリ部１１は、学習
用の標準的な文字パターンとそのカテゴリー（区分）と
の組のＮ組を保持している。

パターン連想型ニューラルネットワーク１２は、標準文
字パターンＳｔを入力信号とし、その文字パターンのカ
テゴリーに、を教師信号として学習し、文字パターンＳ
ｔそのカテゴリーＫｔを認識する機能を有する。

学習・認識制御部１３は、パターン連想型ニューラルネ
ットワーク１２の学習と認識の動作を制御する。

入力領域部１４は、パターン連想型ニューラルネットワ
ーク１２の各入力セルを含み、外部からのパターンは入
力領域部１４を通してパターン連想型ニューラルネット
ワーク１２の入力となる。

切換え部１５は、学習と認識とのフェーズの間で、パタ
ーン連想型ニューラルネットワーク１２への入力を切り
換える。

次に、本実施例の動作を説明する。

動作は、パターン連想型ニューラルネットワーク１２の
学習を行う学習フェーズと、装置を用いて文字パターン
の認識を行う認識フェーズからなる。

（１）学習フェーズ学習フェーズについて、第１図と、学習フェーズにおけ
る信号の流れの一例を示す第２図とを用いて説明する。

学習フェーズでは、第１図の切換え部１５は接点ａ側に
切換えられる。

パターン連想型ニューラルネットワーク１２は、標準文
字パターン・カテゴリー・メモリ部１１からの標準文字
パターンＳ１を入力信号とし、その文字パターンのカテ
ゴリーＫｔを教師信号とする。

これらの入力信号と教師信号を基にしてパターン連想型
ニューラルネットワーク１２の内部パラメータの更新を
行う、この更新は、引用文献２に詳細に解説されている
バックワード・プロパゲーションを用いて実行°するこ
とができる０以上に述べた学習操作を、標準文字パター
ン・カテゴリー・メモリ部１１に保持されている標準文
字パターンＳ１とカテゴリーＫｔとについて行う。学習
後の誤差が十分に小さくない場合には、以上に述べた学
習操作を繰り返し、誤差が十分に小さくなるまで学習操
作を繰り返す。

これによって、パターン連想型ニューラルネットワーク
１２の学習は終了する。この学習によってパターン連想
型ニューラルネットワーク１２は、前述の学習によって
文字パターンＳＬを基にして、そのカテゴリーＫｔを認
識する機能を有する。

（２）認識の学習フェーズ認識フェーズについて、第１図と、認識フェーズにおけ
る信号の流れの一例を示す第３図と、認識フェーズにお
ける手続きを示す第４図と、パターン濃さの勾配Ｇ、を
求める説明図である第５図とを用いて説明する。

認識フェーズでは、第１図の切換え部１５は接点す側に
切換えられる。

まず、認識すべきパターンは外部より入力領域部１４に
提示される。この時の認識すべきパターンは原パターン
より大まかに切り出される。この手法については、引用
文献ｌに説明されている。

パターン連想型ニューラルネットワーク１２の各入力セ
ルの入力の計算（第４図ステ・ノブ４１）は、入力領域
の位置において提示されているノでターンの強度に従っ
て計算する。格子点よりΔＸ、Δｙずれた位置にあるセ
ルの入力■　（ΔＸ、Δｙ）は、−例として、以下のよ
うに決定することができる。

ｌ　（ΔＸ、Δｙ）＝　（１−ΔＸ）（１−Δｙ）Ｉｓ
。

＋Δｘ（１−Δｙ）Ｉｔ。

＋　（１−ΔＸ）ΔｙＩｏＩ＋ΔＸΔ）１１＋＋　　　　　　（２）ここでｔ、、、
１．。、■。ｌ＋　　Ｉ。。は、各格子点に対応するパ
ターンの濃さである。

次に、出力の計算（第４図ステ・ンプ４２）は、引用文
献２に詳細に解説されているフォーワード・プロパゲー
ションを用いて実行することができる。

“正解”の選択（第４図ステ・ンプ４３）は、出力のう
ち最大出力のものを正解とする。正解が決まると、平均
２乗誤差Ｅは以下のようになる。

式中、Ｎは出力層のセルの数、Ａ、は、Ａ、が最大出力
であったら１．０、それ以外では０．０である。

０、は、出力層の第ｉセルの出力である。

入力層の各セルのデルタ値の計算（第４図ステップ４４
）は、引用文献２に詳細に解説されているバックワード
・プロパゲーションを用いて実行することができる。こ
れによって、入力層の第ｊセルのデルタ値δ、を求める
ことができる。デルタ値δ、は、出力層での平均２乗誤
差Ｅとは、以下に示されるような関係がある。

ここでｎｅＪは、第ｊ入カセルの入力である。

従って、δ、が正の値のときは、第ｊ入カセルの総入力
ｎｅＪが増加すると、平均２乗誤差Ｅは減少する。その
結果、出力はより“正解”に近付くことになる。このこ
とから、出力をより“正解′。

に近付けるためには、第ｊ入カセルの総入力ｎｅｔＪを
、以下に与えられるようなΔｎｅｔ、だけ変更させれば
良いことが分かる。

Δｎｅｔ、−ηδ、　　　　　　　　　　　　　（５）
出力層のエラーを減少させるために“移動しなければな
らない位置”は、パターン濃さの勾配Ｇ、とΔｎｅｔｊ
を用いて計算する。

パターン濃さの勾配Ｇ、は、−例として、第５図に示す
様に、周囲のパターン濃さを基にして、以下のように内
挿して計算できる。

Ｇｊ　＝ｃ、、Ｊｉ　＋ｃｙ、ａｊ　　　　　　　　　
　（６）＝Δ）’　　（Ｉｚ　　　Ｉｏｎ）＋　（１−Δｙ）　　（１＋。−１０゜）（７）＝ΔＸ
（Ｉｚ　　　１１１１）＋　（１−Δｘ）　　（Ｉｏｎ　　　Ｉｏｏ）　　　　
（８）ここで、Ｉｚ、Ｉｔ。、Ｉｏ、、Ｉ。。は、各位
置に対応するパターンの濃さである。

出力のエラーが減少する様にするためにセルを移動させ
ようとする力を、以下ゾルタカと呼ぶ。

ゾルタカｎ、は、ΔｎｅＪ　とパターンの濃さの勾配Ｇ
、を用いて以下のように計算できる。

上式では、パターンの濃さの勾配ｃｙｊ＝ｏの時は、ゾ
ルタカｎ、は無限大となる。しかしながら、この状態で
はゾルタカｎｊはほぼ０となる必要がある上記のことを
考慮すると、ゾルタカＱａは、−例として、以下のよう
に決定することができる。

入力領域のセル間には、長方形を保つような空間的な制
約力を、以下アドレス力と呼ぶ。アドレス力は、セル間
の距離が増加すると発生しもとの距離に戻そうとする。

この力は、入力領域を長方形に保つことについて働き、
入力領域全体が回転または平行移動しても働かない、第
ｊセルと第ｍセルに働く、アドレス力ＦＪ＋＠は以下の
ように与えられる。

二二で、ｋは、バネ定数、ＪＭは、始点が第ｊセルで終
点が第ｍセルで与えられる位置ベクトル、し４１．は、
第ｊセルと第ｍセルの自然長である。

第ｊセルと第ｍセルに働くアドレス力ｐｊ＋ａを用いて
、第ｊセルに働くアドレス力ＦＪ＋Ｉｌは以下のように
なる。

ＦＪ＝ΣＦｊ、、　　　　　　　　　　　　　　０２１
ここで、入力領域でのセルの新しい位置を決定（第４図
ステップ４５）は、ゾルタカとアドレス力を組み合わせ
てセルの新しい位置を決定する。セルの新しい位置ベク
トルＰ、は、以下のように計算できる。

Ｐ　、＊ｍｗ　＝　Ｐ　、ｏｌｄ十ΔＰＪ”’　　　　
　　　　　Ｑ３１ΔＰ　ｊ”’　＝α、ΔＰ　Ｊ”’＋
ａ！ｏ４十α、　Ｆ　ｊ　　　　　　　　　　　０４）
α１は、前回の位置の変更量に作用するパラメータで、
一種の慣性とみなすことができる。この慣性を用いるこ
とによって、ローカルミニマムを乗り越えて入力領域を
パターンに適応化させることが可能となる。

ここで誤差が十分に小さい値に収束していないならば、
各入力セルの入力を計算（第４図ステップ４１）に、収
束していれば、終了する。

〔発明の効果］本発明の入力領域適応型ニューラルネットワーク文字認
識装置は、大まかに切り出された文字パターンに対して
、ノイズを含んだあるいは入力領域部が回転または平行
移動した文字パターンに対して適応してニューラルネッ
トワークを用いて文字認識を行うことにより、文字認識
精度と確度がともに向上することができるという効果を
有している。また、パターンの提示位置を確定できると
いう効果を有している。

【図面の簡単な説明】

第１図は入力領域適応型ニューラルネットワーク文字認
識装置の一実施例を示す構成図、第２図は学習フェーズ
の信号の流れを示すブロック図、第３図は認識フェーズの信号の流れを示すブロック図、第４図は認識フェーズにおける手続きを示すフローチャ
ート、第５図はパターン濃さの勾配Ｇｊを求める説明図、第６図はパターン連想型ニューラルネットワークの構成
例を示す図である。１１・・・・・標準文字パターン・カテゴリー・メモリ
部１２・・・・・パターン連想型ニューラルネットワーク１３・・・・・学習・認識制御部１４・・・・・入力領域部１５・・・・・切換え部５１・・・・・入力層５２・・・・・中間層５３・・出力層

Claims

【特許請求の範囲】

　（１）　標準的な文字パターンおよびその文字パター
ンのカテゴリーを保持する標準文字パターン・カテゴリ
ー・メモリ部と、ノイズを含んだ回転または平行移動した文字パターンに
対して適応する入力領域部と、標準的な位置に提示された文字パターンを認識すること
のできるパターン連想型ニューラルネットワークと、パターン連想型ニューラルネットワークを制御する学習
・認識制御部とを有することを特徴とする入力領域適応
型ニューラルネットワーク認識装置。