JPH03265986A

JPH03265986A - 文字認識装置

Info

Publication number: JPH03265986A
Application number: JP2065055A
Authority: JP
Inventors: Toru Ueda; 徹上田; Yasushi Ishizuka; 康司石塚; Fumio Togawa; 外川　文雄; Takashi Aramaki; 荒巻　隆志
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1990-03-15
Filing date: 1990-03-15
Publication date: 1991-11-27
Anticipated expiration: 2012-06-25
Also published as: JP2624558B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〈産業上の利用分野〉この発明は、読み取った文字画像情報の１文字の領域を
小領域に分割し、この小領域の特徴量に基づいて文字コ
ードを得る文字認識装置に関する。

〈従来の技術〉従来、文字認識装置として次のようなものがある。すな
わち、文書等から読み取った文字画像情報の１文字領域
を連続した矩形の小領域に分割する。そして、この分割
された小領域における画像情報の特徴量を抽出し、この
小領域の特徴量に基づいて上記１文字領域の画像情報に
対応する文字コードを識別して読み取った文字を認識す
るのである。

その際に用いられる小領域の画像情報の特徴量の一つと
して小領域の中における平均濃度がある。

この小領域の特徴量として平均濃度を用いる方法はメツ
シュ法と呼ばれる。このメツシュ法は次のようにして読
み取った文字画像情報の文字コードを認識する。すなわ
ち、平均濃度が閾値以上の値を示す小領域の特徴量には
“１”を与える一方、そうでない小領域の特徴量には“
０”を与えたメツシュ・パターンを作成する。そして、
このメツシュ・パターンと標準文字の文字画像情報から
同様にして作成された標準文字パターンとを重ね合わせ
、対応する小領域の値が異なる小領域の数を数える。

そして、一番受ない値を取る標準文字パターンの文字コ
ードを読み取った文字画像情報に対する文字コードであ
ると認識するのである。

〈発明が解決しようとする課題〉上述のように、上記メッシュ法に代表される文字認識装
置においては、上記小領域における特徴量をその小領域
の画像情報から直接抽出する（すなわち、画像情報その
ものの特徴量を表す）ようにしている。そのために、例
えば特定の平板名の特徴量を抽出する場合、平板名のみ
からなる文章から抽出された上記特定の平板名の特徴量
とＪＩＳ第１水準の漢字と平板名とから成る文章から抽
出された上記特定の平板名の特徴量とは全く同じ特徴量
となる。

ところか、平板名（４６字）のみから成る文字群の文字
形態差の特徴とＪＩＳ第１水準の漢字と平板名とから成
る（合計約３０００字）文字群の文字形態差の特徴とは
異なるのである。したがって、特定の平板名文字を認識
する際に、平板名のみから成る文字群において上記特定
の平板名文字を認識する際の特徴量と、ＪＩＳ第１水準
の漢字と平板名とから成る文字群において上記特定の平
板名文字を認識する際の特＠量とは異なって然るべきで
ある。

しかしながら、上述のように従来の文字認識装置におい
ては小領域の特徴量を画像情報から直接抽出するように
しているので、小領域の画像情報の特徴を表すことはで
きるが認識対象文字群の文字形態差の特徴を表すことが
できないのである。

したがって、平板名のみから成る文字群において特定の
平板名を認識する場合と、ＪＩＳ第１水準の漢字と平板
名とから成る文字群において上記特定の平板名を認識す
る場合との認識能力に差が生じてしまうと言う問題があ
る。

また、１文字領域を小領域に分割する際に、上述のよう
に一律に連続した矩形の小領域に分割しているために、
手書き文字のように文字を形成する線の位置が書き手に
よって変動する場合には、同じ文字を構成する線である
にも拘わらず認識対象文字に係る１文字領域と標準パタ
ーンに係る１文字領域とにおいて異なった小領域に属す
る場合があり、文字認識能力が低下すると言う問題もあ
る。

さらに、上記１文字領域を小領域に分割する際に、矩形
の領域に等分割しているため、個々の小領域は識別対象
の文字群の文字形態差が良く表れる箇所を網羅できるよ
うな形状になっていない。

したがって、上記小領域に係る特徴量は十分に認識対象
文字群の文字形態差を表すことができず、小領域の特徴
量に基づいて文字を認識しようとする場合には１文字領
域を構成する総ての小領域について特徴量を求める必要
があり、文字認識処理の効率が悪いと言う問題もある。

そこで、この発明の目的は、１文字領域を構成する小領
域の特徴量を認識対象文字群の文字形態差を適確に表す
ように算出して、文字群の文字形態差の特徴が異なる種
々の文字群のいずれに対しても高い文字認識能力を有し
、かつ、認識効率の良い文字認識装置を提供することに
ある。

く課題を解決するための手段〉上記目的を達成するため、第１の発明は、読み取った文
字画像情報から１文字領域の画像情報を切り出し、この
１文字領域の画像情報に基づいて上記文字画像情報に対
応する文字コートを認識する文字認識装置において、上
記１文字領域の画像情報を小領域に分割する領域分割部
と、上記領域分割部によって分割された小領域の画像情
報と認識対象文字群における文字形態差を上記小領域別
に良く表すようなテンプレートとの類似度に基づいて、
上記小領域における特徴量を算出する特徴量算出部と、
上記１文字領域を構成する総ての小領域における上記特
徴量算出部によって算出された特徴量に基づいて、上記
読み取られた文字画像情報に対応する文字コードを認識
する文字コード認識部を備えたことを特徴としている。

また、第２の発明は、上記第１の発明の文字認識装置に
おいて、上記領域分割部は、上記１文字領域の文字画像
情報を小領域に分割する際に、互いに隣接する小領域を
オーバーラツプさせて分割するように成したことを特徴
としている。

また、第３の発明は、上記第１または第２の発明の文字
認識装置において、上記領域分割部は、上記１文字領域
の文字画像情報を小領域に分割する際に、認識対象文字
群における文字形態差が良く表れる箇所を網羅するよう
な種々の形状に分割するように成したことを特徴として
いる。

また、第４の発明は、上記第１乃至第３の発明のいずれ
かの文字認識装置において、学習に際して、入力された
学習用ベクトルの内容に近付くように上記入力された学
習用ベクトルに応した特定のウェイトベクトルの内容を
更新するニューラルネットワークを備えて、上記認識対
象文字群を代表するような複数の学習用文字の文字画像
情報に基らいて上記小領域毎に作成された学習用ベクト
ルを用いて上記ニューラルネットワークを学習し、各学
習用ベクトルの内容に近付くように更新された結果上記
認識対象文字群を代表する各学習用文字の文字形態差を
良く表すように設定されたウェイトベクトルを上記特＠
量算出部で上記小領域の特徴量を算出する際に用いるテ
ンプレートとすることを特徴としている。

また、第５の発明は、上記第１乃至第４の発明のいずれ
かの文字認識装置において、上記文字コード認識部は、
上記１文字領域を構成する総ての小領域における上記特
徴量算出部によって算出された特徴量に基づく入力ベク
トルか入力されると、その入力ベクトルが属する文字コ
ードを識別するように学習された文字識別ニューラルネ
ットワークで構成したことを特徴としている。

〈作用〉第１の発明において、読み取られた文字画像情報から１
文字領域の画像情報が切り出されて領域分割部に入力さ
れる。そして、この領域分割部によって上記１文字領域
の画像情報が小領域に分割される。そうすると、特徴算
出部は、上記領域分割部によって分割された小領域の画
像情報とテンプレートとの類似度に基づいて、上記小領
域における特徴量を算出する。こうして、上記１文字領
域を構成する総ての小領域における特徴量が算出される
と、この１文字領域を構成する総ての小領域における特
徴量に基づいて、上記読み取られた文字画像情報に対応
する文字コードが文字コード認識部によって認識される
。

その際に、上記テンプレートは認識対象文字群の文字形
態差を良く表すように設定されているので、このテンプ
レートに基づいて算出される各小領域の特徴量は、認識
対象文字群における文字形態差を各小領域毎に良く表し
ているのである。したがって、文字群の文字形態差の特
徴が異なる種々の文字群のいずれにおいても正しく文字
コードが認識される。

また、第２の発明において、上記１文字領域の文字画像
情報が上記領域分割部によって小領域に分割されるに際
し、互いに隣接する小領域かオーバーラツプするように
分割される。

したがって、手書き文字のように文字を形成する線が書
き手によって変動し、かつ、その線が隣接する小領域の
境界付近に位置するような場合であっても、同じ文字を
形成する線は認識対象文字に係る１文字領域と標準パタ
ーンに係る１文字領域とにおける同じ小領域に属するよ
うになる。その結果、認識対象文字の特徴パターンとそ
の文字の標準パターンとの類似度かより高くなるのであ
る。

また、第３の発明において、上記１文字領域の文字画像
情報が上記領域分割部によって小領域に分割されるに際
し、認識対象文字群における文字形態差が良く表れる箇
所を網羅するような種々の形状に分割される。

したがって、上記特徴量算出部によって行われる上記小
領域の特徴量の算出は、認識対象文字群における文字形
態差が良く表れる箇所を網羅するように分割された種々
の形状の小領域のみにおいて、効率良くしかも精度良〈
実施される。

また、第４の発明において、上記認識対象文字群を代表
するような複数の学習用文字の文字画像情報に基づいて
学習用ベクトルが上記小領域毎に作成される。そして、
この学習用ベクトルがニューラルネットワークに入力さ
れてウェイトベクトルの内容か学習用ベクトルの内容に
近付くように学習が行われる。そうすると、上記ニュー
ラルネットワークのウェイトベクトルは上記認識対象文
字群を代表する各学習用文字の文字形態差を良く表すよ
うに更新される。こうして、認識対象文字群を代表する
各学習用文字の文字形態差を良く表すように設定された
ウェイトベクトルは上記特徴量算出部によって上記小領
域の特徴量を算出する際のテンプレートとして用いられ
る。

したかって、上記学習用ベクトルを上記ニューラルネッ
トワークに入力するだけで、認識対象文字群の文字形態
差を良く表すような、テンプレートが自動的に作成され
る。

また、第５の発明において、上記特徴量算出部によって
上記１文字領域を構成する小領域における特徴量が算出
される。そして上記１文字領域を構成する総ての小領域
における特徴量に基づいて入力ベクトルが作成される。

こうして作成された人力ヘクトが、その入力ベクトルが
属する文字コートを識別するように学習された文字識別
ニューラルネットワークに入力される。そうすると、上
記文字識別ニューラルネットワークによって、上記入力
ベクトルか属する文字コートが識別され、上記読み取ら
れた文字画像情報に対応する文字コードが認識される。

したかって、類似度算出等の複雑な処理を実施すること
なく、簡単な処理で上記読み取られた文字画像情報に対
する文字コードが認識される。

〈実施例〉以下、この発明を図示の実施例により詳細に説明する。

この発明は、切り出された１文字領域の文字画像情報を
構成する小領域の特徴量を求めるに際し、認識対象文字
群の文字形態差を良く表すような特徴量を求めることに
よって、認識対象文字群の内容に因らずに高い文字認識
率を得るものである。

ｍ引り第１図はこの発明の文字認識装置における−実流側を示
すブロック図である。第り図において、スキャナｌは、
呈示された文書等から文字画像情報を読み取り第１バツ
フア２に一時格納する。文字切出し部３は、第１バツフ
ア２に格納された文字画像情報を読み出して１文字領域
に切り出し、この切り出された１文字領域の文字画像情
報を領域分割部４に出力する。領域分割部４は、文字切
出し部３によって切り出された！文字領域の文字画像を
更に小領域に分割し、分割された各小領域毎の画像情報
を第２バツフア５に一時格納する。

特徴量算出部６は、第２バツフア５に格納された各小領
域毎の画像情報のうち一つの小領域の画像情報を順次読
み出し、この読み出した小領域の画像情報とテンプレー
ト・メモリ７に格納されている上記小領域に対応する種
々のテンプレートとの類似度を、後に詳述するようにし
て算出する。

そして、こうして算出された一つの小領域における複数
の類似度から成るベクトルをその小領域の特徴！（特徴
ベクトル）として第３バツフア８に一時格納する。

類似度算出部９は、１文字領域を構成する総ての小領域
の特徴量を第３バツフア８から読み出して１文字の特徴
パターン（特徴ベクトルのパターン）を得る。そして、
１文字の特徴パターンとパターン・メモリｌＯに格納さ
れた種々の標準文字パターンとの類似度を算出する。こ
こで、上記標準文字パターンは、認識対象文字の標準と
なる文字画像情報から上述と同様にして求めた特徴ベク
トルのパターンである。こうして、類似度算出部９によ
って算出された各標準文字パターンとの類似度（例えば
、両特徴ベクトルの積和等）のうち、最も類似度の大き
な標準文字パターンに対応する文字コードを読み出した
文字画像情報の文字コードであると認識する。すなわち
、上記類似度算出部９および標準パターン・メモリ１０
て文字コード認識部を構成するのである。

こうして認識された文字コードは認識結果としてインタ
ーフェース１１から外部機器に送出される。

ＣＰＵ（中央処理装置）１２は、上記スキャナｌ第１バ
ツフア２１文字切出し部３．領領域割部４゜１２バッフ
ァ５．特徴量算出部６．第３バッファ８類似度算出＠９
およびインターフェース１１を制御して、次のように文
字認識処理を実行する。

第２図は上記ＣＰＵ１２によって実施される１文字認識
処理動作のフローチャートである。以下、第２図に従っ
て本実施例における１文字認識処理動作について述べる
。

ステップＳ１で、文書等からスキャナ１によって文字画
像情報が読み取られて、文字画像が入力される。

ステップＳ２で、スキャナ１で読み取られた文字画像情
報に基づいて、文字切出し部３によって１文字領域の文
字画像情報が切り出される。

ステップＳ３で、文字切出し部３で切り出された１文字
領域の文字画像情報が、領域分割ｆｆ４によって更に小
領域に分割される。

ステップＳ４で、領域分割［４で分割された１文字領域
を構成する各小領域の画像情報が１小領域づつ順次特徴
量算出部６によって読み出され、テンプレート・メモリ
７に格納されている上記小領域に対応した種々のテンプ
レートとの類似度か算出される。そして、得られた種々
のテンプレートに係る複数の類似度から成るベクトルを
その小領域の特徴量とする。

その際に実施される類似度の計算方法は種々あるか、例
えばユークリッド距離の値を求めてその値の逆数を取れ
ばよい。

ステップＳ５で、上記ステップＳ４において得られた１
文字領域を構成する全小領域の特徴量が類似度算出部９
によって読み出され、その結果得られた１文字の特徴パ
ターンとパターン・メモリ１０に格納された種々の標準
文字パターンとの類似度が算出される。

ステップＳ６で、上記ステップＳ５において算出された
類似度のうち最も類似度の高い標準文字パターンに対応
する文字コートか、上記ステップＳ２で切り出された１
文字領域の文字画像に対応する文字コードとして認識さ
れる。そして、こうして認識された文字コートがインタ
ーフェース１１を介して外部機器に出力され、１文字認
識処理動作を終了する。

次に具体的な例を挙げて、本実施例における文字認識処
理について、さらに詳細に説明する。

第３図は例えば文字「大」と文字「犬」とから成る文字
群から文字「大」を識別して認識する場合の例である。

第３図（ａ）は文字「大」の文字画像であり、第３図（
ｂ）は文字「犬ｊの文字画像である。また、第３図（ｃ
）は、第３図（ａ）および第３図（ｂ）を４×４のメツ
シュ状の小領域に分割した際における最右上の小領域２
１．２１’に対する類似度算出時に用いるテンプレート
である。

まず、第２図におけるステップＳ４において、例えば小
領域２１．２１’における類似度算出が次のようにして
行われる。すなわち、小領域２１゜２１’およびテンプ
レートが更に例えば４×４の１６領域の線領域に分割さ
れる。そして、第３図（ａ）における小領域２１あるい
は第３図（ｂ）における小領域２１’の各線領域のうち
、第３図（ｃ）に示す各テンプレートにおける１６個の
線領域と一致する（両紙領域における平均濃度が閾値に
対して同し側にある）！［］領域が幾つ在るかを数える
。そして、得られた値を小領域２１あるいは小領域２１
°と夫々のテンプレート（イ）、（ロ）、（ハ）、（ニ
）との類似度とするのである。したがって、テンプレー
トの線領域と小領域の線領域とが総て一致すればその小
領域とテンプレートとの類似度は“１６”となり、テン
プレートの線領域と小領域の線領域とが総て一致しなけ
ればその小領域とテンプレートとの類似度は“０“とな
る。

第３図（ａ）における文字画像「大」の小領域２１およ
び第３図（ｂ）における文字画像「犬」の小領域２１′
と夫々のテンプレート（イ）、（ロ）、（ハ）、（ニ）
とから得られた類似度を第１表に示す。

第１表同様にして、小領域２１．２１以外の小領域に対する類
似度の算出か実行される。その際に用いられるテンプレ
ートは、第３図（Ｃ）に示すテンプレートとは異なり、
類似度を算出しようとしている小領域に対応するテンプ
レート群が用いられる。

第１表より、テンプレート（ロ）以外の各テンプレート
（イ）、（ハ）、（ニ）と文字画像「大」における小領
域２１との類似度の値は、文字画像「犬」における小領
域２１’との類似度の値とは大きく異なる。

これは、テンプレート　（イ）、（ハ）、（ニ）は文字
群「大」および「犬」の小領域２１．２１’における文
字形態差を良く表しているからである。そこで、上記文
字画像「大」においては各類似度から成るベクトル（１
６，８，８，０）を小領域２１の特徴量とし、文字画像
「犬」においては各類似度から成るベクトル（１０，８
，１４，６）を小領域２１′の特徴量とするのである。

これに対して、文字画像「大」における小領域２１以外
の小領域と文字画像「犬」における小領域２１°以外の
小領域とはほぼ同じ画像情報を有しているので、各小領
域におけるテンプレートとの類似度も同じ値となる。し
たかって、小領域２１２１”以外の小領域の特徴量は同
じとなる。すなわち、小領域２１．２１’の特徴量の差
によって文字−大」と文字「犬」との文字形態差が良く
表れ、文字「大」と文字「犬」とから成る文字群から文
字１大」を識別して認識できるのである。

すなわち、本実施例においては、認識対象文字群に属す
る各文字の画像情報差を良く表すようなテンプレート群
を各小領域毎に用意することによって、各小領域におけ
る画像情報の特徴ではなく画像情報差の特徴を良く表す
ような特徴量を得ることかできるのである。したがって
、例えば平板名のみから成る文字群の文字形態差を表す
種々のテンプレートとＪＩＳ第１水準の漢字と平板名と
から成る文字群の文字形態差を表す種々のテンプレート
とを各小領域別に用意することによって、上述のような
各文字群の内容に応じて各文字群の文字形態差を各小領
域毎に良く表す特徴量を得ることができるのである。

つまり、本実施例による小領域の特徴量を用いれば、平
板名のみから成る文字群において特定の平板名を認識す
る場合も、ＪＩＳ第１水準の漢字と平板名とから成る文
字群において上記特定の平板名を認識する場合も高い認
識能力が得られるのである。

このように、本実施例においては、スキャナｌから読み
取られて文字切出し部３によって１文字領域に切り出さ
れた文字画像情報を、領域分割部４によって複数の小領
域に分割する。その後、特徴量算出部６によって、各小
領域毎に小領域の画像情報とテンプレートメモリ７に格
納された上記小領域に対応した種々のテンプレートとの
類似度を算出し、得られた複数の類似度から成るベクト
ルをその小領域の特徴量とする。そして、こうして算出
された１文字領域に係る全小領域の特徴量からなる識別
対象文字の特徴パターンとパターン・メモリｌＯに格納
された標準文字パターンとの類似度を類似度算出部９に
よって算出し、最も類似度の高い標準文字パターンに対
応した文字コードを識別対象文字のコードであると認識
するようにしている。

し乙がって、認識対象文字群の文字形態差に応した種々
のテンプレートを各小領域別に用意することによって、
識別対象となる文字群の文字形態差を各小領域毎に良く
表すことができるような特徴量を得ることができる。す
なわち、本実施例によれば、文字群の文字形態差の特徴
が異なる種々の識別対象文字群のいずれに対しても高い
文字認識能力を得ることかできるのである。

実施例■ 実施例■は、上述の実施例Ｉにおいて、第１図に示す領
域分割部４によって実施される１文字領域の小領域への
分割における分割方法に関するものである。

第６図は、従来の方法によって１文字領域を連続した矩
形の小領域に等分割した場合の例を示す。

この場合、第６図（ａ）においては文字「大」の縦線が
小領域２７に存在している。一方、第６図（ｂ）におい
ては文字「大」の縦線か小領域２６°に存在している。

したがって、例えば第６図（ａ）が認識対象の文字画像
であり、第６図（ｂ）が標準文字パターンに係る文字画
像であるとすると、第１図に示す類似度算出部９によっ
て実行される認識対象文字の特徴パターンとその文字の
標準文字パターンとの類似度算出の際に高い類似度が得
られな０のである。上述のような問題は、特に手書き文
字の認識の場合に頻繁に発生する。

そこで、本実施例においては、第４図に示すように、互
いに隣接する小領域（例えば、小領域２２と小領域２３
）を１７３ずつオーバーラツプさせるのである。こうす
ることによって、次のような効果が生じる。すなわち、
第５図（ａ）においては文字「大」の縦線は小領域２４
に存在しており、かつ、第５図（ｂ）においても文字「
大」の縦線は小領域２４°に存在していることになるの
である。したがって、第１図の類似度算出部９によって
実行される認識対象文字の特徴パターンとその文字の標
準文字パターンとの類似度算出の際に高い類似度が得ら
れるのである。

その際に、第５図（ａ）における小領域２５にも文字「
大」の縦線か存在することになる。しかしながら、この
場合には、第５図（ｂ）における小領域２５′には文字
「大」の縦線は存在しないので、小領域２５と小領域２
５°との類似度は低い値と成って問題はないのである。

このように、本実施例においては、上述の実施例１にお
ける領域分割部４によって実施される１文字領域の小領
域への分割に際して、隣接する小領域を互いにオーバー
ラツプさせるようにしている。したがって、文字を形成
する線が互いに隣接する小領域の境界部分に存在する場
合であっても、上記文字を構成する線が認識対象の文字
画像と標準文字パターンに係る文字画像との互いに対応
する小領域に存在するようになる。

したがって、第１図における類似度算出部９によって実
行される１文字の特徴パターンに係る類似度算出の際に
高い類似度が得られ、その結果高い文字認識能力が得ら
れる。

上記実施例においては、互いに隣接する小領域をオーバ
ーラツプさせる範囲を小領域の１７３としているが、こ
の値に限定されるものでないことは言うまでもない。

上記実施例においては、互いに水平方向に隣接する小領
域をオーバーラツプさせているが、互いに垂直方向に隣
接する小領域をオーバーラツプさせても何ら差し支えな
い。

実施例■ 実施例■は、上述の実施例■と同様に、１文字領域の小
領域への分割における分割方法に関するものである。

上述の各実施例においては、１文字領域を複数の小領域
に分割する際に、各小領域を同じ大きさおよび同じ形状
（矩形）の小領域に分割するようにしている。その場合
には、各小領域の形状は認識対象文字群の文字形態差が
良く表れる箇所を網羅できないような一律の形状となる
ので、１〜３個の小領域から得られる特徴量のみでは認
識対象文字群の文字形態差の特徴を表すことかできない
。

したがって、１文字領域を構成する総ての小領域につい
ての特徴量を求め、その全小領域の特徴量によって表現
される１文字領域のパターンによって１文字の特徴を表
さなければならない。つまり、特徴量算出部６によって
行われる小領域の画像情報とテンプレートとの類似度算
出処理を、１文字領域を形成する１６個の小領域の総て
について実行しなければならず、特徴量算出の効率が悪
いのである。

そこで、本実施例においては、第７図に示すように小領
域の形状を、認識対象文字群の文字形態に応じてその文
字形態差が良く表れる箇所を網羅できるような種々の形
状にすることによって、第１図に示す特徴量算出部６に
よる小領域に係る特徴量算出処理を効率良くしかも精度
良く行うものである。第７図は文字「大」を認識する際
に用いられる小領域の例である。この場合には、文字−
大」をこの文字「大」に似た文字（例えば、「犬」、「
木」「水」、「太」、「状」、「伏」等）から容易に識
別できるように、小領域の形状を設定するのである。そ
のために、本実施例においては、小領域２８．小領域２
９および小領域３０を設ける。

上記小領域２８は、略正方形の１文字領域における図中
左側の垂直な辺に沿った帯状を成している。すなわち、
この小領域２８は認識対象文字群の１文字領域における
左側の文字形態差を表すための領域であり、文字群「大
」、「犬」、「木Ｊ、ｒ水」、「太」等と文字「状」、
「伏」等とを識別するための小領域である。また、小領
域２９は、１文字領域における左側の垂直な辺から下側
の水平な辺に沿ってＬ字形の帯状を成している。すなわ
ち、この小領域２９は１文字領域における左側から下側
へかけての文字形態差を表すための領域であり、文字「
大」「犬」等と文字「木」、「水」、「太」、「状」、
「伏ｊ等とを識別するための小領域である。さらに、小
領域３０は１文字領域における右上の一角に在って矩形
を成している。すなわち、この小領域３０は１文字領域
における右上角の文字形態差を表すための領域であり、
文字「大」と文字「犬」等とを識別するための小領域で
ある。

そして、上記小領域２８に対応したテンプレートとして
、文字群「大」、「犬」、「木」、「水」、「太」、「
状」「伏」等の小領域２８に対応する領域の文字形態差
を良く表すような種々のテンプレートを用意する。

同様に、上記小領域２９あるいは小領域３０に対応した
テンプレートとして、文字群「大」、「犬」江木」。

「水」、「太」、「状」、「伏」等の小領域２９あるい
は小領域３０に対応する領域の文字形態差を良く表すよ
うな種々のテンプレートを用意するのである。

こうして、第２図におけるステップＳ４において、１文
字領域の上記各小領域２Ｂ、２９．３０における画像情
報と夫々の小領域に対応した種々のテンプレートとの類
似度算出を実施することによって、入力された文字「大
」の文字画像情報に対応する文字コードを文字群「大」
、「犬」、「木」、「水」、「太」「状」、「伏」等の
文字コードの中から適確に識別して認識できるのである
。

その際に、第７図から明らかなように、本実施例におけ
る小領域２８，２９．３０は上記各実施例の場合のよう
に１文字領域を総て網羅するように形成する必要はなく
、認識対象文字群の文字形態差が良く表れている箇所さ
え網羅していれば十分である。

このように、本実施例においては、上述の実施例１ある
いは実施例■における領域分割部４によって実施される
１文字領域の小領域への分割に際して、認識対象文字群
の文字形態差が良く表れる箇所を網羅できるような種々
の形状の小領域に分割するようにしている。したがって
、特徴量算出に際しては、認識対象文字群の文字形態差
が良く表れるような小領域のみにおいてテンプレートと
の類似度算出を実行すればよいのである。

すなわち、本実施例によれば、１文字領域の特徴量算出
に際して認識対象文字群における文字形態差を十分に表
すような特徴量を算出することができ、かつ、１文字領
域を構成する総ての小領域においてテンプレートとの類
似度算出を実行する必要がなく、小領域に係る特徴量算
出処理を精度良くしかも効率良〈実施できる。

寒監聾■ 実施例■は、例えば上述の実施例Ｉにおいて、第１図に
示す特重量算出部６で類似度を算出する際に使用される
種々のテンプレートの作成に関する例である。その際に
、本実施例におけるテンプレートの作成は、ニューラル
ネットワークを用いて自動的に作成する。

第８図は本実施例に係る文字認識装置の部分ブロック図
である。この文字認識装置は第１図に示す文字認識装置
にテンプレート・メモリ７に格納されるテンプレートを
作成する自己組織化ニューラルネットワーク３１を付加
したちのである。ここで、第８図には第１図のブロック
図における特徴量算出部６およびテンプレート・メモリ
７とそれらに付加された自己組織化ニューラルネットワ
ーク３１のみを記載し、その他の部分は第１図と全く同
じであるため記載を省略しである。

第８図において、文字認識に先立って、認識対象文字群
を代表する文字における文字画像情報の上記小領域に対
応する画像情報を表すベクトルが、学習用ベクトルとし
て自己組織化ニューラルネットワーク３１に入力される
。そうすると、自己組織化ニューラルネットワーク３１
は、後に詳述するように、内部に有している学習ベクト
ルに応じた特定のウェイトベクトルの内容を入力された
学習用ベクトルの内容に近付けるように学習するのであ
る。次に、他の小領域に係る種々の学習用ベクトルが順
次自己組織化ニューラルネットワーク３１に入力される
と、同様にして学習が実行され、自己組織化ニューラル
ネットワーク３１内には夫々の学習用ベクトルを写像し
た複数のウェイトベクトルが生成されるのである。

つまり、学習済みの自己組織化ニューラルネットワーク
３１に生成されたウェイトベクトルは、認識対象文字群
を代表する文字（以下、学習用文字と言う）の文字画像
の各小領域に係る画像情報を良く表すような内容を有す
るのである。このことは、取りも直さず、学習済みの自
己組織化ニューラルネットワーク３１内に生成されたウ
ェイトベクトルは上記小領域における類似度算出の際に
用いるテンプレートであると言える。そこで、自己組織
化ニューラルネットワーク３１内に生成された各ウェイ
トベクトルを、入力文字画像の各小領域における類似度
算出の際に用いられるテンプレートとして、各小領域と
対応付けてテンプレート・メモリ７に格納するのである
。

文字認識処理が開始されると、実施例１の場合と同様に
して、１文字の文字画像情報が小領域に分割されて第２
バツフア５に格納される。そして、この第２バツフア５
に格納された小領域の画像情報と、上述のようにして作
成されてテンプレート・メモリ７に格納された上記小領
域に対応したテンプレートとが特徴量算出部６によって
読み出される。そして、上記小領域の画像情報と上記種
々のテンプレートとの類似度が特徴量算出部６によって
算出される。その結果、上述のようにして得られた上記
小領域の特徴量が第３バツフア８に格納されるのである
。その後、実施例Ｉの場合と同様にして１文字の特徴パ
ターンが求められ、この１文字の特徴パターンと標準文
字パターンとの類似度が算出されるのである。

第９図は本実施例に係る自己組織化ニューラルネットワ
ーク３１の概略図である。本実施例における自己組織化
ニューラルネットワーク３１としては、自己組織化特徴
写像によって学習が行われるコホーネン型ニューラルネ
ットワークを用いる。

このコホーネン型ニューラル・ネットワークの構造は、
総ての自己組織化ノード３２，３２．・・・が入力ノー
ド３３に対して結合された構造なっている。自己組織化
ノード３２は、複数の自己組織化ノード３２，３２．・
・・に付加された番号ｉで表すことにする。例えば、自
己組織化ノード３２ｉはｉ番目の自己組織化ノードを表
す。

上記人力ノード３３には上記１文字領域を構成する小領
域の画像情報を表す６４次元の学習用ベクトルＸが入力
される。そうすると、学習用ベクトル又とウェイトベク
トルＷとに基づいて、所定のアルゴリズムに従って出力
値が各結合毎に算出される。ここで、上記ウェイトベク
トルＷは自己組織化ノード３２に対応付けて設けられて
おり、自己組織化ノード３２ｉに対するウェイトベクト
ルはＷｉ”と表すことにする。

本実施例においては、上記コホーネン型二二一うルネッ
トワークの学習を自己組織化特徴写像によって実施する
。そして、入力ノード３３に入力された学習用ベクトル
Ｘの内容の特徴を上記学習用ベクトルＸに応じた特定の
ウェイトベクトルＷ１の内容に写像することによって、
認識対象文字群を代表する学習用文字に係る各小領域の
画像情報を良く表すようなウェイトベクトルを自己組織
するものである。

上記自己組織化特徴写像による学習は、学習用ベクトル
Ｘを入力した際に、入力された学習用ベクトルＸとの類
似度が最も高いウェイトベクトルＷに対して実施される
学習である。すなわち、この自己組織化特徴写像による
学習のアルゴリズムは（１）式によってウェイトベクト
ルＷの値を更新することによって行われる教師無し学習
である。

Ｒ（Ｘ　（ｔ）、Ｗｃ（ｔ））　＝ｍａｘ［Ｒ（Ｘ　（
ｔ）、Ｗｉ（ｔ）））とした場合に、以下余白− ここで、ｔ：学習回数Ｘ：学習用ベクトルＷ：　ウェイトベクトルｉ：ウェイトベクトル番号ＷＣ：学習用ベクトルＸとの類似度が最大のウェイトベクトルＲ（Ａ、Ｂ）：ベクトルＡとベクトルＢとの類似度を求
める関数ａ（ｔ）：学習回数ｔと共に減少する関数Ｎｃ：Ｗｃの
近傍に設けられた所定領域内のベクトル番号の集合すなわち、自己組織化特徴写像による学習は、学習用ベ
クトルＸを入力した際に、この学習用ベクトルＸとの類
似度が最大であるウェイトベクトルＷｃの近傍に設けら
れた所定領域内に存在するウェイトベクトルＷｉ（ｉＥ
Ｎｃ）の内容を、学習用ベクトルＸとの差（Ｘ−Ｗｉ）
の値を小さくするように更新するのである。こうして学
習が繰り返されることによって、やがてウェイトベクト
ルＷｉは学習用ベクトルＸの内容と同じようになり、ウ
ェイトベクトルＷｉに学習用ベクトルＸの内容の特徴が
写像されるのである。その結果、自己組織化ノード３２
ｉが自己組織されるのである。

次に、上述の自己組織化特徴写像による学習を上記小領
域に係る類似度算出時に使用するテンプレートの作成に
利用する場合について、学習用文字「犬」に係る学習用
ベクトルを入力した場合を例に詳細に説明する。

６４Ｘ６４のマトリックス構造を成すイメージセンサに
よって読み取られた文字画像情報の外枠が一定の大きさ
になるように正規化され、第９図に示すような３２Ｘ３
２のメッンユ状の！文字「犬」の文字画像情報が得られ
る。さらに、この３２×３２のメッンユ状の１文字の文
字画像情報が４×４の小領域３４．・・・に分割される
。したがって、各小領域は８×８のメツシュから構成さ
れることになる。

次に、例えば、上述のようにして得られた各小領域のう
ち右上の小領域３４の画像情報を学習用ベクトルＸ。と
じた場合について説明する。

上記小領域３４の６４個のメッ７ュにおける画像情報を
６４次元の学習用ベクトルＸ０の各要素として、入力ノ
ード３３に入力する。その際における上記画像情報とし
ては上述の平均濃度を用い、メツシュの平均濃度が閾値
以上であればそのメツシュの画像情報として“ビを与え
る一方閾値より小さければ“０“を与えればよい。そう
すると、各自己組織化ノード３２ｉに対応付けられたウ
ェイトベクトルＷｉ毎に、このウェイトベクトルＷｉと
学習用ベクトルＸ０との類似度Ｒが算出される。

ここで、本実施例における自己組織化ニューラルネット
ワークは次のような概略構造になっている。すなわち、
この自己組織化ニューラルネットワークは一組１６個Ｘ
１６組（＝２５６個）の自己組織化ノード３２を有する
（ｌ≦ｉ≦２５６）。そして、夫々の組に属する１６個
の自己組織化ノート３２．３２．・・・は異なる一つの
入力ノードに結合されると共に、１文字領域を構成する
各小領域のいずれか一つに対応付けられている。第９図
においては小領域３４に対応付けられた一組の自己組織
化ノードのみが記載されている。したがって、小領域３
４に係る類似度算出は、第９図に示す一組１６個の自己
組織化ノード３２ｉ（１≦１≦１６）に対応付けられた
ウェイトベクトルＷ１（１≦ｉ≦１６）について実施さ
れる。すなわち、その際の類似度ＲｉはＲ（Ｘ　ｏ、Ｗ
　ｉ）　（１≦ｉ≦１６）となる。

こうして、類似度Ｒｉが算出された結果、ウェイトベク
トルＷｉ０との類似度が最大であった（すなわち、Ｒｍ
ａｘ＝Ｒｉｏ＝Ｒ（Ｘｏ、Ｗｉｏ））とすると、ウェイ
トベクトルＷｉ０を中心とした所定領域内のウェイトベ
クトルＷｉ（ｉｅＮｉｏ）の内容が学習用ベクトルｘ０
の内容に近付くように更新されるのである。こうした学
習が繰り返された結果、最大類似度Ｒｍａｘが閾値以上
になると学習が停止される。

そうすると、その時点で最大類似ｉＲｍａｘを示してい
るウェイトベクトル（例えば、ウェイトベクトルＷｉ、
）は学習用ベクトルＸ。の特徴を写像しているのである
。

同様にして、他の学習用文字の右上の小領域（小領域３
４に対応）の画像情報に基づく学習用ベクトルＸ＋、Ｘ
ｔ、・・・が入力ノード３３に順次入力されて学習が実
行される。そして、学習が終了した時点で最大類似度Ｒ
ｍａｘを示しているウェイトベクトル（例えば、ウェイ
トベクトルＷｉ＋　＊　Ｘ　ｉ２　、・・）は夫々学習
用ベクトルｘ　ｌ＋　ｘ　、、・・・の特徴を写像して
いるのである。すなわち、こうして学習用文字「犬」を
含む種々の学習用ベクトルに対応付けられた特定のウェ
イトベクトルＷ　ｉ　ｏ　、　Ｗ　ｉ＋　、　Ｗ　１　
ｔ　、・・・は、各学習用文字に係る１文字領域の右上
の小領域の画像情報を写像するように自己組織される。

そこで、本実施例においては、この学習によって学習用
ベクトルＸ対応付けられた各ウェイトベクトルＷｉ、、
Ｗｉ、、Ｗｉｙ、・・・の内容を右上の小領域に対応し
た種々のテンプレートとするのである。

こうすることによって、上記各学冒用文字群の右上の小
領域における文字形態差を良く表す種々のテンプレート
が得られるのである。

以下、上述と同様にして、文字「犬」含む各学習用文字
の上記右上の小領域とは異なる他の小領域に係る学習用
ベクトルＸを、夫々第９図とは異なる自己組織化ノード
の組に対応した入力ノートに入力することによって、上
記学腎用文字群の上記右上の小領域とは異なる他の小領
域における文字形態差を良く表す種々のテンプレートか
得られる。

こうして、順次文字「犬」含む各学習用文字の小領域を
変えて学習用ベクトルＸを自己組織化ニューラルネット
ワーク３１に入力することによって、上記学習文字群の
総ての各小領域における文字形態差を良く表す種々のテ
ンプレートが各小領域毎に得られるのである。

但し、こうして得られたテンプレートを使用して上記小
領域における画像情報との類似度の算出を行う場合には
、上記小領域における画像情報は認識対象文字の３２Ｘ
３２のメツシュから成る文字画像情報を４Ｘ４の小領域
に分割して得たちのを用いなければならない。

このように、本実施例においては、第１図の実施例１に
おけるテンプレート・メモリ７に格納する種々のテンプ
レートを、自己組織化ニューラルネットワーク３１によ
って学習用文字の画像情報に基づいて生成するようにし
ている。したがって、認識対象文字群を代表する学習用
文字を用いて自己組織化特徴写像によって自己組織化ニ
ューラルネットワーク３１を学習することによって、上
記認識対象文字群の各小領域における文字形態差を良く
表す種々のテンプレートを自動的に得ることができる。

上記実施例においては、１文字領域を構成する一つの小
領域に対応する自己組織化ノード３２の数を１６個とし
ている。しかしながら、この発明においてはこれに限定
されるもではなく、作成したいテンプレート数（すなわ
ち、学習文字の種類の数）に応じて設定すればよい。

上記実施例においては、上記テンプレートの生成を自己
組織化特徴写像によって学習される自己組織化ニューラ
ルネットワーク３１で実施している。しかしながら、こ
の発明においてはこれに限定されるものではなく、例え
ば学習ベクトル量子化（ＬＶＱ）や学習ベクトル量子化
２（ＬＶＱ２）暮によって学習されるコホーネン型ニュ
ーラルネットワークで実施してもよい。要はウェイトベ
クトルの内容が学習用ベクトルの内容に近付くように学
習されるようなニューラルネットワークの構造と学習ア
ルゴリズムであればよいのである。しかしながら、ＬＶ
ＱやＬＶＱ２による学習は教師有りの学習であるため自
己組織化ができないので、出力ノードの学習用ベクトル
が属するカテゴリへの割り付けや教師データの入力等を
行わなければ成らず、学習が面倒である。したがって、
自己組織化特徴写像による学習の方か自動的にテンプレ
ートが生成されるため優れていると言える。

実施例■ 実施例■は、実施例■において、上記類似度算出部９お
よびパターン・メモリ１０によって実施する１文字の特
徴パターンに基づく文字コード認識動作をニューラルネ
ットワークによって実施する例である。

第１Ｏ図は、本実施例に係る文字認識装置ブロック図で
ある。この文字認識装置は実施例■における文字認識装
置の類似度算出部９およびパターン・メモリ１０で構成
される文字コード認識部を文字識別ニューラルネットワ
ーク４４で構成したものである。本実施例における上記
文字識別ニューラルネットワーク４４は、ＬＶＱ２によ
って学習されたコホーネン型ニューラルネットワークを
用いる。以下、本実施例を上述の実施例■に適応させた
場合について説明する。

このコホーネン型ニューラルネットワークの概略構造は
、第１１図に示すように、総ての出力ノード４５．４５
．・・・が入力ノード４６に対して結合された構造なっ
ている。出力ノード４６．４５．・・・は認識対象文字
群のいずれかの文字の文字コード（カテゴリ）に割り付
けられている。出力ノード４５は、この出力ノード４５
が割り付けられたカテゴリの番号ｊとそのカテゴリ内に
含まれる複数の出力ノード４５，４５．・・・の番号に
とで表すことにする。例えば出力ノード４５３には“ｊ
”番目のカテゴリに割り付けられた“ｋ”番目の出力ノ
ードを表す。入力ノード４６には１文字領域を構成する
小領域数に対応した１６次元の入力ベクトルＩが入力さ
れる。そうすると、入力ベクトルＩとウェイトベクトル
Ｗとに基づいて、後に詳述するようなアルゴリズムに従
って出力値０が各結合毎に算出され、この算出された出
力値０が各出力ノード４５から出力される。そして、最
大値を出力している出力ノード４５か割り付けられてい
るカテゴリを、入力ベクトルＩが属するカテゴリ（文字
コード）であると識別するのである。ここで、上記ウェ
イトベクトルＷは出力ノード４５に対応付けられており
、各ウェイトベクトルＷは対応する出力ノード（例えば
、出力ノード４５ｊｋ）と同じ添数字で表す（例えば、
Ｗｊｋ）ことにする。

上記構成のコホーネン型ニューラルネットワークの出力
値算出アルゴリズムは（２）式のようなアルゴリズムで
ある。

０ｊｋ−Σ　（Ｉ　１ｘＷｉｊｋ）　　　・−（２）ｉ
：１ここで、ｌ：入力ベクトルＩおよびそれに対応したウェ
イトベクトルＷの要素の番号（１≦ｉ≦１６）このようなコホーネン型ニューラルネットワークの学習
方法として用いられているＬＶＱ２は、学習用ベクトル
Ｙを入力した際の出力値Ｏと、その出力値０に基づく識
別カテゴリに従って、式（３）によってウェイトベクト
ルＷの値を更新する方法である。

まず、以下に述べるようにして学習用ベクトルＹが作成
される。すなわち、例えば上述の実施例■においてテン
プレート作成時に用いた正規化された３２Ｘ３２のメツ
シュ状の学習用文字「犬」の文字画像情報が、８×８の
メツシュから成る小領域に分割される。そして、実施例
■で述べたようにして作成されてテンプレート・メモリ
４３に格納されているテンプレート（６４次元ベクトル
）と上記学習用文字「犬」の各小領域における画像情報
（６４次元ベクトル）との類似度が特徴量算出部４２に
よって算出される。

上記類似度は、例えば当該小領域の画像情報のベクトル
と上記当該小領域に対応するテンプレートのベクトルと
の積和を算出し、この積和の値を類似度とすればよい。

同様にして、当該小領域に対応する総てのテンプレート
との類似度を算出し、得られた複数の類似度から成るベ
クトルを当該小領域の特徴量とする。このような操作を
学習用文字「犬」の１文字領域を構成する総て（１６個
）の小領域について実行し、総ての小領域の特徴量を求
める。こうして求めた学習用文字「犬」における１６個
の特徴量を、学習用文字「犬」に係る１６次元の学習用
ベクトルＹとするのである。

上述のようにして求められた学習用ベクトルＹを第１１
図に示すように文字識別ニューラルネットワーク４４の
入力ノード４６に入力してニューラルネットワークの学
習が開始される。

すなわち、上記学習用ベクトルＹを入力した際の出力ノ
ードからの出力値Ｏｊｋのうち、最大出力値をＯｊ＋に
＋とじ、２番目に大きな出力値をＯｊｐｋｔとしたとき
に、ｊ、≠学習用ベクトルＹが属するカテゴリの番号かつ、Ｊ、−学習用ベクトルＹが属するカテゴリの番号ならば
、ウェイトベクトルＷ　ｊ＋　ｋ　ｌ、　Ｗ　ｊｙ　ｋ
　ｔの内容を夫々、Ｗｊｔｋｔ　　＝　　Ｗ３２に！＋Ｋ（Ｙ−Ｗｊ２にり
に更新する。

ここで、Ｋ：定数あるいは学習回数と共に減少する関数
。

上記ウェイトベクトルＷＬｋ＋、ＷｊＪｔの初期値は学
習用ベクトルＹの値とする。

その結果、学習が繰り返されるに連れて、２番目に大き
な値０ｊＪｔを出力する出力ノードからの出力値か大き
くなる一方、最大出力値０ｊｌｋｌを出力する出力ノー
ドからの出力値が小さくなるのである。そして、やがて
は学習用ベクトルＹと同じカテゴリに属する２番目に大
きな値０Ｌｋｔを出力した出力ノードからの出力値が、
学習用ベクトルＹと異なったカテゴリに属する最大出力
値Ｏｊ、ｋを出力した出力ノートからの出力値よりも大
きくなる。

すなわち、学習用ベクトルＹが属するカテゴリｊｔ（文
字「犬」の文字コード）に割り付けられた出力ノードが
最大出力値を出力するようになり、最大出力値に基づい
て学習用ベクトルＹが属するカテゴリを正しく識別でき
るようになるのである。

上述と同様に他の学習用文字の文字画像情報に基づいて
文字識別ニューラルネットワーク４４の学習が実行され
る。

こうして、文字識別ニューラルネットワーク４４の学習
が終了すると、認識対象文字の文字画像がスキャナ４１
に入力されて、文字認識動作が開始される。

上記スキャナ４１によって読み取られた認識対象文字の
１文字領域の文字画像情報が８×８のメツシュから成る
小領域に分割される。そして、１文字領域を構成する総
ての小領域における画像情報とテンプレート・メモリ４
３に格納されているテンプレートとの類似度が例えば上
述のようにして特徴量算出部４２よって算出される。そ
して、その結果に基づいて認識対象文字の１文字領域を
構成する総ての小領域（１６個）の特徴量か得られる。

こうして得られた認識対象文字における１６個の特徴量
を、認識対象文字に係る１６次元の入力ベクトルＩとす
るのである。

上記文字識別ニューラルネットワーク４４の入力ノード
４６に上記１６次元の入力ベクトルＩが入力されると、
入力ベクトルＩと上述の学習によって更新されているウ
ェイトベクトルＷとに基づいて、（２）式に従って出力
値Ｏが各結合毎に算出され、この算出された出力値Ｏが
各出力ノード４５から出力される。そこで、最大値を出
力している出力ノード４５が割り付けられているカテゴ
リ（文字コード）を、認識対象文字の文字コードである
と識別して認識するのである。

このように、本実施例においては、特徴量算出部４２に
よって算出された各小領域の特徴量に基づいて認識対象
文字の文字コードを認識する文字コード認識部を、１文
字領域を構成する総ての小領域の特徴量に基づく入力ベ
クトルが属する文字コードを識別するように学習された
文字識別ニューラルネットワーク４４によって構成して
いる。

したがって、認識対象文字の特徴パターンとその文字の
標準文字パターンとの類似度算出等の処理の必要がなく
、文字識別ニューラルネットワーク４４に認識対象文字
における１文字領域を構成する総ての小領域の特徴量に
基づく入力ベクトルを入力するだけの簡単な処理で、効
率良く上記認識対象文字の文字コードを識別して認識で
きる。

上記実施例においては、文字識別ニューラルネットワー
ク４４としてＬＶＱ２によって学習するコホーネン型ニ
ューラルネットワークを用いている。

しかしながら、この発明における文字識別二二−ラルネ
ットワークの構造と学習方法は、上記実施例に限定され
るものではない。

上記実施例においては、文字コード認識部を構成する文
字識別ニューラルネットワークを実施例■に適応する例
について説明している。しかしなから、この発明はこれ
に限定されるものではなく、実施例１あるいは実施例■
あるいは実施例ｍあるいはそれらの組み合わせに適応し
ても何等差し支えない。

〈発明の効果〉以上より明らかなように、第１の発明の文字認識装置は
、領域分割部、特徴量算出部および文字コード認識部を
有して、読み取った文字画像情報から切り出した１文字
領域を上記領域分割部によって小領域に分割し、上記特
徴量算出部によって、この小領域の画像情報と認識対象
文字群の文字形態差を上記小領域別によく表すようなテ
ンプレートとの類似度に基づいて上記小領域における特
徴量を算出し、上記１文字領域を構成する総ての小領域
における上記特徴量算出部で算出された特徴量に基づい
て、上記読み取られた文字画像情報に対応する文字コー
ドを上記文字コード認識部によって認識するようにした
ので、上記特徴量算出部によって算出される特徴量は認
識対象文字群の文字形態差を良く表している。

したがって、第１の発明の文字認識装置は、文字群の文
字形態差の特徴か異なるような種々の文字群のいずれに
対しても高い文字認識能力を有する。

また、第２の発明の文字認識装置は、上記第１の発明の
文字認識装置における領域分割部を、上記１文字領域の
文字画像情報を小領域に分割する際に互いに隣接する小
領域をオーバーラツプさせて分割するように成したので
、第２の発明の文字認識装置によれば、文字を形成する
線の位置が変動し、かつ、その線が小領域の境界付近に
位置するするような場合であっても、同じ文字を形成す
る線は、認識対象文字に係る１文字領域と標準文字パタ
ーンに係る１文字領域とにおける同じ小領域に属するよ
うになる。

したがって、文字コード認識処理時における認識対象文
字の特徴パターンとその文字の標準文字パターンとの類
似度が高くなり、文字認識能力がより高められる。

また、第３の発明の文字認識装置は、上記第１あるいは
第２の発明の文字認識装置における領域分割部を、上記
１文字領域の文字画像情報を小領域に分割する際に認識
対象文字群の文字形態差が良く表れる箇所を網羅するよ
うな種々の形状に分割するように成したので、上記特徴
量算出部によって行われる上記小領域の特徴量の算出は
、認識対象文字群の文字形態差が良く表れる箇所を網羅
するように分割された種々の形状の小領域のみによって
実施できる。

したがって、第３の発明の文字認識装置によれば、１文
字領域を構成する小領域の特徴量の算出に際して認識対
象文字群における文字形態差をより良く表すように算出
でき、かつ、認識対象文字の１文字領域を構成する総て
の小領域について特徴量を算出する必要がなく、上記小
領域の特徴量算出処理をより精度良くしかも効率良〈実
施できる。

また、第４の発明の文字認識装置は、上記第１乃至第３
のいずれかの発明の文字認識装置にニューラルネットワ
ークを設けて、上記認識対象文字群を代表するような複
数の学習用文字の文字画像情報に基づいて作成された学
習用ベクトルを用いて上記ニューラルネットワークを学
習し、その結果上記各学習用文字の文字形態差を良く表
すように設定されたウェイトベクトルを上記特徴量算出
部で上記小領域の特徴量を算出する際に用いられるテン
プレートとするようにしたので、第４の発明の文字認識
装置によれば、上記ニューラルネットワークに上記学習
用ベクトルを入力するだけで、認識対象文字群の文字形
態差をよく表すようなテンプレートが自動的に得られる
。

また、第５の発明の文字認識装置は、上記第１乃至第４
のいずれかの発明の文字認識装置における文字コード認
識部を、認識対象文字の１文字領域を構成する総ての小
領域における特徴量に基づく入力ベクトルが入力される
と、その入力ベクトルが属する文字コードを識別するよ
うに学習された文字認識ニューラルネットワークで構成
したので、第５の発明の文字認識によれば、上記認識対
象文字に係る１文字の特徴パターンと標準文字パターン
との類似度等を算出する必要がなく、読み取られた文字
画像情報に対応した文字コードをより簡単な処理で効率
良く認識できる。

【図面の簡単な説明】

第１図はこの発明の文字認識装置における一実施例のブ
ロック図、第２図は第１図におけるＣＰＵによる１文字
認識処理動作のフローチャート、第３図は第１図に係る
小領域とテンプレートの説明図、第４図は小領域の分割
方法の説明図、第５図は第４図に係る小領域の分割方法
における効果の説明図、第６図は従来の小領域の分割方
法の説明図、第７図は第４図とは異なる分割方法の説明
図、第８図は自己組織化ニューラルネットワークによっ
てテンプレートを作成する文字認識装置における部分ブ
ロック図、第９図は第８図における自己組織化ニューラ
ルネットワークの学習の説明図ξ第１０図は文字識別ニ
ューラルネットワークによって文字コード識別動作を行
う文字認識装置のブロック図、第１１図は第１Ｏ図の文
字認識装置における文字識別ニューラルネットワークの
学習の説明図である。１４１・・スキャナ、　　　３・・・文字切出し部、４
・・領域分割部、　　　６，４２・・・特徴量算出部、
７４３・・テンプレート・メモリ、９　類似度算出部、１２・・・ＣＰＵ。３１・自己組織化ニューラルネットワーク、３２・・・
自己組織化ノード、　３３・・入力ノート、４４・・・
文字識別ニューラルネットワーク、４５・・出力ノード
、　　　　　４６・・・入力ノード。

Claims

【特許請求の範囲】

（１）読み取った文字画像情報から１文字領域の画像情
報を切り出し、この１文字領域の画像情報に基づいて上
記文字画像情報に対応する文字コードを認識する文字認
識装置において、上記１文字領域の画像情報を小領域に分割する領域分割
部と、上記領域分割部によって分割された小領域の画像情報と
認識対象文字群における文字形態差を上記小領域別に良
く表すようなテンプレートとの類似度に基づいて、上記
小領域における特徴量を算出する特徴量算出部と、上記１文字領域を構成する総ての小領域における上記特
徴量算出部によって算出された特徴量に基づいて、上記
読み取られた文字画像情報に対応する文字コードを認識
する文字コード認識部を備えたことを特徴とする文字認
識装置。
（２）請求項１に記載の文字認識装置において、上記領
域分割部は、上記１文字領域の文字画像情報を小領域に
分割する際に、互いに隣接する小領域をオーバーラップ
させて分割するように成したことを特徴とする文字認識
装置。
（３）請求項１または請求項２に記載の文字認識装置に
おいて、上記領域分割部は、上記１文字領域の文字画像情報を小
領域に分割する際に、認識対象文字群における文字形態
差が良く表れる箇所を網羅するような種々の形状に分割
するように成したことを特徴とする文字認識装置。
（４）請求項１乃至請求項３のいずれかに記載の文字認
識装置において、学習に際して、入力された学習用ベクトルの内容に近付
くように上記入力された学習用ベクトルに応じた特定の
ウェイトベクトルの内容を更新するニューラルネットワ
ークを備えて、上記認識対象文字群を代表するような複数の学習用文字
の文字画像情報に基づいて上記小領域毎に作成された学
習用ベクトルを用いて上記ニューラルネットワークを学
習し、各学習用ベクトルの内容に近付くように更新され
た結果上記認識対象文字群を代表する各学習用文字の文
字形態差を良く表すように設定されたウェイトベクトル
を上記特徴量算出部で上記小領域の特徴量を算出する際
に用いるテンプレートとすることを特徴とする文字認識
装置。
（５）請求項１乃至請求項４のいずれかに記載の文字認
識装置において、上記文字コード認識部は、上記１文字領域を構成する総
ての小領域における上記特徴量算出部によって算出され
た特徴量に基づく入力ベクトルが入力されると、その入
力ベクトルが属する文字コードを識別するように学習さ
れた文字識別ニューラルネットワークで構成したことを
特徴とする文字認識装置。