JP2680419B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2680419B2
JP2680419B2 JP1121079A JP12107989A JP2680419B2 JP 2680419 B2 JP2680419 B2 JP 2680419B2 JP 1121079 A JP1121079 A JP 1121079A JP 12107989 A JP12107989 A JP 12107989A JP 2680419 B2 JP2680419 B2 JP 2680419B2
Authority
JP
Japan
Prior art keywords
character
character pattern
character recognition
similarity
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1121079A
Other languages
English (en)
Other versions
JPH02300876A (ja
Inventor
和仁 春木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1121079A priority Critical patent/JP2680419B2/ja
Publication of JPH02300876A publication Critical patent/JPH02300876A/ja
Application granted granted Critical
Publication of JP2680419B2 publication Critical patent/JP2680419B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、ニューラルネットワークを用いた文字認識
装置に関する。
(従来の技術) 近年、ニューラルネットワークを用いて文字認識、音
声認識、画像情報処理等を行うシステムの開発が盛んで
ある。
一般に知られる文字認識処理は、入力文字パターンと
複数と文字パターン候補とのパターン・マッチングによ
りそれぞれの類似度を算出し、その中で最大類似度を得
た文字パターン候補を最終的な文字認識結果として判定
し出力することで文字認識を行うものである。これに対
し、従来の文字認識方法にニューラルネットを組合せた
方式では、ある入力文字パターンの認識結果に誤りが生
じた場合、その入力文字パターンに対する次回からの文
字認識において正解の文字パターン候補が得られるよう
な方向性を持ってニューラルネットワークにおける各ア
ーク荷重値を修正する。
したがって、このニューラルネットワークを採用した
文字認識処理により、入力文字パターンの特徴の変化に
応じた良好な文字認識を安定して行うことが可能とな
る。
(発明が解決しようとする課題) ところが、こうしたニューラルネットワークを採用し
た文字認識処理では、手書き数字の認識において良好な
認識率が得られるものの、これを手書きカナ文字等に適
用しようとした場合数々の障害があった。
例えば、手書き数字の場合、ニューラルネットワーク
の入力層は、入力文字パターンと「0」から「9」まで
の各数字との類似度にそれぞれ対応する10個のユニット
と、ダミー1個の計11個のユニットだけで済む。これに
対し手書きカナ文字の場合は、入力層は、入力文字パタ
ーンと「ア」から「ン」までの各カナ文字との類似度に
それぞれ対応する46個のユニットとダミー1個の計47個
が必要となる。これに伴って中間層の数も数字の場合は
50個程度で済んでいたが、カナ文字の場合は少なくとも
100個あるいはそれ以上必要とする。出力層についても
数字の場合は10個、カナ文字の場合は46個必要とする。
したがって、大規模となり、しかも手書きカナ文字の
場合、「エ、コ、ユ」等の類似した文字が多いため学習
に長時間を要し、満足する認識率を得ることができない
という問題があった。
本発明はこのような課題を解決するためのもので、手
書きカナ文字のように文字種類が多く、多くの類似パタ
ーンを有した文字群についても高い正解率で文字認識を
行うことのできる文字認識装置の提供を目的としてい
る。
[発明の構成] (課題を解決するための手段) 第1の発明の文字認識装置は上記した目的を達成する
ために、入力文字パターンと複数の文字パターン候補と
の各類似度から入力文字パターンの認識結果として最も
確信度の高い文字パターン候補を判定する文字認識装置
において、各文字パターン候補を類似文字群のグループ
毎に複数分類し、各類似度から、各グループ毎に本来類
似度が最大となってしかるべき文字パターン候補が最終
的な文字認識結果として得られるよう学習を行い、各グ
ループ毎に最も確信度の高い文字パターン候補をそれぞ
れ判定する複数のサブニューラルネットと、各類似度か
ら、本来類似度が最大となってしかるべき文字パターン
候補を含むサブニューラルネットの判定結果が最終的な
文字認識結果となるよう学習を行い、最も確信度の高い
文字パターン候補を含むサブニューラルネットを判定す
るニューラルネットとを具備したものである。
また第2の発明は、上述した発明において、入力文字
パターンと複数の文字パターン候補との間で得られた各
類似度を所定のしきい値と比較する比較手段を設け、こ
の比較手段が第1の出力信号を出力した場合、最大類似
度を得た文字パターン候補を文字認識結果として判定す
るとともに、前記比較手段が第2の出力信号を出力した
場合、サブニューラルネットおよびニューラルネットに
最終的な文字認識結果の判定処理を渡す手段を備えたも
のである。
(作 用) 第1の発明の文字認識装置では、各サブニューラルネ
ットおよびニューラルネットに、それぞれ入力文字パタ
ーンと複数の文字パターン候補との各類似度が入力され
ると、各サブニューラルネットは、それぞれのグループ
内において、最も確信度の高い文字パターン候補をそれ
ぞれ判定する。一方、ニューラルネットは、各サブニュ
ーラルネットから出力された判定結果のうち最も確信度
の高い文字パターン候補を含むサブニューラルネットを
判定し、これにより最終的な文字認識結果を決定する。
また学習時において、各サブニューラルネットは、そ
れぞれのグループ内において、入力文字パターンと複数
の文字パターン候補との各類似度から本来類似度が最大
となってしかるべき文字パターン候補が最終的な文字認
識結果として得られるよう学習を行い、ニューラルネッ
トは、各類似度から本来類似度が最大となってしかるべ
き文字パターン候補を含むサブニューラルネットの判定
結果が最終的な文字認識結果として決定されるよう学習
を行う。
したがって、この発明によれば、手書きカナ文字のよ
うに文字種類が多く、多くの類似パターンを有した文字
群についても高い正解率で文字認識を行うことができ
る。
また第2の発明では、入力文字パターンと複数の文字
パターン候補との間で得られた各類似度を、比較手段に
おいてそれぞれ所定のしきい値と比較し、比較手段から
第1の出力信号が出力された場合、最大類似度を得た文
字パターン候補を文字認識結果として判定する。また比
較手段から第2の出力信号が出力された場合、サブニュ
ーラルネットおよびニューラルネットに最終的な文字認
識結果の判定処理を渡すようにしている。
これによれば、サブニューラルネットおよびニューラ
ルネットを用いて文字認識結果の判定処理を必要とする
文字を絞り込んで学習することができるので、より一層
認識率の向上を図ることができる。
(実施例) 以下、本発明の実施例を図面に基づいて詳細に説明す
る。
第1図はこの発明に係る一実施例の文字認識装置の構
成を説明するためのブロック図である。
同図において、1は帳票上に手書きされたカナ文字等
を光学的に読取ってその文字パターンを得るスキャナ
部、2はスキャナ部1により読取られた入力文字パター
ンとのマッチング対象となる文字パターン候補群(この
実施例では「ア」〜「ン」までのカナ文字が不可欠)が
登録されたパターン候補格納部、3はスキャナ部1から
の入力文字パターンとパターン候補格納部2に格納され
た文字パターン候補との所定のパターン・マッチングを
行ってそれぞれの類似度を算出するパターン・マッチン
グ部、4はパターン・マッチング部3において算出され
た各文字パターン候補に対する類似度の組合せから、最
も確からしい文字パターン候補を最終的な文字認識結果
として判定する文字判定部、5は文字判定部4において
判定された文字認識結果を格納するデータ格納部であ
る。
さて、このような構成の文字認識装置において、上記
した文字判定部4はニューラルネットを採用して次のよ
うに構成される。
第2図はこのニューラルネットを用いて構成された文
字判定部の構成を示している。
同図に示すように、この文字判定部4は、判断部11、
制御用ニューラルネット12、複数のサブニューラルネッ
ト13〜32(この実施例では19個)、最終判定部33、学習
データベース34を備えて構成される。
判断部11は、パターン・マッチングにより算出された
各文字パターン候補に対する類似度の最大値が、予め設
定されたしきい値を越えているか否かを判断して、越え
ていればその最大類似度を得た文字パターン候補を最終
的な文字認識結果として出力し、越えていなければ制御
用ニューラルネット12およびサブニューラルネット13〜
32に文字認識結果の判定処理を渡す。
サブニューラルネット13〜32は、各文字パターン候補
を、誤読を招き易い「エ、コ、ユ」「ハ、ヘ、ム」等の
類似文字群のグループ毎に分類し、入力文字パターンと
各文字パターン候補との各類似度から、各グループ毎に
本来類似度が最大となってしかるべき文字パターン候補
が文字認識結果として得られるよう学習を行い、その学
習の結果において、各グループ毎に最も確信度の高い文
字パターン候補の判定を行うものである。
尚、上述した類似文字群のグループとしては、その他
に、「ミ、ヨ、ヲ」「ソ、ツ、リ」「シ、ソ、ン」
「シ、ル、レ」「チ、テ、ラ」「サ、テ、ナ」「ク、
フ、ワ」「コ、ニ、ユ」「ウ、ク、ラ」「ク、タ、フ」
「ケ、チ、ナ」「キ、マ、ヤ」「オ、ネ、ホ」「セ、
ヒ、モ」「ア、ス、ヌ」「ト、ノ、メ」「イ、カ、ロ」
等がある。
制御用のニューラルネット12は、入力文字パターンと
各文字パターン候補との類似度から、本来類似度が最大
となってしかるべき文字パターン候補を含むサブニュー
ラルネット13〜32の判定結果が最終的な認識結果として
最終判定部33において選択されるよう学習を行い、その
学習の結果において、最も確信度の高い文字パターン候
補を含んだサブニューラルネット13〜32を判定するもの
である。
全体学習データベース34は、制御用ニューラルネット
12および各サブニューラルネット13〜32での学習で用い
られるデータ、すなわち入力文字パターンと各文字パタ
ーン候補との類似度とこれに対応する正確のデータとの
組が格納される。またこの全体学習データベース34に格
納された学習データは、学習実の際、各ニューラルネッ
ト12、13〜32の学習データベース(後述する)に転送さ
れることになるが、各サブニューラルネット13〜32に対
しては、データ選別器35を介してそれぞれ該当する学習
データを選択した上で転送される。
ところで、上述した各ニューラルネット12、13〜32で
は、その学習機能を、例えばバックプロパゲーションア
ルゴリズム等の学習アルゴリズムを用いて実現してい
る。
第3図は各ニューラルネットの基本構成を示してい
る。
同図に示すように、この実施例のニューラルネット1
2、13〜32の構成は、パターン・マッチングにより算出
された各パターン候補に対する類似度がそれぞれ入力さ
れる複数の入力ノードAからなる入力層と、各入力ノー
ドAとアークBを介してネットワークで結合された複数
の中間ノードCからなる中間層と、各中間ノードCとア
ークDを介してネットワークで結合され、各パターン候
補に対する類似度からそれぞれの最終的な正解確信度を
示す値を出力する出力ノードEからなる出力層とから構
成されている。
また上述した各アークB、Dには、各ノード間の結合
の強さを示す荷重値が設定されており、これらの荷重値
は、次のネットワーク管理部により修正されるようにな
っている。
このネットワーク管理部の構成を第4図を用いて説明
する。
同図において、41は入力ノードAおよび中間ノードC
からそれぞれ出力されたデータを一時的に保持するノー
ド出力値テーブル、42は各アークB、Dに設定された荷
重値を保持する荷重値テーブル、43は各入力ノードAや
中間ノードCからの出力データにそれぞれ荷重値テーブ
ル42上に対応する荷重値を乗じて積算を行う積算器、44
は個々の中間ノードCや出力ノードEに終結される積算
結果を加算する加算器である。また45は通常の文字認識
において出力された各文字パターン候補に対する最終的
な積算値(類似度)の中から最大値を得た文字パターン
候補を最終的な文字認識結果として判定する判定器、46
は学習時において出力された各文字パターン候補に対す
る最終的な積算値と本来類似度が最大となってしかるべ
き正解のデータとをそれぞれ取込んで比較し、それぞれ
が一致しているかどうかを評価する評価器、47は評価器
46において各データが一致しないと判定されたとき、当
該入力文字パターンに対する次回からの文字認識処理に
おいて正確を得るような方向性を持って荷重値テーブル
42上の各荷重値を修正する荷重値修正器、48は全体学習
データベース33からの学習データを格納する学習データ
ベース、49は学習データベース48の登録内容を管理する
学習管理器である。
次にこのネットワーク管理部による学習の基本動作を
第5図のフローチャートを用いて説明する。
まず学習データベース48から、類似度の組合せとこれ
に対応する正解のデータの組を1つずつ抽出し(ステッ
プa)、これを制御用ニューラルネット12、サブニュー
ラルネット13〜32の各入力ノード出力値テーブル41と評
価器46にそれぞれセットする(ステップb)。
さて入力ノード出力値テーブル41に類似度がセットさ
れると、各類似度は入力ノードAから中間ノードCを介
して出力ノードEに至るまでの間において、アークBお
よびアークDにそれぞれ設定された荷重値を用いて積
算、さらに加算され、最終的に各出力ノードEに終結さ
れたそれぞれの値が各文字パターン候補に対する確から
しさを示す値(確信度)となる(ステップc)。
この後、各出力ノードEから出力された各文字パター
ン候補に対する値は評価器46に出力される。比較器46
は、各出力ノードEから出力されたデータと正解のデー
タとを比較評価し(ステップd)、その比較評価の結
果、両者が一致していなければ、荷重値修正器47を起動
させて荷重値テーブル42における各荷重値を、次回から
の処理において正確のデータが得られるような方向性を
持って修正する(ステップe)。同時に学習管理器49
は、今回の文字認識処理における入力類似度の組合せと
正解のデータとの組を再び学習データとして学習データ
ベース48に格納する。
全ての文字パターンのサンプルに対する1回目の学習
が終了すると、学習管理器49は、2回目の学習を開始さ
せるため学習データベース48から再度1組ずつ各類似度
の組合せと正解のデータとの組を抽出し、これらを各ニ
ューラルネット12、13〜32にそれぞれセットする。
以上の学習動作を延々と繰り返し、全ての文字パター
ンのサンプルについて正解のデータが得られるようにな
った時点で、あるいは所定回数の荷重値修正を終えた時
点で、全ての学習を終了させる(ステップf)。
次にこの文字認識装置の動作を説明する。
ある手書きカナ文字についてパターン・マッチングを
行い、その結果得た各文字パターン候補に対する類似度
の組合せが文字判定部4に入力されると、判断部11は、
まずその中での最大類似度が予め設定されたしきい値を
越えているか否かを判断する。そして最大類似度がしき
い値を越えていれば、その最大類似度を得た文字パター
ン候補を最終的な文字認識結果として出力する。また最
大類似度がしきい値を越えていなければ、制御用ニュー
ラルネット12、サブニューラルネット13〜32に文字認識
結果の最終判定処理を渡す。
制御用ニューラルネット12は、判断部11よりこの処理
を受継ぐと、上記各類似度の組合せから、どのサブニュ
ーラルネット13〜32の判定結果が最も確信度が高いかを
決定し、そのネット番号を最終判定部33に送る。
一方、各サブニューラルネット13〜32では、それぞれ
自身のグループに属する文字間で、上記各類似度の組合
せから、入力文字パターンの認識結果として最も確信度
の高い文字パターン候補を決定し、これらを最終判定部
33に送る。
この結果、最終判定部33は、制御用ニューラルネット
12で決定したサブニューラルネットの判定結果を最終的
な文字認識結果として出力する。
次にこの文字認識装置での学習の具体例を説明する。
正解が「ユ」である入力文字パターンについて、この
文字を含むサブニューラルネット12〜32において各文字
パターン候補との類似度を算出したところ、 エ………0.5 コ………0.8 ユ………0.7 という結果が得られたとする。
この場合、本来類似度が最大となってしかるべき文字
パターン候補は「コ」ではなく「ユ」であることから、
学習により、「ユ」の文字パターン候補に対する類似度
の算出結果が「コ」の文字パターン候補に対する類似度
の最終結果よりも高くなるよう、同サブニューラルネッ
ト12〜32における各アークの荷重値を修正する。また、
上記類似度の組合せから、制御用ニューラルネット12に
おいて、同サブニューラルネット12〜32の判定結果が最
も確信度が高いものとして判定されるよう該制御用ニュ
ーラルネット12における各アークの荷重値を修正する。
かくしてこの実施例の文字認識装置によれば、各サブ
ニューラルネット13〜32において、それぞれ類似パター
ン毎に分類された文字パターン候補間での学習および文
字認識結果の判定を行い、制御用ニューラルネット12に
おいて、どのサブニューラルネット13〜32が最も確信度
が高い文字パターン候補を含んでいるかを学習、判定す
るようにしたので、手書きカナ文字のように文字種類が
多く、類似文字パターンを多く含んだものであっても、
高い正解率で文字認識を行うことができる。
尚、上述した実施例では、ニューラルネットによる文
字認識を、入力文字パターンと文字パターン候補とのマ
ッチングの結果得た最大類似度が、あるしきい値を越え
ない場合に限り行ったが、その他の方法として、最大類
似度から2番目に高い類似度を差し引いた値をしきい値
と比較し、その結果から次の動作を決定するようにして
もよい。
また、この実施例では手書きカナ文字の認識について
説明したが、本発明はこれに限定されるものではなく、
例えば、ローマ字や漢字等の認識にも適用が可能であ
る。
[発明の効果] 以上説明したように本発明の文字認識装置によれば、
手書きカナ文字のように文字種類が多く、多くの類似パ
ターンを有した文字群についても高い正解率で文字認識
を行うことができる。
【図面の簡単な説明】
第1図は本発明の一実施例の文字認識装置の全体構成を
説明するためのブロック図、第2図は第1図におけるニ
ューラルネットを用いた文字判定部の構成を説明するた
めのブロック図、第3図はニューラルネットの基本構成
を示す図、第4図は各ニューラルネットにおけるネット
ワーク管理部の構成を説明するためのブロック図、第5
図は第4図のネットワーク管理部による学習の基本動作
を示すフローチャートである。 11……判断部、12……制御用ニューラルネット、13〜32
……サブニューラルネット、33……最終判定部。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文字パターンと複数の文字パターン候
    補との各類似度から前記入力文字パターンの認識結果と
    して最も確信度の高い文字パターン候補を判定する文字
    認識装置において、 前記各文字パターン候補を類似文字群のグループ毎に複
    数分類し、前記各類似度から、各グループ毎に本来類似
    度が最大となってしかるべき文字パターン候補が最終的
    な文字認識結果として得られるよう学習を行い、前記各
    グループ毎に最も確信度の高い文字パターン候補をそれ
    ぞれ判定する複数のサブニューラルネットと、 前記各類似度から、本来類似度が最大となってしかるべ
    き文字パターン候補を含む前記サブニューラルネットの
    判定結果が前記文字認識結果となるよう学習を行い、最
    も確信度の高い文字パターン候補を含むサブニューラル
    ネットを判定するニューラルネットとを具備したことを
    特徴とする文字認識装置。
  2. 【請求項2】請求項1記載の文字認識装置において、 入力文字パターンと複数の文字パターン候補との間で得
    られた各類似度を所定のしきい値と比較する比較手段を
    設け、この比較手段が第1の出力信号を出力した場合、
    最大類似度を得た文字パターン候補を文字認識結果とし
    て判定するとともに、前記比較手段が第2の出力信号を
    出力した場合、サブニューラルネットおよびニューラル
    ネットに最終的な文字認識結果の判定処理を渡す手段を
    備えたことを特徴とする文字認識装置。
JP1121079A 1989-05-15 1989-05-15 文字認識装置 Expired - Lifetime JP2680419B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1121079A JP2680419B2 (ja) 1989-05-15 1989-05-15 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1121079A JP2680419B2 (ja) 1989-05-15 1989-05-15 文字認識装置

Publications (2)

Publication Number Publication Date
JPH02300876A JPH02300876A (ja) 1990-12-13
JP2680419B2 true JP2680419B2 (ja) 1997-11-19

Family

ID=14802336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1121079A Expired - Lifetime JP2680419B2 (ja) 1989-05-15 1989-05-15 文字認識装置

Country Status (1)

Country Link
JP (1) JP2680419B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5438629A (en) * 1992-06-19 1995-08-01 United Parcel Service Of America, Inc. Method and apparatus for input classification using non-spherical neurons
DE69333811T2 (de) * 1992-06-19 2006-05-11 United Parcel Service Of America, Inc. Verfahren und Gerät zur Erzeugung und Einstellung eines Neurones
JP3411847B2 (ja) * 1999-03-01 2003-06-03 日本電信電話株式会社 入力機器用色再現方法及び装置、並びにこの方法のプログラムを記録した記録媒体

Also Published As

Publication number Publication date
JPH02300876A (ja) 1990-12-13

Similar Documents

Publication Publication Date Title
JP3088171B2 (ja) 自己組織型パタ−ン分類システム及び分類方法
Hosang et al. Learning non-maximum suppression
US11715281B2 (en) System and method for detecting objects in a digital image, and system and method for rescoring object detections
US6397200B1 (en) Data reduction system for improving classifier performance
Moreira et al. Improved pairwise coupling classification with correcting classifiers
JPH08329031A (ja) 仮説生成装置及び仮説生成方法並びに分類装置
Steck et al. Bayesian belief networks for data mining
US5555439A (en) Learning system and a learning pattern showing method for a neural network
JP2680419B2 (ja) 文字認識装置
US6789070B1 (en) Automatic feature selection system for data containing missing values
JP4997524B2 (ja) 多変数決定木構築システム、多変数決定木構築方法および多変数決定木を構築するためのプログラム
JPH05225163A (ja) ニューラルネットシステムおよびニューラルネットの学習方法
JP3318958B2 (ja) 学習型波形認識処理装置
JPH06180691A (ja) 適応的入出力装置
JPH08115387A (ja) パターン認識装置
JPH05314320A (ja) 認識距離の差と候補順を利用した認識結果の評価方式
JPH01120633A (ja) データ・ベースの探索時の順次的判断を適応的に再配列するシステム
KR102134972B1 (ko) 속도와 전력효율이 향상된 결정 트리 장치 및 이의 분류 방법
CN117521737B (zh) 网络模型的转换方法、装置、终端及计算机可读存储介质
JP2639028B2 (ja) 神経回路の学習装置および学習方法
JPH03220686A (ja) 文字認識装置
JPH02125392A (ja) 文字認識方法およびこれを用いた文字認識装置
JPH02129782A (ja) 文字認識方法
JP3281020B2 (ja) 神経回路網の高速学習装置
JPH11259447A (ja) 属性選択装置、属性評価装置、属性選択方法、属性評価方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070801

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080801

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090801

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090801

Year of fee payment: 12