JPH03294983A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH03294983A
JPH03294983A JP2097261A JP9726190A JPH03294983A JP H03294983 A JPH03294983 A JP H03294983A JP 2097261 A JP2097261 A JP 2097261A JP 9726190 A JP9726190 A JP 9726190A JP H03294983 A JPH03294983 A JP H03294983A
Authority
JP
Japan
Prior art keywords
character
character pattern
group
similarity
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2097261A
Other languages
English (en)
Inventor
Kazuhito Haruki
春木 和仁
Masaya Ono
雅也 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2097261A priority Critical patent/JPH03294983A/ja
Publication of JPH03294983A publication Critical patent/JPH03294983A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、ニューラルネットワークを用いた文字認識装
置に関する。
(従来の技術) 近年、ニューラルネットワークを用いて文字認識、音声
認識、画像情報処理等を行うシステムの開発が盛んであ
る。
一般に知られる文字認識処理は、入力文字パターンと複
数の文字パターン候補とのパターン・マツチングにより
それぞれの類似度を算出し、その中で最大類似度を得た
文字パターン候補を最終的な文字認識結果として判定し
出力することで文字認識を行うものである。これに対し
、従来の文字認識方法にニューラルネットを組合せた方
式では、ある入力文字パターンの認識結果に誤りが生じ
た場合、その入力文字パターンに対する次回からの文字
認識において正解の文字パターン候補が得られるような
方向性を持ってニューラルネットワークにおける各アー
ク荷重値を修正する。
したがって、このニューラルネットワークを採用した文
字認識処理により、入力文字パターンの特徴の変化に応
じた良好な文字認識を安定して行うことが可能となる。
(発明が解決しようとする課題) ところが、こうしたニューラルネットワークを採用した
文字認識処理では、手書き数字の認識においては良好な
認識率が得られるものの、これを手書きカナ文字等に適
用しようとした場合数々の障害があった。
例えば、手書き数字の場合、ニューラルネットワークの
入力層は、入力文字パターンと「0」から「9」までの
各数字との類似度にそれぞれ対応する10個のユニット
と、ダミー1個の計If個のユニットだけで済む。これ
に対し手書きカナ文字の場合は、入力層は、入力文字パ
ターンと「ア」から「ン」までの各カナ文字との類似度
にそれぞれ対応する46個のユニットとダミー1個の計
47個が必要となる。これに伴って中間層の数も数字の
場合は50個程度で済んでいたが、カナ文字の場合は少
なくとも 100個あるいはそれ以上必要とする。
出力層についても数字の場合は10個、カナ文字の場合
は46個必要とする。
したがって、大規模となり、しかも手書きカナ文字の場
合、「工、コ、ユ」等のパターンが類似した文字が多い
ため学習に長時間を要し、満足する認識率を得ることが
できないという問題があった。
本発明はこのような課題を解決するためのもので、手書
きカナ文字のように文字種類が多く、多くの類似パター
ンを有した文字群についても、高い正解率で文字認識を
行うことのできる文字認識装置の提供を目的としている
[発明の構成] (課題を解決するための手段) 第1の発明の文字認識装置は上記した目的を達成するた
めに、入力文字パターンと複数の文字パターン候補との
各類似度から入力文字パターンの認識結果として最も確
信度の高い文字パターン候補を判定する文字認識装置に
おいて、文字パターン候補を類似文字群毎に複数のグル
ープに分類し、各類似度から、入力文字パターンがどの
グループに含まれるかを判定するグループ判定手段と、
分類されたグループ毎に、各類似度とグループ判定手段
の判定結果から、本来類似度が最大となるべき文字パタ
ーン候補が得られるよう学習を行い、かつ最も確信度の
高い文字パターン候補をそれぞれ判定する複数のニュー
ラルネットと、複数のニューラルネットによりそれぞれ
判定された各文字パターン候補の中から最終的な文字認
識結果を判定する最終判定手段とを具備している。
また第2の発明は、入力文字パターンと複数の文字パタ
ーン候補との各類似度から入力文字パターンの認識結果
として最も確信度の高い文字パターン候補を判定する文
字認識装置において、文字パターン候補を類似文字群毎
に複数のグループに分類し、各類似度から、入力文字パ
ターンが本来類似度が最大となるべき文字パターン候補
の属するグループに含まれると判定されるよう学習を行
い、かつ入力文字パターンが含まれるグループを判定す
るグループ判定用ニューラルネットと、分類されたグル
ープ毎に、各類似度とグループ判定用ニューラルネット
の判定結果から、本来類似度が最大となるべき文字パタ
ーン候補が得られるよう学習を行い、かつ最も確信度の
高い文字パターン候補をそれぞれ判定する複数のニュー
ラルネットと、複数のニューラルネットによりそれぞれ
判定された各文字パターン候補の中から最終的な文字認
識結果を判定する最終判定手段とを具備している。
(作 用) 第1の発明の文字認識装置では、グループ判定手段は、
入力文字パターンと複数の文字パターン候補との各類似
度に基づき、類似文字群毎に分類された各グループの中
で入力文字パターンがどのグループに含まれるかを判定
する。
一方、各ニューラルネットは、前記各類似度とグループ
判定手段の判定結果に基づき、それぞれ自身のグループ
に属する文字の中がら本来類似度が最大となるべき文字
パターン候補が認識結果として得られるよう学習を行う
。そして学習終了後、前記各類似度とグループ判定手段
の判定結果がら、それぞれ自身のグループに属する文字
の中から最も確信度の高い文字パターン候補を判定する
そして、最終判定手段は、各ニューラルネットにより得
られた各文字パターン候補の中がら最終的な認識結果を
判定する。
また第2の発明の文字認識装置では、グループ判定用ニ
ューラルネットは、入力文字パターンと複数の文字パタ
ーン候補との各類似度に基づき、入力文字パターンが本
来類似度が最大となるべき文字パターン候補の属するグ
ループに含まれると判定されるよう学習を行う。そして
学習終了後、前記各類似度から入力文字パターンがどの
グループに含まれるかを判定結果として出力する。
一方、各ニューラルネットは、前記各類似度とグループ
判定用ニューラルネットの判定結果に基づき、それぞれ
自身のグループに属する文字の中から本来類似度が最大
となるべき文字パターン候補が認識結果として得られる
よう学習を行う。そして学習終了後、前記各類似度とグ
ループ判定用ニューラルネットの判定結果から、それぞ
れ自身のグループに属する文字の中から最も確信度の高
い文字パターン候補を判定する。
そして、最終判定手段は、各ニューラルネットにより得
られた各文字パターン候補の中から最終的な認識結果を
判定する。
したがって、これらの発明によれば、手書きカナ文字の
ように文字種類が多く、多くの類似パターンを有した文
字群についても高い正解率で文字認識を行うことができ
る。
(実施例) 以下、本発明の実施例を図面に基づいて詳細に説明する
第2図はこの発明に係る一実施例の文字認識装置の構成
を説明するためのブロック図である。
同図において、1は帳票上に手書きされたカナ文字等を
光学的に読取ってその文字パターンを得るスキャナ部、
2はスキャナ部1により読取られた入力文字パターンと
のマツチング対象となる文字パターン候補群(この実施
例では「ア」〜「ン」までのカナ文字か不可欠)が登録
されたパターン候補格納部、3はスキャナ部1からの入
力文字パターンとパターン候補格納部2に格納された文
字パターン候補との所定のパターン・マツチングを行っ
てそれぞれの類似度を算出するパターン・マツチング部
、4はパターン・マツチング部3において算出された各
文字パターン候補に対する類似度の組合せから、最も確
からしい文字パターン候補を最終的な文字認識結果とし
て判定する文字判定部、5は文字判定部4において判定
された文字認識結果を格納するデータ格納部である。
さて、このような構成の文字認識装置において、上記し
た文字判定部4はニューラルネットを用いて次のように
構成される。
第1図はこのニューラルネットを用いて構成された文字
判定部の構成を示している。
同図に示すように、この文字判定部4は、グループ分は
用ニューラルネット11、複数(この実施例では19個
)のニューラルネット12〜31、最終判定部32、全
体学習データベース33、データ選別部34を備えて構
成される。
グループ分は用ニューラルネット11は、各文字パター
ン候補を類似文字群毎に複数のグループに分類し、入力
文字パターンと各文字パターン候補との各類似度から、
本来類似度が最大となるべき文字パターン候補の属する
グループに入力文字パターンが含まれていると判定され
るよう学習を行い、かつその学習の結果において、前記
各類似度から入力文字パターンを含んだグループを判定
するものである。
ニューラルネット12〜31は、分類されたグループ毎
に、入力文字パターンと各文字パターン候補との各類似
度とグループ分は用ニューラルネット11の判定結果か
ら、本来類似度が最大となってしかるべき文字パターン
候補が文字認識結果として得られるよう学習を行い、か
つその学習の結果において、前記各類似度とグループ分
は用ニューラルネット11の判定結果から、最も確信度
の高い文字パターン候補を判定するものである。
最終判定部32は、各ニューラルネット12〜31によ
り得られた各文字パターン候補の中から最終的な文字認
識結果を判定するものである。
全体学習データベース33は、グループ分は用ニューラ
ルネット11および各二二一うルネット12〜31での
学習で用いられるデータ、すなわち入力文字パターンと
各文字パターン候補との類似度とこれに対応する正解の
データとの組が格納される。またこの全体学習データベ
ース33に格納された学習データは、学習実行の際、グ
ループ分は用二二一うルネット11および各二二一うル
ネット12〜31の学習データベース(後述する)に転
送されることになるが、各ニューラルネット12〜31
に対しては、データ選別部34を介してそれぞれ該当す
る学習データを選別し、グループ分は用ニューラルネッ
ト11の判定結果と合せて転送される。
ところで、上述したグループ分は用ニューラルネット1
1および各ニューラルネット12〜31では、その学習
機能を、例えばバックプロパゲーションアルゴリズム等
の学習アルゴリズムを用いて実現している。
第3図は各ニューラルネットの基本構成を示している。
同図に示すように、この実施例の二二一うルネットの基
本構成は、パターン・マツチングにより算出された各パ
ターン候補に対する類似度がそれぞれ入力される複数の
入力ノードAからなる入力層と、各入力ノードAとアー
クBを介してネットワークで結合された複数の中間ノー
ドCからなる中間層と、各中間ノードCとアークDを介
してネットワークで結合され、各パターン候補に対する
類似度からそれぞれの最終的な正解確信度を示す値を出
力する出力ノードEからなる出力層とから構成されてい
る。そして各ノードは、それぞれ所定の入出力関数を有
し、この入出力関数により信号の変換を行う。
また上述した各アークBSDには、各ノード間の結合の
強さを示す荷重値が設定されており、これらの荷重値は
、次のネットワーク管理部により修正されるようになっ
ている。
このネットワーク管理部の構成を第4図を用いて説明す
る。
同図において、41は入力ノードAおよび中間ノードC
からそれぞれ出力されたデータを一時的に保持するノー
ド出力値テーブル、42は各アークB、Dに設定された
荷重値を保持する荷重値テーブル、43は各入力ノード
Aや中間ノードCからの出力データにそれぞれ荷重値テ
ーブル42上の対応する荷重値を乗じて積算を行う積算
器、44は個々の中間ノードCや出力ノードEに終結さ
れる積算結果を加算する加算器である。また45は通常
の文字認識において出力された各文字バタン候補に対す
る最終的な積算値(類似度)の中から最大値を得た文字
パターン候補を最終的な文字認識結果として判定する判
定器、46は学習時において出力された各文字パターン
候補に対する最終的な積算値と本来類似度が最大となっ
てしかるべき正解のデータとをそれぞれ取込んで比較し
、それぞれが一致しているかどうかを評伍する評価器、
47は評価器46において各データが一致しないと判定
されたとき、当該入力文字パターンに対する次回からの
文字認識処理において正解を得るような方向性を持って
荷重値テーブル42上の各荷重値を修正する荷重値修正
器、48は全体学習データベース33からの学習データ
を格納する学習データベース、49は学習データベース
48の登録内容を管理する学習管理器である。
次にこのネットワーク管理部による学習の基本動作をグ
ループ分は用ニューラルネット11の場合を例にとり第
5図のフローチャートを用いて説明する。
学習データベース48から、類似度の組合せとこれに対
応する正解のデータの組を1つずつ抽出しくステップa
)、これをグループ分は用ニューラルネット11の各入
力ノード出力値テーブル41と評価器46にそれぞれセ
ットする(ステップb)。
入力ノード出力値テーブル41に類似度がセットされる
と、各類似度は入力ノードAがら中間ノードCを介して
出力ノードEに至るまでの間において、アークBおよび
アークDにそれぞれ設定された荷重値を用いて積算、さ
らに加算された後、各ノードにおける入出力関数により
変換され、最終的に各出力ノードEに終結されたそれぞ
れの値が各文字パターン候補に対する確がらしさを示す
値(確信度)となる(ステップC)。
この後、各出力ノードEがら出力された各文字パターン
候補に対する値は評価器46に出力される。評価器46
は、各出力ノードEがら出力されたデータと正解のデー
タとを比較評価しくステップd)、その比較評価の結果
、両者が一致していなければ、荷重値修正器47を起動
させて荷重値テーブル42における各荷重値を、次回か
らの処理において正解のデータが得られるような方向性
を持って修正する(ステップe)。同時に学習管理器4
9は、今回の文字認識処理における入力類似度の組合せ
と正解のデータとの組を再び学習ブタとして学習データ
ベース48に格納する。
全ての文字パターンのサンプルに対する 1回目の学習
が終了すると、学習管理器49は、2回目の学習を開始
させるため学習データベース48がら再度1組ずつ各類
似度の組合せと正解のデータとの組を抽出し、これらを
グループ分は用二二うルネット11にセットする。
以上の学習動作を延々と繰り返し、全ての文字パターン
のサンプルについて正解のデータが得られるようになっ
た時点で、または所定回数の荷重値修正を終えた時点で
、グループ分は用二二一うルネット11の学習を終了さ
せる(ステップf)。
尚、各二二一うルネット12〜31の学習は、学習デー
タをセットするときにグループ分は用ニューラルネット
11の出力値を学習データに加えることを除けば、先の
グループ分は用ニューラルネット11の学習と同じであ
る。
次にこの文字認識装置の動作を説明する。
ある手書きカナ文字についてパターン・マツチングを行
い、その結果得た各文字パターン候補に対する類似度の
組合せが文字判定部4に入力されると、この類似度の組
合せは、グループ分は用ニューラルネット11にそれぞ
れ渡される。
するとグループ分は用ニューラルネット11は、前記各
類似度の組合せから、入力文字パターンがどのグループ
に含まれるかを判定し、その結果を各ニューラルネット
12〜31に送る。
各ニューラルネット12〜31は、それぞれ自身のグル
ープに属する文字間で、前記各類似度の・組合せおよび
グループ分は用二二一うルネット11の判定結果から、
入力文字パターンの認識結果として最も確信度が高い文
字パターン候補を判定し、これらを最終判定部32に送
る。
最終判定部32は、各ニューラルネット12〜31の出
力結果を比較し、最も値の大きなものを最終的な文字認
識結果として出力する。
かくしてこの実施例の文字認識装置によれば、グループ
分は用ニューラルネット11において、入力文字パター
ンのグループ分けに関する重み付けを行い、各ニューラ
ルネット12〜31において、それぞれ類似文字毎に分
類された文字パターン候補間での学習および文字認識結
果の判定を行うようにしたので、手書きカナ文字のよう
に文字種類が多く、類似文字パターンを多く含んだもの
であっても、高い正解率で文字認識を行うことができる
なお、この実施例では手書きカナ文字の認識について説
明したが、本発明はこれに限定されるものではなく、例
えば、ローマ字や漢字等の認識にも適用が可能である。
[発明の効果] 以上説明したように本発明の文字認識装置によれば、手
書きカナ文字のように文字種類が多く、多くの類似パタ
ーンを有した文字群についても、高い正解率で文字認識
を行うことができる。
【図面の簡単な説明】
第1図は本発明の一実施例の文字認識装置におけるニュ
ーラルネットを用いた文字判定部の構成ヲ説明するため
のブロック図、第2図は第1図の文字認識装置の全体構
成を説明するだめのブロック図、第3図はニューラルネ
ットの基本構成を示す図、第4図は各ニューラルネット
におけるネットワーク管理部の構成を説明するためのブ
ロック図、第5図は第4図のネットワーク管理部による
学習め基本動作を示すフローチャートである。 11・・・グループ分は用ニューラルネット12〜31
・・・ニューラルネット 32・・・最終判定部

Claims (2)

    【特許請求の範囲】
  1. (1)入力文字パターンと複数の文字パターン候補との
    各類似度から前記入力文字パターンの認識結果として最
    も確信度の高い文字パターン候補を判定する文字認識装
    置において、 前記文字パターン候補を類似文字群毎に複数のグループ
    に分類し、前記各類似度から、前記入力文字パターンが
    どのグループに含まれるかを判定するグループ判定手段
    と、 前記分類されたグループ毎に、前記各類似度と前記グル
    ープ判定手段の判定結果から、本来類似度が最大となる
    べき文字パターン候補が得られるよう学習を行い、かつ
    最も確信度の高い文字パターン候補をそれぞれ判定する
    複数のニューラルネットと、 前記複数のニューラルネットによりそれぞれ判定された
    各文字パターン候補の中から最終的な文字認識結果を判
    定する最終判定手段とを具備することを特徴とする文字
    認識装置。
  2. (2)入力文字パターンと複数の文字パターン候補との
    各類似度から前記入力文字パターンの認識結果として最
    も確信度の高い文字パターン候補を判定する文字認識装
    置において、 前記文字パターン候補を類似文字群毎に複数のグループ
    に分類し、前記各類似度から、前記入力文字パターンが
    本来類似度が最大となるべき文字パターン候補の属する
    グループに含まれると判定されるよう学習を行い、かつ
    前記入力文字パターンが含まれるグループを判定するグ
    ループ判定用ニューラルネットと、 前記分類されたグループ毎に、前記各類似度と前記グル
    ープ判定用ニューラルネットの判定結果から、本来類似
    度が最大となるべき文字パターン候補が得られるよう学
    習を行い、かつ最も確信度の高い文字パターン候補をそ
    れぞれ判定する複数のニューラルネットと、 前記複数のニューラルネットによりそれぞれ判定された
    各文字パターン候補の中から最終的な文字認識結果を判
    定する最終判定手段とを具備することを特徴とする文字
    認識装置。
JP2097261A 1990-04-12 1990-04-12 文字認識装置 Pending JPH03294983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2097261A JPH03294983A (ja) 1990-04-12 1990-04-12 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2097261A JPH03294983A (ja) 1990-04-12 1990-04-12 文字認識装置

Publications (1)

Publication Number Publication Date
JPH03294983A true JPH03294983A (ja) 1991-12-26

Family

ID=14187603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2097261A Pending JPH03294983A (ja) 1990-04-12 1990-04-12 文字認識装置

Country Status (1)

Country Link
JP (1) JPH03294983A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251057A (ja) * 1999-03-01 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 入力機器用色再現方法及び装置、並びにこの方法のプログラムを記録した記録媒体
JP2008060989A (ja) * 2006-08-31 2008-03-13 Noritsu Koki Co Ltd 撮影画像補正方法及び撮影画像補正モジュール
CN110476173A (zh) * 2017-07-21 2019-11-19 谷歌有限责任公司 利用强化学习的分层设备放置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251057A (ja) * 1999-03-01 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 入力機器用色再現方法及び装置、並びにこの方法のプログラムを記録した記録媒体
JP2008060989A (ja) * 2006-08-31 2008-03-13 Noritsu Koki Co Ltd 撮影画像補正方法及び撮影画像補正モジュール
CN110476173A (zh) * 2017-07-21 2019-11-19 谷歌有限责任公司 利用强化学习的分层设备放置
CN110476173B (zh) * 2017-07-21 2023-08-01 谷歌有限责任公司 利用强化学习的分层设备放置

Similar Documents

Publication Publication Date Title
JP2940933B2 (ja) パターン認識方式
Hosang et al. Learning non-maximum suppression
JP3088171B2 (ja) 自己組織型パタ−ン分類システム及び分類方法
US4876731A (en) Neural network model in pattern recognition using probabilistic contextual information
USRE47830E1 (en) Computing device and method using associative pattern memory using recognition codes for input patterns
EP3349152A1 (en) Classifying data
JP3265701B2 (ja) 多判定器によるパターン認識装置
JPH03294983A (ja) 文字認識装置
JPH05225163A (ja) ニューラルネットシステムおよびニューラルネットの学習方法
JP2680419B2 (ja) 文字認識装置
JPH03220686A (ja) 文字認識装置
CN111177388A (zh) 一种处理方法及计算机设备
JPH08115387A (ja) パターン認識装置
JPH03164886A (ja) 文字認識装置
JPH0388090A (ja) 文字認識装置
JP2778194B2 (ja) パターン認識方法および装置
JPH02125392A (ja) 文字認識方法およびこれを用いた文字認識装置
JPH04260987A (ja) 文字認識装置
JP2684857B2 (ja) 認識判断装置
JPH05165971A (ja) ニューラルネットを用いたパターン認識の方法および装置
JPH05258114A (ja) 文字認識装置
JPH05258117A (ja) 文字認識装置
JPH09231079A (ja) ファジィ推論システムおよびファジィルール構築システム
JP3109476B2 (ja) 候補数制御機能付き文字認識装置及び方法
JPH0683798A (ja) 学習認識装置