JPH03220686A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH03220686A
JPH03220686A JP2017406A JP1740690A JPH03220686A JP H03220686 A JPH03220686 A JP H03220686A JP 2017406 A JP2017406 A JP 2017406A JP 1740690 A JP1740690 A JP 1740690A JP H03220686 A JPH03220686 A JP H03220686A
Authority
JP
Japan
Prior art keywords
character
character pattern
neural network
learning
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017406A
Other languages
English (en)
Inventor
Masaya Ono
雅也 小野
Kazuhito Haruki
春木 和仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2017406A priority Critical patent/JPH03220686A/ja
Publication of JPH03220686A publication Critical patent/JPH03220686A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) 本発明は、ニューラルネットワークを用いた文字認識装
置に関する。
(従来の技術) 近年、ニューラルネットワークを用いて文字認識、音声
認識、画像情報処理等を行うシステムの開発が盛んであ
る。
一般に知られる文字認識処理は、入力文字パターンと複
数の文字パターン候補とのパターン・マツチングにより
それぞれの類似度を算出し、その中で最大類似度を得た
文字パターン候補を最終的な文字認識結果として判定し
出力することで文字認識を行うものである。これに対し
、従来の文字認識方法にニューラルネットを組合せた方
式では、ある入力文字パターンの認識結果に誤りが生じ
た場合、その入力文字パターンに対する次回からの文字
認識において正解の文字パターン候補が得られるような
方向性を持ってニューラルネットワークにおける各アー
ク荷重値を修正する。
したがって、このニューラルネットワークを採用した文
字認識処理により、入力文字パターンの特徴の変化に応
じた良好な文字認識を安定して行うことが可能となる。
(発明が解決しようとする課題) ところが、こうしたニューラルネットワークを採用した
文字認識処理では、手書き数字の認識においては良好な
認識率が得られるものの、これを手書きカナ文字等に適
用しようとした場合数々の障害があった。
例えば、手書き数字の場合、ニューラルネットワークの
入力層は、入力文字パターンと「0」から「9」までの
各数字との類似度にそれぞれ対応する10個のユニット
と、ダミー1個の計11個のユニットだけで済む。これ
に対し手書きカナ文字の場合は、入力層は、入力文字パ
ターンと「ア」から「ン」までの各カナ文字との類似度
にそれぞれ対応する46個のユニットとダミー1個の計
47個が必要となる。これに伴って中間層の数も数字の
場合は50個程度で済んでいたが、カナ文字の場合は少
なくとも 100個あるいはそれ以上必要とする。
出力層についても数字の場合は10個、カナ文字の場合
は46個必要とする。
したがって、大規模となり、しかも手書きカナ文字の場
合、「工、コ、ユ」等のパターンが類似した文字が多い
ため学習に長時間を要し、満足する認識率を得ることが
できないという問題があった。
この対策として、入力文字パターンを類似したちの同志
で複数のグループに分け、これらのグループの中で専門
に判定を行う小規模なニューラルネットワークを複数組
合せることが考えられるが、その場合には、いかにして
入力文字パターンを最適にグループ分けするかが問題に
なる。
本発明はこのような課題を解決するためのもので、手書
きカナ文字のように文字種類が多く、多くの類似パター
ンを有した文字群についても、学習に長時間を要すこと
なく、高い正解率で文字認識を行うことのできる文字認
識装置の提供を目的としている。
[発明の構成] (課題を解決するための手段) 本発明の文字認識装置は上記した目的を遠戚するために
、入力文字パターンと複数の文字パターン候補との各類
似度から入力文字パターンの認識結果として最も確信度
の高い文字パターン候補を判定する文字認識装置におい
て、各文字パターン候補をベクトル間の内積が大きいも
の同士で複数のグループに分類し、各グループ毎に、各
類似度から、本来類似度が最大となるべき文字パターン
候補が最終的な文字認識結果として出力されるよう学習
を行い、かつ最も確信度の高い文字パターン候補をそれ
ぞれ判定する複数のサブニューラルネットと、各類似度
から、本来類似度が最大となるべき文字パターン候補を
含むサブニューラルネットの判定結果が最終的な文字認
識結果として判定されるよう学習を行い、かつ最も確信
度の高い文字パターン候補を含むサブニューラルネット
を判定するニューラルネットとを具備している。
(作 用) 本発明の文字認識装置では、各サブニューラルネットお
よびニューラルネットに、それぞれ入力文字パターンと
複数の文字パターン候補との各類似度が入力されると、
各サブニューラルネットは、それぞれのグループ内にお
いて最も確信度の高い文字パターン候補をそれぞれ判定
する。そしてニューラルネットは、各サブニューラルネ
ットの中から、最も確信度の高い文字パターン候補を含
むサブニューラルネットを判定する。
また学習時において、各サブニューラルネットは、分類
された各グループ毎に、入力文字パターンと複数の文字
パターン候補との各類似度から、本来類似度が最大とな
るべき文字パターン候補が最終的な文字認識結果として
出力されるよう学習を行う。またニューラルネットは、
前記各類似度から本来類似度が最大となるべき文字パタ
ーン候補を含むサブニューラルネットの判定結果が選択
されるよう学習を行う。
ここで、各サブニューラルネットが対象とする文字パタ
ーン候補のグループ分けは、各文字バタン候補が持つベ
クトル間の内積が大きいもの同士、すなわち類似したベ
クトルの文字パターン候補同士を集めて行われる。
したがって、この発明によれば、手書きカナ文字のよう
に文字種類が多く、多くの類似パターンを有した文字群
についても高い正解率で文字認識を行うことができる。
(実施例) 以下、本発明の実施例を図面に基づいて詳細に説明する
第2図はこの発明に係る一実施例の文字認識装置の構成
を説明するためのブロック図である。
同図において、1は帳票上に手書きされたカナ文字等を
光学的に読取ってその文字パターンを得るスキャナ部、
2はスキャナ部1により読取られた入力文字パターンと
のマツチング対象となる文字パターン候補群(この実施
例では「ア」〜「ン」までのカナ文字が不可欠)が登録
されたパターン候補格納部、3はスキャナ部1からの入
力文字パターンとパターン候補格納部2に格納された文
字パターン候補との所定のパターン・マツチングを行っ
てそれぞれの類似度を算出するパターン・マツチング部
、4はパターン・マツチング部3において算出された各
文字パターン候補に対する類似度の組合せから、最も確
からしい文字パターン候補を最終的な文字認識結果とし
て判定する文字判定部、5は文字判定部4において判定
された文字認識結果を格納するデータ格納部である。
さて、このような構成の文字認識装置において、上記し
た文字判定部4はニューラルネットを用いて次のように
構成される。
第1図はこのニューラルネットを用いて構成された文字
判定部の構成を示している。
同図に示すように、この文字判定部4は、制御用ニュー
ラルネット11と、複数のサブニューラルネット12〜
31と(この実施例では19個)、最終判定部32と、
全体学習データベース33と、データ選別部34とを備
えて構成される。
サブニューラルネット12〜31は、各文字パターン候
補を、ベクトル間の内積が大きいもの同士で複数のグル
ープに分類し、入力文字パターンと各文字パターン候補
との各類似度値から、各グループ毎に本来類似度が最大
となってしかるべき文字パターン候補か得られるよう学
習を行い、その学習の結果において、各グループ毎に最
も確信度の高い文字パターン候補の判定を行うものであ
る。
制御用ニューラルネット11は、入力文字パターンと各
文字パターン候補との各類似度値から、本来類似度が最
大となってしかるべき文字パターン候補を含むサブニュ
ーラルネット12〜31の判定結果が最終的な文字認識
結果として最終判定部32で選択されるよう学習を行い
、その学習の結果において、最も確信度の高い文字パタ
ーン候補を含んだサブニューラルネット12〜31を判
定するものである。
全体学習データベース33は、制御用ニューラルネット
11および各サブニューラルネット12〜31での学習
で用いられるデータ、すなわち入力文字パターンと各文
字パターン候補との類似度とこれに対応する正解のデー
タとの組が格納される。またこの全体学習データベース
33に格納された学習データは、学習実行の際、各ニュ
ーラルネット11.12〜31の学習データベース(後
述する)に転送されることになるが、各サブニューラル
ネット12〜31に対しては、データ選別部34を介し
てそれぞれ該当する学習データを選別した上で転送され
る。
ここで、各サブニューラルネット12〜31における文
字パターン候補のグループ分けの方法を第3図のフロー
チャートを用いて説明する。
まず各文字パターン候補のベクトルを求め(ステップa
)、各ベクトル間の内積を求める(ステップb)。次に
ベクトル間の内積の値が大きな文字パターン候補同士を
集めて、各文字パターン候補を複数のグループに分類す
る(ステップC)。
ここで、どのグループにも属さない文字パターン 0 候補が複数71在した場合は(ステップd)、これらを
個々に独立したグループとするか、またはこれらを一つ
のグループにまとめる(ステップe)。
さらに細かいグループ分けを行う場合は、前記各グルー
プ内の文字パターン候補について同様の手順で分類を行
えばよい。
ところで、上述した各ニューラルネット11.12〜3
1ては、その学習機能を、例えばパックプロパゲーショ
ンアルゴリズム等の学習アルゴリズムを用いて実現して
いる。
第4図は各ニューラルネットの基本構成を示している。
同図に示すように、この実施例のニューラルネットの基
本構成は、パターン・マツチングにより算出された各パ
ターン候補に対する類似度がそれぞれ入力される複数の
入力ノードAからなる入力層と、各入力ノードAとアー
クBを介してネットワークで結合された複数の中間ノー
ドCからなる中間層と、各中間ノードCとアークDを介
してネットワークで結合され、各パターン候補に対する
1 類似度からそれぞれの最終的な正解確信度を示す値を出
力する出力ノードEからなる出力層とから構成されてい
る。
また上述した各アークBSDには、各ノード間の結合の
強さを示す荷重値か設定されており、これらの荷重値は
、次のネットワーク管理部により修正されるようになっ
ている。
このネットワーク管理部の構成を第5図を用いて説明す
る。
同図において、41は入力ノードAおよび中間ノードC
からそれぞれ出力されたデータを一時的に保持するノー
ド出力値テーブル、42は各アクBSDに設定された荷
重値を保持する荷重値テブル、43は各入力ノードAや
中間ノードCからの出力データにそれぞれ荷重値テーブ
ル42上の対応する荷重値を乗じて積算を行う積算器、
44は個々の中間ノードCや出力ノードEに終結される
積算結果を加算する加算器である。また45は通常の文
字認識において出力された各文字パタン候補に対する最
終的な積算値(類似度)の中2 から最大値を得た文字パターン候補を最終的な文字認識
結果として判定する判定器、46は学習時において出力
された各文字パターン候補に対する最終的な積算値と本
来類似度が最大となってしかるべき正解のデータとをそ
れぞれ取込んで比較し、それぞれが一致しているかどう
かを評価する評価器、47は評価器46において各デー
タが一致しないと判定されたとき、当該入力文字パター
ンに対する次回からの文字認識処理において正解を得る
ような方向性を持って荷重値テーブル42上の各荷重値
を修正する荷重値修正器、48は全体学習データベース
33からの学習データを格納する学習データベース、4
9は学習データベース48の登録内容を管理する学習管
理器である。
次にこのネットワーク管理部による学習の基本動作を第
6図のフローチャートを用いて説明する。
まず学習データベース48から、類似度の組合せとこれ
に対応する正解のデータの組を 1つずつ抽出しくステ
ップa)、これを制御用ニューラルネット11および各
サブニューラルネット12〜3 31の各入力ノード出力値テーブル41と評価器46に
それぞれセットする(ステップb)。
さて入力ノード出力値テーブル41に類似度がセットさ
れると、各類似度は入力ノードAから中間ノードCを介
して出力ノードEに至るまでの間において、アークBお
よびアークDにそれぞれ設定された荷重値を用いて積算
、さらに加算され、最終的に各出力ノードEに終結され
たそれぞれの値が各文字パターン候補に対する確からし
さを示す値(確信度)となる(ステップC)。
この後、各出力ノードEから出力された各文字パターン
候補に対する値は評価器46に出力される。評価器46
は、各出力ノードEから出力されたデータと正解のデー
タとを比較評価しくステップd)、その比較評価の結果
、両者が一致していなければ、荷重値修正器47を起動
させて荷重値テーブル42における各荷重値を、次回か
らの処理において正解のデータが得られるような方向性
を持って修正する(ステップe)。同時に学習管理器4
9は、今回の文字認識処理における入力類4 低度の組合せと正解のデータとの組を「4び学習ブタと
して学習データヘ−ス48に格納する。
全ての文字パターンのサンプルに対する 1回「1の学
習か終了すると、学習管理器49は、2回目の学習を開
始させるため学習データベース48から再度1組ずつ各
類似度の組合せと正解のデータとの組を抽出し、これら
を各ニューラルネット11.12〜3]にそれぞれセッ
トする。
以」−の学習動作を延々と繰り迦し、全ての文字パター
ンのサンプル(こついて止角11′のデータか111ら
れるようになった時点て、あるいは所定回数の荷重値修
正を終えた時点で、全ての学習を終了させる(ステップ
f)。
次にこの文字認識装置の動作を説明する。
ある手書きカナ文字についてパターン・マツチングを行
い、その拮果得た各文字パターン候補に対する類似度の
組合せか文字判定部4に入力されると、この類似度の組
合せは、制御用ニューラルネット1]および各ザブニュ
ーラルネット12〜31にそれぞれ渡される。
]5 すると制御用ニューラルネット]1は、前記各類似度の
紹合せから、どのサブニューラルネット12〜3]の判
定結果か最も正解の確信度が高いかを決定し、そのネッ
ト番号を最終判定部32に送る。
また、各ザブニューラルネット12〜31は、前記各類
似度の組合せから、それぞれ白身のグルプ内においてど
の文字パターン候補が入力文字パターンの認識結果とし
て最も確信度が高いか1′11定し、これらの判定結果
を最終列に部32に送る。
この紐束、最終判定部32は、制御用ニューラルネット
11で決定されたネット番号のザブニュラルネット12
〜3]の判定結果を最終的な判定結果として判定しこれ
を出力する。
かくしてこの実施例の文字認識装置によれば、各ザブニ
ューラルネッ)・12〜3]において、それぞれベクト
ル間の内積が大きいもの同士集めた文字パターン候補間
での学習および文字認識結果の判定を行うとともに、制
御用ニューラルネット11において、とのサブニューラ
ルネット12〜6 31か最も確信度の高い文字パターン候補を含んでいる
かを学習、判定するようにしたので、手書きカナ文字の
ように文字種類か多く、類似文字パターンを多く含んだ
ものであっても、高い正解率で文字認識を行うことがで
きる。
なお、上述した実施例では、文字判定部4の構造を、制
御用ニューラルネット1]どザブニュラルネット12〜
31の二段階のものとしたか、必要に応じてこれをさら
に多段階としたり、サブニューラルネットの数を19個
以外にして文字認識を行わせてもよい。
また、この実施例では手書きカナ文字の認識について説
明したが、本発明はこれに駆足されるものではなく、例
えば、ローマ字や炭室等の認識にも適用が可能である。
[発明の効果] 以上説明したように本発明の文字認識装置によれば、手
書きカナ文字のように文字種類が多く、多くの類似パタ
ーンを有した文字群についても、学習に長時間を要すこ
となく、高い正解率で文字7 認識を行うことができる。
【図面の簡単な説明】
第1図は本発明に係る一実胞例の文字認識装置における
ニューラルネットを用いた文字判定部の構成を説明する
ためのブロック図、第2図は第1図の文字認識装置の全
体構成を説明するためのブロック図、地3図は第1図の
ザブニューラルネットにおける各文字パターン候補のグ
ループ分けの手順を示すフローチャート、第4図はニュ
ーラルネットの址本梠成を示す図、第5図は第4図のニ
ューラルネットにおけるネットワーク管理部の構成を説
明するためのブロック図、第6図は第5図のネットワー
ク管理部による学習の基本動作を示すフローチャー1・
である。 11・・・制御用ニューラルネット、12〜31・・サ
ブニューラルネット、32・・・最終判定部、33・・
・全体学習データベース、34・・・データ選別部。

Claims (1)

  1. 【特許請求の範囲】 入力文字パターンと複数の文字パターン候補との各類似
    度から入力文字パターンの認識結果として最も確信度の
    高い文字パターン候補を判定する文字認識装置において
    、 前記各文字パターン候補をベクトル間の内積が大きいも
    の同士で複数のグループに分類し、各グループ毎に、前
    記各類似度から、本来類似度が最大となるべき文字パタ
    ーン候補が最終的な文字認識結果として出力されるよう
    学習を行い、かつ最も確信度の高い文字パターン候補を
    それぞれ判定する複数のサブニューラルネットと、 前記各類似度から、本来類似度が最大となるべき文字パ
    ターン候補を含むサブニューラルネットの判定結果が最
    終的な文字認識結果として判定されるよう学習を行い、
    かつ最も確信度の高い文字パターン候補を含むサブニュ
    ーラルネットを判定するニューラルネットとを具備する
    ことを特徴とする文字認識装置。
JP2017406A 1990-01-25 1990-01-25 文字認識装置 Pending JPH03220686A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017406A JPH03220686A (ja) 1990-01-25 1990-01-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017406A JPH03220686A (ja) 1990-01-25 1990-01-25 文字認識装置

Publications (1)

Publication Number Publication Date
JPH03220686A true JPH03220686A (ja) 1991-09-27

Family

ID=11943118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017406A Pending JPH03220686A (ja) 1990-01-25 1990-01-25 文字認識装置

Country Status (1)

Country Link
JP (1) JPH03220686A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021089714A (ja) * 2019-12-05 2021-06-10 エスアーペー エスエー 文字の視覚認識符号化

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021089714A (ja) * 2019-12-05 2021-06-10 エスアーペー エスエー 文字の視覚認識符号化

Similar Documents

Publication Publication Date Title
Hosang et al. Learning non-maximum suppression
JP2940933B2 (ja) パターン認識方式
EP0465489B1 (en) Genetic synthesis of neural networks
EP3349152A1 (en) Classifying data
KR20200000216A (ko) 단어자질을 강화한 음성 대화 방법 및 시스템
KR102223382B1 (ko) 다중타입 엔티티에 기반한 지식 보완 방법 및 장치
CN110288199A (zh) 产品质量预测的方法
JP3265701B2 (ja) 多判定器によるパターン認識装置
CN110275928A (zh) 迭代式实体关系抽取方法
JPH08227408A (ja) ニューラルネットワーク
US5493632A (en) Neural network employing a location addressable memory and method for operating the same
JPH03220686A (ja) 文字認識装置
JPH05225163A (ja) ニューラルネットシステムおよびニューラルネットの学習方法
CN109697511B (zh) 数据推理方法、装置及计算机设备
Austin et al. A neural architecture for fast rule matching
CN115203690A (zh) 一种基于异常偏差类神经元的深度学习模型安全加固方法
JPH03294983A (ja) 文字認識装置
JPH02300876A (ja) 文字認識装置
JP7230324B2 (ja) ニューラルネットワークの学習方法、コンピュータプログラム及びコンピュータ装置
JP3318958B2 (ja) 学習型波形認識処理装置
JPH0388090A (ja) 文字認識装置
JPH03164886A (ja) 文字認識装置
Aguilar et al. Recognition algorithm using evolutionary learning on the random neural networks
JPH02125392A (ja) 文字認識方法およびこれを用いた文字認識装置
Thammasiri et al. Imbalance classification model for churn prediction