JPH05258114A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05258114A
JPH05258114A JP4052763A JP5276392A JPH05258114A JP H05258114 A JPH05258114 A JP H05258114A JP 4052763 A JP4052763 A JP 4052763A JP 5276392 A JP5276392 A JP 5276392A JP H05258114 A JPH05258114 A JP H05258114A
Authority
JP
Japan
Prior art keywords
character
group
network
input
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4052763A
Other languages
English (en)
Inventor
Mutsuo Ijuin
睦雄 伊集院
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4052763A priority Critical patent/JPH05258114A/ja
Publication of JPH05258114A publication Critical patent/JPH05258114A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 (修正有) 【目的】高い文字認識率を得ることができる文字認識装
置を提供する。 【構成】文字を類似あるいは互いに識別が困難な10の
グループに分類し、それぞれグループ内の文字を識別す
るグループネットワークGP1〜GP10、入力された
文字パターンがグループネットワークGP1〜GP10
のどのグループに属するのかを判定するグループ判定ネ
ットワークGP、グループネットワークGP1〜GP1
0の最大出力値及びグループ判定ネットワークGPの出
力値から総合的に判断して最適な文字種を決定す総合判
断ネットワーク32から構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字の認識を自動化す
るための文字認識装置に関する。
【0002】
【従来の技術】従来、ニューラルネットワークを文字認
識に適用する場合において、比較的小規模かつ、小数の
データに対しては高い認識能力が期待できるが、ネット
ワークの規模やデータ数の拡大に伴い、学習時間の増大
や極小解にはまり易くなるという問題が生じた。
【0003】そこで、認識文字をある基準でグループ化
し、まず、認識対象文字がどのグループに属するかとい
う大分類を行った後、各グループ内で詳細分類を行い、
1文字にまで絞り込むという構造化ニューラルネットワ
ークが考えられている。この場合、グループ内の文字を
識別するのに個々のニューラルネットワークは、学習デ
ータ数が少なく、規模も少なくて済むため、高い認識率
が期待できる。
【0004】しかし、最初にどのグループに属するのか
を決定する大分類のニューラルネットワークは、学習す
べきデータ数が多く、規模も大きくなり易く現実的でな
い。また、詳細分類を行う複数のニューラルネットワー
クは、類似文字グループ構成の際に、1文字を1グルー
プに割り当て、複数グループに重複して文字を割り当て
ることを行わないため、最初の大分類ニューラルネット
ワークの認識率で全体の文字認識率が決定されてしま
う。
【0005】このため、たとえ他の詳細分類のニューラ
ルネットワーク内に正しい文字種が存在していても、文
字認識の判断基準以下の場合は破棄され、判断基準を満
たす場合は、まちがった認識がなされ、正しい文字種が
無視されるという問題点があった。
【0006】
【発明が解決しようとする課題】前述したように、従
来、構造化ニューラルネットワークを適用して文字認識
を行う場合、全体の文字認識率は、最初に行われるグル
ープ選択のための大分類ニューラルネットワークの認識
能力に大きく依存し、制限されるという問題点があっ
た。
【0007】そこで、本発明は、かかる問題点を除去
し、高い文字認識が得ることができる文字認識装置を提
供することを目的とする。
【0008】
【課題を解決するための手段】本発明は、同一の文字種
が含まれることが許され、文字パタ−ンが類似する複数
のグループに分類された文字グループ単位で並列に文字
認識を行う複数の文字認識手段と、前記複数の文字認識
手段と並列に接続され、入力文字パターンが前記複数の
文字認識手段の文字グループのどのカテゴリーに類似す
るかを判定するグループ判定手段と、前記複数の文字認
識手段と前記グループ判定手段の出力結果から総合的に
入力文字パターンの文字種を決定する総合文字種決定手
段とを具備することを特徴とする。
【0009】
【作用】本発明は、同一の文字種が含まれることが許さ
れ、文字パタ−ンが類似する複数のグループに分類され
た文字グループ単位で並列に文字認識を行う複数の文字
認識手段と、入力文字パターンが前記文字認識手段の文
字グループのどのカテゴリーに類似するかを判定するグ
ループ判定手段を並列に接続して処理した後、前記複数
の文字認識手段と前記グループ判定手段の出力結果から
総合的に入力文字パターンの文字種を決定するようにし
ているので、文字認識対象文字の文字認識率を向上する
ことができる。
【0010】
【実施例】以下、図面を参照して本発明の実施例につい
て説明する。
【0011】図1は、本発明の一実施例である文字認識
装置の構成ブロック図である。図1において、予め認識
する文字を類似する文字グループに分類し、各グループ
毎に入力された文字パターン11の詳細な文字認識を行
うグループネットワークGP1〜GPn、入力された文
字パターン11がどのグループネットワークに属するか
を判定するグループ判定ネットワークGP、前記各グル
ープネットワークGP1〜GPnの出力及び前記グルー
プ判定ネットワークGPの出力から総合的に判断して最
終的に入力された文字パターンの文字種を決定し、決定
された文字種を認識結果出力13として出力する総合判
断ネットワーク12により構成される。なお、グループ
ネットワークGP1〜GPn、グループ判定ネットワー
クGP及び総合判断ネットワークはバックプロパゲーシ
ョン・アルゴリズム等の学習機能を持つニューラルネッ
トワークで構成されている。
【0012】図2はグループネットワークGP1〜GP
nにおけるニューラルネットワークの構成図である。該
ニューラルネットワークはバックプロパゲーションによ
り学習を行うニューラルネットワークにより構成されて
いる。図2のように、該グループネットワークは入力
層、中間層及び出力層の3層で構成されている。この入
力層、中間層及び出力層の間のユニットは互いに結合
し、各結合は重みを持っており、所望の出力値との誤差
をもとに所望の値を出力するように結合の重みを修正す
ることにより学習を行う。
【0013】ここで、バックプロパゲーションの学習動
作について概説する。まず、各結合の重みの値をランダ
ムに設定し、入力と該入力に対する所望の出力を与え
る。次に、入力層、中間層、出力層の順で入力に対する
出力を決定していく。入力層のユニットは入力値をその
まま出力値とする。中間層、出力層のユニットは下位層
のユニットの出力値とユニット間の結合の重みの加重総
和を入力値とする。中間層、出力層の各ユニットは入力
値を非線形関数により交換して出力する。次に、出力層
のユニットの出力と所望の出力の誤差を評価する。この
評価関数の値を小さくするように各ユニットのしきい
値、結合の重みを更新する。このような手順で評価値が
十分小さくなるまで学習を繰り返す。
【0014】さて、学習されたグループネットワークに
入力された文字パターンは、パターンの特徴を持つベク
トルとして入力層の入力ユニットA1〜Amに入力され
る。入力されたパターンベクトルは中間層を介して出力
層に出力される。ここで、最終的な出力層の出力ユニッ
トは、グループネットワークに分けられ、認識すべき文
字の担当文字数と同じ数となる。図2においては、文字
数が3つの場合の出力ユニットB1〜B3を示してい
る。
【0015】図3は、グループ判定ネットワークGPに
おけるニューラルネットワークの構成図である。該ニュ
ーラルネットワークは、図2のニューラルネットワーク
と同様にバックプロパゲーションにより学習を行うニュ
ーラルネットワークで構成されている。また、構成も図
2と同様であり、該グループ判定ネットワークは入力
層、中間層及び出力層の3層で構成されている。入力層
はグループネットワークと同様の文字パターンデータが
入力され、入力ユニットAA1〜AAmの数はグループ
ネットワークの入力層の入力ユニットA1〜Amの数と
同じである。出力層は判定すべきグループがnグループ
あるのでn個のユニットBB1〜BBnとなる。なお、
該グループ判定ネットワークの学習は入力された文字パ
ターンがどの文字グループに属するかを学習する。
【0016】図4は、総合判断ネットワーク12におけ
るニューラルネットワークの構成図である。該ニューラ
ルネットワークも図2、図3と同様にバックプロパゲー
ションにより学習を行うニューラルネットワークで構成
されている。また、全体的な構成も入力層、中間層及び
出力層の3層で構成されており、図2、図3と同様であ
る。図4において、入力層の入力ユニットは大きく2つ
に分けることができる。すなわち、1つは、グループ判
定ネットワークの出力値を入力する入力ユニットBB1
〜BBnであり、他は、グループネットワーク毎の最大
出力値を入力する入力層の入力ユニットAB1〜ABn
である。前記各入力ユニットの数は、それぞれn個であ
る。従って、入力層の入力ユニットの数は全部で2n個
となる。入力ユニットから入力されたデータは、中間層
を介して出力層に出力される。出力層はn個のユニット
CC1〜CCnからなり、分類された文字グループに対
応するユニットとなる。すなわち、グループ判定ネット
ワークの出力値と各グループネットワークの最大出力値
に対して適切な重み付けがなされ、最終的に最適な認識
を行った文字グループのグループネットワークに相当す
る出力ユニットが最大出力値をとることとなる。その
後、総合判断ネットワークの最大出力ユニットに対応す
るグループネットワークの最大出力ユニットの文字を入
力された文字パターンの文字種として決定する。
【0017】次に、具体例としてカタカナ文字の文字認
識の例を挙げて説明する。図5は、本発明による一実施
例であるカタカナ用文字認識装置の構成ブロック図であ
る。図5において、本文字認識装置は、カタカナ文字を
類似あるいは互いに識別が困難な10のグループに分類
され、それぞれグループ内の文字を識別するグループネ
ットワークGP1〜GP10、入力された文字パターン
がグループネットワークGP1〜GP10のどのグルー
プに属するのかを判定するグループ判定ネットワークG
P、グループネットワークGP1〜GP10の最大出力
値及びグループ判定ネットワークGPの出力値から総合
的に判断して最適な文字種を決定する総合判断ネットワ
ーク32から構成される。また、グループネットワーク
の内、グループネットワークGP1は「ア」、「カ」、
「ウ」の文字認識を、グループネットワークGP2は
「カ」、「コ」、「ロ」の文字認識を、グループネット
ワークGP3は「ソ」、「ツ」、「ノ」、「リ」の文字
認識を行うものとする。
【0018】ここで、文字パターン”カ”が入力された
とすると、まず、グループ判定ネットワークでは、最大
出力ユニットに相当するグループネットワ−クGP2を
第1候補とし、次の高い出力を有するユニットに相当す
るグループネットワ−クGP1を第2候補、さらに次に
高い出力を有するユニットに相当するグループネットワ
−クGP3を第3候補とする。以下、同様に出力の高さ
順を優先順位とし、全部10個グループ分の優先順位を
出力値として総合判断ネットワーク32に入力する。
【0019】このとき、グループ判定ネットワークと並
列に接続されたグループネットワークGP1〜GP10
は、それぞれ文字パターン”カ”の入力に対して、グル
ープ内の文字に対する文字認識を行い、最大出力値を有
するユニット出力値を出力し、総合判断ネットワーク3
2に入力する。例えば、グループネットワークGP1で
は「カ」が、グループネットワークGP2では「コ」
が、グループネットワークGP3及びグループネットワ
ークGP10では「リ」が最大出力値を有し、出力され
る。この時点において、グループ判定ネットワークはグ
ループネットワークGP2が最大出力値を有しているた
め、該グループネットワーク内に文字パターン”カ”に
対する最適文字種が存在する確率が最も高いと判定して
おり、誤った判定となっている。
【0020】さて、総合判断ネットワーク32におい
て、グループ判定ネットワークから出力された10個の
文字グループの優先順位を意味する出力値と、10のグ
ループネットワークGP1〜GP10から出力された1
0個の出力値が入力され、ニューラルネットワークによ
り各入力値に対して重み付けがなされ、最適なグループ
ネットワークが選択され、選択されたグループネットワ
ークにおいて最大出力を有した文字種が選択される。す
なわち、総合判断ネットワークはグループネットワーク
GP1を選択し、最終的に、グループネットワークGP
1において最大出力値を有した文字種「カ」が、文字パ
ターン”カ”の文字種と判断されて出力される。
【0021】なお、本実施例では文字認識について説明
したが、文字以外のパタ−ン認識にも応用することがで
きる。
【0022】
【発明の効果】以上説明したように、本発明は、同一の
文字種が含まれることが許され、文字パタ−ンが類似す
る複数のグループに分類された文字グループ単位で並列
に文字認識を行う複数の文字認識手段と、入力文字パタ
ーンが前記文字認識手段の文字グループのどのカテゴリ
ーに類似するかを判定するグループ判定手段を並列に接
続して処理した後、前記複数の文字認識手段と前記グル
ープ判定手段の出力結果から総合的に入力文字パターン
の文字種を決定するようにしているので、構造化ネット
ワークの大分類ネットワークに相当するグループ判定手
段の利点を有効に活用することができ、より正確な文字
認識が可能となり、文字認識率を向上することができる
利点を有する。
【0023】また、大量の入力データに関する構造化ネ
ットワークの利点を有効に活用することができる。すな
わち、構造化ネットワークの場合、上位の1つのネット
ワークにより生じた誤った認識は他に大きな影響を与え
たが、該影響を分散することにより各種の異なる手法に
よるネットワークの出力を総合的に判断するため、漢字
等の大量のデータに対しても適切な分類または異なる判
断手法を並列に処理することにより高い文字認識率を確
保することができるという利点を有する。
【図面の簡単な説明】
【図1】本発明の一実施例である文字認識装置の構成ブ
ロック図。
【図2】グループネットワークにおけるニューラルネッ
トワークの構成図。
【図3】グループ判定ネットワークにおけるニューラル
ネットワークの構成図。
【図4】総合判断ネットワークにおけるニューラルネッ
トワークの構成図。
【図5】本発明による一実施例であるカタカナ用文字認
識装置の構成ブロック図。
【符号の説明】
11 文字パターン入力部 12,32 総合判断ネットワーク 13,33 認識結果出力部 31 文字パターン”カ” GP グループ判定ネットワーク GP1〜GPn グループネットワーク A1〜Am,AA1〜AAm,BB1〜BBn,AB1
〜ABn 入力ユニット B1〜B3,BB1〜BBn,CC1〜CCn 出力ユ
ニット

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】同一の文字種が含まれることが許され、文
    字パタ−ンが類似する複数のグループに分類された該文
    字グループ単位で並列に文字認識を行う複数の文字認識
    手段と、 前記複数の文字認識手段と並列に接続され、入力文字パ
    ターンが前記複数の文字認識手段の文字グループのどの
    カテゴリーに類似するかを判定するグループ判定手段
    と、 前記複数の文字認識手段と前記グループ判定手段の出力
    結果から総合的に入力文字パターンの文字種を決定する
    総合文字種決定手段とを具備することを特徴とする文字
    認識装置。
  2. 【請求項2】前記複数の文字認識手段、前記グループ判
    定手段及び前記総合文字決定手段をニューラルネットワ
    ークにより処理することを特徴とする前記請求項1記載
    の文字認識装置。
JP4052763A 1992-03-11 1992-03-11 文字認識装置 Pending JPH05258114A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4052763A JPH05258114A (ja) 1992-03-11 1992-03-11 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4052763A JPH05258114A (ja) 1992-03-11 1992-03-11 文字認識装置

Publications (1)

Publication Number Publication Date
JPH05258114A true JPH05258114A (ja) 1993-10-08

Family

ID=12923918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4052763A Pending JPH05258114A (ja) 1992-03-11 1992-03-11 文字認識装置

Country Status (1)

Country Link
JP (1) JPH05258114A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251057A (ja) * 1999-03-01 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 入力機器用色再現方法及び装置、並びにこの方法のプログラムを記録した記録媒体
JP4494561B2 (ja) * 1999-09-17 2010-06-30 徹 中川 パターン識別装置
WO2020218512A1 (ja) * 2019-04-26 2020-10-29 Arithmer株式会社 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251057A (ja) * 1999-03-01 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 入力機器用色再現方法及び装置、並びにこの方法のプログラムを記録した記録媒体
JP4494561B2 (ja) * 1999-09-17 2010-06-30 徹 中川 パターン識別装置
WO2020218512A1 (ja) * 2019-04-26 2020-10-29 Arithmer株式会社 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム

Similar Documents

Publication Publication Date Title
Brown et al. User identification via keystroke characteristics of typed names using neural networks
Ishibuchi et al. Fuzzy data mining: Effect of fuzzy discretization
JPH02306387A (ja) パターン認識方式
CN110288199A (zh) 产品质量预测的方法
CN106874963B (zh) 一种基于大数据技术的配电网故障诊断方法及系统
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN107145778A (zh) 一种入侵检测方法及装置
JPH08227408A (ja) ニューラルネットワーク
CN107979606B (zh) 一种具有自适应的分布式智能决策方法
JPH05258114A (ja) 文字認識装置
JP3222699B2 (ja) パターン認識装置
CN111666985B (zh) 一种基于dropout的深度学习对抗样本图像分类防御方法
CN109308565B (zh) 人群绩效等级识别方法、装置、存储介质及计算机设备
JPH05101028A (ja) 複数特徴量の統合判定方法
Nasir et al. An improved multi-objective optimization algorithm based on fuzzy dominance for risk minimization in biometric sensor network
US7246100B2 (en) Classifying an analog voltage in a control system using binary classification of time segments determined by voltage level
JPH0764793A (ja) 多数決型クラスタリング装置
JPH03294983A (ja) 文字認識装置
JP2680419B2 (ja) 文字認識装置
CN115438979B (zh) 一种融合专家模型决策的数据风险识别方法及服务器
JPH03164886A (ja) 文字認識装置
Wilson et al. Testing for normality using neural networks
JPH1063632A (ja) 大規模ニューラルネットワーク構築方法及び大規模ニューラルネットワーク構築装置及びニューラルネットワーク装置
JPH04260987A (ja) 文字認識装置
Ai et al. Knowledge Distillation on Multiple Experts for Long-Tailed Recognition