JPH08167005A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH08167005A
JPH08167005A JP6311697A JP31169794A JPH08167005A JP H08167005 A JPH08167005 A JP H08167005A JP 6311697 A JP6311697 A JP 6311697A JP 31169794 A JP31169794 A JP 31169794A JP H08167005 A JPH08167005 A JP H08167005A
Authority
JP
Japan
Prior art keywords
character
recognition
character recognition
input
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6311697A
Other languages
English (en)
Inventor
Mitsugi Matsushita
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6311697A priority Critical patent/JPH08167005A/ja
Publication of JPH08167005A publication Critical patent/JPH08167005A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 様々な文字種に対して高精度の文字認識を行
なう。 【構成】 文字入力部11から入力された文字に対し
て、文字認識方法の異なる複数の文字認識部12,1
3,...,14が文字認識を行ない、認識候補と、そ
の確からしさの度合を表わす正規化された認識得点とを
出力する。結果出力部15は各文字認識手段の認識候補
の中で認識得点が最高のものを最終的な認識結果として
出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、一般的には文書や図面
の処理全般に係り、より具体的には、文字認識に関す
る。なお、本発明は原理的には、音声認識や画像認識な
どを含むパターン認識全般に応用可能である。
【0002】
【従来の技術】文字認識に関しては、従来より様々な手
法が考案されているが、そのいくつかについて、その概
要及び長短所について次に述べる。
【0003】一つは、本出願人による特開平3−108
079号の「線図形特徴抽出方法及び線図形認識方法」
である。この方法は、入力された文字の構造的特徴(各
ストロークの大局的な情報を記述する準位相構造)を抽
出し、この構造的特徴と辞書モデルとのマッチングを行
ない、一致したモデルに対して、構造的特徴の形状を表
わすパラメータ(準位相構造の構成成分(プリミティ
ブ,プリミティブ系列)の始点、終点、中心点、外接矩
形の寸法等の幾何学的特徴値)を用いて距離計算を行な
い、最も距離の小さいモデルを認識結果とする。
【0004】この方法は、数字や英字等の比較的画数が
少なく、文字の構造が単純な文字種に対する認識に多く
用いられ、優れた認識精度を得られる。また、この方法
の大きな特長は、構造的に一致しないモデルを認識対象
から外すので、他の文字認識方法に比べてリジェクト機
能が非常に優れ、誤認識も極めて少ないことである。
【0005】しかし、この方法の弱点は、画数が多く文
字の構造も複雑な漢字等の文字種に対する認識には必ず
しも適さないことである。そもそも、画数が多く構造が
複雑な文字種の場合、入力文字に潰れ、その他の変形が
生じやすく、構造的特徴を抽出すること自体が非常に難
しいからである。
【0006】よって、漢字のような画数が多く文字の構
造も複雑な文字種に対しては、文字の統計的特徴を利用
する認識方法が採用されることが多い。統計的特徴を用
いる文字認識方法として、例えば本出願人による特開昭
63−16394号の「文字認識方法」がある。この方
法は、入力された文字の多層方向ヒストグラムという統
計的特徴を抽出して辞書パターンとの距離を計算し、距
離が最も小さい辞書パターンを認識結果とするものであ
る。ここで多層方向ヒストグラムについて簡単に述べ
る。基本的には、文字パターンの文字線輪郭画素に方向
コードを付け、文字枠の各辺から対向する辺へ向かって
文字パターンを走査して白画素(背景)の次に出現した
方向コードを検出し、その方向コードを、それが走査線
上で何番目に検出されたかによって複数の層に層別し、
文字パターンを分割した複数のメッシュ領域のそれぞれ
毎に、ある層までの層別の方向コードのヒストグラムを
求める。このヒストグラムが多層方向ヒストグラムであ
る。そして、各メッシュ領域の多層方向ヒストグラムを
成分(特徴量)としたベクトルが、文字パターンの特徴
ベクトルとして用いられる。
【0007】このように様々な文字認識方法があるが、
それぞれ一長一短があり、あらゆる文字種(数字、英
字、漢字など)に強い文字認識方法は実現されていな
い。したがって、多くの文字種に対応するためには、異
なる複数種類の文字認識方法を組み合わせて用いること
が考えられる。
【0008】複数種類の文字認識方法を用いる例とし
て、特開昭61−60188号の「文字認識装置」があ
る。この装置では、入力された文字の文字種を分類して
から、分類された文字種に応じて、文字種別の異なった
認識手段の一つを選択して使用する。しかし、文字種の
分類を誤った場合に正しく認識できないという問題があ
る。因みに、様々な文字種の文字認識を行なう場合に
は、各文字種間に類似文字が存在することが多いため
(例えば、数字の「1」と英字の「l」(小文字のL)、
カタカナの「エ」と漢字の「工」など)、文字種を正確
に分類することは非常に困難であることが多い。
【0009】
【発明が解決しようとする課題】本発明は、以上の諸問
題点に鑑みてなされたもので、様々な文字種に対応する
ための新規な文字認識装置を提供することを目的する。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、本発明により提供される文字認識装置は以下に述べ
るような特徴を持つものである。請求項1記載の発明に
よる文字認識装置の特徴は、文字の入力手段と、複数の
文字認識手段と、結果出力手段とを有し、該複数の文字
認識手段によって、該入力手段により入力された文字に
対する文字認識処理を行ない認識候補とその確からしさ
の度合を表わす認識得点とを求め、該結果出力手段によ
って、該複数の文字認識手段により求められた認識候補
の中で最高の認識得点を持つものを認識結果として選択
することである。
【0011】請求項2記載の発明による文字認識装置の
特徴は、文字の入力手段と、文字認識処理を行なって候
補文字を求める、順序付けられた複数の文字認識手段と
を有し、該入力手段により入力された文字に対する文字
認識処理を、該複数の文字認識手段より順序に従い選ば
れた文字認識手段によって順に行ない、最初の認識候補
が該複数の文字認識手段中の任意の文字認識手段により
得られた時点で該入力された文字に対する文字認識処理
を終了することである。
【0012】請求項3記載の発明による文字認識装置の
特徴は、文字の入力手段と、文字認識処理を行なって認
識候補とその確からしさの度合を表わす認識得点とを得
る、順序付けられた複数の文字認識手段とを有し、該入
力手段により入力された文字に対する文字認識処理を、
該複数の文字認識手段より順序に従い選ばれた文字認識
手段によって順に行ない、所定の最低得点より良好な認
識得点を持つ最初の認識候補が該複数の文字認識手段中
の任意の文字認識手段により得られた時点で該入力され
た文字に対する文字認識処理を終了することである。
【0013】請求項4記載の発明による文字認識装置の
特徴は、文字の入力手段と、文字認識処理を行なって認
識候補を求める複数の文字認識手段と、類似文字の検出
手段とを有し、該入力手段により入力された文字に対す
る文字認識処理を該複数の文字認識手段中の第1の文字
認識手段により行ない、得られた認識候補に類似した他
の文字種の文字が存在するか該類似文字検出手段によっ
て調べ、他の文字種に類似文字が存在する場合には、該
複数の文字認識手段中の該第1の文字認識手段以外の一
つ以上の文字認識手段により該入力された文字に対する
文字認識処理を行なうことである。
【0014】請求項5記載の発明による文字認識装置の
特徴は、文字の入力手段と、文字種の識別手段と、文字
認識処理を行なって認識候補とその確からしさの度合を
表わす認識得点とを求める複数の文字認識手段とを有
し、該入力手段により入力された文字の文字種を該文字
種識別手段によって識別し、識別された文字種に対応し
た該複数の文字認識手段中の一つの文字認識手段により
該入力された文字に対する文字認識処理を行なって、予
め決められた最低点より良好な認識得点を持つ認識候補
が得られない場合に、該複数の文字認識手段中の他の文
字認識手段により該入力された文字に対する文字認識処
理を行なうことである。
【0015】
【作用】請求項1記載の発明によれば、複数の文字認識
手段の文字認識方法を異ならせることにより、入力文字
に対して異なった複数の文字認識方法による認識候補が
得られ、その中の認識得点が最高の候補を認識結果とす
ることができる。前述のように、文字認識方法によって
得意とする文字種に相違があるが、通常、入力文字の文
字種に強い文字認識方法を用いた文字認識手段による認
識候補が最も高い認識得点を持つ。したがって、実質的
に、複数の文字認識方法の中から入力文字の文字種に強
い文字認識方法が自動的に選ばれて適用されたと同様と
なるので、様々な文字種に対して精度のよい文字認識が
可能となる。
【0016】請求項2または3記載の発明によれば、最
初の文字認識手段により文字認識が行なわれ、リジェク
トされなければ、または認識得点の良好な認識候補が得
られたならば、処理を終わり、そうでなければ、次の順
番の文字認識手段により文字認識を行なわせ、というよ
うに、信頼できる認識候補が得られるまで複数の文字認
識手段により所定の順序で順に文字認識認識が行なわれ
る。したがって、複数の文字認識手段の文字認識方法を
異ならせることにより、信頼できる認識候補が得られる
まで異なった複数の文字認識方法を順次に適用すること
ができるため、請求項1記載の発明と同様に様々な文字
種に対して高精度の文字認識が可能である。しかも、信
頼できる認識候補がある文字認識手段によって得られた
段階で、それ以降の文字認識手段による処理は打ち切ら
れるため、請求項1記載の発明に比べ、全体的な処理時
間を短縮できる。
【0017】請求項4記載の発明によれば、一つの文字
認識手段による認識候補に類似文字がある場合に、当該
類似文字の文字種を得意とする文字認識手段によって認
識候補を求めさせることができる。したがって、文字認
識手段の文字認識方法を異ならせることによって、様々
な文字種に関し、類似文字のある文字に対する認識精度
を向上させることができる。また、最初の文字認識手段
により得られた認識候補に類似文字がない場合は、その
段階で処理を終わるため、また、類似文字があった場合
にも、当該類似文字の文字種に対応した文字認識手段に
よってのみ処理が続けられるだけであるため、複数の文
字認識手段の全部を無条件に用いて処理する構成に比
べ、全体の処理時間を短縮できる。
【0018】請求項5記載の発明によれば、文字種識別
手段によって入力文字の文字種を識別し、その文字種に
強い文字認識方法を用いた一つの文字認識手段により文
字認識を行なわせ、得られた認識候補の認識得点が悪い
場合に限って、他の文字認識手段によって認識候補を求
めさせることができる。最初の文字認識手段による文字
認識によって十分な認識得点を持つ認識候補が得られる
可能性が高いので、その時点で処理を終了できることが
多く、したがって、全体的な処理時間を短縮できる。ま
た、前記特開昭61−60188号の装置では、一つの
認識手段で認識ができなかった時は、そこで処理が終了
してしまうので、文字種の識別を間違うと妥当な認識結
果を得られない危険がある。これに対して、請求項5記
載の発明によれば、認識得点が良好でない場合には他の
文字認識手段(方法)によっても認識処理を行なうた
め、文字種識別が失敗した場合にも高精度の認識が可能
となる。
【0019】なお、上記各請求項記載の発明において、
認識精度を一層向上させるために、一つまたは複数の文
字認識手段により得られた認識候補に基づいて最終的な
認識結果を決定する際に、文字に関する知識(例えば単
語、文字種、文書中の文字列の属性などの知識)に関す
る情報を導入してもよいことは、後記実施例に関連して
述べるとおりである。
【0020】
【実施例】以下、図面を用いて、本発明のいくつかの実
施例を詳細に説明する。 <実施例1>図1は本実施例の文字認識装置の簡略化し
たブロック図である。この文字認識装置は、文字入力部
11と、N個の文字認識部(第1文字認識部12,第2
文字認識部13,...,第N文字認識部14)、結果
出力部15、それら各部の動作を制御する制御部16か
ら構成されている。
【0021】文字入力部11は、スキャナー等の画像入
力装置より文字を画像データとして取り込む部分であ
る。各文字認識部(12,13,...,14)は、文
字入力部11によって入力された文字の画像データの文
字認識を行なう部分であり、それぞれで採用される文字
認識の方法が異なっている。例えば、第1文字認識部1
2では前記特開平3−108079号の構造的特徴を利
用する文字認識方法が用いられ、第2文字認識部13で
は前記特開昭63−16394号の多層方向ヒストグラ
ムと呼ばれる統計的特徴を利用する文字認識方法が採用
される、等々である。
【0022】各文字認識部(12,13,...,1
4)の認識対象文字は、完全に異なっていても、一部異
なっていても、完全に一致していてもよい。文字認識部
の個数は一般化してN個となっているが、その個数は2
個以上であれば任意である。
【0023】各文字認識部(12,13,...,1
4)は、それぞれの認識方法により得られた認識候補と
ともに、その確からしさの度合を表わす認識得点を出力
する。この認識得点としては、例えば入力文字と辞書と
の距離の逆数を用いることができる。複数の文字認識部
による認識得点を共通に扱うことができるようにするた
め、各文字認識部による認識得点は、その分布と分散が
同じになるように正規化される。
【0024】結果出力部15は、各文字認識部(12,
13,...,14)による認識候補とその認識得点
(正規化されたもの)とを入力し、認識得点が最高の認
識候補を文字認識結果として選び、それを外部に出力す
る。ただし、いずれの文字認識部でも認識候補が得られ
なかった場合には、結果出力部15はリジェクトを出力
する。
【0025】図2は、本実施例の文字認識装置の概略処
理フローを示している。ステップ101で文字入力部1
1によって1文字が入力される。ステップ102,10
3,104,105のループで第1文字認識部12,第
2文字認識部13,...,第N文字認識部14により
順に入力文字の認識が行なわれる。そして、ステップ1
06で結果出力部15より最終的な文字認識結果が出力
される。このような処理フローの制御は制御部16によ
って行なわれる。
【0026】<実施例2>図3は本実施例の文字認識装
置の簡略化したブロック図であり、図4はその概略処理
フローを示すフローチャートである。この文字認識装置
は、文字入力部31と、N個の文字認識部(第1文字認
識部32,第2文字認識部33,...,第N文字認識
部34)、結果出力部35、それら各部の動作を制御す
る制御部36から構成されている。
【0027】文字入力部31はスキャナー等の画像入力
装置によって文字を画像データとして入力するものであ
る。各文字認識部(32,33,...,34)は、そ
れぞれ異なった文字認識方法を用いて、文字入力部31
によって入力された文字の認識をするものであり、例え
ば前記実施例1の各文字認識部(12,13,...,
14)と同様でよいが、認識得点を出力する必要はな
い。なお、本実施例にあっては、第1文字認識部32に
おける文字認識方法として、誤認識が少なく、かつリジ
ェクト率の高い文字認識方法、例えば前記特開平3−1
08079号の構造的特徴を利用する文字認識方法を採
用するのが好ましい。
【0028】図4に示したフローチャートに沿って、さ
らに説明する。文字入力部31によって文字の画像デー
タが入力され(ステップ111)、つづいて、第1文字
認識部32による文字認識が行なわれる(ステップ11
2,113)。第1文字認識部32により認識候補が得
られたならば(その認識結果がリジェクトでないなら
ば)、処理の流れはステップ114からステップ117
へ進み、残りの文字認識部による文字認識は行なわれ
ず、第1文字認識部32の認識候補がそのまま最終的な
認識結果として結果出力部35より出力され、処理を終
了する。
【0029】第1文字認識部32による認識結果がリジ
ェクトであったときは、処理の流れはステップ113に
戻り、第2文字認識部33による入力文字の認識処理が
行なわれる。認識候補が得られたならば、処理の流れは
ステップ114からステップ117へ進み、その認識候
補が最終的な文字認識結果として出力されることになる
が、リジェクトのときには処理の流れはステップ113
へ戻り、次の文字認識部による文字認識が行なわれる。
【0030】このように、認識候補が得られるまで、複
数の文字認識部が前段のものから順に文字認識処理を実
行していく(ステップ113〜ステップ116のルー
プ)。このループを抜けるのは、最後段の第N文字認識
部34による文字認識処理が終わった場合か、それより
前の文字認識部で認識候補が得られた場合である。第N
文字認識部34による文字認識処理まで進んだ場合、そ
の結果がそのまま最終的な認識結果となる。つまり、認
識候補が得られたときは、それが最終的な文字認識結果
として出力され、リジェクトとなったときには最終的な
結果としてリジェクトが出力される。以上の処理フロー
の制御は制御部36によって行なわれる。
【0031】<実施例3>図5は本実施例の文字認識装
置の簡略化したブロック図であり、図6はその概略処理
フローを示すフローチャートである。この文字認識装置
は、文字入力部41と、N個の文字認識部(第1文字認
識部42,第2文字認識部43,...,第N文字認識
部44)、結果出力部45、それら各部の動作を制御す
る制御部46から構成されている。
【0032】文字入力部41は、スキャナー等の画像入
力装置より文字を画像データとして入力する部分であ
る。各文字認識部(42,43,...,44)は、そ
れぞれ異なった文字認識方法を用いて、入力された文字
の認識をするものであり、例えば前記実施例1の各文字
認識部(12,13,...,14)と同様でよい。各
文字認識部は前記実施例1の場合と同様、認識候補とと
もに正規化された認識得点を出力する。
【0033】図6に示したフローチャートに沿って、さ
らに説明する。文字入力部41によって文字の画像デー
タが入力され(ステップ111)、つづいて、第1文字
認識部42による文字認識が行なわれる(ステップ12
1,123)。第1文字認識部42により得られた認識
候補の認識得点が、予め決められた最低得点より良好で
あれば、処理の流れはステップ124からステップ12
7へ進み、残りの文字認識部による文字認識は行なわれ
ず、第1文字認識部42の認識候補がそのまま最終的な
認識結果として結果出力部45より出力され、処理を終
了する。
【0034】第1文字認識部42による認識結果の認識
得点が、予め決められた最低得点より悪いとき(リジェ
クトのときも同様)、処理の流れはステップ123に戻
り、第2文字認識部43による入力文字の認識処理が行
なわれる。その認識候補の認識得点が予め決められた最
低得点より良好ならば、処理の流れはステップ124か
らステップ127へ進み、それまでに得られた認識候補
の中で最も認識得点の良好なものが最終的な文字認識結
果として出力されることになるが、認識得点が最低得点
より悪いとき(またはリジェクトのとき)には、処理の
流れはステップ123へ戻り、次の文字認識部による文
字認識が行なわれる。
【0035】このように、最低得点より良好な認識得点
の認識候補が得られるまで、複数の文字認識部が前段の
ものから順に文字認識処理を実行していく(ステップ1
23〜ステップ126のループ)。このループを抜ける
のは、最後段の第N文字認識部44による文字認識処理
が終わった場合か、それより前の文字認識部で認識得点
の良好な認識候補が得られた場合である。そして、それ
までに得られた認識候補中の最高の認識得点を持つもの
が最終的な認識結果として出力される。なお、認識候補
が得られなかった場合には、最終的な結果としてリジェ
クトが出力される。以上の処理フローの制御は制御部3
6によって行なわれる。
【0036】<実施例4>図7は本実施例の文字認識装
置の簡略化したブロック図であり、図8はその概略処理
フローを示すフローチャートである。この文字認識装置
は、文字入力部51、N個の文字認識部(第1文字認識
部52,第2文字認識部53,...,第N文字認識部
54)、結果出力部55、類似文字検出部56、それら
各部の動作を制御する制御部57から構成されている。
【0037】文字入力部51は、スキャナー等の画像入
力装置より文字を画像データとして入力する部分であ
る。各文字認識部(52,53,...,54)は、そ
れぞれ異なった文字認識方法を用いて、入力された文字
の認識をするものであり、例えば前記実施例1の各文字
認識部(12,13,...,14)と同様でよい。各
文字認識部は前記実施例1の場合と同様、認識候補とと
もに正規化された認識得点を出力する。類似文字検出部
56は、第1文字認識部52から出力された認識候補に
対する類似文字が他の文字種に存在するか調べるもの
で、予め各文字種間の類似文字をテーブル等として保有
している。
【0038】図8に示したフローチャートに沿って、さ
らに説明する。文字入力部51によって文字の画像デー
タが入力され(ステップ131)、つづいて、第1文字
認識部52による文字認識が行なわれる(ステップ13
2)。類似文字検出部56は、第1文字認識部52によ
り得られた認識候補について他の文字種に類似文字が存
在するか調べる(ステップ133)。そして、類似文字
が存在すると判断された場合には、処理はステップ13
4へ進み、当該類似文字の文字種を認識対象文字種とし
た他の一つまたは二つ以上の文字認識部(5
3,...,54)による文字認識が行なわれ、それか
らステップ135の処理に進む。
【0039】例えば、第1文字認識部52がカタカナを
認識対象文字種としているものである場合に、認識候補
として「エ」(カタカナ)が得られたとするとすると、
その類似文字として漢字の「工」が存在すると類似文字
検出部56で判断されるることになろう。この例では、
漢字を認識対象文字種とする文字認識部(例えば第2文
字認識部23)により、入力文字の認識が行なわれる。
【0040】第1文字認識部52による認識候補に対す
る類似文字が存在しないと判断された場合は、ステップ
133よりステップ135に進む。なお、図8には示さ
れていないが、第1認識処理部52の認識でリジェクト
となった場合、他の文字認識部53,...,54の全
部の文字認識を行なう。
【0041】ステップ135において、結果出力部55
は、それまでに一つまたは二つ以上の文字認識部(5
2,53,...,54)によって得られた認識候補中
で認識得点が最も高いものを最終的に認識結果として選
び出力する。なお、認識候補が一つも得られなかった場
合にはリジェクトが出力される。
【0042】<実施例5>図9は本実施例の文字認識装
置の簡略化したブロック図であり、図10はその概略処
理フローを示すフローチャートである。この文字認識装
置は、文字入力部61、N個の文字認識部(第1文字認
識部62,第2文字認識部63,...,第N文字認識
部64)、結果出力部65、文字種識別部67、それら
各部の動作を制御する制御部68から構成されている。
【0043】文字入力部61は、スキャナー等の画像入
力装置より文字を画像データとして入力する部分であ
る。文字種識別部67は、文字入力部61により入力さ
れた文字の文字種を識別するものである。文字種の識別
は様々な手法によることが可能であるが、例えば、入力
文字のストローク数を抽出して、ストローク数が少なけ
れば数字や英字である可能性が高いので、文字種を英数
字と判定し、逆にストローク数が多ければ文字種を漢字
と判定するような簡易なものでも構わない。
【0044】各文字認識部(52,53,...,5
4)は、それぞれ異なった文字認識方法を用いて、入力
された文字の認識をするものであり、例えば前記実施例
1の各文字認識部(12,13,...,14)と同様
でよく、前記実施例1の場合と同様、認識候補とともに
正規化された認識得点を出力する。
【0045】図10に示したフローチャートに沿って、
さらに説明する。文字入力部61によって文字の画像デ
ータが入力され(ステップ141)、文字種識別部67
によって、入力文字の文字種を識別する(ステップ14
2)。そして、識別された文字種を認識対象とした文字
認識部(図9においては第1文字認識部62となってい
るが、これは便宜のためであり、文字認識部62,6
3,...,64中の該当文字種のものが選ばれる)に
よって行なわれ(ステップ143)、その結果について
判定が行なわれる(ステップ144)。
【0046】ステップ143の第1認識処理で認識候補
が得られ、かつ、その認識得点が予め決められた最低点
より良好であれば、処理はステップ146へ進む。しか
し、リジェクトとなったか、あるいは認識候補が得られ
たが、その認識得点が予め決められた最低点より悪い場
合には、ステップ145に進み、他の文字認識部により
入力文字に対する文字認識処理が行なわれた後、ステッ
プ146へ進む。
【0047】ステップ146において、結果出力部65
は、それまでに得られた認識候補中の認識得点が最も良
好なものを最終的な認識結果として選び、それを外部に
出力する。なお、認識候補が一つも得られなかった場合
は、最終的認識結果としてリジェクトが出力される。
【0048】<実施例6>図11は本実施例の文字認識
装置の簡略化したブロック図であり、図12はその概略
処理フローを示すフローチャートである。この文字認識
装置は、文字入力部71、N個の文字認識部(第1文字
認識部72,第2文字認識部73,...,第N文字認
識部74)、結果出力部75、文字知識処理部78、そ
れら各部の動作を制御する制御部79から構成されてい
る。
【0049】文字入力部71は、スキャナー等の画像入
力装置より文字を画像データとして入力する部分であ
る。各文字認識部(72,73,...,74)は、そ
れぞれ異なった文字認識方法を用いて、入力された文字
の認識をするものであり、例えば前記実施例1の各文字
認識部(12,13,...,14)と同様でよく、前
記実施例1の場合と同様、認識候補とともに正規化され
た認識得点を出力する。結果出力部75は、各文字認識
部によって得られた認識候補、それぞれの認識得点、及
び文字知識処理部78からの情報をもとに、最終的な認
識結果を決定して出力するものである。つまり、本文字
認識装置は、前記実施例1の文字認識装置に文字知識処
理部78を追加した如き構成である。
【0050】図12に示したフローチャートに沿って、
さらに説明する。文字入力部71によって文字の画像デ
ータが入力され(ステップ151)、この入力文字に対
して各文字認識部(72,73,...,74)により
文字認識が行なわれ、認識候補と認識得点とが得られる
(ステップ152,153,154,155)。この文
字認識処理が終わると、文字知識処理部78による文字
知識処理が行なわれる(ステップ156)。
【0051】文字知識処理部78は、注目している入力
文字及びその前後の入力文字と、予め記憶している文字
に関する知識情報を基に、注目している入力文字の認識
候補の確からしさ(確度)を出力するものである。例え
ば、「注目している入力文字の前後の入力文字が両方と
もカタカナであるときは、注目している入力文字もカタ
カナである可能性が高い」とする。あるいは、入力され
る文字列が住所であることが分かっている場合に、「注
目している入力文字と前後の入力文字に対する認識候補
が”東亨都”となったときに、”東京都”である確率が
高い、つまり注目している入力文字が”京”である確率
が高い」とする。
【0052】このような文字知識処理が終わると、ステ
ップ157に進み、結果出力部75は、各文字認識部の
認識候補と、文字知識処理部78より出力された確度に
基づいて、最終的な認識結果を出力する。上に示した”
東京都”の例で、真ん中の文字に対して”京”と”亨”
が認識候補となった場合には、仮に”亨”の認識得点の
ほうが”京”の認識得点より高くとも、文字知識処理部
78からの情報に従って”京”を選んで出力する。この
ように個々の文字の特徴による文字認識の結果に加え
て、文字に関する知識を利用すれば、より高い認識精度
を得られる。
【0053】なお、前記実施例2乃至前記実施例5にお
いても、本実施例の文字知識処理部78と同様のものを
付加し、最終的な認識結果の決定に文字知識を利用する
ようにしてよいことは当然である。
【0054】
【発明の効果】以上、詳細に述べたように、本発明によ
れば次のような効果を得られる。請求項1記載の発明に
よれば、複数の文字認識手段の文字認識方法を異ならせ
ることにより、様々な文字種に対して精度のよい文字認
識が可能となる。請求項2または3記載の発明によれ
ば、複数の文字認識手段の文字認識方法を異ならせるこ
とにより、請求項1記載の発明と同様に様々な文字種に
対して高精度の文字認識が可能であるとともに、請求項
1記載の発明に比べ、全体的な処理時間を短縮できる。
請求項4記載の発明によれば、複数の文字認識手段の文
字認識方法を異ならせることによって、様々な文字種に
関し、類似文字のある文字に対する認識精度を向上させ
ることができるとともに、請求項1記載の発明に比べ、
全体の処理時間を短縮できる。請求項5記載の発明によ
れば、様々な文字種に対して高精度の文字認識が可能で
あり、また、文字認識が失敗した場合にも高精度の認識
が可能である。また、請求項1記載の発明に比べ全体的
な処理時間を短縮できる。
【図面の簡単な説明】
【図1】実施例1の文字認識装置の簡略化したブロック
図である。
【図2】実施例1の処理概要を示すフローチャートであ
る。
【図3】実施例2の文字認識装置の簡略化したブロック
図である。
【図4】実施例2の処理概要を示すフローチャートであ
る。
【図5】実施例3の文字認識装置の簡略化したブロック
図である。
【図6】実施例3の処理概要を示すフローチャートであ
る。
【図7】実施例4の文字認識装置の簡略化したブロック
図である。
【図8】実施例4の処理概要を示すフローチャートであ
る。
【図9】実施例5の文字認識装置の簡略化したブロック
図である。
【図10】実施例5の処理概要を示すフローチャートで
ある。
【図11】実施例6の文字認識装置の簡略化したブロッ
ク図である。
【図12】実施例6の処理概要を示すフローチャートで
ある。
【符号の説明】
11,31,41,51,61,71 文字入力部 12,32,42,52,62,72 第1文字認識部 13,33,43,53,63,73 第2文字認識部 14,34,44,54,64,74 第N文字認識部 15,35,45,55,65,75 結果出力部 16,36,46,57,68,79 制御部 56 類似文字検出部 67 文字種識別部 78 文字知識処理部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字の入力手段と、複数の文字認識手段
    と、結果出力手段とを有し、該複数の文字認識手段によ
    って、該入力手段により入力された文字に対する文字認
    識処理を行ない認識候補とその確からしさの度合を表わ
    す認識得点とを求め、該結果出力手段によって、該複数
    の文字認識手段により求められた認識候補の中で最高の
    認識得点を持つものを認識結果として選択する文字認識
    装置。
  2. 【請求項2】 文字の入力手段と、文字認識処理を行な
    って候補文字を求める、順序付けられた複数の文字認識
    手段とを有し、該入力手段により入力された文字に対す
    る文字認識処理を、該複数の文字認識手段より順序に従
    い選ばれた文字認識手段によって順に行ない、最初の認
    識候補が該複数の文字認識手段中の任意の文字認識手段
    により得られた時点で該入力された文字に対する文字認
    識処理を終了する文字認識装置。
  3. 【請求項3】 文字の入力手段と、文字認識処理を行な
    って認識候補とその確からしさの度合を表わす認識得点
    とを得る、順序付けられた複数の文字認識手段とを有
    し、該入力手段により入力された文字に対する文字認識
    処理を、該複数の文字認識手段より順序に従い選ばれた
    文字認識手段によって順に行ない、所定の最低得点より
    良好な認識得点を持つ最初の認識候補が該複数の文字認
    識手段中の任意の文字認識手段により得られた時点で該
    入力された文字に対する文字認識処理を終了する文字認
    識装置。
  4. 【請求項4】 文字の入力手段と、文字認識処理を行な
    って認識候補を求める複数の文字認識手段と、類似文字
    の検出手段とを有し、該入力手段により入力された文字
    に対する文字認識処理を該複数の文字認識手段中の第1
    の文字認識手段により行ない、得られた認識候補に類似
    した他の文字種の文字が存在するか該類似文字検出手段
    によって調べ、他の文字種に類似文字が存在する場合に
    は、該複数の文字認識手段中の該第1の文字認識手段以
    外の一つ以上の文字認識手段により該入力された文字に
    対する文字認識処理を行なう文字認識装置。
  5. 【請求項5】 文字の入力手段と、文字種の識別手段
    と、文字認識処理を行なって認識候補とその確からしさ
    の度合を表わす認識得点とを求める複数の文字認識手段
    とを有し、該入力手段により入力された文字の文字種を
    該文字種識別手段によって識別し、識別された文字種に
    対応した該複数の文字認識手段中の一つの文字認識手段
    により該入力された文字に対する文字認識処理を行なっ
    て、予め決められた最低点より良好な認識得点を持つ認
    識候補が得られない場合に、該複数の文字認識手段中の
    他の文字認識手段により該入力された文字に対する文字
    認識処理を行なう文字認識装置。
JP6311697A 1994-12-15 1994-12-15 文字認識装置 Pending JPH08167005A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6311697A JPH08167005A (ja) 1994-12-15 1994-12-15 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6311697A JPH08167005A (ja) 1994-12-15 1994-12-15 文字認識装置

Publications (1)

Publication Number Publication Date
JPH08167005A true JPH08167005A (ja) 1996-06-25

Family

ID=18020384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6311697A Pending JPH08167005A (ja) 1994-12-15 1994-12-15 文字認識装置

Country Status (1)

Country Link
JP (1) JPH08167005A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004046315A (ja) * 2002-07-09 2004-02-12 Canon Inc 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JP2018156598A (ja) * 2017-03-21 2018-10-04 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004046315A (ja) * 2002-07-09 2004-02-12 Canon Inc 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JP2018156598A (ja) * 2017-03-21 2018-10-04 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
CN112036383B (zh) 一种基于手静脉的身份识别方法及装置
JP2001175811A (ja) 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
JPH08167005A (ja) 文字認識装置
JP2000348141A (ja) 入力情報の予測方法と装置、ならびにプログラム記憶媒体
RU2251736C2 (ru) Способ идентификации зачеркнутых символов при распознавании рукописного текста
JPH08263655A (ja) パターン認識方法
JP2671985B2 (ja) 情報認識方法
JPH07319880A (ja) キーワード抽出・検索装置
KR100332752B1 (ko) 문자인식방법
JP3071745B2 (ja) 文字認識結果の後処理方法
KR940007933B1 (ko) 사용자 독립형 온라인 한글문자 인식방법
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JPH06295356A (ja) オンライン文字認識装置
JPH0290384A (ja) 文字認識装置の後処理方式
JP3476872B2 (ja) 文字認識装置
JPH06195508A (ja) 文字切り出し方法
JP2000099631A (ja) パターン認識装置及びパターン認識方法
JP2923295B2 (ja) パターン同定処理方式
JPH07141471A (ja) 文字認識方法
JPH07239913A (ja) 文字認識装置
JPH08272909A (ja) 文字認識方法および文字認識装置
JPH0318987A (ja) 辞書登録方法
JP2002149641A (ja) 手書文字認識装置、及び手書文字認識プログラムを記録した記録媒体
JPS63178380A (ja) 文字列認識装置
JPH0883318A (ja) 変曲点抽出方法、辞書の大分類方法、文字認識方法及び文字認識装置