JPH11224305A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH11224305A
JPH11224305A JP10024993A JP2499398A JPH11224305A JP H11224305 A JPH11224305 A JP H11224305A JP 10024993 A JP10024993 A JP 10024993A JP 2499398 A JP2499398 A JP 2499398A JP H11224305 A JPH11224305 A JP H11224305A
Authority
JP
Japan
Prior art keywords
character
recognition
display
determination
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10024993A
Other languages
English (en)
Inventor
Mikio Hasegawa
幹夫 長谷川
Hirohisa Goto
裕久 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10024993A priority Critical patent/JPH11224305A/ja
Publication of JPH11224305A publication Critical patent/JPH11224305A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 認識結果の効率的な確認作業が可能な文字認
識装置を提供する。 【解決手段】 メモリ20から1文字ずつ切り出された
文字パターンPTNは、異なる文字認識方法を用いる複
数の認識部40a〜40cに共通に与えられ、各認識部
40a〜40cの認識結果は、それぞれ判定部50に与
えられる。判定部50では、各認識部40a〜40cか
らの認識結果が多数決判定され、多数決で決定された文
字の文字コードと、判定根拠となった多数決割合とが、
表示部60に与えられる。表示部60では、もとの文字
パターンPTNから得られるイメージパターンと、判定
結果の文字と、多数決割合とが表示される。これによ
り、オペレータは多数決割合を参照して誤判定の率が高
い判定結果を重点的にチェックすることができ、効率的
な確認作業が可能になる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字イメージから
文字を認識してその認識結果を出力する文字認識装置に
関するものである。
【0002】
【従来の技術】文字認識装置は、文書や帳票等に記載さ
れた文字を読み取り、コンピュータ等で処理可能なデー
タに変換する装置である。このような文字認識装置で
は、例えば、スキャナを用いて光学的に文字イメージが
取得され、その文字イメージと予め作成されている文字
辞書とが照合されて文字が認識され、その認識結果がC
RT等の表示装置に表示されるようになっている。ま
た、オペレータは、表示装置に表示された認識結果を見
て確認し、誤りがある場合にはその認識結果を修正する
ような確認作業を行っている。そして、正しいと確認さ
れ、または修正された結果が最終的な認識結果として出
力されるようになっている。
【0003】文字認識装置では、例えば金額欄を読み取
る場合等に、特に高い文字認識精度が要求される。文字
認識精度を向上させる1つの方法として、例えば次のよ
うな文献に記載されるものがあった。 文献:電子情報通信学会技術研究報告、PRU92−3
3(1992−9)、松井俊弘他、「文字認識アルゴリ
ズムの複合化手法の検討」 上記文献では、複数の文字認識方法を用いて文字パター
ンを照合して認識し、それらの各認識方法で得られた複
数の認識結果に基づいて、例えば多数決等の方法で、1
文字毎に最終的な認識結果を判定して出力する方法が示
唆されている。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
文字認識方法では、次のような課題があった。複数の認
識方法による多数決で最終的な認識結果を判定しても、
最後にはオペレータによる確認作業が必要である。この
確認作業は、例えば、入力された文字パターンまたは入
力された帳票と、認識結果の文字とを目視によって比較
し、誤認識部分を捜し出して修正するという作業であ
る。多数決等の認識方法によって誤認識の確率が小さく
なると、オペレータにとっては確認作業を慎重に行わな
ければならず、極度に注意力を集中した作業を行うため
に確認に要する時間が長くなり、処理速度が低下してし
まうという課題があった。
【0005】本発明は、前記従来技術が持っていた課題
を解決し、確認作業に適した認識結果の表示を行うこと
により、認識結果の効率的な確認作業を行うことが可能
で、かつ精度の高い文字認識装置を提供するものであ
る。
【0006】
【課題を解決するための手段】前記課題を解決するため
に、本発明の内の第1の発明は、文字認識装置におい
て、文書画像から1文字毎に切り出された文字パターン
に対して文字認識を行う複数の文字認識手段と、前記複
数の文字認識手段の認識結果に基づいて該認識結果の確
からしさの値を求め、該確からしさの値に基づいて前記
文字パターンに該当する文字を判定する判定手段と、前
記判定手段で求められた確からしさの値に応じて表示形
態を変えて、前記判定結果を表示する判定手段とを備え
ている。第1の発明によれば、以上のように文字認識装
置を構成したので、次のような作用が行われる。文書画
像から切り出された文字パターンは、複数の文字認識手
段において文字認識され、その認識結果が判定手段に与
えられる。判定手段では、認識結果に基づいて確からし
さの値が求められ、これによって文字が判定される。判
定結果は表示手段に与えられ、確からしさの値に応じて
表示形態を変えて表示される。
【0007】第2の発明では、第1の発明における判定
手段を、前記複数の文字認識手段の認識結果の内で、同
一の認識結果が占める割合に基づいて前記確からしさの
値を算出するように構成している。第2の発明の判定手
段では、次のような作用が行われる。即ち、複数の文字
認識手段の多数決によって確からしさの値が算出され
る。第3の発明では、第1の発明における判定手段を、
前記複数の文字認識手段の認識結果の組み合わせ毎に前
記確からしさの値と前記判定結果とを予め定めた判定用
の情報を有し、該判定用の情報を参照して該複数の文字
認識手段の認識結果に基づいて前記文字パターンに該当
する文字を判定するように構成している。第3の発明の
判定手段では、次のような作用が行われる。即ち、予め
定められた判定用の情報が参照されて、確からしさの値
と判定結果が求められる。
【0008】第4の発明では、第1の発明における表示
手段を、前記判定手段の判定結果の表示とともに、該判
定結果に対比して該判定手段で求められた確からしさの
値を表示するように構成している。第4の発明の表示手
段では、次のような作用が行われる。即ち、判定結果と
確からしさの値が対比して表示される。第5の発明で
は、第1の発明における表示手段を、前記判定手段で求
められた確からしさの値に応じて、表示色、表示文字フ
ォント、表示輝度、表示文字寸法、表示修飾、或いは表
示の点滅頻度を変えて前記判定結果を表示するように構
成している。第5の発明の表示手段では、次のような作
用が行われる。即ち、確からしさの値に応じて、判定結
果の文字の色、形、輝度等の表示形態を変えて表示され
る。
【0009】
【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示す文字認識装置の
構成図である。この文字認識装置は、文書や帳票等に記
載された文字を画素に分解して光学的に読み取り、電気
信号に変換してイメージデータを生成するスキャナ10
を有している。スキャナ10には、生成されたイメージ
データを格納するためのメモリ20が接続されている。
メモリ20には、格納されたイメージデータの中から、
認識対象の文字を1文字毎に文字パターンPTNとして
切り出す切出部30が接続されている。
【0010】切出部30には、複数の文字認識手段(例
えば、認識部)40a,40b,40cの入力側が接続
されている。これらの認識部40a〜40cは、共通に
与えられた文字パターンPTNを、それぞれ異なる認識
アルゴリズム、或いは異なる文字辞書等を使用して、異
なる認識方法で文字認識をするようになっている。これ
らの認識部40a〜40cの出力側には、判定手段(例
えば、判定部)50が接続されている。判定部50は、
各認識部40a〜40cから与えられた認識結果の文字
コードを判定値計算部51に出力する。判定値計算部5
1は、同一文字コードの個数を計数し、入力された文字
コードに占める割合(多数決割合)をパーセント値で求
め、その多数決割合と文字コードとを判定部50に出力
するものである。判定部50では、判定値計算部51か
ら受け取った文字コードと多数決割合の値を用いて、最
大の多数決割合の値を持つ文字コードを判定結果と判定
し、その時の多数決割合の値を判定結果の「確からし
さ」として出力するものである。判定部50の出力側に
は、表示手段(例えば、表示部)60が接続されてい
る。
【0011】表示部60は、表示制御部61、フォント
部62、及び表示器63で構成されており、この表示制
御部61に判定部50の判定結果と切出部30からの文
字パターンPTNが与えられるようになっている。表示
制御部61には、フォント部62が接続されている。フ
ォント部62には、判定部50から与えられた判定結果
の文字コードに対応する文字を表示するためのフォント
が格納されている。そして、表示制御部61は、判定部
50から出力された判定結果の確からしさと予め定めた
閾値を比較してフォントを切り替えるようになってい
る。
【0012】図2は、図1中の表示器63による判定結
果の表示例を示す図である。以下、図2を参照しつつ、
図1の文字認識装置の動作を説明する。まず、オペレー
タが読み取り対象の文書や帳票等をスキャナ10に入力
すると、読み取られた文書や帳票等のイメージデータが
メモリ20に格納される。メモリ20に格納されたイメ
ージデータの中から、所定の位置に書かれた文字の文字
パターンPTNが、切出部30によって切り出され、認
識部40a〜40cと、表示部60とに与えられる。表
示部60に与えられた文字パターンPTNは、表示器6
3のパターン表示エリア63aに読み取られたままのイ
メージパターンで表示される。一方、認識部40aに与
えられた1番目の文字パターンPTN1は、この認識部
40aで、例えばパターンマッチング法による文字認識
が行われ、「2」と認識されて文字「2」の文字コード
が認識結果として出力される。また、文字イメージIM
G1は、それぞれ認識部40b,40cで文字認識が行
われ、同様に「2」と認識されたとする。これらの認識
部40a〜40cの認識結果は、判定部50に与えられ
る。
【0013】判定部50では、3個の認識部40a〜4
0cの認識結果を判定値計算部51に出力する。判定値
計算部51では、認識結果が一致しているので、判定結
果として文字「2」の文字コードと、その判定の根拠と
なった多数決割合(=100%)とを判定部50に出力
する。判定部50は、判定結果とその確からしさ(多数
決割合)を表示部60に出力する。表示部60では、与
えられた判定結果の文字コードと確からしさに基づい
て、フォント部62が参照され、表示器63の認識結果
エリア63bに、確からしさに応じて、例えば青色で文
字「2」が表示される。また、多数決割合(=100
%)が、表示器63の確からしさ表示エリア63cに表
示される。
【0014】次に、2番目の文字パターンPTN2が、
認識部40aで文字「6」と認識され、認識部40b,
40cで文字「5」と認識されたとすると、これらの認
識結果は同様に判定部50と判定値計算部51によって
文字「5」と判定され、文字「5」の文字コードと、そ
の多数決割合(=67%)とが表示部60に出力され
る。表示器63の認識結果エリア63bには、例えば黄
色で文字「5」が表示される。更に、確からしさ表示エ
リア63cには、判定の根拠となった多数決割合(=6
7%)が表示される。更に、3番目の文字パターンPT
N3が、認識部40aで文字「9」と認識され、認識部
40bで文字「7」、認識部40cで文字「2」と認識
されたとすると、これらの認識結果の多数決割合は同一
(=33%)であるので、判定部50では、所定の順番
に従って、例えば認識部40aにおける認識結果が判定
結果と見なされ、文字「9」の文字コードと多数決割合
(=33%)とが表示部60に出力される。表示器63
の認識結果エリア63bには、例えば赤色で文字「9」
が表示され、確からしさ表示エリア63cには、多数決
割合(=33%)が表示される。
【0015】以上のように、この第1の実施形態の文字
認識装置は、文字認識を行う複数の認識部40a〜40
cと、これらの認識部40a〜40cの認識結果に基づ
いて1つの文字を判定結果として出力する判定部50
と、判定結果を作成するために多数決割合を求める判定
値計算部51と、判定結果の文字とともに、その判定の
根拠となる多数決割合を同時に表示する表示部60を有
している。更に、判定結果の文字の色を多数決割合に応
じて変えて表示している。このため、オペレータは、判
定結果の色と同時に表示された多数決割合とによって誤
判定の可能性を知ることができ、多数決割合の低い文字
を重点的にチェックすることにより、確認作業の効率化
と処理速度の向上が可能になる。更に、確認漏れもなく
なり、精度の高い認識結果を得ることができる。
【0016】第2の実施形態 図3は、本発明の第2の実施形態を示す文字認識装置の
構成図であり、図1中の要素と共通の要素には共通の符
号が付されている。この文字認識装置では、図1の文字
認識装置の判定部50に代えて、これと機能の異なる判
定部50Aを設けた構成となっている。判定部50A
は、図1中の判定部50と同様に、複数の認識部40a
〜40cの文字コードとその確からしさとを判定結果と
し出力する機能を有している。また、判定部50Aに
は、認識部40a〜40cから与えられた文字コードの
組み合わせに基づいて、予め判定結果と確からしさの値
を定めた結果判定テーブル52が接続されている。その
他の構成は、図1と同様である。
【0017】図4は、図3中の結果判定テーブル部52
の内容の一例を示す図である。また、図5は、図3中の
表示器63による判定結果の表示例を示す図である。次
に、図4及び図5を参照しつつ、図3の文字認識装置の
動作を説明する。スキャナ10で読み取られたイメージ
データがメモリ20に格納され、このメモリ20から、
所定の位置に書かれた文字の文字パターンPTNが、切
出部30によって切り出され、認識部40a〜40c
と、表示部60とに与えられる。表示部60に与えられ
た文字パターンPTNは、表示器63のイメージ表示エ
リア63aに表示される。
【0018】また、1番目の文字パターンPTN1は認
識部40a〜40cに与えられ、これらの認識部40a
〜40cにおいて、すべて「2」と認識されると、文字
「2」の文字コードが認識結果として出力される。判定
部50Aでは、これらの認識結果に基づいて結果判定テ
ーブル52が参照される。図4に示すように、3個の認
識部40a〜40cの認識結果がすべて「2」であるの
で、判定結果として文字「2」の文字コードと、その確
からしさの値(=100)とが読み出され、表示部60
に出力される。表示部60では、与えられた判定結果の
文字コードに基づいてフォント62が参照され、図5に
示すように、表示器63に文字「2」と確からしさの値
とが表示される。2番目の文字パターンPTN2が、認
識部40aで文字「6」と認識され、認識部40b,4
0cで文字「5」と認識されたとすると、これらの認識
結果に基づいて結果判定テーブル52が参照され、文字
「5」の文字コードと、その確からしさの値(=70)
とが表示部60に出力される。
【0019】3番目の文字パターンPTN3が、認識部
40aで文字「7」と認識され、認識部40bで文字
「9」、認識部40cで文字「2」と認識されたとする
と、これらの認識結果に基づいて結果判定テーブル52
が参照され、文字「9」の文字コードと、その確からし
さの値(=30)とが表示部60に出力される。この場
合、確からしさの値が予め定めた閾値(この実施形態で
は50)より小さい時には、表示部60で使用する表示
文字フォントに斜体字を使用し、文字修飾として下線を
加える。即ち、図5において文字列の3文字目の「7」
に対する判定結果「9」は、斜体字に下線が加えられた
フォントを用いて表示される。以上のように、この第2
の実施形態の文字認識装置では、結果判定テーブル52
に格納された情報を参照して認識文字の判定を行う判定
部50Aを有している。従って、各認識部40a〜40
cの文字毎の認識性能の相違を考慮して結果判定テーブ
ル52を作成しておくことにより、第1の実施形態の利
点に加えて、更に誤りの少ない判定結果を得ることがで
きるという利点がある。
【0020】なお、本発明は、上記実施形態に限定され
ず、種々の変形が可能である。この変形例としては、例
えば、次の(a)〜(d)のようなものがある。 (a) 認識部40a〜40cの数は3個に限定され
ず、複数個であればよい。 (b) 認識部40a〜40cによる文字認識方法は、
例示したパターンマッチング法等に限定されず、どのよ
うな文字認識方法を行うものでも良い。また、認識部の
構成は、図1及び図3の構成に限定されず、その文字認
識方法に適した構成を適用することができる。 (c) 判定結果の確からしさの表示は、数値や色分け
に限定されず、文字の大きさや、表示位置、表示輝度、
表示文字フォントの字体、下線や網かけ表示等の表示修
飾、または表示の点滅速度の相違、或いはこれらの組み
合わせによって区分して表示することができる。 (d) 図1及び図3の文字認識装置は、読み取り対象
の帳票等を読み取るためのスキャナ10を有している
が、オンライン等の通信回線を介して文字イメージIM
Gを入力するようにしても良い。
【0021】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、文字認識を行う複数の文字認識手段と、それ
らの認識結果に基づいて該認識結果の確からしさに基づ
いて文字を判定する判定手段と、確からしさに応じて判
定結果の表示形態を変えて表示する前記表示手段とを有
している。これにより、認識結果の効率的な確認作業が
可能になり、かつ精度の高い認識処理が可能になる。第
2の発明によれば、判定手段において複数の認識結果を
多数決で判定して確からしさを算出するので、第1の発
明の効果に加えて、判定処理の単純化が可能になるとい
う効果がある。
【0022】第3の発明によれば、判定手段において、
予め定めた判定用の情報を参照して、複数の認識結果の
組み合わせに応じて文字を判定するので、各文字認識手
段の認識特性を判定基準に加味することができ、第1の
発明の効果に加えて、更に精度の高い認識処理が可能に
なるという効果がある。第4の発明によれば、表示手段
において、判定結果と確からしさとを対比して表示する
ので、第1の発明の効果に加えて、更に効率的な確認作
業が可能になるという効果がある。第5の発明によれ
ば、表示手段において、確からしさに応じて、判定結果
の表示形態を、表示色、表示文字フォント等を変えて表
示するので、第1の発明の効果に加えて、更に効率的な
確認作業が可能になるという効果がある。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示す文字認識装置の
構成図である。
【図2】図1中の表示器63による判定結果の表示例を
示す図である。
【図3】本発明の第2の実施形態を示す文字認識装置の
構成図である。
【図4】図3中の結果判定テーブル部52の内容の一例
を示す図である。
【図5】図3中の表示器63による判定結果の表示例を
示す図である。
【符号の説明】
10 スキャナ 20 メモリ 30 切出部 40a〜40c 認識部 50,50A 判定部 51 判定値計算部 52 結果判定テーブル 60 表示部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文書画像から1文字毎に切り出された文
    字パターンに対して文字認識を行う複数の文字認識手段
    と、 前記複数の文字認識手段の認識結果に基づいて該認識結
    果の確からしさの値を求め、該確からしさの値に基づい
    て前記文字パターンに該当する文字を判定する判定手段
    と、 前記判定手段で求められた確からしさの値に応じて表示
    形態を変えて、前記判定結果を表示する前記表示手段と
    を、 備えたことを特徴とする文字認識装置。
  2. 【請求項2】 前記判定手段は、前記複数の文字認識手
    段の認識結果の内で、同一の認識結果が占める割合に基
    づいて前記確からしさの値を算出することを特徴とする
    請求項1記載の文字認識装置。
  3. 【請求項3】 前記判定手段は、前記複数の文字認識手
    段の認識結果の組み合わせ毎に前記確からしさの値と前
    記判定結果とを予め定めた判定用の情報を有し、該判定
    用の情報を参照して該複数の文字認識手段の認識結果に
    基づいて前記文字パターンに該当する文字を判定するこ
    とを特徴とする請求項1記載の文字認識装置。
  4. 【請求項4】 前記表示手段は、前記判定手段の判定結
    果の表示とともに、該判定結果に対比して該判定手段で
    求められた確からしさの値を表示することを特徴とする
    請求項1記載の文字認識装置。
  5. 【請求項5】 前記表示手段は、前記判定手段で求めら
    れた確からしさの値に応じて、表示色、表示文字フォン
    ト、表示輝度、表示文字寸法、表示修飾、或いは表示の
    点滅頻度を変えて前記判定結果を表示することを特徴と
    する請求項1記載の文字認識装置。
JP10024993A 1998-02-06 1998-02-06 文字認識装置 Withdrawn JPH11224305A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10024993A JPH11224305A (ja) 1998-02-06 1998-02-06 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10024993A JPH11224305A (ja) 1998-02-06 1998-02-06 文字認識装置

Publications (1)

Publication Number Publication Date
JPH11224305A true JPH11224305A (ja) 1999-08-17

Family

ID=12153513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10024993A Withdrawn JPH11224305A (ja) 1998-02-06 1998-02-06 文字認識装置

Country Status (1)

Country Link
JP (1) JPH11224305A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711642B2 (en) 2000-05-31 2010-05-04 Fujitsu Limited Payment form discrimination method and apparatus
WO2013118672A1 (ja) * 2012-02-06 2013-08-15 オムロン株式会社 文字読取用のプログラムおよび文字読取装置ならびに文字読取方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711642B2 (en) 2000-05-31 2010-05-04 Fujitsu Limited Payment form discrimination method and apparatus
WO2013118672A1 (ja) * 2012-02-06 2013-08-15 オムロン株式会社 文字読取用のプログラムおよび文字読取装置ならびに文字読取方法
JP2013161277A (ja) * 2012-02-06 2013-08-19 Omron Corp 文字読取用のプログラムおよび文字読取装置

Similar Documents

Publication Publication Date Title
JPH11224305A (ja) 文字認識装置
JPH06348911A (ja) 英文字認識装置
JPH0277891A (ja) 文字認識装置
JP3270551B2 (ja) 文字認識装置および文字認識方法
US20240232522A1 (en) Document comparison system
JPH0850631A (ja) 文字認識装置
JP3111521B2 (ja) 認識文字修正方法
JPH0496882A (ja) 全角/半角判定方法
JP3466761B2 (ja) 文書処理装置及びその制御方法
JPH1069517A (ja) 文字認識装置
JP3111522B2 (ja) 認識文字修正方法
JP2001222679A (ja) 文字読取システム
JP3595081B2 (ja) 文字認識方法
JPH0773270A (ja) 光学式文字読取システム
JPH0652359A (ja) 文字認識方法
JPH0728957A (ja) 英文字認識装置
JPH11353414A (ja) 文字画像認識装置
JPH06282680A (ja) 文字認識処理装置
JPH09106434A (ja) Ocrの誤読修正方法
JPH04268986A (ja) 文字認識装置
JPH0758497B2 (ja) 文字認識装置
JPH06243294A (ja) 文字認識後処理装置
JP2000020638A (ja) 文字列方向判別方法
JPH0785213A (ja) 文字認識結果の表示方法
JPH06119483A (ja) 文字読み取り装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050510