JPH0757049A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0757049A
JPH0757049A JP5223834A JP22383493A JPH0757049A JP H0757049 A JPH0757049 A JP H0757049A JP 5223834 A JP5223834 A JP 5223834A JP 22383493 A JP22383493 A JP 22383493A JP H0757049 A JPH0757049 A JP H0757049A
Authority
JP
Japan
Prior art keywords
area
character recognition
certainty
reading
reading order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5223834A
Other languages
English (en)
Inventor
Keiji Kojima
啓嗣 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP5223834A priority Critical patent/JPH0757049A/ja
Publication of JPH0757049A publication Critical patent/JPH0757049A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 認識結果の確認と修正を容易に行うことが可
能な文字認識装置を提供する。 【構成】 中央演算処理装置22は、画像メモリ12に
格納された画像情報から、文字領域、表領域、写真領域
の各領域を判断すると共に、読み取る順番を決定する。
そして、各領域や読取順番を決定する際に使用した数値
や、その数値を閾値処理したランク等の各種情報から、
領域および読取順番の各々について、その確信度を判断
する。判断した確信度に応じて、図2に示すように、領
域枠57や読取順表示矢印56の色、または輝度等を変
化させて表示する。ユーザは入力装置16のマウスまた
はキーボード等によって誤認識箇所の修正を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置に係り、詳
細には、光学的文字読取装置(OCR)によって読み取
る文字、図形等の読取領域および読取順番を判断する文
字認識装置に関する。
【0002】
【従来の技術】記録された文字や図形を光学的に読み取
り、認識するOCRが広く開発されている。従来のOC
Rでは、ユーザが認識したい範囲をマウスなどのポイン
タを利用して指定していたのに対して、最近のOCRで
は、文書画像をテキストに変換する作業をバッチ的に行
い、また、範囲を指定を省略するために、これらの処置
を自動化する技術が盛んに開発されている。これらの処
理を自動化するために、光学的に読み取った文書画像か
ら、どこが文字領域なのか、どこが表領域なのか、どこ
が写真・図領域なのかを識別すると共に、識別した領域
がどのような順番でOCRによって認識されるべきかを
判断するようにしている。例えば、特開平2−1878
83号公報に記載された技術では、文書画像から自動的
に領域を検出し、検出された領域をどのような順番で読
み取るべきか判断し、検出された領域とその読み取りの
順番を表示するようにしている。
【0003】
【発明が解決しようとする課題】しかし、文書画像から
自動的に領域を検出し、検出された領域をどのような順
番で読み取るべきか判断する技術において、OCRと同
様に全ての文書画像に対して100%正解するのは難し
く、誤認識する場合がある。この場合、ユーザは、正し
く領域が検出されているか、正しく読み取りの順番が決
められているかなど結果を確認する必要がある。また、
認識結果を単に表示するだけでは、ユーザは全ての表示
について逐一確認する必要があり、具体的にどこが間違
っているのを発見するのに時間がかかっていた。
【0004】そこで、本発明は、認識結果の確認と修正
を容易に行うことが可能な文字認識装置を提供すること
を目的とする。
【0005】
【課題を解決するための手段】請求項1記載の発明で
は、文書画像から自動的に領域を判断する領域判断手段
と、この領域検出手段で検出された領域をどのような順
番で読み取るべきかを判断する読取順番判断手段と、前
記領域判断手段で判断された領域と、前記読取順番判断
手段で判断された読取順番を修正する修正手段と、前記
読取領域判断手段および読取順番判断手段で判断された
領域および読取順番の確からしさを判断する確信度判断
手段と、この確信度判断手段で判断された確からしさに
応じて読取領域および読取順番を表示する表示手段とを
文字認識装置に具備させて前記目的を達成する。請求項
2記載の発明では、請求項1記載の文字認識装置におけ
る表示手段が、確信度判断手段で判断された確からしさ
に応じて、色および輝度の少なくとも一方を変えて表示
する。請求項3記載の発明では、請求項1記載の文字認
識装置における表示手段が、確信度判断手段で判断され
た確からしさに応じて、領域の範囲を示す枠の形状およ
び読み取りの順番を表わす形状の少なくとも一方を変え
て表示する。請求項4記載の発明では、請求項1から請
求項3記載の文字認識装置における表示手段が、確から
しさを同時に表示する。請求項5記載の発明では、請求
項1から請求項4記載の文字認識装置における表示手段
による表示結果を印字する印字手段を具備する。
【0006】
【作用】本発明の文字認識装置では、読取領域判断手段
および読取順番判断手段で判断された領域および読取順
番の確からしさを、確信度判断手段で判断する。そし
て、確からしさの判断結果に応じて読取領域および読取
順番の表示を変えることで、認識結果の確認作業を軽減
する。ここでいう確からしについては、例えば、領域や
読み取る順番を決める際に使用した数値、その数値を閾
値処理したランク等の各種の情報を使用することが可能
である。
【0007】
【実施例】以下、本発明の文字認識装置における一実施
例を図1および図2を参照して詳細に説明する。図1は
文字認識装置の構成を表したものである。この文字認識
装置は、文字や図形等を画像情報として読み取り、2値
化した画像データとして出力するスキャナ11、および
スキャナ11で読み取った画像情報から文字や図形等を
認識する文字認識部12を備えている。また、文字認識
装置は、スキャナ11で読み取った画像情報や文字認識
部12による認識結果を表示するディスプレイ13と、
文字認識部12による認識結果等のデータを出力する印
字装置14を備えている。さらに、文字認識装置は、認
識結果の修正等を行うための入力装置16を備えてい
る。この入力装置16は、例えばマウス等のポインティ
ングデバイスや、キーボード等で構成される。
【0008】文字認識部12は、スキャナで読み取られ
た画像情報を格納する画メモリ21を備えている。ま
た、文字認識部12は、一般的な文字認識処理や、画像
メモリ21に格納された画像情報から読取領域や読取順
番を判断すると共に、その確からしさである確信度を判
断する等の本実施例における処理、を行う中央演算処理
装置22を備えている。
【0009】さらに、文字認識部12は、この中央演算
処理装置22で各種処理を行うための各種プログラムが
格納されたROM(リード・オンリ・メモリ)23、中
央演算処理装置22による各種処理においてワーキング
エリアとして使用されるワークエリアRAM(ランダム
・アクセス・メモリ)24、および、文字認識等の認識
を行う場合に使用される辞書25、とを備えている。ス
キャナ11、文字認部12の各部、ディスプレイ13、
印字装置14はそれぞれデータバス等のバスライン15
で接続されている。
【0010】次に、このように構成された実施例の動作
について説明する。原稿がセットされると、スキャナ1
1によって原稿の画像情報が読み取られ、2値データと
して、文字認識部12の画像メモリ12に格納されると
共に、ディスプレイ13に表示される。中央演算処理装
置22は、画像メモリ12に格納された画像情報から、
文字領域、表領域、写真領域の区別を判断する。そし
て、判断した各領域に対して読み取る順番を決定する。
この各領域や読取順番を決定する際に使用した数値や、
その数値を閾値処理したランク等の各種情報は、ワーク
エリアRAM24に格納される。そして、中央演算処理
装置11は、このワークエリアRAM24に格納したラ
ンク等の各種情報から、領域および読取順番の各々につ
いて、その確信度を判断する。確信度の判断は、例え
ば、デンプスター・シェーファーの確立理論を使用し
て、総合的に最終認識結果の確信度を決定することが可
能であるが、他の方法によることも可能である。
【0011】この例ようにして、領域と読取順番およ
び、これらの確信度が中央演算処理装置22で判断され
ると、その判断結果がディスプレイ13に表示される。
図2は、ディスプレイ13に表示される読取領域、読取
順番および確信度を表したものである。図2(a)は、
文字認識部12によって、画像メモリ21に格納された
画像情報から判断した、読取領域と読取順番を表したも
のである。この図2(a)に示すように、文字認識部1
2は、文字領域51、表領域52、写真領域53を判断
すると共に、その読取順番54、55を判断する。この
実施例において、読取順番は、文字領域を最優先させ、
その次に表領域の認識の順番となっている。そして、図
2(b)に示すように、文字認識部12で各読取領域お
よび読取順番の確信度が低い場合、読取領域に対しては
その領域枠57を、読取順番に対してはその読取順表示
矢印56の色、または輝度を変化させる。具体的には、
薄い色や異なる色にし、また、低い輝度で表示する。
【0012】また、読取領域および読取順番の確信度が
低い場合、領域枠と読取順表示矢印の形状を変化させる
ようにしてもよい。具体的には、図2(c)に示すよう
に、領域枠58と読取順表示矢印59を点線で表示して
もよい。また、図示しないが、確信度の低い領域枠や読
取順表示矢印の太さを変化させることも可能てある。
【0013】さらに、読取領域および読取順番の確信度
が低い場合、確信度が低いことを示すように、記号を表
示してもよい。具体的には、図2(d)に示すように、
ランク表示「?」60を表示してもよい。
【0014】確信度に応じてディスプレイ13に表示さ
れた読取領域と、読取順番のうち、ユーザは、確信度の
低い所を中心に確認を行う。誤認識箇所がある場合、ユ
ーザは入力装置16のマウスまたはキーボード等によっ
て誤認識箇所の修正を行う。また、ディスプレイ13に
表示されている判断結果を印字装置14に出力し、この
出力から確認を行うことも可能である。このように、本
実施例によれば、読取領域と読取順番の確からしさをデ
ィスプレイ13に表示し、また、印字装置14から出力
することで、ユーザは、確認処理および修正処理を容易
行うことが可能になる。
【0015】
【発明の効果】本発明の文字認識装置によれば、読取領
域判断手段および読取順番判断手段で判断された領域お
よび読取順番の確からしさを判断する確信度判断手段
と、この確信度判断手段で判断された確からしさに応じ
て読取領域および読取順番を表示する表示手段を備えた
ので、読取領域、読取順番の認識結果の確認と修正を容
易に行うことができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置における一実施例の構成
図である。
【図2】読取領域、読取順番、および確信度をディスプ
レイに表示した状態を示す説明図である。
【符号の説明】 11 スキャナ 12 文字認識部 13 ディスプレイ 14 印字装置 15 バスライン 16 入力装置 21 画像メモリ 22 中央演算処理装置 23 ROM 24 ワークエリアRAM 25 辞書 51 文字領域 52 表領域 53 写真領域 54、55、56、59 読取順矢印 57 領域枠 60 ランク表示

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文書画像から自動的に領域を判断する領
    域判断手段と、 この領域検出手段で検出された領域をどのような順番で
    読み取るべきかを判断する読取順番判断手段と、 前記領域判断手段で判断された領域と、前記読取順番判
    断手段で判断された読取順番を修正する修正手段と、 前記読取領域判断手段および読取順番判断手段で判断さ
    れた領域および読取順番の確からしさを判断する確信度
    判断手段と、 この確信度判断手段で判断された確からしさに応じて読
    取領域および読取順番を表示する表示手段とを具備する
    ことを特徴とする文字認識装置。
  2. 【請求項2】 表示手段は、確信度判断手段で判断され
    た確からしさに応じて、色および輝度の少なくとも一方
    を変えて表示することを特徴とする請求項1記載の文字
    認識装置。
  3. 【請求項3】 表示手段は、確信度判断手段で判断され
    た確からしさに応じて、領域の範囲を示す枠の形状およ
    び読み取りの順番を表わす形状の少なくとも一方を変え
    て表示することを特徴とする請求項1記載の文字認識装
    置。
  4. 【請求項4】 表示手段は、確からしさを同時に表示す
    ることを特徴とする請求項1から請求項3記載の文字認
    識装置。
  5. 【請求項5】 表示手段による表示結果を印字する印字
    手段を具備することを特徴とする請求項1から請求項4
    記載の文字認識装置。
JP5223834A 1993-08-17 1993-08-17 文字認識装置 Pending JPH0757049A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5223834A JPH0757049A (ja) 1993-08-17 1993-08-17 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5223834A JPH0757049A (ja) 1993-08-17 1993-08-17 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0757049A true JPH0757049A (ja) 1995-03-03

Family

ID=16804453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5223834A Pending JPH0757049A (ja) 1993-08-17 1993-08-17 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0757049A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193356A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2014119767A (ja) * 2012-12-13 2014-06-30 Hitachi Omron Terminal Solutions Corp 帳票表示システム、帳票表示装置、及び帳票表示方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193356A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2014119767A (ja) * 2012-12-13 2014-06-30 Hitachi Omron Terminal Solutions Corp 帳票表示システム、帳票表示装置、及び帳票表示方法

Similar Documents

Publication Publication Date Title
US7636483B2 (en) Code type determining method and code boundary detecting method
JP3727971B2 (ja) 文書処理装置、及び文書処理方法
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
JPH07121664A (ja) 自動ヨーロッパ言語決定装置
JPH1139428A (ja) 文書映像の方向修正方法
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
JPH0757049A (ja) 文字認識装置
JPH02293989A (ja) 文字認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP2674475B2 (ja) 文字読取装置
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JPH10207978A (ja) 文字等パターン照合方法及び装置
JP2022019257A (ja) 情報処理装置、情報処理方法及びプログラム
JP2978801B2 (ja) 手書き文字認識の文字入力方式
JPH0554193A (ja) 文字認識装置
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JPH08249421A (ja) 反転文字の認識方法
JP2000163511A (ja) 光学文字読取装置
JP2001312692A (ja) 認識文字修正方法及び認識文字修正プログラム
JP2002074262A (ja) 認識文字修正方法
JPH02191084A (ja) 文字確認修正方式
JPH05298488A (ja) 光学的文字読取装置
JPH07306911A (ja) Ocr読取結果修正装置
JPH0452885A (ja) 文字読取装置