JP3037727B2 - Ocrシステム - Google Patents

Ocrシステム

Info

Publication number
JP3037727B2
JP3037727B2 JP2228660A JP22866090A JP3037727B2 JP 3037727 B2 JP3037727 B2 JP 3037727B2 JP 2228660 A JP2228660 A JP 2228660A JP 22866090 A JP22866090 A JP 22866090A JP 3037727 B2 JP3037727 B2 JP 3037727B2
Authority
JP
Japan
Prior art keywords
character
ocr
misreading
confidence index
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2228660A
Other languages
English (en)
Other versions
JPH04109379A (ja
Inventor
豊志 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2228660A priority Critical patent/JP3037727B2/ja
Publication of JPH04109379A publication Critical patent/JPH04109379A/ja
Application granted granted Critical
Publication of JP3037727B2 publication Critical patent/JP3037727B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、光学的文字読取装置(OCR)による文字読
取り結果に対する誤読文字修正機能を有するOCRシステ
ムに関する。
(従来の技術) 一般に、光学的文字読取装置による帳票等に記入され
た文字の読取り結果についてのチェック方式としては、
チェックデジット方式や合計チェック方式が用いられて
いる。これらのチェック方式では、1フィールド単位、
及び1帳票単位に、読取り結果に誤読された文字が含ま
れているか否かがチェックされる。ユーザは、誤読され
たことが示されている場合に、1フィールド単位及び1
帳票単位に、1文字1文字について目視チェックを行
い、誤読された文字を見つけて修正を行なっている。
(発明が解決しようとする課題) このように、従来のチェック方式では、1フィールド
単位及び1帳票単位に、1文字1文字について目視チェ
ックが必要であり、どの帳票の、どのフィールドの、ど
の文字が誤読文字であるかを見つけるまでに多くの時間
を必要とし、かつ大変な作業負担となっていた。
本発明は前記のような点に鑑みてなされたもので、誤
読文字の修正を容易、かつ効率的に行なうことが可能な
OCRシステムを提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、文字読取り結果に対する誤読文字修正機能
を有するOCRシステムにおいて、文字読取り結果につい
て確からしさを示す信頼指数を各文字毎に求める信頼指
数設定手段と、文字読取り結果について誤読の有無をチ
ェックする誤読判別手段と、この誤読判定手段で誤読が
あると判定された場合、文字読取り結果を表示すると共
に、前記信頼指数設定手段で求めた信頼指数に基づいて
誤読の可能性の大きい読取り結果の文字を指示する表示
手段とを具備して構成するものである。
(作用) このような構成によれば、信頼指数に基づいて修正対
象とする文字が検索されるので、誤りの可能性の高い文
字から優先して修正、または誤読しているか否かのチェ
ックを行なうことができる。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。
第1図は同実施例に係わるOCRシステムの構成を示すブ
ロック図である。第1図に示すOCRシステムは、文字認
識処理を行なうOCR装置10、及びOCR装置10の制御や文字
認識結果に対する誤読チェック等を行なうOCR制御装置2
0によって構成されている。
OCR装置10には、帳票イメージの入力を行なうスキャ
ナ部12、スキャナ部12によって入力された帳票イメージ
について文字認識処理を実行する認識部14、及びOCR制
御装置20とのインターフェイスを司るOCRインターフェ
イス部16によって構成されている。認識部14は、OCR制
御装置20からの指示に応じて、帳票に設けられた各フィ
ールドについて1文字毎に文字認識処理を行なう。文字
認識処理では、1文字毎に文字パターンの切出しを行な
い、文字パターンと標準パターン(辞書)との照合を行
なって類似度値を求める。また、切り出された文字パタ
ーンをもとに、帳票に記入された文字の字形(例えば、
標準文字、変形文字、カスレ文字、汚れ文字、つづけ・
はみ出し文字)の判別が行なわれる。さらに、認識部14
は、類似度値、及び文字の字形に基づいて、文字単位、
フィールド単位に、文字読取結果として正しいものであ
るという確からしさを示す信頼指数を求めるものであ
る。
OCR制御装置20には、OCR装置10に対する制御やユーザ
インターフェイス(I/O機器)制御、文字読取り結果の
編集等を含むOCRシステム全体の制御を司る制御部22、
ユーザインターフェイスであるCRT24,キーボード26、及
びOCR装置10とのインターフェイスを司るOCR制御装置イ
ンターフェイス部28によって構成されている。制御部22
は、OCR装置10において得られる文字認識結果、信頼指
数に基づいて、誤読文字が存在するか否かのチェック、
文字の修正(編集)等を行なう。CRT24は、文字認識結
果等の各種表示を行なうものである。キーボード28は、
ユーザからのOCRシステムに対する処理実行の指示やデ
ータのインプット等に用いられる。
次に、同実施例の動作について説明する。
はじめに、同実施例において文字読取りの対象とされ
る帳票について説明する。第2図に、その帳票の一例を
示している。第2図に示す帳票には、複数の文字記入用
のフィールド(a〜f)が設けられ、数字が記入される
ものとする。特に、フィールドfには、フィールドa〜
gに記入された数字の合計が記入されるように規定され
ているものとする。
まず、OCR装置10のスキャナ部12によって、第2図に
示す帳票についての帳票イメージを入力する。この帳票
イメージが、スキャナ部12から認識部14に転送される
と、OCR制御装置20からの指示により文字認識処理が実
行される。認識部14は、帳票に設けられた各フィールド
単位に、1文字毎に文字パターンを切出して文字認識処
理を行なう。この際、各文字について、標準パターン
(辞書)との類似度値、及び文字の性質(文字の字形)
を求める。そして、認識部14は、類似度値、文字の字形
に基づいて、各文字について、文字認識結果の答えとし
ての信頼性を数値(信頼指数)として求める。
一般に、光学的文字読取装置による文字読取りにおい
ては、誤読し易い文字の傾向に片寄りがある。さらに、
例えば標準文字→変形文字→カスレ文字→汚れ文字→つ
づけ・はみ出し文字、というように、読取りの際の難度
も字形毎に異なるのが一般的である。このようなこと
を、総合的、統計的に文字認識結果の信頼指数という形
で、認識結果の付加データとして求めておくことによっ
て、OCR制御装置20側での誤読チェックにおいて誤読文
字の存在が見つかった場合に、誤読文字の検索を容易に
行なうことができる。
同実施例では、認識部14において、各文字毎に10段階
で示す信頼指数を求めるものとする。この結果、信頼指
数が1〜4の文字についてはリジェクト文字として出力
し、信頼指数が5〜10の文字については文字認識結果と
して第1候補(類似度値が最も高いもの)を文字コード
で出力する。さらに、その信頼指数を各文字毎に、認識
結果の付加データとして出力する。第2図に示す帳票に
記入された各文字に対応する信頼指数を第3図に示して
いる。
さらに、フィールド内の各文字についての認識後に、
その各文字の信頼指数に基づいてフィールドに対する信
頼指数を求めて、フィールド単位の付加データとして出
力する。なお、ここでは、フィールド単位の信頼指数の
値は、フィールド内の各文字に対する信頼指数の最小値
をとるものとする。第4図には、各フィールドの記入文
字、文字読取結果、及びフィールド単位の信頼指数の対
応を示している。
こうして、認識部14において各文字について認識処理
が行なわれ、信頼指数が得られると、その結果がOCRイ
ンターフェイス部16、OCR制御装置インターフェイス28
を介して制御部22に転送される。
制御部22では、フィールドa〜eについての読取り結
果(a,b,c,d,e)が、フィールドfの読取り結果(f)
と一致するか否かを判別する。すなわち、 a+b+c+d+e=f …(1) が成立するか否かを計算する。この結果、前記(1)式
が成立する場合には、正しく読取りが行なわれたものと
して、制御部22は認識部14に対して、次の帳票の読取り
を指示するフィードコマンドを与える。
一方、前記(1)式が成立しない場合には、1シート
分の読取り結果をCRT24に表示させる。この時、制御部2
2は、1シート分の読取り結果中の信頼指数の最も低い
フィールドの、さらに信頼指数の最も低い文字にカーソ
ル位置を設定する。そして、カーソル位置の文字に対す
るキーボード26からの文字修正指示の入力待ちとなる。
修正対象とする文字(カーソルが示す文字)は、信頼
指数の小さい順に順次設定される。つまり、誤りの可能
性の大きい文字から順に、修正対象の文字として表示さ
れる。
このようにして、OCR装置10における読取り状況を、
信頼指数という形でOCR制御装置20に与えることによ
り、各文字について目視チェックを行なうことなく誤読
文字を容易に見つけることができるために、誤読文字修
正の作業負担を大幅に軽減すると共に、効率的に作業を
行なうことができる。
なお、前記実施例においては、文字単位、フィールド
単位に信頼指数を求めているが、シート単位に信頼指数
を求めて利用することも可能である。それは、トータル
バッチチェック機能を有するシステムにおいて、どのシ
ートに誤読文字が存在する可能性が高いかを、シート毎
の信頼指数から簡単に推測することができる。つまり、
信頼指数の最も低い文字が存在するシートが誤読シート
である可能性が高いことになり、これをもとにしてシー
ト単位の誤読文字検索順を決定すれば良い。
[発明の効果] 以上のように本発明によれば、認識結果について信頼
指数を求め、この信頼指数に基づいて誤読文字を検索す
るので、誤読文字の修正を容易、かつ効率的に行なうこ
とが可能となるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わるOCRシステムの構成
を示すブロック図、第2図は処理対象とする帳票の一例
を示す図、第3図は第2図に帳票に記入された文字に対
する信頼指数の例を示す図、第4図は各フィールドの記
入文字,文字読取結果,及びフィールド単位の信頼指数
の対応を示す図である。 10……OCR装置、12……スキャナ部、14……認識部、16
……OCRインターフェイス部、20……OCR制御装置、22…
…制御部、24……CRT、26……キーボード、28……OCR制
御装置インターフェイス。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字読取り結果に対する誤読文字修正機能
    を有するOCRシステムにおいて、 文字読取り結果について確からしさを示す信頼指数を各
    文字毎に求める信頼指数設定手段と、 文字読取り結果について誤読の有無をチェックする誤読
    判別手段と、 この誤読判定手段で誤読があると判定された場合、文字
    読取り結果を表示すると共に、前記信頼指数設定手段で
    求めた信頼指数に基づいて誤読の可能性の大きい読取り
    結果の文字を指示する表示手段と を具備したことを特徴とするOCRシステム。
JP2228660A 1990-08-30 1990-08-30 Ocrシステム Expired - Lifetime JP3037727B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2228660A JP3037727B2 (ja) 1990-08-30 1990-08-30 Ocrシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2228660A JP3037727B2 (ja) 1990-08-30 1990-08-30 Ocrシステム

Publications (2)

Publication Number Publication Date
JPH04109379A JPH04109379A (ja) 1992-04-10
JP3037727B2 true JP3037727B2 (ja) 2000-05-08

Family

ID=16879818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2228660A Expired - Lifetime JP3037727B2 (ja) 1990-08-30 1990-08-30 Ocrシステム

Country Status (1)

Country Link
JP (1) JP3037727B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544045A (en) * 1991-10-30 1996-08-06 Canon Inc. Unified scanner computer printer
JP2007148334A (ja) * 2005-11-02 2007-06-14 Nippon Shokubai Co Ltd 液晶表示装置用光拡散板およびその製造方法

Also Published As

Publication number Publication date
JPH04109379A (ja) 1992-04-10

Similar Documents

Publication Publication Date Title
JPH05108883A (ja) 文字認識方法及び装置
EP0687991A2 (en) Information processing method and apparatus
JP3037727B2 (ja) Ocrシステム
JPH11213087A (ja) 文字認識装置
KR950001061B1 (ko) 문서인식 수정장치
JPH07160801A (ja) オンライン文字認識装置
JP3128357B2 (ja) 文字認識処理装置
JP3367973B2 (ja) 文字処理方法及び装置
JPH07210623A (ja) 文書画像処理装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP2677271B2 (ja) 文字認識装置
JPH05120472A (ja) 文字認識装置
JPH0612520A (ja) 文字認識装置の確認修正方式
JPH0721303A (ja) 文字認識装置
JPH053631B2 (ja)
JP3077580B2 (ja) 文字読取装置
JPH0520490A (ja) 光学的文字読取修正システム
JPS6186881A (ja) オンライン手書き文字認識方式
JPH0830717A (ja) 文字認識方法とその装置
JPH0318987A (ja) 辞書登録方法
JPH07192079A (ja) 文字認識装置
JPH0362280A (ja) 文字読取装置
JPH01298483A (ja) 画像認識装置
JPS6398788A (ja) 認識装置
JPH0488490A (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080225

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090225

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110225

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110225

Year of fee payment: 11