JP3037727B2 - Ocrシステム - Google Patents
OcrシステムInfo
- Publication number
- JP3037727B2 JP3037727B2 JP2228660A JP22866090A JP3037727B2 JP 3037727 B2 JP3037727 B2 JP 3037727B2 JP 2228660 A JP2228660 A JP 2228660A JP 22866090 A JP22866090 A JP 22866090A JP 3037727 B2 JP3037727 B2 JP 3037727B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- ocr
- misreading
- confidence index
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
取り結果に対する誤読文字修正機能を有するOCRシステ
ムに関する。
た文字の読取り結果についてのチェック方式としては、
チェックデジット方式や合計チェック方式が用いられて
いる。これらのチェック方式では、1フィールド単位、
及び1帳票単位に、読取り結果に誤読された文字が含ま
れているか否かがチェックされる。ユーザは、誤読され
たことが示されている場合に、1フィールド単位及び1
帳票単位に、1文字1文字について目視チェックを行
い、誤読された文字を見つけて修正を行なっている。
単位及び1帳票単位に、1文字1文字について目視チェ
ックが必要であり、どの帳票の、どのフィールドの、ど
の文字が誤読文字であるかを見つけるまでに多くの時間
を必要とし、かつ大変な作業負担となっていた。
読文字の修正を容易、かつ効率的に行なうことが可能な
OCRシステムを提供することを目的とする。
を有するOCRシステムにおいて、文字読取り結果につい
て確からしさを示す信頼指数を各文字毎に求める信頼指
数設定手段と、文字読取り結果について誤読の有無をチ
ェックする誤読判別手段と、この誤読判定手段で誤読が
あると判定された場合、文字読取り結果を表示すると共
に、前記信頼指数設定手段で求めた信頼指数に基づいて
誤読の可能性の大きい読取り結果の文字を指示する表示
手段とを具備して構成するものである。
象とする文字が検索されるので、誤りの可能性の高い文
字から優先して修正、または誤読しているか否かのチェ
ックを行なうことができる。
第1図は同実施例に係わるOCRシステムの構成を示すブ
ロック図である。第1図に示すOCRシステムは、文字認
識処理を行なうOCR装置10、及びOCR装置10の制御や文字
認識結果に対する誤読チェック等を行なうOCR制御装置2
0によって構成されている。
ナ部12、スキャナ部12によって入力された帳票イメージ
について文字認識処理を実行する認識部14、及びOCR制
御装置20とのインターフェイスを司るOCRインターフェ
イス部16によって構成されている。認識部14は、OCR制
御装置20からの指示に応じて、帳票に設けられた各フィ
ールドについて1文字毎に文字認識処理を行なう。文字
認識処理では、1文字毎に文字パターンの切出しを行な
い、文字パターンと標準パターン(辞書)との照合を行
なって類似度値を求める。また、切り出された文字パタ
ーンをもとに、帳票に記入された文字の字形(例えば、
標準文字、変形文字、カスレ文字、汚れ文字、つづけ・
はみ出し文字)の判別が行なわれる。さらに、認識部14
は、類似度値、及び文字の字形に基づいて、文字単位、
フィールド単位に、文字読取結果として正しいものであ
るという確からしさを示す信頼指数を求めるものであ
る。
インターフェイス(I/O機器)制御、文字読取り結果の
編集等を含むOCRシステム全体の制御を司る制御部22、
ユーザインターフェイスであるCRT24,キーボード26、及
びOCR装置10とのインターフェイスを司るOCR制御装置イ
ンターフェイス部28によって構成されている。制御部22
は、OCR装置10において得られる文字認識結果、信頼指
数に基づいて、誤読文字が存在するか否かのチェック、
文字の修正(編集)等を行なう。CRT24は、文字認識結
果等の各種表示を行なうものである。キーボード28は、
ユーザからのOCRシステムに対する処理実行の指示やデ
ータのインプット等に用いられる。
る帳票について説明する。第2図に、その帳票の一例を
示している。第2図に示す帳票には、複数の文字記入用
のフィールド(a〜f)が設けられ、数字が記入される
ものとする。特に、フィールドfには、フィールドa〜
gに記入された数字の合計が記入されるように規定され
ているものとする。
示す帳票についての帳票イメージを入力する。この帳票
イメージが、スキャナ部12から認識部14に転送される
と、OCR制御装置20からの指示により文字認識処理が実
行される。認識部14は、帳票に設けられた各フィールド
単位に、1文字毎に文字パターンを切出して文字認識処
理を行なう。この際、各文字について、標準パターン
(辞書)との類似度値、及び文字の性質(文字の字形)
を求める。そして、認識部14は、類似度値、文字の字形
に基づいて、各文字について、文字認識結果の答えとし
ての信頼性を数値(信頼指数)として求める。
ては、誤読し易い文字の傾向に片寄りがある。さらに、
例えば標準文字→変形文字→カスレ文字→汚れ文字→つ
づけ・はみ出し文字、というように、読取りの際の難度
も字形毎に異なるのが一般的である。このようなこと
を、総合的、統計的に文字認識結果の信頼指数という形
で、認識結果の付加データとして求めておくことによっ
て、OCR制御装置20側での誤読チェックにおいて誤読文
字の存在が見つかった場合に、誤読文字の検索を容易に
行なうことができる。
で示す信頼指数を求めるものとする。この結果、信頼指
数が1〜4の文字についてはリジェクト文字として出力
し、信頼指数が5〜10の文字については文字認識結果と
して第1候補(類似度値が最も高いもの)を文字コード
で出力する。さらに、その信頼指数を各文字毎に、認識
結果の付加データとして出力する。第2図に示す帳票に
記入された各文字に対応する信頼指数を第3図に示して
いる。
その各文字の信頼指数に基づいてフィールドに対する信
頼指数を求めて、フィールド単位の付加データとして出
力する。なお、ここでは、フィールド単位の信頼指数の
値は、フィールド内の各文字に対する信頼指数の最小値
をとるものとする。第4図には、各フィールドの記入文
字、文字読取結果、及びフィールド単位の信頼指数の対
応を示している。
が行なわれ、信頼指数が得られると、その結果がOCRイ
ンターフェイス部16、OCR制御装置インターフェイス28
を介して制御部22に転送される。
果(a,b,c,d,e)が、フィールドfの読取り結果(f)
と一致するか否かを判別する。すなわち、 a+b+c+d+e=f …(1) が成立するか否かを計算する。この結果、前記(1)式
が成立する場合には、正しく読取りが行なわれたものと
して、制御部22は認識部14に対して、次の帳票の読取り
を指示するフィードコマンドを与える。
分の読取り結果をCRT24に表示させる。この時、制御部2
2は、1シート分の読取り結果中の信頼指数の最も低い
フィールドの、さらに信頼指数の最も低い文字にカーソ
ル位置を設定する。そして、カーソル位置の文字に対す
るキーボード26からの文字修正指示の入力待ちとなる。
指数の小さい順に順次設定される。つまり、誤りの可能
性の大きい文字から順に、修正対象の文字として表示さ
れる。
信頼指数という形でOCR制御装置20に与えることによ
り、各文字について目視チェックを行なうことなく誤読
文字を容易に見つけることができるために、誤読文字修
正の作業負担を大幅に軽減すると共に、効率的に作業を
行なうことができる。
単位に信頼指数を求めているが、シート単位に信頼指数
を求めて利用することも可能である。それは、トータル
バッチチェック機能を有するシステムにおいて、どのシ
ートに誤読文字が存在する可能性が高いかを、シート毎
の信頼指数から簡単に推測することができる。つまり、
信頼指数の最も低い文字が存在するシートが誤読シート
である可能性が高いことになり、これをもとにしてシー
ト単位の誤読文字検索順を決定すれば良い。
指数を求め、この信頼指数に基づいて誤読文字を検索す
るので、誤読文字の修正を容易、かつ効率的に行なうこ
とが可能となるものである。
を示すブロック図、第2図は処理対象とする帳票の一例
を示す図、第3図は第2図に帳票に記入された文字に対
する信頼指数の例を示す図、第4図は各フィールドの記
入文字,文字読取結果,及びフィールド単位の信頼指数
の対応を示す図である。 10……OCR装置、12……スキャナ部、14……認識部、16
……OCRインターフェイス部、20……OCR制御装置、22…
…制御部、24……CRT、26……キーボード、28……OCR制
御装置インターフェイス。
Claims (1)
- 【請求項1】文字読取り結果に対する誤読文字修正機能
を有するOCRシステムにおいて、 文字読取り結果について確からしさを示す信頼指数を各
文字毎に求める信頼指数設定手段と、 文字読取り結果について誤読の有無をチェックする誤読
判別手段と、 この誤読判定手段で誤読があると判定された場合、文字
読取り結果を表示すると共に、前記信頼指数設定手段で
求めた信頼指数に基づいて誤読の可能性の大きい読取り
結果の文字を指示する表示手段と を具備したことを特徴とするOCRシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2228660A JP3037727B2 (ja) | 1990-08-30 | 1990-08-30 | Ocrシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2228660A JP3037727B2 (ja) | 1990-08-30 | 1990-08-30 | Ocrシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04109379A JPH04109379A (ja) | 1992-04-10 |
JP3037727B2 true JP3037727B2 (ja) | 2000-05-08 |
Family
ID=16879818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2228660A Expired - Lifetime JP3037727B2 (ja) | 1990-08-30 | 1990-08-30 | Ocrシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3037727B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5544045A (en) * | 1991-10-30 | 1996-08-06 | Canon Inc. | Unified scanner computer printer |
JP2007148334A (ja) * | 2005-11-02 | 2007-06-14 | Nippon Shokubai Co Ltd | 液晶表示装置用光拡散板およびその製造方法 |
-
1990
- 1990-08-30 JP JP2228660A patent/JP3037727B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH04109379A (ja) | 1992-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH05108883A (ja) | 文字認識方法及び装置 | |
EP0687991A2 (en) | Information processing method and apparatus | |
JP3037727B2 (ja) | Ocrシステム | |
JPH11213087A (ja) | 文字認識装置 | |
KR950001061B1 (ko) | 문서인식 수정장치 | |
JPH07160801A (ja) | オンライン文字認識装置 | |
JP3128357B2 (ja) | 文字認識処理装置 | |
JP3367973B2 (ja) | 文字処理方法及び装置 | |
JPH07210623A (ja) | 文書画像処理装置 | |
JPH06251187A (ja) | 文字認識誤り修正方法及び装置 | |
JP2677271B2 (ja) | 文字認識装置 | |
JPH05120472A (ja) | 文字認識装置 | |
JPH0612520A (ja) | 文字認識装置の確認修正方式 | |
JPH0721303A (ja) | 文字認識装置 | |
JPH053631B2 (ja) | ||
JP3077580B2 (ja) | 文字読取装置 | |
JPH0520490A (ja) | 光学的文字読取修正システム | |
JPS6186881A (ja) | オンライン手書き文字認識方式 | |
JPH0830717A (ja) | 文字認識方法とその装置 | |
JPH0318987A (ja) | 辞書登録方法 | |
JPH07192079A (ja) | 文字認識装置 | |
JPH0362280A (ja) | 文字読取装置 | |
JPH01298483A (ja) | 画像認識装置 | |
JPS6398788A (ja) | 認識装置 | |
JPH0488490A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080225 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090225 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100225 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100225 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110225 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110225 Year of fee payment: 11 |