JPS62103784A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS62103784A
JPS62103784A JP60244313A JP24431385A JPS62103784A JP S62103784 A JPS62103784 A JP S62103784A JP 60244313 A JP60244313 A JP 60244313A JP 24431385 A JP24431385 A JP 24431385A JP S62103784 A JPS62103784 A JP S62103784A
Authority
JP
Japan
Prior art keywords
character
pattern
rejection
registered
rejected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60244313A
Other languages
English (en)
Inventor
Shinji Matsuda
信治 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60244313A priority Critical patent/JPS62103784A/ja
Publication of JPS62103784A publication Critical patent/JPS62103784A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、光学的文字読取装置等の文字読取装置に関す
る。
[発明の技術的背景とその問題点] 従来、光学的文字読取袋fff(OCR)では、構造解
析方式及びパターンマツチング方式等の各種の認識方式
が開発されている。OCRは、いずれかの認識方式によ
り、用紙上に記録された文字に対する認!I処理を実行
して、認識結果である文字コードを出力する。
ここで、OCRは認識処理を実行する際、識別不能文字
(リジェクト文字)があるとリジェクトすることになる
。このリジェクト文字は、手書き文字の場合には筆記者
特有の癖のある癖文字であることが多い。このため、O
CRの読取率を向上(即ちリジェクト率の減少)させる
ために、予め辞書メモリに癖文字に対応する文字パター
ンを記憶し、この文字パターンに基づいて癖文字に対す
る認識処理を行なうことが考えられる。しかしながら、
全ての癖文字の文字パターンを辞書メモリに記憶するこ
とは、人寄Hの辞書メモリが必要になり、実際上極めて
困難である。
[発明の目的1 本発明の目的は、人寄」の辞書メモリを特に用意するこ
となく、例えば筆記者の癖文字に対する認識処理でのり
ジェット率を大幅に減少して、読取率全体を向上するこ
とができる文字読取装置を提供することにある。
[発明の概要] 本発明は、通常の文字パターンに対する第1の認識手段
とは別に、例えば癖文字の認識用の第2の認識手段を備
えている。第2の認識手段は、第1の認識手段でリジェ
クトされた癖文字の文字パターンに対する認識処理を、
予め登録メモリに記憶された登録パターンに基づいて行
なう。登録メモリには、第1の認識手段でリジェクトさ
れた文字パターン及びその文字コードが、例えばオペレ
ータからのキー人力指示により登録されている。
このような構成のOCRにより、認識処理に必要な癖文
字等の文字パターンを登録し、登録後にその癖文字等の
文字パターンに対する認識処理を確実に行なうことが可
能となる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わるOCRの構成を示すブロック図で
ある。第1図において、量子化部10は、用紙上に記録
された文字に対応する文字パターンデータを作成する回
路である。母子化部10は、図示しないイメージセンサ
(例えばCODスキャナ)から用紙上を走査して得る光
電変換信号が与えられると、その光電変換信号を211
化信号に変換する。検切部11は、量子化部10で得ら
れる例えば1行分の文字パターンから、1文字分の文字
パターンを検切して格納する。前処理部12は、検切部
11から出力される文字パターンに対して、ノイズ除去
及び位置、大きさを揃える正規化処理を行なう回路であ
る。
特徴抽出部13は、前処理部12から出力される文字パ
ターンから、識別処理に必要な特徴を求めてそのデータ
を識別部14へ出力する。識別部14は、特徴抽出部1
3で抽出された文字パターンの特徴を、辞書メモリ15
に予め記憶された標準パターンに基づいて識別し、該当
する文字コードを答として出力する。制御部16は、O
CR全体の制御を行なう回路である。リジェクト修正部
17は、識別部14でリジェクトが発生した際、第2図
に示すようなそのリジェクトパターンを表示する表示装
置20及びリジェクト修正用のキーボード21を備えて
いる。
癖文字識別部18は、識別部14でリジェクトが発生し
た際、そのリジェクトパターンをパターン登録部19に
登録された登録パターンに基づいて識別処理を行なう。
次に、同実施例の動作を第3図のフローチャートを参照
して説明する。先ず、用紙上に記録された文字がイメー
ジセンサにより走査されると、その文字に対応する光電
変換信号が量子化部1oに与えられる。吊子化部10は
、光電変換信号を2値化信号に変換し、この2値化信号
からなる文字パターンを図示しないバッファメモリに格
納する。検切部11は、吊子化部10から出力される例
えば1行分の文字パターンから、1文字分の文字パター
ンを検切する。前処理部12は、検切部11で検切され
た文字パターンに対するノイズ除去及び正規化処理を行
なう。特徴抽出部13は、前処理部12から得られる正
規化パターンから識別処理に必要な特徴を抽出する。識
別部14は、辞書メモリ15に予め記憶された各カテゴ
リ毎の標準パターンのvF徴と正規化パターンの特徴と
を比較し、最大のマツチング度を示すカテゴリの文字コ
ードを答として出力する。
ここで、識別部14は、識別処理により複数の候補文字
(識別結果)を求めて、第1位の候補文字のマツチング
度が所定の閾値以下の場合又は第1位と第2位の各候補
文字間のマツチング度差が所定の閾値以下の場合には′
、識別不能としてリジェクトする。制御部16は、識別
部14でリジェクト処理がなされると、リジェクト制御
動作を実行する。
即ち、第3図のステップS1に示すように、リジェクト
修正部17の表示装置20に表示させる。表示装置20
は、第2図に示すように、リジェクトされた文字パター
ン(リジェクトパターン〉22を表示することになる。
オペレータは、表示装置20の画面を確認して、例えば
数字「5」に相当するリジェクトパターン22が読取対
衆として必要であると判断すると、キーボード21に設
けられた登録キー23を操作する。このとき、オペレー
タは、登録キー23と共にリジェクトパターン22に相
当する数字「5」のキー24を操作する。
制御部16は、ステップ82.83に示すように、キー
ボード21の登録キー23の操作により登録モードが指
示されたと判断し、リジェクトパターン22を前処理部
12からパターン登録部19に転送して登録させる。こ
のとき、パターン登録部19には、リジェクトパターン
22と共に、キーボード21から入力された文字コード
(この場合、数字「5」のコード)も登録される。この
ような処理により、各種のリジェクトパターンがパター
ン登録部19に登録されることになる。
次に、ステップS4に示すように、次の文字パターンに
対する識別処理が識別部14で実行されたとする。識別
部14は、リジェクトでなければ、ステップS6に示す
ように、文字パターンに対応する文字コードを答として
出力する。一方、識別部14がリジェクトした場合、制
御部16はそのリジェクトパターンがパターン登録部1
9に登録されているか否かを判断する(ステップS7)
、この場合、制御部16は、識別部14で求められた第
1位の候補文字のカテゴリがパターン登録部19に登録
されているか否かを判定する。制御部16は、登録され
ていると判断すると、癖文字識別部18に対して識別処
理を実行させる。癖文字識別部18は、前処理部12か
ら出力されるリジェクトパターンとパターン登録部19
に登録されたりジェクトパターン22とを比較し、その
マツチング度が所定の閾値以上であるか否かを判定する
(ステップ88.S9)。マツチング度が閾値以上であ
れば、癖文字識別部18は、例えばリジェクトパター 
ン22に対応する数字「5」の文字コードを答として出
力する。また、マツチング度が閾値未満であれば、癖文
字識別部18は識別部14と同様にリジェクトすること
になる。
このようにして、文字パターンに対する識別処理でリジ
ェクトがなされた場合、そのリジェクトパターンが表示
される。オペレータは、表示されたリジェクトパターン
を確認して、そのリジェクトパターンが読取対象として
必要であると判断すると、登録処理を行なう。これによ
り、例えば筆記者の癖文字がリジェクトされる場合、そ
の癖文字に対応するリジェクトパターンを登録すること
ができる。
このため、一度登録すれば、癖文字に対するリジェクト
を防止して、癖文字の認識を確実に行なうことができる
。この場合、オペレータが必要と認めた癖文字のみを登
録するため、パターン登録部19は特別大容量のメモリ
を必要としない。また、通常の識別処理に必要な辞書メ
モリ15の記憶内容を変更することはないため、他の文
字種に対する読取率が低下するような事態は発生しない
[発明の効果1 以上詳述したように本発明によれば、リジェクトされた
癖文字等の文字パターンを必要に応じて登録し、通常の
認識処理ではリジェクトされる文字パターンを登録パタ
ーンに基づいて認識することができる。このため、大容
量の辞書メモリを特に用意することなく、例えば筆記者
の癖文字に対する認識処理でのりジェット率を大幅に減
少することができる。したがって、結果的に、手書き文
字等に対する読取率全体を向上することが可能となるも
のである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は同実施例のリジェク
ト修正部の具体的構成を示すブロック図、第3図は同実
膿例の動作を説明するためのフローチャートである。 12・・・前処理部、14・・・識別部、15・・・辞
書メモリ、16・・・制御部、17・・・リジェクト修
正部、18・・・癖文字識別部、19・・・パターン登
録部。

Claims (1)

  1. 【特許請求の範囲】 用紙上に記録された文字に対応する文字パターンに対す
    る認識処理を実行する第1の認識手段と、この第1の認
    識手段の認識処理の結果がリジェクトの際にそのリジェ
    クトされたリジェクト文字パターンを表示し外部からの
    登録指示に応じて前記リジェクト文字パターン及びそれ
    に該当する文字コードを登録メモリに登録するリジェク
    ト制御手段と、 前記第1の認識手段の認識処理の結果がリジェクトの際
    にそのリジェクトされたリジェクト文字パターンに対し
    て前記登録メモリに登録された文字パターンに基づいて
    認識処理を実行し前記登録メモリに登録された該当文字
    コードを認識結果として出力する第2の認識手段とを具
    備したことを特徴とする文字読取装置。
JP60244313A 1985-10-31 1985-10-31 文字読取装置 Pending JPS62103784A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60244313A JPS62103784A (ja) 1985-10-31 1985-10-31 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60244313A JPS62103784A (ja) 1985-10-31 1985-10-31 文字読取装置

Publications (1)

Publication Number Publication Date
JPS62103784A true JPS62103784A (ja) 1987-05-14

Family

ID=17116871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60244313A Pending JPS62103784A (ja) 1985-10-31 1985-10-31 文字読取装置

Country Status (1)

Country Link
JP (1) JPS62103784A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6373982B1 (en) 1998-05-07 2002-04-16 International Business Machines Corporation Process and equipment for recognition of a pattern on an item presented

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS523697A (en) * 1975-05-10 1977-01-12 Toyobo Co Ltd Process for polymerizing of arylene ester polymers
JPS6072089A (ja) * 1983-09-28 1985-04-24 Fujitsu Ltd 認識装置
JPS60237583A (ja) * 1984-05-11 1985-11-26 Mitsubishi Electric Corp 文字読取修正方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS523697A (en) * 1975-05-10 1977-01-12 Toyobo Co Ltd Process for polymerizing of arylene ester polymers
JPS6072089A (ja) * 1983-09-28 1985-04-24 Fujitsu Ltd 認識装置
JPS60237583A (ja) * 1984-05-11 1985-11-26 Mitsubishi Electric Corp 文字読取修正方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6373982B1 (en) 1998-05-07 2002-04-16 International Business Machines Corporation Process and equipment for recognition of a pattern on an item presented

Similar Documents

Publication Publication Date Title
US5119433A (en) Method and system for locating the amount field on a document
US7099508B2 (en) Document identification device, document definition method and document identification method
JPH0221383A (ja) 光学文字読取装置
US4811412A (en) Method of a system for analyzing characters
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JPS62103784A (ja) 文字読取装置
JPH0291789A (ja) 文字認識方法
JPS6316795B2 (ja)
JP2575408B2 (ja) 郵便物の宛先住所読取装置
JPH07152856A (ja) 光学的文字読取装置
JP2746904B2 (ja) 文書読取り装置
JPH10269311A (ja) 帳票処理単位指定方法
JPH01191986A (ja) 読取装置
JPH01201789A (ja) 文字読取装置
JP3696152B2 (ja) 帳票識別装置および帳票識別方法
JPH0562021A (ja) 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム
JP2953162B2 (ja) 文字認識装置
JPH03123989A (ja) 文字認識装置
JP2972443B2 (ja) 文字認識装置
JPH07296102A (ja) データ入力方式
JPH1125206A (ja) マーク認識方法
JPH03219384A (ja) 文字認識装置
JPS63257081A (ja) 文書入力方式
JPH08263591A (ja) 文字認識装置及び方法
JPH1097592A (ja) 文字認識装置