JPH03122785A - 光学的文字読取装置 - Google Patents
光学的文字読取装置Info
- Publication number
- JPH03122785A JPH03122785A JP1258771A JP25877189A JPH03122785A JP H03122785 A JPH03122785 A JP H03122785A JP 1258771 A JP1258771 A JP 1258771A JP 25877189 A JP25877189 A JP 25877189A JP H03122785 A JPH03122785 A JP H03122785A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- noise
- information
- deleted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012015 optical character recognition Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims description 9
- 230000003287 optical effect Effects 0.000 claims description 9
- 238000000926 separation method Methods 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 5
- 230000037430 deletion Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 abstract description 9
- 238000010606 normalization Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000002411 adverse Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は、予め設定された読取情報に基づいて、文字読
取処理を行なう光学的文字読取装置に関する。
取処理を行なう光学的文字読取装置に関する。
(従来の技術)
一般に、光学的文字読取装置においては、処理対象とす
る帳票に記入された文字以外の点,短い線等が文字に近
接していると、この点,線が文字の一部として文字認識
処理が行なわれてしまい、その結果リジェクトすること
があった。このため、あるべきでない文字以外の点、線
等のパターンは、文字認識処理の前段において実行され
る前処理によって削除されるようになっている。通常、
前処理においては、予め設定された大きさ(固定値)を
越えるか否かを判定し、しきい値未満の点、線等のパタ
ーンを不要なパターンとして削除している。
る帳票に記入された文字以外の点,短い線等が文字に近
接していると、この点,線が文字の一部として文字認識
処理が行なわれてしまい、その結果リジェクトすること
があった。このため、あるべきでない文字以外の点、線
等のパターンは、文字認識処理の前段において実行され
る前処理によって削除されるようになっている。通常、
前処理においては、予め設定された大きさ(固定値)を
越えるか否かを判定し、しきい値未満の点、線等のパタ
ーンを不要なパターンとして削除している。
(発明が解決しようとする課題)
帳票上に文字以外の点、線が存在する理由としては、帳
票記入者による誤記入、印刷時に付着したゴミ、ボール
ペン、鉛筆等の筆記具による汚れ等、様々な場合が考え
られる。しかしながら、従来の光学的文字読取装置では
、文字以外の点。
票記入者による誤記入、印刷時に付着したゴミ、ボール
ペン、鉛筆等の筆記具による汚れ等、様々な場合が考え
られる。しかしながら、従来の光学的文字読取装置では
、文字以外の点。
線等のパターンを削除するか否かを判定するためのしき
い値が固定となっていた。このため、汚れが目立つよう
な帳票について文字読取処理を行なう場合であっても、
予め設定されたしきい値によって、不要なパターンであ
るか否かが判定されていた。すなわち、処理対象とする
帳票の汚れ等の状態に対処することができず、不要なパ
ターンであっでも、ある程度の大きさであれば削除され
ず、文字パターンの一部として扱われて文字認識処理に
悪影響を与えてしまうという問題があった。
い値が固定となっていた。このため、汚れが目立つよう
な帳票について文字読取処理を行なう場合であっても、
予め設定されたしきい値によって、不要なパターンであ
るか否かが判定されていた。すなわち、処理対象とする
帳票の汚れ等の状態に対処することができず、不要なパ
ターンであっでも、ある程度の大きさであれば削除され
ず、文字パターンの一部として扱われて文字認識処理に
悪影響を与えてしまうという問題があった。
本発明は前記のような点に鑑みてなされたもので、帳票
の汚れ蔓によって文字認識処理に悪影響を与えにくくす
ることが可能な光学的文字読取装置を提供することを目
的とする。
の汚れ蔓によって文字認識処理に悪影響を与えにくくす
ることが可能な光学的文字読取装置を提供することを目
的とする。
[発明の構成]
(課題を解決するための手段)
本発明は、文字パターンに含まれる独立した分離パター
ンが不要なものであるか否かを判定するために用いられ
る判定しきい値情報を読取情報の一部として保持するた
めの保持手段と、文字パターンに含まれる各分離パター
ンについて、不要なものであるか否かを前記保持手段に
保持された判定しきい値情報に基づいて判定する判定手
段と、この判定手段によって不要と判定された分離パタ
ーンを文字パターン中から削除する削除手段とを備えて
おり、削除手段によって不要なパターンが削除された文
字パターンについて文字認識処理を行なうように構成す
るものである。
ンが不要なものであるか否かを判定するために用いられ
る判定しきい値情報を読取情報の一部として保持するた
めの保持手段と、文字パターンに含まれる各分離パター
ンについて、不要なものであるか否かを前記保持手段に
保持された判定しきい値情報に基づいて判定する判定手
段と、この判定手段によって不要と判定された分離パタ
ーンを文字パターン中から削除する削除手段とを備えて
おり、削除手段によって不要なパターンが削除された文
字パターンについて文字認識処理を行なうように構成す
るものである。
(作用)
このような構成によれば、読取情報の一部として保持手
段に保持された判定しきい値情報に従って、文字パター
ンに含まれる不要なパターンの判定を行なうので、判定
しきい値を変更することによって、処理対象とする帳票
に応じた不要なパターンの削除を行なうことができる。
段に保持された判定しきい値情報に従って、文字パター
ンに含まれる不要なパターンの判定を行なうので、判定
しきい値を変更することによって、処理対象とする帳票
に応じた不要なパターンの削除を行なうことができる。
(実施例)
以下、図面を参照して本発明の一実施例を説明する。第
1図は同実施例に係わる光学的文字読取装置の構成を示
すブロック図である。同図において、lOは制御部であ
り、装置全体の制御を司るものである。11は各処理部
における各種処理に用いられる読取情報(以下、FC(
フォーマットコントロール)情報と称する)を格納する
ためのFC情報格納メモリであり、制御部lOによって
読み出される。FC情報には、帳票に記録された文字の
文字ピッチ、文字サイズ、フォントに関する情報や、文
字パターンに含まれる不要なパターン(ノイズ)を削除
する処理に用いられるしきい値情報等が含まれている。
1図は同実施例に係わる光学的文字読取装置の構成を示
すブロック図である。同図において、lOは制御部であ
り、装置全体の制御を司るものである。11は各処理部
における各種処理に用いられる読取情報(以下、FC(
フォーマットコントロール)情報と称する)を格納する
ためのFC情報格納メモリであり、制御部lOによって
読み出される。FC情報には、帳票に記録された文字の
文字ピッチ、文字サイズ、フォントに関する情報や、文
字パターンに含まれる不要なパターン(ノイズ)を削除
する処理に用いられるしきい値情報等が含まれている。
このFC情報は、文字読取処理を実施する前に予め作成
され、Fe情報格納メモリ11に格納されるものである
。12はCCDスキャナ等によって構成されるセンサ部
であり、文字認識処理の対象とする帳票を光学的に走査
して、帳票に記録された文字等に応じた光電変換信号を
出力する。センサ部12には、センサ部12から出力さ
れた光電変換信号を量子化する量子化部13が接続され
ている。量子化部13には、量子化によって得られた1
シ一ト分の帳票イメージを格納するシートバッファ14
が接続されている。シートバッファ14には、制御部l
Oの制御のもとに文字ピッチ情報等に基づいて、帳票イ
メージから1文字分の文字のパターンを切り出して格納
する検切部15が接続されている。検切部15には、切
り出された文字パターンからノイズの削除を含む前処理
、及び文字パターンの位置、大きさ等を揃える正規化処
理を行なう前処理正規化部16が接続されている。
され、Fe情報格納メモリ11に格納されるものである
。12はCCDスキャナ等によって構成されるセンサ部
であり、文字認識処理の対象とする帳票を光学的に走査
して、帳票に記録された文字等に応じた光電変換信号を
出力する。センサ部12には、センサ部12から出力さ
れた光電変換信号を量子化する量子化部13が接続され
ている。量子化部13には、量子化によって得られた1
シ一ト分の帳票イメージを格納するシートバッファ14
が接続されている。シートバッファ14には、制御部l
Oの制御のもとに文字ピッチ情報等に基づいて、帳票イ
メージから1文字分の文字のパターンを切り出して格納
する検切部15が接続されている。検切部15には、切
り出された文字パターンからノイズの削除を含む前処理
、及び文字パターンの位置、大きさ等を揃える正規化処
理を行なう前処理正規化部16が接続されている。
前処理正規化部16には、正規化された文字バターンに
ついて文字認識処理を行なう認識部17が接続されてい
る。文字認識処理は、辞書メモリ18に格納された各文
字の特徴を示す辞書データに基づいて行われる。認識部
17には、文字認識処理の結果を出力するための出力部
19が接続されている。
ついて文字認識処理を行なう認識部17が接続されてい
る。文字認識処理は、辞書メモリ18に格納された各文
字の特徴を示す辞書データに基づいて行われる。認識部
17には、文字認識処理の結果を出力するための出力部
19が接続されている。
次に、同実施例の動作を説明する。
まず、帳票について読取処理を実施する前に、予め文字
読取処理に必要なFC情報(読取情報)が作成され、F
C情報格納メモリ11に格納される。
読取処理に必要なFC情報(読取情報)が作成され、F
C情報格納メモリ11に格納される。
この際、文字の文字ピッチ、文字サイズ、フォント等の
文字読取処理に必要なFC情報に加えて、前処理正規化
部16における不要なパターン(ノイズ)を削除する処
理に用いられるしきい値情報がパラメータとして設定さ
れる。すなわち、検切部15によって切り出された文字
パターンに含まれる分離パターンがノイズであるか否か
を判定するためのしきい値情報は、第2図に示すような
パターンの面積(S)1幅(W)、高さ(H)のそれぞ
れについて設定される。なお、FC情報としてしきい値
情報が設定されない場合は、ある固定の規定値がしきい
値がとして設定されるものとする。
文字読取処理に必要なFC情報に加えて、前処理正規化
部16における不要なパターン(ノイズ)を削除する処
理に用いられるしきい値情報がパラメータとして設定さ
れる。すなわち、検切部15によって切り出された文字
パターンに含まれる分離パターンがノイズであるか否か
を判定するためのしきい値情報は、第2図に示すような
パターンの面積(S)1幅(W)、高さ(H)のそれぞ
れについて設定される。なお、FC情報としてしきい値
情報が設定されない場合は、ある固定の規定値がしきい
値がとして設定されるものとする。
はじめに、文字読取処理の対象とする帳票は、センサ部
12において光学的に走査される。センサ部12からは
帳票に記録された文字等に応じて光電変化信号が出力さ
゛れる。量子化部13は、センサ部12からの光電変換
信号を量子化する。この量子化によって得られた帳票イ
メージは、シートバッファI4に格納される。
12において光学的に走査される。センサ部12からは
帳票に記録された文字等に応じて光電変化信号が出力さ
゛れる。量子化部13は、センサ部12からの光電変換
信号を量子化する。この量子化によって得られた帳票イ
メージは、シートバッファI4に格納される。
シートバッファ14に帳票イメージが格納されると、制
御部lOは、FC情報格納メモリl■に格納された文字
の切出しに用いられる文字ピッチ等の情報を読出して検
切部15に転送する。検切部15は、制御部lOから与
えられた文字ピッチ情報等をもと1;1文字分の文字パ
ターンを、シートバッファ14に格納された帳票イメー
ジ中から検出し、切出しを行なう。検切部15は、切出
した文字パターンを保持する。
御部lOは、FC情報格納メモリl■に格納された文字
の切出しに用いられる文字ピッチ等の情報を読出して検
切部15に転送する。検切部15は、制御部lOから与
えられた文字ピッチ情報等をもと1;1文字分の文字パ
ターンを、シートバッファ14に格納された帳票イメー
ジ中から検出し、切出しを行なう。検切部15は、切出
した文字パターンを保持する。
次に、検切部15が文字パターンの切出しを行なうと、
制御部lOは、FC情報格納メモリ11に格納された不
要パターン(ノイズ)削除のためのしきい値情報を読出
し、前処理正規化部IBに転送する。
制御部lOは、FC情報格納メモリ11に格納された不
要パターン(ノイズ)削除のためのしきい値情報を読出
し、前処理正規化部IBに転送する。
そして、前処理正規化部16は、第3図に示すフローチ
ャートのように、微小な点、短い線等の各分離パターン
について、しきい値情報に基づいてノイズであるか否か
の判定を行なう。
ャートのように、微小な点、短い線等の各分離パターン
について、しきい値情報に基づいてノイズであるか否か
の判定を行なう。
ここでは、分離パターンの面積S(ドツト数)。
幅W、高さHと、それぞれに対応するしきい値情報との
比較を順次行ない(ステップ81〜S3)、全てがしき
い値未満であれば、分離パターンをノイズと判定する。
比較を順次行ない(ステップ81〜S3)、全てがしき
い値未満であれば、分離パターンをノイズと判定する。
そして、ノイズと判定した分離パターンを、文字パター
ン中から削除する(ステップS4)。
ン中から削除する(ステップS4)。
また、ステップ81〜S3において、何れかの条件でし
きい値以上であるものがあった場合は、分離パターンを
ノイズと判定せずに、パターンの削除を行わない。
きい値以上であるものがあった場合は、分離パターンを
ノイズと判定せずに、パターンの削除を行わない。
なお、FC情報格納メモリUに、任意に設定されたしき
い値情報が格納されていない場合は、規定値に基づいて
前記処理が実行される。
い値情報が格納されていない場合は、規定値に基づいて
前記処理が実行される。
こうして、ノイズと判定された分離パターンが削除され
た文字パターンは、文字サイズ、傾き等が補正され正規
化される。正規化された文字パターンは、認識部17に
転送される。
た文字パターンは、文字サイズ、傾き等が補正され正規
化される。正規化された文字パターンは、認識部17に
転送される。
認識部17は、辞書メモリ18に格納された辞書データ
を用いて認識゛処理を行なう。認識部17における認識
結果(文字コード)は、出力部19に出力され表示等が
行なわれる。
を用いて認識゛処理を行なう。認識部17における認識
結果(文字コード)は、出力部19に出力され表示等が
行なわれる。
このようにして、FC情報の一部として設定されたしき
い値情報に基づいて、文字パターンに含まれるノイズの
削除を行なうことができる。このため、処理対象とする
帳票の汚れや、使用される筆記具等に対応するしきい値
情報を設定することにより、リジェクトや誤認識を発生
しにくくすることができる。
い値情報に基づいて、文字パターンに含まれるノイズの
削除を行なうことができる。このため、処理対象とする
帳票の汚れや、使用される筆記具等に対応するしきい値
情報を設定することにより、リジェクトや誤認識を発生
しにくくすることができる。
[発明の効果]
以上のように本発明によれば、文字パターンに含まれる
分離パターンが不要なものであるか否かを判定するため
に用いられるしきい値情報を、読取情報(FC情報)に
含まれるパラメータとして設定することができるので、
処理対象とする帳票に応じたしきい値情報を設定するこ
とができる。
分離パターンが不要なものであるか否かを判定するため
に用いられるしきい値情報を、読取情報(FC情報)に
含まれるパラメータとして設定することができるので、
処理対象とする帳票に応じたしきい値情報を設定するこ
とができる。
このため、文字パターン中からノイズを確実に削除する
ことができるので、ノイズの影響を受けない文字認識処
理を行なうことができ、正確な文字認識処理の結果を得
ることができるものである。
ことができるので、ノイズの影響を受けない文字認識処
理を行なうことができ、正確な文字認識処理の結果を得
ることができるものである。
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図はしきい値情報を説明
するための図、第3図はノイズ判定の処理の手順を示す
フローチャートである。
の構成を示すブロック図、第2図はしきい値情報を説明
するための図、第3図はノイズ判定の処理の手順を示す
フローチャートである。
Claims (2)
- (1)文字読取処理の対象とする帳票を光学的に走査す
ることによって帳票イメージを検出し、予め設定された
読取情報に基づいて、前記帳票イメージから文字パター
ンを切出して文字認識処理を行なう光学的文字読取装置
において、 前記文字パターンに含まれる独立した分離パターンが不
要なものであるか否かを判定するために用いられる判定
しきい値情報を前記読取情報の一部として保持するため
の保持手段と、 文字パターンに含まれる各分離パターンについて、不要
なものであるか否かを前記保持手段に保持された判定し
きい値情報に基づいて判定する判定手段と、 前記判定手段によって不要と判定された分離パターンを
文字パターン中から削除する削除手段と、を具備し、 前記削除手段によって不要なパターンが削除された文字
パターンについて文字認識処理を行なうことを特徴とす
る光学的文字読取装置。 - (2)前記判定しきい値情報は前記分離パターンの面積
、幅、高さについてのしきい値を含み、前記判定手段は
前記分離パターンの面積、幅、高さのそれぞれについて
判定を行なうことを特徴とする第1請求項記載の光学的
文字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1258771A JPH03122785A (ja) | 1989-10-05 | 1989-10-05 | 光学的文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1258771A JPH03122785A (ja) | 1989-10-05 | 1989-10-05 | 光学的文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03122785A true JPH03122785A (ja) | 1991-05-24 |
Family
ID=17324856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1258771A Pending JPH03122785A (ja) | 1989-10-05 | 1989-10-05 | 光学的文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03122785A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0535475A (ja) * | 1991-07-25 | 1993-02-12 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識システム |
JPH05151398A (ja) * | 1991-12-02 | 1993-06-18 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識方法 |
US7130085B2 (en) * | 2001-08-23 | 2006-10-31 | Fujitsu Limited | Half-tone dot elimination method and system thereof |
JP2020009345A (ja) * | 2018-07-12 | 2020-01-16 | スキャネット株式会社 | 答案採点のシステム、プログラムおよび方法 |
-
1989
- 1989-10-05 JP JP1258771A patent/JPH03122785A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0535475A (ja) * | 1991-07-25 | 1993-02-12 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識システム |
JPH05151398A (ja) * | 1991-12-02 | 1993-06-18 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識方法 |
US7130085B2 (en) * | 2001-08-23 | 2006-10-31 | Fujitsu Limited | Half-tone dot elimination method and system thereof |
JP2020009345A (ja) * | 2018-07-12 | 2020-01-16 | スキャネット株式会社 | 答案採点のシステム、プログラムおよび方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5048107A (en) | Table region identification method | |
JPS6115284A (ja) | 光学的文字読取装置 | |
JPH07105312A (ja) | 光学式文字読取装置における文字イメージのごみ除去方法及び装置 | |
JPH03122785A (ja) | 光学的文字読取装置 | |
JP3090070B2 (ja) | 帳票識別方法及び装置 | |
JP2702441B2 (ja) | ウェーハ識別文字認識システム | |
JP2894111B2 (ja) | 光学式活字文字認識装置における認識結果の総合判定方式 | |
JPS62251887A (ja) | 文字認識・図形処理装置 | |
JP3391987B2 (ja) | 帳票認識装置 | |
JP4580520B2 (ja) | 文字認識方法および文字認識装置 | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
JP2908495B2 (ja) | 文字画像抽出装置 | |
JPS5949671A (ja) | 光学的文字読取装置 | |
JP2923004B2 (ja) | 画像生成装置 | |
JP3160458B2 (ja) | 文字読取装置及び文字読取方法 | |
JPH10171924A (ja) | 文字認識装置 | |
JPH03296884A (ja) | 文字画像抽出装置 | |
JPH10233930A (ja) | 画像処理装置 | |
JPH0557632B2 (ja) | ||
JPH11184962A (ja) | 光学的文字読取装置、照合修正方法、及び記録媒体 | |
JP2001209755A (ja) | 書損じ修正装置、書損じ修正方法および書損じ修正プログラムを格納したコンピュータ読取り可能な記録媒体 | |
JP3747602B2 (ja) | 画像処理方法および画像処理装置 | |
JPS6160184A (ja) | 光学的文字読取装置 | |
JPH03164885A (ja) | 光学式文字読取装置 | |
JPS60122474A (ja) | 正規化方法 |