JPH1040338A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH1040338A
JPH1040338A JP8196395A JP19639596A JPH1040338A JP H1040338 A JPH1040338 A JP H1040338A JP 8196395 A JP8196395 A JP 8196395A JP 19639596 A JP19639596 A JP 19639596A JP H1040338 A JPH1040338 A JP H1040338A
Authority
JP
Japan
Prior art keywords
character
black
data
determined
erased
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8196395A
Other languages
English (en)
Inventor
Kaoru Washio
かおる 鷲尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8196395A priority Critical patent/JPH1040338A/ja
Publication of JPH1040338A publication Critical patent/JPH1040338A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 帳票の文字枠内が抹消されていた場合でも認
識処理に時間が掛からないようにする。 【解決手段】 帳票1の文字枠2内に記入された文字は
イメージセンサ4により読み取られ、読み取られた画像
データはメモリ7に格納される。前処理部8はメモリ7
から文字パターンを切り出し、文字枠内の黒点数を計数
する。この計数値が所定値より多ければ制御部10によ
り抹消文字と判定する。抹消文字と判定した場合には文
字認識処理を行わない。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票上の文字枠内
に記入された文字を光学的に読取る光学式文字読取装置
(OCR)に関し、特に帳票上の抹消文字の切り出しを
行う光学式文字読取装置に関する。
【0002】
【従来の技術】従来OCRは、帳票上の文字を光学系に
よりイメージセンサに結像させ、このイメージセンサに
おいて得た画像信号を多値データ(イメージデータ)に
変換し、該多値データをメモリに書き込むようになって
いる。そして多値データから切り出した文字の特徴を抽
出することにより文字を認識することができる。
【0003】
【発明が解決しようとする課題】帳票には文字枠が予め
印刷されており、この文字枠内に認識対象の文字が記入
されるが、ボールペン等修正が困難な筆記用具で文字が
記入される場合、記入ミスをするとその文字枠内を黒く
塗り潰すことがある。こうした場合、黒く塗り潰した文
字枠も塗り潰していない文字枠と同様に読取りが行わ
れ、塗り潰した文字枠内も文字パターンとして認識され
る。実際に塗り潰した文字は存在せず、そのため認識結
果を出すのに時間が多くかかっていた。
【0004】
【課題を解決するための手段】上記課題を解決するため
に本発明は、帳票上の文字枠内に記入された文字を光学
的に読取って得られる画像データを二値データに変換
し、この二値データを1文字分切り出して文字認識する
光学式文字読取装置において、切り出された文字枠内の
黒点数を計数することにより抹消文字か否かを判定し、
抹消文字と判定した場合は認識処理を行わずに認識結果
をリジェクトとすることを特徴とする。
【0005】上記構成の本発明によれば、切り出された
文字枠内の黒点数を計数し、この計数値が所定以上あれ
ば抹消文字と判定され、抹消文字と判定された場合には
文字認識処理を行わない。したがって抹消文字を読み取
った場合でも認識結果を出すのに時間はかからない。
【0006】
【発明の実施の形態】以下、本発明の実施の形態を図面
にしたがって説明する。なお各図面に共通する要素には
同一の符号を付す。図1は本発明の実施の形態の光学式
文字読取装置を示すブロック図である。
【0007】図1において、帳票1にはあらかじめ文字
枠2が印刷されていて、ここに数字、アルファベット、
ひらがな、片仮名、漢字等が記入される。帳票1は図示
しない搬送手段により矢印方向に搬送される。搬送され
る帳票1の上方にはレンズ3およびイメージセンサ4が
配設される。イメージセンサ4は増幅器(アンプ)5に
接続され、増幅器5には順次アナログ/ディジタル(A
/D)変換部6、メモリ7、前処理部8、認識部9に接
続している。また前処理部8には制御部10が接続され
ている。制御部10はカウンタを内蔵している。
【0008】図2は前処理部の内部を示すブロック図で
ある。同図において、前処理部8には射影検出部11と
二値化部12が含まれている。射影検出部11は、読み
取った画像データから主走査方向および副走査方向の射
影を抽出するものである。また二値化部12は文字の画
像データを多値データから二値データに変換するもので
ある。
【0009】図3は帳票の記入例を示す説明図である。
図3において、帳票1の文字枠2a〜2eには数字が記
入されている。ここで文字枠2cについては記入ミスが
あって塗り潰されている。
【0010】次に本実施の形態の動作を図4に示すフロ
ーチャートにしたがって説明する。図4は実施の形態の
読取り動作を示すフローチャートである。ここでは図3
に示す、塗り潰しの文字枠のある帳票を読み取る動作を
説明する。
【0011】帳票1が図示しない搬送手段により図1の
矢印方向に搬送され、図示しない光源により帳票1が照
射されると、帳票1からの反射光がレンズ3を通ってイ
メージセンサ4に結像する。イメージセンサ4は受光し
た光信号を電気信号に変換して出力する。電気信号に変
換された画像信号はアンプ5により増幅され、続いてA
/D変換部6によりディジタル信号に変換されて多値デ
ータにされる。多値データとされた画像データは、行単
位または頁単位でメモリ7に格納される(ステップ
1)。
【0012】前処理部8の射影検出部11は、メモリ7
に格納された1文字分の多値データを読み出し、主走査
方向(図3に示すx方向)の射影と副走査方向(図3に
示すy方向)の射影を抽出する(ステップ2)。そして
主走査方向および副走査方向の各多値データの内、予め
設定されたスライス値以下のデータを検出する。これに
より不要な点や食み出し文字等のノイズが検出され、こ
のノイズを除いた枠内部に対応する多値データを二値化
部12へ送る(ステップ3)。二値化部12では、送ら
れてきた多値データを設定されたスライス値によってス
ライスし、黒白の二値データに変換する。
【0013】制御部10では文字パターン内の黒点(黒
のデータ)をカウントする(ステップ4)。次に黒点の
数が文字パターン内の全画素の80パーセントより多い
かどうかを判定する(ステップ5)。ここで黒点数が全
画素の80パーセント以上と判定した場合は、文字パタ
ーン内が黒く塗り潰されていると判断し、抹消文字であ
るとして認識処理を行わずに認識結果をリジェクトと決
定する(ステップ7)。黒点の数が全画素の80パーセ
ント未満である場合は、通常に記入された文字であると
して二値データを認識部9へ送って認識処理を行う(ス
テップ6)。
【0014】以上のように抹消文字と判定した場合には
認識処理を行わないので、記入ミスした文字の認識時間
を短縮することができ、さらにシステム全体の処理時間
の短縮に繋がる。なお上記実施の形態では、黒点数が8
0パーセント以上を抹消文字としたが、基準比率はこの
数値に限定されるものではなく、実験結果等により任意
に設定すればよい。
【0015】上記実施の形態では、記入ミスした文字を
抹消する仕方として文字枠内を殆ど真っ黒に塗り潰した
ものを抹消文字と判定するのであるが、記入ミスした文
字を抹消する仕方としては例えば図5に示す仕方もあ
る。図5は他の帳票の記入例を示す説明図である。図5
に示す文字枠2ccに示すような文字の抹消をした場
合、文字パターン内の黒点数は少なくなる。こうした黒
点数の少ない抹消文字を判定する実施の形態を他の実施
の形態として次に説明する。
【0016】他の実施の形態は、構成上は前記実施の形
態と同様である。したがって他の実施の形態の動作を以
下に説明する。図6は他の実施の形態の読取り動作を示
すフローチャートである。
【0017】ステップ11からステップ15までは前記
実施の形態の動作と同様であるので説明を省略する。ス
テップ15において黒点の数が文字パターン内の全画素
の80パーセントより多くないと判定した場合、次に文
字パターン内の総黒点数が文字パターン内の45パーセ
ント以上あるかどうか判断する(ステップ16)。総黒
点数が45パーセント以上であれば、図5に示すような
抹消文字の可能性があるので、次に文字枠内の図7に示
す位置Aにおけるx方向の黒画素のブロック(黒画素が
連続している塊)がいくつあるか算える。そして算えた
値が5つより多いかどうか判定する(ステップ17)。
図7は図5の文字枠2ccを示す説明図である。
【0018】図7において、線21a〜21lは抹消線
である。点aと点bは文字記入領域の角の点であり、点
Mはa点とb点の中点である。また点Aはa点とM点の
中点で、点BはM点とb点の中点である。上記のステッ
プ17においてA点の位置からx方向に黒画素が連続し
ている塊の数を算えるが、これはイメージデータ上でA
点からx方向に点線で示す座標について黒点があるかど
うかを順次判定していくことにより行われる。A点の座
標は次式(1)で求められる。 A(x,y)=(ax,(3ay+by)/4) ……(1) 図7に示す例ではA点からx方向に点線で示す座標につ
いては、黒ブロックが5個検出されることになる。記入
文字種がアルファベットまたは数字の場合には、x方向
に黒ブロックが5個以上検出されることはないので、黒
ブロックが5個以上検出された場合は抹消線が存在する
と判定される。したがってこの実施の形態の抹消文字の
判定方法では、帳票への記入文字種がアルファベットま
たは数字の場合に適用される。
【0019】図6のフローチャートに戻って説明する。
ステップ17において抹消文字と判定された場合は、認
識を行わないで認識結果を抹消文字と決定する(ステッ
プ21)。ステップ17で抹消文字と判定されない場合
は、次に図7に示す点Bの位置からx方向に点線で示す
座標について黒点がいくつあるか算える(ステップ1
8)。この場合もステップ17におけると同様に黒ブロ
ックが5個以上あるかどうか判定される。B点の座標は
次式(2)で求められる。 B(x,y)=(ax,(ay+3by)/4) ……(2) ステップ17の場合と同様に、図7に示す例でB点から
x方向に点線で示す座標については、黒ブロックが5個
検出されることになる。このようにA点とB点のすべて
のx座標の2箇所で黒ブロックの個数を検出することに
より、上部だけあるいは下部だけ抹消線が引かれている
場合も検出できる。
【0020】ステップ18で黒ブロックが4個以下と判
定された場合、次に多値データを主走査方向の射影を抽
出する。これを図8に示す。図8において射影22が抽
出されたものである。この射影22の値の内、点A,B
における値を求める。そして求めた値が、文字枠2の総
画素数に対して50パーセントを越えているかどうかを
判断する(ステップ19)。50パーセントを越えてい
る場合は、抹消文字であると判定し、認識処理は行わな
い。50パーセントを越えていない場合は、抹消文字で
はないと判定し、次に認識処理に移行する。
【0021】以上のように、記入文字がアルファベット
や数字の場合には、複数の点における射影の値が所定値
(50パーセント)より多ければ抹消文字と見做すこと
ができるので、上記方法により抹消文字を検出してこの
場合には認識処理を行わないようにすることができる。
なおこの実施の形態では、抹消文字の判定基準となる数
値(45パーセント、50パーセント)は、上記実施の
形態の場合と同様に、限定されるものではなく実験結果
等により任意に設定すればよい。また黒ブロックの数に
ついての判定基準も5個に限定されるわけではなく、適
正な値に設定可能である。
【0022】また上記他の実施の形態においては、黒ブ
ロックの数の計数をx方向に行ったが、これをy方向に
計数してもよい。さらに上記動作のステップ19におい
て射影をx方向に抽出したが、これもy方向に行うよう
にしてもよい。
【0023】
【発明の効果】以上詳細に説明したように本発明によれ
ば、切り出された文字枠内の黒点数を計数することによ
り抹消文字か否かを判定し、抹消文字と判定した場合は
認識結果をリジェクトとするようにしたので、切り出さ
れた文字枠内の黒点数の計数値が所定以上あれば抹消文
字と判定され、抹消文字と判定された場合には文字認識
処理を行わない。したがって抹消文字を読み取った場合
でも認識結果を出すのに時間はかからない。
【図面の簡単な説明】
【図1】発明の実施の形態の光学式文字読取装置を示す
ブロック図である。
【図2】前処理部を示すブロック図である。
【図3】帳票の記入例を示す説明図である。
【図4】実施の形態の読取動作を示すフローチャートで
ある。
【図5】他の帳票の記入例を示す説明図である。
【図6】他の実施の形態の読取動作を示すフローチャー
トである。
【図7】図5の文字枠2ccを示す説明図である。
【図8】他の実施の形態の射影を示す説明図である。
【符号の説明】
1 帳票 2 文字枠 8 前処理部 10 制御部 11 射影検出部 12 二値化部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 帳票上の文字枠内に記入された文字を光
    学的に読取って得られる画像データを二値データに変換
    し、この二値データを1文字分切り出して文字認識する
    光学式文字読取装置において、 切り出された文字枠内の黒点数を計数することにより抹
    消文字か否かを判定し、 抹消文字と判定した場合は認識処理を行わずに認識結果
    をリジェクトとすることを特徴とする光学式文字読取装
    置。
  2. 【請求項2】 前記判定により抹消文字と判定されない
    場合、主走査方向または副走査方向の所定の位置におけ
    る黒点数を計数し、計数値が所定数以上の場合は抹消文
    字と判定する請求項1記載の光学式文字読取装置。
JP8196395A 1996-07-25 1996-07-25 光学式文字読取装置 Withdrawn JPH1040338A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8196395A JPH1040338A (ja) 1996-07-25 1996-07-25 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8196395A JPH1040338A (ja) 1996-07-25 1996-07-25 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH1040338A true JPH1040338A (ja) 1998-02-13

Family

ID=16357162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8196395A Withdrawn JPH1040338A (ja) 1996-07-25 1996-07-25 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH1040338A (ja)

Similar Documents

Publication Publication Date Title
US5471549A (en) Method of detecting and correcting a direction of image data and document image filing system employing the same
EP0063454A2 (en) Method for recognizing machine encoded characters
JPS6115284A (ja) 光学的文字読取装置
CN111126266A (zh) 文本处理方法、文本处理系统、设备及介质
KR20010015025A (ko) 문자인식장치의 문자추출방법 및 장치
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH1040338A (ja) 光学式文字読取装置
JP3710164B2 (ja) 画像処理装置及び方法
JP2877380B2 (ja) 光学的文字読取装置
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
JP3715473B2 (ja) 宛名読取装置
JPH0916715A (ja) 文字認識装置および方法
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JPS62262194A (ja) 光学式文字読取装置
JPS6160184A (ja) 光学的文字読取装置
JPS63136181A (ja) 文字読取装置
JPH10233930A (ja) 画像処理装置
JPH04223584A (ja) 光学式文字読取装置
JPH04359393A (ja) 光学的文字読取装置
JPH08171610A (ja) 光学式文字読み取り装置および光学式文字読み取り方法
JP2000113101A (ja) 文字切り出し方法および装置
JPH04139593A (ja) 郵便番号認識装置
JPS62200490A (ja) 光学的文字読取装置
JPH03222082A (ja) 文字認識装置
JPS60189584A (ja) 図形量子化装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20031007