JP2902694B2 - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JP2902694B2
JP2902694B2 JP1305026A JP30502689A JP2902694B2 JP 2902694 B2 JP2902694 B2 JP 2902694B2 JP 1305026 A JP1305026 A JP 1305026A JP 30502689 A JP30502689 A JP 30502689A JP 2902694 B2 JP2902694 B2 JP 2902694B2
Authority
JP
Japan
Prior art keywords
image
character
underline
detection
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1305026A
Other languages
English (en)
Other versions
JPH03164885A (ja
Inventor
雅郎 栗田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP1305026A priority Critical patent/JP2902694B2/ja
Publication of JPH03164885A publication Critical patent/JPH03164885A/ja
Application granted granted Critical
Publication of JP2902694B2 publication Critical patent/JP2902694B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、情報処理システム等において文字情報の入
力手段として用いられる光学式文字読取装置に関する。
(従来の技術) 一般に、光学式文字読取装置においては、光電変換部
を通して読込んだ帳票のイメージを暫定的にイメージバ
ッファに格納した後、このイメージバッファから、1文
字毎に文字イメージの検出、切出しを行って、各文字イ
メージに対する文字認識を行っている。
しかしながら、これまでの光学式文字読取装置では、
帳票上に2文字以上に渡るアンダーラインや罫線が記さ
れていると、これらアンダーラインや罫線が付された各
文字間の境目が識別し難くなるため、上述したイメージ
バッファからの文字の検出切出し処理を良好に行うこと
ができなくなるという問題があった。
(発明が解決しようとする課題) 本発明はこのような課題を解決するためのもので、帳
票上の文字にアンダーラインや罫線が付されていても、
イメージバッファ上にてそのアンダーラインや罫線のイ
メージを消去することにより、通常処理の場合と同様、
良好に文字の検出切出し処理を行うことのできる光学式
文字読取装置の提供を目的としている。
[発明の構成] (課題を解決するための手段) 本発明の光学式文字読取装置は上述した目的を達成す
るために、帳票のイメージを読取るイメージ読取手段
と、このイメージ読取手段により読取られた帳票イメー
ジが格納されるイメージバッファと、このイメージバッ
ファに格納された帳票イメージから1文字単位のイメー
ジを検出し切出す第1の文字検出切出手段と、この第1
の文字検出切出手段による1文字単位のイメージの検
出、切出を行えない範囲が存在した場合に、この範囲の
イメージを複数の区間に分割し、分割した複数の区間の
うちの所定の1区間の下半分の範囲内で、黒ビットの数
に応じたヒストグラムを求め、求めた該ヒストグラムと
予め定められた閾値とに基づいて、前記所定の1区間の
下半分の範囲の中からさらに特定の範囲を抽出し、抽出
した該特定の範囲に所定のマージンを加えた範囲を、ア
ンダーライン又は罫線のイメージが存在するアンダーラ
イン検出範囲として検出する第1の検出手段と、前記第
1の検出手段にて前記所定の1区間より検出された前記
アンダーライン検出範囲に基づいて、該所定の1区間に
隣接する区間から順にアンダーライン検出範囲を求めて
行き、前記分割された全ての区間のアンダーライン検出
範囲を検出する第2の検出手段と、前記イメージバッフ
ァに格納された帳票イメージから、前記第1又は第2の
検出手段にて検出されたアンダーライン検出範囲のイメ
ージを消去する消去手段と、この消去手段によりイメー
ジが消去された後の前記イメージバッファに格納されて
いる帳票イメージから、1文字毎にイメージを検出し切
出す第2の文字検出切出手段と、前記第1又は第2の文
字検出切出手段により切出された文字イメージから文字
認識を行う文字認識手段とを具備することを特徴とす
る。
(作用) 本発明の光学式文字読取装置は、イメージバッファ上
に格納された帳票イメージにおいて、1文字単位のイメ
ージの検出、切出のできない範囲がある場合、この範囲
のイメージを複数の区間に分割し、分割した複数の区間
のうちの所定の1区間の下半分の範囲内で黒ビットの数
に応じたヒストグラムを求めることで、アンダーライン
又は罫線のイメージが存在するアンダーライン検出範囲
を検出し、さらに、所定の1区間より検出されたアンダ
ーライン検出範囲を基準に、分割された全ての区間のア
ンダーライン検出範囲を検出することができ、検出され
た全ての区間のアンダーライン検出範囲のイメージをイ
メージバッファ上から消去するので、帳票上の文字にア
ンダーラインや罫線が付されていても、迅速に文字の検
出、切出し処理を行うことができる。
(実施例) 以下、本発明の実施例を図面に基づいて説明する。
第1図は本発明に係る一実施例の光学式文字読取装置
の構成を説明するためのブロック図である。
同図において、1は帳票P上のイメージを電気信号に
変換して読込む光電変換部、2は光電変換部1により電
気信号に変換されて読込まれた帳票イメージを暫定的に
蓄えるイメージバッファ、3はイメージバッファ2上に
蓄えられた帳票イメージから1文字毎にイメージデータ
を検出して切出す文字検出切出部である。また4はイメ
ージバッファ2上に蓄えられた帳票イメージから、文字
に付されたアンダーラインや罫線のイメージを検出する
アンダーライン検出部、5はアンダーライン検出部4に
より検出されたアンダーラインや罫線のイメージをイメ
ージバッファ2上から消去するアンダーライン消去部で
ある。さらに6は文字検出切出部3により1文字毎に検
出して切出された文字イメージについて文字認識を行う
文字認識部である。
次にこの実施例の光学式文字読取装置により、アンダ
ーラインが記された帳票を読込む場合の動作を第2図の
フローチャートと第3図ないし第6図を参照しながら説
明する。
まず、帳票Pのイメージを光電変換部1により電気信
号に変換して読込み、これをイメージバッファ2に格納
する(ステップA)。
この後、文字検出切出部3により、イメージバッファ
2に格納された帳票イメージから、文字単位のイメージ
を検出することができれば、その文字イメージをイメー
ジバッファ2上から切出して文字認識部6に送る(ステ
ップB)。
また、文字検出切出部3により、文字単位のイメージ
を検出することができなければ、イメージバッファ2上
にアンダーラインや罫線のイメージが存在するものと判
断して、その文字の検出、切出しを行えなかった範囲を
求める(ステップC)。
次に、第3図に示すように、文字の検出、切出しを行
えなかった範囲を複数の区間A、B、Cに分割する(ス
テップD)。
そして第1番目の区間Aから、イメージバッファ2上
のアンダーラインの位置を次のようにして検出する(ス
テップE)。
まず区間Aについて、黒ビットの数を高さ毎にみたヒ
ストグラムを求める。但しこの場合の処理は、第4図に
示すように、区間Aの最下端から開始し、全体の半分の
高さまでを限度として行われる。そしていずれの高さに
おいてもヒストグラムの値が第1のしきい値(th1)に
達しない場合は、ブロックアンダーライン検出失敗のフ
ラグを立てて、次の区間Bでのアンダーラインの検出を
同様に行う。
また区間Aにおいて、ヒストグラムの値が第1のしき
い値(th1)に達した場合は、次にこの第1のしきい値
(th1)よりも低レベル側に設定された第2のしきい値
(th2)で、ヒストグラムの上端および下端を求める。
そしてその上端および下端に所定のマージン(mu、md)
をそれぞれ加えた範囲を、イメージバッファ2上にてア
ンダーラインが存在する範囲(以下、これをアンダーラ
イン検出範囲と称す。)として記憶する。
続いて、第5図に示すように、アンダーライン検出範
囲aの上端の下端に、さらに所定のマージン(mu′、m
d′)を加え、これを次の区間Bでヒストグラムをとる
範囲とする。
したがって、次の区間Bでは、区間Aの場合よりも狭
い範囲内のヒストグラムの算定で済むため、効率良くイ
メージバッファ2上のアンダーラインを検出することが
できる。
なお、この区間Bで、アンダーラインを検出できなけ
れば、ブロックアンダーライン検出失敗のフラグを立て
て、次の区間Cでヒストグラムをとる範囲を少し広げ
る。
以上により全区間におけるアンダーライン検出範囲が
求められる。
さて、全ての区間についてアンダーラインの検出が終
了したら(ステップF)、次にブロックアンダーライン
検出失敗フラグを調べ、全ての区間においてアンダーラ
インの検出が失敗したか否かを判断する(ステップ
G)。
全ての区間についてアンダーラインの検出が失敗して
いたならば、アンダーライン検出失敗のフラグを立てて
(ステップH)、アンダーライン消去処理は行わない。
但し、アンダーラインの検出が1つでも成功していた
ならば(ステップI)、成功している区間との前後関係
より、検出を失敗した区間でアンダーラインが存在しそ
うな区間を判断し、この区間については、前後の区間の
アンダーライン検出範囲の中間位置的な範囲を、当該区
間におけるアンダーライン検出範囲とする(ステップ
J)。
以上により、第6図に示すように、全ての区間A、
B、Cにおけるアンダーライン検出範囲が求まる。
次に、これら全ての区間におけるアンダーライン検出
範囲内の黒ビットを全て白ビットに変換する。これによ
り、イメージバッファ2上のアンダーラインのイメージ
が消去される(ステップK)。
この後、イメージバッファ2上に残ったアンダーライ
ン消去済みの帳票イメージから、文字検出切出部3によ
り、1文字毎にイメージが検出されて切出され(ステッ
プL)、切出された文字イメージは、文字認識部4に送
られて文字認識される。
かくしてこの実施例の光学式文字読取装置によれば、
イメージバッファ2に格納された帳票イメージからアン
ダーラインや罫線のイメージを検出して、これらのイメ
ージをイメージバッファ2から消去するようにしたの
で、帳票P上の文字にアンダーラインや罫線が付されて
いても、通常の処理の場合と同様、良好に文字の検出切
出し処理を行うことができる。
[発明の効果] 以上説明したように本発明の光学式文字読取装置によ
れば、帳票上の文字にアンダーラインや罫線が付されて
いても、イメージバッファ上にてそのアンダーラインや
罫線のイメージを消去することにより、通常の処理の場
合と同様、良好に文字の検出切出し処理を行うことがで
きる。
【図面の簡単な説明】
第1図は本発明に係る一実施例の光学式文字読取装置の
構成を説明するためのブロック図、第2図は第1図の光
学式文字読取装置の全体的な処理の流れを示すフローチ
ャート、第3図は第2図の動作における帳票イメージの
分割処理を示す図、第4図は同じく第2図の動作におい
てヒストグラムを求める処理を示す図、第5図は同じく
第2図の動作においてヒストグラムを求める範囲を変更
する処理を示す図、第6図は同じく第2図の動作におい
てアンダーラインを消去する範囲を示す図である。 P……帳票、1……光電変換部、2……イメージバッフ
ァ、3……文字検出切出部、4……アンダーライン検出
部、5……アンダーライン消去部、6……文字認識部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/20 G06K 9/34

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】帳票のイメージを読取るイメージ読取手段
    と、 このイメージ読取手段により読取られた帳票イメージが
    格納されるイメージバッファと、 このイメージバッファに格納された帳票イメージから1
    文字単位のイメージを検出し切出す第1の文字検出切出
    手段と、 この第1の文字検出切出手段による1文字単位のイメー
    ジの検出、切出を行えない範囲が存在した場合に、この
    範囲のイメージを複数の区間に分割し、分割した複数の
    区間のうちの所定の1区間の下半分の範囲内で、黒ビッ
    トの数に応じたヒストグラムを求め、求めた該ヒストグ
    ラムと予め定められた閾値とに基づいて、前記所定の1
    区間の下半分の範囲の中からさらに特定の範囲を抽出
    し、抽出した該特定の範囲に所定のマージンを加えた範
    囲を、アンダーライン又は罫線のイメージが存在するア
    ンダーライン検出範囲として検出する第1の検出手段
    と、 前記第1の検出手段にて前記所定の1区間より検出され
    た前記アンダーライン検出範囲に基づいて、該所定の1
    区間に隣接する区間から順にアンダーライン検出範囲を
    求めて行き、前記分割された全ての区間のアンダーライ
    ン検出範囲を検出する第2の検出手段と、 前記イメージバッファに格納された帳票イメージから、
    前記第1又は第2の検出手段にて検出されたアンダーラ
    イン検出範囲のイメージを消去する消去手段と、 この消去手段によりイメージが消去された後の前記イメ
    ージバッファに格納されている帳票イメージから、1文
    字毎にイメージを検出し切出す第2の文字検出切出手段
    と、 前記第1又は第2の文字検出切出手段により切出された
    文字イメージから文字認識を行う文字認識手段と を具備することを特徴とする光学式文字読取装置。
JP1305026A 1989-11-22 1989-11-22 光学式文字読取装置 Expired - Lifetime JP2902694B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1305026A JP2902694B2 (ja) 1989-11-22 1989-11-22 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1305026A JP2902694B2 (ja) 1989-11-22 1989-11-22 光学式文字読取装置

Publications (2)

Publication Number Publication Date
JPH03164885A JPH03164885A (ja) 1991-07-16
JP2902694B2 true JP2902694B2 (ja) 1999-06-07

Family

ID=17940198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1305026A Expired - Lifetime JP2902694B2 (ja) 1989-11-22 1989-11-22 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JP2902694B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5357612B2 (ja) * 2009-04-13 2013-12-04 株式会社日立ソリューションズ 下線除去装置
JP2016212284A (ja) 2015-05-11 2016-12-15 富士通株式会社 採点ルールの適用対象指定プログラム、正誤判定ルール設定プログラム、採点ルールの適用対象指定方法、正誤判定ルール設定方法、適用対象指定装置および正誤判定ルール設定装置

Also Published As

Publication number Publication date
JPH03164885A (ja) 1991-07-16

Similar Documents

Publication Publication Date Title
KR20160132842A (ko) 플로우 문서를 생성하기 위한 이미지 문서 컴포넌트 검출 및 추출 기법
JP2902694B2 (ja) 光学式文字読取装置
CN111753812A (zh) 文本识别方法及设备
JP2503208B2 (ja) 名刺画像処理方法
JP2610881B2 (ja) 文字列内の文字大きさ測定方式
JP2788506B2 (ja) 文字認識装置
JPS6136874A (ja) 光学文字読取装置における訂正文字処理方法
JPH0728935A (ja) 文書画像処理装置
JP2975720B2 (ja) 光学的文字読取装置
JPS6054082A (ja) 光学文字読取装置
JPS58106665A (ja) 文字行切出し方法
JP3220226B2 (ja) 文字列方向判別方法
JP3060248B2 (ja) 表認識装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2722549B2 (ja) 光学文字読取装置
JP2832035B2 (ja) 文字認識装置
JP2590099B2 (ja) 文字読取方式
JP2972443B2 (ja) 文字認識装置
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2002015283A (ja) 分離文字列統合方法および装置
JP2987462B2 (ja) 文字方向判定装置及び文字方向判定方法
JP3190794B2 (ja) 文字切り出し装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JPH0586585B2 (ja)
JPH07168911A (ja) 文書認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080319

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090319

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100319

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100319

Year of fee payment: 11