JPH10222606A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH10222606A
JPH10222606A JP9034266A JP3426697A JPH10222606A JP H10222606 A JPH10222606 A JP H10222606A JP 9034266 A JP9034266 A JP 9034266A JP 3426697 A JP3426697 A JP 3426697A JP H10222606 A JPH10222606 A JP H10222606A
Authority
JP
Japan
Prior art keywords
character
frame
image
detecting
entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9034266A
Other languages
English (en)
Inventor
Yoshiyuki Matsuyama
好幸 松山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9034266A priority Critical patent/JPH10222606A/ja
Priority to US09/009,181 priority patent/US6142374A/en
Publication of JPH10222606A publication Critical patent/JPH10222606A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 非ドロップアウトカラーによって印刷された
文字記入枠に接触したりはみ出したりして記載された文
字を正確に切り出し認識することを可能とする。 【解決手段】 ラベリング処理部2は、1行分の文字イ
メージに対して、文字塊毎に番号を付加する。文字枠検
出部3により文字枠位置を検出、文字枠除去部4によ
り、文字枠を除去する。文字パターン欠除補正部5は、
文字枠欠除部4によって除去された文字の一部をラベリ
ング処理部2によってラベル付けされたデータを基に、
切断された端点を求め、文字の欠除部分を補正する。こ
の手段により、文字枠と文字が接触したり、はみ出した
場合でも。正確に切り出し認識することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票等に記入され
た文字の読取りを行う光学的文字読取装置に関する。
【0002】
【従来の技術】一般に、帳票等の用紙に記入された文字
を読取る光学的文字読取装置においては、帳票等の用紙
に設けられた文字記入位置を示す枠(文字記入枠)内に
記録された文字を切り出して認識している。
【0003】このために、文字記入枠が非ドロップアウ
トカラーによって印刷されている場合、文字は、文字記
入枠と接触したり、はみ出さないことが、文字記入条件
となっている。
【0004】しかし、現在は帳票と用紙への記録は、手
書きによったり、スタンプによって多く行われ、このた
めに、記録文字が、文字記入枠に接触したり、はみ出し
たりする場合が多く存在することとなる。
【0005】このような問題を解決するために、従来光
学的文字読取装置として、例えば、特開平3−2828
95号公報に記載されたものがある。
【0006】これによれば、従来の光学的読取装置は、
処理対象とする用紙に設けられた文字記入枠に記録され
た文字を、前記用紙のシートイメージを検出し、同シー
トイメージから文字パターンを切り出して文字認識処理
を行うことによって読取る場合、、前記シートイメージ
から前記文字記入枠の枠イメージを検出する枠イメージ
検出手段と、前記枠イメージ検出手段によって検出され
た枠イメージから、前記文字パターンと重複しない除去
すべき部分を検出する除去イメージ検出手段と、前記除
去すべく部分を、前記シートイメージから除去するイメ
ージ除去手段とを具備し、前記イメージ除去手段による
除去の結果得られたシートイメージから、文字パターン
の検出を行うように構成しており、このような構成によ
れば、文字記入枠と接触したり、はみ出して文字が記録
されることによって、文字パターンと枠イメージとが重
複する部分がある場合であっても、枠イメージの重複し
ない部分のみが除去され、不必要な枠イメージが除去さ
れたシートイメージが切り出され、接触等すること無く
記録された文字の文字パターンと同一の品質で文字認識
処理を行うものであるとしている。
【0007】
【発明が解決しようとする課題】しかしながら、従来の
光学的文字読取装置では、手書きによって記載された文
字やスタンプによって押された文字など、文字記入枠に
接触したり、はみ出したりする文字が存在した場合、は
み出した文字イメージから認識に不必要な文字記入枠を
除去してしまうと、文字の一部分が欠除し、文字認識結
果に影響が出てしまうことがあった。
【0008】本発明は、非ドロップアウトカラーによっ
て印刷された文字記入枠に接触したりはみ出したりして
記載された文字を正確に切り出し認識することが可能な
光学的文字読取装置を提供することを目的としている。
【0009】
【課題を解決するための手段】上記目的に鑑み、本発明
による光学的文字読取装置は、枠・文字イメージ検出手
段によって検出された文字記入枠及び文字のイメージに
ラべリング処理を施して文字塊毎にラベル付けを施すラ
べリング処理手段と、このラべリング処理手段によって
ラベル付けされたデータを基に、文字枠除去手段によっ
て除去された文字の欠如部分を補正する文字パターン欠
如補正手段と、この文字パターン欠如補正手段によって
文字記入枠に重なった文字イメージの塊を検出して、文
字パターンの検出を行う文字パターン切り出し手段とを
有することを特徴とする。
【0010】これにより、非ドロップアウトカラーによ
って印刷された文字記入枠に接触したりはみ出したりし
て記載された文字を正確に切り出し認識することが可能
となった。
【0011】
【発明の実施の形態】請求項1記載の光学的文字読取装
置は、帳票等の処理対象用紙に印刷された文字記入枠内
に記録された文字を、前記処理対象用紙のシートイメー
ジを検出し、同シートイメージから文字パターンを切り
出して文字認識処理を行って、読取る光学的文字読取装
置が、前記処理対象用紙のシートイメージから前記文字
記入枠及び文字のイメージを検出する枠・文字イメージ
検出手段と、この枠・文字イメージ検出手段によって検
出された文字記入枠及び文字のイメージにラべリング処
理を施して文字塊毎にラベル付けを施すラべリング処理
手段と、前記枠・文字イメージ検出手段によって検出さ
れた文字記入枠及び文字のイメージから文字記入枠位置
を検出する文字記入枠検出手段と、前記文字記入枠検出
手段によって検出された文字記入枠位置データに基づい
て文字記入枠を除去する文字枠除去手段と、前記文字枠
除去手段によって除去された文字の欠如部分を、前記ラ
べリング処理手段によってラベル付けされたデータを基
に補正する文字パターン欠如補正手段と、前記文字パタ
ーン欠如補正手段によって文字記入枠に重なった文字イ
メージの塊を検出して、文字パターンの検出を行う文字
切り出し手段とを、前記文字切り出し手段によって切り
出された文字イメージと標準文字パターンとのマッチン
グを行って、文字を認識する文字認識手段とを、有して
構成することを特徴とするものである。
【0012】次に、本発明の実施の形態について、図面
を参照しながら説明する。
【0013】図1は、本発明の実施の形態の主要部分の
構成を示すブロック図である。処理対象となる帳票は光
学的に走査することによって帳票イメージを得る。
【0014】1は、ラインバッファーで、この帳票イメ
ージから文字と文字記入枠が記載されている1行分のイ
メージを検出し、格納している枠・文字イメージ検出手
段を構成する。
【0015】2は、ラべリング処理部で、ラインバッフ
ァー1に格納された1行分のイメージにラベリング処理
を施して文字塊毎に番号を付けるラベリング処理手段を
構成している。
【0016】3は、文字記入枠検出部で、ラインバッフ
ァー1に格納された1行分の文字イメージから縦・横方
向の射影ヒストグラムをとり、文字枠位置を検出する文
字記入枠検出手段を構成する。
【0017】4は、文字枠除去部で、文字枠検出部3に
よって検出された文字枠位置から文字枠を除去する文字
枠除去手段を構成している。
【0018】5は、文字パターン欠除補正部で、文字枠
除去部4によって除去された文字の一部をラベリング処
理部2によってラベル付けされたデータを基に、文字の
欠除部分を補正する文字パターン欠如補正手段を構成す
る。
【0019】6は、文字切り出し部で、文字パターン欠
除補正部5で補正された文字イメージをラベル付けされ
た文字塊毎に切り出す文字切り出し手段を構成する。
【0020】7は、文字認識部で、文字切り出し部6に
より切り出された文字イメージと標準文字パターンとの
マッチングが行われ、その結果が文字認識結果として出
力する文字認識手段を構成している。
【0021】以上のように構成する実施の形態につい
て、図2乃至図5を参照しながら、図6に記載されたフ
ローチャートに基づいて、その動作を説明する。
【0022】図2は、帳票等の文字記入枠が存在する処
理対象用紙に記載された1行分の文字イメージの例を示
している。
【0023】この1行分の文字イメージが、ラインバッ
ファー1に格納される(f1)。
【0024】次に、ラベリング処理部2によって、文字
イメージは、黒画素の塊毎に、ラベル番号が付加される
(f2)。これは、ある位置にある黒画素を考えたき、
これに接する上、下、右、左上、左下、右上、右下の黒
画素にも同じラベル番号を付加し、文字イメージの塊を
分類する操作である。
【0025】次に、文字枠検出部3では、ラインバッフ
ァー1に格納された1行分の文字イメージから縦・横方
向の射影ヒストグラムをとり(f3)、縦枠線と横枠線
の位置を検出する(f4)。この枠線の位置の判定は、
ヒストグラム値が前もって縦・横方向それぞれ設定した
閾値を越えた場合に、枠線が存在すると判定する。
【0026】図3、図4は、それぞれ図2の縦方向・横
方向の射影ヒストグラムをとった一例であり、図中のa
〜hの位置が枠線の存在する位置である。
【0027】文字枠除去部4は、前記射影ヒストグラム
より得られた枠線位置から文字記入枠を除去する(f
5)。文字パターン欠除補正部5では、文字枠除去によ
って切除された文字イメージを補正する。
【0028】図5は、図2の一部を拡大して示すもの
で、文字パターン欠如補正部5によって文字枠除去後、
切除された文字イメージを補正する動作をの一例を示す
図である。領域8は縦枠線を示しており、文字枠除去4
部により黒画素が白画素に変換されて、枠線が除去され
ている。画素の中に記されている数字は、ラベル番号を
示している。
【0029】まず、あるラベル番号、例えば、ラベル番
号1に注目して、縦枠線の1画素左の縦ラインを上から
下に操作し(f6)、ラベル番号1が連続している部分
を探索し、その始点と終点との組み合わせを求める(f
7)。
【0030】この例では、始点と終点との組は、点1p
1と点1p2、点1p3と点1p4、点1p5と点1p
6である。また、この点のアドレス(横方向x、縦方向
y)も記憶しておく。
【0031】同様にして、縦枠線の1画素右の縦ライン
を上から下に走査し、始点と終点との組み点rp1と点
rp2、点rp3とrp4点、点rp5と点rp6とを
求める。
【0032】次に、左側の始点1p1、1p3、1p5
のそれぞれについて、y座標の値が右側の始点rp1、
rp3、rp5のy座標の値のどれに最も近いかを求
め、切断された点のペアを求める(f8)。
【0033】この例では、始点1p1とrp1、1p3
とrp3、1p5とrp5が互いにペアとなり、終点の
1p2とrp2、1p4とrp4、1p6とrp6とが
ペア値なる。
【0034】次に、このペア2点のアドレスから傾き
を、整数値(少数定位以下は切り捨て)sw求め(f
9)、縦枠線の1画素左にある始点または終点から出発
して、1画素右の位置から傾き分上下に移動した位置を
黒画素(ラベル番号1)にする。この黒画素にした位置
から同様の操作を繰り返し、縦枠線の最右側ラインまで
継続する。
【0035】図5の点1p1と点rp1のペアで考える
と、傾きは4(画素)/4(画素)=1で、点w1、w
2、w3が黒画素(ラベル番号1)となる。
【0036】同様に、点1ptと点rp2のペアについ
ても行い、点w4、w5、w6が黒画素(ラベル番号
1)になる。
【0037】この後、点w1とw4との間、点w2と点
w5の間、点w3とw6の間も、黒画素(ラベル番号
1)にする(f10)。
【0038】この操作をすべての縦枠線左右の2点のペ
アについて行い、文字パターン欠除の補正が完了する。
横枠線に対する処理も同様に実施可能である。
【0039】切り出し部6では、文字パターン欠除補正
部5で出力されたイメージを基に、ラベル付けされた文
字塊毎に切り出す(f11)。図5の例では、ラベル番
号1の塊を1文字として切り出す。この切り出された文
字イメージは、標準パターン辞書に格納されている文字
の標準パターンとマッチングが行われ、その結果が文字
認識結果として出力される(f12)。
【0040】
【発明の効果】以上のように、本発明によれば、文字パ
ターン欠除補正手段を設けることにより、非ドロップア
ウトカラーによって印刷された文字記入枠に接触した
り、はみ出したりして記載された文字を正確に切り出し
認識することが可能となる等、光学的文字読取装置とし
て優れた効果を発揮することとなる。
【図面の簡単な説明】
【図1】本発明の実施の形態における主要部分の構成を
示すブロック図。
【図2】本発明の実施の形態における帳票等の処理対象
用紙に記載された1行分の文字イメージの例を示す図。
【図3】本発明の実施の形態における縦方向の射影ヒス
トグラムの例を示す図。
【図4】本発明の実施の形態における横方向の射影ヒス
トグラムの例を示す図。
【図5】本発明の実施の形態における横方向の文字パタ
ーン欠除補正部の動作の説明図。
【図6】本発明の実施の形態における動作説明のための
フロー図。
【符号の説明】
1 ラインバッファー(枠・文字イメージ検出手段) 2 ラベリング処理部(ラベリング手段) 3 文字枠検出部(文字枠検出部) 4 文字枠除去部(文字枠除去手段) 5 文字パターン欠除補正部(文字パターン欠除補正
部) 6 文字切り出し部(文字切り出し手段) 7 文字認識部(文字認識手段)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 帳票等の処理対象用紙に印刷された文字
    記入枠内に記録された文字を、前記処理対象用紙のシー
    トイメージを検出し、同シートイメージから文字パター
    ンを切り出して文字認識処理を行って、読取る光学的文
    字読取装置が、 前記処理対象用紙のシートイメージから前記文字記入枠
    及び文字のイメージを検出する枠・文字イメージ検出手
    段と、 この枠・文字イメージ検出手段によって検出された文字
    記入枠及び文字のイメージにラべリング処理を施して文
    字塊毎にラベル付けを施すラべリング処理手段と、 前記枠・文字イメージ検出手段によって検出された文字
    記入枠及び文字のイメージから文字記入枠位置を検出す
    る文字記入枠検出手段と、 前記文字記入枠検出手段によって検出された文字記入枠
    位置データに基づいて文字記入枠を除去する文字枠除去
    手段と、 前記文字枠除去手段によって除去された文字の欠如部分
    を、前記ラべリング処理手段によってラベル付けされた
    データを基に補正する文字パターン欠如補正手段と、 前記文字パターン欠如補正手段によって文字記入枠に重
    なった文字イメージの塊を検出して、文字パターンの検
    出を行う文字切り出し手段とを、 前記文字切り出し手段によって切り出された文字イメー
    ジと標準文字パターンとのマッチングを行って、文字を
    認識する文字認識手段とを、 有して構成することを特徴とする光学的文字読取装置。
JP9034266A 1997-01-20 1997-02-04 光学的文字読取装置 Pending JPH10222606A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9034266A JPH10222606A (ja) 1997-02-04 1997-02-04 光学的文字読取装置
US09/009,181 US6142374A (en) 1997-01-20 1998-01-20 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9034266A JPH10222606A (ja) 1997-02-04 1997-02-04 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPH10222606A true JPH10222606A (ja) 1998-08-21

Family

ID=12409376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9034266A Pending JPH10222606A (ja) 1997-01-20 1997-02-04 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH10222606A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110136B1 (en) 1999-11-22 2006-09-19 Sharp Kabushiki Kaisha Reading apparatus and data processing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110136B1 (en) 1999-11-22 2006-09-19 Sharp Kabushiki Kaisha Reading apparatus and data processing system

Similar Documents

Publication Publication Date Title
US7965293B2 (en) Image processing device, image processing method, and image processing program for reconstructing data
JP4867401B2 (ja) 画像処理装置及びプログラム
JPH10222606A (ja) 光学的文字読取装置
JP7406884B2 (ja) 情報処理装置、プログラム及び制御方法
WO2001013324A1 (fr) Procede de traitement de documents, support d'enregistrement d'un programme de traitement de documents et dispositif de traitement de documents
JP2000082110A (ja) 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体
JP3348224B2 (ja) 表枠線の交点補正装置および表認識装置および光学文字読取装置
JP3794285B2 (ja) 光学式文字読取装置
JP3954247B2 (ja) 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置
JP4867400B2 (ja) 画像処理装置及びプログラム
JP3613356B2 (ja) 楽譜認識装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JPS5949671A (ja) 光学的文字読取装置
JPH11282958A (ja) 文字認識方法及び装置並びに記録媒体
JP3047857B2 (ja) 光学式文字読み取り装置
JP3239965B2 (ja) 文字認識装置
JP2721415B2 (ja) 文字画像抽出方法
JPH10162104A (ja) 文字認識装置
JPH01144181A (ja) 光学的文字読取装置
JPH07282190A (ja) 光学文字読取装置
JPH02128292A (ja) 光学文字読取装置
JPH02193278A (ja) 画像処理装置
JPH1153469A (ja) 文字切り出し装置、光学式文字読取装置及び記録媒体
JPS6361387A (ja) 文字切り出し方法
JPH06333089A (ja) 光学文字読取装置