JPH10208043A - 枠線検出装置 - Google Patents

枠線検出装置

Info

Publication number
JPH10208043A
JPH10208043A JP9007280A JP728097A JPH10208043A JP H10208043 A JPH10208043 A JP H10208043A JP 9007280 A JP9007280 A JP 9007280A JP 728097 A JP728097 A JP 728097A JP H10208043 A JPH10208043 A JP H10208043A
Authority
JP
Japan
Prior art keywords
character
frame
frame line
line
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9007280A
Other languages
English (en)
Inventor
Yoshiyuki Matsuyama
好幸 松山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9007280A priority Critical patent/JPH10208043A/ja
Priority to US09/009,181 priority patent/US6142374A/en
Publication of JPH10208043A publication Critical patent/JPH10208043A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 帳票に印刷された文字記入枠を少ないデータ
表現で正確に検出し、文字記入枠に接触したりはみ出し
たりして記載された文字を正確に切り出すとこ可能にす
る。 【解決手段】 枠幅検出部3により枠線の幅を検出し、
枠直線式算出部4により枠線の境界直線式を算出するこ
とにより枠線を少ないデータ表現で正確に検出する。文
字接触判定部5、コーナ点生成部6及び文字領域検出部
7により枠線に接している文字を枠線状の矩形領域とし
て出力することで枠線に接触したり枠線からはみ出して
記載された文字を正確に切り出す。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、帳票等に記載され
た文字の読み取りを行う光学的文字読取装置における枠
線検出装置に関する。
【0002】
【従来の技術】一般に、帳票等に記載された文字の読み
取りを行う光学的文字読取装置においては、帳票に印刷
された文字記入枠内に記載された文字を切り出して認識
している。このため、文字記入枠が非ドロップアウトカ
ラーによって印刷されている場合には、文字が文字記入
枠と接触したり、文字記入枠からはみ出さないように記
載しなければならないという制限がある。
【0003】しかるに、現在では手書きによって記載さ
れた文字やスタンプによって押された文字なども多くな
ってきているため、文字記入枠に接触したり、文字記入
枠からはみ出したりする文字も存在することがある。こ
のような文字記入枠に接触したり、文字記入枠からはみ
出した文字イメージをそのまま切り出したのでは、認識
に不要な文字記入枠が残ってしまい、文字認識結果に影
響が出てしまう。
【0004】
【発明が解決しようとする課題】このように従来の光学
的文字読取装置においては、文字が文字記入枠に接触し
たり、文字記入枠からはみ出した場合、特別な処理を施
していないため、文字認識結果に影響が出るという問題
があった。従って、帳票に記載されている文字位置を特
定する目安とするため、あるいは枠線に接触したり、枠
線からはみ出して記載された文字を正確に切り出すため
に枠線の位置を正確に検出する必要があった。
【0005】本発明は、このような従来の問題を解決す
もので、帳票に印刷された文字記入枠を少ないデータ表
現で正確に検出でき、かつ文字記入枠線上の文字存在領
域を探索することにより、枠線に接触したりはみ出した
りして記載された文字を正確に切り出して認識すること
が可能な枠線検出装置を提供することを目的とする。
【0006】
【課題を解決するための手段】この課題を解決するため
に本発明の枠線検出装置は、帳票イメージの枠線付近の
マスク領域を走査することにより枠に垂直な方向の黒画
素連続数を計数し、該黒画素連続数のヒストグラムから
枠線の幅を検出する枠線幅検出手段と、枠線幅検出手段
により検出した枠線の幅を基に該幅に合致する枠両端点
の集合から最小2乗法により枠線の直線式を算出する枠
直線式算出手段とを備えるものである。
【0007】これにより、帳票に印刷された文字記入枠
を少ないデータ表現で正確に検出でき、かつ文字記入枠
線上の文字存在領域を探索することにより、枠線に接触
したりはみ出したりして記載された文字を正確に切り出
して認識することが可能になる。
【0008】
【発明の実施の形態】本発明の請求項1の記載の発明
は、文字や枠線が記載されている帳票イメージから枠線
を検出する枠線検出装置であって、前記帳票イメージの
枠線付近のマスク領域を走査することにより枠に垂直な
方向の黒画素連続数を計数し、該黒画素連続数のヒスト
グラムから枠線の幅を検出する枠線幅検出手段と、前記
枠線幅検出手段により検出した枠線の幅を基に該幅に合
致する枠両端点の集合から最小2乗法により枠線の直線
式を算出する枠直線式算出手段とを備えるものであり、
帳票イメージの枠線位置を少ないデータ量で正確に認識
することができる。
【0009】本発明の請求項2の記載の発明は、文字や
枠線が記載されている帳票イメージから枠線を検出する
枠線検出装置であって、枠境界線上を走査し、枠線上に
文字が接しているかを判定する文字接触判定手段と、前
記文字接触判定手段が枠線上に文字が接しているを判定
した時に得られた情報を基に枠線と文字とが交わる交差
点(コーナ点)を生成するコーナ点生成手段と、前記コ
ーナ点生成手段により生成されたコーナ点データから枠
線上の文字の存在領域を矩形で検出して出力する文字領
域検出手段とを備えるものであり、文字記入枠線上の文
字存在領域を探索することにより、枠線に接触したりは
み出したりして記載された文字を正確に切り出して認識
することが可能になる。
【0010】以下、本発明の実施の形態について、図1
乃至図9用いて説明する。図1は、本発明の枠線検出装
置を適用した実施の形態における光学的文字読取装置の
構成を示すブロック図である。同図において、イメージ
読込部1は、処理対象となる帳票を光学的に走査するこ
とによって得られる帳票イメージデータを格納するもの
である。枠線マスク領域検出部2は、イメージ読込部1
によって得られた帳票イメージから縦・横方向の射影ヒ
ストグラムを取り、凡その枠線位置領域を検出するもの
である。枠幅検出部3は、枠線マスク領域検出部2で得
られた枠線位置領域から枠線に垂直な方向の黒画素連続
数を検出し、黒画素連続数のヒストグラムから枠線の枠
幅(一定値)を求めるものである。枠直線式算出部4
は、枠幅検出部3で求められた枠幅値に一致するサンプ
ル点から最小2乗法を用いて枠線の境界直線式を求める
ものである。
【0011】文字接触判定部5は、枠直線式算出部4で
算出された枠線の境界直線式を基に境界線上の点を走査
することにより、境界線の点毎に文字接触が存在するか
を判定するものである。コーナ点生成部6は、文字接触
判定部5が境界線の点毎に文字接触の存在を判定した時
に得られるデータを基に、境界線と文字との交差点(コ
ーナ点)を生成する。文字領域検出部7は、コーナ点生
成部6で生成されたコーナ点情報から枠線に接している
文字領域を枠線上の矩形領域として出力する。
【0012】以上述べた枠幅検出部3、枠直線式算出部
4、文字接触判定部5、コーナ点生成部6及び文字領域
検出部7が枠線検出部10を構成する。
【0013】また、文字切出部8は、枠線検出部10で
得られた情報を基に文字接触がない枠線を消去すること
により、1文字毎に文字を切り出すものである。文字認
識部9は、文字切出部8によって切り出された文字イメ
ージと標準文字パターンとのマッチングを行い、その結
果が文字認識結果として出力される。
【0014】以上のように構成された枠線検出装置の動
作について、図2乃至図9を参照して説明する。
【0015】図2は、帳票等の文字記入枠の存在する処
理対象用紙に記載された文字イメージの例を示し、この
帳票イメージがイメージ読込部1によって読み込まれ格
納される。次に、枠線マスク領域検出部2では、イメー
ジ読込部1によって読み込まれた帳票イメージから縦・
横方向の射影ヒストグラムを取り、縦枠線と横枠線の位
置を検出する。この枠線位置の判定は、ヒストグラム値
が前以て縦・横方向それぞれに設定した閾値を超えた場
合に枠線が存在すると判定する。
【0016】図3及び図4はそれぞれ図2の縦方向・横
方向の射影ヒストグラムを取った例を示す。図中のa〜
hの位置が枠線の存在する位置である、これにより、多
少のマージンを加えた枠線を包含する矩形領域(枠線マ
スク領域)が検出される。枠幅検出部3は、枠線マスク
領域検出部2で検出された枠線マスク領域内の枠線に垂
直な方向の黒画素連続数を計数し、黒画素連続数のヒス
トグラムの最大値を枠線の幅とする。
【0017】図5は縦枠線の一部を拡大して示した説明
図であり、図6は図5に示す枠線に垂直な方向の黒画素
連続数の度数ヒストグラムである。
【0018】図5の例では、図6のヒストグラムの最大
値から枠幅を「3」とする。この過程において、枠線方
向のサンプル数を適当な間引き間隔で減らすことによっ
ても枠幅値を検出できる。この場合、枠線が実線でなく
破線となっている時でも検出可能である枠直線式算出部
4は、枠幅検出部3で求められた枠幅値に一致するサン
プル点から枠線の境界直線式を求める。図5の例では、
縦枠線の左側境界直線式は同図の丸で囲んだ「 」の点
集合から最小2乗法を用いて直線式の傾きと切片の値を
算出する。縦枠線の右側境界直線式も同様にして丸で囲
んだ「r」の点集合から最小2乗法を用いて直線式の傾
きと切片の値を算出する。帳票全体の全枠線の境界直線
式が求められると、枠線同士の交差部分の矩形頂点座標
が境界直線式同士の交点として求められる、この求めら
れた交点座標から、少ないデータ量で枠線の存在領域を
表わすことができる。
【0019】図7は、枠線の存在領域を説明するための
図を示している。同図において、p1〜p24は枠線同
士の交差部分の矩形頂点座標であり、l1〜l5は枠線
を表わしている。図7の場合、枠線l1の存在領域は、
p1,p2,p7,p8を結ぶ矩形領域であり、枠線l
4の存在領域は、p1,p18,p19,p4を結ぶ矩
形領域である。
【0020】従って、本発明の実施の形態によれば、枠
幅検出部3と枠直線式算出部4により、枠線の存在領域
を少ないデータ量で確実に検出することができる。
【0021】次に、文字記入枠に接触したり、文字記入
枠からはみ出して記載された文字の切り出し認識する場
合の動作について、図8及び図9を参照して説明する。
【0022】文字接触判定部5は、枠直線式算出部4で
算出された枠線の境界直線式を基に枠境界線上の点毎
に、枠線の外側に特定の画素、例えば2画素連続して黒
画素が存在するときに、その境界線上の点に文字接触し
ていると判定する。
【0023】図8は、枠境界線上の文字接触判定を説明
するための図である。図中の「0」は文字が接触してい
ない点であり、「1」は文字が接触している点である。
この場合、枠線の外側に2画素連続して黒画素がある時
に文字接触があると判定している。
【0024】コーナ点生成部6は、文字接触判定部5で
判定した結果から枠線と文字との交差点にコーナ点を生
成する。具体的には、図8の枠境界線上において上から
下にみて、「0」から「1」に変わる点を(x,y)と
すると、左側境界線の場合(x−1,y−1)の点(c
s1)に、右側境界線の場合(x+1,y−1)の点
(cs2)にコーナ点(枠→文字のコーナ点と呼ぶ)を
それぞれ設ける。また、「0」から「1」に変わる点を
(x,y)とすると、左側境界線の場合(x−1,y)
の点(ce1)に、右側境界線の場合(x+1,y)の
点(ce2)にコーナ点(文字→枠のコーナ点と呼ぶ)
をそれぞれ設ける。
【0025】文字領域検出部7は、コーナ点生成部6で
生成されたコーナ点情報から枠線に接している文字領域
を枠線上の矩形領域として出力する。図9は枠線上の文
字領域検出を説明するための図を示している。この図9
において、cs3,cs4,cs5,cs6は枠→文字
のコーナ点であり、ce3,ce4,ce5,ce6は
文字→枠のコーナ点である。枠→文字のコーナ点とその
下にある最初の文字→枠のコーナ点がペアーとなる。こ
の場合、cs3とce3、cs4とce4、cs5とc
e5、cs6とce6がペアーとなる。
【0026】また、縦枠線の場合は、ペアーのコーナ点
を包含する矩形を枠線上の文字領域として出力する。図
9の例では、cs3,ce3,cs4,ce4を包含す
る矩形k1とcs5,ce5,cs6,ce6を包含す
る矩形k2が枠線上の文字領域となる。
【0027】一方、文字切出部8は、枠線検出部10で
得られた情報を基に文字接触がない枠線を消去すること
により、1文字毎に文字を切り出すし、文字認識部9
は、文字切出部8によって切り出された文字イメージと
標準文字パターンとのマッチングを行い、その結果が文
字認識結果として出力される。
【0028】以上のように、文字接触判定部5、コーナ
点生成部6及び文字領域検出部7により、文字記入枠に
接触したり、文字記入枠からはみ出して記載された文字
も正確に切り出し認識することができる。
【0029】
【発明の効果】以上のように本発明によれば、帳票に印
刷された文字記入枠を少ないデータ表現で正確に検出で
きるとともに、文字記入枠線上の文字存在領域を探索す
ることにより、文字記入枠に接触したり、文字記入枠か
らはみ出して記載された文字も正確に切り出し認識する
ことができるという効果を有する。
【図面の簡単な説明】
【図1】本発明の枠線検出装置を適用した実施の形態に
おける光学的文字読取装置の構成を示すブロック図
【図2】本発明の実施の形態における帳票等の処理対象
用紙に記載された文字イメージの例を示す図
【図3】本発明の実施の形態における縦方向の射影ヒス
トグラム図
【図4】本発明の実施の形態における横方向の射影ヒス
トグラム図
【図5】本発明の実施の形態における枠幅検出部及び枠
直線式算出部の動作説明のための縦枠線の一部の拡大図
【図6】本発明の実施の形態における枠幅検出部の動作
説明のための黒画素連続数の度数ヒストグラム図
【図7】本発明の実施の形態における枠直線式算出部の
動作説明のための枠線存在領域を示す図
【図8】本発明の実施の形態における文字接触判定部及
びコーナ点生成部の動作説明のための図
【図9】本発明の実施の形態における文字領域検出部の
動作説明のための図
【符号の説明】
1 イメージ読込部 2 枠線マスク領域検出部 3 枠幅検出部 4 枠直線式算出部 5 文字接触判定部 6 コーナ点生成部 7 文字領域検出部 8 文字切出部 9 文字認識部 10 枠線検出部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文字や枠線が記載されている帳票イメー
    ジから枠線を検出する枠線検出装置であって、 前記帳票イメージの枠線付近のマスク領域を走査するこ
    とにより枠に垂直な方向の黒画素連続数を計数し、該黒
    画素連続数のヒストグラムから枠線の幅を検出する枠線
    幅検出手段と、前記枠線幅検出手段により検出した枠線
    の幅を基に該幅に合致する枠両端点の集合から最小2乗
    法により枠線の直線式を算出する枠直線式算出手段とを
    備えることを特徴とする枠線検出装置。
  2. 【請求項2】 文字や枠線が記載されている帳票イメー
    ジから枠線を検出する枠線検出装置であって、 枠境界線上を走査し、枠線上に文字が接しているかを判
    定する文字接触判定手段と、前記文字接触判定手段が枠
    線上に文字が接しているを判定した時に得られた情報を
    基に枠線と文字とが交わる交差点(コーナ点)を生成す
    るコーナ点生成手段と、前記コーナ点生成手段により生
    成されたコーナ点データから枠線上の文字の存在領域を
    矩形で検出して出力する文字領域検出手段とを備えるこ
    とを特徴とする枠線検出装置。
JP9007280A 1997-01-20 1997-01-20 枠線検出装置 Pending JPH10208043A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9007280A JPH10208043A (ja) 1997-01-20 1997-01-20 枠線検出装置
US09/009,181 US6142374A (en) 1997-01-20 1998-01-20 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9007280A JPH10208043A (ja) 1997-01-20 1997-01-20 枠線検出装置

Publications (1)

Publication Number Publication Date
JPH10208043A true JPH10208043A (ja) 1998-08-07

Family

ID=11661630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9007280A Pending JPH10208043A (ja) 1997-01-20 1997-01-20 枠線検出装置

Country Status (1)

Country Link
JP (1) JPH10208043A (ja)

Similar Documents

Publication Publication Date Title
JPH08287184A (ja) 画像切り出し装置及び文字認識装置
JPH10208043A (ja) 枠線検出装置
JPH03263282A (ja) 文字読取装置の文字切出し方法
JPH07220081A (ja) 画像認識装置の図形の切出し方法
JP4242962B2 (ja) 文字切出装置
JPH04112283A (ja) 画像処理方法及び装置
JPH07230526A (ja) 文字読取装置
JP7532124B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP4159071B2 (ja) 画像処理方法,画像処理装置および該処理方法を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0728935A (ja) 文書画像処理装置
JPH10124670A (ja) 図面認識方法
JP3113217B2 (ja) 破線認識方法
JP3190794B2 (ja) 文字切り出し装置
JPH09179982A (ja) 特定パターン検出方法
JPH11250256A (ja) 図形認識処理方法及びそのプログラムを記録した記録媒体
JP3039427B2 (ja) 文字切り出し方式及び方法
JPH06266893A (ja) 光学文字読取装置
JP2982221B2 (ja) 文字読み取り装置
JP2925270B2 (ja) 文字読取装置
JPH0467674B2 (ja)
JPH0711816B2 (ja) 文字切り出し方法
JP2983448B2 (ja) 図面認識方法
JPH02189696A (ja) 光学文字読取装置
JPH0798747A (ja) 文字切出し装置
JPH08171609A (ja) 文字列高速抽出装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050105