JPH09185676A - 罫線除去方法 - Google Patents

罫線除去方法

Info

Publication number
JPH09185676A
JPH09185676A JP7352144A JP35214495A JPH09185676A JP H09185676 A JPH09185676 A JP H09185676A JP 7352144 A JP7352144 A JP 7352144A JP 35214495 A JP35214495 A JP 35214495A JP H09185676 A JPH09185676 A JP H09185676A
Authority
JP
Japan
Prior art keywords
ruled line
ruled
input image
lines
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7352144A
Other languages
English (en)
Other versions
JP3830998B2 (ja
Inventor
Hideo Horiuchi
秀雄 堀内
Yoshimasa Iwata
義正 岩田
Kenji Mishima
健司 三縞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP35214495A priority Critical patent/JP3830998B2/ja
Priority to US08/771,055 priority patent/US5896464A/en
Publication of JPH09185676A publication Critical patent/JPH09185676A/ja
Application granted granted Critical
Publication of JP3830998B2 publication Critical patent/JP3830998B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】文字と罫線が一部で接触あるいは重なった二値
画像や濃淡画像から罫線を確実・容易に除去できる罫線
除去方法を提供する。 【解決手段】文字と罫線を含む入力画像から罫線を除去
する方法において、入力画像中の罫線の存在範囲を特定
し、その特定した罫線存在範囲内の罫線に対して垂直の
方向に存在する連続した有意画素領域のうち罫線の幅に
相当する所定の幅の黒画素領域のみを罫線と見なして除
去する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば文字と罫線
を含む帳票などをスキャナで読み取って電子化した入力
画像から罫線を除去する方法に係り、特に文字と非ドロ
ップアウトカラーの罫線が重なっている領域においても
罫線を確実に除去して文字のみを抽出できる罫線除去方
法に関する。
【0002】
【従来の技術】各種伝票類などの帳票を読み取る光学的
文字読み取り装置(以下、OCRという)は、従来では
帳票上にドロップアウトカラーで印刷された記入枠に書
かれた文字を読み取るものがほとんどであった。これに
対し、近年では様々な帳票が簡易に作成されるようにな
り、記入枠が非ドロップアウトカラーで印刷された帳票
も出現しているため、非ドロップアウトカラーの記入枠
に書かれた文字を読み取るニーズが高まってきている。
【0003】記入枠が非ドロップアウトカラーで印刷さ
れた帳票を読み取るためのOCRでは、文字と罫線が重
なっている場合にその画像から記入枠を構成する罫線を
除去し、文字のみを抽出して認識する必要がある。この
ような帳票から罫線を除去する技術は、例えば特公平6
−97471(以下、公知文献1という)に開示されて
いる。この公知文献1の方式では、図1に示すような記
入枠と文字が重なっている入力画像について、記入枠の
内側の輪郭線に沿って強制的に切断することによって記
入枠を除去した図2(a)に示す画像と、切断開始点と
終点から外側の輪郭線にまっすぐ伸ばした線によって切
断することによって記入枠を除去した図2(b)に示す
画像を作成し、この画像から文字を認識している。
【0004】しかし、公知文献1の方式では図3(a)
に示すように記入枠が一辺において文字部と3つ以上の
個所で接触している場合には、図3(b)に示すように
記入枠の罫線を除去しきれず、罫線が付加されたまま文
字を抽出してしまうという問題があった。
【0005】また、この方式では図4に示すように文字
が記入枠の多数の辺と接触している場合には、図5に示
すように枠線を除去した画像として何通りもの画像が作
成され、これが文字認識対象の候補画像となる。しか
し、文字認識は一般に演算量が多くいわゆる重い処理で
あるため、このように候補画像が多くなると演算時間が
かかり過ぎるという問題がある。
【0006】さらに、文字認識において図3(b)の場
合では「2」と認識しなければならないところを文字に
付加されたままの罫線の存在のために「8」と誤読して
しまったり、また図5に示したように多数の候補画像を
認識することになると、誤読の可能性が高くなるという
問題があった。
【0007】一方、濃淡画像から罫線を除去する方法と
しては、例えば電子通信学会論文誌’80/4 Vo
l.J63−D,No.4,pp.349−356「自
動しきい値選定法」(以下、公知文献2という)に記載
されているように、文字と罫線の濃度差を利用して、所
定のしきい値により二値化することで両者を分離し、罫
線の濃度を持つ画素のみを除去する方法が提案されてい
る。しかし、この公知文献2の方法は文字が濃く、罫線
が薄い画像、つまり文字と罫線の濃度差が大きい濃淡画
像の場合は、二値化しきい値から文字と罫線を分離する
ことができるが、文字と罫線の濃度差が十分にない場合
には分離が難しい。
【0008】
【発明が解決しようとする課題】上述したように従来の
二値画像に適用される罫線除去方法では、罫線が文字部
と多数の個所で接触している二値画像については、罫線
の除去を確実に行うことができず、罫線部分が残ったま
ま文字を抽出してしまったり、また何通りもの罫線除去
画像が認識対象の候補画像として生成されるために演算
時間がかかり過ぎるという問題があり、さらに罫線をつ
けたままの文字や何通りもの候補画像を認識するために
誤読の可能性が高くなるという問題もあった。
【0009】また、濃淡画像に適用される罫線除去技術
として、文字と罫線の濃度差を利用してしきい値により
二値化することにより両者を分離し、罫線の濃度を持つ
画素のみを除去する方法では、文字と罫線の濃度差が大
きくない場合には罫線を確実に除去することは難しいと
いう問題があった。
【0010】本発明は、文字と罫線が一部で接触あるい
は重なった二値画像や濃淡画像から罫線を確実・容易に
除去できる罫線除去方法を提供することを目的とする。
【0011】
【課題を解決するための手段】上記の課題を解決するた
め、本発明に係る第1の罫線除去方法は、入力画像中の
罫線の存在する範囲を特定し、その特定した罫線存在範
囲内の罫線に対して垂直の方向に存在する連続した有意
画素領域のうち罫線の幅に相当する所定の幅の有意画素
領域のみを罫線と見なして除去することを特徴とする。
【0012】この第1の罫線除去方法においては、罫線
の存在範囲を特定した後、罫線の幅に相当する有意画素
領域のみを除去するため、例えば文字を貫通する形で罫
線が重なっている領域でも、罫線が確実に除去される。
【0013】本発明に係る第2の罫線除去方法は、入力
画像中の罫線の存在する範囲を特定すると共に、その特
定した罫線存在範囲から外側に延びている文字部分の輪
郭線の方向に沿って入力画像中の罫線を切断または仮想
的に切断した後、特定した罫線存在範囲内の罫線に対し
て垂直の方向に存在する連続した有意画素領域のうち罫
線の幅に相当する所定の幅の有意画素領域のみを罫線と
見なして除去することを特徴とする。また、第2の罫線
除去方法において、入力画像中の罫線の一部を含む部分
の輪郭線を求め、特定した罫線存在範囲の外側に存在す
る有意画素領域の輪郭から輪郭線の方向を推定すること
を特徴とする。
【0014】この第2の罫線除去方法では、文字部分の
輪郭線の方向に沿って入力画像中の罫線を切断または仮
想的に切断した後、第1の罫線除去方法と同様の処理を
行うことにより、罫線除去後の文字部分において罫線と
重なった領域付近に出っぱり途切れが生じることがな
く、文字認識がより容易となる。
【0015】本発明に係る第3の罫線除去方法は、文字
と罫線を含む入力画像上に罫線と交差する方向にしきい
値を分布させ、このしきい値を用いて入力画像をしきい
値処理することにより入力画像から罫線を除去する方法
において、しきい値を罫線の部分で凸型をなす形状に分
布させたことを特徴とする。さらに、第3の罫線除去方
法において、罫線の部分で凸型をなすしきい値を罫線の
端部付近で傾斜した形状に分布させたことを特徴とす
る。
【0016】この第3の罫線除去方法においては、文字
と罫線を分離するためのしきい値の分布を罫線の部分で
凸型とすることにより、文字と罫線の濃度差が比較的小
さい場合でも、しきい値処理により罫線が確実に文字と
分離されて除去される。さらに、しきい値の分布を罫線
の端部付近で傾斜した形状とすれば、その傾斜を罫線方
向の入力画像の濃度分布に合わせて決定することによ
り、罫線の端部の輪郭線付近で文字部分を消滅させるこ
となく罫線を除去することができる。
【0017】また、本発明は上述した第1、第2および
第3の罫線除去方法の少なくとも一つを用いて罫線の除
去を行うことを特徴とする。この場合、これら全ての罫
線除去方法で罫線除去を行ってみて、最も良好な結果が
得られる方法を選択してもよいし、逐次的に第1、第2
および第3の罫線除去方法を実行し、良好な結果が得ら
れた段階で処理を終了して一つの方法を選択してもよ
い。また、入力画像の種類によって一つの罫線除去方法
を選択して用いることも可能である。
【0018】さらに、本発明は二値画像のための罫線除
去方法および濃淡画像のための罫線除去方法を少なくと
も備え、これらの罫線除去方法の一つにより罫線を除去
することを特徴とする。
【0019】
【発明の実施の形態】以下、本発明の実施形態を図面を
参照して説明する。図6は、本発明の罫線除去方法を適
用した光学的文字読み取り装置(OCR)の機能的構成
を示すブロック図である。このOCRは画像入力部1
1、罫線位置特定部12、部分画像指定部13、罫線種
類判別部14、罫線除去方式選択部15、罫線除去部1
6、文字抽出部17、文字認識部18および結果出力部
19からなり、画像入力部11の一部と、罫線位置特定
部12、部分画像指定部13、罫線種類判別部14、罫
線除去方式選択部15、罫線除去部16、文字抽出部1
7および文字認識部18の部分は、ソフトウェア処理に
より実現してもよいし、ハードウェアにより実現しても
よい。
【0020】画像入力部11は例えばスキャナであり、
読み取り対象の帳票上の画像を入力する。罫線位置特定
部12は、画像入力部11からの入力画像について罫線
と思われる位置(罫線位置)を特定する。部分画像指定
部13は、特定された罫線位置から除去すべき罫線を含
む部分画像の位置を指定する。罫線種類判別部14は、
画像入力部11からの入力画像のうち部分画像指定部1
3により指定された部分画像に存在する罫線の種類を判
別する。
【0021】罫線除去方式選択部15は、複数種類用意
された罫線除去方式の中から入力画像の種類に合った最
適な方式を選択する。罫線除去部16は、複数種類の罫
線除去方式による罫線除去処理機能を有し、画像入力部
11からの入力画像について罫線除去方式選択部15に
より選択された方式で罫線除去処理を行う。
【0022】文字抽出部17は、罫線除去部16によっ
て罫線が除去された後の入力画像から文字部分を抽出す
る。文字認識部18は、文字抽出部17で抽出された文
字について認識処理を行う。結果出力部19は、この文
字認識結果を例えばディスプレイあるいはハードコピー
により出力する。
【0023】次に、本実施形態における罫線除去処理を
含む文字認識の処理手順を図7に示すフローチャートを
参照して説明する。
【0024】まず、画像入力部11によって例えば帳票
を読み取ることにより画像を入力する(ステップS
1)。図8は入力画像101の一例であり、この入力画
像101にはカラー画像、二値画像および濃淡画像など
の種類がある。次に、罫線位置特定部12によって入力
画像中の罫線位置を特定する(ステップS2)。罫線位
置の特定には、罫線幅を特定する処理も含まれるものと
する。この罫線位置特定処理では、帳票固有の罫線情報
がある場合にはその情報を用いて罫線位置の特定を行
い、それ以外の場合、例えば入力画像がカラー画像の場
合であって帳票特有の罫線情報がない場合には、画像上
に存在する各色の分布状況を調べることによって罫線位
置を特定する。また、入力画像が二値画像の場合には黒
画素の分布状況を調べ、さらに濃淡画像の場合には微分
マスクを用い、Hough変換や射影によって罫線位置
を特定する。
【0025】次に、部分画像指定部13によって、本発
明の罫線除去方法により除去すべき罫線の罫線位置を含
む部分画像102の位置を指定する(ステップS3)。
具体的には、図8中に示す入力画像101について、文
字を囲む文字枠を構成する線上をある幅(G画素分)に
わたり走査し、文字部分と接触あるいは重なっている部
分を部分画像102として指定する。
【0026】次に、部分画像指定部13で指定された部
分画像102内に存在する罫線の種類を罫線種類判別部
14によって判別する(ステップS4)。罫線の種類と
しては、大別して実線と点線(破線も含む)がある。罫
線種類の判別には、帳票固有の罫線情報から罫線の種類
が得られる場合はそれを用い、それがない場合には罫線
上を罫線方向に沿って走査し、例えばカラー画像では背
景色から罫線色に変わる回数、濃淡画像では濃度が急激
に変化する回数、二値画像では白画素から黒画素に変わ
る回数をそれぞれ数え、この回数があるしきい値を越え
た場合を点線、そうでない場合を実線とそれぞれ判別す
る。また、部分画像102にラベリングを施し、そのラ
ベル数があるしきい値を越えた場合を点線、そうでない
場合を実線とそれぞれ判別するようにしてもよい。
【0027】次に、罫線除去方式選択部15によって複
数用意された罫線除去方式を適宜組み合わせて、入力画
像101に最も適合したものを選択する(ステップS
5)。そして、選択された罫線除去方式に基づいて罫線
除去部16で文字と接触している罫線を除去する(ステ
ップS6)。この結果、図9(a)に示すような接触罫
線除去画像103が得られる。
【0028】次に、文字抽出部16において接触罫線除
去画像103にラベリング等の処理を施して文字の抽出
を行い(ステップS7)、図9(b)に示すように罫線
以外のラベルを抽出文字104として出力する。最後
に、文字認識部17において抽出文字104の認識を行
い(ステップS8)、図9(c)に示すような認識結果
105を結果出力部18によって出力する(ステップS
9)。
【0029】なお、文字認識部17の認識方式は公知の
もので構わない。また、この例では文字と罫線が接触し
ている部分のみ部分画像を指定して罫線を除去したが、
全ての罫線に除去処理を施し、罫線を全て除去して文字
のみを抽出することも可能である。文字と接触している
罫線以外の罫線の除去には、公知の技術を用いることが
できる。
【0030】次に、図6における罫線除去方式選択部1
5および罫線除去部16の実現例を図10および図11
により説明する。
【0031】図10の例は、n種類の罫線除去方式によ
る罫線除去部21−1〜21−nと出力結果選択部22
を有し、罫線除去部21−1〜21−nでそれぞれ罫線
除去処理を行って、その罫線除去結果と共に確信度10
6を出力し、出力結果選択部22に入力する。この確信
度106は、各方式において罫線除去処理がどの程度う
まくいったかを示す指標であり、例えば濃淡画像におけ
る罫線除去方式では分離度がこれに当る。出力結果選択
部22では、確信度106の値から最も適当な罫線除去
方式を選択する。なお、これらn種類の罫線除去方式に
よる罫線除去処理を全て実行する必要はなく、ある順序
で各方式の罫線除去処理を逐次行い、先に処理の終わっ
た方式によりより出力された確信度106がある決めら
れた条件を満たした場合にはその罫線除去方式を選択
し、それ以降の方式での罫線除去処理は行わなくともよ
い。
【0032】図11の例は、n種類の罫線除去方式によ
る罫線除去部31−1〜31−nと出力結果選択部32
を有し、罫線除去部31−1〜31−nで例えば精度の
高いものから順に罫線除去処理を実行し、その罫線除去
結果と共に確信度106を出力し、出力結果選択部32
に入力する。そして、確信度106がある条件を満たし
た時点で処理を終了し、その条件を満たさなかった場合
には、次の方式による罫線除去処理を実行し、同様に処
理を続けていく。全ての方式の罫線除去部31−1〜3
1−nで条件を満たさなかった場合は、例えば最も精度
の高い方式による罫線除去処理結果を出力結果選択部3
2で選択する。
【0033】なお、図6の罫線除去方式選択部15にお
いて、予め設定された帳票フォーマットに関する情報
や、帳票に対してレイアウト解析や線図形認識等の処理
を施して得られるフォーマットに関する情報等により罫
線除去方式を選択する方法を用いてもよい。
【0034】個々の罫線除去方式の詳細については後述
するが、例えば入力画像101が二値画像の場合は、後
述する二値画像における罫線除去方式[I],[II]のいずれ
かを用い、また入力画像101が二値画像であって罫線
が細い場合は、二値画像における罫線除去方式[I],[II]
による罫線除去処理結果に顕著な差がないため、より簡
単で高速な方の罫線除去方式[I] を選択する。また、入
力画像101が濃淡画像の場合には、濃淡画像における
罫線除去方式を用いる。
【0035】以下に、これらの各罫線除去方式について
詳細に説明する。 (1)二値画像における罫線除去方式[I] 図12を用いて、罫線除去方式[I] について順を追って
説明する。この罫線除去方式[I] は、入力画像中の罫線
の存在する範囲を特定し、その特定した罫線存在範囲内
の罫線に対して垂直の方向に存在する連続した有意画素
領域のうち罫線の幅に相当する所定の幅の有意画素領域
のみを罫線と見なして除去する方式である。
【0036】[ステップ1]:罫線位置の特定 この罫線除去方式[I] では、入力画像101として例え
ば図12(a)に示すような文字と罫線が一部で重なっ
た二値画像が入力されたとき、まず罫線位置特定部12
において図12(b)に示すように罫線方向(図では上
下方向)の射影をとることにより、罫線の存在すると思
われる幅V(=罫線推定幅、図の例ではV=2)の帯状
の領域を罫線位置として特定する。ここで、予め罫線位
置特定部12において罫線位置の情報が得られている場
合には、それを特定された罫線位置として用いることが
できる。そして、このように罫線位置が特定された罫線
の左右の端を両側にW画素分(図の例ではW=1)広
げ、これを罫線の存在範囲として特定する。
【0037】[ステップ2]:罫線除去 次に、ステップ1により特定された罫線の存在範囲内を
罫線推定幅Vの罫線除去マスク107によって走査しな
がら、この罫線推定幅V内に罫線に垂直の方向に存在す
る連続した有意画素である黒画素を1ライン毎に除去し
ていく。なお、罫線除去マスク107の幅は罫線推定幅
V+αとしても構わない。この処理の結果、図12
(c)に示すように、罫線が除去された文字画像が得ら
れる。
【0038】但し、この方式では文字と罫線が重なった
領域付近に出っぱり108や途切れ109が見られるこ
とがある。途切れ109については、罫線を除去したラ
インがPライン以内しか連続していない場合には除去せ
ずに元に戻すという方法で発生させなくすることが出来
る。
【0039】(2)二値画像における罫線除去方式[II] 図12〜図17を用いて、罫線除去方式[II]について順
を追って説明する。先に説明した罫線除去方式[I] で
は、前述したように罫線除去後に得られる文字画像にお
いて、図12(c)に示されるように文字と罫線が重な
った領域付近に出っぱり108や途切れ109が見られ
ることがあり、これらは輪郭を用いた文字認識手法を採
用した際に悪影響を及ぼすことがある。
【0040】これに対し、ここで説明する罫線除去方式
[II]によると、入力画像中の罫線の存在する範囲を特定
すると共に、その特定した罫線存在範囲から外側に延び
ている文字部分の輪郭線の方向に沿って入力画像中の罫
線を切断または仮想的に切断した後、罫線存在範囲内の
罫線に対して垂直の方向に存在する連続した有意画素領
域のうち罫線の幅に相当する所定の幅の有意画素領域の
みを罫線と見なして除去することにより、罫線除去結果
として出っぱり108や途切れ109のない良好な文字
画像を得ることができる。さらに詳しくは、入力画像中
の罫線の一部を含む一部分について輪郭線を求め、入力
画像中の特定した罫線存在範囲の外側に存在する有意画
素領域の輪郭から輪郭線の方向を推定する。
【0041】[ステップ1]:切断点の決定 この罫線除去方式[II]では、図12(a)に示した入力
画像に対してまず輪郭線を求めた後、図13(a)に示
すように罫線の存在範囲内にある輪郭線の凹部に切断点
110を決定する。切断点110とは、罫線を切断する
際の始点または終点を表す点であり、その決定法につい
ては後に詳しく説明する。この際、二値化誤差や掠れの
ために罫線に凹凸が生じている場合もあるので、罫線の
存在範囲内の白画素を全て黒画素に置き換えることによ
って、罫線推定幅を罫線の存在範囲の幅とし、罫線除去
後にそれらの置き換えられた黒画素を元の白画素に戻し
てもよい。
【0042】[ステップ2]:罫線の切断 次に、図13(a)において罫線の左側と右側にある切
断点110について、それらの切断点110間の距離
や、切断点110の文字輪郭方向112を基に最適な左
右の対を求め、それらの対の間を結んだ線(以下、連結
線と呼ぶ)上の黒画素を一旦白画素に置き換えることに
よって、罫線を切断する。
【0043】[ステップ3]:罫線除去 次に、前述した罫線除去方式[I] の場合と同様に、罫線
除去マスク107によって罫線推定幅V内の黒画素を1
ライン毎に除去する。この際、罫線と重なっている文字
の上側輪郭に相当する輪郭線と下側輪郭に相当する連結
線とに挟まれた黒画素111は除去しない。その後、白
画素に置き換えた画素を部分を元の黒画素に戻すことに
よって、図13(b)に示すように文字画像を抽出する
ことができる。図13(b)と前述した罫線除去方式
[I] による罫線除去結果を示した図12(c)を比較し
て分かるように、罫線除去方式[II]の方が出っぱり10
8や途切れ109が発生しにくく、なめらかな輪郭線が
得られている。
【0044】以上が罫線除去方式[II]における罫線除去
の概略的な手順である。
【0045】次に、図14および図15を用いて、この
罫線除去方式[II]方式における切断点110の決定法に
ついて説明する。
【0046】まず、図14(a)に示すように罫線の左
右端から両側にS画素目(この例ではS=3)の位置で
罫線に沿って入力画像パターンを切断する。すなわち、
罫線の左右端から両側にS画素目の位置を罫線に沿って
接続した切断線上の画素を一旦白画素に置き換える。次
に、この切断後の入力画像パターンについて輪郭を追跡
する。ここで、図14(a)のようにS=3程度で切断
すると内輪郭が出にくく、一つの外輪郭のみで以下の処
理をすることができ、処理時間を短縮することが可能で
ある。但し、この方法では切断点110における文字輪
郭方向112(後述)が求まりにくくなるため、図14
(b)に示すように例えばS=5で切断した場合の輪郭
から文字輪郭方向112を求め、S=3の場合の切断点
110と対応をとって代入を行い、最終的な文字輪郭方
向112を求める方法を用いてもよい。
【0047】輪郭を追跡する際に、輪郭上の各点(以
下、輪郭点と呼ぶ)のxy座標、輪郭点の方向(図15
(a)参照)、各輪郭点と一つ前の輪郭点の方向との差
分(以下、方向差分と呼ぶ)および近似角度を輪郭点の
情報として蓄えておく。ここでいう近似角度とは、正確
に言うと周辺とのなす角の余弦の2乗に対して2乗する
前の符号を付加したものであるが、余弦を2乗せずにそ
の大きさを用いたり、また余弦に代えて正弦等を用いて
も構わない。
【0048】例えば、i番目の輪郭点のxy座標を(x
i ,yi )、その前後K点目の輪郭点のxy座標をそれ
ぞれ(xi-k ,yi-K )、(xi+k ,yi+K )とする
と、i番目の輪郭点の近似角度は以下の式により求めら
れる。
【0049】 近似角度=s*cos2 θ =s*(m・n)2 /(|m|2 *|n|2 ) (1) 但し、m=(xi-k −xi ,yi-K −yi ) n=(xi+k −xi ,yi+K −yi ) θはベクトルmとベクトルnとのなす角 sはm・nが正のときs=1,負のときs=−1 次に、このようにして求められた輪郭点の情報から方向
差分が負のもの(すなわち凹部)を抽出し、その輪郭点
の前後M点の中で最も大きな近似角度を持つ輪郭点を切
断点110とする。この例では、図15(b)に示され
るようにM=4とする。
【0050】但し、この方法のみではなだらかな凹部に
おける切断点110については抽出できないこともある
ので、その場合には以下に述べる切断点110の性質を
利用して切断点110を決定する。図15(c)は、切
断点110が存在すべき領域の近傍における輪郭線の動
きの例を矢印で表した図であり、切断点110付近では
輪郭線は必ず罫線から左右方向にW+1画素以上離れた
後、再び罫線の方に戻ってくることが分かる。輪郭線が
罫線からW画素しか離れない場合には罫線部の二値化誤
差の可能性もあるので、切断点110は存在しないもの
とする。なお、図15(c)ではW=1としている。
【0051】そこで、輪郭追跡の際に罫線からW+1=
2画素以上離れた時にスイッチをオンにし、再び罫線に
戻ってきた時にスイッチをオフにすると、そのオン・オ
フの間に2つの切断点110があると判断できる。ま
た、図15(c)の方法でも切断点110が求められな
かった場合には、罫線から離れた直後の画素および罫線
に戻る寸前の画素を切断点110とする。切断点110
が既に求められている場合でも、オン・オフの間に2つ
の切断点110があるかどうかを確認し、切断点110
の数を調整することが望ましい。また、切断点110は
図15(c)で説明したような輪郭線が罫線から離れた
後に再び罫線に戻るという性質から、罫線の両側それぞ
れ偶数個ずつ存在することが分かる。例えば、図14
(b)の例では罫線の左側に6つ(L1〜L6)、罫線
の右側に6つ(R1〜R6)の切断点110が求められ
ることになる。
【0052】次に、このようにして決定された切断点1
10における文字輪郭方向112を求める。文字輪郭方
向112とは、図14(b)に示されるように切断点1
10から文字側に向かって延びている輪郭線の方向を意
味する。そして、切断点110から文字方向に向かって
輪郭線上を最大N点分たどって、切断線と接する点もし
くは輪郭点の方向差分がある値以上になる直前の点(x
j ,yj )を求め、これらから得られる直線の方程式を ax+by+c=0 (2) 但し、xi ≦yj a=yi −yj ,b=xj −xi ,c=xi j −xj
i ,t=−a/b とした時の係数a,b,cおよび傾きtを切断点110
の情報として蓄える。
【0053】次に、図16および図17を用いて罫線除
去方式[II]における切断点110の対を求める方法につ
いて説明する。切断点110の対同士を結んだ線分は、
罫線と重なった文字部分の輪郭線に当たる。例えば図1
6(a)の左側の切断点L1は文字の上側の輪郭線上に
当たるため、これと対になり得る右側の切断点110は
R1,R3,R5である。このように対となり得る複数
の切断点の組み合わせから最適な対を求めるために、切
断点110のxy座標と、切断点110を決定する処理
で求めた係数a,b,cを用いる。最も簡単な方法は、
対となるべき切断点110同士の2点間の距離を求める
ことであるが、これのみでは局所的に集中した切断点1
10の対を求める場合に、その組み合せを誤るおそれが
ある。
【0054】そこで、切断点110から文字側に向かっ
て延びている輪郭線の方向も考慮した評価値を用いて、
最適な対を求めることにする。ここでは、図16(b)
に示すように切断点L1とR1の対を例として、評価値
f(L1,R1)を求めてみる。まず、L1のxy座標
を(xL1,yL1)、文字輪郭方向112の情報をaL1
L1,cL1とし、同様にR1についてもxy座標を(x
R1,yR1),文字輪郭方向112の情報をaR1,bR1
R1とする。ここで、評価値f(L1,R1)は以下の
式で求められる。
【0055】 f(L1,R1)=h12 +t*(h22 +h32 ) (3) 但し、 h12 =(xL1−xR12 +(yL1−yR12 h22 =(aL1*xR1+bL1*yR1+cL12 /(a2
L1+b2 L1) h32 =(aR1*xL1+bR1*yL1+cR12 /(a2
R1+b2 R1) tは定数 (3)式におけるh1は切断点110間の距離、h2お
よびh3は一方の切断点110における文字輪郭方向1
12のなす直線と他方の切断点110との距離を表し、
この評価値が最小となる組合せを最適な切断点110の
対とする。ただし、ここでいう評価値は一例であり、h
1〜h3を単独で用いたり、適当に組み合わせたりして
も構わない。これにより、図16(a)の例では(L
1,R1)(L2,R2)(L3,R3)(L4,R
4)(L5,R5)(L6,R6)という切断点110
の対が求められる。
【0056】また、図16(c)では上側の切断点11
0が4つ(U1〜U4)、下側の切断点110が2つ
(D1,D2)あるが、この場合に上記の方法で求めら
れる切断点110の対は(U1,D1)(U4,D2)
のみで、U2やU3のように対が得られずに他の切断点
110の対に内包されてしまう切断点110も存在し得
る。これらの代表的な以下に例を示す。
【0057】まず、図17(a)のように同じ側にあっ
て近接している、文字の上側輪郭線上にある切断点11
0と下側輪郭線上にある切断点110(前述した輪郭追
跡の際のオン・オフの間にある2つの切断点のこと。以
下、これらを上下の対応点と呼ぶ)とが共に対を得られ
ず、かつ片側に1組しかないか、2組以上あってもそれ
らがあるしきい値以上離れている場合には、この上下の
対応点(L1,L2)(R1,R2)を対とする。
【0058】次に、図17(b)のように対が得られな
かった上下の対応点が同じ側に2組以上存在する場合、
その2組の対応点のうち近い切断点110同士の距離を
求め(図中のth1)、これがあるしきい値よりも小さ
く、かつ各切断点110の文字輪郭方向112を示す直
線が罫線側で交わる場合には、外側2つの切断点110
の文字輪郭方向112を罫線側に延長して、罫線の他方
の端とぶつかった点を仮の切断点110として対とす
る。図17(b)の例では、(L1,r1)(L4,r
2)が対となり、L2とL3はそれらの対に内包され
る。
【0059】また、図16(b)のように対が得られな
かった上下の対応点の距離(図中ではth2)があるし
きい値より大きく、かつ各切断点110における文字輪
郭方向112を示す直線が罫線側で交わる場合には、そ
れぞれの文字輪郭方向112を罫線側に延長して交わっ
た点を仮の切断点110として対とする。図16(b)
の例では、(L1,r1)(L2,r1)が対となる。
【0060】以上のようにして切断点110の対が求め
られたならば、罫線の除去処理を行う。この罫線除去処
理においては、上記の手順によって得られた切断点11
0の対同士を結び、その連結線を上から順に追ってい
く。切断点110の対応が正しければ、その連結線は文
字の上側輪郭線、下側輪郭線、上側輪郭線、下側輪郭線
……と交互に現れるはずである。もし、切断点110の
対応が違う場合は、評価値を用いてその前後の連結線を
削除することで調節する。
【0061】次に、最終的に得られた連結線上にある画
素を一旦白画素に置き換えて、罫線除去マスク17を用
いた罫線除去方式[I] による罫線除去を行う。この際、
文字の上側輪郭線に当たる連結線とそのすぐ下に存在す
る下側輪郭線に当たる連結線に挟まれた罫線上の黒画素
111については除去しない。
【0062】そして最後に、連結線上の置き換えた黒画
素を元に戻すことによって、図13(b)に示したよう
な滑らかな輪郭線を持った文字を抽出する。
【0063】(3)濃淡画像における罫線除去方式 次に、図18〜図23を参照して濃淡画像における罫線
除去方式について説明する。前述したように、文字と罫
線の濃度差を利用してしきい値処理により二値化するこ
とで両者を分離し、罫線の濃度を持つ画素のみを除去す
る公知文献2の方法では、文字と罫線の濃度差が大きい
濃淡画像の場合は、固定の二値化しきい値で文字と罫線
の分離ができるが、文字と罫線の濃度差が十分にない場
合には分離が難しい。
【0064】ここで説明する罫線除去方式は、入力画像
の罫線位置を求め、罫線付近の二値化しきい値とそれ以
外の部分の二値化しきい値を変えることによって、文字
と罫線の濃度差が小さい場合でも罫線を容易に除去でき
るようにしたものである。
【0065】図18(a)は入力画像である文字と罫線
を含む濃淡画像の例であり、ここでは白画素の値を
“0”とする。この濃淡画像について、まず個々の点の
量子化誤差を是正するため平滑化を行う。平滑化は、例
えばフィルタリングにより行われる。フィルタリングに
よる平滑化では、平滑化対象となる注目画素および近傍
の画素の濃度値を重み付け積算し、その積算値(以下、
濃度値積算値という)を注目画素の濃度値とする。この
平滑化の後、水平方向の罫線の場合は水平方向に、垂直
方向の罫線の場合は垂直方向に各画素の濃度値を積算
し、それぞれ垂直方向および水平方向への軸への射影成
分を計算する。こうして計算される射影成分を積算射影
という。ここで積算する値は濃度値そのままでもよく、
また適当に定めたしきい値、例えば背景と思われる画素
の濃度値よりやや大きい濃度値を持つ画素の数でもよ
い。
【0066】図18(a)中の罫線(クロスハッチング
で示す)は水平方向の罫線なので、水平方向に各画素の
濃度値を積算して、図18(b)に示すように垂直方向
の軸への積算射影113を求め、この積算射影113に
おいて濃度値積算値が所定値以上の領域を罫線位置11
4として求める。ここで予め罫線情報として罫線位置が
与えられている場合には、それをそのまま罫線位置11
4として用いる。
【0067】図18(c)は、図18(a)の垂直方向
の3つの断面A,B,Cにおける濃度値積算値の分布
(以下、濃度分布という)と、文字と罫線の分離のため
のしきい値曲線を示している。
【0068】一方、入力画像全体の濃度値の分布から背
景部とそれ以外の部分とを分離するための二値化しきい
値thAを求めておく。この二値化しきい値thAの求
め方としては、公知文献2に記載された方法を用いても
よいが、濃度分布において背景部とそれ以外の部分との
差がある一定値を越えているような場合には、背景部の
濃度値よりやや大きい濃度値を二値化しきい値thAと
してもよい。
【0069】図19(a)に、図18(a)に示した濃
淡画像全体における濃度による画素数分布を示す。図1
9(a)において横紬は濃度値、縦軸は各濃度値毎の画
素数である。また、ここで求められた二値化しきい値t
hAによる二値化しきい値曲線をDとする。
【0070】次に、図18(b)の罫線位置114の両
端をΗ画素分だけ広げて罫線存在範囲とし、この罫線存
在範囲内で今度は逆方向に画素の濃度値を積算して、図
20に示す濃度値積算射影を求める。図20において横
軸は図18(a)における水平方向の位置、縦軸は濃度
値積算値である。罫線が図18(a)中に示されるよう
な水平方向の罫線の場合は、垂直方向に濃度値を積算す
る。文字と罫線の濃度差が大きい場合には、文字が罫線
と接触している部分は接触していない部分に対して濃度
値積算値が大きいために、図20に示すようにあるしき
い値以上の差が現われるので、接触していない部分の濃
度値(すなわち罫線の濃度値)を基に二値化しきい値t
hBを決定する。図19(b)に、上述した罫線存在範
囲内における濃度による画素数分布を示す。図19
(a)と同様に横紬は濃度値、縦軸は各濃度値毎の画素
数である。
【0071】二値化しきい値thΒが決定した場合、罫
線位置114では決定された二値化しきい値thΒを用
い、それ以外の部分では二値化しきい値thA(thA
<thB)を用いた凸型の二値化しきい値曲線Εを求め
る。この凸型の二値化しきい値曲線Eを図18(c)中
の断面Βの濃度分布116と対応させて示す。一方、前
述の濃度積算値に大きな差が現れなかった場合には、以
下の処理を行う。
【0072】図18(c)中の断面Aの濃度分布115
および断面Cの濃度分布117を見てみると、罫線内お
よび文字内の画素全てが同じ濃度値であるわけではな
く、例えば罫線部分については罫線中央部をピークとし
て、端に向かって濃度値が小さくなることが多い。そこ
で、罫線中央部の画素の濃度値を用いて、例えば公知文
献2の方法に従って二値化しきい値thCを求める。図
21に、罫線中央部の画素のみを用いた濃度による画素
数分布を示す。罫線中央部の画素の濃度値のみを積算す
るために、図19(b)の濃度による画素数分布に比べ
て積算される画素数が少ないので、文字と罫線の境目が
より鮮明となることが分かる。
【0073】公知文献2の方法を用いた際、同時に求め
られる分離度(求められたしきい値の確からしさを示す
指標)がある設定値より小さい場合は、その二値化しき
い値を無効として二値化しきい値曲線Dで二値化を行
い、他の罫線除去方式で罫線除去を行うこととする。
【0074】断面Aの濃度分布115および断面Cの濃
度分布117に、罫線位置114で二値化しきい値th
Cを用い、それ以外の部分で二値化しきい値thA(t
hA<thC)を用いた凸型の二値化しきい値曲線Fを
示す。この二値化しきい値曲線Fを用いて二値化を行っ
てもよいが、前述したように罫線中の濃度分布は中央部
をピークとして、端に向かって値が小さくなっているこ
とが多く、場合によっては罫線の両端付近に存在する文
字部が求められた二値化しきい値thCより小さくなっ
て、罫線の輪郭線付近の文字の一部が消えてしまうこと
もあり得る。
【0075】図22に、断面Cの濃度分布117の罫線
付近を拡大して示す。同図のように文字と罫線が分布し
ているとすると、斜線部分118に相当する文字部分の
濃度値が凸型の二値化しきい値曲線Fより小さい値とな
り、斜線部分118の文字が消滅してしまうことが分か
る。
【0076】そこで、この濃度分布の形状を考慮して、
罫線の輪郭線付近の二値化しきい値曲線に傾斜を付ける
ことにより、文字部分の濃度がしきい値曲線より小さく
なることを防止して、このような文字の一部が消えてし
まう現象を抑制する。この方法により求められた二値化
しきい値曲線Gを図18(c)の断面Cの濃度分布に併
せて示す。
【0077】このように傾斜を付けたしきい値曲線Gの
求め方を図23を用いて説明する。すなわち、例えば図
23(a)に示すように罫線推定幅+2Hが「9」で、
罫線のみの部分の画素の濃度値が「10」,「40」,
「70」,「90」,「100」,「90」,「7
0」,「40」,「10」で、さらに図18(c)中に
示す二値化しきい値thCがthC=110の場合、図
23(b)に示すように二値化しきい値曲線Gの凸部の
濃度値を断面Cの濃度分布に比例させて「11」,「4
4」,「77」,「99」,「110」,「99」,
「77」,「44」,「11」とすることにより、二値
化しきい値曲線Gの凸部の裾野部分、すなわち罫線の端
部付近で傾斜を付ける。
【0078】なお、この手法は例えば図18(c)の断
面Bの凸型の二値化しきい値曲線Εにも適用することが
でき、それにより傾斜を付けた二値化しきい値曲線Ε′
を図18(c)の濃度分布116中に示す。
【0079】
【発明の効果】以上説明したように本発明によれば、非
ドロップアウトカラーの文字と罫線が重なっている場合
でも、高精度に罫線を除去し、文字のみを正しく抽出す
ることができる。
【0080】すなわち、第1の罫線除去方法によれば、
入力画像について罫線の存在範囲を特定した後、罫線の
幅に相当する有意画素領域のみを除去することにより、
文字を貫通する形で罫線が多数の点で重なっているよう
な領域でも、罫線のみを確実に除去することができる。
【0081】第2の罫線除去方法によれば、文字部分の
輪郭線の方向に沿って入力画像中の罫線を切断または仮
想的に切断した後、第1の罫線除去方法と同様の処理を
行うことにより、罫線除去後の文字部分において罫線と
重なった領域付近に出っぱり途切れが生じることがな
く、以降の文字認識処理をより容易に行うことが可能と
なる。
【0082】第3の罫線除去方法によれば、文字と罫線
を分離するためのしきい値の分布を罫線の部分で凸型と
することにより、文字と罫線の濃度差が比較的小さい場
合でも、しきい値処理により罫線を確実に文字と分離し
て除去でき、さらにしきい値の分布を罫線の端部付近で
傾斜した形状とすれば、その傾斜を罫線と垂直方向の入
力画像の濃度分布に合わせて決定することにより、罫線
の端部の輪郭線付近で文字部分を消滅させることなく、
罫線を除去することができる。
【図面の簡単な説明】
【図1】文字と罫線が重なっている画像の例を示す図
【図2】第1の従来技術を説明するための図1の画像に
罫線除去処理を行った画像の例を示す図
【図3】第2の従来技術を説明するための記入枠の一辺
と文字が多数接触している画像およびその画像に罫線除
去処理を行った画像の例を示す図
【図4】記入枠の多数の辺と文字が接触している画像の
例を示す図
【図5】従来の方式による切断候補画像を示す図
【図6】本発明の一実施形態に係る光学的文字読み取り
装置の構成を示すブロック図
【図7】同実施形態における一連の処理手順を示すフロ
ーチャート
【図8】同実施形態の動作を説明するための入力画像お
よび部分画像の例を示す図
【図9】同実施形態の動作を説明するための接触罫線除
去画像と抽出文字および認識結果の例を示す図
【図10】図6における罫線除去方式選択部および罫線
除去部の機能的構成を示すブロック図
【図11】図6における罫線除去方式選択部および罫線
除去部の他の機能的構成を示すブロック図
【図12】文字と罫線が重なっている画像とこれに対す
る射影による罫線位置の推定・罫線除去マスクの走査お
よび第1の罫線除去方法による罫線除去結果の一例を示
す図
【図13】文字と罫線が重なっている画像に対する切断
点・除去しない黒画素・罫線除去マスクによる走査およ
び第2の罫線除去方法による罫線除去結果を示す図
【図14】第2の罫線除去方法を説明するための文字と
罫線が重なっている画像に対する輪郭追跡および切断点
の文字輪郭方向を示す図
【図15】第2の罫線除去方法を説明するための輪郭点
の方向と角度および切断点付近の輪郭線の動きを示す図
【図16】第2の罫線除去方法を説明するための切断点
の対の一例と切断点同士の距離および切断点の対の他の
例を示す図
【図17】第2の罫線除去方法を説明するための対の得
られなかった切断点の対応を示す図
【図18】第3の罫線除去方法を説明するための文字と
罫線を含む濃淡画像と垂直方向への画素の濃度値の積算
射影および各断面位置での画素の濃度分布としきい値曲
線を示す図
【図19】第3の罫線除去方法を説明するための濃度に
よる画素数の分布を示す図
【図20】第3の罫線除去方法を説明するための濃度値
積算値の分布を示す図
【図21】第3の罫線除去方法を説明するための濃度に
よる画素数の分布を示す図
【図22】第3の罫線除去方法を説明するための特定位
置での画素の濃度分布を拡大して示す図
【図23】第3の罫線除去方法を説明するための二値化
しきい値曲線に付ける傾斜の求め方を説明するための図
【符号の説明】
11…画像入力部 12…罫線位置特定部 13…部分画像特定部 14…罫線種類判別部 15…罫線除去方式選択部 16…罫線除去部 17…文字抽出部 18…文字認識部 19…結果出力部 101…入力画像 102…部分画像 103…接触罫線除去画像 104…抽出文字 105…認識結果 106…確信度 107…罫線除去マスク 108…出っぱり 109…途切れ 110…切断点 111…除去しない黒画素 112…文字輪郭方向 113…積算射影 114…罫線位置 115…濃度値積算射影 116…断面Aにおける濃度分布 117…断面Bにおける濃度分布 118…断面Cにおける濃度分布

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】文字と罫線を含む入力画像から罫線を除去
    する方法において、 前記入力画像中の罫線の存在する範囲を特定し、その特
    定した罫線存在範囲内の罫線に対して垂直の方向に存在
    する連続した有意画素領域のうち罫線の幅に相当する所
    定の幅の有意画素領域のみを罫線と見なして除去するこ
    とを特徴とする罫線除去方法。
  2. 【請求項2】文字と罫線を含む入力画像から罫線を除去
    する方法において、 前記入力画像中の罫線の存在する範囲を特定すると共
    に、その特定した罫線存在範囲から外側に延びている文
    字部分の輪郭線の方向に沿って前記入力画像中の罫線を
    切断または仮想的に切断した後、前記罫線存在範囲内の
    罫線に対して垂直の方向に存在する連続した有意画素領
    域のうち罫線の幅に相当する所定の幅の有意画素領域の
    みを罫線と見なして除去することを特徴とする罫線除去
    方法。
  3. 【請求項3】文字と罫線を含む入力画像上に罫線と交差
    する方向にしきい値を分布させ、このしきい値を用いて
    前記入力画像をしきい値処理することにより前記入力画
    像から罫線を除去する方法において、 前記しきい値を罫線の部分で凸型をなす形状に分布させ
    たことを特徴とする罫線除去方法。
  4. 【請求項4】文字と罫線を含む入力画像上に罫線と交差
    する方向にしきい値を分布させ、このしきい値を用いて
    前記入力画像をしきい値処理することにより前記入力画
    像から罫線を除去する方法において、 前記しきい値を罫線の部分で凸型をなし、かつ罫線の端
    部付近で傾斜した形状に分布させたことを特徴とする罫
    線除去方法。
  5. 【請求項5】文字と罫線を含む入力画像から罫線を除去
    する方法において、 請求項1に記載の第1の罫線除去方法、請求項2に記載
    の第2の罫線除去方法、請求項3または4に記載の第3
    の罫線除去方法の少なくとも一つを用いて罫線を除去す
    ることを特徴とする罫線除去方法。
  6. 【請求項6】二値画像のための罫線除去方法および濃淡
    画像のための罫線除去方法を少なくとも備え、これらの
    罫線除去方法の一つにより罫線を除去することを特徴と
    する罫線除去方法。
JP35214495A 1995-12-28 1995-12-28 罫線除去方法及びこれを用いた文字認識装置 Expired - Lifetime JP3830998B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP35214495A JP3830998B2 (ja) 1995-12-28 1995-12-28 罫線除去方法及びこれを用いた文字認識装置
US08/771,055 US5896464A (en) 1995-12-28 1996-12-20 Ruled line elimination apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35214495A JP3830998B2 (ja) 1995-12-28 1995-12-28 罫線除去方法及びこれを用いた文字認識装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005322127A Division JP2006059384A (ja) 2005-11-07 2005-11-07 罫線除去方法

Publications (2)

Publication Number Publication Date
JPH09185676A true JPH09185676A (ja) 1997-07-15
JP3830998B2 JP3830998B2 (ja) 2006-10-11

Family

ID=18422084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35214495A Expired - Lifetime JP3830998B2 (ja) 1995-12-28 1995-12-28 罫線除去方法及びこれを用いた文字認識装置

Country Status (2)

Country Link
US (1) US5896464A (ja)
JP (1) JP3830998B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6324302B1 (en) * 1997-05-30 2001-11-27 Ricoh Company, Ltd. Method and a system for substantially eliminating erroneously recognized non-solid lines
JP3411472B2 (ja) * 1997-05-30 2003-06-03 富士通株式会社 パターン抽出装置
EP0965943A3 (en) * 1998-06-04 2001-11-28 Matsushita Electric Industrial Co., Ltd. Optical character reading method and system for a document with ruled lines and their application
JP3574584B2 (ja) * 1998-12-16 2004-10-06 富士通株式会社 表画像処理装置及びそのプログラム記憶媒体
AU3712600A (en) 1999-02-26 2000-09-14 Raf Technology, Inc. Method and system for identifying a reference region on an image of a dropped-out form
US6330357B1 (en) 1999-04-07 2001-12-11 Raf Technology, Inc. Extracting user data from a scanned image of a pre-printed form
JP3204245B2 (ja) * 1999-04-27 2001-09-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 罫線除去方法および装置
US6728426B1 (en) * 1999-08-23 2004-04-27 International Business Machines Corporation Compression of form images in gray-level
JP3995185B2 (ja) * 2000-07-28 2007-10-24 株式会社リコー 枠認識装置及び記録媒体
JP2002109596A (ja) * 2000-09-28 2002-04-12 Nippon Conlux Co Ltd 貨幣識別方法及び装置
JP3898075B2 (ja) * 2002-03-18 2007-03-28 株式会社リコー 画像処理装置、画像処理方法及び記録媒体
JP4834351B2 (ja) * 2005-08-22 2011-12-14 株式会社東芝 文字認識装置及び文字認識方法
US8000535B2 (en) * 2007-06-18 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for refining text segmentation results
EP2416282A4 (en) * 2009-03-31 2016-09-28 Fujitsu Frontech Ltd DEVICE AND METHOD FOR RECOGNIZING CHARACTERS
JP6292782B2 (ja) * 2013-07-17 2018-03-14 キヤノン株式会社 記録装置及び記録方法
US9311720B2 (en) 2013-11-26 2016-04-12 Saudi Arabian Oil Company Automated saw cut correction for 3D core digital modeling from computerized tomography scanner (CTS) images
US9019570B1 (en) 2013-11-27 2015-04-28 Mcgraw-Hill School Education Holdings Llc Systems and methods for computationally distinguishing handwritten pencil marks from preprinted marks in a scanned document
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
US10438098B2 (en) * 2017-05-19 2019-10-08 Hand Held Products, Inc. High-speed OCR decode using depleted centerlines

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235653A (en) * 1984-08-31 1993-08-10 Hitachi, Ltd. Document analysis system
JPS6393066A (ja) * 1986-10-08 1988-04-23 Hitachi Ltd ケイ線およびタブ設定装置
US5101448A (en) * 1988-08-24 1992-03-31 Hitachi, Ltd. Method and apparatus for processing a document by utilizing an image
US5191612A (en) * 1990-03-13 1993-03-02 Fujitsu Limited Character recognition system
JP2789971B2 (ja) * 1992-10-27 1998-08-27 富士ゼロックス株式会社 表認識装置
JP3603906B2 (ja) * 1994-04-15 2004-12-22 富士写真フイルム株式会社 画像信号2値化処理装置および方法

Also Published As

Publication number Publication date
JP3830998B2 (ja) 2006-10-11
US5896464A (en) 1999-04-20

Similar Documents

Publication Publication Date Title
JPH09185676A (ja) 罫線除去方法
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP2951814B2 (ja) 画像抽出方式
WO2018074110A1 (ja) 指紋処理装置、指紋処理方法、プログラム、指紋処理回路
CN110197153B (zh) 一种户型图中墙体自动识别方法
JP2000105829A (ja) 顔パーツ検出方法及びその装置
JP3603836B2 (ja) 道路白線認識装置
Gilly et al. A survey on license plate recognition systems
CN114863492A (zh) 一种低质量指纹图像的修复方法及修复装置
CN110348307B (zh) 一种起重机金属结构攀爬机器人的路径边缘识别方法及系统
Gul et al. Automatic extraction of contour lines from topographic maps
JP2019144608A (ja) 解析装置、ひび割れ検出処理装置、および解析プログラム
CN111524171B (zh) 图像处理方法、装置和电子设备
JP2898562B2 (ja) ナンバープレート決定方法
JPH05151341A (ja) 車両用走行路検出装置
CN115984211A (zh) 视觉定位方法、机器人及存储介质
JP2868134B2 (ja) 画像処理方法及び装置
JP4020202B2 (ja) 縞状パターン抽出システムおよび縞状パターン抽出方法
JP2871590B2 (ja) 画像抽出方式
JP2858530B2 (ja) エッジ強調装置
JP2963508B2 (ja) 文字切出し装置
JP2006059384A (ja) 罫線除去方法
JP7239034B2 (ja) 指紋処理装置、指紋処理方法、プログラム、指紋処理回路
KR102102369B1 (ko) 정합 성능 추정 방법 및 장치
JPH096909A (ja) 文字読取装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060713

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110721

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130721

Year of fee payment: 7

EXPY Cancellation because of completion of term