JPH10254991A - 罫線消去方法及び機械読み取り可能な媒体 - Google Patents
罫線消去方法及び機械読み取り可能な媒体Info
- Publication number
- JPH10254991A JPH10254991A JP9051997A JP5199797A JPH10254991A JP H10254991 A JPH10254991 A JP H10254991A JP 9051997 A JP9051997 A JP 9051997A JP 5199797 A JP5199797 A JP 5199797A JP H10254991 A JPH10254991 A JP H10254991A
- Authority
- JP
- Japan
- Prior art keywords
- ruled line
- black run
- gravity
- center
- erasing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
字線を保存しつつ罫線を高精度に消去する。 【解決手段】 罫線の直交部分を認識して消去する(3
02,303)。罫線のベクトル方向に処理位置を移動
しつつ、処理位置において直交する黒ランの長さを罫線
太さと比較し(309)、罫線太さ以外の長さの黒ラン
は消去する(310)。罫線太さより相当に長い黒ラン
は消去せず(312)、それより短い黒ランについては
罫線との重心のずれを検出し(313)、重心のずれが
大きいときには、その重心のずれ方向と反対の端側を部
分的に消去する(315)。
Description
くに、文字認識装置の前処理部等において、文字と罫線
が混在した帳票等の画像より、文字を保存しつつ罫線を
消去する技術に関する。
認識装置で処理する場合、罫線と文字との近接(接触、
交差、重複)が大きな問題となる。高精度の文字認識を
実現するには、そのような近接した文字を罫線と分離し
て認識しなければならず、その一つの方法として、前処
理段階で帳票画像より罫線だけを消去する方法がある。
て、FormOut!(イスラエル国、TiS社)なる
商品名のソフトウエアが知られている。このソフトウエ
アは、記入欄が未記入の帳票(見本)を読み取って、そ
の定型情報(罫線、文字、図形)を学習する。その後、
記入欄が記入された同種の帳票を読み取り、その画像よ
り、学習した定型情報を除去し、記入欄に記入された文
字等の変動情報だけの画像を出力する。
「見本」が存在すること、それを予め学習すること、学
習済みの見本と同種の帳票を処理することを前提として
おり、見本のない帳票類や学習したことのない種類の帳
票類の処理に利用できない。また、罫線と文字の接触に
はある程度対応が可能なようであるが、罫線との交差、
特に斜め線との交差や重複の場合には、文字を復元でき
るほどの性能は期待できないようである。
く、任意の種類の帳票等の画像より、文字を保存しつつ
罫線を高精度に消去する方法を提供することにある。
法は、見本を利用することなく、帳票等の画像より、罫
線と近接した文字線を保存しつつ罫線を消去するため、
罫線の直交部分を認識するステップ、認識された直交部
分を消去するステップ、及び、罫線の重心の付近を垂直
に横切る黒ランの中で、罫線の太さを超えない長さを持
つ黒ランを消去するステップを含む(請求項1乃至
4)。さらに、罫線に文字線が斜めに交差した部分に罫
線の未消去部分を残さないために、罫線の重心の付近を
垂直に横切る黒ランで、罫線の太さより大きく、かつ、
罫線の太さより十分大きな閾値より小さい長さを持つ黒
ランであって、その重心が罫線の重心より所定値以上ず
れた黒ランについて、その重心のずれ方向と反対の端側
を部分的に消去するステップを含む(請求項2又は
4)。さらに、罫線と文字線との重複もしくは接触した
部分に罫線の未消去部分を残さないために、罫線の重心
付近を垂直に横切る黒ランであって、罫線の太さより所
定の若干量だけ大きなほぼ一定の長さを持つ黒ランが連
続し、前又は後に罫線の太さより十分に大きな所定値以
上の長さを持つ黒ランが存在する区間を検出し、その区
間内の黒ランについて、その重心の罫線の重心からずれ
た方向と反対の端側を部分的に消去するステップを含む
(請求項3又は4)。
施の形態を説明する。
な構成のコンピュータシステム10においてソフトウエ
アにより実施することができる。図1において、12は
各構成部の相互接続のためのバス、14は中央演算処理
装置(CPU)、16はシステムメモリである。20は
プリンタ等の外部装置であって、パラレルポート22を
介しバス12に接続される。24はディスプレイであっ
てディスプレイアダプター26を介してバス12に接続
され、38はポインティングデバイスのマウスでシリア
ルポート28によりバス12に接続される。30はキー
ボード、32は固定ディスク装置、33はフロッピーデ
ィスクドライブである。34はイメージスキャナであ
り、外部インターフェイス36によりバス12に接続さ
れる。
ジスキャナ34によって原稿より読み取られて入力さ
れ、あるいは、フロッピーディスク33Aに一旦記録さ
れた後にフロッピーディスクドライブ33を介して入力
される。入力された画像データは固定ディスクドライブ
32に一旦保存され、処理実行時にシステムメモリ16
の特定領域に読み込まれるか、あるいは直接的にシステ
ムメモリ16の特定領域に読み込まれる。処理途中の画
像データや最終的な結果としての画像データ、その他の
データはシステムメモリ16の特定領域に一時的に記憶
される。最終結果の画像データは、固定ディスクドライ
ブ30に保存され、必要な時に外部装置20やフロッピ
ーディスク33Aに出力される。また、入力された画像
データや処理途中の画像データはディスプレイ24に表
示させることができる。ユーザは、罫線の指定や他の情
報の入力を、マウス38やキーボード30を操作するこ
とにより行うことができる。後記実施例に関連して詳細
に説明する罫線消去処理のためのプログラムは、固定デ
ィスクドライブ32又はフロッピーティスク33Aより
システムメモリ16にロードされ、中央演算処理装置1
4によって実行される。
具体的に説明するが、図1に示すコンピュータシステム
10の構成との関連は自明であろうから説明を省略す
る。
流れを示すフローチャートである。図2において、ま
ず、文字と罫線を含む文書等の画像データが入力され
(ステップ200)、次にその画像データの2値化処理
を行う(ステップ201)。この2値化処理後の画像デ
ータに対し画像圧縮を施す(ステップ202)。この画
像圧縮後の画像データが後述の処理の対象となる。な
お、入力された画像データが2値化済みの場合には、ス
テップ201の2値化処理は不要である。また、ステッ
プ202の画像圧縮は、画像データの記憶に必要なメモ
リ量の削減と処理時間の短縮を目的としており、その必
要がなければ省いてよい。
テップ203)。罫線の自動認識は、例えば水平、垂直
方向の長い黒ランを統合し、その外接矩形を罫線として
抽出する方法や、水平、垂直方向に黒画素の射影をとっ
て、ピークをもっている領域を罫線として抽出する方法
によって行うことが可能である。求める罫線の情報は、
例えば罫線の位置、長さ、太さである。そのような方法
で認識される罫線は、水平方向と垂直方向の罫線である
が、ベクトル解析による罫線認識方法を採用すれば、斜
め罫線も認識可能である。
与えられるようにしてもよい。具体的には、罫線のテン
プレートを使って罫線の位置情報を与え、あるいは、画
像データをディスプレイ24に画面表示し、その画面上
でマウス38又はキーボード30を利用して罫線の位置
を指定し位置情報を与える方法を採用してもよい。
認識する(ステップ204)。ベクトル解析の方法によ
り斜め罫線も認識した場合には、斜め罫線相互の直交部
分も認識する。図3(a)に示すように、垂直方向の罫
線の矩形101の左上頂点の座標を(Vxs,Vys)、右
下頂点の座標を(Vxe,Vye)とし、これと直交する水
平方向の罫線の矩形100の左上頂点の座標を(Hxs,
Hys)、右下頂点の座標を(Hxe,Hye)とすると、直
交部分102は、左上頂点の座標が(Vxs,Hys)、右
下頂点の座標が(Vxe,Hye)の四角形領域として求ま
る。
の黒画素を白画素に置き換える(ステップ205)。か
くして、罫線と罫線の直交部分が画像より消去される。
消去される部分は罫線相互の直交する部分に限定され、
罫線と文字との直交部分は消去されることはない。
画像データに対し、ステップ206〜212の処理ルー
プで罫線の未消去部分を消去する。ステップ206で罫
線を1つ選び、その罫線の消去をステップ207〜21
1の処理ループで行う。この処理は、罫線の始点より終
点へ向かって1画素単位で処理位置を変えながら繰り返
し実行され、罫線の終端まで処理した段階でループを抜
ける。
おいて、罫線の重心付近を横切る、罫線のベクトル方向
に垂直な方向の黒ランの長さを検出する(ステップ20
8)。例えば、図3(b)に示す水平方向の罫線の矩形
100の場合、(Hxs,(Hys+Hye)/2)と(Hxe,
(Hys+Hye)/2)の2点を結ぶ直線111の周辺で、
それを縦方向に横切る黒ランの長さを、左端から右端ま
で処理位置を順次移しながら検出する。検出した黒ラン
の長さと罫線の太さを比較し(ステップ209)、黒ラ
ンの長さが罫線の太さ以下ならば、その黒ランの黒画素
を白画素に置き換える(ステップ210)。ここで、罫
線の太さとは、予めシステムにおいて指定されるかユー
ザに指定された罫線の平均太さのことである。なお、こ
のような静的な閾値処理に代えて、注目した黒ランと直
前の黒ランとの長さの差分が小さい場合に、注目した黒
ランを消去すると判断するような動的な閾値処理を用い
ることも可能である。
プ206に戻って、別の1つの罫線を選び、同様の罫線
消去処理を行う。最後の罫線まで処理したとステップ2
12で判断すると、罫線消去処理は完了し、罫線処理済
みの画像データが出力される(ステップ213)。
触、交差、重複)した文字線を保存しつつ罫線を消去す
ることができる。しかし反面、罫線の文字線が近接した
部分の消去が不完全になる。例えば、図4(a)に示す
文字線121が罫線122に斜めに交差した部分120
の場合、図4(b)に黒領域として表した罫線122の
部分123は、その黒ランの長さが罫線太さより大きい
ため消去されず、ノイズとして残ってしまう。このよう
な消去漏れ部分の面積が十分に小さければ許容できる
が、その面積が無視できない大きさであると、罫線消去
後の画像に対する文字認識等に悪影響がある。次に説明
する本発明の第2の実施例によれば、文字線が斜めに交
差する部分の罫線の消去漏れを大幅に減らすことができ
る。
れを示すフローチャートである。図5において、画像デ
ータの入力のステップ300、罫線認識のステップ30
1、罫線直交部分の認識のステップ302、罫線直交部
分の消去のステップ303は、図2のステップ200,
203,204,205と同様である。なお、入力され
る画像データが2値化されていない場合には、その2値
化処理が必要となる。また、使用メモリ量の削減や処理
時間の短縮のために、画像データの圧縮処理を追加して
もよい。
に対し、ステップ305〜318の処理ループによっ
て、罫線の未消去部分の消去を行う。まず、未処理の罫
線を一つ選び(ステップ305)、初期フラグをオフし
(ステップ306)、当該罫線のベクトル方向に1画素
単位で処理位置をずらしながら、未消去部分を順次に消
去する(ステップ307〜317)。
る、罫線のベクトル方向に垂直な方向の黒ランの長さを
検出する(ステップ308)。これは図2のステップ2
08と同様である(図3(b)参照)。検出した黒ラン
の長さと罫線の太さとの大小判定を行う(ステップ30
9)。黒ランの長さが罫線の太さ以下ならば、その黒ラ
ンは罫線を構成している黒ランとみなし、その黒画素を
白画素に置き換え(ステップ310)、初期フラグをオ
フする(ステップ311)。そして、処理位置が罫線の
終端まで達していなければ、ステップ317よりステッ
プ307に戻り、処理位置を一つ進めて処理を続ける。
きいとステップ309で判断された場合、その黒ランの
長さと、罫線太さや文字太さ(システムにより予め指定
されるかユーザ指定される)より十分に大きく選ばれた
閾値との大小判定を行う(ステップ312)。黒ランの
長さが閾値以上であると判定された場合、罫線と直交し
た文字線と判断されるので、その黒ランを消去しない
で、次の処理位置の処理に進む。例えば、図6(a)に
示すような文字線132と罫線131の交差部分130
においては、黒ランの長さは罫線太さ及び文字太さより
遥かに大きくなるため、消去しない。したがって、図6
(b)に拡大して示すように、罫線131の文字線13
2との交差部分を除いた部分だけが消去され、文字線1
32は保存される。
閾値より小さいと判定された場合、黒ランの重心(中
点)と罫線の重心(太さ方向の中点)とのずれを検出し
(ステップ313)、そのずれが所定の閾値より大きい
か否かを判定し(ステップ314)、ずれが閾値より大
きいときには黒ラン消去のためのステップ315に進む
が、そうでないときには処理位置を1つ進めて処理を続
ける。
図7により具体的に説明する。図7(a)において、1
40は罫線、141は罫線140と交差した文字線であ
る。142は罫線の太さ方向の重心を結んだ線であり、
143は罫線140のベクトル方向に垂直な方向の黒ラ
ンの重心を結んだ線である。罫線140の先頭から文字
線と交差するP1位置の直前までは、その黒ランはステ
ップ310によって消去される。しかし、P1位置で
は、閾値を超える長い黒ランが検出されるためステップ
313に進み、重心のずれ(線142と線143のず
れ)が検出される。そして、図7(a)に示す例のよう
に、重心のずれが大きい場合には、ステップ315に進
む。
フラグはオフであるので、当該処理位置での黒ランの長
さhから罫線の太さbを引いた基準値Xを求める(ステ
ップ315A)。図7(b)は、この基準値Xの求め方
を説明している。そして初期フラグをオンにし(ステッ
プ315B)、当該処理位置の黒ランの、その重心のず
れた方向の端から基準値Xに相当する長さ分を保存し、
残りの部分を消去する(ステップ315C)。図7
(a)の例では、P1位置の黒ランの下端より基準値X
に相当する長さ分を保存し、残りの上の部分の黒画素を
白画素に置き換えることになる。
ランの部分消去を行っていく。重心のずれが閾値より小
さくなるP2位置まで黒ランの部分消去が行われる。P
2位置からは、重心のずれが閾値より小さくなるため黒
ランの部分消去(ステップ315)は行われない。その
結果、図7(c)に示すように罫線140の文字線14
1より上側の三角形状の部分145が消去される。
まではステップ315に進むことなく処理位置が進めら
れるが、P3位置に達するとステップ315に進む。こ
の時点では初期フラグはオンの状態であるので、基準値
Xは再計算されず、P1位置で求められた基準値xが用
いられ、黒ランの重心のずれた側の端より基準値Xの長
さを超えた部分が消去される(ステップ315C)。図
7(a)の例では、黒ランの下端側部分が消去される。
この部分消去はP4位置まで順次行われる。その結果、
図7(c)に示すように罫線140の文字線141より
下側の三角形状の部分146が消去される。このように
して、前記第1実施例では消去できなかった文字線等と
斜めに交差した罫線部分が消去される。P4位置の次の
処理位置からは黒ランの長さが罫線太さ以下となるの
で、ステップ310によって消去される。
ている。150は罫線、151はその重心を結んだ線、
152及び153は罫線150と交差した文字線等の
線、154は罫線太さ方向の黒ランの重心を結んだ線で
ある。この例のような線の交差部分については、ステッ
プ315の部分消去の対象から外されるので、交差線分
と接触した罫線の部分(図8の斜線領域155,15
6)はノイズとして残ってしまう。
の処理ループにより1つの罫線の消去が終了すると、ス
テップ305に戻って次の罫線を一つ選び、その消去処
理を実行する。最後の罫線まで消去処理が終わると、ス
テップ318で処理ループを抜け、罫線処理後の画像デ
ータが出力され(ステップ319)、これが終わると処
理は完了する。
による処理の流れを示すフローチャートである。本実施
例は、罫線の文字線との重複もしくは接触部分の消去漏
れを減らすことができる。
400、罫線認識のステップ401、罫線直交部分の認
識のステップ402、罫線直交部分の消去のステップ4
03は、図2のステップ200,203,204,20
5と同様である。なお、入力される画像データが2値化
されていない場合には、その2値化処理が必要となる。
また、使用メモリ量の削減や処理時間の短縮のために、
画像データの圧縮処理を追加してもよい。
に対し、ステップ405〜413の処理ループによっ
て、罫線の未消去部分と思われる黒ラン消去領域を作成
する。実際の消去は図10に示すステップ415〜42
4の処理ループで行う。
405)、その罫線のベクトル方向に1画素単位で処理
位置をずらしながら、未消去部分と思われる黒ラン消去
領域を作成する(ステップ406〜412)。処理位置
において、罫線の重心付近を横切る、罫線のベクトル方
向に垂直な方向の黒ランの長さを検出する(ステップ4
07)。これは図2のステップ208と同様である(図
3(b)参照)。検出した黒ランの長さと罫線の太さと
の大小判定を行う(ステップ408)。黒ランの長さが
罫線の太さ以下ならば、その黒ランは罫線を構成してい
る黒ランである可能性が高いので、ステップ409に進
む。このステップ409では、ステップ408で罫線の
構成黒ランである可能性が高いと判断された連続した黒
ランを統合した黒ラン消去領域の作成、更新を行う。そ
して、処理位置が罫線の終端まで達していなければ、ス
テップ412よりステップ406に戻り、処理位置を一
つ進めて処理を続ける。
きいとステップ408で判断された場合、その黒ランの
長さと、罫線太さや文字太さより十分に大きく選ばれた
閾値との大小判定を行う(ステップ410)。黒ランの
長さが閾値以上であると判定された場合、交差した文字
の黒ランであるとみなされ、その黒ランは消去対象から
除外され、ステップ412よりステップ406に戻り、
次の処理位置の処理に進む。ステップ410において、
黒ランの長さが閾値より小さいと判定された場合には、
ステップ411に進む。このステップ411では、ステ
ップ410で長さが閾値より小さいと判定された連続し
た黒ランを含む黒ラン消去領域の作成、更新を行う(ス
テップ411)。そして、ステップ412よりステップ
406に戻り、次の処理位置の処理を続ける。
ステップ406〜412の処理ループを抜け、ステップ
405に戻り、次の未処理の罫線に対する処理を始め
る。最後の罫線の処理が終わると、ステップ405〜4
13の処理ループを抜け、ステップ415〜424の処
理ループに入る。
15)、その大きさ(罫線の長さ方向の大きさ)を所定
の閾値より小さいか調べる(ステップ416)。その閾
値より大きさが小さい場合、黒ラン消去領域は罫線では
ないとみなされ、消去の対象から外され、ステップ42
4よりステップ415に戻り、次の黒ラン消去領域の処
理に進む。
合、その黒ラン消去領域内の黒ランの長さの分布(太さ
の分布)、及び、図7に関連して説明した黒ランの重心
と罫線の重心とのずれを求める(ステップ417)。
わたって、黒ラン長がほぼ一定であり、かつ、黒ラン長
が罫線太さを超えないか調べる(ステップ418)。こ
の条件が満たされる場合、その黒ラン消去領域は罫線と
判断できるので、領域内の黒ランの全画素を白画素に置
き換え、黒ランを全体的に消去し(ステップ419)、
当該黒ラン消去領域に対する処理を終わる。
線太さより若干大きく、かつ、変化の小さい黒ラン長が
連続し、前及び/又は後に罫線太さよりかなり大きな黒
ラン長が存在する区間があるか調べる(ステップ42
0)。そのような区間がある場合、その区間は文字と罫
線との重複もしくは接触がある部分と考えられるので、
文字線に相当する部分を残すように当該区間内の黒ラン
を部分的に消去し(ステップ421)、その後にステッ
プ422に進む。
る。図11(a)は罫線160に文字161が重複もし
くは接触した例を示している。その重複もしくは接触し
た部分162を図11(b)に拡大して示す。図11
(b)に示す区間163がステップ420で見つけられ
る。この例では、区間163の黒ランの重心が罫線の重
心に対し上側にずれている。したがって、区間163内
の黒ランの上端より基準値に相当する長さ分だけを残
し、それにより下端側の部分を消去する。基準値として
は、システムにより予め与えられる、又はユーザにより
指定される文字の太さを用いることができる。このよう
な部分消去の結果は図11(c)のようになる。図11
(c)において、網掛け部分が消去された部分である。
なお、罫線160の区間164及び区間165の部分は
それぞれ別個の黒ラン消去領域として抽出され、それぞ
れステップ419により消去される。
の情報を参照し、黒ランの重心と罫線の重心とのずれが
所定の閾値より大きい部分があるか調べる(ステップ4
22)。この閾値は図5のステップ314で用いる閾値
と同様の値でよい。重心のずれが大きい部分がある場
合、罫線に文字線が斜めに交差した部分であると考えら
れるので、ステップ423において、図5のステップ3
15と同様に、斜めに交差した文字線と罫線とのなす三
角形状の領域の黒画素を白画素に置き換え、それがノイ
ズとして残らないようにする処理を行う。
つ処理し、最後の黒ラン消去領域の処理を終わるとステ
ップ424で処理ループから抜ける。そして、消去処理
後の画像データを出力し(ステップ425)、処理を完
了する。
1乃至4の各項記載の発明によれば、見本を用いること
なく、任意の帳票等の画像より、罫線と近接した文字線
を保存しつつ、罫線を消去することができる。請求項2
記載の発明によれば、罫線に文字線が斜めに交差した部
分に罫線の未消去部分を残さない精密な罫線消去が可能
である。請求項3記載の発明によれば、罫線と文字線と
の重複もしくは接触部分に罫線の未消去部分を残さない
精密な罫線消去が可能である。請求項4記載の発明によ
れば、罫線に文字線が斜めに交差した部分及び罫線に文
字線が重複もしくは接触した部分に、罫線の未消去部分
を残さないような精密な罫線消去が可能である。請求項
5記載の発明によれば、請求項1乃至4の各項記載の発
明による罫線消去を、一般的なコンピュータシステムを
利用し容易に実行することができる等々の効果を得られ
る。
用できるコンピュータシステムの一例を示すブロック図
である。
ローチャートである。
である。 (b)罫線の黒ランの長さの検出を説明するための図で
ある。
図である。 (b)罫線と文字線が斜めに交差する部分における罫線
消去漏れによるノイズを説明するための拡大図である。
ローチャートである。
る。 (b)罫線と文字線との直交部に対する処理を説明する
ための拡大図である。
線の重心と黒ランの重心のずれ、及び罫線消去処理を説
明するための図である。
ける罫線の重心と黒ランの重心のずれを示す図である。
ローチャートの前半部分である。
フローチャートの後半部分である。
例を示す図である。 (b)罫線と文字線との重複もしくは接触部分に対する
罫線消去処理を説明するための拡大図である。 (c)罫線と文字線との重複もしくは接触部分に対する
罫線消去処理の結果を示す拡大図である。
Claims (5)
- 【請求項1】 文字と罫線が混在した画像より罫線を消
去する方法であって、罫線の直交部分を認識するステッ
プ、認識された直交部分を消去するステップ、及び、罫
線の重心の付近を垂直に横切る黒ランの中で、罫線の太
さを超えない長さを持つ黒ランを消去するステップを有
することを特徴とする罫線消去方法。 - 【請求項2】 文字と罫線が混在した画像より罫線を消
去する方法であって、罫線の直交部分を認識するステッ
プ、認識された直交部分を消去するステップ、罫線の重
心の付近を垂直に横切る黒ランの中で、罫線の太さを超
えない長さを持つ黒ランを消去するステップ、及び、罫
線の重心の付近を垂直に横切る黒ランで、罫線の太さよ
り大きく、かつ、罫線の太さより十分大きな閾値より小
さい長さを持つ黒ランであって、その重心が罫線の重心
より所定値以上ずれた黒ランについて、その重心のずれ
方向と反対の端側を部分的に消去するステップを有する
ことを特徴とする罫線消去方法。 - 【請求項3】 文字と罫線が混在した画像より罫線を消
去する方法であって、罫線の直交部分を認識するステッ
プ、認識された直交部分を消去するステップ、罫線の重
心の付近を垂直に横切る黒ランの中で、罫線の太さを超
えない長さを持つ黒ランを消去するステップ、及び、罫
線の重心付近を垂直に横切る黒ランであって、罫線の太
さより所定の若干量だけ大きなほぼ一定の長さを持つ黒
ランが連続し、前又は後に罫線の太さより十分に大きな
所定値以上の長さを持つ黒ランが存在する区間を検出
し、その区間内の黒ランについて、その重心の罫線の重
心からずれた方向と反対の端側を部分的に消去するステ
ップを有することを特徴とする罫線消去方法。 - 【請求項4】 文字と罫線が混在した画像より罫線を消
去する方法であって、罫線の直交部分を認識するステッ
プ、認識された直交部分を消去するステップ、罫線の重
心の付近を垂直に横切る黒ランの中で、罫線の太さを超
えない長さを持つ黒ランを消去するステップ、罫線の重
心の付近を垂直に横切る黒ランで、罫線の太さより大き
く、かつ、罫線の太さより十分大きな閾値より小さい長
さを持つ黒ランであって、その重心が罫線の重心より所
定値以上ずれた黒ランについて、その重心のずれ方向と
反対の端側を部分的に消去するステップ、及び、罫線の
重心付近を垂直に横切る黒ランであって、罫線の太さよ
り所定の若干量だけ大きなほぼ一定の長さを持つ黒ラン
が連続し、前又は後に罫線の太さより十分に大きな所定
値以上の長さを持つ黒ランが存在する区間を検出し、そ
の区間内の黒ランについて、その重心の罫線の重心から
ずれた方向と反対の端側を部分的に消去するステップを
有することを特徴とする罫線消去方法。 - 【請求項5】 請求項1、2、3又は4記載の罫線消去
方法の各処理ステップをコンピュータに実行させるため
のプログラムを記録した機械読み取り可能な媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05199797A JP3846752B2 (ja) | 1997-03-06 | 1997-03-06 | 罫線消去方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05199797A JP3846752B2 (ja) | 1997-03-06 | 1997-03-06 | 罫線消去方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10254991A true JPH10254991A (ja) | 1998-09-25 |
JP3846752B2 JP3846752B2 (ja) | 2006-11-15 |
Family
ID=12902499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP05199797A Expired - Fee Related JP3846752B2 (ja) | 1997-03-06 | 1997-03-06 | 罫線消去方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3846752B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006004271A (ja) * | 2004-06-18 | 2006-01-05 | Fujitsu Ltd | 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 |
US7003159B2 (en) | 2000-07-28 | 2006-02-21 | Ricoh Co., Ltd. | Document frame recognition system and method |
JP2015036992A (ja) * | 2013-08-15 | 2015-02-23 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 文字のストロークを保護しながら、文書画像中の下線およびテーブルラインを除去する方法 |
CN105469026A (zh) * | 2014-09-30 | 2016-04-06 | 柯尼卡美能达美国研究所有限公司 | 针对文档图像的水平和垂直线检测和移除 |
WO2019150628A1 (ja) * | 2018-01-30 | 2019-08-08 | 三菱電機株式会社 | 記入領域抽出装置および記入領域抽出プログラム |
-
1997
- 1997-03-06 JP JP05199797A patent/JP3846752B2/ja not_active Expired - Fee Related
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7003159B2 (en) | 2000-07-28 | 2006-02-21 | Ricoh Co., Ltd. | Document frame recognition system and method |
JP2006004271A (ja) * | 2004-06-18 | 2006-01-05 | Fujitsu Ltd | 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 |
JP4571447B2 (ja) * | 2004-06-18 | 2010-10-27 | 富士通株式会社 | 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 |
JP2015036992A (ja) * | 2013-08-15 | 2015-02-23 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 文字のストロークを保護しながら、文書画像中の下線およびテーブルラインを除去する方法 |
CN105469026B (zh) * | 2014-09-30 | 2019-04-09 | 柯尼卡美能达美国研究所有限公司 | 针对文档图像的水平和垂直线检测和移除 |
JP2016072958A (ja) * | 2014-09-30 | 2016-05-09 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 文書画像における縦線および横線の検出および削除 |
CN105469026A (zh) * | 2014-09-30 | 2016-04-06 | 柯尼卡美能达美国研究所有限公司 | 针对文档图像的水平和垂直线检测和移除 |
WO2019150628A1 (ja) * | 2018-01-30 | 2019-08-08 | 三菱電機株式会社 | 記入領域抽出装置および記入領域抽出プログラム |
JP2019133320A (ja) * | 2018-01-30 | 2019-08-08 | 三菱電機インフォメーションシステムズ株式会社 | 記入領域抽出装置および記入領域抽出プログラム |
CN111630522A (zh) * | 2018-01-30 | 2020-09-04 | 三菱电机株式会社 | 记入区域提取装置和记入区域提取程序 |
GB2583258A (en) * | 2018-01-30 | 2020-10-21 | Mitsubishi Electric Corp | Entry area extraction device and entry area extraction program |
GB2583258B (en) * | 2018-01-30 | 2021-03-24 | Mitsubishi Electric Corp | Entry field extraction device and entry field extraction program |
US11430241B2 (en) | 2018-01-30 | 2022-08-30 | Mitsubishi Electric Corporation | Entry field extraction device and computer readable medium |
CN111630522B (zh) * | 2018-01-30 | 2023-09-26 | 三菱电机株式会社 | 记入区域提取装置和计算机能读取的记录介质 |
Also Published As
Publication number | Publication date |
---|---|
JP3846752B2 (ja) | 2006-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4388545B2 (ja) | 画像処理装置及び方法、並びにプログラム | |
JPH10105361A (ja) | オブジェクト指定方法及びシステム | |
US8212815B2 (en) | Drawing apparatus, drawing program, and drawing method | |
US20020051574A1 (en) | Character recognition method, program and recording medium | |
US6810147B2 (en) | Document image processing apparatus for processing line portions manually input to document image, method therefor, and computer readable recording medium recorded with document image processing program therefor | |
JP3615333B2 (ja) | 罫線消去装置 | |
JPH05334383A (ja) | 画像図形編集装置 | |
JPH10254991A (ja) | 罫線消去方法及び機械読み取り可能な媒体 | |
JP4908867B2 (ja) | 地理画像処理システム | |
JP2878194B2 (ja) | 画像データの部分消去および部分検出方法 | |
JP3516541B2 (ja) | 建設図面の寸法情報認識方法及び認識装置 | |
JP5074622B2 (ja) | 地理画像処理システム | |
JP3516540B2 (ja) | 建設図面認識方法及び認識装置 | |
JPH1153539A (ja) | 円形パターン判定方法および記録媒体 | |
JP2001236464A (ja) | 文字抽出方法、文字抽出装置及び記憶媒体 | |
JP4297815B2 (ja) | 情報処理装置および処理方法およびプログラムおよび記録媒体 | |
JP4040231B2 (ja) | 文字抽出方法及び装置並びに記憶媒体 | |
JPH07295733A (ja) | 手書きストローク編集装置 | |
JPH10312460A (ja) | 画像処理方法及び高精度画像処理装置 | |
JP3329528B2 (ja) | ドキュメント読取り装置 | |
JPH1091787A (ja) | 線図形認識方法及び線図形認識装置 | |
JP2003030585A (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JP2003030584A (ja) | 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体 | |
JPH03233787A (ja) | 文字画像抽出装置 | |
JP5505953B2 (ja) | 画像判別システム、その方法及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060818 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090901 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100901 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110901 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130901 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |