JP4089849B2 - 罫線処理装置および記録媒体 - Google Patents
罫線処理装置および記録媒体 Download PDFInfo
- Publication number
- JP4089849B2 JP4089849B2 JP02387099A JP2387099A JP4089849B2 JP 4089849 B2 JP4089849 B2 JP 4089849B2 JP 02387099 A JP02387099 A JP 02387099A JP 2387099 A JP2387099 A JP 2387099A JP 4089849 B2 JP4089849 B2 JP 4089849B2
- Authority
- JP
- Japan
- Prior art keywords
- run
- rectangle
- processing apparatus
- setting
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、入力画像から文字矩形、四角枠などを精度よく判定する罫線処理装置および罫線処理プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
本出願人は先に、入力画像から特定方向の黒ランを抽出し、抽出された黒ランの中点の点列を芯線として抽出し、また、入力画像上の黒画素連結成分に外接する矩形の領域において2個以上の芯線が抽出された場合に、その矩形の領域を文字領域と判定する線図形画像処理方法を提案した(特願平9−40811号)。
【0003】
【発明が解決しようとする課題】
しかし、上記提案した従来の方法では、連結矩形中に含まれるノイズなどにより、文字でないにも係らず文字として誤って判定することがあった。
【0004】
本発明は上記した問題を解決するためになされたもので、
本発明の目的は、漢字や数字などは、ある一定の領域内に複数の直線成分を持った線で構成されていることを考慮して、連結矩形から、この直線成分を取り出し、その性質を基に文字矩形か否かを判定することにより、ノイズに強い罫線処理装置および記録媒体を提供することにある。
【0005】
【課題を解決するための手段】
前記目的を達成するために、請求項1記載の発明では、入力された画像の主走査方向および副走査方向におけるランを抽出する手段と、前記抽出されたランの頻度分布を求める手段と、前記頻度分布を基に所定の閾値を設定する手段と、前記所定の閾値より大きなランを用いて連結矩形を抽出する手段と、前記抽出された連結矩形から罫線を抽出する手段と、所定領域内の主走査方向および副走査方向に所定本数以上の罫線が存在しているとき、文字矩形と判定する手段とを備えたことを特徴としている。
【0006】
請求項2記載の発明では、前記閾値を設定する手段は、前記頻度分布の微分値を基に前 記所定の閾値を設定することを特徴としている。
【0007】
請求項3記載の発明では、前記頻度分布に対してデジタルフィルタ処理を行う手段を更に備えたことを特徴としている。
【0008】
請求項4記載の発明では、前記閾値を設定する手段は、前記頻度分布を基に前記所定の閾値を設定するとき、頻度分布のピークよりも大きい部分に閾値を設定することを特徴としている。
【0009】
請求項5記載の発明では、請求項1乃至4のいずれか1項に記載の罫線処理装置の各手段として、コンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴としている。
【0010】
【発明の実施の形態】
以下、本発明の一実施例を図面を用いて具体的に説明する。
(実施例1)
図1は、本発明の実施例1の構成を示し、図2は、実施例1の処理フローチャートを示す。図において、1は画像入力部、2は原画メモリ、3はラン抽出部、4は連結矩形抽出部、5は罫線抽出部、6は文字矩形判定部である。
【0011】
以下、図2を参照しながら、実施例1の処理動作を説明する。スキャナなどの画像入力部1で原稿を読み取り、入力画像を原画メモリ2に格納する(ステップ101)。ラン抽出部3は、原画メモリ2内の画像データの主走査方向についてランを抽出し、メモリに格納する(ステップ102)。
【0012】
次いで、連結矩形抽出部4は、主走査方向において抽出されたランについて、所定の閾値(固定閾値)より大きなランのみを対象に連結矩形の抽出を行い(ステップ103)、罫線抽出部5は、抽出された連結矩形から罫線(直線成分)を抽出する(ステップ104)。副走査方向についても同様の処理を行い(ステップ106)、罫線を抽出する。
【0013】
文字矩形判定部6は、主走査方向/副走査方向の何れにも3本以上の罫線が所定領域に存在していれば(ステップ107)、該所定領域を文字矩形として判定する(ステップ108)。
【0014】
(実施例2)
実施例2は、アンケート用紙などに使用されている中抜きの四角枠を判定する実施例である。図3は、実施例2の構成を示し、実施例1の文字矩形判定部を、四角枠判定部7に置き換えて構成している。図4は、実施例2の処理フローチャートである。ステップ206までの処理は実施例1と同様である。
【0015】
四角枠判定部7は、主走査方向/副走査方向の何れにも2本の罫線が所定領域に存在し、それぞれの罫線の始点と終点が一致していれば(ステップ207)、四角枠として判定する(ステップ208)。
【0016】
(実施例3)
実施例3は、黒地に白抜きで表現されている反転文字領域を判定する実施例である。図5は、実施例3の構成を示し、実施例1の文字矩形判定部を、反転文字領域判定部8に置き換えて構成している。また、図6は、実施例3の処理フローチャートであり、ステップ306までの処理は実施例1と同様である。
【0017】
ステップ307において、全ての罫線を抽出した後、反転文字領域判定部8は、罫線の幅の平均をとり、平均値に所定値を付加した値よりも、罫線幅が大きい領域を、反転文字領域として判定する(ステップ308)。
【0018】
(実施例4)
上記した実施例1から3または従来の方法では、固定閾値を用いて罫線を抽出している。このため、表の中に含まれる文字の大きさよりも少し大きな長さを持った線を抽出することが難しい。これは、あらゆるドキュメントにおいて文字内に罫線が抽出されないような、ある程度大きな固定の閾値を設定する必要があるためである。このように、従来の方法では、ある程度大きな固定の閾値を設定しているので、文字内の疑似罫線の抽出を抑えることができるが、逆に、文字サイズよりも少し大きい程度の短い罫線を抽出することができない。
【0019】
そこで、本実施例では、閾値を固定値ではなく、読み取り原稿の特徴から閾値を推定し、この閾値を基に罫線を判別している。
【0020】
図7は、実施例4の構成を示す。実施例1との相違点は、連結矩形抽出部24と、ID付与部25と、矩形ID選択部26と、頻度計数部27と、閾値設定部28と、連結矩形抽出部29を設けた点である。図8は、実施例4の処理フローチャートである。
【0021】
入力画像を原画メモリ22に格納し(ステップ401)、ラン抽出部23は、主走査方向においてランを抽出しメモリに格納する(ステップ402)。連結矩形抽出部24は、メモリ上のランを使って連結矩形を抽出し、ID付与部25は連結矩形に矩形ID(シリアル番号)を付与し、その矩形IDを、その連結矩形成分を構成する全てのランにも付与する(ステップ403)。矩形ID選択部26は、ある特定の(つまり、処理対象となる)連結矩形(矩形ID)を選択し(ステップ404)、頻度計数部27は指定された矩形IDをもつランを検索し、頻度を計数する(ステップ405)。
【0022】
次いで、閾値設定部28は、ラン頻度の分布を基に閾値を求める(ステップ406)。連結矩形抽出部29は、主走査方向における抽出されたランについて、上記算出された閾値より大きなランのみを対象に連結矩形の抽出を行う(ステップ407)。罫線抽出部30は、抽出された連結矩形から罫線を抽出する(ステップ408)。副走査方向についても同様の処理を行い(ステップ410)、罫線を抽出する。
【0023】
文字矩形判定部31は、主走査方向/副走査方向の何れにも3本以上の罫線が所定領域に存在していれば(ステップ411)、文字矩形として判定する(ステップ412)。
【0024】
ここで、上記したランの頻度分布から閾値を求める方法として、本実施例では、以下の2つの方法を採る。
【0025】
図9は、第1の方法を説明する図である。第1の方法では、ランレングスの小さい方から分布のピークを探索する。次いで、分布平面上でピークを通る傾きが負の直線を仮定し、すべての分布点と直線との距離を求め、その和をとる。すべての直線について、演算を行い、和が一番小さい直線を求める。そして、その直線と、分布がゼロと交差するランレングスを閾値と設定する。
【0026】
図10は、第2の方法を説明する図である。分布平面上で傾きがゼロの直線を仮定し、すべての分布点と直線との距離を求め、その和をとる。すべての直線について、演算を行い、和が一番小さい直線を求める。その直線が分布と交差する点をランレングスの閾値とする。
【0027】
(実施例5)
一般的に、縦線と横線を含む表の枠の連結矩形成分のラン頻度分布は、図11に示すようになる。すなわち、ランレングス1〜10が縦線のラン分布であり、10〜28が縦線あるいは横線に接触している文字のラン分布となっている。29以上のラン分布は横線のラン分布である。図11の分布では、閾値を29に設定することにより、横線のみが抽出できる。分布の微分値がゼロ、つまりラン分布が変化しなくなったら、その点が閾値となる。本実施例では、この閾値を探索するために差分を使用している。
【0028】
図12は、実施例5の構成を示す。実施例4と相違する点は、差分計算部32を設けた点である。図13は、実施例5の処理フローチャートを示す。
【0029】
差分計算部32は、頻度分布についてランレングスの小さい方から順に、隣の頻度との差分を求める(ステップ506)。閾値設定部28は、差分がゼロとなったランレングスを閾値とする(ステップ507)。以下、実施例4と同様に、連結矩形抽出部29は、主走査方向において、設定された閾値より大きなランのみを対象に連結矩形の抽出を行い(ステップ508)、罫線抽出部30は抽出された連結矩形から罫線を抽出する(ステップ509)。
【0030】
(実施例6)
オフィスで作成される表を含む文書のラン分布は、概ね図11に示す傾向となるが、上記した実施例5のように差分を求めたとき、ノイズ等によって、ランレングス値29より小さい値でも隣の分布頻度値と一致することがある。あるいは、29より大きいランレングスでも、頻度値としては10またはそれ以上の頻度値となる場合もあり、頻度値が隣と一致する場合が必ずあるとは限らない。これは、ラン分布にのっている高周波成分のノイズが原因である。
【0031】
一般に、高周波成分ノイズはFIR(Finit Impulse Response)型デジタルフィルタで除去することができる。そこで、本実施例では、デジタルフィルタを使用して、高周波ノイズに相当する部分を除去する。
【0032】
図14は、実施例6の構成を示し、実施例5の構成にさらにフィルタ処理部33を付加したものである。また、図15は、実施例6の処理フローチャートを示す。ステップ601〜605、ステップ607〜612は、実施例5の処理と同様である。ステップ606では、フィルタ処理部33において、頻度分布に対してデジタルフィルタ(ローパスフィルタ)をかけて高周波ノイズを除去する。
【0033】
(実施例7)
図16は、横線のみのラン分布を示す。ラン分布を連結矩形単位でとると、表の枠を構成する連結矩形や、横線を構成する連結矩形が含まれる。横線のみの連結矩形を、閾値33の付近で取り出すためには、ラン分布のピークより大きい位置で、微分値がゼロになる点を探せば良い。
【0034】
図17は、実施例7の構成を示す。実施例6と相違する点は、ピーク検出部34を設けた点と、差分計算部32の処理内容が異なる点である。図18は、実施例7の処理フローチャートである。
【0035】
ステップ706までの処理は実施例6と同様である。ステップ707では、ピーク検出部34は、頻度分布におけるランレングスの小さい方から、2次微分値がゼロあるいは微分値の符号が変化する点を探索し、ピークとする。次いで、差分計算部32は、ピークより後方で、隣の頻度との差分を求める(ステップ708)。閾値設定部28は、差分がゼロとなったランレングスを閾値とする(ステップ709)。以下の処理は、実施例6と同様であるので、説明を省略する。
【0036】
(実施例8)
表を認識する際には、連結矩形抽出を繰返し行う必要があり、その都度、原画からランを抽出して、連結矩形を抽出すると処理に時間を要する。そこで、ラン情報のみをあらかじめ用意しておくことにより、ランを使った他の特徴量の抽出等の処理時間を短縮できる。
【0037】
つまり、ランの属性を保持することで、処理の結果を累積的に保持できるため、認識が終了したランを、その次の認識処理から除くことができ、その結果、認識処理全体の処理時間の短縮が可能となる。同時にラン単位で認識が可能となるため、細部にわたって精度の高い認識処理が可能となる。また、ラン情報に変換されているため、各種の画像処理を短時間で行うことができる。
【0038】
図19は、実施例8の構成を示す。この実施例では、実施例7の構成にさらに属性情報記録部35と文字データ消去部36を付加している。また、図20は、実施例8の処理フローチャートである。ステップ803において、ラン抽出部23は、抽出したランに対応するラン属性情報(例えば文字、線などの属性)を保持する領域を確保する。
【0039】
属性情報記録部35は、文字矩形判定部31で文字矩形として判定された矩形内において、連結矩形を構成するランに文字であることを示すマークを記録する(ステップ817)。次いで、文字データ消去部36では、抽出されたランを調べ、文字であるマークが付与されているランに対応する原画上の黒画素を消去する(ステップ818)。
【0040】
なお、ラン属性情報としては、この他に、ランが線、写真などの画像、ノイズ、線ノイズ、背景などのどれに属しているかを示す属性を保持するようにしてもよい。
【0041】
(実施例9)
実施例9は、本発明をソフトウェアによって実現する場合の実施例である。図21は、実施例9のシステム構成例を示す。CD−ROMなどの記録媒体には、本発明の罫線処理機能または処理手順が記録されていて、これをシステムにインストールする。スキャナなどにセットされた原稿を読み取り、メモリ上に展開された原稿画像から罫線を抽出し、抽出された罫線の本数を基に所定領域が文字矩形であるか否かを判定し、その判定結果をディスプレイなどに表示出力する。
【0042】
【発明の効果】
以上、説明したように、請求項1、5記載の発明によれば、所定領域内の連結矩形の直線成分(罫線)を調べることによって精度良く文字矩形であるか否かを判定することができる。また、従来の固定閾値では抽出できない短い罫線を抽出することができる。また、分布自体は表の大きさに依存しないため、大きな表や小さな表を同じ処理方法によって処理することができる。つまり、本発明の処理方法は解像度に依存しない。
【0043】
請求項2記載の発明によれば、分布の微分値から閾値を推定しているので、より正確な閾値推定が可能となる。
【0044】
請求項3記載の発明によれば、分布にのっている高周波ノイズを除去しているので、より正確な閾値の推定が可能となる。
【0045】
請求項4記載の発明によれば、縦線、横線を含む表枠だけではなく、単なる直線からなる分布に対しても適切な閾値を推定できる。
【図面の簡単な説明】
【図1】 本発明の実施例1の構成を示す。
【図2】 本発明の実施例1の処理フローチャートを示す。
【図3】 本発明の実施例2の構成を示す。
【図4】 本発明の実施例2の処理フローチャートを示す。
【図5】 本発明の実施例3の構成を示す。
【図6】 本発明の実施例3の処理フローチャートを示す。
【図7】 本発明の実施例4の構成を示す。
【図8】 本発明の実施例4の処理フローチャートを示す。
【図9】 閾値を求める第1の方法を説明する図である。
【図10】 閾値を求める第2の方法を説明する図である。
【図11】 一般的な表を含むラン頻度分布を示す。
【図12】 本発明の実施例5の構成を示す。
【図13】 本発明の実施例5の処理フローチャートを示す。
【図14】 本発明の実施例6の構成を示す。
【図15】 本発明の実施例6の処理フローチャートを示す。
【図16】 横線のみのラン頻度分布を示す。
【図17】 本発明の実施例7の構成を示す。
【図18】 本発明の実施例7の処理フローチャートを示す。
【図19】 本発明の実施例8の構成を示す。
【図20】 本発明の実施例8の処理フローチャートを示す。
【図21】 本発明の実施例9の構成を示す。
【符号の説明】
1 画像入力部
2 原画メモリ
3 ラン抽出部
4 連結矩形抽出部
5 罫線抽出部
6 文字矩形判定部
Claims (5)
- 入力された画像の主走査方向および副走査方向におけるランを抽出する手段と、前記抽出されたランの頻度分布を求める手段と、前記頻度分布を基に所定の閾値を設定する手段と、前記所定の閾値より大きなランを用いて連結矩形を抽出する手段と、前記抽出された連結矩形から罫線を抽出する手段と、所定領域内の主走査方向および副走査方向に所定本数以上の罫線が存在しているとき、文字矩形と判定する手段とを備えたことを特徴とする罫線処理装置。
- 前記閾値を設定する手段は、前記頻度分布の微分値を基に前記所定の閾値を設定することを特徴とする請求項1記載の罫線処理装置。
- 前記頻度分布に対してデジタルフィルタ処理を行う手段を更に備えたことを特徴とする請求項1または2記載の罫線処理装置。
- 前記閾値を設定する手段は、前記頻度分布を基に前記所定の閾値を設定するとき、頻度分布のピークよりも大きい部分に閾値を設定することを特徴とする請求項1記載の罫線処理装置。
- 請求項1乃至4のいずれか1項に記載の罫線処理装置の各手段として、コンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02387099A JP4089849B2 (ja) | 1999-02-01 | 1999-02-01 | 罫線処理装置および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02387099A JP4089849B2 (ja) | 1999-02-01 | 1999-02-01 | 罫線処理装置および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000222577A JP2000222577A (ja) | 2000-08-11 |
JP4089849B2 true JP4089849B2 (ja) | 2008-05-28 |
Family
ID=12122492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02387099A Expired - Fee Related JP4089849B2 (ja) | 1999-02-01 | 1999-02-01 | 罫線処理装置および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4089849B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4329764B2 (ja) | 2006-01-17 | 2009-09-09 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置および罫線抽出プログラム |
JP4424309B2 (ja) | 2006-01-23 | 2010-03-03 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、文字判定プログラム、および文字判定方法 |
JP5262778B2 (ja) | 2009-02-05 | 2013-08-14 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
-
1999
- 1999-02-01 JP JP02387099A patent/JP4089849B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000222577A (ja) | 2000-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
EP1146478B1 (en) | A method for extracting titles from digital images | |
Kise et al. | Segmentation of page images using the area Voronoi diagram | |
JP5171421B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP4089849B2 (ja) | 罫線処理装置および記録媒体 | |
JPH1031716A (ja) | 文字行抽出方法および装置 | |
JP4129898B2 (ja) | 文字サイズ推定方法および装置 | |
JP4867894B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
JP4381455B2 (ja) | 文字サイズ推定方法、装置および記録媒体 | |
JP2008004116A (ja) | 映像中の文字検索方法及び装置 | |
JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
JPH11316797A (ja) | 文書画像の領域識別方法および装置 | |
JP2000306102A (ja) | 罫線識別方法および記録媒体 | |
JP4731748B2 (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JP2004246597A (ja) | 画像処理装置、記録媒体およびプログラム | |
JP4064068B2 (ja) | 画像処理装置と画像処理方法及び記録媒体 | |
JP4738645B2 (ja) | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 | |
JP2000259826A (ja) | 罫線抽出方法、装置および記録媒体 | |
JP2001236464A (ja) | 文字抽出方法、文字抽出装置及び記憶媒体 | |
JP3585143B2 (ja) | 文字列抽出方法および装置 | |
JP2000163571A (ja) | 罫線認識方法、装置および記録媒体 | |
JP2001126028A (ja) | 罫線識別方法、罫線識別装置および記録媒体 | |
JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
JP2000181990A (ja) | 罫線処理方法、装置および記録媒体 | |
JP3220481B2 (ja) | 原稿の空白領域抽出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070919 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071101 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080221 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110307 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120307 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130307 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140307 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |