JPH02252081A - 線分の検出方法 - Google Patents
線分の検出方法Info
- Publication number
- JPH02252081A JPH02252081A JP1075274A JP7527489A JPH02252081A JP H02252081 A JPH02252081 A JP H02252081A JP 1075274 A JP1075274 A JP 1075274A JP 7527489 A JP7527489 A JP 7527489A JP H02252081 A JPH02252081 A JP H02252081A
- Authority
- JP
- Japan
- Prior art keywords
- line
- line segment
- detected
- segments
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 22
- 238000001514 detection method Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 6
- 238000007639 printing Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、線分の検出方法に関し、例えば文字認識の前
処理段階に於ける線分の検出方法に関する。
処理段階に於ける線分の検出方法に関する。
本発明は、線分を含む印刷文書をイメージスキャナ等を
用いて人力された文書画像情報から、所定の長さ以上の
線素を検出し、検出された複数の線素の連結状態に応じ
て、少なくとも1つの線素を有する線分を検出すること
により、多少のIIJiきがある線分や印刷時の掠れを
有する線分でも正しく検出ができるようにしたものであ
る。
用いて人力された文書画像情報から、所定の長さ以上の
線素を検出し、検出された複数の線素の連結状態に応じ
て、少なくとも1つの線素を有する線分を検出すること
により、多少のIIJiきがある線分や印刷時の掠れを
有する線分でも正しく検出ができるようにしたものであ
る。
文字、アンダーライン、表等が混在する印刷文書の文字
認識を行う場合、入力文書画像から文字でない線分を抽
出し、消去することは、文字認識を行うための前段階の
処理として重要である。
認識を行う場合、入力文書画像から文字でない線分を抽
出し、消去することは、文字認識を行うための前段階の
処理として重要である。
現在オフィスでは、オフィス・オートメンジョン化が進
み、文書はワード・プロセッサ(以下、ワープロという
、)等で作成することが一般的になりつつある。ところ
でワープロで作成された文書はフロッピ・ディスク等に
ファイルされている。
み、文書はワード・プロセッサ(以下、ワープロという
、)等で作成することが一般的になりつつある。ところ
でワープロで作成された文書はフロッピ・ディスク等に
ファイルされている。
しかし各社のワープロのフロッピ・ディスクの仕様が異
なり、まだ印刷された文書紙面が媒体となってデータの
交換が行われているが現状である。
なり、まだ印刷された文書紙面が媒体となってデータの
交換が行われているが現状である。
また、近年印刷文書の認識技術の発達、特に文字認識の
実用化に伴い印刷物の電子化が容易に成りつつある0例
えば、特開昭6i−741ot号、62−74182号
、6.2−74183号、62−74104号にて本件
発明者が開示した文字認識装置がある。
実用化に伴い印刷物の電子化が容易に成りつつある0例
えば、特開昭6i−741ot号、62−74182号
、6.2−74183号、62−74104号にて本件
発明者が開示した文字認識装置がある。
ところで、印刷物に文字、表、写真等が混じっている場
合は、これらを自動的に区別することができる製品は少
く、また図形や表内にある文字は、文字として認識でき
ないのが現状である。1例えば表内の文字の認識につい
ては表の枠が邪魔しているために文字のP!識ができず
、まだ裏全体を一図形として処理しているのが現状であ
る。
合は、これらを自動的に区別することができる製品は少
く、また図形や表内にある文字は、文字として認識でき
ないのが現状である。1例えば表内の文字の認識につい
ては表の枠が邪魔しているために文字のP!識ができず
、まだ裏全体を一図形として処理しているのが現状であ
る。
また、図面認識や領域抽出法の分野では、線分の検出方
法が研究されており、細線化方法、輪郭ベクトル対の中
心検出方法、方向別黒ランの最短の中心検出方法、円弧
追跡法、周辺分布による検出方法、綿密度による検出方
法等の線分の検出方法が提案されている。しかし、これ
らの方法では線分の始点の座標、終点の座標等の特徴量
は検出できても、例えば線分には太さがあり、文字認識
の前処理段階で必要とされる完全な線分の消去ができな
かった。したがって、主として文字認識の前処理である
線分の消去を効果的に行える線分の検出方法が望まれて
いる。
法が研究されており、細線化方法、輪郭ベクトル対の中
心検出方法、方向別黒ランの最短の中心検出方法、円弧
追跡法、周辺分布による検出方法、綿密度による検出方
法等の線分の検出方法が提案されている。しかし、これ
らの方法では線分の始点の座標、終点の座標等の特徴量
は検出できても、例えば線分には太さがあり、文字認識
の前処理段階で必要とされる完全な線分の消去ができな
かった。したがって、主として文字認識の前処理である
線分の消去を効果的に行える線分の検出方法が望まれて
いる。
本発明に係る線分の検出方法は、上述の実情に鑑みてな
されたものであり、例えば表を単なる図形としてではな
く、表の枠と文字とを識別して文字認識ができるように
するための線分の検出方法の提供を目的とする。
されたものであり、例えば表を単なる図形としてではな
く、表の枠と文字とを識別して文字認識ができるように
するための線分の検出方法の提供を目的とする。
(!!iffを解決するための手段)
本発明に係る線分検出方法は、上述したような課題を解
決するために、第1図に示すように、文書画像入カニ程
31において入力された文書画像情報から、所定の長さ
以上の線素を検出する工程S2と、検出された複数の線
素の連結状態に応じて、少な(とも1つの線素を有する
線分を検出する工程S3とを有することを特徴としてい
る。
決するために、第1図に示すように、文書画像入カニ程
31において入力された文書画像情報から、所定の長さ
以上の線素を検出する工程S2と、検出された複数の線
素の連結状態に応じて、少な(とも1つの線素を有する
線分を検出する工程S3とを有することを特徴としてい
る。
本発明に係る線分の検出方法によれば、線素を所定の条
件の下に検出し、検出された各線素の連結状態を判断し
、線分を1つ以上の線素の集合とみなして線分を検出す
ることにより、多少の傾きがある線分や印刷時の掠れを
有する線分でも正しく検出できる。
件の下に検出し、検出された各線素の連結状態を判断し
、線分を1つ以上の線素の集合とみなして線分を検出す
ることにより、多少の傾きがある線分や印刷時の掠れを
有する線分でも正しく検出できる。
以下、本発明に係る一実施例について図面を参照しなが
ら説明する。
ら説明する。
先ず、本実施例の線分の検出方法及び該線分の検出方法
によって得られた情報を用いて線分を消去する方法の概
略を第1図に示すフローチャート用いて説明する。
によって得られた情報を用いて線分を消去する方法の概
略を第1図に示すフローチャート用いて説明する。
文書画像入カニ程Slにおいて、線分を含む文書、例え
ばアンダーラインや表を含む印刷文書をイメージスキャ
ナ(以下スキャナと言う、)等を用いて2値化された文
書画像として入力する。以下、ここでスキャナで入力し
た場合の1走査線上の黒いラインを黒ランというものと
する。
ばアンダーラインや表を含む印刷文書をイメージスキャ
ナ(以下スキャナと言う、)等を用いて2値化された文
書画像として入力する。以下、ここでスキャナで入力し
た場合の1走査線上の黒いラインを黒ランというものと
する。
次に線素検出工程S2に進む、この工程S2は、上記文
書画像入カニ程Slで入力された文書画像内の線分を後
述する線素の集合と見なし、上記スキャナの特性や印刷
時の掠れ等によって線素が途中で切れた状態で入力され
た場合、この途切れを修正する線素統合ステップS2a
と、文書画像内の文字と線分とを区別するために所定の
長さ以上の線素のみを検出するステップS2bとから成
る。
書画像入カニ程Slで入力された文書画像内の線分を後
述する線素の集合と見なし、上記スキャナの特性や印刷
時の掠れ等によって線素が途中で切れた状態で入力され
た場合、この途切れを修正する線素統合ステップS2a
と、文書画像内の文字と線分とを区別するために所定の
長さ以上の線素のみを検出するステップS2bとから成
る。
次に線分検出工程S3に進む、この工程S3は、上記線
素検出工程S2で検出された複数の線素の連結状態を検
出するステップS3aと、連結状態に応じて後述する線
分テーブルを作成するステップS3bとから成る。
素検出工程S2で検出された複数の線素の連結状態を検
出するステップS3aと、連結状態に応じて後述する線
分テーブルを作成するステップS3bとから成る。
次に線分消去工程S4に進む。この工程S4は、文字と
表等が混在する印刷文書の文字認識を行う場合に必要な
線分を消去する工程であり、上記線分検出工程S3で作
成された線分テーブルを用いて、消去範囲を拡張するス
テップ34aと、線分を消去するステップS4bから成
る。以下、各工程の詳細を説明する。
表等が混在する印刷文書の文字認識を行う場合に必要な
線分を消去する工程であり、上記線分検出工程S3で作
成された線分テーブルを用いて、消去範囲を拡張するス
テップ34aと、線分を消去するステップS4bから成
る。以下、各工程の詳細を説明する。
文書画像入カニ程Slにおいて、文書中に存在するアン
ダーライン、表の枠等の水平方向の任意の線分IOは、
スキャナで入力すると、第2図に示す線分10のように
スキャナの分解能に対応した幅の水平方向の複数の黒ラ
ン[11,B2.[13,84の集合として表現され、
この集合の全体の幅は線分の幅に対応している。ところ
で、上記水平方向の線分はスキャナ入力時の傾きの影響
を受けやすく、見た目には水平であっても、完全な水平
状態で入力されるのは殆ど無く、第2図に示す右に(引
いた線分11、左に傾いた線分12のように複数の黒ラ
ンBl、B2.B3.B4の連結として表現される。
ダーライン、表の枠等の水平方向の任意の線分IOは、
スキャナで入力すると、第2図に示す線分10のように
スキャナの分解能に対応した幅の水平方向の複数の黒ラ
ン[11,B2.[13,84の集合として表現され、
この集合の全体の幅は線分の幅に対応している。ところ
で、上記水平方向の線分はスキャナ入力時の傾きの影響
を受けやすく、見た目には水平であっても、完全な水平
状態で入力されるのは殆ど無く、第2図に示す右に(引
いた線分11、左に傾いた線分12のように複数の黒ラ
ンBl、B2.B3.B4の連結として表現される。
次に、線素検出工程S2において、先ず線素の統合ステ
ップS2aを第3図を用いて説明する。
ップS2aを第3図を用いて説明する。
第3図は、上記スキャナで水平方向に走査した場合の任
意の1走査線上の線素を表したものである。
意の1走査線上の線素を表したものである。
元々は一本の線素であっても、スキャナの特性や印刷時
の掠れ等によって線素が途中で切れた状態(黒ラン[1
5,B6. [17,[1Bの状態)で表現される場合
があり、線素を正確に検出するためには、これらを修正
する必要がある。即ち、その中断の間隔Δdが所定の閾
値δhより小さい(Δdくδh)時は、線素Llが連続
しているものと見なし、大きい、(Δd≧δh)時は別
の線素L2と見なす、第3図の具体例では、Δdl+
Δdt+ Δd、<δ11、Δd4≧δhである。
の掠れ等によって線素が途中で切れた状態(黒ラン[1
5,B6. [17,[1Bの状態)で表現される場合
があり、線素を正確に検出するためには、これらを修正
する必要がある。即ち、その中断の間隔Δdが所定の閾
値δhより小さい(Δdくδh)時は、線素Llが連続
しているものと見なし、大きい、(Δd≧δh)時は別
の線素L2と見なす、第3図の具体例では、Δdl+
Δdt+ Δd、<δ11、Δd4≧δhである。
次にこの線素検出工程S2の所定の長さ以上の線素検出
ステップS2bを、同じく第3図を用いて説明する。上
記線素統合ステップS2aで1つの線素とされた任意の
線素りの長さをlとし、文字r−,等を線分の線素とし
て検出しないように所定の閾値zth以上B>gth)
の場合、初めて有効な線分の線素として検出する。第3
図の具体例では、!!1,1.2>1thである。とこ
ろで、上記の閾値δh、j!thの具体的な値としては
、例えば300dp I (300ドツト/イスチ)の
解像度のスキャナで入力した場合、閾値δhは8ドツト
に相当する長さに、闇値zthは文字「−」等を含まな
い程度にlの線分消去工程S4において消去してしまわ
ないように)90ドツトに相当する長さにすればよい、
ここで、上述のようにして検出された線素りを識別する
データとして、線素の始点座標(XsL+y) 、終点
座標(Xaa+V)を用いるものとする。
ステップS2bを、同じく第3図を用いて説明する。上
記線素統合ステップS2aで1つの線素とされた任意の
線素りの長さをlとし、文字r−,等を線分の線素とし
て検出しないように所定の閾値zth以上B>gth)
の場合、初めて有効な線分の線素として検出する。第3
図の具体例では、!!1,1.2>1thである。とこ
ろで、上記の閾値δh、j!thの具体的な値としては
、例えば300dp I (300ドツト/イスチ)の
解像度のスキャナで入力した場合、閾値δhは8ドツト
に相当する長さに、闇値zthは文字「−」等を含まな
い程度にlの線分消去工程S4において消去してしまわ
ないように)90ドツトに相当する長さにすればよい、
ここで、上述のようにして検出された線素りを識別する
データとして、線素の始点座標(XsL+y) 、終点
座標(Xaa+V)を用いるものとする。
なお、X座標は、上記スキャナの1水平走査をlライン
とした場合のライン番号iに相当することになる。
とした場合のライン番号iに相当することになる。
次に線分検出工程S3において、先ずこの工程S3の線
素の連結状態の検出ステップS3aについて、第4図、
第5図を用いて説明する。第4図に示すように、1つの
線分であってもスキャナの特性や印刷時の掠れ等によっ
て、今度は垂直方向に各線素が分離されたものとして線
分が表現される場合がある。この場合、2つの線素L3
.L4のX座標の差ΔVが所定の閾値δVより小さい(
ΔvくδV)時は、同じ線分を構成する線素の可能性が
あるものと見なし、次にこの2つの線素の水平方向の位
置関係を調べる。即ち、一方の線素の始点座標又は終点
座標が、水平方向において他の線素の始点座標と終点座
標との間に存在するかを調べ、存在するときは、この2
つの線素は同一の線分を構成するものとする。これらの
関係を、第4図に示す具体的な座標を用いて、数式で表
現すると、 xzgt≦x4.、≦X□、または、 X4mL≦Xjit≦X ’4 a dとなる。ところ
で、上述のスキャナを用いた場合、上記の閾値δVの具
体的な値は、2ドツトに相当する長さとすればよい。
素の連結状態の検出ステップS3aについて、第4図、
第5図を用いて説明する。第4図に示すように、1つの
線分であってもスキャナの特性や印刷時の掠れ等によっ
て、今度は垂直方向に各線素が分離されたものとして線
分が表現される場合がある。この場合、2つの線素L3
.L4のX座標の差ΔVが所定の閾値δVより小さい(
ΔvくδV)時は、同じ線分を構成する線素の可能性が
あるものと見なし、次にこの2つの線素の水平方向の位
置関係を調べる。即ち、一方の線素の始点座標又は終点
座標が、水平方向において他の線素の始点座標と終点座
標との間に存在するかを調べ、存在するときは、この2
つの線素は同一の線分を構成するものとする。これらの
関係を、第4図に示す具体的な座標を用いて、数式で表
現すると、 xzgt≦x4.、≦X□、または、 X4mL≦Xjit≦X ’4 a dとなる。ところ
で、上述のスキャナを用いた場合、上記の閾値δVの具
体的な値は、2ドツトに相当する長さとすればよい。
以上のようにして検出され、同一の線分を構成する線素
とされる具体的な線素の連結状態の各種パターンを第5
図に示す、&ll素L5.L6の連結状態は、線素L6
の始点のX座標が線素L5の始点及び終点の各X座標の
間にある場合である。線素L7.L8.の連結状態は、
線素L7の始点のX座標が線素L8の始点及び終点の各
X座標の間にある場合である。!JiI素L9.LIO
の連結状態は、線素し9の終点及び線素LIOの始点の
各X座標が同じ場合である。線素Lll、 L12の
連結状態は、線素L11の始点及び線素L12の終点の
各X座標が同じ場合である。線素L13. L14の
連結状態は、線素L14の始点及び時点の各X座標が線
素L13の始点及び終点の各X座標の間にある場合であ
る。線素L15、 LlGの連結状態は、線素L15
の始点及び終点の各X座標が線素L16の始点及び終点
の各X座標の間にある場合である。線素LIT、 L
lB、 L19の連結状態は、線素L18の始点、終
点及び線素L19の始点の各X座標が線素L17の始点
及び終点の各X座標の間にある場合である。
とされる具体的な線素の連結状態の各種パターンを第5
図に示す、&ll素L5.L6の連結状態は、線素L6
の始点のX座標が線素L5の始点及び終点の各X座標の
間にある場合である。線素L7.L8.の連結状態は、
線素L7の始点のX座標が線素L8の始点及び終点の各
X座標の間にある場合である。!JiI素L9.LIO
の連結状態は、線素し9の終点及び線素LIOの始点の
各X座標が同じ場合である。線素Lll、 L12の
連結状態は、線素L11の始点及び線素L12の終点の
各X座標が同じ場合である。線素L13. L14の
連結状態は、線素L14の始点及び時点の各X座標が線
素L13の始点及び終点の各X座標の間にある場合であ
る。線素L15、 LlGの連結状態は、線素L15
の始点及び終点の各X座標が線素L16の始点及び終点
の各X座標の間にある場合である。線素LIT、 L
lB、 L19の連結状態は、線素L18の始点、終
点及び線素L19の始点の各X座標が線素L17の始点
及び終点の各X座標の間にある場合である。
次にこの工程S3の線分テーブル作成ステップS3bに
ついて説明する。このステップS3bは、上記線素の連
結状態に基づいて、同一の線分を構成する線素と判断さ
れた全ての線素を1区分とし、文書画像内の各線素を各
線分毎に区分けして線分テーブルを作成する。このよう
にして作成された線分テーブル、例えば上述の具体例、
300dpi(300ドツト/インチ)の解像度のスキ
ャナで印刷文書を入力した場合の線分テーブルを第1表
に示す。
ついて説明する。このステップS3bは、上記線素の連
結状態に基づいて、同一の線分を構成する線素と判断さ
れた全ての線素を1区分とし、文書画像内の各線素を各
線分毎に区分けして線分テーブルを作成する。このよう
にして作成された線分テーブル、例えば上述の具体例、
300dpi(300ドツト/インチ)の解像度のスキ
ャナで印刷文書を入力した場合の線分テーブルを第1表
に示す。
この線分テーブルは、線分巻線素の集合として表現して
おり、各線素を線素の始点座標、終点座標を用いて表現
している。即ち線素の始点、終点のX座標は等しくライ
ン番号iで示され、始点、終点の各X座標は1ist
、X*4で示される0例えばこの線分テーブルは、線分
1は4つの線素から、線分2は5つの線素から構成され
ていることを示している。さらに線分lの第1の線素の
X座標、即ちライン番号i、始点のX座標xst 、終
点のX座4!I Xaaは80.1270.1694で
あることを示している。
おり、各線素を線素の始点座標、終点座標を用いて表現
している。即ち線素の始点、終点のX座標は等しくライ
ン番号iで示され、始点、終点の各X座標は1ist
、X*4で示される0例えばこの線分テーブルは、線分
1は4つの線素から、線分2は5つの線素から構成され
ていることを示している。さらに線分lの第1の線素の
X座標、即ちライン番号i、始点のX座標xst 、終
点のX座4!I Xaaは80.1270.1694で
あることを示している。
(以下、余白)
表1 線分テーブル
以上のような線分の検出方法を用いると、印刷文書内の
水平方向の線分の検出ができ、かつ多少の傾きがある線
分でも正しく線分の検出ができる。
水平方向の線分の検出ができ、かつ多少の傾きがある線
分でも正しく線分の検出ができる。
次に線分消去工程S4において、先ず消去範囲の拡張ス
テップS4aを第6図、第7図を用いて説明をする。印
刷文書の線分には、印刷時の滲みやスキャナ入力時の雑
音が存在し、第6図に示すようにこれらの雑音Nは、上
述の線素検出方法により検出された任意の線素Ll、
L2. L3. L4. L5に隣接して発生すること
が多い。なお、これらの雑音Nは、有効な線素としては
長さが短くかつそれらの水平方向の間隔Δdは上述の閾
値δhよりも大きい、したがって、これら雑音Nは線分
テーブルに線素として登録されないものである。しかし
、これらの雑音Nは文字認識の場合の邪魔になるので、
線分の消去と同時に除去するのが好ましい、そこで、第
7図に示すように、任意の線素し2の消去範囲を、該線
素に隣接する線素Ll、L3を含めて考えた場合に得ら
れる水平方向の最小始点、最大終点を該線素L2のライ
ンに於ける水平方向の始点、終点とする範囲に拡張する
。なお、線分の最上の線素L1、最下の線素L3につい
ては、上記範囲に加えて該線素の始点、終点と同じ水平
方向の範囲であって、それぞれの線素の上又は下ライン
も含む範囲(破線に囲まれた範囲)に拡張する0次にこ
の線分消去工程S4の線分の消去ステップS4bについ
て第6図を用いて説明する。上記消去範囲の拡張ステッ
プS4aで指定された範囲を消去する。この結果、第6
図に示すように線分を消去するとともに線分の周辺の雑
音(破線内の範囲の雑音)も同時に除去できる。
テップS4aを第6図、第7図を用いて説明をする。印
刷文書の線分には、印刷時の滲みやスキャナ入力時の雑
音が存在し、第6図に示すようにこれらの雑音Nは、上
述の線素検出方法により検出された任意の線素Ll、
L2. L3. L4. L5に隣接して発生すること
が多い。なお、これらの雑音Nは、有効な線素としては
長さが短くかつそれらの水平方向の間隔Δdは上述の閾
値δhよりも大きい、したがって、これら雑音Nは線分
テーブルに線素として登録されないものである。しかし
、これらの雑音Nは文字認識の場合の邪魔になるので、
線分の消去と同時に除去するのが好ましい、そこで、第
7図に示すように、任意の線素し2の消去範囲を、該線
素に隣接する線素Ll、L3を含めて考えた場合に得ら
れる水平方向の最小始点、最大終点を該線素L2のライ
ンに於ける水平方向の始点、終点とする範囲に拡張する
。なお、線分の最上の線素L1、最下の線素L3につい
ては、上記範囲に加えて該線素の始点、終点と同じ水平
方向の範囲であって、それぞれの線素の上又は下ライン
も含む範囲(破線に囲まれた範囲)に拡張する0次にこ
の線分消去工程S4の線分の消去ステップS4bについ
て第6図を用いて説明する。上記消去範囲の拡張ステッ
プS4aで指定された範囲を消去する。この結果、第6
図に示すように線分を消去するとともに線分の周辺の雑
音(破線内の範囲の雑音)も同時に除去できる。
上記のように線分の消去範囲を拡張して線分を消去する
ことにより、多少の1頃きがある線分でも効果的に消去
可能となる。また、文字の下のアンダーラインも消去す
ることができる。ところで、上記の線分消去において線
分を構成する線素が3ラインよりも小さいものは雑音と
みなして消去しないようにしてもよい、なお、上記の消
去範囲をこえた雑音や3ラインよりも小さくて消去しな
かった線分は、例えば文字認識を行う場合の文字切り出
しの段階で除去可能である。
ことにより、多少の1頃きがある線分でも効果的に消去
可能となる。また、文字の下のアンダーラインも消去す
ることができる。ところで、上記の線分消去において線
分を構成する線素が3ラインよりも小さいものは雑音と
みなして消去しないようにしてもよい、なお、上記の消
去範囲をこえた雑音や3ラインよりも小さくて消去しな
かった線分は、例えば文字認識を行う場合の文字切り出
しの段階で除去可能である。
なお、本発明は、上記実施例のみに限定されるものでは
なく、例えば垂直方向の線分の検出に用いるようにして
もよい、即ち水平方向の線分検出と同じアルゴリズムを
用いて、垂直方向の線分検出を行えばよい、また、上述
の通常の入力状態の文書画像と該文書画像を90度回転
した状態の文書画像を同時に持てば、水平方向と垂直方
向の線分検出を同時に行うことができ、例えば表の枠で
ある水平、垂直方向の線分の検出を高速に行うことがで
きる。また、垂直方向の線分の消去も上述の水平方向の
線分の消去と同じ方法で行うことができる。
なく、例えば垂直方向の線分の検出に用いるようにして
もよい、即ち水平方向の線分検出と同じアルゴリズムを
用いて、垂直方向の線分検出を行えばよい、また、上述
の通常の入力状態の文書画像と該文書画像を90度回転
した状態の文書画像を同時に持てば、水平方向と垂直方
向の線分検出を同時に行うことができ、例えば表の枠で
ある水平、垂直方向の線分の検出を高速に行うことがで
きる。また、垂直方向の線分の消去も上述の水平方向の
線分の消去と同じ方法で行うことができる。
以上のように、多少の傾きがある線分や線分の太さを正
る′αに検出できるということは、今までは図形として
取り扱っていた表を、表の枠情報と文字情報とに分離し
て取り扱うことができ、表中の数字等の文字情報を自由
に取り扱えることができることになる0例えば表を含む
文書を、紙面を媒体としてスキャナでパーソナル・コン
ピュタに入力し、表を枠の情報と文字の情報に分離して
取り扱うことにより、表の再現、拡大、縮小が可能にな
る。さらに表中の文字のデータベースの構築も可能にな
る。また、表以外の図やグラフ等も枠で囲まれているこ
とが多く、これらの枠を識別することにより、図形やグ
ラフが紙面のどの位置が存在するかが推測でき、これら
図形等を自由に移動したり、削除したりすることも可能
になる。また、アンダーラインの消去も簡単に行うこと
ができ、文字認識が容易になる。
る′αに検出できるということは、今までは図形として
取り扱っていた表を、表の枠情報と文字情報とに分離し
て取り扱うことができ、表中の数字等の文字情報を自由
に取り扱えることができることになる0例えば表を含む
文書を、紙面を媒体としてスキャナでパーソナル・コン
ピュタに入力し、表を枠の情報と文字の情報に分離して
取り扱うことにより、表の再現、拡大、縮小が可能にな
る。さらに表中の文字のデータベースの構築も可能にな
る。また、表以外の図やグラフ等も枠で囲まれているこ
とが多く、これらの枠を識別することにより、図形やグ
ラフが紙面のどの位置が存在するかが推測でき、これら
図形等を自由に移動したり、削除したりすることも可能
になる。また、アンダーラインの消去も簡単に行うこと
ができ、文字認識が容易になる。
第1図は本発明に係る線分の検出方法及び線分の消去方
法の一実施例を示すフローチャート図、第2図はスキャ
ナで入力された線分を示す模式図、第3図は線素検出の
原理を説明するための模式図、第4図は線素の垂直方向
の連結状態を示す模式図、第5図は線素の各種連結パタ
ーンを示す図、第6図及び第7図は線分の消去範囲を示
す模式図である。 〔発明の効果〕 以上の説明からも明らかなように、本発明に係る線分の
検出方法によれば、線分を線素の集合としてとらえ、多
少の傾きがある線分でも正しく検出することができ、後
で、の線分消去に適した線分検出が行える。 また、本発明の実施例によれば、上記検出方法にて検出
された線分を消去する際に、線分に付着した印刷時の滲
みやスキャナの雑音も同時に除去することができる。 S2・・・線素検出工程 S3・・・線分検出工程 S4・・・線分消去工程
法の一実施例を示すフローチャート図、第2図はスキャ
ナで入力された線分を示す模式図、第3図は線素検出の
原理を説明するための模式図、第4図は線素の垂直方向
の連結状態を示す模式図、第5図は線素の各種連結パタ
ーンを示す図、第6図及び第7図は線分の消去範囲を示
す模式図である。 〔発明の効果〕 以上の説明からも明らかなように、本発明に係る線分の
検出方法によれば、線分を線素の集合としてとらえ、多
少の傾きがある線分でも正しく検出することができ、後
で、の線分消去に適した線分検出が行える。 また、本発明の実施例によれば、上記検出方法にて検出
された線分を消去する際に、線分に付着した印刷時の滲
みやスキャナの雑音も同時に除去することができる。 S2・・・線素検出工程 S3・・・線分検出工程 S4・・・線分消去工程
Claims (1)
- 【特許請求の範囲】 入力された文書画像情報から、所定の長さ以上の線素を
検出する工程と、 検出された複数の線素の連結状態に応じて、少なくとも
1つの線素を有する線分を検出する工程とを有して成る
線分の検出方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1075274A JPH02252081A (ja) | 1989-03-25 | 1989-03-25 | 線分の検出方法 |
US07/496,931 US5129012A (en) | 1989-03-25 | 1990-03-21 | Detecting line segments and predetermined patterns in an optically scanned document |
EP90105582A EP0389988B1 (en) | 1989-03-25 | 1990-03-23 | Detecting line segments and predetermined patterns in an optically scanned document |
DE69029594T DE69029594T2 (de) | 1989-03-25 | 1990-03-23 | Ermittlung von Linienabschnitten und von vorbestimmten Mustern in einem optisch abgetasteten Dokument |
KR1019900003973A KR910017331A (ko) | 1989-03-25 | 1990-03-24 | 인쇄문자 인식장치에 있어서의 선분의 검출방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1075274A JPH02252081A (ja) | 1989-03-25 | 1989-03-25 | 線分の検出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02252081A true JPH02252081A (ja) | 1990-10-09 |
Family
ID=13571489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1075274A Pending JPH02252081A (ja) | 1989-03-25 | 1989-03-25 | 線分の検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH02252081A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069452A (zh) * | 2015-08-07 | 2015-11-18 | 武汉理工大学 | 基于局部结构分析的直线移除方法 |
-
1989
- 1989-03-25 JP JP1075274A patent/JPH02252081A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069452A (zh) * | 2015-08-07 | 2015-11-18 | 武汉理工大学 | 基于局部结构分析的直线移除方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
US6574375B1 (en) | Method for detecting inverted text images on a digital scanning device | |
US6009196A (en) | Method for classifying non-running text in an image | |
US5889886A (en) | Method and apparatus for detecting running text in an image | |
JP3792747B2 (ja) | 文字認識装置及び方法 | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
KR100390264B1 (ko) | 폼처리중자동페이지등록및자동영역검출을위한시스템및방법 | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
US5856877A (en) | Apparatus and method for processing and reproducing image information | |
US5129012A (en) | Detecting line segments and predetermined patterns in an optically scanned document | |
JP3727974B2 (ja) | 画像処理装置及び方法 | |
CN114299528B (zh) | 一种针对扫描文档的信息提取和结构化方法 | |
JPH0863548A (ja) | 画像処理方法及び装置 | |
JPH0652354A (ja) | スキュー補正方法並びにスキュー角検出方法並びにドキュメントセグメンテーションシステムおよびスキュー角検出装置 | |
JPH0863583A (ja) | ドキュメント格納検索装置及び方法 | |
US5923782A (en) | System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings | |
JP3837193B2 (ja) | 文字行抽出方法および装置 | |
JPS62254282A (ja) | 重畳するパタ−ンを分離する方法及び装置 | |
JPH08317193A (ja) | ディジタル化画像の縦横ラインを検知し修正する方法および装置 | |
JPH02252081A (ja) | 線分の検出方法 | |
JP2000187705A (ja) | 文書読取装置および方法および記憶媒体 | |
EP0476873B1 (en) | Method of and apparatus for separating image regions | |
JP3171626B2 (ja) | 文字認識の処理領域・処理条件指定方法 | |
JP2000090194A (ja) | 画像処理方法および画像処理装置 | |
JPH02252078A (ja) | 文書の領域識別方法 |