JPH02252078A

JPH02252078A - 文書の領域識別方法

Info

Publication number: JPH02252078A
Application number: JP1075275A
Authority: JP
Inventors: Keiko Abe; 阿部　惠子
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1989-03-25
Filing date: 1989-03-25
Publication date: 1990-10-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、文書の領域識別方法に関し、例えば文字、表
、図形、写真等が混在する文書の各領域の種類、文字の
みの領域（以下、文字領域という。

）、表領域、図形領域等を識別する文書の領域識〔発明
の概要〕本発明は、線分を含む印刷°文書をイメージスキャナ等
を用いて入力された文書画像情報から線分を検出し、検
出された線分の連結状態を判断し、線分の連結状態に基
づき線分をライン、テーブル、ブロックに分類すること
により、複数の領域からなる文書の各領域の種類を識別
できるようにしたものである。

〔従来の技術〕

現在オフィスでは、オフィス・オートメンシラン化が進
み、文書はワード・プロセッサ（以下ワープロという、
）等で作成することが一般的になりつつある。ところで
、ワープロで作成された文書はフロッピ・ディスク等に
ファイルされてし喝。

しかし、各社のワープロのフロッピ・ディスクの仕様が
異なり、まだ印刷された文書紙面が媒体となってデータ
の交換が行われているが現状である。

また、近年印刷文書の認識技術の発達、特に文字認識の
実用化に伴い印刷物の電子化が容易に成りつつある０例
えば、特開昭６２−７４１８１号、６２−７４１８２号
、６２−７４１８３号、６２−７４１８４号にて本件発
明者が開示した文字認識装置がある。

〔発明が解決しようとする課題〕

従来、文字、表、図形、写真等の領域を自動的に識別す
る方法が研究され、周辺分布法、拡大縮退による方法等
が提案されている。しかしこれらの方法では、文字以外
の表領域や図形領域、即ちイメージ領域と文字領域との
識別にとどまり、イメージ領域の詳細な識別、即ち表、
図形、写真等の領域を識別するこ止は行われていなかっ
た。ところで、文字、表、図形、写真等が混じっている
印刷物の文字認識を行う場合、例えば表内の文字認識を
行う場合、表の枠と表内の文字とを識別する特別な前処
理が必要である。したがって、文字認識を行うためには
、文字認識の前処理として、先ず文書の各領域の種類、
文字領域、表領域、図形領域等を識別する処理、次に識
別された各領域に対応した処理を行う必要がある。

本発明に係る文書の領域識別方法は、上述の実情に迄み
てなされたものであり、文書の各領域に対応した文字Ｌ
ｌ！ｌｉの前処理、例えば表の枠と表内の文字とを識別
する処理ができるような文書の領域識別方法の提供を目
的とする。

（課題を解決するための手段〕本発明は、上述のような課題を解決するために第１図に
示すように、文書画像入カニ程Ｓｔにおいて入力された
文書画像情報から線分を検出する工程Ｓ２と、検出され
た線分の連結状態、例えば交差点、角点の有無を判断す
る工程Ｓ３と、線分の連結状態（交差点、角点の有無）
に基づき線分をライン、テーブル、ブロックに分類する
工程Ｓ４と、線分の分類に基づいて複数の領域からなる
文書の各領域の種類を識別する工程Ｓ５とを有すること
を特徴としている。

〔作用〕

本発明に係る文書の領域識別方法によれば、文書画像内
の線分を所定の条件の下に検出し、検出された各線分の
連結゛状態（交差点、角点の有無）に苛づき線分をライ
ン、テーブル、ブロックに分類することにより、文書の
各領域の種類を識別することができる。

〔実施例〕

以下、本発明に係る一実施例について図面を参照しなが
ら説明する。

先ず、本実施例の文書の領域識別方法の概略を第１図に
示すフローチャート用いて説明する。

文書画像入カニ程Ｓｌは、線分を含む文書、例えば表を
含む印刷文書をイメージスキャナ（以下スキャナと言う
、）等を用いて２値化された文書画像として入力する。

次に線分検出工程Ｓ２に進み、上記文書画像から線分、
例えば表の枠、アンダーライン等の線分を後述する方法
によって検出する。

次に交差点・角点の有無判断工程Ｓ３に進み、上記線分
検出工程Ｓ２で検出された線分の交差点、角点の有無を
後述する条件により判断する。

次に分類工程Ｓ４に進み、上記線分の交差点、角点の有
無に基づいて、各線分を後述するライン、テーブル、ブ
ロックに分類する。

次に領域の種類識別工程Ｓ５に進み、上記分類エフｆｆ
５４においてライン、テーフ゛ル、フ′ロンクに分類さ
れた結果に基づき、文書内の各領域の種類、例えば文字
領域、表領域、図形領域等を識別する。

以下、各工程の詳細を説明する。

文書画像入カニ程Ｓ１において、文書中に存在するアン
ダーライン、罫線、表の枠等の水平方向の任意の線分は
、スキャナで入力するとスキャナの走査線上の黒いライ
ンの集合として表現される。

即ち、第２図に示すようにスキ中すの分解能に対応した
幅の水平方向の複数の黒いライン（以下、線素という、
　）　Ｌｌ、Ｌ２．Ｌ３．Ｌ４の集合として表現され、
この集合の全体の幅は線分の幅に対応している、ところ
で、上記水平方向の線分はスキ、ヤナ人力時の傾きの影
響を受けやすく、見た目には水平であっても、完全な水
平状態で入力されるのは殆ど無く、第２図に示す線分１
１．１２ように複数の線素Ｌ１．Ｌ２．Ｌ３．Ｌ４の連
結として表現される。また、第３図に示すように、元々
は一本の線素Ｌｌであっても、スキャナの特性や印刷時
の掠れ等によって線素が途中で切れた状態（黒いライン
［１５，ＩＩＧ。

Ｂ７，８８の状態）で表現される場合がある。また、第
４図に示すように、１つの線分を構成する線素Ｌ３．Ｌ
４であってもスキャナの特性や印刷時の掠れ等によって
、今度は垂直方向に各線素Ｌ３、Ｌ４が分ｊｉｌｔされ
たものとして線分が表現される場合がある。

線分検出工程Ｓ２は、上記第３図、第４図に示すように
、１つの線分であってもスキャナの特性や印刷時の掠れ
等によって複数に分離された線素の集合として表現され
た線分も検出できるようにしたものである。即ち、第３
図に示すように、中断の間隔Δｄが所定の閾値δｈより
小さい（Δｄ１、Δｄｓｌ　Δｄ、＜δｈ　）時は、線
素Ｌ１が連続しているものと見なし、大きい（Δｄ４≧
δｈ）時は別の線素Ｌ２と見なす０次にこの１つの線素
と見なされた任意の線素りの長さをｌとし、文字「−」
等を線分の線素として検出しないように所定の闇値ｐｔ
ｈ以上（ｆ）ｊ！Ｌｈ）の場合、初めて有効な線分の線
素として検出する。第３図の具体例では、１１、ｆｆ１
２）Ｆ！Ｌｈの場合であり、線素Ｌｌ、Ｌ２は有効な線
素として検出される。

次に第４図に示すように、垂直方向に線素Ｌ３゜Ｌ４が
分離された場合は、２つの線素Ｌ３．Ｌ４のＸ座標の差
Δνが所定の閾値δν未満（ΔνくδＶ）の時は、同じ
線分を構成する線素の可能性があると見なし、次にこの
２の線素の水平方向の位置関係（線素の連結状態）を調
べる。即ち、一方の線素Ｌ４の始点のＸ座標（Ｌａ５ｔ
　）または終点のＸ座Ｌｌ！（ｘ４．、）が、水平方向
において他の線素Ｌ３の始点のＸ座標（Ｘ３１Ｌ　）と
終点のＸ座４Ｉ（ｘｓａａ）との間に存在する場合、こ
れら２つの線素Ｌ３゜Ｌ４は同一の線分を構成するもの
とする。上記関係を数式で示すと、 ×５．Ｌ≦Ｘ４１Ｌ≦Ｘ３．４　　または、ＸａｓＬＳ
Ｘｘｓｔ≦χ４．。

となる、ところで上記閾値δｈ、ｌＬｈ、δＶの具体的
な値としては、例えば３００ｄｐｉ　（３００ドラトノ
インチ）の解像度のイメージスキャナで印刷文書をスキ
ャンした場合、δｈは８ドツトに相当する長さ、ｐｔｈ
は文字「−」等を含まない程度に９０ドツトに相当する
長さ、δＶは２ドツトに相当する長さにすればよい、上
記条件を満たす具体的な線素の各種連結状態を第５図に
示すａ！ＩＡ素Ｌ５．Ｌ６の連結状態は、線素Ｌ６の始
点のＸ座標が線素Ｌ５の始点及び終点の各Ｘ座標の間に
ある場合である。　ｆｌ素Ｌ７．Ｌ８．の連結状態は、
線素Ｌ７の始点のＸ座標が線素Ｌ８の始点及び終点の各
Ｘ座標の間にある場合である。線素Ｌ９．ｆｊｏの連結
状態は、線素Ｌ９の終点及び線素ＬＩＯの始点の各Ｘ座
標が同じ場合である。線素Ｌｌｌ、　　Ｌ１２の連結状
態は、線素Ｌｌｌの始点及び線素Ｌ１２の終点の各Ｘ座
標が同じ場合である。線素Ｌ１３．　　Ｌｌ４の連結状
態は、線素Ｌ１４の始点及び終点の各Ｘ座標が線素Ｌ１
３の始点及び終点の各Ｘ座標の間にある場合である。

線素Ｌ１５．　　Ｌｌ（ｉの連結状態は、線素Ｌ１５の
始点及び終点の各Ｘ座標が線素Ｌ１６の始点及び終点の
各Ｘ座標の間にある場合である。線素Ｌ１７．　ＬｌＢ
。

Ｌｌ９の連結状態は、線素Ｌ１Ｂの始点、終点及び線素
ＬＩ９の始点の各Ｘ座標が線素Ｌ１７の始点及び終点の
各Ｘ座標の間にある場合である。

以上のような線分の検出方法を用いると、多少の傾きが
ある線分でも正しく線分の検出が出来る。

また垂直方向の線分も、水平方向の線分の検出と同じア
ルゴリズムを用いて検出することができる。

ここで検出された水平方向線分Ｌｈの始点Ｈ３Ｌ、終点
Ｈａｄの座標をそれぞれ（ＸｈｉＬ＋　ｙｋｓｔ　）、
（Ｘｂａａ　＋　ｙｈａｔ　）とし、垂直方向線分Ｌｖ
の始点Ｖｓｔ、終点Ｖｅｄの座標をそれぞれ（ＸＶＩＬ
　＋　ｙｖｓＬ）、（Ｘｖ＊＊Ｉ　Ｘｗａ４　）　とす
る。

次に交差点・角点の有無判断工程Ｓ３において、先ず線
分の交差点、角点について第６図を用いて説明する。第
６図のａは線分が交差点を有する場合を示し、同じくｂ
は線分が角点を有する場合を示す。

第６図のａに示すように交差点は、水平方向線分Ｌｈと
垂直方向線分Ｌｖが交差する場合であり、水平方向線分
Ｌｌｈの始点、終点の座標を（Ｘ１ｈｌｌ＋ｌｒｈｍｔ
）、（Ｘｌｈａｄ＋　Ｖｔｂａｉ　）とし、垂直方向線
分Ｌｌｖの始点、終点の座標を（ＸＩＶｓＬ＋　Ｖ＋ｖ
ｓｃ）、（Ｘｌｖ＊ｌ　ＹＩｗａａ　）とすると、交差
点の成立条件は、Ｘ＋ｈ＊ｔ＜Ｘ＋ｖｔｔ＋　　Ｘｔｗａ４＜Ｘ＋ｈａ−
かつ）’＋ｖｓｃ＜）’＋−−１１ｔ＋Ｖ＋ｂａａ＜Ｙ
Ｉｗａａである。

第６図のｂに示すように角点は、水平方向線分Ｌｈの始
点Ｈｓｔまたは終点Ｈｅｄと垂直方向線分Ｌνの始点Ｖ
ｓｔまたは終点Ｖｅｄとが重なり合う場合であり、水平
方向線分Ｌ２ｈの始点、終点の座標を（Ｘｘｂｓｔ＋　
３’ｆｈｍｔ）、（Ｘ＊ｌ＋＊ｄ＋　Ｖｔｉ＋ｅａ　）
とし、水平方向線分Ｌ３ｈの始点、終点の座標を（に！
ｈｌｌＬ＋Ｙ３ｈ□）、（χｓｈ、ａｒ　３’ｉｂｅ＊
　）とし、垂直方向線分Ｌ２ｖの始点、終点の座標をＣ
）ｉ＊ｖｓ＊ｒ　Ｖｚｖｍｔ）、Ｃ’）Ｏｖａｍ＋　Ｖ
ｚｖｍｔ　）とし、垂直方向線分Ｌ３ｖの始点、終点の
座標を（Ｘｓｖ□ｒ　ｙｆｆｖｓＬ）、（Ｘｓｖ＠ｄｒ
ｌｚｖｍａ　）とすると、角点の成立条件は、Ｘ□□Ｌ
”ＸＩＶＩＬ　　かつ　Ｖｔｈ□”ｙｔｖｓＬ　　また
は、×１．ｔ・×５．４　かつ　Ｖｊｂｓｔ−ｙ！ｖａ
ａ　　または、ｘｔｂ＊＊”）ｌｉｖｓｔ　　かつ　Ｖ
ｚｂ＊４＝ｙ＊ｖｓｔ　　または、Ｘ２ｈａｍ”Ｘｘｖ
ｍ４　　かつ　ｙ３ｋｍｍ”Ｖｚｖｍｔである。

交差点・角点の有無判断工程Ｓ３は、上記線分検出工Ｊ
”ｌＳ２で検出された水平方向線分Ｌｈと垂直方向線分
Ｌｖにおいて、上記交差点、角点の有無を判断する工程
である。先ずこの工程Ｓ３のステップＳ３ａにおいて、
水平方向線分Ｌｈと垂直方向線分Ｌｖとの交差点の有無
を判断する。交差点がある場合、ステップＳ４ｃ進ろ、
交差点が無い場合、ステップＳ３ｂに進む４次にこのス
テップＳ３ｂにおいて、水平方向線分Ｌｈと垂直方向線
分Ｌｖとの角点の有無を判断する。角点がある場合、ス
テップＳ４ｂ進み、角点が無い場合、ステップＳ４ａに
進む。

ここで上記交差点の有無を判断するステップＳ３８に関
連して、次に示すような連結点を補助的に用いることが
できる。即ち、上記交差点の有無判断ステップＳ３ａに
おいて、連結点の有無についても判断するようにしても
よい、この場合、上記交差点、連結点の少なくとも一方
がある場合もステップＳ４ｃ進むものとする。上記連結
点は、第６図のＣに示すように垂直方向線分Ｌｖの始点
Ｖｓｔまたは終点Ｖｅｄが水平方向線分Ｌｈ上にある場
合であり、水平方向線分Ｌ４ｈの始点、終点の座標を０
ｆｉｈｓｔ＋　ｙ４ｂｓ＊）、（Ｘａｈａａｒ　Ｖａｈ
ａａ　）とし、水平方向線分Ｌ５ｈの始点、終点の座標
を（ｘｓ、＃Ｌ、シ５ｈｕｔ）、（Ｘａｈａａｒ　Ｖｓ
ｈａａ　）とし、垂直方向線分Ｌ４νの始点、終点の座
標を（Ｘｓｖｓｔ＋　ｙ４ＶＫＬ）　ｓ　　ＣＸ４ｗａ
ワｙ４ｗａ４　）とすると、連結点の成立条件は、Ｘ＜ｈａｔ＜Ｘ４ｖａＬ＜Ｘａｂａ−かつｙ４ｈｓＬ！
ｙ４に＋１４すＪＶＩ＆または、 χ５ｌｔｌ！＜ｌｉｖｓｔ＜Ｖａｈａａ　　かつ！Ｓｈ
ｓＬ−Ｖｓｈｍａす４管・４である。

次に分類工程Ｓ４において、先ずこの分類工程Ｓ４で用
いられる線分の分類の１ｆｆｉ類について第７図を用い
て説明する。線分は、ライン又はテーブル又はブロック
を構成する３種類の線分に分類される。

ラインは、第７図のａに示すように１つの水平方向線分
Ｌｈのみからなり、この水平方向線分Ｌｈに直角に交わ
る垂直方向線分Ｌｖが存在しない場合、この水平方向線
分Ｌｈをラインを構成する線分とする。

テーブルは、第７図のｂに示すように水平方向線分Ｌｈ
と垂直方向線分Ｌｖが交差する場合、これらの線分をテ
ーブルを構成する線分とする。なお、上述のように連結
点のみが存在する特殊な場合も、これらの線分はテーブ
ルを構成する線分とする。即ち、交差点及び連結点があ
る場合は第７図のｂに示すようなテーブルであり、交差
点のみがある場合は第７図のｂに示すテーブルの外枠を
取り除いたテーブルであり、連結点のみがある場合はテ
ーブルの外枠と水平方向線分又は垂直方向の線分のいず
れか一方で構成されるテーブルである。

ブロックは、第７図のＣに示すように水平方向線分Ｌｈ
、垂直方向線分Ｌｖが角点のみを有する場合、これらの
線分をブロックを構成する線分とする。

以上のように分類の種類を定義した場合、分類工程Ｓ４
は、上記交差点・角点の有無判断工程Ｓ３の結果に基づ
き、文書画像内の各線分を、ライン、テーブル、ブロッ
クのいずれかを構成する線分に分類する。

領域の種類識別工程Ｓ５は、上記分類工程Ｓ４において
分類された結果に基づき、文書画像の各領域の種類を識
別する０例えば、任意の線分がラインを構成する線分と
判断された場合、この領域は罫線やアンダーラインが存
在する領域とする。

また、線分がテーブルを構成する線分と判断された場合
、このテーブルを構成する線分が存在する領域を表領域
とする。また、線分がブロックを構成する線分と判断さ
れた場合、このブロックを構成する線分が存在する２１
域を図形６１域とする。

以上のように文書画像の線分を単なる線分として検出す
るのでなく、例えばアンダーラインを構成する線分や表
を構成する線分として線分を検出することにより、文書
の各領域の種類が識別できる。また、今まではイメージ
情報として取り扱っていた表を、表の枠の情報と表内の
文字情報とに分離して取り扱うことができ、文字認識を
容易に行うことができることになる。この結果、例えば
印刷文書をスキャナ等でパーソナル・コンピュタに文書
画像として入力し、文字領域と表領域と図形領域とを区
別して、それぞれにあった処理できる。即ち、文書画像
に表が存在する場合、表の枠と表内の文字とを区別して
処理をおこなうことができ、表の再現、拡大、縮小が可
能になる。更に表中の文字のデータベースの構築も可能
になる。

また、図形が存在する場合、この図形の再現、拡大、縮
小、移動等が自由にできることになる。また、アンダー
ラインが存在する場合、この線分を消去することにより
、文字認識が容易に行えることになる。

なお、本発明は上記の実施例に限定されるものではなく
、上記交差点の有無を判断ステップＳ３８において、上
記連結点の有無のみを判断するようにしてもよく、また
交差点、連結点の両方が同時に存在するか否かを判断す
るようにしてもよい。

ナで入力された場合の線分を示す模式図、第３図は線素
検出の原理を説明するだめの模式図、第４図は線素の垂
直方向の連結状態を示す模式図、第５図は線素の各種連
結パターンを示す図、第６図は線分の連結関係を示す図
、第７図は線分の分類の種類を示す図である。

〔発明の効果〕以上の説明からも明らかなように、本発明に係る文書の
領域識別方法によれば、線分を単なる線分として取り扱
わず、例えば表の枠を構成する線分や、図形の枠を構成
する線分として取扱ことにより、後での文字認識に適し
た文書の各領域の種類の識別が行える。この結果、印刷
文書の電子化、即ち、電子計算機による文字認識や図形
処理等を容易に行うことができる。

【図面の簡単な説明】

第１図は本発明に係る文書の領域識別方法の一実施例を
示すフローチャート図、第２図はスキャＳ２・・・線分
検出工程Ｓ３・・・交差点・連結点の有無判断工程Ｓ４・・・線
分の分類工程

Claims

【特許請求の範囲】入力された文書画像情報から、線分を検出する工程と、検出された線分の連結状態を判断する工程と、上記線分
の連結状態に基づき線分をライン、テーブル、ブロック
に分類する工程と、上記線分の分類に基づき、複数の領域からなる文書の各
領域の種類を識別する工程とを有して成る文書の領域識
別方法。