JPH02252078A - 文書の領域識別方法 - Google Patents

文書の領域識別方法

Info

Publication number
JPH02252078A
JPH02252078A JP1075275A JP7527589A JPH02252078A JP H02252078 A JPH02252078 A JP H02252078A JP 1075275 A JP1075275 A JP 1075275A JP 7527589 A JP7527589 A JP 7527589A JP H02252078 A JPH02252078 A JP H02252078A
Authority
JP
Japan
Prior art keywords
document
line
segments
line segment
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1075275A
Other languages
English (en)
Inventor
Keiko Abe
阿部 惠子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP1075275A priority Critical patent/JPH02252078A/ja
Priority to US07/496,931 priority patent/US5129012A/en
Priority to EP90105582A priority patent/EP0389988B1/en
Priority to DE69029594T priority patent/DE69029594T2/de
Priority to KR1019900003973A priority patent/KR910017331A/ko
Publication of JPH02252078A publication Critical patent/JPH02252078A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文書の領域識別方法に関し、例えば文字、表
、図形、写真等が混在する文書の各領域の種類、文字の
みの領域(以下、文字領域という。
)、表領域、図形領域等を識別する文書の領域識〔発明
の概要〕 本発明は、線分を含む印刷°文書をイメージスキャナ等
を用いて入力された文書画像情報から線分を検出し、検
出された線分の連結状態を判断し、線分の連結状態に基
づき線分をライン、テーブル、ブロックに分類すること
により、複数の領域からなる文書の各領域の種類を識別
できるようにしたものである。
〔従来の技術〕
現在オフィスでは、オフィス・オートメンシラン化が進
み、文書はワード・プロセッサ(以下ワープロという、
)等で作成することが一般的になりつつある。ところで
、ワープロで作成された文書はフロッピ・ディスク等に
ファイルされてし喝。
しかし、各社のワープロのフロッピ・ディスクの仕様が
異なり、まだ印刷された文書紙面が媒体となってデータ
の交換が行われているが現状である。
また、近年印刷文書の認識技術の発達、特に文字認識の
実用化に伴い印刷物の電子化が容易に成りつつある0例
えば、特開昭62−74181号、62−74182号
、62−74183号、62−74184号にて本件発
明者が開示した文字認識装置がある。
〔発明が解決しようとする課題〕
従来、文字、表、図形、写真等の領域を自動的に識別す
る方法が研究され、周辺分布法、拡大縮退による方法等
が提案されている。しかしこれらの方法では、文字以外
の表領域や図形領域、即ちイメージ領域と文字領域との
識別にとどまり、イメージ領域の詳細な識別、即ち表、
図形、写真等の領域を識別するこ止は行われていなかっ
た。ところで、文字、表、図形、写真等が混じっている
印刷物の文字認識を行う場合、例えば表内の文字認識を
行う場合、表の枠と表内の文字とを識別する特別な前処
理が必要である。したがって、文字認識を行うためには
、文字認識の前処理として、先ず文書の各領域の種類、
文字領域、表領域、図形領域等を識別する処理、次に識
別された各領域に対応した処理を行う必要がある。
本発明に係る文書の領域識別方法は、上述の実情に迄み
てなされたものであり、文書の各領域に対応した文字L
l!liの前処理、例えば表の枠と表内の文字とを識別
する処理ができるような文書の領域識別方法の提供を目
的とする。
(課題を解決するための手段〕 本発明は、上述のような課題を解決するために第1図に
示すように、文書画像入カニ程Stにおいて入力された
文書画像情報から線分を検出する工程S2と、検出され
た線分の連結状態、例えば交差点、角点の有無を判断す
る工程S3と、線分の連結状態(交差点、角点の有無)
に基づき線分をライン、テーブル、ブロックに分類する
工程S4と、線分の分類に基づいて複数の領域からなる
文書の各領域の種類を識別する工程S5とを有すること
を特徴としている。
〔作用〕
本発明に係る文書の領域識別方法によれば、文書画像内
の線分を所定の条件の下に検出し、検出された各線分の
連結゛状態(交差点、角点の有無)に苛づき線分をライ
ン、テーブル、ブロックに分類することにより、文書の
各領域の種類を識別することができる。
〔実施例〕
以下、本発明に係る一実施例について図面を参照しなが
ら説明する。
先ず、本実施例の文書の領域識別方法の概略を第1図に
示すフローチャート用いて説明する。
文書画像入カニ程Slは、線分を含む文書、例えば表を
含む印刷文書をイメージスキャナ(以下スキャナと言う
、)等を用いて2値化された文書画像として入力する。
次に線分検出工程S2に進み、上記文書画像から線分、
例えば表の枠、アンダーライン等の線分を後述する方法
によって検出する。
次に交差点・角点の有無判断工程S3に進み、上記線分
検出工程S2で検出された線分の交差点、角点の有無を
後述する条件により判断する。
次に分類工程S4に進み、上記線分の交差点、角点の有
無に基づいて、各線分を後述するライン、テーブル、ブ
ロックに分類する。
次に領域の種類識別工程S5に進み、上記分類エフff
54においてライン、テーフ゛ル、フ′ロンクに分類さ
れた結果に基づき、文書内の各領域の種類、例えば文字
領域、表領域、図形領域等を識別する。
以下、各工程の詳細を説明する。
文書画像入カニ程S1において、文書中に存在するアン
ダーライン、罫線、表の枠等の水平方向の任意の線分は
、スキャナで入力するとスキャナの走査線上の黒いライ
ンの集合として表現される。
即ち、第2図に示すようにスキ中すの分解能に対応した
幅の水平方向の複数の黒いライン(以下、線素という、
 ) Ll、L2.L3.L4の集合として表現され、
この集合の全体の幅は線分の幅に対応している、ところ
で、上記水平方向の線分はスキ、ヤナ人力時の傾きの影
響を受けやすく、見た目には水平であっても、完全な水
平状態で入力されるのは殆ど無く、第2図に示す線分1
1.12ように複数の線素L1.L2.L3.L4の連
結として表現される。また、第3図に示すように、元々
は一本の線素Llであっても、スキャナの特性や印刷時
の掠れ等によって線素が途中で切れた状態(黒いライン
[15,IIG。
B7,88の状態)で表現される場合がある。また、第
4図に示すように、1つの線分を構成する線素L3.L
4であってもスキャナの特性や印刷時の掠れ等によって
、今度は垂直方向に各線素L3、L4が分jiltされ
たものとして線分が表現される場合がある。
線分検出工程S2は、上記第3図、第4図に示すように
、1つの線分であってもスキャナの特性や印刷時の掠れ
等によって複数に分離された線素の集合として表現され
た線分も検出できるようにしたものである。即ち、第3
図に示すように、中断の間隔Δdが所定の閾値δhより
小さい(Δd1、Δdsl Δd、<δh )時は、線
素L1が連続しているものと見なし、大きい(Δd4≧
δh)時は別の線素L2と見なす0次にこの1つの線素
と見なされた任意の線素りの長さをlとし、文字「−」
等を線分の線素として検出しないように所定の闇値pt
h以上(f)j!Lh)の場合、初めて有効な線分の線
素として検出する。第3図の具体例では、11、ff1
2)F!Lhの場合であり、線素Ll、L2は有効な線
素として検出される。
次に第4図に示すように、垂直方向に線素L3゜L4が
分離された場合は、2つの線素L3.L4のX座標の差
Δνが所定の閾値δν未満(ΔνくδV)の時は、同じ
線分を構成する線素の可能性があると見なし、次にこの
2の線素の水平方向の位置関係(線素の連結状態)を調
べる。即ち、一方の線素L4の始点のX座標(La5t
 )または終点のX座Ll!(x4.、)が、水平方向
において他の線素L3の始点のX座標(X31L )と
終点のX座4I(xsaa)との間に存在する場合、こ
れら2つの線素L3゜L4は同一の線分を構成するもの
とする。上記関係を数式で示すと、 ×5.L≦X41L≦X3.4  または、XasLS
Xxst≦χ4.。
となる、ところで上記閾値δh、lLh、δVの具体的
な値としては、例えば300dpi (300ドラトノ
インチ)の解像度のイメージスキャナで印刷文書をスキ
ャンした場合、δhは8ドツトに相当する長さ、pth
は文字「−」等を含まない程度に90ドツトに相当する
長さ、δVは2ドツトに相当する長さにすればよい、上
記条件を満たす具体的な線素の各種連結状態を第5図に
示すa!IA素L5.L6の連結状態は、線素L6の始
点のX座標が線素L5の始点及び終点の各X座標の間に
ある場合である。 fl素L7.L8.の連結状態は、
線素L7の始点のX座標が線素L8の始点及び終点の各
X座標の間にある場合である。線素L9.fjoの連結
状態は、線素L9の終点及び線素LIOの始点の各X座
標が同じ場合である。線素Lll、  L12の連結状
態は、線素Lllの始点及び線素L12の終点の各X座
標が同じ場合である。線素L13.  Ll4の連結状
態は、線素L14の始点及び終点の各X座標が線素L1
3の始点及び終点の各X座標の間にある場合である。
線素L15.  Ll(iの連結状態は、線素L15の
始点及び終点の各X座標が線素L16の始点及び終点の
各X座標の間にある場合である。線素L17. LlB
Ll9の連結状態は、線素L1Bの始点、終点及び線素
LI9の始点の各X座標が線素L17の始点及び終点の
各X座標の間にある場合である。
以上のような線分の検出方法を用いると、多少の傾きが
ある線分でも正しく線分の検出が出来る。
また垂直方向の線分も、水平方向の線分の検出と同じア
ルゴリズムを用いて検出することができる。
ここで検出された水平方向線分Lhの始点H3L、終点
Hadの座標をそれぞれ(XhiL+ ykst )、
(Xbaa + yhat )とし、垂直方向線分Lv
の始点Vst、終点Vedの座標をそれぞれ(XVIL
 + yvsL)、(Xv**I Xwa4 ) とす
る。
次に交差点・角点の有無判断工程S3において、先ず線
分の交差点、角点について第6図を用いて説明する。第
6図のaは線分が交差点を有する場合を示し、同じくb
は線分が角点を有する場合を示す。
第6図のaに示すように交差点は、水平方向線分Lhと
垂直方向線分Lvが交差する場合であり、水平方向線分
Llhの始点、終点の座標を(X1hll+lrhmt
)、(Xlhad+ Vtbai )とし、垂直方向線
分Llvの始点、終点の座標を(XIVsL+ V+v
sc)、(Xlv*l YIwaa )とすると、交差
点の成立条件は、 X+h*t<X+vtt+  Xtwa4<X+ha−
かつ)’+vsc<)’+−−11t+V+baa<Y
Iwaaである。
第6図のbに示すように角点は、水平方向線分Lhの始
点Hstまたは終点Hedと垂直方向線分Lνの始点V
stまたは終点Vedとが重なり合う場合であり、水平
方向線分L2hの始点、終点の座標を(Xxbst+ 
3’fhmt)、(X*l+*d+ Vti+ea )
とし、水平方向線分L3hの始点、終点の座標を(に!
hllL+Y3h□)、(χsh、ar 3’ibe*
 )とし、垂直方向線分L2vの始点、終点の座標をC
)i*vs*r Vzvmt)、C’)Ovam+ V
zvmt )とし、垂直方向線分L3vの始点、終点の
座標を(Xsv□r yffvsL)、(Xsv@dr
lzvma )とすると、角点の成立条件は、X□□L
”XIVIL  かつ Vth□”ytvsL  また
は、×1.t・×5.4 かつ Vjbst−y!va
a  または、xtb**”)livst  かつ V
zb*4=y*vst  または、X2ham”Xxv
m4  かつ y3kmm”Vzvmtである。
交差点・角点の有無判断工程S3は、上記線分検出工J
”lS2で検出された水平方向線分Lhと垂直方向線分
Lvにおいて、上記交差点、角点の有無を判断する工程
である。先ずこの工程S3のステップS3aにおいて、
水平方向線分Lhと垂直方向線分Lvとの交差点の有無
を判断する。交差点がある場合、ステップS4c進ろ、
交差点が無い場合、ステップS3bに進む4次にこのス
テップS3bにおいて、水平方向線分Lhと垂直方向線
分Lvとの角点の有無を判断する。角点がある場合、ス
テップS4b進み、角点が無い場合、ステップS4aに
進む。
ここで上記交差点の有無を判断するステップS38に関
連して、次に示すような連結点を補助的に用いることが
できる。即ち、上記交差点の有無判断ステップS3aに
おいて、連結点の有無についても判断するようにしても
よい、この場合、上記交差点、連結点の少なくとも一方
がある場合もステップS4c進むものとする。上記連結
点は、第6図のCに示すように垂直方向線分Lvの始点
Vstまたは終点Vedが水平方向線分Lh上にある場
合であり、水平方向線分L4hの始点、終点の座標を0
fihst+ y4bs*)、(Xahaar Vah
aa )とし、水平方向線分L5hの始点、終点の座標
を(xs、#L、シ5hut)、(Xahaar Vs
haa )とし、垂直方向線分L4νの始点、終点の座
標を(Xsvst+ y4VKL) s  CX4wa
ワy4wa4 )とすると、連結点の成立条件は、 X<hat<X4vaL<Xaba−かつy4hsL!
y4に+14すJVI&または、 χ5ltl!<livst<Vahaa  かつ!Sh
sL−Vshmaす4管・4である。
次に分類工程S4において、先ずこの分類工程S4で用
いられる線分の分類の1ffi類について第7図を用い
て説明する。線分は、ライン又はテーブル又はブロック
を構成する3種類の線分に分類される。
ラインは、第7図のaに示すように1つの水平方向線分
Lhのみからなり、この水平方向線分Lhに直角に交わ
る垂直方向線分Lvが存在しない場合、この水平方向線
分Lhをラインを構成する線分とする。
テーブルは、第7図のbに示すように水平方向線分Lh
と垂直方向線分Lvが交差する場合、これらの線分をテ
ーブルを構成する線分とする。なお、上述のように連結
点のみが存在する特殊な場合も、これらの線分はテーブ
ルを構成する線分とする。即ち、交差点及び連結点があ
る場合は第7図のbに示すようなテーブルであり、交差
点のみがある場合は第7図のbに示すテーブルの外枠を
取り除いたテーブルであり、連結点のみがある場合はテ
ーブルの外枠と水平方向線分又は垂直方向の線分のいず
れか一方で構成されるテーブルである。
ブロックは、第7図のCに示すように水平方向線分Lh
、垂直方向線分Lvが角点のみを有する場合、これらの
線分をブロックを構成する線分とする。
以上のように分類の種類を定義した場合、分類工程S4
は、上記交差点・角点の有無判断工程S3の結果に基づ
き、文書画像内の各線分を、ライン、テーブル、ブロッ
クのいずれかを構成する線分に分類する。
領域の種類識別工程S5は、上記分類工程S4において
分類された結果に基づき、文書画像の各領域の種類を識
別する0例えば、任意の線分がラインを構成する線分と
判断された場合、この領域は罫線やアンダーラインが存
在する領域とする。
また、線分がテーブルを構成する線分と判断された場合
、このテーブルを構成する線分が存在する領域を表領域
とする。また、線分がブロックを構成する線分と判断さ
れた場合、このブロックを構成する線分が存在する21
域を図形61域とする。
以上のように文書画像の線分を単なる線分として検出す
るのでなく、例えばアンダーラインを構成する線分や表
を構成する線分として線分を検出することにより、文書
の各領域の種類が識別できる。また、今まではイメージ
情報として取り扱っていた表を、表の枠の情報と表内の
文字情報とに分離して取り扱うことができ、文字認識を
容易に行うことができることになる。この結果、例えば
印刷文書をスキャナ等でパーソナル・コンピュタに文書
画像として入力し、文字領域と表領域と図形領域とを区
別して、それぞれにあった処理できる。即ち、文書画像
に表が存在する場合、表の枠と表内の文字とを区別して
処理をおこなうことができ、表の再現、拡大、縮小が可
能になる。更に表中の文字のデータベースの構築も可能
になる。
また、図形が存在する場合、この図形の再現、拡大、縮
小、移動等が自由にできることになる。また、アンダー
ラインが存在する場合、この線分を消去することにより
、文字認識が容易に行えることになる。
なお、本発明は上記の実施例に限定されるものではなく
、上記交差点の有無を判断ステップS38において、上
記連結点の有無のみを判断するようにしてもよく、また
交差点、連結点の両方が同時に存在するか否かを判断す
るようにしてもよい。
ナで入力された場合の線分を示す模式図、第3図は線素
検出の原理を説明するだめの模式図、第4図は線素の垂
直方向の連結状態を示す模式図、第5図は線素の各種連
結パターンを示す図、第6図は線分の連結関係を示す図
、第7図は線分の分類の種類を示す図である。
〔発明の効果〕 以上の説明からも明らかなように、本発明に係る文書の
領域識別方法によれば、線分を単なる線分として取り扱
わず、例えば表の枠を構成する線分や、図形の枠を構成
する線分として取扱ことにより、後での文字認識に適し
た文書の各領域の種類の識別が行える。この結果、印刷
文書の電子化、即ち、電子計算機による文字認識や図形
処理等を容易に行うことができる。
【図面の簡単な説明】
第1図は本発明に係る文書の領域識別方法の一実施例を
示すフローチャート図、第2図はスキャS2・・・線分
検出工程 S3・・・交差点・連結点の有無判断工程S4・・・線
分の分類工程

Claims (1)

  1. 【特許請求の範囲】 入力された文書画像情報から、線分を検出する工程と、 検出された線分の連結状態を判断する工程と、上記線分
    の連結状態に基づき線分をライン、テーブル、ブロック
    に分類する工程と、 上記線分の分類に基づき、複数の領域からなる文書の各
    領域の種類を識別する工程とを有して成る文書の領域識
    別方法。
JP1075275A 1989-03-25 1989-03-25 文書の領域識別方法 Pending JPH02252078A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP1075275A JPH02252078A (ja) 1989-03-25 1989-03-25 文書の領域識別方法
US07/496,931 US5129012A (en) 1989-03-25 1990-03-21 Detecting line segments and predetermined patterns in an optically scanned document
EP90105582A EP0389988B1 (en) 1989-03-25 1990-03-23 Detecting line segments and predetermined patterns in an optically scanned document
DE69029594T DE69029594T2 (de) 1989-03-25 1990-03-23 Ermittlung von Linienabschnitten und von vorbestimmten Mustern in einem optisch abgetasteten Dokument
KR1019900003973A KR910017331A (ko) 1989-03-25 1990-03-24 인쇄문자 인식장치에 있어서의 선분의 검출방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1075275A JPH02252078A (ja) 1989-03-25 1989-03-25 文書の領域識別方法

Publications (1)

Publication Number Publication Date
JPH02252078A true JPH02252078A (ja) 1990-10-09

Family

ID=13571516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1075275A Pending JPH02252078A (ja) 1989-03-25 1989-03-25 文書の領域識別方法

Country Status (1)

Country Link
JP (1) JPH02252078A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011044089A (ja) * 2009-08-24 2011-03-03 Fuji Xerox Co Ltd 画像処理装置およびプログラム
CN109726643A (zh) * 2018-12-13 2019-05-07 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质
US11688193B2 (en) 2020-11-13 2023-06-27 International Business Machines Corporation Interactive structure annotation with artificial intelligence

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011044089A (ja) * 2009-08-24 2011-03-03 Fuji Xerox Co Ltd 画像処理装置およびプログラム
CN109726643A (zh) * 2018-12-13 2019-05-07 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质
CN112818812A (zh) * 2018-12-13 2021-05-18 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质
CN112818812B (zh) * 2018-12-13 2024-03-12 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质
US11688193B2 (en) 2020-11-13 2023-06-27 International Business Machines Corporation Interactive structure annotation with artificial intelligence

Similar Documents

Publication Publication Date Title
KR100390264B1 (ko) 폼처리중자동페이지등록및자동영역검출을위한시스템및방법
Taylor et al. Extraction of data from preprinted forms
US5201011A (en) Method and apparatus for image hand markup detection using morphological techniques
US5856877A (en) Apparatus and method for processing and reproducing image information
US5889886A (en) Method and apparatus for detecting running text in an image
EP0334472B1 (en) Methods of detecting character strings
JPH0652354A (ja) スキュー補正方法並びにスキュー角検出方法並びにドキュメントセグメンテーションシステムおよびスキュー角検出装置
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
Amin et al. A robust system for thresholding and skew detection in mixed text/graphics documents
Mitchell et al. Newspaper document analysis featuring connected line segmentation
Lakshmi et al. An optical character recognition system for printed Telugu text
StevensÝ et al. Automatic processing of document annotations
JPS62254282A (ja) 重畳するパタ−ンを分離する方法及び装置
JPH02252078A (ja) 文書の領域識別方法
JPS63259783A (ja) ページ分類装置
Zlatopolsky Automated document segmentation
Normand et al. A background based adaptive page segmentation algorithm
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH02252081A (ja) 線分の検出方法
Hobby Using shape and layout information to find signatures, text, and graphics
Li An implementation of ocr system based on skeleton matching
JPH0916713A (ja) 画像領域分割方法
JPH0449148B2 (ja)
JPS5949671A (ja) 光学的文字読取装置
JPS60153567A (ja) 印刷文書画像の領域抽出方法