JP2926066B2 - 表認識装置 - Google Patents

表認識装置

Info

Publication number
JP2926066B2
JP2926066B2 JP4161858A JP16185892A JP2926066B2 JP 2926066 B2 JP2926066 B2 JP 2926066B2 JP 4161858 A JP4161858 A JP 4161858A JP 16185892 A JP16185892 A JP 16185892A JP 2926066 B2 JP2926066 B2 JP 2926066B2
Authority
JP
Japan
Prior art keywords
character
extracting
block
ruled line
extracting means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4161858A
Other languages
English (en)
Other versions
JPH05334490A (ja
Inventor
糸乘勝彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP4161858A priority Critical patent/JP2926066B2/ja
Publication of JPH05334490A publication Critical patent/JPH05334490A/ja
Application granted granted Critical
Publication of JP2926066B2 publication Critical patent/JP2926066B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書画像処理の分野にお
いて、表画像から表の構造を認識する表認識装置に関す
る。
【0002】
【従来の技術】従来の表認識の方式としては、表領域の
周辺分布を用いる方式や、表を構成する罫線をベクトル
線分に変換して、罫線で囲まれた矩形枠を抽出する方式
が知られている。周辺分布を使用する方式として例えば
特開平2−61775公報記載のものがあり、ベクトル
線分を使用する方式として例えば特開平1−12935
8公報記載のものがある。
【0003】特開平2−61775公報記載の周辺分布
を使用する方式は、表領域の画像の周辺分布をとり、そ
の周辺分布のヒストグラムからある閾値以上の高さを持
つ山から罫線の位置を推定し、罫線の位置が表の最も外
側にある外枠の罫線を取り出す。次にこの外枠に両端を
接する罫線を求め、その罫線により外枠を複数の矩形枠
に分割する。さらに、分割された各矩形枠内に対して同
様の処理を再帰的に施すことにより、罫線で囲まれた矩
形枠を抽出する。後者の特開平1−129358公報記
載の方式は、ベクトル線分を追跡して取り出した各矩形
枠の位置関係を調べることで表の認識を行なう。
【0004】これらの方式は、表を構成する罫線に省略
が無いことを前提としているが、実際に文書中に使用さ
れる表には罫線の一部が省略されているものも結構多
い。特開平2−264386公報記載の方式においては
表の両脇の罫線が省略されている場合でも、正しく矩形
枠を取り出せる方式である。すなわち、表画像から取り
出した縦罫線、横罫線から表の両脇に罫線があるかを判
別し、無い場合に表の両脇に縦罫線を仮想的に生成する
方式である。
【0005】
【発明が解決しようとする課題】従来、文書中に使用さ
れている表には、様々な形態のものがある。図2はその
例を示すもので、同図(a)の表は全ての罫線が揃った
表、(b)は両脇の罫線が省略された表、(c)および
(d)は両脇の罫線の他にも省略されている縦罫線、横
罫線がある表、(e)は全ての罫線が省略された表であ
る。このうち(a)および(b)の各表に関しては従来
の技術によって対応可能であるが、(c)(d)の表の
ように両脇の罫線の他にも省略されている縦罫線、横罫
線がある場合および(e)の表のように全ての罫線が省
略されている場合には表の構造を正確に認識して、表と
して意味のある単位で文字列を取り出すことができなか
った。本発明の目的は、縦罫線、横罫線の一部または全
部に省略のあるような表であっても、表を構成する各枠
を正確に切り出すことのできる、表認識装置を提供する
ことにある。
【0006】
【課題を解決するための手段および作用】本発明の表認
識装置は、表画像から文字ブロックを抽出する文字ブロ
ック抽出手段(図1の11、図8の81)と、前記文字
ブロック抽出手段により抽出された文字ブロック相互の
位置関係を識別し、表の構造を表すデータを出力する位
置関係識別手段(図1の12、図8の82)とを基本的
な構成として備えたものである。この発明によれば、文
字ブロック抽出手段により抽出された文字ブロック相互
の位置関係を位置関係識別手段により識別する。表にお
ける文字ブロックは表の構成要素として一般に規則正し
く整列した位置関係にあるので、文字ブロック相互の位
置関係を見ることにより表の構造を認識できる。従来
は、表の罫線のみに着目して表を構成する枠を求めてい
たので、縦罫線、横罫線の一部または全部に省略のある
ような表の構造を正確に認識することができないという
問題があったが、本発明によれば文字ブロックの並びを
用いて表の構造を認識するので、その問題は解消でき
る。
【0007】本発明の一態様によれば、前記の基本的な
構成において、前記文字ブロック抽出手段は、文字の書
かれている画素の塊を囲む矩形領域を求める文字矩形抽
出手段(図1の111)と、その文字矩形抽出手段で求
めた各文字矩形間の距離を求めて、その距離がある閾値
より小さな文字矩形を全て1つの文字ブロックとして統
合する文字ブロック矩形抽出手段(図1の112)を備
えている。その閾値は全体の文字矩形間の距離の統計を
調べて決めたり、文字の幅を基準にしてその何%という
ようにして決めたりすればよい。
【0008】本発明の他の態様によれば、前記の基本的
な構成において、前記文字ブロック抽出手段は、表中の
文字と罫線を分離して、罫線をベクトル化する罫線ベク
トル化手段(図8の811)と、罫線ベクトル化手段に
より得られた罫線のベクトルデータを基に文字が書かれ
ているべき矩形領域を文字領域として抽出する文字領域
抽出手段(図8の812)と、その文字領域抽出手段で
求めた各文字領域に対して、文字の書かれている画素の
塊を囲む矩形領域を求める文字矩形抽出手段(図8の8
13)と、その文字矩形抽出手段で求めた各文字矩形間
の距離を求めて、ある閾値より小さな文字矩形を全て1
つの文字ブロックとして統合する文字ブロック矩形抽出
手段(図8の814)とを備えている。これは前の段落
(0007)で説明した文字ブロック抽出手段に、罫線
ベクトル化手段と文字領域抽出手段とを付加した構成の
ものである。この態様によれば、罫線ベクトル化手段で
罫線を求め、文字領域抽出手段により罫線により挟まれ
た領域を調べて文字が書かれるべき各文字領域を把握
し、その各文字領域において文字矩形を抽出するように
したので、文字ブロックを精度良く抽出することができ
る。
【0009】本発明の他の態様によれば、前記の基本的
な構成において、前記位置関係識別手段は、文字ブロッ
ク抽出処理により抽出された文字ブロック矩形を構成枠
とし、その構成枠の行方向の並びを識別する行抽出手段
(図1の121、図8の821)と、構成枠識別手段で
抽出した表を構成する構成枠の列方向の並びを識別する
列抽出手段(図1の122、図8の822)とを備えて
いる。また、そのさらに具体的態様においては、前記行
抽出手段は各構成枠の中心のy座標が所定の誤差範囲で
同一である構成枠の群を同一の行として抽出するよう構
成され、前記列抽出手段は各構成枠の中心のx座標が所
定の誤差範囲で同一である構成枠の群を同一の列として
抽出するよう構成される。表における文字ブロックは一
般に表の行および列に沿って配置されているので、この
ように文字ブロック矩形を構成枠として行および列方向
の並びを調べ、行および列にグループ化することにより
表構造の構成要素を抽出することができる。
【0010】さらに、本発明の他の態様では、前記の基
本的な構成において、さらに罫線によって囲まれる矩形
枠を抽出する矩形枠抽出手段を設け、位置関係識別手段
において罫線で囲まれた矩形枠と表中の文字ブロックを
同等に扱い各位置関係を識別するようにしたものであ
る。すなわち、この表認識装置は、表画像から文字ブロ
ックを抽出する文字ブロック抽出手段(図11の11
3)と、表画像から表を構成する罫線によって囲まれる
矩形枠を抽出する矩形枠抽出手段(図11の112)
と、前記矩形枠抽出手段により抽出された矩形枠および
前記文字ブロック抽出手段により抽出された文字ブロッ
ク相互の位置関係を識別し、表の構造を表すデータを作
成する位置関係識別手段(図11の114)とを備えて
いる。表の罫線で囲まれた矩形枠と表中の文字ブロック
を同等に扱うことにより、罫線で囲まれていない表中の
枠であっても、文字ブロックとして表の中の1つの構成
要素であると識別されるので、図2における(a),
(b)の表はもちろん、(c),(d),(e)の表も
正確に認識することができる。
【0011】上記発明において、矩形枠抽出手段は、罫
線画像をベクトルデータに変換する罫線ベクトル化手段
(図8の1121)と、その罫線ベクトル化手段により
出力された罫線ベクトルの接続関係を基に矩形枠を求め
る第1の矩形枠抽出手段(図11の1121)と、一端
が他のいずれの罫線ベクトルにも接続されていない罫線
ベクトルから一部の罫線が省略された矩形枠を抽出する
第2の矩形枠抽出手段(図11の1123)とを備えて
いる。
【0012】上記発明において、位置関係識別手段は、
その一態様によれば、前記矩形抽出手段により抽出した
表の罫線から構成される矩形枠と文字ブロック抽出処理
により抽出された文字ブロック矩形枠とから表を構成す
る構成枠を識別する構成枠識別手段(図11の114
1)と、その構成枠識別手段で抽出した表を構成する構
成枠の行方向の並びを識別する行抽出手段(図11の1
142)と、構成枠識別手段で抽出した表を構成する構
成枠の列方向の並びを識別する列抽出手段(図11の1
143)を備えている。また、その構成枠識別手段は、
具体的態様においては、前記矩形抽出手段により抽出し
た矩形枠については、その矩形枠内の文字ブロックを抽
出し、複数の文字ブロックがあったときは、その複数の
文字ブロックをそれぞれ構成枠と決定し、単一の文字ブ
ロックがあったときは矩形枠を構成枠と決定するもので
ある。このように構成枠を決定(認識)することによ
り、図2の(d)のように一部に罫線が省略されている
罫線の矩形枠があっても、表の構成要素である構成枠を
正確に決定することができる。
【0013】
【実施例】
(第1の実施例)図1は本発明の第1の実施例の構成を
示す図である。この実施例の表認識装置は、一連の文字
からなる文字ブロックの配置状態を調べて表の構造を認
識するものであって、図1に示すように表画像中の文字
画像から文字ブロックを抽出する文字ブロック抽出部1
1と、文字ブロック抽出部11により抽出された文字ブ
ロック相互の位置関係を識別し表の構造を表すデータを
得る位置関係識別部12とを備えている。
【0014】文字ブロック抽出部11は、文字の書かれ
ている画素の塊を囲む矩形領域を求める文字矩形抽出処
理部111と、その文字矩形抽出処理部111で求めた
各文字矩形間の距離を求めて、その距離がある閾値より
小さな文字矩形を文字ブロックとして統合する文字ブロ
ック矩形抽出処理部112からなっている。また、位置
関係識別部12は、文字ブロック抽出処理により抽出さ
れた文字ブロック矩形を構成枠として受け取り、その構
成枠の行方向の並びを識別する行抽出処理部121と、
構成枠の列方向の並びを識別する列抽出処理部122
と、位置関係の識別結果を記憶する表構造記憶部123
からなっている。
【0015】以上のように構成された本実施例の各部の
処理について、詳細に説明する。本実施例で処理の対象
とする画像は、イメージスキャナなどの画像入力装置に
より入力された表を含む文書画像から表領域が分離され
て得られた表画像である。表領域の分離手段は画面上で
マウスのようなポインティングデバイスにより操作者が
指定するものや、画像の属性を基に自動的に分離する表
領域分離装置(例えば、特開平2−210586号公報
参照)などがあり、いずれも公知の技術である。文字矩
形抽出処理部111は、表画像中の文字画像部分に対し
て、図3の(a),(b)に示すように、字の書かれて
いる画素の塊31,32,33,34を囲む矩形領域3
5,36,37,38を求める。すなわち、表の画像が
背景の画素値が0、文字/線の画素値が1で書かれてい
る時、画素値が1である塊を取り出してその矩形領域を
求める。このとき、2つの矩形領域が重なってるとき
は、図3の(b)のように2つの矩形領域37,38を
包含できるような矩形領域39で表す。なお、文字の矩
形領域を抽出する方法は、良く知られている技術(例え
ば、特開平2−267678号公報参照)であるので詳
細な説明は省略する。
【0016】さらに文字ブロック矩形抽出処理部112
では、文字矩形抽出処理部112で求めた各文字矩形間
の距離を求めて、ある閾値より小さな文字矩形を全て1
つの文字ブロックとして統合する処理を行なう。この処
理で用いる閾値は、全体の文字矩形間の距離の統計を調
べて決めてもいいし、文字の大きさの数%として決めて
もよく、ここでは特に閾値の決定方法については定めな
い。この処理を図4の(a)に示す罫線のない表に適用
した時の結果は、同図(b)のようになる。これらの処
理の結果得られた文字ブロックの矩形枠はそれぞれに識
別子が付され矩形枠の位置(x座標,y座標)、幅、高
さ等がデータとして適宜のメモリに蓄積される。
【0017】図5aおよび図5bは、文字ブロック矩形
抽出処理部112の処理のフローを示す図である。図5
aは文字矩形をブロックにまとめるための前記閾値を求
めるための処理手順を示すものである。処理に必要な定
数や中間結果を格納する格納部として、定数N、文字矩
形の幅の集計結果を格納する変数sumw、文字矩形の
高さの集計結果を格納する変数sumh、幅および高さ
の閾値Tw,Th、変数iが用意されている。まず、初期
設定としてNには文字矩形抽出処理部111で抽出した
文字矩形の総数を設定し、sumw、sumh、およびi
はそれぞれ0に設定する(ステップ501)。そして、
iがNを越えていないかどうかを判定し(ステップ50
2)、i<Nのときは、sumw、sumhに文字矩形C
iの幅、高さを加算し(ステップ503)、その加算値
を2Nで除する(ステップ504)。そしてiを1ずつ
増加させながら(ステップ505)、iがNより大きく
なるまでステップ502〜505の処理を繰り返す。i
がNより大きくなったとき、幅および高さの閾値Tw
hは文字矩形の幅の平均値の1/2の値として得られ
る。
【0018】図5aの処理で閾値が得られると、図5b
の処理により文字矩形をブロックにまとめる処理を行
う。変数jおよびBを0に設定する(ステップ50
6)。文字矩形Cjはいずれかの文字ブロックCBに登
録済かを判定する(ステップ507)。登録済みであれ
ば、次の文字矩形を処理するため変数jを1だけ増加さ
せる(ステップ517)。ステップ507の判定の結
果、文字矩形Cjがまだ未登録であったなら、文字ブロ
ックCBBに文字矩形Cjを登録する(ステップ50
8)。この登録された文字矩形Cjは一つの文字ブロッ
クCBBの先頭の文字矩形となる。次に、その登録した
文字と距離が閾値TwあるいはTh以内の距離にある文字
矩形を探して文字ブロックCBBに登録する処理を行
う。そのため、先ず変数kをjに設定する(ステップ5
09)。そして文字矩形Ckはいずれかの文字ブロック
に登録済かどうかを調べる(ステップ510)。登録済
みでなければ、CBBとCkとの距離Dを求める(ステッ
プ511)。求めた距離Dが閾値TwあるいはTh以内の
距離にあるか否かを調べる(ステップ512)。距離D
が閾値TwあるいはThの範囲内にあったならば、文字矩
形Ckを文字ブロックCBBに追加し、CBBの大きさを
変更する(ステップ513)。ステップ510で、文字
矩形Ckが登録済みであると判定されたとき、ステップ
512で距離Dが閾値TwあるいはThの範囲内にないと
判定されたとき、およびステップ513での追加の処理
を終えたときには、次の文字矩形を探すために、k=k
+1に設定し(ステップ514)、すべての文字矩形に
対する処理が終えたか否かを判定した後(ステップ51
5)、まだ処理が終わっていないときはその設定した次
の文字矩形についてステップ510〜514の処理を繰
り返す。ステップ515の判定で、k<Nではなくなっ
たときは、次の文字ブロックを求めるために、B=B+
1とすると共に(ステップ516)、j=j+1とする
(ステップ517)。j<Nの間は、ステップ507〜
ステップ518の処理を続行し、j<Nでなくなったと
き処理を終了する(ステップ519)。
【0019】次に、位置関係識別部12の働きについて
説明する。位置関係識別部12は、前述のように行抽出
処理部121、列抽出処理部122の3つの処理部から
なり、以下に順をおって説明する。この実施例では、文
字ブロック抽出部11で抽出した文字ブロックをそのま
ま構成枠として登録する。図4の(c)が構成枠を示す
ものである。
【0020】行抽出処理部121と列抽出処理部122
では、文字ブロック矩形抽出処理部121で抽出した文
字ブロック矩形を表を構成する構成枠とみなし、それら
の並びを識別する。図6aおよび図6bは行抽出処理の
フロー、図7aおよび図7bは列抽出処理のフローを示
す図である。同図に示すように、全ての構成枠の中心点
の座標を求め、行抽出処理では構成枠の中心点のY座標
がある誤差範囲内に並んでいる構成枠を表の行と識別
し、列抽出処理では構成枠の中心点のX座標がある誤差
範囲内に並んでいる構成枠を表の列と識別する。
【0021】即ち、行抽出処理では、図6aおよび図6
bに示すように、先ず構成枠の総数を変数Nに設定する
(ステップ601)。全ての構成枠の中心点のY座標を
求め,配列CBに格納する(ステップ602)。全矩形
枠の中で最大の高さを持つものを探索し、その高さの1
/2を誤差範囲の閾値Thの値とする(ステップ60
3)。次に文字ブロックのY座標の配列CBを昇順にソ
ートする(ステップ604)。そして、i=G=0、y
=CBiに設定し、行配列をクリアする(ステップ60
5)。次に、配列CBから一つの構成枠のY座標CBi
を取り出し、行配列に登録済かどうかを判定し(ステッ
プ607)、登録されていない構成枠CBiにたいして
は、yとの距離が閾値Th以内の範囲にあるか否かを|
CBi−y|<Thの演算により判定し(ステップ60
8)、yとの距離が閾値Th以内の範囲にあった場合は
CBiに対応する構成枠を行配列に格納する(ステップ
609)。文字ブロックが登録済みであった場合、およ
びyとの距離が閾値Th以内の範囲になかった場合は、
次の文字ブロックを取り出すためにi=i+1とする
(ステップ610)。取り出した新しい文字ブロックに
対して同様の行配列への判定、登録処理(ステップ60
7〜609)を行う。処理が進みi<Nでなくなったら
(ステップ606の判定)、一つの行に対する抽出処理
が終了し、次の行の抽出処理を行うため図6bのフロー
へ進む。行配列の内容をG番目の行情報として出力する
(ステップ611)。次に行配列をクリアするととも
に、i=0、G=G+1に設定する(ステップ61
2)。そして、G+1番目の行の先頭となるべき構成枠
を探す。すなわち、構成枠を最初から一つずつ取り出
し、いずれかの行に登録済みか否かを判定し(ステップ
614)、最初に見つかった未登録の構成枠をG+1番
目の行の先頭となるべき構成枠yとして指定するととも
に、i=0に設定し(ステップ616)、図6aのステ
ップ606〜610の1行の抽出処理へ移る。なお、ス
テップ613においてi<Nでないと判定されたとき、
すなわち未登録の構成枠がなくなったときは行の抽出処
理を終了する。
【0022】列抽出処理は、図7aおよび図7bに示す
通りであり、行抽出処理とは行と列とが入れ替わりって
いる点を除けばほぼ同様の処理を行う。すなわち、全て
の構成枠の中心点のX座標を配列CBに格納し(ステッ
プ702)、昇順にソートする(ステップ704)。全
矩形枠の中で最大の幅の1/2を誤差範囲の閾値Tw
値とし(ステップ703)、i=G=0 、x=CBi
に設定し、行配列をクリアする(ステップ705)。次
に、配列CBに格納された構成枠CBiを一つずつ取り
出し、登録されていない構成枠CBiにたいしては、x
との距離が誤差範囲の閾値Tw以内の範囲にあるか否か
を判定し(ステップ707〜708)、誤差範囲内にあ
った場合はCB iに対応する構成枠を列配列に格納する
(ステップ709)。一つの列に対する抽出処理が終了
したら、次の列の抽出処理を行うため図7bのフローへ
進む。次に、次の列の先頭となるべき未登録の最初の構
成枠を探し(ステップ714〜715)、見つかった
ら、図7aのステップ706〜710の1列の抽出処理
へ移る。未登録の構成枠がなくなったときは列の抽出処
理を終了する。
【0023】行抽出処理部121および列抽出処理部1
22の処理により、図4の(d)(e)に示すように構
成枠は行と列にグループ化される。その出力データは、
例えば、構成枠を表す識別番号に、行番号と列番号を与
えた形式で表構造記憶部123に記憶され、任意のシス
テム例えばワープロで利用可能な状態となる。
【0024】以上に説明したように、この第1の実施例
は、文字ブロック抽出部11で抽出した文字ブロックを
表の構成枠とし、その並びにより行および列からなる表
の構造を抽出するので、図4の(a)に示すような全く
罫線のない表であっても、表構造を認識することができ
る。なお、罫線のある表の場合でも、この第1の実施例
により同様に文字ブロックのみに基づいて表構造を認識
することができる。
【0025】(第2の実施例)図8は本発明の第2の実
施例の構成を示す図である。この実施例の表認識装置
は、罫線を基に表における文字領域を抽出し、その文字
領域内で文字ブロックを抽出し、抽出した文字ブロック
の配置状態を調べて表の構造を認識するものであって、
図1に示す第1の実施例の構成と同様に、表画像から文
字ブロックを抽出する文字ブロック抽出部81と、文字
ブロック抽出部81により抽出された文字ブロック相互
の位置関係を識別し表構造を表すデータを生成する位置
関係識別部82とからなる基本構成を備えている。そし
て、この第2の実施例は、第1の実施例とは、文字ブロ
ック抽出部81の構成が異なり、文字矩形抽出処理部8
13の前段に、罫線ベクトル化処理部811および文字
領域抽出処理部812からなる文字領域を求めるための
手段が付加されている。その罫線ベクトル化処理部81
1は、表中の文字と罫線を分離して、罫線をベクトル化
するものである。また、文字領域抽出処理部812は、
罫線ベクトル化処理部811により得られた罫線のベク
トルデータを基に文字が書かれているべき矩形領域を文
字領域として抽出するものである。
【0026】表の罫線だけをベクトル化するには表を構
成する線の部分と文字の部分とに分ける必要がある。こ
の分離処理は、図形中の文字と線分を分離する処理と同
様の既存の手法を用いることができる。なお、本願出願
人が先に特許出願した特願平3−290299号「文字
/図形分離装置」(発明者 清水昇)の技術を用いた場
合は、誤りの少ない正確な分離処理をより高速に行うこ
とができる。その文字/図形分離装置について簡単に説
明する。これは、図9に示すように、入力画像における
各黒画素塊の二以上の特徴を抽出する特徴抽出部91
と、その特徴抽出手段91の特徴抽出結果を利用して初
期クラスタ中心を求める初期クラスタ中心決定部92
と、特徴抽出部91の特徴抽出結果と初期クラスタ中心
決定部92の決定結果とを利用してクラスタリングする
ことにより領域の判定を行う領域判定部93とを備えて
いる。各黒画素塊の特徴量としては、たとえば黒画素塊
の面積、偏平率、輪郭線の複雑さなどを用いることがで
きる。特徴抽出部91でこのような特徴量が抽出される
と、次に初期クラスタ中心決定部92は、抽出された黒
画素塊の特徴量の分布を用いて初期クラスタの中心を求
める。領域判定部93は、抽出された黒画素塊の2以上
の特徴量に対して、初期クラスタ中心決定部92により
求められた初期クラスタ中心を用いて、クラスタリング
を行って各黒画素塊の属すべき領域を判定する。
【0027】分離された表の罫線の領域は、2値画像
を、端点、折れ線、交差点、分岐点などの特徴点を始点
および終点とするベクトルデータに変換する。このベク
トルデータに変換する方法は既存の技術(例えば、信学
技報PRL83−8、PRL85−24、PRL86−
89、特開平2−210586号公報、特開平2−10
5265号公報等参照)を用いればよいのでここでは説
明を省略する。
【0028】図10aおよび図10bは文字領域抽出処
理部812の抽出処理のフローを示す図である。罫線ベ
クトル化処理部811で得られた罫線ベクトルを縦罫線
VRと横罫線HRに分け(ステップ1001)、それぞ
れをカウントして、縦罫線の数をVに格納し、横罫線を
Hに格納する(ステップ1002)。横罫線の有無を判
定し(ステップ1003)、横罫線がなければ文字領域
数Rを1に設定し、領域の大きさを入力画像の大きさと
する(ステップ1009)。横罫線があれば文字領域数
RをH−1に設定し、iを0に設定する(ステップ10
04)。次に、横罫線をY座標の昇順にソートする(ス
テップ1005)。そして、Y座標の小さい順から文字
領域に番号を割り付けて行く。すなわち、i番目の横罫
線とi+1番目の横罫線で区切られる領域をi番目の文
字領域とする(ステップ1007)。i<Rでなくなっ
たら(ステップ1006)、番号の割り付けが終わり、
図10bに示す垂直方向の罫線による文字領域の処理に
移る。
【0029】縦罫線の有無を判定し(ステップ101
0)、縦罫線がなければ文字領域数Rを1に設定し、領
域の大きさを入力画像の大きさとする(ステップ101
8)。縦罫線があれば、図10aの処理で求めた横罫線
による文字領域数Rの内容をR1に移し、RにはR+V
−1を設定し、i,j,kをそれぞれ0に設定する(ス
テップ1011)。次に、縦罫線をX座標の昇順にソー
トする(ステップ1012)。そして横罫線で区切られ
た各領域ごとに、縦罫線で区切られた領域を求めて行く
(ステップ1014〜1017)。すなわち、横罫線で
区切られたj番目の領域について、i番目とi+1番目
の縦罫線で区切られる領域をk番目の文字領域とする
(ステップ1013)。この番号付けを順次iおよびk
を1ずつ増加しながら、j番目の領域に縦罫線で区切ら
れた未処理の領域がなくなったと判定されるまで、繰り
返す(ステップ1014,1015)。そして、つぎの
横罫線で区切られた領域について処理するため、jを1
だけ増加させるとともにiを0にクリアする。そして横
罫線で区切られた領域の最後のものについて処理が終わ
るまで、すなわちj<R1ではなくなったと判定される
まで、ステップ1013〜1017を繰り返す。以上の
ようにして、罫線で区切られた文字領域が抽出され、そ
の結果は文字矩形抽出処理部813へ渡される。
【0030】文字矩形抽出処理部813以降の処理部の
動作は、基本的には第1の実施例と同じである。ただ、
文字矩形抽出処理および文字ブロック抽出処理は、文字
領域抽出処理部812により抽出された文字領域の情報
を用いて行われる。従って、文字矩形の抽出が容易にな
り、しかも確実となるとともに、文字ブロックについて
も、罫線を挟んで近接している文字を一つのブロックと
して検出する誤りがなくなり、文字ブロックを確実に抽
出することができる。
【0031】(第3の実施例)図11は本発明の第3の
実施例を示すブロック図である。この実施例の表認識装
置は、表画像に含まれる文字部分と罫線部分を分離する
文字・罫線分離処理部1110と、文字・罫線分離処理
部1110により分離された罫線画像から表を構成する
罫線によって囲まれる矩形枠を抽出する矩形枠抽出部1
120と、文字・罫線分離処理部1110により分離さ
れた文字画像から表を構成する文字ブロック矩形枠を抽
出する文字ブロック抽出部1130と、矩形枠抽出部1
120により抽出された矩形枠および文字ブロック抽出
部1130により抽出された文字ブロック相互の位置関
係を識別し表の構造を表すデータを作成する位置関係識
別部1140と、位置関係識別部1140により識別さ
れた表の構造を表すデータを記憶する表構造記憶部11
44とを備えている。
【0032】矩形枠抽出部1120は、罫線画像をベク
トル化する罫線ベクトル化処理部1121と、罫線ベク
トル化処理部1121の出力する罫線ベクトルを基に、
罫線ベクトルにより囲まれた完全な矩形枠を抽出する完
全矩形枠抽出処理部1122と、罫線の一部が省略され
て矩形枠の一部がない不完全な矩形枠を抽出し足りない
ところを補って矩形枠とする不完全矩形枠抽出処理部1
123とを備えている。
【0033】文字ブロック抽出部1130は、字領域抽
出処理部1131と、文字矩形抽出処理部1131と、
文字ブロック矩形抽出処理部矩形抽出部11とを備えて
いる。文字領域抽出処理部1131は、矩形枠抽出部1
120により得られた矩形枠により囲まれた領域をそれ
ぞれ文字領域と決定し、文字・罫線分離処理部1110
からの文字画像を各文字領域ごとに切り出し、文字矩形
抽出処理部1132へ渡す。文字矩形抽出処理部113
2は、文字の書かれている画素の塊を囲む矩形領域を求
めるものである。文字ブロック矩形抽出処理部1133
は、文字矩形抽出処理部1132で求めた各文字矩形間
の距離を求めて、その距離がある閾値より小さな文字矩
形を全て1つの文字ブロックとして統合するものであ
る。
【0034】また、位置関係識別部1140は、矩形枠
抽出部1120により抽出された矩形枠および前記文字
ブロック抽出113により抽出された文字ブロック相互
の位置関係を識別するものであって、構成枠識別処理部
1141と、行抽出処理部1142と、列抽出処理部1
143と、それらの抽出結果を記憶する表構造記憶部1
141からなっている。構成枠識別処理部1141は、
前記矩形抽出手段により抽出した表の罫線から構成され
る矩形枠と文字ブロック抽出手段により抽出された文字
ブロック矩形枠から表を構成する構成枠を識別するもの
である。行抽出処理部1142は、構成枠識別処理部1
141で抽出した表を構成する構成枠の行方向の並びを
識別し、列抽出処理部1143は、構成枠識別処理部1
141で抽出した表を構成する構成枠の列方向の並びを
識別するものである。
【0035】以上のように構成された本実施例の動作に
ついて説明する。文字・罫線分離処理部1110は、図
形中の文字と線分を分離する処理と同様の既存の手法を
用いることができる。なお、第2の実施例において挙げ
た特願平3−290299号「文字/図形分離装置」の
技術を用いると、誤りの少ない正確な分離処理をより高
速に行うことができる。ここで分離した罫線画像の情報
は矩形枠抽出部1120に出力され、文字画像の情報は
文字ブロック抽出部1130へ出力される。
【0036】罫線画像は罫線ベクトル化処理部1121
でベクトル化される。すなわち、2値画像を、端点、折
れ線、交差点、分岐点などの特徴点を始点および終点と
するベクトルデータに変換する。このベクトルデータに
変換する方法は前掲の既存の技術を用いればよい。変換
された罫線ベクトルデータは、罫線ベクトルにより囲ま
れた完全な矩形枠を抽出する完全矩形枠抽出処理部11
22と、罫線の一部が省略されて矩形枠の一部がない不
完全な矩形枠を抽出し足りないところを補って矩形枠と
する不完全矩形枠抽出処理部1123とに渡される。
【0037】完全矩形枠抽出処理部1122は、罫線ベ
クトルデータを基に罫線ベクトルにより囲まれた完全な
矩形枠を取り出す。図12aおよび12bはその処理の
フローチャートである。表の矩形枠は、1つの水平ベク
トルデータの左右に垂直ベクトルデータが接続し、さら
にその下に水平ベクトルデータが接続していることか
ら、各水平ベクトルデータを調べて、条件を満たすベク
トルデータを図14に示す矩形枠構成表に記入する。ま
ず、表を構成する全てのベクトルデータの数を計数する
(ステップ1201)。以下のステップ1202からス
テップ1212の処理を全てのベクトルデータに対して
適用する。矩形枠の上罫線となる水平ベクトルデータV
iを捜す(ステップ1203)。これは、ベクトルデー
タと水平線とのなす角度がある閾値以下であることから
水平なベクトルデータを見つけることができる。ここで
みつけた水平ベクトルデータViは、k番目の矩形枠の
上罫線となる可能性があるので、矩形枠構成表141の
k番目の矩形枠の上罫線の欄にこのベクトルデータVi
を登録する(ステップ1204)。次に矩形枠Wkの右
側の辺を構成するベクトルデータを捜す(ステップ12
05)。すなわち、ベクトルデータViの右端の端点に
接し、かつベクトルデータViに接していないほうの端
点がベクトルデータViより下にあるような垂直ベクト
ルデータをみつける処理を行なう。垂直ベクトルデータ
は、垂線とのなす角度がある閾値以下であることから容
易に求めることができる。このステップで見つけたベク
トルデータは矩形枠Wkの右罫線を構成する可能性があ
るので、矩形枠構成表141のk番目の矩形枠の右罫線
の欄に登録する(ステップ1206)。同様に矩形枠W
kの左罫線を捜し(ステップ1207)、矩形枠構成表
141のk番目の矩形枠の左罫線の欄に登録する(ステ
ップ1208)。さらに、いま求めた右罫線、左罫線の
下側に接するベクトルデータを見つけ(ステップ120
9)、矩形枠構成表141のk番目の矩形枠の下罫線の
欄に登録する(ステップ1210)。以上の処理のう
ち、1つでも罫線が見つからない場合は、矩形枠構成表
141のk番目の矩形枠のすべての登録を破棄して、他
のベクトルデータで構成される矩形枠を登録できるよう
にリセットする。以上の処理を図13の表に適用した時
の矩形枠構成表141は図14のようになる。また、他
の例として図15のような表に対する処理では、矩形枠
構成表141は図16のようになる。さらに、この後の
処理に便利なように矩形枠構成表141を、各矩形枠の
左上隅のX座標、Y座標と矩形の幅と高さで表す矩形枠
テーブル171に書き換える。図14の矩形枠テーブル
は図17の(a)のようになる。
【0038】不完全矩形枠抽出処理部1123は、罫線
の一部が省略されて矩形枠の一部がない不完全な矩形枠
を抽出し足りないところを補って表の矩形枠として取り
出す。図18aおよび18bはその処理のフローチャー
トである。まず、完全矩形枠抽出処理部1122により
抽出された矩形枠の要素として矩形枠構成表に登録され
ているベクトルデータ以外の未登録ベクトルを抽出する
(ステップ1801〜1806)。そのために、まず、
Nにベクトルデータの総数を設定し、i=k=0にクリ
アする(ステップ1801)。ベクトルデータViを取
り出し、矩形枠構成表に登録されているか否かを調べ
(ステップ1803)、登録されていなければベクトル
列VVに登録するとともに(ステップ1804)、カウ
ンタkにより計数する(ステップ1805)。そして次
のベクトルを取り出すためにi=i+1とする(ステッ
プ1806)。ベクトルデータViが矩形枠構成表に登
録されていた場合には、そのまま次のベクトルの処理に
移る(ステップ1806)。iがNに達したとき、すな
わちすべてのベクトルについて未登録ベクトルの登録処
理が終わったら(ステップ1802)、未登録ベクトル
列VV内で、最も近い2つの端点を結ぶ水平/垂直なベ
クトルを補う(ステップ1807)。その補った数をn
とする。ベクトルの総数kをk+nとし、またi=m=
0にクリアする(ステップ1808)。矩形枠の上罫線
となる水平ベクトルデータVViを捜す(ステップ18
10)。これは、ベクトルデータと水平線とのなす角度
がある閾値以下であることから水平なベクトルデータを
見つけることができる。ここでみつけた水平ベクトルデ
ータVViは、m番目の矩形枠Wmの上罫線となる可能性
があるので、不完全矩形枠構成表のm番目の矩形枠の上
罫線の欄にこのベクトルデータVViを登録する(ステ
ップ1811)。次に矩形枠Wmの右側の辺を構成する
ベクトルデータを捜す(ステップ1812)。すなわ
ち、ベクトルデータVViの右端の端点に接し、かつベ
クトルデータVViに接していないほうの端点がベクト
ルデータViより下にあるような垂直ベクトルデータを
みつける処理を行なう。垂直ベクトルデータは、垂線と
のなす角度がある閾値以下であることから容易に求める
ことができる。このステップで見つけたベクトルデータ
は矩形枠Wmの右罫線を構成する可能性があるので、不
完全矩形枠構成表のm番目の矩形枠の右罫線の欄に登録
する(ステップ1813)。同様に矩形枠Wmの左罫線
を捜し(ステップ1814)、不完全矩形枠構成表のm
番目の矩形枠の左罫線の欄に登録する(ステップ181
5)。さらに、いま求めた右罫線、左罫線の下側に接す
るベクトルデータを見つけ(ステップ1816)、不完
全矩形枠構成表のm番目の矩形枠Wmの下罫線の欄に登
録する(ステップ1817)。以上の処理のうち、1つ
でも罫線が見つからない場合は、不完全矩形枠構成表の
m番目の矩形枠Wmのすべての登録を破棄して、他のベ
クトルデータで構成される矩形枠を登録できるようにリ
セットする。図20の(b)は不完全矩形枠構成表の例
を示すもので、これは図19の表の不完全矩形枠部分を
表すものである。さらに、この後の処理に便利なように
不完全矩形枠構成表を、各矩形枠の左上隅のX座標、Y
座標と矩形の幅と高さで表す矩形枠テーブルに書き換え
る。
【0039】次に文字ブロック抽出部1130の処理に
ついて説明する。文字領域抽出処理部1131では、表
の中で罫線で区切られ、文字が書かれているべき矩形を
見つけ文字領域テーブルに登録する。本実施例では、完
全矩形枠抽出部および不完全矩形枠抽出部により矩形枠
が抽出されているので、これを文字領域テーブルに登録
すればよい。図19の例では、2個の完全矩形枠に囲ま
れた文字領域と、4個の不完全矩形枠内の文字領域とが
得られる。他の例としては、図21の(a)のような罫
線の不足している表に対してこの処理は、図21の
(b)のように罫線を補い、図21の(c)のように複
数の文字ブロックを包含する文字領域211を抽出す
る。この後の処理は、ここで求めた文字領域ごとに処理
を進める。このように文字領域を得て、文字領域ごとに
文字ブロックの抽出を行うようにすることにより罫線を
またぐような文字ブロックの抽出を防ぐことができる。
【0040】次の文字矩形抽出処理1132について説
明する。ここでは、文字領域抽出処理部1131で求め
た各文字領域に対して、文字の書かれている画素の塊を
囲む矩形領域を求める。すなわち、表の画像が背景の画
素値が0、文字/線の画素値が1で書かれている時、画
素値が1である塊を取り出してその矩形領域を求める。
2つの矩形領域が重なってるときは、図3の(b)のよ
うに2つの矩形領域37,38を包含できるような矩形
領域39で表す。なお、文字の矩形領域を抽出する方法
は、既存の技術であるので詳細な説明は省略する。
【0041】さらに文字ブロック矩形抽出処理部113
3では、文字矩形抽出処理部1132で求めた各文字矩
形間の距離を求めて、ある閾値より小さな文字矩形を全
て1つの文字ブロックとして統合する処理を行なう。そ
の処理の詳細は、第1の実施例における文字ブロック矩
形抽出処理部112の処理と基本的には同じであり、図
5aおよび図5bのフローチャートに示されている。こ
のフローチャートについては第1の実施例において既に
説明したので、ここでの説明は省略する。ただ、第1の
実施例の場合はブロックに統合するか否かを前記閾値の
みにより判定していたが、本実施例は文字領域の情報を
参照して同じ文字領域にある場合にのみ一つの文字ブロ
ックに統合する。これにより罫線をまたぐような文字ブ
ロックの抽出を防ぐことができる。
【0042】最後に位置関係識別部1140の働きにつ
いて説明する。位置関係識別114はさらに、構成枠識
別処理部1141、行抽出処理1142、列抽出処理1
143の3つの処理部からなる。構成枠識別処理では、
実際に表の構造を構成する枠は、表の罫線から構成され
る矩形枠なのか、文字ブロックの枠なのかを識別し、選
択する処理である。矩形枠の内部には少なくとも1つ以
上の文字ブロックが存在しているはずなので、矩形枠の
内部にある文字ブロックの数を計数して、2つ以上の文
字ブロックが確認された場合は、文字ブロックを構成枠
として登録し、また、1つの文字ブロックだけが存在す
る場合は、矩形枠を構成枠として登録する。
【0043】図22は上記の構成枠識別処理の詳細を示
すフロー図である。Nに完全矩形枠の総数、Mに文字ブ
ロックの総数を設定し、完全矩形枠wの配列の要素を指
定する変数i、識別した構成枠の配列の要素を指定する
変数C、各完全矩形枠に含まれる文字ブロックを計数す
る変数sをそれぞれ0に設定する(ステップ220
1)。文字ブロックCBjの配列の要素を指定する変数
jと変数sを0に設定する(ステップ2202)。文字
ブロックCBjを取り出し、完全矩形枠Wiに含まれるか
否かを判定し(ステップ2203)、含まれる場合には
sをインクリメントし(ステップ2204)、含まれな
い場合には何もしない。そして、次の文字ブロックを取
り出すためjをインクリメントする(ステップ220
5)。以上のステップ2204〜2205の処理を、順
次、未処理の文字ブロックがなくなったと判定される
(ステップ2206)まで繰り返す。このようにして、
ひとつの完全矩形枠について、すべての文字ブロックを
調べ終わったら、その完全矩形枠に含まれる文字ブロッ
クの数sが複数あるか否かを判定し(ステップ220
7)、複数あっだ場合には、完全矩形枠Wiに含まれる
s個の文字ブロックを構成枠として登録する(ステップ
2208)。s個登録したのでCをC+sとする(ステ
ップ2209)。一方、その完全矩形枠Wiに含まれる
文字ブロックの数sが1であったときは、完全矩形枠W
iをC番目の構成枠として登録し(ステップ221
0)、Cをインクリメントする(ステップ2211)。
以上の処理により、ひとつの完全矩形枠について、関連
する構成枠を識別したら、次に完全矩形枠について同様
の処理を行うためi=i+1とし、ステップ2202に
戻る。i<Nでないとの判定(ステップ2213)がな
されると、すべての処理が終了する。図23の(a)お
よび(b)に、構成枠を抽出した結果の一例を示す。同
図(a)は表の例、(b)は(a)の表から抽出した構
成枠を示す。
【0044】行抽出処理部1142と列抽出処理部11
43では、構成枠識別処理部1141で抽出した表を構
成する枠の並びを識別する。すなわち、全ての構成枠の
中心点の座標を求め、行抽出処理部1142では構成枠
の中心点のY座標がある誤差範囲内に並んでいる構成枠
を表の行と識別し、列抽出処理1143では構成枠の中
心点のX座標がある誤差範囲内に並んでいる構成枠を表
の列と識別する。この処理の詳細は、行抽出処理フロー
を図6aおよび図6bに示し、列抽出処理フローを図7
aおよび図7bに示す。これらの処理の詳細な説明は、
第1の実施例により説明したところと同じである。行抽
出処理152、列抽出処理153の結果を図24と図2
5に示す。
【0045】このような処理を行なった後に、抽出した
行と列の並びで順に番号付けを行ない、この番号付けに
従って、ワープロの表のデータを記述することで、画像
として入力した表をワープロで編集が可能な表に変換す
ることが可能である。また、構成枠を用いて文字を切り
出すことにより、図24の(a)に示した表のように表
の両脇に罫線が不足している場合、図24の(b)のよ
うに表の第2列目と第3列目が罫線からなる矩形枠で、
残りは文字ブロックであるような構成枠が抽出できる。
線の不足している表も容易に文字認識装置へ入力するこ
とも可能となる。たとえば、図24の(a)に示した表
のように表の両脇に罫線が不足している場合、図24の
(b)のように表の第2列目と第3列目が罫線からなる
矩形枠で、残りは文字ブロックであるような構成枠が抽
出できる。また、図25の(a)に示した表のように縦
の罫線が全てと横罫線の一部が省略されている場合に
は、同図(b)のように構成枠は全て文字ブロックとな
る。また、図26の(a)に示した表のように表の縦罫
線、横罫線の一部が省略されている場合、表の中に罫線
からなる矩形枠を抽出することができるが、さらにその
内部に複数の文字ブロックを含んでいるために、図26
の(b)のようにその構成枠は全て文字ブロックとな
る。図24、図25、図26に示したようにどのタイプ
の表に対しても、本実施例は表の行と列の構造を正確に
取り出すことができる。本実施例では少なくとも罫線が
書かれている表を対象として説明したが、同様の処理を
行なうことにより、罫線をまったく含まない表に対して
も適用しうるものである。さらに、明示的に表として書
かれていない文章、たとえば箇条書の文書に対して、表
としての構造を付加することも可能である。
【0046】
【発明の効果】本発明によれば、文字ブロック抽出手段
により抽出された文字ブロック相互の位置関係を位置関
係識別手段により識別する。表における文字ブロックは
表の構成要素として一般に規則正しく整列した位置関係
にあるので、文字ブロック相互の位置関係を見ることに
より表の構造を認識できる。従来は、表の罫線のみに着
目して表を構成する枠を求めていたので、縦罫線、横罫
線の一部または全部に省略のあるような表の構造を正確
に認識することができないという問題があったが、本発
明によれば文字ブロックの並びを用いて表の構造を認識
するので、その問題は解消できる。
【0047】また、本発明の文字領域抽出手段を設けた
態様によれば、文字領域抽出手段により罫線の情報を用
いて文字領域を抽出し、文字領域ごとに文字ブロックを
抽出する。したがって、罫線を挟んで近接した文字矩形
を一つのブロックとして抽出されるおそれはなく、文字
ブロックを精度よく抽出することができ、ひいては表の
構造を正確に認識することができる。
【0048】本発明において、罫線によって囲まれる矩
形枠を抽出する矩形枠抽出手段を設け、位置関係識別手
段において罫線で囲まれた矩形枠と表中の文字ブロック
を同等に扱い各位置関係を識別するようにした態様のも
のにおいては、表の罫線で囲まれた矩形枠と表中の文字
ブロックを同等に扱うことにより、罫線で囲まれていな
い表中の枠であっても、文字ブロックとして表の中の1
つの構成要素であると識別されるので、罫線の一部また
は全部が省略された表も、罫線が全部揃っている表と同
様に正確に認識することができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施例の構成を示す図
【図2】 (a)〜(e)は文書中で使われる表の例を
示す図
【図3】 (a)および(b)は文字矩形の例を示した
【図4】 (a)〜(e)は罫線がすべて省略された表
の認識を説明するための図
【図5a】 文字ブロックの抽出処理のフローを示す図
【図5b】 文字ブロックの抽出処理のフローを示す図
(図5aの続き)
【図6a】 行抽出処理のフローを示す図
【図6b】 行抽出処理のフローを示す図(図6aの続
き)
【図7a】 列抽出処理のフローを示す図
【図7b】 列抽出処理のフローを示す図(図7aの続
き)
【図8】 本発明の第2の実施例の構成を示す図
【図9】
【図10a】 第2の実施例における文字領域抽出処理
のフローを示す図
【図10b】 第2の実施例における文字領域抽出処理
のフローを示す図(図10aの続き)
【図11】 本発明の第3の実施例の構成を示す図
【図12a】 完全矩形枠抽出処理部の処理フローを示
す図
【図12b】 完全矩形枠抽出処理部の処理フローを示
す図(図12aの続き)
【図13】 表を構成するベクトルデータの例を示す図
【図14】 矩形枠構成表の一例を示す図を示す図
【図15】 表を構成するベクトルデータの他の例を示
す図
【図16】 矩形枠構成表の他の例を示す図
【図17】 (a)矩形枠テーブルおよび(b)文字領
域テーブルの一例を示す図
【図18a】 不完全矩形枠抽出処理のフローを示す図
【図18b】 不完全矩形枠抽出処理のフローを示す図
(図18aの続き)
【図19】 一部の罫線が省略された表を構成するベク
トルデータの例を示す図
【図20】 図19の表に対応する矩形枠構成表の例を
示すもので、(a)は完全矩形枠構成表、(b)は不完
全矩形枠構成表をそれぞれ示す図
【図21】 文字領域の抽出を説明するための図
【図22】 構成枠識別処理部の処理のフローを示す図
【図23】 構成枠、行および列の抽出の例を示した図
で、(a)は右端の縦罫線が省略された表の例、(b)
は抽出された構成枠、(c)は抽出された行、(d)は
抽出された列をそれぞれ示す。
【図24】 構成枠、行および列の抽出の他の例を示し
た図で、(a)は左右両端の縦罫線が省略された表の
例、(b)は抽出された構成枠、(c)は抽出された
行、(d)は抽出された列をそれぞれ示す。
【図25】 構成枠、行および列の抽出の他の例を示し
た図で、(a)は縦罫線がすべて省略された表の例、
(b)は抽出された構成枠、(c)は抽出された行、
(d)は抽出された例をそれぞれ示す。
【図26】 構成枠、行および列の抽出の他の例を示し
た図で、(a)は縦罫線および横罫線の一部が省略され
た表の例、(b)は抽出された構成枠、(c)は抽出さ
れた行、(d)は抽出された列をそれぞれ示す。
【符号の説明】
11,81…文字ブロック抽出部、111,813…文
字矩形抽出処理部、112,814…文字ブロック矩形
抽出処理部、12,82…位置関係識別部、121,8
21…行抽出処理部、122,822…列抽出処理部、
123,823…表構造記憶部、811…罫線ベクトル
化処理部、812…文字領域抽出処理部、1110…文
字・罫線分離処理部、1120…矩形枠抽出部、112
1…罫線ベクトル化処理部、1122…完全矩形枠抽出
処理部、1123…不完全矩形抽出処理部、1130…
文字ブロック抽出部、1132…文字矩形抽出処理部、
1133…文字ブロック矩形抽出処理部、1140…位
置関係識別部、1141…構成枠識別処理部、1142
…行抽出処理部、1143…列抽出処理部、1144…
表構造記憶部、31,32,33,34…黒画素塊、3
5,36,39…文字矩形、161…構成枠、171…
矩形枠テーブル、172…文字領域テーブル211…文
字領域。

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】 表画像から文字ブロックを抽出する文字
    ブロック抽出手段と、 前記文字ブロック抽出手段により抽出された文字ブロッ
    ク相互の位置関係を識別し、表の構造を表すデータを生
    成する位置関係識別手段とを有することを特徴とする表
    認識装置。
  2. 【請求項2】 表画像を文字画像と罫線画像に分離する
    文字・罫線分離手段を設け、前記文字ブロック抽出手段
    へ前記文字・罫線分離手段により分離された文字画像を
    入力することを特徴とする請求項1記載の表認識装置。
  3. 【請求項3】 前記文字ブロック抽出手段は、文字の書
    かれている画素の塊を囲む矩形領域を求める文字矩形抽
    出手段と、文字矩形抽出手段で求めた各文字矩形間の距
    離に基づいて1以上の文字矩形を文字ブロックとして統
    合する文字ブロック矩形抽出手段を備えたことを特徴と
    する請求項1記載の表認識装置。
  4. 【請求項4】 文字ブロック矩形抽出手段は、文字矩形
    抽出手段で求めた各文字矩形間の距離を求めて、ある閾
    値より小さな距離で連続した文字矩形群を1つの文字ブ
    ロックとして統合する処理を行うことを特徴とする請求
    項3記載の表認識装置。
  5. 【請求項5】 前記文字ブロック抽出手段は、表中の文
    字と罫線を分離して、罫線をベクトル化する罫線ベクト
    ル化手段と、その罫線ベクトル化手段により得られた罫
    線のベクトルデータを基に文字が書かれているべき矩形
    領域を文字領域として抽出する文字領域抽出手段と、
    の文字領域抽出手段で求めた各文字領域に対して、文字
    の書かれている画素の固まりを囲む矩形領域を求める文
    字矩形抽出手段と、その文字矩形抽出手段で求めた各文
    字矩形間の距離に基づいて1以上の文字矩形を文字ブロ
    ックとして統合する文字ブロック矩形抽出手段とを備え
    たことを特徴とする請求項1記載の表認識装置。
  6. 【請求項6】 前記位置関係識別手段は、文字ブロック
    抽出手段により抽出された文字ブロック矩形を表の構成
    枠とみなし、その構成枠の行方向の並びを識別する行抽
    出手段と、前記構成枠の列方向の並びを識別する列抽出
    手段を備えたことを特徴とする請求項1記載の表認識装
    置。
  7. 【請求項7】 前記行抽出手段は各構成枠の中心のy座
    標が所定の誤差範囲で同一である構成枠の群を同一の行
    として抽出するものであり、前記列抽出手段は各構成枠
    の中心のx座標が所定の誤差範囲で同一である構成枠の
    群を同一の列として抽出するものであることを特徴とす
    る請求項6記載の表認識装置。
  8. 【請求項8】 対象とする表領域から表を構成する罫線
    によって囲まれる矩形枠を抽出する矩形枠抽出手段と、 対象とする表領域から文字ブロックを抽出する文字ブロ
    ック抽出手段と、 前記矩形枠抽出手段により抽出された矩形枠および前記
    文字ブロック抽出手段により抽出された文字ブロック相
    互の位置関係を識別する位置関係識別手段と、を有する
    ことを特徴とする表認識装置。
  9. 【請求項9】 表画像を文字画像と罫線画像に分離する
    文字・罫線分離手段を設け、前記文字ブロック抽出手段
    へは前記文字・罫線分離手段により分離された文字画像
    を入力し、前記矩形抽出手段へは前記文字・罫線分離手
    段により分離された罫線画像を入力することを特徴とす
    る請求項8記載の表認識装置。
  10. 【請求項10】 前記矩形枠抽出手段は、文字・罫線分
    離手段により分離した罫線画像をベクトルデータに変換
    する罫線ベクトル化手段と、その罫線ベクトル化手段に
    より出力された罫線ベクトルの接続関係を基に矩形枠を
    求める第1の矩形枠抽出手段と、一端が他のいずれの罫
    線ベクトルにも接続されていない罫線ベクトルから一部
    の罫線が省略された矩形枠を推定する第2の矩形枠抽出
    手段とを備えたことを特徴とする請求項8記載の表認識
    装置。
  11. 【請求項11】 前記文字ブロック抽出手段は、文字の
    書かれている画素の塊を囲む矩形領域を求める文字矩形
    抽出手段と、その文字矩形抽出手段で求めた各文字矩形
    間の距離を求め、その距離に基づいて1以上の文字矩形
    を文字ブロックとして統合する文字ブロック矩形抽出手
    段を備えたことを特徴とする請求項8記載の表認識装
    置。
  12. 【請求項12】 前記文字ブロック抽出手段は、矩形枠
    抽出手段の出力を基に、文字が書かれているべき矩形領
    域を文字領域として抽出する文字領域抽出手段と、文字
    領域抽出手段で求めた各文字領域に対して、文字の書か
    れている画素の塊を囲む矩形領域を求める文字矩形抽出
    手段と、文字矩形抽出手段で求めた各文字矩形の間の距
    離に基づいて1以上の文字矩形を文字ブロックとして統
    合する文字ブロック矩形抽出手段とを備えたことを特徴
    とする請求項8記載の表認識装置。
  13. 【請求項13】 前記位置関係識別手段は、前記矩形抽
    出手段により抽出した表の罫線から構成される矩形枠と
    文字ブロック抽出手段により抽出された文字ブロック矩
    形とから表を構成する構成枠を識別する構成枠識別手段
    と、構成枠識別手段で抽出した表を構成する構成枠の行
    方向の並びを識別する行抽出手段と、構成枠識別手段で
    抽出した表を構成する構成枠の列方向の並びを識別する
    列抽出手段を備えたことを特徴とする請求項8記載の表
    認識装置。
  14. 【請求項14】 前記構成枠識別手段は、前記矩形抽出
    手段により抽出した矩形枠については、その矩形枠内の
    文字ブロックを抽出し、複数の文字ブロックがあったと
    きは、その複数の文字ブロックをそれぞれ構成枠と決定
    し、単一の文字ブロックがあったときは矩形枠を構成枠
    と決定する処理を行うことを特徴とする請求項13記載
    の表認識装置。
  15. 【請求項15】 前記行抽出手段は各構成枠の中心のy
    座標が所定の誤差範囲で同一である構成枠の群を同一の
    行として抽出するものであり、前記列抽出手段は各構成
    枠の中心のx座標が所定の誤差範囲で同一である構成枠
    の群を同一の列として抽出するものであることを特徴と
    する請求項13記載の表認識装置。
JP4161858A 1992-05-29 1992-05-29 表認識装置 Expired - Fee Related JP2926066B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4161858A JP2926066B2 (ja) 1992-05-29 1992-05-29 表認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4161858A JP2926066B2 (ja) 1992-05-29 1992-05-29 表認識装置

Publications (2)

Publication Number Publication Date
JPH05334490A JPH05334490A (ja) 1993-12-17
JP2926066B2 true JP2926066B2 (ja) 1999-07-28

Family

ID=15743300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4161858A Expired - Fee Related JP2926066B2 (ja) 1992-05-29 1992-05-29 表認識装置

Country Status (1)

Country Link
JP (1) JP2926066B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032770A (ja) 2000-06-23 2002-01-31 Internatl Business Mach Corp <Ibm> 文書処理方法、文書処理システムおよび媒体
JP5318742B2 (ja) * 2009-12-14 2013-10-16 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
US8914419B2 (en) 2012-10-30 2014-12-16 International Business Machines Corporation Extracting semantic relationships from table structures in electronic documents
US10289653B2 (en) 2013-03-15 2019-05-14 International Business Machines Corporation Adapting tabular data for narration
US9164977B2 (en) 2013-06-24 2015-10-20 International Business Machines Corporation Error correction in tables using discovered functional dependencies
US9600461B2 (en) 2013-07-01 2017-03-21 International Business Machines Corporation Discovering relationships in tabular data
US9607039B2 (en) 2013-07-18 2017-03-28 International Business Machines Corporation Subject-matter analysis of tabular data
US9830314B2 (en) 2013-11-18 2017-11-28 International Business Machines Corporation Error correction in tables using a question and answer system
US9286290B2 (en) 2014-04-25 2016-03-15 International Business Machines Corporation Producing insight information from tables using natural language processing
US10095740B2 (en) 2015-08-25 2018-10-09 International Business Machines Corporation Selective fact generation from table data in a cognitive system

Also Published As

Publication number Publication date
JPH05334490A (ja) 1993-12-17

Similar Documents

Publication Publication Date Title
US6006240A (en) Cell identification in table analysis
US5774580A (en) Document image processing method and system having function of determining body text region reading order
US5048107A (en) Table region identification method
JP3343864B2 (ja) 語体の分離方法
US5668892A (en) Table recognition apparatus
US6175844B1 (en) Ordering groups of text in an image
US8077976B2 (en) Image search apparatus and image search method
JP2926066B2 (ja) 表認識装置
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
Saitoh et al. Document image segmentation and text area ordering
EP0496531A2 (en) Method and system for layout analysis of a document image
JPH0256707B2 (ja)
Saitoh et al. Document image segmentation and layout analysis
JPH08320914A (ja) 表認識方法および装置
JP3904397B2 (ja) 表認識方法
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JPH06131497A (ja) 表認識方式
JP2917427B2 (ja) 図面読取装置
KR100331035B1 (ko) 서식문서영상의자동해석방법
JPH03126188A (ja) 文字認識装置
JPH03142691A (ja) 表形式文書認識方式
JPH07160810A (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH0259979A (ja) 文書画像処理装置
JPS63126082A (ja) 文字認識方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees