JPH06139404A - 表認識装置 - Google Patents

表認識装置

Info

Publication number
JPH06139404A
JPH06139404A JP4310861A JP31086192A JPH06139404A JP H06139404 A JPH06139404 A JP H06139404A JP 4310861 A JP4310861 A JP 4310861A JP 31086192 A JP31086192 A JP 31086192A JP H06139404 A JPH06139404 A JP H06139404A
Authority
JP
Japan
Prior art keywords
character
character block
extracting
block
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4310861A
Other languages
English (en)
Other versions
JP2789971B2 (ja
Inventor
Katsuhiko Itonori
勝彦 糸乘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP4310861A priority Critical patent/JP2789971B2/ja
Publication of JPH06139404A publication Critical patent/JPH06139404A/ja
Priority to US08/479,974 priority patent/US5708730A/en
Priority to US08/599,099 priority patent/US5668892A/en
Application granted granted Critical
Publication of JP2789971B2 publication Critical patent/JP2789971B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Abstract

(57)【要約】 【目的】 表の罫線が大幅に省略されているような表あ
るい内容に省略されている部分のある表に関しても、正
確に表の構造を取り出すことができること。 【構成】 文字と罫線が混在している表画像を認識する
表認識装置において、表画像中の文字と罫線を分離する
文字/罫線分離部11と、文字/罫線分離部12によっ
て分離された文字画像から文字ブロックを抽出する文字
ブロック抽出部12と、文字ブロック抽出部12によっ
て抽出された各文字ブロックを相互の位置関係から各文
字ブロックの縁を揃えるように拡張する文字ブロック拡
張部13と、文字ブロック間の位置関係により行を抽出
する行抽出部14と、前記文字ブロック拡張部により拡
張された文字ブロック間の位置関係により列を抽出する
列抽出部15とを有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字と図形が混在してい
る表画像を認識し、行と列の構造を取り出す表認識装置
に関する。
【0002】
【従来の技術】従来の表認識の方式としては、表領域の
周辺分布や表を構成する罫線をベクトル線分に変換し
て、罫線で囲まれた矩形枠を抽出している。周辺分布を
使用する方式として、例えば特開平2−61775号公
報記載の技術、ベクトル線分を使用する方式として特開
平1−129358号公報記載の技術等がある。前者の
方式は、周辺分布により表の最も外側にある外枠の罫線
を取り出し、この外枠に両端を接する罫線により複数の
矩形枠に分割する。さらに、分割された各矩形枠内に対
して同様の処理を再帰的に施すことにより、罫線で囲ま
れた矩形枠を抽出する。後者の方式は、ベクトル線分を
追跡して取り出した各矩形枠の位置関係を調べることに
より表の認識を行なう。
【0003】これらの従来の方式は、表を構成する罫線
に省略が無いことを前提としているが、特開平2−26
4386号公報においては表の両脇の罫線が省略されて
いる場合でも、正しく矩形枠を取り出すことができるよ
うにした方式が開示されている。すなわち、この方式
は、表画像から取り出した縦罫線、横罫線から表の両脇
に罫線があるかを判別し、無い場合に表の両脇に縦罫線
を仮想的に生成する方式である。
【0004】上述の従来の方式は罫線がすべて揃ってい
るか、最も外側の罫線のみが省略されている表、 すな
わち図2の(a)(b)のような表に対してのみ適用可
能であり、図2の(c)〜(e)のような表の場合には
適用できなかった。図2の(c)のような表にも適用可
能な方式として、文字列間の空白領域に注目して省略さ
れている罫線を補おうとする方式が特開平3−1426
91号公報で開示されている。
【0005】
【発明が解決しようとする課題】しかしながら、表
(d)(e)のように行あるいは列に入れ子の構造が存
在しているときには、連続する空白領域を見つけるため
により精密に画像を調べる必要があり、処理時間が長く
なる欠点を持っていた。また、表の行と列の構造の認識
においても、表を構成する各要素中に代表点(中心、重
心)を設け、この代表点間の行、あるいは列方向の距離
によって行、列を抽出していた。すなわち、すべての代
表点の行、あるいは列方向の距離を調べ、この距離が閾
値以下のものを1つの行あるいは列として抽出する。し
かし、文字ブロックを表の構成要素とした場合、文字ブ
ロック間の位置のずれが大きい場合には、必ずしも正確
に行、列を抽出できるものではなかった。
【0006】また、従来の方式は、表画像中の文字をO
CR(文字認識装置)が正確に認識できるように各文字
が存在する部分を切り出すことが主な目的であり、表そ
れ自体の構造を保存するものではなかった。したがっ
て、いかに表の内容が省略されていようとも文字が記入
されている範囲が特定できればよかった。逆に言えば、
表の内容が省略されている部分はOCRに入力する必要
がないので無視することができた。しかし、表の構造を
取り出して、ワープロなどの文書作成装置に再度入力し
て利用するような場合には、表の内容の省略を無視でき
ない場合がある。たとえば、図2の(e)の表のように
横罫線のみで記述されている表の場合、内容の省略は表
の行、列の構造を抽出する作業に支障を来たし、正確に
表の構造を取り出すことができなくなるという不都合が
あった。
【0007】本発明は、このような問題点を解決するこ
とを目的とするものである。すなわち本発明は、表の罫
線が大幅に省略されているような表あるい内容に省略さ
れている部分のある表に関しても、正確に表の構造を取
り出すことができる表認識装置を提供することを目的と
する。
【0008】
【課題を解決するための手段】本発明(請求項1)は、
文字と罫線が混在している表画像を認識する表認識装置
において、表画像中の文字と罫線を分離する文字/罫線
分離手段(図1の11)と、前記文字/罫線分離手段に
よって分離された文字画像から文字ブロックを抽出する
文字ブロック抽出手段(図1の12)と、前記文字ブロ
ック抽出手段によって抽出された各文字ブロックを相互
の位置関係から各文字ブロックの縁を揃えるように拡張
する文字ブロック拡張手段(図1の13)とを有するこ
とを特徴とする。
【0009】本発明(請求項2)は、前記文字/罫線分
離手段、文字ブロック抽出手段、文字ブロック抽出手段
を備えた表認識装置において、前記文字ブロック拡張手
段により拡張された文字ブロック間の位置関係により行
を抽出する行抽出手段(図1の14)と、前記文字ブロ
ック拡張手段により拡張された文字ブロック間の位置関
係により列を抽出する列抽出手段(図1の15)とを設
けたことを特徴とする。
【0010】本発明(請求項3)は、前記文字/罫線分
離手段、文字ブロック抽出手段、文字ブロック拡張手
段、行抽出手段および列抽出手段を備えた前記表認識装
置において、文字ブロック拡張手段(図15の153)
が、文字/罫線分離手段(図15の151)によって分
離された罫線画像と文字ブロック抽出手段(図15の1
52)によって抽出された各文字ブロックとから文字ブ
ロックをその他の文字ブロックと重複しないように、最
も近い罫線まで拡張する第1の文字ブロック拡張手段
(図15の1531)と、第1の文字ブロック拡張手段
によって拡張された各文字ブロックを相互の位置関係か
ら各文字ブロックの縁を揃えるように拡張する第2の文
字ブロック拡張手段(図15の1532)とを備えてい
る。
【0011】本発明(請求項4)は、文字と罫線が混在
している表画像を認識する表認識装置において、表画像
中の文字と罫線を分離する文字/罫線分離手段(図21
の211)と、前記文字/罫線分離手段によって分離さ
れた文字画像から文字ブロックを抽出する文字ブロック
抽出手段(図21の212)と、前記文字/罫線分離手
段によって分離された罫線画像から罫線により構成され
る矩形を抽出する矩形枠抽出手段(図21の213)
と、前記矩形枠抽出手段により抽出した矩形枠と文字ブ
ロック抽出手段によって抽出された各文字ブロックとの
包含関係により文字ブロックを1つ以下含む矩形枠(す
なわち文字ブロックを1つだけ含む矩形枠および文字ブ
ロックを含まない矩形枠)を表を構成する枠として抽出
する構成枠抽出手段(図21の214)と、前記構成枠
抽出手段によって抽出された構成枠に含まれない文字ブ
ロックと前記文字/罫線分離手段により分離された罫線
画像とから対象とする文字ブロックをその他の文字ブロ
ックと重複しないように、最も近い罫線まで拡張する第
1の文字ブロック拡張手段(図21の2151)と、前
記第1の文字ブロック拡張手段によって拡張された各文
字ブロックを相互の位置関係から各文字ブロックの縁を
揃えるように拡張する第2の文字ブロック拡張手段(図
21の2152)と、前記第2の文字ブロック拡張手段
により拡張された文字ブロックと前記構成枠抽出手段に
よって抽出された構成枠との間の位置関係により行を抽
出する行抽出手段(図21の216)と、前記第2の文
字ブロック拡張手段により拡張された文字ブロックと前
記構成枠抽出手段によって抽出された構成枠との間の位
置関係により列を抽出する列抽出手段(図21の21
7)とを有することを特徴とする。
【0012】本発明(請求項5)は、文字と罫線が混在
している表画像を認識する表認識装置において、表画像
中の文字と罫線を分離する文字/罫線分離手段(図28
の281)と、前記文字/罫線分離手段によって分離さ
れた文字画像から文字ブロックを抽出する文字ブロック
抽出手段(図28の282)と、前記文字/罫線分離手
段により分離された罫線画像と文字ブロック抽出手段に
よって抽出された各文字ブロックとから文字ブロックを
その他の文字ブロックと重複しないように、最も近い罫
線まで拡張する第1の文字ブロック拡張手段(図28の
283)と、前記第1の文字ブロック拡張手段によって
拡張された各文字ブロックを相互の位置関係から各文字
ブロックの縁を揃えるように拡張する第2の文字ブロッ
ク拡張手段(図28の284)と、前記第2の文字ブロ
ック拡張手段により拡張された文字ブロックの位置関係
により文字ブロックを正規化する文字ブロック正規化手
段(図28の285)と、前記文字ブロック正規化手段
により正規化された各文字ブロックの重複している矩形
を検出しその矩形を仮想的な文字ブロックとみなす文字
ブロック補間手段(図28の286)と、前記文字ブロ
ック補間手段により補間された文字ブロック間の位置関
係により行を抽出する行抽出手段(図28の287)
と、前記文字ブロック補間手段により補間された文字ブ
ロック間の位置関係により列を抽出する列抽出手段(図
28の288)とを有することを特徴とする。
【0013】
【作用】本発明(請求項1)の作用においては、表画像
中に存在する文字と罫線を文字/罫線分離手段によって
分離し、求めた文字画像中の黒画素塊間の距離などから
1まとまりの文字ブロックを文字ブロック抽出手段によ
って求め、この文字ブロック抽出手段によって求めたす
べての文字ブロックの縁を揃えるように文字ブロック拡
張手段によって拡張する。このように本発明は表を構成
する文字ブロックを拡張し、文字ブロック間にあるギャ
ップを埋めることにより表を認識するので、表の罫線が
大幅に省略されているような表に関してもその構造を認
識することができ、しかも文字ブロック間の位置ずれが
大きくても正確な認識を行うことができる。
【0014】本発明(請求項2)においては、前述の拡
張した文字ブロックの行方向、列方向の並びを行抽出手
段および列抽出手段によって調べ、行、列の構造を取り
出す。本発明では表を構成する文字ブロックを拡張した
ブロックにより表の行方向および列方向の並びを抽出す
るので、表の構造を正確に抽出することができる。
【0015】本発明(請求項3)においては、文字/罫
線分離手段で求めた罫線画像を用いて、文字ブロック抽
出手段で求めた全ての文字ブロックを他の文字ブロック
をまたがないように最も近い罫線まで各文字ブロックを
第1の文字ブロック拡張手段によって拡張し、この第1
の文字ブロック拡張手段203によって拡張された各文
字ブロックの縁をそろえるように第2の文字ブロック拡
張手段によって拡張する。これによれば、文字ブロック
の拡張に罫線の情報を利用するので、より正確に表の構
造を抽出することができる。例えば、分割された列の見
出し部分のように複数の分割列にまたがる文字ブロック
がある表(図20(a))であっても正確に表の構造を
得ることができる(図20(c))。
【0016】本発明(請求項4)においては、文字/罫
線分離手段で分離された罫線画像から矩形枠抽出手段に
よって罫線で形成されるすべての矩形を抽出しておく。
構成枠抽出手段では、文字ブロック抽出手段によって抽
出された文字ブロックと矩形枠抽出手段で抽出された矩
形との包含関係を調べ、1つ以下の文字ブロックを含む
矩形(即ち、1つの文字ブロック含む矩形または文字ブ
ロックを含まない矩形)を表の構成枠とする。表の構成
枠に含まれない文字ブロックを第1の文字ブロック拡張
手段と第2の文字ブロック拡張手段によって文字ブロッ
クを拡張し、この文字ブロックと上記構成枠抽出手段に
よって求めた構成枠の行方向、列方向の並びを行抽出手
段、列抽出手段によって調べ、行、列の構造を取り出
す。本発明によれば、表の罫線で形成される矩形を表の
構造を把握するために利用するので、複雑な構成の表で
あってもその構造を正確に抽出することができる。
【0017】本発明(請求項5)においては、表画像中
に存在する文字と罫線を文字/罫線分離手段1によって
分離し、求めた文字画像中の黒画素塊間の距離から1ま
とまりの文字ブロックを文字ブロック抽出手段によって
求め、文字/罫線分離手段で求めた罫線画像を用いて、
文字ブロック抽出手段で求めた全ての文字ブロックを他
の文字ブロックをまたがないように最も近い罫線まで各
文字ブロックを第1の文字ブロック拡張手段によって拡
張し、さらに全ての文字ブロックの縁を揃えるように第
2の文字ブロック拡張手段によって拡張する。次にこの
拡張した文字ブロックをその矩形領域の情報から、文字
ブロックの位置、大きさを文字ブロック正規化手段で正
規化する。文字ブロック補間手段で、この正規化した文
字ブロック間の重複を調べ、重複している部分に仮想的
な文字ブロックを設け、文字ブロックの行方向、列方向
の並びを行抽出手段、列抽出手段によって調べ、行、列
の構造を取り出す。本発明によれば、文字ブロックをそ
の縁をそろえるように拡張し、位置、大きさを正規化す
ることによって、内容に省略のある表であっても、正確
に表の構造を抽出することができる。
【0018】
【実施例】第1の実施例 図1は本発明の第1の実施例の構成を示す図である。こ
の装置は、文字/罫線分離部11、文字ブロック抽出部
12、文字ブロック拡張部13、行抽出部14、列抽出
部15を備えている。文字/罫線分離部11は、表画像
中に書かれている文字と罫線を分離する処理を行うもの
である。この処理は、文字を形成する画像中の画素の塊
と、罫線(図形)を形成する画素の塊の面積、輪郭、複
雑さなどを調べることによって実現することができる。
例えば、岩城らの「文字・図形分離処理におけるプロダ
クション・システム導入の一検討」(PRU83−62
P.67−74)に記載されている公知の技術を利用
することができる。また、本出願人による特願平3−2
90299号記載の技術を用いればより好適である。こ
れ以後の処理は分離された画像の内、文字画像に注目し
て処理が行われる。
【0019】文字ブロック抽出部2では、上記文字/罫
線分離部11によって得られる文字画像について、1つ
の画素塊を含む矩形領域を求め、これを1つの文字と推
定して、文字間の距離によって接近している1つ以上の
文字をまとめて文字ブロックとして統合する。日本語は
図3に示すように複数の画素塊から構成されていること
が多いため、単純に1つの画素塊を1つの文字に対応さ
せることは本来の意味としては間違っているが、図3
(a)のようにこれらの画素塊は非常に接近しているた
めに、本実施例では問題にならない。そのため、ここで
は特別な処理は行なわない。ただし、図3(b)のよう
に2つの画素塊がその矩形領域において、重複する部分
がある時にはこの2つの画素塊を統合してあらたに矩形
領域を設定することとする。なお、より正確に1つづつ
の文字を求める必要がある時には、特開平3−2672
78号記載の技術を使用することができる。
【0020】図4および図5のフローを用いて文字ブロ
ック抽出部について詳しく説明する。ただし、この時点
で文字画像中の全ての文字を表す画素塊の矩形領域が求
められているものとし、この矩形領域を文字矩形として
表す。まず、図4において、各文字矩形の大きさの総和
を求め(ステップ401〜404)、総和の大きさの平
均の1/2を文字ブロックとして統合する時の閾値T
w,Thとする。ここでは文字矩形の平均的大きさの半
分を閾値として決めているが、この閾値の決め方はこれ
に限らず、文字矩形間の距離の平均の数%として決める
などの方法を取ってもよい。
【0021】次に、図5において、文字矩形を1つづつ
取り出し、既に文字ブロックの一部として登録されてい
るかを調べる(ステップ407)。もし文字ブロックの
一部でなければ、あらたに文字ブロックを作り、その先
頭の要素としてこの文字ブロックを登録する(ステップ
408)。次に残りの文字矩形についてこの文字ブロッ
クとの距離を求め(ステップ411)、水平、垂直方向
の距離が図4で求めた閾値Tw,Thより小さいか否か
を調べる(ステップ412)。小さい場合には、文字ブ
ロックの一部として登録する(ステップ413)。以上
の処理を文字ブロックに登録されていない文字矩形がな
くなるまで繰り返す。
【0022】以上の処理によって、図6(a),
(b)、図7(a),(b)のように文字ブロックを抽
出することができる。ここでは、文字画像についてだけ
調べて文字ブロックを抽出しているが、文字/罫線分離
部1で求めることのできる罫線画像を用い、文字を表す
画素塊がいかに接近して存在していても、罫線をまたが
って統合するようなことを禁止することで、より正確な
文字ブロックを求めることが可能となる。
【0023】次に文字ブロック拡張部13は、各文字ブ
ロックの縦方向、横方向における文字ブロックの分布を
調べて、その縁を揃えるように各文字ブロックを拡張す
る。文字ブロック拡張部13の処理を図8のフローを用
いて説明する。まず、この処理は横方向への拡張と、縦
方向への拡張からなっている。各文字ブロックがどの座
標でいくつ重なっているかを表す縦方向の文字ブロック
分布を作成する(ステップ801)。図9に図6(a)
の表に対する縦方向の文字ブロック分布91を示す。な
お、図9には横方向の文字ブロック分布92も合わせて
示す。次に変数iを0にリセットする(ステップ80
2)。縦方向の文字ブロック分布HistWの値がi、
すなわち0に変化する、あるいは0から0より大きい他
の値へ変化する部分を見つけ、他の文字ブロックをまた
がらないように各文字ブロックの幅を拡張する(ステッ
プ803)。ただし、このとき次の2つのルールを設定
して、拡張を行なう。 ルール1: 他の値からiに変化した時は、右方向への
拡張 ルール2: iからiより大きい他の値に変化する時
は、左方向への拡張 この処理をi<Nである間続ける。i=0の時のステッ
プ803の結果を図10(a)に、文字ブロックの幅の
拡張が終了した時点での文字ブロックの様子を図10
(b)に示す。
【0024】次に、横方向の文字ブロック分布を作成し
高さの拡張を同様な処理によって行なう(ステップ80
4〜806)。なお、ステップ806での拡張のルール
は、 ルール1: 他の値からiに変化した時は、下方向への
拡張 ルール2: iからiより大きい他の値に変化する時
は、上方向への拡張 以上の処理によって、図11に示すような各行、列にお
いて縁が揃っている文字ブロックを得ることができる。
【0025】行抽出部14と列抽出部15では、文字ブ
ロック拡張部13によって拡張された文字ブロックの位
置関係を調べることで行と列の関係を抽出する。図11
の文字ブロック分布を見ても明らかなように、各行、各
列を構成する文字ブロックはある一定の範囲内に存在し
ている。したがって、この包含関係を調べることで、正
確に各行、各列を抽出することが可能である。行抽出部
14の処理フローを図12に、列抽出部15の処理フロ
ーを図13に示す。
【0026】行抽出部14では、まず各文字ブロックを
文字ブロックの上辺のY座標によって昇順に並べかえる
(ステップ1201)。次にi番目の文字ブロックBi
を取り出し(最初はi=0にリセット)、行に登録され
ていない文字ブロックの中で文字ブロックBiの存在す
る縦方向の範囲、すなわち文字ブロックBiの上辺のY
座標〜下辺のY座標の範囲内に存在する文字ブロックを
1つの行として登録する(ステップ1202)。この処
理を、未登録の文字ブロックがなくなるまで繰り返す。
【0027】また、同様にして列抽出部15は、各文字
ブロックを文字ブロックの左辺のX座標によって昇順に
並べかえる(ステップ1301)。次にi番目の文字ブ
ロックBiを取り出し(最初はi=0にリセット)、列
に登録されていない文字ブロックの中で文字ブロックB
iの存在する横方向の範囲、すなわち文字ブロックBi
の左辺のX座標〜右辺のX座標の範囲内に存在する文字
ブロックを1つの列として登録する(ステップ130
2)。この処理を、未登録の文字ブロックがなくなるま
で繰り返す。
【0028】さらに、図6(a)の表のように行あるい
は列に分割のある場合には、複数の行あるいは列が抽出
されなくなるまで、各行、列に対して、繰り返し行抽
出、列抽出の処理を行なうことで、行、列を抽出するこ
とができる。図6(a)の表に対して行抽出した結果を
図14(a)に、列抽出の結果を図14(b)に示す。
以上のように、文字ブロックをその縁を揃えるように拡
張することによって、表中の行と列の構造を正確に抽出
することができる。
【0029】第2の実施例 第2の実施例は、第1の実施例に加えて表画像中の罫線
を用いて、文字ブロックの拡張処理を簡素化し、かつよ
り正確に行、列の構造を抽出するものである。図15は
第2の実施例の基本構成を示す図である。この第2の実
施例の表認識装置は、文字/罫線分離部151、文字ブ
ロック抽出部152、文字ブロック拡張部153、行抽
出部154、および列抽出部155を備えてなり、その
文字ブロック拡張部153は第1の文字ブロック拡張部
1531と第2の文字ブロック拡張部1532からな
る。文字/罫線分離部151と文字ブロック抽出部15
2については、実施例1で述べているのと同じであるの
で、ここでは説明しない。
【0030】第1の文字ブロック拡張部1531は、文
字/罫線分離部151によって分離された罫線画像と文
字ブロック抽出部152によって抽出された文字ブロッ
クを入力として、罫線を用いて文字ブロックの大きさを
拡張するものである。第1の文字ブロック拡張部153
1の処理フローを図16および図17に示す。このフロ
ーを用いてその処理を順を追って説明する。罫線画像を
ベクトル化する(ステップ1601)。このベクトル化
の手法は、特開平1−142880号公報、特開平2−
105265号公報などに記載されている技術を用いる
ことができる。次に、各文字ブロックとベクトル・デー
タとの距離を求め、文字ブロックの上下左右で最も近い
ベクトル・データをそれぞれ求める(ステップ160
2、1605、1608、1611)。ここで求めたベ
クトル・データと文字ブロックとの間に、他の文字ブロ
ックが無い場合にのみ文字ブロックをベクトル・データ
まで拡張する(ステップ1603〜1604、1606
〜1607、1609〜1610、1612〜161
3)。この時の拡張は、可能であればベクトル・データ
の端点と文字ブロックの角を一致させるような拡張を行
なう。この処理を全ての文字ブロックに対して行なう。
【0031】図6(a)の表に対する第1の文字ブロッ
ク拡張部1531の処理結果を図18(a)に示す。ま
た、罫線のすべてそろっている表について第1の文字ブ
ロック拡張部1531の処理結果を図19に示す。図1
9から明らかなように、罫線がすべてそろっていると
き、第1の文字ブロック拡張部1531で求められる文
字ブロックは、罫線で囲まれている矩形と一致してい
る。このようなとき、文字ブロックの縁は既にそろって
いるため、第2の文字ブロック拡張部1532の処理は
省略することができる。次に第2の文字ブロック拡張部
1532は、第1の実施例の文字ブロック拡張部13と
同様な手法を用いることができる。図6(a)の表に対
する第2の文字ブロック拡張部1532の処理結果を図
18(b)に示す。
【0032】行抽出部154と列抽出部155について
は第1の実施例において説明したのと同じ処理であるの
で、ここでは説明を省略する。以上の処理によって、例
えば図20(a)に示すような罫線の一部が欠けてお
り、しかも列が分割されている表を認識することが可能
となる。第1の実施例の文字ブロック拡張部13では、
図20(b)のような誤った結果となるが、第1の文字
ブロック拡張部1531の罫線情報を用いたブロック拡
張の効果により図20(c)のように表の構造に一致し
た結果を求めることができる。
【0033】第3の実施例 第3の実施例は、表画像中の罫線によってできる矩形を
も用いて、行、列の抽出処理を正確に行なうものであ
る。図21は第3の実施例の基本構成を示す図である。
この実施例の表認識装置は、文字/罫線分離部211、
文字ブロック抽出部212、矩形枠抽出部213、構成
枠抽出部214、文字ブロック拡張部215、行抽出部
216、列抽出部217を備えており、さらに、文字ブ
ロック拡張部215は第1の文字ブロック拡張部215
1と第2の文字ブロック拡張部2152とからなってい
る。入力された表画像は、文字/罫線分離部211によ
り文字画像と罫線画像に分離される。文字ブロック抽出
部212は、分離された文字画像を入力として表中の文
字ブロックを抽出する。文字/罫線分離部211と文字
ブロック抽出部212は第1の実施例で説明したものと
同じであり、ここでは説明を省略する。
【0034】矩形枠抽出部213は、罫線画像を入力と
し、罫線によって形成される矩形を抽出する処理を行う
ものである。この処理は罫線画像をベクトル化したの
ち、ベクトル・データ間のつながりを調べて矩形を抽出
していく。このベクトル化の手法は公知技術であるの
で、ここでは特に述べない(例えば特開平1−1428
80号公報、特開平2−105265号公報参照)。罫
線で囲われている枠は、1つの水平ベクトル・データの
左右に垂直ベクトル・データが接続し、さらにその下に
水平ベクトル・データが接続していることから、各水平
ベクトル・データを調べて、条件を満たすベクトル・デ
ータを枠として登録する方法により抽出する。
【0035】この処理を図22および図23に示すフロ
ーチャートを用いて説明する。まず、表を構成する全て
のベクトル・データの数を計数する(ステップ220
1)。以下のステップ2202からステップ2212の
処理を全てのベクトル・データに対して適用する。次
に、矩形枠の上罫線となる水平ベクトル・データViを
捜す(ステップ2203)。これは、ベクトル・データ
と水平線とのなす角度がある閾値以下であることから水
平なベクトル・データを見つけることができる。ここで
みつけた水平ベクトル・データViは、k番目の矩形枠
の上罫線となる可能性があるので、矩形枠構成表241
のk番目の矩形枠の上罫線の欄にこのベクトル・データ
Viを登録する(ステップ2204)。次に矩形枠Wk
の右側の辺を構成するベクトル・データを捜す(ステッ
プ2205)。すなわち、ベクトル・データViの右端
の端点に接し、かつベクトル・データViに接していな
いほうの端点がベクトル・データViより下にあるよう
な垂直ベクトル・データをみつける処理を行なう。垂直
ベクトル・データは、垂線とのなす角度がある閾値以下
であることから容易に求めることができる。このステッ
プで見つけたベクトル・データは矩形枠Wkの右罫線を
構成する可能性があるので、矩形枠構成表241のk番
目の矩形枠の右罫線の欄に登録する(ステップ220
6)。このとき、右罫線として見つけたベクトル・デー
タの下に、このベクトル・データよりに左側に伸びるベ
クトル・データが接続していないか調べる。このような
ベクトル・データが存在していない場合、その下に接す
る垂直なベクトル・データも矩形枠Wkの右罫線を構成
する可能性があるので、矩形枠構成表241のk番目の
矩形枠の右罫線の欄に登録する。
【0036】同様に、矩形枠Wkの左罫線を捜し(ステ
ップ2207)、矩形枠構成表241のk番目の矩形枠
の左罫線の欄に登録する(ステップ2208)。さら
に、いま求めた右罫線、左罫線を結ぶような水平なベク
トル・データを見つけ(ステップ2209)、矩形枠構
成表241のk番目の矩形枠の下罫線の欄に登録する
(ステップ2210)。以上の処理のうち、1つでも罫
線が見つからない場合は、矩形枠構成表241のk番目
の矩形枠のすべての登録を破棄して、他のベクトル・デ
ータで構成される矩形枠を登録できるようにリセットす
る。以上の処理を図24(a)の表に適用した時の矩形
枠構成表241は図24(b)のようになる。
【0037】構成枠抽出部214では、文字ブロック抽
出部212で求めた文字ブロックと矩形枠抽出部213
で求めた矩形枠の包含関係を調べ、ただ1つだけ文字ブ
ロックを含む、あるいはまったく文字ブロックを含まな
い矩形枠を表の構成要素として抽出する。図25に、構
成枠抽出部214の処理フローを示す。処理の概要は、
各矩形枠と文字ブロックの包含関係を調べ(ステップ2
503)、矩形枠に含まれる文字ブロックの数を計数す
る(ステップ2504)。この結果、複数の文字ブロッ
クを含む矩形枠はその内部の文字ブロックによって行と
列の構造が支配されるので、このような矩形枠は棄却す
る。また、1つ以下の文字ブロックを含む矩形枠は構成
枠として登録する(ステップ2507,2508)。図
26(a)のような表についての構成枠抽出部214の
結果は図26(b)のようになる。
【0038】文字ブロック拡張部215では、文字/罫
線分離部211で求められた罫線画像と構成枠抽出部2
14によって求められた構成枠とその外にある文字ブロ
ックを入力として、第1の文字ブロック拡張部2151
と第2の文字ブロック拡張部2152とにより、文字ブ
ロックの縁がそろうように拡張する。この第1と第2の
文字ブロック拡張部は、第1の実施例、第2の実施例で
説明しているのでここでの説明を省略する。行抽出部2
16と列抽出部217は、文字ブロックと構成枠を入力
とすることが異なるだけで、第1の実施例で説明した処
理と同じである。実施例3の構成によって、図26
(a)にしめすような表から、行と列の構造を抽出した
結果を図27(a),(b)に示す。以上説明したよう
に、本実施例によれば、さまざまな複雑な表であっても
その行、列の構造を正確に抽出することが可能である。
【0039】第4の実施例 図28は本発明の第4の実施例の構成を示す図である。
これは文字/罫線分離部281、文字ブロック抽出部2
82、第1の文字ブロック拡張部283、第2の文字ブ
ロック拡張部284、文字ブロック正規化部285、文
字ブロック補間部286、行抽出部287、列抽出部2
88を備えている。また、第1の文字ブロック拡張部2
83は、第1の文字ブロック幅拡張部2831と第1の
文字ブロック高拡張部2832からなり、第2の文字ブ
ロック拡張部284は第2の文字ブロック幅拡張部28
41、第2の文字ブロック高拡張部2842および文字
ブロック統合部2843からなり、文字ブロック正規化
部285は文字ブロック幅正規化部2851と文字ブロ
ック高正規化部2852からなる。
【0040】文字/罫線分離部281は、表画像中に書
かれている文字と罫線を分離する処理を行うものであ
る。文字ブロック抽出部282は、上記文字/罫線分離
部1によって得られる文字画像について、1つの黒画素
塊を含む矩形領域を求め、これを1つの文字と推定し
て、文字間の距離によって接近している1つ以上の文字
をまとめて文字ブロックとして統合するものである。こ
れらは第1の実施例で説明したものと同じであり、ここ
では説明を省略する。
【0041】次に第1の文字ブロック拡張部283は、
文字/罫線分離部281によって分離された罫線画像と
文字ブロック抽出部282によって抽出された文字ブロ
ックを入力として、罫線を用いて文字ブロックの大きさ
を拡張するものである。この第1の文字ブロック拡張部
283は上下方向に文字ブロックを拡張する第1の文字
ブロック高拡張部2832と、左右方向に文字ブロック
を拡張する第1の文字ブロック幅拡張部2831とから
なっている。
【0042】第1の文字ブロック高拡張部2832によ
る上下方向に文字ブロックを拡張するアルゴリズムを図
29を用いて説明する。まず、罫線画像をベクトル化す
る(ステップ291)。このベクトル化の手法は、例え
ば特開平1−142880号公報、特開平2−1052
65号公報などに記載されている既存の技術を用いるこ
とができる。次に、各文字ブロックとベクトル・データ
との距離を求め、文字ブロックの上下で最も近いベクト
ル・データをそれぞれ求める。ここで求めたベクトル・
データと文字ブロックとの間に、他の文字ブロックが無
い場合にのみ文字ブロックをベクトル・データまで拡張
する(ステップ292〜297)。この時の拡張は、可
能であればベクトル・データの端点と文字ブロックの角
を一致させるような拡張を行なう。この処理を全ての文
字ブロックに対して行なう。同様に図30は、第1の文
字ブロック幅拡張部2831による左右方向に文字ブロ
ックを拡張するアルゴリズムを示している。このアルゴ
リズムは上記図29で説明したアリゴリズムと上方向を
左方向とみなし、下方向を右方向とみなしたものと同一
である。図6(a)の表に対する第1の文字ブロック拡
張部283の処理結果を図18(a)に示す。また、図
19(a)に示すような罫線の全て揃っている表につい
て第1の文字ブロック拡張部283の処理結果を図19
(b)に示す。同図から明らかなように、罫線が全て揃
っているとき、第1の文字ブロック拡張部283で求め
られる文字ブロックは、罫線で囲まれている矩形と一致
している。
【0043】次に第2の文字ブロック拡張部284は、
横方向における文字ブロックの分布および各文字ブロッ
クの縦方向における分布を調べて、その縁を揃えるよう
に各文字ブロックを拡張するものであり、第2の文字ブ
ロック幅拡張部2841、第2の文字ブロック高拡張部
2842とそれぞれの結果を統合する文字ブロック統合
部1843により構成されている。
【0044】それぞれの処理を順を追って説明してい
く。まず、第2の文字ブロック幅拡張部2841と第2
の文字ブロック高拡張部2842の処理を図31および
図32のフローを用いて説明する。この2つの処理それ
ぞれを並列に行なう。第2の文字ブロック幅拡張部28
41ではステップ3101において、各文字ブロックが
どの座標でいくつ重なっているかを表す縦方向の文字ブ
ロック分布を作成する。図33に図6(a)の表に対す
る縦方向の文字ブロック分布331を示す。なお、図3
3には横方向の文字ブロック分布332も合わせて示
す。ここでは、第1の文字ブロック拡張部283の結果
に対して処理を行なっている。次にステップ3102で
変数iを0にリセットする。ステップ3103では、縦
方向の文字ブロック分布HistWの値がi、すなわち
0に変化する、あるいは0から0より大きい他の値へ変
化する部分を見つけ、他の文字ブロックをまたがらない
ように各文字ブロックの幅を拡張する。ただし、このと
き次の2つのルールを設定して、拡張を行なう。 ルール1: 他の値からiに変化した時は、右方向への
拡張 ルール2: iからiより大きい他の値に変化する時
は、左方向への拡張 この処理をi<Nである間続ける。文字ブロックの幅の
拡張が終了した時点での文字ブロックの様子を図34
(a)に示す。
【0045】なお、第2の文字ブロック高拡張部284
2については、図32のステップ3201〜3203に
おいて、横方向の文字ブロック分布を作成し、高さの拡
張を上述の幅の拡張と同様な処理によって行なう。な
お、ステップ3203での拡張のルールは、 ルール1: 他の値からiに変化した時は、下方向への
拡張 ルール2: iからiより大きい他の値に変化する時
は、上方向への拡張 である。図34(b)に高さの拡張が終了した時の文字
ブロックの様子を示す。
【0046】文字ブロック統合部2843では、第2の
文字ブロック幅拡張部2841と第2の文字ブロック高
拡張部2842の結果を入力とし、それぞれの幅、高さ
を合わせて最終的に各文字ブロックの縁が揃った状態の
文字ブロックを得る。この処理は、それぞれの結果を調
べて対応する文字ブロックの幅は第2の文字ブロック幅
拡張部2841の処理結果を、高さは第2の文字ブロッ
ク高拡張部2842の処理結果を用いて、各文字ブロッ
クの大きさを変更する。図6(a)の表についての文字
ブロック統合処理の結果を図35に示す。また、図36
に内容に省略のある表についての、第2の文字ブロック
拡張部284の処理結果を示す。図36(b)に見られ
るように、内容に省略のある部分(斜線)で文字ブロッ
クが重複する。
【0047】文字ブロック正規化部285では、上記の
第2の文字ブロック拡張部284で拡張された文字ブロ
ックを、それを構成する上下左右の境界線の位置情報か
ら、全ての文字ブロックの位置、幅、高さを正規化す
る。この処理は、図28に示すように文字ブロック幅正
規化部2851と文字ブロック高正規化部2852とか
ら構成されている。ここでは、図37を用いて文字ブロ
ック幅正規化部2851について説明する。まず、全て
の枠を調べ、右端のX座標を求め配列BXRに記憶する
(ステップ3701)。このとき、重複するX座標は配
列BXRに記憶しない。また、左側のX座標についても
同様に配列BXLに記憶する(ステップ3702)。こ
のとき、配列BXRの最初の要素BXR[1]には−1
の値を入れ他の座標値とは区別をし、実際の座標値は配
列BXRの2番目の要素BXR[2]から記憶する。次
に、この2つの配列BXL,BXRを昇順にソートする
(ステップ3703)。次に、再度全ての文字ブロック
の左端のX座標を調べ、その値が対応する配列BXLの
要素番号(配列の添字が該当する)を文字ブロック正規
化表381のXの欄に登録する(ステップ3704)。
たとえば、図36において、枠No.W1の左座標は配
列BXLの2番目の要素に対応するので、文字ブロック
正規化表381の枠No.W1のXの欄に2を登録す
る。次に、全ての文字ブロックの右端のX座標を調べ、
その値の対応する配列BXRの要素番号から、先に登録
した文字ブロック正規化表381の対応する枠のXの欄
の値を引いた値を文字ブロック正規化表381のW
(幅)の欄に登録する(ステップ3705)。たとえ
ば、図36において、枠No.W1の右座標は配列BX
Rの3番目の要素に対応するので、文字ブロック正規化
表381の枠No.W1のW(幅)の欄に2を登録す
る。文字ブロック高正規化部2852は、文字ブロック
幅正規化部2851がX座標について行っていることを
Y座標について同様に行うことで実現することができ
る。図36についての文字ブロック正規化表381を図
38に示す。
【0048】文字ブロック補間部286では、文字ブロ
ック正規化部285で求めた文字ブロック正規化表38
1をもとに、文字ブロックの重複を調べる。この処理の
手順を図39のフローを用いて説明する。まず、変数i
とjに初期値0,1をそれぞれ記憶する(ステップ39
01)。i番目とj番目の文字ブロックを比較し、文字
ブロック正規化表381において重複する部分があるか
調べる(ステップ3902)。このとき重複する部分が
あれば、重複部分に対応する仮想的な文字ブロックを文
字ブロック正規化表381に登録する(ステップ390
3)。次に、i番目とj番目の文字ブロックから重複す
る部分を削除して、文字ブロック正規化表381に登録
し直す(ステップ3904)。以上の処理を全ての文字
ブロックに対して行なう。以上のように処理した図38
の文字ブロック正規化表381を図40(a)に、また
実際の表に対応付けた様子を図40(b)に示す。以上
の処理により、省略されている内容部分に仮想的な文字
ブロックを生成することができる。
【0049】行抽出部287と列抽出部288では、文
字ブロック正規化部285によって正規化され、文字ブ
ロック補間部286で補間された文字ブロックの位置関
係を調べることにより行と列の関係を抽出する。文字ブ
ロック正規化表381からも解るように、全ての文字ブ
ロックは一意に決定できる2次元座標として表されてい
る。したがって、この文字ブロック正規化表381の値
を調べることで、正確に各行、各列を抽出することが可
能である。たとえば、文字ブロック正規化表381のY
の欄に3の値を持つ文字ブロックは1つの行であるとす
ることができる。行抽出部287の処理フローを図41
に、列抽出部288の処理フローを図42に示す。
【0050】行抽出部287では、まず各文字ブロック
を文字ブロック正規化表381におけるY座標によって
昇順に並べかえる(ステップ4101)。次にi番目の
文字ブロックBiを取り出し(最初はi=0にリセッ
ト)、行に登録されていない文字ブロックの中で文字ブ
ロックBiの存在する縦方向の範囲、すなわち文字ブロ
ックBiの文字ブロック正規化表381におけるY座標
から高さHの範囲内に存在する文字ブロックを1つの行
として登録する(ステップ4102)。この処理を、未
登録の文字ブロックがなくなるまで繰り返す。
【0051】また、同様にして列抽出部288は、各文
字ブロックを文字ブロック正規化表381におけるX座
標によって昇順に並べかえる(ステップ4201)。次
にi番目の文字ブロックBiを取り出し(最初はi=0
にリセット)、列に登録されていない文字ブロックの中
で文字ブロックBiの存在する横方向の範囲、すなわち
文字ブロックBiの文字ブロック正規化表381におけ
るX座標から幅Wの範囲内に存在する文字ブロックを1
つの列として登録する(ステップ4202)。この処理
を、未登録の文字ブロックがなくなるまで繰り返す。さ
らに、行あるいは列に分割のある場合には、複数の行あ
るいは列が抽出されなくなるまで、各行、列に対して、
繰り返し行抽出、列抽出の処理を行なうことで、行、列
を抽出することができる。図36(a)の表に対して行
抽出した結果を図43(a)に、列抽出の結果を図43
(b)に示す。
【0052】以上のように、第4の実施例は、文字ブロ
ックをその縁を揃えるように拡張し、位置、大きさを正
規化することによって、内容に省略のある表であって
も、表中の行と列の構造を正確に抽出することができ
る。
【0053】なお、図44に本発明の実施例(第2の実
施例)による実験結果の一例を示す。図44(a)は原
画像であり、図2(e)に示したような縦の罫線が省略
された型の表である。図44(b)は(a)の原画像に
対して処理した結果である。表の1つ1つの欄が認識で
きていることが分かる。なお、文字部分については、文
字認識処理を行っている。少しではあるが文字認識の誤
りが含まれている。
【0054】
【発明の効果】本発明(請求項1、2)によれば、表を
構成する文字ブロックを拡張し、文字ブロック間にある
ギャップを埋めることにより表を認識するので、表の罫
線が大幅に省略されているような表に関してもその構造
を認識することができ、しかも文字ブロック間の位置ず
れが大きくても正確な認識を行うことができる。
【0055】本発明(請求項3)によれば、文字ブロッ
クの拡張に罫線の情報を利用するので、より正確に表の
構造を抽出することができる。例えば、分割された列の
見出し部分のように複数の分割列にまたがる文字ブロッ
クがある表(図20(a))であっても正確に表の構造
を得ることができる(図20(c))。
【0056】本発明(請求項4)によれば、表の罫線で
形成される矩形を表の構造を把握するために利用するの
で、複雑な構成の表であってもその構造を正確に抽出す
ることができる。
【0057】本発明(請求項5)によれば、文字ブロッ
クをその縁を揃えるように拡張し、位置、大きさを正規
化するので、内容に省略のある表であっても、表中の行
と列の構造を正確に抽出することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例の構成を示す図
【図2】文書中で使用される表の例を示す図
【図3】文字の画素塊を説明するための図
【図4】文字ブロック抽出部のフロー(一部)を示す図
【図5】文字ブロック抽出部のフロー(図4の続き)を
示す図
【図6】(a)および(b)は文字ブロック抽出の結果
の一例を説明するための図
【図7】(a)および(b)は文字ブロック抽出の結果
の他の例を説明するための図
【図8】文字ブロック拡張部の処理フロー図
【図9】文字ブロック分布を説明するための図
【図10】(a)および(b)は文字ブロックの横方向
の拡張を説明するたの図
【図11】文字ブロックの拡張の結果を示す図
【図12】行抽出部の処理フロー図
【図13】列抽出部の処理フロー図
【図14】(a)は行を抽出した結果、(b)は列を抽
出した結果を説明するための図
【図15】本発明の第2の実施例の構成を示す図
【図16】第1の文字ブロック拡張部の処理フロー(一
部)を示す図
【図17】第1の文字ブロック拡張部の処理フロー(図
16の続き)を示す図
【図18】(a)および(b)は第1の文字ブロック拡
張部の処理結果の一例を説明するための図
【図19】(a)および(b)は第1の文字ブロック拡
張部の処理結果の他の例を説明するための図
【図20】(a)、(b)および(c)は文字ブロック
拡張の結果を説明するための図
【図21】本発明の第3の実施例の構成を示す図
【図22】矩形枠抽出部の処理フロー(一部)を示す図
【図23】矩形枠抽出部の処理フロー(図22の続き)
を示す図
【図24】(a)および(b)は矩形枠構成表を説明す
るための図
【図25】構成枠抽出部の処理フロー図
【図26】(a)および(b)は構成枠の例を説明する
ための図
【図27】(a)および(b)は第3の実施例の構成に
より行と列の構造を抽出した結果を示す図
【図28】本発明の第4の実施例の構成を示す図
【図29】第1の文字ブロック高拡張部による上下方向
に文字ブロックを拡張する処理のフロー図
【図30】第1の文字ブロック幅拡張部による上下方向
に文字ブロックを拡張する処理のフロー図
【図31】第2の文字ブロック幅拡張部の処理のフロー
【図32】第2の文字ブロック高拡張部の処理のフロー
【図33】図6(a)の表に対する縦方向および横方向
の文字ブロック分布を示す図
【図34】(a)は文字ブロックの幅の拡張結果、
(b)は文字ブロックの高さの拡張結果を示す図
【図35】文字ブロック統合部により統合結果を示す図
【図36】(a)は内容に省略のある表の例、(b)は
(a)の表に対する文字ブロック統合部による統合結果
を示す図
【図37】文字ブロック正規化部の処理のフローを示す
【図38】文字ブロック正規化表を示す図
【図39】文字ブロック補間部の処理のフローを示す図
【図40】(a)は文字ブロック補間部の処理の結果で
きる文字ブロック正規化表を示し、(b)は文字ブロッ
ク補間部の処理の結果を説明するための図
【図41】行抽出部の処理のフローを示す図
【図42】列抽出部の処理のフローを示す図
【図43】(a)は行抽出の結果、(b)は列抽出の結
果を説明するための図
【図44】(a)は表の原画像、(b)は原画像に対し
て処理した結果を示す図
【符号の説明】
11,151,211,281…文字/罫線分離部、1
2,152,212,282…文字ブロック抽出部、1
3,153,215…文字ブロック拡張部、1531,
2151,…第1の文字ブロック拡張部、1532,2
152…第2の文字ブロック拡張部、14,154,2
16、287…行抽出部、15,155,217、28
8…列抽出部、214…構成枠抽出部、2831…第1
の文字ブロック幅拡張部、2832…第1の文字ブロッ
ク高拡張部、、2841…第2の文字ブロック幅拡張
部、2842…第2の文字ブロック高拡張部、2843
…文字ブロック統合部、285…文字ブロック正規化
部、2851…文字ブロック幅正規化部、2852…文
字ブロック高正規化部、286…文字ブロック補間部
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成5年11月22日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0019
【補正方法】変更
【補正内容】
【0019】 文字ブロック抽出部2では、上記文字/
罫線分離部11によって得られる文字画像について、1
つの画素塊を含む矩形領域を求め、これを1つの文字と
推定して、文字間の距離によって接近している1つ以上
の文字をまとめて文字ブロックとして統合する。日本語
は図3に示すように複数の画素塊から構成されているこ
とが多いため、単純に1つの画素塊を1つの文字に対応
させることは本来の意味としては間違っているが、図3
(a)のようにこれらの画素塊は非常に接近しているた
めに、本実施例では問題にならない。そのため、ここで
は特別な処理は行なわない。ただし、図3(b)のよう
に2つの画素塊がその矩形領域において、重複する部分
がある時にはこの2つの画素塊を統合してあらたに矩形
領域を設定することとする。なお、より正確に1つづつ
の文字を求める必要がある時には、特開平2−2676
78公報記載の技術を使用することができる。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字と罫線が混在している表画像を認識
    する表認識装置において、 表画像中の文字と罫線を分離する文字/罫線分離手段
    と、 前記文字/罫線分離手段によって分離された文字画像か
    ら文字ブロックを抽出する文字ブロック抽出手段と、 前記文字ブロック抽出手段によって抽出された各文字ブ
    ロックを相互の位置関係から各文字ブロックの縁を揃え
    るように拡張する文字ブロック拡張手段と、を有するこ
    とを特徴とする表認識装置。
  2. 【請求項2】 請求項1記載の表認識装置において、 前記文字ブロック拡張手段により拡張された文字ブロッ
    ク間の位置関係により行を抽出する行抽出手段と、 前記文字ブロック拡張手段により拡張された文字ブロッ
    ク間の位置関係により列を抽出する列抽出手段と、を設
    けたことを特徴とする表認識装置。
  3. 【請求項3】 文字と罫線が混在している表画像を認識
    する表認識装置において、 表画像中の文字と罫線を分離する文字/罫線分離手段
    と、 前記文字/罫線分離手段によって分離された文字画像か
    ら文字ブロックを抽出する文字ブロック抽出手段と、 前記文字/罫線分離手段によって分離された罫線画像と
    前記文字ブロック抽出手段によって抽出された各文字ブ
    ロックとから文字ブロックをその他の文字ブロックと重
    複しないように、最も近い罫線まで拡張する第1の文字
    ブロック拡張手段と、 前記第1の文字ブロック拡張手段によって拡張された各
    文字ブロックを相互の位置関係から各文字ブロックの縁
    を揃えるように拡張する第2の文字ブロック拡張手段
    と、 前記第2の文字ブロック拡張手段により拡張された文字
    ブロック間の位置関係により行を抽出する行抽出手段
    と、 前記第2の文字ブロック拡張手段により拡張された文字
    ブロック間の位置関係により列を抽出する列抽出手段
    と、を設けたことを特徴とする表認識装置。
  4. 【請求項4】 文字と罫線が混在している表画像を認識
    する表認識装置において、 表画像中の文字と罫線を分離する文字/罫線分離手段
    と、 前記文字/罫線分離手段によって分離された文字画像か
    ら文字ブロックを抽出する文字ブロック抽出手段と、 前記文字/罫線分離手段によって分離された罫線画像か
    ら罫線により構成される矩形を抽出する矩形枠抽出手段
    と、 前記矩形枠抽出手段により抽出した矩形枠と文字ブロッ
    ク抽出手段によって抽出された各文字ブロックとの包含
    関係により文字ブロックを1つ以下含む矩形枠を表を構
    成する枠として抽出する構成枠抽出手段と、 前記構成枠抽出手段によって抽出された構成枠に含まれ
    ない文字ブロックと前記文字/罫線分離手段により分離
    された罫線画像とから対象とする文字ブロックをその他
    の文字ブロックと重複しないように、最も近い罫線まで
    拡張する第1の文字ブロック拡張手段と、 前記第1の文字ブロック拡張手段によって拡張された各
    文字ブロックを相互の位置関係から各文字ブロックの縁
    を揃えるように拡張する第2の文字ブロック拡張手段
    と、 前記第2の文字ブロック拡張手段により拡張された文字
    ブロックと前記構成枠抽出手段により抽出された構成枠
    との間の位置関係により行を抽出する行抽出手段と、 前記第2の文字ブロック拡張手段により拡張された文字
    ブロックと前記構成枠抽出手段により抽出された構成枠
    との間の位置関係により列を抽出する列抽出手段とを有
    することを特徴とする表認識装置。
  5. 【請求項5】文字と罫線が混在している表画像を認識す
    る表認識装置において、 表画像中の文字と罫線を分離する文字/罫線分離手段
    と、 前記文字/罫線分離手段によって分離された文字画像か
    ら文字ブロックを抽出する文字ブロック抽出手段と、 前記文字/罫線分離手段により分離された罫線画像と文
    字ブロック抽出手段によって抽出された各文字ブロック
    とから文字ブロックをその他の文字ブロックと重複しな
    いように、最も近い罫線まで拡張する第1の文字ブロッ
    ク拡張手段と、 前記第1の文字ブロック拡張手段によって拡張された各
    文字ブロックを相互の位置関係から各文字ブロックの縁
    を揃えるように拡張する第2の文字ブロック拡張手段
    と、 前記第2の文字ブロック拡張手段により拡張された文字
    ブロックの位置関係により文字ブロックを正規化する文
    字ブロック正規化手段と、 前記文字ブロック正規化手段により正規化された各文字
    ブロックの重複している矩形を検出しその矩形を仮想的
    な文字ブロックとみなす文字ブロック補間手段と、 前記文字ブロック補間手段により補間された文字ブロッ
    ク間の位置関係により行を抽出する行抽出手段と、 前記文字ブロック補間手段により補間された文字ブロッ
    ク間の位置関係により列を抽出する列抽出手段とを有す
    ることを特徴とする表認識装置。
JP4310861A 1992-10-27 1992-10-27 表認識装置 Expired - Fee Related JP2789971B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP4310861A JP2789971B2 (ja) 1992-10-27 1992-10-27 表認識装置
US08/479,974 US5708730A (en) 1992-10-27 1995-06-07 Table recognition apparatus
US08/599,099 US5668892A (en) 1992-10-27 1996-02-09 Table recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4310861A JP2789971B2 (ja) 1992-10-27 1992-10-27 表認識装置

Publications (2)

Publication Number Publication Date
JPH06139404A true JPH06139404A (ja) 1994-05-20
JP2789971B2 JP2789971B2 (ja) 1998-08-27

Family

ID=18010276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4310861A Expired - Fee Related JP2789971B2 (ja) 1992-10-27 1992-10-27 表認識装置

Country Status (2)

Country Link
US (2) US5708730A (ja)
JP (1) JP2789971B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032770A (ja) * 2000-06-23 2002-01-31 Internatl Business Mach Corp <Ibm> 文書処理方法、文書処理システムおよび媒体
JP2007241428A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 画像処理装置及びプログラム

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3814320B2 (ja) * 1995-12-14 2006-08-30 キヤノン株式会社 画像処理方法及び装置
JP3830998B2 (ja) * 1995-12-28 2006-10-11 株式会社東芝 罫線除去方法及びこれを用いた文字認識装置
US6327387B1 (en) * 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
JP3411472B2 (ja) * 1997-05-30 2003-06-03 富士通株式会社 パターン抽出装置
US6173073B1 (en) * 1998-01-05 2001-01-09 Canon Kabushiki Kaisha System for analyzing table images
JP4235286B2 (ja) * 1998-09-11 2009-03-11 キヤノン株式会社 表認識方法及び装置
JP3258287B2 (ja) * 1999-01-06 2002-02-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 画像データの解析方法及び解析装置、及び画像データの解析を行うためのプログラム・プロダクトを格納した記録媒体
US6865720B1 (en) * 1999-03-23 2005-03-08 Canon Kabushiki Kaisha Apparatus and method for dividing document including table
WO2000062243A1 (fr) * 1999-04-14 2000-10-19 Fujitsu Limited Procede et dispositif d'extraction de chaines de caracteres utilisant un composant de base d'une image de document
EP1310904A4 (en) * 2000-06-02 2007-03-28 Japan Science & Tech Agency DOCUMENT PROCESSING METHOD, RECORDING MEDIA RECORDING A DOCUMENT PROCESSING PROGRAM AND DOCUMENT PROCESSOR
JP2004139484A (ja) * 2002-10-21 2004-05-13 Hitachi Ltd 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system
JP4973063B2 (ja) * 2006-08-14 2012-07-11 富士通株式会社 表データ処理方法及び装置
US8473467B2 (en) * 2009-01-02 2013-06-25 Apple Inc. Content profiling to dynamically configure content processing
US8380753B2 (en) 2011-01-18 2013-02-19 Apple Inc. Reconstruction of lists in a document
US8543911B2 (en) 2011-01-18 2013-09-24 Apple Inc. Ordering document content based on reading flow
CN103377177B (zh) * 2012-04-27 2016-03-30 北大方正集团有限公司 一种数字版式文件中识别表格的方法及装置
US9008443B2 (en) 2012-06-22 2015-04-14 Xerox Corporation System and method for identifying regular geometric structures in document pages
US8812870B2 (en) 2012-10-10 2014-08-19 Xerox Corporation Confidentiality preserving document analysis system and method
US9008425B2 (en) 2013-01-29 2015-04-14 Xerox Corporation Detection of numbered captions
CN104268545B (zh) * 2014-09-15 2017-09-29 同方知网(北京)技术有限公司 一种电子档版式文件中的表格区域识别与内容栅格化方法
US9684844B1 (en) * 2016-07-15 2017-06-20 StradVision, Inc. Method and apparatus for normalizing character included in an image
US11650970B2 (en) 2018-03-09 2023-05-16 International Business Machines Corporation Extracting structure and semantics from tabular data
US11200413B2 (en) * 2018-07-31 2021-12-14 International Business Machines Corporation Table recognition in portable document format documents
US20220107883A1 (en) * 2018-12-28 2022-04-07 Micro Focus Llc Automated identification of input elements in a graphical user interface

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01129358A (ja) * 1987-11-16 1989-05-22 Canon Inc 表数値演算装置
JPH0261775A (ja) * 1988-08-29 1990-03-01 Nippon Telegr & Teleph Corp <Ntt> 表画像認識方式
JP2812982B2 (ja) * 1989-04-05 1998-10-22 株式会社リコー 表認識方法
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
DE69033312D1 (de) * 1989-07-10 1999-11-11 Hitachi Ltd Dokumentdatenverarbeitungsgerät unter Anwendung von Bilddaten
JP2796561B2 (ja) * 1989-10-30 1998-09-10 株式会社エフ・エフ・シー 表形式文書認識方式
JP2913821B2 (ja) * 1990-02-23 1999-06-28 日立工機株式会社 ドットラインプリンタのインクリボン速度制御方法
US5191612A (en) * 1990-03-13 1993-03-02 Fujitsu Limited Character recognition system
US5172422A (en) * 1991-05-13 1992-12-15 Eastman Kodak Company Fast character segmentation of skewed text lines for optical character recognition
US5253305A (en) * 1991-06-25 1993-10-12 Industrial Technology Research Institute Character boundary identification method and system
US5425138A (en) * 1991-12-26 1995-06-13 Casio Computer Co., Ltd. Apparatus and method for automatically editing documents including text data and table data with ruled lines
JPH05250357A (ja) * 1992-03-05 1993-09-28 Ricoh Co Ltd 画像読取修正装置および修正画像形成装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032770A (ja) * 2000-06-23 2002-01-31 Internatl Business Mach Corp <Ibm> 文書処理方法、文書処理システムおよび媒体
US7046847B2 (en) 2000-06-23 2006-05-16 International Business Machines Corporation Document processing method, system and medium
JP2007241428A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 画像処理装置及びプログラム

Also Published As

Publication number Publication date
JP2789971B2 (ja) 1998-08-27
US5708730A (en) 1998-01-13
US5668892A (en) 1997-09-16

Similar Documents

Publication Publication Date Title
JPH06139404A (ja) 表認識装置
US5774580A (en) Document image processing method and system having function of determining body text region reading order
JP2951814B2 (ja) 画像抽出方式
CN108446264A (zh) Pdf文档中的表格矢量解析方法及装置
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
Dori et al. Segmentation and recognition of dimensioning text from engineering drawings
JP2926066B2 (ja) 表認識装置
ALshebeili et al. Arabic character recognition using 1-D slices of the character spectrum
JPH0440749B2 (ja)
JPH08320914A (ja) 表認識方法および装置
US11270146B2 (en) Text location method and apparatus
JPH0410087A (ja) 基本ライン抽出方法
JPH11232439A (ja) 文書画像構造解析方法
JP3798179B2 (ja) パターン抽出装置及び文字切り出し装置
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JPH06131497A (ja) 表認識方式
JP2917427B2 (ja) 図面読取装置
JPH02116987A (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JPH06119491A (ja) 帳票理解システム
JPH0697470B2 (ja) 文字列抽出装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
KR950011065B1 (ko) 문자 인식방법
CN116958995A (zh) 一种基于字符在平面位置信息的分段方法
JP3022672B2 (ja) 手書き文字の識別方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090612

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100612

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110612

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110612

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees