JPH06139404A

JPH06139404A - 表認識装置

Info

Publication number: JPH06139404A
Application number: JP4310861A
Authority: JP
Inventors: Katsuhiko Itonori; 勝彦糸乘
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1992-10-27
Filing date: 1992-10-27
Publication date: 1994-05-20
Anticipated expiration: 2013-08-27
Also published as: JP2789971B2; US5708730A; US5668892A

Abstract

(57)【要約】【目的】表の罫線が大幅に省略されているような表あ
るい内容に省略されている部分のある表に関しても、正
確に表の構造を取り出すことができること。【構成】文字と罫線が混在している表画像を認識する
表認識装置において、表画像中の文字と罫線を分離する
文字／罫線分離部１１と、文字／罫線分離部１２によっ
て分離された文字画像から文字ブロックを抽出する文字
ブロック抽出部１２と、文字ブロック抽出部１２によっ
て抽出された各文字ブロックを相互の位置関係から各文
字ブロックの縁を揃えるように拡張する文字ブロック拡
張部１３と、文字ブロック間の位置関係により行を抽出
する行抽出部１４と、前記文字ブロック拡張部により拡
張された文字ブロック間の位置関係により列を抽出する
列抽出部１５とを有する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は文字と図形が混在してい
る表画像を認識し、行と列の構造を取り出す表認識装置
に関する。

【０００２】

【従来の技術】従来の表認識の方式としては、表領域の
周辺分布や表を構成する罫線をベクトル線分に変換し
て、罫線で囲まれた矩形枠を抽出している。周辺分布を
使用する方式として、例えば特開平２−６１７７５号公
報記載の技術、ベクトル線分を使用する方式として特開
平１−１２９３５８号公報記載の技術等がある。前者の
方式は、周辺分布により表の最も外側にある外枠の罫線
を取り出し、この外枠に両端を接する罫線により複数の
矩形枠に分割する。さらに、分割された各矩形枠内に対
して同様の処理を再帰的に施すことにより、罫線で囲ま
れた矩形枠を抽出する。後者の方式は、ベクトル線分を
追跡して取り出した各矩形枠の位置関係を調べることに
より表の認識を行なう。

【０００３】これらの従来の方式は、表を構成する罫線
に省略が無いことを前提としているが、特開平２−２６
４３８６号公報においては表の両脇の罫線が省略されて
いる場合でも、正しく矩形枠を取り出すことができるよ
うにした方式が開示されている。すなわち、この方式
は、表画像から取り出した縦罫線、横罫線から表の両脇
に罫線があるかを判別し、無い場合に表の両脇に縦罫線
を仮想的に生成する方式である。

【０００４】上述の従来の方式は罫線がすべて揃ってい
るか、最も外側の罫線のみが省略されている表、すな
わち図２の（ａ）（ｂ）のような表に対してのみ適用可
能であり、図２の（ｃ）〜（ｅ）のような表の場合には
適用できなかった。図２の（ｃ）のような表にも適用可
能な方式として、文字列間の空白領域に注目して省略さ
れている罫線を補おうとする方式が特開平３−１４２６
９１号公報で開示されている。

【０００５】

【発明が解決しようとする課題】しかしながら、表
（ｄ）（ｅ）のように行あるいは列に入れ子の構造が存
在しているときには、連続する空白領域を見つけるため
により精密に画像を調べる必要があり、処理時間が長く
なる欠点を持っていた。また、表の行と列の構造の認識
においても、表を構成する各要素中に代表点（中心、重
心）を設け、この代表点間の行、あるいは列方向の距離
によって行、列を抽出していた。すなわち、すべての代
表点の行、あるいは列方向の距離を調べ、この距離が閾
値以下のものを１つの行あるいは列として抽出する。し
かし、文字ブロックを表の構成要素とした場合、文字ブ
ロック間の位置のずれが大きい場合には、必ずしも正確
に行、列を抽出できるものではなかった。

【０００６】また、従来の方式は、表画像中の文字をＯ
ＣＲ（文字認識装置）が正確に認識できるように各文字
が存在する部分を切り出すことが主な目的であり、表そ
れ自体の構造を保存するものではなかった。したがっ
て、いかに表の内容が省略されていようとも文字が記入
されている範囲が特定できればよかった。逆に言えば、
表の内容が省略されている部分はＯＣＲに入力する必要
がないので無視することができた。しかし、表の構造を
取り出して、ワープロなどの文書作成装置に再度入力し
て利用するような場合には、表の内容の省略を無視でき
ない場合がある。たとえば、図２の（ｅ）の表のように
横罫線のみで記述されている表の場合、内容の省略は表
の行、列の構造を抽出する作業に支障を来たし、正確に
表の構造を取り出すことができなくなるという不都合が
あった。

【０００７】本発明は、このような問題点を解決するこ
とを目的とするものである。すなわち本発明は、表の罫
線が大幅に省略されているような表あるい内容に省略さ
れている部分のある表に関しても、正確に表の構造を取
り出すことができる表認識装置を提供することを目的と
する。

【０００８】

【課題を解決するための手段】本発明（請求項１）は、
文字と罫線が混在している表画像を認識する表認識装置
において、表画像中の文字と罫線を分離する文字／罫線
分離手段（図１の１１）と、前記文字／罫線分離手段に
よって分離された文字画像から文字ブロックを抽出する
文字ブロック抽出手段（図１の１２）と、前記文字ブロ
ック抽出手段によって抽出された各文字ブロックを相互
の位置関係から各文字ブロックの縁を揃えるように拡張
する文字ブロック拡張手段（図１の１３）とを有するこ
とを特徴とする。

【０００９】本発明（請求項２）は、前記文字／罫線分
離手段、文字ブロック抽出手段、文字ブロック抽出手段
を備えた表認識装置において、前記文字ブロック拡張手
段により拡張された文字ブロック間の位置関係により行
を抽出する行抽出手段（図１の１４）と、前記文字ブロ
ック拡張手段により拡張された文字ブロック間の位置関
係により列を抽出する列抽出手段（図１の１５）とを設
けたことを特徴とする。

【００１０】本発明（請求項３）は、前記文字／罫線分
離手段、文字ブロック抽出手段、文字ブロック拡張手
段、行抽出手段および列抽出手段を備えた前記表認識装
置において、文字ブロック拡張手段（図１５の１５３）
が、文字／罫線分離手段（図１５の１５１）によって分
離された罫線画像と文字ブロック抽出手段（図１５の１
５２）によって抽出された各文字ブロックとから文字ブ
ロックをその他の文字ブロックと重複しないように、最
も近い罫線まで拡張する第１の文字ブロック拡張手段
（図１５の１５３１）と、第１の文字ブロック拡張手段
によって拡張された各文字ブロックを相互の位置関係か
ら各文字ブロックの縁を揃えるように拡張する第２の文
字ブロック拡張手段（図１５の１５３２）とを備えてい
る。

【００１１】本発明（請求項４）は、文字と罫線が混在
している表画像を認識する表認識装置において、表画像
中の文字と罫線を分離する文字／罫線分離手段（図２１
の２１１）と、前記文字／罫線分離手段によって分離さ
れた文字画像から文字ブロックを抽出する文字ブロック
抽出手段（図２１の２１２）と、前記文字／罫線分離手
段によって分離された罫線画像から罫線により構成され
る矩形を抽出する矩形枠抽出手段（図２１の２１３）
と、前記矩形枠抽出手段により抽出した矩形枠と文字ブ
ロック抽出手段によって抽出された各文字ブロックとの
包含関係により文字ブロックを１つ以下含む矩形枠（す
なわち文字ブロックを１つだけ含む矩形枠および文字ブ
ロックを含まない矩形枠）を表を構成する枠として抽出
する構成枠抽出手段（図２１の２１４）と、前記構成枠
抽出手段によって抽出された構成枠に含まれない文字ブ
ロックと前記文字／罫線分離手段により分離された罫線
画像とから対象とする文字ブロックをその他の文字ブロ
ックと重複しないように、最も近い罫線まで拡張する第
１の文字ブロック拡張手段（図２１の２１５１）と、前
記第１の文字ブロック拡張手段によって拡張された各文
字ブロックを相互の位置関係から各文字ブロックの縁を
揃えるように拡張する第２の文字ブロック拡張手段（図
２１の２１５２）と、前記第２の文字ブロック拡張手段
により拡張された文字ブロックと前記構成枠抽出手段に
よって抽出された構成枠との間の位置関係により行を抽
出する行抽出手段（図２１の２１６）と、前記第２の文
字ブロック拡張手段により拡張された文字ブロックと前
記構成枠抽出手段によって抽出された構成枠との間の位
置関係により列を抽出する列抽出手段（図２１の２１
７）とを有することを特徴とする。

【００１２】本発明（請求項５）は、文字と罫線が混在
している表画像を認識する表認識装置において、表画像
中の文字と罫線を分離する文字／罫線分離手段（図２８
の２８１）と、前記文字／罫線分離手段によって分離さ
れた文字画像から文字ブロックを抽出する文字ブロック
抽出手段（図２８の２８２）と、前記文字／罫線分離手
段により分離された罫線画像と文字ブロック抽出手段に
よって抽出された各文字ブロックとから文字ブロックを
その他の文字ブロックと重複しないように、最も近い罫
線まで拡張する第１の文字ブロック拡張手段（図２８の
２８３）と、前記第１の文字ブロック拡張手段によって
拡張された各文字ブロックを相互の位置関係から各文字
ブロックの縁を揃えるように拡張する第２の文字ブロッ
ク拡張手段（図２８の２８４）と、前記第２の文字ブロ
ック拡張手段により拡張された文字ブロックの位置関係
により文字ブロックを正規化する文字ブロック正規化手
段（図２８の２８５）と、前記文字ブロック正規化手段
により正規化された各文字ブロックの重複している矩形
を検出しその矩形を仮想的な文字ブロックとみなす文字
ブロック補間手段（図２８の２８６）と、前記文字ブロ
ック補間手段により補間された文字ブロック間の位置関
係により行を抽出する行抽出手段（図２８の２８７）
と、前記文字ブロック補間手段により補間された文字ブ
ロック間の位置関係により列を抽出する列抽出手段（図
２８の２８８）とを有することを特徴とする。

【００１３】

【作用】本発明（請求項１）の作用においては、表画像
中に存在する文字と罫線を文字／罫線分離手段によって
分離し、求めた文字画像中の黒画素塊間の距離などから
１まとまりの文字ブロックを文字ブロック抽出手段によ
って求め、この文字ブロック抽出手段によって求めたす
べての文字ブロックの縁を揃えるように文字ブロック拡
張手段によって拡張する。このように本発明は表を構成
する文字ブロックを拡張し、文字ブロック間にあるギャ
ップを埋めることにより表を認識するので、表の罫線が
大幅に省略されているような表に関してもその構造を認
識することができ、しかも文字ブロック間の位置ずれが
大きくても正確な認識を行うことができる。

【００１４】本発明（請求項２）においては、前述の拡
張した文字ブロックの行方向、列方向の並びを行抽出手
段および列抽出手段によって調べ、行、列の構造を取り
出す。本発明では表を構成する文字ブロックを拡張した
ブロックにより表の行方向および列方向の並びを抽出す
るので、表の構造を正確に抽出することができる。

【００１５】本発明（請求項３）においては、文字／罫
線分離手段で求めた罫線画像を用いて、文字ブロック抽
出手段で求めた全ての文字ブロックを他の文字ブロック
をまたがないように最も近い罫線まで各文字ブロックを
第１の文字ブロック拡張手段によって拡張し、この第１
の文字ブロック拡張手段２０３によって拡張された各文
字ブロックの縁をそろえるように第２の文字ブロック拡
張手段によって拡張する。これによれば、文字ブロック
の拡張に罫線の情報を利用するので、より正確に表の構
造を抽出することができる。例えば、分割された列の見
出し部分のように複数の分割列にまたがる文字ブロック
がある表（図２０（ａ））であっても正確に表の構造を
得ることができる（図２０（ｃ））。

【００１６】本発明（請求項４）においては、文字／罫
線分離手段で分離された罫線画像から矩形枠抽出手段に
よって罫線で形成されるすべての矩形を抽出しておく。
構成枠抽出手段では、文字ブロック抽出手段によって抽
出された文字ブロックと矩形枠抽出手段で抽出された矩
形との包含関係を調べ、１つ以下の文字ブロックを含む
矩形（即ち、１つの文字ブロック含む矩形または文字ブ
ロックを含まない矩形）を表の構成枠とする。表の構成
枠に含まれない文字ブロックを第１の文字ブロック拡張
手段と第２の文字ブロック拡張手段によって文字ブロッ
クを拡張し、この文字ブロックと上記構成枠抽出手段に
よって求めた構成枠の行方向、列方向の並びを行抽出手
段、列抽出手段によって調べ、行、列の構造を取り出
す。本発明によれば、表の罫線で形成される矩形を表の
構造を把握するために利用するので、複雑な構成の表で
あってもその構造を正確に抽出することができる。

【００１７】本発明（請求項５）においては、表画像中
に存在する文字と罫線を文字／罫線分離手段１によって
分離し、求めた文字画像中の黒画素塊間の距離から１ま
とまりの文字ブロックを文字ブロック抽出手段によって
求め、文字／罫線分離手段で求めた罫線画像を用いて、
文字ブロック抽出手段で求めた全ての文字ブロックを他
の文字ブロックをまたがないように最も近い罫線まで各
文字ブロックを第１の文字ブロック拡張手段によって拡
張し、さらに全ての文字ブロックの縁を揃えるように第
２の文字ブロック拡張手段によって拡張する。次にこの
拡張した文字ブロックをその矩形領域の情報から、文字
ブロックの位置、大きさを文字ブロック正規化手段で正
規化する。文字ブロック補間手段で、この正規化した文
字ブロック間の重複を調べ、重複している部分に仮想的
な文字ブロックを設け、文字ブロックの行方向、列方向
の並びを行抽出手段、列抽出手段によって調べ、行、列
の構造を取り出す。本発明によれば、文字ブロックをそ
の縁をそろえるように拡張し、位置、大きさを正規化す
ることによって、内容に省略のある表であっても、正確
に表の構造を抽出することができる。

【００１８】

【実施例】第１の実施例図１は本発明の第１の実施例の構成を示す図である。こ
の装置は、文字／罫線分離部１１、文字ブロック抽出部
１２、文字ブロック拡張部１３、行抽出部１４、列抽出
部１５を備えている。文字／罫線分離部１１は、表画像
中に書かれている文字と罫線を分離する処理を行うもの
である。この処理は、文字を形成する画像中の画素の塊
と、罫線（図形）を形成する画素の塊の面積、輪郭、複
雑さなどを調べることによって実現することができる。
例えば、岩城らの「文字・図形分離処理におけるプロダ
クション・システム導入の一検討」（ＰＲＵ８３−６２
Ｐ．６７−７４）に記載されている公知の技術を利用
することができる。また、本出願人による特願平３−２
９０２９９号記載の技術を用いればより好適である。こ
れ以後の処理は分離された画像の内、文字画像に注目し
て処理が行われる。

【００１９】文字ブロック抽出部２では、上記文字／罫
線分離部１１によって得られる文字画像について、１つ
の画素塊を含む矩形領域を求め、これを１つの文字と推
定して、文字間の距離によって接近している１つ以上の
文字をまとめて文字ブロックとして統合する。日本語は
図３に示すように複数の画素塊から構成されていること
が多いため、単純に１つの画素塊を１つの文字に対応さ
せることは本来の意味としては間違っているが、図３
（ａ）のようにこれらの画素塊は非常に接近しているた
めに、本実施例では問題にならない。そのため、ここで
は特別な処理は行なわない。ただし、図３（ｂ）のよう
に２つの画素塊がその矩形領域において、重複する部分
がある時にはこの２つの画素塊を統合してあらたに矩形
領域を設定することとする。なお、より正確に１つづつ
の文字を求める必要がある時には、特開平３−２６７２
７８号記載の技術を使用することができる。

【００２０】図４および図５のフローを用いて文字ブロ
ック抽出部について詳しく説明する。ただし、この時点
で文字画像中の全ての文字を表す画素塊の矩形領域が求
められているものとし、この矩形領域を文字矩形として
表す。まず、図４において、各文字矩形の大きさの総和
を求め（ステップ４０１〜４０４）、総和の大きさの平
均の１／２を文字ブロックとして統合する時の閾値Ｔ
ｗ，Ｔｈとする。ここでは文字矩形の平均的大きさの半
分を閾値として決めているが、この閾値の決め方はこれ
に限らず、文字矩形間の距離の平均の数％として決める
などの方法を取ってもよい。

【００２１】次に、図５において、文字矩形を１つづつ
取り出し、既に文字ブロックの一部として登録されてい
るかを調べる（ステップ４０７）。もし文字ブロックの
一部でなければ、あらたに文字ブロックを作り、その先
頭の要素としてこの文字ブロックを登録する（ステップ
４０８）。次に残りの文字矩形についてこの文字ブロッ
クとの距離を求め（ステップ４１１）、水平、垂直方向
の距離が図４で求めた閾値Ｔｗ，Ｔｈより小さいか否か
を調べる（ステップ４１２）。小さい場合には、文字ブ
ロックの一部として登録する（ステップ４１３）。以上
の処理を文字ブロックに登録されていない文字矩形がな
くなるまで繰り返す。

【００２２】以上の処理によって、図６（ａ），
（ｂ）、図７（ａ），（ｂ）のように文字ブロックを抽
出することができる。ここでは、文字画像についてだけ
調べて文字ブロックを抽出しているが、文字／罫線分離
部１で求めることのできる罫線画像を用い、文字を表す
画素塊がいかに接近して存在していても、罫線をまたが
って統合するようなことを禁止することで、より正確な
文字ブロックを求めることが可能となる。

【００２３】次に文字ブロック拡張部１３は、各文字ブ
ロックの縦方向、横方向における文字ブロックの分布を
調べて、その縁を揃えるように各文字ブロックを拡張す
る。文字ブロック拡張部１３の処理を図８のフローを用
いて説明する。まず、この処理は横方向への拡張と、縦
方向への拡張からなっている。各文字ブロックがどの座
標でいくつ重なっているかを表す縦方向の文字ブロック
分布を作成する（ステップ８０１）。図９に図６（ａ）
の表に対する縦方向の文字ブロック分布９１を示す。な
お、図９には横方向の文字ブロック分布９２も合わせて
示す。次に変数ｉを０にリセットする（ステップ８０
２）。縦方向の文字ブロック分布ＨｉｓｔＷの値がｉ、
すなわち０に変化する、あるいは０から０より大きい他
の値へ変化する部分を見つけ、他の文字ブロックをまた
がらないように各文字ブロックの幅を拡張する（ステッ
プ８０３）。ただし、このとき次の２つのルールを設定
して、拡張を行なう。ルール１：他の値からｉに変化した時は、右方向への
拡張ルール２：ｉからｉより大きい他の値に変化する時
は、左方向への拡張この処理をｉ＜Ｎである間続ける。ｉ＝０の時のステッ
プ８０３の結果を図１０（ａ）に、文字ブロックの幅の
拡張が終了した時点での文字ブロックの様子を図１０
（ｂ）に示す。

【００２４】次に、横方向の文字ブロック分布を作成し
高さの拡張を同様な処理によって行なう（ステップ８０
４〜８０６）。なお、ステップ８０６での拡張のルール
は、ルール１：他の値からｉに変化した時は、下方向への
拡張ルール２：ｉからｉより大きい他の値に変化する時
は、上方向への拡張以上の処理によって、図１１に示すような各行、列にお
いて縁が揃っている文字ブロックを得ることができる。

【００２５】行抽出部１４と列抽出部１５では、文字ブ
ロック拡張部１３によって拡張された文字ブロックの位
置関係を調べることで行と列の関係を抽出する。図１１
の文字ブロック分布を見ても明らかなように、各行、各
列を構成する文字ブロックはある一定の範囲内に存在し
ている。したがって、この包含関係を調べることで、正
確に各行、各列を抽出することが可能である。行抽出部
１４の処理フローを図１２に、列抽出部１５の処理フロ
ーを図１３に示す。

【００２６】行抽出部１４では、まず各文字ブロックを
文字ブロックの上辺のＹ座標によって昇順に並べかえる
（ステップ１２０１）。次にｉ番目の文字ブロックＢｉ
を取り出し（最初はｉ＝０にリセット）、行に登録され
ていない文字ブロックの中で文字ブロックＢｉの存在す
る縦方向の範囲、すなわち文字ブロックＢｉの上辺のＹ
座標〜下辺のＹ座標の範囲内に存在する文字ブロックを
１つの行として登録する（ステップ１２０２）。この処
理を、未登録の文字ブロックがなくなるまで繰り返す。

【００２７】また、同様にして列抽出部１５は、各文字
ブロックを文字ブロックの左辺のＸ座標によって昇順に
並べかえる（ステップ１３０１）。次にｉ番目の文字ブ
ロックＢｉを取り出し（最初はｉ＝０にリセット）、列
に登録されていない文字ブロックの中で文字ブロックＢ
ｉの存在する横方向の範囲、すなわち文字ブロックＢｉ
の左辺のＸ座標〜右辺のＸ座標の範囲内に存在する文字
ブロックを１つの列として登録する（ステップ１３０
２）。この処理を、未登録の文字ブロックがなくなるま
で繰り返す。

【００２８】さらに、図６（ａ）の表のように行あるい
は列に分割のある場合には、複数の行あるいは列が抽出
されなくなるまで、各行、列に対して、繰り返し行抽
出、列抽出の処理を行なうことで、行、列を抽出するこ
とができる。図６（ａ）の表に対して行抽出した結果を
図１４（ａ）に、列抽出の結果を図１４（ｂ）に示す。
以上のように、文字ブロックをその縁を揃えるように拡
張することによって、表中の行と列の構造を正確に抽出
することができる。

【００２９】第２の実施例第２の実施例は、第１の実施例に加えて表画像中の罫線
を用いて、文字ブロックの拡張処理を簡素化し、かつよ
り正確に行、列の構造を抽出するものである。図１５は
第２の実施例の基本構成を示す図である。この第２の実
施例の表認識装置は、文字／罫線分離部１５１、文字ブ
ロック抽出部１５２、文字ブロック拡張部１５３、行抽
出部１５４、および列抽出部１５５を備えてなり、その
文字ブロック拡張部１５３は第１の文字ブロック拡張部
１５３１と第２の文字ブロック拡張部１５３２からな
る。文字／罫線分離部１５１と文字ブロック抽出部１５
２については、実施例１で述べているのと同じであるの
で、ここでは説明しない。

【００３０】第１の文字ブロック拡張部１５３１は、文
字／罫線分離部１５１によって分離された罫線画像と文
字ブロック抽出部１５２によって抽出された文字ブロッ
クを入力として、罫線を用いて文字ブロックの大きさを
拡張するものである。第１の文字ブロック拡張部１５３
１の処理フローを図１６および図１７に示す。このフロ
ーを用いてその処理を順を追って説明する。罫線画像を
ベクトル化する（ステップ１６０１）。このベクトル化
の手法は、特開平１−１４２８８０号公報、特開平２−
１０５２６５号公報などに記載されている技術を用いる
ことができる。次に、各文字ブロックとベクトル・デー
タとの距離を求め、文字ブロックの上下左右で最も近い
ベクトル・データをそれぞれ求める（ステップ１６０
２、１６０５、１６０８、１６１１）。ここで求めたベ
クトル・データと文字ブロックとの間に、他の文字ブロ
ックが無い場合にのみ文字ブロックをベクトル・データ
まで拡張する（ステップ１６０３〜１６０４、１６０６
〜１６０７、１６０９〜１６１０、１６１２〜１６１
３）。この時の拡張は、可能であればベクトル・データ
の端点と文字ブロックの角を一致させるような拡張を行
なう。この処理を全ての文字ブロックに対して行なう。

【００３１】図６（ａ）の表に対する第１の文字ブロッ
ク拡張部１５３１の処理結果を図１８（ａ）に示す。ま
た、罫線のすべてそろっている表について第１の文字ブ
ロック拡張部１５３１の処理結果を図１９に示す。図１
９から明らかなように、罫線がすべてそろっていると
き、第１の文字ブロック拡張部１５３１で求められる文
字ブロックは、罫線で囲まれている矩形と一致してい
る。このようなとき、文字ブロックの縁は既にそろって
いるため、第２の文字ブロック拡張部１５３２の処理は
省略することができる。次に第２の文字ブロック拡張部
１５３２は、第１の実施例の文字ブロック拡張部１３と
同様な手法を用いることができる。図６（ａ）の表に対
する第２の文字ブロック拡張部１５３２の処理結果を図
１８（ｂ）に示す。

【００３２】行抽出部１５４と列抽出部１５５について
は第１の実施例において説明したのと同じ処理であるの
で、ここでは説明を省略する。以上の処理によって、例
えば図２０（ａ）に示すような罫線の一部が欠けてお
り、しかも列が分割されている表を認識することが可能
となる。第１の実施例の文字ブロック拡張部１３では、
図２０（ｂ）のような誤った結果となるが、第１の文字
ブロック拡張部１５３１の罫線情報を用いたブロック拡
張の効果により図２０（ｃ）のように表の構造に一致し
た結果を求めることができる。

【００３３】第３の実施例第３の実施例は、表画像中の罫線によってできる矩形を
も用いて、行、列の抽出処理を正確に行なうものであ
る。図２１は第３の実施例の基本構成を示す図である。
この実施例の表認識装置は、文字／罫線分離部２１１、
文字ブロック抽出部２１２、矩形枠抽出部２１３、構成
枠抽出部２１４、文字ブロック拡張部２１５、行抽出部
２１６、列抽出部２１７を備えており、さらに、文字ブ
ロック拡張部２１５は第１の文字ブロック拡張部２１５
１と第２の文字ブロック拡張部２１５２とからなってい
る。入力された表画像は、文字／罫線分離部２１１によ
り文字画像と罫線画像に分離される。文字ブロック抽出
部２１２は、分離された文字画像を入力として表中の文
字ブロックを抽出する。文字／罫線分離部２１１と文字
ブロック抽出部２１２は第１の実施例で説明したものと
同じであり、ここでは説明を省略する。

【００３４】矩形枠抽出部２１３は、罫線画像を入力と
し、罫線によって形成される矩形を抽出する処理を行う
ものである。この処理は罫線画像をベクトル化したの
ち、ベクトル・データ間のつながりを調べて矩形を抽出
していく。このベクトル化の手法は公知技術であるの
で、ここでは特に述べない（例えば特開平１−１４２８
８０号公報、特開平２−１０５２６５号公報参照）。罫
線で囲われている枠は、１つの水平ベクトル・データの
左右に垂直ベクトル・データが接続し、さらにその下に
水平ベクトル・データが接続していることから、各水平
ベクトル・データを調べて、条件を満たすベクトル・デ
ータを枠として登録する方法により抽出する。

【００３５】この処理を図２２および図２３に示すフロ
ーチャートを用いて説明する。まず、表を構成する全て
のベクトル・データの数を計数する（ステップ２２０
１）。以下のステップ２２０２からステップ２２１２の
処理を全てのベクトル・データに対して適用する。次
に、矩形枠の上罫線となる水平ベクトル・データＶｉを
捜す（ステップ２２０３）。これは、ベクトル・データ
と水平線とのなす角度がある閾値以下であることから水
平なベクトル・データを見つけることができる。ここで
みつけた水平ベクトル・データＶｉは、ｋ番目の矩形枠
の上罫線となる可能性があるので、矩形枠構成表２４１
のｋ番目の矩形枠の上罫線の欄にこのベクトル・データ
Ｖｉを登録する（ステップ２２０４）。次に矩形枠Ｗｋ
の右側の辺を構成するベクトル・データを捜す（ステッ
プ２２０５）。すなわち、ベクトル・データＶｉの右端
の端点に接し、かつベクトル・データＶｉに接していな
いほうの端点がベクトル・データＶｉより下にあるよう
な垂直ベクトル・データをみつける処理を行なう。垂直
ベクトル・データは、垂線とのなす角度がある閾値以下
であることから容易に求めることができる。このステッ
プで見つけたベクトル・データは矩形枠Ｗｋの右罫線を
構成する可能性があるので、矩形枠構成表２４１のｋ番
目の矩形枠の右罫線の欄に登録する（ステップ２２０
６）。このとき、右罫線として見つけたベクトル・デー
タの下に、このベクトル・データよりに左側に伸びるベ
クトル・データが接続していないか調べる。このような
ベクトル・データが存在していない場合、その下に接す
る垂直なベクトル・データも矩形枠Ｗｋの右罫線を構成
する可能性があるので、矩形枠構成表２４１のｋ番目の
矩形枠の右罫線の欄に登録する。

【００３６】同様に、矩形枠Ｗｋの左罫線を捜し（ステ
ップ２２０７）、矩形枠構成表２４１のｋ番目の矩形枠
の左罫線の欄に登録する（ステップ２２０８）。さら
に、いま求めた右罫線、左罫線を結ぶような水平なベク
トル・データを見つけ（ステップ２２０９）、矩形枠構
成表２４１のｋ番目の矩形枠の下罫線の欄に登録する
（ステップ２２１０）。以上の処理のうち、１つでも罫
線が見つからない場合は、矩形枠構成表２４１のｋ番目
の矩形枠のすべての登録を破棄して、他のベクトル・デ
ータで構成される矩形枠を登録できるようにリセットす
る。以上の処理を図２４（ａ）の表に適用した時の矩形
枠構成表２４１は図２４（ｂ）のようになる。

【００３７】構成枠抽出部２１４では、文字ブロック抽
出部２１２で求めた文字ブロックと矩形枠抽出部２１３
で求めた矩形枠の包含関係を調べ、ただ１つだけ文字ブ
ロックを含む、あるいはまったく文字ブロックを含まな
い矩形枠を表の構成要素として抽出する。図２５に、構
成枠抽出部２１４の処理フローを示す。処理の概要は、
各矩形枠と文字ブロックの包含関係を調べ（ステップ２
５０３）、矩形枠に含まれる文字ブロックの数を計数す
る（ステップ２５０４）。この結果、複数の文字ブロッ
クを含む矩形枠はその内部の文字ブロックによって行と
列の構造が支配されるので、このような矩形枠は棄却す
る。また、１つ以下の文字ブロックを含む矩形枠は構成
枠として登録する（ステップ２５０７，２５０８）。図
２６（ａ）のような表についての構成枠抽出部２１４の
結果は図２６（ｂ）のようになる。

【００３８】文字ブロック拡張部２１５では、文字／罫
線分離部２１１で求められた罫線画像と構成枠抽出部２
１４によって求められた構成枠とその外にある文字ブロ
ックを入力として、第１の文字ブロック拡張部２１５１
と第２の文字ブロック拡張部２１５２とにより、文字ブ
ロックの縁がそろうように拡張する。この第１と第２の
文字ブロック拡張部は、第１の実施例、第２の実施例で
説明しているのでここでの説明を省略する。行抽出部２
１６と列抽出部２１７は、文字ブロックと構成枠を入力
とすることが異なるだけで、第１の実施例で説明した処
理と同じである。実施例３の構成によって、図２６
（ａ）にしめすような表から、行と列の構造を抽出した
結果を図２７（ａ），（ｂ）に示す。以上説明したよう
に、本実施例によれば、さまざまな複雑な表であっても
その行、列の構造を正確に抽出することが可能である。

【００３９】第４の実施例図２８は本発明の第４の実施例の構成を示す図である。
これは文字／罫線分離部２８１、文字ブロック抽出部２
８２、第１の文字ブロック拡張部２８３、第２の文字ブ
ロック拡張部２８４、文字ブロック正規化部２８５、文
字ブロック補間部２８６、行抽出部２８７、列抽出部２
８８を備えている。また、第１の文字ブロック拡張部２
８３は、第１の文字ブロック幅拡張部２８３１と第１の
文字ブロック高拡張部２８３２からなり、第２の文字ブ
ロック拡張部２８４は第２の文字ブロック幅拡張部２８
４１、第２の文字ブロック高拡張部２８４２および文字
ブロック統合部２８４３からなり、文字ブロック正規化
部２８５は文字ブロック幅正規化部２８５１と文字ブロ
ック高正規化部２８５２からなる。

【００４０】文字／罫線分離部２８１は、表画像中に書
かれている文字と罫線を分離する処理を行うものであ
る。文字ブロック抽出部２８２は、上記文字／罫線分離
部１によって得られる文字画像について、１つの黒画素
塊を含む矩形領域を求め、これを１つの文字と推定し
て、文字間の距離によって接近している１つ以上の文字
をまとめて文字ブロックとして統合するものである。こ
れらは第１の実施例で説明したものと同じであり、ここ
では説明を省略する。

【００４１】次に第１の文字ブロック拡張部２８３は、
文字／罫線分離部２８１によって分離された罫線画像と
文字ブロック抽出部２８２によって抽出された文字ブロ
ックを入力として、罫線を用いて文字ブロックの大きさ
を拡張するものである。この第１の文字ブロック拡張部
２８３は上下方向に文字ブロックを拡張する第１の文字
ブロック高拡張部２８３２と、左右方向に文字ブロック
を拡張する第１の文字ブロック幅拡張部２８３１とから
なっている。

【００４２】第１の文字ブロック高拡張部２８３２によ
る上下方向に文字ブロックを拡張するアルゴリズムを図
２９を用いて説明する。まず、罫線画像をベクトル化す
る（ステップ２９１）。このベクトル化の手法は、例え
ば特開平１−１４２８８０号公報、特開平２−１０５２
６５号公報などに記載されている既存の技術を用いるこ
とができる。次に、各文字ブロックとベクトル・データ
との距離を求め、文字ブロックの上下で最も近いベクト
ル・データをそれぞれ求める。ここで求めたベクトル・
データと文字ブロックとの間に、他の文字ブロックが無
い場合にのみ文字ブロックをベクトル・データまで拡張
する（ステップ２９２〜２９７）。この時の拡張は、可
能であればベクトル・データの端点と文字ブロックの角
を一致させるような拡張を行なう。この処理を全ての文
字ブロックに対して行なう。同様に図３０は、第１の文
字ブロック幅拡張部２８３１による左右方向に文字ブロ
ックを拡張するアルゴリズムを示している。このアルゴ
リズムは上記図２９で説明したアリゴリズムと上方向を
左方向とみなし、下方向を右方向とみなしたものと同一
である。図６（ａ）の表に対する第１の文字ブロック拡
張部２８３の処理結果を図１８（ａ）に示す。また、図
１９（ａ）に示すような罫線の全て揃っている表につい
て第１の文字ブロック拡張部２８３の処理結果を図１９
（ｂ）に示す。同図から明らかなように、罫線が全て揃
っているとき、第１の文字ブロック拡張部２８３で求め
られる文字ブロックは、罫線で囲まれている矩形と一致
している。

【００４３】次に第２の文字ブロック拡張部２８４は、
横方向における文字ブロックの分布および各文字ブロッ
クの縦方向における分布を調べて、その縁を揃えるよう
に各文字ブロックを拡張するものであり、第２の文字ブ
ロック幅拡張部２８４１、第２の文字ブロック高拡張部
２８４２とそれぞれの結果を統合する文字ブロック統合
部１８４３により構成されている。

【００４４】それぞれの処理を順を追って説明してい
く。まず、第２の文字ブロック幅拡張部２８４１と第２
の文字ブロック高拡張部２８４２の処理を図３１および
図３２のフローを用いて説明する。この２つの処理それ
ぞれを並列に行なう。第２の文字ブロック幅拡張部２８
４１ではステップ３１０１において、各文字ブロックが
どの座標でいくつ重なっているかを表す縦方向の文字ブ
ロック分布を作成する。図３３に図６（ａ）の表に対す
る縦方向の文字ブロック分布３３１を示す。なお、図３
３には横方向の文字ブロック分布３３２も合わせて示
す。ここでは、第１の文字ブロック拡張部２８３の結果
に対して処理を行なっている。次にステップ３１０２で
変数ｉを０にリセットする。ステップ３１０３では、縦
方向の文字ブロック分布ＨｉｓｔＷの値がｉ、すなわち
０に変化する、あるいは０から０より大きい他の値へ変
化する部分を見つけ、他の文字ブロックをまたがらない
ように各文字ブロックの幅を拡張する。ただし、このと
き次の２つのルールを設定して、拡張を行なう。ルール１：他の値からｉに変化した時は、右方向への
拡張ルール２：ｉからｉより大きい他の値に変化する時
は、左方向への拡張この処理をｉ＜Ｎである間続ける。文字ブロックの幅の
拡張が終了した時点での文字ブロックの様子を図３４
（ａ）に示す。

【００４５】なお、第２の文字ブロック高拡張部２８４
２については、図３２のステップ３２０１〜３２０３に
おいて、横方向の文字ブロック分布を作成し、高さの拡
張を上述の幅の拡張と同様な処理によって行なう。な
お、ステップ３２０３での拡張のルールは、ルール１：他の値からｉに変化した時は、下方向への
拡張ルール２：ｉからｉより大きい他の値に変化する時
は、上方向への拡張である。図３４（ｂ）に高さの拡張が終了した時の文字
ブロックの様子を示す。

【００４６】文字ブロック統合部２８４３では、第２の
文字ブロック幅拡張部２８４１と第２の文字ブロック高
拡張部２８４２の結果を入力とし、それぞれの幅、高さ
を合わせて最終的に各文字ブロックの縁が揃った状態の
文字ブロックを得る。この処理は、それぞれの結果を調
べて対応する文字ブロックの幅は第２の文字ブロック幅
拡張部２８４１の処理結果を、高さは第２の文字ブロッ
ク高拡張部２８４２の処理結果を用いて、各文字ブロッ
クの大きさを変更する。図６（ａ）の表についての文字
ブロック統合処理の結果を図３５に示す。また、図３６
に内容に省略のある表についての、第２の文字ブロック
拡張部２８４の処理結果を示す。図３６（ｂ）に見られ
るように、内容に省略のある部分（斜線）で文字ブロッ
クが重複する。

【００４７】文字ブロック正規化部２８５では、上記の
第２の文字ブロック拡張部２８４で拡張された文字ブロ
ックを、それを構成する上下左右の境界線の位置情報か
ら、全ての文字ブロックの位置、幅、高さを正規化す
る。この処理は、図２８に示すように文字ブロック幅正
規化部２８５１と文字ブロック高正規化部２８５２とか
ら構成されている。ここでは、図３７を用いて文字ブロ
ック幅正規化部２８５１について説明する。まず、全て
の枠を調べ、右端のＸ座標を求め配列ＢＸＲに記憶する
（ステップ３７０１）。このとき、重複するＸ座標は配
列ＢＸＲに記憶しない。また、左側のＸ座標についても
同様に配列ＢＸＬに記憶する（ステップ３７０２）。こ
のとき、配列ＢＸＲの最初の要素ＢＸＲ［１］には−１
の値を入れ他の座標値とは区別をし、実際の座標値は配
列ＢＸＲの２番目の要素ＢＸＲ［２］から記憶する。次
に、この２つの配列ＢＸＬ，ＢＸＲを昇順にソートする
（ステップ３７０３）。次に、再度全ての文字ブロック
の左端のＸ座標を調べ、その値が対応する配列ＢＸＬの
要素番号（配列の添字が該当する）を文字ブロック正規
化表３８１のＸの欄に登録する（ステップ３７０４）。
たとえば、図３６において、枠Ｎｏ．Ｗ１の左座標は配
列ＢＸＬの２番目の要素に対応するので、文字ブロック
正規化表３８１の枠Ｎｏ．Ｗ１のＸの欄に２を登録す
る。次に、全ての文字ブロックの右端のＸ座標を調べ、
その値の対応する配列ＢＸＲの要素番号から、先に登録
した文字ブロック正規化表３８１の対応する枠のＸの欄
の値を引いた値を文字ブロック正規化表３８１のＷ
（幅）の欄に登録する（ステップ３７０５）。たとえ
ば、図３６において、枠Ｎｏ．Ｗ１の右座標は配列ＢＸ
Ｒの３番目の要素に対応するので、文字ブロック正規化
表３８１の枠Ｎｏ．Ｗ１のＷ（幅）の欄に２を登録す
る。文字ブロック高正規化部２８５２は、文字ブロック
幅正規化部２８５１がＸ座標について行っていることを
Ｙ座標について同様に行うことで実現することができ
る。図３６についての文字ブロック正規化表３８１を図
３８に示す。

【００４８】文字ブロック補間部２８６では、文字ブロ
ック正規化部２８５で求めた文字ブロック正規化表３８
１をもとに、文字ブロックの重複を調べる。この処理の
手順を図３９のフローを用いて説明する。まず、変数ｉ
とｊに初期値０，１をそれぞれ記憶する（ステップ３９
０１）。ｉ番目とｊ番目の文字ブロックを比較し、文字
ブロック正規化表３８１において重複する部分があるか
調べる（ステップ３９０２）。このとき重複する部分が
あれば、重複部分に対応する仮想的な文字ブロックを文
字ブロック正規化表３８１に登録する（ステップ３９０
３）。次に、ｉ番目とｊ番目の文字ブロックから重複す
る部分を削除して、文字ブロック正規化表３８１に登録
し直す（ステップ３９０４）。以上の処理を全ての文字
ブロックに対して行なう。以上のように処理した図３８
の文字ブロック正規化表３８１を図４０（ａ）に、また
実際の表に対応付けた様子を図４０（ｂ）に示す。以上
の処理により、省略されている内容部分に仮想的な文字
ブロックを生成することができる。

【００４９】行抽出部２８７と列抽出部２８８では、文
字ブロック正規化部２８５によって正規化され、文字ブ
ロック補間部２８６で補間された文字ブロックの位置関
係を調べることにより行と列の関係を抽出する。文字ブ
ロック正規化表３８１からも解るように、全ての文字ブ
ロックは一意に決定できる２次元座標として表されてい
る。したがって、この文字ブロック正規化表３８１の値
を調べることで、正確に各行、各列を抽出することが可
能である。たとえば、文字ブロック正規化表３８１のＹ
の欄に３の値を持つ文字ブロックは１つの行であるとす
ることができる。行抽出部２８７の処理フローを図４１
に、列抽出部２８８の処理フローを図４２に示す。

【００５０】行抽出部２８７では、まず各文字ブロック
を文字ブロック正規化表３８１におけるＹ座標によって
昇順に並べかえる（ステップ４１０１）。次にｉ番目の
文字ブロックＢｉを取り出し（最初はｉ＝０にリセッ
ト）、行に登録されていない文字ブロックの中で文字ブ
ロックＢｉの存在する縦方向の範囲、すなわち文字ブロ
ックＢｉの文字ブロック正規化表３８１におけるＹ座標
から高さＨの範囲内に存在する文字ブロックを１つの行
として登録する（ステップ４１０２）。この処理を、未
登録の文字ブロックがなくなるまで繰り返す。

【００５１】また、同様にして列抽出部２８８は、各文
字ブロックを文字ブロック正規化表３８１におけるＸ座
標によって昇順に並べかえる（ステップ４２０１）。次
にｉ番目の文字ブロックＢｉを取り出し（最初はｉ＝０
にリセット）、列に登録されていない文字ブロックの中
で文字ブロックＢｉの存在する横方向の範囲、すなわち
文字ブロックＢｉの文字ブロック正規化表３８１におけ
るＸ座標から幅Ｗの範囲内に存在する文字ブロックを１
つの列として登録する（ステップ４２０２）。この処理
を、未登録の文字ブロックがなくなるまで繰り返す。さ
らに、行あるいは列に分割のある場合には、複数の行あ
るいは列が抽出されなくなるまで、各行、列に対して、
繰り返し行抽出、列抽出の処理を行なうことで、行、列
を抽出することができる。図３６（ａ）の表に対して行
抽出した結果を図４３（ａ）に、列抽出の結果を図４３
（ｂ）に示す。

【００５２】以上のように、第４の実施例は、文字ブロ
ックをその縁を揃えるように拡張し、位置、大きさを正
規化することによって、内容に省略のある表であって
も、表中の行と列の構造を正確に抽出することができ
る。

【００５３】なお、図４４に本発明の実施例（第２の実
施例）による実験結果の一例を示す。図４４（ａ）は原
画像であり、図２（ｅ）に示したような縦の罫線が省略
された型の表である。図４４（ｂ）は（ａ）の原画像に
対して処理した結果である。表の１つ１つの欄が認識で
きていることが分かる。なお、文字部分については、文
字認識処理を行っている。少しではあるが文字認識の誤
りが含まれている。

【００５４】

【発明の効果】本発明（請求項１、２）によれば、表を
構成する文字ブロックを拡張し、文字ブロック間にある
ギャップを埋めることにより表を認識するので、表の罫
線が大幅に省略されているような表に関してもその構造
を認識することができ、しかも文字ブロック間の位置ず
れが大きくても正確な認識を行うことができる。

【００５５】本発明（請求項３）によれば、文字ブロッ
クの拡張に罫線の情報を利用するので、より正確に表の
構造を抽出することができる。例えば、分割された列の
見出し部分のように複数の分割列にまたがる文字ブロッ
クがある表（図２０（ａ））であっても正確に表の構造
を得ることができる（図２０（ｃ））。

【００５６】本発明（請求項４）によれば、表の罫線で
形成される矩形を表の構造を把握するために利用するの
で、複雑な構成の表であってもその構造を正確に抽出す
ることができる。

【００５７】本発明（請求項５）によれば、文字ブロッ
クをその縁を揃えるように拡張し、位置、大きさを正規
化するので、内容に省略のある表であっても、表中の行
と列の構造を正確に抽出することができる。

【図面の簡単な説明】

【図１】本発明の第１の実施例の構成を示す図

【図２】文書中で使用される表の例を示す図

【図３】文字の画素塊を説明するための図

【図４】文字ブロック抽出部のフロー（一部）を示す図

【図５】文字ブロック抽出部のフロー（図４の続き）を
示す図

【図６】（ａ）および（ｂ）は文字ブロック抽出の結果
の一例を説明するための図

【図７】（ａ）および（ｂ）は文字ブロック抽出の結果
の他の例を説明するための図

【図８】文字ブロック拡張部の処理フロー図

【図９】文字ブロック分布を説明するための図

【図１０】（ａ）および（ｂ）は文字ブロックの横方向
の拡張を説明するたの図

【図１１】文字ブロックの拡張の結果を示す図

【図１２】行抽出部の処理フロー図

【図１３】列抽出部の処理フロー図

【図１４】（ａ）は行を抽出した結果、（ｂ）は列を抽
出した結果を説明するための図

【図１５】本発明の第２の実施例の構成を示す図

【図１６】第１の文字ブロック拡張部の処理フロー（一
部）を示す図

【図１７】第１の文字ブロック拡張部の処理フロー（図
１６の続き）を示す図

【図１８】（ａ）および（ｂ）は第１の文字ブロック拡
張部の処理結果の一例を説明するための図

【図１９】（ａ）および（ｂ）は第１の文字ブロック拡
張部の処理結果の他の例を説明するための図

【図２０】（ａ）、（ｂ）および（ｃ）は文字ブロック
拡張の結果を説明するための図

【図２１】本発明の第３の実施例の構成を示す図

【図２２】矩形枠抽出部の処理フロー（一部）を示す図

【図２３】矩形枠抽出部の処理フロー（図２２の続き）
を示す図

【図２４】（ａ）および（ｂ）は矩形枠構成表を説明す
るための図

【図２５】構成枠抽出部の処理フロー図

【図２６】（ａ）および（ｂ）は構成枠の例を説明する
ための図

【図２７】（ａ）および（ｂ）は第３の実施例の構成に
より行と列の構造を抽出した結果を示す図

【図２８】本発明の第４の実施例の構成を示す図

【図２９】第１の文字ブロック高拡張部による上下方向
に文字ブロックを拡張する処理のフロー図

【図３０】第１の文字ブロック幅拡張部による上下方向
に文字ブロックを拡張する処理のフロー図

【図３１】第２の文字ブロック幅拡張部の処理のフロー
図

【図３２】第２の文字ブロック高拡張部の処理のフロー
図

【図３３】図６（ａ）の表に対する縦方向および横方向
の文字ブロック分布を示す図

【図３４】（ａ）は文字ブロックの幅の拡張結果、
（ｂ）は文字ブロックの高さの拡張結果を示す図

【図３５】文字ブロック統合部により統合結果を示す図

【図３６】（ａ）は内容に省略のある表の例、（ｂ）は
（ａ）の表に対する文字ブロック統合部による統合結果
を示す図

【図３７】文字ブロック正規化部の処理のフローを示す
図

【図３８】文字ブロック正規化表を示す図

【図３９】文字ブロック補間部の処理のフローを示す図

【図４０】（ａ）は文字ブロック補間部の処理の結果で
きる文字ブロック正規化表を示し、（ｂ）は文字ブロッ
ク補間部の処理の結果を説明するための図

【図４１】行抽出部の処理のフローを示す図

【図４２】列抽出部の処理のフローを示す図

【図４３】（ａ）は行抽出の結果、（ｂ）は列抽出の結
果を説明するための図

【図４４】（ａ）は表の原画像、（ｂ）は原画像に対し
て処理した結果を示す図

【符号の説明】

１１，１５１，２１１，２８１…文字／罫線分離部、１
２，１５２，２１２，２８２…文字ブロック抽出部、１
３，１５３，２１５…文字ブロック拡張部、１５３１，
２１５１，…第１の文字ブロック拡張部、１５３２，２
１５２…第２の文字ブロック拡張部、１４，１５４，２
１６、２８７…行抽出部、１５，１５５，２１７、２８
８…列抽出部、２１４…構成枠抽出部、２８３１…第１
の文字ブロック幅拡張部、２８３２…第１の文字ブロッ
ク高拡張部、、２８４１…第２の文字ブロック幅拡張
部、２８４２…第２の文字ブロック高拡張部、２８４３
…文字ブロック統合部、２８５…文字ブロック正規化
部、２８５１…文字ブロック幅正規化部、２８５２…文
字ブロック高正規化部、２８６…文字ブロック補間部

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成５年１１月２２日

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】００１９

【補正方法】変更

【補正内容】

【００１９】文字ブロック抽出部２では、上記文字／
罫線分離部１１によって得られる文字画像について、１
つの画素塊を含む矩形領域を求め、これを１つの文字と
推定して、文字間の距離によって接近している１つ以上
の文字をまとめて文字ブロックとして統合する。日本語
は図３に示すように複数の画素塊から構成されているこ
とが多いため、単純に１つの画素塊を１つの文字に対応
させることは本来の意味としては間違っているが、図３
（ａ）のようにこれらの画素塊は非常に接近しているた
めに、本実施例では問題にならない。そのため、ここで
は特別な処理は行なわない。ただし、図３（ｂ）のよう
に２つの画素塊がその矩形領域において、重複する部分
がある時にはこの２つの画素塊を統合してあらたに矩形
領域を設定することとする。なお、より正確に１つづつ
の文字を求める必要がある時には、特開平２−２６７６
７８号公報記載の技術を使用することができる。

Claims

【特許請求の範囲】

【請求項１】文字と罫線が混在している表画像を認識
する表認識装置において、表画像中の文字と罫線を分離する文字／罫線分離手段
と、前記文字／罫線分離手段によって分離された文字画像か
ら文字ブロックを抽出する文字ブロック抽出手段と、前記文字ブロック抽出手段によって抽出された各文字ブ
ロックを相互の位置関係から各文字ブロックの縁を揃え
るように拡張する文字ブロック拡張手段と、を有するこ
とを特徴とする表認識装置。
【請求項２】請求項１記載の表認識装置において、前記文字ブロック拡張手段により拡張された文字ブロッ
ク間の位置関係により行を抽出する行抽出手段と、前記文字ブロック拡張手段により拡張された文字ブロッ
ク間の位置関係により列を抽出する列抽出手段と、を設
けたことを特徴とする表認識装置。
【請求項３】文字と罫線が混在している表画像を認識
する表認識装置において、表画像中の文字と罫線を分離する文字／罫線分離手段
と、前記文字／罫線分離手段によって分離された文字画像か
ら文字ブロックを抽出する文字ブロック抽出手段と、前記文字／罫線分離手段によって分離された罫線画像と
前記文字ブロック抽出手段によって抽出された各文字ブ
ロックとから文字ブロックをその他の文字ブロックと重
複しないように、最も近い罫線まで拡張する第１の文字
ブロック拡張手段と、前記第１の文字ブロック拡張手段によって拡張された各
文字ブロックを相互の位置関係から各文字ブロックの縁
を揃えるように拡張する第２の文字ブロック拡張手段
と、前記第２の文字ブロック拡張手段により拡張された文字
ブロック間の位置関係により行を抽出する行抽出手段
と、前記第２の文字ブロック拡張手段により拡張された文字
ブロック間の位置関係により列を抽出する列抽出手段
と、を設けたことを特徴とする表認識装置。
【請求項４】文字と罫線が混在している表画像を認識
する表認識装置において、表画像中の文字と罫線を分離する文字／罫線分離手段
と、前記文字／罫線分離手段によって分離された文字画像か
ら文字ブロックを抽出する文字ブロック抽出手段と、前記文字／罫線分離手段によって分離された罫線画像か
ら罫線により構成される矩形を抽出する矩形枠抽出手段
と、前記矩形枠抽出手段により抽出した矩形枠と文字ブロッ
ク抽出手段によって抽出された各文字ブロックとの包含
関係により文字ブロックを１つ以下含む矩形枠を表を構
成する枠として抽出する構成枠抽出手段と、前記構成枠抽出手段によって抽出された構成枠に含まれ
ない文字ブロックと前記文字／罫線分離手段により分離
された罫線画像とから対象とする文字ブロックをその他
の文字ブロックと重複しないように、最も近い罫線まで
拡張する第１の文字ブロック拡張手段と、前記第１の文字ブロック拡張手段によって拡張された各
文字ブロックを相互の位置関係から各文字ブロックの縁
を揃えるように拡張する第２の文字ブロック拡張手段
と、前記第２の文字ブロック拡張手段により拡張された文字
ブロックと前記構成枠抽出手段により抽出された構成枠
との間の位置関係により行を抽出する行抽出手段と、前記第２の文字ブロック拡張手段により拡張された文字
ブロックと前記構成枠抽出手段により抽出された構成枠
との間の位置関係により列を抽出する列抽出手段とを有
することを特徴とする表認識装置。
【請求項５】文字と罫線が混在している表画像を認識す
る表認識装置において、表画像中の文字と罫線を分離する文字／罫線分離手段
と、前記文字／罫線分離手段によって分離された文字画像か
ら文字ブロックを抽出する文字ブロック抽出手段と、前記文字／罫線分離手段により分離された罫線画像と文
字ブロック抽出手段によって抽出された各文字ブロック
とから文字ブロックをその他の文字ブロックと重複しな
いように、最も近い罫線まで拡張する第１の文字ブロッ
ク拡張手段と、前記第１の文字ブロック拡張手段によって拡張された各
文字ブロックを相互の位置関係から各文字ブロックの縁
を揃えるように拡張する第２の文字ブロック拡張手段
と、前記第２の文字ブロック拡張手段により拡張された文字
ブロックの位置関係により文字ブロックを正規化する文
字ブロック正規化手段と、前記文字ブロック正規化手段により正規化された各文字
ブロックの重複している矩形を検出しその矩形を仮想的
な文字ブロックとみなす文字ブロック補間手段と、前記文字ブロック補間手段により補間された文字ブロッ
ク間の位置関係により行を抽出する行抽出手段と、前記文字ブロック補間手段により補間された文字ブロッ
ク間の位置関係により列を抽出する列抽出手段とを有す
ることを特徴とする表認識装置。