JPH09288714A - 表認識方法および装置 - Google Patents

表認識方法および装置

Info

Publication number
JPH09288714A
JPH09288714A JP8122709A JP12270996A JPH09288714A JP H09288714 A JPH09288714 A JP H09288714A JP 8122709 A JP8122709 A JP 8122709A JP 12270996 A JP12270996 A JP 12270996A JP H09288714 A JPH09288714 A JP H09288714A
Authority
JP
Japan
Prior art keywords
area
ruled line
image data
recognition
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8122709A
Other languages
English (en)
Inventor
Hideko Murata
英子 村田
Takuya Okamoto
卓哉 岡本
Masanori Kato
雅則 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8122709A priority Critical patent/JPH09288714A/ja
Publication of JPH09288714A publication Critical patent/JPH09288714A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 (修正有) 【課題】テキスト、図、および表で構成され、読み込ん
だ方向に記述されているページと90度回転した方向で
記述されているページとが混在する文書画像に対して、
表内に書かれている文字を正しく認識する。 【解決手段】領域分割で抽出された表が読み込んだ方向
かあるいは90度回転した方向かを判定する際、以下の
通り、文書中に占める表領域の位置または大きさに関す
る情報に基づいて判定する。(1)表領域の座標位置が
文書中の上下または左右であるかを判定する。(2)表
領域と同文書内に存在する別の表領域または表領域以外
の他の領域との位置関係を調べ、上下または左右に並ん
でいるかを判定する。(3)表を形成する罫線の部分的
な欠落を検出し、欠落罫線の位置が表の外枠の上下また
は左右であるかを判定する。(4)表領域内の罫線で区
切られた所定領域内の文字要素を抽出し、文字要素に対
して方向別に文字認識を行い、その文字認識結果の評価
を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキスト、図、お
よび表などが混在している文書をイメージスキャナなど
で読み込んだ画像データにおいて、画像データ内の文字
や表の座標位置など表を構成する情報を抽出する文書認
識システムに関し、特に、記述される方向がページ毎に
異なる表などが存在する文書を認識するのに有効な表認
識方法に関する。
【0002】
【従来の技術】一般的な文書では、データの見易さや比
較のし易さなどの理由で、テキスト、図、および表など
が混在して用いられる。このような文書において、文書
内に存在する表を抽出する方法として、それぞれテキス
ト、図、および表の領域分割を行った後、表の構造解析
を行う方法がある。例えば、「表認識方式」(特願平07
-149497号)では、文書中の縦方向あるいは横方向に長
い黒ランを抽出することにより罫線の候補を求め、その
候補のうち、それぞれが互いに接続する場合に罫線とし
て抽出する方法が開示されている。
【0003】テキスト、図、および表の領域分割処理方
法としては、「空白の構造に基づく文書画像の領域分
割」(電子情報通信学会技術研究報告,Vol.94 NO.44
4,PRU94-101,1995.1)などに開示された方法がある。
これは、文書中の白画素だけを含む矩形を抽出し、その
矩形が領域分割にどれくらい有効であるかを評価し、有
効であるとみなされた矩形に囲まれる黒画素を抽出する
ことにより領域分割を行うものである。具体的には、ま
ず、文書中の白画素だけを含む矩形のうち、外枠の面積
と幅と高さがそれぞれ一定以上のものを抽出する。抽出
された矩形内において、水平方向の白ランの左右の端
が、文書の端に位置するかあるいは黒画素の連結成分の
外接矩形に接している場合、その白ランは水平の有効な
白ランとする。同様に、垂直方向の白ランの上下の端に
ついても求め、垂直の有効な白ランとする。さらに、水
平に有効な白ランと垂直に有効な白ランが重なった白画
素を有効な白画素とし、その有効な白画素の面積が一定
以上のものを有効白矩形とする。この有効白矩形に囲ま
れた黒画素を抽出することにより領域分割を行う。
【0004】また、表の構造解析の方法としては、「文
字ブロックの並びを考慮した表構造の認識」(電子情報
通信学会春季大会1993, D-410)などがある。これは、
表内の1つの項目であると判断された文字列を抽出し、
その文字列の矩形領域をその矩形領域を囲む上下左右の
方向に最も近い罫線まで拡張することにより表を形成す
るセルの領域を抽出し、表の構造を解析するものであ
る。
【0005】
【発明が解決しようとする課題】イメージスキャナなど
の入力装置を用いて読み込んだ画像データに書かれてい
る文字を認識し、コードデータとして再利用する場合、
テキスト部分はもちろん、表など罫線で囲まれた領域
(以下、「セル」という)も認識の対象としなければな
らない場合もある。表は、表内の項目数や項目内の文字
列数などの文字の記入状態により、表示する向きが画像
データを読み込んだ方向(以下、「縦方向」という)で
あったり、読み込んだ方向に対して90度回転した方向
(以下、「横方向」という)であったり、データによっ
て様々な種類が存在する。これらの種類の表が混在する
文書においては、予め方向を定めておくことができな
い。従って、これらの表や図などを含んだ文書から表の
領域と表の構造を抽出し、セル内の文字を認識するに
は、まず、この表が縦方向か横方向かを判定する必要が
ある。しかし、上記従来の技術では、所定の一方向に記
述されている文書だけを対象としているため、表の方向
を判定する必要がある文書には適用できないという問題
があった。
【0006】本発明は、上述の従来例における問題点に
鑑み、テキスト、図、および表などが混在している文書
において、その表が縦方向や横方向の表である場合で
も、その方向を自動的に判定して表認識を行なうことが
できる表認識方法および装置を提供することを目的とす
る。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に係る発明は、テキストや図や表が混在し
ている文書の画像データに対して、テキスト領域、図形
領域、および表領域の抽出や、テキスト領域の文字認
識、表領域の構造解析および文字認識を行う文書認識シ
ステムにおける表認識方法であって、前記画像データか
ら黒画素の集まりにより形成された罫線を抽出するステ
ップと、抽出された罫線から表の外枠を表す罫線を抽出
することにより表領域を求めるステップと、抽出された
表が所定の方向である第1の方向かあるいはこれを90
度回転した第2の方向であるかを、文書中に占める該表
領域の位置に関する情報または大きさに関する情報に基
づいて、判定するステップとを備えたことを特徴とす
る。第1の方向と第2の方向は相対的な概念である。例
えば、画像データを読み込んだ方向を第1の方向とし、
それを90度回転した方向を第2の方向とすればよい。
【0008】請求項2に係る発明は、請求項1におい
て、前記求めた表領域の座標位置が文書中の上端あるい
は下端であるか、または左端あるいは右端であるかを判
定することにより、求めた表領域が前記第1の方向かま
たは前記第2の方向かを判定することを特徴とする。
【0009】請求項3に係る発明は、請求項1におい
て、前記求めた表領域と同文書内に存在する別の表領域
または表領域以外の他の領域との位置関係を調べ、上下
に並んでいるか、または左右に並んでいるかを判定する
ことにより、求めた表領域が前記第1の方向かまたは前
記第2の方向かを判定することを特徴とする。
【0010】請求項4に係る発明は、請求項1におい
て、前記求めた表領域の表を形成する罫線の部分的な欠
落を検出し、該欠落罫線の位置が表の外枠の上あるいは
下であるか、または該欠落罫線の位置が表の外枠の左あ
るいは右であるかを判定することにより、求めた表領域
が前記第1の方向かまたは前記第2の方向かを判定する
ことを特徴とする。
【0011】請求項5に係る発明は、請求項1におい
て、前記求めた表領域内の罫線で区切られた所定領域内
の文字要素を抽出し、該文字要素に対して前記第1の方
向と前記第2の方向のそれぞれの方向に対して文字認識
を行い、その文字認識結果の評価により、求めた表領域
が前記第1の方向かまたは前記第2の方向かを判定する
ことを特徴とする。
【0012】請求項6に係る発明は、テキストや図や表
が混在している文書の画像データに対して、テキスト領
域、図形領域、および表領域の抽出や、テキスト領域の
文字認識、表領域の構造解析および文字認識を行う文書
認識システムで用いる表認識装置であって、前記画像デ
ータから黒画素の集まりにより形成された罫線を抽出す
る手段と、抽出された罫線から表の外枠を表す罫線を抽
出することにより表領域を求める手段と、抽出された表
が所定の方向である第1の方向かあるいはこれを90度
回転した第2の方向であるかを、文書中に占める該表領
域の位置に関する情報または大きさに関する情報に基づ
いて判定する手段とを備えたことを特徴とする。
【0013】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を説明する。
【0014】図1は、本発明の一実施形態である文書認
識システムにおける処理の流れを説明するための図であ
る。100は、テキスト、図、および表などが混在した
複数ページからなる画像データを示す。文書認識システ
ム101は、画像データ入力制御部105により画像デ
ータ100を読み込み、認識制御部106で、テキスト
領域、表領域、および図形領域などに領域分割し、領域
毎に後述する各処理を行い、その処理の結果を表認識結
果102、図形データ103、文字認識結果104とし
て画像データ出力制御部109から出力する。文書認識
システム101は、具体的には、コンピュータ(画像デ
ータを入力するスキャナなどの入力装置や認識結果を出
力する出力装置などを含むものとする)とソフトウェア
から構成されている。
【0015】認識制御部106は、画像データ100中
に存在するテキスト、表、および図などに対して領域分
割処理107を行い、その領域分割した個々の領域毎に
所定の処理を行うものである。領域分割処理107は、
画像データ100上の黒画素の連結成分(黒画素が連続
している部分)を抽出し、類似した大きさの連結成分が
並ぶ領域を検出することによりテキスト領域を特定する
とともに、罫線で囲まれた領域を抽出することにより表
領域を特定し、さらに文字とも表とも判定されない連結
成分を図形領域として特定する。領域分割処理107
は、そのように画像データ100を、テキスト領域、表
領域および図形領域にそれぞれ領域分割する。
【0016】領域分割処理107により分割されたテキ
スト領域に対しては、行抽出、文字の切り出し、および
文字認識などの文字認識処理108を行う。そして、文
字認識処理108の結果を、画像データ出力制御部10
9を用いて文字認識結果104として出力する。図形領
域に対しては圧縮などの画像処理110を行い、その画
像処理110の結果を、画像データ出力制御部109を
用いて図形データ103として出力する。また、表領域
に対しては、表内の罫線を検出することにより表の構造
を解析し、抽出された表が画像データを読み込んだ方向
かあるいは読み込んだ画像データを90度回転した方向
かを判定するなどの表認識処理111を行う。そして、
画像データ出力制御部109を用いて、表の位置やサイ
ズ、表内の罫線の本数や位置などを表認識結果102と
して出力する。表内に存在する文字は、文字認識処理1
08と同様の処理を行い、文字認識結果104として出
力する。
【0017】図2および図3に、表が含まれている画像
データ100の例を示す。図2に示した表は、画像デー
タ入力制御部105で読み込み、傾きを補正した画像デ
ータ100である。図2に示した表は、画像データを読
み込んだ方向である所定方向(以下、「縦方向」とい
う)に記載された表である。一方、図3に示した表は、
読み込んだ画像データ100に対して傾き補正を行った
ものであるが、画像データを読み込んだ方向に対して9
0度回転した方向(以下、「横方向」という)の表であ
る。ここで説明する例では、用紙の長手方向に画像を読
み込むようにしているので、「縦方向」は用紙の長手方
向になっているが、「縦方向」と「横方向」は相対的な
概念であり、必ずしも用紙の長手方向を「縦方向」とし
なくてもよい。画像データを読み込んだ方向を縦とし、
それを90度回転した方向を横と見ればよい。
【0018】図2および図3において、画像データ20
0、画像データ202、画像データ300、および画像
データ302は、テキストと表が混在している文書の例
である。画像データ201および画像データ301は、
表だけが記載されている文書の例である。画像データ2
03および画像データ303は、1ページ中に複数の表
が存在する文書の例である。画像データ204、画像デ
ータ205、および画像データ206、並びに、画像デ
ータ304、画像データ305、および画像データ30
6は、1つの表が複数ページにまたがって記載されてい
る文書の例である。また、これらの表内には、文字が書
かれている。
【0019】次に、図4を用いて、図1の文書認識シス
テム101により、文書中に存在する表を抽出し、その
表の構造などを認識する表解析処理について説明する。
【0020】処理 400:画像データ入力制御部10
5は、テキスト、図、および表などが混在している画像
データ100をイメージスキャナなどの入力装置を用い
て読み込み、読み込んだ画像データ100の傾きを補正
する。傾きの補正に関しては、画像データ100中に存
在する罫線を抽出して傾きを求め、その傾きに応じて画
像データを回転させることにより補正する方法などがあ
る。
【0021】処理 401:領域分割処理107におい
て、処理400によって読み込まれた画像データ100
に対し、表の外枠を構成する罫線を抽出し、表領域を求
める。表領域の検出処理は、図5で詳細に説明する。
【0022】処理 402:表認識処理111におい
て、処理401により求めた表領域内の罫線を抽出する
ことにより表の構造を求める。また、抽出された表が縦
方向かあるいは横方向かを判定する。表認識処理に関し
ては、図6を用いて詳細に説明する。
【0023】処理 403:処理402によって求めた
表の座標位置や大きさ、表内の罫線の数およびその座標
値、さらに、表の方向などの解析結果を、画像データ出
力制御部109によりプリンタなどを用いて表認識結果
102として出力する。
【0024】以上が表を解析する処理の流れである。次
に、この表解析処理における表領域の抽出処理(処理4
01)について、図5を用いて詳細に説明する。
【0025】図5は、画像データ100中に記載されて
いる表領域を抽出する処理の流れを示した図である。表
の外枠を形成する罫線は、一般的に、その表の上部およ
び下部に存在する横罫線、および左部および右部に存在
する縦罫線の計4直線で構成される。したがって、この
ような表領域はそれらの罫線を抽出することによって求
めることが可能となる。
【0026】処理 500:処理400で読み込まれた
画像データ100において、画像データ100上に存在
する黒ランのうち、縦あるいは横に細長く、ある一定の
長さ以上の黒ランを抽出し、縦長の黒ランを縦罫線とし
て、横長の黒ランを横罫線として求める。ここで求めた
縦罫線および横罫線は、表の外枠を形成する罫線や表の
構造を示す罫線であり、以下の処理に用いられる。
【0027】処理 501:処理500において求めた
縦罫線および横罫線において、縦罫線の端点と横罫線の
端点が接している箇所を求め、表の外枠を形成する4角
を検出し、表領域を求める。
【0028】縦罫線の場合、縦罫線の始点あるいは終点
と横罫線の始点あるいは終点とが接している横罫線を抽
出し、接している箇所を表領域を形成する外枠の角とす
る。画像データ100を読み込んだ際に傾きなどが生
じ、傾き補正などにより表の外枠罫線であるにもかかわ
らず、縦罫線と横罫線とが接していない可能性があるの
で、縦罫線の始点あるいは終点と横罫線の始点あるいは
終点との距離がしきい値α(αは所定の値)以下の場
合、この横罫線は縦罫線に接しているものとみなす。
【0029】横罫線の場合、横罫線の始点あるいは終点
と縦罫線の始点あるいは終点とが接している縦罫線を抽
出し、接している箇所を表領域を形成する外枠の角とす
る。縦罫線の場合と同様に、しきい値α以下の距離に縦
罫線が存在する場合、これらが接しているものとする。
【0030】表の外枠を形成する4角は、上述の縦罫線
と横罫線の接続箇所を4ヶ所検出することにより求め
る。具体的には、画像データ100の左上を原点とし
て、罫線の2端点の座標値が小さい方を始点、他方を終
点とした場合、縦罫線Aの始点と始点が接している横罫
線Bを検出し、接している箇所を表領域を形成する左上
の角とする。抽出された横罫線Bの終点と始点が接して
いる縦罫線Cを検出し、接している箇所を表領域を形成
する右上の角とする。同様に、縦罫線Cの終点と終点
が、縦罫線Aの終点と始点が接している横罫線Dを抽出
し、縦罫線Aと横罫線Dの接している箇所を左下の角と
し、縦罫線Cと横罫線Dの接している箇所を右下の角と
する。このようにして表の外枠を形成する4角を求め、
これらに囲まれた領域を表領域とする。
【0031】なお、画像データの入力時に傾きなどが生
じて、縦罫線と横罫線の端点の距離がしきい値α以上の
場合や、表の外枠を示す罫線が元々存在しない場合、外
枠4罫線と4角を抽出できないことがある。ここでは、
外枠4罫線と4角が抽出できない場合でも、縦罫線の端
点と横罫線の端点とが一ヶ所でも接している部分があれ
ば、その縦罫線と同じ高さでその横罫線と同じ幅の領域
は表領域とみなして、処理502に進むものとする。外
枠を示す罫線が全く検出できなかった場合は、処理50
4に進む。
【0032】処理 502:処理501で抽出された表
領域において、その領域が複数存在する場合、表内の構
造を示す罫線が、誤って外枠罫線として抽出された可能
性がある。そこで、処理502では表領域の重複チェッ
クを行う。まず、抽出された表領域のすべてに対して、
表領域を囲む矩形領域の4角の座標値を検出する。そし
て、その4角内に別の表領域が存在するか否かを検出す
る。例えば、第1の表領域の4角内に別の第2の表領域
が検出された場合、第1の表領域が第2の表領域を含む
ということだから、第2の表領域として抽出された縦罫
線および横罫線は、第1の表領域内の表の構造を示す罫
線とみなせる。そこで、この場合は、第1の表領域を残
し、第2の表領域については表領域として特定しない。
【0033】処理 503:1つの画像データに1つの
表が存在する場合、その表内に書かれた文字は、表の構
造を示す罫線に囲まれた領域(セル)内に存在する。し
かし、画像データ205のように表が複数ページにまた
がって存在する場合、セルが前ページから続いており、
さらに次ページへと続き、各ページ毎に見るとページ内
の表の外枠が罫線で閉じてない場合がある。このような
表の場合、処理502で抽出された表領域と平行でかつ
同じ幅あるいは同じ高さの罫線を抽出し、処理502で
抽出された表領域をここで抽出した罫線まで拡大する必
要がある。処理503では、その処理を行う。例えば、
画像データ205の場合、処理502で抽出された表領
域は207になる。しかし、この表は前ページ204か
ら続いているため、処理503では、表領域207と縦
方向に平行である罫線208もこの表領域に含まれるも
のとみなし、表領域を罫線208を含む領域に拡大す
る。
【0034】処理 504:処理503と同様に、セル
が前ページから続いており、あるいは次ページへと続く
場合、そのページにおける表の外枠を表す罫線が、処理
501では全く検出できないことがある。このような場
合、処理500で検出した縦罫線および横罫線を用い
て、平行する罫線を抽出することにより表の外枠を求め
る。ただし、平行する罫線が3本以上存在する場合は、
セルを区切る罫線も含まれているとみなせるので、平行
する2つの罫線で囲まれた領域が最大のものを表領域と
し、その2つの罫線を表の外枠を形成する罫線とする。
例えば、画像データ305の場合、処理502では表領
域を抽出できないので、処理502から処理504に進
む。そして、処理504では、画像データ305中の平
行する罫線を抽出し、平行する2つの罫線で囲まれた領
域が最大のものを表領域とする。
【0035】以上説明した処理により、表領域を検出す
る。次に、表のセル構造と表の方向を求める処理(処理
402)について、図6を用いて説明する。
【0036】処理 600:ここでは、処理503およ
び処理504で抽出された表領域内におけるセルの構造
を求める。セルは一般的に罫線で区切られている場合が
多いため、その罫線を抽出することによりセルを抽出す
る。セルの抽出は、例えば「表認識方式」(特願平07-1
49497号)などに開示されている方法を用いて行う。こ
こでは、表の外枠に接している罫線を抽出し、さらに抽
出された罫線または外枠に接している別の罫線を抽出す
る。この処理を繰り返し行い、罫線で区切られた領域を
求め、セルの領域とする。
【0037】処理 601:処理600で求めた表が縦
方向の表かあるいは横方向の表かを判定する。表の縦横
判定処理については、図7で詳細に説明する。
【0038】図7を用いて、処理401で抽出された表
が縦方向の表かあるいは横方向の表かを判定する処理6
01の流れを詳細に説明する。
【0039】処理 700:画像データ204や画像デ
ータ304などのように1つの表が複数ページにまたが
って記載されている場合、表を形成する外枠の4罫線の
全てが存在するとは限らない場合もある。例えば、縦方
向の画像データ204は、次のページにつながっている
ために、下端部分209の横罫線が欠落している。ま
た、次ページの画像データ205の上端部分210は、
前ページからの続きであるため、横罫線が欠落してい
る。一方、横方向の表が記載された画像データ304
は、次ページに続いているため、右端部分307の縦罫
線が欠落している。また、次ページの画像データ305
は、左端部分308が前ページからの続きであるため、
縦罫線が欠落している。このように、抽出された表領域
の外枠を示す罫線を検出すると同時に、欠落している罫
線を見つけることにより、上横罫線あるいは下横罫線が
欠落してる場合は縦方向の表であり、左縦罫線あるいは
右縦罫線が欠落している場合は横方向の表であると判定
することができる。処理700ではこのような判定を行
う。欠落罫線の抽出方法は、図8を用いて詳細に説明す
る。表の外枠の4罫線が全て抽出されたら(すなわち外
枠に欠落罫線がなかったとき)、処理701に進む。処
理700で欠落罫線が検出され、縦方向の表と判定され
たら処理704へ、横方向の表と判定されたら処理70
5へ、それぞれ進む。この処理700により、図2
(c)や図3(c)に示した表の方向が判定できる。
【0040】処理 701:処理700で表の方向が判
定されなかった画像データに対して、表領域の位置判定
を行う。
【0041】画像データ中に複数の表が存在している画
像データ203のような場合、処理401の領域分割で
抽出される表領域は、ページ幅一杯に記述されており、
上下の位置に現れる。また、画像データ303のような
場合、処理401の領域分割で抽出される表領域は、ペ
ージ高さ一杯に記述されており、左右の位置に現れる。
そこで、処理401で抽出された表領域が複数存在する
場合、この領域がページ幅一杯に記述されて、上下に並
んでいれば縦方向と判定し、処理704に進む。また、
この領域がページ高さ一杯に記述されて、左右に並んで
いれば横方向と判定し、処理705に進む。画像データ
中に表が1つしか存在ない場合や、上下あるいは左右の
位置関係が判定できない場合は、処理702に進む。以
上の処理701により、図2(b)や図3(b)に示し
た表の方向が判定できる。
【0042】なお、処理701では複数の表領域の位置
関係が上下あるいは左右になることに基づいてその表の
方向を判定しているが、さらに領域分割処理107によ
りテキスト領域、図形領域、および表領域を求めた際、
表領域と他の領域(テキスト領域や図形領域)の位置関
係に対しても同様に上下あるいは左右の位置判定を施す
ことにより、抽出された表の方向を判定することが可能
となる。例えば、図2(a)の画像データ201ではテ
キスト領域が上にあって表領域が下にあるので表の方向
を縦方向と判定できる。また、図3(a)の画像データ
301ではテキスト領域が左にあって表領域が右にある
ので表の方向を横方向と判定できる。
【0043】処理 702:処理401により抽出され
た表領域において、その表領域が画像データ100中の
どの位置に記載されているかにより、表の方向を判定す
る。表の座標位置判定については、図9で詳しく説明す
る。表の座標位置判定で表の方向が縦方向と判定された
場合、処理704に進む。また、横方向と判定された場
合、処理705に進む。ここで判定できなかった場合
は、処理703に進む。以上の処理702により、図2
(a)の画像データ200や図3(a)の画像データ3
00の表の方向が判定できる。
【0044】処理 703:処理700から処理702
までの判定処理で、表の方向が判定できなかった表領域
に対して、文字認識を用いて方向を判定する。ここで縦
方向と判定された場合、処理704に進む。また、横方
向と判定された場合、処理705に進む。双方とも判定
不可能の場合は、エラーとして処理を終了する。文字認
識による判定については、図11で詳細に説明する。以
上の処理703により、図2(a)の画像データ20
1,202や図3(a)の画像データ301,302の
表の方向が判定できる。
【0045】処理 704:処理700から処理703
において縦方向と判定された表に対して、判定結果を画
像データ出力制御部109を用いて表認識結果102と
して出力する。
【0046】処理 705:処理704と同様に、横方
向と判定された表に対して、判定結果を画像データ出力
制御部109を用いて表認識結果102として出力す
る。
【0047】次に、図8を用いて欠落罫線の抽出方法を
説明する。本図は、画像データ204のように、1つの
表が複数ページにまたがっており、次ページにつながる
箇所800の罫線が欠落している表を示している。この
ような画像データ801に対して、処理401により表
領域を抽出し、抽出された表領域の外接矩形付近に罫線
が存在するか否かをチェックする。抽出された表領域の
外接矩形を構成する4辺の線分を中心に所定の幅802
内を罫線検出箇所803(図の斜線部分)とし、この罫
線検出箇所803内に存在する罫線を検出する。本図の
場合、表の外枠下部分800においては、罫線が存在し
ないため抽出不可能となり、この表は下横罫線が存在し
ない表として判定される。
【0048】図9と図10を用いて、画像データ中で表
領域が占める位置によりその表が縦方向かあるいは横方
向かを判定する処理について説明する。ただし、読み込
んだ画像データ中の表が縦方向の場合、ページ幅一杯に
記述されているものとし、横方向の場合、ページの高さ
一杯に記述されているものとする。
【0049】処理 900:処理401で抽出された表
領域において、当該表領域の左端および右端に存在する
外枠の線分が所定の範囲内に存在するか否かをチェック
する。
【0050】図10に示した画像データ1000は、処
理400で読み込まれた画像データ100の一例であ
る。画像データ中には、上下左右の縁に余白が存在する
ので、読み込んだ画像データ1000中の上マージン1
001、下マージン1002、右マージン1003、お
よび左マージン1004を考慮する。これらの余白に囲
まれた領域内において、左端から所定の幅1005を持
つ外枠罫線左抽出箇所1006と右端から所定の幅10
05と同じ長さの幅1007を持つ外枠罫線右抽出箇所
1008を設定する。抽出された表1009の外枠左端
の線分1010が外枠罫線左抽出箇所1006内に存在
し、かつ、抽出された表1009の外枠右端の線分10
11が外枠罫線右抽出箇所1008に存在するか否かを
チェックする。
【0051】処理 901:処理900と同様に、処理
401で抽出された表領域において、当該表領域の上端
および下端に存在する外枠の線分が所定の範囲内に存在
するか否かをチェックする。
【0052】図10に示した画像データ1012は、処
理400で読み込まれた画像データ100の一例であ
る。処理900と同様に、上下左右の縁である余白を除
いた領域において、上端から所定の高さ1013を持つ
外枠罫線上抽出箇所1014と下端から所定の高さ10
13と同じ長さの高さ1015を持つ外枠罫線下抽出箇
所1016を設定する。抽出された表1017の外枠上
端の線分1018が外枠罫線上抽出箇所1014内に存
在し、かつ、抽出された表1017の外枠下端の線分1
019が外枠罫線下抽出箇所1016に存在するか否か
をチェックする。
【0053】処理 902:処理900および処理90
1のチェック結果を用いて、表領域の方向判定を行う。
処理900において、外枠罫線左抽出箇所1006およ
び外枠罫線右抽出箇所1008に表の外枠の左右端の線
分が存在することが検出された場合には、抽出された表
は縦方向であると判定する。また、処理901におい
て、外枠罫線上抽出箇所1014および外枠罫線下抽出
箇所1016に表の外枠の上下端の線分が存在すること
が検出された場合には、抽出された表は横方向であると
判定する。
【0054】なお、図10の画像データ1020のよう
に、処理900および処理901の双方で表領域の外枠
が存在すると判定されるような場合もある。このような
処理900および処理901の双方で表領域の外枠が存
在すると判定された場合や、双方とも表領域の外枠が存
在しないと判定された場合は、方向の判定が不可能とす
る。
【0055】図11を用いて、文字認識判定処理の流れ
について説明する。処理700から処理702の判定処
理を行っても、抽出された表が縦方向か横方向か判定で
きない場合がある。例えば、表の外枠罫線がすべて存在
し、画像データ全面に表領域が記載されている画像デー
タでは、表を構成する外枠罫線の欠落箇所や、表領域の
位置などから方向を判定することは難しい。具体的に
は、画像データ全面に表が存在する画像データ201や
画像データ301、画像データの端の方に表が存在する
画像データ202や画像データ302などである。そこ
で、表内に存在する文字を縦方向および横方向の双方に
関して文字認識を行い、認識結果の良好な方をその表の
方向であると判定する。
【0056】処理 1100:画像データ100に対し
て処理600で検出した表内の全セルについてセル内の
文字が書かれている領域の面積を求めることにより、文
字認識を行うセルを決定する。具体的なセルの決定方法
は、まず、セル内において連結成分(黒ランの集まり)
を抽出し、その外接矩形の面積の合計を求める。すべて
のセルについてこれらの処理を行い、面積が最大のセル
を求め、そのセルを文字認識判定用セルと決定する。例
えば図12に示す表1200の場合、黒画素が占める面
積が最大になるセルは1201であるから、このセル1
201を文字認識判定用セルとする。
【0057】処理 1101:処理1100で求めた文
字認識判定用セル1201内において、文字認識処理を
行う。この文字認識処理は、この表が縦方向であるとし
て文字認識を行うものである。セル内の連結成分を抽出
し、行抽出、文字切り出しなどを行い文字を認識する方
法としては、例えば「文字認識方法」(特開平05-25051
8号)に開示されている方法を用いる。
【0058】処理 1102:横方向に向いた表の文字
認識判定用セル内の文字を認識するため、画像データ1
00を時計廻りに90度回転する。図12の表1202
は、表1200を90度回転した表である。文字認識判
定用セル1201は、画像データを90度回転すると1
203の位置になる。
【0059】処理 1103:処理1101と同様に、
処理1102で求めた文字認識判定用セル1203内に
おいて、文字認識処理を行う。この文字認識処理は、こ
の表が横方向であるとして文字認識を行うものである。
【0060】処理 1104:処理1101および処理
1103で文字認識した結果、文字の認識率が良い方を
表の方向とする。認識率が処理1101の方が良い場
合、表は縦方向であり、また、処理1103の方が良い
場合、横方向であるとする。ここでは、文字認識を行っ
た結果の認識率を用いて表の方向を判定したが、単語処
理で評価する方法を用いてもよい。この方法は、文字認
識結果の文字列から単語を抽出し、より多く単語が抽出
された方向をその表の方向と判定するものである。
【0061】
【発明の効果】以上述べたように、本発明によれば、テ
キスト、図、および表などが混在している文書から表を
抽出し、その表が読み込んだ所定の方向(第1の方向)
であるか、あるいは画像データを90度回転した方向
(第2の方向)であるかを容易に判定することが可能と
なる。したがって、ページ内に1つの表領域と図形やテ
キストなどの他の領域が存在する場合、ページ内に複数
の表領域が存在する場合、および複数頁にまたがって表
が存在する場合などに、その表の方向を正しく判定する
ことが可能になる。
【図面の簡単な説明】
【図1】本発明に係る文書認識の流れを示す図
【図2】縦方向の表の例を示す図
【図3】横方向の表の例を示す図
【図4】表解析処理の流れを示す図
【図5】表領域の検出処理の流れを示す図
【図6】表認識処理の流れを示す図
【図7】表の縦横方向検出処理の流れを示す図
【図8】表の外枠罫線の検出範囲を示す図
【図9】表の座標位置による判定処理の流れを示す図
【図10】表の外枠判定の方式を示す図
【図11】文字認識判定処理の流れを示す図
【図12】90度回転した表内のセルの位置を示す図
【符号の説明】
100:画像データ、101:文書認識システム、10
2:表認識結果のデータ、103:図形データ、10
4:文字認識結果のデータ、105:画像データ入力制
御部、106:認識制御部、109:画像データ出力制
御部、205:複数ページにまたがって表示されている
表の一部で、上下の横罫線が存在しない表、305:複
数ページにまたがって表示されている横方向の表の一部
で、表の左右の縦罫線が存在しない表、1201:縦方
向の表内に存在する文字認識の対象となるセル領域、1
203:横方向の表内に存在する文字認識の対象となる
セル領域。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】テキストや図や表が混在している文書の画
    像データに対して、テキスト領域、図形領域、および表
    領域の抽出や、テキスト領域の文字認識、表領域の構造
    解析および文字認識を行う文書認識システムにおける表
    認識方法であって、 前記画像データから黒画素の集まりにより形成された罫
    線を抽出するステップと、 抽出された罫線から表の外枠を表す罫線を抽出すること
    により表領域を求めるステップと、 抽出された表が所定の方向である第1の方向かあるいは
    これを90度回転した第2の方向であるかを、文書中に
    占める該表領域の位置に関する情報または大きさに関す
    る情報に基づいて、判定するステップとを備えたことを
    特徴とする表認識方法。
  2. 【請求項2】前記請求項1において、前記第1の方向か
    第2の方向かを判定するステップは、前記求めた表領域
    の座標位置が文書中の上端あるいは下端であるか、また
    は左端あるいは右端であるかを判定することにより、求
    めた表領域が前記第1の方向かまたは前記第2の方向か
    を判定することを特徴とする表認識方法。
  3. 【請求項3】前記請求項1において、前記第1の方向か
    第2の方向かを判定するステップは、前記求めた表領域
    と同文書内に存在する別の表領域または表領域以外の他
    の領域との位置関係を調べ、上下に並んでいるか、また
    は左右に並んでいるかを判定することにより、求めた表
    領域が前記第1の方向かまたは前記第2の方向かを判定
    することを特徴とする表認識方法。
  4. 【請求項4】前記請求項1において、前記第1の方向か
    第2の方向かを判定するステップは、前記求めた表領域
    の表を形成する罫線の部分的な欠落を検出し、該欠落罫
    線の位置が表の外枠の上あるいは下であるか、または該
    欠落罫線の位置が表の外枠の左あるいは右であるかを判
    定することにより、求めた表領域が前記第1の方向かま
    たは前記第2の方向かを判定することを特徴とする表認
    識方法。
  5. 【請求項5】前記請求項1において、前記第1の方向か
    第2の方向かを判定するステップは、前記求めた表領域
    内の罫線で区切られた所定領域内の文字要素を抽出し、
    該文字要素に対して前記第1の方向と前記第2の方向の
    それぞれの方向に対して文字認識を行い、その文字認識
    結果の評価により、求めた表領域が前記第1の方向かま
    たは前記第2の方向かを判定することを特徴とする表認
    識方法。
  6. 【請求項6】テキストや図や表が混在している文書の画
    像データに対して、テキスト領域、図形領域、および表
    領域の抽出や、テキスト領域の文字認識、表領域の構造
    解析および文字認識を行う文書認識システムで用いる表
    認識装置であって、 前記画像データから黒画素の集まりにより形成された罫
    線を抽出する手段と、 抽出された罫線から表の外枠を表す罫線を抽出すること
    により表領域を求める手段と、 抽出された表が所定の方向である第1の方向かあるいは
    これを90度回転した第2の方向であるかを、文書中に
    占める該表領域の位置に関する情報または大きさに関す
    る情報に基づいて判定する手段とを備えたことを特徴と
    する表認識装置。
JP8122709A 1996-04-19 1996-04-19 表認識方法および装置 Pending JPH09288714A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8122709A JPH09288714A (ja) 1996-04-19 1996-04-19 表認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8122709A JPH09288714A (ja) 1996-04-19 1996-04-19 表認識方法および装置

Publications (1)

Publication Number Publication Date
JPH09288714A true JPH09288714A (ja) 1997-11-04

Family

ID=14842675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8122709A Pending JPH09288714A (ja) 1996-04-19 1996-04-19 表認識方法および装置

Country Status (1)

Country Link
JP (1) JPH09288714A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020827A (ja) * 2007-07-13 2009-01-29 Sharp Corp 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
US20150161462A1 (en) * 2013-12-11 2015-06-11 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and non-transitory computer readable medium
CN112651331A (zh) * 2020-12-24 2021-04-13 万兴科技集团股份有限公司 文本表格提取方法、系统、计算机设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020827A (ja) * 2007-07-13 2009-01-29 Sharp Corp 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
US20150161462A1 (en) * 2013-12-11 2015-06-11 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and non-transitory computer readable medium
US9400926B2 (en) 2013-12-11 2016-07-26 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and non-transitory computer readable medium
CN112651331A (zh) * 2020-12-24 2021-04-13 万兴科技集团股份有限公司 文本表格提取方法、系统、计算机设备及存储介质
CN112651331B (zh) * 2020-12-24 2024-04-16 万兴科技集团股份有限公司 文本表格提取方法、系统、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
JP3278471B2 (ja) 領域分割方法
US6377704B1 (en) Method for inset detection in document layout analysis
JP3576570B2 (ja) 比較方法
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US8989485B2 (en) Detecting a junction in a text line of CJK characters
JPH09288714A (ja) 表認識方法および装置
JPH0410087A (ja) 基本ライン抽出方法
JP2007164719A (ja) 行方向判定プログラム、方法及び装置
JPH08329187A (ja) 文書読取装置
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP3187895B2 (ja) 文字領域抽出方法
JPH0728935A (ja) 文書画像処理装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3133797B2 (ja) 文字認識方法及びその装置
JP3019897B2 (ja) 行切出し方法
JPH117493A (ja) 文字認識処理装置
JPH0728934A (ja) 文書画像処理装置
JP3190794B2 (ja) 文字切り出し装置
JPH07160810A (ja) 文字認識装置
JPH0830725A (ja) 画像処理装置及び方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2003317107A (ja) 罫線抽出方法及び装置
JPH04276885A (ja) 文字切出し装置
Amano et al. Character string detection algorithm using horizontal boundaries, and its application to a part number entry system