JPH04360294A - 表認識装置および表認識方法 - Google Patents

表認識装置および表認識方法

Info

Publication number
JPH04360294A
JPH04360294A JP3136195A JP13619591A JPH04360294A JP H04360294 A JPH04360294 A JP H04360294A JP 3136195 A JP3136195 A JP 3136195A JP 13619591 A JP13619591 A JP 13619591A JP H04360294 A JPH04360294 A JP H04360294A
Authority
JP
Japan
Prior art keywords
character
rectangle
circumscribed
circumscribed rectangle
creating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3136195A
Other languages
English (en)
Inventor
Yujiro Kamimura
上村 裕二郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3136195A priority Critical patent/JPH04360294A/ja
Publication of JPH04360294A publication Critical patent/JPH04360294A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、印刷された表を読み取
り、表構造および、セル内の文字を認識する表認識装置
および方法に関する。
【0002】
【従来の技術】近年、表認識装置がコンピュータなどの
入力装置として利用されるようになってきた。文書の清
書システムとして表認識装置の利用を考慮すると、罫線
位置,線種,線幅、およびセル内の文字を認識する必要
がある。
【0003】以下に従来の表認識装置を構成する機能ブ
ロックを列挙する。図6は従来の表認識装置の機能ブロ
ック図であり、11はキーボード,マウス等の指示によ
り、表認識を行う命令を発行する認識指令部、12は入
力された画像データを格納する画像メモリ、13は画像
メモリの縦,横2方向の黒画素のヒストグラムをとるヒ
ストグラム抽出部、14は抽出されたヒストグラムにお
いて、しきい値よりも高い部分の画像データを局所的に
見ることにより罫線を抽出し、セルに分解する表構造抽
出部、15はサンプル文字を記憶する文字パターン辞書
、16は各セル内の文字をサンプル文字と比較し、前も
って決めた値よりも近い類似度ならば、その文字として
出力する文字認識部、17は認識した表の情報を出力す
る表出力部である。
【0004】
【発明が解決しようとする課題】しかしながら上記従来
の機能ブロックの構成では、ヒストグラムの特徴を用い
るため、文字部分と、破線や点線部分の区別が明確にで
きない。したがって、表の構造を認識する場合、文字を
構成する線分を、誤って罫線と認識してしまうという問
題点があった。
【0005】本発明は上記問題点を解決するもので、正
確な表構造を認識する表認識装置および方法を提供する
ことを目的とする。
【0006】
【課題を解決するための手段】本発明は上記目的を達成
するために、連結黒画素の外接矩形リストを作成する黒
画素ラベリング部、外接矩形の辺の長さから矩形内が文
字であると推定する文字矩形推定部、文字矩形内の黒画
素を除いて縮小画像を作成する縮小画像作成部、および
縮小画像における連結白画素の外接矩形リストを作成す
る白画素ラベリング部を備える。
【0007】
【作用】本発明は上記した構成により、表が破線や点線
で構成されている場合や、線に途切れがある場合でも、
縮小率を適当に決めることにより、縮小画像では線の途
切れがなくなる。この縮小画像の連結白画素の外接矩形
を抽出し、しきい値よりも大きなものを選ぶことにより
、表のセルが抽出でき、正確な構造認識が可能となる。
【0008】
【実施例】図1は本発明の一実施例における表認識装置
の機能ブロック図を示すものである。図において21は
キーボード,マウス等の指示により、表認識を行う命令
を発行する認識指令部、22は入力された画像データを
格納する画像メモリ、23は連結黒画素の外接矩形リス
トを作成する手段である黒画素ラベリング部、24は外
接矩形の辺の長さから矩形内が文字であると推定する手
段である文字矩形推定部、25は文字矩形内の黒画素を
除いて縮小画像を作成する手段である縮小画像作成部、
26は縮小画像における連結白画素の外接矩形リストを
作成する手段である白画素ラベリング部、27は白画素
の外接矩形の内、しきい値よりも大きいものを選び、表
のセルとして抽出する手段である表構造抽出部、28は
セル内の文字を切り出す文字切り出し部、29はサンプ
ル文字を記憶する文字パターン辞書、30は各セル内の
文字をサンプル文字と比較し、前もって決めた値よりも
近い類似度ならば、その文字として出力する文字認識部
、31は認識した表の情報を出力する表出力部である。
【0009】図2は本実施例の表認識装置の構成を示す
ブロック図である。図2において41は表画像を読み取
るスキャナで、読み取った表画像をイメージデータとし
て出力する。42はRAMで、スキャナ41からのイメ
ージデータを記憶する画像領域43、連結画素の外接矩
形リストを格納する外接矩形リスト領域44、イメージ
データの縮小画像を格納する縮小画像領域45、表認識
の結果得られる表の構造、セル内の文字を格納する表デ
ータ領域46を有する。47はROMで、文字認識に使
用する辞書を記憶した特徴辞書領域48およびプログラ
ム記憶領域49を有する。50はプログラム記憶領域4
9に記憶された制御プログラムに従って処理を行う処理
回路である。51は認識指令を行うキーボードであり、
52は表データ領域46に記憶された表を表示する表示
部である。
【0010】以上のような構成ブロックの本実施例の表
認識装置について以下その動作を図3のフローチャート
を用いて説明する。
【0011】ステップs1では、スキャナから画像を入
力し、メモリに格納する(図5(a))。ステップs2
では、入力した画像の傾きを補正する。ステップs3で
は、傾きを補正した画像の連結黒画素の外接矩形を作成
する。ステップs4では、外接矩形の面積の最頻値を求
める。ただし、このとき、破線,点線等の要素を除くた
めに、矩形の短辺がしきい値以下のものは、計算に入れ
ない。ステップs5では、ステップs4で求めた最頻値
との比が、しきい値の範囲に入っている外接矩形を検索
する(図5(b))。ステップs6では、縮小画像を作
成する(図5(c))。
【0012】このステップの詳細は後述する。ステップ
s7では、ステップs6で得られた縮小画像の連結白画
素の外接矩形を作成する。ステップs8では、ステップ
s7で得られた外接矩形の内、しきい値よりも大きいも
のを選び出し、表のセルとする(図5(d))。ステッ
プs9では、ステップs8で抽出されたすべてのセル内
の文字認識が終了したかどうかを調べ、終了するまでス
テップs10のセル内文字認識を繰り返す。ステップs
11では、得られた表構造を出力する。
【0013】次に図4のフローチャートを用いてステッ
プs6の詳細について説明する。ステップs61では、
縮小画像の1ドットラインに相当するイメージデータの
領域(例えば1/5に縮小する場合は、イメージデータ
5ライン)をワーク領域にコピーする。ステップs62
では、ステップs61でコピーした領域とステップs5
で抽出された矩形とが重なっている部分を探し、その内
部を白画素で満たす。ステップs63では、縮小画像の
1ドットに相当するイメージの中(例えば1/5に縮小
する場合は、5*5の正方形の内部)がすべて白画素な
らば0、それ以外は1として、縮小画像領域に書き込む
。ステップs64では、すべてのラインに対して、処理
が終了したかどうかを調べ、終了していなければステッ
プs61以下の処理を繰り返す。
【0014】以上のように本発明の実施例の表認識装置
によれば、黒画素ラベリング部,文字矩形推定部,縮小
画像作成部、および白画素ラベリング部を設けることに
よって、正確に表の構造を認識することができる。
【0015】
【発明の効果】以上の実施例から明らかなように、本発
明によれば、連結黒画素の外接矩形リストを作成する黒
画素ラベリング部、外接矩形の辺の長さから矩形内が文
字であると推定する文字矩形推定部、文字矩形内の黒画
素を除いて縮小画像を作成する縮小画像作成部、および
縮小画像における連結白画素の外接矩形リストを作成す
る白画素ラベリング部を設けてあるので表の構造を正確
に認識することができる表認識装置および方法を提供で
きる。
【図面の簡単な説明】
【図1】本発明の一実施例における表認識装置の機能ブ
ロック図
【図2】本実施例の表認識装置の構成を示すブロック図
【図3】本実施例における制御手順を示すフローチャー
【図4】本実施例における制御手順を示すフローチャー
【図5】本発明の認識動作を説明するための画像図
【図
6】従来の文字認識装置における表認識装置の機能ブロ
ック図
【符号の説明】
23  黒画素ラベリング部 24  文字矩形推定部 25  縮小画像作成部 26  白画素ラベリング部 27  表構造抽出部 41  スキャナ 42  RAM 47  ROM 48  特徴辞書領域 49  プログラム記憶領域 50  処理回路 51  キーボード 52  表示部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】与えられた入力図形を走査して得られた原
    図形情報に基づいて、表の構造を認識する表認識装置に
    おいて、連結黒画素の外接矩形リストを作成する手段と
    、外接矩形の辺の長さから矩形内が文字であると推定す
    る手段と、文字であると推定された矩形内の黒画素を除
    いた部分の縮小画像を作成する手段と、縮小画像の連結
    白画素の外接矩形リストを作成する手段と、抽出された
    白画素外接矩形リストの内、あらかじめ定めた大きさよ
    りも大きいものを表のセルとして抽出する手段を備えた
    表認識装置。
  2. 【請求項2】表画像を読み取るスキャナ手段と、書き込
    み読み出し可能な第1メモリ手段と、文字辞書およびプ
    ログラムを格納してある第2メモリ手段と、前記プログ
    ラムを実行する処理手段と、認識指令のためのキーボー
    ド手段と、表示手段とを備え、前記スキャナから画像を
    入力し前記第1メモリ手段に格納するステップと、前記
    入力画像の傾きを補正するステップと、前記補正画像の
    連結黒画素の第1外接矩形を作成するステップと、前記
    第1外接矩形の面積の最頻値を求めるステップと、前記
    最頻値との比がしきい値内に入っている。第1外接矩形
    を検索するステップと、前記第1外接矩形の縮小画像を
    作成するステップと、前記縮小画像の連結白画素の第2
    外接矩形を作成するステップと、前記第2外接矩形の中
    からしきい値より大なるものを選び表のセルとするステ
    ップと、抽出されたすべてのセル内の文字認識が終了し
    たかを調べ終了するまでセル内文字認識を繰り返すステ
    ップと、得られた表構造を出力するステップを含む表認
    識方法。
JP3136195A 1991-06-07 1991-06-07 表認識装置および表認識方法 Pending JPH04360294A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3136195A JPH04360294A (ja) 1991-06-07 1991-06-07 表認識装置および表認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3136195A JPH04360294A (ja) 1991-06-07 1991-06-07 表認識装置および表認識方法

Publications (1)

Publication Number Publication Date
JPH04360294A true JPH04360294A (ja) 1992-12-14

Family

ID=15169566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3136195A Pending JPH04360294A (ja) 1991-06-07 1991-06-07 表認識装置および表認識方法

Country Status (1)

Country Link
JP (1) JPH04360294A (ja)

Similar Documents

Publication Publication Date Title
JP3052438B2 (ja) 表認識装置
JPH04360294A (ja) 表認識装置および表認識方法
JP2957729B2 (ja) 行方向判定装置
JP3060248B2 (ja) 表認識装置
JP2788506B2 (ja) 文字認識装置
JPH0573721A (ja) 表認識装置
JP2703559B2 (ja) 文字認識支援装置
JPH0728935A (ja) 文書画像処理装置
JP3502130B2 (ja) 表認識装置および表認識方法
JP2867531B2 (ja) 文字サイズ認識装置
JPH0830725A (ja) 画像処理装置及び方法
JP3045086B2 (ja) 光学式文字読取方法および装置
JP2957707B2 (ja) 行方向判定装置
JP2957774B2 (ja) 行方向判定装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2957740B2 (ja) 行方向判定装置
JPH0728934A (ja) 文書画像処理装置
JPH04158487A (ja) 表認識装置
JPH04123282A (ja) 表認識装置
JPH08185475A (ja) 画像認識装置
JP2000187704A (ja) 文字認識装置及びその方法及び記憶媒体
JPH06195505A (ja) 表認識装置
JPH06337960A (ja) 表認識装置
JPH04156694A (ja) 文字認識方式
JPH04330584A (ja) 行方向判定装置