JPH07129723A - 表認識装置および表認識方法 - Google Patents

表認識装置および表認識方法

Info

Publication number
JPH07129723A
JPH07129723A JP5273458A JP27345893A JPH07129723A JP H07129723 A JPH07129723 A JP H07129723A JP 5273458 A JP5273458 A JP 5273458A JP 27345893 A JP27345893 A JP 27345893A JP H07129723 A JPH07129723 A JP H07129723A
Authority
JP
Japan
Prior art keywords
cell
extracted
oblique line
diagonal line
diagonal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5273458A
Other languages
English (en)
Other versions
JP3502130B2 (ja
Inventor
Yujiro Kamimura
裕二郎 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP27345893A priority Critical patent/JP3502130B2/ja
Publication of JPH07129723A publication Critical patent/JPH07129723A/ja
Application granted granted Critical
Publication of JP3502130B2 publication Critical patent/JP3502130B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 セルの対角線上に斜め線が存在する表画像を
正確に認識することができる表認識装置を提供すること
である。 【構成】 斜め線抽出部6、斜め線出力部7および斜め
線消去部8が設けられる。斜め線抽出部6は、画像メモ
リ2内の画像データにおいて、セル抽出部5により抽出
されたセルの対角線上に黒画素が連続して存在するかど
うかを調べて斜め線を抽出する。斜め線出力部7は斜め
線抽出部6により抽出された斜め線を出力する。斜め線
消去部8は、画像メモリ2内の画像データにおいて、斜
め線抽出部6により抽出された斜め線を消去する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像データにおいて表
構造およびセル内の文字を認識する表認識装置および表
認識方法に関するものである。
【0002】
【従来の技術】近年、表認識装置がコンピュータ等の入
力装置として利用されるようになってきた。文書の清書
システムとして表認識装置の利用を考慮すると、罫線位
置、線種、線巾およびセル内の文字を認識する必要があ
る。
【0003】以下に従来の表認識装置について説明す
る。図5は従来の表認識装置の機能構成を示すブロック
図である。
【0004】画像入力部51は、スキャナー等の画像入
力器から表画像を読み取り、それを2値の画像データに
変換する。画像メモリ52は、画像入力部51から与え
られる画像データを格納する。実線ラン抽出部53は、
画像メモリ52内の画像データを走査して一定長さ以上
の黒画素の並び(以下ランと呼ぶ)を抽出する。破線ラ
ン抽出部54は、画像メモリ52内の画像データを走査
して特定パターンのランを抽出する。表構造抽出部55
は、実線ラン抽出部53および破線ラン抽出部54によ
り抽出されたランの連結性を調べて罫線を抽出するとと
もに、抽出された罫線位置の相互関係を解析することに
より表内のセルを抽出する。
【0005】一方、文字パターン辞書56にはサンプル
文字が記憶される。文字認識部57においては、表構造
抽出部55により抽出されたセル内のデータが文字とし
て認識される。文字認識部57は、画像メモリ52内の
画像データにおいて、表構造抽出部55により抽出され
た各セル内の文字を文字パターン辞書56に記憶された
サンプル文字と比較し、類似度を算出する。そして、算
出された類似度が予め定められた値よりも高い場合に
は、そのサンプル文字をセル内の文字として出力する。
表出力部58は、表構造抽出部55により抽出された表
構造および文字認識部57により認識された文字の情報
を出力する。
【0006】
【発明が解決しようとする課題】しかしながら、上記の
従来の表認識装置では、図6に示すようにセルの対角線
上に斜め線が存在する表画像を認識する場合、斜め線は
特別な意味をもたず、文字コードとして出力されるとい
う問題点があった。
【0007】そこで、本発明の目的は、セルの対角線上
に斜め線が存在する表画像を認識する場合でも正確な表
構造認識およびセル内の文字認識を行なうことができる
表認識装置および表認識方法を提供することを目的とす
る。
【0008】
【課題を解決するための手段】本発明に係る表認識装置
は、画像データにおいて四方を罫線で囲まれた領域をセ
ルとして抽出するセル抽出手段と、セル抽出手段により
抽出されたセルの対角線上の画素を調べることにより斜
め線を抽出する斜め線抽出手段と、斜め線抽出手段によ
り抽出された斜め線を画像データから消去する斜め線消
去手段とを備える。
【0009】本発明に係る表認識方法は、画像データに
おいて四方を罫線で囲まれた領域をセルとして抽出する
ステップと、抽出されたセルの対角線上の画素を調べる
ことにより斜め線を抽出するステップと、斜め線抽出手
段により抽出された斜め線を画像データから消去するス
テップとを含む。
【0010】
【作用】本発明に係る表認識装置および表認識方法にお
いては、セルの対角線上に斜め線が存在する表画像を認
識する場合、画像データにおいて各セルの対角線上の斜
め線部分が抽出され、画像データから抽出された斜め線
が消去される。したがって、セルの対角線上の斜め線が
誤って文字コードとして出力されることがなくなり、か
つセルの対角線上の斜め線を表構造データとして抽出す
ることができる。
【0011】
【実施例】図1は、本発明の一実施例による表認識装置
の機能構成を示すブロック図である。
【0012】図1において、画像入力部1は、スキャナ
等の画像入力器から表画像を読み取り、それを2値の画
像データに変換する。画像メモリ2は、画像入力部1か
ら与えられる画像データを格納する。実線ラン抽出部3
は、画像メモリ2内の画像データを走査して一定長さ以
上の黒画素の並び(以下、ランと呼ぶ)を抽出する。破
線ラン抽出部4は、画像メモリ2内の画像データを走査
して特定パターンのランを抽出する。セル抽出部5は、
実線ラン抽出部3および破線ラン抽出部4により抽出さ
れたランの連結性を調べて罫線を抽出するとともに、抽
出された罫線で囲まれた矩形領域をセルとして抽出す
る。
【0013】斜め線抽出部6は、画像メモリ2内の画像
データにおいて、セル抽出部5により抽出されたセルの
対角線上に斜め線が存在するかどうかを調べ、斜め線を
抽出する。斜め線出力部7は、斜め線抽出部6により抽
出された斜め線を出力する。斜め線消去部8は、画像メ
モリ2内の画像データにおいて、斜め線抽出部6により
抽出された斜め線を消去する。
【0014】文字パターン辞書9にはサンプル文字が記
憶される。文字認識部10は、画像メモリ2内の画像デ
ータにおいて、セル抽出部5により抽出された各セル内
の文字を文字パターン辞書9内のサンプル文字と比較
し、類似度を算出する。そして、算出された類似度が予
め定めた値よりも高い場合に、そのサンプル文字をセル
内の文字として出力する。表出力部11は、セル抽出部
35により抽出された表構造、文字認識部10により認
識された文字、および斜め線出力部7により出力された
斜め線の情報を出力する。
【0015】図2は、この実施例の表認識装置のハード
ウエア構成を示すブロック図である。
【0016】この表認識装置は、スキャナ41、RAM
(ランダムアクセスメモリ)42、ROM(リードオン
リメモリ)46、処理回路49、キーボード50および
表示部51を含む。
【0017】スキャナ41は表画像を読み取り、読み取
った表画像を画像データ(イメージデータ)として出力
する。RAM42は、画像メモリ領域43、ラン領域4
4および表データ領域45を含む。画像メモリ領域43
にはスキャナ41から与えられる画像データが記憶され
る。ラン領域44には画像メモリ領域43内の画像デー
タの縦および横の2方向のランが格納される。表データ
領域45には表認識の結果として得られる表構造および
セル内の文字が格納される。
【0018】ROM46は特徴辞書領域47およびプロ
グラム記憶領域48を含む。特徴辞書領域47には文字
認識に使用する文字パターン辞書が記憶される。プログ
ラム領域48には制御プログラムが記憶される。処理回
路49は、プログラム記憶領域48に記憶された制御プ
ログラムに従って処理を行なう。キーボード50は認識
指令を行なうために用いられる。表示部51は表データ
領域45に記憶された表構造および文字を表示する。
【0019】図2の画像メモリ領域43は図1の画像メ
モリ2に対応し、図2の特徴辞書領域47は図1の文字
パターン辞書9に対応する。また、図2のプログラム記
憶領域48に記憶された制御プログラムおよび処理回路
49が、図1の画像入力部1、実線ラン抽出部3、破線
ラン抽出部4、セル抽出部5、斜め線抽出部6、斜め線
出力部7、斜め線消去部8、文字認識部10および表出
力部11を構成する。
【0020】次に、図3のフローチャートを参照しなが
ら図1および図2に示される表認識装置の動作を説明す
る。
【0021】ステップs1では、画像入力部1がスキャ
ナ41から画像データを入力し、入力された画像データ
を画像メモリ2(画像メモリ領域43)に格納する。ス
テップs2では、画像メモリ2内の画像データにおいて
画像の傾きが補正される。ステップs3では、ステップ
s2で傾き補正された画像データから、実線ラン抽出部
3が縦および横方向の一定長さ以上のランを抽出し、破
線ラン抽出部4が縦および横方向の特定パターンのラン
を抽出する。抽出されたランはラン領域44に格納され
る。
【0022】ステップs4では、セル抽出部5が、ステ
ップs3で抽出されたランのうち、途切れの長さが所定
のしきい値以内でかつ長さが所定のしきい値以上のラン
を選択する。ステップs5では、セル抽出部5が、ステ
ップs4で選択されたランを連結し、罫線を抽出する。
抽出された罫線は表データ領域45に格納される。ステ
ップs6では、さらにセル抽出部5が、画像メモリ2内
の画像データにおいてステップs5で抽出した罫線で囲
まれた矩形領域をセルとして抽出する。
【0023】ステップs7では、斜め線抽出部6が、画
像メモリ2内の画像データにおいてステップs6で抽出
されたすべてのセル内の斜め線を抽出するとともに、斜
め線消去部8が、画像メモリ2内の画像データから斜め
線部分の画像を消去する(このステップの詳細は後述す
る)。抽出された斜め線は表データ領域45に格納され
る。
【0024】ステップs8では、文字認識部10による
セル内の文字認識がすべて終了したかどうかを調べ、終
了した場合にはステップs10で表出力部11が表デー
タ領域45に格納された表構造および文字を出力して処
理を終了する。文字認識部10によるセル内の文字認識
がすべて終了していない場合は、ステップs9で文字認
識部10が文字認識を行なう。
【0025】次に、図4のフローチャートを用いて図3
のステップs7の斜め線抽出処理を詳細に説明する。
【0026】ステップs71では、未処理のセルがある
かどうかを調べ、未処理の処理がある場合にはステップ
s72に進み、未処理のセルがない場合には処理を終了
する。
【0027】ステップs72では、斜め線抽出部6が、
画像メモリ2内の画像データにおいてセルの左上角から
右下角の斜め方向の画素を走査し、黒画素の並びを調べ
る。この斜め方向の走査は、セルの左上角のアドレスお
よびセルの右下角のアドレスに基づいてセルの対角線上
のアドレスを算出することにより行なう。
【0028】ステップs73では、斜め線抽出部6は、
ステップs72で走査した黒画素の並びの途切れが所定
のしきい値以内であるかどうかを調べる。黒画素の並び
の途切れがしきい値以内であれば斜め線があると判断し
てステップs74に進み、黒画素の並びの途切れが所定
のしきい値より大きければステップs76に進む。
【0029】ステップs74では、斜め線出力部7が、
斜め線抽出部6により抽出された斜め線データを表デー
タ領域45に出力する。ステップs75では、斜め線消
去部8が、画像メモリ2内の画像データにおいてステッ
プs72で走査された画像部分を白画素で消去する。
【0030】ステップs76では、斜め線抽出部6が、
画像メモリ2内の画像データにおいてセルの右上角から
左下角の斜め方向の画素を走査し、黒画素の並びを調べ
る。ステップs77では、斜め線抽出部6は、ステップ
s76で走査した黒画素の並びの途切れが所定のしきい
値以内であるかどうかを調べる。黒画素の並びの途切れ
がしきい値以内であれば斜め線があると判断してステッ
プs78に進み、黒画素の並びの途切れがしきい値より
大きければステップs71に戻る。
【0031】ステップs78では、斜め線出力部7が、
斜め線抽出部6により抽出された斜め線データを表デー
タ領域45に出力する。ステップs79では、斜め線消
去部8が、画像メモリ2内の画像データにおいてステッ
プs76で走査された画像部分を白画素で消去する。
【0032】上記実施例によれば、画像データにおける
各セル内の斜め線が斜め線抽出部6により抽出され、斜
め線出力部7により出力されるとともに、斜め線消去部
8により画像データにおける各セル内の斜め線が消去さ
れるので、セル内に斜め線が存在する表画像について
も、表構造および各セル内の文字を正確に認識すること
ができる。
【0033】
【発明の効果】以上のように本発明によれば、画像デー
タにおいて各セル内の対角線上の斜め線が斜め線データ
として抽出され、かつ各セル内の斜め線が画像データか
ら消去されるので、各セルの対角線上に斜め線が存在す
る表画像についても表構造および各セル内の文字を正確
に認識することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における表認識装置の機能構
成を示すブロック図
【図2】本発明の一実施例における表認識装置のハード
ウエア構成を示すブロック図
【図3】本発明の一実施例における表認識装置の動作を
示すフローチャート
【図4】本発明の一実施例における表認識装置の斜め線
抽出処理のフローチャート
【図5】従来の表認識装置の機能構成を示すブロック図
【図6】セルの対角線上に斜め線が存在する表画像を示
す図
【符号の説明】
1 画像入力部 2 画像メモリ 3 実線ラン抽出部 4 破線ラン抽出部 5 セル抽出部 6 斜め線抽出部 7 斜め線出力部 8 斜め線消去部 9 文字パターン辞書 10 文字認識部 11 表出力部 41 スキャナ 42 RAM 43 画像メモリ領域 44 ラン領域 45 表データ領域 46 ROM 47 特徴辞書領域 48 プログラム記憶領域 49 処理回路 50 キーボード 51 表示部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】画像データにおいて四方を罫線で囲まれた
    領域をセルとして抽出するセル抽出手段と、 前記セル抽出手段により抽出されたセルの対角線上の画
    素を調べることにより斜め線を抽出する斜め線抽出手段
    と、 前記斜め線抽出手段により抽出された斜め線を前記画像
    データから消去する斜め線消去手段とを備えた、表認識
    装置。
  2. 【請求項2】画像データにおいて四方を罫線で囲まれた
    領域をセルとして抽出するステップと、 前記抽出されたセルの対角線上の画素を調べることによ
    り斜め線を抽出するステップと、 前記抽出された斜め線を前記画像データから消去するス
    テップとを含む、表認識方法。
JP27345893A 1993-11-01 1993-11-01 表認識装置および表認識方法 Expired - Fee Related JP3502130B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27345893A JP3502130B2 (ja) 1993-11-01 1993-11-01 表認識装置および表認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27345893A JP3502130B2 (ja) 1993-11-01 1993-11-01 表認識装置および表認識方法

Publications (2)

Publication Number Publication Date
JPH07129723A true JPH07129723A (ja) 1995-05-19
JP3502130B2 JP3502130B2 (ja) 2004-03-02

Family

ID=17528200

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27345893A Expired - Fee Related JP3502130B2 (ja) 1993-11-01 1993-11-01 表認識装置および表認識方法

Country Status (1)

Country Link
JP (1) JP3502130B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012038160A (ja) * 2010-08-09 2012-02-23 Fuji Xerox Co Ltd 画像判定装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012038160A (ja) * 2010-08-09 2012-02-23 Fuji Xerox Co Ltd 画像判定装置及びプログラム

Also Published As

Publication number Publication date
JP3502130B2 (ja) 2004-03-02

Similar Documents

Publication Publication Date Title
JPH03122773A (ja) 画像形成装置
JPH0721310A (ja) 文書認識装置
JP2000112599A (ja) 文書画像処理装置及び文書画像処理方法
JP3502130B2 (ja) 表認識装置および表認識方法
JP2796561B2 (ja) 表形式文書認識方式
JP3052438B2 (ja) 表認識装置
JP3060248B2 (ja) 表認識装置
JP2003317107A (ja) 罫線抽出方法及び装置
JPH06337960A (ja) 表認識装置
JPH06195505A (ja) 表認識装置
JP2908495B2 (ja) 文字画像抽出装置
JPH08185475A (ja) 画像認識装置
JPH05159100A (ja) 表認識装置
JPH06150056A (ja) 表認識装置
JPH0728934A (ja) 文書画像処理装置
JP2800205B2 (ja) 画像処理装置
JP2991761B2 (ja) 行切出し方法
JPH09128478A (ja) 画像処理装置
JPH0573721A (ja) 表認識装置
JPH04360294A (ja) 表認識装置および表認識方法
JP2954218B2 (ja) 画像処理方法及び装置
JPH08180134A (ja) 画像認識装置及び方法
JPH04276888A (ja) 文字読取装置
JPH08241376A (ja) 文字認識装置および文字認識方法
JPH04311283A (ja) 行方向判定装置

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031204

LAPS Cancellation because of no payment of annual fees