JP3060248B2 - 表認識装置 - Google Patents
表認識装置Info
- Publication number
- JP3060248B2 JP3060248B2 JP3040055A JP4005591A JP3060248B2 JP 3060248 B2 JP3060248 B2 JP 3060248B2 JP 3040055 A JP3040055 A JP 3040055A JP 4005591 A JP4005591 A JP 4005591A JP 3060248 B2 JP3060248 B2 JP 3060248B2
- Authority
- JP
- Japan
- Prior art keywords
- extracting
- histogram
- line
- ruled line
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、印刷された表を読み取
り、表構造及びセル内の文字を認識する表認識装置に関
するものである。
り、表構造及びセル内の文字を認識する表認識装置に関
するものである。
【0002】
【従来の技術】近年、表認識装置がコンピュータなどの
入力装置として利用されるようになってきた。文書の清
書システムとして表認識装置の利用を考慮すると、罫線
位置,線種,線幅,及びセル内の文字を認識する必要が
ある。
入力装置として利用されるようになってきた。文書の清
書システムとして表認識装置の利用を考慮すると、罫線
位置,線種,線幅,及びセル内の文字を認識する必要が
ある。
【0003】以下に、従来の表認識装置について説明す
る。図4は従来の表認識装置の構成を示すブロック図で
あり、31はキーボード,マウス等の指示により、表認識
を行う命令を発行する認識指令部である。32は入力され
た画像データを格納する画像メモリ、33は画像データを
走査して一定長さ以上の黒画素の並び(以下ランという)
を抽出する実線ラン抽出部、34は画像データを走査して
特定パターンのランを抽出する破線ラン抽出部、35は実
線ラン抽出部33及び破線ラン抽出部34で抽出されたラン
の連結性を調べて罫線を抽出し、抽出された罫線位置の
相互関係を見ることにより、セルを抽出する表構造抽出
部、36はサンプル文字を記憶する文字パターン辞書部、
37は各セル内の文字をサンプル文字と比較し、前もって
決めた値よりも近い類似度ならば、その文字として出力
する文字認識部、38は認識した表の情報を出力する表出
力部である。
る。図4は従来の表認識装置の構成を示すブロック図で
あり、31はキーボード,マウス等の指示により、表認識
を行う命令を発行する認識指令部である。32は入力され
た画像データを格納する画像メモリ、33は画像データを
走査して一定長さ以上の黒画素の並び(以下ランという)
を抽出する実線ラン抽出部、34は画像データを走査して
特定パターンのランを抽出する破線ラン抽出部、35は実
線ラン抽出部33及び破線ラン抽出部34で抽出されたラン
の連結性を調べて罫線を抽出し、抽出された罫線位置の
相互関係を見ることにより、セルを抽出する表構造抽出
部、36はサンプル文字を記憶する文字パターン辞書部、
37は各セル内の文字をサンプル文字と比較し、前もって
決めた値よりも近い類似度ならば、その文字として出力
する文字認識部、38は認識した表の情報を出力する表出
力部である。
【0004】
【発明が解決しようとする課題】上記の従来の構成で
は、表の中に文字が密集している場合、前記破線ラン抽
出部34において、文字部分を誤って罫線と認識してしま
い、表の構造が正確に認識できないという問題があっ
た。
は、表の中に文字が密集している場合、前記破線ラン抽
出部34において、文字部分を誤って罫線と認識してしま
い、表の構造が正確に認識できないという問題があっ
た。
【0005】本発明の目的は、従来の問題を解消し、表
の構造を認識する場合、文字を構成する線分を、誤って
罫線と認識することがない表認識装置を提供することに
ある。
の構造を認識する場合、文字を構成する線分を、誤って
罫線と認識することがない表認識装置を提供することに
ある。
【0006】
【課題を解決するための手段】本発明の表認識装置は、
上記の問題を解決するため、実線(罫線)で囲まれた部分
のヒストグラム(histogram)をとるヒストグラム抽出手
段と、抽出されたヒストグラムの特徴から実線以外の罫
線の位置を推定する罫線位置推定手段と、推定された罫
線位置の黒画素の並び(ラン)が、あらかじめ定めた特定
パターンと一致するかどうかを調べることにより、実線
以外の罫線を抽出する表構造抽出手段を備えたことを特
徴とするものである。
上記の問題を解決するため、実線(罫線)で囲まれた部分
のヒストグラム(histogram)をとるヒストグラム抽出手
段と、抽出されたヒストグラムの特徴から実線以外の罫
線の位置を推定する罫線位置推定手段と、推定された罫
線位置の黒画素の並び(ラン)が、あらかじめ定めた特定
パターンと一致するかどうかを調べることにより、実線
以外の罫線を抽出する表構造抽出手段を備えたことを特
徴とするものである。
【0007】
【作用】上記の構成により、線と文字の部分をヒストグ
ラムによって識別することができる。したがって、表の
構造を認識する場合、文字を構成する線分を誤って罫線
と認識することがなくなり、正確な構造の認識が可能と
なる。
ラムによって識別することができる。したがって、表の
構造を認識する場合、文字を構成する線分を誤って罫線
と認識することがなくなり、正確な構造の認識が可能と
なる。
【0008】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。
する。
【0009】図1は本発明の一実施例における表認識装
置の構成を示すブロック図である。図1において1はキ
ーボード,マウス等の指示により、表認識を行う命令を
発行する認識指令部、2は入力された画像データを格納
する画像メモリ、3は画像データを走査して一定長さ以
上の黒画素のランを抽出する画素並び抽出手段であるラ
ン抽出部、4はラン抽出部3で抽出されたランの連結性
を調べて罫線を抽出する罫線抽出部、5は抽出された罫
線で囲まれた部分のヒストグラムをとるヒストグラム抽
出部、6は抽出されたヒストグラムにおいて、しきい値
よりも高く、かつ幅がしきい値よりも狭い部分を捜し出
す罫線位置推定部、7は推定した罫線位置の画像データ
を局所的に見ることにより罫線を抽出し、セル(cell)に
分解する表構造抽出部、8はサンプル文字を記憶する文
字パターン辞書部、9は各セル内の文字をサンプル文字
と比較し、前もって決めた値よりも近い類似度ならば、
その文字として出力する文字認識部、10は認識した表の
情報を出力する表出力部である。
置の構成を示すブロック図である。図1において1はキ
ーボード,マウス等の指示により、表認識を行う命令を
発行する認識指令部、2は入力された画像データを格納
する画像メモリ、3は画像データを走査して一定長さ以
上の黒画素のランを抽出する画素並び抽出手段であるラ
ン抽出部、4はラン抽出部3で抽出されたランの連結性
を調べて罫線を抽出する罫線抽出部、5は抽出された罫
線で囲まれた部分のヒストグラムをとるヒストグラム抽
出部、6は抽出されたヒストグラムにおいて、しきい値
よりも高く、かつ幅がしきい値よりも狭い部分を捜し出
す罫線位置推定部、7は推定した罫線位置の画像データ
を局所的に見ることにより罫線を抽出し、セル(cell)に
分解する表構造抽出部、8はサンプル文字を記憶する文
字パターン辞書部、9は各セル内の文字をサンプル文字
と比較し、前もって決めた値よりも近い類似度ならば、
その文字として出力する文字認識部、10は認識した表の
情報を出力する表出力部である。
【0010】図2は本実施例の表認識装置の具体的な構
成を示すブロック図である。図2において、11は表画像
を読み取り、読み取った表画像をイメージデータとして
出力するスキャナ、12はRAMであって、スキャナ11か
らのイメージデータを記憶する画像メモリ領域13と、イ
メージデータの縦,横二方向の黒画素のランを格納する
ラン領域14と、イメージデータの縦,横二方向の黒画素
のヒストグラムを格納するヒストグラム領域15と、表認
識の結果得られる表の構造,セル内の文字を格納する表
データ領域16とを備えている。17はROMであって、文
字認識に使用する辞書を記憶した特徴辞書領域18、及び
プログラム記憶領域19を備えている。20はプログラム記
憶領域19に記憶された制御プログラムに従って処理を行
う処理回路である。21は認識指令を行うキーボードであ
り、22は表データ領域16に記憶された表を表示する表示
部である。
成を示すブロック図である。図2において、11は表画像
を読み取り、読み取った表画像をイメージデータとして
出力するスキャナ、12はRAMであって、スキャナ11か
らのイメージデータを記憶する画像メモリ領域13と、イ
メージデータの縦,横二方向の黒画素のランを格納する
ラン領域14と、イメージデータの縦,横二方向の黒画素
のヒストグラムを格納するヒストグラム領域15と、表認
識の結果得られる表の構造,セル内の文字を格納する表
データ領域16とを備えている。17はROMであって、文
字認識に使用する辞書を記憶した特徴辞書領域18、及び
プログラム記憶領域19を備えている。20はプログラム記
憶領域19に記憶された制御プログラムに従って処理を行
う処理回路である。21は認識指令を行うキーボードであ
り、22は表データ領域16に記憶された表を表示する表示
部である。
【0011】以上のように構成された本実施例の表認識
装置について、以下その動作を図3のフローチャートを
用いて説明する。
装置について、以下その動作を図3のフローチャートを
用いて説明する。
【0012】ステップS1では、スキャナ11から画像を
入力し、メモリに格納する。ステップS2では、入力し
た画像の傾きを補正する。ステップS3では、画像の
縦,横二方向のランを抽出する。ステップS4では、抽
出したランの内、一定長さ以上のものを検索する。ステ
ップS5では、ステップS4で検索したランを連結し
て、罫線を抽出する。ステップS6では、ステップS5
で抽出した罫線で囲まれた部分の画像の縦,横二方向の
ヒストグラムをとる。ステップS7では、ステップS6
で抽出したヒストグラムにおいて、しきい値よりも高
く、かつ幅がしきい値よりも狭い部分に罫線があると推
定する。ステップS8では、推定した罫線位置のラン
が、あらかじめ定めた特定パターンと一致するかどうか
を調べることにより、表を構成する実線以外の罫線の位
置を認識する。ステップS9では、認識された罫線の位
置からセルを抽出する。ステップS10では、抽出された
セル内の文字認識を行う。
入力し、メモリに格納する。ステップS2では、入力し
た画像の傾きを補正する。ステップS3では、画像の
縦,横二方向のランを抽出する。ステップS4では、抽
出したランの内、一定長さ以上のものを検索する。ステ
ップS5では、ステップS4で検索したランを連結し
て、罫線を抽出する。ステップS6では、ステップS5
で抽出した罫線で囲まれた部分の画像の縦,横二方向の
ヒストグラムをとる。ステップS7では、ステップS6
で抽出したヒストグラムにおいて、しきい値よりも高
く、かつ幅がしきい値よりも狭い部分に罫線があると推
定する。ステップS8では、推定した罫線位置のラン
が、あらかじめ定めた特定パターンと一致するかどうか
を調べることにより、表を構成する実線以外の罫線の位
置を認識する。ステップS9では、認識された罫線の位
置からセルを抽出する。ステップS10では、抽出された
セル内の文字認識を行う。
【0013】以上のように、本実施例によれば、ヒスト
グラム抽出部5,罫線位置推定部6,及び表構造抽出部
7を設けることにより、正確に表の構造を認識すること
ができる。
グラム抽出部5,罫線位置推定部6,及び表構造抽出部
7を設けることにより、正確に表の構造を認識すること
ができる。
【0014】
【発明の効果】本発明によれば、実線(罫線)で囲まれた
部分のヒストグラムをとるヒストグラム抽出手段と、抽
出されたヒストグラムの特徴から実線以外の罫線の位置
を推定する罫線位置推定手段と、推定された罫線位置の
ランが、あらかじめ定めた特定パターンと一致するかど
うかを調べることにより、実線以外の罫線を抽出する表
構造抽出手段を設けることにより、表の構造を正確に認
識することができる表認識装置を提供できる。
部分のヒストグラムをとるヒストグラム抽出手段と、抽
出されたヒストグラムの特徴から実線以外の罫線の位置
を推定する罫線位置推定手段と、推定された罫線位置の
ランが、あらかじめ定めた特定パターンと一致するかど
うかを調べることにより、実線以外の罫線を抽出する表
構造抽出手段を設けることにより、表の構造を正確に認
識することができる表認識装置を提供できる。
【図1】本発明の一実施例における表認識装置の構成を
示すブロック図である。
示すブロック図である。
【図2】本実施例のより具体的な構成を示すブロック図
である。
である。
【図3】本実施例の制御手段を示すフローチャートであ
る。
る。
【図4】従来の文字認識装置における表認識装置の構成
を示すブロック図である。
を示すブロック図である。
1…認識指令部、 2…画像メモリ、 3…ラン抽出
部、 4…罫線抽出部、5…ヒストグラム抽出部、 6
…罫線位置推定部、 7…表構造抽出部、 8…文字パ
ターン辞書部、 9…文字認識部、 10…表出力部、
11…スキャナ、12…RAM、 13…画像メモリ領域、
14…ラン領域、 15…ヒストグラム領域、 16…表デー
タ領域、 17…ROM、 18…特徴辞書領域、 19…プ
ログラム記憶領域、 20…処理回路、 21…キーボー
ド、 22…表示部。
部、 4…罫線抽出部、5…ヒストグラム抽出部、 6
…罫線位置推定部、 7…表構造抽出部、 8…文字パ
ターン辞書部、 9…文字認識部、 10…表出力部、
11…スキャナ、12…RAM、 13…画像メモリ領域、
14…ラン領域、 15…ヒストグラム領域、 16…表デー
タ領域、 17…ROM、 18…特徴辞書領域、 19…プ
ログラム記憶領域、 20…処理回路、 21…キーボー
ド、 22…表示部。
Claims (1)
- 【請求項1】 与えられた入力図形を走査して得られた
原図形情報に基づいて、表の構造を認識する表認識装置
において、縦・横2方向の黒画素の並びのうち、一定長
さ以上のものを抽出する画素並び抽出手段と、抽出され
た前記並びを連結することにより、実線の罫線を抽出す
る罫線抽出手段と、抽出された罫線で囲まれた部分のヒ
ストグラムを抽出するヒストグラム抽出手段と、抽出さ
れたヒストグラムの特徴から実線以外の罫線の位置を推
定する罫線位置推定手段と、推定された罫線位置の黒画
素の並びが、あらかじめ定められた特定パターンと一致
するかどうかを調べることにより、実線以外の罫線を抽
出する表構造抽出手段とを備えたことを特徴とする表認
識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3040055A JP3060248B2 (ja) | 1991-03-06 | 1991-03-06 | 表認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3040055A JP3060248B2 (ja) | 1991-03-06 | 1991-03-06 | 表認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05174186A JPH05174186A (ja) | 1993-07-13 |
JP3060248B2 true JP3060248B2 (ja) | 2000-07-10 |
Family
ID=12570236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3040055A Expired - Fee Related JP3060248B2 (ja) | 1991-03-06 | 1991-03-06 | 表認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3060248B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8746519B2 (en) | 2010-01-15 | 2014-06-10 | West Coast Chain Mfg. Co. | Releasable attachment apparatus |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5365440B2 (ja) | 2009-09-15 | 2013-12-11 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
-
1991
- 1991-03-06 JP JP3040055A patent/JP3060248B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8746519B2 (en) | 2010-01-15 | 2014-06-10 | West Coast Chain Mfg. Co. | Releasable attachment apparatus |
Also Published As
Publication number | Publication date |
---|---|
JPH05174186A (ja) | 1993-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6643401B1 (en) | Apparatus and method for recognizing character | |
JPH07200745A (ja) | 少なくとも二つのイメージセクションの比較方法 | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP3060248B2 (ja) | 表認識装置 | |
JP3052438B2 (ja) | 表認識装置 | |
JP2917427B2 (ja) | 図面読取装置 | |
JPH0554072A (ja) | デジタル翻訳装置 | |
JPH0728935A (ja) | 文書画像処理装置 | |
JP3502130B2 (ja) | 表認識装置および表認識方法 | |
JP2788506B2 (ja) | 文字認識装置 | |
JP4974794B2 (ja) | 文書認識装置、文書認識方法、コンピュータプログラム | |
JP2887823B2 (ja) | 文書認識装置 | |
JPH0830725A (ja) | 画像処理装置及び方法 | |
JPH07168911A (ja) | 文書認識装置 | |
JP2923004B2 (ja) | 画像生成装置 | |
JPH07160810A (ja) | 文字認識装置 | |
JP3064508B2 (ja) | 文書認識装置 | |
JPH0573721A (ja) | 表認識装置 | |
JPH08185475A (ja) | 画像認識装置 | |
JP3276554B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JPH0728934A (ja) | 文書画像処理装置 | |
JPH08147314A (ja) | 認識型文書ファイリング装置及びその制御方法 | |
JP3428504B2 (ja) | 文字認識装置 | |
JPH04360294A (ja) | 表認識装置および表認識方法 | |
JPH06150056A (ja) | 表認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |