JPH08180134A - 画像認識装置及び方法 - Google Patents

画像認識装置及び方法

Info

Publication number
JPH08180134A
JPH08180134A JP6325156A JP32515694A JPH08180134A JP H08180134 A JPH08180134 A JP H08180134A JP 6325156 A JP6325156 A JP 6325156A JP 32515694 A JP32515694 A JP 32515694A JP H08180134 A JPH08180134 A JP H08180134A
Authority
JP
Japan
Prior art keywords
image
run
unit
character
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6325156A
Other languages
English (en)
Inventor
Yujiro Kamimura
裕二郎 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6325156A priority Critical patent/JPH08180134A/ja
Publication of JPH08180134A publication Critical patent/JPH08180134A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 網が掛かっている画像に対しても、正確に文
字コード等のコードに変換する。 【構成】 スキャナーから入力した画像の網が掛かって
いる範囲を指定し、その内部の連結黒画素の外接矩形を
抽出する。得られた矩形の頻度分布から網掛け除去のた
めのしきい値を決定し、決定したしきい値よりも小さい
矩形の内部画像を白画素で満たす。その後、従来の画像
認識を行う。 【効果】 網が掛かっている画像を認識する場合、網の
部分のみを除去した画像が得られるため、正確な画像認
識が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書画像を読み取り、
表の構造、図形、文字等を認識する画像認識装置及び方
法に関するものである。
【0002】
【従来の技術】近年、画像認識装置がコンピュータ等の
ための入力装置として利用されるようになってきた。そ
こで、文書の清書システムとして画像認識装置の利用を
考慮すると、罫線位置、線種、線幅及びセル内の文字を
認識する必要がある。
【0003】以下に従来の画像認識装置について説明す
る。図10は従来の画像認識装置の機能ブロック図であ
り、11はスキャナ等の画像入力器から文書を読み取
り、2値の画像に変換する画像入力部、12は画像入力
部11で入力された画像データを格納する画像メモリ、
13は画像の傾きを補正する傾き補正部、14は画像デ
ータを走査して一定長さ以上の黒画素の並び(以下ラン
という)を抽出する実線ラン抽出部、15は画像データ
を走査して特定パターンのランの並びを抽出する破線ラ
ン抽出部、16は実線ラン抽出部14及び破線ラン抽出
部15で抽出されたランの連結性を調べて罫線を抽出
し、抽出された罫線位置の相互関係を見ることにより、
セルを抽出するセル抽出部、17はサンプル文字を記憶
する文字パターン辞書、18は各セル内の文字をサンプ
ル文字と比較し、前もって決めた値よりも近い類似度な
らば、その文字として出力する文字認識部、19は認識
した表の情報を出力する表出力部である。
【0004】画像入力部11から入力された画像データ
は、セル抽出部16によって解析され、罫線及び表内の
セルが抽出される。抽出されたセル内のデータは、文字
として文字認識部18において認識処理される。
【0005】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、図1のようにセルの中に網掛けが存在する
表画像を認識する場合、表の構造やセル内の文字認識が
正確にできないという問題点があった。
【0006】本発明は、網掛けがなされた文字・記号等
についても認識が可能な画像認識装置及び方法を提供す
ることを目的とする。
【0007】
【課題を解決するための手段】本発明は上記問題点を解
決するため、網掛けの範囲を指定する網掛け範囲指定部
と、指定した網掛け範囲の連結黒画素の外接矩形を抽出
するラベリング部と、抽出した外接矩形の大きさから網
掛け部分を判定する網掛け判定部と、網掛けと判定され
た内部の画素を消去する網掛け除去部を備える。
【0008】
【作用】本発明は上記した構成により図1を認識する場
合、網掛けのセルは上記網掛け判定部および網掛け除去
部において、網掛けの部分の画像のみが消去され網がか
かっていない画像になる(図2参照)。その後、表認
識、セル内文字認識が行われるため正確な表構造認識お
よびセル内文字認識が可能となる。
【0009】
【実施例】図3は本発明の一実施例における画像認識装
置の機能ブロック図を示すものである。図3において3
1はスキャナ等の画像入力器から文書を読み取り、2値
の画像に変換する画像入力部、32は画像入力部31で
入力された画像データを格納する画像メモリ、33は画
像の傾きを補正する傾き補正部、34は網掛けの範囲を
指定する網掛け範囲指定部、35は指定された範囲の内
部の連結黒画素の外接矩形を抽出するラベリング部、3
6は抽出した外接矩形の大きさから網掛け部分を判定す
る網掛け判定部、37は網掛けと判定された内部の画素
を消去する網掛け除去部である。また、38は画像デー
タを走査して一定長さ以上の黒画素の並び(以下ランと
いう)を抽出する実線ラン抽出部、39は画像データを
走査して特定パターンのランの並びを抽出する破線ラン
抽出部、40は実線ラン抽出部38及び破線ラン抽出部
39で抽出されたランの連結性を調べて罫線を抽出し、
抽出された罫線位置の相互関係を見ることにより、セル
を抽出するセル抽出部、41はサンプル文字を記憶する
文字パターン辞書、42は各セル内の文字をサンプル文
字と比較し、前もって決めた値よりも近い類似度なら
ば、その文字として出力する文字認識部、43は認識し
た表の情報を出力する表出力部である。
【0010】図4は本実施例の画像認識装置の回路構成
を示すブロック図である。図4において44は表画像を
読み取るスキャナで、読み取った表画像をイメージデー
タとして出力する。45はRAMでスキャナ44からの
イメージデータを記憶する画像メモリ領域46、画像メ
モリ領域46の縦、横2方向の連続する黒画素と白画素
の長さ(ラン)を格納するラン領域47、網掛け範囲内
のラベリングデータを格納するラベリング領域48、ラ
ベリングデータの長辺の頻度分布を格納する頻度分布領
域49、表認識の結果得られる表の構造、セルの文字を
格納する表データ領域50を有する。51はROMで文
字認識に使用する辞書を記憶した特徴辞書領域52及び
プログラム記憶領域53を有する。54はプログラム記
憶領域53に記憶された制御プログラムに従って処理を
行う処理回路である。55は認識指令を行うキーボード
であり、56は表データ領域50に記憶された表を表示
する表示部である。
【0011】以上のように構成された本実施例の画像認
識装置について以下その動作を図5のフローチャートを
用いて説明する。
【0012】ステップs1では、画像入力部31によっ
てスキャナ44から画像を入力し、画像メモリ32(画
像メモリ領域46)に格納する。ステップs2では、傾
き補正部33が画像メモリ領域46の画像の傾きを補正
し、再び画像メモリ領域46に格納する。ステップs3
では、網掛け範囲指定部34、ラベリング部35、網掛
け判定部36及び網掛け除去部37が画像メモリ領域4
6に格納された画像から網掛けを除去し、再び画像メモ
リ領域46に格納する(このステップの詳細は後述す
る)。ステップs4では、実線ラン抽出部38及び破線
ラン抽出部39が画像メモリ領域46に格納された画像
から縦、横2方向の連続する黒画素と白画素の長さ(ラ
ン)を抽出しラン領域47に格納する。ステップs5で
は、実線ラン抽出部38および破線ラン抽出部39によ
ってラン領域47に格納されたランの内、白ランの長さ
がしきい値(破線の途切れの最大長さ)以内の場合、そ
の前後の黒ランを統合して1つの黒ランとして扱い、長
さがしきい値以上の黒ランを選ぶ。ステップs6では、
セル抽出部40がステップs5で選ばれたランの内、接
触しているグループ毎に始点終点を求め、表データ領域
50に格納する。ステップs7では、セル抽出部40が
ステップs6で抽出された罫線で囲まれた部分の四隅の
座標をセルとして抽出し、表データ領域50に格納す
る。ステップs8では、文字認識部42がセル内の文字
認識が全て終了したかどうか調べ、yesの場合はステ
ップs10で表出力部43が表を出力して終了し、no
の場合は文字認識部42及び文字パターン辞書41によ
ってステップs9でセル内文字認識を行う。
【0013】次に図6のフローチャートを用いてステッ
プs3の詳細について説明する。ステップs31では、
網掛け範囲指定部34がマウスなどの入力装置を使って
網が掛かっている範囲を指定する(図7参照)。ステッ
プs32では、ラベリング部35が指定した網掛け範囲
内の画像のラベリングデータを抽出し(図8参照)、ラ
ベリング領域48に格納する。ステップs33では、網
掛け判定部36がラベリング領域48に格納されたラベ
リングデータの長辺の頻度分布を取り、頻度分布領域4
9に格納する。ステップs34では、網掛け判定部36
が頻度分布領域49に格納された頻度分布の最も頻度が
高い山を探し、その山の右端を網掛け除去しきい値とす
る(図9参照)。ステップs35では、網掛け判定部3
6がラベリング領域48に格納された全てのラベリング
データに対して処理が終了したかどうか調べ、yesの
場合は処理を終了し、noの場合は処理の対象となるラ
ベリングデータを1つ選びステップs36に進む。ステ
ップs36では、網掛け判定部36によって、対象ラベ
リングデータの幅がステップs34で決定したしきい値
より大きいかどうかを調べ、大きければ網ではないと判
断し、ステップs35に戻り、小さければステップs3
7に進む。ステップs37では、網掛け判定部36によ
って、対象ラベリングデータの高さがステップs34で
決定したしきい値より大きいかどうかを調べ、大きけれ
ば網ではないと判断しステップs35に戻り、小さけれ
ばステップs38に進む。ステップs38では網掛け除
去部37によって、画像メモリ領域46の対象ラベリン
グデータ内部に相当する部分を白画素で満たす。以上の
処理が終了すると、網掛け判定部36により、ステップ
s34で決定したしきい値よりも縦横ともに小さい黒画
素は、網掛け除去部36により、ステップs38におい
て白画素で消去され、画像メモリ領域46の画像は網掛
けのみが消去された画像となる。
【0014】以上のように本実施例によれば、網掛け範
囲指定部34、ラベリング部35、網掛け判定部36及
び、網掛け除去部37を設けることにより、網が掛かっ
た部分がある表画像の網の部分のみを除去するため、構
造認識及びセル内文字認識を正確に行うことができる。
【0015】
【発明の効果】本発明は、網掛けの範囲を指定する網掛
け範囲指定部と、指定した網掛け範囲の連結黒画素の外
接矩形を抽出するラベリング部と、抽出した外接矩形の
大きさから網掛け部分を判定する網掛け判定部と、網掛
けと判定された内部の画素を消去する網掛け除去部を備
えることにより、網掛けのセルは上記網掛け判定部およ
び網掛け除去部において、網掛けの部分の画像のみが消
去され網がかかっていない画像になる。その後、表認
識、セル内文字認識が行われるため正確な表構造認識お
よびセル内文字認識が可能となる。
【図面の簡単な説明】
【図1】本発明の画像認識装置の実施例において網掛け
除去を行う前のサンプルを示す図
【図2】本発明の画像認識装置の実施例において網掛け
除去後のサンプルを示す図
【図3】本発明の画像認識装置の実施例の機能ブロック
【図4】本実施例の画像認識装置の実施例の回路構成を
示すブロック図
【図5】本実施例における制御手順を示すフローチャー
【図6】本実施例における制御手順を示すフローチャー
【図7】本実施例における網掛け範囲の画像のサンプル
を示す図
【図8】本実施例における網掛け範囲のラベリングデー
タを示す図
【図9】本実施例におけるラベリングデータの長辺の頻
度分布を示す図
【図10】従来の装置の機能ブロック図
【符号の説明】
31 画像入力部 32 画像メモリ 33 傾き補正部 34 網掛け範囲指定部 35 ラベリング部 36 網掛け判定部 37 網掛け除去部 38 実線ラン抽出部 39 破線ラン抽出部 40 セル抽出部 41 文字パターン辞書 42 文字認識部 43 表出力部 44 スキャナ 45 RAM 46 画像メモリ領域 47 ラン領域 48 ラベリング領域 49 頻度分布領域 50 表データ領域 51 ROM 52 特徴辞書領域 53 プログラム記憶領域 54 処理回路 55 キーボード 56 表示部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】読み込んだ原図形情報に基づいて画像を文
    字認識し、文字コードに変換する画像認識装置であっ
    て、網掛けの範囲を指定する網掛け範囲指定部と、指定
    した網掛け範囲の連結する画素の外接矩形を抽出するラ
    ベリング部と、抽出した外接矩形の大きさより文字・記
    号から離れた網点を検出する網掛け判定部と、検出され
    た網点の画素を消去する網掛け除去部と、文字認識する
    文字認識部とを備えることを特徴とする画像認識装置。
  2. 【請求項2】読み込んだ原図形情報に基づいて画像を文
    字認識し、文字・記号コードに変換する画像認識方法で
    あって、網掛けの範囲を指定するステップと、指定した
    網掛け範囲の連結する画素の外接矩形を抽出するステッ
    プと、抽出した外接矩形の大きさより、文字・記号から
    離れた網点を検出するステップと、検出された網点の画
    素を消去するステップと、文字認識するステップとを備
    えた画像認識方法。
JP6325156A 1994-12-27 1994-12-27 画像認識装置及び方法 Pending JPH08180134A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6325156A JPH08180134A (ja) 1994-12-27 1994-12-27 画像認識装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6325156A JPH08180134A (ja) 1994-12-27 1994-12-27 画像認識装置及び方法

Publications (1)

Publication Number Publication Date
JPH08180134A true JPH08180134A (ja) 1996-07-12

Family

ID=18173654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6325156A Pending JPH08180134A (ja) 1994-12-27 1994-12-27 画像認識装置及び方法

Country Status (1)

Country Link
JP (1) JPH08180134A (ja)

Similar Documents

Publication Publication Date Title
EP0621554B1 (en) Method and apparatus for automatic determination of text line, word and character cell spatial features
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JPH03122773A (ja) 画像形成装置
JP3411472B2 (ja) パターン抽出装置
US7130085B2 (en) Half-tone dot elimination method and system thereof
JPH09311905A (ja) 行検出方法および文字認識装置
EP0766193B1 (en) Optical character reader with skew correction
JPH08180134A (ja) 画像認識装置及び方法
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
Ye et al. Document image matching and annotation lifting
JP3502130B2 (ja) 表認識装置および表認識方法
JP2908495B2 (ja) 文字画像抽出装置
JP4383797B2 (ja) 傾き検出方法、傾き検出装置およびプログラム
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JP3052438B2 (ja) 表認識装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP3060248B2 (ja) 表認識装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2003317107A (ja) 罫線抽出方法及び装置
JP2991761B2 (ja) 行切出し方法
JPH04241074A (ja) 自動文書清書装置
JPH04276888A (ja) 文字読取装置
JPH0816715A (ja) 表認識装置及び表認識方法
JP2954218B2 (ja) 画像処理方法及び装置
JPH08185475A (ja) 画像認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040928

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050510