JP2000057262A - 画像処理装置及び記録媒体 - Google Patents
画像処理装置及び記録媒体Info
- Publication number
- JP2000057262A JP2000057262A JP10219295A JP21929598A JP2000057262A JP 2000057262 A JP2000057262 A JP 2000057262A JP 10219295 A JP10219295 A JP 10219295A JP 21929598 A JP21929598 A JP 21929598A JP 2000057262 A JP2000057262 A JP 2000057262A
- Authority
- JP
- Japan
- Prior art keywords
- image
- black
- character
- white
- inverted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
の可能性がある文字領域を持つ文書画像から文字を自動
的に抽出する画像処理装置を提供すること。 【解決手段】 2値化されている原画像M2及び反転画
像M3それぞれの画像に対して画像内の全ての黒画素に
対して白画素までの最短距離値M5を求め、黒画素連結
領域それぞれに関して前記距離変換手段で求めた最短距
離値M5の最大値である最大距離値を求め、求めた1又
は2以上の最大距離値に基づいて前記原画像又は前記反
転画像のどちらかを選択する。これにより、文字を構成
する黒画素連結領域がその他の領域に比べて最大距離値
が大きくなる、すなわち太さが太くなると共に、面積も
大きいことを利用して、白地に黒文字と黒地に白文字の
場合とを判別することができる。
Description
字を抽出する画像処理装置及び記録媒体に関するもの
で、特に白地に黒色文字と黒地に白色文字のどちらかの
可能性がある文字領域を持つ文書画像から文字を自動的
に抽出し認識するために利用される。
の判別を行う方法としては、特公平5−65911号公
報に示されているように、2値画像を膨張させ、領域の
特徴量があらかじめ設定した文字や数字の特徴量と類似
するかどうかの比較を行う方法や、特開平6−2668
97号公報に示されているように、画像に占める黒画素
の割合で選択を行う方法などがある。
技術において、例えば輪郭のみで構成されているような
修飾文字の場合には、2値画像を膨張させた結果の領域
に関する特徴量(縦横比等)だけでは輪郭線が文字の構
成要素なのか、輪郭線の中が文字(白黒反転画像では黒
色文字になる)であるのかを判別することは難しい。ま
た、黒画素の割合は文字によって差があるため、対象文
字列によっては画像の選択を誤る可能性がある。本発明
は上記問題点を解決するためになされたもので、白地に
黒色文字と黒地に白色文字のどちらかの可能性がある文
字領域を持つ文書画像から文字を自動的に抽出する画像
処理装置及び記録媒体を提供することを目的とする。
は、2値化されている原画像及び該原画像が白黒反転さ
れている反転画像それぞれの画像に対して画像内の全て
の黒画素に対して白画素までの最短距離値を求める距離
変換手段と、黒画素連結領域それぞれに関して前記距離
変換手段で求めた最短距離値の最大値である最大距離値
を求める最大算出手段と、求めた1又は2以上の最大距
離値に基づいて前記原画像又は前記反転画像のどちらか
を選択する選択手段と、を備えるものである。
で求めた黒画素連結領域毎の最大距離値の画像全体での
平均値と画像全体の黒画素数との積の大小に基づいて前
記原画像又は前記反転画像のどちらかを選択するもので
あることで、画像全体黒画素数を加味して選択すること
ができる。さらに、本発明の画像処理装置は、2値化さ
れている原画像及び該原画像が白黒反転されている反転
画像それぞれの画像に対して文字認識処理を行う文字認
識手段と、文字認識用辞書との類似度の画像全体での和
の大小に基づいて前記原画像又は前記反転画像のどちら
かを選択する選択手段と、を備えるものである。
処理装置として機能させるためのプログラムを記録した
コンピュータ読み取り可能な記録媒体である。本発明
は、文字を構成する黒画素連結領域がその他の領域に比
べて最大距離値が大きくなる、すなわち太さが太くなる
と共に、面積も大きいことを利用することで、白地に黒
文字と黒地に白文字の場合とを判別することを可能とす
るものである。また、文字認識結果を利用して、文字と
して意味があると考えられる領域の多い方を選択するこ
とで、白地に黒文字と黒地に白文字の場合とを判別する
ことを可能とするものである。
置の実施の形態について、図1〜図6に基づき説明す
る。ここでは画像全体を処理対象として説明するが、画
像の一部分を処理対象としてもかまわない。 (1)第1実施の形態 図1は、本発明を適用した第1実施の形態システムの構
成を示す機能ブロック図である。Sは文書を入力するス
キャナ、M1は入力画像用メモリ、M2は2値画像用メ
モリ、M3は反転画像用メモリ、M4はラベル画像用メ
モリ、M5は距離値格納用メモリ、Rはプログラム用R
OM、PはR内のプログラムに従って処理の流れを制御
する制御部である。図2は、第1実施の形態の処理の流
れを示すフローチャートである。
画像用メモリM1に転送されるようにする。画像の格納
方法は、画像(横方向:X画素数,縦方向:Y画素数)
に対し、画像左上の画素から画像右下の画素へと順に、
画素の輝度値(0〜255)を1byteずつメモリに
格納していく。すなわち座標 (x,y)=(0,0)〜(X−
1,Y−1) の輝度値を、メモリの(x+X×y)番目
のアドレスに1byte単位で格納する。画像1枚につ
きメモリ容量は(X×Y)byte必要である。
モリM1内の画像を2値化して、2値画像用メモリM2
に1(黒)又は0(白)を格納する。2値化の方法とし
ては、あらかじめしきい値Thの値を決めておき、 M1(x,y)<Th ならば M2(x,y)←1 M1(x,y)≧Th ならば M2(x,y)←0 とする固定しきい値法や、画像の位置によってしきい値
を変える動的しきい値法等がある。図3は2値化した画
像の一例である。
モリM2に格納された画像に対し、黒画素連結領域毎に
ラベリングを行い、求めたラベル画像をラベル画像用メ
モリM4に格納する。
モリM2に格納された画像全体を走査し、ある任意の座
標の画素が黒である場合、その画素から白画素までの最
短距離を求め、求めた値を距離値格納用メモリM5に格
納する。図4は、距離値格納用メモリM5内の記憶内容
の一例である。図中の"1","2","3"は格納された距離
値を表している。
メモリM4と距離値格納用メモリM5を同時に走査し、
ラベル値毎の最大距離値を求め、求めた最大距離値の画
像全体での平均値Rbを計算する。なお計算前に、最大
距離値があらかじめ定めたしきい値Thr以下(又は以
上)の領域を削除したり、黒画素連結領域の大きさに応
じて領域を削除したりすることで、文字以外の領域を削
除しておくことも可能である。
モリM2全体を走査し、画像内の黒画素数Abを求め
る。
モリM2全体を走査し、 M2(x,y)=0 ならば M3(x,y)←1 M2(x,y)=1 ならば M3(x,y)←0 を代入することで、白黒が反転した画像を反転画像用メ
モリM3内に作成する。この時反転画像用メモリM3に
おいて、画像の端に接する黒画素連結領域は、文字では
無いとみなし、その領域内は0クリアしておく。
S6と同様の処理を2値画像用メモリM2の代わりに反
転画像用メモリM3を対象として行い、最大距離値の平
均Rwと黒画素数Awを求める。
b,Aw,Rb,Rwを基に、 Ab×Rb≧Aw×Rw ならば 2値画像用メモリM
2 Ab×Rb<Aw×Rw ならば 反転画像用メモリM
3 の中にある画像を文字が存在する方として選択する。つ
まり、面積が大きく、最大距離値の平均、すなわち太さ
が太い領域が存在する画像を、文字が存在する方として
選択する。
成を示す機能ブロック図である。Sは文書を入力するス
キャナ、M1は入力画像用メモリ、M2は2値画像用メ
モリ、M3は反転画像用メモリ、Dは文字特徴辞書、R
はプログラム用ROM、PはR内のプログラムに従って
処理の流れを制御する制御部である。図6は、第2実施
の形態の処理の流れを示すフローチャートである。画像
より文字を次のように抽出する。
形態のステップS1〜S2と同じ。 〔ステップS23〕制御部Pは2値画像用メモリM2に
格納された画像に対し、文字切り出し処理を行い、文字
1文字毎の領域座標を求める。文字切り出し方法は数多
く存在し、どの方法を使用してもかまわない。
メモリM2に格納された画像に対し、前ステップで切り
出した文字領域から文字特徴量を求める。なお、文字認
識に使用される文字特徴量には様々な種類が存在してお
り、以下に記述する特徴量に限定するものではない。こ
こでは一例として、文字領域を縦横それぞれ6分割して
36のメッシュとし、メッシュ一つずつに対して黒画素
密度m1,…,m36を求める。
24で求めた特徴量m1,…,m36と文字特徴辞書Dに
格納された特徴量mi1,…,mi36(i:辞書に登録
された文字数)との差の2乗和を求め、最小となる値の
逆数dを類似度とする。画像内のすべての文字に対して
類似度を求めて、求めた類似度の和をdbとする。
ップS7と同じ。 〔ステップS27〜S29〕ステップS23〜S25と
同様の処理を2値画像用メモリM2の代わりに反転画像
用メモリM3を対象として行い、類似度の和をdwとす
る。
b、dwを基に、 db≧dw ならば 2値画像用メモリM2 db<dw ならば 反転画像用メモリM3 の中にある画像を文字が存在する方として選択する。つ
まり、文字として意味があると考えられる領域の多い画
像を、文字が存在する方として選択する。
は、文字認識処理を行うことにより文字コードに変換す
ることなどが可能である。なお、本発明は上記実施の形
態に限定されるものではない。本発明は、コンピュータ
を上記画像処理装置として機能させるためのプログラム
を記録したコンピュータ読み取り可能な記録媒体であっ
ても良い。
文字を構成する黒画素連結領域がその他の領域に比べて
最大距離値が大きくなる、すなわち太さが太くなると共
に、面積も大きいことを利用することで、白地に黒文字
と黒地に白文字の場合とを判別することができる。ま
た、文字認識結果を利用して、文字として意味があると
考えられる領域の多い方を選択することで、白地に黒文
字と黒地に白文字の場合とを判別することができる。
機能ブロック図。
フローチャ−ト。
機能ブロック図。
フローチャ−ト。
Claims (4)
- 【請求項1】 2値化されている原画像及び該原画像が
白黒反転されている反転画像それぞれの画像に対して画
像内の全ての黒画素に対して白画素までの最短距離値を
求める距離変換手段と、黒画素連結領域それぞれに関し
て前記距離変換手段で求めた最短距離値の最大値である
最大距離値を求める最大算出手段と、求めた1又は2以
上の最大距離値に基づいて前記原画像又は前記反転画像
のどちらかを選択する選択手段と、を備えることを特徴
とする画像処理装置。 - 【請求項2】 前記選択手段は、前記最大算出手段で求
めた黒画素連結領域毎の最大距離値の画像全体での平均
値と画像全体の黒画素数との積の大小に基づいて前記原
画像又は前記反転画像のどちらかを選択するものである
ことを特徴とする請求項1記載の画像処理装置。 - 【請求項3】 2値化されている原画像及び該原画像が
白黒反転されている反転画像それぞれの画像に対して文
字認識処理を行う文字認識手段と、文字認識用辞書との
類似度の画像全体での和の大小に基づいて前記原画像又
は前記反転画像のどちらかを選択する選択手段と、を備
えることを特徴とする画像処理装置。 - 【請求項4】 コンピュータを請求項1乃至3いずれか
に記載の画像処理装置として機能させるためのプログラ
ムを記録したことを特徴とするコンピュータ読み取り可
能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21929598A JP4129320B2 (ja) | 1998-08-03 | 1998-08-03 | 画像処理装置及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21929598A JP4129320B2 (ja) | 1998-08-03 | 1998-08-03 | 画像処理装置及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000057262A true JP2000057262A (ja) | 2000-02-25 |
JP4129320B2 JP4129320B2 (ja) | 2008-08-06 |
Family
ID=16733269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21929598A Expired - Fee Related JP4129320B2 (ja) | 1998-08-03 | 1998-08-03 | 画像処理装置及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4129320B2 (ja) |
-
1998
- 1998-08-03 JP JP21929598A patent/JP4129320B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP4129320B2 (ja) | 2008-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6347156B1 (en) | Device, method and storage medium for recognizing a document image | |
US5075895A (en) | Method and apparatus for recognizing table area formed in binary image of document | |
US7321688B2 (en) | Image processor for character recognition | |
JP2001351066A (ja) | 文書認識処理のための装置、方法及び記録媒体 | |
EP1017011A2 (en) | Block selection of table features | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
JP2000207489A (ja) | 文字抽出方法、装置および記録媒体 | |
JPH0418351B2 (ja) | ||
JP3938005B2 (ja) | 画像処理装置および画像処理方法 | |
JP2000057262A (ja) | 画像処理装置及び記録媒体 | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2858530B2 (ja) | エッジ強調装置 | |
JPH04287179A (ja) | 画像処理装置 | |
JP2002109470A (ja) | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
JPH09204525A (ja) | 画像像域分離装置及びその方法 | |
JPH09186858A (ja) | 画像処理方法及び装置、及びコンピュータ制御装置 | |
JP2775807B2 (ja) | 文字認識方法 | |
JP2002077631A (ja) | 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 | |
JP7459151B2 (ja) | 情報処理装置、情報処理システム、情報処理方法、及びプログラム | |
JP2001291056A (ja) | 文書画像認識装置及び記録媒体 | |
KR100334624B1 (ko) | 클러스터링기반문서영상분할방법 | |
JP2926842B2 (ja) | 文字切出し回路 | |
JP3906723B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH0676105A (ja) | 文書認識システム | |
JPH0795336B2 (ja) | 文字認識方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080513 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080519 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |