JP4129320B2 - 画像処理装置及び記録媒体 - Google Patents
画像処理装置及び記録媒体 Download PDFInfo
- Publication number
- JP4129320B2 JP4129320B2 JP21929598A JP21929598A JP4129320B2 JP 4129320 B2 JP4129320 B2 JP 4129320B2 JP 21929598 A JP21929598 A JP 21929598A JP 21929598 A JP21929598 A JP 21929598A JP 4129320 B2 JP4129320 B2 JP 4129320B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- black
- character
- processing apparatus
- maximum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
【発明の属する技術分野】
本発明は、文書画像中より文字を抽出する画像処理装置及び記録媒体に関するもので、特に白地に黒色文字と黒地に白色文字のどちらかの可能性がある文字領域を持つ文書画像から文字を自動的に抽出し認識するために利用される。
【0002】
【従来の技術】
従来の白地に黒色文字と黒地に白色文字の判別を行う方法としては、特公平5−65911号公報に示されているように、2値画像を膨張させ、領域の特徴量があらかじめ設定した文字や数字の特徴量と類似するかどうかの比較を行う方法や、特開平6−266897号公報に示されているように、画像に占める黒画素の割合で選択を行う方法などがある。
【0003】
【発明が解決しようとする課題】
しかしながら、従来の技術において、例えば輪郭のみで構成されているような修飾文字の場合には、2値画像を膨張させた結果の領域に関する特徴量(縦横比等)だけでは輪郭線が文字の構成要素なのか、輪郭線の中が文字(白黒反転画像では黒色文字になる)であるのかを判別することは難しい。また、黒画素の割合は文字によって差があるため、対象文字列によっては画像の選択を誤る可能性がある。
本発明は上記問題点を解決するためになされたもので、白地に黒色文字と黒地に白色文字のどちらかの可能性がある文字領域を持つ文書画像から文字を自動的に抽出する画像処理装置及び記録媒体を提供することを目的とする。
【0004】
【課題を解決するための手段】
本発明の画像処理装置は、2値化されている原画像及び該原画像が白黒反転されている反転画像それぞれの画像に対して画像内の全ての黒画素に対して白画素までの最短距離値を求める距離変換手段と、黒画素連結領域それぞれに関して前記距離変換手段で求めた最短距離値の最大値である最大距離値を求める最大算出手段と、求めた1又は2以上の最大距離値に基づいて前記原画像又は前記反転画像のどちらかを選択する選択手段と、を備えるものである。
【0005】
また、前記選択手段は、前記最大算出手段で求めた黒画素連結領域毎の最大距離値の画像全体での平均値と画像全体の黒画素数との積の大小に基づいて前記原画像又は前記反転画像のどちらかを選択するものであることで、画像全体黒画素数を加味して選択することができる。
さらに、本発明の画像処理装置は、2値化されている原画像及び該原画像が白黒反転されている反転画像それぞれの画像に対して文字認識処理を行う文字認識手段と、文字認識用辞書との類似度の画像全体での和の大小に基づいて前記原画像又は前記反転画像のどちらかを選択する選択手段と、を備えるものである。
【0006】
また、本発明は、コンピュータを上記画像処理装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明は、文字を構成する黒画素連結領域がその他の領域に比べて最大距離値が大きくなる、すなわち太さが太くなると共に、面積も大きいことを利用することで、白地に黒文字と黒地に白文字の場合とを判別することを可能とするものである。
また、文字認識結果を利用して、文字として意味があると考えられる領域の多い方を選択することで、白地に黒文字と黒地に白文字の場合とを判別することを可能とするものである。
【0007】
【発明の実施の形態】
以下に、本発明による画像処理装置の実施の形態について、図1〜図6に基づき説明する。ここでは画像全体を処理対象として説明するが、画像の一部分を処理対象としてもかまわない。
(1)第1実施の形態
図1は、本発明を適用した第1実施の形態システムの構成を示す機能ブロック図である。Sは文書を入力するスキャナ、M1は入力画像用メモリ、M2は2値画像用メモリ、M3は反転画像用メモリ、M4はラベル画像用メモリ、M5は距離値格納用メモリ、Rはプログラム用ROM、PはR内のプログラムに従って処理の流れを制御する制御部である。図2は、第1実施の形態の処理の流れを示すフローチャートである。
【0008】
画像より文字を次のように抽出する。
〔ステップS1〕
スキャナSから入力した画像は、入力画像用メモリM1に転送されるようにする。画像の格納方法は、画像(横方向:X画素数,縦方向:Y画素数)に対し、画像左上の画素から画像右下の画素へと順に、画素の輝度値(0〜255)を1byteずつメモリに格納していく。すなわち座標 (x,y)=(0,0)〜(X−1,Y−1) の輝度値を、メモリの(x+X×y)番目のアドレスに1byte単位で格納する。画像1枚につきメモリ容量は(X×Y)byte必要である。
【0009】
〔ステップS2〕
制御部Pは入力画像用メモリM1内の画像を2値化して、2値画像用メモリM2に1(黒)又は0(白)を格納する。2値化の方法としては、あらかじめしきい値Thの値を決めておき、
M1(x,y)<Th ならば M2(x,y)←1
M1(x,y)≧Th ならば M2(x,y)←0
とする固定しきい値法や、画像の位置によってしきい値を変える動的しきい値法等がある。図3は2値化した画像の一例である。
【0010】
〔ステップS3〕
制御部Pは2値画像用メモリM2に格納された画像に対し、黒画素連結領域毎にラベリングを行い、求めたラベル画像をラベル画像用メモリM4に格納する。
【0011】
〔ステップS4〕
制御部Pは2値画像用メモリM2に格納された画像全体を走査し、ある任意の座標の画素が黒である場合、その画素から白画素までの最短距離を求め、求めた値を距離値格納用メモリM5に格納する。図4は、距離値格納用メモリM5内の記憶内容の一例である。図中の"1","2","3"は格納された距離値を表している。
【0012】
〔ステップS5〕
制御部Pはラベル画像用メモリM4と距離値格納用メモリM5を同時に走査し、ラベル値毎の最大距離値を求め、求めた最大距離値の画像全体での平均値Rbを計算する。
なお計算前に、最大距離値があらかじめ定めたしきい値Thr以下(又は以上)の領域を削除したり、黒画素連結領域の大きさに応じて領域を削除したりすることで、文字以外の領域を削除しておくことも可能である。
【0013】
〔ステップS6〕
制御部Pは2値画像用メモリM2全体を走査し、画像内の黒画素数Abを求める。
【0014】
〔ステップS7〕
制御部Pは2値画像用メモリM2全体を走査し、
M2(x,y)=0 ならば M3(x,y)←1
M2(x,y)=1 ならば M3(x,y)←0
を代入することで、白黒が反転した画像を反転画像用メモリM3内に作成する。
この時反転画像用メモリM3において、画像の端に接する黒画素連結領域は、文字では無いとみなし、その領域内は0クリアしておく。
【0015】
〔ステップS8〜S11〕
ステップS3〜S6と同様の処理を2値画像用メモリM2の代わりに反転画像用メモリM3を対象として行い、最大距離値の平均Rwと黒画素数Awを求める。
【0016】
〔ステップS12〕
制御部Pは、求めたAb,Aw,Rb,Rwを基に、
Ab×Rb≧Aw×Rw ならば 2値画像用メモリM2
Ab×Rb<Aw×Rw ならば 反転画像用メモリM3
の中にある画像を文字が存在する方として選択する。つまり、面積が大きく、最大距離値の平均、すなわち太さが太い領域が存在する画像を、文字が存在する方として選択する。
【0017】
(2)第2実施の形態
図5は、本発明を適用した第2実施の形態システムの構成を示す機能ブロック図である。Sは文書を入力するスキャナ、M1は入力画像用メモリ、M2は2値画像用メモリ、M3は反転画像用メモリ、Dは文字特徴辞書、Rはプログラム用ROM、PはR内のプログラムに従って処理の流れを制御する制御部である。図6は、第2実施の形態の処理の流れを示すフローチャートである。
画像より文字を次のように抽出する。
【0018】
〔ステップS21からS22〕
第1実施の形態のステップS1〜S2と同じ。
〔ステップS23〕
制御部Pは2値画像用メモリM2に格納された画像に対し、文字切り出し処理を行い、文字1文字毎の領域座標を求める。文字切り出し方法は数多く存在し、どの方法を使用してもかまわない。
【0019】
〔ステップS24〕
制御部Pは2値画像用メモリM2に格納された画像に対し、前ステップで切り出した文字領域から文字特徴量を求める。なお、文字認識に使用される文字特徴量には様々な種類が存在しており、以下に記述する特徴量に限定するものではない。ここでは一例として、文字領域を縦横それぞれ6分割して36のメッシュとし、メッシュ一つずつに対して黒画素密度m1,…,m36を求める。
【0020】
〔ステップS25〕
制御部PはステップS24で求めた特徴量m1,…,m36と文字特徴辞書Dに格納された特徴量mi1,…,mi36(i:辞書に登録された文字数)との差の2乗和を求め、最小となる値の逆数dを類似度とする。画像内のすべての文字に対して類似度を求めて、求めた類似度の和をdbとする。
【0021】
〔ステップS26〕
第1実施の形態のステップS7と同じ。
〔ステップS27〜S29〕
ステップS23〜S25と同様の処理を2値画像用メモリM2の代わりに反転画像用メモリM3を対象として行い、類似度の和をdwとする。
【0022】
〔ステップS30〕
制御部Pは、求めたdb、dwを基に、
db≧dw ならば 2値画像用メモリM2
db<dw ならば 反転画像用メモリM3
の中にある画像を文字が存在する方として選択する。つまり、文字として意味があると考えられる領域の多い画像を、文字が存在する方として選択する。
【0023】
上記処理によって選択された画像に対しては、文字認識処理を行うことにより文字コードに変換することなどが可能である。
なお、本発明は上記実施の形態に限定されるものではない。
本発明は、コンピュータを上記画像処理装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であっても良い。
【0024】
【発明の効果】
以上のように本発明の画像処理装置は、文字を構成する黒画素連結領域がその他の領域に比べて最大距離値が大きくなる、すなわち太さが太くなると共に、面積も大きいことを利用することで、白地に黒文字と黒地に白文字の場合とを判別することができる。また、文字認識結果を利用して、文字として意味があると考えられる領域の多い方を選択することで、白地に黒文字と黒地に白文字の場合とを判別することができる。
【図面の簡単な説明】
【図1】本発明の第1実施の形態システムの構成を示す機能ブロック図。
【図2】本発明の第1実施の形態システムの動作を示すフローチャ−ト。
【図3】文字領域を含む画像の一例を示す図。
【図4】距離値格納用メモリ内の記憶内容を示す図。
【図5】本発明の第2実施の形態システムの構成を示す機能ブロック図。
【図6】本発明の第2実施の形態システムの動作を示すフローチャ−ト。
【符号の簡単な説明】
S スキャナ
M1 入力画像用メモリ
M2 2値画像用メモリ
M3 反転画像用メモリ
M4 ラベル画像用メモリ
M5 距離値格納用メモリ
D 文字特徴辞書
R プログラム用ROM
P 制御部
Claims (2)
- 画像中より文字を抽出する画像処理装置であって、
2値化されている原画像及び該原画像が白黒反転されている反転画像それぞれの画像に対して画像内の全ての黒画素に対して白画素までの最短距離値を求める距離変換手段と、
2値化されている原画像及び反転画像それぞれの黒画素連結領域それぞれに関して前記距離変換手段で求めた最短距離値の最大値である最大距離値を求める最大算出手段と、
2値化されている原画像及び反転画像それぞれに関して前記最大算出手段で求めた黒画素連結領域毎の最大距離値の画像全体での平均値と画像全体の黒画素数との積を求め、前記原画像又は前記反転画像のうち、当該積の大きい方の画像を文字が存在する画像として選択する選択手段と
を備え、該選択手段によって選択された画像中より文字を抽出することを特徴とする画像処理装置。 - コンピュータを請求項1記載の画像処理装置として機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21929598A JP4129320B2 (ja) | 1998-08-03 | 1998-08-03 | 画像処理装置及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21929598A JP4129320B2 (ja) | 1998-08-03 | 1998-08-03 | 画像処理装置及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000057262A JP2000057262A (ja) | 2000-02-25 |
JP4129320B2 true JP4129320B2 (ja) | 2008-08-06 |
Family
ID=16733269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21929598A Expired - Fee Related JP4129320B2 (ja) | 1998-08-03 | 1998-08-03 | 画像処理装置及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4129320B2 (ja) |
-
1998
- 1998-08-03 JP JP21929598A patent/JP4129320B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000057262A (ja) | 2000-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2940936B2 (ja) | 表領域識別方法 | |
US4757551A (en) | Character recognition method and system capable of recognizing slant characters | |
CN101453575B (zh) | 一种视频字幕信息提取方法 | |
JP2000207489A (ja) | 文字抽出方法、装置および記録媒体 | |
JPH0418351B2 (ja) | ||
JPH07160812A (ja) | 画像処理装置及び方法 | |
JP4129320B2 (ja) | 画像処理装置及び記録媒体 | |
JPH0656618B2 (ja) | 画像情報の文字・図形分離方法 | |
JPH03126181A (ja) | 文書画像の領域分割方法 | |
KR940020246A (ko) | 문서인식장치의 영역분할 방법 | |
JP3417635B2 (ja) | 侵入物体認識方法 | |
JP4250316B2 (ja) | 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 | |
JPH04287179A (ja) | 画像処理装置 | |
JP2775807B2 (ja) | 文字認識方法 | |
JP2002109470A (ja) | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
JPH09204525A (ja) | 画像像域分離装置及びその方法 | |
JP2789622B2 (ja) | 文字/図形領域判定装置 | |
JPH0540848A (ja) | 文書画像の領域抽出方法 | |
JP2001291056A (ja) | 文書画像認識装置及び記録媒体 | |
JP2743378B2 (ja) | 文字認識方法 | |
JPH0795336B2 (ja) | 文字認識方式 | |
JPS6361382A (ja) | 線画像からの文字成分除去方法 | |
JP2926842B2 (ja) | 文字切出し回路 | |
JP2899356B2 (ja) | 文字認識装置 | |
JPH08214150A (ja) | 二値イメージ出力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080513 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080519 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |