JP2000057262A - 画像処理装置及び記録媒体 - Google Patents

画像処理装置及び記録媒体

Info

Publication number
JP2000057262A
JP2000057262A JP10219295A JP21929598A JP2000057262A JP 2000057262 A JP2000057262 A JP 2000057262A JP 10219295 A JP10219295 A JP 10219295A JP 21929598 A JP21929598 A JP 21929598A JP 2000057262 A JP2000057262 A JP 2000057262A
Authority
JP
Japan
Prior art keywords
image
black
character
white
inverted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10219295A
Other languages
English (en)
Other versions
JP4129320B2 (ja
Inventor
Harunobu Mori
晴信 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP21929598A priority Critical patent/JP4129320B2/ja
Publication of JP2000057262A publication Critical patent/JP2000057262A/ja
Application granted granted Critical
Publication of JP4129320B2 publication Critical patent/JP4129320B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 白地に黒色文字と黒地に白色文字のどちらか
の可能性がある文字領域を持つ文書画像から文字を自動
的に抽出する画像処理装置を提供すること。 【解決手段】 2値化されている原画像M2及び反転画
像M3それぞれの画像に対して画像内の全ての黒画素に
対して白画素までの最短距離値M5を求め、黒画素連結
領域それぞれに関して前記距離変換手段で求めた最短距
離値M5の最大値である最大距離値を求め、求めた1又
は2以上の最大距離値に基づいて前記原画像又は前記反
転画像のどちらかを選択する。これにより、文字を構成
する黒画素連結領域がその他の領域に比べて最大距離値
が大きくなる、すなわち太さが太くなると共に、面積も
大きいことを利用して、白地に黒文字と黒地に白文字の
場合とを判別することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像中より文
字を抽出する画像処理装置及び記録媒体に関するもの
で、特に白地に黒色文字と黒地に白色文字のどちらかの
可能性がある文字領域を持つ文書画像から文字を自動的
に抽出し認識するために利用される。
【0002】
【従来の技術】従来の白地に黒色文字と黒地に白色文字
の判別を行う方法としては、特公平5−65911号公
報に示されているように、2値画像を膨張させ、領域の
特徴量があらかじめ設定した文字や数字の特徴量と類似
するかどうかの比較を行う方法や、特開平6−2668
97号公報に示されているように、画像に占める黒画素
の割合で選択を行う方法などがある。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
技術において、例えば輪郭のみで構成されているような
修飾文字の場合には、2値画像を膨張させた結果の領域
に関する特徴量(縦横比等)だけでは輪郭線が文字の構
成要素なのか、輪郭線の中が文字(白黒反転画像では黒
色文字になる)であるのかを判別することは難しい。ま
た、黒画素の割合は文字によって差があるため、対象文
字列によっては画像の選択を誤る可能性がある。本発明
は上記問題点を解決するためになされたもので、白地に
黒色文字と黒地に白色文字のどちらかの可能性がある文
字領域を持つ文書画像から文字を自動的に抽出する画像
処理装置及び記録媒体を提供することを目的とする。
【0004】
【課題を解決するための手段】本発明の画像処理装置
は、2値化されている原画像及び該原画像が白黒反転さ
れている反転画像それぞれの画像に対して画像内の全て
の黒画素に対して白画素までの最短距離値を求める距離
変換手段と、黒画素連結領域それぞれに関して前記距離
変換手段で求めた最短距離値の最大値である最大距離値
を求める最大算出手段と、求めた1又は2以上の最大距
離値に基づいて前記原画像又は前記反転画像のどちらか
を選択する選択手段と、を備えるものである。
【0005】また、前記選択手段は、前記最大算出手段
で求めた黒画素連結領域毎の最大距離値の画像全体での
平均値と画像全体の黒画素数との積の大小に基づいて前
記原画像又は前記反転画像のどちらかを選択するもので
あることで、画像全体黒画素数を加味して選択すること
ができる。さらに、本発明の画像処理装置は、2値化さ
れている原画像及び該原画像が白黒反転されている反転
画像それぞれの画像に対して文字認識処理を行う文字認
識手段と、文字認識用辞書との類似度の画像全体での和
の大小に基づいて前記原画像又は前記反転画像のどちら
かを選択する選択手段と、を備えるものである。
【0006】また、本発明は、コンピュータを上記画像
処理装置として機能させるためのプログラムを記録した
コンピュータ読み取り可能な記録媒体である。本発明
は、文字を構成する黒画素連結領域がその他の領域に比
べて最大距離値が大きくなる、すなわち太さが太くなる
と共に、面積も大きいことを利用することで、白地に黒
文字と黒地に白文字の場合とを判別することを可能とす
るものである。また、文字認識結果を利用して、文字と
して意味があると考えられる領域の多い方を選択するこ
とで、白地に黒文字と黒地に白文字の場合とを判別する
ことを可能とするものである。
【0007】
【発明の実施の形態】以下に、本発明による画像処理装
置の実施の形態について、図1〜図6に基づき説明す
る。ここでは画像全体を処理対象として説明するが、画
像の一部分を処理対象としてもかまわない。 (1)第1実施の形態 図1は、本発明を適用した第1実施の形態システムの構
成を示す機能ブロック図である。Sは文書を入力するス
キャナ、M1は入力画像用メモリ、M2は2値画像用メ
モリ、M3は反転画像用メモリ、M4はラベル画像用メ
モリ、M5は距離値格納用メモリ、Rはプログラム用R
OM、PはR内のプログラムに従って処理の流れを制御
する制御部である。図2は、第1実施の形態の処理の流
れを示すフローチャートである。
【0008】画像より文字を次のように抽出する。 〔ステップS1〕スキャナSから入力した画像は、入力
画像用メモリM1に転送されるようにする。画像の格納
方法は、画像(横方向:X画素数,縦方向:Y画素数)
に対し、画像左上の画素から画像右下の画素へと順に、
画素の輝度値(0〜255)を1byteずつメモリに
格納していく。すなわち座標 (x,y)=(0,0)〜(X−
1,Y−1) の輝度値を、メモリの(x+X×y)番目
のアドレスに1byte単位で格納する。画像1枚につ
きメモリ容量は(X×Y)byte必要である。
【0009】〔ステップS2〕制御部Pは入力画像用メ
モリM1内の画像を2値化して、2値画像用メモリM2
に1(黒)又は0(白)を格納する。2値化の方法とし
ては、あらかじめしきい値Thの値を決めておき、 M1(x,y)<Th ならば M2(x,y)←1 M1(x,y)≧Th ならば M2(x,y)←0 とする固定しきい値法や、画像の位置によってしきい値
を変える動的しきい値法等がある。図3は2値化した画
像の一例である。
【0010】〔ステップS3〕制御部Pは2値画像用メ
モリM2に格納された画像に対し、黒画素連結領域毎に
ラベリングを行い、求めたラベル画像をラベル画像用メ
モリM4に格納する。
【0011】〔ステップS4〕制御部Pは2値画像用メ
モリM2に格納された画像全体を走査し、ある任意の座
標の画素が黒である場合、その画素から白画素までの最
短距離を求め、求めた値を距離値格納用メモリM5に格
納する。図4は、距離値格納用メモリM5内の記憶内容
の一例である。図中の"1","2","3"は格納された距離
値を表している。
【0012】〔ステップS5〕制御部Pはラベル画像用
メモリM4と距離値格納用メモリM5を同時に走査し、
ラベル値毎の最大距離値を求め、求めた最大距離値の画
像全体での平均値Rbを計算する。なお計算前に、最大
距離値があらかじめ定めたしきい値Thr以下(又は以
上)の領域を削除したり、黒画素連結領域の大きさに応
じて領域を削除したりすることで、文字以外の領域を削
除しておくことも可能である。
【0013】〔ステップS6〕制御部Pは2値画像用メ
モリM2全体を走査し、画像内の黒画素数Abを求め
る。
【0014】〔ステップS7〕制御部Pは2値画像用メ
モリM2全体を走査し、 M2(x,y)=0 ならば M3(x,y)←1 M2(x,y)=1 ならば M3(x,y)←0 を代入することで、白黒が反転した画像を反転画像用メ
モリM3内に作成する。この時反転画像用メモリM3に
おいて、画像の端に接する黒画素連結領域は、文字では
無いとみなし、その領域内は0クリアしておく。
【0015】〔ステップS8〜S11〕ステップS3〜
S6と同様の処理を2値画像用メモリM2の代わりに反
転画像用メモリM3を対象として行い、最大距離値の平
均Rwと黒画素数Awを求める。
【0016】〔ステップS12〕制御部Pは、求めたA
b,Aw,Rb,Rwを基に、 Ab×Rb≧Aw×Rw ならば 2値画像用メモリM
2 Ab×Rb<Aw×Rw ならば 反転画像用メモリM
3 の中にある画像を文字が存在する方として選択する。つ
まり、面積が大きく、最大距離値の平均、すなわち太さ
が太い領域が存在する画像を、文字が存在する方として
選択する。
【0017】(2)第2実施の形態 図5は、本発明を適用した第2実施の形態システムの構
成を示す機能ブロック図である。Sは文書を入力するス
キャナ、M1は入力画像用メモリ、M2は2値画像用メ
モリ、M3は反転画像用メモリ、Dは文字特徴辞書、R
はプログラム用ROM、PはR内のプログラムに従って
処理の流れを制御する制御部である。図6は、第2実施
の形態の処理の流れを示すフローチャートである。画像
より文字を次のように抽出する。
【0018】〔ステップS21からS22〕第1実施の
形態のステップS1〜S2と同じ。 〔ステップS23〕制御部Pは2値画像用メモリM2に
格納された画像に対し、文字切り出し処理を行い、文字
1文字毎の領域座標を求める。文字切り出し方法は数多
く存在し、どの方法を使用してもかまわない。
【0019】〔ステップS24〕制御部Pは2値画像用
メモリM2に格納された画像に対し、前ステップで切り
出した文字領域から文字特徴量を求める。なお、文字認
識に使用される文字特徴量には様々な種類が存在してお
り、以下に記述する特徴量に限定するものではない。こ
こでは一例として、文字領域を縦横それぞれ6分割して
36のメッシュとし、メッシュ一つずつに対して黒画素
密度m1,…,m36を求める。
【0020】〔ステップS25〕制御部PはステップS
24で求めた特徴量m1,…,m36と文字特徴辞書Dに
格納された特徴量mi1,…,mi36(i:辞書に登録
された文字数)との差の2乗和を求め、最小となる値の
逆数dを類似度とする。画像内のすべての文字に対して
類似度を求めて、求めた類似度の和をdbとする。
【0021】〔ステップS26〕第1実施の形態のステ
ップS7と同じ。 〔ステップS27〜S29〕ステップS23〜S25と
同様の処理を2値画像用メモリM2の代わりに反転画像
用メモリM3を対象として行い、類似度の和をdwとす
る。
【0022】〔ステップS30〕制御部Pは、求めたd
b、dwを基に、 db≧dw ならば 2値画像用メモリM2 db<dw ならば 反転画像用メモリM3 の中にある画像を文字が存在する方として選択する。つ
まり、文字として意味があると考えられる領域の多い画
像を、文字が存在する方として選択する。
【0023】上記処理によって選択された画像に対して
は、文字認識処理を行うことにより文字コードに変換す
ることなどが可能である。なお、本発明は上記実施の形
態に限定されるものではない。本発明は、コンピュータ
を上記画像処理装置として機能させるためのプログラム
を記録したコンピュータ読み取り可能な記録媒体であっ
ても良い。
【0024】
【発明の効果】以上のように本発明の画像処理装置は、
文字を構成する黒画素連結領域がその他の領域に比べて
最大距離値が大きくなる、すなわち太さが太くなると共
に、面積も大きいことを利用することで、白地に黒文字
と黒地に白文字の場合とを判別することができる。ま
た、文字認識結果を利用して、文字として意味があると
考えられる領域の多い方を選択することで、白地に黒文
字と黒地に白文字の場合とを判別することができる。
【図面の簡単な説明】
【図1】本発明の第1実施の形態システムの構成を示す
機能ブロック図。
【図2】本発明の第1実施の形態システムの動作を示す
フローチャ−ト。
【図3】文字領域を含む画像の一例を示す図。
【図4】距離値格納用メモリ内の記憶内容を示す図。
【図5】本発明の第2実施の形態システムの構成を示す
機能ブロック図。
【図6】本発明の第2実施の形態システムの動作を示す
フローチャ−ト。
【符号の簡単な説明】
S スキャナ M1 入力画像用メモリ M2 2値画像用メモリ M3 反転画像用メモリ M4 ラベル画像用メモリ M5 距離値格納用メモリ D 文字特徴辞書 R プログラム用ROM P 制御部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 2値化されている原画像及び該原画像が
    白黒反転されている反転画像それぞれの画像に対して画
    像内の全ての黒画素に対して白画素までの最短距離値を
    求める距離変換手段と、黒画素連結領域それぞれに関し
    て前記距離変換手段で求めた最短距離値の最大値である
    最大距離値を求める最大算出手段と、求めた1又は2以
    上の最大距離値に基づいて前記原画像又は前記反転画像
    のどちらかを選択する選択手段と、を備えることを特徴
    とする画像処理装置。
  2. 【請求項2】 前記選択手段は、前記最大算出手段で求
    めた黒画素連結領域毎の最大距離値の画像全体での平均
    値と画像全体の黒画素数との積の大小に基づいて前記原
    画像又は前記反転画像のどちらかを選択するものである
    ことを特徴とする請求項1記載の画像処理装置。
  3. 【請求項3】 2値化されている原画像及び該原画像が
    白黒反転されている反転画像それぞれの画像に対して文
    字認識処理を行う文字認識手段と、文字認識用辞書との
    類似度の画像全体での和の大小に基づいて前記原画像又
    は前記反転画像のどちらかを選択する選択手段と、を備
    えることを特徴とする画像処理装置。
  4. 【請求項4】 コンピュータを請求項1乃至3いずれか
    に記載の画像処理装置として機能させるためのプログラ
    ムを記録したことを特徴とするコンピュータ読み取り可
    能な記録媒体。
JP21929598A 1998-08-03 1998-08-03 画像処理装置及び記録媒体 Expired - Fee Related JP4129320B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21929598A JP4129320B2 (ja) 1998-08-03 1998-08-03 画像処理装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21929598A JP4129320B2 (ja) 1998-08-03 1998-08-03 画像処理装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2000057262A true JP2000057262A (ja) 2000-02-25
JP4129320B2 JP4129320B2 (ja) 2008-08-06

Family

ID=16733269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21929598A Expired - Fee Related JP4129320B2 (ja) 1998-08-03 1998-08-03 画像処理装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP4129320B2 (ja)

Also Published As

Publication number Publication date
JP4129320B2 (ja) 2008-08-06

Similar Documents

Publication Publication Date Title
US6347156B1 (en) Device, method and storage medium for recognizing a document image
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US7321688B2 (en) Image processor for character recognition
JP2001351066A (ja) 文書認識処理のための装置、方法及び記録媒体
EP1017011A2 (en) Block selection of table features
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JPH0418351B2 (ja)
JP3938005B2 (ja) 画像処理装置および画像処理方法
JP2000057262A (ja) 画像処理装置及び記録媒体
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2858530B2 (ja) エッジ強調装置
JPH04287179A (ja) 画像処理装置
JP2002109470A (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JPH09204525A (ja) 画像像域分離装置及びその方法
JPH09186858A (ja) 画像処理方法及び装置、及びコンピュータ制御装置
JP2775807B2 (ja) 文字認識方法
JP2002077631A (ja) 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体
JP7459151B2 (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JP2001291056A (ja) 文書画像認識装置及び記録媒体
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JP2926842B2 (ja) 文字切出し回路
JP3906723B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0676105A (ja) 文書認識システム
JPH0795336B2 (ja) 文字認識方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080519

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees