JP4129320B2 - 画像処理装置及び記録媒体 - Google Patents

画像処理装置及び記録媒体 Download PDF

Info

Publication number
JP4129320B2
JP4129320B2 JP21929598A JP21929598A JP4129320B2 JP 4129320 B2 JP4129320 B2 JP 4129320B2 JP 21929598 A JP21929598 A JP 21929598A JP 21929598 A JP21929598 A JP 21929598A JP 4129320 B2 JP4129320 B2 JP 4129320B2
Authority
JP
Japan
Prior art keywords
image
black
character
processing apparatus
maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21929598A
Other languages
English (en)
Other versions
JP2000057262A (ja
Inventor
晴信 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP21929598A priority Critical patent/JP4129320B2/ja
Publication of JP2000057262A publication Critical patent/JP2000057262A/ja
Application granted granted Critical
Publication of JP4129320B2 publication Critical patent/JP4129320B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書画像中より文字を抽出する画像処理装置及び記録媒体に関するもので、特に白地に黒色文字と黒地に白色文字のどちらかの可能性がある文字領域を持つ文書画像から文字を自動的に抽出し認識するために利用される。
【0002】
【従来の技術】
従来の白地に黒色文字と黒地に白色文字の判別を行う方法としては、特公平5−65911号公報に示されているように、2値画像を膨張させ、領域の特徴量があらかじめ設定した文字や数字の特徴量と類似するかどうかの比較を行う方法や、特開平6−266897号公報に示されているように、画像に占める黒画素の割合で選択を行う方法などがある。
【0003】
【発明が解決しようとする課題】
しかしながら、従来の技術において、例えば輪郭のみで構成されているような修飾文字の場合には、2値画像を膨張させた結果の領域に関する特徴量(縦横比等)だけでは輪郭線が文字の構成要素なのか、輪郭線の中が文字(白黒反転画像では黒色文字になる)であるのかを判別することは難しい。また、黒画素の割合は文字によって差があるため、対象文字列によっては画像の選択を誤る可能性がある。
本発明は上記問題点を解決するためになされたもので、白地に黒色文字と黒地に白色文字のどちらかの可能性がある文字領域を持つ文書画像から文字を自動的に抽出する画像処理装置及び記録媒体を提供することを目的とする。
【0004】
【課題を解決するための手段】
本発明の画像処理装置は、2値化されている原画像及び該原画像が白黒反転されている反転画像それぞれの画像に対して画像内の全ての黒画素に対して白画素までの最短距離値を求める距離変換手段と、黒画素連結領域それぞれに関して前記距離変換手段で求めた最短距離値の最大値である最大距離値を求める最大算出手段と、求めた1又は2以上の最大距離値に基づいて前記原画像又は前記反転画像のどちらかを選択する選択手段と、を備えるものである。
【0005】
また、前記選択手段は、前記最大算出手段で求めた黒画素連結領域毎の最大距離値の画像全体での平均値と画像全体の黒画素数との積の大小に基づいて前記原画像又は前記反転画像のどちらかを選択するものであることで、画像全体黒画素数を加味して選択することができる。
さらに、本発明の画像処理装置は、2値化されている原画像及び該原画像が白黒反転されている反転画像それぞれの画像に対して文字認識処理を行う文字認識手段と、文字認識用辞書との類似度の画像全体での和の大小に基づいて前記原画像又は前記反転画像のどちらかを選択する選択手段と、を備えるものである。
【0006】
また、本発明は、コンピュータを上記画像処理装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明は、文字を構成する黒画素連結領域がその他の領域に比べて最大距離値が大きくなる、すなわち太さが太くなると共に、面積も大きいことを利用することで、白地に黒文字と黒地に白文字の場合とを判別することを可能とするものである。
また、文字認識結果を利用して、文字として意味があると考えられる領域の多い方を選択することで、白地に黒文字と黒地に白文字の場合とを判別することを可能とするものである。
【0007】
【発明の実施の形態】
以下に、本発明による画像処理装置の実施の形態について、図1〜図6に基づき説明する。ここでは画像全体を処理対象として説明するが、画像の一部分を処理対象としてもかまわない。
(1)第1実施の形態
図1は、本発明を適用した第1実施の形態システムの構成を示す機能ブロック図である。Sは文書を入力するスキャナ、M1は入力画像用メモリ、M2は2値画像用メモリ、M3は反転画像用メモリ、M4はラベル画像用メモリ、M5は距離値格納用メモリ、Rはプログラム用ROM、PはR内のプログラムに従って処理の流れを制御する制御部である。図2は、第1実施の形態の処理の流れを示すフローチャートである。
【0008】
画像より文字を次のように抽出する。
〔ステップS1〕
スキャナSから入力した画像は、入力画像用メモリM1に転送されるようにする。画像の格納方法は、画像(横方向:X画素数,縦方向:Y画素数)に対し、画像左上の画素から画像右下の画素へと順に、画素の輝度値(0〜255)を1byteずつメモリに格納していく。すなわち座標 (x,y)=(0,0)〜(X−1,Y−1) の輝度値を、メモリの(x+X×y)番目のアドレスに1byte単位で格納する。画像1枚につきメモリ容量は(X×Y)byte必要である。
【0009】
〔ステップS2〕
制御部Pは入力画像用メモリM1内の画像を2値化して、2値画像用メモリM2に1(黒)又は0(白)を格納する。2値化の方法としては、あらかじめしきい値Thの値を決めておき、
M1(x,y)<Th ならば M2(x,y)←1
M1(x,y)≧Th ならば M2(x,y)←0
とする固定しきい値法や、画像の位置によってしきい値を変える動的しきい値法等がある。図3は2値化した画像の一例である。
【0010】
〔ステップS3〕
制御部Pは2値画像用メモリM2に格納された画像に対し、黒画素連結領域毎にラベリングを行い、求めたラベル画像をラベル画像用メモリM4に格納する。
【0011】
〔ステップS4〕
制御部Pは2値画像用メモリM2に格納された画像全体を走査し、ある任意の座標の画素が黒である場合、その画素から白画素までの最短距離を求め、求めた値を距離値格納用メモリM5に格納する。図4は、距離値格納用メモリM5内の記憶内容の一例である。図中の"1","2","3"は格納された距離値を表している。
【0012】
〔ステップS5〕
制御部Pはラベル画像用メモリM4と距離値格納用メモリM5を同時に走査し、ラベル値毎の最大距離値を求め、求めた最大距離値の画像全体での平均値Rbを計算する。
なお計算前に、最大距離値があらかじめ定めたしきい値Thr以下(又は以上)の領域を削除したり、黒画素連結領域の大きさに応じて領域を削除したりすることで、文字以外の領域を削除しておくことも可能である。
【0013】
〔ステップS6〕
制御部Pは2値画像用メモリM2全体を走査し、画像内の黒画素数Abを求める。
【0014】
〔ステップS7〕
制御部Pは2値画像用メモリM2全体を走査し、
M2(x,y)=0 ならば M3(x,y)←1
M2(x,y)=1 ならば M3(x,y)←0
を代入することで、白黒が反転した画像を反転画像用メモリM3内に作成する。
この時反転画像用メモリM3において、画像の端に接する黒画素連結領域は、文字では無いとみなし、その領域内は0クリアしておく。
【0015】
〔ステップS8〜S11〕
ステップS3〜S6と同様の処理を2値画像用メモリM2の代わりに反転画像用メモリM3を対象として行い、最大距離値の平均Rwと黒画素数Awを求める。
【0016】
〔ステップS12〕
制御部Pは、求めたAb,Aw,Rb,Rwを基に、
Ab×Rb≧Aw×Rw ならば 2値画像用メモリM2
Ab×Rb<Aw×Rw ならば 反転画像用メモリM3
の中にある画像を文字が存在する方として選択する。つまり、面積が大きく、最大距離値の平均、すなわち太さが太い領域が存在する画像を、文字が存在する方として選択する。
【0017】
(2)第2実施の形態
図5は、本発明を適用した第2実施の形態システムの構成を示す機能ブロック図である。Sは文書を入力するスキャナ、M1は入力画像用メモリ、M2は2値画像用メモリ、M3は反転画像用メモリ、Dは文字特徴辞書、Rはプログラム用ROM、PはR内のプログラムに従って処理の流れを制御する制御部である。図6は、第2実施の形態の処理の流れを示すフローチャートである。
画像より文字を次のように抽出する。
【0018】
〔ステップS21からS22〕
第1実施の形態のステップS1〜S2と同じ。
〔ステップS23〕
制御部Pは2値画像用メモリM2に格納された画像に対し、文字切り出し処理を行い、文字1文字毎の領域座標を求める。文字切り出し方法は数多く存在し、どの方法を使用してもかまわない。
【0019】
〔ステップS24〕
制御部Pは2値画像用メモリM2に格納された画像に対し、前ステップで切り出した文字領域から文字特徴量を求める。なお、文字認識に使用される文字特徴量には様々な種類が存在しており、以下に記述する特徴量に限定するものではない。ここでは一例として、文字領域を縦横それぞれ6分割して36のメッシュとし、メッシュ一つずつに対して黒画素密度m1,…,m36を求める。
【0020】
〔ステップS25〕
制御部PはステップS24で求めた特徴量m1,…,m36と文字特徴辞書Dに格納された特徴量mi1,…,mi36(i:辞書に登録された文字数)との差の2乗和を求め、最小となる値の逆数dを類似度とする。画像内のすべての文字に対して類似度を求めて、求めた類似度の和をdbとする。
【0021】
〔ステップS26〕
第1実施の形態のステップS7と同じ。
〔ステップS27〜S29〕
ステップS23〜S25と同様の処理を2値画像用メモリM2の代わりに反転画像用メモリM3を対象として行い、類似度の和をdwとする。
【0022】
〔ステップS30〕
制御部Pは、求めたdb、dwを基に、
db≧dw ならば 2値画像用メモリM2
db<dw ならば 反転画像用メモリM3
の中にある画像を文字が存在する方として選択する。つまり、文字として意味があると考えられる領域の多い画像を、文字が存在する方として選択する。
【0023】
上記処理によって選択された画像に対しては、文字認識処理を行うことにより文字コードに変換することなどが可能である。
なお、本発明は上記実施の形態に限定されるものではない。
本発明は、コンピュータを上記画像処理装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であっても良い。
【0024】
【発明の効果】
以上のように本発明の画像処理装置は、文字を構成する黒画素連結領域がその他の領域に比べて最大距離値が大きくなる、すなわち太さが太くなると共に、面積も大きいことを利用することで、白地に黒文字と黒地に白文字の場合とを判別することができる。また、文字認識結果を利用して、文字として意味があると考えられる領域の多い方を選択することで、白地に黒文字と黒地に白文字の場合とを判別することができる。
【図面の簡単な説明】
【図1】本発明の第1実施の形態システムの構成を示す機能ブロック図。
【図2】本発明の第1実施の形態システムの動作を示すフローチャ−ト。
【図3】文字領域を含む画像の一例を示す図。
【図4】距離値格納用メモリ内の記憶内容を示す図。
【図5】本発明の第2実施の形態システムの構成を示す機能ブロック図。
【図6】本発明の第2実施の形態システムの動作を示すフローチャ−ト。
【符号の簡単な説明】
S スキャナ
M1 入力画像用メモリ
M2 2値画像用メモリ
M3 反転画像用メモリ
M4 ラベル画像用メモリ
M5 距離値格納用メモリ
D 文字特徴辞書
R プログラム用ROM
P 制御部

Claims (2)

  1. 画像中より文字を抽出する画像処理装置であって、
    2値化されている原画像及び該原画像が白黒反転されている反転画像それぞれの画像に対して画像内の全ての黒画素に対して白画素までの最短距離値を求める距離変換手段と、
    2値化されている原画像及び反転画像それぞれの黒画素連結領域それぞれに関して前記距離変換手段で求めた最短距離値の最大値である最大距離値を求める最大算出手段と、
    2値化されている原画像及び反転画像それぞれに関して前記最大算出手段で求めた黒画素連結領域毎の最大距離値の画像全体での平均値と画像全体の黒画素数との積を求め、前記原画像又は前記反転画像のうち、当該積の大きい方の画像を文字が存在する画像として選択する選択手段と
    を備え、該選択手段によって選択された画像中より文字を抽出することを特徴とする画像処理装置。
  2. コンピュータを請求項1記載の画像処理装置として機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP21929598A 1998-08-03 1998-08-03 画像処理装置及び記録媒体 Expired - Fee Related JP4129320B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21929598A JP4129320B2 (ja) 1998-08-03 1998-08-03 画像処理装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21929598A JP4129320B2 (ja) 1998-08-03 1998-08-03 画像処理装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2000057262A JP2000057262A (ja) 2000-02-25
JP4129320B2 true JP4129320B2 (ja) 2008-08-06

Family

ID=16733269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21929598A Expired - Fee Related JP4129320B2 (ja) 1998-08-03 1998-08-03 画像処理装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP4129320B2 (ja)

Also Published As

Publication number Publication date
JP2000057262A (ja) 2000-02-25

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
US4757551A (en) Character recognition method and system capable of recognizing slant characters
CN101453575B (zh) 一种视频字幕信息提取方法
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JPH0418351B2 (ja)
JPH07160812A (ja) 画像処理装置及び方法
JP4129320B2 (ja) 画像処理装置及び記録媒体
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
JPH03126181A (ja) 文書画像の領域分割方法
KR940020246A (ko) 문서인식장치의 영역분할 방법
JP3417635B2 (ja) 侵入物体認識方法
JP4250316B2 (ja) 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体
JPH04287179A (ja) 画像処理装置
JP2775807B2 (ja) 文字認識方法
JP2002109470A (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2789622B2 (ja) 文字/図形領域判定装置
JPH0540848A (ja) 文書画像の領域抽出方法
JP2001291056A (ja) 文書画像認識装置及び記録媒体
JP2743378B2 (ja) 文字認識方法
JPH0795336B2 (ja) 文字認識方式
JPS6361382A (ja) 線画像からの文字成分除去方法
JP2926842B2 (ja) 文字切出し回路
JP2899356B2 (ja) 文字認識装置
JPH08214150A (ja) 二値イメージ出力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080519

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees