JP2000348138A - かすれ補正装置、かすれ補正方法および記録媒体 - Google Patents

かすれ補正装置、かすれ補正方法および記録媒体

Info

Publication number
JP2000348138A
JP2000348138A JP11154675A JP15467599A JP2000348138A JP 2000348138 A JP2000348138 A JP 2000348138A JP 11154675 A JP11154675 A JP 11154675A JP 15467599 A JP15467599 A JP 15467599A JP 2000348138 A JP2000348138 A JP 2000348138A
Authority
JP
Japan
Prior art keywords
image data
degree
blurring
blur
labeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11154675A
Other languages
English (en)
Other versions
JP3845227B2 (ja
Inventor
Hiroshi Sumiya
浩 角谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP15467599A priority Critical patent/JP3845227B2/ja
Publication of JP2000348138A publication Critical patent/JP2000348138A/ja
Application granted granted Critical
Publication of JP3845227B2 publication Critical patent/JP3845227B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 従来、英文字原稿の文字認識精度を向上させ
るイメージデータにおけるかすれの自動補正は、実際に
文字認識処理を行い、その過程において取得される「認
識の信頼度」を判定基準としてイメージデータの濃度補
正を行っていた。しかしながら、従来技術では同一デー
タに対して数回の「文字認識処理」を行うため、文字認
識自体に時間が掛かり、濃度補正処理の性能が著しく悪
いという問題点があった。 【解決手段】 英文字原稿のイメージデータにおけるか
すれ補正装置において、イメージデータを一時記憶部に
取り込み、取り込んだイメージデータにおける周辺分布
による分割数とラベリング数を算出し、ラベリング数を
周辺分布による分割数で除算してかすれ度を求め、かす
れ度が所定の値以上ならばイメージデータの濃度補正を
行う手段を設けることにより、イメージデータの英文字
のかすれ度を自動的に判定し、イメージデータを適正な
濃度に補正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、英文字原稿のイ
メージデータにおけるかすれ補正装置、かすれ補正方法
および記録媒体に関するものであり、特に、文字列イメ
ージの「周辺分布による分割数」および「ラベリング
数」を使用することによって、イメージデータの「かす
れ度」を判定し、イメージデータに適正な濃度補正を行
う。
【0002】なお、この明細書において、「周辺分布に
よる分割数」という用語は、格子状に黒画素または白画
素にて表現されたイメージ画像である2値画像を例にし
て説明すると、「周辺分布」は画像の黒画素データをX
軸およびY軸などの直線に投影したもので、その軸上に
存在する黒画素の累積数をヒストグラムなどによって表
現したものであり、その周辺分布データを黒画素が存在
しない空白帯によって分割した場合の数を指す。また、
「ラベリング数」という用語は、2値画像を例にして説
明すると、画像中における黒隗の数であり、同一領域に
属する点には同じラベルをつけ、異なった領域には他の
ラベルをつけていった場合のラベルの種類数を指す。
【0003】
【従来の技術】従来、英文字原稿の文字認識精度を向上
させるイメージデータにおけるかすれの自動補正は、実
際に文字認識処理を行い、その過程において取得される
「認識の信頼度」を判定基準としてイメージデータの濃
度補正を行っていた。
【0004】図4に、従来の英文字原稿の文字認識に使
用するイメージデータにおける文字のかすれの補正処理
の処理フローチャート例を示す。なお、この例では、イ
メージデータは2値データとしている。
【0005】以下、このフローにしたがって、動作を説
明する。
【0006】ステップS401:イメージデータを読み
出し、一時記憶部に格納する。
【0007】ステップS402:イメージデータに対
し、文字認識処理を実行する。
【0008】ステップS403:認識結果の信頼度が適
正かを判定する。適正ならばステップS404に進み、
適正でないならばステップS405に進む。
【0009】ステップS404:イメージデータを次の
処理に渡す。そして、処理を終了する。
【0010】ステップS405:最初の処理かを判定す
る。最初の処理ならばステップS406に進み、最初の
処理でないならばステップS407に進む。
【0011】ステップS406:イメージデータに膨張
処理の補正を行う。そして、ステップS402に戻る。
なお、膨張処理とはイメージデータの文字の部分、つま
り黒の部分を文字の輪郭に沿って数画素分を黒にするこ
とにより、文字を膨張させ、かすれを補正する処理であ
る。また、収縮処理はその逆でイメージデータの文字の
部分、つまり黒の部分を文字の輪郭に沿って数画素分を
白にし、必要以上に膨張処理を施したとき、元に戻す場
合に使用する。
【0012】ステップS407:ステップS402で処
理した文字認識処理の信頼度が前回処理した時の信頼度
より向上したかを判定する。前回より向上したならばス
テップS408に進み、前回より向上していないならば
ステップS410に進む。
【0013】ステップS408:前回の補正が膨張処理
かを判定する。膨張処理ならばステップS409に進
み、膨張処理でないならばステップS410に進む。
【0014】ステップS409:イメージデータに膨張
処理の補正を行う。そして、ステップS402に戻る。
【0015】ステップS410:イメージデータに収縮
処理の補正を行う。そして、ステップS402に戻る。
【0016】このような処理で、イメージデータを適正
な濃度に補正して、イメージデータの英文字のかすれを
補正している。
【0017】図5に、英文字原稿の文字認識に使用する
イメージデータにおける文字のかすれの補正例図を示
す。図5(a)は補正前のイメージデータ、図5(b)
は補正後のイメージデータである。補正前のイメージデ
ータの1、2、6、7番目の「y」、「o」、「z」、
「a」などの文字は所々文字がかすれて分断されている
が、補正後のイメージデータでは膨張処理の補正によ
り、かすれによる分断はなくなっている。
【0018】
【発明が解決しようとする課題】しかしながら、図4に
示す従来技術では、同一データに対して数回の「文字認
識処理」を行うことになり、文字認識自体に時間が掛か
り、濃度補正処理の性能が著しく悪いという問題点があ
った。
【0019】また、イメージデータの濃度は適切であっ
ても、文字自体が不適切のため文字認識処理ができない
などの問題点もあった。
【0020】
【課題を解決するための手段】この発明は上記のような
問題点を考慮してなされたもので、英文字原稿のイメー
ジデータにおけるかすれ補正装置において、イメージデ
ータを一時記憶部に取り込み、取り込んだイメージデー
タにおける周辺分布による分割数とラベリング数を算出
し、ラベリング数を周辺分布による分割数で除算してか
すれ度を求め、かすれ度が所定値以上ならばイメージデ
ータの濃度補正を行う手段を設けることにより、イメー
ジデータの英文字のかすれ度を自動的に判定し、イメー
ジデータを適正な濃度に補正することが可能となる。
【0021】
【発明の実施の形態】(1)英文字原稿のイメージデー
タにおけるかすれ補正装置において、イメージデータを
一時記憶部に取り込むイメージデータ取込部と、取り込
んだイメージデータの周辺分布による分割数を算出する
分割数算出部と、取り込んだイメージデータのラベリン
グ数を算出するラベリング数算出部と、算出した周辺分
布による分割数とラベリング数とを使用し、ラベリング
数を周辺分布による分割数で除算して求めるかすれ度が
所定値以上かを判定するかすれ度判定部と、かすれ度の
判定により実行され、イメージデータが2値データなら
ば膨張または収縮処理を行い、多値データならばしきい
値を増加または減少させて2値化処理を行うことでイメ
ージデータを濃度補正するイメージデータ補正部とを設
けることにより、イメージデータの英文字のかすれ度を
自動的に判定し、イメージデータを適正な濃度に補正す
ることが可能となる。
【0022】(2)(1)記載のかすれ補正装置におい
て、イメージデータの文字サイズが小さい時に、イメー
ジデータを拡大処理するイメージデータ拡大部を設ける
ことにより、イメージデータの文字サイズの大きさにか
かわらず、一律の膨張または収縮処理を行うことが可能
となる。
【0023】(3)英文字原稿のイメージデータにおけ
るかすれ補正方法において、イメージデータを一時記憶
部に取り込み、取り込んだイメージデータにおける周辺
分布による分割数とラベリング数を算出し、ラベリング
数を周辺分布による分割数で除算してかすれ度を求め、
かすれ度が所定値以上ならばイメージデータの濃度補正
を行うことにより、イメージデータの英文字のかすれ度
を自動的に判定し、イメージデータを適正な濃度に補正
することが可能となる。
【0024】(4)(3)記載のかすれ補正方法におい
て、イメージデータの文字サイズが小さい時に、イメー
ジデータを拡大処理することにより、イメージデータの
文字サイズの大きさにかかわらず、一律の膨張または収
縮処理を行うことが可能となる。
【0025】(5)英文字原稿のイメージデータにおけ
るかすれを補正するプログラムを記録する記録媒体にお
いて、イメージデータを一時記憶部に取り込み、取り込
んだイメージデータにおける周辺分布による分割数とラ
ベリング数を算出し、ラベリング数を周辺分布による分
割数で除算してかすれ度を求め、かすれ度が所定値以上
ならばイメージデータの濃度補正を行うプログラムを記
録する記録媒体をコンピュータで実行することにより、
イメージデータの英文字のかすれ度を自動的に判定し、
イメージデータを適正な濃度に補正することが可能とな
る。
【0026】
【実施例】図1に、本発明の構成ブロック図を示す。図
中、1は英文字原稿のイメージデータにおけるかすれを
補正するかすれ補正装置であり、かすれ補正装置1はイ
メージデータを一時記憶部に取り込むイメージデータ取
込部101と、取り込んだイメージデータの文字サイズ
が小さい時に、イメージデータを拡大処理するイメージ
データ拡大部106と、取り込んだイメージデータの周
辺分布による分割数を算出する分割数算出部102と、
取り込んだイメージデータのラベリング数を算出するラ
ベリング数算出部103と、算出した周辺分布による分
割数とラベリング数とを使用し、ラベリング数を周辺分
布による分割数で除算して求めるかすれ度が所定値以上
かを判定するかすれ度判定部104と、かすれ度の判定
により実行され、イメージデータが2値データならば膨
張または収縮処理を行い、多値データならばしきい値を
増加または減少させて2値化処理を行うことでイメージ
データを濃度補正するイメージデータ補正部105とで
構成されている。
【0027】図2、図3を参照して、本発明のかすれ補
正装置の動作を説明する。図2は本発明のかすれ補正装
置の一実施例の処理フローチャート、図3はかすれ度の
説明図である。
【0028】以下、図2のフローにしたがって動作を説
明する。
【0029】ステップS201:イメージデータを取り
込み、一時記憶部に格納する。
【0030】ステップS202:イメージデータの文字
サイズが所定値より小さいならばイメージデータの拡大
処理を行う。これにより、イメージデータの文字サイズ
の大きさにかかわらず、一律の膨張または収縮処理を行
うことができる。
【0031】ステップS203:イメージデータの周辺
分布による分割数を算出する。
【0032】例えば、文字のかすれが少ない図3(a−
1)のイメージデータの場合、周辺分布による分割数は
16となり、文字のかすれが多い図3(b−1)のイメ
ージデータの場合、周辺分布による分割数は14とな
る。
【0033】ステップS204:イメージデータのラベ
リング数を算出する。
【0034】例えば、文字のかすれが少ない図3(a−
1)のイメージデータの場合、ラベリング数は18とな
り、文字のかすれが多い図3(b−1)のイメージデー
タの場合、ラベリング数は28となる。
【0035】ステップS205:ラベリング数を周辺分
布による分割数で除算し、かすれ度を算出し、一時記憶
部に記憶する。
【0036】したがって、文字のかすれが少ない図3
(a−1)のイメージデータのかすれ度は、(ラベリン
グ数/周辺分布による分割数)で、18/16=1.1
2となり、文字のかすれが多い図3(b−1)のイメー
ジデータのかすれ度は、(ラベリング数/周辺分布によ
る分割数)で、28/14=2.00となる。つまり、
英文字におけるかすれ度は1に近いほど、かすれが少な
い。
【0037】ステップS206:かすれ度が所定値より
小さいかを判定する。小さいならばステップS207に
進み、小さくないならばステップS210に進む。
【0038】ステップS207:かすれ度の変移が所定
値より小さいかを判定する。小さいならばステップS2
08に進み、小さくないならばステップS209に進
む。なお、この処理は黒画素の回りに黒画素を付着させ
る膨張処理が効果的に作用しているか否かを「かすれ
度」の変化具合によって判断しており、効果的に作用し
ている場合は一定間隔で「かすれ度」が減少していく
が、今までに比べ一定範囲を越える急激な減少が起こっ
た場合は「今回の膨張処理は不適切」と判断する。ま
た、ある回数の膨張処理を行っても「かすれ度」の変化
が見られない場合は、画像に対して本手法が有効でな
い、かすれ具合が大きすぎて本手法では適切なデータ補
正ができないと判断する。
【0039】ステップS208:イメージデータを次の
処理に渡す。そして、処理を終了する。
【0040】ステップS209:イメージデータが2値
データならば収縮処理、多値データならばしきい値を増
加させて2値化処理を行う。そして、処理を終了する。
【0041】ステップS210:かすれ度の変移が所定
値より小さいかを判定する。小さいならばステップS2
10に進み、小さくないならば処理を終了する。
【0042】ステップS211:イメージデータが2値
データならば膨張処理、多値データならばしきい値を減
少させて2値化処理を行う。そして、ステップS203
に戻る。
【0043】
【発明の効果】この発明は、上記に説明したような形態
で実施され、以下の効果がある。
【0044】英語の文字認識精度を向上させるイメージ
データにおける濃度補正を簡単かつ迅速に処理すること
が可能となる。
【図面の簡単な説明】
【図1】 本発明の構成ブロック図である。
【図2】 本発明のかすれ補正装置の一実施例の処理フ
ローチャートである。
【図3】 かすれ度の説明図である。
【図4】 従来の英文字原稿の文字認識に使用するイメ
ージデータにおける文字のかすれの補正処理の処理フロ
ーチャート例である。
【図5】 英文字原稿の文字認識に使用するイメージデ
ータにおける文字のかすれの補正例図である。
【符号の説明】
1 かすれ補正装置 101 イメージデータ取込部 102 分割数算出部 103 ラベリング数算出部 104 かすれ度判定部 105 イメージデータ補正部 106 イメージデータ拡大部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 英文字原稿のイメージデータにおけるか
    すれ補正装置において、 イメージデータを一時記憶部に取り込むイメージデータ
    取込部(101)と、取り込んだイメージデータの周辺
    分布による分割数を算出する分割数算出部(102)
    と、取り込んだイメージデータのラベリング数を算出す
    るラベリング数算出部(103)と、算出した周辺分布
    による分割数とラベリング数とを使用し、ラベリング数
    を周辺分布による分割数で除算して求めるかすれ度が所
    定値以上かを判定するかすれ度判定部(104)と、か
    すれ度の判定により実行され、イメージデータが2値デ
    ータならば膨張または収縮処理を行い、多値データなら
    ばしきい値を増加または減少させて2値化処理を行うこ
    とでイメージデータを濃度補正するイメージデータ補正
    部(105)とを設け、イメージデータの英文字のかす
    れ度を自動的に判定し、イメージデータを適正な濃度に
    補正することを特徴とするかすれ補正装置。
  2. 【請求項2】 イメージデータの文字サイズが小さい時
    に、イメージデータを拡大処理するイメージデータ拡大
    部(106)を設けることを特徴とする請求項1記載の
    かすれ補正装置。
  3. 【請求項3】 英文字原稿のイメージデータにおけるか
    すれ補正方法において、 イメージデータを一時記憶部に取り込み、取り込んだイ
    メージデータにおける周辺分布による分割数とラベリン
    グ数を算出し、ラベリング数を周辺分布による分割数で
    除算してかすれ度を求め、かすれ度が所定値以上ならば
    イメージデータの濃度補正を行うことを特徴とするかす
    れ補正方法。
  4. 【請求項4】 請求項2記載のかすれ補正方法におい
    て、 イメージデータの文字サイズが小さい時は、イメージデ
    ータを拡大処理することを特徴とするかすれ補正方法。
  5. 【請求項5】 英文字原稿のイメージデータにおけるか
    すれを補正するプログラムを記録する記録媒体におい
    て、 イメージデータを一時記憶部に取り込み、取り込んだイ
    メージデータにおける周辺分布による分割数とラベリン
    グ数を算出し、ラベリング数を周辺分布による分割数で
    除算してかすれ度を求め、かすれ度が所定値以上ならば
    イメージデータの濃度補正を行うプログラムを記録した
    コンピュータ読み取り可能な記録媒体。
JP15467599A 1999-06-02 1999-06-02 かすれ補正装置、かすれ補正方法および記録媒体 Expired - Lifetime JP3845227B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15467599A JP3845227B2 (ja) 1999-06-02 1999-06-02 かすれ補正装置、かすれ補正方法および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15467599A JP3845227B2 (ja) 1999-06-02 1999-06-02 かすれ補正装置、かすれ補正方法および記録媒体

Publications (2)

Publication Number Publication Date
JP2000348138A true JP2000348138A (ja) 2000-12-15
JP3845227B2 JP3845227B2 (ja) 2006-11-15

Family

ID=15589460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15467599A Expired - Lifetime JP3845227B2 (ja) 1999-06-02 1999-06-02 かすれ補正装置、かすれ補正方法および記録媒体

Country Status (1)

Country Link
JP (1) JP3845227B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1324521C (zh) * 2003-03-15 2007-07-04 三星电子株式会社 用于识别图象字符的预处理设备和方法
JP2013200872A (ja) * 2012-03-26 2013-10-03 Tata Consultancy Services Ltd 連続して存在する英数字を識別するための画像処理システムおよびその方法
JP2021013124A (ja) * 2019-07-08 2021-02-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1324521C (zh) * 2003-03-15 2007-07-04 三星电子株式会社 用于识别图象字符的预处理设备和方法
JP2013200872A (ja) * 2012-03-26 2013-10-03 Tata Consultancy Services Ltd 連続して存在する英数字を識別するための画像処理システムおよびその方法
JP2021013124A (ja) * 2019-07-08 2021-02-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US11570331B2 (en) 2019-07-08 2023-01-31 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
JP7341758B2 (ja) 2019-07-08 2023-09-11 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
JP3845227B2 (ja) 2006-11-15

Similar Documents

Publication Publication Date Title
JP3899523B2 (ja) 画像類似度算出システムおよび画像検索システム
CN109977949B (zh) 边框微调的文本定位方法、装置、计算机设备及存储介质
CN109255300B (zh) 票据信息提取方法、装置、计算机设备及存储介质
CN111242074B (zh) 一种基于图像处理的证件照背景替换方法
US8538191B2 (en) Image correction apparatus and method for eliminating lighting component
CN114283156A (zh) 一种用于去除文档图像颜色及手写笔迹的方法及装置
CN110991520A (zh) 一种生成训练样本的方法以及装置
CN112418243A (zh) 特征提取方法、装置及电子设备
CN111340040B (zh) 一种纸张字符识别方法、装置、电子设备及存储介质
JP2000348138A (ja) かすれ補正装置、かすれ補正方法および記録媒体
CN110610163B (zh) 一种自然场景下基于椭圆拟合的表格提取方法及系统
CN111767752A (zh) 一种二维码识别方法及装置
CN112580638B (zh) 文本检测方法、装置、存储介质及电子设备
CN112052859B (zh) 一种自由场景下的车牌精准定位方法及装置
CN112529923A (zh) 一种控件识别方法及装置
CN112418109A (zh) 一种图像处理方法、装置
JP3046653B2 (ja) 文字原稿の傾き補正方法
JP4396328B2 (ja) 画像類似度算出システム、画像検索システム、画像類似度算出方法および画像類似度算出用プログラム
CN117953519B (zh) 一种用于档案数字化服务的质量监控方法及系统
JP3046656B2 (ja) 文字原稿の傾き補正方法
JP2003271897A (ja) 文字認識装置、画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP2007328652A (ja) 画像処理装置および画像処理プログラム
CN113971689A (zh) 图像配准方法以及相关装置
JP2000285237A (ja) 画像処理装置、画像処理方法及び画像処理プログラムを記録した記録媒体
JPH07192088A (ja) 画像処理方法及び装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060818

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3845227

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090825

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120825

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120825

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130825

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140825

Year of fee payment: 8

EXPY Cancellation because of completion of term