JP3883341B2 - 画像処理方法、装置及び記録媒体 - Google Patents

画像処理方法、装置及び記録媒体 Download PDF

Info

Publication number
JP3883341B2
JP3883341B2 JP30892699A JP30892699A JP3883341B2 JP 3883341 B2 JP3883341 B2 JP 3883341B2 JP 30892699 A JP30892699 A JP 30892699A JP 30892699 A JP30892699 A JP 30892699A JP 3883341 B2 JP3883341 B2 JP 3883341B2
Authority
JP
Japan
Prior art keywords
white
run
image
image processing
processing method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30892699A
Other languages
English (en)
Other versions
JP2001126029A (ja
Inventor
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP30892699A priority Critical patent/JP3883341B2/ja
Publication of JP2001126029A publication Critical patent/JP2001126029A/ja
Application granted granted Critical
Publication of JP3883341B2 publication Critical patent/JP3883341B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理方法、その方法を実施するための装置、記録媒体、及び装置構成に係り、より詳細には、白抜けの生じる画像に対する画像処理、例えば、文字認識装置等への入力画像に対する前処理等に用いて好適な画像処理に関するものである。
【0002】
【従来の技術】
特開平8−016717号公報には、切り出された文字画像の大きさに応じてノイズの大きさを設定し、大きさがノイズと判断される場合にノイズとして削除する方法が提案されている。この手法は画像中のノイズ(黒画素の塊)を取り除くための手法であるが、まったく同様の手法を画像中の白抜けを取り除く手法として用いることが可能である。
【0003】
図10は、本発明が処理対象としている画像の一例を示す図で、本発明が処理対象としている画像は、主に解像度の高い画像であって、スキャナの特性や(画像を奇麗に見せるための)エッジ強調等によって黒画素の内部に白抜けの生じた画像を対象とする。図10に示す画像の様に、太い文字線分の内部に白抜けが生じた場合、この画像をプリントアウトして目視する際にはほとんど問題がないが、この画像に対してOCR(光学的文字認識装置)等を用いて読み取る場合、光学的文字認識装置では認識の際に画像のエッジに注目する場合が多いため文字認識精度の低下が懸念される。
【0004】
上述ような白抜けの補完については、ノイズ処理の手法を適用することが可能であり、たとえば、前記特開平8−016717号公報に記載の手法を用いて、ノイズ以下の大きさの白抜けを黒画素で置換するような手法が考えられる。
【0005】
【発明が解決しようとする課題】
しかしながら、前記特開平8−016717号公報に記載の手法は文字あるいは矩形等の切り出し処理を必要とするので、白抜けの補完処理としては処理時間がかかる。文字認識処理に組み込めば全体として高速な処理を行うことは可能であるが、近年、ソフトウエアのコンポーネント化が進み、スキャナからの画像入力、画像補正、文字認識ソフトウエア等別々のソフトウエアをそれぞれつないで用いる場合には、実際問題として、文字認識ソフトウエアの内部の処理を変更することは困難な場合が多い。
【0006】
本発明は、上述のごとき実情に鑑みてなされたもので、スキャナから入力された画像を文字認識ソフトウエアに入力する際の前処理として、高速に文字画像中の白抜けを黒画素で補完することが可能であり、 部品化されたソフトウエアを組み合わせて用いる際の、文字認識ソフトウエアの前処理として有効な画像処理方法、その方法を実施するための装置、記録媒体、更には、装置構成を提供しようとするものである。
【0007】
【課題を解決するための手段】
請求項1の発明は、画像中の注目する白ランが白抜けであるか判断を行い、該判断の結果により画像処理を行う画像処理方法であって、前記画像中の隣接する2つのラインのそれぞれから黒ランと白ランを抽出するステップと、抽出した白ランのうち、1つの注目する白ランを包含する黒ランの長さの総和を求めるステップと、前記注目する白ランの長さおよび前記黒ランの長さの総和に基づいて該注目する白ランが白抜けであるかを判断するステップと、前記注目する白ランが白抜けであると判断したとき、該白抜けを黒画素で補完するステップと、を有することを特徴としたものである。
【0009】
請求項2の発明は、請求項1の発明において、前記白抜けであるかを判断するステップは、前記注目する白ランの長さに対応する所定の第1閾値と前記黒ランの長さの総和とを比較することにより、該注目する白ランが白抜けであるかを判断することを特徴としたものである。
【0010】
請求項3の発明は、請求項2の発明において、前記第1閾値は、前記注目する白ランの長さが長いほど大きく設定されることを特徴としたものである。
【0011】
請求項4の発明は、請求項1乃至3のいずれかの発明において、前記注目する白ランの長さは、所定の第2閾値より大きいことを特徴としたものである。
【0013】
請求項の発明は、請求項1乃至のいずれかの発明において、いずれかに記載の白抜け補完処理を画像の解像度に応じて行うことを特徴としたものである。
【0014】
請求項の発明は、請求項1乃至のいずれかの発明において、いずれかに記載の白抜け補完処理を画像の解像度が縦横等しい場合に行うことを特徴としたものである。
【0015】
請求項の発明は、請求項1乃至のいずれかに記載の画像処理方法をコンピュータに実行させるプログラムを記憶したコンピュータが読み取り可能な記憶媒体であることを特徴としたものである。
【0016】
請求項の発明は、請求項1乃至のいずれかに記載の画像処理方法を実行するハードウエア装置であることを特徴としたものである。
【0017】
請求項の発明は、請求項1乃至のいずれかに記載の画像処理方法を実行するハードウエア装置の一部あるいは全体をネットワークを介して接続した装置構成であることを特徴としたものである。
【0018】
【発明の実施の形態】
本発明は、画像の前処理部に関するもので、一般的には、画像入力部(スキャナ等)や文字認識部と共に用いて画像のテキスト化を行う。なお、画像のテキスト化においては、画像の入力等を画像入力工場で行い、画像の認識を画像のテキスト化工場で行うことも考えられる。
【0019】
図1乃至図3は、それぞれ本発明による画像処理方法が適用される装置構成例を示す図で、図中、1は画像入力部、2は画像前処理部、3は文字認識部、4はネットワーク(電話回線等)で、本発明においては、図10に示したような白抜け画像が入力された場合の処理を行うものである。
【0020】
図4は、本発明の動作説明を行うためのフローチャートで、まず、入力画像に対して白抜けの補完処理を行うか否かを判断する。一般的に、高解像度の画像ほど、文字線分の太さ(画素数)が太くなるので、白抜けを生じ易くなる。また、ファクシミリ等の画像で縦横の解像度の異なる画像では文字画像が特定の方向につぶれるので、白抜けが起こりにくくなる場合が多い。そこで、本発明では、解像度が300dpi以下の画像の場合(S1)、或いは縦横の解像度が異なる場合(S2)は白抜けの補完処理を行わず、入力された画像をそのまま文字認識部に送る。
【0021】
つぎに、2ラインにおいて白ランと黒ランを抽出する。本発明では2ライン分の黒ランと白ランが抽出されればよく(S3)、2ライン単位で処理を進めることができるので、処理に必要なメモリ量も非常に少なくて済む。
図5は、ランの抽出例を示す図で、ランが抽出されたならば、まず、下のラインの白ランについて、左側の白ランから、白ランの長さが定められたしきい値Lより短い場合に、白ランの範囲を包含する黒ランを探す(本実施例では、L=5とする)。
【0022】
図5の例の場合、まず白ラン21は左側に接続する黒ランがないので(S4)、処理を次の白ラン22の処理に移す。白ラン22については、上のラインに白ランの範囲を包含する黒ラン11が存在するので、白ラン22の長さから接続する黒ラン22の長さに関するしきい値Aを求める。しきい値Aの算出については、一例を表1に示す。
【0023】
【表1】
Figure 0003883341
【0024】
図5の例の場合、白ラン22の長さは2であるので、A=10となる。
次に、白ラン2に接続する黒ラン11、黒ラン21、黒ラン22の長さの総和を求める。図5の例の場合、12+5+18=35となる。ここで、35>10(=A)であるので、白ラン22は白抜けであると判断され、黒画素で置換される。処理後の状態を図6に示す。
【0025】
次のラインの処理においては、下のラインの内容を上のラインとして取り扱えばよく、新たに次のラインについてランの抽出処理を行えば良いので、2ライン分のバッファをトグルで用いることで処理を進めることができる。図6の処理後の概念図を図7に示す。
【0026】
また、別の例を図8を用いて説明する。まず、白ラン21については、左側に接続する黒ランがないので、処理を白ラン22に移す。白ラン22については、白ランの長さが5であり、L=5以上であるので、白抜けであるとはみなされず、次の白ラン23の処理に移る(S5)。白ラン23については、長さが4であるので、白ランの範囲を包含する黒ランを探す(S6)。図8の場合、黒ラン12が存在するので、表1を用いて隣接する黒ランの長さのしきい値Aを求める(S7)。この場合、白ラン23の長さは4であるので、A=14となる。つぎに、隣接する黒ランの長さの合計を求める(S8)。図8の白ラン23の場合、黒ラン12、黒ラン22、黒ラン23と接続している。ここで、黒ランの長さの合計Tは、5+1+3=9となり、しきい値A=14より小さい値となる(S9)。したがって、白ラン23は白抜けであるとは判断されず、黒画素で埋める処理は行われない。最終的に、図8の例の場合には、入力画像がそのまま出力される。
【0027】
【発明の効果】
以上説明したように、本手法では2ライン分のランの情報のみに基づいて処理を行っているので、処理に必要なメモリ量が極めて少ない。また、画像に対して1回のアクセスで処理を終了するので、非常に短い処理時間で処理を終えることができる。
実際に、図10に示す画像に対して本処理を適用した結果を図9に示す。図9より良好に白抜けが補完されていることが、画像でも確認できる。また、文字認識処理を行い、認識結果を比較してその効果は確認されている。
【図面の簡単な説明】
【図1】 本発明による画像処理方法が適用される装置構成例を示す図である。
【図2】 本発明による画像処理方法が適用される他の装置構成例を示す図である。
【図3】 本発明による画像処理方法が適用される他の装置構成例を示す図である。
【図4】 本発明の動作説明を行うためのフローチャートである。
【図5】 ランの抽出例(白ランを黒ランと判定する場合)を示す概念図である。
【図6】 抽出処理後の状態を示す図である。
【図7】 抽出処理後の概念図である。
【図8】 ラン抽出例の他の例(白ランを黒ランと判定しない場合)を示す概念図である。
【図9】 本発明による処理結果の例を示す図である。
【図10】 本発明が適用される画像例を示す図である。
【符号の説明】
1…画像入力部、2…画像前処理部、3…文字認識部、4…ネットワーク(電話回線等)。

Claims (9)

  1. 画像中の注目する白ランが白抜けであるか判断を行い、該判断の結果により画像処理を行う画像処理方法であって、前記画像中の隣接する2つのラインのそれぞれから黒ランと白ランを抽出するステップと、抽出した白ランのうち、1つの注目する白ランを包含する黒ランの長さの総和を求めるステップと、前記注目する白ランの長さおよび前記黒ランの長さの総和に基づいて該注目する白ランが白抜けであるかを判断するステップと、前記注目する白ランが白抜けであると判断したとき、該白抜けを黒画素で補完するステップと、を有することを特徴とする画像処理方法。
  2. 請求項1において、前記白抜けであるかを判断するステップは、前記注目する白ランの長さに対応する所定の第1閾値と前記黒ランの長さの総和とを比較することにより、該注目する白ランが白抜けであるかを判断することを特徴とする画像処理方法。
  3. 請求項2において、前記第1閾値は、前記注目する白ランの長さが長いほど大きく設定されることを特徴とする画像処理方法。
  4. 請求項1乃至3のいずれかにおいて、前記注目する白ランの長さは、所定の第2閾値より大きいことを特徴とする画像処理方法。
  5. 請求項1乃至のいずれかに記載の白抜け補完処理を画像の解像度に応じて行うことを特徴とする画像処理方法。
  6. 請求項1乃至のいずれかに記載の白抜け補完処理を画像の解像度が縦横等しい場合に行うことを特徴とする画像処理方法。
  7. 請求項1乃至のいずれかに記載の画像処理方法をコンピュータに実行させるプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
  8. 請求項1乃至のいずれかに記載の画像処理方法を実行するハードウエア装置。
  9. 請求項1乃至のいずれかに記載の画像処理方法を実行するハードウエア装置の一部あるいは全体をネットワークを介して接続した装置構成。
JP30892699A 1999-10-29 1999-10-29 画像処理方法、装置及び記録媒体 Expired - Fee Related JP3883341B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30892699A JP3883341B2 (ja) 1999-10-29 1999-10-29 画像処理方法、装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30892699A JP3883341B2 (ja) 1999-10-29 1999-10-29 画像処理方法、装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001126029A JP2001126029A (ja) 2001-05-11
JP3883341B2 true JP3883341B2 (ja) 2007-02-21

Family

ID=17986952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30892699A Expired - Fee Related JP3883341B2 (ja) 1999-10-29 1999-10-29 画像処理方法、装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP3883341B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689295A (zh) 2007-06-29 2010-03-31 汤姆森许可贸易公司 用于减少图像中的伪像的设备和方法

Also Published As

Publication number Publication date
JP2001126029A (ja) 2001-05-11

Similar Documents

Publication Publication Date Title
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
JP4261005B2 (ja) 領域ベースのイメージ2値化システム
JP4189506B2 (ja) 画像処理のための装置、方法及び記録媒体
US7269298B2 (en) Image processing device, image processing method, and record medium on which the same is recorded
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
CN104966092B (zh) 一种图像处理方法和装置
JP2009032299A (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
US20030107781A1 (en) Image processing apparatus, image processing method and image processing program
JP4077094B2 (ja) カラー文書画像認識装置
JP2009037596A (ja) 画像処理装置およびプログラム
JP3931651B2 (ja) 画像処理装置
JP3883341B2 (ja) 画像処理方法、装置及び記録媒体
US8401325B2 (en) Image processing method, image processing apparatus, and computer program for core line modification of a thinning figure in an image process
CN111445402A (zh) 一种图像去噪方法及装置
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
CN114267035A (zh) 一种文档图像处理方法、系统、电子设备及可读介质
JP2001283212A (ja) ベクタ変換下地補間方法
JP3391987B2 (ja) 帳票認識装置
JP4735212B2 (ja) 画像処理装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP2725859B2 (ja) 文字行検出方式
JP3020293B2 (ja) 属性判別方法
JPH09167228A (ja) 画像変換方法及び装置、並びに、それらを利用した画像整形方法及び装置、並びに、それらを利用したシステム
JP4032735B2 (ja) 画像処理装置および画像処理方法
JP4061256B2 (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061114

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101124

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111124

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111124

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121124

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131124

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees