JP2005285006A - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
JP2005285006A
JP2005285006A JP2004101431A JP2004101431A JP2005285006A JP 2005285006 A JP2005285006 A JP 2005285006A JP 2004101431 A JP2004101431 A JP 2004101431A JP 2004101431 A JP2004101431 A JP 2004101431A JP 2005285006 A JP2005285006 A JP 2005285006A
Authority
JP
Japan
Prior art keywords
image
edge
character
unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004101431A
Other languages
English (en)
Other versions
JP3990375B2 (ja
Inventor
Toshimasa Dobashi
外志正 土橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2004101431A priority Critical patent/JP3990375B2/ja
Priority to TW094105658A priority patent/TWI256597B/zh
Priority to KR1020050015362A priority patent/KR100704389B1/ko
Priority to CNB2005100510490A priority patent/CN100379255C/zh
Priority to US11/071,457 priority patent/US7359568B2/en
Publication of JP2005285006A publication Critical patent/JP2005285006A/ja
Application granted granted Critical
Publication of JP3990375B2 publication Critical patent/JP3990375B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)

Abstract

【課題】文字可読性に優れたエッジ画像を得ることのできる画像処理装置を提供する。
【解決手段】エッジ処理に適した濃度や色情報に変換された画像の情報から、決められた画像単位ごとに、隣接する他の画像単位との間の差分の値を求め、求められた差分の値が負であるものについて、その差分の絶対値を、前記隣接する他の画像単位の差分の値に移動加算してエッジ画像を生成する。
【選択図】図4

Description

本発明は、カラー文書やグレースケール文書などから文字のエッジ画像を作成する画像処理装置および画像処理方法に関するものである。
カラー文書やグレースケール文書などを対象とする文字認識技術に関して、文書中の文字の輪郭を背景から分離した画像を得るためにエッジ検出と呼ばれる手法が用いられる。このエッジ検出は、隣接する画素間での濃度や色などの値の変化(差分値)を検出する方法であり(たとえば特許文献1を参照)。これにより、たとえば、文字の濃度が背景の濃度よりも高い画像などから、文字の輪郭に対応したエッジ画像などを得ることができる。
特開2001−175808号公報(段落0010など)
しかしながら、隣接する画素間での濃度や色などの値の差分の絶対値をそのまま用いてエッジ画像としただけでは、文字の輪郭線に沿った部分は濃く、その内側は薄い、いわゆる中抜け状となったり、文字の線幅が太くなったりする傾向にあり、文字が接触してしまったり、文字可読性の高い画像が得られにくいという問題があった。
本発明は、このような課題を解決するためのもので、カラー文書やグレースケール文書などから文字可読性に優れたエッジ画像を得ることのできる画像処理装置および画像処理方法を提供することを目的としている。
上記課題を解決するために、本発明の画像処理装置は、画像の情報を入力する入力部と、入力部により入力された画像の情報をエッジ検出に適した情報に変換する変換部と、変換部を通して得られた画像の情報から、決められた画像単位ごとに、決められた方向に隣接する他の画像単位との間の差分の値を求め、求められた差分の値が負であるものについて、その差分の絶対値を、前記決められた方向に隣接する他の画像単位の差分の値に移動加算してエッジ画像を生成する画像処理部とを具備する。この発明により、エッジ画像における文字の線幅の広がりが防止されるとともに、文字の中抜けが抑制され、文字可読性の高いエッジ画像を得ることができる。
また、本発明の画像処理装置において、変換部は、入力された画像の情報を濃度と色情報に変換し、画像処理部は、変換部により得られた濃度と色情報の各々のついてエッジ画像を生成し、これらのエッジ画像を合成して一つのエッジ画像を作成するものとしてもよい。
この発明により、濃度や色の異なる様々な文字と背景との組み合せに対して、文字可読性の高いエッジ画像を得ることができる。
さらに、本発明の画像処理装置において、画像入力部は、非反転文字の領域と反転文字の領域とが混在する画像の情報を入力し、画像処理部は、非反転文字用のエッジ画像を作成するとともに反転文字用のエッジ画像を作成し、作成された各エッジ画像から文字列の領域ごとに一方のエッジ画像を選択し、これらを合成して一つのエッジ画像を作成するものであってもよい。特に、画像処理部は、作成された各エッジ画像から、文字列の領域ごとにこれに含まれる文字領域のサイズの平均値が小さい方のエッジ画像を選択するものとする。
この発明によれば、非反転文字と反転文字が混在した文書画像から、文字の可読性の高いエッジ画像を生成することができる。
さらに、本発明の画像処理装置において、画像処理部は、作成されたエッジ画像において文字領域のサイズの平均値が閾値以上である文字列の領域を判定し、この文字列領域の原画像に対する二値化画像を作成し、この二値化画像を同文字列領域のエッジ画像に代えて、他の文字列領域の画像と合成するものであってもよい。
この発明によれば、入力画像において文字サイズが異なる文字列領域が混在する場合にも、中抜けのない可読性の高い文字の画像が得られる。
本発明の画像処理装置および画像処理方法によれば、カラー文書やグレースケール文書などから、文字可読性に優れたエッジ画像を得ることができる。
以下、本発明の実施形態を図面に基づいて説明する。
図1は本発明の第1の実施形態にかかる画像処理装置100の構成を示すブロック図である。
同図に示すように、この画像処理装置100は、画像入力部1、画像補正部2、色空間変換部3、エッジ画像生成部4、画像出力部5およびページメモリ6を備える。
画像入力部1は画像の情報を入力する手段であり、具体的には、複写機、スキャナ、ファクシミリ、デジタルカメラなどの入力機器や、あらかじめストレージデバイスなどに記憶された画像の情報を入力する手段であってもよい。画像補正部2は、エッジ検出のための前処理としてフィルタリングによる網点除去などの画像補正を行う。色空間変換部3は、補正後の画像をエッジ処理に適した濃度や色情報に変換する。エッジ画像生成部4は、エッジ処理に適した情報に変換された画像からエッジ画像を生成する。画像出力部5は、生成されたエッジ画像を出力する手段であり、具体的には、複写機、プリンター、ファクシミリ、ディスプレイなどの出力機器や、エッジ画像をファイル化してストレージデバイスなどに出力する手段であってもよい。ページメモリ6は入力された画像の情報や、各処理途中の画像の情報が記憶されるメモリである。
次に、この実施形態の画像処理装置100の動作を説明する。
図2は、第1の実施形態の画像処理装置100の処理の流れを示すフローチャートである。
まず、画像入力部1により、フルカラーまたはグレースケールの画像情報が入力されてページメモリ6に格納される(ステップS101)。続いて、画像補正部2により、ページメモリ6に格納された画像に対し、たとえば網点除去などの補正処理が行われる(ステップS102)。次に、色空間変換部3にて、RGB色空間の画像情報がエッジ処理に適したたとえば濃度や色空間の情報(たとえば彩度、色相成分、輝度成分、色度など)に変換される(ステップS103)。続いて、エッジ画像生成部4にて、エッジ処理に適した情報に変換された画像から、主走査方向および副走査方向の各々に対してエッジの検出が行われ、エッジ画像が作成される(ステップS104)。そして、画像出力部5により、作成されたエッジ画像が出力される(ステップS105)。
次に、図3および図4を用いて、ステップS104のエッジ画像生成の手順を説明する。
図3は入力された原画像の例であり、この原画像は背景とこの背景上に配置された、背景よりも濃度が高い文字とで構成されている。図4は図3に示す原画像からの濃度によるエッジ画像生成の様子を示しており、図4(a)は図3の原画像のX軸方向におけるA−B区間の濃度分布、図4(b)は図4(a)の濃度分布に対して下記の式(1)で計算される差分処理の結果である。
f’(x)=f(x)−f(x−1) ・・・(1)
ここで、f(x)は原画像におけるX軸上の位置(x)にある画像単位の濃度値、f(x−1)は原画像における位置(x)の画像単位の隣の位置(x−1)の画像単位の濃度値、f’(x)はエッジ画像における位置(x)の画像単位の濃度値(差分値)である。このように、濃度分布から、各々の画像単位ごとに隣の画像単位との濃度の差分値を求める。なお、画像単位とは、原画像を区分する単位であり、たとえば、1画素、N*N(Nは任意の整数)画素のまとまりである。
図4(b)の差分の値の絶対値をとることで、図4(c)に示すように、文字の輪郭に相当するエッジが検出される。しかし、この状態では、文字において中抜けが存在し、さらに画像単位の幅だけ文字線分の幅が太いままであるため、文字可読性の高いエッジ画像とは言えない。
そこで、図4(d)に示すように、差分の値が負であるものについては、その絶対値を1画像単位分だけ隣接する画像単位の差分値にそれぞれ移動加算する。図4(d)の例では、X軸方向においてX座標の値が小さくなる方向(左)に絶対値を1画像単位分だけ移動して加算を行っている。
なお、(1)式を
f’(x)=f(x)−f(x+1)・・・(1´)
に変更した場合には、差分の値が負となったものの絶対値をX軸方向においてX座標の値が大きくなる方向(右)に1画像単位分だけ移動して加算を行うようにすればよい。
図4では、原画像から一方の軸方向(X軸方向)での濃度によるエッジ画像を生成する場合を示したが、二軸方向(X軸方向とY軸方向)について同様の処理を行い、各方向の処理結果を合成してエッジ画像を生成するようにしてもよいことは言うまでもない。この場合の計算例を以下に示す。
f(x,y)を原画像の(x,y)座標位置の画像単位の濃度値、f’(x,y)をエッジ画像の(x,y)座標位置の画像単位の濃度値とすると、エッジ画像は次式(2)によって算出される。
f’(x,y)=fx’(x,y)+fy’(x,y) ・・・(2)
ここで、fx=f(x,y−1)−f(x−1,y−1)+f(x,y)−f(x−1,y)+f(x,y+1)−f(x−1,y+1)、ただし、f(x)>=0の場合、fx’(x,y)=fx、fx<0の場合、fx’(x,y)=fx’(x−1,y)−fx。
また、fy=f(x−1,y)−f(x−1,y−1)+f(x,y)−f(x,y−1)+f(x+1,y)−f(x+1,y−1)、ただし、fy>=0の場合、fy’(x,y)=fy、fy<0の場合、fy’(x,y)=fy’(x,y−1)−fy。
図5に、本実施形態の画像処理装置100により得られたエッジ画像を従来の方法で得られたエッジ画像と比較して示す図である。図5(a)は原画像の例であり、この原画像から差分の値の絶対値をとって得られたエッジ画像が図5(b)、そして本実施形態によって得られたエッジ画像が図5(c)である。図5(b)と図5(c)の各エッジ画像を比較することで明らかなように、本実施形態によれば、エッジ画像における文字の線幅の広がりが防止されるとともに、文字の中抜けが抑制され、文字可読性の高いエッジ画像を得ることができる。
次に、本発明の第2の実施形態を説明する。
図6は、第2の実施形態の画像処理装置200の構成を示すブロック図である。
同図に示すように、この画像処理装置200は、画像入力部1、画像補正部2、色空間変換部3、エッジ画像生成部4、画像出力部5、ページメモリ6およびエッジ画像合成部7を備える。この画像処理装置200において、エッジ画像生成部4は、第1の実施形態では、濃度のエッジ画像や色情報のエッジ画像のみといったように1つのエッジ画像を生成していたが、この実施形態では濃度のエッジ画像に加えて、色空間の情報(たとえば彩度、色相成分、輝度成分、色度など)のエッジ画像も同時に生成する。エッジ画像合成部7は、エッジ画像生成部4にて生成された複数のエッジ画像を合成して画像出力部5に出力する。その他のブロックの機能は第1の実施形態と同じである。
図7は、この第2の実施形態の画像処理装置200の処理の流れを示すフローチャートである。
まず、画像入力部1により、フルカラーまたはグレースケールの画像情報が入力されてページメモリ6に格納される(ステップS701)。続いて、画像補正部2により、ページメモリ6に格納された画像に対し、たとえば網点除去などの補正処理が行われる(ステップS702)。次に、色空間変換部3にて、RGB色空間の画像情報がエッジ処理に適した濃度の情報と色空間(たとえば彩度、色相成分、輝度成分、色度など)の情報に変換される(ステップS703)。続いて、エッジ画像生成部4にて、エッジ処理に適した情報に変換された画像から、主走査方向および副走査方向に対して、濃度の情報と色情報の各々についてエッジの検出が行われ、濃度のエッジ画像と色情報のエッジ画像が生成される(ステップS704)。この際、第1の実施形態と同様の手順で濃度のエッジ画像と色情報のエッジ画像の生成が行われる。続いて、生成された各エッジ画像がエッジ画像合成部7にて合成され(ステップS705)、1つの合成エッジ画像として画像出力部5より出力される(ステップS706)。
エッジ画像の合成方法には、個々のエッジ画像の画像単位の値に、情報の属性(濃度、彩度、色相成分、輝度成分、色度など)に応じた重みを加え、その平均値を求める方法や、個々のエッジ画像の画像単位の値に色情報の属性に応じた重みを加え、最大値となった画像単位を集めたものを合成エッジ画像とする方法などが考えられる。
したがって、この第2の実施形態の画像処理装置200によれば、濃度や色の異なる様々な文字と背景との組み合せに対して、文字可読性の高いエッジ画像を得ることができる。
次に、本発明の第3の実施形態を説明する。
図8は、第3の実施形態の画像処理装置300の構成を示すブロック図である。
同図に示すように、この画像処理装置300は、画像入力部1、画像補正部2、色空間変換部3、エッジ画像生成部4、画像出力部5、ページメモリ6、エッジ画像合成部7および文字列領域抽出部8を備える。この画像処理装置300において、文字列領域抽出部8は、エッジ画像から文字列領域を抽出して個々の文字領域のサイズやその平均値を算出する。また、エッジ画像生成部4には、1つの原画像から非反転文字用のエッジ画像と反転文字用のエッジ画像を作成する機能が付加されている。エッジ画像合成部7は、文字列領域抽出部8によって算出された文字列領域ごとの文字領域のサイズ平均値に基づいて、エッジ画像生成部4にて作成された非反転文字用のエッジ画像と反転文字用のエッジ画像のいずれか一方を選択し、これらを合成して一つのエッジ画像を作成する機能を有している。その他のブロックの機能は第1の実施形態と同じである。
図9は、この第3の実施形態の画像処理装置300の処理の流れを示すフローチャートである。
まず、画像入力部1により、フルカラーまたはグレースケールの画像情報が入力されてページメモリ6に格納される(ステップS901)。続いて、画像補正部2により、ページメモリ6に格納された画像に対し、たとえば網点除去などの補正処理が行われる(ステップS902)。次に、色空間変換部3にて、RGB色空間の画像情報がエッジ処理に適したたとえば濃度や色空間の情報(たとえば彩度、色相成分、輝度成分、色度など)に変換される(ステップS903)。続いて、エッジ画像生成部4にて、エッジ処理に適した情報に変換された画像から、主走査方向および副走査方向の各々についてエッジの検出が行われ、非反転文字用のエッジ画像f’(x,y)と反転文字用のエッジ画像f’inv(x,y)が生成される(ステップS904)。
反転文字用のエッジ画像f’inv(x,y)は次式(3)によって算出される。
f’inv(x,y)=fx’(x,y)+fy’(x,y) ・・・(3)
ここで、fx=−{f(x,y−1)−f(x−1,y−1)+f(x,y)−f(x−1,y)+f(x,y+1)−f(x−1,y+1)}、ただし、fx>=0の場合、fx’(x,y)=fx、fx<0の場合、fx’(x,y)=fx’(x−1,y)−fx。
また、fy=−{f(x−1,y)−f(x−1,y−1)+f(x,y)−f(x,y−1)+f(x+1,y)−f(x+1,y−1)}、ただし、fy>=0の場合、fy’(x,y)=fyとし、fx<0の場合、fy’(x,y)=fy’(x,y−1)−fy。
この結果、たとえば、図10(a)の原画像に対して、図10(b)に示すような非反転文字用のエッジ画像f’(x,y)と、図10(c)に示すような反転文字用のエッジ画像f’inv(x,y)が得られる。このように反転文字に対する非反転文字用のエッジ画像f’(x,y)は縁取り状の文字となる。非反転文字に対する反転文字用のエッジ画像f’inv(x,y)も同様である。
次に、文字列領域抽出部8により、エッジ画像f’(x,y)とエッジ画像f’inv(x,y)から文字列領域が抽出される(ステップ905)。文字列領域の抽出は、エッジ画像から連結成分をラベリング処理によって抽出し、連結成分のレイアウト解析によって連結成分が連続して直線状に並んでいる領域を文字列と判定する方法などによって実現できる。この際、図11に示すように、個々の連結部分を1つの文字領域71,73とみなして、その文字領域71,73の幅Wと高さHを求め、文字列領域72,74ごとに、これに含まれる文字領域71,73の幅Wと高さHの値の平均値を求めておく。
たとえば、図12に示すように、非反転文字の文字列と反転文字の文字列とが混在する原画像80からエッジ画像f’(x,y)とエッジ画像f’inv(x,y)が得られ、6つの文字列領域81−86が得られる。
次に、エッジ画像合成部7により、エッジ画像f’(x,y)とエッジ画像f’inv(x,y)とにおいて対応する文字列領域のうちから文字可読性の高い方をそれぞれ選択して1つの合成エッジ画像87を生成する(ステップ906)。ここで、文字可読性の高い文字例領域は、文字列領域ごとの上記文字領域の幅と高さの値の平均値に基づいて判定される。
すなわち、図11に示したように、反転文字に対する非反転文字用のエッジ画像f’(x,y)は縁取り状の文字となり、この場合の個々の文字領域71のサイズは、反転文字に対する反転文字用のエッジ画像f’inv(x,y)として得られたストローク状の文字の文字領域73のサイズよりも大きい。一般にストローク状の文字は縁取り状の文字よりも可読性が高いので、文字領域の幅と高さの値の平均値が小さいほうの文字例領域を可読性の高い文字例領域として判定すればよい。
この結果、図12の例では、文字列領域81,82,86が文字可読性の高い文字例領域として判定され、これらの文字例領域81,82,86のエッジ画像を合成して1つの合成エッジ画像87が作成される。最後に、このようにして作成された合成エッジ画像87が画像出力部5より出力される(ステップS907)。
したがって、この第3の実施形態の画像処理装置300によれば、非反転文字と反転文字が混在した文書画像から、文字の可読性の高いエッジ画像を生成することができる。
次に、本発明の第4の実施形態を説明する。
図13は、第4の実施形態の画像処理装置400の構成を示すブロック図である。
同図に示すように、この画像処理装置400は、画像入力部1、画像補正部2、色空間変換部3、エッジ画像生成部4、画像出力部5、ページメモリ6、文字列領域抽出部8、画像二値化部9および画像合成部10を備える。この画像処理装置400において、文字列領域抽出部8は、エッジ画像から文字列領域を抽出して個々の文字領域のサイズやその平均値を算出する。画像二値化部9は、画像入力部1により入力された原画像の二値化処理を行う。画像合成部10は、エッジ画像生成部4により作成されたエッジ画像と画像二値化部9により作成された二値画像とを合成するものである。その他のブロックの機能は、図1に示した第1の実施形態と同じである。
図14は、第4の実施形態の画像処理装置400の処理の流れを示すフローチャートである。
まず、画像入力部1により、フルカラーまたはグレースケールの画像情報が入力されてページメモリ6に格納される(ステップS1401)。続いて、画像補正部2により、ページメモリ6に格納された画像に対し、たとえば網点除去などの補正処理が行われる(ステップS1402)。次に、色空間変換部3にて、RGB色空間の画像情報がエッジ処理に適した濃度の情報や色空間の情報(たとえば彩度、色相成分、輝度成分、色度など)に変換される(ステップS1403)。続いて、エッジ画像生成部4にて、エッジ処理に適した情報に変換された画像から、主走査方向および副走査方向の各々についてエッジの検出が行われ、エッジ画像が作成される(ステップS1404)。この際、第1の実施形態と同様の手順でエッジ画像の生成が行われる。
次に、文字列領域抽出部8により、エッジ画像から文字列領域が抽出され、文字列領域ごとに、これに含まれる文字領域の幅と高さの値の平均値が求められる(ステップ1405)。続いて、画像合成部10は、エッジ画像から抽出された文字列領域の文字領域の幅と高さの値の平均値を閾値を基準に評価する(ステップS1406)。この評価によって、文字領域の幅と高さの値の平均値が閾値以上である文字列領域が存在しないことが判定された場合には(ステップS1406のNO)、ステップS1404で作成されたエッジ画像を画像出力部5より出力する(ステップS1407)。
文字領域の幅と高さの値の平均値が閾値以上である文字列領域が存在する場合には(ステップS1406のYES)、画像二値化部9により、その文字領域の幅と高さの値の平均値が閾値以上である文字列領域に対して原画像の二値化処理を行う(ステップS1408)。二値化処理は、該当する文字列領域の原画像に対してヒストグラムをとるなどして下地部分と文字部分とが適切に分離されるように行うことが好ましい。また、元画像の文字が反転文字である場合には、文字部分が黒となるように、下地部分と文字部分の二値化処理の結果の値を反転させた結果を最終的な二値化画像として出力する。
画像合成部10は、画像二値化部9より二値化画像を取得すると、この二値化画像を同じ文字列領域のエッジ画像に代えて採用し、他の文字列領域のエッジ画像または二値化画像と合成して1つの合成エッジ画像を作成する(ステップS1409)。最後に、このようにして作成された合成エッジ画像が画像出力部5より出力される(ステップS1407)。
図15に、以上の画像処理の具体例を示す。図15(a)は原画像、図15(b)は原画像から作成されたエッジ画像であり、画像の一つの文字列領域91に含まれている文字領域のサイズの平均値は閾値以上であり、他の文字列領域92,93,94に含まれている文字領域のサイズの平均値は閾値未満であるとする。本実施形態では、エッジ画像の作成において1画像単位分だけ移動して加算を行うので、中抜け防止の効果が得られる文字サイズに制限があり、この制限を超えるサイズの文字の場合には、結果的に中抜けのある縁取り状となってしまう。そこで、文字領域のサイズの平均値が閾値以上である文字列領域91については、エッジ画像に代えて原画像の二値化画像を採用し、他の文字列領域92,93,94のエッジ画像と合成し、図15(c)に示す1つの出力画像とする。
これにより、原画像において文字のサイズが異なる文字列領域が混在する場合にも、中抜けのない可読性の高い文字の画像を得ることができる。
なお、本発明は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
たとえば、上記各実施形態では、エッジ検出において差分フィルタを用いたが、2次微分フィルタ(ラプラシアンフィルタ)を用いることも可能である。
本発明の第1の実施形態にかかる画像処理装置の構成を示すブロック図である。 第1の実施形態の画像処理装置の処理の流れを示すフローチャートである。 入力された原画像の例を示す図である。 図3の原画像からのエッジ画像生成の様子を示す図である。 第1の実施形態の画像処理装置により得られたエッジ画像を従来の方法で得られたエッジ画像と比較して示す図である。 本発明の第2の実施形態の画像処理装置の構成を示すブロック図である。 第2の実施形態の画像処理装置の処理の流れを示すフローチャートである。 第3の実施形態の画像処理装置の構成を示すブロック図である。 第3の実施形態の画像処理装置の処理の流れを示すフローチャートである。 非反転文字用のエッジ画像と反転文字用のエッジ画像の例を示す図である。 文字領域のサイズを算出する方法を示す図である。 非反転文字の文字列と反転文字の文字列とが混在する原画像に対するエッジ画像の合成の様子を示す図である。 第4の実施形態の画像処理装置の構成を示すブロック図である。 第4の実施形態の画像処理装置の処理の流れを示すフローチャートである。 第4の実施形態の画像処理装置の画像処理の例を示す図である。
符号の説明
1…画像入力部、2…画像補正部、3…色空間変換部、4…エッジ画像生成部、5…画像出力部、6…ページメモリ、7…エッジ画像合成部、8…文字列領域抽出部、9…画像二値化部、10…画像合成部、100…画像処理装置

Claims (10)

  1. 画像の情報を入力する入力部と、
    前記入力部により入力された画像の情報をエッジ検出に適した情報に変換する変換部と、
    前記変換部を通して得られた画像の情報から、決められた画像単位ごとに、決められた方向に隣接する他の画像単位との間の差分の値を求め、求められた差分の値が負であるものについて、その差分の絶対値を、前記決められた方向に隣接する他の画像単位の差分の値に移動加算してエッジ画像を生成する画像処理部と
    を具備することを特徴とする画像処理装置。
  2. 前記変換部は、前記入力された画像の情報を濃度と色情報に変換し、
    前記画像処理部は、前記変換部により得られた濃度と色情報の各々のついてエッジ画像を生成し、これらのエッジ画像を合成して一つのエッジ画像を作成する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記画像入力部は、非反転文字の領域と反転文字の領域とが混在する画像の情報を入力し、
    前記画像処理部は、非反転文字用のエッジ画像を作成するとともに反転文字用のエッジ画像を作成し、作成された前記各エッジ画像から文字列の領域ごとに一方のエッジ画像を選択し、これらを合成して一つのエッジ画像を作成する
    ことを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記画像処理部は、作成された前記各エッジ画像から、前記文字列の領域ごとにこれに含まれる文字領域のサイズの平均値が小さい方のエッジ画像を選択する
    ことを特徴とする請求項3に記載の画像処理装置。
  5. 前記画像処理部は、作成されたエッジ画像において文字領域のサイズの平均値が閾値以上である文字列の領域を判定し、この文字列領域の原画像に対する二値化画像を作成し、この二値化画像を同文字列領域のエッジ画像に代えて、他の文字列領域の画像と合成する
    ことを特徴とする請求項1または2に記載の画像処理装置。
  6. 入力された画像の情報をエッジ検出に適した情報に変換し、この変換後の画像情報から、決められた画像単位ごとに、決められた方向に隣接する他の画像単位との間の差分の値を求め、求められた差分の値が負であるものについて、その差分の絶対値を、前記決められた方向に隣接する他の画像単位の差分の値に移動加算してエッジ画像を生成する
    ことを特徴とする画像処理方法。
  7. 前記入力された画像の情報を濃度と色情報に変換し、
    前記変換後の濃度と色情報の各々のついてエッジ画像を生成し、これらのエッジ画像を合成して一つのエッジ画像を作成する
    ことを特徴とする請求項6に記載の画像処理方法。
  8. 非反転文字の領域と反転文字の領域とが混在する画像の情報を入力し、
    この入力された画像の情報から、前記非反転文字用のエッジ画像を作成するとともに反転文字用のエッジ画像を作成し、作成された前記各エッジ画像から文字列の領域ごとに一方のエッジ画像を選択し、これらを合成して一つのエッジ画像を作成する
    ことを特徴とする請求項6または7に記載の画像処理方法。
  9. 作成した前記各エッジ画像から、前記文字列の領域ごとにこれに含まれる文字領域のサイズの平均値が小さい方のエッジ画像を選択する
    ことを特徴とする請求項8に記載の画像処理方法。
  10. 作成されたエッジ画像において文字領域のサイズの平均値が閾値以上である文字列の領域を判定し、この文字列領域の原画像に対する二値化画像を作成し、この二値化画像を同文字列領域のエッジ画像に代えて、他の文字列領域の画像と合成する
    ことを特徴とする請求項6または7に記載の画像処理方法。
JP2004101431A 2004-03-30 2004-03-30 画像処理装置および画像処理方法 Expired - Lifetime JP3990375B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004101431A JP3990375B2 (ja) 2004-03-30 2004-03-30 画像処理装置および画像処理方法
TW094105658A TWI256597B (en) 2004-03-30 2005-02-24 Image processing apparatus and image processing method
KR1020050015362A KR100704389B1 (ko) 2004-03-30 2005-02-24 화상처리장치 및 화상처리방법
CNB2005100510490A CN100379255C (zh) 2004-03-30 2005-02-25 图像处理装置及图像处理方法
US11/071,457 US7359568B2 (en) 2004-03-30 2005-03-04 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004101431A JP3990375B2 (ja) 2004-03-30 2004-03-30 画像処理装置および画像処理方法

Publications (2)

Publication Number Publication Date
JP2005285006A true JP2005285006A (ja) 2005-10-13
JP3990375B2 JP3990375B2 (ja) 2007-10-10

Family

ID=35050304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004101431A Expired - Lifetime JP3990375B2 (ja) 2004-03-30 2004-03-30 画像処理装置および画像処理方法

Country Status (5)

Country Link
US (1) US7359568B2 (ja)
JP (1) JP3990375B2 (ja)
KR (1) KR100704389B1 (ja)
CN (1) CN100379255C (ja)
TW (1) TWI256597B (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009123206A (ja) * 2007-11-14 2009-06-04 Canon Inc 画像からテキストを抽出する方法及び装置
WO2013031418A1 (ja) * 2011-08-30 2013-03-07 株式会社メガチップス 線分および円弧検出装置
JP2013050762A (ja) * 2011-08-30 2013-03-14 Mega Chips Corp 線分および円弧検出装置
JP2013069043A (ja) * 2011-09-21 2013-04-18 Mega Chips Corp 線分および円弧検出装置
WO2013136546A1 (ja) * 2012-03-16 2013-09-19 株式会社東芝 画像処理装置、及び画像処理方法
US8867788B2 (en) 2010-07-29 2014-10-21 Honda Motor Co., Ltd. Vehicle periphery monitoring device
JP2021013124A (ja) * 2019-07-08 2021-02-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4807618B2 (ja) * 2006-03-06 2011-11-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4818091B2 (ja) * 2006-12-13 2011-11-16 キヤノン株式会社 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法
US8428387B2 (en) * 2007-03-06 2013-04-23 Shimadzu Corporation Edge evaluation method, edge detection method, image correction method, and image processing system
JP2010056672A (ja) * 2008-08-26 2010-03-11 Oki Data Corp 画像処理装置
JP5701181B2 (ja) * 2011-08-18 2015-04-15 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
CN103177709B (zh) * 2011-12-20 2015-03-11 北大方正集团有限公司 字符显示方法和装置
CN103577816A (zh) * 2012-07-24 2014-02-12 夏普株式会社 图像处理装置和图像处理方法
CN105009198B (zh) * 2013-02-28 2017-05-17 株式会社东芝 显示处理装置以及显示处理方法
CN104217202B (zh) * 2013-06-03 2019-01-01 支付宝(中国)网络技术有限公司 信息识别方法、设备和系统
JP2015176252A (ja) * 2014-03-13 2015-10-05 オムロン株式会社 画像処理装置および画像処理方法
CN105225221B (zh) * 2014-07-02 2018-02-06 中国科学院广州生物医药与健康研究院 图像边缘检测方法及系统
DE102015100927A1 (de) * 2015-01-22 2016-07-28 MAQUET GmbH Assistenzeinrichtung und Verfahren zur bildgebenden Unterstützung eines Operateurs während eines chirurgischen Eingriffs unter Verwendung mindestens eines medizinischen Instrumentes
US9684844B1 (en) * 2016-07-15 2017-06-20 StradVision, Inc. Method and apparatus for normalizing character included in an image
CN106446908A (zh) * 2016-08-31 2017-02-22 乐视控股(北京)有限公司 图像中目标检测方法及装置
US10909406B2 (en) * 2018-01-08 2021-02-02 Newgen Software Technologies Limited Image processing system and method
CN111768410B (zh) * 2019-05-22 2024-04-05 北京沃东天骏信息技术有限公司 图像处理方法和装置
EP3939009A1 (en) * 2019-05-31 2022-01-19 Apple Inc. Method and device for generating a resultant image based on colors extracted from an input image

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3092024B2 (ja) * 1991-12-09 2000-09-25 松下電器産業株式会社 画像処理方法
US6041145A (en) * 1995-11-02 2000-03-21 Matsushita Electric Industrial Co., Ltd. Device and method for smoothing picture signal, device and method for encoding picture and device and method for decoding picture
JP3832520B2 (ja) * 1996-08-19 2006-10-11 富士ゼロックス株式会社 画像形成装置および画像処理装置
CN1198653A (zh) * 1997-05-06 1998-11-11 华通电脑股份有限公司 化学蚀刻形成盲孔的多层电路板制法
JPH11308438A (ja) 1998-04-20 1999-11-05 Ricoh Co Ltd 画像処理装置
SG75190A1 (en) * 1998-12-14 2000-09-19 Canon Kk Image processing method and apparatus image processing system and storage medium
JP3680922B2 (ja) * 1999-07-14 2005-08-10 シャープ株式会社 画像処理装置
JP4146047B2 (ja) 1999-09-28 2008-09-03 株式会社東芝 画像の傾き検知方法及び文書画像処理装置
JP3890840B2 (ja) 1999-12-22 2007-03-07 富士通株式会社 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体
JP3878401B2 (ja) * 2000-09-14 2007-02-07 シャープ株式会社 画像処理装置、画像処理方法およびそれを記録した記録媒体
JP2002135801A (ja) * 2000-10-25 2002-05-10 Sony Corp 画像処理装置
JP4085584B2 (ja) * 2001-02-28 2008-05-14 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像形成装置
US8999632B2 (en) 2012-10-04 2015-04-07 Vertex Pharmaceuticals Incorporated Method for measuring ATR inhibition mediated increases in DNA damage

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009123206A (ja) * 2007-11-14 2009-06-04 Canon Inc 画像からテキストを抽出する方法及び装置
US8867788B2 (en) 2010-07-29 2014-10-21 Honda Motor Co., Ltd. Vehicle periphery monitoring device
JP5718920B2 (ja) * 2010-07-29 2015-05-13 本田技研工業株式会社 車両周辺監視装置
US9443318B2 (en) 2011-08-30 2016-09-13 Megachips Corporation Line segment and arc detection apparatus
JP2013050762A (ja) * 2011-08-30 2013-03-14 Mega Chips Corp 線分および円弧検出装置
WO2013031418A1 (ja) * 2011-08-30 2013-03-07 株式会社メガチップス 線分および円弧検出装置
US9721179B2 (en) 2011-08-30 2017-08-01 Megachips Corporation Line segment and arc detection apparatus
JP2013069043A (ja) * 2011-09-21 2013-04-18 Mega Chips Corp 線分および円弧検出装置
WO2013136546A1 (ja) * 2012-03-16 2013-09-19 株式会社東芝 画像処理装置、及び画像処理方法
JP2013196136A (ja) * 2012-03-16 2013-09-30 Toshiba Corp 画像処理装置、及び画像処理方法
US9275279B2 (en) 2012-03-16 2016-03-01 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
JP2021013124A (ja) * 2019-07-08 2021-02-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP7341758B2 (ja) 2019-07-08 2023-09-11 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
CN1678016A (zh) 2005-10-05
KR100704389B1 (ko) 2007-04-05
US20050219581A1 (en) 2005-10-06
JP3990375B2 (ja) 2007-10-10
KR20060042142A (ko) 2006-05-12
TWI256597B (en) 2006-06-11
TW200539063A (en) 2005-12-01
CN100379255C (zh) 2008-04-02
US7359568B2 (en) 2008-04-15

Similar Documents

Publication Publication Date Title
JP3990375B2 (ja) 画像処理装置および画像処理方法
US8050499B2 (en) Image-processing apparatus, image-processing method, and computer program used therewith
JP4189506B2 (ja) 画像処理のための装置、方法及び記録媒体
WO1999067943A1 (fr) Unite et procede de traitement d'images, et support sur lequel le programme de traitement des images est enregistre
JP2009278363A (ja) 画像処理装置及び画像処理方法
JP5049920B2 (ja) 画像処理装置及び画像処理方法
JP2013196369A (ja) 画像処理装置、文字認識方法及びコンピュータプログラム
JP2009225422A (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
JP2004126648A (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP4582204B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP4748234B2 (ja) 画像処理装置および画像形成装置
US20120114230A1 (en) Image processing apparatus, image processing method, and storage medium
JP2000181992A (ja) カラー文書画像認識装置
JP2009037596A (ja) 画像処理装置およびプログラム
JP6607490B2 (ja) 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
JP2009141597A (ja) 画像処理装置、文字領域特定方法、および文字領域特定プログラム
JP2009017247A (ja) 画像処理装置およびプログラム
JP2007088912A (ja) 画像処理装置およびプログラム
JP3888090B2 (ja) 画像処理装置及び画像処理方法
JP2007335983A (ja) 画像処理装置
JP2011061473A (ja) 画像判別装置
JP2008299673A (ja) 画像処理装置、画像処理プログラムおよび該画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに画像処理方法
JP3754721B2 (ja) 画像処理装置及びその方法
JP3596962B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070717

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070719

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 3990375

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100727

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110727

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130727

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350