JP2005275854A - 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 - Google Patents

画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 Download PDF

Info

Publication number
JP2005275854A
JP2005275854A JP2004088716A JP2004088716A JP2005275854A JP 2005275854 A JP2005275854 A JP 2005275854A JP 2004088716 A JP2004088716 A JP 2004088716A JP 2004088716 A JP2004088716 A JP 2004088716A JP 2005275854 A JP2005275854 A JP 2005275854A
Authority
JP
Japan
Prior art keywords
character
color
image
extracting
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004088716A
Other languages
English (en)
Other versions
JP4441300B2 (ja
Inventor
Hirofumi Nishida
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2004088716A priority Critical patent/JP4441300B2/ja
Priority to US11/088,891 priority patent/US7715624B2/en
Publication of JP2005275854A publication Critical patent/JP2005275854A/ja
Application granted granted Critical
Publication of JP4441300B2 publication Critical patent/JP4441300B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3871Composing, repositioning or otherwise geometrically modifying originals the composed originals being of different kinds, e.g. low- and high-resolution originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6027Correction or control of colour gradation or colour contrast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background

Abstract

【課題】
文書画像のテキスト部分(小さい文字)について、もとの低解像度の多値画像を高解像度の2値画像に変換し、さらに文字の色を正確に再現して効率的に高解像度の高精細画像を生成する。
【解決手段】
画像処理装置1は、取得した原デジタル画像から文字を抽出する文字抽出手段11と、文字抽出手段により抽出した各文字について原デジタル画像OGよりも高い解像度の2値画像を生成する高解像度2値画像生成手段12と、文字抽出手段により抽出した各文字について文字色を抽出する文字色抽出手段13と、文字抽出手段により抽出した各文字の平均色と、最も暗い色とから文字の輪郭色を決定する文字輪郭色決定手段14と、原デジタル画像から当該原デジタル画像よりも高い解像度の画像を生成する高解像度画像生成手段15とを備えている。
【選択図】 図1

Description

本発明は、スキャナ、デジタルカメラ等の画像入力機器により取り込んだ文書、図面の画像から、文字・線図を正確にまたは改善して再現した画像を作成することができる画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体に関する。
近年、カラースキャナ、カラーデジタルカメラ(カラーデジタルカメラ付きの携帯型電話機を含む)等のカラー情報入力機器が広く普及している。カラースキャナでは、たとえば解像度400dpi、256階調で原稿画像を読み取る場合には、処理するべきデータ量が増化し、読み取りに時間がかかる等の不都合がある。また、カラーデジタルカメラでは、たとえば解像度400dpiで撮影するとメモリに記憶できる画像数が少なくなるといった不都合がある。
一般に、カラー画像では、たとえば200dpi程度であっても、ディスプレイに表示する場合に画質が劣って見えることはない。このため、この種のカラー情報入力機器では、カラーの文書、図面、地図等を、200dpi程度の解像度で取得し(すなわち読み取りまたは撮影し)、所定フォーマット(TIF、JPEG、GIF等)のイメージファイルとして他の装置に送信等している。
ところで、カラービットマップ画像に、写真、絵等のほか、文字・線図が含まれている場合において、これら文字・線図を正確にまたは改善して認識したい場合が生じることがある。たとえば、あるユーザは、カラービットマップ画像に描かれている文字・線図を、高解像度で印刷出力し、ディスプレイに表示し、またはグラフィックツール(画像加工ができるソフトウェア)により加工したい場合がある。あるいは、あるユーザは、カラービットマップ画像に描かれている文字列を文字認識装置によりコード化し、ワードプロセッサにより編集可能な文字列として編集等したい場合がある。
ところが、カラーの印刷文書、図面、地図等が200dpi程度の解像度で作成されている場合に、画像に含まれる文字・線図が小さいと(たとえば、3ミリ四方程度であると)、当該画像をディスプレイに表示出力したときや、印刷出力したときに文字・線図の視認性が低下するし、また、画像に含まれ文字・線図をOCR等の画像認識装置により認識する場合、文字・線図が正しく認識ができないことがある。
モノクロ画像からなる文書、図面、地図等は200dpi程度の解像度では、たとえばディスプレイに表示したときに画質が劣って見える。このため、モノクロ画像からなる文書等は、通常は、解像度400dpi以上の解像度で作成される。すなわち、モノクロスキャナでは(あるいは、カラースキャナのモノクロ読み取りモードでは)、400dpi程度の解像度で、文書、図面、地図等を読み取り、2値画像として画像処理装置(コンピュータ等)に渡すことができる。また、デジタルカメラでは、モノクロで撮影した場合には、撮影画像のデータ量は、カラーで撮影した場合のデータ量に比べて圧倒的に小さいので、撮影画像は400dpi程度の解像度で、メモリに蓄積される。
モノクロビットマップ画像は、400dpi程度の解像度であれば、画像中の文字が小さい場合(たとえば、3ミリ四方程度)であっても、高い視認性でディスプレイに表示することができるし、またプリンタにより高解像度で印刷出力することができ、また、たとえば文字認識装置による認識も良好に行うことができる。
200dpi程度以下の解像度の、多階調のカラー画像に含まれる文字・線図等を、モノクロの400dpiの画像と同様に、正確に再現しまたは改善して作成することが望まれているが、この場合には、前述したように、小さい文字の視認性が問題となる。特に、入力系の「ボケ」作用が強いときには、小さい文字の視認性が極めて悪くなることがある。特に,入力系の「ボケ」作用が強いときには、(a)白背景上の黒文字とその周囲に色が着いている、(b)本来均一であるべき文字のストロークの色がばらついている、(c)輪郭が不明瞭となっている等の理由により、小さい文字が読みづらくなる。
文字強調の方法として,従来はエッジ強調が主に用いられてきた(特許文献1,2,3)。しかし、低解像度の小さい文字(たとえば、200dpiでの3ミリ角程度の文字)の場合、図4に示すように、ストローク幅が1〜2画素と狭いため、エッジ強調は有効でない。さらに、エッジ強調のパラメータは入力機器の特性に強く依存するため、入力に使われる機器が不特定、未知の場合には、適用が難しい。さらに、エッジ強調をすると、OCRの精度が逆に下がることもあり、人間にとっての見易さとOCRの認識精度は必ずしも両立しないという問題点がある。
そこで、小さい文字部分について、もとの低解像度の多値画像を、高解像度の2値画像に変換することによって、高精細のカラー文書画像を生成する手法が考えられる。この手法では、(a)テキスト部分(小さい文字)について高解像度の2値画像を生成し、(b)他の部分は通常の方法(双1次補間,3次スプライン補間等)で補間して高解像度化し、(c)高解像度カラー画像に、高解像度2値テキスト画像を埋め込むことで、小さい文字について高精細のカラー文書画像を生成することができる。
上記の手法に基づいて、具体的なアルゴリズムを設計する際の課題としては、小さい文字の抽出とそれらの文字色の推定が挙げられる。文字色の推定では、局所的に算出された文字色をクラスタリングすることによって、処理対象とするテキストに使われているフォント色のパレットを求めることが必要である。カラークラスタリングの方法には、それぞれの応用に則して数多くの方法が提案されている。特に、文書画像への応用としては、色を利用したテキスト抽出があり,本、雑誌、CDの表紙、Web上の画像等に適用されている(非特許文献1,2,3等参照)。
特許第2558915号 特許第3154242号 特許第3176341号 A.K. Jain and B. Yu, Automatic text location in images and video frames, Pattern Recognition, 31(12), 2055-2076, 1998. Y. Zhong, K. Karu, and A. Jain, Locating text in complex color images, Pattern Recognition, 28(10), 1523-1535, 1995. J. Zhou and D. Lopresti, Extracting text from WWW images, Proc. 4th International Conference on Document Analysis and Recognition (Ulm, Germany), August 1997, 1997, pp. 248-252.
非特許文献1,2,3等における技術は、各代表色の割合にそれほどの偏りがなく、テキスト文書に比べて文字の数も少ない場合には有効であるが、各代表色の割合に偏りがあり、通常のテキスト文書のように文字の数が場合には次のような問題が生じる。
すなわち、通常のテキスト文書では、黒を主体として、その他強調に使うためにいくつかの色が使われる。文字色の分布を調べると、大多数(50%以上)を占める黒に相当するクラスタと、その他の色が点在するような特殊なプロファイルが得られることが多い。このため、色のクラスタリングを行う際には、注意を払わなければ、強調に使われている色が、大多数を占めている黒に相当するクラスタに併合されてしまう(黒色に埋もれてしまう)といった現象が生じる可能性がある。また、非特許文献1,2,3等における技術は、計算効率が良いとは言えず、処理時間が長くなるという問題もある。
本発明は、文書画像のテキスト部分(小さい文字)について、もとの低解像度の多値画像を高解像度の2値画像に変換し、さらに文字の色を正確に再現して効率的に高解像度の高精細画像を生成することができる画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを格納した記録媒体を提案することを目的とする。
第1発明の画像処理装置は、取得した原デジタル画像から文字を抽出する文字抽出手段と、前記文字抽出手段により抽出した各文字について前記原デジタル画像よりも高い解像度の2値画像を生成する高解像度2値画像生成手段と、前記文字抽出手段により抽出した各文字について文字色を抽出する文字色抽出手段と、前記文字抽出手段により抽出した各文字の平均色と、最も暗い色とから文字の輪郭色を決定する文字輪郭色決定手段と、前記原デジタル画像から当該原デジタル画像よりも高い解像度の画像を生成する高解像度画像生成手段とを備えたことを特徴とする。
また、第2発明の画像処理装置は、取得した原デジタル画像から文字を抽出する文字抽出手段と、前記文字抽出手段により抽出した各文字について前記原デジタル画像よりも高い解像度の2値画像を生成する高解像度2値画像生成手段と、前記文字抽出手段により抽出した各文字について文字色を抽出する文字色抽出手段と、前記文字抽出手段により抽出した各文字について、大多数の文字に使われている色のパレットを抽出する大多数文字色パレット抽出手段と、前記文字抽出手段により抽出した各文字について、前記大多数の文字に使われている色以外の少数の文字にのみ使われている色のパレットを抽出する少数文字色パレット抽出手段と、前記原デジタル画像から当該原デジタル画像よりも高い解像度の画像を生成する高解像度画像生成手段とを備えたことを特徴とする。
第2発明の画像処理装置は、前記高解像度画像生成手段は、前記原デジタル画像の文字以外の部分は補間により拡大し(すなわち、画素数を増やし)、抽出された各文字については前記高解像度2値画像生成手段により生成した高解像度の2値画像における文字のストローク部分に、前記大多数文字色パレット抽出手段または前記少数文字色パレット抽出手段により抽出した文字色のパレットを用いて色を埋め込むことを特徴とする。
第2発明の画像処理装置では、前記大多数文字色パレット抽出手段は、色分布のヒストグラムを作成する色分布ヒストグラム作成手段と、色分布ヒストグラム作成手段により生成したヒストグラムから、最大のクラスタを抽出する最大クラスタ抽出手段と、前記最大のクラスタを代表する色を求めるクラスタ代表色抽出手段と、前記最大のクラスタを取り除いた色分布のヒスグラムを作成する最大クラスタ除去ヒストグラム作成手段とを有することができる。
第2発明の画像処理装置では、前記少数文字色パレット抽出手段は、大多数の文字に使われている色のクラスタを取り除いた色分布のヒスグラムを作成する少数文字色ヒストグラム作成手段と、前記少数文字色ヒストグラム作成手段により作成したヒストグラムから、色のクラスタを抽出る少数文字色クラスタ抽出手段と、前記少数文字色クラスタ抽出手段により抽出した各クラスタを代表する色を抽出する少数文字色クラスタ代表色抽出手段とを有することができる。
本発明の画像処理方法は、取得した原デジタル画像から文字を抽出するステップと、前記文字抽出ステップにおいて抽出した各文字について前記原デジタル画像よりも高い解像度の2値画像を生成するステップと、前記文字抽出ステップにおいて抽出した各文字について文字色を抽出するステップと、前記文字抽出ステップにおいて抽出した各文字の平均色と、最も暗い色とから文字の輪郭色を決定するステップと、前記原デジタル画像から当該原デジタル画像よりも高い解像度の画像を生成するステップとを備えたことを特徴とする。また、本発明の画像処理方法は、取得した原デジタル画像から文字を抽出する文字抽出ステップと、前記文字抽出ステップにおいて抽出した各文字について前記原デジタル画像よりも高い解像度の2値画像を生成する高解像度2値画像生成ステップと、前記文字抽出ステップにおいて抽出した各文字について文字色を抽出する文字色抽出ステップと、前記文字抽出ステップにおいて抽出した各文字について、大多数の文字に使われている色のパレットを抽出する大多数文字色パレット抽出ステップと、前記文字抽出ステップにおいて抽出した各文字について、前記大多数の文字に使われている色以外の少数の文字にのみ使われている色のパレットを抽出する少数文字色パレット抽出ステップと、前記原デジタル画像から当該原デジタル画像よりも高い解像度の画像を生成する高解像度画像生成ステップと、備えたことをも特徴とする。
本発明の画像処理プログラムは、コンピュータを、第1および第2発明の画像処理装置における各手段として機能させることを特徴とする。
本発明のコンピュータに読取り可能な記録媒体は、コンピュータを、第1および第2発明の画像処理装置における各手段として実行させるためのプログラムであることを特徴とする。
原画像では、文字のストロークの色が均一でないため、視認性が芳しくないが、生成された画像では,文字のストロークの色が均一になり、明瞭になっている。
画質向上の効果は、拡大表示において顕著に認められる。拡大すると、原画像では文字の輪郭がぼやけるために視認性が悪い。しかし、テキスト強調では文字とその周辺が2色に縮約されるので、輪郭が明瞭になる。
エッジ強調などで観測されるオーバーシュートなどのディフェクトや、OCRへの悪影響もない。
図1は本発明の画像処理装置の第1構成例を示す機能ブロック図である。
図1では、画像処理装置1は、文字抽出手段11と、高解像度2値画像生成手段12と、文字色抽出手段13と、文字輪郭色決定手段14と、高解像度画像生成手段15とを備えている。
文字抽出手段11は取得した原デジタル画像OGから文字を抽出し、高解像度2値画像生成手段12は文字抽出手段11により抽出した各文字について原デジタル画像(カラービットマップ画像)OGよりも解像度が高い2値画像(高解像度2値画像HMC)を生成し、文字色抽出手段13は、文字抽出手段111により抽出した各文字について文字色を抽出する。
文字輪郭色決定手段14は、文字抽出手段11により抽出した各文字の平均色と、最も暗い色とから文字の輪郭色を決定する。
高解像度画像生成手段15は、原デジタル画像OGから当該原デジタル画像よりも高い解像度の画像(高解像度カラー画像HRG)を生成する。すなわち、高解像度画像生成手段15は、原デジタル画像OGの文字以外の部分は補間により拡大し、抽出された各文字については高解像度2値画像生成手段12により生成した高解像度2値画像HMCにおける文字のストローク部分に、文字輪郭色決定手段14により抽出した文字色のパレットを用いて色を埋め込む。
図2は本発明の画像処理装置の第2構成例を示す機能ブロック図である。
図2では、画像処理装置2は、文字抽出手段21と、高解像度2値画像生成手段22と、文字色抽出手段23と、文字色パレット抽出手段24と、高解像度画像生成手段25とを備えている。
文字抽出手段21は取得した原デジタル画像OGから文字を抽出し、高解像度2値画像生成手段22は文字抽出手段21により抽出した各文字について原デジタル画像OGよりも解像度が高い2値画像(高解像度2値画像HMC)を生成し、文字色抽出手段23は、文字抽出手段21により抽出した各文字について文字色を抽出する。
文字色パレット抽出手段24は、大多数文字色パレット抽出手段241と、少数文字色パレット抽出手段242とかなり、大多数文字色パレット抽出手段241は、文字抽出手段21により抽出した各文字について大多数の文字(たとえば、全文字の50%以上)に使われている色のパレットを抽出し、少数文字色パレット抽出手段242は、文字抽出手段21により抽出した各文字について、大多数の文字に使われている色以外の少数の文字にのみ使われている色のパレットを抽出する。大多数文字色パレット抽出手段241は、色分布のヒストグラムを作成する色分布ヒストグラム作成手段2411と、色分布ヒストグラム作成手段2411により生成したヒストグラムから、最大クラスタを抽出する最大クラスタ抽出手段2412と、最大クラスタを代表する色を求めるクラスタ代表色抽出手段2413と、最大のクラスタを取り除いた色分布のヒスグラムを作成する最大クラスタ除去ヒストグラム作成手段2414とを有している。また、少数文字色パレット抽出手段242は、大多数の文字に使われている色のクラスタを取り除いた色分布のヒスグラムを作成する少数文字色ヒストグラム作成手段2421と、少数文字色ヒストグラム作成手段2421により作成したヒストグラムから、色のクラスタを抽出る少数文字色クラスタ抽出手段2422と、少数文字色クラスタ抽出手段2422により抽出した各クラスタを代表する色を抽出する少数文字色クラスタ代表色抽出手段2423とを有している。
高解像度画像生成手段25は、原デジタル画像OGから当該原デジタル画像よりも高い解像度の画像(高解像度カラー画像HRG)を生成する。高解像度画像生成手段25は、原デジタル画像OGの文字以外の部分は補間により拡大し、抽出された各文字については高解像度2値画像生成手段22により生成した高解像度2値画像HMCにおける文字のストローク部分に、大多数文字色パレット抽出手段241または少数文字色パレット抽出手段242により抽出した文字色のパレットを用いて色を埋め込む。
図3は本発明の画像処理装置のハードウェア構成図である。
図3において、パーソナルコンピュータ(PC)310は画像処理装置として動作するもので、CPU311と、メモリ312(ROM3121とRAM3122とからなる)と、ハードディスク装置313と、リムーバブルディスク装置314と、表示装置315と、キーボード316と、ポインティングデバイス(マウス等)317と、ネットワークインタフェース318とがバス319に接続されて構成されている。なお、ネットワークインタフェース318は、通信回線300を介して処理対象である原デジタル画像OGを受信しあるいは処理結果である高解像度カラー画像HRGを所定の送信先に送信することができる。
図1および図2に示した各手段は、ROM3121またはRAM3122に書き込まれ、または読み込まれているものとする。また、画像作成の処理対象となることができる原デジタル画像OGがリムーバブルディスク装置314に格納されているものとする。また、本発明の画像処理プログラムがハードディスク装置(「HDD」で示す)313に格納されているものとし、ユーザが画像処理プログラムを起動すると、画像処理プログラム(「GCP」で示す)はRAM312に読み込まれ、画像作成処理が可能になる。
《第1実施形態》
図5のフローチャートは、図1の画像処理装置1の処理を示すもので、
(1)文字抽出手段11により、原デジタル画像OG上の小さい文字の候補領域を抽出し(S110)、
(2)高解像度2値画像生成手段12により、高解像度2値画像HMCを生成するとともに、原デジタル画像OG上の文字の色を抽出し(S120)、
(3)高解像度画像生成手段15により高解像度カラー画像HRGを生成する(S130)、
の各ステップにより構成される。
以下、各構成要素による上記ステップついて述べる。
(1)小さい文字の候補領域の抽出
まず、文字抽出手段11により、原デジタル画像OGをモノクロ画像(輝度画像)に変換し、2値化を行うことで低解像度2値画像LMCを作成する。
2値化方法としては、大局的閾値と局所的閾値を併用する。大局的閾値には、前景と背景の輝度レベルの2つがあり、例えば判別分析やモーメント保持原理による方法を用いて計算する。
前景輝度閾値より暗い画素はONに、背景輝度閾値より明るい画素はOFFに設定する。ON/OFFが未定の画素については、局所的2値化、例えばNiblackの方法により決定する。例えば、図6に示した原デジタル画像OGからは、図7のような低解像度2値画像LMCが得られる。
このように求められた低解像度2値画像LMCから、ON画素連結成分の輪郭を抽出する。小さい文字の輪郭線であれば外輪郭であり、かつその輪郭のbounding box(輪郭線をちょうど囲むような最小の直立長方形)の幅と高さがある範囲内(例えば、200dpiで40画素=5mm)に収まるはずである。実際には,隣接する文字が接触したり、ノイズが存在したりするので、bounding boxの幅または高さの少なくとも一方が決められた範囲(例えば、200dpiで3画素〜40画素=0.75mm〜5mm)にあるような外輪郭を囲むbounding boxの集合を文字候補領域とする。
(2)高解像度2値画像の生成と文字色の抽出
文字候補領域を構成するbounding boxのそれぞれにおいて、既存の技術により、図8に示すように高解像度の2値画像を生成するとともに、図9に示すように、文字色を計算する。なお、図9では、説明の便宜上、文字色(各文字の位置に相当するブロックの色)を同一色のグレーで示してあるが、実際には、1色以上のカラーで表される。
文字色の計算においては、図4の例で見られるように、光学系のPSF(点広がり関数)の影響によって、2値画像のON画素で計算された平均色が、実際の色よりも明るめになってしまうことに注意する。そこで,ON画素から算出した平均色の加えて、最も暗い色も算出し、それら2つの平均をそのbounding boxにおける文字色とすることが好ましい。
(3)高解像度画像の合成
文字部分(図8の黒画素)以外は、原画像を通常の補間方法で拡大し、高解像度のカラー画像を生成する。そして、図10に示すように、この高解像度のカラー画像のON画素を、(2)で求めた文字色で埋め込み、高解像度カラー画像HRGを作成する。
《第2実施形態》
図11のフローチャートは、図2の画像処理装置2の処理を示すもので、
(1)文字抽出手段21により、原デジタル画像OG上の小さい文字の候補領域を抽出し(S210)、
(2)高解像度2値画像生成手段22により、高解像度2値画像HMCを生成するとともに、原デジタル画像OG上の文字の色を抽出し(S220)、
(3)文字色パレット抽出手段24により大多数も文字の最大クラスタを抽出した後、各文字色のパレットを抽出し(S230)、
(4)高解像度画像生成手段25により高解像度カラー画像HRGを生成する(S240)、
の各ステップにより構成される。
(1)の「小さい文字の候補領域の抽出」および(2)の「高解像度2値画像の生成と文字色の抽出」は第1実施形態と同じである。
(3)カラークラスタリング
第2実施形態では、文字色パレット抽出手段24により文字色をクラスタリングすることによって、少数文字色パレット抽出手段2421により少数の色から成るパレットを構築する。
テキスト文書画像における文字色のクラスタリングでは、
(a)強調に使われている色が、大多数を占めている黒に相当するクラスタに併合されて、黒に埋もれてしまう現象が生じてしまう可能性があること、
(b)多次元データのクラスタリングに際しての課題である計算効率の向上を図ること、
等の点に注意する必要がある。
まず、計算効率の向上を考えると、サンプルの数が少なくとも10万のオーダになる。たとえば、200dpiのA4サイズの画像で画素数は4,000,000程度であり、そのうち文字領域が10%を占めると、サンプル数は400,000程度になる。このため、ヒストグラムをもとにしたクラスタリング方法が適当である。さらに、3次元ヒストグラムよりも、色彩空間の工夫により、各カラーチャンネルでヒストグラムを構成し、クラスタリングした結果を組み合わせることが望ましい。ここで,色彩空間は、3つの成分間で分布の独立性が高い(共分散が小さい)ものを選ぶべきである。
(a)の問題を考えると、まず、大多数文字色パレット抽出手段241により大多数を占める支配色(大多数文字色)のクラスタを抽出し、少数文字色パレット抽出手段2421により残りのサンプルから強調に使う色を抽出するという2段階の処理が適当である。
(3−1)色彩空間
本実施形態では、成分間での分布の独立性、計算の簡単さ、各成分の取り扱いやすさ(HSVやHSIの場合、Hue成分の値が角度になるため、若干扱いにくくなる)から、YCbCr空間を用いている。
(3−2)ヒストグラムをもとにしたクラスタリング
本実施形態では、色分布ヒストグラム作成手段2411は、YCbCrの各成分について、信号値を再量子化(例えば、32レベル)し、ヒストグラムを構成する。図12は、信号値に対する出現の頻度レベルを示す図である。図12に示すように、各レベルについて、近傍で最も多くのデータを持つレベルを記憶しておく(すなわち、ポインタを張る)。もし、両隣のレベルのデータ数が自身よりも少なければ、ポインタを張らない。すべてのレベルについてポインタを設定し終えれば、図12に矢印で示すような、データ数が極大であるようなレベルに向かうポインタのチェーンが構築されている。このようなチェーンのそれぞれについて,それに属するレベルの集合が1つのクラスタとなる。各クラスタの代表値は、データ数が最多のレベルとすればよい。
(3−3)支配色のクラスタ抽出
次に、最大クラスタ抽出手段241により、支配色のクラスタ抽出をする。図6の画像のように、黒文字が支配的なテキスト文書では、YCbCrの各成分についてのヒストグラムを構成すると、大多数の文字が黒であり、少数の文字がカラーの文字であるような文字色画像(図13参照)からは、図14に示すように、CbとCr成分の中央に、大多数を占めるクラスタが構成される。このような支配色を構成するクラスタを、次のように抽出して行く。なお、図13ではモノクロで表現されているが、たとえば、右上のグレーのa,b,cで示した文字色は実際にはカラーであるものとする。
(i)各成分について,ヒストグラムを用いたクラスタリングを適用して、最大のクラスタを抽出する。図14の例では、Y、Cr、Cb成分(32レベルに量子化)について、それぞれ、[7,14]、[14,16]、[14,18]の閉区間となり、中心は、それぞれ、9、15、15となる。すべての成分について、最大クラスタの大きさが、決められた割合(例えば、50%)よりも大きければ、次のステップ(ii)と(iii)のようにして支配色のクラスタを抽出する。そのような成分がなければ,終了する。
(ii)各成分の最大クラスタ(閉区間)の直積をとることによって,3次元の直方体,ここの例では、
{(Y,Cb,Cr):7≦Y≦14,14≦Cb≦16,14≦Cr≦19}
を構成する。図13に示したような文字色画像から,この直方体に属する文字色を抽出すると、図14に示したように、文字色の全体のうち、69.4%がこの直方体に含まれる。
(iii)これらの画素を、各成分の最大クラスタの中心を組み合わせた色、ここの例では、中心は、(Y,Cb,Cr)=(9,15,15)、(R,G,B)=(61,79,58)に置き換えることにより、支配色のクラスタが構築される。
(iv)直方体に含まれる文字色を除外して,YCbCrの各成分のヒストグラムを再構成(図15)し、(i)の処理に進む。
図15のヒストグラムをみてわかるように、CbとCr成分の中央に、大多数を占めるクラスタが存在ずるので、上記の手続きが繰り返される。クラスタは、[22,25]×[14,16]×[14,18]の3次元直方体(32レベルのYCbCr空間)で、中心は、(Y,Cb,Cr)=(24,14,15)、(R,G,B)=(181,202,164)となり、図15に示すように、文字色の23.2%を占める。この後、(iv)で再構成されるヒストグラムは、最終的に図16のようになり、YとCb成分には支配的なクラスタがなくなるので、支配色の抽出は終了する。
(3−4)強調色(少数文字色)のクラスタ抽出
上記のようにして、支配色を抽出した後、少数文字色ヒストグラム作成手段2421により、強調色のヒストグラムを作成し、少数文字色クラスタ抽出手段2422により、強調色のクラスタを抽出する。大多数文字色では、各成分の最大クラスタのみを用いたのに対して、ここでは、すべてのクラスタから構成される組み合わせについて、3次元直方体を構成して、各文字色を分類して行く。
図17に文字色のクラスタリングの結果を示す。ここでは、支配色(クラスタ1と2)と強調色(クラスタ3〜6)の6色にクラスタリングされる。図16からわかるように、Y成分には3つ、Cb成分には4つ、Cr成分には2つのクラスタが存在するので、最大3×4×2=24個のクラスタ(直方体)があり得るが、実際には4つのクラスタしか存在しない。また、この段階になって、Y成分の中央部分に支配色に隠れていた[14,15]のクラスタが出現している。支配色の抽出を行わない場合,6番目のクラスタ(図13の右上の3文字の色に相当)が他のより大きなクラスタに併合されてしまい、誤分類が生じることになる。
(4)高解像度画像の合成
小さい文字以外は、原デジタル画像OGを通常の方法で補間し,高解像度のカラー画像を生成する。そして,高解像度2値画像のON画素を、(2)で求めた文字色が属するクラスタの代表色を使って埋め込み、高解像度カラー画像HRGを作成する。
本発明の画像処理装置の第1の構成例を示す機能ブロック図である。 本発明の画像処理装置の第2の構成例を示す機能ブロック図である。 本発明の画像処理装置のハードウェア構成図である。 低解像度の小さい文字を示す図である。 図1の画像処理装置の処理を示すフローチャートである。 本発明が適用される原デジタル画像の一例を示す図である。 原デジタル画像から得られる低解像度2値画像を示す図である。 本発明の処理の課程で得られる高解像度の2値画像を示す図である。 文字色(各文字の位置に相当するブロックの色)を示す説明図である。 本発明の実施形態により作成された高解像度カラー画像HRGを示す図である。 図2の画像処理装置の処理を示すフローチャートである。 原デジタル画像の信号値に対する出現の頻度レベルを示す図である。 図2の画像処理装置による処理課程において作成される文字色画像を示す図である。 原デジタル画像についてのクラスタ分布を示す図である。 再構成されたヒストグラムを示す図である。 再構成を繰り返すことで作成された最終的なヒストグラムを示す図である。 第2実施形態における画像処理装置の文字色のクラスタリングの結果を示す図である。
符号の説明
1 画像処理装置
11,21 文字抽出手段
12,22 高解像度2値画像生成手段
13,23 文字色抽出手段
14 文字輪郭色決定手段
15,25 高解像度画像生成手段
24 文字色パレット抽出手段
241 大多数文字色パレット抽出手段
242 少数文字色パレット抽出手段
300 通信回線
310 PC
311 CPU
312 メモリ
313 ハードディスク装置
314 リムーバブルディスク装置
315 表示装置
316 キーボード
317 ポインティングデバイス
318 ネットワークインタフェース
319 バス
2411 色分布ヒストグラム作成手段
2412 最大クラスタ抽出手段
2413 クラスタ代表色抽出手段
2414 最大クラスタ除去ヒストグラム作成手段
2421 少数文字色ヒストグラム作成手段
2422 少数文字色クラスタ抽出手段
2423 少数文字色クラスタ代表色抽出手段
3121 ROM
3122 RAM

Claims (9)

  1. 取得した原デジタル画像から文字を抽出する文字抽出手段と、
    前記文字抽出手段により抽出した各文字について前記原デジタル画像よりも高い解像度の2値画像を生成する高解像度2値画像生成手段と、
    前記文字抽出手段により抽出した各文字について文字色を抽出する文字色抽出手段と、
    前記文字抽出手段により抽出した各文字の平均色と、最も暗い色とから文字の輪郭色を決定する文字輪郭色決定手段と、
    前記原デジタル画像から当該原デジタル画像よりも高い解像度の画像を生成する高解像度画像生成手段と、
    を備えたことを特徴とする画像処理装置。
  2. 取得した原デジタル画像から文字を抽出する文字抽出手段と、
    前記文字抽出手段により抽出した各文字について前記原デジタル画像よりも高い解像度の2値画像を生成する高解像度2値画像生成手段と、
    前記文字抽出手段により抽出した各文字について文字色を抽出する文字色抽出手段と、
    前記文字抽出手段により抽出した各文字について、大多数の文字に使われている色のパレットを抽出する大多数文字色パレット抽出手段と、
    前記文字抽出手段により抽出した各文字について、前記大多数の文字に使われている色以外の少数の文字にのみ使われている色のパレットを抽出する少数文字色パレット抽出手段と、
    前記原デジタル画像から当該原デジタル画像よりも高い解像度の画像を生成する高解像度画像生成手段と、
    を備えたことを特徴とする画像処理装置。
  3. 前記高解像度画像生成手段は、
    前記原デジタル画像の文字以外の部分は補間により拡大し、
    抽出された各文字については前記高解像度2値画像生成手段により生成した高解像度の2値画像における文字のストローク部分に、前記大多数文字色パレット抽出手段または前記少数文字色パレット抽出手段により抽出した文字色のパレットを用いて色を埋め込む、
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記大多数文字色パレット抽出手段は、
    色分布のヒストグラムを作成する色分布ヒストグラム作成手段と、
    色分布ヒストグラム作成手段により生成したヒストグラムから、最大のクラスタを抽出する最大クラスタ抽出手段と、
    前記最大のクラスタを代表する色を求めるクラスタ代表色抽出手段と、
    前記最大のクラスタを取り除いた色分布のヒスグラムを作成する最大クラスタ除去ヒストグラム作成手段と、
    を有することを特徴とする請求項2または3に記載の画像処理装置。
  5. 前記少数文字色パレット抽出手段は、
    大多数の文字に使われている色のクラスタを取り除いた色分布のヒスグラムを作成する少数文字色ヒストグラム作成手段と、
    前記少数文字色ヒストグラム作成手段により作成したヒストグラムから、色のクラスタを抽出る少数文字色クラスタ抽出手段と、
    前記少数文字色クラスタ抽出手段により抽出した各クラスタを代表する色を抽出する少数文字色クラスタ代表色抽出手段とを有することを特徴とする請求項2から4の何れかに記載の画像処理装置。
  6. 取得した原デジタル画像から文字を抽出するステップと、
    前記文字抽出ステップにおいて抽出した各文字について前記原デジタル画像よりも高い解像度の2値画像を生成するステップと、
    前記文字抽出ステップにおいて抽出した各文字について文字色を抽出するステップと、
    前記文字抽出ステップにおいて抽出した各文字の平均色と、最も暗い色とから文字の輪郭色を決定するステップと、
    前記原デジタル画像から当該原デジタル画像よりも高い解像度の画像を生成するステップと、
    を備えたことを特徴とする画像処理方法。
  7. 取得した原デジタル画像から文字を抽出する文字抽出ステップと、
    前記文字抽出ステップにおいて抽出した各文字について前記原デジタル画像よりも高い解像度の2値画像を生成する高解像度2値画像生成ステップと、
    前記文字抽出ステップにおいて抽出した各文字について文字色を抽出する文字色抽出ステップと、
    前記文字抽出ステップにおいて抽出した各文字について、大多数の文字に使われている色のパレットを抽出する大多数文字色パレット抽出ステップと、
    前記文字抽出ステップにおいて抽出した各文字について、前記大多数の文字に使われている色以外の少数の文字にのみ使われている色のパレットを抽出する少数文字色パレット抽出ステップと、
    前記原デジタル画像から当該原デジタル画像よりも高い解像度の画像を生成する高解像度画像生成ステップと、
    を備えたことを特徴とする画像処理方法。
  8. コンピュータを、請求項1から5の何れかに記載の各手段として機能させることを特徴とする画像処理プログラム。
  9. コンピュータを、請求項1から5の何れかに記載の各手段として実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2004088716A 2004-03-25 2004-03-25 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 Expired - Fee Related JP4441300B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004088716A JP4441300B2 (ja) 2004-03-25 2004-03-25 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
US11/088,891 US7715624B2 (en) 2004-03-25 2005-03-25 Recognizing or reproducing a character's color

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004088716A JP4441300B2 (ja) 2004-03-25 2004-03-25 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体

Publications (2)

Publication Number Publication Date
JP2005275854A true JP2005275854A (ja) 2005-10-06
JP4441300B2 JP4441300B2 (ja) 2010-03-31

Family

ID=34989855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004088716A Expired - Fee Related JP4441300B2 (ja) 2004-03-25 2004-03-25 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体

Country Status (2)

Country Link
US (1) US7715624B2 (ja)
JP (1) JP4441300B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007336226A (ja) * 2006-06-14 2007-12-27 Canon Inc 情報処理装置、制御方法、およびコンピュータプログラム
JP2009124614A (ja) * 2007-11-17 2009-06-04 Ricoh Co Ltd 画像処理装置及びこれを備えた画像形成装置、並びに、画像処理方法
JP2009225233A (ja) * 2008-03-18 2009-10-01 Casio Hitachi Mobile Communications Co Ltd 端末装置及びプログラム
EP2254000A2 (en) 2009-05-22 2010-11-24 Ricoh Company, Ltd. Image forming apparatus with image color measuring unit and image forming method

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4768451B2 (ja) * 2006-01-18 2011-09-07 株式会社リコー 画像処理装置、画像形成装置、プログラムおよび画像処理方法
US8244039B2 (en) * 2007-07-12 2012-08-14 Ricoh Company, Limited Apparatus, method, and computer program product for acquiring processing content for image data
US8411112B1 (en) 2011-07-08 2013-04-02 Google Inc. Systems and methods for generating an icon
JP5893379B2 (ja) * 2011-12-13 2016-03-23 キヤノン株式会社 画像圧縮装置、画像圧縮方法、コンピュータプログラム
US10409822B2 (en) 2014-05-06 2019-09-10 Shutterstock, Inc. Systems and methods for presenting ranked search results
CN111488885B (zh) * 2020-06-28 2020-09-25 成都四方伟业软件股份有限公司 一种图片主题色系智能提取方法及装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5668646A (en) * 1990-02-06 1997-09-16 Canon Kabushiki Kaisha Apparatus and method for decoding differently encoded multi-level and binary image data, the later corresponding to a color in the original image
JP3376129B2 (ja) * 1993-12-27 2003-02-10 キヤノン株式会社 画像処理装置及びその方法
US5848185A (en) * 1994-12-28 1998-12-08 Canon Kabushiki Kaisha Image processing apparatus and method
US6463173B1 (en) * 1995-10-30 2002-10-08 Hewlett-Packard Company System and method for histogram-based image contrast enhancement
US5956470A (en) * 1997-09-25 1999-09-21 Xerox Corporation Text quality enhancement via resolution enhancement technique based on separating jaggedness detection and filtering
JPH11341292A (ja) * 1998-05-29 1999-12-10 Canon Inc 画像処理装置及び方法及び記憶媒体
JP3713982B2 (ja) 1998-10-14 2005-11-09 富士ゼロックス株式会社 画像処理装置および画像処理方法
JP3748172B2 (ja) * 1998-12-09 2006-02-22 富士通株式会社 画像処理装置
US6941321B2 (en) * 1999-01-26 2005-09-06 Xerox Corporation System and method for identifying similarities among objects in a collection
JP2001016447A (ja) * 1999-06-30 2001-01-19 Minolta Co Ltd 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体
US6546132B1 (en) * 1999-09-21 2003-04-08 Seiko Epson Corporation Color table manipulations for smooth splicing
JP3882427B2 (ja) 1999-10-25 2007-02-14 富士ゼロックス株式会社 画像処理装置および画像処理方法
US20020049979A1 (en) * 2000-05-18 2002-04-25 Patrick White Multiple camera video system which displays selected images
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
JP3989738B2 (ja) * 2002-01-16 2007-10-10 シャープ株式会社 画像形成方法および画像形成装置ならびにプログラム、記録媒体
US7145691B2 (en) * 2002-01-17 2006-12-05 Kabushiki Kaisha Toshiba Image reading apparatus
JP4047192B2 (ja) * 2003-02-24 2008-02-13 キヤノン株式会社 画像圧縮装置及び方法、画像伸張装置及び方法、プログラム
JP2004320448A (ja) * 2003-04-16 2004-11-11 Ricoh Co Ltd 画像処理装置、画像処理システム、およびコンピュータが実行するためのプログラム
US20050078867A1 (en) * 2003-10-14 2005-04-14 Kabushiki Kaisha Toshiba System and method for generating black and white reproductions of color documents
US20060023236A1 (en) * 2004-07-30 2006-02-02 Sievert Otto K Method and arrangement for copying documents

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007336226A (ja) * 2006-06-14 2007-12-27 Canon Inc 情報処理装置、制御方法、およびコンピュータプログラム
JP4732250B2 (ja) * 2006-06-14 2011-07-27 キヤノン株式会社 情報処理装置、制御方法、およびコンピュータプログラム
US8077986B2 (en) 2006-06-14 2011-12-13 Canon Kabushiki Kaisha Information processing apparatus, method of controlling same and computer program
JP2009124614A (ja) * 2007-11-17 2009-06-04 Ricoh Co Ltd 画像処理装置及びこれを備えた画像形成装置、並びに、画像処理方法
US8259359B2 (en) 2007-11-17 2012-09-04 Ricoh Company, Limited Image processing device and image forming apparatus equipped with the image processing device
JP2009225233A (ja) * 2008-03-18 2009-10-01 Casio Hitachi Mobile Communications Co Ltd 端末装置及びプログラム
EP2254000A2 (en) 2009-05-22 2010-11-24 Ricoh Company, Ltd. Image forming apparatus with image color measuring unit and image forming method

Also Published As

Publication number Publication date
US20050213811A1 (en) 2005-09-29
JP4441300B2 (ja) 2010-03-31
US7715624B2 (en) 2010-05-11

Similar Documents

Publication Publication Date Title
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
JP5047051B2 (ja) 画像処理装置及び画像符号化方法
US8417029B2 (en) Image processing apparatus and method, including fill-up processing
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4366011B2 (ja) 文書処理装置及び方法
JP4250483B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP4123356B2 (ja) 画像処理装置、画像処理プログラム、記憶媒体
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JP2003152995A (ja) 画像処理装置
US7885486B2 (en) Image processing system, method for processing image and computer readable medium
JP4235583B2 (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2010056827A (ja) 画像処理装置および画像処理プログラム
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2010286959A (ja) 顔画像高解像度化方法、顔画像高解像度化装置、及びそのプログラム
JP2006197178A (ja) 画像処理装置および画像処理方法およびプログラムおよび記憶媒体
JP6607490B2 (ja) 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
JP2003244447A (ja) 画像処理装置及び画像処理方法
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
JP2004120092A (ja) 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム
JP2004199622A (ja) 画像処理装置、画像処理方法、記録媒体およびプログラム
JP2007005907A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP2005204206A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061228

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090131

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140115

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees