JP4027016B2 - 画像処理装置、画像処理方法及び記憶媒体 - Google Patents

画像処理装置、画像処理方法及び記憶媒体 Download PDF

Info

Publication number
JP4027016B2
JP4027016B2 JP2000211377A JP2000211377A JP4027016B2 JP 4027016 B2 JP4027016 B2 JP 4027016B2 JP 2000211377 A JP2000211377 A JP 2000211377A JP 2000211377 A JP2000211377 A JP 2000211377A JP 4027016 B2 JP4027016 B2 JP 4027016B2
Authority
JP
Japan
Prior art keywords
binarization
image
character
binarized
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000211377A
Other languages
English (en)
Other versions
JP2002024824A (ja
Inventor
ゆかり 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000211377A priority Critical patent/JP4027016B2/ja
Priority to DE60138073T priority patent/DE60138073D1/de
Priority to EP01305987A priority patent/EP1173003B1/en
Priority to US09/902,172 priority patent/US6999619B2/en
Priority to CNB011325208A priority patent/CN1201266C/zh
Priority to CNB200510054267XA priority patent/CN100348014C/zh
Publication of JP2002024824A publication Critical patent/JP2002024824A/ja
Priority to US11/246,301 priority patent/US7221790B2/en
Priority to US11/678,914 priority patent/US7376267B2/en
Application granted granted Critical
Publication of JP4027016B2 publication Critical patent/JP4027016B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は,画像処理装置、画像処理方法及び記憶媒体に関する。
【0002】
【従来の技術】
近年、スキャナの普及により文書の電子化が進んでいる。電子化された文書をフルカラーで所有すると300dpiでA4サイズの場合約24Mバイトになり、保有するにもメモリを逼迫するし、メイル添付などで他人に送信できるサイズではない。
【0003】
そこで、フルカラー画像を圧縮する方法としてJPEGが知られている。JPEGは写真などの自然画像を圧縮するには非常に効果も高く、画質も良いが、文字部などの高周波部分をJPEG圧縮するとモスキートノイズと呼ばれる画像劣化が発生し、圧縮率も悪い。一般的にオフィス文書は文字部が多いので、2値化を行いMMRなどの圧縮をかけ、文字領域座標とそこの文字の代表色を持つことで簡易的にカラーオフィス文書は表現できる。さらに、雑誌などの複雑なカラー文書では、領域分割を行い、文字領域を抜いた下地部分のJPEG圧縮と、文字領域を最適閾値にて2値化した2値画像のMMR圧縮を生成し、前記MMRデータに色情報を添付することで、かなり複雑なカラー文書も小さなデータサイズで表現することが可能となる。
【0004】
従って、文字領域部分の文字色代表色を算出する技術が必要になる。従来、文字色代表色を算出するには例として次のような方法があった。
【0005】
まず、文字領域の2値画像を参照しながら黒部分の多値画像データの粗い3次元ヒストグラムをとる。次にその粗い3次元ヒストグラムの一番高い値に含まれる多値画像の画素の細かいヒストグラムを取り、その一番高い値を代表色とする。
【0006】
【発明が解決しようとする課題】
しかしながら、上記方法を用いて文字色の代表色を算出する場合に、12ポイント以上の大きな文字を300dpi以上で読み込んだ文字であれば、そこそこの色を算出することができたが、10ポイント以下の文字は本来算出した代表色データの2値画像の黒に対応する割合は小さく、所望の色を算出することができなかった。
【0007】
ここで、大きな文字の代表色を算出する場合と、小さな文字の代表色を算出する場合を図19を利用して説明する。
【0008】
図19は白地に緑文字が書かれているサンプルを示している。1901は比較的太い文字の2値化結果を示している。その2値化結果1901の黒部分の多値画像は1902のようなレベルの変化をしている。1902のレベルの変化を見ると、文字部の代表色に相当する部分1904及び1905に長くとどまっているため、色空間RGB上では図20(a)のように分布される。2002が図19における緑色の文字色の固まりであり、すなわち文字部の代表色を表している。文字部の固まり2002はある程度の大きさを有しているので、ここを抽出することは比較的容易である。
【0009】
一方、図19の1906に示したような細い文字においては多値画像でのレベル変化は1907のような形をしていて文字部の代表色に相当する部分1908及び1909に到達するやいなやまた下地レベルへと変化してしまう。この場合のRGB色空間における分布は図20(a)のようになり、図20(a)の2002と比較すると、このデータから図20(b)の2005のポイントを算出するのは困難である。その2値化処理により点線であらわした線の左側が文字として黒く2値化され、従来の方法で説明した方法により代表色を算出すると、最多数存在する値として2006の点が得られてしまう。これは得たい文字色と比較して白っぽい緑となり、好ましくない。
【0010】
また、この現象を防ぐために、2値画像を細線化し、その細線画像により従来の代表色算出処理を行うことが考えられるが、その方法では、以下のような不具合が考えられる。
【0011】
簡単にするため「。」を例にして説明を行う。
【0012】
図21に白地に緑の「。」が書かれているとする。この「。」のレベル遷移は2104のような変化をしていることが考えられる。これは本来中央の窪みは白のレベルまで戻ることが理想であるのだが、小さいポイントの文字の「。」は戻りきらないことがある。それを2105に示す閾値で2値化処理をおこなうと2102に示すような真ん中が白くない黒丸が2値化結果になる。これに対して細線化処理を行うと2103のようになる。この2値画像が示す多値画像の位置はレベル2104で示すと2106のポイントとなり、これは代表色としては好ましくないレベルである。
【0013】
このような「潰れ現象」は特にポイント数の小さい文字において発生するので、細線化処理が効果的でないことがわかる。
【0014】
一方、文字を表現する出力としての2値画像を文字代表色算出に使用していた。しかし、文字を最適に表現する閾値は文字がかすれないように2値化することが好ましい。その後のOCR処理などを考えても、かすれるよりは潰れるように2値化したほうがOCR結果も良いことが知られている。
【0015】
図22に文字領域の典型的な輝度ヒストグラムの様子を示す。ポイント2201が文字の2値化画像としては望ましい点である。しかし、この点で2値化を行うと、下地から文字部分への遷移する画素も黒く2値化され出力としては好ましいのに、文字の代表色を算出するにはノイズとなる。
【0016】
その様子を図22に示す。図22のポイント2201で2値化を行うと、図23の2301で2値化をすることになり、2値化結果は2302、2303のように下地から文字への遷移部分も多く含んだ2値画像となる。
【0017】
従って、上記のように文字を表現する出力としての2値画像を文字代表色算出に使用していたので、文字部分の最適な代表色を算出することができなかった。
【0018】
本発明は、上記問題を解決し、文字部分の最適な代表色を算出することができる画像処理装置、画像処理方法及び記憶媒体を提供することを目的とする。
【0019】
【課題を解決するための手段】
上記目的を達成するために本発明の画像処理装置は、第1の2値化閾値を用いて入力画像を2値化する第1の2値化手段と、前記第1の2値化手段で2値化された画像に基づいて、文字領域を検出する領域分割手段と、前記検出された文字領域に対応する前記入力画像のヒストグラムを算出するヒストグラム算出手段と、前記第1の2値化手段で前記第1の2値化閾値を用いて2値化された画像における前記文字領域内の文字画像よりも2値化後の文字画像がかすれる第2の2値化閾値を、前記ヒストグラム算出手段で算出されたヒストグラムに基づいて算出する2値化閾値算出手段と、前記2値化閾値算出手段により算出された前記2値化後の文字画像がかすれる第2の2値化閾値で前記入力画像を2値化する第2の2値化手段と、前記第2の2値化手段で前記2値化後の文字画像がかすれる第2の2値化閾値を用いて2値化された画像と前記入力画像とに基づいて代表色を算出し、当該算出した代表色を、前記第1の2値化手段で前記第1の2値化閾値を用いて2値化された画像における前記文字領域の文字色にする算出手段とを有することを特徴とする。
【0020】
【発明の実施の形態】
(第1の実施形態)
以下、図面を参照して本発明に係る好適な実施形態を詳細に説明する。
【0021】
図1は、本実施形態の応用構成図を示す。
【0022】
102は原画像101を入力し、原画像101に対して2値化を行い2値画像(a)103を生成する2値化部(a)である。
【0023】
104は2値画像(a)を入力し、2値画像(a)から文字領域、写真領域などの領域を検出して、その座標および属性、例えば文字、写真などの領域情報105を生成する領域分割部である。
【0024】
106は領域情報105から文字の属性を持つ領域に対応する2値画像の1部分に対してMMR圧縮を行い、圧縮コードD107を生成するMMR圧縮部である。
【0025】
108は領域情報105から文字の属性を持つ領域に対応する領域内に含まれる文字の代表色を算出する文字代表色演算部である。文字代表色演算部108内には、文字代表色算出部のための2値化部(b)1081を有し、2値画像(b)1082を生成する。ここで算出された色情報は領域情報105の領域の属性として新たに書き込まれる。
【0026】
109は前記領域情報105の情報から自然画像の属性を持つ領域に対応する領域内に含まれる元画像の1部分のJPEG圧縮を行い、圧縮コードCを生成するJPEG圧縮部である。
【0027】
更に上記構成について詳細を説明する。
【0028】
図3に2値化部(a)102及び領域分割部104における処理の流れの一例を示す。
【0029】
ステップS301〜S303に2値化部(a)102における処理の流れを示し、ステップS304〜S306に領域分割部104における処理の流れを示す。
【0030】
ステップS301にて原画像101、例えばRGBカラー画像を入力し、以下に示す式により、輝度変換を行い、輝度画像Jを生成する。
【0031】
Y = 0.299R+0.587G+0.114B
【0032】
ステップS302にて輝度データのヒストグラムを取り、2値化を行うための閾値Tを算出する。
【0033】
ステップS303にて輝度画像Jを閾値Tにて2値化し、2値画像Kを生成する。
【0034】
ステップS304にて黒画素の輪郭線追跡を行い、すべての黒領域をラベル付けする。
【0035】
ステップS305にてラベル付けされた黒領域をその形や位置から文字、自然画の判定を行う。
【0036】
ステップS306にて更に、文字領域に関して形や位置から結合するものを結合する。ステップS306の結合処理は行わなくて良い。ただしその場合、代表色を算出する文字領域の数が多くなり、処理時間がかかってしまう欠点がある。利点としては、細やかに文字色の変化に対応できることがある。
【0037】
次に図2の原画像を使用して、ステップS306の結合処理まで行った場合を説明する。
【0038】
図2の原画像に対して輝度変換を行い(S301、S302)、その輝度のヒストグラムを算出すると図4のようになる。このヒストグラムから平均、分散、などのデータを利用して閾値T=150を算出し、2値化した画像は図5のようになる(S303)。これが図1の103の2値画像である。図6は図5の2値画像の解像度を落したものに、輪郭線追跡処理を行い、すべてをラベリングした様子である(S304)。このラベル付けされた黒領域の形、位置などの情報から文字、および自然画像の属性判断を行う(S305)。ただし実際にこのような画像が生成されるわけではなく、イメージである。ここでは、601が大きく、内部も黒いその形状から自然画像と判断される。また、602から605については、内部に文字を所有し、空洞である形状から「枠」であると判断される。本実施形態においては、枠情報は領域情報105に保持されず無視されることとする。しかし、その限りでなく、枠情報として保有することもアプリケーションも考えられる。または文字領域情報の下地として扱うアプリケーションも考えられる。その場合、下地の色を算出する手段を持つ必要がある。
【0039】
図7が図2の原画像から文字の属性がついて抽出された黒領域を示した図である。ここで、必要ならばこれらの黒画素の集まりを位置の近さや横幅、高さの一致からグループ化していくと、図8に示すような、801から817の17個の文字領域が検出できる。本実施形態ではグループ化(S306)を行うこととして、これらの17個の座標データが文字という属性を持ち、図1の109に格納される。一方、図6の601の座標データは写真という属性を持ち、図1の109に格納される。
【0040】
次に、文字代表色演算部108における処理の流れを図9に示す。領域情報105に格納されたすべての座標に対して処理を行うので、ステップS901では未処理の文字座標があるかどうかチェックし、あったらステップS902にすすみ、無かったらendにすすむ。
【0041】
ステップS902にて、その座標の属性が文字であるかどうかチェックし、文字であったらステップS903にすすみ、文字でない場合はステップS901に戻る。
【0042】
ステップS903にてその領域情報に対応する原画像の輝度ヒストグラムを算出する。この輝度ヒストグラムは一部の文字領域の物なので、図4に示したような全体のヒストグラムのように複雑な形状ではなく、図22に示したようなシンプルな形状をしている可能性が高い。
【0043】
そこで、ステップS904にて代表色算出に最適な閾値、すなわち文字がかすれるような閾値T2を算出する。図22でいうと、ポイント2202である。
【0044】
閾値T2を算出する方法としては一例として次のような方法がある。図10のフローチャートを使用して説明する。
【0045】
ステップS1001にて、無限ループに陥らないように処理数をカウントする変数limitに0を代入する。
【0046】
ステップS1002にて、輝度ヒストグラムから、ヒストグラムの平均値(average)とそのスキュー(skew)を求める。このskewは特別にskew_firstとして、値を保持しておく。それらの計算式は、以下のようになる。
【0047】
【外1】
Figure 0004027016
【0048】
ステップS1003にてHistUpperにaverageを代入し、HistLowerに0を代入する。ステップS1004にてlimitが10以上であるかどうかチェックし、10以上であるならばステップS1009にすすむ。(ここで、10でなくて、5でも構わないし、20でも構わない)ステップS1005にて、HistUpperからHistLower内のヒストグラムの
【0049】
【外2】
Figure 0004027016
を算出する。
【0050】
ステップS1006にて、skew<my*0.1の条件を満足するか否かをチェックして、満足した場合はこれ以上の計算は必要ないとしてステップS1010に飛ぶ。満足しない場合はステップS1007にすすむ。ステップS1007にてskew < 0.0かつskew_first < skew*0.1の条件を満足するか否かをチェックして、満足した場合はこれ以上の計算は必要ないとして1010に飛ぶ。満足しない場合はステップS1008にすすむ。ステップS1008ではHistLowerにaverageを代入する。そしてステップS1009にてlimitに1を足し、ステップS1004に戻る。
【0051】
以上のような繰り返しにより、最終的に1010にて閾値T2にaverageが代入され、それは図22のポイント2202に示すようなかすれる2値画像を得られる閾値となる。
【0052】
ヒストグラムの形状によっては、2値化すると黒画素の全くない閾値を算出する可能性もあるので、その閾値T2より黒側に存在する画素の数を数え、極端に少ない場合は多少白よりに補正する必要がある。そのような結果に陥り易いヒストグラムの形状を図17に示す。
【0053】
以上のような複雑な計算を行う代わりに、閾値T2を算出する方法としては、ヒストグラムをとり、全画素数に対して5%の画素が黒に2値化される閾値を選ぶ方法などがある。(数値は一例)そのような閾値算出例を図18に示す。
【0054】
ステップS905にて、前記閾値T2にてその部分領域の2値化処理を2値化部(b)1081で行い、図1の1082に示すような2値画像(b)を生成する。図24に示すように、前記閾値T2、すなわちポイント2202で2値化すれば、図24の2401で2値化することになり、2402、2403に示したような遷移部を含まない2値化が可能となる。必要ならば、この2値画像をさらに細線化処理を行う。この2値画像はかすれるような閾値なので、図21を使用して説明したような従来の代表色算出処理にて施した細線処理のような失敗の発生の可能性は少ない。ステップS906にて2値画像(b)の黒部分に対応する元画像の画素のRGBのおのおののヒストグラムを生成する。生成されたヒストグラムの色空間は、RGBに限らず元画像がYUVならYUVのヒストグラムをとってもよい。ステップS907にて、RGBヒストグラムおのおののピークを文字代表色として、領域情報105の対応する領域の属性として書き込む。
【0055】
このステップS906,ステップS907は以下に示す他の方法も考えられる。例えば、RGBおのおののヒストグラムを算出するのではなく、RGB3次元のヒストグラムを算出する。その場合細かくヒストグラムを算出することは、計算機の性能的に無理であるし、また、色の遷移点というノイズに惑わされないようにするため粗いヒストグラムを算出することが好ましい。この大まかなヒストグラムで一番大きな値を得た後に、このヒストグラムに存在する細かなヒストグラムを改めて算出し、また、一番大きな値を得る方法もある。
【0056】
最終的には2値画像領域情報に従って、文字の属性を持つ領域に関しては2値画像(a)102の対応する領域のMMR圧縮を施して圧縮コードD107を生成し、一方、自然画像の属性を持つ領域に関しては元画像データの対応する領域のJPEG圧縮を行い圧縮コードC110を生成する。文字や自然画像などの領域の種別および文字のときはさらに代表色を保有する領域情報105、圧縮コードC111、圧縮コードD112の3つをまとめたフォーマットを必要ならば生成する。これが圧縮データとなる。
【0057】
(第2の実施形態)
図11に他の応用構成例を示す。本実施形態では領域分割する画像として閾値による2値画像を使用するのではなく、微分フィルタをかけ、すべての画素の近隣の画素とのエッジ量を算出し、そのエッジ量を2値化することにより得られた2値画像を使用して領域分割を行う。領域分割法としては第1の実施形態と同様に輪郭線追跡をすることとする。
【0058】
この場合、第1の実施形態と異なることは、文字として抽出される領域に、普通に2値化を施すと反転状態になる領域も存在することである。
【0059】
図12に通常文字と反転文字の違いを示す。反転文字はたとえば赤色の下地に白い文字が書いてあるようなものであり、カラー原稿には珍しいことではない。このような文字領域は第1の実施形態では文字として属性がつかず、外側の色のついている枠を含んだ領域で自然画像として属性がついた領域となっていた。本実施形態では微分2値画像を領域分割に使用することにより、図12に示すような反転文字領域も文字として領域分割可能となる。すると、その輝度ヒストグラム形状は通常文字領域が図22のようになるのに対して図13のような形状になる。1301の山が下地の固まりを示していて、1302の山が文字の固まりをしめしている。本実施形態においては、文字代表色算出するための部分2値画像(b)(図11の11082)を生成する2値化部分は反転処理が必要であることになる。
【0060】
反転するか否かの判断は以下の式で得ることができる。
【0061】
応用構成例1にて一例として示した以下の式がある。
【0062】
【外3】
Figure 0004027016
このskew_firstがマイナスのときは図22のような通常文字部分の領域であるが、skew_firstがプラスのときは図13に示すような反転文字領域であると判定できる。
【0063】
また、この処理のフローチャートを図16に示し、簡単に説明する。図16の右側(S1613-S1619)は図10とまったく同じである。左側(1605-1611)が反転文字の場合の計算式となる。
【0064】
また、ステップ1603にて、skew_firstが0以上であったらば、2値化部に反転処理をするか否かを指示するDoInvertフラグをセットする。
【0065】
DoInvertフラグが立っていたら(ONだったら)2値化部(b)11081および、出力として目に見える2値化部(a)1111も2値化結果を反転する。なお、この反転文字も対応する攻勢の場合、領域分割部1104においては、枠という属性を持つ領域を検出する必要があり、また、その枠内の平均色を算出する必要もある。というのも、反転文字の下地には白ではない色がついているのだが、それを表現する必要があるからである。それら枠領域平均色演算部は図11内では省略した。
【0066】
一方、後述する図14の構成においては、下地に全面のJPEGを保持するので、反転文字に対応しても、枠という属性を持つ領域を持つ必要はない。
【0067】
(第3の実施形態)
他に、応用構成例として、図14に示すような構成が考えられる。
【0068】
簡単に図14の構成を説明する。
【0069】
本構成においては領域分割処理としては文字領域のみの座標を検出する文字領域抽出処理1402を保有し、文字領域座標を1403に格納する。
【0070】
この文字領域の2値画像1405を2値化部1404にて生成し、その2値画像1405従って、文字部塗りつぶし部1408にて元画像の文字部を周りの平均色で塗りつぶした原稿1413を生成する。上記部分2値画像はMMR圧縮され圧縮コードDが生成される。上記文字抜き画像はJPEG圧縮され圧縮コードCが生成される。
【0071】
1411にて、第1の実施形態の図9に示した文字代表色演算処理が行われ、代表色1412が生成される。
【0072】
図15に図14の構成の圧縮データを伸長するための構成図を示す。
【0073】
この圧縮データを伸長するときには、圧縮コードCのJPEG伸長処理を行い多値画像Gを生成する。一方、圧縮コードDのMMR伸長処理を行い、部分領域の2値画像Fを生成し、上記画像G上に2値画像が黒の画素にはその領域の代表値を載せ、2値画像が白の領域は何もしないという合体処理をおこない、最終的に画像Hを得る。
【0074】
構成例図1、構成例図11と比較して、文字領域を抜いた全面のJPEG画像を保有するので元画像データの雰囲気を損なわないという利点がある。
【0075】
(他の実施形態)
また、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタ等)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置等)に適用しても良い。
【0076】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0077】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0078】
【発明の効果】
以上説明したように、本発明は、入力画像に応じたヒストグラムを算出し、前記算出されたヒストグラムに基づいて前記画像の所定領域画像がかすれるような2値化閾値を算出し、算出された2値化閾値で前記入力画像を2値化し、その2値化結果に基づいて前記入力画像の所定領域画像の色を算出することにより、細い文字であっても、下地から文字への遷移部の色のデータを削除することができるので、最適な文字の代表色を算出することができる。
【図面の簡単な説明】
【図1】第1の実施形態における応用構成図を示す図である。
【図2】原画像の例を示す図である。
【図3】2値化部と領域分割部における処理の流れの一例を示す図である。
【図4】原画像の輝度ヒストグラム形状を示す図である。
【図5】原画像を2値化処理した2値画像を示す図である。
【図6】2値画像に対してラベリングした様子を示す図である。
【図7】原画像から文字の属性がついて抽出された黒領域を示す図である。
【図8】原画像の文字領域を示す図である。
【図9】文字代表色演算部における処理の流れを示す図である。
【図10】閾値T2を算出する方法の一例を示す図である。
【図11】第2の実施形態における応用構成図を示す図である。
【図12】通常文字と反転文字の違いを示す図である。
【図13】反転文字部の輝度ヒストグラム形状を示す図である。
【図14】第3の実施形態における応用構成図を示す図である。
【図15】第3の実施形態における圧縮データを伸張するための構成を示す図である。
【図16】反転文字に対する処理の流れを示す図である。
【図17】ヒストグラムの形状の一例を示す図である。
【図18】閾値T2を算出する方法の一例を示す図である。
【図19】大きな文字の代表色を算出する場合と、小さな文字の代表色を算出する場合を説明する図である。
【図20】RGB色空間における分布を示す図である。
【図21】2値画像の細線化を説明する図である。
【図22】文字領域の典型的な輝度ヒストグラムの様子を示すである。
【図23】画像を2値化した結果を示す図である。
【図24】画像を2値化した結果を示す図である。

Claims (7)

  1. 第1の2値化閾値を用いて入力画像を2値化する第1の2値化手段と、
    前記第1の2値化手段で2値化された画像に基づいて、文字領域を検出する領域分割手段と、
    前記検出された文字領域に対応する前記入力画像ヒストグラムを算出するヒストグラム算出手段と、
    前記第1の2値化手段で前記第1の2値化閾値を用いて2値化された画像における前記文字領域内の文字画像よりも2値化後の文字画像がかすれる第2の2値化閾値を、前記ヒストグラム算出手段で算出されたヒストグラムに基づいて算出する2値化閾値算出手段と、
    前記2値化閾値算出手段により算出された前記2値化後の文字画像がかすれる第2の2値化閾値で前記入力画像を2値化する第2の2値化手段と、
    前記第2の2値化手段で前記2値化後の文字画像がかすれる第2の2値化閾値を用いて2値化された画像と前記入力画像とに基づいて代表色を算出し、当該算出した代表色を、前記第1の2値化手段で前記第1の2値化閾値を用いて2値化された画像における前記文字領域の文字色にする算出手段と
    を有することを特徴とする画像処理装置。
  2. 前記算出手段は、前記第2の2値化手段で前記2値化後の文字画像がかすれる第2の2値化閾値を用いて2値化された画像の黒部分に対応する前記入力画像の画のヒストグラムを算出し、該算出されたヒストグラムに基づいて前記代表色を算出し、当該算出した代表色を、前記第1の2値化手段で前記第1の2値化閾値を用いて2値化された画像における前記文字領域の文字色にすることを特徴とする請求項1記載の画像処理装置。
  3. 前記第1の2値化手段および前記第2の2値化手段は、2値化結果を反転する反転手段を更に有することを特徴とする請求項1記載の画像処理装置。
  4. 第1の2値化閾値を用いて入力画像を2値化する第1の2値化工程と、
    前記第1の2値化工程で2値化された画像に基づいて、文字領域を検出する領域分割工程と、
    前記検出された文字領域に対応する前記入力画像ヒストグラムを算出するヒストグラム算出工程と、
    前記第1の2値化工程で前記第1の2値化閾値を用いて2値化された画像における前記文字領域内の文字画像よりも2値化後の文字画像がかすれる第2の2値化閾値を、前記ヒストグラム算出工程で算出されたヒストグラムに基づいて算出する2値化閾値算出工程と、
    前記2値化閾値算出工程で算出された前記2値化後の文字画像がかすれる第2の2値化閾値で前記入力画像を2値化する第2の2値化工程と、
    前記第2の2値化工程で前記2値化後の文字画像がかすれる第2の2値化閾値を用いて2値化された画像と前記入力画像とに基づいて代表色を算出し、当該算出した代表色を、前記第1の2値化工程で前記第1の2値化閾値を用いて2値化された画像における前記文字領域の文字色にする算出工程とを有することを特徴とする画像処理方法。
  5. 前記算出工程は、前記第2の2値化工程で前記2値化後の文字画像がかすれる第2の2値化閾値を用いて2値化された画像の黒部分に対応する前記入力画像の画のヒストグラムを算出し、該算出されたヒストグラムに基づいて前記代表色を算出し、当該算出した代表色を、前記第1の2値化工程で前記第1の2値化閾値を用いて2値化された画像における前記文字領域の文字色にすることを特徴とする請求項記載の画像処理方法。
  6. 前記第1の2値化工程および前記第2の2値化工程は、2値化結果を反転する反転工程を更に有することを特徴とする請求項記載の画像処理方法。
  7. コンピュータを、
    第1の2値化閾値を用いて入力画像を2値化する第1の2値化手段、
    前記第1の2値化手段で2値化された画像に基づいて、文字領域を検出する領域分割手段、
    前記検出された文字領域に対応する前記入力画像ヒストグラムを算出するヒストグラム算出手段
    前記第1の2値化手段で前記第1の2値化閾値を用いて2値化された画像における前記文字領域内の文字画像よりも2値化後の文字画像がかすれる第2の2値化閾値を、前記ヒストグラム算出手段で算出されたヒストグラムに基づいて算出する2値化閾値算出手段
    前記2値化閾値算出手段により算出された前記2値化後の文字画像がかすれる第2の2値化閾値で前記入力画像を2値化する第2の2値化手段
    前記第2の2値化手段で前記2値化後の文字画像がかすれる第2の2値化閾値を用いて2値化された画像と前記入力画像とに基づいて代表色を算出し、当該算出した代表色を、前記第1の2値化手段で前記第1の2値化閾値を用いて2値化された画像における前記文字領域の文字色にする算出手段
    として機能させるためのプログラムを格納した、コンピュータ可読な記憶媒体。
JP2000211377A 2000-07-12 2000-07-12 画像処理装置、画像処理方法及び記憶媒体 Expired - Fee Related JP4027016B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2000211377A JP4027016B2 (ja) 2000-07-12 2000-07-12 画像処理装置、画像処理方法及び記憶媒体
EP01305987A EP1173003B1 (en) 2000-07-12 2001-07-11 Image processing method and image processing apparatus
US09/902,172 US6999619B2 (en) 2000-07-12 2001-07-11 Processing for accurate reproduction of symbols and other high-frequency areas in a color image
DE60138073T DE60138073D1 (de) 2000-07-12 2001-07-11 Bildverarbeitungsverfahren und Bildverarbeitungsvorrichtung
CNB011325208A CN1201266C (zh) 2000-07-12 2001-07-12 图像处理装置和图像处理方法
CNB200510054267XA CN100348014C (zh) 2000-07-12 2001-07-12 图像处理装置、图像处理方法
US11/246,301 US7221790B2 (en) 2000-07-12 2005-10-11 Processing for accurate reproduction of symbols and other high-frequency areas in a color image
US11/678,914 US7376267B2 (en) 2000-07-12 2007-02-26 Image processing apparatus, image processing method, and program and storage medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000211377A JP4027016B2 (ja) 2000-07-12 2000-07-12 画像処理装置、画像処理方法及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2002024824A JP2002024824A (ja) 2002-01-25
JP4027016B2 true JP4027016B2 (ja) 2007-12-26

Family

ID=18707493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000211377A Expired - Fee Related JP4027016B2 (ja) 2000-07-12 2000-07-12 画像処理装置、画像処理方法及び記憶媒体

Country Status (1)

Country Link
JP (1) JP4027016B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9357916B2 (en) * 2012-05-10 2016-06-07 Carl Zeiss Meditec, Inc. Analysis and visualization of OCT angiography data

Also Published As

Publication number Publication date
JP2002024824A (ja) 2002-01-25

Similar Documents

Publication Publication Date Title
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
US20180020118A1 (en) Image processing apparatus, method, and storage medium
JP4568460B2 (ja) 画像処理装置及び記録媒体
JP4366011B2 (ja) 文書処理装置及び方法
US5778092A (en) Method and apparatus for compressing color or gray scale documents
US6393150B1 (en) Region-based image binarization system
US6999619B2 (en) Processing for accurate reproduction of symbols and other high-frequency areas in a color image
JP5302768B2 (ja) 画像処理装置及び画像処理方法
JP4250483B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
JP2003152995A (ja) 画像処理装置
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JP4364809B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP2008165381A (ja) 画像処理装置及び画像処理方法
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP4027016B2 (ja) 画像処理装置、画像処理方法及び記憶媒体
JP7134045B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP3910120B2 (ja) 画像処理装置、方法、該方法を実行するプログラム及び記録媒体
JP5517028B2 (ja) 画像処理装置
JP4228905B2 (ja) 画像処理装置及びプログラム
JP4213357B2 (ja) 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム
JP3966448B2 (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
JP4035696B2 (ja) 線分検出装置及び画像処理装置
JP7413751B2 (ja) 画像処理システムおよびプログラム
JP2003338934A (ja) 画像処理装置および方法
RU2737001C1 (ru) Устройство и способ обработки изображений и носитель данных

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050411

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050414

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050506

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071009

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131019

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees