JP4498422B2 - 画素の分類方法および画像処理装置 - Google Patents

画素の分類方法および画像処理装置 Download PDF

Info

Publication number
JP4498422B2
JP4498422B2 JP2008010940A JP2008010940A JP4498422B2 JP 4498422 B2 JP4498422 B2 JP 4498422B2 JP 2008010940 A JP2008010940 A JP 2008010940A JP 2008010940 A JP2008010940 A JP 2008010940A JP 4498422 B2 JP4498422 B2 JP 4498422B2
Authority
JP
Japan
Prior art keywords
color
pixel
similarity
distance
local background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008010940A
Other languages
English (en)
Other versions
JP2008187709A (ja
Inventor
マフィット ファーマン アーメット
ジョン キャンベル リチャード
マシュー スピーグル ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2008187709A publication Critical patent/JP2008187709A/ja
Application granted granted Critical
Publication of JP4498422B2 publication Critical patent/JP4498422B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18105Extraction of features or characteristics of the image related to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、デジタル画像上のグリフ(字体)画素を抽出する方法およびシステムに関するものである。
デジタル画像の内容は、当該デジタル画像の圧縮に対して、圧縮率及び圧縮による副作用(compression artifacts:アーチファクト)の点で大きな影響を与えるものである。画像の写真領域は、文字領域用に設計された圧縮アルゴリズムを用いて圧縮された場合、効率的に圧縮されない。同様に、文字画像は、写真領域用に設計され最適化された圧縮アルゴリズムを用いて圧縮された場合、効率的に圧縮されない。画像の特定の種別用に設計された圧縮アルゴリズムを他の種別の画像に用いた場合、圧縮率に悪影響があるだけでなく、伸張後の画像に圧縮による副作用(アーチファクト)が視認可能な状態で表れることがある。
さらに、文字をくっきりさせるために設計された画像強調アルゴリズムを写真画像に適用した場合、写真画像の中に、視認を悪化させるような作用を生じさせることもある。特に、はっきりとしたエッジを含む写真領域に悪影響がある。スムージング処理は、自然画像を強調するものであり、文字領域に対して行われることはほとんどない。
デジタル画像において特定の種別の領域を検知し、当該特定の種別の領域に適した圧縮アルゴリズムや画像強調アルゴリズムを適宜組み合わせて用いることにより、圧縮率の改善、圧縮による副作用の低減、画像品質の向上を図ることができる。
画像データの内容に基づいた画像領域の意味ラベリング(a semantic labeling)は、ドキュメント管理システムや画像データベースにおいても役に立つ。
特許文献1には、領域判定の技術が開示されている。特許文献1では、カラー画像が混在した原稿に対して、輪郭部分に存在する中間色をエッジ補正フィルタにより補正(削除)した後、RGBデータをL*・a*・b*データに変換し、L*信号より等濃度領域データ、分散データ、エッジ検出データを、a*・b*信号より等色相領域データ、分散データ、エッジ検出データを求める。そして、等濃度領域における分散データ、エッジ検出データに基づき濃度情報での文字写真領域の判定を行い、また、等色相領域における分散データ、エッジ検出データに基づき色相情報による文字領域及び写真領域の判定を行う。これらの領域判定結果に基づいて、画像処理が施された画像データを、領域毎に異なる方法で圧縮する。
特開2001−61062(2001年3月6日公開)
しかしながら、上記特許文献1に記載の技術では、前処理として、エッジ補正フィルタによる中間色の削除を行う必要がある。また、網点領域について考慮されておらず、網点領域が存在した場合には、ウィンドウ内エッジ検出で急峻なエッジが検出されて網点が字体として検出される可能性があり、正しく字体領域(文字領域)が検出できないおそれがある。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、エッジ補正フィルタのような前処理を行うことなく、精度良く字体画素を抽出することができる画素の分類方法および画像処理装置を実現することにある。
本発明に係る画素の分類方法は、上記課題を解決するために、デジタル画像における画素の分類方法であって、a)デジタル画像における注目画素を選択する第1ステップと、b)注目画素、および、注目画素に隣接し、第1の局所背景の推定色を有する第1の複数の画素よりなる第1の領域が、画素及びその隣接領域がラージテキストに含まれるときに当該画素および当該隣接領域が充足する条件を示すラージテキスト要件を満たすか否かを評価する第2ステップと、c)注目画素が上記ラージテキスト要件を満たす場合、当該注目画素を字体画素として分類する第3ステップと、d)注目画素が上記ラージテキスト要件を満たさない場合、注目画素に隣接し、第2の局所背景の推定色を有する第2の複数の画素よりなる第2の領域の色に基づいて、動的閾値を算出する第4ステップと、e)上記第2の局所背景の推定色と注目画素の色との差の大きさを示す第1の類似度を求める第5ステップと、f)上記第1の類似度が上記動的閾値よりも大きい場合、注目画素を字体画素として分類する第6ステップと、g)上記第1の類似度が上記動的閾値以下である場合、注目画素を非字体画素として分類する第7ステップと、を含むことを特徴とする。
また、本発明に係る画像処理装置は、デジタル画像における画素の分類を行う画像処理装置であって、a)デジタル画像の中から注目画素を選択する画素選択部と、b)注目画素、および、注目画素に隣接し、第1の局所背景の推定色を有する第1の複数の画素よりなる第1の領域が、画素及びその隣接領域がラージテキストに含まれるときに当該画素および当該隣接領域が充足する条件を示すラージテキスト要件を満たすか否かを評価するラージテキスト評価部と、c)注目画素が上記ラージテキスト要件を満たす場合、当該注目画素を字体画素として分類する第1分類部と、d)注目画素が上記ラージテキスト要件を満たさない場合、注目画素に隣接し、第2の局所背景の推定色を有する第2の複数の画素よりなる第2の領域の色に基づいて、動的閾値を算出する動的閾値算出部と、e)上記第2の局所背景の推定色と注目画素の色との差の大きさを示す第1の類似度を求める第1類似度算出部と、f)上記第1の類似度が上記動的閾値よりも大きい場合、注目画素を字体画素として分類する第2分類部と、g)上記第1の類似度が上記動的閾値以下である場合、注目画素を非字体画素として分類する第3分類部と、を備えることを特徴とする。
上記の構成によれば、注目画素および第1の領域がラージテキスト要件を満たす場合、注目画素が字体画素として分類される。字体の中には、線幅が比較的大きいものもある(ここではラージテキストという)。そのような場合、注目画素および第1の領域のほぼ全体がラージテキストの中に含まれることがある。ラージテキスト要件は、画素およびその隣接領域がラージテキストに含まれない場合には画素およびその隣接領域が有するものではなく、画素およびその隣接領域がラージテキストに含まれる場合に、当該画素および隣接領域が有する特徴を示すものである。具体例については後述する。そして、ラージテキスト要件を満たすか否かを判断し、ラージテキスト要件を満たす場合、当該注目画素を字体画素として分類される。これにより、注目画素および第1の領域のほぼ全体がラージテキストに含まれる場合であっても、精度よく、注目画素を字体画素として分類することができる。
また、ラージテキストに含まれなくても、字体のエッジ部分において注目画素が字体画素である場合がある。このような画素は、上述したラージテキスト要件では判定できない。なぜなら、注目画素に隣接する領域には、ラージテキストに含まれないものがあるからである。
しかしながら、上記の構成によれば、第2の局所背景の推定色と注目画素の色との差の大きさを示す第1の類似度と動的閾値との大小関係により、字体画素/非字体画素の分類を行う。注目画素が字体のエッジ部分に近い場合、注目画素に隣接する領域の中には、字体の中に含まれる画素、第2の領域に含まれる画素、両者が混在する画素が含まれる。注目画素が局所背景の領域に含まれる場合、第2の局所背景の推定色と注目画素の色との差の大きさを示す第1の類似度が小さくなる。一方、注目画素が字体に含まれる場合、第2の局所背景の推定色と注目画素の色との差の大きさを示す第1の類似度が大きくなる。そして、両者が混在する画素の場合、第1の類似度はこれらの中間の値を取る。そのため、動的閾値を字体の色および第2の局所背景の推定色との間に設定することにより、注目画素の字体画素/非字体画素の分類を適切に行うことができる。上述したように、第2の領域には、字体の中に含まれる画素、第2の領域に含まれる画素、両者が混在する画素が含まれる。そのため、第2の領域の色に基づいて、字体の色および第2の局所背景の推定色との間の適切な値に動的閾値を容易に設定することができる。これにより、字体画素/非字体画素の分類を精度よく行うことができる。
また、局所背景の推定色は、各局所領域に対して予め求められた色であり、当該領域を代表する一つの色である。そのため、網点領域であっても、網点周期に従った変動の影響をなくしたもの、つまり、平均的な代表色で表される。そのため、網点領域においても網点を誤って文字として検出する可能性が少なくなる。
以上のように、上記の構成によれば、局所背景の色と注目画素の色との差、および、ラージテキスト要件に基づいて字体画素を精度よく抽出することができる。すなわち、エッジ補正フィルタのような前処理を行うことなく、精度良く字体画素を抽出することができる。
さらに、本発明の画素の分類方法において、上記第4ステップは、a)色空間における、上記第2の複数の画素の各画素の色と上記第2の局所背景の推定色との距離である複数の第2カラーディスタンスを求めるステップと、b)上記複数の第2カラーディスタンスのレンジを求めるステップと、c)上記複数の第2カラーディスタンスの最小値を決定するステップと、d)上記複数の第2カラーディスタンスのレンジを定数によって調整するステップと、e)調整したレンジを上記第2カラーディスタンスの最小値に加算した値を動的閾値とするステップと、を含むことが好ましい。
また、本発明の画像処理装置において、上記動的閾値算出部は、色空間における、上記第2の複数の画素における各画素の色と上記第2の局所背景の推定色との距離である複数の第2カラーディスタンスを求める距離算出部と、上記複数の第2カラーディスタンスのレンジを求めるレンジ算出部と、上記複数の第2カラーディスタンスの最小値を決定する最小値決定部と、上記複数の第2カラーディスタンスのレンジを定数によって調整する調整部と、調整部により調整されたレンジを上記第2カラーディスタンスの最小値に加算した値を動的閾値とする加算部と、を備えることが好ましい。
ここで、レンジは、複数の第2カラーディスタンスの範囲であり、例えば最大値と最小値との差である。
上記の構成によれば、動的閾値は、第2カラーディスタンスの最小値に、調整されたレンジが加算される。これにより、第2の領域が字体のエッジ部分を含む場合、容易に動的閾値を、字体の色と局所背景の色との間に設定することができる。その結果、字体画素の抽出を精度よく行うことができる。
さらに、本発明の画素の分類方法において、上記第2ステップは、a)色空間における、上記第1の複数の画素の各画素の色と上記第1の局所背景の推定色との距離である複数の第1カラーディスタンスを求め、当該複数の第1カラーディスタンスの平均値である第1平均カラーディスタンスを求めるステップと、b)上記複数の第1カラーディスタンスのレンジを求めるステップと、c)上記第1平均カラーディスタンスと平均距離の閾値とを比較するステップと、d)上記第1カラーディスタンスのレンジとカラーレンジ閾値とを比較するステップと、e)上記第1平均カラーディスタンスが上記平均距離の閾値よりも大きく、かつ、上記第1カラーディスタンスのレンジが上記カラーレンジ閾値よりも小さい場合に、注目画素が上記ラージテキスト要件を満たすと評価するステップと、を含むことが好ましい。
また、本発明の画像処理装置において、上記ラージテキスト評価部は、色空間における、上記第1の複数の画素における各画素の色と上記第1の局所背景の推定色との距離である複数の第1カラーディスタンスを求め、当該複数の第1カラーディスタンスの平均値である第1平均カラーディスタンスを求める平均算出部と、上記複数の第1カラーディスタンスのレンジを求めるレンジ算出部と、上記第1平均カラーディスタンスと平均距離の閾値とを比較する第1比較部と、上記第1カラーディスタンスのレンジとカラーレンジ閾値とを比較する第2比較部と、上記第1平均カラーディスタンスが上記平均距離の閾値よりも大きく、かつ、上記第1カラーディスタンスのレンジが上記カラーレンジ閾値よりも小さい場合に、注目画素が上記ラージテキスト要件を満たすと評価する判定部と、を備えることが好ましい。
画素及びその隣接する領域がラージテキストに含まれる場合、当該領域の各画素と局所背景の推定色との距離は全体的に大きくなり、その平均値も大きくなる。一方、各画素のカラー値は字体の色に近くなるため、当該距離のレンジ(例えば、最大値と最小値との差)は、小さくなる。よって、上記の構成によれば、注目画素がラージテキスト要件を満たすか否かを精度よく判定することができる。
なお、上記の第1の類似度としては、例えば、色空間における、上記第2の局所背景の推定色と注目画素の色との距離が挙げられる。当該距離は、3次元市街地距離により表すことができる。
また、上記第1の領域と上記第2の領域とが同じ領域であってもよい。
さたに、本発明の画素の分類方法は、色空間における、注目画素に隣接する第3の領域を構成する第3の複数の画素の各画素の色と、当該第3の領域の第3の局所背景の推定色との距離である複数の第3カラーディスタンスを求め、当該複数の第3カラーディスタンスの平均値である第3平均カラーディスタンスを求めるステップを含み、上記第3平均カラーディスタンスがコントラスト閾値以上である場合に、上記第2ステップを行い、上記第3平均カラーディスタンスがコントラスト閾値よりも小さい場合に、注目画素を非字体画素として分類してもよい。
もしくは、本発明の画素の分類方法は、注目画素に隣接する第3の領域の第3の局所背景の推定色と注目画素の色との差の大きさを示す第2の類似度を求めるステップを含み、上記第2の類似度が類似度閾値以上の場合に、上記第2ステップを行い、上記第2の類似度が類似度閾値よりも小さい場合に、注目画素を非字体画素として分類してもよい。
また、本発明の画像処理装置は、色空間における、注目画素に隣接する第3の領域を構成する第3の複数の画素の各画素の色と、当該第3の領域の第3の局所背景の推定色との距離である複数の第3カラーディスタンスを求め、当該複数の第3カラーディスタンスの平均値である第3平均カラーディスタンスを求める平均算出部と、上記第3平均カラーディスタンスがコントラスト閾値よりも小さい場合に、注目画素を非字体画素として分類する第4分類部とを備え、上記ラージテキスト評価部は、上記第3平均カラーディスタンスがコントラスト閾値以上である場合に、上記ラージテキスト要件の評価を行ってもよい。
もしくは、本発明の画像処理装置は、注目画素に隣接する第3の領域の第3の局所背景の推定色と注目画素の色との差の大きさを示す第2の類似度を求める第2類似度算出部と、上記第2の類似度が類似度閾値よりも小さい場合に、注目画素を非字体画素として分類する第4分類部とを備え、上記ラージテキスト評価部は、上記第2の類似度が類似度閾値以上の場合に、上記ラージテキスト要件の評価を行ってもよい。
上記の構成によれば、局所背景の推定色に近い色を有する注目画素を非字体画素として分類することができ、それ以外の画素について、ラージテキスト要件の判断を行うことができる。
さらに、本発明の画素の分類方法は、色空間における、注目画素に隣接する第3の領域を構成する第3の複数の画素の各画素の色と、当該第3の領域の第3の局所背景の推定色との距離である複数の第3カラーディスタンスを求め、当該複数の第3カラーディスタンスの平均値である第3平均カラーディスタンスを求めるステップを含み、上記第3平均カラーディスタンスがコントラスト閾値以上である場合、あるいは、上記第3の局所背景の推定色が原稿下地の推定色と等しい場合に、上記第2ステップを行い、上記第3平均カラーディスタンスがコントラスト閾値よりも小さく、かつ、上記第3の局所背景の推定色が原稿下地の推定色と等しくない場合に、注目画素を非字体画素として分類してもよい。
もしくは、本発明の画素の分類方法は、注目画素に隣接する第3の領域の第3の局所背景の推定色と注目画素の色との類似度である第2の類似度を求めるステップを含み、上記第2の類似度が類似度閾値以上の場合、あるいは、上記第3の局所背景の推定色が原稿下地の推定色と等しい場合に、上記第2のステップを行い、上記第2の類似度が類似度閾値よりも小さく、かつ、上記第3の局所背景の推定色が原稿下地の推定色と等しくない場合に、注目画素を非字体画素として分類してもよい。
また、本発明の画像処理装置は、色空間における、注目画素に隣接する第3の領域を構成する第3の複数の画素の各画素の色と、当該第3の領域の第3の局所背景の推定色との距離である複数の第3カラーディスタンスを求め、当該複数の第3カラーディスタンスの平均値である第3平均カラーディスタンスを求める平均算出部と、上記第3平均カラーディスタンスがコントラスト閾値よりも小さく、かつ、上記第3の局所背景の推定色が原稿下地の推定色と等しくない場合に、注目画素を非字体画素として分類する第4分類部とを備え、上記ラージテキスト評価部は、上記第3平均カラーディスタンスがコントラスト閾値以上である場合、あるいは、上記第3の局所背景の推定色が原稿下地の推定色と等しい場合に、上記ラージテキスト要件の評価を行ってもよい。
もしくは、本発明の画像処理装置は、注目画素に隣接する第3の領域の第3の局所背景の推定色と注目画素の色との差の大きさを示す第2の類似度を求める第2類似度算出部と、上記第2の類似度が類似度閾値よりも小さく、かつ、上記第3の局所背景の推定色が原稿下地の推定色と等しくない場合に、注目画素を非字体画素として分類する第4分類部とを備え、上記ラージテキスト評価部は、上記第2の類似度が類似度閾値以上の場合、あるいは、上記第3の局所背景の推定色が原稿下地の推定色と等しい場合に、上記ラージテキスト要件の評価を行ってもよい。
上記の構成によれば、局所背景の推定色および原稿下地の推定色に近い色を有する注目画素を非字体画素として分類することができ、それ以外の画素について、ラージテキスト要件の判断を行うことができる。
また、本発明の画素の分類方法は、デジタル画像における画素の分類方法であって、a)デジタル画像の中の注目画素を選択するステップと、b)注目画素に隣接し、複数の画素からなる領域の局所背景の推定色を取得するステップと、c)上記デジタル画像の原稿下地の推定色を取得するステップと、d)上記局所背景の推定色と注目画素の色との距離を示す、上記局所背景の推定色と注目画素の色との差の大きさを示す類似度を求め、e)上記類似度が類似度閾値以下であり、かつ、上記局所背景の推定色が上記原稿下地の推定色と等しくない場合に、注目画素を字体画素として分類するステップと、f)上記類似度が類似度閾値よりも大きい場合、あるいは、上記局所背景の推定色が上記原稿下地の推定色と等しい場合に、上記領域の中の複数の画素と上記局所背景の色との間のコントラストを算出するステップと、g)上記コントラストがコントラスト閾値よりも小さく、かつ、上記局所背景の推定色が原稿下地の推定色と等しくない場合に、注目画素を字体画素として分類するステップと、h)上記コントラストがコントラスト閾値以上である場合、あるいは、上記局所背景の推定色が原稿下地の推定色と等しい場合に、画素がラージテキストに含まれるときに当該画素が充足する条件を示すラージテキスト要件を注目画素が満たすか否か判断するステップと、i)注目画素が上記ラージテキスト要件を満たす場合に、注目画素を非字体画素として分類するステップと、j)注目画素が上記ラージテキスト要件を満たさない場合に、色空間における上記領域の中の複数の画素の各画素の色と上記局所背景の推定色との距離である複数のカラーディスタンスを求め、当該複数のカラーディスタンスのレンジを固定値により調整し、調整したレンジと上記複数のカラーディスタンスの最小値とを加算することで動的閾値を求めるステップと、k)上記類似度が上記動的閾値よりも大きい場合に、注目画素を非字体画素として分類するステップと、l)上記類似度が上記動的閾値以下である場合に、注目画素を字体画素として分類するステップと、を含む。
上記の構成によれば、局所背景の色と注目画素の色との差、および、ラージテキスト要件に基づいて字体画素を精度よく抽出することができる。すなわち、エッジ補正フィルタのような前処理を行うことなく、精度良く字体画素を抽出することができる。
本発明に係る画素の分類方法は、デジタル画像における画素の分類方法であって、a)デジタル画像における注目画素を選択する第1ステップと、b)注目画素、および、注目画素に隣接し、第1の局所背景の推定色を有する第1の複数の画素よりなる第1の領域が、画素及びその隣接領域がラージテキストに含まれるときに当該画素および当該隣接領域が充足する条件を示すラージテキスト要件を満たすか否かを評価する第2ステップと、c)注目画素が上記ラージテキスト要件を満たす場合、当該注目画素を字体画素として分類する第3ステップと、d)注目画素が上記ラージテキスト要件を満たさない場合、注目画素に隣接し、第2の局所背景の推定色を有する第2の複数の画素よりなる第2の領域の色に基づいて、動的閾値を算出する第4ステップと、e)上記第2の局所背景の推定色と注目画素の色との差の大きさを示す第1の類似度を求める第5ステップと、f)上記第1の類似度が上記動的閾値よりも大きい場合、注目画素を字体画素として分類する第6ステップと、g)上記第1の類似度が上記動的閾値以下である場合、注目画素を非字体画素として分類する第7ステップと、を含む。
また、本発明に係る画像処理装置は、デジタル画像における画素の分類を行う画像処理装置であって、a)デジタル画像の中から注目画素を選択する画素選択部と、b)注目画素、および、注目画素に隣接し、第1の局所背景の推定色を有する第1の複数の画素よりなる第1の領域が、画素及びその隣接領域がラージテキストに含まれるときに当該画素および当該隣接領域が充足する条件を示すラージテキスト要件を満たすか否かを評価するラージテキスト評価部と、c)注目画素が上記ラージテキスト要件を満たす場合、当該注目画素を字体画素として分類する第1分類部と、d)注目画素が上記ラージテキスト要件を満たさない場合、注目画素に隣接し、第2の局所背景の推定色を有する第2の複数の画素よりなる第2の領域の色に基づいて、動的閾値を算出する動的閾値算出部と、e)上記第2の局所背景の推定色と注目画素の色との差の大きさを示す第1の類似度を求める第1類似度算出部と、f)上記第1の類似度が上記動的閾値よりも大きい場合、注目画素を字体画素として分類する第2分類部と、g)上記第1の類似度が上記動的閾値以下である場合、注目画素を非字体画素として分類する第3分類部と、を備える。
上記の構成によれば、局所背景の色と注目画素の色との差、および、ラージテキスト要件に基づいて字体画素を精度よく抽出することができる。すなわち、エッジ補正フィルタのような前処理を行うことなく、精度良く字体画素を抽出することができる。
本発明の実施形態は、図面を参照することでより理解されるであろう。図面では、同じ部材については同じ符号をつけている。
ここで、図に示されるように、本発明の構成は、様々な異なる形態に変形および設計されることができることが容易にわかるであろう。このように、以下に述べる、本発明の方法およびシステムの実施形態についてのより詳細な説明は、本発明の範囲を限定するものではなく、本発明の最良の形態を示したものにすぎない。
本発明の実施形態の構成は、ハードウェア、ファームウェアおよび/またはソフトウェアによって実現されてもよい。ここで述べる一実施形態はこれらの形態の1つについてのみ説明するものであり、本発明の範囲内において、各構成をこれらの形態の何れかで実現可能であることは、当業者にとって自明である。
(実施形態1)
本発明の実施形態1について説明する。本実施形態は、スキャンされた文書画像における文字または記号の部分である画素を抽出するための方法およびシステムに関するものである。本明細書、図面および特許請求の範囲において、これらの画素を「グリフ(字体)画素」と称することとする。スキャンされた文書画像は、一般的に、様々な種類の領域(例えば、網点領域、写真領域、図形領域、文字領域など)を含むとともに、スキャンプロセスにおいて生じたアーチファクト(例えば、ノイズ、光学的なぼやけ(optical blur)、色の干渉による縞模様(color fringing)など)を含む複雑な性質を有する。その結果、グリフ抽出が困難になっている。
本実施形態について、典型的な画像10を示す図1を参照しながら説明する。画像10は、文書が印刷される紙の色である第1の均一色の下地領域12と、第2の均一色を有する第1局所背景領域14と、第3の均一色を有する第2局所背景領域16と、第4の均一色を有する第3局所背景領域18とを含むいくつかの領域を備えた文書画像である。印刷およびスキャン処理の不完全さのために、均一色の画像領域(例えば、局所背景領域)を構成する画素の各々は、同一の画素値(カラー値)(color value)を有していない場合がある。均一色の画像領域では、画素のカラー値は、中央又はピークのカラー値を中心とした狭い分布(つまり、分散値が小さい)を形成する傾向にある。本発明の実施形態では、狭い分布のカラー値を有する画素を、画像領域において均一色を示しているカラークラスに属するものと設定する。局所背景領域におけるカラークラスを、局所背景の推定色という。原稿下地領域(原稿背景領域)におけるカラークラスを原稿下地の推定色という。
本発明の実施形態において、2つのカラー値の比較を行う場合がある。この場合、比較処理の前に、対象となる2つのカラー値のうちの少なくとも一方について、他の色空間から、比較が実施される共通の色空間への変換処理が行われてもよい。また、使用するカラー値の算出処理が実施されてもよい。カラー値は、当該算出処理の前に、一つの色空間から別の色空間へと変換されてもよい。典型的な色空間の例としては、RGB、Yuv、L*a*b*、YCbCr、Lab、XYZ、YIQ、いずれかのluma-chroma-chroma(luminance-chrominance-chrominance、輝度−色度−色度)色空間、ならびに、輝度および他の単チャンネルの色空間を含む公知の色空間などが挙げられる。
上述した2つのカラー値の比較処理は、全ての色成分について比較を行うものであってもよい。あるいは、2つのカラー値の比較処理は、一部の色成分について比較を行うものであってもよい。例えば、luma-chroma-chroma色空間において輝度成分のみ比較を行う場合や、RGB色空間においてG(green)成分のみ比較を行う場合である。同様に、カラー値を用いた算出処理は、全ての色成分を用いた算出処理であってもよいし、一部の色成分を用いた算出処理であってもよい。一部の色成分を用いた算出処理の例としては、例えば、luma-chroma-chroma色空間において輝度成分のみを用いる場合や、RGB色空間においてG(green)成分のみを用いる場合である。
また、本発明の実施形態において、注目画素を取り囲む局所区域(領域)の画素のカラーデータを調査する調査処理を行う場合がある。図2は、注目画素29を取り囲む画素21〜28を含む局所区域20の一例を示す図である。局所区域(領域)は、任意のサイズまたは形状を有する。図2で例示される局所区域(local neighborhood)20は、注目画素29を取り囲む3×3の区域である。局所区域の他の例としては、N×N(Nは整数)の区域、N×M(N,Mは整数)の区域、円形領域、n個の最隣接画素を含む領域(n-nearest neighbors region)、事前に分類またはよく考えられたラベル付けが行われた画素の異形領域、および、注目画素を取り囲む所定のサイズまたは形状を有する他の局所区域が挙げられる。局所区域20の画素データから算出された統計量は、注目画素29を「グリフ」画素または「非グリフ」画素として分類またはラベル付けするために使用されてもよい。もしくは、注目画素29は、「グリフ」画素、「非グリフ」画素および「不明」画素のいずれかに分類またはラベル付けされてもよい。また、本実施形態において、局所区域20に含まれる全ての画素は、注目画素に割り当てられたラベルに従って、分類またはラベル付けがされてもよい。
また、本実施形態において、デジタル画像の各画素は、グリフ画素としての状態を決定するために調査されてもよい。もしくは、デジタル画像のうちの選択された一部の画素について調査されてもよい。さらに、調査対象となる画素の選択グループは、以前にテキスト候補画素として識別された画素を含むものであってもよい。
本発明の一実施形態に係る画像処理装置30の構成について、図11を参照しながら説明する。図11は、グリフ画素の検出を行う画像処理装置30の構成を示すブロック図である。図11に示されるように、画像処理装置30は、画素選択部31と、推定色取得部32と、ラージテキスト評価部33と、類似度算出部34と、動的閾値算出部35と、分類部36とを備えている。
画素選択部31は、デジタル画像の中から、グリフ画素か非グリフ画素かを判断する判断対象となる注目画素を選択するものである。画素選択部31は、デジタル画像の全ての画素を順に注目画素として選択してもよいが、テキスト候補画素として抽出された画素を注目画素として選択することが好ましい。テキスト候補画素の抽出方法は、公知の技術を用いればよい。例えば、特開平9−186861に記載のように、画像データをDCT変換して、特定のDCT係数について絶対値の和を求め、文字らしさを表す点数とする。そして、この点数が所定の閾値より大きいブロックを文字画像候補ブロックと判定し、当該ブロックに含まれる画素をテキスト候補画素として抽出すればよい。また、他の例として、ソベルなどのエッジ検出フィルタと閾値を用いて閾値以上の輝度差(濃度差)のあるものを初期テキスト候補画素として検出することで、画素単位での初期テキスト候補画素検出を行い、その後、上記のようなブロック単位で初期テキスト候補画素の存在するブロックを最終文字画像候補ブロックと判定し、当該ブロックに含まれる画素をテキスト候補画素として抽出してもよい。
推定色取得部32は、局所背景および原稿下地の推定色を取得するものである。推定色取得部32は、外部から推定色を受け取ってもよいし、推定色を決定してもよい。局所背景の推定色を決定する典型的な方法としては、米国特許出願11/365,067(出願日2006年2月28日)(特開2007−235948のファミリーパテント)に記載の方法や、米国特許出願11/424,290(出願日2006年6月15日)に記載の方法、その他の公知の方法を用いることができる。
具体的には、推定色取得部32は、画像を分割した複数の区分について、階調値と階調値に含まれる画素数との関係を示す区分ヒストグラムを作成し、各々の区分ヒストグラムから特定された特徴量(例えばピークを表す階調値の範囲)を抽出する。そして、推定色取得部32は、各々の区分ヒストグラムより抽出された特徴量(ピークを表している階調値の範囲)をカウントする。すなわち、特徴量を表している階調値について「1」を加算していき、ピークヒストグラムを作成する。さらに、推定色取得部32は、階調値に対する上記カウント値を、階調値に含まれる画素数(全画素数に対する割合)で正規化し、この正規化された結果を基に、入力画像に含まれるページ全体の下地(原稿下地領域)や複数の比較的広い局所的な背景(局所背景領域)の識別を行うとともに、各領域の階調値から推定色を決定する。
また、推定色取得部32は、次のようにして、推定色を決定してもよい。すなわち、推定色取得部32は、デジタル画像における選択画素のカラー値の頻度(出現度数)を求め、さらに、カラー値の頻度におけるピーク領域、および、各ピーク領域に対応するカラー値を特定する。そして、各ピーク領域に対応するカラー値と画像ラベルとを関連付ける。ここで、画像ラベルは、例えば、原稿下地領域または局所背景領域を示す。なお、精度良くラベル付けする場合には、画像全体、あるいは、画像全体から、網点画素、エッジ画素を取り除いた画素についてヒストグラムを生成し、このヒストグラムの最大度数ピークを下地領域と判定すればよい。そして、この原稿下地領域と各クラスのラベルの代表色(例えば平均値)を比較し、最も近い代表色を有するクラスを下地領域として、それ以外の領域を局所背景として扱うことが出来る。そして、推定色取得部32は、原稿下地領域および局所背景領域の代表色を各領域の推定色として決定する。
上記のようにして推定色を決定する場合、当該推定色は、網点の影響をなくした局所背景の色をクラスタリングすることにより求められる。この結果、後述する推定色を用いた処理を行うことにより網点領域における網点を文字として検出することがなくなる。
なお、ここで挙げた具体例は推定色の決定方法の一例であり、これに限定されるものではない。推定色取得部32は、公知の方法を用いて、原稿下地領域および局所背景領域の推定色を決定すればよい。
ラージテキスト評価部33は、注目画素がラージテキスト要件を満たすか否かを判断するものである。ラージテキスト要件とは、図12に示されるように注目画素に隣接する局所区域がサイズの大きい字体(ラージテキスト)に含まれる場合に、当該局所区域の画素のカラー値が満たす条件を示すものである。ラージテキスト評価部33は、平均算出部331と、レンジ算出部332と、比較部333と、判定部334とを備える。
平均算出部331は、注目画素に隣接する局所区域の推定色のカラー値cLBGと、当該局所区域内の複数の画素の色のカラー値cとの距離である複数のカラーディスタンスd(c,cLBG)を求め、その平均値である平均カラーディスタンスμを求めるものである。
レンジ算出部332は、上記の複数のカラーディスタンスd(c,cLBG)のうちの最大値と最小値との差分であるレンジrを求めるものである。
比較部333は、平均算出部331が算出した平均カラーディスタンスμと所定の平均距離閾値Tμとを比較するとともに、レンジ算出部332が算出したレンジrと所定のカラーレンジ閾値Tとを比較するものである。
判定部334は、μがTμよりも大きく、かつ、rがTよりも小さい場合に、注目画素がラージテキストに属するものであることを示す条件であるラージテキスト要件を満たすものと判定するものである。
図13は、ラージテキストに局所区域が含まれる場合の、当該局所区域内の画素に対応するカラーディスタンスを示す図である。図13に示されるように、局所区域がラージテキストに含まれる場合、レンジが小さく、平均カラーディスタンスは大きくなる。そこで、局所区域がラージテキストに含まれる場合にμおよびrが取り得る範囲と、局所区域がラージテキストに含まれない場合にμおよびrが取り得る範囲とを予め行う実験で求め、局所区域がラージテキストに含まれるか否かを識別できるように、上記平均距離閾値Tμとカラーレンジ閾値Tとが設定されている。これにより、判定部334は、注目画素がラージテキストに属するか否か、すなわち、ラージテキスト要件を満たすか否かを精度よく判定することができる。
類似度算出部34は、注目画素に隣接する局所区域の局所背景の推定色と注目画素の色との類似度を算出するものである。本実施形態では、類似度として、局所背景の推定色と注目画素の色との距離(カラーディスタンス:色差)を求める。
動的閾値算出部35は、ラージテキスト評価部33により注目画素がラージテキスト要件を満たさないと判定した場合に、注目画素に隣接し、局所背景の推定色を有する複数の画素よりなる局所区域における色に基づいて、動的閾値を算出するものである。
動的閾値算出部35は、距離算出部351と、レンジ算出部352と、最小値決定部353と、調整部354と、加算部355とを備える。
距離算出部351は、注目画素に隣接する局所区域の推定色のカラー値cLBGと、当該局所区域内の複数の画素の色のカラー値cとの距離である複数のカラーディスタンスd(c,cLBG)を求めるものである。
レンジ算出部352は、上記の複数のカラーディスタンスd(c,cLBG)のうちの最大値と最小値との差分であるレンジrを求めるものである。
最小値決定部353は、上記の複数のカラーディスタンスd(c,cLBG)のうちの最小値dminを抽出するものである。
調整部354は、レンジrを定数Rによって調整するものである。具体的には、rをRで割る。
加算部355は、調整部354により調整されたレンジr/Rをカラーディスタンスの最小値dminに加算した値を動的閾値Tとするものである。
図14(a)(b)は、局所区域が字体のエッジ部と重なるときの、当該局所区域内の画素に対応するカラーディスタンスの一例を示す図である。この場合、図14(a)(b)に示されるように、局所区域には、局所背景の色を示す画素と、グリフ(字体)の色またはそれに近い色を示す画素とが含まれる。そのため、レンジrは比較的大きくなる。そして、動的閾値Tとして、dmin+r/Rが設定されるため、注目画素がグリフに近い色を示す場合(図14(b)の場合)と、注目画素が局所背景に近い色を示す場合(図14(a)の場合)とを区別することができる。その結果、注目画素のグリフ/非グリフを精度よく判定することができる。
また、図15は、局所区域が網点領域上の字体のエッジ部と重なるときの、当該局所区域内の画素に対応するカラーディスタンスの一例を示す図である。図15に示されるように、網点変調によるカラー値の変動幅が、動的閾値以下の範囲に含まれるように、Rが設定されている。そのため、注目画素のカラー値が網点変動によって変動したとしても、当該注目画素を誤ってグリフ画素として検出されることがない。このように、動的閾値を用いることにより、網点領域であっても、注目画素のグリフ/非グリフを精度よく判定することができる。
分類部36は、ラージテキスト評価部33の評価結果、類似度算出部34により算出された類似度および動的閾値算出部35により算出された動的閾値に基づいて、注目画素を「グリフ」画素か「非グリフ」画素かのいずれかに分類するものである。
本発明の一実施形態に係る画像処理の流れの概要について図3を参照しながら説明する。まず、類似度算出部34は、注目画素の色と、当該注目画素に隣接する第1の区域(領域)の局所背景の推定色との類似度を決定する。そして、当該類似度に基づいて類似しているか否かが判定される(S30)。
注目画素の色と第1の区域の局所背景の推定色とが類似している場合(S30でYes)、注目画素は、分類部36により「非グリフ」画素としてラベル付けされる(S32)。一方、注目画素の色と第1の区域の局所背景の推定色とが類似していない場合(S30でNo)、当該注目画素に隣接する第2の区域(領域)におけるコントラストの算出が類似度算出部34により実施される。そして、コントラストが閾値と比較して低いかどうかが判断される(S34)。ここで、第1の区域と第2の区域とは同じであってもよいし、第1の区域が第2の区域と異なるものであってもよい。
第2の区域のコントラストが相対的に低いものと判断されると(S34でYes)、注目画素は、「非グリフ」画素としてラベル付けされる(S32)。一方、コントラストが相対的に高いものとして判断されると(S34でNo)、注目画素がラージテキスト(記号文字も含む)の一部であるかどうかの判定がラージテキスト評価部33により行われる(S37)。注目画素がラージテキスト(記号文字も含む)の一部であるかどうかの判定処理は、注目画素に隣接する第3の区域に属する画素のカラー値の比較処理を含む。
注目画素がラージテキスト(記号文字も含む)の一部であると判定された場合(S37でYes)、注目画素は「グリフ」画素として分類部36によりラベル付けされる(S43)。注目画素がラージテキスト(記号文字も含む)の一部ではないと判定された場合(S37でNo)、注目画素と当該注目画素に隣接する第4の区域の局所背景とのコントラストが動的閾値よりも大きいか否かが判断される(S40)。コントラストが動的閾値よりも大きい場合(S40でYes)、注目画素は「グリフ」画素としてラベル付けされる(S43)。コントラストが動的閾値以下である場合(S40でNo)、注目画素は「非グリフ」画素としてラベル付けされる(S32)。なお、本実施形態において、第1、第2、第3および第4の区域は、同じ区域であってもよいし、異なる区域であってもよい。
次に、図3で示した画像処理の流れを、図4を参照しながら、より詳細に説明する。図4は、本発明の一実施形態の画像処理の詳細を示すフローチャートである。
まず、類似度算出部34は、デジタル画像の注目画素について、当該注目画素の色(カラー値:cPOI)と当該注目画素に隣接する第1の区域の局所背景の推定色(カラー値:cLGB1)との類似度を求める(S50)。ここでは、当該類似度は、注目画素の色cPOIと当該注目画素に隣接する第1の区域の局所背景の推定色cLGB1との間の距離Dとして算出される。ここで、この2つのカラー値間の距離を、d(cPOI,cLGB1)とする。本実施形態では、第1の区域全体に対して、単一のカラー値cLGB1が局所区域の推定色として得られる。あるいは、局所背景の推定色は、第1の区域の各画素の値から取得してもよい。すなわち、第1の区域の局所背景の推定色は、当該区域の各画素について求められる局所背景の色推定値の組合せにより算出される。ここでは、局所背景の色推定値として、注目画素の直前の局所背景の1つの色推定値を代表色推定値として用いる方法や、複数の局所背景の色推定値から、次に述べている「典型的な組み合わせ」を用いて代表色推定値を求める方法などがある。典型的な組合せは、平均値、中間値、重み付け係数を用いて得られる平均値、および個々の局所背景の推定値の他の組合せを含む。
従来知られている距離が、注目画素の色cPOIと当該注目画素に隣接する第1の区域の局所背景の推定色cLGB1との間の距離D=d(cPOI,cLGB1)の決定に用いることができる。典型的な距離としては、luma-chroma-chroma色空間のchroma成分間の2次元の市街地距離、3次元の色空間の成分間の3次元の市街地距離、ユークリッド距離、luma-chroma-chroma色空間のchroma成分間の重み付け係数を用いて得られる2次元の市街地距離、3次元の色空間の成分間の重み付け係数を用いて得られる3次元の市街地距離、および他の良く知られた距離が挙げられる。距離Dは、共通色空間におけるcPOIに対応する点とcLBG1に対応する点との距離であるとも表現できる。なお、市街地距離(city block distance)とは、注目画素に隣接する4近傍の画素をベースに画素間の距離を表すものであり、注目画素の第1近傍にある画素は1単位、第2近傍にある画素(対角の位置の画素)は2単位離れていると表すものである。類似度算出部34は、例えば、3次元の市街地距離に基づいて、2つのカラー値間の距離を算出し、当該距離を類似度とする。
次に、距離D=d(cPOI,cLGB1)は、注目画素の色が背景の色と実質的に類似しているかどうかを判断するために、類似度閾値TLGB_SIMと比較される(S51)。類似度閾値TLGB_SIMは、固定値であってもよいし、可変値(adaptive threshold)であってもよい。例えば、色味重視で判定するならば、L値(輝度値)の差に応じて可変値とする方法が考えられる。すなわち、L値の差が小さいときは、小さめの閾値で判定し、L値の差が大きいときは、大きめの閾値で判定することで、L値の差による違いを吸収し、色の差を重視するように制御することができる。
距離D=d(cPOI,cLGB1)が類似度閾値TLGB_SIM以下である場合(S51でNo)、すなわち、注目画素の色と当該注目画素に隣接する区域の局所背景の色とが近いことを示している場合、注目画素は「非グリフ」画素として分類部36によりラベル付けされる(S69)。一方、距離D=d(cPOI,cLGB1)が類似度閾値TLGB_SIMよりも小さくない場合、すなわち、D>TLGB_SIMの場合(S51でYes)、さらなる処理が実行される。
なお、上記比較処理(S51)は、さらに、原稿下地の色に関する追加条件を含んでいてもよい。すなわち、距離D=d(cPOI,cLGB1)が類似度閾値TLGB_SIM以下である場合、あるいは、局所背景の推定色cLGB1が原稿下地の色cPBGと等しくない場合、注目画素は、「非グリフ」画素として分類部36によりラベル付けされる。この追加条件により、局所背景の推定色が不確定または誤りを含む場合であっても、より精度の高いグリフ画素の検出を行うことができる。また、距離D=d(cPOI,cLGB1)が類似度閾値TLGB_SIMよりも大きい場合(つまり、D>TLGB_SIMの場合)、もしくは、cLGB1=cPBGの場合に、さらなる処理が実行されてもよい。
次に、注目画素に実質的に隣接する第2の区域におけるコントラストの算出が類似度算出部34により実施される。コントラストの算出において、類似度算出部34は、第2の区域における局所背景の推定色cLGB2から、第2の区域における画素のカラーディスタンス(色差)を計算する(S54)。本実施形態では、第2の区域全体に対して、単一のカラー値cLGB2が局所区域の推定色として得られる。あるいは、局所背景の推定色は、第2の区域の各画素の値から取得してもよい。すなわち、第2の区域の局所背景の推定色は、当該区域の各画素について求められる局所背景の色推定値の組合せにより算出される。典型的な組合せは、平均値、中間値、重み付け係数を用いて得られる平均値、および個々の局所背景の推定値の他の組合せを含む。
続いて、第2の区域における画素の平均カラーディスタンスμ (2)が、以下の式に従って、類似度算出部34により算出される(S55)。
Figure 0004498422
数1において、NH2は第2の区域を示しており、cは区域NH2に含まれる画素jのカラー値を示しており、d(・,・)は距離を示している。典型的な測定としては、luma-chroma-chroma色空間のchroma成分間の2次元の市街地距離の測定、3次元の色空間の成分間の3次元の市街地距離の測定、ユークリッド距離測定、luma-chroma-chroma色空間のchroma成分間の加重値が与えられた2次元の市街地距離の測定や、3次元の色空間の成分間の加重値が与えられた3次元の市街地距離の測定、および他の良く知られた距離測定が挙げられる。
N×Mの矩形区域に対しては、平均カラーディスタンスは、以下の式に従って算出される。
Figure 0004498422
算出された平均カラーディスタンスμ (2)は、注目画素の周りの第2の区域が局所背景の推定色と比較して低いコントラストであるか否かを判定するために、コントラスト閾値TCONと分類部36により比較される(S56)。コントラスト閾値TCONは、固定値であっても可変値(adaptive threshold)であってもよい。コントラストの見た目の差は、明るさによって異なるので、例えば、見た目を重視した制御を行うとするならば、暗い場合は閾値を大きめにして十分な差がないとコントラストがないとみなし、明るい場合は閾値を小さめにして少しの差でもコントラストがあるように判断するといった方法が挙げられる。
平均カラーディスタンスμ (2)がコントラスト閾値TCONよりも小さい場合(S56でYes)、すなわち、注目画素の色が背景(局所背景および原稿下地以外の背景)と比較して低コントラストを有する場合、注目画素は「非グリフ」画素として分類部36によりラベル付けされる(S69)。平均カラーディスタンスμ (2)がコントラスト閾値TCONよりも小さくない場合(S56でNo)、さらなる処理が必要とされる。
なお、次のような変形形態であってもよい。すなわち、平均カラーディスタンスμ (2)がコントラスト閾値TCONよりも小さく、かつ、原稿下地の色cPBGが局所背景推定色cLBG2と等しくない場合、すなわち、注目画素の色が局所背景と比較して低コントラストを有し、かつ、注目画素が網点領域上である場合、注目画素は「非グリフ」画素としてラベル付けされる。この変形形態の場合、平均カラーディスタンスμ (2)がコントラスト閾値TCONよりも小さくない場合、もしくは、原稿下地の色cPBGが局所背景の推定色cLBG2と等しい場合、さらなる処理が必要とされる。
続いて、更なる処理が必要となる場合(S56でNo)、注目画素がラージテキスト(記号文字を含む)の一部であるかどうかの判定がラージテキスト評価部33により行われる。注目画素がラージテキスト(記号文字を含む)の一部であるかどうかの判定処理は、上述したように、平均算出部331が平均カラーディスタンμを算出する処理(S59)を含む。ここでは、平均カラーディスタンμは、注目画素に隣接する第3の区域において算出されるので、μ (3)と表すこととする。注目画素がラージテキスト(または記号文字も含む)の一部であるかどうかの判定処理は、さらに、第3の区域に対する局所背景の推定色から、当該第3の区域の画素の色のカラーディスタンスのレンジ(範囲)をレンジ算出部332が求める処理(S60)を含む。カラーディスタンスのレンジは、以下の式に従って決定される。
Figure 0004498422
数3において、cLBG3は第3の区域における局所背景の推定色を示す。
次に、r (3)がカラーレンジ閾値Tr以下であるか、および、μ (3)が平均ディスタンス閾値Tμ以上であるかが比較部333により確認される(S61)。
本実施形態では、カラーディスタンスのレンジr (3)が小さく、かつ、平均カラーディスタンスμ (3)が大きい場合(S61でYes)、判定部334は、注目画素がラージテキスト(記号文字を含む)の一部であると判定する。そして、カラーディスタンスのレンジr (3)が小さく、かつ、平均カラーディスタンスμ (3)が大きい場合、すなわち、注目画素がラージテキスト(記号文字を含む)の一部であると判定部334により判定された場合、分類部36は、注目画素を「グリフ」画素としてラベル付けする(S70)。一方、そうでない場合は、更なる処理が必要とされる。
次に、注目画素がラージテキスト(記号文字を含む)の一部ではないと判定部334により判定された場合(S61でNo)、類似度算出部34は、注目画素と当該注目画素に隣接する第4の区域の局所背景との間のコントラストとして、カラーディスタンス D=d(cPOT,cLBG4)を求める(S64)。また、動的閾値算出部35は、動的閾値Tを、以下の式に従って算出する(S65)。
Figure 0004498422
数4において、r (4)およびdmin (4)は、上述したようにレンジ算出部352および最小値決定部353により求められるものであり、Rは予め定められた一定値である。その後、分類部36は、注目画素と第4の区域の局所背景の色との間のコントラストであるカラーディスタンスD=d(cPOT,cLBG4)が動的閾値Tよりも大きいか否かを判断する(S66)。そして、D>Tである場合(S66でYes)、注目画素は「グリフ」画素として分類部36によりラベル付けされる(S70)。一方、D≦Tである場合(S66でNo)、注目画素は「非グリフ」画素として分類部36によりラベル付けされる(S69)。
以上、本発明の一実施形態について説明した。なお、本発明の実施形態は上記説明のものに限定されない。以下で述べるような別の実施形態であってもよい。以下、別の実施形態の例をいくつか説明する。なお、以下の実施形態において、画像処理装置30の構成は、図11に示したものと同様であるが、各部の処理の流れが異なる。そのため、以下の各実施形態については、画像処理の流れについてのみ説明する。
(実施形態2)
本発明の実施形態2における画像処理の流れの概要について図5を参照しながら説明する。
本実施形態では、まず、注目画素がラージテキスト(記号文字を含む)の一部であるか否かの判定がラージテキスト評価部33により実行される(S80)。注目画素がラージテキスト(または記号文字を含む)の一部であるか否かの判定処理には、注目画素に隣接する第1の区域内の複数の画素のカラー値の比較処理が含まれる。注目画素がラージテキスト(記号文字を含む)の一部であると判定された場合(S80でYes)、注目画素は「グリフ」画素として分類部36によりラベル付けされる(S82)。一方、注目画素がラージテキスト(記号文字を含む)の一部ではないと判定された場合(S80でNo)、注目画素と当該注目画素に隣接する第2の区域の局所背景との間のコントラストが動的閾値よりも大きいか否かが判断される(S84)。コントラストが動的閾値よりも大きい場合(S84でYes)、注目画素は「グリフ」画素としてラベル付けされる(S82)。コントラストが動的閾値以下である場合(S84でNo)、注目画素は「非グリフ」画素としてラベル付けされる(S87)。もしくは、コントラストが動的閾値以上である場合に、注目画素が「グリフ」画素としてラベル付けされ、コントラストが動的閾値未満である場合、注目画素が「非グリフ」画素としてラベル付けされてもよい。また、第1の区域と第2の区域とは同じであってもよいし、異なるものであってもよい。
次に、図5で示した画像処理の流れを、図8を参照しながら、より詳細に説明する。図8は、本実施形態の画像処理の詳細を示すフローチャートである。
図8に示されるように、まずは、注目画素がラージテキスト(記号文字も含む)の一部であるか否かの判定処理として、上記実施形態1と同様に、平均カラーディスタンスμを算出する処理が行われる。すなわち、まず、注目画素に隣接する第1の区域内の各画素の色cと当該第1の区域に対する局所背景の推定色cLBG1との距離D を算出する処理が平均算出部331により行われる(S130)。そして、平均算出部331は、D の平均値である、平均カラーディスタンスμを求める(S131)。ここでの平均カラーディスタンスμは、第1の区域に対して算出されるため、μ (1)と記載する。
次に、注目画素がラージテキスト(記号文字を含む)の一部であるか否かの判定処理として、注目画素に隣接する第1の区域内の各画素の色と当該第1の区域に対する局所背景の推定色とのカラーディスタンスのレンジr (1)を算出する処理(S132)がレンジ算出部332により行われる。カラーディスタンスのレンジr (1)は、以下の式に従って算出される。
Figure 0004498422
数5において、cLBG1は、第1の区域における局所背景の推定色を示している。
次に、r (1)がカラーレンジ閾値Tr以下であるか、および、μ (1)が平均ディスタンス閾値Tμ以上であるかが比較部333により確認される(S133)。
本実施形態では、カラーディスタンスのレンジr (1)が小さく、かつ、平均カラーディスタンスμ (1)が大きい場合(S133でYes)、判定部334は、注目画素がラージテキスト(記号文字を含む)の一部であると判定する。そして、カラーディスタンスのレンジr (1)が小さく、かつ、平均カラーディスタンスμ (1)が大きい場合、、すなわち、注目画素がラージテキスト(記号文字を含む)の一部であると判定部334により判定された場合、分類部36は、注目画素を「グリフ」画素としてラベル付けする(S135)。一方、そうでない場合は、更なる処理が必要とされる。
次に、注目画素がラージテキスト(記号文字を含む)の一部ではないと判定部334により判定された場合(S133でNo)、類似度算出部34は、注目画素と当該注目画素に隣接する第2の区域の局所背景の色cLBG2との間のコントラストとして、カラーディスタンス D=d(cPOT,cLBG2)を求める(S137)。また、動的閾値算出部35は、動的閾値Tを、以下の式に従って算出する(S138)。
Figure 0004498422
数6において、r (2)およびdmin (2)は上述したようにレンジ算出部352および最小値決定部353により求められるものであり、Rは予め定められた一定値である。その後、分類部36は、注目画素と第2の区域の局所背景の色との間のコントラストであるカラーディスタンスD=d(cPOT,cLBG2)が動的閾値Tよりも大きいか否かを判断する(S139)。そして、D>Tである場合(S139でYes)、注目画素は「グリフ」画素として分類部36によりラベル付けされる(S135)。一方、D≦Tである場合(S139でNo)、注目画素は「非グリフ」画素として分類部36によりラベル付けされる(S142)。
なお、本実施形態において、注目画素がラージテキスト(記号文字を含む)の一部であるか否かの判定処理の前に、注目画素の予備分類を実行してもよい。予備分類処理において、字体とは全く関係のないものと推定される注目画素を「非グリフ」画素として分類してもよい。これにより、注目画素に対するさらなる調査の必要性を消去することができる。典型的な予備分類処理は、コンテンツに基づく先験的な注目画素のラベリングによる処理や、「グリフ」の領域と全く一致しない特徴量に基づいた処理などが含まれる。
(実施形態3)
本発明の実施形態3における画像処理の流れの概要について図6を参照しながら説明する。
本実施形態では、まず、注目画素に隣接する第1の区域のコントラストの算出が類似度算出部34により実行される。そして、コントラストが閾値と比較して低いかどうかが判断される(S90)。
第1の区域におけるコントラストが相対的に低いと判断された場合(S90でYes)、注目画素は「非グリフ」画素としてラベル付けされる(S92)。一方、コントラストが相対的に高いものとして判断された場合(S90でNo)、注目画素がラージテキスト(記号文字を含む)の一部であるか否かの判定がラージテキスト評価部33により実行される(S94)。注目画素がラージテキスト(記号文字を含む)の一部であるか否かの判定処理には、注目画素に隣接する第2の区域内の複数の画素のカラー値の比較処理が含まれる。
注目画素がラージテキスト(記号文字を含む)の一部であると判定された場合(S94でYes)、注目画素は「グリフ」画素として分類部36によりラベル付けされる(S96)。一方、注目画素がラージテキスト(記号文字を含む)の一部ではないと判定された場合(S94でNo)、注目画素と当該注目画素に隣接する第3の区域の局所背景との間のコントラストが動的閾値よりも大きいか否かが判断される(S98)。コントラストが動的閾値よりも大きい場合(S98でYes)、注目画素は「グリフ」画素としてラベル付けされる(S96)。コントラストが動的閾値以下である場合(S98でNo)、注目画素は「非グリフ」画素としてラベル付けされる(S92)。なお、第1、第2および第3の区域は、同じであってもよいし、何れかが異なるものであってもよい。
次に、図6で示した画像処理の流れを、図9を参照しながら、より詳細に説明する。図9は、本実施形態の画像処理の詳細を示すフローチャートである。
まず、注目画素に隣接する第1の区域のコントラストの算出が類似度算出部34により実行される。当該コントラストの算出において、類似度算出部34は、まず、第1の区域における局所背景の推定色cLBG1からの、当該第1の区域内の各画素との距離である複数のカラーディスタンスD を算出する。本実施形態では、第1の区域全体に対して、単一のカラー値cLGB1が局所区域の推定色として得られる。あるいは、局所背景の推定色は、第1の区域の各画素の値から取得してもよい。すなわち、第1の区域の局所背景の推定色は、当該区域の各画素について求められる局所背景の色推定値の組合せにより算出される。典型的な組合せは、平均値、中間値、重み付け係数を用いて得られる平均値、および個々の局所背景の推定値の他の組合せを含む。
第1の区域における画素の平均カラーディスタンスμ (1)は、以下の式に従って、類似度算出部34により算出される(S151)。
Figure 0004498422
数7において、NH1は第2の区域を示しており、cは区域NH1に含まれる画素jのカラー値を示しており、d(・,・)は距離を示している。典型的な測定としては、luma-chroma-chroma色空間のchroma成分間の2次元の市街地距離の測定、3次元の色空間の成分間の3次元の市街地距離の測定、ユークリッド距離測定、luma-chroma-chroma色空間のchroma成分間の加重値が与えられた2次元の市街地距離の測定や、3次元の色空間の成分間の加重値が与えられた3次元の市街地距離の測定、および他の良く知られた距離測定が挙げられる。
N×Mの矩形区域に対しては、平均カラーディスタンスは、以下の式に従って算出される。
Figure 0004498422
算出された平均カラーディスタンスμ (1)は、注目画素の周りの第1の区域が局所背景の推定色と比較して低いコントラストであるか否かを判定するために、コントラスト閾値TCONと分類部36により比較される(S152)。コントラスト閾値TCONは、固定値であっても可変値であってもよい。
平均カラーディスタンスμ (1)がコントラスト閾値TCONよりも小さい場合(S152でYes)、すなわち、注目画素の色が背景(局所背景および原稿下地以外の背景)と比較して低コントラストを有する場合、注目画素は「非グリフ」画素として分類部36によりラベル付けされる(S154)。平均カラーディスタンスμ (1)がコントラスト閾値TCONよりも小さくない場合(S152でNo)、さらなる処理が必要とされる。
なお、次のような変形形態であってもよい。すなわち、平均カラーディスタンスμ (1)がコントラスト閾値TCONよりも小さく、かつ、原稿下地の色cPBGが局所背景推定色cLBG1と等しくない場合、すなわち、注目画素の色が局所背景と比較して低コントラストを有し、かつ、注目画素が網点領域上である場合、注目画素は「非グリフ」画素としてラベル付けされる。この変形形態の場合、平均カラーディスタンスμ (1)がコントラスト閾値TCONよりも小さくない場合、もしくは、原稿下地の色cPBGが局所背景の推定色cLBG1と等しい場合、さらなる処理が必要とされる。
続いて、更なる処理が必要となる場合(S152でNo)、注目画素がラージテキスト(記号文字を含む)の一部であるかどうかの判定がラージテキスト評価部33により行われる。注目画素がラージテキスト(記号文字を含む)の一部であるかどうかの判定処理は、上述したように、第2の区域における局所背景の推定色cLGB2と第2の区域における画素の色cとの距離であるカラーディスタンス(色差)D を類似度算出部34が計算する処理(S156)と、平均算出部331が平均カラーディスタンμを算出する処理(S157)を含む。ここでの平均カラーディスタンμは、注目画素に隣接する第2の区域において算出されるので、μ (2)と表すこととする。
注目画素がラージテキスト(記号文字を含む)の一部であるかどうかの判定処理は、さらに、第2の区域に対する局所背景の推定色と当該第2の区域の画素の色とのカラーディスタンスのレンジr (2)を求める処理(S158)を含む。カラーディスタンスのレンジr (2)は、以下の式に従って決定される。
Figure 0004498422
数9において、cLBG2は第2の区域における局所背景の推定色を示す。
次に、r (2)がカラーレンジ閾値Tr以下であるか、および、μ (2)が平均ディスタンス閾値Tμ以上であるかが比較部333により確認される(S159)。
本実施形態では、カラーディスタンスの範囲r (2)が小さく、かつ、平均カラーディスタンスμ (2)が大きい場合(S159でYes)、判定部334は、注目画素がラージテキスト(記号文字を含む)の一部であると判定する。そして、カラーディスタンスの範囲r (2)が小さく、かつ、平均カラーディスタンスμ (2)が大きい場合、すなわち、注目画素がラージテキスト(記号文字を含む)の一部であると判定部334により判定された場合、分類部36は、注目画素を「グリフ」画素としてラベル付けする(S161)。一方、そうでない場合は、更なる処理が必要とされる。
次に、注目画素がラージテキスト(記号文字を含む)の一部ではないと判定部334により判定された場合(S159でNo)、類似度算出部34は、注目画素と当該注目画素に隣接する第3の区域の局所背景の色cLBG3との間のコントラストとして、カラーディスタンス D=d(cPOT,cLBG3)を求める(S163)。また、動的閾値算出部35は、動的閾値Tを、以下の式に従って算出する(S164)。
Figure 0004498422
数10において、r (3)およびdmin (3)は上述したようにレンジ算出部352および最小値決定部353により求められるものであり、Rは予め定められた一定値である。その後、分類部36は、注目画素と第3の区域の局所背景の色との間のコントラストであるカラーディスタンスD=d(cPOT,cLBG3)が動的閾値Tよりも大きいか否かを判断する(S165)。そして、D>Tである場合(S165でYes)、注目画素は「グリフ」画素として分類部36によりラベル付けされる(S161)。一方、D≦Tである場合(S165でNo)、注目画素は「非グリフ」画素として分類部36によりラベル付けされる(S154)。
(実施形態4)
本発明の実施形態4における画像処理の流れの概要について図7を参照しながら説明する。
本実施形態では、まず、類似度算出部34は、注目画素の色と、当該注目画素に隣接する第1の区域の局所背景の推定色との類似度を決定する。そして、当該類似度に基づいて類似しているか否かが判定される(S110)。
注目画素の色と第1の区域の局所背景の推定色とが類似している場合(S110でYes)、注目画素は、分類部36により「非グリフ」画素としてラベル付けされる(S112)。一方、注目画素の色と第1の区域の局所背景の推定色とが類似していない場合(S110でNo)、注目画素がラージテキスト(記号文字を含む)の一部であるかどうかの判定がラージテキスト評価部33により行われる。注目画素がラージテキスト(記号文字を含む)の一部であるか否かの判定処理には、注目画素に隣接する第2の区域内の複数の画素のカラー値の比較処理が含まれる。
注目画素がラージテキスト(記号文字も含む)の一部であると判定された場合(S114でYes)、注目画素は「グリフ」画素として分類部36によりラベル付けされる(S116)。一方、注目画素がラージテキスト(記号文字も含む)の一部ではないと判定された場合(S114でNo)、注目画素と当該注目画素に隣接する第3の区域の局所背景との間のコントラストが動的閾値よりも大きいか否かが判断される(S118)。コントラストが動的閾値よりも大きい場合(S118でYes)、注目画素は「グリフ」画素としてラベル付けされる(S116)。コントラストが動的閾値以下である場合(S118でNo)、注目画素は「非グリフ」画素としてラベル付けされる(S112)。もしくは、コントラストが動的閾値以上である場合に、注目画素が「グリフ」画素としてラベル付けされ、コントラストが動的閾値未満である場合、注目画素が「非グリフ」画素としてラベル付けされてもよい。また、第1、第2および第3の区域は、同じであってもよいし、いずれかが異なるものであってもよい。
次に、図7で示した画像処理の流れを、図10を参照しながら、より詳細に説明する。図10は、本実施形態の画像処理の詳細を示すフローチャートである。
まず、類似度算出部34は、デジタル画像の注目画素について、当該注目画素の色cPOIと当該注目画素に隣接する第1の区域の局所背景の推定色cLGB1との類似度を求める(S180)。ここでは、当該類似度は、注目画素の色cPOIと当該注目画素に隣接する第1の区域の局所背景の推定色cLGB1との間の距離Dとして算出される。ここで、この2つのカラー値の間の距離を、d(cPOI,cLGB1)とする。本実施形態では、第1の区域全体に対して、単一のカラー値cLGB1が局所区域の推定色として得られる。あるいは、局所背景の推定色は、第1の区域の各画素の値から取得してもよい。すなわち、第1の区域の局所背景の推定色は、当該区域の各画素について求められる局所背景の色推定値の組合せにより算出される。典型的な組合せは、平均値、中間値、重み付け係数を用いて得られる平均値、および個々の局所背景の推定値の他の組合せを含む。
従来知られている距離測定方法が、注目画素の色cPOIと当該注目画素に隣接する第1の区域の局所背景の推定色cLGB1との間の距離D=d(cPOI,cLGB1)の決定に用いることができる。典型的な測定としては、luma-chroma-chroma色空間のchroma成分間の2次元の市街地距離の測定、3次元の色空間の成分間の3次元の市街地距離の測定、ユークリッド距離測定、luma-chroma-chroma色空間のchroma成分間の加重値が与えられた2次元の市街地距離の測定や、3次元の色空間の成分間の加重値が与えられた3次元の市街地距離の測定、および他の良く知られた距離測定が挙げられる。
次に、距離D=d(cPOI,cLGB1)は、注目画素の色が背景の色とが実質的に類似しているかどうかを判断するために、類似度閾値TLGB_SIMと比較される(S181)。類似度閾値TLGB_SIMは、固定値であってもよいし、可変値であってもよい。距離D=d(cPOI,cLGB1)が類似度閾値TLGB_SIM以下である場合(S181でNo)、すなわち、注目画素の色と当該注目画素に隣接する区域の局所背景の色とが近いことを示している場合、注目画素は「非グリフ」画素として分類部36によりラベル付けされる(S183)。一方、距離D=d(cPOI,cLGB1)が類似度閾値TLGB_SIMよりも小さくない場合(S181でYes)、さらなる処理が必要となる。
なお、次のような変形形態でもよい。すなわち、距離D=d(cPOI,cLGB1)が類似度閾値TLGB_SIMよりも小さい場合、すなわち、注目画素の色と当該注目画素に隣接する区域の局所背景の色とが近いことを示している場合であり、かつ、局所背景の推定色cLGB1が原稿下地の色cPBGと等しくない場合、注目画素は、「非グリフ」画素としてラベル付けされる。この変形形態では、距離D=d(cPOI,cLGB1)が類似度閾値TLGB_SIMよりも小さくない場合(例えば、D>TLGB_SIMの場合)、もしくは、cLGB1=cPBGの場合、さらなる処理が必要となる。
また、区域Kにおける画素の平均カラーディスタンスμ (K)が、以下の式に従って算出される。
Figure 0004498422
数11において、NHKは区域Kを示しており、cは区域NHKに含まれる画素jのカラー値を示しており、d(・,・)は距離を示している。典型的な測定としては、luma-chroma-chroma色空間のchroma成分間の2次元の市街地距離の測定、3次元の色空間の成分間の3次元の市街地距離の測定、ユークリッド距離測定、luma-chroma-chroma色空間のchroma成分間の加重値が与えられた2次元の市街地距離の測定や、3次元の色空間の成分間の加重値が与えられた3次元の市街地距離の測定、および他の良く知られた距離測定が挙げられる。
N×Mの矩形区域に対しては、平均カラーディスタンスは、以下の式に従って算出される。
Figure 0004498422
次に、更なる処理が必要となる場合(S181でYes)、注目画素がラージテキスト(記号文字も含む)の一部であるかどうかの判定がラージテキスト評価部33により行われる。注目画素がラージテキスト(記号文字も含む)の一部であるかどうかの判定処理は、上述したように、第2の区域における局所背景の推定色cLGB2と第2の区域における画素の色cとの距離であるカラーディスタンス(色差)D を類似度算出部34が計算する処理(S185)と、平均算出部331が平均カラーディスタンμを算出する処理(S186)を含む。ここでの平均カラーディスタンμは、注目画素に隣接する第2の区域において算出されるので、μ (2)と表すこととする。
注目画素がラージテキスト(記号文字も含む)の一部であるかどうかの判定処理は、さらに、第2の区域に対する局所背景の推定色と当該第2の区域の画素の色とのカラーディスタンスのレンジr (2)を求める処理(S187)を含む。カラーディスタンスのレンジr (2)は、以下の式に従って決定される。
Figure 0004498422
数13において、cLBG2は第2の区域における局所背景の推定色を示す。
次に、r (2)がカラーレンジ閾値Tr以下であるか、および、μ (2)が平均ディスタンス閾値Tμ以上であるかが比較部333により確認される(S188)。
本実施形態では、カラーディスタンスの範囲r (2)が小さく、かつ、平均カラーディスタンスμ (2)が大きい場合(S188でYes)、判定部334は、注目画素がラージテキスト(記号文字も含む)の一部であると判定する。そして、カラーディスタンスの範囲r (2)が小さく、かつ、平均カラーディスタンスμ (2)が大きい場合、すなわち、注目画素がラージテキスト(記号文字を含む)の一部であると判定部334により判定された場合、分類部36は、注目画素を「グリフ」画素としてラベル付けする(S190)。一方、そうでない場合は、更なる処理が必要とされる。
次に、注目画素がラージテキスト(記号文字を含む)の一部ではないと判定部334により判定された場合(S188でNo)、類似度算出部34は、注目画素と当該注目画素に隣接する第3の区域の局所背景の色cLBG3との間のコントラストとして、カラーディスタンス D=d(cPOT,cLBG3)を求める(S192)。また、動的閾値算出部35は、動的閾値Tを、以下の式に従って算出する(S193)。
Figure 0004498422
数14において、r (3)およびdmin (3)は上述したようにレンジ算出部352および最小値決定部353により求められるものであり、Rは予め定められた一定値である。その後、分類部36は、注目画素と第3の区域の局所背景の色との間のコントラストであるカラーディスタンスD=d(cPOT,cLBG3)が動的閾値Tよりも大きいか否かを判断する(S194)。そして、D>Tである場合(S194でYes)、注目画素は「グリフ」画素として分類部36によりラベル付けされる(S190)。一方、D≦Tである場合(S194でNo)、注目画素は「非グリフ」画素として分類部36によりラベル付けされる(S183)。
本発明では、局所背景の推定色を受け取る実施形態であってもよいし、当該推定色を決定する実施形態であってもよい。局所背景の推定色を決定する典型的な方法としては、米国特許出願11/365,067(出願日2006年2月28日)に記載の方法や、米国特許出願11/424,290(出願日2006年6月15日)に記載の方法、その他の公知の方法を用いることができる。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
最後に、画像処理装置30の各ブロックは、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、画像処理装置30は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである画像処理装置30の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記画像処理装置30に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、画像処理装置30を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は、デジタル画像の画素の分類を行う画像処理装置および当該装置を含む画像形成装置、例えば、複写機などの用途に適用できる。
原稿下地領域と複数の局所背景領域とを含むドキュメント画像の一例を示す図である。 注目画素と当該注目画素に隣接する領域との一例を示す図である。 本発明の実施形態1に係る画素の分類処理の流れの概要を示すフローチャートである。 本発明の実施形態1に係る画素の分類処理の流れの詳細を示すフローチャートである。 本発明の実施形態2に係る画素の分類処理の流れの概要を示すフローチャートである。 本発明の実施形態3に係る画素の分類処理の流れの概要を示すフローチャートである。 本発明の実施形態4に係る画素の分類処理の流れの概要を示すフローチャートである。 本発明の実施形態2に係る画素の分類処理の流れの詳細を示すフローチャートである。 本発明の実施形態3に係る画素の分類処理の流れの詳細を示すフローチャートである。 本発明の実施形態4に係る画素の分類処理の流れの詳細を示すフローチャートである。 本発明の一実施形態に係る画像処理装置の構成を示すブロック図である。 ラージテキストの一例を示す図である。 ラージテキストに局所区域が含まれる場合の、当該局所区域内の画素に対応するカラーディスタンスを示す図である。 局所区域が字体のエッジ部と重なるときの、当該局所区域内の画素に対応するカラーディスタンスの一例を示す図であり、(a)は注目画素が局所背景に近い色を示す場合であり、(b)は注目画素がグリフに近い色を示す場合である。 局所区域が網点領域上の字体のエッジ部と重なるときの、当該局所区域内の画素に対応するカラーディスタンスの一例を示す図である。
符号の説明
20 局所区域(第1〜第3の領域)
21−28 画素(第1−第3の複数の画素)
29 注目画素
30 画像処理装置
31 画素選択部
32 推定色取得部
33 ラージテキスト評価部
331 平均算出部
332 レンジ算出部
333 比較部
334 判定部
34 類似度算出部
35 動的閾値算出部
351 距離算出部
352 レンジ算出部
353 最小値決定部
354 調整部
355 加算部
36 分類部(第1−第4分類部)

Claims (17)

  1. デジタル画像における画素の分類方法であって、
    a)デジタル画像における注目画素を選択する第1ステップと、
    b)注目画素に隣接する第1の複数の画素の各画素の色と、上記第1の複数の画素に対する局所背景を代表する色である第1の局所背景の代表色との色空間における距離である複数の第1カラーディスタンスを求め、当該複数の第1カラーディスタンスの平均値である第1平均カラーディスタンスを求め、上記第1平均カラーディスタンスが平均距離の閾値よりも大きく、かつ、上記複数の第1カラーディスタンスの最大値と最小値との差分が差分閾値よりも小さい場合に、当該注目画素が字体要件を満たすと評価する第2ステップと、
    c)注目画素が上記字体要件を満たす場合、当該注目画素を字体画素として分類する第3ステップと、
    d)注目画素が上記字体要件を満たさない場合、当該注目画素に隣接する第2の複数の画素の各画素の色と、上記第2の複数の画素に対する局所背景を代表する色である第2の局所背景の代表色との色空間における距離である複数の第2カラーディスタンスを求め、上記複数の第2カラーディスタンスの最大値と最小値との差分を定数によって調整して調整差分値を求め、上記調整差分値を上記複数の第2カラーディスタンスの最小値に加算した値を動的閾値として算出する第4ステップと、
    e)上記第2の局所背景の代表色と注目画素の色との差の大きさを示す第1の類似度を求める第5ステップと、
    f)上記第1の類似度が上記動的閾値よりも大きい場合、注目画素を字体画素として分類する第6ステップと、
    g)上記第1の類似度が上記動的閾値以下である場合、注目画素を非字体画素として分類する第7ステップと、
    を含むことを特徴とする画素の分類方法。
  2. 上記第5ステップにおいて、色空間における、上記第2の局所背景の代表色と注目画素の色との距離を上記第1の類似度として求めることを特徴とする請求項に記載の画素の分類方法。
  3. 3次元市街地距離により、上記第2の局所背景の代表色と注目画素の色との距離を求めることを特徴とする請求項に記載の画素の分類方法。
  4. 上記第1の複数の画素よりなる第1の領域と上記第2の複数の画素よりなる第2の領域とが同じ領域であることを特徴とする請求項1から3の何れか1項に記載の画素の分類方法。
  5. 色空間における、注目画素に隣接する第3の領域を構成する第3の複数の画素の各画素の色と、当該第3の領域に対する局所背景を代表する色である第3の局所背景の代表色との距離である複数の第3カラーディスタンスを求め、当該複数の第3カラーディスタンスの平均値である第3平均カラーディスタンスを求めるステップを含み、
    上記第3平均カラーディスタンスがコントラスト閾値以上である場合に、上記第2ステップを行い、上記第3平均カラーディスタンスがコントラスト閾値よりも小さい場合に、注目画素を非字体画素として分類することを特徴とする請求項1から4の何れか1項に記載の画素の分類方法。
  6. 注目画素に隣接する第3の領域に対する局所背景を代表する色である第3の局所背景の代表色と注目画素の色との差の大きさを示す第2の類似度を求めるステップを含み、
    上記第2の類似度が類似度閾値以上の場合に、上記第2ステップを行い、上記第2の類似度が類似度閾値よりも小さい場合に、注目画素を非字体画素として分類することを特徴とする請求項1から4の何れか1項に記載の画素の分類方法。
  7. 色空間における、注目画素に隣接する第3の領域を構成する第3の複数の画素の各画素の色と、当該第3の領域に対する局所背景を代表する色である第3の局所背景の代表色との距離である複数の第3カラーディスタンスを求め、当該複数の第3カラーディスタンスの平均値である第3平均カラーディスタンスを求めるステップを含み、
    上記第3平均カラーディスタンスがコントラスト閾値以上である場合、あるいは、上記第3の局所背景の代表色が原稿下地を代表する色である原稿下地の代表色と等しい場合に、上記第2ステップを行い、上記第3平均カラーディスタンスがコントラスト閾値よりも小さく、かつ、上記第3の局所背景の代表色が原稿下地の代表色と等しくない場合に、注目画素を非字体画素として分類することを特徴とする請求項1から4の何れか1項に記載の画素の分類方法。
  8. 注目画素に隣接する第3の領域に対する局所背景を代表する色である第3の局所背景の代表色と注目画素の色との類似度である第2の類似度を求めるステップを含み、
    上記第2の類似度が類似度閾値以上の場合、あるいは、上記第3の局所背景の代表色が原稿下地を代表する色である原稿下地の代表色と等しい場合に、上記第2ステップを行い、上記第2の類似度が類似度閾値よりも小さく、かつ、上記第3の局所背景の代表色が原稿下地の代表色と等しくない場合に、注目画素を非字体画素として分類することを特徴とする請求項1から4の何れか1項に記載の画素の分類方法。
  9. デジタル画像における画素の分類を行う画像処理装置であって、
    a)デジタル画像の中から注目画素を選択する画素選択部と、
    b)注目画素に隣接する第1の複数の画素の各画素の色と、上記第1の複数の画素に対する局所背景を代表する色である第1の局所背景の代表色との色空間における距離である複数の第1カラーディスタンスを求め、当該複数の第1カラーディスタンスの平均値である第1平均カラーディスタンスを求め、上記第1平均カラーディスタンスが平均距離の閾値よりも大きく、かつ、上記複数の第1カラーディスタンスの最大値と最小値との差分が差分閾値よりも小さい場合に、当該注目画素が字体要件を満たすと評価する字体評価部と、
    c)注目画素が上記字体要件を満たす場合、当該注目画素を字体画素として分類する第1分類部と、
    d)注目画素が上記字体要件を満たさない場合、当該注目画素に隣接する第2の複数の画素の各画素の色と、上記第2の複数の画素に対する局所背景を代表する色である第2の局所背景の代表色との色空間における距離である複数の第2カラーディスタンスを求め、上記複数の第2カラーディスタンスの最大値と最小値との差分を定数によって調整して調整差分値を求め、上記調整差分値を上記複数の第2カラーディスタンスの最小値に加算した値を動的閾値として算出する動的閾値算出部と、
    e)上記第2の局所背景の代表色と注目画素の色との差の大きさを示す第1の類似度を求める第1類似度算出部と、
    f)上記第1の類似度が上記動的閾値よりも大きい場合、注目画素を字体画素として分類する第2分類部と、
    g)上記第1の類似度が上記動的閾値以下である場合、注目画素を非字体画素として分類する第3分類部と、
    を備えることを特徴とする画像処理装置。
  10. 上記第1類似度算出部は、色空間における、上記第2の局所背景の代表色と注目画素の色との距離を上記第1の類似度として求めることを特徴とする請求項に記載の画像処理装置。
  11. 上記第1類似度算出部は、3次元市街地距離により、上記第2の局所背景の代表色と注目画素の色との距離を求めることを特徴とする請求項10に記載の画像処理装置。
  12. 上記第1の複数の画素よりなる第1の領域と上記第2の複数の画素よりなる第2の領域とが同じ領域であることを特徴とする請求項9から11の何れか1項に記載の画像処理装置。
  13. 色空間における、注目画素に隣接する第3の領域を構成する第3の複数の画素の各画素の色と、当該第3の領域に対する局所背景を代表する色である第3の局所背景の代表色との距離である複数の第3カラーディスタンスを求め、当該複数の第3カラーディスタンスの平均値である第3平均カラーディスタンスを求める平均算出部と、
    上記第3平均カラーディスタンスがコントラスト閾値よりも小さい場合に、注目画素を非字体画素として分類する第4分類部とを備え、
    上記字体評価部は、上記第3平均カラーディスタンスがコントラスト閾値以上である場合に、上記字体要件の評価を行うことを特徴とする請求項9から12の何れか1項に記載の画像処理装置。
  14. 注目画素に隣接する第3の領域に対する局所背景を代表する色である第3の局所背景の代表色と注目画素の色との差の大きさを示す第2の類似度を求める第2類似度算出部と、
    上記第2の類似度が類似度閾値よりも小さい場合に、注目画素を非字体画素として分類する第4分類部とを備え、
    上記字体評価部は、上記第2の類似度が類似度閾値以上の場合に、上記字体要件の評価を行うことを特徴とする請求項9から12の何れか1項に記載の画像処理装置。
  15. 色空間における、注目画素に隣接する第3の領域を構成する第3の複数の画素の各画素の色と、当該第3の領域に対する局所背景を代表する色である第3の局所背景の代表色との距離である複数の第3カラーディスタンスを求め、当該複数の第3カラーディスタンスの平均値である第3平均カラーディスタンスを求める平均算出部と、
    上記第3平均カラーディスタンスがコントラスト閾値よりも小さく、かつ、上記第3の局所背景の代表色が原稿下地を代表する色である原稿下地の代表色と等しくない場合に、注目画素を非字体画素として分類する第4分類部とを備え、
    上記字体評価部は、上記第3平均カラーディスタンスがコントラスト閾値以上である場合、あるいは、上記第3の局所背景の代表色が原稿下地の代表色と等しい場合に、上記字体要件の評価を行うことを特徴とする請求項9から12の何れか1項に記載の画像処理装置。
  16. 注目画素に隣接する第3の領域に対する局所背景を代表する色である第3の局所背景の代表色と注目画素の色との差の大きさを示す第2の類似度を求める第2類似度算出部と、
    上記第2の類似度が類似度閾値よりも小さく、かつ、上記第3の局所背景の代表色が原稿下地を代表する色である原稿下地の代表色と等しくない場合に、注目画素を非字体画素として分類する第4分類部とを備え、
    上記字体評価部は、上記第2の類似度が類似度閾値以上の場合、あるいは、上記第3の局所背景の代表色が原稿下地の代表色と等しい場合に、上記字体要件の評価を行うことを特徴とする請求項9から12の何れか1項に記載の画像処理装置。
  17. デジタル画像における画素の分類方法であって、
    a)デジタル画像の中の注目画素を選択するステップと、
    b)注目画素に隣接する複数の画素からなる領域に対する局所背景を代表する色である局所背景の代表色を取得するステップと、
    c)上記デジタル画像の原稿下地を代表する色である原稿下地の代表色を取得するステップと、
    )上記局所背景の代表色と注目画素の色との差の大きさを示す類似度を求めるステップと
    e)上記類似度が類似度閾値以下であり、かつ、上記局所背景の代表色が上記原稿下地の代表色と等しくない場合に、注目画素を字体画素として分類するステップと、
    f)上記類似度が類似度閾値よりも大きい場合、あるいは、上記局所背景の代表色が上記原稿下地の代表色と等しい場合に、上記領域の中の複数の画素と上記局所背景の代表色との間のコントラストを算出するステップと、
    g)上記コントラストが第1コントラスト閾値よりも小さく、かつ、上記局所背景の代表色が原稿下地の代表色と等しくない場合に、注目画素を字体画素として分類するステップと、
    h)上記コントラストが第1コントラスト閾値以上である場合、あるいは、上記局所背景の代表色が原稿下地の代表色と等しい場合に、上記領域の中の複数の画素の各画素の色と、上記局所背景の代表色との色空間における距離である複数のカラーディスタンスを求め、上記コントラストが第2コントラスト閾値よりも大きく、かつ、上記複数のカラーディスタンスの最大値と最小値との差分が差分閾値よりも小さい場合に、注目画素が字体要件を満たすと評価するステップと、
    i)注目画素が上記字体要件を満たす場合に、注目画素を字体画素として分類するステップと、
    j)注目画素が上記字体要件を満たさない場合に、上記複数のカラーディスタンスの最大値と最小値との差分を固定値により調整して調整差分値を求め上記調整差分値と上記複数のカラーディスタンスの最小値とを加算することで動的閾値を求めるステップと、
    k)上記類似度が上記動的閾値よりも大きい場合に、注目画素を字体画素として分類するステップと、
    l)上記類似度が上記動的閾値以下である場合に、注目画素を字体画素として分類するステップと、
    を含むことを特徴とする画素の分類方法。
JP2008010940A 2007-01-26 2008-01-21 画素の分類方法および画像処理装置 Expired - Fee Related JP4498422B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/627,456 US7856142B2 (en) 2007-01-26 2007-01-26 Methods and systems for detecting character content in a digital image

Publications (2)

Publication Number Publication Date
JP2008187709A JP2008187709A (ja) 2008-08-14
JP4498422B2 true JP4498422B2 (ja) 2010-07-07

Family

ID=39668047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008010940A Expired - Fee Related JP4498422B2 (ja) 2007-01-26 2008-01-21 画素の分類方法および画像処理装置

Country Status (2)

Country Link
US (1) US7856142B2 (ja)
JP (1) JP4498422B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310817A (ja) * 2007-06-18 2008-12-25 Sharp Corp テキストマップの中からライン構造を検出する方法および画像処理装置

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7856142B2 (en) * 2007-01-26 2010-12-21 Sharp Laboratories Of America, Inc. Methods and systems for detecting character content in a digital image
US20090041344A1 (en) * 2007-08-08 2009-02-12 Richard John Campbell Methods and Systems for Determining a Background Color in a Digital Image
JP5333787B2 (ja) * 2010-07-20 2013-11-06 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US9218680B2 (en) * 2010-09-01 2015-12-22 K-Nfb Reading Technology, Inc. Systems and methods for rendering graphical content and glyphs
CN102831579B (zh) * 2011-06-16 2015-06-17 富士通株式会社 文本增强方法及装置、文本提取方法及装置
US8959082B2 (en) 2011-10-31 2015-02-17 Elwha Llc Context-sensitive query enrichment
US10552581B2 (en) 2011-12-30 2020-02-04 Elwha Llc Evidence-based healthcare information management protocols
US10528913B2 (en) 2011-12-30 2020-01-07 Elwha Llc Evidence-based healthcare information management protocols
US10559380B2 (en) 2011-12-30 2020-02-11 Elwha Llc Evidence-based healthcare information management protocols
US10475142B2 (en) 2011-12-30 2019-11-12 Elwha Llc Evidence-based healthcare information management protocols
US10340034B2 (en) 2011-12-30 2019-07-02 Elwha Llc Evidence-based healthcare information management protocols
US20130173298A1 (en) 2011-12-30 2013-07-04 Elwha LLC, a limited liability company of State of Delaware Evidence-based healthcare information management protocols
US10679309B2 (en) 2011-12-30 2020-06-09 Elwha Llc Evidence-based healthcare information management protocols
US9767554B2 (en) * 2015-02-19 2017-09-19 Sony Corporation Method and system for detection of surgical gauze during anatomical surgery
US10607397B2 (en) * 2015-06-04 2020-03-31 Hewlett-Packard Development Company, L.P. Generating three dimensional models
US9563961B1 (en) 2016-01-19 2017-02-07 Xerox Corporation Method and system for image processing
US10341634B2 (en) 2016-01-29 2019-07-02 Samsung Electronics Co., Ltd. Method and apparatus for acquiring image disparity
JP6810892B2 (ja) * 2017-06-05 2021-01-13 京セラドキュメントソリューションズ株式会社 画像処理装置
JP7028099B2 (ja) * 2018-08-02 2022-03-02 日本電信電話株式会社 候補領域推定装置、候補領域推定方法、及びプログラム
CN113646203A (zh) * 2019-03-29 2021-11-12 罗姆股份有限公司 半导体装置、使用了它的车载用显示器系统、电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222688A (ja) * 1997-01-21 1998-08-21 Xerox Corp 画像処理方法
JP2001101426A (ja) * 1999-09-02 2001-04-13 Xerox Corp ディジタル画像処理方法
JP2001109895A (ja) * 1999-10-04 2001-04-20 Xerox Corp 複数のディジタル画像の処理方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4030068A (en) * 1976-01-12 1977-06-14 Decision Data Computer Corporation Optical character recognition system
AU533978B2 (en) * 1979-11-16 1983-12-22 Tokyo Electric Co. Ltd. Character reader
US4490850A (en) * 1981-12-17 1984-12-25 Ncr Corporation Matrix character recognition
US4644410A (en) * 1985-03-11 1987-02-17 R. A. McDonald Dynamic threshold binary generator
US5566255A (en) * 1991-03-05 1996-10-15 Ricoh Company, Ltd. Segmenting a page of a document into areas which are text and areas which are halftone
JP3276985B2 (ja) * 1991-06-27 2002-04-22 ゼロックス・コーポレーション イメージピクセル処理方法
US5268967A (en) * 1992-06-29 1993-12-07 Eastman Kodak Company Method for automatic foreground and background detection in digital radiographic images
JPH07334625A (ja) * 1994-06-06 1995-12-22 Nec Corp 文字列入力装置
US5768414A (en) * 1995-12-22 1998-06-16 Canon Kabushiki Kaisha Separation of touching characters in optical character recognition
US5852678A (en) * 1996-05-30 1998-12-22 Xerox Corporation Detection and rendering of text in tinted areas
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
JP3114668B2 (ja) * 1997-10-03 2000-12-04 日本電気株式会社 物体検出・背景除去方法、装置およびプログラムを記録した記録媒体
US6295371B1 (en) * 1998-10-22 2001-09-25 Xerox Corporation Method and apparatus for image processing employing image segmentation using tokenization
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
US6853755B2 (en) * 2001-03-28 2005-02-08 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive compression of scanned documents
US6973213B2 (en) * 2001-10-12 2005-12-06 Xerox Corporation Background-based image segmentation
US6859204B2 (en) * 2002-07-01 2005-02-22 Xerox Corporation Dynamic threshold system for multiple raster content (MRC) representation of documents
US6993185B2 (en) * 2002-08-30 2006-01-31 Matsushita Electric Industrial Co., Ltd. Method of texture-based color document segmentation
US7079687B2 (en) * 2003-03-06 2006-07-18 Seiko Epson Corporation Method and apparatus for segmentation of compound documents
US20050226503A1 (en) * 2004-04-07 2005-10-13 Bailey James R Scanned image content analysis
JP4243614B2 (ja) * 2006-01-11 2009-03-25 Necアクセステクニカ株式会社 線分検出器及び線分検出方法
US7856142B2 (en) * 2007-01-26 2010-12-21 Sharp Laboratories Of America, Inc. Methods and systems for detecting character content in a digital image
US8340430B2 (en) * 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8014596B2 (en) * 2007-10-30 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for background color extrapolation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222688A (ja) * 1997-01-21 1998-08-21 Xerox Corp 画像処理方法
JP2001101426A (ja) * 1999-09-02 2001-04-13 Xerox Corp ディジタル画像処理方法
JP2001109895A (ja) * 1999-10-04 2001-04-20 Xerox Corp 複数のディジタル画像の処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310817A (ja) * 2007-06-18 2008-12-25 Sharp Corp テキストマップの中からライン構造を検出する方法および画像処理装置

Also Published As

Publication number Publication date
JP2008187709A (ja) 2008-08-14
US7856142B2 (en) 2010-12-21
US20080181496A1 (en) 2008-07-31

Similar Documents

Publication Publication Date Title
JP4498422B2 (ja) 画素の分類方法および画像処理装置
JP3964327B2 (ja) 画像内の関心領域を決定するための方法及び装置及び画像伝送方法及び装置
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
US8121403B2 (en) Methods and systems for glyph-pixel selection
JP5008572B2 (ja) 画像処理方法、画像処理装置およびコンピュータ可読媒体
US7379594B2 (en) Methods and systems for automatic detection of continuous-tone regions in document images
JP4340701B2 (ja) デジタル画像のテキストを識別する方法およびシステム
JP4745296B2 (ja) デジタル画像の領域分離方法および領域分離システム
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
JP4745297B2 (ja) デジタル画像における均一な色の領域を特定する方法およびシステム
JP2014057306A (ja) 画像位相一致を用いた文書画像の二値化及び分割
JP4745430B2 (ja) デジタル画像のテキストの位置決定を行う方法およびシステム
JP2004529404A (ja) 画像を分析するための方法及び装置
US7119924B2 (en) Detection and segmentation of sweeps in color graphics images
JP4764903B2 (ja) テキストマップの中からライン構造を検出する方法および画像処理装置
EP3407589B1 (en) Image processing apparatus, image processing method, and storage medium
JP4498425B2 (ja) デジタル画像の画素を分類する方法およびシステム
JP4649498B2 (ja) 画像データの色補正方法及びシステム
US8472716B2 (en) Block-based noise detection and reduction method with pixel level classification granularity
CN107704864B (zh) 基于图像对象性语义检测的显著目标检测方法
JP2007234007A (ja) デジタル画像の領域を検知する方法およびシステム
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
US7826668B1 (en) Adaptive region editing tool
JP4437772B2 (ja) 画像処理システム、画像処理方法、プログラムおよびその記録媒体
US20090041344A1 (en) Methods and Systems for Determining a Background Color in a Digital Image

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100316

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100413

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees