JP4756436B2 - パターン認識装置とそのパターン認識方法、及びパターン認識プログラム - Google Patents

パターン認識装置とそのパターン認識方法、及びパターン認識プログラム Download PDF

Info

Publication number
JP4756436B2
JP4756436B2 JP2001201953A JP2001201953A JP4756436B2 JP 4756436 B2 JP4756436 B2 JP 4756436B2 JP 2001201953 A JP2001201953 A JP 2001201953A JP 2001201953 A JP2001201953 A JP 2001201953A JP 4756436 B2 JP4756436 B2 JP 4756436B2
Authority
JP
Japan
Prior art keywords
color
image
pixel
main
colors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001201953A
Other languages
English (en)
Other versions
JP2003016444A (ja
Inventor
雅彦 濱中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001201953A priority Critical patent/JP4756436B2/ja
Publication of JP2003016444A publication Critical patent/JP2003016444A/ja
Application granted granted Critical
Publication of JP4756436B2 publication Critical patent/JP4756436B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明はカラー画像のパターン認識に関し、特に、文字等のパターンを含むカラー画像において、画像が低解像度であり、かつパターン領域の色(前景色)とパターン以外の領域の色(背景色)が不特定で複数存在する場合にも、画像中のパターンを抽出し認識するパターン認識装置とそのパターン認識方法、及びパターン認識プログラムに関する。
【0002】
【従来の技術】
従来のカラー画像用パターン認識装置の一例が、特許第003061812号公報(特開平03−014077号公報)に開示されている(以下、第1の従来技術と称する)。この従来のカラー画像用パターン認識装置は、図17に示すように、カラー画像入力部10と、色分布分割部70と、二値画像生成部80と、二値パターン認識部90を備えている。この従来のカラー画像用パターン認識装置は、次のように動作する。
【0003】
カラー画像入力部10は、例えばスキャナやカメラ等の画像入力装置により画像を読みとり、又は予めコンピュータにファイルとして記憶されていた画像を読み込み、メモリ上に記憶する。色分布分割部70は、カラー画像入力部10が取得したカラー画像の各画素の色情報を用いて、色空間における分布を基に距離の近い色が同じグループとなるクラスタに分割する。二値画像生成部80は、色分布分割部70が分割して生成した各クラスタに対して、クラスタに属する色情報を持つ画素の値を“1”、属さない画素の値を“0”とする二値画像を生成する。二値パターン認識部90は、二値画像生成部80が生成した各二値画像に対して、認識すべきパターンを抽出しパターン認識を実行する。
【0004】
従来のカラー画像用パターン認識装置の他の一例が、特開平11−338976号公報に開示されている(以下、第2の従来技術と称する)。この従来のカラー画像用パターン認識装置は、図18に示すように、カラー画像入力部10と、明度画像生成部75と、二値画像生成部85と、二値パターン認識部95を備えている。このような構成を有する従来のカラー画像用パターン認識装置は次のように動作する。
【0005】
明度画像生成部75は、カラー画像入力部10が取得したカラー画像の各画素に対して、色情報から明度を表す量を計算し、当該量を各画素の値とする多値画像を生成する。二値画像生成部85は、明度画像生成部75が生成した多値画像に対して、画素間(サブピクセル)の明度を補間して解像度を上げつつ二値画像を生成する。二値パターン認識部95は、二値画像生成部85が生成した二値画像に対して、認識すべきパターンを抽出しパターン認識を実行する。
【0006】
【発明が解決しようとする課題】
上述したように従来の技術では、以下に述べるような問題点があった。
【0007】
第1に、第1の従来技術では、低解像度の画像に対して、認識精度が低いという問題点がある。その理由は、低解像度の画像では、文字サイズが例えば10×10画素程度の少ない画素により示され、更に低解像度の二値画像しか生成できないために、文字の形状を表す情報が極めて少なく、結果として認識精度が低下してしまうためである。
【0008】
第2に、第2の従来技術では、多値画像を生成しているものの、認識すべきパターンの領域の明度よりも明るい背景や暗い背景が混在するような複雑な画像では、必要なパターン領域を抽出することができないという問題点がある。その理由は、明度を表す多値画像から閾値を用いてパターン領域を抽出する際に、その画像に明るい背景や暗い背景が混在する場合には、その明るい背景又は暗い背景のいずれかがパターン領域に加えられて残ってしまうためである。
【0009】
低解像度でかつ背景色の複雑な画像に対してパターンを高精度に認識するためには、任意の前景色のパターンを抽出しつつ、当該パターンに属する度合いを多値画像として表現し、当該多値画像を用いてパターン認識することが必要であるが、しかし、従来技術では、当該多値画像を生成することができなかった。
【0010】
本発明の目的は、上記従来技術の欠点を解決し、低解像度でかつ背景色の複雑な画像に対しても任意の前景色のパターンを抽出し、当該パターンに属する度合いを多値画像として表現し当該多値画像を用いてパターン認識する、カラー画像のパターン認識装置とそのパターン認識方法、及びパターン認識プログラムを提供することにある。
【0011】
【課題を解決するための手段】
本発明の第1のパターン認識装置は、カラー画像の各画素の色情報を基に、当該カラー画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出手段と、カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの主要色を判定する対応主要色判定手段と、当該画素の前景・背景色を成す2つの主要色の組が判定された場合に、所定の色空間において、カラー画像の各画素の色を、当該画素の前景・背景色として判定された2つの主要色を結ぶ線分へ投影し、当該投影した点と、2つの主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成手段と、各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識手段を備え、対応主要色判定手段は、カラー画像の各画素に対して、色空間における各主要色の2つを結ぶ線分又は主要色への当該画素の色からの距離を計算し、当該線分又は主要色への距離が最小となる主要色の組を前景・背景色として選出する
本発明の第2のパターン認識装置は、カラー画像の各画素の色情報を基に、当該カラー画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出手段と、カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの主要色を判定する対応主要色判定手段と、当該画素の前景・背景色を成す2つの主要色の組が判定された場合に、所定の色空間において、カラー画像の各画素の色を、当該画素の前景・背景色として判定された2つの主要色を結ぶ線分へ投影し、当該投影した点と、2つの主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成手段と、各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識手段を備え、対応主要色判定手段は、カラー画像の各画素に対して、当該カラー画像中の当該画素の周りの予め定められた範囲内に存在する主要色を検出し、主要色が2つの場合は、検出された各主要色を前景・背景色とし、主要色が3つ以上の場合は、色空間における、検出された各主要色の2つを結ぶ線分又は主要色への当該画素の色からの距離を計算し、当該線分又は主要色への距離が最小となる主要色の組を前景・背景色として選出する。
本発明の第3のパターン認識装置は、カラー画像の各画素の色情報を基に、当該カラー画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出手段と、カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの主要色を判定する対応主要色判定手段と、当該画素の前景・背景色を成す2つの主要色の組が判定された場合に、所定の色空間において、カラー画像の各画素の色を、当該画素の前景・背景色として判定された2つの主要色を結ぶ線分へ投影し、当該投影した点と、2つの主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成手段と、各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識手段を備え、対応主要色判定手段は、カラー画像の各画素に対して、色空間における各主要色の2つを結ぶ線分又は主要色への当該画素の色からの色空間上の距離を算出し、当該カラー画像中における各主要色の2つを結ぶ線分又は主要色への当該画素の位置からの画像中の距離を算出し、色空間上の距離と画像中の距離との和が最小となる主要色の組を、前景・背景色として選出する。
【0012】
本発明の第1のパターン認識方法は、カラー画像の各画素の色情報を基に、当該カラー画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出ステップと、カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの主要色を判定する対応主要色判定ステップと、当該画素の前景・背景色を成す2つの主要色の組が判定された場合に、所定の色空間において、カラー画像の各画素の色を、当該画素の前景・背景色として判定された2つの主要色を結ぶ線分へ投影し、当該投影した点と、2つの主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成ステップと、各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識ステップを備え、対応主要色判定ステップで、カラー画像の各画素に対して、色空間における各主要色の2つを結ぶ線分又は主要色への当該画素の色からの距離を計算し、当該線分又は主要色への距離が最小となる主要色の組を前景・背景色として選出する
本発明の第2のパターン認識方法は、カラー画像の各画素の色情報を基に、当該カラー画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出ステップと、カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの主要色を判定する対応主要色判定ステップと、当該画素の前景・背景色を成す2つの主要色の組が判定された場合に、所定の色空間において、カラー画像の各画素の色を、当該画素の前景・背景色として判定された2つの主要色を結ぶ線分へ投影し、当該投影した点と、2つの主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成ステップと、各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識ステップを備え、対応主要色判定ステップで、カラー画像の各画素に対して、当該カラー画像中の当該画素の周りの予め定められた範囲内に存在する主要色を検出し、主要色が2つの場合は、検出された各主要色を前景・背景色とし、主要色が3つ以上の場合は、色空間における、検出された各主要色の2つを結ぶ線分又は主要色への当該画素の色からの距離を計算し、当該線分又は主要色への距離が最小となる主要色の組を前景・背景色として選出する。
本発明の第3のパターン認識方法は、カラー画像の各画素の色情報を基に、当該カラー画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出ステップと、カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの主要色を判定する対応主要色判定ステップと、当該画素の前景・背景色を成す2つの主要色の組が判定された場合に、所定の色空間において、カラー画像の各画素の色を、当該画素の前景・背景色として判定された2つの主要色を結ぶ線分へ投影し、当該投影した点と、2つの主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成ステップと、各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識ステップを備え、対応主要色判定ステップで、カラー画像の各画素に対して、色空間における各主要色の2つを結ぶ線分又は主要色への当該画素の色からの色空間上の距離を算出し、当該カラー画像中における各主要色の2つを結ぶ線分又は主要色への当該画素の位置からの画像中の距離を算出し、色空間上の距離と画像中の距離との和が最小となる主要色の組を、前景・背景色として選出する。
【0013】
本発明の第1のパターン認識プログラムは、コンピュータを制御することにより、カラー画像のパターン認識を行なうパターン認識プログラムにおいて、カラー画像の各画素の色情報を基に、当該カラー画像画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出処理と、カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの主要色を判定する対応主要色判定処理と、当該画素の前景・背景色を成す2つの主要色の組が判定された場合に、所定の色空間において、カラー画像の各画素の色を、当該画素の前景・背景色として判定された2つの主要色を結ぶ線分へ投影し、当該投影した点と、2つの主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成処理と、各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識処理を実行させ、対応主要色判定処理で、カラー画像の各画素に対して、色空間における各主要色の2つを結ぶ線分又は主要色への当該画素の色からの距離を計算し、当該線分又は主要色への距離が最小となる主要色の組を前景・背景色として選出する処理を実行させる
本発明の第2のパターン認識プログラムは、コンピュータを制御することにより、カラー画像のパターン認識を行なうパターン認識プログラムにおいて、カラー画像の各画素の色情報を基に、当該カラー画像画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出処理と、カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの主要色を判定する対応主要色判定処理と、当該画素の前景・背景色を成す2つの主要色の組が判定された場合に、所定の色空間において、カラー画像の各画素の色を、当該画素の前景・背景色として判定された2つの主要色を結ぶ線分へ投影し、当該投影した点と、2つの主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成処理と、各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識処理を実行させ、対応主要色判定処理で、カラー画像の各画素に対して、当該カラー画像中の当該画素の周りの予め定められた範囲内に存在する主要色を検出し、主要色が2つの場合は、検出された各主要色を前景・背景色とし、主要色が3つ以上の場合は、色空間における、検出された各主要色の2つを結ぶ線分又は主要色への当該画素の色からの距離を計算し、当該線分又は主要色への距離が最小となる主要色の組を前景・背景色として選出する処理を実行させる。
本発明の第3のパターン認識プログラムは、コンピュータを制御することにより、カラー画像のパターン認識を行なうパターン認識プログラムにおいて、カラー画像の各画素の色情報を基に、当該カラー画像画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出処理と、カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの主要色を判定する対応主要色判定処理と、当該画素の前景・背景色を成す2つの主要色の組が判定された場合に、所定の色空間において、カラー画像の各画素の色を、当該画素の前景・背景色として判定された2つの主要色を結ぶ線分へ投影し、当該投影した点と、2つの主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成処理と、各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識処理を実行させ、対応主要色判定処理で、カラー画像の各画素に対して、色空間における各主要色の2つを結ぶ線分又は主要色への当該画素の色からの色空間上の距離を算出し、当該カラー画像中における各主要色の2つを結ぶ線分又は主要色への当該画素の位置からの画像中の距離を算出し、色空間上の距離と画像中の距離との和が最小となる主要色の組を、前景・背景色として選出する処理を実行させる。
【0030】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【0031】
図1は、本発明の第1の実施の形態によるパターン認識装置100の構成を示すブロック図である。図1を参照すると、本実施の形態のパターン認識装置100は、カラー画像入力部10、主要色抽出部20、対応主要色判定部30、多値画像生成部40、多値パターン認識部50を備えている。これらの各部は、それぞれ概略次のような機能を備える。
【0032】
カラー画像入力部10は、例えばスキャナやカメラ等の画像入力装置により画像を読みとり、又は予めコンピュータにファイルとして記憶されていた画像を読み込み、メモリ上に記憶する。
【0033】
主要色抽出部20は、カラー画像入力部10により取得したカラー画像の各画素の色情報を用いて、出現頻度の高い複数の色を主要色として抽出する。
【0034】
対応主要色判定部30は、カラー画像入力部10により取得したカラー画像の各画素に対して、予め指定された色空間において、当該画素を2つの主要色の中間色として最も近似することのできる2つの主要色の組み合わせを、当該画素の前景・背景色として判定する。
【0035】
多値画像生成部40は、対応主要色判定部30により得られた各画素に対する前景・背景色に基づき、当該画素の色と当該前景・背景色に対応する2主要色との距離関係により当該2主要色に関する多値画像の各画素値を求めることにより、主要色抽出部20が抽出した各主要色に対応する各多値画像を生成する。ここで、画素の画素値とは、その画素と、その前景・背景色として判定された主要色との関連の度合いを示す値である。例えば、本実施の形態においては、画素を最も近似する前記中間色において、当該画素の前景・背景色である2つの主要色のそれぞれが占める度合いとして画素値を算出することができる。
【0036】
多値パターン認識部50は、多値画像生成部40が生成した各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する。
【0037】
この多値パターン認識部50によるパターン認識の処理は、従来技術を利用して実現できる。例えば、「1998年4月、電子情報通信学会論文誌D−II、第J81-D-II巻、第4号、641〜650頁」に示されるように、多値画像から文字列領域を抽出する場合、空間周波数が高く、コントラストが大きい領域を文字候補領域として抽出し、更に二値化して各パターンの外接矩形を求め、当該外接矩形のアスペクト比やサイズ、外接矩形間の近接性や直線的配列などにより文字領域らしさを判定することにより、文字列領域及び文字を抽出できる。抽出された各文字の多値画像は、当該多値画像から認識に必要な特徴を抽出し、各字種の予め学習された特徴と比較することにより、認識される。
【0038】
また例えば、「1994年10月、電子情報通信学会論文誌D−II、第J77-D-II巻、第10号、2046〜2053頁」に示されるように、各画素での勾配の方向と強度を計算し、各小領域毎に方向別に強度を加算することにより、多値画像から特徴を得ることができる。
【0039】
次に、本実施の形態のパターン認識装置100の全体の動作について、図面を参照して詳細に説明する。図2は、本実施の形態によるパターン認識の動作を説明するためのフローチャートである。
【0040】
図2を参照すると、まず、カラー画像入力部10により取得したカラー画像は、主要色抽出部20に供給され、主要色抽出部20は、カラー画像の各画素の色の頻度分布を計算する(ステップ200)。更に、主要色抽出部20は、当該色の頻度分布を基に、出現頻度の高い複数の色を主要色として抽出する(ステップ202)。
【0041】
対応主要色判定部30は、カラー画像入力部10により取得したカラー画像の各画素に対して、主要色抽出部20が抽出した主要色の中から、当該画素の近隣に存在する主要色を選出する(ステップ300)。更に、対応主要色判定部30は、選出された主要色を用い、当該主要色の各組に対して、色空間において当該主要色の組を結ぶ線分への当該画素の色からの距離を計算する(ステップ302)。更に、対応主要色判定部30は、当該距離が最小となる主要色の組を選出し、当該主要色の組を当該画素が属する前景・背景色の組とする(ステップ304)。
【0042】
多値画像生成部40は、対応主要色判定部30により得られた各画素に対する前景・背景色に基づき、色空間において、当該画素の色を当該前景・背景色に対応する2主要色を結ぶ線分へ投影した点と当該2主要色との距離関係により当該2主要色に関する多値画像の各画素値を求めることにより、主要色抽出部20が抽出したその各主要色に対応する各多値画像を生成する(ステップ400)。
【0043】
最後に、多値パターン認識部50は、多値画像生成部40が生成した各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する(ステップ500)。
【0044】
次に、具体的な実施例を用いて本実施の形態の動作を説明する。図3は、本実施の形態の処理対象のカラー画像の一具体例を示す図である。ここでは、カラー画像入力部10において、図3に示すような認識対象のカラー画像(この図3では白黒画像で表現している)が入力された場合を考える。
【0045】
図3の例のカラー画像においては、主に4つの色が使用されているのであり、図4においては、図3における主要な4つの色のそれぞれの領域をそれぞれ黒色で示している。ここで、その各領域に対応する色をそれぞれC1,C2,C3,C4とする(本実施例では、色はRGBで表現されているとする)。ただし、画像の細部を拡大表示してみると、図5に示すように(図5では図3の「日」の左側を拡大表示している)、各領域の境界部分(エッジ部)では、各色が混合した混合色が存在している。
【0046】
まず、主要色抽出部20は、カラー画像の各画素の色の頻度分布を計算する(ステップ200)。図6に、色の頻度を画素数で表現し頻度の高い順に並べた例を示す(C5以下は例えばC1〜C4の混合色である)。
【0047】
ここで、頻度分布を計算する際に、例えばRGBのそれぞれが8ビットで表現されている場合は、ノイズ等により色が少し変化しても違う色と判断されてしまうため、例えばRGBそれぞれを4ビットで表現するように色空間の表現精度を落としてから頻度分布を計算してもよい。
【0048】
次に、当該色の頻度分布を基に、出現頻度の高い複数の色を主要色として抽出する(ステップ202)。例えば、主要色を抽出するための頻度(画素数)の閾値ThをTh=100とすると、図6に示す頻度分布の結果よりC1〜C4の4色が主要色として抽出される。ここで、閾値Thは、予め設定されているか、画像中の画素数との比率により自動的に設定される。
【0049】
対応主要色判定部30は、カラー画像の各画素に対して、主要色抽出部20が抽出した主要色(C1〜C4の4色)の中から、当該画素の近隣に存在する主要色を選出する(ステップ300)。例えば、図7に示す画素pに対しては近隣にはC1,C2,C4の3つの主要色が存在する。ここで、画素pの近隣を表す領域とは、画素pからの距離が閾値Td以下の画素qの集合とする。画素pと画素qの距離M(p,q)は、例えばユークリッド距離や市街区距離などを使用する。
【0050】
次に、選出された主要色C1,C2,C4を用い、当該主要色の各組(C1,C2)、(C2,C4)、(C4,C1)に対して、色空間において当該主要色の組を結ぶ線分への当該画素pの色Cpからの距離を計算する(ステップ302)。
【0051】
図8は、RGB色空間における画素pの色Cpと各主要色の組を結ぶ線分との関係を図示している。RGB空間において点Cp(k)(k=R,G,B)を2点Ci(k)とCj(k)を結ぶ直線に射影した点をCp'(k)とすると、Cp'(k)=Ci(k)+t×(Cj(k)−Ci(k))という関係が成り立ち、tは下式により求まる。
【0052】
t=Σk(Cj(k)−Ci(k))×(Cp(k)−Ci(k))/Σk(Cj(k)−Ci(k))2
ここで、Σkはk=R,G,Bに関する総和を意味する。
【0053】
従って、点Cp(k)から2点Ci(k)とCj(k)を結ぶ線分へ距離D(Cp,Ci,Cj)は、点Cp(k)と点Cp'(k)の距離により求まる。ここで、距離には、例えばユークリッド距離や市街区距離などを使用する。ただし、点Cp'(k)が2点Ci(k)とCj(k)を結ぶ線分上に存在するためには、0≦t≦1である必要がある。従って、点Cp(k)と点Cp'(k)の距離の代わりに、t<0の場合は点Cp(k)と点Ci(k)の距離、t>1の場合は点Cp(k)と点Cj(k)の距離を用いてもよい。
【0054】
上述の方法により、主要色の各組(C1,C2)、(C2,C4)、(C4,C1)に対して、画素pの色Cpから各主要色を結ぶ線分への距離D(Cp,C1,C2)、D(Cp,C2,C4)、D(Cp,C4,C1)がそれぞれ求まる。
【0055】
次に、当該距離が最小となる主要色の組を選出し、当該主要色の組を当該画素pが属する前景・背景色の組とする(ステップ304)。本実施例ではD(Cp,C2,C4)が最小となるので、(C2,C4)の組が画素pの属する前景・背景色の組となる。
【0056】
また、図9に示す画素rに対しては近隣にはC2,C4の2つの主要色しか存在しないので、(C2,C4)の組が画素rの属する前景・背景色の組となる。ただし、最小となる距離が非常に大きい場合は、当該画素に関しては、前景・背景色は判定できなかったとしてもよい。この前景・背景色を判定する計算は、カラー画像の各画素に対して実施される。
【0057】
多値画像生成部40は、対応主要色判定部30により得られた各画素に対する前景・背景色に基づき、色空間において、当該画素の色を当該前景・背景色に対応する2主要色を結ぶ線分へ投影した点と当該2主要色との距離関係により当該2主要色に関する多値画像の各画素値を求めることにより、主要色抽出部20が抽出した各主要色に対応する各多値画像を生成する(ステップ400)。
【0058】
主要色Ciに対応する多値画像(主要色Ciが前景色と仮定した場合)は、例えばカラー画像の画素値が主要色Ciの時に多値画像の画素値が255、カラー画像の画素値がCi以外の主要色である時に多値画像の画素値が0になるように生成する。例えば、図7に示す画素pに対しては、前景・背景色に対応する2主要色は(C2,C4)であり、色空間において点Cp(k)をC2(k),C4(k)を結ぶ線分(またはC2(k),C4(k)を通る直線としてもよい)へ投影した点Cp’(k)と2主要色C2(k),C4(k)との位置関係は、
Cp’(k) =C2(k)+t×(C4(k)−C2(k))とすると、
Cp’(k)−C2(k)=t×(C4(k)−C2(k))、
Cp’(k)−C4(k)=(1−t)×(C2(k)−C4(k))となる。
【0059】
従って、主要色C2に対応する多値画像の画素pの画素値に[256×(1−t)]を代入、主要色C4に対応する多値画像の画素pの画素値には[256×t]を代入する(ただし、255以上の場合は255、0以下の場合は0とする)。ここで、記号[ ]は、ガウス記号(小数点以下を切り捨てて整数化する関数)を意味する。
【0060】
この処理を各画素に対して実行すると、図4のような主要色C1〜C4に対応した4つの多値画像が生成される(図4では黒色の部分が画素値255に、白色の部分が画素値0に対応する)。また、図4では明示されていないが、図10に一部を拡大して示すように、エッジ部分は0〜255の間のある中間的な画素値になっている。
【0061】
最後に、多値パターン認識部50は、多値画像生成部40が生成した各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する(ステップ500)。図4に示す4つの多値画像から文字を抽出し認識する場合、空間周波数や領域のサイズなど情報により、例えばC1,C2,C3に対応する多値画像内の領域は文字候補領域から除外され、C4の「日本」に対応する領域が抽出される(条件によってはC3の「●」に対応する領域も抽出される場合もある)。抽出されたC4における領域は、文字認識により「日本」と認識され、最終的に図3に示したカラー画像内に「日本」という文字列が存在したことがわかる。
【0062】
以上説明したように、本実施の形態によれば、各画素に対して、当該画素が属する前景・背景色を主要色の中から判定し、各主要色への距離に基づき多値画像を生成することができる。このため、背景色の複雑な画像に対しても、任意の前景色のパターンを抽出しつつ、当該パターンに属する度合いを多値画素値として表現した多値画像を生成でき、当該多値画像をパターン認識することにより低解像度でかつ背景色の複雑な画像に対しても高精度に認識を行うことができる。
【0063】
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。
【0064】
図11は、本発明の第2の実施の形態によるパターン認識装置100aの構成を示すプロック図である。図11を参照すると、本実施の形態のパターン認識装置100aは、カラー画像入力部10、主要色抽出部20、対応主要色判定部30、多値画像生成部40、多値画像指定部65、多値パターン認識部55を備えている。これらの各部は、それぞれ概略次のような機能を備える。
【0065】
カラー画像入力部10と、主要色抽出部20と、対応主要色判定部30と、多値画像生成部40は、図1に示した第1の実施の形態における処理と同一の処理を実行する。
【0066】
多値画像指定部65は、多値画像生成部40が生成した各多値画像をディスプレイ等の表示装置を用いて利用者に表示する。利用者は、認識させたいパターンを含む多値画像をマウス等の入力手段を用いて指定し、多値画像指定部65は、その多値画像の指定を受け付ける。
【0067】
多値パターン認識部55は、多値画像指定部65により指定された多値画像を多値画像生成部40から取得し、当該多値画像に対して認識すべきパターンを抽出しパターン認識を実行する。
【0068】
次に、本実施の形態の全体の動作について、図面を参照して詳細に説明する。図12は、本実施の形態によるパターン認識の動作を説明するためのフローチャートである。図12を参照すると、ステップ200と、ステップ202と、ステップ300と、ステップ302と、ステップ304と、ステップ400は、図2のフローチャートに示した第1の実施の形態における動作と同一である。
【0069】
本実施の形態においては、ステップ400における各主要色の多値画像の生成後、多値画像指定部65が、多値画像生成部40が生成した各多値画像をディスプレイ等の表示装置を用いて利用者に表示する(ステップ650)。利用者は、認識させたいパターンを含む多値画像を、マウス等を用いて指定し、多値画像指定部65がその多値画像の指定を受け付ける(ステップ652)。多値パターン認識部55は、多値画像指定部65において指定された多値画像を多値画像生成部40から取得し、当該多値画像に対して認識すべきパターンを抽出しパターン認識を実行する(ステップ550)。
【0070】
次に、具体的な実施例を用いて本実施の形態の動作を説明する。ここでは、カラー画像入力部10において、図3に示すような認識対象のカラー画像が入力された場合を考える。
【0071】
まず、第1の実施の形態の動作と同じ処理により、主要色抽出部20、対応主要色判定部30、多値画像生成部40により、図4に示すような主要色C1〜C4に対する4つの多値画像が生成される(ステップ200、ステップ202、ステップ300、ステップ302、ステップ304、ステップ400)。
【0072】
多値画像指定部65は、多値画像生成部40により生成された各多値画像(図4)を、ディスプレイ等の表示装置を用いて利用者に表示する(ステップ650)。利用者は、認識させたいパターンを含む多値画像を、マウス等の入力手段を用いて指定する(ステップ652)。例えば、「日本」を認識させたい場合は、「日本」を含む主要色C4の多値画像を指定する。
【0073】
多値パターン認識部55は、多値画像指定部65において指定された主要色C4に対応する多値画像を多値画像生成部40から取得し、当該多値画像に対して認識すべきパターンを抽出しパターン認識を実行する(ステップ550)。
【0074】
文字を抽出し認識する場合、C4の「日本」に対応する領域のみが正しく抽出され認識される。またこのようにして、第1の実施の形態と異なり、認識処理の不要なC3の「●」の領域が認識処理の対象に含まれてしまうことを回避できる。
【0075】
以上説明したように、本実施の形態によれば、多値画像指定部65において利用者が認識させたいパターンを含む多値画像を指定できるというように構成されているため、必要なパターンのみを的確に抽出し、高精度にパターンを認識することができる。
【0076】
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。
【0077】
図13は、本発明の第3の実施の形態によるパターン認識装置100bの構成を示すブロック図である。図13を参照すると、本実施の形態のパターン認識装置100bは、カラー画像入力部10、主要色抽出部20、抽出条件変更部25、対応主要色判定部30、多値画像生成部40、多値パターン認識部50を備えている。これらの各部は、それぞれ概略次のような機能を備える。
【0078】
カラー画像入力部10と、主要色抽出部20と、対応主要色判定部30と、多値画像生成部40と、多値パターン認識部50は、図1に示した第1の実施の形態における処理と同一の処理を実行する。
【0079】
抽出条件変更部25は、対応主要色判定部30において前景・背景色が判定できなかった画素が多数存在する場合において、主要色を抽出するための条件を変更する。
【0080】
次に、本実施の形態の全体の動作について、図面を参照して詳細に説明する。図14は、本実施の形態によるパターン認識の動作を説明するためのフローチャートである。図14を参照すると、ステップ200と、ステップ202と、ステップ300と、ステップ302と、ステップ304と、ステップ400と、ステップ500は、図2に示した第1の実施の形態における動作と同一である。
【0081】
本実施の形態においては、ステップ304における当該画素が属する前景・背景色の組の選出後、抽出条件変更部25は、対応主要色判定部30において前景・背景色が判定できなかった画素数Nを計数し(ステップ250)、画素数Nを閾値Tnと比較し(ステップ252)、画素数Nが大きい場合は、主要色抽出のための条件を変更し(ステップ254)、主要色抽出部20(ステップ202)に進む。一方、画素数Nが小さい場合は、多値画像生成部40(ステップ400)に進む。
【0082】
次に、具体的な実施例を用いて本実施の形態の動作を説明する。ここでは、カラー画像入力部10において、図3に示すような認識対象のカラー画像が入力された場合を考える。
【0083】
主要色抽出部20は、カラー画像の各画素の色の頻度分布を計算し(ステップ200)、図6に示すような色の頻度分布が算出される。次に、当該色の頻度分布を基に、出現頻度の高い複数の色を主要色として抽出する(ステップ202)。ここで、主要色を抽出するための頻度(画素数)の閾値Thを最初はTh=200とすると、図6に示す頻度分布の結果によりC1〜C3の3色が主要色として抽出される。
【0084】
対応主要色判定部30は、カラー画像の各画素に対して、主要色抽出部20が抽出した主要色(C1〜C3の3色)の中から、当該画素の近隣に存在する主要色を選出する(ステップ300)。例えば、図7に示す画素pに対しては近隣にはC1,C2の2つの主要色しか存在しない。
【0085】
次に、選出された主要色C1,C2を用い、当該主要色の組(C1,C2)に対して、色空間において当該主要色の組を結ぶ線分への当該画素pの色Cpからの距離D(Cp,C1,C2)を計算する(ステップ302)。
【0086】
しかし、画素pの色Cpは、本来C1とC2による混合色ではないため、図8に示すように距離D(Cp,C1,C2)は非常に大きくなる。従って、当該画素pに関しては、前景・背景色は判定できなかったと判定される(ステップ304)。また、例えば、図9に示す画素rに対しては近隣には主要色はC2の1つしか存在しないため、この場合も前景・背景色を判定することはできない。
【0087】
抽出条件変更部25は、対応主要色判定部30において前景・背景色が判定できなかった画素数Nを計数する(ステップ250)。例えば、前景・背景色が判定できなかった画素数NがN=100存在し、閾値TnがTn=50である場合、NとTnを比較すると(ステップ252)、N>Tnであるため、抽出条件変更部25は主要色抽出のための条件として主要色の頻度(画素数)の閾値ThをTh=100に変更し(ステップ254)、主要色抽出部20(ステップ202)に進む。
【0088】
主要色抽出部20は、主要色を抽出するための頻度(画素数)の閾値ThをTh=100として、図6に示す頻度分布の結果よりC1〜C4の4色を主要色として抽出する。対応主要色判定部30は、カラー画像の各画素に対して、主要色抽出部20が抽出した主要色(C1〜C4の4色)の中から、当該画素の近隣に存在する主要色を選出する(ステップ300)。
【0089】
例えば、図7に示す画素pに対しては近隣にはC1,C2,C4の3つの主要色が存在し、当該主要色の各組(C1,C2)、(C2,C4)、(C4,C1)に対して、色空間において当該主要色の組を結ぶ線分への当該画素pの色Cpからの距離距離D(Cp,C1,C2)、D(Cp,C2,C4)、D(Cp,C4,C1)を計算する(ステップ302)。
【0090】
次に、当該距離が最小となる主要色の組(C2,C4)を選出し、当該主要色の組を当該画素pが属する前景・背景色の組とする(ステップ304)。抽出条件変更部25は、対応主要色判定部30において前景・背景色が判定できなかった画素数Nを計数する(ステップ250)。
【0091】
例えば、前景・背景色が判定できなかった画素数NがN=10存在し、閾値TnがTn=50である場合、NとTnを比較すると(ステップ252)、N<Tnであるため、多値画像生成部40(ステップ400)に進む。
【0092】
以上説明したように、本実施の形態によれば、対応主要色判定部30において、もし前景・背景色が判定できなかった画素が多数存在する場合には、主要色を抽出するための条件を変更することができる。このため、主要色の抽出漏れをなくし、高精度にパターンを抽出し認識することができる。
【0093】
次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。
【0094】
図15は、本発明の第4の実施の形態によるパターン認識装置100cの構成を示すブロック図である。図15を参照すると、本実施の形態のパターン認識装置100cは、カラー画像入力部10、前景色指定部60、主要色抽出部20、対応主要色判定部35、多値画像生成部45、多値パターン認識部55を備えている。これらの各部は、それぞれ概略次のような機能を備える。
【0095】
カラー画像入力部10と、主要色抽出部20は、図1に示した第1の実施の形態における処理と同一の処理を実行する。
【0096】
前景色指定部60は、カラー画像入力部10により取得されたカラー画像をディスプレイ等の表示装置を用いて利用者に表示する。そして、利用者が認識させたいパターン部分をマウス等の入力手段を用いて指定することにより、前景色指定部60はパターンの前景色を取得する。
【0097】
対応主要色判定部35は、カラー画像入力部10により取得されたカラー画像の各画素に対して、前景色指定部60において指定された前景色と、主要色抽出部20が抽出した主要色を用い、当該主要色の中から当該画素の色が属する前景・背景色の組を判定する。
【0098】
多値画像生成部45は、前景色指定部60において指定された前景色と、対応主要色判定部35により取得した各画素に対する背景色に基づき、指定されたの前景色に対応する多値画像の各画素値を、当該画素の色と当該前景・背景色との距離関係により求め、多値画像を生成する。
【0099】
多値パターン認識部55は、多値画像生成部45が生成した多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する。
【0100】
次に、本実施の形態の全体の動作について、図面を参照して詳細に説明する。図16は、本実施の形態によるパターン認識の動作を説明するためのフローチャートである。図16を参照すると、ステップ200と、ステップ202と、ステップ300と、ステップ302と、ステップ304は、図2に示した第1の実施の形態における動作と同一である。
【0101】
まず始めに、カラー画像入力部10により取得したカラー画像は、前景色指定部60においてディスプレイ等の表示装置を用いて利用者に表示される(ステップ600)。利用者は認識させたいパターンの部分をマウス等の入力手段を用いて指定し、パターンの前景色を指定する(ステップ602)。
【0102】
次に、カラー画像入力部10により取得したカラー画像は主要色抽出部20に供給され、主要色抽出部20は、カラー画像の各画素の色の頻度分布を計算する(ステップ200)。更に、当該色の頻度分布を基に、出現頻度の高い色を主要色として抽出する(ステップ202)。
【0103】
対応主要色判定部35は、カラー画像入力部10により取得したカラー画像の各画素に対して、主要色抽出部20が抽出した主要色の中から、当該画素の近隣に存在する主要色を選出する(ステップ300)。
【0104】
次に、選出された主要色に対して、前景色指定部60において指定された前景色を含むように当該主要色の組を限定する(ステップ350)。更に、選出された主要色を用い、色空間において当該主要色との組を結ぶ線分への当該画素の色からの距離を計算する(ステップ302)。更に、当該距離が最小となる主要色の組を選出し、当該主要色の組を当該画素が属する前景・背景色の組とする(ステップ304)。
【0105】
多値画像生成部45は、前景色指定部60において指定された前景色、対応主要色判定部35より得られた各画素に対する背景色に基づき、指定された前景色に対応する多値画像の各画素値を当該画素の色と当該前景・背景色との距離関係により求め、多値画像を生成する(ステップ450)。
【0106】
最後に、多値パターン認識部55は、多値画像生成部45により生成された多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する(ステップ550)。
【0107】
次に、具体的な実施例を用いて本実施の形態の動作を説明する。ここでは、カラー画像入力部10において、図3に示すような認識対象のカラー画像が入力された場合を考える。
【0108】
まず、前景色指定部60において、ディスプレイを用いて当該カラー画像が利用者に表示される(ステップ600)。利用者は、例えば「日本」という文字を認識させたい場合、「日本」の文字部分(色がC4の部分)の1点をマウス等の入力手段を用いて指定し、文字の前景色C4を指定する(ステップ602)。
【0109】
次に、主要色抽出部20は、カラー画像の各画素の色の頻度分布を計算し、図6に示すような色の頻度分布を算出する(ステップ200)。更に、当該色の頻度分布を基に、出現頻度の高い色を主要色として抽出する(ステップ202)。例えば、主要色を抽出するための頻度(画素数)の閾値ThをTh=100とすると、図6に示す頻度分布の結果よりC1〜C4の4色が主要色として抽出される。
【0110】
対応主要色判定部35は、カラー画像の各画素に対して、主要色抽出部20が抽出した主要色(C1〜C4の4色)の中から、当該画素の近隣に存在する主要色を選出する(ステップ300)。例えば、図7に示す画素pに対しては、近隣にはC1,C2,C4の3つの主要色が存在する。
【0111】
次に、主要色C4は、前景色指定部60において指定された前景色であるので、主要色の組を(C4,C1)と(C4,C2)に限定する(ステップ350)。次に、選出された主要色の組を結ぶ線分への当該画素pの色Cpからの距離D(Cp,C4,C1)、D(Cp,C4,C2)を計算する(ステップ302)。更に、当該距離が最小となる前景色と主要色の組(C4,C2)を選出し、当該前景色と主要色の組を当該画素pが属する前景・背景色の組とする(ステップ304)。
【0112】
多値画像生成部45は、前景色指定部60において指定された前景色、対応主要色判定部35により得られた各画素に対する背景色に基づき、指定された前景色C4に対応する多値画像の各画素値を当該画素の色と当該前景・背景色との距離関係により求め、多値画像を生成する(ステップ450)。
【0113】
この処理を各画素に対して実行すると、図4における主要色C4に対応した1つの多値画像が生成される。最後に、多値パターン認識部55は、多値画像生成部45が生成したC4に対応した多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する(ステップ550)。文字を抽出し認識する場合、C4の「日本」に対応する領域のみが抽出され認識される。
【0114】
以上説明したように、本実施の形態によれば、前景色指定部60において利用者が認識させたいパターンの前景色を指定することができる。このため、必要なパターンのみを的確に抽出し、高精度にパターンを認識することができる。
【0115】
次に、本発明のその他の実施の形態を説明する。
【0116】
第1〜第4の実施の形態において、画像の色空間はRGB空間としたが、他の色空間(例えば、CMYK、HSI、Lab等の色空間)を使用することも同様に実施することができる。
【0117】
また、主要色抽出部20において、上記各実施の形態においては、色の頻度分布を画像全体で集計し、主要色を抽出するための頻度(画素数)の閾値Thを用いて主要色を抽出したが、画像の局所的な領域で集計し主要色を抽出する方法も同様に実施することができる。パターンは局所的な領域に集中していることが多く、画像全体ではパターンの前景色の頻度は低く、必要な主要色が抽出されない場合がある。このため、局所的な領域で集計する方式を採用することにより、必要な主要色をより抽出することができる。
【0118】
また、対応主要色判定部30、35において、上記各実施の形態においては、各画素に対して距離の閾値Tdを用いて近隣の主要色を選出するようにしたが、その閾値Tdの値を可変としてもよい。閾値Tdが小さい場合には、近隣に必要な主要色が見つからない場合が多くなる。ここで、閾値を可変とすることにより、近隣の主要色が見つからない場合には、必要な個数の主要色が見つかるまで自動的に順次閾値を大きくして探すことができる。
【0119】
また、選択された主要色の各組に対して、上記各実施の形態においては、色空間において各画素の色からの距離を計算し最も近い前景・背景色の組を選出したが、色空間における距離だけでなく、画像中の座標空間における画素と近隣の主要色の画素との距離も加えて距離を計算する方式も、同様にして実施することができる。
【0120】
例えば、主要色の組をCi、Cjとし、画像中で画素pに最も近い主要色Ci、Cjを持つ画素をi、jとした場合に、距離の総和Eを、E=a×D(Cp,Ci,Cj)+b×(M(p,i)+M(p,j))と算出することができる(ここで、a、bは重み係数)。更にここで、画素と近隣の2主要色の画素との位置関係(直線性)を、コストとして距離に加えてもよい。
【0121】
第2の実施の形態においては、多値画像指定部65において指定する対象は、多値画像としたが、認識させたいパターンを含む多値画像の一部を指定する方式も同様に実施することができる。
【0122】
第4の実施の形態においては、前景色指定部60において指定する対象は、認識させたいパターンの1点(その点の色)としたが、更に認識させたいパターンを含む領域を指定する方式も同様に実施することができる。
【0123】
また、上記各実施の形態においては、最初に、認識対象のカラー画像から複数の主要色を抽出している。つまり、その抽出された主要色を2個づつ組にし、色空間上でその2個の主要色が成す線分と、カラー画像の各画素の色とが成す距離を用いて、各画素の画素値を算出し多値画像を生成するのであった。しかし、本発明では、複数の主要色の抽出を必ずしも必要とするものではなく、例えば、主要色が1つしか抽出できなかった場合に、その1つの主要色とカラー画像の各画素の色とが色空間上で成す距離を用いて、上記各実施の形態と同様にして、各画素の画素値を算出し多値画像を生成する機能を更に備えるものとしてもよい。
【0124】
なお、上記各実施の形態のカラー画像のパターン認識装置100、100a、100b、100cは、カラー画像入力部10、主要色抽出部20、抽出条件変更部25、対応主要色判定部30、35、多値画像生成部40、45、多値パターン認識部50、55、前景色指定部60、多値画像指定部65、色分布分割部70、明度画像生成部75、二値画像生成部80、85、二値パターン認識部90、95の機能や、その他の機能をハードウェア的に実現することは勿論として、各機能を備えるコンピュータプログラムであるパターン認識プログラムを、コンピュータ処理装置のメモリにロードされることで実現することができる。このパターン認識プログラムは、磁気ディスク、半導体メモリその他の記録媒体200、200a、200b、200cに格納される。そして、その記録媒体からコンピュータ処理装置にロードされ、コンピュータ処理装置の動作を制御することにより、上述した各機能を実現する。
【0125】
以上好ましい実施の形態及び実施例をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び実施例に限定されるものではなく、その技術的思想の範囲内において様々に変形して実施することができる。
【0126】
【発明の効果】
以上説明したように本発明のパターン認識装置によれば、以下のような効果が達成される。
【0127】
第1に、本発明によれば、低解像度でかつ背景色の複雑な画像に対しても高精度にパターン認識を行うことができる。その理由は、各画素に対して、当該画素が属する前景・背景色を判定し、各主要色への色空間における距離関係に基づき多値画像を生成するため、背景色の複雑な画像に対しても、任意の前景色のパターンを抽出しつつ、当該パターンに属する度合いを多値画素値として表現した多値画像を生成でき、更にその生成された多値画像を用いて当該多値画像をパターン認識するためである。また、主要色を抽出するための条件を変更することができるため、主要色の抽出漏れをなくし、高精度にパターンを抽出し認識できるためである。
【0128】
第2に、本発明によれば、認識させたい必要なパターンのみが的確に抽出され高精度にパターンを認識できる。その理由は、利用者が認識させたいパターンの前景色を指定したり、認識させたいパターンを含む多値画像を指定できるからである。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態によるパターン認識装置の構成を示すブロック図である。
【図2】 本発明の第1の実施の形態によるパターン認識の動作を説明するためのフローチャートである。
【図3】 本発明の第1の実施の形態の処理対象のカラー画像の一具体例を示す図である。
【図4】 本発明の第1の実施の形態の多値画像生成部が、図3の例のカラー画像から生成した多値画像の一具体例を示す図である。
【図5】 本発明の第1の実施の形態の処理対象のカラー画像の細部の一具体例を示す図である。
【図6】 本発明の第1の実施の形態の主要色抽出部が算出した色の頻度分布の一具体例を示す図である。
【図7】 本発明の第1の実施の形態の処理対象のカラー画像の細部の一具体例を示す図である。
【図8】 本発明の第1の実施の形態の対応主要色判定部によるRGB色空間における画素の色と各主要色の組を結ぶ線分との関係を示す図である。
【図9】 本発明の第1の実施の形態の処理対象のカラー画像の細部の一具体例を示す図である。
【図10】 本発明の第1の実施の形態の多値画像生成部が生成した多値画像の、細部の一具体例を示す図である。
【図11】 本発明の第2の実施の形態によるパターン認識装置の構成を示すプロック図である。
【図12】 本発明の第2の実施の形態によるパターン認識の動作を説明するためのフローチャートである。
【図13】 本発明の第3の実施の形態によるパターン認識装置の構成を示すブロック図である。
【図14】 本発明の第3の実施の形態によるパターン認識の動作を説明するためのフローチャートである。
【図15】 本発明の第4の実施の形態によるパターン認識装置の構成を示すブロック図である。
【図16】 本発明の第4の実施の形態によるパターン認識の動作を説明するためのフローチャートである。
【図17】 第1の従来技術の実施の形態の構成を示すブロック図である。
【図18】 第2の従来技術の実施の形態の構成を示すブロック図である。
【符号の説明】
100、100a、100b、100c パターン認識装置
10 カラー画像入力部
20 主要色抽出部
25 抽出条件変更部
30、35 対応主要色判定部
40、45 多値画像生成部
50、55 多値パターン認識部
60 前景色指定部
65 多値画像指定部
70 色分布分割部
75 明度画像生成部
80、85 二値画像生成部
90、95 二値パターン認識部
200、200a、200b、200c 記録媒体

Claims (18)

  1. カラー画像の各画素の色情報を基に、当該カラー画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出手段と、
    前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定する対応主要色判定手段と、
    当該画素の前記前景・背景色を成す2つの前記主要色の組が判定された場合に、所定の色空間において、前記カラー画像の各画素の色を、当該画素の前記前景・背景色として判定された2つの前記主要色を結ぶ線分へ投影し、当該投影した点と、2つの前記主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成手段と、
    各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識手段を備え
    前記対応主要色判定手段は、
    前記カラー画像の各画素に対して、前記色空間における各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の色からの距離を計算し、当該線分又は前記主要色への距離が最小となる前記主要色の組を前記前景・背景色として選出することを特徴とするパターン認識装置。
  2. カラー画像の各画素の色情報を基に、当該カラー画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出手段と、
    前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定する対応主要色判定手段と、
    当該画素の前記前景・背景色を成す2つの前記主要色の組が判定された場合に、所定の色空間において、前記カラー画像の各画素の色を、当該画素の前記前景・背景色として判定された2つの前記主要色を結ぶ線分へ投影し、当該投影した点と、2つの前記主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成手段と、
    各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識手段を備え、
    前記対応主要色判定手段は、
    前記カラー画像の各画素に対して、当該カラー画像中の当該画素の周りの予め定められた範囲内に存在する前記主要色を検出し、
    前記主要色が2つの場合は、検出された各前記主要色を前記前景・背景色とし、
    前記主要色が3つ以上の場合は、前記色空間における、検出された各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の色からの距離を計算し、当該線分又は前記主要色への距離が最小となる前記主要色の組を前記前景・背景色として選出することを特徴とするパターン認識装置。
  3. カラー画像の各画素の色情報を基に、当該カラー画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出手段と、
    前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定する対応主要色判定手段と、
    当該画素の前記前景・背景色を成す2つの前記主要色の組が判定された場合に、所定の色空間において、前記カラー画像の各画素の色を、当該画素の前記前景・背景色として判定された2つの前記主要色を結ぶ線分へ投影し、当該投影した点と、2つの前記主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成手段と、
    各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識手段を備え、
    前記対応主要色判定手段は、
    前記カラー画像の各画素に対して、前記色空間における各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の色からの色空間上の距離を算出し、当該カラー画像中における各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の位置からの画像中の距離を算出し、前記色空間上の距離と前記画像中の距離との和が最小となる前記主要色の組を、前景・背景色として選出することを特徴とするパターン認識装置
  4. 前記対応主要色判定手段で、前景・背景色を成す2つの前記主要色が判定できなかった画素が予め定められた量を超える場合に、前記主要色抽出手段において設定されている前記閾値を変更し、前記主要色抽出手段による前記主要色の抽出処理を再実行させる抽出条件変更手段を備えることを特徴とする請求項1から請求項3のいずれか1つに記載のパターン認識装置
  5. 前記生成された多値画像の中から、パターン認識の対象であるパターンを含む多値画像の、利用者の操作による指定を受け付ける多値画像指定手段を備え、
    前記指定された多値画像に対して認識すべきパターンを抽出しパターン認識を実行することを特徴とする請求項1から請求項4のいずれか1つに記載のパターン認識装置
  6. 前記カラー画像中の、パターン認識の対象であるパターンが示される部分の、利用者の操作による前景色の指定を受け付ける前景色指定手段を備え、
    前記対応主要色判定手段が、
    前記前景色指定手段で指定された前景色と、前記主要色抽出手段で抽出された主要色を用いて、前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定することを特徴とする請求項1から請求項5のいずれか1つに記載のパターン認識装置
  7. カラー画像の各画素の色情報を基に、当該カラー画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出ステップと、
    前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定する対応主要色判定ステップと、
    当該画素の前記前景・背景色を成す2つの前記主要色の組が判定された場合に、所定の色空間において、前記カラー画像の各画素の色を、当該画素の前記前景・背景色として判定された2つの前記主要色を結ぶ線分へ投影し、当該投影した点と、2つの前記主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成ステップと、
    各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識ステップを備え、
    前記対応主要色判定ステップで、
    前記カラー画像の各画素に対して、前記色空間における各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の色からの距離を計算し、当該線分又は前記主要色への距離が最小となる前記主要色の組を前記前景・背景色として選出することを特徴とするパターン認識方法
  8. カラー画像の各画素の色情報を基に、当該カラー画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出ステップと、
    前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定する対応主要色判定ステップと、
    当該画素の前記前景・背景色を成す2つの前記主要色の組が判定された場合に、所定の色空間において、前記カラー画像の各画素の色を、当該画素の前記前景・背景色として判定された2つの前記主要色を結ぶ線分へ投影し、当該投影した点と、2つの前記主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成ステップと、
    各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識ステップを備え、
    前記対応主要色判定ステップで、
    前記カラー画像の各画素に対して、当該カラー画像中の当該画素の周りの予め定められた範囲内に存在する前記主要色を検出し、
    前記主要色が2つの場合は、検出された各前記主要色を前記前景・背景色とし、
    前記主要色が3つ以上の場合は、前記色空間における、検出された各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の色からの距離を計算し、当該線分又は前記主要色への距離が最小となる前記主要色の組を前記前景・背景色として選出することを特徴とするパターン認識方法
  9. カラー画像の各画素の色情報を基に、当該カラー画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出ステップと、
    前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定する対応主要色判定ステップと、
    当該画素の前記前景・背景色を成す2つの前記主要色の組が判定された場合に、所定の色空間において、前記カラー画像の各画素の色を、当該画素の前記前景・背景色として判定された2つの前記主要色を結ぶ線分へ投影し、当該投影した点と、2つの前記主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成ステップと、
    各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識ステップを備え、
    前記対応主要色判定ステップで、
    前記カラー画像の各画素に対して、前記色空間における各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の色からの色空間上の距離を算出し、当該カラー画像中における各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の位置からの画像中の距離を算出し、前記色空間上の距離と前記画像中の距離との和が最小となる前記主要色の組を、前景・背景色として選出することを特徴とするパターン認識方法
  10. 前記対応主要色判定ステップで、前景・背景色を成す2つの前記主要色が判定できなかった画素が予め定められた量を超える場合に、前記主要色抽出ステップにおいて設定されている前記閾値を変更し、前記主要色抽出ステップによる前記主要色の抽出処理を再実行させる抽出条件変更ステップを備えることを特徴とする請求項7から請求項9のいずれか1つに記載のパターン認識方法
  11. 前記生成された多値画像の中から、パターン認識の対象であるパターンを含む多値画像の、利用者の操作による指定を受け付ける多値画像指定ステップを備え、
    前記指定された多値画像に対して認識すべきパターンを抽出しパターン認識を実行することを特徴とする請求項7から請求項10のいずれか1つに記載のパターン認識方法
  12. 前記カラー画像中の、パターン認識の対象であるパターンが示される部分の、利用者の操作による前景色の指定を受け付ける前景色指定ステップを備え、
    前記対応主要色判定ステップで、
    前記前景色指定ステップで指定された前景色と、前記主要色抽出ステップで抽出された主要色を用いて、前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定することを特徴とする請求項7から請求項11のいずれか1つに記載のパターン認識方法
  13. コンピュータを制御することにより、カラー画像のパターン認識を行なうパターン認識プログラムにおいて、
    カラー画像の各画素の色情報を基に、当該カラー画像画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出処理と、
    前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定する対応主要色判定処理と、
    当該画素の前記前景・背景色を成す2つの前記主要色の組が判定された場合に、所定の色空間において、前記カラー画像の各画素の色を、当該画素の前記前景・背景色として判定された2つの前記主要色を結ぶ線分へ投影し、当該投影した点と、2つの前記主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成処理と、
    各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識処理を実行させ、
    前記対応主要色判定処理で、
    前記カラー画像の各画素に対して、前記色空間における各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の色からの距離を計算し、当該線分又は前記主要色への距離が最小となる前記主要色の組を前記前景・背景色として選出する処理を実行させることを特徴とするパターン認識プログラム
  14. コンピュータを制御することにより、カラー画像のパターン認識を行なうパターン認識プログラムにおいて、
    カラー画像の各画素の色情報を基に、当該カラー画像画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出処理と、
    前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定する対応主要色判定処理と、
    当該画素の前記前景・背景色を成す2つの前記主要色の組が判定された場合に、所定の色空間において、前記カラー画像の各画素の色を、当該画素の前記前景・背景色として判定された2つの前記主要色を結ぶ線分へ投影し、当該投影した点と、2つの前記主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成処理と、
    各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識処理を実行させ、
    前記対応主要色判定処理で、
    前記カラー画像の各画素に対して、当該カラー画像中の当該画素の周りの予め定められた範囲内に存在する前記主要色を検出し、
    前記主要色が2つの場合は、検出された各前記主要色を前記前景・背景色とし、
    前記主要色が3つ以上の場合は、前記色空間における、検出された各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の色からの距離を計算し、当該線分又は前記主要色への距離が最小となる前記主要色の組を前記前景・背景色として選出する処理を実行させることを特徴とするパターン認識プログラム
  15. コンピュータを制御することにより、カラー画像のパターン認識を行なうパターン認識プログラムにおいて、
    カラー画像の各画素の色情報を基に、当該カラー画像画像画像中で出現頻度が所定の閾値以上である主要色を抽出する主要色抽出処理と、
    前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定する対応主要色判定処理と、
    当該画素の前記前景・背景色を成す2つの前記主要色の組が判定された場合に、所定の色空間において、前記カラー画像の各画素の色を、当該画素の前記前景・背景色として判定された2つの前記主要色を結ぶ線分へ投影し、当該投影した点と、2つの前記主要色との距離に応じて、当該2主要色それぞれの多値画像の各画素値を決定し、各主要色に対応する各多値画像を生成する多値画像生成処理と、
    各多値画像に対して、認識すべきパターンを抽出しパターン認識を実行する多値パターン認識処理を実行させ、
    前記対応主要色判定処理で、
    前記カラー画像の各画素に対して、前記色空間における各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の色からの色空間上の距離を算出し、当該カラー画像中における各前記主要色の2つを結ぶ線分又は前記主要色への当該画素の位置からの画像中の距離を算出し、前記色空間上の距離と前記画像中の距離との和が最小となる前記主要色の組を、前景・背景色として選出する処理を実行させることを特徴とするパターン認識プログラム
  16. 前記対応主要色判定処理で、前前景・背景色を成す2つの前記主要色が判定できなかった画素が予め定められた量を超える場合に、前記主要色抽出処理において設定されている前記閾値を変更し、前記主要色抽出処理による前記主要色の抽出処理を再実行させる抽出条件変更処理を実行させることを特徴とする請求項13から請求項15のいずれか1つに記載のパターン認識プログラム
  17. 前記生成された多値画像の中から、パターン認識の対象であるパターンを含む多値画像の、利用者の操作による指定を受け付ける多値画像指定処理と、
    前記指定された多値画像に対するパターン認識処理を実行させることを特徴とする請求項13から請求項16のいずれか1つに記載のパターン認識プログラム
  18. 前記カラー画像中の、パターン認識の対象であるパターンが示される部分の、利用者の操作による前景色の指定を受け付ける前景色指定処理を備え、
    前記対応主要色判定処理で、
    前記前景色指定処理で指定された前景色と、前記主要色抽出処理で抽出された主要色を用いて、前記カラー画像の各画素に対して、当該画素の前景・背景色を成す2つの前記主要色を判定することを特徴とする請求項13から請求項17のいずれか1つに記載のパターン認識プログラム
JP2001201953A 2001-07-03 2001-07-03 パターン認識装置とそのパターン認識方法、及びパターン認識プログラム Expired - Fee Related JP4756436B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001201953A JP4756436B2 (ja) 2001-07-03 2001-07-03 パターン認識装置とそのパターン認識方法、及びパターン認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001201953A JP4756436B2 (ja) 2001-07-03 2001-07-03 パターン認識装置とそのパターン認識方法、及びパターン認識プログラム

Publications (2)

Publication Number Publication Date
JP2003016444A JP2003016444A (ja) 2003-01-17
JP4756436B2 true JP4756436B2 (ja) 2011-08-24

Family

ID=19038841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001201953A Expired - Fee Related JP4756436B2 (ja) 2001-07-03 2001-07-03 パターン認識装置とそのパターン認識方法、及びパターン認識プログラム

Country Status (1)

Country Link
JP (1) JP4756436B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036517B (zh) * 2014-07-01 2017-02-15 成都品果科技有限公司 一种基于梯度采样的图像抠图方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4394692B2 (ja) 2004-09-17 2010-01-06 中部日本電気ソフトウェア株式会社 図形読み取り装置及び方法並びにそのプログラム
JP4495606B2 (ja) * 2005-01-19 2010-07-07 日本放送協会 色識別装置及び色識別プログラム
JP4315209B2 (ja) 2007-03-26 2009-08-19 村田機械株式会社 画像処理装置および地色検出方法
US8014596B2 (en) * 2007-10-30 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for background color extrapolation
JP5028337B2 (ja) * 2008-05-30 2012-09-19 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP6056309B2 (ja) * 2012-09-18 2017-01-11 富士通株式会社 画像処理装置、画像処理方法及びプログラム
CN110827287B (zh) * 2018-08-14 2023-06-23 阿里巴巴(上海)有限公司 确定背景色置信度和图像处理的方法、装置及设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3061812B2 (ja) * 1989-06-12 2000-07-10 日本電気株式会社 パターン認識方法および装置
JPH0514750A (ja) * 1990-10-16 1993-01-22 Sharp Corp 画像色分解装置
JPH05328142A (ja) * 1992-05-18 1993-12-10 Hitachi Ltd 画像データ圧縮方法および画像表示装置
JP3345350B2 (ja) * 1998-05-27 2002-11-18 富士通株式会社 文書画像認識装置、その方法、及び記録媒体
JP2000163516A (ja) * 1998-12-01 2000-06-16 Mitsubishi Electric Corp 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036517B (zh) * 2014-07-01 2017-02-15 成都品果科技有限公司 一种基于梯度采样的图像抠图方法

Also Published As

Publication number Publication date
JP2003016444A (ja) 2003-01-17

Similar Documents

Publication Publication Date Title
US8265350B2 (en) Method and apparatus for detecting and processing specific pattern from image
US8264500B2 (en) Image masks generated from local color models
EP0977151B1 (en) Image processing apparatus, image processing method, and storage medium
US8649599B2 (en) Image processing apparatus, image processing method, and program
US7149355B2 (en) Image processing apparatus, image processing method, image processing program, and computer-readable record medium storing image processing program
JP4772819B2 (ja) 画像検索装置および画像検索方法
JP4125273B2 (ja) 画像処理装置及びその方法、プログラム
US9792695B2 (en) Image processing apparatus, image processing method, image processing system, and non-transitory computer readable medium
CN116645592B (zh) 一种基于图像处理的裂缝检测方法和存储介质
US7885486B2 (en) Image processing system, method for processing image and computer readable medium
JP4756436B2 (ja) パターン認識装置とそのパターン認識方法、及びパターン認識プログラム
EP2782065A1 (en) Image-processing device removing encircling lines for identifying sub-regions of image
JP2008310817A (ja) テキストマップの中からライン構造を検出する方法および画像処理装置
US8837785B2 (en) Red-eye removal using multiple recognition channels
JP2008158847A (ja) 画像配信装置および画像配信方法
CN109242750B (zh) 图片签名方法、图片匹配方法、装置、设备及存储介质
US8786735B2 (en) Red-eye removal using multiple recognition channels
JP6711031B2 (ja) 画像処理装置、画像処理方法、画像処理システムおよびプログラム
JP7144384B2 (ja) オブジェクト検出装置、方法及びプログラム
JP2006050481A (ja) 画像処理装置、画像処理方法及びそのプログラム
CN111626935B (zh) 像素图缩放方法、游戏内容生成方法及装置
AU742875B2 (en) Method and apparatus for generating a distance image of an original image
JP2006050480A (ja) 画像処理装置、画像処理方法及びそのプログラム
JPWO2015083396A1 (ja) 画像処理装置及び画像処理方法
JP2010191931A (ja) 画像処理装置、画像形成装置、コンピュータプログラム、記録媒体及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080611

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110509

R150 Certificate of patent or registration of utility model

Ref document number: 4756436

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110522

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140610

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees