JP2004258749A - Method and device for clustering feature vector of image - Google Patents
Method and device for clustering feature vector of image Download PDFInfo
- Publication number
- JP2004258749A JP2004258749A JP2003046014A JP2003046014A JP2004258749A JP 2004258749 A JP2004258749 A JP 2004258749A JP 2003046014 A JP2003046014 A JP 2003046014A JP 2003046014 A JP2003046014 A JP 2003046014A JP 2004258749 A JP2004258749 A JP 2004258749A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- image
- feature
- representative
- representative vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、画像から抽出した複数の特徴ベクトルを分類する方法および装置に関し、特に、特徴ベクトル空間におけるクラスタリングの手法を用いて、画像から抽出した複数の特徴ベクトルを、互いに類似したもの同士が属する複数のクラスターに分類する方法および装置に関する。
【0002】
【従来の技術】
観測データや画像データの特徴が該特徴を表すn個のパラメータを成分とする特徴ベクトルとして表現できる場合のデータ分類手法として、複数の特徴ベクトルをn次元の特徴ベクトル空間に写像して、該特徴ベクトル空間における分布をもとにこれらの特徴ベクトルを複数のクラスターに分類する、いわゆるクラスタリングの手法が従来から知られている。クラスターとは、文字通り、特徴ベクトル空間における特徴ベクトルの「塊」であり、特徴ベクトル空間におけるユークリッド距離等を指標として、互いに近い特徴ベクトルが同一のクラスターに分類される。すなわち、同一のクラスターに属する特徴ベクトルは、互いに類似した特徴を表しているものである。
【0003】
通常、クラスタリング処理に際しては、どの程度まで分類を行うかを示す一定値のパラメータを、処理開始に先立って指定しなくてはならない。たとえば、最終的なクラスターの個数や、クラスター中心と該クラスターに属する特徴ベクトル間の許容可能な最大距離が、かかるパラメータとして指定され得る。クラスターの個数等を固定しない自己収束形のアルゴリズムを使用する場合であっても、クラスターの拡がりに関するパラメータやクラスター間の距離に関するパラメータ等、どの程度まで分類を行うかを示す何らかの一定値のパラメータを指定する必要性は解消されない(たとえば、非特許文献1参照)。
【0004】
【非特許文献1】
長尾真著、「画像認識論」、初版、コロナ社、昭和58年2月15日
、p.120−126
【0005】
【発明が解決しようとする課題】
クラスタリング処理に際してどの程度まで分類を行うべきかは、データの内容に強く依存する。とりわけ、多様性の高い画像データを対象とする場合には、適当な分類の程度は、各画像データによって大きく異なる。たとえば、1つの画像を、該画像に含まれる「空」、「海」、「建物」等の撮影対象要素に対応する画像領域に分割する領域分割処理を行うために、該画像の各画素から抽出した特徴ベクトルをクラスタリング処理により分類する場合等には、各画像に含まれる撮影対象要素の数は多様であり、どの程度まで分類を行うべきかの画一的な基準を定めることは不可能である。すなわち、撮影対象要素として「空」と「海」のみを含む画像であれば、2つの画像領域に分割できればよいのであるから、分類の程度は粗くて足りるが、さらに「建物」、「木」、「土」等の多くの撮影対象要素を含む画像については、より細かい分類が必要である。この場合に、前者の画像に合わせた画一的な分類の程度の基準を採用すれば、後者の画像については十分な分類が行えないこととなり、後者の画像に合わせた画一的な基準を採用すれば、実際には「空」と「海」しか撮影されていない前者の画像を不必要に多くの画像領域に分割することとなる。
【0006】
したがって、画像データを対象としたクラスタリング処理においては、分類対象としていかなる画像データが入力されても、その画像データ自体から該画像データに最適な分類の程度を特定し、安定した分類性能を実現する手法が強く望まれる。
【0007】
本発明は、かかる事情に鑑み、好ましい分類の程度を指定するパラメータの入力を要さずに、入力された画像データ自体から最適な分類の程度を特定して、該画像データから抽出した特徴ベクトルの分類を行うクラスタリング方法および装置を提供することを目的とするものである。
【0008】
【課題を解決するための手段】
すなわち、本発明に係る第1の画像の特徴ベクトルのクラスタリング方法は、原画像から、段階的に解像度の異なる複数の複数画素からなる低解像度画像を導出する工程と、該複数の低解像度画像のうち解像度が最も低い最低解像度画像から、代表ベクトルの各成分の初期値および歪み閾値の初期値を求める工程と、解像度が次に低い画像から複数の特徴ベクトルを抽出する工程と、上記の歪み閾値を最適な分類の程度の指標として、上記の代表ベクトルに基づいて、上記の複数の特徴ベクトルを分類する工程と、代表ベクトルおよび歪み閾値を更新する工程と、原画像から抽出された複数の特徴ベクトルの最適な分類の程度による分類が求められるまで、上記の抽出する工程から上記の更新する工程を繰り返す工程を含むことを特徴とする方法である。
【0009】
また、本発明に係る第1の画像の特徴ベクトルのクラスタリング装置は、原画像から、段階的に解像度の異なる複数の複数画素からなる低解像度画像を導出する手段と、該複数の低解像度画像のうち解像度が最も低い最低解像度画像から、代表ベクトルの各成分の初期値および歪み閾値の初期値を求める手段と、解像度が次に低い画像から複数の特徴ベクトルを抽出する手段と、上記の歪み閾値を最適な分類の程度の指標として、上記の代表ベクトルに基づいて、上記の複数の特徴ベクトルを分類する手段と、代表ベクトルおよび歪み閾値を更新する手段と、原画像から抽出された複数の特徴ベクトルの最適な分類の程度による分類が求められるまで、上記の抽出する手段から上記の更新する手段を繰返し動作させる手段を備えていることを特徴とする装置である。
【0010】
ここで、本発明において「低解像度画像」とは、原画像よりも画素数の少ない複数画素からなる画像であって、原画像を基として、ガウシアンピラミッド、線形補間、スプライン補間、ウェーブレット変換等を利用した画像縮小処理により順次求められるものを指す。画像の縦方向と横方向に対して、異なる縮小率を適用してもよい。
【0011】
また、本発明において「特徴ベクトル」とは、画像から抽出されるベクトルであって、当該画像の特徴を示す複数のパラメータ(以下、「特徴量」と呼ぶ)を成分とするベクトルを指す。特徴ベクトルは、典型的には抽出対象の画像を構成する画素ごとに抽出されるが、いくつかの画素からなるブロックごとに抽出してもよいし、抽出対象の画像に線形補間やガウシアンピラミッド等による画像縮小処理を施した縮小画像の各画素から抽出してもよい。特徴ベクトルの成分である特徴量としては、たとえば色の特徴、輝度の特徴、テクスチャーの特徴、奥行情報、該画像に含まれるエッジの特徴等を示す特徴量が使用され得る。
【0012】
さらに、本発明において「代表ベクトル」とは、特徴ベクトル空間において規定される各クラスターを代表するベクトルを指し、クラスターごとに1つの代表ベクトルが割り当てられる。ここで、「特徴ベクトル空間」とは、上記の特徴ベクトルの各成分を座標とする空間を指す。たとえば、特徴ベクトルがYCC表色系における各画素の輝度成分および2つの色差成分を成分とするベクトルである場合には、3次元のYCC表色系空間が特徴ベクトル空間となる。
【0013】
また、本発明において「歪み閾値」とは、各低解像度画像または原画像においてどの程度まで分類を行うかの基準となる値である。
【0014】
また、本発明に係る第2の画像の特徴ベクトルのクラスタリング方法は、原画像から、段階的に解像度の異なる複数の複数画素からなる低解像度画像を導出する工程と、該複数の低解像度画像のうち解像度が最も低い最低解像度画像から、代表ベクトルの各成分の初期値および歪み閾値の初期値を求める工程と、解像度が次に低い画像を現在画像として、該現在画像から複数の特徴ベクトルを抽出する工程と、該複数の特徴ベクトルを特徴ベクトル空間に写像する工程と、特徴ベクトル空間において、上記の複数の特徴ベクトルを、上記の代表ベクトルの各々が代表するクラスターに分類して、現在画像における暫定的な分類を求める工程と、上記のクラスターの各々に含まれる特徴ベクトルに基づいて、代表ベクトルを更新する工程と、上記の暫定的な分類の歪みを示す歪みパラメータを求める工程と、該歪みパラメータを歪み閾値と比較し、歪みパラメータが歪み閾値より大きい場合には、代表ベクトルに新たなベクトルを追加する工程と、歪みパラメータが歪み閾値より小さくなるまで、上記の暫定的な分類を求める工程から上記の新たなベクトルを追加する工程を繰り返し、現在画像における最終的な分類を求める工程と、現在画像における暫定的な分類のいずれかまたは最終的な分類に基づいて、歪み閾値を更新する工程と、原画像が現在画像とされ、原画像における最終的な分類が求められるまで、上記の複数の特徴ベクトルを抽出する工程から上記の歪み閾値を更新する工程を繰り返す工程を含むことを特徴とする方法である。
【0015】
また、本発明に係る第2の画像の特徴ベクトルのクラスタリング装置は、原画像から、段階的に解像度の異なる複数の複数画素からなる低解像度画像を導出する手段と、該複数の低解像度画像のうち解像度が最も低い最低解像度画像から、代表ベクトルの各成分の初期値および歪み閾値の初期値を求める手段と、解像度が次に低い画像を現在画像として、該現在画像から複数の特徴ベクトルを抽出する手段と、該複数の特徴ベクトルを特徴ベクトル空間に写像する手段と、特徴ベクトル空間において、上記の複数の特徴ベクトルを、上記の代表ベクトルの各々が代表するクラスターに分類して、現在画像における暫定的な分類を求める手段と、上記のクラスターの各々に含まれる特徴ベクトルに基づいて、代表ベクトルを更新する手段と、上記の暫定的な分類の歪みを示す歪みパラメータを求める手段と、該歪みパラメータを歪み閾値と比較し、歪みパラメータが歪み閾値より大きい場合には、代表ベクトルに新たなベクトルを追加する手段と、歪みパラメータが歪み閾値より小さくなるまで、上記の暫定的な分類を求める手段から上記の新たなベクトルを追加する手段を繰返し動作させ、現在画像における最終的な分類を求める手段と、現在画像における暫定的な分類のいずれかまたは最終的な分類に基づいて、歪み閾値を更新する手段と、原画像が現在画像とされ、原画像における最終的な分類が求められるまで、上記の複数の特徴ベクトルを抽出する手段から上記の歪み閾値を更新する手段を繰返し動作させる手段を備えていることを特徴とする装置である。
【0016】
ここで、本発明において「歪みパラメータ」とは、歪み閾値と比較されるパラメータであって、いわばクラスターによる特徴ベクトルの暫定的な分類の大まかさを表す指標である。クラスターの数が多くなり分類が細かくなるほど、歪みパラメータは小さくなる。なお、本発明に係る第2の画像の特徴ベクトルのクラスタリング方法および装置は、上記の歪みパラメータが歪み閾値よりも大きい場合には代表ベクトルに新たなベクトルを追加し、歪みパラメータが歪み閾値よりも小さくなるまで現在画像における分類処理を繰り返すものであるが、歪みパラメータと歪み閾値が等しい場合の扱いが定められている方法および装置も、本発明の範囲に属するものとする。すなわち、歪みパラメータが歪み閾値以上である場合には代表ベクトルに新たなベクトルを追加し、歪みパラメータが歪み閾値よりも小さくなるまで現在画像における分類処理を繰り返すものと、歪みパラメータが歪み閾値よりも大きい場合には代表ベクトルに新たなベクトルを追加し、歪みパラメータが歪み閾値以下となるまで現在画像における分類処理を繰り返すもののいずれも、本発明の範囲に属するものとする。
【0017】
ここで、本発明による第2のクラスタリング方法は、代表ベクトルを更新する工程と歪みパラメータを求める工程との間に、代表ベクトルに基づいて暫定的な分類を更新する工程をさらに含んでいてもよい。同様に、本発明による第2のクラスタリング装置も、代表ベクトルを更新する手段により更新された代表ベクトルに基づいて、暫定的な分類を更新する手段をさらに備えていてもよい。
【0018】
また、上記の暫定的な分類を求める工程または手段は、複数の特徴ベクトルの各々を、上記の代表ベクトルのうち該特徴ベクトルと特徴ベクトル空間における距離が最も近い代表ベクトルが代表するクラスターに分類するものであってもよい。この場合において、上記の代表ベクトルを更新する工程または手段は、特徴ベクトル空間において、クラスターの各々に含まれる特徴ベクトルの重心を表すベクトルを、新たな代表ベクトルとするものであってもよい。さらに、上記の歪みパラメータが、各クラスターのうち特徴ベクトル空間における拡がりが最も大きいクラスターの該拡がりを示す値であって、上記の新たなベクトルを追加する工程または手段が、所属するクラスターを代表する代表ベクトルとの距離が最も遠い特徴ベクトルと同一のベクトルを、新たなベクトルとして代表ベクトルに追加するものであってもよい。
【0019】
ここで、特徴ベクトル空間における「距離」とは、典型的には特徴ベクトル空間における2つのベクトル間のユークリッド距離を指すが、特徴ベクトル空間における2つのベクトルの近接度合いを適当に表す指標であれば、ユークリッド距離に限られないものとする。また、特徴ベクトル空間におけるクラスターの「拡がりを示す値」としては、たとえば、そのクラスターに属する各々の特徴ベクトルと該クラスターの代表ベクトルとの距離の最大値や平均値等が使用され得る。
【0020】
また、上記の歪み閾値を更新する工程または手段は、現在画像における最終的な分類を求めるために求められた、歪みパラメータのいずれかを新たな歪み閾値とするものであってもよい。
【0021】
さらに、上記の代表ベクトルの各成分の初期値および歪み閾値の初期値を求めるに際しては、n個の画素からなる上記の最低解像度画像から、1つの原代表ベクトルを導出し、該n個の画素の各々から抽出されたn個の特徴ベクトルと、原代表ベクトルとの、特徴ベクトル空間における距離を求め、最大距離を示す特徴ベクトルを代表ベクトル候補とするとともに最も高い候補順位を付け、続いて残りの特徴ベクトルの各々と、原代表ベクトルおよび代表ベクトル候補のうち該特徴ベクトルに最も近いものとの、特徴ベクトル空間における距離を求め、最大距離を示す特徴ベクトルを代表ベクトル候補に追加するとともに次に高い候補順位を付け、かかる次に高い候補順位を付ける処理を複数回繰り返し、この候補順位に従って、代表ベクトル候補のうちの上位いくつかの特徴ベクトルの各成分の値を、代表ベクトルの各成分の初期値とし、上記のn個の特徴ベクトルの特徴ベクトル空間における拡がりを示す値を歪み閾値の初期値としてもよい。この場合において、上記の上位いくつかの特徴ベクトルとして、代表ベクトル候補に追加された際の上記の最大距離の変化量が最大であった特徴ベクトルまでを選択してもよい。
【0022】
ここで、「原代表ベクトル」とは、最低解像度画像を代表する1つのベクトルであって、たとえば最低解像度画像の各画素から抽出される特徴量の各平均値を成分とするベクトル等が使用され得る。
【0023】
【発明の効果】
本発明に係る画像の特徴ベクトルのクラスタリング方法および装置は、入力された原画像自体から導出した最低解像度画像に基づいて代表ベクトルの各成分の初期値および歪み閾値の初期値を求め、これらの初期値を利用して、解像度が次に低い画像における特徴ベクトルの最適な分類を順次求めていき、最終的には原画像から抽出した特徴ベクトルの分類を求めるものであるので、好ましい分類の程度を指定するパラメータの入力を要さずに、原画像の内容に応じた最適な分類の程度により、原画像から抽出した特徴ベクトルの分類を行うことができる。したがって、いかなる原画像が入力されても、安定した分類性能を実現することができ、様々な撮影対象要素を含む多数の画像に対して、連続して領域分割処理を施す場合等に極めて有効である。
【0024】
また、本発明に係る画像の特徴ベクトルのクラスタリング方法および装置は、低解像度化された画像すなわち特徴ベクトル数を減じた画像において順次分類処理を行い、しかも各低解像度画像における分類処理は、歪みパラメータが歪み閾値よりも小さくなった時点で打ち切られ、解像度が次に低い画像における処理へと進むので、従来のクラスタリング処理と比較して、計算量が過大となることもない。
【0025】
【発明の実施の形態】
以下、図面により、本発明の例示的な実施形態を詳細に説明する。
【0026】
図1は、本発明の1つの実施形態であるクラスタリング処理の手順を示したフローチャートである。このクラスタリング処理は、最終的には原画像の各画素から抽出した特徴ベクトルを、複数のクラスターに分類することを目的とするものであり、原画像を「空」、「海」、「建物」等の撮影対象要素に対応する複数の画像領域に分割する領域分割処理等に利用できる。なお、本実施形態では、原画像は1024×1024画素のデジタル写真画像であるとし、特徴ベクトルは、YCC表色系で表された輝度成分および2つの色差成分を成分とする3次元のベクトルであるとする。
【0027】
原画像が入力されると、まず図1のステップ10において、段階的に解像度の異なる複数の低解像度画像が導出される。本実施形態では、図2に示すように、原画像から出発して、縦横の画素数をそれぞれ2分の1とした低解像度画像を順次求めていき、最終的には第9低解像度画像すなわち画素数2×2の低解像度画像まで求めるものとする。この画素数2×2の低解像度画像が、本実施形態における最低解像度画像である。
【0028】
これらの各低解像度画像を求めるための画像縮小処理の手法としてはいかなる手法を用いてもよいが、本実施形態ではガウシアンピラミッドによる縮小処理を用いるものとする。ガウシアンピラミッドによる縮小処理とは、縮小対象の画像にガウシアンフィルターを適用していわばぼやかした画像を導出するステップと、そのようにぼやかした画像の画素を1つおきに拾って縦横の画素数をそれぞれ2分の1とした画像を導出するステップを順次繰り返して、段階的に解像度の異なる低解像度画像を導出していく処理である。使用されるガウシアンフィルターは、たとえばフィルターの大きさが5×5であれば、図3のようになる。なお、画像端の処理に関しては、たとえば図3に示した5×5の大きさのフィルターを使用する場合には、縮小対象の画像の各辺に2行分または2列分の適当な画素値を有する画素を便宜的に追加することにより、もとの縮小対象の画像と同じ大きさのぼやかした画像を導出することができる。追加する画素の「適当な画素値」としては、ゼロ値や、画像端の画素値を繰り返した値等が使用され得る。
【0029】
低解像度画像の導出が終了すると、次に、図1のステップ12において、最低解像度画像(2×2画素)を基に、初期代表ベクトルすなわち代表ベクトルの各成分の初期値が導出される。この初期代表ベクトル導出処理を、以下、図4のフローチャートならびに図5の概念図に沿って詳細に説明する。
【0030】
まず、図4のステップ40において、最低解像度画像から1つの原代表ベクトルが導出される。本実施形態では、最低解像度画像をなす4つの画素から抽出した特徴ベクトルの各成分の平均値を成分とする1つのベクトルを、原代表ベクトルとする。たとえば、図5の(a)に示した特徴ベクトル空間において、4つのベクトルOB1、OB2、OB3およびOB4が最低解像度画像をなす4つの画素から抽出された特徴ベクトルであるとすると、原代表ベクトルはOAのようになる。
【0031】
次に、図4のステップ42において、上記の4つの特徴ベクトルの各々と、原代表ベクトルとの距離を算出する。本実施形態では、この距離は特徴ベクトル空間におけるユークリッド距離であるとする。図5の(a)の例では、算出される距離はそれぞれd1、d2、d3およびd4である。
【0032】
続いて、ステップ44において、ステップ42で算出した距離のうち最大の距離を示す特徴ベクトルを、候補順位第1位の代表ベクトル候補とする。図5の(a)の例では、距離d1、d2、d3およびd4のうち最大距離はd1であり、したがって最大距離を示す特徴ベクトルはベクトルOB1であるので、ベクトルOB1が、候補順位第1位の代表ベクトル候補すなわち第1代表ベクトル候補とされる。
【0033】
次に、ステップ46において、残りの特徴ベクトルすなわち3つのベクトルOB2、OB3およびOB4の各々と、原代表ベクトルOAおよび代表ベクトル候補OB1のうちその特徴ベクトルとの距離が最も近いものとの距離が特定される。この例では、図5の(b)に示すように、ベクトルOB3およびOB4については、原代表ベクトルOAとの距離の方が代表ベクトル候補OB1との距離よりも小さいため、図示のように距離d1’およびd2’が特定される。ベクトルOB2については、代表ベクトル候補OB1との距離の方が原代表ベクトルOAとの距離よりも小さいため、距離d3’が特定される。
【0034】
続いて、ステップ48において、ステップ46で算出した距離のうち最大の距離を示す特徴ベクトルを、次に高い候補順位の代表ベクトル候補とする。図5の(b)の例では、最大距離d1’を示す特徴ベクトルはベクトルOB2であるので、ベクトルOB2が、候補順位第2位の第2代表ベクトル候補とされる。
【0035】
次に、ステップ50において、まだ候補順位を付けていない特徴ベクトルがあるか否かが確認される。ここでは、まだ特徴ベクトルOB2およびOB4に候補順位が付けられていないので、処理はステップ46に戻る。ここで再び行われるステップ46では、図5の(c)に示すように、ベクトルOB4については、原代表ベクトルOAおよび代表ベクトル候補OB1ならびにOB3のうちもっとも距離が近いベクトルは原代表ベクトルOAであるので、図示のように原代表ベクトルOAとの距離d1’’が特定される。ベクトルOB2については、代表ベクトル候補OB1との距離d2’’が特定される。続くステップ48においては、距離d1’’の方がd2’’よりも大きいので、特徴ベクトルOB4が候補順位第3位の第3代表ベクトル候補とされる。
【0036】
このようにして、4つ全ての特徴ベクトルに候補順位が付けられるまで、図4のステップ46からステップ50が繰り返され、最終的には各特徴ベクトルがOB1、OB3、OB4、OB2の順に代表ベクトル候補に追加され、候補順位第1位から第4位が付けられることとなる。
【0037】
続いて、図4のステップ52において、上記の候補順位に従って、代表ベクトル候補のうち上位いくつかの特徴ベクトルを初期代表ベクトルとするのであるが、本実施形態では、代表ベクトル候補に追加された際の上記の最大距離の変化量が最大であった特徴ベクトルまでを、初期代表ベクトルとする。すなわち、図5に示すとおり、特徴ベクトルOB1が第1代表ベクトル候補として代表ベクトル候補に追加された際には、最大距離はd1からd1’に変化しており、次に特徴ベクトルOB3が代表ベクトル候補に追加された際には、最大距離はd1’からd1’’に変化している。この最大距離の変化の様子を図示すると、図6のようになる。この例では、最大距離の変化量は、候補順位第2位の特徴ベクトルOB3が代表ベクトル候補に追加されたときが最大であるので、候補順位第2位までの特徴ベクトル、すなわちベクトルOB1およびOB3の2つが、初期代表ベクトルOR1およびOR2とされる。
【0038】
ここで、本実施形態では、上記のとおり特徴ベクトル空間における最大距離の変化量を基準として初期代表ベクトルを選択したが、平均距離の変化量等を基準としてもよい。あるいは、最低解像度画像では画素数は相当に減じられているので(本実施形態では4画素)、最低解像度画像の各画素から抽出した特徴ベクトルの全てを初期代表ベクトルとしてもよい。要するに、外部からの何らかのパラメータの入力を要さずに、原画像から導出した最低解像度画像自体から、所定の処理により該原画像に応じた代表ベクトルの各成分の初期値を求めるものであれば、本発明の範囲に属するものである。
【0039】
図1に戻り、続いてステップ14において、歪み閾値の初期値が、やはり最低解像度画像に基づいて導出される。この歪み閾値の初期値は、次の低解像度画像すなわち画素数4×4の第8低解像度画像において、どの程度まで分類を行うかの基準となる値である。この歪み閾値の初期値は、最低解像度をなすn個(本実施形態では4個)の画素から抽出された特徴ベクトルの、特徴ベクトル空間における拡がりを示す値であることが好ましいが、必ずしもそれに限られず、上記した代表ベクトルの各成分の初期値の場合と同様、外部からの何らかのパラメータの入力を要さずに、原画像から導出した最低解像度画像自体から、所定の処理により該原画像に応じた歪み閾値の初期値を求めるものであれば、本発明の範囲に属するものである。本実施形態では、最低解像度画像の各画素から抽出した4つの特徴ベクトルと、原代表ベクトルとの距離の最大値、すなわち図5の(a)における距離d1を、歪み閾値Dの初期値とする。これに代えて、図5のより下の階層における最大距離(すなわち、d1’、d1’’等)や、距離d1、d2、d3およびd4の平均値等を使用してもよい。
【0040】
次に、図1のステップ16において、解像度が次に低い画像、すなわち画素数4×4の第8低解像度画像が現在画像とされ、該現在画像における分類処理が開始される。以下、図7から9も参照しながら、画素数4×4の現在画像における分類処理について順を追って説明する。
【0041】
まず、図1のステップ18において、現在画像をなす16個の画素の各々から、YCC表色系における輝度成分および2つの色差成分を成分とする特徴ベクトルが抽出される。
【0042】
次に、ステップ20において、上記の16個の特徴ベクトルが特徴ベクトル空間に写像される。16個の特徴ベクトルの終点をC1からC16で表すこととすると、この例ではそれらの特徴ベクトル空間における分布は、図7の(a)に示すような分布であるとする。
【0043】
続いて、ステップ22において、上記の16個の特徴ベクトルを、各代表ベクトルが代表するクラスターに暫定的に分類する。現在の代表ベクトルは、最低解像度画像から導出した初期代表ベクトルOR1およびOR2であるので、これらに代表される2つのクラスターに16個の特徴ベクトルを分類する。本実施形態では、特徴ベクトル空間におけるユークリッド距離を基準として、距離が近い方の代表ベクトルが代表するクラスターに、各特徴ベクトルを分類するものとする。その結果、暫定的な分類は図7の(a)に示すようになる。
【0044】
次に、ステップ24において、上記の2つのクラスターの各々に含まれる特徴ベクトルに基づいて、各代表ベクトルを、これらのクラスターをより適切に代表するものに更新する。本実施形態では、図7の(b)に示すように、各クラスターに属する特徴ベクトルの重心を指すベクトルに、代表ベクトルOR1およびOR2を更新する。
【0045】
続いて、ステップ26において、現在の暫定的な分類の歪みを示す歪みパラメータを算出する。この歪みパラメータは、現在の暫定的な分類において、各クラスターのうち特徴ベクトル空間における拡がりが最も大きいクラスターの該拡がりを示す値であることが好ましい。本実施形態では、代表ベクトルと、該代表ベクトルが代表するクラスターに含まれる特徴ベクトルとの、特徴ベクトル空間におけるユークリッド距離の最大値を歪みパラメータとする。この例では、図7の(c)に示すように、代表ベクトルOR1と、そのクラスターに属する特徴ベクトルOC1との距離dmaxが最大であるので、このdmaxが歪みパラメータとされる。なお、最大値に代えて平均値等を歪みパラメータとしてもよい。
【0046】
次に、ステップ28において、ステップ26で求めた歪みパラメータが歪み閾値D以下であるか否かが調べられる。現在の歪み閾値Dは、最低解像度画像から求めた歪み閾値の初期値である。この例では、この段階での歪みパラメータdmaxは歪み閾値Dよりも大きく、したがって図1に示した処理はステップ30へと進むものとする。
【0047】
ステップ30では、クラスターの数を1つ増やしてより細かい暫定的な分類を求めるために、新たなベクトルが代表ベクトルに追加される。本実施形態では、図8の(a)に示すように、所属するクラスターを代表する代表ベクトルとの距離が最も遠い特徴ベクトル、すなわち上記の最大距離dmaxを示す特徴ベクトルOC1と同一のベクトルが、新たな代表ベクトルOR3として追加される。
【0048】
以下、3つの代表ベクトルに基づいて、再びステップ22から28の処理が行われる。すなわち、ステップ22では、特徴ベクトル空間におけるユークリッド距離を基準として、各代表ベクトルが代表する3つのクラスターに特徴ベクトルOC1からOC16が分類され(図8の(a)参照)、ステップ24では、代表ベクトルOR1からOR3が各クラスターの重心を指すベクトルに更新され(図8の(b)参照)、ステップ26では、代表ベクトルと、該代表ベクトルが代表するクラスターに含まれる特徴ベクトルとの距離の最大値d’maxが、新たな暫定的な分類の歪みを示す歪みパラメータとして導出される(図8の(c)参照)。この例では、新たな歪みパラメータd’maxも歪み閾値Dより大きいものとする。したがって、ステップ28から再びステップ30へと進み、上記の最大距離d’maxを示す特徴ベクトルOC2と同一のベクトルが、新たな代表ベクトルOR4として代表ベクトルに追加される(図9の(a)参照)。
【0049】
続いて、図9の(a)から(c)に示すように、4つの代表ベクトルに基づいて、再びステップ22から28の処理が行われる。ここで、3回目のステップ26で求められた、4つのクラスターによる暫定的な分類の歪みを示す歪みパラメータd’’max(図9の(c)参照)は、歪み閾値Dより小さいものとする。すると、図1に示す処理は、3回目のステップ28からステップ32へと進む。このときの分類が、現在画像における最終的な分類である。
【0050】
ステップ32では、現在画像が原画像であるか否かが確認される。この例では、現段階での現在画像は画素数4×4の第8低解像度画像であって原画像ではないので、図1に示す処理はステップ34を経てステップ16に戻り、解像度が次に低い画像、すなわち画素数8×8の第7低解像度画像における分類処理へと進むことになる。
【0051】
解像度が次に低い画像へと進む前に行われるステップ34においては、現在画像における上記の暫定的な分類のいずれかまたは最終的な分類に基づいて、次の画像における分類をどの程度まで行うかの基準となる新たな歪み閾値が導出され、歪み閾値Dの更新が行われる。新たな歪み閾値Dとしては、たとえば、現在画像における分類処理において求められた歪みパラメータ(この例では、上記のdmax、d’maxおよびd’’max)のいずれかを使用することができる。本実施形態では、最初に導出された歪みパラメータ、すなわちdmaxを新たな歪み閾値Dとして採用するものとする。これに代えて、最後に導出した歪みパラメータ(この例ではd’’max)を新たな歪み閾値Dとして採用することとしてもよい。
【0052】
以下、原画像が現在画像とされ、原画像における最終的な分類が求められるまで、図1に示したステップ16から34の処理を繰り返すことにより、最終的には、原画像の各画素から抽出された1024×1024個の特徴ベクトルの分類を求めることができる。かかる分類結果は、原画像を「空」、「海」、「建物」等の撮影対象要素に対応する複数の画像領域に分割する領域分割処理等に利用できる。
【0053】
上記の実施形態によれば、入力された原画像自体から導出した画素数2×2の最低解像度画像に基づいて初期代表ベクトルおよび歪み閾値の初期値が求められ、これらを利用して解像度が次に低い画像における特徴ベクトルの最適な分類を順次求めていくことにより、最終的には原画像の各画素から抽出した特徴ベクトルの分類が求められるので、外部からのパラメータの入力を要さずに、原画像の内容に応じた最適な分類の程度により分類を行うことができる。したがって、いかなる原画像が入力されても、安定した分類性能を実現することができる。
【0054】
なお、上記の実施形態の変更例として、図1のステップ24と26の間に、ステップ24で更新された代表ベクトルに基づいて暫定的な分類も更新するステップをさらに含む形態を採用してもよい。たとえば、更新された各代表ベクトルと各特徴ベクトルとの特徴ベクトル空間におけるユークリッド距離を求め直して、より近い方の代表ベクトルが代表するクラスターに各特徴ベクトルを分類し直す処理等がこれにあたる。
【0055】
また、上記の実施形態では、YCC表色系で表された輝度成分および2つの色差成分を成分とする3次元のベクトルを特徴ベクトルとしたが、特徴ベクトルの各成分はこれらに限られず、また、特徴ベクトルの次元も3に限られない。
【0056】
また、上記の実施形態では、説明の便宜上、原画像を1024×1024画素の正方形の画像としたが、縦横の画素数が異なる原画像に対しても本発明を適用できることは言うまでもない。各低解像度画像も、正方形画像に限られない。さらに、最低解像度画像の画素数も4画素に限られず、原画像の画素数より少ない複数画素であれば、いかなる画素数であってもよい。
【0057】
さらに、上記の実施形態は、原画像の各画素から抽出した特徴ベクトルの分類を目的とするものであったが、原画像に予め画像縮小処理を施し、縮小画像の各画素から抽出した特徴ベクトルの分類を行う形態等も、本発明の範囲に属する。この場合、縮小画像の各画素から抽出した特徴ベクトルの分類を行った後、該縮小画像にあらためて画像拡大処理を施すこと等により、上記の実施形態と同様、分類結果を原画像の領域分割処理等に利用することができる。
【0058】
なお、本発明の上記およびその他の実施形態によるクラスタリング処理は、コンピュータ・プログラムにより実行することもできる。また、上記の説明は、説明の便宜上、方法に関して行ったが、上記の各ステップを行う手段を備えた装置も、本発明の範囲に属するものとする。
【0059】
以上、本発明の実施形態について詳細に述べたが、上記の実施形態は例示的なものに過ぎず、本発明の技術的範囲は、本明細書中の特許請求の範囲のみによって定められるべきものであることは言うまでもない。
【図面の簡単な説明】
【図1】本発明の1つの実施形態であるクラスタリング処理の手順を示したフローチャート
【図2】図1の実施形態における、各低解像度画像の導出方法を示した概念図
【図3】各低解像度画像の導出に使用するガウシアンフィルターの例を示した図
【図4】図1の実施形態における、初期代表ベクトルの導出工程を詳細に示したフローチャート
【図5】図4に示した初期代表ベクトルの導出工程の各段階を示した概念図
【図6】図4に示した初期代表ベクトルの導出工程において、初期代表ベクトルの選択の基準となる最大距離の変化を示した棒グラフ
【図7】4×4画素の低解像度画像における分類処理の各段階を示した概念図
【図8】4×4画素の低解像度画像における分類処理の各段階を示した概念図
【図9】4×4画素の低解像度画像における分類処理の各段階を示した概念図[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a method and apparatus for classifying a plurality of feature vectors extracted from an image, and in particular, a plurality of feature vectors extracted from an image using a clustering technique in a feature vector space belong to each other. The present invention relates to a method and apparatus for classifying a plurality of clusters.
[0002]
[Prior art]
As a data classification method when features of observation data or image data can be expressed as feature vectors having n parameters representing the features, a plurality of feature vectors are mapped to an n-dimensional feature vector space, and the features A so-called clustering method for classifying these feature vectors into a plurality of clusters based on the distribution in the vector space is conventionally known. A cluster is literally a “lumps” of feature vectors in the feature vector space, and feature vectors that are close to each other are classified into the same cluster using Euclidean distance in the feature vector space as an index. That is, feature vectors belonging to the same cluster represent features that are similar to each other.
[0003]
In general, in the clustering process, a constant value parameter indicating how far the classification is to be performed must be specified prior to the start of the process. For example, the final number of clusters and the maximum allowable distance between the cluster center and feature vectors belonging to the clusters can be specified as such parameters. Even when using a self-converging algorithm that does not fix the number of clusters, etc., some constant value parameter that indicates how far the classification is performed, such as a parameter related to cluster expansion and a parameter related to the distance between clusters. The necessity to specify is not eliminated (for example, see Non-Patent Document 1).
[0004]
[Non-Patent Document 1]
Nagao Makoto, "Image recognition theory", first edition, Corona, February 15, 1983
, P. 120-126
[0005]
[Problems to be solved by the invention]
The degree to which classification should be performed in the clustering process strongly depends on the data contents. In particular, when image data with high diversity is targeted, the appropriate classification level varies greatly depending on the image data. For example, in order to perform region division processing for dividing one image into image regions corresponding to imaging target elements such as “sky”, “sea”, and “building” included in the image, from each pixel of the image When classifying extracted feature vectors by clustering processing, etc., the number of elements to be captured included in each image varies, and it is impossible to set a uniform standard for how much to classify It is. That is, if the image includes only “sky” and “sea” as elements to be photographed, it may be divided into two image regions, so that the degree of classification is coarse, but “building” and “tree” are sufficient. For images including many elements to be photographed such as “soil”, a finer classification is required. In this case, if the standard of the degree of uniform classification according to the former image is adopted, sufficient classification cannot be performed for the latter image, and the uniform standard according to the latter image cannot be achieved. If it is adopted, the former image, in which only “sky” and “sea” are actually photographed, is unnecessarily divided into many image areas.
[0006]
Therefore, in the clustering process for image data, regardless of what image data is input as a classification target, the optimum classification level for the image data is specified from the image data itself, and stable classification performance is realized. A method is strongly desired.
[0007]
In view of such circumstances, the present invention specifies the optimum classification level from the input image data itself and does not require input of a parameter that specifies the preferable classification level, and extracts the feature vector from the image data. It is an object of the present invention to provide a clustering method and apparatus for performing classification.
[0008]
[Means for Solving the Problems]
That is, in the first image feature vector clustering method according to the present invention, a step of deriving a low-resolution image composed of a plurality of pixels having different resolutions in stages from an original image, and the plurality of low-resolution images A step of obtaining an initial value of each component of the representative vector and an initial value of a distortion threshold from the lowest resolution image having the lowest resolution, a step of extracting a plurality of feature vectors from an image having the next lowest resolution, and the above distortion threshold , Using the representative vector as a measure of the optimum classification degree, classifying the plurality of feature vectors, updating the representative vector and the distortion threshold, and a plurality of features extracted from the original image Characterized in that it includes a step of repeating the updating step from the extracting step until the classification according to the optimum classification degree of the vector is obtained. It is the law.
[0009]
In addition, the first image feature vector clustering apparatus according to the present invention includes: a unit for deriving a low-resolution image including a plurality of pixels having different resolutions in stages from an original image; Means for obtaining an initial value of each component of the representative vector and an initial value of a distortion threshold from the lowest resolution image of the lowest resolution; means for extracting a plurality of feature vectors from an image with the next lowest resolution; and the above distortion threshold As an index of the degree of optimal classification, means for classifying the plurality of feature vectors based on the representative vector, means for updating the representative vector and the distortion threshold, and a plurality of features extracted from the original image Means for repeatedly operating the updating means from the extracting means until classification according to the optimum degree of vector classification is required. It is a device for the butterflies.
[0010]
Here, in the present invention, the “low resolution image” is an image composed of a plurality of pixels having a smaller number of pixels than the original image. Based on the original image, Gaussian pyramid, linear interpolation, spline interpolation, wavelet transform, etc. It refers to what is sequentially obtained by the image reduction processing used. Different reduction ratios may be applied to the vertical and horizontal directions of the image.
[0011]
In the present invention, a “feature vector” refers to a vector extracted from an image and including a plurality of parameters (hereinafter referred to as “feature amounts”) indicating the features of the image as components. The feature vector is typically extracted for each pixel constituting the extraction target image. However, the feature vector may be extracted for each block made up of several pixels, or linear interpolation, Gaussian pyramid, etc. may be added to the extraction target image. The image may be extracted from each pixel of the reduced image subjected to the image reduction process. As the feature amount that is a component of the feature vector, for example, a feature amount indicating a color feature, a brightness feature, a texture feature, depth information, an edge feature included in the image, or the like can be used.
[0012]
Further, in the present invention, the “representative vector” refers to a vector representing each cluster defined in the feature vector space, and one representative vector is assigned to each cluster. Here, the “feature vector space” refers to a space having the coordinates of each component of the feature vector. For example, when the feature vector is a vector having the luminance component of each pixel and two color difference components in the YCC color system as components, the three-dimensional YCC color system space is the feature vector space.
[0013]
Further, in the present invention, the “distortion threshold value” is a value serving as a reference for how much classification is performed in each low-resolution image or original image.
[0014]
The second feature vector clustering method according to the present invention includes a step of deriving a low-resolution image including a plurality of pixels having different resolutions in stages from an original image, and a step of extracting the plurality of low-resolution images. Of these, the step of obtaining the initial value of each component of the representative vector and the initial value of the distortion threshold from the lowest resolution image with the lowest resolution, and extracting a plurality of feature vectors from the current image with the next lowest resolution image as the current image A step of mapping the plurality of feature vectors to a feature vector space, and classifying the plurality of feature vectors into clusters represented by each of the representative vectors in the feature vector space. Obtaining a provisional classification, updating a representative vector based on a feature vector included in each of the clusters, and Determining a distortion parameter indicating the provisional classification of the distortion; comparing the distortion parameter with a distortion threshold; and if the distortion parameter is greater than the distortion threshold, adding a new vector to the representative vector; Until the parameter becomes smaller than the distortion threshold, the process of adding the new vector from the process of obtaining the provisional classification is repeated, and the process of obtaining the final classification in the current image and the provisional classification in the current image A step of updating a distortion threshold based on any one of or a final classification, and extracting the plurality of feature vectors until the original image is a current image and a final classification in the original image is obtained. To repeating the step of updating the distortion threshold value.
[0015]
According to the second image feature vector clustering apparatus of the present invention, there is provided a means for deriving a low-resolution image composed of a plurality of pixels having different resolutions from the original image, and a plurality of the low-resolution images. Means for obtaining the initial value of each component of the representative vector and the initial value of the distortion threshold from the lowest resolution image of the lowest resolution, and extracting a plurality of feature vectors from the current image with the next lowest resolution image as the current image Means for mapping the plurality of feature vectors to the feature vector space, and classifying the plurality of feature vectors into clusters represented by each of the representative vectors in the feature vector space, Means for obtaining a provisional classification, means for updating the representative vector based on the feature vector included in each of the clusters, and Means for determining a distortion parameter indicating a provisional classification distortion, and means for comparing the distortion parameter with a distortion threshold, and if the distortion parameter is greater than the distortion threshold, adding a new vector to the representative vector; Until the parameter becomes smaller than the distortion threshold, the means for adding the new vector from the means for obtaining the provisional classification is repeatedly operated to obtain the final classification in the current image, and the provisional in the current image. Based on one of the final classifications or the final classification, the means for updating the distortion threshold and the above feature vectors are extracted until the original image is the current image and the final classification in the original image is required It is an apparatus characterized by comprising means for repeatedly operating the means for updating the distortion threshold value from the means for performing the above.
[0016]
Here, in the present invention, the “distortion parameter” is a parameter that is compared with a distortion threshold value, which is an index that represents the roughness of provisional classification of feature vectors by clusters. The greater the number of clusters and the finer the classification, the smaller the distortion parameter. Note that the second image feature vector clustering method and apparatus according to the present invention adds a new vector to the representative vector when the distortion parameter is larger than the distortion threshold, and the distortion parameter is larger than the distortion threshold. Although the classification process in the current image is repeated until it becomes smaller, a method and an apparatus in which handling when the distortion parameter is equal to the distortion threshold are also included in the scope of the present invention. That is, when the distortion parameter is equal to or greater than the distortion threshold, a new vector is added to the representative vector, and the classification process in the current image is repeated until the distortion parameter becomes smaller than the distortion threshold. If it is larger, a new vector is added to the representative vector, and any one that repeats the classification process in the current image until the distortion parameter becomes equal to or less than the distortion threshold value falls within the scope of the present invention.
[0017]
Here, the second clustering method according to the present invention may further include a step of updating the provisional classification based on the representative vector between the step of updating the representative vector and the step of obtaining the distortion parameter. . Similarly, the second clustering apparatus according to the present invention may further include means for updating the provisional classification based on the representative vector updated by the means for updating the representative vector.
[0018]
Further, the step or means for obtaining the provisional classification classifies each of the plurality of feature vectors into a cluster represented by a representative vector that is closest to the feature vector in the feature vector space among the representative vectors. It may be a thing. In this case, the step or means for updating the representative vector may use a vector representing the centroid of the feature vector included in each cluster as a new representative vector in the feature vector space. Further, the distortion parameter is a value indicating the spread of the cluster having the largest spread in the feature vector space among the clusters, and the step or means for adding the new vector represents the cluster to which the cluster belongs. The same vector as the feature vector farthest from the representative vector may be added to the representative vector as a new vector.
[0019]
Here, the “distance” in the feature vector space typically refers to the Euclidean distance between two vectors in the feature vector space, but any index that appropriately represents the degree of proximity of the two vectors in the feature vector space. Suppose that it is not limited to the Euclidean distance. As the “value indicating the spread” of the cluster in the feature vector space, for example, the maximum value or average value of the distance between each feature vector belonging to the cluster and the representative vector of the cluster can be used.
[0020]
In addition, the step or means for updating the distortion threshold value described above may use any one of the distortion parameters obtained for obtaining the final classification in the current image as a new distortion threshold value.
[0021]
Further, when obtaining the initial value of each component of the representative vector and the initial value of the distortion threshold, one original representative vector is derived from the lowest resolution image consisting of n pixels, and the n pixels The distance in the feature vector space between the n feature vectors extracted from each and the original representative vector is obtained, the feature vector indicating the maximum distance is set as the representative vector candidate, and the highest candidate ranking is given, followed by The distance between each of the feature vectors in the feature vector space between the original representative vector and the representative vector candidate closest to the feature vector is obtained, and the feature vector indicating the maximum distance is added to the representative vector candidate and The process of assigning a higher candidate rank and repeating the process of assigning the next higher candidate rank is repeated several times, and the representative vector is The value of each component of the top few feature vectors among the candidates is set as the initial value of each component of the representative vector, and the value indicating the spread in the feature vector space of the n feature vectors is set as the initial value of the distortion threshold. Also good. In this case, as the top several feature vectors, up to the feature vector having the maximum change amount of the maximum distance when added to the representative vector candidate may be selected.
[0022]
Here, the “original representative vector” is one vector representing the lowest resolution image, and for example, a vector whose component is an average value of feature amounts extracted from each pixel of the lowest resolution image is used. obtain.
[0023]
【The invention's effect】
An image feature vector clustering method and apparatus according to the present invention obtain initial values of respective components of a representative vector and initial values of distortion threshold values based on a minimum resolution image derived from an input original image itself, The value is used to sequentially determine the optimum classification of feature vectors in the next lowest resolution image, and finally to determine the classification of feature vectors extracted from the original image. The feature vector extracted from the original image can be classified according to the optimum classification according to the content of the original image without requiring input of the designated parameter. Therefore, even if any original image is input, stable classification performance can be realized, and this is extremely effective when performing continuous segmentation on a large number of images including various elements to be photographed. is there.
[0024]
The image feature vector clustering method and apparatus according to the present invention sequentially performs classification processing on a low-resolution image, that is, an image with a reduced number of feature vectors, and the classification processing for each low-resolution image includes distortion parameters. Is cut off when the value becomes smaller than the distortion threshold value, and the process proceeds to an image with the next lowest resolution, so that the amount of calculation does not become excessive as compared with the conventional clustering process.
[0025]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the drawings.
[0026]
FIG. 1 is a flowchart showing a procedure of clustering processing according to one embodiment of the present invention. The purpose of this clustering process is to classify the feature vectors extracted from each pixel of the original image into a plurality of clusters. The original image is “sky”, “sea”, “building”. It can be used for area division processing that divides into a plurality of image areas corresponding to the elements to be imaged. In the present embodiment, the original image is a digital photographic image having 1024 × 1024 pixels, and the feature vector is a three-dimensional vector having a luminance component and two color difference components expressed in the YCC color system. Suppose there is.
[0027]
When the original image is input, first, in
[0028]
Any method of image reduction processing for obtaining each of these low resolution images may be used, but in this embodiment, reduction processing using a Gaussian pyramid is used. The reduction process using the Gaussian pyramid is the step of deriving a blurred image by applying a Gaussian filter to the image to be reduced, and picking up every other pixel in such a blurred image and calculating the number of vertical and horizontal pixels respectively. This is a process of sequentially deriving low-resolution images having different resolutions by sequentially repeating the steps of deriving an image that has been reduced to half. The Gaussian filter used is, for example, as shown in FIG. 3 if the filter size is 5 × 5. Regarding the processing of the image edge, for example, when a 5 × 5 size filter shown in FIG. 3 is used, appropriate pixel values for two rows or two columns on each side of the image to be reduced are used. For convenience, a blurred image having the same size as the original image to be reduced can be derived. As the “appropriate pixel value” of the pixel to be added, a zero value, a value obtained by repeating the pixel value at the image end, or the like can be used.
[0029]
When the derivation of the low resolution image is finished, next, in
[0030]
First, in
[0031]
Next, in
[0032]
Subsequently, in
[0033]
Next, in
[0034]
Subsequently, in
[0035]
Next, in
[0036]
In this way, step 46 to step 50 in FIG. 4 are repeated until all four feature vectors are given candidate ranks. 1 , OB 3 , OB 4 , OB 2 Are added to the representative vector candidates in this order, and the first to fourth candidate rankings are given.
[0037]
Subsequently, in
[0038]
Here, in the present embodiment, the initial representative vector is selected on the basis of the change amount of the maximum distance in the feature vector space as described above. However, the change amount of the average distance or the like may be used as a reference. Alternatively, since the number of pixels is considerably reduced in the lowest resolution image (four pixels in this embodiment), all of the feature vectors extracted from each pixel of the lowest resolution image may be used as the initial representative vector. In short, as long as the initial value of each component of the representative vector corresponding to the original image is obtained from the minimum resolution image itself derived from the original image by a predetermined process without requiring input of any parameters from the outside. It belongs to the scope of the present invention.
[0039]
Returning to FIG. 1, subsequently, in
[0040]
Next, in
[0041]
First, in
[0042]
Next, in
[0043]
Subsequently, in
[0044]
Next, in
[0045]
Subsequently, in
[0046]
Next, in
[0047]
In
[0048]
Thereafter, the processing of
[0049]
Subsequently, as shown in (a) to (c) of FIG. 9, the processing of
[0050]
In
[0051]
In
[0052]
Hereinafter, until the original image is made the current image and the final classification in the original image is obtained, the process of
[0053]
According to the above embodiment, the initial representative vector and the initial value of the distortion threshold value are obtained based on the 2 × 2 minimum resolution image derived from the input original image itself, and the resolution is determined using these. The feature vectors extracted from each pixel of the original image are finally obtained by sequentially finding the optimum classification of feature vectors in a low image, so there is no need to input parameters from the outside. Classification can be performed according to the optimum degree of classification according to the contents of the original image. Therefore, stable classification performance can be realized no matter what original image is input.
[0054]
In addition, as a modification of the above embodiment, a mode may be adopted that further includes a step of updating the provisional classification based on the representative vector updated in
[0055]
In the above embodiment, a three-dimensional vector having a luminance component and two color difference components expressed in the YCC color system is used as a feature vector. However, each component of the feature vector is not limited to these, and The dimension of the feature vector is not limited to 3.
[0056]
In the above embodiment, for convenience of explanation, the original image is a square image of 1024 × 1024 pixels, but it goes without saying that the present invention can be applied to original images having different numbers of vertical and horizontal pixels. Each low-resolution image is not limited to a square image. Further, the number of pixels of the minimum resolution image is not limited to four, and any number of pixels may be used as long as it is a plurality of pixels smaller than the number of pixels of the original image.
[0057]
Furthermore, the above embodiment is intended to classify the feature vectors extracted from each pixel of the original image. However, the feature vector extracted from each pixel of the reduced image by performing image reduction processing on the original image in advance. The form of performing the classification is also within the scope of the present invention. In this case, after classifying the feature vector extracted from each pixel of the reduced image, the image is subjected to image enlargement processing again on the reduced image. Etc. can be used.
[0058]
Note that the clustering process according to the above and other embodiments of the present invention may be executed by a computer program. In addition, the above description has been made with respect to a method for convenience of description, but an apparatus including means for performing each of the above steps is also within the scope of the present invention.
[0059]
Although the embodiments of the present invention have been described in detail above, the above-described embodiments are merely illustrative, and the technical scope of the present invention should be defined only by the claims in this specification. Needless to say.
[Brief description of the drawings]
FIG. 1 is a flowchart showing a procedure of clustering processing according to an embodiment of the present invention.
FIG. 2 is a conceptual diagram showing a method for deriving each low-resolution image in the embodiment of FIG.
FIG. 3 is a diagram showing an example of a Gaussian filter used for deriving each low-resolution image.
4 is a flowchart showing in detail an initial representative vector derivation step in the embodiment of FIG. 1;
5 is a conceptual diagram showing each stage of the initial representative vector derivation process shown in FIG. 4;
6 is a bar graph showing a change in the maximum distance which is a reference for selecting an initial representative vector in the initial representative vector derivation step shown in FIG.
FIG. 7 is a conceptual diagram showing each stage of classification processing in a low-resolution image of 4 × 4 pixels.
FIG. 8 is a conceptual diagram illustrating each stage of classification processing in a low-resolution image of 4 × 4 pixels.
FIG. 9 is a conceptual diagram showing each stage of classification processing in a low-resolution image of 4 × 4 pixels.
Claims (18)
前記複数の低解像度画像のうち解像度が最も低い最低解像度画像から、代表ベクトルの各成分の初期値および歪み閾値の初期値を求める工程と、
解像度が次に低い画像から複数の特徴ベクトルを抽出する工程と、
前記歪み閾値を最適な分類の程度の指標として、前記代表ベクトルに基づいて、前記複数の特徴ベクトルを分類する工程と、
前記代表ベクトルおよび前記歪み閾値を更新する工程と、
前記原画像から抽出された複数の特徴ベクトルの前記最適な分類の程度による分類が求められるまで、前記抽出する工程から前記更新する工程を繰り返す工程を含むことを特徴とする画像の特徴ベクトルのクラスタリング方法。Deriving from the original image a low resolution image composed of a plurality of pixels having different resolutions in stages;
Obtaining an initial value of each component of the representative vector and an initial value of a distortion threshold from the lowest resolution image having the lowest resolution among the plurality of low resolution images;
Extracting a plurality of feature vectors from the next lowest resolution image;
Classifying the plurality of feature vectors based on the representative vector, using the distortion threshold as an index of an optimal classification level;
Updating the representative vector and the distortion threshold;
Clustering of feature vectors of an image, including a step of repeating the updating step from the extracting step until classification according to the degree of the optimum classification of a plurality of feature vectors extracted from the original image is obtained Method.
前記複数の低解像度画像のうち解像度が最も低い最低解像度画像から、代表ベクトルの各成分の初期値および歪み閾値の初期値を求める工程と、
解像度が次に低い画像を現在画像として、該現在画像から複数の特徴ベクトルを抽出する工程と、
該複数の特徴ベクトルを特徴ベクトル空間に写像する工程と、
前記特徴ベクトル空間において、前記複数の特徴ベクトルを、前記代表ベクトルの各々が代表するクラスターに分類して、前記現在画像における暫定的な分類を求める工程と、
前記クラスターの各々に含まれる前記特徴ベクトルに基づいて、前記代表ベクトルを更新する工程と、
前記暫定的な分類の歪みを示す歪みパラメータを求める工程と、
該歪みパラメータを前記歪み閾値と比較し、該歪みパラメータが該歪み閾値より大きい場合には、前記代表ベクトルに新たなベクトルを追加する工程と、
前記歪みパラメータが前記歪み閾値より小さくなるまで、前記暫定的な分類を求める工程から前記新たなベクトルを追加する工程を繰り返し、前記現在画像における最終的な分類を求める工程と、
前記現在画像における前記暫定的な分類のいずれかまたは前記最終的な分類に基づいて、前記歪み閾値を更新する工程と、
前記原画像が前記現在画像とされ、前記原画像における前記最終的な分類が求められるまで、前記複数の特徴ベクトルを抽出する工程から前記歪み閾値を更新する工程を繰り返す工程を含むことを特徴とする画像の特徴ベクトルのクラスタリング方法。Deriving from the original image a low resolution image composed of a plurality of pixels having different resolutions in stages;
Obtaining an initial value of each component of the representative vector and an initial value of a distortion threshold from the lowest resolution image having the lowest resolution among the plurality of low resolution images;
Extracting a plurality of feature vectors from the current image, with the next lowest resolution image as the current image;
Mapping the plurality of feature vectors to a feature vector space;
Classifying the plurality of feature vectors into clusters represented by each of the representative vectors in the feature vector space to obtain a provisional classification in the current image;
Updating the representative vector based on the feature vectors included in each of the clusters;
Determining a distortion parameter indicative of the provisional classification distortion;
Comparing the distortion parameter with the distortion threshold and, if the distortion parameter is greater than the distortion threshold, adding a new vector to the representative vector;
Repeating the step of adding the new vector from the step of determining the tentative classification until the distortion parameter is less than the distortion threshold, and determining the final classification in the current image;
Updating the distortion threshold based on any of the tentative classifications in the current image or the final classification;
Including the step of repeating the step of updating the distortion threshold from the step of extracting the plurality of feature vectors until the original image is the current image and the final classification in the original image is obtained. Clustering method of feature vectors of images to be performed.
前記新たなベクトルを追加する工程が、所属するクラスターを代表する前記代表ベクトルとの距離が最も遠い前記特徴ベクトルと同一のベクトルを、前記新たなベクトルとして前記代表ベクトルに追加する工程であることを特徴とする請求項4または5記載のクラスタリング方法。The distortion parameter is a value indicating the spread of the cluster having the largest spread in the feature vector space among the clusters,
The step of adding the new vector is a step of adding the same vector as the feature vector having the longest distance from the representative vector representing the cluster to which the cluster belongs to the representative vector as the new vector. 6. The clustering method according to claim 4, wherein the clustering method is characterized.
n個の画素からなる前記最低解像度画像から、1つの原代表ベクトルを導出する工程と、
前記n個の画素の各々から抽出されたn個の特徴ベクトルと、前記原代表ベクトルとの、前記特徴ベクトル空間における距離を求め、最大距離を示す特徴ベクトルを代表ベクトル候補とするとともに、最も高い候補順位を付ける工程と、
残りの特徴ベクトルの各々と、前記原代表ベクトルおよび前記代表ベクトル候補のうち該特徴ベクトルに最も近いものとの、前記特徴ベクトル空間における距離を求め、最大距離を示す特徴ベクトルを前記代表ベクトル候補に追加するとともに、次に高い候補順位を付ける工程と、
前記次に高い候補順位を付ける工程を複数回繰り返す工程と、
前記候補順位に従って、前記代表ベクトル候補のうちの上位いくつかの前記特徴ベクトルの各成分の値を、前記代表ベクトルの各成分の前記初期値とする工程と、
前記n個の特徴ベクトルの前記特徴ベクトル空間における拡がりを示す値を前記歪み閾値の前記初期値とする工程を含むことを特徴とする請求項2から7いずれか1項記載のクラスタリング方法。Obtaining the initial value comprises:
deriving one original representative vector from the lowest resolution image consisting of n pixels;
A distance in the feature vector space between the n feature vectors extracted from each of the n pixels and the original representative vector is obtained, and a feature vector indicating the maximum distance is set as a representative vector candidate and the highest Assigning candidate ranks,
A distance in the feature vector space between each of the remaining feature vectors and the original representative vector and the representative vector candidate closest to the feature vector is obtained, and a feature vector indicating a maximum distance is determined as the representative vector candidate. And adding the next highest candidate ranking,
Repeating the step of assigning the next highest candidate ranking multiple times;
In accordance with the candidate rank, the value of each component of the top several feature vectors of the representative vector candidates is set as the initial value of each component of the representative vector;
The clustering method according to any one of claims 2 to 7, further comprising a step of setting a value indicating a spread of the n feature vectors in the feature vector space as the initial value of the distortion threshold value.
前記複数の低解像度画像のうち解像度が最も低い最低解像度画像から、代表ベクトルの各成分の初期値および歪み閾値の初期値を求める手段と、
解像度が次に低い画像から複数の特徴ベクトルを抽出する手段と、
前記歪み閾値を最適な分類の程度の指標として、前記代表ベクトルに基づいて、前記複数の特徴ベクトルを分類する手段と、
前記代表ベクトルおよび前記歪み閾値を更新する手段と、
前記原画像から抽出された複数の特徴ベクトルの前記最適な分類の程度による分類が求められるまで、前記抽出する手段から前記更新する手段を繰返し動作させる手段を備えていることを特徴とする画像の特徴ベクトルのクラスタリング装置。Means for deriving a low resolution image composed of a plurality of pixels having different resolutions in stages from the original image;
Means for determining an initial value of each component of the representative vector and an initial value of a distortion threshold from the lowest resolution image having the lowest resolution among the plurality of low resolution images;
Means for extracting a plurality of feature vectors from the next lowest resolution image;
Means for classifying the plurality of feature vectors based on the representative vector, using the distortion threshold as an index of an optimal classification level;
Means for updating the representative vector and the distortion threshold;
Means for repeatedly operating the updating means from the extracting means until classification according to the optimum classification degree of the plurality of feature vectors extracted from the original image is obtained. Feature vector clustering device.
前記複数の低解像度画像のうち解像度が最も低い最低解像度画像から、代表ベクトルの各成分の初期値および歪み閾値の初期値を求める手段と、
解像度が次に低い画像を現在画像として、該現在画像から複数の特徴ベクトルを抽出する手段と、
該複数の特徴ベクトルを特徴ベクトル空間に写像する手段と、
前記特徴ベクトル空間において、前記複数の特徴ベクトルを、前記代表ベクトルの各々が代表するクラスターに分類して、前記現在画像における暫定的な分類を求める手段と、
前記クラスターの各々に含まれる前記特徴ベクトルに基づいて、前記代表ベクトルを更新する手段と、
前記暫定的な分類の歪みを示す歪みパラメータを求める手段と、
該歪みパラメータを前記歪み閾値と比較し、該歪みパラメータが該歪み閾値より大きい場合には、前記代表ベクトルに新たなベクトルを追加する手段と、
前記歪みパラメータが前記歪み閾値より小さくなるまで、前記暫定的な分類を求める手段から前記新たなベクトルを追加する手段を繰返し動作させ、前記現在画像における最終的な分類を求める手段と、
前記現在画像における前記暫定的な分類のいずれかまたは前記最終的な分類に基づいて、前記歪み閾値を更新する手段と、
前記原画像が前記現在画像とされ、前記原画像における前記最終的な分類が求められるまで、前記複数の特徴ベクトルを抽出する手段から前記歪み閾値を更新する手段を繰返し動作させる手段を備えていることを特徴とする画像の特徴ベクトルのクラスタリング装置。Means for deriving a low resolution image composed of a plurality of pixels having different resolutions in stages from the original image;
Means for determining an initial value of each component of the representative vector and an initial value of a distortion threshold from the lowest resolution image having the lowest resolution among the plurality of low resolution images;
Means for extracting an image having the next lowest resolution as a current image and extracting a plurality of feature vectors from the current image;
Means for mapping the plurality of feature vectors to a feature vector space;
Means for classifying the plurality of feature vectors into clusters represented by each of the representative vectors in the feature vector space to obtain a provisional classification in the current image;
Means for updating the representative vector based on the feature vectors included in each of the clusters;
Means for determining a distortion parameter indicative of the provisional classification distortion;
Means for comparing the distortion parameter with the distortion threshold and, if the distortion parameter is greater than the distortion threshold, adding a new vector to the representative vector;
Means for repeatedly operating means for adding the new vector from means for determining the tentative classification until the distortion parameter is less than the distortion threshold, and for determining a final classification in the current image;
Means for updating the distortion threshold based on any of the provisional classifications in the current image or the final classification;
Means for repeatedly operating the means for extracting the plurality of feature vectors from the means for extracting the plurality of feature vectors until the original image is the current image and the final classification in the original image is obtained; An image feature vector clustering device.
前記新たなベクトルを追加する手段が、所属するクラスターを代表する前記代表ベクトルとの距離が最も遠い前記特徴ベクトルと同一のベクトルを、前記新たなベクトルとして前記代表ベクトルに追加する手段であることを特徴とする請求項13または14記載のクラスタリング装置。The distortion parameter is a value indicating the spread of the cluster having the largest spread in the feature vector space among the clusters,
The means for adding the new vector is means for adding, to the representative vector, the same vector as the feature vector having the longest distance from the representative vector representing the cluster to which the new vector belongs. The clustering device according to claim 13 or 14, characterized in that
n個の画素からなる前記最低解像度画像から、1つの原代表ベクトルを導出する手段と、
前記n個の画素の各々から抽出されたn個の特徴ベクトルと、前記原代表ベクトルとの、前記特徴ベクトル空間における距離を求め、最大距離を示す特徴ベクトルを代表ベクトル候補とするとともに、最も高い候補順位を付ける手段と、
残りの特徴ベクトルの各々と、前記原代表ベクトルおよび前記代表ベクトル候補のうち該特徴ベクトルに最も近いものとの、前記特徴ベクトル空間における距離を求め、最大距離を示す特徴ベクトルを前記代表ベクトル候補に追加するとともに、次に高い候補順位を付ける手段と、
前記次に高い候補順位を付ける手段を繰返し動作させる手段と、
前記候補順位に従って、前記代表ベクトル候補のうちの上位いくつかの前記特徴ベクトルの各成分の値を、前記代表ベクトルの各成分の前記初期値とする手段と、
前記n個の特徴ベクトルの前記特徴ベクトル空間における拡がりを示す値を前記歪み閾値の前記初期値とする手段を備えていることを特徴とする請求項11から16いずれか1項記載のクラスタリング装置。Means for determining the initial value;
means for deriving one original representative vector from the lowest resolution image comprising n pixels;
A distance in the feature vector space between the n feature vectors extracted from each of the n pixels and the original representative vector is obtained, and a feature vector indicating the maximum distance is set as a representative vector candidate and the highest A means to rank candidates,
A distance in the feature vector space between each of the remaining feature vectors and the original representative vector and the representative vector candidate closest to the feature vector is obtained, and a feature vector indicating a maximum distance is determined as the representative vector candidate. Means to add and rank the next highest candidate ranking,
Means for repeatedly operating the means for assigning the next highest candidate ranking;
Means for setting the values of the components of the top several feature vectors of the representative vector candidates according to the candidate rank as the initial values of the components of the representative vector;
17. The clustering apparatus according to claim 11, further comprising a unit that sets a value indicating a spread of the n feature vectors in the feature vector space as the initial value of the distortion threshold.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003046014A JP2004258749A (en) | 2003-02-24 | 2003-02-24 | Method and device for clustering feature vector of image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003046014A JP2004258749A (en) | 2003-02-24 | 2003-02-24 | Method and device for clustering feature vector of image |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004258749A true JP2004258749A (en) | 2004-09-16 |
Family
ID=33112678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003046014A Withdrawn JP2004258749A (en) | 2003-02-24 | 2003-02-24 | Method and device for clustering feature vector of image |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004258749A (en) |
-
2003
- 2003-02-24 JP JP2003046014A patent/JP2004258749A/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4690339B2 (en) | Image processing | |
CN108629783B (en) | Image segmentation method, system and medium based on image feature density peak search | |
JP4253335B2 (en) | Method and apparatus for filtering and clustering by means of image mean shift using kernel function values | |
Carreira-Perpinan | Acceleration strategies for Gaussian mean-shift image segmentation | |
US8488190B2 (en) | Image processing apparatus, image processing apparatus control method, and storage medium storing program | |
CN110866896B (en) | Image saliency target detection method based on k-means and level set super-pixel segmentation | |
JP4098021B2 (en) | Scene identification method, apparatus, and program | |
US8995761B2 (en) | Image processing apparatus, image processing method, and computer-readable medium | |
US20140149412A1 (en) | Information processing apparatus, clustering method, and recording medium storing clustering program | |
CN1716316A (en) | Color segmentation-based stereo 3D reconstruction system and process | |
JP2004361987A (en) | Image retrieval system, image classification system, image retrieval program, image classification program, image retrieval method, and image classification method | |
JP2004164624A (en) | Method and apparatus for low depth of field image segmentation | |
JP2014041476A (en) | Image processing apparatus, image processing method, and program | |
JP2013536960A (en) | System and method for synthesizing portrait sketches from photographs | |
JP2005513632A (en) | Split an image using the water source method | |
JP5888068B2 (en) | Image processing apparatus and program | |
CN107533760A (en) | A kind of image partition method and device | |
JP3708042B2 (en) | Image processing method and program | |
JP2011210111A (en) | Image feature quantity generation device, method and program | |
JP2009123234A (en) | Object identification method, apparatus and program | |
JP4967045B2 (en) | Background discriminating apparatus, method and program | |
JP6546385B2 (en) | IMAGE PROCESSING APPARATUS, CONTROL METHOD THEREOF, AND PROGRAM | |
JP6151908B2 (en) | Learning device, identification device, and program thereof | |
JP2004258749A (en) | Method and device for clustering feature vector of image | |
JP2006031392A (en) | Template matching device and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060509 |