JP4036009B2 - Image data classification device - Google Patents
Image data classification device Download PDFInfo
- Publication number
- JP4036009B2 JP4036009B2 JP2002036237A JP2002036237A JP4036009B2 JP 4036009 B2 JP4036009 B2 JP 4036009B2 JP 2002036237 A JP2002036237 A JP 2002036237A JP 2002036237 A JP2002036237 A JP 2002036237A JP 4036009 B2 JP4036009 B2 JP 4036009B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- distance
- classification
- feature
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、画像データの分類に関する。
【0002】
【従来の技術】
従来、登録された画像データを分類および検索するために、画像データと共にキーワードなどのコード情報を付加するのが一般的であった。このコード情報は、画像データを登録する際、またはすでに登録された画像データを分類、整理する際に、キーボードなどから入力されていた。しかし、このような方法では、分類あるいは検索対象となる画像データを登録する際に、コード情報を人手によって入力しなければならず、多大な作業量を要するという問題があった。
【0003】
そこで、画像データから様々な特徴量を抽出して特徴ベクトルを構成し、これをコード情報に代わる情報として分類、検索に用いる方法が提案されている。また、画像データ間の類似度は、画像データから抽出した特徴ベクトル間の距離の近さに応じて定義されているが、特徴ベクトルの分布やベクトル距離計算の定義に類似度が依存してしまい、望ましい類似度が求められない可能性が指摘されていた。この特徴ベクトルの分布による依存性を排除するために、特開平9−265529号公報に記載された技術においては、特徴ベクトルの分布により分類結果を補正することにより、分布による影響を排除している。
【0004】
また、特徴ベクトルによる分類を行う場合、様々な側面から画像データを捉えるために多くの種類の特徴量を抽出しており、特徴ベクトルが高次元となっていた。特徴ベクトルを用いて分類、検索を行う場合、これが高次元であると、ベクトルの照合の処理時間が増大するという問題があった。
【0005】
そこで、多くの場合、蓄積された特徴ベクトルに対して主成分分析を行うことで、特徴ベクトルの直交性を保証し、分散の小さい空間軸を排除することにより、特徴ベクトルの次元数を抑えている。また、特開平11−219347号公報では、蓄積された特徴ベクトルを階層的に記述しておき、検索あるいは分類の際には、可能性の低い階層の照合を省略することにより、処理の高速化を図っている。
【0006】
【発明が解決しようとする課題】
しかし、前述の公報に記載された技術によっても、特徴ベクトルにより分類あるいは検索された結果が、妥当性のあるものであるのか保証することはできなかった。つまり、特徴ベクトルにより分類された結果が、ユーザの望むような分類となっていない場合があった。
【0007】
また、蓄積されている特徴ベクトルの空間軸数が非常に多かったり、蓄積されている特徴ベクトルの分散が大きい場合には、主成分分析を行っても特徴ベクトルの空間軸数を十分に減らすことができない場合があった。
【0008】
本発明は、このような問題点を考慮してなされたものであり、画像データから抽出した特徴ベクトルによる分類が、ユーザの望む分類に近くなるようにし、また処理負担の軽減することを目的とする。
【0009】
【課題を解決するための手段】
前述の課題を解決するために、本発明にかかる画像データ分類装置においては、まず、あらかじめ複数の参照群に分類された画像データの特徴ベクトルに基づき、2種類以上の距離定義により、個々の画像データ間のベクトル区間距離を算出し、この算出されたベクトル間距離により、前記参照群に属する画像データの分類を行う。そして、この分類結果を前記参照群の分類のされ方と比較して、参照群の分類と類似した分類結果が得られた距離定義を得る。この距離定義を適用して未分類の画像データの分類を行う。
【0010】
また、前記距離算出手段によるベクトル間距離の算出は、前記特徴ベクトルの分散、共分散および密度の少なくとも一つに基づいて行うことができる。
【0011】
また、前記距離算出手段によるベクトル間距離の算出は、前記特徴ベクトルの所定の空間軸に関する出現確率に基づいて行うことができる。
【0012】
また、前記画像データの特徴ベクトルは、当該画像データの登録に関する空間軸を含み、前記距離算出手段によるベクトル間距離の算出は、前記画像の登録に関する空間軸に対応した出現確率に基づいて行うことができる。
【0013】
また、他の画像データ分類装置は、あらかじめ複数の参照群に分類された画像データのn次元特徴ベクトルに基づき、前記参照群間のベクトル間距離を算出する。また、このn次元特徴ベクトルの各空間軸の、ベクトル間距離に関する寄与度を算出し、この寄与度の高い空間軸を、nより小さいm個を抽出し、m次元の特徴ベクトル空間を抽出する。そして、未分類の画像データに対し、前記m次元特徴ベクトル空間において、ベクトル間距離に基づき、前記未分類の画像データの分類を行う。
【0014】
前記寄与度の算出にあたっては、前記n次元特徴ベクトルの少なくとも一つの空間軸を排除した特徴ベクトルに基づき参照群間の距離を算出し、この距離とn次元特徴ベクトルに基づく距離との比較により、前記排除した空間軸の寄与度を算出することができる。
【0015】
【発明の実施の形態】
以下、本発明の実施の形態(以下実施形態という)を、図面に従って説明する。図1は、本実施形態の画像データ分類装置が適用されるネットワークの概略構成を示す図である。ネットワークには、インストールされた所定のプログラムによって本実施形態の画像データ分析装置として機能するコンピュータであるクライアント1、紙などの印刷媒体上の画像を取り込むスキャナ2、データベースを提供するデータベースサーバー3およびネットワークの管理を行うウェブサーバー4が接続されている。また、ノート型コンピュータ、携帯情報端末などの外部端末5とネットワークを接続するルータ6も設けられている。画像データは、前記のスキャナの他、ネット上から、外部端末5から、さらにはクライアント1の外部記憶媒体用のドライブから読み込むことができる。
【0016】
図2は、本実施形態の機能構成図であって、特に画像データを分類するための距離定義の選択にかかる構成を示している。画像データ10は、二つの参照群12,14に、あらかじめ分類されて、記憶されている。この分類は、ユーザにとって好ましいものとなっている。特徴ベクトル抽出手段16により、第1の参照群12と第2の参照群14に分類されている各画像データより特徴ベクトルを抽出する。抽出された各特徴ベクトル間の距離を距離算出手段18により算出する。距離算出手段18は、N個の距離定義に基づきぞれぞれの距離を算出する第1距離算出部18-1、第2距離算出部18-2、・・・第N距離算出部18-Nを含む。距離算出手段18で算出された複数の距離は、それぞれ評価手段20によりその距離定義の妥当性が評価される。評価手段20は、N個の距離算出部18-1〜18-Nに1対1に対応してN個の評価部、すなわち第1評価部20-1、第2評価部20-2、・・・第N評価部20-Nを含んでいる。各評価部20-1〜20-Nは、対応する距離算出部18-1〜18-Nが各々算出した距離に基づき、二つの参照群12,14に属する画像データを再度分類する。そして、この再分類が、好ましく分類された参照群の分類と、どの程度類似するかを評価する。各評価部20-1〜20-Nの評価結果に基づき、距離定義選択手段22は、適切な距離定義を選択する。距離定義の選択は、その距離定義によって分類された画像データが、参照群12,14と同じように、またはどの程度類似して分類されているかに基づき行うことができる。
【0017】
図3は、本実施形態の機能構成図であって、特に、好ましい分類を行うために選択され定義された距離に基づく未分類の画像データの分類にかかる構成を示している。未分類画像データ24のそれぞれの特徴ベクトルが、特徴ベクトル抽出手段26によって抽出される。さらに、距離算出手段28によって、抽出された各特徴ベクトル間の距離が算出される。このときの距離算出に用いられる距離定義は、前述の距離定義選択手段22により選択されたものである。分類手段30により、算出された各ベクトル間距離に基づき未分類の各画像データ24の分類を行い、分類された画像データを、データベース32に登録する。
【0018】
図4は、本実施形態の、画像データの距離定義の選択に係る処理フローチャートである。まず、すでに好ましい分類が行われている画像データを入力し(S100)、特徴ベクトルの抽出を行い(S102)、データベース32に登録する。このときの好ましい分類とは、例えばユーザによる分類およびその評価を事前に行ったものであり、客観評価の他、主観評価による分類も含まれる。また、特徴ベクトルとは、画像データにより定量的に取り出すことのできる値からなるn次元ベクトルである。例えば、画像データに含まれる色情報やエッジ情報など、画像処理によって得られるn個の特徴量からなる。上記一連の処理を分析対象となる画像データがなくなるまで繰り返す(S104)。
【0019】
次に、所定の複数の距離定義から一つを選び(S106)、ステップS100で入力された画像データの分類された群(参照群)間で、特徴ベクトル間距離を求める(S108)。ここでいう距離定義とは、ベクトル間の距離(類似度または非類似度としてもよい)を求める上での定義のことで、例えば、チェビシェフ距離、特徴ベクトルの分散、共分散を考慮に入れたマハラノビス距離あるいはユークリッド距離などを用いる。独自に定義したもの、例えば各分類の密度を考慮に入れた距離や画像データの登録者、登録順序、登録間隔および登録日時などの少なくとも一つに対応した出現確率を反映させた距離などを用いてもよい。出現確率とは、例えば、ある画像データに、登録日時が近い画像データが来たときに、後者の画像データが、前者の画像データに同一の群に分類される確率を示す。登録者が同じであれば、同傾向の画像データが登録される傾向が強いと考えられる。また、登録順序や登録日時が近い画像であれば、一つのイベント(例えば運動会)の各シーンの映像である可能性が高いと考えられる。
【0020】
計算された距離に基づき、特徴ベクトルの分類を行う(S110)。ここで分類とは、特徴ベクトル間の距離を基に、その距離の近いものをまとめていくというものである。一般にクラスタ分析などといわれる方法を用いる。クラスタ解析には階層的手法と非階層的手法があるが、ここではどちらを用いることもできる。全特徴ベクトルの分類が終了したならば(S112)、事前の分類、すなわち参照群を分けた分類との比較を行う(S114)。上記ステップS106〜S114を、評価対象となる距離定義がなくなるまで繰り返し(S116)、全ての距離定義について評価が終了したら、最終的に距離定義の選択を行う(S118)。この距離定義の選択は、各距離定義に対してなされた評価の結果を比較し、事前に好ましく分類された参照群に、より類似する分類がなされた距離定義を選択する。
【0021】
図5は、本実施形態の、未分類画像データの分類に係る処理を示すフローチャートである。まず、これから分類する(未分類の)画像データを取り込み(S120)、これらの各画像データの特徴ベクトルを抽出し、これをデータベース32に登録する(S122)。この特徴ベクトルは、図4に示すチャートのステップS102で抽出したものと同等のベクトルであり、画像データより定量的に取り出すことができる値からなるn次元ベクトルである。特徴ベクトルの抽出を分類対象となる画像データがなくなるまで繰り返す(S124)。
【0022】
次に、図4のチャートのステップS118で選択された距離定義を呼び出し(S126)、この距離計算方法に基づき未分類画像データの各特徴ベクトル間の距離の算出を行う(S128)。算出された距離に基づき、図4のチャートのステップS110と同様の分類手法により、特徴ベクトルの、すなわち未分類画像データの分類を行う(S130)。分類が終了した(S132)ならば、分類結果をデータベース32に登録する(S138)。
【0023】
以上のように、本実施形態においては、すでに分類されている画像データと同様または類似の分類となるような距離定義に基づき新たな画像データの分類を行う。したがって、新たな画像データを分類する際に、すでに分類されている画像データを参照して、この分類と同等または類似の分類を自動的に行うことが可能となる。
【0024】
図6は、本発明の関連技術の機能構成図であって、特に画像データを分類するための特徴ベクトルの抽出にかかる構成を示している。画像データ50は、二つの参照群52,54に、あらかじめ分類されて、記憶されている。この分類は、ユーザにとって好ましいものとなっている。第1の参照群52と第2の参照群54に分類されている各画像データは、n次元の特徴ベクトルを有している。この特徴ベクトルの各空間軸が表す特徴量を一つずつ特徴量抽出手段58により抽出する。そして、その特徴量の一つずつに対して特徴量評価手段60にてその特徴量が画像データ50を二つの参照群52,54に分けるに当たってどの程度寄与しているかを評価する。具体的には、特徴量抽出手段58は、前記n次元特徴ベクトルを構成する第1〜第nの空間軸のうち、それぞれ一つを抽出する第1〜第n特徴量抽出部58-1〜58-nを含む。特徴量評価手段60は、前述の第1〜第n特徴量抽出部58-1〜58-nに1対1に対応して第1〜第n特徴量評価部60-1〜60-nを含む。各特徴量評価部60-1〜60-nは、それぞれ対応する各特徴量抽出部58-1〜58-nで抽出された特徴量に対して参照群52,54の分類の寄与度を評価する。具体的には、抽出された一つの特徴量(空間軸)を除いた(n−1)次元の特徴ベクトルを形成し、この特徴ベクトルに基づき参照群52,54に属する画像データ50を再分類する。この再分類が、二つの参照群52,54と同様または類似の分類となるのであれば、除いた特徴量は参照群52,54の分類への寄与が低いことが判断できる。逆に、再分類において、大きく分類が異なるようになれば、除いた特徴量が参照群52,54の分類への寄与が高いことが判断できる。各空間軸に対して評価を行い、特徴ベクトル構成手段62により寄与度の高いm個(n>m)の空間軸によりm次特徴ベクトルを構成する。
【0025】
図7は、本発明の関連技術の機能構成図であって、特に、好ましい分類を行うために抽出されたm次元特徴ベクトルに基づく未分類の画像データの分類にかかる構成を示している。未分類画像データ64のそれぞれのm個の特徴量が特徴量抽出手段66により抽出される。特徴量抽出手段は、m個の第1〜第m特徴量抽出部66-1〜66-mにより構成され、一つの特徴量に対し、一つの抽出部が対応している。抽出された特徴量より、特徴ベクトル生成手段68にて、m次元特徴ベクトルを生成する。このm次元特徴ベクトル空間において、分類手段70にて分類を行い、分類結果をデータベース72に登録する。
【0026】
図8は、本発明の関連技術の、分類のための特徴量の抽出に係る処理フローチャートである。まず、すでに好ましい分類が行われている画像データを入力し(S200)、各画像データごとにn個の特徴量を抽出し、データベース72に登録する(S202)。ここで、特徴量とは、画像データより定量的に取り出すことのできる値であり、例えば、画像データに含まれる色情報やエッジ情報など、画像処理によって得られる値である。この処理を分析対象となる画像データがなくなるまで繰り返す(S204)。
【0027】
次に、n次元特徴ベクトル空間から、一つの特徴量(空間軸)を除いた特徴量で構成される(n−1)次元特徴ベクトル空間を取り出し(S206)、参照群52,54間の距離を測る(S208)。この際(n−1)次元特徴ベクトル空間における参照群の重心を求め、この重心間の距離を測り、参照群間の距離とする。こうして得られた(n−1)次元特徴ベクトル空間における参照群間の距離と、n次元特徴ベクトル空間における参照群間の距離からウイルクスのΛ統計量を求めて比較し、取り除かれた特徴量が分類に寄与しているかを示す寄与度を求める(S210)。この処理をn個の特徴量全てに対して行う(S212)。上記の寄与度に基づき、実際の分類に用いるm次元特徴ベクトル空間を選択する。この際、統計的に有意と認められる特徴量を選択し、あるいは所定の条件で抽出した寄与度の上位i個または上位j%の特徴量を選択する(S214)。
【0028】
図9は、本発明の関連技術の、未分類画像データの分類に係る処理を示すフローチャートである。まず、これから分類する(未分類の)画像データを取り込み(S216)、これらの各画像データの特徴量を抽出し、これをデータベース72に登録する(S218)。この特徴量は、図8に示すチャートのステップS202で抽出したものと同等のベクトルであり、画像データより定量的に取り出すことができる値からなるn個の特徴量である。特徴ベクトルの抽出を分類対象となる画像データがなくなるまで繰り返す(S220)。
【0029】
次に、図8のチャートのステップS214で決定した特徴ベクトル空間を用い(S222)、未分類画像データの各特徴ベクトル間の距離の算出を行う(S224)。算出された距離に基づき、特徴ベクトルの分類を行う(S226)。この分類は、特徴ベクトル間の距離を基に、その距離の近いものをまとめていくというものである。一般にクラスタ分析などといわれる方法を用いる。クラスタ解析には、階層的手法と非階層的手法があるが、どちらを用いてもよい。特徴ベクトルの分類が終了したら(S228)、分類結果をデータベースに登録し(S230)、終了する。
【0030】
上記関連技術によれば、すでに分類されている画像データの分類に関し、寄与度の高い特徴量により構成される特徴量ベクトルにより、新たな画像データの分類を行う。よって、新たな画像データの分類をする際に、すでに分類されている画像データの分類と同様または類似する分類を自動的に行うことができる。また、寄与度の高い特徴量を選び出していることにより、分類に用いる特徴量ベクトルの次元を低くすることができ、処理負担が軽減される。
【図面の簡単な説明】
【図1】 ネットワーク環境の一例を示す図である。
【図2】 本実施形態の機能を示すブロック図であり、特に分類に用いる距離定義の決定に係る構成を示す図である。
【図3】 本実施形態の機能を示すブロック図であり、特に未分類の画像データの分類に係る構成を示す図である。
【図4】 本実施形態の処理を示すフローチャートであり、特に分類に用いる距離定義の決定に係るチャートである。
【図5】 本実施形態の処理を示すフローチャートであり、特に未分類の画像データの分類に係るチャートである。
【図6】 の機能を示すブロック図であり、特に分類に用いる特徴量の抽出に係る構成を示す図である。
【図7】 本発明の関連技術の機能を示すブロック図であり、特に未分類の画像データの分類に係る構成を示す図である。
【図8】 本発明の関連技術の処理を示すフローチャートであり、特に分類に用いる特徴量の抽出に係る構成を示す図である。
【図9】 本発明の関連技術の処理を示すフローチャートであり、特に未分類の画像データの分類に係るチャートである。
【符号の説明】
10,50 画像データ(分類済み)、12,52 第1参照群、14,54 第2参照群、16 特徴ベクトル抽出手段、18 距離算出手段、20 評価手段、22 距離定義選択手段、24,64 画像データ(未分類)、26 特徴ベクトル抽出手段、28 距離算出手段、30 分類手段、32,72 データベース、58 特徴量抽出手段、60 特徴量評価手段、62 特徴ベクトル構成手段、66 特徴量抽出手段、68 特徴ベクトル生成手段、70 分類手段。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to image data classification.
[0002]
[Prior art]
Conventionally, in order to classify and search registered image data, it has been common to add code information such as keywords together with the image data. This code information has been input from a keyboard or the like when registering image data or classifying and organizing already registered image data. However, in such a method, when registering image data to be classified or searched, there is a problem that code information must be manually input, and a large amount of work is required.
[0003]
In view of this, a method has been proposed in which a feature vector is constructed by extracting various feature amounts from image data, and this is used for classification and retrieval as information replacing code information. The similarity between image data is defined according to the distance between feature vectors extracted from the image data. However, the similarity depends on the distribution of feature vectors and the definition of vector distance calculation. It was pointed out that the desired similarity may not be required. In order to eliminate the dependency due to the feature vector distribution, the technique described in Japanese Patent Laid-Open No. 9-265529 eliminates the influence of the distribution by correcting the classification result based on the feature vector distribution. .
[0004]
In addition, when performing classification based on feature vectors, many types of feature quantities are extracted in order to capture image data from various aspects, and the feature vectors are high-dimensional. When performing classification and retrieval using feature vectors, there is a problem that the processing time of vector matching increases if this is high-dimensional.
[0005]
Therefore, in many cases, by performing principal component analysis on the accumulated feature vectors, the orthogonality of the feature vectors is guaranteed, and by eliminating the spatial axis with small variance, the number of feature vector dimensions can be reduced. Yes. In Japanese Patent Laid-Open No. 11-219347, the accumulated feature vectors are described hierarchically, and when searching or classifying, the collation of the unlikely hierarchy is omitted, thereby speeding up the processing. I am trying.
[0006]
[Problems to be solved by the invention]
However, even with the technique described in the above-mentioned publication, it has not been possible to guarantee whether the result classified or searched by the feature vector is valid. That is, there are cases where the result classified by the feature vector is not the classification desired by the user.
[0007]
Also, if the number of stored feature vectors has a large number of spatial axes, or if the distribution of stored feature vectors is large, the number of feature vectors can be reduced sufficiently even if principal component analysis is performed. There was a case that could not be.
[0008]
The present invention has been made in consideration of such problems, and it is an object of the present invention to make classification based on feature vectors extracted from image data close to classification desired by a user and to reduce processing load. To do.
[0009]
[Means for Solving the Problems]
In order to solve the above-described problem, in the image data classification device according to the present invention, first, based on the feature vectors of image data previously classified into a plurality of reference groups, individual images are defined by two or more types of distance definitions. A vector section distance between data is calculated, and image data belonging to the reference group is classified based on the calculated distance between vectors. Then, the classification result is compared with the classification method of the reference group to obtain a distance definition that provides a classification result similar to the classification of the reference group. This distance definition is applied to classify unclassified image data.
[0010]
Further, the calculation of the distance between vectors by the distance calculation means can be performed based on at least one of variance, covariance and density of the feature vector.
[0011]
Further, the calculation of the distance between vectors by the distance calculation means can be performed based on the appearance probability of the feature vector with respect to a predetermined spatial axis.
[0012]
Further, the feature vector of the image data includes a spatial axis related to registration of the image data, and the calculation of the inter-vector distance by the distance calculation means is performed based on the appearance probability corresponding to the spatial axis related to the registration of the image. Can do.
[0013]
Another image data classification device calculates the inter-vector distance between the reference groups based on the n-dimensional feature vectors of the image data previously classified into a plurality of reference groups. In addition, the degree of contribution related to the inter-vector distance of each space axis of the n-dimensional feature vector is calculated, m space axes having a high degree of contribution are extracted, and m-dimensional feature vector spaces are extracted. . Then, the unclassified image data is classified in the m-dimensional feature vector space based on the inter-vector distance.
[0014]
In calculating the contribution, a distance between reference groups is calculated based on a feature vector excluding at least one spatial axis of the n-dimensional feature vector, and a comparison between the distance and a distance based on the n-dimensional feature vector is performed. The degree of contribution of the excluded space axis can be calculated.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention (hereinafter referred to as embodiments) will be described with reference to the drawings. FIG. 1 is a diagram showing a schematic configuration of a network to which the image data classification device of this embodiment is applied. The network includes a client 1 that is a computer functioning as an image data analysis apparatus according to the present embodiment by a predetermined program installed, a scanner 2 that captures an image on a print medium such as paper, a database server 3 that provides a database, and a network Is connected to a
[0016]
FIG. 2 is a functional configuration diagram of the present embodiment, and particularly shows a configuration related to selection of a distance definition for classifying image data. The
[0017]
FIG. 3 is a functional configuration diagram of the present embodiment, and particularly shows a configuration related to classification of unclassified image data based on a distance selected and defined for performing preferable classification. Each feature vector of the
[0018]
FIG. 4 is a process flowchart relating to selection of a distance definition of image data according to the present embodiment. First, image data that has already been classified preferably is input (S100), feature vectors are extracted (S102), and registered in the
[0019]
Next, one is selected from a plurality of predetermined distance definitions (S106), and a distance between feature vectors is obtained between the classified groups (reference groups) of the image data input in step S100 (S108). The distance definition here is a definition for obtaining a distance between vectors (which may be a similarity or dissimilarity). For example, the Chebyshev distance, feature vector variance, and covariance are taken into account. Use Mahalanobis distance or Euclidean distance. For example, a distance that takes into account the density of each classification, a distance that reflects the probability of appearance corresponding to at least one of the registrant of image data, registration order, registration interval, registration date, etc. May be. The appearance probability indicates, for example, the probability that the image data of the latter is classified into the same group as the former image data when the image data having a similar registration date and time comes to certain image data. If the registrants are the same, it is considered that image data having the same tendency is strongly registered. In addition, if the registration order and the registration date and time are close to each other, it is highly possible that the images are scene images of one event (for example, athletic meet).
[0020]
Based on the calculated distance, the feature vectors are classified (S110). Here, the classification is to group together those having a short distance based on the distance between feature vectors. In general, a method called cluster analysis is used. There are a hierarchical method and a non-hierarchical method for cluster analysis, but either can be used here. When the classification of all feature vectors is completed (S112), the comparison with the prior classification, that is, the classification into which the reference group is divided is performed (S114). The above steps S106 to S114 are repeated until there is no distance definition to be evaluated (S116). When the evaluation is completed for all the distance definitions, the distance definition is finally selected (S118). The selection of the distance definition compares the results of evaluations made for each distance definition, and selects a distance definition that has been classified more similar to a reference group that has been preferably classified in advance.
[0021]
FIG. 5 is a flowchart showing processing relating to classification of unclassified image data according to the present embodiment. First, image data to be classified (unclassified) is fetched (S120), feature vectors of these image data are extracted and registered in the database 32 (S122). This feature vector is a vector equivalent to that extracted in step S102 of the chart shown in FIG. 4, and is an n-dimensional vector composed of values that can be extracted quantitatively from the image data. The feature vector extraction is repeated until there is no image data to be classified (S124).
[0022]
Next, the distance definition selected in step S118 of the chart of FIG. 4 is called (S126), and the distance between each feature vector of unclassified image data is calculated based on this distance calculation method (S128). Based on the calculated distance, the feature vector, that is, the unclassified image data is classified by the same classification method as in step S110 of the chart of FIG. 4 (S130). If the classification is completed (S132), the classification result is registered in the database 32 (S138).
[0023]
As described above, in this embodiment, new image data is classified based on a distance definition that is similar to or similar to already classified image data. Therefore, when classifying new image data, it is possible to automatically perform classification equivalent to or similar to this classification with reference to already classified image data.
[0024]
FIG. 6 is a functional configuration diagram of the related art of the present invention , and particularly shows a configuration related to extraction of feature vectors for classifying image data. The
[0025]
FIG. 7 is a functional configuration diagram of the related art of the present invention , and particularly shows a configuration related to classification of unclassified image data based on an m-dimensional feature vector extracted for performing preferable classification. The m feature amounts of each of the
[0026]
FIG. 8 is a flowchart of processing related to feature amount extraction for classification according to the related art of the present invention . First, image data that has been preferably classified is input (S200), n feature quantities are extracted for each image data, and registered in the database 72 (S202). Here, the feature amount is a value that can be quantitatively extracted from the image data, for example, a value obtained by image processing such as color information and edge information included in the image data. This process is repeated until there is no image data to be analyzed (S204).
[0027]
Next, an (n−1) -dimensional feature vector space composed of features obtained by removing one feature (space axis) is extracted from the n-dimensional feature vector space (S206), and the distance between the
[0028]
FIG. 9 is a flowchart showing processing relating to classification of unclassified image data according to the related art of the present invention . First, the image data to be classified (unclassified) is fetched (S216), and the feature amount of each image data is extracted and registered in the database 72 (S218). This feature quantity is a vector equivalent to that extracted in step S202 of the chart shown in FIG. 8, and is n feature quantities having values that can be extracted quantitatively from the image data. The feature vector extraction is repeated until there is no image data to be classified (S220).
[0029]
Next, using the feature vector space determined in step S214 of the chart of FIG. 8 (S222), the distance between each feature vector of unclassified image data is calculated (S224). Based on the calculated distance, the feature vectors are classified (S226). This classification is based on the distances between feature vectors, and those with close distances are collected. In general, a method called cluster analysis is used. Cluster analysis includes a hierarchical method and a non-hierarchical method, either of which may be used. When the feature vector classification is completed (S228), the classification result is registered in the database (S230), and the process ends.
[0030]
According to the related technology , new image data is classified based on feature quantity vectors composed of feature quantities having a high contribution degree with respect to classification of already classified image data. Therefore, when new image data is classified, classification similar to or similar to the classification of already classified image data can be automatically performed. Further, by selecting feature amounts having a high contribution, the dimension of the feature vector used for classification can be reduced, and the processing burden is reduced.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating an example of a network environment.
FIG. 2 is a block diagram illustrating functions of the present embodiment, and particularly a configuration related to determination of a distance definition used for classification.
FIG. 3 is a block diagram illustrating functions of the present embodiment, and particularly a configuration related to classification of unclassified image data.
FIG. 4 is a flowchart showing processing of the present embodiment, and is a chart relating to determination of a distance definition used for classification in particular.
FIG. 5 is a flowchart showing processing of the present embodiment, particularly a chart relating to classification of unclassified image data.
FIG. 6 is a block diagram showing the function of, and is a diagram showing a configuration related to extraction of feature amounts used for classification in particular.
FIG. 7 is a block diagram showing functions of a related technique of the present invention , and particularly a diagram showing a configuration relating to classification of unclassified image data.
FIG. 8 is a flowchart showing processing according to a related technique of the present invention , and particularly shows a configuration related to extraction of feature amounts used for classification.
FIG. 9 is a flowchart showing processing according to the related art of the present invention , particularly a chart relating to classification of unclassified image data.
[Explanation of symbols]
10, 50 Image data (classified), 12, 52 First reference group, 14, 54 Second reference group, 16 Feature vector extraction means, 18 Distance calculation means, 20 Evaluation means, 22 Distance definition selection means, 24, 64 Image data (unclassified), 26 feature vector extraction means, 28 distance calculation means, 30 classification means, 32, 72 database, 58 feature quantity extraction means, 60 feature quantity evaluation means, 62 feature vector construction means, 66 feature quantity extraction means 68 Feature vector generation means, 70 Classification means.
Claims (4)
あらかじめ複数の参照群に分類された画像データの特徴ベクトルに基づき、2種類以上の距離定義により、個々の画像データ間のベクトル間距離を算出する距離算出手段と、
前記算出されたベクトル間距離により、前記参照群に属する画像データの分類を行い、この分類結果を前記参照群と比較して、当該ベクトル間距離を算出した距離定義を評価し、前記参照群の分類と類似した分類がなされた距離定義を選択する距離定義選択手段と、
未分類の画像データに対し、前記選択された距離定義を適用して、当該未分類の画像データの分類を行う分類手段と、
を有する画像データ分類装置。An image data classification device that classifies the image data based on feature vectors extracted from the image data,
Distance calculating means for calculating a distance between vectors of individual image data based on two or more types of distance definitions based on feature vectors of image data classified in advance into a plurality of reference groups;
The image data belonging to the reference group is classified based on the calculated inter-vector distance, the classification result is compared with the reference group, the distance definition for calculating the inter-vector distance is evaluated, and the reference group A distance definition selection means for selecting a distance definition having a classification similar to the classification;
Applying the selected distance definition to unclassified image data, classifying means for classifying the unclassified image data,
An image data classification device having
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002036237A JP4036009B2 (en) | 2002-02-14 | 2002-02-14 | Image data classification device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002036237A JP4036009B2 (en) | 2002-02-14 | 2002-02-14 | Image data classification device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003242160A JP2003242160A (en) | 2003-08-29 |
JP4036009B2 true JP4036009B2 (en) | 2008-01-23 |
Family
ID=27778178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002036237A Expired - Fee Related JP4036009B2 (en) | 2002-02-14 | 2002-02-14 | Image data classification device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4036009B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007017264A (en) * | 2005-07-07 | 2007-01-25 | Sharp Corp | Method and device for evaluating image processing algorithm, method and device for generating image processing algorithm, program, and program recording medium |
JP5455787B2 (en) | 2010-05-27 | 2014-03-26 | パナソニック株式会社 | Motion analysis apparatus and motion analysis method |
JP6213665B2 (en) | 2014-03-18 | 2017-10-18 | 日本電気株式会社 | Information processing apparatus and clustering method |
JP6418841B2 (en) * | 2014-08-07 | 2018-11-07 | キヤノン株式会社 | Data processing method and data processing apparatus |
CN111930935A (en) * | 2020-06-19 | 2020-11-13 | 普联国际有限公司 | Image classification method, device, equipment and storage medium |
-
2002
- 2002-02-14 JP JP2002036237A patent/JP4036009B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003242160A (en) | 2003-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bicego et al. | Similarity-based clustering of sequences using hidden Markov models | |
Bouguila | Clustering of count data using generalized Dirichlet multinomial distributions | |
EP2100260B1 (en) | Identifying images using face recognition | |
Ibrahim et al. | Cluster representation of the structural description of images for effective classification | |
US8719267B2 (en) | Spectral neighborhood blocking for entity resolution | |
CN109977994B (en) | Representative image selection method based on multi-example active learning | |
US20050265607A1 (en) | Multimodal high-dimensional data fusion for classification and identification | |
US20060133666A1 (en) | Methods and systems for feature selection | |
US5774576A (en) | Pattern recognition by unsupervised metric learning | |
US20030182082A1 (en) | Method for determining a quality for a data clustering and data processing system | |
Jenni et al. | Pre-processing image database for efficient Content Based Image Retrieval | |
JP4082043B2 (en) | Image search device | |
US8682065B2 (en) | Distance metric learning with feature decomposition | |
JP4036009B2 (en) | Image data classification device | |
WO2019184480A1 (en) | Item recommendation | |
Wang et al. | SpecVAT: Enhanced visual cluster analysis | |
JP4703487B2 (en) | Image classification method, apparatus and program | |
JP5971722B2 (en) | Method for determining transformation matrix of hash function, hash type approximate nearest neighbor search method using the hash function, apparatus and computer program thereof | |
CN111314109A (en) | Weak key-based large-scale Internet of things equipment firmware identification method | |
Wang et al. | Finding uninformative features in binary data | |
CN115935082A (en) | User cold start content recommendation method, computing device and storage medium | |
Schreck et al. | A new metaphor for projection-based visual analysis and data exploration | |
US10984075B1 (en) | High dimensional to low dimensional data transformation and visualization system | |
JP5923744B2 (en) | Image search system, image search method, and search apparatus | |
Li et al. | Gene function classification using fuzzy k-nearest neighbor approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040913 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070710 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070904 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071009 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071022 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101109 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111109 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111109 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121109 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121109 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131109 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |