JPWO2009072466A1 - 画像分類装置および画像分類プログラム - Google Patents
画像分類装置および画像分類プログラム Download PDFInfo
- Publication number
- JPWO2009072466A1 JPWO2009072466A1 JP2009544662A JP2009544662A JPWO2009072466A1 JP WO2009072466 A1 JPWO2009072466 A1 JP WO2009072466A1 JP 2009544662 A JP2009544662 A JP 2009544662A JP 2009544662 A JP2009544662 A JP 2009544662A JP WO2009072466 A1 JPWO2009072466 A1 JP WO2009072466A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- cluster
- color
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
- G06T7/44—Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/54—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
Abstract
Description
本発明の最良の実施の形態に係る画像分類装置1は、複数の画像データを、類似した画像毎に分類する。本発明の最良の実施の形態に係る画像分類装置1は、画像データベース51中に存在する画像データを類似した画像毎に分類し、得られる分類結果に基づいて画像を検索する。さらに、画像分類装置1は、分類、検索の結果を3次元空間上で可視化を行い、提示する。分類・検索結果を3次元空間上に配置することで、画像分類装置1は、空間的な距離により画像間の類似性を理解することが可能なユーザインターフェースを実現することができる。
図2を参照して、本発明の最良の実施の形態に係る画像分類装置1の処理の概要を説明する。
ここで、ステップS3およびステップS4においては、色コリログラムのみを用いて処理する場合について説明したが、色ヒストグラムだけを用いても良いし、色コリログラムと色ヒストグラムを用いても良い
図3に示すように、本発明の最良の実施の形態に係る画像分類装置1は、中央処理制御装置101、ROM(Read Only Memory)102、RAM(Random Access Memory)103及び入出力インタフェース109を備える。これらは、バス110を介して接続されている。入出力インタフェース109には、入力装置104、表示装置105、通信制御装置106、記憶装置107及びリムーバブルディスク108が接続されている。
図1に示すように、本発明の最良の実施の形態に係る画像分類装置1は、画像データベース51、分類部10および表示部20を備える。分類部10は、特徴量算出部11、第1のクラスタリング部12、第2のクラスタリング部13およびクラスタ統合部14を備える。
ここで、本発明の特徴量算出部11は、各画像データの色コリログラムに基づいて算出する場合について説明するが、色ヒストグラムを用いても良いし、色ヒストグラムと色コリログラムの二つを用いても良い。
本発明の最良の実施の形態に係る画像分類装置1は、カラー画像を分類の対象とし、画像中の色に基づく特徴を用いて画像を自動的に分類する。画像中の色を表現する特徴として、一般に色ヒストグラムが用いられる。しかしながら、色ヒストグラムを用いた場合、画像中の色の空間的な分布については考慮することができない。そこで、本発明の最良の実施の形態に係る画像分類装置1は、画像中の色の分布について考慮することが可能な特徴として、色コリログラムに着目する。色ヒストグラムに代えて、この色コリログラムを用いることで、色の空間的な分布の差異が考慮され、高精度な画像の自動分類が実現される。本発明の最良の実施の形態においては、色コリログラムに基づいて分類する場合について説明するが、色ヒストグラムを用いても良いし、色ヒストグラムと色コリログラムの二つを用いても良い。
図4において、ステップS102ないしステップS104の処理は、各画像データの色ヒストグラムを算出する処理である。ステップS105ないしステップS107の処理は、各画像データの色コリログラムを算出する処理である。ステップS108およびステップS109は、ステップS104およびステップS105において取得された各画像データの色ヒストグラムおよび色コリログラムに基づいて、各画像データ間の色コリログラムおよび色ヒストグラムの距離を算出する。
1.色ヒストグラム
色ヒストグラムは画像中に特定の色が出現する確率の分布により定義される。画像Iにおける各画素の色はc1, ・ ・ ・ , cm のm階調に量子化されているものとし、各画素p = (x, y) ∈ Iに対してI(p) をその画素の色とする。また、Ic = {p|I(p) = c} とする。このとき、画像Iの色ci に対する色ヒストグラムhci(I)は、次式により定義される。
色ヒストグラムが画像中に特定の色が出現する確率の分布として定義されるのに対し、色コリログラムは画像中の一定距離離れた画素間における特定の色の共起確率の分布として定義される。このことから、図5Aおよび図5Bに示すように、色ヒストグラムと色コリログラムは異なる特徴を表す。具体的には、図5Aに示すように、大きい円が一つだけある画像についても、図5Bに示すように小さい円が多数含まれている画像についても、同じ色ヒストグラムを有する。しかし、色コリログラムで表すことにより、図5Aおよび図5Bの画像それぞれの特徴を示すことができる。
画像I における各画素の色はc1, ・ ・ ・ , cm のm階調に量子化されているものとし、各画素p = (x, y) ∈ I に対してI(p) をその画素の色とする。また、Ic = {p|I(p) = c} とする。このとき、画像I の色ci,cj,距離k に対する色コリログラム
本発明の最良の実施の形態に係る画像分類装置1は、複数の画像データにおける、画像から算出した色ヒストグラム間、および色コリログラム間の距離を用いて、画像間の類似度を評価する。色ヒストグラム間の距離尺度としては様々なものが考えられるが、その中でも人間の知覚に近い距離尺度であることが報告されている2次形式距離を用いることで、適切な分類結果を得ることが可能となる。ただし、2次形式距離は色ヒストグラム間の距離として定義されており、そのままでは色コリログラム間の距離尺度としては用いることができない。そこで、本発明の最良の実施の形態に係る画像分類装置1は、色ヒストグラム間の2次形式距離の概念を拡張することで、色コリログラム間の距離を定義する。
第1のクラスタリング部12、第2のクラスタリング部13およびクラスタ統合部14について説明する。
本発明の最良の実施の形態は、画像中の色とその分布に着目し、多段階に処理することで、高精度な画像の自動分類を実現する。まずは画像中の色の分布に着目し、色コリログラム間の2次形式距離に基づくK-means 法により、画像が分類される。具体的には、画像分類装置1は、図6に示すように、画像データベース51に記憶された画像データ群を、K-means 法により分類し、クラスタC11、C12、C13およびC14を生成する。
以降、各処理について詳細に述べる。
本発明の最良の実施の形態に係る第1のクラスタリング部12は、N枚の分類対象画像fi(i = 1, ・ ・ ・ ,N) を複数の集合に分類するため、 K-means 法を用いてクラスタリングを行う。ここで、K-means法によるクラスタリングは、非階層型クラスタリング手法の一種である。
本発明の最良の実施の形態に係る第1のクラスタリング部12は、K-means 法に用いる特徴ベクトルを生成する。第1のクラスタリング部12は、各fi について、R、G、Bの輝度値をそれぞれm 階調に量子化し、距離k1 に対する色コリログラムを算出する。ここで、k1は予め与えられる値である。得られた色コリログラムに対し、式13を適用することでl 次元ベクトルc’i を算出し、特徴ベクトルとする。以上の処理により得られた特徴ベクトルに対し、K-means 法を適用する。ただし、K-means 法はクラスタリング結果が初期クラスタ、およびクラスタ数により変化する。そこで、本発明の最良の実施の形態においては、クラスタリング結果を評価するため、次式により表されるクラスタリング誤差Ek を用いる。
K-means 法を適用することにより得られた分類結果は、画像全体の色の分布に着目したものであるため、画像の詳細な特徴については考慮されていない。よって、異なる被写体を撮像した画像が、同一のクラスタに含まれる可能性がある。そこで、画像分類装置1は、より詳細な特徴を用いて各クラスタを分割することで、分類結果の高精度化を図る。具体的には、画像分類装置1は、画像の詳細な特徴としてエッジに着目し、エッジ画素と、エッジ画素を中心とする周辺の画素との色の関係を考慮することで、より高精度な分類結果を得る。ここで、エッジ画素とは、Sobelフィルタで取得したエッジであって、被写体のエッジとは限らない。また、周辺の画素とは、エッジ画素の座標を(x,y)としたとき、エッジ画素からの距離k2は、
まず、Sobel フィルタを用いて各画像におけるエッジ画素を検出する。このとき、画素の3×3近傍の画素値に図9に示す記号を与えると、Sobel フィルタによるエッジ強度es は次式で定義される。
以上の処理により、画像分類装置1は、K-means 法を用いて得た各クラスタを、画像の重要な特徴であるエッジに着目して分割することが可能となる。ただし、これに伴って過分割が行われ、同一の被写体を撮像した画像が複数のクラスタに分割される場合がある。そこで、本発明の最良の実施の形態は、分割された各クラスタを、被写体に着目して統合することで、最終的な分類結果を得る。
まずクラスタ統合部14は、画像データベース51に記憶された全ての画像データについて、ステップS401ないしステップS404の処理を実行する。ステップS401ないしステップS404の処理では、クラスタ統合部14は、画像データの構図を決定する。
最良の実施の形態において、被写体を構成する画素を推定するにあたり、分類対象画像をそのおおまかな色の分布から図11Aおよび図11Bに示す2つの構図に大別する。
構図2:構図1以外の構図(図11B参照)。例えば、図11Dに示す、テクスチャ画像等、画像全体を被写体が占める画像。
及び画像の構図(構図1、あるいは構図2)の決定法が、以下に示される。
構図2:構図1以外の画像を構図2とする。
本発明の最良の実施の形態においては、S(Ck,Cl) の最小値が、閾値TH よりも高い値を示すまで統合処理を繰り返し行う。以上の処理を行うことで、被写体に着目した高精度な類似画像分類が実現可能となる。
分類部10の処理によって得られた画像の特徴量、及びその分類結果に基づき、本発明の最良の実施の形態に係る画像分類装置1は、画像の分類結果を可視化する。この画像分類結果の可視化は、画像を多次元空間上に配置することで実現可能となる。
まず、ステップS501において、表示部20は、画像データベース51に記憶された各画像データについて、画像全体の色コリログラム、エッジ領域における色コリログラムおよび被写体領域における色ヒストグラムと色コリログラムを算出する。この算出処理は、上述した分類部10における処理結果値が参照されることが好ましい。各特徴値が算出されると、表示部20は、ステップS502において、画像データ間の距離を定義する。
一方、ステップS505において、表示部20は、表示装置20が座標更新が収束したと判定する場合、表示処理を終了する。
まず、表示部20は、各画像データから特徴ベクトルを作成する。特徴ベクトルの要素としては、表示部20は、上述した画像全体の色コリログラム、エッジ領域における色コリログラム、被写体領域における色ヒストグラムと色コリログラムの特徴量を用いる。表示部20は、このようにして求められた画像Ii の特徴ベクトルvi から、式26に基づき画像間の距離DI (i, j) を算出する。
手順1:初期配置
図15に示すように、表示部20は、各画像を3次元空間上にランダムに配置し、透視変換することで2次元のスクリーン上に表示する。この際、表示部20は、各画像を配置する座標には多面体を描画し、その各面に対象画像を描画する。これにより、表示部20が、画像の3次元上の位置をユーザに分かり易く提示することが可能となる。
表示部20は、画像間の距離に基づき各画像の移動量を計算し、各画像の3次元空間上の座標を変更する。このとき、画像Ii の3 次元座標をpi とすると、その移動量
画像が左に1移動された場合
f(-1)=|5-6|+|4-3|=2
画像が移動されない場合
f(0)=|5-7|+|4-2|=4
画像が右に1移動された場合
f(1)=|5-8|+|4-1|=6
以上より、画像を左に移動させたときに評価関数が、最小となることが分かる。したがって、この場合画像I2は、左へ移動する。このときの各画像の位置が、図17Bに示される。表示部20は、この処理を繰り返すことで、各画像を類似した画像の近傍に配置することができる。
次のステップでは、評価関数は以下のようになる。
画像が左に1移動された場合
f(-1)=|5-5|+|4-4|=0
画像が移動されない場合
f(0)=|5-6|+|4-3|=2
画像が右に1移動された場合
f(1)=|5-7|+|4-2|=4
以上より、画像I2は、左へ移動する。このときの各画像の位置が、図17Cに示される。
次のステップにおける評価関数は、以下のようになる。
画像が左に1移動された場合
f(-1)=|5-4|+|4-5|=2
画像が移動されない場合
f(0)=|5-5|+|4-4|=0
画像が右に1移動された場合
f(1)=|5-6|+|4-3|=2
このとき、評価関数は画像を移動させないとき最小となる。この時点で評価関数は収束しているので、表示部20は、画像(画像データのサムネイル)の移動を終了する。以上の処理を全ての画像に関して、表示部20が評価関数が収束するまで行うことで、画像分類結果の可視化が実現する。
本発明の最良の実施の形態に係る表示部20は、まず、図15に示す初期画面P201を、表示装置105に表示する。初期画面P201は、分類過程表示部201を備えている。分類過程表示部201には、上述した手順1において、画像データのサムネイルをランダムに配置した状態が表示される。この初期画面P201は、各画像データのサムネイルを3次元空間にランダムに配置した後に透視変換を施すことにより得られる画面である。
手順2および手順3が繰り返された結果、移動量が収束すると、図16に示す結果画面P202が、表示装置105に表示される。結果画面P202は、分類結果表示部202を備える。分類結果表示部202において、類似した画像が近くに表示される。一方、類似しない画像が遠くに表示される。
このボタンがクリックされると、アニメーションの速度が速くなる。これにより、ユーザが最終的な収束結果を見たい場合には、表示部20は、それを迅速に提示することができる。
(2)初期状態復元ボタン
このボタンがクリックされると、表示部20は、分類過程を初期状態に戻すことができる。
(3)マップ表示・非表示ボタン
分類画面右上部に現在位置と視点の方向を示すマップが用意されている。これにより、ユーザは画像を配置した3次元空間上を自由に移動することができる。このボタンがクリックされることで、マップの表示・非表示を切替えることが可能である。
(4)視点変更ボタン
表示部20は、画像を配置した3次元空間上での移動、および視点の変更を、マウスのドラッグにより行うことができる。その他、ユーザが4つの視点変更ボタンをクリックすることによっても、表示部20は、予め定めた4つの位置・視点に変更することができる。
本発明の最良の実施の形態に係る画像分類装置1は、分類結果を表示する際に3次元空間上において可視化する。これにより画像分類装置1は、分類結果を効率的に閲覧させることができる。具体的には、画像分類装置1は、画像間の非類似度に基づいて3次元空間上における距離を決定し、画像のサムネイルを表示装置105に配置する。これにより、データベース中の画像のサムネイルが類似画像ごとに集まった状態が、表示装置105に表示される。
このように、本発明の実施の形態に係る画像分類装置1は、第1のクラスタリング部12により、まず画像全体の特徴量に基づいて大まかに分類する。次に画像分類装置1は、第2のクラスタリング部13により、画像を特徴付けるエッジ部分に注目して、更に階層的に詳細に分類する。更に、第1のクラスタリング部12および第2のクラスタリング部13により過分割されたクラスタを、クラスタ統合部14は、被写体の特徴に基づいて、被写体ごとにクラスタを統合する。最後に被写体に基づいてクラスタを統合することにより、画像分類装置1は、ユーザの検索キーワードに合致しやすいクラスタを生成できる。
本発明の変形例に係る画像分類装置1aは、最良の実施の形態に係る分類機能を利用することで、クエリ画像を与えた際に自動的に画像を検索することができる。
本発明の変形例に係る画像分類装置1aは、図1に示す本発明の最良の実施の形態に係る画像分類装置1と比べて、クエリ画像分類部30を備えている点が異なる。クエリ画像分類部30は、クエリ画像特徴量算出部31と、所属クラスタ決定部32を備えている。
まずステップS21において、画像分類装置1aは、クエリ画像データ52の特徴ベクトルを算出する。更にステップS22において画像データベース22から各画像データを読み出し、各画像データにおける特徴ベクトルを取得する。
図20を参照して、本発明の変形例に係るクエリ画像特徴量算出処理31が説明される。
まず、ステップS601において、クエリ画像特徴量算出処理31は、記憶装置107からクエリ画像データ52を読み出し、ステップS602において、クエリ画像データ52の画像全体の色コリログラムを算出する。次にステップS603において、クエリ画像特徴量算出処理31は、クエリ画像データ52のエッジ領域における色コリログラムを算出する。さらにステップS604において、クエリ画像特徴量算出処理31は、被写体領域における色コリログラムを算出する。
図21を参照して、本発明の変形例に係る所属クラスタ決定部32を説明する。
まず、ステップS701において、所属クラスタ決定部32は、画像データベース52の各画像データから、特徴ベクトルを生成する。更にステップS702において、所属クラスタ決定部32は、クラスタ統合部14によって生成された各クラスタの特徴ベクトルの平均ベクトルを算出する。
本発明の変形例に係る表示部20aは、クエリ画像分類部30において得られたクエリ画像データ52の特徴量と所属するクラスタの情報を画像データベース51に追加する。さらに表示部20aは、本発明の最良の実施の形態で説明した画像分類装置1と同様に可視化する。
本発明の変形例に係る画像分類装置1aは、検索結果を表示する際に3次元空間上において可視化することで、検索結果を効率的に閲覧させることができる。具体的には、画像間の非類似度を3次元空間上における距離とすることで、画像分類装置1aは、ユーザに検索結果を直感的に理解させることができる。さらに、3次元空間上における距離を、画像の非類似度に基づいて設定することで、画像分類装置1aは、検索結果として表示されるクエリ画像以外の画像においても類似した画像が近傍に表示されるため、ユーザに、効率的に検索結果を閲覧をさせることが可能となる。
上記のように、本発明の最良の実施の形態および変形例によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなる。
例えば、本発明の最良の実施の形態に記載した画像分類装置は、図1に示すように一つのハードウェア上に構成されても良いし、その機能や処理数に応じて複数のハードウェア上に構成されても良い。又、既存の情報システム上に実現されても良い。
本発明はここでは記載していない様々な実施の形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
Claims (20)
- 複数の画像データを、類似した画像毎に分類する画像分類装置であって、
複数の画像データが記憶された画像データベースと、
前記複数の画像データのそれぞれについて、画像全体の特徴量を算出するとともに、前記画像データのエッジを検出し、検出されたエッジ部分の特徴量を算出する特徴量算出部と、
前記画像全体における特徴量に基づいて、前記複数の画像データを複数のクラスタに分類する第1のクラスタリング部と、
前記エッジ部分の前記特徴量に基づいて、前記第1のクラスタリング部によって分類された複数のクラスタを、更に複数のクラスタに分類する第2のクラスタリング部と、
前記複数の画像データのそれぞれについて画像の構図から被写体を構成する画素を決定し、前記第2のクラスタリング部によって分類された複数のクラスタを、前記被写体を構成する画素に基づいて統合するクラスタ統合部
とを備える画像分類装置。 - 前記複数の画像データについてそれぞれのサムネイルを任意に配置し、前記画像データの前記画像全体の特徴量、前記エッジ部分の特徴量、前記被写体を構成する画素の特徴量および前記クラスタ統合部14により決定された前記画像データのクラスタに基づいて、前記各サムネイルの座標を更新して表示するとともに、前記各サムネイルの移動量を計算し、前記各サムネイルの移動量が0に収束するまで、座標を更新して表示する処理を繰り返す表示部
を更に備える請求項1に記載の画像分類装置。 - 前記特徴量算出部は、前記複数の画像データのそれぞれについて、前記画像データにおける輝度値に基づいて、前記画像全体における色コリログラムを算出し、他の画像データの画像全体との色コリログラムの距離を、前記画像全体の特徴量として算出するとともに、前記エッジ部分における色コリログラムを算出し、他の画像データのエッジ部分との色コリログラムの距離を、前記エッジ部分の特徴量として算出する
請求項1に記載の画像分類装置。 - 前記第1のクラスタリング部は、前記画像全体における特徴量に基づいて、全ての前記クラスタによるクラスタリング誤差が閾値内になるように、前記クラスタの数と、前記クラスタに属する画像データを決定する
請求項1に記載の画像分類装置。 - 前記第2のクラスタリング部は、前記エッジ部分の前記特徴量に基づいて、前記第1のクラスタリング部によって分類された各クラスタのクラスタ内誤差が閾値内になるように、前記クラスタの数と、前記クラスタに属する画像データを決定する
請求項1に記載の画像分類装置。 - 前記クラスタ統合部は、前記画像データに任意の境界線を設け、前記境界線によって得られる第1の領域と第2の領域における色ヒストグラム間の距離を算出し、前記境界線を動かすことによって前記色ヒストグラム間の距離が大きく変化する境界線を、構図を決定するための境界線とし、該境界線外を構成する画素の代表色との色差が閾値よりも大きな画素を、前記被写体を構成している画素とする
請求項1に記載の画像分類装置。 - 前記クラスタ統合部は更に、前記被写体を構成する画素の色コリログラムと色ヒストグラムを算出し、算出された色コリログラムと色ヒストグラムに基づいて、前記第2のクラスタリング部によって分類された複数のクラスタのうち、任意の2つのクラスタの非類似度が、閾値よりも高くなるまで、クラスタの統合を繰り返す
請求項6に記載の画像分類装置。 - クエリ画像データの特徴ベクトルを算出するクエリ画像特徴量算出部と、
前記クエリ画像データの前記特徴ベクトルに基づいて、前記クラスタ統合部により生成されたクラスタから、前記クエリ画像データの所属するクラスタを決定するクラスタ決定部
とを備える請求項1に記載の画像分類装置。 - 前記特徴ベクトルは、画像全体における色コリログラムと、エッジ部分の色コリログラムと、被写体領域の色ヒストグラムと色コリログラムをパラメータとして有し、
前記クエリ画像特徴量算出部は、前記クエリ画像データの前記画像全体における色コリログラムと、前記クエリ画像データの前記エッジ部分の色コリログラムと、前記クエリ画像データの前記被写体領域の色ヒストグラムと色コリログラムを算出して、前記クエリ画像データの特徴ベクトルを算出する
請求項8に記載の画像分類装置。 - 前記クラスタ決定部は、前記クラスタ統合部により生成された各クラスタに属する画像データの特徴ベクトルの平均を算出し、前記クエリ画像データの特徴ベクトルとの距離を最小とするクラスタをクエリ画像の所属クラスタとする
請求項9に記載の画像分類装置。 - 複数の画像データを、類似した画像毎に分類する画像分類プログラムであって、
コンピュータを、
画像データベースに記憶された複数の画像データのそれぞれについて、画像全体の特徴量を算出するとともに、前記画像データのエッジを検出し、検出されたエッジ部分の特徴量を算出する特徴量算出手段と、
前記画像全体における特徴量に基づいて、前記複数の画像データを複数のクラスタに分類する第1のクラスタリング手段と、
前記エッジ部分の前記特徴量に基づいて、前記第1のクラスタリング手段によって分類された複数のクラスタを、更に複数のクラスタに分類する第2のクラスタリング手段と、
前記複数の画像データのそれぞれについて画像の構図から被写体を構成する画素を決定し、前記第2のクラスタリング手段によって分類された複数のクラスタを、前記被写体を構成する画素に基づいて統合するクラスタ統合手段
として機能させる画像分類プログラム。 - 前記複数の画像データについてそれぞれのサムネイルを任意に配置し、前記画像データの前記画像全体の特徴量、前記エッジ部分の特徴量および前記被写体を構成する画素の特徴量に基づいて、前記各サムネイルの座標を更新して表示するとともに、前記各サムネイルの移動量を計算し、前記各サムネイルの移動量が0に収束するまで、座標を更新して表示する処理を繰り返す表示手段
として、更に前記コンピュータを機能させる請求項11に記載の画像分類プログラム。 - 前記特徴量算出手段は、前記複数の画像データのそれぞれについて、前記画像データにおける輝度値に基づいて、前記画像全体における色コリログラムを算出し、他の画像データの画像全体との色コリログラムの距離を、前記画像全体の特徴量として算出するとともに、前記エッジ部分における色コリログラムを算出し、他の画像データのエッジ部分との色コリログラムの距離を、前記エッジ部分の特徴量として算出する
請求項11に記載の画像分類プログラム。 - 前記第1のクラスタリング手段は、前記画像全体における特徴量に基づいて、全ての前記クラスタによるクラスタリング誤差が閾値内になるように、前記クラスタの数と、前記クラスタに属する画像データを決定する
請求項11に記載の画像分類プログラム。 - 前記第2のクラスタリング手段は、前記エッジ部分の前記特徴量に基づいて、前記第1のクラスタリング手段によって分類された各クラスタのクラスタ内誤差が閾値内になるように、前記クラスタの数と、前記クラスタに属する画像データを決定する
請求項11に記載の画像分類プログラム。 - 前記クラスタ統合手段は、前記画像データに任意の境界線を設け、前記境界線によって得られる第1の領域と第2の領域における色ヒストグラム間の距離を算出し、前記境界線を動かすことによって前記色ヒストグラム間の距離が大きく変化する境界線を、構図を決定するための境界線とし、該境界線外を構成する画素の代表色との色差が閾値よりも大きな画素を、前記被写体を構成している画素とする
請求項11に記載の画像分類プログラム。 - 前記クラスタ統合手段は更に、前記被写体を構成する画素の色コリログラムと色ヒストグラムを算出し、算出された色コリログラムと色ヒストグラムに基づいて、前記第2のクラスタリング手段によって分類された複数のクラスタのうち、任意の2つのクラスタの非類似度が、閾値よりも高くなるまで、クラスタの統合を繰り返す
請求項16に記載の画像分類プログラム。 - クエリ画像データの特徴ベクトルを算出するクエリ画像特徴量算出手段と、
前記クエリ画像データの前記特徴ベクトルに基づいて、前記クラスタ統合手段により生成されたクラスタから、前記クエリ画像データの所属するクラスタを決定するクラスタ決定手段
として、更に前記コンピュータを機能させる請求項11に記載の画像分類プログラム。 - 前記特徴ベクトルは、画像全体における色コリログラムと、エッジ部分の色コリログラムと、被写体領域の色ヒストグラムと色コリログラムをパラメータとして有し、
前記クエリ画像特徴量算出手段は、前記クエリ画像データの前記画像全体における色コリログラムと、前記クエリ画像データの前記エッジ部分の色コリログラムと、前記クエリ画像データの前記被写体領域の色ヒストグラムと色コリログラムを算出して、前記クエリ画像データの特徴ベクトルを算出する
請求項18に記載の画像分類プログラム。 - 前記クラスタ決定手段は、前記クラスタ統合手段により生成された各クラスタに属する画像データの特徴ベクトルの平均を算出し、前記クエリ画像データの特徴ベクトルとの距離を最小とするクラスタをクエリ画像の所属クラスタとする
請求項19に記載の画像分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009544662A JP5229744B2 (ja) | 2007-12-03 | 2008-12-01 | 画像分類装置および画像分類プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007312371 | 2007-12-03 | ||
JP2007312371 | 2007-12-03 | ||
JP2009544662A JP5229744B2 (ja) | 2007-12-03 | 2008-12-01 | 画像分類装置および画像分類プログラム |
PCT/JP2008/071803 WO2009072466A1 (ja) | 2007-12-03 | 2008-12-01 | 画像分類装置および画像分類プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009072466A1 true JPWO2009072466A1 (ja) | 2011-04-21 |
JP5229744B2 JP5229744B2 (ja) | 2013-07-03 |
Family
ID=40717646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009544662A Active JP5229744B2 (ja) | 2007-12-03 | 2008-12-01 | 画像分類装置および画像分類プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8180161B2 (ja) |
EP (1) | EP2216749B1 (ja) |
JP (1) | JP5229744B2 (ja) |
WO (1) | WO2009072466A1 (ja) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3336765A1 (en) * | 2006-05-10 | 2018-06-20 | Nikon Corporation | Object recognition device, object recognition program, and image search service providing method |
US8004576B2 (en) | 2008-10-31 | 2011-08-23 | Digimarc Corporation | Histogram methods and systems for object recognition |
JP5123870B2 (ja) * | 2009-02-10 | 2013-01-23 | キヤノン株式会社 | 画像処理方法および画像処理装置およびプログラム |
JP2011243148A (ja) * | 2010-05-21 | 2011-12-01 | Sony Corp | 情報処理装置、情報処理方法及びプログラム |
JP5539066B2 (ja) * | 2010-06-29 | 2014-07-02 | キヤノン株式会社 | クラスタリング処理装置、クラスタリング処理方法 |
JP2012058926A (ja) * | 2010-09-07 | 2012-03-22 | Olympus Corp | キーワード付与装置及びプログラム |
SE535888C2 (sv) * | 2011-06-08 | 2013-02-05 | Imtt Svenska Ab | Förfarande för att identifiera en karaktäristisk del i en bild |
US20130004066A1 (en) * | 2011-07-03 | 2013-01-03 | Butler David G | Determining a background color of a document |
KR101851241B1 (ko) * | 2011-12-06 | 2018-04-24 | 삼성전자 주식회사 | 휴대 단말기의 컨텐츠 통합 관리 방법 및 장치 |
US9158965B2 (en) * | 2012-06-14 | 2015-10-13 | The Board Of Trustees Of The Leland Stanford Junior University | Method and system for optimizing accuracy-specificity trade-offs in large scale visual recognition |
US9185387B2 (en) | 2012-07-03 | 2015-11-10 | Gopro, Inc. | Image blur based on 3D depth information |
WO2014045075A1 (en) * | 2012-09-21 | 2014-03-27 | Ltu Technologies | Method and a device for visualizing information related to similarity distance computed between two images |
JP6471689B2 (ja) * | 2013-04-17 | 2019-02-20 | 大日本印刷株式会社 | コロニー検出装置、培地情報登録システム、プログラム及び衛生管理システム |
WO2015057778A1 (en) * | 2013-10-16 | 2015-04-23 | 3M Innovative Properties Company | Note recognition and association based on grouping |
US9685194B2 (en) | 2014-07-23 | 2017-06-20 | Gopro, Inc. | Voice-based video tagging |
US10074013B2 (en) | 2014-07-23 | 2018-09-11 | Gopro, Inc. | Scene and activity identification in video summary generation |
US9697233B2 (en) * | 2014-08-12 | 2017-07-04 | Paypal, Inc. | Image processing and matching |
US10019143B1 (en) | 2014-09-29 | 2018-07-10 | Amazon Technologies, Inc. | Determining a principal image from user interaction |
US10203847B1 (en) * | 2014-09-29 | 2019-02-12 | Amazon Technologies, Inc. | Determining collections of similar items |
JP6419560B2 (ja) * | 2014-12-05 | 2018-11-07 | 株式会社東芝 | 検索装置、方法及びプログラム |
US9734870B2 (en) | 2015-01-05 | 2017-08-15 | Gopro, Inc. | Media identifier generation for camera-captured media |
US9805662B2 (en) * | 2015-03-23 | 2017-10-31 | Intel Corporation | Content adaptive backlight power saving technology |
US9639560B1 (en) | 2015-10-22 | 2017-05-02 | Gopro, Inc. | Systems and methods that effectuate transmission of workflow between computing platforms |
US9787862B1 (en) | 2016-01-19 | 2017-10-10 | Gopro, Inc. | Apparatus and methods for generating content proxy |
US10078644B1 (en) | 2016-01-19 | 2018-09-18 | Gopro, Inc. | Apparatus and methods for manipulating multicamera content using content proxy |
US9871994B1 (en) | 2016-01-19 | 2018-01-16 | Gopro, Inc. | Apparatus and methods for providing content context using session metadata |
US10129464B1 (en) | 2016-02-18 | 2018-11-13 | Gopro, Inc. | User interface for creating composite images |
US9972066B1 (en) | 2016-03-16 | 2018-05-15 | Gopro, Inc. | Systems and methods for providing variable image projection for spherical visual content |
US10402938B1 (en) | 2016-03-31 | 2019-09-03 | Gopro, Inc. | Systems and methods for modifying image distortion (curvature) for viewing distance in post capture |
US9838730B1 (en) | 2016-04-07 | 2017-12-05 | Gopro, Inc. | Systems and methods for audio track selection in video editing |
US10229719B1 (en) | 2016-05-09 | 2019-03-12 | Gopro, Inc. | Systems and methods for generating highlights for a video |
US9953679B1 (en) | 2016-05-24 | 2018-04-24 | Gopro, Inc. | Systems and methods for generating a time lapse video |
US9967515B1 (en) | 2016-06-15 | 2018-05-08 | Gopro, Inc. | Systems and methods for bidirectional speed ramping |
US9922682B1 (en) | 2016-06-15 | 2018-03-20 | Gopro, Inc. | Systems and methods for organizing video files |
US10045120B2 (en) | 2016-06-20 | 2018-08-07 | Gopro, Inc. | Associating audio with three-dimensional objects in videos |
US10395119B1 (en) | 2016-08-10 | 2019-08-27 | Gopro, Inc. | Systems and methods for determining activities performed during video capture |
US9953224B1 (en) | 2016-08-23 | 2018-04-24 | Gopro, Inc. | Systems and methods for generating a video summary |
JP2018041261A (ja) * | 2016-09-07 | 2018-03-15 | 東芝テック株式会社 | 情報処理装置及びプログラム |
US10282632B1 (en) | 2016-09-21 | 2019-05-07 | Gopro, Inc. | Systems and methods for determining a sample frame order for analyzing a video |
US10268898B1 (en) | 2016-09-21 | 2019-04-23 | Gopro, Inc. | Systems and methods for determining a sample frame order for analyzing a video via segments |
US10397415B1 (en) | 2016-09-30 | 2019-08-27 | Gopro, Inc. | Systems and methods for automatically transferring audiovisual content |
US10044972B1 (en) | 2016-09-30 | 2018-08-07 | Gopro, Inc. | Systems and methods for automatically transferring audiovisual content |
US11106988B2 (en) | 2016-10-06 | 2021-08-31 | Gopro, Inc. | Systems and methods for determining predicted risk for a flight path of an unmanned aerial vehicle |
US10002641B1 (en) | 2016-10-17 | 2018-06-19 | Gopro, Inc. | Systems and methods for determining highlight segment sets |
CN108132935B (zh) * | 2016-11-30 | 2021-08-10 | 英业达科技有限公司 | 图像分类方法及图像展示方法 |
CN108460389B (zh) * | 2017-02-20 | 2021-12-03 | 阿里巴巴集团控股有限公司 | 一种识别图像中对象的类型预测方法、装置及电子设备 |
WO2018155412A1 (ja) | 2017-02-21 | 2018-08-30 | 日本電気株式会社 | 分類装置と分類方法並びにプログラム |
US10339443B1 (en) | 2017-02-24 | 2019-07-02 | Gopro, Inc. | Systems and methods for processing convolutional neural network operations using textures |
US9916863B1 (en) | 2017-02-24 | 2018-03-13 | Gopro, Inc. | Systems and methods for editing videos based on shakiness measures |
US10360663B1 (en) | 2017-04-07 | 2019-07-23 | Gopro, Inc. | Systems and methods to create a dynamic blur effect in visual content |
US10395122B1 (en) | 2017-05-12 | 2019-08-27 | Gopro, Inc. | Systems and methods for identifying moments in videos |
US10614114B1 (en) | 2017-07-10 | 2020-04-07 | Gopro, Inc. | Systems and methods for creating compilations based on hierarchical clustering |
US10402698B1 (en) | 2017-07-10 | 2019-09-03 | Gopro, Inc. | Systems and methods for identifying interesting moments within videos |
JP6674581B1 (ja) * | 2019-07-16 | 2020-04-01 | 株式会社ジャパン・カレント | 画像分類システム及び画像分類方法 |
CN110502651B (zh) * | 2019-08-15 | 2022-08-02 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN115668295A (zh) * | 2020-05-29 | 2023-01-31 | 索尼集团公司 | 图像处理装置和方法 |
CN111860692B (zh) * | 2020-07-31 | 2022-05-31 | 国网重庆市电力公司电力科学研究院 | 一种基于K-mediod的物联网环境下的异常数据检测方法 |
CN112257801B (zh) * | 2020-10-30 | 2022-04-29 | 浙江商汤科技开发有限公司 | 图像的增量聚类方法、装置、电子设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148795A (ja) | 1998-08-31 | 2000-05-30 | Canon Inc | 画像検索装置及びその方法、コンピュ―タ可読メモリ |
EP1815392A1 (en) | 2004-11-23 | 2007-08-08 | Eastman Kodak Company | Automated radiograph classification using anatomy information |
JP4565187B2 (ja) * | 2005-06-10 | 2010-10-20 | 国立大学法人北海道大学 | 画像表示位置決定装置、画像表示位置決定方法、画像表示位置決定プログラム、及びこれを記録したコンピュータ読取可能な記録媒体 |
EP1755067A1 (en) | 2005-08-15 | 2007-02-21 | Mitsubishi Electric Information Technology Centre Europe B.V. | Mutual-rank similarity-space for navigating, visualising and clustering in image databases |
TWI384413B (zh) | 2006-04-24 | 2013-02-01 | Sony Corp | An image processing apparatus, an image processing method, an image processing program, and a program storage medium |
-
2008
- 2008-12-01 US US12/673,423 patent/US8180161B2/en active Active
- 2008-12-01 WO PCT/JP2008/071803 patent/WO2009072466A1/ja active Application Filing
- 2008-12-01 JP JP2009544662A patent/JP5229744B2/ja active Active
- 2008-12-01 EP EP08855861.4A patent/EP2216749B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP5229744B2 (ja) | 2013-07-03 |
US8180161B2 (en) | 2012-05-15 |
WO2009072466A1 (ja) | 2009-06-11 |
EP2216749A1 (en) | 2010-08-11 |
EP2216749B1 (en) | 2017-11-08 |
EP2216749A4 (en) | 2011-12-21 |
US20110103700A1 (en) | 2011-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5229744B2 (ja) | 画像分類装置および画像分類プログラム | |
JP4340367B2 (ja) | 画像分類装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP5033580B2 (ja) | 画像処理装置及び画像処理方法 | |
JP4579404B2 (ja) | 画像処理方法及びその装置 | |
JP5282658B2 (ja) | 画像学習、自動注釈、検索方法及び装置 | |
US20040024758A1 (en) | Image classification method, image feature space displaying method, program, and recording medium | |
JP4948607B2 (ja) | 画像検索装置、画像分類装置及び方法並びにプログラム | |
JP5283088B2 (ja) | 画像検索装置および同画像検索装置に適用される画像検索用コンピュータプログラム | |
JP2009509215A (ja) | 画像データベースでのナビゲーション、視覚化、及びクラスタ化のための相互ランク類似度空間 | |
JP4173246B2 (ja) | 類似画像表示方法及び類似画像表示処理プログラムを格納した記録媒体 | |
JP2008217428A (ja) | 画像検索プログラム、方法及び装置 | |
JP4674257B2 (ja) | 画像分類装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
CN108377351A (zh) | 用于在模板上布局图像的图像处理装置和图像处理方法 | |
JP3572215B2 (ja) | 検索画像の空間表示方法及び装置及びこの方法のプログラムを記憶した記憶媒体 | |
CN115115856A (zh) | 图像编码器的训练方法、装置、设备及介质 | |
CN115115855A (zh) | 图像编码器的训练方法、装置、设备及介质 | |
JP2004005303A (ja) | 画像検索装置、画像検索方法及び画像検索プログラム | |
JP2004192555A (ja) | 情報管理方法、情報管理装置及び情報管理プログラム | |
Guada et al. | A novel edge detection algorithm based on a hierarchical graph-partition approach | |
JP6478301B2 (ja) | 画像判別装置、画像判別方法、及びプログラム | |
JP5061147B2 (ja) | 画像検索装置 | |
JP2011043954A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP6336827B2 (ja) | 画像検索装置、画像検索方法および検索システム | |
JP2006048711A (ja) | 画像検索システム、画像検索プログラムおよび記憶媒体、並びに画像検索方法 | |
JP2017005699A (ja) | 画像処理装置、画像処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111124 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130312 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5229744 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |