JP4796356B2 - 判別分析を行う方法、プログラム及び装置 - Google Patents

判別分析を行う方法、プログラム及び装置 Download PDF

Info

Publication number
JP4796356B2
JP4796356B2 JP2005246889A JP2005246889A JP4796356B2 JP 4796356 B2 JP4796356 B2 JP 4796356B2 JP 2005246889 A JP2005246889 A JP 2005246889A JP 2005246889 A JP2005246889 A JP 2005246889A JP 4796356 B2 JP4796356 B2 JP 4796356B2
Authority
JP
Japan
Prior art keywords
image
vector
mapping
target
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005246889A
Other languages
English (en)
Other versions
JP2006221607A (ja
Inventor
俊一 加藤
昌裕 多田
Original Assignee
学校法人 中央大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 学校法人 中央大学 filed Critical 学校法人 中央大学
Priority to JP2005246889A priority Critical patent/JP4796356B2/ja
Publication of JP2006221607A publication Critical patent/JP2006221607A/ja
Application granted granted Critical
Publication of JP4796356B2 publication Critical patent/JP4796356B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、所与の基準に基づいて分類された複数の画像群からなる画像データベースから提示された画像が属する画像群を判別するための方法、プログラム及び装置に関する。
ここ数年のブロードバンド・ネットワークの急速な普及に伴い、ネットワーク上における画像データベースから、個人が趣味で製作した画像コンテンツや広告などに用いられる商業用の画像コンテンツなど、種々の画像コンテンツにアクセスすることが可能となってきた。
そのため、大量の画像コンテンツを含む画像データベースから顧客が望む画像を正確かつ迅速に検索できるシステムが必要となるが、多くの画像データベースでは、このような目的を達成するために、画像データベースに含まれる画像を画像の類似性や画像から受ける印象などの観点から複数のカテゴリ(複数の画像群)に分類し、顧客により指定されたカテゴリ(画像群)に属する画像を提示することが可能とされている。
しかし、画像のカテゴリへの分類作業の負荷は画像データベースに含まれる画像数に比例して増大するために、画像データベースの大きさによってはこのような作業を人手によって行うことが実質的に不可能な場合がある。
また画像データベースによっては、「ナチュラルな印象」、「フレッシュな印象」など、画像から受けるイメージによって画像の分類がなされる場合があるが、このような分類は、分類者の感性に依存する部分が大きいために、分類の統一性を維持するためには、分類者を任意には変更できない制約が生じることになり、それ故に画像データの分類作業が一層困難となる。
このような問題を解決するため、画像のカテゴリ分類の作業をコンピュータ上で実行することを可能とするための種々の試みが行われている。
例えば、特許文献1(特開2003−256429号公報)では、ある程度の数の画像を画像の類似性や画像から受ける印象など何らかの基準に基づいて複数の画像群に分類し、この分類された画像群を教師データとして用いて分類が行われた基準をコンピュータに学習させ、この基準に従って、提示された画像(判別対象の画像/対象画像)がどの画像群に属するべきかをコンピュータ上で自動的に判別分析(提示された画像がどの画像群に帰属するかの判断)するための手法が提案されている。
また、本発明者らは、上記特許文献1に記載される手法を更に前進させ、各画像群に属する画像を分割した基本領域から抽出される特徴量ベクトルの分布が近似する基本領域を統合することにより、分類者が分類に際して着目したと考えられる領域を注目領域として特定するとともに、当該注目領域から抽出される特徴量ベクトルの各画像群に属する画像間での分散の程度から上記分類の際に当該注目領域がどの程度重視されたかについての指標として注目度を導出し、各注目領域についての各カテゴリに属する画像群と対象画像との類似性を示す指標(領域間距離)を注目度に応じた重み付けを加えて積算した値に基づいて対象画像の各カテゴリへの帰属を判別することで、分類者の知覚作用をより正確に反映させたより精度の高い判別分析を行いうる手法を提案している(特願2004−56290号)。
特開2003−256429号公報
本発明は、何らかの基準に基づいて分類された複数の画像群を教師データとし、当該教師データを用いて当該教師データの分類に用いられた基準をコンピュータに学習させ、この基準に従って、提示された画像の判別分析をコンピュータ上で自動的に実行するための新たな方法、プログラム乃至装置を提供することをその目的とする。
また本発明は、コンピュータ上での画像の判別分析を行うための方法、プログラム乃至装置であって、特願2004−56290号に記載される手法と同等乃至それ以上に精度の高い判別分析を行いうる方法、プログラム乃至装置を提供することをその目的とする。
また本発明は、「ナチュラルな印象」、「フレッシュな印象」など、画像から受ける印象(イメージ)により分類された複数の画像群からなる画像データベースに特に好適に適用することができる判別分析の方法、プログラム乃至装置を提供することをその課題とする。
本発明は、上記課題を解決したものであり、所与の基準に基づいて分類された複数の画像群のいずれかの画像群に対象画像を判別するための方法又は装置であって、一の画像群に含まれる画像である帰属画像のそれぞれを所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する第1のステップ又は手段と、前記一の画像群について、特徴量ベクトルの分布が近似する基本領域を統合することにより構図領域を特定する第2のステップ又は手段と、各帰属画像の各構図領域から、帰属特徴量ベクトルとして、特徴量ベクトルを抽出する第3のステップ又は手段と、各構図領域について、帰属特徴量ベクトルの前記一の画像群における分散度に対して逆相関の関係にある指数である注目度を導出する第4のステップ又は手段と、画像データベースに含まれる画像のうちの前記一の画像群に属する画像以外の画像である非帰属画像のそれぞれを構図領域と同一の領域である第1対応領域に分割し、非帰属特徴量ベクトルとして、各非帰属画像の各第1対応領域から特徴量ベクトルを抽出する第5のステップ又は手段と、各構図領域について、構図領域から抽出された各帰属特徴量ベクトルが帰属する第1のクラスと、当該構図領域に対応する第1対応領域から抽出された各非帰属特徴量ベクトルが帰属する第2のクラスとを識別するSVMに基づく第1の識別関数を導出する第6のステップ又は手段と、対象画像を構図領域と同一の領域である第2対応領域に分割し、対象特徴量ベクトルとして、各第2対応領域から特徴量ベクトルを抽出する第7のステップ又は手段と、各第2対応領域から抽出された対象特徴量ベクトルを、対応する構図領域について導出された第1の識別関数に適用することにより、対象特徴量ベクトルの識別を行う第8のステップ又は手段と、前記第8のステップ又は手段において第1のクラスに識別された対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度に基づいて対象画像を前記一の画像群に判別するか否かを決定するステップ又は手段とを有することを特徴とする方法又は装置、或いは、上記各ステップをコンピュータに実行させることを特徴とするプログラムである。
図1は、本発明の構成の概略を概念的に示す説明図であり、本発明は、図1に示されるように、以下の3つの特徴点を有している。
即ち、一の画像群(比較対象の画像群/図では画像群Aと表示されている)に分類された各画像(C(i=1,2,・・・NA))を所定数の基本領域に分割し(図では縦横5×5の25個の基本領域に分割した例が示されている)、この基本領域を所定の基準に基づいて統合することで、画像群の分類に際して着目されたであろう構図を構図領域P(図では、2つの構図領域P、Pが特定された例が示されている)として抽出するとともに、分類の際に各構図領域がどの程度重視されたかについての指標として注目度zを導出する第1の特徴点、
この構図領域P毎に、SVMに基づく第1の識別関数f(x)を導出するとともに、対象画像C(提示された画像)を構図領域Pと同一の領域(第2対応領域P )に分割し、各第2対応領域P から抽出される特徴量ベクトル(対象特徴量ベクトルx )を、対応する構図領域Pから導出された第1の識別関数f(x)に適用する(代入する)ことにより、対象特徴量ベクトルxのクラスの識別を行う第2の特徴点、及び、
第1のクラスに識別された第2対応領域P に対応する構図領域Pの注目度zに基づいて対象画像の判別を行う第3の特徴点、
の3つの特徴点である。
そして本発明では、上記第1、第3の特徴点を有するが故に、特願2004−56290号に記載される手法と同様に、分類の際における分類者の知覚作用をより正確に反映させた精度の高い判別分析が可能となるという作用効果が達成される。
更に、本発明では、上記第2の特徴点を有するが故に、一の画像群に対する対象画像の判別分析を、当該一の画像群から特定される構図領域に基づいて行うことが可能となり、従って、特願2004−56290号に記載される手法に比して更に精度が高い判別分析が可能となるという作用効果が達成され、また、特定の構図領域を一の画像群に判別し、他の構図領域を他の画像群に判別するなど、構図領域毎の判別(構図領域毎の意味づけ)を行うことが可能となるという作用効果が達成される。
ここで、本発明は、所与の基準に基づいて分類された複数の画像群からなる画像データベースに対して対象画像の判別分析を行うものであるが、ここに言う所与の基準としては、画像の類似性に基づく基準や、画像から受ける印象に基づく基準を挙げることができる。
そして、所与の基準として、画像の類似性に基づく基準が用いられる場合には、与えられた複数の画像を、任意の分類者の個人的な感覚(類似度判断基準)に基づいて、類似するもの毎に画像群に分類して画像データベースを構築することが可能であり、この場合は、本発明により、当該分類者の個人的な類似度判断基準を反映させた判別分析が計算機上で実行されることになる。
また、商標や意匠の類似判断のように、統一的な指針により客観化された類似度判断基準が所与の基準として用いられる場合には、例えば、当該所与の基準に従って過去に類似すると判断された複数の画像群から画像データベースを構築することが可能であり、この場合は、本発明により、与えられた統一的な指針を反映させた判別分析が計算機上で実行されることになる。
また、本発明では、「ナチュラルな印象」、「フレッシュな印象」など、画像から分類者(鑑賞者)が受ける印象を所与の基準として用い、各画像から分類者が受ける印象の種類毎に分類された画像群(印象グループ)から画像データベースを構築することも可能であり、この場合には、画像が分類者に与えるであろう印象を反映させた判別分析が計算機上で実行されることになる。
この場合、例えば、単一の画像から分類者が複数の印象を受けること(例えば、単一の画像から「ナチュラルな印象」を受けるとともに、「フレッシュな印象」も受けるような場合)は通常生じうることであるため、ここでの画像データベースでは、単一の画像を複数の画像群(印象グループ)に重複して分類することを許容することが便宜であると考えられるが、本発明では、上記第2の特徴点を有するが故に、このような重複して分類された画像群に対しての対象画像の判別分析を好適に行うことができる。
また、本発明における帰属画像(一の画像群に含まれる画像)の基本領域への分割は、任意の方法で行うことが可能であるが、各基本領域が相互に重複する部分を生じず、余白を生じない態様で分割することが好ましい。なお、分割数を増加させると計算量の増大を生じることから、例えば、各画像が方形である場合には、4×4〜6×6程度の升目状に分割することが考えられる。
また、本発明で使用する特徴量ベクトルとしては、画像中の任意の領域の画像的な特徴を表示する複数の特徴量を要素とする任意の多次元ベクトルを使用することが可能であるが、所与の基準に基づく分類が行われる際における分類者の視覚的な知覚作用を好適に反映させた特徴量ベクトルを使用することが特に好ましく、例えば、全域的特徴量や近傍画素間の局所的な関係を表現する局所的特徴量から、ノイズや環境光の変化に影響を受けにくい特徴量を選択し、また、側抑制効果(視覚の知覚過程において、ある点が刺激を受けて興奮作用を起こすと、その周辺の点が逆に抑制作用を起こす機構)など、人の知覚作用の特性を反映させるための重み付けを加えるなどにより特徴量ベクトルを設計することが好ましい。
また、本発明の構図領域は、一の画像群において特徴量ベクトルの分布が近似する基本領域を統合することにより特定されるものであり、この構図領域は、ユーザが画像データベース中の画像を画像群に分類する際に注目した構図に相当すると考えられる。
ここで、特徴量ベクトルの分布の近似性をどのような手法により判断するか、或いは、どの程度の近似性をもって基本領域の統合を行うかなどは任意であり、例えば、最終的に抽出される構図領域の個数を既知として、ある評価基準の下で逐次修正に基づき分類を行うK−means法や、情報量基準を用いて構図領域の個数を決定するX−means法などを使用することが可能であるが、K−means法は、構図領域の個数を事前に決定する方法が問題となり、また、両法とも基本領域の形成方法によってどのような構図領域が抽出されるかに影響を及ぼしやすく、また、局所解に陥りやすいという問題がある。
この点、モデルのパラメータの記述長と、モデルを用いてデータを記述したときの記述長の和が最小となるモデルを選択していくMDL基準には上記のような欠点はなく、MDL基準に基づいて基本領域の統合を行うことで構図領域を特定することが特に好ましい。
なお、構図領域の特定の際、例えば、全ての基本領域(或いは、統合された領域)から選ばれる2つの領域の全ての組み合わせについて、それぞれの領域から抽出される特徴量ベクトルを用いてマハラノビス汎距離を計算し、これが最小となる2つの領域について、MDL基準に基づく統合の判断を行うようにすることが可能であり、これにより、構図領域の抽出のための計算の高速化を図ることができる。
また、更に、主成分分析によりこの計算に使用する特徴量ベクトルを次元圧縮することが可能であり、これにより、計算の高速化が実現されるとともに、計算に含まれるべき乗計算などにより計算値が発散し、或いは、ゼロに収束して有意な結果を得ることができないなどの不都合を回避することが可能となる。
また、本発明における注目度は、一の画像群の各構図領域から抽出される特徴量ベクトル(帰属特徴量ベクトル)の当該一の画像群における分散度に対して逆相関の関係にある指数であり、例えば、帰属特徴量ベクトルの共分散行列の行列式を分散度を示す指標として使用し、当該行列式の逆数、当該行列式の対数の逆数、或いは、これらを任意の量により規格化した数値などを注目度とすることが可能である。
このような注目度は、各画像群への分類の際に、各構図領域がどの程度注目されたか、乃至、どの程度重視されたかを示すものと考えられる。
なぜなら、ある画像群における構図領域から抽出された帰属特徴量ベクトルの分散が小さければ、その構図領域では、その画像群に分類する際の基準が一貫していると考えることができ、その分散が大きければ、その画像群に分類する際の基準が一貫していないと考えることができるからである。
また、本発明におけるSVM(サポートベクターマシン/Support Vector Machine)は、例えば、赤穂昭太郎、津田宏治,「サポートベクターマシン−基本的仕組みと最近の発展−」,数理科学,No444,52〜58頁,(2000年)などに詳述される2クラス識別器であり、一の画像群のある特定の構図領域についてのSVMに基づく第1の識別関数は以下のようにして導くことができる。
即ち、帰属画像(一の画像群に含まれる画像)の各構図領域から特徴量ベクトル(帰属特徴量ベクトル)を抽出するとともに、非帰属画像(一の画像群以外の画像軍に含まれる画像、即ち画像データベースに含まれる全ての画像のうちの帰属画像以外の画像)のそれぞれを、構図領域と同一の領域である第1対応領域に分割し、各非帰属画像の各第1対応領域から特徴量ベクトル(非帰属特徴量ベクトル)を抽出する。
そして、各帰属画像の上記特定の構図領域から抽出された帰属特徴量ベクトル、及び、各非帰属画像の上記特定の構図領域に対応する第1対応領域から抽出された非帰属特徴量ベクトルからなるテストサンプルをx=(χ,・・・、χとした場合、第1の識別関数f(x)は、式(1)で示される。
Figure 0004796356
ここで、帰属特徴量ベクトルが帰属するクラスを第1のクラス、非帰属特徴量ベクトルが帰属するクラスを第2のクラスとして、SVMの学習用のクラスラベルをyと表記し、テストサンプルが第1のクラスに属していればy=1、第2のクラスに属していればy=−1とする。
この場合、識別平面とテストサンプルの間のマージンを最大化することができる第1の識別関数は、以下の最適化問題を解くことにより求めることが可能である。
Figure 0004796356
また、本発明における対象画像の一の画像群に対する判別分析(対象画像を一の画像群に判別するか否かについての決定)は、当該一の画像群について特定された個々の構図領域について上記により導出された第1の識別関数を用いた識別の結果に基づいて行われる。
即ち、対象画像は、一の画像群について特定された構図領域と同一の領域である第2対応領域に分割され、対象画像の第2対応領域のそれぞれから、特徴量ベクトル(対象特徴量ベクトル)が抽出される。
続いて、各第2対応領域から抽出された対象特徴量ベクトルを、当該第2対応領域に対応する構図領域について導出された第1の識別関数に適用することにより、各対象特徴量ベクトルが第1、第2のクラスのいずれに帰属するかの識別が行われる。
そして、対象画像の一の画像群に対する判別分析は、第1のクラスに帰属すると識別された対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域の注目度に基づいて行われる。
また、上記本発明に係る判別分析のための方法、プログラム又は装置では、SVMに基づく識別に、更に1クラスSVMに基づく識別を併用することにより、判別の精度を更に高めることが可能である。
即ち、SVMは2クラスの識別器であるため、どのようなデータであっても必ずどちらかのクラスに識別されることになり、本来いずれの画像群にも判別されるべきでない外れ点(例えば、画像から鑑賞者が受ける印象を所与の基準として複数の画像群への分類が行われた画像データベースに本発明を適用する場合であれば、どの画像群についての印象も喚起されないような画像)が一の画像群に識別される恐れがあるが、このような外れ点を1クラスSVMにより検出することが可能である。
1クラスSVMは、非線形な写像Φであって、写像Φによる写像先での内積が元の空間におけるガウシアンカーネル関数の値と一致する写像Φを用いて写像を行うと、元の空間の外れ点は原点近くに写像されるという性質を利用して外れ点の識別を行うものである(1クラスSVMについての詳細は、例えば、麻生英樹、津田宏治、村田昇著,「統計化学のフロンティア6 パターン認識と学習の統計学」,岩波書店,2003年に記載されている)。
いま、一の画像群A={C,・・・CNA} に属する画像C (i=1,・・・NA) のある構図領域Pから抽出した特徴量ベクトル(帰属特徴量ベクトル)をxi,k (i=1,・・・NA) とすると、1クラスSVMに基づく第2の識別関数は、式(5)により与えられる。
Figure 0004796356
上記写像Φによる帰属特徴量ベクトルの写像ベクトルΦ(xi,k )を原点側の写像ベクトルであって、予め定められた割合νの写像ベクトルと、それ以外の写像ベクトルとに分けるような超平面を定める第2の識別関数は、以下の式(6)に示される最適化問題を解くことにより導くことができる。
Figure 0004796356
従って、第1の識別関数により第1のクラスに識別される対象特徴量ベクトルであって、かつ、当該対象特徴量ベクトルの上記写像Φによる写像ベクトルである対象写像ベクトルが、対応する構図領域について導出された第2の識別関数により原点側に識別されない対象写像ベクトルについての対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域の注目度に基づいて判別分析を行うことにより外れ点を除外することが可能となり、従って、より精度の高い判別分析を行うことが可能となる。
また、本発明における対象画像の一の画像群に対する判別分析は、第1の識別関数により第1のクラスに識別された対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度を積算した値である確信値が、予め定められた閾値を越えているか否かに基づいて行うものとすることが可能であり、これにより、判別分析の画一化、容易化を図ることができる。
同様に、上述の1クラスSVMを併用する場合には、第1の識別関数により第1のクラスに識別された対象特徴量ベクトルであって、かつ、第2の識別関数により原点側に識別されなかった対象写像ベクトルについての対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度を積算した値である確信値が、予め定められた閾値を越えているか否かにより、対象画像の一の画像群に対する判別分析を行うことが可能であり、これにより、判別分析の画一化、容易化を図ることができる。
また、本発明において、各帰属画像、各非帰属画像及び対象画像のそれぞれから複数種類の解像度の帰属画像、非帰属画像及び対象画像を生成し、それぞれの解像度の帰属画像、非帰属画像及び対象画像について上記本発明に従う判別分析を行うことが可能であり、これにより、分類者が分類の際に注目するオブジェクトや模様のサイズの多様性にも対応した判別分析を行うことが可能となり、更に、上記した確信値に基づいて判別分析を行うのであれば、各解像度について上記により導出された確信値を積算した値が、予め定められた閾値を越えているか否かにより判別分析を行うことが可能であり、これにより、判別分析の画一化、容易化を図ることができる。
また、上記においては、SVMに基づく第1の識別関数を、各構図領域から抽出された各帰属特徴量ベクトルが帰属する第1のクラスと、当該構図領域に対応する第1対応領域から抽出された各非帰属特徴量ベクトルが帰属する第2のクラスとを識別するものとして導出したが、SVMは、2つのクラス(第1、第2のクラス)が線形分離可能であるときには高い認識率を期待できるが、非線形で複雑な問題に対してはその限りではない。
そこで、非線形な写像Φであって、写像Φによる写像先での内積が、元の空間におけるカーネル関数(カーネル関数の一例としては、ガウシアンカーネルを挙げることができる)の値と一致する写像Φにより、各帰属特徴量ベクトル及び各非帰属特徴量ベクトルを写像し、SVMに基づく第1の識別関数を、各帰属特徴量ベクトルを写像Φにより写像したベクトルが帰属する第1のクラスと、各非帰属特徴量ベクトルを写像Φにより写像したベクトルが帰属する第2のクラスとに識別するものとして導出することにより、線形分離性を高めることが可能である。
なお、この場合には、本発明の第8のステップにおける識別又は帰属クラス識別手段による識別は、対象画像の各第2対応領域から導出される対象特徴量ベクトルを上記写像Φにより写像したベクトルを、上記第1の識別関数に適用することにより行われることになる。
本発明では、互いに類似する画像群を統合することによって、元の画像群数より少ない複数の大グループを形成する第11のステップと、前記複数の大グループのいずれかの大グループに対象画像を判別する第12のステップと、前記第12のステップにおいて対象画像が判別された大グループに属する画像群である大グループ内画像群が複数である場合には、そのいずれかの大グループ内画像群に対象画像を判別する第13のステップとを有し、前記第12のステップが、前記複数の大グループを前記複数の画像群として前記第1〜第8のステップ及び前記判別決定ステップを実行するものであり、前記第13のステップが、前記大グループ内画像群を前記複数の画像群として前記第1〜第8のステップ及び前記判別決定ステップを実行するものとすることが好ましい(請求項10)。
本発明における第1の識別関数は、一の画像群の構図領域から抽出される帰属特徴量ベクトルが帰属する第1のクラスと、一の画像群以外の画像群に属する画像の第1対応領域から抽出される非特徴量ベクトルが帰属する第2のクラスとを識別する関数として導出されるが、真に第1のクラスと第2のクラスとを識別できる適切な第1の識別関数の導出を可能とするには、帰属特徴量ベクトルの個数と非帰属特徴量ベクトルの個数に大きな隔たりがないこと、換言すれば、一の画像群に属する画像数と、それ以外の画像群に属する画像数に大きな隔たりがないことが必要である。
従って、仮に個々の画像群に属する画像数が同程度であったとしても、画像群数が多い場合(例えば10個以上)や、画像群数がさほど多くなくても、一の画像群に属する画像数が、全体の画像数と比較して極端に少ない場合には、真に第1のクラスと第2のクラスとを識別できる適切な第1の識別関数を導出することができず、そのために、妥当性のある判別分析が実行できなくなる。
請求項10の発明は、複数の画像群を統合することで大グループを形成し、対象画像の判別を、大グループ間での判別と、大グループに属する画像群である大グループ内画像群間での判別の2段階で行うことにより、帰属特徴量ベクトルの個数と非帰属特徴量ベクトルの個数に大きな隔たりを生じないようにし、より多くの場合に妥当性のある判別分析が行われるようにしたものである。
なお、請求項10の発明では、互いに類似する大グループを統合することで更に上位の大グループを形成し、対象画像の判別を、3以上の多段階で行うようにすることも可能である。
ここで、複数の画像群から構成される一般的な画像データベースを考えると、ある画像群と他の画像群が何らかの意味で類似しており、ある画像群と更に他の画像群とは全く類似しない、といったように画像群間にも類似度が存在しているケースが多いと考えられるが、そのような場合には、画像群間の類似度を大グループの形成において考慮することにより、判別精度の向上を図ることが可能となる。
そして、画像群間の類似度を考慮した大グループの形成を行うについては、MDL基準を用いることが好ましい。
即ち、K−means法やX−means法に基づいて画像群間の類似度を考慮した大グループの形成を行うことも可能であるが、K−means法は、大グループの個数を事前に決定する方法が問題となり、また、両法とも局所解に陥りやすいという問題があり、このような欠点を有さないMDL基準に基づいて大グループの形成を行うことが好ましい。
本明細書は、第2の発明として、所与の基準に基づいて分類された複数の画像群のいずれかの画像群に対象画像を判別するための方法又は装置であって、互いに類似する画像群を統合することにより、元の画像群数よりも少ない複数の大グループを形成する第1のステップ又は手段と、前記複数の大グループのいずれかの大グループに対象画像を判別する第2のステップ又は手段と、前記第2のステップにおいて対象画像が判別された大グループに属する画像群である大グループ内画像群が複数である場合には、そのいずれかの大グループ内画像群に対象画像を判別する第3のステップ又は手段とを有することを特徴とする方法又は装置、或いは上記各ステップをコンピュータに実行させるプログラムを開示する。
3以上の画像群の識別を2クラス識別器を用いて行う手法には、大きく分けて、
(1)「画像群Aとそれ以外」という2クラス識別をn回行う方法(one−vs−all方法)、
(2)「画像群Aと画像群B」という2クラス識別をn×n回行う方法(pairwise方法)、
(3)2分木を用いて2クラス識別を行う方法(2分木法)
の3種類があるが、画像群数が多い場合には、上記のいずれの手法によっても、多数の識別器の学習と多数回の識別の実行が必要であり、この識別器数及び識別回数の低減が一つの課題となっている。
本願第2の発明は、この課題を解決したものであり、2クラス識別器を用いて3以上の画像群の識別を行う判別分析における識別器数及び識別回数の低減を達成し、或いは更に判別精度の向上をも達成するものである。
複数の画像群から構成される画像データベースでは、画像群間になんらか意味での類似度が存在するケースが多いことは上記の通りであり、本願第2の発明では、この点に注目し、ある程度類似したクラスを統合することで大グループを形成し、対象画像の判別を、大グループ間での判別と、大グループに属する画像群である大グループ内画像群間での判別の2段階で行うことにより、識別器数及び識別回数の低減を達成した。
図2は、本願第2の発明による効果を従来の2分木法と対比して示す説明図である。
図2左側は、SVMに基づく2クラス識別器を従来の2分木法に基づいて配置したものである。図中のA/Bは画像群Aと画像群Bの識別器を表す。A〜Fの6つの画像群に対して、15個の識別器を用意(学習)する必要があり、かつ、A〜Fのいずれかの画像群に対象画像を判別するには、5回の識別が必要となる。
図2右側は、SVMに基づく2クラス識別器を本願第2の発明に従って配置したものである。ここでは、A〜FのうちA、B、Cをまとめて大グループαを、D、E、Fをまとめて大グループβを生成している。A〜Fの6つ画像群に対して、7個の識別器しか用意(学習)する必要がなく、かつ、わずか3回の識別でA〜Fのいずれかの画像群に対象画像を判別することができる。
また本願第2の発明では、類似する画像群同士を統合することにより大グループを形成するものとしたため、ランダムに大グループを生成する場合と比べ高い判別精度が期待できる。
第2の発明では、互いに類似する大グループを統合することで更に上位の大グループを形成し、対象画像の判別を、3以上の多段階で行うようにすることも可能である。
第2の発明における互いに類似する画像群を統合することによる大グループの形成は、請求項10の発明について上記したと同様の理由により、MDL基準に基づいて行うことが好ましい。
第2の発明は、SVMに基づく識別関数を用いて2クラス識別を行う方法、プログラム、装置に好適に適用することができるが、SVM以外の手法による2クラス識別を行う方法、プログラム、装置にも同様に適用することができる。
以下、本発明の画像検索方法を実行するためのプログラム、及び、本発明の画像検索装置の一実施形態(第1の実施形態)を、添付の図面を参照して説明する。
プロの写真家により撮影された人物画像から、コンテンツ業務に携わる専門家10名の合議により、「フレッシュ&クリーン」の印象を感じると判断された画像154枚よりなる画像群A(印象グループA)、「ナチュラル&リラックス」の印象を感じると判断された画像169枚よりなる画像群B(印象グループB)、及び、「モダン&アーバン」の印象を感じると判断された画像108枚よりなる画像群C(印象グループC)を抽出し、中央処理装置(CPU)、ROM、RAM、ハードディスクなどの各種の記憶装置を備えるパーソナルコンピュータを用い、以下の手順で判別分析を行い、その有効性の確認を行った。
(1)画像データベースの構築
上記画像群A〜Cの各画像のイメージデータを3種類の解像度(1/1、1/4、1/16)でハードディスクに取り込み、これを画像データベース(教師データ)とした。
(2)特徴量ベクトルの導出法
本実施の形態では、任意の領域における特徴量ベクトルとして、下記の84種類の局所的特徴量と、6種類の全域的特徴量から構成される90次元のベクトルを使用するものとした。
(a)局所的特徴量
局所的特徴量としては、式(7)に従って、輝度値((R+G+B)/3)についての3点間コントラスト値Contを導出した。
Figure 0004796356
ここで、rは参照点であり、a (i) (i)は変位であり、f(r)は参照点、変位点における輝度値である。
式(7)において、分子は視神経への刺激の差分であり、これを分母の刺激強度で正規化することで、式(7)のコントラスト値には、刺激強度に対してスケール不変であり、また、ノイズに強いという特性が与えられている。
また、参照点と2つの変位点についての3点間コントラスト値とすることにより、画像の直線的な変化の方向性だけでなく、曲線的な変化にも対応することができるようにされている。
また、式(7)において、変位a (i) (i)の取り方は無数に考えられるが、ここでは、近接画素間の関係を重視して参照点rの周りの局所的な3×3の画素に限定し、図3に示す28種類のパターンでの3点間コントラスト値を計算した。なお、図中の「+」は参照点rを、「*」は変位a (i) (i)を示している。
そして、式(7)で求められるコントラスト値から、信号強度に対するスケール不変性を維持しつつ、入力信号間の相対的な信号の強弱を強調するために、式(8)のγ値を導出した。
Figure 0004796356
更に、γ値をL段階(λ,・・・,λ)にレベル分けし、式(9)で示されるγ’値を導入した。なお、本実施形態では計算の簡明のため、L=3とした。
Figure 0004796356
そして、式(10)に示されるw(γ値がλのレベルである信号が全信号に占める割合)を用いて式(11)に示されるg値を求め、これを局所的特徴量とした。
Figure 0004796356
Figure 0004796356
ここで、Pは任意の画像において特徴量ベクトルの抽出の対象となる任意の画像領域であり、式(11)のg値は、wによる重み付けを行うことにより、対象となる画像領域中でどの信号が相対的に強く反応しているかが強調され、また、入力された信号の取捨選択が行われており、これにより、人の知覚作用における側抑制の機構の再現が図られている。
g値としては、28パターン×3レベルについて、合計84の値が導出される。
(b)全域的特徴量
全域的特徴量としては、輝度値及び2種類の色差(R−G、及び、Y−B)についての領域Pにおける信号強度の平均値、及び、分散の6つの値を使用した。
(3)構図領域の特定
上記3種類の解像度についての3つの画像群A〜Cについて、以下の手順により構図領域を抽出した。
(a)全ての解像度の全ての画像群の各画像の画像平面を5×5のメッシュに分割し、これを基本領域Pk,ρ(k=1〜25,ρ=1〜3)とした。
(b)そして、それぞれの基本領域から(2)の方法により90次元の特徴量ベクトルxk,ρを抽出し、これに主成分分析を適用して次元圧縮を行い、低次元特徴量ベクトルyk,ρを導出し、更に、yk,ρの各類似画像群の各解像度についての重心ベクトルを導出した。
(c)続いて、基本領域Pk,ρから得た重心ベクトルと、基本領域Pl,ρから得た重心ベクトルの間のマハラノビス汎距離D k,lを式(12)により導出した。
Figure 0004796356
ここで、yk,ρ、yl,ρの上部にバーが付されている記号は、それぞれ、基本領域Pk,ρ、Pl,ρから得た上記重心ベクトルであり、Σ−1は共分散行列の逆行列である。
(d)続いて、全ての基本領域の組み合わせのうち、マハラノビス汎距離D k,lが最小となる2つの基本領域Pk,ρ、Pl,ρを統合した場合の統合モデルのMDL(MDL(uni))と統合しない場合の分割モデルのMDL(MDL(div))を以下の方法により導出した。
まず、基本領域Pk,ρから抽出される特徴量ベクトルxk,ρが、当該類似画像群において式(13)に示されるn変量正規分布に従うものと仮定する。
Figure 0004796356
ここで、θ=(μ,Σ)は、n変量正規分布のパラメータであり、μは期待値ベクトル、Σは共分散行列であり、この場合の基本領域Pk,ρのMDLは式(14)により表すことができる。
Figure 0004796356
ここで、θ上の「^」が付された記号はθの最ゆう推定量であり、Jは自由度であり、I(θ)はp(x|θ)のFisher情報行列であり、|・|は、「・」の行列式である。また、L(・)は、「・」のゆう度関数であり、L(・)=Πp(・)である。
いま、基本領域Pk,ρ、Pl,ρを統合した統合領域Pkl,ρから抽出される特徴量ベクトルxkl,ρが類似画像群内でパラメータをθkl=(μkl,Σkl)とするn変量正規分布をしていると仮定すると、統合領域Pkl,ρのMDL(uni)は、式(15)で表すことができる。
Figure 0004796356
ここで、J(uni)は統合モデルの自由度である。
また、統合しない場合の基本領域Pk,ρ、Pl,ρの特徴量ベクトルxl,ρ、xl,ρにパラメータθ=(θ,θ)を持つ式(16)で表される確率分布を仮定する。
Figure 0004796356
ここで、p(x|θ)、p(x|θ)は、それぞれ、パラメータθ、θを持つ確率密度関数である。
この時の分割モデルのMDL(div)は、式(17)で表される。
Figure 0004796356
そして導出された両MDLが、MDL(uni)≦MDL(div)となる場合には、その2つの基本領域を統合して新たな基本領域とする処理を行った。MDL(uni)≧MDL(div)となる場合には、統合は行われない。
(e)上記の(c)及び(d)の手順を繰り返して実行し、最終的に残された基本領域、及び、基本領域の統合により生じた基本領域のそれぞれが構図領域として特定された。
(5)注目度の導出
画像から受ける印象に基づく分類を行う際、鑑賞者は、画像中の各特徴を同列に評価せず、画像中の一部の(興味を引かれた)オブジェクトや背景を重点的に評価していると考えられるが、上記(4)において抽出した各構図領域がどの程度の重みをもって評価されたかを、当該構図領域から抽出される特徴量ベクトルが画像群内においてどの程度分散しているかにより推定することが可能である。
即ち、特徴量ベクトルの各画像群内における分布の分散が大きければ、分類者はさほどその構図領域には注目していないと考えられ、逆に、その分散が小さければ、その構図領域に対する注目度は高いと考えることが可能である。
本実施形態では、この考えに基づき、各画像群について、解像度ρの構図領域Pk,ρにおける注目度zk,ρを下記の式(18)により導出した。
Figure 0004796356
ただし、
Figure 0004796356
であり、Σk,ρは、対象となる画像群の解像度ρの構図領域Pk,ρから抽出される特徴量ベクトルxk,ρの共分散行列であり、|・|は行列式である。また、ΣρΣk,ρ=1である。
(6)識別関数の導出
SVMに基づく第1の識別関数及び1クラスSVMに基づく第2の識別関数は、一の画像群(比較対象の画像群)毎に、各解像度の各構図領域について導出される。なお、ここでは、説明の便宜上、一の画像群である画像群Aのある解像度ρのある構図領域Pについて第1、第2の識別関数を導出する場合について説明する。
(a)帰属特徴量ベクトル、非帰属特徴量ベクトル、対象特徴量ベクトルの導出
解像度ρの画像群Aに属する各画像の構図領域Pから、(2)の手順に従って特徴量ベクトル(帰属特徴量ベクトル)を導出する。
同様に、解像度ρの画像群A以外の画像群(即ち、画像群B及びC)に属する各画像の上記構図領域Pに対応する領域(第1対応領域)から、(2)の手順に従って特徴量ベクトル(非帰属特徴量ベクトル)を導出する。
同様に、解像度ρの対象画像の構図領域Pに対応する領域(第2対応領域)から、(2)の手順に従って、特徴量ベクトル(対象特徴量ベクトル)を導出する。
なお、以下では、上記により求めた帰属特徴量ベクトル及び非帰属特徴量ベクトルをxi,k(i=1,・・・,N)と表記する。ここで、Nは、画像群A〜Cに属する画像の総数である。
また、SVMの学習用のクラスラベルをy(i=1,・・・,N)と表記し、画像ciが画像群Aに属する場合はy=1とし、画像群Aに属しない場合はy=−1とする。
(b)第1の識別関数の導出
上記した通り、本発明のSVMに基づく第1の識別関数は、各帰属特徴量ベクトルが帰属するクラス(第1のクラス)と、各非帰属特徴量ベクトルが帰属するクラス(第2のクラス)とを識別するものとして導出することもできるが、本実施例では、より高い識別性を得るために、非線形な写像Φであって、写像Φによる写像先での内積(Φ(x)・Φ(x′))が、元の空間で定義されるカーネル関数K(x,x′)の値と一致する写像Φを用い、各帰属特徴量ベクトル及び非帰属特徴量ベクトルを写像したベクトルΦ(x)を用いて第1の識別関数が導出される。
なお、上記カーネル関数K(x,x′)としては、式(20)のガウシアンカーネルを用いることができる。
Figure 0004796356
この場合、第1の識別関数f(Φ(x))は、下記式(21)となる。
Figure 0004796356
ここで、sgn(u)はu>0のときには1、u≦0のときには−1となる符号関数であり、wは重みベクトルである。
この第1の識別関数f(Φ(x))は、以下式(22)に示される最適化問題を解くことにより導出することができる。
Figure 0004796356
(c)第2の識別関数の導出
上記した通り、本発明の判別分析は、SVMに基づく第1の識別関数による識別の結果にのみ基づいて行うことも可能であるが、本実施形態では、外れ点が第1のクラスに識別されることにより、誤った判別がなされる可能性を低減するために、SVMに基づく第1の識別関数による識別に1クラスSVMに基づく第2の識別関数による識別を併用する。
1クラスSVMに基づく第2の識別関数は、各帰属特徴量ベクトルを、非線形な写像Φであって、Φによる写像先での内積が元の空間における上記式(20)に示すガウシアンカーネル関数K(x,x′)の値と一致する写像Φにより写像することにより得られる写像ベクトルΦ(x)を、原点側の写像ベクトルであって、予め定められた割合νの写像ベクトルと、それ以外の写像ベクトルとに識別する超平面として求められる。
上記に従い、ある解像度ρの画像群Aに属する帰属画像c(i=1,・・・NA)の構図領域Pから得られる帰属特徴量ベクトルをxi,k(i=1,・・・,NA)とすれば、第2の識別関数f(1svm),A(Φ(x))は、下記式(23)で表される。
Figure 0004796356
ここで、sgn(u)はu>0のときには1、u≦0のときには−1となる符号関数であり、wは重みベクトルである。
予め定められた割合ν(ν∈(0,1])の写像ベクトルΦ(x)が原点側に残る(外れ点とされる)ような超平面は、下記式(24)に示される最適化問題を解くことにより求められる。
Figure 0004796356
(7)判別分析
本実施の形態では、以下の式(25)で定義される確信値Dを導出し、Dが閾値である0.5を越える場合に対象画像を一の画像群である画像群Aに判別した。
Figure 0004796356
ここで、式(25)中のδk,ρ、δ(1svm) k,ρは、それぞれ、以下の式(26)、(27)により定義されるデルタ関数である。
また、式(26)、(27)中のxk,ρは、解像度ρの画像群Aについて特定される構図領域Pと同一の領域である第2対応領域から抽出される、解像度ρの対象画像の対象特徴量ベクトルであり、zk,ρは解像度ρの画像群Aの構図領域Pについて上記(5)の手順で導出された注目度である。
Figure 0004796356
(8)判別分析の精度の評価
以下の手順により判別分析を行い、その判別精度を評価した。
(a)評価1
本発明により教師データの学習がどの程度正しく行われているかを確かめるため、LOO法による評価を実行した。
この評価では、上記画像群Aに分類された画像154枚、画像群Bに分類された画像169枚、画像群Cに分類された画像108の合計431枚の画像を使用し、この431枚の画像のうちの1枚を抜き取って対象画像とし、残りの430枚の画像から構成される画像データベースを教師データとして上記(1)〜(7)の手順による判別分析を実行し、対象画像が当初に分類されていた画像群に正しく判別されるか否かを判定し、この作業を、順次対象画像を変更して全ての画像について実行した時の判別精度を評価した。
上記評価の結果は図4(a)に示す通りであり、いずれの画像群についても70%以上の極めて高い精度で専門家の分類を再現できていることが確認された。
(b)評価2
続いて、未分類の写真画像7329枚をテストデータとして使用し、これを順次対象画像として上記(1)〜(7)の手順を実行することにより上記画像群A〜Cに対する判別分析を実行し、各対象画像が正しい画像群に判別された場合を成功、正しい画像群に判別されなかった場合を失敗として、成功率を評価した。
なお、7329枚のテストデータ中、事前の目視によるチェックにより、画像群Aに属すると判定されたものは533枚、画像群Bに属すると判定されたものは1202枚、画像群Cに属すると判定されたものは282枚である。
上記評価の結果は図4(b)に示す通りであり、いずれの画像群についても70%以上の極めて高い精度で正しい画像群への判別を再現できていることが確認された。
続いて、本願第2の発明に対応する第2の実施形態として、11個の画像群c(c=1〜11)からなる画像データベースに対する対象画像の判別を行う手法について説明する。
まず、判別に使用される2クラス識別器の個数及び2クラス識別の回数を低減させることを目的として、11個の画像群cを、11よりも小さい数(2〜10個)の大グループに統合する。
画像群間の類似度を評価するための画像特徴量としては、各画像群の各画像から抽出される任意の特徴量ベクトルを使用することができるが、ここでは、上記(2)の手順において説明したと同様の90次元の特徴量ベクトルを使用する。ただし簡単のため、各画像を基本領域に分割することはせず、各画像群に属する各画像の画像平面P全体から抽出した画像特徴量xを用いる。
(α)そして、全ての画像群の全ての画像から画像特徴量xを抽出し、これに主成分分析を適用して次元圧縮を行うことで低次元特徴量ベクトルyを導出し、各画像群cについて、低次元特徴量ベクトルyの重心ベクトルyを導出する。
(β)続いて、重心ベクトルyを用い、各画像群cから選ばれる2つの画像群c、c間のマハラノビス距離D c1c2を算出する。マハラノビス距離D c1c2の算出は、上記(3)(c)の手順と同様にして行うことができる。
そして、各画像群cから選ばれるすべての組み合わせの画像群c、cの中で、マハラノビス距離D c1c2が最小となる画像群c、cを統合した場合の統合モデルのMDL(MDL(uni))と統合しない場合の分割モデルのMDL(MDL(div))を導出する。
このMDL(uni)及びMDL(div)の導出は、上記手順(3)(d)において述べた手順を、式(13)〜(17)におけるk及びlをc及びcに置き換えてそのまま実行することにより行うことができる。
導出された両MDLが、MDL(uni)≦MDL(div)となる場合には、その2つの画像群を統合して新たな画像群とし、MDL(uni)≧MDL(div)となる場合には、統合は行わない。
(γ)上記(α)及び(β)の手順を繰り返して実行し、最終的に残された画像群、及び画像群の統合により生じた画像群のそれぞれを大グループとする。
上記(α)〜(γ)により大グループが形成されたならば、大グループ間における対象画像の判別分析を実行する。この判別分析は、第1の実施形態における画像群A〜Cを上記により形成された大グループに置き換えて実行することにより行うことができる。
そして、対象画像が判別された大グループに2以上の画像群(グループ内画像群)が含まれている場合には、第1の実施形態と同様にして、グループ内画像群間における対象画像の判別分析を実行する。対象画像が判別された大グループに属するグループ内画像群が1つであれば、対象画像はそのグループ内画像群に判別される。
本発明の概略を概念的に示す説明図。 本発明による効果を従来の2分木法と対比して示す説明図。 3点間コントラストの導出に使用される隣接画素の配置を示す説明図。 本発明の一実施形態に係る判別分析の精度についての評価結果を示す説明図。

Claims (11)

  1. 所与の基準に基づいて分類された複数の画像群のいずれかの画像群に対象画像を判別するための方法であって、
    コンピュータに、
    前記複数の画像群のうちの一の画像群に含まれる画像である帰属画像のそれぞれを所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する第1のステップと、
    前記一の画像群について、特徴量ベクトルの分布が近似する基本領域を統合することにより構図領域を特定する第2のステップと、
    各帰属画像の各構図領域から、帰属特徴量ベクトルとして、特徴量ベクトルを抽出する第3のステップと、
    各構図領域について、帰属特徴量ベクトルの前記一の画像群における分散度に対して逆相関の関係にある指数である注目度を導出する第4のステップと、
    前記一の画像群以外の画像群に属する画像である非帰属画像のそれぞれを構図領域と同一の領域である第1対応領域に分割し、非帰属特徴量ベクトルとして、各非帰属画像の各第1対応領域から特徴量ベクトルを抽出する第5のステップと、
    各構図領域について、構図領域から抽出された各帰属特徴量ベクトルが帰属する第1のクラスと、当該構図領域に対応する第1対応領域から抽出された各非帰属特徴量ベクトルが帰属する第2のクラスとを識別するSVMに基づく第1の識別関数を導出する第6のステップと、
    対象画像を構図領域と同一の領域である第2対応領域に分割し、対象特徴量ベクトルとして、各第2対応領域から特徴量ベクトルを抽出する第7のステップと、
    各第2対応領域から抽出された対象特徴量ベクトルを、対応する構図領域について導出された第1の識別関数に適用することにより、対象特徴量ベクトルの識別を行う第8のステップと、
    前記第8のステップにおいて第1のクラスに識別された対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度に基づいて対象画像を前記一の画像群に判別するか否かを決定する判別決定ステップと
    各構図領域について、構図領域から抽出された各帰属画像の帰属特徴量ベクトルを、非線形な写像であって、当該写像による写像先での内積が元の空間におけるガウシアンカーネル関数の値と一致する当該写像により写像することにより得られる写像ベクトルを、原点側の写像ベクトルであって、予め定められた割合νの写像ベクトルと、それ以外の写像ベクトルとに識別する1クラスSVMに基づく第2の識別関数を導出する第9のステップと、
    各第2対応領域から抽出される対象特徴量ベクトルを前記写像により写像することにより得られる写像ベクトルである対象写像ベクトルに、対応する構図領域について導出された第2の識別関数を適用することにより、各対象写像ベクトルが原点側に識別されるか否かを判定する第10のステップとを実行させ、
    前記判別決定ステップにおいて、
    前記第8のステップにおいて第1のクラスに識別された対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度を積算した値である確信値、又は、
    前記第8のステップにおいて第1のクラスに識別された対象特徴量ベクトルであって、かつ、前記第10のステップにおいて原点側に識別されないと判定された対象写像ベクトルについての対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度を積算した値である確信値が、予め定められた閾値を越えている場合に対象画像を前記一の画像群に判別させることを特徴とする方法。
  2. コンピュータに、各帰属画像、各非帰属画像及び対象画像のそれぞれから複数種類の解像度の画像を生成させ
    各解像度の各帰属画像、各非帰属画像及び対象画像について、前記第1〜第10のステップが実行され
    前記判別決定ステップにおいて、各解像度について導出された前記確信値が、予め定められた閾値を越えている場合に対象画像を前記一の画像群に判別されることを特徴とする請求項に記載の方法。
  3. 前記第6のステップにおいて、
    非線形な第2の写像であって、当該第2の写像による写像先での内積が元の空間におけるカーネル関数の値と一致する当該第2の写像による各帰属特徴量ベクトル及び各非帰属特徴量ベクトルの写像が実行され、
    各構図領域についての第1の識別関数は、構図領域から抽出された各帰属特徴量ベクトルを前記第2の写像により写像したベクトルが帰属する第1のクラスと、当該構図領域に対応する第1対応領域から抽出された各非帰属特徴量ベクトルを前記第2の写像により写像したベクトルが帰属する第2のクラスとを識別する関数として導出され、
    前記第8のステップにおける識別は、前記第2の写像により対象特徴量ベクトルを写像したベクトルを第1の識別関数に適用することにより行われることを特徴とする請求項1又は2に記載の方法。
  4. 解像度ρの構図領域Pにおける特徴量ベクトルの共分散行列をΣk,ρとして、
    Figure 0004796356
    ただし、
    Figure 0004796356
    により前記注目度zk,ρ 導出されることを特徴とする請求項1〜のいずれか一項に記載の判別方法。
  5. 前記第2のステップにおいて、特徴量ベクトルの分布の近似性MDL基準に基づいて判断されることを特徴とする請求項1〜のいずれか一項に記載の方法。
  6. 前記第2のステップにおいて、各基本領域から抽出される特徴量ベクトルの、比較対象の画像群、又は、比較対象の画像群の各解像度における重心ベクトルが導出され、当該重心ベクトル間のマハラノビスの汎距離が最小となる2つの基本領域を統合の対象として、MDL基準に基づく判定が行われることを特徴とする請求項に記載の方法。
  7. 各基本領域から抽出される特徴量ベクトルを主成分分析により次元圧縮し、次元圧縮された低次元特徴量ベクトルを用いて前記重心ベクトルの導出が行われることを特徴とする請求項に記載の方法。
  8. コンピュータに、
    互いに類似する画像群を統合することによって、元の画像群数より少ない複数の大グループを形成する第11のステップと、
    前記複数の大グループのいずれかの大グループに対象画像を判別する第12のステップと、
    前記第12のステップにおいて対象画像が判別された大グループに属する画像群である大グループ内画像群が複数である場合には、そのいずれかの大グループ内画像群に対象画像を判別する第13のステップとを更に実行させ
    前記第12のステップが、前記複数の大グループを前記複数の画像群として前記第1〜第8のステップ及び前記判別決定ステップを実行するものであり、
    前記第13のステップが、前記複数の大グループ内画像群を前記複数の画像群として前記第1〜第8のステップ及び前記判別決定ステップを実行するものであることを特徴とする請求項1〜に記載の方法。
  9. 前記第11のステップにおける画像群の統合が、MDL基準に基づいて実行されることを特徴とする請求項に記載の方法。
  10. 所与の基準に基づいて分類された複数の画像群のいずれかの画像群に対象画像を判別するためのプログラムであって、
    コンピュータに、
    前記複数の画像群のうちの一の画像群に含まれる画像である帰属画像のそれぞれを所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する第1のステップと、
    前記一の画像群について、特徴量ベクトルの分布が近似する基本領域を統合することにより構図領域を特定する第2のステップと、
    各帰属画像の各構図領域から、帰属特徴量ベクトルとして、特徴量ベクトルを抽出する第3のステップと、
    各構図領域について、帰属特徴量ベクトルの前記一の画像群における分散度に対して逆相関の関係にある指数である注目度を導出する第4のステップと、
    前記一の画像群以外の画像群に属する画像である非帰属画像のそれぞれを構図領域と同一の領域である第1対応領域に分割し、非帰属特徴量ベクトルとして、各非帰属画像の各第1対応領域から特徴量ベクトルを抽出する第5のステップと、
    各構図領域について、構図領域から抽出された各帰属特徴量ベクトルが帰属する第1のクラスと、当該構図領域に対応する第1対応領域から抽出された各非帰属特徴量ベクトルが帰属する第2のクラスとを識別するSVMに基づく第1の識別関数を導出する第6のステップと、
    対象画像を構図領域と同一の領域である第2対応領域に分割し、対象特徴量ベクトルとして、各第2対応領域から特徴量ベクトルを抽出する第7のステップと、
    各第2対応領域から抽出された対象特徴量ベクトルを、対応する構図領域について導出された第1の識別関数に適用することにより、対象特徴量ベクトルの識別を行う第8のステップと、
    前記第8のステップにおいて第1のクラスに識別された対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度に基づいて対象画像を前記一の画像群に判別するか否かを決定する判別決定ステップと、
    各構図領域について、構図領域から抽出された各帰属画像の帰属特徴量ベクトルを、非線形な写像であって、当該写像による写像先での内積が元の空間におけるガウシアンカーネル関数の値と一致する当該写像により写像することにより得られる写像ベクトルを、原点側の写像ベクトルであって、予め定められた割合νの写像ベクトルと、それ以外の写像ベクトルとに識別する1クラスSVMに基づく第2の識別関数を導出する第9のステップと、
    各第2対応領域から抽出される対象特徴量ベクトルを前記写像により写像することにより得られる写像ベクトルである対象写像ベクトルに、対応する構図領域について導出された第2の識別関数を適用することにより、各対象写像ベクトルが原点側に識別されるか否かを判定する第10のステップとを実行させ、
    前記判別決定ステップにおいて、
    前記第8のステップにおいて第1のクラスに識別された対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度を積算した値である確信値、又は、
    前記第8のステップにおいて第1のクラスに識別された対象特徴量ベクトルであって、かつ、前記第10のステップにおいて原点側に識別されないと判定された対象写像ベクトルについての対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度を積算した値である確信値が、予め定められた閾値を越えている場合に対象画像を前記一の画像群に判別させることを特徴とする方法。
    ることを特徴とするプログラム。
  11. 所与の基準に基づいて分類された複数の画像群のいずれかの画像群に対象画像を判別するための装置であって、
    前記複数の画像群のうちの一の画像群に含まれる画像である帰属画像のそれぞれを所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する第1特徴量ベクトル抽出手段と、
    前記一の画像群について、前記第1特徴量ベクトル抽出手段により抽出された特徴量ベクトルの分布が近似する基本領域を統合することにより構図領域を特定する構図領域特定手段と、
    各帰属画像の各構図領域から、帰属特徴量ベクトルとして、特徴量ベクトルを抽出する第2特徴量ベクトル抽出手段と、
    各構図領域について、帰属特徴量ベクトルの前記一の画像群における分散度に対して逆相関の関係にある指数として、注目度を導出する注目度導出手段と、
    前記一の画像群以外の画像群に属する画像である非帰属画像のそれぞれを構図領域と同一の領域である第1対応領域に分割し、非帰属特徴量ベクトルとして、各非帰属画像の各第1対応領域から特徴量ベクトルを抽出する第3特徴量ベクトル抽出手段と、
    各構図領域について、構図領域から抽出された各帰属特徴量ベクトルが帰属する第1のクラスと、当該構図領域に対応する第1対応領域から抽出された各非帰属特徴量ベクトルが帰属する第2のクラスとを識別するSVMに基づく第1の識別関数を導出する第1識別関数導出手段と、
    対象画像を構図領域と同一の領域である第2対応領域に分割し、対象特徴量ベクトルとして、各第2対応領域から特徴量ベクトルを抽出する第4特徴量ベクトル抽出手段と、
    各第2対応領域から抽出された対象特徴量ベクトルを、対応する構図領域について導出された第1の識別関数に適用することにより、対象特徴量ベクトルの識別を行う第1クラス識別手段と、
    前記第1クラス識別手段により第1のクラスに識別された対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度に基づいて対象画像を前記一の画像群に判別するか否かを決定する判別決定手段と、
    各構図領域について、構図領域から抽出された各帰属画像の帰属特徴量ベクトルを、非線形な写像であって、当該写像による写像先での内積が元の空間におけるガウシアンカーネル関数の値と一致する当該写像により写像することにより得られる写像ベクトルを、原点側の写像ベクトルであって、予め定められた割合νの写像ベクトルと、それ以外の写像ベクトルとに識別する1クラスSVMに基づく第2の識別関数を導出する第2識別関数導出手段と、
    各第2対応領域から抽出される対象特徴量ベクトルを前記写像により写像することにより得られる写像ベクトルである対象写像ベクトルに、対応する構図領域について導出された第2の識別関数を適用することにより、各対象写像ベクトルが原点側に識別されるか否かを判定する判定手段とを有し、
    前記判別決定手段は、
    前記第1クラス識別手段により第1のクラスに識別された対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度を積算した値である確信値、又は、
    前記第1クラス識別手段により第1のクラスに識別された対象特徴量ベクトルであって、かつ、前記判定手段により原点側に識別されないと判定された対象写像ベクトルについての対象特徴量ベクトルが抽出された第2対応領域に対応する構図領域についての注目度を積算した値である確信値が、予め定められた閾値を越えている場合に対象画像を前記一の画像群に判別することを特徴とする装置。
JP2005246889A 2005-01-13 2005-08-26 判別分析を行う方法、プログラム及び装置 Expired - Fee Related JP4796356B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005246889A JP4796356B2 (ja) 2005-01-13 2005-08-26 判別分析を行う方法、プログラム及び装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005006572 2005-01-13
JP2005006572 2005-01-13
JP2005246889A JP4796356B2 (ja) 2005-01-13 2005-08-26 判別分析を行う方法、プログラム及び装置

Publications (2)

Publication Number Publication Date
JP2006221607A JP2006221607A (ja) 2006-08-24
JP4796356B2 true JP4796356B2 (ja) 2011-10-19

Family

ID=36983883

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005246889A Expired - Fee Related JP4796356B2 (ja) 2005-01-13 2005-08-26 判別分析を行う方法、プログラム及び装置

Country Status (1)

Country Link
JP (1) JP4796356B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100461182C (zh) * 2007-05-24 2009-02-11 北京交通大学 一种基于多视角的交互式视频搜索方法
US8478053B2 (en) 2009-07-15 2013-07-02 Nikon Corporation Image sorting apparatus

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944518A (ja) * 1995-08-02 1997-02-14 Adoin Kenkyusho:Kk 画像データベースの構築方法と、画像データベースの検索方法及び検索装置
US6134344A (en) * 1997-06-26 2000-10-17 Lucent Technologies Inc. Method and apparatus for improving the efficiency of support vector machines
JP4254008B2 (ja) * 2000-04-26 2009-04-15 コニカミノルタビジネステクノロジーズ株式会社 パターン検出装置及び方法
WO2002059828A2 (en) * 2001-01-23 2002-08-01 Biowulf Technologies, Llc Computer-aided image analysis
JP2002259409A (ja) * 2001-03-01 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> 情報抽出方法、情報抽出装置、コンピュータ読取可能な記憶媒体およびコンピュータ・プログラム

Also Published As

Publication number Publication date
JP2006221607A (ja) 2006-08-24

Similar Documents

Publication Publication Date Title
Gunay et al. Automatic age classification with LBP
Lu et al. Estimating sheep pain level using facial action unit detection
Oliver et al. False positive reduction in mammographic mass detection using local binary patterns
Ramachandra et al. Towards making morphing attack detection robust using hybrid scale-space colour texture features
Kao et al. Visual aesthetic quality assessment with a regression model
Kaur et al. Face recognition using principal component analysis
JP6041996B2 (ja) 視覚的属性を修正する装置、システム及び方法
Jiang et al. Saliency in crowd
CN112784742B (zh) 鼻纹特征的提取方法、装置及非易失性存储介质
JP2017102906A (ja) 情報処理装置、情報処理方法及びプログラム
JP2022553779A (ja) キャビン内の環境の調整方法及び装置
Dhanashree et al. Fingernail analysis for early detection and diagnosis of diseases using machine learning techniques
Ngxande et al. Detecting inter-sectional accuracy differences in driver drowsiness detection algorithms
KR101961462B1 (ko) 객체 인식 방법 및 장치
JP4796356B2 (ja) 判別分析を行う方法、プログラム及び装置
Gowda Age estimation by LS-SVM regression on facial images
Rehman et al. Modified texture features from histogram and gray level co-occurence matrix of facial data for ethnicity detection
JP2005250562A (ja) 判別分析を行う方法、類似画像検索方法、及び、そのプログラム、装置
RU2768797C1 (ru) Способ и система для определения синтетически измененных изображений лиц на видео
JP2017084006A (ja) 画像処理装置およびその方法
CN111428553B (zh) 人脸色素斑识别方法、装置、计算机设备和存储介质
Ahmed et al. Age estimation using facial images: A survey of the state-of-the-art
JP6397439B2 (ja) 属性推定装置
Mandalapu et al. Image quality and texture-based features for reliable textured contact lens detection
JP6964296B2 (ja) 領域抽出装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110726

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110729

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees