JP5454356B2 - データ分類装置およびプログラム - Google Patents

データ分類装置およびプログラム Download PDF

Info

Publication number
JP5454356B2
JP5454356B2 JP2010118510A JP2010118510A JP5454356B2 JP 5454356 B2 JP5454356 B2 JP 5454356B2 JP 2010118510 A JP2010118510 A JP 2010118510A JP 2010118510 A JP2010118510 A JP 2010118510A JP 5454356 B2 JP5454356 B2 JP 5454356B2
Authority
JP
Japan
Prior art keywords
group
data
data classification
variance
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010118510A
Other languages
English (en)
Other versions
JP2011248457A (ja
Inventor
司 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP2010118510A priority Critical patent/JP5454356B2/ja
Publication of JP2011248457A publication Critical patent/JP2011248457A/ja
Application granted granted Critical
Publication of JP5454356B2 publication Critical patent/JP5454356B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、データ分類装置およびプログラムに関する。
従来から、複数の変数を有するデータについて、変数間の相互関連を分析することでデータの分類を行う多変量解析の手法として、例えば主成分分析や判別分析が広く知られている。
これらの手法は、多次元の特徴量空間中で射影により新たな特徴量を算出する手法である。主成分分析では、特徴量の分散が大きくなれば各要素が広範囲に散らばってより容易に分類を行えるため、上記の射影軸は全要素の分散が大きくなるように決定される。
一方、判別分析は主成分分析を拡張した考えであって、データを分類した各グループ内の分散値は小さく、かつグループ間の分散値が大きくなるように射影軸を決定する手法である(例えば、特許文献1参照)。
特許第3480563号公報
従来の主成分分析や判別分析の各手法では、固有値方程式から導出される固有ベクトルのうちから固有値の大きな順に主軸が決定される。しかし、本願の発明者は、固有値の大きさに基づいて決定された主軸でデータの分類を行うと、精度よくデータの分類ができる特徴を必ずしも抽出できないことを見いだした。
上記事情に鑑み、データを精度よく分類できる特徴がより容易に抽出される手段を提供する。
データ分類装置の一態様は、第1ベクトル演算部と、第2ベクトル演算部と、データ分類部とを備える。第1ベクトル演算部は、p個の成分を含む分類対象データから、それぞれq個(q≦p)の変換ベクトル候補を求める。第2ベクトル演算部は、q個の変換ベクトル候補のうちから、r個(r<q)の変換ベクトルを求める。データ分類部は、変換ベクトルを用いて、複数種類の分類対象データを、注目すべき分類対象データを抽出する第1グループと、第1グループと異なる第2グループとに分類する。そして、第2ベクトル演算部は、第1グループに属する分類対象データを用いて変換ベクトル候補の第1分散値をそれぞれ求めるとともに、第2グループに属する分類対象データを用いて変換ベクトル候補の第2分散値をそれぞれ求める。また、第2ベクトル演算部は、第1分散値に対する第2分散値の比(第2分散値/第1分散値)が大きい順に変換ベクトル候補のうちから変換ベクトルを求める。
なお、一の態様のデータ分類装置を含む撮像装置、コンピュータを一の態様のデータ分類装置として動作させるプログラム、上記のプログラムを記憶した記憶媒体、一の態様に係るデータ分類装置の動作を方法のカテゴリで表現したものは、いずれも本発明の具体的態様として有効である。
データ分類装置の一態様では、注目すべき分類対象データを抽出する第1グループから第1分散値を求め、第1グループと異なる第2グループから第2分散値を求める。そして、データ分類装置の一態様では、第1分散値に対する第2分散値の比が大きくなる順に変換ベクトルを求めることで、データを精度よく分類できる特徴をより容易に抽出できる。
一の実施形態でのデータ分類装置の構成例を示すブロック図 主成分分析の手法の概念図 判別分析でのクラス分布の概念図 判別分析でのベクトルの関係を示す図 一の実施形態のデータ分類処理におけるW軸上での要素の分布例を示す図 一の実施形態での学習処理の例を示す流れ図 一の実施形態での学習処理の例を示す流れ図 各実施例および比較例について、グループAおよびBでの画像分類の正解率を示す図
<一の実施形態での装置構成例>
図1は、一の実施形態でのデータ分類装置の構成例を示すブロック図である。一の実施形態では、撮像装置で撮像されたカラー画像のデータをデータ分類装置での分類対象とする例を説明する。
また、一の実施形態でのデータ分類装置は、データ分類プログラムがインストールされたパーソナルコンピュータで構成される。
図1に示すコンピュータ11は、データ読込部12、記憶装置13、CPU14、メモリ15および入出力I/F16、バス17を有している。データ読込部12、記憶装置13、CPU14、メモリ15および入出力I/F16は、バス17を介して相互に接続されている。さらに、コンピュータ11には、入出力I/F16を介して、入力デバイス18(キーボード、ポインティングデバイスなど)とモニタ19とがそれぞれ接続されている。なお、入出力I/F16は、入力デバイス18からの各種入力を受け付けるとともに、モニタ19に対して表示用のデータを出力する。
データ読込部12は、上記の分類対象データ(画像データ)や、上記のデータ分類プログラムを外部から読み込むときに用いられる。例えば、データ読込部12は、着脱可能な記憶媒体からデータを取得する読込デバイス(光ディスク、磁気ディスク、光磁気ディスクの読込装置など)や、公知の通信規格に準拠して外部の装置と通信を行う通信デバイス(USBインターフェース、LANモジュール、無線LANモジュールなど)で構成される。
記憶装置13は、例えば、ハードディスクや、不揮発性の半導体メモリなどの記憶媒体で構成される。この記憶装置13には、データ分類プログラムや、プログラムの実行に必要となる各種のデータが記録されている。なお、記憶装置13には、データ読込部12から読み込んだ分類対象データを記憶しておくこともできる。
CPU14は、コンピュータ11の各部を統括的に制御するプロセッサである。このCPU14は、上記のデータ分類プログラムの実行によって、第1ベクトル演算部21、第2ベクトル演算部22、データ分類部23、パラメータ決定部24、画像処理部25としてそれぞれ機能する(第1ベクトル演算部21、第2ベクトル演算部22、データ分類部23、パラメータ決定部24、画像処理部25の各動作は後述する)。
メモリ15は、データ分類プログラムでの各種演算結果を一時的に記憶する。このメモリ15は、例えば揮発性のSDRAMなどで構成される。
<データ分類処理の概念説明>
次に、一の実施形態でのデータ分類処理を説明する。なお、本明細書では、理解の便宜のため、従来技術である主成分分析および判別分析の概略を最初に説明し、その後に一の実施形態でのデータ分類処理の手法を詳細に説明する。
(主成分分析の概略説明)
図2は、主成分分析の手法の概念を示す図である。例えば、注目する1つの要素(分類対象データ)が、n次元の特徴量ベクトルを用いてn次元の特徴量空間中の1点で表現されているとする。また、上記の特徴量空間中にはN個の要素が存在し、かつ各要素がグループAか、グループA以外のグループBに属している場合を考える。
主成分分析は、各要素を表現するときにnより小さい数の特徴量で、各要素を分離する最適な特徴量を求める手法であり、特徴量空間で分散値が最大となる射影軸Wを求める。この分散値が最大となるW軸上では、各要素から得られる特徴量が最も重ならずに分布するため、より少ない次元数で各要素を表現できることが分かる。
Figure 0005454356
したがって、上記の式(1)は、下式(3)で表現できる。
Figure 0005454356
なお、上記の各式において、ベクトルはn×1の行列で表現し、添字のTは行列の転置を意味している。また、式(3)のStotは、下式(4)で表わされるn×nの対称行列であって、分散共分散行列と称される。
Figure 0005454356
上記の式(3),式(4)によれば、分散共分散行列を単位射影ベクトルで挟むと、注目する射影軸での分散値が得られることが分かる。
そして、主成分分析の演算では、上記の式(3)で定義される分散が最大となる単位射影ベクトルを求めればよい。
Figure 0005454356
(判別分析の概略説明)
図3は、判別分析でのクラス分布の概念図である。判別分析では、N個の要素がk個のクラスに分類されるとともに、各要素がいずれかのクラスに属していることを前提とする。なお、以下の説明では、それぞれのクラスをCkと表記する。
Figure 0005454356
式(6)−(8)の関係を用いると、上記の式(4)で定義された系全体の分散共分散行列を下式(9)のように書き換えることができる。
Figure 0005454356
ただし、上記の式(9)の導出において、
Figure 0005454356
を導入した。
上記の式(4)と同様に考えると、クラスCjでのクラス内分散共分散行列は、Cjのみの要素を用いて下式(11)で定義できる。また、各クラスの平均ベクトルの分散は下式(12)で定義できる。
Figure 0005454356
よって、式(11),(12)から、上記の式(9)は下式(13)で表現できることが分かる。
Figure 0005454356
上記の式(13)は、式(4)で定義された系全体の分散共分散行列が、各クラスのクラス内分散共分散行列と、クラス間の分散共分散行列とに分離可能であることを示している。また、上記の式(3),(13)から、各グループの分散共分散行列をそれぞれ単位射影ベクトルで挟むと、射影軸(w軸)における各グループの分散値が得られることが分かる。
判別分析の手法では、クラス内分散の総和を小さくする一方で、クラス間分散を大きくする条件を満たす単位射影ベクトルを求める。
(一の実施形態でのデータ分類処理)
本願の発明者は、複数の分類対象データのうちから注目するものとそれ以外のものとを分類する場合において、以下の問題点を見いだした。
例えば、複数の分類対象データ(要素)のうちから、注目すべき要素(注目要素)とそれ以外の要素(非注目要素)とを2つのグループに分類する場合を考える。このとき、注目要素を分類するグループを第1グループ(グループAとも称する)とし、非注目要素を分類するグループを第2グループ(グループBとも称する)とする。
従来の手法では、第1グループと第2グループとのそれぞれが共に小さい分布となるような固有値方程式を立てる。そして、従来の手法では、その固有値方程式の固有値の大きい順に単位射影ベクトルを主軸として抽出し、この主軸を用いて各要素を分類している。この場合、クラス間分散が十分大きくないと、グループAとグループBとの分布の重なりが急激に大きくなるので、グループAとグループBとの分離の正解率は非常に悪くなる。また、非注目グループに様々な異なる種類の要素があるときには、本来注目すべきグループAの分散が大きい軸がグループBの影響によって抽出される場合がある。すなわち、上記の手法によれば、第1グループの要素を分類するときに、非注目要素にも共通する特徴を反映する主軸が優先的に抽出されてしまうおそれがあった。
本願の発明者は、上記の問題点に着眼し、第1グループでの要素の分散値(第1分散値)に対する第2グループでの要素の分散値(第2分散値)の比(第2分散値/第1分散値)が大きいほど、注目要素の特徴をよく反映した主軸が抽出できることを見いだした。すなわち、第1分散値が小さければ、主軸上で第1グループの要素がまとまった状態となり、注目要素に共通する特徴を絞り込める可能性が高くなる。また、第1分散値に対して第2分散値が十分に大きくなれば、主軸上で第2グループの要素が大きく分散し、第1グループの要素を正しく抽出できる可能性が向上する。なお、一の実施形態のデータ分類処理におけるW軸上での要素の分布例を図5に模式的に示す。
一例として、一の実施形態でのデータ分類処理では、以下の式(14)−(16)で定義される固有値λの極大値を求める場合を考える。なお、本明細書において、「σ」はグループA内での要素の分散値(第1分散値)を示し、「σ」はグループB内での要素の分散値(第2分散値)を示し、「σAB」はグループA,Bのグループ間分散値を示す。
Figure 0005454356
このとき、一の実施形態でのデータ分類処理で解くべき問題は、以下の式(17)に示す固有値問題に帰着する。なお、式(17)の添字lは序数を示す変数である。
Figure 0005454356
ただし、式(14)のケースでは、式(17)の分散共分散行列Sは以下の式(18)で得られる。式(15)のケースでは、式(17)の分散共分散行列Sは以下の式(19)で得られる。式(16)のケースでは、式(17)の分散共分散行列Sは以下の式(20)で得られる。
Figure 0005454356
また、本明細書において、「SA」は、グループAの要素で算出される分散共分散行列(n×nの対称行列)であり、「SB」は、グループBの要素で算出される分散共分散行列(n×nの対称行列)である。
Figure 0005454356
一般に、n次元の行列Sで定義された固有値方程式(式(17))を解くと、n個の固有ベクトルが得られる。そして、一の実施形態でのデータ分類処理では、下式(22)で各固有ベクトルの評価値βをそれぞれ求め、この評価値βの大きい順に主軸を選択すればよい。
Figure 0005454356
なお、上記のデータ分類処理での射影演算は、単純な線形演算であるため、比較的少ない負荷でコンピュータに実行させることができる。
<一の実施形態でのデータ分類装置の動作例>
以下、図1に示すデータ分類装置の動作例を説明する。図1のデータ分類装置は、教師付き学習によってデータ分類処理で用いる変換ベクトルを予め決定するとともに、教師付き学習で求めた変換ベクトルを用いてデータ分類処理を実行する。また、一の実施形態では、データ分類処理の一例として、撮像装置で撮像された画像を、第1グループおよび第2グループに分類する場合を説明する。
(学習処理の一例)
まず、図6の流れ図を参照しつつ、一の実施形態での学習処理の例を説明する。ここで、図6の流れ図の処理は、プログラムの実行指示に応じてCPU14が実行する。なお、以下に示す学習処理は、データ分類装置(またはプログラム)の製造者が予め製造工程で実行してもよく、あるいはデータ分類装置を購入したユーザが実行するものであってもよい。
ステップS101:CPU14は、複数の教師画像データをデータ読込部12から読み込んで取得する。
ここで、各々の教師画像データは、上記の分類対象データと同様のカラー画像(RGBのベイヤ画像)のデータであって、評価者によってシーン別(例えば、「ポートレート」、「夜景」、「風景・造形(構造物など)」などのシーン)に予め分類されている。また、各画像に相応するシーンを示す正解データは、各々の教師画像データに対応付けされている。なお、S101で取得された教師画像データおよび正解データは、CPU14の制御によって、記憶装置13またはメモリ15に記録される。
ステップS102:CPU14は、各々の教師画像について画像の特徴量を取得する。例えば、一の実施形態では、各々の教師画像につき、CPU14が以下の(a)−(e)の処理を行うことで特徴量を求めればよい。
(a)CPU14は、教師画像のRGB面の3画像をそれぞれ同じサイズで生成する。例えば、CPU14は、画像のR画素を用いてR面の画像を生成するとともに、画像のB画素を用いてB面の画像を生成する。また、CPU14は、画像内の近接するGr画素およびGb画素を平均化し、教師画像に対応するG面の画像を生成する。
(b)CPU14は、B面とG面との間で対応する画素の差分をとる(B−G)ことで、Cb面の画像を擬似的に生成する。CPU14は、同様に、R面とG面との間で対応する画素の差分をとる(R−G)ことで、Cr面の画像を擬似的に生成する。これにより、CPU14は、教師画像に対応するG面、Cb面、Cr面の画像を取得する。なお、Cb面、Cr面の生成時に、撮影時のホワイトバランス情報は用いないものとする。
(c)CPU14は、G面、Cb面、Cr面の各画像につき、各画素で縦方向および横方向の差分をとる。これにより、CPU14は、G面のエッジ画像、Cb面のエッジ画像、Cr面のエッジ画像をそれぞれ生成する。
(d)CPU14は、上記(b),(c)の処理で取得した6画像(G面の画像、Cb面の画像、Cr面の画像、G面のエッジ画像、Cb面のエッジ画像、Cr面のエッジ画像)につき、それぞれ画像内を10×10の100領域に分割し、各分割領域でそれぞれ平均画素値を求める。そして、CPU14は、各分割領域での平均画素値を特徴量成分の1つとして取得する。これにより、1画像につき100個の特徴量成分が生成される。
(e)CPU14は、上記(b),(c)の処理で取得した6画像につき、特徴量成分として、撮影時のAF領域での画素平均値と、面全体での画素平均値とをそれぞれ求める。なお、上記(d),(e)で求まる特徴量成分は、1画像につき102個となる。
ステップS103:CPU14は、正解データを参照して、全ての教師画像のデータを、グループAとグループBとに分類する。例えば、注目する特性を「ポートレート」とした場合、CPU14は、正解データを参照して、「ポートレート」の教師画像データ(要素)をグループAに属させるとともに、残りの教師画像データ(要素)をグループBに属させる。
ステップS104:第1ベクトル演算部21は、グループAの要素から算出される分散共分散行列SAと、グループBの要素から算出される分散共分散行列SBとをそれぞれ求める。
ここで、特徴量成分の数がp個であれば、各要素での特徴量成分のベクトルはp×1の行列で表現され、各々の分散共分散行列はp×pの対称行列で表現される。例えば、ある教師画像でのG面画像での特徴量成分のベクトルは102×1の行列で表現される。
ステップS105:第1ベクトル演算部21は、分散共分散行列SAの逆行列と、分散共分散行列SBと、単位射影ベクトルとを用いた行列の固有値方程式(式(14)−(20))を解く。上記のように分散共分散行列はp×pの対称行列である。ここでの固有値問題は、解に重複がある場合には重複分だけ解の数が少なくなるため、q個の固有値と、各固有値に対応したq個の異なる単位射影ベクトル(変換ベクトル候補)とをもつ(ただしq≦p)。
なお、一の実施形態において、S105での第1ベクトル演算部21は、各面(6面)でそれぞれ独立してq個(最大102個)の変換ベクトル候補を求めるものとする。
ステップS106:第2ベクトル演算部22は、q個の変換ベクトル候補のうちから、データ分類処理に用いるr個(r<q)の変換ベクトルを求める。このとき、第2ベクトル演算部22は、各々の変換ベクトル候補について、上記の式(22)により、第2分散値/第1分散値の比となる評価値βをそれぞれ求める。そして、第2ベクトル演算部22は、この評価値βの大きい順にr個の変換ベクトルを決定すればよい。
なお、一の実施形態において、S106での第2ベクトル演算部22は、各面でそれぞれ求めた全ての変換ベクトル候補のうちから、評価値βの上位6つを変換ベクトルとして抽出するものとする。
(データ分類処理の一例)
次に、図7の流れ図を参照しつつ、一の実施形態でのデータ分類処理の例を説明する。なお、図7の流れ図の処理は、プログラムの実行指示に応じてCPU14が実行する。
ステップS201:CPU14は、分類対象データ(画像データ)をデータ読込部12から読み込んで取得する。ここで、S201で取得される分類対象データとしての画像は、上記の教師画像とは異なり、データ分類装置にとってシーンが未知の画像である。なお、上記の分類対象データは、CPU14の制御によって、記憶装置13またはメモリ15に記録される。
ステップS202:CPU14は、分類対象データの画像の特徴量を取得する。なお、S202での処理は、上記のS102の処理と同一であるので重複説明を省略する。
ステップS203:第1ベクトル演算部21は、上記の学習処理で決定された変換ベクトルの成分をそれぞれ求める。
ステップS204:データ分類部23は、変換ベクトル(S203)に基づいて、分類対象データを特徴量空間に射影する。そして、データ分類部23は、特徴量空間に射影された分類対象データの値と、特徴量空間でのグループAの中心値との距離に応じて、分類対象データがグループAに属するか否かを判定する。
例えば、変換ベクトルの各成分(i軸)でのグループAの平均値、偏差値をそれぞれ「ci,σi」とし、分類対象データのi軸への射影成分を「xi」としたとき、データ分類部23は、下式(23)の演算を行い、グループAの要素との判別パラメータγを求める。そして、データ分類部23は、判別パラメータγの値が1以下であれば、分類対象データがグループAに属すると判定する。
Figure 0005454356
上記の式(23)において「all.com」は変換ベクトルの全成分を示している。また、上記の式(23)において「α」は、i軸に射影された値がグループAの平均値から離れているかどうかを判断するパラメータである。
ステップS205:CPU14は、S204での判定結果に基づいて各種の処理を実行する。
一例として、S205でのCPU14は、S204での判定結果(分類対象データがグループAに属するか否か)をモニタ19に表示してもよい。また、CPU14は、分類対象データがグループAに属する場合には、画像のシーンを示す情報を付帯情報として分類対象データに対応づけて記録してもよい。
また、S205でのCPU14は、複数の分類対象データについて、それぞれS202からS204の処理をそれぞれ実行し、複数の分類対象データのうちからグループAに属する画像のみを抽出してもよい。
また、S205でのパラメータ決定部24は、S204の判定結果に応じて、所定のグループの画像データに施す画像処理を変更してもよい。
一例として、S205において、グループAの画像として「ポートレート」の画像を抽出する場合、パラメータ決定部24は、グループAに属する画像の画像処理のパラメータを以下のように決定する。まず、パラメータ決定部24は、階調変換処理のパラメータとして、デフォルトの階調曲線よりも相対的にコントラストが低めになる軟調の階調曲線を選択する。また、パラメータ決定部24は、色変換処理のパラメータとして、肌色の彩度を向上させる色変換マトリクスを選択する。
そして、画像処理部25は、上記の各パラメータを用いて、グループAに属する画像のデータに画像処理を施す。これにより、データ分類装置は、ポートレートと判定された画像について、顔の柔らかさの表現が強調されるとともに、人物の肌色のくすみなどが軽減されるレタッチ処理を行うことができる。
なお、上記の画像処理は一例にすぎず、パラメータ決定部24は、ポートレートの画像に対する画像処理のパラメータとして、他のパラメータを変更してもよい。勿論、パラメータ決定部24は、グループAの画像として「ポートレート」以外の画像が抽出される場合には、グループAのシーンに相応する画像処理のパラメータを選択することはいうまでもない。以上で図7の流れ図の説明を終了する。
上記実施形態のデータ分類装置は、教師付き学習により、第1分散値に対する第2分散値の比が大きくなる順に変換ベクトルを求める(S106)。そして、データ分類装置は、上記の変換ベクトルを用いてデータの分類を行う(S204)。上記の変換ベクトルは、注目要素のみに共通する特徴をよく反映したものであるので、データ分類装置は、注目要素と非注目要素とを比較的高い精度で分類することが可能となる。
<実施例>
以下、上記実施形態のデータ分類装置によるデータ分類処理の実施例を説明する。この実施例1−3では、予めシーンが評価されている複数のサンプル画像(YCbCr色空間)を用いて、上記実施形態の学習処理およびデータ分類処理で画像の分類を行った。なお、比較例として、従来の判別分析の手法で得た変換ベクトルでも画像の分類を行った。
ここで、実施例1では、上記の式(16)の固有値方程式により変換ベクトル候補を求めている。実施例2では、上記の式(14)の固有値方程式により変換ベクトル候補を求めている。実施例3では、上記の式(15)の固有値方程式により変換ベクトル候補を求めている。
また、上記のサンプル画像の内訳は、注目すべき風景画像が350枚であり、それ以外の画像が4500枚である。各実施例および比較例では、上記のS102の処理とほぼ同様の手法で、各サンプル画像から6面分の画像(Y面の画像、Cb面の画像、Cr面の画像、Y面のエッジ画像、Cb面のエッジ画像、Cr面のエッジ画像)を生成した。そして、上記の各面からそれぞれ102個の特徴量成分を求めた。
また、各実施例では、上記のS106の処理と同様の手法で、全ての変換ベクトル候補のうちから、評価値βの上位6つを変換ベクトルとして抽出している。一方、比較例では、各面で固有値の大きい上位3個の変換ベクトルを用いて、18個の主成分で判別を行っている。なお、各実施例および比較例では、グループAの正解率を正規化するために、データ分類の判定式である式(23)の「α」の値を個別に調整した(比較例:α=7.0、実施例1:α=7.5、実施例2:α=9.0、実施例3:α=6.0)。
また、各実施例および比較例では、上記のサンプル画像を用いた30回の交差妥当化(30-fold cross validation)をそれぞれ実行した。すなわち、各実施例および比較例では、サンプル画像から95%の画像を教師画像としてランダムに抽出した。そして、この教師画像を用いて上記実施形態の手法で変換ベクトルを決定するとともに、残りの5%のサンプル画像を用いて分類の正解率を求めた。以上の処理を30回繰り返して正解率の平均を求めた。
図8は、各実施例および比較例について、グループAおよびBでの画像分類の正解率を示している。各実施例および比較例は、グループAの正解率がほぼ同程度になるように上記αを設定している。その結果、各実施例は、グループAおよびBでの正解率にさほど大きな違いはないことが確認できる。一方、比較例ではグループAの正解率に対してグループBの正解率が約半分と大きく低下しているが、本手法ではグループAの正解率に対するグループBの正解率があまり低下していないことが分かる。これにより、一の実施形態の手法では、グループAの要素のみに共通する特徴が反映された射影ベクトルを選択して分類が行われていることが分かる。
<実施形態の補足事項>
(1)上記実施形態では、データ分類装置が行列による線形変換によって、複数の要素のうちから注目する要素を分類する例を説明した。しかし、本発明のデータ分類装置は、公知の非線形変換の手法を用いて、複数の要素のうちから注目する要素を分類するものであってもよい。
(2)上記実施形態では、第2ベクトル演算部22が導出した変換ベクトルをそのまま用いてデータを分類する例を説明した。しかし、本発明では、学習処理で得た変換ベクトルを例えばサポートベクターマシン(SVM)に入力して、要素の判別モデルを構築するようにしてもよい。
(3)上記実施形態では、第1ベクトル演算部21、第2ベクトル演算部22、データ分類部23、画像処理部24の各処理をソフトウエア的に実現する例を説明したが、ASICによってこれらの各処理をハードウエア的に実現しても勿論かまわない。
(4)本発明のデータ分類装置は、電子カメラ、イメージスキャナを含む撮像装置に実装されるものであってもよい(なお、撮像装置の構成の図示は省略する)。この場合、データ分類装置は、撮像部から分類対象となる画像のデータを取得し、製造工程等で行われた学習処理によって取得した変換ベクトルを用いて、画像のデータを分類すればよい。なお、電子カメラに実装されたデータ分類装置では、シーン判別の結果に基づいて、パラメータ決定部が、撮影条件のパラメータ(絞り値、露光期間、撮像感度など)や、画像処理のパラメータ(階調特性、ホワイトバランス、色変換マトリクスなど)を設定することも可能である。
(5)上記実施形態では、分類対象の画像自体から特徴量成分を得る例を説明した。しかし、本発明では、撮像装置の各種センサが画像撮影時に取得した撮影情報(各AFエリアの測距情報など)を特徴量成分としてもよい。
(6)上記実施形態でのデータ分類装置は、分類対象となる画像のシーン分類を行う例を説明したが、本発明における分類対象は上記実施形態の例に限定されるものではない。
例えば、本発明のデータ分類装置は、多様な人物の顔を撮影した画像を教師データとし、特定の表情(笑顔や目を閉じた顔)の画像を抽出する用途に応用することもできる。または、本発明のデータ分類装置は、顕微鏡観察で同一種類の培養細胞を撮像した画像を教師データとし、特定状態の培養細胞(例えば分化誘導された細胞)の画像を抽出する用途に応用することもできる。
さらに、本発明のデータ分類装置は、画像の分類を行う構成に限定されず、多次元の特徴量成分を有する統計データの分類に広く応用できる。
以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲が、その精神および権利範囲を逸脱しない範囲で前述のような実施形態の特徴点および利点にまで及ぶことを意図するものである。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずであり、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物によることも可能である。
11…コンピュータ、12…データ読込部、13…記憶装置、14…CPU、15…メモリ、16…入出力I/F、17…バス、18…入力デバイス、19…モニタ、21…第1ベクトル演算部、22…第2ベクトル演算部、23…データ分類部、24…パラメータ決定部、25…画像処理部

Claims (8)

  1. p個の成分を含む分類対象データから、それぞれq個(q≦p)の変換ベクトル候補を求める第1ベクトル演算部と、
    q個の前記変換ベクトル候補のうちから、r個(r<q)の変換ベクトルを求める第2ベクトル演算部と、
    前記変換ベクトルを用いて、複数種類の分類対象データを、注目すべき分類対象データを抽出する第1グループと、前記第1グループと異なる第2グループとに分類するデータ分類部と、を備え、
    前記第2ベクトル演算部は、前記第1グループに属する分類対象データを用いて前記変換ベクトル候補の第1分散値をそれぞれ求めるとともに、前記第2グループに属する分類対象データを用いて前記変換ベクトル候補の第2分散値をそれぞれ求め、前記第1分散値に対する前記第2分散値の比が大きい順に前記変換ベクトル候補のうちから前記変換ベクトルを求めるデータ分類装置。
  2. 請求項1に記載のデータ分類装置において、
    前記第1ベクトル演算部は、固有値方程式に基づいて前記変換ベクトル候補を求めるデータ分類装置。
  3. 請求項2に記載のデータ分類装置において、
    前記第1ベクトル演算部は、下式で固有値λが定義される固有値方程式に基づいて前記変換ベクトル候補を求めるデータ分類装置。
    Figure 0005454356
    但し、σは前記第1分散値を示し、σは前記第2分散値を示し、σABは前記第1グループと前記第2グループとのグループ間分散を示す。
  4. 請求項2に記載のデータ分類装置において、
    前記第1ベクトル演算部は、下式で固有値λが定義される固有値方程式に基づいて前記変換ベクトル候補を求めるデータ分類装置。
    Figure 0005454356
    但し、σは前記第1分散値を示し、σは前記第2分散値を示し、σABは前記第1グループと前記第2グループとのグループ間分散を示す。
  5. 請求項2に記載のデータ分類装置において、
    前記第1ベクトル演算部は、下式で固有値λが定義される固有値方程式に基づいて前記変換ベクトル候補を求めるデータ分類装置。
    Figure 0005454356
    但し、σは前記第1分散値を示し、σは前記第2分散値を示し、σABは前記第1グループと前記第2グループとのグループ間分散を示す。
  6. 請求項1から請求項5のいずれか1項に記載のデータ分類装置において、
    前記分類対象データが画像データであるデータ分類装置。
  7. 請求項6に記載のデータ分類装置において、
    前記データ分類部による分類結果に応じて、入力される画像に対する画像処理のパラメータを決定するパラメータ決定部をさらに備えるデータ分類装置。
  8. コンピュータを、請求項1から請求項7のいずれか1項に記載のデータ分類装置として機能させるプログラム。
JP2010118510A 2010-05-24 2010-05-24 データ分類装置およびプログラム Expired - Fee Related JP5454356B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010118510A JP5454356B2 (ja) 2010-05-24 2010-05-24 データ分類装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010118510A JP5454356B2 (ja) 2010-05-24 2010-05-24 データ分類装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2011248457A JP2011248457A (ja) 2011-12-08
JP5454356B2 true JP5454356B2 (ja) 2014-03-26

Family

ID=45413675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010118510A Expired - Fee Related JP5454356B2 (ja) 2010-05-24 2010-05-24 データ分類装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5454356B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015089590A (ja) 2013-11-05 2015-05-11 ファナック株式会社 バラ積みされた物品をロボットで取出す装置及び方法

Also Published As

Publication number Publication date
JP2011248457A (ja) 2011-12-08

Similar Documents

Publication Publication Date Title
JP7130368B2 (ja) 情報処理装置および情報処理システム
Li et al. Visual tracking via incremental log-euclidean riemannian subspace learning
JP6270182B2 (ja) 属性要因分析方法、装置、およびプログラム
US9053388B2 (en) Image processing apparatus and method, and computer-readable storage medium
JP4321350B2 (ja) パラメタ推定方法、パラメタ推定装置および照合方法
JP5418991B2 (ja) 個人認証システム、個人認証方法
US9245206B2 (en) Image processing apparatus and image processing method
KR20130071341A (ko) 안면 특징 벡터 구성
Chen et al. Face age estimation using model selection
Rajput et al. A robust face super-resolution algorithm and its application in low-resolution face recognition system
Li et al. Hallucinating faces from thermal infrared images
JP2011141866A (ja) データ分類装置、データ分類システムおよびプログラム
US8655084B2 (en) Hand-based gender classification
JP6202938B2 (ja) 画像認識装置および画像認識方法
JP5454356B2 (ja) データ分類装置およびプログラム
JP5791361B2 (ja) パターン識別装置、パターン識別方法およびプログラム
JP2016058018A (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
Ouanan et al. A novel face recognition system based on Gabor and Zernike features
JP2014199519A (ja) 物体識別装置、物体識別方法及びプログラム
JP2012234497A (ja) オブジェクト識別装置、オブジェクト識別方法、及びプログラム
JP4099981B2 (ja) 画像認識システム、画像認識方法および画像認識プログラム
JP2005266981A (ja) 人種推定装置
CN110781802B (zh) 一种基于信息论流形的人脸图像识别方法
Almaddah et al. Face relighting using discriminative 2D spherical spaces for face recognition
JP2017207960A (ja) 画像解析装置、画像解析方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131223

R150 Certificate of patent or registration of utility model

Ref document number: 5454356

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees