WO2010087124A1

WO2010087124A1 - 特徴量選択装置

Info

Publication number: WO2010087124A1
Application number: PCT/JP2010/000246
Authority: WO
Inventors: 岩元浩太; 大網亮磨
Original assignee: 日本電気株式会社
Priority date: 2009-01-29
Filing date: 2010-01-19
Publication date: 2010-08-05
Also published as: EP2333718B1; CN102301395A; US8620087B2; KR20110103423A; EP2333718A1; US20110135203A1; JP4766197B2; JPWO2010087124A1; EP2333718A4; KR101404401B1; CN102301395B

Abstract

　この特徴量選択装置は、複数の元画像と、この複数の元画像に対して改変処理を施した複数の改変画像と、の各々の画像からM種類の特徴量を抽出する特徴量抽出手段と、元画像とその改変画像どうしおよび同一の元画像の改変画像どうしは同一の画像、それら以外の画像どうしは異なる画像として扱って、異なる画像を識別できる度合いである識別能力と、画像への改変処理によって特徴量の値が変化しない度合いである頑健性とを評価基準として、上記各々の画像から抽出された上記Ｍ種類の特徴量を評価し、上記Ｍ種類の特徴量からＭより少ないＮ種類の特徴量の集合を、画像を識別するための特徴量として選択する特徴量選択手段とを備えている。

Description

特徴量選択装置

　本発明は、特徴量を選択する装置に関し、特に多数の種類の特徴量から、画像を識別する（画像の同一性を判定する）ための画像識別子に適した複数の特徴量を選択する装置に関する。

　画像識別子は、画像を識別する（同一性を判定する）ための画像特徴量である。ある画像から抽出した画像識別子と、別の画像から抽出した画像識別子とを比較し、その比較結果から、２つの画像が同一である度合いを示す同一性尺度（一般的には、類似度または距離という）を算出することができる。また、算出した同一性尺度をある閾値と比較することにより、２つの画像が同一であるか否かを判定することができる。ここで「２つの画像が同一」とは、画像信号（画像を構成する画素の画素値）のレベルで２つの画像が同一である場合だけに限らず、画像の圧縮形式（フォーマット）の変換、画像のサイズ・アスペクト比の変換、画像の色調の調整、画像への各種フィルタ処理（鮮鋭化、平滑化など）、画像への局所的な加工（テロップ重畳、切抜きなど）、画像の再キャプチャリング、などの各種改変処理によって、一方の画像が他方の画像の複製された画像である場合も含む。画像識別子を用いれば、例えば、画像、または画像の集合体である動画像の複製を検知できるため、画像または動画像の違法コピー検知システムなどに応用することができる。

　画像識別子は、一般的に、複数の特徴量の集合から成る。集合に含まれる個々の特徴量を１つの次元とすると、画像識別子は複数次元の特徴ベクトルである。特に、特徴量としては離散値である量子化インデックス（量子化した値）が用いられることが多い。画像識別子の例が、非特許文献１、非特許文献２、および特許文献１に記載されている。これらの文献に記載の方法では、画像の複数の局所領域ごとに特徴量を抽出し、抽出した特徴量を量子化して量子化インデックスを算出し、算出した局所領域ごとの量子化インデックスを量子化インデックスベクトルとして、画像識別子としている。

　具体的には、非特許文献１、非特許文献２では、画像をブロックに分割し、各々のブロックを局所領域として特徴量（量子化インデックス）を抽出している。また非特許文献１では、ブロック内の輝度分布のパターンを１１種類に分類したものを量子化インデックスとしている。非特許文献２では（非特許文献２の“Ｌｏｃａｌ　Ｅｄｇｅ　Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ”として記載されている技術）、ブロック内から抽出されるエッジ点の重心位置を量子化したものを量子化インデックスとしている。

　他方、特許文献１に記載の方法では、図５に示すように、画像２４０内のあらかじめ定められた位置の３２個の長方形領域２４４（図５ではそのうち１６個の長方形領域が描かれている）からそれぞれ平均輝度値を算出し、対となる長方形領域の間（図５では対となる長方形領域を点線２４８で結んでいる）で平均輝度値の差を算出し、１６次元の差ベクトル２５０を求める。差ベクトル２５０に対してベクトル変換により合成ベクトルを生成し、合成ベクトルの各次元を量子化して得られた１６次元の量子化インデックスベクトルを画像識別子とする。

　このような、複数の特徴量の集合から成る画像識別子を設計する場合、各々の特徴量として、どのような特徴量を用いるか（どのような特徴量抽出のパラメータを用いるか）を選択することは、画像識別子の性能（画像の同一性を判定できる精度）を決めるため、重要である。複数の特徴量の集合から成る画像識別子において、特徴量を適切に選択することによって、画像識別子の性能（画像の同一性を判定できる精度）を向上させることができる。

　すなわち、複数の特徴量の集合から成る画像識別子に適した（性能を最適化する）特徴量（画像の同一性の判定精度が高くなるような特徴量）を選択することが重要である。

　上記の非特許文献１、非特許文献２、および特許文献１に記載されている画像識別子は、各々の特徴量が、特徴量ごとに定められた（相互に異なる）局所領域から抽出される。従って、これらの文献の例では、どのような局所領域から特徴量を抽出するか（各々の特徴量として、どのような局所領域を定めるか）を選択することが、画像識別子の性能を左右することになる。

　複数の特徴量の集合から成る画像識別子を設計する場合、一般的に、その特徴量（特徴量抽出のパラメータ）の決定（選択）は、経験的な知見や、試行錯誤の実験によって行われることが多かった。例えば非特許文献１や非特許文献２では、各々の特徴量の局所領域は、画像を規則正しく分割したブロックとしている。例えば非特許文献１では、画像を８×８＝６４のブロックに規則正しく分割し、その各々のブロックを局所領域として、特徴量を抽出している。しかしながら、これらの経験的な知見や、試行錯誤では、画像識別子の性能（画像の同一性判定の精度）を最適化するのは困難である。

　一方で、性能を最適化するように、特徴量を自動的に選択する技術は（特徴量選択技術と呼ぶ）、パターン認識の分野で用いられている。具体的には、主成分分析（PCA：　Principal　Component　Analysis）や、線形判別法（LDA:　Linear Discriminant Analysis）を用いる方法がある。

特表平８－５００４７１号公報

Ｋｏｔａ　Ｉｗａｍｏｔｏ、Ｅｉｊｉ　Ｋａｓｕｔａｎｉ、Ａｋｉｏ　Ｙａｍａｄａ、"Ｉｍａｇｅ　Ｓｉｇｎａｔｕｒｅ　Ｒｏｂｕｓｔ　ｔｏ　Ｃａｐｔｉｏｎ　Ｓｕｐｅｒｉｍｐｏｓｉｔｉｏｎ　ｆｏｒ　Ｖｉｄｅｏ　Ｓｅｑｕｅｎｃｅ　Ｉｄｅｎｔｉｆｉｃａｔｉｏｎ"、Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｉｍａｇｅ　Ｐｒｏｃｅｓｓｉｎｇ　（ＩＣＩＰ２００６）、２００６．Ａｒｕｎ　Ｈａｍｐａｐｕｒ、Ｒｕｕｄ　Ｍ．　Ｂｏｌｌｅ、"Ｃｏｍｐａｒｉｓｏｎ　ｏｆ　Ｄｉｓｔａｎｃｅ　Ｍｅａｓｕｒｅｓ　ｆｏｒ　Ｖｉｄｅｏ　Ｃｏｐｙ　Ｄｅｔｅｃｔｉｏｎ"、Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｍｕｌｔｉｍｅｄｉａ　ａｎｄ　Ｅｘｐｏ　（ＩＣＭＥ２００１）、ｐ．９４６、２００１．

　複数の特徴量の集合から成る画像識別子に適した（性能を最適化する）特徴量、すなわち画像の同一性の判定精度が高くなるような特徴量を選択する際は、異なる画像を識別できる度合いである識別能力と、画像への各種改変処理によって特徴量の値が変化しない度合いである頑健性との２つの要件を両立さなければならない。

　しかしながら、上述した特徴量選択技術では、異なる画像を識別できる度合いである識別能力と、画像への各種改変処理によって特徴量の値が変化しない度合いである頑健性との双方を考慮して特徴量を選択していないため、画像識別子の性能を最適化できない（画像の同一性の判定精度を最適化できない）という問題点がある。すなわち、主成分分析（PCA）による方法は、特徴量の分布全体の持つ情報を最大化しているため、特徴量の頑健性を考慮していない（特徴量の頑健性を考慮した特徴量選択ができない）。また、線形判別分析（LDA）による方法は、クラス分類（有限個のクラスに分類する問題）の特徴選択には適しているが、あらかじめクラスが定義されない（画像）識別子の特徴選択には適していない（画像識別子における識別能力、頑健性を考慮した特徴選択ではない）。

［発明の目的］
　そこで本発明の目的は、画像識別子の性能（画像の同一性の判定精度）を最適化するのは困難である、という課題を解決する特徴量選択装置を提供することにある。

　本発明の一形態にかかる特徴量選択装置は、複数の元画像と、この複数の元画像に対して改変処理を施した複数の改変画像と、の各々の画像からM種類の特徴量を抽出する特徴量抽出手段と、元画像とその改変画像どうしおよび同一の元画像の改変画像どうしは同一の画像、それら以外の画像どうしは異なる画像として扱って、異なる画像を識別できる度合いである識別能力と、画像への改変処理によって特徴量の値が変化しない度合いである頑健性とを評価基準として、上記各々の画像から抽出された上記Ｍ種類の特徴量を評価し、上記Ｍ種類の特徴量からＭより少ないＮ種類の特徴量の集合を、画像を識別するための特徴量として選択する特徴量選択手段とを備えている。

　本発明は上述のように構成されているため、画像を識別するための複数の特徴量の集合から成る画像識別子の性能（画像の同一性の判定精度）を最適化することができる。

本発明の第１の実施の形態のブロック図である。多形状領域比較特徴量の抽出方法を示す図である。特徴量記憶手段に記憶されたデータの一例を示す図である。本発明の第１の実施の形態の処理例を示すフローチャートである。特許文献１に記載されている画像識別子の抽出方法を示す図である。

　次に、本発明の実施の形態について図面を参照して詳細に説明する。

［第１の実施の形態］
　本実施の形態に係る特徴量抽出装置は、画像データベースに含まれる画像群を用いて、M種類の特徴量から、画像識別子として適したMより少ないN種類（N＜M）の特徴量を選択し、選択したN種類の特徴量を示す情報を出力する。ここで「画像識別子として適した特徴量」とは、画像の同一性の判定精度が高くなるような特徴量のことをいう。本発明による特徴量選択装置で選択されたN種類の特徴量の集合は、N次元の特徴ベクトル（画像識別子）における各次元の特徴量として用いられる。N次元の特徴ベクトル（画像識別子）どうしの照合方法、すなわち同一性尺度を算出する方法としては、同一の（対応する次元の）特徴量の値の比較に基づいて算出する方法（例えば、特徴量の値（量子化インデックス）が一致する次元数を類似度として算出したり、ハミング距離、ユークリッド距離、コサイン類似度（内積）などを算出する）であることを想定している。また、MとNは、あらかじめ決定された数値（定数）である必要はなく、M＞2かつN＜Mを満たす正の整数であれば、その値が変化する変数であってもよい。

　図１を参照すると、本発明の第１の実施の形態に係る特徴量抽出装置は、画像改変手段１１、特徴量抽出パラメータ生成手段１２、特徴量抽出手段１３、特徴量選択手段１４、元画像記憶手段２１、改変画像記憶手段２２、特徴量抽出パラメータ記憶手段２３、および特徴量記憶手段２４から構成されている。

　元画像記憶手段２１は、多数の元画像をその元画像を一意に識別するための番号などの画像IDと関連付けて記憶する画像データベースである。元画像記憶手段２１に記憶される元画像は、本実施の形態に係る特徴量選択装置が、画像識別子に適した特徴量を選択するために用いられる。元画像記憶手段２１に記憶された元画像は、画像改変手段１１および特徴量抽出手段１３へ供給される。

　元画像記憶手段２１に記憶される元画像群は、画像識別子に適した特徴量を選択するために用いられるため、より多くの元画像（例えば１万以上など）を含むことが望ましい。また、元画像記憶手段２１に記憶される元画像群は、画像識別子に適した特徴量を選択するために用いられるため、本実施の形態の特徴量選択装置によって選択された特徴量から成る画像識別子を用いる対象となる画像群と同様な傾向の画像群（類似した傾向の画像群）であることが望ましい。例えば、画像識別子を用いる対象が、インターネット上の画像や動画像である場合は（例えば、インタネット上の画像や動画像の違法は複製を検知するために用いるなど）、元画像記憶手段２１に記憶される元画像群は、インターネット上のあらゆる画像を満遍なく均等にサンプリングした画像群であることが望ましい。また例えば、画像識別子を用いる対象が、風景画像に限定される場合は、元画像記憶手段２１に記憶される元画像群は、様々な風景画像をサンプリングした画像群であることが望ましい。また例えば、画像識別子を用いる対象が、絵画の画像である場合は、元画像記憶手段２１に記憶される元画像群は、様々な絵画の画像をサンプリングした画像群であることが望ましい。また例えば、画像識別子を用いる対象の画像群が、様々な種類の画像が混合されている場合は、元画像記憶手段２１に記憶される元画像群は、各々の種類の画像が、対象の画像群と同様の割合で混合されていることが望ましい。

　このように、元画像記憶手段２１に含まれる元画像群が、画像識別子を用いる対象となる画像群と同様な傾向の画像群（類似した傾向の画像群）であることにより、その対象となる画像群に対して、画像を識別するための画像識別子として、より適切な特徴量を選択できるため、画像の同一性の判定精度がより高い画像識別子を構成できる。

　画像改変手段１１は、元画像記憶手段２１から供給される元画像に対して改変処理を施して、改変画像を生成する。生成された改変画像は、どの元画像から生成された改変画像であるかが明確になるように、生成元の元画像と関連付けて、改変画像記憶手段２２に記憶される。元画像とその改変画像とを関連付ける方法は任意である。例えば、元画像に付与された画像IDに、その元画像から生成された複数の改変画像を一意に識別する枝番号を連結した値を、改変画像の画像IDとして改変画像に付与するといった方法でもよい。

　ここで改変処理の例としては、以下のような処理がある。ただし、これらの処理はあくまでも例示であり、これらに限定されるものではない。また、画像改変手段１１は、これらの組み合わせ（例えば（A）＋（D）など）を施すようにしてもよい。

　(A)画像の圧縮形式（フォーマット）の変換
　(B)画像のサイズ・アスペクト比の変換
　(C)画像の色調の調整・モノクロ化
　(D)画像への各種フィルタ処理（鮮鋭化、平滑化など）
　(E)画像への局所的な加工（テロップ重畳、切抜きなど）
　(F)画像の回転・平行移動・クロッピングなどの幾何変換
　(G)画像への黒帯付加（黒帯とは、例えば4:3と16:9のアスペクト変換によって画面の上下や左右に挿入される黒い余白領域を指す）。
　(H)画像の再キャプチャリング

　画像改変手段１１は、元画像記憶手段２１に記憶された元画像の各々に対して、複数種類の改変処理を施して、複数種類の改変画像を生成してもよい（すなわち、改変画像の数は、元画像の数よりも多くなってもよい）。

　また画像改変手段１１が施す改変処理は、本実施の形態の特徴量選択装置によって選択された特徴量から成る画像識別子を用いる画像において行われる改変処理や、画像識別子を用いる対象において頑健性を要求される改変処理と、同様で（傾向が同様）あることが望ましい。例えば、画像識別子を用いる対象となるシステムにおいて、上記の（A）、（B）、（C）、（D）に対する頑健性が要求される（あるいはそのシステムにおいて（A）、（B）、（C）、（D）の改変処理が行われる）場合には、画像改変手段１１は（A）、（B）、（C）、（D）の改変処理を施すことが望ましい。また例えば、画像識別子を用いる対象において、様々な種類の改変処理が行われる場合は、画像改変手段１１は、各々の種類の改変処理を、その対象で行われるのと同様の割合で施すことが望ましい。このように、画像改変手段１１が施す改変処理を、画像識別子を用いる対象において行われる改変処理や、頑健性を要求される改変処理と同様（傾向が同様）とすることにより、その対象に対して、画像を識別するための画像識別子として、より頑健な特徴量を選択できるため、より画像の同一性の判定精度が高い画像識別子を構成できる。

　特徴量抽出パラメータ生成手段１２は、M種類の特徴量のそれぞれについて、画像から特徴量を抽出するためのパラメータである特徴量抽出パラメータを生成する。生成したM種類の特徴量抽出パラメータは、特徴量抽出パラメータ記憶手段２３に記憶される。なお、本実施の形態では、M種類の特徴量抽出パラメータを生成する特徴量抽出パラメータ生成手段１２を備えるようにしているが、この特徴量抽出パラメータ生成手段１２を省略した実施の形態も考えられる。特徴量抽出パラメータ生成手段１２が省略された構成では、特徴量抽出パラメータ生成手段１２と同一あるいは類似の手段によって生成されるか、または人手で作成されたM種類の特徴量抽出パラメータが、特徴量抽出パラメータ記憶手段２３に事前に記憶される。

　ここで、Mは、画像識別子の特徴量として選択する特徴量の数Nよりも大きい数（N＜M）であればよいが、Nの数倍から数十倍以上であるほうが望ましい。例えば画像識別子の特徴量として選択する特徴量の数N＝５００程度であれば（なお、Nは、画像識別子の同一性判定精度や、画像識別子のサイズ、照合速度などの要求条件から適正値を決めることができる）、Mは例えば２０００から５０００以上程度であることが望ましい。Mをより多くすることにより（より多くの種類の特徴量を生成することにより）、より適切なN種類の特徴量を選択できる可能性が高くなり、より画像の同一性の判定精度の高い画像識別子を構成できる。

　M種類の特徴量抽出パラメータによって抽出されるM種類の特徴量は、どのような種類のものであってもよい。ただし、より多くの種類の画像に対して有効性があるように改良された特徴量であるのが望ましい。その一例を図２を参照して説明する。

　図２は、より多くの種類の画像に対して有効性があるように改良された特徴量の一例（以下、多形状領域比較特徴量と呼ぶ）の抽出方法を示す図である。多形状領域比較特徴量は、あらかじめ、特徴ベクトルの次元ごとに、その特徴量を抽出するための、画像内の２つの抽出領域（第１の抽出領域と第２の抽出領域）が定められている。抽出領域の形状に多様性がある点が、多形状領域比較特徴量と特許文献１に記載された特徴量との大きな相違点である。多形状領域比較特徴量を抽出するには、次元ごとに、次元ごとに定められた第１の抽出領域と第２の抽出領域の平均輝度値を算出し、第１の抽出領域の平均輝度値と第２の抽出領域の平均輝度値とを比較して（すなわち差分値に基づいて）、３値に量子化して（＋１、０、－１）量子化インデックスを得る。第１の抽出領域の平均輝度値と第２の抽出領域の平均輝度値との差分値の絶対値がある規定の閾値以下の場合は、第１の抽出領域と第２の抽出領域の平均輝度値の差がないものとみなし、差がないことを示す量子化インデックス０とし、それ以外の場合は、第１の抽出領域の平均輝度値と第２の抽出領域の平均輝度値との大小を比較して、第１の抽出領域の平均輝度値のほうが大きい場合は量子化インデックスを＋１、それ以外の場合は量子化インデックスを－１とする。ここで、次元ｎの第１の抽出領域の平均輝度値をＶｎ１、第２の抽出領域の平均輝度値をＶｎ２とし、規定の閾値をｔｈとすると、次元ｎの量子化インデックスＱｎは、次式で算出することができる。

Ｑｎ＝＋１　　（｜Ｖｎ１－Ｖｎ２｜＞ｔｈ　かつ　Ｖｎ１＞Ｖｎ２　の場合）
　　　　０　　（｜Ｖｎ１－Ｖｎ２｜≦ｔｈ　の場合）
　　　－１　　（｜Ｖｎ１－Ｖｎ２｜＞ｔｈ　かつ　Ｖｎ１≦Ｖｎ２　の場合）
　　…［式１］

　多形状領域比較特徴量では、特徴量に対応した特徴量抽出パラメータは、それぞれの特徴量の第１の抽出領域と第２の抽出領域とを示す情報となる。例えば、ある正規化された画像サイズ（例えば３２０×２４０画素など）における第１の抽出領域の画素座標値の集合と、第２の抽出領域の画素座標値の集合とを、特徴量抽出パラメータとしてもよい。また、抽出領域をより少ないパラメータとして表現してもよい。例えば、抽出領域の形状が四角形であれば、四角形の四隅の座標値を特徴量抽出パラメータとしてもよいし、また例えば、抽出領域の形状が円形であれば、円形の中心の座標値と半径値を特徴量抽出パラメータとしてもよい。また、閾値ｔｈが特徴量の種類ごとに異なる場合は、閾値ｔｈも特徴量抽出パラメータに含めてもよい。

　特徴量抽出パラメータ生成手段１２は、M種類の多形状領域比較特徴量の特徴量抽出パラメータを、例えば擬似乱数によって自動的に生成してもよい。例えば、擬似乱数の種（シード）から乱数列を発生させ、発生した乱数に基づいて抽出領域の形状や、閾値ｔｈを自動的に生成してもよい。例えば抽出領域の形状が四角形である場合は、発生した乱数に基づいて抽出領域の四隅の座標値を自動的に生成してもよい。

　なお、多形状領域比較特徴量では、M種類の特徴量が、平均輝度値という同一の特性を有している。しかし、M種類の特徴量は同じ特性を持つ特徴量に限定されず、例えば、色情報、周波数情報、エッジ情報などの異なる特性の特徴量を、M種類の特徴量として混在させてもよい。すなわち、例えばM種類の特徴量のうちの一部が多形状領域比較特徴量で、一部が色情報に基づく特徴量で、一部が周波数情報に基づく特徴量で、一部がエッジ情報に基づく特徴量、として特徴量抽出パラメータを生成してもよい。

　特徴量抽出手段１３は、元画像記憶手段２１に記憶された元画像と、改変画像記憶手段２２に記憶された改変画像とを入力し、特徴量抽出パラメータ記憶手段２３に記憶されたM種類の特徴量の抽出方法を規定する特徴量抽出パラメータに従って、元画像と改変画像のそれぞれの画像からM種類の特徴量を抽出する。特徴量抽出手段１３は、元画像からM種類の特徴量を抽出する特徴量抽出部１３１と、改変画像からM種類の特徴量を抽出する特徴量抽出部１３２との２つの抽出部を備えている。これら２つの特徴量抽出部１３１、１３２は、同時に並行して動作させてもよいし、一つずつ順番に動作させてもよい。

　元画像から抽出されたM種類の特徴量と、改変画像から抽出されたM種類の特徴量とは、特徴量記憶手段２４に記憶される。特徴量記憶手段２４では、元画像から抽出されたM種類の特徴量と、その元画像の改変画像から抽出されたM種類の特徴量とを対応付けて記憶する。対応付けの方法は、任意でよい。例えば、改変画像の画像IDが、その元画像の画像IDに枝番号を連結したものであれば、元画像から抽出したM種類の特徴量の集合に対してその元画像の画像IDを付与し、その元画像の改変画像から抽出したM種類の特徴量の集合に対してはその改変画像の画像IDを付与しておけば、画像IDを識別することで、元画像から抽出されたM種類の特徴量と、その元画像の改変画像から抽出されたM種類の特徴量との対応を認識することができる。

　特徴量記憶手段２４に記憶されたデータの一例を図３に示す。この例の特徴量記憶手段２４には、元画像記憶手段２１に記憶された元画像に１対１に対応する特徴量群２４－１～２４－ｘが記憶されている。１つの特徴量群、例えば特徴量群２４－１は、対応する元画像の画像IDとその元画像から抽出されたM種類の特徴量とから構成された元画像特徴量データ２４１と、その元画像の改変画像の画像IDとその改変画像から抽出されたM種類の特徴量とから構成された改変画像特徴量データ２４１－１～２４１－ｙとを含む。ここで、同じ特徴量群に属する画像（つまり、或る１つの元画像とその改変画像）どうしは同一の画像、異なる特徴量群に属する画像どうしは異なる画像として扱われる。

　特徴量選択手段１４は、特徴量記憶手段２４に記憶された元画像から抽出されたM種類の特徴量の値と、改変画像から抽出されたM種類の特徴量の値とを用いて、特徴量の集合が有する、異なる画像を識別できる度合いである識別能力と、特徴量の集合が有する、画像への改変処理によって特徴量の値が変化しない度合いである頑健性との和が大きくなるように、N種類の特徴量の集合を選択する。以下、特徴量選択手段１４の機能を詳細に説明する。

　ここで、選択するN種類の特徴量を添え字nで表す（n=1,2,…,N)。選択するN種類の特徴量に対して、元画像群から抽出した特徴量の値を確率変数X_nと表し、改変画像群から抽出した特徴量の値を確率変数X'_nと表す。例えば、特徴量が上述した多形状領域比較特徴量である場合は、特徴量は｛＋１、０、－１｝のいずれかの値（量子化インデックス）をとる確率変数とみなすことができる。

　また、選択するN種類の特徴量の、元画像群から抽出した特徴量の確率変数X_nの集合、改変画像群から抽出した特徴量の確率変数X'_nの集合を、それぞれ、
S_N=｛X₁,X₂,…,X_N｝
S'_N=｛X'₁,X'₂,…,X'_N｝
と表す。

　特徴量の集合が有する、異なる画像を識別できる度合いである識別能力は、集合S_N=｛X₁,X₂,…,X_N｝に対して算出することができる。集合S_N=｛X₁,X₂,…,X_N｝が有する識別能力を、D(S_N)と表す。D(S_N)は値が大きいほど、識別能力が大きいこと表す。

　特徴量の集合が有する、画像への改変処理によって特徴量の値が変化しない度合いである頑健性は集合S_N=｛X₁,X₂,…,X_N｝、およびそれに対応する集合S'_N=｛X'₁,X'₂,…,X'_N｝から算出することができる。S_N=｛X₁,X₂,…,X_N｝、および、集合S'_N=｛X'₁,X'₂,…,X'_N｝が有する頑健性を、R(S_N,S'_N)と表す。R(S_N,S'_N)は値が大きいほど、頑健性が大きいことを表す。

　特徴量の集合が有する識別能力と頑健性の和E(S_N,S'_N)は、以下の評価式２で与えられる。
E(S_N,S'_N)=D(S_N)+R(S_N,S'_N)　　…［式２］

　特徴量選択手段１４は、評価式２によるE(S_N,S'_N)の値が大きくなるように、N種類の特徴量の集合を選択する。例えば、E(S_N,S'_N)の値が最大となるN種類の特徴量の集合を、（一括で）選択してもよい。またE(S_N,S'_N)の値が大きくなるように、逐次的に特徴量を選択していき（追加していき）、特徴量の集合を選択してもよい。

　以下、特徴量の値が離散値（量子化インデックス）である場合における識別能力D(S_N)と頑健性R(S_N,S'_N)の算出方法の具体例を示す。ここで、特徴量の取り得る値の集合、すなわち確率変数X_n、確率変数X'_nの取り得る値の集合を、χ_n=｛x_n｝と表す。例えば、特徴量が上述した多形状領域比較特徴量である場合は、χ_n=｛+1,0,-1｝となる。

［識別能力D(S_N)の算出方法の具体例］
　（１）特徴量の集合が有する識別能力は、例えば、各々の特徴量の情報エントロピーが大きいほど、識別能力も大きくなると考えることができる。情報エントロピーが大きいほど、各々の特徴量のとる値（確率変数X_n）の出現確率が均等に近くなるため、冗長性が小さくなり、識別能力が大きくなる。逆に、各々の特徴量のとる値（確率変数X_n）の出現確率が、ある特定の値に偏っていると、冗長性が大きくなり、情報エントロピーが小さくなるため、識別能力は小さくなる。

　従って、特徴量の集合が有する識別能力D(S_N)を、各々の特徴量の情報エントロピーの総和として算出することができる。

　特徴量nの確率変数X_nの情報エントロピーH(X_n)は、次式で算出できる。
H(X_n)=-Σ_AA p(x_n)log p(x_n)　　…［式３］
なお、Σの下の添え字AAはx_n∈χ_nを意味する。

　ここで、p(x_n)=Pr(X_n=x_n)であり、供給される元画像群の特徴量の値から、算出することができる。例えば、特徴量nが上述した多形状領域比較特徴量である場合は、p(+1)=Pr(X_n=+1),p(0)=Pr(X_n=0),p(-1)=Pr(X_n=-1)となり、それぞれ、元画像群の特徴量の値が＋１、０、－１、となる確率を、その出現頻度から算出すればよい。

　従って、特徴量の集合が有する識別能力D(S_N)は、例えば、各々の特徴量の情報エントロピーH(X_n)の総和として、次式で算出できる。
D(S_N)=Σ_n=1 ^NH(X_n)　　…［式４］

　（２）また、特徴量の集合が有する識別能力は、例えば、各々の特徴量の間の、相関が小さく、確率的な独立性が高いほど、冗長性が小さくなるため、識別能力が大きくなる。これは、お互いに相関が大きい特徴量が集まっても、冗長性が大きくなり、画像を識別する識別能力が上がらないためである。各々の特徴量の相関の度合いを表す尺度として相互情報量を用いることができる。

　特徴量nの確率変数X_nと、特徴量kの確率変数X_kとの間の相互情報量I(X_n;X_k)は、次式で算出できる。
I(X_n;X_k)=Σ_BBΣ_CC p(x_n,x_k)log[p(x_n,x_k)/{p(x_n)p(x_k)}］　　…［式５］
なお、Σの下の添え字BBはx_n∈χ_nを意味し、同じくCCはx_k∈χ_kを意味する。

　ここで、p(x_n,x_k)=Pr(X_n=x_n,X_k=x_k)であり、x_n,x_kの同時確率を表す。p(x_n,x_k)は、供給される元画像群の特徴量の値から、算出することができる。例えば、特徴量が上述した多形状領域比較特徴量である場合は、
p(+1,+1)=Pr(X_n=+1,X_k=+1)、p(+1,0)=Pr(X_n=+1,X_k=0)、
p(+1,-1)=Pr(X_n=+1,X_k=-1)、p(0,+1)=Pr(X_n=0,X_k=+1)、
p(0,0)=Pr(X_n=0,X_k=0)、p(0,-1)=Pr(X_n=0,X_k=-1)、
p(-1,+1)=Pr(X_n=-1,X_k=+1)、p(-1,0)=Pr(X_n=-1,X_k=0)、
p(-1,-1)=Pr(X_n=-1,X_k=-1)
となり、元画像群の特徴量nと特徴量kの組み合わせの出現頻度から、同時確率を算出すればよい。

　式５で表される特徴量nの確率変数X_nと特徴量kの確率変数X_kとの間の相互情報量I(X_n;X_k)は、この２つの特徴量の間の相関の度合いを表す尺度であるため、相互情報量I(X_n;X_k)が小さいほど、識別能力が大きくなると考えることができる。従って、特徴量の集合が有する識別能力D(S_N)は、相互情報量I(X_n;X_k)の、全ての特徴量の組み合わせの総和に基づいて、次式のように算出することができる。
D(S_N)=-Σ_n=1 ^N Σ_k=n+1 ^N I(X_n;X_k)　　…［式６］

　ここで、相互情報量の総和を負にしている（－を付けている）のは、相互情報量の総和が小さいほど、識別能力D(S_N)の値を大きくするためである。

　（３）また、特徴量の集合が有する識別能力D(S_N)は、式４と式６の総和をとり、次式のように算出してもよい。
D(S_N)=Σ_n=1 ^N H(X_n)-Σ_n=1 ^N Σ_k=n+1 ^N I(X_n;X_k)　　［式７］

　（４）また、特徴量の集合が有する識別能力D(S_N)は、式４のように特徴量の情報エントロピーH(X_n)の総和を取るのではなく、集合S_N=｛X₁,X₂,…,X_N｝の結合エントロピーH(X₁,X₂,…,X_N)として算出してもよい。すなわち、識別能力D(S_N)を、次式として算出してもよい。
D(S_N)=H(X₁,X₂,…,X_N)=-Σ_DD p(x₁,x₂,…,x_N)log p(x₁,x₂,…,x_N)　　…［式８］
なお、Σの下の添え字DDは、x₁∈χ₁,x₂∈χ₂,…,x_N∈χ_Nを意味する。

　ただし、式８による結合エントロピーの計算は、特徴量の数が増えるにつれて、計算量が指数オーダで増大するため、Nの数が大きい場合は、現実的ではない。

　ここで説明した式４、式６、式７、式８による識別能力D(S_N)の算出方法は、一例であり、これらの算出方法に限られない。

　なお、識別能力は元画像群の特徴量の値（確率変数X_n）ではなく、改変画像群の特徴量の値（確率変数X'_n）から算出してもよい。あるいは、それらを混合したものから算出してもよい。

［頑健性R(S_N,S'_N)の算出方法の具体例］
　（１）特徴量の集合が有する頑健性R(S_N,S'_N)は、例えば、各々の特徴量に対して、画像の改変前後において、特徴量の値が変化しない度合いを算出し、その総和として求めることができる。これは、供給される元画像群の特徴量の値（確率変数X_n）と、改変画像群の対応する特徴量の値（確率変数X'_n）とを比較して、同値確率（特徴量の値が一致する確率＝変化しない確率）を測定することで算出することができる。ここで、特徴量nの、画像の改変前後の特徴量の値の同値確率をp(x_n=x'_n)と表す。例えば、特徴量が上述した多形状領域比較特徴量である場合は、p(x_n=x'_n)=Pr(X_n=+1,X'_n=+1)+Pr(X_n=0,X'_n=0)+Pr(X_n=-1,X'_n=-1)となる。特徴量の集合が有する頑健性R(S_N,S'_N)は、例えば、各々の特徴量の同値確率p(x_n=x'_n)の総和として、次式で算出できる。
R(S_N,S'_N)=Σ_n=1 ^N p(x_n=x'_n)　　…［式９］

　（２）また、特徴量の集合が有する頑健性R(S_N,S'_N)は、例えば、各々の特徴量の、元画像群の特徴量の値（確率変数X_n）と、改変画像群の対応する特徴量の値（確率変数X'_n）とから算出される条件付きエントロピーH(X_n|X'_n)に基づいて、算出してもよい。

　特徴量nの条件付きエントロピーH(X_n|X'_n)は、確率変数X'_n（改変画像群の特徴量の値）を知ったときに残る確率変数X_n（元画像群の特徴量の値）の曖昧さを表すため、改変前後で特徴量の値が変化しない確率が高い（改変前後で特徴量が一致する確率が高い）場合、すなわち頑健性が大きい場合は、条件付きエントロピーH(X_n|X'_n)は小さい値となる。すなわち、条件付きエントロピーH(X_n|X'_n)は小さいほど、頑健性が大きくなると考えることができる。特徴量nの条件付きエントロピーH(X_n|X'_n)は、次式で算出できる。
H(X_n|X'_n)=-Σ_EE Σ_FF p(x_n,x'_n)log
p(x_n|x'_n)　　…［式１０］
なお、Σの下の添え字EEはx_n∈χ_nを意味し、同じくFFはx'_n∈χ_nを意味する。

　特徴量の集合が有する頑健性R(S_N,S'_N)は、例えば、各々の特徴量の上記条件付きエントロピーH(X_n|X'_n)の総和に基づいて、次式のように算出することもできる。
R(S_N,S'_N)=-Σ_n=1 ^N H(X_n|X'_n)　　…［式１１］

　ここで、条件付きエントロピーH(X_n|X'_n)の総和を負にしている（－を付けている）のは、条件付きエントロピーH(X_n|X'_n)の総和が小さいほど、頑健性R(S_N,S'_N)の値を大きくするためである。

　ここで説明した式９、式１１による頑健性R(S_N,S'_N)の算出方法は、一例であり、これらの算出方法に限られない。

［識別能力と頑健性の和E(S_N,S'_N)の算出方法の具体例］
　識別能力と頑健性の和E(S_N,S'_N)は、式２に基づいて、例えば、識別能力D(S_N)の算出方法として式４、式６、式７、式８のいずれか、頑健性R(S_N,S'_N)の算出方法として式９、式１１のいずれか、を組み合わせて和を算出してもよい。

　また例えば、適当な重み係数αを用いて、次式のように識別能力D(S_N)と、頑健性R(S_N,S'_N)との和を算出してもよい。
E(S_N,S'_N)=αD(S_N)+(1-α)R(S_N,S'_N)　　…［式１２］

　ここでは組み合わせの一例として、識別能力D(S_N)の算出方法として式７を、頑健性R(S_N,S'_N)の算出方法として式１１を用いた場合の識別能力と頑健性の和E(S_N,S'_N)の算出方法の例を、次式に示す。
E(S_N,S'_N)=D(S_N)+R(S_N,S'_N)
　　　　=Σ_n=1 ^N H(X_n)-Σ_n=1 ^N Σ_k=n+1 ^N I(X_n;X_k)-Σ_n=1 ^N H(X_n|X'_n)
　　　　=Σ_n=1 ^N I(X_n;X'_n)-Σ_n=1 ^N Σ_k=n+1 ^N I(X_n;X_k)　　　…［式１３］

　なお、式１３の式展開は、I(X;Y)=H(X)-H(X|Y)に基づく。

　特徴量選択手段１４は、ここまでに述べてきたような識別能力と頑健性の和の評価式２によるE(S_N,S'_N)の値が大きくなるように、N種類の特徴量の集合を選択する。例えば、E(S_N,S'_N)が最大となるN種類の特徴量の集合を、一括で選択してもよい。しかしながら、E(S_N,S'_N)が大きくなるように、N種類の特徴量の集合を一括で選択するのは、一般的に困難である。なぜならば、あらゆる特徴量の組み合わせに対してE(S_N,S'_N)を算出して評価する必要があるため、組み合わせの数が膨大になるためである。

　そこで、現実的な方法としては、E(S_N,S'_N)が大きくなるように、逐次的に（インクリメンタルに）特徴量を追加していき、特徴量の集合を選択していく方法がある。この方法を、インクリメンタル方式と呼ぶことにする。インクリメンタル方式では、N種類の特徴量（確率変数X_n）を、特徴量（確率変数X_n）の集合を１つずつ増やしながら、N種類の特徴量を選択する。すなわち、
S₁=｛X₁｝
S₂=｛X₁,X₂｝
S₃=｛X₁,X₂,X₃｝
…
S_N=｛X₁,X₂,…,X_N｝
という形で、特徴量を１つずつ追加していく。

　インクリメンタル方式では、例えば、識別能力と頑健性の和の評価式２の値が、最も大きくなるような特徴量を、逐次選択していき、特徴量を追加していく。集合S_N-1から、集合S_Nへと、特徴量を１つ追加する際に、識別能力と頑健性の和の評価式２によるE(S_N,S'_N)の値が最大となるような特徴量（確率変数）X_nを追加する。これは、特徴量追加前の特徴量の集合の識別能力と頑健性の和の評価式２の値と、特徴量追加後の特徴量の集合の識別能力と頑健性の和の評価式２の値との差分が最大となるような特徴量（確率変数）X_nを追加することを意味する。すなわち評価式、
E(S_N,S'_N)-E(S_N-1,S'_N-1)　　…［式１４］
が最大となるような特徴量（確率変数）X_nを追加する。

　例えば、識別能力と頑健性の和の評価式１３によるE(S_N,S'_N)を用いた場合は、次の評価式１５が最大となるような特徴量特徴量（確率変数）X_nを追加する。
E(S_N,S'_N)-E(S_N-1,S'_N-1)=I(X_n;X'_n)-Σ_k=1 ^N-1 I(X_n;X_k)　　…［式１５］

　次に、図４のフローチャートを参照して、本実施の形態の動作を説明する。

　まず、画像改変手段１１が、元画像記憶手段２１から読み出した元画像のそれぞれに対して、あらかじめ定められた種類の改変処理を施して、改変画像を生成し、改変画像記憶手段２２に保存する（Ｓ１０１）。

　次に、特徴量抽出パラメータ生成手段１２が、M種類の特徴量のそれぞれについて、画像から特徴量を抽出するためのパラメータである特徴量抽出パラメータを生成し、特徴量抽出パラメータ記憶手段２３に保存する（Ｓ１０２）。

　次に、特徴量抽出手段１３の特徴量抽出部１３１が、M種類の特徴量の抽出パラメータに従って、元画像記憶手段２１中のそれぞれの元画像からM種類の特徴量を抽出して、特徴量記憶手段２４に保存する（Ｓ１０３）。さらに、特徴量抽出手段１３の特徴量抽出部１３２が、M種類の特徴量の抽出パラメータに従って、改変画像記憶手段２２中のそれぞれの改変画像からM種類の特徴量を抽出して、特徴量記憶手段２４に保存する（Ｓ１０４）。

　次に、特徴量選択手段１４が、特徴量記憶手段２４に記憶された元画像および改変画像のM種類の特徴量を入力し、元画像とその改変画像どうしおよび同一の元画像の改変画像どうしは同一の画像、それら以外の画像どうしは異なる画像として扱って、異なる画像を識別できる度合いである識別能力と画像への改変処理によって特徴量の値が変化しない度合いである頑健性とを評価基準として、M種類の特徴量からN種類の特徴量を選択し、出力する（Ｓ１０５）。以下では、インクリメンタル方式を例に挙げて、ステップＳ１０５の詳細を説明する。

　まず、特徴量選択手段１４は、１つ目の特徴量の種類を決定する（Ｓ１０６）。例えば、M種類の特徴量の中から、識別能力と頑健性の和の評価式の値が最大となる１種類の特徴量を選択し、この選択した種類の特徴量を１つ目に決定する。具体的には、式１３においてN=1として、この評価式の値が最大となる種類の特徴量を選択する。他の方法として、M種類の特徴量の中からランダムに１種類の特徴量を選択してもよい。

　次に特徴量選択手段１４は、追加する１つの特徴量の種類を決定する（Ｓ１０７）。具体的には、特徴量追加前の特徴量の集合の識別能力と頑健性の和の評価式の値と、特徴量追加後の特徴量の集合の識別能力と頑健性の和の評価式の値との差分（つまり、式１４の値）が最大となるような種類の特徴量を選択し、この選択した種類の特徴量を次に追加する１つの特徴量に決定する。

　次に特徴量選択手段１４は、N種類の特徴量が決定されたかどうかを判定し（Ｓ１０８）、未だN種類に満たなければ、ステップＳ１０７に戻って、残りの種類の特徴量の決定を続ける。他方、N種類の特徴量が決定されていれば、決定したN種類の特徴量を図１には図示しない記憶手段などに出力する（Ｓ１０９）。

　このように本実施の形態によれば、複数の特徴量の集合から成る、画像を識別するための画像識別子の性能を最適化する（画像の同一性の判定精度を高くする）ように、特徴量を選択することができる。

　その理由は、改変前後の画像群から抽出した特徴量の値を用いて、異なる画像を識別できる度合いである識別能力と、画像への改変処理によって特徴量の値が変化しない度合いである頑健性との和が大きくなるように、特徴量を選択するためである。

　以上本発明の実施の形態について説明したが、本発明は以上の実施の形態にのみ限定されるものではない。本発明の構成や詳細には、本発明の範囲内で当業者が理解しうる様々な変更をすることができる。また、本発明の特徴量抽出装置は、その有する機能をハードウェア的に実現することは勿論、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した実施の形態における画像改変手段１１、特徴量抽出パラメータ生成手段１２、特徴量抽出手段１３および特徴量選択手段１４などとして機能させる。

　なお、本発明は、日本国にて２００９年１月２９日に特許出願された特願２００９－１７８０６の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。

１１…画像改変手段
１２…特徴量抽出パラメータ生成手段
１３…特徴量抽出手段
１３１、１３２…特徴量抽出部
１４…特徴量選択手段
２１…元画像記憶手段
２２…改変画像記憶手段
２３…特徴量抽出パラメータ記憶手段
２４…特徴量記憶手段

Claims

　複数の元画像と、該複数の元画像に対して改変処理を施した複数の改変画像と、の各々の画像からM種類の特徴量を抽出する特徴量抽出手段と、
　元画像とその改変画像どうしおよび同一の元画像の改変画像どうしは同一の画像、それら以外の画像どうしは異なる画像として扱って、異なる画像を識別できる度合いである識別能力と、画像への改変処理によって特徴量の値が変化しない度合いである頑健性とを評価基準として、前記各々の画像から抽出された前記Ｍ種類の特徴量を評価し、前記Ｍ種類の特徴量からＭより少ないＮ種類の特徴量の集合を、画像を識別するための特徴量として選択する特徴量選択手段と、
を備えることを特徴とする特徴量選択装置。
　前記特徴量抽出手段は、特徴量の抽出方法を規定するパラメータである特徴量抽出パラメータに従って、前記Ｍ種類の特徴量を抽出する
ことを特徴とする請求項１に記載の特徴量選択装置。
　前記M種類の特徴量の抽出方法を規定する特徴量抽出パラメータとして、画像から特徴量を抽出する領域として、対をなす２つの部分領域の形状の組み合わせと、対をなす２つの部分領域の相対的な位置関係との双方が、他の少なくとも１つの部分領域対と相違する１以上の部分領域対を含むように規定したＭ種類の部分領域対に関する定義情報を用いる
ことを特徴とする請求項１または２に記載の特徴量選択装置。
　前記特徴量は、前記画像から抽出した物理量を量子化して得られる量子化値である
ことを特徴とする請求項１乃至３の何れか１項に記載の特徴量選択装置。
　複数の前記元画像を記憶する元画像記憶手段と、
　前記元画像に対して改変処理を施した改変画像を生成する画像改変手段と、
　前記生成された改変画像を記憶する改変画像記憶手段と、
を備えることを特徴とする請求項１乃至４の何れか１項に記載の特徴量選択装置。
　前記画像改変手段は、画像のサイズの変換、画像のアスペクト比の変換、画像の色調の調整、画像のモノクロ化、画像への各種フィルタ処理、画像への局所的な加工、画像の幾何変換、画像への黒帯付加、画像の再キャプチャリングのうちの何れか１つ、または複数の改変処理を行う
ことを特徴とする請求項５に記載の特徴量選択装置。
　前記M種類の特徴量の抽出方法を規定する特徴量抽出パラメータを生成する特徴量抽出パラメータ生成手段と、
　前記生成された前記M種類の特徴量抽出パラメータを記憶する特徴量抽出パラメータ記憶手段と、
を備えることを特徴とする請求項２乃至６の何れか１項に記載の特徴量選択装置。
（段落００３６）
　前記特徴量抽出パラメータ生成手段は、擬似乱数列を発生させ、発生した乱数に基づいて前記特徴量抽出パラメータを生成する
ことを特徴とする請求項７に記載の特徴量選択装置。
　前記特徴量選択手段は、前記識別能力と前記頑健性との和の評価式の値が大きくなるようなN種類の特徴量の集合を選択する
ことを特徴とする請求項１乃至８の何れか１項に記載の特徴量選択装置。
　前記特徴量選択手段は、N種類の特徴量の識別能力を、前記各々の画像から抽出された特徴量を用いて、Ｎ種類の各々の特徴量の情報エントロピーを総和した値、N種類の特徴量を含む集合の結合エントロピー、またはＮ種類の特徴量どうしの相互情報量を総和した値、として計算する
ことを特徴とする請求項９に記載の特徴量選択装置。
　前記特徴量選択手段は、N種類の特徴量の頑健性を、前記元画像から抽出された特徴量と前記改変画像から抽出された特徴量とを用いて、Ｎ種類の各々の特徴量の改変前後の特徴量の同値確率を総和した値、またはＮ種類の各々の特徴量の条件付きエントロピーを総和した値、として計算する
ことを特徴とする請求項９に記載の特徴量選択装置。
　前記特徴量選択手段は、追加前の特徴量の集合の前記評価式の値と、追加後の特徴量の集合の前記評価式の値との差分が最大となるような特徴量を1つずつ追加していくことにより、N種類の特徴量を選択する
ことを特徴とする請求項９乃至１１の何れか１項に記載の特徴量選択装置。
　複数の元画像と、該複数の元画像に対して改変処理を施した複数の改変画像と、の各々の画像からM種類の特徴量を抽出し、
　元画像とその改変画像どうしおよび同一の元画像の改変画像どうしは同一の画像、それら以外の画像どうしは異なる画像として扱って、異なる画像を識別できる度合いである識別能力と、画像への改変処理によって特徴量の値が変化しない度合いである頑健性とを評価基準として、前記各々の画像から抽出された前記Ｍ種類の特徴量を評価し、前記Ｍ種類の特徴量からＭより少ないＮ種類の特徴量の集合を、画像を識別するための特徴量として選択する
ことを特徴とする特徴量選択方法。
　前記Ｍ種類の特徴量の抽出では、特徴量の抽出方法を規定するパラメータである特徴量抽出パラメータに従って、前記Ｍ種類の特徴量を抽出する
ことを特徴とする請求項１３に記載の特徴量選択方法。
　前記M種類の特徴量の抽出方法を規定する特徴量抽出パラメータとして、画像から特徴量を抽出する領域として、対をなす２つの部分領域の形状の組み合わせと、対をなす２つの部分領域の相対的な位置関係との双方が、他の少なくとも１つの部分領域対と相違する１以上の部分領域対を含むように規定したＭ種類の部分領域対に関する定義情報を用いる
ことを特徴とする請求項１３または１４に記載の特徴量選択方法。
　前記特徴量は、前記画像から抽出した物理量を量子化して得られる量子化値である
ことを特徴とする請求項１３乃至１５の何れか１項に記載の特徴量選択方法。
　さらに、前記元画像に対して改変処理を施した前記改変画像を生成する
ことを特徴とする請求項１３乃至１６の何れか１項に記載の特徴量選択方法。
　前記改変画像の生成では、画像のサイズの変換、画像のアスペクト比の変換、画像の色調の調整、画像のモノクロ化、画像への各種フィルタ処理、画像への局所的な加工、画像の幾何変換、画像への黒帯付加、画像の再キャプチャリングのうちの何れか１つ、または複数の改変処理を行う
ことを特徴とする請求項１７に記載の特徴量選択方法。
　さらに、前記M種類の特徴量の抽出方法を規定する前記特徴量抽出パラメータを生成する
ことを特徴とする請求項１４乃至１８の何れか１項に記載の特徴量選択方法。
　前記特徴量抽出パラメータの生成では、擬似乱数列を発生させ、発生した乱数に基づいて前記特徴量抽出パラメータを生成する
ことを特徴とする請求項７に記載の特徴量選択方法。
　前記画像を識別するための特徴量の選択では、前記識別能力と前記頑健性との和の評価式の値が大きくなるようなN種類の特徴量の集合を選択する
ことを特徴とする請求項１３乃至２０の何れか１項に記載の特徴量選択方法。
　前記画像を識別するための特徴量の選択では、N種類の特徴量の識別能力を、前記各々の画像から抽出された特徴量を用いて、Ｎ種類の各々の特徴量の情報エントロピーを総和した値、N種類の特徴量を含む集合の結合エントロピー、またはＮ種類の特徴量どうしの相互情報量を総和した値、として計算する
ことを特徴とする請求項２１に記載の特徴量選択方法。
　前記画像を識別するための特徴量の選択では、N種類の特徴量の頑健性を、前記元画像から抽出された特徴量と前記改変画像から抽出された特徴量とを用いて、Ｎ種類の各々の特徴量の改変前後の特徴量の同値確率を総和した値、またはＮ種類の各々の特徴量の条件付きエントロピーを総和した値、として計算する
ことを特徴とする請求項２１に記載の特徴量選択方法。
　前記画像を識別するための特徴量の選択では、追加前の特徴量の集合の前記評価式の値と、追加後の特徴量の集合の前記評価式の値との差分が最大となるような特徴量を1つずつ追加していくことにより、N種類の特徴量を選択する
ことを特徴とする請求項２１乃至２３の何れか１項に記載の特徴量選択方法。
　コンピュータを、
　複数の元画像と、該複数の元画像に対して改変処理を施した複数の改変画像と、の各々の画像からM種類の特徴量を抽出する特徴量抽出手段と、
　元画像とその改変画像どうしおよび同一の元画像の改変画像どうしは同一の画像、それら以外の画像どうしは異なる画像として扱って、異なる画像を識別できる度合いである識別能力と、画像への改変処理によって特徴量の値が変化しない度合いである頑健性とを評価基準として、前記各々の画像から抽出された前記Ｍ種類の特徴量を評価し、前記Ｍ種類の特徴量からＭより少ないＮ種類の特徴量の集合を、画像を識別するための特徴量として選択する特徴量選択手段と
して機能させるためのプログラム。