JPWO2012032889A1 - 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム - Google Patents

物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム Download PDF

Info

Publication number
JPWO2012032889A1
JPWO2012032889A1 JP2012532912A JP2012532912A JPWO2012032889A1 JP WO2012032889 A1 JPWO2012032889 A1 JP WO2012032889A1 JP 2012532912 A JP2012532912 A JP 2012532912A JP 2012532912 A JP2012532912 A JP 2012532912A JP WO2012032889 A1 JPWO2012032889 A1 JP WO2012032889A1
Authority
JP
Japan
Prior art keywords
bag
probability
instance
learning
positive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012532912A
Other languages
English (en)
Other versions
JP5776694B2 (ja
Inventor
利憲 細井
利憲 細井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012532912A priority Critical patent/JP5776694B2/ja
Publication of JPWO2012032889A1 publication Critical patent/JPWO2012032889A1/ja
Application granted granted Critical
Publication of JP5776694B2 publication Critical patent/JP5776694B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本発明は、見えの変動が多様な物体であっても高い識別精度を得ることが可能な技術を提供する。本発明における学習装置は、対象のインスタンスの識別スコアを計算する弱識別器を、特徴量とバッグラベルとに基づいて生成する弱識別器生成部と、生成された弱識別器に基づいて識別スコアを計算する弱識別部と、計算された識別スコアに基づいて対象のインスタンスのインスタンス確率を計算するインスタンス確率計算部と、計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率を計算するバッグ確率計算部と、バッグ確率の尤もらしさを表す尤度を、バッグラベルに基づいて計算する尤度計算部と、を含む。

Description

本発明は、画像中の物体を識別するための学習に関し、特に高い識別精度を得ることが可能な学習装置、学習システム、学習方法、及び学習プログラムに関する。
画像中の物体を識別する方式の1つとして、統計的パターン認識技術に基づく方式がある。この方式では、物体のテクスチャデータを事前に収集して学習処理を実行し、学習処理で計算されたパラメータに基づいて識別処理を実行することで、識別したい画像中のテクスチャが物体のものであるか否かを識別する。この方式では高い識別精度を得られることが知られている。
その反面、統計的な手法であるため高い識別精度を得るためには、学習処理を実行するために必要なデータ(以下、学習データと記載する)を大量に用意する必要がある。学習データとは、識別の対象となる対象物体を切出した画像テンプレート群とそれら個々の物体のクラス情報(ラベルとも呼ばれる)の集合とみなしてよい。この学習データを作成するためには、物体が映った画像を用意し、さらに、画像上での対象物体の正確な位置・サイズ・回転角等の情報を用意する必要がある。この対象物体の位置・サイズ・回転角等の情報は、通常、人間が画像を目視し、手作業によって作成する。
統計的パターン認識技術に基づく方式の問題は、この学習データを作成するための作業量が膨大であることである。また、画像テンプレートを切出す際の対象物体の位置・サイズ・回転角等の決定基準を、どのようにして定めれば良い識別精度を得られるかは、実際に学習して、識別してみなければわからない。例えば、対象物体が人体の場合を考える。対象物体が人体か否かを識別するのに、全身の画像を画像テンプレートとして利用するのが良いか、または手足のように位置の変動が大きな部位を使わず胴体のみの画像を画像テンプレートとして利用するのが良いかは実際に試してみないとわからない。
仮に、対象物体の位置・サイズ・回転角等が正確でなくとも、自動的かつ適切に学習できるならば、学習データを作成する作業量を大幅に削減することができる。このような学習方式の1つが非特許文献1に記載されている。
非特許文献1に記載されている手法は、Multiple Instance Learning Boostingと呼ばれる。この手法では、ある対象について位置・サイズ・回転角を摂動させた多数の画像テンプレートを用意し、これら画像テンプレートの集合(以下、バッグと記載する)を用いて学習処理を行う。非特許文献1に記載の手法は、「バッグ内の多数の画像テンプレートのうち1つ以上が正確な位置・サイズ・回転角に基づいた物体の画像テンプレートである確率」に基づいた評価尺度で学習する。これにより非特許文献1に記載の手法は、画像テンプレートの集合の中に、正確でない位置・サイズ・回転角に基づいた画像テンプレートが含まれていても、学習処理の過程で自動的に、バッグ同士で共通した特徴を見いだし学習する。つまり、非特許文献1に記載の手法は、自動的に物体の位置・サイズ・回転角が揃った特徴を選んで学習処理をしていると解釈できる。
統計的パターン認識技術分野においては、多種多様な学習方式が存在し、そのうちの1種としてアンサンブル型と呼ばれる種類の学習方式がある。この方式では、弱識別器と呼ばれる識別器を複数組み合わせることによって、最終的な識別結果を得る。この方式では、弱識別器群が行う識別と最終的な識別とを合わせた一連の識別処理を、1つの識別器が行っているとみなす。その一連の識別処理を行う1つの識別器を、強識別器と呼ぶ。この方式の特徴は、弱識別器1つずつの識別精度は必ずしも高くなくても、強識別器としてみれば高い識別精度を得られる点である。非特許文献1では「ブースティング」と呼ばれるアンサンブル型学習方式を改良した方式が採用されている。
一方、特許文献1に記載の手法は、学習ベクトル量子化(LVQ)と呼ばれる統計的パターン認識手法の1種である。LVQという手法自体はアンサンブル型学習方式ではないが、この特許文献1では、アンサンブル学習に近い概念が取り入れられている。
特許文献1に記載の手法は、パターンの特徴ベクトルについて、識別に有効な次元を逐次選択して追加していく。このため、特許文献1に記載の手法は、最初は低次元ベクトルによる識別を行い、その後は次元が追加された高次元ベクトルによる識別を行う。この手法の場合、追加される特徴次元による識別を弱識別器とみなせば、弱識別器群の組み合わせによって強識別器を構成しているとみなせるので、アンサンブル型の学習方式の一種とみなせる。
その他、本発明に関連する技術として、特許文献2及び特許文献3にはサンプル画像を用いた学習方式が記載されている。
Paul Viola,John C. Platt,and Cha Zhang著「Multiple Instance Boosting for Object Detection」In NIPS 18、1419−1426ページ、MIT Press、2006年
特願2009−022898号公報 特開2005−250773号公報 特開2007−226512号公報
しかしながら上記の関連技術では、対象物体の見えの変動が多様な場合に十分高い識別精度を得ることができない。例えば非特許文献1に記載の技術は、学習処理において「バッグ内の画像テンプレートのどれか1つ以上が物体の正確な位置・サイズ・回転角である確率」という確率に基づいた評価尺度を用いている。このため、非特許文献1に記載の技術は、見えの変動が多様な物体に対しては、評価尺度である尤度を最大化しても、バッグ同士で共通した特徴に着目できず、その結果、対象物体が共通して持つ特徴を学習できない。
以上より、本発明の目的は、見えの変動が多様な物体であっても高い識別精度を得ることが可能な、物体識別向けの学習装置、学習システム、学習方法、及び学習プログラムを提供することにある。
上記目的を達成するために、本発明に係る学習装置は、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成する弱識別器生成部と、弱識別器生成部によって生成された弱識別器に基づいて識別スコアを計算する弱識別部と、弱識別部によって計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算するインスタンス確率計算部と、インスタンス確率計算部で計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算するバッグ確率計算部と、バッグ確率計算部で計算されたバッグ確率の尤もらしさを表す尤度を、バッグラベルに基づいて計算する尤度計算部と、を含む。
上記目的を達成するために、本発明に係る学習システムは、上述の学習装置と記憶装置とを含む学習システムであって、記憶装置は、正確な対象物体のインスタンス(ポジティブインスタンス)を2つ以上含む、対象物体のインスタンスについて摂動させた多数のインスタンスの集合(ポジティブバッグ)と、ポジティブバッグではないインスタンスの集合(ネガティブバッグ)とに関する、複数のバッグから抽出した特徴量を保持する特徴量記憶部と、各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルを保持するバッグラベル記憶部と、を含み学習装置において、弱識別器生成部は、弱識別器を、特徴量記憶部の保持する特徴量とバッグラベル記憶部の保持するバッグラベルとに基づいて生成し、尤度計算部は、尤度を、バッグラベル記憶部が保持するバッグラベルに基づいて、学習に用いる複数のバッグを対象に計算し、学習装置は、尤度計算部で計算された尤度に基づいて弱識別器を選択する弱識別器選択部をさらに含み、記憶装置は、弱識別器選択部で選択された弱識別器に関するパラメータを記憶するパラメータ記憶部をさらに含む。
上記目的を達成するために、本発明に係る学習方法は、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、生成された弱識別器に基づいて識別スコアを計算し、計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、計算されたバッグ確率の尤もらしさを表す尤度を、バッグラベルに基づいて計算する。
上記目的を達成するために、本発明に係る記録媒体が格納する学習プログラムは、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、生成された弱識別器に基づいて識別スコアを計算し、計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、計算されたバッグ確率の尤もらしさを表す尤度を、バッグラベルに基づいて計算する、処理をコンピュータに実行させる。
本発明における物体識別向けの学習装置、学習システム、学習方法、及び学習プログラムによれば、見えの変動が多様な物体であっても高い識別精度を得ることができる。
非特許文献1におけるポジティブバッグとネガティブバッグの概念図である。 「位置に関して摂動させて切出した画像テンプレート」を説明するための図である。 「スケール・回転角に関して摂動させて切出した画像テンプレート」を説明するための図である。 物体識別の学習処理に用いるデータを説明するための図である。 本発明の第1の実施の形態における学習システムの機能構成を示すブロック図である。 本発明の第1の実施の形態におけるポジティブバッグとネガティブバッグの概念図である。 本発明の第1の実施の形態における学習システムの動作を示す流れ図である。 本発明の第2の実施の形態における学習システムの機能構成を示すブロック図である。 「位置に関して摂動の程度が近いこと」を説明するための図である。 「スケール・回転角に関して摂動の程度が近いこと」を説明するための図である。 本発明の第2の実施の形態におけるポジティブバッグとネガティブバッグの概念図である。 摂動の程度とインスタンスがポジティブである確率との関係を説明するための図である。 本発明の第2の実施の形態における学習システムの動作を示す流れ図である。 本発明の第3の実施の形態における識別システムと学習システムとの関係の機能構成を示すブロック図である。 識別システムの動作を示す流れ図である。 第4の実施の形態における本発明に係る学習装置の機能構成を示すブロック図である。 第4の実施の形態における学習装置の動作を示す流れ図である。
まず、本発明の理解を容易にするために、本発明の関連技術について詳細に説明する。
非特許文献1では、対象物体である事象を「ポジティブ」と呼び、対象物体でない事象を「ネガティブ」と呼ぶ。また、位置・サイズ・回転角が正確である対象物体の画像テンプレートを「ポジティブインスタンス」と呼び、正確でない対象物体の画像テンプレートおよび対象物体でない画像テンプレートのことを「ネガティブインスタンス」と呼ぶ。尚、インスタンスという言葉は、画像テンプレートそのものを指すことと、画像テンプレートを任意の特徴量に変換した特徴量テンプレートを指すことがある。
非特許文献1では、バッグの中にポジティブインスタンスが1つでも存在すれば、そのバッグを「ポジティブバッグ」と呼び、バッグの中にネガティブインスタンスのみが存在すれば、そのバッグを「ネガティブバッグ」と呼ぶ。図1は、非特許文献1におけるポジティブバッグとネガティブバッグの概念図である。バッグがポジティブかネガティブかという情報を「バッグラベル」と呼ぶ。
図2及び図3は、「摂動させて切出した画像テンプレート」を説明するための図である。具体的には、図2は、「位置に関して摂動させて切出した画像テンプレート」を説明するための図である。図2は、対象物体の画像テンプレートを横方向と縦方向に摂動させた画像テンプレートの集合を示す。図2において、縦軸は「縦方向の位置の摂動」を示す。また、横軸は「横方向の位置の摂動」を示す。図3は、「スケール・回転角に関して摂動させて切出した画像テンプレート」を説明するための図である。図3は、対象物体の画像テンプレートを回転角とスケールとに関して摂動させた画像テンプレートの集合を示す。図3において、縦軸は「スケールの摂動」を示す。また、横軸は「回転角の摂動」を示す。ポジティブバッグは、図2と図3に示すように、位置やサイズ等を摂動させて切出した画像テンプレート群で構成される。
図4は、物体識別の学習処理に用いるデータを説明するための図である。図4において、1(星のマーク)は物体画像テンプレートを摂動させて生成した画像テンプレートである。また、2(四角のマーク)は物体画像以外のその他の画像テンプレートから生成した画像テンプレートである。
図4に示すように、学習処理に用いるデータは、対象物体の画像テンプレートを摂動させて生成した画像テンプレートの集合であるポジティブバッグとその他の画像テンプレートから生成した画像テンプレートの集合であるネガティブバッグとを含む。実際に学習する際には、複数のポジティブバッグと1つ以上のネガティブバッグが用いられる。
以下に、非特許文献1の学習処理における計算手順を説明する。i番目のバッグ内のj番目の画像テンプレートが対象物体である確率をPijとし、バッグ内の1つ以上の画像テンプレートが対象物体である確率をPiとすると、Piは式1によって計算される。
Figure 2012032889
また、識別結果の尤もらしさを評価する評価尺度をLとすると、Lは式2によって定義される。
Figure 2012032889
tiは、i番目のバッグに対象物体が1つ以上含まれている場合は1、そうでない場合は0をとる変数である。非特許文献1に記載の技術は、上記Lで表される尤度を最大化するように学習パラメータを求める。以上の非特許文献1で与えられる言葉の定義は、以下に記載する本発明の実施の形態における説明でも、特に断らない限りにおいて同様の意味で使用する。
以下、本発明の実施の形態について説明する。なお、各実施の形態の学習システムを構成する各装置における各部は、制御部、メモリ、メモリにロードされたプログラム、プログラムを格納するハードディスク等の記憶ユニット、ネットワーク接続用インターフェースなどからなり、ハードウェアとソフトウェアの任意の組合せによって実現される。そして特に断りのない限り、その実現方法、装置は限定されない。
制御部は、CPU(Central Processing Unit。以下同様。)などからなり、オペレーティングシステムを動作させて学習システムの各装置の全体を制御する。また、制御部は、例えばドライブ装置などに装着された記録媒体からメモリにプログラムやデータを読み出し、これにしたがって各種の処理を実行する。
記録媒体は、例えば光ディスク、フレキシブルディスク、磁気光ディスク、外付けハードディスク、半導体メモリ等であって、コンピュータプログラムをコンピュータ読み取り可能に記録する。また、コンピュータプログラムは、通信網に接続されている図示しない外部コンピュータからダウンロードされても良い。
また、各実施の形態の説明において利用するブロック図は、ハードウェア単位の構成ではなく、機能単位のブロックを示している。これらの機能ブロックはハードウェア、ソフトウェアの任意の組み合わせによって実現される。また、これらの図においては、各実施の形態の構成部は物理的に結合した一つの装置により実現されるよう記載されている場合もあるが、その実現手段は特に限定されない。すなわち、二つ以上の物理的に分離した装置を有線または無線で接続し、これら複数の装置により、各実施の形態のシステムを実現しても良い。
<第1の実施の形態>
図5は、本発明の第1の実施の形態における学習システム10の機能構成を示すブロック図である。図5に示すように、学習システム10は、学習装置100と、記憶装置200とを含む。学習装置100は、弱識別器生成部110と、弱識別部120と、インスタンス確率計算部130と、バッグ確率計算部140と、尤度計算部150と、弱識別器選択部160とを含む。記憶装置200は、特徴量記憶部210と、バッグラベル記憶部220と、パラメータ記憶部230とを含む。
まず、記憶装置200が含む各記憶部について説明する。
特徴量記憶部210は、事前に、学習に利用するインスタンスを保持する。本実施の形態において、学習に利用するインスタンスは、画像テンプレートを任意の特徴量に変換したデータであって、ポジティブバッグ又はネガティブバッグに含まれる。すなわち、特徴量記憶部210は、正確な対象物体の画像テンプレート(ポジティブインスタンス)を2つ以上含む、対象物体の画像テンプレートについて摂動させた多数の画像テンプレートの集合(ポジティブバッグ)と、ポジティブバッグではない画像テンプレートの集合(ネガティブバッグ)とに関する、複数のバッグから抽出した特徴量を保持する。
バッグラベル記憶部220は、事前に、学習に利用する個々のバッグがポジティブバッグであるかまたはネガティブバッグであるかという情報であるバッグラベルを保持する。
パラメータ記憶部230は、弱識別器選択部160で選択された弱識別器に関するパラメータを記憶する。弱識別器に関するパラメータは、具体的には、使用する特徴量、弱識別の手順を決定する値、又は閾値等であり、弱識別器の識別方式によって異なる。
次に、学習装置100が含む各構成について説明する。
弱識別器生成部110は、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、特徴量記憶部210の保持する特徴量とバッグラベル記憶部220の保持するバッグラベルとに基づいて生成する。生成される弱識別器は、1種類または複数の特徴量を用いて2クラス識別する任意の識別器でも良い。
弱識別部120は、弱識別器生成部110によって生成された弱識別器に基づいて、画像テンプレートを識別処理して、識別スコアを計算する。
インスタンス確率計算部130は、弱識別部120によって計算された識別スコアに基づいて対象のインスタンスがポジティブインスタンスである確率(インスタンス確率)Pijを計算する。インスタンス確率Pijは、例えば、式3によって計算されても良い。
Figure 2012032889
式3においてiはバッグの番号、jはインスタンスの番号である。また、Sijは弱識別器によって求められた識別スコアである。係数αとβは、実際のデータを元に近似推定しても良いし、定数としても良い。尚、スコア確率値を量子化して1対1に対応付けた対応表による変換といった、式3による算出以外の算出方法であっても、Pijが数学的に確率としての条件を満たせば良い。
バッグ確率計算部140は、インスタンス確率計算部130で計算された、1つのバッグ中のインスタンス全てのインスタンス確率の値から、バッグがポジティブである確率を計算する。ただし、「バッグがポジティブである」とは、バッグ中のインスタンスのうち2つ以上がポジティブインスタンスであること、である。すなわち、バッグ確率計算部140は、インスタンス確率計算部130で計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算する。例えば、バッグ確率計算部140は、式4によってバッグ確率を計算しても良い。
Figure 2012032889
ただし、
Figure 2012032889
式4において、右辺の大括弧内の第1項はすべてのインスタンスがポジティブインスタンスでない確率であり、一方、第2項は1つのインスタンスだけがポジティブインスタンスである確率である。式4におけるPiは、1から第1項と第2項を引くことで、2つ以上のインスタンスがポジティブインスタンスである確率を表していると言える。
尤度計算部150は、バッグラベル記憶部220が保持するバッグラベルに基づいて、バッグ確率計算部140で計算された、学習に用いる複数のバッグのバッグ確率の尤もらしさを表す尤度Lを計算する。Lは、例えば式5によって計算しても良い。
Figure 2012032889
ここで、tiは以下の値を取る。
Figure 2012032889
ただし、Lは尤もらしさを表現すればよいので、対数関数などの単調増加関数でさらに変換しても構わない。また、単調減少関数で変換しても構わない。その場合、後述の弱識別器選択部160は、値が最大になる場合ではなく最小になる場合を選択しても良い。本実施の形態においては、尤度の高さが尤もらしさの高さを表すものとする。
弱識別器選択部160は、尤度計算部150で計算された尤度に基づいて弱識別器を選択する。すなわち、弱識別器選択部160は、尤度計算部150で計算された尤度が最も高い弱識別器を選択する。弱識別器選択部160は、選択した弱識別器に関するパラメータをパラメータ記憶部230に記憶する。
次に、本発明の第1の実施の形態における「バッグラベル」の定義について説明する。図6は、本発明の第1の実施の形態におけるポジティブバッグとネガティブバッグの概念図である。図6に示すように、本発明の第1の実施の形態では、バッグの中にポジティブインスタンスが2つ以上存在すれば、そのバッグを「ポジティブバッグ」と呼び、バッグの中のポジティブインスタンスが1つ以下であれば、そのバッグを「ネガティブバッグ」と呼ぶ。
次に、図5、及び図7の流れ図を参照して学習システム10の全体の動作について詳細に説明する。
図7は、本発明の第1の実施の形態における学習システム10の動作を示す流れ図である。図7に示すように、まず弱識別器生成部110は、特徴量記憶部210の保持する特徴量と、バッグラベル記憶部220の保持するバッグラベルに基づいて、弱識別器を1つ生成する[弱識別器生成ステップ(ステップS110)]。弱識別器は、1種類または複数の特徴量を用いて2クラス識別する任意の識別器である。なお、ある弱識別器が最終的に利用されるかどうかは後述のステップS160の結果次第であり、個々の弱識別器の識別精度が高い必要はない。
次に、弱識別部120は、1つのインスタンスについて弱識別行い、識別スコアを得る[弱識別実行ステップ(ステップS120)]。識別スコアは、例えば0または1の2値をとり得る値でも良いし、実数値でも良い。
次に、インスタンス確率計算部130は、インスタンスがポジティブインスタンスである確率、つまり位置、サイズ、および回転角が正確である対象物体のインスタンスである確率(インスタンス確率)を算出する[インスタンス確率計算ステップ(ステップS130)]。
なお、ステップS120とステップS130は、1つのバッグ内の全てのインスタンス分だけ繰り返し実行される。
次に、バッグ確率計算部140は、バッグがポジティブである確率、つまりバッグ中のインスタンスのうち2つ以上がポジティブインスタンスである確率(バッグ確率)を、例えば式4に基づいて計算する[バッグ確率計算ステップ(ステップS140)]。
なお、ステップS120からS140までの処理は、全てのバッグ個数分だけ繰り返し実行される。
次に、尤度計算部150は、ステップS140までで計算された学習処理に用いる全てのバッグに関する確率と、バッグラベル記憶部220に記憶されたバッグラベルに基づいて、計算された確率の尤もらしさ(尤度)Lを計算する[尤度計算ステップ(ステップS150)]。先述の通り、尤度計算部150は、例えば式5によりLを計算しても良い。
なお、ステップS110からステップS150までの処理は、弱識別器生成ステップで生成された全ての弱識別器候補について繰り返し実行される。ただし、後述のステップS160で選択された弱識別器については除く。つまり、ステップS110からステップS150までの処理は、全ての弱識別器候補のうち未選択のものについて繰り返し実行される。
次に、弱識別器選択部160は、ステップS150までの処理で計算された弱識別器の尤度について、最も高い尤度の弱識別器を選択して、弱識別器に関するパラメータをパラメータ記憶部230に記憶する[弱識別器選択ステップ(ステップS160)]。
なお、ステップS110からS160までの処理は、所定の回数、または、強識別器としての所定の識別精度に達するまで繰り返す。所定の回数は、事前に決められた回数でも良いし、学習処理時間の上限によって回数を決めても良い。また、所定の識別精度は、例えば、ネガティブインスタンスをポジティブインスタンスであると識別した誤受入率と、ポジティブバッグをネガティブバッグと識別した誤棄却率の2つの値が両方とも閾値を下回るように設定しても良い。
以上説明したように、本発明の第1の実施の形態における学習システム10は、1つのバッグの中のインスタンスのうち2つ以上がポジティブインスタンスである確率を計算する。つまり学習システム10は、1つのバッグに対応する摂動された画像テンプレート群のうち2つ以上の画像テンプレートの位置・サイズ・回転角が正しい確率(バッグ確率)を計算する。学習システム10は、計算したバッグ確率に基づいて学習処理するように構成されているため、見えの変動が多様な物体であっても高い識別精度を得ることが可能な学習ができる。
なぜならば、ポジティブバッグは、摂動させた画像テンプレートのみで構成されるため、摂動が粗くなければ、殆ど正確な位置・サイズ・回転角のテンプレートが必ず複数存在するためである。そのため、本発明の第1の実施の形態における学習システム10によれば、見えの変動が多様な物体に関する識別といった識別が困難な場合においても、バッグが2つ以上のポジティブインスタンスを含む確率という評価尺度である尤度を最大化することで、バッグ同士で共通した特徴を使った弱識別器が選択されやすい。
<第2の実施の形態>
本発明の第2の実施の形態における学習システムは、バッグ確率計算部が、特定の条件を満たすバッグ確率を計算する条件付バッグ確率計算部である点が、第1の実施の形態における学習システムと異なる。
図8は、本発明の第2の実施の形態における学習システム11の機能構成を示すブロック図である。図8に示すように、学習システム11は、学習装置101と記憶装置200とを含む。
学習装置101は、第1の実施の形態における学習システム10の学習装置100とほぼ同じ構成であるが、バッグ確率計算部140が、特定の条件を満たすバッグ確率を計算する条件付バッグ確率計算部141である点が異なる。記憶装置200は、第1の実施の形態における学習システム10の記憶装置200と同じ構成である。
条件付バッグ確率計算部141は、インスタンス確率計算部130で計算された、1つのバッグ中のインスタンス全ての確率の値から、バッグがポジティブである確率を計算する。ただし、本実施の形態において「バッグがポジティブである」とは、バッグ中のインスタンスのうち特定の条件を満たす2つ以上のインスタンスがポジティブインスタンスであること、である。また、特定の条件とは、インスタンスに対応した画像テンプレートの位置・サイズ・回転角に関する摂動の程度が近いこと、である。
図9、及び図10を参照して「摂動の程度が近いこと」について詳しく説明する。図9は、「位置に関して摂動の程度が近いこと」を説明するための図である。図10は、「スケール・回転角に関して摂動の程度が近いこと」を説明するための図である。図9、及び図10に示すように、「摂動の程度が近い」とは、例えば、図9と図10において太枠で囲まれた隣接した2つの画像テンプレートの関係に相当する。このように、本実施の形態では摂動の程度が近い2つのインスタンスが同時にポジティブインスタンスであることを「バッグがポジティブである」と定義する。
次に、本発明の第2の実施の形態における「バッグラベル」の定義について説明する。図11は、本発明の第2の実施の形態におけるポジティブバッグとネガティブバッグの概念図である。図11において、3は摂動の程度が近いポジティブインスタンスの例である。また、4は摂動の程度が近くないポジティブインスタンスの例である。
図11に示すように、本発明の第2の実施の形態では、バッグの中にポジティブインスタンスが2つ以上存在し、そのポジティブインスタンスに対応した画像テンプレートの摂動の程度が近い場合に、そのバッグを「ポジティブバッグ」と呼ぶ。バッグの中のポジティブインスタンスが2つ以上存在しても、摂動の程度が近くない場合は、そのバッグを「ネガティブバッグ」と呼ぶ。
図12は、摂動の程度とインスタンスがポジティブである確率との関係を説明するための図である。図12に示すように、実際に学習処理するバッグは、摂動させた画像テンプレートのみで構成されるため、摂動が粗くなければ、殆ど正確な位置・サイズ・回転角のテンプレートが必ず複数存在し、しかもそれらテンプレート同士は摂動の程度が近い、という性質がある。図12において、縦軸は「インスタンスがポジティブである確率」を示す。また、横軸は「摂動の程度」を示す。
条件付バッグ確率計算部141は、上記の性質に基づき、バッグ内に含まれる2つ以上のポジティブインスタンスが、摂動の程度が近い2つ以上のインスタンスである確率(条件付バッグ確率)を計算する。
条件付バッグ確率計算部141は、式6によって条件付バッグ確率を計算しても良い。
Figure 2012032889
ただし、
Figure 2012032889
式6において、右辺の大括弧内の第3項Rは摂動の程度が近くない2つのインスタンスがポジティブインスタンスである確率である。つまり、式6におけるPiは、摂動の程度が近い2つのポジティブインスタンスが1組以上存在する確率を表していると言える。Rは、摂動の程度が近くない2つのインスタンスがポジティブインスタンスである確率を表すものであれば、どのような式で表しても良い。
本実施の形態において、尤度計算部150は、バッグラベル記憶部220が保持するバッグラベルに基づいて、条件付バッグ確率計算部141で計算された、学習に用いる複数のバッグのバッグ確率の尤もらしさを表す尤度Lを計算する。
次に、図8、及び図13の流れ図を参照して学習システム11の全体の動作について詳細に説明する。
図13は、本発明の第2の実施の形態における学習システム11の動作を示す流れ図である。図13に示すように、学習システム11の動作は、学習システム10の動作とほぼ同じであるが、図7のステップS140における動作が、ステップS141(条件付バッグ確率計算ステップ)である点が異なる。
学習システム11は、ステップ140の動作の代わりに、条件付バッグ確率計算部141が、バッグがポジティブである確率を計算する。つまり、条件付バッグ確率計算部141は、バッグ内の摂動の程度が近い2つのインスタンスがポジティブインスタンスである確率を、例えば式6に基づいて計算する[条件付バッグ確率計算ステップ(ステップS141)]。
学習システム11における尤度算出ステップS150では、尤度計算部150が、ステップS141までで計算された学習処理に用いる全てのバッグに関する確率と、バッグラベル記憶部220に記憶されたバッグラベルに基づいて、計算された確率の尤もらしさLを計算する。
以上説明したように、本発明の第2の実施の形態における学習システム11は、1つのバッグの中のインスタンスのうち摂動の程度が近い2つがポジティブインスタンスである確率を計算する。つまり学習システム11は、1つのバッグに対応する摂動された画像テンプレート群のうち摂動の程度が近い2つの画像テンプレートの位置・サイズ・回転角が正しい確率(条件付バッグ確率)を計算する。学習システム11は、計算した条件付バッグ確率に基づいて学習処理するように構成されているため、見えの変動が多様な物体であっても高い識別精度を得ることが可能な学習ができる。
なぜならば、ポジティブバッグは、摂動させた画像テンプレートのみで構成されるため、摂動が粗くなければ、殆ど正確な位置・サイズ・回転角のテンプレートが摂動の程度が近い範囲内に必ず複数存在するためである。そのため、本発明の第2の実施の形態における学習システム11によれば、見えの変動が多様な物体に関する識別といった識別が困難な場合においても、バッグが摂動の程度が近い2つ以上のポジティブインスタンスを含む確率という評価尺度である尤度を最大化することで、バッグ同士で共通した特徴を使った弱識別器が選択されやすい。
<第3の実施の形態>
本発明の第3の実施の形態は、第1又は第2の実施の形態における学習システムで学習したパラメータを用いて物体の識別処理を行う識別システム20である。
図14は、本発明の第3の実施の形態における識別システムと学習システムとの関係の機能構成を示すブロック図である。図14に示すように、識別システム20は、学習システム10又は11が含む記憶装置200と、識別装置300と、を含む。学習システム10又は11については、第1又は第2の実施の形態と同様の構成であるため説明を省略する。また、図14に示すように、識別システム20を含むシステム全体を学習システム30としても良い。
識別装置300は特徴量抽出手部310と識別部320とを含む。
特徴量抽出部310は、識別の対象となる画像から特徴量を抽出する。
識別部320は、特徴量抽出部310が抽出した特徴量について、パラメータ記憶部230から読み出したパラメータに基づいて画像中の物体を識別する。
次に、図14、及び図15の流れ図を参照して、識別システム20の動作について説明する。
図15は、識別システム20の動作を示す流れ図である。図15に示すように、まずユーザは、識別したい画像を特徴量抽出部310に入力する。特徴量抽出部310は、入力された識別の対象となる画像から特徴量を抽出する[特徴量抽出ステップ(ステップS310)]。
特徴量抽出部310は、上記の学習システム10又は11の特徴量記憶部210に記憶される特徴量と同じ方式で計算した特徴量を抽出する。ただし、弱識別器選択部160において、選択された弱識別器が必要とする特徴量のみを抽出しても良い。特徴量抽出部310は、どの特徴量が必要かどうかの情報をパラメータ記憶部230から読み出す。
次に、識別部320は、特徴量抽出手部310で抽出した特徴量について、パラメータ記憶部230から読み出したパラメータに基づいて画像中の物体の種類を識別する[識別ステップ(ステップS320)]。
この物体の種類を識別する方式は、学習システム10又は11で採用した手法にあわせれば良い。例えば、特許文献1はLVQの一種である。この手法を学習に採用した場合、識別部320は、特徴量をベクトルとして考え、所定の次元数の特徴量を用いて、識別のパラメータである代表ベクトル(参照ベクトルとも呼ぶ)との識別を実行すれば良い。
以上説明したように、本発明の識別システム20によれば、学習システム10又は11で学習したパラメータを用いることで、見えの変動が多様な物体であっても高い識別精度で識別することができる。
<第4の実施の形態>
図16は、第4の実施の形態における本発明に係る学習装置102の機能構成を示すブロック図である。図16に示すように、学習装置102は、弱識別器生成部110と、弱識別部120と、インスタンス確率計算部130と、バッグ確率計算部140と、尤度計算部150と、を含む。
弱識別器生成部110は、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成する。
複数のバッグから抽出した特徴量とバッグラベルは、図16には図示しない記憶装置が保持していても良い。その場合、弱識別器生成部110は、適宜図示しない記憶装置から特徴量とバッグラベルを読み出して、弱識別器を生成しても良い。
弱識別部120は、弱識別器生成部110によって生成された弱識別器に基づいて識別スコアを計算する。
インスタンス確率計算部130は、弱識別部120によって計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算する。
バッグ確率計算部140は、インスタンス確率計算部130で計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算する。
尤度計算部150は、バッグ確率計算部140で計算されたバッグ確率の尤もらしさを表す尤度を、バッグラベルに基づいて計算する。バッグラベルは、16には図示しない記憶装置が保持していても良い。その場合、尤度計算部150は、適宜図示しない記憶装置からバッグラベルを読み出して、尤度を計算しても良い。
次に、図16、及び図17の流れ図を参照して、学習装置102の動作について説明する。
図17は、第4の実施の形態における学習装置102の動作を示す流れ図である。図17に示すように、まず弱識別器生成部110は、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて、弱識別器を1つ生成する[弱識別器生成ステップ(ステップS110)]。
次に、弱識別部120は、1つのインスタンスについて弱識別行い、識別スコアを得る[弱識別実行ステップ(ステップS120)]。
次に、インスタンス確率計算部130は、インスタンスがポジティブインスタンスである確率、つまり位置、サイズ、および回転角が正確である対象物体のインスタンスである確率(インスタンス確率)を算出する[インスタンス確率計算ステップ(ステップS130)]。
なお、ステップS120とステップS130は、1つのバッグ内の全てのインスタンス分だけ繰り返し実行される。
次に、バッグ確率計算部140は、バッグがポジティブである確率、つまりバッグ中のインスタンスのうち2つ以上がポジティブインスタンスである確率(バッグ確率)を、例えば式4に基づいて計算する[バッグ確率計算ステップ(ステップS140)]。
なお、ステップS120からS140までの処理は、全てのバッグ個数分だけ繰り返し実行される。
次に、尤度計算部150は、ステップS140までで計算された学習処理に用いる全てのバッグに関する確率と、バッグラベルとに基づいて、計算された確率の尤もらしさ(尤度)Lを計算する[尤度計算ステップ(ステップS150)]。
なお、ステップS110からステップS150までの処理は、弱識別器生成ステップで生成された全ての弱識別器候補について繰り返し実行される。
その後、学習装置102は、尤度計算ステップで計算された尤度に基づいて弱識別器を選択し、該弱識別器に関するパラメータを図示しない記憶装置に記憶しても良い。
以上説明したように、本発明の学習装置102によれば、見えの変動が多様な物体であっても高い識別精度を得ることが可能な学習ができる。
次に、本発明の第1の実施の形態の具体的な実施例を説明する。以下、人物の頭部を識別対象とする例について説明する。
本実施例では、統計的パターン認識手法として、特許文献1に記載されている手法を用いる。以下、この手法を「カスケード型GLVQ(カスケード型一般化学習ベクトル量子化)」と表記する。
まず、具体的な構成や動作の説明の前に、カスケード型GLVQについて簡潔に説明する。カスケード型に限らずLVQによる手法では、識別したいクラス毎に参照ベクトルと呼ばれる代表ベクトルを用意し、学習処理によって識別に適した参照ベクトルを求める。
ここでは、特に、特徴量パターンをD次元ベクトルとした場合について説明する。カスケード型GLVQの学習処理では、まず、ある1次元に着目し、その次元の値のみを使って1次元の参照ベクトルを学習する。この処理をすべての次元分だけ実行することで、1次元の参照ベクトルがD個求まる。そして、1次元参照ベクトルの中で最も識別に向くベクトルを選択する。次に、選択済みの次元と未選択の次元のある1次元に着目し、2次元の参照ベクトルを学習する。そして、1次元目と同様の手順により、2次元の参照ベクトルの中で最も識別に向くベクトルを選択する。このような処理を3次元目以降も繰り返すことで、最終的にD次元の参照ベクトルが求まる。
なお、カスケード型GLVQの識別処理では、入力された特徴量パターンと参照ベクトルとの距離を計算し、最も近い参照ベクトルが属するクラスに識別される。
次に、本実施例の具体的な構成を説明する。
学習システム10の構成図である図5において、学習装置100としてパーソナルコンピュータ、記憶装置200として半導体メモリを用いる。この場合、特徴量記憶部210とバッグラベル記憶部220、パラメータ記憶部230は半導体メモリ上の一部とみなせる。一方、弱識別器生成部110、弱識別部120、インスタンス確率計算部130、バッグ確率計算部140、尤度計算部150、弱識別器選択部160は、パーソナルコンピュータのCPU上で実現できる。
なお、特徴量記憶部210は、事前に、位置・スケール・回転角に関して摂動させた頭部画像テンプレートについて特徴量を抽出したデータ(ポジティブインスタンス)と、物体でない画像テンプレートについて特徴量を抽出したデータ(ネガティブインスタンス)とを保持する(図2、図3参照)。これらのデータを用意するのに、位置・スケール・回転角に関して正確な情報は必要ない。
また、バッグラベル記憶部220は、事前に、特徴量記憶部210に記憶されているインスタンスで構成されるバッグの情報として、各バッグがポジティブであるかネガティブであるかという情報(バッグラベル)を保持する。
次に本実施例の動作を説明する。
まず、学習システム10は、図7のステップS110に相当する動作を実行する。ステップS110において、弱識別器生成部110は、特徴量記憶部210に記憶されたD次元特徴量のうちある1次元のみに着目した弱識別器を生成する。弱識別器を生成する動作は、カスケード型GLVQにおける1次元分の識別器(1次元の参照ベクトル群)を学習する動作に相当する。
次に、学習システム10は、ステップS120に相当する動作を実行する。ステップS120において、弱識別部120は、S110で生成された弱識別器による弱識別として、カスケード型GLVQにおける1次元分の識別処理を行い、識別スコアを計算する。カスケード型GLVQでは、識別スコアとして実数値が出力される。
次に、学習システム10は、ステップS130に相当する動作を実行する。ステップS130において、インスタンス確率計算部130は、式3によって識別スコアからインスタンス確率を計算する。式3の係数αとβについては、例えば、それぞれ1としても良い。なお、学習システム10は、ステップS120とS130との動作を、1つのバッグ内の全てのインスタンス分だけ繰り返し実行する。
次に、学習システム10は、ステップS140に相当する動作を実行する。ステップS140において、バッグ確率計算部140は、式4に基づいてバッグがポジティブである確率を計算する。これにより求まる値は、具体的には、バッグの中に正確に切出された頭部画像テンプレートが2つ以上ある確率である。なお、学習システム10は、ステップS120からS140までの動作を、全てのバッグ個数分だけ繰り返し実行する。
次に、学習システム10は、ステップS150に相当する動作を実行する。ステップS150において、尤度計算部150は、式5に基づいて尤度を計算する。ただし、計算途中の値が微小な数値になり、数値計算上不安定になる場合があるため、本実施例においては、尤度計算部150は、式5の尤度Lの対数Log(L)を計算する。なお、学習システム10は、ステップS110からS150までの動作を、全ての弱識別器候補の数Dから選択済みの候補数を引いた回数だけ繰り返し実行する。
次に、学習システム10は、ステップS160に相当する動作を実行する。ステップS160において、弱識別器選択部160は、最も高い尤度となる弱識別器を選択し、選択した弱識別器に関するパラメータを、パラメータ記憶部230に記録する。記録するパラメータは、弱識別に使う特徴量次元の番号、カスケード型GLVQの参照ベクトル、弱識別したスコアの閾値である。なお、ステップS110からS160までの処理は所定の回数、例えばD回実行する。
以上の動作により、パラメータ記憶部230に学習処理の結果としてのパラメータが保持される。
<実施の形態の他の表現>
上記の各実施の形態においては、以下に示すような学習装置、学習システム、学習方法、学習プログラム及び識別装置の特徴的構成が示されている(以下のように限定されるわけではない)。なお、本発明の学習プログラムは、コンピュータに、図7、図13、図15、又は図17に示した各ステップを実行させるプログラムであって、各実施の形態で説明した各ステップの動作を実行させるプログラムであれば良い。
(付記1)
対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成する弱識別器生成手段と、
前記弱識別器生成手段によって生成された弱識別器に基づいて前記識別スコアを計算する弱識別手段と、
前記弱識別手段によって計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算するインスタンス確率計算手段と、
前記インスタンス確率計算手段で計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算するバッグ確率計算手段と、
前記バッグ確率計算手段で計算されたバッグ確率の尤もらしさを表す尤度を、前記バッグラベルに基づいて計算する尤度計算手段と、
を含む学習装置。
(付記2)
前記正確な対象物体のインスタンスは、位置、サイズ、および回転角が正確である対象物体のインスタンスである、
付記1に記載の学習装置。
(付記3)
前記バッグ確率計算手段は、バッグ内に含まれる2つ以上のポジティブインスタンスが、摂動の程度が近い2つ以上のインスタンスである確率(条件付バッグ確率)を計算する条件付バッグ確率計算手段である、
付記1又は2に記載の学習装置。
(付記4)
付記1〜3のいずれかに記載の学習装置と記憶装置とを含む学習システムであって、
前記記憶装置は、
正確な対象物体のインスタンス(ポジティブインスタンス)を2つ以上含む、対象物体のインスタンスについて摂動させた多数のインスタンスの集合(ポジティブバッグ)と、ポジティブバッグではないインスタンスの集合(ネガティブバッグ)とに関する、複数のバッグから抽出した特徴量を保持する特徴量記憶手段と、
各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルを保持するバッグラベル記憶手段と、
を含み
前記学習装置において、
前記弱識別器生成手段は、前記弱識別器を、前記特徴量記憶手段の保持する特徴量と前記バッグラベル記憶手段の保持するバッグラベルとに基づいて生成し、
前記尤度計算手段は、前記尤度を、前記バッグラベル記憶手段が保持するバッグラベルに基づいて、学習に用いる複数のバッグを対象に計算し、
前記学習装置は、前記尤度計算手段で計算された尤度に基づいて弱識別器を選択する弱識別器選択手段をさらに含み、
前記記憶装置は、前記弱識別器選択手段で選択された弱識別器に関するパラメータを記憶するパラメータ記憶手段をさらに含む、
学習システム。
(付記5)
識別の対象となる画像から特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段が抽出した特徴量について、前記パラメータ記憶手段が記憶する前記パラメータに基づいて前記画像中の物体を識別する識別手段と、
を含む付記4に記載の学習システム。
(付記6)
対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、
前記生成された弱識別器に基づいて前記識別スコアを計算し、
前記計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、
前記計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、
前記計算されたバッグ確率の尤もらしさを表す尤度を、前記バッグラベルに基づいて計算する、
学習方法。
(付記7)
前記正確な対象物体のインスタンスは、位置、サイズ、および回転角が正確である対象物体のインスタンスである、
付記6に記載の学習方法。
(付記8)
前記バッグ確率は、バッグ内に含まれる2つ以上のポジティブインスタンスが、摂動の程度が近い2つ以上のインスタンスである確率(条件付バッグ確率)である、
付記6又は7に記載の学習方法。
(付記9)
対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、
前記生成された弱識別器に基づいて前記識別スコアを計算し、
前記計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、
前記計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、
前記計算されたバッグ確率の尤もらしさを表す尤度を、前記バッグラベルに基づいて計算する、
処理をコンピュータに実行させる学習プログラムを格納する記録媒体。
(付記10)
前記正確な対象物体のインスタンスは、位置、サイズ、および回転角が正確である対象物体のインスタンスである、
付記9に記載の学習プログラムを格納する記録媒体。
(付記11)
前記バッグ確率は、バッグ内に含まれる2つ以上のポジティブインスタンスが、摂動の程度が近い2つ以上のインスタンスである確率(条件付バッグ確率)である、
付記9又は10に記載の学習プログラムを格納する記録媒体。
以上、実施の形態を参照して本願発明を説明したが、本願発明は以上の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で同業者が理解し得る様々な変更をすることができる。
この出願は、2010年9月9日に出願された日本出願特願2010−201592を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明の学習装置、学習システム、学習方法、及び学習プログラムは、カメラで撮影された画像について人物や自動車といった所望の物体に応じて分類する画像整理用途や、所望の物体を画像から検出して物体の状況を監視する自動監視用途等に適用できる。
10 学習システム
11 学習システム
20 識別システム
30 学習システム
100 学習装置
101 学習装置
102 学習装置
110 弱識別器生成部
120 弱識別部
130 インスタンス確率計算部
140 バッグ確率計算部
141 条件付バッグ確率計算部
150 尤度計算部
160 弱識別器選択部
200 記憶装置
210 特徴量記憶部
220 バッグラベル記憶部
230 パラメータ記憶部
300 識別装置
310 特徴量抽出部
320 識別部
【書類名】 明細書
【発明の名称】 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム
【技術分野】 本発明は、画像中の物体を識別するための学習に関し、特に高い識別精度を得ることが可能な学習装置、学習システム、学習方法、及び学習プログラムに関する。
【背景技術】
【0001】
画像中の物体を識別する方式の1つとして、統計的パターン認識技術に基づく方式がある。この方式では、物体のテクスチャデータを事前に収集して学習処理を実行し、学習処理で計算されたパラメータに基づいて識別処理を実行することで、識別したい画像中のテクスチャが物体のものであるか否かを識別する。この方式では高い識別精度を得られることが知られている。
【0002】
その反面、統計的な手法であるため高い識別精度を得るためには、学習処理を実行するために必要なデータ(以下、学習データと記載する)を大量に用意する必要がある。学習データとは、識別の対象となる対象物体を切出した画像テンプレート群とそれら個々の物体のクラス情報(ラベルとも呼ばれる)の集合とみなしてよい。この学習データを作成するためには、物体が映った画像を用意し、さらに、画像上での対象物体の正確な位置・サイズ・回転角等の情報を用意する必要がある。この対象物体の位置・サイズ・回転角等の情報は、通常、人間が画像を目視し、手作業によって作成する。
【0003】
統計的パターン認識技術に基づく方式の問題は、この学習データを作成するための作業量が膨大であることである。また、画像テンプレートを切出す際の対象物体の位置・サイズ・回転角等の決定基準を、どのようにして定めれば良い識別精度を得られるかは、実際に学習して、識別してみなければわからない。例えば、対象物体が人体の場合を考える。対象物体が人体か否かを識別するのに、全身の画像を画像テンプレートとして利用するのが良いか、または手足のように位置の変動が大きな部位を使わず胴体のみの画像を画像テンプレートとして利用するのが良いかは実際に試してみないとわからない。
【0004】
仮に、対象物体の位置・サイズ・回転角等が正確でなくとも、自動的かつ適切に学習できるならば、学習データを作成する作業量を大幅に削減することができる。このような学習方式の1つが非特許文献1に記載されている。
【0005】
非特許文献1に記載されている手法は、Multiple Instance Learning Boostingと呼ばれる。この手法では、ある対象について位置・サイズ・回転角を摂動させた多数の画像テンプレートを用意し、これら画像テンプレートの集合(以下、バッグと記載する)を用いて学習処理を行う。非特許文献1に記載の手法は、「バッグ内の多数の画像テンプレートのうち1つ以上が正確な位置・サイズ・回転角に基づいた物体の画像テンプレートである確率」に基づいた評価尺度で学習する。これにより非特許文献1に記載の手法は、画像テンプレートの集合の中に、正確でない位置・サイズ・回転角に基づいた画像テンプレートが含まれていても、学習処理の過程で自動的に、バッグ同士で共通した特徴を見いだし学習する。つまり、非特許文献1に記載の手法は、自動的に物体の位置・サイズ・回転角が揃った特徴を選んで学習処理をしていると解釈できる。
【0006】
統計的パターン認識技術分野においては、多種多様な学習方式が存在し、そのうちの1種としてアンサンブル型と呼ばれる種類の学習方式がある。この方式では、弱識別器と呼ばれる識別器を複数組み合わせることによって、最終的な識別結果を得る。この方式では、弱識別器群が行う識別と最終的な識別とを合わせた一連の識別処理を、1つの識別器が行っているとみなす。その一連の識別処理を行う1つの識別器を、強識別器と呼ぶ。この方式の特徴は、弱識別器1つずつの識別精度は必ずしも高くなくても、強識別器としてみれば高い識別精度を得られる点である。非特許文献1では「ブースティング」と呼ばれるアンサンブル型学習方式を改良した方式が採用されている。
【0007】
一方、特許文献1に記載の手法は、学習ベクトル量子化(LVQ)と呼ばれる統計的パターン認識手法の1種である。LVQという手法自体はアンサンブル型学習方式ではないが、この特許文献1では、アンサンブル学習に近い概念が取り入れられている。
【0008】
特許文献1に記載の手法は、パターンの特徴ベクトルについて、識別に有効な次元を逐次選択して追加していく。このため、特許文献1に記載の手法は、最初は低次元ベクトルによる識別を行い、その後は次元が追加された高次元ベクトルによる識別を行う。この手法の場合、追加される特徴次元による識別を弱識別器とみなせば、弱識別器群の組み合わせによって強識別器を構成しているとみなせるので、アンサンブル型の学習方式の一種とみなせる。
【0009】
その他、本発明に関連する技術として、特許文献2及び特許文献3にはサンプル画像を用いた学習方式が記載されている。
【先行技術文献】
【特許文献】
【0010】
【非特許文献】
【0011】
【非特許文献1】 Paul Viola,John C. Platt,and Cha Zhang著「Multiple Instance Boosting for Object Detection」In NIPS 18、1419−1426ページ、MIT Press、2006年
【特許文献1】 特願2009−022898号公報
【特許文献2】 特開2005−250773号公報
【特許文献3】 特開2007−226512号公報
【発明の概要】
【発明が解決しようとする課題】
【0012】
しかしながら上記の関連技術では、対象物体の見えの変動が多様な場合に十分高い識別精度を得ることができない。例えば非特許文献1に記載の技術は、学習処理において「バッグ内の画像テンプレートのどれか1つ以上が物体の正確な位置・サイズ・回転角である確率」という確率に基づいた評価尺度を用いている。このため、非特許文献1に記載の技術は、見えの変動が多様な物体に対しては、評価尺度である尤度を最大化しても、バッグ同士で共通した特徴に着目できず、その結果、対象物体が共通して持つ特徴を学習できない。
【0013】
以上より、本発明の目的は、見えの変動が多様な物体であっても高い識別精度を得ることが可能な、物体識別向けの学習装置、学習システム、学習方法、及び学習プログラムを提供することにある。
【課題を解決するための手段】
【0014】
上記目的を達成するために、本発明に係る学習装置は、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成する弱識別器生成部と、弱識別器生成部によって生成された弱識別器に基づいて識別スコアを計算する弱識別部と、弱識別部によって計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算するインスタンス確率計算部と、インスタンス確率計算部で計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算するバッグ確率計算部と、バッグ確率計算部で計算されたバッグ確率の尤もらしさを表す尤度を、バッグラベルに基づいて計算する尤度計算部と、を含む。
【0015】
上記目的を達成するために、本発明に係る学習システムは、上述の学習装置と記憶装置とを含む学習システムであって、記憶装置は、正確な対象物体のインスタンス(ポジティブインスタンス)を2つ以上含む、対象物体のインスタンスについて摂動させた多数のインスタンスの集合(ポジティブバッグ)と、ポジティブバッグではないインスタンスの集合(ネガティブバッグ)とに関する、複数のバッグから抽出した特徴量を保持する特徴量記憶部と、各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルを保持するバッグラベル記憶部と、を含み学習装置において、弱識別器生成部は、弱識別器を、特徴量記憶部の保持する特徴量とバッグラベル記憶部の保持するバッグラベルとに基づいて生成し、尤度計算部は、尤度を、バッグラベル記憶部が保持するバッグラベルに基づいて、学習に用いる複数のバッグを対象に計算し、学習装置は、尤度計算部で計算された尤度に基づいて弱識別器を選択する弱識別器選択部をさらに含み、記憶装置は、弱識別器選択部で選択された弱識別器に関するパラメータを記憶するパラメータ記憶部をさらに含む。
【0016】
上記目的を達成するために、本発明に係る学習方法は、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、生成された弱識別器に基づいて識別スコアを計算し、計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、計算されたバッグ確率の尤もらしさを表す尤度を、バッグラベルに基づいて計算する。
【0017】
上記目的を達成するために、本発明に係る学習プログラムは、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、生成された弱識別器に基づいて識別スコアを計算し、計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、計算されたバッグ確率の尤もらしさを表す尤度を、バッグラベルに基づいて計算する、処理をコンピュータに実行させる。
【発明の効果】
【0018】
本発明における物体識別向けの学習装置、学習システム、学習方法、及び学習プログラムによれば、見えの変動が多様な物体であっても高い識別精度を得ることができる。
【図面の簡単な説明】
【0019】
【図1】 非特許文献1におけるポジティブバッグとネガティブバッグの概念図である。
【図2】 「位置に関して摂動させて切出した画像テンプレート」を説明するための図である。
【図3】 「スケール・回転角に関して摂動させて切出した画像テンプレート」を説明するための図である。
【図4】 物体識別の学習処理に用いるデータを説明するための図である。
【図5】 本発明の第1の実施の形態における学習システムの機能構成を示すブロック図である。
【図6】 本発明の第1の実施の形態におけるポジティブバッグとネガティブバッグの概念図である。
【図7】 本発明の第1の実施の形態における学習システムの動作を示す流れ図である。
【図8】 本発明の第2の実施の形態における学習システムの機能構成を示すブロック図である。
【図9】 「位置に関して摂動の程度が近いこと」を説明するための図である。
【図10】 「スケール・回転角に関して摂動の程度が近いこと」を説明するための図である。
【図11】 本発明の第2の実施の形態におけるポジティブバッグとネガティブバッグの概念図である。
【図12】 摂動の程度とインスタンスがポジティブである確率との関係を説明するための図である。
【図13】 本発明の第2の実施の形態における学習システムの動作を示す流れ図である。
【図14】 本発明の第3の実施の形態における識別システムと学習システムとの関係の機能構成を示すブロック図である。
【図15】 識別システムの動作を示す流れ図である。
【図16】 第4の実施の形態における本発明に係る学習装置の機能構成を示すブロック図である。
【図17】 第4の実施の形態における学習装置の動作を示す流れ図である。
【発明を実施するための形態】
【0020】
まず、本発明の理解を容易にするために、本発明の関連技術について詳細に説明する。
【0021】
非特許文献1では、対象物体である事象を「ポジティブ」と呼び、対象物体でない事象を「ネガティブ」と呼ぶ。また、位置・サイズ・回転角が正確である対象物体の画像テンプレートを「ポジティブインスタンス」と呼び、正確でない対象物体の画像テンプレートおよび対象物体でない画像テンプレートのことを「ネガティブインスタンス」と呼ぶ。尚、インスタンスという言葉は、画像テンプレートそのものを指すことと、画像テンプレートを任意の特徴量に変換した特徴量テンプレートを指すことがある。
【0022】
非特許文献1では、バッグの中にポジティブインスタンスが1つでも存在すれば、そのバッグを「ポジティブバッグ」と呼び、バッグの中にネガティブインスタンスのみが存在すれば、そのバッグを「ネガティブバッグ」と呼ぶ。図1は、非特許文献1におけるポジティブバッグとネガティブバッグの概念図である。バッグがポジティブかネガティブかという情報を「バッグラベル」と呼ぶ。
【0023】
図2及び図3は、「摂動させて切出した画像テンプレート」を説明するための図である。具体的には、図2は、「位置に関して摂動させて切出した画像テンプレート」を説明するための図である。図2は、対象物体の画像テンプレートを横方向と縦方向に摂動させた画像テンプレートの集合を示す。図2において、縦軸は「縦方向の位置の摂動」を示す。また、横軸は「横方向の位置の摂動」を示す。図3は、「スケール・回転角に関して摂動させて切出した画像テンプレート」を説明するための図である。図3は、対象物体の画像テンプレートを回転角とスケールとに関して摂動させた画像テンプレートの集合を示す。図3において、縦軸は「スケールの摂動」を示す。また、横軸は「回転角の摂動」を示す。ポジティブバッグは、図2と図3に示すように、位置やサイズ等を摂動させて切出した画像テンプレート群で構成される。
【0024】
図4は、物体識別の学習処理に用いるデータを説明するための図である。図4において、1(星のマーク)は物体画像テンプレートを摂動させて生成した画像テンプレートである。また、2(四角のマーク)は物体画像以外のその他の画像テンプレートから生成した画像テンプレートである。
【0025】
図4に示すように、学習処理に用いるデータは、対象物体の画像テンプレートを摂動させて生成した画像テンプレートの集合であるポジティブバッグとその他の画像テンプレートから生成した画像テンプレートの集合であるネガティブバッグとを含む。実際に学習する際には、複数のポジティブバッグと1つ以上のネガティブバッグが用いられる。
【0026】
以下に、非特許文献1の学習処理における計算手順を説明する。i番目のバッグ内のj番目の画像テンプレートが対象物体である確率をPijとし、バッグ内の1つ以上の画像テンプレートが対象物体である確率をPiとすると、Piは式1によって計算される。
【0027】
【数1】
Figure 2012032889
また、識別結果の尤もらしさを評価する評価尺度をLとすると、Lは式2によって定義される。
【0028】
【数2】
Figure 2012032889
tiは、i番目のバッグに対象物体が1つ以上含まれている場合は1、そうでない場合は0をとる変数である。非特許文献1に記載の技術は、上記Lで表される尤度を最大化するように学習パラメータを求める。以上の非特許文献1で与えられる言葉の定義は、以下に記載する本発明の実施の形態における説明でも、特に断らない限りにおいて同様の意味で使用する。
【0029】
以下、本発明の実施の形態について説明する。なお、各実施の形態の学習システムを構成する各装置における各部は、制御部、メモリ、メモリにロードされたプログラム、プログラムを格納するハードディスク等の記憶ユニット、ネットワーク接続用インターフェースなどからなり、ハードウェアとソフトウェアの任意の組合せによって実現される。そして特に断りのない限り、その実現方法、装置は限定されない。
【0030】
制御部は、CPU(Central Processing Unit。以下同様。)などからなり、オペレーティングシステムを動作させて学習システムの各装置の全体を制御する。また、制御部は、例えばドライブ装置などに装着された記録媒体からメモリにプログラムやデータを読み出し、これにしたがって各種の処理を実行する。
【0031】
記録媒体は、例えば光ディスク、フレキシブルディスク、磁気光ディスク、外付けハードディスク、半導体メモリ等であって、コンピュータプログラムをコンピュータ読み取り可能に記録する。また、コンピュータプログラムは、通信網に接続されている図示しない外部コンピュータからダウンロードされても良い。
【0032】
また、各実施の形態の説明において利用するブロック図は、ハードウェア単位の構成ではなく、機能単位のブロックを示している。これらの機能ブロックはハードウェア、ソフトウェアの任意の組み合わせによって実現される。また、これらの図においては、各実施の形態の構成部は物理的に結合した一つの装置により実現されるよう記載されている場合もあるが、その実現手段は特に限定されない。すなわち、二つ以上の物理的に分離した装置を有線または無線で接続し、これら複数の装置により、各実施の形態のシステムを実現しても良い。
【0033】
<第1の実施の形態>
図5は、本発明の第1の実施の形態における学習システム10の機能構成を示すブロック図である。図5に示すように、学習システム10は、学習装置100と、記憶装置200とを含む。学習装置100は、弱識別器生成部110と、弱識別部120と、インスタンス確率計算部130と、バッグ確率計算部140と、尤度計算部150と、弱識別器選択部160とを含む。記憶装置200は、特徴量記憶部210と、バッグラベル記憶部220と、パラメータ記憶部230とを含む。
【0034】
まず、記憶装置200が含む各記憶部について説明する。
【0035】
特徴量記憶部210は、事前に、学習に利用するインスタンスを保持する。本実施の形態において、学習に利用するインスタンスは、画像テンプレートを任意の特徴量に変換したデータであって、ポジティブバッグ又はネガティブバッグに含まれる。すなわち、特徴量記憶部210は、正確な対象物体の画像テンプレート(ポジティブインスタンス)を2つ以上含む、対象物体の画像テンプレートについて摂動させた多数の画像テンプレートの集合(ポジティブバッグ)と、ポジティブバッグではない画像テンプレートの集合(ネガティブバッグ)とに関する、複数のバッグから抽出した特徴量を保持する。
【0036】
バッグラベル記憶部220は、事前に、学習に利用する個々のバッグがポジティブバッグであるかまたはネガティブバッグであるかという情報であるバッグラベルを保持する。
【0037】
パラメータ記憶部230は、弱識別器選択部160で選択された弱識別器に関するパラメータを記憶する。弱識別器に関するパラメータは、具体的には、使用する特徴量、弱識別の手順を決定する値、又は閾値等であり、弱識別器の識別方式によって異なる。
【0038】
次に、学習装置100が含む各構成について説明する。
【0039】
弱識別器生成部110は、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、特徴量記憶部210の保持する特徴量とバッグラベル記憶部220の保持するバッグラベルとに基づいて生成する。生成される弱識別器は、1種類または複数の特徴量を用いて2クラス識別する任意の識別器でも良い。
【0040】
弱識別部120は、弱識別器生成部110によって生成された弱識別器に基づいて、画像テンプレートを識別処理して、識別スコアを計算する。
【0041】
インスタンス確率計算部130は、弱識別部120によって計算された識別スコアに基づいて対象のインスタンスがポジティブインスタンスである確率(インスタンス確率)Pijを計算する。インスタンス確率Pijは、例えば、式3によって計算されても良い。
【0042】
【数3】
Figure 2012032889
式3においてiはバッグの番号、jはインスタンスの番号である。また、Sijは弱識別器によって求められた識別スコアである。係数αとβは、実際のデータを元に近似推定しても良いし、定数としても良い。尚、スコア確率値を量子化して1対1に対応付けた対応表による変換といった、式3による算出以外の算出方法であっても、Pijが数学的に確率としての条件を満たせば良い。
【0043】
バッグ確率計算部140は、インスタンス確率計算部130で計算された、1つのバッグ中のインスタンス全てのインスタンス確率の値から、バッグがポジティブである確率を計算する。ただし、「バッグがポジティブである」とは、バッグ中のインスタンスのうち2つ以上がポジティブインスタンスであること、である。すなわち、バッグ確率計算部140は、インスタンス確率計算部130で計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算する。例えば、バッグ確率計算部140は、式4によってバッグ確率を計算しても良い。
【0044】
【数4】
Figure 2012032889
ただし、
【0045】
【数5】
Figure 2012032889
式4において、右辺の大括弧内の第1項はすべてのインスタンスがポジティブインスタンスでない確率であり、一方、第2項は1つのインスタンスだけがポジティブインスタンスである確率である。式4におけるPiは、1から第1項と第2項を引くことで、2つ以上のインスタンスがポジティブインスタンスである確率を表していると言える。
【0046】
尤度計算部150は、バッグラベル記憶部220が保持するバッグラベルに基づいて、バッグ確率計算部140で計算された、学習に用いる複数のバッグのバッグ確率の尤もらしさを表す尤度Lを計算する。Lは、例えば式5によって計算しても良い。
【0047】
【数6】
Figure 2012032889
ここで、tiは以下の値を取る。
【0048】
【数7】
Figure 2012032889
【0049】
ただし、Lは尤もらしさを表現すればよいので、対数関数などの単調増加関数でさらに変換しても構わない。また、単調減少関数で変換しても構わない。その場合、後述の弱識別器選択部160は、値が最大になる場合ではなく最小になる場合を選択しても良い。本実施の形態においては、尤度の高さが尤もらしさの高さを表すものとする。
【0050】
弱識別器選択部160は、尤度計算部150で計算された尤度に基づいて弱識別器を選択する。すなわち、弱識別器選択部160は、尤度計算部150で計算された尤度が最も高い弱識別器を選択する。弱識別器選択部160は、選択した弱識別器に関するパラメータをパラメータ記憶部230に記憶する。
【0051】
次に、本発明の第1の実施の形態における「バッグラベル」の定義について説明する。図6は、本発明の第1の実施の形態におけるポジティブバッグとネガティブバッグの概念図である。図6に示すように、本発明の第1の実施の形態では、バッグの中にポジティブインスタンスが2つ以上存在すれば、そのバッグを「ポジティブバッグ」と呼び、バッグの中のポジティブインスタンスが1つ以下であれば、そのバッグを「ネガティブバッグ」と呼ぶ。
【0052】
次に、図5、及び図7の流れ図を参照して学習システム10の全体の動作について詳細に説明する。
【0053】
図7は、本発明の第1の実施の形態における学習システム10の動作を示す流れ図である。図7に示すように、まず弱識別器生成部110は、特徴量記憶部210の保持する特徴量と、バッグラベル記憶部220の保持するバッグラベルに基づいて、弱識別器を1つ生成する[弱識別器生成ステップ(ステップS110)]。弱識別器は、1種類または複数の特徴量を用いて2クラス識別する任意の識別器である。なお、ある弱識別器が最終的に利用されるかどうかは後述のステップS160の結果次第であり、個々の弱識別器の識別精度が高い必要はない。
【0054】
次に、弱識別部120は、1つのインスタンスについて弱識別行い、識別スコアを得る[弱識別実行ステップ(ステップS120)]。識別スコアは、例えば0または1の2値をとり得る値でも良いし、実数値でも良い。
【0055】
次に、インスタンス確率計算部130は、インスタンスがポジティブインスタンスである確率、つまり位置、サイズ、および回転角が正確である対象物体のインスタンスである確率(インスタンス確率)を算出する[インスタンス確率計算ステップ(ステップS130)]。
【0056】
なお、ステップS120とステップS130は、1つのバッグ内の全てのインスタンス分だけ繰り返し実行される。
【0057】
次に、バッグ確率計算部140は、バッグがポジティブである確率、つまりバッグ中のインスタンスのうち2つ以上がポジティブインスタンスである確率(バッグ確率)を、例えば式4に基づいて計算する[バッグ確率計算ステップ(ステップS140)]。
【0058】
なお、ステップS120からS140までの処理は、全てのバッグ個数分だけ繰り返し実行される。
【0059】
次に、尤度計算部150は、ステップS140までで計算された学習処理に用いる全てのバッグに関する確率と、バッグラベル記憶部220に記憶されたバッグラベルに基づいて、計算された確率の尤もらしさ(尤度)Lを計算する[尤度計算ステップ(ステップS150)]。先述の通り、尤度計算部150は、例えば式5によりLを計算しても良い。
【0060】
なお、ステップS110からステップS150までの処理は、弱識別器生成ステップで生成された全ての弱識別器候補について繰り返し実行される。ただし、後述のステップS160で選択された弱識別器については除く。つまり、ステップS110からステップS150までの処理は、全ての弱識別器候補のうち未選択のものについて繰り返し実行される。
【0061】
次に、弱識別器選択部160は、ステップS150までの処理で計算された弱識別器の尤度について、最も高い尤度の弱識別器を選択して、弱識別器に関するパラメータをパラメータ記憶部230に記憶する[弱識別器選択ステップ(ステップS160)]。
【0062】
なお、ステップS110からS160までの処理は、所定の回数、または、強識別器としての所定の識別精度に達するまで繰り返す。所定の回数は、事前に決められた回数でも良いし、学習処理時間の上限によって回数を決めても良い。また、所定の識別精度は、例えば、ネガティブインスタンスをポジティブインスタンスであると識別した誤受入率と、ポジティブバッグをネガティブバッグと識別した誤棄却率の2つの値が両方とも閾値を下回るように設定しても良い。
【0063】
以上説明したように、本発明の第1の実施の形態における学習システム10は、1つのバッグの中のインスタンスのうち2つ以上がポジティブインスタンスである確率を計算する。つまり学習システム10は、1つのバッグに対応する摂動された画像テンプレート群のうち2つ以上の画像テンプレートの位置・サイズ・回転角が正しい確率(バッグ確率)を計算する。学習システム10は、計算したバッグ確率に基づいて学習処理するように構成されているため、見えの変動が多様な物体であっても高い識別精度を得ることが可能な学習ができる。
【0064】
なぜならば、ポジティブバッグは、摂動させた画像テンプレートのみで構成されるため、摂動が粗くなければ、殆ど正確な位置・サイズ・回転角のテンプレートが必ず複数存在するためである。そのため、本発明の第1の実施の形態における学習システム10によれば、見えの変動が多様な物体に関する識別といった識別が困難な場合においても、バッグが2つ以上のポジティブインスタンスを含む確率という評価尺度である尤度を最大化することで、バッグ同士で共通した特徴を使った弱識別器が選択されやすい。
【0065】
<第2の実施の形態>
本発明の第2の実施の形態における学習システムは、バッグ確率計算部が、特定の条件を満たすバッグ確率を計算する条件付バッグ確率計算部である点が、第1の実施の形態における学習システムと異なる。
【0066】
図8は、本発明の第2の実施の形態における学習システム11の機能構成を示すブロック図である。図8に示すように、学習システム11は、学習装置101と記憶装置200とを含む。
【0067】
学習装置101は、第1の実施の形態における学習システム10の学習装置100とほぼ同じ構成であるが、バッグ確率計算部140が、特定の条件を満たすバッグ確率を計算する条件付バッグ確率計算部141である点が異なる。記憶装置200は、第1の実施の形態における学習システム10の記憶装置200と同じ構成である。
【0068】
条件付バッグ確率計算部141は、インスタンス確率計算部130で計算された、1つのバッグ中のインスタンス全ての確率の値から、バッグがポジティブである確率を計算する。ただし、本実施の形態において「バッグがポジティブである」とは、バッグ中のインスタンスのうち特定の条件を満たす2つ以上のインスタンスがポジティブインスタンスであること、である。また、特定の条件とは、インスタンスに対応した画像テンプレートの位置・サイズ・回転角に関する摂動の程度が近いこと、である。
【0069】
図9、及び図10を参照して「摂動の程度が近いこと」について詳しく説明する。図9は、「位置に関して摂動の程度が近いこと」を説明するための図である。図10は、「スケール・回転角に関して摂動の程度が近いこと」を説明するための図である。図9、及び図10に示すように、「摂動の程度が近い」とは、例えば、図9と図10において太枠で囲まれた隣接した2つの画像テンプレートの関係に相当する。このように、本実施の形態では摂動の程度が近い2つのインスタンスが同時にポジティブインスタンスであることを「バッグがポジティブである」と定義する。
【0070】
次に、本発明の第2の実施の形態における「バッグラベル」の定義について説明する。図11は、本発明の第2の実施の形態におけるポジティブバッグとネガティブバッグの概念図である。図11において、3は摂動の程度が近いポジティブインスタンスの例である。また、4は摂動の程度が近くないポジティブインスタンスの例である。
【0071】
図11に示すように、本発明の第2の実施の形態では、バッグの中にポジティブインスタンスが2つ以上存在し、そのポジティブインスタンスに対応した画像テンプレートの摂動の程度が近い場合に、そのバッグを「ポジティブバッグ」と呼ぶ。バッグの中のポジティブインスタンスが2つ以上存在しても、摂動の程度が近くない場合は、そのバッグを「ネガティブバッグ」と呼ぶ。
【0072】
図12は、摂動の程度とインスタンスがポジティブである確率との関係を説明するための図である。図12に示すように、実際に学習処理するバッグは、摂動させた画像テンプレートのみで構成されるため、摂動が粗くなければ、殆ど正確な位置・サイズ・回転角のテンプレートが必ず複数存在し、しかもそれらテンプレート同士は摂動の程度が近い、という性質がある。図12において、縦軸は「インスタンスがポジティブである確率」を示す。また、横軸は「摂動の程度」を示す。
【0073】
条件付バッグ確率計算部141は、上記の性質に基づき、バッグ内に含まれる2つ以上のポジティブインスタンスが、摂動の程度が近い2つ以上のインスタンスである確率(条件付バッグ確率)を計算する。
【0074】
条件付バッグ確率計算部141は、式6によって条件付バッグ確率を計算しても良い。
【0075】
【数8】
Figure 2012032889
ただし、
【0076】
【数9】
Figure 2012032889
式6において、右辺の大括弧内の第3項Rは摂動の程度が近くない2つのインスタンスがポジティブインスタンスである確率である。つまり、式6におけるPiは、摂動の程度が近い2つのポジティブインスタンスが1組以上存在する確率を表していると言える。Rは、摂動の程度が近くない2つのインスタンスがポジティブインスタンスである確率を表すものであれば、どのような式で表しても良い。
【0077】
本実施の形態において、尤度計算部150は、バッグラベル記憶部220が保持するバッグラベルに基づいて、条件付バッグ確率計算部141で計算された、学習に用いる複数のバッグのバッグ確率の尤もらしさを表す尤度Lを計算する。
【0078】
次に、図8、及び図13の流れ図を参照して学習システム11の全体の動作について詳細に説明する。
【0079】
図13は、本発明の第2の実施の形態における学習システム11の動作を示す流れ図である。図13に示すように、学習システム11の動作は、学習システム10の動作とほぼ同じであるが、図7のステップS140における動作が、ステップS141(条件付バッグ確率計算ステップ)である点が異なる。
【0080】
学習システム11は、ステップ140の動作の代わりに、条件付バッグ確率計算部141が、バッグがポジティブである確率を計算する。つまり、条件付バッグ確率計算部141は、バッグ内の摂動の程度が近い2つのインスタンスがポジティブインスタンスである確率を、例えば式6に基づいて計算する[条件付バッグ確率計算ステップ(ステップS141)]。
【0081】
学習システム11における尤度算出ステップS150では、尤度計算部150が、ステップS141までで計算された学習処理に用いる全てのバッグに関する確率と、バッグラベル記憶部220に記憶されたバッグラベルに基づいて、計算された確率の尤もらしさLを計算する。
【0082】
以上説明したように、本発明の第2の実施の形態における学習システム11は、1つのバッグの中のインスタンスのうち摂動の程度が近い2つがポジティブインスタンスである確率を計算する。つまり学習システム11は、1つのバッグに対応する摂動された画像テンプレート群のうち摂動の程度が近い2つの画像テンプレートの位置・サイズ・回転角が正しい確率(条件付バッグ確率)を計算する。学習システム11は、計算した条件付バッグ確率に基づいて学習処理するように構成されているため、見えの変動が多様な物体であっても高い識別精度を得ることが可能な学習ができる。
【0083】
なぜならば、ポジティブバッグは、摂動させた画像テンプレートのみで構成されるため、摂動が粗くなければ、殆ど正確な位置・サイズ・回転角のテンプレートが摂動の程度が近い範囲内に必ず複数存在するためである。そのため、本発明の第2の実施の形態における学習システム11によれば、見えの変動が多様な物体に関する識別といった識別が困難な場合においても、バッグが摂動の程度が近い2つ以上のポジティブインスタンスを含む確率という評価尺度である尤度を最大化することで、バッグ同士で共通した特徴を使った弱識別器が選択されやすい。
【0084】
<第3の実施の形態>
本発明の第3の実施の形態は、第1又は第2の実施の形態における学習システムで学習したパラメータを用いて物体の識別処理を行う識別システム20である。
【0085】
図14は、本発明の第3の実施の形態における識別システムと学習システムとの関係の機能構成を示すブロック図である。図14に示すように、識別システム20は、学習システム10又は11が含む記憶装置200と、識別装置300と、を含む。学習システム10又は11については、第1又は第2の実施の形態と同様の構成であるため説明を省略する。また、図14に示すように、識別システム20を含むシステム全体を学習システム30としても良い。
【0086】
識別装置300は特徴量抽出手部310と識別部320とを含む。
【0087】
特徴量抽出部310は、識別の対象となる画像から特徴量を抽出する。
【0088】
識別部320は、特徴量抽出部310が抽出した特徴量について、パラメータ記憶部230から読み出したパラメータに基づいて画像中の物体を識別する。
【0089】
次に、図14、及び図15の流れ図を参照して、識別システム20の動作について説明する。
【0090】
図15は、識別システム20の動作を示す流れ図である。図15に示すように、まずユーザは、識別したい画像を特徴量抽出部310に入力する。特徴量抽出部310は、入力された識別の対象となる画像から特徴量を抽出する[特徴量抽出ステップ(ステップS310)]。
【0091】
特徴量抽出部310は、上記の学習システム10又は11の特徴量記憶部210に記憶される特徴量と同じ方式で計算した特徴量を抽出する。ただし、弱識別器選択部160において、選択された弱識別器が必要とする特徴量のみを抽出しても良い。特徴量抽出部310は、どの特徴量が必要かどうかの情報をパラメータ記憶部230から読み出す。
【0092】
次に、識別部320は、特徴量抽出手部310で抽出した特徴量について、パラメータ記憶部230から読み出したパラメータに基づいて画像中の物体の種類を識別する[識別ステップ(ステップS320)]。
【0093】
この物体の種類を識別する方式は、学習システム10又は11で採用した手法にあわせれば良い。例えば、特許文献1はLVQの一種である。この手法を学習に採用した場合、識別部320は、特徴量をベクトルとして考え、所定の次元数の特徴量を用いて、識別のパラメータである代表ベクトル(参照ベクトルとも呼ぶ)との識別を実行すれば良い。
【0094】
以上説明したように、本発明の識別システム20によれば、学習システム10又は11で学習したパラメータを用いることで、見えの変動が多様な物体であっても高い識別精度で識別することができる。
【0095】
<第4の実施の形態>
図16は、第4の実施の形態における本発明に係る学習装置102の機能構成を示すブロック図である。図16に示すように、学習装置102は、弱識別器生成部110と、弱識別部120と、インスタンス確率計算部130と、バッグ確率計算部140と、尤度計算部150と、を含む。
【0096】
弱識別器生成部110は、対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成する。
【0097】
複数のバッグから抽出した特徴量とバッグラベルは、図16には図示しない記憶装置が保持していても良い。その場合、弱識別器生成部110は、適宜図示しない記憶装置から特徴量とバッグラベルを読み出して、弱識別器を生成しても良い。
【0098】
弱識別部120は、弱識別器生成部110によって生成された弱識別器に基づいて識別スコアを計算する。
【0099】
インスタンス確率計算部130は、弱識別部120によって計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算する。
【0100】
バッグ確率計算部140は、インスタンス確率計算部130で計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算する。
【0101】
尤度計算部150は、バッグ確率計算部140で計算されたバッグ確率の尤もらしさを表す尤度を、バッグラベルに基づいて計算する。バッグラベルは、16には図示しない記憶装置が保持していても良い。その場合、尤度計算部150は、適宜図示しない記憶装置からバッグラベルを読み出して、尤度を計算しても良い。
【0102】
次に、図16、及び図17の流れ図を参照して、学習装置102の動作について説明する。
【0103】
図17は、第4の実施の形態における学習装置102の動作を示す流れ図である。図17に示すように、まず弱識別器生成部110は、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて、弱識別器を1つ生成する[弱識別器生成ステップ(ステップS110)]。
【0104】
次に、弱識別部120は、1つのインスタンスについて弱識別行い、識別スコアを得る[弱識別実行ステップ(ステップS120)]。
【0105】
次に、インスタンス確率計算部130は、インスタンスがポジティブインスタンスである確率、つまり位置、サイズ、および回転角が正確である対象物体のインスタンスである確率(インスタンス確率)を算出する[インスタンス確率計算ステップ(ステップS130)]。
【0106】
なお、ステップS120とステップS130は、1つのバッグ内の全てのインスタンス分だけ繰り返し実行される。
【0107】
次に、バッグ確率計算部140は、バッグがポジティブである確率、つまりバッグ中のインスタンスのうち2つ以上がポジティブインスタンスである確率(バッグ確率)を、例えば式4に基づいて計算する[バッグ確率計算ステップ(ステップS140)]。
【0108】
なお、ステップS120からS140までの処理は、全てのバッグ個数分だけ繰り返し実行される。
【0109】
次に、尤度計算部150は、ステップS140までで計算された学習処理に用いる全てのバッグに関する確率と、バッグラベルとに基づいて、計算された確率の尤もらしさ(尤度)Lを計算する[尤度計算ステップ(ステップS150)]。
【0110】
なお、ステップS110からステップS150までの処理は、弱識別器生成ステップで生成された全ての弱識別器候補について繰り返し実行される。
【0111】
その後、学習装置102は、尤度計算ステップで計算された尤度に基づいて弱識別器を選択し、該弱識別器に関するパラメータを図示しない記憶装置に記憶しても良い。
【0112】
以上説明したように、本発明の学習装置102によれば、見えの変動が多様な物体であっても高い識別精度を得ることが可能な学習ができる。
【0113】
<実施例>
次に、本発明の第1の実施の形態の具体的な実施例を説明する。以下、人物の頭部を識別対象とする例について説明する。
【0114】
本実施例では、統計的パターン認識手法として、特許文献1に記載されている手法を用いる。以下、この手法を「カスケード型GLVQ(カスケード型一般化学習ベクトル量子化)」と表記する。
【0115】
まず、具体的な構成や動作の説明の前に、カスケード型GLVQについて簡潔に説明する。カスケード型に限らずLVQによる手法では、識別したいクラス毎に参照ベクトルと呼ばれる代表ベクトルを用意し、学習処理によって識別に適した参照ベクトルを求める。
【0116】
ここでは、特に、特徴量パターンをD次元ベクトルとした場合について説明する。カスケード型GLVQの学習処理では、まず、ある1次元に着目し、その次元の値のみを使って1次元の参照ベクトルを学習する。この処理をすべての次元分だけ実行することで、1次元の参照ベクトルがD個求まる。そして、1次元参照ベクトルの中で最も識別に向くベクトルを選択する。次に、選択済みの次元と未選択の次元のある1次元に着目し、2次元の参照ベクトルを学習する。そして、1次元目と同様の手順により、2次元の参照ベクトルの中で最も識別に向くベクトルを選択する。このような処理を3次元目以降も繰り返すことで、最終的にD次元の参照ベクトルが求まる。
【0117】
なお、カスケード型GLVQの識別処理では、入力された特徴量パターンと参照ベクトルとの距離を計算し、最も近い参照ベクトルが属するクラスに識別される。
【0118】
次に、本実施例の具体的な構成を説明する。
【0119】
学習システム10の構成図である図5において、学習装置100としてパーソナルコンピュータ、記憶装置200として半導体メモリを用いる。この場合、特徴量記憶部210とバッグラベル記憶部220、パラメータ記憶部230は半導体メモリ上の一部とみなせる。一方、弱識別器生成部110、弱識別部120、インスタンス確率計算部130、バッグ確率計算部140、尤度計算部150、弱識別器選択部160は、パーソナルコンピュータのCPU上で実現できる。
【0120】
なお、特徴量記憶部210は、事前に、位置・スケール・回転角に関して摂動させた頭部画像テンプレートについて特徴量を抽出したデータ(ポジティブインスタンス)と、物体でない画像テンプレートについて特徴量を抽出したデータ(ネガティブインスタンス)とを保持する(図2、図3参照)。これらのデータを用意するのに、位置・スケール・回転角に関して正確な情報は必要ない。
【0121】
また、バッグラベル記憶部220は、事前に、特徴量記憶部210に記憶されているインスタンスで構成されるバッグの情報として、各バッグがポジティブであるかネガティブであるかという情報(バッグラベル)を保持する。
【0122】
次に本実施例の動作を説明する。
【0123】
まず、学習システム10は、図7のステップS110に相当する動作を実行する。ステップS110において、弱識別器生成部110は、特徴量記憶部210に記憶されたD次元特徴量のうちある1次元のみに着目した弱識別器を生成する。弱識別器を生成する動作は、カスケード型GLVQにおける1次元分の識別器(1次元の参照ベクトル群)を学習する動作に相当する。
【0124】
次に、学習システム10は、ステップS120に相当する動作を実行する。ステップS120において、弱識別部120は、S110で生成された弱識別器による弱識別として、カスケード型GLVQにおける1次元分の識別処理を行い、識別スコアを計算する。カスケード型GLVQでは、識別スコアとして実数値が出力される。
【0125】
次に、学習システム10は、ステップS130に相当する動作を実行する。ステップS130において、インスタンス確率計算部130は、式3によって識別スコアからインスタンス確率を計算する。式3の係数αとβについては、例えば、それぞれ1としても良い。なお、学習システム10は、ステップS120とS130との動作を、1つのバッグ内の全てのインスタンス分だけ繰り返し実行する。
【0126】
次に、学習システム10は、ステップS140に相当する動作を実行する。ステップS140において、バッグ確率計算部140は、式4に基づいてバッグがポジティブである確率を計算する。これにより求まる値は、具体的には、バッグの中に正確に切出された頭部画像テンプレートが2つ以上ある確率である。なお、学習システム10は、ステップS120からS140までの動作を、全てのバッグ個数分だけ繰り返し実行する。
【0127】
次に、学習システム10は、ステップS150に相当する動作を実行する。ステップS150において、尤度計算部150は、式5に基づいて尤度を計算する。ただし、計算途中の値が微小な数値になり、数値計算上不安定になる場合があるため、本実施例においては、尤度計算部150は、式5の尤度Lの対数Log(L)を計算する。なお、学習システム10は、ステップS110からS150までの動作を、全ての弱識別器候補の数Dから選択済みの候補数を引いた回数だけ繰り返し実行する。
【0128】
次に、学習システム10は、ステップS160に相当する動作を実行する。ステップS160において、弱識別器選択部160は、最も高い尤度となる弱識別器を選択し、選択した弱識別器に関するパラメータを、パラメータ記憶部230に記録する。記録するパラメータは、弱識別に使う特徴量次元の番号、カスケード型GLVQの参照ベクトル、弱識別したスコアの閾値である。なお、ステップS110からS160までの処理は所定の回数、例えばD回実行する。
【0129】
以上の動作により、パラメータ記憶部230に学習処理の結果としてのパラメータが保持される。
【0130】
<実施の形態の他の表現>
上記の各実施の形態においては、以下に示すような学習装置、学習システム、学習方法、学習プログラム及び識別装置の特徴的構成が示されている(以下のように限定されるわけではない)。なお、本発明の学習プログラムは、コンピュータに、図7、図13、図15、又は図17に示した各ステップを実行させるプログラムであって、各実施の形態で説明した各ステップの動作を実行させるプログラムであれば良い。
(付記1)
対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成する弱識別器生成手段と、
前記弱識別器生成手段によって生成された弱識別器に基づいて前記識別スコアを計算する弱識別手段と、
前記弱識別手段によって計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算するインスタンス確率計算手段と、
前記インスタンス確率計算手段で計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算するバッグ確率計算手段と、
前記バッグ確率計算手段で計算されたバッグ確率の尤もらしさを表す尤度を、前記バッグラベルに基づいて計算する尤度計算手段と、
を含む学習装置。
(付記2)
前記正確な対象物体のインスタンスは、位置、サイズ、および回転角が正確である対象物体のインスタンスである、
付記1に記載の学習装置。
(付記3)
前記バッグ確率計算手段は、バッグ内に含まれる2つ以上のポジティブインスタンスが、摂動の程度が近い2つ以上のインスタンスである確率(条件付バッグ確率)を計算する条件付バッグ確率計算手段である、
付記1又は2に記載の学習装置。
(付記4)
付記1〜3のいずれかに記載の学習装置と記憶装置とを含む学習システムであって、
前記記憶装置は、
正確な対象物体のインスタンス(ポジティブインスタンス)を2つ以上含む、対象物体のインスタンスについて摂動させた多数のインスタンスの集合(ポジティブバッグ)と、ポジティブバッグではないインスタンスの集合(ネガティブバッグ)とに関する、複数のバッグから抽出した特徴量を保持する特徴量記憶手段と、
各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルを保持するバッグラベル記憶手段と、
を含み
前記学習装置において、
前記弱識別器生成手段は、前記弱識別器を、前記特徴量記憶手段の保持する特徴量と前記バッグラベル記憶手段の保持するバッグラベルとに基づいて生成し、
前記尤度計算手段は、前記尤度を、前記バッグラベル記憶手段が保持するバッグラベルに基づいて、学習に用いる複数のバッグを対象に計算し、
前記学習装置は、前記尤度計算手段で計算された尤度に基づいて弱識別器を選択する弱識別器選択手段をさらに含み、
前記記憶装置は、前記弱識別器選択手段で選択された弱識別器に関するパラメータを記憶するパラメータ記憶手段をさらに含む、
学習システム。
(付記5)
識別の対象となる画像から特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段が抽出した特徴量について、前記パラメータ記憶手段が記憶する前記パラメータに基づいて前記画像中の物体を識別する識別手段と、
を含む付記4に記載の学習システム。
(付記6)
対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、
前記生成された弱識別器に基づいて前記識別スコアを計算し、
前記計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、
前記計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、
前記計算されたバッグ確率の尤もらしさを表す尤度を、前記バッグラベルに基づいて計算する、
学習方法。
(付記7)
前記正確な対象物体のインスタンスは、位置、サイズ、および回転角が正確である対象物体のインスタンスである、
付記6に記載の学習方法。
(付記8)
前記バッグ確率は、バッグ内に含まれる2つ以上のポジティブインスタンスが、摂動の程度が近い2つ以上のインスタンスである確率(条件付バッグ確率)である、
付記6又は7に記載の学習方法。
(付記9)
対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、
前記生成された弱識別器に基づいて前記識別スコアを計算し、
前記計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、
前記計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、
前記計算されたバッグ確率の尤もらしさを表す尤度を、前記バッグラベルに基づいて計算する、
処理をコンピュータに実行させる学習プログラム
(付記10)
前記正確な対象物体のインスタンスは、位置、サイズ、および回転角が正確である対象物体のインスタンスである、
付記9に記載の学習プログラム
(付記11)
前記バッグ確率は、バッグ内に含まれる2つ以上のポジティブインスタンスが、摂動の程度が近い2つ以上のインスタンスである確率(条件付バッグ確率)である、
付記9又は10に記載の学習プログラム
【0131】
以上、実施の形態を参照して本願発明を説明したが、本願発明は以上の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で同業者が理解し得る様々な変更をすることができる。
【0132】
この出願は、2010年9月9日に出願された日本出願特願2010−201592を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【産業上の利用可能性】
【0133】
本発明の学習装置、学習システム、学習方法、及び学習プログラムは、カメラで撮影された画像について人物や自動車といった所望の物体に応じて分類する画像整理用途や、所望の物体を画像から検出して物体の状況を監視する自動監視用途等に適用できる。
【符号の説明】
【0134】
10 学習システム
11 学習システム
20 識別システム
30 学習システム
100 学習装置
101 学習装置
102 学習装置
110 弱識別器生成部
120 弱識別部
130 インスタンス確率計算部
140 バッグ確率計算部
141 条件付バッグ確率計算部
150 尤度計算部
160 弱識別器選択部
200 記憶装置
210 特徴量記憶部
220 バッグラベル記憶部
230 パラメータ記憶部
300 識別装置
310 特徴量抽出部
320 識別部


Claims (7)

  1. 対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成する弱識別器生成手段と、
    前記弱識別器生成手段によって生成された弱識別器に基づいて前記識別スコアを計算する弱識別手段と、
    前記弱識別手段によって計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算するインスタンス確率計算手段と、
    前記インスタンス確率計算手段で計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算するバッグ確率計算手段と、
    前記バッグ確率計算手段で計算されたバッグ確率の尤もらしさを表す尤度を、前記バッグラベルに基づいて計算する尤度計算手段と、
    を含む学習装置。
  2. 前記正確な対象物体のインスタンスは、位置、サイズ、および回転角が正確である対象物体のインスタンスである、
    請求項1に記載の学習装置。
  3. 前記バッグ確率計算手段は、バッグ内に含まれる2つ以上のポジティブインスタンスが、摂動の程度が近い2つ以上のインスタンスである確率(条件付バッグ確率)を計算する条件付バッグ確率計算手段である、
    請求項1又は2に記載の学習装置。
  4. 請求項1〜3のいずれかに記載の学習装置と記憶装置とを含む学習システムであって、
    前記記憶装置は、
    正確な対象物体のインスタンス(ポジティブインスタンス)を2つ以上含む、対象物体のインスタンスについて摂動させた多数のインスタンスの集合(ポジティブバッグ)と、ポジティブバッグではないインスタンスの集合(ネガティブバッグ)とに関する、複数のバッグから抽出した特徴量を保持する特徴量記憶手段と、
    各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルを保持するバッグラベル記憶手段と、
    を含み
    前記学習装置において、
    前記弱識別器生成手段は、前記弱識別器を、前記特徴量記憶手段の保持する特徴量と前記バッグラベル記憶手段の保持するバッグラベルとに基づいて生成し、
    前記尤度計算手段は、前記尤度を、前記バッグラベル記憶手段が保持するバッグラベルに基づいて、学習に用いる複数のバッグを対象に計算し、
    前記学習装置は、前記尤度計算手段で計算された尤度に基づいて弱識別器を選択する弱識別器選択手段をさらに含み、
    前記記憶装置は、前記弱識別器選択手段で選択された弱識別器に関するパラメータを記憶するパラメータ記憶手段をさらに含む、
    学習システム。
  5. 識別の対象となる画像から特徴量を抽出する特徴量抽出手段と、
    前記特徴量抽出手段が抽出した特徴量について、前記パラメータ記憶手段が記憶する前記パラメータに基づいて前記画像中の物体を識別する識別手段と、
    を含む請求項4に記載の学習システム。
  6. 対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、
    前記生成された弱識別器に基づいて前記識別スコアを計算し、
    前記計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、
    前記計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、
    前記計算されたバッグ確率の尤もらしさを表す尤度を、前記バッグラベルに基づいて計算する、
    学習方法。
  7. 対象のインスタンスがポジティブインスタンスであるか否かを示す識別スコアを計算する弱識別器を、複数のバッグから抽出した特徴量と各バッグがポジティブバッグかネガティブバッグかという情報であるバッグラベルとに基づいて生成し、
    前記生成された弱識別器に基づいて前記識別スコアを計算し、
    前記計算された識別スコアに基づいて対象のインスタンスが正確な対象物体のインスタンス(ポジティブインスタンス)である確率(インスタンス確率)を計算し、
    前記計算されたインスタンス確率に基づいて、ポジティブインスタンスがバッグ内に2つ以上含まれる確率(バッグ確率)を計算し、
    前記計算されたバッグ確率の尤もらしさを表す尤度を、前記バッグラベルに基づいて計算する、
    処理をコンピュータに実行させる学習プログラムを格納する記録媒体。
JP2012532912A 2010-09-09 2011-08-02 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム Expired - Fee Related JP5776694B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012532912A JP5776694B2 (ja) 2010-09-09 2011-08-02 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2010201592 2010-09-09
JP2010201592 2010-09-09
PCT/JP2011/068009 WO2012032889A1 (ja) 2010-09-09 2011-08-02 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム
JP2012532912A JP5776694B2 (ja) 2010-09-09 2011-08-02 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム

Publications (2)

Publication Number Publication Date
JPWO2012032889A1 true JPWO2012032889A1 (ja) 2014-01-20
JP5776694B2 JP5776694B2 (ja) 2015-09-09

Family

ID=45810492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012532912A Expired - Fee Related JP5776694B2 (ja) 2010-09-09 2011-08-02 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム

Country Status (3)

Country Link
US (1) US8965111B2 (ja)
JP (1) JP5776694B2 (ja)
WO (1) WO2012032889A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2013010977A (es) 2011-03-31 2013-10-30 Procter & Gamble Sistema, modelos y metodos para identificar y evaluar agentes dermoactivos eficaces para tratar la caspa/dermatitis seborreica.
EP2859486A2 (en) 2012-06-06 2015-04-15 The Procter & Gamble Company Systems and methods for identifying cosmetic agents for hair/scalp care compositions
JP6255296B2 (ja) * 2014-03-31 2017-12-27 セコム株式会社 対象識別装置
US9720981B1 (en) 2016-02-25 2017-08-01 International Business Machines Corporation Multiple instance machine learning for question answering systems
JP7223372B2 (ja) * 2019-07-30 2023-02-16 Kddi株式会社 学習装置、学習方法及び学習プログラム
CN112766161B (zh) * 2021-01-20 2022-12-02 西安电子科技大学 基于集成约束多示例学习的高光谱目标检测方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250773A (ja) 2004-03-03 2005-09-15 Fuji Photo Film Co Ltd 対象物識別装置および方法並びにプログラム
JP4640825B2 (ja) 2006-02-23 2011-03-02 富士フイルム株式会社 特定向き顔判定方法および装置並びにプログラム
US8233704B2 (en) * 2007-06-13 2012-07-31 Sri International Exemplar-based heterogeneous compositional method for object classification
US7890443B2 (en) * 2007-07-13 2011-02-15 Microsoft Corporation Learning classifiers using combined boosting and weight trimming
US20090198654A1 (en) * 2008-02-05 2009-08-06 Microsoft Corporation Detecting relevant content blocks in text
US8804005B2 (en) * 2008-04-29 2014-08-12 Microsoft Corporation Video concept detection using multi-layer multi-instance learning
US8015132B2 (en) * 2008-05-16 2011-09-06 Samsung Electronics Co., Ltd. System and method for object detection and classification with multiple threshold adaptive boosting
WO2010090189A1 (ja) 2009-02-03 2010-08-12 日本電気株式会社 パターン認識装置、パターン認識方法およびパターン認識プログラム
US8135221B2 (en) * 2009-10-07 2012-03-13 Eastman Kodak Company Video concept classification using audio-visual atoms
US8588519B2 (en) * 2010-09-22 2013-11-19 Siemens Aktiengesellschaft Method and system for training a landmark detector using multiple instance learning
US8649613B1 (en) * 2011-11-03 2014-02-11 Google Inc. Multiple-instance-learning-based video classification

Also Published As

Publication number Publication date
US20130170739A1 (en) 2013-07-04
JP5776694B2 (ja) 2015-09-09
WO2012032889A1 (ja) 2012-03-15
US8965111B2 (en) 2015-02-24

Similar Documents

Publication Publication Date Title
CN109934293B (zh) 图像识别方法、装置、介质及混淆感知卷积神经网络
JP6498107B2 (ja) 分類装置、方法、及びプログラム
JP5776694B2 (ja) 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム
CN110210513B (zh) 数据分类方法、装置及终端设备
US20130251246A1 (en) Method and a device for training a pose classifier and an object classifier, a method and a device for object detection
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
JP2004054956A (ja) 顔/類似顔映像で学習されたパターン分類器を利用した顔検出方法及びシステム
CN110069129B (zh) 确定系统和确定方法
JP2017102906A (ja) 情報処理装置、情報処理方法及びプログラム
JP5214679B2 (ja) 学習装置、方法及びプログラム
WO2021051530A1 (zh) 检测异常邮件的方法、装置、设备和存储介质
CN113128550A (zh) 用于数据有效的主动机器学习的设备和计算机实现的方法
JP2020042519A (ja) 異常検知装置、異常検知方法、及び異常検知プログラム
JP2013117861A (ja) 学習装置、学習方法およびプログラム
CN116872961B (zh) 用于智能驾驶车辆的控制系统
CN112597997A (zh) 感兴趣区域确定方法、图像内容识别方法及装置
CN116579616A (zh) 一种基于深度学习的风险识别方法
KR101590896B1 (ko) 일반화 성능을 갖는 심화학습 장치 및 방법, 그 방법을 수행하기 위한 기록 매체 및 장치
CN114422450B (zh) 基于多源网络流量数据的网络流量分析方法和装置
CN113706580B (zh) 一种基于相关滤波跟踪器的目标跟踪方法、系统、设备及介质
CN114495265B (zh) 多跨域场景下基于活动图加权的人体行为识别方法
JP2017033175A (ja) 画像処理装置、画像処理方法及びプログラム
JP2016062249A (ja) 識別辞書学習システム、認識辞書学習方法および認識辞書学習プログラム
CN114842183A (zh) 一种基于卷积神经网络的开关状态识别方法和系统
CN110555342B (zh) 一种图像识别方法、装置和图像设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150622

R150 Certificate of patent or registration of utility model

Ref document number: 5776694

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees