JP5719145B2 - 情報処理装置、その処理方法及びプログラム - Google Patents
情報処理装置、その処理方法及びプログラム Download PDFInfo
- Publication number
- JP5719145B2 JP5719145B2 JP2010246747A JP2010246747A JP5719145B2 JP 5719145 B2 JP5719145 B2 JP 5719145B2 JP 2010246747 A JP2010246747 A JP 2010246747A JP 2010246747 A JP2010246747 A JP 2010246747A JP 5719145 B2 JP5719145 B2 JP 5719145B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- learning
- query
- pattern
- learning pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Description
ノードに分配された学習パターンに対して実行するクエリを該ノードに対応して作成する作成手段と、
前記ノードに分配された学習パターンに対して該ノードに対応して作成されたクエリを実行し、該クエリの実行結果に基づいて個々の学習パターンを該ノードよりも下位のノードへ分配する分配手段と、
前記ノードにおける前記学習パターンの分配に際して、前記ノードよりも上位のノードにおけるクエリの実行時に前記学習パターンに含まれる前記対象物体が存在する領域が参照されたか否かを示す履歴を集計した履歴情報に基づいて、前記ノードに対するクエリが有効に実行されたか否かを判定する判定手段と
を具備し、
前記分配手段は、
前記クエリが有効に実行されたと判定された学習パターンを前記下位のノードに分配し、前記クエリが有効に実行されなかったと判定された学習パターンを削除する
ことを特徴とする。
図1は、本発明の一実施の形態に係わる情報処理装置10の構成の一例を示す図である。
この場合、従来の分類木では、P=C1∪C2且つC1∩C2=φとなる。
この処理が始まると、情報処理装置10は、学習部21において、まず、ルートノードに学習パターンの全てを格納する(S101)。ここで、図3(a)及び図3(b)を用いて、学習パターンの一例について説明する。図3(a)は、前処理を行なう前の生の学習パターンを示しており、図3(b)は、当該生の学習パターンから背景を削除した学習パターンを示している。
このような学習パターンの格納が済むと、情報処理装置10は、学習部21において、ルートノードをカレントノードとして設定する(S102)。ルートノードとは、木構造(ツリー)の一番根元に存在するノードのことを指し、図4に示す41のノードを指す。カレントノードとは、学習処理及び認識処理において現在処理しているノードを示す。
情報処理装置10は、学習部21において、詳細については後述するが、カレントノードを展開するため、図2(b)に示すサブルーチン(カレントノードの展開処理)を呼び出す(S103)。そして、当該サブルーチンの処理が終われば、学習処理は終了する。なお、図4に示す符号41から49の順番に従ってカレントノードは移動することとなる。
この処理が始まると、情報処理装置10は、学習部21において、まず、カレントノードがターミナルノードであるか否かの判定を行なう。ターミナルノードとは、nullノード及びleafノードのいずれかのノードを指す。nullノードは、学習パターンが全く含まれないノードであり、leafノードは、残っている学習パターンの集合が所定条件を満たすノードである。所定条件としては、例えば、「カレントノードに存在するクラス(識別するべきパターン)がK種類(例えば、K=10)以下である」等が挙げられる。この場合、K=1であれば、「カレントノードが純粋に1つのクラスしか含まない」という条件となる。また、これ以外にも、例えば、「カレントノードに存在する学習パターンから情報量エントロピーを計算し、その値が所定閾値以下である」等を所定条件としても良い。なお、この条件で閾値を0にすれば、上述の「カレントノードが純粋に1つのクラスしか含まない」と同じ条件となる。ここで、例えば、パターン認識の目的がクラス判定であれば、ターミナルノードには、各クラスの存在確率が保持される。上述した通り、leafノードの条件が「カレントノードが純粋に1つのクラスしか含まれない」であれば、ターミナルノードには、その残ったクラスの番号が格納される。一方、パターン認識の目的がいわゆる回帰の場合、ターミナルノードには、ある推定値、又は推定ベクトルが格納される。
ここで、情報処理装置10は、カレントノードの展開に先立って、まず、クエリ作成部23において、当該カレントノードで実行するクエリを作成する(S202)。クエリ作成処理は、例えば、カレントノードに残っている学習パターンの集合(カレントノードにおける学習パターンの集合)を用いて行なわれる。非特許文献1に記載されるように、Gini係数を用いてクエリの効率を測定し、最も効率の高いクエリを選択することによりクエリを作成しても良い。また、特許文献1や非特許文献2に記載されるように、ランダムに次元や画像内の参照点を選択し、その次元や参照点の値に基づく判定を行なうことによりクエリを作成するようにしても良い。比較的単純なクエリとしては、画像(又は特徴ベクトル)上の2点(2つの次元)を選び、その値の大小を比較することによって2つの枝(ノード)に分配するクエリが考えられる。以下、このタイプのクエリを想定して説明する。
クエリの作成が済むと、情報処理装置10は、分配部24において、当該クエリに基づいてカレントパターン集合(カレントノードに残っている学習パターン)を枝(ノード)に分配する(S203)。この分配の数(R)は、ノードによって異なるようにしても良いが、一般に、全てのノードで同じ値を用いる。このS203の処理においては、例えば、分配数がR=2の場合には、いわゆる2分木が作成され、図4に示す形態の分類木が得られる。なお、S203の処理における分配処理の詳細については後述する。
S204〜S207の処理においては、分配された枝毎に処理が行なわれる。具体的には、i番目の枝(ノード)をカレントノードに設定し(S205)、図1(b)に示すサブルーチンを再帰呼び出しする(S206)。この処理は、変数iが分配数(R)に達するまで繰り返し行なわれる。
カレントノードに残っている学習パターンの集合がn個の学習パターンで構成されているとする。この場合、情報処理装置10は、学習部21において、S302〜S305の処理(学習パターンiのループ)をn回実行する。このループ処理では、情報処理装置10は、判定部25において、個々の学習パターンiが適正であるか否かの判定を行なう(S302)。判定の結果、学習パターンiが適正であれば(S303でYES)、情報処理装置10は、分配部24において、学習パターンiをクエリに基づいて枝(ノード)に振り分ける(S304)。また、情報処理装置10は、分配部24において、学習パターンiが不適正であれば(S303でNO)、当該学習パターンiを削除する(S305)。
情報処理装置10は、認識部22において、まず、カレントノードをルートノードに設定する(S401)。次に、情報処理装置10は、認識部22において、カレントノードがターミナルノード(nullノード又はleafノード)であるか否かの判定を行なう。カレントノードがターミナルノードであれば(S402でYES)、情報処理装置10は、認識部22において、そのターミナルノードの情報を認識結果としてセットし、この処理を終了する。
一方、カレントノードがターミナルノードでなければ(S402でNO)、情報処理装置10は、認識部22において、カレントノードに格納されているクエリに基づいて枝番号(ノード番号)を算出する(S403)。そして、算出された枝番号の子ノードをカレントノードに設定した後(S404)、再度、S402の判定処理に戻る。なお、この処理では、ルートノードからターミナルノード(nullノード又はleafノード)に到達するまで木構造を辿ることになる。
次に、実施形態2について説明する。実施形態1においては、木構造の辞書を作成する過程(学習処理)において学習パターンが適正条件を満たさない場合には該当する学習パターンを削除していた。これに対して、実施形態2においては、学習パターンが適正条件を満たさない場合には、該当の学習パターンを全ての子ノードに冗長に分配する場合について説明する。なお、実施形態2に係わる情報処理装置10の構成や、全体的な動作については、実施形態1と同様であるため、その説明については省略し、ここでは相違点について重点的に説明する。
次に、実施形態3について説明する。実施形態1においては、1つの木構造の辞書(又は木構造の判別器)を作成し、当該1つの木構造の辞書等を用いてパターンを解析する場合について説明した。これに対して、実施形態3においては、複数の木構造の辞書(又は木構造の判別器)を作成し、当該複数の木構造の辞書等を用いてパターンを解析する場合について説明する。なお、ここでは、複数の木構造の判別器を作成し使用する場合を例に挙げて説明する。
次に、実施形態4について説明する。実施形態4においては、学習パターンとして画像を用いる場合について説明する。ここでは、まず、図10を用いて、実施形態4に係わる処理の概要について説明する。
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (8)
- パターン認識の対象となる対象物体が含まれる学習パターンの集合をルートノードに設定し、該設定した学習パターンの集合に含まれる個々の学習パターンを各ノードに分配していくことにより木構造の辞書を作成する情報処理装置であって、
ノードに分配された学習パターンに対して実行するクエリを該ノードに対応して作成する作成手段と、
前記ノードに分配された学習パターンに対して該ノードに対応して作成されたクエリを実行し、該クエリの実行結果に基づいて個々の学習パターンを該ノードよりも下位のノードへ分配する分配手段と、
前記ノードにおける前記学習パターンの分配に際して、前記ノードよりも上位のノードにおけるクエリの実行時に前記学習パターンに含まれる前記対象物体が存在する領域が参照されたか否かを示す履歴を集計した履歴情報に基づいて、前記ノードに対するクエリが有効に実行されたか否かを判定する判定手段と
を具備し、
前記分配手段は、
前記クエリが有効に実行されたと判定された学習パターンを前記下位のノードに分配し、前記クエリが有効に実行されなかったと判定された学習パターンを削除する
ことを特徴とする情報処理装置。 - パターン認識の対象となる対象物体が含まれる学習パターンの集合をルートノードに設定し、該設定した学習パターンの集合に含まれる個々の学習パターンを各ノードに分配していくことにより木構造の辞書を作成する情報処理装置であって、
ノードに分配された学習パターンに対して実行するクエリを該ノードに対応して作成する作成手段と、
前記ノードに分配された学習パターンに対して該ノードに対応して作成されたクエリを実行し、該クエリの実行結果に基づいて個々の学習パターンを該ノードよりも下位の複数のノードへ分配する分配手段と、
前記ノードにおける前記学習パターンの分配に際して、前記ノードよりも上位のノードにおけるクエリの実行時に前記学習パターンに含まれる前記対象物体が存在する領域が参照されたか否かを示す履歴を集計した履歴情報に基づいて、前記ノードに対するクエリが有効に実行されたか否かを判定する判定手段と
を具備し、
前記分配手段は、
前記クエリが有効に実行されたと判定された学習パターンを前記複数の下位のノードのいずれかに分配するとともに、前記クエリが有効に実行されなかったと判定された学習パターンを前記複数の下位のノードの全てに分配する
ことを特徴とする情報処理装置。 - 前記学習パターンは画像であり、
前記クエリは、前記画像内の複数の画素の画素値を比較するクエリである
ことを特徴とする請求項1又は2記載の情報処理装置。 - 前記判定手段は、前記ノードおよび該ノードよりも上位のノードにおいて前記学習パターンに含まれる前記対象物体が存在する領域が参照されたか否かを集計することで得られる該参照の割合が閾値以上の場合には、前記ノードに対するクエリが有効に実行されたと判定することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
- 前記パターン認識の対象となるパターンの集合をルートノードに設定し、前記木構造の辞書を辿りながら各ノードに対応して作成されたクエリを実行することによりパターンの認識を行なう認識手段
を更に具備することを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。 - パターン認識の対象となる対象物体が含まれる学習パターンの集合をルートノードに設定し、該設定した学習パターンの集合に含まれる個々の学習パターンを各ノードに分配していくことにより木構造の辞書を作成する情報処理装置の処理方法であって、
作成手段が、ノードに分配された学習パターンに対して実行するクエリを該ノードに対応して作成する工程と、
分配手段が、前記ノードに分配された学習パターンに対して該ノードに対応して作成されたクエリを実行し、該クエリの実行結果に基づいて個々の学習パターンを該ノードよりも下位のノードへ分配する工程と、
判定手段が、前記ノードにおける前記学習パターンの分配に際して、前記ノードよりも上位のノードにおけるクエリの実行時に前記学習パターンに含まれる前記対象物体が存在する領域が参照されたか否かを示す履歴を集計した履歴情報に基づいて、前記ノードに対するクエリが有効に実行されたか否かを判定する工程と
を含み、
前記分配手段は、
前記クエリが有効に実行されたと判定された学習パターンを前記下位のノードに分配し、前記クエリが有効に実行されなかったと判定された学習パターンを削除する
ことを特徴とする情報処理装置の処理方法。 - パターン認識の対象となる対象物体が含まれる学習パターンの集合をルートノードに設定し、該設定した学習パターンの集合に含まれる個々の学習パターンを各ノードに分配していくことにより木構造の辞書を作成する情報処理装置の処理方法であって、
作成手段が、ノードに分配された学習パターンに対して実行するクエリを該ノードに対応して作成する工程と、
分配手段が、前記ノードに分配された学習パターンに対して該ノードに対応して作成されたクエリを実行し、該クエリの実行結果に基づいて個々の学習パターンを該ノードよりも下位の複数のノードへ分配する工程と、
判定手段が、前記ノードにおける前記学習パターンの分配に際して、前記ノードよりも上位のノードにおけるクエリの実行時に前記学習パターンに含まれる前記対象物体が存在する領域が参照されたか否かを示す履歴を集計した履歴情報に基づいて、前記ノードに対するクエリが有効に実行されたか否かを判定する工程と
を含み、
前記分配手段は、
前記クエリが有効に実行されたと判定された学習パターンを前記複数の下位のノードのいずれかに分配するとともに、前記クエリが有効に実行されなかったと判定された学習パターンを前記複数の下位のノードの全てに分配する
ことを特徴とする情報処理装置の処理方法。 - コンピュータを、請求項1乃至5の何れか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010246747A JP5719145B2 (ja) | 2010-11-02 | 2010-11-02 | 情報処理装置、その処理方法及びプログラム |
US13/281,115 US8930286B2 (en) | 2010-11-02 | 2011-10-25 | Information processing apparatus, processing method therefor, and non-transitory computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010246747A JP5719145B2 (ja) | 2010-11-02 | 2010-11-02 | 情報処理装置、その処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012098960A JP2012098960A (ja) | 2012-05-24 |
JP5719145B2 true JP5719145B2 (ja) | 2015-05-13 |
Family
ID=45997766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010246747A Expired - Fee Related JP5719145B2 (ja) | 2010-11-02 | 2010-11-02 | 情報処理装置、その処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8930286B2 (ja) |
JP (1) | JP5719145B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5538967B2 (ja) | 2009-06-18 | 2014-07-02 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP6053341B2 (ja) * | 2012-06-13 | 2016-12-27 | キヤノン株式会社 | 情報処理装置、その処理方法及びプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3466689B2 (ja) | 1994-01-26 | 2003-11-17 | キヤノン株式会社 | 手書き文字認識方法及びその装置 |
JP3453422B2 (ja) | 1994-02-10 | 2003-10-06 | キヤノン株式会社 | 文字パターンのユーザ辞書への登録方法及び該ユーザ辞書を有する文字認識装置 |
JP3416268B2 (ja) | 1994-06-30 | 2003-06-16 | キヤノン株式会社 | 画像認識装置及びその方法 |
JP3630734B2 (ja) | 1994-10-28 | 2005-03-23 | キヤノン株式会社 | 情報処理方法 |
JPH08249422A (ja) | 1995-03-08 | 1996-09-27 | Canon Inc | 文字処理装置及び方法 |
JP3792755B2 (ja) | 1995-08-29 | 2006-07-05 | キヤノン株式会社 | 文字認識方法及び装置 |
JP3437347B2 (ja) | 1995-09-08 | 2003-08-18 | キヤノン株式会社 | 文字認識装置及びその方法及びコンピュータ |
JP3761937B2 (ja) | 1995-09-18 | 2006-03-29 | キヤノン株式会社 | パターン認識方法及び装置及びコンピュータ制御装置 |
JPH0991380A (ja) | 1995-09-21 | 1997-04-04 | Canon Inc | 情報処理装置及び方法及び記憶媒体 |
JP3535624B2 (ja) | 1995-09-21 | 2004-06-07 | キヤノン株式会社 | 検索装置及び方法 |
JP3744997B2 (ja) | 1996-01-12 | 2006-02-15 | キヤノン株式会社 | 文字認識装置及びその方法 |
US5982933A (en) | 1996-01-12 | 1999-11-09 | Canon Kabushiki Kaisha | Information processing method, information processing apparatus, and storage medium |
US5930392A (en) * | 1996-07-12 | 1999-07-27 | Lucent Technologies Inc. | Classification technique using random decision forests |
US7203669B2 (en) * | 2003-03-17 | 2007-04-10 | Intel Corporation | Detector tree of boosted classifiers for real-time object detection and tracking |
US8290882B2 (en) * | 2008-10-09 | 2012-10-16 | Microsoft Corporation | Evaluating decision trees on a GPU |
WO2010100701A1 (ja) * | 2009-03-06 | 2010-09-10 | 株式会社 東芝 | 学習装置、識別装置及びその方法 |
-
2010
- 2010-11-02 JP JP2010246747A patent/JP5719145B2/ja not_active Expired - Fee Related
-
2011
- 2011-10-25 US US13/281,115 patent/US8930286B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012098960A (ja) | 2012-05-24 |
US8930286B2 (en) | 2015-01-06 |
US20120109861A1 (en) | 2012-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Discriminative elastic-net regularized linear regression | |
Doersch et al. | Unsupervised visual representation learning by context prediction | |
Wang et al. | Transferred dimensionality reduction | |
JP6041923B2 (ja) | 情報処理方法及び情報処理装置 | |
Deng et al. | What does classifying more than 10,000 image categories tell us? | |
Ziegler et al. | Locally uniform comparison image descriptor | |
Lin et al. | Face gender recognition based on face recognition feature vectors | |
Wang et al. | Zero-shot image classification based on deep feature extraction | |
Aghamaleki et al. | Transfer learning approach for classification and noise reduction on noisy web data | |
JP5906071B2 (ja) | 情報処理方法、情報処理装置、および記憶媒体 | |
JP5719145B2 (ja) | 情報処理装置、その処理方法及びプログラム | |
Zhang et al. | Landmark‐Guided Local Deep Neural Networks for Age and Gender Classification | |
Kang et al. | Combining random forest with multi-block local binary pattern feature selection for multiclass head pose estimation | |
Kompella et al. | Weakly supervised multi-scale recurrent convolutional neural network for co-saliency detection and co-segmentation | |
Liu et al. | Multi-view descriptor mining via codeword net for action recognition | |
Lu et al. | Face recognition using face patch networks | |
Liu et al. | Feature fusion using Extended Jaccard Graph and word embedding for robot | |
JP6053341B2 (ja) | 情報処理装置、その処理方法及びプログラム | |
Jasim et al. | A fuzzy based feature extraction approach for handwritten characters | |
Nurhadiyatna et al. | Extended Gaussian mixture model enhanced by hole filling algorithm (GMMHF) utilize GPU acceleration | |
JP6032930B2 (ja) | 情報処理装置、情報処理方法 | |
Doan et al. | Large scale image classification: fast feature extraction, multi-codebook approach and multi-core svm training | |
Hall et al. | Learning a model from spatially disjoint data | |
Lu et al. | Object localization by density-based spatial clustering | |
Kang | Image processing and understanding based on graph similarity testing: algorithm design and software development |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140815 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150320 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5719145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |