JP5675214B2 - 情報処理装置、情報処理方法およびプログラム - Google Patents

情報処理装置、情報処理方法およびプログラム Download PDF

Info

Publication number
JP5675214B2
JP5675214B2 JP2010183391A JP2010183391A JP5675214B2 JP 5675214 B2 JP5675214 B2 JP 5675214B2 JP 2010183391 A JP2010183391 A JP 2010183391A JP 2010183391 A JP2010183391 A JP 2010183391A JP 5675214 B2 JP5675214 B2 JP 5675214B2
Authority
JP
Japan
Prior art keywords
information processing
pattern
patterns
processing apparatus
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010183391A
Other languages
English (en)
Other versions
JP2012043156A5 (ja
JP2012043156A (ja
Inventor
俊太 舘
俊太 舘
裕輔 御手洗
裕輔 御手洗
裕人 吉井
裕人 吉井
奥野 泰弘
泰弘 奥野
克彦 森
克彦 森
優和 真継
優和 真継
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010183391A priority Critical patent/JP5675214B2/ja
Priority to US13/207,143 priority patent/US8755611B2/en
Publication of JP2012043156A publication Critical patent/JP2012043156A/ja
Publication of JP2012043156A5 publication Critical patent/JP2012043156A5/ja
Application granted granted Critical
Publication of JP5675214B2 publication Critical patent/JP5675214B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Description

本発明は情報処理装置、情報処理方法およびプログラムに関するものである。
従来、パターン認識のための機械学習の技術として、複数の識別器で識別を行い、識別結果を統合することによって高精度な識別を行うアンサンブル学習法と呼ばれる手法がある(例えば、特許文献1を参照)。アンサンブル学習法は、推定の分散値の大きな識別器(弱識別器)でも、複数の識別器(弱識別器)を集めて多数決による識別を行うと推定値の分散が小さくなることを識別の原理としている。アンサンブル学習手法には、例えば、バギング、ブースティング、ランダムフォレストなどの手法がある。
米国特許第6,009,199号公報
P. Viola and M. Jones, "Rapid object detection using a boosted cascade of simple features," Proc. of CVPR, 2001. A. Torralba, K. Murphy, W. Freeman, Sharing visual features for multiclass and multiview object detection, IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 29, no. 5, pp. 854-869, 2007 N. Dalal and B. Triggs, Histograms of Oriented Gradients for Human Detection, IEEE Conputer Vision and Pattern Recognition, 886-893, 2005 Choe, S. B. Faraway, J. J., Modelling Head and Hand Orientation During Motion Using Quaternions, SAE Transactions, VOL 113, PART 1, p.p. 186-192, 2004 Qianjun Xu, Marie desJardins and Kiri L. Wagstaff. Active Constrained Clustering by Examining Spectral Eigenvectors. Proc of Discovery Science 2005.
アンサンブル学習手法による画像認識では、弱識別器への入力として、例えば、Haar基底関数(非特許文献1)や局所パッチとのマッチング(非特許文献2)のように、ある種の特徴量変換の基底関数が用いられることが多い。多くのアンサンブル学習手法では、弱識別器ごとに異なった基底関数を選択し、基底関数によって張られる空間上で学習データを判別学習している。その際、画像の一部分しか参照しないようなスパースな基底関数を用いるか、もしくはいわゆるintegral image(非特許文献1)等を用いることが多い。integral imageを用いることによりデータの参照回数を抑えることができるので、高速な判別が実現できる。
なお、特徴量の変換関数が小さな有限集合であれば弱識別器に与える最適な基底関数を総当たりで探索することができる。しかし、一般には変換関数の元は非可算無限であるため、総当たりで試行することは通常できない。そのような時には適当な範囲でランダムに変換関数を選んで基底関数を決定することが行われる。具体的にはランダムに十分な数の変換関数の候補が選ばれた基底のプールを作成し、プールの中から最適な基底関数を選択する方法等で近似される。
ところで、パターン認識の応用課題の中には、対象物体の姿勢や形状の僅かな違いを識別するようなタスクがある。例えば、工業製品の組み立て自動化の際には、小さな切欠の有無で部品を識別したいという要望が生じることがある。また、マニピュレーターによる部品のピッキングために、部分的に似ていても姿勢が全く異なるような部品を正しく見分けたいといった要望が存在することがある。このように空間上に疎にしか差異のないパターンを識別するタスクのことを、ここでは「似て非なるクラス」の識別問題と呼ぶ(ここで言う空間とは画像の二次元空間のみならず何らかの特徴空間も含む)。
また明示的に「似て非なるクラス」ではない認識の課題においても、もし精度の向上を追求するのであれば、多かれ少なかれこのクラスの対象を適切に識別する必要が生じる。
似て非なるクラスの識別をアンサンブル学習で行う場合、総当たりで最適な基底関数を選択する方法では、実際の差異ではなくノイズの方に過学習してしまって真に有効な基底を選べないことがありえる。また基底をランダムに選ぶ方法では、有効な基底を漏らしてしまうか、不十分な数しか選択できない恐れがある。アンサンブル学習法は手法の特性上、有効な弱識別器(判別正解率の期待値が0.5より大きい弱識別器)のバリエーションが十分多くないと汎化誤差が小さくならない。このため、できるだけ多数の基底の候補を含むプールと多数の弱識別器を用いることが望ましい。しかしそれでは学習および検出時の計算量とデータ量が増大するという問題が生じる。
上記の課題に鑑み、本発明は、特徴量空間の無数の基底関数の選択肢の中からパターン認識に有効な基底関数を優先的に選ぶことが可能な情報処理技術の提供を目的とする。
上記の目的を達成するべく、本発明にかかる情報処理装置は、複数の判別器による結果を統合することによりパターンを判別するアンサンブル判別器を構成するそれぞれの判別器を生成するための情報処理装置であって、
入力手段を介して入力された複数のパターン間における特徴量の差異の分布を算出する算出手段と、
前記算出手段により算出された前記差異の分布を正規化することにより確率分布を生成する手段と、
前記生成された確率分布が示す確率に基づいて前記複数のパターンを判別するために参照するべきパターンにおける複数の画素を決定する決定手段と、
前記決定手段により決定された前記複数の画素の特徴量を用いて前記入力された複数のパターンを分類することにより、パターン判別に用いる判別器を複数生成する生成手段と、を備えることを特徴とする。
本発明によれば、特徴量空間の無数の基底関数の選択肢の中からパターン認識に有効な基底関数を優先的に選ぶことが可能な情報処理技術の提供が可能になる。
(a)本発明の実施形態にかかるパターン認識方法を実行することが可能な情報処理装置の構成を説明する図、(b)パターン認識方法の処理の流れを概略的に示す模式図。 (a)本実施形態のパターン認識方法の基本的な処理手順を説明する図、(b)クラス間の差異を模式的に示した図。 (a)確率分布に従って画素を決定する処理を例示的に説明する図、(b)パターン認識過程における決定木の生成を例示的に説明する図。 (a)第1実施形態のパターン認識処理の流れを説明する図、(b)第1実施形態のパターン認識過程における決定木の生成を例示的に説明する図。 第1実施形態の変形例を説明する図。 第2実施形態のパターン認識処理の流れを説明する図。 第2実施形態の姿勢データのばらつきを算出する処理を模式的に説明する図。 第3実施形態のパターン認識処理の流れを説明する図。 第4実施形態における弱識別器の接続構成、およびパターン認識過程の結果の一例を表す図。 第4実施形態のパターン認識処理の流れを説明する図。 第2実施形態の学習過程における回帰木の生成を例示的に説明する図。
(第1実施形態)
図1(a)の参照により、本発明の実施形態にかかるパターン認識方法を実行することが可能な情報処理装置の構成を説明する。ここでいう「パターン」とは例えば、静止画、動画、音声信号、文書データなどを認識の対象とすることが可能であるが、本発明の趣旨はこの例に限定されるものではない。具体例として、対象物を撮影した静止画を認識対象のパターンとし、対象物の名称、カテゴリー、3次元上の位置、姿勢等の情報を推定する例が挙げられる。ここでいう対象物とは、任意の物体を含み、例えば、人物、人物の顔、臓器、工業製品、自動車、半導体基板などが含まれる。
情報処理装置は、外部記憶装置101、中央処理装置(CPU)102、メモリ103、入出力装置104を備え、中央処理装置(CPU)102の全体的な制御の下にパターン認識方法を実行することが可能である。外部記憶装置101は、パターン認識方法の各処理ステップをコンピュータに実行させるためのパターン認識プログラムや、パターン認識方法の実行に用いる学習パターン、学習パターンを用いて作成された辞書等を保持する。また、外部記憶装置101は、パターン認識方法によって導かれた新規パターンの認識結果を保持することも可能である。中央処理装置(CPU)102はパターン認識プログラムの実行を司ることが可能である。
また、中央処理装置(CPU)102は、外部記憶装置101、メモリ103、入出力装置104の動作を制御することが可能である。メモリ103は、中央処理装置(CPU)102によってパターン認識プログラムのサブルーチン、またはパターン認識プログラムの実行時に参照するべきデータを一時的に格納することが可能である。また、メモリ103はパターン認識方法によって導かれた新規パターンの認識結果を一時的に保持することも可能である。入出力装置104は、ユーザからの指示を受け付け、認識対象となる新規パターンを取り込む入力部と、パターン認識結果を他の情報処理装置や、例えば、ロボットを制御する制御装置などへ出力する出力部とを有する。認識対象のパターンとして2次元の画像を用いる場合、入出力装置104の入力部はカメラとして機能して、対象物体を撮影することも可能である。
ユーザはパターン認識プログラムの実行開始のトリガーとして、入出力装置104を介して、実行を指示することも可能である。また、入出力装置104は、パターン認識結果を表示するための表示部を有しており、ユーザは、表示部に表示されたパターン認識結果を確認することも可能である。また、入出力装置104は、キーボートを有しており、ユーザはキーボートを介してパターン認識プログラムのパラメータを設定することが可能である。
図1(b)は本発明の第1実施形態にかかるパターン認識方法の処理の流れを概略的に示す模式図である。まず、認識対象の形態を示すパターン(学習パターン)151において、学習パターン151間の特徴量の差異を基に確率分布152を作成する。そして確率分布152に従って、基底の選択を行い、特徴量の基底153a、b、c、・・・を弱識別器154a、b、c・・・ごとに選択してアンサンブル学習を行う。
次に、図2(a)の参照により、本実施形態のパターン認識方法の基本的な処理手順を説明する。本実施形態では対象物体(部品)の姿勢推定を例とした分類問題を解くものとする。部品の画像が学習画像のパターンとして与えられたとき、その部品の姿勢をパターン認識方法の適用により識別する。ここでは数種類の姿勢のクラスを識別するタスクを想定する。学習パターンとしては、照明条件の違いや、大きさや傾きなど僅かな見え方の違いなど、一つの姿勢のクラスについて複数のバリエーションの画像が用意されているものとする。
本発明は多数の識別器を用いるアンサンブル学習方式に広く適応が可能であるが、本実施形態ではその中の一つとしてランダムフォレスト方式に適応させることとする(特許文献1を参照)。ランダムフォレストは複数の決定木を用いてパターン認識を行う手法である。決定木の各ノードにおいて何らかのランダムな基準によって生成される情報の問い合わせを行い、問い合わせの結果に応じて学習パターンを次々と分割していく。葉ノードに達した時に残っている学習パターンをその葉ノードの分類結果として記憶する。判別時には、入力パターンに対して学習時と同じ情報の問い合わせを行ってノードをルートノードから葉ノードへとたどる。葉ノードに達したら記憶されているパターンをその決定木の判別結果とする。全ての決定木の判別結果を投票等により統合して最終的な判別結果とする。
学習は決定木ごとに行われる。まずステップS201で、全ての学習画像のパターン(パターン画像)を特徴量に変換する。本実施形態では照明変動に対して頑健な識別を行うことを目的としてラプラシアン・オブ・ガウシアン(Laplacian of Gaussian:以降「LoG」と表記する)の処理を施し、エッジの強度画像を得る。次に、ステップS202からS207までの処理を各決定木の各弱識別器に対して個々に行う。
ステップS203では、パターン内において、クラス間の特徴量の差異の分布を計算する。ここで具体的に特徴量はLoGのエッジ強度であり、差異の値は姿勢のクラス内とクラス間の分散の比Fである。Fを以下の数式のように画素ごとに求める。
Figure 0005675214
但し、I(x,y)は座標x,yの画素のエッジ強度、m(x,y)は姿勢クラスCのエッジ強度の平均値、m(x,y)は全パターンのエッジ強度の平均値、nは各姿勢クラスの画像パターンの個数である。
ここで、図2(b)の参照番号220は異なる姿勢クラス間の差異を模式的に示した図である。姿勢クラス1の画像221と姿勢クラス2の画像222との分散比を求めて二つのクラスの差異の分布223を求める。確率的選択の結果を示す画像224は差異の分布を基に確率的に選択された画素の位置を複数示している。ここでは図示を簡単にするために二つの姿勢のクラスのみを示しているが、本実施形態では実際には判別対象のパターンの全姿勢のクラスについて分散比を算出する。なお、ルートノードなどで対象となる学習パターンの数が多くて処理時間がかかるようなときは、学習パターンの集合からいくつかのパターンをランダムサンプリングして小さなサンプルで計算を行うようにしてもよい。
次にステップS204において、クラス間の差異の分布Fを基にして確率分布Pを作成する。例えば、ここでは以下のような数式を用いればよい。
Figure 0005675214
ただし、ZはΣΣP(x,y)=1となるための正規化パラメータ、ρは分散比の高低を確率分布にどの程度反映するかを決定するチューニングパラメータである。ρ→0ならば確率は一様分布に近づく。すなわち分散比の高低を考慮しない分布になる。
次にステップS205において、確率分布Pを用いて各ノード(各弱識別器)が判別のために参照する基底を決定する。通常のランダムフォレストにおいて、基底とは、いずれかの画素の値(特徴量)であり、ランダムに参照する画素を確率分布Pに従って決定する。確率分布による決定の方法として、具体的な例を図3(a)に図示する。まず確率分布301の画素ごとの確率P(x,y)の値をラスター方向に加算し、累積値のテーブル302を生成しておく。0〜1までの乱数を発生させて、乱数の値に対応する画素を選択する。図3(a)の場合、乱数0.8123に最も近い値0.86を有する累積テーブルの画素I(4,2)が選択される。
次に、ステップ206において、識別器の学習を行う。ここでは画像の一点のエッジ強度の値(特徴量)と、あらかじめランダムに設定した閾値ξとを比較する。比較の結果、学習画像のパターンを二つに分類して二つの新しいノードを生成する。これが各識別器における学習となる。そして分割された各パターンについて以降のノードでも、先に説明したステップS203からS206を繰り返す。このようにして決定木が所定の深さに達するか、分割されたパターンの数が所定の数以下になればそのノードを葉ノードとする。葉ノードには残っている学習パターンの姿勢クラスの頻度を記憶する。
本実施形態の動作の例を図3(b)に示す。ここでは簡単のために深さが4の小さなツリーを示す。なお、無意味な比較が行われる回数を減らすために、閾値は学習データの分布を参考にして適切に設定しておいてもよい。決定木1の各ノードにおいて、それぞれ画素A,B,C,D,Eと閾値ξ,ξ,ξ,ξ4,ξとを比較してその判定結果により分岐し、最後に葉ノードに達して姿勢の判別結果を得ることができる。決定木2、3についても同様にして、姿勢の判別結果を得ることができる。
次に図4(a)の動作フローチャートを用いて本実施形態の判別処理について詳述する。判別処理の動作と結果の一例を図4(b)に示す。判別処理は入力画像を各決定木で独立に判別させ、その結果を統合することで実行される。まずステップS408では学習時に行った前処理と同様の手法(ここではLoG)を用いて入力画像を特徴量に変換する。次に決定木のルートノードを初期位置とする。そして各ノードでステップS409からステップS412までを繰り返す。
ステップS410では、そのノードについて学習時と同じ画素を選択して値を観測する。そしてステップS411では、学習時にランダムに決定した閾値との比較を行う。図4(b)に示した動作例では決定木1の各ノードにおいて、それぞれ画素A,B,Eと閾値ξ,ξ,ξとを比較してその判定結果により左、右、左と分岐し、最後に葉ノードに達して姿勢1という判別結果を得ている。
本実施形態で用いる決定木の場合、各ノードで分類対象となるパターンの集合はパターンの分割によって刻々と変化するため、パターンの差異の値や差異に基づいて作成される確率分布が各ノードで変化していくことに注意が必要である。ルートノードから葉ノードに近づくにつれ、パターンは分岐によって細分化されていき、パターンの差異に特化した詳細な比較が行われる。これにより効率的にパターンの分類を行うことができる。
また、汎化誤差を避けるために、適宜、チューニングパラメータρを調整するような工夫があってもよい。例えば、ノードの深さに応じてρの値を変えてもよい。具体的には判別の初期のノードではρ=0として、あまりパターン間の差異を考慮しないようにし、徐々にρの値を大きくしていくような方法が考えられる。また別の工夫として、例えば半分のノードはρ=0として確率分布を考慮せずに基底を選び、半分のノードはρ=1として確率分布を考慮して基底を選ぶ。これを交互に繰り返すというような工夫も考えられる。
なお、本実施形態では特徴量に変換する前処理としてLoGを使ったが、本発明の趣旨はこれに限るものではない。パターンのクラスを識別するために有効な特徴量の変換であればどのような特徴量変換も候補となりうる。認識対象のパターンや条件によって適切なものを選べばよい。例えば、HOG(Histogram of Oriented Gradient)(非特許文献3を参照)などを選ぶことも可能である。本実施形態の変形例について、以下に簡単に説明する。例えば、図5に模式図を示すように部品の学習画像のパターンセット501をそれぞれ7×7のセルからなるHOG特徴量に変換する。各セルが8方位の輝度勾配の値を持つので一つの学習画像のパターンは392次元の特徴ベクトル502に変換される。この392次元の特徴量について次元ごとに全パターンの分散比を求めて分散比の分布503を作成し、先述と同様の方法で確率分布504を作成する。各識別器では確率分布504によってHOG特徴量の次元の一つを基底として選び、ランダムな値との比較を行って学習データを分割していけばよい。
なお、本実施形態では確率分布の元となるパターンのクラス間の差異を表す指標として分散比を用いたが、これは他の指標であってもよい。具体的には、特徴量の値XとクラスのラベルYの2つを変量とする相互情報量I(X;Y)を利用することも考えられる。また、1クラスに1パターンしかデータがなければ、特徴量のクラス間の標準偏差を利用することも考えられる。正規化を適切に行うことで、様々な指標に対して本発明の適用が可能である。実際には用いる特徴量や認識タスクなどを勘案して有効な指標を選択することになる。
(第2実施形態)
第1実施形態では姿勢識別の問題をアンサンブルの分類木を用いることで分類の問題として解いた。しかしこのためにはあらかじめ姿勢を有限個のクラスターに分割しておく必要があり、クラスタリングの方法の妥当性や最適な角度の分解能が不明といった問題が生じる。第2実施形態では姿勢推定問題をクラスの分類問題としては解かず、回帰木を用いて姿勢の数値を直接推定する。
回帰木は関数の近似に用いられる手法である。構造は分類木とほぼ同じであるが、葉ノードにはパターンのクラスではなく、入力に対して関数が出力すべき数値を対応づける点が異なる。本実施形態では入力を部品の画像とし、出力を物体の姿勢の値である極角θ、偏角φとする。ここでは説明の簡単のために姿勢の面内回転の違いは存在しないと仮定して二自由度の姿勢の推定を行うタスクを考える。
通常の回帰木では、特徴量の候補を総当たりで試してデータを分割してみて、最適な特徴量を選んで決定木の分岐を行う。具体的には推定したい変量(ここでは姿勢の値)の分割後の二群内のばらつきが最も小さくなるような特徴量を選択するのが一般的である。そして各ノードでこれを繰り返して分岐とデータの分割を行っていく。
本実施形態のアンサンブル学習手法では、最適な特徴量を基底として選択するのではなく、分割後のばらつきの値を評価して有効な特徴量が優先して選ばれるように確率分布を作成する。そして確率分布を基に特徴量を選択して基底とする。本実施形態の処理の例を図11に示す。ここでは簡単のために深さが4の小さなツリーを示す。なお、無意味な比較が行われる回数を減らすために、閾値は学習データの分布を参考にして適切に設定しておいてもよい。決定木1の各ノードにおいて、それぞれ画素A,B,C,D,Eと閾値ξ,ξ,ξ,ξ4,ξとを比較してその判定結果により分岐し、最後に葉ノードに達して姿勢の値の判別結果を得ることができる。決定木2、3についても同様にして、姿勢の値の判別結果を得ることができる。
図6を参照して第2実施形態のパターン認識処理の流れを説明する。まず、ステップS601では第1実施形態と同様にLoGによって前処理を行う。そしてノードごとに、どの画素の値に着目して判別対象のパターンを分割したら、どの程度有効な分割が行われるのかを評価する。具体的にはステップS604で、適当な閾値である画素の値(これを基底fi)との比較により、特徴量である画素の値が大きいパターン群と特徴量である画素の値の小さいパターン群の二つの領域に分割する(第1のデータセット、第2のデータセット)。次にステップS605で分割後の二つのパターン群において、画素の値(特徴量)として、姿勢の方位のばらつきの指標Vを算出する。ばらつきの指標Vについては後述する。ばらつきの指標Vをその画素の基底としての有効度として画素ごとに記憶する。なお、上記の分割の閾値として、例えば、二分割されたデータの個数がなるべく等分になる値を用いる。または、指標Vが最大になる値を用いてもよい。
ばらつきの指標Vの算出の方法を以下に説明する。ここでは図7(a)のように姿勢の空間として2次元球面Sとその上に分布している姿勢のデータ群を考える。姿勢は極角θ,偏角φで表される。極角θ,偏角φから座標x,y,zへの変換は、以下の数3の式により求めることができる。
Figure 0005675214
この座標の値を用いてn個の姿勢データから姿勢の平均ベクトルを合成すると、長さは、以下の数4の式により求められる。
Figure 0005675214
ここで、以下の数5の式で定義される値はn個の姿勢データのばらつきを反映した値である。
Figure 0005675214
v=0で姿勢の方位のばらつきが最小であり、v=1でばらつきが最大となる。データをn個とn個の二つに分割したときの二つの群(第1のデータセット、第2のデータセット)のばらつきの平均は、以下の数6式により求めることができる。平均のばらつきVを各基底の判別の有効度の変量とする(図7(b))。平均のばらつきVは、基底fiの有効度を示す。
Figure 0005675214
以降の処理は、第1実施形態と多くの部分について共通である。ステップS607において、変量V(x,y)から確率分布P(x,y)を作成する。ステップS608において、確率的に画素を選択して基底とし、ステップS609において、回帰木の分岐とデータの分割を行う。葉ノードには、残っている姿勢のデータを平均して平均の方位を求めてこれを記憶する。姿勢の平均の方法は、例えば、先述のように平均ベクトルを合成し、その極角と偏角を求めて姿勢の値とすればよい。
姿勢の推定時には、入力画像を与えて各回帰木を辿り、各回帰木について姿勢の値を得る。これを平均して最終的な姿勢の推定結果とする。ここで、出力結果に外れ値が含まれていても頑健に結果が得られるように、M推定等の一般的なロバスト推定を用いてもよい。
ここでは面内回転を考慮せずに二自由度の姿勢推定について説明したが、別の実施形態として、面内回転を含む三自由度の自由姿勢を推定する形態が考えられる。基本的な形態は二自由度のときと同じであるが、三自由度の場合は四元数を使って姿勢の方位を表す必要がある。分割後の姿勢のばらつきを評価するためには姿勢の方位間の差分と平均を定義する必要がある。
これは以下のようにして定義する。まず二つの姿勢の差分である角度差は姿勢の方位を長さ1の四元数をqで表し、別の姿勢pに対して以下の数7式として定義する。
Figure 0005675214
次に四元数による姿勢の平均の計算方法は近似的な方法を含めていくつか提案されている(例えば、非特許文献4)。これらを用いて先述の方法と同様の計算を行えば分割後の姿勢のばらつきを評価することができる。このようにして三自由度姿勢についても本実施形態の適用が可能である。
(第3実施形態)
第3実施形態では本発明の適用可能な決定木を用いて3つ以上の物体の種類の識別について説明する。物体としては人工物から一般物体まで様々な対象が考えられるが、ここでは具体的に工業用部品同士を例にして識別することを考える。条件としては多数の部品の種類が存在し、それぞれについて学習画像が一枚ずつ与えられているとする。すなわちここでは1クラス1パターンの多クラスのパターン識別を解くことになる。学習データには図2(b)の部品クラス211と部品クラス212のように、部分的には似通っていて、切欠の有無などで適切に見分ける必要があるようなものが存在すると仮定する。
本実施形態では第1実施形態と同様に複数の決定木を分類木のアンサンブルとして使う。本実施形態では2点の画素の値を比較することで、決定木を分岐させていくことにする。
簡単な例としてもし2クラスのパターンを見分けるのであれば、クラス間でパターンの差分を求め、正の値の領域のどこか1点の画素と、負の値の領域のどこか1点の画素を比較すれば、比較的信頼性の高い判別を行うことが期待できる。但し本実施形態では1クラス1パターンの多クラスを扱うため、後述するような工夫を用いる。
図8の参照により第3実施形態のパターン認識処理の流れを説明する。本実施形態における学習時の処理の流れを説明する。本実施形態では、まずステップS801において、入力画像に対してLoG等の前処理を行う。ステップS802からS811までの処理を繰り返す。次に前処理で得られた特徴量の値を基にステップS803において、k−平均クラスタリングを用いて学習パターンを便宜的に二つのクラスターに分割する。次にステップS804では、先のステップS803で分割された二つのクラスターからランダムに各一つずつパターンを選択してペアを作成し、ステップS805において、二つのパターンの画素ごとの差分値を計算する。ステップS806において、正の成分と負の成分とにそれぞれ分けて個別にその絶対値を加算して、加算結果を保存する。ステップS804〜ステップS807を所定の数だけ繰り返して、正の値の成分と負の値の成分の分布の二枚の画像を得る。これを第1実施形態で行ったのと同様の手法によりステップS808で正規化して二つの確率分布を作成する。
そして、ステップS809ではこの二つの確率分布に従って2点を確率的に決定する。確率分布に基づく累積マップからの確率的な選択の方法も第1実施形態と同様に行えばよい。そして、ステップS810では2点の特徴量の比較を行って、対象物の認識を行うため、比較の結果に従って学習パターンの分割とツリーの分岐を行う。このときには先ほどのクラスターの分割結果は考慮せずに新たな分割を行う。以上のように分割を進め、一つのパターンのみがノードに残るまでツリーを分岐する処理を繰り返す。一つのパターンのみのノードに到達したらパターンの種類を記憶して葉ノードとする。なお、途中でどちらかのノードのパターンが空になるような問い合わせは無効として選択をやり直す。
なお、クラスタリングの際には計算量低減のため、全データを使わずに部分的にランダムサンプリングしたセットでクラスタリングを行ってもよい。また、クラスタリングの方法はk−平均クラスタリングに限らず、例えばスペクトラルクラスタリング手法(非特許文献5を参照)等を使ってもよい。データの性質と計算量とのトレードオフを考慮しながら選択すればよい。また、識別器による2点の比較の際には、第1実施形態で閾値を設けたようにどちらかにランダムな閾値を足してから比較するような形態にしてもよい。以上が本実施形態のパターン認識手法の学習の動作フローである。判別時には、こうして形成された複数の決定木をそれぞれ独立に辿り、葉ノードに達したときのパターンをその決定木の判別結果とする。全ての決定木で多数決をとって出現頻度の最大のパターンを判別結果とする。本実施形態の変形として、例えば、第1実施形態と同様に各ノードで1点の画素情報をランダムな値と比較するような形態でもよい。画像のクラス間の差異としては、例えば、パターンの各画素の標準偏差を利用して確率分布を作成することも可能である。
(第4実施形態)
第4実施形態としては、本発明を人物の顔の検出タスクに適用した例を説明する。ここでの問題設定の枠組みおよび識別器の構成は基本的には非特許文献1のViolaらの形態に則すものである。ViolaらはAdaboost手法(非特許文献1参照)で弱識別器を学習し、図9(a)に示すいわゆるカスケード構造で多段の判定を行った。これにより顔と非顔の2クラスのパターンの識別を行っている。また、判別の閾値を大きく下回るような、明らかに顔でないと判定できるパターンに関しては各段階において棄却を行うため、高速な判定が可能である。発明者はこれに本発明を適用して改良を行う。
Violaらは弱識別器に与える特徴量としてHaar基底関数を用いている。24×24の解像度の画像で最大4のサブドメインを持つHaar基底関数の場合、4万個程度のバリエーションが存在する。Violaらはこの全バリエーションを総当たりで試し、その時点でもっとも誤判別率が低くなるHaar基底を選択している。もし画像の解像度を24×24よりも高くするか、より複雑なパターンのHaar基底を用いようとすると、バリエーションの数が膨大になって現実的な時間では総当たりで試すことはできなくなる。
そこで本実施形態ではパターン間の特徴量の差異を元に確率分布を作成して有効な基底が優先的に選択されるようにする。図10の参照により、第4実施形態のパターン認識処理の流れを説明する。また学習時のある一つのノードの動作の例を図9(c)に模式図として示す。以下では特に非特許文献1との相違の部分に絞って説明する。
まず、クラス間の差異の分布を求める。本実施形態ではステップS1003で顔クラスの学習画像902(正事例学習画像)と非顔クラスの学習画像903(負事例学習画像)のデータに対して線形判別分析を行う。線形判別分析の結果、2クラスの分散比を最大化する一つの基底が得られる。この基底はn個の画素に対応するn次元の空間を1次元に圧縮する変換基底である。変換基底の係数の結果例を904に示す。係数904は実数値であり、正の値と負の値があることに留意されたい。
この係数とよく一致するようなHaar基底を優先的に選択すれば、2つのクラスを効率的に判別できることが期待できる。これについては様々な実現の方法が考えられるが、本実施形態では例えば以下のような操作で実現する。ステップS1004でまず、n個のHaar基底をランダムに生成する。1つのHaar基底の例を905に示す。
次に、ステップS1005においてこのn個のHaar基底と、線形判別分析の基底の係数904との一致度のスコアを測る。具体的にはスコアとしては例えば正規化相関(相互相関)の値を求めればよい。そして正規化相関の絶対値の大きな基底が有効な基底と考え、これらの基底がn個の中から優先されて選択されるようにする。ステップS1006では第1実施形態で行ったのと同様の方法を用いて一致度のスコアの値を正規化して確率分布に変換する。そしてS1007では第1実施形態で行ったのと同様にして累積分布のテーブルを作成して、確率的に一つのHaar基底を選択して判別(S1008)のための基底906とする。このようにした後、棄却閾値を決定し(S1009)、棄却された学習データを除き(S1010)、学習データの重み付けを更新する(S1011)。学習は、非特許文献1と同一の方法でもってAdaboostにより行う。誤判別データの重み付の仕方や判別閾値907の設定の仕方については非特許文献1に十分に開示されているのでここでは説明を省く。このようにして識別器を学習させる。
検出時には、非特許文献1と同様にいわゆるスライディングウィンドウによる走査処理を行って画像の全領域について顔か否かの判定を行う。また異なった見えのサイズに対応するために、複数の解像度の階層画像を用いて複数回の判定を行う。
なお、本実施形態では基底関数を一つ選んで1次元空間上で判別と閾値の決定を行ったが、本発明の適用可能な実施形態においては弱識別器が判別を行う空間は1次元に限定されない。例えば、二つ以上の基底関数を選んで多次元の空間を張り、データの判別を行うような形態も考えられる。これにより、より複雑なHaar基底の組み合わせの表現を実現することが可能である。弱識別器の判別の手法としては、例えば、ソフトマージンのサポートベクターマシンなどを用いることができる。なお、組み合わせの効果を得るためには、Haar基底関数で変換した後にさらに2乗するなど、非線形な変換を含む方が好ましい。本実施形態ではViolaらの手法に順じて、図9(a)のように弱識別器のカスケードを一つのみ用いる実現形態を説明したが、図9(b)のようなカスケードのアンサンブルを用いて判別結果を多数決で統合するような形態も考えられる。この形態では基底選択のランダム性をより有効に用いてアンサンブル学習が行われることが期待できる。
上述の実施形態によれば、特徴量空間の無数の基底関数の選択肢の中からパターン認識に有効な基底関数を優先的に選ぶことが可能な技術の提供が可能になる。
また、基底関数の選択の仕方が決定的でないために弱識別器の多様なバリエーションが保持される。このようにして結果的に従来のアンサンブル学習手法に比べて、識別の精度を高めることができる。また、学習時および検出時の計算量やデータ量をより小さくすることができる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (14)

  1. 複数の判別器による結果を統合することによりパターンを判別するアンサンブル判別器を構成するそれぞれの判別器を生成するための情報処理装置であって、
    入力手段を介して入力された複数のパターン間における特徴量の差異の分布を算出する算出手段と、
    前記算出手段により算出された前記差異の分布を正規化することにより確率分布を生成する手段と、
    前記生成された確率分布が示す確率に基づいて前記複数のパターンを判別するために参照するべきパターンにおける複数の画素を決定する決定手段と、
    前記決定手段により決定された前記複数の画素の特徴量を用いて前記入力された複数のパターンを分類することにより、パターン判別に用いる判別器を複数生成する生成手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記複数のパターンを二つのクラスターに分割する分割手段と、
    前記分割手段により分割された前記二つのクラスターからそれぞれ一つのパターンを選択して、選択されたパターン間の特徴量の差分を算出する手段と、
    を更に備え、
    前記決定手段は、前記差分の正の成分を正規化して求められた分布と、前記差分の負の成分を正規化して求められた分布と、を用いて、前記複数のパターンを判別するために参照するべきパターン内の画素を決定し、
    前記生成手段は、前記決定手段により決定された前記画素の特徴量に基づいて前記複数のパターンの判別を行うことにより前記複数の判別器を生成することを特徴とする請求項1に記載の情報処理装置。
  3. 前記生成される判別器は決定木のノードを構成することを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記複数のパターンそれぞれの画素の特徴量に基づいて、前記複数のパターンの集合を2つのパターン群に分割する分割手段と、
    前記分割手段により分割されたそれぞれのパターン群について特徴量のばらつきを算出し、前記算出された特徴量のばらつきの平均を算出する手段と、
    を更に備え、
    前記決定手段は、算出された前記特徴量のばらつきの平均を正規化して求められた確率分布を用いて、前記複数のパターンを判別するために参照するべきパターン内の画素を決定し、
    前記生成手段は、前記決定手段により決定された前記画素の特徴量に基づいて前記複数のパターンの判別を行うことにより前記複数の判別器を生成することを特徴とする請求項1に記載の情報処理装置。
  5. 前記判別は回帰木のノードを構成することを特徴とする請求項1または4に記載の情報処理装置。
  6. 請求項1乃至5のいずれか1項に記載の情報処理装置の各手段としてコンピュータを機能させるためのプログラム。
  7. 複数の判別器による結果を統合することによりパターンを判別するアンサンブル判別器を構成するそれぞれの判別器を生成するための情報処理装置における情報処理方法であって、
    前記情報処理装置の算出手段が、入力手段を介して入力された複数のパターン間における特徴量の差異の分布を算出する算出工程と、
    前記情報処理装置の確率分布を生成する手段が、前記算出工程で算出された前記差異の分布を正規化することにより確率分布を生成する工程と、
    前記情報処理装置の決定手段が、前記生成された確率分布が示す確率に基づいて前記複数のパターンを判別するために参照するべきパターンにおける複数の画素を決定する決定工程と、
    前記情報処理装置の生成手段が、前記決定工程で決定された前記複数の画素の特徴量を用いて前記入力された複数のパターンを分類することにより、パターン判別に用いる判別器を複数生成する生成工程と、
    を有することを特徴とする情報処理方法。
  8. 前記算出手段は、対象物の姿勢を示す複数のパターン間における特徴量の差異の分布を算出することを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
  9. 前記生成手段は、前記決定手段により決定された前記画素の特徴量と、予め設定された閾値と、の比較の結果を用いて、前記対象物の姿勢を求めるための判別を行う判別器を生成することを特徴とする請求項8に記載の情報処理装置。
  10. 複数の判別器による結果を統合することによりパターンを判別するアンサンブル判別器を構成するそれぞれの判別器を生成するための情報処理装置であって、
    入力手段を介して入力された複数のパターン間における特徴量の差異の分布を算出する算出手段と、
    前記算出手段により算出された前記差異の分布を正規化することにより確率分布を生成する手段と、
    前記生成された確率分布が示す確率に基づいて前記複数のパターンを判別するために参照するべき前記入力された複数のパターンにおける特徴量の基底を決定する決定手段と、
    前記決定手段により決定された前記特徴量の基底を用いて前記入力された複数のパターンを分類することにより、パターン判別に用いる判別器を複数生成する生成手段と、
    を備えることを特徴とする情報処理装置。
  11. 前記基底は、特徴量の次元であることを特徴とする請求項10に記載の情報処理装置。
  12. 前記基底は、基底関数であることを特徴とする請求項10に記載の情報処理装置。
  13. 複数の判別器による結果を統合することによりパターンを判別するアンサンブル判別器を構成するそれぞれの判別器を生成するための情報処理装置における情報処理方法であって、
    前記情報処理装置の算出手段が、入力手段を介して入力された複数のパターン間における特徴量の差異の分布を算出する算出工程と、
    前記情報処理装置の確率分布を生成する手段が、前記算出工程で算出された前記差異の分布を正規化することにより確率分布を生成する工程と、
    前記情報処理装置の決定手段が、前記生成された確率分布が示す確率に基づいて前記複数のパターンを判別するために参照するべき前記入力された複数のパターンにおける特徴量の基底を決定する決定工程と、
    前記情報処理装置の生成手段が、前記決定工程で決定された前記特徴量の基底を用いて前記入力された複数のパターンを分類することにより、パターン判別に用いる判別器を複数生成する生成工程と、
    を有することを特徴とする情報処理方法。
  14. 請求項10乃至12のいずれか1項に記載の情報処理装置の各手段としてコンピュータを機能させるためのプログラム。
JP2010183391A 2010-08-18 2010-08-18 情報処理装置、情報処理方法およびプログラム Expired - Fee Related JP5675214B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010183391A JP5675214B2 (ja) 2010-08-18 2010-08-18 情報処理装置、情報処理方法およびプログラム
US13/207,143 US8755611B2 (en) 2010-08-18 2011-08-10 Information processing apparatus and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010183391A JP5675214B2 (ja) 2010-08-18 2010-08-18 情報処理装置、情報処理方法およびプログラム

Publications (3)

Publication Number Publication Date
JP2012043156A JP2012043156A (ja) 2012-03-01
JP2012043156A5 JP2012043156A5 (ja) 2013-09-19
JP5675214B2 true JP5675214B2 (ja) 2015-02-25

Family

ID=45594113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010183391A Expired - Fee Related JP5675214B2 (ja) 2010-08-18 2010-08-18 情報処理装置、情報処理方法およびプログラム

Country Status (2)

Country Link
US (1) US8755611B2 (ja)
JP (1) JP5675214B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10196867B2 (en) 2014-12-23 2019-02-05 Shell Oil Company System and method for positioning of tubular members

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5538967B2 (ja) 2009-06-18 2014-07-02 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP5848551B2 (ja) * 2011-08-26 2016-01-27 キヤノン株式会社 学習装置、学習装置の制御方法、検出装置、検出装置の制御方法、およびプログラム
JP5896661B2 (ja) 2011-09-14 2016-03-30 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム
KR101175597B1 (ko) * 2011-09-27 2012-08-21 (주)올라웍스 아다부스트 학습 알고리즘을 이용하여 얼굴 특징점 위치를 검출하기 위한 방법, 장치, 및 컴퓨터 판독 가능한 기록 매체
JP5886616B2 (ja) 2011-11-30 2016-03-16 キヤノン株式会社 物体検出装置、物体検出装置の制御方法、およびプログラム
JP5806606B2 (ja) 2011-12-01 2015-11-10 キヤノン株式会社 情報処理装置、情報処理方法
JP5865043B2 (ja) 2011-12-06 2016-02-17 キヤノン株式会社 情報処理装置、情報処理方法
US8879831B2 (en) * 2011-12-15 2014-11-04 Microsoft Corporation Using high-level attributes to guide image processing
CN103366177B (zh) * 2012-03-28 2016-12-07 佳能株式会社 对象检测分类器生成方法和设备、图像对象检测方法和设备
JP5931646B2 (ja) * 2012-08-20 2016-06-08 Kddi株式会社 画像処理装置
JP6124566B2 (ja) * 2012-11-29 2017-05-10 国立大学法人九州工業大学 画像認識方法および画像認識装置
US9390502B2 (en) * 2013-04-22 2016-07-12 Kabushiki Kaisha Toshiba Positioning anatomical landmarks in volume data sets
JP6282045B2 (ja) * 2013-05-23 2018-02-21 キヤノン株式会社 情報処理装置および方法、プログラム、記憶媒体
JP6245880B2 (ja) * 2013-07-31 2017-12-13 キヤノン株式会社 情報処理装置および情報処理手法、プログラム
JP6226701B2 (ja) * 2013-11-05 2017-11-08 キヤノン株式会社 データ処理方法及び装置、データ識別方法及び装置、プログラム
JP6359985B2 (ja) * 2015-02-12 2018-07-18 株式会社デンソーアイティーラボラトリ デプス推定モデル生成装置及びデプス推定装置
US9922269B2 (en) * 2015-06-05 2018-03-20 Kla-Tencor Corporation Method and system for iterative defect classification
JP6708385B2 (ja) * 2015-09-25 2020-06-10 キヤノン株式会社 識別器作成装置、識別器作成方法、およびプログラム
JP6687894B2 (ja) * 2016-05-20 2020-04-28 富士ゼロックス株式会社 クラス推定装置及びプログラム
JP7149692B2 (ja) 2017-08-09 2022-10-07 キヤノン株式会社 画像処理装置、画像処理方法
EP3807815A4 (en) * 2018-06-14 2021-07-21 Magic Leap, Inc. DEEP NETWORK OF EXTENDED REALITY
JP7091174B2 (ja) * 2018-07-09 2022-06-27 キヤノン株式会社 システム、システムの制御方法及びプログラム
JP6918397B1 (ja) * 2020-02-10 2021-08-11 株式会社エイシング 情報処理装置、方法、プログラム及びシステム
CN111339749B (zh) * 2020-03-02 2022-05-20 乐山师范学院 无条件文本生成方法、文本生成装置及存储介质

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3466689B2 (ja) 1994-01-26 2003-11-17 キヤノン株式会社 手書き文字認識方法及びその装置
JP3453422B2 (ja) 1994-02-10 2003-10-06 キヤノン株式会社 文字パターンのユーザ辞書への登録方法及び該ユーザ辞書を有する文字認識装置
JP3416268B2 (ja) 1994-06-30 2003-06-16 キヤノン株式会社 画像認識装置及びその方法
JP3630734B2 (ja) 1994-10-28 2005-03-23 キヤノン株式会社 情報処理方法
JPH08249422A (ja) 1995-03-08 1996-09-27 Canon Inc 文字処理装置及び方法
JP3792755B2 (ja) 1995-08-29 2006-07-05 キヤノン株式会社 文字認識方法及び装置
JP3437347B2 (ja) 1995-09-08 2003-08-18 キヤノン株式会社 文字認識装置及びその方法及びコンピュータ
JP3761937B2 (ja) 1995-09-18 2006-03-29 キヤノン株式会社 パターン認識方法及び装置及びコンピュータ制御装置
JPH0991380A (ja) 1995-09-21 1997-04-04 Canon Inc 情報処理装置及び方法及び記憶媒体
JP3535624B2 (ja) 1995-09-21 2004-06-07 キヤノン株式会社 検索装置及び方法
US5982933A (en) 1996-01-12 1999-11-09 Canon Kabushiki Kaisha Information processing method, information processing apparatus, and storage medium
JP3744997B2 (ja) 1996-01-12 2006-02-15 キヤノン株式会社 文字認識装置及びその方法
US5930392A (en) 1996-07-12 1999-07-27 Lucent Technologies Inc. Classification technique using random decision forests
US6351561B1 (en) * 1999-03-26 2002-02-26 International Business Machines Corporation Generating decision-tree classifiers with oblique hyperplanes
US7054850B2 (en) 2000-06-16 2006-05-30 Canon Kabushiki Kaisha Apparatus and method for detecting or recognizing pattern by employing a plurality of feature detecting elements
JP2002358523A (ja) 2001-05-31 2002-12-13 Canon Inc パターン認識処理装置及びその方法、画像入力装置
JP4846924B2 (ja) 2001-05-31 2011-12-28 キヤノン株式会社 パターン認識装置
AU2003289116A1 (en) 2002-12-16 2004-07-09 Canon Kabushiki Kaisha Pattern identification method, device thereof, and program thereof
JP4204336B2 (ja) * 2003-01-30 2009-01-07 富士通株式会社 顔の向き検出装置、顔の向き検出方法及びコンピュータプログラム
EP3358501B1 (en) 2003-07-18 2020-01-01 Canon Kabushiki Kaisha Image processing device, imaging device, image processing method
EP1697877B1 (en) 2003-12-16 2009-09-16 Canon Kabushiki Kaisha Pattern identification method, apparatus, and program
JP4217664B2 (ja) 2004-06-28 2009-02-04 キヤノン株式会社 画像処理方法、画像処理装置
JP4697670B2 (ja) * 2005-01-05 2011-06-08 日本電気株式会社 識別用データ学習システム、学習装置、識別装置及び学習方法
JP5008269B2 (ja) 2005-04-08 2012-08-22 キヤノン株式会社 情報処理装置、情報処理方法
JP4712563B2 (ja) * 2006-01-16 2011-06-29 富士フイルム株式会社 顔検出方法および装置並びにプログラム
JP4556891B2 (ja) * 2006-03-17 2010-10-06 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
JP2008059197A (ja) 2006-08-30 2008-03-13 Canon Inc 画像照合装置、画像照合方法、コンピュータプログラム及び記憶媒体
JP2009086749A (ja) 2007-09-27 2009-04-23 Canon Inc パターン識別手法、識別用パラメータ学習方法、及び装置
JP4948379B2 (ja) 2007-12-18 2012-06-06 キヤノン株式会社 パターン識別器生成方法、情報処理装置、プログラム及び記憶媒体
JP5055166B2 (ja) 2008-02-29 2012-10-24 キヤノン株式会社 眼の開閉度判定装置、方法及びプログラム、撮像装置
US8331655B2 (en) 2008-06-30 2012-12-11 Canon Kabushiki Kaisha Learning apparatus for pattern detector, learning method and computer-readable storage medium
JP4623199B2 (ja) * 2008-10-27 2011-02-02 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
JP5254893B2 (ja) 2009-06-26 2013-08-07 キヤノン株式会社 画像変換方法及び装置並びにパターン識別方法及び装置
JP5409237B2 (ja) 2009-09-28 2014-02-05 キヤノン株式会社 パターン検出装置、その処理方法及びプログラム
JP5336995B2 (ja) 2009-10-19 2013-11-06 キヤノン株式会社 特徴点位置決め装置、画像認識装置、その処理方法及びプログラム
JP5588165B2 (ja) 2009-12-24 2014-09-10 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP5554984B2 (ja) 2009-12-24 2014-07-23 キヤノン株式会社 パターン認識方法およびパターン認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10196867B2 (en) 2014-12-23 2019-02-05 Shell Oil Company System and method for positioning of tubular members

Also Published As

Publication number Publication date
US20120045120A1 (en) 2012-02-23
JP2012043156A (ja) 2012-03-01
US8755611B2 (en) 2014-06-17

Similar Documents

Publication Publication Date Title
JP5675214B2 (ja) 情報処理装置、情報処理方法およびプログラム
US10747989B2 (en) Systems and/or methods for accelerating facial feature vector matching with supervised machine learning
Pazhoumand-Dar et al. Joint movement similarities for robust 3D action recognition using skeletal data
Patil et al. 3-D face recognition: features, databases, algorithms and challenges
Creusot et al. A machine-learning approach to keypoint detection and landmarking on 3D meshes
US8675974B2 (en) Image processing apparatus and image processing method
KR102535810B1 (ko) 이미지 인식 시스템 및 방법
Severo et al. A benchmark for iris location and a deep learning detector evaluation
US20150235109A1 (en) Learning method and apparatus for pattern recognition
JP5153434B2 (ja) 情報処理装置及び情報処理方法
JP5241606B2 (ja) オブジェクト識別装置及びオブジェクト識別方法
Pomares et al. Ground extraction from 3D lidar point clouds with the classification learner app
Liu et al. Fusing sorted random projections for robust texture and material classification
Barra et al. Unconstrained ear processing: What is possible and what must be done
Jayech et al. Clustering and Bayesian network for image of faces classification
Hossain et al. A Real-time Machine Learning-Based Person Recognition System With Ear Biometrics
Masoumzadeh et al. HydraPicker: Fully Automated Particle Picking in Cryo-EM by Utilizing Dataset Bias in Single Shot Detection.
Herlambang et al. Cloud-based architecture for face identification with deep learning using convolutional neural network
Devi et al. Face Emotion Classification using AMSER with Artificial Neural Networks
Gumusbas et al. Offline signature identification and verification based on capsule representations
Lumini et al. Deep featrues combined with hand-crafted features for face recognition
Singh et al. Genetic algorithm implementation to optimize the hybridization of feature extraction and metaheuristic classifiers
Gigilashvili et al. Texture-based clustering of archaeological textile images
Ginhac et al. Robust Face Recognition System based on a multi-views face database
Manohar et al. Engaging Noble Tolerance Recognitions Through Modern Technologies and Machine Learning in Community Superintendence of Bio-Cyber Research

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130813

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130813

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141224

R151 Written notification of patent or utility model registration

Ref document number: 5675214

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees