JP2015225410A - 認識装置、方法及びプログラム - Google Patents

認識装置、方法及びプログラム Download PDF

Info

Publication number
JP2015225410A
JP2015225410A JP2014108495A JP2014108495A JP2015225410A JP 2015225410 A JP2015225410 A JP 2015225410A JP 2014108495 A JP2014108495 A JP 2014108495A JP 2014108495 A JP2014108495 A JP 2014108495A JP 2015225410 A JP2015225410 A JP 2015225410A
Authority
JP
Japan
Prior art keywords
category
recognition target
recognition
reliability
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2014108495A
Other languages
English (en)
Inventor
友弘 中居
Tomohiro Nakai
友弘 中居
進 窪田
Susumu Kubota
進 窪田
伊藤 聡
Satoshi Ito
聡 伊藤
友樹 渡辺
Yuki Watanabe
友樹 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2014108495A priority Critical patent/JP2015225410A/ja
Priority to US14/721,045 priority patent/US20150363667A1/en
Publication of JP2015225410A publication Critical patent/JP2015225410A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

【課題】認識精度及びロバスト性を高めることができる認識装置、方法及びプログラムを提供する。
【解決手段】実施形態の認識装置は、第1記憶部と、取得部と、第1算出部と、第2算出部と、第3算出部と、決定部と、を備える。第1記憶部は、各学習パターンが複数のカテゴリのいずれかに属する複数の学習パターンを記憶する。取得部は、認識対象パターンを取得する。第1算出部は、カテゴリ毎に、認識対象パターンと当該カテゴリに属する学習パターンとの距離に対する当該カテゴリに属する学習パターンの数の分布を示す距離ヒストグラムを算出する。第2算出部は、複数のカテゴリそれぞれの距離ヒストグラムを分析して、認識対象パターンの特徴量を算出する。第3算出部は、特徴量と1以上の識別器とを用いて、認識対象カテゴリの信頼度を算出する。決定部は、信頼度を用いて、1以上の認識対象カテゴリの中から認識対象パターンのカテゴリを決定する。
【選択図】図1

Description

本発明の実施形態は、認識装置、方法及びプログラムに関する。
パターン認識において、k近傍法という手法が知られている。k近傍法は、カテゴリが既知の複数の学習パターンの中から、カテゴリが未知の認識対象パターンとの特徴空間における距離が小さい学習パターンの上位k個を探索し、探索したk個の学習パターンのうち最も多くの学習パターンが属するカテゴリを、当該認識対象パターンのカテゴリに推定する手法である。
T. M. Cover and P. E. Hart, "Nearest Neighbor Pattern Classification", IEEE Trans. Information Theory, vol. 13, no. 1, pp. 21-27, Jan. 1967.
しかしながら、上述したような従来技術では、限られた近傍数k個の学習パターンで認識対象パターンを評価するため、カテゴリ全体との関係を評価できず、正確な認識が困難な場合がある。また、学習パターンに誤りが含まれていた場合、ロバスト性の低下が懸念される。本発明が解決しようとする課題は、認識精度及びロバスト性を高めることができる認識装置、方法及びプログラムを提供することである。
実施形態の認識装置は、第1記憶部と、取得部と、第1算出部と、第2算出部と、第3算出部と、決定部と、出力部と、を備える。第1記憶部は、各学習パターンが複数のカテゴリのいずれかに属する複数の学習パターンを記憶する。取得部は、認識対象の認識対象パターンを取得する。第1算出部は、前記カテゴリ毎に、前記認識対象パターンと当該カテゴリに属する学習パターンとの距離に対する当該カテゴリに属する学習パターンの数の分布を示す距離ヒストグラムを算出する。第2算出部は、前記複数のカテゴリそれぞれの前記距離ヒストグラムを分析して、前記認識対象パターンの特徴量を算出する。第3算出部は、前記特徴量と1以上の認識対象カテゴリに属するか否かを識別する1以上の識別器とを用いて、前記認識対象カテゴリの信頼度を算出する。決定部は、前記信頼度を用いて、前記1以上の認識対象カテゴリの中から前記認識対象パターンのカテゴリを決定する。出力部は、前記認識対象パターンの決定された前記カテゴリを出力する。
第1実施形態の認識装置の例を示す構成図。 第1実施形態の認識対象パターンと学習パターンの距離の算出例の説明図。 第1実施形態の距離ヒストグラムの例を示す図。 第1実施形態の認識処理例を示すフローチャート。 第1実施形態のカテゴリ決定処理例を示すフローチャート。 第2実施形態の認識装置の例を示す構成図。 第2実施形態の累積ヒストグラムの例を示す図。 第2実施形態の認識処理例を示すフローチャート。 各実施形態及び変形例の認識装置のハードウェア構成例を示す図。
以下、添付図面を参照しながら、実施形態を詳細に説明する。
(第1実施形態)
図1は、第1実施形態の認識装置10の一例を示す構成図である。図1に示すように、認識装置10は、撮像部7と、抽出部9と、取得部11と、第1記憶部13と、第1算出部15と、第2算出部16と、第2記憶部17と、第3算出部18と、決定部19と、出力制御部21と、出力部23とを、備える。
撮像部7は、例えば、デジタルカメラなどの撮像装置により実現できる。抽出部9、取得部11、第1算出部15、第2算出部16、第3算出部18、決定部19、及び出力制御部21は、例えば、CPU(Central Processing Unit)などの処理装置にプログラムを実行させること、即ち、ソフトウェアにより実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェア及びハードウェアを併用して実現してもよい。第1記憶部13及び第2記憶部17は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、光ディスク、RAM(Random Access Memory)、及びROM(Read Only Memory)などの磁気的、光学的、又は電気的に記憶可能な記憶装置により実現できる。出力部23は、例えば、液晶ディスプレイやタッチパネルディスプレイなどの表示装置により実現してもよいし、スピーカなどの音声出力装置により実現してもよいし、両者を併用して実現してもよい。
撮像部7は、認識対象物を撮像して画像を得る。抽出部9は、撮像部7により撮像された画像から、認識対象のパターンである認識対象パターンを抽出する。
取得部11は、抽出部9により抽出された認識対象パターンを取得する。第1実施形態の認識対象パターンは、認識対象物を撮像した画像から抽出した特徴ベクトルであり、例えば、HOG(Histogram of Oriented Gradients)などの画像特徴量が該当する。
なお、認識対象パターンは、画像から抽出した特徴ベクトルに限定されるものではなく、例えば、マイクやセンサなど任意の手段で取得した情報から任意の方法で抽出した特徴ベクトルであってもよい。
第1記憶部13は、各学習パターンが複数のカテゴリのいずれかに属する複数の学習パターンを記憶する。なお、各カテゴリに属する学習パターンの数は、複数であることを想定しているが、単数であることを除外するものではない。
第1実施形態では、学習パターンは、対象物を撮像した画像から抽出した特徴ベクトルであるものとするが、これに限定されるものではない。学習パターンは、認識対象パターンと対応する情報であればどのようなものであってもよい。
また、カテゴリとは、対象物(学習パターン)の種類を示すものであり、対象物(学習パターン)が元々潜在的に有している固有な情報が該当する。例えば、対象物が人であれば、当該対象物に基づく学習パターン(特徴ベクトル)のカテゴリは「人」となり、対象物が道路であれば、当該対象物に基づく学習パターン(特徴ベクトル)のカテゴリは「道路」となり、対象物が標識であれば、当該対象物に基づく学習パターン(特徴ベクトル)のカテゴリは「標識」となり、対象物が茂みであれば、当該対象物に基づく学習パターン(特徴ベクトル)のカテゴリは「茂み」となる。
第1算出部15は、カテゴリ毎に、取得部11により取得された認識対象パターンと当該カテゴリに属する学習パターンとの距離に対する当該カテゴリに属する学習パターンの数の分布を示す距離ヒストグラムを算出する。
具体的には、第1算出部15は、第1記憶部13から複数の学習パターンを取得し、取得した複数の学習パターンそれぞれと取得部11により取得された認識対象パターンとの距離を算出する。例えば、第1算出部15は、図2に示すように、認識対象パターンと学習パターンとのユークリッド距離を算出する。なお、図2に示す例では、認識対象パターンと学習パターンとのユークリッド距離を矢印で示している。
但し、認識対象パターンと学習パターンとの距離は、ユークリッド距離に限定されるものではなく、例えば、マンハッタン距離、マハラノビス距離、及びハミング距離などの任意の距離尺度を用いることができる。
そして第1算出部15は、複数のカテゴリそれぞれについて、当該カテゴリに属する複数の学習パターンを、算出した距離毎に集計することで、例えば、図3に示すような、距離ヒストグラムを算出する。なお、第1算出部15は、算出した距離毎に学習パターンを集計するのではなく、距離区間毎に、算出した距離が当該距離区間に収まる学習パターンの数を集計して、距離ヒストグラムを算出してもよい。
また、図2及び図3に示す例では、学習パターンとして、カテゴリAに属する学習パターン及びカテゴリBに属する学習パターンを例示しているが、これに限定されるものではなく、実際には、他のカテゴリに属する学習パターンも存在する。
また、第1算出部15は、第1記憶部13に記憶されている全ての学習パターンを認識対象パターンとの距離算出対象(比較対象)とする必要はなく、第1記憶部13に記憶されている一部の学習パターンを認識対象パターンとの距離算出対象としてもよい。但し、この場合、認識対象パターンとの距離が小さくなることが想定される学習パターンを距離算出対象とし、認識対象パターンとの距離が大きくなることが想定される学習パターンを距離算出対象から除外することが好ましい。
第2算出部16は、複数のカテゴリそれぞれの距離ヒストグラムを分析して、取得部11により取得された認識対象パターンの特徴量を算出する。認識対象パターンの特徴量は、第1算出部15により取得された複数の学習パターンと取得部11により取得された認識対象パターンとの関係に基づいて定まる値であればよい。第1実施形態では、認識対象パターンの特徴量は、距離ヒストグラム毎の最頻値となる距離を並べたものであるものとするが、これに限定されるものではない。
例えば、学習パターンのカテゴリ数をC、認識対象パターンと第1記憶部13に記憶されている学習パターンとの距離の最大値をD、カテゴリc(1≦c≦C)の距離ヒストグラムにおいて最頻値となる距離(学習パターン数が最も多い距離)をd(0≦d≦D)とする。この場合、第2算出部16は、複数のカテゴリそれぞれの距離ヒストグラムから当該カテゴリの最頻値となる距離dを求めることで得られる{d,…,d}を、認識対象パターンの特徴量とする。
第2記憶部17は、1以上の認識対象カテゴリに属するか否かを識別する1以上の識別器を記憶する。なお、1以上の認識対象カテゴリは、それぞれ、第1算出部15により取得された複数の学習パターンの少なくともいずれかが属するカテゴリであってもよいし、第1算出部15により取得された複数の学習パターンのいずれも属さないカテゴリであってもよい。
1以上の識別器は、それぞれ、入力データが自身の識別対象の認識対象カテゴリに属するか否かを識別するものであり、詳細には、入力データが自身の識別対象の認識対象カテゴリに属することの信頼度を出力する。
例えば、識別器は、自身の識別対象の認識対象カテゴリが第1算出部15により取得された学習パターンのカテゴリと同一であれば、入力データ(第2算出部16により算出された特徴量)と自身の識別対象の認識対象カテゴリとが近いほど高い信頼度を出力する。また例えば、識別器は、自身の識別対象の認識対象カテゴリが第1算出部15により取得された学習パターンのカテゴリと異なれば、入力データ(第2算出部16により算出された特徴量)と自身の識別対象の認識対象カテゴリとが、両カテゴリの近さに近いほど高い信頼度を出力する。なお、両カテゴリが同一であるか否かは、既知であり、両カテゴリが異なる場合の両カテゴリの近さは、識別器の学習時に学習されており、既知である。
第1実施形態では、1以上の識別器が1以上の線形識別器であり、第2記憶部17が、1以上の線形識別器それぞれの重み及びバイアスを記憶するものとするが、これに限定されるものではない。なお、線形識別器は、2クラスを識別する2クラス識別器であっても、多クラスを識別する多クラス識別器であってもよいが、第1実施形態では、2クラス識別器を例に取り説明する。
例えば、認識対象カテゴリ数がGの場合、2クラスの線形識別器数もGとなるため、第2記憶部17は、線形識別器毎に、入力データが自身の識別対象の認識対象カテゴリg(1≦g≦G)に属する信頼度rを計算するための重み{wg1,…,wgC}とバイアスbを記憶する。なお、線形識別器の重み及びバイアスは、例えば、事前に用意された正解カテゴリが既知の学習サンプルを用いて、カテゴリgに属する学習サンプルとそれ以外のカテゴリに属する学習サンプルの識別境界をSVM(Support Vector Machine)で学習することで求めることができる。
第3算出部18は、第2算出部16により算出された特徴量と第2記憶部17に記憶されている1以上の識別器とを用いて、認識対象カテゴリの信頼度を算出する。具体的には、第3算出部18は、第2算出部16により算出された特徴量と第2記憶部17に記憶されている1以上の識別器とを用いて、1以上の認識対象カテゴリそれぞれの信頼度を算出する。つまり、第3算出部18は、第2記憶部17に記憶されている線形識別器の重み及びバイアス毎に、当該重み及び当該バイアスと第2算出部16により算出された特徴量とを用いて、当該線形識別器が識別する認識対象カテゴリの信頼度を算出する。
第1実施形態では、信頼度は、線形識別器の重みと特徴量との内積と、線形識別器のバイアスと、の和であり、第3算出部18は、例えば、数式(1)を用いて、カテゴリgの信頼度rを算出する。
Figure 2015225410
そして第3算出部18は、算出した1以上の認識対象カテゴリそれぞれの信頼度の中から、認識対象パターンのカテゴリとなる確率が上位となるn(n≧1)個の認識対象カテゴリの信頼度を抽出する。例えば、第3算出部18は、G個の認識対象カテゴリそれぞれの信頼度{r,…,r}を算出した場合、{r,…,r}を大きい順にn個並べ、{u,…,u}とする。これにより、G個の信頼度{r,…,r}の中から、n(個の信頼度{u,…,u}を抽出する。なお、{u,…,u}それぞれのカテゴリ{f,…,f}が、順位が1〜n位となる候補カテゴリとなる。
決定部19は、第3算出部18により算出された信頼度を用いて、1以上の認識対象カテゴリの中から認識対象パターンのカテゴリを決定する。具体的には、決定部19は、第3算出部18により算出されたn個の信頼度のうちいずれかの信頼度を用いて、n個の認識対象カテゴリの中から認識対象パターンのカテゴリを決定する。
例えば、決定部19は、第3算出部18により算出されたn個の信頼度{u,…,u}のうち最も値の大きい最大信頼度(1位累積信頼度)uが閾値Rfix(第2閾値の一例)を超えているか否かを判定し、閾値Rfixを超えている場合、当該最大信頼度uのカテゴリfを認識対象パターンのカテゴリに決定する。
また例えば、決定部19は、最大信頼度uが閾値Rfixを超えていない場合、n個の信頼度{u,…,u}のうち最大信頼度以外の所定信頼度が閾値Rreject(第3閾値の一例)を超えているか否かを判定し、閾値Rrejectを超えている場合、n個の信頼度{u,…,u}のうち当該所定信頼度以上の信頼度の認識対象カテゴリを認識対象パターンのカテゴリの候補に決定する。なお、Rreject<Rfixであるものとする。例えば、所定信頼度が3位累積信頼度uであり、閾値Rrejectを超えていれば、1〜3位累積信頼度{u,u,u}の認識対象カテゴリ{f,f,f}が認識対象パターンのカテゴリの候補となる。
また例えば、決定部19は、所定信頼度が閾値Rrejectを超えていない場合、n個の認識対象カテゴリの中に認識対象パターンのカテゴリは存在しないことを決定する。
但し、認識対象パターンのカテゴリの決定手法は、上記の例に限定されず、例えば、最大信頼度の認識対象カテゴリを認識対象パターンのカテゴリに決定するか、認識対象パターンのカテゴリは存在しないことを決定するかの2通りとしてもよいし、所定信頼度以上の信頼度の認識対象カテゴリを認識対象パターンのカテゴリの候補に決定するか、認識対象パターンのカテゴリは存在しないことを決定するかの2通りとしてもよい。
出力制御部21は、決定部19により決定された認識対象パターンのカテゴリを出力部23に出力させる。
図4は、第1実施形態の認識装置10で行われる認識処理の手順の流れの一例を示すフローチャートである。
まず、取得部11は、認識対象パターンを取得する(ステップS101)。
続いて、第1算出部15は、カテゴリ毎に、取得部11により取得された認識対象パターンと当該カテゴリに属する学習パターンとの距離に対する当該カテゴリに属する学習パターンの数の分布を示す距離ヒストグラムを算出する(ステップS103)。
続いて、第2算出部16は、複数のカテゴリそれぞれの距離ヒストグラムを分析して、認識対象パターンの特徴量を算出する(ステップS105)。
続いて、第3算出部18は、第2算出部16により算出された特徴量と第2記憶部17に記憶されている1以上の識別器とを用いて、1以上の認識対象カテゴリそれぞれの信頼度を算出し、認識対象パターンのカテゴリとなる確率が上位となるn個の認識対象カテゴリの信頼度を抽出する(ステップS106)。
続いて、決定部19は、第3算出部18により算出されたn個の信頼度のうちいずれかの信頼度を用いて、n個の認識対象カテゴリの中から認識対象パターンのカテゴリを決定する認識対象カテゴリ決定処理を行う(ステップS107)。
続いて、出力制御部21は、決定部19により決定された認識対象パターンのカテゴリを出力部23に出力させる(ステップS109)。
図5は、第1実施形態の決定部19で行われるカテゴリ決定処理の手順の流れの一例を示すフローチャートである。
まず決定部19は、第3算出部18により算出されたn個の信頼度{u,…,u}のうち1位累積信頼度uが閾値Rfixを超えているか否かを判定し(ステップS111)、閾値Rfixを超えている場合(ステップS111でYes)、当該1位累積信頼度uのカテゴリfを認識対象パターンのカテゴリに決定する(ステップS113)。
1位累積信頼度uが閾値Rfixを超えていない場合(ステップS111でNo)、決定部19は、n個の信頼度{u,…,u}のうち1位累積信頼度u以外のH位累積信頼度uが閾値Rrejectを超えているか否かを判定し(ステップS115)、閾値Rrejectを超えている場合(ステップS115でYes)、1〜H位累積信頼度{u,…,u}のカテゴリ{f,…,f}を認識対象パターンのカテゴリの候補に決定する(ステップS117)。
H位累積信頼度uが閾値Rrejectを超えていない場合(ステップS115でNo)、決定部19は、認識対象パターンのカテゴリを無しに決定する(ステップS119)。
以上のように第1実施形態によれば、認識対象パターンと各カテゴリの学習パターンとの距離ヒストグラムを利用することで、認識対象パターンと各カテゴリの学習パターン全体との関係を評価することができ、認識精度及びロバスト性を高めたパターン認識を実現することができる。
特に第1実施形態では、認識対象パターンの特徴量を、距離ヒストグラム毎の最頻値となる距離を並べたものとしているため、認識対象パターンと各カテゴリの学習パターン全体との関係を適切に評価することができる。このため、この特徴量と1以上の認識対象カテゴリに属するか否かを識別する1以上の識別器とを用いて、認識対象カテゴリの信頼度を算出し、この信頼度を用いて、1以上の認識対象カテゴリの中から認識対象パターンのカテゴリを決定すれば、認識精度及びロバスト性をより高めたパターン認識を実現することができる。
例えば、第1実施形態において、1以上の認識対象カテゴリの1つを人とすれば、人であるか否かの認識精度及びロバスト性をより高めたパターン認識を実現することができ、車載カメラ用の人物認識などに好適である。
(第2実施形態)
第2実施形態では、距離ヒストグラムを構成する距離毎の学習パターンの数を累積した累積数の割合を示す累積ヒストグラムを更に用いて信頼度を算出する例について説明する。以下では、第1実施形態との相違点の説明を主に行い、第1実施形態と同様の機能を有する構成要素については、第1実施形態と同様の名称・符号を付し、その説明を省略する。
図6は、第2実施形態の認識装置110の一例を示す構成図である。図6に示すように、第2実施形態の認識装置110は、第4算出部125及び第2算出部116が、第1実施形態と相違する。
第4算出部125は、例えば、ソフトウェアにより実現してもよいし、ハードウェアにより実現してもよいし、ソフトウェア及びハードウェアを併用して実現してもよい。
第4算出部125は、カテゴリ毎に、第1算出部15により算出された距離ヒストグラムを構成する距離毎の学習パターン数を累積した累積数の割合を距離毎に示す累積ヒストグラムを算出する。具体的には、第4算出部125は、図7に示すように、カテゴリ毎に、距離ヒストグラムを構成する距離毎の学習パターン数を距離が小さい順に累積した累積数の当該カテゴリに属する学習パターンの合計数に対する割合を距離毎に示す累積ヒストグラムを算出する。
第2算出部116は、複数のカテゴリそれぞれの累積ヒストグラムを分析して、第1算出部15により取得された取得部11により取得された認識対象パターンの特徴量を算出する。第2実施形態では、認識対象パターンの特徴量は、累積ヒストグラム毎に上述した割合が第1閾値に達する距離を並べたものであるものとするが、これに限定されるものではない。
例えば、学習パターンのカテゴリ数をC、カテゴリc(1≦c≦C)の累積ヒストグラムにおいて上述した割合が第1閾値に達する距離をdとする。この場合、第2算出部116は、複数のカテゴリそれぞれの累積ヒストグラムから当該カテゴリの距離dを求めることで得られる{d,…,d}を、認識対象パターンの特徴量とする。
なお特徴量の算出は、上記手法に限定されるものではなく、距離ヒストグラム及び累積ヒストグラムから算出される任意の値を用いて算出すればよい。例えば、複数の閾値を設定して、累積ヒストグラムがそれぞれの閾値に達する距離、カテゴリごとに異なる閾値を設定した場合の閾値に達する距離、累積ヒストグラムを累積数の割合ではなく学習パターンの累積個数とした場合の閾値に達する距離などを用いて特徴量を算出してもよい。
図8は、第2実施形態の認識装置110で行われる認識処理の手順の流れの一例を示すフローチャートである。
まず、ステップS201〜S203までの処理は、図4に示すフローチャートのステップS101〜S103までの処理と同様である。
続いて、第4算出部125は、カテゴリ毎に、第1算出部15により算出された距離ヒストグラムを構成する距離毎の学習パターン数を累積した累積数の割合を距離毎に示す累積ヒストグラムを算出する(ステップS204)。
続いて、第2算出部116は、複数のカテゴリそれぞれの累積ヒストグラムを分析して、認識対象パターンの特徴量を算出する(ステップS205)。
以下、ステップS206〜S209までの処理は、図4に示すフローチャートのステップS106〜S109までの処理と同様である。
以上のように第2実施形態によれば、認識対象パターンと各カテゴリの学習パターンとの累積ヒストグラムを利用することで、認識対象パターンと各カテゴリの学習パターン全体との関係を評価することができ、認識精度及びロバスト性を高めたパターン認識を実現することができる。
(変形例1)
上記各実施形態では、認識対象パターン及び学習パターンが認識対象物を撮像した画像から抽出した特徴ベクトルである例について説明したが、これに限定されず、認識対象物を撮像した画像そのものであってもよい。この場合、認識装置は、抽出部9を備える必要はなく、取得部11は、撮像部7が撮像した画像を取得すればよい。また、第1算出部15は、認識対象パターンと学習パターンとの距離として、例えば、両画像の各ピクセルの画素値の差の合計などを算出して、距離ヒストグラムを算出すればよい。
(変形例2)
上記各実施形態では、認識装置が撮像部7及び抽出部9を備える例について説明したが、認識装置は、これらの構成を備えていなくてもよい。この場合、外部で認識対象パターンを生成し、この認識対象パターンを取得部11が取得したり、第1記憶部13に認識対象パターンを記憶しておき、この認識対象パターンを取得部11が取得したりすればよい。
(ハードウェア構成)
図9は、上記各実施形態及び変形例の認識装置のハードウェア構成の一例を示す図である。上記各実施形態及び変形例の認識装置は、CPUなどの制御装置902と、ROMやRAMなどの記憶装置904と、HDDなどの外部記憶装置906と、ディスプレイなどの表示装置908と、キーボードやマウスなどの入力装置910と、デジタルカメラなどの撮像装置912と、を備えており、通常のコンピュータを利用したハードウェア構成となっている。
上記各実施形態及び変形例の認識装置で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD(Digital Versatile Disk)、フレキシブルディスク(FD)等のコンピュータで読み取り可能な記憶媒体に記憶されて提供される。
また、上記各実施形態及び変形例の認識装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。また、上記各実施形態及び変形例の認識装置で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するようにしてもよい。また、上記各実施形態及び変形例の認識装置で実行されるプログラムを、ROM等に予め組み込んで提供するようにしてもよい。
上記各実施形態及び変形例の認識装置で実行されるプログラムは、上述した各部をコンピュータ上で実現させるためのモジュール構成となっている。実際のハードウェアとしては、CPUがHDDからプログラムをRAM上に読み出して実行することにより、上記各部がコンピュータ上で実現されるようになっている。
なお、本発明は、上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせても良い。
例えば、上記各実施形態のフローチャートにおける各ステップを、その性質に反しない限り、実行順序を変更し、複数同時に実施し、あるいは実施毎に異なった順序で実施してもよい。
以上のように、上記各実施形態及び変形例によれば、認識精度及びロバスト性を高めることができる。
7 撮像部
9 抽出部
10、110 認識装置
11 取得部
13 第1記憶部
15 第1算出部
16、116 第2算出部
17 第2記憶部
18 第3算出部
19 決定部
21 出力制御部
23 出力部
125 第4算出部
902 制御装置
904 記憶装置
906 外部記憶装置
908 表示装置
910 入力装置
912 撮像装置

Claims (13)

  1. 各学習パターンが複数のカテゴリのいずれかに属する複数の学習パターンを記憶する第1記憶部と、
    認識対象の認識対象パターンを取得する取得部と、
    前記カテゴリ毎に、前記認識対象パターンと当該カテゴリに属する学習パターンとの距離に対する当該カテゴリに属する学習パターンの数の分布を示す距離ヒストグラムを算出する第1算出部と、
    前記複数のカテゴリそれぞれの前記距離ヒストグラムを分析して、前記認識対象パターンの特徴量を算出する第2算出部と、
    前記特徴量と1以上の認識対象カテゴリに属するか否かを識別する1以上の識別器とを用いて、前記認識対象カテゴリの信頼度を算出する第3算出部と、
    前記信頼度を用いて、前記1以上の認識対象カテゴリの中から前記認識対象パターンのカテゴリを決定する決定部と、
    前記認識対象パターンの決定された前記カテゴリを出力する出力部と、
    を備える認識装置。
  2. 前記第3算出部は、前記1以上の認識対象カテゴリそれぞれの信頼度を算出して、前記認識対象パターンのカテゴリとなる確率が上位となるn(n≧1)個の認識対象カテゴリの信頼度を抽出し、
    前記決定部は、前記n個の信頼度のうちいずれかの信頼度を用いて、前記n個の認識対象カテゴリの中から前記認識対象パターンの前記カテゴリを決定する請求項1に記載の認識装置。
  3. 前記1以上の識別器は、1以上の線形識別器であり、
    前記1以上の線形識別器それぞれの重み及びバイアスを記憶する第2記憶部を更に備え、
    前記第3算出部は、前記線形識別器の重み及びバイアス毎に、当該重み及び当該バイアスと前記特徴量とを用いて、当該線形識別器が識別する認識対象カテゴリの信頼度を算出する請求項2に記載の認識装置。
  4. 前記信頼度は、前記線形識別器の重みと前記特徴量との内積と、前記線形識別器のバイアスと、の和である請求項3に記載の認識装置。
  5. 前記特徴量は、前記距離ヒストグラム毎の最頻値となる距離を並べたものである請求項1に記載の認識装置。
  6. 前記カテゴリ毎に、前記距離ヒストグラムを構成する前記数を累積した累積数の割合を前記距離毎に示す累積ヒストグラムを算出する第4算出部を更に備え、
    前記第2算出部は、前記複数の累積ヒストグラムを分析して、前記特徴量を算出する請求項1に記載の認識装置。
  7. 前記複数のカテゴリそれぞれの前記累積ヒストグラムは、当該カテゴリの前記距離ヒストグラムを構成する前記数を距離が小さい順に累積した累積数の当該カテゴリに属する学習パターンの合計数に対する割合を距離毎に示し、
    前記特徴量は、前記累積ヒストグラム毎に前記割合が第1閾値に達する距離を並べたものである請求項6に記載の認識装置。
  8. 前記決定部は、前記n個の信頼度のうち最も値の大きい最大信頼度が第2閾値を超えているか否かを判定し、前記第2閾値を超えている場合、当該最大信頼度の認識対象カテゴリを前記認識対象パターンの前記カテゴリに決定する請求項2に記載の認識装置。
  9. 前記決定部は、前記n個の信頼度のうち最も値の大きい最大信頼度以外の所定信頼度が第3閾値を超えているか否かを判定し、前記第3閾値を超えている場合、前記n個の信頼度のうち当該所定信頼度以上の信頼度の認識対象カテゴリを前記認識対象パターンの前記カテゴリの候補に決定する請求項2に記載の認識装置。
  10. 前記決定部は、前記所定信頼度が前記第3閾値を超えていない場合、前記n個の認識対象カテゴリの中に前記認識対象パターンのカテゴリは存在しないことを決定する請求項9に記載の認識装置。
  11. 認識対象物を撮像して画像を得る撮像部と、
    前記画像から前記認識対象パターンを抽出する抽出部と、を更に備え、
    前記取得部は、抽出された前記認識対象パターンを取得する請求項1に記載の認識装置。
  12. 認識対象の認識対象パターンを取得する取得ステップと、
    各学習パターンが複数のカテゴリのいずれかに属する複数の学習パターンを記憶する記憶部から、前記複数の学習パターンを取得し、前記カテゴリ毎に、前記認識対象パターンと当該カテゴリに属する学習パターンとの距離に対する当該カテゴリに属する学習パターンの数の分布を示す距離ヒストグラムを算出する第1算出ステップと、
    前記複数のカテゴリそれぞれの前記距離ヒストグラムを分析して、前記認識対象パターンの特徴量を算出する第2算出ステップと、
    前記特徴量と1以上の認識対象カテゴリに属するか否かを識別する1以上の識別器とを用いて、前記認識対象カテゴリの信頼度を算出する第3算出ステップと、
    前記信頼度を用いて、前記1以上の認識対象カテゴリの中から前記認識対象パターンのカテゴリを決定する決定ステップと、
    前記認識対象パターンの決定された前記カテゴリを出力する出力ステップと、
    を含む認識方法。
  13. 認識対象の認識対象パターンを取得する取得ステップと、
    各学習パターンが複数のカテゴリのいずれかに属する複数の学習パターンを記憶する記憶部から、前記複数の学習パターンを取得し、前記カテゴリ毎に、前記認識対象パターンと当該カテゴリに属する学習パターンとの距離に対する当該カテゴリに属する学習パターンの数の分布を示す距離ヒストグラムを算出する第1算出ステップと、
    前記複数のカテゴリそれぞれの前記距離ヒストグラムを分析して、前記認識対象パターンの特徴量を算出する第2算出ステップと、
    前記特徴量と1以上の認識対象カテゴリに属するか否かを識別する1以上の識別器とを用いて、前記認識対象カテゴリの信頼度を算出する第3算出ステップと、
    前記信頼度を用いて、前記1以上の認識対象カテゴリの中から前記認識対象パターンのカテゴリを決定する決定ステップと、
    前記認識対象パターンの決定された前記カテゴリを出力する出力ステップと、
    をコンピュータに実行させるためのプログラム。
JP2014108495A 2014-05-26 2014-05-26 認識装置、方法及びプログラム Abandoned JP2015225410A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014108495A JP2015225410A (ja) 2014-05-26 2014-05-26 認識装置、方法及びプログラム
US14/721,045 US20150363667A1 (en) 2014-05-26 2015-05-26 Recognition device and method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014108495A JP2015225410A (ja) 2014-05-26 2014-05-26 認識装置、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2015225410A true JP2015225410A (ja) 2015-12-14

Family

ID=54836426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014108495A Abandoned JP2015225410A (ja) 2014-05-26 2014-05-26 認識装置、方法及びプログラム

Country Status (2)

Country Link
US (1) US20150363667A1 (ja)
JP (1) JP2015225410A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018189962A1 (ja) * 2017-04-12 2018-10-18 株式会社日立製作所 物体認識装置、物体認識システム、及び物体認識方法
US10395098B2 (en) 2016-02-16 2019-08-27 Samsung Electronics Co., Ltd. Method of extracting feature of image to recognize object

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3033068B1 (fr) * 2015-02-24 2017-03-10 Ifp Energies Now Procede de segmentation de l'image d'un objet reconstruit par reconstruction tridimensionnelle
JP7035827B2 (ja) * 2018-06-08 2022-03-15 株式会社リコー 学習識別装置および学習識別方法
US11094376B2 (en) * 2019-06-06 2021-08-17 Stmicroelectronics International N.V. In-memory compute array with integrated bias elements

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720291B2 (en) * 2004-02-17 2010-05-18 Corel Corporation Iterative fisher linear discriminant analysis
US7991199B2 (en) * 2007-06-29 2011-08-02 Microsoft Corporation Object identification and verification using transform vector quantization
US8014973B1 (en) * 2007-09-07 2011-09-06 Kla-Tencor Corporation Distance histogram for nearest neighbor defect classification
JP6112801B2 (ja) * 2012-08-22 2017-04-12 キヤノン株式会社 画像認識装置及び画像認識方法
JP2014123184A (ja) * 2012-12-20 2014-07-03 Toshiba Corp 認識装置、方法及びプログラム
US9436890B2 (en) * 2014-01-23 2016-09-06 Samsung Electronics Co., Ltd. Method of generating feature vector, generating histogram, and learning classifier for recognition of behavior

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10395098B2 (en) 2016-02-16 2019-08-27 Samsung Electronics Co., Ltd. Method of extracting feature of image to recognize object
WO2018189962A1 (ja) * 2017-04-12 2018-10-18 株式会社日立製作所 物体認識装置、物体認識システム、及び物体認識方法
JP2018180879A (ja) * 2017-04-12 2018-11-15 株式会社日立製作所 物体認識装置、物体認識システム、及び物体認識方法
US10963736B2 (en) 2017-04-12 2021-03-30 Hitachi, Ltd. Object recognition apparatus, object recognition system, and object recognition method

Also Published As

Publication number Publication date
US20150363667A1 (en) 2015-12-17

Similar Documents

Publication Publication Date Title
US9002101B2 (en) Recognition device, recognition method, and computer program product
KR101725651B1 (ko) 식별 장치 및 식별 장치의 제어 방법
JP6544900B2 (ja) オブジェクト識別装置、オブジェクト識別方法及びプログラム
JP5214760B2 (ja) 学習装置、方法及びプログラム
US9639779B2 (en) Feature point detection device, feature point detection method, and computer program product
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
US9842279B2 (en) Data processing method for learning discriminator, and data processing apparatus therefor
US20190370982A1 (en) Movement learning device, skill discriminating device, and skill discriminating system
JP2015225410A (ja) 認識装置、方法及びプログラム
US10635991B2 (en) Learning method, information processing device, and recording medium
JP2018045516A (ja) 分類装置、分類方法およびプログラム
JP2016191975A (ja) 機械学習装置
JP2017102906A (ja) 情報処理装置、情報処理方法及びプログラム
JP5214679B2 (ja) 学習装置、方法及びプログラム
CN113963303A (zh) 图像处理方法、视频识别方法、装置、设备及存储介质
JP2015194927A (ja) 対象識別装置
JP2015035172A (ja) 表情解析装置及び表情解析プログラム
KR101521136B1 (ko) 얼굴 인식 방법 및 얼굴 인식 장치
JP2017084006A (ja) 画像処理装置およびその方法
US9390347B2 (en) Recognition device, method, and computer program product
JP2016099716A (ja) システム、識別装置、識別モデル生成装置、情報処理方法及びプログラム
JP2014199533A (ja) 画像識別装置、画像識別方法およびプログラム
JP6453618B2 (ja) 算出装置、方法及びプログラム
JP6511942B2 (ja) 情報処理装置および情報処理プログラム
US20230377188A1 (en) Group specification apparatus, group specification method, and computer-readable recording medium

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160912

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20170111