JP4514687B2 - パターン認識装置 - Google Patents

パターン認識装置 Download PDF

Info

Publication number
JP4514687B2
JP4514687B2 JP2005308933A JP2005308933A JP4514687B2 JP 4514687 B2 JP4514687 B2 JP 4514687B2 JP 2005308933 A JP2005308933 A JP 2005308933A JP 2005308933 A JP2005308933 A JP 2005308933A JP 4514687 B2 JP4514687 B2 JP 4514687B2
Authority
JP
Japan
Prior art keywords
feature
recognition
unit
vector
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005308933A
Other languages
English (en)
Other versions
JP2006155594A (ja
Inventor
謙太朗 横井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005308933A priority Critical patent/JP4514687B2/ja
Priority to US11/269,430 priority patent/US20060100872A1/en
Publication of JP2006155594A publication Critical patent/JP2006155594A/ja
Application granted granted Critical
Publication of JP4514687B2 publication Critical patent/JP4514687B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像などのパターン情報をもとに、異常を検出したり、対象を検出・識別する、パターン認識技術に関する。
従来、パラメトリックな手法により対象を認識・識別する手法が提案されている(例えば、非特許文献1)。この手法では、パターンの分布がガウス分布などの既知のモデルに従うと仮定している。部分空間法は、この手法の一例である。
また、モデルを仮定しないノンパラメトリックな手法も提案されている(例えば、特許文献1、特許文献2)。この手法では、各画素の輝度の事後確率に基づいて、背景か否かを識別している。
特許第3486229号公報 特許第3490196号公報 関真規人、他2名、「背景変動に頑健な背景差分法」、画像の認識理解シンポジウム MIRU-2000、Vol.2、pp.403-408、2000年7月
パラメトリックな手法では仮定されたパターン分布が用いられるので、画像間に位置ズレが無いことが必要である。そのために、画像間で共通な複数の特徴点の位置、および、形状に基づいて、パターンの位置合わせ、および、変形が行われる。
しかし、位置合わせが困難な場合がある。例えば、明確な特徴点の定義が困難な場合、あるいは、特徴点のマッチングが困難な場合である。また、位置ズレ自体が特徴量である場合、位置合わせによって特徴情報が失われる。逆に位置合わせを行わない場合、パターンの分布は必ずしもモデルに適合しないため、認識性能が低下する。
特許文献1や特許文献2に記載されたノンパラメトリックな手法では、ピクセルの輝度の事後確率に基づいて背景か否かを識別するため、画像間に位置ズレが無いことが前提となっている。そのため、位置ズレがある場合に対応することは困難である。また、ピクセルという大変局所的な情報のみで判定を行うために認識が不安定になることがある。
そこで、本発明では、ノンパラメトリックな手法でありながら位置ズレに対して頑健なパターン認識手法を提供することを目的とする。
上記の課題を解決するために、本発明の一実施形態のパターン認識装置は、学習対象の画像および認識対象の画像を入力する画像入力部と、前記学習対象及び前記認識対象に関して入力された画像の各々の特徴量ベクトルを算出する特徴量ベクトル算出部と、前記学習対象の各々に関する前記特徴量ベクトルの確率分布の、特徴量ベクトル空間内における算出対象範囲を設定する算出対象範囲設定部と、前記学習対象の各々の前記確率分布を、前記算出対象範囲内で算出する確率分布算出部と、前記学習対象の各々の識別子、および、前記学習対象の各々の前記確率分布を関連付けて記憶する確率分布記憶部と、前記認識対象について算出された特徴量ベクトル、および、前記確率分布記憶部に記憶された確率分布を用いて、前記認識対象が前記学習対象の各々と対応する確率である事後確率を算出する事後確率算出部と、前記事後確率に基づいて前記認識対象の認識を行う認識部と、を備え、前記特徴量ベクトル算出部は、入力された画像の各々について複数の特徴量を求め、これらの特徴量を成分として有する原特徴量ベクトルを求める手段と、同一の学習対象に関する前記原特徴量ベクトルに対して主成分分析を行ってL個の固有値およびL個の固有ベクトルを求め、前記原特徴量ベクトルおよび前記L個の固有ベクトルを用いてL次元の前記特徴量ベクトルを算出する手段と、を備え、前記算出対象範囲設定部は、前記算出対象範囲を、前記特徴量ベクトルの平均を中心として前記固有値の大きさに応じた距離の範囲内に設定する
本発明によれば、位置ズレに対して頑健な認識処理を実現できる。
(第1の実施形態)以下、図面を参照して本発明の第1の実施形態を説明する。
図1は第1の実施形態のパターン認識装置のブロック図である。このパターン認識装置は、画像を入力する画像入力部110と、学習対象の識別子を入力する識別子入力部111と、入力された画像の特徴量ベクトルとその固有値とを抽出する特徴量抽出部101と、特徴量抽出部101が用いるデータ(入力された画像に関する情報)および特徴量抽出部101が生成したデータ(特徴量ベクトル空間を規定するパラメータ)を記憶するパラメータ記憶部113とを備える。
このパターン認識装置は、特徴量ベクトル空間において特徴量ベクトルの確率分布を求める範囲(算出対象範囲)を、求められた特徴量ベクトルと固有値とに基づいて設定する算出対象範囲設定部102と、特徴量ベクトルの確率分布を算出対象範囲内で算出する確率分布算出部103と、求められた確率分布を学習対象の識別子と関連付けて記憶する確率分布記憶部104とを備える。
このパターン認識装置は、認識対象の画像から求められた特徴量ベクトルと確率分布記憶部104に記憶された学習対象の確率分布とを用いて、認識対象が学習対象の各々に該当する確率である事後確率を算出する事後確率算出部105と、求められた事後確率を比較して認識対象の認識結果を出力する事後確率比較部106とを備える。
このパターン認識装置は2種類の処理モードを持つ。一つは学習処理モードで、もう一つは認識処理モードである。モード切替部112は特徴量抽出部101と事後確率算出部105とに各モードに対応する制御信号を送ることにより、動作モードを切り替える。
学習処理モードの場合、モード切替部112は学習処理モード用の制御信号を送る。特徴量抽出部101はこの制御信号を受けると、抽出した特徴量ベクトル等を算出対象範囲設定部102に出力するようになる。また、事後確率算出部105はこの制御信号を受けると、事後確率の算出処理を停止する。
認識処理モードの場合、モード切替部112は認識処理モード用の制御信号を送る。特徴量抽出部101はこの制御信号を受けると、抽出した特徴量ベクトル等を事後確率算出部105に出力するようになる。また、事後確率算出部105はこの制御信号を受けると、事後確率の算出処理を開始する。
各処理モードにおける動作の概要を説明する。学習処理モードでは、特徴量抽出部101が学習対象の画像の特徴量ベクトルを求め、確率分布算出部103が学習対象の特徴量ベクトルの確率分布を求め、確率分布記憶部104が学習対象の確率分布を辞書として記憶する。
認識処理モードでは、特徴量抽出部101が認識対象の画像の特徴量ベクトルを求め、事後確率算出部105が認識対象の特徴量ベクトルと確率分布記憶部104に記憶された確率分布とを用いて、認識対象が学習対象の各々に該当する確率である事後確率を算出し、事後確率比較部106が事後確率に基づいて認識を行う。
図2は、学習処理の流れ図であり、図3は、認識処理の流れ図である。本実施形態のパターン認識装置は、縦m画素×横n画素のm×n次元の画像パターンを用いて学習処理および認識処理を行う。
(学習処理の説明)まず、図2を参照して学習処理を説明する。
(ステップS201)特徴量抽出処理
特徴量抽出部101は、入力された学習対象の画像から原特徴量ベクトルxを抽出する。原特徴量ベクトルとは、ベクトルの各成分が画像中の情報を反映した量を有するベクトルである。画像中の情報を反映した量とは、例えば、画像中のエッジ情報、画像中のエッジの角度情報、あるいは、各画素の輝度値そのものである。
本実施形態のパターン認識装置は各画素の輝度値そのものを用いる。したがって、特徴量抽出部101は、学習対象の画像からm×n次元の原特徴量ベクトルxを抽出する。
この原特徴量ベクトルxのそれぞれは、本実施形態における入力パターンに相当する。
(ステップS202)主成分分析処理
特徴量抽出部101は、すべての原特徴量ベクトルxに対して主成分分析を行い、各原特徴量ベクトルxに対応するL次元の特徴量ベクトルyと、L個の固有値λとを求める(ただしL≦m×nである)。
このL次元の特徴量ベクトルyのそれぞれは、本実施形態のパターン認識装置が用いる処理用パターンに相当する。すなわち、このステップS202では、m×n次元の入力パターンに対して主成分分析を行い、L次元の処理用パターンを生成する。
より具体的には、特徴量抽出部101は複数の原特徴量ベクトルxに対して主成分分析を行い、平均原特徴量ベクトルx_{ave}、固有値の大きい上位L個の固有値λ_{i}(i=1, 2, ... , L)、および、これらの固有値に対応するL個の固有ベクトルφ_{i}(i=1, 2, ... , L)とを計算する。
なお、原特徴量ベクトルxがm×n次元のベクトルであるので、平均原特徴量ベクトルx_{ave}および固有ベクトルφ_{i}はm×n次元のベクトルである。
そして特徴量抽出部101は、L次元の特徴量ベクトルyを
y=[φ_{1}, φ_{2}, ... , φ_{L}](x−x_{ave})
という関係式により求める。
さらに、平均特徴量ベクトルy_{ave}を
y_{ave}=[φ_{1}, φ_{2}, ... , φ_{L}]x_{ave}
という関係式により求める。
なお、説明の便宜上、原特徴量ベクトルx、平均原特徴量ベクトルx_{ave}、および、固有ベクトルφ_{i}は列ベクトルであるものとし、[φ_{1}, φ_{2}, ... , φ_{L}]はL個の固有ベクトルφ_{i}の各々を転置したものを行成分として有するL行(m×n)列の行列であるものとする。
すなわち、特徴量ベクトルyは、L個の固有ベクトルφ_{i}を用いて原特徴量ベクトルx(あるいは原特徴量ベクトルxと平均原特徴量ベクトルx_{ave}との差分)をL次元の空間に射影したものである。
特徴量抽出部101は、平均特徴量ベクトルy_{ave}と、L個の固有値λ_{i}(i=1, 2, ... , L)と、識別子入力部111に入力された学習対象の識別子c_{j}(j=1, 2, ... , C)と、L次元特徴量ベクトルyとを算出対象範囲設定部102に出力する。このとき、複数のL次元特徴量ベクトルyの各々は、学習対象の識別子c_{j}と関連付けて出力される。尚、以下の説明では「識別子c_{j}によって識別される学習対象に関する集合」を「クラスc_{j}」と記載する。
また、特徴量抽出部101は、原特徴量ベクトルx、識別子c_{j}、L個の固有値λ_{i}、固有ベクトルφ_{i}および平均原特徴量ベクトルx_{ave}をパラメータ記憶部113に出力する。パラメータ記憶部113は、原特徴量ベクトルx識別子c_{j}と対応づけて記憶する。パラメータ記憶部113は、各固有値とそれぞれに対応する固有ベクトルとを対応付けて記憶する。
(ステップS203)算出対象範囲の制限
算出対象範囲設定部102は、L次元の特徴量ベクトル空間Y内で特徴量ベクトルyの確率分布を求める範囲(算出対象範囲)を、L個の固有値λ_{i}(i=1, 2, ... , L)を用いて設定する。
具体的には、図5に示すように、特徴量ベクトル空間Yにおいて、平均特徴量ベクトルy_{ave}を中心として、半径rλ_{i}(i=1, 2, ... , L)の範囲に限定する。すなわち、特徴量ベクトル空間Yの第i次元に対しては、平均特徴量ベクトルy_{ave}の第i次元成分であるy_{ave}^{i}を中心として半径rλ_{i}の範囲に限定する。各学習対象の確率分布は、この算出対象範囲内で求められる。
特徴量ベクトル空間Yは無限の広がりを有する。確率分布の計算を有限時間で数値的に算出するためには、算出範囲を限定する必要がある。本実施形態の算出手法の場合、確率分布の範囲がガウス分布で限定できるとすれば、r=3の時に全分布の99.74%が含まれ、r=4の時に全分布の99.99%が含まれる。よって、限定された空間であっても十分な精度で確率分布を算出することが可能である。
(ステップS204)確率分布の算出
確率分布算出部103は、L次元の特徴量ベクトル空間Y内で特徴量ベクトルyの確率分布を、ステップS203で設定した算出対象範囲内で算出する。確率分布は、各学習対象ごとに算出される。すなわち、一つのクラスc_{j}につき一つの確率分布が算出される。
確率分布算出部103は、同一のクラスc_{j}に属する特徴量ベクトルyについて、特徴量ベクトル空間Yに例えば「Parzen窓」と呼ばれる手法を適用して確率分布を求める。「Parzen窓」の詳細は、Richard O. Duda, Peter E. Hart, and David G. Stork. "Pattern Classification (Second Edition). Wiley Interscience, 2000に記載されているので、本明細書では図4を参照して概要を説明する。
確率分布算出部103は、特徴量ベクトル空間YをW個のL次元超立体w_{k}に分割する。L次元超立体w_{k}の体積v_{k}は、本実施形態では特徴量ベクトルyの数aに反比例させる。尚、aの正の平方根などに反比例させても構わない。
ここで、超立体w_{k}に含まれ、クラスc_{j}に属する、特徴量ベクトルの数をnum_{k}(c_{j})と表す。確率分布算出部103は、確率分布p(y|c_{j})を以下の数式に基づいて計算する。
Figure 0004514687
(ステップS205)確率分布の記憶
確率分布記憶部104は、確率分布p(y∈w_{k}|c_{j})をクラスc_{j}と超立体w_{k}とに関連付けて記憶する。
以上が、学習処理の詳細な流れである。
(認識処理の説明)次に、図3を参照して認識処理について説明する。
(ステップS301)特徴量抽出処理
特徴量抽出部101は、ステップS201と同様にして、入力された認識対象の画像から原特徴量ベクトルxを抽出する。本実施形態のパターン認識装置は各画素の輝度値そのものを特徴量として扱う。したがって、特徴量抽出部101は、認識対象の画像からm×n次元の原特徴量ベクトルxを抽出する。
(ステップS302)主成分分析処理
特徴量抽出部101は、認識対象について求められた原特徴量ベクトルxからL次元の特徴量ベクトルyを求める。特徴量抽出部101は、パラメータ記憶部113から読み出した平均原特徴量ベクトルx_{ave}と固有ベクトルφ_{i}とを用いて、L次元の特徴量ベクトルyを
y=[φ_{1}, φ_{2}, ... , φ_{L}](x−x_{ave})
という関係式により求める。
特徴量抽出部101は、複数のL次元特徴量ベクトルyを事後確率算出部105に出力する。
(ステップS303)事後確率の算出
事後確率算出部105は、超立体w_{k}の中から各特徴量ベクトルyが属するものを探索する。以下の説明では、各特徴量ベクトルyが属する超立体を超立体w_{K}と表す。そして、事後確率算出部105は、各特徴量ベクトルyが属する超立体w_{K}における、その特徴量ベクトルyの属するクラスc_{j}に対する事後確率p(c_{j}|y∈w_{K})を求める。
事後確率p(c_{j}|y∈w_{K})は、ベイズの定理に基づいて以下の数式で表される。
Figure 0004514687
ここで、p(y)はすべてのクラスc_{j}に共通であるので無視できる。よって、事後確率算出部105は以下の数式を用いて事後確率p(c_{j}|y∈w_{K})を求める。
Figure 0004514687
なお、p(c_{j})はクラスc_{j}の出現確率(事前確率)に相当する。すなわち、学習済みの各学習対象が認識時に出現する確率に相当する。したがって、すべての学習対象が等確率で出現するという仮定が良い近似であるならば、事前確率p(c_{j})は定数項とみなせる。この仮定が成り立つ場合とは、例えば、学習対象がランダムに出現する場合が挙げられる。また、特定の学習対象が出現しやすい場合は、出現頻度を学習することにより事前確率p(c_{j})の値を決定することができる。
確率分布p(y∈w_{K}|c_{j})は、学習処理の際に確率分布記憶部104に記憶されている。よって、事後確率算出部105は、上記の数3に基づいて、ある認識対象から求められた特徴量ベクトルyがあるクラスc_{j}に属する事後確率p(c_{j}|y)を求めることができる。
(ステップS304)認識
事後確率比較部106は、求められた事後確率の中から最大の事後確率p(c_{J}|y)を探索する。そして、事後確率比較部106は、最大の事後確率p(c_{J}|y)に対応するクラスc_{J}を求める。事後確率比較部106は、認識対象がクラスc_{J}に属すると判定する。
なお、最大の事後確率p(c_{J}|y)が閾値を超えない場合、認識対象は学習対象のいずれでもないと判断されるように、事後確率比較部106が構成されていても構わない。
以上が、認識処理の詳細な流れである。第1の実施形態のパターン認識装置は、以上に説明したパターン認識手法を用いているので、例えば、位置合わせが十分でない画像に対する対象物の認識、および、位置ズレ自体が特徴となるパターン認識・検出が実現可能となる。すなわち、位置合わせをせずに認識処理を行うことができるので、位置ズレに対して頑健である。
(第1の実施形態と参考例との比較)以下、図6を参照して、第1の実施形態と参考例との差異を説明する。
第1の参考例は背景差分法である。背景差分法は、図6(a)に示すように、ある注目画素が背景であればその輝度Iの分布はガウス分布に従うと仮定する手法である。そして、入力画像における注目画素の輝度Iと予め学習した背景画像における同じ画素の平均輝度との差が所定の閾値以下であれば背景(通常)と判定され、そうでなければ侵入者(異常)と判定される。
第2の参考例はピクセルの事後確率に基づく手法である。上述の特許文献1および特許文献2は、この手法の一例である。この手法は、図6(b)に示すように、背景に関する学習画像における注目画素の輝度Iの確率分布p(I|背景)からベイズの定理に従って入力画像における注目画素の事後確率p(背景|I)を求める。そして、この手法は、事後確率p(背景|I)と閾値との比較により、背景か否かを判定する。
第3の参考例は部分空間に基づく手法である。上述の非特許文献1は、この手法の一例である。この手法は、図6(c)に示すようにパターンの分布がガウス分布等のモデルに従うと仮定する。そして、この手法は、入力画像内の注目領域のパターンがクラスc_{i}のパターン分布に十分近ければそのクラスc_{i}(例えば、背景)にであると判定し、そうでなければ別のクラス(例えば、侵入者)と判定する。
これに対して第1の実施形態の手法は、第2の参考例の手法をパターン空間に拡張したもの(あるいは、第3の部分空間法を、モデルを仮定しないノンパラメトリックな手法に拡張したもの)である(図6(d)に相当する)。局所的な情報であるピクセルの輝度の代わりにパターンの分布を利用することにより、第1の実施形態の手法は位置ズレを許容する。また、位置ズレがあるパターンの分布はガウス分布等のモデルに適合しない。そのため、第1の実施形態の手法はモデルを仮定しない。第1の実施形態の手法は、学習対象の画像における特徴量ベクトル(注目パターン)yの確率分布p(y|c_{i})と数2の数式とを用いて、認識対象の画像における注目パターンの事後確率p(c_{i}|y)を求める。そして、第1の実施形態の手法は、事後確率p(c_{i}|y)の大きさに基づいて、認識対象がクラスc_{i}に属するか否かを判定する。
(第1の実施形態1の変形例)以下、第1の実施形態の変形例を説明する。
第1の実施形態において事後確率を算出する際に、Parzen窓の代わりにk最近傍法(k-Nearest Neighbor)を用いることができる。図7はk最近傍法を用いる場合のブロック図である。
本変形例のパターン認識装置は、学習特徴量ベクトル記憶部107を有する点で第1の実施形態のパターン認識装置と異なる。以下では、この異なる点を中心に説明する。
学習特徴量ベクトル記憶部107は、特徴量抽出部101が学習処理の際に求めたL次元特徴量ベクトルのうちのD個を記憶する。そして、事後確率算出部105が事後確率を算出する際に、事後確率算出部105はD個の学習特徴量ベクトルの中から認識対象の画像から求められた特徴量ベクトルyとの距離が近い上位k個を選択する。そして、事後確率算出部105は、k個の学習特徴量ベクトルのうちクラスc_{j}に属するものがk_{j}個であった場合に、以下の式を用いて事後確率を算出する。
Figure 0004514687
もしくは、D個の学習特徴量ベクトルの中から、クラスc_{j}に属して、かつ、特徴量ベクトルyとの距離が近い上位k個の学習特徴量ベクトルを抽出し、それらの特徴量ベクトルyに対する距離dist(y,c_{j},m)(m=1,・・・,k)に基づいて以下の式を用いて事後確率を算出しても構わない。
Figure 0004514687
なお、事後確率算出部105は、数4の数式あるいは数5の数式を用いて算出した事後確率と、数2の数式を用いて算出した事後確率とを単純平均もしくは加重平均したものを最終的な事後確率として出力しても構わない。このようにすると、事後確率の算出結果が安定すると考えられる。
第1の実施形態の特徴量抽出部101は、縦m画素×横n画素の画像の各画素の輝度値を特徴量としてm×n次元の原特徴量ベクトルxを抽出している。変形例の特徴量抽出部101は、縦m画素×横n画素の画像を所定サイズ(例えば8画素×8画素)の複数のブロックに分割する。そして、各ブロック内の各画素の輝度値を特徴量として64次元の原特徴量ベクトルx_{s}(s=1,・・・,分割数)を抽出する。
変形例の特徴量抽出部101は、抽出された原特徴量ベクトルx_{s}に対して、ブロック単位で主成分分析を行う。例えば、複数の画像が入力された場合であれば、画像間で同じ位置のブロックから抽出された複数の原特徴量ベクトルx_{s}を対象に主成分分析を行う。そして、ブロック単位で確率分布の算出を行う。
認識処理についても同様で、認識対象からブロック単位で特徴量ベクトルyを求め、ブロック単位で事後確率を算出する。そして、全体の事後確率は、例えば各ブロックの事後確率の積により求めることができる。あるいは、所定の閾値以上の事後確率を有するブロックの個数、比率、集積度、密度に応じて認識処理を行うこともできる。また、異常状態と正常状態とを監視するシステムに応用するならば、ブロック単位で正常・異常を判定することも可能である。
(第2の実施形態)以下、図面を参照して本発明の第2の実施形態を説明する。
第1の実施形態のパターン認識装置は、クラスc_{j}の事後確率とその他のクラスc_{g}の事後確率とを比較して認識を行った。しかし、すべてのクラスの特徴量ベクトルを求められるとは限らない。
例えば、正常状態と異常状態とを認識・判別する監視システムの場合、正常状態に相当する正常状態クラスc_{0}の特徴量ベクトルを得ることは容易である。しかし、異常状態に相当する異常状態クラスc_{1}の特徴量ベクトルを得ることが困難な場合が少なくない。例えば、建物を監視するシステムに火災状態を学習させるために、監視対象の建物に火を放つようなことは現実的でない。
このようなシステムの場合、正常状態からの乖離がある閾値を超えた場合に異常状態と判定するという処理がしばしば行われるが、閾値設定の妥当性が問題となる。そこで、本実施形態のパターン認識装置は、特徴量ベクトルを得ることが困難なクラスについて事後確率を算出するための確率分布を推定して認識を行う。
図8は、本実施形態のパターン認識装置のブロック図である。本実施形態のパターン認識装置は、仮確率分布算出部108を備える点で、第1の実施形態のパターン認識装置と異なる。以下、第1の実施形態と異なる部分を中心に説明する。
仮確率分布算出部108は、特徴量ベクトルを得ることが困難なクラスについて事後確率を算出するための仮確率分布を算出する。仮確率分布算出部108は、これまでに学習した他のクラスの確率分布を用いて仮確率分布を算出する。本実施形態では、仮確率分布として一様な分布を用いる。
図9は、本実施形態のパターン認識装置の認識処理の流れである。基本的には図3に示した第1の実施形態と同様であるが、仮確率分布の算出を行うステップ(ステップS900)がある点と、事後確率の算出ステップ(ステップS303)では仮確率分布も用いて事後確率を算出する点が異なる。第1の実施形態と異なる点を中心に認識処理を説明する。
(ステップS900)仮確率分布の算出
仮確率分布算出部108は、ある範囲に一様に分布する確率分布を求める。そのために、仮確率分布算出部108は、分布範囲を求める。
仮確率分布算出部108は、パラメータ記憶部113から平均原特徴量ベクトルx_{ave}と固有ベクトルφ_{i}とを読み出して、平均特徴量ベクトルy_{ave}を
y_{ave}=[φ_{1}, φ_{2}, ... , φ_{L}](x_{ave})
という式を用いて求める。この平均特徴量ベクトルy_{ave}は仮確率分布の中心を定める。
仮確率分布算出部108は、パラメータ記憶部113からすべての固有値λ_{i}を読み出す。特徴量ベクトル空間の第i次元の基底ベクトルは、固有ベクトルφ_{i}のいずれかと平行である。すなわち、第i次元の基底ベクトルは固有ベクトルφ_{i}をスカラー倍したものである。仮確率分布算出部108は、第i次元の仮確率分布の分布範囲を、この固有ベクトルφ_{i}に対応する固有値λ_{i}を用いて定める。
仮確率分布算出部108は、平均特徴量ベクトルy_{ave}を中心として半径rλ_{i}の空間内で一様な確率分布を求める。ここで求められた一様な確率分布が仮確率分布である(図10)。例えば、半径rλ_{i}の空間内に図4に示す超立体w_{K}がv個含まれる場合は、確率1/vの一様分布を仮確率分布として求める。
(ステップS303)事後確率の算出
第1の実施形態と同様にして事後確率を算出する。ただし、本実施形態の事後確率算出部105は、仮確率分布に対する事後確率と確率分布記憶部104に記憶された確率分布に対する事後確率との両方を算出する。すなわち、本実施形態の事後確率算出部105は、特徴量ベクトルを得るために十分な量の学習をすることが困難なクラスに関しては、仮確率分布に対する事後確率を求める。本実施形態の事後確率算出部105は、例えば、学習データや学習対象の画像が閾値より少ないクラスに関しては、仮確率分布を用いて事後確率を計算する。
以上に説明したように、本実施形態のパターン認識装置ならば、学習しにくいクラスが存在する場合にも認識を行うことが可能である。
(第3の実施形態)以下、図面を参照して本発明の第3の実施形態を説明する。
第1および第2の実施形態で説明した事後確率に基づく認識手法は、パターンの分布モデルを仮定しないノンパラメトリックな手法である。この手法は、高い性能を得るためには比較的多くの学習データが必要とされる。
これに対し、部分空間法に代表されるパラメトリックな手法は、比較的少ない学習データでも、ある程度高い性能が得られる場合が多い。
そこで、本実施形態のパターン認識装置は、第1および第2の実施形態のパターン認識装置に、他の手法(例えば、パラメトリックな手法)を組み合わせることにより認識性能の向上および安定化を図る。
図11は本実施形態のパターン認識装置のブロック図である。本実施形態のパターン認識装置は、学習処理の際に入力されたデータ量を監視して学習量を計測する学習量計測部1100と、第1または第2の実施形態のパターン認識装置に相当する第1パターン認識部1101と、他の手法によるパターン認識を行う第2パターン認識部1102と、第1パターン認識部1101および第2パターン認識部1102による認識結果を重み付けして最終的な認識結果を出力する重み付け判定部1103とを備える。
第1パターン認識部1101および第2パターン認識部1102は、認識対象の画像の入力を受けて、各々の認識手法により認識を行い、第1認識結果および第2認識結果を重み付け判定部1103に出力する。
第2パターン認識部1102は、学習データ量が少ない場合にも第1および第2の実施形態の認識手法に比べて安定した認識性能が得られる手法(他の手法)により認識を行う。例えば、部分空間法(エルッキ・オヤ著、小川英光、佐藤誠訳、「パターン認識と部分空間法」)による認識手法や、多重判別分析法(Richard O. Duda, Peter E. Hart, and David G. Stork. "Pattern Classification (Second Edition)". Wiley Interscience, 2000)を用いた認識手法を用いることができる。
学習量計測部1100は、入力された画像を、第1パターン認識部1101及び第2パターン認識部1102に供給する。また、学習量計測部1100は、学習処理中の第1パターン認識部1101および第2パターン認識部1102に入力された画像数または学習対象数を監視するとともに、この画像数または学習対象数を学習量として保持する。そして、認識処理の際には、学習量を重み付け判定部1103に出力する。
図12は本実施形態のパターン認識装置による認識処理の流れを示す。
(ステップS1201)第1パターン認識部1101は、第1または第2の実施形態で説明された認識手法による認識を行う。第1パターン認識部1101は第1認識結果と第1学習量とを重み付け判定部1103に出力する。
(ステップS1202)第2パターン認識部1102は、他の手法による認識を行う。第2パターン認識部1102は第2認識結果と第2学習量とを重み付け判定部1103に出力する。なお、本実施形態では、第1認識結果および第2認識結果は同じスケールの類似度であるものとする。
(ステップS1203)重み付け判定部1103は学習量に基づいて重み付け係数を計算し、その係数に基づいて第1認識結果と第2認識結果とを重み付けして最終的な認識結果を求める。
本実施形態では、学習量が少ない場合には第2認識結果を重視し、学習量が多くなるにつれ第1認識結果を重視するように重み付けを行う。例えば、第1認識結果に対する重み付け係数α(第2認識結果に対する重み付け係数は1−α)、学習量n、設計的な係数β(β>0)とした場合、重み付け係数を以下の式に基づいて求める。
Figure 0004514687
数6の数式によれば、学習量nが大きくなるにしたがって、第1認識結果に対する重み付け係数αは大きくなる(0から1に漸近する)。
重み付け判定部1103は二つの認識結果を重み付け係数に基づいて加算した結果を用いて、最終的な認識結果を求める。例えば、閾値と比較して「既学習対象のいずれかと合致した/いずれとも合致しない」という判定を行うことができる。
なお、第2パターン認識部1102が複数の手法で認識を行い、第2認識結果が複数(例えば、m個)存在する場合には、第2認識結果の各々の重み付け係数を(1−α)/mとする。
以上に説明したパターン認識装置ならば、学習量が少ない場合でも学習量が多い場合と同様な安定した高い認識性能を実現することが可能となる。
なお、これまでに説明した各実施形態のパターン認識装置はコンピュータによって実行されるプログラムとして実現されても構わない。すなわち、CPU(Central Processing Unit)等のプロセッサがメモリに記憶されたプログラムを実行して、メモリに記憶されたデータを用いてパターン認識の処理を行う構成であっても構わない。上述の各実施形態で用いられるパラメータ、データ、係数、定数、および、変数等は、プログラムの実行時にはメモリに記憶される。CPUはメモリのアドレスを指定してその値を参照・変更しながら処理を行う。
第1の実施形態のパターン認識装置のブロック図 第1の実施形態のパターン認識装置による学習処理の流れ 第1の実施形態のパターン認識装置による認識処理の流れ 確率分布の計算例 確率分布の算出範囲例 第1の実施形態と参考例との比較 第1の実施形態の一変形例 第2の実施形態のパターン認識装置のブロック図 第2の実施形態のパターン認識装置による認識処理の流れ 仮確率分布の例 第3の実施形態のパターン認識装置のブロック図 第3の実施形態のパターン認識装置による認識処理の流れ
符号の説明
101 特徴量抽出部
102 算出対象範囲設定部
103 確率分布算出部
104 確率分布記憶部
105 事後確率算出部
106 事後確率比較部
110 画像入力部
111 識別子入力部
112 モード切替部

Claims (1)

  1. 学習対象の画像および認識対象の画像を入力する画像入力部と、
    前記学習対象および前記認識対象に関して入力された前記画像の各々の特徴量ベクトルを算出する特徴量ベクトル算出部と、
    前記学習対象の各々に関する前記特徴量ベクトルの確率分布の、特徴量ベクトル空間内における算出対象範囲を設定する算出対象範囲設定部と、
    前記学習対象の各々の前記確率分布を、前記算出対象範囲内で算出する確率分布算出部と、
    前記学習対象の各々の識別子、および、前記学習対象の各々の前記確率分布を関連付けて記憶する確率分布記憶部と、
    前記認識対象について算出された特徴量ベクトル、および、前記確率分布記憶部に記憶された確率分布を用いて、前記認識対象が前記学習対象の各々と対応する確率である事後確率を算出する事後確率算出部と、
    前記事後確率に基づいて前記認識対象の認識を行う認識部と、
    を備え、
    前記特徴量ベクトル算出部は、
    入力された画像の各々について複数の特徴量を求め、これらの特徴量を成分として有する原特徴量ベクトルを求める手段と、
    同一の学習対象に関する前記原特徴量ベクトルに対して主成分分析を行ってL個の固有値およびL個の固有ベクトルを求め、前記原特徴量ベクトルおよび前記L個の固有ベクトルを用いてL次元の前記特徴量ベクトルを算出する手段と、
    を備え、
    前記算出対象範囲設定部は、前記算出対象範囲を、前記特徴量ベクトルの平均を中心として前記固有値の大きさに応じた距離の範囲内に設定する、
    ことを特徴とすパターン認識装置。
JP2005308933A 2004-11-08 2005-10-24 パターン認識装置 Expired - Fee Related JP4514687B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005308933A JP4514687B2 (ja) 2004-11-08 2005-10-24 パターン認識装置
US11/269,430 US20060100872A1 (en) 2004-11-08 2005-11-08 Pattern recognition apparatus and pattern recognition method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004323115 2004-11-08
JP2005308933A JP4514687B2 (ja) 2004-11-08 2005-10-24 パターン認識装置

Publications (2)

Publication Number Publication Date
JP2006155594A JP2006155594A (ja) 2006-06-15
JP4514687B2 true JP4514687B2 (ja) 2010-07-28

Family

ID=36317448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005308933A Expired - Fee Related JP4514687B2 (ja) 2004-11-08 2005-10-24 パターン認識装置

Country Status (2)

Country Link
US (1) US20060100872A1 (ja)
JP (1) JP4514687B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720774B2 (en) * 2005-10-31 2010-05-18 Sony Corporation Learning method and apparatus utilizing genetic algorithms
JP2007310860A (ja) * 2005-10-31 2007-11-29 Sony Corp 学習装置及び方法
TWI437878B (zh) * 2007-11-20 2014-05-11 Quanta Comp Inc 用以校正影像訊號中壞點之方法及電路
US8311281B2 (en) 2008-04-09 2012-11-13 Nec Corporation Object detection apparatus
JP4872103B2 (ja) * 2009-02-05 2012-02-08 国立大学法人 大分大学 臨床検査値の管理装置、管理方法及び管理プログラム
EP2741806B1 (en) 2011-08-11 2018-11-07 Medical Components, Inc. Apparatus for the dialysis of blood
US9977708B1 (en) 2012-11-08 2018-05-22 23Andme, Inc. Error correction in ancestry classification
US9213947B1 (en) 2012-11-08 2015-12-15 23Andme, Inc. Scalable pipeline for local ancestry inference
US9262726B2 (en) * 2013-01-17 2016-02-16 Applied Materials, Inc. Using radial basis function networks and hyper-cubes for excursion classification in semi-conductor processing equipment
USD905853S1 (en) 2018-02-27 2020-12-22 Medical Components, Inc. Catheter tip
CA3147888A1 (en) 2019-07-19 2021-01-28 23Andme, Inc. Phase-aware determination of identity-by-descent dna segments
US11817176B2 (en) 2020-08-13 2023-11-14 23Andme, Inc. Ancestry composition determination
CN112183544B (zh) * 2020-09-29 2024-09-13 厦门大学 一种融合双通道的三层架构数学公式识别方法、系统和存储设备
USD984880S1 (en) 2020-11-06 2023-05-02 Medical Components, Inc. Clamp with indicator

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002150286A (ja) * 2000-11-14 2002-05-24 Glory Ltd パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003150960A (ja) * 2001-11-12 2003-05-23 Telecommunication Advancement Organization Of Japan 識別処理装置およびそのコンピュータプログラム
JP2004294360A (ja) * 2003-03-28 2004-10-21 Hitachi High-Technologies Corp 欠陥分類方法及び装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3486229B2 (ja) * 1994-07-27 2004-01-13 株式会社東芝 画像変化検出装置
JPH0921610A (ja) * 1995-07-04 1997-01-21 N T T Data Tsushin Kk 画像処理装置及び画像処理方法
JPH10222472A (ja) * 1997-01-31 1998-08-21 Casio Comput Co Ltd 電子計算装置、計算方法、及び計算処理プログラムを記録した記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002150286A (ja) * 2000-11-14 2002-05-24 Glory Ltd パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003150960A (ja) * 2001-11-12 2003-05-23 Telecommunication Advancement Organization Of Japan 識別処理装置およびそのコンピュータプログラム
JP2004294360A (ja) * 2003-03-28 2004-10-21 Hitachi High-Technologies Corp 欠陥分類方法及び装置

Also Published As

Publication number Publication date
JP2006155594A (ja) 2006-06-15
US20060100872A1 (en) 2006-05-11

Similar Documents

Publication Publication Date Title
JP4514687B2 (ja) パターン認識装置
CN108038474B (zh) 人脸检测方法、卷积神经网络参数的训练方法、装置及介质
EP3258425B1 (en) Information processing apparatus, information processing method, and storage medium
US7593566B2 (en) Data recognition device
CN107103332A (zh) 一种面向大规模数据集的相关向量机分类方法
US7162085B2 (en) Pattern recognition method and apparatus
US11403878B2 (en) Apparatus and method with user verification
US11593673B2 (en) Systems and methods for identifying influential training data points
US9842279B2 (en) Data processing method for learning discriminator, and data processing apparatus therefor
US20020039446A1 (en) Pattern recognition based on piecewise linear probability density function
CN114503131A (zh) 检索装置、检索方法、检索程序和学习模型检索系统
CN113657510A (zh) 一种有标注价值的数据样本的确定方法及装置
CN113762005A (zh) 特征选择模型的训练、对象分类方法、装置、设备及介质
CN111681266A (zh) 船舶跟踪方法、系统、设备及存储介质
JP2009134466A (ja) 認識処理装置、方法及びコンピュータプログラム
CN113033578B (zh) 基于多尺度特征匹配的图像校准方法、系统、终端及介质
CN105069464A (zh) 一种分类器使用方法
JP2000090274A (ja) パターン識別方法及びパターン識別プログラムを記録した記録媒体
US9779062B2 (en) Apparatus, method, and computer program product for computing occurrence probability of vector
US20220147853A1 (en) Method for validating simulation models
WO2021111832A1 (ja) 情報処理方法、情報処理システム及び情報処理装置
JP2009032046A (ja) 分類装置、分類方法、ならびに、プログラム
JP2906743B2 (ja) 文字認識装置
CN116761176A (zh) 多步攻击识别模型的训练方法、多步攻击识别方法
Álvarez-Meza et al. Image synthesis based on manifold learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100409

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100511

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees