JP2010262601A - パターン認識システム及びパターン認識方法 - Google Patents

パターン認識システム及びパターン認識方法 Download PDF

Info

Publication number
JP2010262601A
JP2010262601A JP2009114897A JP2009114897A JP2010262601A JP 2010262601 A JP2010262601 A JP 2010262601A JP 2009114897 A JP2009114897 A JP 2009114897A JP 2009114897 A JP2009114897 A JP 2009114897A JP 2010262601 A JP2010262601 A JP 2010262601A
Authority
JP
Japan
Prior art keywords
likelihood
feature amount
dictionary
unit
input pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009114897A
Other languages
English (en)
Other versions
JP5361524B2 (ja
Inventor
Kotaro Yano
光太郎 矢野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009114897A priority Critical patent/JP5361524B2/ja
Priority to US13/318,471 priority patent/US8938117B2/en
Priority to PCT/JP2010/003106 priority patent/WO2010131435A1/en
Priority to CN201080021092.1A priority patent/CN102422325B/zh
Publication of JP2010262601A publication Critical patent/JP2010262601A/ja
Application granted granted Critical
Publication of JP5361524B2 publication Critical patent/JP5361524B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)
  • Image Processing (AREA)

Abstract

【課題】上位カテゴリにおける物体の認識と下位カテゴリにおける特定物体の認識を、簡易な構成で実現することができるパターン認識システム及びパターン認識方法等を提供する。
【解決手段】パターン抽出部20は、画像取得部10により取得された画像データからパターン認識を行う部分画像を切り出す。特徴量算出部30は、パターン抽出部20により切り出された部分画像から所望の物体を認識するための特徴量を求める。尤度算出部40は、特徴量算出部30により求められた特徴量から認識対象である物体の尤度を求める。物体判別部50は、尤度算出部40により求められた物体の尤度からパターン抽出部20により切り出された部分画像が認識対象である物体かどうかを判別する。認識結果出力部60は、物体判別部50により認識された結果を出力する。
【選択図】図1

Description

本発明は、入力パターンから所定の物体及びその下位カテゴリにおける特定物体を区別して認識するパターン認識システム及びパターン認識方法等に関する。
画像から特定の被写体パターンを自動的に検出する画像処理方法は非常に有用であり、このような画像処理方法は、例えば人間の顔の判定に利用することができる。従って、このような画像処理方法は、通信会議、マン・マシン・インタフェース、セキュリティ、人間の顔を追跡するためのモニタ・システム、画像圧縮等の多くの分野で使用することができる。
画像中から顔を検出する技術は、例えば、非特許文献1に記載されている。例えば、いくつかの顕著な特徴(2つの目、口、鼻など)及びその特徴間の固有の幾何学的位置関係を利用して、人間の顔を検出する技術が記載されている。また、人間の顔の対称的特徴、人間の顔色の特徴、テンプレート・マッチング、ニューラル・ネットワーク等を利用して、人間の顔を検出する技術が記載されている。
一方、近年では、単に顔を検出するだけでなく、検出した顔画像について、誰の顔なのかという特定人物を区別して認識する技術に対する要望がある。例えば、カメラで撮影した画像中の顔を認識して、認識した顔に合わせた適切な露出・焦点制御を行うアプリケーションでは、画像中に複数の人物が存在する場合に特定人物を区別して認識することができれば特定の人物に適切な制御を行うことが可能となる。
しかしながら、現状では、顔の認識処理及び特定人物顔の認識処理を簡潔に実行することはできない。例えば、特許文献1には、顔の認識を肌色の特徴により行い、認識した顔内部の注目領域を求め、求めた注目領域の位置を特徴量として特定人物顔の認識を行う技術が記載されている。この技術では、顔の認識処理と特定人物顔の認識処理とを個別に行っている。この技術において、仮に画像中から特定人物顔の認識を行うために各処理を単純に組合せて用いると、夫々に特徴量の計算、認識処理を行う必要があり、処理が複雑になってしまう。
このような認識処理の問題は、顔の認識処理及び特定人物顔の認識処理の組み合わせに限らず、上位カテゴリにおける物体の認識処理及び下位カテゴリにおける物体の認識処理との組み合わせにおける一般的な問題となっている。即ち、顔認識のアプリケーションでは、顔等の上位カテゴリの認識を行った後、特定人物顔等の下位カテゴリの認識を行いたいという要望がある。また、膨大な数の画像から動物の認識を行い、動物画像の検索を行うというアプリケーションにおいて、下位カテゴリである犬画像の検索を行いたいという要望がある。また、車のナビゲーションにおいて走行シーンから映像中の道路標識及び看板を認識して強調表示するというアプリケーションにおいて、特定の看板を区別して強調表示したいという要望がある。
特開2007−115109号公報
Yang et al, "Detecting Faces in Images: A Survey", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.24 , NO.1, JANUARY 2002
本発明は、上位カテゴリにおける物体の認識と下位カテゴリにおける特定物体の認識を、簡易な構成で実現することができるパターン認識システム及びパターン認識方法等を提供することを目的とする。
本願発明者は、前記課題を解決すべく鋭意検討を重ねた結果、以下に示す発明の諸態様に想到した。
本発明に係るパターン認識システムは、入力パターンの特徴量を算出する特徴量算出手段と、予め所定の物体の特徴量の分布に基づいて作成された物体辞書を記憶した物体辞書記憶手段と、予め前記所定の物体のうち特定物体の特徴量の分布に基づいて作成された特定物体辞書を記憶した特定物体辞書記憶手段と、前記物体辞書を参照して、前記特徴量算出手段により算出された特徴量から前記入力パターンが前記所定の物体であることの尤度を算出する第1の尤度算出手段と、前記第1の尤度算出手段により算出された尤度に基づいて前記入力パターンが前記所定の物体であるかを判別する第1の物体判別手段と、前記第1の物体判別手段により、前記入力パターンが前記所定の物体であると判別された場合に、前記特定物体辞書を参照して、前記特徴量算出手段により算出された特徴量から前記入力パターンが前記特定物体であることの尤度を求める第2の尤度算出手段と、前記第2の尤度算出手段により算出された尤度に基づいて前記入力パターンが前記特定物体であるかを判別する第2の物体判別手段と、を有することを特徴とする。
本発明に係るパターン認識方法は、入力パターンの特徴量を算出する特徴量算出ステップと、予め所定の物体の特徴量の分布に基づいて作成された物体辞書を参照して、前記特徴量算出ステップにおいて算出した特徴量から前記入力パターンが前記所定の物体であることの尤度を算出する第1の尤度算出ステップと、前記第1の尤度算出ステップにおいて算出した尤度に基づいて前記入力パターンが前記所定の物体であるかを判別する第1の物体判別ステップと、前記第1の物体判別ステップにおいて、前記入力パターンが前記所定の物体であると判別した場合に、予め前記所定の物体のうち特定物体の特徴量の分布に基づいて作成された特定物体辞書を参照して、前記特徴量算出ステップにおいて算出した特徴量から前記入力パターンが前記特定物体であることの尤度を求める第2の尤度算出ステップと、前記第2の尤度算出ステップにおいて算出した尤度に基づいて前記入力パターンが前記特定物体であるかを判別する第2の物体判別ステップと、を有することを特徴とする。
本発明によれば、入力パターンが特定物体であることの判別に際して、その上位カテゴリである所定の物体であることの認識に用いられる特徴量を用いるため、簡素な構成で上位カテゴリ及び下位カテゴリの物体認識を行うことができる。
本発明の実施形態に係るパターン認識システムの構成を示すブロック図である。 予め記憶されている物体辞書を用いて所定の物体を認識する方法を示すフローチャートである。 画像から顔パターンの探索を行う方法を示す図である。 顔の特徴量を示す図である。 物体の尤度を求める参照テーブルの一例を示す図である。 顔の認識結果の出力例を示す図である。 下位のカテゴリに属する特定物体の認識を行うための設定方法を示すフローチャートである。 特定物体における物体の尤度を求める参照テーブルの一例を示す図である。 下位のカテゴリに属する特定物体の辞書の設定を受けて下位のカテゴリに属する特定物体を認識する方法を示すフローチャートである。 顔及び特定人物の顔の認識結果の出力例を示す図である。 パターン認識システムの構成の他の例を示す図である。
以下、本発明の実施形態について添付の図面を参照して具体的に説明する。図1は、本発明の実施形態に係るパターン認識システムの構成を示すブロック図である。
このパターン認識システムには、画像入力部10、パターン抽出部20、特徴量算出部30、尤度算出部40、物体判別部50、認識結果出力部60、物体辞書記憶部100及び110、並びに辞書作成部200が設けられている。
画像入力部10は、カメラ等の撮像部で撮像した画像データを取得する。パターン抽出部20は、画像入力部10により取得された画像データからパターン認識を行う部分画像を切り出す。特徴量算出部30は、パターン抽出部20により切り出された部分画像から所望の物体を認識するための特徴量を求める。尤度算出部40は、特徴量算出部30により求められた特徴量から認識対象である物体の尤度を求める。物体判別部50は、尤度算出部40により求められた物体の尤度からパターン抽出部20により切り出された部分画像が認識対象である物体かどうかを判別する。認識結果出力部60は、物体判別部50により認識された結果を出力する。例えば、認識結果出力部60は、物体判別部50により所望の物体であると判別された場合には、当該部分画像の領域を他の画像領域と区別できるようにディスプレイに表示する。
物体辞書記憶部100及び110は、尤度算出部40が尤度を求める際に用いる所望の認識対象に対応する物体辞書を記憶している。物体辞書は、例えば複数の物体パターンから機械学習により予め求められる。辞書作成部200は、特徴量算出部30により求められた特徴量から特定物体を認識するための特定物体辞書を作成する。物体辞書記憶部110は、特定物体辞書記憶手段として、物体辞書の中でも特に特定物体辞書を記憶している。
なお、これらの各部の動作は、パターン認識システムに設けられた制御部(図示せず)により制御される。
次に、上述のように構成されたパターン認識システムの動作について説明する。パターン認識システムの動作としては、次のものが挙げられる。即ち、(1)予め記憶されている物体辞書を用いて所定の物体の認識、(2)下位のカテゴリに属する特定物体の認識を行うための設定、(3)下位のカテゴリに属する特定物体の辞書の設定を受けての下位のカテゴリに属する特定物体の認識が挙げられる。
先ず、(1)の予め記憶されている物体辞書を用いて所定の物体の認識について説明する。図2は、予め記憶されている物体辞書を用いて所定の物体を認識する方法を示すフローチャートである。ここでは、画像から人の顔を認識する場合について説明する。
この方法では、先ず、画像入力部10が、撮像部により撮像された画像データを取得する(ステップS101)。画像データは、例えば8ビットの画素により構成される2次元配列のデータであり、R、G、Bの3つの面により構成される。画像入力部10は、RGB画像データを輝度画像データに変換し、輝度画像データを以後の処理に適用するものとし、画像メモリ(図示せず)に格納する。なお、画像データとしてYUV画像データを取得する場合には、Y成分をそのまま輝度データとしてもよい。
次いで、パターン抽出部20が、ステップS101で取得された画像データを画像メモリから読み出し、物体認識を行う対象領域である部分画像を入力パターンとして当該画像データ中から切り出す(ステップS102)。この際には、例えば、図3に示すように、画像全域から縦横順次に走査していくことにより画像データ中から顔を検出し、切り出し位置を決定する。また、様々な大きさの顔の検出に対応するため、図3に示すように、読み込んだ画像データを所定の割合で順次に縮小し、それに対して前述した顔検出の走査を行うことが好ましい。このような処理により切り出された部分画像が、後段の認識処理における部分画像の画像パターンが顔かどうかの判別の対象となる。
その後、特徴量算出部30が、パターン抽出部20により切り出された部分画像から所望の物体を認識するための特徴量を求める(ステップS103)。顔の認識を行うための特徴量としては、例えば、両目の間隔と口までの距離との比が挙げられる。
ここで、両目の間隔と口までの距離との比を求める方法について図4を参照しながら説明する。特徴量算出部30は、図4に示すように、パターン抽出部20により切り出された部分画像Rから、周囲よりも輝度が暗い部分(輝度分布の極小値となる位置)を目及び口の候補として3箇所抽出し、図4に示すように、両目の間隔L1及び両目から口までの距離L2を求める。そして、顔の判別を行う特徴量fを以下の(式1)のように算出する。
f=L1÷L2 (式1)
なお、図4には部分画像Rが顔画像となっている例を示しているが、顔画像となっていない場合でも、目及び口の候補の3箇所の抽出及び特徴量fの算出が行われる。
また、人の顔の特徴を表す複数の特徴量を組み合わせることにより、高い精度で顔の認識を行うことが可能となる。例えば、文献「Viola and Jones, "Rapid Object Detection using Boosted Cascade of Simple Features", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR'01)」に記載されている特徴量を用いてもよい。この文献に記載された方法では、局所的な明暗のコントラストを表す特徴量を6,000以上組み合わせている。
ステップS103の後、尤度算出部40が、第1の尤度算出手段として、特徴量算出部30により求められた特徴量から物体辞書記憶部100に予め記憶されている物体辞書を用いて認識対象である物体の尤度を求める(ステップS104)。物体辞書(この場合は顔の辞書)は、例えば、特徴量fの値に対応した尤度(顔らしさの値)を予めテーブルとしてあるものである。この場合、尤度算出部40は、即ち、特徴量fの値からテーブルの参照すべきビンの位置を決定し、決定したビンに記憶されている値を尤度として求める。テーブルの例を図5に示す。図5の縦軸Cは尤度を表す。
ここで、テーブルの作成方法について簡単に説明する。テーブルを作成するためには、先ず、認識対象の物体(この場合は顔)のサンプル画像パターン及びそれ以外のサンプル画像パターンを複数用意する。望ましくは夫々10,000パターン以上用意する。そして、夫々の画像パターンから特徴量fを計算する。そして、認識対象物体(顔)の全画像パターンの特徴量fの値からテーブルの参照すべきビンの位置を決定し、その頻度分布を顔確率分布Pr(f|IF)として求める。ここで、IFは顔画像パターンを表し、Pr(f|IF)は顔画像パターンにおける特徴量fの確率分布を表す。同様に、認識対象物体(顔)以外の全画像パターンの特徴量fの値からテーブルの参照すべきビンの位置を決定し、その頻度分布を非顔確率分布Pr(f|INF)として求める。ここで、INFは非顔画像パターンを表し、Pr(f|INF)は非顔画像パターンにおける特徴量fの確率分布を表す。このとき、顔の尤度Cは以下の(式2)で表わされる。
C=log[{Pr(f|IF)}÷{Pr(f|INF)}] (式2)
従って、物体辞書には特徴量fのビン毎に(式2)の尤度Cの値を設定しておけばよい。
なお、前述したように、人の顔の特徴を表す複数の特徴量を組み合わせることにより、高い精度で顔の認識を行うことが可能となる。このように複数の特徴量を組み合わせる場合には、例えば、複数の特徴量の夫々に対して、尤度を求め、その尤度の総和を顔の尤度とする。即ち、k番目の特徴量をfk、特徴量fkに対する尤度をCk(fk)とすると、顔の尤度Cは以下の(式3)で求めることができる。
Figure 2010262601
ステップS104の後、物体判別部50が、第1の物体判別手段として、尤度算出部40により求められた物体の尤度から、パターン抽出部20により切り出された部分画像が認識対象である物体かどうかを判別する(ステップS105)。即ち、ステップS104において算出された顔の尤度Cが所定の閾値Tよりも大きい場合は、照合対象の部分画像パターンを顔と判別し、所定の閾値T以下の場合は、照合対象の部分画像パターンを非顔と判別する。
そして、物体判別部50により部分画像が顔と判別された場合、制御部がその位置を認識結果として記憶部(図示せず)に保存する(ステップS106)。なお、物体判別部50により部分画像が非顔と判別された場合、ステップS102に戻る。
これらのステップS102〜S106の処理が、図3に示すように画像内で順次繰り返し実行される。そして、認識結果出力部60が、ステップ106において記憶部(図示せず)に保存された認識結果を、図6に示すようにディスプレイに表示する(ステップS107)。図6中の矩形部分が入力画像に重畳表示された顔認識結果を表している。
次に、(2)下位のカテゴリに属する特定物体の認識を行うための設定について説明する。図7は、下位のカテゴリに属する特定物体の認識を行うための設定方法を示すフローチャートである。ここでは、画像から特定人物の顔を認識する場合について説明する。
この方法では、先ず、画像入力部10が、撮像部により撮像された画像データを取得する(ステップS101)。このとき取得する画像は特定人物(例えばAさん)の顔が写っている画像であるとする。この画像データは画像メモリ(図示せず)に格納される。
次いで、パターン抽出部20が、ステップS101で取得された画像データを画像メモリから読み出し、物体認識を行う対象領域である部分画像を入力パターンとして当該画像データ中から切り出す(ステップS102)。
その後、特徴量算出部30が、パターン抽出部20により切り出された部分画像から所望の物体を認識するための特徴量を求める(ステップS103)。
続いて、制御部が、特徴量算出部30によって算出された特徴量の値を記憶部(図示せず)に一時的に保存する(ステップS201)。
次いで、尤度算出部40が、特徴量算出部30により求められた特徴量から物体辞書記憶部100に予め記憶されている物体辞書を用いて認識対象である物体の尤度を求める(ステップS104)。
その後、物体判別部50が、尤度算出部40により求められた物体の尤度から、パターン抽出部20により切り出された部分画像が認識対象である物体かどうかを判別する(ステップS105)。
そして、物体判別部50により部分画像が顔と判別された場合、辞書作成部200が、ステップS201において一時的に記憶された特徴量から辞書の作成を行う(ステップS202)。なお、物体判別部50により部分画像が非顔と判別された場合、ステップS102に戻る。
これらのステップS102〜S202の処理が、図3に示すように画像内で順次繰り返し実行される。なお、非顔と判別された部分画像又は辞書作成に用いた部分画像が、画像内の最後の部分画像であった場合は、ステップS101に戻り、また、別のAさんの顔が写っている画像を取得してステップS101〜S202の処理が繰り返し実行される。
このような方法では、ステップS105において物体判別部50により顔と判別された部分画像が特定人物(Aさん)の顔画像であれば、Aさんの顔に限定した辞書を作成することができる。即ち、ステップS201で保存されたAさんの顔画像パターンから算出された特徴量fを用い、テーブルの参照すべきビンの位置を決定し、Aさんの顔における特徴量fの頻度分布を顔確率分布Pr(f|IFA)として求める。ここで、IFAはAさんの顔画像パターンを表し、Pr(f|IFA)は顔画像パターンにおける特徴量fの確率分布を表す。そして、非顔画像パターンにおける特徴量fの確率分布Pr(f|INF)を用いると、Aさんの顔の尤度CAは以下の(式4)になる。
A=log[{Pr(f|IFA)}÷{Pr(f|INF)}] (式4)
従って、物体辞書には特徴量fのビン毎に(式4)の尤度CAの値を設定しておけばよい。
なお、複数の特徴量を組み合わせて認識を行う場合には、特徴量毎に特定人物の辞書を作成しておけばよい。
また、特定人物のサンプル画像をより多く取得しておくことにより、高い精度で当該特定人物の認識を行うことが可能となる。例えば、ステップS105において顔と判別された部分画像パターンに対して、所定量の位置ずれ、変倍、輝度変化等の画像処理を施して一つの顔部分画像から複数の顔部分画像を生成するようにして、複数の特徴量を算出、取得するようにしてもよい。また、特徴量のサンプル数が少ない場合には確率分布として精度の高いものが得られないので、特徴量のサンプル値より正規分布を想定して近似した確率分布を使って辞書を作成してもよい。例えば、Aさんが一般の人物よりも面長の顔である場合には、特徴量fの尤度を表すテーブルを図5に示した顔のテーブルに比べ、図8に示すように特徴量fの値が小さい方に偏って分布したものとしてもよい。
ステップS202の後、制御部が、ステップS202において作成された特定物体の辞書を物体辞書記憶部110に保存する(ステップS203)。
このようにして、下位のカテゴリに属する特定物体の認識を行うための設定処理が終了する。
次に、(3)の下位のカテゴリに属する特定物体の辞書の設定を受けて下位のカテゴリに属する特定物体を認識する方法について説明する。図9は、下位のカテゴリに属する特定物体の辞書の設定を受けて下位のカテゴリに属する特定物体を認識する方法を示すフローチャートである。
この方法では、先ず、画像入力部10が、撮像部により撮像された画像データを取得する(ステップS101)。
次いで、パターン抽出部20が、ステップS101で取得された画像データを画像メモリから読み出し、物体認識を行う対象領域である部分画像を入力パターンとして当該画像データ中から切り出す(ステップS102)。
その後、特徴量算出部30が、パターン抽出部20により切り出された部分画像から所望の物体を認識するための特徴量を求める(ステップS103)。
続いて、制御部が、特徴量算出部30によって算出された特徴量の値を記憶部(図示せず)に一時的に保存する(ステップS201)。
次いで、尤度算出部40が、特徴量算出部30により求められた特徴量から物体辞書記憶部100に予め記憶されている物体辞書を用いて認識対象である物体の尤度を求める(ステップS104)。
その後、物体判別部50が、尤度算出部40により求められた物体の尤度から、パターン抽出部20により切り出された部分画像が認識対象である物体かどうかを判別する(ステップS105)。即ち、物体判別部50が、部分画像が顔かどうかを判別する。
そして、物体判別部50により部分画像が顔と判別された場合、制御部がその位置を認識結果として記憶部(図示せず)に保存する(ステップS106)。なお、物体判別部50により部分画像が非顔と判別された場合、ステップS102に戻る。
次いで、尤度算出部40が、第2の尤度算出手段として、ステップS201において一時的に記憶された特徴量から物体辞書記憶部110に予め記憶されている特定物体の辞書を用いて認識対象である物体の尤度を求める(ステップS301)。即ち、尤度算出部40は、特定物体の辞書(ここではAさんの顔の辞書)には特徴量fの値に対応した尤度が予めテーブルとして設定されているので、特徴量fの値からテーブルの参照すべきビンの位置を決定し、決定したビンに記憶されている値を尤度として求める。また、複数の特徴量を組み合わせて尤度を算出する場合には、例えば、複数の特徴量の夫々に対して、尤度を求め、その尤度の総和を顔の尤度とする。即ち、k番目の特徴量をfk、特徴量fkに対する尤度をCAk(fk)とすると、Aさんの顔の尤度CAは以下の(式5)で求めることができる。
Figure 2010262601
また、このとき、一般的な顔の分布に対してAさん特有の特徴量を強調して認識を行うようにしてもよい。その場合には、以下の(式6)のように夫々の特徴量に対する尤度に顔の尤度に基づいた重み付けを行う。但し、wk={w・Ck(fk)}-N、w、Nは定数、である。
Figure 2010262601
ステップS301の後、物体判別部50が、第2の物体判別手段として、尤度算出部40により求められた特定物体の尤度から、パターン抽出部20により切り出された部分画像が特定物体かどうかを判別する(ステップS302)。即ち、ステップS301において算出された特定人物の顔の尤度CAが所定の閾値TAよりも大きい場合は、照合対象の部分画像パターンをAさんの顔と判別し、所定の閾値TA以下の場合は、照合対象の部分画像パターンをAさんの顔でないと判別する。
そして、物体判別部50により部分画像が特定人物の顔と判別された場合、制御部がその位置を認識結果として記憶部(図示せず)に保存する(ステップS303)。なお、物体判別部50により部分画像が特定人物の顔ではないと判別された場合、ステップS102に戻る。
これらのステップS102〜S303の処理が、図3に示すように画像内で順次繰り返し実行される。そして、認識結果出力部60が、ステップS106において記憶部(図示せず)に保存された認識結果を、図10に示すようにディスプレイに表示する(ステップS304)。図10中の細線で示した矩形部分が入力画像に重畳表示された顔認識結果を表し、太線で示した矩形部分が入力画像に重畳表示された特定人物(Aさん)の顔認識結果を表している。なお、非顔と判別された部分画像、特定人物の顔ではないと判別された部分画像、又は認識結果を保存した部分画像が、画像内の最後の部分画像であった場合に、更に別の画像を処理するのであれば、ステップS101に戻る。
このような本実施形態によれば、下位カテゴリの物体の認識においても上位カテゴリの物体認識のための特徴量を共通に用いているため、複雑な処理を追加することなく、上位カテゴリ及び下位カテゴリの物体認識を容易に行うことができる。
なお、パターン認識システムは、カメラ等の単一の装置から構成されている必要はなく、例えば2つの装置(カメラ及びコンピュータシステム)から構成されていてもよい。例えば、顔認識機能を備えたカメラを使って特定人物の顔画像を撮影し、撮影した特定人物の顔画像を認識機能及び辞書作成機能を備えたシステムに出力して、作成した辞書をカメラに記憶するようにしてもよい。この具体的な構成の例を図11に示す。
このパターン認識システムには、カメラ1及びコンピュータシステム2が含まれている。カメラ1には、画像入力部10、パターン抽出部20、特徴量算出部30、尤度算出部40、物体判別部50、認識結果出力部60、並びに物体辞書記憶部100及び110が含まれている。一方、コンピュータシステム2には、画像取得部300、パターン抽出部20、特徴量算出部30、尤度算出部40、物体判別部50、辞書作成部200、物体辞書記憶部100及び物体辞書出力部310が含まれている。
カメラ1内及びコンピュータシステム2内の特徴量算出部30は、顔を認識するための特徴量を算出する。また、カメラ1内及びコンピュータシステム2内の物体辞書記憶部100は、顔を認識するための物体辞書を記憶している。
なお、コンピュータシステム2内の画像取得部300は、記憶媒体又は通信媒体等(図示せず)を介して、カメラ1の画像入力部10から画像データを取得する。また、物体辞書出力部310は、辞書作成部200により作成された物体辞書を、記憶媒体又は通信媒体等(図示せず)を介してカメラ1内の物体辞書記憶部110に出力する。
他の構成は図1に示すものと同様である。
次に、このようなパターン認識システムの動作について説明する。先ず、特定人物の顔を認識するための設定において、カメラ1が特定人物の顔画像を画像入力部10で取得する。そして、カメラ1により取得された画像が、記憶媒体(CFカード等)又は通信媒体(USBケーブル等のデータ通信のためのケーブル等)等を介してコンピュータシステム2の画像取得部300に送られる。
コンピュータシステム2では、取得した画像データに対して、パターン抽出部20、特徴量算出部30、尤度算出部40及び物体判別部50によって部分画像毎に顔の認識が行われる。そして、顔と判別された部分画像パターンの特徴量から辞書作成部200が特定人物の顔の物体辞書を作成する。その後、物体辞書出力部310が、作成された物体辞書を記憶媒体又は通信媒体等(図示せず)を介して出力し、この物体辞書がカメラ1の物体辞書記憶部110に保存される。続いて、カメラ1において、物体辞書記憶部100及び110に夫々記憶されている顔の物体辞書及び特定人物の顔の物体辞書に基づく認識処理が行われる。
これらの実施形態では、辞書作成部200によって下位カテゴリの物体を認識する辞書を作成して、それを使用して特定物体の認識を行っているが、本発明はこのような構成に限定されるものではない。例えば、予め特定物体を認識する辞書を用意しておいて、上位カテゴリの物体の認識を行う特徴量に基づいて特定物体の辞書を使用して尤度を求め、特定物体の認識を行うように構成してもよい。このような構成でも、認識処理をできるだけ共通化して、複雑な処理を追加することなく上位カテゴリにおける物体の認識と下位カテゴリにおける物体の認識を行うことができる。
また、認識の対象は人間の顔に限定されることはなく、他の対象についても、上位カテゴリにおける物体の認識処理及び下位カテゴリにおける物体の認識処理を組み合わせて実行することができる。
なお、上述した実施形態の処理は、各機能を具現化したソフトウェアのプログラムコードを、システム又は装置のコンピュータ(若しくはCPU、MPU)が読み出し実行することによって実現することができる。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードの指示に基づき、OS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した各実施例の機能が実現される場合も含まれている。
1:カメラ、2:コンピュータシステム、10:画像入力部、20:パターン抽出部、30:特徴量算出部、40:尤度算出部、50:物体判別部、60:認識結果出力部、100、110:物体辞書記憶部、200:辞書作成部、310:辞書出力部

Claims (5)

  1. 入力パターンの特徴量を算出する特徴量算出手段と、
    予め所定の物体の特徴量の分布に基づいて作成された物体辞書を記憶した物体辞書記憶手段と、
    予め前記所定の物体のうち特定物体の特徴量の分布に基づいて作成された特定物体辞書を記憶した特定物体辞書記憶手段と、
    前記物体辞書を参照して、前記特徴量算出手段により算出された特徴量から前記入力パターンが前記所定の物体であることの尤度を算出する第1の尤度算出手段と、
    前記第1の尤度算出手段により算出された尤度に基づいて前記入力パターンが前記所定の物体であるかを判別する第1の物体判別手段と、
    前記第1の物体判別手段により、前記入力パターンが前記所定の物体であると判別された場合に、前記特定物体辞書を参照して、前記特徴量算出手段により算出された特徴量から前記入力パターンが前記特定物体であることの尤度を求める第2の尤度算出手段と、
    前記第2の尤度算出手段により算出された尤度に基づいて前記入力パターンが前記特定物体であるかを判別する第2の物体判別手段と、
    を有することを特徴とするパターン認識システム。
  2. 前記特定物体の複数の入力パターンにおける前記特徴量算出手段により算出された特徴量の分布に基づいて前記特定物体の辞書を作成する辞書作成手段を有し、
    前記特定物体辞書記憶手段は、前記辞書作成手段により作成された辞書を前記特定物体辞書として記憶することを特徴とする請求項1に記載のパターン認識システム。
  3. 前記特徴量算出手段は、前記入力パターンから複数の特徴量を算出し、
    前記第1の尤度算出手段は、前記特徴量算出手段により算出された夫々の特徴量に対して前記尤度を算出し、前記入力パターンが前記所定の物体であることの尤度を算出し、
    前記第2の尤度算出手段は、前記特徴量算出手段により算出された夫々の特徴量に対して前記尤度を算出し、前記入力パターンが前記特定物体であることの尤度を算出することを特徴とする請求項1又は2に記載のパターン認識システム。
  4. 入力パターンの特徴量を算出する特徴量算出ステップと、
    予め所定の物体の特徴量の分布に基づいて作成された物体辞書を参照して、前記特徴量算出ステップにおいて算出した特徴量から前記入力パターンが前記所定の物体であることの尤度を算出する第1の尤度算出ステップと、
    前記第1の尤度算出ステップにおいて算出した尤度に基づいて前記入力パターンが前記所定の物体であるかを判別する第1の物体判別ステップと、
    前記第1の物体判別ステップにおいて、前記入力パターンが前記所定の物体であると判別した場合に、予め前記所定の物体のうち特定物体の特徴量の分布に基づいて作成された特定物体辞書を参照して、前記特徴量算出ステップにおいて算出した特徴量から前記入力パターンが前記特定物体であることの尤度を求める第2の尤度算出ステップと、
    前記第2の尤度算出ステップにおいて算出した尤度に基づいて前記入力パターンが前記特定物体であるかを判別する第2の物体判別ステップと、
    を有することを特徴とするパターン認識方法。
  5. コンピュータに、
    入力パターンの特徴量を算出する特徴量算出ステップと、
    予め所定の物体の特徴量の分布に基づいて作成された物体辞書を参照して、前記特徴量算出ステップにおいて算出した特徴量から前記入力パターンが前記所定の物体であることの尤度を算出する第1の尤度算出ステップと、
    前記第1の尤度算出ステップにおいて算出した尤度に基づいて前記入力パターンが前記所定の物体であるかを判別する第1の物体判別ステップと、
    前記第1の物体判別ステップにおいて、前記入力パターンが前記所定の物体であると判別した場合に、予め前記所定の物体のうち特定物体の特徴量の分布に基づいて作成された特定物体辞書を参照して、前記特徴量算出ステップにおいて算出した特徴量から前記入力パターンが前記特定物体であることの尤度を求める第2の尤度算出ステップと、
    前記第2の尤度算出ステップにおいて算出した尤度に基づいて前記入力パターンが前記特定物体であるかを判別する第2の物体判別ステップと、
    を実行させることを特徴とするプログラム。
JP2009114897A 2009-05-11 2009-05-11 パターン認識システム及びパターン認識方法 Active JP5361524B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2009114897A JP5361524B2 (ja) 2009-05-11 2009-05-11 パターン認識システム及びパターン認識方法
US13/318,471 US8938117B2 (en) 2009-05-11 2010-05-06 Pattern recognition apparatus and method therefor configured to recognize object and another lower-order object
PCT/JP2010/003106 WO2010131435A1 (en) 2009-05-11 2010-05-06 Pattern recognition apparatus and method therefor configured to recognize object and another lower-order object
CN201080021092.1A CN102422325B (zh) 2009-05-11 2010-05-06 用于识别对象及另一低级别对象的模式识别装置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009114897A JP5361524B2 (ja) 2009-05-11 2009-05-11 パターン認識システム及びパターン認識方法

Publications (2)

Publication Number Publication Date
JP2010262601A true JP2010262601A (ja) 2010-11-18
JP5361524B2 JP5361524B2 (ja) 2013-12-04

Family

ID=43084822

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009114897A Active JP5361524B2 (ja) 2009-05-11 2009-05-11 パターン認識システム及びパターン認識方法

Country Status (4)

Country Link
US (1) US8938117B2 (ja)
JP (1) JP5361524B2 (ja)
CN (1) CN102422325B (ja)
WO (1) WO2010131435A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013196045A (ja) * 2012-03-15 2013-09-30 Omron Corp 画像処理装置、画像処理方法、制御プログラムおよび記録媒体
JP2016186817A (ja) * 2016-07-13 2016-10-27 ソニー株式会社 端末装置、物体識別方法、情報処理装置、及びプログラム
JP2017168057A (ja) * 2016-03-18 2017-09-21 株式会社Spectee 画像分類装置、画像分類システム及び画像分類方法
WO2019074011A1 (ja) * 2017-10-10 2019-04-18 株式会社Cygames 対象物取得確認のためのシステム、サーバ、プログラム及び方法
JP2019220014A (ja) * 2018-06-21 2019-12-26 株式会社東芝 画像解析装置、画像解析方法及びプログラム
US10628955B2 (en) 2015-05-19 2020-04-21 Rakuten, Inc. Information processing device, information processing method, and program for identifying objects in an image

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5800557B2 (ja) * 2011-04-20 2015-10-28 キヤノン株式会社 パターン認識装置、パターン認識方法及びプログラム
EP3016069B1 (en) 2013-06-28 2024-07-03 Nec Corporation Training data generating device, method, and program
JP6655878B2 (ja) 2015-03-02 2020-03-04 キヤノン株式会社 画像認識方法及び装置、プログラム
JP6629139B2 (ja) * 2016-05-30 2020-01-15 株式会社東芝 制御装置、制御方法およびプログラム
FR3060170B1 (fr) * 2016-12-14 2019-05-24 Smart Me Up Systeme de reconnaissance d'objets base sur un modele generique 3d adaptatif
CN113095119B (zh) * 2020-01-09 2023-11-21 北京君正集成电路股份有限公司 一种修正人脸裁剪框的人脸识别系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005056387A (ja) * 2003-07-18 2005-03-03 Canon Inc 画像処理装置、撮像装置、画像処理方法
JP2006079382A (ja) * 2004-09-10 2006-03-23 Hitachi Omron Terminal Solutions Corp 情報処理装置、不正者検出方法および現金自動預け払い装置
JP2006243849A (ja) * 2005-02-28 2006-09-14 Toshiba Corp 機器制御装置及びその方法
JP2008243093A (ja) * 2007-03-29 2008-10-09 Toshiba Corp 辞書データの登録装置及び辞書データの登録方法

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3910267B2 (ja) 1997-09-10 2007-04-25 富士フイルム株式会社 画像処理方法および装置
JP3842006B2 (ja) * 2000-03-30 2006-11-08 グローリー工業株式会社 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
DE60213032T2 (de) * 2001-05-22 2006-12-28 Matsushita Electric Industrial Co. Ltd. Gerät zur Gesichtsdetektion, Gerät zur Detektion der Gesichtspose, Gerät zur Extraktion von Teilbildern und Verfahren für diese Geräte
CN1209731C (zh) * 2003-07-01 2005-07-06 南京大学 一种基于每人一幅图像的自动人脸识别方法
WO2005008593A1 (ja) * 2003-07-18 2005-01-27 Canon Kabushiki Kaisha 画像処理装置、撮像装置、画像処理方法
CN1839410B (zh) 2003-07-18 2015-05-20 佳能株式会社 图像处理设备、摄像设备、图像处理方法
JP4511850B2 (ja) 2004-03-03 2010-07-28 学校法人早稲田大学 人物属性識別方法およびそのシステム
US7567715B1 (en) * 2004-05-12 2009-07-28 The Regents Of The University Of California System and method for representing and encoding images
JP2006023798A (ja) 2004-07-06 2006-01-26 Fuji Photo Film Co Ltd 画像データ処理装置および方法,ならびに画像データ処理プログラム
KR101174179B1 (ko) 2004-10-21 2012-08-16 톰슨 라이센싱 블록 기반의 필름 그레인 패턴의 적응적 디블로킹을 위한기술
JP4284288B2 (ja) * 2005-03-10 2009-06-24 株式会社東芝 パターン認識装置及びその方法
JP4653606B2 (ja) * 2005-05-23 2011-03-16 株式会社東芝 画像認識装置、方法およびプログラム
JP2007115109A (ja) 2005-10-21 2007-05-10 Sony Corp 画像処理装置および方法、プログラム、並びに記録媒体
CA2654960A1 (en) * 2006-04-10 2008-12-24 Avaworks Incorporated Do-it-yourself photo realistic talking head creation system and method
US20070276776A1 (en) * 2006-05-24 2007-11-29 Vigilant Technology Ltd. User trainable detection apparatus and method
JP2008011202A (ja) 2006-06-29 2008-01-17 Toshiba Corp フィルムグレイン処理回路
JP4849988B2 (ja) * 2006-07-31 2012-01-11 三洋電機株式会社 撮像装置及び出力画像生成方法
JP4745207B2 (ja) * 2006-12-08 2011-08-10 株式会社東芝 顔特徴点検出装置及びその方法
EP2102805A1 (en) 2006-12-11 2009-09-23 Cinnafilm, Inc. Real-time film effects processing for digital video
KR100886557B1 (ko) * 2007-05-03 2009-03-02 삼성전자주식회사 적응형 학습에 기반한 얼굴 인식 시스템 및 방법
JP4924264B2 (ja) * 2007-07-24 2012-04-25 セイコーエプソン株式会社 画像処理装置、画像処理方法、および、コンピュータプログラム
JP2009080522A (ja) * 2007-09-25 2009-04-16 Mitsubishi Electric Corp 物体画像認識装置
JP4720810B2 (ja) * 2007-09-28 2011-07-13 富士フイルム株式会社 画像処理装置、撮像装置、画像処理方法及び画像処理プログラム
JP5176572B2 (ja) * 2008-02-05 2013-04-03 ソニー株式会社 画像処理装置および方法、並びにプログラム
US8213689B2 (en) * 2008-07-14 2012-07-03 Google Inc. Method and system for automated annotation of persons in video content
JP2010122879A (ja) * 2008-11-19 2010-06-03 Sony Ericsson Mobile Communications Ab 端末装置、表示制御方法および表示制御プログラム
JP4710979B2 (ja) * 2009-01-09 2011-06-29 ソニー株式会社 対象物検出装置、学習装置、対象物検出方法およびプログラム
JP5227888B2 (ja) * 2009-05-21 2013-07-03 富士フイルム株式会社 人物追跡方法、人物追跡装置および人物追跡プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005056387A (ja) * 2003-07-18 2005-03-03 Canon Inc 画像処理装置、撮像装置、画像処理方法
JP2006079382A (ja) * 2004-09-10 2006-03-23 Hitachi Omron Terminal Solutions Corp 情報処理装置、不正者検出方法および現金自動預け払い装置
JP2006243849A (ja) * 2005-02-28 2006-09-14 Toshiba Corp 機器制御装置及びその方法
JP2008243093A (ja) * 2007-03-29 2008-10-09 Toshiba Corp 辞書データの登録装置及び辞書データの登録方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013196045A (ja) * 2012-03-15 2013-09-30 Omron Corp 画像処理装置、画像処理方法、制御プログラムおよび記録媒体
US10628955B2 (en) 2015-05-19 2020-04-21 Rakuten, Inc. Information processing device, information processing method, and program for identifying objects in an image
JP2017168057A (ja) * 2016-03-18 2017-09-21 株式会社Spectee 画像分類装置、画像分類システム及び画像分類方法
JP2016186817A (ja) * 2016-07-13 2016-10-27 ソニー株式会社 端末装置、物体識別方法、情報処理装置、及びプログラム
WO2019074011A1 (ja) * 2017-10-10 2019-04-18 株式会社Cygames 対象物取得確認のためのシステム、サーバ、プログラム及び方法
JP2019070964A (ja) * 2017-10-10 2019-05-09 株式会社Cygames 対象物取得確認のためのシステム、サーバ、プログラム及び方法
KR20200051014A (ko) * 2017-10-10 2020-05-12 가부시키가이샤 사이게임스 대상물 취득 확인을 위한 시스템, 서버, 프로그램 및 방법
US11281908B2 (en) 2017-10-10 2022-03-22 Cygames, Inc. System, server, program, and method for confirming acquisition of target object
KR102420331B1 (ko) * 2017-10-10 2022-07-13 가부시키가이샤 사이게임스 대상물 취득 확인을 위한 시스템, 서버, 프로그램 및 방법
JP2019220014A (ja) * 2018-06-21 2019-12-26 株式会社東芝 画像解析装置、画像解析方法及びプログラム
US11417129B2 (en) 2018-06-21 2022-08-16 Kabushiki Kaisha Toshiba Object identification image device, method, and computer program product

Also Published As

Publication number Publication date
CN102422325B (zh) 2015-06-24
CN102422325A (zh) 2012-04-18
WO2010131435A1 (en) 2010-11-18
US20120063674A1 (en) 2012-03-15
JP5361524B2 (ja) 2013-12-04
US8938117B2 (en) 2015-01-20

Similar Documents

Publication Publication Date Title
JP5361524B2 (ja) パターン認識システム及びパターン認識方法
JP5366756B2 (ja) 情報処理装置及び情報処理方法
WO2019033572A1 (zh) 人脸遮挡检测方法、装置及存储介质
JP2009211179A (ja) 画像処理方法、パターン検出方法、パターン認識方法及び画像処理装置
JP2005056387A (ja) 画像処理装置、撮像装置、画像処理方法
JP2009015614A (ja) 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム
Grijalva et al. Smartphone recognition of the US banknotes' denomination, for visually impaired people
WO2019033570A1 (zh) 嘴唇动作分析方法、装置及存储介质
US20180107877A1 (en) Image processing apparatus, image processing method, and image processing system
US9870618B2 (en) Image processing apparatus and image processing method
CN112633221B (zh) 一种人脸方向的检测方法及相关装置
JP2007025900A (ja) 画像処理装置、画像処理方法
JP2007025902A (ja) 画像処理装置、画像処理方法
JP2006323779A (ja) 画像処理方法、画像処理装置
JP4708835B2 (ja) 顔検出装置、顔検出方法、及び顔検出プログラム
US9286707B1 (en) Removing transient objects to synthesize an unobstructed image
KR20130105322A (ko) 화상 처리장치, 화상 처리방법, 제어 프로그램 및 기록매체
JP2013218605A (ja) 画像認識装置、画像認識方法及びプログラム
JP6202938B2 (ja) 画像認識装置および画像認識方法
JP5791361B2 (ja) パターン識別装置、パターン識別方法およびプログラム
JP2007026308A (ja) 画像処理方法、画像処理装置
JP2010146395A (ja) 画像処理装置、画像処理方法、画像処理プログラム、及び、電子機器
KR20130105284A (ko) 화상처리장치, 화상처리방법, 제어 프로그램 및 기록매체
JP2017138743A (ja) 画像処理装置、画像処理方法及びプログラム
JP5625196B2 (ja) 特徴点検出装置、特徴点検出方法、特徴点検出プログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130430

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130903

R151 Written notification of patent or utility model registration

Ref document number: 5361524

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151