JP5755046B2 - 画像認識装置、画像認識方法及びプログラム - Google Patents

画像認識装置、画像認識方法及びプログラム Download PDF

Info

Publication number
JP5755046B2
JP5755046B2 JP2011138693A JP2011138693A JP5755046B2 JP 5755046 B2 JP5755046 B2 JP 5755046B2 JP 2011138693 A JP2011138693 A JP 2011138693A JP 2011138693 A JP2011138693 A JP 2011138693A JP 5755046 B2 JP5755046 B2 JP 5755046B2
Authority
JP
Japan
Prior art keywords
local feature
category
dictionary
local
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011138693A
Other languages
English (en)
Other versions
JP2013008093A (ja
Inventor
潔考 高橋
潔考 高橋
矢野 光太郎
光太郎 矢野
崇士 鈴木
崇士 鈴木
佐藤 博
博 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011138693A priority Critical patent/JP5755046B2/ja
Priority to US13/527,235 priority patent/US9002115B2/en
Publication of JP2013008093A publication Critical patent/JP2013008093A/ja
Application granted granted Critical
Publication of JP5755046B2 publication Critical patent/JP5755046B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features

Landscapes

  • Engineering & Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像認識装置、画像認識方法及びプログラムに関する。
従来から、人物の顔を含む画像から顔の領域を抽出し、抽出した顔画像を予め登録した特定人物の顔画像と比較することにより、個人識別を行う顔認識技術が知られている。この技術は、例えば、カメラに写っている人物が登録者であると認証されたときにオフィスへの入室を許可するといったセキュリティ用途に使用されている。一方、この技術を同一人物が写っている写真の検索に利用したいといった要望もある。前者の用途においては人物を撮影する際の条件に制約を付けて高精度の認識を可能としているが、後者の場合は人物の撮影条件が多岐におよび認識精度が低下するといった問題がある。例えば、顔の向きや表情、撮影時の照明が異なった写真間では同一人物が写っていても、別人物と誤判定してしまうことがあった。
このような問題を解決するために様々な条件を含む複数の顔画像を登録して認識を行う方法が提案されている。例えば、特許文献1では入力された動画像から上を向いた顔、ひげを生やした顔、口を開いた顔等、さまざまな状態の顔を登録して認識精度を向上させる方法が開示されている。また、特許文献2では顔の向きを変えた顔画像を複数枚登録して認識精度を向上させている。
特開2007−249588号公報 特開2009−258991号公報
しかしながら、顔の向き、表情、照明等の条件の組み合わせが異なる画像をそれぞれ登録しようとすると、登録すべき顔画像の枚数が多くなってしまう問題があった。また、多数の画像を登録すると、認識処理を行う際に多くの登録画像との照合を行う必要があるので処理量も多くなってしまう問題があった。
本発明はこのような問題点に鑑みなされたもので、認識対象や撮影条件が変化する場合に、比較的、登録データ量が少なくても高精度に認識することを目的とする。
そこで、本発明は、画像認識装置であって、各カテゴリに属する複数登録用画像から抽出した局所特徴量を当該カテゴリの辞書登録する辞書登録手段と、入力画像の複数の領域から局所特徴量を抽出する局所特徴抽出手段と、前記局所特徴抽出手段で抽出された入力画像の局所特徴量と前記辞書登録手段により前記辞書に事前に登録された局所特徴量とを比較して前記入力画像の属するカテゴリを決定するカテゴリ決定手段と、を有し、前記辞書登録手段は、各カテゴリに対して、前記複数の登録用画像の複数の所定の領域から抽出された局所特徴量の属性を判別する判別手段と、前記複数の登録用画像から抽出された局所特徴量の中から、前記所定の領域毎に、前記判別手段により判別された各局所特徴量の属性と各領域の代表的属性の情報とに基づいて、代表的局所特徴量を選択する第1の選択手段と、前記所定の領域毎に、該領域から抽出された局所特徴量の間の類似度を算出し、算出した類似度に基づいて、互いに類似していない局所特徴量を選択する第2の選択手段と、を有し、前記第2の選択手段により選択された局所特徴量と前記代表的局所特徴量とをそのカテゴリに関するその領域の局所特徴量として前記辞書に登録する。
本発明によれば、認識対象や撮影条件が変化する場合に、比較的、登録データ量が少なくても高精度に認識することができる。
画像認識装置のハードウェア構成の一例を示す図(その1)である。 辞書データを作成する登録処理の一例を示すフローチャートである。 顔領域から局所領域を切り出した一例を示す図である。 認識処理の一例を示すフローチャートである。 画像認識装置のハードウェア構成の一例を示す図(その2)である。
以下、本発明の実施形態について図面に基づいて説明する。
<実施形態1>
以下、添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
本実施形態では、同一カテゴリに属することが保証される画像として、人物の顔画像を時間的に連続した時系列画像である動画像から複数枚入力し、辞書データを作成する場合について説明する。
図1は、画像認識装置のハードウェア構成の一例を示す図である。
画像取得部10は、カメラ等の撮像部で撮像した画像データを取得する。
顔検出部20は、画像取得部10で取得された画像データから画像中の顔領域画像を抽出する。
局所領域切出部30は、顔検出部20で取得された顔領域から局所領域画像を切り出す。
局所特徴抽出部40は、局所領域切出部30で切り出された局所領域画像から顔認識するための特徴量を求め、局所特徴記憶部210に記憶する。
属性情報抽出部50は、属性判別モデル記憶部220に記憶されている属性判別モデルを基に局所特徴抽出部40で求められた局所特徴量の属性情報を求める。
代表的局所特徴選択部60は、代表的属性情報記憶部230に記憶されている代表的属性情報と属性情報抽出部50で求められた属性情報とを基に局所特徴記憶部210の局所特徴量から代表的な変動をもつ局所特徴量を選択する。
類似度算出部70は、局所特徴抽出部40で取得され、局所特徴記憶部210内に記憶された局所特徴量の全組合せにおける類似度を各々算出し、局所特徴量の類似度の分布(類似度分布)として類似度記憶部240に記憶する。また、類似度算出部70は、局所特徴記憶部210に記憶されている局所特徴量と辞書データ記憶部250に登録されている局所特徴量との類似度を算出する。
局所特徴選択部80は、類似度記憶部240に記憶されている類似度を基に局所特徴記憶部210の局所特徴量から所定の登録条件に合致する局所特徴量を登録対象として選択する。
辞書登録部90は、代表的局所特徴選択部60及び局所特徴選択部80で選択された局所特徴量を辞書データ記憶部250に登録する。
類似度統合部100は、類似度記憶部240に記憶されている類似度を基に入力画像と辞書データとの間の類似度を求める。
カテゴリ決定部110は、類似度統合部100で求められた類似度を基に入力画像のカテゴリを決定する。
まず、人物の顔画像を動画像から複数枚入力し、辞書データを作成する登録処理について図2を用いて説明する。図2は、辞書データを作成する登録処理の一例を示すフローチャートである。
画像取得部10は、カメラ等の撮像部で撮像した画像データを取得する(S1000)。
顔検出部20は、画像取得部10で取得した画像データから、顔の検出を行う(S1001)。画像中から人物の顔を検出する方法としては、公知の技術を用いればよい。顔が検出された場合、顔検出部20は、顔領域画像を取得する。このとき、顔領域のサイズは撮像時のカメラとの距離や角度に応じて変化する。そのため、顔検出部20は、本実施形態の後段処理で想定している、予め定められた又は設定された入力画像サイズに合うように変倍処理を施す。顔が検出されなかった場合、顔検出部20は、S1000に処理を移す。そして、画像取得部10は、後続する画像の取得を行う。なお、顔検出部20は、顔を検出した場合に、不図示のディスプレイに顔画像と共に検出した顔枠を重畳して表示し、不図示のユーザインタフェースによって、登録対象とする顔をユーザが指定するようにしてもよい。
局所領域切出部30は、顔検出部20で取得された顔画像データから局所領域画像を切り出す(S1002)。より具体的には、局所領域切出部30は、人物の顔画像から複数の特徴点を検出し、その特徴点との相対的な位置関係に基づいて所定の矩形画像を顔領域から切り出す。顔領域から局所領域を切り出した様子を図3に示す。図3は、顔領域から局所領域を切り出した一例を示す図である。図3に示したように、局所領域切出部30は、特徴点として目、口、鼻等の構成要素の端点を検出する。これらの端点は、左右の目の端、口角、鼻等、個人の特徴を表すと考えられる部位から予め選択しておいたものである。局所領域切出部30は、局所領域画像を、これらの端点との幾何学的位置関係を基に各々、例えば5×5画素の画像領域として切り出す。なお、局所領域切出部30は、局所領域の一つとして顔画像全体を切り出すようにしてもよい。
局所特徴抽出部40は、局所領域切出部30で切り出した局所領域画像から、顔を認識するための特徴量を求め、局所特徴記憶部210に記憶する(S1003)。例えば、局所特徴抽出部40は、局所領域画像から輝度値を抽出し、抽出した輝度値から25次元の特徴ベクトルを作成して局所特徴量とする。局所特徴抽出部40は、その他にも、色の特徴を表すカラーヒストグラムや、エッジを表すエッジ方向の勾配ヒストグラム、増分符号等を抽出してもよい。局所特徴抽出部40は、それらを組み合せて一つの特徴ベクトルとする。
属性情報抽出部50は、属性判別モデル記憶部220に記憶されている属性判別モデルを基に局所特徴抽出部40で求めた局所特徴量の属性情報を求める(S1004)。属性判別モデルは、多種多様な顔画像における目、口、鼻、等の局所領域画像を教師データとして学習し、入力された同領域画像のクラス判別に用いる多クラス判別用識別モデルである。例えば、画像認識装置は、口元を局所領域とした場合、予め口元の閉じた画像から口元が最大限に開くまでの画像を教師データとして学習することにより、口元の開き具合の属性判別モデルを属性判別モデル記憶部220に記憶しておく。画像認識装置は、属性判別モデルの学習を、例えば、サポートベクター回帰等の方法を用いて行う。特徴量の属性情報は「口元の開き具合0.8」等の数値で出力され、一旦、属性情報抽出部50の内部メモリに記憶される。属性判別の処理は局所領域毎に行われる。顔画像の認識においては、属性判別は顔向き、表情の何れか、又は両方を用いることが効果的である。
画像データ取得(S1000)から属性情報抽出処理(S1004)までの一連の処理は、動画内の各画像に対して行われる。但し、処理する画像は動画内の画像全てである必要はない。例えば、画像認識装置は、処理量の削減を目的として、動画の全フレームではなく、2フレーム毎、3フレーム毎、等、幾つかのフレームを処理対象から外してもよい。また、画像認識装置は、動画内の顔画像の変動具合に応じて処理対象とするフレームを決定してもよい。例えば、画像認識装置は、過去に処理したフレームとの差分が一定以上であった場合に、そのフレームを処理対象とする。
代表的局所特徴選択部60は、予め代表的属性情報記憶部230に記憶されている代表的属性情報と属性情報抽出部50で求めた属性情報とを基に局所特徴記憶部210の局所特徴量から代表的局所特徴量を選択する(S1005)。まず、代表的局所特徴選択部60は、各局所領域において複数画像夫々から抽出した属性情報と代表的属性情報記憶部230に記憶されている対応する局所領域の代表的属性情報との差を算出する。そして、代表的局所特徴選択部60は、その差の最も小さい属性情報に対応した局所特徴量を局所特徴記憶部210から選択する。ここで、局所特徴記憶部210に記憶されている局所特徴量と属性情報抽出部50で取得された属性情報とは全て局所領域毎に対応付けられている。代表的局所特徴選択部60は、以上の処理を全ての局所領域に対して行う。
ここで、代表的属性情報記憶部230に記憶されている代表的属性情報は、目、口、鼻、等の局所領域毎に代表的だと考えられる局所領域画像から属性情報抽出部50がS1004の処理を行って抽出したものである。例えば、口の領域においては、代表的顔画像として入力した様々な顔画像から口の領域の属性情報が抽出される。そして、属性情報抽出部50は、その平均出力値を代表的属性情報として代表的属性情報記憶部230に記憶する。代表的顔画像は、例えば、正面顔向きで口元は閉じた状態の顔画像である。その他、例えば、目は自然に開いている状態を代表的属性情報とするのがよい。
類似度算出部70は、局所特徴抽出部40で取得され、局所特徴記憶部210内に記憶された局所特徴量の全組合せにおける類似度を各々算出し、局所特徴量の類似度分布として類似度記憶部240に記憶する(S1006)。類似度算出部70は、局所特徴量間の類似度の尺度としてユークリッド距離を用いる。その他にも、類似度算出部70は、マハラノビス距離等を用いることができる。類似度算出部70は、この類似度算出処理を、全ての局所領域に対し行う。
局所特徴選択部80は、類似度算出部70で算出され、類似度記憶部240に記憶されている類似度を基に局所特徴記憶部210の局所特徴量から所定の登録条件に合致する局所特徴量を登録対象として選択する(S1007)。より具体的に説明すると、局所特徴選択部80は、一つの局所領域における局所特徴量全てに対して、類似度記憶部240を参照し、登録条件として所定範囲内に代表的局所特徴量との距離が収まるか否かを判定し、所定範囲内に収まる局所特徴量を抽出する。ここで、代表的局所特徴量は、局所領域毎にS1005の処理で選択されたものである。また、ここで定める局所特徴量間の距離の範囲は、後述する認識処理において同一人物か否かの基準である閾値を基に定められた値である。そして、局所特徴選択部80は、上記処理で抽出した局所特徴量の中から互いに類似度が低い局所特徴量を、所定の局所特徴量の数の分だけ登録対象として選択する。ここで、局所特徴選択部80は、互いに類似度が低い局所特徴量の組合せは、登録局所特徴量の数の分だけ局所特徴量を任意に選択した場合の、局所特徴量間の類似度と類似度との標準偏差により求める。
例えば、選択すべき局所特徴量の数をf、類似度算出部70で算出された局所特徴量間の類似度を示す距離をdi、その標準偏差をσとし、距離の総和をσで正規化した値を評価関数Eとする。そして、最大の評価関数Eを与える組の局所特徴量を登録対象とする。
Figure 0005755046
但し、n = f2、Cは、組み合わせの記号
例えば、登録すべき局所特徴量の数を「3つ」とした場合、局所特徴選択部80は、局所特徴記憶部210内の代表的局所特徴量を含む3つの局所特徴量の全組み合わせを抽出し、各組み合わせに対して評価関数を算出し、その評価関数が最大となる組み合わせを登録対象とする。
なお、登録局所特徴量の数を予め決めずに、局所特徴選択部80は、各局所特徴量間の類似度のばらつきに応じて局所特徴量を選択するようにしてもよい。更に、局所特徴選択部80は、登録可能な類似度の範囲を、局所特徴抽出部40で取得した局所特徴量のばらつきに応じて動的に変えるようにしてもよい。
局所特徴選択部80は、全ての局所領域に対して前記処理を行う。なお、登録する局所特徴量の数は全局所領域で同一でなくてもよい。
登録条件に合致する局所特徴量が選択できない場合には、局所特徴選択部80は、代表的局所特徴量を変更したり、動画の再入力をユーザに促したりしてもよい。
辞書登録部90は、代表的局所特徴選択部60及び局所特徴選択部80で選択された局所特徴量を辞書データ記憶部250に登録する(S1008)。そして、辞書登録部90は、辞書データにカテゴリ名を付与し、認識時に付与する。辞書登録部90は、カテゴリ名として「個人の顔にユニークな名称」を付与する。例えば、辞書登録部90は、カテゴリ名として個人の名前等を付与する。なお、辞書登録部90は、全ての局所領域に対し行う。
なお、辞書登録部90は、カテゴリ名として、自動的に各個人に固有なID番号を付与してもよい。また、任意のキーワードをユーザが登録できるようにしてもよい。例えば、画像認識装置は、不図示のディスプレイに登録対象となった顔画像と共に固有なID番号か任意のキーワードを登録するか否かの質問ウインドウを表示する。そして、任意のキーワードを登録する場合、画像認識装置は、文字入力欄を表示し、そこにユーザが不図示のユーザインタフェースによって入力した文字をカテゴリ名として登録する。
本実施形態では、登録対象となる人物の辞書データが未登録の場合について記述した。しかしながら、画像認識装置は、既登録の場合には本実施形態の辞書データを作成する処理で取得することができる局所特徴量を用いて、辞書データの追加登録や置換をしてもよい。
例えば、S1006において、類似度算出部70は、新たに入力した画像から得られた局所特徴量を追加して類似度の算出を行う。そして、S1007において、局所特徴選択部80は、上述したと同様の処理により局所特徴量の選択をする。
なお、上述した例では、画像認識装置は、動画像から複数の入力画像を抽出するようにしたが、同一人物の顔画像を関連付けて取得する方法であれば他の方法を用いてもよい。例えば、画像認識装置は、人物写真のデータベースから登録対象の人物の複数写真を関連付け、関連付けた画像群でS1000からS1004までの処理を繰り返して局所特徴量を抽出するようにする。
次に、人物の顔画像を入力し、上述の登録処理により事前に作成した辞書データを基に行う顔認識処理について図4を用いて説明する。図4は、認識処理の一例を示すフローチャートである。なお、ここでは入力顔画像一枚を想定して動作を説明する。図4のS1100、S1101、S1102、S1103は夫々図2のS1000、S1001、S1002、S1003と同様の処理を行うので説明は省略する。
類似度算出部70は、局所特徴記憶部210の局所特徴量と辞書データ記憶部250の個人毎の辞書データの局所特徴量との類似度を登録時と同様の処理を行って計算し、類似度記憶部240に記憶する(S1104)。例えば、顔を認識するための局所領域がNR領域、局所領域毎に辞書データ記憶部250に登録した個人別の局所特徴量の数をfとすると、類似度算出部70は、NR×f個の類似度を計算する。これらの類似度は局所領域毎に分類されて類似度記憶部240に記憶される。
類似度統合部100は、類似度算出部70で計算され、類似度記憶部240に記憶された類似度から、入力画像と辞書データとの間の類似度を求める(S1105)。まず、類似度統合部100は、局所領域毎に類似度算出部70で計算された類似度のうち、最も類似度の高い値がその局所領域を代表する類似度として選択する。そして、類似度統合部100は、局所領域毎の最大の類似度の全局所領域での総和を求め、入力画像と個人別の辞書データとの類似度として出力する。なお、顔画像に隠れや著しい表情の変化がある場合に対応するために、類似度統合部100は、全局所領域でなく類似度が上位所定数の局所領域での総和を求めるようにしてもよい。
ここで説明したS1104、S1105の処理は辞書データ記憶部250にある個人毎の辞書データの分だけ繰り返される。
カテゴリ決定部110は、類似度統合部100で求められた類似度を基に入力画像のカテゴリを決定する(S1106)。より具体的には、カテゴリ決定部110は、各カテゴリに属する辞書データについて得られた入力画像・辞書データ間の類似度を比較し、入力画像と辞書データとの間の類似度が最大となる辞書データが属するカテゴリを入力画像が属するカテゴリと決定する。但し、カテゴリ決定部110は、類似度の最大値が予め定めた閾値を超えない場合には入力画像に該当するカテゴリは無いとして結果を出力する。以上により、入力画像が属するカテゴリ、即ち入力画像中の顔がどの個人の顔であるかが識別される。
入力画像・辞書データの間の類似度の最大値に対する閾値の大きさは任意であるが、大きすぎる閾値を設定した場合、本来何れかのカテゴリに属す入力画像が「どのカテゴリにも属さない」と出力されてしまう可能性がある。また、小さすぎる閾値を設定した場合、本来どのカテゴリにも属さない入力画像も「何れかのカテゴリに属する」と出力されてしまう可能性がある。この閾値は、予め調整を重ねて決めておくとよいし、また、変更可能にしてもよい。
仮に、画像認識装置が、代表的局所特徴量を選出せずに全局所特徴量をクラスタリングして辞書データを抽出してしまうと、代表的局所特徴量及びその近傍が認識できない辞書データを抽出する可能性がある。また、登録範囲に制約を設けない場合、画像認識装置は、同様に代表的局所特徴量及びその近傍が認識できない辞書データを抽出する可能性がある。
したがって、本実施形態では、代表的局所特徴選択部60において代表的局所特徴量を選択し、且つ、局所特徴選択部80において認識処理における閾値を基に登録範囲に制約を設けることにより、代表的局所特徴量及びその近傍を確実に認識可能としている。また、評価関数として局所特徴量間の距離の標準偏差を導入することにより、辞書データに登録する局所特徴量の偏りを軽減し、認識可能な範囲をより広範囲に広げる事を可能としている。
以上により、従来、複数顔画像を登録する際、顔の様々な変動を表現するために画像単位で登録する必要があったのに対し、本実施形態では局所領域単位で登録することにより、上記画像を表現するための登録特徴量を削減することができる。例えば、5枚の画像分の画像情報を辞書データとして登録する場合、従来は5枚の画像を全て登録する必要があったのに対し、本実施形態では5つ分の登録特徴量を表現可能な分だけ局所特徴量を局所領域毎に登録すればよい。つまり、必ずしも全局所領域で5つの局所特徴量を登録する必要はないため、登録特徴量を削減し、且つ、効率的な登録処理が可能となる。また、認識処理において、登録する辞書データが少なくても高い識別性能で図ることが可能であるため、認識処理における処理効率の向上も期待できる。
例えば、辞書データとして全局所領域で5つの局所特徴量ずつ登録してある場合は、任意の入力画像から抽出する5つの局所特徴量との類似度算出処理が行われる。しかしながら、本実施形態では、同様の識別性能を得られる情報量として、全局所領域の半分で3つの局所特徴量ずつ登録してあり、残り半分で2つの局所特徴量ずつ登録する場合、1/2の処理量で、同程度の性能の識別器を生成する事ができる。
<実施形態2>
実施形態1では図1に示したように画像認識装置の各部をハードウェアとして実装した例を説明したが、図5に示すように、CPU1がメモリ2に記憶されたプログラムを実行することによって各部として機能させるソフトウェアで実現するようにしてもよい。なお、図5のハードウェア構成の場合、図1の210、220、230、240、250の各記憶部はメモリ2に構成されるが、このことは本実施形態を制限するものではない。各記憶部をそれぞれ異なる記憶媒体(例えば、メモリ、レジスタ、ディスク装置等)で構成してもよい。
<その他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
以上、上述した画像認識装置では、複数枚の画像から局所特徴量を抽出し、局所特徴量の分布に応じて領域毎に複数の局所特徴量を選択して辞書として登録するようにした。即ち、上述した画像認識装置は、領域毎に代表的な変動をもつ特徴量を保持し、その組み合わせで認識対象全体の変動を表現するようにしたため、比較的、登録データ量が少なくても高精度に認識を行うことができる。
以上、上述した各実施形態によれば、認識対象や撮影条件が変化する場合に、比較的、登録データ量が少なくても高精度に認識することができる。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
40 局所特徴抽出部、90 辞書登録部、110 カテゴリ決定部

Claims (6)

  1. 各カテゴリに属する複数登録用画像から抽出した局所特徴量を当該カテゴリの辞書登録する辞書登録手段と、
    入力画像の複数の領域から局所特徴量を抽出する局所特徴抽出手段と、
    前記局所特徴抽出手段で抽出された入力画像の局所特徴量と前記辞書登録手段により前記辞書に事前に登録された局所特徴量とを比較して前記入力画像の属するカテゴリを決定するカテゴリ決定手段と、
    を有し、
    前記辞書登録手段は、各カテゴリに対して、
    前記複数の登録用画像の複数の所定の領域から抽出された局所特徴量の属性を判別する判別手段と、
    前記複数の登録用画像から抽出された局所特徴量の中から、前記所定の領域毎に、前記判別手段により判別された各局所特徴量の属性と各領域の代表的属性の情報とに基づいて、代表的局所特徴量を選択する第1の選択手段と、
    前記所定の領域毎に、該領域から抽出された局所特徴量の間の類似度を算出し、算出した類似度に基づいて、互いに類似していない局所特徴量を選択する第2の選択手段と、
    を有し、
    前記第2の選択手段により選択された局所特徴量と前記代表的局所特徴量とをそのカテゴリに関するその領域の局所特徴量として前記辞書に登録する画像認識装置。
  2. 前記第1の選択手段は、前記複数の登録用画像から抽出された局所特徴量の中から前記代表的属性との差が最小の属性を有する局所特徴量を前記代表的局所特徴量として択する請求項1記載の画像認識装置。
  3. 前記第2の選択手段は、選択する局所特徴量の数を前記類似度のばらつきに応じて決定する請求項1又は2記載の画像認識装置。
  4. 前記カテゴリとは、個人の顔である請求項1乃至3何れか1項記載の画像認識装置。
  5. 画像認識装置が実行する画像認識方法であって、
    各カテゴリに属する複数登録用画像から抽出した局所特徴量を当該カテゴリの辞書登録する辞書登録ステップと、
    入力画像の複数の領域から局所特徴量を抽出する局所特徴抽出ステップと、
    前記局所特徴抽出ステップで抽出された入力画像の局所特徴量と前記辞書登録ステップにおいて前記辞書に事前に登録された局所特徴量とを比較して前記入力画像の属するカテゴリを決定するカテゴリ決定ステップと、
    含み
    前記辞書登録ステップは各カテゴリに対して、
    前記複数の登録用画像の複数の所定の領域から抽出された局所特徴量の属性を判別する判別ステップと、
    前記複数の登録用画像から抽出された局所特徴量の中から、前記所定の領域毎に、前記判別ステップにおいて判別された各局所特徴量の属性と各領域の代表的属性の情報とに基づいて、代表的局所特徴量を選択する第1の選択ステップと、
    前記所定の領域毎に、該領域から抽出された局所特徴量の間の類似度を算出し、算出した類似度に基づいて、互いに類似していない局所特徴量を選択する第2の選択ステップと、
    を含み、
    前記第2の選択ステップにおいて選択された局所特徴量と前記代表的局所特徴量とをそのカテゴリに関するその領域の局所特徴量として前記辞書に登録する画像認識方法。
  6. 入力画像があるカテゴリの画像かどうかを認識するコンピュータに、
    各カテゴリに属する複数の登録用画像から抽出した局所特徴量を当該カテゴリの辞書に登録する辞書登録ステップと、
    入力画像の複数の領域から局所特徴量を抽出する局所特徴抽出ステップと、
    前記局所特徴抽出ステップで抽出された入力画像の局所特徴量と前記辞書登録ステップにおいて前記辞書に事前に登録された局所特徴量とを比較して前記入力画像の属するカテゴリを決定するカテゴリ決定ステップと、
    を実行させ、
    前記辞書登録ステップは各カテゴリに対して、
    前記複数の登録用画像の複数の所定の領域から抽出された局所特徴量の属性を判別する判別ステップと、
    前記複数の登録用画像から抽出された局所特徴量の中から、前記所定の領域毎に、前記判別ステップにおいて判別された各局所特徴量の属性と各領域の代表的属性の情報とに基づいて、代表的局所特徴量を選択する第1の選択ステップと、
    前記所定の領域毎に、該領域から抽出された局所特徴量の間の類似度を算出し、算出した類似度に基づいて、互いに類似していない局所特徴量を選択する第2の選択ステップと、
    を含み、
    前記第2の選択ステップにおいて選択された局所特徴量と前記代表的局所特徴量とをそのカテゴリに関するその領域の局所特徴量として前記辞書に登録するプログラム。
JP2011138693A 2011-06-22 2011-06-22 画像認識装置、画像認識方法及びプログラム Expired - Fee Related JP5755046B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011138693A JP5755046B2 (ja) 2011-06-22 2011-06-22 画像認識装置、画像認識方法及びプログラム
US13/527,235 US9002115B2 (en) 2011-06-22 2012-06-19 Dictionary data registration apparatus for image recognition, method therefor, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011138693A JP5755046B2 (ja) 2011-06-22 2011-06-22 画像認識装置、画像認識方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013008093A JP2013008093A (ja) 2013-01-10
JP5755046B2 true JP5755046B2 (ja) 2015-07-29

Family

ID=47361909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011138693A Expired - Fee Related JP5755046B2 (ja) 2011-06-22 2011-06-22 画像認識装置、画像認識方法及びプログラム

Country Status (2)

Country Link
US (1) US9002115B2 (ja)
JP (1) JP5755046B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6128910B2 (ja) * 2013-03-21 2017-05-17 キヤノン株式会社 学習装置、学習方法及びプログラム
JP2016162072A (ja) 2015-02-27 2016-09-05 株式会社東芝 特徴量抽出装置
CN108369451B (zh) * 2015-12-18 2021-10-29 索尼公司 信息处理装置、信息处理方法及计算机可读存储介质
CN106203445B (zh) * 2016-06-30 2019-05-07 北京小白世纪网络科技有限公司 一种基于大规模词典迁移的词典构造方法
JP6872742B2 (ja) * 2016-06-30 2021-05-19 学校法人明治大学 顔画像処理システム、顔画像処理方法及び顔画像処理プログラム
CN110458121B (zh) * 2019-08-15 2023-03-14 京东方科技集团股份有限公司 一种人脸图像生成的方法及装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4161659B2 (ja) * 2002-02-27 2008-10-08 日本電気株式会社 画像認識システム及びその認識方法並びにプログラム
JP2008217803A (ja) * 2002-02-27 2008-09-18 Nec Corp 画像認識システム及びその認識方法並びにプログラム
KR100438841B1 (ko) * 2002-04-23 2004-07-05 삼성전자주식회사 이용자 검증 및 데이터 베이스 자동 갱신 방법, 및 이를이용한 얼굴 인식 시스템
JP4725377B2 (ja) 2006-03-15 2011-07-13 オムロン株式会社 顔画像登録装置、顔画像登録方法、顔画像登録プログラム、および記録媒体
JP5358083B2 (ja) * 2007-11-01 2013-12-04 株式会社日立製作所 人物画像検索装置及び画像検索装置
JP2008243093A (ja) * 2007-03-29 2008-10-09 Toshiba Corp 辞書データの登録装置及び辞書データの登録方法
JP5018404B2 (ja) * 2007-11-01 2012-09-05 ソニー株式会社 画像識別装置および画像識別方法、並びに、プログラム
JP5176572B2 (ja) * 2008-02-05 2013-04-03 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP5261009B2 (ja) 2008-04-16 2013-08-14 パナソニック株式会社 顔画像登録装置
JP5385759B2 (ja) * 2009-10-30 2014-01-08 キヤノン株式会社 画像処理装置及び画像処理方法
JP5576384B2 (ja) * 2010-01-29 2014-08-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ データ処理装置

Also Published As

Publication number Publication date
US9002115B2 (en) 2015-04-07
JP2013008093A (ja) 2013-01-10
US20120328198A1 (en) 2012-12-27

Similar Documents

Publication Publication Date Title
JP5801601B2 (ja) 画像認識装置、画像認識装置の制御方法、およびプログラム
WO2017107957A1 (zh) 人脸图像的检索方法及装置
JP5554984B2 (ja) パターン認識方法およびパターン認識装置
JP4241763B2 (ja) 人物認識装置及びその方法
JP5121506B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP5755046B2 (ja) 画像認識装置、画像認識方法及びプログラム
JP5418991B2 (ja) 個人認証システム、個人認証方法
Neamah et al. Discriminative features mining for offline handwritten signature verification
Wang et al. Expression of Concern: Facial feature discovery for ethnicity recognition
JP2010026603A (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP7107598B2 (ja) 認証用顔画像候補判定装置、認証用顔画像候補判定方法、プログラム、および記録媒体
JP7287511B2 (ja) 情報処理装置、容疑者情報生成方法及びプログラム
EP2084677A1 (en) Biometric matching method and apparatus
KR20070105074A (ko) 이동 통신 단말기에서 이미지 관리 방법
Mayer et al. Adjusted pixel features for robust facial component classification
CN111666976A (zh) 基于属性信息的特征融合方法、装置和存储介质
Sanil et al. 2D-3D facial image analysis for identification of facial features using machine learning algorithms with hyper-parameter optimization for forensics applications
JP2021103538A (ja) 情報処理装置、情報処理方法、および、情報処理プログラム
CN111783725A (zh) 人脸识别方法、装置及存储介质
Cai et al. Robust facial expression recognition using RGB-D images and multichannel features
JP2017084006A (ja) 画像処理装置およびその方法
JP2006244385A (ja) 顔判別装置およびプログラム並びに顔判別装置の学習方法
KR101884874B1 (ko) 부분 이미지 기반 객체 판별 방법 및 장치
CN110490027A (zh) 一种用于人脸识别的人脸特征提取训练方法及系统
JP2005004454A (ja) 顔画像分類登録方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140623

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150526

LAPS Cancellation because of no payment of annual fees