JP5787845B2 - 画像認識装置、方法、及びプログラム - Google Patents

画像認識装置、方法、及びプログラム Download PDF

Info

Publication number
JP5787845B2
JP5787845B2 JP2012185288A JP2012185288A JP5787845B2 JP 5787845 B2 JP5787845 B2 JP 5787845B2 JP 2012185288 A JP2012185288 A JP 2012185288A JP 2012185288 A JP2012185288 A JP 2012185288A JP 5787845 B2 JP5787845 B2 JP 5787845B2
Authority
JP
Japan
Prior art keywords
feature data
reliability
face area
unit
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012185288A
Other languages
English (en)
Other versions
JP2014044503A (ja
Inventor
智一 河原
智一 河原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2012185288A priority Critical patent/JP5787845B2/ja
Priority to US13/856,146 priority patent/US20140056490A1/en
Publication of JP2014044503A publication Critical patent/JP2014044503A/ja
Application granted granted Critical
Publication of JP5787845B2 publication Critical patent/JP5787845B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Description

本発明の実施形態は、画像認識装置、方法、及びプログラムに関する。
認識対象となる対象人物が写っている入力画像から、対象人物の顔の特徴を数値化した
特徴量を抽出し、予めデータベースに登録されている複数の人物の顔の特徴量と比較する
ことにより、対象人物を認識する画像認識装置がある。
従来の画像認識装置には、入力画像における対象人物の顔の向き、対象人物の装着物、
照明環境から、顔認識に用いる複数の特徴量の信頼度を判定し、当該信頼度と各特徴量と
に基づいて対象人物を認識することにより、認識精度を高めようとするものがある。
しかしながら、このような画像認識装置では、入力画像内での顔のサイズ等に起因して
、十分に認識精度を高めることができない。
特開2007―128262号公報 特開2006−268825号公報 特開2007−4767号公報 特開2008−146329号公報
発明が解決しようとする課題は、画像に写っている人物を精度よく認識することができ
る画像認識装置、方法、及びプログラムを提供することである。
上記課題を解決するために、本発明の一の実施形態に係る画像認識装置1は、取得部と
、検出部と、抽出部と、算出部と、照合部とを備える。
取得部は、画像を取得する。検出部は、前記画像から認識対象となる対象人物の顔領域を検出する。抽出部は、前記顔領域の特徴データを抽出する。算出部は、前記顔領域のサイズに基づく前記特徴データの信頼度を算出する。照合部は、複数の人物の顔の特徴データを予め格納しているデータベースを参照し、前記信頼度を用いて、抽出された前記特徴データと、前記データベースに格納されている前記特徴データとを照合し、前記対象人物を認識する。前記抽出部は、サイズを正規化した前記顔領域の周波数成分を前記特徴データとして抽出する。前記算出部は、前記周波数成分の帯域毎の前記信頼度を算出する。
第1の実施形態に係る画像認識装置1を表すブロック図。 画像認識装置1の処理を表すフローチャート。 抽出部13による顔領域の特徴量の抽出方法の説明図。 顔領域のサイズと特徴データの信頼度とを対応付けた信頼度テーブルの一例図。 照合データの一例図。 画像認識装置2を表すブロック図。 顔領域の空間周波数成分を抽出して可視化した周波数画像。 フィルタテーブルの一例図。 可視化した各フィルタを表す一例図。 抽出部23及び算出部24の処理を表すフローチャート。 画像認識装置1,2のハードウェア構成の一例を表すブロック図。
以下、本発明の実施形態について図面を参照して詳細に説明する。
本願明細書と各図において、既出の図に関して前述したものと同様の要素には同一の符号
を付して詳細な説明は適宜省略する。
(第1の実施形態)
第1の実施形態に係る画像認識装置1は、監視カメラを用いたセキュリティシステム等
に用いられ得る。画像認識装置1は、入力画像に写っている対象人物の顔と、データベー
スに予め格納されている複数の人物の顔に関する照合データとを照合して、当該対象人物
を認識するものである。
画像認識装置1は、入力画像に写っている対象人物の顔領域のサイズを算出するととも
に、顔領域内の特徴データを抽出する。画像認識装置1は、顔領域のサイズに基づいて認
識に用いる特徴データの信頼度を算出する。画像認識装置1は、顔領域のサイズに基づい
て算出した信頼度と特徴データとを用いて、対象人物を認識するため、対象人物を精度よ
く認識することができる。
図1は、本実施形態の画像認識装置1を表すブロック図である。画像認識装置1は、取
得部11と、検出部12と、抽出部13と、算出部14と、照合部15と、出力部16と
、照合データ格納部51とを備える。算出部14は、サイズ算出部141と、信頼度算出
部142とを含む。
取得部11は、入力画像を取得する。入力画像は、例えば監視カメラで撮影された画像
であってよい。入力画像は静止画でも動画像のフレームであっても構わない。
検出部12は、入力画像に写っている対象人物の顔領域を検出する。対象人物は、一人
であっても、複数人であっても構わない。例えば、検出部12は、顔領域を検出するため
の矩形領域を画像上で走査し、矩形領域の平均輝度差に基づくHaar−like特徴を
用いて、顔領域を検出してもよい(特許文献2参照)。あるいは、検出部は、顔領域を検
出するための顔モデル画像を用いたテンプレートマッチングにより、顔領域を検出しても
よい。
抽出部13は、検出された顔領域の特徴データを抽出する。このとき、抽出部13は、
入力画像から顔領域を切り出し、当該顔領域を拡大/縮小、又はアフィン変換等を用いて
、予め定められたサイズに正規化する。これは、対象人物の顔領域のサイズに応じて、抽
出されるベクトルである特徴データの次元(要素数)が変わるため、照合部15(後述)
での照合には特徴データのベクトルの次元を揃える必要があるからである。
サイズ算出部141は、検出された顔領域のサイズを算出する。
信頼度算出部142は、算出された顔領域のサイズに基づいて、各特徴データの信頼度
を算出する。ここで特徴データの信頼度とは、照合部15(後述)が当該特徴データを用
いて照合する際に、当該特徴データがどれくらい信頼できるかを示す度合いである。詳細
は後述する。
照合データ格納部51は、複数の人物について、人物を識別するための人物IDと、当
該人物の顔領域の特徴データとを対応付けた照合データを予め格納している。照合データ
とは、テーブル形式であってよい。また、照合データに含まれる特徴データと、抽出部1
3が抽出する特徴データとは、比較可能なように予め対応させておく。
照合部15は、照合データ格納部51を参照し、対象人物の顔領域から抽出された各特
徴データと、格納された照合データとを照合することにより、特徴データ毎の類似の度合
いである特徴データ類似度を算出する。照合部15は、算出した各特徴データ類似度と、
信頼度算出部142が算出した信頼度とに基づいて、照合データに存在する人物毎に、対
象人物との類似の度合いである人物類似度を算出する。
照合部15は、人物類似度が高い人物IDを照合データ格納部51から抽出する。照合
データ格納部51から抽出した人物IDが本実施形態における認識結果である。なお、照
合部15は、人物類似度が最も高い人物IDのみを抽出してもよく、人物類似度が最も高
いものから順に、複数人の人物IDを抽出してもよい。すなわち、照合部15は、ユーザ
からの要求に応じて認識結果を設定可能なものであってよい。
出力部16は、認識結果を出力する。出力部16は、例えば、認識結果を表示ディスプ
レイやスピーカ、あるいは当該認識結果を用いてデータ処理を行なう他の装置等に出力す
る。
取得部11と、検出部12と、抽出部13と、サイズ算出部141と、信頼度算出部1
42と、照合部15と、出力部16とは、CPU(Central Processin
g Unit)、及びCPUが用いるメモリにより実現されてよい。また、照合データ格
納部51は、HDD(Hard Disk Drive)、SSD(Solid Sta
te Drive)、ROM(Read Only Memory)、メモリカード等の
磁気的、光学的、又は電気的に記憶可能な記憶装置の少なくともいずれかにより実現され
てよい。
また、照合データ格納部51は、ネットワーク上の一又は複数のサーバで構成されても
よい。これにより、画像認識装置1を、クラウドコンピューティングを用いたシステムと
して実装することが可能となる。
以上、画像認識装置1の構成について説明した。
図2は、画像認識装置1の処理を表すフローチャートである。図2のフローチャートに
示す処理は、取得部11が入力画像を取得する毎に行なわれる。
ステップS101において、取得部11は、入力画像を取得する(S101)。取得部
11は、取得した入力画像を検出部12と抽出部13とに供給する。
ステップS102において、検出部12は、入力画像に写っている対象人物の顔領域を
検出したか否かを判定する(S102)。
顔領域を検出しなかった場合は(S102:NO)、ステップS101に遷移し、取得
部11は、次の入力画像を取得する。
顔領域を検出した場合(S102:YES)、ステップS103において、抽出部13
は、検出された顔領域の複数の特徴データを抽出する(S103)。このとき、検出部1
2は、入力画像での対象人物の位置情報を、抽出部13とサイズ算出部141とに供給す
る。本実施形態における顔領域は矩形であるため、検出部12は、顔領域の左上の点の座
標と、右下の点の座標とを抽出部13に供給してよい。そして、抽出部13は、入力画像
における当該位置情報の領域から複数の特徴データを抽出する。
図3は、抽出部13による顔領域の特徴データの抽出方法の説明図である。入力画像に
対して、矩形201は検出部12で検出された顔領域を表す。矩形202〜205は、矩
形201を4等分した各々の矩形である。
本実施形態では、矩形201および矩形202〜205から特徴データを抽出する。本
実施形態では、抽出される特徴データの次元を揃えるために、各矩形を予め定めた大きさ
の矩形画像に拡大/縮小、又はアフィン変換し、各矩形画像の各画素の輝度値を要素とす
るベクトルを長さ1に正規化したものを特徴データとする。
あるいは、顔領域の画像にソーベルフィルタやガボールフィルタを施して得られる画像
の各画素の輝度値を要素とするベクトルを特徴データとしてもよい。あるいは、特徴デー
タに白色化変換などの線型変換を施したものでもよい。あるいは、特徴量抽出を行なう前
段階で、3次元顔モデルを用いて正面向きの顔画像を生成する正規化処理を行なってもよ
い(特許文献3参照)。
ここで、顔認識の分野では、一般的に、抽出された各特徴データによる認識精度は、顔
領域のサイズによって異なる。例えば、入力画像における顔領域のサイズが大きい場合、
細部の形状まで識別することができるため、矩形202〜205から抽出された特徴デー
タの認識精度は、矩形201から抽出された特徴データの認識精度より高い。
一方、入力画像における顔領域のサイズが小さい場合、細部の形状は潰れてしまうため
、特徴データの認識性能は低下する。すなわち、抽出された各特徴データの認識精度は顔
領域のサイズによって変化する。なお、本実施形態では、1つの顔領域から抽出する特徴
データの数をN個として説明する。
抽出部13は、抽出した特徴データを信頼度算出部142と照合部15とに供給する。
ステップS104において、サイズ算出部141は、供給された位置情報に基づいて、
検出された顔領域のサイズを算出する(S104)。
図3に示すwは、顔矩形201の横幅を表している。hは、顔矩形201の縦幅を表し
ている。サイズ算出部141は、式1により、顔領域のサイズsを横幅wと縦幅hの平均
として算出する。
サイズ算出部141は、算出した顔領域のサイズを信頼度算出部142に供給する。
ステップS105において、信頼度算出部142は、算出された顔領域のサイズに基づ
いて、各特徴データの信頼度を算出する(S105)。各特徴データの信頼度ri(i=
1、…N)を式2により定義する。
ここで、ai、bi、ciは予め与えられたi番目(i=1、…N)の特徴データの信
頼度を計算するための係数である。すなわち、式(2)では、顔のサイズsがaiに近い
程大きく、遠い程小さくなり、その大きくなる度合はbiで決まる。ciは信頼度の最大
値を調整する値である。なお、ここでは、顔サイズは横幅wと縦幅hの平均(式1)を用
いたが、最大値や最小値を用いても良い。また、式(3)で与えられる横幅wと縦幅hの
関数でもよい。
ここで、ai、bi、ci、di、ei、は予め与えられたi番目(i=1、…N)の
特徴データの信頼度を計算するための係数である。
また、顔領域のサイズではなく、目や鼻孔、口の両端等の顔の特徴点を検出し、その座
標や特徴点間の距離を用いて、各特徴データの信頼度riを算出しても構わない。特徴点
の検出方法は、例えば特許文献4の方法を用いてもよい。特徴点間の距離は、例えば両目
間の距離等を用いてよい。
また、各特徴データの信頼度riは、数式ではなく予め記憶した信頼度テーブルを使い
、定めてもよい。図4は顔領域のサイズと特徴データの信頼度とを対応付けた信頼度テー
ブルの一例図である。図4の信頼度テーブルでは、例えば顔のサイズが「25」のとき、
第1特徴量の信頼度は「0.8」、第2特徴量の信頼度は「0.1」となる。
信頼度算出部142は、算出した信頼度を照合部15に供給する。
ステップS106において、照合部15は、照合データ格納部51を参照し、対象人物
の顔領域から抽出された各特徴データと、照合データに含まれる各人物の顔の特徴量とを
照合することにより、対象人物の特徴データに対する各人物の特徴データ類似度を算出す
る(S106)。
図5は、照合データの一例図である。図5に示すように、本実施形態の照合データは、
複数の人物の各々について、人物の識別情報である人物IDと、当該人物の顔の特徴デー
タとが対応付けられたデータである。
本例では、人物IDがAの人物に対して、当該人物の顔画像から抽出した第1特徴デー
タ(a1,a2,…,ad)〜第N特徴データ(A1,A2,…,Ad)が対応付けられ
ている。人物IDがBの人物に対して、当該人物の顔画像から抽出した第1特徴データ(
b1,b2,…,bd)〜第N特徴データ(B1,B2,…,Bd)が対応付けられてい
る。ここで、dは特徴データ(ベクトル)の次元である。
本実施形態において、照合部15は、対象人物の顔領域から抽出された各特徴データと
、照合データの各人物の特徴データとの内積を、各特徴データの特徴データ類似度として
算出する。各特徴データは長さ1のベクトルのため、内積は単純類似度と同様である。す
なわち、特徴データ類似度siは、式4により表されてよい。
ただし、(x1、・・・、xd)は、抽出部13で抽出されたi番目の特徴データを表
す。(a1、・・・、ad)は、照合データ格納部51に格納された人物IDがAの人物
のi番目の特徴データを表す。
ステップS107において、照合部15は、算出した各特徴データ類似度と、信頼度算
出部142が算出した信頼度とに基づいて、照合データ格納部51の照合データに含まれ
る人物について、対象人物との類似の程度である人物類似度を算出する(S107)。
すなわち、本実施形態において、照合部15は、各特徴データの類似度s1〜sNと、
算出部14で得られた信頼度r1〜rNとに基づいて、照合データに含まれる人物と対象
人物との類似度である人物類似度sを算出する。類似度sは、式5により表されてよい。
ステップS108において、照合部15は、照合データに含まれる全ての人物の人物類
似度を算出したか否かを判定する(S108)。
全ての人物の人物類似度を算出していない場合は(S108:NO)、ステップS10
7に遷移し、照合部15は、まだ人物類似度を算出していない人物の人物類似度を算出す
る。
全ての人物の人物類似度を算出した場合(S108:YES)、ステップS109にお
いて、照合部15は、人物類似度が高い人物IDを照合データ格納部51から、認識結果
として得る。本実施形態において、照合部15は、人物類似度が高い人物IDを照合デー
タ格納部51から抽出する。
ステップS110において、出力部16は、認識結果を出力する(S110)。本実施
形態において、出力部16は、人物類似度が最も高い人物の人物IDと、その人物類似度
とを出力する。
ただし、これに限られず、出力部16は、人物類似度が予め設定された閾値以上となっ
た人物IDと、その人物類似度とを出力してもよい。この場合、閾値以上となる人物類似
度が存在しない場合は、照合データに含まれる人物に該当者がいないことを示す情報を出
力してよい。あるいは、照合データに含まれる、全員の人物の人物IDと、各人物IDに
対応する人物類似度とを出力してもよい。
以上、画像認識装置1の処理について説明した。
なお、本実施形態において、顔領域は矩形であるとして説明したがこれに限られない。
例えば、顔領域は、円領域や楕円領域、多角形領域でもよい。顔領域が円領域の場合、検
出部12は、顔領域の中心と半径を位置情報として抽出部13に供給してもよい。楕円領
域の場合、検出部12は、顔領域の中心と長軸と短軸の座標を位置情報として抽出部13
に供給してもよい。多角形領域の場合、検出部12は、各頂点の座標を位置情報として抽
出部13に供給してもよい。
本実施形態によれば、顔領域のサイズに基づいて算出した信頼度と特徴データとを用い
て、対象人物を認識するため、対象人物を精度よく認識することができる。
(変形例)
本実施形態では、抽出部13が各特徴データを抽出した後、算出部14が各特徴データ
の信頼度を算出しているが、この順序は逆でも構わない。また、このとき、抽出部13は
、算出された信頼度を用いて、抽出する特徴データを選択してもよい。すなわち、抽出部
13は、算出された信頼度が予め定められた閾値以上となった特徴データのみを抽出して
もよい。また、信頼度の大きい順に特徴データを並べ、上位のものだけを抽出してもよい
。また、信頼度が0の特徴量については抽出しなくてもよい。これにより、処理を高速化
することができる。
(第2の実施形態)
第2の実施形態に係る画像認識装置2は、入力画像に写っている対象人物の顔領域を周
波数変換して、顔領域の空間周波数成分を抽出し、特徴データの信頼度を算出する点が第
1の実施形態の場合と異なる。空間周波数成分はベクトルで表現される。すなわち、本実
施形態では、空間周波数成分の各成分が特徴データとなる。以下、第1の実施形態と異な
る部分について説明する。
図6は、画像認識装置2を表すブロック図である。画像認識装置2は、画像認識装置1
と比較して、抽出部13が抽出部23に置き変わり、算出部14が算出部24に置き変わ
る。算出部24は、フィルタ適用部241と、信頼度算出部242と、フィルタテーブル
格納部52とを含む。
抽出部23は、入力画像において、検出部12が検出した顔領域の周波数成分を抽出す
る。例えば、抽出部23は、図2に示す対象人物の顔領域(矩形201)に対して、2次
元フーリエ変換を施し、空間周波数成分を抽出する。このとき、抽出部23は、入力画像
における顔領域を予め定めたサイズに正規化し、顔領域の周波数成分を抽出する。
入力画像における顔領域のサイズに応じて、抽出部23が抽出する空間周波数成分の帯
域が異なる。例えば、入力画像における顔領域のサイズが大きくなると、空間周波数成分
の高周波の帯域が大きくなり、入力画像における顔領域のサイズが小さくなると、空間周
波数成分の低周波の帯域が大きくなる。
図7は、顔領域の空間周波数成分を可視化した周波数画像である。図7に示す周波数画
像では、中央付近が低周波成分の強度を表し、より外側が高周波成分の強度を表している
。2次元フーリエ変換は、フーリエ変換の他に、離散フーリエ変換、高速フーリエ変換、
離散コサイン変換等を含む。
フィルタテーブル格納部52は、信頼度算出部242(後述)が信頼度を算出する際に
用いるフィルタと、当該フィルタに対応する特徴データとを対応付けたフィルタテーブル
を格納している。
図8は、フィルタテーブルの一例図である。特徴データに対応するフィルタはベクトル
で表現される。図9は、可視化した各フィルタを表す一例図である。フィルタ適用部24
1は、抽出部23が抽出した顔領域の空間周波数成分に、図9に示すフィルタを適用する
。すなわち、フィルタ適用部241は、周波数成分とフィルタとを共に数値を並べた同じ
次元のベクトルとみなし、ベクトルの各成分同士の積を成分とするベクトル(適用ベクト
ル)を求める。これが、本実施形態におけるフィルタの適用を意味する。
本実施形態の場合、フィルタ適用部241は、フィルタ901を顔領域の空間周波数成
分に適用し、顔領域の低周波成分を得る。フィルタ適用部241は、フィルタ902を顔
領域の空間周波数成分に適用し、顔領域の中周波成分を得る。フィルタ適用部241は、
フィルタ903を顔領域の空間周波数成分に適用し、顔領域の高周波成分を得る。
また、フィルタ適用部241は、フィルタ904を顔領域の空間周波数成分に適用して
もよい。フィルタ904は、ガボールフィルタであり、周波数と周期の方向とを同時に指
定し、その成分を得ることができる。
なお、フィルタ適用部241は、複数の顔領域から抽出した周波数成分に対して主成分
分析や線形判別分析等を適用して得られたベクトルをフィルタとして適用してもよい。
信頼度算出部242は、フィルタ適用部241で得られた適用ベクトルから、特徴デー
タ(空間周波数成分の各成分)の信頼度を算出する。本実施形態では、各特徴データの信
頼度は、適用ベクトルの大きさ(長さ)とする。
入力画像における顔領域のサイズに応じて、抽出部23が抽出する空間周波数成分の帯
域が異なるため、信頼度算出部242が算出する信頼度も、顔領域のサイズに応じて切り
替わる。例えば、顔領域のサイズが大きい場合は、高周波成分の帯域を抽出するフィルタ
処理により得られる特徴データの信頼度が高くなり、顔領域のサイズが小さい場合は、低
周波成分を抽出するフィルタ処理により得られる特徴データの信頼度が低くなる。
なお、各特徴データの信頼度は、適用ベクトルの長さの2乗でもよい。すなわち、適用
ベクトルが長い程、当該適用ベクトルに対応するフィルタで得られた成分が多いことを意
味する。
また、各特徴データの信頼度を算出した後、信頼度の総和が1になるように信頼度の総
和で各信頼度を除したものを改めて各特徴データの信頼度としてもよい。また、この信頼
度に顔領域のサイズから得られる信頼度との平均や積等を、改めて各特徴データの信頼度
としてもよい。
図10は、抽出部23及び算出部24の処理を表すフローチャートである。
ステップS201において、抽出部23は、入力画像において、検出部12が検出した
顔領域の周波数成分を抽出する(S201)。ステップS202において、フィルタ適用
部241は、抽出部23が抽出した顔領域の空間周波数成分に、フィルタテーブル格納部
52が格納するフィルタを順次選択して適用する(S202)。信頼度算出部242は、
フィルタ適用部241で得られた適用ベクトルから、特徴データの信頼度を算出する(S
203)。
ステップS204において、信頼度算出部242は、全ての特徴データの信頼度を算出
したか否かを判定する(S204)。全ての特徴データの信頼度を算出していない場合は
(S204:NO)、ステップS202に遷移する。全ての特徴データの信頼度を算出し
た場合(S204:YES)、信頼度算出部242は、各特徴データの信頼度を照合部1
5に供給する。
以上、抽出部23及び算出部24の処理について説明した。
なお、照合部15は、抽出された空間周波数成分を特徴データとして用い、第1実施形
態と同様の処理を行なう。このとき、照合データ格納部51が格納する照合データに含ま
れる特徴データは、抽出部23が抽出する特徴データと比較可能なように予め対応させて
おく。
本実施形態によれば、入力画像のける顔領域のサイズのみならず、上述したような処理
を行うことにより、顔の解像度や入力画像のボケ等も考慮することができるため、画像に
写っている人物を精度よく認識することができる。
図11は、画像認識装置1,2のハードウェア構成の一例を表すブロック図である。図
11に示すように、画像認識装置1,2は、CPU1101と、画像中から顔と物体の認
識を行う認識プログラムなどを記憶するROM1102と、RAM1103と、認識テー
ブルなどを記憶するHDD1104と、HDD1104とのインタフェイスであるI/F
1105と、画像入力用のインタフェイスであるI/F1106と、マウスやキーボード
などの入力装置1107と、入力装置1107とのインタフェイスであるI/F1116
と、ディスプレイなどの表示装置1108と、表示装置1108とのインタフェイスであ
るI/F1110と、バス1111とを備えており、通常のコンピュータを利用したハー
ドウェア構成となっている。なおCPU1101、ROM1102、RAM1103、I
/F1105、I/F1106、I/F1116、及びI/F1110は、バス1111
を介して互いに接続されている。
画像認識装置1,2では、CPU1101が、ROM1102から認識プログラムをR
AM1103上に読み出して実行することにより、上記各部(検出部、算出部、抽出部、
照合部等)がコンピュータ上で実現され、HDD1104に記憶されている照合データ等
を用いて、I/F1106から入力画像に含まれる対象人物の顔領域を認識する。
なお、認識プログラムはHDD1104に記憶されていてもよい。また、認識プログラ
ムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、CD−R
、メモリカード、DVD、フレキシブルディスク(FD)等のコンピュータで読み取り可
能な記憶媒体に記憶されて提供されるようにしてもよい。また、認識プログラムを、イン
ターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由で
ダウンロードさせることにより提供するようにしてもよい。また、認識プログラムを、イ
ンターネット等のネットワーク経由で提供または配布するようにしてもよい。また、認識
テーブルは、ROM1102に記憶されていてもよい。また、画像をHDD1104に記
憶しておき、I/F1105から画像を入力するようにしてもよい。
以上のように、画像認識装置1,2では、入力画像に写っている対象人物の顔領域のサ
イズから、使用する特徴データの信頼度を算出し、その信頼度に基づいて各特徴量の認識
結果を統合することで、顔のサイズや顔の解像度による顔認識精度の低下を抑制すること
が可能となる。また、第2の実施形態によれば、低解像度の顔画像を拡大して入力された
場合や、ボケているが顔領域のサイズが大きい場合に周波数成分から、信頼度を算出する
ため、得られた信頼度を使うことにより、顔認識精度低下を抑止することが可能となる。
なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではそ
の要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施
の形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成す
ることができる。例えば、実施の形態に示される全構成要素からいくつかの構成要素を削
除してもよい。さらに、異なる実施の形態にわたる構成要素を適宜組み合わせてもよい。
これまで、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として
提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形
態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲
で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発
明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲
に含まれる。
1,2 画像認識装置
11 取得部
12 検出部
13、23 抽出部
14 算出部
15 照合部
16 出力部
51 照合データ格納部
52 フィルタテーブル格納部
141 サイズ算出部
142、242 信頼度算出部
241 フィルタ適用部

Claims (6)

  1. 画像を取得する取得部と、
    前記画像から認識対象となる対象人物の顔領域を検出する検出部と、
    前記顔領域の特徴データを抽出する抽出部と、
    前記顔領域のサイズに基づく前記特徴データの信頼度を算出する算出部と、
    複数の人物の顔の特徴データを予め格納しているデータベースを参照し、前記信頼度を
    用いて、抽出された前記特徴データと、前記データベースに格納されている前記特徴デー
    タとを照合し、前記対象人物を認識する照合部とを備え、
    前記抽出部は、サイズを正規化した前記顔領域の周波数成分を前記特徴データとして抽
    出し、
    前記算出部は、前記周波数成分の帯域毎の前記信頼度を算出する、
    ことを特徴とする画像認識装置。
  2. 前記算出部は、前記周波数成分から帯域毎の成分を抽出するフィルタを適用し、各々の前
    記成分について、フィルタ適用後の前記成分の大きさに応じた前記信頼度を算出する、
    請求項1記載の画像認識装置。
  3. 前記抽出部は、前記信頼度を用いて、抽出する特徴データを選択する、
    請求項1記載の画像認識装置。
  4. 前記抽出部は、前記信頼度が所定の閾値以上の前記特徴データを抽出する、
    請求項3記載の画像認識装置。
  5. 画像を取得し、
    前記画像から認識対象となる対象人物の顔領域を検出し、
    前記顔領域の特徴データを抽出し、
    前記顔領域のサイズに基づく前記特徴データの信頼度を算出し、
    複数の人物の顔の特徴データを予め格納しているデータベースを参照し、前記信頼度を用
    いて、抽出された前記特徴データと、前記データベースに格納されている前記特徴データ
    とを照合し、前記対象人物を認識し、
    サイズを正規化した前記顔領域の周波数成分を前記特徴データとして抽出し
    前記周波数成分の帯域毎の前記信頼度を算出する、
    画像認識方法。
  6. コンピュータを
    画像を取得する手段と、
    前記画像から認識対象となる対象人物の顔領域を検出する手段と、
    前記顔領域の特徴データを抽出し、サイズを正規化した前記顔領域の周波数成分を当該
    特徴データとして抽出する手段と、
    前記顔領域のサイズに基づく前記特徴データの信頼度を算出し、前記周波数成分の帯域
    毎の当該信頼度を算出する手段と、
    複数の人物の顔の特徴データを予め格納しているデータベースを参照し、前記信頼度を
    用いて、抽出された前記特徴データと、前記データベースに格納されている前記特徴デー
    タとを照合する前記対象人物を認識する手段として機能させる、
    画像認識プログラム。
JP2012185288A 2012-08-24 2012-08-24 画像認識装置、方法、及びプログラム Active JP5787845B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012185288A JP5787845B2 (ja) 2012-08-24 2012-08-24 画像認識装置、方法、及びプログラム
US13/856,146 US20140056490A1 (en) 2012-08-24 2013-04-03 Image recognition apparatus, an image recognition method, and a non-transitory computer readable medium thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012185288A JP5787845B2 (ja) 2012-08-24 2012-08-24 画像認識装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014044503A JP2014044503A (ja) 2014-03-13
JP5787845B2 true JP5787845B2 (ja) 2015-09-30

Family

ID=50148024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012185288A Active JP5787845B2 (ja) 2012-08-24 2012-08-24 画像認識装置、方法、及びプログラム

Country Status (2)

Country Link
US (1) US20140056490A1 (ja)
JP (1) JP5787845B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101381439B1 (ko) * 2011-09-15 2014-04-04 가부시끼가이샤 도시바 얼굴 인식 장치 및 얼굴 인식 방법
JP6404011B2 (ja) * 2014-06-25 2018-10-10 株式会社日立製作所 生体情報を利用する認証システム
JP6216353B2 (ja) 2015-09-15 2017-10-18 株式会社オプティム 情報特定システム、情報特定方法及び、そのプログラム
CN107844766A (zh) * 2017-10-31 2018-03-27 北京小米移动软件有限公司 人脸图像模糊度的获取方法、装置和设备
RU2718172C1 (ru) * 2019-01-10 2020-03-30 Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-воздушных сил "Военно-воздушная академия имени профессора Н.Е. Жуковского и Ю.А. Гагарина" (г. Воронеж) Министерства обороны Российской Федерации Способ поиска объектов на цифровых изображениях
CN111856445B (zh) * 2019-04-11 2023-07-04 杭州海康威视数字技术股份有限公司 一种目标检测方法、装置、设备及系统
CN111242077A (zh) * 2020-01-20 2020-06-05 西安奥卡云数据科技有限公司 一种人物追踪方法、系统及服务器
CN111340013B (zh) * 2020-05-22 2020-09-01 腾讯科技(深圳)有限公司 人脸识别方法、装置、计算机设备及存储介质
US20220415018A1 (en) * 2020-09-03 2022-12-29 Nec Corporation Information processing system, information processing method, and computer program
WO2023148964A1 (ja) * 2022-02-07 2023-08-10 日本電気株式会社 照合装置、照合方法、およびプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4208450B2 (ja) * 2001-10-15 2009-01-14 株式会社東芝 顔画像監視システム
JP3903783B2 (ja) * 2001-12-14 2007-04-11 日本電気株式会社 顔メタデータ生成方法および装置、並びに顔類似度算出方法および装置
JP3873793B2 (ja) * 2002-03-29 2007-01-24 日本電気株式会社 顔メタデータ生成方法および顔メタデータ生成装置
JP2005044330A (ja) * 2003-07-24 2005-02-17 Univ Of California San Diego 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置
US7551755B1 (en) * 2004-01-22 2009-06-23 Fotonation Vision Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
JP4696857B2 (ja) * 2005-11-02 2011-06-08 オムロン株式会社 顔照合装置
KR100723417B1 (ko) * 2005-12-23 2007-05-30 삼성전자주식회사 얼굴 인식 방법, 그 장치, 이를 위한 얼굴 영상에서 특징추출 방법 및 그 장치
KR100745981B1 (ko) * 2006-01-13 2007-08-06 삼성전자주식회사 보상적 특징에 기반한 확장형 얼굴 인식 방법 및 장치
JP2008015871A (ja) * 2006-07-07 2008-01-24 Konica Minolta Holdings Inc 認証装置、及び認証方法
JP2008117333A (ja) * 2006-11-08 2008-05-22 Sony Corp 情報処理装置、情報処理方法、個人識別装置、個人識別装置における辞書データ生成・更新方法および辞書データ生成・更新プログラム
JP4999570B2 (ja) * 2007-06-18 2012-08-15 キヤノン株式会社 表情認識装置及び方法、並びに撮像装置
JP2009163555A (ja) * 2008-01-08 2009-07-23 Omron Corp 顔照合装置
US8224042B2 (en) * 2009-03-12 2012-07-17 Seiko Epson Corporation Automatic face recognition

Also Published As

Publication number Publication date
JP2014044503A (ja) 2014-03-13
US20140056490A1 (en) 2014-02-27

Similar Documents

Publication Publication Date Title
JP5787845B2 (ja) 画像認識装置、方法、及びプログラム
US20230117712A1 (en) Feature density object classification, systems and methods
KR102299847B1 (ko) 얼굴 인증 방법 및 장치
US9530078B2 (en) Person recognition apparatus and person recognition method
JP2016081212A (ja) 画像認識装置、画像認識方法、および、画像認識プログラム
KR101216115B1 (ko) 고객 인적정보 생성방법 및 생성장치, 그 기록매체 및 포스 시스템
JP2012038106A (ja) 情報処理装置、情報処理方法、およびプログラム
JP6906717B2 (ja) 状態判定装置、状態判定方法、及び状態判定プログラム
JP6410450B2 (ja) オブジェクト識別装置、オブジェクト識別方法及びプログラム
JP2011100229A (ja) 画像処理装置、画像処理方法
JP6071002B2 (ja) 信頼度取得装置、信頼度取得方法および信頼度取得プログラム
JP6527421B2 (ja) 人物認識装置及びそのプログラム
JP2010108494A (ja) 画像内の顔の特性を判断する方法及びシステム
US11908157B2 (en) Image processing device, image processing method, and recording medium in which program is stored
JP5787686B2 (ja) 顔認識装置、及び顔認識方法
KR102063745B1 (ko) 측면 프로파일링 기반 신원확인 장치 및 방법
JP2012221053A (ja) 画像認識装置、画像認識方法、及びプログラム
JP5791361B2 (ja) パターン識別装置、パターン識別方法およびプログラム
KR102249663B1 (ko) 귀 인식 기반 신원확인 방법 및 시스템
JP2014199505A (ja) 画像認識装置、画像認識方法及びプログラム
JP2020098422A (ja) 画像処理装置、方法及びプログラム
KR20210050649A (ko) 모바일 기기의 페이스 인증 방법
JP6896467B2 (ja) 本人照合システム
JP5748548B2 (ja) オブジェクト識別装置、オブジェクト識別方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140822

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150123

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20150216

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150728

R151 Written notification of patent or utility model registration

Ref document number: 5787845

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151