JP6626259B2 - 画像認識装置、画像認識方法、及び画像認識プログラム - Google Patents
画像認識装置、画像認識方法、及び画像認識プログラム Download PDFInfo
- Publication number
- JP6626259B2 JP6626259B2 JP2015046510A JP2015046510A JP6626259B2 JP 6626259 B2 JP6626259 B2 JP 6626259B2 JP 2015046510 A JP2015046510 A JP 2015046510A JP 2015046510 A JP2015046510 A JP 2015046510A JP 6626259 B2 JP6626259 B2 JP 6626259B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- image
- organ
- similarity
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title description 48
- 210000000056 organ Anatomy 0.000 claims description 202
- 230000001815 facial effect Effects 0.000 claims description 52
- 238000000605 extraction Methods 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 33
- 238000006243 chemical reaction Methods 0.000 description 20
- 238000001514 detection method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 16
- 208000004547 Hallucinations Diseases 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 208000029152 Small face Diseases 0.000 description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 210000000887 face Anatomy 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Collating Specific Patterns (AREA)
Description
複数の登録画像を、前記登録画像に写っている各顔器官の顔器官位置と関連付けて記憶する登録手段と、
入力画像の顔領域全体と前記複数の登録画像の各登録画像の顔領域全体とを比較して、前記入力画像と前記登録画像との顔類似度を算出し、前記顔類似度に基づいて前記入力画像に対応する前記登録画像を探索し、当該対応する登録画像に関連付けて記憶されている前記顔器官位置を、前記入力画像の顔器官位置として設定する設定手段と、
前記設定手段が設定した前記顔器官位置に基づいて前記入力画像の各顔器官の特徴量を抽出し、かつ、前記登録手段が記憶している前記顔器官位置に基づいて前記各登録画像の各顔器官の特徴量を抽出する特徴抽出手段と、
前記特徴抽出手段が抽出した前記入力画像の各顔器官の特徴量と前記各登録画像の各顔器官の特徴量との顔器官類似度を算出し、算出された前記顔器官類似度に基づいて前記入力画像に写っている顔と前記各登録画像に写っている顔が同一人物の顔か識別する顔識別手段と、
を備えることを特徴とする。
本発明では、従来のように入力された低解像顔画像に対して顔特徴点検出技術を適用して位置合わせをするのではなく、登録処理で登録された顔画像から検出した顔特徴点を入力された低解像顔画像に適用することで位置合わせを行う。
また、これに加え、高解像化技術に対して位置ズレに頑健な本発明の技術を組み込むことで、低解像顔画像に対する顔認証精度を大幅に向上させることができる。
第1の実施形態では、登録処理で登録された顔画像から検出した顔器官位置を入力低解像顔画像の顔器官位置に設定し、顔認識を実行する。以下で、その詳細を説明する。
図14に、本実施形態における画像認識装置のハードウェア構成の一例を示す。画像認識装置1400は、CPU(Central Processing Unit)1401、ROM(Read Only Memory)1402、RAM(Random Access Memory)1403を備える。更に、二次記憶装置1404、表示部1405、操作部1406、ネットワーク通信部1407、ネットワーク接続部1408、USB通信部1409、USB接続部1410、および接続バス1411を備える。
CPU1401は、ROM1402やRAM1403に格納された制御プログラムを実行することにより、本装置全体の制御を行う。
RAM1403は、揮発性メモリであり、画像データや制御プログラムおよびその実行結果を一時的に記憶する。
CPU1401は、二次記憶装置1404に記憶されているプログラムやOSをメモリ1403に読み出す。そして、メモリ1403上で当該プログラムを実行することで、画像認識装置の各種の機能を実現することができる。
また、後述する処理を記述したソフトウェア(プログラム)をネットワークまたは各種記憶媒体を介して取得して実行してもよい。
接続バス1411は、CPU1401、ROM1402、RAM1403、二次記憶装置1404などを接続して相互にデータの入出力を行う。
図1は、第1の実施形態における画像認識装置の機能構成の一例を示したブロック図である。図1に示すように、本実施形態の機能構成は、画像取得部110、顔位置検出部120、顔器官位置検出部130、顔器官位置設定部140、特徴抽出部150、顔画像登録部160、及び顔識別部170を含む。
また、画像取得部110は、登録画像と一致するか判断される対象となる画像(以下、「入力画像」とも記載する)を取得する。
顔位置検出部120は、入力画像および登録画像に写っている顔の位置を検出する。
顔器官位置検出部130は、入力画像に関しては、入力画像に写っている各顔器官の位置は検出しない。
入力画像から顔の大きさ、顔の位置、顔の向きの少なくとも1つが異なる複数の変換画像を生成し、生成された複数の変換画像のそれぞれと、複数の登録画像のそれぞれとの顔類似度を算出し、
顔類似度が最も高くなる変換画像と登録画像とのペアを探索し、
顔類似度が最も高くなる登録画像に関連付けて記憶されている顔器官位置を、顔類似度が最も高くなる変換画像の顔器官位置として設定する、ことが好ましい。
特徴抽出部150は、入力画像に関しては、顔器官位置設定部140が設定した顔器官位置に基づいて、入力画像の変換画像から各顔器官の特徴量を抽出する。
例えば、
第1の登録画像を、
第1の登録画像に写っている右目の位置、左目の位置、口の位置と、
第1の登録画像に写っている右目の特徴量、左目の特徴量、口の特徴量と、
関連付けて記憶する。
図2(a)のステップS1001では、まず、登録モードが選択されているかどうかを判定する。登録モードが選択されている場合には、顔画像登録モードに進む。
図2(b)のステップS1101では、画像取得部110において、登録画像を取得する。画像取得部110は、レンズなどの集光素子、光を電気信号に変換するCMOSやCCDなどの撮像素子、アナログ信号をデジタル信号に変換するAD変換器を通過することによって、得られたデジタル画像データを取得する。また、間引き処理等を行うことによって、例えば、VGA(640×480[pixel])やQVGA(320×240[pixel])に変換した顔画像を取得することも可能である。また、撮影の他もフラッシュメモリなどを通じて登録画像を取得することもできる。従って、登録画像は比較的に高解像度の顔画像が登録される。
ステップS1202では、ステップS1201で検出した顔や左右の目や口などの重心位置からアフィン変換などを利用して顔の大きさが所定のサイズ、顔の向きが正立するような第1の正規化画像を生成する。なお、顔の大きさは左右の目の間のユークリッド距離として定義する方法などがある。
ステップS1302では、ステップS1301で検出した目尻や目頭などのより細かな特徴点の重心位置を利用して顔の大きさが所定のサイズ、顔の向きが正立するような第2の正規化画像を生成する。
ステップS1601では、顔画像登録部160が、個人ID、ステップS1301で検出された顔器官位置、ステップS1302で生成された第2の正規化画像、ステップS1501で生成された特徴量をメモリなどに記憶する。
なお、従来の顔認証ではステップS1601においては、ステップS1301で検出された顔器官位置やステップS1302で生成された第2の正規化画像は記憶せず、個人IDと特徴量だけを記憶するケースが一般的である。
図2(a)のステップS1001で、顔識別モードが選択された場合には、顔識別モードに進む。
図3のステップS1102からステップS1204までの処理は、顔画像登録モードにおけるステップS1101からステップS1202までの処理と同じため、説明を省略する。但し、本発明の第1の実施形態では、顔識別モードで取得される顔画像は、遠方にある小さい顔やぼけている顔などの低解像顔画像としている。
図4は、ステップS1401における顔器官位置設定処理の詳細な処理フローを示している。
図5は、ステップS1411における変換画像生成処理を解説した図である。
ステップS1411では、図5に示すようにステップS1204で生成された第1の正規化画像からスケール(サイズ)、シフト量、回転量の異なる複数の変換画像を生成する。スケール、シフト量、回転量の異なる複数の変換画像は、例えば、アフィン変換を用いて生成する。
ステップS1412では、図6Aに示すようにステップS1411で生成されたスケール、シフト量、回転量の異なる複数の変換画像と、登録画像とのマッチングを行うことで最も類似度の高くなる変換画像と登録画像とのペアを探索する。マッチングには、例えば、正規化相互相関などを用いる。
ステップS1413では、図6Bに示すようにステップS1412で探索された登録画像(図6Bの例では第1の登録画像)の顔器官位置を、変動画像(図6Bの例では第1の変換画像)の顔器官位置として設定する。なお、登録画像の顔器官位置は上述のようにステップS1301での顔器官位置検出の結果である。
ステップS1701では、ステップS1502で抽出された特徴量と、ステップS1601で記憶された特徴量との類似度(顔器官類似度)を算出し、個人を識別する。
例えば、図6Cに示すように、第1の変換画像の各顔器官と第1の登録画像の各顔器官の類似度、第1の変換画像の各顔器官と第2の登録画像の各顔器官の類似度を算出する。そして、算出された顔器官類似度に基づいて、第1の入力画像に写っている人物と第1の登録画像に写っている人物とが同一人物か、第1の入力画像に写っている人物と第2の登録画像に写っている人物とが同一人物かを識別する。
第2の実施形態では、入力画像の顔器官位置を設定した後に、入力画像の変換画像を高解像化する。そしで、高解像化した変換画像の各顔器官と、登録画像の各顔器官の類似度を算出し、算出された類似度(顔器官類似度)に基づいて、入力画像に写っている人物と登録画像に写っている人物が同一人物かを識別する。
図7Aは、第2の実施形態における画像認識装置の機能構成の一例を示したブロック図である。図7Aに示すように、本実施形態の機能構成200は、画像取得部110、顔位置検出部120、顔器官位置検出部130、顔器官位置設定部140、特徴抽出部151、顔画像登録部160、及び顔識別部171、並びに高解像顔画像生成部210を含む。
画像認識装置200は高解像顔画像生成部210を有するが、画像認識装置100は高解像顔画像生成部210に相当する機能部は有しない。
高解像顔画像生成部210は、顔類似度が最も高くなる変換画像から高解像顔画像を生成する。
顔識別部171は、高解像顔画像の各顔器官の特徴量と、各登録画像の各顔器官の特徴量との顔器官類似度を算出し、算出された顔器官類似度に基づいて、入力画像に写っている顔と各登録画像に写っている顔が同一人物の顔か識別する。
図7Cは、第2の実施形態における一連の処理の流れを示すフローチャートである。
ステップS1502では、特徴抽出部151が高解像化された変換画像から特徴量を抽出する。
ステップS1701では、特徴抽出部151が高解像化された変換画像から抽出した特徴量と、特徴抽出部151によって登録画像から抽出され顔画像登録部160に記憶されている特徴量との類似度(顔器官類似度)が算出される。そして、算出された顔器官類似度に基づいて、顔識別部170が入力画像に写っている人物と登録画像に写っている人物とが同一人物かを識別する。
まず、始めに高解像顔画像生成技術であるhallucination技術について説明する。
・hallucination技術の説明
hallucination技術は、低解像顔画像から高解像顔画像を生成する技術である。その原理の概要は、入力された低解像顔画像を他人の高解像顔画像で近似するというものである。詳細を説明する。
高解像と低解像のペアは数式2に示すように複数格納されている。
また、高解像化辞書を構成する第1のペア、第1のペアを構成する低解像辞書、第1のペアを構成する高解像辞書のそれぞれを数式3のように記述すると、高解像化辞書と低解像辞書と高解像辞書との関係は数式4のとおりである。
これにより、低解像部分画像を近似する低解像辞書と結合係数α(α1、α2、α3、...)が求まり、そして、低解像辞書に対応する高解像辞書と結合係数α(α1、α2、α3、...)を用いて高解像部分画像を生成する。数式6は生成された高解像部分画像を表す式である。
・hallucination技術の問題点
hallucination技術では、低解像顔画像を複数のブロックに分割し、各ブロック毎に高解像化辞書Dを利用して高解像化を行うため、目や口などの位置を所定の位置に合わせるような高精度な位置合わせが必要である。もし、高精度な位置合わせができていない場合には、生成された高解像顔画像が部分的に破綻してしまい、十分な顔認証精度を実現できない可能性がある。
以上のように、hallucination技術では目や口などの位置を所定の位置に合わせることが非常に重要であり、これができていない場合には画像の一部が破綻してしまうような現象が発生する。しなしながら、低解像顔画像に対して高精度な位置合わせをすることは困難である。そこで、第3の実施形態では、高解像化処理で複数の高解像顔画像を生成し、その中から最も類似度が高い領域を利用することによって、破綻していない領域だけを利用して顔認証を行う。以下で、その詳細を説明する。
顔器官位置設定部140が設定した顔器官位置に基づいて、2回変換高解像顔画像の各顔器官の特徴量を抽出し、
顔画像登録部160が記憶している顔器官位置に基づいて、各登録画像の各顔器官の特徴量を抽出する。
第1の2回変換高解像顔画像を用いて算出された第1の顔器官についての顔器官類似度の最高値と、
第2の2回変換高解像顔画像を用いて算出された第2の顔器官についての顔器官類似度の最高値と、を統合して統合顔器官類似度を得る。
第1の顔器官とは、例えば右目であり、第2の顔器官とは例えば左目である。
第3の2回変換高解像顔画像を用いて算出された第3の顔器官(例えば、口)についての顔器官類似度の最高値や、
第4の2回変換高解像顔画像を用いて算出された第4の顔器官(右目、左目、口以外の顔器官)についての顔器官類似度の最高値と、を統合して統合顔器官類似度を得るとしても良い、という意味である。
また、「第2の2回変換高解像顔画像」とは「当該画像の第2の顔器官と登録画像の第2の顔器官との組合せ」から「第2の顔器官についての顔器官類似度の最高値」が得られた2回変換高解像画像ということを意味する。
これと同じ「2回変換高解像顔画像」から「第2の顔器官についての顔器官類似度の最高値」が得られることもあり得る。この場合、「第1の2回変換高解像顔画像」と「第2の2回変換高解像顔画像」とは同一の「2回変換高解像顔画像」となる。
顔登録モードは第1の実施形態の顔登録モード同様であるので、説明を省略する。
図10のステップS2102からステップS2302までの処理は図2のステップS1101からステップS1202までの処理と同様である。
ステップS2303以降を説明する前に本発明の第3の実施形態でのポイントを説明する。
上述で説明した通り、hallucination技術を用いた場合、目や口などの位置を所定の位置に合わせることができず、画像の一部が破綻してしまうような現象が発生する。そこで、第3の実施形態では、ステップS2303でシフト量、スケール、回転量の異なる複数の変換画像を生成し、生成した複数の変換画像に対して高解像化処理を行い、登録画像との類似度が高い領域だけを利用して顔認識を行う。その結果、破綻していない領域だけを利用して顔認証を行うことになる。
変換画像18001と変換画像18005はシフト量が異なる変換画像の例である。変換画像18001から生成した高解像顔画像18003のブロック18004と、変換画像18005から生成した高解像顔画像18007のブロック18008とは、登録画像との顔器官類似度が高い(つまり、破綻していない)領域の例である。
以上が、第3の実施形態のポイントである。
続いて、第3の実施形態における処理を順次説明する。
ステップS2303では、ステップS2302で生成された正規化画像からシフト量、スケール、回転量の異なる複数の変換画像を生成する。例えば、アフィン変換などを用いる。
図13Aに示すように、入力画像からスケール変換、シフト変換、回転変換などにより第1〜第3の変換画像を生成する。なお、スケール変換、シフト変換、回転変換のそれぞれによって複数の変換画像が生成されること、各変換を適宜組み合わせても良いことは第1、第2の実施形態と同様である。
ステップS2304では、図4のステップS1402と同様に、類似度が最も高くなる変換画像と登録画像とのペアを探索する。
ステップS2305では、ステップS2304で類似度が最も高くなると判断されたペアの変換画像からシフト量、スケール、回転量の異なる複数の変換画像(以下、「2回変換画像」とも記載する)を生成する。
図13Aに示す例では、第1の変換画像が類似度が最も高くなった変換画像であり、その第1の変換画像から、第1の2回変換画像、第2の2回変換画像を生成している。
図10のステップS2305におけるシフト量、スケール、回転量は、ステップS2303におけるシフト量、スケール、回転量よりも小さい。ステップS2303は顔全体の類似度を比較するための前処理であるのに対し、ステップS2305は顔全体と比べて小さい顔器官の類似度を比較するための前処理だからである。例えば、ステップS2303では1cm単位でシフトさせ、ステップS2305では1mm単位でシフトさせる。
図13Bに示す例では、第1の2回変換画像を高解像化して第1の2回変換高解像画像とし、第2の2回変換画像を高解像化して第2の2回変換高解像画像とした。
ステップS2502では、ステップS2401で生成された全ての高解像顔画像に対して非特許文献1に記載されているようなLBP特徴を抽出する。
<類似度の算出>
ステップS2701では、高解像顔画像のあるブロックからステップS2502で抽出したLBP特徴と、ステップS1601(図2)で記憶した顔画像の同じブロックから抽出したLBP特徴との類似度をそれぞれ算出する。
第1の2回変換画像のブロック18022から抽出したLBP特徴と、第1の登録画像のブロック18010から抽出したLBP特徴との類似度を算出し、
第2の2回変換画像のブロック18008から抽出したLBP特徴と、第1の登録画像のブロック18010から抽出したLBP特徴との類似度を算出する。
第1の2回変換画像のブロック18004から抽出したLBP特徴と、第1の登録画像のブロック18011から抽出したLBP特徴との類似度を算出し、
第2の2回変換画像のブロック18012から抽出したLBP特徴と、第1の登録画像のブロック18011から抽出したLBP特徴との類似度を算出する。
ステップS2702では、ブロック位置が同じ複数のペアの類似度の中から最も類似度の高いペアの類似度を選択し、選択された類似度を統合する。
例えば、図13Bの高解像顔画像18003のブロック18022と、登録画像18009のブロック18010との類似度(顔器官類似度)と、
高解像顔画像18007のブロック18008と、登録画像18009のブロック18010との類似度(顔器官類似度)と、の中から最も類似度の高いペア(ブロック18008とブロック18010とのペア)の類似度を選択する。
高解像顔画像18007のブロック18012と、登録画像18009のブロック18011との類似度(顔器官類似度)と、の中から最も類似度の高いペア(ブロック18004とブロック18011とのペア)の類似度を選択する。
そして、選択された類似度(ブロック18008とブロック18010とのペアの類似度、ブロック18004とブロック18011とのペアの類似度)を統合する。
ステップS2801では、統合された類似度に基づいて顔識別を実行する。
図11を用いてステップS2502〜ステップS2702について、詳しく説明する。
まず、ステップS3010では、顔器官の特徴を抽出する。
ステップS3011では、顔器官の類似度を算出する。
ステップS3012では、全ての2回変換高解像画像について顔器官類似度を算出していなければステップS3010に戻り、新たな2回変換高解像画像についてステップS3010以降の処理を繰り返す。全ての2回変換高解像画像について顔器官類似度を算出していればステップS3013に進む。
この場合、
第1の2回変換高解像画像の右目と第1の登録画像の右目との第1の類似度を算出し、
第2の2回変換高解像画像の右目と第1の登録画像の右目との第2の類似度を算出し、
:
第(n−1)の2回変換高解像画像の右目と第1の登録画像の右目との第(n−1)の類似度を算出し、
第nの2回変換高解像画像の右目と第1の登録画像の右目との第nの類似度を算出したら、ステップS3013に進む。
例えば、前記の如く、2回変換高解像画像として第1の2回変換高解像画像から第nの2回変換高解像画像までが生成されたとする(nは任意の自然数)。
この場合、
右目についての第1の類似度、第2の類似度、・・・、第(n−1)の類似度、第nの類似度の中での最高値を記憶する。
例えば、右目、左目及び口に関して、顔器官類似度を算出し、その最高値を記憶し、統合して顔識別をする場合に、右目に関しては最高値の記憶をしたが、左目に関してはまだ最高値を記憶していないとする。
第1の2回変換高解像画像の左目と第1の登録画像の左目との第1の類似度を算出し、
第2の2回変換高解像画像の左目と第1の登録画像の左目との第2の類似度を算出し、
:
第nの2回変換高解像画像の左目と第1の登録画像の左目との第nの類似度を算出したら、左目についての第1の類似度、第2の類似度、・・・、第(n−1)の類似度、第nの類似度の中での最高値を記憶する。
ステップS3015では、顔器官類似度を統合する。
例えば、右目についての顔器官類似度の最高値と、左目についての顔器官類似度の最高値と、口についての顔器官類似度の最高値とを合計する。
例えば、右目については、第1の2回変換高解像画像と第1の登録画像との類似度が最高値となり、
左目については第1の2回変換高解像画像と第1の登録画像との類似度が最高値となり、
口については第3の2回変換高解像画像と第1の登録画像との類似度が最高値となり得る。
又は、右目については、第1の2回変換高解像画像と第1の登録画像との類似度が最高値となり、
左目については第3の2回変換高解像画像と第1の登録画像との類似度が最高値となり、
口については第5の2回変換高解像画像と第1の登録画像との類似度が最高値となり得る。
全ての登録画像について、全ての顔器官について、全ての変換画像との組み合わせについて顔器官類似度を統合したら、ステップS2801に進み、顔識別を実行する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
120 顔位置検出部
130 顔器官位置検出部
140 顔器官位置設定部
150 特徴抽出部
160 顔画像登録部
170 顔識別部
Claims (7)
- 複数の登録画像を、前記登録画像に写っている各顔器官の顔器官位置と関連付けて記憶する登録手段と、
入力画像の顔領域全体と前記複数の登録画像の各登録画像の顔領域全体とを比較して、前記入力画像と前記登録画像との顔類似度を算出し、前記顔類似度に基づいて前記入力画像に対応する前記登録画像を探索し、当該対応する登録画像に関連付けて記憶されている前記顔器官位置を、前記入力画像の顔器官位置として設定する設定手段と、
前記設定手段が設定した前記顔器官位置に基づいて前記入力画像の各顔器官の特徴量を抽出し、かつ、前記登録手段が記憶している前記顔器官位置に基づいて前記各登録画像の各顔器官の特徴量を抽出する特徴抽出手段と、
前記特徴抽出手段が抽出した前記入力画像の各顔器官の特徴量と前記各登録画像の各顔器官の特徴量との顔器官類似度を算出し、算出された前記顔器官類似度に基づいて前記入力画像に写っている顔と前記各登録画像に写っている顔が同一人物の顔か識別する顔識別手段と、
を備えることを特徴とする画像認識装置。 - 前記設定手段は、
前記入力画像から顔の大きさ、顔の位置、顔の向きの少なくとも1つが異なる複数の変換画像を生成し、前記生成された複数の変換画像のそれぞれと、前記複数の登録画像のそれぞれとの顔類似度を算出し、
前記顔類似度に基づいて前記変換画像と前記登録画像との対応するペアを探索し、
前記ペアとなる登録画像に関連付けて記憶されている前記顔器官位置を、前記ペアとなる変換画像の顔器官位置として設定し、
前記特徴抽出手段は、
前記設定手段が設定した前記顔器官位置に基づいて、前記ペアとなる変換画像の各顔器官の特徴量を抽出し、
前記登録手段が記憶している前記顔器官位置に基づいて、前記各登録画像の各顔器官の特徴量を抽出し、
前記顔識別手段は、
前記特徴抽出手段が抽出した前記変換画像の各顔器官の特徴量と
前記特徴抽出手段が抽出した前記各登録画像の各顔器官の特徴量との顔器官類似度を算出し、
算出された前記顔器官類似度に基づいて、前記入力画像に写っている顔と前記各登録画像に写っている顔が同一人物の顔か識別することを特徴とする請求項1に記載の画像認識装置。 - 前記入力画像は低解像、前記登録画像は高解像であることを特徴とする請求項1又は2に記載の画像認識装置。
- 前記ペアとなる変換画像から高解像顔画像を生成する生成手段をさらに備え、
前記特徴抽出手段は、
前記設定手段が設定した前記顔器官位置に基づいて、前記高解像顔画像の各顔器官の特徴量を抽出し、
前記登録手段が記憶している前記顔器官位置に基づいて、前記各登録画像の各顔器官の特徴量を抽出し、
前記顔識別手段は、
前記高解像顔画像の各顔器官の特徴量と
前記各登録画像の各顔器官の特徴量との顔器官類似度を算出し、
算出された前記顔器官類似度に基づいて、前記入力画像に写っている顔と前記各登録画像に写っている顔が同一人物の顔か識別することを特徴とする請求項2に記載の画像認識装置。
- 前記生成手段は、
前記顔類似度が最も高くなる前記変換画像から、顔の大きさ、顔の位置、顔の向きの少なくとも1つが異なる複数の2回変換画像を生成し、
前記複数の2回変換画像の各2回変換画像から高解像顔画像を生成し、
前記特徴抽出手段は、
前記設定手段が設定した前記顔器官位置に基づいて、前記高解像顔画像の各顔器官の特徴量を抽出し、
前記登録手段が記憶している前記顔器官位置に基づいて、前記各登録画像の各顔器官の特徴量を抽出し、
前記顔識別手段は、
前記高解像顔画像の各顔器官の特徴量と
前記各登録画像の各顔器官の特徴量との顔器官類似度を算出し、
少なくとも
第1の高解像顔画像を用いて算出された第1の顔器官についての顔器官類似度と、
第2の高解像顔画像を用いて算出された第2の顔器官についての顔器官類似度と、を統合して得られる統合類似度に基づいて、前記入力画像に写っている顔と前記各登録画像に写っている顔が同一人物の顔か識別することを特徴とする請求項4に記載の画像認識装置。 - 複数の登録画像を、前記登録画像に写っている各顔器官の顔器官位置と関連付けて記憶する登録工程と、
入力画像の顔領域全体と前記複数の登録画像の各登録画像の顔領域全体とを比較して、前記入力画像と前記登録画像との顔類似度を算出し、前記顔類似度に基づいて前記入力画像に対応する前記登録画像を探索し、当該対応する登録画像に関連付けて記憶されている前記顔器官位置を、前記入力画像の顔器官位置として設定する設定工程と、
前記設定工程において設定された前記顔器官位置に基づいて前記入力画像の各顔器官の特徴量を抽出し、かつ、前記登録工程において記憶された前記顔器官位置に基づいて前記各登録画像の各顔器官の特徴量を抽出する特徴抽出工程と、
前記特徴抽出工程において抽出された前記入力画像の各顔器官の特徴量と前記各登録画像の各顔器官の特徴量との顔器官類似度を算出し、算出された前記顔器官類似度に基づいて前記入力画像に写っている顔と前記各登録画像に写っている顔が同一人物の顔か識別する顔識別工程と
を含むことを特徴とする画像認識方法。 - 請求項1乃至5の何れか1項に記載の画像認識装置の各手段としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015046510A JP6626259B2 (ja) | 2015-03-09 | 2015-03-09 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015046510A JP6626259B2 (ja) | 2015-03-09 | 2015-03-09 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016167164A JP2016167164A (ja) | 2016-09-15 |
JP6626259B2 true JP6626259B2 (ja) | 2019-12-25 |
Family
ID=56898548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015046510A Active JP6626259B2 (ja) | 2015-03-09 | 2015-03-09 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6626259B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102370063B1 (ko) | 2017-03-28 | 2022-03-04 | 삼성전자주식회사 | 얼굴 인증 방법 및 장치 |
JP6947202B2 (ja) * | 2017-09-19 | 2021-10-13 | 日本電気株式会社 | 照合システム |
JP6544404B2 (ja) | 2017-09-19 | 2019-07-17 | 日本電気株式会社 | 照合システム |
JP7298658B2 (ja) * | 2017-09-19 | 2023-06-27 | 日本電気株式会社 | 照合システム |
CN109977832B (zh) * | 2019-03-19 | 2024-03-29 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置及存储介质 |
KR102665968B1 (ko) * | 2019-06-27 | 2024-05-16 | 삼성전자주식회사 | 블러 추정 방법 및 장치 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007115109A (ja) * | 2005-10-21 | 2007-05-10 | Sony Corp | 画像処理装置および方法、プログラム、並びに記録媒体 |
JP6265592B2 (ja) * | 2012-12-10 | 2018-01-24 | セコム株式会社 | 顔特徴抽出装置および顔認証システム |
-
2015
- 2015-03-09 JP JP2015046510A patent/JP6626259B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016167164A (ja) | 2016-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6626259B2 (ja) | 画像認識装置、画像認識方法、及び画像認識プログラム | |
US9626551B2 (en) | Collation apparatus and method for the same, and image searching apparatus and method for the same | |
Raghavendra et al. | Exploring the usefulness of light field cameras for biometrics: An empirical study on face and iris recognition | |
Sequeira et al. | Cross-eyed 2017: Cross-spectral iris/periocular recognition competition | |
JP6544900B2 (ja) | オブジェクト識別装置、オブジェクト識別方法及びプログラム | |
JP5424819B2 (ja) | 画像処理装置、画像処理方法 | |
CN102422325B (zh) | 用于识别对象及另一低级别对象的模式识别装置及其方法 | |
JP6112801B2 (ja) | 画像認識装置及び画像認識方法 | |
Diwakar et al. | An extraction and recognition of tongue-print images for biometrics authentication system | |
Hajari et al. | Neural network approach to iris recognition in noisy environment | |
JP2005149507A (ja) | テクストンを用いる対象物認識方法及び装置 | |
EP3617993B1 (en) | Collation device, collation method and collation program | |
JP6456031B2 (ja) | 画像認識装置、画像認識方法およびプログラム | |
Reddy et al. | Face recognition based on cross diagonal complete motif matrix | |
Li et al. | Design and learn distinctive features from pore-scale facial keypoints | |
JP2019096146A (ja) | 画像識別装置、画像識別方法、コンピュータプログラム、及び記憶媒体 | |
Valente et al. | Perspective distortion modeling, learning and compensation | |
Samangooei et al. | On acquisition and analysis of a dataset comprising of gait, ear and semantic data | |
CN110826534A (zh) | 一种基于局部主成分分析的人脸关键点检测方法及系统 | |
JP2013218605A (ja) | 画像認識装置、画像認識方法及びプログラム | |
JP5791361B2 (ja) | パターン識別装置、パターン識別方法およびプログラム | |
Hizem et al. | Face recognition from synchronised visible and near-infrared images | |
KR102027786B1 (ko) | 다수의 얼굴 이미지를 동시에 사용하는 얼굴 인식 및 인증 방법 및 시스템 | |
Gorbatsevich et al. | Face pose recognition based on monocular digital imagery and stereo-based estimation of its precision | |
Suchitra et al. | Face image retrieval of efficient sparse code words and multiple attribute in binning image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180306 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191129 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6626259 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |