JP4582702B2 - 画像認識装置 - Google Patents

画像認識装置 Download PDF

Info

Publication number
JP4582702B2
JP4582702B2 JP2004337465A JP2004337465A JP4582702B2 JP 4582702 B2 JP4582702 B2 JP 4582702B2 JP 2004337465 A JP2004337465 A JP 2004337465A JP 2004337465 A JP2004337465 A JP 2004337465A JP 4582702 B2 JP4582702 B2 JP 4582702B2
Authority
JP
Japan
Prior art keywords
image
dictionary data
recognition
processing unit
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004337465A
Other languages
English (en)
Other versions
JP2006146673A (ja
Inventor
賢治 松尾
真幸 橋本
淳 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2004337465A priority Critical patent/JP4582702B2/ja
Publication of JP2006146673A publication Critical patent/JP2006146673A/ja
Application granted granted Critical
Publication of JP4582702B2 publication Critical patent/JP4582702B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像認識装置に関し、特に、画像を用いて人物の認証や検索、物体の照合や識別などに用いられ、それを高い信頼性で行うことができる画像認識装置に関する。
近年、店頭で携帯電話を使った電子決済が可能になり、今後利用者が増えることが予想される。携帯電話はその紛失時の悪用を防ぐために4桁数字によるダイヤルロック機能を備えているが、これが電子決済などの利用されることに伴い、より高度なセキュリティを確保することが望まれる。
より高度なセキュリティを確保するために、携帯電話のカメラで撮影された顔画像を画像認識して所有者認証を行う方法が考えられる。この場合、携帯電話や組み込み機器などのCPU処理能力やメモリ容量は限られているので必要とする計算量と使用するメモリ量は可能な限り少なく、処理負荷の低い画像認識方法が望まれる。また、携帯電話に限らず、高機能なPCにおいても認識処理の高速化の観点から処理負荷が低減された画像認識方法が求められている。
従来、処理負荷が低く、高速で認識処理が可能な画像認識方法として、2枚の画像の相関値Cを測定し、その相関値Cの値の大小で判定を行なう画像認識方法が存在する。ここで、ベクトルを〈 〉付き文字で表すと、2枚の画像の相関値Cは、各画像をベクトル〈u〉、〈v〉とみなし、次式で表される。
C=(〈u〉,〈v〉)/{|〈u〉||〈v〉|} -1≦C≦1
ここで、(〈u〉,〈v〉)は、ベクトル〈u〉、〈v〉の内積を表し、|〈u〉|、|〈v〉|はそれぞれ、ベクトル〈u〉、〈v〉の大きさを表す。つまり、2枚の画像の相関値Cは、各画像のベクトル〈u〉、〈v〉の内積を、ベクトル〈u〉、〈v〉それぞれの大きさの積で除したものとして定義される。
相関値Cは、-1〜1の範囲の値を持ち、この値が1に近いほど、ベクトル〈u〉、〈v〉は類似している、すなわち2枚の画像が類似していることを意味する。従って、入力された画像と予め登録された画像の相関値Cを求め、その値が1に近いかどうかで2枚の画像の類似性を判定することができる。具体的には、顔画像を対象として人物の異同判定を行う場合、相関値Cが設定されたしきい値以上であれば両画像の人物は同じ(本人)と判定でき、しきい値未満ならば両画像の人物は異なる(他人)と判定することができる。
図3は、顔画像認証に適用した従来の画像認識装置のブロック構成図である。この画像認識装置は、ある人物の顔を提影して得られる顔画像から、その人物が本人であるか否かを照合もしくはその人物が誰であるかを識別するものであり、機能からすると、予め辞書データを作成して登録する辞書データ作成処理部1と、入力画像から人物の照合および識別を行う画像認識処理部2に大別される。
辞書データ作成処理部1は、データベース14へ登録するための辞書データを作成する。辞書データの作成に際しては、まず、識別情報IDを持った1名の人物を撮影し、該人物の顔画像を入力する。正規化処理部11は、入力された顔画像の位置、領域、大きさ、輝度レベルなどを正規化した正規化画像〈xID〉を出力する。
辞書データ作成部13は、入力された正規化画像〈xID〉に該人物の識別情報IDを添えた辞書データAを作成する。辞書データ作成部13で作成された辞書データAは、データベース14に蓄積される。データべース14には、同様にして作成された他の人物の辞書データB, C,・・・も蓄積される。
以上のようにして各人物の辞書データA, B, C,・・・をデータベース14に蓄積した後、不特定の人物の顔を撮影し、これにより得られた1枚の顔画像を画像認識処理部2に入力する。正規化処理部21は、辞書データ登録時と同様に、入力画像を位置、領域、大きさ、輝度などに関して正規化して正規化画像〈x〉を出力する。この正規化画像〈x〉は相関値計算部23に入力される。
相関値計算部23は、正規化処理部21から入力された正規化画像〈x〉とデータベース14に蓄積されている辞書データA,B,C,・・・内の登録画像を比較し、照合または識別処理を行うための相関値Cを計算する。
照合処理の場合、照合を行ないたい人物の識別情報IDを指定し、正規化処理部21から入力された正規化画像〈x〉とデータベース14に蓄積されている識別情報IDの人物の辞書データ内の登録画像の相関値Cを求め、その値をしきい値判定部24に出力する。しきい値判定部24は、入力された相関値Cがしきい値T以上であれば入力画像の人物が当該人物である(OK)と判定し、しきい値T未満であれば当該人物でない(NG)と判定する。
識別処理の場合には、正規化処理部21から入力された正規化画像〈x〉とデータベース14に蓄積されている各人物の辞書データA,B,C,・・・内の登録画像の相関値Cを求め、最大の相関値を示す人物の識別情報IDとその相関値Cを識別結果として出力する。
下記特許文献1には、入力顔画像をその特徴点がデータベース部の基準顔画像の特徴点と一致するように変形させた後、両画像間の相関を求めることにより、顔の表情や向きが変化したとしても高精度の個人認識を可能にした画像認識装置が記載されている。
特開平11−161791号公報
しかしながら、従来の画像認識装置では、元来高い相関を持つような種類の画像を認識の対象とする場合、認識分離するためのしきい値の設定が微妙となり、十分な信頼性で認識分離されるようにしきい値を設定することが困難であるという課題がある。
例えば、顔画像を認識の対象とする場合、顔画像は異なる人物間であっても元来0.9〜0.95程度の比較的高い相関値を示す。したがって、顔画像の相関値のうちのほぼ大半が人物の違いに依存しない共通成分に起因する値で占められており、個人の特徴は残りのわずか0.05〜0.1程度と非常に小さい範囲に含まれていることがわかる。
そのため、顔画像を対象として認識を行う場合、人物間の分離度は低く、識別の合否を判定するための最適なしきい値を設定することは容易ではない。また、個人の特徴よりも照明や表情の変化などが相関値に与える影響の方が相対的に大きくなる場合があり、誤判定を起こしやすいという課題がある。
本発明の目的は、上記課題を解決し、顔画像のように元来高い相関を持つような種類の画像を認識対象とする場合であっても、誤判定を起こすことなく、高い信頼性で画像認識することができる画像認識装置を提供することにある。
上記課題を解決するために、本発明は、予め多数の画像を含んだ基準画像集合から、共通する成分を抽出して低次元の基準画像集合の部分空間を作成する部分空間作成処理部と、対象物認識用辞書データの登録の際に撮影された画像を前記基準画像集合の部分空間に投射し、該画像と該画像が部分空間に投射された成分とのベクトル差である補空間上のベクトルを求めて対象物認識用辞書データを作成し登録する辞書データ作成処理部と、撮影された対象物画像を前記基準画像集合の部分空間に投射し該対象物画像と該対象物画像が部分空間に投射された成分とのベクトル差である補空間上のベクトルを求めて、前記辞書データ作成処理部により登録された対象物認識用辞書データとの相関値を求めることにより対象物を認識する画像認識処理部とを備えたことを特徴としている。
ここで、前記部分空間作成処理部を、照明条件を様々に変えて撮影された画像を含む基準画像集合から低次元の基準画像集合の部分空間を作成するものとすることができる。また、認識処理の対象を人物の顔画像とすることができる。
本発明では、対象物の特徴を多く含む成分である補空間上のベクトルの相関値を求め、該相関値により対象物を認識するので、元来高い相関を持つような種類の画像を認識対象とする場合であっても対象物間の認識分離度を高くすることができ、認識精度を向上させることができる。すなわち画像を用いて人物の認証や検索および物体の照合や識別などを行う画像認識装置において、認識の信頼性を高めることができる。特に人物の顔画像は、異なる人物間であっても元来高い相関値を持つので本発明を適用して有効である。
また、照明条件を様々に変えて撮影された画像を基準画像集合に含ませることにより、照明などの撮影条件の変化に耐性のある画像認識を可能にすることができる。
以下、図面を参照して本発明を詳細に説明する。図1は、本発明に係る画像認識装置の一実施形態を示すブロック図であり、図3と同一あるいは同等部分には同じ符号を付してある。以下では、人物の顔画像を認識の対象とした場合を例として説明するが、本発明における認識の対象は、人物の顔画像に限定されず、その他の任意の画像とすることができる。
図1の画像認識装置は、機能からすると、予め多数の顔画像からそれらに共通する成分を抽出する基準顔画像集合の部分空間作成処理部3と、予め辞書データを作成して登録する辞書データ作成処理部1、と入力画像から人物を照合および識別する画像認識処理部2に大別される。
基準顔画像集合の部分空間作成処理部3は、予め多数の人物の顔画像集合に共通する成分、すなわち固有ベクトル〈e1〉,〈e2〉,・・・を抽出して低次元の部分空間を作成する。
そのために、まず、撮影された多数の人物の顔画像〈yi〉を正規化処理部31に入力する。正規化処理部31は、入力された顔画像〈yi〉の位置、領域、大きさ、輝度レベルなどを正規化した正規化画像を出力する。これらを基準画像集合と定義する。
次に、基準画像集合を自己相関行列作成部32に入力して、基準画像集合の自己相関行列[R]を求める。ここでは行列を[ ]付き文字で表すこととする。
自己相関行列[R]は、次式で定義できる。なお、式中の「T」は転置操作を意味する。
Figure 0004582702
次に、自己相関行列[R]を固有ベクトル算出部33に入力する。固有ベクトル算出部33は、入力された自己相関行列[R]から基準画像集合の部分空間を張る固有ベクトル〈e1〉,〈e2〉,・・・を算出して低次元の部分空間を作成する。
ここで、図2に示すように、基準画像集合の部分空間と正規化された顔画像〈x〉をその部分空間に投射した場合の補空間上のベクトル〈Δx〉を考える。
この場合、正規化された顔画像〈x〉を基準画像集合の部分空間に投射することにより得られるベクトルは、正規化された顔画像〈x〉の中の基準画像集合内の全ての人物の顔画像に共通する成分に相当するので、正規化された顔画像〈x〉から該ベクトルを差し引けば、この部分空間上に投射された基準画像集合内の全ての人物の顔画像に共通する成分を取り除くことができる。
すなわち、正規化された顔画像〈x〉から全ての人物の顔画像に共通する成分(部分空間上に投射されたベクトル)を取いた結果、その残差は基準顔画像集合の部分空間の補空間上に含まれる。そして、その残差である補空間上のベクトル〈Δx〉は個人の特徴を多く含む成分となるので、補空間上のベクトル〈Δx〉を相関値算出の対象とすることによって、顔画像が元来高い相関を持つにも拘わらず、人物間を良好に認識分離することができる。
照明条件を様々に変えて撮影した顔画像を基準画像集合に含めた場合、照明変動を吸収できる部分空間を作成することができる。すなわち、補空間上のベクトル〈Δx〉は、常にその部分空間と垂直なベクトルとして算出されるため、照明変動の成分を含まないベクトルとなる。したがって、補空間上のベクトル〈Δx〉を用いることによって、照明などの撮影条件の変化に耐性のある顔画像認識が可能となる。
辞書データ作成処理部1は、データベース14へ登録するための辞書データを作成する。辞書データの作成に際しては、まず、識別情報IDを持った1名の人物を撮影し、該人物の顔画像を入力する。正規化処理部11は、入力された顔画像の位置、領域、大きさ、輝度レベルなどを正規化した正規化画像〈xID〉を出力する。
補空間への投射部12は、入力された正規化画像〈xID〉を基準画像集合の部分空間作成処理部3で作成された部分空間に投射して、その補空間上のベクトル〈ΔxID〉を求める。補空間上のベクトル〈ΔxID〉は辞書データ作成部13の入力となる。
具体的には、補空間上のベクトル〈ΔxID〉は、基準画像集合の部分空間作成処理部2の固有ベクトル算出部23で求められた固有ベクトル〈e1〉,〈e2〉,・・・を用いて次式によって求めることができる。
〈ΔxID〉=(〈ΔxID〉,〈e1〉)〈e1〉+(〈ΔxID 〉,〈e2〉)〈e2〉+(〈ΔxID 〉,〈e3〉)〈e3〉+・・・+(〈ΔxID i−1〉,〈ei〉)〈ei〉+・・・
〈ΔxID 〉=(〈ΔxID〉,〈e1〉)〈e1〉
〈ΔxID 〉=(〈ΔxID 〉,〈e2〉)〈e2〉
・・・
〈ΔxID 〉=(〈ΔxID i−1〉,〈ei〉)〈ei〉
・・・
辞書データ作成部13は、入力された補空間上のベクトル〈ΔxID〉に該人物の識別情報IDを添えた辞書データAを作成する。辞書データ作成部13で作成された辞書データAは、データベース14に蓄積される。データベース14には、同様にして作成された他の人物の辞書データB, C,・・・も蓄積される。
以上のようにして各人物の辞書データA, B, C,・・・をデータベース14に蓄積した後、不特定の人物の顔を撮影し、これにより得られた1枚の顔画像を画像認識処理部2に入力する。正規化処理部21は、辞書データ登録時と同様に、入力画像を位置、領域、大きさ、輝度などに関して正規化して正規化画像〈x〉を出力する。この正規化画像〈x〉は、補空間への投射部22に入力される。
補空間への投射部22は、辞書データ作成処理部1と同様に、入力された正規化画像〈xID〉を基準画像集合の部分空間作成処理部3で作成された部分空間に投射して、その補空間上のベクトル〈ΔxID〉を求める。この補空間上のベクトル〈ΔxID〉は相関値計算23に入力される。
相関値計算部23は、補空間への投射部22から入力された補空間上のベクトル〈ΔxID〉とデータベース14に蓄積されている辞書データA,B,C,・・・内の登録ベクトルを比較し、照合または識別処理を行うための相関値Cを計算する。
照合処理の場合、照合を行ないたい人物の識別情報IDを指定し、補空間への投射部22から入力された補空間上のベクトル〈ΔxID〉とデータベース14に蓄積されている識別情報IDの人物の辞書データ内の登録ベクトルの相関値Cを求め、その値Cをしきい値判定部24に出力する。しきい値判定部24は、入力された相関値Cがしきい値T以上であれば入力画像の人物が当該人物である(OK)と判定し、しきい値T未満であれば当該人物でない(NG)と判定する。
識別処理の場合には、補空間への投射部22から入力された補空間上のベクトル〈ΔxID〉とデータベース14に蓄積されている各人物の辞書データA,B,C,・・・内の登録ベクトルの相関値Cを求め、最大の相関値を示す人物の識別情報IDとその相関値Cを識別結果として出力する。
本発明は、画像を基準画像集合部分空間に投射し、その補空間上のベクトルを利用し、しかもその相関値を求めて画像認識するので、携帯電話や組み込み機器などでCPU処理能力やメモリ容量は限られている場合でも問題のない画像認識を実現することができるとともに、画像認識の精度を高めることができる。
本発明を携帯電話のカメラで撮影された顔画像を利用した所有者認証に適用すれば、バイオメトリック認証という高度な所有者認証を高い信頼性で行うことができ、携帯電話紛失時の悪用を防ぐことができる。
また、本発明は、1人の人物の表情を精度よく分析する表情分析などにも適用できる。これは、1人の人物の多様な顔画像を基準画像集合とし、上記と同様に補間空間上のベクトルを利用して、笑い顔、泣き顔、怒り顔などについての辞書データの作成および画像認識を行うことで実現できる。
本発明に係る画像認識装置の一実施形態を示すブロック図である。 基準画像集合の部分空間とその補空間上のベクトルの説明図である。 従来の画像認識装置を示すブロック図である。
符号の説明
1・・・辞書データ作成処理部、2・・・画像認識処理部、3・・・基準画像集合の部分空間作成処理部、11,21,31・・・正規化処理部、12,22・・・補空間への投射部、13・・・辞書データ作成部、14・・・データベース、23・・・相関値計算部、24・・・しきい値判定部、32・・・自己相関行列作成部、33・・・固有ベクトル算出部

Claims (3)

  1. 予め多数の画像を含んだ基準画像集合から共通する成分を抽出して低次元の基準画像集合の部分空間を作成する部分空間作成処理部と、
    対象物認識用辞書データの登録の際に撮影された画像を前記基準画像集合の部分空間に投射し、該画像と該画像が部分空間に投射された成分とのベクトル差である補空間上のベクトルを求めて対象物認識用辞書データを作成し登録する辞書データ作成処理部と、
    撮影された対象物画像を前記基準画像集合の部分空間に投射し該対象物画像と該対象物画像が部分空間に投射された成分とのベクトル差である補空間上のベクトルを求めて、前記辞書データ作成処理部により登録された対象物認識用辞書データとの相関値を求めることにより対象物を認識する画像認識処理部とを備えたことを特徴とする画像認識装置。
  2. 前記部分空間作成処理部は、照明条件を様々に変えて撮影された画像を含む基準画像集合から低次元の基準画像集合の部分空間を作成することを特徴とする請求項1に記載の画像認識装置。
  3. 認識処理の対象を人物の顔画像とすることを特徴とする請求項1または2に記載の画像認識装置。
JP2004337465A 2004-11-22 2004-11-22 画像認識装置 Expired - Fee Related JP4582702B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004337465A JP4582702B2 (ja) 2004-11-22 2004-11-22 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004337465A JP4582702B2 (ja) 2004-11-22 2004-11-22 画像認識装置

Publications (2)

Publication Number Publication Date
JP2006146673A JP2006146673A (ja) 2006-06-08
JP4582702B2 true JP4582702B2 (ja) 2010-11-17

Family

ID=36626267

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004337465A Expired - Fee Related JP4582702B2 (ja) 2004-11-22 2004-11-22 画像認識装置

Country Status (1)

Country Link
JP (1) JP4582702B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104392356A (zh) * 2014-11-28 2015-03-04 苏州福丰科技有限公司 基于三维人脸识别的移动支付系统及方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5468859B2 (ja) * 2009-09-30 2014-04-09 パナソニック株式会社 インターホンシステム
JP6747112B2 (ja) * 2016-07-08 2020-08-26 株式会社リコー 情報処理システム、画像処理装置、情報処理装置、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520442A (ja) * 1991-07-17 1993-01-29 Nippon Telegr & Teleph Corp <Ntt> 顔画像照合装置
JP2003317099A (ja) * 2002-02-25 2003-11-07 Toshiba Corp パターン認識用辞書生成装置及び方法、パターン認識装置及び方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520442A (ja) * 1991-07-17 1993-01-29 Nippon Telegr & Teleph Corp <Ntt> 顔画像照合装置
JP2003317099A (ja) * 2002-02-25 2003-11-07 Toshiba Corp パターン認識用辞書生成装置及び方法、パターン認識装置及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104392356A (zh) * 2014-11-28 2015-03-04 苏州福丰科技有限公司 基于三维人脸识别的移动支付系统及方法

Also Published As

Publication number Publication date
JP2006146673A (ja) 2006-06-08

Similar Documents

Publication Publication Date Title
JP6268960B2 (ja) 画像認識装置及び画像認識装置に対するデータ登録方法
KR101506105B1 (ko) 화상 대조 장치, 화상 처리 시스템, 화상 대조 프로그램이 기록된 기록 매체, 및 화상 대조 방법
TWI727329B (zh) 用於基於深度學習方法提供對資源之選擇性存取之防欺騙系統及方法
JP4351982B2 (ja) 個人認証方法、装置及びプログラム
JP2007257221A (ja) 顔認識システム
JP2016006679A (ja) 顔認識方法、装置、および該方法を実行するためのコンピュータ可読記録媒体
WO2017170384A1 (ja) 生体データ処理装置、生体データ処理システム、生体データ処理方法、生体データ処理プログラム、生体データ処理プログラムを記憶する記憶媒体
JP7151875B2 (ja) 画像処理装置、画像処理方法、およびプログラム
Gomez-Barrero et al. Face verification put to test: A hill-climbing attack based on the uphill-simplex algorithm
JP2006085268A (ja) 生体認証システムおよび生体認証方法
WO2020065851A1 (ja) 虹彩認証装置、虹彩認証方法および記憶媒体
KR100847142B1 (ko) 얼굴 인식을 위한 전처리 방법, 이를 이용한 얼굴 인식방법 및 장치
CN113642639B (zh) 活体检测方法、装置、设备和存储介质
WO2022130616A1 (ja) 認証方法、情報処理装置、及び認証プログラム
Dhruva et al. Novel algorithm for image processing based hand gesture recognition and its application in security
JP2006085289A (ja) 顔認証システムおよび顔認証方法
JP4582702B2 (ja) 画像認識装置
KR100564766B1 (ko) 다중 생체 정보를 이용한 개인 등록 및 인증 시스템과 그방법
Kauba et al. Identifying the origin of iris images based on fusion of local image descriptors and PRNU based techniques
JP4446383B2 (ja) 画像処理装置および画像認識装置
JP4577771B2 (ja) 顔画像認識装置
JP2005196516A (ja) 顔認識によるセキュリティ方法
TW201020938A (en) System and method for identifying irises
EP4167179A1 (en) Authentication method, authentication program, and information processing device
JP4429873B2 (ja) 顔画像認証装置及び顔画像認証方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100602

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100827

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130910

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees