JP2012164093A - 顔画像認証装置 - Google Patents

顔画像認証装置 Download PDF

Info

Publication number
JP2012164093A
JP2012164093A JP2011023310A JP2011023310A JP2012164093A JP 2012164093 A JP2012164093 A JP 2012164093A JP 2011023310 A JP2011023310 A JP 2011023310A JP 2011023310 A JP2011023310 A JP 2011023310A JP 2012164093 A JP2012164093 A JP 2012164093A
Authority
JP
Japan
Prior art keywords
user
unit
face image
output
authentication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011023310A
Other languages
English (en)
Other versions
JP5606948B2 (ja
Inventor
Naoyuki Takada
直幸 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Secom Co Ltd
Original Assignee
Secom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Secom Co Ltd filed Critical Secom Co Ltd
Priority to JP2011023310A priority Critical patent/JP5606948B2/ja
Publication of JP2012164093A publication Critical patent/JP2012164093A/ja
Application granted granted Critical
Publication of JP5606948B2 publication Critical patent/JP5606948B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】複数の利用者が連続して認証される場合であっても、全員分について認証結果を含む出力用音声情報を出力する顔画像認証装置を提供する。
【解決手段】本発明にかかる顔画像認証装置は、撮像部により取得された入力画像から利用者の入力顔画像を抽出する顔検出部と、1人分の出力用音声情報を入力顔画像の数だけ出力するのに要する総出力時間と本装置の利用者が通行終了までに要する通行時間を算出する時間長算出部と、総出力時間が通行時間を上回る場合には短縮した出力用音声情報生成する音声合成部と、出力用音声情報を利用者に出力する通知部とを有する。

【選択図】図1

Description

本発明は、認証結果を利用者に音声にて出力する機能を有する顔画像認証装置に関する。
従来より、企業の居室の入口などに設置され、通行する利用者(社員等)の顔を撮影して取得された顔画像を登録された顔画像と照合することにより、当該居室に入室可能な人物であるか否かを認証する顔画像認証装置が提案されている。近年では、機器の処理速度の向上に伴い、居室入口の扉の前で一旦立ち止まって暗証番号を入力するタイプの他に、歩行中の利用者の顔を撮影して認証処理を短時間に終了させ、利用者が扉に接近する前に認証結果を確定させる歩行型の顔画像認証装置が提案されている。このような歩行型の顔画像認証装置においては、利用者に対して認証結果を音声出力することで、装置の使用感を高めることが行われる。しかし、出勤時など、複数の利用者が同時に居室入口に接近すると、認証処理および音声出力に要する時間が、利用者が入室に要する時間を超えることがある。
特許文献1では、歩行中の人物を対象とした人物認識装置について、撮影された画像中の人数を計数し、人数が多い場合には、過去の利用履歴などを参照した認証処理の優先度に応じて、機器の処理能力を割り当てる技術が開示されている。
特開2007−156541号公報
特許文献1に記載された人物認証装置では、優先度が高く設定された利用者について優先的に機器の処理能力を割り当てるため、利用者が入室しようとするまでに認識し終わらないという事態を避けることができる。
しかし、利用者への音声出力は、認識された利用者の人数分だけ要するため、利用者が入室しようとするまでに認識処理が終了していても、全員分の音声出力が終了しないことがあり、装置の使用感が向上しないことがあった。
そこで、本発明の目的は、入室を試みる利用者の全員に対して、認証結果を含む音声出力を行い、使用感の確保が可能な顔画像認証装置を提供することにある。
本発明は、利用者を含む入力画像を取得する撮像部と、入力画像から利用者の入力顔画像を検出する顔検出部と、予め、登録顔画像、利用者に出力する音声情報、該音声情報をひとりの利用者に出力するのに標準的な標準出力時間を記憶する記憶部と、入力顔画像を用いて利用者と登録顔画像の人物が一致するか否かを認証する認証部と、登録顔画像の人物に一致した認証者を計数する計数部と、標準出力時間と認証者の数から総出力時間を算出し、該総出力時間が所定の時間長閾値を越えるか否かを判定する判定部と、音声情報から認証者への出力用音声情報を生成する音声合成部と、出力用音声情報を用いて利用者に音声出力する出力部と、を有し、音声合成部は、出力用音声情報として、総出力時間が時間長閾値以下と判定されると標準音声情報を生成し、総出力時間が時間長閾値を越えると判定されると、時間長が標準音声情報より短い短縮音声情報を生成することを特徴とした顔画像認証装置を提供する。
かかる顔画像認証装置において、記憶部は、音声情報として、認証定型句と登録顔画像の個人呼称句を記憶し、音声合成部は、標準音声情報を、一つの認証定型句とひとりの認証者の個人呼称句から生成し、短縮音声情報を、一つの認証定型句と複数人の認証者の個人呼称句から生成することが好ましい。
かかる顔画像認証装置において、顔画像認証装置は、さらに、順次取得される複数の入力画像において対応する入力顔画像を追跡する追跡部と、撮像部の設置条件を用いて、利用者が存在する床面上における該利用者と撮像部との距離を検出する距離検出部と、追跡された利用者について、距離の時間変化から該利用者の歩行速度を検出する速度検出部とを有し、判定部は、距離と歩行速度から算出される通行時間を時間長閾値に用いることが好ましい。
本発明によれば、入室を試みる利用者の全員に対して、認証結果を含む音声出力を行えるため、使用感の確保が可能となる。
本発明にかかる顔画像認証装置の概略構成図である。 利用者それぞれに対して標準音声情報が出力される場合の、運用場所の模式図である。 利用者をひとまとめにして、短縮音声情報が出力される場合の、運用場所の模式図である。 記憶部110に記憶される登録者情報をテーブル形式で示した模式図である。 音声情報に含まれる定型的な語句を例示した図である。 利用者との距離を計算する方法を説明する模式図である。 本発明にかかる顔画像認証装置の動作フロー図である。 短縮音声情報を生成するにあたって、個人呼称句123を並べる順番の方法を説明する模式図である。 計数部240における、計数方法について、他の実施形態を説明する入力画像の模式図である。
以下、図を参照しつつ、本発明にかかる顔画像認証装置の一つの実施の形態を、図を参照しつつ説明する。
当該顔画像認証装置は、企業の居室などの入口付近に設置されたカメラから入力された画像に写った人物(社員等の利用者)について、その顔画像を抽出して認証処理を行い、人物の数や歩行速度に応じて、通行終了前にその全員分について出力できるよう認証結果を含む音声情報(音声ガイダンス)を可変とするものである。これにより、利用者の使用感を確保することが可能となる。
図1は、本発明にかかる顔画像認証装置10の概略構成図である。
顔画像認証装置10は、撮像部20、通知部30、インターフェース部100、記憶部110、処理部200から構成されている。
撮像部20は、顔画像認証装置10が運用される環境に応じて、利用者の顔を撮影できるように設置される。その例として、図2には、扉2を開けて入室を試みる利用者1a〜1cの顔を撮影するよう撮像部20が、扉2の上方である天井付近に取り付けられている様子が示されている。
撮像部20は、予め定められた撮影条件に応じて適切な焦点距離を持つレンズを有し、CCDまたはC−MOSといった固体撮像素子の2次元アレイ上に利用者の顔の像を結像するカメラを含む。
そして、撮像部20は、利用者が写った画像を入力画像として生成して、インターフェース部100に出力する。
尚、撮像部20は、カラーの多階調画像を作成するものであっても良く、あるいは、近赤外に感度を有し、グレー画像を作成するカメラであっても良い。また、撮像部20が有する固体撮像素子の2次元アレイは、利用者の顔の各部位について、その特徴を十分に入力画像に含み得る画素数を有することが好ましい。
通知部30は、後述する音声合成部280にて生成された出力用音声情報を、インターフェース部100から受け取り、顔画像認証装置10の利用者に出力するための手段であり、いわゆるスピーカーである。利用者に聞こえるような位置に、適当な音量で出力されるように調整されているものとする。図2の模式図では、扉2の上方に、撮像部20と並べて利用者の方向に向けて設置された様子が示されている。
インターフェース部100は、撮像部20と通知部30と接続されるインターフェース回路であり、例えばビデオインターフェース、オーディオインターフェースなどのインターフェース回路を有する。
インターフェース部100は、撮像部20から受け取った入力画像を処理部200に渡し、処理部200から受け取った出力用音声情報を通知部30に渡す。
記憶部110は、半導体メモリ、磁気記録媒体およびそのアクセス装置および光記録媒体およびそのアクセス装置の少なくとも一つを有する。そして、記憶部110は、顔画像認証装置10を制御するためのコンピュータープログラム、各種パラメータおよびデータを記憶する。
また、記憶部110は、予め、図2でいう扉2を開けて入室が許可された利用者である登録者について、その登録者ごとに登録者情報120として、識別情報、登録顔画像または登録顔画像から抽出され認証処理に用いる顔画像に関する特徴量、個人呼称句、人物属性とを記憶する。
さらに、記憶部110は、処理部200の結果に応じて、通知部30から利用者に出力される出力用音声情報を生成するための音声情報130を記憶する。
音声情報130には認証定型句131、非認証定型句132、敬称句133と、標準出力時間140が含まれる。
記憶部110に記憶されている各情報について、図4と図5を用いて説明する。
図4には登録者情報が、符号120に示すテーブル形式にて模式的に示されている。登録者1人分の登録者情報は、識別子121、登録顔画像122、個人呼称句123、人物属性124から構成されている。
識別子121は、登録者1人について1つ割り当てられる数字または記号であり、顔画像認証装置10が企業の居室入口にて運用されるならば、例えば社員番号が用いられる。あるいは連続する正の整数であってもよい。
登録顔画像122は、後述する処理部200の認証部230にて、認証処理に用いられる各登録者の顔の特徴を含む画像である。図4では理解の容易のため顔画像として描画したが、記憶部110への記憶の際、即ち顔画像の登録の際に、認証処理に直接用いる特徴量として記憶することも可能である。
個人呼称句123は、各登録者の名称である。図4における例では、識別子121が“1”の人物の名称は“A”であり、識別子121が“2”の人物の名称は“B”であることを示している。
個人呼称句123は、個人の本名である氏名でもよいし、通称名でもよい。また名字のみでもよい。ありふれた名字のため、同じ名字の人物が複数登録される場合に限って氏名を登録してもよい。
なお、個人呼称句123を単独で出力用音声情報として、通知部30から出力するとした場合、それに必要な時間長をtmとする。当該時間長tmは、個人呼称句123を通知部30から出力するために必要な長さを確保した、全ての登録者に共通の値とするが、各登録者の名称の長さに応じて異なる値としてもよい。
人物属性124は、各登録者の属性を表す情報である。図4における例では、企業における役職を示しており、識別子121が“1”の人物の属性は“役員”であり、識別子121が“2”の人物の属性は“部長”であり、識別子121が“3”の人物の属性は“担当”であり、識別子121が“4”の人物の属性は、事前に来訪するとの連絡をしてきた人物であることを示している。この人物属性124は、後述する音声合成部280にて、利用者に通知する音声において、呼びかけの敬称に用いることができる。敬称についても後述する。
図5は、認証部230の処理結果に応じて、音声合成部280が、利用者に出力する音声情報の生成に用いる認証定型句131、非認証定型句132、敬称句133(図1では不図示)を示している。それぞれ図5に例示される文言を含み、記憶部110に記憶するためには、文字列として記憶してもよいし、音声合成部280にて直接利用できる音声データを記憶してもよい。音声データを記憶する場合には、音声合成部280における処理の複雑さは軽減されるものの、必要な記憶容量が増えるので、適宜記憶するデータ量を考慮して決めればよい。
認証定型句131は、撮像部20にて取得された入力画像に写った利用者が、登録者情報120のいずれかの人物に一致した場合に、音声合成部280にて用いられ、当該利用者に出力される語句である。例えば、認証部230における照合処理が午前中に行われた場合には「おはようございます」との語句を用い、日中のいわゆるオフィスアワーに行われた場合には「お疲れさまです」との語句を用い、夕方に行われた場合には「お疲れさまでした」との語句を用いるのが好適である。あるいは図4における識別子121が“4”の人物のように、来訪者の場合には「いらっしゃいませ」との語句を用いるのが好適である。
認証定型句131を単独で出力用音声情報として、通知部30から出力するとした場合、それに必要な時間長をtgとする。当該時間長tgは、認証定型句131を通知部30から出力するために必要な長さを確保した、全ての認証定型句131に共通の値とするが、認証定型句131の長さに応じて異なる値としてもよい。
非認証定型句132は、撮像部20にて取得された入力画像に写った利用者が、登録者情報120のいずれの人物にも一致しない場合に、音声合成部280にて用いられ、当該利用者に出力される語句である。この場合、例えば、入力画像に写った利用者が社外の人物である場合には、当該利用者に失礼のないよう「ご来館ありがとうございます」との語句や「ご用の方は内線電話にて呼び出してください」との語句を用いるのが好適である。
あるいは、顔画像認証装置10が設置された場所が、企業内部の人間の利用が圧倒的であることが仮定でき、別途IDカードによる認証装置が備わっている場合には「カード操作をしてください」との語句を用いるのが好適である。
非認証定型句132を単独で出力用音声情報として、通知部30から出力するとした場合、それに必要な時間長をtnとする。当該時間長tnは、非認証定型句132を通知部30から出力するために必要な長さを確保した全ての非認証定型句132に共通の値とするが、非認証定型句132の長さに応じて異なる値としてもよい。
敬称句133は、撮像部20にて取得された入力画像に写った利用者の属性に応じて、当該利用者に出力する出力用音声情報に付加する敬称を表す語句である。当該利用者が、登録者情報120のいずれかの人物に一致した場合には、人物属性124を参照して、それに応じた敬称句133が選択される。例えば、図4における識別子121が“1”の人物の属性は“役員”であるので、敬称句133としては「役員」を用い、識別子121が“4”の人物は来訪者であるので「様」を用いるのが好適である。
あるいは、人物属性124を参照せず、全ての利用者について共通の敬称句を用いる場合には、一般的な「さん」を用いるのが好適である。
敬称句133を単独で出力用音声情報として、通知部30から出力するとした場合、それに必要な時間長をtrとする。図5では、各語句について共通の値としたが、音数に応じて異なる値としてもよい。
標準出力時間ts140は、認証者ひとりに対して出力用音声情報を出力した場合の音声長に相当する時間である。本実施の形態では、前述の認証定型句131、個人呼称句123、敬称句133を連続させた出力用音声情報である標準音声情報を通知部30から当該利用者に出力するのに要する時間に相当し、予め記憶されている。
また、本実施の形態では、標準出力時間140を、予め定めた時間としたが、予め各登録者ごとにtg、tm、trを記憶させておき、認証された際に全ての認証者にかかるtg、tm、trを用いて、それぞれについての平均値を求め、その和を標準出力時間140としてもよい。
例えば認証定型句131を「おはようございます」、個人呼称句123を「A」、敬称句133を「役員」とすると、標準音声情報は「おはようございます、A役員」となり、標準出力時間ts140は、図5に示すようにts=tg+tm+trから求めることができる。
図5に示す認証定型句131、非認証定型句132、敬称句133は、それぞれ例示であり、顔画像人称装置10の運用場所や運用方針、あるいは利用者の嗜好に応じて語句を増減してもよい。
図1に戻り、処理部200は、1個または複数個のプロセッサおよびその周辺回路を有し、利用者に対する認証処理を実行する。そのために処理部200は、そのプロセッサ上で動作するソフトウェアにより実装される機能モジュールとして、顔検出部210、追跡部220、速度検出部260、距離検出部250、認証部230、計数部240、判定部270、音声合成部280とを有する。これらの各部は、独立した集積回路、ファームウェア、マイクロプロセッサなどで構成されてもよい。
以下、処理部200の各部について詳細に説明する。
顔検出部210は、撮像部20にて取得された入力画像から、当該入力画像に写っている利用者の顔を検出し、切り出して入力顔画像を取得する。同時に、入力顔画像の、入力画像中における検出位置、即ち入力画像について水平方向にX軸、垂直方向にY軸を定義した場合のX座標とY座標を取得する。
入力画像中に複数の利用者が写っている場合には、それぞれの利用者毎に入力顔画像と上記座標情報を取得する。
顔検出部210は、取得した入力顔画像を追跡部220と認証部230に出力し、座標情報を記憶部110、追跡部220と、距離検出部250、音声合成部280に出力する。
顔検出部210における、顔の検出と入力顔画像の取得は適宜公知の方法を用いればよい。例えば、撮像部20の設置条件から定まる人間の顔の大きさに応じた楕円形状を入力画像中から検出する方法や、識別器と呼ばれるフィルタにて顔を直接検出する方法を採用すればよい。
追跡部220は、記憶部110に一時記憶された入力顔画像の座標情報を参照し、同一利用者の顔画像を入力画像上にて追跡する。そのために、追跡部220は、入力画像において、過去時点における入力顔画像の座標情報と現在時点おける入力顔画像の座標情報とを比較し、一定の範囲内であれば対応付けることとする。さらには、認証部230の照合結果を参照するのが好適である。オプティカルフローなど、他の方法を用いてもよい。
認証部230は、記憶部110に記憶されている登録顔画像122のそれぞれと、顔検出部210にて検出された入力顔画像との類似の程度を調べ、その最大値が所定の照合閾値を越えている場合には、入力顔画像の人物は類似度が最大値を示した登録顔画像122の人物に一致すると判断する。
類似の程度を求める方法は、適宜公知の方法を用いればよい。例えば顔の特徴的な部位を表す特徴点を公知の方法で抽出し、その特徴点の位置関係のずれの程度を用いたり、特徴点付近の局所領域の輝度や色の相違度を用いることができる。
認証部230は、認証の結果を計数部240と音声合成部280に出力する。
計数部240は、認証部230の結果を参照し、入力顔画像に写った人物が登録者情報120のいずれかの人物に一致した場合、即ち、認証者(登録者)と確認された人数Nfを計数する。その結果は判定部270に出力される。
なお、処理部200は、撮像部20にて取得された入力画像を一定の枚数(例えば10枚)を記憶部110に一時記憶させるものとし、計数部240は、顔検出部210にて検出された入力顔画像について、同一人物ごとに認証者を計数してNfを求めてもよい。
これを図9に示す模式図を用いて説明する。図9には、3枚の入力画像を例示している。
時刻tでは人物Aのみが、時刻t+1では人物Aとさらに人物Bが、時刻t+2では人物Bとさらに人物Cが写っている。
そこで、計数部240は、時刻tの入力画像のみを用いて計数するのではなく、認証部230により人物A、人物B、人物Cが認証者と判断されたとして、時刻tから時刻t+2までに取得された入力画像に写った人物A、人物B、人物Cの3人を計数結果としてもよい。
距離検出部250は、入力画像に写った利用者について、撮像部20との水平方向の距離Lを算出する。
そのためには、撮像部20の設置条件を既知として、図6に示すような方法に基づけばよい。
即ち、撮像部20の設置高をhc[mm]、利用者1の平均的な顔の高さをht[mm]、入力画像の水平方向の総画素数をpa[pixel]、入力画像中の顔の幅の画素数をpw[pixel]、利用者1の平均的な顔の幅をwf[mm]、撮像部20の撮像素子の横幅をwc[mm]、焦点距離をfc[mm]、撮像部20と利用者1との直線距離をd[mm]、利用者1の仰角をθ[rad]とすると、d=(hc×wf×fc)/(pa×wc)(式1)、θ=arcsin((hc−ht)/d)(式2)、L=d×cosθ(式3)にて求めることができる。
上記計算式で求まった距離Lは、概算値ではあるが、本発明における精度としては十分実用に耐えうる。当然、より高精度さを求めるので有れば、レーザー光や超音波による専用の測距手段を用いればよい。
入力画像中に複数の利用者が写っている場合には、距離検出部250は、各利用者について距離Lを求め、求めた距離Lを記憶部110に一時記憶させる。
速度検出部260は、入力画像に写った利用者について、距離検出部250にて求めた撮像部20からの距離Lの時間変化にて、歩行速度を算出する。即ち、前回時刻における利用者の距離Lと現時刻における利用者の距離Lの差を、撮像部20から取得される入力画像の取得時間間隔にて除算すれば求めることができる。
入力画像中に複数の利用者が写っている場合には、各利用者について求める。但し、本発明にかかる顔画像認証装置10が動作するような、企業の居室入口では、複数の利用者が写っていても、各利用者間では歩行速度は概ね同程度であることもわかっているので、いずれか1名の歩行速度で代表させてもよい。あるいは全員の歩行速度の平均値を採用してもよい。
または、距離検出部250の検出結果に依らず、簡易な処理として、入力画像における入力顔画像の座標の時間変化を歩行速度の代用としてもよい。
速度検出部260は、求めた速度vを判定部270に出力する。
判定部270は、計数部240にて計数された認証者数Nf、速度検出部260にて検出された利用者の歩行速度v、認証部230の認証結果、記憶部110に記憶されている認証定型句131の時間長tgなどを用いて、入力画像に写った利用者全員に出力するために必要な出力用音声情報の総出力時間と、それら利用者が歩行に要する通行時間とを算出し、音声合成部280が生成すべき出力用音声情報の種類を決定する。
まず、認証部230が、入力顔画像の利用者が登録顔画像122のいずれかの人物について一致したと判断した場合に、認証者の1人分について音声合成部280が生成する標準音声情報は、1つの認証定型句131、1人分の個人呼称句123、1つの敬称句133から構成される。この標準音声情報を利用者に対して出力するのに必要な時間長が標準出力時間長ts140であり、総出力時間は、ts×Nfにて求めることができる。
また、本実施の形態では、標準出力時間140を、予め定めた時間としたが、前述のtm、tg、trが登録者ごとに異ならせて、標準出力時間140を算出した場合には、認証者のtm、tg、trを総和することで総出力時間を求めることができる。
一方で、認証部230が、入力顔画像の利用者が登録顔画像122のいずれの人物についても一致しない非認証者と判断した場合には、個人呼称句123を特定することができないので、音声合成部280は、記憶部110に記憶されている非認証定型句132を用いて出力用音声情報を作成することになる。当該人数をNngとする。
通行時間は、認証者Nf人について、扉2を通過するのに要する時間である(図2または図3を参照)。よって、並びの最後の人物、図2または図3でいう符号1cの人物が、扉2までのLeの距離を歩き終わるのに要する時間である。よって、通行時間はLe/vで求められる。
(総出力時間≦通行時間)の場合には、入力画像に写っている利用者全員が通行し終わるまでに、その全員分について、前述の標準音声情報をそれぞれ出力することが可能なことを意味している。この様子を図2に示す。
図2には、扉2を開けて入室を試みる利用者が3名おり、離れて歩行している様子が例示されている。同図では、扉2からLsの距離にて歩行中である符号1aに示す利用者について認証し終わり、当該利用者について標準音声情報を出力し、引き続き同様に符号1bに示す利用者について認証し終わり、当該標準音声情報を出力し、さらに符号1cに示す利用者について認証し終わり、当該標準音声情報を出力するという一連の動作が、利用者1cが扉2を通過するまでに可能である。
よって、(総出力時間≦通行時間)の場合には判定部270は、利用者それぞれについて標準音声情報を生成するよう音声合成部280に指示する。
一方、(総出力時間>通行時間)の場合には、入力画像に写っている利用者全員が通行し終わるまでに、その全員分について、前述の標準音声情報を出力しきれないことを意味している。この様子を図3に示す。
図3には、図2と同様に3名が例示されているが、密着するほどではないにしろ、短時間に扉2を次々と通過しようとする様子を示している。この場合、人物1aについては扉2を通過する前に標準音声情報を出力することができても、人物1bについては、扉2を通過する時に出力し、人物1cに至っては扉2を通過した後に出力することになりかねない。
よって、その場合には判定部270は、利用者それぞれについて個人音声合成を生成するのではなく、短縮音声情報を生成するよう音声合成部280に指示する。
音声合成部280は、判定部270の判定結果による指示に従い、利用者に出力する出力用音声情報を生成する。出力用音声情報の種類には、登録者情報120のいずれかに一致すると認証部230にて判定された認証者に対しては、前述のように標準音声情報と短縮音声情報とがある。
標準音声情報は、利用者に出力する出力用音声情報の基本的なものであり、前述のように、利用者1人分について、1つの認証定型句131、1人分の個人呼称句123、1つの敬称句133から構成されている。例えば、図4に示した識別子“1”の人物の場合には「おはようございます、A役員」が標準音声情報となる。同様に、例えば識別子“3”の人物の場合には「お疲れさまです、Cさん」が標準音声情報となる。
但し、認証部230による照合結果として、入力顔画像の人物が、登録顔画像122のいずれの人物とも一致しないと判断された場合には、いずれかの個人呼称句123を特定して用いることができない。よって、その場合には、音声合成部280は、顔画像認証装置10の運用場所や運用方針などに応じて、記憶部110に記憶されている非認証定型句132から、いずれかを選択して出力用音声情報を生成するものとする。
短縮音声情報は、図3に模式的に示すように、複数の利用者が次々と入室を試みる場合に生成されるものであり、1つの認証定型句131、計数部240が計数した認証者数分の個人呼称句123、それぞれの敬称句133から構成されている。例えば、図3に示した場合では、人物1aが図4でいう識別子“1”の人物、人物1bが図4でいう識別子“2”の人物、人物1cが図4でいう識別子“3”の人物であるとすると、「お疲れさまです、A役員、B部長、Cさん」が短縮音声情報となる。
個人呼称句123の順番は、認証部230が認証結果を出力した順番とすることが望ましい。あるいは、距離検出部250が、入力画像に写った認証者ごとに求めた、撮像部20からの距離に応じて、距離が小さい順とすることもできる。
短縮音声情報は、標準音声情報を人数分連続させるよりも短い時間長となっている。上記の例では、「お疲れさまです、A役員。お疲れさまです、B部長。お疲れさまです、Cさん」よりも短い時間で出力することができる。
従って、図3に模式的に示すように、複数の利用者が次々と入室を試みる場合であっても、最後の利用者が扉を通過する前に出力し終わることが可能となる。
次に、図7に示すフロー図を用いて、本発明にかかる顔画像認証装置10の動作を説明する。
まず、処理部200は、撮像部20からインターフェース部100を介して、利用者の顔が写っている入力画像を取得する(ステップS100)。そして処理部200は、取得した入力画像を顔検出部210に渡す。
顔検出部210は、入力画像から利用者の顔の写っている領域を検出し、それを含む入力顔画像を抽出する(ステップS110)。顔検出部210が、入力画像中に利用者の顔が写っている領域の検出に失敗した場合には、図7では明示していないが、利用者が当該入力画像中には存在しないとして、処理をステップS100に戻す。
次に、認証部230は、入力顔画像と登録顔画像122をパターンマッチングなどに方法により直接比較したり、両画像から特徴量を抽出して比較するなどの周知の方法を用いて、認証処理を行い、入力顔画像が記憶部110に記憶されている登録者情報120のいずれかの人物か否かを判定する(ステップS120)。
判定部270は、認証者数や、利用者の位置などの情報を用いて、標準音声情報を人数分順次出力するのに必要な時間である総出力時間を算出する(ステップS180)。算出方法は既に述べた通りである。
上述のステップS180の処理と並行して、ステップS140〜S170の処理が行われる。
追跡部220は、顔検出部210が抽出した入力顔画像について、入力画像中における位置を時系列に把握し、追跡する処理を行う(ステップS140)。
距離検出部250は、入力画像に写っている利用者について、撮像部20の設置条件から、床面上における撮像部20との距離を算出する(ステップS150)。この距離に撮像部20と扉2までの距離を加減算することで、扉2までの距離を求めることができる(図2、図3、図6を参照)。
速度検出部260は、前ステップで距離検出部250が求めた、距離の時間変化から、利用者の歩行速度を求める(ステップS160)。
判定部270は、利用者と扉までの位置と、前ステップで求めた速度から、全利用者が通行し終わるのに要する通行時間を算出する(ステップS170)。
そして判定部270は、ステップS180にて求められた総出力時間と、ステップS170にて求められた通行時間とを比較し(ステップS190)、総出力時間より通行時間が長い場合には、判定部270は音声合成部280に利用者それぞれ向けに標準音声情報を生成するよう指示し、音声合成部280は標準音声情報を生成する(ステップS200)。一方で、総出力時間より通行時間が短い場合には、判定部270は音声合成部280に短縮音声情報を生成するよう指示し、音声合成部280は短縮音声情報を生成する(ステップS210)。
通知部30は、インターフェース部100から、ステップS170またはS180にて生成された音声情報を受け取り、利用者に出力する(S220)。
ステップS220の出力処理が終了すると、処理部200は、次の時点の入力画像を撮像部20から取得して処理すべく、ステップS100に処理を戻す。
音声合成部280における短縮音声情報の生成において、個人呼称句123の順番は、認証部230が認証した順に並べることが好ましい。図3の模式図では、利用者1a、利用者1b、利用者1cの順で扉2からの距離が小さいので、短縮音声情報においては、「A、B、C」の順に並べる。
もしくは、図3の模式図のように、撮像部20が利用者を上方から見下ろすように設置する場合には、入力画像中で、扉2に近い順に入力画像中で下から並ぶことになるので、その並び順を利用してもよい。これを図8の模式図を用いて説明する。
図8には、図3の状態において、撮像部20が取得した利用者1a、1b、1cを映した入力画像300が示されている。図8からわかるように、扉2に最も近い利用者1aが最も下に写っており、扉2から離れるに従って上方に映る。
よって、入力画像300のx−y座標系を符号310のように設定すると、各利用者の入力顔画像330の重心320のy座標を比較すればよい。図8の場合では、人物1aのy座標をya、人物1bのy座標をyb、人物1cのy座標をycとすると、ya>yb>ycとなる。よって、重心320のy座標が大きい順に短縮音声情報では個人呼称句を並べることができる。
なお、入力画像に写った人物の中に、認証部230にて登録顔画像122の人物のいずれとも一致が判断されない非認証者が含まれている場合には、音声合成部280は、当該非認証者のために、非認証定型句131を用いて出力用音声情報を生成して、通知部30はその出力用音声情報を出力する。
以上説明してきたように、本発明にかかる顔画像認証装置は、利用者の人数と通行時間、1人分の出力音声の長さなどを判断して、単純に利用者それぞれに標準音声情報を並べると、利用者が通行し終わる前に出力が終わらないと判断されるときは、短縮した音声を生成して出力することで、本装置の使用感の低下を招かない効果を奏する。
本発明にかかる顔画像認証装置の実施の形態はこれまでに説明してきたものに限られない。図8を用いて説明した入力画像中での顔画像の重心位置を比較する手法の他にも、撮影条件を正確に把握でき、利用者の歩行速度を実験などにより概略既知である場合には、計数部240にて計数された認証者数を直接ステップS190における条件分岐の判断に用いても良い。例えば、認証者が3以上の場合には、音声合成部280は短縮音声情報を生成するものとしても、同様の効果を得ることができる。この場合、距離検出部250、速度検出部260は省略できる。
あるいは、利用者の数や通行時間に依らず、総出力時間を所定の時間長閾値と比較して、上回る場合には音声合成部280は短縮音声情報を生成するものとしてもよい。
または、記憶部110に記憶する登録者情報120に、人物属性124に応じた、音声合成部280における短縮音声情報の並び順を表す情報を付加しておいてもよい。例えば、図4でいう識別子121が“4”の人物については“最優先”、役職が高い識別子121が“1”の人物については“優先”、役職が低い識別子121が“3”の人物については“通常”などと設定して、その順に並べて生成することもできる。
さらには、音声合成部280に、出力音声情報のピッチを変えずに出力速度(再生速度)を変える機能が備わっている場合には、判定部270の判定条件として、聞き取り可能な範囲で出力速度を速めても総出力時間が通行時間を下回らない場合に短縮音声情報を生成するよう音声合成部280に指示してもよい。
20・・・撮像部
30・・・通知部
123・・・個人呼称句
124・・・人物属性
131・・・認証定型句
132・・・非認証定型句
210・・・顔検出部
230・・・認証部
270・・・判定部
280・・・音声合成部

Claims (3)

  1. 利用者を含む入力画像を取得する撮像部と、
    前記入力画像から前記利用者の入力顔画像を検出する顔検出部と、
    予め、登録顔画像、前記利用者に出力する音声情報、該音声情報をひとりの前記利用者に出力するのに標準的な標準出力時間を記憶する記憶部と、
    前記入力顔画像を用いて前記利用者と前記登録顔画像の人物が一致するか否かを認証する認証部と、
    前記登録顔画像の人物に一致した認証者を計数する計数部と、
    前記標準出力時間と前記認証者の数から総出力時間を算出し、該総出力時間が所定の時間長閾値を越えるか否かを判定する判定部と、
    前記音声情報から前記認証者への出力用音声情報を生成する音声合成部と、
    前記出力用音声情報を用いて前記利用者に音声出力する出力部と、
    を有し、
    前記音声合成部は、前記出力用音声情報として、
    前記総出力時間が前記時間長閾値以下と判定されると標準音声情報を生成し、
    前記総出力時間が前記時間長閾値を越えると判定されると、時間長が前記標準音声情報より短い短縮音声情報を生成する
    ことを特徴とした顔画像認証装置。
  2. 前記記憶部は、前記音声情報として、認証定型句と前記登録顔画像の個人呼称句を記憶し、
    前記音声合成部は、
    前記標準音声情報を、一つの前記認証定型句とひとりの認証者の前記個人呼称句から生成し、
    前記短縮音声情報を、一つの前記認証定型句と複数人の認証者の前記個人呼称句から生成する
    ことを特徴とした請求項1に記載の顔画像認証装置。
  3. 前記顔画像認証装置は、さらに、
    順次取得される複数の前記入力画像において対応する前記入力顔画像を追跡する追跡部と、
    前記撮像部の設置条件を用いて、前記利用者が存在する床面上における該利用者と前記撮像部との距離を検出する距離検出部と、
    前記追跡された前記利用者について、前記距離の時間変化から該利用者の歩行速度を検出する速度検出部と
    を有し、
    前記判定部は、
    前記距離と前記歩行速度から算出される通行時間を前記時間長閾値に用いる
    ことを特徴とした請求項1から請求項2のいずれか1つに記載の顔画像認証装置。
JP2011023310A 2011-02-04 2011-02-04 顔画像認証装置 Active JP5606948B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011023310A JP5606948B2 (ja) 2011-02-04 2011-02-04 顔画像認証装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011023310A JP5606948B2 (ja) 2011-02-04 2011-02-04 顔画像認証装置

Publications (2)

Publication Number Publication Date
JP2012164093A true JP2012164093A (ja) 2012-08-30
JP5606948B2 JP5606948B2 (ja) 2014-10-15

Family

ID=46843430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011023310A Active JP5606948B2 (ja) 2011-02-04 2011-02-04 顔画像認証装置

Country Status (1)

Country Link
JP (1) JP5606948B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012212071A (ja) * 2011-03-31 2012-11-01 Secom Co Ltd 顔画像認証装置
JP2016051246A (ja) * 2014-08-29 2016-04-11 マツダ株式会社 車両用歩行者検出装置
JP2016522487A (ja) * 2013-05-10 2016-07-28 イーリス−ゲゼルシャフト ミット ベシュレンクテル ハフツング インフラレッド アンド インテリジェント センサーズ 手の静脈パターンを記録するセンサシステム及び方法
JP2018112402A (ja) * 2018-04-26 2018-07-19 東芝ライフスタイル株式会社 冷蔵庫
WO2022201746A1 (ja) * 2021-03-23 2022-09-29 日本電気株式会社 入退管理システム、入退管理方法、及び記録媒体

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003014485A (ja) * 2001-07-05 2003-01-15 Alpine Electronics Inc ナビゲーション装置
US6724919B1 (en) * 1999-06-25 2004-04-20 Kabushiki Kaisha Toshiba Method of personal verification for computer system, computer system, and recording medium
JP2005248542A (ja) * 2004-03-03 2005-09-15 Toshiba Corp 認証システム及び認証方法
US20060126906A1 (en) * 2001-03-15 2006-06-15 Kabushiki Kaisha Toshiba Entrance management apparatus and entrance management method
JP2007156541A (ja) * 2005-11-30 2007-06-21 Toshiba Corp 人物認識装置、人物認識方法および入退場管理システム
JP2008217714A (ja) * 2007-03-07 2008-09-18 Sogo Keibi Hosho Co Ltd 追跡装置、追跡方法、及び追跡プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6724919B1 (en) * 1999-06-25 2004-04-20 Kabushiki Kaisha Toshiba Method of personal verification for computer system, computer system, and recording medium
US20060126906A1 (en) * 2001-03-15 2006-06-15 Kabushiki Kaisha Toshiba Entrance management apparatus and entrance management method
JP2003014485A (ja) * 2001-07-05 2003-01-15 Alpine Electronics Inc ナビゲーション装置
JP2005248542A (ja) * 2004-03-03 2005-09-15 Toshiba Corp 認証システム及び認証方法
JP2007156541A (ja) * 2005-11-30 2007-06-21 Toshiba Corp 人物認識装置、人物認識方法および入退場管理システム
JP2008217714A (ja) * 2007-03-07 2008-09-18 Sogo Keibi Hosho Co Ltd 追跡装置、追跡方法、及び追跡プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012212071A (ja) * 2011-03-31 2012-11-01 Secom Co Ltd 顔画像認証装置
JP2016522487A (ja) * 2013-05-10 2016-07-28 イーリス−ゲゼルシャフト ミット ベシュレンクテル ハフツング インフラレッド アンド インテリジェント センサーズ 手の静脈パターンを記録するセンサシステム及び方法
JP2016051246A (ja) * 2014-08-29 2016-04-11 マツダ株式会社 車両用歩行者検出装置
JP2018112402A (ja) * 2018-04-26 2018-07-19 東芝ライフスタイル株式会社 冷蔵庫
WO2022201746A1 (ja) * 2021-03-23 2022-09-29 日本電気株式会社 入退管理システム、入退管理方法、及び記録媒体

Also Published As

Publication number Publication date
JP5606948B2 (ja) 2014-10-15

Similar Documents

Publication Publication Date Title
JP6151582B2 (ja) 顔認証システム
JP5606948B2 (ja) 顔画像認証装置
US20100079243A1 (en) Authentication system, authentication method, and authentication program
WO2018192448A1 (zh) 一种人证比对的认证方法、系统及相机
JP2007156974A (ja) 個人認証・識別システム
JP2006235718A (ja) 顔認証装置、その顔認証方法、その顔認証装置を組み込んだ電子機器およびその顔認証プログラムを記録した記録媒体
JP2015138449A (ja) 個人認証装置、個人認証方法及びプログラム
JP2013167986A (ja) 画像認識システム、画像認識方法
JP4899552B2 (ja) 認証装置、認証方法、認証プログラム、これを記録したコンピュータ読み取り可能な記録媒体
WO2020065954A1 (ja) 認証装置、認証方法および記憶媒体
WO2020065851A1 (ja) 虹彩認証装置、虹彩認証方法および記憶媒体
JP5648452B2 (ja) 画像処理プログラムおよび画像処理装置
JP2008009689A (ja) 顔登録装置、顔認証装置および顔登録方法
JP2003233816A (ja) アクセスコントロールシステム
JP2017044778A (ja) 認証装置
JP2010262527A (ja) 通行者計数装置、通行者計数方法および通行者計数プログラム
KR20110006971A (ko) 출입통제시스템의 출입인증 사용자에 대한 출입허가용 정면얼굴 영상 검출 방법
JP2006085289A (ja) 顔認証システムおよび顔認証方法
US20080154929A1 (en) Collation method, registration apparatus, collation apparatus, and program
JP5618594B2 (ja) 顔画像照合装置
JP2003036442A (ja) 個人認証装置
JP5871764B2 (ja) 顔認証装置
US20230139161A1 (en) Systems and methods for verifying user activity using behavioral models
JP5955057B2 (ja) 顔画像認証装置
JP6679291B2 (ja) 申請者認証装置、及び認証方法、並びにその方法を用いたセキュリティ認証システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140819

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140827

R150 Certificate of patent or registration of utility model

Ref document number: 5606948

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250