JPH09160589A - 利用者照合装置 - Google Patents

利用者照合装置

Info

Publication number
JPH09160589A
JPH09160589A JP7317942A JP31794295A JPH09160589A JP H09160589 A JPH09160589 A JP H09160589A JP 7317942 A JP7317942 A JP 7317942A JP 31794295 A JP31794295 A JP 31794295A JP H09160589 A JPH09160589 A JP H09160589A
Authority
JP
Japan
Prior art keywords
voice
image
user
feature amount
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7317942A
Other languages
English (en)
Inventor
Kazuaki Obara
和昭 小原
Tatsumi Watanabe
辰巳 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7317942A priority Critical patent/JPH09160589A/ja
Publication of JPH09160589A publication Critical patent/JPH09160589A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

(57)【要約】 【課題】 キーボードからパスワードを入力する場合に
比べて、利用者照合をより厳密に行うことができ、不正
にパスワードを取得した利用者が情報処理装置を不正に
利用することを防止することができる利用者照合装置を
提供する。 【解決手段】 利用者の音声を蓄積する手段405と、
利用者の画像を蓄積する手段407と、現在の利用者の
画像を入力する手段402と、前記入力画像から利用者
の画像特徴量を抽出する手段404と、現在の利用者の
音声を入力する手段401と、前記入力音声から利用者
の音声特徴量を抽出する手段403と、前記入力画像と
入力音声を前記蓄積されている画像・音声と照合する手
段408,406と、前記照合に用いる音声または画像
を限定する手段と、前記照合結果に基づき現在の利用者
が登録されている利用者であるか否かを判断する手段4
09から構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は利用者照合装置に関
するものであり、特に音声と画像の個人性特徴量を利用
して効率的な利用者照合を行う利用者照合装置に関す
る。
【0002】
【従来の技術】従来の利用者照合装置は、一般的に例え
ば図11に示したように構成されている。図11におい
て、1101は情報入力するための情報入力手段で例え
ばキーボード、1102は情報処理装置で例えばコンピ
ュータ、1103は入力された情報を表示するための情
報表示手段、1104は他の情報処理装置と接続するた
めのネットワーク装置である。
【0003】以上のように構成された従来の利用者照合
装置においては、情報入力の開始に当たって情報処理装
置を現在の利用者(これから利用しようとする利用者)
が予め利用許可された利用者であるか否かを、通常、利
用者がキーボードからパスワード(暗唱番号)を入力す
ることにより確認して、利用許可された利用者であると
判断したときに限って情報の入力が開始できるようにな
る。
【0004】
【発明が解決しようとする課題】しかしながら、以上の
ように構成された従来の利用者照合装置においては、不
特定多数の利用者が利用できるような環境で情報処理装
置が利用されるような場合には、何らかの手段によっ
て、利用許可された以外の者が不正にパスワードを取得
してキーボードからパスワードを入力することにより情
報処理装置が不正に利用されてしまうという問題があっ
た。
【0005】本発明はかかる点に鑑み、不正にパスワー
ドを取得した利用者が情報処理装置を不正に利用するこ
とを防止し、情報処理装置の利用者の照合をより厳密に
行うことのできる利用者照合装置を提供することを目的
とする。
【0006】
【課題を解決するための手段】本発明に係る利用者照合
装置は、情報処理装置の利用を許可された利用者の画像
の特徴量と音声の特徴量を予め蓄積しておき、現在の利
用者の画像と音声を入力し、それぞれの特徴量を抽出
し、抽出した画像特徴量および音声特徴量をそれぞれ蓄
積されている画像特徴量および音声特徴量と照合して、
画像による照合結果と音声による照合結果とが一致した
ときに現在の利用者が登録されている利用者であると判
断するように構成してあることを特徴としている。利用
者の画像の特徴量と音声の特徴量を用いて照合するの
で、情報処理装置の利用者の照合をより厳密に行うこと
ができ、不正にパスワードを取得した利用者が情報処理
装置を不正に利用することを防止する。
【0007】
【発明の実施の形態】本発明に係る請求項1の利用者照
合装置は、情報処理装置の利用許可された利用者の画像
の特徴量と音声の特徴量を蓄積しておき、入力した現在
の利用者の画像の特徴量を蓄積されている画像の特徴量
と照合するとともに、入力した現在の利用者の音声の特
徴量を蓄積されている音声の特徴量と照合し、画像によ
る照合結果と音声による照合結果とが一致したときに現
在の利用者が登録されている利用者であると判断するよ
うに構成してあることを特徴としている。利用者の画像
の特徴量と音声の特徴量を用いて照合するので、情報処
理装置の利用者の照合をより厳密に行うことができ、不
正にパスワードを取得した利用者が情報処理装置を不正
に利用することを防止する。
【0008】本発明に係る請求項2の利用者照合装置
は、登録利用者の音声を蓄積する手段と、登録利用者の
画像を蓄積する手段と、現在の利用者の画像を入力する
手段と、前記入力画像から利用者の個人性を反映する画
像特徴量を抽出する手段と、現在の利用者の音声を入力
する手段と、前記入力音声から利用者の個人性を反映す
る音声特徴量を抽出する手段と、前記入力画像に含まれ
る画像特徴量を予め蓄積してある画像特徴量と照合する
手段と、前記画像照合結果により前記蓄積手段に蓄積し
てある利用者を照合するために用いる音声の候補を限定
する手段と、前記限定された音声候補の特徴量と入力さ
れた音声の特徴量とを照合する手段と、前記画像による
照合結果と前記音声による照合結果が一致したときに現
在の利用者が登録利用者であると判断する手段を備えた
ことを特徴としている。音声照合するに際して、予め、
画像による照合結果に基づいて音声候補を限定してある
から、照合すべき数が大きいとき、効率的な照合が可能
となる。
【0009】本発明に係る請求項3の利用者照合装置
は、登録利用者の音声を蓄積する手段と、登録利用者の
画像を蓄積する手段と、現在の利用者の画像を入力する
手段と、前記入力画像から利用者の個人性を反映する画
像特徴量を抽出する手段と、現在の利用者の音声を入力
する手段と、前記入力音声から利用者の個人性を反映す
る音声特徴量を抽出する手段と、前記入力画像に含まれ
る画像特徴量を予め蓄積してある画像特徴量と照合する
手段と、前記画像照合結果と入力された利用者の個人性
を反映する音声特徴量の一部を用いて前記蓄積手段に蓄
積してある利用者を照合するために用いる音声候補を限
定する手段と、前記限定された音声候補の特徴量と入力
された音声の特徴量とを照合する手段と、前記画像によ
る照合結果と前記音声による照合結果が一致したときに
現在の利用者が登録利用者であると判断する手段を備え
たことを特徴としている。まず現在の利用者の画像情報
を用いて利用者の照合を行い、その結果と音声の大局的
な特徴量の類似性とを用いて照合すべき音声を限定する
ことによって、照合すべき画像と音声の数が大きいと
き、効率的な照合が可能となる。
【0010】本発明に係る請求項4の利用者照合装置
は、登録利用者の音声を蓄積する手段と、登録利用者の
画像を蓄積する手段と、現在の利用者の画像を入力する
手段と、前記入力画像から利用者の個人性を反映する画
像特徴量を抽出する手段と、現在の利用者の音声を入力
する手段と、前記入力音声から利用者の個人性を反映す
る音声特徴量を抽出する手段と、前記入力音声に含まれ
る音声特徴量を予め蓄積してある音声特徴量と照合する
手段と、前記音声照合結果により前記蓄積してある利用
者の照合に用いる画像候補を限定する手段と、前記限定
された画像候補の特徴量と入力された画像特徴量とを照
合する手段と、前記画像による照合結果と前記音声によ
る照合結果が一致したときに現在の利用者が登録利用者
であると判断する手段を備えたことを特徴としている。
まず現在の利用者の音声情報を用いて利用者の照合を行
い、その照合結果を用いて照合すべき画像を大幅に限定
することによって、音声に比べて照合時間のかかる画像
の照合時間を大きく削減することができ、登録者数が大
きな情報処理装置を利用する場合に効率的な照合が可能
となる。
【0011】本発明に係る請求項5の利用者照合装置
は、登録利用者の音声を蓄積する手段と、登録利用者の
画像を蓄積する手段と、現在の利用者の画像を入力する
手段と、前記入力画像から利用者の個人性を反映する画
像特徴量を抽出する手段と、現在の利用者の音声を入力
する手段と、前記入力音声から利用者の個人性を反映す
る音声特徴量を抽出する手段と、入力された利用者の個
人性を反映する音声特徴量の一部を用いて前記蓄積手段
に蓄積してある利用者を照合するために用いる音声候補
を限定する手段と、前記限定された音声候補の特徴量と
入力された音声の特徴量とを照合する手段と、入力され
た利用者の個人性を反映する画像特徴量の一部を用いて
前記蓄積手段に蓄積してある利用者を照合するために用
いる画像候補を限定する手段と、前記限定された画像候
補の特徴量と入力された画像の特徴量とを照合する手段
と、前記画像による照合結果と前記音声による照合結果
が一致したときに現在の利用者が登録利用者であると判
断する手段を備えたことを特徴としている。利用者の音
声の大局的な情報と画像の大局的な情報とを用いて照合
候補を選択することによって、利用者照合時間を大きく
削減することができ、利用者数が大きな情報処理装置を
利用する場合に効率的な照合が可能となる。
【0012】本発明に係る請求項6の利用者照合装置
は、登録利用者の音声を蓄積する手段と、登録利用者の
画像を蓄積する手段と、現在の利用者の画像を入力する
手段と、前記入力画像から利用者の個人性を反映する画
像特徴量を抽出する手段と、現在の利用者の音声を入力
する手段と、前記入力音声から利用者の個人性を反映す
る音声特徴量を抽出する手段と、入力された利用者の個
人性を反映する音声特徴量の一部を用いて前記蓄積手段
に蓄積してある利用者を照合するために用いる音声候補
を限定する手段と、前記限定された音声候補の特徴量と
入力された音声の特徴量とを照合する手段と、入力され
た利用者の個人性を反映する画像特徴量の一部を用いて
前記蓄積手段に蓄積してある利用者を照合するために用
いる画像候補を限定する手段と、前記音声照合結果によ
り同様に蓄積してある利用者を照合するために用いる画
像候補を限定する手段と、前記限定された画像候補の特
徴量と入力された画像の特徴量とを照合する手段と、前
記音声による照合結果と前記画像による照合結果が一致
したときに現在の利用者が登録利用者であると判断する
手段を備えたことを特徴としている。音声照合結果を用
いて照合すべき画像をさらに限定するので、請求項5の
場合よりもより効率的な照合を行うことができる。
【0013】本発明に係る請求項7の利用者照合装置
は、登録利用者の音声を蓄積する手段と、登録利用者の
画像を蓄積する手段と、現在の利用者の画像を入力する
手段と、前記入力画像から利用者の個人性を反映する画
像特徴量を抽出する手段と、現在の利用者の音声を入力
する手段と、前記入力音声から利用者の個人性を反映す
る音声特徴量を抽出する手段と、入力された利用者の個
人性を反映する画像特徴量の一部を用いて前記蓄積手段
に蓄積してある利用者を照合するために用いる画像候補
を限定する手段と、前記限定された画像候補の特徴量と
入力された画像の特徴量とを照合する手段と、入力され
た利用者の個人性を反映する音声特徴量の一部を用いて
前記蓄積手段に蓄積してある利用者を照合するために用
いる音声候補を限定する手段と、前記画像照合結果によ
り同様に蓄積してある利用者を照合するために用いる音
声候補を限定する手段と、前記限定された音声候補の特
徴量と入力された音声の特徴量とを照合する手段と、前
記画像による照合結果と前記音声による照合結果が一致
したときに現在の利用者が登録利用者であると判断する
手段を備えたことを特徴としている。画像照合結果を用
いて照合すべき画像をさらに限定するので、請求項5の
場合よりもより効率的な照合を行うことができる。
【0014】本発明に係る請求項8の利用者照合装置
は、登録利用者の音声を蓄積する手段と、登録利用者の
画像を蓄積する手段と、現在の利用者の画像を入力する
手段と、前記入力画像から利用者の個人性を反映する画
像特徴量を抽出する手段と、現在の利用者の音声を入力
する手段と、前記入力音声から利用者の個人性を反映す
る音声特徴量を抽出する手段と、前記入力音声に含まれ
る音声特徴量を予め蓄積してある音声特徴量と照合する
手段と、前記入力音声から現在の利用者を照合したとき
の音声信頼度を求める手段と、前記音声照合結果により
前記蓄積してある利用者の照合に用いる画像を限定する
手段と、前記限定された画像特徴量と入力された画像特
徴量とを照合する手段と、前記画像照合結果から現在の
利用者を照合したときの画像信頼度を求める手段と、前
記音声からの信頼度と前記画像からの信頼度の各々が予
め設定した値よりも高いときに現在の利用者が登録利用
者であると判断する手段を備えたことを特徴としてい
る。入力された音声と画像を用いて利用者を判定すると
同時に、音声と画像の信頼度を考慮することでより信頼
度の高い確実な利用者照合判定を行うことができる。
【0015】本発明に係る請求項9の利用者照合装置
は、登録利用者の音声を蓄積する手段と、登録利用者の
画像を蓄積する手段と、現在の利用者の音声を入力する
手段と、前記入力音声から利用者の個人性を反映する音
声特徴量を抽出する手段と、現在の利用者の画像を入力
する手段と、前記入力画像から利用者の個人性を反映す
る画像特徴量を抽出する手段と、前記入力した画像特徴
量と予め蓄積してある画像特徴量とを照合する手段と、
前記画像照合結果の信頼度を求める手段と、前記画像照
合結果と信頼度に基づき音声照合に用いるための登録利
用者の数と候補を限定する手段と、前記限定された利用
者の音声特徴量と入力された音声特徴量とを照合する手
段と、前記音声照合結果の信頼度を求める手段と、前記
画像から求めた信頼度と前記音声から求めた信頼度の各
々が予め設定した値よりも高いときに現在の利用者が登
録されている利用者であると判断する手段を備えたこと
を特徴としている。入力された画像と音声を用いて利用
者を判定すると同時に、音声と画像の信頼度を考慮する
ことでより信頼度の高い確実な利用者照合判定を行うこ
とができる。
【0016】本発明に係る請求項10の利用者照合装置
は、登録利用者の音声を蓄積する手段と、登録利用者の
画像を蓄積する手段と、現在の利用者の画像を入力する
手段と、現在の利用者の音声を入力する手段と、前記入
力画像から利用者の個人性を反映する画像特徴量を抽出
する手段と、前記入力した画像特徴量と予め蓄積してあ
る画像特徴量とを照合する手段と、前記画像照合結果の
信頼度を求める手段と、前記画像照合結果と信頼度に基
づき音声照合に用いるための登録利用者の候補を限定す
る手段と、前記画像信頼度が予め設定した基準値より高
かったときに現在の利用者が登録利用者であると判断す
る手段と、前記画像信頼度が予め設定した基準値よりも
低かったときに前記音声入力手段から音声を入力する手
段と、前記入力音声から利用者の個人性を反映する音声
特徴量を抽出する手段と、前記画像照合結果と前記音声
の個人性情報を用いて限定された音声特徴量と入力され
た音声特徴量とを照合する手段と、前記音声照合結果の
信頼度を求める手段と、前記音声の信頼度と前記画像の
信頼度の各々が予め設定した値よりも高かったときに現
在の利用者が登録利用者であると判断する手段を備えた
ことを特徴としている。まず画像を用いて利用者を照合
し、そのときの画像信頼度が基準値よりも高かった場合
には音声を使った照合は行わずに情報処理装置の利用を
許可し、画像信頼度が基準値よりも低かった場合には音
声を用いた照合も行うことで、より効率的で確かな利用
者照合判定を行うことができる。
【0017】本発明に係る請求項11の利用者照合装置
は、上記請求項1から請求項10までのいずれかにおい
て、利用者の音声特徴量を抽出する手段が、利用者の音
声のピッチの平均値を求める手段と、ピッチの標準偏差
を求める手段と、平均音声パワーを求める手段と、平均
音声パワーの標準偏差を求める手段と、音声パワースベ
クトラムの時系列情報を求める手段とからなるものであ
る。高精度な照合を行うことができる。
【0018】本発明に係る請求項12の利用者照合装置
は、上記請求項1から請求項10までのいずれかにおい
て、利用者の画像特徴量を抽出する手段が、利用者の顔
画像の輝度情報を求める手段と、輝度情報の位置微分情
報を求める手段と、利用者の顔画像の輪郭情報を求める
手段と、利用者の顔画像の色情報を求める手段と、前記
画像の輝度情報、輝度情報の位置微分情報、輪郭情報、
色情報の重みづけを行う手段とからなるものである。高
精度な照合を行うことができる。
【0019】本発明に係る請求項13の利用者照合装置
は、上記請求項1から請求項10までのいずれかにおい
て、利用者の画像特徴量を抽出する手段が、画像から利
用者の身長を推定する手段と、利用者の顔画像の色情報
を求める手段と、前記顔画像の輝度情報、輝度情報の位
置微分情報、輪郭情報とからなるものである。高精度な
照合を行うことができる。
【0020】(実施の形態1)以下、本発明の実施の形
態1について図面を参照して説明する。
【0021】図1は本発明の実施の形態1における利用
者照合装置の構成図を示すものである。図1において、
100は情報処理装置、101は情報処理装置100を
これから利用しようとする利用者(現在の利用者)の音
声を入力するための音声入力装置、102は情報処理装
置100の現在の利用者の顔画像を入力するための画像
入力装置、103は音声入力装置101で入力された現
在の利用者の音声の特徴量を取り出すための音声特徴抽
出装置、104は画像入力装置102で入力された現在
の利用者の画像の特徴量を取り出すための画像特徴抽出
装置、105は予め登録されている利用者の音声の特徴
量を蓄積している登録者音声特徴蓄積装置、106は音
声特徴抽出装置103で取り出された現在の利用者の音
声の特徴量と登録者音声特徴蓄積装置105に予め登録
されている利用者の音声の特徴量を照合するための音声
照合装置である。この音声照合装置106は、画像照合
装置108での画像照合の結果により登録者音声特徴蓄
積装置105で限定されたN個(Nは正の整数)の音声
候補の特徴量を音声特徴抽出装置103が抽出した音声
の特徴量と照合するように構成されている。107は予
め登録されている利用者の画像の特徴量を蓄積している
登録者画像特徴蓄積装置、108は画像特徴抽出装置1
04で取り出された現在の利用者の画像の特徴量と登録
者画像特徴蓄積装置107に予め登録されている利用者
の画像の特徴量を照合するための画像照合装置、109
は画像照合装置108で照合された利用者と音声照合装
置106で照合された利用者とが一致しているか否かを
判定する一致判定装置である。
【0022】以上のように構成された実施の形態1の利
用者照合装置について、以下にその動作を説明する。情
報処理装置100の現在の利用者は利用に先立ち利用者
の音声と顔画像をそれぞれ音声入力装置101と画像入
力装置102から入力する。
【0023】入力された画像は画像特徴抽出装置104
に入力され、現在の利用者の画像に含まれる個人性情報
を抽出する。画像に含まれる個人性情報としては、顔画
像の輝度情報、輝度情報の位置微分情報、顔画像の色情
報を用いる。現在の利用者の画像が予め情報処理装置1
00に登録されている利用者であるか否かの照合につい
ては、画像特徴抽出装置104で抽出した特徴量と登録
者画像特徴蓄積装置107の特徴量とが画像照合装置1
08で照合され、利用者が予め登録されているか否かを
照合する。
【0024】一方、入力された音声は音声特徴抽出装置
103に入力され、現在の利用者の音声に含まれる個人
性情報を抽出する。ここで抽出している個人性情報とし
ては、音声のピッチの平均値、ピッチの標準偏差、平均
音声パワーとその標準偏差、音声パワースペクトラムの
時系列情報等を用いる。これらの特徴量は公知の手法
(例えばDFT分析、LPC分析、フィルタ分析等)を
用いて容易に求めることが可能である。音声特徴抽出装
置103で抽出された音声の特徴量は登録者音声特徴蓄
積装置105に蓄積されている予め登録されている利用
者の音声の特徴量と音声照合装置106で照合され、利
用者が予め登録されているか否かを照合する。ここで照
合に用いられる蓄積音声は、画像照合の結果から求めた
N個(Nは正の整数)の利用者の候補の音声に限定され
ている。すなわち、音声照合装置106は画像照合の結
果により登録者音声特徴蓄積装置105で限定されたN
個の音声候補の特徴量を音声特徴抽出装置103が抽出
した音声の特徴量と照合する。音声照合装置106での
特徴量の照合は、公知のHMM(Hidden Malkof Model
)、DTW(Dynamic Time Warping)、LVQ(Learn
ing Vector Quantizer)などのパターン照合手法を用い
て行うことができる。一致判定装置109は画像照合装
置108による照合結果と音声照合装置106による照
合結果とが一致したときのみ「1」を出力し、不一致の
ときは「0」を出力する。一致判定装置109が「1」
を出力したときのみ、現在の利用者が登録されている利
用者であると判断して、現在の利用者に対して情報処理
装置100の利用を許可する。
【0025】以上のように本実施の形態によれば、利用
者に特有な画像情報と音声情報を用いて利用者の照合を
行うことによって、従来のパスワード(暗唱番号)をキ
ーボードから入力するだけでは避けることのできない情
報処理装置の不正利用を防ぐことができる。そして、音
声照合するに際して、予め、画像による照合結果に基づ
いて音声候補を限定してあるから、照合すべき数が大き
いとき、効率的な照合が可能となる。
【0026】(実施の形態2)以下、本発明の実施の形
態2について図面を参照して説明する。
【0027】図2は本発明の実施の形態2における利用
者照合装置の構成図を示すものである。図2において、
200は情報処理装置、201は情報処理装置200に
現在の利用者の音声を入力するための音声入力装置、2
02は情報処理装置200の現在の利用者の顔画像を入
力するための画像入力装置、203−1は音声入力装置
201で入力された現在の利用者の音声の平均的なピッ
チ等の大局的な特徴量を取り出すための音声特徴抽出装
置、203−2は音声入力装置201で入力された現在
の利用者の音声のスペクトル特徴を反映する特徴量を取
り出すための音声特徴抽出装置、204は画像入力装置
202で入力された現在の利用者の画像の特徴量を取り
出すための画像特徴抽出装置、205は予め登録されて
いる利用者の音声の特徴量を蓄積している登録者音声特
徴蓄積装置、206は音声特徴抽出装置203で取り出
された現在の利用者の音声の特徴量と予め登録されてい
る利用者の音声の特徴量を照合するための音声照合装
置、207は予め登録されている利用者の画像の特徴量
を蓄積している登録者画像特徴蓄積装置、208は画像
特徴抽出装置204で取り出された現在の利用者の画像
の特徴量と予め登録されている利用者の画像の特徴量を
照合するための画像照合装置、209は画像照合装置2
08で照合された利用者と音声照合装置206で照合さ
れた利用者とが一致しているか否かを判定する一致判定
装置である。音声特徴抽出装置203−1による大局的
な音声の特徴量に基づいて登録者音声特徴蓄積装置20
5での音声候補を限定するように構成されている。ま
た、画像照合装置208によるN個の画像候補に基づい
ても登録者音声特徴蓄積装置205での音声候補を限定
するように構成されている。
【0028】以上のように構成された実施の形態2の利
用者照合装置について、以下にその動作を説明する。情
報処理装置200の現在の利用者は利用に先立ち利用者
の音声と顔画像を入力する。画像入力装置202によっ
て入力された画像は画像特徴抽出装置204に入力さ
れ、利用者の画像に含まれる個人性情報を抽出する。画
像に含まれる個人性情報としては、顔画像の輝度情報、
輝度情報の位置微分情報、顔画像の色情報を用いる。画
像特徴抽出装置204で取り出した画像特徴量と登録者
画像特徴蓄積装置207に蓄積された画像特徴量とが画
像照合装置208で照合され、現在の利用者に最も近い
登録利用者からN番目(Nは正の整数)までの候補を出
力する。
【0029】一方、音声入力装置201から入力された
音声は音声特徴抽出装置203−1,203−2に入力
され、利用者の音声に含まれる個人性情報を抽出する。
音声特徴抽出装置203−1では、音声のピッチの平均
値、ピッチの標準偏差、平均音声パワーとその標準偏差
の個人性情報の大局的な特徴量を求める。音声特徴抽出
装置203−2では、音声パワースペクトラムの時系列
情報を求める。これらの特徴量は公知の手法(例えばD
FT分析、LPC分析、フィルタ分析等)を用いて容易
に求めることが可能である。音声特徴抽出装置203で
求められた音声の特徴量は登録者音声特徴蓄積装置20
5に予め登録されている利用者の音声の特徴量と音声照
合装置206で照合され、利用者が予め登録されている
か否かを照合する。ここで照合に用いられる蓄積音声
は、画像照合の結果から求めたN個の利用者の候補と、
音声特徴抽出装置203−1で求めた大局的な音声特徴
量の類似している登録利用者に限定されている。音声照
合装置206での特徴量の照合は公知のHMM、DT
W、LVQなどのパターン照合手法を用いて行うことが
できる。一致判定装置209は画像照合装置208によ
る照合結果と音声照合装置206による照合結果とが一
致したときのみ「1」を出力し、不一致のときは「0」
を出力する。一致判定装置209が「1」を出力したと
きのみ、現在の利用者が登録されている利用者であると
判断して、現在の利用者に対して情報処理装置200の
利用を許可する。
【0030】以上のように本実施の形態によれば、まず
現在の利用者の画像情報を用いて利用者の照合を行い、
その結果と音声の大局的な特徴量の類似性とを用いて照
合すべき音声を限定することによって、照合すべき画像
と音声の数が大きいとき、効率的な照合が可能となると
ともに、従来のパスワードをキーボードから入力するだ
けでは避けることのできない情報処理装置の不正利用を
防ぐことができる。
【0031】(実施の形態3)以下、本発明の実施の形
態3について図面を参照して説明する。
【0032】図3は本発明の実施の形態3における利用
者照合装置の構成図を示すものである。図3において、
300は情報処理装置、301は情報処理装置300に
現在の利用者の音声を入力するための音声入力装置、3
02は情報処理装置300の現在の利用者の顔画像を入
力するための画像入力装置、303−1は音声入力装置
301で入力された現在の利用者の音声の平均的なピッ
チ等の大局的な特徴量を取り出すための音声特徴抽出装
置、303−2は音声入力装置301で入力された現在
の利用者の音声のスペクトル特徴を反映する特徴量を取
り出すための音声特徴抽出装置、304は画像入力装置
302で入力された現在の利用者の画像の特徴量を取り
出すための画像特徴抽出装置、305は予め登録されて
いる利用者の音声の特徴量を蓄積している登録者音声特
徴蓄積装置、306は音声特徴抽出装置303で取り出
された現在の利用者の音声の特徴量と予め登録されてい
る利用者の音声の特徴量を照合するための音声照合装
置、307は予め登録されている利用者の画像の特徴量
を蓄積している登録者画像特徴蓄積装置、308は画像
特徴抽出装置304で取り出された現在の利用者の画像
の特徴量と予め登録されている利用者の画像の特徴量を
照合するための画像照合装置、309は画像照合装置3
08で照合された利用者と音声照合装置306で照合さ
れた利用者とが一致しているか否かを判定する一致判定
装置である。音声特徴抽出装置303−1による大局的
な音声の特徴量に基づいて登録者音声特徴蓄積装置30
5での音声候補を限定するように構成されている。ま
た、音声照合装置306によるN個の音声候補に基づい
て登録者画像特徴蓄積装置307での画像候補を限定す
るように構成されている。
【0033】以上のように構成された実施の形態3の利
用者照合装置について、以下にその動作を説明する。情
報処理装置300の現在の利用者は利用に先立ち利用者
の音声と顔画像を入力する。音声入力装置301から入
力された音声は音声特徴抽出装置303−1,303−
2に入力され利用者の音声に含まれる個人性情報を抽出
する。音声特徴抽出装置303−1では、音声のピッチ
の平均値、ピッチの標準偏差、平均音声パワーとその標
準偏差の個人性情報の大局的な特徴量を求める。音声特
徴抽出装置303−2では、音声パワースペクトラムの
時系列情報等を求める。これらの特徴量は公知の手法
(例えばDFT分析、LPC分析、フィルタ分析等)を
用いて容易に求めることが可能である。音声特徴抽出装
置303で求められた音声の特徴量は登録者音声特徴蓄
積装置305に予め登録されている利用者の音声の特徴
量と音声照合装置306によって照合され、利用者が予
め登録されているか否かが判断される。照合を効率的に
行うために本実施の形態では、音声特徴抽出装置303
−1で抽出された音声のピッチの平均値、ピッチの標準
偏差、平均音声パワーとその標準偏差の個人性情報の大
局的な特徴量の類似した登録者音声特徴蓄積装置305
の音声に限定して音声照合を行っている。音声照合装置
306での特徴量の照合は公知のHMM、DTW、LV
Qなどのパターン照合手法を用いて行うことができる。
【0034】一方、画像入力装置302によって入力さ
れた現在の利用者の画像は画像特徴抽出装置304で特
徴抽出された後、画像照合装置308に入力され、登録
者画像特徴蓄積装置307に蓄積された画像特徴量と照
合され、現在の利用者が予め登録されている利用者であ
るか否かが判断される。本実施の形態では、画像に含ま
れる個人性情報として、顔画像の輝度情報、輝度情報の
位置微分情報、顔画像の色情報を用いる。現在の利用者
の画像が予め情報処理装置300に登録されている利用
者であるか否かは、画像特徴抽出装置304で取り出し
た特徴量と登録者画像特徴蓄積装置307の特徴量とを
画像照合装置308で照合する。照合すべき登録蓄積画
像の候補は本実施の形態では、先の音声照合装置306
での照合結果によって限定された候補を用いている。こ
の画像照合装置308では現在の利用者の入力画像と最
も類似した蓄積画像が出力される。一致判定装置309
は画像による照合結果と前記音声による照合結果が一致
したときに「1」を出力し、不一致のときは「0」を出
力する。一致判定装置309が「1」を出力したときの
み、現在の利用者が登録されている利用者であると判断
して、現在の利用者に対して情報処理装置300を利用
することを許可する。
【0035】以上のように本実施の形態によれば、まず
現在の利用者の音声情報を用いて利用者の照合を行い、
その照合結果を用いて照合すべき画像を大幅に限定する
ことによって、音声に比べて照合時間のかかる画像の照
合時間を大きく削減することができ、登録者数が大きな
情報処理装置を利用する場合に効率的な照合が可能とな
るとともに、従来のパスワードをキーボードから入力す
るだけでは避けることのできない情報処理装置の不正利
用を防ぐことができる。
【0036】(実施の形態4)以下、本発明の実施の形
態4について図面を参照して説明する。
【0037】図4は本発明の実施の形態4における利用
者照合装置の構成図を示すものである。図8において、
400は情報処理装置、401は情報処理装置400に
現在の利用者の音声を入力するための音声入力装置、4
02は情報処理装置400に現在の利用者の画像を入力
するための画像入力装置、403−1は音声入力装置4
01で入力された現在の利用者の音声の平均的なピッチ
等の大局的な特徴量を取り出すための音声特徴抽出装
置、403−2は音声入力装置401で入力された現在
の利用者の音声のスペクトル特徴を反映する特徴量を取
り出すための音声特徴抽出装置、404−1は入力画像
に含まれる利用者の身長に代表される大局的な画像特徴
量を抽出する画像特徴抽出装置、404−2は入力画像
に含まれる利用者の顔色、顔の輪郭、目の大きさ、輝度
分布等の局所的な画像特徴量を抽出する画像特徴抽出装
置、405は予め登録されている利用者の音声の特徴量
を蓄積している登録者音声特徴蓄積装置、406は音声
特徴抽出装置403で取り出された現在の利用者の音声
の特徴量と予め登録されている利用者の音声の特徴量を
照合するための音声照合装置、407は予め登録されて
いる利用者の画像の特徴量を蓄積している登録者画像特
徴蓄積装置、408は画像特徴抽出装置404で取り出
された現在の利用者の画像の特徴量と予め登録されてい
る利用者の画像の特徴量を照合するための画像照合装
置、409は画像照合装置408で照合された利用者と
音声照合装置406で照合された利用者とが一致してい
るか否かを判定する一致判定装置である。音声特徴抽出
装置403−1による大局的な音声の特徴量に基づいて
登録者音声特徴蓄積装置405での音声候補を限定する
ように構成されている。また、画像特徴抽出装置404
−1による大局的な画像の特徴量に基づいて登録者画像
特徴蓄積装置407での画像候補を限定するように構成
されている。
【0038】以上のように構成された実施の形態4の利
用者照合装置について、以下にその動作を説明する。情
報処理装置400の現在の利用者は利用に先立ち利用者
の音声と顔画像を入力する。音声入力装置401から入
力された現在の利用者の音声は音声特徴抽出装置403
−1,403−2に入力され、利用者の音声に含まれる
個人性情報が抽出される。音声特徴抽出装置403−1
では、利用者の個人性情報である音声のピッチの平均
値、ピッチの標準偏差、平均音声パワーとその標準偏差
の大局的な特徴量を求める。音声特徴抽出装置403−
2では音声パワースペクトラムの時系列情報を抽出す
る。これらの特徴量は公知の手法(例えばDFT分析、
LPC分析、フィルタ分析等)を用いて容易に求めるこ
とが可能である。音声特徴抽出装置403−1で求めた
大局的な音声特徴量は予め登録されている利用者の音声
の特徴量を蓄積している登録者音声特徴蓄積装置405
の照合すべき候補を限定するために用いられる。すなわ
ち、現在の利用者の音声のピッチの平均値、ピッチの標
準偏差、平均音声パワーとその標準偏差の大局的な特徴
量の類似している蓄積音声が登録者音声特徴蓄積装置4
05から選択され、音声照合装置406での照合に用い
られる。入力された音声と限定された音声は音声照合装
置406によって照合され、利用者が予め登録されてい
るか否かが判断される。音声照合装置406での特徴量
の照合は公知のHMM、DTW、LVQなどのパターン
照合手法を用いて行うことができる。
【0039】一方、画像入力装置402によって入力さ
れた利用者の画像は画像特徴抽出装置403−1,40
3−2に入力され、利用者の画像に含まれる個人性情報
が抽出される。画像特徴抽出装置403−1では、利用
者の個人性情報である身長に代表されるような画像の大
局的な特徴量を求め、登録者画像特徴蓄積装置407に
おいて照合すべき画像候補を限定する。画像特徴抽出装
置403−2では顔画像の輝度情報、輝度情報の位置微
分情報、顔画像の色情報を画像特徴量として抽出してい
る。
【0040】画像照合装置408では、画像特徴抽出装
置404−2で抽出された画像特徴量と登録者画像特徴
蓄積装置407において限定された画像特徴量とを照合
し、現在の利用者の画像が予め登録されている利用者の
画像であるか否かを照合する。照合すべき登録蓄積画像
の候補は本実施の形態では、画像特徴抽出装置404−
1で求めた大局的な画像特徴量の類似した候補を登録者
画像特徴蓄積装置407から限定している。一致判定装
置409は音声照合装置406と画像照合装置408と
の照合結果を照合し、それらが一致したときのみ「1」
を出力し、不一致のときは「0」を出力する。一致判定
装置409が「1」を出力したときのみ、現在の利用者
が登録されている利用者であると判断して、利用者が情
報処理装置400を利用することを許可している。
【0041】以上のように本実施の形態によれば、利用
者の音声の大局的な情報と画像の大局的な情報とを用い
て照合候補を選択することによって、利用者照合時間を
大きく削減することができ、利用者数が大きな情報処理
装置を利用する場合に効率的な照合が可能となるととも
に、従来のパスワードをキーボードから入力するだけで
は避けることのできない情報処理装置の不正利用を防ぐ
ことができる。
【0042】(実施の形態5)以下、本発明の実施の形
態5について図面を参照して説明する。
【0043】図5は本発明の実施の形態5における利用
者照合装置の構成図を示すものである。この実施の形態
5の構成は前述の実施の形態4(図4)の構成とほぼ同
様であり、同様な情報処理装置500、音声入力装置5
01、画像入力装置502、音声特徴量抽出装置503
−1,503−2、画像特徴抽出装置504−1,50
4−2、登録者音声特徴蓄積装置505、音声照合装置
506、登録者画像特徴蓄積装置507、画像照合装置
508、一致判定装置509を備えている。音声特徴抽
出装置503−1は入力された現在の利用者の音声の平
均的なピッチ等の大局的な特徴量を取り出し、音声特徴
抽出装置503−2は入力された現在の利用者の音声の
スペクトル特徴を反映する特徴量を取り出す。画像特徴
抽出装置504−1は入力画像に含まれる利用者の身長
に代表される大局的な画像特徴量を抽出し、画像特徴抽
出装置504−2は入力画像に含まれる利用者の顔色、
顔の輪郭、目の大きさ、輝度分布等の局所的な画像特徴
量を抽出する。音声特徴抽出装置503−1による大局
的な音声の特徴量に基づいて登録者音声特徴蓄積装置5
05での音声候補を限定するように構成されている。ま
た、画像特徴抽出装置504−1による大局的な画像の
特徴量と音声照合装置506による音声照合結果とに基
づいて登録者画像特徴蓄積装置507での画像候補を限
定するように構成されている。
【0044】実施の形態4の場合に比べると、音声照合
装置506の照合結果を用いて、照合すべき画像をさら
に限定することによって、より効率的な照合を行うこと
ができる。
【0045】(実施の形態6)以下、本発明の実施の形
態6について図面を参照して説明する。
【0046】図6は本発明の実施の形態6における利用
者照合装置の構成図を示すものである。この実施の形態
6の構成は前述の実施の形態4(図4)の構成とほぼ同
様であり、同様な情報処理装置600、音声入力装置6
01、画像入力装置602、音声特徴量抽出装置603
−1,603−2、画像特徴抽出装置604−1,60
4−2、登録者音声特徴蓄積装置605、音声照合装置
606、登録者画像特徴蓄積装置607、画像照合装置
608、一致判定装置609を備えている。音声特徴抽
出装置603−1は入力された現在の利用者の音声の平
均的なピッチ等の大局的な特徴量を取り出し、音声特徴
抽出装置603−2は入力された現在の利用者の音声の
スペクトル特徴を反映する特徴量を取り出す。画像特徴
抽出装置604−1は入力画像に含まれる利用者の身長
に代表される大局的な画像特徴量を抽出し、画像特徴抽
出装置604−2は入力画像に含まれる利用者の顔色、
顔の輪郭、目の大きさ、輝度分布等の局所的な画像特徴
量を抽出する。画像特徴抽出装置604−1による大局
的な画像の特徴量に基づいて登録者画像特徴蓄積装置6
07での画像候補を限定するように構成されている。ま
た、音声特徴抽出装置603−1による大局的な音声の
特徴量および画像照合装置608による画像照合結果と
に基づいて登録者音声特徴蓄積装置605での音声候補
を限定するように構成されている。
【0047】実施の形態4の場合に比べると、画像照合
装置608の照合結果を用いて、照合すべき音声をさら
に限定することによって、より効率的な照合を行うこと
ができる。
【0048】(実施の形態7)以下、本発明の実施の形
態7について図面を参照して説明する。
【0049】図7は本発明の実施の形態7における利用
者照合装置の構成図を示すものである。図7において、
700は情報処理装置、701は情報処理装置700に
現在の利用者の音声を入力するための音声入力装置、7
02は情報処理装置700に現在の利用者の顔画像を入
力するための画像入力装置、703−1は音声入力装置
701で入力された現在の利用者の音声の平均的なピッ
チ等の大局的な特徴量を取り出すための音声特徴抽出装
置、703−2は音声入力装置701で入力された現在
の利用者の音声のスペクトル特徴を反映する特徴量を取
り出すための音声特徴抽出装置、704は画像入力装置
702で入力された現在の利用者の画像の特徴量を取り
出すための画像特徴抽出装置、705は予め登録されて
いる利用者の音声の特徴量を蓄積している登録者音声特
徴蓄積装置、706は音声特徴抽出装置703で取り出
された現在の利用者の音声の特徴量と予め登録されてい
る利用者の音声の特徴量を照合するための音声照合装置
である。音声特徴抽出装置703−1による大局的な音
声の特徴量に基づいて登録者音声特徴蓄積装置705で
の音声候補を限定するように構成されている。707は
予め登録されている利用者の画像の特徴量を蓄積してい
る登録者画像特徴蓄積装置、708は画像特徴抽出装置
704で取り出された現在の利用者の画像の特徴量と予
め登録されている利用者の画像の特徴量を照合するため
の画像照合装置である。音声照合装置706によるN個
の音声候補に基づいて登録者画像特徴蓄積装置707で
の画像候補を限定するように構成されている。709は
画像照合装置708で照合した結果の信頼度Gを求める
ための画像信頼度評価装置、710は音声照合装置70
6で照合した結果の信頼度Sを求めるための音声信頼度
評価装置、711は画像信頼度評価装置709で求めら
れた画像から評価した現在の利用者が登録利用者である
ことを判断するための信頼度Gと、音声信頼度評価装置
710で求められた音声から評価した現在の利用者が登
録利用者であることを判断するための信頼度Sを総合し
て現在の利用者が情報処理装置700を利用することを
許可するか否かを判断するための信頼度評価装置であ
る。
【0050】以上のように構成された実施の形態7の利
用者照合装置について、以下にその動作を説明する。情
報処理装置700の現在の利用者は利用に先立ち利用者
の音声と顔画像を入力する。音声入力装置701から入
力された音声は音声特徴抽出装置703−1,703−
2に入力され利用者の音声に含まれる個人性情報が抽出
される。音声特徴抽出装置703−1では、音声のピッ
チの平均値、ピッチの標準偏差、平均音声パワーとその
標準偏差の個人性情報の大局的な特徴量を求める。音声
特徴抽出装置703−2では、音声パワースペクトラム
の時系列情報を抽出する。これらの特徴量は公知の手法
(例えばDFT分析、LPC分析、フィルタ分析等)を
用いて容易に求めることが可能である。音声特徴抽出装
置703−1で求められた音声の特徴量は登録者音声特
徴蓄積装置705に入力され、音声照合装置706で照
合に用いる候補データを選出する。音声照合装置706
では登録者音声特徴蓄積装置705からの候補データと
現在の利用者とについて、音声特徴抽出装置703−2
で抽出された特徴量を用いて照合を行い、その結果を登
録者画像特徴蓄積装置707と音声信頼度評価装置71
0に出力する。音声照合装置706での特徴量の照合は
公知のHMM、DTW、LVQなどのパターン照合手法
を用いて行うことができる。これらの照合の結果、現時
点で入力された音声が予め蓄積されている音声データと
どれくらい似ているかが音声信頼度評価装置710で評
価される。本実施の形態では、音声信頼度評価装置71
0での信頼度Sの評価は具体的には、 S=1−Smin /Smin2 ……………………………………………(1) で定義している。式(1)でSmin は入力音声と最も良
く照合した蓄積音声との照合結果である距離であり、S
min2は次に良く照合した蓄積音声との距離である。信頼
度Sが1に近いほど入力音声と蓄積音声との音声との一
致度が高く信頼度が高いことになる。
【0051】一方、画像入力装置702によって入力さ
れた現在の利用者の画像は画像特徴抽出装置704に入
力され、利用者の画像に含まれる個人性情報を抽出す
る。画像に含まれる個人性情報としては、顔画像の輝度
情報、輝度情報の位置微分情報、顔画像の色情報を用い
る。現在の利用者の画像が予め情報処理装置700に登
録されている利用者の画像であるか否かは、画像特徴抽
出装置704で取り出した特徴量と登録者画像特徴蓄積
装置707の特徴量とを画像照合装置708で照合す
る。照合に用いられる蓄積画像は、音声信号装置706
から出力された現在の利用者に最も近い登録利用者から
N番目(Nは正の整数)までの候補を用いる。現在の利
用者の画像と予め情報処理装置700に登録されている
利用者の照合は入力画像の輝度情報等を使う公知の手法
で行うことが可能である。画像照合装置708で求めら
れる現在の利用者の入力画像と蓄積画像との類似度は画
像信頼度評価装置709に入力される。画像信頼度評価
装置709では入力された照合結果から信頼度を求め
る。画像信頼度評価装置709での信頼度Gの評価は具
体的には、 G=1−Gmin /Gmin2 ……………………………………………(2) で定義している。式(2)でGmin は入力画像と最も良
く照合した蓄積画像との照合結果である距離であり、G
min2は次に良く照合した蓄積画像との距離である。本実
施の形態の照合距離は、照合する画像間の対応する画素
間の輝度の差を使って求めている。信頼度Gが1に近い
ほど入力画像と蓄積画像との一致度が高く信頼度が高い
ことになる。
【0052】信頼度評価装置711では音声信頼度評価
装置710で求めた信頼度Sと画像信頼度評価装置70
9で求めた信頼度Gのどちらともが予め設定している基
準値よりも高く、かつ音声照合装置706と画像照合装
置708による音声で判定した利用者と画像で判定した
利用者が一致したときにのみ現在の利用者が登録された
利用者であるとして、情報処理装置700の利用を許可
する。
【0053】以上のように本実施の形態によれば、入力
された音声と画像を用いて利用者を判定すると同時に、
音声と画像の信頼度を考慮することでより信頼度の高い
確実な利用者照合判定を行うことができる。なお、音声
で判定した利用者と画像で判定した利用者が一致しては
いるが、信頼度が低い場合には、さらに現在の利用者に
キーボードからパスワードを入力させることによって情
報処理装置700の利用を許可することもできる。ま
た、信頼度評価装置711の判定基準としては、音声信
頼度評価装置710で求めた信頼度Sと画像信頼度評価
装置709で求めた信頼度Gのどちらともが予め設定し
ている基準値を超えたことを基準とする代わりに、信頼
度Sまたは信頼度Gが1に近いときには情報処理装置7
00の利用を許可するようにすることもできる。
【0054】(実施の形態8)以下、本発明の実施の形
態8について図面を参照して説明する。
【0055】図8は本発明の実施の形態8における利用
者照合装置の構成図を示すものである。図8において、
800は情報処理装置、801は情報処理装置800に
現在の利用者の音声を入力するための音声入力装置、8
02は情報処理装置800に現在の利用者の顔画像を入
力するための画像入力装置、803−1は音声入力装置
801で入力された現在の利用者の音声の平均的なピッ
チ等の大局的な特徴量を取り出すための音声特徴抽出装
置、803−2は音声入力装置801で入力された現在
の利用者の音声のスペクトル特徴を反映する特徴量を取
り出すための音声特徴抽出装置、804は画像入力装置
802で入力された現在の利用者の画像の特徴量を取り
出すための画像特徴抽出装置、805は予め登録されて
いる利用者の音声の特徴量を蓄積している登録者音声特
徴蓄積装置、806は音声特徴抽出装置803で取り出
された現在の利用者の音声の特徴量と予め登録されてい
る利用者の音声の特徴量を照合するための音声照合装置
である。音声特徴抽出装置803−1による大局的な音
声の特徴量に基づいて登録者音声特徴蓄積装置805で
の音声候補を限定するように構成されている。807は
予め登録されている利用者の画像の特徴量を蓄積してい
る登録者画像特徴蓄積装置、808は画像特徴抽出装置
804で取り出された現在の利用者の画像の特徴量と予
め登録されている利用者の画像の特徴量を照合するため
の画像照合装置、809は画像照合装置808で照合し
た結果の信頼度を求めるための画像信頼度評価装置であ
る。画像信頼度評価装置809によって得た信頼度Gに
基づいて登録者音声特徴蓄積装置805でN個の音声候
補を限定するように構成されている。810は音声照合
装置806で照合した結果の信頼度Sを求めるための音
声信頼度評価装置、811は画像信頼度評価装置809
で求められた画像から評価した現在の利用者が登録利用
者であることを判断するための信頼度Gと、音声信頼度
評価装置810で求められた音声から評価した現在の利
用者が登録利用者であることを判断するための信頼度S
を総合して現在の利用者が情報処理装置800を利用す
ることを許可するか否かを判断するための信頼度評価装
置である。
【0056】以上のように構成された実施の形態8の利
用者照合装置について、以下にその動作を説明する。情
報処理装置800の現在の利用者は利用に先立ち利用者
の音声と顔画像を入力する。画像入力装置802によっ
て入力された利用者の画像は、画像特徴抽出装置804
に入力され利用者の画像に含まれる個人性情報が抽出さ
れる。画像の個人性情報としては、顔画像の輝度情報、
輝度情報の位置微分情報、顔画像の色情報を用いる。画
像照合装置808では登録者画像特徴蓄積装置807に
蓄積されている画像特徴量と画像特徴抽出装置804で
抽出された画像特徴量とを照合し、現在の利用者に最も
近い登録利用者からN番目(Nは正の整数)までの候補
を画像信頼度評価装置809に入力する。画像信頼度評
価装置809では信頼度に応じて照合候補数Nを求め、
選択されたN個の候補を登録者音声特徴蓄積装置805
に出力する。すなわち信頼度が高いときには少ない照合
候補を、信頼度が低いときには多くの照合候補を登録者
音声特徴蓄積装置805に出力する。登録者音声特徴蓄
積装置805では照合すべき音声候補を限定する。
【0057】画像信頼度評価装置809での信頼度Gの
評価は具体的には、G=1−Gmin /Gmin2で定義して
おり、Gmin は入力画像と最も良く照合した蓄積画像と
の距離であり、Gmin2は次に良く照合した蓄積画像との
照合結果である距離である。本実施の形態の照合距離
は、照合する画像間の対応する画素間の輝度の差を使っ
て求めている。信頼度Gが1に近いほど入力画像と蓄積
画像との一致度が高く信頼度が高いため、登録者音声特
徴蓄積装置805に出力される候補数は少なくてよい。
【0058】一方、音声入力装置801から入力された
現在の利用者の音声は音声特徴抽出装置803−1,8
03−2に入力されて、利用者の音声に含まれる個人性
情報が抽出される。音声特徴抽出装置803−1では、
音声のピッチの平均値、ピッチの標準偏差、平均音声パ
ワーとその標準偏差の個人性情報の大局的な特徴量を求
める。音声特徴抽出装置803−2では、音声パワース
ペクトラムの時系列情報等を求める。これらの特徴量は
公知の手法(例えばDFT分析、LPC分析、フィルタ
分析等)を用いて容易に求めることが可能である。音声
特徴抽出装置803−1,803−2で求められた音声
の特徴量は登録者音声特徴蓄積装置805の情報と音声
照合装置806で照合される。ここで照合に用いられる
蓄積音声は、画像信頼度評価装置809から画像信頼度
に応じて出力されたN個の利用者の音声候補と、音声特
徴抽出装置803−1で求めた大局的な音声特徴量で限
定されたデータを用いている。音声照合装置806での
特徴量の照合は公知のHMM、DTW、LVQなどのパ
ターン照合手法を用いて行うことができる。これらの照
合の結果、現時点で入力された音声が予め蓄積されてい
る音声データとどれくらい似ているかが音声信頼度評価
装置810で評価される。本実施の形態では、音声信頼
度評価装置810での信頼度Sの評価は具体的には、S
=1−Smin/Smin2で定義しており、Smin は入力音
声と最も良く照合した蓄積音声との距離であり、Smin2
は次に良く照合した蓄積音声との距離である。信頼度S
が1に近いほど入力音声と蓄積音声との一致度が高く信
頼度が高いことになる。
【0059】信頼度評価装置811では音声信頼度評価
装置810で求めた信頼度Sと画像信頼度評価装置80
9で求めた信頼度Gに基づいて判定を行う。ここでの判
定は、信頼度S,Gに基づいて予め設定している図9に
示したような判定基準に基づいて行っている。音声信頼
度評価装置810と画像信頼度評価装置809で求めた
信頼度S,Gがそれぞれ予め設定した値よりも高く図9
で網点を施した領域に入ったときに登録された利用者で
あるとして、情報処理装置800の利用を許可する。こ
の判定基準作成は音声信頼度評価装置810と画像信頼
度評価装置809で収集した信頼度からテーブルとして
作成することができるほか、公知のニューラルネットワ
ークやファジー等の手法を用いて容易に行うことができ
る。
【0060】以上のように本実施の形態によれば、入力
された画像と音声を用いて利用者を判定すると同時に、
音声と画像の信頼度を考慮することでより信頼度の高い
確実な利用者照合判定を行うことができる。なお、音声
で判定した利用者と画像で判定した利用者が一致しては
いるが、信頼度が低い場合には、現在の利用者にキーボ
ードからパスワードを入力させることによって情報処理
装置800の利用を許可することもできる。
【0061】(実施の形態9)以下、本発明の実施の形
態9について図面を参照して説明する。
【0062】図10は本発明の実施の形態9における利
用者照合装置の構成図を示すものである。図10におい
て、1000は情報処理装置、1001は情報処理装置
1000に現在の利用者の音声を入力するための音声入
力装置、1002は情報処理装置1000に現在の利用
者の顔画像を入力するための画像入力装置、1003−
1は音声入力装置1001で入力された現在の利用者の
音声の平均的なピッチ等の大局的な特徴量を取り出すた
めの音声特徴抽出装置、1003−2は音声入力装置1
001で入力された現在の利用者の音声のスペクトル特
徴を反映する特徴量を取り出すための音声特徴抽出装
置、1004は画像入力装置1002で入力された現在
の利用者の顔画像の特徴量を取り出すための画像特徴抽
出装置、1005は予め登録されている利用者の音声の
特徴量を蓄積している登録者音声特徴蓄積装置、100
6は音声特徴抽出装置1003で取り出された現在の利
用者の音声の特徴量と予め登録されている利用者の音声
の特徴量を照合するための音声照合装置、1007は予
め登録されている利用者の画像の特徴量を蓄積している
登録者画像特徴蓄積装置、1008は画像特徴抽出装置
1004で取り出された現在の利用者の画像の特徴量と
予め登録されている利用者の画像の特徴量を照合するた
めの画像照合装置、1009は画像照合装置1008で
照合した結果の信頼度Gを求めるための画像信頼度評価
装置、1010は音声照合装置1006で照合した結果
の信頼度Sを求めるための音声信頼度評価装置、101
1は画像信頼度評価装置1009で求められた画像から
評価した現在の利用者が登録利用者であることを判断す
るための信頼度Gと音声信頼度評価装置1010で求め
られた音声から評価した現在の利用者が登録利用者であ
ることを判断するための信頼度Sを総合して現在の利用
者が情報処理装置1000を利用することを許可するか
否かを判断するための信頼度評価装置である。音声特徴
抽出装置1003−1による大局的な音声の特徴量に基
づいて登録者音声特徴蓄積装置1005での音声候補を
限定するように構成されている。また、画像信頼度評価
装置1009によって得た信頼度Gに基づいて登録者音
声特徴蓄積装置1005でN個の音声候補を限定するよ
うに構成されている。
【0063】以上のように構成された実施の形態9の利
用者照合装置について、以下にその動作を説明する。情
報処理装置1000の現在の利用者は利用に先立ち利用
者の音声と顔画像を入力する。画像入力装置1002に
よって入力された現在の利用者の画像は、画像特徴抽出
装置1004に入力され利用者の画像に含まれる個人性
情報が抽出される。画像の個人性情報としては、顔画像
の輝度情報、輝度情報の位置微分情報、顔画像の色情報
を用いる。画像照合装置1008では登録者画像特徴蓄
積装置1007に蓄積されている画像特徴量と特徴抽出
装置1004からの画像特徴量とを照合し、現在の利用
者に最も近い登録利用者からN番目(Nは正の整数)ま
での候補を画像信頼度評価装置1009に入力する。画
像信頼度評価装置1009では信頼度の最も高い候補の
信頼度に応じて、N個の候補を求め、その候補情報を登
録者音声特徴蓄積装置1005に出力する。すなわち、
類似度が高いときには少ない候補を、類似度が低いとき
には多くの候補を登録者音声特徴蓄積装置1005に出
力する。画像信頼度評価装置1009での信頼度Gの評
価は具体的には、G=1−Gmin /Gmin2で定義してお
り、Gmin は入力画像と最も良く照合した蓄積画像との
照合結果の距離であり、Gmin2は次に良く照合した蓄積
画像との距離である。本実施の形態の照合距離は、照合
する画像間の対応する面素間の輝度の差を使って求めて
いる。信頼度Gが1に近いほど入力画像と蓄積画像との
一致度が高く信頼度が高いことになる。本実施の形態で
はここで求めた画像信頼度Gが予め設定した値よりも高
かったときには、現在の利用者が登録されている利用者
であると認め、情報処理装置1000の利用を許可す
る。
【0064】一方、画像信頼度Gが予め設定した値より
も低かったときには音声を用いた照合を行うために以下
の処理を行う。音声入力装置1001より入力された現
在の利用者の音声は音声特徴抽出装置1003−1,1
003−2に入力されて、利用者の音声に含まれる個人
性情報を抽出する。音声特徴抽出装置1003−1で
は、音声のピッチの平均値、ピッチの標準偏差、平均音
声パワーとその標準偏差の個人性情報の大局的な特徴量
を求める。音声特徴抽出装置1003−2では、音声パ
ワースペクトラムの時系列情報等を求める。これらの特
徴量は公知の手法(例えばDFT分析、LPC分析、フ
ィルタ分析等)を用いて容易に求めることが可能であ
る。音声特徴抽出装置1003−1,1003−2で求
められた音声の特徴量は登録者音声特徴蓄積装置100
5の特徴量と音声照合装置1006で照合される。ここ
で照合に用いられる蓄積音声は、画像信頼度評価装置1
009から画像信頼度Gに応じて出力されたN個の利用
者の候補と、音声特徴抽出装置1003−1で求めた大
局的な音声特徴量で限定されたデータを用いている。音
声照合装置1006での特徴量の照合は公知のHMM、
DTW、LVQなどのパターン照合手法を用いて行うこ
とができる。これらの照合の結果、現時点で入力された
音声が予め蓄積されている音声データとどれくらい似て
いるかが音声信頼度評価装置1010で評価される。本
実施の形態では、音声信頼度評価装置1010での信頼
度Sの評価は具体的には、S=1−Smin /Smin2で定
義しており、Smin は入力音声と最も良く照合した蓄積
音声との距離であり、Smin2は次に良く照合した蓄積音
声との距離である。信頼度Sが1に近いほど入力音声と
蓄積音声との一致度が高く信頼度が高いことになる。
【0065】信頼度評価装置1011では画像信頼度評
価装置1009で求めた画像信頼度Gと音声信頼度評価
装置1010で求めた音声信頼度Sがともに予め設定し
た基準値よりも高く、かつ音声で判定した利用者と画像
で判定した利用者が一致したときにのみ現在の利用者が
登録された利用者であるとして、情報処理装置1000
の利用を許可する。
【0066】以上のように本実施の形態によれば、まず
画像を用いて利用者を照合し、そのときの画像信頼度が
設定値よりも高かった場合には音声を使った照合は行わ
ずに情報処理装置1000の利用を許可し、画像信頼度
が設定値よりも低かった場合には音声を用いた照合も行
うことで、より効率的で確かな利用者照合判定を行うこ
とができる。
【0067】
【発明の効果】以上説明したように、本発明によれば、
利用者に特有な音声と顔画像の情報を用いて利用者の照
合を行うことによって情報処理装置の利用者を確実に制
限することができ、従来のパスワード(暗唱番号)をキ
ーボードから入力するだけでは避けることのできない情
報処理装置の不正利用を防ぐことができ、その実用的価
値には大なるものがある。
【図面の簡単な説明】
【図1】本発明の実施の形態1における利用者照合装置
の構成図である。
【図2】本発明の実施の形態2における利用者照合装置
の構成図である。
【図3】本発明の実施の形態3における利用者照合装置
の構成図である。
【図4】本発明の実施の形態4における利用者照合装置
の構成図である。
【図5】本発明の実施の形態5における利用者照合装置
の構成図である。
【図6】本発明の実施の形態6における利用者照合装置
の構成図である。
【図7】本発明の実施の形態7における利用者照合装置
の構成図である。
【図8】本発明の実施の形態8における利用者照合装置
の構成図である。
【図9】本発明の実施の形態8における信頼度評価装置
の説明図である。
【図10】本発明の実施の形態9における利用者照合装
置の構成図である。
【図11】従来の利用者照合装置の構成図である。
【符号の説明】
100,200,300,400,500,600,7
00,800,1000……情報処理装置 101,201,301,401,501,601,7
01,801,1001……音声入力装置 102,202,302,402,502,602,7
02,802,1002……画像入力装置 103,203−1,203−2,303−1,303
−2,403−1,403−2,503−1,503−
2,603−1,603−2,703−1,703−
2,803−1,803−2,1003−1,1003
−2……音声特徴抽出装置 104,204,304,404−1,404−2,5
04−1,504−2,604−1,604−2,70
4,804,1004……画像特徴抽出装置 105,205,305,405,505,605,7
05,805,1005……登録者音声特徴蓄積装置 106,206,306,406,506,606,7
06,806,1006……音声照合装置 107,207,307,407,507,607,7
07,807,1007……登録者画像特徴蓄積装置 108,208,308,408,508,608,7
08,808,1008……画像照合装置 109,209,309,409,509,609……
一致判定装置 709,809,1009……画像信頼度評価装置 710,810,1010……音声信頼度評価装置 711,811,1011……信頼度評価装置

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 情報処理装置の利用許可された利用者の
    画像の特徴量と音声の特徴量を蓄積しておき、入力した
    現在の利用者の画像の特徴量を蓄積されている画像の特
    徴量と照合するとともに、入力した現在の利用者の音声
    の特徴量を蓄積されている音声の特徴量と照合し、画像
    による照合結果と音声による照合結果とが一致したとき
    に現在の利用者が登録されている利用者であると判断す
    るように構成してあることを特徴とする利用者照合装
    置。
  2. 【請求項2】 登録利用者の音声を蓄積する手段と、登
    録利用者の画像を蓄積する手段と、現在の利用者の画像
    を入力する手段と、前記入力画像から利用者の個人性を
    反映する画像特徴量を抽出する手段と、現在の利用者の
    音声を入力する手段と、前記入力音声から利用者の個人
    性を反映する音声特徴量を抽出する手段と、前記入力画
    像に含まれる画像特徴量を予め蓄積してある画像特徴量
    と照合する手段と、前記画像照合結果により前記蓄積手
    段に蓄積してある利用者を照合するために用いる音声の
    候補を限定する手段と、前記限定された音声候補の特徴
    量と入力された音声の特徴量とを照合する手段と、前記
    画像による照合結果と前記音声による照合結果が一致し
    たときに現在の利用者が登録利用者であると判断する手
    段を備えたことを特徴とする利用者照合装置。
  3. 【請求項3】 登録利用者の音声を蓄積する手段と、登
    録利用者の画像を蓄積する手段と、現在の利用者の画像
    を入力する手段と、前記入力画像から利用者の個人性を
    反映する画像特徴量を抽出する手段と、現在の利用者の
    音声を入力する手段と、前記入力音声から利用者の個人
    性を反映する音声特徴量を抽出する手段と、前記入力画
    像に含まれる画像特徴量を予め蓄積してある画像特徴量
    と照合する手段と、前記画像照合結果と入力された利用
    者の個人性を反映する音声特徴量の一部を用いて前記蓄
    積手段に蓄積してある利用者を照合するために用いる音
    声候補を限定する手段と、前記限定された音声候補の特
    徴量と入力された音声の特徴量とを照合する手段と、前
    記画像による照合結果と前記音声による照合結果が一致
    したときに現在の利用者が登録利用者であると判断する
    手段を備えたことを特徴とする利用者照合装置。
  4. 【請求項4】 登録利用者の音声を蓄積する手段と、登
    録利用者の画像を蓄積する手段と、現在の利用者の画像
    を入力する手段と、前記入力画像から利用者の個人性を
    反映する画像特徴量を抽出する手段と、現在の利用者の
    音声を入力する手段と、前記入力音声から利用者の個人
    性を反映する音声特徴量を抽出する手段と、前記入力音
    声に含まれる音声特徴量を予め蓄積してある音声特徴量
    と照合する手段と、前記音声照合結果により前記蓄積し
    てある利用者の照合に用いる画像候補を限定する手段
    と、前記限定された画像候補の特徴量と入力された画像
    特徴量とを照合する手段と、前記画像による照合結果と
    前記音声による照合結果が一致したときに現在の利用者
    が登録利用者であると判断する手段を備えたことを特徴
    とする利用者照合装置。
  5. 【請求項5】 登録利用者の音声を蓄積する手段と、登
    録利用者の画像を蓄積する手段と、現在の利用者の画像
    を入力する手段と、前記入力画像から利用者の個人性を
    反映する画像特徴量を抽出する手段と、現在の利用者の
    音声を入力する手段と、前記入力音声から利用者の個人
    性を反映する音声特徴量を抽出する手段と、入力された
    利用者の個人性を反映する音声特徴量の一部を用いて前
    記蓄積手段に蓄積してある利用者を照合するために用い
    る音声候補を限定する手段と、前記限定された音声候補
    の特徴量と入力された音声の特徴量とを照合する手段
    と、入力された利用者の個人性を反映する画像特徴量の
    一部を用いて前記蓄積手段に蓄積してある利用者を照合
    するために用いる画像候補を限定する手段と、前記限定
    された画像候補の特徴量と入力された画像の特徴量とを
    照合する手段と、前記画像による照合結果と前記音声に
    よる照合結果が一致したときに現在の利用者が登録利用
    者であると判断する手段を備えたことを特徴とする利用
    者照合装置。
  6. 【請求項6】 登録利用者の音声を蓄積する手段と、登
    録利用者の画像を蓄積する手段と、現在の利用者の画像
    を入力する手段と、前記入力画像から利用者の個人性を
    反映する画像特徴量を抽出する手段と、現在の利用者の
    音声を入力する手段と、前記入力音声から利用者の個人
    性を反映する音声特徴量を抽出する手段と、入力された
    利用者の個人性を反映する音声特徴量の一部を用いて前
    記蓄積手段に蓄積してある利用者を照合するために用い
    る音声候補を限定する手段と、前記限定された音声候補
    の特徴量と入力された音声の特徴量とを照合する手段
    と、入力された利用者の個人性を反映する画像特徴量の
    一部を用いて前記蓄積手段に蓄積してある利用者を照合
    するために用いる画像候補を限定する手段と、前記音声
    照合結果により同様に蓄積してある利用者を照合するた
    めに用いる画像候補を限定する手段と、前記限定された
    画像候補の特徴量と入力された画像の特徴量とを照合す
    る手段と、前記音声による照合結果と前記画像による照
    合結果が一致したときに現在の利用者が登録利用者であ
    ると判断する手段を備えたことを特徴とする利用者照合
    装置。
  7. 【請求項7】 登録利用者の音声を蓄積する手段と、登
    録利用者の画像を蓄積する手段と、現在の利用者の画像
    を入力する手段と、前記入力画像から利用者の個人性を
    反映する画像特徴量を抽出する手段と、現在の利用者の
    音声を入力する手段と、前記入力音声から利用者の個人
    性を反映する音声特徴量を抽出する手段と、入力された
    利用者の個人性を反映する画像特徴量の一部を用いて前
    記蓄積手段に蓄積してある利用者を照合するために用い
    る画像候補を限定する手段と、前記限定された画像候補
    の特徴量と入力された画像の特徴量とを照合する手段
    と、入力された利用者の個人性を反映する音声特徴量の
    一部を用いて前記蓄積手段に蓄積してある利用者を照合
    するために用いる音声候補を限定する手段と、前記画像
    照合結果により同様に蓄積してある利用者を照合するた
    めに用いる音声候補を限定する手段と、前記限定された
    音声候補の特徴量と入力された音声の特徴量とを照合す
    る手段と、前記画像による照合結果と前記音声による照
    合結果が一致したときに現在の利用者が登録利用者であ
    ると判断する手段を備えたことを特徴とする利用者照合
    装置。
  8. 【請求項8】 登録利用者の音声を蓄積する手段と、登
    録利用者の画像を蓄積する手段と、現在の利用者の画像
    を入力する手段と、前記入力画像から利用者の個人性を
    反映する画像特徴量を抽出する手段と、現在の利用者の
    音声を入力する手段と、前記入力音声から利用者の個人
    性を反映する音声特徴量を抽出する手段と、前記入力音
    声に含まれる音声特徴量を予め蓄積してある音声特徴量
    と照合する手段と、前記入力音声から現在の利用者を照
    合したときの音声信頼度を求める手段と、前記音声照合
    結果により前記蓄積してある利用者の照合に用いる画像
    を限定する手段と、前記限定された画像特徴量と入力さ
    れた画像特徴量とを照合する手段と、前記画像照合結果
    から現在の利用者を照合したときの画像信頼度を求める
    手段と、前記音声からの信頼度と前記画像からの信頼度
    の各々が予め設定した値よりも高いときに現在の利用者
    が登録利用者であると判断する手段を備えたことを特徴
    とする利用者照合装置。
  9. 【請求項9】 登録利用者の音声を蓄積する手段と、登
    録利用者の画像を蓄積する手段と、現在の利用者の音声
    を入力する手段と、前記入力音声から利用者の個人性を
    反映する音声特徴量を抽出する手段と、現在の利用者の
    画像を入力する手段と、前記入力画像から利用者の個人
    性を反映する画像特徴量を抽出する手段と、前記入力し
    た画像特徴量と予め蓄積してある画像特徴量とを照合す
    る手段と、前記画像照合結果の信頼度を求める手段と、
    前記画像照合結果と信頼度に基づき音声照合に用いるた
    めの登録利用者の数と候補を限定する手段と、前記限定
    された利用者の音声特徴量と入力された音声特徴量とを
    照合する手段と、前記音声照合結果の信頼度を求める手
    段と、前記画像から求めた信頼度と前記音声から求めた
    信頼度の各々が予め設定した値よりも高いときに現在の
    利用者が登録利用者であると判断する手段を備えたこと
    を特徴とする利用者照合装置。
  10. 【請求項10】 登録利用者の音声を蓄積する手段と、
    登録利用者の画像を蓄積する手段と、現在の利用者の画
    像を入力する手段と、現在の利用者の音声を入力する手
    段と、前記入力画像から利用者の個人性を反映する画像
    特徴量を抽出する手段と、前記入力した画像特徴量と予
    め蓄積してある画像特徴量とを照合する手段と、前記画
    像照合結果の信頼度を求める手段と、前記画像照合結果
    と信頼度に基づき音声照合に用いるための登録利用者の
    候補を限定する手段と、前記画像信頼度が予め設定した
    基準値より高かったときに現在の利用者が登録利用者で
    あると判断する手段と、前記画像信頼度が予め設定した
    基準値よりも低かったときに前記音声入力手段から音声
    を入力する手段と、前記入力音声から利用者の個人性を
    反映する音声特徴量を抽出する手段と、前記画像照合結
    果と前記音声の個人性情報を用いて限定された音声特徴
    量と入力された音声特徴量とを照合する手段と、前記音
    声照合結果の信頼度を求める手段と、前記音声の信頼度
    と前記画像の信頼度の各々が予め設定した値よりも高か
    ったときに現在の利用者が登録利用者であると判断する
    手段を備えたことを特徴とする利用者照合装置。
  11. 【請求項11】 利用者の音声特徴量を抽出する手段
    が、利用者の音声のピッチの平均値を求める手段と、ピ
    ッチの標準偏差を求める手段と、平均音声パワーを求め
    る手段と、平均音声パワーの標準偏差を求める手段と、
    音声パワースベクトラムの時系列情報を求める手段とか
    らなる請求項1から請求項10までのいずれかに記載の
    利用者照合装置。
  12. 【請求項12】 利用者の画像特徴量を抽出する手段
    が、利用者の顔画像の輝度情報を求める手段と、輝度情
    報の位置微分情報を求める手段と、利用者の顔画像の輪
    郭情報を求める手段と、利用者の顔画像の色情報を求め
    る手段と、前記画像の輝度情報、輝度情報の位置微分情
    報、輪郭情報、色情報の重みづけを行う手段とからなる
    請求項1から請求項10までのいずれかに記載の利用者
    照合装置。
  13. 【請求項13】 利用者の画像特徴量を抽出する手段
    が、画像から利用者の身長を推定する手段と、利用者の
    顔画像の色情報を求める手段と、前記顔画像の輝度情
    報、輝度情報の位置微分情報、輪郭情報とからなる請求
    項1から請求項10までのいずれかに記載の利用者照合
    装置。
JP7317942A 1995-12-06 1995-12-06 利用者照合装置 Pending JPH09160589A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7317942A JPH09160589A (ja) 1995-12-06 1995-12-06 利用者照合装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7317942A JPH09160589A (ja) 1995-12-06 1995-12-06 利用者照合装置

Publications (1)

Publication Number Publication Date
JPH09160589A true JPH09160589A (ja) 1997-06-20

Family

ID=18093745

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7317942A Pending JPH09160589A (ja) 1995-12-06 1995-12-06 利用者照合装置

Country Status (1)

Country Link
JP (1) JPH09160589A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002221992A (ja) * 2001-01-29 2002-08-09 Nec Corp 人物特定システム
JP2005312748A (ja) * 2004-04-30 2005-11-10 Sony Corp 識別装置及び識別方法並びに認証システム
US6980669B1 (en) 1999-12-08 2005-12-27 Nec Corporation User authentication apparatus which uses biometrics and user authentication method for use with user authentication apparatus
JP2006202208A (ja) * 2005-01-24 2006-08-03 Toshiba Corp 生体認証装置、生体認証方法および通行制御装置
WO2007114346A1 (ja) * 2006-03-30 2007-10-11 Honda Moter Co., Ltd. 音声認識装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6980669B1 (en) 1999-12-08 2005-12-27 Nec Corporation User authentication apparatus which uses biometrics and user authentication method for use with user authentication apparatus
JP2002221992A (ja) * 2001-01-29 2002-08-09 Nec Corp 人物特定システム
JP4622106B2 (ja) * 2001-01-29 2011-02-02 日本電気株式会社 人物特定システム
JP2005312748A (ja) * 2004-04-30 2005-11-10 Sony Corp 識別装置及び識別方法並びに認証システム
JP4636306B2 (ja) * 2004-04-30 2011-02-23 ソニー株式会社 識別装置及び識別方法並びに認証システム
JP2006202208A (ja) * 2005-01-24 2006-08-03 Toshiba Corp 生体認証装置、生体認証方法および通行制御装置
WO2007114346A1 (ja) * 2006-03-30 2007-10-11 Honda Moter Co., Ltd. 音声認識装置

Similar Documents

Publication Publication Date Title
CA2549092C (en) System and method for providing improved claimant authentication
US6580814B1 (en) System and method for compressing biometric models
Bigun et al. Multimodal biometric authentication using quality signals in mobile communications
US9792912B2 (en) Method for verifying the identity of a speaker, system therefore and computer readable medium
US6107935A (en) Systems and methods for access filtering employing relaxed recognition constraints
US7447632B2 (en) Voice authentication system
CN107958669B (zh) 一种声纹识别的方法及装置
JP3439359B2 (ja) 個人識別方法、個人識別装置および記録媒体
CN107404381A (zh) 一种身份认证方法和装置
US20070038460A1 (en) Method and system to improve speaker verification accuracy by detecting repeat imposters
US20070219792A1 (en) Method and system for user authentication based on speech recognition and knowledge questions
CN107221333A (zh) 一种身份认证的方法和装置
CN110379433B (zh) 身份验证的方法、装置、计算机设备及存储介质
GB2229305A (en) Identity verification
CN109448732B (zh) 一种数字串语音处理方法及装置
CN112417412A (zh) 一种银行账户余额查询方法、装置及系统
JP2001514768A (ja) 話者証明システム
CN111242769A (zh) 身份验证方法、装置、设备及计算机可读存储介质
JPH09160589A (ja) 利用者照合装置
JP2000215316A (ja) 生体情報認識装置およびその方法
JP3829355B2 (ja) 利用者照合装置
JP3849841B2 (ja) 話者認識装置
US7162641B1 (en) Weight based background discriminant functions in authentication systems
JP4440414B2 (ja) 話者照合装置及び方法
JPH10261083A (ja) 個人同定装置及び個人同定方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040806

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050809