JP5704013B2

JP5704013B2 - ユーザ認証方法、ユーザ認証装置、およびプログラム

Info

Publication number: JP5704013B2
Application number: JP2011168897A
Authority: JP
Inventors: 功誠山下
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2011-08-02
Filing date: 2011-08-02
Publication date: 2015-04-22
Anticipated expiration: 2031-08-02
Also published as: CN102915734A; US11100207B2; US9147053B2; US20130036452A1; US10445480B2; US20200004944A1; JP2013033368A; US20150347735A1

Description

本開示は、ユーザ認証方法、ユーザ認証装置、およびプログラムに関する。

生体認証は、パスワードや磁気カードなどの代わりにユーザの生体情報を用いるユーザ認証方法である。生体認証の例としては、特許文献１に記載されているような静脈認証および指紋認証や、特許文献２に記載されているような虹彩認証が知られている。

このような生体認証は、忘却や紛失などによってユーザ本人が認証されなくなったり、情報の漏洩や盗難などによって第三者がユーザになりすまして不正に認証されたりする可能性が低いユーザ認証方法として、近年普及している。

特開２００８−１６５７４２号公報特開２００１−３４７５４号公報

特許文献１，２に記載された静脈認証、指紋認証および虹彩認証などの生体認証では、静脈パターンや指紋、虹彩パターンを予めテンプレートとして取得し、保持する。このように、ユーザ個人の身体的形状をデータとして収集することに対しては、指紋の採取に代表されるように、ユーザが心理的な抵抗感を感じる場合がある。

また、生体情報といえども、例えばユーザが第三者と共謀したような場合など、複製される可能性はゼロではない。また、何らかの原因で予め取得されたテンプレートの情報が流出すると、テンプレートが複製されることによって安全性が大きく低下する可能性がある。

そこで、本開示では、より効果的な生体認証を実現することが可能な、新規かつ改良されたユーザ認証方法、ユーザ認証装置、およびプログラムを提案する。

本開示によれば、ユーザの頭部伝達関数を用いて上記ユーザの周りの空間の第１の位置にある音源を仮想的に定位させた音データを上記ユーザに向けて再生すること、上記再生された音データを聴取した上記ユーザが上記音源の位置として推定した、上記ユーザの周りの空間の第２の位置を取得すること、および上記第１の位置と上記第２の位置との符合によって上記ユーザを認証することを含むユーザ認証方法が提供される。

また、本開示によれば、ユーザの頭部伝達関数を用いて上記ユーザの周りの空間の第１の位置にある音源を仮想的に定位させた音データを上記ユーザに向けて再生する再生部、上記再生された音データを聴取した上記ユーザが上記音源の位置として推定した、上記ユーザの周りの空間の第２の位置を取得する回答取得部、および上記第１の位置と上記第２の位置との符合によって上記ユーザを認証する認証部を備えるユーザ認証装置が提供される。

さらに、本開示によれば、ユーザの頭部伝達関数を用いて上記ユーザの周りの空間の第１の位置にある音源を仮想的に定位させた音データを上記ユーザに向けて再生する機能、上記再生された音データを聴取した上記ユーザが上記音源の位置として推定した、上記ユーザの周りの空間の第２の位置を取得する機能、および上記第１の位置と上記第２の位置との符合によって上記ユーザを認証する機能をコンピュータに実現させるためのプログラムが提供される。

本開示によれば、テンプレートとしてユーザ個人の直接的な身体的形状表現ではない頭部伝達関数が用いられるため、ユーザの心理的抵抗感が比較的少ない。また、頭部伝達関数による音源の位置の推定はユーザ固有の能力であるため、テンプレートの頭部伝達関数の複製または流出が発生しても安全性が低下しにくい。

以上説明したように本開示によれば、より効果的な生体認証を実現することができる。

立体音響空間における音源について説明するための図である。立体音響空間における頭部伝達関数について説明するための図である。仮想的な音源の再生について説明するための図である。仮想的な音源を再生するための装置構成の例を示す図である。頭部伝達関数を利用したユーザ認証の一例を概念的に示す図である。頭部伝達関数を利用したユーザ認証の別の例を概念的に示す図である。本開示の第１の実施形態においてユーザ認証に用いられる装置の構成を示す図である。本開示の第１の実施形態に係るユーザ認証装置の機能構成を示すブロック図である。本開示の第１の実施形態におけるユーザＩＤおよび回答の入力装置の例について説明するための図である。本開示の第１の実施形態における回答ボタンの水平方向の配置について説明するための図である。本開示の第１の実施形態における回答ボタンの上下方向の配置について説明するための図である。本開示の第１の実施形態におけるユーザ認証処理のステップを示すフローチャートである。図１２に示した処理の変形例のステップを示すフローチャートである。本開示の第２の実施形態においてユーザ認証に用いられる装置の構成を示す図である。本開示の第３の実施形態においてユーザ認証に用いられる装置の構成を示す図である。本開示の第３の実施形態におけるユーザＩＤおよび回答の入力画面の例を示す図である。本開示の第４の実施形態においてユーザ認証に用いられる装置の構成を示す図である。情報処理装置のハードウェア構成を説明するためのブロック図である。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

なお、説明は以下の順序で行うものとする。
１．頭部伝達関数を利用したユーザ認証の基本的なアイデア
２．本開示の実施形態
２−１．第１の実施形態（バイノーラル再生の例）
２−２．第２の実施形態（トランスオーラル再生の例）
２−３．第３の実施形態（端末装置を回答に用いる例）
２−４．第４の実施形態（端末装置のユーザを認証する例）
３．補足

（１．頭部伝達関数を利用したユーザ認証の基本的なアイデア）
以下で説明する本開示の実施形態では、頭部伝達関数を利用してユーザが認証される。まず、この頭部伝達関数を利用したユーザ認証の基本的なアイデアについて、図１〜６を参照して説明する。

（頭部伝達関数について）
図１は、立体音響空間における音源について説明するための図である。

立体音響空間Ｒは、聴取者であるユーザＵの周りの空間であり、音源Ｓが存在する。以下の説明では、音源Ｓの位置を、ユーザＵの位置を原点とする極座標系において、動径ｒ、偏角θ，φを用いて表現する。ユーザＵの位置は、正確には、ユーザＵの左右の耳を結ぶ線分の中点でありうる。動径ｒは、この点から音源Ｓの位置までの距離である。また、偏角θは、水平面内で、ユーザＵの正面の方向と音源Ｓの方向とがなす角である。偏角φは、垂直面内で、ユーザＵの位置を含む水平面と音源Ｓの方向とがなす角である。

図２は、立体音響空間における頭部伝達関数について説明するための図である。

ここで、ユーザＵの鼓膜に到達する音波（以下、聴取音ともいう）では、ユーザＵの頭部や耳での反射および回折のために、音源Ｓから放射される音波（以下、原音ともいう）の特定の周波数成分が強調されたり減衰したりする。ユーザＵの左耳と右耳とでは、原音が反射したり回折したりする過程が異なるため、聴取音の周波数成分が異なりうる。また、ユーザＵの左耳と右耳とでは、音源Ｓからの距離が異なるため、聴取音の位相も異なりうる。

このときの原音から聴取音への変化を伝達関数として表現したものが、頭部伝達関数ＨＲＴＦ（Head-Related Transfer Function）である。ＨＲＴＦは、特に、ユーザＵの頭部の形状、耳介の形状、外耳道形状、および皮膚の音響インピーダンスなどに強く依存する。すなわち、ＨＲＴＦは、それぞれのユーザによって異なる関数である。また、ＨＲＴＦは、立体音響空間Ｒにおける音源Ｓの位置によっても異なる。

図では、音源Ｓからの音波が、頭部伝達関数ＨＲＴＦ＿Ｌで変化してユーザＵの左耳の鼓膜に到達し、頭部伝達関数ＨＲＴＦ＿Ｒで変化してユーザＵの右耳の鼓膜に到達することが示されている。上記のように、ＨＲＴＦはそれぞれのユーザに固有であり、また音源Ｓの位置によって異なる。従って、ＨＲＴＦ＿ＬおよびＨＲＴＦ＿Ｒは、それぞれユーザＵ、音源Ｓの位置を示す動径ｒおよび偏角θ，φに依存する関数として、ＨＲＴＦ＿Ｌ（Ｕ，ｒ，θ，φ）、およびＨＲＴＦ＿Ｒ（Ｕ，ｒ，θ，φ）と表せる。

ユーザＵの感覚中枢である脳は、音源Ｓの位置（ｒ，θ，φ）と頭部伝達関数ＨＲＴＦとの関係を、経験則として認識している。これによって、ユーザＵは、ＨＲＴＦ＿Ｌ（Ｕ，ｒ，θ，φ）およびＨＲＴＦ＿Ｒ（Ｕ，ｒ，θ，φ）で変化した聴取音によって、音源Ｓの位置（ｒ，θ，φ）を認識することができる。

ＨＲＴＦは、原音と聴取音との間の伝達特性を周波数領域において表現したものである。このＨＲＴＦを離散フーリエ逆変換すると、頭部インパルスレスポンスＨＲＩＲ（Head-Related Impulse Response）が得られる。ＨＲＩＲは、原音と聴取音との間の伝達特性を時間領域において表現したものであり、広義には頭部伝達関数に含まれる。ＨＲＩＲも、ＨＲＴＦと同様に、左耳と右耳とで異なり、ユーザＵ、音源Ｓの位置を示す動径ｒおよび偏角θ，φに依存する関数として、ＨＲＩＲ＿Ｌ（Ｕ，ｒ，θ，φ）およびＨＲＩＲ＿Ｒ（Ｕ，ｒ，θ，φ）と表せる。

図３は、仮想的な音源の再生について説明するための図である。

立体音響空間Ｖは、聴取者であるユーザＵの周りの空間として認識される仮想的な空間である。原音Ｘに、測定された頭部インパルスレスポンスＨＲＩＲ＿Ｌ（Ｕ，ｒ，θ，φ），ＨＲＩＲ＿Ｒ（Ｕ，ｒ，θ，φ）を畳み込み積分すると、原音Ｘは、現実の立体音響空間Ｒで位置（ｒ，θ，φ）にある音源Ｓから放射されてユーザＵの鼓膜に到達する聴取音と同様に変化する。そのため、畳み込み積分後の音波をユーザＵの鼓膜の近傍から放射すると、ユーザは仮想的な立体音響空間Ｖにおいて位置（ｒ，θ，φ）に位置する音源を知覚する。これは一種の錯聴ともいえる。この場合、ユーザの左耳への出力信号Ｙ_Ｌと、右耳への出力信号Ｙ_Ｒとは、それぞれ以下の式１，２のように表せる。なお、“＊”は、畳み込み積分演算を示す。

Ｙ_Ｌ＝Ｘ＊ＨＲＩＲ＿Ｌ（Ｕ，ｒ，θ，φ）・・・（式１）
Ｙ_Ｒ＝Ｘ＊ＨＲＩＲ＿Ｒ（Ｕ，ｒ，θ，φ）・・・（式２）

ユーザＵのＨＲＩＲは、実際の音響空間Ｒで、音源Ｓとしてインパルス信号やＴＳＰ（Time Stretched Pulse）信号などを再生し、ユーザＵの左耳および右耳に装着したマイクロホンで聴取音を収音することによって周波数領域のＨＲＴＦ＿ＬおよびＨＲＴＦ＿Ｒを測定し、これを離散フーリエ逆変換することによって求められる。また、測定されたインパルス応答信号から時間領域で直接的に求めることも可能である。

上述のように、ＨＲＩＲは音源Ｓの位置を示す動径ｒおよび偏角θ，φに依存するため、音源Ｓが位置する可能性があるそれぞれの位置で測定されることが望ましい。例えば、音源Ｓまでの動径ｒを１ｍなどの所定の距離に固定し、偏角θまたは偏角φを１度ごとに変化させながら、すべての偏角θ，φの組み合わせにおけるＨＲＩＲを測定することが考えられる。聴覚によって認識される方位角の最小分解能は、方向にもよるが概ね１度程度であるため、偏角θ，φを１度ずつ変化させたメッシュ上の観測点におけるＨＲＩＲを測定することによって、立体音響空間ＶにおいてユーザＵからの距離がｒの任意の位置にある仮想的な音源を再生することができる。

なお、ユーザＵの鼓膜近傍からの音波の放射には、例えばイヤホンやヘッドホンなどが用いられる。この場合、イヤホンやヘッドホンの装着位置を考慮した外耳道の伝達特性の補正、およびイヤホンやヘッドホンのスピーカドライバの音響特性の補正などを加えることによって、ユーザＵに音源の位置をより正確に知覚させることが可能になる。また、ユーザＵの鼓膜近傍への音波の放射には、後述するトランスオーラルシステムが用いられてもよい。

図４は、仮想的な音源を再生するための装置構成の例を示す図である。

装置１０において、左用および右用のＦＩＲ（Finite Impulse Response）フィルタ１１Ｌ，１１Ｒで、入力された原音データ（モノラル）とＨＲＩＲ＿ＬまたはＨＲＩＲ＿Ｒとの畳み込み積分が実行される。原音データは、例えばサンプリング周波数４４．１ｋＨｚ、量子化ビット数１６ビットのデジタル信号として入力される。ここで、ＨＲＩＲ係数のタップ長を５１２サンプルとすると、ＦＩＲフィルタ１１Ｌ，１１Ｒでの畳み込み積分は、５１２タップの積和演算処理になる。ＦＩＲフィルタはＤＳＰ（Digital Signal Processor）のような演算ハードウェアとして実装されてもよいし、またＣＰＵ（Central Processing Unit）によるソフトウェア信号処理として実装されてもよい。

ＦＩＲフィルタ１１Ｌ，１１Ｒでの畳み込み積分の結果、ユーザの左耳への出力信号Ｙ_Ｌ、および右耳への出力信号Ｙ_Ｒが得られる。これらの信号は、それぞれ、Ｄ／Ａコンバータ１２Ｌ，１２Ｒでデジタル信号からアナログ信号に変換され、アンプ１３Ｌ，１３Ｒで増幅され、スピーカ１４Ｌ，１４Ｒから聴取者であるユーザＵに向けて出力される。後述するように、スピーカ１４Ｌ，１４Ｒは、ヘッドホンやイヤホン、またはトランスオーラルシステムを構成するスピーカなど、ユーザＵの左耳と右耳とに別々の音声を出力する機能を有するスピーカである。

ここで、ＦＩＲフィルタ１１Ｌ，１１Ｒは、ＣＰＵ１５によって制御される。ＣＰＵ１５は、入力された音源位置に応じて、ストレージ装置などに格納されたＨＲＩＲ係数テーブル１６からＨＲＩＲ係数を取得する。ＨＲＩＲ係数は、例えば、ユーザＵを識別するユーザＩＤに紐付けられ、音源Ｓの位置を示す動径ｒおよび偏角θ，φの組み合わせごとに、それぞれＨＲＩＲ＿ＬおよびＨＲＩＲ＿Ｒについて格納される。

（頭部伝達関数を用いたユーザ認証）
上述のように、頭部伝達関数であるＨＲＴＦおよびＨＲＩＲは、それぞれのユーザに固有な関数である。ユーザＵは、自己のＨＲＴＦによって位置（ｒ，θ，φ）にある音源Ｓから放射された原音がどのように変化して聴取音になるかを経験的に学習している。ユーザＵは、この学習を通して、聴取音から音源Ｓの位置を認識することができるようになる。

従って、例えば図３に示した仮想的な立体音響空間Ｖにおける音源の再生で、他のユーザＵ’の頭部インパルスレスポンスＨＲＩＲ＿Ｌ（Ｕ’，ｒ，θ，φ），ＨＲＩＲ＿Ｒ（Ｕ’，ｒ，θ，φ）を原音Ｘに畳み込み積分したものをユーザＵの鼓膜の近傍から放射しても、ユーザは仮想的な立体音響空間Ｖにおいて位置（ｒ，θ，φ）に位置する音源を知覚しない。他のユーザＵ’のＨＲＴＦによる原音Ｘの変化は、ユーザＵが経験的に学習している自己のＨＲＴＦによる変化とは異なるためである。このように、仮想音源の定位の知覚に関する個人差が著しいことは、一般的によく知られている現象である。

ユーザＵに、自己のものではないＨＲＴＦから算出したＨＲＩＲを畳み込み積分した原音Ｘを提示した場合、上記のように音源の位置は正しく知覚されない。特に、前方や上下の任意の位置に正確に定位（前方定位、上下定位）させることは極めて難しい。この場合、音源は、ユーザＵの頭の内部（頭内定位）、またはユーザＵの後方の誤った位置に定位（後方定位）して知覚されることが知られている。

逆にいえば、ユーザＵの頭部インパルスレスポンスＨＲＩＲ＿Ｌ（Ｕ，ｒ，θ，φ），ＨＲＩＲ＿Ｒ（Ｕ，ｒ，θ，φ）を畳み込み積分した原音Ｘを提示された場合に、音源が位置（ｒ，θ，φ）にあることを正しく知覚できるのは、ユーザＵだけである。

頭部伝達関数を利用したユーザ認証の基本的なアイデアは、上記の発見によるものである。つまり、頭部伝達関数を利用したユーザ認証は、ユーザＵのＨＲＩＲなどの頭部伝達関数をテンプレートとして用い、この頭部伝達関数を用いて仮想的に発生させた音源の位置を正確に推定させることによってユーザＵを認証するというものである。この認証では、例えば、仮想的に発生させた音源の位置が所定の微小な誤差の範囲内で正確に推定された場合に限って、ユーザＵを本人であると認証する。

図５は、頭部伝達関数を利用したユーザ認証の一例を概念的に示す図である。

例えば、ユーザＵの前方の位置（ｒ，θ_１，０）にある音源Ｓ_Ｔを、頭部インパルスレスポンスＨＲＩＲ＿Ｌ（Ｕ，ｒ，θ_１，０），ＨＲＩＲ＿Ｒ（Ｕ，ｒ，θ_１，０）を原音Ｘに畳み込み積分することによって仮想的に再生して、聴取者に提示する。この場合、聴取者がユーザＵであれば、音源Ｓ_Ｔの位置を正しく知覚できるはずである。一方、聴取者がユーザＵではなければ、音源Ｓ_Ｔの位置を正しく知覚できず、例えば聴取者の後方に位置する音源Ｓ_Ｆと誤って知覚する。従って、ユーザＵの前方にある音源Ｓ_Ｔの位置を推定させれば、ユーザＵを精度よく認証することができる。

図６は、頭部伝達関数を利用したユーザ認証の別の例を概念的に示す図である。

上述のように、ユーザＵに、自己のものではないＨＲＴＦから算出したＨＲＩＲを畳み込み積分した原音Ｘを提示した場合、音源は、ユーザＵの頭の内部、またはユーザＵの後方の誤った位置に定位して知覚される。この誤った位置が分布する範囲は、ユーザＵの上下方向について、特に狭い。つまり、自己のものではないＨＲＴＦから算出したＨＲＩＲを畳み込み積分した原音Ｘを提示された場合、聴取者が音源の高さを識別することは非常に困難である。

例えば、ユーザＵの前方の位置（ｒ，０，φ_１）にある音源Ｓ_Ｔを、頭部インパルスレスポンスＨＲＩＲ＿Ｌ（Ｕ，ｒ，０，φ_１），ＨＲＩＲ＿Ｒ（Ｕ，ｒ，０，φ_１）を原音Ｘに畳み込み積分することによって仮想的に再生して、聴取者に提示する。この場合、聴取者がユーザＵであれば、音源Ｓ_Ｔの位置を正しく知覚できるはずである。一方、聴取者がユーザＵではなければ、音源Ｓ_Ｔの位置を正しく知覚できず、多くの場合、聴取者の後方で聴取者と同じ高さに位置する音源Ｓ_Ｆと誤って知覚する。従って、ユーザＵからみて高さが異なる複数の位置のいずれかにある音源Ｓ_Ｔの位置を推定させれば、ユーザＵを精度よく認証することができる。

（２．本開示の実施形態）
次に、以上で説明した基本的なアイデアを利用してユーザを認証する実施形態のいくつかの例について説明する。

（２−１．第１の実施形態）
まず、図７〜図１２を参照して、本開示の第１の実施形態について説明する。本実施形態では、ユーザＵの頭部伝達関数を用いて再生された仮想的な音源が、バイノーラル再生によって聴取者に提供される。聴取者は、推定した音源の位置を、入力装置を用いて回答する。回答が正しい場合、聴取者がユーザＵとして認証される。

図７は、本開示の第１の実施形態においてユーザ認証に用いられる装置の構成を示す図である。

本実施形態では、ユーザ認証装置１００に、ＩＤ入力装置１５０と、ヘッドホン１６０と、回答入力装置１７０とが接続される。ＩＤ入力装置１５０と、ヘッドホン１６０と、回答入力装置１７０とは、ユーザＵが認証される場所、例えば機密情報を扱う部屋の入口などに設置される。ユーザＵは、例えばこの部屋に入る権限を有し、ユーザＵの頭部伝達関数は予め測定されてユーザ認証装置１００に登録されている。

ＩＤ入力装置１５０は、ユーザＵが自己のユーザＩＤを入力するのに用いられる。ユーザＵの頭部伝達関数は、ユーザＩＤと関連付けられてユーザ認証装置１００に登録されており、ＩＤ入力装置１５０によって取得されたユーザＩＤを用いて読み出される。

ヘッドホン１６０は、ユーザ認証装置１００が生成した、音源を仮想的に再生した音声を、バイノーラル再生によって聴取者に提供するのに用いられる。上述のように、ヘッドホン１６０の装着位置やスピーカドライバの音響特性を考慮した補正を音声に加えることによって、ユーザＵに音源の位置をより正確に知覚させることが可能になる。

回答入力装置１７０は、聴取者が推定した音源の位置を回答として取得するのに用いられる。図示されているように、回答入力装置１７０は、“１”〜“９”の９つのボタンを有する。聴取者は、これらのボタンのうちのいずれかを選択し、選択されたボタンに対応する位置が回答として取得される。なお、回答入力装置１７０のボタンの配置については後述する。

本実施形態では、以上のような装置構成を用いて、聴取者が仮想的に再生された音源の位置を正しく推定できるかを判定する。聴取者が音源の位置を正しく推定できた場合、聴取者はユーザＵとして認証され、例えばユーザ認証装置１００から認証結果を取得した外部装置が部屋の入口のロックを解除するなどの処理が実行されうる。

このように、専用の入力装置を用いてユーザＩＤおよび回答を取得することによって、ユーザＵは磁気カードなどを携帯しなくてもよく、ユーザＵの負担感を軽減することができる。

図８は、本開示の第１の実施形態に係るユーザ認証装置の機能構成を示すブロック図である。

ユーザ認証装置１００は、ＩＤ取得部１０１と、頭部伝達関数取得部１０３と、仮想音源位置設定部１０７と、生成部１０９と、デコード回路１１３と、再生部１１５と、回答取得部１１７と、認証部１１９と、認証結果出力部１２１とを含む。また、ユーザ認証装置１００は、ストレージ装置などに格納された頭部伝達関数データ１０５および原音データ１１１を参照する。

ＩＤ取得部１０１は、ユーザＵのユーザＩＤを取得する。ＩＤ取得部１０１は、例えばＩＤ入力装置１５０に接続されるインターフェースであり、聴取者がＩＤ入力装置１５０を用いて入力したユーザＩＤの情報を取得する。ＩＤ取得部１０１は、取得したＩＤの情報を頭部伝達関数取得部１０３に提供する。

頭部伝達関数取得部１０３は、予め測定されたユーザＵの頭部伝達関数を取得する。上述のように、頭部伝達関数は、ユーザＵと、音源Ｓの位置（ｒ，θ，φ）とに依存する。そこで、頭部伝達関数取得部１０３は、ＩＤ取得部１０１から取得したユーザＩＤと、仮想音源位置設定部１０７から取得した仮想音源の位置とを用いて頭部伝達関数データ１０５を参照し、予め測定されて格納されているユーザＵの頭部伝達関数の情報を取得する。ここで取得される頭部伝達関数は、例えばＨＲＩＲである。頭部伝達関数取得部１０３は、取得した頭部伝達関数の情報を生成部１０９に提供する。

仮想音源位置設定部１０７は、仮想音源の位置（ｒ，θ，φ）をランダムに設定する。仮想音源位置設定部１０７は、仮想的な立体音響空間Ｖの任意の位置を仮想音源の位置（以下、第１の位置ともいう）に設定する。本実施形態においては、仮想音源の位置が９つの選択肢からの選択によって回答されるため、仮想音源位置設定部１０７は、この９つの選択肢のそれぞれに対応する立体音響空間Ｖの９つの位置うちのいずれかを仮想音源の位置として設定する。なお、回答の選択肢と仮想音源の位置との関係については後述する。仮想音源位置設定部１０７は、設定した第１の位置の情報を頭部伝達関数取得部１０３および認証部１１９に提供する。

上記のように、頭部伝達関数取得部１０３は、ＩＤ取得部１０１が取得したユーザＩＤと、仮想音源位置設定部１０７が設定した第１の位置とに基づいて、頭部伝達関数データ１０５から頭部伝達関数を取得する。ここで、仮想音源位置設定部１０７によって設定されうる第１の位置は、９つの位置のうちのいずれかである。そのため、頭部伝達関数データ１０５には、ユーザＵについて、少なくとも上記の９つの位置の頭部伝達関数が予め用意されている。

生成部１０９は、頭部伝達関数を用いて立体音響空間Ｖの第１の位置にある音源を仮想的に再生した音データを生成する。生成部１０９は、ユーザＵの第１の位置での頭部伝達関数の情報を、頭部伝達関数取得部１０３から取得する。生成部１０９は、例えば図４に示した装置１０の場合と同様に、ＦＩＲフィルタを用いて実現されうる。生成部１０９は、デコード回路１１３から提供された原音のデータを、頭部伝達関数を用いて加工して、仮想音源の音データを生成する。生成部１０９は、生成した音データを再生部１１５に提供する。

デコード回路１１３は、原音データ１１１をデコードする。原音データ１１１は、例えば、サンプリング周波数４４．１ｋＨｚ、量子化ビット数１６ｂｉｔでＭＰ３圧縮されたモノラルの音データである。デコード回路１１３は、この音データをデコードしてＰＣＭ信号に復調し、生成部１０９に提供する。

再生部１１５は、聴取者、つまり認証を受けようとするユーザＵに向けて、生成部１０９から提供された音データを再生する。再生部１１５は、例えばヘッドホン１６０に接続されるインターフェースであり、Ｄ／Ａコンバータやアンプなどを含んでもよい。再生部１１５は、音データを聴取者に提示するためにヘッドホン１６０に提供する。

回答取得部１１７は、ヘッドホン１６０を用いて再生部１１５によって再生された音データを聴取した聴取者が推定した、立体音響空間Ｖにおける仮想的な音源の位置（以下、第２の位置ともいう）を回答として取得する。回答取得部１７は、例えば回答入力装置１７０に接続されるインターフェースであり、聴取者が回答入力装置１７０を用いて入力した第２の位置の情報を取得する。回答取得部１１７は、取得した第２の位置の情報を認証部１１９に提供する。

認証部１１９は、第１の位置と第２の位置との符合によってユーザＵを認証する。認証部１１９は、第１の位置の情報を仮想音源位置設定部１０７から取得し、第２の位置の情報を回答取得部１１７から取得する。認証部１１９は、第１の位置と第２の位置とが符合している場合に、聴取者が仮想音源の位置を正しく知覚していると判定し、聴取者がユーザＵであると認証する。後述するように、認証部１１９は、この判定を複数回繰り返すことによってユーザＵを認証してもよい。認証部１１９は、認証の結果を認証結果出力部１２１に出力する。

認証結果出力部１２１は、認証結果を出力する。認証結果出力部１２１は、例えばユーザ認証装置１００の外部の装置に接続されるインターフェースであり、外部の装置に認証結果を提供してもよい。本実施形態において、外部の装置は、例えば部屋の入口をロックする施錠装置などである。外部の装置では、ユーザ認証装置１００による認証結果と、他の認証装置、例えばパスワードや磁気カードまたは生体認証などでユーザＵを認証する認証装置による認証結果とを併用してユーザＵを認証してもよい。また、認証結果出力部１２１は、認証結果を認証装置１００の内部の他の部分に出力するためのインターフェースであってもよい。

なお、頭部伝達関数取得部１０３と、仮想音源位置設定部１０７と、認証部１１９と、は、例えばＣＰＵ、ＲＡＭ(Random Access Memory）、ＲＯＭ（Read Only Memory）などによって実現される。

図９は、本開示の第１の実施形態におけるユーザＩＤおよび回答の入力装置の例について説明するための図である。

本実施形態において、ＩＤ入力装置１５０および回答入力装置１７０は、聴取者の前方の壁などに設置される。ＩＤ入力装置１５０は、例えばテンキーおよび決定キーによってユーザＩＤを入力する装置である。回答入力装置１７０は、上述したように９つのボタンを有し、いずれかのボタンの押下によって回答を取得する。

ここで、回答入力装置１７０では、回答入力装置１７０に対面する聴取者からみて中央に“５”のボタンが配置され、その周りの聴取者からみて上、下、左、右、左上、右上、左下、右下に、それぞれ“１”〜“４”、“６”〜“９”のボタンが配置されている。これらの９つのボタンがそれぞれ示す位置は、立体音響空間Ｖにおいて予め定められた位置群といえる。上述のように、第１の位置および第２の位置は、この位置群から選択される。

このように、第１の位置および第２の位置をそれぞれ所定の位置群から選択することによって、ユーザＵの頭部伝達関数を、少なくとも所定の位置群に含まれる位置について測定しておけばよくなり、頭部伝達関数の測定が簡単になる。また、仮想的な音源の位置を推定するユーザＵの回答を、選択肢からの選択によって取得することが可能になり、回答の入力、および正答の判定が簡単になる。なお、位置群に含まれる位置の数は９つには限られず、任意の数でありうる。

図１０は、本開示の第１の実施形態における回答ボタンの水平方向の配置について説明するための図である。

図では、聴取者の周りの仮想的な立体音響空間Ｖの、聴取者の頭の高さでの水平断面図が概略的に示されている。本実施形態では、聴取者の前方、距離ｒの位置に、回答入力装置１７０が設置される。従って、回答入力装置１７０の“５”のボタンは、立体音響空間Ｖで位置（ｒ，０，０）にある音源Ｓ_５に対応する。また、回答入力装置１７０の“４”のボタンは、立体音響空間Ｖで位置（ｒ，−θ_１，０）にある音源Ｓ_４に対応し、“６”のボタンは、位置（ｒ，θ_１，０）にある音源Ｓ_６に対応する。

図示された例において、音源Ｓ_４と音源Ｓ_５、および音源Ｓ_５と音源Ｓ_６との間の距離は、いずれもｒ×ｔａｎθ_１になる。この場合、回答入力装置１７０の“４”および“６”のボタンまでの距離は、ｒよりも若干大きくなるが、例えばｒが１ｍ程度、θ_１が１０°程度であれば、誤差として無視しうる範囲である。回答入力装置１７０の“４”および“６”のボタンまでの距離を正確にｒにする場合、聴取者から回答入力装置１７０までの距離、つまり“５”のボタンまでの距離をｒ×ｃｏｓθ_１とし、音源Ｓ_４と音源Ｓ_５、および音源Ｓ_５と音源Ｓ_６との間の距離をｒ×ｓｉｎθ_１としてもよい。

図１１は、本開示の第１の実施形態における回答ボタンの上下方向の配置について説明するための図である。

図では、聴取者の周りの仮想的な立体音響空間Ｖの、聴取者の前後方向での垂直断面図が概略的に示されている。上述のように、本実施形態では、聴取者の前方、距離ｒの位置に、回答入力装置１７０が設置され、“５”のボタンが立体音響空間Ｖの立体音響空間Ｖで位置（ｒ，０，０）にある音源Ｓ_５に対応する。また、回答入力装置１７０の“２”のボタンは、立体音響空間Ｖで位置（ｒ，０，φ_１）にある音源Ｓ_２に対応し、“８”のボタンは、位置（ｒ，０，−φ_１）にある音源Ｓ_８に対応する。

図示された例において、音源Ｓ_２と音源Ｓ_５、および音源Ｓ_５と音源Ｓ_８との間の距離は、いずれもｒ×ｔａｎφ_１になる。この場合、回答入力装置１７０の“２”および“８”のボタンまでの距離は、ｒよりも若干大きくなるが、例えばｒが１ｍ程度、φ_１が１０°程度であれば、誤差として無視しうる範囲である。回答入力装置１７０の“２”および“８”のボタンまでの距離を正確にｒにする場合、聴取者から回答入力装置１７０までの距離、つまり“５”のボタンまでの距離をｒ×ｃｏｓφ_１とし、音源Ｓ_２と音源Ｓ_５、および音源Ｓ_５と音源Ｓ_８との間の距離をｒ×ｓｉｎφ_１としてもよい。

図示しない音源Ｓ_１，Ｓ_３，Ｓ_７，Ｓ_９の立体音響空間Ｖでの位置、および回答入力装置１７０の対応するボタンは、上述した音源Ｓ_２，Ｓ_４〜Ｓ_６，Ｓ_８と同様に設定される。すなわち、音源Ｓ_１は、位置（ｒ，−θ_１，φ_１）にあり、ボタン“１”に対応する。音源Ｓ_３は、位置（ｒ，θ_１，φ_１）にあり、ボタン“３”に対応する。音源Ｓ_７は、位置（ｒ，−θ_１，−φ_１）にあり、ボタン“７”に対応する。音源Ｓ_９は、位置（ｒ，θ_１，−φ_１）にあり、ボタン“９”に対応する。

なお、本実施形態において、予め測定されるユーザＵの頭部伝達関数は、壁での反射の影響を除くために、無響空間で測定されることが望ましい。しかし、例えば、ユーザＵが認証される場所、すなわちヘッドホン１６０および回答入力装置１７０が設置される場所が狭い部屋の中であるような場合には、その部屋の壁での反射や吸収を考慮した環境で頭部伝達関数を測定してもよい。

図１２は、本開示の第１の実施形態におけるユーザ認証処理のステップを示すフローチャートである。

まず、ユーザ認証装置１００のＩＤ取得部１０１が、聴取者がＩＤ入力装置１５０を用いて入力したユーザＩＤを取得する（ステップＳ１０１）。次に、仮想音源位置設定部１０７が、仮想音源の位置をランダムに設定する（ステップＳ１０３）。ここで仮想音源位置設定部１０７は、仮想音源の位置を、上述の音源Ｓ_１〜Ｓ_９の位置からランダムに選択する。

次に、頭部伝達関数取得部１０３が、ステップＳ１０１で取得されたユーザＩＤを用いて、ステップＳ１０３で設定された仮想音源の位置におけるユーザＵのＨＲＩＲ関数を取得する（ステップＳ１０５）。上述のように、ここで取得されるＨＲＩＲ関数は、予め測定されて頭部伝達関数データ１０５として格納されている。

次に、生成部１０９が、ステップＳ１０５で取得されたＨＲＩＲ関数を原音データに畳み込み積分することによって、仮想音源の音データを生成する（ステップＳ１０７）。次に、再生部１１５が、ヘッドホン１６０を用いて聴取者に向けて再生する（ステップＳ１０９）。

次に、回答取得部１１７が、回答入力装置１７０を用いて、聴取者が仮想音源の位置を推定した回答を取得する（ステップＳ１１１）。ここで、ステップＳ１０９とステップＳ１１１との間には、聴取者の思考および動作にかかる時間を考慮した所定の待機時間が設定されうる。

次に、認証部１１９が、ステップＳ１１１で取得された回答によって示される第２の位置が、ステップＳ１０３で設定された仮想音源の位置である第１の位置に一致するか否かを判定する（ステップＳ１１３）。ここで、第２の位置が第１の位置に一致すると判定されなかった場合、認証部１１９は、“ユーザ認証失敗”の結果を、認証結果出力部１２１を介して出力する（ステップＳ１１５）。

一方、ステップＳ１１３において、第２の位置が第１の位置に一致すると判定された場合、認証部１１９は、さらに、ステップＳ１０３〜ステップＳ１０９による仮想音源の再生が所定の回数繰り返されたか否かを判定する（ステップＳ１１７）。ここで、仮想音源の再生が所定の回数繰り返されたと判定された場合、認証部１１９は、“ユーザ認証成功”の結果を、認証結果出力部１２１を介して出力する（ステップＳ１１９）。

一方、ステップＳ１１７において、仮想音源の再生が所定の回数繰り返されたと判定されなかった場合、ステップＳ１０３からの仮想音源の再生の処理を再度実行する。このとき、ステップＳ１０３では、仮想音源の位置が再度ランダムに設定されうる。

つまり、本実施形態では、仮想音源の位置を変えて（ランダムに選択された結果、前回と同じ位置になる場合もある）、仮想音源の再生と聴取者からの回答の取得とが所定の回数繰り返される。これによって、他人が偶発的にユーザＵとして認証されてしまう可能性を低くすることができる。

図１３は、図１２に示した処理の変形例のステップを示すフローチャートである。

図示された例では、ステップＳ１１１の次に、認証部１１９が、取得された回答が正答であるか誤答であるかを判定し、正答または誤答のカウントを更新する（ステップＳ１２１）。カウントは、ＲＡＭなどに数値として格納されうる。次に、認証部１１９は、ステップＳ１１７を実行する。

ステップＳ１１７において、仮想音源の再生が所定の回数繰り返されたと判定された場合、認証部１１９は、所定の回数、および正答または誤答のカウントから聴取者の正答の回数を算出し、正答の回数または正答率が閾値以上であるかを判定する（ステップＳ１２３）。ここで、正答の回数または正答率が閾値以上であると判定された場合、認証部１１９は、“ユーザ認証成功”の結果を、認証結果出力部１２１を介して出力する（ステップＳ１１９）。一方、正答の回数または正答率が閾値以上であると判定されなかった場合、認証部１１９は、“ユーザ認証失敗”の結果を、認証結果出力部１２１を介して出力する（ステップＳ１１５）。

上記の変形例では、仮想音源の再生の繰り返しの中で、例えば１回誤答があっても、そこで即座に認証が失敗することがなく、その後正答が続けば、認証が成功する可能性がある。これによって、ＨＲＩＲ関数やヘッドホン１６０が完全でないためにユーザＵ本人でも誤答の可能性がある場合に、ユーザＵ本人が認証されなくなることを防ぐことができる。

ここで、認証部１１９は、ステップＳ１２１で誤答が検出された場合に、仮想音源の再生を繰り返す回数を増加させてもよい。認証部１１９は、例えば、“最初から、または誤答の後に３回連続して正答する”、または“仮想音源の再生を３回以上繰り返し、途中で正答率が７５％以上になったら認証成功、５０％を下回ったら認証失敗とする”などの条件によって、仮想音源の再生を繰り返す回数を動的に設定してもよい。

（２−２．第２の実施形態）
次に、図１４を参照して、本開示の第２の実施形態について説明する。本実施形態は、ユーザＵの頭部伝達関数を用いて再生された仮想的な音源が、ヘッドホン１６０を用いてバイノーラル再生される代わりに、トランスオーラルシステムを構成するスピーカ２６０によってトランスオーラル再生される点が上記の第１の実施形態とは異なる。それ以外の点については、上記の第１の実施形態と同様であるため、詳細な説明を省略する。

図１４は、本開示の第２の実施形態においてユーザ認証に用いられる装置の構成を示す図である。

スピーカ２６０は、トランスオーラルシステムを構成する左右１対のスピーカである。なお、スピーカ２６０に適用されるトランスオーラルシステムの構成としては、公知のさまざまな構成が適用されうる。スピーカ２６０によって、聴取者は、ヘッドホン１６０によるバイノーラル再生の場合と同様に、左耳用および右耳用に再生された音声をそれぞれの耳で聴取することが可能である。

本実施形態では、仮想音源をトランスオーラル再生することによって、認証を受けようとするユーザＵがヘッドホン１６０を装着することが不要になる。これによって、認証のだめのユーザの動作がさらに簡単になり、生体認証に対するユーザの抵抗感をさらに低下させることができる。

（２−３．第３の実施形態）
次に、図１５および図１６を参照して、本開示の第３の実施形態について説明する。本実施形態は、ユーザＩＤ、および聴取者が音源の位置を推定した回答を、ＩＤ入力装置１５０および回答入力装置１７０に代えて、聴取者が所持する端末装置３００を用いて取得する点が上記の第１の実施形態とは異なる。それ以外の点については、上記の第１の実施形態と同様であるため、詳細な説明を省略する。

図１５は、本開示の第３の実施形態においてユーザ認証に用いられる装置の構成を示す図である。

端末装置３００は、例えば携帯電話、タブレット型ＰＣ（Personal Computer）などの端末装置である。端末装置３００は、聴取者の操作を取得する操作部と、ユーザ認証装置１００と通信する通信部とを少なくとも有する。聴取者は、端末装置３００の入力部を用いてユーザＩＤおよび回答を入力する。端末装置３００は、取得したユーザＩＤおよび回答の情報をユーザ認証装置１００に向けて送信する。本実施形態では、ユーザ認証装置１００のＩＤ取得部１０１および回答取得部１１７は、端末装置３００からユーザＩＤおよび回答の情報を受信する受信装置によって実現される。

図１６は、本開示の第３の実施形態におけるユーザＩＤおよび回答の入力画面の例を示す図である。

本実施形態において、端末装置３００は、入力部としてタッチスクリーン３１０を有する。タッチスクリーン３１０には、ＩＤ入力表示３５０と、回答入力表示３７０とを含むグラフィカルインターフェースが表示される。

例えば、聴取者は、例えばオンスクリーンキーボードなどを用いてＩＤ入力表示３５０にユーザＩＤを入力し、“ＯＫ”ボタンを押下する。端末装置３００は、ユーザ認証装置１００にユーザＩＤの情報を送信し、ユーザ認証装置１００は、ユーザＩＤによって特定されるユーザの頭部伝達関数を用いて生成した仮想音源を、ヘッドホン１６０を介して聴取者に提示する。聴取者は、仮想音源の位置として推定した位置を、回答入力表示３７０に入力候補として表示された“１”〜“９”のボタンの押下によって入力する。端末装置３００は、ユーザ認証装置１００に回答の情報を送信し、ユーザ認証装置１００は、設定された仮想音源の位置と回答の位置との符合によって聴取者をユーザＵとして認証する。図示された例では、仮想音源の再生が３回繰り返され、聴取者が３回正答するとユーザＵとして認証される。

なお、例えば端末装置３００がユーザによって専用されるものである場合、ユーザ認証装置１００がユーザＵを識別する情報として端末装置３００の機器ＩＤを保持し、端末装置３００が機器ＩＤをユーザ認証装置１００に送信することによって、ユーザＩＤの入力が省略されてもよい。また、ユーザ認証装置１００は、仮想音源の音データを端末装置３００に送信し、端末装置３００に接続されたヘッドホンを介して仮想音源が聴取者に提示されてもよい。

この場合、例えば図１０および図１１で説明したように、回答のためのボタンの位置と仮想音源の位置とを空間的に対応させることが難しいため、例えば端末装置３００を正面に把持して回答をするように聴取者に指示してもよい。なお、端末装置３００の入力部はタッチスクリーンには限られず、ディスプレイと操作ボタンの組み合わせなどであってもよい。この場合、回答入力のために、携帯電話などが有するテンキーが用いられてもよい。

本実施形態では、ユーザＩＤの入力および回答の入力を、専用の入力装置に代えて端末装置３００を用いて取得する。これによって、ユーザ認証のための装置の構成を簡単にすることができる。

また、本実施形態の変形例として、上記の第２の実施形態と同様に、仮想的な音源をトランスオーラル再生してスピーカ２６０によってユーザに提示してもよい。これによって、認証のためのユーザの動作が簡単になるとともに、ユーザ自身の所有物である端末装置３００への接触だけで認証が可能になるため、生体認証に対するユーザの抵抗感をさらに低下させることができる。

（２−４．第４の実施形態）
次に、図１７を参照して、本開示の第４の実施形態について説明する。本実施形態は、端末装置４００が、ユーザ認証装置１００、ＩＤ入力装置１５０、および回答入力装置１７０として機能する点が、上記の第１の実施形態とは異なる。それ以外の点については、上記の第１の実施形態と同様であるため、詳細な説明を省略する。

図１７は、本開示の第４の実施形態においてユーザ認証に用いられる装置の構成を示す図である。

端末装置４００は、例えばＰＣ、携帯電話などの端末装置である。上記の第３の実施形態における端末装置３００が、所定の場所に設置されたユーザ認証装置１００と通信してユーザＵを認証するのに対し、本実施形態における端末装置４００は、自らの処理でユーザＵの認証を完結させる。例えば、端末装置４００は、自らのロック状態を解除するためにユーザを認証する。従って、端末装置４００は、携帯性がある端末装置には限られず、例えばデスクトップ型のＰＣなど、据置型の端末装置であってもよい。

端末装置４００は、上記の第１の実施形態におけるユーザ認証装置１００と同様の機能構成を有する。ＩＤ取得部１０１および回答取得部１１７は、例えばキーボード、マウスなどの入力装置によって実現されうる。また、端末装置４００は、上記の第３の実施形態における端末装置３００と同様のタッチスクリーン３１０を有し、ＩＤ入力表示３５０および回答入力表示３７０を表示することによって、ＩＤ取得部１０１および回答取得部１１７の機能を実現してもよい。

ユーザＵは、例えば、ロックされていた端末装置４００の操作を再開するときに、ユーザＩＤを入力した後、ヘッドホン１６０によって提示される音声を聴取し、仮想的な音源の位置を回答する。回答が正しければユーザＵが認証され、端末装置４００のロック状態が解除されて操作が可能になる。

なお、例えば端末装置４００がユーザＵによって専用されるものである場合、端末装置４００が保持するユーザＩＤの入力が省略されうる。この場合、端末装置４００が保持する頭部伝達関数の情報はユーザＵのものに限られるため、端末装置４００はＩＤ取得部１０１の機能を有さなくてもよい。

本実施形態では、端末装置４００が、頭部伝達関数を用いてユーザＵを認証し、認証の結果を自ら利用する。これによって、例えばさまざまな装置のロック解除やログインなどのためのユーザ認証を、頭部伝達関数を用いて簡便かつ効率的にすることができる。

また、本実施形態の変形例として、上記の第２の実施形態と同様に、仮想的な音源をトランスオーラル再生して、端末装置４００が有するスピーカによってユーザに提示してもよい。これによって、認証のためのユーザの動作がより簡単になる。

（３．補足）
（ハードウェア構成）
図１８を参照して、上記で説明された本開示の実施形態におけるユーザ認証装置１００、端末装置３００，４００を実現しうる情報処理装置９００のハードウェア構成について説明する。

図１８は、情報処理装置のハードウェア構成を説明するためのブロック図である。

情報処理装置９００は、ＣＰＵ９０１、ＲＯＭ９０３、およびＲＡＭ９０５を含む。さらに、情報処理装置９００は、ホストバス９０７、ブリッジ９０９、外部バス９１１、インターフェース９１３、入力装置９１５、出力装置９１７、ストレージ装置９１９、ドライブ９２１、接続ポート９２３、および通信装置９２５を含んでもよい。

ＣＰＵ９０１は、演算処理装置および制御装置として機能し、ＲＯＭ９０３、ＲＡＭ９０５、ストレージ装置９１９、またはリムーバブル記録媒体９２７に記録された各種プログラムに従って、情報処理装置９００内の動作全般またはその一部を制御する。ＲＯＭ９０３は、ＣＰＵ９０１が使用するプログラムや演算パラメータなどを記憶する。ＲＡＭ９０５は、ＣＰＵ９０１の実行において使用するプログラムや、その実行において適宜変化するパラメータなどを一次記憶する。ＣＰＵ９０１、ＲＯＭ９０３、およびＲＡＭ９０５は、ＣＰＵバスなどの内部バスにより構成されるホストバス９０７により相互に接続されている。さらに、ホストバス９０７は、ブリッジ９０９を介して、ＰＣＩ（Peripheral Component Interconnect/Interface）バスなどの外部バス９１１に接続されている。

入力装置９１５は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバーなど、ユーザによって操作される装置である。入力装置９１５は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、情報処理装置９００の操作に対応した携帯電話などの外部接続機器９２９であってもよい。入力装置９１５は、ユーザが入力した情報に基づいて入力信号を生成してＣＰＵ９０１に出力する入力制御回路を含む。ユーザは、この入力装置９１５を操作することによって、情報処理装置９００に対して各種のデータを入力したり処理動作を指示したりする。

出力装置９１７は、取得した情報をユーザに対して視覚的または聴覚的に通知することが可能な装置で構成される。出力装置９１７は、例えば、ＬＣＤ（Liquid Crystal Display）、ＰＤＰ（Plasma Display Panel）、有機ＥＬ（Electro-Luminescence）ディスプレイなどの表示装置、スピーカおよびヘッドホンなどの音声出力装置、ならびにプリンタ装置などでありうる。出力装置９１７は、情報処理装置９００の処理により得られた結果を、テキストまたは画像などの映像として出力したり、音声または音響などの音声として出力したりする。

ストレージ装置９１９は、情報処理装置９００の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置９１９は、例えば、ＨＤＤ（Hard Disk Drive）などの磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどにより構成される。このストレージ装置９１９は、ＣＰＵ９０１が実行するプログラムや各種データ、および外部から取得した各種のデータなどを格納する。

ドライブ９２１は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体９２７のためのリーダライタであり、情報処理装置９００に内蔵、あるいは外付けされる。ドライブ９２１は、装着されているリムーバブル記録媒体９２７に記録されている情報を読み出して、ＲＡＭ９０５に出力する。また、ドライブ９２１は、装着されているリムーバブル記録媒体９２７に記録を書き込む。

接続ポート９２３は、機器を情報処理装置９００に直接接続するためのポートである。接続ポート９２３は、例えば、ＵＳＢ（Universal Serial Bus）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Small Computer System Interface）ポートなどでありうる。また、接続ポート９２３は、ＲＳ−２３２Ｃポート、光オーディオ端子、ＨＤＭＩ（High-Definition Multimedia Interface）ポートなどであってもよい。接続ポート９２３に外部接続機器９２９を接続することで、情報処理装置９００と外部接続機器９２９との間で各種のデータが交換されうる。

通信装置９２５は、例えば、通信ネットワーク９３１に接続するための通信デバイスなどで構成された通信インターフェースである。通信装置９２５は、例えば、有線または無線ＬＡＮ（Local Area Network）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、またはＷＵＳＢ（Wireless USB）用の通信カードなどでありうる。また、通信装置９２５は、光通信用のルータ、ＡＤＳＬ（Asymmetric Digital Subscriber Line）用のルータ、または、各種通信用のモデムなどであってもよい。通信装置９２５は、例えば、インターネットや他の通信機器との間で、ＴＣＰ／ＩＰなどの所定のプロトコルを用いて信号などを送受信する。また、通信装置９２５に接続される通信ネットワーク９３１は、有線または無線によって接続されたネットワークであり、例えば、インターネット、家庭内ＬＡＮ、赤外線通信、ラジオ波通信または衛星通信などである。

以上、情報処理装置９００のハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。かかる構成は、実施する時々の技術レベルに応じて適宜変更されうる。

（他の実施形態）
上記で説明した実施形態の他にも、本開示はさまざまな実施形態によって実施されうる。

例えば、上記の実施形態では、ユーザ認証装置がユーザの頭部伝達関数をユーザＩＤに関連付けて保持し、これを用いて音データを生成してユーザに向けて再生するが、本開示の実施形態はこれに限られない。ユーザ認証装置は、仮想音源の位置として設定されうる位置のそれぞれについてユーザの頭部伝達関数を用いて予め生成された音データを、音ファイルとしてユーザＩＤおよび位置情報に関連付けて保持してもよい。この場合、再生部は、ユーザＩＤと仮想音源位置に応じて、予め作成されて保持されている音ファイルから選択された音ファイルを用いて音データを再生する。従って、ユーザ認証装置は、音声データ生成部を含まずに構成されうる。

（効果のまとめ）
本開示の実施形態によって得られうる効果について、以下にまとめる。なお、これらの効果は、必ずしもそのすべてが同時に得られるものではなく、実施形態の構成に応じて得られる可能性があるものである。

ユーザ認証のためのキーとして用いられる頭部伝達関数は、身体の一部分の情報ではなく、頭部や耳の形状、皮膚の音響インピーダンスなど、ユーザの身体の複数の特徴によって定まる関数であるため、複製することが極めて困難である。従って、上記の実施形態によるユーザ認証では、より高い安全性を提供することが可能である。

頭部伝達関数を用いて再生された仮想的な音源の位置を正しく推定することは、ユーザの感覚中枢が経験則として習得するものである。そのため、第三者が流出や複製などによってユーザの頭部伝達関数を入手したとしても、再生される音源の位置を正しく推定することは非常に困難である。従って、上記の実施形態によるユーザ認証では、テンプレートの流出や複製によって安全性が低下するのを防ぐことができる。

頭部伝達関数は、各ユーザの身体的特徴から間接的に取得される。そのため、上記の実施形態によるユーザ認証では、ユーザの身体的特徴を直接的に採取する他の生体認証方法に比べて、ユーザの心理的な抵抗感が少ない。また、他のユーザと共用される装置へのユーザの接触を必要としない構成とすることも可能であるため、例えば潔癖症のユーザの心理的な抵抗感を低減させるようなことも可能である。

仮想的な音源の再生には、一般的な音声の再生装置を用いることが可能である。また、ユーザからの回答の入力にも、既にある端末装置などを用いる構成とすることが可能である。従って、上記の実施形態によるユーザ認証では、認証のための装置のコストを抑えることができる。

（結び）
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）ユーザの頭部伝達関数を用いて前記ユーザの周りの空間の第１の位置にある音源を仮想的に定位させた音データを前記ユーザに向けて再生すること、
前記再生された音データを聴取した前記ユーザが前記音源の位置として推定した、前記ユーザの周りの空間の第２の位置を取得すること、および
前記第１の位置と前記第２の位置との符合によって前記ユーザを認証すること
を含むユーザ認証方法。
（２）前記第１の位置は、前記ユーザの周りの空間において予め定められた位置群のうちのいずれかの位置である、前記（１）に記載のユーザ認証方法。
（３）前記位置群は、高さが異なる複数の位置を含む、前記（２）に記載のユーザ認証方法。
（４）前記位置群は、前記ユーザの前方の位置を含む、前記（２）または（３）に記載のユーザ認証方法。
（５）前記第２の位置は、前記ユーザが前記位置群から選択した位置である、前記（２）〜（４）のいずれか１項に記載のユーザ認証方法。
（６）前記第２の位置は、前記位置群を入力候補として表示するグラフィカルユーザインターフェースを用いて前記ユーザが前記位置群から選択した位置である、前記（５）に記載のユーザ認証方法。
（７）前記再生すること、および前記取得することを繰り返し、
前記第１の位置と前記第２の位置とが符合した回数が閾値以上である場合に前記ユーザを認証する、前記（１）〜（６）のいずれか１項に記載のユーザ認証方法。
（８）前記音データは、バイノーラル再生される、前記（１）〜（７）のいずれか１項に記載のユーザ認証方法。
（９）前記音データは、トランスオーラル再生される、前記（１）〜（７）のいずれか１項に記載のユーザ認証方法。
（１０）前記第２の位置は、前記音データの再生のための装置と同じ場所に設けられた入力装置によって取得される、前記（１）〜（９）のいずれか１項に記載のユーザ認証方法。
（１１）前記第２の位置は、前記ユーザが所持する端末装置への入力によって取得される、前記（１）〜（９）のいずれか１項に記載のユーザ認証方法。
（１２）前記音データを生成することをさらに含む、前記（１）〜（１１）のいずれか１項に記載のユーザ認証方法。
（１３）ユーザの頭部伝達関数を用いて前記ユーザの周りの空間の第１の位置にある音源を仮想的に定位させた音データを前記ユーザに向けて再生する再生部、
前記再生された音データを聴取した前記ユーザが前記音源の位置として推定した、前記ユーザの周りの空間の第２の位置を取得する回答取得部、および
前記第１の位置と前記第２の位置との符合によって前記ユーザを認証する認証部
を備えるユーザ認証装置。
（１４）ユーザの頭部伝達関数を用いて前記ユーザの周りの空間の第１の位置にある音源を仮想的に定位させた音データを前記ユーザに向けて再生する機能、
前記再生された音データを聴取した前記ユーザが前記音源の位置として推定した、前記ユーザの周りの空間の第２の位置を取得する機能、および
前記第１の位置と前記第２の位置との符合によって前記ユーザを認証する機能
をコンピュータに実現させるためのプログラム。

１００ユーザ認証装置
１０１ＩＤ取得部
１０３頭部伝達関数取得部
１０７仮想音源位置設定部
１０９生成部
１１５再生部
１１７回答取得部
１１９認証部
１５０ＩＤ入力装置
１６０ヘッドホン
１７０回答入力装置
２６０スピーカ
３００，４００端末装置
３１０タッチスクリーン
３５０ＩＤ入力表示
３７０回答入力表示

Claims

ユーザの頭部伝達関数を用いて前記ユーザの周りの空間の第１の位置にある音源を仮想的に定位させた音データを前記ユーザに向けて再生すること、
前記再生された音データを聴取した前記ユーザが前記音源の位置として推定した、前記ユーザの周りの空間の第２の位置を取得すること、および
前記第１の位置と前記第２の位置との符合によって前記ユーザを認証すること
を含むユーザ認証方法。
前記第１の位置は、前記ユーザの周りの空間において予め定められた位置群のうちのいずれかの位置である、請求項１に記載のユーザ認証方法。
前記位置群は、高さが異なる複数の位置を含む、請求項２に記載のユーザ認証方法。
前記位置群は、前記ユーザの前方の位置を含む、請求項２または３に記載のユーザ認証方法。
前記第２の位置は、前記ユーザが前記位置群から選択した位置である、請求項２〜４のいずれか１項に記載のユーザ認証方法。
前記第２の位置は、前記位置群を入力候補として表示するグラフィカルユーザインターフェースを用いて前記ユーザが前記位置群から選択した位置である、請求項５に記載のユーザ認証方法。
前記再生すること、および前記取得することを繰り返し、
前記第１の位置と前記第２の位置とが符合した回数が閾値以上である場合に前記ユーザを認証する、請求項１〜６のいずれか１項に記載のユーザ認証方法。
前記音データは、バイノーラル再生される、請求項１〜７のいずれか１項に記載のユーザ認証方法。
前記音データは、トランスオーラル再生される、請求項１〜７のいずれか１項に記載のユーザ認証方法。
前記第２の位置は、前記音データの再生のための装置と同じ場所に設けられた入力装置によって取得される、請求項１〜９のいずれか１項に記載のユーザ認証方法。
前記第２の位置は、前記ユーザが所持する端末装置への入力によって取得される、請求項１〜９のいずれか１項に記載のユーザ認証方法。
前記音データを生成することをさらに含む、請求項１〜１１のいずれか１項に記載のユーザ認証方法。
ユーザの頭部伝達関数を用いて前記ユーザの周りの空間の第１の位置にある音源を仮想的に定位させた音データを前記ユーザに向けて再生する再生部、
前記再生された音データを聴取した前記ユーザが前記音源の位置として推定した、前記ユーザの周りの空間の第２の位置を取得する回答取得部、および
前記第１の位置と前記第２の位置との符合によって前記ユーザを認証する認証部
を備えるユーザ認証装置。
ユーザの頭部伝達関数を用いて前記ユーザの周りの空間の第１の位置にある音源を仮想的に定位させた音データを前記ユーザに向けて再生する機能、
前記再生された音データを聴取した前記ユーザが前記音源の位置として推定した、前記ユーザの周りの空間の第２の位置を取得する機能、および
前記第１の位置と前記第２の位置との符合によって前記ユーザを認証する機能
をコンピュータに実現させるためのプログラム。