JP7078740B2

JP7078740B2 - 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法

Info

Publication number: JP7078740B2
Application number: JP2020546610A
Authority: JP
Inventors: 貞雄鶴賀; 康宣橋本; 和彦吉澤; 義憲岡田
Original assignee: Maxell Ltd
Current assignee: Maxell Ltd
Priority date: 2018-09-12
Filing date: 2018-09-12
Publication date: 2022-05-31
Anticipated expiration: 2038-09-12
Also published as: WO2020054002A1; US20210256104A1; JPWO2020054002A1; EP3851985A1; CN112654983A; EP3851985A4

Description

本発明は、情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法に関する。

情報処理装置やネットワークシステム等では、音声入力によるユーザー認証が行われている。音声入力によるユーザー認証においては、暗証音声が事前に登録される。そして、登録された暗証音声と、認証を受けようとする者が入力した暗証音声とが一致すれば、この者が登録者本人であると認証される。

例えば、特許文献１には、暗証音声とその暗証音声の鍵となる語を組み合わせて登録しておき、認証時には鍵となる語を利用者に呈示して、鍵となる語に対応する暗証音声の発声を求める本人認証方法が開示されている。これにより、他人が偽って認証を受けることを困難にしている。

特開平１０－１７３６４４号公報

しかしながら、特許文献１に開示された方法では、ユーザーは、登録された暗証音声を正確に記憶し、認証時に発声しなければならず、ユーザーにとって大きな負担になる。さらに、ユーザーは、暗証音声を忘却すると認証を受けることができず、情報処理装置等を使用できなくなってしまう。

そこで、本発明は、音声入力を用いた使い勝手よく安全性の高いユーザー認証を行うことが可能な情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法を提供することを目的とする。

本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、以下のとおりである。

本発明の代表的な実施の形態による情報処理装置は、音声入力処理部と、メモリと、コントローラと、を備えている。情報処理装置にユーザーを登録するためのユーザー登録処理では、音声入力処理部は、登録対象ユーザーが発する登録用音声を取り込み、登録用音声を第１の音声信号に変換する。コントローラは、第１の音声信号から第１の音声特徴を抽出し、第１の音声特徴と既にメモリに保存されている既登録ユーザーの音声特徴とを比較する。コントローラは、第１の音声特徴が既登録ユーザーの音声特徴と一致しない場合、第１の音声特徴を登録対象ユーザーと対応付けてメモリへ保存し、第１の音声特徴に基づいて音声パスワードを生成し、音声パスワードを前記メモリへ保存する、処理を実行する。コントローラは、ユーザー登録処理によりメモリに保存した音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行う。

本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。

すなわち、本発明の代表的な実施の形態によれば、音声入力を用いた使い勝手よく安全性の高いユーザー認証を行うことが可能となる。

本発明の実施の形態１に係る情報処理装置の構成の一例を示すブロック図である。本発明の実施の形態１に係るユーザー登録処理の動作シーケンスの一例を示す図である。本発明の実施の形態１に係るユーザー認証処理の動作シーケンスの一例を示す図である。本発明の実施の形態１に係るユーザー認証処理の動作シーケンスの一例を示す図である。本発明の実施の形態２に係るユーザー認証ネットワークシステムの構成の一例を示すブロック図である。本発明の実施の形態２に係るユーザー登録処理の動作シーケンスの一例を示す図である。本発明の実施の形態２に係るユーザー認証処理の動作シーケンスの一例を示す図である。

以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明する。なお、発明を実施するための最良の形態を説明するための各図において、同一の機能を有する部材には同一の符号を付し、その繰り返しの説明は省略する。

（実施の形態１）
図１は、本発明の実施の形態１に係る情報処理装置の構成の一例を示すブロック図である。図１に示すように、情報処理装置１００は、コントローラ１０１、メモリ１１４、音声入力処理部１２０、音声出力処理部１２１、表示部１２８、通信部１２９、基地局通信部１３０を備えている。情報処理装置１００を構成するこれらの構成要素は、バス１４０を介して互いに接続されている。

メモリ１１４は、情報処理装置１００で取り扱われる各種情報を保存する機能ブロックである。メモリ１１４は、例えばフラッシュメモリ等の不揮発性メモリを有し、コントローラ１０１で実行される各種プログラムや、各既登録ユーザーの音声特徴及び音声パスワード等の各種情報を保存する。メモリ１１４は、プログラム記憶領域１１３、ユーザー情報記憶領域１０６（例えば１０６ａ～１０６ｃ）を備えている。

プログラム記憶領域１１３は、ＯＳ（Operating System）や動作制御用アプリケーション等の各種プログラムを格納する記憶領域である。これらのプログラムは、コントローラ１０１で実行される。

ユーザー情報記憶領域１０６ａは、例えば既登録ユーザーであるユーザーＡのユーザー情報を格納する記憶領域である。ユーザー情報記憶領域１０６ａは、ユーザーＡの音声特徴を記憶する音声特徴記憶領域１０２ａ、ユーザーＡの音声パスワードを記憶する音声パスワード記憶領域（例えば１０３ａ～１０５ａ）等を備えている。音声パスワード記憶領域１０３ａ～１０５ａは、それぞれ異なるユーザーＡのユーザー認証用の音声パスワードを保存する。なお、音声パスワード記憶領域の個数は、これより少なくてもよいし、これより多くてもよい。

ユーザー情報記憶領域１０６ｂは、例えば既登録ユーザーであるユーザーＢのユーザー情報を格納する記憶領域である。ユーザー情報記憶領域１０６ｂは、ユーザーＢの音声特徴を記憶する音声特徴記憶領域１０２ｂ、ユーザーＢの音声パスワードを記憶する音声パスワード記憶領域（例えば１０３ｂ～１０５ｂ）等を備えている。音声パスワード記憶領域１０３ｂ～１０５ｂは、それぞれ異なるユーザーＢのユーザー認証用の音声パスワードをそれぞれ保存する。なお、ユーザー情報記憶領域１０６ｂにおいても、音声パスワード記憶領域の個数は、これより少なくてもよいし、これより多くてもよい。

ユーザー情報記憶領域１０６ｃは、例えば既登録ユーザーであるユーザーＣのユーザー情報を格納する記憶領域である。ユーザー情報記憶領域１０６ｃは、ユーザーＣの音声特徴を記憶する音声特徴記憶領域１０２ｃ（図示は省略）、ユーザーＣの音声パスワードを記憶する音声パスワード記憶領域（例えば１０３ｃ～１０５ｃ、図示は省略）等を備えている。音声パスワード記憶領域１０３ｃ～１０５ｃは、それぞれ異なるユーザーＣのユーザー認証用の音声パスワードを保存する。なお、ユーザー情報記憶領域１０６ｃにおいても、音声パスワード記憶領域の個数は、これより少なくてもよいし、これより多くてもよい。

音声入力処理部１２０は、音声入力用のマイク等を備えている。音声入力処理部１２０は、マイクを介して外部の音声を取り込み、取り込んだ音声を音声信号に変換する。音声入力処理部１２０は、音声信号をメモリ１１４やコントローラ１０１へ出力する。メモリ１１４は、音声入力処理部１２０から出力された音声信号を保存してもよい。

音声出力処理部１２１は、音声出力用のスピーカ等を備えている。音声出力処理部１２１は、スピーカを介して音声信号に基づく音声を外部に放音する。

コントローラ１０１は、情報処理装置１００を構成する各部を制御する機能ブロックである。コントローラ１０１は、ＣＰＵ(Central Processing Unit)やＲＡＭ(Random Access Memory)等を備えている。コントローラ１０１は、メモリ１１４のプログラム記憶領域１１３からＯＳや動作制御用アプリケーション等の各種プログラムを読み出しＲＡＭに展開する。そして、コントローラ１０１は、ＲＡＭに展開したプログラムをＣＰＵで実行することにより、図１に示す音声特徴抽出処理部１２２、音声特徴照合判別処理部１２３、音声パスワード生成処理部１２４、音声パスワード抽出処理部１２５、音声パスワード照合判別処理部１２６等の各機能ブロックをＣＰＵに実現する。そして、コントローラ１０１は、これらの機能ブロックにより、情報処理装置１００の動作を制御する。なお、コントローラ１０１内の各機能ブロックは、ソフトウェアのみで実現されてもよいし、ソフトウェア及びハードウェアにより実現されてもよい。

音声特徴抽出処理部１２２は、音声入力処理部１２０から出力される音声信号から、音声を発した者の音声特徴を抽出する。なお、音声特徴の抽出処理は、いわゆる音声認識処理において一般的に用いられる周知技術を利用すればよい。具体的には、音声信号を数十ｍｓの区間ごとに周波数分析することにより、音声の周波数情報（音響スペクトル）を時系列で取得し、この音響スペクトルを音声特徴として抽出する。

音声特徴照合判別処理部１２３は、音声特徴抽出処理部１２２で抽出される音声特徴と、メモリ１１４の音声特徴記憶領域（例えば１０２ａ～１０２ｃ）に記憶されている既登録ユーザーの音声特徴とを比較照合し、両者が一致するかどうかを判別する。

音声パスワード生成処理部１２４は、音声特徴記憶領域に保存された音声特徴に基づいて複数の音声パスワードを生成する。音声パスワード生成処理部１２４は、例えば、音声特徴記憶領域１０２ａに保存された音声特徴に基づいて、ユーザーＡの複数の音声パスワードを生成する。これと同様に、音声パスワード生成処理部１２４は、例えば、音声特徴記憶領域１０２ｂ，１０２ｃに保存された音声特徴に基づいて、ユーザーＢ，Ｃの複数の音声パスワードをそれぞれ生成する。

また、情報処理装置１００の使用中、登録ユーザーの音声特徴は随時更新される。そこで、音声パスワード生成処理部１２４は、更新された音声特徴に基づいて新たな音声パスワードを生成してもよい。音声パスワード生成処理部１２４は、生成した音声パスワードを、対応する既登録ユーザーの音声パスワード記憶領域に記憶させる。

音声パスワード抽出処理部１２５は、ユーザー認証処理時、認証対象ユーザーが発した音声から音声パスワードを抽出する。

音声パスワード照合判別処理部１２６は、音声パスワード抽出処理部１２５で抽出された音声パスワードと、メモリ１１４のユーザー情報記憶領域に記憶されている音声パスワードとを比較照合し、両者が一致するかどうかを判別する。

表示部１２８は、例えば液晶パネル等の表示パネルを備え、ユーザーに通知する各種情報を表示する。例えば、表示部１２８は、ユーザー認証処理時、認証対象ユーザーが発すべき音声パスワードの文言等の情報を表示する。表示部１２８には、入力操作部１２７が設けられている。入力操作部１２７は、例えばキーボードやマウス等の入力装置であり、ユーザーの操作により各種情報が入力される。

なお、表示パネルが静電容量式等のタッチパネルで構成され、表示パネルが入力操作部１２７として使用されてもよい。この場合、ユーザーは、指やタッチペン等によるタッチパネルへの接近又は接触操作により各種情報を入力する。

通信部１２９は、例えば、無線ＬＡＮや有線ＬＡＮを介して外部ネットワークと接続され、外部ネットワークと接続された装置との間で情報の送受信を行う通信インターフェースである。

基地局通信部１３０は、例えば、Ｗ－ＣＤＭＡ（Wideband Code Division Multiple Access）やＧＳＭ（登録商標）（Global System for Mobile communications）等の遠距離無線通信を行う通信インターフェースである。基地局通信部１３０は、送受信アンテナを介して遠距離無線通信と接続された装置との間で情報の送受信を行う。

なお、情報処理装置１００は、音声特徴抽出処理に際し、外部データベースとの接続が必要な場合には、通信部１２９や基地局通信部１３０を介して外部データベースへアクセスし、外部データベースとの間で各種情報が送受信される。

＜ユーザー登録処理＞
次に、本実施の形態に係るユーザー登録処理について説明する。図２は、本発明の実施の形態１に係るユーザー登録処理の動作シーケンスの一例を示す図である。図２では、左側に登録対象ユーザーの動作が示され、右側に情報処理装置１００の動作が示されている。ユーザー登録処理は、情報処理装置１００にユーザーを登録するための処理である。ユーザー登録処理では、以下のステップＳ２０１～Ｓ２１５の処理が行われる。

まず、ステップＳ２０１において、登録対象ユーザーは、入力操作部１２７から、ユーザー登録処理開始の入力操作を行う。例えば、登録対象ユーザーは、登録開始ボタンの操作、表示パネルに表示される登録開始ボタンのタッチ、あるいは仮パスワードの入力操作等を行う。

情報処理装置１００は、入力操作部１２７からの登録開始入力を受け付け（Ｓ２０２）、登録対象ユーザーに対し、何らかの登録用音声の発声を登録対象ユーザーに要求する（Ｓ２０３）、具体的には、情報処理部１００は、音声発声の要求を表示部１２８に表示したり、音声出力処理部１２１からスピーカを介して音声で伝えることにより登録対象ユーザーに要求する。

登録対象ユーザーは、情報処理装置１００による音声発声の要求を認識すると（Ｓ２０４）、何らかの登録用音声を情報処理装置１００に向けて発声する（Ｓ２０５）。

登録対象ユーザーから登録用音声が発声されると、音声入力処理部１２０は、登録用音声を取り込み音声信号（第１の音声信号）に変換し、バス１４０を介して音声信号をコントローラ１０１へ出力する（Ｓ２０６）。

音声特徴抽出処理部１２２は、音声入力処理部１２０から出力された音声信号から登録対象ユーザーの音声特徴（第１の音声特徴）を抽出する（Ｓ２０７）。そして、音声特徴照合判別処理部１２３は、登録対象ユーザーの音声特徴と、既にメモリ１１４の音声特徴記憶領域（例えば１０２ａ～１０２ｃ）に保存されている既登録ユーザーの音声特徴とを比較照合し（Ｓ２０８）、登録対象ユーザーの音声特徴が、すでに音声特徴記憶領域（例えば１０２ａ～１０２ｃ）に保存されているか否か判別する（Ｓ２０９）。

登録対象ユーザーの音声特徴が、音声特徴記憶領域（例えば１０２ａ～１０２ｃ）に保存されている既登録ユーザーの音声特徴と一致しないと判断した場合（Ｎ）、コントローラ１０１は、登録対象ユーザーが未登録の新規登録ユーザーと判断し、登録対象ユーザーの音声特徴を、登録対象ユーザーと対応付けてメモリ１１４へ保存する（Ｓ２１０）。具体的には、コントローラ１０１は、この登録対象ユーザー用のユーザー情報記憶領域１０６を新たに割り当て、登録対象ユーザーの音声特徴を、新たに割り当てたユーザー情報記憶領域１０６の音声特徴記憶領域１０２に保存する（Ｓ２１０）。

そして、音声パスワード生成処理部１２４は、登録対象ユーザーの音声特徴に基づいて、登録対象ユーザーの音声パスワードを複数生成し、生成した複数の音声パスワードを、新たに割り当てられたユーザー情報記憶領域１０６の音声パスワード記憶領域（例えば１０３～１０５）に保存する（Ｓ２１１）。

コントローラ１０１は、ユーザー登録処理が完了したことを、表示部１２８への表示や、音声出力処理部１２１からの放音により登録対象ユーザーに通知する（ステップＳ２１２）。なお、コントローラ１０１は、表示部１２８への表示及び音声出力表示１２１からの放音を併用して、ユーザー登録処理が完了したことを登録対象ユーザーに通知してもよい。

登録対象ユーザーは、情報処理装置１００からの通知により自身のユーザー登録処理が完了したことを認識する（Ｓ２１３）。これにより、ユーザー登録処理に係る一連の処理が完了する。

一方、ステップＳ２０９において、登録対象ユーザーの音声特徴が、いずれかの音声特徴記憶領域（例えば１０２ａ～１０２ｃ）に保存されている音声特徴と一致する場合（Ｙ）、コントローラ１０１は、この登録対象ユーザーは、すでに登録された既登録ユーザーであると判断し、登録対象ユーザーはすでに登録済みであることを、表示部１２８への表示や、音声出力処理部１２１からの放音により登録対象ユーザーに通知する（ステップＳ２１４）。なお、この場合においても、コントローラ１０１は、表示部１２８への表示及び音声出力表示１２１からの放音を併用してもよい。

そして、ユーザーは、情報処理装置１００からの通知により、自身がすでにユーザー登録されていることを認識する（Ｓ２１３）。これによっても、ユーザー登録に係る一連の処理が終了する。

情報処理装置１００は、登録対象ユーザーからの要求があれば、その都度これらのユーザー登録処理を行う。

＜ユーザー認証処理＞
次に、本実施の形態におけるユーザー認証処理について説明する。図３～４は、本発明の実施の形態１に係るユーザー認証処理の動作シーケンスの一例を示す図である。図３～４においても、左側に認証対象ユーザーの動作が示され、右側に情報処理装置１００の動作が示されている。なお、図４は、図３の主要シーケンスＳ３５０の詳細な処理内容を示す。図３の主要シーケンスＳ３５０には、主要シーケンスと主要シーケンス外との接続関係を示すステップのみが便宜的に示されている。

まず、ステップＳ３０１において、認証対象ユーザーは、ユーザー認証処理を開始するため、情報処理装置１００に向けて何らかの認証用音声を発声する。

音声入力処理部１２１は、認証対象ユーザーが発する認証用音声を取り込み、認証用音声を音声信号（第２の音声信号）に変換し、バス１４０を介して音声信号をコントローラ１０１へ出力する（Ｓ３０２）。

音声入力処理部１２０から出力された音声信号から認証対象ユーザーの音声特徴（第２の音声特徴）を抽出する（Ｓ３０３）。そして、音声特徴照合判別処理部１２３は、認証対象ユーザーの音声特徴と、既にメモリ１１４の音声特徴記憶領域（例えば１０２ａ～１０２ｃ）に保存されている既登録ユーザーの音声特徴とを比較照合し（Ｓ３０４）、認証対象ユーザーの音声特徴が、すでに音声特徴記憶領域（例えば１０２ａ～１０２ｃ）に保存されているか否か判別する（Ｓ３０５）。

認証対象ユーザーの音声特徴が音声特徴記憶領域（１０２ａ～１０２ｃ，…）に保存されている既登録ユーザーの音声特徴と一致しない場合（Ｎ）、コントローラ１０１は、認証対象ユーザーは、未登録であり既登録ユーザーではないと判断し、ユーザー認証処理が不可能であることを、表示部１２８への表示や、音声出力処理部１２１からの放音により認証対象ユーザーに通知する（Ｓ３２４）。

認証対象ユーザーは、情報処理装置１００から通知により、ユーザー認証処理が不可能であることを認識すると（Ｓ３２５）、再度ユーザー認証処理を行うか否かを判断する（Ｓ３２６）。そして、認証対象ユーザーは、再度ユーザー認証処理を行うと判断した場合（Ｙ）、再度のステップＳ３０１において、認証用音声を再度発声する。また、認証対象ユーザーが再度のユーザー認証処理を行わないと判断した場合（Ｎ）、ユーザー認証処理は終了する。

一方、ステップＳ３０５において、音声特徴照合判別処理部１２３が、認証対象ユーザーの音声特徴がいずれかの音声特徴記憶領域（例えば１０２ａ）に記憶されている音声特徴と一致すると判断した場合（Ｙ）、コントローラ１０１は、認証対象ユーザーの音声特徴と一致する音声特徴に対応する既登録ユーザー（例えばユーザーＡ）を、音声パスワードによる認証対象となる特定ユーザーとして絞り込む（Ｓ３０６）。

特定ユーザー（例えばユーザーＡ）が絞り込まれると、コントローラ１０１は、特定ユーザーに対応するユーザー情報記憶領域（例えば１０６ａ）の音声パスワード記憶領域（例えば１０３ａ～１０５ａ）に保存されている複数の音声パスワードから、１つの音声パスワードをランダムに選択する（Ｓ３０７）。そして、コントローラ１０１は、選択した音声パスワードを表示部１２８への表示や、音声出力処理部１２１からの放音により認証対象ユーザーに提示し、提示した音声パスワードの発声を認証対象ユーザーに促す（Ｓ３０８）。

認証対象ユーザーは、情報処理装置１００から通知された音声パスワードを認識すると（Ｓ３０９）、認識した音声パスワードを発声する（Ｓ３１０）。

認証対象ユーザーに音声パスワードを提示した後、音声入力処理部１２０は、認証対象ユーザーが発した音声パスワードの音声を取り込み、音声パスワードの音声を音声信号（第３の音声信号）に変換し、バス１４０を介して音声信号をコントローラ１０１へ出力する。そして、音声パスワード抽出処理部１２５は、取り込まれた音声信号から認証対象ユーザーが発した音声パスワードを抽出する（Ｓ３１１）。

これらの処理と並行して、コントローラ１０１は、認証対象ユーザーへの音声パスワードの通知後、認証対象ユーザーが発した音声パスワードの音声を取り込んだかどうかを判断する（Ｓ３１２）。さらに、コントローラ１０１は、認証対象ユーザーに音声パスワードを通知してから経過した提示時間を計測し、提示時間が予め設定されるタイムアウト時間を経過したかどうかを判断する（Ｓ３１３）。

コントローラ１０１は、例えば、ステップＳ３１２において、認証対象ユーザーが発した音声パスワードの音声を取り込んでいないと判断し（Ｎ）、ステップＳ３１３において、提示時間がタイムアウト時間を経過していないと判断した場合（Ｎ）、再度ステップＳ３１２の処理を行う。すなわち、この場合、情報処理装置１００は、認証対象ユーザーが発する音声パスワードの音声を取り込めるように引き続き待機する。

また、コントローラ１０１は、例えば、ステップＳ３１２において、認証対象ユーザーが発した音声パスワードの音声を取り込んでいないと判断し（Ｎ）、ステップＳ３１３において、提示時間がタイムアウト時間を経過していると判断した場合（Ｙ）、時間超過（タイムアウト）によりユーザー認証処理を停止する。そして、コントローラ１０１は、タイムアウトによりユーザー認証処理を停止したことを、表示部１２８への表示や、音声出力処理部１２１からの放音により認証対象ユーザーに通知する（Ｓ３２７）。

認証対象ユーザーは、タイムアウトによりユーザー認証処理が停止されたことを認識し（Ｓ３２８）、再度ユーザー認証処理を行うか否かを判断する（Ｓ３２６）。ステップＳ３２６についてはすでに述べたので、ここではその後の処理についての説明は省略する。

一方、ステップＳ３１２において、コントローラ１０１が、認証対象ユーザーが発した音声を取り込んだと判断した場合（Ｙ）、すなわち、タイムアウト時間内に音声パスワードを取り込んだと判断した場合、音声パスワード照合判別処理部１２６は、認証対象ユーザーに提示された音声パスワードと、認証対象ユーザーの音声信号（第３の音声信号）から抽出した音声パスワードとを比較照合し（Ｓ３１４）、これらの音声パスワードが一致するかどうかを判断する（Ｓ３１５）。

ステップＳ３１５において、音声パスワード照合判別処理部１２６が、これらの音声パスワードが一致しないと判別した場合（Ｎ）、コントローラ１０１は、これらの音声パスワードが不一致であることを、表示部１２８への表示や、音声出力処理部１２１からの放音により認証対象ユーザーに通知する（Ｓ３２９）。

認証対象ユーザーは、情報処理装置１００からの通知により、これらの音声パスワードの不一致を認識する。すなわち、認証対象ユーザーは、提示された音声パスワードと、自身が発した音声パスワードとが一致しなかったことを認識し（Ｓ３３０）、音声パスワードを再度発声するかどうかを判断する（Ｓ３３１）。

ステップＳ３３１において、認証対象ユーザーが音声パスワードの再発声を行わないと判断した場合（Ｎ）、ステップＳ３２６の処理が行われる。ステップＳ３２６についてはすでに述べているので、説明は省略する。

これに対し、認証対象ユーザーは、ステップＳ３３１において音声パスワードの再発声を行うと判断した場合（Ｙ）、情報処理装置１００に対し音声パスワードの再通知を要求するかどうかを判断する（Ｓ３３２）。認証対象ユーザーは、ステップＳ３３２において、音声パスワードの再通知を要求しないと判断した場合（Ｎ）、ステップＳ３１０に戻り、前回通知されたものと同一の音声パスワードを再度発声する。

一方、認証対象ユーザーは、ステップＳ３３２において音声パスワードの再通知を要求すると判断した場合（Ｙ）、発声や入力操作により、情報処理装置１００に対し音声パスワードの再通知を要求する（Ｓ３３３）。

そして、情報処理装置１００は、認証対象ユーザーからの再通知要求を取り込み（Ｓ３３４）、ステップＳ３０７～Ｓ３０８の処理を再度行うことで特定ユーザーの別の音声パスワードを認証対象ユーザーに通知する。

ところで、ステップＳ３１５において、音声パスワード照合判別処理部１２６が、認証対象ユーザーに提示した特定ユーザーの音声パスワードと、認証対象ユーザーの音声信号（第３の音声信号）から抽出した音声パスワードとが一致すると判断した場合（Ｙ）、音声特徴抽出処理部１２２は、ステップＳ３１１で取り込まれた認証対象ユーザーが発した音声パスワードの音声の音声信号から音声特徴（第３の音声特徴）を抽出する（Ｓ３１６）。そして、音声特徴照合判別処理部１２３は、抽出した音声特徴と、特定ユーザー（例えばユーザーＡ）の音声特徴とを比較照合し（Ｓ３１７）、両者の音声特徴が一致するかどうかを判断する（Ｓ３１８）。

音声特徴照合判別処理部１２３が、これらの音声特徴が一致しないと判断した場合（Ｎ）、コントローラ１０１は、認証対象ユーザーに対しユーザー認証が不可能であることを通知する（Ｓ３２４）。

一方、音声特徴照合判別処理部１２３が、これらの音声特徴が一致すると判断した場合（Ｙ）、コントローラ１０１は、認証対象ユーザーが特定ユーザー（例えばユーザーＡ）であると判断し、ユーザー認証処理を完了する。そして、コントローラ１０１は、ユーザー認証処理が完了したことを、表示部１２８への表示や、音声出力処理部１２１からの放音により認証対象ユーザーに通知する（Ｓ３１９）。認証対象ユーザーは、情報処理装置１００からの通知により、自身が既登録ユーザーであると認証され、ユーザー認証処理が完了したことを認識する（Ｓ３２０）。これにより、ユーザー認証処理が終了する。

＜ユーザー認証処理の完了後＞
認証された既登録ユーザー（特定ユーザー、例えばユーザーＡ）は、情報処理装置１００の各種機能を利用することが可能となる（Ｓ３４０）。具体的には、認証された既登録ユーザーは、情報処理装置１００への入力操作を行うことにより（Ｓ３４１）、情報処理装置１００の無線通信機能や電話機能等を動作させることができる（Ｓ３４２）。

また、ステップＳ３４１において、認証された既登録ユーザーが、例えばアイコンのタップ操作等の入力操作を行うと、ステップＳ３４２において、情報処理装置１００は、対応するアプリケーションを実行して、各種機能を実現する。

また、音声入力処理部１２０は、通話や音声操作等で認証された既登録ユーザーが発する音声（認証後音声）を取り込み、音声信号（第４の音声信号）に変換する。そして、コントローラ１０１は、この音声信号から、認証された既登録ユーザーの音声特徴（第４の音声特徴）を抽出し、抽出した音声特徴に基づいて、メモリ１１４に保存されているこの既登録ユーザーの音声特徴を更新する。

そして、音声パスワード生成処理部１２３は、更新された音声特徴に基づいて新たな音声パスワードを生成し、メモリ１１４に保存する。このように、情報処理装置１００は、既登録ユーザーごとに音声特徴を更新し続けることにより、より複雑な音声パスワードを生成することが可能となる。

また、情報処理装置１００は、使用中の既登録ユーザーに対し、より多くのフレーズを話してもらうように、画面表示や音声による発生指示を出してもよい。例えば、情報処理装置１００は、既登録ユーザーと会話したり、あるいは、使用頻度が低い既登録ユーザーや、音声による入力操作を行う頻度が低い既登録ユーザーに対し、音声を発するよう指示する。これにより、情報処理装置１００は、既登録ユーザーの音声を多く集め、随時音声特徴を更新し、より複雑な音声パスワードを生成することが可能となる。これにより、情報処理装置１００の安全性が向上する。

＜情報処理装置の利用範囲＞
本実施の形態の情報処理装置１００は、例えば、ヘッドマウントディスプレイ（ＨＭＤ）に搭載され、ＨＤＭのユーザーに対してユーザー登録処理、ユーザー認証処理が行われる。また、情報処理装置１００は、例えば、携帯電話、スマートフォン、タブレット端末、ＡＩスピーカ等でもよい。

＜効果等＞
本実施の形態によれば、コントローラ１０１は、ユーザー登録処理において、登録保存した音声特徴に基づいて登録対象ユーザーの音声パスワードを生成し、ユーザー認証処理において、音声パスワードを認証対象ユーザーに発声させる。

この構成によれば、既登録ユーザーは、音声パスワードの連想や記憶を行う必要がないので、音声入力を用いた使い勝手よく安全性の高いユーザー認証を行うことが可能となる。

また、本実施の形態によれば、コントローラ１０１は、既登録ユーザーごとに複数の音声パスワードを生成し、複数の音声パスワードからランダムに選択した音声パスワードを認証対象ユーザーに提示する。

この構成によれば、自動的に音声パスワードが生成されるため、既登録ユーザーによるパスワードの登録作業が不要となり、使い勝手をより向上させることが可能となる。また、この構成によれば、認証対象ユーザーに提示される音声パスワードを、その場限りのワンタイムの音声パスワードとすることができるので、盗み見や盗聴による第三者の不正認証を防止することが可能となる。

また、本実施の形態によれば、コントローラ１０１は、音声パスワードを認証対象ユーザーに提示してから経過した提示時間がタイムアウト時間を経過していると判断すると、ユーザー認証処理を停止する。

盗み見や盗聴により第三者がワンタイムの音声パスワードを取得するには相当の時間が必要である。したがって、この構成によれば、ワンタイムの音声パスワードを用いた第三者の不正認証をより一層防止することが可能となる。

なお、本実施の形態では、コントローラ１０１は、認証対象ユーザーに提示された音声パスワードと、認証対象ユーザーが発した音声パスワードとが一致すると判断した場合、認証対象ユーザーが発した音声パスワードから音声特徴（第３の音声特徴）を抽出し、この音声特徴と特定ユーザーの音声特徴とが一致するかどうかを判断する処理を行っている。しかし、このようなシーケンスに限定されず、コントローラ１０１は、認証対象ユーザーに提示された音声パスワードと、認証対象ユーザーが発した音声パスワードとが一致すると判断した場合、認証対象ユーザーが特定ユーザーであると判断し、ユーザー認証処理を終了してもよい。

この構成によれば、ユーザー認証に要する時間が短縮され、ユーザー認証処理の安全性を確保しつつ、使い勝手をより向上させることが可能となる。

また、本実施の形態では、認証用音声の取り込み時（Ｓ３０３）、音声パスワード取り込み時（Ｓ３１１）の２回、音声特徴を抽出し、登録保存されている音声特徴と比較照合を行っている（Ｓ３１４～Ｓ３１５）。その際、ステップＳ３０３では、音声特徴の特徴量の照合判別の閾値を広めに設定して、特徴量が最も近い既登録ユーザーを特定ユーザーとして絞り込む程度にし、ステップＳ３１１では、音声特徴の特徴量の照合判別の閾値を狭めに設定して、音声特徴の一致度が高い場合のみ認証対象ユーザーが特定ユーザーであると判定してもよい。

また、本実施の形態では、音声パスワード生成処理部１２４は、単語、文章の長さ、音声パスワードの個数等により、音声パスワードの複雑さを適宜変更してもよい。この構成によれば、必要なセキュリティレベルや、使用状況を考慮することができ、安全性と利便性とをバランスよく確保することが可能となる。

また、本実施の形態では、音声パスワードが定期的に変更されてもよいし、一度使用した音声パスワードが再度使用されないようにしてもよい。これにより、第三者による不正認証をより一層防止することが可能となり、安全性を更に向上させることができる。

登録ユーザーの音声特徴は、時間帯によって変化することがある。このため、情報処理装置１００は、それぞれの登録ユーザーについて、時間帯ごとの音声特徴を登録保存してもよい。そして、コントローラ１０１は、時間帯に合わせた音声特徴を用いた音声パスワードによりユーザー認証処理を行ってもよい。この構成によれば、より適切な音声特徴を用いたユーザー認証処理が行われるので、ユーザー認証の精度を向上させることが可能となる。

また、野外では、ユーザー認証処理時における認証対象ユーザーの音声パスワードの音声が第三者に盗聴される可能性があるので、野外で使用した音声パスワードは、屋内のみで使用されるようにしてもよい。

また、本実施の形態では、音声パスワード生成処理部１２４において、音声パスワードが自動的に生成される場合について説明したが、登録ユーザー発生した音声を、音声パスワードとして登録してもよい。

また、本実施の形態では、ランダムに選択された音声パスワードがユーザーに提示される場合について説明したが、複数の音声パスワードが提示され、これらの中から発声する音声パスワードを認証対象ユーザーが選択してもよい。

また、ユーザー認証処理の開始時、認証対象ユーザーが何らかの認証用音声を発声するようにしているが、既登録ユーザーにより予め登録された音声が認証用音声として発声されるようにしてもよい。

（実施の形態２）
次に、実施の形態２について説明する。本実施の形態では、ネットワークを介してサーバ装置との間でユーザー認証を行うユーザー認証ネットワークシステムについて説明する。なお、以下では、前述の実施の形態と重複する箇所についての説明を適宜省略する。

図５は、本発明の実施の形態２に係るユーザー認証ネットワークシステムの構成の一例を示すブロック図である。図５に示すユーザー認証ネットワークシステム４５０は、情報処理装置４００（例えば４００－１，４００－２）、サーバ装置４３０、外部ネットワーク４４０を備えている。外部ネットワーク４４０は、情報処理装置４００とサーバ装置４３０とを接続する。

情報処理装置４００（例えば４００－１，４００－２）は、施設４２０（例えば４２０－１～４２０－２）にそれぞれ含まれている。施設４２０（例えば４２０－１～４２０－２）は、例えば、情報処理装置４００（例えば４００－１～４００－２）、入館ゲート４１０（例えば４１０－１～４１０－２）をそれぞれ備えている。

入館ゲート４１０は、例えば、施設４２０の入口付近に配置される。また、情報処理装置４００は、入館ゲート４１０付近に配置され、入館ゲート４１０を通過しようとする人を認証対象ユーザーとしてユーザー認証処理を行う。ユーザー認証された認証対象ユーザーは、入館ゲート４１０の通過が許可され、施設４２０内に入館することができる。

なお、施設４２０－２の構成は、施設４２０－１と同様であるので、以下では、施設４２０－１を例に、施設の構成を説明する。情報処理装置４００－１は、実施の形態１の情報処理装置１００の構成と類似している。情報処理装置４００－１と情報処理装置１００との相違点は、メモリ１１４にユーザー情報記憶領域１０６が設けられていないこと、及び機能動作制御部４０１が追加されていることである。

機能動作制御部４０１は、対応する入館ゲート４１０－１の開閉状態を制御する機能ブロックである。機能動作制御部４０１は、情報処理装置４００－１においてユーザー認証処理が完了すると、入館ゲート４１０を閉状態から開状態へ切り換える入館ゲート制御信号を送信する。これにより、認証された認証対象ユーザーは、入館ゲート４１０－１を通過することができる。

サーバ装置４３０は、施設４２０への入館が許可された既登録ユーザーの情報を管理する装置である。図４に示すように、サーバ装置４３０は、コントローラ４２１、メモリ４２４、通信部４２９等を備えている。サーバ装置４３０を構成する各部は、バス４２８を介して相互に接続されている。

メモリ４２４は、サーバ装置４３０に係る各種情報を格納する機能ブロックである。メモリ４２４は、例えば、コントローラ４２１で使用される各種プログラムや、登録ユーザーごとの音声特徴及び音声パスワード等の各種情報を保存する。メモリ４２４は、プログラム記憶領域４２３、複数のユーザー情報記憶領域４２６を備えている。ユーザー情報記憶領域４２６は、図１のユーザー情報記憶領域１０６に対応するものである。なお、図４では、既登録ユーザーであるユーザーＥ～Ｇに対応するユーザー情報記憶領域４２６ｅ～４２６ｇが示されている。

プログラム記憶領域４２３は、ＯＳや動作制御用アプリケーション等の各種プログラムを保存する記憶領域である。これらのプログラムは、コントローラ４２１で展開され実行される。

ユーザー情報記憶領域４２６ｅは、ユーザーＥのユーザー情報を保存する記憶領域である。ユーザー情報記憶領域４２６ｅは、例えば、ユーザーＥの音声特徴を保存する音声特徴記憶領域４２２ｅ、ユーザーＥの音声パスワードを保存する音声パスワード記憶領域４２３ｅ～４２５ｅ等を備えている。音声パスワード記憶領域４２３ｅ～４２５ｅには、互いに異なる音声パスワードがそれぞれ保存される。なお、音声パスワード記憶領域の個数は、情報処理装置１００と同様、これより少なくてもよいし、これより多くてもよい。

ユーザー情報記憶領域４２６ｆは、ユーザーＦのユーザー情報を保存する記憶領域である。ユーザー情報記憶領域４２６ｆは、例えば、ユーザーＦの音声特徴を保存する音声特徴記憶領域４２２ｆ、ユーザーＦの音声パスワードを保存する音声パスワード記憶領域４２３ｆ～４２５ｆ等を備えている。

ユーザー情報記憶領域４２６ｇは、ユーザーＧのユーザー情報を保存する記憶領域である。図示はしていないが、ユーザー情報記憶領域４２６ｇも、ユーザーＧの音声特徴を保存する音声特徴記憶領域、ユーザーＧの音声パスワードを保存する複数の音声パスワード記憶領域等を備えている。

通信部４２９は、外部ネットワーク４４０と接続され、外部ネットワーク４４０を介して情報処理装置４００との間で情報の送受信を行う通信インターフェースである。具体的には、情報処理装置４００の通信部１２９は、外部ネットワーク４４０を介してサーバ装置４３０の通信部４２９と接続され、互いの通信部間において情報の送受信が行われる。

また、情報処理装置４００は、基地局４４５を介してサーバ装置４３０との間で情報の送受信を行ってもよい。具体的には、情報処理装置４００の基地局通信部１３０が、基地局４４５及び外部ネットワーク４４０を介してサーバ装置４３０の通信部４２９と接続され、互いの通信部間において情報の送受信が行われる。

コントローラ４２１は、ＣＰＵ等で構成され、メモリ４２４に保存されているＯＳや動作制御用アプリケーション等のプログラムを実行することにより、サーバ装置４３０を構成する各部を制御し、サーバ装置４３０全体の動作制御処理を行う。

ユーザー登録処理時、コントローラ４２１は、情報処理装置４００から送信される登録対象ユーザーの音声特徴及び音声パスワードを、通信部４２９を介して受信し、メモリ４２４に保存する。また、ユーザー認証処理時、コントローラ４２１は、メモリ４２４に保存されている音声特徴及び音声パスワードを、通信部４２９を介して情報処理装置４００へ送信する。

＜ユーザー登録処理＞
次に、ユーザー認証ネットワークシステム４５０におけるユーザー登録処理について説明する。なお、以下では、情報処理装置４００－１（施設４２０－１）とサーバ装置４３０との間における処理を例にして、ユーザー登録処理を説明するが、その他の情報処理装置４００とサーバ装置４３０との間においても同様の処理がなされる。

図６は、本発明の実施の形態２に係るユーザー登録処理の動作シーケンスの一例を示す図である。図６では、左側に登録対象ユーザーの動作が示され、中央に情報処理装置４００－１の動作が示され、右側にサーバ装置４３０の動作がそれぞれ示されている。なお、図６では、図２と同様の処理が行われるステップには同一の符号が付されており、該当するステップについての詳細な説明は適宜省略する。

本実施の形態のユーザー登録処理では、ステップＳ２０１～Ｓ２０７，Ｓ２１２～Ｓ２１５、及び以下のステップＳ５０１～Ｓ５１４の処理が行われる。まず、登録対象ユーザーによるユーザー登録処理開始の入力操作（Ｓ２０１）から、情報処理装置４００－１による音声特徴の抽出処理（Ｓ２０７）までの各処理については、説明を省略する。

音声特徴（第１の音声特徴）の抽出処理が行われると、情報処理装置４００－１は、サーバ装置４３０に保存されている全登録ユーザーの音声特徴を自身の情報処理装置４００－１へ送信するよう、音声特徴の送信要求をサーバ装置４０３に送信する（Ｓ５０１）。

サーバ装置４０３は、情報処理装置４００－１から送信された登録ユーザーの音声特徴の送信要求を受信すると（Ｓ５０２）、メモリ４２４に保存されている全登録ユーザーの音声特徴を情報処理装置４００－１へ送信する（Ｓ５０３）。なお、サーバ装置４３０は、情報処理装置４００（施設４２０）ごとに登録ユーザーの管理を行っている場合、音声特徴の送信要求を行った情報処理装置（例えば４００－１）の登録ユーザーの音声特徴のみを送信する。

情報処理装置４００－１がサーバ装置４０３から送信された音声特徴を受信すると（Ｓ５０４）、音声特徴照合判別処理部１２３は、ステップＳ２０７において抽出された音声特徴と、受信した登録ユーザーの音声特徴とを比較照合し（Ｓ５０５）、抽出された音声特徴がすでに登録されているかどうかを判断する（Ｓ５０６）。抽出した音声特徴が、いずれの登録ユーザーの音声特徴とも一致しないと判断した場合（Ｎ）、コントローラ１０１は、この登録対象ユーザーが、未登録の新規登録ユーザーであると判断し、抽出した音声特徴をサーバ装置４３０へ送信する（Ｓ５０７）。

情報処理装置４００－１から送信された音声特徴を受信すると、サーバ装置４３０は、メモリ４２４におけるユーザー情報未登録のユーザー情報記憶領域４２６に、受信した音声特徴を登録する（Ｓ５０８）。具体的には、コントローラ４２１は、この登録対象ユーザー用のユーザー情報記憶領域４２６を新たに割り当て、登録対象ユーザーの音声特徴を、新たに割り当てたユーザー情報記憶領域４２６の音声特徴記憶領域に保存する。そして、サーバ装置４３０は、受信した音声特徴の登録保存が完了したことを通知する保存完了通知を情報処理装置４００－１へ送信する（Ｓ５０９）。

情報処理装置４００－１は、送信した音声特徴の登録完了通知を受信すると（Ｓ５１０）、登録された音声特徴に基づいて応する音声パスワードを複数生成しサーバ装置４０３に送信する（Ｓ５１１）。

音声パスワード生成処理部１２４は、登録した音声特徴に基づいて、新規登録ユーザーの音声パスワードを複数生成する。そして、情報処理装置４００－１は、生成した複数の音声パスワードをサーバ装置４３０へ送信する（Ｓ５１１）。

サーバ装置４３０は、情報処理装置４００－１から送信された複数の音声パスワードを受信すると、受信した音声パスワードを、新規登録ユーザーに対応するユーザー情報記憶領域４２６の音声パスワード記憶領域に保存し（Ｓ５１２）、音声パスワードの登録保存が完了したことを示す登録完了通知を情報処理装置４００－１へ送信する（Ｓ５１３）。

情報処理装置４００－１が音声パスワードの登録完了通知を受信すると（Ｓ５１４）、ユーザー登録処理が完了する。情報処理装置４００－１のコントローラ１０１は、ユーザー登録が完了したことを、表示部１２８への表示、音声出力処理部１２１からの放音により登録対象ユーザー（新規登録ユーザー）に通知する（ステップＳ２１２）。

一方、ステップＳ５０６において、抽出した登録対象ユーザーの音声特徴が、サーバ装置４３０から送信された音声特徴のいずれかと一致する場合（Ｙ）、コントローラ１０１は、この登録対象ユーザーが、すでに登録された既登録ユーザーであると判断し、すでに登録されていることを、表示部１２８への表示や、音声出力処理部１２１からの放音により登録対象ユーザーに通知する（ステップＳ２１４）。なお、ステップＳ２１２～Ｓ２１５についての詳しい説明は省略する。

＜ユーザー認証処理＞
次に、本実施の形態におけるユーザー認証処理について説明する。なお、以下でも、除法処理装置４００－１（施設４２０－１）とサーバ装置４３０との間における処理を例にして、ユーザー認証処理の説明を行うが、その他の情報処理装置４００（施設４２０）とサーバ装置４３０との間においても同様の処理がなされる。

図７は、本発明の実施の形態２に係るユーザー認証処理の動作シーケンスの一例を示す図である。図７では、左側に認証対象ユーザーの動作が示され、中央に情報処理装置４００－１の動作が示され、右側にサーバ装置４３０の動作がそれぞれ示されている。なお、図７では、図３～４と同様の処理が行われるステップには同一の符号が付されており、該当するステップについての詳細な説明は適宜省略する。なお、図７の主要シーケンスＳ３５０は、図４と同様であり、主要シーケンスと主要シーケンス外との接続関係を示すステップのみが便宜的に示されている。

まず、ユーザー認証処理を開始時における、認証対象ユーザーによる認証用音声の発声（Ｓ３０１）から、情報処理装置４００が、認証用音声の音声信号から認証対象ユーザーの音声特徴を抽出する（Ｓ３０３）までのステップＳ３０１～Ｓ３０３については、説明を省略する。

そして、認証対象ユーザーの音声特徴が抽出されると、情報処理装置４００－１は、サーバ装置４３０に登録されている音声特徴を自身の情報処理装置４００－１に送信するよう、音声特徴の送信要求をサーバ装置４３０に送信する（Ｓ６０１）。

サーバ装置４３０は、情報処理装置４００から音声特徴の送信要求を受信すると（Ｓ６０２）、メモリ４２４に登録されている音声特徴を情報処理装置４００－１へ送信する（Ｓ６０３）。

情報処理装置４００－１は、サーバ装置４０３から送信された音声特徴を受信すると、例えばコントローラ１０１内のＲＡＭやメモリ１１４に、受信した音声特徴を一時的に保存する（Ｓ６０４）。

音声特徴照合判別処理部１２３は、ステップＳ３０３において抽出された音声特徴と、サーバ装置４３０から受信した既登録ユーザーの音声特徴とを比較照合し（Ｓ３０４）、抽出した音声特徴が、すでに登録されているかどうかを判断する（Ｓ３０５）。

音声特徴照合判別処理部１２３が、抽出した認証対象ユーザーの音声特徴がサーバ装置４３０から受信したいずれかの音声特徴と一致すると判断した場合（Ｙ）、コントローラ１０１は、認証対象ユーザーの音声特徴と一致する音声特徴に対応する既登録ユーザー（例えばユーザーＥ）を、音声パスワードによる認証対象となる特定ユーザーとして絞り込む（Ｓ３０６）。特定ユーザー（例えばユーザーＥ）が絞り込まれると、情報処理装置４００－１は、特定ユーザーの音声パスワードの送信要求をサーバ装置４３０へ送信する（Ｓ６０５）。

サーバ装置４３０が情報処理装置４００－１から音声パスワードの送信要求を受信すると（Ｓ６０６）、コントローラ４２１は、ユーザーＥに対応する複数の音声パスワード記憶領域（４２３ｅ～４２５ｅ）からすべての音声パスワードを読み出し、読み出した音声パスワードを、通信部４２９を介して情報処理装置４００－１へ送信する（Ｓ６０７）。

情報処理装置４００－１は、サーバ装置４３０から送信された音声パスワードを受信すると、例えばコントローラ１０１内のＲＡＭやメモリ１１４に、受信した音声パスワードを一時的に保存する（Ｓ６０８）。

そして、コントローラ１０１は、受信した特定ユーザー（ユーザーＥ）の音声パスワードから、１つの音声パスワードをランダムに選択する（Ｓ３０７）。

一方、ステップＳ３０５において、音声特徴照合判別処理部１２３が、抽出した音声特徴がサーバ装置４３０から受信したいずれの音声特徴とも一致しないと判断した場合（Ｎ）、コントローラ１０１は、ユーザー認証が不可能であることを、表示部１２８への表示や、音声出力処理部１２１からの放音により認証対象ユーザーに通知する（Ｓ３２４）。

ステップＳ３０７，Ｓ３２４以降は、図４の主要シーケンスＳ３５０に含まれる各処理が行われる。このうち、ステップＳ３２０では、認証対象ユーザーは、例えば表示部１２８に表示される確認ボタンをタッチすることにより、ユーザー認証処理の完了を認識したことを情報処理装置４００－１へ通知してもよい。

そして、ユーザー認証処理が完了したことを認証対象ユーザーが認識すると、機能動作制御部４０１は、入館ゲート４１０－１を閉状態から開状態へ切り換える入館ゲート制御信号を送信する。これにより、入館ゲート４１０－１が開門され、ユーザー認証された認証対象ユーザーは、入館ゲート４１０－１を通過し、施設４２０－１内に入館することができる（Ｓ６１０）。

なお、ステップＳ３１９において、ユーザー認証の完了が通知されてから所定の待機時間が経過した後、ステップＳ６１０の処理が行われてもよい。

＜効果等＞
本実施の形態によれば、すでに述べた実施の形態１における各効果に加え、以下の効果が得られる。本実施の形態によれば、情報処理装置４００から離れた場所に設けられたサーバ装置４３０に登録ユーザーの音声特徴及び音声パスワードが保存され、情報処理装置４００は、外部ネットワーク４４０を介してサーバ装置４３０から音声特徴及び音声パスワードを受信する。この構成によれば、外部ネットワーク４４０と接続されたあらゆる施設４２０の情報処理装置４００からでも、サーバ装置４３０内に保存されている音声特徴及び音声パスワードを受信してユーザー認証処理を行うことができる。また、登録ユーザーの各種情報の管理が一元化される。

また、本実施の形態では、サーバ装置として、クラウドサーバが用いられてもよい。この構成によれば、サーバ装置４３０の容量が大容量化され、より多くの既登録ユーザーの情報を保存することが可能となる。また、既登録ユーザーのデータベースの構築や活用が可能となる。

また、本実施の形態においても、情報処理装置４００は、ユーザー認証処理後、登録ユーザーが発する音声を取り込み、音声特徴を随時更新し、更新した音声特徴に基づいて新たな音声パスワードを生成してもよい。更新された音声特徴及び新たな音声パスワードは、サーバ装置４３０へ送信され、メモリ４２４に保存される。

なお、情報処理装置４００は、サーバ装置４３０の容量、サーバ装置４３０との通信状況等を考慮し、生成した音声パスワードを自身のメモリ１１４に格納してもよい。

また、本実施の形態では、ユーザー認証ネットワークシステムとして、入館ゲート４１０の開門制御が例示されているが、これに限らず、パソコン等によるログイン処理や、複数の部屋に対する入室管理等を行う場所に対しても、ユーザー認証ネットワークシステムは利用可能である。

また、図１、図４で示した例では、ユーザー登録処理やユーザー認証処理の開始時に、登録対象ユーザーや認証対象ユーザーが発声する音声が用いられているが、ユーザーを特定する利用者ＩＤ（identification）等のデータ情報がこれらの音声に代えて入力されてもよい。

この場合、ユーザー登録処理時、情報処理装置４００は、入力されたデータ情報から登録対象ユーザーが既登録ユーザーであるかどうかを照合判別し、登録対象ユーザーが既登録ユーザーではないと判断すれば、何らかの音声(所定の音声パスワードでもよい)を発するよう登録対象ユーザーに通知する。情報処理装置４００は、ユーザーが発声した音声を取り込み、この音声から音声特徴を抽出し、音声パスワードを生成し、音声特徴及び音声パスワードとともにこの登録対象ユーザーをユーザー登録すればよい。

また、ユーザー認証処理時、情報処理装置４００は、入力されたデータ情報から認証対象ユーザーが既登録ユーザーかどうかを照合判別し、既登録ユーザーであると判断すれば、既登録ユーザーの音声パスワードをランダムに選択して認証対象ユーザーに提示すればよい。

また、図１、図４に示した音声入力処理部１２０は、マイクが発声音声を取り込む構成となっているが、ユーザーの音声を取り込む方法としては、これ以外にも、骨伝導等による方法がある。骨伝導は、空気を伝わって鼓膜に振動させ聴覚神経に伝える気導音、すなわち、耳からの集音音声に対し、声帯などの振動が頭蓋骨を伝わり直接聴覚神経に伝わる骨導音によるものである。例えばディスプレイを頭部に装着するヘッドマウントディスプレイでは、利用者から発声された音声信号を気導音だけでなく、頭部に装着されていることより、骨伝導による骨導音も取り込めることができ、この場合も図１、図４に示した実施例と同様にして、ユーザー登録処理やユーザー認証処理が行われる。

なお、本発明は上記した実施の形態に限定されるものではなく、様々な変形例が含まれる。また、上記した実施の形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。

また、ある実施の形態の構成の一部を他の実施の形態の構成に置き換えることが可能であり、また、ある実施の形態の構成に他の実施の形態の構成を加えることも可能である。また、各実施の形態の構成の一部について、他の構成の追加、削除、置換をすることが可能である。なお、図面に記載した各部材や相対的なサイズは、本発明を分かりやすく説明するため簡素化・理想化しており、実装上はより複雑な形状となる場合がある。

１００，４００…情報処理装置、１０１…コントローラ、１１４…メモリ、１２０…音声入力処理部、４２４…メモリ、４３０…サーバ装置、４４０…外部ネットワーク、４５０…ユーザー認証ネットワークシステム

Claims

情報処理装置であって、
音声入力処理部と、
メモリと、
コントローラと、
を備え、
前記情報処理装置にユーザーを登録するためのユーザー登録処理では、
前記音声入力処理部は、登録対象ユーザーが発する登録用音声を取り込み、前記登録用音声を第１の音声信号に変換し、
前記コントローラは、前記第１の音声信号から第１の音声特徴を抽出し、前記第１の音声特徴と既に前記メモリに保存されている既登録ユーザーの音声特徴とを比較し、一致しない場合は前記第１の音声特徴を前記登録対象ユーザーと対応付けて前記メモリへ保存し、前記第１の音声特徴に基づいて音声パスワードを生成し、前記音声パスワードを前記メモリへ保存する、処理を実行し、
前記ユーザー登録処理により前記メモリに保存した前記音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行う、
情報処理装置。
請求項１に記載の情報処理装置において、
前記ユーザー認証処理では、
前記音声入力処理部は、認証対象ユーザーが発する認証用音声を取り込み、前記認証用音声を第２の音声信号に変換し、
前記コントローラは、前記第２の音声信号から第２の音声特徴を抽出し、前記第２の音声特徴と既に前記メモリに保存されている前記既登録ユーザーの音声特徴とを比較し、一致する場合は前記第２の音声特徴と一致する音声特徴に対応した既登録ユーザーを特定ユーザーとして絞り込み、前記特定ユーザーの音声パスワードを前記認証対象ユーザーに提示し、
前記音声入力処理部は、前記認証対象ユーザーが発した音声パスワードの音声を取り込み、前記認証対象ユーザーが発した前記音声パスワードの音声を第３の音声信号に変換し、
前記コントローラは、前記第３の音声信号から前記認証対象ユーザーが発した前記音声パスワードを抽出し、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとを比較し、一致する場合は前記認証対象ユーザーが前記特定ユーザーであると判断する、
情報処理装置。
請求項２に記載の情報処理装置において、
前記コントローラは、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとが一致する場合は前記第３の音声信号から第３の音声特徴を抽出し、前記第３の音声特徴と前記特定ユーザーの音声特徴とを比較し、一致する場合は前記認証対象ユーザーが前記特定ユーザーであると判断する、
情報処理装置。
請求項２に記載の情報処理装置において、
前記コントローラは、前記ユーザー登録処理では、前記第１の音声特徴に基づいて複数の前記音声パスワードを生成し、前記ユーザー認証処理では、前記複数の音声パスワードからランダムに選択した前記音声パスワードを前記認証対象ユーザーに提示する、
情報処理装置。
請求項２に記載の情報処理装置において、
前記ユーザー認証処理では、前記コントローラは、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示した後、
前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んだかどうかを判断し、
前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示してから経過した提示時間を計測し、前記提示時間がタイムアウト時間を経過したかどうかを判断し、
前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んでおらず、前記提示時間が前記タイムアウト時間を経過している場合は前記ユーザー認証処理を停止する、
情報処理装置。
請求項１に記載の情報処理装置において、
前記ユーザー認証処理の完了後、前記音声入力処理部は、認証された前記認証対象ユーザーが発する認証後音声を取り込み、前記認証後音声を第４の音声信号に変換し、
前記コントローラは、前記第４の音声信号から第４の音声特徴を抽出し、前記第４の音声特徴に基づいて、前記メモリに保存されている前記認証された認証対象ユーザーの音声特徴を更新し、更新された前記音声特徴に基づいて新たな音声パスワードを生成し、前記新たな音声パスワードを前記認証された認証対象ユーザーと対応付けて前記メモリに保存する、
情報処理装置。
音声入力処理部と、コントローラと、を備えた情報処理装置と、
メモリを備えたサーバ装置と、
前記情報処理装置と前記サーバ装置とを接続する外部ネットワークと、
を備えたユーザー認証ネットワークシステムであって、
前記ユーザー認証ネットワークシステムにユーザーを登録するためのユーザー登録処理では、
前記音声入力処理部は、登録対象ユーザーが発する登録用音声を取り込み、前記登録用音声を第１の音声信号に変換し、
前記コントローラは、前記第１の音声信号から第１の音声特徴を抽出し、
前記情報処理装置は、既に前記メモリに保存されている既登録ユーザーの音声特徴の送信要求を前記サーバ装置に送信し、
前記サーバ装置は、前記既登録ユーザーの音声特徴の送信要求を受信すると、前記メモリに保存されている前記既登録ユーザーの音声特徴を、前記情報処理装置に送信し、
前記情報処理装置が、前記既登録ユーザーの音声特徴を受信すると、前記コントローラは、前記第１の音声特徴と受信した前記既登録ユーザーの音声特徴とを比較し、一致しない場合、
前記情報処理装置は、前記第１の音声特徴を前記サーバ装置へ送信し、
前記サーバ装置は、受信した前記第１の音声特徴を前記登録対象ユーザーと対応付けて前記メモリへ保存し、前記第１の音声特徴の登録完了通知を前記情報処理装置へ送信し、
前記情報処理装置が前記登録完了通知を受信すると、前記コントローラは、前記第１の音声特徴に基づいて音声パスワードを生成し、生成した前記音声パスワードを前記サーバ装置へ送信し、
前記サーバ装置は、前記音声パスワードを受信すると、受信した前記音声パスワードを前記メモリへ保存し、
前記コントローラは、前記ユーザー登録処理により前記メモリに保存した前記音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行う、
ユーザー認証ネットワークシステム。
請求項７に記載のユーザー認証ネットワークシステムにおいて、
前記ユーザー認証処理では、
前記音声入力処理部は、認証対象ユーザーが発する認証用音声を取り込み、前記認証用音声を第２の音声信号に変換し、
前記コントローラは、前記第２の音声信号から第２の音声特徴を抽出し、
前記情報処理装置は、前記既登録ユーザーの音声特徴の送信要求を前記サーバ装置に送信し、
前記サーバ装置は、前記既登録ユーザーの音声特徴の送信要求を受信すると、前記メモリに保存されている前記既登録ユーザーの音声特徴を、前記情報処理装置に送信し、
前記情報処理装置が、前記既登録ユーザーの音声特徴を受信すると、前記コントローラは、前記第２の音声特徴と受信した前記既登録ユーザーの音声特徴とを比較し、一致する場合は前記第２の音声特徴と一致する音声特徴に対応した既登録ユーザーを特定ユーザーとして絞り込み、
前記情報処理装置は、前記特定ユーザーの音声パスワードの送信要求を前記サーバ装置へ送信し、
前記サーバ装置は、前記特定ユーザーの音声パスワードの送信要求を受信すると、前記特定ユーザーの音声パスワードを前記情報処理装置へ送信し、
前記情報処理装置は、受信した前記特定ユーザーの音声パスワードを前記認証対象ユーザーに提示し、
前記音声入力処理部は、前記認証対象ユーザーが発した音声パスワードの音声を取り込み、前記認証対象ユーザーが発した前記音声パスワードの音声を第３の音声信号に変換し、
前記コントローラは、前記第３の音声信号から前記認証対象ユーザーが発した前記音声パスワードを抽出し、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとを比較し、一致する場合は前記認証対象ユーザーが前記特定ユーザーであると判断する、
ユーザー認証ネットワークシステム。
請求項８に記載のユーザー認証ネットワークシステムにおいて、
前記コントローラは、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとが一致する場合は前記第３の音声信号から第３の音声特徴を抽出し、前記第３の音声特徴と前記特定ユーザーの音声特徴とを比較し、一致すると場合は前記認証対象ユーザーが前記特定ユーザーであると判断する、
ユーザー認証ネットワークシステム。
請求項８に記載のユーザー認証ネットワークシステムにおいて、
前記コントローラは、前記ユーザー登録処理では、前記第１の音声特徴に基づいて複数の前記音声パスワードを生成し、前記ユーザー認証処理では、前記複数の音声パスワードからランダムに選択した前記音声パスワードを前記認証対象ユーザーに提示する、
ユーザー認証ネットワークシステム。
請求項８に記載のユーザー認証ネットワークシステムにおいて、
前記ユーザー認証処理では、前記コントローラは、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示した後、
前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んだかどうかを判断し、
前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示してから経過した提示時間を計測し、前記提示時間がタイムアウト時間を経過したかどうかを判断し、
前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んでおらず、前記提示時間が前記タイムアウト時間を経過している場合は前記ユーザー認証処理を停止する、
ユーザー認証ネットワークシステム。
請求項７に記載のユーザー認証ネットワークシステムにおいて、
前記ユーザー認証処理の完了後、前記音声入力処理部は、認証された前記認証対象ユーザーが発する認証後音声を取り込み、前記認証後音声を第４の音声信号に変換し、
前記コントローラは、前記第４の音声信号から第４の音声特徴を抽出し、前記第４の音声特徴に基づいて、前記メモリに保存されている前記認証された認証対象ユーザーの音声特徴を更新し、更新された前記音声特徴に基づいて新たな音声パスワードを生成し、
前記情報処理装置は、更新された前記音声特徴及び前記新たな音声パスワードを前記サーバ装置へ送信し、
前記サーバ装置は、更新された前記音声特徴及び前記新たな音声パスワードを受信すると、受信した前記更新された音声特徴及び前記新たな音声パスワードを前記認証された認証対象ユーザーと対応付けて前記メモリへ保存する、
ユーザー認証ネットワークシステム。
音声入力処理部と、メモリと、コントローラと、を備えた情報処理装置におけるユーザー認証方法であって、
前記情報処理装置にユーザーを登録するためのユーザー登録処理では、
前記音声入力処理部が、登録対象ユーザーが発する登録用音声を取り込み、前記登録用音声を第１の音声信号に変換するステップと、
前記コントローラが、前記第１の音声信号から第１の音声特徴を抽出するステップと、
前記コントローラが、前記第１の音声特徴と既に前記メモリに保存されている既登録ユーザーの音声特徴とを比較するステップと、
前記第１の音声特徴が前記既登録ユーザーの音声特徴と一致しない場合、前記コントローラが、前記第１の音声特徴を前記登録対象ユーザーと対応付けて前記メモリへ保存し、前記第１の音声特徴に基づいて音声パスワードを生成し、前記音声パスワードを前記メモリへ保存するステップと、
を有し、
前記コントローラが、前記ユーザー登録処理により前記メモリに保存した前記音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行うステップを有する、
ユーザー認証方法。
請求項１３に記載のユーザー認証方法において、
前記ユーザー認証処理では、
前記音声入力処理部が、認証対象ユーザーが発する認証用音声を取り込み、前記認証用音声を第２の音声信号に変換するステップと、
前記コントローラが、前記第２の音声信号から第２の音声特徴を抽出するステップと、
前記コントローラが、前記第２の音声特徴と既に前記メモリに保存されている前記既登録ユーザーの音声特徴と前記第２の音声特徴とを比較するステップと、
前記登録ユーザーの音声特徴と前記第２の音声特徴とが一致する場合、前記コントローラが、前記第２の音声特徴と一致する音声特徴に対応した既登録ユーザーを特定ユーザーとして絞り込み、前記特定ユーザーの音声パスワードを前記認証対象ユーザーに提示するステップと、
前記音声入力処理部が、前記認証対象ユーザーが発した音声パスワードの音声を取り込み、前記認証対象ユーザーが発した前記音声パスワードの音声を第３の音声信号に変換するステップと、
前記コントローラが、前記第３の音声信号から前記認証対象ユーザーが発した前記音声パスワードを抽出ステップと、
前記コントローラが、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとを比較するステップと、
前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとが一致する場合、前記コントローラが、前記認証対象ユーザーは前記特定ユーザーであると判断するステップと、
を有する、
ユーザー認証方法。
請求項１４に記載のユーザー認証方法において、
前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとが一致する場合、前記コントローラが、前記第３の音声信号から第３の音声特徴を抽出するステップと、
前記コントローラが、前記第３の音声特徴と前記特定ユーザーの音声特徴とを比較するステップと、
前記第３の音声特徴と前記特定ユーザーの音声特徴とが一致する場合、前記コントローラが、前記認証対象ユーザーは前記特定ユーザーであると判断するステップと、
を有する、
ユーザー認証方法。
請求項１４に記載のユーザー認証方法において、
前記ユーザー認証処理では、
前記コントローラが、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示するステップの後、
前記コントローラが、前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んだかどうかを判断するステップと、
前記コントローラが、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示してから経過した提示時間を計測するステップと、
前記コントローラが、前記提示時間がタイムアウト時間を経過したかどうかを判断するステップと、
前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んでおらず、前記提示時間が前記タイムアウト時間を経過している場合、前記コントローラが、前記ユーザー認証処理を停止するステップと、
を有する、
ユーザー認証方法。
請求項１３に記載のユーザー認証方法において、
前記ユーザー認証処理の完了後、
前記音声入力処理部が、認証された前記認証対象ユーザーが発する認証後音声を取り込み、前記認証後音声を第４の音声信号に変換するステップと、
前記コントローラが、前記第４の音声信号から第４の音声特徴を抽出するステップと、
前記コントローラが、前記第４の音声特徴に基づいて、前記メモリに保存されている前記認証された認証対象ユーザーの音声特徴を更新し、更新された前記音声特徴に基づいて新たな音声パスワードを生成し、前記新たな音声パスワードを前記認証された認証対象ユーザーと対応付けて前記メモリに保存するステップと、
を有する、
ユーザー認証方法。
音声入力処理部と、コントローラと、を備えた情報処理装置と、
メモリを備えたサーバ装置と、
前記情報処理装置と前記サーバ装置とを接続する外部ネットワークと、
を備えたユーザー認証ネットワークシステムにおけるユーザー認証方法であって、
前記ユーザー認証ネットワークシステムにユーザーを登録するためのユーザー登録処理では、
前記音声入力処理部が、登録対象ユーザーが発する登録用音声を取り込み、前記登録用音声を第１の音声信号に変換するステップと、
前記コントローラが、前記第１の音声信号から第１の音声特徴を抽出するステップと、
前記情報処理装置が、既に前記メモリに保存されている既登録ユーザーの音声特徴の送信要求を前記サーバ装置に送信するステップと、
前記サーバ装置が、前記既登録ユーザーの音声特徴の送信要求を受信すると、前記メモリに保存されている前記既登録ユーザーの音声特徴を、前記情報処理装置に送信するステップと、
前記情報処理装置が、前記既登録ユーザーの音声特徴を受信すると、前記コントローラが、前記第１の音声特徴と受信した前記既登録ユーザーの音声特徴とを比較するステップと、
前記第１の音声特徴が前記登録ユーザーの音声特徴と一致しない場合、前記情報処理装置が、前記第１の音声特徴を前記サーバ装置へ送信するステップと、
前記サーバ装置が、受信した前記第１の音声特徴を前記登録対象ユーザーと対応付けて前記メモリへ保存し、前記第１の音声特徴の登録完了通知を前記情報処理装置へ送信するステップと、
前記情報処理装置が前記登録完了通知を受信すると、前記コントローラが、前記第１の音声特徴に基づいて音声パスワードを生成し、生成した前記音声パスワードを前記サーバ装置へ送信するステップと、
前記サーバ装置が、前記音声パスワードを受信すると、受信した前記音声パスワードを前記メモリへ保存するステップと、
を有し、
前記コントローラが、前記ユーザー登録処理により前記メモリに保存した前記音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行うステップを有する、
ユーザー認証方法。
請求項１８に記載のユーザー認証方法において、
前記ユーザー認証処理では、
前記音声入力処理部が、認証対象ユーザーが発する認証用音声を取り込み、前記認証用音声を第２の音声信号に変換するステップと、
前記コントローラが、前記第２の音声信号から第２の音声特徴を抽出するステップと、
前記情報処理装置が、前記既登録ユーザーの音声特徴の送信要求を前記サーバ装置に送信するステップと、
前記サーバ装置が、前記既登録ユーザーの音声特徴の送信要求を受信すると、前記メモリに保存されている前記既登録ユーザーの音声特徴を、前記情報処理装置に送信するステップと、
前記情報処理装置が、前記既登録ユーザーの音声特徴を受信すると、前記コントローラが、前記第２の音声特徴と受信した前記登録ユーザーの音声特徴とを比較するステップと、
前記登録ユーザーの音声特徴と前記第２の音声特徴とが一致する場合、前記コントローラが、前記第２の音声特徴と一致する前記登録ユーザーの音声特徴に対応した既登録ユーザーを特定ユーザーとして絞り込むステップと、
前記情報処理装置が、前記特定ユーザーの音声パスワードの送信要求を前記サーバ装置へ送信するステップと、
前記サーバ装置が、前記特定ユーザーの音声パスワードの送信要求を受信すると、前記特定ユーザーの音声パスワードを前記情報処理装置へ送信するステップと、
前記情報処理装置が、受信した前記特定ユーザーの音声パスワードを前記認証対象ユーザーに提示するステップと、
前記音声入力処理部が、前記認証対象ユーザーが発した音声パスワードの音声を取り込み、前記認証対象ユーザーが発した前記音声パスワードの音声を第３の音声信号に変換するステップと、
前記コントローラが、前記第３の音声信号から前記認証対象ユーザーが発した前記音声パスワードを抽出するステップと、
前記コントローラが、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとを比較するステップと、
前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとが一致する場合、前記コントローラが、前記認証対象ユーザーは前記特定ユーザーであると判断するステップと、
を有する、
ユーザー認証方法。
請求項１９に記載のユーザー認証方法において、
前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第３の音声信号から抽出した前記音声パスワードとが一致する場合、前記コントローラが、前記第３の音声信号から第３の音声特徴を抽出するステップと、
前記コントローラが、前記第３の音声特徴と前記特定ユーザーの音声特徴とを比較するステップと、
前記第３の音声特徴と前記特定ユーザーの音声特徴とが一致する場合、前記コントローラが、前記認証対象ユーザーは前記特定ユーザーであると判断するステップと、
を有する、
ユーザー認証方法。
請求項１９に記載のユーザー認証方法において、
前記ユーザー認証処理では、
前記コントローラが、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示するステップの後、
前記コントローラが、前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んだかどうかを判断するステップと、
前記コントローラが、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示してから経過した提示時間を計測するステップと、
前記コントローラが、前記提示時間がタイムアウト時間を経過したかどうかを判断するステップと、
前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んでおらず、前記提示時間が前記タイムアウト時間を経過している場合、前記コントローラが、前記ユーザー認証処理を停止するステップと、
を有する、
ユーザー認証方法。
請求項１８に記載のユーザー認証方法において、
前記ユーザー認証処理の完了後、
前記音声入力処理部が、認証された前記認証対象ユーザーが発する認証後音声を取り込み、前記認証後音声を第４の音声信号に変換するステップと、
前記コントローラが、前記第４の音声信号から第４の音声特徴を抽出するステップと、
前記コントローラが、前記第４の音声特徴に基づいて、前記メモリに保存されている前記認証された認証対象ユーザーの音声特徴を更新し、更新された前記音声特徴に基づいて新たな音声パスワードを生成するステップと、
前記情報処理装置が、更新された前記音声特徴及び前記新たな音声パスワードを前記サーバ装置へ送信するステップと、
前記サーバ装置が、更新された前記音声特徴及び前記新たな音声パスワードを受信すると、受信した前記更新された音声特徴及び前記新たな音声パスワードを前記認証された認証対象ユーザーと対応付けて前記メモリへ保存するステップと、
を有する、
ユーザー認証方法。