JP7078740B2 - 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法 - Google Patents

情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法 Download PDF

Info

Publication number
JP7078740B2
JP7078740B2 JP2020546610A JP2020546610A JP7078740B2 JP 7078740 B2 JP7078740 B2 JP 7078740B2 JP 2020546610 A JP2020546610 A JP 2020546610A JP 2020546610 A JP2020546610 A JP 2020546610A JP 7078740 B2 JP7078740 B2 JP 7078740B2
Authority
JP
Japan
Prior art keywords
voice
user
authentication
password
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020546610A
Other languages
English (en)
Other versions
JPWO2020054002A1 (ja
Inventor
貞雄 鶴賀
康宣 橋本
和彦 吉澤
義憲 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maxell Ltd
Original Assignee
Maxell Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maxell Ltd filed Critical Maxell Ltd
Publication of JPWO2020054002A1 publication Critical patent/JPWO2020054002A1/ja
Priority to JP2022082008A priority Critical patent/JP7280999B2/ja
Application granted granted Critical
Publication of JP7078740B2 publication Critical patent/JP7078740B2/ja
Priority to JP2023079528A priority patent/JP7553652B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Description

本発明は、情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法に関する。
情報処理装置やネットワークシステム等では、音声入力によるユーザー認証が行われている。音声入力によるユーザー認証においては、暗証音声が事前に登録される。そして、登録された暗証音声と、認証を受けようとする者が入力した暗証音声とが一致すれば、この者が登録者本人であると認証される。
例えば、特許文献1には、暗証音声とその暗証音声の鍵となる語を組み合わせて登録しておき、認証時には鍵となる語を利用者に呈示して、鍵となる語に対応する暗証音声の発声を求める本人認証方法が開示されている。これにより、他人が偽って認証を受けることを困難にしている。
特開平10-173644号公報
しかしながら、特許文献1に開示された方法では、ユーザーは、登録された暗証音声を正確に記憶し、認証時に発声しなければならず、ユーザーにとって大きな負担になる。さらに、ユーザーは、暗証音声を忘却すると認証を受けることができず、情報処理装置等を使用できなくなってしまう。
そこで、本発明は、音声入力を用いた使い勝手よく安全性の高いユーザー認証を行うことが可能な情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法を提供することを目的とする。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、以下のとおりである。
本発明の代表的な実施の形態による情報処理装置は、音声入力処理部と、メモリと、コントローラと、を備えている。情報処理装置にユーザーを登録するためのユーザー登録処理では、音声入力処理部は、登録対象ユーザーが発する登録用音声を取り込み、登録用音声を第1の音声信号に変換する。コントローラは、第1の音声信号から第1の音声特徴を抽出し、第1の音声特徴と既にメモリに保存されている既登録ユーザーの音声特徴とを比較する。コントローラは、第1の音声特徴が既登録ユーザーの音声特徴と一致しない場合、第1の音声特徴を登録対象ユーザーと対応付けてメモリへ保存し、第1の音声特徴に基づいて音声パスワードを生成し、音声パスワードを前記メモリへ保存する、処理を実行する。コントローラは、ユーザー登録処理によりメモリに保存した音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行う。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。
すなわち、本発明の代表的な実施の形態によれば、音声入力を用いた使い勝手よく安全性の高いユーザー認証を行うことが可能となる。
本発明の実施の形態1に係る情報処理装置の構成の一例を示すブロック図である。 本発明の実施の形態1に係るユーザー登録処理の動作シーケンスの一例を示す図である。 本発明の実施の形態1に係るユーザー認証処理の動作シーケンスの一例を示す図である。 本発明の実施の形態1に係るユーザー認証処理の動作シーケンスの一例を示す図である。 本発明の実施の形態2に係るユーザー認証ネットワークシステムの構成の一例を示すブロック図である。 本発明の実施の形態2に係るユーザー登録処理の動作シーケンスの一例を示す図である。 本発明の実施の形態2に係るユーザー認証処理の動作シーケンスの一例を示す図である。
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明する。なお、発明を実施するための最良の形態を説明するための各図において、同一の機能を有する部材には同一の符号を付し、その繰り返しの説明は省略する。
(実施の形態1)
図1は、本発明の実施の形態1に係る情報処理装置の構成の一例を示すブロック図である。図1に示すように、情報処理装置100は、コントローラ101、メモリ114、音声入力処理部120、音声出力処理部121、表示部128、通信部129、基地局通信部130を備えている。情報処理装置100を構成するこれらの構成要素は、バス140を介して互いに接続されている。
メモリ114は、情報処理装置100で取り扱われる各種情報を保存する機能ブロックである。メモリ114は、例えばフラッシュメモリ等の不揮発性メモリを有し、コントローラ101で実行される各種プログラムや、各既登録ユーザーの音声特徴及び音声パスワード等の各種情報を保存する。メモリ114は、プログラム記憶領域113、ユーザー情報記憶領域106(例えば106a~106c)を備えている。
プログラム記憶領域113は、OS(Operating System)や動作制御用アプリケーション等の各種プログラムを格納する記憶領域である。これらのプログラムは、コントローラ101で実行される。
ユーザー情報記憶領域106aは、例えば既登録ユーザーであるユーザーAのユーザー情報を格納する記憶領域である。ユーザー情報記憶領域106aは、ユーザーAの音声特徴を記憶する音声特徴記憶領域102a、ユーザーAの音声パスワードを記憶する音声パスワード記憶領域(例えば103a~105a)等を備えている。音声パスワード記憶領域103a~105aは、それぞれ異なるユーザーAのユーザー認証用の音声パスワードを保存する。なお、音声パスワード記憶領域の個数は、これより少なくてもよいし、これより多くてもよい。
ユーザー情報記憶領域106bは、例えば既登録ユーザーであるユーザーBのユーザー情報を格納する記憶領域である。ユーザー情報記憶領域106bは、ユーザーBの音声特徴を記憶する音声特徴記憶領域102b、ユーザーBの音声パスワードを記憶する音声パスワード記憶領域(例えば103b~105b)等を備えている。音声パスワード記憶領域103b~105bは、それぞれ異なるユーザーBのユーザー認証用の音声パスワードをそれぞれ保存する。なお、ユーザー情報記憶領域106bにおいても、音声パスワード記憶領域の個数は、これより少なくてもよいし、これより多くてもよい。
ユーザー情報記憶領域106cは、例えば既登録ユーザーであるユーザーCのユーザー情報を格納する記憶領域である。ユーザー情報記憶領域106cは、ユーザーCの音声特徴を記憶する音声特徴記憶領域102c(図示は省略)、ユーザーCの音声パスワードを記憶する音声パスワード記憶領域(例えば103c~105c、図示は省略)等を備えている。音声パスワード記憶領域103c~105cは、それぞれ異なるユーザーCのユーザー認証用の音声パスワードを保存する。なお、ユーザー情報記憶領域106cにおいても、音声パスワード記憶領域の個数は、これより少なくてもよいし、これより多くてもよい。
音声入力処理部120は、音声入力用のマイク等を備えている。音声入力処理部120は、マイクを介して外部の音声を取り込み、取り込んだ音声を音声信号に変換する。音声入力処理部120は、音声信号をメモリ114やコントローラ101へ出力する。メモリ114は、音声入力処理部120から出力された音声信号を保存してもよい。
音声出力処理部121は、音声出力用のスピーカ等を備えている。音声出力処理部121は、スピーカを介して音声信号に基づく音声を外部に放音する。
コントローラ101は、情報処理装置100を構成する各部を制御する機能ブロックである。コントローラ101は、CPU(Central Processing Unit)やRAM(Random Access Memory)等を備えている。コントローラ101は、メモリ114のプログラム記憶領域113からOSや動作制御用アプリケーション等の各種プログラムを読み出しRAMに展開する。そして、コントローラ101は、RAMに展開したプログラムをCPUで実行することにより、図1に示す音声特徴抽出処理部122、音声特徴照合判別処理部123、音声パスワード生成処理部124、音声パスワード抽出処理部125、音声パスワード照合判別処理部126等の各機能ブロックをCPUに実現する。そして、コントローラ101は、これらの機能ブロックにより、情報処理装置100の動作を制御する。なお、コントローラ101内の各機能ブロックは、ソフトウェアのみで実現されてもよいし、ソフトウェア及びハードウェアにより実現されてもよい。
音声特徴抽出処理部122は、音声入力処理部120から出力される音声信号から、音声を発した者の音声特徴を抽出する。なお、音声特徴の抽出処理は、いわゆる音声認識処理において一般的に用いられる周知技術を利用すればよい。具体的には、音声信号を数十msの区間ごとに周波数分析することにより、音声の周波数情報(音響スペクトル)を時系列で取得し、この音響スペクトルを音声特徴として抽出する。
音声特徴照合判別処理部123は、音声特徴抽出処理部122で抽出される音声特徴と、メモリ114の音声特徴記憶領域(例えば102a~102c)に記憶されている既登録ユーザーの音声特徴とを比較照合し、両者が一致するかどうかを判別する。
音声パスワード生成処理部124は、音声特徴記憶領域に保存された音声特徴に基づいて複数の音声パスワードを生成する。音声パスワード生成処理部124は、例えば、音声特徴記憶領域102aに保存された音声特徴に基づいて、ユーザーAの複数の音声パスワードを生成する。これと同様に、音声パスワード生成処理部124は、例えば、音声特徴記憶領域102b,102cに保存された音声特徴に基づいて、ユーザーB,Cの複数の音声パスワードをそれぞれ生成する。
また、情報処理装置100の使用中、登録ユーザーの音声特徴は随時更新される。そこで、音声パスワード生成処理部124は、更新された音声特徴に基づいて新たな音声パスワードを生成してもよい。音声パスワード生成処理部124は、生成した音声パスワードを、対応する既登録ユーザーの音声パスワード記憶領域に記憶させる。
音声パスワード抽出処理部125は、ユーザー認証処理時、認証対象ユーザーが発した音声から音声パスワードを抽出する。
音声パスワード照合判別処理部126は、音声パスワード抽出処理部125で抽出された音声パスワードと、メモリ114のユーザー情報記憶領域に記憶されている音声パスワードとを比較照合し、両者が一致するかどうかを判別する。
表示部128は、例えば液晶パネル等の表示パネルを備え、ユーザーに通知する各種情報を表示する。例えば、表示部128は、ユーザー認証処理時、認証対象ユーザーが発すべき音声パスワードの文言等の情報を表示する。表示部128には、入力操作部127が設けられている。入力操作部127は、例えばキーボードやマウス等の入力装置であり、ユーザーの操作により各種情報が入力される。
なお、表示パネルが静電容量式等のタッチパネルで構成され、表示パネルが入力操作部127として使用されてもよい。この場合、ユーザーは、指やタッチペン等によるタッチパネルへの接近又は接触操作により各種情報を入力する。
通信部129は、例えば、無線LANや有線LANを介して外部ネットワークと接続され、外部ネットワークと接続された装置との間で情報の送受信を行う通信インターフェースである。
基地局通信部130は、例えば、W-CDMA(Wideband Code Division Multiple Access)やGSM(登録商標)(Global System for Mobile communications)等の遠距離無線通信を行う通信インターフェースである。基地局通信部130は、送受信アンテナを介して遠距離無線通信と接続された装置との間で情報の送受信を行う。
なお、情報処理装置100は、音声特徴抽出処理に際し、外部データベースとの接続が必要な場合には、通信部129や基地局通信部130を介して外部データベースへアクセスし、外部データベースとの間で各種情報が送受信される。
<ユーザー登録処理>
次に、本実施の形態に係るユーザー登録処理について説明する。図2は、本発明の実施の形態1に係るユーザー登録処理の動作シーケンスの一例を示す図である。図2では、左側に登録対象ユーザーの動作が示され、右側に情報処理装置100の動作が示されている。ユーザー登録処理は、情報処理装置100にユーザーを登録するための処理である。ユーザー登録処理では、以下のステップS201~S215の処理が行われる。
まず、ステップS201において、登録対象ユーザーは、入力操作部127から、ユーザー登録処理開始の入力操作を行う。例えば、登録対象ユーザーは、登録開始ボタンの操作、表示パネルに表示される登録開始ボタンのタッチ、あるいは仮パスワードの入力操作等を行う。
情報処理装置100は、入力操作部127からの登録開始入力を受け付け(S202)、登録対象ユーザーに対し、何らかの登録用音声の発声を登録対象ユーザーに要求する(S203)、具体的には、情報処理部100は、音声発声の要求を表示部128に表示したり、音声出力処理部121からスピーカを介して音声で伝えることにより登録対象ユーザーに要求する。
登録対象ユーザーは、情報処理装置100による音声発声の要求を認識すると(S204)、何らかの登録用音声を情報処理装置100に向けて発声する(S205)。
登録対象ユーザーから登録用音声が発声されると、音声入力処理部120は、登録用音声を取り込み音声信号(第1の音声信号)に変換し、バス140を介して音声信号をコントローラ101へ出力する(S206)。
音声特徴抽出処理部122は、音声入力処理部120から出力された音声信号から登録対象ユーザーの音声特徴(第1の音声特徴)を抽出する(S207)。そして、音声特徴照合判別処理部123は、登録対象ユーザーの音声特徴と、既にメモリ114の音声特徴記憶領域(例えば102a~102c)に保存されている既登録ユーザーの音声特徴とを比較照合し(S208)、登録対象ユーザーの音声特徴が、すでに音声特徴記憶領域(例えば102a~102c)に保存されているか否か判別する(S209)。
登録対象ユーザーの音声特徴が、音声特徴記憶領域(例えば102a~102c)に保存されている既登録ユーザーの音声特徴と一致しないと判断した場合(N)、コントローラ101は、登録対象ユーザーが未登録の新規登録ユーザーと判断し、登録対象ユーザーの音声特徴を、登録対象ユーザーと対応付けてメモリ114へ保存する(S210)。具体的には、コントローラ101は、この登録対象ユーザー用のユーザー情報記憶領域106を新たに割り当て、登録対象ユーザーの音声特徴を、新たに割り当てたユーザー情報記憶領域106の音声特徴記憶領域102に保存する(S210)。
そして、音声パスワード生成処理部124は、登録対象ユーザーの音声特徴に基づいて、登録対象ユーザーの音声パスワードを複数生成し、生成した複数の音声パスワードを、新たに割り当てられたユーザー情報記憶領域106の音声パスワード記憶領域(例えば103~105)に保存する(S211)。
コントローラ101は、ユーザー登録処理が完了したことを、表示部128への表示や、音声出力処理部121からの放音により登録対象ユーザーに通知する(ステップS212)。なお、コントローラ101は、表示部128への表示及び音声出力表示121からの放音を併用して、ユーザー登録処理が完了したことを登録対象ユーザーに通知してもよい。
登録対象ユーザーは、情報処理装置100からの通知により自身のユーザー登録処理が完了したことを認識する(S213)。これにより、ユーザー登録処理に係る一連の処理が完了する。
一方、ステップS209において、登録対象ユーザーの音声特徴が、いずれかの音声特徴記憶領域(例えば102a~102c)に保存されている音声特徴と一致する場合(Y)、コントローラ101は、この登録対象ユーザーは、すでに登録された既登録ユーザーであると判断し、登録対象ユーザーはすでに登録済みであることを、表示部128への表示や、音声出力処理部121からの放音により登録対象ユーザーに通知する(ステップS214)。なお、この場合においても、コントローラ101は、表示部128への表示及び音声出力表示121からの放音を併用してもよい。
そして、ユーザーは、情報処理装置100からの通知により、自身がすでにユーザー登録されていることを認識する(S213)。これによっても、ユーザー登録に係る一連の処理が終了する。
情報処理装置100は、登録対象ユーザーからの要求があれば、その都度これらのユーザー登録処理を行う。
<ユーザー認証処理>
次に、本実施の形態におけるユーザー認証処理について説明する。図3~4は、本発明の実施の形態1に係るユーザー認証処理の動作シーケンスの一例を示す図である。図3~4においても、左側に認証対象ユーザーの動作が示され、右側に情報処理装置100の動作が示されている。なお、図4は、図3の主要シーケンスS350の詳細な処理内容を示す。図3の主要シーケンスS350には、主要シーケンスと主要シーケンス外との接続関係を示すステップのみが便宜的に示されている。
まず、ステップS301において、認証対象ユーザーは、ユーザー認証処理を開始するため、情報処理装置100に向けて何らかの認証用音声を発声する。
音声入力処理部121は、認証対象ユーザーが発する認証用音声を取り込み、認証用音声を音声信号(第2の音声信号)に変換し、バス140を介して音声信号をコントローラ101へ出力する(S302)。
音声入力処理部120から出力された音声信号から認証対象ユーザーの音声特徴(第2の音声特徴)を抽出する(S303)。そして、音声特徴照合判別処理部123は、認証対象ユーザーの音声特徴と、既にメモリ114の音声特徴記憶領域(例えば102a~102c)に保存されている既登録ユーザーの音声特徴とを比較照合し(S304)、認証対象ユーザーの音声特徴が、すでに音声特徴記憶領域(例えば102a~102c)に保存されているか否か判別する(S305)。
認証対象ユーザーの音声特徴が音声特徴記憶領域(102a~102c,…)に保存されている既登録ユーザーの音声特徴と一致しない場合(N)、コントローラ101は、認証対象ユーザーは、未登録であり既登録ユーザーではないと判断し、ユーザー認証処理が不可能であることを、表示部128への表示や、音声出力処理部121からの放音により認証対象ユーザーに通知する(S324)。
認証対象ユーザーは、情報処理装置100から通知により、ユーザー認証処理が不可能であることを認識すると(S325)、再度ユーザー認証処理を行うか否かを判断する(S326)。そして、認証対象ユーザーは、再度ユーザー認証処理を行うと判断した場合(Y)、再度のステップS301において、認証用音声を再度発声する。また、認証対象ユーザーが再度のユーザー認証処理を行わないと判断した場合(N)、ユーザー認証処理は終了する。
一方、ステップS305において、音声特徴照合判別処理部123が、認証対象ユーザーの音声特徴がいずれかの音声特徴記憶領域(例えば102a)に記憶されている音声特徴と一致すると判断した場合(Y)、コントローラ101は、認証対象ユーザーの音声特徴と一致する音声特徴に対応する既登録ユーザー(例えばユーザーA)を、音声パスワードによる認証対象となる特定ユーザーとして絞り込む(S306)。
特定ユーザー(例えばユーザーA)が絞り込まれると、コントローラ101は、特定ユーザーに対応するユーザー情報記憶領域(例えば106a)の音声パスワード記憶領域(例えば103a~105a)に保存されている複数の音声パスワードから、1つの音声パスワードをランダムに選択する(S307)。そして、コントローラ101は、選択した音声パスワードを表示部128への表示や、音声出力処理部121からの放音により認証対象ユーザーに提示し、提示した音声パスワードの発声を認証対象ユーザーに促す(S308)。
認証対象ユーザーは、情報処理装置100から通知された音声パスワードを認識すると(S309)、認識した音声パスワードを発声する(S310)。
認証対象ユーザーに音声パスワードを提示した後、音声入力処理部120は、認証対象ユーザーが発した音声パスワードの音声を取り込み、音声パスワードの音声を音声信号(第3の音声信号)に変換し、バス140を介して音声信号をコントローラ101へ出力する。そして、音声パスワード抽出処理部125は、取り込まれた音声信号から認証対象ユーザーが発した音声パスワードを抽出する(S311)。
これらの処理と並行して、コントローラ101は、認証対象ユーザーへの音声パスワードの通知後、認証対象ユーザーが発した音声パスワードの音声を取り込んだかどうかを判断する(S312)。さらに、コントローラ101は、認証対象ユーザーに音声パスワードを通知してから経過した提示時間を計測し、提示時間が予め設定されるタイムアウト時間を経過したかどうかを判断する(S313)。
コントローラ101は、例えば、ステップS312において、認証対象ユーザーが発した音声パスワードの音声を取り込んでいないと判断し(N)、ステップS313において、提示時間がタイムアウト時間を経過していないと判断した場合(N)、再度ステップS312の処理を行う。すなわち、この場合、情報処理装置100は、認証対象ユーザーが発する音声パスワードの音声を取り込めるように引き続き待機する。
また、コントローラ101は、例えば、ステップS312において、認証対象ユーザーが発した音声パスワードの音声を取り込んでいないと判断し(N)、ステップS313において、提示時間がタイムアウト時間を経過していると判断した場合(Y)、時間超過(タイムアウト)によりユーザー認証処理を停止する。そして、コントローラ101は、タイムアウトによりユーザー認証処理を停止したことを、表示部128への表示や、音声出力処理部121からの放音により認証対象ユーザーに通知する(S327)。
認証対象ユーザーは、タイムアウトによりユーザー認証処理が停止されたことを認識し(S328)、再度ユーザー認証処理を行うか否かを判断する(S326)。ステップS326についてはすでに述べたので、ここではその後の処理についての説明は省略する。
一方、ステップS312において、コントローラ101が、認証対象ユーザーが発した音声を取り込んだと判断した場合(Y)、すなわち、タイムアウト時間内に音声パスワードを取り込んだと判断した場合、音声パスワード照合判別処理部126は、認証対象ユーザーに提示された音声パスワードと、認証対象ユーザーの音声信号(第3の音声信号)から抽出した音声パスワードとを比較照合し(S314)、これらの音声パスワードが一致するかどうかを判断する(S315)。
ステップS315において、音声パスワード照合判別処理部126が、これらの音声パスワードが一致しないと判別した場合(N)、コントローラ101は、これらの音声パスワードが不一致であることを、表示部128への表示や、音声出力処理部121からの放音により認証対象ユーザーに通知する(S329)。
認証対象ユーザーは、情報処理装置100からの通知により、これらの音声パスワードの不一致を認識する。すなわち、認証対象ユーザーは、提示された音声パスワードと、自身が発した音声パスワードとが一致しなかったことを認識し(S330)、音声パスワードを再度発声するかどうかを判断する(S331)。
ステップS331において、認証対象ユーザーが音声パスワードの再発声を行わないと判断した場合(N)、ステップS326の処理が行われる。ステップS326についてはすでに述べているので、説明は省略する。
これに対し、認証対象ユーザーは、ステップS331において音声パスワードの再発声を行うと判断した場合(Y)、情報処理装置100に対し音声パスワードの再通知を要求するかどうかを判断する(S332)。認証対象ユーザーは、ステップS332において、音声パスワードの再通知を要求しないと判断した場合(N)、ステップS310に戻り、前回通知されたものと同一の音声パスワードを再度発声する。
一方、認証対象ユーザーは、ステップS332において音声パスワードの再通知を要求すると判断した場合(Y)、発声や入力操作により、情報処理装置100に対し音声パスワードの再通知を要求する(S333)。
そして、情報処理装置100は、認証対象ユーザーからの再通知要求を取り込み(S334)、ステップS307~S308の処理を再度行うことで特定ユーザーの別の音声パスワードを認証対象ユーザーに通知する。
ところで、ステップS315において、音声パスワード照合判別処理部126が、認証対象ユーザーに提示した特定ユーザーの音声パスワードと、認証対象ユーザーの音声信号(第3の音声信号)から抽出した音声パスワードとが一致すると判断した場合(Y)、音声特徴抽出処理部122は、ステップS311で取り込まれた認証対象ユーザーが発した音声パスワードの音声の音声信号から音声特徴(第3の音声特徴)を抽出する(S316)。そして、音声特徴照合判別処理部123は、抽出した音声特徴と、特定ユーザー(例えばユーザーA)の音声特徴とを比較照合し(S317)、両者の音声特徴が一致するかどうかを判断する(S318)。
音声特徴照合判別処理部123が、これらの音声特徴が一致しないと判断した場合(N)、コントローラ101は、認証対象ユーザーに対しユーザー認証が不可能であることを通知する(S324)。
一方、音声特徴照合判別処理部123が、これらの音声特徴が一致すると判断した場合(Y)、コントローラ101は、認証対象ユーザーが特定ユーザー(例えばユーザーA)であると判断し、ユーザー認証処理を完了する。そして、コントローラ101は、ユーザー認証処理が完了したことを、表示部128への表示や、音声出力処理部121からの放音により認証対象ユーザーに通知する(S319)。認証対象ユーザーは、情報処理装置100からの通知により、自身が既登録ユーザーであると認証され、ユーザー認証処理が完了したことを認識する(S320)。これにより、ユーザー認証処理が終了する。
<ユーザー認証処理の完了後>
認証された既登録ユーザー(特定ユーザー、例えばユーザーA)は、情報処理装置100の各種機能を利用することが可能となる(S340)。具体的には、認証された既登録ユーザーは、情報処理装置100への入力操作を行うことにより(S341)、情報処理装置100の無線通信機能や電話機能等を動作させることができる(S342)。
また、ステップS341において、認証された既登録ユーザーが、例えばアイコンのタップ操作等の入力操作を行うと、ステップS342において、情報処理装置100は、対応するアプリケーションを実行して、各種機能を実現する。
また、音声入力処理部120は、通話や音声操作等で認証された既登録ユーザーが発する音声(認証後音声)を取り込み、音声信号(第4の音声信号)に変換する。そして、コントローラ101は、この音声信号から、認証された既登録ユーザーの音声特徴(第4の音声特徴)を抽出し、抽出した音声特徴に基づいて、メモリ114に保存されているこの既登録ユーザーの音声特徴を更新する。
そして、音声パスワード生成処理部123は、更新された音声特徴に基づいて新たな音声パスワードを生成し、メモリ114に保存する。このように、情報処理装置100は、既登録ユーザーごとに音声特徴を更新し続けることにより、より複雑な音声パスワードを生成することが可能となる。
また、情報処理装置100は、使用中の既登録ユーザーに対し、より多くのフレーズを話してもらうように、画面表示や音声による発生指示を出してもよい。例えば、情報処理装置100は、既登録ユーザーと会話したり、あるいは、使用頻度が低い既登録ユーザーや、音声による入力操作を行う頻度が低い既登録ユーザーに対し、音声を発するよう指示する。これにより、情報処理装置100は、既登録ユーザーの音声を多く集め、随時音声特徴を更新し、より複雑な音声パスワードを生成することが可能となる。これにより、情報処理装置100の安全性が向上する。
<情報処理装置の利用範囲>
本実施の形態の情報処理装置100は、例えば、ヘッドマウントディスプレイ(HMD)に搭載され、HDMのユーザーに対してユーザー登録処理、ユーザー認証処理が行われる。また、情報処理装置100は、例えば、携帯電話、スマートフォン、タブレット端末、AIスピーカ等でもよい。
<効果等>
本実施の形態によれば、コントローラ101は、ユーザー登録処理において、登録保存した音声特徴に基づいて登録対象ユーザーの音声パスワードを生成し、ユーザー認証処理において、音声パスワードを認証対象ユーザーに発声させる。
この構成によれば、既登録ユーザーは、音声パスワードの連想や記憶を行う必要がないので、音声入力を用いた使い勝手よく安全性の高いユーザー認証を行うことが可能となる。
また、本実施の形態によれば、コントローラ101は、既登録ユーザーごとに複数の音声パスワードを生成し、複数の音声パスワードからランダムに選択した音声パスワードを認証対象ユーザーに提示する。
この構成によれば、自動的に音声パスワードが生成されるため、既登録ユーザーによるパスワードの登録作業が不要となり、使い勝手をより向上させることが可能となる。また、この構成によれば、認証対象ユーザーに提示される音声パスワードを、その場限りのワンタイムの音声パスワードとすることができるので、盗み見や盗聴による第三者の不正認証を防止することが可能となる。
また、本実施の形態によれば、コントローラ101は、音声パスワードを認証対象ユーザーに提示してから経過した提示時間がタイムアウト時間を経過していると判断すると、ユーザー認証処理を停止する。
盗み見や盗聴により第三者がワンタイムの音声パスワードを取得するには相当の時間が必要である。したがって、この構成によれば、ワンタイムの音声パスワードを用いた第三者の不正認証をより一層防止することが可能となる。
なお、本実施の形態では、コントローラ101は、認証対象ユーザーに提示された音声パスワードと、認証対象ユーザーが発した音声パスワードとが一致すると判断した場合、認証対象ユーザーが発した音声パスワードから音声特徴(第3の音声特徴)を抽出し、この音声特徴と特定ユーザーの音声特徴とが一致するかどうかを判断する処理を行っている。しかし、このようなシーケンスに限定されず、コントローラ101は、認証対象ユーザーに提示された音声パスワードと、認証対象ユーザーが発した音声パスワードとが一致すると判断した場合、認証対象ユーザーが特定ユーザーであると判断し、ユーザー認証処理を終了してもよい。
この構成によれば、ユーザー認証に要する時間が短縮され、ユーザー認証処理の安全性を確保しつつ、使い勝手をより向上させることが可能となる。
また、本実施の形態では、認証用音声の取り込み時(S303)、音声パスワード取り込み時(S311)の2回、音声特徴を抽出し、登録保存されている音声特徴と比較照合を行っている(S314~S315)。その際、ステップS303では、音声特徴の特徴量の照合判別の閾値を広めに設定して、特徴量が最も近い既登録ユーザーを特定ユーザーとして絞り込む程度にし、ステップS311では、音声特徴の特徴量の照合判別の閾値を狭めに設定して、音声特徴の一致度が高い場合のみ認証対象ユーザーが特定ユーザーであると判定してもよい。
また、本実施の形態では、音声パスワード生成処理部124は、単語、文章の長さ、音声パスワードの個数等により、音声パスワードの複雑さを適宜変更してもよい。この構成によれば、必要なセキュリティレベルや、使用状況を考慮することができ、安全性と利便性とをバランスよく確保することが可能となる。
また、本実施の形態では、音声パスワードが定期的に変更されてもよいし、一度使用した音声パスワードが再度使用されないようにしてもよい。これにより、第三者による不正認証をより一層防止することが可能となり、安全性を更に向上させることができる。
登録ユーザーの音声特徴は、時間帯によって変化することがある。このため、情報処理装置100は、それぞれの登録ユーザーについて、時間帯ごとの音声特徴を登録保存してもよい。そして、コントローラ101は、時間帯に合わせた音声特徴を用いた音声パスワードによりユーザー認証処理を行ってもよい。この構成によれば、より適切な音声特徴を用いたユーザー認証処理が行われるので、ユーザー認証の精度を向上させることが可能となる。
また、野外では、ユーザー認証処理時における認証対象ユーザーの音声パスワードの音声が第三者に盗聴される可能性があるので、野外で使用した音声パスワードは、屋内のみで使用されるようにしてもよい。
また、本実施の形態では、音声パスワード生成処理部124において、音声パスワードが自動的に生成される場合について説明したが、登録ユーザー発生した音声を、音声パスワードとして登録してもよい。
また、本実施の形態では、ランダムに選択された音声パスワードがユーザーに提示される場合について説明したが、複数の音声パスワードが提示され、これらの中から発声する音声パスワードを認証対象ユーザーが選択してもよい。
また、ユーザー認証処理の開始時、認証対象ユーザーが何らかの認証用音声を発声するようにしているが、既登録ユーザーにより予め登録された音声が認証用音声として発声されるようにしてもよい。
(実施の形態2)
次に、実施の形態2について説明する。本実施の形態では、ネットワークを介してサーバ装置との間でユーザー認証を行うユーザー認証ネットワークシステムについて説明する。なお、以下では、前述の実施の形態と重複する箇所についての説明を適宜省略する。
図5は、本発明の実施の形態2に係るユーザー認証ネットワークシステムの構成の一例を示すブロック図である。図5に示すユーザー認証ネットワークシステム450は、情報処理装置400(例えば400-1,400-2)、サーバ装置430、外部ネットワーク440を備えている。外部ネットワーク440は、情報処理装置400とサーバ装置430とを接続する。
情報処理装置400(例えば400-1,400-2)は、施設420(例えば420-1~420-2)にそれぞれ含まれている。施設420(例えば420-1~420-2)は、例えば、情報処理装置400(例えば400-1~400-2)、入館ゲート410(例えば410-1~410-2)をそれぞれ備えている。
入館ゲート410は、例えば、施設420の入口付近に配置される。また、情報処理装置400は、入館ゲート410付近に配置され、入館ゲート410を通過しようとする人を認証対象ユーザーとしてユーザー認証処理を行う。ユーザー認証された認証対象ユーザーは、入館ゲート410の通過が許可され、施設420内に入館することができる。
なお、施設420-2の構成は、施設420-1と同様であるので、以下では、施設420-1を例に、施設の構成を説明する。情報処理装置400-1は、実施の形態1の情報処理装置100の構成と類似している。情報処理装置400-1と情報処理装置100との相違点は、メモリ114にユーザー情報記憶領域106が設けられていないこと、及び機能動作制御部401が追加されていることである。
機能動作制御部401は、対応する入館ゲート410-1の開閉状態を制御する機能ブロックである。機能動作制御部401は、情報処理装置400-1においてユーザー認証処理が完了すると、入館ゲート410を閉状態から開状態へ切り換える入館ゲート制御信号を送信する。これにより、認証された認証対象ユーザーは、入館ゲート410-1を通過することができる。
サーバ装置430は、施設420への入館が許可された既登録ユーザーの情報を管理する装置である。図4に示すように、サーバ装置430は、コントローラ421、メモリ424、通信部429等を備えている。サーバ装置430を構成する各部は、バス428を介して相互に接続されている。
メモリ424は、サーバ装置430に係る各種情報を格納する機能ブロックである。メモリ424は、例えば、コントローラ421で使用される各種プログラムや、登録ユーザーごとの音声特徴及び音声パスワード等の各種情報を保存する。メモリ424は、プログラム記憶領域423、複数のユーザー情報記憶領域426を備えている。ユーザー情報記憶領域426は、図1のユーザー情報記憶領域106に対応するものである。なお、図4では、既登録ユーザーであるユーザーE~Gに対応するユーザー情報記憶領域426e~426gが示されている。
プログラム記憶領域423は、OSや動作制御用アプリケーション等の各種プログラムを保存する記憶領域である。これらのプログラムは、コントローラ421で展開され実行される。
ユーザー情報記憶領域426eは、ユーザーEのユーザー情報を保存する記憶領域である。ユーザー情報記憶領域426eは、例えば、ユーザーEの音声特徴を保存する音声特徴記憶領域422e、ユーザーEの音声パスワードを保存する音声パスワード記憶領域423e~425e等を備えている。音声パスワード記憶領域423e~425eには、互いに異なる音声パスワードがそれぞれ保存される。なお、音声パスワード記憶領域の個数は、情報処理装置100と同様、これより少なくてもよいし、これより多くてもよい。
ユーザー情報記憶領域426fは、ユーザーFのユーザー情報を保存する記憶領域である。ユーザー情報記憶領域426fは、例えば、ユーザーFの音声特徴を保存する音声特徴記憶領域422f、ユーザーFの音声パスワードを保存する音声パスワード記憶領域423f~425f等を備えている。
ユーザー情報記憶領域426gは、ユーザーGのユーザー情報を保存する記憶領域である。図示はしていないが、ユーザー情報記憶領域426gも、ユーザーGの音声特徴を保存する音声特徴記憶領域、ユーザーGの音声パスワードを保存する複数の音声パスワード記憶領域等を備えている。
通信部429は、外部ネットワーク440と接続され、外部ネットワーク440を介して情報処理装置400との間で情報の送受信を行う通信インターフェースである。具体的には、情報処理装置400の通信部129は、外部ネットワーク440を介してサーバ装置430の通信部429と接続され、互いの通信部間において情報の送受信が行われる。
また、情報処理装置400は、基地局445を介してサーバ装置430との間で情報の送受信を行ってもよい。具体的には、情報処理装置400の基地局通信部130が、基地局445及び外部ネットワーク440を介してサーバ装置430の通信部429と接続され、互いの通信部間において情報の送受信が行われる。
コントローラ421は、CPU等で構成され、メモリ424に保存されているOSや動作制御用アプリケーション等のプログラムを実行することにより、サーバ装置430を構成する各部を制御し、サーバ装置430全体の動作制御処理を行う。
ユーザー登録処理時、コントローラ421は、情報処理装置400から送信される登録対象ユーザーの音声特徴及び音声パスワードを、通信部429を介して受信し、メモリ424に保存する。また、ユーザー認証処理時、コントローラ421は、メモリ424に保存されている音声特徴及び音声パスワードを、通信部429を介して情報処理装置400へ送信する。
<ユーザー登録処理>
次に、ユーザー認証ネットワークシステム450におけるユーザー登録処理について説明する。なお、以下では、情報処理装置400-1(施設420-1)とサーバ装置430との間における処理を例にして、ユーザー登録処理を説明するが、その他の情報処理装置400とサーバ装置430との間においても同様の処理がなされる。
図6は、本発明の実施の形態2に係るユーザー登録処理の動作シーケンスの一例を示す図である。図6では、左側に登録対象ユーザーの動作が示され、中央に情報処理装置400-1の動作が示され、右側にサーバ装置430の動作がそれぞれ示されている。なお、図6では、図2と同様の処理が行われるステップには同一の符号が付されており、該当するステップについての詳細な説明は適宜省略する。
本実施の形態のユーザー登録処理では、ステップS201~S207,S212~S215、及び以下のステップS501~S514の処理が行われる。まず、登録対象ユーザーによるユーザー登録処理開始の入力操作(S201)から、情報処理装置400-1による音声特徴の抽出処理(S207)までの各処理については、説明を省略する。
音声特徴(第1の音声特徴)の抽出処理が行われると、情報処理装置400-1は、サーバ装置430に保存されている全登録ユーザーの音声特徴を自身の情報処理装置400-1へ送信するよう、音声特徴の送信要求をサーバ装置403に送信する(S501)。
サーバ装置403は、情報処理装置400-1から送信された登録ユーザーの音声特徴の送信要求を受信すると(S502)、メモリ424に保存されている全登録ユーザーの音声特徴を情報処理装置400-1へ送信する(S503)。なお、サーバ装置430は、情報処理装置400(施設420)ごとに登録ユーザーの管理を行っている場合、音声特徴の送信要求を行った情報処理装置(例えば400-1)の登録ユーザーの音声特徴のみを送信する。
情報処理装置400-1がサーバ装置403から送信された音声特徴を受信すると(S504)、音声特徴照合判別処理部123は、ステップS207において抽出された音声特徴と、受信した登録ユーザーの音声特徴とを比較照合し(S505)、抽出された音声特徴がすでに登録されているかどうかを判断する(S506)。抽出した音声特徴が、いずれの登録ユーザーの音声特徴とも一致しないと判断した場合(N)、コントローラ101は、この登録対象ユーザーが、未登録の新規登録ユーザーであると判断し、抽出した音声特徴をサーバ装置430へ送信する(S507)。
情報処理装置400-1から送信された音声特徴を受信すると、サーバ装置430は、メモリ424におけるユーザー情報未登録のユーザー情報記憶領域426に、受信した音声特徴を登録する(S508)。具体的には、コントローラ421は、この登録対象ユーザー用のユーザー情報記憶領域426を新たに割り当て、登録対象ユーザーの音声特徴を、新たに割り当てたユーザー情報記憶領域426の音声特徴記憶領域に保存する。そして、サーバ装置430は、受信した音声特徴の登録保存が完了したことを通知する保存完了通知を情報処理装置400-1へ送信する(S509)。
情報処理装置400-1は、送信した音声特徴の登録完了通知を受信すると(S510)、登録された音声特徴に基づいて応する音声パスワードを複数生成しサーバ装置403に送信する(S511)。
音声パスワード生成処理部124は、登録した音声特徴に基づいて、新規登録ユーザーの音声パスワードを複数生成する。そして、情報処理装置400-1は、生成した複数の音声パスワードをサーバ装置430へ送信する(S511)。
サーバ装置430は、情報処理装置400-1から送信された複数の音声パスワードを受信すると、受信した音声パスワードを、新規登録ユーザーに対応するユーザー情報記憶領域426の音声パスワード記憶領域に保存し(S512)、音声パスワードの登録保存が完了したことを示す登録完了通知を情報処理装置400-1へ送信する(S513)。
情報処理装置400-1が音声パスワードの登録完了通知を受信すると(S514)、ユーザー登録処理が完了する。情報処理装置400-1のコントローラ101は、ユーザー登録が完了したことを、表示部128への表示、音声出力処理部121からの放音により登録対象ユーザー(新規登録ユーザー)に通知する(ステップS212)。
一方、ステップS506において、抽出した登録対象ユーザーの音声特徴が、サーバ装置430から送信された音声特徴のいずれかと一致する場合(Y)、コントローラ101は、この登録対象ユーザーが、すでに登録された既登録ユーザーであると判断し、すでに登録されていることを、表示部128への表示や、音声出力処理部121からの放音により登録対象ユーザーに通知する(ステップS214)。なお、ステップS212~S215についての詳しい説明は省略する。
<ユーザー認証処理>
次に、本実施の形態におけるユーザー認証処理について説明する。なお、以下でも、除法処理装置400-1(施設420-1)とサーバ装置430との間における処理を例にして、ユーザー認証処理の説明を行うが、その他の情報処理装置400(施設420)とサーバ装置430との間においても同様の処理がなされる。
図7は、本発明の実施の形態2に係るユーザー認証処理の動作シーケンスの一例を示す図である。図7では、左側に認証対象ユーザーの動作が示され、中央に情報処理装置400-1の動作が示され、右側にサーバ装置430の動作がそれぞれ示されている。なお、図7では、図3~4と同様の処理が行われるステップには同一の符号が付されており、該当するステップについての詳細な説明は適宜省略する。なお、図7の主要シーケンスS350は、図4と同様であり、主要シーケンスと主要シーケンス外との接続関係を示すステップのみが便宜的に示されている。
まず、ユーザー認証処理を開始時における、認証対象ユーザーによる認証用音声の発声(S301)から、情報処理装置400が、認証用音声の音声信号から認証対象ユーザーの音声特徴を抽出する(S303)までのステップS301~S303については、説明を省略する。
そして、認証対象ユーザーの音声特徴が抽出されると、情報処理装置400-1は、サーバ装置430に登録されている音声特徴を自身の情報処理装置400-1に送信するよう、音声特徴の送信要求をサーバ装置430に送信する(S601)。
サーバ装置430は、情報処理装置400から音声特徴の送信要求を受信すると(S602)、メモリ424に登録されている音声特徴を情報処理装置400-1へ送信する(S603)。
情報処理装置400-1は、サーバ装置403から送信された音声特徴を受信すると、例えばコントローラ101内のRAMやメモリ114に、受信した音声特徴を一時的に保存する(S604)。
音声特徴照合判別処理部123は、ステップS303において抽出された音声特徴と、サーバ装置430から受信した既登録ユーザーの音声特徴とを比較照合し(S304)、抽出した音声特徴が、すでに登録されているかどうかを判断する(S305)。
音声特徴照合判別処理部123が、抽出した認証対象ユーザーの音声特徴がサーバ装置430から受信したいずれかの音声特徴と一致すると判断した場合(Y)、コントローラ101は、認証対象ユーザーの音声特徴と一致する音声特徴に対応する既登録ユーザー(例えばユーザーE)を、音声パスワードによる認証対象となる特定ユーザーとして絞り込む(S306)。特定ユーザー(例えばユーザーE)が絞り込まれると、情報処理装置400-1は、特定ユーザーの音声パスワードの送信要求をサーバ装置430へ送信する(S605)。
サーバ装置430が情報処理装置400-1から音声パスワードの送信要求を受信すると(S606)、コントローラ421は、ユーザーEに対応する複数の音声パスワード記憶領域(423e~425e)からすべての音声パスワードを読み出し、読み出した音声パスワードを、通信部429を介して情報処理装置400-1へ送信する(S607)。
情報処理装置400-1は、サーバ装置430から送信された音声パスワードを受信すると、例えばコントローラ101内のRAMやメモリ114に、受信した音声パスワードを一時的に保存する(S608)。
そして、コントローラ101は、受信した特定ユーザー(ユーザーE)の音声パスワードから、1つの音声パスワードをランダムに選択する(S307)。
一方、ステップS305において、音声特徴照合判別処理部123が、抽出した音声特徴がサーバ装置430から受信したいずれの音声特徴とも一致しないと判断した場合(N)、コントローラ101は、ユーザー認証が不可能であることを、表示部128への表示や、音声出力処理部121からの放音により認証対象ユーザーに通知する(S324)。
ステップS307,S324以降は、図4の主要シーケンスS350に含まれる各処理が行われる。このうち、ステップS320では、認証対象ユーザーは、例えば表示部128に表示される確認ボタンをタッチすることにより、ユーザー認証処理の完了を認識したことを情報処理装置400-1へ通知してもよい。
そして、ユーザー認証処理が完了したことを認証対象ユーザーが認識すると、機能動作制御部401は、入館ゲート410-1を閉状態から開状態へ切り換える入館ゲート制御信号を送信する。これにより、入館ゲート410-1が開門され、ユーザー認証された認証対象ユーザーは、入館ゲート410-1を通過し、施設420-1内に入館することができる(S610)。
なお、ステップS319において、ユーザー認証の完了が通知されてから所定の待機時間が経過した後、ステップS610の処理が行われてもよい。
<効果等>
本実施の形態によれば、すでに述べた実施の形態1における各効果に加え、以下の効果が得られる。本実施の形態によれば、情報処理装置400から離れた場所に設けられたサーバ装置430に登録ユーザーの音声特徴及び音声パスワードが保存され、情報処理装置400は、外部ネットワーク440を介してサーバ装置430から音声特徴及び音声パスワードを受信する。この構成によれば、外部ネットワーク440と接続されたあらゆる施設420の情報処理装置400からでも、サーバ装置430内に保存されている音声特徴及び音声パスワードを受信してユーザー認証処理を行うことができる。また、登録ユーザーの各種情報の管理が一元化される。
また、本実施の形態では、サーバ装置として、クラウドサーバが用いられてもよい。この構成によれば、サーバ装置430の容量が大容量化され、より多くの既登録ユーザーの情報を保存することが可能となる。また、既登録ユーザーのデータベースの構築や活用が可能となる。
また、本実施の形態においても、情報処理装置400は、ユーザー認証処理後、登録ユーザーが発する音声を取り込み、音声特徴を随時更新し、更新した音声特徴に基づいて新たな音声パスワードを生成してもよい。更新された音声特徴及び新たな音声パスワードは、サーバ装置430へ送信され、メモリ424に保存される。
なお、情報処理装置400は、サーバ装置430の容量、サーバ装置430との通信状況等を考慮し、生成した音声パスワードを自身のメモリ114に格納してもよい。
また、本実施の形態では、ユーザー認証ネットワークシステムとして、入館ゲート410の開門制御が例示されているが、これに限らず、パソコン等によるログイン処理や、複数の部屋に対する入室管理等を行う場所に対しても、ユーザー認証ネットワークシステムは利用可能である。
また、図1、図4で示した例では、ユーザー登録処理やユーザー認証処理の開始時に、登録対象ユーザーや認証対象ユーザーが発声する音声が用いられているが、ユーザーを特定する利用者ID(identification)等のデータ情報がこれらの音声に代えて入力されてもよい。
この場合、ユーザー登録処理時、情報処理装置400は、入力されたデータ情報から登録対象ユーザーが既登録ユーザーであるかどうかを照合判別し、登録対象ユーザーが既登録ユーザーではないと判断すれば、何らかの音声(所定の音声パスワードでもよい)を発するよう登録対象ユーザーに通知する。情報処理装置400は、ユーザーが発声した音声を取り込み、この音声から音声特徴を抽出し、音声パスワードを生成し、音声特徴及び音声パスワードとともにこの登録対象ユーザーをユーザー登録すればよい。
また、ユーザー認証処理時、情報処理装置400は、入力されたデータ情報から認証対象ユーザーが既登録ユーザーかどうかを照合判別し、既登録ユーザーであると判断すれば、既登録ユーザーの音声パスワードをランダムに選択して認証対象ユーザーに提示すればよい。
また、図1、図4に示した音声入力処理部120は、マイクが発声音声を取り込む構成となっているが、ユーザーの音声を取り込む方法としては、これ以外にも、骨伝導等による方法がある。骨伝導は、空気を伝わって鼓膜に振動させ聴覚神経に伝える気導音、すなわち、耳からの集音音声に対し、声帯などの振動が頭蓋骨を伝わり直接聴覚神経に伝わる骨導音によるものである。例えばディスプレイを頭部に装着するヘッドマウントディスプレイでは、利用者から発声された音声信号を気導音だけでなく、頭部に装着されていることより、骨伝導による骨導音も取り込めることができ、この場合も図1、図4に示した実施例と同様にして、ユーザー登録処理やユーザー認証処理が行われる。
なお、本発明は上記した実施の形態に限定されるものではなく、様々な変形例が含まれる。また、上記した実施の形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施の形態の構成の一部を他の実施の形態の構成に置き換えることが可能であり、また、ある実施の形態の構成に他の実施の形態の構成を加えることも可能である。また、各実施の形態の構成の一部について、他の構成の追加、削除、置換をすることが可能である。なお、図面に記載した各部材や相対的なサイズは、本発明を分かりやすく説明するため簡素化・理想化しており、実装上はより複雑な形状となる場合がある。
100,400…情報処理装置、101…コントローラ、114…メモリ、120…音声入力処理部、424…メモリ、430…サーバ装置、440…外部ネットワーク、450…ユーザー認証ネットワークシステム

Claims (22)

  1. 情報処理装置であって、
    音声入力処理部と、
    メモリと、
    コントローラと、
    を備え、
    前記情報処理装置にユーザーを登録するためのユーザー登録処理では、
    前記音声入力処理部は、登録対象ユーザーが発する登録用音声を取り込み、前記登録用音声を第1の音声信号に変換し、
    前記コントローラは、前記第1の音声信号から第1の音声特徴を抽出し、前記第1の音声特徴と既に前記メモリに保存されている既登録ユーザーの音声特徴とを比較し、一致しない場合は前記第1の音声特徴を前記登録対象ユーザーと対応付けて前記メモリへ保存し、前記第1の音声特徴に基づいて音声パスワードを生成し、前記音声パスワードを前記メモリへ保存する、処理を実行し、
    前記ユーザー登録処理により前記メモリに保存した前記音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行う、
    情報処理装置。
  2. 請求項1に記載の情報処理装置において、
    前記ユーザー認証処理では、
    前記音声入力処理部は、認証対象ユーザーが発する認証用音声を取り込み、前記認証用音声を第2の音声信号に変換し、
    前記コントローラは、前記第2の音声信号から第2の音声特徴を抽出し、前記第2の音声特徴と既に前記メモリに保存されている前記既登録ユーザーの音声特徴とを比較し、一致する場合は前記第2の音声特徴と一致する音声特徴に対応した既登録ユーザーを特定ユーザーとして絞り込み、前記特定ユーザーの音声パスワードを前記認証対象ユーザーに提示し、
    前記音声入力処理部は、前記認証対象ユーザーが発した音声パスワードの音声を取り込み、前記認証対象ユーザーが発した前記音声パスワードの音声を第3の音声信号に変換し、
    前記コントローラは、前記第3の音声信号から前記認証対象ユーザーが発した前記音声パスワードを抽出し、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとを比較し、一致する場合は前記認証対象ユーザーが前記特定ユーザーであると判断する、
    情報処理装置。
  3. 請求項2に記載の情報処理装置において、
    前記コントローラは、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとが一致する場合は前記第3の音声信号から第3の音声特徴を抽出し、前記第3の音声特徴と前記特定ユーザーの音声特徴とを比較し、一致する場合は前記認証対象ユーザーが前記特定ユーザーであると判断する、
    情報処理装置。
  4. 請求項2に記載の情報処理装置において、
    前記コントローラは、前記ユーザー登録処理では、前記第1の音声特徴に基づいて複数の前記音声パスワードを生成し、前記ユーザー認証処理では、前記複数の音声パスワードからランダムに選択した前記音声パスワードを前記認証対象ユーザーに提示する、
    情報処理装置。
  5. 請求項2に記載の情報処理装置において、
    前記ユーザー認証処理では、前記コントローラは、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示した後、
    前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んだかどうかを判断し、
    前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示してから経過した提示時間を計測し、前記提示時間がタイムアウト時間を経過したかどうかを判断し、
    前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んでおらず、前記提示時間が前記タイムアウト時間を経過している場合は前記ユーザー認証処理を停止する、
    情報処理装置。
  6. 請求項1に記載の情報処理装置において、
    前記ユーザー認証処理の完了後、前記音声入力処理部は、認証された前記認証対象ユーザーが発する認証後音声を取り込み、前記認証後音声を第4の音声信号に変換し、
    前記コントローラは、前記第4の音声信号から第4の音声特徴を抽出し、前記第4の音声特徴に基づいて、前記メモリに保存されている前記認証された認証対象ユーザーの音声特徴を更新し、更新された前記音声特徴に基づいて新たな音声パスワードを生成し、前記新たな音声パスワードを前記認証された認証対象ユーザーと対応付けて前記メモリに保存する、
    情報処理装置。
  7. 音声入力処理部と、コントローラと、を備えた情報処理装置と、
    メモリを備えたサーバ装置と、
    前記情報処理装置と前記サーバ装置とを接続する外部ネットワークと、
    を備えたユーザー認証ネットワークシステムであって、
    前記ユーザー認証ネットワークシステムにユーザーを登録するためのユーザー登録処理では、
    前記音声入力処理部は、登録対象ユーザーが発する登録用音声を取り込み、前記登録用音声を第1の音声信号に変換し、
    前記コントローラは、前記第1の音声信号から第1の音声特徴を抽出し、
    前記情報処理装置は、既に前記メモリに保存されている既登録ユーザーの音声特徴の送信要求を前記サーバ装置に送信し、
    前記サーバ装置は、前記既登録ユーザーの音声特徴の送信要求を受信すると、前記メモリに保存されている前記既登録ユーザーの音声特徴を、前記情報処理装置に送信し、
    前記情報処理装置が、前記既登録ユーザーの音声特徴を受信すると、前記コントローラは、前記第1の音声特徴と受信した前記既登録ユーザーの音声特徴とを比較し、一致しない場合、
    前記情報処理装置は、前記第1の音声特徴を前記サーバ装置へ送信し、
    前記サーバ装置は、受信した前記第1の音声特徴を前記登録対象ユーザーと対応付けて前記メモリへ保存し、前記第1の音声特徴の登録完了通知を前記情報処理装置へ送信し、
    前記情報処理装置が前記登録完了通知を受信すると、前記コントローラは、前記第1の音声特徴に基づいて音声パスワードを生成し、生成した前記音声パスワードを前記サーバ装置へ送信し、
    前記サーバ装置は、前記音声パスワードを受信すると、受信した前記音声パスワードを前記メモリへ保存し、
    前記コントローラは、前記ユーザー登録処理により前記メモリに保存した前記音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行う、
    ユーザー認証ネットワークシステム。
  8. 請求項7に記載のユーザー認証ネットワークシステムにおいて、
    前記ユーザー認証処理では、
    前記音声入力処理部は、認証対象ユーザーが発する認証用音声を取り込み、前記認証用音声を第2の音声信号に変換し、
    前記コントローラは、前記第2の音声信号から第2の音声特徴を抽出し、
    前記情報処理装置は、前記既登録ユーザーの音声特徴の送信要求を前記サーバ装置に送信し、
    前記サーバ装置は、前記既登録ユーザーの音声特徴の送信要求を受信すると、前記メモリに保存されている前記既登録ユーザーの音声特徴を、前記情報処理装置に送信し、
    前記情報処理装置が、前記既登録ユーザーの音声特徴を受信すると、前記コントローラは、前記第2の音声特徴と受信した前記既登録ユーザーの音声特徴とを比較し、一致する場合は前記第2の音声特徴と一致する音声特徴に対応した既登録ユーザーを特定ユーザーとして絞り込み、
    前記情報処理装置は、前記特定ユーザーの音声パスワードの送信要求を前記サーバ装置へ送信し、
    前記サーバ装置は、前記特定ユーザーの音声パスワードの送信要求を受信すると、前記特定ユーザーの音声パスワードを前記情報処理装置へ送信し、
    前記情報処理装置は、受信した前記特定ユーザーの音声パスワードを前記認証対象ユーザーに提示し、
    前記音声入力処理部は、前記認証対象ユーザーが発した音声パスワードの音声を取り込み、前記認証対象ユーザーが発した前記音声パスワードの音声を第3の音声信号に変換し、
    前記コントローラは、前記第3の音声信号から前記認証対象ユーザーが発した前記音声パスワードを抽出し、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとを比較し、一致する場合は前記認証対象ユーザーが前記特定ユーザーであると判断する、
    ユーザー認証ネットワークシステム。
  9. 請求項8に記載のユーザー認証ネットワークシステムにおいて、
    前記コントローラは、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとが一致する場合は前記第3の音声信号から第3の音声特徴を抽出し、前記第3の音声特徴と前記特定ユーザーの音声特徴とを比較し、一致すると場合は前記認証対象ユーザーが前記特定ユーザーであると判断する、
    ユーザー認証ネットワークシステム。
  10. 請求項8に記載のユーザー認証ネットワークシステムにおいて、
    前記コントローラは、前記ユーザー登録処理では、前記第1の音声特徴に基づいて複数の前記音声パスワードを生成し、前記ユーザー認証処理では、前記複数の音声パスワードからランダムに選択した前記音声パスワードを前記認証対象ユーザーに提示する、
    ユーザー認証ネットワークシステム。
  11. 請求項8に記載のユーザー認証ネットワークシステムにおいて、
    前記ユーザー認証処理では、前記コントローラは、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示した後、
    前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んだかどうかを判断し、
    前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示してから経過した提示時間を計測し、前記提示時間がタイムアウト時間を経過したかどうかを判断し、
    前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んでおらず、前記提示時間が前記タイムアウト時間を経過している場合は前記ユーザー認証処理を停止する、
    ユーザー認証ネットワークシステム。
  12. 請求項7に記載のユーザー認証ネットワークシステムにおいて、
    前記ユーザー認証処理の完了後、前記音声入力処理部は、認証された前記認証対象ユーザーが発する認証後音声を取り込み、前記認証後音声を第4の音声信号に変換し、
    前記コントローラは、前記第4の音声信号から第4の音声特徴を抽出し、前記第4の音声特徴に基づいて、前記メモリに保存されている前記認証された認証対象ユーザーの音声特徴を更新し、更新された前記音声特徴に基づいて新たな音声パスワードを生成し、
    前記情報処理装置は、更新された前記音声特徴及び前記新たな音声パスワードを前記サーバ装置へ送信し、
    前記サーバ装置は、更新された前記音声特徴及び前記新たな音声パスワードを受信すると、受信した前記更新された音声特徴及び前記新たな音声パスワードを前記認証された認証対象ユーザーと対応付けて前記メモリへ保存する、
    ユーザー認証ネットワークシステム。
  13. 音声入力処理部と、メモリと、コントローラと、を備えた情報処理装置におけるユーザー認証方法であって、
    前記情報処理装置にユーザーを登録するためのユーザー登録処理では、
    前記音声入力処理部が、登録対象ユーザーが発する登録用音声を取り込み、前記登録用音声を第1の音声信号に変換するステップと、
    前記コントローラが、前記第1の音声信号から第1の音声特徴を抽出するステップと、
    前記コントローラが、前記第1の音声特徴と既に前記メモリに保存されている既登録ユーザーの音声特徴とを比較するステップと、
    前記第1の音声特徴が前記既登録ユーザーの音声特徴と一致しない場合、前記コントローラが、前記第1の音声特徴を前記登録対象ユーザーと対応付けて前記メモリへ保存し、前記第1の音声特徴に基づいて音声パスワードを生成し、前記音声パスワードを前記メモリへ保存するステップと、
    を有し、
    前記コントローラが、前記ユーザー登録処理により前記メモリに保存した前記音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行うステップを有する、
    ユーザー認証方法。
  14. 請求項13に記載のユーザー認証方法において、
    前記ユーザー認証処理では、
    前記音声入力処理部が、認証対象ユーザーが発する認証用音声を取り込み、前記認証用音声を第2の音声信号に変換するステップと、
    前記コントローラが、前記第2の音声信号から第2の音声特徴を抽出するステップと、
    前記コントローラが、前記第2の音声特徴と既に前記メモリに保存されている前記既登録ユーザーの音声特徴と前記第2の音声特徴とを比較するステップと、
    前記登録ユーザーの音声特徴と前記第2の音声特徴とが一致する場合、前記コントローラが、前記第2の音声特徴と一致する音声特徴に対応した既登録ユーザーを特定ユーザーとして絞り込み、前記特定ユーザーの音声パスワードを前記認証対象ユーザーに提示するステップと、
    前記音声入力処理部が、前記認証対象ユーザーが発した音声パスワードの音声を取り込み、前記認証対象ユーザーが発した前記音声パスワードの音声を第3の音声信号に変換するステップと、
    前記コントローラが、前記第3の音声信号から前記認証対象ユーザーが発した前記音声パスワードを抽出ステップと、
    前記コントローラが、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとを比較するステップと、
    前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとが一致する場合、前記コントローラが、前記認証対象ユーザーは前記特定ユーザーであると判断するステップと、
    を有する、
    ユーザー認証方法。
  15. 請求項14に記載のユーザー認証方法において、
    前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとが一致する場合、前記コントローラが、前記第3の音声信号から第3の音声特徴を抽出するステップと、
    前記コントローラが、前記第3の音声特徴と前記特定ユーザーの音声特徴とを比較するステップと、
    前記第3の音声特徴と前記特定ユーザーの音声特徴とが一致する場合、前記コントローラが、前記認証対象ユーザーは前記特定ユーザーであると判断するステップと、
    を有する、
    ユーザー認証方法。
  16. 請求項14に記載のユーザー認証方法において、
    前記ユーザー認証処理では、
    前記コントローラが、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示するステップの後、
    前記コントローラが、前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んだかどうかを判断するステップと、
    前記コントローラが、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示してから経過した提示時間を計測するステップと、
    前記コントローラが、前記提示時間がタイムアウト時間を経過したかどうかを判断するステップと、
    前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んでおらず、前記提示時間が前記タイムアウト時間を経過している場合、前記コントローラが、前記ユーザー認証処理を停止するステップと、
    を有する、
    ユーザー認証方法。
  17. 請求項13に記載のユーザー認証方法において、
    前記ユーザー認証処理の完了後、
    前記音声入力処理部が、認証された前記認証対象ユーザーが発する認証後音声を取り込み、前記認証後音声を第4の音声信号に変換するステップと、
    前記コントローラが、前記第4の音声信号から第4の音声特徴を抽出するステップと、
    前記コントローラが、前記第4の音声特徴に基づいて、前記メモリに保存されている前記認証された認証対象ユーザーの音声特徴を更新し、更新された前記音声特徴に基づいて新たな音声パスワードを生成し、前記新たな音声パスワードを前記認証された認証対象ユーザーと対応付けて前記メモリに保存するステップと、
    を有する、
    ユーザー認証方法。
  18. 音声入力処理部と、コントローラと、を備えた情報処理装置と、
    メモリを備えたサーバ装置と、
    前記情報処理装置と前記サーバ装置とを接続する外部ネットワークと、
    を備えたユーザー認証ネットワークシステムにおけるユーザー認証方法であって、
    前記ユーザー認証ネットワークシステムにユーザーを登録するためのユーザー登録処理では、
    前記音声入力処理部が、登録対象ユーザーが発する登録用音声を取り込み、前記登録用音声を第1の音声信号に変換するステップと、
    前記コントローラが、前記第1の音声信号から第1の音声特徴を抽出するステップと、
    前記情報処理装置が、既に前記メモリに保存されている既登録ユーザーの音声特徴の送信要求を前記サーバ装置に送信するステップと、
    前記サーバ装置が、前記既登録ユーザーの音声特徴の送信要求を受信すると、前記メモリに保存されている前記既登録ユーザーの音声特徴を、前記情報処理装置に送信するステップと、
    前記情報処理装置が、前記既登録ユーザーの音声特徴を受信すると、前記コントローラが、前記第1の音声特徴と受信した前記既登録ユーザーの音声特徴とを比較するステップと、
    前記第1の音声特徴が前記登録ユーザーの音声特徴と一致しない場合、前記情報処理装置が、前記第1の音声特徴を前記サーバ装置へ送信するステップと、
    前記サーバ装置が、受信した前記第1の音声特徴を前記登録対象ユーザーと対応付けて前記メモリへ保存し、前記第1の音声特徴の登録完了通知を前記情報処理装置へ送信するステップと、
    前記情報処理装置が前記登録完了通知を受信すると、前記コントローラが、前記第1の音声特徴に基づいて音声パスワードを生成し、生成した前記音声パスワードを前記サーバ装置へ送信するステップと、
    前記サーバ装置が、前記音声パスワードを受信すると、受信した前記音声パスワードを前記メモリへ保存するステップと、
    を有し、
    前記コントローラが、前記ユーザー登録処理により前記メモリに保存した前記音声パスワードを用いて、認証対象ユーザーのユーザー認証処理を行うステップを有する、
    ユーザー認証方法。
  19. 請求項18に記載のユーザー認証方法において、
    前記ユーザー認証処理では、
    前記音声入力処理部が、認証対象ユーザーが発する認証用音声を取り込み、前記認証用音声を第2の音声信号に変換するステップと、
    前記コントローラが、前記第2の音声信号から第2の音声特徴を抽出するステップと、
    前記情報処理装置が、前記既登録ユーザーの音声特徴の送信要求を前記サーバ装置に送信するステップと、
    前記サーバ装置が、前記既登録ユーザーの音声特徴の送信要求を受信すると、前記メモリに保存されている前記既登録ユーザーの音声特徴を、前記情報処理装置に送信するステップと、
    前記情報処理装置が、前記既登録ユーザーの音声特徴を受信すると、前記コントローラが、前記第2の音声特徴と受信した前記登録ユーザーの音声特徴とを比較するステップと、
    前記登録ユーザーの音声特徴と前記第2の音声特徴とが一致する場合、前記コントローラが、前記第2の音声特徴と一致する前記登録ユーザーの音声特徴に対応した既登録ユーザーを特定ユーザーとして絞り込むステップと、
    前記情報処理装置が、前記特定ユーザーの音声パスワードの送信要求を前記サーバ装置へ送信するステップと、
    前記サーバ装置が、前記特定ユーザーの音声パスワードの送信要求を受信すると、前記特定ユーザーの音声パスワードを前記情報処理装置へ送信するステップと、
    前記情報処理装置が、受信した前記特定ユーザーの音声パスワードを前記認証対象ユーザーに提示するステップと、
    前記音声入力処理部が、前記認証対象ユーザーが発した音声パスワードの音声を取り込み、前記認証対象ユーザーが発した前記音声パスワードの音声を第3の音声信号に変換するステップと、
    前記コントローラが、前記第3の音声信号から前記認証対象ユーザーが発した前記音声パスワードを抽出するステップと、
    前記コントローラが、前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとを比較するステップと、
    前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとが一致する場合、前記コントローラが、前記認証対象ユーザーは前記特定ユーザーであると判断するステップと、
    を有する、
    ユーザー認証方法。
  20. 請求項19に記載のユーザー認証方法において、
    前記認証対象ユーザーに提示した前記特定ユーザーの前記音声パスワードと前記第3の音声信号から抽出した前記音声パスワードとが一致する場合、前記コントローラが、前記第3の音声信号から第3の音声特徴を抽出するステップと、
    前記コントローラが、前記第3の音声特徴と前記特定ユーザーの音声特徴とを比較するステップと、
    前記第3の音声特徴と前記特定ユーザーの音声特徴とが一致する場合、前記コントローラが、前記認証対象ユーザーは前記特定ユーザーであると判断するステップと、
    を有する、
    ユーザー認証方法。
  21. 請求項19に記載のユーザー認証方法において、
    前記ユーザー認証処理では、
    前記コントローラが、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示するステップの後、
    前記コントローラが、前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んだかどうかを判断するステップと、
    前記コントローラが、前記特定ユーザーの前記音声パスワードを前記認証対象ユーザーに提示してから経過した提示時間を計測するステップと、
    前記コントローラが、前記提示時間がタイムアウト時間を経過したかどうかを判断するステップと、
    前記認証対象ユーザーが発する前記音声パスワードの音声を取り込んでおらず、前記提示時間が前記タイムアウト時間を経過している場合、前記コントローラが、前記ユーザー認証処理を停止するステップと、
    を有する、
    ユーザー認証方法。
  22. 請求項18に記載のユーザー認証方法において、
    前記ユーザー認証処理の完了後、
    前記音声入力処理部が、認証された前記認証対象ユーザーが発する認証後音声を取り込み、前記認証後音声を第4の音声信号に変換するステップと、
    前記コントローラが、前記第4の音声信号から第4の音声特徴を抽出するステップと、
    前記コントローラが、前記第4の音声特徴に基づいて、前記メモリに保存されている前記認証された認証対象ユーザーの音声特徴を更新し、更新された前記音声特徴に基づいて新たな音声パスワードを生成するステップと、
    前記情報処理装置が、更新された前記音声特徴及び前記新たな音声パスワードを前記サーバ装置へ送信するステップと、
    前記サーバ装置が、更新された前記音声特徴及び前記新たな音声パスワードを受信すると、受信した前記更新された音声特徴及び前記新たな音声パスワードを前記認証された認証対象ユーザーと対応付けて前記メモリへ保存するステップと、
    を有する、
    ユーザー認証方法。
JP2020546610A 2018-09-12 2018-09-12 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法 Active JP7078740B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022082008A JP7280999B2 (ja) 2018-09-12 2022-05-19 情報処理装置
JP2023079528A JP7553652B2 (ja) 2018-09-12 2023-05-12 ユーザー認証方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/033885 WO2020054002A1 (ja) 2018-09-12 2018-09-12 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022082008A Division JP7280999B2 (ja) 2018-09-12 2022-05-19 情報処理装置

Publications (2)

Publication Number Publication Date
JPWO2020054002A1 JPWO2020054002A1 (ja) 2021-09-24
JP7078740B2 true JP7078740B2 (ja) 2022-05-31

Family

ID=69776989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020546610A Active JP7078740B2 (ja) 2018-09-12 2018-09-12 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法

Country Status (5)

Country Link
US (1) US20210256104A1 (ja)
EP (1) EP3851985A4 (ja)
JP (1) JP7078740B2 (ja)
CN (1) CN112654983A (ja)
WO (1) WO2020054002A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7266448B2 (ja) * 2019-04-12 2023-04-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 話者認識方法、話者認識装置、及び話者認識プログラム
WO2024018429A1 (en) * 2022-07-22 2024-01-25 Samsung Electronics Co., Ltd. Audio signal processing method, audio signal processing apparatus, computer device and storage medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128307A (ja) 2003-10-24 2005-05-19 Aruze Corp 声紋認証システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1020883A (ja) * 1996-07-02 1998-01-23 Fujitsu Ltd ユーザ認証装置
JPH10173644A (ja) 1996-12-11 1998-06-26 Nippon Telegr & Teleph Corp <Ntt> 本人認証方法
US8812319B2 (en) * 2001-01-31 2014-08-19 Ibiometrics, Inc. Dynamic pass phrase security system (DPSS)
CN101197131B (zh) * 2006-12-07 2011-03-30 积体数位股份有限公司 随机式声纹密码验证系统、随机式声纹密码锁及其产生方法
US8499342B1 (en) * 2008-09-09 2013-07-30 At&T Intellectual Property I, L.P. Systems and methods for using voiceprints to generate passwords on mobile devices
JP6084654B2 (ja) * 2015-06-04 2017-02-22 シャープ株式会社 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128307A (ja) 2003-10-24 2005-05-19 Aruze Corp 声紋認証システム

Also Published As

Publication number Publication date
WO2020054002A1 (ja) 2020-03-19
US20210256104A1 (en) 2021-08-19
JPWO2020054002A1 (ja) 2021-09-24
EP3851985A1 (en) 2021-07-21
CN112654983A (zh) 2021-04-13
EP3851985A4 (en) 2022-04-20

Similar Documents

Publication Publication Date Title
US11508382B2 (en) System, device and method for enforcing privacy during a communication session with a voice assistant
JP6651570B2 (ja) ユーザの認証を行うユーザ認証装置、ユーザ認証装置において実行されるプログラム、ユーザの認証を行うための入力デバイスにおいて実行されるプログラム、ユーザ認証装置および入力デバイスを備えたコンピュータシステム
KR20190087798A (ko) 음성 명령을 이용한 사용자 인증 방법 및 전자 장치
WO2017043717A1 (ko) 생체인식 본인인증 방법
JP7078740B2 (ja) 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法
CN105577375B (zh) 身份验证方法及装置
JP7553652B2 (ja) ユーザー認証方法
US10606992B2 (en) User authentication system and user authentication application program
JP2015201187A (ja) 防犯システム
JP6457682B1 (ja) 認証システム、認証方法、ならびに、プログラム
US20220264276A1 (en) Safety confirmation system and safety confirmation method
JP2016184095A (ja) 言語認識装置、言語認識方法及びプログラム
US20090163200A1 (en) Mobile device supporting walkaway conversation establishment
JP2018055022A (ja) 音声認識システム、情報処理装置、プログラム
KR102453161B1 (ko) 자동 응답 시스템으로 개인 정보를 전송하기 위한 장치 및 방법
US11017394B2 (en) System for vision impaired users to execute electronic transactions
CN112085506A (zh) 一种交易方法及装置、终端、可读存储介质
JP7437927B2 (ja) 電子マネー送金システム、プログラム、送金人端末、サーバ装置、及び電子マネー送金方法
JPWO2019106811A1 (ja) クエリ応答システムおよびクエリ応答方法
JP7254316B1 (ja) プログラム、情報処理装置、及び方法
JP7508787B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、命令実行サーバ、命令実行方法、命令実行プログラム、データサーバ、データ処理方法およびデータ処理プログラム
US11012823B1 (en) Delivering information to a non-active user of a communication device
WO2019208223A1 (ja) ユーザの認証を行うユーザ認証装置、ユーザ認証装置において実行されるプログラム、ユーザの認証を行うための入力デバイスにおいて実行されるプログラム、ユーザ認証装置および入力デバイスを備えたコンピュータシステム
JP5886720B2 (ja) 無線通信端末、方法、およびプログラム
JP2002023883A (ja) Icカード型音声認識機構によるセキュリティ情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210301

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20211022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220519

R150 Certificate of patent or registration of utility model

Ref document number: 7078740

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150