JP6931175B2 - 情報処理装置、情報処理システム、および、プログラム - Google Patents

情報処理装置、情報処理システム、および、プログラム Download PDF

Info

Publication number
JP6931175B2
JP6931175B2 JP2019237461A JP2019237461A JP6931175B2 JP 6931175 B2 JP6931175 B2 JP 6931175B2 JP 2019237461 A JP2019237461 A JP 2019237461A JP 2019237461 A JP2019237461 A JP 2019237461A JP 6931175 B2 JP6931175 B2 JP 6931175B2
Authority
JP
Japan
Prior art keywords
voice
user
authentication
information
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019237461A
Other languages
English (en)
Other versions
JP2021106350A (ja
Inventor
直 鈴木
直 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Client Computing Ltd
Original Assignee
Fujitsu Client Computing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Client Computing Ltd filed Critical Fujitsu Client Computing Ltd
Priority to JP2019237461A priority Critical patent/JP6931175B2/ja
Publication of JP2021106350A publication Critical patent/JP2021106350A/ja
Application granted granted Critical
Publication of JP6931175B2 publication Critical patent/JP6931175B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Description

本発明は、情報処理装置、情報処理システム、および、プログラムに関する。
近年、自身で発話して声を出すことが難しい人は、代用音声でコミュニケーションをとることができる。例えば、喉頭がんなどで喉頭を摘出した人や、気管切開や声門閉鎖術をした人など、声帯で発話することが難しい人は、喉頭原音の代替音を電気的に生成する人工喉頭装置による代用音声や、食道発声法による代用音声などを利用する場合がある。代用音声を利用すれば、他者と声でコミュニケーションをとることが可能になるが、短所もある。
例えば、人工喉頭装置による代用音声は、電気的な振動音(ブザー音)を音源としているため、音質が機械的で単調でロボットのような声であり、聞き取りにくい。そこで、音声変換技術を使えば、このような聞き取りにくい声を、聞きやすい声に変換することが可能となる。つまり、音声変換技術を使えば、人工喉頭装置による機械的な代用音声を自然な声に変換することができ、人の声に近い自然な声でコミュニケーションをとることが可能となる。
しかしながら、音声変換技術を使えば、例えば、音声通信による通話(例えば電話)において、発声させた音声を他人の声にそっくりな音声に変換してから通話相手に伝えることができるため、他人の声をまねる「なりすまし」に悪用される可能性がある。
そこで、開示の技術は、上記事情に鑑みてなされたものであって、音声通信による通話における音声変換技術を用いたなりすましを抑制することができる情報処理装置、情報処理システム、および、プログラムを提供することを目的とする。
本発明の第1態様に係る情報処理装置は、ユーザまたはユーザが用いる音声発声補助装置によって発声された音声の情報を取得する第1取得部と、前記ユーザに関する音声以外の生体情報を取得する第2取得部と、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、声紋認証を行う第1認証部と、前記生体情報、および、前記ユーザの登録生体情報に基づいて、生体認証を行う第2認証部と、他の通話装置との音声通信による通話状態を制御する通話制御部と、音声を所定の登録音声に変換する音声変換部と、を備える。前記第1認証部による前記声紋認証の結果が成功であり、かつ、前記第2認証部による前記生体認証の結果が成功であった場合に、前記通話制御部は通話相手の通話装置との音声通信による通話状態を確立し、前記音声変換部は前記通話状態で前記ユーザまたは前記ユーザが用いる前記音声発声補助装置によって発声された音声を前記登録音声に変換してから通話相手の通話装置に伝達する。また、前記第1認証部は、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、複数のボリュームそれぞれについて登録されている前記ユーザの登録声紋情報のうち、前記音声とボリューム同士が近い前記登録声紋情報に基づいて前記声紋認証を行う。あるいは、前記第1認証部は、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、前記音声のボリュームと、前記ユーザの登録声紋情報のボリュームに基づいて、前記ユーザに、発声させる音声のボリュームの増加または減少の要請を通知する。
本発明の第2態様に係る情報処理システムは、ユーザの喉頭原音の代替音を電気的に生成する人工喉頭装置と、情報処理装置と、を備える情報処理システムであって、前記情報処理装置は、前記ユーザが用いる前記人工喉頭装置によって発声された音声の情報を取得する第1取得部と、前記ユーザに関する音声以外の生体情報を取得する第2取得部と、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、声紋認証を行う第1認証部と、前記生体情報、および、前記ユーザの登録生体情報に基づいて、生体認証を行う第2認証部と、他の通話装置との音声通信による通話状態を制御する通話制御部と、音声を所定の登録音声に変換する音声変換部と、を備える。前記第1認証部による前記声紋認証の結果が成功であり、かつ、前記第2認証部による前記生体認証の結果が成功であった場合に、前記通話制御部は通話相手の通話装置との音声通信による通話状態を確立し、前記音声変換部は前記通話状態で前記ユーザが用いる前記人工喉頭装置によって発声された音声を前記登録音声に変換してから通話相手の通話装置に伝達する。また、前記第1認証部は、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、複数のボリュームそれぞれについて登録されている前記ユーザの登録声紋情報のうち、前記音声とボリューム同士が近い前記登録声紋情報に基づいて前記声紋認証を行う。あるいは、前記第1認証部は、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、前記音声のボリュームと、前記ユーザの登録声紋情報のボリュームに基づいて、前記ユーザに、発声させる音声のボリュームの増加または減少の要請を通知する。
本発明の第3態様に係るプログラムは、ユーザまたはユーザが用いる音声発声補助装置によって発声された音声の情報を取得する第1取得ステップと、前記ユーザに関する音声以外の生体情報を取得する第2取得ステップと、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、声紋認証を行う第1認証ステップと、前記生体情報、および、前記ユーザの登録生体情報に基づいて、生体認証を行う第2認証ステップと、前記第1認証ステップによる前記声紋認証の結果が成功であり、かつ、前記第2認証ステップによる前記生体認証の結果が成功であった場合に、通話相手の通話装置との音声通信による通話状態を確立し、前記通話状態で前記ユーザまたは前記ユーザが用いる前記音声発声補助装置によって発声された音声を登録音声に変換してから通話相手の通話装置に伝達する通話制御ステップと、をコンピュータに実行させるためのプログラムである。また、前記第1認証ステップは、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、複数のボリュームそれぞれについて登録されている前記ユーザの登録声紋情報のうち、前記音声とボリューム同士が近い前記登録声紋情報に基づいて前記声紋認証を行う。あるいは、前記第1認証ステップは、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、前記音声のボリュームと、前記ユーザの登録声紋情報のボリュームに基づいて、前記ユーザに、発声させる音声のボリュームの増加または減少の要請を通知する。
本発明の各態様によれば、音声通信による通話における音声変換技術を用いたなりすましを抑制することができる。
図1は、実施形態の情報処理システムを含むシステム全体の構成及び処理の流れを説明する図である。 図2は、実施形態の情報処理システムの全体構成の概要を示す図である。 図3は、実施形態における第1のスペクトログラムデータを模式的に示す図である。 図4は、実施形態における第2のスペクトログラムデータを模式的に示す図である。 図5は、実施形態の情報処理装置における処理を示すフローチャートである。
以下、添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。図1は、実施形態の情報処理システムSを含むシステム全体の構成及び処理の流れを説明する図である。
図1に示すように、システムは、ユーザが使用する情報処理装置1及び人工喉頭装置100を有する情報処理システムSと、ユーザの通話相手が使用する通話装置200とを有する。通話装置200は、携帯電話またはスマートフォン等の通信機器であってよい。情報処理システムSは、情報処理装置1で指紋等の生体情報で生体認証をする。情報処理システムSは、生体認証が成功したと判定すると、人工喉頭装置100によって発声させたユーザの声によって声紋認証をする。情報処理システムSは、声紋認証に成功したと判定すると、通話相手の通話装置200に本人である旨を示す本人通知及び通話を希望する旨をメール等によって通知する。尚、情報処理装置1は、更にユーザのID及びPWによる認証をした後、通話を希望する旨を通話装置200に通知してもよい。通話相手がユーザとの通話を了承する旨を通話装置200に入力すると、通話装置200は、了承する旨をユーザの情報処理装置1にメール等によって返信する。これにより、ユーザは、情報処理装置1及び通話装置200を介して、通話相手との会話を開始する。ここで、ユーザが予め登録した登録音声による通話を希望する場合、情報処理装置1は、人工喉頭装置100により発声させた声を登録音声に変換して、通話装置200に送信してよい。
次に、図2を参照して、実施形態の情報処理システムSの全体構成について説明する。図2は、実施形態の情報処理システムSの全体構成の概要を示す図である。情報処理システムSは、情報処理装置1と、人工喉頭装置100(電気式人工喉頭)と、を備える。人工喉頭装置100は、ユーザの喉頭原音の代替音を電気的に生成する装置である。ユーザが人工喉頭装置100を首の所定箇所に当てて発声時と同じ口の動きをすると、人工喉頭装置100はユーザの喉頭原音の代替音を電気的に生成する。
情報処理装置1は、例えば、パーソナルコンピュータ、スマートフォン、タブレット端末等により実現される。また、情報処理装置1は、内蔵装置または外付け装置により、音声通信による通話機能も有している。情報処理装置1は、処理部2と、記憶部3と、入力部4と、表示部5と、通信部6と、音声入力部7と、生体情報入力部8と、を備える。
記憶部3は、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)等から構成され、各種プログラム、各種データ、各種演算結果等を記憶する。また、記憶部3は、音声変換技術を実現するための音声変換プログラムを記憶する。また、記憶部3は、声紋認証に用いるための所定の登録声紋情報を記憶する。また、記憶部3は、声紋認証以外の生体認証を行うための所定の登録生体情報(例えば登録指紋情報等)を記憶する。また、記憶部3は、後述する第3認証を行うためのユーザの登録ID(Identifier)と登録PW(Pass Word)を記憶する。
また、記憶部3は、所定の登録音声を記憶する。登録音声の一例は、ユーザが声を失う前に録音された音声である。そして、音声変換プログラムを用いることで、入力音声をその登録音声に変換することができる。したがって、例えば、音声通信による通話(電話等)において、登録音声のユーザの入力音声をその登録音声に変換するのはよいが、他のユーザの入力音声をその登録音声に変換することは「なりすまし」を可能にしてしまうので回避すべきである。そこで、以下では、音声通信による通話における音声変換技術を用いたなりすましを抑制する技術について説明する。
入力部4は、ユーザによる情報入力手段であり、例えば、マウス、キーボード、タッチパネル等である。表示部5は、情報表示手段であり、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、LCD(Liquid Crystal Display)装置などである。
通信部6は、外部装置と通信するための通信インタフェースである。音声入力部7は、音声入力手段であり、例えば、マイクロフォンである。
生体情報入力部8は、ユーザに関する音声以外の生体情報を入力する手段である。生体情報入力部8は、例えば、ユーザの指紋を読み取る指紋センサである。しかし、生体情報入力部8で対象とする生体情報は、指紋に限定されず、ほかに、静脈、虹彩、顔などであってもよい。
処理部2は、情報処理手段であり、例えば、MPU(Micro Processing Unit)やCPU(Central Processing Unit)などのプロセッサである。処理部2は、プロセッサがRAM等のメモリ上にプログラムを展開することにより、各機能部を実現させる。なお、処理部2は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジックによって実現してもよい。
処理部2は、機能部として、取得部21と、第1認証部22と、第2認証部23と、第3認証部24と、通話制御部25と、音声変換部26と、通知部27と、を備える。
取得部21は、各種情報を取得する。例えば、取得部21は、ユーザまたはユーザが用いる人工喉頭装置100(音声発声補助装置)によって発声された音声の情報を音声入力部7から取得する第1取得部として機能する。また、取得部21は、ユーザに関する音声以外の生体情報を生体情報入力部8から取得する第2取得部として機能する。
第1認証部22は、取得部21が取得した音声の情報、および、記憶部3に記憶された登録声紋情報に基づいて、声紋認証を行う。声紋認証は、例えば、スペクトログラムを使用することによって実現できる。
図3は、実施形態における第1のスペクトログラムデータを模式的に示す図である。図3(a)〜(e)は、5人の被験者に人工喉頭装置100を使って同一の所定の単語を発声してもらった場合の音声のスペクトログラムを示すデータである。図3(a)〜(e)において、縦軸は周波数で、横軸は時間である。
図3(a)〜(e)からわかるように、人工喉頭装置100によって発声した機械的な音声であっても、発話者の身体的特徴や口の動かし方により、スペクトログラムの特徴が異なるため、声紋認証を行うことができる。
ここで、図4は、実施形態における第2のスペクトログラムデータを模式的に示す図である。図4(a)〜(i)は、同一の被験者によって、人工喉頭装置100を使って同一の一文字分の音を発声してもらった場合の音声のスペクトログラムを示すデータである。図4(a)〜(i)において、縦軸は周波数で、横軸は時間である。また、人工喉頭装置100において、音の高さの設定を所定の低音、中音、高音の三段階とし、音のボリューム(大きさ)の設定を所定の小、中、大の三段階とした。
図4(a)、(b)、(c)は、低音で、それぞれ、ボリュームを小、中、大に設定した場合のデータである。
図4(d)、(e)、(f)は、中音で、それぞれ、ボリュームを小、中、大に設定した場合のデータである。
図4(g)、(h)、(i)は、高音で、それぞれ、ボリュームを小、中、大に設定した場合のデータである。
図4(a)〜(i)からわかるように、同一の被験者によって人工喉頭装置100によって発声した機械的な音声であっても、人工喉頭装置100の音の高さやボリュームの設定によって、スペクトログラムの特徴がやや異なる。また、一般に、人工喉頭装置100のユーザは、環境音の種類や大きさによって人工喉頭装置100の音のボリュームの設定を変更することは多いが、声の高さの設定を変更することは少ない。
そこで、例えば、第1認証部22は、取得部21が取得した音声の情報、および、記憶部3に記憶された登録声紋情報に基づいて、声紋認証を行う場合に、複数のボリュームそれぞれについて登録されている登録声紋情報のうち、取得した音声とボリューム同士が近い登録声紋情報に基づいて声紋認証を行うようにしてもよい。そうすれば、声紋認証の精度がさらに向上する。その場合、記憶部3に、予め、複数のボリュームそれぞれについての登録声紋情報を記憶させておく。
なお、第1認証部22は、当該声紋認証を行う場合に、複数の声の高さそれぞれについて登録されている登録声紋情報のうち、取得した音声と声の高さ同士が近い登録声紋情報に基づいて声紋認証を行うようにしてもよい。その場合、記憶部3に、予め、複数の声の高さそれぞれについての登録声紋情報を記憶させておく。
図2に戻って、第1認証部22は、取得部21が取得した音声の情報、および、記憶部3に記憶された登録声紋情報に基づいて、声紋認証を行う場合に、音声のボリュームと、登録声紋情報のボリュームに基づいて、ユーザに、発声させる音声のボリュームの増加または減少の要請を通知するようにしてもよい。そうすれば、ユーザがその通知に応じて発声させる音声のボリュームを増加または減少させることが期待できるので、声紋認証の精度がさらに向上する。
第2認証部23は、生体情報入力部8が取得した生体情報、および、記憶部3に記憶された登録生体情報に基づいて、生体認証を行う。例えば、生体認証が指紋認証の場合であれば、第2認証部23は、生体情報入力部8が取得した指紋情報と、記憶部3に記憶されている登録指紋情報を用いてパターンマッチング等を行うことで指紋認証を行う。
第3認証部24は、入力部4によって入力されたIDとPW、および、記憶部3に記憶された登録IDと登録PWに基づいて、第3認証を行う。
通話制御部25は、音声通信による通話状態を制御する。通話制御部25は、例えば、通話相手の通話装置200との音声通信による通話状態を確立したり、終了させたりする。
音声変換部26は、音声入力部7によって入力された音声を、音声変換プログラムを用いて所定の登録音声等に変換する。また、音声変換部26は、音声変換プログラムの利用の許可、制限付き許可、不許可を判定する(詳細は後述)。
通知部27は、外部装置を使用するユーザに対して所定の通知を行う。例えば、第1認証部22による声紋認証の結果が成功であり、かつ、第2認証部23による生体認証の結果が成功であった場合に、通話制御部25による通話状態の確立前に、情報処理装置1のユーザによる通話希望の旨を通話相手(通話予定の相手)の通話装置200に通知する。この通知は、例えば、電子メールによって行えばよい。この通知を受けた通話相手は、承認か非承認を通話装置200に入力することによって、承認または非承認の返答を情報処理装置1に返すことができる。
通知部27が通話相手の通話装置200から通話を承認する旨の返答を受信したとき、通話制御部25は通話相手の通話装置200との音声通信による通話状態を確立することができる。そして、音声変換部26は通話状態でユーザまたはユーザが用いる人工喉頭装置100によって発声された音声を登録音声に変換してから通話相手の通話装置200に伝達する。
また、第1認証部22による声紋認証の結果と、第2認証部23による生体認証の結果と、の少なくともいずれか失敗であった場合に、音声変換部26はユーザまたはユーザが用いる人工喉頭装置100によって発声された音声を登録音声に変換することを抑止する。
次に、図5を参照して、実施形態の情報処理装置1における処理について説明する。図5は、実施形態の情報処理装置1における処理を示すフローチャートである。ここでは、所定のユーザが、情報処理装置1を用いて、音声通信による通話をする場合に、自身の発声した音声を音声変換プログラムによって登録音声に変換しながら通話することを希望する場合を想定する。なお、所定のユーザは、登録音声のユーザと同一の場合もあれば同一でない場合もある。
まず、ユーザが生体情報入力部8に指を当て、取得部21が生体情報入力部8からユーザの指紋情報を取得すると、ステップS1において、第2認証部23は、取得部21が取得した指紋情報、および、記憶部3に記憶された登録指紋情報に基づいて指紋認証を行う。第2認証部23は、指紋認証が成功した場合はステップS5に進み、失敗した場合はステップS2に進む。
ステップS2において、ユーザが入力部4によってIDとPWを入力すると、第3認証部24は、入力されたIDとPW、および、記憶部3に記憶された登録IDと登録PWに基づいて第3認証を行う。第3認証部24は、第3認証が成功した場合はステップS3に進み、失敗した場合はステップS4に進む。
ステップS3において、音声変換部26は、制限付きで音声変換プログラムの使用を許可する。つまり、音声変換部26は、人工喉頭装置100によって発声させたユーザの声を、登録音声以外の音声への音声変換を許可する。ステップS4において、音声変換部26は、音声変換プログラムの使用を許可しない。
ステップS5において、ユーザが人工喉頭装置100を用いて音声入力部7に対して発声し、取得部21が音声入力部7から発声した音声の情報を取得すると、第1認証部22は、取得した音声の情報、および、記憶部3に記憶された登録声紋情報に基づいて声紋認証を行う。第1認証部22は、声紋認証に成功した場合はステップS6に進み、失敗した場合はステップS3に進む。
ステップS6において、通知部27は、通話相手(通話予定の相手)の通話装置200に対して、ユーザによる通話希望の旨を電子メール等で通話相手の通話装置200に通知する。この通知を受けた通話相手は、承認か非承認を通話装置200に入力する。通話装置200は、通話相手が入力した承認または非承認を示す返答を情報処理装置1に返す。尚、通話装置200は、通話相手が非承認を入力した場合、情報処理装置1に返答を返さなくてもよい。
ステップS7において、通知部27は、通話相手の通話装置200からの返答を受信する。次に、ステップS8において、通知部27は、返答が承認であるか否かを判定し、Yesの場合はステップS11に進み、Noの場合はステップS9に進む。尚、通知部27は、承認の返答を受信した場合、ステップS11に進み、一定の時間経過しても返答を受信しなかった場合、ステップS9に進んでもよい。
ステップS9において、通話制御部25は、ユーザと通話相手との通話を許可しない。次に、ステップS10において、音声変換部26は、音声変換プログラムの使用を許可する。ここでは、通話相手の通話装置200からの回答が非承認であったので、通話は許可しないが、2つの生体情報の認証で成功していて、なりすましの可能性は低い(つまり、ユーザは登録音声のユーザである可能性が高い)ので、音声通信による通話以外での音声変換プログラムの使用を許可しても問題はない。
ステップS11において、通話制御部25は、ユーザと通話相手との通話を許可する。次に、ユーザは、入力部4を用いて音声変換プログラムを利用するか否かを選択する。これを受けて、ステップS12において、音声変換部26は、ユーザが音声変換プログラムを利用するか否かを判定し、ユーザが音声変換プログラムを利用する旨を入力した場合、即ち、Yesの場合はステップS13に進み、ユーザが音声変換プログラムを利用する旨を入力しない場合、即ち、Noの場合はステップS14に進む。
ステップS13において、音声変換部26は、音声変換プログラムを起動する。これ以降、ユーザは、音声変換プログラムを用いて自身の声(人工喉頭装置100を用いて発声させた声)を登録音声に変換することができる。
次に、通話制御部25は、通話状態を確立する。次に、ステップS14において、音声変換部26は通話状態でユーザが用いる人工喉頭装置100によって発声された音声を登録音声に変換してから通話相手の通話装置200に伝達する。
次に、ステップS15において、通話制御部25は、通話が終了したか否かを判定し、Yesの場合は処理を終了し、Noの場合はステップS14に戻る。
このように、本実施形態の情報処理システムSによれば、情報処理装置1において、声紋認証と声紋認証以外の生体認証の2つの認証を行って、両方の結果が成功だった場合にのみ、音声通信による通話における発声音声から登録音声への変換を可能とすることで、音声通信による通話における音声変換技術を用いたなりすましを抑制することができる。つまり、2つの生体情報の認証により、セキュリティ対策を強化し、個人の特定の確実性を向上させ、音声変換プログラムの使用の可否をより的確に判定できる。
また、音声通信による通話前に通話相手に事前に通知することで注意喚起をすることができ、さらに、通話の承認の可否を選択可能とすることで利便性や安全性が向上する。
また、図5のステップS2のID/PW認証で「成功」の場合や、ステップS5の声紋認証で「失敗」の場合、制限付きでの音声変換プログラムの利用を許可して一定の利便性を確保しつつ、登録音声への音声変換を許可しないことで、音声通信による通話以外でのなりすましも抑制することができる。
なお、本実施形態の情報処理装置1で実行されるプログラムは、これらの装置にインストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供するように構成してもよい。
また、当該プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、当該プログラムを、インターネット等のネットワーク経由で提供または配布するように構成してもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
例えば、上述の実施形態では、ユーザが人工喉頭装置100を用いて発声するものとしたが、これに限定されない。ユーザが人工喉頭装置100以外の音声発声補助装置によって発声した場合や、ユーザが装置無しで発声した場合についても、本発明を適用できる。
1…情報処理装置、2…処理部、3…記憶部、4…入力部、5…表示部、6…通信部、7…音声入力部、8…生体情報入力部、21…取得部、22…第1認証部、23…第2認証部、24…第3認証部、25…通話制御部、26…音声変換部、27…通知部、100…人工喉頭装置、200…通話装置、S…情報処理システム

Claims (8)

  1. ユーザまたはユーザが用いる音声発声補助装置によって発声された音声の情報を取得する第1取得部と、
    前記ユーザに関する音声以外の生体情報を取得する第2取得部と、
    前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、声紋認証を行う第1認証部と、
    前記生体情報、および、前記ユーザの登録生体情報に基づいて、生体認証を行う第2認証部と、
    通話相手の通話装置との音声通信による通話状態を制御する通話制御部と、
    音声を所定の登録音声に変換する音声変換部と、を備え、
    前記第1認証部による前記声紋認証の結果が成功であり、かつ、前記第2認証部による前記生体認証の結果が成功であった場合に、前記通話制御部は前記通話相手の通話装置との音声通信による通話状態を確立し、前記音声変換部は前記通話状態で前記ユーザまたは前記ユーザが用いる前記音声発声補助装置によって発声された音声を前記登録音声に変換してから前記通話相手の通話装置に伝達し、
    前記第1認証部は、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、複数のボリュームそれぞれについて登録されている前記ユーザの登録声紋情報のうち、前記音声とボリューム同士が近い前記登録声紋情報に基づいて前記声紋認証を行う、情報処理装置。
  2. ユーザまたはユーザが用いる音声発声補助装置によって発声された音声の情報を取得する第1取得部と、
    前記ユーザに関する音声以外の生体情報を取得する第2取得部と、
    前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、声紋認証を行う第1認証部と、
    前記生体情報、および、前記ユーザの登録生体情報に基づいて、生体認証を行う第2認証部と、
    通話相手の通話装置との音声通信による通話状態を制御する通話制御部と、
    音声を所定の登録音声に変換する音声変換部と、を備え、
    前記第1認証部による前記声紋認証の結果が成功であり、かつ、前記第2認証部による前記生体認証の結果が成功であった場合に、前記通話制御部は前記通話相手の通話装置との音声通信による通話状態を確立し、前記音声変換部は前記通話状態で前記ユーザまたは前記ユーザが用いる前記音声発声補助装置によって発声された音声を前記登録音声に変換してから前記通話相手の通話装置に伝達し、
    前記第1認証部は、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、前記音声のボリュームと、前記ユーザの登録声紋情報のボリュームに基づいて、前記ユーザに、発声させる音声のボリュームの増加または減少の要請を通知する、情報処理装置。
  3. 前記第1認証部による前記声紋認証の結果が成功であり、かつ、前記第2認証部による前記生体認証の結果が成功であった場合に、前記通話状態の確立前に、前記ユーザによる通話希望の旨を前記通話相手の通話装置に通知する通知部を、さらに備え、
    前記通知部が前記通話相手の通話装置から通話を承認する旨の返答を受信したとき、前記通話制御部は前記通話相手の通話装置との音声通信による通話状態を確立することができる、請求項1または請求項2に記載の情報処理装置。
  4. 前記第1認証部による前記声紋認証の結果と、前記第2認証部による前記生体認証の結果と、の少なくともいずれか失敗であった場合に、前記音声変換部は前記ユーザまたは前記ユーザが用いる前記音声発声補助装置によって発声された音声を前記登録音声に変換することを抑止する、請求項1または請求項2に記載の情報処理装置。
  5. ユーザの喉頭原音の代替音を電気的に生成する人工喉頭装置と、情報処理装置と、を備える情報処理システムであって、
    前記情報処理装置は、
    前記ユーザが用いる前記人工喉頭装置によって発声された音声の情報を取得する第1取得部と、
    前記ユーザに関する音声以外の生体情報を取得する第2取得部と、
    前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、声紋認証を行う第1認証部と、
    前記生体情報、および、前記ユーザの登録生体情報に基づいて、生体認証を行う第2認証部と、
    通話相手の通話装置との音声通信による通話状態を制御する通話制御部と、
    音声を所定の登録音声に変換する音声変換部と、を備え、
    前記第1認証部による前記声紋認証の結果が成功であり、かつ、前記第2認証部による前記生体認証の結果が成功であった場合に、前記通話制御部は前記通話相手の通話装置との音声通信による通話状態を確立し、前記音声変換部は前記通話状態で前記ユーザが用いる前記人工喉頭装置によって発声された音声を前記登録音声に変換してから前記通話相手の通話装置に伝達し、
    前記第1認証部は、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、複数のボリュームそれぞれについて登録されている前記ユーザの登録声紋情報のうち、前記音声とボリューム同士が近い前記登録声紋情報に基づいて前記声紋認証を行う、情報処理システム。
  6. ユーザの喉頭原音の代替音を電気的に生成する人工喉頭装置と、情報処理装置と、を備える情報処理システムであって、
    前記情報処理装置は、
    前記ユーザが用いる前記人工喉頭装置によって発声された音声の情報を取得する第1取得部と、
    前記ユーザに関する音声以外の生体情報を取得する第2取得部と、
    前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、声紋認証を行う第1認証部と、
    前記生体情報、および、前記ユーザの登録生体情報に基づいて、生体認証を行う第2認証部と、
    通話相手の通話装置との音声通信による通話状態を制御する通話制御部と、
    音声を所定の登録音声に変換する音声変換部と、を備え、
    前記第1認証部による前記声紋認証の結果が成功であり、かつ、前記第2認証部による前記生体認証の結果が成功であった場合に、前記通話制御部は前記通話相手の通話装置との音声通信による通話状態を確立し、前記音声変換部は前記通話状態で前記ユーザが用いる前記人工喉頭装置によって発声された音声を前記登録音声に変換してから前記通話相手の通話装置に伝達し、
    前記第1認証部は、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、前記音声のボリュームと、前記ユーザの登録声紋情報のボリュームに基づいて、前記ユーザに、発声させる音声のボリュームの増加または減少の要請を通知する、情報処理システム。
  7. ユーザまたはユーザが用いる音声発声補助装置によって発声された音声の情報を取得する第1取得ステップと、
    前記ユーザに関する音声以外の生体情報を取得する第2取得ステップと、
    前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、声紋認証を行う第1認証ステップと、
    前記生体情報、および、前記ユーザの登録生体情報に基づいて、生体認証を行う第2認証ステップと、
    前記第1認証ステップによる前記声紋認証の結果が成功であり、かつ、前記第2認証ステップによる前記生体認証の結果が成功であった場合に、通話相手の通話装置との音声通信による通話状態を確立し、前記通話状態で前記ユーザまたは前記ユーザが用いる前記音声発声補助装置によって発声された音声を登録音声に変換してから前記通話相手の通話装置に伝達する通話制御ステップと、をコンピュータに実行させるためのプログラムであって、
    前記第1認証ステップは、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、複数のボリュームそれぞれについて登録されている前記ユーザの登録声紋情報のうち、前記音声とボリューム同士が近い前記登録声紋情報に基づいて前記声紋認証を行う、プログラム
  8. ユーザまたはユーザが用いる音声発声補助装置によって発声された音声の情報を取得する第1取得ステップと、
    前記ユーザに関する音声以外の生体情報を取得する第2取得ステップと、
    前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、声紋認証を行う第1認証ステップと、
    前記生体情報、および、前記ユーザの登録生体情報に基づいて、生体認証を行う第2認証ステップと、
    前記第1認証ステップによる前記声紋認証の結果が成功であり、かつ、前記第2認証ステップによる前記生体認証の結果が成功であった場合に、通話相手の通話装置との音声通信による通話状態を確立し、前記通話状態で前記ユーザまたは前記ユーザが用いる前記音声発声補助装置によって発声された音声を登録音声に変換してから前記通話相手の通話装置に伝達する通話制御ステップと、をコンピュータに実行させるためのプログラムであって、
    前記第1認証ステップは、前記音声の情報、および、前記ユーザの登録声紋情報に基づいて、前記声紋認証を行う場合に、前記音声のボリュームと、前記ユーザの登録声紋情報のボリュームに基づいて、前記ユーザに、発声させる音声のボリュームの増加または減少の要請を通知する、プログラム
JP2019237461A 2019-12-26 2019-12-26 情報処理装置、情報処理システム、および、プログラム Active JP6931175B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019237461A JP6931175B2 (ja) 2019-12-26 2019-12-26 情報処理装置、情報処理システム、および、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019237461A JP6931175B2 (ja) 2019-12-26 2019-12-26 情報処理装置、情報処理システム、および、プログラム

Publications (2)

Publication Number Publication Date
JP2021106350A JP2021106350A (ja) 2021-07-26
JP6931175B2 true JP6931175B2 (ja) 2021-09-01

Family

ID=76919630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019237461A Active JP6931175B2 (ja) 2019-12-26 2019-12-26 情報処理装置、情報処理システム、および、プログラム

Country Status (1)

Country Link
JP (1) JP6931175B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04287558A (ja) * 1991-03-18 1992-10-13 Fujitsu Ltd 障害者用音声通信方式
JP3258632B2 (ja) * 1998-11-26 2002-02-18 株式会社高度移動通信セキュリティ技術研究所 指紋認証装置
JP2006171226A (ja) * 2004-12-14 2006-06-29 Sony Corp 音声処理装置
JP2010103704A (ja) * 2008-10-22 2010-05-06 Yamaha Corp 音声変換装置
JP5569151B2 (ja) * 2010-06-01 2014-08-13 株式会社ナカヨ通信機 電話システム、電話端末、およびプレゼンス情報の通知方法
JP7143579B2 (ja) * 2017-11-02 2022-09-29 ヤマハ株式会社 音声入力装置

Also Published As

Publication number Publication date
JP2021106350A (ja) 2021-07-26

Similar Documents

Publication Publication Date Title
JP7294477B2 (ja) 認証装置、認証方法およびコンピュータプログラム
US11056117B2 (en) Enhanced voiceprint authentication
CA3026251C (en) System and method for voice authentication
ES2880006T3 (es) Método y aparato de construcción de modelo de la huella vocal de un usuario
US10650824B1 (en) Computer systems and methods for securing access to content provided by virtual assistants
US8812319B2 (en) Dynamic pass phrase security system (DPSS)
US8589167B2 (en) Speaker liveness detection
CN108702354A (zh) 基于传感器信号的活跃度确定
JP7380775B2 (ja) 音響機器、音響機器の制御方法及び制御プログラム
EP4143719B1 (en) Techniques to provide sensitive information over a voice connection
CN101467204A (zh) 用于生物计量声纹认证的方法和系统
JP2002312318A (ja) 電子装置、本人認証方法およびプログラム
JP7120313B2 (ja) 生体認証装置、生体認証方法およびプログラム
JP6931175B2 (ja) 情報処理装置、情報処理システム、および、プログラム
JP2000067005A (ja) 本人確認方法及びその方法を用いた装置及び本人確認装置制御プログラムを記録した記録媒体
Shirvanian et al. Short voice imitation man-in-the-middle attacks on Crypto Phones: Defeating humans and machines
KR101876262B1 (ko) 복합 사용자 인증 시스템
JP7487668B2 (ja) 情報処理装置及び情報処理方法
JP5263595B2 (ja) ユーザ認証装置及び方法
JP2007010995A (ja) 話者認識方法
CN109756342B (zh) 一种基于声纹的对话交流式的账号身份认证方法及装置
JP7293863B2 (ja) 音声処理装置、音声処理方法およびプログラム
FI127920B (en) Online multimodal information transfer method, associated system and device
JP2023155684A (ja) プログラム、情報処理装置、及び方法
US20190199713A1 (en) Authentication via middle ear biometric measurements

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210330

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210726

R150 Certificate of patent or registration of utility model

Ref document number: 6931175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150