JP7215563B2 - 声認証装置、声認証方法、及び、記録媒体 - Google Patents

声認証装置、声認証方法、及び、記録媒体 Download PDF

Info

Publication number
JP7215563B2
JP7215563B2 JP2021502000A JP2021502000A JP7215563B2 JP 7215563 B2 JP7215563 B2 JP 7215563B2 JP 2021502000 A JP2021502000 A JP 2021502000A JP 2021502000 A JP2021502000 A JP 2021502000A JP 7215563 B2 JP7215563 B2 JP 7215563B2
Authority
JP
Japan
Prior art keywords
question
voice
text information
answer
information indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021502000A
Other languages
English (en)
Other versions
JPWO2020171040A1 (ja
Inventor
慎也 高島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020171040A1 publication Critical patent/JPWO2020171040A1/ja
Application granted granted Critical
Publication of JP7215563B2 publication Critical patent/JP7215563B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、声認証装置、声認証方法及び記録媒体に関する。
保険サービス、銀行口座の照会、会員制サービス等の電話問合せを受け付けるサービスでは、特定の人物に限って情報を開示するために声認証を利用した本人確認を行うことがある。
特許文献1は、通話中の話者が予め登録された顧客であることを特定するシステムであって、話者の通話音声から抽出した声紋情報と、声紋が登録されたデータベースとを比較し、話者が予め登録された顧客であることを特定するシステムを開示している。
特開2010-113167号公報
特許文献1に記載の技術は、声紋が登録されたデータベース内に複数のグループが存在し、話者の声紋と各グループの基準者の声紋とを比較する。そして最も類似するグループに属する被登録者の声紋と当該話者の声紋を順次比較し、最も類似する被登録者を特定する。この場合、データベース内に登録された声紋と話者の声紋とを順次比較するため時間を要する。
本発明は、電話を介して本人確認を行う状況において、より短時間かつ高精度な声認証を実現することを課題とする。
本発明によれば、
質問がユーザの識別情報と関連付けて記録された記録手段と、
回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられている質問を優先して出力する出力手段と、
前記出力手段が出力した質問に対する回答が発声された音声情報を用いて声認証を行う認証手段と、
を備え
前記質問は、質問内容に対応する回答を示すテキスト情報が関連付けて記録された質問と、質問内容に対応する回答を示すテキスト情報が記録されていない質問を含む声認証装置が提供される。
本発明によれば、
質問をユーザの識別情報と関連付けて記録し、
回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられている質問を優先して出力し、
出力された質問に対する回答が発声された音声情報を用いて声認証を行
前記質問は、質問内容に対応する回答を示すテキスト情報が関連付けて記録された質問と、質問内容に対応する回答を示すテキスト情報が記録されていない質問を含む声認証方法が提供される。
本発明によれば、
質問をユーザの識別情報と関連付けて記録し、
回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられた質問を優先して出力する処理、
出力された質問に対する回答が発声された音声情報を用いて声認証を行う処理、
を実行させ
前記質問は、質問内容に対応する回答を示すテキスト情報が関連付けて記録された質問と、質問内容に対応する回答を示すテキスト情報が記録されていない質問を含むプログラムが提供される。
本発明によれば、より短時間かつ高精度で音声による認証を行うことができる。
本実施形態の声認証システムの機能ブロック図の一例である。 本実施形態の声認証装置の機能ブロック図の一例である。 本実施形態の声認証装置が処理する情報の一例を模式的に示す図である。 本実施形態の声認証装置のハードウエア構成の一例を示す図である。 本実施形態の声認証装置の処理の流れの一例を示すフローチャートである。 本実施形態の声認証装置の機能ブロック図の一例である。 本実施形態の処理装置の処理の流れの一例を示すフローチャートである。 本実施形態の声認証装置の機能ブロック図の一例である。 本実施形態の処理装置の処理の流れの一例を示すフローチャートである。 本実施形態の声認証装置の機能ブロック図の一例である。
<第1の実施形態>
本発明の第1の実施形態を説明する。図1の機能ブロック図を用いて、本実施形態の声認証システムの全体像を説明する。声認証装置10はオペレーター端末20と接続され、声認証に必要な情報を送受信する。
声認証は、音声の特徴量を用いて音声を発した人物を特定する認証方法である。声認証の方式には、特定のフレーズの音声情報を登録し認証する方式(テキスト依存方式)と、フレーズに依存せず非定型の自然な会話の音声情報を登録し認証する方式(テキスト独立方式)が例示される。テキスト依存方式は、特定フレーズの発話音声データを登録および認証に用いるため、フレーズに依存しないテキスト独立方式に比べて、短時間の音声で照合が可能であり、かつ高精度で認証を行うことができる。また、テキスト独立方式であっても照合に用いる音声が示すテキスト情報が既知である方が、高い精度で認証を行うことができる。
声認証装置10は、識別情報取得部11とストレージ部12と出力部13と音声取得部14と認証部15とを有する。オペレーター端末20は、コールセンター等においてオペレーターが利用する端末であり、通話部21と表示部23と入力部22を有する。これらの構成は、インターネット等の通信ネットワークを介して接続され、相互に通信可能である。
本実施形態は、コールセンターで電話対応業務に従事するオペレーターが、声認証を用いて通話中の顧客の本人確認を行う例を挙げて説明する。なお、本実施形態では、顧客は識別対象者のことを指す。
オペレーターは顧客から電話の問合せを受け、電話対応をする人物である。オペレーターは電話対応業務に携わる間、オペレーター端末20を操作する。オペレーターは、電話で問合せをした顧客に対し、個人情報等の開示範囲が制限される情報を開示する場合には、情報を開示する前に顧客が個人情報を開示可能な人物であることを確認する。本実施形態では顧客の本人確認に声認証を利用する。
オペレーター端末20は、パーソナルコンピュータ、スマートフォン、タブレット端末、携帯電話、専用端末等が例示されるが、これらに限定されない。
入力部22は、顧客を識別する識別情報の入力を受け付け、識別情報取得部11に送信する。オペレーターは、顧客から聞き取った識別情報を入力部22に入力する。入力部22は、オペレーターからの入力を受け付ける機器として実現されてもよい。入力部22は、パーソナルコンピュータに接続されたキーボード、スマートフォンまたはタブレット端末が有するタッチパネル等が例示されるが、これらに限定されない。
識別情報取得部11は、顧客の識別情報を取得する。識別情報は、外部端末から受信してもよいし、声認証装置10に入力されるものであってもよい。識別情報は、電話番号、登録番号、氏名、郵便番号、住所、生年月日、発声フレーズ、虹彩、顔画像、指紋、掌紋、静脈、歩容等が例示されるが、これらに限定されない。
図2を用いてストレージ部12が有するデータベースの概念を説明する。ストレージ部12は、顧客の音声の特徴量が記録された認証データベース1Bと、顧客の認証に用いる質問が記録された質問データベース2Bを有する。質問データベース2Bには、顧客の本人確認をする際にオペレーターが顧客に問う質問を示す情報と、質問に対する回答を示す情報が関連付けて複数記録されている。
図3を用いて質問データベース2Bに記録された情報について説明する。図3は、質問データベース2Bに記録された情報の一例である。質問データベース2Bには、顧客の認証に用いる質問と回答が関連付けて記録される。質問と回答の組み合わせは顧客の識別情報と関連付けて記録されている。
図3の一例によると、「生年月日は?」と記録された質問の回答は「〇月〇日」とテキスト情報で記録されているが、「携帯電話の下四桁は?」と記録された質問に対しては、回答を示すテキスト情報が記録されていない。このように質問データベース2Bには回答がテキスト情報で関連付けて記録されている質問と、回答がテキスト情報で関連付けて記録されていない質問、の複数種類が記録されている。
出力部13は、識別情報取得部11が取得した識別情報を用いて、質問データベース2Bに記録された質問の中から、識別情報が示す顧客に関連付けられた質問を特定し、回答がテキスト情報で関連付けて記録された質問を優先して出力する。出力部13は、表示部23が情報を表示する指示を出力するものであってもよいし、出力部13が表示部23の機能を備えていてもよい。
表示部23は、オペレーターが参照する情報を表示する。表示部23は、出力部13から受信した情報を表示する。表示部23が表示する情報は、例えば、顧客の本人確認をするために必要な情報や、オペレーターが顧客に問いかける質問を示す情報の他、声認証の結果等を含んでいてもよい。表示部23は視覚情報等を出力するものであり、ディスプレイ、ランプ等が例示されるが、これらに限定されない。
なお、表示部23がオペレーターに情報を伝達する代わりに、不図示のスピーカが出力部13から受信した情報を音声でオペレーターに伝達してもよい。また、表示部23が不図示のスピーカを備えてもよい。その場合、表示部23は、出力部13から受信した情報を音声情報及び視覚情報で出力する。不図示のスピーカは、パーソナルコンピュータまたはタブレット端末に接続されたヘッドセットに内蔵されるものや、スマートフォンまたはタブレット端末が有するものが例示されるが、これらに限定されない。
通話部21は、オペレーター端末20と顧客との通話中に、顧客が発した音声を受信し、受信した音声を音声取得部14に送信する。通話部21が音声取得部14に送信する音声には、少なくとも顧客が発した音声の一部が含まれていればよい。例えば、通話部21は、オペレーターが顧客に質問を問いかけた後に、質問に対し顧客が回答した音声を送信する。なお、通話部21は、単に質問を問いかけた後に顧客が発した音声を取得するように設計されてもよい。
通話部21は、オペレーターが顧客と通話を行うために用いる機器として実現されてもよい。通話部21は、パーソナルコンピュータまたはタブレット端末に接続されたヘッドセット、スマートフォンまたはタブレット端末が有するマイク及びスピーカ等が例示されるが、これらに限定されない。
音声取得部14は、顧客が発した音声を取得し認証部15に送信する。音声取得部14が認証部15に送信する音声には、少なくとも顧客が発した音声の一部が含まれていればよい。例えば、音声取得部14は、出力部13が情報(例:認証に用いる質問)を出力した後に、音声を取得する。
認証部15は、音声取得部14が取得した音声または音声の特徴量を参照し、認証データベース1Bに記録された音声の特徴量と照合する。照合に成功した場合、顧客は識別情報が示す人物であることを特定する。
次に、声認証装置10及びオペレーター端末20を、一つ以上のコンピュータを用いて実現するハードウエア構成の一例について説明する。声認証装置10及びオペレーター端末20が備える各機能部は、任意のコンピュータのCPU(Central Processing Unit)、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット、ネットワーク接続用インターフェイス等を中心にハードウエアとソフトウエアの任意の組合せによって実現される。この実現方法、装置には種々の変形例があることは、当業者には理解されるところである。なお記憶ユニットは、装置の出荷以前から格納されているプログラムのほか、光ディスク、光磁気ディスク、半導体フラッシュメモリ等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納可能である。
図4は、声認証装置10及びオペレーター端末20のハードウエア構成を例示するブロック図である。図4に示すように、声認証装置10及びオペレーター端末20は、プロセッサ1A、メモリ2A、入出力インターフェイス3A、周辺回路4A、通信インターフェイス5A、バス6Aを有する。周辺回路4Aには、様々なモジュールが含まれる。声認証装置10及びオペレーター端末20は周辺回路4Aを有さなくてもよい。なお、声認証装置10及びオペレーター端末20は物理的及び/又は論理的に分かれた複数の装置で構成されてもよい。この場合、複数の装置各々が上記のハードウエア構成を備えることができる。
バス6Aは、プロセッサ1A、メモリ2A、入出力インターフェイス3A、周辺回路4A、通信インターフェイス5Aが相互にデータを送受信するためのデータ伝送路である。プロセッサ1Aは、例えばCPU、GPU(Graphics Processing Unit)やマイクロプロセッサ等の演算処理装置である。プロセッサ1Aは、例えば、メモリ2Aに記憶された各種プログラムに従って処理を実行することが可能である。
メモリ2Aは、例えばRAM(Random Access Memory)やROM(Read Only Memory)などのメモリであり、プログラムや各種データを記憶する。
入出力インターフェイス3Aは、入力装置、外部装置、外部ストレージ部、外部センサ、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部ストレージ部等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばタッチパネル、キーボード、マウス、マイク、カメラ等である。出力装置は、例えばディスプレイ、スピーカ、プリンタ、ランプ等である。
プロセッサ1Aは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。
通信インターフェイス5Aは声認証装置10及びオペレーター端末20が外部装置と相互に通信することを実現する他、声認証装置10とオペレーター端末20が相互に通信することを実現する。なお、声認証装置10またはオペレーター端末20の一部の機能をコンピュータで構成してもよい。
次に図5のフローチャートを用いて本実施形態における声認証方法を説明する。オペレーターはオペレーター端末20を操作し、顧客と通話を開始する。オペレーターは、通話中に顧客の識別情報を受け付け入力部22に入力する(S11)。入力部22は、受け付けた顧客の識別情報を、識別情報取得部11に送信する。識別情報取得部11は、受信した顧客の識別情報を基に、ストレージ部12が有する質問データベース2Bから識別情報と関連付いた質問群を特定する(S12)。
出力部13は、顧客の識別情報に関連付いた質問群の中から、回答がテキスト情報で関連付けられて記録された質問を表示部23に送信する。表示部23は出力部13から送信された質問を表示する(S13)。オペレーターは、表示部23に表示された質問を通話中の顧客に問いかける。
通話部21は、オペレーターが質問を問いかけた後に、質問に対する回答を示す音声を取得し、音声取得部14に送信する(S14)。つまり、通話部21は、出力部13が質問を出力した後に顧客が発した音声を取得する。音声取得部14は、受信した顧客の音声を認証部15に送信する。認証部15は受信した音声を用いて認証を行う(S15)。
以上説明した本実施形態の声認証装置10では、顧客の声認証をする際に、データベース上に記録された質問の中から、回答がテキスト情報で関連付けて記録された質問を選択してオペレーターに提示し質問の問いかけを促す。オペレーターはテキスト情報が既知である音声を顧客に発声させやすくするため、これにより質問をランダムに発生させた場合に比較して、より短時間で音声による本人確認を行うことができる。
<第2の実施形態>
第2の実施形態は、声認証装置10がオペレーター端末20との通信の有無に依らず単体で機能する点で、第1の実施形態と相違する。本実施形態は声認証装置10について説明する。
本発明の第2の実施形態を説明する。図6の機能ブロック図を用いて、本実施形態の声認証装置の全体像を説明する。声認証装置10は、識別情報取得部11とストレージ部12と出力部13と音声取得部14と認証部15とを有する。これらの構成は、インターネット等の通信ネットワークを介して接続され、相互に通信可能である。
識別情報取得部11は、顧客の識別情報を取得する。識別情報は、外部端末から受信してもよいし、声認証装置10に直接入力されるものであってもよい。識別情報は、電話番号、登録番号、氏名、郵便番号、住所、生年月日、発声フレーズ、虹彩、顔画像、指紋、掌紋、静脈、歩容等が例示されるが、これらに限定されない。
出力部13は、識別情報取得部11が取得した識別情報を用いて、質問データベース2Bに記録された質問の中から、識別情報が示す顧客に関連付けられた質問を特定し、回答がテキスト情報で関連付けて記録された質問を優先して出力する。
音声取得部14は、顧客が発した音声を取得し認証部15に送信する。音声取得部14が認証部15に送信する音声には、少なくとも顧客が発した音声の一部が含まれていればよい。例えば、音声取得部14は、出力部13が情報(例:認証に用いる質問)を出力した後に、音声を取得する。
認証部15は、音声取得部14が取得した音声または音声の特徴量を参照し、認証データベース1Bに記録された音声の特徴量と照合する。照合に成功した場合、顧客は識別情報が示す人物であることを特定する。
次に図7のフローチャートを用いて本実施形態の声認証装置10の処理の流れの一例を説明する。声認証装置10は顧客の識別情報が入力されると(S21)、顧客の識別情報に関連付いた質問の中から、回答がテキスト情報で関連付けて記録された質問を出力する(S22)。質問を出力した後に、質問に対する回答を示す音声を取得し(S23)、取得した音声を用いて、認証を行う(S24)。
以上説明した本実施形態の声認証装置10では、顧客の声認証をする際に、データベース上に記録された質問の中から、回答がテキスト情報で関連付けて記録された質問を優先して出力する。顧客は質問に対する回答を試みようとして、テキスト情報が既知である音声を発する可能性が高くなるため、顧客に対して質問をランダムに出力する場合に比べ、より短時間で音声による本人確認を行うことができる。
<第3の実施形態>
第3の実施形態は、声認証装置10が更に優先度設定部16を有する点で第1及び第2の実施形態とは相違する。声認証装置10の他の構成は第1及び第2の実施形態と同一である。第1及び第2の実施形態と重複する箇所に関しては説明を省略する。
図8の機能ブロック図を用いて、本実施形態の声認証装置の全体像を説明する。声認証装置10は、第1の実施形態の声認証装置の構成に加え、優先度設定部16を有する。
優先度設定部16は、質問データベース2Bに記録された質問の中から、出力部13が出力する質問の優先度を設定する。質問データベース2Bには、第1の実施形態と同様に、関連付いた回答がテキスト情報で記録されている質問と、関連付いた回答がテキスト情報で記録されていない質問が複数記録されている。
優先度設定部16は、質問データベース2Bに記録された複数の質問の中で、回答がテキスト情報で記録されていない質問と比べて、回答がテキスト情報で記録されている質問の優先度を高く設定する。
ストレージ部12は、優先度設定部16が設定した優先度を、質問データベース2Bに記録された質問に関連付けて記録する。
出力部13は、優先度設定部16が各質問に設定した優先度に基づき、質問データベース2Bに記録された質問の中から優先度が高く設定された質問を選択し、出力する。出力部13が出力する質問は1以上であり、例えば、最初に選択され出力された質問が顧客の本人確認に有効ではない場合は、次に優先度が高く設定された質問が出力されるよう設計してもよい。
次に図9のフローチャートを用いて本実施形態の声認証装置10の処理の流れの一例を説明する。声認証装置10は顧客の識別情報が入力されると(S31)、顧客の識別情報を基にデータベースを参照し、質問を出力する優先度を設定する(S32)。設定された優先度を質問に関連付けて記録する(S33)。次に顧客の識別情報に関連付いた質問の中から、設定された優先度が最も高い質問を出力する(S34)。質問を出力した後に、質問に対する回答を示す音声を取得し(S35)、取得した音声を用いて、認証を行う(S36)。
なお、上記の処理の流れは一例であり、S31~S36までの各ステップは適宜変更可能である。例えば、質問の優先度を設定するステップ(S32)及び優先度を質問に関連付けて記録するステップ(S33)は顧客の識別情報を入力するステップ(S31)の前に処理されてもよい。また、上記で説明した処理の流れが発生する前に質問の優先度が設定されるものであってもよいし、質問データベース2Bに新規の質問が記録されたタイミングで質問の優先度を再設定(更新)してもよい。質問の優先度が設定されるタイミング及び優先度を質問に関連付けて記録するタイミングは限定されない。
以上説明した本実施形態の声認証装置10では、顧客の声認証をする際に、データベース上に記録された質問の中から、出力する質問の優先度を設定する。テキスト情報の回答が関連付いた質問を優先して顧客に問いかけることができるため、顧客は質問に対する回答を試みようとして、テキスト情報が既知である音声を発する可能性が高くなる。顧客が発話する音声のテキスト情報を予測できるため、顧客に対して質問をランダムに出力する場合に比べ、より短時間で音声による本人確認を行うことができる。
<変形例>
上記の第1から第3の実施形態に適応可能な変形例を説明する。上記の実施形態の声認証装置10はストレージ部12を有するが、変形例では、ストレージ部12の構成が声認証装置10とは異なる外部端末に搭載されていてもよい。この場合、声認証装置10とストレージ部12はインターネット等の通信ネットワークを介して相互に通信可能である。
他の変形例を説明する。第1の実施形態では、オペレーター端末20が有する表示部23から出力された質問をオペレーターが問うことで、質問に回答しようと顧客が発した音声を用いた声認証を行うが、出力部13はオペレーター端末20に対して質問を出力する以外にも、通話部21を介して自動音声等で顧客に質問を直接問いかけてもよい。この場合、顧客は通話に使用している不図示の端末を介して自動音声で流れる質問を聞き、質問に対する回答を発話する。オペレーター端末20が有する通話部21は、顧客が発話した音声を取得する。
上記の変形例では、顧客に質問を問いかける際にオペレーターを介する必要がないため、オペレーターの本人確認業務に要する負荷を軽減することができる。
他の変形例を説明する。オペレーター端末20が有する表示部23は、顧客の認証結果を表示してもよいし、認証結果に応じて顧客の識別情報に関連付いた所定の情報を表示してもよい。
声認証装置10はオペレーター端末20の機能を有してもよい。その場合でも同様の効果を得られる。
声認証装置10と通信するオペレーター端末20は複数であってもよいし、声認証装置10が複数のオペレーター端末20を有する構成であってもよい。
上記で説明した変形例は、第1から第3の実施形態と適宜組み合わせ可能である他、変形例同士を互いに組み合わせることも可能である。第1から第3の実施形態で記述した構成同士を互いに組み合わせてもよい。
<第4の実施形態>
図10は、第4の実施形態に係る声認証装置の機能構成を示す。声認証装置40は、出力部41と、認証部42と、を備える。出力部41は、回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられている質問を優先して出力する。認証部42は、出力部が出力した質問に対する回答が発声された音声情報を用いて声認証を行う。
その他、本発明の趣旨を逸脱しない範囲で、上記した実施形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この発明の技術内容は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。
上記の実施形態及び変形例の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられている質問を優先して出力する出力部と、
前記出力部が出力した質問に対する回答が発声された音声情報を用いて声認証を行う認証部と、
を備える声認証装置。
(付記2)
質問がユーザの識別情報と関連付けて記録された記録部をさらに備え、
前記質問は、質問内容に対応する回答を示すテキスト情報が関連付けて記録された質問と、質問内容に対応する回答を示すテキスト情報が記録されていない質問を含む、
付記1に記載の声認証装置。
(付記3)
前記音声情報は、前記出力部が質問を出力した後に前記ユーザが発した音声である
付記1または2に記載の声認証装置。
(付記4)
質問の優先度を設定する優先度設定部をさらに備え、
前記質問の優先度は、前記出力部が出力する優先度を示し、
前記記録部は、質問の優先度を記録し、
前記優先度設定部は、回答を示すテキスト情報が関連付けられた質問の優先度をテキスト情報が関連付けられていない質問より高く設定する、
付記1から3のいずれか1項に記載の声認証装置。
(付記5)
前記出力部は、前記認証部が認証に失敗した場合、次に優先度の高い質問を出力する、
付記4に記載の声認証装置。
(付記6)
前記出力部は、前記出力部を閲覧したオペレーターが前記出力部に表示された質問をユーザに問うことを促す、付記1から5のいずれか1項に記載の声認証装置。
(付記7)
回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられた質問を優先して出力し、
出力された質問に対する回答が発声された音声情報を用いて声認証を行う、声認証方法。
(付記8)
コンピュータに、
回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられた質問を優先して出力する処理、
出力された質問に対する回答が発声された音声情報を用いて声認証を行う処理、
を実行させるプログラムを記録した記録媒体。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。
この出願は、2019年2月18日に出願された日本出願特願2019-026871を基礎とする優先権を主張し、その開示の全てをここに取り込む。
1A プロセッサ
2A メモリ
3A 入出力インターフェイス
4A 周辺回路
5A 通信インターフェイス
6A バス
1B 認証データベース
2B 質問データベース
10 声認証装置
11 識別情報取得部
12 ストレージ部
13 出力部
14 音声取得部
15 認証部
16 優先度設定部
20 オペレーター端末
21 通話部
22 入力部
23 表示部

Claims (7)

  1. 質問がユーザの識別情報と関連付けて記録された記録手段と、
    回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられている質問を優先して出力する出力手段と、
    前記出力手段が出力した質問に対する回答が発声された音声情報を用いて声認証を行う認証手段と、
    を備え、
    前記質問は、質問内容に対応する回答を示すテキスト情報が関連付けて記録された質問と、質問内容に対応する回答を示すテキスト情報が記録されていない質問を含む声認証装置。
  2. 前記音声情報は、前記出力手段が質問を出力した後に前記ユーザが発した音声である請求項1に記載の声認証装置。
  3. 質問の優先度を設定する優先度設定手段をさらに備え、
    前記質問の優先度は、前記出力手段が出力する優先度を示し、
    前記記録手段は、質問の優先度を記録し、
    前記優先度設定手段は、回答を示すテキスト情報が関連付けられた質問の優先度をテキスト情報が関連付けられていない質問より高く設定する請求項に記載の声認証装置。
  4. 前記出力手段は、前記認証手段が認証に失敗した場合、次に優先度の高い質問を出力する請求項に記載の声認証装置。
  5. 前記出力手段は、前記出力手段を閲覧したオペレーターが前記出力手段に表示された質問をユーザに問うことを促す請求項1からのいずれか1項に記載の声認証装置。
  6. 質問をユーザの識別情報と関連付けて記録し、
    回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられた質問を優先して出力し、
    出力された質問に対する回答が発声された音声情報を用いて声認証を行
    前記質問は、質問内容に対応する回答を示すテキスト情報が関連付けて記録された質問と、質問内容に対応する回答を示すテキスト情報が記録されていない質問を含む声認証方法。
  7. 質問をユーザの識別情報と関連付けて記録し、
    コンピュータに、回答を示すテキスト情報が関連付けられていない質問より、回答を示すテキスト情報が関連付けられた質問を優先して出力する処理、
    出力された質問に対する回答が発声された音声情報を用いて声認証を行う処理、
    を実行させ
    前記質問は、質問内容に対応する回答を示すテキスト情報が関連付けて記録された質問と、質問内容に対応する回答を示すテキスト情報が記録されていない質問を含むプログラム。
JP2021502000A 2019-02-18 2020-02-18 声認証装置、声認証方法、及び、記録媒体 Active JP7215563B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019026871 2019-02-18
JP2019026871 2019-02-18
PCT/JP2020/006179 WO2020171040A1 (ja) 2019-02-18 2020-02-18 声認証装置、声認証方法、及び、記録媒体

Publications (2)

Publication Number Publication Date
JPWO2020171040A1 JPWO2020171040A1 (ja) 2021-12-16
JP7215563B2 true JP7215563B2 (ja) 2023-01-31

Family

ID=72145003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021502000A Active JP7215563B2 (ja) 2019-02-18 2020-02-18 声認証装置、声認証方法、及び、記録媒体

Country Status (5)

Country Link
US (1) US20220139402A1 (ja)
EP (1) EP3929917A4 (ja)
JP (1) JP7215563B2 (ja)
CN (1) CN113454711A (ja)
WO (1) WO2020171040A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023100960A1 (ja) * 2021-12-03 2023-06-08 パナソニックIpマネジメント株式会社 認証装置および認証方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099090A (ja) 1998-09-22 2000-04-07 Kdd Corp 記号列を用いた話者認識方法
JP2002014695A (ja) 2000-06-28 2002-01-18 Nippon Telegr & Teleph Corp <Ntt> 対話型本人認証方法および装置
JP2003263417A (ja) 2002-03-11 2003-09-19 Ryutaro Yoshida 認証システム
JP2004177663A (ja) 2002-11-27 2004-06-24 Fujitsu Ltd 受講者識別方法
JP2010109618A (ja) 2008-10-29 2010-05-13 Ntt Communications Kk 認証装置、認証方法、及びプログラム
WO2013080406A1 (ja) 2011-11-28 2013-06-06 Necソフト株式会社 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
JP2014197140A (ja) 2013-03-29 2014-10-16 株式会社日本総合研究所 オペレータ本人確認支援システム及びその方法
JP2017187967A (ja) 2016-04-07 2017-10-12 京セラドキュメントソリューションズ株式会社 電子機器及び認証プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1314303A2 (en) * 2000-08-29 2003-05-28 Telefonaktiebolaget LM Ericsson (publ) Voice response unit, control method thereof and telephone communication system
JP2004139221A (ja) * 2002-10-16 2004-05-13 Ntt Docomo Tokai Inc 認証システム
JP4438014B1 (ja) 2008-11-06 2010-03-24 株式会社ネイクス 有害顧客検知システム、その方法及び有害顧客検知プログラム
CN102035649B (zh) * 2009-09-29 2013-08-21 国际商业机器公司 认证方法和装置
US20130006626A1 (en) * 2011-06-29 2013-01-03 International Business Machines Corporation Voice-based telecommunication login
KR101209033B1 (ko) * 2012-02-14 2012-12-06 주식회사 예스피치 자동응답시스템의 화자인식을 이용한 고객 인증 시스템 및 방법
CN104217149B (zh) * 2013-05-31 2017-05-24 国际商业机器公司 基于语音的生物认证方法及设备
US20140379339A1 (en) * 2013-06-20 2014-12-25 Bank Of America Corporation Utilizing voice biometrics
CN107278306A (zh) * 2014-12-30 2017-10-20 威斯科数据安全国际有限公司 基于个人访问历史的用户认证
US10331867B2 (en) * 2016-10-05 2019-06-25 Plantronics, Inc. Enhanced biometric user authentication
JP2019026871A (ja) 2017-07-26 2019-02-21 日立金属株式会社 希土類フッ化物の製造方法
CN109003612B (zh) * 2018-06-08 2021-01-29 英业达科技有限公司 基于人工智能的语音问答验证系统及其方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099090A (ja) 1998-09-22 2000-04-07 Kdd Corp 記号列を用いた話者認識方法
JP2002014695A (ja) 2000-06-28 2002-01-18 Nippon Telegr & Teleph Corp <Ntt> 対話型本人認証方法および装置
JP2003263417A (ja) 2002-03-11 2003-09-19 Ryutaro Yoshida 認証システム
JP2004177663A (ja) 2002-11-27 2004-06-24 Fujitsu Ltd 受講者識別方法
JP2010109618A (ja) 2008-10-29 2010-05-13 Ntt Communications Kk 認証装置、認証方法、及びプログラム
WO2013080406A1 (ja) 2011-11-28 2013-06-06 Necソフト株式会社 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
JP2014197140A (ja) 2013-03-29 2014-10-16 株式会社日本総合研究所 オペレータ本人確認支援システム及びその方法
JP2017187967A (ja) 2016-04-07 2017-10-12 京セラドキュメントソリューションズ株式会社 電子機器及び認証プログラム

Also Published As

Publication number Publication date
EP3929917A4 (en) 2022-05-04
WO2020171040A1 (ja) 2020-08-27
EP3929917A1 (en) 2021-12-29
JPWO2020171040A1 (ja) 2021-12-16
US20220139402A1 (en) 2022-05-05
CN113454711A (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
CA3026251C (en) System and method for voice authentication
US11087769B1 (en) User authentication for voice-input devices
CN108702354B (zh) 基于传感器信号的活跃度确定
US20130006626A1 (en) Voice-based telecommunication login
US20030074201A1 (en) Continuous authentication of the identity of a speaker
US10984802B2 (en) System for determining identity based on voiceprint and voice password, and method thereof
US11062011B2 (en) Authentication via a dynamic passphrase
US20120253810A1 (en) Computer program, method, and system for voice authentication of a user to access a secure resource
JP2016529567A (ja) 決済を検証するための方法、装置、およびシステム
CN109510806B (zh) 鉴权方法及装置
JP2016517548A (ja) 音声及び顔認識に基づくサービス提供
EP4143719B1 (en) Techniques to provide sensitive information over a voice connection
US9014347B2 (en) Voice print tagging of interactive voice response sessions
JP2020518053A (ja) パーソナルボイスアシスタント認証
CN111160928A (zh) 一种验证身份的方法及装置
JP7215563B2 (ja) 声認証装置、声認証方法、及び、記録媒体
JP2000067005A (ja) 本人確認方法及びその方法を用いた装置及び本人確認装置制御プログラムを記録した記録媒体
EP3502938B1 (en) A conversational registration method for client devices
US11289080B2 (en) Security tool
US20160155188A1 (en) Usable security with social network assistance
JP5728456B2 (ja) 通信端末
KR20160112856A (ko) 화자 인증을 이용한 금융 보안 시스템 및 그 방법
US12010108B2 (en) Techniques to provide sensitive information over a voice connection
KR20140029990A (ko) 생체정보를 이용한 본인인증 시스템 및 방법
EP4002900A1 (en) Method and device for multi-factor authentication with voice based authentication

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210812

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230102

R151 Written notification of patent or utility model registration

Ref document number: 7215563

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151