JP2019097122A - 音声応答装置、および、プログラム - Google Patents
音声応答装置、および、プログラム Download PDFInfo
- Publication number
- JP2019097122A JP2019097122A JP2017227073A JP2017227073A JP2019097122A JP 2019097122 A JP2019097122 A JP 2019097122A JP 2017227073 A JP2017227073 A JP 2017227073A JP 2017227073 A JP2017227073 A JP 2017227073A JP 2019097122 A JP2019097122 A JP 2019097122A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- response
- mode
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004044 response Effects 0.000 title claims abstract description 140
- 238000004891 communication Methods 0.000 claims description 22
- 230000005540 biological transmission Effects 0.000 abstract description 33
- 238000004458 analytical method Methods 0.000 description 17
- 230000015572 biosynthetic process Effects 0.000 description 17
- 238000003786 synthesis reaction Methods 0.000 description 17
- 238000000034 method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
Abstract
【課題】電話による詐欺の発生を防止する。【解決手段】音声応答装置(100)は、音声入力部(10)と、音声出力部(20)と、電話網インタフェース(30)と、制御部(70)と、を備え、制御部が、電話網インタフェースが受信した受信音声を音声出力部に出力させ、受信音声に応じて、音声入力部に入力された入力音声を電話網インタフェースに送信させるか、予め設定された応答音声を送信させるか、を切り替える。【選択図】図1
Description
本発明は、音声応答装置、および、プログラムに関する。
電話による詐欺の発生を防止するために、予め登録されたユーザの関係者の声紋データと、当該ユーザの通話相手の声紋データとが一致するか否かを、通話開始後に当該ユーザに通知する技術がある。
例えば、特許文献1には、電話番号が登録されていない場合に、自動応答等で対応し、不審電話ではない場合には着信を許可する電話器システムが開示されている。特許文献2には、通話中に通話相手の声紋データを登録者の声紋データと比較し、一致するか一致しないかをユーザに通知する認証装置が開示されている。特許文献3には、通話中に通話相手の声紋データを登録者の声紋データと比較し、一致しない場合には通話の自動切断、バイブレーション等を行う通話システムが開示されている。
詐欺加害者が、予め警察、銀行員等を名乗って電話をかけた後で、ユーザの関係者になりすまして電話をかけることにより、ユーザに、通話相手が関係者であると強く信じ込ませることができる場合がある。このような場合、ユーザに対して、声紋データの不一致の通知等による警告を行ったとしても、ユーザは警告を無視するおそれがあるため、必ずしも詐欺を防止することができない。
本発明の一態様は、電話による詐欺の発生を防止することを目的とする。
上記の課題を解決するために、本発明の一態様に係る音声応答装置は、音声入力部と、音声出力部と、通信部と、制御部と、を備え、上記制御部が、上記通信部が受信した受信音声を上記音声出力部に出力させ、上記受信音声に応じて、上記音声入力部に入力された入力音声を上記通信部に送信させる第一モードと、上記入力音声に替えて、予め設定された応答音声を上記通信部に送信させる第二モードと、を切り替える。
本発明の一態様によれば、通話中にユーザを一度クールダウンさせることにより、電話による詐欺の発生を防止することができる。
〔実施形態1〕
以下、本発明の実施形態1について、詳細に説明する。
以下、本発明の実施形態1について、詳細に説明する。
(音声応答装置100の概要)
本実施形態に係る音声応答装置100は、通話相手が詐欺加害者である可能性があると判断した場合、通話相手に対して自動でメッセージを送信する。
本実施形態に係る音声応答装置100は、通話相手が詐欺加害者である可能性があると判断した場合、通話相手に対して自動でメッセージを送信する。
まず、通話者が通話相手と通話中に、通話相手からの音声を解析し、詐欺電話か否かを判定する。
この場合の解析方法には、会話で使われる単語が詐欺らしいか否かの判定、声紋が登録された詐欺師の声紋と一致するか否かの判定、等の方法を用いてもよい。
詐欺電話の可能性があると判定された場合、以下の動作を行う。
(1)通話者の音声を通話相手に送ることを停止する。このとき、通話者に対して自動応答モードに入ったことを通知してもよい。
(2)通話相手に対して、音声メッセージを送信する。当該音声メッセージは、音声合成によって作られたものでもよいし、予め通話者の音声を録音しておき、それを基に生成してもよい。音声メッセージの内容は、通話相手に対して「一旦切ってかけなおす。」等を提案するものでもよいし、「あなたの名前をもう一度教えて。」等の質問を行うものでもよい。音声メッセージは、通話相手だけでなく、通話者に対しても送信される。
(3)送信したメッセージに対して、通話相手からの受信を待つ。受信があった場合に、次のメッセージを送信する。このメッセージは、通話相手からの応答に応じて変化させてもよい。全てのメッセージに対して受信があった場合、通話者に対して自動応答モードを終了することを通知し、通話者の音声が通話相手に送られるようにする。
(1)通話者の音声を通話相手に送ることを停止する。このとき、通話者に対して自動応答モードに入ったことを通知してもよい。
(2)通話相手に対して、音声メッセージを送信する。当該音声メッセージは、音声合成によって作られたものでもよいし、予め通話者の音声を録音しておき、それを基に生成してもよい。音声メッセージの内容は、通話相手に対して「一旦切ってかけなおす。」等を提案するものでもよいし、「あなたの名前をもう一度教えて。」等の質問を行うものでもよい。音声メッセージは、通話相手だけでなく、通話者に対しても送信される。
(3)送信したメッセージに対して、通話相手からの受信を待つ。受信があった場合に、次のメッセージを送信する。このメッセージは、通話相手からの応答に応じて変化させてもよい。全てのメッセージに対して受信があった場合、通話者に対して自動応答モードを終了することを通知し、通話者の音声が通話相手に送られるようにする。
(音声応答装置100の構成)
図1は、本実施形態に係る音声応答装置100の要部構成を示すブロック図である。図1に示すように、音声応答装置100は、音声入力部10、音声出力部20、電話網インタフェース(通信部)30、および、制御部70を備えている。
図1は、本実施形態に係る音声応答装置100の要部構成を示すブロック図である。図1に示すように、音声応答装置100は、音声入力部10、音声出力部20、電話網インタフェース(通信部)30、および、制御部70を備えている。
音声入力部10は、音声応答装置100を用いて通話する通話者(ユーザ)1の発話する音声を入力する。音声入力部10は、内蔵マイクであってもよいし、制御部70と外付けのマイクとの間のインタフェースであってもよい。
音声出力部20は、当該ユーザに対して音声を出力する。音声出力部20は、内蔵スピーカであってもよいし、制御部70と外付けのスピーカとの間のインタフェースであってもよい。
電話網インタフェース30は、電話網2と接続し、音声の送受信を行う。電話網2は、通常の電話回線であってもよいし、IP電話で用いられるインターネットであってもよい。
制御部70は、音声応答装置100全体を制御するものであり、例えば、少なくとも1つのCPU(Central Processing Unit)等のプロセッサが制御プログラムを実行することにより実現される。制御プログラムは、音声応答装置100の制御部70としてコンピュータを機能させるためのものである。
図1に示すように、制御部70は、送信音声選択部71、メッセージ生成部72、出力音声合成部73、音声送信部74、受信音声解析部75、および、音声受信部76を備えている。
送信音声選択部71は、音声入力部10に入力された音声と、メッセージ生成部72で生成された音声との何れを、音声送信部74に送るのかを選択する。すなわち、送信音声選択部71は、受信音声に応じて、音声入力部10に入力された入力音声を電話網インタフェース30に送信させる通常会話モード(第一モード)と、入力音声に替えて、予め設定された応答音声を電話網インタフェース30に送信させる自動応答モード(第二モード)と、を切り替える。
メッセージ生成部72は、音声合成によって、出力用の音声メッセージを生成する。出力音声合成部73は、電話網インタフェース30、および、音声受信部76が受信した音声と、メッセージ生成部72で生成された音声とを合成し、合成した音声を音声出力部20に送る。出力音声合成部73は、電話網インタフェース30が受信した受信音声を音声出力部20に出力させてもよい。出力音声合成部73は、自動応答モードにおいて、応答音声を音声出力部20に出力させてもよい。
音声送信部74は、電話網インタフェース30を介して、音声を電話網2に送信する。受信音声解析部75は、音声受信部76で受信した音声を解析する。音声受信部76は、電話網インタフェース30を介して電話網2から音声を受信する。
(音声応答装置100の通常動作)
通常の通話において、音声入力部10は、通話者1の発話した音声を、音声応答装置100に入力し、音声送信部74は、当該音声を、電話網インタフェース30を介して電話網2に送信する。一方、音声受信部76は、通話相手の音声を、電話網2から電話網インタフェース30を介して受信し、音声出力部20が当該音声を可聴音に変換して通話者1に送信する。通常の通話の際には、送信音声選択部71は、音声入力部10が入力した音声をそのまま音声送信部74に送り、出力音声合成部73は、音声受信部76が受信した音声をそのまま音声出力部20に送る。
通常の通話において、音声入力部10は、通話者1の発話した音声を、音声応答装置100に入力し、音声送信部74は、当該音声を、電話網インタフェース30を介して電話網2に送信する。一方、音声受信部76は、通話相手の音声を、電話網2から電話網インタフェース30を介して受信し、音声出力部20が当該音声を可聴音に変換して通話者1に送信する。通常の通話の際には、送信音声選択部71は、音声入力部10が入力した音声をそのまま音声送信部74に送り、出力音声合成部73は、音声受信部76が受信した音声をそのまま音声出力部20に送る。
(メッセージ生成部72の処理)
メッセージ生成部72は、どういった場合にどのメッセージを通話相手に送信するのかというメッセージルールを保存している。メッセージルールの例を表1に示す。
メッセージ生成部72は、どういった場合にどのメッセージを通話相手に送信するのかというメッセージルールを保存している。メッセージルールの例を表1に示す。
表1に示すように、メッセージルールには、登録されているメッセージ毎に、メッセージの本文、そのメッセージが送信される条件、および、メッセージ送信後にどの状態になるのかを示す情報が含まれている。
表1の例では、メッセージ生成部72は、制御部70が自動応答モードになった場合に、「すみません。あなたの名前をもう一度教えてください。」というメッセージを生成する。
次に、そのメッセージに対して通話相手からの受信が肯定的だった場合(質問に回答する場合等)、メッセージ生成部72は、「あなたの電話番号も教えてください。」というメッセージを生成する。
これに対しても通話相手からの受信が肯定的だった場合、メッセージ生成部72は、「ありがとうございました。」というメッセージを生成する。その後に、制御部70は、通常会話モード(通話を開始したときのモード)に戻る。
通話相手が回答を拒否する等、受信が肯定的でなかった場合、メッセージ生成部72は、「申し訳ありませんが、電話を切ります。」というメッセージを生成する。そして、制御部70は、通話を終了する。
(音声応答装置100の処理)
音声応答装置100は、通話者1が電話を受けた場合、通話相手に詐欺の疑いがあるか否かを判定し、詐欺の疑いがあるときには、合成音声によるメッセージによって応答する。
音声応答装置100は、通話者1が電話を受けた場合、通話相手に詐欺の疑いがあるか否かを判定し、詐欺の疑いがあるときには、合成音声によるメッセージによって応答する。
図2は、本実施形態に係る音声応答装置100の通話処理を示すフローチャートである。以下、図2に従って、音声応答装置100の通話処理について説明する。
(ステップS1)
通話者1は、通話相手と通話を開始する。音声応答装置100において、制御部70は、通常会話モードになる。音声受信部76は、電話網2から電話網インタフェース30を経由して、通話相手の音声を受信し、当該受信音声を出力音声合成部73および受信音声解析部75に送信する。
通話者1は、通話相手と通話を開始する。音声応答装置100において、制御部70は、通常会話モードになる。音声受信部76は、電話網2から電話網インタフェース30を経由して、通話相手の音声を受信し、当該受信音声を出力音声合成部73および受信音声解析部75に送信する。
(ステップS2)
受信音声解析部75は、音声受信部76から受信音声を取得し、通話中の受信音声を解析する。例えば、受信音声解析部75は、受信音声に含まれる単語を抽出して、単語全体に対する、詐欺でよく使われる単語の割合を計算する。
受信音声解析部75は、音声受信部76から受信音声を取得し、通話中の受信音声を解析する。例えば、受信音声解析部75は、受信音声に含まれる単語を抽出して、単語全体に対する、詐欺でよく使われる単語の割合を計算する。
(ステップS3)
受信音声解析部75は、通常会話モードでは、受信音声に応じて、詐欺の可能性を判定する。すなわち、受信音声解析部75は、通話相手の話が詐欺らしいか否かを判定する。
受信音声解析部75は、通常会話モードでは、受信音声に応じて、詐欺の可能性を判定する。すなわち、受信音声解析部75は、通話相手の話が詐欺らしいか否かを判定する。
具体的には、受信音声解析部75は、受信音声に含まれる単語または受信音声の声紋に基づいて、詐欺の可能性を判定する。例えば、受信音声解析部75は、上記割合が閾値以上か否かを判定する。通話相手の話が詐欺らしい場合(ステップS3のYES)、制御部70は、ステップS5に進む。通話相手の話が詐欺らしくない場合(ステップS3のNO)、制御部70は、ステップS4に進む。
(ステップS4)
制御部70は、通話相手と、通話者1との通話を継続する。すなわち、制御部70は、通常会話モードを継続する。そして、制御部70は、ステップS2に進む。
制御部70は、通話相手と、通話者1との通話を継続する。すなわち、制御部70は、通常会話モードを継続する。そして、制御部70は、ステップS2に進む。
(ステップS5)
制御部70は、詐欺の可能性が高いときに、自動応答モードに切り替える。送信音声選択部71は、通話者1の音声の送信を停止して、通話相手に通話者1の声が聞こえないようにする。この場合、メッセージ生成部72は、「自動応答モードに切り替えます。」という音声メッセージを生成し、出力音声合成部73に送る。出力音声合成部73は、この音声メッセージを通話相手の音声と合成する。音声出力部20は、合成した音声を通話者1に出力する。
制御部70は、詐欺の可能性が高いときに、自動応答モードに切り替える。送信音声選択部71は、通話者1の音声の送信を停止して、通話相手に通話者1の声が聞こえないようにする。この場合、メッセージ生成部72は、「自動応答モードに切り替えます。」という音声メッセージを生成し、出力音声合成部73に送る。出力音声合成部73は、この音声メッセージを通話相手の音声と合成する。音声出力部20は、合成した音声を通話者1に出力する。
(ステップS6)
その後、メッセージ生成部72は、通話相手に対する応答メッセージを作成する。そして、メッセージ生成部72は、当該応答メッセージを、送信音声選択部71、および、出力音声合成部73に送る。
その後、メッセージ生成部72は、通話相手に対する応答メッセージを作成する。そして、メッセージ生成部72は、当該応答メッセージを、送信音声選択部71、および、出力音声合成部73に送る。
(ステップS7)
送信音声選択部71は、この応答メッセージを音声送信部74、電話網インタフェース30を介して通話相手に送信する。また、出力音声合成部73は、この応答メッセージを通話相手の音声と合成して通話者に出力する。
送信音声選択部71は、この応答メッセージを音声送信部74、電話網インタフェース30を介して通話相手に送信する。また、出力音声合成部73は、この応答メッセージを通話相手の音声と合成して通話者に出力する。
(ステップS8)
制御部70は、メッセージルールにおいて、当該メッセージ送信後の次状態が自動応答か否かを判定する。次状態が自動応答である場合(ステップS8のYES)、制御部70は、ステップS9に進む。次状態が自動応答でない場合(ステップS8のNO)、制御部70は、ステップS10に進む。
制御部70は、メッセージルールにおいて、当該メッセージ送信後の次状態が自動応答か否かを判定する。次状態が自動応答である場合(ステップS8のYES)、制御部70は、ステップS9に進む。次状態が自動応答でない場合(ステップS8のNO)、制御部70は、ステップS10に進む。
(ステップS9)
音声受信部76が通話相手の応答音声を受信すると、受信音声解析部75はその受信音声を解析する。そして、制御部70は、ステップS6に進む。
音声受信部76が通話相手の応答音声を受信すると、受信音声解析部75はその受信音声を解析する。そして、制御部70は、ステップS6に進む。
(ステップS10)
制御部70は、自動応答モードにおいて、受信音声に応じて、通常会話モードに切り替えるか、または、通話を切断する。具体的には、制御部70は、自動応答モードにおいて、問い合わせ事項を含む応答音声を電話網インタフェース30に送信させ、受信音声が問い合わせ事項に対する回答を含むか否かを判定し、当該回答を含む場合に通常会話モードに切り替え、当該回答を含まない場合に、通話を切断する。
制御部70は、自動応答モードにおいて、受信音声に応じて、通常会話モードに切り替えるか、または、通話を切断する。具体的には、制御部70は、自動応答モードにおいて、問い合わせ事項を含む応答音声を電話網インタフェース30に送信させ、受信音声が問い合わせ事項に対する回答を含むか否かを判定し、当該回答を含む場合に通常会話モードに切り替え、当該回答を含まない場合に、通話を切断する。
例えば、制御部70は、メッセージルールにおいて、当該メッセージ送信後の次状態が通常会話か否かを判定する。次状態が通常会話である場合(ステップS10のYES)、制御部70は、ステップS11に進む。次状態が通常会話でない場合(ステップS10のNO)、制御部70は、ステップS12に進む。
(ステップS11)
制御部70は、通常会話モードに戻る。すなわち、制御部70は、通話者1の音声の送信を再開する。
制御部70は、通常会話モードに戻る。すなわち、制御部70は、通話者1の音声の送信を再開する。
(ステップS12)
制御部70は、通話を終了する。
制御部70は、通話を終了する。
以下では、表1に示すメッセージルールを参照して、音声応答装置100の処理について説明する。
ステップS6において、表1に示すメッセージの例では、初期メッセージが「すみません。あなたの名前をもう一度教えてください。」となっているので、メッセージ生成部72は、この文章の音声メッセージを作成する。音声送信部74は、当該メッセージを送信する(ステップS7)。
ステップS8において、メッセージルールによれば、初期メッセージの次状態が自動応答になっているので、制御部70は、初期メッセージに対する通話相手からの受信を待ってステップS9に進む。
ステップS9において、メッセージ生成部72は、初期メッセージに対する受信音声が肯定的な内容だった場合、メッセージルールに従って、「あなたの電話番号も教えてください。」という応答メッセージを作成する(ステップS6)。音声送信部74は、当該メッセージを通信相手に送信する(ステップS7)。
メッセージルールにおいて、当該メッセージ送信後の次状態が自動応答となっているので(ステップ8のYES)、通話相手からの受信音声を待って、受信音声解析部75は当該受信音声を解析する(ステップS9)。メッセージ生成部72は、通話相手からの受信が肯定的だった場合、メッセージルールに従って、「ありがとうございました。」という応答メッセージを作成する(ステップS6)。音声送信部74は、当該メッセージを通信相手に送信する(ステップS7)。
このメッセージルールにおいて、当該メッセージ送信後の次状態が「通常会話」となっているので(ステップS10のYES)、応答メッセージ送信後、メッセージ生成部72は、「自動応答モードを終了します。」という音声メッセージを生成し、出力音声合成部73に送る。出力音声合成部73は、このメッセージを通話相手の受信音声と合成して通話者1に出力する。その後、送信音声選択部71は、通話者1の音声の送信を再開し、通話相手に通話者1の声が聞こえるようにする(ステップS11)。
また、メッセージ生成部72は、初期メッセージ、または、「あなたの電話番号も教えてください。」というメッセージに対する通話相手からの受信が肯定的な内容でなかった場合、メッセージルールに従って、次のメッセージである「申し訳ありませんが、電話を切ります。」という応答メッセージを作成する。音声送信部74は、当該メッセージを通話相手に送信する。
このメッセージルールにおいて、次状態が「通話終了」となっているので(ステップS10のNO)、制御部70は、応答メッセージ送信後に通話を終了する。
上記によれば、音声応答装置100は、通話相手が詐欺師である可能性があるか否かを判定し、通話相手が詐欺師である可能性がある場合に、メッセージを通話相手に自動で送信するモードに自動的に切り替えるため、通話中にユーザを一度クールダウンさせることができる。これにより、通話相手が関係者であると通話者が強く信じ込まされている場合でも、クールダウンの機会をユーザに与えることができ、電話による詐欺を防止することができる。
また、ステップS7において、出力音声合成部73が、応答音声をユーザに出力することにより、ユーザに応答音声を確認させることができる。これにより、ユーザは、応答音声と通話相手との対話内容を容易に理解することができる。
〔実施形態2〕
以下に、変形例を示す。
以下に、変形例を示す。
制御部70は、自動応答モードにおいて、受信音声に応じて、通話を切断してもよい。また、制御部70は、自動応答モードにおいて、問い合わせ事項を含む応答音声を電話網インタフェース30に送信させ、受信音声が問い合わせ事項に対する回答を含むか否かを判定し、当該回答を含む場合に、通話を切断してもよい。例えば、制御部70は、通話相手に電話番号を問い合わせ、回答を受けたら、折り返し電話する旨を伝えて切断してもよい。本変形例におけるメッセージルールの例を表2に示す。
上記のようなメッセージルールであっても、実施形態1と同様に、音声応答装置100は、クールダウンの機会をユーザに与えることができ、電話による詐欺を防止することができる。
〔実施形態3〕
本発明の実施形態3について、以下に説明する。なお、説明の便宜上、実施形態1、2にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
本発明の実施形態3について、以下に説明する。なお、説明の便宜上、実施形態1、2にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
(音声応答装置101の構成)
図3は、本実施形態に係る音声応答装置101の要部構成を示すブロック図である。図3に示すように、音声応答装置101は、音声入力部10、音声出力部20、電話網インタフェース30、ネットワークインタフェース50、および、制御部70を備えている。
図3は、本実施形態に係る音声応答装置101の要部構成を示すブロック図である。図3に示すように、音声応答装置101は、音声入力部10、音声出力部20、電話網インタフェース30、ネットワークインタフェース50、および、制御部70を備えている。
ネットワークインタフェース50は、インターネットと接続し、データの送受信を行う。なお、他の構成要素の機能は、実施形態1と同様である。
図3に示すように、制御部70は、送信音声選択部71、メッセージ生成部72、出力音声合成部73、音声送信部74、音声受信部76、および、受信音声解析部79を備えている。受信音声解析部79は、ネットワークインタフェース50を介して、声紋情報提供サーバ3との間で通信を行いながら、音声受信部76が受信した音声を解析する。なお、他の構成要素の機能は、実施形態1と同様である。
(音声応答装置101の処理)
音声応答装置101の通話処理は、基本的に音声応答装置100の通話処理と同様である。ただし、異なる処理について、以下に説明する。
音声応答装置101の通話処理は、基本的に音声応答装置100の通話処理と同様である。ただし、異なる処理について、以下に説明する。
ステップS2において、受信音声解析部79は、通信相手の受信音声から声紋を抽出し、ネットワークインタフェース50を介して声紋情報提供サーバ3に声紋データを送る。声紋情報提供サーバ3は、受信した声紋に詐欺師の疑いがあるか否かを判定して、判定結果を受信音声解析部79に返す。
本実施形態では、声紋が詐欺師のものか否かを判定するために、音声応答装置101で声紋を抽出し、抽出した声紋を声紋情報提供サーバ3に送信し、声紋情報提供サーバ3が判定を行っているが、以下のような構成であってもよい。
(1)声紋情報提供サーバ3が、事前に、詐欺師の声紋情報を音声応答装置101に送信する。そして、音声応答装置101が、事前に、詐欺師の声紋情報を受信して、その後に声紋の抽出および判定を行う。
(2)音声応答装置101が通話相手の音声を声紋情報提供サーバ3に送信する。そして、声紋情報提供サーバ3が、通話相手の音声を受信して、声紋の抽出および判定を行う。
(3)声紋情報提供サーバ3が、事前に、詐欺師の声紋情報を識別するための学習済みモデルを音声応答装置101に送信する。そして、音声応答装置101が、事前に、詐欺師の声紋情報を識別するための学習済みモデルを受信して、その後に当該学習モデルを用いて声紋の抽出および判定を行う。
(1)声紋情報提供サーバ3が、事前に、詐欺師の声紋情報を音声応答装置101に送信する。そして、音声応答装置101が、事前に、詐欺師の声紋情報を受信して、その後に声紋の抽出および判定を行う。
(2)音声応答装置101が通話相手の音声を声紋情報提供サーバ3に送信する。そして、声紋情報提供サーバ3が、通話相手の音声を受信して、声紋の抽出および判定を行う。
(3)声紋情報提供サーバ3が、事前に、詐欺師の声紋情報を識別するための学習済みモデルを音声応答装置101に送信する。そして、音声応答装置101が、事前に、詐欺師の声紋情報を識別するための学習済みモデルを受信して、その後に当該学習モデルを用いて声紋の抽出および判定を行う。
上記によれば、音声応答装置100は、通話相手が詐欺師である可能性があるか否かを好適に判定することができる。
〔実施形態4〕
本発明の実施形態4について、以下に説明する。なお、説明の便宜上、実施形態1にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
本発明の実施形態4について、以下に説明する。なお、説明の便宜上、実施形態1にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
(音声応答装置102の構成)
図4は、本実施形態に係る音声応答装置102の要部構成を示すブロック図である。図1に示すように、音声応答装置102は、音声入力部10、音声出力部20、電話網インタフェース30、メッセージ登録インタフェース40、および、制御部70を備えている。
図4は、本実施形態に係る音声応答装置102の要部構成を示すブロック図である。図1に示すように、音声応答装置102は、音声入力部10、音声出力部20、電話網インタフェース30、メッセージ登録インタフェース40、および、制御部70を備えている。
メッセージ登録インタフェース40は、通話者1の音声の登録開始を制御部70に指示する。メッセージ登録インタフェース40は、例えば、電話機に備えられた「登録用ボタン」のような部位であってもよいし、スマートフォンを操作して起動した、メッセージ登録アプリケーションの画面であってもよい。なお、他の構成要素の機能は、実施形態1と同様である。
図4に示すように、制御部70は、送信音声選択部71、出力音声合成部73、音声送信部74、受信音声解析部75、音声受信部76、メッセージ登録部77、および、メッセージ生成部78を備えている。
メッセージ登録部77は、メッセージ登録インタフェース40からの指示を受けて、通話者1の音声を登録する。メッセージ生成部78は、登録された音声から、出力用の音声メッセージを選択する。なお、他の構成要素の機能は、実施形態1と同様である。
(音声応答装置102の処理)
通話者1は、音声応答装置102を利用する場合、事前にメッセージ音声を登録しておく。図5は、本実施形態に係る音声応答装置102のメッセージ登録処理を示すフローチャートである。
通話者1は、音声応答装置102を利用する場合、事前にメッセージ音声を登録しておく。図5は、本実施形態に係る音声応答装置102のメッセージ登録処理を示すフローチャートである。
(ステップS21)
まず、通話者1は、音声応答装置102のメッセージ登録インタフェース40を操作して、メッセージ登録の開始を指示する。
まず、通話者1は、音声応答装置102のメッセージ登録インタフェース40を操作して、メッセージ登録の開始を指示する。
(ステップS22)
メッセージ登録部77は、登録が必要となる語句(メッセージ)を、音声出力部20を介して通話者1に出力する。
メッセージ登録部77は、登録が必要となる語句(メッセージ)を、音声出力部20を介して通話者1に出力する。
(ステップS23)
音声出力部20出力されたメッセージを聞いた通話者1は、当該メッセージを音声入力部10に向かって発話する。メッセージ登録部77は、発話されたメッセージを保存する。
音声出力部20出力されたメッセージを聞いた通話者1は、当該メッセージを音声入力部10に向かって発話する。メッセージ登録部77は、発話されたメッセージを保存する。
(ステップS24)
メッセージを保存した後、メッセージ登録部77は、全ての語句を登録したか否かを判定する。全ての語句を登録していない場合(ステップS24のNO)、メッセージ登録部77は、ステップS22に戻る。全ての語句を登録した場合(ステップS24のYES)、メッセージ登録部77は、メッセージ登録処理を終了する。
メッセージを保存した後、メッセージ登録部77は、全ての語句を登録したか否かを判定する。全ての語句を登録していない場合(ステップS24のNO)、メッセージ登録部77は、ステップS22に戻る。全ての語句を登録した場合(ステップS24のYES)、メッセージ登録部77は、メッセージ登録処理を終了する。
すなわち、メッセージ登録部77は、メッセージを保存した後、次に登録が必要なメッセージを、音声出力部20を介して出力する。そして、メッセージ登録部77は、ステップS22、S23の処理を、必要なメッセージが全て登録されるまで繰り返す。
例として、実施形態1における表1のメッセージルールがある場合、メッセージ登録を開始すると(ステップS21)、まず、音声出力部20は、「すみません。後でかけ直したいので、電話番号を教えてください。」というメッセージを出力する(ステップS22)。これに対して、通話者1は、「すみません。あなたの名前をもう一度教えてください。」と発話する(ステップS23)。メッセージ登録部77は、発話された音声を保存する。メッセージ登録部77は、これらの処理を、全てのメッセージに対して繰り返すことで、全てのメッセージに対する、通話者1の音声を登録する。
音声応答装置102の通話処理は、基本的には音声応答装置100の通話処理と同様である。ただし、ステップS6において、制御部70は、応答音声を生成する替わりに、予め記憶されている音声から応答音声を選択する。
上記によれば、音声応答装置100は、より自然な応答音声を出力することができる。
〔ソフトウェアによる実現例〕
音声応答装置100、101、102の制御ブロック(特に、制御部70)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
音声応答装置100、101、102の制御ブロック(特に、制御部70)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
後者の場合、音声応答装置100、101、102は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも1つのプロセッサ(制御装置)を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも1つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る音声応答装置(100)は、音声入力部(10)と、音声出力部(20)と、通信部(電話網インタフェース30)と、制御部(70)と、を備え、上記制御部が、上記通信部が受信した受信音声を上記音声出力部に出力させ、上記受信音声に応じて、上記音声入力部に入力された入力音声を上記通信部に送信させる第一モード(通常会話モード)と、上記入力音声に替えて、予め設定された応答音声を上記通信部に送信させる第二モード(自動応答モード)と、を切り替える。
本発明の態様1に係る音声応答装置(100)は、音声入力部(10)と、音声出力部(20)と、通信部(電話網インタフェース30)と、制御部(70)と、を備え、上記制御部が、上記通信部が受信した受信音声を上記音声出力部に出力させ、上記受信音声に応じて、上記音声入力部に入力された入力音声を上記通信部に送信させる第一モード(通常会話モード)と、上記入力音声に替えて、予め設定された応答音声を上記通信部に送信させる第二モード(自動応答モード)と、を切り替える。
上記の構成によれば、音声応答装置は、受信音声に応じて(例えば、受信音声が詐欺の可能性を示す場合に)、ユーザの代わりに音声応答装置が自動的に応答するモードに切り替えることにより、ユーザをクールダウンさせることができる。従って、電話による詐欺の発生を防止することができる。
本発明の態様2に係る音声応答装置は、上記態様1において、上記制御部が、上記第一モードでは、上記受信音声に応じて、詐欺の可能性を判定し、上記可能性が高いときに、上記第二モードに切り替えることとしてもよい。
上記の構成によれば、第一モードでは、受信音声に応じて、詐欺の可能性を判定し、可能性が高いときに、第二モードに切り替えるので、電話による詐欺の発生を防止することができる。
本発明の態様3に係る音声応答装置は、上記態様2において、上記制御部が、上記受信音声に含まれる単語または上記受信音声の声紋に基づいて、上記可能性を判定することとしてもよい。
上記の構成によれば、受信音声に含まれる単語または受信音声の声紋に基づいて、詐欺の可能性を判定するので、適切な判定を行うことができる。
本発明の態様4に係る音声応答装置は、上記態様1から3において、上記制御部が、上記第二モードにおいて、上記応答音声を上記音声出力部に出力させることとしてもよい。
上記の構成によれば、ユーザに応答音声を確認させることができる。これにより、ユーザは、応答音声と通話相手との対話内容を容易に理解することができる。
本発明の態様5に係る音声応答装置は、上記態様1から4において、上記制御部が、上記第二モードにおいて、上記受信音声に応じて、上記第一モードに切り替えるか、または、通話を切断することとしてもよい。
上記の構成によれば、第二モードにおいて、受信音声に応じて、第一モードに切り替えるか、または、通話を切断するので、通話相手に応じた対応を行うことができる。
本発明の態様6に係る音声応答装置は、上記態様5において、上記制御部が、上記第二モードにおいて、問い合わせ事項を含む上記応答音声を上記通信部に送信させ、上記受信音声が上記問い合わせ事項に対する回答を含むか否かを判定し、上記回答を含む場合に上記第一モードに切り替え、上記回答を含まない場合に、上記通話を切断することとしてもよい。
上記の構成によれば、第二モードにおいて、受信音声が問い合わせ事項に対する回答を含むか否かに応じて、第一モードに切り替えるか、または、通話を切断するので、通話相手に応じた対応を適切に行うことができる。
本発明の態様7に係る音声応答装置は、上記態様1から4において、上記制御部が、上記第二モードにおいて、上記受信音声に応じて、通話を切断することとしてもよい。
上記の構成によれば、第二モードにおいて、受信音声に応じて、通話を切断するので、ユーザを確実にクールダウンさせることができる。
本発明の態様8に係る音声応答装置は、上記態様7において、上記制御部が、上記第二モードにおいて、問い合わせ事項を含む上記応答音声を上記通信部に送信させ、上記受信音声が上記問い合わせ事項に対する回答を含むか否かを判定し、上記回答を含む場合に、上記通話を切断することとしてもよい。
上記の構成によれば、第二モードにおいて、受信音声が問い合わせ事項に対する回答を含む場合に、通話を切断するので、通話相手に応じた対応を適切に行うことができる。
本発明の態様9に係る音声応答装置は、上記態様1から8において、上記制御部が、上記応答音声を生成するか、または、予め記憶されている音声から選択することとしてもよい。
上記の構成によれば、応答音声を生成するか、または、予め記憶されている音声から選択するので、適切な音声を通話相手に送信することができる。
本発明の各態様に係る音声応答装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記音声応答装置が備える各部(ソフトウェア要素)として動作させることにより上記音声応答装置をコンピュータにて実現させる音声応答装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
100 音声応答装置
1 通話者
2 電話網
10 音声入力部
20 音声出力部
30 電話網インタフェース(通信部)
70 制御部
1 通話者
2 電話網
10 音声入力部
20 音声出力部
30 電話網インタフェース(通信部)
70 制御部
Claims (10)
- 音声入力部と、
音声出力部と、
通信部と、
制御部と、を備え、
上記制御部は、
上記通信部が受信した受信音声を上記音声出力部に出力させ、
上記受信音声に応じて、
上記音声入力部に入力された入力音声を上記通信部に送信させる第一モードと、
上記入力音声に替えて、予め設定された応答音声を上記通信部に送信させる第二モードと、
を切り替えることを特徴とする音声応答装置。 - 上記制御部は、上記第一モードでは、上記受信音声に応じて、詐欺の可能性を判定し、上記可能性が高いときに、上記第二モードに切り替えることを特徴とする請求項1に記載の音声応答装置。
- 上記制御部は、上記受信音声に含まれる単語または上記受信音声の声紋に基づいて、上記可能性を判定することを特徴とする請求項2に記載の音声応答装置。
- 上記制御部は、上記第二モードにおいて、上記応答音声を上記音声出力部に出力させることを特徴とする請求項1から3の何れか1項に記載の音声応答装置。
- 上記制御部は、上記第二モードにおいて、上記受信音声に応じて、上記第一モードに切り替えるか、または、通話を切断することを特徴とする請求項1から4の何れか1項に記載の音声応答装置。
- 上記制御部は、上記第二モードにおいて、問い合わせ事項を含む上記応答音声を上記通信部に送信させ、上記受信音声が上記問い合わせ事項に対する回答を含むか否かを判定し、上記回答を含む場合に上記第一モードに切り替え、上記回答を含まない場合に、上記通話を切断することを特徴とする請求項5に記載の音声応答装置。
- 上記制御部は、上記第二モードにおいて、上記受信音声に応じて、通話を切断することを特徴とする請求項1から4の何れか1項に記載の音声応答装置。
- 上記制御部は、上記第二モードにおいて、問い合わせ事項を含む上記応答音声を上記通信部に送信させ、上記受信音声が上記問い合わせ事項に対する回答を含むか否かを判定し、上記回答を含む場合に、上記通話を切断することを特徴とする請求項7に記載の音声応答装置。
- 上記制御部は、上記応答音声を生成するか、または、予め記憶されている音声から選択することを特徴とする請求項1から8の何れか一項に記載の音声応答装置。
- 請求項1に記載の音声応答装置としてコンピュータを機能させるためのプログラムであって、上記制御部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017227073A JP2019097122A (ja) | 2017-11-27 | 2017-11-27 | 音声応答装置、および、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017227073A JP2019097122A (ja) | 2017-11-27 | 2017-11-27 | 音声応答装置、および、プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019097122A true JP2019097122A (ja) | 2019-06-20 |
Family
ID=66973254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017227073A Pending JP2019097122A (ja) | 2017-11-27 | 2017-11-27 | 音声応答装置、および、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019097122A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021035045A (ja) * | 2020-06-30 | 2021-03-01 | 株式会社鈴康 | 電話機、報知システム及びコンピュータプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11331358A (ja) * | 1998-05-14 | 1999-11-30 | Sony Corp | 電話端末および電話端末においての着信時の応答方法 |
JP2000059498A (ja) * | 1998-08-05 | 2000-02-25 | Sharp Corp | 電話装置 |
JP2012070218A (ja) * | 2010-09-24 | 2012-04-05 | Sanyo Electric Co Ltd | 電話装置 |
JP2015041887A (ja) * | 2013-08-22 | 2015-03-02 | 株式会社ナカヨ | 相手判定機能を有する電話装置とその制御方法 |
JP2017069750A (ja) * | 2015-09-30 | 2017-04-06 | Kddi株式会社 | 無線通信装置 |
-
2017
- 2017-11-27 JP JP2017227073A patent/JP2019097122A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11331358A (ja) * | 1998-05-14 | 1999-11-30 | Sony Corp | 電話端末および電話端末においての着信時の応答方法 |
JP2000059498A (ja) * | 1998-08-05 | 2000-02-25 | Sharp Corp | 電話装置 |
JP2012070218A (ja) * | 2010-09-24 | 2012-04-05 | Sanyo Electric Co Ltd | 電話装置 |
JP2015041887A (ja) * | 2013-08-22 | 2015-03-02 | 株式会社ナカヨ | 相手判定機能を有する電話装置とその制御方法 |
JP2017069750A (ja) * | 2015-09-30 | 2017-04-06 | Kddi株式会社 | 無線通信装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021035045A (ja) * | 2020-06-30 | 2021-03-01 | 株式会社鈴康 | 電話機、報知システム及びコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102582517B1 (ko) | 공유된 음성 작동 디바이스상의 호출 핸들링 | |
US7180991B2 (en) | Dynamic, interactive call notification | |
KR20130018105A (ko) | 모바일 개인 비서를 위한 방법 및 그 전자 장치 | |
JP6218568B2 (ja) | 通信装置、通信システム、通信方法、および通信プログラム | |
US20040136515A1 (en) | Off-hold alert for telecommunications devices | |
JP2007096961A (ja) | 電話装置 | |
US7046784B2 (en) | Polite call waiting notification | |
JP2019097122A (ja) | 音声応答装置、および、プログラム | |
JP7052335B2 (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP2010212860A (ja) | メッセージ送信システム | |
JP2016184807A (ja) | 中継装置および中継方法 | |
JPS59208965A (ja) | 電話機の呼出方式 | |
JP2007019600A (ja) | 電話装置及び着信通知方法 | |
JP6028289B2 (ja) | 中継システム、中継方法及びプログラム | |
US11037567B2 (en) | Transcription of communications | |
JP4126547B2 (ja) | 携帯電話機用のプログラムおよびその配信サービスシステム | |
JP6843592B2 (ja) | 電話機 | |
TWI519123B (zh) | 電話語音輸出之方法,用於電話語音之電腦程式產品及可撥打電話之電子裝置 | |
JP2007006238A (ja) | 電話連絡方法、及び記録媒体 | |
JP2019134261A (ja) | 通信装置、制御装置、制御方法、制御プログラム | |
KR20220147454A (ko) | 메시지 착신음 제공 장치 및 방법 | |
JP2023084571A (ja) | 音声処理システム、プログラム、方法、オンライン会議システム、および音声通話装置 | |
JP5494742B2 (ja) | 音声信号レベル自動調整機能を有する主装置 | |
CN110249615A (zh) | 电话系统、电话机、电话转移方法和程序 | |
EP2150020A1 (en) | Method for communicating, a related system for communicating and a related transforming part |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210525 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20211124 |