JP2019097122A

JP2019097122A - 音声応答装置、および、プログラム

Info

Publication number: JP2019097122A
Application number: JP2017227073A
Authority: JP
Inventors: 智幸河添; Tomoyuki Kawazoe
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2017-11-27
Filing date: 2017-11-27
Publication date: 2019-06-20

Abstract

【課題】電話による詐欺の発生を防止する。【解決手段】音声応答装置（１００）は、音声入力部（１０）と、音声出力部（２０）と、電話網インタフェース（３０）と、制御部（７０）と、を備え、制御部が、電話網インタフェースが受信した受信音声を音声出力部に出力させ、受信音声に応じて、音声入力部に入力された入力音声を電話網インタフェースに送信させるか、予め設定された応答音声を送信させるか、を切り替える。【選択図】図１

Description

本発明は、音声応答装置、および、プログラムに関する。

電話による詐欺の発生を防止するために、予め登録されたユーザの関係者の声紋データと、当該ユーザの通話相手の声紋データとが一致するか否かを、通話開始後に当該ユーザに通知する技術がある。

例えば、特許文献１には、電話番号が登録されていない場合に、自動応答等で対応し、不審電話ではない場合には着信を許可する電話器システムが開示されている。特許文献２には、通話中に通話相手の声紋データを登録者の声紋データと比較し、一致するか一致しないかをユーザに通知する認証装置が開示されている。特許文献３には、通話中に通話相手の声紋データを登録者の声紋データと比較し、一致しない場合には通話の自動切断、バイブレーション等を行う通話システムが開示されている。

特開２０１７−０８５３９１号公報（２０１７年０５月１８日公開）特開２０１６−１４９６３６号公報（２０１６年０８月１８日公開）特開２０１５−１７７４１４号公報（２０１５年１０月０５日公開）

詐欺加害者が、予め警察、銀行員等を名乗って電話をかけた後で、ユーザの関係者になりすまして電話をかけることにより、ユーザに、通話相手が関係者であると強く信じ込ませることができる場合がある。このような場合、ユーザに対して、声紋データの不一致の通知等による警告を行ったとしても、ユーザは警告を無視するおそれがあるため、必ずしも詐欺を防止することができない。

本発明の一態様は、電話による詐欺の発生を防止することを目的とする。

上記の課題を解決するために、本発明の一態様に係る音声応答装置は、音声入力部と、音声出力部と、通信部と、制御部と、を備え、上記制御部が、上記通信部が受信した受信音声を上記音声出力部に出力させ、上記受信音声に応じて、上記音声入力部に入力された入力音声を上記通信部に送信させる第一モードと、上記入力音声に替えて、予め設定された応答音声を上記通信部に送信させる第二モードと、を切り替える。

本発明の一態様によれば、通話中にユーザを一度クールダウンさせることにより、電話による詐欺の発生を防止することができる。

本発明の実施形態１に係る音声応答装置の要部構成を示すブロック図である。本発明の実施形態１に係る音声応答装置の通話処理を示すフローチャートである。本発明の実施形態３に係る音声応答装置の要部構成を示すブロック図である。本発明の実施形態４に係る音声応答装置の要部構成を示すブロック図である。本発明の実施形態４に係る音声応答装置のメッセージ登録処理を示すフローチャートである。

〔実施形態１〕
以下、本発明の実施形態１について、詳細に説明する。

（音声応答装置１００の概要）
本実施形態に係る音声応答装置１００は、通話相手が詐欺加害者である可能性があると判断した場合、通話相手に対して自動でメッセージを送信する。

まず、通話者が通話相手と通話中に、通話相手からの音声を解析し、詐欺電話か否かを判定する。

この場合の解析方法には、会話で使われる単語が詐欺らしいか否かの判定、声紋が登録された詐欺師の声紋と一致するか否かの判定、等の方法を用いてもよい。

詐欺電話の可能性があると判定された場合、以下の動作を行う。
（１）通話者の音声を通話相手に送ることを停止する。このとき、通話者に対して自動応答モードに入ったことを通知してもよい。
（２）通話相手に対して、音声メッセージを送信する。当該音声メッセージは、音声合成によって作られたものでもよいし、予め通話者の音声を録音しておき、それを基に生成してもよい。音声メッセージの内容は、通話相手に対して「一旦切ってかけなおす。」等を提案するものでもよいし、「あなたの名前をもう一度教えて。」等の質問を行うものでもよい。音声メッセージは、通話相手だけでなく、通話者に対しても送信される。
（３）送信したメッセージに対して、通話相手からの受信を待つ。受信があった場合に、次のメッセージを送信する。このメッセージは、通話相手からの応答に応じて変化させてもよい。全てのメッセージに対して受信があった場合、通話者に対して自動応答モードを終了することを通知し、通話者の音声が通話相手に送られるようにする。

（音声応答装置１００の構成）
図１は、本実施形態に係る音声応答装置１００の要部構成を示すブロック図である。図１に示すように、音声応答装置１００は、音声入力部１０、音声出力部２０、電話網インタフェース（通信部）３０、および、制御部７０を備えている。

音声入力部１０は、音声応答装置１００を用いて通話する通話者（ユーザ）１の発話する音声を入力する。音声入力部１０は、内蔵マイクであってもよいし、制御部７０と外付けのマイクとの間のインタフェースであってもよい。

音声出力部２０は、当該ユーザに対して音声を出力する。音声出力部２０は、内蔵スピーカであってもよいし、制御部７０と外付けのスピーカとの間のインタフェースであってもよい。

電話網インタフェース３０は、電話網２と接続し、音声の送受信を行う。電話網２は、通常の電話回線であってもよいし、ＩＰ電話で用いられるインターネットであってもよい。

制御部７０は、音声応答装置１００全体を制御するものであり、例えば、少なくとも１つのＣＰＵ（Central Processing Unit）等のプロセッサが制御プログラムを実行することにより実現される。制御プログラムは、音声応答装置１００の制御部７０としてコンピュータを機能させるためのものである。

図１に示すように、制御部７０は、送信音声選択部７１、メッセージ生成部７２、出力音声合成部７３、音声送信部７４、受信音声解析部７５、および、音声受信部７６を備えている。

送信音声選択部７１は、音声入力部１０に入力された音声と、メッセージ生成部７２で生成された音声との何れを、音声送信部７４に送るのかを選択する。すなわち、送信音声選択部７１は、受信音声に応じて、音声入力部１０に入力された入力音声を電話網インタフェース３０に送信させる通常会話モード（第一モード）と、入力音声に替えて、予め設定された応答音声を電話網インタフェース３０に送信させる自動応答モード（第二モード）と、を切り替える。

メッセージ生成部７２は、音声合成によって、出力用の音声メッセージを生成する。出力音声合成部７３は、電話網インタフェース３０、および、音声受信部７６が受信した音声と、メッセージ生成部７２で生成された音声とを合成し、合成した音声を音声出力部２０に送る。出力音声合成部７３は、電話網インタフェース３０が受信した受信音声を音声出力部２０に出力させてもよい。出力音声合成部７３は、自動応答モードにおいて、応答音声を音声出力部２０に出力させてもよい。

音声送信部７４は、電話網インタフェース３０を介して、音声を電話網２に送信する。受信音声解析部７５は、音声受信部７６で受信した音声を解析する。音声受信部７６は、電話網インタフェース３０を介して電話網２から音声を受信する。

（音声応答装置１００の通常動作）
通常の通話において、音声入力部１０は、通話者１の発話した音声を、音声応答装置１００に入力し、音声送信部７４は、当該音声を、電話網インタフェース３０を介して電話網２に送信する。一方、音声受信部７６は、通話相手の音声を、電話網２から電話網インタフェース３０を介して受信し、音声出力部２０が当該音声を可聴音に変換して通話者１に送信する。通常の通話の際には、送信音声選択部７１は、音声入力部１０が入力した音声をそのまま音声送信部７４に送り、出力音声合成部７３は、音声受信部７６が受信した音声をそのまま音声出力部２０に送る。

（メッセージ生成部７２の処理）
メッセージ生成部７２は、どういった場合にどのメッセージを通話相手に送信するのかというメッセージルールを保存している。メッセージルールの例を表１に示す。

表１に示すように、メッセージルールには、登録されているメッセージ毎に、メッセージの本文、そのメッセージが送信される条件、および、メッセージ送信後にどの状態になるのかを示す情報が含まれている。

表１の例では、メッセージ生成部７２は、制御部７０が自動応答モードになった場合に、「すみません。あなたの名前をもう一度教えてください。」というメッセージを生成する。

次に、そのメッセージに対して通話相手からの受信が肯定的だった場合（質問に回答する場合等）、メッセージ生成部７２は、「あなたの電話番号も教えてください。」というメッセージを生成する。

これに対しても通話相手からの受信が肯定的だった場合、メッセージ生成部７２は、「ありがとうございました。」というメッセージを生成する。その後に、制御部７０は、通常会話モード（通話を開始したときのモード）に戻る。

通話相手が回答を拒否する等、受信が肯定的でなかった場合、メッセージ生成部７２は、「申し訳ありませんが、電話を切ります。」というメッセージを生成する。そして、制御部７０は、通話を終了する。

（音声応答装置１００の処理）
音声応答装置１００は、通話者１が電話を受けた場合、通話相手に詐欺の疑いがあるか否かを判定し、詐欺の疑いがあるときには、合成音声によるメッセージによって応答する。

図２は、本実施形態に係る音声応答装置１００の通話処理を示すフローチャートである。以下、図２に従って、音声応答装置１００の通話処理について説明する。

（ステップＳ１）
通話者１は、通話相手と通話を開始する。音声応答装置１００において、制御部７０は、通常会話モードになる。音声受信部７６は、電話網２から電話網インタフェース３０を経由して、通話相手の音声を受信し、当該受信音声を出力音声合成部７３および受信音声解析部７５に送信する。

（ステップＳ２）
受信音声解析部７５は、音声受信部７６から受信音声を取得し、通話中の受信音声を解析する。例えば、受信音声解析部７５は、受信音声に含まれる単語を抽出して、単語全体に対する、詐欺でよく使われる単語の割合を計算する。

（ステップＳ３）
受信音声解析部７５は、通常会話モードでは、受信音声に応じて、詐欺の可能性を判定する。すなわち、受信音声解析部７５は、通話相手の話が詐欺らしいか否かを判定する。

具体的には、受信音声解析部７５は、受信音声に含まれる単語または受信音声の声紋に基づいて、詐欺の可能性を判定する。例えば、受信音声解析部７５は、上記割合が閾値以上か否かを判定する。通話相手の話が詐欺らしい場合（ステップＳ３のＹＥＳ）、制御部７０は、ステップＳ５に進む。通話相手の話が詐欺らしくない場合（ステップＳ３のＮＯ）、制御部７０は、ステップＳ４に進む。

（ステップＳ４）
制御部７０は、通話相手と、通話者１との通話を継続する。すなわち、制御部７０は、通常会話モードを継続する。そして、制御部７０は、ステップＳ２に進む。

（ステップＳ５）
制御部７０は、詐欺の可能性が高いときに、自動応答モードに切り替える。送信音声選択部７１は、通話者１の音声の送信を停止して、通話相手に通話者１の声が聞こえないようにする。この場合、メッセージ生成部７２は、「自動応答モードに切り替えます。」という音声メッセージを生成し、出力音声合成部７３に送る。出力音声合成部７３は、この音声メッセージを通話相手の音声と合成する。音声出力部２０は、合成した音声を通話者１に出力する。

（ステップＳ６）
その後、メッセージ生成部７２は、通話相手に対する応答メッセージを作成する。そして、メッセージ生成部７２は、当該応答メッセージを、送信音声選択部７１、および、出力音声合成部７３に送る。

（ステップＳ７）
送信音声選択部７１は、この応答メッセージを音声送信部７４、電話網インタフェース３０を介して通話相手に送信する。また、出力音声合成部７３は、この応答メッセージを通話相手の音声と合成して通話者に出力する。

（ステップＳ８）
制御部７０は、メッセージルールにおいて、当該メッセージ送信後の次状態が自動応答か否かを判定する。次状態が自動応答である場合（ステップＳ８のＹＥＳ）、制御部７０は、ステップＳ９に進む。次状態が自動応答でない場合（ステップＳ８のＮＯ）、制御部７０は、ステップＳ１０に進む。

（ステップＳ９）
音声受信部７６が通話相手の応答音声を受信すると、受信音声解析部７５はその受信音声を解析する。そして、制御部７０は、ステップＳ６に進む。

（ステップＳ１０）
制御部７０は、自動応答モードにおいて、受信音声に応じて、通常会話モードに切り替えるか、または、通話を切断する。具体的には、制御部７０は、自動応答モードにおいて、問い合わせ事項を含む応答音声を電話網インタフェース３０に送信させ、受信音声が問い合わせ事項に対する回答を含むか否かを判定し、当該回答を含む場合に通常会話モードに切り替え、当該回答を含まない場合に、通話を切断する。

例えば、制御部７０は、メッセージルールにおいて、当該メッセージ送信後の次状態が通常会話か否かを判定する。次状態が通常会話である場合（ステップＳ１０のＹＥＳ）、制御部７０は、ステップＳ１１に進む。次状態が通常会話でない場合（ステップＳ１０のＮＯ）、制御部７０は、ステップＳ１２に進む。

（ステップＳ１１）
制御部７０は、通常会話モードに戻る。すなわち、制御部７０は、通話者１の音声の送信を再開する。

（ステップＳ１２）
制御部７０は、通話を終了する。

以下では、表１に示すメッセージルールを参照して、音声応答装置１００の処理について説明する。

ステップＳ６において、表１に示すメッセージの例では、初期メッセージが「すみません。あなたの名前をもう一度教えてください。」となっているので、メッセージ生成部７２は、この文章の音声メッセージを作成する。音声送信部７４は、当該メッセージを送信する（ステップＳ７）。

ステップＳ８において、メッセージルールによれば、初期メッセージの次状態が自動応答になっているので、制御部７０は、初期メッセージに対する通話相手からの受信を待ってステップＳ９に進む。

ステップＳ９において、メッセージ生成部７２は、初期メッセージに対する受信音声が肯定的な内容だった場合、メッセージルールに従って、「あなたの電話番号も教えてください。」という応答メッセージを作成する（ステップＳ６）。音声送信部７４は、当該メッセージを通信相手に送信する（ステップＳ７）。

メッセージルールにおいて、当該メッセージ送信後の次状態が自動応答となっているので（ステップ８のＹＥＳ）、通話相手からの受信音声を待って、受信音声解析部７５は当該受信音声を解析する（ステップＳ９）。メッセージ生成部７２は、通話相手からの受信が肯定的だった場合、メッセージルールに従って、「ありがとうございました。」という応答メッセージを作成する（ステップＳ６）。音声送信部７４は、当該メッセージを通信相手に送信する（ステップＳ７）。

このメッセージルールにおいて、当該メッセージ送信後の次状態が「通常会話」となっているので（ステップＳ１０のＹＥＳ）、応答メッセージ送信後、メッセージ生成部７２は、「自動応答モードを終了します。」という音声メッセージを生成し、出力音声合成部７３に送る。出力音声合成部７３は、このメッセージを通話相手の受信音声と合成して通話者１に出力する。その後、送信音声選択部７１は、通話者１の音声の送信を再開し、通話相手に通話者１の声が聞こえるようにする（ステップＳ１１）。

また、メッセージ生成部７２は、初期メッセージ、または、「あなたの電話番号も教えてください。」というメッセージに対する通話相手からの受信が肯定的な内容でなかった場合、メッセージルールに従って、次のメッセージである「申し訳ありませんが、電話を切ります。」という応答メッセージを作成する。音声送信部７４は、当該メッセージを通話相手に送信する。

このメッセージルールにおいて、次状態が「通話終了」となっているので（ステップＳ１０のＮＯ）、制御部７０は、応答メッセージ送信後に通話を終了する。

上記によれば、音声応答装置１００は、通話相手が詐欺師である可能性があるか否かを判定し、通話相手が詐欺師である可能性がある場合に、メッセージを通話相手に自動で送信するモードに自動的に切り替えるため、通話中にユーザを一度クールダウンさせることができる。これにより、通話相手が関係者であると通話者が強く信じ込まされている場合でも、クールダウンの機会をユーザに与えることができ、電話による詐欺を防止することができる。

また、ステップＳ７において、出力音声合成部７３が、応答音声をユーザに出力することにより、ユーザに応答音声を確認させることができる。これにより、ユーザは、応答音声と通話相手との対話内容を容易に理解することができる。

〔実施形態２〕
以下に、変形例を示す。

制御部７０は、自動応答モードにおいて、受信音声に応じて、通話を切断してもよい。また、制御部７０は、自動応答モードにおいて、問い合わせ事項を含む応答音声を電話網インタフェース３０に送信させ、受信音声が問い合わせ事項に対する回答を含むか否かを判定し、当該回答を含む場合に、通話を切断してもよい。例えば、制御部７０は、通話相手に電話番号を問い合わせ、回答を受けたら、折り返し電話する旨を伝えて切断してもよい。本変形例におけるメッセージルールの例を表２に示す。

上記のようなメッセージルールであっても、実施形態１と同様に、音声応答装置１００は、クールダウンの機会をユーザに与えることができ、電話による詐欺を防止することができる。

〔実施形態３〕
本発明の実施形態３について、以下に説明する。なお、説明の便宜上、実施形態１、２にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。

（音声応答装置１０１の構成）
図３は、本実施形態に係る音声応答装置１０１の要部構成を示すブロック図である。図３に示すように、音声応答装置１０１は、音声入力部１０、音声出力部２０、電話網インタフェース３０、ネットワークインタフェース５０、および、制御部７０を備えている。

ネットワークインタフェース５０は、インターネットと接続し、データの送受信を行う。なお、他の構成要素の機能は、実施形態１と同様である。

図３に示すように、制御部７０は、送信音声選択部７１、メッセージ生成部７２、出力音声合成部７３、音声送信部７４、音声受信部７６、および、受信音声解析部７９を備えている。受信音声解析部７９は、ネットワークインタフェース５０を介して、声紋情報提供サーバ３との間で通信を行いながら、音声受信部７６が受信した音声を解析する。なお、他の構成要素の機能は、実施形態１と同様である。

（音声応答装置１０１の処理）
音声応答装置１０１の通話処理は、基本的に音声応答装置１００の通話処理と同様である。ただし、異なる処理について、以下に説明する。

ステップＳ２において、受信音声解析部７９は、通信相手の受信音声から声紋を抽出し、ネットワークインタフェース５０を介して声紋情報提供サーバ３に声紋データを送る。声紋情報提供サーバ３は、受信した声紋に詐欺師の疑いがあるか否かを判定して、判定結果を受信音声解析部７９に返す。

本実施形態では、声紋が詐欺師のものか否かを判定するために、音声応答装置１０１で声紋を抽出し、抽出した声紋を声紋情報提供サーバ３に送信し、声紋情報提供サーバ３が判定を行っているが、以下のような構成であってもよい。
（１）声紋情報提供サーバ３が、事前に、詐欺師の声紋情報を音声応答装置１０１に送信する。そして、音声応答装置１０１が、事前に、詐欺師の声紋情報を受信して、その後に声紋の抽出および判定を行う。
（２）音声応答装置１０１が通話相手の音声を声紋情報提供サーバ３に送信する。そして、声紋情報提供サーバ３が、通話相手の音声を受信して、声紋の抽出および判定を行う。
（３）声紋情報提供サーバ３が、事前に、詐欺師の声紋情報を識別するための学習済みモデルを音声応答装置１０１に送信する。そして、音声応答装置１０１が、事前に、詐欺師の声紋情報を識別するための学習済みモデルを受信して、その後に当該学習モデルを用いて声紋の抽出および判定を行う。

上記によれば、音声応答装置１００は、通話相手が詐欺師である可能性があるか否かを好適に判定することができる。

〔実施形態４〕
本発明の実施形態４について、以下に説明する。なお、説明の便宜上、実施形態１にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。

（音声応答装置１０２の構成）
図４は、本実施形態に係る音声応答装置１０２の要部構成を示すブロック図である。図１に示すように、音声応答装置１０２は、音声入力部１０、音声出力部２０、電話網インタフェース３０、メッセージ登録インタフェース４０、および、制御部７０を備えている。

メッセージ登録インタフェース４０は、通話者１の音声の登録開始を制御部７０に指示する。メッセージ登録インタフェース４０は、例えば、電話機に備えられた「登録用ボタン」のような部位であってもよいし、スマートフォンを操作して起動した、メッセージ登録アプリケーションの画面であってもよい。なお、他の構成要素の機能は、実施形態１と同様である。

図４に示すように、制御部７０は、送信音声選択部７１、出力音声合成部７３、音声送信部７４、受信音声解析部７５、音声受信部７６、メッセージ登録部７７、および、メッセージ生成部７８を備えている。

メッセージ登録部７７は、メッセージ登録インタフェース４０からの指示を受けて、通話者１の音声を登録する。メッセージ生成部７８は、登録された音声から、出力用の音声メッセージを選択する。なお、他の構成要素の機能は、実施形態１と同様である。

（音声応答装置１０２の処理）
通話者１は、音声応答装置１０２を利用する場合、事前にメッセージ音声を登録しておく。図５は、本実施形態に係る音声応答装置１０２のメッセージ登録処理を示すフローチャートである。

（ステップＳ２１）
まず、通話者１は、音声応答装置１０２のメッセージ登録インタフェース４０を操作して、メッセージ登録の開始を指示する。

（ステップＳ２２）
メッセージ登録部７７は、登録が必要となる語句（メッセージ）を、音声出力部２０を介して通話者１に出力する。

（ステップＳ２３）
音声出力部２０出力されたメッセージを聞いた通話者１は、当該メッセージを音声入力部１０に向かって発話する。メッセージ登録部７７は、発話されたメッセージを保存する。

（ステップＳ２４）
メッセージを保存した後、メッセージ登録部７７は、全ての語句を登録したか否かを判定する。全ての語句を登録していない場合（ステップＳ２４のＮＯ）、メッセージ登録部７７は、ステップＳ２２に戻る。全ての語句を登録した場合（ステップＳ２４のＹＥＳ）、メッセージ登録部７７は、メッセージ登録処理を終了する。

すなわち、メッセージ登録部７７は、メッセージを保存した後、次に登録が必要なメッセージを、音声出力部２０を介して出力する。そして、メッセージ登録部７７は、ステップＳ２２、Ｓ２３の処理を、必要なメッセージが全て登録されるまで繰り返す。

例として、実施形態１における表１のメッセージルールがある場合、メッセージ登録を開始すると（ステップＳ２１）、まず、音声出力部２０は、「すみません。後でかけ直したいので、電話番号を教えてください。」というメッセージを出力する（ステップＳ２２）。これに対して、通話者１は、「すみません。あなたの名前をもう一度教えてください。」と発話する（ステップＳ２３）。メッセージ登録部７７は、発話された音声を保存する。メッセージ登録部７７は、これらの処理を、全てのメッセージに対して繰り返すことで、全てのメッセージに対する、通話者１の音声を登録する。

音声応答装置１０２の通話処理は、基本的には音声応答装置１００の通話処理と同様である。ただし、ステップＳ６において、制御部７０は、応答音声を生成する替わりに、予め記憶されている音声から応答音声を選択する。

上記によれば、音声応答装置１００は、より自然な応答音声を出力することができる。

〔ソフトウェアによる実現例〕
音声応答装置１００、１０１、１０２の制御ブロック（特に、制御部７０）は、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ソフトウェアによって実現してもよい。

後者の場合、音声応答装置１００、１０１、１０２は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも１つのプロセッサ（制御装置）を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも１つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばＣＰＵ（Central Processing Unit）を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ＲＯＭ（Read Only Memory）等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するＲＡＭ（Random Access Memory）などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

〔まとめ〕
本発明の態様１に係る音声応答装置（１００）は、音声入力部（１０）と、音声出力部（２０）と、通信部（電話網インタフェース３０）と、制御部（７０）と、を備え、上記制御部が、上記通信部が受信した受信音声を上記音声出力部に出力させ、上記受信音声に応じて、上記音声入力部に入力された入力音声を上記通信部に送信させる第一モード（通常会話モード）と、上記入力音声に替えて、予め設定された応答音声を上記通信部に送信させる第二モード（自動応答モード）と、を切り替える。

上記の構成によれば、音声応答装置は、受信音声に応じて（例えば、受信音声が詐欺の可能性を示す場合に）、ユーザの代わりに音声応答装置が自動的に応答するモードに切り替えることにより、ユーザをクールダウンさせることができる。従って、電話による詐欺の発生を防止することができる。

本発明の態様２に係る音声応答装置は、上記態様１において、上記制御部が、上記第一モードでは、上記受信音声に応じて、詐欺の可能性を判定し、上記可能性が高いときに、上記第二モードに切り替えることとしてもよい。

上記の構成によれば、第一モードでは、受信音声に応じて、詐欺の可能性を判定し、可能性が高いときに、第二モードに切り替えるので、電話による詐欺の発生を防止することができる。

本発明の態様３に係る音声応答装置は、上記態様２において、上記制御部が、上記受信音声に含まれる単語または上記受信音声の声紋に基づいて、上記可能性を判定することとしてもよい。

上記の構成によれば、受信音声に含まれる単語または受信音声の声紋に基づいて、詐欺の可能性を判定するので、適切な判定を行うことができる。

本発明の態様４に係る音声応答装置は、上記態様１から３において、上記制御部が、上記第二モードにおいて、上記応答音声を上記音声出力部に出力させることとしてもよい。

上記の構成によれば、ユーザに応答音声を確認させることができる。これにより、ユーザは、応答音声と通話相手との対話内容を容易に理解することができる。

本発明の態様５に係る音声応答装置は、上記態様１から４において、上記制御部が、上記第二モードにおいて、上記受信音声に応じて、上記第一モードに切り替えるか、または、通話を切断することとしてもよい。

上記の構成によれば、第二モードにおいて、受信音声に応じて、第一モードに切り替えるか、または、通話を切断するので、通話相手に応じた対応を行うことができる。

本発明の態様６に係る音声応答装置は、上記態様５において、上記制御部が、上記第二モードにおいて、問い合わせ事項を含む上記応答音声を上記通信部に送信させ、上記受信音声が上記問い合わせ事項に対する回答を含むか否かを判定し、上記回答を含む場合に上記第一モードに切り替え、上記回答を含まない場合に、上記通話を切断することとしてもよい。

上記の構成によれば、第二モードにおいて、受信音声が問い合わせ事項に対する回答を含むか否かに応じて、第一モードに切り替えるか、または、通話を切断するので、通話相手に応じた対応を適切に行うことができる。

本発明の態様７に係る音声応答装置は、上記態様１から４において、上記制御部が、上記第二モードにおいて、上記受信音声に応じて、通話を切断することとしてもよい。

上記の構成によれば、第二モードにおいて、受信音声に応じて、通話を切断するので、ユーザを確実にクールダウンさせることができる。

本発明の態様８に係る音声応答装置は、上記態様７において、上記制御部が、上記第二モードにおいて、問い合わせ事項を含む上記応答音声を上記通信部に送信させ、上記受信音声が上記問い合わせ事項に対する回答を含むか否かを判定し、上記回答を含む場合に、上記通話を切断することとしてもよい。

上記の構成によれば、第二モードにおいて、受信音声が問い合わせ事項に対する回答を含む場合に、通話を切断するので、通話相手に応じた対応を適切に行うことができる。

本発明の態様９に係る音声応答装置は、上記態様１から８において、上記制御部が、上記応答音声を生成するか、または、予め記憶されている音声から選択することとしてもよい。

上記の構成によれば、応答音声を生成するか、または、予め記憶されている音声から選択するので、適切な音声を通話相手に送信することができる。

本発明の各態様に係る音声応答装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記音声応答装置が備える各部（ソフトウェア要素）として動作させることにより上記音声応答装置をコンピュータにて実現させる音声応答装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

１００音声応答装置
１通話者
２電話網
１０音声入力部
２０音声出力部
３０電話網インタフェース（通信部）
７０制御部

Claims

音声入力部と、
音声出力部と、
通信部と、
制御部と、を備え、
上記制御部は、
上記通信部が受信した受信音声を上記音声出力部に出力させ、
上記受信音声に応じて、
上記音声入力部に入力された入力音声を上記通信部に送信させる第一モードと、
上記入力音声に替えて、予め設定された応答音声を上記通信部に送信させる第二モードと、
を切り替えることを特徴とする音声応答装置。
上記制御部は、上記第一モードでは、上記受信音声に応じて、詐欺の可能性を判定し、上記可能性が高いときに、上記第二モードに切り替えることを特徴とする請求項１に記載の音声応答装置。
上記制御部は、上記受信音声に含まれる単語または上記受信音声の声紋に基づいて、上記可能性を判定することを特徴とする請求項２に記載の音声応答装置。
上記制御部は、上記第二モードにおいて、上記応答音声を上記音声出力部に出力させることを特徴とする請求項１から３の何れか１項に記載の音声応答装置。
上記制御部は、上記第二モードにおいて、上記受信音声に応じて、上記第一モードに切り替えるか、または、通話を切断することを特徴とする請求項１から４の何れか１項に記載の音声応答装置。
上記制御部は、上記第二モードにおいて、問い合わせ事項を含む上記応答音声を上記通信部に送信させ、上記受信音声が上記問い合わせ事項に対する回答を含むか否かを判定し、上記回答を含む場合に上記第一モードに切り替え、上記回答を含まない場合に、上記通話を切断することを特徴とする請求項５に記載の音声応答装置。
上記制御部は、上記第二モードにおいて、上記受信音声に応じて、通話を切断することを特徴とする請求項１から４の何れか１項に記載の音声応答装置。
上記制御部は、上記第二モードにおいて、問い合わせ事項を含む上記応答音声を上記通信部に送信させ、上記受信音声が上記問い合わせ事項に対する回答を含むか否かを判定し、上記回答を含む場合に、上記通話を切断することを特徴とする請求項７に記載の音声応答装置。
上記制御部は、上記応答音声を生成するか、または、予め記憶されている音声から選択することを特徴とする請求項１から８の何れか一項に記載の音声応答装置。
請求項１に記載の音声応答装置としてコンピュータを機能させるためのプログラムであって、上記制御部としてコンピュータを機能させるためのプログラム。