JP3608449B2 - Voice response method and apparatus, and storage medium storing voice response program - Google Patents

Voice response method and apparatus, and storage medium storing voice response program Download PDF

Info

Publication number
JP3608449B2
JP3608449B2 JP25564299A JP25564299A JP3608449B2 JP 3608449 B2 JP3608449 B2 JP 3608449B2 JP 25564299 A JP25564299 A JP 25564299A JP 25564299 A JP25564299 A JP 25564299A JP 3608449 B2 JP3608449 B2 JP 3608449B2
Authority
JP
Japan
Prior art keywords
response
caller
history
voice
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25564299A
Other languages
Japanese (ja)
Other versions
JP2001086243A (en
Inventor
佳織 楢原
弘行 松井
亮造 布川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP25564299A priority Critical patent/JP3608449B2/en
Publication of JP2001086243A publication Critical patent/JP2001086243A/en
Application granted granted Critical
Publication of JP3608449B2 publication Critical patent/JP3608449B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音声応答方法及び装置及び音声応答プログラムを格納した記憶媒体に係り、特に、通信網に接続され、発信者に対して応答するための音声応答方法及び装置及び音声応答プログラムを格納した記憶媒体に関する。
【0002】
【従来の技術】
図10は、従来の応答装置の構成を示す。
従来の応答装置は、回線インタフェース部1、着信検出部2、通話部4、応答部5、及び制御部6から構成される。
同図に示す応答装置では、回線インタフェース部1に着信があると、着信検出部2は、着信を検出し、制御部6に通知し、着信表示し、オペレータは通話部4で応答する。
【0003】
あるいは、無人化のため夜間などはオペレータの代わりに、応答部5を設け、音声ガイダンスと押しボタンダイヤル信号認識により応答する。
また、電子交換機システムにおいて、ISDN網が提供する発IDにより応答メッセージを変化させる方法(特開平6−237296)や、発IDにより利用者を検索し、サービス内容を決定することが可能なファクシミリ装置(特開平9−65088)等がある。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の応答装置では、無人対応時の着信側の応答形式が限定され、利用者の望む応答形式で応答できないという問題がある。また、PBによる選択分岐が多く、利用者の求めるサービスに辿り着くまでに時間がかかるという問題がある。
【0005】
また、全ての着信呼が夜間受け付けへ転送される場合は、夜間もオペレータの稼働が大きいという問題がある。
さらに、従来の発IDにより応答メッセージを変化させる方法(特開平6−237296)や、発IDにより利用者を検索し、サービス内容を決定することが可能なファクシミリ装置(特開平9−65088)は、多数話者への音声認識の適用には、話者を特定するID番号を利用者に入力させる必要がある。また、話者の発話の一部を用いて、蓄積されている多数の話者毎の認識パターンとの照合処理により話者の特定を行う必要がある。
【0006】
本発明は、上記の点に鑑みなされたもので、音声認識の認識率を向上させ、発話者別に応答形式、応答方法を可変とし、音声認識に向いていない話者と判断される場合には、音声認識を試みないことにより操作時間を短縮することが可能な音声応答方法及び装置及び音声応答プログラムを格納した記憶媒体を提供すること目的とする。
【0007】
【課題を解決するための手段】
図1は、本発明の原理を説明するための図である。
本発明(請求項1)は、通信網に接続され、発信者に対して音声で応答するための音声応答方法において、
発信者毎に過去の音声認識の成功/失敗の結果、応答回数、応答時における応答形式を含む応答履歴を保持しておき(ステップ1)、
発信者から着信呼があった場合に(ステップ2)、該発信者に対応する応答履歴を検索し(ステップ3)、
検索された発信者に対応する応答履歴において、連続した一定回数以上の音声認識の成功履歴がある場合には(ステップ4)、音声認識による応答を行う(ステップ5)。
【0008】
本発明(請求項2)は、応答履歴を発信者の発ID毎に保持しておき、
発信者から着信呼があった場合に、該発信者の発IDを取得し、
発IDを発信者特定のキーとして、応答履歴を検索し、
検索された応答履歴に基づいて応答形式を決定する。
本発明(請求項3)は、応答形式として、
音声認識と音声ガイダンスの組み合わせ、押しボタンダイヤル信号認識と音声ガイダンスの組み合わせ、音声ガイダンスと通話録音の組み合わせ、音声ガイダンス、着信呼を転送し、転送先における応答の何れかを用いる。
【0009】
本発明(請求項4)は、応答履歴に発IDが登録されていない場合には、応答形式を発信者に指定させ、
発IDのある着信呼については、応答履歴から該発IDに対応する応答履歴情報を取得し、応答回数の履歴により応答形式を決定する。
本発明(請求項5)は、応答時に所定の時間無音である場合に、応答形式を変更する、または、音声認識の成功/失敗により応答形式を変更する、または、発信者の操作により応答形式を変更する制御方法のうちのいずれか、または、複数の制御を行う。
【0010】
図2は、本発明の原理構成図である。
本発明(請求項6)は、通信網に接続され、発信者に対して音声で応答するための音声応答装置であって、
発信者毎に過去の音声認識の成功/失敗の結果、応答回数、応答時における応答形式を含む応答履歴を保持する応答形式履歴蓄積手段11と、
発信者からの着信呼を検出する着信検出手段2と、
着信検出手段2において、着信呼があった場合に、該発信者に対応する応答履歴を応答形式履歴蓄積手段11より検索する履歴検索手段6と、
履歴検索手段6により検索された発信者に対応する応答履歴において、連続した一定回数以上の音声認識の成功履歴がある場合には、音声認識による応答を行う応答手段5とを有する。
【0011】
本発明(請求項7)は、応答形式履歴蓄積手段11において、
応答履歴を発信者の発ID毎に保持しておき、
履歴検索手段6において、
発信者から着信呼があった場合に、該発信者の発IDを取得し、発IDを発信者特定のキーとして、応答履歴を検索する手段を含み、
応答手段5において、
履歴検索手段6により検索された応答履歴に基づいて応答形式を決定する手段を含む。
【0012】
本発明(請求項8)は、応答履歴の応答形式として、
音声認識と音声ガイダンスの組み合わせ、押しボタンダイヤル信号認識と音声ガイダンスの組み合わせ、音声ガイダンスと通話録音の組み合わせ、音声ガイダンス、着信呼を転送し、転送先における応答の何れかを保持する。
本発明(請求項9)は、応答履歴に発IDが登録されていない場合には、応答形式を発信者に指定させる応答形式指定指示手段を更に有し、
応答手段5において、
発IDのある着信呼については、履歴検索手段6により検索された応答回数の履歴により応答形式を決定する手段を含む。
【0013】
本発明(請求項10)は、発信者に対する応答時に所定の時間無音であることを検出する無音時間検出手段を更に有し、
応答手段5において、
無音時間検出手段において所定の時間無音である場合に、応答形式を変更する手段、または、音声認識の成功/失敗により応答形式を変更する手段、または、発信者の操作により応答形式を変更する手段のうちのいずれか、または、複数の手段を実行する。
【0014】
本発明(請求項11)は、通信網に接続され、発信者に対して音声で応答するための音声応答装置に搭載される音声応答プログラムを格納した記憶媒体であって、
発信者毎に過去の音声認識の成功/失敗の結果、応答回数、応答時における応答形式を含む応答履歴を記憶手段に蓄積させる応答形式履歴格納プロセスと、
発信者からの着信呼を検出する着信検出プロセスと、
着信検出プロセスにおいて、着信呼があった場合に、該発信者に対応する応答履歴を記憶手段より検索する履歴検索プロセスと、
履歴検索プロセスにより検索された発信者に対応する応答履歴において、連続した一定回数以上の音声認識の成功履歴がある場合には、音声認識による応答を行う応答プロセスとを有する。
【0015】
本発明(請求項12)は、応答形式履歴格納プロセスにおいて、
応答履歴を発信者の発ID毎に記憶手段に格納し、
履歴検索プロセスにおいて、
発信者から着信呼があった場合に、該発信者の発IDを取得し、発IDを発信者特定のキーとして、応答履歴を検索するプロセスを含み、
応答プロセスにおいて、
履歴検索プロセスにより検索された応答履歴に基づいて応答形式を決定するプロセスを含む。
【0016】
本発明(請求項13)は、応答履歴の応答形式として、
音声認識と音声ガイダンスの組み合わせ、押しボタンダイヤル信号認識と音声ガイダンスの組み合わせ、音声ガイダンスと通話録音の組み合わせ、音声ガイダンス、着信呼を転送し、転送先における応答の何れかを用いる。
本発明(請求項14)は、記憶手段に応答履歴として発IDが登録されていない場合には、応答形式を発信者に指定させる応答形式指定指示プロセスを更に有し、
応答プロセスにおいて、
発IDのある着信呼については、履歴検索プロセスにより検索された応答回数の履歴により応答形式を決定するプロセスを含む。
【0017】
本発明(請求項15)は、発信者に対する応答時に所定の時間無音であることを検出する無音時間検出プロセスを更に有し、
応答プロセスは、
無音時間検出プロセスにおいて所定の時間無音である場合に、応答形式を変更するプロセス、または、音声認識の成功/失敗により応答形式を変更するプロセス、または、発信者の操作により応答形式を変更するプロセスのうちのいずれか、または、複数のプロセスを実行する。
【0018】
上述のように、本発明によれば、発話者の過去の音声認識の成功・不成功の履歴を判定して、連続した一定回数以上の音声認識成功履歴がある発話者の場合には、音声認識による応答を起動することにより、音声認識の認識率を向上させることが可能となる。
また、発話者別に応答形式・応答方法を変更することが可能となる。
【0019】
さらに、発話者の履歴を検索する際に、電話回線を経由して送出される発ID(発信電話番号)を発話者特定のキーとする検索手段を用いることにより、音声認識利用者の操作性を向上させるとことが可能となる。
【0020】
【発明の実施の形態】
図3は、本発明の応答装置の構成を示す。
同図に示す応答装置は、通信網と接続する回線インタフェース部1、通信網からの着信を検出する着信検出部2、通信網から送られてくる発IDを検出する発ID検出部3、利用者との通話を行う通話部4、着信に応答できる複数の応答形式を有する応答部5、当該装置を制御する制御部6、及び応答部5における応答履歴を発ID別、応答形式別に蓄積する発ID別応答形式履歴蓄積部11から構成される。
【0021】
発ID別応答形式履歴蓄積部11は、応答履歴として、発ID、発信者毎の過去の音声認識の成功/失敗の結果、応答回数、応答時における応答形式を蓄積する。
制御部6は、着信時に発ID検出部3により検出した発IDに基づいて、発ID別応答形式履歴蓄積部11から応答履歴を検索し、得られた応答履歴から応答部5において応答する形式を指定する。
【0022】
次に、上記の構成における動作を説明する。
図4は、本発明の応答装置の動作のシーケンスチャートである。
ステップ101) 回線インタフェース部1を介して通信網から着信検出部2が着信を検出し、制御部6に通知する。
ステップ102) 発ID検出部3において、通信網から送られてくる発IDを検出し、制御部6に通知する。
【0023】
ステップ103) 制御部6は、発ID検出部3から取得した発IDに基づいて発ID別応答形式履歴蓄積部11を検索し、当該発IDに対応する応答履歴を取得する。
ステップ104) 制御部6は、取得した応答履歴を応答部5に渡し、応答部5は、当該応答部5が有する複数の応答形式1〜nにおいて応答履歴に対応する応答形式を決定する。
【0024】
ステップ105) 応答部5は、決定された応答形式を通話部4に転送し、通話部4から、通信網を介して利用者に応答する。
これにより、発ID別応答形式履歴蓄積部11に蓄積されている発ID別応答形式に基づいて発信者別に応答形式を可変して提供することが可能となる。
【0025】
【実施例】
以下、図面と共に本発明の実施例を説明する。
[第1の実施例]
図5は、本発明の第1の実施例の応答装置の構成を示す。同図において図3の構成と同一部分については、同一符号を付し、その説明を省略する。
【0026】
図5に示す応答装置は、図3の構成に、転送先電話帳蓄積部15、発信部16、通話路スイッチ17、応答検出部18を付加し、応答部5に、押しボタンダイヤル信号・ダイヤルパルス信号(PB・DP)認識部8、音声認識部9、通話録音部10及び音声ガイダンス部19を付加した構成である。
制御部6において、発ID検出部3により検出された発IDに基づいて、発ID別応答形式履歴蓄積部11を参照し、応答形式を取得し、当該応答形式に応じて、応答部5の種々の機能に応答形式を通話部4に出力するよう指示する。
【0027】
本実施例における発ID津応答形式履歴蓄積部11には、応答形式として、音声ガイダンスと音声認識を組み合わせた応答形式、音声ガイダンスとPB・DP認識を組み合わせた応答形式、音声ガイダンスと通話録音を組み合わせた応答形式、音声ガイダンスの応答形式、または、着信呼を転送先に転送し、当該転送先から応答する応答形式等が各発ID毎に蓄積されているものとする。
【0028】
また、応答部5における応答形式として、音声ガイダンスと音声認識を組み合わせた応答形式、音声ガイダンスとPB・DP認識を組み合わせた応答形式、音声ガイダンスと通話録音を組み合わせた応答形式、音声ガイダンスの応答形式、または、着信呼を転送先に転送し、当該転送先から応答する応答形式を指定する。
【0029】
応答部5の応答認識部9は、例えば、特開平10−190842や特開平7−230295に開示されているような、応答形式に基づいて、通話部4から取得した音声データを音声認識する。
着信呼の転送において、制御部6は、転送先電話帳蓄積部15から転送先を読み出し、発信部16から転送先に発信する。さらに、転送応答時に、応答検出部18にて利用者からの応答を検出し、制御部6へ通知する。制御部6は、通話路スイッチ17を制御し、着信呼と転送先間で通話路を形成し、着信呼を転送する制御を行う。
【0030】
図6は、本発明の第1の実施例の応答装置の動作を示すシーケンスチャートである。
ステップ201) 回線インタフェース部1を介して通信網から着信検出部2が着信を検出し、制御部6に通知する。
ステップ202) 発ID検出部3において、通信網から送られてくる発IDを検出し、制御部6に通知する。
【0031】
ステップ203) 制御部6は、発ID検出部3から取得した発IDに基づいて発ID別応答形式履歴蓄積部11を検索し、当該発IDに対応する応答履歴を取得する。
ステップ204) 制御部6は、応答履歴から応答部5において当該発IDに対応する応答形式を参照し、当該応答形式に応じて、応答部5の各機能(PB・DP認識部8、音声認識部9、通話録音部10、音声ガイダンス部19のいずれか、または、複数組み合わせた機能)から上述した方法により選択する。
【0032】
ステップ205) 着信呼以外の場合には、ステップ204により選択された応答形式に基づいて、通話部4から通信網を介して利用者に応答する。
ステップ206) 着信呼の場合には、制御部6において転送先への応答形式を決定する。
ステップ207) さらに、制御部6は、着信呼から転送先IDを抽出し、該転送先IDに基づいてら転送先電話帳蓄積部15から転送先を読み出す。
【0033】
ステップ208) 発信部16は、読み出された転送先にステップ206で決定された応答形式に対応する応答を行う。
ステップ209) 応答検出部18において転送先からの応答を検出すると、制御部6は、着信呼が転送可能となるように通話路スイッチ17を制御する。
ステップ210) 着信呼と転送先との間で通話路を形成し、発信部16より着信呼を転送先に転送する。
【0034】
[第2の実施例]
本実施例では、ある一定時間以上無音時間が継続した場合の処理、及び、応答履歴の音声認識が成功している応答回数を抽出し、所定の回数連続している発IDを有する場合に、音声認識による応答を行う処理について説明する。
図7は、本発明の第2の実施例の応答装置の構成を示し、図5と同一構成部分には同一符号を付し、その説明を省略する。
【0035】
同図に示す構成は、図5の構成に、無音時間検出部14を付加した構成である。無音時間検出部14は、応答した着信呼をモニタし、無音時間が一定時間より長ければ、無音と判定する。
図8、図9は、本発明の第2の実施例の応答装置の動作を示すフローチャートである。
【0036】
まず、応答装置は、無人で対応する(ステップ300)。ここで、発ID検出部3において発IDを検出できない場合には、応答部5から通話部4を介して音声ガイダンスを流す(ステップ301)。また、発IDが検出できた場合には、制御部6は、発ID別応答形式履歴蓄積部11より発ID別の応答履歴と応答回数を読み出し、応答回数が1回目の場合には応答部5に転送し、通話部4から有人応対を行う。このとき、オペレータは、ユーザのデータを発ID別応答形式履歴蓄積部11に投入し、応対した内容を履歴として蓄積する(ステップ302)。応答回数が2回以上の場合、制御部6は、発ID別応答履歴蓄積部11から発ID別応答履歴を読み出す(ステップ303)。
【0037】
ここで、音声認識が連続2回上成功しており、音声認識が選択されている場合には、応答部5の音声認識部9より音声認識で応答する(ステップ305)。また、ステップ304において、PB・DP認識が選択されている場合には、応答部5のPB・DP認識部8で応答する(ステップ306)。ステップ305における音声認識で、成功し、かつ無音でない場合には、応答履歴を更新する(ステップ307)。その後サービスを提供する(ステップ308)。なお、音声認識の成功/失敗の判断方法としては、応答の際に、ユーザが音声を入力し、認識した後に音声ガイダンスによりユーザのPB等による確認手段により判定する方法を用いるものとする。
【0038】
音声認識で応答に失敗、または、無音判定した場合には、応答部5のPB・DP認識部8により応答する(ステップ306)。
ステップ306のPB・DP認識において成功した場合には、応答履歴を更新し(ステップ309)。応答履歴の更新は、応答形式・注文内容をデータベースに書き込むことで達成されるものとする。その後サービスを提供する(ステップ310)。
【0039】
PB・DP認識部8によるPB・DP認識に失敗、または、無音判定で無音時間が一定時間よりも長い場合は、有人に転送するか、通話録音するかをガイダンスで質問し(ステップ311)、ユーザが転送を希望するならば、ユーザが転送操作して、発ID別応答形式履歴蓄積部11の応答履歴を更新し(ステップ314)、転送、有人応対を行う(ステップ315)。ユーザが転送を希望しない場合は、発ID別応答形式履歴蓄積部11の応答履歴を更新し(ステップ312)、通話録音をする(ステップ313)。
【0040】
また、音声認識での応答で、連続した一定回数以上の成功履歴がある場合のユーザに対しては、始めから音声認識による応答を行い、それ以外のユーザに対しては、まず、始めに音声認識での応答を希望するかどうかを質問し、前回PB・DP認識と音声ガイダンスの組み合わせの形式で応答しているようなユーザは、応答の始めに音声認識での応答を望むかどうかを問い合わせ、ユーザが希望するなら音声認識での応答を行うものとする。
【0041】
なお、上記の動作において、音声認識を用いた応答に2回以上連続で成功したか否かの判断においては、2回に限定されることなく、過去に所定の回数以上連続して音声認識に成功した履歴があるか否かで判断されるようにしてもよい。
また、上記の実施例は、図3、図5、図7の構成に基づいて説明しているが、これらの応答装置をプログラムとして構築し、応答装置として利用されるコンピュータに接続されるディスク装置、フロッピーディスク、CD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることにより、容易に本発明を実現することが可能である。
【0042】
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【0043】
【発明の効果】
上述のように、本発明によれば、発信者の過去の音声認識の成功/失敗の履歴を判定して、連続した一定回数以上の音声認識成功履歴がある発信者の場合には、音声認識による応答を起動することにより、音声認識の認識率を向上させることができる。
【0044】
また、本発明は、従来のように認識辞書を変更することではなく、発信者別に応答形式・応答方法を可変とすることにより、音声認識に向いていない話者と判断される場合には、以降の処理では、音声認識を試みないことにより、操作時間が短縮される。
また、通信網から送られてくる発信者識別情報を検出し、当該発信者識別情報に基づいて応答形式を選択して応答し、応答履歴を発信者識別情報別に蓄積することにより、それぞれの発信者にあった応答形式を提供することが可能となる。
【0045】
また、発信者の応答履歴を検索する際に、従来のように、発信者に発IDを入力させることなく、電話回線を経由し送出される発IDを検索のための発信者の特定のキーとして用いることにより、音声認識利用者の操作性を向上させることができる。
また、応答する際に、音声認識と音声ガイダンスの組み合わせ、押しボタンダイヤル信号認識と音声ガイダンスの組み合わせ、音声ガイダンスと通話録音の組み合わせ、音声ガイダンス、等の応答形式を用いて着信呼を転送し、転送先にて応答することにより、発信者への負担を軽減させることが可能となる。
【0046】
また、発信者識別情報のない着信呼に対しては応答形式を指定し、発信者識別情報のある着信呼に対しては、蓄積されている応答履歴を求め、応答回数の履歴により応答形式を指定することが可能となる。また、応答時の無音検出の場合や、発信者の操作により、応答形式を変更することが可能となる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の応答装置の構成図である。
【図4】本発明の応答装置の動作のシーケンスチャートである。
【図5】本発明の第1の実施例の応答装置の構成図である。
【図6】本発明の第1の実施例の応答装置の動作を示すシーケンスチャートである。
【図7】本発明の第2の実施例の応答装置の構成図である。
【図8】本発明の第2の実施例の応答装置の動作を示すフローチャート(その1)である。
【図9】本発明の第2の実施例の応答装置の動作を示すフローチャート(その2)である。
【図10】従来の応答装置の構成図である。
【符号の説明】
1 回線インタフェース部
2 着信検出手段、着信検出部
3 発ID検出部
4 通話部
5 応答手段、応答部
6 履歴検索手段、制御部
8 PB・DP認識部
9 音声認識部
10 通話録音部
11 発ID別応答形式履歴蓄積手段、発ID別応答形式履歴蓄積部
15 転送先電話帳蓄積部
16 発信部
17 通話路スイッチ
18 応答検出部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a voice response method and apparatus and a storage medium storing a voice response program, and more particularly to a voice response method and apparatus for connecting to a communication network and responding to a caller and a voice response program. The present invention relates to a storage medium.
[0002]
[Prior art]
FIG. 10 shows a configuration of a conventional response device.
The conventional response device includes a line interface unit 1, an incoming call detection unit 2, a call unit 4, a response unit 5, and a control unit 6.
In the response device shown in the figure, when an incoming call is received at the line interface unit 1, the incoming call detection unit 2 detects the incoming call, notifies the control unit 6, displays the incoming call, and the operator responds at the call unit 4.
[0003]
Alternatively, the response unit 5 is provided instead of the operator at night for unmanned operation and responds by voice guidance and push button dial signal recognition.
Further, in an electronic exchange system, a method of changing a response message by an originating ID provided by the ISDN network (Japanese Patent Laid-Open No. 6-237296), or a facsimile apparatus capable of searching for a user by the originating ID and determining service contents (Japanese Patent Laid-Open No. 9-65088).
[0004]
[Problems to be solved by the invention]
However, in the conventional response device, there is a problem that the response format on the receiving side at the time of unattended response is limited, and it is impossible to respond in the response format desired by the user. Moreover, there are many selection branches by PB, and there is a problem that it takes time to reach the service requested by the user.
[0005]
Further, when all incoming calls are transferred to the reception at night, there is a problem that the operation of the operator is large at night.
Further, there are a conventional method of changing a response message based on the calling ID (Japanese Patent Laid-Open No. 6-237296) and a facsimile apparatus (Japanese Patent Laid-Open No. 9-65088) capable of searching for a user based on the calling ID and determining service contents. In order to apply voice recognition to a large number of speakers, it is necessary for the user to input an ID number that identifies the speaker. In addition, it is necessary to specify a speaker by using a part of the speaker's utterance and collating with a recognition pattern for each of a large number of accumulated speakers.
[0006]
The present invention has been made in view of the above points. In the case where it is determined that the speaker is not suitable for speech recognition by improving the recognition rate of speech recognition, making the response format and response method variable for each speaker. Another object of the present invention is to provide a voice response method and apparatus capable of reducing the operation time by not attempting voice recognition, and a storage medium storing a voice response program.
[0007]
[Means for Solving the Problems]
FIG. 1 is a diagram for explaining the principle of the present invention.
The present invention (Claim 1) is a voice response method for replying to a caller by voice connected to a communication network.
For each caller, a response history including the result of past speech recognition success / failure, the number of responses, and the response format at the time of response is retained (step 1).
When there is an incoming call from the caller (step 2), the response history corresponding to the caller is searched (step 3),
In the response history corresponding to the retrieved caller, when there is a continuous history of successful voice recognition more than a certain number of times (step 4), a response by voice recognition is performed (step 5).
[0008]
The present invention (Claim 2) maintains a response history for each caller ID,
When there is an incoming call from the caller, obtain the caller ID of the caller,
Search the response history using the caller ID as the caller-specific key,
A response format is determined based on the retrieved response history.
In the present invention (Claim 3), as a response format,
A combination of voice recognition and voice guidance, a combination of push button dial signal recognition and voice guidance, a combination of voice guidance and call recording, voice guidance, an incoming call, and a response at the transfer destination are used.
[0009]
The present invention (Claim 4) allows the caller to specify the response format when the calling ID is not registered in the response history,
For an incoming call with a caller ID, response history information corresponding to the caller ID is acquired from the response history, and the response format is determined based on the response frequency history.
The present invention (Claim 5) changes the response format when there is no sound for a predetermined time at the time of response, or changes the response format due to the success / failure of voice recognition, or the response format by the operation of the caller One or a plurality of control methods are performed.
[0010]
FIG. 2 is a principle configuration diagram of the present invention.
The present invention (Claim 6) is a voice response device connected to a communication network for responding with voice to a caller,
Response format history storage means 11 for holding a response history including the result of past voice recognition success / failure for each caller, the number of responses, and the response format at the time of response;
Incoming call detection means 2 for detecting an incoming call from a caller;
In the incoming call detection means 2, when there is an incoming call, the history search means 6 for searching the response history corresponding to the caller from the response format history storage means 11,
In the response history corresponding to the caller searched by the history search means 6, there is a response means 5 that makes a response by voice recognition when there is a continuous history of voice recognition more than a predetermined number of times.
[0011]
According to the present invention (Claim 7), the response format history storage means 11
Keep a response history for each caller ID,
In the history search means 6,
Means for obtaining a caller ID of the caller when there is an incoming call from the caller, and searching for a response history using the caller ID as a caller-specific key;
In response means 5,
A means for determining a response format based on the response history searched by the history search means;
[0012]
In the present invention (claim 8), as a response format of the response history,
A combination of voice recognition and voice guidance, a combination of push button dial signal recognition and voice guidance, a combination of voice guidance and call recording, voice guidance, and an incoming call are transferred, and one of the responses at the transfer destination is held.
The present invention (Claim 9) further includes response format designation instruction means for causing the caller to designate a response format when the calling ID is not registered in the response history.
In response means 5,
For an incoming call with a caller ID, means for determining a response format based on the history of the number of responses searched by the history search means 6 is included.
[0013]
The present invention (Claim 10) further includes silent time detecting means for detecting silence for a predetermined time when responding to the caller,
In response means 5,
Means for changing the response format when the silent time detection means is silent for a predetermined time, means for changing the response format due to success / failure of voice recognition, or means for changing the response format by the operation of the caller Or a plurality of means are executed.
[0014]
The present invention (Claim 11) is a storage medium that stores a voice response program that is connected to a communication network and is mounted on a voice response device for responding to a caller with voice.
A response format history storage process for accumulating in the storage means a response history including the results of past voice recognition success / failure for each caller, the number of responses, and the response format at the time of response;
An incoming call detection process to detect incoming calls from callers;
In the incoming call detection process, when there is an incoming call, a history search process for searching a response history corresponding to the caller from the storage means;
In the response history corresponding to the caller searched by the history search process, there is a response process for performing a response by voice recognition when there is a continuous history of voice recognition more than a predetermined number of times.
[0015]
According to the present invention (Claim 12), in the response format history storage process,
The response history is stored in the storage means for each caller ID,
In the history search process,
Including a process of obtaining a caller ID of the caller when there is an incoming call from the caller, and searching a response history using the caller ID as a caller-specific key,
In the response process,
Including a process of determining a response format based on the response history retrieved by the history retrieval process.
[0016]
According to the present invention (claim 13), as a response format of the response history,
A combination of voice recognition and voice guidance, a combination of push button dial signal recognition and voice guidance, a combination of voice guidance and call recording, voice guidance, an incoming call, and a response at the transfer destination are used.
The present invention (Claim 14) further includes a response format designation instruction process for causing the caller to designate a response format when the calling ID is not registered as a response history in the storage means,
In the response process,
For an incoming call with a caller ID, a process of determining a response format based on a history of the number of responses retrieved by the history retrieval process is included.
[0017]
The present invention (Claim 15) further includes a silent time detection process for detecting silence for a predetermined time when responding to the caller,
The response process is
The process of changing the response format when there is silence for a predetermined time in the silent time detection process, the process of changing the response format due to the success / failure of voice recognition, or the process of changing the response format by the operation of the caller One or more processes are executed.
[0018]
As described above, according to the present invention, the success / failure history of the speaker's past speech recognition is determined. By activating the response by recognition, the recognition rate of voice recognition can be improved.
In addition, the response format and response method can be changed for each speaker.
[0019]
Further, when searching for the history of the speaker, the operability of the voice recognition user is obtained by using a search means using the calling ID (calling telephone number) transmitted via the telephone line as a key for specifying the speaker. Can be improved.
[0020]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 3 shows the configuration of the response device of the present invention.
The response device shown in FIG. 1 includes a line interface unit 1 connected to a communication network, an incoming call detection unit 2 that detects an incoming call from the communication network, an outgoing ID detection unit 3 that detects an outgoing ID sent from the communication network, A communication unit 4 for making a call with a person, a response unit 5 having a plurality of response formats capable of responding to incoming calls, a control unit 6 for controlling the device, and a response history in the response unit 5 are stored for each calling ID and response format It is comprised from the response format log | history storage part 11 by origination ID.
[0021]
The response format history storage unit 11 for each calling ID stores the calling ID, the result of past voice recognition success / failure for each caller, the number of responses, and the response format at the time of response as the response history.
The control unit 6 searches the response history from the response ID history storage unit 11 for each calling ID based on the calling ID detected by the calling ID detection unit 3 at the time of an incoming call, and responds in the response unit 5 from the obtained response history. Is specified.
[0022]
Next, the operation in the above configuration will be described.
FIG. 4 is a sequence chart of the operation of the response device according to the present invention.
Step 101) The incoming call detection unit 2 detects an incoming call from the communication network via the line interface unit 1, and notifies the control unit 6 of the incoming call.
Step 102) The calling ID detection unit 3 detects the calling ID sent from the communication network and notifies the control unit 6 of it.
[0023]
Step 103) The control unit 6 searches the response format history storage unit 11 for each outgoing ID based on the outgoing ID acquired from the outgoing ID detection unit 3, and acquires the response history corresponding to the outgoing ID.
Step 104) The control unit 6 passes the acquired response history to the response unit 5, and the response unit 5 determines a response format corresponding to the response history in the plurality of response formats 1 to n included in the response unit 5.
[0024]
Step 105) The response unit 5 transfers the determined response format to the call unit 4, and responds to the user from the call unit 4 via the communication network.
Accordingly, it is possible to provide a variable response format for each caller based on the response format for each caller ID stored in the response format history storage unit 11 for each caller ID.
[0025]
【Example】
Embodiments of the present invention will be described below with reference to the drawings.
[First embodiment]
FIG. 5 shows the configuration of the response device according to the first embodiment of the present invention. 3, the same parts as those in FIG. 3 are denoted by the same reference numerals, and the description thereof is omitted.
[0026]
The response device shown in FIG. 5 has a transfer destination telephone directory storage unit 15, a transmission unit 16, a speech path switch 17, and a response detection unit 18 added to the configuration of FIG. A pulse signal (PB / DP) recognition unit 8, a voice recognition unit 9, a call recording unit 10, and a voice guidance unit 19 are added.
In the control unit 6, based on the outgoing ID detected by the outgoing ID detection unit 3, the response format history storage unit 11 for each outgoing ID is referred to, the response format is acquired, and the response unit 5 Instruct various functions to output a response format to the communication unit 4.
[0027]
In the present embodiment, the ID ID response format history storage unit 11 includes a response format combining voice guidance and voice recognition, a response format combining voice guidance and PB / DP recognition, voice guidance and call recording as response formats. It is assumed that a combined response format, a voice guidance response format, or a response format in which an incoming call is transferred to a transfer destination and responded from the transfer destination is stored for each calling ID.
[0028]
Further, as a response format in the response unit 5, a response format combining voice guidance and voice recognition, a response format combining voice guidance and PB / DP recognition, a response format combining voice guidance and call recording, a response format of voice guidance Alternatively, the incoming call is transferred to the transfer destination, and a response format for responding from the transfer destination is designated.
[0029]
The response recognition unit 9 of the response unit 5 recognizes the voice data acquired from the call unit 4 based on the response format as disclosed in, for example, JP-A-10-190842 and JP-A-7-230295.
In transferring an incoming call, the control unit 6 reads the transfer destination from the transfer destination telephone directory storage unit 15 and transmits the transfer destination from the transmission unit 16 to the transfer destination. Furthermore, at the time of a transfer response, the response detection unit 18 detects a response from the user and notifies the control unit 6 of the response. The control unit 6 controls the speech path switch 17 to form a speech path between the incoming call and the transfer destination, and performs control to transfer the incoming call.
[0030]
FIG. 6 is a sequence chart showing the operation of the response device according to the first exemplary embodiment of the present invention.
Step 201) The incoming call detection unit 2 detects an incoming call from the communication network via the line interface unit 1, and notifies the control unit 6 of the incoming call.
Step 202) The calling ID detection unit 3 detects the calling ID sent from the communication network, and notifies the control unit 6 of it.
[0031]
Step 203) The control unit 6 searches the response ID history storage unit 11 for each outgoing ID based on the outgoing ID acquired from the outgoing ID detection unit 3, and acquires a response history corresponding to the outgoing ID.
Step 204) The control unit 6 refers to the response format corresponding to the caller ID in the response unit 5 from the response history, and according to the response format, each function of the response unit 5 (PB / DP recognition unit 8, voice recognition) From any one of the unit 9, the call recording unit 10, the voice guidance unit 19, or a combination of functions).
[0032]
Step 205) If the call is not an incoming call, the call unit 4 responds to the user via the communication network based on the response format selected in Step 204.
Step 206) In the case of an incoming call, the control unit 6 determines a response format to the transfer destination.
Step 207) Further, the control unit 6 extracts the transfer destination ID from the incoming call, and reads the transfer destination from the transfer destination telephone directory storage unit 15 based on the transfer destination ID.
[0033]
Step 208) The transmitting unit 16 makes a response corresponding to the response format determined in Step 206 to the read transfer destination.
Step 209) When the response detector 18 detects a response from the transfer destination, the controller 6 controls the speech path switch 17 so that the incoming call can be transferred.
Step 210) A communication path is formed between the incoming call and the transfer destination, and the incoming call is transferred from the transmission unit 16 to the transfer destination.
[0034]
[Second Embodiment]
In this embodiment, when the silent time continues for a certain time or more, and when the response history voice recognition has been successful, the number of responses is extracted, and when there is a predetermined number of consecutive IDs, Processing for performing a response by voice recognition will be described.
FIG. 7 shows the configuration of the response device according to the second embodiment of the present invention. The same components as those in FIG.
[0035]
The configuration shown in the figure is a configuration in which a silent time detection unit 14 is added to the configuration of FIG. 5. The silent time detecting unit 14 monitors the incoming call that has been answered, and determines that there is no sound if the silent time is longer than a certain time.
8 and 9 are flowcharts showing the operation of the response device according to the second embodiment of the present invention.
[0036]
First, the response device responds unattended (step 300). Here, when the calling ID detection unit 3 cannot detect the calling ID, the voice guidance is played from the response unit 5 through the calling unit 4 (step 301). When the originating ID can be detected, the control unit 6 reads the response history and response count for each originating ID from the response format history storage unit 11 for each originating ID, and when the response count is the first time, the response unit Then, the call unit 4 performs a manned response. At this time, the operator inputs the user data into the response format history storage unit 11 for each calling ID, and stores the contents of the response as a history (step 302). When the number of responses is two or more, the control unit 6 reads the response history for each outgoing ID from the response history storage for each outgoing ID 11 (step 303).
[0037]
Here, when the voice recognition has succeeded twice consecutively and the voice recognition is selected, the voice recognition unit 9 of the response unit 5 responds by voice recognition (step 305). If PB / DP recognition is selected in step 304, the PB / DP recognition unit 8 of the response unit 5 responds (step 306). If the speech recognition in step 305 is successful and not silent, the response history is updated (step 307). Thereafter, a service is provided (step 308). As a method for determining the success / failure of voice recognition, a method is used in which a user inputs a voice at the time of response, and after the voice is recognized, it is judged by a confirmation means using the user's PB or the like by voice guidance.
[0038]
If the response fails in voice recognition or if silence is determined, the PB / DP recognition unit 8 of the response unit 5 responds (step 306).
If the PB / DP recognition in step 306 is successful, the response history is updated (step 309). The response history is updated by writing the response format / order contents in the database. Thereafter, a service is provided (step 310).
[0039]
If the PB / DP recognition by the PB / DP recognition unit 8 fails, or if the silent time is longer than a certain time in the silence determination, the guidance asks whether to transfer to a manned person or record a call (step 311). If the user wishes to transfer, the user performs a transfer operation to update the response history in the response format history storage unit 11 for each calling ID (step 314), and perform transfer and manned response (step 315). If the user does not wish to transfer, the response history in the response format history storage unit 11 for each calling ID is updated (step 312) and the call is recorded (step 313).
[0040]
In addition, for users who have a success history of a certain number of consecutive responses in voice recognition, a voice recognition response is made from the beginning. Asks whether or not he / she wants a response by recognition, and the user who responded in the form of a combination of PB / DP recognition and voice guidance last time inquires whether or not he / she wants a response by voice recognition at the beginning of the response If the user desires, a response by voice recognition is performed.
[0041]
In the above operation, the determination of whether or not the response using the voice recognition has succeeded twice or more in succession is not limited to two times, and the voice recognition has been continuously performed a predetermined number of times or more in the past. The determination may be made based on whether or not there is a successful history.
Moreover, although the above embodiment has been described based on the configurations of FIGS. 3, 5, and 7, a disk device that is constructed as a program and that is connected to a computer that is used as the response device. It is possible to easily realize the present invention by storing it in a portable storage medium such as a floppy disk or a CD-ROM and installing it when implementing the present invention.
[0042]
The present invention is not limited to the above-described embodiments, and various modifications and applications can be made within the scope of the claims.
[0043]
【The invention's effect】
As described above, according to the present invention, the caller's past speech recognition success / failure history is determined. By starting the response according to, the recognition rate of voice recognition can be improved.
[0044]
Further, the present invention does not change the recognition dictionary as in the prior art, but by changing the response format and response method for each caller, when it is determined that the speaker is not suitable for speech recognition, In the subsequent processing, the operation time is shortened by not trying speech recognition.
Also, by detecting the caller identification information sent from the communication network, responding by selecting the response format based on the caller identification information, and storing the response history for each caller identification information, It is possible to provide a response format suitable for the person.
[0045]
In addition, when searching for a caller's response history, a caller's specific key for searching for a caller ID sent via a telephone line without causing the caller to input a caller ID as in the prior art. As a result, it is possible to improve the operability of the voice recognition user.
Also, when answering, the incoming call is forwarded using a response format such as voice recognition and voice guidance combination, push button dial signal recognition and voice guidance combination, voice guidance and call recording combination, voice guidance, etc. By responding at the forwarding destination, the burden on the caller can be reduced.
[0046]
In addition, a response format is specified for an incoming call without caller identification information, and an accumulated response history is obtained for an incoming call with caller identification information. It can be specified. In addition, it is possible to change the response format in the case of silence detection at the time of response or by the operation of the caller.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining the principle of the present invention.
FIG. 2 is a principle configuration diagram of the present invention.
FIG. 3 is a configuration diagram of a response device according to the present invention.
FIG. 4 is a sequence chart of the operation of the response device according to the present invention.
FIG. 5 is a configuration diagram of a response device according to the first exemplary embodiment of the present invention.
FIG. 6 is a sequence chart showing the operation of the response device according to the first exemplary embodiment of the present invention.
FIG. 7 is a configuration diagram of a response device according to a second embodiment of the present invention.
FIG. 8 is a flowchart (No. 1) showing an operation of the response device according to the second exemplary embodiment of the present invention.
FIG. 9 is a flowchart (part 2) illustrating the operation of the response device according to the second exemplary embodiment of the present invention.
FIG. 10 is a configuration diagram of a conventional response device.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 Line interface part 2 Incoming call detection means, incoming call detection part 3 Calling ID detection part 4 Calling part 5 Response means, response part 6 History search means, control part 8 PB / DP recognition part 9 Voice recognition part 10 Call recording part 11 Calling ID Separate response format history storage means, ID-specific response format history storage unit 15 Forwarding destination telephone directory storage unit 16 Transmission unit 17 Communication path switch 18 Response detection unit

Claims (15)

通信網に接続され、発信者に対して音声で応答するための音声応答方法において、
発信者毎に過去の音声認識の成功/失敗の結果、応答回数、応答時における応答形式を含む応答履歴を保持しておき、
発信者から着信呼があった場合に、該発信者に対応する前記応答履歴を検索し、
検索された前記発信者に対応する応答履歴において、連続した一定回数以上の音声認識の成功履歴がある場合に、音声認識による応答を行うことを特徴とする音声応答方法。
In a voice response method for connecting to a communication network and responding to a caller with voice,
For each caller, keep a response history including the results of past voice recognition success / failure, number of responses, response format at the time of response,
When there is an incoming call from the caller, search the response history corresponding to the caller,
A voice response method characterized by performing a response by voice recognition when there is a success history of voice recognition more than a predetermined number of times in the response history corresponding to the searched sender.
前記応答履歴を発信者の発ID毎に保持しておき、
前記発信者から着信呼があった場合に、該発信者の発IDを取得し、
前記発IDを発信者特定のキーとして、前記応答履歴を検索し、
前記応答履歴に基づいて、応答形式を決定する請求項1記載の音声応答方法。
The response history is kept for each caller ID,
When there is an incoming call from the caller, obtain the caller ID of the caller,
Search the response history using the caller ID as a caller specific key,
The voice response method according to claim 1, wherein a response format is determined based on the response history.
前記応答形式として、
音声認識と音声ガイダンスの組み合わせ、押しボタンダイヤル信号認識と音声ガイダンスの組み合わせ、音声ガイダンスと通話録音の組み合わせ、音声ガイダンス、着信呼を転送し、転送先における応答の何れかを用いる請求項2記載の音声応答方法。
As the response format,
3. The combination of voice recognition and voice guidance, a combination of push button dial signal recognition and voice guidance, a combination of voice guidance and call recording, voice guidance, an incoming call, and using one of the responses at the transfer destination. Voice response method.
前記応答履歴に発IDが登録されていない場合には、応答形式を発信者に指定させ、
発IDのある着信呼については、前記応答履歴から該発IDに対応する応答履歴情報を取得し、応答回数の履歴により応答形式を決定する請求項1記載の音声応答方法。
If the calling ID is not registered in the response history, let the caller specify the response format,
2. The voice response method according to claim 1, wherein for an incoming call having a caller ID, response history information corresponding to the caller ID is acquired from the response history, and a response format is determined based on a history of the number of responses.
応答時に所定の時間無音である場合に、応答形式を変更する、または、音声認識の成功/失敗により応答形式を変更する、または、発信者の操作により応答形式を変更する制御方法のうちのいずれか、または、複数の制御を行う請求項1記載の音声応答方法。Any of the control methods of changing the response format when the response is silent for a predetermined time, changing the response format by success / failure of voice recognition, or changing the response format by the operation of the caller The voice response method according to claim 1, wherein a plurality of controls are performed. 通信網に接続され、発信者に対して音声で応答するための音声応答装置であって、
発信者毎に過去の音声認識の成功/失敗の結果、応答回数、応答時における応答形式を含む応答履歴を保持する応答形式履歴蓄積手段と、
発信者からの着信呼を検出する着信検出手段と、
前記着信検出手段において、着信呼があった場合に、該発信者に対応する応答履歴を前記応答形式履歴蓄積手段より検索する履歴検索手段と、
前記履歴検索手段により検索された前記発信者に対応する応答履歴において、連続した一定回数以上の音声認識の成功履歴がある場合には、音声認識による応答を行う応答手段とを有することを特徴とする音声応答装置。
A voice response device connected to a communication network for responding to a caller with voice,
Response format history storage means for holding a response history including the result of success / failure of past voice recognition for each caller, the number of responses, and the response format at the time of response;
An incoming call detection means for detecting an incoming call from a caller;
In the incoming call detection means, when there is an incoming call, a history search means for searching a response history corresponding to the caller from the response format history storage means;
In the response history corresponding to the caller searched by the history search means, there is a response means for making a response by voice recognition when there is a continuous history of voice recognition more than a predetermined number of times. Voice response device.
前記応答形式履歴蓄積手段は、
前記応答履歴を発信者の発ID毎に保持しておき、
前記履歴検索手段は、
前記発信者から着信呼があった場合に、該発信者の発IDを取得し、前記発IDを発信者特定のキーとして、前記応答履歴を検索する手段を含み、
前記応答手段は、
前記履歴検索手段により検索された前記応答履歴に基づいて、応答形式を選択する手段を含む請求項6記載の音声応答装置。
The response format history storage means includes:
The response history is kept for each caller ID,
The history search means includes:
When there is an incoming call from the caller, the caller ID of the caller is acquired, and the caller ID is used as a caller-specific key to search the response history,
The response means includes
7. The voice response device according to claim 6, further comprising means for selecting a response format based on the response history searched by the history search means.
前記応答形式として、
音声認識と音声ガイダンスの組み合わせ、押しボタンダイヤル信号認識と音声ガイダンスの組み合わせ、音声ガイダンスと通話録音の組み合わせ、音声ガイダンス、着信呼を転送し、転送先における応答の何れかを用いる請求項7記載の音声応答装置。
As the response format,
8. A combination of voice recognition and voice guidance, a combination of push button dial signal recognition and voice guidance, a combination of voice guidance and call recording, a voice guidance, and an incoming call are transferred, and any one of responses at the transfer destination is used. Voice response device.
前記応答履歴に発IDが登録されていない場合には、応答形式を発信者に指定させる応答形式指定指示手段を更に有し、
前記応答手段は、
発IDのある着信呼については、該発IDに基づいて前記履歴検索手段により検索された応答回数の履歴により応答形式を決定する手段を含む請求項6記載の音声応答装置。
In the case where the calling ID is not registered in the response history, it further has a response format designation instruction means for causing the caller to specify a response format,
The response means includes
7. The voice response apparatus according to claim 6, further comprising means for determining a response format based on a history of the number of responses searched by the history search means based on the call ID for an incoming call having a call origination ID.
前記発信者に対する応答時に所定の時間無音であることを検出する無音時間検出手段を更に有し、
前記応答手段は、
前記無音時間検出手段において所定の時間無音である場合に、応答形式を変更する手段、または、音声認識の成功/失敗により応答形式を変更する手段、または、発信者の操作により応答形式を変更する手段のうちのいずれか、または、複数の手段を実行する請求項6記載の音声応答装置。
Silence time detection means for detecting silence for a predetermined time when responding to the caller,
The response means includes
When the silent time detection means is silent for a predetermined time, the response format is changed, the response format is changed by the success / failure of voice recognition, or the response format is changed by the operation of the caller. The voice response device according to claim 6, wherein one or a plurality of means is executed.
通信網に接続され、発信者に対して音声で応答するための音声応答装置に搭載される音声応答プログラムを格納した記憶媒体であって、
発信者毎に過去の音声認識の成功/失敗の結果、応答回数、応答時における応答形式を含む応答履歴を記憶手段に蓄積させる応答形式履歴格納プロセスと、
発信者からの着信呼を検出する着信検出プロセスと、
前記着信検出プロセスにおいて、着信呼があった場合に、該発信者に対応する応答履歴を前記記憶手段より検索する履歴検索プロセスと、
前記履歴検索プロセスにより検索された前記発信者に対応する応答履歴において、連続した一定回数以上の音声認識の成功履歴がある場合には、音声認識による応答を行う応答プロセスとを有することを特徴とする音声応答プログラムを格納した記憶媒体。
A storage medium connected to a communication network and storing a voice response program installed in a voice response device for responding to a caller with voice,
A response format history storage process for accumulating in the storage means a response history including the results of past voice recognition success / failure for each caller, the number of responses, and the response format at the time of response;
An incoming call detection process to detect incoming calls from callers;
In the incoming call detection process, when there is an incoming call, a history search process for searching a response history corresponding to the caller from the storage means;
The response history corresponding to the caller searched by the history search process has a response process of performing a response by voice recognition when there is a continuous history of successful voice recognition more than a certain number of times. A storage medium that stores a voice response program.
前記応答形式履歴格納プロセスは、
前記応答履歴を発信者の発ID毎に前記記憶手段に格納し、
前記履歴検索プロセスは、
前記発信者から着信呼があった場合に、該発信者の発IDを取得し、前記発IDを発信者特定のキーとして、前記応答履歴を検索するプロセスを含み、
前記応答プロセスは、
前記履歴検索プロセスにより検索された前記応答履歴に基づいて、応答形式を選択する手段を含む請求項11記載の音声応答プログラムを格納した記憶媒体。
The response format history storage process includes:
The response history is stored in the storage means for each caller ID,
The history search process includes:
When an incoming call is received from the caller, the caller ID of the caller is acquired, and the response history is searched using the caller ID as a caller-specific key,
The response process is:
12. A storage medium storing a voice response program according to claim 11, further comprising means for selecting a response format based on the response history searched by the history search process.
前記応答形式として、
音声認識と音声ガイダンスの組み合わせ、押しボタンダイヤル信号認識と音声ガイダンスの組み合わせ、音声ガイダンスと通話録音の組み合わせ、音声ガイダンス、着信呼を転送し、転送先における応答の何れかを用いる請求項12記載の音声応答プログラムを格納した記憶媒体。
As the response format,
The combination of voice recognition and voice guidance, a combination of push button dial signal recognition and voice guidance, a combination of voice guidance and call recording, voice guidance, an incoming call, and using one of the responses at the transfer destination. A storage medium storing a voice response program.
前記記憶手段に応答履歴として発IDが登録されていない場合には、応答形式を発信者に指定させる応答形式指定指示プロセスを更に有し、
前記応答プロセスは、
発IDのある着信呼については、前記履歴検索プロセスにより検索された応答回数の履歴により応答形式を決定するプロセスを含む請求項11記載の音声応答プログラムを格納した記憶媒体。
If the calling ID is not registered as a response history in the storage means, it further includes a response format designation instruction process for allowing the caller to designate a response format;
The response process is:
12. A storage medium storing a voice response program according to claim 11, further comprising a process of determining a response format based on a history of the number of responses retrieved by the history retrieval process for an incoming call having a caller ID.
前記発信者に対する応答時に所定の時間無音であることを検出する無音時間検出プロセスを更に有し、
前記応答プロセスは、
前記無音時間検出プロセスにおいて所定の時間無音である場合に、応答形式を変更するプロセス、または、音声認識の成功/失敗により応答形式を変更するプロセス、または、発信者の操作により応答形式を変更するプロセスのうちのいずれか、または、複数のプロセスを実行する請求項11記載の音声応答プログラムを格納した記憶媒体。
A silence time detection process for detecting silence for a predetermined time when responding to the caller;
The response process is:
When there is no sound for a predetermined time in the silent time detection process, the response format is changed, the response format is changed by the success / failure of voice recognition, or the response format is changed by the operation of the caller. The storage medium storing the voice response program according to claim 11, wherein one or more of the processes are executed.
JP25564299A 1999-09-09 1999-09-09 Voice response method and apparatus, and storage medium storing voice response program Expired - Fee Related JP3608449B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25564299A JP3608449B2 (en) 1999-09-09 1999-09-09 Voice response method and apparatus, and storage medium storing voice response program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25564299A JP3608449B2 (en) 1999-09-09 1999-09-09 Voice response method and apparatus, and storage medium storing voice response program

Publications (2)

Publication Number Publication Date
JP2001086243A JP2001086243A (en) 2001-03-30
JP3608449B2 true JP3608449B2 (en) 2005-01-12

Family

ID=17281593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25564299A Expired - Fee Related JP3608449B2 (en) 1999-09-09 1999-09-09 Voice response method and apparatus, and storage medium storing voice response program

Country Status (1)

Country Link
JP (1) JP3608449B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167715A (en) * 2001-11-29 2003-06-13 Ricoh Co Ltd Method for displaying communication history among processes, program for making computer execute the same, image formation device, and image formation system
US20040264677A1 (en) * 2003-06-30 2004-12-30 Horvitz Eric J. Ideal transfer of call handling from automated systems to human operators based on forecasts of automation efficacy and operator load
JP4992925B2 (en) * 2009-03-23 2012-08-08 トヨタ自動車株式会社 Spoken dialogue apparatus and program
JP2015049337A (en) * 2013-08-30 2015-03-16 株式会社東芝 Voice response device, voice response program and voice response method
JP6787269B2 (en) 2017-07-21 2020-11-18 トヨタ自動車株式会社 Speech recognition system and speech recognition method

Also Published As

Publication number Publication date
JP2001086243A (en) 2001-03-30

Similar Documents

Publication Publication Date Title
JP3591052B2 (en) Private telephone system and information processing method thereof
JP3608449B2 (en) Voice response method and apparatus, and storage medium storing voice response program
JPH08237371A (en) Computerized telephone set and its method
JPH05276555A (en) Telephone controller and telephone exchange
JPS63211949A (en) Telephone set
JP3211111B2 (en) Mobile phone with recording function during absence
JP3315778B2 (en) Phone with answering machine
JPH08242280A (en) Voice mail device
JP2882401B2 (en) Voice storage device, voice storage method, and recording medium storing voice storage program
JPH09162973A (en) Multimedia communication method/system
JP2006238132A (en) Apparatus and program for controlling incoming call
JP2005079772A (en) Automatic answering telephone system
JP2001346236A (en) Voice response telephone call transfer system
JPH09214599A (en) Specific party call reception method and telephone set with function of specific party call reception
JPH0795281A (en) Automatic answering telephone system
JPH0685901A (en) Isdn key telephone system
JPH03135147A (en) Automatic answering telephone function system in communication terminal equipment
JPH0468741A (en) Automatic answering telephone set
JP3245561B2 (en) Key telephone device and incoming call response method
JP2000125000A (en) Incoming call procedure automatic selection device by caller's number
JP3158764B2 (en) Facsimile machine
JPH0936960A (en) Id identification terminal
JPH02151159A (en) Automatic answering telephone set
JPH07221833A (en) Voice recognition telephone system
JP2000188637A (en) Message storing and reproducing device and method therefor

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041004

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071022

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees