JP4197344B2 - 音声対話システム - Google Patents
音声対話システム Download PDFInfo
- Publication number
- JP4197344B2 JP4197344B2 JP2006042422A JP2006042422A JP4197344B2 JP 4197344 B2 JP4197344 B2 JP 4197344B2 JP 2006042422 A JP2006042422 A JP 2006042422A JP 2006042422 A JP2006042422 A JP 2006042422A JP 4197344 B2 JP4197344 B2 JP 4197344B2
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- dialog
- voice
- state
- dialog state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000004044 response Effects 0.000 claims description 46
- 238000010586 diagram Methods 0.000 claims description 42
- 238000000034 method Methods 0.000 claims description 30
- 238000012546 transfer Methods 0.000 claims description 30
- 230000003993 interaction Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 12
- 230000002452 interceptive effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 12
- 230000007704 transition Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000000737 periodic effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000007474 system interaction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Description
<対話例1>
システム:列車案内です。問い合わせ内容を、料金、時刻、始発、終電の4つの中よりお選びください。
利用者:時刻。
システム:出発駅をどうぞ。
利用者:東京。
システム:到着駅をどうぞ。
利用者:大阪。
システム:出発時刻、到着時刻のどちらを指定しますか?
利用者:出発時刻。
システム:出発時刻は何時ですか?
システム:列車案内です。ご質問をどうぞ。
利用者:東京から京都までいくらかかりますか? [料金に関する問い合わせ]
システム:東京から京都までの料金でよろしいですか?
利用者:やっぱり大阪までの時刻を調べたいのですが。 [時刻に関する問い合わせ]
システム:出発時刻、または、到着時刻は何時ですか?
利用者:21時ごろ出発で。
システム:東京から大阪まで、21時ごろ出発でよろしいですか?
利用者:新幹線の終電を教えてください。 [終電に関する問い合わせ]
システム:東京から大阪まで、新幹線の終電でよろしいですか?
利用者:はい。
(1) 利用者からの音声による問い合わせに応答する音声対話システムであって、
前記利用者からの音声を認識して前記問い合わせに対する応答を行う音声対話部と、
前記音声対話部と前記利用者の対話内容を記憶する対話履歴ログと、
各対話状態をあらかじめ定義する対話状態図定義ファイルと、
前記利用者と前記音声対話部との対話状態を推定するための対話状態判別モデルと、
前記音声対話部が応答不能と判断したことに応じて、前記対話履歴ログ、前記対話状態図定義ファイル、および前記対話状態判別モデルから前記利用者と前記音声対話部との現在の対話状態を推定する対話情報解析部と、
前記推定した対話状態を視覚的にオペレータに提示する対話状態表示部と、
を備える音声対話システムを提供する。
(2)前記対話履歴ログは、前記利用者との対話内容として、サービス開始からオペレータ転送発生までの音声認識結果、前記音声認識結果に対する信頼度、前記音声認識結果の入力済みとなった項目、応答文またはそのID、サービスの開始、およびサービス終了のうち少なくともいずれか一つを含む、(1)に記載の音声対話システムを提供する。
利用者からの音声による問い合わせに応答する音声対話のための方法であって、
前記利用者からの音声を認識して前記問い合わせに対する応答を行う音声対話ステップと、
前記音声対話ステップにおける前記利用者との対話履歴を対話履歴ログに記憶する対話履歴ログ記憶ステップと、
前記音声対話ステップにおいて応答不能と判断したことに応じて、前記対話履歴ログと、各対話状態をあらかじめ定義する対話状態図定義ファイルと、前記利用者と前記音声対話ステップにおける対話状態を推定するための対話状態判別モデルと、から前記利用者の前記音声対話ステップにおける現在の対話状態を推定する対話情報解析ステップと、
前記推定した対話状態を視覚的にオペレータに提示する対話状態表示ステップと、
を含む方法を提供する。
利用者からの音声による問い合わせに応答する音声対話のためのコンピュータ・プログラムであって、
前記利用者からの音声を認識して前記問い合わせに対する応答を行う音声対話ステップと、
前記音声対話ステップにおける前記利用者との対話履歴を対話履歴ログに記憶する対話履歴ログ記憶ステップと、
前記音声対話ステップにおいて応答不能と判断したことに応じて、前記対話履歴ログと、前記利用者と前記音声対話ステップにおける対話状態を推定するための対話状態判別モデルと、各対話状態をあらかじめ定義する対話状態図定義ファイルとから、前記利用者の前記音声対話ステップにおける現在の対話状態を推定する対話情報解析ステップと、
前記推定した対話状態を視覚的にオペレータに提示する対話状態表示ステップと、
をコンピュータに実行させる、コンピュータ・プログラムを提供する。
また、本発明は、このようなコンピュータ・プログラムを記録したコンピュータ可読媒体を含むプログラム製品も提供する。
(1)システムの仕様などからオペレータに表示するための対話状態を定義し、サービス開始から終了までの遷移図を作成する。
(2)システムの対話履歴ログから現在の対話状態を判別するモデルを作成する。
(3) (1)、(2)の手順を用いてオペレータ転送発生時に現在の対話状態を推定し、遷移図上で現在の対話状態を強調表示する。
(4)オペレータ転送発生時に、入力済みの項目に対して、対話履歴ログを用いて、その信頼度を計算し、信頼度に応じて色を変えて表示する。
(5)オペレータ転送発生時に、入力済みの項目に対して、対話履歴ログを用いて、入力履歴を取得し、過去N回(N>1)の履歴に対して、時間的に古いものに関しては、文字サイズを例えば小さく変えて表示する。
・音声認識結果
・音声認識結果に対するスコア(音声認識スコア)
・音声認識の結果入力済みとなっている項目(正しく認識されたどうかにはよらない)
・応答文、または応答文を表すID(応答文ID)
・システムのサービス開始、終了を示す情報
<対話履歴ログ12の例>
20050717 14:30:21 サービス開始
20050717 14:30:22 システム応答文ID:1
20050717 14:30:22 システム応答:列車案内システムにようこそ。質問をどうぞ。
20050717 14:30:29 音声認識結果:料金を教えてください。
20050717 14:30:29 音声認識スコア:料金=0、を=50、教えて=50、ください=70、全体=73
20050717 14:30:29 入力済項目:検索内容=料金、出発駅=指定なし、到着駅=指定なし、時刻=指定なし
20050717 14:30:33 システム応答文ID:2
20050717 14:30:33 システム応答:料金案内ですね。出発駅をどうぞ。
20050717 14:30:40 音声認識結果:出発は東京です。
20050717 14:30:40 音声認識スコア:出発=80、は=50、東京=90、全体=78
20050717 14:30:40 入力済項目:検索内容=料金、出発駅=東京、到着駅=指定なし
20050717 14:31:35 システム応答文ID:99
20050717 14:31:35 システム応答:ご利用ありがとうございました。
20050717 14:31:40 サービス終了
ここでは、上記列車料金・時刻検索システムの仕様を元に以下のように対話状態を定義する。
・サービス開始
・サービス選択中
・料金検索入力中
・料金検索確認中
・時刻検索入力中
・時刻検索確認中
・始発検索入力中
・始発検索確認中
・終電検索入力中
・終電検索確認中
・定期検索入力中
・定期検索確認中
・サービス継続確認中
・サービス終了
<表示すべき入力項目例>
・出発駅
・到着駅
・ご利用日
・時刻
・列車名
・列車種別
・人数
・定期種別
・定期期間
<状態と表示すべき入力項目の関連付けの例>
・時刻検索入力中={出発駅、到着駅、ご利用日、時刻、列車名、列車種別}
・定期検索入力中={出発駅、到着駅、定期種別、定期期間}
S(t)=F(ResID(t),ResID(t−1),S(t−1))
と表せる。
ここで、
Pr(Si |ResID(t),ResID(t−1)): 対話ログ履歴より求められた、時刻tにおける応答文IDがResID(t),時刻t−1における応答文IDがResID(t−1)であるときの、対話状態がSiである確率。
Pr(Si | ResID(t)): 対話ログ履歴より求められた、時刻tにおける応答文IDがResID(t)であるときの、対話状態がSiである確率。
対話ログ履歴より推定する関数Fの例としては、図4のフローチャートに示すような関数を考える。
Pr(Si |ResID(t))>0となるSiが存在するかどうかを判断し(ステップS13)、そのようなSiが存在すれば、Pr(Si |ResID(t))が最大となるSiを出力とし、処理を終了する。
Pr(状態1 |ResID(t),ResID(t−1))=0.5、
Pr(状態2 |ResID(t),ResID(t−1))=0.3、
Pr(状態3 |ResID(t),ResID(t−1))=0.2の場合、
max(0.5,0.3,0.2)=0.5なので、S(t)=状態1となる。
Pr(Si |ResID(t),ResID(t−1))>0となるSiが存在せず、
Pr(状態1 |ResID(t))=0.2、
Pr(状態2 |ResID(t))=0.7、
Pr(状態3 |ResID(t))=0.2の場合、
max(0.2,0.7,0.2)=0.7なので、S(t)=状態2となる。
S(t)=F(時刻t0から時刻tまでのログ, 時刻t0から時刻tまでの対話状態)と表すことができる。先の例では、Fの入力パラメータは、ResID(応答文ID)と過去の状態Sであったが、これに利用者の発話の認識結果などを追加することなども考えられる。また、対話状態判別モデル13は、先の例のように既存のログから学習を行う統計モデルでもよいし、後述するようなルールベースであってもよい。
初期値として入力済み: 初期値としてシステムにより入力されている。
入力済み(信頼度低): 音声認識のスコアが閾値以下である。または、入力済みの項
目が直近のN発話において、一定回数以上更新されている。
入力済み(信頼度高): 音声認識のスコアが閾値以上である。
確認済み: 指定された情報が確認済みである。
システム: 列車案内です。ご用件をどうぞ。
利用者: 東京から神戸までの終電を知りたいんだけど。
システム: 東京から神目までの終電でよろしいですか?
利用者: 神戸までにして。
システム: 東京から神目までの終電でよろしいですか?
利用者: 神戸まで。
システム: 東京から甲奴までの終電でよろしいですか? <対話状態1>
システム: 列車案内です。ご用件をどうぞ。
利用者: 東京から大阪までの終電を知りたいんだけど。
システム: 東京から大阪までの終電でよろしいですか?
利用者: はい。
システム: ご利用日は今日でよろしいですか?
利用者: 明日でお願いします。
システム: ご利用日は明日、新幹線、のぞみのご利用でよろしいですか?
利用者: オペレータに代わってくれますか? <対話状態2>
以下、ルールベースの対話状態判別モデル13の例を示す。ルールベースの対話状態判別モデル13では、関数Fは対話状態を決定するルールによりS(t)を得る。以下では単純な例として、転送発生時tの応答文ID(ResID(t))、時刻t−1の対話状態S(t−1)から、転送発生時の対話状態S(t)を得るものを紹介する。図9は、転送発生時の応答文IDと対応する応答文、およびそのときの対話状態の関係を表で表したものである。
2a 電話機
2b パソコン
3 回線制御部
4 オペレータ端末選択部
5a、5b、5c オペレータ端末
10 利用者
11 音声対話部
12 対話履歴ログ
13 対話状態判別モデル
14 対話状態図定義ファイル
15 対話情報解析部
16 対話情報表示部
17 オペレータ
21 対話状態遷移図の例
22 入力項目
Claims (21)
- 利用者からの音声による問い合わせに応答する音声対話システムであって、
前記利用者からの音声を認識して前記問い合わせに対する応答を行う音声対話部と、
前記音声対話部と前記利用者の対話内容を記憶する対話履歴ログと、
各対話状態と少なくとも表示に関する情報とを定義づける対話状態図定義ファイルと、
現在の対話状態を、サービス開始時刻から現在時刻までの対話履歴ログと前記サービス開始時刻から前記現在時刻までの対話状態とに応じて判別するための対話状態判別モデルと、
前記音声対話部が応答不能と判断したことに応じて、前記対話履歴ログおよび前記対話状態判別モデルに基づいて前記利用者と前記音声対話部との現在の対話状態を推定する対話情報解析部と、
前記対話状態図定義ファイルに応じた対話状態図が表示され、該対話状態図に前記推定した対話状態を視覚的にオペレータに提示する対話状態表示部と、
を備える音声対話システム。 - 前記対話履歴ログは、前記利用者との対話内容として、サービス開始からオペレータ転送発生までの音声認識結果、前記音声認識結果に対する信頼度、前記音声認識結果の入力済みとなった項目、応答文またはそのID、サービスの開始、およびサービス終了のうち少なくともいずれか一つを含む、請求項1に記載の音声対話システム。
- 前記対話状態図定義ファイルは、各対話状態とその表示のための配置情報、表示対象となる入力項目、および各対話状態において表示すべき入力項目を定義する、請求項1に記載の音声対話システム。
- 前記対話状態判別モデルは、前記対話履歴ログから現在の対話状態を推定するための経験的なデータの集合またはアルゴリズムの集合を含む、請求項1に記載の音声対話システム。
- 前記対話情報解析部は、前記利用者の入力済みの項目の信頼度の計算、および、入力履歴の推定を行う、請求項1に記載の音声対話システム。
- 前記対話状態表示部は、前記対話状態図の上で前記現在の対話状態を強調表示する、請求項1に記載の音声対話システム。
- 前記対話状態表示部は、前記利用者の入力済みの項目に対して、前記対話履歴ログを用いて前記音声対話部の音声認識結果の信頼度を取得し、前記信頼度に応じて色を変えて表示する、請求項1に記載の音声対話システム。
- 前記対話状態表示部は、前記利用者の入力済みの項目に対して、前記対話履歴ログを用いて前記利用者の入力履歴を取得し、前記入力履歴の順に応じて文字サイズを変えて表示する、請求項1に記載の音声対話システム。
- 利用者からの音声による問い合わせに応答する音声対話のための方法であって、
前記利用者からの音声を認識して前記問い合わせに対する応答を行う音声対話ステップと、
前記音声対話ステップにおける前記利用者のとの対話履歴を対話履歴ログに記憶する対話履歴ログ記憶ステップと、
前記音声対話ステップにおいて応答不能と判断したことに応じて、前記対話履歴ログと、現在の対話状態を、サービス開始時刻から現在時刻までの対話履歴ログと前記サービス開始時刻から前記現在時刻までの対話状態とに応じて判別するための対話状態判別モデルと、に基づいて前記利用者の前記音声対話ステップにおける現在の対話状態を推定する対話情報解析ステップと、
各対話状態と少なくとも表示に関する情報とを定義づける対話状態図定義ファイルに応じた対話状態図を表示して、該対話状態図に前記推定した対話状態を視覚的にオペレータに提示する対話状態表示ステップと、
を含む方法。 - 前記対話履歴ログは、前記利用者の問い合わせ内容として、サービス開始からオペレータ転送発生までの音声認識結果、前記音声認識結果に対する信頼度、前記音声認識結果の入力済みとなった項目、応答文またはそのID、サービスの開始、およびサービス終了のうち少なくともいずれか一つを含む、請求項9に記載の方法。
- 前記対話状態図定義ファイルは、各対話状態とその表示のための配置情報、表示対象となる入力項目、および各対話状態において表示すべき入力項目を定義する、請求項9に記載の方法。
- 前記対話状態判別モデルは、前記対話履歴ログから現在の対話状態を推定するための経験的なデータの集合またはアルゴリズムの集合を含む、請求項9に記載の方法。
- 前記対話情報解析ステップは、前記利用者の入力済みの項目の信頼度の計算、および、入力履歴の推定を行う、請求項9に記載の方法。
- 前記対話状態表示ステップは、前記対話状態図の上で前記現在の対話状態を強調表示する、請求項9に記載の方法。
- 利用者からの音声による問い合わせに応答する音声対話のためのコンピュータ・プログラムであって、
前記利用者からの音声を認識して前記問い合わせに対する応答を行う音声対話ステップと、
前記音声対話ステップにおける前記利用者との対話履歴を対話履歴ログに記憶する対話履歴ログ記憶ステップと、
前記音声対話ステップにおいて応答不能と判断したことに応じて、前記対話履歴ログと、現在の対話状態を、サービス開始時刻から現在時刻までの対話履歴ログと前記サービス開始時刻から前記現在時刻までの対話状態とに応じて判別するための対話状態判別モデルとに基づいて、前記利用者の前記音声対話ステップにおける現在の対話状態を推定する対話情報解析ステップと、
各対話状態と少なくとも表示に関する情報とを定義づける対話状態図定義ファイルに応じた対話状態図を表示して、該対話状態図に前記推定した対話状態を視覚的にオペレータに提示する対話状態表示ステップと、
をコンピュータに実行させる、コンピュータ・プログラム。 - 前記対話履歴ログは、前記利用者との対話内容として、サービス開始からオペレータ転送発生までの音声認識結果、前記音声認識結果に対する信頼度、前記音声認識結果の入力済みとなった項目、応答文またはそのID、サービスの開始、およびサービス終了のうち少なくともいずれか一つを含む、請求項15に記載のコンピュータ・プログラム。
- 前記対話状態図定義ファイルは、各対話状態とその表示のための配置情報、表示対象となる入力項目、および各対話状態において表示すべき入力項目を定義する、請求項15に記載のコンピュータ・プログラム。
- 前記対話状態判別モデルは、前記対話履歴ログから現在の対話状態を推定するための経験的なデータの集合またはアルゴリズムの集合を含む、請求項15に記載のコンピュータ・プログラム。
- 前記対話情報解析ステップは、前記利用者の入力済みの項目の信頼度の計算、および、入力履歴の推定を行う、請求項15に記載のコンピュータ・プログラム。
- 前記対話状態表示ステップは、前記対話状態図の上で前記現在の対話状態を強調表示する、請求項15に記載のコンピュータ・プログラム。
- 利用者からの音声による問い合わせに応答する音声対話のためのコンピュータ・プログラムが記録されたコンピュータ可読媒体であって、
コンピュータを、
前記利用者からの音声を認識して前記問い合わせに対する応答を行う音声対話コード手段と、
前記音声対話コード手段における前記利用者との対話履歴を対話履歴ログに記憶する対話履歴ログ記憶コード手段と、
前記音声対話コード手段において応答不能と判断したことに応じて、前記対話履歴ログと、現在の対話状態を、サービス開始時刻から現在時刻までの対話履歴ログと前記サービス開始時刻から前記現在時刻までの対話状態とに応じて判別するための対話状態判別モデルとに基づいて、前記利用者の前記音声対話コード手段における現在の対話状態を推定する対話情報解析コード手段と、
各対話状態と少なくとも表示に関する情報とを定義づける対話状態図定義ファイルに応じた対話状態図を表示して、該対話状態図に前記推定した対話状態を視覚的にオペレータに提示する対話状態表示コード手段と、
して機能させるための前記コンピュータ・プログラムを記録した、コンピュータ可読媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006042422A JP4197344B2 (ja) | 2006-02-20 | 2006-02-20 | 音声対話システム |
US11/673,126 US8095371B2 (en) | 2006-02-20 | 2007-02-09 | Computer-implemented voice response method using a dialog state diagram to facilitate operator intervention |
US12/253,849 US8145494B2 (en) | 2006-02-20 | 2008-10-17 | Voice response system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006042422A JP4197344B2 (ja) | 2006-02-20 | 2006-02-20 | 音声対話システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007219385A JP2007219385A (ja) | 2007-08-30 |
JP4197344B2 true JP4197344B2 (ja) | 2008-12-17 |
Family
ID=38429422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006042422A Expired - Fee Related JP4197344B2 (ja) | 2006-02-20 | 2006-02-20 | 音声対話システム |
Country Status (2)
Country | Link |
---|---|
US (2) | US8095371B2 (ja) |
JP (1) | JP4197344B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101816229B1 (ko) * | 2010-05-19 | 2018-01-08 | 구글 엘엘씨 | 이력 데이터를 이용한 연락처 정보의 명확화 |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9635154B1 (en) * | 2008-02-08 | 2017-04-25 | West Corporation | Real-time monitoring of caller experience for a group of steps in a call flow |
US9094485B1 (en) * | 2008-02-08 | 2015-07-28 | West Corporation | Real-time adjustment for better caller experience |
DE102008046431A1 (de) * | 2008-09-09 | 2010-03-11 | Deutsche Telekom Ag | Sprachdialogsystem mit Reject-Vermeidungsverfahren |
JP5035208B2 (ja) * | 2008-10-10 | 2012-09-26 | 株式会社デンソー | 情報処理装置,インタフェース提供方法およびプログラム |
US8943394B2 (en) * | 2008-11-19 | 2015-01-27 | Robert Bosch Gmbh | System and method for interacting with live agents in an automated call center |
US8934618B2 (en) * | 2008-12-29 | 2015-01-13 | Avaya Inc. | Method for analysing an interactive voice response system |
US8379804B2 (en) * | 2009-01-07 | 2013-02-19 | International Business Machines Corporation | Using a complex events processor (CEP) to direct the handling of individual call sessions by an interactive voice response (IVR) system |
US8798983B2 (en) | 2009-03-30 | 2014-08-05 | Microsoft Corporation | Adaptation for statistical language model |
JP2011033680A (ja) * | 2009-07-30 | 2011-02-17 | Sony Corp | 音声処理装置及び方法、並びにプログラム |
US20110246194A1 (en) * | 2010-03-30 | 2011-10-06 | Nvoq Incorporated | Indicia to indicate a dictation application is capable of receiving audio |
US8848882B2 (en) * | 2010-07-07 | 2014-09-30 | Verizon Patent And Licensing Inc. | System for and method of measuring caller interactions during a call session |
US8645136B2 (en) * | 2010-07-20 | 2014-02-04 | Intellisist, Inc. | System and method for efficiently reducing transcription error using hybrid voice transcription |
KR101169045B1 (ko) * | 2010-08-24 | 2012-07-26 | (주) 콜게이트 | 음성-화면 ars 서비스 시스템 및 그 제공방법과 컴퓨터 판독 가능한 기록매체 |
JP5431282B2 (ja) * | 2010-09-28 | 2014-03-05 | 株式会社東芝 | 音声対話装置、方法、プログラム |
JP6260138B2 (ja) * | 2013-08-12 | 2018-01-17 | 日本電気株式会社 | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム |
US9413891B2 (en) | 2014-01-08 | 2016-08-09 | Callminer, Inc. | Real-time conversational analytics facility |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
CN105744090A (zh) * | 2014-12-09 | 2016-07-06 | 阿里巴巴集团控股有限公司 | 语音信息处理方法及装置 |
US10482184B2 (en) | 2015-03-08 | 2019-11-19 | Google Llc | Context-based natural language processing |
WO2016143131A1 (ja) * | 2015-03-12 | 2016-09-15 | 株式会社 東芝 | 対話支援装置、方法およびプログラム、および端末 |
WO2016147400A1 (ja) * | 2015-03-19 | 2016-09-22 | 株式会社 東芝 | 対話データ収集システム、対話データ収集方法、対話データ収集プログラム、対話データ収集支援装置、対話データ収集支援方法および対話データ収集支援プログラム |
EP3369175B1 (en) * | 2015-10-28 | 2024-01-10 | DTS, Inc. | Object-based audio signal balancing |
US10063702B2 (en) * | 2015-12-30 | 2018-08-28 | Shanghai Xiaoi Robot Technology Co., Ltd. | Intelligent customer service systems, customer service robots, and methods for providing customer service |
US9978367B2 (en) * | 2016-03-16 | 2018-05-22 | Google Llc | Determining dialog states for language models |
US10827064B2 (en) | 2016-06-13 | 2020-11-03 | Google Llc | Automated call requests with status updates |
JP6736691B2 (ja) | 2016-06-13 | 2020-08-05 | グーグル エルエルシー | 人間のオペレータへのエスカレーション |
JP6470246B2 (ja) * | 2016-11-15 | 2019-02-13 | ソフトバンク株式会社 | ユーザーサポートシステム、ユーザーサポートプログラム及びユーザーサポート方法 |
US11093716B2 (en) * | 2017-03-31 | 2021-08-17 | Nec Corporation | Conversation support apparatus, conversation support method, and computer readable recording medium |
US20180314532A1 (en) * | 2017-04-26 | 2018-11-01 | Google Inc. | Organizing messages exchanged in human-to-computer dialogs with automated assistants |
JP6787269B2 (ja) * | 2017-07-21 | 2020-11-18 | トヨタ自動車株式会社 | 音声認識システム及び音声認識方法 |
JP2019046267A (ja) * | 2017-09-04 | 2019-03-22 | トヨタ自動車株式会社 | 情報提供方法、情報提供システム、および情報提供装置 |
US11037554B1 (en) * | 2017-09-12 | 2021-06-15 | Wells Fargo Bank, N.A. | Network of domain knowledge based conversational agents |
KR102485253B1 (ko) * | 2017-11-10 | 2023-01-06 | 현대자동차주식회사 | 대화 시스템 및 그 제어방법 |
US10885119B2 (en) | 2017-11-24 | 2021-01-05 | Wipro Limited | Method and system for processing multimodal user queries |
JP7004955B2 (ja) * | 2017-12-11 | 2022-01-21 | トヨタ自動車株式会社 | サービス提供装置、サービス提供プログラム及び音声認識によるサービスを提供する方法 |
CN110879837B (zh) * | 2018-09-06 | 2022-01-14 | 华为技术有限公司 | 一种信息处理方法及装置 |
US10908883B2 (en) * | 2018-11-13 | 2021-02-02 | Adobe Inc. | Voice interaction development tool |
US10847156B2 (en) | 2018-11-28 | 2020-11-24 | Adobe Inc. | Assembled voice interaction |
US11043214B1 (en) * | 2018-11-29 | 2021-06-22 | Amazon Technologies, Inc. | Speech recognition using dialog history |
US11017771B2 (en) | 2019-01-18 | 2021-05-25 | Adobe Inc. | Voice command matching during testing of voice-assisted application prototypes for languages with non-phonetic alphabets |
US10964322B2 (en) | 2019-01-23 | 2021-03-30 | Adobe Inc. | Voice interaction tool for voice-assisted application prototypes |
US20220013119A1 (en) * | 2019-02-13 | 2022-01-13 | Sony Group Corporation | Information processing device and information processing method |
US11580970B2 (en) * | 2019-04-05 | 2023-02-14 | Samsung Electronics Co., Ltd. | System and method for context-enriched attentive memory network with global and local encoding for dialogue breakdown detection |
KR20210114480A (ko) | 2019-05-06 | 2021-09-23 | 구글 엘엘씨 | 자동 통화 시스템 |
US11133006B2 (en) * | 2019-07-19 | 2021-09-28 | International Business Machines Corporation | Enhancing test coverage of dialogue models |
CN111833854B (zh) * | 2020-01-08 | 2024-07-16 | 北京嘀嘀无限科技发展有限公司 | 一种人机交互方法与终端、计算机可读存储介质 |
WO2021188126A1 (en) | 2020-03-20 | 2021-09-23 | Google Llc | Semi-delegated calling by an automated assistant on behalf of human participant |
US11303749B1 (en) | 2020-10-06 | 2022-04-12 | Google Llc | Automatic navigation of an interactive voice response (IVR) tree on behalf of human user(s) |
CN112329907A (zh) * | 2020-12-24 | 2021-02-05 | 北京百度网讯科技有限公司 | 对话处理方法、装置、电子设备和存储介质 |
Family Cites Families (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05216618A (ja) * | 1991-11-18 | 1993-08-27 | Toshiba Corp | 音声対話システム |
EP0543329B1 (en) * | 1991-11-18 | 2002-02-06 | Kabushiki Kaisha Toshiba | Speech dialogue system for facilitating human-computer interaction |
JPH0876965A (ja) * | 1994-09-07 | 1996-03-22 | Toshiba Corp | 音声認識システム |
DE69617544T2 (de) * | 1995-01-18 | 2002-08-08 | Koninklijke Philips Electronics N.V., Eindhoven | Verfahren und -vorrichtung zur erzeugung eines mensch/maschine-dialogs mit bedienereingriff |
JP3810551B2 (ja) | 1997-03-18 | 2006-08-16 | 株式会社エヌ・ティ・ティ・データ | 音声認識システム、コールセンタシステム、音声認識方法及び記録媒体 |
WO1998050907A1 (en) * | 1997-05-06 | 1998-11-12 | Speechworks International, Inc. | System and method for developing interactive speech applications |
US6006183A (en) | 1997-12-16 | 1999-12-21 | International Business Machines Corp. | Speech recognition confidence level display |
US6047060A (en) * | 1998-02-20 | 2000-04-04 | Genesys Telecommunications Laboratories, Inc. | Method and apparatus for enabling full interactive monitoring of calls to and from a call-in center |
JP3125746B2 (ja) * | 1998-05-27 | 2001-01-22 | 日本電気株式会社 | 人物像対話装置及び人物像対話プログラムを記録した記録媒体 |
DE19830007A1 (de) * | 1998-06-24 | 1999-12-30 | Deutsche Telekom Ag | Verfahren zum Betreiben eines globalen, virtuellen Call-Centers |
US6219643B1 (en) * | 1998-06-26 | 2001-04-17 | Nuance Communications, Inc. | Method of analyzing dialogs in a natural language speech recognition system |
US6377949B1 (en) * | 1998-09-18 | 2002-04-23 | Tacit Knowledge Systems, Inc. | Method and apparatus for assigning a confidence level to a term within a user knowledge profile |
US6278454B1 (en) * | 1998-09-24 | 2001-08-21 | Ericsson Inc. | Call progress graphical user interface |
US6246981B1 (en) * | 1998-11-25 | 2001-06-12 | International Business Machines Corporation | Natural language task-oriented dialog manager and method |
US6356869B1 (en) * | 1999-04-30 | 2002-03-12 | Nortel Networks Limited | Method and apparatus for discourse management |
TW501046B (en) * | 1999-06-11 | 2002-09-01 | Ind Tech Res Inst | A portable dialogue manager |
US6836537B1 (en) * | 1999-09-13 | 2004-12-28 | Microstrategy Incorporated | System and method for real-time, personalized, dynamic, interactive voice services for information related to existing travel schedule |
US6510411B1 (en) * | 1999-10-29 | 2003-01-21 | Unisys Corporation | Task oriented dialog model and manager |
EP1240642B1 (en) * | 1999-12-20 | 2008-08-20 | BRITISH TELECOMMUNICATIONS public limited company | Learning of dialogue states and language model of spoken information system |
US6763104B1 (en) * | 2000-02-24 | 2004-07-13 | Teltronics, Inc. | Call center IVR and ACD scripting method and graphical user interface |
US6707904B1 (en) * | 2000-02-25 | 2004-03-16 | Teltronics, Inc. | Method and system for collecting reports for call center monitoring by supervisor |
EP1275042A2 (en) * | 2000-03-06 | 2003-01-15 | Kanisa Inc. | A system and method for providing an intelligent multi-step dialog with a user |
US7143040B2 (en) * | 2000-07-20 | 2006-11-28 | British Telecommunications Public Limited Company | Interactive dialogues |
US7024348B1 (en) * | 2000-09-28 | 2006-04-04 | Unisys Corporation | Dialogue flow interpreter development tool |
JP2002140243A (ja) | 2000-10-31 | 2002-05-17 | Arcadia:Kk | ネットワークシステム、処理管理装置 |
GB0030078D0 (en) * | 2000-12-09 | 2001-01-24 | Hewlett Packard Co | Voice service system and method |
JP3857047B2 (ja) * | 2000-12-28 | 2006-12-13 | 富士通株式会社 | 音声対話システム及び音声対話方法 |
US7003079B1 (en) * | 2001-03-05 | 2006-02-21 | Bbnt Solutions Llc | Apparatus and method for monitoring performance of an automated response system |
US6937705B1 (en) * | 2001-03-05 | 2005-08-30 | Verizon Corporate Services Group Inc. | Apparatus and method for visually representing events in calls handled by an automated response system |
US6879685B1 (en) * | 2001-03-05 | 2005-04-12 | Verizon Corporate Services Group Inc. | Apparatus and method for analyzing routing of calls in an automated response system |
US6922466B1 (en) * | 2001-03-05 | 2005-07-26 | Verizon Corporate Services Group Inc. | System and method for assessing a call center |
USRE45096E1 (en) * | 2001-04-19 | 2014-08-26 | British Telecommunications Public Limited Company | Voice response system |
EP1255190A1 (en) * | 2001-05-04 | 2002-11-06 | Microsoft Corporation | Interface control |
EP1378886A1 (en) * | 2002-07-02 | 2004-01-07 | Ubicall Communications en abrégé "UbiCall" S.A. | Speech recognition device |
US7177815B2 (en) * | 2002-07-05 | 2007-02-13 | At&T Corp. | System and method of context-sensitive help for multi-modal dialog systems |
US7542902B2 (en) * | 2002-07-29 | 2009-06-02 | British Telecommunications Plc | Information provision for call centres |
US7386454B2 (en) * | 2002-07-31 | 2008-06-10 | International Business Machines Corporation | Natural error handling in speech recognition |
US7080323B2 (en) * | 2002-10-03 | 2006-07-18 | Sbc Properties, L.P. | Dynamic and adaptable system and method for selecting a user interface dialogue model |
US20040162724A1 (en) * | 2003-02-11 | 2004-08-19 | Jeffrey Hill | Management of conversations |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
US7103553B2 (en) * | 2003-06-04 | 2006-09-05 | Matsushita Electric Industrial Co., Ltd. | Assistive call center interface |
US20040264677A1 (en) * | 2003-06-30 | 2004-12-30 | Horvitz Eric J. | Ideal transfer of call handling from automated systems to human operators based on forecasts of automation efficacy and operator load |
US20050010418A1 (en) * | 2003-07-10 | 2005-01-13 | Vocollect, Inc. | Method and system for intelligent prompt control in a multimodal software application |
US20050069122A1 (en) * | 2003-09-30 | 2005-03-31 | Xiaofan Lin | System and method for operator assisted automated call handling |
US8189762B2 (en) * | 2003-10-30 | 2012-05-29 | Hewlett-Packard Development Company, L.P. | System and method for interactive voice response enhanced out-calling |
US7945903B1 (en) * | 2004-04-16 | 2011-05-17 | At&T Intellectual Property Ii, L.P. | System and method for converting graphical call flows into finite state machines |
US7398212B2 (en) * | 2004-04-22 | 2008-07-08 | Hewlett-Packard Development Company, L.P. | System and method for quality of service management with a call handling system |
US8687792B2 (en) * | 2004-04-22 | 2014-04-01 | Hewlett-Packard Development Company, L.P. | System and method for dialog management within a call handling system |
WO2006040969A1 (ja) * | 2004-10-08 | 2006-04-20 | Matsushita Electric Industrial Co., Ltd. | 対話支援装置 |
CN1842787B (zh) * | 2004-10-08 | 2011-12-07 | 松下电器产业株式会社 | 对话支援装置 |
JP4679254B2 (ja) * | 2004-10-28 | 2011-04-27 | 富士通株式会社 | 対話システム、対話方法、及びコンピュータプログラム |
US20060095267A1 (en) * | 2004-10-28 | 2006-05-04 | Fujitsu Limited | Dialogue system, dialogue method, and recording medium |
US7881440B2 (en) * | 2004-12-22 | 2011-02-01 | At&T Intellectual Property Ii, L.P. | Method for automatic graphical profiling of a system |
JP2006189626A (ja) * | 2005-01-06 | 2006-07-20 | Fuji Photo Film Co Ltd | 記録装置及び音声記録プログラム |
US20060155526A1 (en) * | 2005-01-10 | 2006-07-13 | At&T Corp. | Systems, Devices, & Methods for automating non-deterministic processes |
US8490015B2 (en) * | 2005-04-15 | 2013-07-16 | Microsoft Corporation | Task dialog and programming interface for same |
US7720684B2 (en) * | 2005-04-29 | 2010-05-18 | Nuance Communications, Inc. | Method, apparatus, and computer program product for one-step correction of voice interaction |
JP4680691B2 (ja) * | 2005-06-15 | 2011-05-11 | 富士通株式会社 | 対話システム |
TWI277948B (en) * | 2005-09-02 | 2007-04-01 | Delta Electronics Inc | Method and system for template inquiry dialogue system |
US20070115920A1 (en) * | 2005-10-18 | 2007-05-24 | Microsoft Corporation | Dialog authoring and execution framework |
US8019057B2 (en) * | 2005-12-21 | 2011-09-13 | Verizon Business Global Llc | Systems and methods for generating and testing interactive voice response applications |
US7924986B2 (en) * | 2006-01-27 | 2011-04-12 | Accenture Global Services Limited | IVR system manager |
US7593522B2 (en) * | 2006-03-09 | 2009-09-22 | At&T Intellectual Property I, L.P. | Call center user interface and methods of using same |
US7872994B2 (en) * | 2006-08-11 | 2011-01-18 | Cisco Technology, Inc. | SIP out-of-dialog REFER mechanism for handoff between front-end and back-end services |
US20080104512A1 (en) * | 2006-10-31 | 2008-05-01 | Motorola, Inc. | Method and apparatus for providing realtime feedback in a voice dialog system |
US9082406B2 (en) * | 2006-11-30 | 2015-07-14 | Robert Bosch Llc | Method and system for extending dialog systems to process complex activities for applications |
-
2006
- 2006-02-20 JP JP2006042422A patent/JP4197344B2/ja not_active Expired - Fee Related
-
2007
- 2007-02-09 US US11/673,126 patent/US8095371B2/en not_active Expired - Fee Related
-
2008
- 2008-10-17 US US12/253,849 patent/US8145494B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101816229B1 (ko) * | 2010-05-19 | 2018-01-08 | 구글 엘엘씨 | 이력 데이터를 이용한 연락처 정보의 명확화 |
Also Published As
Publication number | Publication date |
---|---|
US20070198272A1 (en) | 2007-08-23 |
US8095371B2 (en) | 2012-01-10 |
JP2007219385A (ja) | 2007-08-30 |
US8145494B2 (en) | 2012-03-27 |
US20090141871A1 (en) | 2009-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4197344B2 (ja) | 音声対話システム | |
US20060287868A1 (en) | Dialog system | |
US9575964B2 (en) | Generic virtual personal assistant platform | |
US7318031B2 (en) | Apparatus, system and method for providing speech recognition assist in call handover | |
US8831186B2 (en) | Systems and methods for gathering information | |
JP4679254B2 (ja) | 対話システム、対話方法、及びコンピュータプログラム | |
KR20190011570A (ko) | 휴먼 에이전트에 의하여 보조 되는 무인 대화 서비스 제공 방법 | |
CN111159364B (zh) | 对话系统、对话装置、对话方法以及存储介质 | |
US20060095267A1 (en) | Dialogue system, dialogue method, and recording medium | |
US20180113854A1 (en) | System for automatic extraction of structure from spoken conversation using lexical and acoustic features | |
JP6540414B2 (ja) | 音声処理装置および音声処理方法 | |
KR20190002891A (ko) | 화행 정보를 이용한 대화 처리 방법 및 그 장치 | |
JP2009182433A (ja) | コールセンターの情報提供システム、情報提供装置、情報提供方法及び情報提供プログラム | |
JP2018159729A (ja) | 対話システム構築支援装置、方法、及びプログラム | |
JP3878147B2 (ja) | 端末装置 | |
JP3933813B2 (ja) | 音声対話装置 | |
JP2010182191A (ja) | 帳票入力装置、帳票入力システム、帳票入力方法、及びプログラム | |
JP2003030187A (ja) | 自動通訳システム、会話学習装置、自動通訳装置及びその方法並びにそのプログラム | |
JP2020027441A (ja) | 営業提案システム、営業提案プログラム及び営業提案方法 | |
JP7377668B2 (ja) | 制御装置、制御方法及びコンピュータプログラム | |
CN113822029A (zh) | 客服辅助方法、装置和系统 | |
JP3783936B2 (ja) | 対話型情報提供装置、対話型情報提供処理方法、プログラム及び記録媒体 | |
US8213966B1 (en) | Text messages provided as a complement to a voice session | |
US20240321267A1 (en) | A system and method for delivering domain or use-case switch suggestion for an ongoing conversation | |
US12132863B1 (en) | Artificial intelligence assistance for customer service representatives |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071205 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20071226 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20080123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080229 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20080910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080925 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4197344 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 3 |
|
S202 | Request for registration of non-exclusive licence |
Free format text: JAPANESE INTERMEDIATE CODE: R315201 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131010 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |