JP2007047488A - 対話方法、対話装置、対話プログラムおよび記録媒体 - Google Patents

対話方法、対話装置、対話プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2007047488A
JP2007047488A JP2005232215A JP2005232215A JP2007047488A JP 2007047488 A JP2007047488 A JP 2007047488A JP 2005232215 A JP2005232215 A JP 2005232215A JP 2005232215 A JP2005232215 A JP 2005232215A JP 2007047488 A JP2007047488 A JP 2007047488A
Authority
JP
Japan
Prior art keywords
scenario
dialogue
input
understanding
focal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005232215A
Other languages
English (en)
Other versions
JP4589843B2 (ja
Inventor
Noboru Miyazaki
昇 宮崎
Tetsuo Amakasu
哲郎 甘粕
Teruo Hagino
輝雄 萩野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005232215A priority Critical patent/JP4589843B2/ja
Publication of JP2007047488A publication Critical patent/JP2007047488A/ja
Application granted granted Critical
Publication of JP4589843B2 publication Critical patent/JP4589843B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】複数の対話システムを適切に切替えることにより広い範囲の話題を扱う対話システムを実現する。
【解決手段】入力理解手段と入力判定手段とシナリオ実行手段と複数の対話システムを備え、シナリオ実行手段は焦点対話シナリオと遷移対話シナリオを保持し、それぞれに対応する二つの言語理解モデルを入力理解手段が保持し、入力判定手段は入力理解手段が出力する二つの入力理解結果と前発話判定履歴とを勘案して入力がどちらのシナリオヘ対応するかを判定する。遷移対話シナリオには焦点対話切替え指令が含まれ、これを検出すると対応する対話システムの言語理解モデルと対話シナリオが新たに入力理解手段とシナリオ実行手段に読み込まれる。
【選択図】図1

Description

この発明は、入力の解釈結果と対話シナリオに記述された対話手順に基づいて適切な応答を出力するような対話システムを構築する技術にかかわるものであって、特に、異なる話題を扱う複数の対話システムを自動的に切り替えながら用いることにより、広い範囲の話に対応する対話を実現する技術の分野に関わる。
音声やテキストなどによる入力を受け付け適切な応答を出力する対話システムは、一般に、入力を理解する装置を用いて入力を機械処理の容易な形へ変形し、あらかじめ与えられた対話シナリオに基づきこの変形された入力理解結果に対応する応答が出力される。このように対話シナリオをあらかじめ与える形式をとる対話システムは、特定の話題に限定した対話を扱うことはできるが、幅広い話題に関連した入力に対して適切な応答を出力することは困難である。これは、話題が広がれば入力に対する応答を決定する対話シナリオの記述が複雑になるからである。一方、狭い範囲の話題しか扱えない対話システムではユーザの要求に不十分な応答しか出来なかったり、ユーザがあらかじめシステムの能力についてよく理解していなくては使えなかったり、といった問題がある。そこで、比較的容易に構築できる狭い範囲の話題を扱う対話システムを複数構築しておき、それらを適切に切替えながら対話を行うことにより擬似的に広い範囲の話題を扱う対話システムを構築することが試みられてきた。
このような試みにおいて、特許文献1のように1入力毎にその入力がどの対話システムに強く関連するかを判定し、該当する対話システムからの応答を出力する技術があった。
特開2004−240150号公報
入力に応じて複数の対話システムを切り替えながら対話を行う手法においては、入力がどの対話システムに関連しているかを精度よく判定する点に技術的な困難が存在する。
特許文献1の手法で、例えばスケジュール管理機能を持つ対話システムと天気予報情報案内機能を持つ対話システムと航空券予約機能を持つ対話システムを切替えながら使用する場合を考える。また、直前に応答を出力した対話システムを焦点対話システムと呼ぶことにする。
ある時点で焦点対話システムがスケジュール管理機能を持つ対話システムであり、その応答が例えば「12月4日の予定を読み上げますがよろしいですか?」である場合を考える。このような場合、次入力に対しても当該スケジュール管理機能を持つ対話システムが応答を返答することが自然である。しかし、このような場合にユーザが「はい」「いいえ」のような、全ての対話システムが入力として受け付けるようなものを入力した場合、この一入力だけで精度よく関連する対話システムを判定することは困難である。
このように、従来の手法では入力がどの対話システムに関連しているかを判定する際に該当する入力のみを手がかりとして判定していたため、特に切替える対象の対話システムの数が多くなればなるほど、精度が不十分となる点に課題があった。
また、特許文献1の手法では、判定が誤る可能性があるにも関わらず判定結果の是非を確認する手続きを経ずに対話システムを切替える。このため、ユーザ側から見れば意図しない対話システムからの応答が出力されることがある。このようなことがおきれば、ユーザは意図する対話システムを指定するためにどの様な入力を与えればよいかわからず、不必要な混乱を与えてしまう点にも課題があった。
上記の課題を解決するため、本発明では切替えながら使われる複数の対話ステムに加えて、それぞれの対話システムが切り替わる際に発生する対話を扱う遷移対話シナリオ、および入力が焦点対話システムに対応する焦点対話シナリオに関連するか、遷移対話シナリオに関連するかを判定する機能を持つ入力判定装置を導入する。
本発明においては、入力を理解する装置において、焦点対話シナリオに対応する入力理解モデル(以下、第1入力理解モデルと称す)を用いた入力理解と、遷移対話シナリオに対応する入力理解モデル(以下、第2入力理解モデルと称す)を用いた入力理解とを両方行い、二つの理解結果(以下、それぞれ第1入力理解結果及び第2入力理解結果とする)を得る。また、入力判定装置において前発話判定履歴を保持し、二つの第1及び第2入力理解結果と前発話判定履歴を同時に勘案して判定を行う。
また、遷移対話シナリオを用いて、次に切替える対話システムが本当にユーザの要求しているシステムであるかどうかを確認する対話手順を経る。
本発明によれば、入力判定装置において二つの入力結果と前発話判定履歴を同時に勘案して判定を行うため、対話の流れを考慮した判定を行うことが可能となる。例えば入力理解装置が第1入力理解モデルによる理解プロセスに失敗し第1入力理解結果が得られず、また第2入力理解モデルによる理解プロセスにも失敗して第2入力理解結果も得られなかった場合、前発話判定履歴が焦点対話シナリオであった場合には今発話も焦点対話シナリオヘ、前発話判定履歴が遷移対話シナリオであった場合には今発話も遷移対話シナリオヘ関連するものと判定することが可能となる。また、入力が「はい」である場合のように第1入力理解結果および第2入力理解結果共に得られる場合、前発話判定履歴が遷移対話シナリオであった場合には今発話も遷移対話シナリオヘ関連するものと判定することが可能となる。
また本発明においては、焦点対話シナリオと遷移対話シナリオのいずれか、すなわち二つのうちの一つを常に判定するため、複数存在する対話システムのいずれかに判定する場合に比べると判定精度は高くなることが期待される。
これら二点の理由により、入力判定精度が低い問題を回避することが出来る。
また、遷移対話シナリオを用いれば、例えば次に切替える対話システムが本当にユーザの要求しているシステムであるかどうかを確認する対話手順を経ることなどが可能になるため、ユーザが意図しない対話システムヘ突然切り替わることが無くなるため、不必要な混乱をユーザに与えることが無くなる。
本発明による対話装置はハードウェアによって構成することも可能であるが、それよりもむしろ、コンピュータに本発明で提案する対話プログラムをインストールし、コンピュータにこのプログラムを実行させることによりコンピュータを対話装置として機能させる実施形態が最良の実施形態である。
コンピュータが対話装置として機能する場合、コンピュータは少なくとも入力理解装置と入力判定装置とシナリオ実行装置とを備え、これら各装置の機能により対話動作を実行する。
図1及び図2に本発明の請求項4記載の対話装置の実施例を示す。請求項4記載の対話装置は入力理解装置101と、入力判定装置102と、シナリオ実行装置103と、焦点対話切替指令に応じて選択的にシナリオ実行装置103と入力理解装置101にコピーされて入力理解モデル或いは焦点対話シナリオとして利用される第1対話システム1041、第2対話システム1042……第n対話システム104nとから成る対話システム群104とを備える。
入力理解装置101は例えば音声を単語列に変換する音声認識装置1013と、単語列を属性と値とから成るペアへ変換する言語理解装置1014との組合わせによって構成することができる。音声認識装置1013は第1音声認識モデル1015と第2音声認識モデル1016とを備え、言語理解装置1014は第1言語理解モデル1011と第2言語理解モデル1012とを備える。
入力判定装置102は前発話判定履歴1021を備え、更に、シナリオ実行装置103は焦点対話シナリオ10311と、遷移対話シナリオ10321とこれら焦点対話シナリオ10311と遷移対話シナリオ10321のそれぞれの履歴を保持した焦点対話履歴10312と遷移対話履歴10322とを備えて構成される。
更に、対話システム群104を構成する第1対話システム1041、第2対話システム1042……第n対話システム104nは対話シナリオ10411、10421……104n1と、言語理解モデル10412、10422、…104n2と、音声認識モデル10413,10423…104n3と、対話履歴10414、10424……104n4とを備えて構成される。
入力1090としては例えば利用者が発声した音声や、テキスト入力、マウス入力、タッチパネル入力、ボタン操作、ジェスチヤ入力、もしくはそれらのいくつかを組み合わせたものなどが考えられる。また、応答内容1095にはスピーカから音声を出力する指令や、コンピュータ画面にテキスト、画像、エージェントキャラクタのジェスチャなどのアニメーション、もしくはそれらのいくつかを組み合わせたものを出力する指令などが考えられる。
本実施例では、入力は音声を、第1及び第2入力理解結果1091、1092は図3及び図4に示す属性と値とからなるペア及びスコアを出力し、応答内容1095にはテキストおよびエージェントキャラクタ動作コマンドを想定して説明する。このような場合、入力理解装置101には、音声を単語列に変換する音声認識装置1013と、単語列を属性とペアからなる値とペアへ変換する言語理解装置1014を組み合わせたものなどを用いることができる。また、言語理解装置1014に備えた第1及び第2音声認識モデル1015,1016には音声認識用の言語モデルや音響モデルが用いられ、第1及び第2言語理解モデル1011、1012には、単語列パタンと属性と値とから成るペアとを対応付ける言語理解規則などを用いることができる。応答内容1095は市販の音声合成装置やキャラクタ画像描画ソフトウェアなどを用いて音声や画像へ変換することによって、ユーザへ提示することができる。
また、本実施例では第1対話システム1041は東京観光案内システムであって、第n対話システム104nは東京行政サービス案内システムであるとする。
本発明による対話装置とユーザとの対話において、ある時点でユーザが東京観光案内についてシステムと対話しているとする。このとき、焦点対話シナリオ10311には東京観光案内だけを処理する対話シナリオ10411がコピーされており、入力理解装置101の第1音声認識モデル1015と第1言語理解モデル1011には東京観光案内に関連する入力だけを想定した音声認識モデル10413と言語理解モデル10412がコピーされている。また、遷移対話シナリオ10321は、ある対話システムから他の対話システムヘ話題が遷移する途中で発生する対話を処理するシナリオが記述されており、第2音声認識モデル1016及び第2言語理解モデル1012には、ある対話システムから他の対話システムヘ話題が遷移する途中で発生する対話に関連した入力を想定した入力理解モデルが記述されている。
請求項4に記載の対話装置において、入力理解装置101は、入力1090が入力されると、第1音声認識モデル1015は入力1090を単語列に変換し、第1言語理解モデル1011はその単語列を解釈し第1入力理解結果1091へと変換する。また、第2音声認識モデル1016も入力1090を単語列に変換し、第2言語理解モデル1012もその単語列を解釈し、第2入力理解結果1092へと変換する。すなわち、一つの入力に対して二つの入力理解結果が生成される。
例えば入力音声が「住民票の写しを受け取りたい」というものであった場合の二つの入力理解結果の例を、図3および図4に示す。この例では、第1音声認識モデル1015及び第1言語理解モデル1011は東京観光案内の話題で頻出する単語が入力されると想定しているのに対し、第2音声認識モデル1016及び第2言語理解モデル1012では東京観光案内や行政サービスやその他全ての話題に関連する単語を想定している。音声認識モデルや言語理解モデルによって想定する入力が異なるため、想定された入力と整合する入力である場合にはスコアが高く、想定外の入力である場合にはスコアが低くなることがある。また本実施例では、入力が音声認識モデルや言語理解モデルにより想定されたものと著しく異なり、スコアが極端に低くなった場合には、入力理解に失敗したとみなして入力理解結果を出力しないような動作を行う。
入力判定装置102では前発話判定履歴1021に保持される前発話判定履歴と第1入力理解結果1091と第2入力理解結果1092とを勘案して、入力判定結果1093とこの入力判定結果1093に対応する入力理解結果1094とを出力する。
図5及び図6に入力判定装置102の動作フローの例を示す。図5及び図6において、先ず第1及び第2入力理解結果1091,1092が共に存在するか否かを判定する(ステップS5−1)。
第1入力理解結果のみが存在する場合は現入力は「焦点対話シナリオ10311に関連する入力」とする判定結果1093を出力する(ステップS5−6)。
第2入力理解のみ存在し、前発話判定結果が「焦点対話シナリオ」でなければ現入力は「遷移対話シナリオに関連する入力」とする入力判定結果1093を出力する(ステップS5−7、S5−8)。
第2入力理解のみが存在し、前発話判定結果が「焦点対話シナリオ」であった場合はステップS5−7を経てステップS6−3(図6)に分岐し、更に第2入力理解結果に現在の焦点対話シナリオに関連する内容が含まれていればステップS6−3を経てステップS6−5で現入力は「焦点対話シナリオに関連する入力」とする判定結果1093を出力する。
第1入力理解結果及び第2入力理解結果が共に存在せず、更に前発話判定結果が焦点対話シナリオであった場合は、ステップS5−4を経てステップS5−9に分岐し、このステップS5−9で現入力は「焦点対話シナリオに関する入力」とする入力結果1093を出力する。
第1入力理解結果及び第2入力理解結果が共に存在せず、更に前発話判定結果が焦点対話シナリオでなかった場合にはステップS5−5で現入力は「遷移対話シナリオに関連する入力」とする入力結果1093を出力する。
ステップS5−1で第1入力理解結果と第2入力理解結果が共に存在し、前発話判定結果が焦点対話シナリオでなければ、ステップS5−10からステップS5−11に分岐し、第1入力理解結果スコアと第2入力理解結果スコアとの大小関係を比較し、第1入力理解結果スコアがβを加算した第2入力理解結果スコアより大きい場合(ステップS5−11)は現入力は「焦点対話シナリオに関連する入力」とする入力判定結果1093を出力する(ステップS5−13)。
ステップS5−11の判定がNOである場合には現入力は「遷移対話シナリオに関連する入力」とする入力判定結果を出力する(ステップS5−12)。
ステップS5−1において、第1及び第2入力理解結果が共に存在し、ステップS5−10において、前発話判定結果が「焦点対話シナリオ」であったと判定された場合はステップS6−1で第1入力理解結果にαを加算したスコアと第2入力理解結果スコアとの大小関係を比較し、第2入力理解結果スコアが小さい場合には現入力は「焦点対話シナリオに関連する入力」とする入力判定結果1093を出力する(ステップS6−2)。
第2入力理解結果スコアがαを加算した第1入力理解結果スコアより大きい場合はステップS6−3に進み、ステップS6−3で第2入力理解結果に現在の焦点対話シナリオに関連する内容が含まれていると判定された場合にはステップS6−5で現入力は「焦点対話シナリオに関連する入力」とする入力判定結果1093を出力する。
ステップS6−3の判定がNOの場合は、現入力は「遷移対話シナリオに関連する入力」とする判定結果1093を出力する(ステップS6−4)。
ステップS5−11とS6−1で用いたαとβは例えばα=0.3、β=0.5等と設定することができるが、これらα及びβの値は入力理解装置101の実装に応じて調整する必要がある。
シナリオ実行装置103では、上述した入力判定結果1093に応じて焦点対話シナリオ10311もしくは遷移対話シナリオ10321を選択し、対応する対話履歴である焦点対話履歴10312もしくは遷移対話履歴10322に記録されているシナリオ実行箇所からシナリオを実行し、応答内容1095を出力する。
また、シナリオ実行装置103が遷移対話シナリオ10321を実行する際に、遷移対話シナリオ10321の内部に記述された焦点対話切替え指令を検出することがある。例えば“行政サービス”ドメインヘ焦点対話を切替えるような焦点対話切替え指令を検出した場合、シナリオ実行装置103は対話シナリオ104n1を焦点対話シナリオ10311へコピーし、音声認識モデル104n3を第1音声認識モデル1015へコピーし、更に言語モデル104n2を第1言語理解モデル1011へコピーする。また、新たに焦点対話シナリオとなった対話シナリオ104n1の初期応答内容が応答内容1095として出力される。図8に応答内容1095の一例を示す。
図7にこの発明の請求項5記載の対話装置の実施例を示す。請求項5に記載の対話装置では、シナリオ実行装置103にいわゆるヘルプ機能として作用するナビゲータ対話シナリオ10331、ナビゲータ対話履歴10332、ナビゲータ音声認識モデル10334とナビゲータ言語理解モデル10333を保持した実施例を示す。この実施例では遷移対話シナリオ10321に記述されている焦点対話切替え指令にはナビゲータを指定する指令が含まれる。また、ナビゲータ対話シナリオ10331にはナビゲータ対話シナリオ10331以外の何れかの対話システムを指定する焦点対話切替指令を含む。シナリオ実行装置103はナビゲータを指定する焦点対話切替え指令を検出した際に、第1音声認識モデル1015にはナビゲータ音声認識モデル10334をコピーし、第1言語理解モデル1011にはナビゲータ言語理解モデル10333をコピーし、入力判定装置102に入力判定モード変更指令1081を送る。入力判定装置102は入力判定モード変更指令1081を受け取ると、再度入力判定モード変更指令1081を受け取るまでの間、第1入力理解結果1091に対応した理解結果を常に出力するように動作する。シナリオ実行装置103はナビゲータ以外のシナリオを指定する焦点対話切替え指令を検出した場合、請求項1に記載される対話装置と同様に焦点対話シナリオおよび音声認識モデルと言語理解モデルに対応する対話システムからコピーし、入力判定装置102に入力判定モード変更指令1081を送る。これにより再び入力判定装置102は図5及び図6に示す手順に沿って入力判定を開始する。これによって、例えば遷移対話シナリオ10321において連続した複数回入力の理解に失敗するなどの現象がおきたり、或いはユーザが例えば「総合案内を呼んで」といった入力をした場合に、自動的にナビゲータシナリオに切替えたりすることが可能となる。
請求項6に記載の対話装置では、シナリオ実行装置103は焦点対話切替え指令を検出した際に、現在の焦点対話シナリオに相当する対話システムの対話履歴に現在の焦点対話履歴をコピーしてから、焦点対話切替え指令で指定された対話システムの対話履歴を現在の焦点対話履歴へコピーする。例えば現在の焦点対話シナリオが対話シナリオ104n1であって焦点対話切替え指令が第1対話システム1041を指定している場合、焦点対話履歴10312を第n対話システム104nの対話履歴104n4(図1参照)へコピーした後に、第1対話システム1041の対話履歴10414(図1参照)を焦点対話履歴10312へとコピーする。これにより、例えば以前に第1対話システム1041の対話シナリオが焦点対話シナリオであったときの対話内容を、別の対話システムへ何度か切替えてから、再度継続して開始することができる。例えば、東京観光案内システムにおいて東京都庁の見所を紹介している場面で行政サービスの案内システムヘ切替えた後、再度観光案内システムヘ切替えれば、東京都庁の紹介場面から対話を継続して行うことが出来る。これによって、ユーザは冗長な入力を再度行うことなくスムーズに対話を進行することができる。
以上説明した本発明による対話装置は図1及び図2に示した構成要素を実現するための対話プログラムをコンピュータにインストールし、コンピュータに請求項4乃至請求項6記載の対話装置として機能させる実施形態が最良の実施形態である。本発明による対話プログラムはコンピュータが解読可能なプログラム言語によって記述され、コンピュータが読み取り可能な例えば磁気ディスク或いはCD−ROMのような記録媒体に記録される。コンピュータにはこれらの記録媒体から或いは通信回線を通じてインストールされる。インストールされた本発明による対話プログラムはコンピュータに備えられたCPUに解読され、コンピュータを対話装置として機能させる。
本発明による対話方法、対話装置および対話プログラムは、複数の対話システムを組み合わせてより広い範囲の話題を扱う対話システムを構築する際に活用される。
本発明による対話装置に用いられる対話システム群の構成例を説明するためのブロック図。 本発明による対話装置に用いられる入力装置と入力判定装置、シナリオ実行装置の構成例を説明するためのブロック図。 焦点対話シナリオに対応する入力理解結果の例を示す図。 遷移対話シナリオに対応する入力理解結果の例を示す図。 本発明による入力判定装置の動作を説明するためのフローチャート。 図5の続きを説明するためのフローチャート。 本発明の変形実施例を説明するためのブロック図。 本発明による対話装置の応答内容の一例を説明するための図。
符号の説明
101 入力装置 104n 第n対話システム
1011 第1言語理解モデル 104n1 対話シナリオ
1012 第2言語理解モデル 104n2 入力理解モデル
1015 第1音声認識モデル 104n4 対話履歴
1016 第2言語認識モデル 1081 入力判定モード変更指令
102 入力判定装置 1090 入力
1021 前発話判定履歴 1091 第1入力理解結果
103 シナリオ実行装置 1092 第2入力理解結果
10311 焦点対話シナリオ 1093 入力判定結果
10312 焦点対話履歴 1094 入力理解結果
10321 遷移対話シナリオ 1095 応答内容
10322 遷移対話履歴
10331 ナビゲータ対話シナリオ
10332 ナビゲータ対話履歴
10333 ナビゲータ言語理解モデル
10334 ナビゲータ音声認識モデル
104 対話システム群
1041 第1対話システム
10411 対話シナリオ
10412 入力理解モデル
10414 対話履歴

Claims (8)

  1. 入力理解方法と入力判定方法とシナリオ実行方法と複数の対話システムからなる対話方法であって、
    シナリオ実行方法は焦点対話シナリオと遷移対話シナリオとそれぞれに対応する焦点対話履歴と遷移対話履歴とを保持し、
    入力理解方法は上記焦点対話シナリオと上記遷移対話シナリオにそれぞれ対応する二つの入力理解モデルを保持し、
    入力判定方法は前発話判定履歴を保持し、複数の対話システムのそれぞれは少なくとも対話シナリオと入力理解モデルとを保持し、
    入力理解方法は入力に対して二つの入力理解モデルをそれぞれ用いて二つの理解結果を求め入力判定方法へ出力し、
    入力判定方法は、前発話判定履歴と二つの理解結果とから、入力が焦点対話シナリオと遷移対話シナリオのいずれに対応するかを判定し、判定結果と判定されたシナリオに対応する理解結果を合わせてシナリオ実行方法へ出力し同時に前発話判定履歴を更新し、
    シナリオ実行方法は入力判定方法からの出力に含まれる判定結果に対応する対話シナリオを、対応する対話履歴に保持されるシナリオ実行箇所から、入力判定方法からの出力に含まれる理解結果を入力としてシナリオを実行しシナリオに記述される応答内容を出力し、
    同時に対応する対話履歴に新たなシナリオ実行箇所を保持し、
    対話シナリオには焦点対話切替え指令が記述されており、シナリオ実行方法は対話シナリオを実行する際に焦点対話切替え指令を検出した場合は、焦点対話切替え指令により指定される対話システムの対話シナリオを焦点対話シナリオとし、この指定される対話システムの入力理解モデルを入力理解方法の保持する焦点対話シナリオに対応する入力理解モデルとすることを特徴とする対話方法。
  2. 請求項1記載の対話方法において、シナリオ実行方法はナビゲータシナリオおよびナビゲ一タ対話履歴およびナビゲータ入力理解モデルを保持し、対話シナリオを実行する際にナビゲータを指定する焦点対話切替え指令を検出した場合は、ナビゲータ入力理解モデルを入力理解方法の保持する焦点対話シナリオに対応する入力理解モデルとし、入力判定方法は新たにナビゲータ以外を指定する焦点切替え指令が検出されるまでは無条件に焦点対話側を判定緒果とし、シナリオ実行方法はナビゲータ対話履歴に保持されるシナリオ実行箇所から、理解結果を入力としてナビゲータシナリオを実行しナビゲータシナリオに記述される応答内容を出力し、同時にナビゲータ対話履歴に新たなシナリオ実行箇所を保持することを特徴とする対話方法。
  3. 請求項1又は2の何れかに記載の対話方法において、シナリオ実行方法が焦点対話切替え指令を検出した際に、焦点対話履歴を現在の焦点対話シナリオに対応した対話システムの対話履歴にコピーし、焦点対話切替え指令で指定される対話システムの対話履歴を焦点対話履歴ヘコピーすることを特徴とする対話方法。
  4. 入力理解装置と入力判定装置とシナリオ実行装置と複数の対話システムからなる対話装置であって、
    シナリオ実行装置は焦点対話シナリオと遷移対話シナリオとそれぞれに対応する焦点対話履歴と遷移対話履歴とを保持し、入力理解装置は上記焦点対話シナリオと上記遷移対話シナリオにそれぞれ対応する二つの入力理解モデルを保持し、入力判定装置は前発話判定履歴を保持し、複数の対話システムのそれぞれは少なくとも対話シナリオと入力理解モデルとを保持し、
    入力理解装置は入力に対して二つの入力理解モデルをそれぞれ用いて二つの理解結果を求め入力判定装置へ出力し、
    入力判定装置は、前発話判定履歴と二つの理解結果とから、入力が焦点対話シナリオと遷移対話シナリオのいずれに対応するかを判定し、判定結果と判定されたシナリオに対応する理解結果を合わせてシナリオ実行装置へ出力し同時に前発話判定履歴を更新し、
    シナリオ実行装置は入力判定装置からの出力に含まれる判定結果に対応する対話シナリオ
    を、対応する対話履歴に保持されるシナリオ実行箇所から、入力判定方法からの出力に含
    まれる理解結果を入力としてシナリオを実行しシナリオに記述される応答内容を出力し、
    同時に対応する対話履歴に新たなシナリオ実行箇所を保持し、
    対話シナリオには焦点対話切替指令が記述されており、シナリオ実行装置は対話シナリオを実行する際に焦点切替え指令を検出した場合は、焦点対話切替え指令により指定される対話システムの対話シナリオを焦点対話シナリオとし、この指定される対話システムの入力理解モデルを入力理解装置が保持する焦点対話シナリオに対応する入力理解モデルとすることを特徴とする対話装置。
  5. 請求項4記載の対話装置において、シナリオ実行装置はナビゲータシナリオおよびナビゲータ対話履歴およびナビゲータ入力理解モデルを保持し、対話シナリオを実行する際にナビゲータを指定する焦点対話切替え指令を検出した場合は、ナビゲータ入力理解モデルを入力理解方法の保持する焦点対話シナリオに対応する入力理解モデルとし、入力判定装置は新たにナビゲータ以外を指定する焦点切替え指令が検出されるまでは無条件に焦点対話側を判定結果とし、シナリオ実行装置はナビゲータ対話履歴に保持されるシナリオ実行箇所から、理解結果を入力としてナビゲータシナリオを実行しナビゲータシナリオに記述される応答内容を出力し、同時にナビゲータ対話履歴に新たなシナリオ実行箇所を保持することを特徴とする対話装置。
  6. 請求項4又は5の何れかに記載の対話装置において、シナリオ実行装置が焦点対話切替え指令を検出した際に、焦点対話履歴を現在の焦点対話シナリオに対応した対話システムの対話履歴にコピーし、焦点対話切替え指令で指定される対話システムの対話履歴を焦点対話履歴ヘコピーすることを特徴とする対話装置。
  7. コンピユータが解読可能なプログラム言語によって記述され、コンピユータに少なくとも請求項4、請求項5、請求項6のいずれかに記載の対話装置として機能させる対話プログラム。
  8. コンピュータが読み取り可能な記録媒体によって構成され、この記録媒体に請求項7記載の対話プログラムを記録した記録媒体。
JP2005232215A 2005-08-10 2005-08-10 対話方法、対話装置、対話プログラムおよび記録媒体 Expired - Fee Related JP4589843B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005232215A JP4589843B2 (ja) 2005-08-10 2005-08-10 対話方法、対話装置、対話プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005232215A JP4589843B2 (ja) 2005-08-10 2005-08-10 対話方法、対話装置、対話プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2007047488A true JP2007047488A (ja) 2007-02-22
JP4589843B2 JP4589843B2 (ja) 2010-12-01

Family

ID=37850357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005232215A Expired - Fee Related JP4589843B2 (ja) 2005-08-10 2005-08-10 対話方法、対話装置、対話プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP4589843B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010170137A (ja) * 2009-01-23 2010-08-05 Honda Motor Co Ltd 音声理解装置
US20130323558A1 (en) * 2012-06-04 2013-12-05 Eaglepicher Technologies, Llc Contoured battery case based on cell shapes
JP2018185561A (ja) * 2017-04-24 2018-11-22 株式会社日立製作所 対話支援システム、対話支援方法、及び対話支援プログラム
JP2020177373A (ja) * 2019-04-16 2020-10-29 学校法人早稲田大学 情報伝達システムおよびプログラム
JP2021144633A (ja) * 2020-03-13 2021-09-24 Kddi株式会社 ユーザの関心度に応じて対話内容を切り替える対話装置、プログラム及び方法
JP2021173796A (ja) * 2020-04-21 2021-11-01 富士通株式会社 会話制御方法、装置、及びプログラム
JP7576290B1 (ja) 2023-06-09 2024-10-31 株式会社サイバーエージェント 話題モジュールセット作成装置、対話装置、話題モジュールセット作成方法、対話方法及びコンピュータプログラム
JP7581651B2 (ja) 2020-04-21 2024-11-13 富士通株式会社 会話制御方法、装置、及びプログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6219899A (ja) * 1985-07-18 1987-01-28 松下電器産業株式会社 文章音声認識装置
JPH04332084A (ja) * 1991-05-07 1992-11-19 Nippon Telegr & Teleph Corp <Ntt> 自動情報提供方法
JPH1031497A (ja) * 1996-07-18 1998-02-03 Hitachi Ltd 音声対話制御方法および音声対話システム
JPH1069482A (ja) * 1996-08-29 1998-03-10 Atr Chinou Eizo Tsushin Kenkyusho:Kk 話題処理装置
JP2001296943A (ja) * 2000-04-14 2001-10-26 Denso Corp 対話型ユーザインターフェース装置
JP2002032370A (ja) * 2000-07-18 2002-01-31 Fujitsu Ltd 情報処理装置
JP2004233676A (ja) * 2003-01-30 2004-08-19 Honda Motor Co Ltd 対話制御装置
JP2004264464A (ja) * 2003-02-28 2004-09-24 Techno Network Shikoku Co Ltd 特定分野辞書を利用した音声認識誤り訂正システム
JP2005190191A (ja) * 2003-12-25 2005-07-14 Equos Research Co Ltd 車載装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6219899A (ja) * 1985-07-18 1987-01-28 松下電器産業株式会社 文章音声認識装置
JPH04332084A (ja) * 1991-05-07 1992-11-19 Nippon Telegr & Teleph Corp <Ntt> 自動情報提供方法
JPH1031497A (ja) * 1996-07-18 1998-02-03 Hitachi Ltd 音声対話制御方法および音声対話システム
JPH1069482A (ja) * 1996-08-29 1998-03-10 Atr Chinou Eizo Tsushin Kenkyusho:Kk 話題処理装置
JP2001296943A (ja) * 2000-04-14 2001-10-26 Denso Corp 対話型ユーザインターフェース装置
JP2002032370A (ja) * 2000-07-18 2002-01-31 Fujitsu Ltd 情報処理装置
JP2004233676A (ja) * 2003-01-30 2004-08-19 Honda Motor Co Ltd 対話制御装置
JP2004264464A (ja) * 2003-02-28 2004-09-24 Techno Network Shikoku Co Ltd 特定分野辞書を利用した音声認識誤り訂正システム
JP2005190191A (ja) * 2003-12-25 2005-07-14 Equos Research Co Ltd 車載装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010170137A (ja) * 2009-01-23 2010-08-05 Honda Motor Co Ltd 音声理解装置
US8548808B2 (en) 2009-01-23 2013-10-01 Honda Motor Co., Ltd. Speech understanding apparatus using multiple language models and multiple language understanding models
US20130323558A1 (en) * 2012-06-04 2013-12-05 Eaglepicher Technologies, Llc Contoured battery case based on cell shapes
US9190642B2 (en) * 2012-06-04 2015-11-17 Eaglepicher Technologies, Llc Contoured battery case based on cell shapes
JP2018185561A (ja) * 2017-04-24 2018-11-22 株式会社日立製作所 対話支援システム、対話支援方法、及び対話支援プログラム
JP2020177373A (ja) * 2019-04-16 2020-10-29 学校法人早稲田大学 情報伝達システムおよびプログラム
JP7244910B2 (ja) 2019-04-16 2023-03-23 学校法人早稲田大学 情報伝達システムおよびプログラム
JP2021144633A (ja) * 2020-03-13 2021-09-24 Kddi株式会社 ユーザの関心度に応じて対話内容を切り替える対話装置、プログラム及び方法
JP7221902B2 (ja) 2020-03-13 2023-02-14 Kddi株式会社 ユーザの関心度に応じて対話内容を切り替える対話装置、プログラム及び方法
JP2021173796A (ja) * 2020-04-21 2021-11-01 富士通株式会社 会話制御方法、装置、及びプログラム
JP7581651B2 (ja) 2020-04-21 2024-11-13 富士通株式会社 会話制御方法、装置、及びプログラム
JP7576290B1 (ja) 2023-06-09 2024-10-31 株式会社サイバーエージェント 話題モジュールセット作成装置、対話装置、話題モジュールセット作成方法、対話方法及びコンピュータプログラム

Also Published As

Publication number Publication date
JP4589843B2 (ja) 2010-12-01

Similar Documents

Publication Publication Date Title
US11823661B2 (en) Expediting interaction with a digital assistant by predicting user responses
JP6073498B2 (ja) 対話制御装置及び対話制御方法
US11797772B2 (en) Word lattice augmentation for automatic speech recognition
JP5195405B2 (ja) 応答生成装置及びプログラム
JP4878471B2 (ja) 情報処理装置およびその制御方法
JP2006048628A (ja) マルチモーダル入力方法
JP2005331882A (ja) 音声認識装置、音声認識方法、および音声認識プログラム
JP2004288018A (ja) 対話制御システム及び方法
KR102527107B1 (ko) 음성에 기반하여 기능을 실행하기 위한 방법 및 이를 지원하는 사용자 전자 장치
JP6595912B2 (ja) 既存の単一言語プロセスからマルチ言語プロセスを構築すること
KR20220028128A (ko) 화자 종속 음성 모델(들)을 사용한 화자 인식
JP4589843B2 (ja) 対話方法、対話装置、対話プログラムおよび記録媒体
KR20220128397A (ko) 자동 음성 인식을 위한 영숫자 시퀀스 바이어싱
Wagner et al. An empirical evaluation of a vocal user interface for programming by voice
Lojka et al. Multi-thread parallel speech recognition for mobile applications
JP2006251545A (ja) 音声対話システム及びコンピュータプログラム
JP5818753B2 (ja) 音声対話システム及び音声対話方法
JP2004151562A (ja) 音声対話制御方法および音声対話制御装置
WO2019142419A1 (ja) 情報処理装置および情報処理方法
JP2007033478A (ja) マルチモーダル対話システム及びマルチモーダルアプリケーション生成ウィザード
JP2006018028A (ja) 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体
Komatani et al. Restoring incorrectly segmented keywords and turn-taking caused by short pauses
JP2000330588A (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体
Hess et al. “Could you please repeat that?” Speech design best practices for minimizing errors
JP2004021028A (ja) 音声対話装置及び音声対話プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100831

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100910

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees