JP3945187B2 - 対話管理装置 - Google Patents
対話管理装置 Download PDFInfo
- Publication number
- JP3945187B2 JP3945187B2 JP2001156632A JP2001156632A JP3945187B2 JP 3945187 B2 JP3945187 B2 JP 3945187B2 JP 2001156632 A JP2001156632 A JP 2001156632A JP 2001156632 A JP2001156632 A JP 2001156632A JP 3945187 B2 JP3945187 B2 JP 3945187B2
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- attribute value
- storage unit
- distance
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012790 confirmation Methods 0.000 claims description 52
- 238000007726 management method Methods 0.000 description 59
- 238000010586 diagram Methods 0.000 description 33
- 238000000034 method Methods 0.000 description 9
- 230000004308 accommodation Effects 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- JSKZWIGBDHYSGI-UCSXVCBISA-L disodium;(6r,7r)-7-[[(2e)-2-(2-amino-1,3-thiazol-4-yl)-2-[1-[2-(3,4-dihydroxybenzoyl)hydrazinyl]-2-methyl-1-oxopropan-2-yl]oxyiminoacetyl]amino]-3-[(2-carboxylato-5-methyl-[1,2,4]triazolo[1,5-a]pyrimidin-7-yl)sulfanylmethyl]-8-oxo-5-thia-1-azabicyclo[4.2. Chemical compound [Na+].[Na+].N([C@H]1[C@@H]2N(C1=O)C(=C(CS2)CSC1=CC(=NC2=NC(=NN21)C([O-])=O)C)C([O-])=O)C(=O)C(\C=1N=C(N)SC=1)=N\OC(C)(C)C(=O)NNC(=O)C1=CC=C(O)C(O)=C1 JSKZWIGBDHYSGI-UCSXVCBISA-L 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【産業上の利用分野】
この発明は,利用者と装置との対話的なマンマシンインタフェースにおける対話管理装置に関するものである。
【0002】
【従来の技術】
近年,利用者がシステムと対話を行ってデータベースから必要な情報を検索したり,チケットの予約を行ったりする対話型マンマシンインタフェースの重要性が高まっている。このような対話型インタフェースにおいては,利用者の入力ミス,回線のノイズなどにより,装置への入力に誤りが含まれている可能性があり,特に入力手段として音声認識を用いる場合,誤認識による誤りを完全に避けることはできない。
【0003】
従来,入力に含まれる誤りに対処するために,まず入力内容を全て復唱して正誤を利用者に確認し,利用者が否定した場合には,代替の候補を確認したり再入力を促したりするという方法が提案されている。例えば図30 は,特開昭63-33797に示される桁無し数字音声認識制御方法の動作フローチャートである。
【0004】
このような音声認識制御方法においては,ステップ61において第一候補の認識結果中の各単語に対する確実度を,第一候補と第二候補の認識スコア(距離値)の比として求める。ステップ64 において,第一候補の認識結果全てを利用者に提示し,否定された場合に誤認識発生と判定する。ステップ64で誤認識発生と判定された場合,ステップ72で最も確実度の低い単語のみを利用者に確認する。利用者が否定すると,ステップ72で確認した単語は誤認識であったと判定され,ステップ81で利用者に再入力を求める応答を出力する。ステップ83で再入力に対する認識結果を確認し,肯定の応答があるまでステップ81に戻り再入力要求を繰り返す。誤りの訂正が終了するとステップ64に戻り,再び認識結果を全て利用者に提示する。利用者に否定されると,誤りを訂正するために再びステップ71以降を実行する。
【0005】
このように構成された音声認識制御方法は,認識候補の一位と二位の認識スコアの比から一位候補の確実度を求め,確実度の低い単語から順に確認を行うことで,訂正のための再入力の回数を減らし,正しい入力の確定までの時間を短くすることが可能となる。
【0006】
一方,認識結果の信頼度を用いて確認動作を制御する対話管理方式として,情報処理学会研究報告音声言語情報処理30-9「音声認識結果の信頼度を用いた頑健な混合主導対話の実現法」(以後文献SLP30-9と呼ぶ)に示された対話管理方式がある。
【0007】
このような文献SLP30-9に示された対話管理方式においては,入力音声に対する認識候補をスコアの高い順にN個求め,それらN個のスコアを用いてN個の認識候補に含まれる各単語の信頼度を図31に示す手順により計算する。
第一位の認識候補中の単語について,得られた信頼度が予め定められた閾値より小さい場合に利用者に確認を行う。また,既に値が入力されている属性を上書きする単語に対しても確認を行う。
【0008】
このように構成された対話管理方式は,音声認識のスコアから求まる信頼度に基づいて,信頼度の低い認識結果に対してのみ確認対話を行うため,不必要な確認対話を行う回数が減り,利用者の利便性が向上する。
【0009】
【発明が解決しようとする課題】
しかしながら,上記の特開昭63-33797に示されるような従来の音声認識制御方法では,入力に誤りが含まれていない場合でも常に利用者に入力内容を確認するため,不必要な確認対話が多くなり利用者の利便性が損なわれるという問題があった。
【0010】
また,上記の文献SLP30-9に示されるような従来の対話管理方式においては,確認対話の制御に用いる信頼度は,入力された音声認識結果のスコアに基づいたものであるため,例えば地名を対象とした音声認識において「津」などのような短い単語の湧き出し誤りが高い信頼度を持ったり,「東急イン横浜」が「今日九人横浜」となるような音響的あるいは言語的に類似の認識誤りが高い信頼度を持つ場合がある。
【0011】
さらに,信頼度は一入力のみから計算され対話文脈は考慮さない。このため,例えば宿泊施設検索装置において,利用者から既に人数として「一人」,部屋のタイプとして「シングル」という情報が入力されている状況において,対話文脈上は明らかに誤りの可能性が高い「九人」という認識結果が入力されても,信頼度が高ければ確認は行われないという問題が生じる。
【0012】
このような問題を解決するために文献SLP30-9に示される従来の対話管理方式においては,値が既に入力されている属性を上書きする入力に対しては利用者に確認を行なう。しかし,確認を行うか否かを判断する基準はなく,常に利用者に確認を行う。このため,例えばデータベース検索のように検索条件を追加,変更,削除しながら対話を進めるような場合,検索条件の変更に対して常に確認が行われ,不必要な確認対話が多くなり利用者の利便性が損なわれるという問題があった。
【0013】
この発明は,上述のような課題を解決するためになされたもので,音声認識結果のスコアに基づいた信頼度では検出できない入力誤りを検出し,入力誤りを検出した場合にのみ確認を行うことで不必要な確認対話を減少させ,利用者の利便性を向上させる対話管理装置を得ることを目的とする。
【0014】
【課題を解決するための手段】
この発明に係る対話管理装置は、処理動作の属性と,該属性に対する値を対にした属性・属性値対を記憶する属性・属性値対記憶部と,
属性値間の距離を計算する規則を記憶した属性値間距離計算規則記憶部と,
処理動作により先に入力された属性値と後から入力された属性値との間の距離を属性値間距離計算規則記憶部の規則に基づき計算する属性値間距離計算部と,属性値間距離計算部の結果を所定値と比較し、その比較結果から,利用者への確認が必要な属性・属性値対であるか否かを決定して出力する確認動作決定部と,対象ドメインにおける処理動作に関する動作規則を記憶した対話管理規則記憶部と,
入力された属性・属性値対に対して,前記対話管理規則記憶部に記憶された動作規則に基づいて次の動作を決定し,この次動作実行用の要求信号を出力するとともに,確認動作決定部から属性・属性値対が入力された場合には,その属性・属性値対の確認を行うための応答生成要求を出力し,確定した属性・属性値対を出力する対話管理部と、
対話管理部からの応答生成要求に対して,応答を生成して出力する応答生成部とを備える。
【0015】
また、この発明に係る対話管理装置は、前記属性値間距離計算規則記憶部は,同一属性に対する属性値を予め複数のクラスに分類し、属性値クラス間の距離を計算する規則を記憶し,
前記属性値間距離計算部は,属性値クラス間の距離を計算する構成にされる。
【0016】
また、この発明に係る対話管理装置は、対話開始時において予め属性値を設定するデフォルト属性値設定部を備え、前記属性・属性値対記憶部は,対話開始時点にその設定された属性値を記憶する構成にされた。
【0017】
また、この発明に係る対話管理装置は、属性値と属性値の関連規則を記憶した属性値間関連規則記憶部を備え,
デフォルト属性値設定部は,前記属性値間規則を参照して,前記属性・属性値対記憶部中の既に確定した属性の属性値に基づいて,他の属性の属性値を設定する構成にされた。
【0018】
【発明の実施の形態】
実施の形態1。
図1はこの発明の対話管理装置の実施の形態1の構成図を示すものである。
1は,対象ドメインにおける,入力に対する外部アプリケーションへの動作要求あるいは利用者への応答に関する動作規則を記憶した対話管理規則記憶部,
2は,装置に入力された属性・属性値対に対して,前記対話管理規則記憶部に記憶された動作規則に基づいて動作を決定し,外部アプリケーションの実行要求あるいは応答生成要求を出力するとともに,後述する確認動作決定部から属性・属性値対が入力された場合には,その属性・属性値対の確認を行うための応答生成要求を出力し,確定した属性・属性値対を出力する対話管理部,
3は,前記対話管理部から入力される属性・属性値対を記憶する属性・属性値対記憶部である。
【0019】
4は,属性値間の距離を計算する規則を記憶した属性値間距離計算規則記憶部,5は,装置に入力された属性・属性値対に対して,前記属性値間距離計算規則記憶部に記憶された規則を参照して,前記属性・属性値対記憶部に記憶された属性値と入力された属性値との距離を計算して出力する属性値間距離計算部,
6は,属性値間の距離に対する閾値を記憶した属性値間距離閾値記憶部,
7は,前記属性値間距離計算部から入力される属性値間の距離と,前記属性値間距離閾値記憶部に記憶された閾値とから,確認を行う属性・属性値対を決定して出力する確認動作決定部,
8は,前記対話管理部から入力される応答生成要求に対して,応答を生成して出力する応答生成部である。
【0020】
以下,本発明を宿泊施設情報検索装置に用いた場合について具体的な動作説明を行う。宿泊施設情報検索装置とは,利用者が場所,金額などの条件を入力して希望の宿泊施設を対話的に検索するものである。
【0021】
図2は対話管理規則記憶部に記憶されたシステム動作の一例を示すもので,システム動作として「ホテル検索」「詳細情報検索」「詳細情報確認」「空室状況確認」の4つが記憶されている。各システム動作には動作に必要な属性が規定され,例えば,「ホテル検索」に対しては,「場所条件」「料金条件」「日時条件」「部屋タイプ条件」「人数条件」「宿泊日数条件」の6 つの属性が,「詳細情報検索」には「ホテル名」「情報項目名」の2つの属性が規定されている。各属性にはシステム動作に必須か非必須かの区分が規定され,例えば,「ホテル検索」の全ての属性は非必須,「詳細情報検索」の全ての属性は必須である。
【0022】
図3は属性値間距離計算規則記憶部に記憶された属性値間距離計算規則の一例を示すものである。属性「場所条件」には,各宿泊施設の地図上での位置を示すx座標とy座標の表と,二つの属性値の距離として地図上の直線距離を用いることが規定されている。属性「部屋タイプ条件」には属性値間の距離を表として規定されており,「料金条件」「日時条件」「人数条件」「宿泊日数条件」に対しては,属性値の差分の絶対値が距離として規定されている。
属性「ホテル名」に対しては,属性値が一致している場合に0,異なる場合に1という距離が規定されている。さらに,属性「情報項目」と「情報項目値」は,どのような属性値に対しても常に距離は0と規定されている。
【0023】
図4は属性値間距離閾記憶部に記憶された閾値の一例を示すものである。属性「場所条件」「部屋タイプ条件」「料金条件」「日時条件」「人数条件」「宿泊日数条件」「ホテル名」のそれぞれに対する属性値間距離の閾値が表形式で規定されている。
【0024】
まず,利用者が装置に対して「今日横浜駅の近くでシングル一名予約したいんですが」と発話した場合を例に説明する。利用者の入力音声に対する音声認識の結果として図5に示す属性・属性値対のリストが対話管理部および属性値間距離計算部に入力される。属性・属性値対とは,装置の動作に必要な属性名と,該属性に対する値を対にしたものであり,図5では,属性「場所条件」に対する属性値「横浜駅」が対となっている。
【0025】
なお本実施の形態では,装置に入力される属性・属性値対として,利用者の入力音声を音声認識した結果得られる例を用いて説明しているが,音声認識に限らず,キーボード入力,グラフィカルユーザインターフェースなどの手段によって生成されるものでも構わない。
【0026】
属性値間距離計算部は,属性・属性値対のリストが入力されるが,属性・属性値対記憶部に記憶された属性・属性値対が存在しないため動作は行わない。
一方,対話管理部は対話管理規則記憶部に記憶された各システム動作について,入力された属性と一致する属性に,入力された属性値を設定する。属性「場所条件」「日時条件」「部屋タイプ条件」「人数条件」を持つシステム動作は「ホテル検索」「空室状況確認」であり,入力から得られる属性値を設定すると各システム動作は図6に示すものとなる。
【0027】
対話管理部は,確定した属性「場所条件」「日時条件」「宿泊日数条件」の属性・属性値対のリストを属性・属性値対記憶部に出力する。属性・属性値対記憶部の状態は図7に示すものとなる。
【0028】
次に対話管理部は,必須属性を持ち,かつ該必須属性の全てに値が設定されているシステム動作,あるいは非必須属性のみを持ち,かつ該非必須属性のいずれかに値が設定されているシステム動作を選択して実行する。図6のシステム動作のうち,「ホテル検索」は非必須の属性のみ持ち,非必須属性に値を持つため,対話管理部はシステム動作「ホテル検索」を選択し,例えばSQLによる検索要求を生成して外部のデータベース検索アプリケーションへ出力する。
【0029】
外部のデータベース検索アプリケーションから,検索結果として図8に示すホテル名のリストが入力されると,対話管理部は検索結果とともに検索結果の応答生成要求を応答生成部に出力する。
【0030】
応答生成部は,検索結果と検索結果の応答生成要求が入力されると,例えば音声合成により,「その条件に合うのは東急イン横浜,ベイシェラトンなど6件ございます。」という応答を生成して利用者に提示する。
【0031】
装置からの応答の後,利用者が次に「東急イン横浜はいくらですか」と発話したとする。このとき,音声認識において「今日九人横浜はいくらですか」という認識誤りが生じ,対話管理部および属性値間距離計算部に図9に示す属性・属性値対のリストが入力されたとする。
【0032】
図9に示す属性・属性値対のリストが入力されると,属性値間距離計算部は,属性「日時条件」「人数条件」について,属性・属性値対記憶部に記憶された属性値と入力された属性値との距離を計算する。まず,属性「日時条件」については,属性・属性値対記憶部に記憶された属性値は「今日」,入力された属性値は「今日」であり,属性値間距離計算規則に基づいて距離値が0と求まる。次に,属性「人数条件」については,属性・属性値対記憶部に記憶された属性値は「1」,入力された属性値は「9」であり,属性値間距離計算規則に基づいて距離値が8と求まる。以上の計算結果を確認動作決定部に出力する。
【0033】
確認動作決定部は,入力された属性のうち,属性値間距離が属性値間距離閾値記憶部に記憶された閾値以上である属性を選択して出力する。今,属性「日時条件」の属性値間距離0と,属性「人数条件」の属性値間距離8が入力された場合,属性値間距離閾値記憶部に記憶された閾値は,属性「日時条件」が5,属性「人数条件」が3であるため,閾値以上となる属性「人数条件」を選択して図10 に示す属性・属性値対を対話管理部に出力する。
【0034】
対話管理部は,音声認識結果として図9に示す属性・属性値対のリストと,確認動作決定部から図10に示す属性・属性値対が入力されると,まず,確認動作決定部から入力された属性・属性値対の確認対話を行うため,図10に示す属性・属性値対と確認応答生成要求を応答生成部に出力する。
【0035】
応答生成部は,図10に示す属性・属性値対と確認応答生成要求が入力されると,例えば音声合成により,「人数を九名にご変更ですか」と利用者に確認する。
【0036】
利用者が「いいえ」と応答すると,音声認識の結果として図11 に示す属性・属性値対が対話管理部へ入力される。確認に対して否定されたため,対話管理部は図9に示す入力から図10に示す属性・属性値対を棄却する。
【0037】
次に対話管理部は,属性「日時条件」の属性値「今日」のみをシステム動作の属性「日時条件」に設定するが,属性値「今日」は以前の値と同一であり,属性値の変更が生じる属性が存在しない。このため,対話管理部はいずれのシステム動作も選択せず,次の入力を促す応答の生成要求を応答生成部に出力し,応答生成部は利用者に「次の入力をどうぞ」という応答を生成して利用者に提示する。
【0038】
以上の動作により,
属性・属性値対記憶部が一度入力され確定した属性値を記憶し,
属性値間距離計算部が,新たに入力された属性値と属性・属性値対記憶部に記憶された属性値との距離を計算して出力し,
確認動作決定部が,属性値間距離が規定された閾値以上の属性の確認を行うことを決定して,該属性の属性・属性値対を出力するため,
音声認識結果に対する音響的・言語的な信頼度のような,一入力のみから定まり対話文脈が考慮されない尺度では検出できない入力誤りを検出し,検出した場合に確認対話を行うことで,不要な確認対話を増加させることなく誤りを棄却することが可能となる。
【0039】
実施の形態2。
実施の形態2は,上述の実施の形態1とは属性値間距離計算規則記憶部,属性値間距離計算部,属性値間距離閾値記憶部が異なるものであり,他は実施の形態1と同一である。従って,基本的には図1の構成を有しているため,図1 を参照することとする。以下,本実施の形態における属性値間距離計算規則記憶部,属性値間距離計算部,属性値間距離閾値記憶部について説明する。
【0040】
図12は属性値間距離計算規則記憶部に記憶された属性値間距離計算規則の一例を示すものである。属性「場所条件」および「部屋タイプ条件」の各属性値は予め複数の属性値クラスに分類されている。例えば,属性「場所条件」に対する属性値は「繁華街に近い」「繁華街に比較的近い」「繁華街から遠い」の三つの属性値クラスに分類され,各属性値クラス間の距離が表形式で規定されている。
その他の「料金条件」「日時条件」「人数条件」「宿泊日数条件」「ホテル名」「情報項目」「情報項目値」の各属性については,図3の属性値間距離を用いる。
【0041】
図13は属性値クラス間距離閾値記憶部に記憶された属性値クラス間距離閾値の一例を示すもので,属性「場所条件」「部屋タイプ条件」に対して属性値クラス間距離の閾値が規定されている。その他の「料金条件」「日時条件」「人数条件」「宿泊日数条件」「ホテル名」「情報項目」「情報項目値」の各属性については,図4の属性値間距離閾値を用いる。
【0042】
図14に示す属性・属性値対のリストが対話管理部および属性値間距離計算部に入力されると,対話管理部は実施の形態1と同様に動作し,外部のデータベース検索アプリケーションへ検索要求を出力して検索結果を受け取り,応答生成部へ検索結果の応答生成要求を出力する。応答生成部は「その条件に合うのはヨコハマビサイドホテル,ビジネスホテルサンケイなど14件ございます。」という応答を生成して利用者に提示する。ここまで処理が完了した時点において,属性・属性値対記憶部の状態は図15に示すものとなっている。
【0043】
利用者の次の入力として,対話管理部および属性値間距離計算部に図16に示す属性・属性値対のリストが入力されたとする。属性・属性値対記憶部には属性「場所条件」に対する属性値は存在するが,属性「料金条件」に対する属性値は存在しない。このため,属性値間距離計算部は属性・属性値対記憶部に値を持つ属性「場所条件」の属性値間距離のみを計算する。
【0044】
属性「場所条件」について,属性・属性値対記憶部に記憶された属性値は「関内駅」で属する属性値クラスは「繁華街から近い」であり,入力された属性値は「磯子駅」で属する属性値クラスは「繁華街から遠い」である。図12 に示す属性値間距離計算規則を参照すると,これら二つの属性値クラス間の距離は2であり,この値を確認動作決定部に出力する。
【0045】
属性値間距離計算部から,属性「場所条件」の属性値クラス間距離として2が入力されると,確認動作決定部は図13に示す属性値間距離閾値記憶部を参照し,入力された属性「場所条件」の属性値クラス間距離が閾値以上であるため,図17 に示す属性・属性値対を対話管理部に出力する。
【0046】
その後,対話管理部および応答生成部が実施の形態1と同様に動作して,利用者に「磯子駅近くに変更なさいますか」という確認を行い,利用者がこれを否定すると,対話管理部は図16に示す入力に含まれる属性「場所条件」に関する属性・属性値対を棄却し,属性「料金条件」の属性値「12000」のみをシステム動作の属性「料金条件」に設定する。
【0047】
以上の動作により,
同一属性に対する属性値を予め複数のクラスに分類しておき,属性・属性値対記憶部が一度入力され確定した属性値を記憶し,属性値間距離計算部が,属性・属性値対記憶部に記憶された属性値と新たに入力された属性値との属性値クラス間距離を計算して出力し,確認動作決定部が,属性値間クラス間距離が規定された閾値以上の属性の確認を行うことを決定して,該属性の属性・属性値対を出力するため,音声認識結果に対する音響的・言語的な信頼度のような,一入力のみから定まり対話文脈が考慮されない尺度では検出できない入力誤りを検出し,検出した場合に確認対話を行うことで,不要な確認対話を増加させることなく誤りを棄却することが可能となる。
【0048】
実施の形態3。
図18は本発明の実施の形態3による対話管理装置の構成を示すブロック図である。実施の形態3においては,上述の実施の形態1の構成に対して,さらにデフォルト属性値設定部を付加した点のみが異なるものであり,他は実施の形態1と同一である。以下,デフォルト属性値設定部の動作について説明する。
【0049】
デフォルト属性値設定部は,対話開始直時点において予め指定された属性値を属性・属性値対記憶部に設定する。例えば,属性「料金条件」「人数条件」「宿泊日数条件」のデフォルト値として,図19に示す属性値を指定した場合,デフォルト属性値設定部により属性・属性値対記憶部の状態は図20に示すものとなる。
【0050】
対話が開始され,利用者の入力として図21 に示す属性・属性値対のリストが対話管理部および属性値間距離計算部に入力されたとする。属性・属性値対記憶部には属性「料金条件」に対する属性値が存在するため,属性値間距離計算部は属性「料金条件」の属性値間距離を計算する。属性・属性値対記憶部の属性値は「15000」,入力の属性値は「5」であるので,属性値間距離として14995を出力する。
一方,属性値・属性値対記憶部には属性「場所条件」に対する属性値は存在しないため,属性値間距離計算部は属性「場所条件」の属性値間距離の計算は行わない。
【0051】
確認動作決定部は,属性値「料金条件」に対する属性値間距離14995が閾値5000を越えているので,図22に示す属性・属性値対を対話管理部に出力する。
【0052】
その後,対話管理部および応答生成部が実施の形態1と同様に動作して,利用者に「料金のご希望は5円ですか」という確認を行い,利用者がこれを否定すると,対話管理部は図16に示す入力に含まれる属性「料金条件」に関する属性・属性値対を棄却し,属性「場所条件」の属性値「横浜駅」のみをシステム動作の属性「場所条件」に設定する。
【0053】
以上の動作により,デフォルト属性値設定部が,対象ドメインにおいて期待される標準的な属性値を対話開始時点に属性・属性値記憶部に設定し,属性値間距離計算部が,属性・属性値対記憶部に記憶された属性値と新たに入力された属性値との属性値間距離を計算して出力し,確認動作決定部が,属性値間クラス間距離が規定された閾値以上の属性の確認を行うことを決定して,該属性の属性・属性値対を出力するため,対話文脈がまだ無い対話開始直後の利用者の発話に対しても,音声認識結果に対する音響的・言語的な信頼度では検出できない入力誤りを検出し,検出した場合に確認対話を行うことで,不要な確認対話を増加させることなく誤りを棄却することが可能となる。
【0054】
実施の形態4。
図23は本発明の実施の形態4による対話管理装置の構成を示すブロック図である。実施の形態4においては,上述の実施の形態1の構成に対して,さらに属性値間関連規則記憶部とデフォルト属性値設定部を付加した点のみが異なるものであり,他は実施の形態1と同一である。以下,属性値間関連規則記憶部とデフォルト属性値設定部について説明する。
【0055】
図24は属性値間関連規則を表形式で記述した一例を示すものである。例えば属性「場所条件」の属性値に対して,属性「料金条件」の属性値が関連付けられており,属性「場所条件」の属性値「横浜駅」に対して属性「料金条件」の属性値「20000」が関連付けられている。
【0056】
対話が開始され,利用者の入力として図25 に示す属性・属性値対のリストが対話管理部および属性値間距離計算部に入力されたとする。対話管理部は実施の形態1と同様に動作し,外部のデータベース検索アプリケーションへ検索要求を出力して検索結果を受け取り,応答生成部へ検索結果の応答生成要求を出力する。応答生成部は「その条件に合うのはヨコハマプラザホテル,横浜国際ホテルなど9件ございます。」という応答を生成して利用者に提示する。ここまで処理が完了した時点において,属性・属性値対記憶部の状態は図26に示すものとなっている。
【0057】
属性・属性値対記憶部の状態が更新されると,デフォルト属性値設定部は,属性値間関連規則記憶部に記憶された属性値間関連規則を参照して,属性・属性値対記憶部中の既に確定した属性の属性値に基づいて,他の属性の属性値を設定する。
【0058】
今,属性・属性値対記憶部の状態が図26に更新された場合,属性「場所条件」および「部屋タイプ条件」は属性値を持ち,かつ図24に示す属性値間関連規則には,それらの属性について属性値間関連規則が規定されている。そこで,デフォルト属性値設定部は属性「場所条件」の属性値「横浜駅」から属性「料金条件」のデフォルト値として「20000」を,属性「部屋タイプ条件」の属性値「和室」から属性「人数条件」のデフォルト値として「4」を設定し,属性・属性値対記憶部は図27 に示すものとなる。
【0059】
利用者の次の入力として,図28に示す属性・属性値対のリストが対話管理部および属性値間距離計算部に入力されたとする。属性・属性値対記憶部には属性「人数条件」に対する属性値が存在するため,属性値間距離計算部は属性「人数条件」の属性値間距離を計算する。属性・属性値対記憶部の属性値は「4」,入力の属性値は「1」であるので,属性値間距離として3を出力する。
【0060】
確認動作決定部は,属性値「人数条件」に対する閾値が3,入力された属性値間距離3なので,図29に示す属性・属性値対を対話管理部に出力する。
【0061】
図29に示す属性・属性値対が入力されると,対話管理部および応答生成部が実施の形態1と同様に動作して,利用者に「一名様ですか?」という確認を行い,利用者がこれを否定すると,対話管理部は図28に示す入力に含まれる属性「人数条件」に関する属性・属性値対を棄却し,属性「日時条件」の属性値「明日」のみをシステム動作の属性「日時条件」に設定する。
【0062】
以上の動作により,
属性値間関連規則記憶部に属性値と属性値の関連規則を記憶し,
デフォルト属性値設定部が,前記属性値間関連規則記憶部に記憶された属性値間関連規則を参照して,記属性・属性値対記憶部中の既に確定した属性の属性値に基づいて,他の属性の属性値を設定し,
属性値間距離計算部が,属性・属性値対記憶部に記憶された属性値と新たに入力された属性値との属性値間距離を計算して出力し,
確認動作決定部が,属性値間距離が規定された閾値以上の属性の確認を行うことを決定して,該属性の属性・属性値対を出力するため,
音声認識結果に対する音響的・言語的な信頼度では検出できない,対話文脈上,既に確定した情報に矛盾するような入力誤りを検出し,検出した場合に確認対話を行うことで,不要な確認対話を増加させることなく誤りを棄却することが可能となる。
【0063】
【発明の効果】
先に入力された属性値と、新たに入力された属性値との距離を計算し,属性値間距離が規定された閾値以上の時は属性の確認を行うことするため,言語的な信頼度のような,一入力のみから定まり対話文脈が考慮されない尺度では検出できない入力誤りを検出し,検出した場合に確認対話を行うことで,不要な確認対話を増加させることなく誤りを棄却することが可能となる。
【0064】
同一属性に対する属性値を予め複数のクラスに分類しておき,属性値間距離計算部が,属性・属性値対記憶部に記憶された属性値と新たに入力された属性値との属性値クラス間距離を計算し,該計算結果が規定された閾値以上のときは属性の確認を行うことをするため,言語的な信頼度のような,一入力のみから定まり対話文脈が考慮されない尺度では検出できない入力誤りを検出し,検出した場合に確認対話を行うことで,不要な確認対話を増加させることなく誤りを棄却することが可能となる。
【0065】
デフォルト属性値設定部が,対象ドメインにおいて期待される標準的な属性値を対話開始時点に属性・属性値記憶部に設定し,属性値間距離計算部が,属性・属性値対記憶部に記憶された属性値と新たに入力された属性値との属性値間距離を計算して出力し,確認動作決定部が,属性値間クラス間距離が規定された閾値以上の属性の確認を行うため,対話文脈がまだ無い対話開始直後の利用者の発話に対しても,言語的な信頼度では検出できない入力誤りを検出し,検出した場合に確認対話を行うことで,不要な確認対話を増加させることなく誤りを棄却することが可能となる。
【0066】
属性値間関連規則記憶部に属性値と属性値の関連規則を記憶し,デフォルト属性値設定部が,前記属性値間関連規則記憶部に記憶された属性値間関連規則を参照して,記属性・属性値対記憶部中の既に確定した属性の属性値に基づいて,他の属性の属性値を設定し,
属性値間距離計算部が,属性・属性値対記憶部に記憶された属性値と新たに入力された属性値との属性値間距離を計算し,該計算の結果が規定された閾値以上の属性の確認を確認動作決定部が行って,該属性の属性・属性値対を出力するため,
言語的な信頼度では検出できない,対話文脈上,既に確定した情報に矛盾するような入力誤りを検出し,検出した場合に確認対話を行うことで,不要な確認対話を増加させることなく誤りを棄却することが可能となる。
【図面の簡単な説明】
【図1】 この発明の対話管理装置の実施の形態1の構成図。
【図2】 システム動作規則の説明図。
【図3】 属性値間距離計算規則の説明図。
【図4】 属性値間距離閾値の説明図。
【図5】 入力音声の音声認識結果による属性・属性値対リスト説明図。
【図6】 属性値が入力されたシステム動作規則の説明図。
【図7】 確定した属性・属性値対のリストの説明図。
【図8】 外部データベース検索結果の入力説明図。
【図9】 音声誤認識結果に基づく属性・属性値対のリストの説明図。
【図10】 属性値間距離が閾値以上の属性の選択結果の説明図。
【図11】 利用者応答の音声認識結果による属性・属性値対の説明図。
【図12】 この発明の対話管理装置の実施の形態2における属性値間距離計算規則の一例を示す説明図。
【図13】 属性値クラス間距離閾値の一例を示す説明図。
【図14】 利用者の要求事項が入力された属性・属性値対リストの説明図。
【図15】 処理途中における属性・属性値対記憶部の状態の説明図。
【図16】 処理途中で利用者より入力された条件結果の属性・属性値対のリストの説明図。
【図17】 属性値クラス間距離が閾値以上の属性・属性値対の説明図。
【図18】 本発明の実施の形態3による対話管理装置の構成を示すブロック図。
【図19】 デフォルト属性値設定部で対話開始直時点に属性・属性値対記憶部に設定する属性値の説明図。
【図20】 図19の属性値が入力された属性・属性値対記憶部の状態説明図。
【図21】 実施の形態3における処理途中で利用者より入力された条件結果の属性・属性値対の説明図。
【図22】 実施の形態3における属性値間距離が閾値以上の属性・属性値対の説明図。
【図23】 本発明の実施の形態4による対話管理装置の構成を示すブロック図。
【図24】 属性値間関連規則を表形式で記述した一例の説明図。
【図25】 実施の形態4による利用者の要求事項が入力された属性・属性値対リストの説明図。
【図26】 図25の属性値が入力された属性・属性値対記憶部の状態の説明図。
【図27】 デフォルト属性値設定部によるデフォルト値設定後の属性・属性値対記憶部の状態の説明図。
【図28】 実施の形態4における処理途中での利用者入力の条件結果による属性・属性値対の説明図である。
【図29】 実施の形態4における属性値間距離が閾値以上の属性・属性値対の説明図である。
【図30】 従来の桁無し数字音声認識制御方法の動作フローチャート。
【図31】 従来の認識結果の信頼度を用いて確認動作を制御する対話管理方式の動作説明図。
【符号の説明】
1:対話管理規則記憶部,2:対話管理部,3:属性・属性値対記憶部、4:属性値間距離計算規則記憶部,5:属性値間距離計算部,6:属性値間距離閾値記憶部,7:確認動作決定部,8:応答生成部。
Claims (4)
- 処理動作の属性と,該属性に対する値を対にした属性・属性値対を記憶する属性・属性値対記憶部と,
属性値間の距離を計算する規則を記憶した属性値間距離計算規則記憶部と,
処理動作により先に入力された属性値と後から入力された属性値との間の距離を属性値間距離計算規則記憶部の規則に基づき計算する属性値間距離計算部と,属性値間距離計算部の結果を所定値と比較し、その比較結果から,利用者への確認が必要な属性・属性値対であるか否かを決定して出力する確認動作決定部と,対象ドメインにおける処理動作に関する動作規則を記憶した対話管理規則記憶部と,
入力された属性・属性値対に対して,前記対話管理規則記憶部に記憶された動作規則に基づいて次の動作を決定し,この次動作実行用の要求信号を出力するとともに,確認動作決定部から属性・属性値対が入力された場合には,その属性・属性値対の確認を行うための応答生成要求を出力し,確定した属性・属性値対を出力する対話管理部と、
対話管理部からの応答生成要求に対して,応答を生成して出力する応答生成部とを備えることを特徴とする対話管理装置。 - 前記属性値間距離計算規則記憶部は,同一属性に対する属性値を予め複数のクラスに分類し、属性値クラス間の距離を計算する規則を記憶し,
前記属性値間距離計算部は,属性値クラス間の距離を計算する構成にされる
ことを特徴とする請求項1記載の対話管理装置。 - 対話開始時において予め属性値を設定するデフォルト属性値設定部を備え、前記属性・属性値対記憶部は,対話開始時点にその設定された属性値を記憶する構成にされることを特徴とする請求項1〜2いずれか記載の対話管理装置。
- 属性値と属性値の関連規則を記憶した属性値間関連規則記憶部を備え,
デフォルト属性値設定部は,前記属性値間規則を参照して,前記属性・属性値対記憶部中の既に確定した属性の属性値に基づいて,他の属性の属性値を設定する構成にされたことを特徴とする請求項3記載の対話管理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001156632A JP3945187B2 (ja) | 2001-05-25 | 2001-05-25 | 対話管理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001156632A JP3945187B2 (ja) | 2001-05-25 | 2001-05-25 | 対話管理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002351492A JP2002351492A (ja) | 2002-12-06 |
JP3945187B2 true JP3945187B2 (ja) | 2007-07-18 |
Family
ID=19000621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001156632A Expired - Fee Related JP3945187B2 (ja) | 2001-05-25 | 2001-05-25 | 対話管理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3945187B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005181386A (ja) * | 2003-12-16 | 2005-07-07 | Mitsubishi Electric Corp | 音声対話処理装置及び音声対話処理方法並びにプログラム |
KR100764174B1 (ko) | 2006-03-03 | 2007-10-08 | 삼성전자주식회사 | 음성 대화 서비스 장치 및 방법 |
JP5749230B2 (ja) * | 2012-08-07 | 2015-07-15 | 日本電信電話株式会社 | 音声認識装置とその方法とプログラム |
CN104360897B (zh) * | 2014-10-29 | 2017-09-22 | 百度在线网络技术(北京)有限公司 | 对话处理方法和对话管理系统 |
JP2018063271A (ja) * | 2015-02-27 | 2018-04-19 | パナソニックIpマネジメント株式会社 | 音声対話装置、音声対話システム、および、音声対話装置の制御方法 |
JP6664072B2 (ja) | 2015-12-02 | 2020-03-13 | パナソニックIpマネジメント株式会社 | 探索支援方法、探索支援装置、及び、プログラム |
JP6562355B2 (ja) * | 2015-12-02 | 2019-08-21 | パナソニックIpマネジメント株式会社 | 探索支援方法、探索支援装置、及び、プログラム |
US11048995B2 (en) | 2017-05-16 | 2021-06-29 | Google Llc | Delayed responses by computational assistant |
-
2001
- 2001-05-25 JP JP2001156632A patent/JP3945187B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002351492A (ja) | 2002-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10331784B2 (en) | System and method of disambiguating natural language processing requests | |
US8612212B2 (en) | Method and system for automatically detecting morphemes in a task classification system using lattices | |
US20060287868A1 (en) | Dialog system | |
US7689418B2 (en) | Method and system for non-intrusive speaker verification using behavior models | |
JP4222743B2 (ja) | 信頼性ベースのアクセス認証用のシステム、プログラムおよび方法 | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
US6490560B1 (en) | Method and system for non-intrusive speaker verification using behavior models | |
US5452397A (en) | Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list | |
US8494862B2 (en) | Method for triggering at least one first and second background application via a universal language dialog system | |
JP5951161B2 (ja) | 音声認識装置及び音声認識方法 | |
US20070219792A1 (en) | Method and system for user authentication based on speech recognition and knowledge questions | |
US5832429A (en) | Method and system for enrolling addresses in a speech recognition database | |
JP2005181386A (ja) | 音声対話処理装置及び音声対話処理方法並びにプログラム | |
JP2018081185A (ja) | 音声認識装置、音声認識システム | |
JP2007124686A (ja) | 音声認識データベースにアドレスを登録する方法とシステム | |
US11537661B2 (en) | Systems and methods for conversing with a user | |
JP3945187B2 (ja) | 対話管理装置 | |
JPH11327585A (ja) | 自由音声評点法を用いた動的音声認識の方法および装置 | |
JP3530109B2 (ja) | 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体 | |
CN110211576B (zh) | 一种语音识别的方法、装置和系统 | |
EP1470549B1 (en) | Method and system for non-intrusive speaker verification using behavior models | |
JP3420965B2 (ja) | 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体 | |
JP5215512B2 (ja) | 発声内に含まれる会社名の自動認識方法 | |
JP2002278589A (ja) | 音声対話装置、音声対話処理方法、音声対話処理プログラムおよびその記録媒体 | |
EP1758351B1 (en) | Method and system for enrolling addresses in a speech recognition database |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20040702 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070320 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070402 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3945187 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100420 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110420 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120420 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120420 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130420 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130420 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140420 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |