JP2003029782A - 対話処理装置及び対話処理方法並びにプログラム - Google Patents
対話処理装置及び対話処理方法並びにプログラムInfo
- Publication number
- JP2003029782A JP2003029782A JP2001220135A JP2001220135A JP2003029782A JP 2003029782 A JP2003029782 A JP 2003029782A JP 2001220135 A JP2001220135 A JP 2001220135A JP 2001220135 A JP2001220135 A JP 2001220135A JP 2003029782 A JP2003029782 A JP 2003029782A
- Authority
- JP
- Japan
- Prior art keywords
- hypothesis
- reliability
- meaning item
- meaning
- understanding result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Complex Calculations (AREA)
Abstract
者に意味項目の正誤確認を行うか否かを決定することか
ら、誤り意味項目の検出精度が悪いという課題があっ
た。 【解決手段】 入力情報の内容を意味項目ごとに認識し
た仮説を、該入力情報に関する尤度に応じて複数生成す
るとともに、これらのうち所定の尤度を有する仮説を理
解結果仮説として選択する仮説生成手段と、理解結果仮
説の各意味項目に対して、該意味項目を有する仮説間の
尤度和である信頼度を算出する信頼度計算手段と、理解
結果仮説の意味項目に対して、複数の仮説において意味
項目同士が共起する割合である関連度を算出する関連度
計算手段と、理解結果仮説の意味項目の信頼度と該意味
項目についての関連度とに基づいて、該理解結果仮説に
関する利用者への応答情報を生成する対話管理手段とを
備える。
Description
ンタフェースとして音声認識や文字認識を利用する対話
処理装置に係り、特に入力情報に対する誤りを意味項目
間の関連度や既知の誤りに基づいた信頼度補正値を用い
て高精度に検出する対話処理装置及び対話処理方法並び
に該対話処理をコンピュータに実行させるプログラムに
関するものである。
する)を入力とする対話処理装置では、その動作を決定
するために、発話内容を解釈する音声理解処理を必要と
する。図10は上述した音声理解処理の一例を示す図で
ある。通常、音声理解処理は、音声認識処理と言語理解
処理とを組み合わせることで実施される。例えば、入力
された発話「東急イン横浜関内でそれ一泊お願いしま
す」に音声認識処理を適用することで、単語系列「あと
/九人/横浜/が/無い/で/それ/一泊/お/願い/
し/ます」を得る。次に、この単語系列に言語理解処理
を適用することで、予め規定された形式による意味内容
の表記として、同図に示すような意味項目「人数=9」
「場所=横浜市」「泊数=1」「意図=値指定」の組み
合わせを得る。
得られる意味項目の組み合わせ(以下、理解結果と称す
る)には、しばしば誤りが含まれる。図10では「東急
イン横浜関内」と発声されている区間を、誤って「あと
/九人/横浜/が/無い」と認識したために、本来生成
すべき意味項目「ホテル=東急イン横浜関内」の代わり
に、誤った意味項目「人数=9」と「場所=横浜市」と
を生成している。
そのまま受理してしまうと、適切な動作を行うことがで
きない。かといって、理解結果が得られた全ての意味項
目に対して、利用者に正誤を逐一確認した場合、本来正
しい意味項目に対しても確認を行うことになるから、対
話が冗長となり、利便性の悪い装置になってしまう。
音声認識スコアから計算される信頼度を各意味項目に付
与し、その信頼度に基づいて意味項目の確認を行う対話
処理方式が、下記文献1で提案されている。文献1:"
Incorporating confidence
measures in the Dutch tra
in timetable information
system developed in ARISE
project"(G.Bouwman,J.Stu
rm,and L.Boves,Proc.ICASS
P99,pp.493−496,1999).
式を適用した対話処理装置の構成を示すブロック図であ
り、音声対話によってホテルの検索や予約を行う例につ
いて示している。図において、100は不図示の音声入
力手段と接続する音声理解部で、該音声入力手段を介し
て利用者から入力された発話に対して音声認識・理解処
理を施して意味項目の組み合わせからなる尤度付きの仮
説群を生成すると共に、これらの中から尤度が最大とな
る仮説を理解結果として選択する。101は意味項目の
信頼度を算出する信頼度計算部であって、音声理解部1
00から入力した理解結果と尤度付きの仮説群とに基づ
いて理解結果に含まれる各意味項目の信頼度を算出す
る。102は対話管理部103と接続する対話状況記憶
部で、対話管理部103から入力した対話状況を保持す
る。103は利用者に提示する応答を生成する対話管理
部であって、音声理解部100からの理解結果、信頼度
計算部101からの信頼度、対話状況記憶部102が保
持する対話状況、及びホテルデータベース105が保持
するホテル情報とを参照して利用者に提示する応答を生
成する。104は対話管理部103から入力した応答を
利用者に提示する応答出力部で、例えば対話管理部10
3からの応答を文字列として不図示のディスプレイ上に
表示する。105はホテル情報を保持するホテルデータ
ベースであって、ホテル名、所在地、交通経路、宿泊料
金や空き部屋状況をホテル情報として管理している。
話処理で得られる情報を示す図であり、この図に沿って
対話処理の概要を説明する。先ず、音声理解部100
は、入力された発話1「東急イン横浜関内でそれ一泊お
願いします」に対して音声理解処理を行って、最終的に
意味項目「人数=9」「場所=横浜市」「泊数=1」
「意図=値指定」からなる理解結果を得る。図示の例に
おいて、理解結果として選択された意味項目のうち、
「人数=9」及び「場所=横浜市」が誤って生成された
意味項目である。また、該理解結果からは、本来生成す
べき「ホテル=東急イン横浜関内」が欠落している。
中の各意味項目に対して、後述する方法で信頼度を計算
する。その結果、信頼度が予め設定した閾値0.50よ
り高い意味項目を正しい可能性が高いとして受理する。
一方、信頼度が閾値より低い場合は、誤りの可能性が高
いとして、利用者に確認を求める(あるいは、直ちに棄
却する)。確認の結果、該意味項目が誤りであることが
わかれば棄却し、逆に正しいことがわかれば受理する。
より低い意味項目は「場所=横浜市」であるから、該意
味項目の正誤を利用者に確認するため、「場所は横浜市
でよろしいですか」を出力する(応答1)。これに対し
利用者が「いいえ」を入力した場合(発話2)、該誤り
である意味項目「場所=横浜市」が棄却される。しかし
ながら、この方法では、信頼度が閾値0.50より高い
誤り意味項目「人数=9」に対しては何ら確認が行われ
ないため、該誤り意味項目を保持したまま対話が進行す
ることになる。
る意味項目が音声理解部100の理解結果に含まれる意
味項目に限定される。即ち、図12では本来あるべき正
しい意味項目である「ホテル=東急イン横浜関内」が理
解結果から脱落しているが、従来の対話処理装置では、
この脱落を検出する手段を持たず、利用者への確認もな
されない。そのため、利用者は、入力したはずの意味項
目が受理されなかったことに気付かないまま対話が進行
することになる。
ついて各構成要素ごとに説明する。先ず、音声理解部1
00は、入力された発話に対して音声認識・理解処理を
行うことで、意味項目の組み合わせからなる尤度付きの
仮説群を生成する。以下、仮説を単に仮説と称する。さ
らに、仮説群の中で尤度が最大の仮説を理解結果として
選択する。これら尤度付き仮説群及び理解結果は、信頼
度計算部101に送られる。
すブロック図である。図に示すように、音声理解部10
0は、音響分析部100a、音声認識部100b及び言
語理解部100cから構成される。先ず、利用者からの
発話は、不図示の音声入力手段を介して音響分析部10
0aに入力される。音響分析部100aでは、入力した
発話の音響分析を行って上記発話に係る入力音声の特徴
ベクトルの時系列を抽出し、音声認識部100bに出力
する。
ルの時系列に対して認識処理を施すことで、尤度の高い
単語系列を5種類生成する(尤度の上位5位までの単語
系列を生成する)。これら5種類の単語系列は、その尤
度と共に言語理解部100cに送出される。ここで、単
語系列の尤度とは、特徴ベクトルの時系列に対する単語
系列の確率的な尤もらしさを評価したスコアであり、例
えば下記文献2の第7章「連続単語モデルに基づく音声
認識」に記載される認識処理によって求められる。文献
2:"音声認識の基礎(下)"L.Rabiner,B.
H.Juang共著,古井 監訳、NTTアドバンステ
クノロジ株式会社編集・発行,1995.
た5種類の各単語系列に対して意味解析を行うことで意
味項目の組み合わせを生成する。この結果として得られ
る意味項目の組み合わせを以下では仮説と称することと
し、これら仮説の集まりを仮説群と称する。このあと、
言語理解部100cは、上記仮説群の中で尤度が最大の
ものを理解結果として選択し、この理解結果に加えて各
仮説の尤度と共に仮説群(尤度付き仮説群)を信頼度計
算部101や対話管理部103に出力する。
意味項目の生成ルールの一例を示す図である。言語理解
部100cによる意味解析は、例えば図14に示すよう
なルールを適用して行っても良い。図示の例は、「人
数」「意図」「泊数」「場所」の意味項目を生成するた
めのルールである。各ルールの左辺は意味項目のカテゴ
リ(「人数」、「意図」、「泊数」、「場所」など)を
表している。右辺は「|」で区切られた複数のパタン
(意味項目のカテゴリが「人数」の場合では、「一人」
など)と、値(パタン「一人」の場合で「@」に後続す
る「1」など)とを定義したものである。言語理解部1
00cでは、これらのパタンと単語系列とを照合して合
致するパタンに対応する値を用いて意味項目を生成す
る。例えば、単語系列「あと/九人/横浜/が/無い/
・・・」に対し人数のルールを適用すると、パタン「九
人」に合致することから、意味項目「人数=9」が生成
される。
前述した図12に見ることができる。発話に対して音声
認識処理を行うことで、尤度の大きさが1位から5位ま
での5種類の単語系列が生成される。さらに、言語理解
処理を施すことで、各単語系列より意味項目の組み合わ
せ仮説が生成される。これら仮説の中で、尤度が最大
(0.38)の意味項目の組み合わせである(人数=
9、場所=横浜市、泊数=1、意図=値設定)を理解結
果として出力する。
から理解結果及び尤度付き仮説群を入力すると、これら
に基づいて各意味項目の信頼度を計算する。これら信頼
度は、後述する対話管理部103に送出される。ここ
で、前述の図12を用いて信頼度の計算方法について説
明する。先ず、信頼度計算部101は、入力した尤度付
き仮説群に対して尤度の正規化を行う。具体的には、第
i位の単語系列の仮説に対して認識時に付与された尤度
をLiとして、下記式(1)から正規化後の尤度(事後
確率)Piを算出する。式(1)中のZは、N個の仮説
に対してPiの総和が1となるように導入した正規化係
数であり、下記式(2)から求められる。また、αは予
め定めた重み係数(定数)であり、Nは仮説数を表して
いる。ここで、仮説数Nは5である。図12に示した各
仮説の尤度は、この正規化処理後に得られる尤度Piで
ある。なお、下記式(2)におけるΣ_{j=1,2,
・・・,N}は、j=1,2,・・・,Nまでのexp
(α・Lj)の各値の総和を示している。
対する尤度の正規化処理が完了すると、下記式(3)を
用いて理解結果に含まれる各意味項目vの信頼度R
(v)を求める。ここで、式(3)中のViは、第i位
の仮説となる意味項目の組み合わせを表している。即
ち、意味項目vの信頼度R(v)は、意味項目vを含む
仮説の尤度和により与えられる。例えば、図12で意味
項目「場所=横浜市」の信頼度は、該意味項目を含む第
1位の仮説と第4位の仮説との尤度和により、0.38
+0.09≒0.46と求めたものである。
データベース105について説明する。対話状況記憶部
102は、後述する対話管理部103より書き込まれた
対話状況を保持する。図15は図11中の対話状況記憶
部が保持する対話状況の一例を示す図であり、同図を用
いて該対話状況の保持方法を説明する。図15における
枠付きのボックスは、変数(スロット)であって対話管
理部103により書き込まれた値を保持する。このうち
上段の9スロットは、理解結果として得られた意味項目
が書き込まれる。例えば、「場所」スロットは、対話中
に利用者から「横浜市」が指定されたことを示してい
る。空のスロットは、これに対応する値が利用者から入
力されていないことを示している。スロット名に*印が
付いているものは必須スロットであり、ホテルを予約す
るためには該スロットの値が必須であることを表してい
る。
味項目とは対応していない。該スロットは、対話開始時
点から空になっているが、ホテルの予約が行われると、
値「完了」が書き込まれる。「予約状況」スロットは、
対話管理部103による対話の終了判定に用いられる。
話管理部103が検索するホテル情報を保持する。図1
6は図11中のホテルデータベースが保持するホテル情
報の一例を示す図である。図示の例では、ホテル情報と
して、ホテルの名称、所在地(住所)、交通経路(最寄
駅)、宿泊料金(料金)及び空室状況がホテルごとに登
録されている。
明する。対話管理部103は、音声理解部100から受
け取る理解結果と、信頼度計算部101から受け取る信
頼度と、対話状況記憶部102が保持する対話状況と、
ホテルデータベース105が保持するホテル情報とを参
照して、利用者に出力する応答を生成する。図17は図
11中の対話管理部の動作を示すフロー図であり、同図
を用いて該対話管理部103の動作について詳細に説明
する。先ず、対話管理部103は、音声理解部100か
ら発話1に対する理解結果(意味項目の組み合わせ)を
受け取る(ステップST100)。続いて、対話管理部
103は、信頼度計算部101からステップST100
で入力した理解結果の各意味項目に関する信頼度を受け
取る(ステップST101)。
103は、ステップST100で受け取った理解結果の
意味項目に基づいて対話状況記憶部102の内容を更新
する。具体的には、図15に示した対話状況記憶部10
2が保持する対話状況の各スロットに、「意図」以外の
意味項目を書き込む。
解結果の各意味項目に関する信頼度に対して、対話管理
部103は、予め設定しておいた閾値0.50による信
頼度の閾値判定を行う(ステップST103)。これに
よって低信頼度の意味項目を検出する。このとき、理解
結果の各意味項目に関する信頼度の中に閾値に達しない
低信頼度の意味項目がない場合、対話管理部103は、
ステップST104の処理に移行する。一方、低信頼度
の意味項目がある場合は、ステップST106の処理に
移行する。
103は、下記のようにして発話1に対する応答を生成
し、応答出力部104に送出する。図18は対話管理部
による応答生成処理の一例を示すフロー図であり、同図
を用いて該ステップST104における動作を詳細に説
明する。先ず、対話管理部103は、理解結果中の意味
項目「意図」による分岐を行う(ステップST11
0)。このとき、「意図=予約要求」であればステップ
ST112の処理に移行し、「意図=値指定」であれば
ステップST111の処理に移行し、「意図=検索要
求」であればステップST115の処理に移行する。
103は、対話状況の必須スロットの内容を調べる。こ
のとき、予約に必要な全ての必須スロットが充足されて
いる場合はステップST113に処理を移す。全ての必
須スロットが充足されていない場合は、ステップST1
15の処理に移行する。
話管理部103は、対話状況の必須スロットの内容を調
べる。このとき、予約に必要な全ての必須スロットが充
足されている場合はステップST113に処理を移す。
全ての必須スロットが充足されていない場合は、ステッ
プST117の処理に移行する。
3が対話状況の必須スロットの値とホテルデータベース
105のホテル情報とを比較して実際に予約可能である
か否かを調べる。このとき、空室が見つかり予約可能で
あると、対話管理部103は、利用者に予約要求が受理
されたことを通知する「ご予約承りました」という応答
を生成して応答出力部104に送出する(ステップST
118)。
は、利用者に予約要求が受理されなかったことを通知す
る「あいにく全室ふさがっております」という応答を生
成して応答出力部104に送出する(ステップST11
9)。
ていない場合、対話管理部103は利用者に必須スロッ
トの充足を求める応答文を生成して応答出力部104に
送出する(ステップST117)。例えば、必須スロッ
ト「部屋タイプ」が未充足であった場合は、「部屋タイ
プはどうしますか」という応答を生成する。
求が受理されたことを通知すると、対話管理部103
は、対話状況の「予約状況」スロットに値「完了」を書
き込む(ステップST122)。
103は、対話状況のスロットに充足されている値を条
件としてホテルデータベース105のホテル情報を検索
し、該条件に合致するホテルを探す。このとき、上記条
件に合致するホテルが1件以上見つからない、即ち、条
件に合致するホテルがないと、対話管理部103は、
「条件に合うホテルは見つかりませんでした」という応
答を生成して応答出力部104に送出する(ステップS
T120)。
上見つかると、対話管理部103は、利用者に検索結果
を示す応答を生成して応答出力部104に送出する(ス
テップST121)。例えば、条件に合致するホテルが
横浜ベイシェラトンの1件であった場合、「1件見つか
りました。ホテル名は横浜ベイシェラトンです。」とい
う応答を生成する。以上の処理が図17におけるステッ
プST104に相当する。
の動作についての説明を続ける。ステップST104に
て応答出力部104に応答が送出されると、対話管理部
103は、対話状況記憶部102の内容に基づいて対話
の終了判定を行う(ステップST105)。このとき、
対話状況の「予約状況」スロットに値「完了」が書き込
まれていれば、対話管理部103は対話を終了する。対
話状況の「予約状況」スロットに値「完了」が書き込ま
れていない場合は、ステップST100に戻って対話を
継続する。
味項目が検出されると、対話管理部103は、この意味
項目に関する正誤を利用者に確認するための応答を生成
して応答出力部104に送出する(ステップST10
6)。例えば、図12に示すように、低信頼度の意味項
目として「場所=横浜市」が検出されると、対話管理部
103は、応答として「場所は横浜市でよろしいです
か」を生成する。
認に対する返答として、対話管理部103は、利用者か
ら音声理解部100を介して新たに入力された発話2に
対する理解結果を受け取る(ステップST107)。
いて、対話管理部103は、ステップST106で確認
を行った意味項目の誤り判定を行う(ステップST10
8)。例えば、ステップST107において、発話2が
「いいえ」であって、その理解結果として「意図=否
定」が得られた場合、対話管理部103は、ステップS
T106で確認を行った意味項目「場所=横浜市」を誤
り意味項目として確定する。このように、誤り意味項目
が確定されると、対話管理部103は、確定した誤り意
味項目を対話状況記憶部102内の対話状況スロットか
ら削除する(ステップST109)。一方、誤り意味項
目として確定されない場合、対話管理部103は、ステ
ップST104の処理に移行して、上述した処理を行
う。
ら受け取る応答を、例えば不図示のディスプレイなどに
文字列として表示して、利用者に提示する。
以上のように構成されているので、信頼度に関する単純
な閾値判定によって利用者に意味項目の正誤確認を行う
か否かを決定することから、誤り意味項目の検出精度が
悪いという課題があった。
率を上げようとして閾値を高く設定すると、正しい意味
項目に対しても頻繁に確認を行うことになって、対話処
理装置の利便性が損なわれてしまう。逆に、閾値を低く
設定すると、確認漏れにより誤り意味項目をそのまま受
理してしまうケースが生じ、対話処理装置に誤動作を生
じていた。
意味項目の検出及びその確認は、誤り意味項目の棄却の
みを目的とするものであることから、理解結果に意味項
目の脱落誤りが生じても、その誤りを検出及び確認する
ことができないという課題があった。この場合、入力し
たはずの意味項目が受理されなかったことに利用者が気
付かないまま対話が進行してしまう。これによって、対
話処理装置は利用者の期待に反した動作を行うことにな
り、利用者にとって利便性が悪い装置になってしまう。
めになされたもので、意味項目間の関連度や既知の誤り
に基づいた信頼度補正値を用いることで、入力情報の理
解誤りによる影響を低減し、利用者が確実且つ快適にタ
スクを達成することができる対話処理装置及び対話処理
方法並びに該対話処理をコンピュータに実行させるプロ
グラムを得ることを目的とする。
装置は、入力情報の内容を意味項目ごとに認識した仮説
を、該入力情報に関する尤度に応じて複数生成するとと
もに、これらのうち所定の尤度を有する仮説を理解結果
仮説として選択する仮説生成手段と、理解結果仮説の各
意味項目に対して、該意味項目を有する仮説間の尤度和
である信頼度を算出する信頼度計算手段と、理解結果仮
説の意味項目に対して、複数の仮説において意味項目同
士が共起する割合である関連度を算出する関連度計算手
段と、理解結果仮説の意味項目の信頼度と該意味項目に
ついての関連度とに基づいて、該理解結果仮説に関する
利用者への応答情報を生成する対話管理手段とを備える
ものである。
手段に信頼度及び関連度の規定値を予め設定しておき、
理解結果仮説内に信頼度が規定値以下である意味項目が
存在すると、該意味項目を認識の正誤についての確認対
象として選択するとともに、該意味項目との関連度が規
定値以上である意味項目が理解結果仮説内に存在する
と、該意味項目も認識の正誤についての確認対象に追加
した応答情報を生成するものである。
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成手段と、理解結果仮説の各意味項目に対し
て、該意味項目を有する仮説間の尤度和である信頼度を
算出する信頼度計算手段と、複数の仮説から認識に誤り
がある意味項目を含む仮説を削除し、これら仮説に基づ
いて理解結果仮説の各意味項目に対する信頼度を算出す
る補正信頼度計算手段と、理解結果仮説の意味項目の補
正信頼度に基づいて、該理解結果仮説に関する利用者へ
の応答情報を生成する対話管理手段とを備えるものであ
る。
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成手段と、理解結果仮説の各意味項目に対し
て、該意味項目を有する仮説間の尤度和である信頼度を
算出する信頼度計算手段と、認識に誤りがある意味項目
を含む仮説を削除した複数の仮説から、所定の尤度を有
する仮説を新たな理解結果仮説として選択する補正仮説
生成手段と、複数の仮説から認識に誤りがある意味項目
を含む仮説を削除し、これら仮説に基づいて新たな理解
結果仮説の各意味項目に対する信頼度を算出する補正信
頼度計算手段と、新たな理解結果仮説の各意味項目の信
頼度に基づいて、該理解結果仮説に関する利用者への応
答情報を生成する対話管理手段とを備えるものである。
手段に信頼度の規定値を予め設定しておき、理解結果仮
説内に信頼度が規定値以下である意味項目が存在する
と、該意味項目を認識の正誤についての確認対象として
選択した応答情報を生成するものである。
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成ステップと、理解結果仮説の各意味項目に対
して、該意味項目を有する仮説間の尤度和である信頼度
を算出する信頼度計算ステップと、理解結果仮説の意味
項目に対して、複数の仮説において意味項目同士が共起
する割合である関連度を算出する関連度計算ステップ
と、理解結果仮説の意味項目の信頼度と該意味項目につ
いての関連度とに基づいて、該理解結果仮説に関する利
用者への応答情報を生成する対話管理ステップと、該対
話管理ステップにて生成された応答情報を提示する応答
提示ステップとを備えるものである。
ステップにて、理解結果仮説内に信頼度が予め設定した
規定値以下である意味項目が存在すると、該意味項目を
認識の正誤についての確認対象として選択するととも
に、該意味項目との関連度が予め設定した規定値以上で
ある意味項目が理解結果仮説内に存在すると、該意味項
目も認識の正誤についての確認対象に追加した応答情報
を生成するものである。
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成ステップと、理解結果仮説の各意味項目に対
して、該意味項目を有する仮説間の尤度和である信頼度
を算出する信頼度計算ステップと、複数の仮説から認識
に誤りがある意味項目を含む仮説を削除し、これら仮説
に基づいて理解結果仮説の各意味項目に対する信頼度を
算出する補正信頼度計算ステップと、理解結果仮説の意
味項目の補正信頼度に基づいて該理解結果仮説に関する
利用者への応答情報を生成する対話管理ステップと、該
対話管理ステップにて生成された応答情報を提示する応
答提示ステップとを備えるものである。
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成ステップと、理解結果仮説の各意味項目に対
して、該意味項目を有する仮説間の尤度和である信頼度
を算出する信頼度計算ステップと、認識に誤りがある意
味項目を含む仮説を削除した複数の仮説から、所定の尤
度を有する仮説を新たな理解結果仮説として選択する補
正仮説生成ステップと、複数の仮説から認識に誤りがあ
る意味項目を含む仮説を削除し、これら仮説に基づいて
新たな理解結果仮説の各意味項目に対する信頼度を算出
する補正信頼度計算ステップと、新たな理解結果仮説の
各意味項目の信頼度に基づいて該理解結果仮説に関する
利用者への応答情報を生成する対話管理ステップと、該
対話管理ステップにて生成された応答情報を提示する応
答提示ステップとを備えるものである。
ステップにて、理解結果仮説内に信頼度が予め設定した
規定値以下である意味項目が存在すると、該意味項目を
認識の正誤についての確認対象として選択した応答情報
を生成するものである。
内容を意味項目ごとに認識した仮説を、該入力情報に関
する尤度に応じて複数生成するとともに、これらのうち
所定の尤度を有する仮説を理解結果仮説として選択する
仮説生成手段、理解結果仮説の各意味項目に対して、該
意味項目を有する仮説間の尤度和である信頼度を算出す
る信頼度計算手段、理解結果仮説の意味項目に対して、
複数の仮説において意味項目同士が共起する割合である
関連度を算出する関連度計算手段、理解結果仮説の意味
項目の信頼度と該意味項目についての関連度とに基づい
て該理解結果仮説に関する利用者への応答情報を生成す
る対話管理手段としてコンピュータを機能させるもので
ある。
内容を意味項目ごとに認識した仮説を、該入力情報に関
する尤度に応じて複数生成するとともに、これらのうち
所定の尤度を有する仮説を理解結果仮説として選択する
仮説生成手段、理解結果仮説の各意味項目に対して、該
意味項目を有する仮説間の尤度和である信頼度を算出す
る信頼度計算手段、複数の仮説から認識に誤りがある意
味項目を含む仮説を削除し、これら仮説に基づいて理解
結果仮説の各意味項目に対する信頼度を算出する補正信
頼度計算手段、理解結果仮説の意味項目の補正信頼度に
基づいて、該理解結果仮説に関する利用者への応答情報
を生成する対話管理手段としてコンピュータを機能させ
るものである。
内容を意味項目ごとに認識した仮説を、該入力情報に関
する尤度に応じて複数生成するとともに、これらのうち
所定の尤度を有する仮説を理解結果仮説として選択する
仮説生成手段、理解結果仮説の各意味項目に対して、該
意味項目を有する仮説間の尤度和である信頼度を算出す
る信頼度計算手段、認識に誤りがある意味項目を含む仮
説を削除した複数の仮説から、所定の尤度を有する仮説
を新たな理解結果仮説として選択する補正仮説生成手
段、複数の仮説から認識に誤りがある意味項目を含む仮
説を削除し、これら仮説に基づいて新たな理解結果仮説
の各意味項目に対する信頼度を算出する補正信頼度計算
手段、新たな理解結果仮説の各意味項目の信頼度に基づ
いて該理解結果仮説に関する利用者への応答情報を生成
する対話管理手段としてコンピュータを機能させるもの
である。
説明するものである。 実施の形態1.図1はこの発明の実施の形態1による対
話処理装置の構成を示すブロック図であり、対話処理に
よってホテルの検索や予約を行う例について示してい
る。図において、1は不図示の音声入力手段と接続する
音声理解部(仮説生成手段)で、該音声入力手段を介し
て利用者から入力された発話に対して音声認識・理解処
理を施して意味項目の組み合わせからなる尤度付きの仮
説群(複数の仮説)を生成すると共に、これらの中から
尤度が最大となる仮説を理解結果(理解結果仮説)とし
て選択する。2は意味項目の信頼度を算出する信頼度計
算部(信頼度計算手段)であって、音声理解部1から入
力した理解結果と尤度付きの仮説群とに基づいて理解結
果に含まれる各意味項目の信頼度を算出する。3は意味
項目の関連度を算出する関連度計算部(関連度計算手
段)で、音声理解部1から理解結果を入力して、該理解
結果内の意味項目に関する関連度を算出する。4は利用
者に提示する応答を生成する対話管理部(対話管理手
段)であって、音声理解部1からの理解結果、信頼度計
算部2からの信頼度、関連度計算部3からの関連度、対
話状況記憶部5が保持する対話状況、及びホテルデータ
ベース6が保持するホテル情報とを参照して利用者に提
示する応答を生成する。
部で、対話管理部4から入力した対話状況を保持する。
6はホテル情報を保持するホテルデータベースであっ
て、ホテル名、所在地、交通経路、宿泊料金や空き部屋
状況をホテル情報として管理している。7は対話管理部
4から入力した応答を利用者に提示する応答出力部で、
例えば対話管理部4からの応答を文字列として不図示の
ディスプレイ上に表示する。ここで、音声理解部1、信
頼度計算部2、関連度計算部3、対話管理部4、及び応
答出力部7の一部の機能は、コンピュータ装置のプロセ
ッサ(CPU)に実行させるプログラムによって実現す
ることができる。また、対話状況記憶部5やホテルデー
タベース6は、上記プロセッサによって適宜データの読
み出し・書き込みが可能なコンピュータ装置が具備する
記憶装置によって実現することができる。
の対話処理装置による対話処理で得られる情報を示す図
であり、この図に沿って対話処理の概要を説明する。先
ず、音声理解部1は、入力された発話1「東急イン横浜
関内でそれ一泊お願いします」に対して音声理解処理を
行って、意味項目「人数=9」「場所=横浜市」「泊数
=1」「意図=値指定」からなる理解結果を得る。図示
の例において、理解結果として選択された意味項目のう
ち、「人数=9」及び「場所=横浜市」が誤って生成さ
れた意味項目である(仮説生成ステップ)。
の各意味項目に対して上記従来の技術で示した方法で信
頼度を計算し、対話管理部4に出力する(信頼度計算ス
テップ)。その結果、対話管理部4は、信頼度が予め設
定された閾値(規定値)0.50より低い意味項目「場
所=横浜市」に関して、認識の誤りがある可能性が高い
と判断し、これらを正誤の確認対象として抽出する(対
話管理ステップ)。
低い意味項目「場所=横浜市」と、その他の意味項目と
の間の関連度を計算し、対話管理部4に出力する(関連
度計算ステップ)。このとき、対話管理部4は、関連度
が予め設定した閾値(規定値)0.30より高い意味項
目「人数=9」に関して、認識の誤りがある可能性が高
いと判断し、これを正誤の確認対象として抽出する(対
話管理ステップ)。
項目の正誤を利用者に確認するための「場所は横浜市、
人数は9人でよろしいですか」という応答情報を生成
し、応答出力部7に出力する(応答1)。応答出力部7
では、例えば不図示のディスプレイなどに文字列として
上記応答情報を表示して、利用者に提示する(応答提示
ステップ)。これに対して、利用者が「いいえ」を入力
した場合(発話2)、該意味項目「場所=横浜市」と
「人数=9」を棄却する。
いて各構成要素ごとに説明する。先ず、音声理解部1
は、入力された発話に対して音声認識・理解処理を行う
ことで、意味項目の組み合わせからなる尤度付きの仮説
群を生成する(仮説生成ステップ)。このとき、従来と
同様にして、音声理解部1は仮説群の中で尤度が最大の
仮説を理解結果として選択する。これら尤度付き仮説群
及び理解結果は、信頼度計算部2、関連度計算部3及び
対話管理部4に送られる。
解結果及び尤度付き仮説群を入力すると、これらに基づ
いて各意味項目の信頼度を計算する(信頼度計算ステッ
プ)。具体的には、上記従来の技術と同様に動作する。
即ち、信頼度計算部2は、入力した尤度付き仮説群に対
して尤度の正規化を行い、第i位の単語系列の仮説に対
して認識時に付与された尤度をLiとして、上記式
(1)から正規化後の尤度(事後確率)Piを算出す
る。次に、信頼度計算部2は、尤度付き仮説群に対する
尤度の正規化処理が完了すると、上記式(3)を用いて
理解結果に含まれる各意味項目vの信頼度R(v)を求
める。このようにして求められた信頼度は、対話管理部
4に送出される。
力した尤度付き仮説群に基づいて意味項目間の関連度を
計算する(関連度計算ステップ)。ここで、関連度と
は、或る2つの意味項目が仮説群中でどの程度偏って共
起するかを表す尺度である。この関連度としては、例え
ば下記式(4)に示すような、意味項目vaの意味項目
vbに対する相互情報量を用いることができる。式中、
^vaや^vbは、vaやvbが生起しないことを示し
ている。また、式中、全ての確率Pは、上記式(1)に
より正規化を行った仮説の尤度Pi(i=1,・・・,
N、Nは仮説数)に基づいて求める。さらに、P(v
b)、P(vb,va)、P(vb|va)は、それぞ
れ下記式(5)、式(6)、式(7)により求める。
意味項目「場所=横浜市」と、理解結果におけるその他
の意味項目との関連度を示している。関連度計算部2に
よって、上述の方法で関連度を計算すると、それぞれ
「人数=9」で0.363、「泊数=1」で0.00
5、「意図=値指定」0.000と求まる。これらのう
ち、関連度が大きい意味項目「人数=9」は、出現する
仮説がほぼ「場所=横浜市」と一致していることを意味
する。従って「人数=9」の正誤は、「場所=横浜市」
の正誤と強い相関を持つ。このようにして求められた信
頼度が閾値0.50より低い意味項目「場所=横浜市」
と、理解結果におけるその他の意味項目との関連度は、
対話管理部4に送出される。
取る理解結果と、信頼度計算部2から受け取る信頼度
と、関連度計算部3から受け取る関連度と、対話状況記
憶部5が保持する対話状況と、ホテルデータベース6が
保持するホテルの情報とを参照して、利用者に出力する
応答を生成する(対話管理ステップ)。図3は図1中の
対話管理部による動作を示すフロー図であり、同図を用
いて該対話管理部の動作について詳細に説明する。先
ず、対話管理部4は、音声理解部1から発話1に対する
理解結果(意味項目の組み合わせ)を受け取る(ステッ
プST1)。続いて、対話管理部4は、信頼度計算部2
からステップST1で入力した理解結果の各意味項目に
関する信頼度を受け取る(ステップST2)。ステップ
ST3において、対話管理部4は、ステップST1で受
け取った理解結果の意味項目に基づいて対話状況記憶部
5の内容を更新する。具体的には、図15に示すような
対話状況記憶部5が保持する対話状況の各スロットに、
「意図」以外の意味項目を書き込む。
果の各意味項目に関する信頼度に対して、対話管理部4
は、予め設定しておいた閾値0.50による信頼度の閾
値判定を行う(ステップST4)。これによって低信頼
度の意味項目を検出する。このとき、理解結果の各意味
項目に関する信頼度の中に閾値に達しない低信頼度の意
味項目がない場合、対話管理部4は、ステップST5の
処理に移行する。一方、低信頼度の意味項目がある場合
は、ステップST7の処理に移行する。ステップST5
において、対話管理部4は、下記のようにして発話1に
対する応答を生成し、応答出力部7に送出する。
管理部4は、対話状況記憶部5の内容に基づいて対話の
終了判定を行う(ステップST6)。このとき、対話状
況の「予約状況」スロットに値「完了」が書き込まれて
いれば、対話管理部4は対話を終了する。対話状況の
「予約状況」スロットに値「完了」が書き込まれていな
い場合は、ステップST1に戻って対話を継続する。
目が検出されると、関連度計算部3は、音声理解部1か
ら入力した尤度付き仮説群に基づいて、上記低信頼度の
意味項目と理解結果内の他の意味項目との間における関
連度を計算し、対話管理部4に送出する(ステップST
7)。
した低信頼度の意味項目と、ステップST1で得られた
理解結果に含まれるその他の意味項目との関連度に関
し、予め定めた閾値0.30による閾値判定を行い、高
関連度の意味項目を検出する。このあと、対話管理部4
は、ステップST4で検出した低信頼度の意味項目、及
びステップST7で検出した高関連度の意味項目に関
し、その正誤を利用者に確認するための応答を生成し、
応答出力部7に送出する(ステップST8)。例えば、
図2に示すように、低信頼度の意味項目として「場所=
横浜市」が検出され、高関連度の意味項目として「人数
=9」が検出されている場合、対話管理部4は「場所は
横浜市、人数は九人でよろしいですか」という応答を生
成する。
認に対する返答として、対話管理部4は、利用者から音
声理解部1を介して新たに入力された発話2に対する理
解結果を受け取る(ステップST9)。
いて、対話管理部4は、ステップST8で確認を行った
意味項目の誤り判定を行う(ステップST10)。例え
ば、ステップST9において、発話2「いいえ」より理
解結果「意図=否定」が得られた場合、対話管理部4
は、ステップST8で確認を行った意味項目「場所=横
浜市」及び「人数=9」を誤り意味項目として確定す
る。このように、誤り意味項目が確定されると、対話管
理部4は、確定した誤り意味項目を対話状況記憶部5内
の対話状況スロットから削除する(ステップST1
1)。一方、誤り意味項目として確定されない場合、対
話管理部4は、ステップST5の処理に移行して、上述
した処理を行う。
る応答を、例えば不図示のディスプレイなどに文字列と
して表示して、利用者に提示する(応答提示ステッ
プ)。
ば、信頼度が低い意味項目に加え、該意味項目に関連度
の高い意味項目(即ち、信頼度の低い意味項目が出現す
る仮説に生起がほぼ限定される意味項目)を検出し、正
誤を利用者に確認するので、該信頼度の低い意味項目が
誤りである場合、これに対して高い関連度を示す意味項
目はその生起確率が極めて小さくなることから同様に誤
りである可能性が高い。これにより、信頼度に対する閾
値判定では検出できない誤り意味項目を、高精度に検出
することが可能であり、誤り意味項目の確認漏れに起因
する対話処理装置の誤動作の問題を解決することができ
る。
態2による対話処理装置の構成を示すブロック図であ
り、対話処理によってホテルの検索や予約を行う例につ
いて示している。図において、4aは利用者に提示する
応答を生成する対話管理部(対話管理手段)であって、
音声理解部1からの理解結果、信頼度計算部2からの信
頼度、補正信頼度計算部8からの補正信頼度、対話状況
記憶部5が保持する対話状況、及びホテルデータベース
6が保持するホテル情報とを参照して利用者に提示する
応答を生成する。8は意味項目の補正信頼度を算出する
補正信頼度計算部(補正信頼度計算手段)であって、対
話管理部4aから入力した誤りが確定した意味項目と尤
度付きの仮説群とに基づいて理解結果に含まれる各意味
項目の信頼度を補正する。ここで、対話管理部4a、及
び補正信頼度計算部8の機能は、コンピュータ装置のプ
ロセッサ(CPU)に実行させるプログラムによって実
現することができる。なお、図1と同一構成要素には同
一符号を付して重複する説明を省略する。
の対話処理装置による対話処理で得られる情報を示す図
であり、この図に沿って対話処理の概要を説明する。先
ず、音声理解部1は、入力された発話1「東急イン横浜
関内でそれ一泊お願いします」に対して音声理解処理を
行って、意味項目「人数=9」「場所=横浜市」「泊数
=1」「意図=値指定」からなる理解結果を得る。図示
の例において、理解結果として選択された意味項目のう
ち、「人数=9」及び「場所=横浜市」が誤って生成さ
れた意味項目である(仮説生成ステップ)。
各意味項目に対して上記従来の技術で示した方法で信頼
度を計算し、対話管理部4aに出力する(信頼度計算ス
テップ)。その結果、対話管理部4aは、信頼度が予め
設定された閾値(規定値)0.50より低い意味項目
「場所=横浜市」に関して、認識の誤りがある可能性が
高いと判断し、これらを正誤の確認対象として抽出する
(対話管理ステップ)。
誤を利用者に確認するための「場所は横浜市でよろしい
ですか」という応答情報を生成し、応答出力部7に出力
する(応答1)。応答出力部7では、例えば不図示のデ
ィスプレイなどに文字列として上記応答情報を表示し
て、利用者に提示する(応答提示ステップ)。これに対
して、利用者が「いいえ」を入力したため(発話2)、
該意味項目「場所=横浜市」を誤りとして確定し、棄却
する。
りであることに基づいて、補正信頼度計算部8は、その
他の意味項目「人数=9」「泊数=1」の補正信頼度を
計算する(補正信頼度計算ステップ)。該補正信頼度が
予め設定した閾値0.30より低い意味項目「人数=
9」は、誤りである可能性が高い。そこで、対話管理部
4aは、該意味項目の正誤を利用者に確認するための
「人数は九人でよろしいですか」という応答情報を生成
し、応答出力部7に出力する(応答2)。応答出力部7
では、例えば不図示のディスプレイなどに文字列として
上記応答情報を表示して、利用者に提示する(応答提示
ステップ)。これに対して、利用者が「いいえ」を入力
したため(発話3)、該意味項目「人数=9」を誤りと
確定し、棄却する。
いて各構成要素ごとに説明する。なお、図4において、
図1と同一符号を付した構成要素は、同一乃至これに相
当する処理を行うため説明を省略する。以下、図4中の
対話管理部4a及び補正信頼度計算部8の動作について
説明する。先ず、補正信頼度計算部8は、対話管理部4
aから受け取る誤り意味項目のリスト及び尤度付き仮説
群に基づいて、理解結果の意味項目の補正信頼度を計算
する(補正信頼度計算ステップ)。ここで、図5を用い
て該補正信頼度計算部8の動作について詳細に説明す
る。対話管理部4aから受け取る誤り意味項目のリスト
とは、既に利用者に確認を行った結果から、誤りである
ことが確定している意味項目のリストである。例えば、
誤り意味項目のリストとして、「場所=横浜市」の1要
素からなるリストを受け取ったとする。このとき、図5
に示す5個の仮説のうち、1位と4位の仮説は該誤り意
味項目「場所=横浜市」を含むことから、誤った仮説で
あることが確定する。
群から該誤った仮説を取り除くとともに、残った仮説群
だけで尤度和が1となるように、下記式(7)で尤度を
正規化する。式中、Liは第i位の単語系列仮説に対し
て認識時に付与された尤度である。Z'は5個の仮説に
対してP’iの総和が1となるように導入した正規化係
数であり、下記式(9)により与える。また、α'は予
め定めた重み係数(定数)である。Nは仮説数であり、
図示の例では5である。
た仮説群を用いて補正信頼度を計算する。或る意味項目
vの補正信頼度R'(v)は、該意味項目を含み、誤り
意味項目を含まない仮説の尤度和により下記式(10)
で与える。
目であることに基づいて、その他の意味項目「人数=
9」「泊数=1」「意図=値指定」の補正信頼度を計算
した例であり、それぞれ0.26,0.89,1.00
と求まる。このように、既知の誤り「場所=横浜市」を
含む仮説を除くことで、発話中の「東急イン横浜関内」
の区間を誤認識した仮説が減少する。このとき、該誤認
識に起因するその他の誤り意味項目「人数=9」も、こ
れを支持する仮説を失うことになるから、信頼度が下が
る。
け取る理解結果及び尤度付き仮説群と、信頼度計算部2
から受け取る信頼度と、補正信頼度計算部8から受け取
る補正信頼度と、前記対話状況記憶部5が保持する対話
状況と、ホテルデータベース6が保持するホテルの情報
とを参照して、利用者に出力する応答を生成する。図6
は図4中の対話管理部による動作を示すフロー図であ
り、同図を用いて該対話管理部の動作について詳細に説
明する。先ず、対話管理部4aは、音声理解部1から発
話1に対する理解結果(意味項目の組み合わせ)と、尤
度付き仮説群とを受け取る(ステップST1a)。続い
て、対話管理部4aは、信頼度計算部2からステップS
T1aで入力した理解結果の各意味項目に関する信頼度
を受け取る(ステップST2a)。
aは、ステップST1aで受け取った理解結果の意味項
目に基づいて対話状況記憶部5の内容を更新する。具体
的には、図15に示すような対話状況記憶部5が保持す
る対話状況の各スロットに、「意図」以外の意味項目を
書き込む。
結果の各意味項目に関する信頼度に対して、対話管理部
4aは、予め設定しておいた閾値0.50による信頼度
の閾値判定を行う(ステップST4a)。これによって
低信頼度の意味項目を検出する。このとき、理解結果の
各意味項目に関する信頼度の中に閾値に達しない低信頼
度の意味項目がない場合、対話管理部4aは、ステップ
ST5aの処理に移行する。一方、低信頼度の意味項目
がある場合は、ステップST7aの処理に移行する。ス
テップST5aにおいて、対話管理部4aは、下記のよ
うにして発話1に対する応答を生成し、応答出力部7に
送出する。
管理部4aは、対話状況記憶部5の内容に基づいて対話
の終了判定を行う(ステップST6a)。このとき、対
話状況の「予約状況」スロットに値「完了」が書き込ま
れていれば、対話管理部4aは対話を終了する。対話状
況の「予約状況」スロットに値「完了」が書き込まれて
いない場合は、ステップST1aに戻って対話を継続す
る。
出した低信頼度の意味項目に関し、その正誤を利用者に
確認するための応答を生成し、応答出力部7に送出する
(ステップST7a)。例えば、図5に示すように、低
信頼度の意味項目として「場所=横浜市」が検出されて
いる場合、対話管理部4aは「場所は横浜市でよろしい
ですか」という応答を生成する。
認に対する返答として、対話管理部4aは、利用者から
音声理解部1を介して新たに入力された発話2に対する
理解結果を受け取る(ステップST8a)。
いて、対話管理部4aは、ステップST7aで確認を行
った意味項目の誤り判定を行う(ステップST9a)。
例えば、ステップST8aにおいて、発話2「いいえ」
より理解結果「意図=否定」が得られた場合、対話管理
部4aは、ステップST8aで確認を行った意味項目
「場所=横浜市」を誤り意味項目として確定する。この
ように、誤り意味項目が確定されると、対話管理部4a
は、確定した誤り意味項目を対話状況記憶部5内の対話
状況スロットから削除する(ステップST10a)。一
方、誤り意味項目として確定されない場合、対話管理部
4aは、ステップST5aの処理に移行して、上述した
処理を行う。
T9aで確定した誤り意味項目とステップST1aで得
られた尤度付き仮説群とを補正信頼度計算部8に送出す
る。その結果、対話管理部4aは、意味項目の補正信頼
度を得ることとなる(ステップST11a)。
理部4aは、ステップST11aで得られた意味項目の
補正信頼度に対し、予め設定した閾値0.30による閾
値判定を行って(ステップST12a)、ステップST
1aで得られた理解結果に含まれる閾値より低い補正信
頼度の意味項目を検出する。ただし、誤り意味項目は検
出対象に含まない。このとき、閾値より低い補正信頼度
の意味項目がないと、対話管理部4aはステップST5
aの処理に移行し、閾値より低い補正信頼度の意味項目
があると、ステップST13aの処理に移行する。
4aは、ステップST4aで検出した閾値より低い補正
信頼度の意味項目に関して、その正誤を利用者に確認す
るための応答内容を生成し、応答出力部7に送出する。
例えば、図5に示すように、閾値より低い補正信頼度の
意味項目として「人数=9」が検出された場合、対話管
理部4aは、「人数は9人でよろしいですか」という応
答情報を生成する。
認に対する返答として、対話管理部4aは、利用者から
音声理解部1を介して新たに入力された発話3に対する
理解結果を受け取る(ステップST14a)。
4aで得られた理解結果に基づいて、ステップST14
aで確認した意味項目の誤り判定を行う。例えば、ステ
ップST16aにおいて、発話3「いいえ」より理解結
果「意図=否定」が得られた場合、ステップST13a
で確認を行った意味項目「人数=9」を誤り意味項目と
して確定する。このように、誤り意味項目が確定された
場合は、ステップST16aに処理を移す。検出されな
い場合は、ステップST5aに処理を移す。このあと、
発話3に対する理解結果に基づいて、対話管理部4a
は、ステップST14aで確認を行った意味項目の誤り
判定を行う(ステップST15a)。例えば、ステップ
ST14aにおいて、発話3「いいえ」より理解結果
「意図=否定」が得られた場合、対話管理部4aは、ス
テップST13aで確認を行った意味項目「人数=9」
を誤り意味項目として確定する。このように、誤り意味
項目が確定されると、対話管理部4aは、確定した誤り
意味項目を対話状況記憶部5内の対話状況スロットから
削除する(ステップST16a)。一方、誤り意味項目
として確定されない場合、対話管理部4aは、ステップ
ST5aの処理に移行して、上述した処理を行う。
ば、信頼度が低い意味項目の正誤を利用者に確認した結
果、該意味項目が誤りであることが確定すると、さらに
再検証処理として、その他の意味項目の信頼度を補正す
るので、信頼度に対する閾値判定では検出できない誤り
意味項目を、高精度に検出することが可能であり、誤り
意味項目の確認漏れに起因する対話処理装置の誤動作の
問題を解決することができる。
態3による対話処理装置の構成を示すブロック図であ
り、対話処理によってホテルの検索や予約を行う例につ
いて示している。図において、4bは利用者に提示する
応答を生成する対話管理部(対話管理手段)であって、
音声理解部1からの理解結果、信頼度計算部2からの信
頼度、補正信頼度計算部8からの補正信頼度、補正音声
理解部9からの補正理解結果、対話状況記憶部5が保持
する対話状況、及びホテルデータベース6が保持するホ
テル情報とを参照して利用者に提示する応答を生成す
る。9は音声理解部1の理解結果から補正理解結果を求
める補正音声理解部(補正仮説生成手段)であって、対
話管理部4bから入力した誤りが確定した意味項目と尤
度付きの仮説群とに基づいて理解結果を補正する。ここ
で、対話管理部4b、及び補正音声理解部9の機能は、
コンピュータ装置のプロセッサ(CPU)に実行させる
プログラムによって実現することができる。なお、図1
及び図4と同一構成要素には同一符号を付して重複する
説明を省略する。
の対話処理装置による対話処理で得られる情報を示す図
であり、この図に沿って対話処理の概要を説明する。先
ず、音声理解部1は、入力された発話1「東急イン横浜
関内でそれ一泊お願いします」に対して音声理解処理を
行って、意味項目「人数=9」「場所=横浜市」「泊数
=1」「意図=値指定」からなる理解結果を得る。図示
の例において、理解結果として選択された意味項目のう
ち、「人数=9」及び「場所=横浜市」が誤って生成さ
れた意味項目である(仮説生成ステップ)。また、該理
解結果からは、本来生成すべき「ホテル=東急イン横浜
関内」が欠落している。
各意味項目に対して上記従来の技術で示した方法で信頼
度を計算し、対話管理部4bに出力する(信頼度計算ス
テップ)。その結果、対話管理部4bは、信頼度が予め
設定された閾値(規定値)0.50より低い意味項目
「場所=横浜市」に関して、認識の誤りがある可能性が
高いと判断し、これらを正誤の確認対象として抽出する
(対話管理ステップ)。
誤を利用者に確認するための「場所は横浜市でよろしい
ですか」という応答情報を生成し、応答出力部7に出力
する(応答1)。応答出力部7では、例えば不図示のデ
ィスプレイなどに文字列として上記応答情報を表示し
て、利用者に提示する(応答提示ステップ)。これに対
して、利用者が「いいえ」を入力したため(発話2)、
該意味項目「場所=横浜市」を誤りとして確定し、棄却
する。
りであることに基づいて、補正音声理解部9は、誤り意
味項目「場所=横浜市」を含む仮説を削除した発話1に
関する仮説群から、補正理解結果を求める(補正仮説生
成ステップ)。この結果、当初の理解結果に含まれてい
た意味項目「人数=9」が消失し、新たな意味項目「ホ
テル=東急イン横浜関内」を含む理解結果が得られる。
解結果中の意味項目に対して補正信頼度を求める(補正
信頼度計算ステップ)。この結果、該意味項目「ホテル
=東急イン横浜関内」の補正信頼度として、0.73が
得られる。該補正信頼度が閾値0.60より高い場合、
正しい意味項目である可能性が高い。同時に、消失した
意味項目「人数=9」は、誤りであった可能性が高い。
そこで、対話管理部4bは、該意味項目の正誤を利用者
に確認するために「人数は九人ではなく、ホテルは東急
イン横浜関内でよろしいですか」という応答情報を生成
し、応答出力部7に送出する(応答2)。応答出力部7
では、例えば不図示のディスプレイなどに文字列として
上記応答情報を表示して、利用者に提示する(応答提示
ステップ)。これに対して、利用者が「はい」を入力し
たため(発話3)、「人数=9」を誤りと確定して棄却
すると共に、「ホテル=東急イン横浜関内」を正解と確
定して受理する。
いて各構成要素ごとに説明する。なお、図7において、
図1及び図4と同一符号を付した構成要素は、同一乃至
これに相当する処理を行うため説明を省略する。以下、
図7中の対話管理部4b及び補正音声理解部9の動作に
ついて説明する。先ず、補正音声理解部9は、対話管理
部4bから受け取る誤り意味項目のリストと、尤度付き
仮説群とに基づいて補正理解結果を生成する(補正仮説
生成ステップ)。ここで、図8を用いて該補正音声理解
部9の動作について詳細に説明する。対話管理部4bか
ら受け取る誤り意味項目のリストとは、既に利用者に確
認を行った結果から、誤りであることが確定している意
味項目のリストである。例えば、該リストとして、誤り
意味項目「場所=横浜市」の1要素からなるリストを受
け取ったとする。このとき、図8に示す仮説群のうち、
1位と4位の仮説は該誤り意味項目を含むことから、誤
った仮説であることが確定する。そこで、上記仮説群か
ら誤った仮説を取り除くとともに、残った仮説群だけで
尤度和が1となるように、上記式(8)による尤度の正
規化を行う。
大の意味項目の組み合わせ「ホテル=東急イン横浜関
内、泊数=1、意図=値指定」を補正理解結果として選
択する。このように、既知の誤り「場所=横浜市」を含
む仮説を除くことで、初めの理解結果に含まれていた意
味項目「人数=9」が消失し、脱落誤りを起こしていた
意味項目「ホテル=東急イン横浜関内」が新たに得られ
る。
け取る理解結果及び尤度付き仮説群と、信頼度計算部2
から受け取る信頼度と、補正音声理解部9から受け取る
補正理解結果と、補正信頼度計算部8から受け取る補正
信頼度と、対話状況記憶部5が保持する対話状況と、ホ
テルデータベース6が保持するホテル情報とを参照し
て、利用者に出力する応答を生成する。図9は図7中の
対話管理部による動作を示すフロー図であり、同図を用
いて該対話管理部の動作について詳細に説明する。先
ず、対話管理部4bは、音声理解部1から発話1に対す
る理解結果(意味項目の組み合わせ)と、尤度付き仮説
群とを受け取る(ステップST1b)。続いて、対話管
理部4bは、信頼度計算部2からステップST1bで入
力した理解結果の各意味項目に関する信頼度を受け取る
(ステップST2b)。
bは、ステップST1bで受け取った理解結果の意味項
目に基づいて対話状況記憶部5の内容を更新する。具体
的には、図15に示すような対話状況記憶部5が保持す
る対話状況の各スロットに、「意図」以外の意味項目を
書き込む。
結果の各意味項目に関する信頼度に対して、対話管理部
4bは、予め設定しておいた閾値0.50による信頼度
の閾値判定を行う(ステップST4b)。これによって
低信頼度の意味項目を検出する。このとき、理解結果の
各意味項目に関する信頼度の中に閾値に達しない低信頼
度の意味項目がない場合、対話管理部4bは、ステップ
ST5bの処理に移行する。一方、低信頼度の意味項目
がある場合は、ステップST7bの処理に移行する。ス
テップST5bにおいて、対話管理部4bは、下記のよ
うにして発話1に対する応答を生成し、応答出力部7に
送出する。
管理部4bは、対話状況記憶部5の内容に基づいて対話
の終了判定を行う(ステップST6b)。このとき、対
話状況の「予約状況」スロットに値「完了」が書き込ま
れていれば、対話管理部4bは対話を終了する。対話状
況の「予約状況」スロットに値「完了」が書き込まれて
いない場合は、ステップST1bに戻って対話を継続す
る。
出した低信頼度の意味項目に関し、その正誤を利用者に
確認するための応答を生成し、応答出力部7に送出する
(ステップST7b)。例えば、図8に示すように、低
信頼度の意味項目として「場所=横浜市」が検出されて
いる場合、対話管理部4bは「場所は横浜市でよろしい
ですか」という応答を生成する。
認に対する返答として、対話管理部4bは、利用者から
音声理解部1を介して新たに入力された発話2に対する
理解結果を受け取る(ステップST8b)。
いて、対話管理部4bは、ステップST7bで確認を行
った意味項目の誤り判定を行う(ステップST9b)。
例えば、ステップST8bにおいて、発話2「いいえ」
より理解結果「意図=否定」が得られた場合、対話管理
部4bは、ステップST8bで確認を行った意味項目
「場所=横浜市」を誤り意味項目として確定する。この
ように、誤り意味項目が確定されると、対話管理部4b
は、確定した誤り意味項目を対話状況記憶部5内の対話
状況スロットから削除する(ステップST10b)。一
方、誤り意味項目として確定されない場合、対話管理部
4bは、ステップST5bの処理に移行して、上述した
処理を行う。
定した誤り意味項目とステップST1bで受け取った尤
度付き仮説群とを補正音声理解部9に送出する。この結
果、対話管理部4bは発話1に対する補正理解結果(意
味項目の組み合わせ)を得る(ステップST11b)。
4bは、ステップST9bで確定した誤り意味項目と、
ステップST1bで受け取った尤度付き仮説群とを補正
信頼度計算部8に送出する。補正信頼度計算部8は、補
正理解結果の各意味項目の補正信頼度を算出すると、こ
れを対話管理部4bに返信する。
T12bで得られた意味項目の補正信頼度に対して、予
め設定した閾値0.60による閾値判定を行う(ステッ
プST13b)。ここで、対話管理部4bは、補正理解
結果から閾値より高い補正信頼度を有する新規意味項目
を検出する。この新規意味項目とは、ステップST1b
の理解結果には存在しなかった補正理解結果中の意味項
目である。併せて、対話管理部4bは、消失した意味項
目を検出する。この消失した意味項目とは、ステップS
T1bの理解結果に存在する補正理解結果に存在しない
意味項目である。ただし、消失した意味項目には、誤り
が確定している意味項目を含まないものとする。このよ
うにして、閾値より高い補正信頼度の新規意味項目が検
出されると、対話管理部4bは、ステップST14bの
処理に移行し、閾値より高い補正信頼度の新規意味項目
が検出されないと、ステップST5bの処理に移行す
る。
4bは、ステップST13bで検出した閾値より高い補
正信頼度の新規意味項目と消失した意味項目とに関し
て、その正誤を利用者に確認するための応答情報を生成
し、応答出力部7に送出する。図8の例では「ホテル=
東急イン横浜関内」と「人数=9」との正誤を確認する
ため、対話管理部4bは、応答「人数は九人ではなく、
ホテルは東急イン横浜関内でよろしいですか」という応
答情報を生成する。
認に対する返答として、対話管理部4bは、利用者から
音声理解部1を介して新たに入力された発話3に対する
理解結果を受け取る(ステップST15b)。
理解結果に基づいて、対話管理部4bは、ステップST
14bで確認した意味項目の正誤判定を行う(ステップ
ST16b)。例えば、ステップST15bにおいて、
発話3「はい」より理解結果「意図=肯定」が得られた
場合、対話管理部4bは、ステップST14bで確認を
行った意味項目「ホテル=東急イン横浜関内」を正しい
新規意味項目として確定するとともに、「人数=9」を
誤り意味項目として確定する。このように、正誤が確定
すると、対話管理部4bは、ステップST17bの処理
に移行し、確定しない場合は、ステップST5bの処理
に移行する。
4bは、ステップST16bで確定した正しい新規意味
項目を、対話状況記憶部5のスロットに書き込む。ま
た、誤りが確定した意味項目を対話状況記憶部5のスロ
ットから削除する。
ば、信頼度が低い意味項目の正誤を利用者に確認した結
果、該意味項目が誤りであることが分かると、さらに再
理解処理として該誤り意味項目を含まない補正理解結果
を求めると共に、その信頼度を計算して、補正理解結果
中に新たな意味項目が高い信頼度で見つかった場合、そ
の正誤を利用者に確認するので、従来の信頼度に基づく
確認と棄却では対処できなかった意味項目の脱落誤りを
救済することができる。これにより、入力情報の欠落に
起因する対話処理装置の誤動作の問題を解決することが
できる。
音声を入力する代わりに、手書きの文字列や印刷された
文字列を入力とし、音声認識手段の代わりに、文字認識
手段を用いても良い。
単語系列から意味項目の組み合わせを一意に生成する言
語理解部を用いる代わりに、単語系列から意味項目の組
み合わせを確率的に複数生成する言語理解部を用いても
良い。
情報の内容を意味項目ごとに認識した仮説を、該入力情
報に関する尤度に応じて複数生成するとともに、これら
のうち所定の尤度を有する仮説を理解結果仮説として選
択し、理解結果仮説の各意味項目に対して該意味項目を
有する仮説間の尤度和である信頼度を算出し、加えて、
理解結果仮説の意味項目に対して仮説において意味項目
同士が共起する割合である関連度を算出して、理解結果
仮説の意味項目の信頼度と該意味項目についての関連度
とに基づいて該理解結果仮説に関する利用者への応答情
報を生成するので、信頼度に対する閾値判定では検出で
きない誤り意味項目を高精度に検出することができると
いう効果がある。また、誤り意味項目の確認漏れに起因
する対話処理装置の誤動作の問題を解決することができ
るという効果がある。
度が予め設定した規定値以下である意味項目が存在する
と、該意味項目を認識の正誤についての確認対象として
選択するとともに、該意味項目との関連度が予め設定し
た規定値以上である意味項目が理解結果仮説内に存在す
ると、該意味項目も認識の正誤についての確認対象に追
加した応答情報を生成するので、信頼度に対する閾値判
定では検出できない誤り意味項目を高精度に検出するこ
とができるという効果がある。
項目ごとに認識した仮説を、該入力情報に関する尤度に
応じて複数生成するとともに、これらのうち所定の尤度
を有する仮説を理解結果仮説として選択し、理解結果仮
説の各意味項目に対して、該意味項目を有する仮説間の
尤度和である信頼度を算出し、加えて、複数の仮説から
認識に誤りがある意味項目を含む仮説を削除し、これら
仮説に基づいて理解結果仮説の各意味項目に対する信頼
度を算出して、理解結果仮説の意味項目の補正信頼度に
基づいて該理解結果仮説に関する利用者への応答情報を
生成するので、信頼度に対する閾値判定では検出できな
い誤り意味項目を高精度に検出することができるという
効果がある。また、誤り意味項目の確認漏れに起因する
対話処理装置の誤動作の問題を解決することができると
いう効果がある。
項目ごとに認識した仮説を、該入力情報に関する尤度に
応じて複数生成するとともに、これらのうち所定の尤度
を有する仮説を理解結果仮説として選択し、理解結果仮
説の各意味項目に対して該意味項目を有する仮説間の尤
度和である信頼度を算出し、認識に誤りがある意味項目
を含む仮説を削除した複数の仮説から、所定の尤度を有
する仮説を新たな理解結果仮説として選択して、複数の
仮説から認識に誤りがある意味項目を含む仮説を削除
し、これら仮説に基づいて新たな理解結果仮説の各意味
項目に対する信頼度を算出して、新たな理解結果仮説の
各意味項目の信頼度に基づいて該理解結果仮説に関する
利用者への応答情報を生成するので、信頼度に対する閾
値判定では検出できない誤り意味項目を高精度に検出す
ることができるとともに、意味項目の脱落誤りを救済す
ることができるという効果がある。これにより、入力情
報の欠落に起因する対話処理装置の誤動作の問題を解決
することができるという効果がある。
度が予め設定した規定値以下である意味項目が存在する
と、該意味項目を認識の正誤についての確認対象として
選択した応答情報を生成するので、信頼度に対する閾値
判定では検出できない誤り意味項目を、高精度に検出す
ることができるという効果がある。
の構成を示すブロック図である。
れる情報を示す図である。
図である。
の構成を示すブロック図である。
れる情報を示す図である。
図である。
の構成を示すブロック図である。
れる情報を示す図である。
図である。
置の構成を示すブロック図である。
得られる情報を示す図である。
ク図である。
の生成ルールの一例を示す図である。
状況の一例を示す図である。
ホテル情報の一例を示す図である。
図である。
すフロー図である。
(信頼度計算手段)、3関連度計算部(関連度計算手
段)、4,4a,4b 対話管理部(対話管理手段)、
5 対話状況記憶部、6 ホテルデータベース、7 応
答出力部、8 補正信頼度計算部(補正信頼度計算手
段)、9 補正音声理解部(補正仮説生成手段)、10
0 音声理解部、100a 音響分析部、100b 音
声認識部、100c 言語理解部、101 信頼度計算
部、102 対話状況記憶部、103対話管理部、10
4 応答出力部、105 ホテルデータベース。
Claims (13)
- 【請求項1】 入力情報の内容を意味項目ごとに認識し
た仮説を、該入力情報に関する尤度に応じて複数生成す
るとともに、これらのうち所定の尤度を有する仮説を理
解結果仮説として選択する仮説生成手段と、 上記理解結果仮説の各意味項目に対して、該意味項目を
有する仮説間の尤度和である信頼度を算出する信頼度計
算手段と、 上記理解結果仮説の意味項目に対して、複数の上記仮説
において意味項目同士が共起する割合である関連度を算
出する関連度計算手段と、 上記理解結果仮説の意味項目の信頼度と該意味項目につ
いての関連度とに基づいて、該理解結果仮説に関する利
用者への応答情報を生成する対話管理手段とを備えた対
話処理装置。 - 【請求項2】 対話管理手段は、信頼度及び関連度の規
定値が予め設定されており、理解結果仮説内に信頼度が
上記規定値以下である意味項目が存在すると、該意味項
目を認識の正誤についての確認対象として選択するとと
もに、該意味項目との関連度が上記規定値以上である意
味項目が上記理解結果仮説内に存在すると、該意味項目
も認識の正誤についての確認対象に追加した応答情報を
生成することを特徴とする請求項1記載の対話処理装
置。 - 【請求項3】 入力情報の内容を意味項目ごとに認識し
た仮説を、該入力情報に関する尤度に応じて複数生成す
るとともに、これらのうち所定の尤度を有する仮説を理
解結果仮説として選択する仮説生成手段と、 上記理解結果仮説の各意味項目に対して、該意味項目を
有する仮説間の尤度和である信頼度を算出する信頼度計
算手段と、 複数の上記仮説から認識に誤りがある意味項目を含む仮
説を削除し、これら仮説に基づいて上記理解結果仮説の
各意味項目に対する信頼度を算出する補正信頼度計算手
段と、 上記理解結果仮説の意味項目の補正信頼度に基づいて、
該理解結果仮説に関する利用者への応答情報を生成する
対話管理手段とを備えた対話処理装置。 - 【請求項4】 入力情報の内容を意味項目ごとに認識し
た仮説を、該入力情報に関する尤度に応じて複数生成す
るとともに、これらのうち所定の尤度を有する仮説を理
解結果仮説として選択する仮説生成手段と、 上記理解結果仮説の各意味項目に対して、該意味項目を
有する仮説間の尤度和である信頼度を算出する信頼度計
算手段と、 認識に誤りがある意味項目を含む仮説を削除した複数の
仮説から、所定の尤度を有する仮説を新たな理解結果仮
説として選択する補正仮説生成手段と、 複数の上記仮説から認識に誤りがある意味項目を含む仮
説を削除し、これら仮説に基づいて上記新たな理解結果
仮説の各意味項目に対する信頼度を算出する補正信頼度
計算手段と、 上記新たな理解結果仮説の各意味項目の信頼度に基づい
て、該理解結果仮説に関する利用者への応答情報を生成
する対話管理手段とを備えた対話処理装置。 - 【請求項5】 対話管理手段は、信頼度の規定値が予め
設定されており、理解結果仮説内に信頼度が上記規定値
以下である意味項目が存在すると、該意味項目を認識の
正誤についての確認対象として選択した応答情報を生成
することを特徴とする請求項3又は請求項4記載の対話
処理装置。 - 【請求項6】 入力情報の内容を意味項目ごとに認識し
た仮説を、該入力情報に関する尤度に応じて複数生成す
るとともに、これらのうち所定の尤度を有する仮説を理
解結果仮説として選択する仮説生成ステップと、 上記理解結果仮説の各意味項目に対して、該意味項目を
有する仮説間の尤度和である信頼度を算出する信頼度計
算ステップと、 上記理解結果仮説の意味項目に対して、複数の上記仮説
において意味項目同士が共起する割合である関連度を算
出する関連度計算ステップと、 上記理解結果仮説の意味項目の信頼度と該意味項目につ
いての関連度とに基づいて、該理解結果仮説に関する利
用者への応答情報を生成する対話管理ステップと、 該対話管理ステップにて生成された応答情報を提示する
応答提示ステップとを備えた対話処理方法。 - 【請求項7】 対話管理ステップにて、理解結果仮説内
に信頼度が予め設定した規定値以下である意味項目が存
在すると、該意味項目を認識の正誤についての確認対象
として選択するとともに、該意味項目との関連度が予め
設定した規定値以上である意味項目が上記理解結果仮説
内に存在すると、該意味項目も認識の正誤についての確
認対象に追加した応答情報を生成することを特徴とする
請求項6記載の対話処理方法。 - 【請求項8】 入力情報の内容を意味項目ごとに認識し
た仮説を、該入力情報に関する尤度に応じて複数生成す
るとともに、これらのうち所定の尤度を有する仮説を理
解結果仮説として選択する仮説生成ステップと、 上記理解結果仮説の各意味項目に対して、該意味項目を
有する仮説間の尤度和である信頼度を算出する信頼度計
算ステップと、 複数の上記仮説から認識に誤りがある意味項目を含む仮
説を削除し、これら仮説に基づいて上記理解結果仮説の
各意味項目に対する信頼度を算出する補正信頼度計算ス
テップと、 上記理解結果仮説の意味項目の補正信頼度に基づいて、
該理解結果仮説に関する利用者への応答情報を生成する
対話管理ステップと、 該対話管理ステップにて生成された応答情報を提示する
応答提示ステップとを備えた対話処理方法。 - 【請求項9】 入力情報の内容を意味項目ごとに認識し
た仮説を、該入力情報に関する尤度に応じて複数生成す
るとともに、これらのうち所定の尤度を有する仮説を理
解結果仮説として選択する仮説生成ステップと、 上記理解結果仮説の各意味項目に対して、該意味項目を
有する仮説間の尤度和である信頼度を算出する信頼度計
算ステップと、 認識に誤りがある意味項目を含む仮説を削除した複数の
仮説から、所定の尤度を有する仮説を新たな理解結果仮
説として選択する補正仮説生成ステップと、 複数の上記仮説から認識に誤りがある意味項目を含む仮
説を削除し、これら仮説に基づいて上記新たな理解結果
仮説の各意味項目に対する信頼度を算出する補正信頼度
計算ステップと、 上記新たな理解結果仮説の各意味項目の信頼度に基づい
て、該理解結果仮説に関する利用者への応答情報を生成
する対話管理ステップと、 該対話管理ステップにて生成された応答情報を提示する
応答提示ステップとを備えた対話処理方法。 - 【請求項10】 対話管理ステップにて、理解結果仮説
内に信頼度が予め設定した規定値以下である意味項目が
存在すると、該意味項目を認識の正誤についての確認対
象として選択した応答情報を生成することを特徴とする
請求項8又は請求項9記載の対話処理方法。 - 【請求項11】 入力情報の内容を意味項目ごとに認識
した仮説を、該入力情報に関する尤度に応じて複数生成
するとともに、これらのうち所定の尤度を有する仮説を
理解結果仮説として選択する仮説生成手段、 上記理解結果仮説の各意味項目に対して、該意味項目を
有する仮説間の尤度和である信頼度を算出する信頼度計
算手段、 上記理解結果仮説の意味項目に対して、複数の上記仮説
において意味項目同士が共起する割合である関連度を算
出する関連度計算手段、 上記理解結果仮説の意味項目の信頼度と該意味項目につ
いての関連度とに基づいて、該理解結果仮説に関する利
用者への応答情報を生成する対話管理手段としてコンピ
ュータを機能させるためのプログラム。 - 【請求項12】 入力情報の内容を意味項目ごとに認識
した仮説を、該入力情報に関する尤度に応じて複数生成
するとともに、これらのうち所定の尤度を有する仮説を
理解結果仮説として選択する仮説生成手段、 上記理解結果仮説の各意味項目に対して、該意味項目を
有する仮説間の尤度和である信頼度を算出する信頼度計
算手段、 複数の上記仮説から認識に誤りがある意味項目を含む仮
説を削除し、これら仮説に基づいて上記理解結果仮説の
各意味項目に対する信頼度を算出する補正信頼度計算手
段、 上記理解結果仮説の意味項目の補正信頼度に基づいて、
該理解結果仮説に関する利用者への応答情報を生成する
対話管理手段としてコンピュータを機能させるためのプ
ログラム。 - 【請求項13】 入力情報の内容を意味項目ごとに認識
した仮説を、該入力情報に関する尤度に応じて複数生成
するとともに、これらのうち所定の尤度を有する仮説を
理解結果仮説として選択する仮説生成手段、 上記理解結果仮説の各意味項目に対して、該意味項目を
有する仮説間の尤度和である信頼度を算出する信頼度計
算手段、 認識に誤りがある意味項目を含む仮説を削除した複数の
仮説から、所定の尤度を有する仮説を新たな理解結果仮
説として選択する補正仮説生成手段、 複数の上記仮説から認識に誤りがある意味項目を含む仮
説を削除し、これら仮説に基づいて上記新たな理解結果
仮説の各意味項目に対する信頼度を算出する補正信頼度
計算手段、 上記新たな理解結果仮説の各意味項目の信頼度に基づい
て、該理解結果仮説に関する利用者への応答情報を生成
する対話管理手段としてコンピュータを機能させるため
のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001220135A JP4128342B2 (ja) | 2001-07-19 | 2001-07-19 | 対話処理装置及び対話処理方法並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001220135A JP4128342B2 (ja) | 2001-07-19 | 2001-07-19 | 対話処理装置及び対話処理方法並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003029782A true JP2003029782A (ja) | 2003-01-31 |
JP4128342B2 JP4128342B2 (ja) | 2008-07-30 |
Family
ID=19053997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001220135A Expired - Fee Related JP4128342B2 (ja) | 2001-07-19 | 2001-07-19 | 対話処理装置及び対話処理方法並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4128342B2 (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005181386A (ja) * | 2003-12-16 | 2005-07-07 | Mitsubishi Electric Corp | 音声対話処理装置及び音声対話処理方法並びにプログラム |
JP2005275348A (ja) * | 2004-02-23 | 2005-10-06 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 |
JP2006139134A (ja) * | 2004-11-12 | 2006-06-01 | Pioneer Electronic Corp | 音声出力制御装置、音声出力制御システム、それらの方法、それらのプログラム、および、それらのプログラムを記録した記録媒体 |
JP2006139133A (ja) * | 2004-11-12 | 2006-06-01 | Pioneer Electronic Corp | 音声情報生成装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、音声情報のデータ構造、音声情報を記録した記録媒体、音声出力制御装置、および、そのシステム |
JP2006208905A (ja) * | 2005-01-31 | 2006-08-10 | Nissan Motor Co Ltd | 音声対話装置及び音声対話方法 |
WO2006083020A1 (ja) * | 2005-02-04 | 2006-08-10 | Hitachi, Ltd. | 抽出された音声データを用いて応答音声を生成する音声認識システム |
JP2008097003A (ja) * | 2006-10-12 | 2008-04-24 | Qnx Software Systems (Wavemakers) Inc | 自動音声認識システムに対する適応コンテキスト |
WO2009008115A1 (ja) * | 2007-07-09 | 2009-01-15 | Mitsubishi Electric Corporation | 音声認識装置およびナビゲーションシステム |
JP2009503560A (ja) * | 2005-07-22 | 2009-01-29 | マルチモダル テクノロジーズ,インク. | コンテンツベースの音声再生強調 |
JP2012027065A (ja) * | 2010-07-20 | 2012-02-09 | Nippon Telegr & Teleph Corp <Ntt> | 2チャネル音声の音声認識方法とその装置とプログラム |
WO2016151698A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 対話装置、方法及びプログラム |
WO2016151699A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 学習装置、方法およびプログラム |
CN111858894A (zh) * | 2020-07-29 | 2020-10-30 | 网易(杭州)网络有限公司 | 语义缺失的识别方法及装置、电子设备、存储介质 |
-
2001
- 2001-07-19 JP JP2001220135A patent/JP4128342B2/ja not_active Expired - Fee Related
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005181386A (ja) * | 2003-12-16 | 2005-07-07 | Mitsubishi Electric Corp | 音声対話処理装置及び音声対話処理方法並びにプログラム |
JP2005275348A (ja) * | 2004-02-23 | 2005-10-06 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 |
JP2006139134A (ja) * | 2004-11-12 | 2006-06-01 | Pioneer Electronic Corp | 音声出力制御装置、音声出力制御システム、それらの方法、それらのプログラム、および、それらのプログラムを記録した記録媒体 |
JP2006139133A (ja) * | 2004-11-12 | 2006-06-01 | Pioneer Electronic Corp | 音声情報生成装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、音声情報のデータ構造、音声情報を記録した記録媒体、音声出力制御装置、および、そのシステム |
JP4661239B2 (ja) * | 2005-01-31 | 2011-03-30 | 日産自動車株式会社 | 音声対話装置及び音声対話方法 |
JP2006208905A (ja) * | 2005-01-31 | 2006-08-10 | Nissan Motor Co Ltd | 音声対話装置及び音声対話方法 |
WO2006083020A1 (ja) * | 2005-02-04 | 2006-08-10 | Hitachi, Ltd. | 抽出された音声データを用いて応答音声を生成する音声認識システム |
JP2009503560A (ja) * | 2005-07-22 | 2009-01-29 | マルチモダル テクノロジーズ,インク. | コンテンツベースの音声再生強調 |
US8768706B2 (en) | 2005-07-22 | 2014-07-01 | Multimodal Technologies, Llc | Content-based audio playback emphasis |
JP2008097003A (ja) * | 2006-10-12 | 2008-04-24 | Qnx Software Systems (Wavemakers) Inc | 自動音声認識システムに対する適応コンテキスト |
WO2009008115A1 (ja) * | 2007-07-09 | 2009-01-15 | Mitsubishi Electric Corporation | 音声認識装置およびナビゲーションシステム |
JPWO2009008115A1 (ja) * | 2007-07-09 | 2010-09-02 | 三菱電機株式会社 | 音声認識装置およびナビゲーションシステム |
JP2012027065A (ja) * | 2010-07-20 | 2012-02-09 | Nippon Telegr & Teleph Corp <Ntt> | 2チャネル音声の音声認識方法とその装置とプログラム |
WO2016151698A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 対話装置、方法及びプログラム |
WO2016151699A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 学習装置、方法およびプログラム |
JPWO2016151699A1 (ja) * | 2015-03-20 | 2017-05-25 | 株式会社東芝 | 学習装置、方法およびプログラム |
JPWO2016151698A1 (ja) * | 2015-03-20 | 2017-05-25 | 株式会社東芝 | 対話装置、方法及びプログラム |
US10446146B2 (en) | 2015-03-20 | 2019-10-15 | Kabushiki Kaisha Toshiba | Learning apparatus and method |
CN111858894A (zh) * | 2020-07-29 | 2020-10-30 | 网易(杭州)网络有限公司 | 语义缺失的识别方法及装置、电子设备、存储介质 |
CN111858894B (zh) * | 2020-07-29 | 2024-06-04 | 网易(杭州)网络有限公司 | 语义缺失的识别方法及装置、电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4128342B2 (ja) | 2008-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9037462B2 (en) | User intention based on N-best list of recognition hypotheses for utterances in a dialog | |
US20230419960A1 (en) | Determining state of automated assistant dialog | |
JP4680691B2 (ja) | 対話システム | |
US7603279B2 (en) | Grammar update system and method for speech recognition | |
JP4724377B2 (ja) | 自然言語理解(NLU)システムにおける規則ベース文法に関するスロットおよび前終端記号(preterminal)に関する統計モデル | |
JP4545363B2 (ja) | 音声認識システムにおける発音辞書の精度の自動的決定 | |
US11016968B1 (en) | Mutation architecture for contextual data aggregator | |
US7529657B2 (en) | Configurable parameters for grammar authoring for speech recognition and natural language understanding | |
US7680661B2 (en) | Method and system for improved speech recognition | |
JP2003029782A (ja) | 対話処理装置及び対話処理方法並びにプログラム | |
WO2013080406A1 (ja) | 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム | |
US8401852B2 (en) | Utilizing features generated from phonic units in speech recognition | |
EP1542207A1 (en) | Speech recognition method and apparatus | |
US8428241B2 (en) | Semi-supervised training of destination map for call handling applications | |
EP2863385B1 (en) | Function execution instruction system, function execution instruction method, and function execution instruction program | |
US20040186819A1 (en) | Telephone directory information retrieval system and method | |
US20220050968A1 (en) | Intent resolution for chatbot conversations with negation and coreferences | |
CN111540353A (zh) | 一种语义理解方法、装置、设备及存储介质 | |
WO2020156342A1 (zh) | 语音识别方法、装置、电子设备及存储介质 | |
US11636853B2 (en) | Natural language grammar improvement | |
Higashinaka et al. | Incorporating discourse features into confidence scoring of intention recognition results in spoken dialogue systems | |
JP5326549B2 (ja) | 音声認識装置及び方法 | |
Hazen et al. | Integrating recognition confidence scoring with language understanding and dialogue modeling. | |
TWI277948B (en) | Method and system for template inquiry dialogue system | |
Švec et al. | Semantic entity detection from multiple ASR hypotheses within the WFST framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20071106 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071106 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080415 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080514 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120523 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120523 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140523 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |