JP2003029782A - 対話処理装置及び対話処理方法並びにプログラム - Google Patents

対話処理装置及び対話処理方法並びにプログラム

Info

Publication number
JP2003029782A
JP2003029782A JP2001220135A JP2001220135A JP2003029782A JP 2003029782 A JP2003029782 A JP 2003029782A JP 2001220135 A JP2001220135 A JP 2001220135A JP 2001220135 A JP2001220135 A JP 2001220135A JP 2003029782 A JP2003029782 A JP 2003029782A
Authority
JP
Japan
Prior art keywords
hypothesis
reliability
meaning item
meaning
understanding result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001220135A
Other languages
English (en)
Other versions
JP4128342B2 (ja
Inventor
Koichi Tanigaki
宏一 谷垣
Yasushi Ishikawa
泰 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001220135A priority Critical patent/JP4128342B2/ja
Publication of JP2003029782A publication Critical patent/JP2003029782A/ja
Application granted granted Critical
Publication of JP4128342B2 publication Critical patent/JP4128342B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】 【課題】 信頼度に関する単純な閾値判定によって利用
者に意味項目の正誤確認を行うか否かを決定することか
ら、誤り意味項目の検出精度が悪いという課題があっ
た。 【解決手段】 入力情報の内容を意味項目ごとに認識し
た仮説を、該入力情報に関する尤度に応じて複数生成す
るとともに、これらのうち所定の尤度を有する仮説を理
解結果仮説として選択する仮説生成手段と、理解結果仮
説の各意味項目に対して、該意味項目を有する仮説間の
尤度和である信頼度を算出する信頼度計算手段と、理解
結果仮説の意味項目に対して、複数の仮説において意味
項目同士が共起する割合である関連度を算出する関連度
計算手段と、理解結果仮説の意味項目の信頼度と該意味
項目についての関連度とに基づいて、該理解結果仮説に
関する利用者への応答情報を生成する対話管理手段とを
備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明はマン・マシン・イ
ンタフェースとして音声認識や文字認識を利用する対話
処理装置に係り、特に入力情報に対する誤りを意味項目
間の関連度や既知の誤りに基づいた信頼度補正値を用い
て高精度に検出する対話処理装置及び対話処理方法並び
に該対話処理をコンピュータに実行させるプログラムに
関するものである。
【0002】
【従来の技術】利用者が発声した音声(以下、発話と称
する)を入力とする対話処理装置では、その動作を決定
するために、発話内容を解釈する音声理解処理を必要と
する。図10は上述した音声理解処理の一例を示す図で
ある。通常、音声理解処理は、音声認識処理と言語理解
処理とを組み合わせることで実施される。例えば、入力
された発話「東急イン横浜関内でそれ一泊お願いしま
す」に音声認識処理を適用することで、単語系列「あと
/九人/横浜/が/無い/で/それ/一泊/お/願い/
し/ます」を得る。次に、この単語系列に言語理解処理
を適用することで、予め規定された形式による意味内容
の表記として、同図に示すような意味項目「人数=9」
「場所=横浜市」「泊数=1」「意図=値指定」の組み
合わせを得る。
【0003】ところで、このような音声理解処理により
得られる意味項目の組み合わせ(以下、理解結果と称す
る)には、しばしば誤りが含まれる。図10では「東急
イン横浜関内」と発声されている区間を、誤って「あと
/九人/横浜/が/無い」と認識したために、本来生成
すべき意味項目「ホテル=東急イン横浜関内」の代わり
に、誤った意味項目「人数=9」と「場所=横浜市」と
を生成している。
【0004】対話処理装置は、こうした誤り意味項目を
そのまま受理してしまうと、適切な動作を行うことがで
きない。かといって、理解結果が得られた全ての意味項
目に対して、利用者に正誤を逐一確認した場合、本来正
しい意味項目に対しても確認を行うことになるから、対
話が冗長となり、利便性の悪い装置になってしまう。
【0005】このような不具合を解消するものとして、
音声認識スコアから計算される信頼度を各意味項目に付
与し、その信頼度に基づいて意味項目の確認を行う対話
処理方式が、下記文献1で提案されている。文献1:"
Incorporating confidence
measures in the Dutch tra
in timetable information
system developed in ARISE
project"(G.Bouwman,J.Stu
rm,and L.Boves,Proc.ICASS
P99,pp.493−496,1999).
【0006】図11は上述したような従来の対話処理方
式を適用した対話処理装置の構成を示すブロック図であ
り、音声対話によってホテルの検索や予約を行う例につ
いて示している。図において、100は不図示の音声入
力手段と接続する音声理解部で、該音声入力手段を介し
て利用者から入力された発話に対して音声認識・理解処
理を施して意味項目の組み合わせからなる尤度付きの仮
説群を生成すると共に、これらの中から尤度が最大とな
る仮説を理解結果として選択する。101は意味項目の
信頼度を算出する信頼度計算部であって、音声理解部1
00から入力した理解結果と尤度付きの仮説群とに基づ
いて理解結果に含まれる各意味項目の信頼度を算出す
る。102は対話管理部103と接続する対話状況記憶
部で、対話管理部103から入力した対話状況を保持す
る。103は利用者に提示する応答を生成する対話管理
部であって、音声理解部100からの理解結果、信頼度
計算部101からの信頼度、対話状況記憶部102が保
持する対話状況、及びホテルデータベース105が保持
するホテル情報とを参照して利用者に提示する応答を生
成する。104は対話管理部103から入力した応答を
利用者に提示する応答出力部で、例えば対話管理部10
3からの応答を文字列として不図示のディスプレイ上に
表示する。105はホテル情報を保持するホテルデータ
ベースであって、ホテル名、所在地、交通経路、宿泊料
金や空き部屋状況をホテル情報として管理している。
【0007】図12は図11中の対話処理装置による対
話処理で得られる情報を示す図であり、この図に沿って
対話処理の概要を説明する。先ず、音声理解部100
は、入力された発話1「東急イン横浜関内でそれ一泊お
願いします」に対して音声理解処理を行って、最終的に
意味項目「人数=9」「場所=横浜市」「泊数=1」
「意図=値指定」からなる理解結果を得る。図示の例に
おいて、理解結果として選択された意味項目のうち、
「人数=9」及び「場所=横浜市」が誤って生成された
意味項目である。また、該理解結果からは、本来生成す
べき「ホテル=東急イン横浜関内」が欠落している。
【0008】次に、信頼度計算部101が上記理解結果
中の各意味項目に対して、後述する方法で信頼度を計算
する。その結果、信頼度が予め設定した閾値0.50よ
り高い意味項目を正しい可能性が高いとして受理する。
一方、信頼度が閾値より低い場合は、誤りの可能性が高
いとして、利用者に確認を求める(あるいは、直ちに棄
却する)。確認の結果、該意味項目が誤りであることが
わかれば棄却し、逆に正しいことがわかれば受理する。
【0009】図12においては、信頼度が閾値0.50
より低い意味項目は「場所=横浜市」であるから、該意
味項目の正誤を利用者に確認するため、「場所は横浜市
でよろしいですか」を出力する(応答1)。これに対し
利用者が「いいえ」を入力した場合(発話2)、該誤り
である意味項目「場所=横浜市」が棄却される。しかし
ながら、この方法では、信頼度が閾値0.50より高い
誤り意味項目「人数=9」に対しては何ら確認が行われ
ないため、該誤り意味項目を保持したまま対話が進行す
ることになる。
【0010】さらに、この方法では、確認対象となり得
る意味項目が音声理解部100の理解結果に含まれる意
味項目に限定される。即ち、図12では本来あるべき正
しい意味項目である「ホテル=東急イン横浜関内」が理
解結果から脱落しているが、従来の対話処理装置では、
この脱落を検出する手段を持たず、利用者への確認もな
されない。そのため、利用者は、入力したはずの意味項
目が受理されなかったことに気付かないまま対話が進行
することになる。
【0011】次に図11に示した対話処理装置の動作に
ついて各構成要素ごとに説明する。先ず、音声理解部1
00は、入力された発話に対して音声認識・理解処理を
行うことで、意味項目の組み合わせからなる尤度付きの
仮説群を生成する。以下、仮説を単に仮説と称する。さ
らに、仮説群の中で尤度が最大の仮説を理解結果として
選択する。これら尤度付き仮説群及び理解結果は、信頼
度計算部101に送られる。
【0012】図13は図11中の音声理解部の構成を示
すブロック図である。図に示すように、音声理解部10
0は、音響分析部100a、音声認識部100b及び言
語理解部100cから構成される。先ず、利用者からの
発話は、不図示の音声入力手段を介して音響分析部10
0aに入力される。音響分析部100aでは、入力した
発話の音響分析を行って上記発話に係る入力音声の特徴
ベクトルの時系列を抽出し、音声認識部100bに出力
する。
【0013】音声認識部100bでは、この特徴ベクト
ルの時系列に対して認識処理を施すことで、尤度の高い
単語系列を5種類生成する(尤度の上位5位までの単語
系列を生成する)。これら5種類の単語系列は、その尤
度と共に言語理解部100cに送出される。ここで、単
語系列の尤度とは、特徴ベクトルの時系列に対する単語
系列の確率的な尤もらしさを評価したスコアであり、例
えば下記文献2の第7章「連続単語モデルに基づく音声
認識」に記載される認識処理によって求められる。文献
2:"音声認識の基礎(下)"L.Rabiner,B.
H.Juang共著,古井 監訳、NTTアドバンステ
クノロジ株式会社編集・発行,1995.
【0014】最後に、言語理解部100cでは、入力し
た5種類の各単語系列に対して意味解析を行うことで意
味項目の組み合わせを生成する。この結果として得られ
る意味項目の組み合わせを以下では仮説と称することと
し、これら仮説の集まりを仮説群と称する。このあと、
言語理解部100cは、上記仮説群の中で尤度が最大の
ものを理解結果として選択し、この理解結果に加えて各
仮説の尤度と共に仮説群(尤度付き仮説群)を信頼度計
算部101や対話管理部103に出力する。
【0015】図14は図13中の言語理解部が使用する
意味項目の生成ルールの一例を示す図である。言語理解
部100cによる意味解析は、例えば図14に示すよう
なルールを適用して行っても良い。図示の例は、「人
数」「意図」「泊数」「場所」の意味項目を生成するた
めのルールである。各ルールの左辺は意味項目のカテゴ
リ(「人数」、「意図」、「泊数」、「場所」など)を
表している。右辺は「|」で区切られた複数のパタン
(意味項目のカテゴリが「人数」の場合では、「一人」
など)と、値(パタン「一人」の場合で「@」に後続す
る「1」など)とを定義したものである。言語理解部1
00cでは、これらのパタンと単語系列とを照合して合
致するパタンに対応する値を用いて意味項目を生成す
る。例えば、単語系列「あと/九人/横浜/が/無い/
・・・」に対し人数のルールを適用すると、パタン「九
人」に合致することから、意味項目「人数=9」が生成
される。
【0016】音声理解部100による音声処理の例は、
前述した図12に見ることができる。発話に対して音声
認識処理を行うことで、尤度の大きさが1位から5位ま
での5種類の単語系列が生成される。さらに、言語理解
処理を施すことで、各単語系列より意味項目の組み合わ
せ仮説が生成される。これら仮説の中で、尤度が最大
(0.38)の意味項目の組み合わせである(人数=
9、場所=横浜市、泊数=1、意図=値設定)を理解結
果として出力する。
【0017】信頼度計算部101は、音声理解部100
から理解結果及び尤度付き仮説群を入力すると、これら
に基づいて各意味項目の信頼度を計算する。これら信頼
度は、後述する対話管理部103に送出される。ここ
で、前述の図12を用いて信頼度の計算方法について説
明する。先ず、信頼度計算部101は、入力した尤度付
き仮説群に対して尤度の正規化を行う。具体的には、第
i位の単語系列の仮説に対して認識時に付与された尤度
をLiとして、下記式(1)から正規化後の尤度(事後
確率)Piを算出する。式(1)中のZは、N個の仮説
に対してPiの総和が1となるように導入した正規化係
数であり、下記式(2)から求められる。また、αは予
め定めた重み係数(定数)であり、Nは仮説数を表して
いる。ここで、仮説数Nは5である。図12に示した各
仮説の尤度は、この正規化処理後に得られる尤度Piで
ある。なお、下記式(2)におけるΣ_{j=1,2,
・・・,N}は、j=1,2,・・・,Nまでのexp
(α・Lj)の各値の総和を示している。
【0018】 Pi≡exp(α・Li)/Z(i=1,・・・,N) ・・・(1)
【0019】 Z≡Σ_{j=1,2,・・・,N}exp(α・Lj) ・・・(2)
【0020】信頼度計算部101は、尤度付き仮説群に
対する尤度の正規化処理が完了すると、下記式(3)を
用いて理解結果に含まれる各意味項目vの信頼度R
(v)を求める。ここで、式(3)中のViは、第i位
の仮説となる意味項目の組み合わせを表している。即
ち、意味項目vの信頼度R(v)は、意味項目vを含む
仮説の尤度和により与えられる。例えば、図12で意味
項目「場所=横浜市」の信頼度は、該意味項目を含む第
1位の仮説と第4位の仮説との尤度和により、0.38
+0.09≒0.46と求めたものである。
【0021】 R(v)=Σ_{is.t.Vi∋v}Pi ・・・(3)
【0022】ここで、対話状況記憶部102及びホテル
データベース105について説明する。対話状況記憶部
102は、後述する対話管理部103より書き込まれた
対話状況を保持する。図15は図11中の対話状況記憶
部が保持する対話状況の一例を示す図であり、同図を用
いて該対話状況の保持方法を説明する。図15における
枠付きのボックスは、変数(スロット)であって対話管
理部103により書き込まれた値を保持する。このうち
上段の9スロットは、理解結果として得られた意味項目
が書き込まれる。例えば、「場所」スロットは、対話中
に利用者から「横浜市」が指定されたことを示してい
る。空のスロットは、これに対応する値が利用者から入
力されていないことを示している。スロット名に*印が
付いているものは必須スロットであり、ホテルを予約す
るためには該スロットの値が必須であることを表してい
る。
【0023】一方、最下段のスロット「予約状況」は意
味項目とは対応していない。該スロットは、対話開始時
点から空になっているが、ホテルの予約が行われると、
値「完了」が書き込まれる。「予約状況」スロットは、
対話管理部103による対話の終了判定に用いられる。
【0024】ホテルデータベース105は、後述する対
話管理部103が検索するホテル情報を保持する。図1
6は図11中のホテルデータベースが保持するホテル情
報の一例を示す図である。図示の例では、ホテル情報と
して、ホテルの名称、所在地(住所)、交通経路(最寄
駅)、宿泊料金(料金)及び空室状況がホテルごとに登
録されている。
【0025】次に、対話管理部103の動作について説
明する。対話管理部103は、音声理解部100から受
け取る理解結果と、信頼度計算部101から受け取る信
頼度と、対話状況記憶部102が保持する対話状況と、
ホテルデータベース105が保持するホテル情報とを参
照して、利用者に出力する応答を生成する。図17は図
11中の対話管理部の動作を示すフロー図であり、同図
を用いて該対話管理部103の動作について詳細に説明
する。先ず、対話管理部103は、音声理解部100か
ら発話1に対する理解結果(意味項目の組み合わせ)を
受け取る(ステップST100)。続いて、対話管理部
103は、信頼度計算部101からステップST100
で入力した理解結果の各意味項目に関する信頼度を受け
取る(ステップST101)。
【0026】ステップST102において、対話管理部
103は、ステップST100で受け取った理解結果の
意味項目に基づいて対話状況記憶部102の内容を更新
する。具体的には、図15に示した対話状況記憶部10
2が保持する対話状況の各スロットに、「意図」以外の
意味項目を書き込む。
【0027】次に、ステップST101で受け取った理
解結果の各意味項目に関する信頼度に対して、対話管理
部103は、予め設定しておいた閾値0.50による信
頼度の閾値判定を行う(ステップST103)。これに
よって低信頼度の意味項目を検出する。このとき、理解
結果の各意味項目に関する信頼度の中に閾値に達しない
低信頼度の意味項目がない場合、対話管理部103は、
ステップST104の処理に移行する。一方、低信頼度
の意味項目がある場合は、ステップST106の処理に
移行する。
【0028】ステップST104において、対話管理部
103は、下記のようにして発話1に対する応答を生成
し、応答出力部104に送出する。図18は対話管理部
による応答生成処理の一例を示すフロー図であり、同図
を用いて該ステップST104における動作を詳細に説
明する。先ず、対話管理部103は、理解結果中の意味
項目「意図」による分岐を行う(ステップST11
0)。このとき、「意図=予約要求」であればステップ
ST112の処理に移行し、「意図=値指定」であれば
ステップST111の処理に移行し、「意図=検索要
求」であればステップST115の処理に移行する。
【0029】ステップST111において、対話管理部
103は、対話状況の必須スロットの内容を調べる。こ
のとき、予約に必要な全ての必須スロットが充足されて
いる場合はステップST113に処理を移す。全ての必
須スロットが充足されていない場合は、ステップST1
15の処理に移行する。
【0030】また、ステップST112においても、対
話管理部103は、対話状況の必須スロットの内容を調
べる。このとき、予約に必要な全ての必須スロットが充
足されている場合はステップST113に処理を移す。
全ての必須スロットが充足されていない場合は、ステッ
プST117の処理に移行する。
【0031】ステップST113では、対話管理部10
3が対話状況の必須スロットの値とホテルデータベース
105のホテル情報とを比較して実際に予約可能である
か否かを調べる。このとき、空室が見つかり予約可能で
あると、対話管理部103は、利用者に予約要求が受理
されたことを通知する「ご予約承りました」という応答
を生成して応答出力部104に送出する(ステップST
118)。
【0032】一方、空室がない場合、対話管理部103
は、利用者に予約要求が受理されなかったことを通知す
る「あいにく全室ふさがっております」という応答を生
成して応答出力部104に送出する(ステップST11
9)。
【0033】また、対話状況の必須スロットが充足され
ていない場合、対話管理部103は利用者に必須スロッ
トの充足を求める応答文を生成して応答出力部104に
送出する(ステップST117)。例えば、必須スロッ
ト「部屋タイプ」が未充足であった場合は、「部屋タイ
プはどうしますか」という応答を生成する。
【0034】ステップST118にて、利用者に予約要
求が受理されたことを通知すると、対話管理部103
は、対話状況の「予約状況」スロットに値「完了」を書
き込む(ステップST122)。
【0035】ステップST115において、対話管理部
103は、対話状況のスロットに充足されている値を条
件としてホテルデータベース105のホテル情報を検索
し、該条件に合致するホテルを探す。このとき、上記条
件に合致するホテルが1件以上見つからない、即ち、条
件に合致するホテルがないと、対話管理部103は、
「条件に合うホテルは見つかりませんでした」という応
答を生成して応答出力部104に送出する(ステップS
T120)。
【0036】一方、上記条件に合致するホテルが1件以
上見つかると、対話管理部103は、利用者に検索結果
を示す応答を生成して応答出力部104に送出する(ス
テップST121)。例えば、条件に合致するホテルが
横浜ベイシェラトンの1件であった場合、「1件見つか
りました。ホテル名は横浜ベイシェラトンです。」とい
う応答を生成する。以上の処理が図17におけるステッ
プST104に相当する。
【0037】ここで、図17に戻って対話管理部103
の動作についての説明を続ける。ステップST104に
て応答出力部104に応答が送出されると、対話管理部
103は、対話状況記憶部102の内容に基づいて対話
の終了判定を行う(ステップST105)。このとき、
対話状況の「予約状況」スロットに値「完了」が書き込
まれていれば、対話管理部103は対話を終了する。対
話状況の「予約状況」スロットに値「完了」が書き込ま
れていない場合は、ステップST100に戻って対話を
継続する。
【0038】一方、ステップST103で低信頼度の意
味項目が検出されると、対話管理部103は、この意味
項目に関する正誤を利用者に確認するための応答を生成
して応答出力部104に送出する(ステップST10
6)。例えば、図12に示すように、低信頼度の意味項
目として「場所=横浜市」が検出されると、対話管理部
103は、応答として「場所は横浜市でよろしいです
か」を生成する。
【0039】続いて、上述した意味項目に関する正誤確
認に対する返答として、対話管理部103は、利用者か
ら音声理解部100を介して新たに入力された発話2に
対する理解結果を受け取る(ステップST107)。
【0040】このあと、発話2に対する理解結果に基づ
いて、対話管理部103は、ステップST106で確認
を行った意味項目の誤り判定を行う(ステップST10
8)。例えば、ステップST107において、発話2が
「いいえ」であって、その理解結果として「意図=否
定」が得られた場合、対話管理部103は、ステップS
T106で確認を行った意味項目「場所=横浜市」を誤
り意味項目として確定する。このように、誤り意味項目
が確定されると、対話管理部103は、確定した誤り意
味項目を対話状況記憶部102内の対話状況スロットか
ら削除する(ステップST109)。一方、誤り意味項
目として確定されない場合、対話管理部103は、ステ
ップST104の処理に移行して、上述した処理を行
う。
【0041】応答出力部104は、対話管理部103か
ら受け取る応答を、例えば不図示のディスプレイなどに
文字列として表示して、利用者に提示する。
【0042】
【発明が解決しようとする課題】従来の対話処理装置は
以上のように構成されているので、信頼度に関する単純
な閾値判定によって利用者に意味項目の正誤確認を行う
か否かを決定することから、誤り意味項目の検出精度が
悪いという課題があった。
【0043】また、このような閾値判定では、誤り検出
率を上げようとして閾値を高く設定すると、正しい意味
項目に対しても頻繁に確認を行うことになって、対話処
理装置の利便性が損なわれてしまう。逆に、閾値を低く
設定すると、確認漏れにより誤り意味項目をそのまま受
理してしまうケースが生じ、対話処理装置に誤動作を生
じていた。
【0044】さらに、従来の対話処理装置における誤り
意味項目の検出及びその確認は、誤り意味項目の棄却の
みを目的とするものであることから、理解結果に意味項
目の脱落誤りが生じても、その誤りを検出及び確認する
ことができないという課題があった。この場合、入力し
たはずの意味項目が受理されなかったことに利用者が気
付かないまま対話が進行してしまう。これによって、対
話処理装置は利用者の期待に反した動作を行うことにな
り、利用者にとって利便性が悪い装置になってしまう。
【0045】この発明は上記のような課題を解決するた
めになされたもので、意味項目間の関連度や既知の誤り
に基づいた信頼度補正値を用いることで、入力情報の理
解誤りによる影響を低減し、利用者が確実且つ快適にタ
スクを達成することができる対話処理装置及び対話処理
方法並びに該対話処理をコンピュータに実行させるプロ
グラムを得ることを目的とする。
【0046】
【課題を解決するための手段】この発明に係る対話処理
装置は、入力情報の内容を意味項目ごとに認識した仮説
を、該入力情報に関する尤度に応じて複数生成するとと
もに、これらのうち所定の尤度を有する仮説を理解結果
仮説として選択する仮説生成手段と、理解結果仮説の各
意味項目に対して、該意味項目を有する仮説間の尤度和
である信頼度を算出する信頼度計算手段と、理解結果仮
説の意味項目に対して、複数の仮説において意味項目同
士が共起する割合である関連度を算出する関連度計算手
段と、理解結果仮説の意味項目の信頼度と該意味項目に
ついての関連度とに基づいて、該理解結果仮説に関する
利用者への応答情報を生成する対話管理手段とを備える
ものである。
【0047】この発明に係る対話処理装置は、対話管理
手段に信頼度及び関連度の規定値を予め設定しておき、
理解結果仮説内に信頼度が規定値以下である意味項目が
存在すると、該意味項目を認識の正誤についての確認対
象として選択するとともに、該意味項目との関連度が規
定値以上である意味項目が理解結果仮説内に存在する
と、該意味項目も認識の正誤についての確認対象に追加
した応答情報を生成するものである。
【0048】この発明に係る対話処理装置は、入力情報
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成手段と、理解結果仮説の各意味項目に対し
て、該意味項目を有する仮説間の尤度和である信頼度を
算出する信頼度計算手段と、複数の仮説から認識に誤り
がある意味項目を含む仮説を削除し、これら仮説に基づ
いて理解結果仮説の各意味項目に対する信頼度を算出す
る補正信頼度計算手段と、理解結果仮説の意味項目の補
正信頼度に基づいて、該理解結果仮説に関する利用者へ
の応答情報を生成する対話管理手段とを備えるものであ
る。
【0049】この発明に係る対話処理装置は、入力情報
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成手段と、理解結果仮説の各意味項目に対し
て、該意味項目を有する仮説間の尤度和である信頼度を
算出する信頼度計算手段と、認識に誤りがある意味項目
を含む仮説を削除した複数の仮説から、所定の尤度を有
する仮説を新たな理解結果仮説として選択する補正仮説
生成手段と、複数の仮説から認識に誤りがある意味項目
を含む仮説を削除し、これら仮説に基づいて新たな理解
結果仮説の各意味項目に対する信頼度を算出する補正信
頼度計算手段と、新たな理解結果仮説の各意味項目の信
頼度に基づいて、該理解結果仮説に関する利用者への応
答情報を生成する対話管理手段とを備えるものである。
【0050】この発明に係る対話処理装置は、対話管理
手段に信頼度の規定値を予め設定しておき、理解結果仮
説内に信頼度が規定値以下である意味項目が存在する
と、該意味項目を認識の正誤についての確認対象として
選択した応答情報を生成するものである。
【0051】この発明に係る対話処理方法は、入力情報
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成ステップと、理解結果仮説の各意味項目に対
して、該意味項目を有する仮説間の尤度和である信頼度
を算出する信頼度計算ステップと、理解結果仮説の意味
項目に対して、複数の仮説において意味項目同士が共起
する割合である関連度を算出する関連度計算ステップ
と、理解結果仮説の意味項目の信頼度と該意味項目につ
いての関連度とに基づいて、該理解結果仮説に関する利
用者への応答情報を生成する対話管理ステップと、該対
話管理ステップにて生成された応答情報を提示する応答
提示ステップとを備えるものである。
【0052】この発明に係る対話処理方法は、対話管理
ステップにて、理解結果仮説内に信頼度が予め設定した
規定値以下である意味項目が存在すると、該意味項目を
認識の正誤についての確認対象として選択するととも
に、該意味項目との関連度が予め設定した規定値以上で
ある意味項目が理解結果仮説内に存在すると、該意味項
目も認識の正誤についての確認対象に追加した応答情報
を生成するものである。
【0053】この発明に係る対話処理方法は、入力情報
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成ステップと、理解結果仮説の各意味項目に対
して、該意味項目を有する仮説間の尤度和である信頼度
を算出する信頼度計算ステップと、複数の仮説から認識
に誤りがある意味項目を含む仮説を削除し、これら仮説
に基づいて理解結果仮説の各意味項目に対する信頼度を
算出する補正信頼度計算ステップと、理解結果仮説の意
味項目の補正信頼度に基づいて該理解結果仮説に関する
利用者への応答情報を生成する対話管理ステップと、該
対話管理ステップにて生成された応答情報を提示する応
答提示ステップとを備えるものである。
【0054】この発明に係る対話処理方法は、入力情報
の内容を意味項目ごとに認識した仮説を、該入力情報に
関する尤度に応じて複数生成するとともに、これらのう
ち所定の尤度を有する仮説を理解結果仮説として選択す
る仮説生成ステップと、理解結果仮説の各意味項目に対
して、該意味項目を有する仮説間の尤度和である信頼度
を算出する信頼度計算ステップと、認識に誤りがある意
味項目を含む仮説を削除した複数の仮説から、所定の尤
度を有する仮説を新たな理解結果仮説として選択する補
正仮説生成ステップと、複数の仮説から認識に誤りがあ
る意味項目を含む仮説を削除し、これら仮説に基づいて
新たな理解結果仮説の各意味項目に対する信頼度を算出
する補正信頼度計算ステップと、新たな理解結果仮説の
各意味項目の信頼度に基づいて該理解結果仮説に関する
利用者への応答情報を生成する対話管理ステップと、該
対話管理ステップにて生成された応答情報を提示する応
答提示ステップとを備えるものである。
【0055】この発明に係る対話処理方法は、対話管理
ステップにて、理解結果仮説内に信頼度が予め設定した
規定値以下である意味項目が存在すると、該意味項目を
認識の正誤についての確認対象として選択した応答情報
を生成するものである。
【0056】この発明に係るプログラムは、入力情報の
内容を意味項目ごとに認識した仮説を、該入力情報に関
する尤度に応じて複数生成するとともに、これらのうち
所定の尤度を有する仮説を理解結果仮説として選択する
仮説生成手段、理解結果仮説の各意味項目に対して、該
意味項目を有する仮説間の尤度和である信頼度を算出す
る信頼度計算手段、理解結果仮説の意味項目に対して、
複数の仮説において意味項目同士が共起する割合である
関連度を算出する関連度計算手段、理解結果仮説の意味
項目の信頼度と該意味項目についての関連度とに基づい
て該理解結果仮説に関する利用者への応答情報を生成す
る対話管理手段としてコンピュータを機能させるもので
ある。
【0057】この発明に係るプログラムは、入力情報の
内容を意味項目ごとに認識した仮説を、該入力情報に関
する尤度に応じて複数生成するとともに、これらのうち
所定の尤度を有する仮説を理解結果仮説として選択する
仮説生成手段、理解結果仮説の各意味項目に対して、該
意味項目を有する仮説間の尤度和である信頼度を算出す
る信頼度計算手段、複数の仮説から認識に誤りがある意
味項目を含む仮説を削除し、これら仮説に基づいて理解
結果仮説の各意味項目に対する信頼度を算出する補正信
頼度計算手段、理解結果仮説の意味項目の補正信頼度に
基づいて、該理解結果仮説に関する利用者への応答情報
を生成する対話管理手段としてコンピュータを機能させ
るものである。
【0058】この発明に係るプログラムは、入力情報の
内容を意味項目ごとに認識した仮説を、該入力情報に関
する尤度に応じて複数生成するとともに、これらのうち
所定の尤度を有する仮説を理解結果仮説として選択する
仮説生成手段、理解結果仮説の各意味項目に対して、該
意味項目を有する仮説間の尤度和である信頼度を算出す
る信頼度計算手段、認識に誤りがある意味項目を含む仮
説を削除した複数の仮説から、所定の尤度を有する仮説
を新たな理解結果仮説として選択する補正仮説生成手
段、複数の仮説から認識に誤りがある意味項目を含む仮
説を削除し、これら仮説に基づいて新たな理解結果仮説
の各意味項目に対する信頼度を算出する補正信頼度計算
手段、新たな理解結果仮説の各意味項目の信頼度に基づ
いて該理解結果仮説に関する利用者への応答情報を生成
する対話管理手段としてコンピュータを機能させるもの
である。
【0059】
【発明の実施の形態】以下、この発明の実施の一形態を
説明するものである。 実施の形態1.図1はこの発明の実施の形態1による対
話処理装置の構成を示すブロック図であり、対話処理に
よってホテルの検索や予約を行う例について示してい
る。図において、1は不図示の音声入力手段と接続する
音声理解部(仮説生成手段)で、該音声入力手段を介し
て利用者から入力された発話に対して音声認識・理解処
理を施して意味項目の組み合わせからなる尤度付きの仮
説群(複数の仮説)を生成すると共に、これらの中から
尤度が最大となる仮説を理解結果(理解結果仮説)とし
て選択する。2は意味項目の信頼度を算出する信頼度計
算部(信頼度計算手段)であって、音声理解部1から入
力した理解結果と尤度付きの仮説群とに基づいて理解結
果に含まれる各意味項目の信頼度を算出する。3は意味
項目の関連度を算出する関連度計算部(関連度計算手
段)で、音声理解部1から理解結果を入力して、該理解
結果内の意味項目に関する関連度を算出する。4は利用
者に提示する応答を生成する対話管理部(対話管理手
段)であって、音声理解部1からの理解結果、信頼度計
算部2からの信頼度、関連度計算部3からの関連度、対
話状況記憶部5が保持する対話状況、及びホテルデータ
ベース6が保持するホテル情報とを参照して利用者に提
示する応答を生成する。
【0060】5は対話管理部4と接続する対話状況記憶
部で、対話管理部4から入力した対話状況を保持する。
6はホテル情報を保持するホテルデータベースであっ
て、ホテル名、所在地、交通経路、宿泊料金や空き部屋
状況をホテル情報として管理している。7は対話管理部
4から入力した応答を利用者に提示する応答出力部で、
例えば対話管理部4からの応答を文字列として不図示の
ディスプレイ上に表示する。ここで、音声理解部1、信
頼度計算部2、関連度計算部3、対話管理部4、及び応
答出力部7の一部の機能は、コンピュータ装置のプロセ
ッサ(CPU)に実行させるプログラムによって実現す
ることができる。また、対話状況記憶部5やホテルデー
タベース6は、上記プロセッサによって適宜データの読
み出し・書き込みが可能なコンピュータ装置が具備する
記憶装置によって実現することができる。
【0061】次に動作について説明する。図2は図1中
の対話処理装置による対話処理で得られる情報を示す図
であり、この図に沿って対話処理の概要を説明する。先
ず、音声理解部1は、入力された発話1「東急イン横浜
関内でそれ一泊お願いします」に対して音声理解処理を
行って、意味項目「人数=9」「場所=横浜市」「泊数
=1」「意図=値指定」からなる理解結果を得る。図示
の例において、理解結果として選択された意味項目のう
ち、「人数=9」及び「場所=横浜市」が誤って生成さ
れた意味項目である(仮説生成ステップ)。
【0062】次に、信頼度計算部2が、上記理解結果中
の各意味項目に対して上記従来の技術で示した方法で信
頼度を計算し、対話管理部4に出力する(信頼度計算ス
テップ)。その結果、対話管理部4は、信頼度が予め設
定された閾値(規定値)0.50より低い意味項目「場
所=横浜市」に関して、認識の誤りがある可能性が高い
と判断し、これらを正誤の確認対象として抽出する(対
話管理ステップ)。
【0063】さらに、関連度計算部3は、上記信頼度の
低い意味項目「場所=横浜市」と、その他の意味項目と
の間の関連度を計算し、対話管理部4に出力する(関連
度計算ステップ)。このとき、対話管理部4は、関連度
が予め設定した閾値(規定値)0.30より高い意味項
目「人数=9」に関して、認識の誤りがある可能性が高
いと判断し、これを正誤の確認対象として抽出する(対
話管理ステップ)。
【0064】こうして、対話管理部4は、抽出した意味
項目の正誤を利用者に確認するための「場所は横浜市、
人数は9人でよろしいですか」という応答情報を生成
し、応答出力部7に出力する(応答1)。応答出力部7
では、例えば不図示のディスプレイなどに文字列として
上記応答情報を表示して、利用者に提示する(応答提示
ステップ)。これに対して、利用者が「いいえ」を入力
した場合(発話2)、該意味項目「場所=横浜市」と
「人数=9」を棄却する。
【0065】次に図1に示した対話処理装置の動作につ
いて各構成要素ごとに説明する。先ず、音声理解部1
は、入力された発話に対して音声認識・理解処理を行う
ことで、意味項目の組み合わせからなる尤度付きの仮説
群を生成する(仮説生成ステップ)。このとき、従来と
同様にして、音声理解部1は仮説群の中で尤度が最大の
仮説を理解結果として選択する。これら尤度付き仮説群
及び理解結果は、信頼度計算部2、関連度計算部3及び
対話管理部4に送られる。
【0066】信頼度計算部2では、音声理解部1から理
解結果及び尤度付き仮説群を入力すると、これらに基づ
いて各意味項目の信頼度を計算する(信頼度計算ステッ
プ)。具体的には、上記従来の技術と同様に動作する。
即ち、信頼度計算部2は、入力した尤度付き仮説群に対
して尤度の正規化を行い、第i位の単語系列の仮説に対
して認識時に付与された尤度をLiとして、上記式
(1)から正規化後の尤度(事後確率)Piを算出す
る。次に、信頼度計算部2は、尤度付き仮説群に対する
尤度の正規化処理が完了すると、上記式(3)を用いて
理解結果に含まれる各意味項目vの信頼度R(v)を求
める。このようにして求められた信頼度は、対話管理部
4に送出される。
【0067】関連度計算部3では、音声理解部1から入
力した尤度付き仮説群に基づいて意味項目間の関連度を
計算する(関連度計算ステップ)。ここで、関連度と
は、或る2つの意味項目が仮説群中でどの程度偏って共
起するかを表す尺度である。この関連度としては、例え
ば下記式(4)に示すような、意味項目vaの意味項目
vbに対する相互情報量を用いることができる。式中、
^vaや^vbは、vaやvbが生起しないことを示し
ている。また、式中、全ての確率Pは、上記式(1)に
より正規化を行った仮説の尤度Pi(i=1,・・・,
N、Nは仮説数)に基づいて求める。さらに、P(v
b)、P(vb,va)、P(vb|va)は、それぞ
れ下記式(5)、式(6)、式(7)により求める。
【0068】 I(vb;va)=−P(vb)logP(vb)−P(^vb)logP( ^vb)+P(vb,va)logP(vb|va)+P(^vb,va)lo gP(^vb|va)+P(vb,^va)logP(vb|^va)+P(^ vb,^va)logP(^vb|^va) ・・・(4)
【0069】 P(vb)=Σ_{is.t.Vi∋vb}Pi ・・・(5)
【0070】 P(vb,va)=Σ_{is.t.Vi⊇{vb,va}}Pi ・・・(6)
【0071】 P(vb|va)=P(vb,va)/P(va) ・・・(7)
【0072】図2では、信頼度が閾値0.50より低い
意味項目「場所=横浜市」と、理解結果におけるその他
の意味項目との関連度を示している。関連度計算部2に
よって、上述の方法で関連度を計算すると、それぞれ
「人数=9」で0.363、「泊数=1」で0.00
5、「意図=値指定」0.000と求まる。これらのう
ち、関連度が大きい意味項目「人数=9」は、出現する
仮説がほぼ「場所=横浜市」と一致していることを意味
する。従って「人数=9」の正誤は、「場所=横浜市」
の正誤と強い相関を持つ。このようにして求められた信
頼度が閾値0.50より低い意味項目「場所=横浜市」
と、理解結果におけるその他の意味項目との関連度は、
対話管理部4に送出される。
【0073】対話管理部4では、音声理解部1から受け
取る理解結果と、信頼度計算部2から受け取る信頼度
と、関連度計算部3から受け取る関連度と、対話状況記
憶部5が保持する対話状況と、ホテルデータベース6が
保持するホテルの情報とを参照して、利用者に出力する
応答を生成する(対話管理ステップ)。図3は図1中の
対話管理部による動作を示すフロー図であり、同図を用
いて該対話管理部の動作について詳細に説明する。先
ず、対話管理部4は、音声理解部1から発話1に対する
理解結果(意味項目の組み合わせ)を受け取る(ステッ
プST1)。続いて、対話管理部4は、信頼度計算部2
からステップST1で入力した理解結果の各意味項目に
関する信頼度を受け取る(ステップST2)。ステップ
ST3において、対話管理部4は、ステップST1で受
け取った理解結果の意味項目に基づいて対話状況記憶部
5の内容を更新する。具体的には、図15に示すような
対話状況記憶部5が保持する対話状況の各スロットに、
「意図」以外の意味項目を書き込む。
【0074】次に、ステップST2で受け取った理解結
果の各意味項目に関する信頼度に対して、対話管理部4
は、予め設定しておいた閾値0.50による信頼度の閾
値判定を行う(ステップST4)。これによって低信頼
度の意味項目を検出する。このとき、理解結果の各意味
項目に関する信頼度の中に閾値に達しない低信頼度の意
味項目がない場合、対話管理部4は、ステップST5の
処理に移行する。一方、低信頼度の意味項目がある場合
は、ステップST7の処理に移行する。ステップST5
において、対話管理部4は、下記のようにして発話1に
対する応答を生成し、応答出力部7に送出する。
【0075】応答出力部7に応答が送出されると、対話
管理部4は、対話状況記憶部5の内容に基づいて対話の
終了判定を行う(ステップST6)。このとき、対話状
況の「予約状況」スロットに値「完了」が書き込まれて
いれば、対話管理部4は対話を終了する。対話状況の
「予約状況」スロットに値「完了」が書き込まれていな
い場合は、ステップST1に戻って対話を継続する。
【0076】一方、ステップST4で低信頼度の意味項
目が検出されると、関連度計算部3は、音声理解部1か
ら入力した尤度付き仮説群に基づいて、上記低信頼度の
意味項目と理解結果内の他の意味項目との間における関
連度を計算し、対話管理部4に送出する(ステップST
7)。
【0077】対話管理部4では、ステップST4で検出
した低信頼度の意味項目と、ステップST1で得られた
理解結果に含まれるその他の意味項目との関連度に関
し、予め定めた閾値0.30による閾値判定を行い、高
関連度の意味項目を検出する。このあと、対話管理部4
は、ステップST4で検出した低信頼度の意味項目、及
びステップST7で検出した高関連度の意味項目に関
し、その正誤を利用者に確認するための応答を生成し、
応答出力部7に送出する(ステップST8)。例えば、
図2に示すように、低信頼度の意味項目として「場所=
横浜市」が検出され、高関連度の意味項目として「人数
=9」が検出されている場合、対話管理部4は「場所は
横浜市、人数は九人でよろしいですか」という応答を生
成する。
【0078】続いて、上述した意味項目に関する正誤確
認に対する返答として、対話管理部4は、利用者から音
声理解部1を介して新たに入力された発話2に対する理
解結果を受け取る(ステップST9)。
【0079】このあと、発話2に対する理解結果に基づ
いて、対話管理部4は、ステップST8で確認を行った
意味項目の誤り判定を行う(ステップST10)。例え
ば、ステップST9において、発話2「いいえ」より理
解結果「意図=否定」が得られた場合、対話管理部4
は、ステップST8で確認を行った意味項目「場所=横
浜市」及び「人数=9」を誤り意味項目として確定す
る。このように、誤り意味項目が確定されると、対話管
理部4は、確定した誤り意味項目を対話状況記憶部5内
の対話状況スロットから削除する(ステップST1
1)。一方、誤り意味項目として確定されない場合、対
話管理部4は、ステップST5の処理に移行して、上述
した処理を行う。
【0080】応答出力部7は、対話管理部4から受け取
る応答を、例えば不図示のディスプレイなどに文字列と
して表示して、利用者に提示する(応答提示ステッ
プ)。
【0081】以上のように、この実施の形態1によれ
ば、信頼度が低い意味項目に加え、該意味項目に関連度
の高い意味項目(即ち、信頼度の低い意味項目が出現す
る仮説に生起がほぼ限定される意味項目)を検出し、正
誤を利用者に確認するので、該信頼度の低い意味項目が
誤りである場合、これに対して高い関連度を示す意味項
目はその生起確率が極めて小さくなることから同様に誤
りである可能性が高い。これにより、信頼度に対する閾
値判定では検出できない誤り意味項目を、高精度に検出
することが可能であり、誤り意味項目の確認漏れに起因
する対話処理装置の誤動作の問題を解決することができ
る。
【0082】実施の形態2.図4はこの発明の実施の形
態2による対話処理装置の構成を示すブロック図であ
り、対話処理によってホテルの検索や予約を行う例につ
いて示している。図において、4aは利用者に提示する
応答を生成する対話管理部(対話管理手段)であって、
音声理解部1からの理解結果、信頼度計算部2からの信
頼度、補正信頼度計算部8からの補正信頼度、対話状況
記憶部5が保持する対話状況、及びホテルデータベース
6が保持するホテル情報とを参照して利用者に提示する
応答を生成する。8は意味項目の補正信頼度を算出する
補正信頼度計算部(補正信頼度計算手段)であって、対
話管理部4aから入力した誤りが確定した意味項目と尤
度付きの仮説群とに基づいて理解結果に含まれる各意味
項目の信頼度を補正する。ここで、対話管理部4a、及
び補正信頼度計算部8の機能は、コンピュータ装置のプ
ロセッサ(CPU)に実行させるプログラムによって実
現することができる。なお、図1と同一構成要素には同
一符号を付して重複する説明を省略する。
【0083】次に動作について説明する。図5は図4中
の対話処理装置による対話処理で得られる情報を示す図
であり、この図に沿って対話処理の概要を説明する。先
ず、音声理解部1は、入力された発話1「東急イン横浜
関内でそれ一泊お願いします」に対して音声理解処理を
行って、意味項目「人数=9」「場所=横浜市」「泊数
=1」「意図=値指定」からなる理解結果を得る。図示
の例において、理解結果として選択された意味項目のう
ち、「人数=9」及び「場所=横浜市」が誤って生成さ
れた意味項目である(仮説生成ステップ)。
【0084】次に、信頼度計算部2が上記理解結果中の
各意味項目に対して上記従来の技術で示した方法で信頼
度を計算し、対話管理部4aに出力する(信頼度計算ス
テップ)。その結果、対話管理部4aは、信頼度が予め
設定された閾値(規定値)0.50より低い意味項目
「場所=横浜市」に関して、認識の誤りがある可能性が
高いと判断し、これらを正誤の確認対象として抽出する
(対話管理ステップ)。
【0085】対話管理部4aは、抽出した意味項目の正
誤を利用者に確認するための「場所は横浜市でよろしい
ですか」という応答情報を生成し、応答出力部7に出力
する(応答1)。応答出力部7では、例えば不図示のデ
ィスプレイなどに文字列として上記応答情報を表示し
て、利用者に提示する(応答提示ステップ)。これに対
して、利用者が「いいえ」を入力したため(発話2)、
該意味項目「場所=横浜市」を誤りとして確定し、棄却
する。
【0086】然る後、該意味項目「場所=横浜市」が誤
りであることに基づいて、補正信頼度計算部8は、その
他の意味項目「人数=9」「泊数=1」の補正信頼度を
計算する(補正信頼度計算ステップ)。該補正信頼度が
予め設定した閾値0.30より低い意味項目「人数=
9」は、誤りである可能性が高い。そこで、対話管理部
4aは、該意味項目の正誤を利用者に確認するための
「人数は九人でよろしいですか」という応答情報を生成
し、応答出力部7に出力する(応答2)。応答出力部7
では、例えば不図示のディスプレイなどに文字列として
上記応答情報を表示して、利用者に提示する(応答提示
ステップ)。これに対して、利用者が「いいえ」を入力
したため(発話3)、該意味項目「人数=9」を誤りと
確定し、棄却する。
【0087】次に図4に示した対話処理装置の動作につ
いて各構成要素ごとに説明する。なお、図4において、
図1と同一符号を付した構成要素は、同一乃至これに相
当する処理を行うため説明を省略する。以下、図4中の
対話管理部4a及び補正信頼度計算部8の動作について
説明する。先ず、補正信頼度計算部8は、対話管理部4
aから受け取る誤り意味項目のリスト及び尤度付き仮説
群に基づいて、理解結果の意味項目の補正信頼度を計算
する(補正信頼度計算ステップ)。ここで、図5を用い
て該補正信頼度計算部8の動作について詳細に説明す
る。対話管理部4aから受け取る誤り意味項目のリスト
とは、既に利用者に確認を行った結果から、誤りである
ことが確定している意味項目のリストである。例えば、
誤り意味項目のリストとして、「場所=横浜市」の1要
素からなるリストを受け取ったとする。このとき、図5
に示す5個の仮説のうち、1位と4位の仮説は該誤り意
味項目「場所=横浜市」を含むことから、誤った仮説で
あることが確定する。
【0088】そこで、補正信頼度計算部8は、上記仮説
群から該誤った仮説を取り除くとともに、残った仮説群
だけで尤度和が1となるように、下記式(7)で尤度を
正規化する。式中、Liは第i位の単語系列仮説に対し
て認識時に付与された尤度である。Z'は5個の仮説に
対してP’iの総和が1となるように導入した正規化係
数であり、下記式(9)により与える。また、α'は予
め定めた重み係数(定数)である。Nは仮説数であり、
図示の例では5である。
【0089】 P'i≡exp(α'・Li)/Z'(i=1,・・・,NかつViが誤り意味 項目を含まない) ・・・(8)
【0090】 Z'≡Σ_{j=1,2,・・・,NかつVjが誤り意味項目を含まない}e xp(α'・Lj) ・・・(9)
【0091】補正信頼度計算部8は、該尤度を正規化し
た仮説群を用いて補正信頼度を計算する。或る意味項目
vの補正信頼度R'(v)は、該意味項目を含み、誤り
意味項目を含まない仮説の尤度和により下記式(10)
で与える。
【0092】 R'(v)=Σ_{is.t.Vi∋vかつViが誤り意味項目を含まない} P'i ・・・(10)
【0093】図5では、「場所=横浜市」が誤り意味項
目であることに基づいて、その他の意味項目「人数=
9」「泊数=1」「意図=値指定」の補正信頼度を計算
した例であり、それぞれ0.26,0.89,1.00
と求まる。このように、既知の誤り「場所=横浜市」を
含む仮説を除くことで、発話中の「東急イン横浜関内」
の区間を誤認識した仮説が減少する。このとき、該誤認
識に起因するその他の誤り意味項目「人数=9」も、こ
れを支持する仮説を失うことになるから、信頼度が下が
る。
【0094】対話管理部4aでは、音声理解部1から受
け取る理解結果及び尤度付き仮説群と、信頼度計算部2
から受け取る信頼度と、補正信頼度計算部8から受け取
る補正信頼度と、前記対話状況記憶部5が保持する対話
状況と、ホテルデータベース6が保持するホテルの情報
とを参照して、利用者に出力する応答を生成する。図6
は図4中の対話管理部による動作を示すフロー図であ
り、同図を用いて該対話管理部の動作について詳細に説
明する。先ず、対話管理部4aは、音声理解部1から発
話1に対する理解結果(意味項目の組み合わせ)と、尤
度付き仮説群とを受け取る(ステップST1a)。続い
て、対話管理部4aは、信頼度計算部2からステップS
T1aで入力した理解結果の各意味項目に関する信頼度
を受け取る(ステップST2a)。
【0095】ステップST3aにおいて、対話管理部4
aは、ステップST1aで受け取った理解結果の意味項
目に基づいて対話状況記憶部5の内容を更新する。具体
的には、図15に示すような対話状況記憶部5が保持す
る対話状況の各スロットに、「意図」以外の意味項目を
書き込む。
【0096】次に、ステップST2aで受け取った理解
結果の各意味項目に関する信頼度に対して、対話管理部
4aは、予め設定しておいた閾値0.50による信頼度
の閾値判定を行う(ステップST4a)。これによって
低信頼度の意味項目を検出する。このとき、理解結果の
各意味項目に関する信頼度の中に閾値に達しない低信頼
度の意味項目がない場合、対話管理部4aは、ステップ
ST5aの処理に移行する。一方、低信頼度の意味項目
がある場合は、ステップST7aの処理に移行する。ス
テップST5aにおいて、対話管理部4aは、下記のよ
うにして発話1に対する応答を生成し、応答出力部7に
送出する。
【0097】応答出力部7に応答が送出されると、対話
管理部4aは、対話状況記憶部5の内容に基づいて対話
の終了判定を行う(ステップST6a)。このとき、対
話状況の「予約状況」スロットに値「完了」が書き込ま
れていれば、対話管理部4aは対話を終了する。対話状
況の「予約状況」スロットに値「完了」が書き込まれて
いない場合は、ステップST1aに戻って対話を継続す
る。
【0098】対話管理部4aは、ステップST4aで検
出した低信頼度の意味項目に関し、その正誤を利用者に
確認するための応答を生成し、応答出力部7に送出する
(ステップST7a)。例えば、図5に示すように、低
信頼度の意味項目として「場所=横浜市」が検出されて
いる場合、対話管理部4aは「場所は横浜市でよろしい
ですか」という応答を生成する。
【0099】続いて、上述した意味項目に関する正誤確
認に対する返答として、対話管理部4aは、利用者から
音声理解部1を介して新たに入力された発話2に対する
理解結果を受け取る(ステップST8a)。
【0100】このあと、発話2に対する理解結果に基づ
いて、対話管理部4aは、ステップST7aで確認を行
った意味項目の誤り判定を行う(ステップST9a)。
例えば、ステップST8aにおいて、発話2「いいえ」
より理解結果「意図=否定」が得られた場合、対話管理
部4aは、ステップST8aで確認を行った意味項目
「場所=横浜市」を誤り意味項目として確定する。この
ように、誤り意味項目が確定されると、対話管理部4a
は、確定した誤り意味項目を対話状況記憶部5内の対話
状況スロットから削除する(ステップST10a)。一
方、誤り意味項目として確定されない場合、対話管理部
4aは、ステップST5aの処理に移行して、上述した
処理を行う。
【0101】このあと、対話管理部4aは、ステップS
T9aで確定した誤り意味項目とステップST1aで得
られた尤度付き仮説群とを補正信頼度計算部8に送出す
る。その結果、対話管理部4aは、意味項目の補正信頼
度を得ることとなる(ステップST11a)。
【0102】意味項目の補正信頼度を受けると、対話管
理部4aは、ステップST11aで得られた意味項目の
補正信頼度に対し、予め設定した閾値0.30による閾
値判定を行って(ステップST12a)、ステップST
1aで得られた理解結果に含まれる閾値より低い補正信
頼度の意味項目を検出する。ただし、誤り意味項目は検
出対象に含まない。このとき、閾値より低い補正信頼度
の意味項目がないと、対話管理部4aはステップST5
aの処理に移行し、閾値より低い補正信頼度の意味項目
があると、ステップST13aの処理に移行する。
【0103】ステップST13aにおいて、対話管理部
4aは、ステップST4aで検出した閾値より低い補正
信頼度の意味項目に関して、その正誤を利用者に確認す
るための応答内容を生成し、応答出力部7に送出する。
例えば、図5に示すように、閾値より低い補正信頼度の
意味項目として「人数=9」が検出された場合、対話管
理部4aは、「人数は9人でよろしいですか」という応
答情報を生成する。
【0104】続いて、上述した意味項目に関する正誤確
認に対する返答として、対話管理部4aは、利用者から
音声理解部1を介して新たに入力された発話3に対する
理解結果を受け取る(ステップST14a)。
【0105】ステップST15aでは、ステップST1
4aで得られた理解結果に基づいて、ステップST14
aで確認した意味項目の誤り判定を行う。例えば、ステ
ップST16aにおいて、発話3「いいえ」より理解結
果「意図=否定」が得られた場合、ステップST13a
で確認を行った意味項目「人数=9」を誤り意味項目と
して確定する。このように、誤り意味項目が確定された
場合は、ステップST16aに処理を移す。検出されな
い場合は、ステップST5aに処理を移す。このあと、
発話3に対する理解結果に基づいて、対話管理部4a
は、ステップST14aで確認を行った意味項目の誤り
判定を行う(ステップST15a)。例えば、ステップ
ST14aにおいて、発話3「いいえ」より理解結果
「意図=否定」が得られた場合、対話管理部4aは、ス
テップST13aで確認を行った意味項目「人数=9」
を誤り意味項目として確定する。このように、誤り意味
項目が確定されると、対話管理部4aは、確定した誤り
意味項目を対話状況記憶部5内の対話状況スロットから
削除する(ステップST16a)。一方、誤り意味項目
として確定されない場合、対話管理部4aは、ステップ
ST5aの処理に移行して、上述した処理を行う。
【0106】以上のように、この実施の形態2によれ
ば、信頼度が低い意味項目の正誤を利用者に確認した結
果、該意味項目が誤りであることが確定すると、さらに
再検証処理として、その他の意味項目の信頼度を補正す
るので、信頼度に対する閾値判定では検出できない誤り
意味項目を、高精度に検出することが可能であり、誤り
意味項目の確認漏れに起因する対話処理装置の誤動作の
問題を解決することができる。
【0107】実施の形態3.図7はこの発明の実施の形
態3による対話処理装置の構成を示すブロック図であ
り、対話処理によってホテルの検索や予約を行う例につ
いて示している。図において、4bは利用者に提示する
応答を生成する対話管理部(対話管理手段)であって、
音声理解部1からの理解結果、信頼度計算部2からの信
頼度、補正信頼度計算部8からの補正信頼度、補正音声
理解部9からの補正理解結果、対話状況記憶部5が保持
する対話状況、及びホテルデータベース6が保持するホ
テル情報とを参照して利用者に提示する応答を生成す
る。9は音声理解部1の理解結果から補正理解結果を求
める補正音声理解部(補正仮説生成手段)であって、対
話管理部4bから入力した誤りが確定した意味項目と尤
度付きの仮説群とに基づいて理解結果を補正する。ここ
で、対話管理部4b、及び補正音声理解部9の機能は、
コンピュータ装置のプロセッサ(CPU)に実行させる
プログラムによって実現することができる。なお、図1
及び図4と同一構成要素には同一符号を付して重複する
説明を省略する。
【0108】次に動作について説明する。図8は図7中
の対話処理装置による対話処理で得られる情報を示す図
であり、この図に沿って対話処理の概要を説明する。先
ず、音声理解部1は、入力された発話1「東急イン横浜
関内でそれ一泊お願いします」に対して音声理解処理を
行って、意味項目「人数=9」「場所=横浜市」「泊数
=1」「意図=値指定」からなる理解結果を得る。図示
の例において、理解結果として選択された意味項目のう
ち、「人数=9」及び「場所=横浜市」が誤って生成さ
れた意味項目である(仮説生成ステップ)。また、該理
解結果からは、本来生成すべき「ホテル=東急イン横浜
関内」が欠落している。
【0109】次に、信頼度計算部2が上記理解結果中の
各意味項目に対して上記従来の技術で示した方法で信頼
度を計算し、対話管理部4bに出力する(信頼度計算ス
テップ)。その結果、対話管理部4bは、信頼度が予め
設定された閾値(規定値)0.50より低い意味項目
「場所=横浜市」に関して、認識の誤りがある可能性が
高いと判断し、これらを正誤の確認対象として抽出する
(対話管理ステップ)。
【0110】対話管理部4bは、抽出した意味項目の正
誤を利用者に確認するための「場所は横浜市でよろしい
ですか」という応答情報を生成し、応答出力部7に出力
する(応答1)。応答出力部7では、例えば不図示のデ
ィスプレイなどに文字列として上記応答情報を表示し
て、利用者に提示する(応答提示ステップ)。これに対
して、利用者が「いいえ」を入力したため(発話2)、
該意味項目「場所=横浜市」を誤りとして確定し、棄却
する。
【0111】然る後、該意味項目「場所=横浜市」が誤
りであることに基づいて、補正音声理解部9は、誤り意
味項目「場所=横浜市」を含む仮説を削除した発話1に
関する仮説群から、補正理解結果を求める(補正仮説生
成ステップ)。この結果、当初の理解結果に含まれてい
た意味項目「人数=9」が消失し、新たな意味項目「ホ
テル=東急イン横浜関内」を含む理解結果が得られる。
【0112】さらに、補正信頼度計算部8は、該補正理
解結果中の意味項目に対して補正信頼度を求める(補正
信頼度計算ステップ)。この結果、該意味項目「ホテル
=東急イン横浜関内」の補正信頼度として、0.73が
得られる。該補正信頼度が閾値0.60より高い場合、
正しい意味項目である可能性が高い。同時に、消失した
意味項目「人数=9」は、誤りであった可能性が高い。
そこで、対話管理部4bは、該意味項目の正誤を利用者
に確認するために「人数は九人ではなく、ホテルは東急
イン横浜関内でよろしいですか」という応答情報を生成
し、応答出力部7に送出する(応答2)。応答出力部7
では、例えば不図示のディスプレイなどに文字列として
上記応答情報を表示して、利用者に提示する(応答提示
ステップ)。これに対して、利用者が「はい」を入力し
たため(発話3)、「人数=9」を誤りと確定して棄却
すると共に、「ホテル=東急イン横浜関内」を正解と確
定して受理する。
【0113】次に図7に示した対話処理装置の動作につ
いて各構成要素ごとに説明する。なお、図7において、
図1及び図4と同一符号を付した構成要素は、同一乃至
これに相当する処理を行うため説明を省略する。以下、
図7中の対話管理部4b及び補正音声理解部9の動作に
ついて説明する。先ず、補正音声理解部9は、対話管理
部4bから受け取る誤り意味項目のリストと、尤度付き
仮説群とに基づいて補正理解結果を生成する(補正仮説
生成ステップ)。ここで、図8を用いて該補正音声理解
部9の動作について詳細に説明する。対話管理部4bか
ら受け取る誤り意味項目のリストとは、既に利用者に確
認を行った結果から、誤りであることが確定している意
味項目のリストである。例えば、該リストとして、誤り
意味項目「場所=横浜市」の1要素からなるリストを受
け取ったとする。このとき、図8に示す仮説群のうち、
1位と4位の仮説は該誤り意味項目を含むことから、誤
った仮説であることが確定する。そこで、上記仮説群か
ら誤った仮説を取り除くとともに、残った仮説群だけで
尤度和が1となるように、上記式(8)による尤度の正
規化を行う。
【0114】この結果、補正音声理解部9は、尤度が最
大の意味項目の組み合わせ「ホテル=東急イン横浜関
内、泊数=1、意図=値指定」を補正理解結果として選
択する。このように、既知の誤り「場所=横浜市」を含
む仮説を除くことで、初めの理解結果に含まれていた意
味項目「人数=9」が消失し、脱落誤りを起こしていた
意味項目「ホテル=東急イン横浜関内」が新たに得られ
る。
【0115】対話管理部4bでは、音声理解部1から受
け取る理解結果及び尤度付き仮説群と、信頼度計算部2
から受け取る信頼度と、補正音声理解部9から受け取る
補正理解結果と、補正信頼度計算部8から受け取る補正
信頼度と、対話状況記憶部5が保持する対話状況と、ホ
テルデータベース6が保持するホテル情報とを参照し
て、利用者に出力する応答を生成する。図9は図7中の
対話管理部による動作を示すフロー図であり、同図を用
いて該対話管理部の動作について詳細に説明する。先
ず、対話管理部4bは、音声理解部1から発話1に対す
る理解結果(意味項目の組み合わせ)と、尤度付き仮説
群とを受け取る(ステップST1b)。続いて、対話管
理部4bは、信頼度計算部2からステップST1bで入
力した理解結果の各意味項目に関する信頼度を受け取る
(ステップST2b)。
【0116】ステップST3bにおいて、対話管理部4
bは、ステップST1bで受け取った理解結果の意味項
目に基づいて対話状況記憶部5の内容を更新する。具体
的には、図15に示すような対話状況記憶部5が保持す
る対話状況の各スロットに、「意図」以外の意味項目を
書き込む。
【0117】次に、ステップST2bで受け取った理解
結果の各意味項目に関する信頼度に対して、対話管理部
4bは、予め設定しておいた閾値0.50による信頼度
の閾値判定を行う(ステップST4b)。これによって
低信頼度の意味項目を検出する。このとき、理解結果の
各意味項目に関する信頼度の中に閾値に達しない低信頼
度の意味項目がない場合、対話管理部4bは、ステップ
ST5bの処理に移行する。一方、低信頼度の意味項目
がある場合は、ステップST7bの処理に移行する。ス
テップST5bにおいて、対話管理部4bは、下記のよ
うにして発話1に対する応答を生成し、応答出力部7に
送出する。
【0118】応答出力部7に応答が送出されると、対話
管理部4bは、対話状況記憶部5の内容に基づいて対話
の終了判定を行う(ステップST6b)。このとき、対
話状況の「予約状況」スロットに値「完了」が書き込ま
れていれば、対話管理部4bは対話を終了する。対話状
況の「予約状況」スロットに値「完了」が書き込まれて
いない場合は、ステップST1bに戻って対話を継続す
る。
【0119】対話管理部4bは、ステップST4bで検
出した低信頼度の意味項目に関し、その正誤を利用者に
確認するための応答を生成し、応答出力部7に送出する
(ステップST7b)。例えば、図8に示すように、低
信頼度の意味項目として「場所=横浜市」が検出されて
いる場合、対話管理部4bは「場所は横浜市でよろしい
ですか」という応答を生成する。
【0120】続いて、上述した意味項目に関する正誤確
認に対する返答として、対話管理部4bは、利用者から
音声理解部1を介して新たに入力された発話2に対する
理解結果を受け取る(ステップST8b)。
【0121】このあと、発話2に対する理解結果に基づ
いて、対話管理部4bは、ステップST7bで確認を行
った意味項目の誤り判定を行う(ステップST9b)。
例えば、ステップST8bにおいて、発話2「いいえ」
より理解結果「意図=否定」が得られた場合、対話管理
部4bは、ステップST8bで確認を行った意味項目
「場所=横浜市」を誤り意味項目として確定する。この
ように、誤り意味項目が確定されると、対話管理部4b
は、確定した誤り意味項目を対話状況記憶部5内の対話
状況スロットから削除する(ステップST10b)。一
方、誤り意味項目として確定されない場合、対話管理部
4bは、ステップST5bの処理に移行して、上述した
処理を行う。
【0122】対話管理部4bは、ステップST9bで確
定した誤り意味項目とステップST1bで受け取った尤
度付き仮説群とを補正音声理解部9に送出する。この結
果、対話管理部4bは発話1に対する補正理解結果(意
味項目の組み合わせ)を得る(ステップST11b)。
【0123】ステップST12bにおいて、対話管理部
4bは、ステップST9bで確定した誤り意味項目と、
ステップST1bで受け取った尤度付き仮説群とを補正
信頼度計算部8に送出する。補正信頼度計算部8は、補
正理解結果の各意味項目の補正信頼度を算出すると、こ
れを対話管理部4bに返信する。
【0124】このあと、対話管理部4bは、ステップS
T12bで得られた意味項目の補正信頼度に対して、予
め設定した閾値0.60による閾値判定を行う(ステッ
プST13b)。ここで、対話管理部4bは、補正理解
結果から閾値より高い補正信頼度を有する新規意味項目
を検出する。この新規意味項目とは、ステップST1b
の理解結果には存在しなかった補正理解結果中の意味項
目である。併せて、対話管理部4bは、消失した意味項
目を検出する。この消失した意味項目とは、ステップS
T1bの理解結果に存在する補正理解結果に存在しない
意味項目である。ただし、消失した意味項目には、誤り
が確定している意味項目を含まないものとする。このよ
うにして、閾値より高い補正信頼度の新規意味項目が検
出されると、対話管理部4bは、ステップST14bの
処理に移行し、閾値より高い補正信頼度の新規意味項目
が検出されないと、ステップST5bの処理に移行す
る。
【0125】ステップST14bにおいて、対話管理部
4bは、ステップST13bで検出した閾値より高い補
正信頼度の新規意味項目と消失した意味項目とに関し
て、その正誤を利用者に確認するための応答情報を生成
し、応答出力部7に送出する。図8の例では「ホテル=
東急イン横浜関内」と「人数=9」との正誤を確認する
ため、対話管理部4bは、応答「人数は九人ではなく、
ホテルは東急イン横浜関内でよろしいですか」という応
答情報を生成する。
【0126】続いて、上述した意味項目に関する正誤確
認に対する返答として、対話管理部4bは、利用者から
音声理解部1を介して新たに入力された発話3に対する
理解結果を受け取る(ステップST15b)。
【0127】このあと、ステップST15bで得られた
理解結果に基づいて、対話管理部4bは、ステップST
14bで確認した意味項目の正誤判定を行う(ステップ
ST16b)。例えば、ステップST15bにおいて、
発話3「はい」より理解結果「意図=肯定」が得られた
場合、対話管理部4bは、ステップST14bで確認を
行った意味項目「ホテル=東急イン横浜関内」を正しい
新規意味項目として確定するとともに、「人数=9」を
誤り意味項目として確定する。このように、正誤が確定
すると、対話管理部4bは、ステップST17bの処理
に移行し、確定しない場合は、ステップST5bの処理
に移行する。
【0128】ステップST17bにおいて、対話管理部
4bは、ステップST16bで確定した正しい新規意味
項目を、対話状況記憶部5のスロットに書き込む。ま
た、誤りが確定した意味項目を対話状況記憶部5のスロ
ットから削除する。
【0129】以上のように、この実施の形態3によれ
ば、信頼度が低い意味項目の正誤を利用者に確認した結
果、該意味項目が誤りであることが分かると、さらに再
理解処理として該誤り意味項目を含まない補正理解結果
を求めると共に、その信頼度を計算して、補正理解結果
中に新たな意味項目が高い信頼度で見つかった場合、そ
の正誤を利用者に確認するので、従来の信頼度に基づく
確認と棄却では対処できなかった意味項目の脱落誤りを
救済することができる。これにより、入力情報の欠落に
起因する対話処理装置の誤動作の問題を解決することが
できる。
【0130】なお、上記実施の形態1から3において、
音声を入力する代わりに、手書きの文字列や印刷された
文字列を入力とし、音声認識手段の代わりに、文字認識
手段を用いても良い。
【0131】また、上記実施の形態1から3において、
単語系列から意味項目の組み合わせを一意に生成する言
語理解部を用いる代わりに、単語系列から意味項目の組
み合わせを確率的に複数生成する言語理解部を用いても
良い。
【0132】
【発明の効果】以上のように、この発明によれば、入力
情報の内容を意味項目ごとに認識した仮説を、該入力情
報に関する尤度に応じて複数生成するとともに、これら
のうち所定の尤度を有する仮説を理解結果仮説として選
択し、理解結果仮説の各意味項目に対して該意味項目を
有する仮説間の尤度和である信頼度を算出し、加えて、
理解結果仮説の意味項目に対して仮説において意味項目
同士が共起する割合である関連度を算出して、理解結果
仮説の意味項目の信頼度と該意味項目についての関連度
とに基づいて該理解結果仮説に関する利用者への応答情
報を生成するので、信頼度に対する閾値判定では検出で
きない誤り意味項目を高精度に検出することができると
いう効果がある。また、誤り意味項目の確認漏れに起因
する対話処理装置の誤動作の問題を解決することができ
るという効果がある。
【0133】この発明によれば、理解結果仮説内に信頼
度が予め設定した規定値以下である意味項目が存在する
と、該意味項目を認識の正誤についての確認対象として
選択するとともに、該意味項目との関連度が予め設定し
た規定値以上である意味項目が理解結果仮説内に存在す
ると、該意味項目も認識の正誤についての確認対象に追
加した応答情報を生成するので、信頼度に対する閾値判
定では検出できない誤り意味項目を高精度に検出するこ
とができるという効果がある。
【0134】この発明によれば、入力情報の内容を意味
項目ごとに認識した仮説を、該入力情報に関する尤度に
応じて複数生成するとともに、これらのうち所定の尤度
を有する仮説を理解結果仮説として選択し、理解結果仮
説の各意味項目に対して、該意味項目を有する仮説間の
尤度和である信頼度を算出し、加えて、複数の仮説から
認識に誤りがある意味項目を含む仮説を削除し、これら
仮説に基づいて理解結果仮説の各意味項目に対する信頼
度を算出して、理解結果仮説の意味項目の補正信頼度に
基づいて該理解結果仮説に関する利用者への応答情報を
生成するので、信頼度に対する閾値判定では検出できな
い誤り意味項目を高精度に検出することができるという
効果がある。また、誤り意味項目の確認漏れに起因する
対話処理装置の誤動作の問題を解決することができると
いう効果がある。
【0135】この発明によれば、入力情報の内容を意味
項目ごとに認識した仮説を、該入力情報に関する尤度に
応じて複数生成するとともに、これらのうち所定の尤度
を有する仮説を理解結果仮説として選択し、理解結果仮
説の各意味項目に対して該意味項目を有する仮説間の尤
度和である信頼度を算出し、認識に誤りがある意味項目
を含む仮説を削除した複数の仮説から、所定の尤度を有
する仮説を新たな理解結果仮説として選択して、複数の
仮説から認識に誤りがある意味項目を含む仮説を削除
し、これら仮説に基づいて新たな理解結果仮説の各意味
項目に対する信頼度を算出して、新たな理解結果仮説の
各意味項目の信頼度に基づいて該理解結果仮説に関する
利用者への応答情報を生成するので、信頼度に対する閾
値判定では検出できない誤り意味項目を高精度に検出す
ることができるとともに、意味項目の脱落誤りを救済す
ることができるという効果がある。これにより、入力情
報の欠落に起因する対話処理装置の誤動作の問題を解決
することができるという効果がある。
【0136】この発明によれば、理解結果仮説内に信頼
度が予め設定した規定値以下である意味項目が存在する
と、該意味項目を認識の正誤についての確認対象として
選択した応答情報を生成するので、信頼度に対する閾値
判定では検出できない誤り意味項目を、高精度に検出す
ることができるという効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による対話処理装置
の構成を示すブロック図である。
【図2】 図1中の対話処理装置による対話処理で得ら
れる情報を示す図である。
【図3】 図1中の対話管理部による動作を示すフロー
図である。
【図4】 この発明の実施の形態2による対話処理装置
の構成を示すブロック図である。
【図5】 図4中の対話処理装置による対話処理で得ら
れる情報を示す図である。
【図6】 図4中の対話管理部による動作を示すフロー
図である。
【図7】 この発明の実施の形態3による対話処理装置
の構成を示すブロック図である。
【図8】 図7中の対話処理装置による対話処理で得ら
れる情報を示す図である。
【図9】 図7中の対話管理部による動作を示すフロー
図である。
【図10】 音声理解処理の一例を示す図である。
【図11】 従来の対話処理方式を適用した対話処理装
置の構成を示すブロック図である。
【図12】 図11中の対話処理装置による対話処理で
得られる情報を示す図である。
【図13】 図11中の音声理解部の構成を示すブロッ
ク図である。
【図14】 図13中の言語理解部が使用する意味項目
の生成ルールの一例を示す図である。
【図15】 図11中の対話状況記憶部が保持する対話
状況の一例を示す図である。
【図16】 図11中のホテルデータベースが保持する
ホテル情報の一例を示す図である。
【図17】 図11中の対話管理部の動作を示すフロー
図である。
【図18】 対話管理部による応答生成処理の一例を示
すフロー図である。
【符号の説明】
1 音声理解部(仮説生成手段)、2 信頼度計算部
(信頼度計算手段)、3関連度計算部(関連度計算手
段)、4,4a,4b 対話管理部(対話管理手段)、
5 対話状況記憶部、6 ホテルデータベース、7 応
答出力部、8 補正信頼度計算部(補正信頼度計算手
段)、9 補正音声理解部(補正仮説生成手段)、10
0 音声理解部、100a 音響分析部、100b 音
声認識部、100c 言語理解部、101 信頼度計算
部、102 対話状況記憶部、103対話管理部、10
4 応答出力部、105 ホテルデータベース。

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 入力情報の内容を意味項目ごとに認識し
    た仮説を、該入力情報に関する尤度に応じて複数生成す
    るとともに、これらのうち所定の尤度を有する仮説を理
    解結果仮説として選択する仮説生成手段と、 上記理解結果仮説の各意味項目に対して、該意味項目を
    有する仮説間の尤度和である信頼度を算出する信頼度計
    算手段と、 上記理解結果仮説の意味項目に対して、複数の上記仮説
    において意味項目同士が共起する割合である関連度を算
    出する関連度計算手段と、 上記理解結果仮説の意味項目の信頼度と該意味項目につ
    いての関連度とに基づいて、該理解結果仮説に関する利
    用者への応答情報を生成する対話管理手段とを備えた対
    話処理装置。
  2. 【請求項2】 対話管理手段は、信頼度及び関連度の規
    定値が予め設定されており、理解結果仮説内に信頼度が
    上記規定値以下である意味項目が存在すると、該意味項
    目を認識の正誤についての確認対象として選択するとと
    もに、該意味項目との関連度が上記規定値以上である意
    味項目が上記理解結果仮説内に存在すると、該意味項目
    も認識の正誤についての確認対象に追加した応答情報を
    生成することを特徴とする請求項1記載の対話処理装
    置。
  3. 【請求項3】 入力情報の内容を意味項目ごとに認識し
    た仮説を、該入力情報に関する尤度に応じて複数生成す
    るとともに、これらのうち所定の尤度を有する仮説を理
    解結果仮説として選択する仮説生成手段と、 上記理解結果仮説の各意味項目に対して、該意味項目を
    有する仮説間の尤度和である信頼度を算出する信頼度計
    算手段と、 複数の上記仮説から認識に誤りがある意味項目を含む仮
    説を削除し、これら仮説に基づいて上記理解結果仮説の
    各意味項目に対する信頼度を算出する補正信頼度計算手
    段と、 上記理解結果仮説の意味項目の補正信頼度に基づいて、
    該理解結果仮説に関する利用者への応答情報を生成する
    対話管理手段とを備えた対話処理装置。
  4. 【請求項4】 入力情報の内容を意味項目ごとに認識し
    た仮説を、該入力情報に関する尤度に応じて複数生成す
    るとともに、これらのうち所定の尤度を有する仮説を理
    解結果仮説として選択する仮説生成手段と、 上記理解結果仮説の各意味項目に対して、該意味項目を
    有する仮説間の尤度和である信頼度を算出する信頼度計
    算手段と、 認識に誤りがある意味項目を含む仮説を削除した複数の
    仮説から、所定の尤度を有する仮説を新たな理解結果仮
    説として選択する補正仮説生成手段と、 複数の上記仮説から認識に誤りがある意味項目を含む仮
    説を削除し、これら仮説に基づいて上記新たな理解結果
    仮説の各意味項目に対する信頼度を算出する補正信頼度
    計算手段と、 上記新たな理解結果仮説の各意味項目の信頼度に基づい
    て、該理解結果仮説に関する利用者への応答情報を生成
    する対話管理手段とを備えた対話処理装置。
  5. 【請求項5】 対話管理手段は、信頼度の規定値が予め
    設定されており、理解結果仮説内に信頼度が上記規定値
    以下である意味項目が存在すると、該意味項目を認識の
    正誤についての確認対象として選択した応答情報を生成
    することを特徴とする請求項3又は請求項4記載の対話
    処理装置。
  6. 【請求項6】 入力情報の内容を意味項目ごとに認識し
    た仮説を、該入力情報に関する尤度に応じて複数生成す
    るとともに、これらのうち所定の尤度を有する仮説を理
    解結果仮説として選択する仮説生成ステップと、 上記理解結果仮説の各意味項目に対して、該意味項目を
    有する仮説間の尤度和である信頼度を算出する信頼度計
    算ステップと、 上記理解結果仮説の意味項目に対して、複数の上記仮説
    において意味項目同士が共起する割合である関連度を算
    出する関連度計算ステップと、 上記理解結果仮説の意味項目の信頼度と該意味項目につ
    いての関連度とに基づいて、該理解結果仮説に関する利
    用者への応答情報を生成する対話管理ステップと、 該対話管理ステップにて生成された応答情報を提示する
    応答提示ステップとを備えた対話処理方法。
  7. 【請求項7】 対話管理ステップにて、理解結果仮説内
    に信頼度が予め設定した規定値以下である意味項目が存
    在すると、該意味項目を認識の正誤についての確認対象
    として選択するとともに、該意味項目との関連度が予め
    設定した規定値以上である意味項目が上記理解結果仮説
    内に存在すると、該意味項目も認識の正誤についての確
    認対象に追加した応答情報を生成することを特徴とする
    請求項6記載の対話処理方法。
  8. 【請求項8】 入力情報の内容を意味項目ごとに認識し
    た仮説を、該入力情報に関する尤度に応じて複数生成す
    るとともに、これらのうち所定の尤度を有する仮説を理
    解結果仮説として選択する仮説生成ステップと、 上記理解結果仮説の各意味項目に対して、該意味項目を
    有する仮説間の尤度和である信頼度を算出する信頼度計
    算ステップと、 複数の上記仮説から認識に誤りがある意味項目を含む仮
    説を削除し、これら仮説に基づいて上記理解結果仮説の
    各意味項目に対する信頼度を算出する補正信頼度計算ス
    テップと、 上記理解結果仮説の意味項目の補正信頼度に基づいて、
    該理解結果仮説に関する利用者への応答情報を生成する
    対話管理ステップと、 該対話管理ステップにて生成された応答情報を提示する
    応答提示ステップとを備えた対話処理方法。
  9. 【請求項9】 入力情報の内容を意味項目ごとに認識し
    た仮説を、該入力情報に関する尤度に応じて複数生成す
    るとともに、これらのうち所定の尤度を有する仮説を理
    解結果仮説として選択する仮説生成ステップと、 上記理解結果仮説の各意味項目に対して、該意味項目を
    有する仮説間の尤度和である信頼度を算出する信頼度計
    算ステップと、 認識に誤りがある意味項目を含む仮説を削除した複数の
    仮説から、所定の尤度を有する仮説を新たな理解結果仮
    説として選択する補正仮説生成ステップと、 複数の上記仮説から認識に誤りがある意味項目を含む仮
    説を削除し、これら仮説に基づいて上記新たな理解結果
    仮説の各意味項目に対する信頼度を算出する補正信頼度
    計算ステップと、 上記新たな理解結果仮説の各意味項目の信頼度に基づい
    て、該理解結果仮説に関する利用者への応答情報を生成
    する対話管理ステップと、 該対話管理ステップにて生成された応答情報を提示する
    応答提示ステップとを備えた対話処理方法。
  10. 【請求項10】 対話管理ステップにて、理解結果仮説
    内に信頼度が予め設定した規定値以下である意味項目が
    存在すると、該意味項目を認識の正誤についての確認対
    象として選択した応答情報を生成することを特徴とする
    請求項8又は請求項9記載の対話処理方法。
  11. 【請求項11】 入力情報の内容を意味項目ごとに認識
    した仮説を、該入力情報に関する尤度に応じて複数生成
    するとともに、これらのうち所定の尤度を有する仮説を
    理解結果仮説として選択する仮説生成手段、 上記理解結果仮説の各意味項目に対して、該意味項目を
    有する仮説間の尤度和である信頼度を算出する信頼度計
    算手段、 上記理解結果仮説の意味項目に対して、複数の上記仮説
    において意味項目同士が共起する割合である関連度を算
    出する関連度計算手段、 上記理解結果仮説の意味項目の信頼度と該意味項目につ
    いての関連度とに基づいて、該理解結果仮説に関する利
    用者への応答情報を生成する対話管理手段としてコンピ
    ュータを機能させるためのプログラム。
  12. 【請求項12】 入力情報の内容を意味項目ごとに認識
    した仮説を、該入力情報に関する尤度に応じて複数生成
    するとともに、これらのうち所定の尤度を有する仮説を
    理解結果仮説として選択する仮説生成手段、 上記理解結果仮説の各意味項目に対して、該意味項目を
    有する仮説間の尤度和である信頼度を算出する信頼度計
    算手段、 複数の上記仮説から認識に誤りがある意味項目を含む仮
    説を削除し、これら仮説に基づいて上記理解結果仮説の
    各意味項目に対する信頼度を算出する補正信頼度計算手
    段、 上記理解結果仮説の意味項目の補正信頼度に基づいて、
    該理解結果仮説に関する利用者への応答情報を生成する
    対話管理手段としてコンピュータを機能させるためのプ
    ログラム。
  13. 【請求項13】 入力情報の内容を意味項目ごとに認識
    した仮説を、該入力情報に関する尤度に応じて複数生成
    するとともに、これらのうち所定の尤度を有する仮説を
    理解結果仮説として選択する仮説生成手段、 上記理解結果仮説の各意味項目に対して、該意味項目を
    有する仮説間の尤度和である信頼度を算出する信頼度計
    算手段、 認識に誤りがある意味項目を含む仮説を削除した複数の
    仮説から、所定の尤度を有する仮説を新たな理解結果仮
    説として選択する補正仮説生成手段、 複数の上記仮説から認識に誤りがある意味項目を含む仮
    説を削除し、これら仮説に基づいて上記新たな理解結果
    仮説の各意味項目に対する信頼度を算出する補正信頼度
    計算手段、 上記新たな理解結果仮説の各意味項目の信頼度に基づい
    て、該理解結果仮説に関する利用者への応答情報を生成
    する対話管理手段としてコンピュータを機能させるため
    のプログラム。
JP2001220135A 2001-07-19 2001-07-19 対話処理装置及び対話処理方法並びにプログラム Expired - Fee Related JP4128342B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001220135A JP4128342B2 (ja) 2001-07-19 2001-07-19 対話処理装置及び対話処理方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001220135A JP4128342B2 (ja) 2001-07-19 2001-07-19 対話処理装置及び対話処理方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2003029782A true JP2003029782A (ja) 2003-01-31
JP4128342B2 JP4128342B2 (ja) 2008-07-30

Family

ID=19053997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001220135A Expired - Fee Related JP4128342B2 (ja) 2001-07-19 2001-07-19 対話処理装置及び対話処理方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP4128342B2 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005181386A (ja) * 2003-12-16 2005-07-07 Mitsubishi Electric Corp 音声対話処理装置及び音声対話処理方法並びにプログラム
JP2005275348A (ja) * 2004-02-23 2005-10-06 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
JP2006139134A (ja) * 2004-11-12 2006-06-01 Pioneer Electronic Corp 音声出力制御装置、音声出力制御システム、それらの方法、それらのプログラム、および、それらのプログラムを記録した記録媒体
JP2006139133A (ja) * 2004-11-12 2006-06-01 Pioneer Electronic Corp 音声情報生成装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、音声情報のデータ構造、音声情報を記録した記録媒体、音声出力制御装置、および、そのシステム
JP2006208905A (ja) * 2005-01-31 2006-08-10 Nissan Motor Co Ltd 音声対話装置及び音声対話方法
WO2006083020A1 (ja) * 2005-02-04 2006-08-10 Hitachi, Ltd. 抽出された音声データを用いて応答音声を生成する音声認識システム
JP2008097003A (ja) * 2006-10-12 2008-04-24 Qnx Software Systems (Wavemakers) Inc 自動音声認識システムに対する適応コンテキスト
WO2009008115A1 (ja) * 2007-07-09 2009-01-15 Mitsubishi Electric Corporation 音声認識装置およびナビゲーションシステム
JP2009503560A (ja) * 2005-07-22 2009-01-29 マルチモダル テクノロジーズ,インク. コンテンツベースの音声再生強調
JP2012027065A (ja) * 2010-07-20 2012-02-09 Nippon Telegr & Teleph Corp <Ntt> 2チャネル音声の音声認識方法とその装置とプログラム
WO2016151698A1 (ja) * 2015-03-20 2016-09-29 株式会社 東芝 対話装置、方法及びプログラム
WO2016151699A1 (ja) * 2015-03-20 2016-09-29 株式会社 東芝 学習装置、方法およびプログラム
CN111858894A (zh) * 2020-07-29 2020-10-30 网易(杭州)网络有限公司 语义缺失的识别方法及装置、电子设备、存储介质

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005181386A (ja) * 2003-12-16 2005-07-07 Mitsubishi Electric Corp 音声対話処理装置及び音声対話処理方法並びにプログラム
JP2005275348A (ja) * 2004-02-23 2005-10-06 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
JP2006139134A (ja) * 2004-11-12 2006-06-01 Pioneer Electronic Corp 音声出力制御装置、音声出力制御システム、それらの方法、それらのプログラム、および、それらのプログラムを記録した記録媒体
JP2006139133A (ja) * 2004-11-12 2006-06-01 Pioneer Electronic Corp 音声情報生成装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、音声情報のデータ構造、音声情報を記録した記録媒体、音声出力制御装置、および、そのシステム
JP4661239B2 (ja) * 2005-01-31 2011-03-30 日産自動車株式会社 音声対話装置及び音声対話方法
JP2006208905A (ja) * 2005-01-31 2006-08-10 Nissan Motor Co Ltd 音声対話装置及び音声対話方法
WO2006083020A1 (ja) * 2005-02-04 2006-08-10 Hitachi, Ltd. 抽出された音声データを用いて応答音声を生成する音声認識システム
JP2009503560A (ja) * 2005-07-22 2009-01-29 マルチモダル テクノロジーズ,インク. コンテンツベースの音声再生強調
US8768706B2 (en) 2005-07-22 2014-07-01 Multimodal Technologies, Llc Content-based audio playback emphasis
JP2008097003A (ja) * 2006-10-12 2008-04-24 Qnx Software Systems (Wavemakers) Inc 自動音声認識システムに対する適応コンテキスト
WO2009008115A1 (ja) * 2007-07-09 2009-01-15 Mitsubishi Electric Corporation 音声認識装置およびナビゲーションシステム
JPWO2009008115A1 (ja) * 2007-07-09 2010-09-02 三菱電機株式会社 音声認識装置およびナビゲーションシステム
JP2012027065A (ja) * 2010-07-20 2012-02-09 Nippon Telegr & Teleph Corp <Ntt> 2チャネル音声の音声認識方法とその装置とプログラム
WO2016151698A1 (ja) * 2015-03-20 2016-09-29 株式会社 東芝 対話装置、方法及びプログラム
WO2016151699A1 (ja) * 2015-03-20 2016-09-29 株式会社 東芝 学習装置、方法およびプログラム
JPWO2016151699A1 (ja) * 2015-03-20 2017-05-25 株式会社東芝 学習装置、方法およびプログラム
JPWO2016151698A1 (ja) * 2015-03-20 2017-05-25 株式会社東芝 対話装置、方法及びプログラム
US10446146B2 (en) 2015-03-20 2019-10-15 Kabushiki Kaisha Toshiba Learning apparatus and method
CN111858894A (zh) * 2020-07-29 2020-10-30 网易(杭州)网络有限公司 语义缺失的识别方法及装置、电子设备、存储介质
CN111858894B (zh) * 2020-07-29 2024-06-04 网易(杭州)网络有限公司 语义缺失的识别方法及装置、电子设备、存储介质

Also Published As

Publication number Publication date
JP4128342B2 (ja) 2008-07-30

Similar Documents

Publication Publication Date Title
US9037462B2 (en) User intention based on N-best list of recognition hypotheses for utterances in a dialog
US20230419960A1 (en) Determining state of automated assistant dialog
JP4680691B2 (ja) 対話システム
US7603279B2 (en) Grammar update system and method for speech recognition
JP4724377B2 (ja) 自然言語理解(NLU)システムにおける規則ベース文法に関するスロットおよび前終端記号(preterminal)に関する統計モデル
JP4545363B2 (ja) 音声認識システムにおける発音辞書の精度の自動的決定
US11016968B1 (en) Mutation architecture for contextual data aggregator
US7529657B2 (en) Configurable parameters for grammar authoring for speech recognition and natural language understanding
US7680661B2 (en) Method and system for improved speech recognition
JP2003029782A (ja) 対話処理装置及び対話処理方法並びにプログラム
WO2013080406A1 (ja) 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
US8401852B2 (en) Utilizing features generated from phonic units in speech recognition
EP1542207A1 (en) Speech recognition method and apparatus
US8428241B2 (en) Semi-supervised training of destination map for call handling applications
EP2863385B1 (en) Function execution instruction system, function execution instruction method, and function execution instruction program
US20040186819A1 (en) Telephone directory information retrieval system and method
US20220050968A1 (en) Intent resolution for chatbot conversations with negation and coreferences
CN111540353A (zh) 一种语义理解方法、装置、设备及存储介质
WO2020156342A1 (zh) 语音识别方法、装置、电子设备及存储介质
US11636853B2 (en) Natural language grammar improvement
Higashinaka et al. Incorporating discourse features into confidence scoring of intention recognition results in spoken dialogue systems
JP5326549B2 (ja) 音声認識装置及び方法
Hazen et al. Integrating recognition confidence scoring with language understanding and dialogue modeling.
TWI277948B (en) Method and system for template inquiry dialogue system
Švec et al. Semantic entity detection from multiple ASR hypotheses within the WFST framework

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071106

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071106

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080415

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080514

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120523

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120523

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130523

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140523

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees