JP2001014165A

JP2001014165A - 応答生成装置、対話管理装置、応答生成方法および応答生成プログラムを格納するコンピュータ読み取り可能な記録媒体

Info

Publication number: JP2001014165A
Application number: JP11186799A
Authority: JP
Inventors: Munehiko Sasajima; 宗彦笹島; Yasuyuki Kono; 恭之河野; Takehide Yano; 武秀屋野
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1999-06-30
Filing date: 1999-06-30
Publication date: 2001-01-19
Anticipated expiration: 2019-06-30
Also published as: JP3715470B2

Abstract

(57)【要約】【課題】自然言語による対話型の問題解決システムに
おいて、複雑な問い合わせ文に対して、問題文に対する
正確な応答が得られたか否かを、ユーザに実時間内で容
易に把握させる。【解決手段】自然言語の対話により、与えられた問い
合わせ文に対する解を含む応答文を生成する応答生成方
法であって、解を導出するために、１つ以上の解決すべ
き部分問題がある場合に、導出された解とともに、部分
問題のそれぞれに対応する問い合わせ文の要素である部
分問題表現と、部分問題のそれぞれへの解の表現である
部分解表現とを対とする部分問題表現対を含む応答文を
生成する応答文生成ステップを含む。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、応答生成装置、対
話管理装置、応答生成方法、および応答生成プログラム
を格納するコンピュータ読みとり可能な記録媒体に関す
る。特に、自然言語による対話型の問題解決システムに
おいて、複雑な問い合わせ文に対して、問題文に対する
正確な応答が得られたか否かを、ユーザに実時間内で容
易に把握させることのできる対話技術に関する。

【０００２】

【従来の技術】音声を入力チャネルとする対話システム
（以下、「音声対話システム」と称する）を、問題解決
型システムのインターフェースに採用する場合について
考える。

【０００３】例えば、カーナビゲーションシステム（以
下、単に「カーナビ」と称する）のインターフェースを
音声対話システムにすることができる。

【０００４】このカーナビを利用して問題解決を図るた
めには、音声対話システムに以下の仕様が求められる。

【０００５】（１）簡単な質問から複雑な質問まで、多
様な質問に対して解答が得られることを要する。

【０００６】（２）得られた解答がユーザの意図を満た
しているかを、ユーザ自身が簡単に確認できることを要
する。

【０００７】（３）ユーザの問題解決のための解答が実
時間で得られることを要する。例えば、カーナビの場合
であれば、この回答は、経路の選択を助ける内容とな
る。

【０００８】これらの仕様のうち、（１）に示す多様な
質問に対する解答の提示という点に関しては、既に様々
な研究が行われている。

【０００９】次に、上記の（２）および（３）の要求仕
様に関する従来技術の問題点を、カーナビの場合を例と
して具体的に説明する。

【００１０】例えば、ユーザが、図１３に示す経路を走
行中であって、現在地として示される地点を通過中であ
るとする。ユーザは、摩耶出口までに複数のサービスエ
リアが存在することを知っており、これからどこで休憩
するかを決めたいと考えたとする。ここで、ユーザは、
カーナビに対して、以下の入力文により質問する。

【００１１】「出口の前の最後のサービスエリアまでど
れくらい？」この質問に応答するためには、例えば以下の手順が必要
となる。

【００１２】ａ．「出口の前の最後のサービスエリア」
に該当するサービスエリアをデータベースから検索す
る。

【００１３】ｂ．現在地から「出口の前の最後のサービ
スエリア」までの距離を算出する。ｃ．算出された距離を含む応答文を生成する。

【００１４】この手順ｃにおいて、生成される文には、
以下の２つのパターンがある。

【００１５】第１に、カーナビによる推論の過程を全く
示さずに、推論結果のみを解答として生成する方法があ
る。図１３の例では、手順ａでの解は「魚崎サービスエ
リア」、手順ｂでの解は「１５キロメートル」である。
従って、この第１の方法は、以下の応答文を生成する。

【００１６】「魚崎サービスエリアまでの距離は約１５
キロです」しかし、ユーザは、上記の応答文が応答された場合、カ
ーナビシステムが、発話された質問文で提示された問題
を正しく認識し、正しいプロセスで問題解決したのか否
かを確認することができない。すなわち、ユーザは、得
られた応答が正しいか否かを検証することができない。
一般に、カーナビに対して音声で入力を行うと、音声の
認識誤りが一定程度発生する。このため、ユーザは、期
待する解答が得られず、要求が達成されない場合があ
る。

【００１７】例えば、カーナビが、上記の入力文中の
「最後」を「最初」と誤認識した場合、手順ａの解は
「吹田サービスエリア」、手順ｂの解は「５キロメート
ル」となる。になり、以下の応答文が生成される。

【００１８】「吹田サービスエリアまでの距離は約５キ
ロです」ユーザは、できるだけ高速上の摩耶出口付近で休憩した
かったにも拘わらず、この要求が達成されないことにな
る。

【００１９】第２に、カーナビによる推論の過程を全て
ユーザへの応答文に含める方法がある。例えば、（「文
部省科学研究費補助金重点領域研究音声・言語・概念
の統合的処理による対話の理解と生成に関する研究」ｐ
ｐ．２２３−２４０，平成８年３月）に開示されている
公知の手法を、この第２の方法に適用することができ
る。この手法においては、音声対話システムからの応答
によってユーザによる発想を促すことを主眼として、シ
ステムが行なった推論が全てユーザに提示される。

【００２０】この第２の方法では、ユーザは、応答文に
提示されたカーナビの全推論過程を把握することによっ
て、正しい解答が得られたか否かを検証することができ
る。

【００２１】しかし、一般に第２の方法で得られる応答
文は冗長となってリアルタイム処理には適さない。すな
わち、第２の方法は、例えば料理の献立を考えることを
支援するシステムなどのように、ユーザに問題解決のた
めの時間が十分に与えられている場合には有効である。
他方、カーナビのようなユーザに問題解決、即ち、経路
や休憩場所などについて正しい判断をするための時間と
余裕がほとんどないような場合には不向きである。

【００２２】第２の方法において、例えば手順ａでは、
以下の推論が行われる。

【００２３】・「出口」とは「現在走行中の有料道路の
終点」である。

【００２４】・「前」とは「現在走行中の経路におい
て、経路の出発点からある基準点までの部分経路」であ
る。

【００２５】・「最後」とは「複数候補のうち最も現在
地から遠いもの」である。

【００２６】これらの推論過程を含めた応答文は、例え
ば以下のように大変長く生成されてしまう。

【００２７】「出発地から現在走行中の有料道路終点で
ある摩耶出口までの間にあるサービスエリアで現在地か
ら最も遠いものは、魚崎サービスエリアです。」この長
い応答文を聞いている間にユーザの現在地は大きく変わ
ってしまう。例えば魚崎サービスエリアを通過してしま
うと、カーナビからの応答文はユーザにとって無意味な
情報となってしまう。また、応答文が長いため、走行中
のユーザがその内容を把握するのも困難となる。

【００２８】

【発明が解決しようとする課題】音声インターフェース
を用いる対話システムにおいては、１００％の認識率が
得られないことを前提とする必要がある。このため、ユ
ーザは、対話の応答文において、・自分の発話が間違って認識されていないか、・システムから得られた問題解決結果は正しいか、の２点を確認する必要がある。さらに、これらの２点は
迅速に確認されなければならない。

【００２９】ここで、単純な問題解決を実行するシステ
ム、例えば地点の検索のみを行うカーナビシステムとの
対話の場合、ユーザは、システムから得られた応答文を
聞くだけで上記の２点を確認することができる。

【００３０】一方、複雑な問題解決を実行するシステ
ム、例えば、２地点間の距離の問い合わせに応答するカ
ーナビシステムとの対話の場合、ユーザは、システムか
ら得られた応答文を聞くだけでは上記の２点を確認する
ことができない。すなわち、システムがユーザの意図す
る動作を実行したのか否か、実行しなかった場合にはど
こで誤りが生じたのか、などを上記の第１の方法では、
確認することができない。あるいは、第２の方法によ
り、これらの情報を含む応答文を出力すると、この応答
文は非常に冗長となり、ユーザが実用的時間内で確認す
ることができない。

【００３１】以上説明したように、本発明は、従来技術
の自然言語による問題解決型の対話システムにおいて、
複雑な問い合わせ文の入力に対して、ユーザが問い合わ
せ文を正しく認識され、処理されたかを、実時間内で容
易に確認、検証することができなかったという問題点を
解決するためになされたものである。

【００３２】そして、その目的とするところは、部分的
な解から入力文に対する解を抽出する必要のある複雑な
問題解決が要求される場合に、ユーザが問い合わせ文が
正しく認識され、処理されたか否かを、実用的時間内で
容易に確認、検証することのできる応答生成装置、対話
管理装置、応答生成方法および応答生成プログラムを格
納する記録媒体を提供することにある。

【００３３】また、本発明の他の目的は、生成された応
答文の冗長性を排除してユーザに苦痛を与えない簡潔な
応答を実現する点にある。

【００３４】

【課題を解決するための手段】上記の課題を解決するた
めの本発明の特徴は、ユーザが複雑な問題解決を要求す
る発話を行った場合に、対話システムがユーザの発話を
どのような部分的な問題の組み合わせとして認識し、か
つ発話に対する解がどのように得られたのか、に関する
情報を含む、簡潔な応答文を生成する点にある。この応
答文は、問い合わせ文に対する全体的な解を得るため
に、それぞれの解を得る必要のある部分問題の表現と、
この部分問題に対する部分的な解の表現とを対応付けて
生成される。

【００３５】かかる機能を実現するための、本発明の第
１の特徴は、自然言語の対話により、与えられた問い合
わせ文に対する解を含む応答文を生成する応答生成装置
であって、前記解を導出するために１つ以上の解決すべ
き部分問題がある場合に、導出された前記解とともに、
前記部分問題のそれぞれに対応する問い合わせ文の要素
である部分問題表現と、前記部分問題のそれぞれへの解
の表現である部分解表現とを対とする部分問題表現対を
含む応答文を生成する応答文生成部を具備することを特
徴とする応答生成装置を提供する点にある。

【００３６】上記構成によれば、ユーザの問い合わせ文
の発話が正しく認識され、かつ正しいプロセスで解が導
出されたか否かを、ユーザに実時間内で容易に把握させ
ることのできる簡潔な応答文を生成することができる。

【００３７】また、本発明の第２の特徴は、上記応答生
成装置は、さらに、各文型に対応し、前記部分問題ごと
に解スロットを定義する応答文のテンプレートを記憶す
る応答文テンプレート記憶部を具備し、前記応答文生成
部は、前記部分問題表現対を、対応する前記解スロット
にバインドする点にある。

【００３８】上記構成によれば、簡易な構成で、上記の
簡潔な応答文を生成することができる。

【００３９】また、本発明の第３の特徴は、上記応答生
成装置は、さらに、前記生成された応答文に関して、前
記部分問題表現対中の前記部分問題表現と、対応する前
記部分解表現との同一性を判定する同一性判定部を具備
し、前記応答文生成部は、前記同一性が判定された部分
問題表現対から、前記部分問題表現または前記部分解表
現のいずれか一方を選択する点にある。

【００４０】上記構成によれば、意味的な冗長性を応答
文から排除して、ユーザに苦痛を与えない自然かつ簡潔
な応答文を生成することができる。

【００４１】また、本発明の第４の特徴は、上記応答生
成装置は、さらに、各発話表現と、該発話表現が示す概
念の抽象度との関係を規定する概念階層を記憶する概念
階層記憶部を具備し、前記同一性判定部は、前記概念階
層に基づいて、前記部分問題表現と、対応する前記部分
解表現との同一性を判定する点にある。

【００４２】また、本発明の第５の特徴は、前記同一性
判定部は、前記部分問題表現と、対応する前記部分解表
現との発話表現上の差異に基づいて、前記同一性を判定
する点にある。

【００４３】上記構成によれば、表層的な表現に着目し
て同一性を判定するので、より簡易な構成で、応答文か
ら冗長性を排除することができる。

【００４４】また、本発明の第６の特徴は、上記応答生
成装置は、さらに、前記生成された応答文の長さが所定
の第１の閾値を越えるか否かを判定する第１の判定部を
具備し、前記応答文生成部は、前記応答文の長さが所定
の閾値を超える場合に、部分問題表現対から、前記部分
解表現を選択する点にある。

【００４５】上記構成によれば、応答文の長さを適宜調
節することができる。

【００４６】また、本発明の第７の特徴は、上記応答生
成装置は、さらに、各部分問題表現対の長さが所定の第
２の閾値を越えるか否かを判定する第２の判定部を具備
し、前記応答文生成部は、前記部分問題表現対の長さが
所定の閾値を越える場合に、前記部分問題表現対から、
前記部分解表現を選択する点にある。

【００４７】上記構成によれば、応答文の長さを適宜調
節することができる。

【００４８】また、本発明の第８の特徴は、自然言語の
対話により、問い合わせ文に対する問題解決を遂行する
対話管理装置であって、問題に対する解を導出するため
に１つ以上の解決すべき部分問題がある場合に、各部分
問題を抽出する意味解析部と、前記部分問題のそれぞれ
に対応する部分解を導出するとともに、該部分解から前
記問い合わせ文に対する解を導出する問題解決部と、導
出された前記解とともに、前記部分問題のそれぞれに対
応する問い合わせ文の要素である部分問題表現と、前記
部分問題のそれぞれへの解の表現である部分解表現とを
対とする部分問題表現対を含む応答文を生成する応答文
生成部を具備することを特徴とする対話管理装置を提供
する点にある。

【００４９】上記構成によれば、ユーザの問い合わせ文
の発話が正しく認識され、かつ正しいプロセスで解が導
出されたか否かを、ユーザに実時間内で容易に把握させ
ることのできる簡潔な応答文を生成することができる。

【００５０】また、本発明の第９の特徴は、自然言語の
対話により、与えられた問い合わせ文に対する解を含む
応答文を生成する応答生成方法であって、前記解を導出
するために１つ以上の解決すべき部分問題がある場合
に、導出された前記解とともに、前記部分問題のそれぞ
れに対応する問い合わせ文の要素である部分問題表現
と、前記部分問題のそれぞれへの解の表現である部分解
表現とを対とする部分問題表現対を含む応答文を生成す
る応答文生成ステップと、前記生成された応答文を出力
制御する出力ステップとを含むことを特徴とする応答生
成方法を提供する点にある。

【００５１】上記構成によれば、ユーザの問い合わせ文
の発話が正しく認識され、かつ正しいプロセスで解が導
出されたか否かを、ユーザに実時間内で容易に把握させ
ることのできる簡潔な応答文を生成することができる。

【００５２】また、本発明の第１０の特徴は、上記応答
生成方法は、さらに、各文型に対応し、前記部分問題ご
とに解スロットを定義する応答文のテンプレートを選択
する応答文テンプレート選択ステップを含み、前記応答
文生成ステップは、前記部分問題表現対を、対応する前
記解スロットにバインドする点にある。

【００５３】また、本発明の第１１の特徴は、上記応答
生成方法は、さらに、前記生成された応答文に関して、
前記部分問題表現対中の前記部分問題表現と、対応する
前記部分解表現との同一性を判定する同一性判定ステッ
プを含み、前記応答文生成ステップは、前記同一性が判
定された部分問題表現対から、前記部分問題表現または
前記部分解表現のいずれか一方を選択する点にある。

【００５４】また、本発明の第１２の特徴は、上記応答
生成方法は、さらに、前記生成された応答文または前記
部分問題表現対の長さが所定の閾値を越えるか否かを判
定する判定ステップを含み、前記応答文生成ステップ
は、前記応答文または前記部分問題表現対の長さが所定
の閾値を超える場合に、部分問題表現対から、前記部分
問題表現または前記部分解表現のいずれか一方を選択す
る点にある。

【００５５】また、本発明の第１３の特徴は、自然言語
の対話により、与えられた問い合わせ文に対する解を含
む応答文を生成する応答生成処理をコンピュータに実行
させるプログラムを格納するコンピュータ読みとり可能
な記録媒体であって、前記解を導出するために、１つ以
上の解決すべき部分問題がある場合に、導出された前記
解とともに、前記部分問題のそれぞれに対応する問い合
わせ文の要素である部分問題表現と、前記部分問題のそ
れぞれへの解の表現である部分解表現とを対とする部分
問題表現対を含む応答文を生成する応答文生成処理を含
むことを特徴とするコンピュータ読みとり可能な記録媒
体を提供する点にある。

【００５６】上記構成によれば、ユーザの問い合わせ文
の発話が正しく認識され、かつ正しいプロセスで解が導
出されたか否かを、ユーザに実時間内で容易に把握させ
ることのできる簡潔な応答文を生成することができる。

【００５７】また、本発明の第１４の特徴は、上記コン
ピュータ可能な記録媒体は、さらに、各文型に対応し、
前記部分問題ごとに解スロットを定義する応答文のテン
プレートを選択する応答文テンプレート選択処理を含
み、前記応答文生成処理は、前記部分問題表現対を、対
応する前記解スロットにバインドする点にある。

【００５８】また、本発明の第１５の特徴は、上記コン
ピュータ読みとり可能な記録媒体は、さらに、前記生成
された応答文に関して、前記部分問題表現対中の前記部
分問題表現と、対応する前記部分解表現との同一性を判
定する同一性判定処理を含み、前記応答文生成処理は、
前記同一性が判定された部分問題表現対から、前記部分
問題表現または前記部分解表現のいずれか一方を選択す
る点にある。

【００５９】また、本発明の第１６の特徴は、上記コン
ピュータ読みとり可能な記録媒体は、さらに、前記生成
された応答文または前記部分問題表現対の長さが所定の
閾値を越えるか否かを判定する判定処理を含み、前記応
答文生成処理は、前記応答文または前記部分問題表現対
の長さが所定の閾値を超える場合に、部分問題表現対か
ら、前記部分問題表現または前記部分解表現のいずれか
一方を選択する点にある。

【００６０】

【発明の実施の形態】第１の実施形態以下、図１から図５を参照して本発明に係る応答生成装
置、対話管理装置、応答生成方法および応答生成プログ
ラムを格納するコンピュータ読み取り可能な記録媒体の
第１の実施形態を詳細に説明する。第１の実施形態は、
複雑な問題解決を要求する問い合わせ文に対して、問い
合わせ文中から部分問題を抽出し、この部分問題の発話
表現と、この部分問題に対する部分解の発話表現とを含
む応答文を生成する機能を提供する。

【００６１】尚、以下の実施形態においては、自動車を
目的地まで誘導するカーナビゲーション・システム（以
下、単にカーナビと略称する）を用いる具体例で説明を
行うが、本発明の実施形態の適用対象はカーナビに限定
されない。以下の実施形態は、自然言語を用いた対話シ
ステム一般に適用することができる。

【００６２】図１は、本発明の第１の実施形態に係る応
答生成装置を含む対話処理システムの構成を示すブロッ
ク図である。第１の実施形態は、音声入力部１１０と、
音声認識部１２０と、構文解析部１３０と、意味解析部
１０２と、問題解決部１０４と、応答生成部１０６とか
ら構成される。

【００６３】音声入力部１１０は、各種マイクなどによ
り実現され、ユーザからの発話を音声信号に変換し、こ
の音声信号を音声認識部１２０に送出する。

【００６４】音声認識部１２０は、音声信号を処理し、
音声信号中の音声区間を検出する。次に、音声認識部１
２０は、認識語彙辞書（図示せず）を参照して、検出さ
れた音声区間中に存在するキーワードを検出する。この
キーワード検出には、例えばキーワードスポッティング
などの一般に知られる手法を用いることができる。音声
認識部１２０は、検出されたキーワードから、単語のグ
ラフである単語ラティスを生成する。具体的には、この
単語ラティスは、このキーワードの各候補であるノード
と、これらのノードの間の接続関係であるリンクとから
構成される。音声認識部１２０は、これらの生成された
単語ラティスを構文解析部１３０へ送出する。

【００６５】構文解析部１３０は、入力された単語ラテ
ィスから、文として受理可能な単語の系列を文として抽
出することにより構文を解析する。尚、この構文解析の
手法には、一般に知られる手法を適用することができ
る。構文解析部１３０は、抽出された受理可能な単語の
系列である文の集合を意味解析部１０２に送出する。

【００６６】意味解析部１０２は、意図表現辞書１４０
などを参照することにより、入力された文の発話表現か
ら発話者の意図を抽出する。意図表現辞書１４０は、各
文型ごとに、ユーザの発話表現のどの部分をどのように
加工して意図表現述語のスロットにバインドするかを記
述する意図表現のデータを記憶する。意味解析部１０２
は、抽出された意図表現を、問題解決部１０４が解釈可
能なデータ構造である意図表現に変換し、この変換され
た意図表現を問題解決部１０４に送出する。尚、意図表
現は、どのようなデータ構造でもよいが、第１の実施形
態では、後述するように述語表現を採用する例で説明す
る。また、意図表現辞書１４０は、意味解析部１０２に
組み込まれて構成されてもよい。意味解析部１０２は、
入力された文が、１または複数の部分問題を含む場合に
は、意図表現辞書１４０に基づいて、各部分問題を抽出
する。

【００６７】問題解決部１０４は、問題解決手順定義１
５０を参照して、入力された意図表現を処理することに
より、ユーザが意図した問題解決を実行する。この際、
入力された意図表現が１または複数の部分問題を含む場
合には、各部分問題ごとの解を導出する。問題解決手順
定義１５０は、この問題解決のための手順を記憶する。
問題解決部１０４は、この問題解決結果を応答生成部１
０６に送出する。

【００６８】応答生成部１０６は、応答文テンプレート
１６０を参照して、入力された問題解決結果をユーザへ
の回答とする応答文を生成する。応答文テンプレート１
６０は、第１の実施形態に係る応答文を生成するための
テンプレートを記憶する。生成された応答文は、音声な
どにより出力される。応答生成部１０６は、１または複
数の部分問題を含む場合には、各部分問題ごとに部分問
題の発話表現とこの部分問題の解の発話表現とを、応答
文中にバインドする。

【００６９】次に、第１の実施形態のハードウエア構成
を説明する。

【００７０】第１の実施形態に係る応答生成装置および
対話管理装置は、各種ハードウエアに実装されてもよ
く、また第１の実施形態の処理を実現するプログラムを
作成することにより、ソフトウエアに実装されてもよ
い。

【００７１】第１の実施形態のハードウエア部分は、Ｃ
ＰＵと、主記憶部と、入力部と、出力部と、大容量外部
記憶装置と、ドライブ装置と、通信部とにより構成され
る。これらの各装置は、バスを解して相互に接続され
る。

【００７２】尚、図１に示す各部は、それぞれの処理手
順を記述したプログラムにより構成されてもよい。これ
らの処理手順を記述したプログラムは、上記のハードウ
エアを具備するコンピュータシステムを制御するための
プログラムとして主記憶部に格納され、ＣＰＵによりプ
ログラムに記述された手順に従って実行されことによ
り、第１の実施形態の機能を実現する。

【００７３】また、これらのプログラムは、コンピュー
タ読み取り可能な記録媒体に記録することができる。こ
の記録媒体を、ドライブ装置を用いて読み出すことによ
り、これらのプログラムが主記憶部に格納される。ある
いは、予めドライブ装置等にインストールしておき、実
行時にどう装置から主記憶部に格納してもよい。ここ
で、記録媒体とは、例えば、半導体メモリ・磁気ディス
ク（フロッピーディスク・ハードディスク）・光ディス
ク（ＣＤ−ＲＯＭ・ＤＶＤ）等、プログラムを記録する
ことができる装置全般を含む。

【００７４】次に、第１の実施形態における問題解決の
処理手順を説明する。図２は、第１の実施形態における
ユーザの発話による問い合わせ文に基づく問題解決およ
び応答文生成処理の処理手順を示すフローチャートであ
る。

【００７５】一般に、１つの単語ラティスから複数の文
候補が発生する。このため、音声対話システムは、図２
に示すアルゴリズムのように、複数の文候補を全て処理
するまで手順を繰り返す。尚、図２では、「Howmuch1」
という識別子を持つ文型を例として説明しており、この
文型以外の処理については表記を省略している。この
「Howmuch1」の文型に属する問い合わせ文の例として
は、例えば、高速道路を走行中のユーザが、カーナビに
対して発話する「現在地から出口までどれくらい？」と
いう問い合わせ文がある。この問い合わせ文は、２地点
間の距離と所要時間とについての問題解決を要求する文
である。また、図２のアルゴリズムは、単語ラティスの
１処理例である。この例の他、例えばスコアが最高のも
の１つだけでなく複数の解決済み文について回答文を生
成する処理を行なってもよい。

【００７６】まず、１つのユーザ発話に対応して、Ｓ２
０以下の問題解決処理で用いる入力文の候補集合を初期
化する（ステップＳ１０）。次に、入力文候補集合が空
であるか否かが判定される（ステップＳ２０）。入力文
候補集合が空であれば（ステップＳ２０Ｙ）、ステップ
Ｓ１３０に進む。一方、入力文候補集合が空でなければ
（ステップＳ２０Ｎ）、入力文候補集合から１つの文が
取り出される（ステップＳ３０）。この１つの文から、
ユーザ発話に対応するユーザ意図表現が生成される（ス
テップＳ４０）。このユーザ意図表現に対応する入力文
型が判定される（ステップＳ５０）。図２では、「Howm
uch1」の識別子を持つ文型の場合に、ステップＳ７０に
進み、他の文型であればその文型に対応する解の生成処
理に進む（ステップＳ６０）。「Howmuch1」の識別子を
持つ文型の場合、上記の問い合わせ文に対応するユーザ
の意図表現から部分問題が抽出される（ステップＳ７
０）。上記の問い合わせ文には、「計測始点」がどこ
か、と「計測終点」がどこか、の２つの部分問題が抽出
される。次に、第１の部分問題である「計測始点」が、
「計測始点」の場所述語表現を用いて解決される（ステ
ップＳ８０）。第２の部分問題である「計測終点」が、
「計測終点」の場所述語表現を用いて解決される（ステ
ップＳ９０）。これら２つの部分問題の解から、上記の
問い合わせ文に対する解が導出される。具体的には、
「計測始点」と「計測終点」の解から２地点間の距離と
所要時間が解決される（ステップＳ１００）。次に、ス
テップＳ１００で得られた解決結果に音響的観点、意味
的観点からスコアが与えられ、このスコアが解決済み文
リストに蓄積される（ステップＳ１１０）。ステップＳ
４０からステップＳ１１０までの処理が終わった文は、
入力文候補集合から削除され、次の１文が選択される
（ステップＳ１２０）。入力文候補集合がすべて処理さ
れると、解決済み文リストからスコアが最高の文が取り
出される（ステップＳ１３０）。次に、この最高スコア
を持つ文に基づいて、応答文が生成される（ステップＳ
１４０）。具体的には、解決結果の表現述語の各スロッ
ト値と、文型ごとに定義された応答文生成テンプレート
を対応づけることにより、応答文を生成する。最後に、
１回のユーザ発話に対応して、１つの応答文が出力され
る（ステップＳ１５０）。

【００７７】システムに対するユーザの発話は、システ
ムに対して問題解決を要求するものである。例えば、カ
ーナビシステムに対する「出口はどこ」という発話は、
カーナビシステムに「出口」と呼べる場所を検索するこ
とを要求する。この問題解決には、単純なものだけでな
く、複数の部分的な部分問題を解決することで初めて問
い合わせに対する解を得ることができる複雑な処理を要
求するものも含まれる。図２の例では、文型Howmuch1に
属する発話「現在地から出口までどれくらい」は、ステ
ップＳ８０の計測始点を表す場所の解決と、ステップＳ
９０の計測終点を表す場所の解決の２つの地点問題解決
を要求する。第１の実施形態では、入力された問い合わ
せ文に対する解を導出する前提として、解決することが
必要となる問題を、部分問題と称する。

【００７８】第１の実施形態に係る応答生成部１０６
は、ユーザ発話文が複数の副問題から構成されている場
合に、ユーザ発話中の部分問題に相当する部分を含むよ
うな応答文を生成する。具体的には、応答生成部１０６
は、図２のステップＳ１４０において、入力文全体が表
す問題の解決においてその部分問題を解決する場合に
は、少なくとも入力文全体についての解決結果と、入力
文中の部分問題のそれぞれに対応する部分入力文と、そ
れぞれの部分入力文に対応する部分解決結果とを含めた
応答文を生成する。ユーザは、システムから出力される
この応答文を聞くことにより、自身の発話がシステムに
よってどのような部分問題に分割され、それぞれの部分
問題が解決されたかを把握することができる。

【００７９】次に、第１の実施形態に係る問題解決処理
の詳細を、図３、図４および図５を参照して具体的に説
明する。ここでは、入力文候補集合の１つが上記の問い
合わせ文（１）「現在地から出口までどれくらい」（１）であった場合を例として説明する。

【００８０】まず、図１に示す構文解析部１３０および
意味解析部１０２は、入力された発話文を、問題解決部
１０４が処理可能なデータ構造である意図表現に変換す
る。図３は、入力発話文の意図表現への変換過程を示
す。図３の１行目から１１行目までは、問題解決部１０
４が問題解決時に参照するユーザ意図表現の構造を示
す。尚、「／＊」と「＊／」で囲まれた部分はコメ
ントであって、問題解決部１０４の処理とは関係しな
い。また、図３のデータ構造は、一例であって、第１の
実施形態を適用するシステム毎に異なって構成されてよ
い。

【００８１】意味解析部１０２は、意図表現辞書１４０
を参照することによって意図表現を初期化する。上記の
発話「現在地から出口までどれくらい」の場合、ユーザ
意図表現は図３の１４行目から１７行目に記載の述語表
現に初期化される。具体的にはまず、構文解析部１０３
によってユーザ発話表現が「HowMuch1」の文型であるこ
とが導出され、意図表現のスロットであるSentenceType
の値が「HowMuch1」に初期化される。意味解析部１０２
は、このSentenceTypeの値をキーとして、意図表現辞書
１４０を探索する。この探索結果から、ユーザの意図
が、「現在地」から「出口」と呼ばれる地点までの２地
点の間の距離を測定することであることが導出される。
この距離の測定をするために、まず「現在地」や「出
口」と呼ばれる地点が現在のユーザの状況に対してどこ
であるのかをそれぞれ導出する。これらを導出した上で
２地点間の距離を計算する必要がある。そこで、意味解
析部１０２は、ユーザの発話中の「現在地」と「出口」
を、それぞれ問題解決部１０４が処理可能な形式に加工
し、スロットStartPosPredとDestPosPredにそれぞれバ
インドする。すなわち、それぞれを部分問題として抽出
する。最後に、文のスコアを初期化する。この文のスコ
アは、音響的観点と意味的観点から加工されて最終的に
決定されるが、意味解析部１０２が受け取るのは音響的
観点からのスコアのみである。図３では、このスコアの
値が１０００であることを示している。尚、第１の実施
形態において、述語中の”−”は、そのスロットが値を
持たないことを示す。以上の意図表現生成の手順は、図
２のフローチャート中、ステップＳ４０、Ｓ５０、Ｓ７
０に相当する。

【００８２】次に、図３の１４行目から１７行目までに
示す意図表現は、２０行目から２３行目に示す述語に変
換される。すなわち、「現在地」と「出口」がユーザの
状況に合わせて解決される。（図２のステップＳ８０，
Ｓ９０）。さらに、２地点間の距離が算出され（ステッ
プＳ１００）、スコアも修正される（ステップＳ１１
０）。解を含む最終的な意図表現は、図３の２６行目か
ら２９行目に記載の内容となる。

【００８３】全ての文候補に対して上記の問題解決が実
行されると（ステップＳ２０Ｙ）、問題解決済み文のリ
ストからスコアが最高のものが選ばれる（ステップＳ１
３０）。この選択された文に対する解決結果をユーザに
提示するための応答文が生成される（ステップＳ１４
０）。第１の実施形態では、「現在地から出口までどれ
くらい」が発話候補文中で最高のスコアを持ったもので
あった場合を例として説明する。

【００８４】次に、図２のステップＳ１４０における応
答文生成処理の詳細を説明する。図４は、第１の実施形
態に係る応答生成部１０６が行う応答文生成処理の詳細
を示すフローチャートである。図５は、図３の意図表現
を、図４のアルゴリズムに従って処理して得られる応答
文の生成過程を示す。

【００８５】上述したように、応答文の生成対象である
文候補の意図表現は、図３の１３行目から１６行目に示
す内容である。この意図表現では文型識別子が「How Mu
ch1」であることから、応答文生成用のテンプレートと
して図５の１行目から１１行目に示すものが選択され
る。尚、この応答文テンプレート１６０は、適当なデー
タベースにあらかじめ保存しておくのが望ましいが、動
的に生成するプログラムコードとして実現されてもよ
い。

【００８６】まず、「How Much1」の文型に適合する応
答文テンプレートが選択される（ステップＳ１４１）。
このテンプレートに基づいて、候補文中のすべての部分
問題（この場合は場所表現）について、発話表現対が生
成される（ステップＳ１４２）。ユーザ発話「現在地か
ら出口までどれくらい」には、２つの場所表現がある。
これらでそれぞれの場所表現について、それぞれ発話表
現対が生成される。尚、発話表現対とは、３つ組のデー
タ構造であり、ユーザが発話時に使用した表現であるユ
ーザ発話表現と、ユーザ発話表現に基づいてシステムが
問題解決を実行した結果の表現である解発話表現と、シ
ステムが応答文で用いる表現をバインドするスロットの
名称である解スロット名称とからなる。すなわち、この
発話表現対の一般形は、次のように表記される。

【００８７】（ユーザ発話表現、解発話表現、解スロッ
ト名称）これら、複数の発話表現対は、リスト状に加工される
（ステップＳ１４３）。図５の１８行目に、生成される
発話表現対リストを示す。例えば、「現在地」というユ
ーザの発話表現について、その解決結果の表現が「吹田
サービスエリア付近」であり、これらの発話表現から生
成される応答文としての表現がスロットStartExpにバイ
ンドされている。この「現在地」の発話表現は、以下の
ように表現される。

【００８８】（現在地、吹田ＳＡ付近、StartExp）同様に、「出口」の発話表現対は、以下のように表現さ
れる。

【００８９】（出口、摩耶出口、DestExp）図５の１８行目は、これら２つの発話表現対をリストに
したものを示す。

【００９０】次に、応答生成部１０６は、この発話表現
対リストを参照して、応答文生成テンプレートの解スロ
ットを埋める（ステップＳ１４４〜Ｓ１４６）。応答文
テンプレートの解スロットにStartExpには、［ユーザ発
話表現、”である”、解発話表現］の表現がバインドさ
れる（ステップＳ１４５）。

【００９１】具体的には、まず発話表現対リストの先頭
要素である、（現在地、吹田ＳＡ付近、StartExp）が参照される。この発話表現対においては、ユーザ発話
表現＝現在地、解発話表現＝吹田ＳＡ付近となる。この
ため、応答文生成テンプレートの解スロットであるStar
tExpには値「現在地である吹田ＳＡ付近」がバインドさ
れる。

【００９２】同様に、「出口」の発話表現対、（出口、摩耶出口、DestExp）が参照され、応答文生成テンプレートの解スロットであ
るDestExpには値「出口である摩耶出口」がバインドさ
れる。処理された発話表現対は、発話表現対リストから
削除される（ステップＳ１４６）。

【００９３】ステップＳ１４５の処理を、発話表現対リ
ストが空になるまで繰り返し行う（ステップＳ１４
４）。

【００９４】図５の２１行目から３１行目は、上記の処
理により初期化された応答文テンプレートの内容を示
す。応答生成部１０６は、この初期化された応答文生成
テンプレートを参照して、出力すべき応答文を生成する
（図２のステップＳ１４０）。図５の図６の３３行目か
ら３４行目に、最終的にユーザに出力される応答文
（１）を示す。

【００９５】「現在地である吹田ＳＡ付近から出口である摩耶出口までの距離は２５キロメートル、所要時間はおよび１９分です。」（１）この応答文（１）は、ユーザの発話表現と、各部分問題
に対する解表現と、問い合わせに対する全体の解表現と
を含む。

【００９６】このため、ユーザは、システムから音声の
形で提供されるこの１文の応答文を聞くだけで、・ユーザ自身の意図した発話が、正しくシステムに認識
されたこと、・システムが現在地、および、出口という２つの表現に
対して問題解決を行なったこと、また、その結果・２つの地点間の距離と所要時間がどの程度であるか、
の３点を容易に確認することができる。また、応答文
（１）を確認することで、システムが意図しなかった問
題解決を実行してしまった場合にもこの誤りを確認でき
る。例えば、ユーザが「出口」という表現を用いたこと
に対して、上記では、「現在走行中の有料道路の終点」
と解釈して問題解決を行なった。しかし、本来のユーザ
の意図は「次に高速道路から出ることができるインタ
ー」であったかもしれない。ユーザは、上記の応答文１
を聞くことによってシステムが「出口」という表現に対
してどのような問題解決を行なうかを推論することがで
きる。このように、ユーザは、問題解決に誤りがあった
場合にも、自身の発話文がシステムにとって曖昧であっ
たことを認識し、条件を付加した発話表現「現在地から
次の出口までどれくらい」などを再度発話することによ
って、本来意図する回答をシステムから得ることができ
る。

【００９７】第１の実施形態によれば、以下の効果が得
られる。

【００９８】すなわち、応答文生成部１０６は、応答文
テンプレート１６０の定義に基づいて、問い合わせに対
する解を導出するために必要となる部分問題に関する発
話表現対を、応答文にバインドする。このため、ユーザ
は、１つの応答文を聞くだけで、ユーザの発話がシステ
ムに正しく認識され、かつ正しいプロセスで解が導出さ
れたことを、実時間内で確認、検証することができる。
尚、第１の実施形態は、応答文テンプレート１６０を付
加しただけの非常に簡易な構成で実現可能であり、対話
システムに大きな計算能力を要求しない。

【００９９】第２の実施形態以下、図６から図９を参照して、本発明の第２の実施形
態に係る応答生成装置、対話管理装置、応答生成方法お
よび応答生成プログラムを格納するコンピュータ読み取
り可能な記録媒体を詳細に説明する。第２の実施形態
は、ユーザに対する応答文から意味的な冗長性を排除す
る機能を提供するものである。

【０１００】図６は、本発明の第２の実施形態に係る応
答生成装置を含む対話処理システムの構成を示すブロッ
ク図である。第２の実施形態は、図１の第１の実施形態
の構成に、さらに図６の同一性検証部１０８を具備する
点において、第２の実施形態の修正である。第２の実施
形態の音声入力部１１０，音声認識部１２０，構文解析
部１３０，意味解析部１０２，問題解決部１０４の構成
は、第１の実施形態と同様である。

【０１０１】第１の実施形態は、簡易な構成で応答文を
生成することができる。しかし、場合によっては同じ意
味の表現を繰り返す冗長な応答文を生成してしまうた
め、応答文を聞くユーザに苦痛を与える場合がある。第
２の実施形態は、第１の実施形態が生成する応答文か
ら、意味的な冗長性を排除してユーザの苦痛を取り除
く。

【０１０２】第２の実施形態に係る同一性検証部１０８
は、ユーザの発話表現とその発話表現に基づく問題解決
結果を最終的に応答文にバインドする前に、ユーザの発
話表現とその発話表現に対する解との間の意味的な同一
性を検証し、検証結果を応答文生成部１０６に受け渡
す。第２の実施形態に係る応答文生成部１０６は、この
同一性検証結果に基づいて、意味的な同一性があると判
定された部分を冗長な部分と判断し、生成された応答文
中でこの冗長な部分を提示しない。

【０１０３】具体的には、問題解決部１０４が、入力文
全体が表す問題の解決においてその部分問題を解決する
場合に、同一性検証部１０８は、少なくとも入力文全体
についての解決結果とあらかじめ定義された概念階層知
識に基づいて比較した場合に、ユーザ発話の部分入力文
が表現する概念と、その部分入力文表現に対応する部分
的解決結果（解）に対応する概念とが属する概念階層の
差異に応じて、その意味的同一性の有無を判定する。応
答文生成部１０６は、意味的同一性があると判定れた発
話表現対に関して、ユーザ発話の部分入力文を非提示と
する応答文に変換する。すなわち、変換後の応答文は、
少なくとも入力文全体についての解決結果と、提示する
と判定された部分入力文と、全ての部分入力文について
の部分的解決結果とが含まれることとなる。

【０１０４】次に、第２の実施形態に係る応答生成部１
０６及び同一性検証部１０８が行う応答文生成処理の手
順を説明する。図７は、第２の実施形態に係る応答生成
処理の詳細の処理手順を示すフローチャートである。こ
こでは、ユーザ発話表現が、「現在地から摩耶出口までどれくらい」（２）であった場合を例として説明する。尚、音声入力から意
図表現の生成までのアルゴリズムは、図２のステップＳ
１０〜Ｓ１３０に従う。このユーザ発話文（２）も、第
１の実施形態と同様に「HowMuch1」に属する。

【０１０５】図８の１３行目から１６行目に、発話文
（２）を、図２のアルゴリズムに従ってユーザ発話文中
に含まれる問題解決も実行した結果得られる意図表現を
示す。

【０１０６】第１の実施形態がこの意図表現を、図４の
応答文生成処理のアルゴリズムにしたがって生成する応
答文は、以下の表現となる。

【０１０７】「現在地である吹田ＳＡ付近から摩耶出口である摩耶出口までの距離は２５キロメートル、所要時間はおよそ１９分です」（２−１）このように、摩耶出口という表現が重複して応答文が無
駄に長くなってしまう。第２の実施形態は、図７のア
ルゴリズムを用いてユーザ発話の抽象度と解表現の抽象
度とを比較することにより、この冗長性を解消する。

【０１０８】図４との差は、ステップＳ１４０５からＳ
１４０９によって応答用の表現を生成する際にユーザ発
話の抽象度と回答表現の抽象度を比較し、生成する応答
表現を変更することである。

【０１０９】ステップＳ１４０１〜ステップＳ１４０４
までの処理は、図４に示す第１の実施形態の処理と同様
である。

【０１１０】図８の１３行目から１６行目に示す意図表
現に対して、ユーザ発話「現在地」と「摩耶出口」に対
する発話表現対リストが図８の１８行目に示す通りに生
成される（ステップＳ１４０１〜ステップＳ１４０
３）。次に、発話表現対リストの先頭要素が発話表現対
Ｔｐにコピーされる（ステップＳ１４０５）。ここで、Ｔｐ＝（現在地、吹田ＳＡ付近、StartExp）となる。尚、Ｔｐとは、発話表現対を一時的に保持する
変数を表す。この発話表現対Ｔｐに関して、概念階層知
識１１１が参照され、ユーザ発話表現の抽象レベルが算
出される（ステップＳ１４０６）。

【０１１１】図９は、概念階層知識の一例を示す。概念
階層知識は少なくとも、対話時に用いられる発話表現
と、発話表現とその発話表現が表す概念とを結び付けた
ノードと、ノード同士の階層関係を含む。例えば、ユー
ザ発話表現である「現在地」は、概念「現在地」と結び
つけられ、その抽象度が２であることが導出される。

【０１１２】次に、ユーザの発話表現に対して行なった
問題解決結果（解）の表現について、概念階層知識１１
１を参照して、同様に抽象レベルが算出される（ステッ
プＳ１４０７）。図９に示すように、「吹田ＳＡ付近」
の抽象度は３と算出される。ステップＳ１４０６および
Ｓ１４０７で得られた２つの表現の抽象レベルが比較さ
れる（ステップＳ１４０８）。この比較の結果、表現
「現在地」と「吹田ＳＡ付近」はその抽象レベルが違う
ため（ステップＳ１４０８Ｎ）、解スロットStartExp
に、「現在地である吹田ＳＡ付近」がバインドされる。

【０１１３】発話表現リストの次の先頭要素が取り出さ
れ（ステップＳ１４１１，Ｓ１４０４）、Ｔｐ＝（摩耶出口、摩耶出口、DestExp）と設定される（ステップＳ１４０５）。

【０１１４】ここで、ユーザ発話表現と問題解決結果の
表現について、概念階層知識１１１を参照してそれぞれ
抽象度が算出される。ここでユーザ発話表現と解表現と
の抽象度レベルは、ともに抽象度は３で等しいため（ス
テップＳ１４０８Ｙ）、解スロットであるDestExpには
発話表現「摩耶出口」のみがバインドされる（ステップ
Ｓ１４０９）。

【０１１５】図８の２１行目から３１行目までに、以上
の処理で生成される応答文生成テンプレートの表現を示
す。応答生成部１０６は、このテンプレートを参照し
て、図８の３３行目から３４行目の通り、「現在地である吹田ＳＡ付近から摩耶出口までの距離は２５キロメートル、所要時間はおよそ１９分です」（２−２）との応答文（２−２）を生成する。

【０１１６】上記の応答文（２−１）と比較して、「摩
耶出口」という表現を冗長に繰り返す説明文ではなくな
っている。

【０１１７】第２の実施形態によれば、さらに以下の効
果が得られる。

【０１１８】すなわち、同一性検証部１０８は、生成さ
れた応答文から、互いに意味的な同一性を持つ発話表現
を、概念階層知識１１１を用いて抽出する。応答生成部
１０６は、この同一性を持つ発話表現を含む応答文を、
冗長性を排除した応答文に変換する。このため、ユーザ
に苦痛を与えることのない、自然な表現の応答文を出力
することができる。

【０１１９】あるいは、第２の実施形態の変形例とし
て、発話表現の意味的同一性を、表層的表現の差異に基
づいて判定してもよい。

【０１２０】意味的に同じ表現の多くは、その表層的表
現同士も同一である。第２の実施形態の変形例は、この
点に着目し、意味的に同じ表現の多くを、第２の実施形
態よりも簡易な構成で排除する。

【０１２１】具体的には、第２の実施形態の変形例に係
る図６の同一性検証部１０８は、入力文中の部分問題に
対応する部分入力文と、この部分入力文に対応する部分
解の表層表現の差異に応じて、両者の同一性を判定す
る。

【０１２２】第２の実施形態の変形例においては、図７
の応答文生成処理において、ステップＳ１４０７および
Ｓ１４０８が削除され、ステップＳ１４０８では、単に
発話表現と問題解決結果の解表現との表現の同一性が文
字列比較により判定される。ステップＳ１４０９以降の
処理は、上記の第２の実施形態と同様である。

【０１２３】第２の実施形態では、概念階層知識１１１
に、あらかじめ概念と表現との結びつきおよびこれらの
間の関係を定義し、応答生成部１０６は、この概念階層
知識１１１を参照して意味的同一性を判定する必要があ
る。一方、第２の実施形態の変形例によれば、概念など
の定義と構築に関するコスト、および参照処理の負荷が
不要となる。意味的に同一であるが表現が異なる発話表
現を排除することはできないが、表層的な表現上で冗長
な発話表現を完全に排除することができる。このため、
第２の実施形態に近い機能が、より低コストで実現でき
る。

【０１２４】第３の実施形態以下、図１０から図１２を参照して、本発明の第３の実
施形態に係る応答生成装置、対話管理装置、応答生成方
法および応答生成プログラムを格納するコンピュータ読
み取り可能な記録媒体を詳細に説明する。第３の実施形
態は、ユーザに出力される応答文の長さを調節する機能
を提供するものである。

【０１２５】図１０は、本発明の第３の実施形態に係る
対話処理システムの構成を示すブロック図である。第２
の実施形態は、図１の第１の実施形態の構成に、さらに
図１０の応答文長判定部１１０を具備する点において、
第１の実施形態の修正である。第２の実施形態の音声入
力部１１０，音声認識部１２０，構文解析部１３０，意
味解析部１０２，問題解決部１０４の構成は、第１およ
び第２の実施形態と同様である。

【０１２６】応答文生成部１０６により生成された応答
文から、第２の実施形態によって冗長な表現を排除して
も、なお対話システム全体が要求する実時間性を満たさ
ない場合がある。例えば、カーナビなど実時間性が高く
要求される音声対話システムでは、長すぎる応答文はユ
ーザの注意を奪い、安全運転を妨げることにもなりかね
ない。

【０１２７】第３の実施形態に係る応答文長判定部１０
９は、短い応答文を生成するために、最終的にユーザに
対して出力する応答文の長さあるいは個々のユーザ発話
の部分入力文の長さとの関係に応じて、応答文の長さを
調節するため、発話表現対の一部を非提示とするか否か
を判定する。

【０１２８】次に、第３の実施形態に係る応答生成部１
０６および応答文長判定部１０９の行う応答文生成処理
の手順を説明する。図１１は、第３の実施形態に係る応
答生成処理の詳細の処理手順を示すフローチャートであ
る。ここでは、ユーザ発話表現が、「現在地から目的地の前の最後のレストランがあるＳＡまでどれくらい？」（３）であった場合を例として説明する。尚、音声入力から意
図表現の生成までのアルゴリズムは、図３のステップＳ
１０〜Ｓ１３０に従う。このユーザ発話文（３）も、第
１の実施形態と同様に「HowMuch1」に属する。

【０１２９】図１２の１３行目から１９行目に、発話文
（３）を、図２のアルゴリズムに従ってユーザ発話文中
に含まれる問題解決も実行した結果得られる意図表現を
示す。

【０１３０】第１の実施形態がこの意図表現を、図４の
応答文生成処理のアルゴリズムにしたがって生成する応
答文は、以下の表現となる。

【０１３１】「現在地である吹田ＳＡ付近から目的地の前の最後のレストランがあるＳＡである吹田ＳＡまでの距離は５キロメートル、所要時間はおよそ３分です」（３−１）このように、生成される応答文（３−１）は、非常に長
いものとなる。例えばカーナビを利用しているユーザに
とって、長過ぎる回答文は必要以上にユーザの気を引い
てしまい、車の運転に対する集中力を奪うことになりか
ねない。一方、長い文によって表現される複雑な質問を
するユーザは、自分が質問した内容を良く理解している
とも考えられる。この考えに基づけば、質問の表現を改
めて逐一応答文に含める必要はない場合もある。

【０１３２】第３の実施形態は、図１１のアルゴリズム
を用いて応答文の長さを調節する。

【０１３３】ステップＳ１４０１〜ステップＳ１４０４
までの処理は、図４に示す第１の実施形態の処理および
図７に示す第２の実施形態の処理と同様である。

【０１３４】図１２の１３行目から１９行目に示す意図
表現に対して、図１２の２１行目および２２行目に示す
通りに生成される（ステップＳ１４０１〜ステップＳ１
４０３）。次に、発話表現対リストの先頭要素が発話表
現対Ｔｐにコピーされる（ステップＳ１４０５）。ここ
で、Ｔｐ＝（現在地、吹田ＳＡ付近、StartExp）となる。

【０１３５】この発話表現対Ｔｐに関して、ユーザ発話
表現の語長が導出される（ステップＳ１４０６ｂ）。こ
こで、語長の定義としては、構成単語数、キーワードの
みの語数など様々なものを用いることができる。第３の
実施形態では、一例として、表現を構成する文字の数と
する。１数字、１漢字、１記号についてもそれぞれの語
長は１と数える。上記のＴｐについてはユーザ発話表現
は、「現在地」であり、その語長は「３」である。

【０１３６】次に、ユーザ発話を解スロットにバインド
した場合の回答文長が求められる（ステップ１４０６
ｃ）。ここで、回答文長の定義としては、やはり様々な
ものを用いることができる。第３の実施形態では、一例
として、出力することが確定している文を構成する文字
の数と定義する。ステップＳ１４０６ｃまでに確定して
いる出力応答文は、「現在地からまでの距離はキロメー
トル、所要時間はおよそ分です」であり、文の長さは
「２９」となる。

【０１３７】得られた応答文長が、所定の閾値と比較さ
れる（ステップＳ１４０８）。この閾値は、任意である
が、第３の実施形態では５０とする。一方、ステップＳ
１４０６ｃで得られた確定している応答文長は、「２
９」であるので（ステップＳ１４０８９Ｎ）、ステップ
Ｓ１４１０に進む。

【０１３８】ここでは、応答表現である「現在地である吹田ＳＡ付近」が解スロットであるStartExpにバインドされる。次に、
発話表現対リストの次の先頭要素が処理対象として選択
される（ステップＳ１４１１，Ｓ１４０４）。ここで、
発話表現対リストの先頭は、（目的地の前の最後のレストランがあるＳＡ、吹田Ｓ
Ａ、DestExp）となる。すなわち、Ｔｐ＝（目的地の前の最後のレストランがあるＳＡ、吹
田ＳＡ、DestExp）となる（ステップＳ１４０５）。ここで、ユーザ発話表
現の語長が、上記の定義に従い算出される（ステップＳ
１４０６ｂ）。確定している発話表現が、「現在地である吹田ＳＡ付近から目的地の前の最後のレ
ストランがあるＳＡまでの距離は５キロメートル、所要
時間はおよそ３分です」であり、その語長は「５９」である。

【０１３９】従って、発話表現を含めた応答文の長さは
閾値「５０」を越えている（ステップＳ１４０８Ｙ）。
このため、Ｔｐの解スロットであるDestExpには値「吹
田ＳＡ」のみがバインドされる。

【０１４０】図１２の２５行目から３５行目までに、上
記の処理によって生成される応答文テンプレートを示
す。この応答文テンプレートを用いて最終的に生成され
る応答文は、図１２の３７行目から３８行目までに示す
ように、「現在地である吹田ＳＡ付近から吹田ＳＡまでの距離は５キロメートル、所要時間はおよそ３分です」（３−２）となる。このように、応答文長判定部１０９は、図１１
のアルゴリズムを用いて必要以上に長い応答文が生成さ
れることを抑制する。尚、図１１のステップＳ１４０６
ｂ、Ｓ１４０６ｃ、Ｓ１４０８において、確定している
全体の応答文長ではなく、個々の発話表現対Ｔｐについ
てそのユーザ発話表現の長さを閾値と比較してもよい。
この発話表現対に関して、長さを調節することによっ
て、ユーザ発話文中の適当な部分問題についてのみ問題
定義を示し、長過ぎる部分問題定義についてはシステム
による解の表現のみを提示する、と言った処理も可能と
なる。さらに、上記の文全体の長さを考慮する方式と、
個々の部分問題についての長さのみを考慮する方式を適
宜組み合わせもよい。

【０１４１】第３の実施形態によれば、以下の効果が得
られる。

【０１４２】すなわち、応答文長判定部１０９は、所定
の閾値に基づいて、応答文の長さを調節する。このた
め、ユーザが長い応答文を聞くことが困難であるよう
な、実時間性の高い対話システムにおいて、応答文の長
さを適宜調節することができる。

【０１４３】尚、上記の３つの実施形態においては、カ
ーナビゲーションシステムを例として説明したが、本発
明はカーナビゲーションシステム特有の問題解決方式に
依存するものではない。従って、自然言語による複雑な
問い合わせを行なう他のシステムに適用することも可能
である。特に、応答内容や、応答生成に要する時間長に
制約があるシステムにおいては、得られる効果が高い。
また、カーナビの場合には運転者は画面を見ることがで
きないため、応答文のみで必要な情報を提示させる方式
を説明したが、他のシステム、例えば駅前での道案内シ
ステムに本発明を適用する場合には、グラフィック表現
などを組み合わせることによってさらに複合的にシステ
ムの効果を高めることも可能である。この他、上記の実
施形態は、本発明の要旨を逸脱しない範囲内で適宜変
更、変形が可能である。

【０１４４】

【発明の効果】以上説明したように、本発明によれば、
以下に記載されるような効果を奏する。

【０１４５】すなわち、本発明に係る応答生成装置、対
話管理装置、応答生成方法および応答生成プログラムを
格納するコンピュータ読み取り可能な記録媒体は、複雑
な問題解決を要求する問い合わせ文に対して、部分問題
要素とこの部分問題要素に対する部分解との発話表現対
を含んだ応答文を生成する機能を提供する。また、生成
された応答文から意味的な冗長性を排除して簡潔な応答
文に変換する機能を提供する。

【０１４６】これにより、ユーザは、問い合わせに対す
るシステムの認識および回答の正確性を、実用的時間内
に容易に確認することが可能となる。

【０１４７】このように、本発明を用いれば、対話にお
ける問題解決が容易かつ迅速に実現され、自然言語を用
いた対話処理システムの可用性が大幅に向上する。

【図面の簡単な説明】

【図１】本発明の第１の実施形態に係る応答生成装置を
含む対話処理システムの構成を示すブロック図である。

【図２】本発明の第１の実施形態に係る応答生成の概略
処理のアルゴリズムを示すフローチャートである。

【図３】発話文から問題解決部に入力される意図表現へ
の変換過程を説明する図である。

【図４】第１の実施形態における図２のステップＳ１４
０での応答文生成処理の詳細のアルゴリズムを示すフロ
ーチャートである。

【図５】第１の実施形態で用いられる応答文テンプレー
トおよび応答文生成の過程の一例を説明する図である。

【図６】本発明の第２の実施形態に係る応答生成装置を
含む対話処理システムの構成を示すブロック図である。

【図７】第２の実施形態における図２のステップＳ１４
０での応答文生成処理の詳細のアルゴリズムを示すフロ
ーチャートである。

【図８】第２の実施形態で用いられる応答文テンプレー
トおよび応答文生成の過程の一例を説明する図である。

【図９】第２の実施形態における概念階層知識の構成を
示す図である。

【図１０】本発明の第３の実施形態に係る応答生成装置
を含む対話処理システムの構成を示すブロック図であ
る。

【図１１】第３の実施形態における図２のステップＳ１
４０での応答文生成処理の詳細のアルゴリズムを示すフ
ローチャートである。

【図１２】第３の実施形態で用いられる応答文テンプレ
ートおよび応答文生成の過程の一例を説明する図であ
る。

【図１３】カーナビゲーションシステムにおける設定経
路とユーザの現在位置との関係を説明する図である。

【符号の説明】

１０２意味解析部１０４問題解決部１０６応答生成部１０８同一性検証部１０９応答文長判定部１１０音声入力部１１１概念階層知識１２０音声認識部１３０構文解析部１４０意図表現辞書１５０問題解決手順定義１６０応答文テンプレート

───────────────────────────────────────────────────── フロントページの続き (72)発明者屋野武秀大阪府大阪市北区大淀中１丁目１番30号株式会社東芝関西支社内Ｆターム(参考） 5B091 AA15 CA05 CA12 CB12 CB24 CC04 CD01 DA06 EA02 5D015 AA01 AA05 LL02 LL06 LL11 9A001 HH03 HH17 JJ77 KK56 KK60

Claims

【特許請求の範囲】

【請求項１】自然言語の対話により、与えられた問い
合わせ文に対する解を含む応答文を生成する応答生成装
置であって、前記解を導出するために１つ以上の解決すべき部分問題
がある場合に、導出された前記解とともに、前記部分問
題のそれぞれに対応する問い合わせ文の要素である部分
問題表現と、前記部分問題のそれぞれへの解の表現であ
る部分解表現とを対とする部分問題表現対を含む応答文
を生成する応答文生成部を具備することを特徴とする応
答生成装置。
【請求項２】上記応答生成装置は、さらに、各文型に対応し、前記部分問題ごとに解スロットを定義
する応答文のテンプレートを記憶する応答文テンプレー
ト記憶部を具備し、前記応答文生成部は、前記部分問題表現対を、対応する
前記解スロットにバインドすることを特徴とする請求項
１に記載の応答生成装置。
【請求項３】上記応答生成装置は、さらに、前記生成された応答文に関して、前記部分問題表現対中
の前記部分問題表現と、対応する前記部分解表現との同
一性を判定する同一性判定部を具備し、前記応答文生成部は、前記同一性が判定された部分問題
表現対から、前記部分問題表現または前記部分解表現の
いずれか一方を選択することを特徴とする請求項１また
は２に記載の応答生成装置。
【請求項４】上記応答生成装置は、さらに、各発話表現と、該発話表現が示す概念の抽象度との関係
を規定する概念階層を記憶する概念階層記憶部を具備
し、前記同一性判定部は、前記概念階層に基づいて、前記部
分問題表現と、対応する前記部分解表現との同一性を判
定することを特徴とする請求項３に記載の応答生成装
置。
【請求項５】前記同一性判定部は、前記部分問題表現と、対応する前記部分解表現との発話
表現上の差異に基づいて、前記同一性を判定することを
特徴とする請求項３または４に記載の応答生成装置。
【請求項６】上記応答生成装置は、さらに、前記生成された応答文の長さが所定の第１の閾値を越え
るか否かを判定する第１の判定部を具備し、前記応答文生成部は、前記応答文の長さが所定の閾値を
超える場合に、部分問題表現対から、前記部分解表現を
選択することを特徴とする請求項１乃至５のいずれか記
載の応答生成装置。
【請求項７】上記応答生成装置は、さらに、各部分問題表現対の長さが所定の第２の閾値を越えるか
否かを判定する第２の判定部を具備し、前記応答文生成部は、前記部分問題表現対の長さが所定
の閾値を越える場合に、前記部分問題表現対から、前記
部分解表現を選択することを特徴とする請求項１乃至５
のいずれか記載の応答生成装置。
【請求項８】自然言語の対話により、問い合わせ文に
対する問題解決を遂行する対話管理装置であって、問題に対する解を導出するために１つ以上の解決すべき
部分問題がある場合に、各部分問題を抽出する意味解析
部と、前記部分問題のそれぞれに対応する部分解を導出すると
ともに、該部分解から前記問い合わせ文に対する解を導
出する問題解決部と、導出された前記解とともに、前記部分問題のそれぞれに
対応する問い合わせ文の要素である部分問題表現と、前
記部分問題のそれぞれへの解の表現である部分解表現と
を対とする部分問題表現対を含む応答文を生成する応答
文生成部を具備することを特徴とする対話管理装置。
【請求項９】自然言語の対話により、与えられた問い
合わせ文に対する解を含む応答文を生成する応答生成方
法であって、前記解を導出するために１つ以上の解決すべき部分問題
がある場合に、導出された前記解とともに、前記部分問
題のそれぞれに対応する問い合わせ文の要素である部分
問題表現と、前記部分問題のそれぞれへの解の表現であ
る部分解表現とを対とする部分問題表現対を含む応答文
を生成する応答文生成ステップと、前記生成された応答文を出力制御する出力ステップとを
含むことを特徴とする応答生成方法。
【請求項１０】上記応答生成方法は、さらに、各文型に対応し、前記部分問題ごとに解スロットを定義
する応答文のテンプレートを選択する応答文テンプレー
ト選択ステップを含み、前記応答文生成ステップは、前記部分問題表現対を、対
応する前記解スロットにバインドすることを特徴とする
請求項９に記載の応答生成方法。
【請求項１１】上記応答生成方法は、さらに、前記生成された応答文に関して、前記部分問題表現対中
の前記部分問題表現と、対応する前記部分解表現との同
一性を判定する同一性判定ステップを含み、前記応答文生成ステップは、前記同一性が判定された部
分問題表現対から、前記部分問題表現または前記部分解
表現のいずれか一方を選択することを特徴とする請求項
９または１０に記載の応答生成方法。
【請求項１２】上記応答生成方法は、さらに、前記生成された応答文または前記部分問題表現対の長さ
が所定の閾値を越えるか否かを判定する判定ステップを
含み、前記応答文生成ステップは、前記応答文または前記部分
問題表現対の長さが所定の閾値を超える場合に、部分問
題表現対から、前記部分問題表現または前記部分解表現
のいずれか一方を選択することを特徴とする請求項９乃
至１１のいずれか記載の応答生成方法。
【請求項１３】自然言語の対話により、与えられた問
い合わせ文に対する解を含む応答文を生成する応答生成
処理をコンピュータに実行させるプログラムを格納する
コンピュータ読みとり可能な記録媒体であって、前記解を導出するために、１つ以上の解決すべき部分問
題がある場合に、導出された前記解とともに、前記部分
問題のそれぞれに対応する問い合わせ文の要素である部
分問題表現と、前記部分問題のそれぞれへの解の表現で
ある部分解表現とを対とする部分問題表現対を含む応答
文を生成する応答文生成処理を含むことを特徴とするコ
ンピュータ読みとり可能な記録媒体。
【請求項１４】上記コンピュータ可能な記録媒体は、
さらに、各文型に対応し、前記部分問題ごとに解スロットを定義
する応答文のテンプレートを選択する応答文テンプレー
ト選択処理を含み、前記応答文生成処理は、前記部分問題表現対を、対応す
る前記解スロットにバインドすることを特徴とする請求
項１３に記載のコンピュータ読みとり可能な記録媒体。
【請求項１５】上記コンピュータ読みとり可能な記録
媒体は、さらに、前記生成された応答文に関して、前記部分問題表現対中
の前記部分問題表現と、対応する前記部分解表現との同
一性を判定する同一性判定処理を含み、前記応答文生成処理は、前記同一性が判定された部分問
題表現対から、前記部分問題表現または前記部分解表現
のいずれか一方を選択することを特徴とする請求項１３
または１４に記載のコンピュータ読みとり可能な記録媒
体。
【請求項１６】上記コンピュータ読みとり可能な記録
媒体は、さらに、前記生成された応答文または前記部分問題表現対の長さ
が所定の閾値を越えるか否かを判定する判定処理を含
み、前記応答文生成処理は、前記応答文または前記部分問題
表現対の長さが所定の閾値を超える場合に、部分問題表
現対から、前記部分問題表現または前記部分解表現のい
ずれか一方を選択することを特徴とする請求項１３乃至
１５のいずれか記載のコンピュータ読みとり可能な記録
媒体。