JP2003255992A

JP2003255992A - 対話システムおよびその制御方法

Info

Publication number: JP2003255992A
Application number: JP2002060900A
Authority: JP
Inventors: Tetsuo Kosaka; 哲夫小坂; Kenichiro Nakagawa; 賢一郎中川; Hiroki Yamamoto; 寛樹山本
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2002-03-06
Filing date: 2002-03-06
Publication date: 2003-09-10
Anticipated expiration: 2022-03-06
Also published as: US20030220793A1; JP3799280B2; US7260531B2

Abstract

(57)【要約】【課題】より効率的にタスクを達成することのできる
対話システムおよびその制御方法を提供すること。【解決手段】検索対象としての各データを所定のクラ
ス毎に分類してメモリ(107)に記憶しておき、対話制御
部(102)の制御により、検索対象を特定のクラスにおけ
るデータに絞り込むための質問の提示順序を決定し、質
問文生成部(103)により、決定された提示順序で質問を
提示する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、インタラクティブ
に情報検索や予約サービス等のタスクを達成する対話シ
ステムおよびその制御方法に関する。

【０００２】

【従来の技術】従来より、キーボード入力や音声入力に
よる対話により情報を検索したり、アプリケーションを
動作させる対話システムが提案されている。ここでは、
音声認識技術を利用した音声対話による番組録画予約シ
ステムを例にとって説明する。予約したい番組名を正確
に知っていれば、その番組名を直接発声することにより
予約ができる。例えば、以下のような対話をなすことで
予約ができる。

【０００３】システム＞予約したい番組名を発声してください。ユーザ＞ニューステン（番組名）システム＞「ニューステン」を録画予約してよろしい
ですか？ユーザ＞はい

【０００４】といったやりとりで、目的を達成できる。
また、番組名を直接知らない場合については、条件を入
力していくことにより目的を達成することもできる。以
下に例を示す。

【０００５】システム＞予約したい番組の時間はいつですか？ユーザ＞午後９時システム＞予約したい番組のチャンネル名は？ユーザ＞東京１１チャンネルシステム＞東京１１チャンネルの午後９時台の番組は
２件あります。ドラマＸＸでよろしいですか？ユーザ＞いいえシステム＞天気予報でいいですか？ユーザ＞はい

【０００６】このようにシステム主導で、システムの質
問に回答することにより段階的に検索対象を絞り込んで
いって目的を達成する対話システムが提案されている。

【０００７】

【発明が解決しようとする課題】ところで、上記したよ
うなシステム主導型の対話システムにおいては、検索対
象を絞り込むための基準として、一般に、絞り込んだ後
の検索件数の期待値が利用される。

【０００８】しかし、期待値だけでは効率的な絞り込み
を行うことは困難である。

【０００９】テレビ番組の録画予約を例にとって説明す
る。

【００１０】まず、番組をその放送時間帯（例えば午前
と午後の２つの時間帯）によって絞り込む場合を想定す
る。例えば２００件ある番組について、午前の番組件数
が１００件、午後の番組件数が１００件である場合、所
望の番組は午前か午後かの質問に回答することで、次の
検索件数を２００件から１００件に絞り込むことができ
る。

【００１１】次に、番組をジャンル（例えばニュース番
組とそれ以外の２つのジャンル）によって絞り込む場合
を想定する。例えば２００件ある番組について、第１の
ジャンル（ニュース）に属する番組が１００件、第２の
ジャンル（ニュース以外）に属する番組も１００件であ
る場合には、上記と同様に１回の質問で次の検索件数を
２００件から１００件に絞り込むことができる。

【００１２】しかし、各ジャンルに属する件数のばらつ
きが大きい場合には問題が生じる。例えば２００件の番
組について、第１のジャンルに属する番組の件数が１件
だけで、第２のジャンルに属する番組件数が１９９件で
ある場合を考える。この場合、ジャンルに関する質問回
答後の件数の期待値は１００件で上記例と変わりはな
い。ところが、１回目の質問でたまたまニュースが指定
されたのであれば、この質問だけで該当番組を確定でき
るが、それ以外の場合には２００件の検索対象がわずか
１件減少するだけで絞り込み効果は少なく、より多くの
質問が必要になり検索に時間がかかってしまうことにな
る。

【００１３】さらに、音声認識技術に目を転じると、ユ
ーザに提示する質問によって回答候補としての認識語彙
が異なるから、質問によって認識性能が変動する。した
がって、認識が困難な類似単語を回答候補に含む質問が
先にある場合には誤認識のために確認作業に手間取り、
結局、検索に時間がかかるという問題が生じることにな
る。

【００１４】たとえば、午前か午後の質問に回答するこ
とにより、検索件数が２００件から１００件に絞り込め
たとする。また、ジャンルに関する質問に回答すること
により、同様に検索件数が２００件から１００件に絞り
込めたとする。

【００１５】この場合は期待値も偏りも同一であるか
ら、どちらのアプローチをとったとしても問題ないよう
にも考えられる。しかし、午前か午後かの質問に対する
回答の音声と、ジャンルに関する質問に対する回答の音
声とを比較すると、前者は発音が類似した単語を多く含
み、後者は発音が類似した単語が少ないといった発音上
の特徴のちがいが現れる。したがって、音声認識による
誤認識を考慮すると質問の内容によって枝刈りできる件
数に差がつくことになる。

【００１６】本発明は、以上のような問題を解決するた
め、より効率的にタスクを達成することのできる対話シ
ステムおよびその制御方法を提供することを目的とす
る。

【００１７】

【課題を解決するための手段】上記の目的を達成するた
めに、例えば本発明の対話システムは、以下の構成を備
える。すなわち、対話的に交換される情報に基づいてデ
ータ検索を行い所定のタスクを達成する対話システムで
あって、検索対象としての各データを所定のクラス毎に
分類して記憶する記憶手段と、検索対象を特定のクラス
におけるデータに絞り込むための質問の提示順序を決定
する決定手段と、決定された提示順序で質問を提示する
提示手段と、を備えることを特徴とする。

【００１８】

【発明の実施の形態】本発明者は、従来の対話システム
においては質問の提示順序が固定されているために上述
の問題が生じることに着目した。本発明の実施形態は、
質問の提示順序を制御することにより検索対象の絞り込
み効果を高めるものである。

【００１９】以下、図面を参照して本発明の好適な実施
形態について詳細に説明する。

【００２０】（実施形態１）図１は、本実施形態におけ
る対話システムの構成を示す図である。

【００２１】本システムは、例えばテレビジョン放送を
受信し録画するＶＴＲ１０９および、録画予約を行いＶ
ＴＲ１０９の録画動作を制御する録画予約部１０８を備
え、当該録画予約を対話的に行うものである。

【００２２】キーボード１１０は、ユーザからの操作に
より情報を入力する。また、同じく情報を入力するため
に、ユーザの音声を入力し音声認識を行う音声認識部１
０１も備える。ユーザはキーボード１１０を用いて情報
を入力することもできるし、音声認識部１０１を用いた
音声入力により情報を入力することもできる。

【００２３】１０４は、ユーザに提示する質問文候補を
検索可能に構成した質問文データベースを記憶するメモ
リ、１０３は質問文データベースに基づき提示すべき質
問文を生成する質問文生成部である。質問文生成部１０
３により生成された質問文は、ディスプレイ１１１に表
示されるか、または、音声合成部１０５に送られて音声
合成により音声出力されうる。

【００２４】１０７は検索対象データを記憶するメモ
リ、１０６はメモリ１０７における検索対象データを後
述する分類毎にエントロピーを計算するエントロピー計
算部である。そして、１０２はエントロピー計算部１０
６の出力に基づき対話制御を行う対話制御部である。

【００２５】図２は、本実施形態における対話システム
の動作を示すフローチャートである。

【００２６】システムがこの動作を開始すると（ステッ
プＳ１）、まず、ステップＳ２で、初期送出文が生成さ
れる。これは、対話制御部１０２で生成され、質問文生
成部１０３で具体的な発声内容、例えば、「これから番
組録画予約を行ないます。」が生成される。この発声内
容は質問文データベース１０４に格納されていたもので
ある。対話制御部１０２で生成される初期送出文は抽象
的な形式で表現されている（例えば「init-sentenc
e」）。これを質問文生成部１０３に送出する。質問文
生成部１０３はこの「init-sentence」に対応するデー
タをメモリ１０４における質問文データベースから検索
して具体的な発声内容を取得する。なお、この質問文デ
ータベースの内容を変えることにより、他の発声内容に
変更することができる。

【００２７】次にステップＳ３で、質問文生成部１０３
で生成された発声内容が音声合成部１０５で音声合成さ
れてユーザに提示される。提示の方法としてはこのよう
に音声合成部１０５を利用して音声で提示してもよい
し、音声合成せずディスプレー１１１に表示してもよ
い。もちろん音声合成部１０５およびディスプレー１１
１の両方を併用してもよい。

【００２８】初期送出文に対応する質問がユーザに提示
された後、ステップＳ４で、質問文の提示順序の戦略が
立てられる。これはエントロピー計算部１０６の計算結
果を基に対話制御部１０２で行われる。ここで、このス
テップＳ４で行われる対話戦略計算の詳細を、図３のフ
ローチャートを用いて説明する。

【００２９】まず、ステップＳ３２で、メモリ１０７か
ら検索対象データを取得する。本実施形態における検索
対象データはいわゆる番組表に対応する。各番組には例
えば、開始時刻および終了時刻、チャネル、ジャンルな
どのキーワードが付加されている。

【００３０】次に、ステップＳ３３で、これらのキーワ
ードをもとに各番組のクラス分けを行う。例えば、放送
時間帯について、５時台の番組、６時台の番
組、．．．、といったようにクラス分類する。同様に、
チャネルやジャンルについてもクラス分類する。

【００３１】次に、ステップＳ３４で、エントロピー計
算部１０６において、上記ステップＳ３３で分類した結
果に基づき各クラス分類ごとのエントロピーの計算を行
う。エントロピーの計算は例えば次のように行う。

【００３２】番組の候補総数をNtotal、各クラスに属す
る番組数をNclass(i)、クラス数をＩとすると、該当ク
ラス分類C_jにおけるエントロピーH(C_j)は以下のように
計算される。

【００３３】

【００３４】次に、ステップＳ３５で、上記ステップＳ
３４での計算結果をもとに各クラス分類のエントロピー
の大小を比較し、エントロピーの大きいクラス順に質問
の提示順序を決定する。以上により対話戦略計算が終了
する。

【００３５】なお、上記ステップＳ４の対話戦略計算
は、図２のフローチャートにおける順序にかかわらず、
システム立上げ時など、ユーザが番組予約をする以前で
あればいつ行ってもよい。

【００３６】説明を図２のフローチャートに戻す。

【００３７】ステップＳ５では、対話制御部１０２によ
って質問文生成部１０３を制御し、ステップＳ４で決ま
った提示順序でユーザに質問を提示し対象を絞り込む。
例えば、質問の提示順序が（１）開始時間帯、（２）チ
ャンネル、（３）ジャンル、と決まった場合は、ユーザ
と以下のような対話がなされる。

【００３８】システム＞何時の番組ですかユーザ＞午後９時システム＞本日午後９時台の番組は２０件あります。
何チャンネルですか？ユーザ＞９チャンネルシステム＞９チャンネル午後９時台の番組は２件で
す。ジャンルは何ですか。ユーザ＞ドラマシステム＞９チャンネル、午後９時台のドラマは「○
○」です。録画予約をしますか？ユーザ＞はいシステム＞録画予約を完了しました。

【００３９】次に、ステップＳ６で、ステップＳ５によ
る対話の結果から対象（例えば番組名）を確定させる。
上記のようにあらかじめ用意した質問だけで唯一決まる
場合には、それを例えば録画予約番組として確定する。
また、対象を絞り込む際、ある閾値を設定しておき、そ
の閾値以下の数の番組数に絞れた場合はそこで対話を打
ち切り、各候補を提示してユーザに直接選択させてもよ
い。閾値が３の場合の対話は例えば以下のようになる。

【００４０】システム＞何時の番組ですかユーザ＞午後９時システム＞本日午後９時台の番組は２０件あります。
何チャンネルですか？ユーザ＞９チャンネルシステム＞９チャンネル午後９時台の番組は２件で
す。「○○」でよろしいですか？ユーザ＞いいえシステム＞それでは「××」でよろしいですか？ユーザ＞はいシステム＞それでは「××」の録画予約をします。

【００４１】また、あらかじめ用意した質問でも候補を
閾値以下に絞れない場合は、候補をすべてユーザに提示
し選択してもらう。このようにして確定された対象に関
する情報は、対話制御部１０２から録画予約部１０８に
送信される。

【００４２】そして、ステップＳ７で、対話制御部１０
２より確定された対象に関する情報を受信した録画予約
部１０８は、その情報に基づいてアプリケーションを動
作させる（すなわち、ＶＴＲ１０９を制御して録画を行
う）。

【００４３】以上説明した実施形態１によれば、検索対
象である放送番組を放送時間帯、チャンネル、ジャンル
等でクラス分類を行い、エントロピーの大きいクラスの
順に質問を提示して検索対象を絞り込んでいく。このた
め、検索対象の絞り込み効果が高まり、検索時間を短縮
することができる。

【００４４】なお、上述の実施形態において、音声認識
部１０１への音声の入力にはマイクロフォンが用いら
れ、また、音声合成部１０５で合成された音声の出力に
はスピーカーが用いられるのが一般的である。これらの
音声入出力デバイスは直接接続されていてもよいし、遠
隔にあってもよい。例えば、遠隔地から電話により音声
入出力を行っても構わない。また、遠隔地からネットワ
ーク接続された端末と音声データをやりとりすることに
より制御しても構わない。

【００４５】また、メモリ１０７における検索対象デー
タがネットワーク接続された遠隔地にあっても構わな
い。さらに、ＶＴＲ１０９についても、制御信号がやり
とりできるインタフェースを介すれば、遠隔地にあって
も構わない。

【００４６】（実施形態２）上述の実施形態１では、エ
ントロピー計算部１０６により計算された各クラスのエ
ントロピーに応じて質問の提示順序を決定したが、本実
施形態では発音距離に応じて質問の提示順序を決定す
る。

【００４７】図４は、実施形態２における対話システム
の構成を示す図である。

【００４８】この構成は図１に示した対話システムとほ
ぼ同様であるので、図１と共通するブロックについては
同一の参照番号を付し説明を省略する。図１と異なる点
は、図１のエントロピー計算部１０６の替わりに、発音
距離計算部４０１が設けられている点である。

【００４９】これにより、本実施形態における対話シス
テムの動作も、図２のフローチャートに示した動作とほ
ぼ同様であるが、ステップＳ４の処理内容のみが異なる
ことになる。以下、このステップＳ４における代替の処
理内容についてフローチャートを用いて説明する。ただ
し、本実施形態では入力手段としてキーボード１１０で
はなく、音声認識部１０１を用いることを前提とする。

【００５０】図５は、発音距離計算部４０１による対話
戦略計算の詳細を示すフローチャートである。

【００５１】まず、ステップＳ５２で、メモリ１０７か
ら検索対象データを取得する。本実施形態における検索
対象データはいわゆる番組表に対応する。各番組には例
えば、開始時刻および終了時刻、チャネル、ジャンルな
どのキーワードが付加されている。

【００５２】次に、ステップＳ５３で、これらのキーワ
ードをもとに各番組のクラス分けを行う。例えば、放送
時間帯について、５時台の番組、６時台の番
組、．．．、と、いったようにクラス分類する。同様
に、チャネルやジャンルについてもクラス分類する。

【００５３】次に、ステップＳ５４で、分類した結果に
基づき各クラス分類ごとの発音距離の計算を行う。発音
距離はさまざまな定義が考えられるが、ここでは一例と
して各発声に含まれる音素の距離を使用するものとす
る。

【００５４】まず、音素の距離テーブルを作成する。音
素距離テーブルでは０〜１の範囲で、音素が類似した場
合は小さな値を、類似していない場合は大きな値を与
え、すべての音素の対について距離を与える。距離の数
値は例えば以下のように与える。音声認識部１０１によ
り音素認識を行い、音素間のコンフュージョンマトリッ
クスを作成する。混同の多い音素間は小さい距離を与
え、混同の少ない音素間は大きい距離を与える。この距
離を０〜１の範囲で正規化し、同一音素の距離は０とす
る。

【００５５】以上の音素距離テーブルを用いて各発声間
の距離を求める。各発声を音素記号列で表わし、音素記
号間でＤＰマッチングをとり、上記距離を累積すること
により各発声間の距離を求める。該当クラスの発音距離
は例えば、そのクラスに属する各発声間の距離の平均で
規定する。あるいは距離の近い発音間のみが誤認識を起
こしやすいと考える場合には、距離の近い発音のペアの
上位Ｎ個を選択し、その上位Ｎ個のみの距離の平均で規
定してもよい。

【００５６】次に、ステップＳ５５で、上記ステップＳ
５４での計算結果をもとに各クラス分類の発音距離の大
小を比較し、発音距離の大きいクラス順に質問の提示順
序を決定する。以上により、対話戦略計算が終了する。

【００５７】なお、上記ステップＳ４の対話戦略計算
は、図２のフローチャートにおける順序にかかわらず、
システム立上げ時など、ユーザが番組予約をする以前で
あればいつ行なってもよい。

【００５８】ステップＳ５以降の処理は実施形態１にお
いて説明したとおりに行えばよい。

【００５９】以上の実施形態２によれば、発音距離の大
きいクラスはより誤認識が少ないと考え、誤認識の少な
そうな事項から質問を行うことにより、誤認識の回数を
減らすことができ、ひいては誤認識の修正のために取ら
れる時間を短縮することができる。

【００６０】（実施形態３）上述の実施形態１では、質
問の提示順序の求め方としてエントロピーを使用した。
また、実施形態２では、発音距離を用いて質問順序を決
定した。実施形態３では、その両方を使用する方法につ
いて説明する。

【００６１】図６は、実施形態３における対話システム
の構成を示す図である。

【００６２】この構成は図１または図２に示した対話シ
ステムとほぼ同様であるので、図１および図２と共通す
るブロックについては同一の参照番号を付し説明を省略
する。ただし、この図６に示す対話システムには、図１
のエントロピー計算部１０６に加え、図２の発音距離計
算部４０１が設けられるとともに、対話戦略計算部６０
１が新たに設けられている。

【００６３】本実施形態では対話戦略計算部６０１にお
いて、発音距離計算部４０１で計算された発音距離およ
びエントロピー計算部１０６で計算されたエントロピー
の両方の計算結果を用いて、質問順序を決定する。具体
的には、この２つの数値に重みをかけ両者を考慮した数
値を計算し、その数値を質問順序の決定に利用する。

【００６３】例えば、クラスCjに関して、発話距離計算
部４０１で計算された発音距離をD(Cj)、エントロピー
計算部１０６で計算されたエントロピーをH(Cj)とする
と、次式で示される計算を行う。 T(Cj)＝α・D(Cj)＋(１−α)・H(Cj)、ただし、ここで、α（ただし、0≦α≦1）は重み係数で、αが０
の場合はエントロピーのみを考慮する場合と等価であ
り、１の場合は発音距離のみを考慮する場合と等価であ
る。このαの値を指定することにより、エントロピーを
より大きく考慮するか、発音距離をより大きく考慮する
かを決めることができる。αの指定はシステムが規定し
た値を使用してもよいし、αの入力手段を付加すること
により、ユーザが指定してもよい。上記計算結果をもと
にT(Cj)の大きいクラス順に質問の提示順序を決定す
る。

【００６４】（実施形態４）上記したそれぞれの実施形
態はシステム主導型の対話システムを想定して説明した
が、対話の一部がユーザ主導であっても構わない。この
場合はシステムが決定した質問順序とは異なる入力をユ
ーザがする可能性がある。その場合は質問ごとにエント
ロピーや発音距離を計算してシステムが順番を決めれば
よい。

【００６５】例えば、対話におけるユーザからの最初の
発声（第１発声）がユーザ主導で入力された場合の対話
例を示す。第１発声があった後エントロピーや発音距離
を計算して質問順を決める。この例では第１発声がなけ
れば、開始時間帯、チャンネル、ジャンルと順番がきま
るが、第１発声でチャンネルが決定されてエントロピー
が０となったため、第１質問後はチャネルに関する質問
はなくなり、開始時間帯、ジャンルという順番で質問が
行なわれる。

【００６６】システム＞番組録画予約システムです。入力をどうぞユーザ＞９チャンネルシステム＞９チャンネルですね。何時の番組ですか？ユーザ＞午後９時システム＞９チャンネル、午後９時台の番組は２件で
す。ジャンルな何ですか？ユーザ＞ドラマシステム＞９チャンネル、午後９時台のドラマは「○
○」です。録画予約をしますか？ユーザ＞はいシステム＞録画予約を完了しました。

【００６７】上記の例では、第１発声がユーザ主導であ
るが、各回の質問ごとにエントロピーや発音距離を計算
することにより、何番目の発声がユーザ主導であっても
よい。また、上記例で最初の質問の答えが違うチャンネ
ルの場合、開始時間帯とジャンルのエントロピーはチャ
ンネルごとに異なるので、質問の順番が入れ換わる可能
性もある。

【００６８】以上説明した実施形態によれば、対話シス
テムにおいて、システムが提示する質問の順序を変える
ことにより、より短い時間で検索件数を絞り込むことが
できる。エントロピーを使う場合には、より偏りのない
検索件数の絞り込みが可能になる。また、発音距離を使
用する場合は、より誤認識回数を減らすことが期待でき
る。このため誤認識の修正にかかる時間を少なくでき、
より短時間で検索件数を絞り込める。さらに、両者を併
用し、より効果を高めることも可能である。

【００６９】

【他の実施形態】以上、本発明の実施形態を詳述した
が、本発明は、複数の機器（例えばホストコンピュー
タ、インタフェース機器、リーダ、プリンタ等）から構
成されるシステムに適用しても、１つの機器からなる装
置（例えば、複写機、ファクシミリ装置等）に適用して
もよい。

【００７０】なお、本発明は、前述した実施形態の機能
を実現するソフトウェアのプログラムを、システムある
いは装置に直接あるいは遠隔から供給し、そのシステム
あるいは装置のコンピュータがその供給されたプログラ
ムを読み出して実行することによっても達成される場合
を含む。

【００７１】したがって、本発明の機能処理をコンピュ
ータで実現するために、そのコンピュータにインストー
ルされるプログラムコード自体も本発明を実現するもの
である。つまり、本発明の特許請求の範囲には、本発明
の機能処理を実現するためのコンピュータプログラム自
体も含まれる。

【００７２】その場合、プログラムの機能を有していれ
ば、オブジェクトコード、インタプリタにより実行され
るプログラム、ＯＳに供給するスクリプトデータ等、プ
ログラムの形態を問わない。

【００７３】プログラムを供給するための記憶媒体とし
ては、例えば、フレキシブルディスク、光ディスク（CD
-ROM、CD-R、CD-RW、DVD等）、光磁気ディスク、磁気テ
ープ、メモリカード等がある。

【００７４】その他、プログラムの供給方法としては、
インターネットを介して本発明のプログラムをファイル
転送によって取得する態様も含まれる。

【００７５】また、本発明のプログラムを暗号化してCD
-ROM等の記憶媒体に格納してユーザに配布し、所定の条
件をクリアしたユーザに対し、インターネットを介して
暗号化を解く鍵情報を取得させ、その鍵情報を使用する
ことで暗号化されたプログラムを実行してコンピュータ
にインストールさせて実現することも可能である。

【００７６】また、コンピュータが、読み出したプログ
ラムを実行することによって、前述した実施形態の機能
が実現される他、そのプログラムの指示に基づき、コン
ピュータ上で稼働しているＯＳ等が実際の処理の一部ま
たは全部を行い、その処理によって前述した実施形態の
機能が実現され得る。

【００７７】さらに、記憶媒体から読み出されたプログ
ラムが、コンピュータに挿入された機能拡張ボードやコ
ンピュータに接続された機能拡張ユニットに備わるメモ
リに書き込まれた後、そのプログラムの指示に基づき、
その機能拡張ボードや機能拡張ユニットに備わるＣＰＵ
等が実際の処理の一部または全部を行い、その処理によ
っても前述した実施形態の機能が実現される。

【００７８】

【発明の効果】本発明によれば、より効率的にタスクを
達成することのできる対話システムおよびその制御方法
を提供することができる。

【図面の簡単な説明】

【図１】実施形態１における対話システムの構成を示す
図である。

【図２】実施形態１における対話システムの動作を示す
フローチャートである。

【図３】実施形態１における対話戦略計算処理の一例を
示すフローチャートである。

【図４】実施形態２における対話システムの構成を示す
図である。

【図５】実施形態２における対話戦略計算処理の一例を
示すフローチャートである。

【図６】実施形態３における対話システムの構成を示す
図である。

───────────────────────────────────────────────────── フロントページの続き (72)発明者山本寛樹東京都大田区下丸子３丁目30番２号キヤノン株式会社内Ｆターム(参考） 5C064 BA07 BB07 BD02 BD09 5D015 AA05 KK02

Claims

【特許請求の範囲】

【請求項１】対話的に交換される情報に基づいてデー
タ検索を行い所定のタスクを達成する対話システムであ
って、検索対象としての各データを所定のクラス毎に分類して
記憶する記憶手段と、検索対象を特定のクラスにおけるデータに絞り込むため
の質問の提示順序を決定する決定手段と、決定された提示順序で質問を提示する提示手段と、を備
えることを特徴とする対話システム。
【請求項２】前記情報の交換のために入力された音声
を認識する音声認識手段を更に備えることを特徴とする
請求項１に記載の対話システム。
【請求項３】前記決定手段は、各クラスのエントロピ
ーを計算するエントロピー計算手段を含み、計算された前記エントロピーを基準にして前記質問の提
示順序を決定することを特徴とする請求項１または２に
記載の対話システム。
【請求項４】前記決定手段は、各クラスの発音距離を計算する距離計算手段を含み、計算された前記発音距離を基準にして前記質問の提示順
序を決定することを特徴とする請求項２に記載の対話シ
ステム。
【請求項５】前記決定手段は、各クラスのエントロピーを計算するエントロピー計算手
段と、各クラスの発音距離を計算する距離計算手段と、計算された前記エントロピーと前記発音距離との重み付
け加算を行う重み付け加算手段と、を含み、前記重み付け加算の結果に基づいて前記質問の提示順序
を決定することを特徴とする請求項２に記載の対話シス
テム。
【請求項６】対話的に交換される情報に基づいてデー
タ検索を行い所定のタスクを達成する対話システムの制
御方法であって、検索対象としての各データを所定のクラス毎に分類して
記憶しておき、検索対象を特定のクラスにおけるデータに絞り込むため
の質問の提示順序を決定する決定ステップと、決定された提示順序で質問を提示する提示ステップと、を有することを特徴とする対話システムの制御方法。
【請求項７】前記情報の交換のために入力された音声
を認識する音声認識ステップを更に有することを特徴と
する請求項６に記載の対話システムの制御方法。
【請求項８】前記決定ステップは、各クラスのエントロピーを計算するエントロピー計算ス
テップを含み、計算された前記エントロピーを基準にして前記質問の提
示順序を決定することを特徴とする請求項６または７に
記載の対話システムの制御方法。
【請求項９】前記決定ステップは、各クラスの発音距離を計算する距離計算ステップを含
み、計算された前記発音距離を基準にして前記質問の提示順
序を決定することを特徴とする請求項７に記載の対話シ
ステムの制御方法。
【請求項１０】前記決定ステップは、各クラスのエントロピーを計算するエントロピー計算ス
テップと、各クラスの発音距離を計算する距離計算ステップと、計算された前記エントロピーと前記発音距離との重み付
け加算を行う重み付け加算ステップと、を含み、前記重み付け加算の結果に基づいて前記質問の提示順序
を決定することを特徴とする請求項７に記載の対話シス
テムの制御方法。
【請求項１１】対話的に交換される情報に基づいてデ
ータ検索を行い所定のタスクを達成する対話システムを
制御するためのプログラムであって、検索対象としての各データを所定のクラス毎に分類して
メモリに記憶させ、検索対象を特定のクラスにおけるデータに絞り込むため
の質問の提示順序を決定する決定ステップ、決定された提示順序で質問を提示する提示ステップ、を実行させるプログラム。
【請求項１２】前記情報の交換のために入力された音
声を認識する音声認識ステップを更に有することを特徴
とする請求項１１に記載のプログラム。
【請求項１３】前記決定ステップは、各クラスのエントロピーを計算するエントロピー計算ス
テップを含み、計算された前記エントロピーを基準にして前記質問の提
示順序を決定することを特徴とする請求項１１または１
２に記載のプログラム。
【請求項１４】前記決定ステップは、各クラスの発音距離を計算する距離計算ステップを含
み、計算された前記発音距離を基準にして前記質問の提示順
序を決定することを特徴とする請求項１２に記載のプロ
グラム。
【請求項１５】前記決定ステップは、各クラスのエントロピーを計算するエントロピー計算ス
テップと、各クラスの発音距離を計算する距離計算ステップと、計算された前記エントロピーと前記発音距離との重み付
け加算を行う重み付け加算ステップと、を含み、前記重み付け加算の結果に基づいて前記質問の提示順序
を決定することを特徴とする請求項１２に記載のプログ
ラム。