JP3998443B2 - 対話システム - Google Patents

対話システム Download PDF

Info

Publication number
JP3998443B2
JP3998443B2 JP2001244617A JP2001244617A JP3998443B2 JP 3998443 B2 JP3998443 B2 JP 3998443B2 JP 2001244617 A JP2001244617 A JP 2001244617A JP 2001244617 A JP2001244617 A JP 2001244617A JP 3998443 B2 JP3998443 B2 JP 3998443B2
Authority
JP
Japan
Prior art keywords
dialog
dialogue
frame
data
slot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001244617A
Other languages
English (en)
Other versions
JP2003058187A (ja
Inventor
真一 岩本
俊明 草野
英樹 北尾
英樹 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP2001244617A priority Critical patent/JP3998443B2/ja
Publication of JP2003058187A publication Critical patent/JP2003058187A/ja
Application granted granted Critical
Publication of JP3998443B2 publication Critical patent/JP3998443B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は対話システム、例えば車載情報機器の1つであるナビゲーション装置やファーストフード店における自動接客装置におけるガイダンス機能部としての対話システムに関する。
【0002】
【従来の技術】
上記のガイダンスの機能を果すために、対話システムにおいては音声認識処理部、対話エンジン、音声合成部、対話データベース等を備え、システム内での対話データ処理が行われる。
【0003】
この場合、音声合成部からユーザへ音声ガイダンスとしての問い掛けをし、ユーザがこれに応えて発声すると、音声認識処理部はその発声の意味を分析する。そして対話エンジンはその分析結果に応じて、アプリケーション(例えば既述のナビゲーションや自動接客)に従い、そのユーザの発声に見合う次の音声ガイダンスを生成し、上記音声合成部を通して再び新たな問い掛けをユーザに対して行う。以下、同様の繰り返しによって対話の流れができ上がる。この対話の流れはシステムの内部的なデータ処理にて行われる。
【0004】
上記の内部的なデータ処理の実行形態にはいろいろあるが、本発明ではいわゆる「フレーム処理」によって実行する形態に立脚した対話システムについて述べる。この「フレーム処理」におけるフレームとは、一連のスロットの並びのことであり、ナビゲーションについて一例を挙げれば、「何県に行きますか」→スロット<2>=「兵庫県」→「兵庫県内の何市に行きますか」→スロット<4>=「神戸市」→「施設種類を教えて下さい」→スロット<6>=「ポートアイランド」といった一連のスロット<2><4><6>が1つのフレームであり、このようにスロットを組み上げることをフレーム処理と呼ぶ。
【0005】
あるいはファーストフード店について一例を挙げれば、「食べ物は何にしますか」→スロット<2>=「ハンバーガー」→スロット<3>=「2つ」→「こちらでお召し上がりですか」→…といった一連のスロット<2><3>を組み上げてフレームにすることをフレーム処理と呼ぶ。
【0006】
このフレーム処理についてみると、従来は次のような処理が含まれている。
【0007】
1)ある1つの対話のフレームをなす所定の一連のスロットが全て、それぞれ対応する発話データ(上述の「兵庫県」等)で埋まることによって、次の対話へ遷移する。
【0008】
2)一連のスロットの全てが埋まった後、予め定めた1つの遷移先対話に固定的に遷移する。
【0009】
3)上記2)の制約を解除するときは、対話遷移データすなわちオートマトンでプログラムを記述しておく。
【0010】
【発明が解決しようとする課題】
1)上記の1)に起因して、一連のスロットの全てがそれぞれの発話データで埋まらない限り、次の対話へ遷移することができない。つまり、対話設計の自由度がきわめて小さい、という問題がある。
【0011】
2)上記の2)に起因して、一連のスロットの全てがそれぞれの発話データで埋まったとき、次に遷移できる対話は1つに定められてしまう。つまり、対話設計の柔軟性に欠ける、という問題がある。
【0012】
3)上記の3)に起因して、オートマトンの記述が混在するため全ての対話をフレーム処理で統一的にデータ処理することができない。つまり、対話設計が複雑化する、という問題がある。
【0013】
4)さらには、上述のオートマトンの記述が混在することから、上述した内部的なデータ処理に使用する各発話データのデータサイズが大きくなってしまう、という問題がある。
【0014】
したがって本発明は、上記諸問題点に鑑み、全ての対話をフレーム処理で実現して対話設計の自由度、柔軟性および簡易性を同時に満足することのできる対話システムを提供することを目的とするものである。
【0015】
【課題を解決するための手段】
図1は本発明が適用される対話システムの一構成例を示す図である。
【0016】
本図において、対話システム10は、マイクMCを通してユーザから入力されたユーザ発声を分析してその意味を認識辞書14を参照しながら認識する音声認識処理部11と、その認識結果をもとにアプリケーション13(前述のナビゲーションや自動接客)に従って対話データベース(対話DB)15を参照しながら対話の流れを生成する対話エンジン12と、生成された対話を音声として合成しスピーカSPよりユーザに提供する音声合成部16と、対話に係る画面をディスプレイ18に出力するGUI(Graphical User Interface)制御部17とからなる。
【0017】
これらの構成要素11〜18の中で、本発明に特に関係するのは対話エンジン12および該対話エンジン12と協働する対話データベース15である。
【0018】
図2は本発明の主要部を表す図である。
【0019】
特に図1における対話エンジン12および対話データベース15の部分を取り出して具体的に示す。
【0020】
図2において特に注目すべき構成要素は対話遷移制御手段21である。すなわち、対話を構成するフレームをなす一連のスロットを順次埋める対話データの埋まり具合に応じて対話の遷移先を特定する対話遷移制御手段である。
【0021】
さらに注目すべき構成要素は、フレームデータ領域22およびフレーム参照テーブル23である。具体的には、まず、対話を構成するフレームをなす一連のスロットの各々にそれぞれ対応する対話データを、該当のスロットに埋めていくためのフレームデータ領域22と、このフレームデータ領域22内に埋められた対話データの埋まり具合によって定まる複数のフレームパターンのそれぞれに対応する対話の遷移先をフレームパターン毎に定義したフレーム参照テーブル23と、を対話データベース15内に構築しておく。
【0022】
そして、フレームデータ領域22とフレーム参照テーブル23とを用いて、対話データの埋まり具合に応じた対話の遷移先を特定する対話遷移制御手段21を、対話エンジン12内に形成する。
【0023】
これにより、スロットの埋まり具合に応じて対話の遷移先を変更することができるため、対話設計の自由度を大にし、また、対話設計に柔軟性を持たせることができる。
【0024】
【発明の実施の形態】
図3は図2のフレームデータ領域22の詳細例を示す図である。
【0025】
本図においてフレームデータ領域22は、分かりやすいように、複数のブロックを多段に積み上げて描いている。
【0026】
1つの対話をなすフレームは、対話IDと対話状態IDで特定される。
【0027】
対話IDは、対話システムが今どういう対話をしているかを表示するためのものである。例えば、ユーザから「行き先」を聞き出すための対話とか、ユーザから「食べ物の注文」を聞き出すための対話であることを表すためのIDである。
【0028】
また対話状態IDは、対話システムが今、1つの対話の流れの中で何番目の状態にいるかを表示するためのものである。例えば、ユーザから「行き先」を聞き出すための対話であれば、「何県ですか」(1番目)、「何市ですか」(2番目)…の流れの中のどこ(状態)にいるかを表すためのIDである。
【0029】
上記の対話IDと対話状態IDとの組を、対話エンジン12からアプリケーション13に送ると、アプリケーション13はその組に相当する案内をユーザに提供するように、音声合成部16を制御する。
【0030】
図4は対話IDと対話状態IDの一例を示す図である。
【0031】
本図において、S−0は上述の対話IDであり、それに付加された数字(1,2…)が上述の対話状態IDである。なお、同図右側のSはシステム側の発話を表し、Uはユーザ側の発話を表す。
【0032】
図3に戻ると、上記の対話IDおよび対話状態IDが、同図の最上段(第1段)に示されている。その第2段にはスロット数Mが記述される。既述したスロット<1>、スロット<2>、スロット<3>…の数である。M=6ならば、1フレームが一連の6スロットから構成される。
【0033】
図3の第3段以降が各スロットに対応し、M個のスロット1,2…Mよりなる。
【0034】
第3段のスロット値属性1Aは、ナビゲーションにおける「県名」や自動接客における「食べ物」を問う対話に相当する。そして、それに答える「兵庫県」や「ハンバーガ」が、第3段に示す「値1」となる。
【0035】
なお、スロット値属性1Aに付随するスロット値属性1Bは常に必要となるデータではないが、スロット値属性1Aである上記の「県名」が、例えば“目的地設定”なのかあるいは“中継点設定”なのかについてアプリケーション13がさらに知る必要がある場合に、そのスロット値属性1Bに、「兵庫県」が“目的地設定”であることあるいは“中継点設定”であることを表示することができる。
【0036】
図3の第4段以降も、上記第3段と同種のデータが記述される。
【0037】
図5は図2のフレーム参照テーブル23の詳細例を示す図である。
【0038】
本図において、フレーム参照テーブル23は、第1段、第2段〜第N段のコラムからなり、各コラムは各フレームパターン対応になっている。
【0039】
最上段(第1段)を例にとると、フレームパターン1は、ある対話ID例えばS−0でその対話状態IDは例えば1である(S−0:1)。つまりフレームデータ領域22に埋まった対話データはS−0:1に相当する。
【0040】
フレーム参照テーブル23は、対話の流れがこのようなフレームパターン(S−0:1)になったならば、“次はどの対話ID/対話状態IDに進め”ということを指示するものである。この指示の内容が同テーブル23内の“遷移先対話ID”/“遷移先対話状態ID”である。上記のフレームパターン1(=S−0:1)の例であると、その“遷移先対話ID”/“遷移先対話状態ID”には、例えばS−0:2が記述される。
【0041】
図6は図5のフレームパターンの検索の仕方を図解的に表す図である。
【0042】
ただし簡素化のために1フレームが3スロットからなる場合について示す。したがって、採り得るフレームパターンの種類は8種である。
【0043】
前述したフレームデータ領域22(図3)においてスロット(対話データ)の埋まり具合に応じて、スロット<1>のみが埋まっていればフレームパターン1のコラムを参照する。同様に、スロット<1><2>のみ、スロット<1><3>のみ、スロット<1><2><3>の全てが埋まっていれば、それぞれ、フレームパターン2、3および8の各コラムを参照する。そしてそれぞれのコラムに示される遷移先ID/遷移先状態IDに従って対話を遷移させる。以上が本発明の第1の態様である。
【0044】
図7は本発明に係る第1の態様の動作を表すフローチャートである。
【0045】
本図において、
ステップS11:図3に示したフレームデータ領域22での動作である。
【0046】
ステップS12:図5および図6において説明したフレーム参照テーブル23の検索動作である。
【0047】
図8の(a)および(b)は第1の態様に従う対話モデルの簡単な2例を示す遷移図である。
【0048】
図8(a)は、発話内容に応じて(フレームパターンに応じて)引き続き同じ対話ID内で対話状態が遷移する様子を表し、
図8(b)は、発話内容に応じて、これまでの対話IDとは違う対話IDへ遷移する様子を表す。
【0049】
図9は本発明に係る第2の態様の動作を表すフローチャートである。
【0050】
この第2の態様の特徴は、フレームをなす一連のスロットの全てにそれぞれの対話データが埋まり切る前に、進行中の対話の対話IDと異なる対話IDへ遷移する場合、これまで進行してきたフレーム処理を終了することを特徴とするものである。
【0051】
従来のフレーム処理によれば、フレームをなす一連のスロットの全てにそれぞれの対話データが埋まり切る前には、他の対話IDに遷移することはできない。つまり、該対話データが埋まり切らない限りフレーム処理を終了できない作りになっていた。
【0052】
ところが本発明では図5に示すフレーム参照テーブル23に従って、他の対話にフレキシブルに移行可能としたので、そのような対話の移行が発生するときには、全スロットが埋まったか否かに拘わらず、それまでのフレーム処理は終了させてしまう、という構成を採ることにする。
【0053】
これにより、対話設計の自由度は大になり、また、柔軟な対話設計が可能となる。
【0054】
ここで図9を参照すると、
ステップS21およびS22は、それぞれ、図7に示したステップS11およびS12と同じである。
【0055】
第2の態様の特徴の1つは、ステップS23を介在させ、1つの対話から他の対話へ(例えば、S−0→S−1)遷移するか否かを判断することである。
【0056】
対話IDが変化しなければ(同一の対話が進行中)、そのままフレーム処理を継続する。つまり、ステップS23の判断結果がYesならば、ステップS24に進む。このことは従来と余り変わらないが、第2の態様のさらなる特徴は、フレーム参照テーブル23に従って1つの対話IDが他の対話IDに遷移するときは(ステップS23の判断結果がNo)、現在進行しているフレーム処理を終了してしまうことである(ステップS26およびS27の各々の前半参照)。
【0057】
ステップS26およびS27の各々の後半の処理は、フレーム参照テーブル23(図5)を参照したときに、対応のテーブル部分に“対話終了コード”が記入されているか否か(ステップS25)によって変わってくる。
【0058】
つまり、ステップS25の判断結果がYesの場合(対話終了コードあり)、対話を終了させてしまう。一方そのステップS25の判断結果がNoの場合(対話終了コードなし)、対話は遷移先の対話へ移動して続行される。
【0059】
図10は第2の態様に従う対話モデルの一例を示す遷移図である。
【0060】
スロットとしては、「肯定」「否定」「県名」の対話データに関係する3個のスロットが用意されているものとして、以下の3つのケースについて説明する。
【0061】
ケース1)
図10の対話状態0の状態で、ユーザが“県名”に関係する「兵庫県」を発声したとすると、スロットの1つである「県名」に関係するスロットが埋まる。そして対話状態3へ移動する。
【0062】
この対話状態3で、フレーム参照テーブル23を参照して、そこに記述されている遷移先対話IDおよび遷移先対話状態IDに遷移する。
【0063】
この場合、「肯定」「否定」に関係するスロットが埋まっていないにも拘わらず、違う対話IDに遷移することが可能となる。このとき遷移前のフレームは破棄される。
【0064】
ケース2)
図10の対話状態0の状態で、ユーザが“否定”に関係する「いいえ」を発声したとすると、スロットの1つである「否定」に関係するスロットが埋まる。そして対話状態2へ移動する。
【0065】
この対話状態2でフレーム参照テーブル23を参照して、そこに記述されている遷移先対話IDおよび遷移先対話状態IDに遷移する。
【0066】
この場合、「肯定」「県名」に関係するスロットが埋まっていないにも拘わらず、違う対話IDに遷移することが可能となる。このとき遷移前のフレームは破棄される。
【0067】
ケース3)
図10の対話状態0の状態で、ユーザが“肯定”に関係する「はい」を発声したとすると、スロットの1つである「肯定」に関係するスロットが埋まる。この状態でフレーム参照テーブル23を参照して、そこに記述されている遷移先対話ID:同じID、遷移先対話状態ID:1に遷移する。
【0068】
この場合アプリケーションが遷移した対話IDおよび対話状態IDデータを元にユーザへ案内を出した後、遷移先対話状態:5の状態になる。
【0069】
この対話状態5の状態で、ユーザが“県名”に関係する「兵庫県」を発声したとすると、スロットの1つである「県名」に関係するスロットが埋まる。そして対話状態3へ移動する。
【0070】
この対話状態3でフレーム参照テーブル23を参照して、そこに記述されている遷移先対話IDおよび遷移先対話状態IDに遷移する。
【0071】
この場合、「否定」に関係するスロットが埋まっていないにも拘わらず、違う対話IDに遷移することが可能となる。このとき遷移前のフレームは破棄される。
【0072】
図11は本発明に係る第3の態様を表す図である。
【0073】
本図に示すとおり、第3の態様に基づくフレーム参照テーブル23は、遷移先ID領域25(図5と同じ)と拡張領域26とからなる。
【0074】
すなわち第3の態様は、フレーム参照テーブル23における各フレームパターンは、各該フレームパターン毎に定義される遷移先対話IDおよび遷移先対話状態IDからなる遷移先ID領域25に加えて、各該フレームパターン毎に定義される特定のイベントへの遷移先を記述する拡張領域26を有することを特徴とするものである。なお、図11では、拡張領域26を拡張領域IおよびIIの対として示す。
【0075】
ここで上記の特定のイベントを、第1例および第2例をもって説明する。
【0076】
第1例によれば、そのイベントはアシスト対話である。アシスト対話とは、システム側からの問い掛けに対し所定の時間(例えば5秒)が経過してもユーザから何の応答もなかったり、あるいは、ユーザからの応答が「助け」を求めるようなものであったような場合に、システム側からもっと回答しやすい形で問い掛け直すときの対話をいう。
【0077】
そこで拡張領域Iには、上記のアシスト対話の対話IDを記述し、拡張領域IIには、該アシスト対話の対話状態IDを記述できるようにする。なお、これら対話IDおよび対話状態IDは、対話の進行具合すなわちフレームパターンの種類に応じて異なる。
【0078】
また第2例によればそのイベントは、例えばアプリケーションへ移行するためのイベント、例えばタイマーを起動させるための制御コードである。
【0079】
かくして、第3の態様によれば対話設計の自由度および柔軟性を向上させることができる。
【0080】
図12は本発明に係る第4の態様の動作を表すフローチャート(その1)、
図13は同フローチャート(その2)である。
【0081】
この第4の態様の特徴は、第1の対話についてフレーム処理をしている途中で第2の対話に遷移するとき、その第1の対話においてスロットに埋めた対話データをそのまま保持し、かつ、上記の第2の対話でのフレーム処理にてスロットに埋めるべき対話データのうち、その保持している対話データと重複するものについては、当該保持データを流用することを特徴とするものである。
【0082】
図12を参照すると、
ステップS31およびS32はそれぞれ、図9に示したステップS21およびS22と同じである。
【0083】
図13を参照すると、
ステップS33、S34、S35およびS36はそれぞれ、図9に示したステップS23、S24、S25およびS27と同じである。
【0084】
したがってこの第4の態様の特徴は、図13のステップS37およびS38で表される。
【0085】
第1の対話についてフレーム処理をしている途中で第2の対話に遷移するとき、そして対話が終了せず継続するとき、すなわち、図12におけるステップS33の判断結果がNoでさらに、図13におけるステップS35の判断結果もNoのときである。
【0086】
このときに、第1の対話におけるフレーム処理においてスロットに埋めた対話データをそのまま保持する(図13のステップS37)。
【0087】
さらに、遷移先の上記第2の対話でのフレーム処理にてスロットに埋めるべき対話のうち、その保持した対話データと重複するものについては、その保持対話データを流用する。すなわち遷移先で使用するフレームデータをフレームデータ領域22から読み込む(図13のステップS38)。
【0088】
このように第4の態様では、共通する対話データの使いまわしをし、これにより対話データベース15におけるメモリ量を削減することが可能となる。
【0089】
図14は本発明に係る第4の態様の特例についての動作を表すフローチャート(その1)、
図15は同フローチャート(その2)である。
【0090】
この第4の態様の特例は、前述した第4の態様における「第2の対話」が既述(図11)のアシスト対話である場合を規定したものである。したがって第4の態様における「第1の対話」はメイン対話である。
【0091】
すなわちこの第4の態様の特例は、メイン対話についてフレーム処理をしている途中で、音声認識処理部11(図1)が、ユーザに対するアシストが必要であるものと判定し、これによりアシスト対話に遷移するとき、そのメイン対話においてスロットに埋めた対話データをそのまま保持し、かつ、そのアシスト対話でのフレーム処理にてスロットに埋めるべき対話データのうち、上記の保持している対話データと重複するものについては、当該保持データを流用することを特徴とするものである。
【0092】
図14および図15を参照すると、図14に示すステップS22と図15に示すステップS23〜S27は、それぞれ、図9に示したステップS22およびS23〜S27と同じである。
【0093】
したがって第4の態様の特例において注目すべきステップは、図14に示すステップS41、S42、S43およびS44である。ただし、このステップS43およびS44は、それぞれ、図13に示した第4の態様におけるステップS37およびS38と同じである。
【0094】
このため、ステップS41およびS42が特に注目すべきステップとなる。
【0095】
ユーザがシステム側からの問い掛けに応答せず所定の時間(例えば5秒)が経過すると(タイムアウト)、上記ステップS41の判断結果はYesとなり、アシスト対話への遷移が開始して、上記第4の態様の特徴をなすステップS43に至り、さらにはステップS44に至る。
【0096】
上記のタイムアウトにはならないが、ユーザからの応答が「助け」を求めるものであって、アシスト対話へ遷移することとなる場合も、上記第4の態様の特徴をなすステップ43に至り、さらにはステップS44に至る。
【0097】
これにより、第4の態様で得られる効果(対話データの使いまわしにより、対話データベース15のメモリ量を削減する)と同様の効果が、アシスト対話への遷移時において得ることができる。
【0098】
図16は第4の態様の特例における対話モデル例Iを示す遷移図であり、
図17は第4の態様の特例における対話モデル例IIを示す遷移図であり、
図18は第4の態様の特例における対話モデル例III を示す遷移図である。
【0099】
図16では、上記アシスト対話において、上記メイン対話で必要な、図3で説明したスロット値属性A、同じく図3で説明したスロット値属性Bを取得する場合を表している。
【0100】
図16の左側はメイン対話の遷移系列であり、その右側はアシスト対話の遷移系列である。
【0101】
アシスト対話の遷移系列で取得されたフレームデータ(スロット値属性A、スロット値属性B)を、メイン対話のフレーム処理におけるフレームデータとして利用するものである。
【0102】
図17および図18の見方は上記の図16の見方と同様である。
【0103】
図19は本発明に係る第5の態様の動作を表すフローチャート(その1)であり、
図20は同フローチャート(その2)である。
【0104】
この第5の態様の特徴は、前述した図12〜図18の態様において、フレームをなす複数のスロットのうち、対話データで埋められたスロットのみについて、その埋められた対話データを保持することを特徴とするものである。
【0105】
これにより、図12〜図18の態様により得られる、対話データの使いまわしにより、対話データベース15のメモリ量を削減する、という効果がより一層顕著なものとなる。
【0106】
図19および図20を参照すると、まず図19において、ステップS31、S32、S33およびS35は、前述した図12および図13で示した同一番号のステップと同様である。
【0107】
次に図20において、ステップS34およびS36は、前述した図13で示した同一番号のステップと同様である。したがってステップS51およびS52が第5の態様において注目すべきステップである。ただしステップS52については図9に示したステップS27と同様である。
【0108】
このステップS51では、フレームをなす複数のスロットのうち、対話データで埋められたスロットのみについて、その埋められた対話データを、対話データベース15内に保持しておく。
【0109】
なお本第5の態様以前の各態様のもとでは、図3に示すフレームデータ構造のフレームを構成する全てのスロットを、そのスロットが空であると否とを問わず、保持するようにしている。
【0110】
しかし第5の態様では、上記ステップS51に示すごとく、スロット値(値1、値2等)の結果と属性のみを保持することとする。例えば、スロットを埋めている「兵庫県」と「目的地設定」をそれぞれ示すデータのみを保持するようにする。
【0111】
これにより前述のように、メモリ量は一層削減可能となる。
【0112】
図21は本発明に係る第6、第7および第8の態様の動作を表すフローチャート(その1)であり、
図22は同フローチャート(その2)である。
【0113】
まず第6の態様について説明すると、この第6の態様は、遷移先の第2の対話またはアシスト対話でのフレーム処理においてスロットに埋めるべき対話データと、前述の保持している対話データとが一致するか否か判断し、一致すると判断したときは、その保持している対話データを用いて当該スロットを埋めることを特徴とするものである。「保持している対話データ」とは、図13のステップS37や図14のステップS43で保持するデータのことである。
【0114】
図21および図22を参照するとこの第6の態様は、ステップS61→S62→S63→S64で表される。
【0115】
上述の図13と図14では、それぞれ、ステップS38とS44で終了するように表しているが、ここで説明する第6(および第7、第8)の態様は、これらステップS38やS44以降についての態様である。つまり図21のステップS61から処理が開始する。
【0116】
ステップS62では、遷移先のフレーム処理でスロットに埋めるべき対話データ、例えばスロット値属性1A,1B,2A,2B…(図3参照)と、上記の保持している対話データ(この例ではスロット値属性1A,1B,2A,2B…)とが一致するか否か判断する。
【0117】
一致していれば、ステップS63にて、その一致したスロットの内容で、遷移先でのフレームにおける該当スロットを埋める。
【0118】
このようにしてスロットが埋まったフレームのフレームパターンをもってフレーム参照テーブル23(図5)を参照し、次の遷移先の対話ID/対話状態IDを検索して、対話をさらに先に進めていく。これが図22のステップS64である。
【0119】
これにより第6の態様においても、対話データの使いまわしによるメモリ量の削減効果が得られる。
【0120】
続いて、図21および図22を参照して、第7の態様を説明する。
【0121】
第7の態様は、既述した遷移先の第2の対話またはアシスト対話でのフレーム処理においてスロットに埋めるべき対話データと、上述の保持している対話データとが一致するか否か判断し、一致しないと判断したとき、かつ、当該遷移先の現状のフレーム処理がフレーム処理開始から既に進んでいると判断したときは、そこから元に戻って対話データの逆検索を実行することを特徴とするものである。
【0122】
図21を参照すると、前記ステップS62の判断結果がNoすなわち不一致であると、まずステップS63′において現状の対話ID/対話状態IDがどうなっているか判断する。この判断をもとに図22のステップS65に移る。
【0123】
このステップS65では、当該遷移先の現状のフレーム処理がフレーム処理を開始する状態にあるか否か判断する。
【0124】
第7の態様は、このステップS65とこれに続くステップS67に特徴がある。好ましくはステップS66を取り入れる。ステップS65の判断結果がYes、すなわち現状のフレーム処理がフレーム処理の開始であれば、該ステップS66に移り、前述した保持している対話データをクリアしてしまう。改めてフレーム処理を開始するので、保持していた対話データは不要となるからである。
【0125】
一方、上記ステップS65の判断結果がNo、すなわち現状のフレーム処理はフレーム処理開始から既に進んでいるときは、既にスロット群に所要の対話データが埋まっているから、そこから元に戻ってフレームデータの逆検索を行う。ここまでが第7の態様である。
【0126】
次に第8の態様が開始する。この第8の態様は、上記の逆検索を実行し(ステップS67)、そこで得た対話データを用いて、既述の第1の対話またはメイン対話でのフレーム処理におけるスロットを埋める(ステップS68)ことを特徴とするものである。
【0127】
図22を参照すると、この第8の態様はステップS68→S69→S64(前出)により表される。
【0128】
かくして得たフレームパターンについてフレーム参照テーブル23により遷移先の対話ID/対話状態IDを検索し、第1の態様等と同様にさらに対話を進める。
【0129】
これにより、第7および第8の態様もまた、メモリ量の削減という効果をもたらす。
【0130】
図23は本発明に係る第9の態様の動作を示すフローチャートである。
【0131】
この第9の態様は、遷移先の対話の種類が遷移前の対話の種類と同一のときは、この遷移前の対話でのフレーム処理で生成したフレーム内の対話データを全てクリアしてから、再度この遷移前の対話でのフレーム処理を実行することを特徴とするものである。
【0132】
図23において、ステップS71では、遷移先の対話が遷移前の対話と同一か否か判断する。
【0133】
同一ならば(Yes)、ステップS72に移って、その遷移前のフレーム処理で埋めたスロットの内容を全てクリアする。
【0134】
その後、再度、その遷移前のフレーム処理を初めから行う。
【0135】
もし上記遷移前におけるフレームのスロットのデータを残したままにしておくと、この埋まったままのフレームで特定されるフレームパターン(図5のフレームパターン1,2…)を別途用意しなければならなくなるからである。
【0136】
したがって第9の態様によれば、同一形式のデータを繰り返し持つ必要がなくなり、メモリ量の削減という効果がもたらされる。
【0137】
図24は第9の態様が利用される対話モデルの一例を示す図である。
【0138】
これはナビゲーションにおけるある対話S−5を取り出したものである。
【0139】
S−5:5に対するユーザの返事が「はい」であるので、また、同じ対話S−5に戻る。この戻ったときに、S−5:2とS−5:4の「いいえ」とS−5:6「はい」を共にクリアする。
【0140】
図25は本発明に係る第10の態様の動作を表すフローチャートである。
【0141】
この第10の態様は、フレーム参照テーブル23によって特定された対話の遷移先の指示内容が、当該対話システム10が連係するアプリケーション13に応じて分岐すべきことを表しているとき、直前まで進行していた対話処理を一旦終了して、このアプリケーション13から対話開始の命令と共に指示される遷移先にて対話処理を継続することを特徴とするものである。
【0142】
図25を参照すると、ステップS81では、上記の対話の遷移先の指示内容が特定の制御コード、すなわちアプリケーション(アプリとも称す)によって遷移先を決めるべきことを表すコードであると(Yes)、ステップS83へ移る。この制御コードは、拡張領域26(図11)に記述しておくことができる。
【0143】
なお特定の制御コードでなければ(No)、ステップS82に移り、前述した通常処理を行う。
【0144】
特定の制御コードが記述されているときはステップS83に移り、一旦対話処理を終了する。このときは“対話終了”のAPI(Application Interface)が呼び出される。
【0145】
そしてステップS84にて、アプリケーションから対話開始の命令が出されるのを待つ。
【0146】
この対話開始命令が出ると、ステップS85にて、この命令と共に送られる対話ID/対話状態ID(遷移先の指定データ)で定まる対話から対話処理を開始する。
【0147】
このように、第10の態様によれば、様々な対話状態を指示するアプリケーションが自ら指示を出すので、対話データベース15に格納すべきデータのデータ量を大幅に減少させることができる。
【0148】
図26は第10の態様が適用される対話モデルの一例を示す図である。
【0149】
本図は、アプリケーションの指示に従って遷移先が分岐する様子を示している。
【0150】
図27は本発明に係る第11の態様の動作を表すフローチャートである。
【0151】
この第11の態様は、一連のスロット(図3のフレームデータ領域22)の一部を、当該対話システムが連係するアプリケーション13への要求に基づいて該アプリケーション13から提供される対話データによって埋めることを特徴とするものである。
【0152】
従来のナビゲーション装置においては、対話データの入力を、音声ではなく、操作パネルの操作スイッチ(図1の右上のSW参照)で行うときは、一連の操作が終了するまで全てその操作スイッチによらなければ対話を行うことができなかった。
【0153】
ところがこの第11の態様によれば、アプリケーションに従ってスイッチ操作で得られた対話データ、例えばU:「兵庫県」やU:「神戸市」が存在していれば、これをアプリケーション13側に要求し該アプリケーション13から受け取るようにする。
【0154】
これにより、スイッチ操作で得た対話データも対話遷移制御手段21にて管理することができ、対話設計の柔軟性が高まる。
【0155】
図27を参照すると、ステップS91で、アプリケーション13から“対話開始”の命令が出されると、
ステップS92で、その命令と共に出力される遷移先の指定データを分析し、操作の途中から対話を開始するのか否か判断する。
【0156】
ステップS93では、ステップS92の判断結果がNoであると、現在の対話状態に至るまでにまだ埋まっていないスロットを埋めるのに必要な値を、アプリケーション13に対して要求し、
ステップS94で、上記の必要な値を該当スロットに埋める。
【0157】
ステップS95では、入手済みの値で埋め切ったフレームデータのフレームパターンがフレーム参照テーブル23に存在するか否か判断し、存在すれば
ステップS96にて、対話を続行する。
【0158】
図28は本発明に係る第12の態様の動作を表すフローチャートである。
【0159】
この第12の態様は、ある対話状態Sを経て音声合成部16が起動されてユーザに案内を行っている途中で、当該対話システム10が連係するアプリケーション13に割り込みが生じた場合、対話遷移制御手段21は、該アプリケーション13によりその対話状態Sに戻れという命令を受けて遷移先をその対話状態Sに特定することを特徴とするものである。
【0160】
この場合、その対話状態Sで蓄積したフレームデータはクリアしておくのが好ましい。
【0161】
このように状態遷移の制御の一部を、アプリケーション13側に移すことにより、対話エンジン(対話遷移制御手段21)の負荷を軽くすることができる、という効果がもたらされる。すなわち、戻れというフレームデータ(スロット)を用意する必要がない。
【0162】
図28を参照すると、
ステップS101で、対話エンジン12は、アプリケーション13に割り込みが発生したか判断する。一例を挙げると、音声認識処理部11において誤認識が行われたことが判明したような場合に、その割り込みが発生する。そうすると、ステップS102において、前の対話に戻れという命令が出されているか判断する。出されていれば、
ステップS103において、対話遷移制御手段21は、上記の誤認識に至った対話をなすフレームに戻り、フレームを再構築する。
【0163】
図29は本発明に係る第13の態様を表す図である。
【0164】
この第13の態様は、図2の構成にグローバル発話専用フレームメモリ31を付加した構成を有する。
【0165】
以上述べてきたいろいろな対話の中で、いずれの対話においても必ず共通する発話が存在する。これがグローバル発話である。いくつかの例を挙げてみると、“戻る”、“認識エラー”、“中止”、“一旦停止”、“誤認識”、“ヘルプ”等々に起因してユーザから入力される発話である。
【0166】
このような発話も含めて、フレームデータ領域22およびフレーム参照テーブル23を形成すると、そのデータサイズは大となってしまう。したがってメモリ量が増大してしまう。また既述したメンテナンスも難しくなる。
【0167】
そこで第13の態様は、上記のグローバル発話のみを専用に記憶するグローバル発話メモリ31を設けることを特徴とするものである。
【0168】
かくして、メモリ量の削減とメンテナンスの向上を可能とする、という効果を得ることができる。
【0169】
【発明の効果】
以上説明したように本発明によれば、全ての対話をフレーム処理で実現可能とし、これにより対話設計の自由度、柔軟性ならびに簡易性を向上させた対話システムを実現することができる。
【図面の簡単な説明】
【図1】本発明が適用される対話システムの一構成例を示す図である。
【図2】本発明の主要部を表す図である。
【図3】図2のフレームデータ領域22の詳細例を示す図である。
【図4】対話IDと対話状態IDの一例を示す図である。
【図5】図2のフレーム参照テーブル23の詳細例を示す図である。
【図6】図5のフレームパターンの検索の仕方を図解的に表す図である。
【図7】本発明に係る第1の態様の動作を表すフローチャートである。
【図8】(a)および(b)は第1の態様に従う対話モデルの簡単な2例を示す遷移図である。
【図9】本発明に係る第2の態様の動作を表すフローチャートである。
【図10】第2の態様に従う対話モデルの一例を示す遷移図である。
【図11】本発明に係る第3の態様の動作を表す図である。
【図12】本発明に係る第4の態様の動作を表すフローチャート(その1)である。
【図13】本発明に係る第4の態様の動作を表すフローチャート(その2)である。
【図14】本発明に係る第4の態様の特例についての動作を表すフローチャート(その1)である。
【図15】本発明に係る第4の態様の特例についての動作を表すフローチャート(その2)である。
【図16】第4の態様の特例における対話モデル例Iを示す遷移図である。
【図17】第4の態様の特例における対話モデル例IIを示す遷移図である。
【図18】第4の態様の特例における対話モデル例III を示す遷移図である。
【図19】本発明に係る第5の態様の動作を表すフローチャート(その1)である。
【図20】本発明に係る第5の態様の動作を表すフローチャート(その2)である。
【図21】本発明に係る第6、第7および第8の態様の動作を表すフローチャート(その1)である。
【図22】本発明に係る第6、第7および第8の態様の動作を表すフローチャート(その1)である。
【図23】本発明に係る第9の態様の動作を表すフローチャートである。
【図24】第9の態様が利用される対話モデルの一例を示す図である。
【図25】本発明に係る第10の態様の動作を表すフローチャートである。
【図26】第10の態様が利用される対話モデルの一例を示す図である。
【図27】本発明に係る第11の態様の動作を表すフローチャートである。
【図28】本発明に係る第12の態様の動作を表すフローチャートである。
【図29】本発明に係る第13の態様の動作を表す図である。
【符号の説明】
10…対話システム
11…音声認識処理部
12…対話エンジン
13…アプリケーション
14…認識辞書
15…対話データベース
16…音声合成部
17…GUI制御部
18…ディスプレイ
21…対話遷移制御手段
22…フレームデータ領域
23…フレーム参照テーブル
25…遷移先ID領域
26…拡張領域
31…グローバル発話専用メモリ

Claims (7)

  1. ユーザからの発声の内容を認識する音声認識処理部と、その認識結果に応じてアプリケーションに従いユーザへの案内を生成する対話エンジンと、その生成された案内の内容を音声として合成してユーザに提供する音声合成部と、前記案内を生成するために前記対話エンジンと協働する対話データベースと、を少なくとも備えてなる対話システムにおいて、
    対話を構成するフレームをなす一連のスロットの各々にそれぞれ対応する対話データを、該当のスロットに埋めていくためのフレームデータ領域と、該フレームデータ領域内に埋められた前記対話データの埋まり具合によって定まる複数のフレームパターンのそれぞれに対応する対話の遷移先を該フレームパターン毎に定義したフレーム参照テーブルと、を前記対話データベース内に構築し、
    前記フレームデータ領域と前記フレーム参照テーブルとを用いて、前記対話データの埋まり具合に応じた対話の遷移先を特定する対話遷移制御手段を、前記対話エンジン内に形成し、
    第1の対話についてフレーム処理をしている途中で第2の対話に遷移するとき、該第1の対話において前記スロットに埋めた前記対話データをそのまま保持し、かつ、該第2の対話でのフレーム処理にてスロットに埋めるべき対話データのうち、前記の保持している対話データと重複するものについては、当該保持データを流用し、ここに、進行中の対話がどのようなジャンルの対話を行っているかを特定する対話IDは、前記第1の対話と第2の対話とで異なることを特徴とする対話システム。
  2. ユーザからの発声の内容を認識する音声認識処理部と、その認識結果に応じてアプリケーションに従いユーザへの案内を生成する対話エンジンと、その生成された案内の内容を音声として合成してユーザに提供する音声合成部と、前記案内を生成するために前記対話エンジンと協働する対話データベースと、を少なくとも備えてなる対話システムにおいて、
    対話を構成するフレームをなす一連のスロットの各々にそれぞれ対応する対話データを、該当のスロットに埋めていくためのフレームデータ領域と、該フレームデータ領域内に埋められた前記対話データの埋まり具合によって定まる複数のフレームパターンのそれぞれに対応する対話の遷移先を該フレームパターン毎に定義したフレーム参照テーブルと、を前記対話データベース内に構築し、
    前記フレームデータ領域と前記フレーム参照テーブルとを用いて、前記対話データの埋まり具合に応じた対話の遷移先を特定する対話遷移制御手段を、前記対話エンジン内に形成し、
    メイン対話についてフレーム処理をしている途中で、前記音声認識処理部が、ユーザに対するアシストが必要であるものと判定し、これによりアシスト対話に遷移するとき、該メイン対話において前記スロットに埋めた前記対話データをそのまま保持し、かつ、該アシスト対話でのフレーム処理にてスロットに埋めるべき対話データのうち、前記の保持している対話データと重複するものについては、当該保持データを流用することを特徴とする対話システム。
  3. 遷移先の対話の種類が遷移前の対話の種類と同一のときは、該遷移前の対話でのフレーム処理で生成したフレーム内の対話データを全てクリアしてから再度該遷移前の対話でのフレーム処理を実行することを特徴とする請求項1または2に記載の対話システム。
  4. 前記フレームをなす複数の前記スロットのうち、前記対話データで埋められたスロットのみについて、その埋められた対話データを保持することを特徴とする請求項またはに記載の対話システム。
  5. 遷移先の前記第2の対話またはアシスト対話でのフレーム処理において前記スロットに埋めるべき対話データと、前記の保持している対話データとが一致するか否か判断し、一致すると判断したときは、その保持している対話データを用いて当該スロットを埋めることを特徴とする請求項またはに記載の対話システム。
  6. 遷移先の前記第2の対話またはアシスト対話でのフレーム処理において前記スロットに埋めるべき対話データと、前記の保持している対話データとが一致するか否か判断し、一致しないと判断したとき、かつ、当該遷移先の現状のフレーム処理がフレーム処理開始から既に進んでいると判断したときは、そこから元に戻って対話データの逆検索を実行することを特徴とする請求項またはに記載の対話システム。
  7. 前記逆検索を実行しそこで得た対話データを用いて、前記第1の対話またはメイン対話でのフレーム処理におけるスロットを埋めることを特徴とする請求項に記載の対話システム。
JP2001244617A 2001-08-10 2001-08-10 対話システム Expired - Fee Related JP3998443B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001244617A JP3998443B2 (ja) 2001-08-10 2001-08-10 対話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001244617A JP3998443B2 (ja) 2001-08-10 2001-08-10 対話システム

Publications (2)

Publication Number Publication Date
JP2003058187A JP2003058187A (ja) 2003-02-28
JP3998443B2 true JP3998443B2 (ja) 2007-10-24

Family

ID=19074520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001244617A Expired - Fee Related JP3998443B2 (ja) 2001-08-10 2001-08-10 対話システム

Country Status (1)

Country Link
JP (1) JP3998443B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018021987A (ja) * 2016-08-02 2018-02-08 ユニロボット株式会社 会話処理装置、及びプログラム
CN111128121B (zh) * 2019-12-20 2021-04-30 贝壳找房(北京)科技有限公司 语音信息生成方法和装置、电子设备和存储介质

Also Published As

Publication number Publication date
JP2003058187A (ja) 2003-02-28

Similar Documents

Publication Publication Date Title
JP4090040B2 (ja) 双方主導マルチモーダル対話及び関連ブラウジング機構を作成するための方法及びシステム
US6243675B1 (en) System and method capable of automatically switching information output format
KR101709187B1 (ko) 계층적 대화 태스크 라이브러리를 이용한 이중 대화관리 기반 음성대화시스템
US8495562B2 (en) System and method to graphically facilitate speech enabled user interfaces
JP2001296943A (ja) 対話型ユーザインターフェース装置
JP3178426B2 (ja) 自然言語対話システム及び自然言語対話プログラム記録媒体
US20080255838A1 (en) Audible presentation and verbal interaction of html-like form constructs
JP2008203559A (ja) 対話装置及び方法
US20110258543A1 (en) Dialog system
CN106030701A (zh) 用于通过语音对话装置检测至少两个具有待关联信息内容的待检测信息的方法、语音对话装置以及机动车
JP2007079397A (ja) 対話方法、対話装置、対話プログラムおよび記録媒体
JP4694198B2 (ja) 対話装置、対話方法、対話プログラムおよびコンピュータに読み取り可能な記録媒体
JP3998443B2 (ja) 対話システム
JP2006155086A (ja) ユーザインタフェース設計装置およびその制御方法
JP2007193422A (ja) 対話型の情報処理システム、およびサービス・シナリオ用のヘルプ・シナリオを提供する方法
JP4585759B2 (ja) 音声合成装置、音声合成方法、プログラム、及び記録媒体
JP3615309B2 (ja) データ検索装置および方法、情報記憶媒体
JP3846896B2 (ja) 音声入力された複合名詞の検索装置、検索方法およびデータベース
JPH0844384A (ja) 連続単語音声認識装置
JPH07168691A (ja) 表示図形領域選択方式
JP3576511B2 (ja) 音声対話装置
JP4535804B2 (ja) 音声対話シーケンス状態表記方法、プログラム、および音声対話装置
JP3755941B2 (ja) 音声対話装置及び対話方法
JP4056546B2 (ja) 音声入力された複合名詞の検索装置、検索方法およびデータベース
JP4682322B2 (ja) 対話情報処理装置及び対話情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070309

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070510

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070807

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110817

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees