JP2003501754A - 目標達成志向会話の表現と推論 - Google Patents
目標達成志向会話の表現と推論Info
- Publication number
- JP2003501754A JP2003501754A JP2001502062A JP2001502062A JP2003501754A JP 2003501754 A JP2003501754 A JP 2003501754A JP 2001502062 A JP2001502062 A JP 2001502062A JP 2001502062 A JP2001502062 A JP 2001502062A JP 2003501754 A JP2003501754 A JP 2003501754A
- Authority
- JP
- Japan
- Prior art keywords
- level
- information
- user
- goal
- inference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 100
- 238000004458 analytical method Methods 0.000 claims abstract description 57
- 230000009471 action Effects 0.000 claims abstract description 54
- 230000007246 mechanism Effects 0.000 claims abstract description 12
- 230000003993 interaction Effects 0.000 claims description 35
- 238000013459 approach Methods 0.000 claims description 18
- 238000012790 confirmation Methods 0.000 claims description 14
- 230000008901 benefit Effects 0.000 claims description 12
- 230000002547 anomalous effect Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 abstract description 7
- 230000000007 visual effect Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 230000001755 vocal effect Effects 0.000 description 7
- 238000007476 Maximum Likelihood Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 230000006855 networking Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000009916 joint effect Effects 0.000 description 3
- 230000005055 memory storage Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000007727 cost benefit analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000009474 immediate action Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 206010013710 Drug interaction Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Image Analysis (AREA)
- Communication Control (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
- Peptides Or Proteins (AREA)
Abstract
Description
raction) に関し、さらに具体的には、会話とも呼ばれることがある、コンピュ
ータと人間との間の対話であって、不確実性(uncertainty)の下にあるユーザ
の目標を言語的情報と非言語的情報の両方から推論し、前記不確実性を解決する
ために収集される最も重要な情報を計算し、タスク抽象階層を進むべきか、後退
すべきかの意思決定を行う方法とタスク抽象階層とを併用することによって達成
される対話に関する。
に順応するのではなく、ユーザがコンピュータの特異性に順応することが中心に
なっていた。例えば、非コンピュータとの対話(人間と人間との対話など)では
、ユーザは、言葉のシグナル (verbal signal) と非言葉のシグナル (nonverbal
signal) を組み合わせて通信しているのが代表的であるの対し、コンピュータ
とユーザとの対話では、そのようなことは行われないのが一般的である。むしろ
、ユーザは、制限付き音声入力 (constrained voice input)、キーボードからの
テキスト入力、マウスから入力をポインティングし、移動し、クリックするとい
ったように、コンピュータに理解しやすい形で情報をコンピュータに情報を入力
することが強要されている。その結果、コンピュータとユーザとの対話にはこの
ような不自然さがあるため、コンピュータを使い易くし、日常生活の直観的な一
部にしようとする努力の妨げとなっている。
ニケーションの基礎となっており、そこでは、各々の人間は独自の要求、目標お
よび情報をもっている。対話は、情報を獲得し、共有し、あるいは批判すること
を意図して、および要求を表明したり、サービスを要求したりするために開始さ
れるのが代表的である。一般的に、不確実性の下で情報を収集し、意思決定する
ことは、対話では中心的役割を果たしている。このことは、コンピュータとユー
ザとの対話で、より自然なコンピュータとユーザとの対話を達成するのを困難に
している理由の1つになっている。
複雑にしている。むしろ、一方の当事者に関する情報のタイプとしては、他方の
当事者に対話でどのように反応させるかを指示できるものが他にもある。例えば
、ある人の外観、挙動、空間的形状、および小道具 (props)(つまり、搬送アイ
テム)は、対話をどのように進めるべきかを判断するとき、すべてが考慮される
ことがある。しかし、一般的には、対話を通したコンピュータとユーザとの対話
に関係する従来技術は、ユーザに関する非言語的情報が中心になっていなかった
。また、コンピュータシステムとの大部分の対話では、不確実性に関して対話で
議論することも、質問を通して、あるいは情報収集の指示を通して追加情報の増
分的問い合わせ (incremental inquiry) を行ってさまざまな情報ソースを調べ
ることもできず、この情報ソースの中には、自然言語理解システムを使用して発
言の自動化構文解析で認識される区別、発言の中に現れるワードやフレーズ、お
よびさまざまな音響的キューと視覚的キュー (cue) などが含まれている。
然にするための、改良された対話型コンピュータとユーザとの対話が望まれてい
る。本発明が必要とされているのは、上記理由とその他の理由によるものである
。
用してコンピュータとユーザとの対話を行うことに関し、このタスク抽象階層は
、いくつかの異なる精細レベルに編成され、ユーザの目標に関するダイアログ(
対話)に参加するようにしている。一実施形態における、コンピュータ実行の方
法によれば、抽象階層のカレントレベルにあるユーザの目標(つまり、ユーザ側
から見たときのコンピュータとユーザとの対話の目的)に関する情報を受取りし
、あるいは情報に関する照会を積極的に行って、目標を評価し、精細化するよう
にしている。この方法によれば、受け取った情報が十分であるかどうかは、例え
ば、すでに収集された情報から確率的推論 (probabilistic inference) を行っ
て、ユーザの代替目標(alternate goal)に確率を割り当て、情報価値解析 (va
lue-of-information analysis) を行って新しい情報を獲得することによって判
断されている。受け取った情報が不十分であれば、追加情報がユーザから受取り
され、推論が行われ、十分であるかどうかが再び評価されるが、その評価は、ユ
ーザの目標に関する1つまたは2つ以上の、先行仮説 (leading hypotheses) に
割り当てられた確率の判定解析的評価 (decision-analytic assessment) が中心
になっている。カレント情報を使用した判定解析的評価に応じて、システムは追
加情報を獲得することを求め、カレントレベルで表された精度にある目標を仮定
し、そのあとで階層内の次の精細レベルにある、より具体的な目標の解析へ進む
ことも、あるいはユーザから目標の確認を求めてから、次の解析レベルへ移るよ
うにすることも可能になっている。各レベルでの代替目標の確率は、一実施形態
では、ベイズネットワーク (Bayesian network) によって判断される。この実施
形態では、先行確率 (leading probability) をもつ目標は、その判断を行うた
めに使用される。最高確率のサブ目標 (sub-goal) が、前進 (progression) の
コストと利益を考慮する判定解析によって判断された前進しきい値 (progressio
n threshold) を超えていれば、そのサブ目標へ進められる。すなわち、カレン
トレベルは後続レベルへ進められ、情報解析と獲得がこの新レベルで再び開始さ
れる。
の目標をいくつかの層に分解すると、徐々に精細度を増しながら、共有理解(sh
ared understanding)に向かう自然収束経路 (path of natural convergence)
上を、対話を導いていくことが可能になる。レベルを複数にすると、各レベルで
の不確実性に関する共通基礎を確立することが可能になり、また、特定レベルで
の理解または誤解に関して対話を行ってから、次レベルへ進むようにすることも
可能になる。収集される情報としては、言語的情報のほかに、ユーザに関する可
視的情報のような、非言語的情報がある。
タ読取可能媒体、およびコンピュータ化システムがあり、これらは種々態様に変
形することが可能である。本発明の他の実施形態、利点および側面は、図面を参
照して下述する「詳細説明」の中で明らかにする。
実施形態について詳しく説明するが、図示の実施形態は、本発明が実施されると
きの特定実施形態を例示したものである。これらの実施形態は、この分野の精通
者が本発明を実施することを可能にする程度に詳しく説明されているが、当然に
理解されるように、他の実施形態を利用することも可能であり、また、本発明の
精神と範囲から逸脱しない限り、論理的、機械的、電気的および他の変更を行う
ことも可能である。従って、以下の詳細説明は、限定的なものではなく、本発明
の範囲は特許請求の範囲によってのみ解釈されるものである。
レーション(操作、演算)をアルゴリズムとシンボルで表して示されている部分
がある。これらのアルゴリズムの説明と表現は、データ処理分野の精通者が使用
すると、作業の内容を他の精通者に最も効果的に伝えることができる手段となる
ものである。アルゴリズムとは、本明細書においても、一般的にも、所望の結果
に導く、それ自身が統一されたステップのシーケンスであると考えられている。
ステップとは、物理量の物理的操作を必要とするステップである。通常は、必ず
しもそうとは限らないが、これらの物理量は、ストアし、転送し、結合し、比較
し、その他の操作をすることができる電気的または磁気的シグナルの形体になっ
ている。
どで表すと、一般に広く使用されていることから、時には好都合であることが実
証されている。なお、ここで留意しておくべきことは、これらの用語と類似用語
は、該当する物理量と関連付けられるので、これらの物理量に付けられる便利な
ラベルにすぎないことである。以下の説明から明らかであるように、特に断りが
ない限り、本明細書全体を通して、処理する、コンピューティングする、計算す
る、判断する、表示する、といった用語を使用している説明個所はコンピュータ
システムのレジスタやメモリ内に物理(電子)量で表されているデータを操作し
て、コンピュータシステムのメモリやレジスタまたは他の情報ストレージ、伝送
またはディスプレイデバイス内に同じように物理量で表されている他のデータに
変換するコンピュータシステムまたは類似エレクトロニックコンピューティング
デバイスのアクションとプロセスのことを指している。
ドウェアと動作環境を示す図である。図1の記載は、本発明が実現されるときに
用いられる適当なコンピュータハードウェアの概要を要約して説明したものであ
る。必ずしもその必要はないが、本発明は、プログラムモジュールのように、パ
ーソナルコンピュータなどのコンピュータによって実行されるコンピュータ実行
可能命令という広い意味で説明されている。一般的に、プログラムモジュールと
しては、特定のタスクを実行し、あるいは特定の抽象データ型を実行している、
ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などがある
。
ータシステム構成で実施することも可能であり、その中には、ハンドヘルドデバ
イス、マイクロプロセッサシステム、マイクロプロセッサベースまたはプログラ
マブルコンシューマエレクトロニクス、ネットワークPC、ミニコンピュータ、メ
インフレームコンピュータなどが含まれている。また、本発明は、コミュニケー
ションネットワークを通してリンクされているリモート処理デバイスによってタ
スクが実行されるような、分散コンピューティング環境で実施することも可能で
ある。分散コンピューティング環境では、プログラムモジュールは、ローカルと
リモートのどちらのメモリストレージデバイスにも置いておくことが可能である
。
ュータ20の形体になった汎用コンピュータデバイスを含み、そこには、処理ユ
ニット21、システムメモリ22、およびシステムメモリを含む種々システムコ
ンポーネントを動作可能に処理ユニット21に結合しているシステムバス23が
含まれている。処理ユニット21は1つだけのこともあれば、2つ以上のことも
あり、コンピュータ20のプロセッサは、単一の中央処理ユニット (central-pr
ocessing unit CPU)、または並列処理環境と一般に呼ばれている複数の処理ユ
ニットを装備している。コンピュータ20は、従来のコンピュータ、分散コンピ
ュータ、または他のタイプのコンピュータにすることが可能であるが、本発明は
それだけに限定されるものではない。
り、その中には、種々のバスアーキテクチャのいずれかを採用しているメモリバ
スやメモリコントローラ、ペリフェラル(周辺)バス、およびローカルバスが含
まれている。システムメモリは単にメモリと呼ばれることもあり、その中には、
リードオンリメモリ (read only memory ROM) 24とランダムアクセスメモリ
(random access memory RAM) 25が含まれている。基本入出力システム (bas
ic input/output system BIOS) 26は、スタートアップ時のときのように、コ
ンピュータ20内のエレメント間で情報を転送するのを支援する基本ルーチンか
ら構成され、ROM 24に格納されている。コンピュータ20は、さらに、ハード
ディスク(図示せず)との間で読み書きするハードディスクドライブ27、取り
外し可能磁気ディスク29との間で読み書きする磁気ディスクドライブ28、お
よびCD-ROMや他の光メディアのような、取り外し可能光ディスク31との間で読
み書きする光ディスクドライブ30を装備している。
ドライブ30は、それぞれハードディスクドライブインタフェース32、磁気デ
ィスクドライブインタフェース33、および光ディスクドライブインタフェース
34を介してシステムバス23に接続されている。これらのドライブとそれぞれ
の関連コンピュータ読取可能媒体は不揮発性ストレージとして、コンピュータ2
0のためのコンピュータ読取可能命令、データ構造、プログラムモジュールおよ
び他のデータを格納している。この分野の精通者ならば理解されるように、磁気
カセット、フラッシュメモリカード、デジタルビデオディスク、ベルヌーイ (Be
rnoulli) カートリッジ、ランダムアクセスメモリ (RAM)、リードオンリメモリ
(ROM) などのように、コンピュータによってアクセス可能なデータを格納してお
くことができるものならば、どのタイプのコンピュータ読取可能媒体でも例示動
作環境で使用することが可能である。
ディスク31、ROM 24、またはRAM 25に格納しておくことが可能であり、そ
の中には、オペレーティングシステム35、1つまたは2つ以上のアプリケーシ
ョンプログラム36、他のプログラムモジュール37、およびプログラムデータ
38が含まれている。ユーザは、キーボード40やポインティングデバイス42
などの、入力デバイスを通してコマンドや情報をコンピュータ20に入力するこ
とができる。他の入力デバイス(図示せず)としては、マイクロホン、ジョイス
ティック、ゲームパッド、サテライトディッシュ、スキャナなどがある。上記お
よび他の入力デバイスは、システムバスに結合されたシリアルポートインタフェ
ース46を通して処理ユニット21に接続されていることがよくあるが、パラレ
ルポート、ゲームポート、またはユニバーサルシリアルバス (universal serial
bus USB) などの、他のインタフェースを介して接続することも可能である。
モニタ47や他のタイプのディスプレイデバイスも、ビデオアダプタ48などの
インタフェースを介してシステムバス23に接続されている。モニタのほかに、
コンピュータは、スピーカやプリンタなどの、他のペリフェラル(周辺)出力デ
バイス(図示せず)を実行しているのが代表的である。
のリモートコンピュータとの論理コネクションを使用するネットワーキング環境
で動作することができる。これらの論理コネクションは、コンピュータ20に結
合されたコミュニケーションデバイスまたはコンピュータ20の一部によって達
成されている。なお、本発明は、特定タイプのコミュニケーションデバイスに限
定されない。リモートコンピュータ49は、別のコンピュータ、サーバ、ルータ
、ネットワークPC、クライアント、ピア(peer)デバイスまたは他の共通ネット
ワークノードにすることが可能であり、図1にはメモリストレージデバイス50
だけが示されているが、コンピュータ20に関連して上述したエレメントの多く
または全部を含んでいるのが代表的である。図1に示す論理コネクションとして
は、ローカルエリアネットワーク (local area network LAN) 51と広域ネッ
トワーク (wide-area network WAN) 52がある。このようなネットワーキング
環境は、オフィスネットワーク、企業内コンピュータネットワーク (enterprise
-wide computer network)、イントラネット (intranet) およびインターネット
(the Internet) で普及しており、これらはいずれも一種のネットワークである
。
コミュニケーションデバイスであるネットワークインタフェースまたはアダプタ
53を通してローカルネットワーク51に接続されている。WANネットワーキン
グ環境で使用されるときは、コンピュータ20は、インターネットなどの広域ネ
ットワーク52上のコミュニケーションを確立するための、一種のコミュニケー
ションデバイスであるモデム54、または他のタイプのコミュニケーションデバ
イスを装備しているのが代表的である。モデム54は内蔵型と外付け型があり、
どちらも、シリアルポートインタフェース46を介してシステムバス23に接続
されている。ネットワーキング環境では、パーソナルコンピュータ20に関連し
て上述したプログラムモジュールまたはその一部は、リモートメモリストレージ
デバイスに格納しておくことができる。以上から理解されるように、図示のネッ
トワークコネクションは単なる例示であり、コンピュータ間のコミュニケーショ
ンを確立する他の手段やコミュニケーションデバイスを使用することも可能であ
る。
象階層を使用してユーザの目標を判断していくことによって、対話型コンピュー
タとユーザとの対話を実現する一般的概念が説明されている。本発明の少なくと
も一部の実施形態では、タスク抽象階層は、コンピュータとユーザとの改善され
た対話を達成する上で重要になっている。
ミュニケーションされる情報または目標の性質に関して継続的に推論し、意思決
定することである。不確実性の下にある情報収集と意思決定は、対話では中心的
役割を果たしている。不確実性の管理は、キーとなる不確実性を明確化する上で
、およびダイアログを該当の詳細レベルに導き、そこで情報をやりとりしたり、
質問をしたりする上で役立つと思われる、分析的な質問(discriminating quest
ions)を形成する際に重要になることがよくある。
は、ユーザとの対話における不確実性、特に共同活動 (joint activity) のコン
テキスト(なお、これに限定されない)における不確実性を、コンピュータで管
理するときに利用すると便利である。この共同活動は、参加者、セッティング(
情景)、および特に、各参加者が妥当であると考えている貢献の種類に制約のあ
る、タスク中心の社会的イベントである行動 (behavior) を説明するために、心
理言語学者によって使用されている用語である。共同活動における参加者は、作
業に関して共通の利益を共有しているものと想定しており、その中には、他の参
加者の想定された役割と責任が含まれている。例えば、受付係ドメイン(行動圏
) (receptionist domain) は、受付係が精通しているものと他の参加者が期待
しているタスクを、他の参加者のために手助けする共同活動である。受付係の主
要タスクは、他の参加者が活動で定義された目標を達成するのを、迅速かつ協力
的に手助けすることである。
きる、代表的なタスク抽象階層を示す図である。このタスク抽象階層200によ
ると、ユーザの目標を判断するという問題を、連続する詳細レベルで診断される
ように分解することができる。このように分解すると、最終的に、改善されたコ
ンピュータとユーザとの対話が得られることになる。
ように、いくつかのレベル0 . . kに分割されている。各レベルは、第1レベル
の目標204と目標206といったように、1つまたは2つ以上の目標をもって
いる。ゼロ番目レベル202は目標が最も抽象化されており、このことは、ユー
ザが階層200によってモデル化されたコンピュータとユーザとの対話コンテキ
ストにおいて、目標をもっていることを示している。あるレベルの各目標は、次
レベルで2つまたはそれ以上の目標になるように連続的に精細化され、あるレベ
ルになると、目標はこれ以上精細化できないようになっている。
抽象階層200をナビゲーションして行くと、ナビゲーションが行われているカ
レント抽象レベルに対して正しい情報が求められる仕方が得られるので、レベル
を下方に向かってナビゲーションして行くのに伴い、ユーザの目標に関するより
具体的な情報が、人間と人間との対話に矛盾しない形で求められることになる。
あるレベルでの情報収集は、レベル2での円形矢印208のように、図2に円形
矢印で示されている。
係側から見たとき、第1レベル目標(つまり、レベル1の目標1 . . n)には、
シャトル(定期往復運転の乗物)を呼んでキャンパスの別の部分に移動させる要
求、建物内に入る要求、なにかをピックアップする(持ち上げる)要求、なにか
をドロップする(降ろす)要求、指示を求める要求、情報に関する質問 (query)
に対して応答を求める要求、公共輸送を利用して通勤するときパスを求める要
求、ファックスを送信する要求、ポスタを貼る要求、ポスタを取り除く要求、な
どを含めることができる。本発明の一実施形態では、セットになった目標を網羅
的にするために、そのリストの中で明示的に考慮されていない目標のことを指す
ために、別の目標が使用されている。
に精細化されていることを示している。例えば、シャトルをキャンパスの別の部
分へ走行させることを要求する目標をレベル2で精細化することには、受付係ド
メイン側から見たとき、ある人についてはメインキャンパスロケーション(主構
内位置)へシャトルすること、ある人については予備的キャンパスロケーション
へシャトルすること、ある人については外部(オフサイト)ロケーションへシャ
トルすること、グループについてはメインキャンパスロケーションへシャトルす
ること、ある人については予備的キャンパスロケーションへシャトルすること、
グループについては外部(オフサイト)ロケーションへシャトルすること、など
を含めることができる。さらに、次レベルの目標、つまり、レベル3は、身体障
害者を運ぶといった特殊ケースの場合や、上級重役を急行シャトルで運ぶ場合に
、シャトルのタイプを追加指定することを考慮することができる。
詳細化させながら共用理解(shared understanding)に向かう自然収束経路上を
、対話を導いて行くことが可能になる。また、レベルを複数にすると、各レベル
での不確実性に関する共通基礎を確立すること、および特定レベルで理解または
誤解について対話してから次レベルへ進むようにすることも可能になる。ユーザ
に対しては、ユーザの目標に関する自然ダイアログの一部として、あるレベルで
の誤解を黙示的または明示的に確認または否認するように指示し、不確実性が減
少してから次レベルへ進むようにすることができる。また、分解を行うと、各レ
ベルで管理しやすくなるモデルに推論が集中されることになる。
くとも一部の実施形態では、ダイアログ(対話)は、コンピュータとユーザが協
力し合って各レベルでの目標を明確化する方法がとられており、これは、最も有
益な質問をするか、あるいはそのレベルで最も有用な非言語的証拠 (non-lingui
stic evidence) を収集し、そのレベルでの目標を確認することを試みることに
よって行われている。カレントレベルでの発言者の目標が確認されるか、強い確
信が得られると、システムはその証拠を次の詳細化された解析レベルへ渡し、そ
の次レベルでその確信を精細化することを試みることができる。これは、ユーザ
の目標について結論が得られるまで続けられる。
、タスク抽象階層がどのようにして構築されるか、つまり、目標がどのようにし
て他の目標に精細化されるかが説明されている。なお、本発明は、このセクショ
ンで説明している方法に限定されるものではない。
) ネットワークは、複数の情報クラスの関連性 (relevance) を1つに融合する
能力を備えている。そのために、発言(つまり、聴覚的または言語的情報)から
も、ビジュアル情報のような非聴覚的情報からも、ユーザの目標について推論す
ることが可能になっている。ベイズネットワークによると、入力情報がもっと抽
象化された目標(ただし、存在する場合)と共に与えられていれば、精細化され
た目標ごとにその確率を生成することが可能になっている。これらの確率にアク
セスすることにより、コンピュータは、情報価値の計算に基づいて質問をするこ
とに導くことが可能になる(これは、「詳細説明」の次のセクションに説明され
ている)。
るレベルに対して構築されている。望ましいことは、これらのネットワークが言
語的観察 (linguistic observations) と非言語的観察 (non-linguistic observ
ations) を考慮することである。非言語的観察によると、ユーザの外観、ロケー
ション、および移動軌跡 (trajectory of locomotion) に関するビジュアルフィ
ーチャ(視覚的特徴)といった、追加のコンテキスト情報が得られる(これらは
、例えば、大きな建物のフロントデスクでさまざまな人、質問、および要求に応
対する受付係がサービスする役割のドメインにおいて有用である)。
も一部の実施形態でコンピュータとユーザとの自然の対話を達成するための1つ
の側面は、コンピュータがユーザからの言語的観察にアクセスできることである
。ユーザからの発言は、構文(シンタックス)、長さ、および特徴が変化する可
能性がある。従って、「詳細説明」のこのセクションでは、本発明の一実施形に
従って言語的証拠にアクセスし、処理する方法が説明されている。
望の対話コンテキスト(例えば、上述した受付係ドメイン)における発言の中で
特定される。これらのワードとフレーズは、この分野ではメタニムス (metanyms
) として知られている。自動化自然言語処理 (natural language processing N
LP) を使用すると、シンタクティックな特徴とセマンティックな特徴などのよう
な、よりハイレベルの言語的抽象を、観察変数としてベイズモデルに導入するこ
とが可能になる。なお、本発明では、そうすることは必ずしも要件になっていな
い。NLPは、この分野では公知である。一実施形態では、使用されるNLPは、NLPw
inと呼ばれるシステムであり、これは、Microsoft Research Natural Language
Processing Groupによって開発されたものである。なお、本発明はそれだけに限
定されるものではない。
。すなわち、S. D. Richardson著「統計的処理をルールベース自然言語パーサに
ブートストラップする (Bootstrapping statistical processing into a rule-b
ased natural language parser)」(Proceedings of the Workshop on Combining
Symbolic and Statistical Approaches to Language, pages 96-103 (1994))
に説明されている。NLPwinは、さらに具体的には、George E. Heidorn著「イン
テリジェントライティングアシスタンス(Intelligent Writing Assistance)」(A
Handbook of Natural Language Processing Techniques (Marcel Dekker 1999)
(R. Dale他編集) (ISBN 0-8247-9000-6))、Karen Jensen、George E. Heidorn
およびStephen D. Richardson編集「自然言語処理:PLNLPアプローチ(Natural L
anguage Processing: The PLNLP Approach)」(Kluwer Academic Publishers, Bo
ston, 1993 (ISBN 0792392795))、さらに詳しくは、S. D. Richardson、Lucy Va
nderwende、William Dolan共著「自然言語解析のためのディクショナリベースと
例示ベースの方法の結合(Combining Dictionary-Based and Example-Based Meth
ods for Natural Language Analysis)」(MSR-TR-93-08, June 1993とS. D. Rich
ardson、William Dolan、Lucy Vanderwende共著「MindNet:テキストからのセマ
ンティック情報の獲得と構造化(MindNet: acquiring and structuring semantic
information from text)」(MSR-TR-98-23, May 29, 1998)。
、よりハイレベルな言語的抽象である、シンタクティック(構文上)、論理上、
およびセマンティック(意味論上)のキュー (cue:合図) を出力し、これらを
使用して目標を区別することを可能にしている。第1ステージでは、システムは
、入力された発言を個々のトークン(字句)にセグメント(区分)化し、その語
形構造によってワードを解析し、オンラインディクショナリ(辞書)でこれらの
ワード(語)を調べるが、このディクショナリの中には、特にマルチワードエン
トリ用に作り替えられたソース(情報源)が含まれている。第2ステージは、シ
ンタクティックスケッチ (syntactic sketch) とも呼ばれ、そこでは、システム
は、文法規則に基づいて発言をそのシンタクティックコンポーネント(構文成分
)に構文解析 (parse) する。第3ステージはシンタクティックポートレート (s
yntactic portrait) とも呼ばれ、そこでは、システムは、オンラインディクシ
ョナリの定義から派生された、コンパイル済み解析から抜き出されたセマンティ
ック関係 (semantic relation:意味関係、概念同士の論理関係) を使用して、
付加曖昧性 (attachment ambiguities) を解決する。最初の3ステージからは、
シンタクティックキューをもつベイズモデルが得られる。第4ステージでは、シ
ステムは、照応指示 (anaphoric reference) を解決し、発言の論理形体を構築
してから、深層主語 (deep subject) や深層間接目的語 (deep indirect object
) などの、機能的役割にセンテンスエレメント(文要素)を割り当てることによ
って述語項関係 (predicate-argument relation) をセマンティックグラフ(意
味グラフ)で表している。最後に、NLPwinは、発言の中のワードについて最も該
当する意味を、意味リストから判断することを試みて、セマンティックキューを
出力する。
value of information VOI)(これは情報の期待価値 (expected value of info
rmation - EVI) 解析としても表されている)を通した情報収集が説明されてい
る。例えば、情報が、このセクションで説明されているように、どのように収集
されるかは、すでに説明したように、図2に円形矢印で示すように表すことがで
きる。すなわち、このセクションで説明されている情報収集の仕方を利用すると
、図2を参照して説明したタスク抽象階層(task abstraction hierarchy)のカ
レントレベルで情報を取得することができる。
で最終的にとられるアクション(行動)の価値を向上することは、決定理論的診
断(または解析)では重要な側面となっている。情報価値 (VOI) 解析は、この
分野では公知であるように、タスク抽象階層 (task decomposition hierarchy)
の、あるレベルでの異なる目標またはサブ目標の推論確率に照らして、および情
報を収集するコストと、新情報があるときと無いときにアクションをとるときの
コストと利益に照らして、尋ねるべき最良質問および行うべき観察を特定するた
めに採用されている。すなわち、VOIによると、情報価値と不確実性の下で観察
を行うコストを考慮することにより、以前に観察されなかった証拠の異なる部分
を評価する期待有用性(expected utility)が得られる。VOIを計算するには、
行うことのできる観察ごとに、最良決定の期待有用性は、観察の対象となる各々
の値に関連付けられる。次に、解析では、各々の値の期待有用性が、観察が行わ
れると異なる値が現れる確率で重み付けされて総和される。
方法をフローチャートで示したものである。コンピュータ実行の方法は、望まし
くは、少なくともその一部が、コンピュータ上で実行される1つまたは2つ以上
のプログラムとして実現されている。すなわち、メモリなどのコンピュータ読取
可能媒体からコンピュータのプロセッサによって実行されるプログラムとして実
現されている。このプログラムは、望ましくは、フロッピディスクやCD-ROMなど
のマシン読取可能媒体に格納しておけば、別のコンピュータに配布し、インスト
ールしたあとで、そこで実行することが可能になる。
する推論が、現在利用可能な情報に基づいて行われる。304で、以前に未観察
であった証拠の追加部分を取得する期待有用性が、前述したように、その追加有
用性を取得する期待コストと共に判断される。証拠部分が無いため、その証拠部
分を受け取るコストが情報の有用性より小であれば、この方法は306へ進み、
そこで終了する。そうでなければ、この方法は308へ進み、最も有用な情報(
つまり、最大有用性をもつ証拠部分)が、例えば、ダイアログを通して収集され
る。次に、別の推論が302で行われ、プロセスは、追加の証拠部分を収集する
コストがその有用性よりも大になるまで繰り返される。従って、図3(a) の方法
は、可能な限り最良の情報を、VOI解析に基づいて収集するので、その情報を収
集する有用性がその収集コストよりも大でなければ、情報は収集されないという
利点がある。
る。アクションA*の即時アクションを表す値は、その期待有用性であり、これは
次式のように書くことができる。
ンAi の有用性であり、p(Hj|E) は、観察され、かつバックグラウンドの証拠Eの
カレント集合が与えられているときの、ユーザ目標Hj の確率である。従って、
別の観察ex が行われたときは、アクションA*' の新期待有用性は次のようにな
る。
る。従って、観察ex を行う次の価値は、その観察をもつアクションをとる期待
有用性から、その観察をもたないときアクションをとる期待有用性を差し引き、
さらに、観察を行うコストC(ex) を差し引いたもの、つまり、次の通りである。
するには、起こり得るあらゆる観察シーケンスを考慮する必要がある。しかるに
、貪欲算法による(greedy) VOIは、観察するのに次善の、単一の最良証拠部分を
計算することが中心になっているので、VOIを近似化するのに好都合であること
がよくあるため、本発明の一実施形態で利用することができる。もっと具体的に
は、情報理論的VOIを利用することで、観察するのに次善の言語的および非言語
的証拠を特定して、タスク抽象階層のカレントレベル内のカレント不確実性を解
決することができる。従って、貪欲算法によるVOI解析は、タスク抽象階層の各
レベル内で利用されて、質問をすることを制御し、非言語的証拠にアクセスする
ことについて決定を行っている。新観察が評価されるたびに、図3(a) の方法に
関連して説明したように、システムは、タスク階層のレベル内の個別目標または
サブ目標の確率を更新し(つまり、推論を行い)、VOIを再計算する。
待値を超えるまで、および/または行うべき観察がなくなるまで(これは、図3(
a) の方法では説明されていない)続けられ、さもなければ、もっとハイレベル
の決定理論的解析は、「詳細説明」の次のセクションで説明するように、システ
ムを次レベルへ進めることになる。
ression) と後退 (retreat) が、本発明の一実施形態によればどのように行われ
るかが説明されている。一特定実施形態では、その仕方は特定の方法と関連付け
て説明されており、そのフローチャートは図5に示されている。なお、本発明は
それだけに限定されるものではない。
な解析レベルで目標について推論し、質問をし、確認を行うために先に進むこと
が妥当な場合がある。例えば、対話の途中で、参加者の一人が、別の参加者の目
標について直接的確認を求めることがある。しかし、明示的に推論を行うと、コ
ストがかかることになる。対話の初期で不十分な推論を行うことは不自然であり
、ユーザは、対話しているエージェントは先走っているか、あるいは明らかな手
がかり(clue)を考慮していないと思うことになる。具体的には、対話を行って
いる人の相手側は、与えられた証拠から目標を理解しているのが代表的であるた
め、そのような状況で目標について直接的質問を行うと、コストが大になる。別
の方法として、エージェントは、情報収集したあとに続いて、代替目標の確率に
基づいて黙示的決定を行って、カレントレベルでの目標を想定することも可能で
ある。ここで誤った推論を行うと、ユーザはその決定について対話する機会を失
うことになるので、コストがかかることになる。
のレベル間のナビゲーションは、自然な方法で行われることになる。このコンピ
ュータ実行の方法は、望ましくは、その一部がコンピュータ上で実行される1つ
または2つ以上のプログラムとして実現されている。すなわち、メモリのような
コンピュータ読取可能媒体からコンピュータのプロセッサによって実行されるプ
ログラムとして実現されている。このプログラムは、望ましくは、フロッピディ
スクやCD-ROMなどのマシン読取可能媒体に格納しておけば、別のコンピュータに
配布し、インストールしたあとで、そこで実行することが可能になる。
の目標からスタートする。すなわち、カレントレベルは、階層の第1レベルにセ
ットされている。そのあと、502で、情報収集が行われる。すなわち、情報は
、タスク抽象階層のカレントレベルに関するものが受取りされ、コンピュータと
ユーザとの対話コンテキストにおけるユーザの目標が評価される。502で収集
された情報が十分であるかどうかも、評価される。不十分であれば、方法は50
2に留まって、追加情報を収集する。502は、一実施形態では、「詳細説明」
の前セクションで説明したように、情報価値解析によって行うことができる。
けに限定されるものではない。例えば、情報としては、テキスト情報、オーディ
オ情報、イメージ/ビデオ情報、またはその他の情報が可能である。情報の受取
りは、特にオーディオ情報(例えば、発言)のコンテキストでは、ユーザとやり
とりすることによって行われるのが代表的である。従って、本発明によれば、最
初にユーザに質問の形で(第2)情報を与え、そのあとこの情報に対する応答を
待ち、ダイアログ(対話)が行われるようにしている。本方法によって与えられ
る情報は、オーディオ情報(例えば、スピーチ)やイメージ/ビデオ情報(例え
ば、ディスプレイデバイス上のエージェントの挙動)にすることも、他の情報に
することも可能である。なお、本発明はそれだけに限定されるものではない。
に受取りされる情報(従って、そのレベルに関係する情報)は、階層の別の、よ
り詳細なレベルに関係していることもある。従って、本発明の少なくとも一部の
実施形態では、あるレベルのときに受取りされる情報は、すべてのレベルに利用
できるので、正しい判断が生成されることになる。
VOI) 解析のコンテキストでは、追加情報を取得する期待コストはその情報の期
待有用性よりも大であるので、一特定実施形態では、2つの推論確率が判断され
ることになるが、本発明はそのことだけに限定されるものではなく、これについ
ては、以下で詳しく説明する。一実施形態における推論確率は、ベイズネットワ
ークの使用によって生成される。
ように、ここで説明するように完全判定解析 (complete decision analysis) で
はなく、近似判定解析 (approximate decision analysis) が行われる。この解
析によると、最高確率をもつ目標に関する特殊確率の集合を考慮することによっ
て、アクションを導くことが可能になる。例えば、確率しきい値の集合は、アク
ションを導くように開発されており、そのアクションは、アクションをとるとき
のコストと利益を不確実性の下で考慮することによって導き出されようになって
いる。とられるアクションとしては、アクションをとる前に推量 (guess) を確
認すること、確認なしで前進すること、情報の収集を続けること、および後退し
て次に上位の解析レベルに戻ること、がある。このような確率しきい値が開発さ
れるときの仕方は、「メッセ−ジングとスケジューリングのための自動化サービ
スを指示するためのシステムと方法(Systems and Methods for Directing Autom
ated Services for Messaging and Scheduling)」という名称で、1999年4月20日
に出願され、係属中の特許出願第09/295,146号 [docket no. 1018.014US1](本
件出願人に譲渡済み)に記載されているアプローチに類似している。なお、この
特許出願の内容は、この分野の通常の知識を有する者ならば理解されるように、
引用により本明細書の一部に含まれている。すなわち、確率しきい値は、1999年
4月20日出願の特許出願に記載されているように、「インアクション(無活動)
」対「アクションに関するダイアログ」対「アクション」としてではなく、むし
ろ、「アクションをとる」対「アクションをとる前に確認」対「確認なしで前進
」対「情報収集の継続」対「後退して次の上位解析レベルに戻る」として判断さ
れる。
照して詳しく説明する。なお、この分野の通常の知識を有する者ならば理解され
るように、説明の便宜上、図3(b) のベイズネットワークには、どの情報入力(
つまり、言語的または非言語的観察)も示されていない。むしろ、精細化された
目標702、704および706(すなわち、目標1 . . . n)が精細度の低い
(つまり、抽象度の高い)目標700に従属することが示されているだけである
。
ると、それぞれの目標がユーザの実際の目標であるとする、推論確率ipが各目標
702、704および706に対して得られる。本発明の目的上、目標700が
与えられているときの推論確率p1は、目標1 . . . nに対応する推論確率ip1 . .
. ipnの最大値であると定義されている。推論確率ip1 . . . ipnは、初期推論
確率と呼ばれる。言い換えれば、抽象目標700が与えられているとき、最大尤
(maximum likelihood) をもつ精細化目標1 . . . nは、対応するipが最高であ
る精細化目標1 . . . nである。
この第2推論確率は、カレントレベルへ進んだのは誤りであり、その代わりに、
直前レベルへ戻るべきであるとする確率p2である。しかし、図3(b) のコンテキ
ストでは、リターン目標708はカレント目標700の別のサブ目標になってい
る。
して示されている。この目標には、サブ目標702、704および706のよう
に、n個のサブ目標があり、これらは、すべてがタスク抽象階層の次レベルに置
かれている。目標700には、リターンサブ目標708もあり、これはタスク抽
象階層の直前レベルに戻る目標である。サブ目標702、704および706の
各々は推論確率をもち、第1推論確率が最大尤をもつサブ目標の推論確率になる
ようになっている。従って、初期推論確率は各々のサブ目標について判断され、
第1推論確率は、最高確率をもつサブ目標の推論確率になっている。第2推論確
率は、リターンサブ目標708の推論確率になっている。
では、図3(b) を参照して上述したようにベイズネットワークによって行われる
。次に、506で(その後、510で)、第1推論確率は2つのしきい値、すな
わち、前進しきい値と推量しきい値と突き合わせて解析される。この2しきい値
は、それぞれ、p*前進しきい値およびp*推量しきい値と呼ぶことができる。
そのことは、確率が508でタスク抽象階層の次レベルへ前進するのを保証する
だけ十分に大であること、つまり、具体的には、カレントレベルの最大尤目標(
つまり、最高初期推論確率をもつ目標)で階層のカレントレベルを次レベルへ進
めることを意味している。そのあと、本方法は502へ戻り、その次レベルで情
報を収集する。
510へ進み、そこで、確率が抽象階層の次レベルへ進むのを保証するだけ十分
に大であるかどうかが判断されるが、これは、ユーザからの確認を得て行われる
。従って、次レベルへ進むことに関して、512でユーザとのダイアログに入る
ことになる。確認されていれば、本方法は514から508へ移って次レベルへ
進んだあと、本方法は502に戻って継続し、その新レベルで情報を収集する。
そうでなければ、本方法は516へ進む。
きい値のどちらよりも大でないか、あるいはp*推量しきい値よりも大であるが、
ユーザがレベル前進を確認しなかった場合である。そのあと、516で、直前レ
ベルに戻るべきか(後退すべきか)どうかが判断される。つまり、第2推論確率
がしきい値よりも大であれば(なお、このしきい値はp*リターンと呼ぶことがで
きる)、直前レベルは518に戻されるので、本方法は502に戻って、直前レ
ベルで情報を受取ることになる(一実施形態では、直前レベルに戻るとき、それ
に見合った謝罪 (apology) または弁明 (justification) が与えられるので、対
話の自然さが保たれることになる)。そうでなければ、本方法は502に戻り、
追加情報がカレントレベルで受取りされる。
これらのしきい値の相互関係を示している図4(a) と図4(b) を参照して説明す
ることにする。図4(a) では、例えば、マッピング400は、第1推論確率が左
から右へ向かって大きくなると、異なる領域402、404および406に入る
ようになっており、そこでは、これらの領域の境界は、p*推量408とp*前進4
10で示されている。従って、推論確率がp*推量408より小であれば、その確
率は領域402に置かれているので、本方法はカレントレベルに残っている。推
論確率がp*推量408よりも大であるが、p*前進410より小であれば、その確
率は領域404に置かれているので、次レベルへ進むべきかどうかに関してユー
ザとのダイアログに入ることになる。最後に、推論確率がp*前進410よりも大
であれば、その確率は領域406に置かれているので、自動的に次レベルへ進む
ことになる。
右へ向かって大きくなっていくと、その境界がp*リターン456で示されている
ように、異なる領域452と454に入っていく。従って、第2推論確率がp*リ
ターン456より小であれば、その確率は領域452に置かれているので、本方
法は同じレベルに留まっている。第2推論確率がp*リターン456よりも大であ
れば、その確率は領域454に置かれているので、本方法は直前レベル454に
戻ることになる(一実施形態では、直前レベルに戻るとき、それに見合う謝罪ま
たは弁明が与えられるので、対話の自然さが保たれることになる)。この分野の
通常の知識を有する者ならば理解されるように、図4(a)の3領域と同じように
、直前レベルへ戻ることに関してユーザとのダイアログのための第3領域を図4
(b) に追加することができ、同様に、図4(b) の2領域と同じように、図4(a)
のダイアログ領域を除去することも可能である。
定理論の使用によって求めることも可能である。つまり、これらのしきい値は、
文脈依存の (context-sensitive:文脈によって変化する)コスト計算によって求
めることが可能である。この計算で使用されるコストは、急いでいるユーザのよ
うな観察の関数にすることが可能であり、対話型ダイアログに関する観察の関数
にすることも可能であり、その中には、ユーザに行った質問の数などが含まれて
いる。例えば、ユーザの要求に関する質問が1つのときは、初期コストは少なく
て済むことになる。しかし、システムが同じ要求について複数の質問をする必要
があるときは、アクションをとるだけのときよりも、別の質問をすることの方が
コスト高になることがある。
設定する方法は、「メッセ−ジングとスケジューリングのための自動化サービス
を指示するためのシステムと方法(Systems and Methods for Directing Automat
ed Services for Messaging and Scheduling)」という名称で、1999年4月20日に
出願され、係属中の特許出願第09/295,146号 [docket no. 1018.014US1](本件
出願人に譲渡済み)に記載されているが、この出願の内容は引用により本明細書
の一部になっている。なお、本発明はそれだけに限定されるものではない。
(cost-benefit analysis)を行い、次の詳細レベルへ進むか、以前に調べたレベ
ルへ戻るか、の判断を行うことを、あるレベル内の推論確率に基づいて導いてい
く。この解析では、直接に前進するか、あるいは目標の確認を求める質問を行う
ことの期待値は、カレント解析レベルに留まって、VOIに基づいて情報収集を継
続することと対比させて考慮される。異なる対話結果の有用性が評価され、前進
のためのしきい値確率を計算するための近似判定解析が採用され、確認を求める
か、あるいは以前に通ったレベルに戻るようにしている。結果の有用性の考慮に
よる導出とは別に、このしきい値確率は直接に評価することができる。
ている。最高尤をもつ目標の確率がp*推量またはp*前進よりも大でなければ、シ
ステムはVOIを実行することを続け、目標に関する追加情報を収集する。VOIが非
正数になるか、あるいは行うべき観察が他になければ、システムは追加情報の要
求を発行する。カレントレベルでの最大尤目標がp*前進よりも大であれば、シス
テムは目標を想定し、次の詳細レベルへ移動する。最大尤がp*推量よりも大であ
るが、p*前進よりも大でなければ、システムは目標を確認するか、拒否するよう
にユーザに求める。目標が無効であるときっぱり拒否されると、ゼロの確率がそ
の目標に割り当てられ、残りの実現可能な目標に対する確率分布が再正規化され
る。戻るためのp*しきい値が使用されて、上位詳細レベルへリターンする決定が
行われる。レベル0より詳細化されたレベルで目標を明確化するベイズモデルに
は、リターン仮説 (return hypothesis) が含まれている。すべてのサブ目標の
確率が減少し、リターン仮説の尤がp*リターンよりも大になったときは、システ
ムは直前レベルにリターンする。このようなことが起こると、システムは誤解に
ついて謝罪し、直前レベルでVOIを続けるか、あるいはVOIが非正数であれば、追
加情報を要求する。
ための、より一般化された判定解析アプローチが説明されている。すなわち、前
のセクションでは、階層内のレベル間のナビゲーションは、推論確率を判断し、
これらの推論確率があるしきい値よりも大であるか、大でないかに基づいてアク
ションをとること(レベル間のナビゲーション)に関連して説明されていた。し
かし、この分野の通常の知識を有する者ならば理解されるように、これは、各結
果に関連する有用性の考慮が与えられているとき、不確実性の下で理想的アクシ
ョン(ideal action)の計算と呼ばれるものを具体化した1つの判定解析方法で
ある。すなわち、前のセクションでの説明は、ここで説明しようとするレベル間
のナビゲーションのための、より一般化されたアプローチを具体化した実施形態
である。
ての目標にわたる確率分布は、最初に、例えば、この分野では公知のようにベイ
ズネットワークの使用によって判断される。次に、確率分布に関連する最大期待
値のアクションが判断される。アクションA*の即時アクションの値はその期待有
用性であり、これは次式のように書くことができる。
し、u(Ai,Hj) はユーザが目標Hj をもつときの特定アクションAi の有用性であ
り、p(Hj|E) は観察され、かつバックグランドの証拠Eのカレントレベルが与え
られているときのユーザ目標Hjの確率である。A*は、上式のarg maxaをとると得
られる、最大期待有用性をもつアクションAであることを示すために使用されて
いる。
明されている、より具体的なアプローチと同じである。すなわち、次レベルへ進
むアクションと直前レベルへ戻るアクションの各々の期待有用性、および前進と
後退の各々に関するダイアログが判断される。確率分布内で関連付けられた最大
期待値のアクションがその後に続いてとられる。
間をナビゲートするだけではなく、すべてのアクションを含んでいる。従って、
決定理論的アプローチは、追加情報を黙示的に取得するか、追加情報を明示的に
取得するか、次レベルへ進むか、直前レベルへ戻るか、ユーザの確認を得て次レ
ベルへ進むか、ユーザの確認を得て直前レベルへ戻るか、のアクションの中から
選択するために使用されている。この分野の通常の知識を有する者ならば理解さ
れるように、本明細書の他の個所に説明されている推論確率判断といった、単一
の確率を使用するといったように、意思決定プロセスのどの側面に対しても、ど
の近似化を使用することが可能である。従って、より一般化された決定理論的ア
プローチを使用すると、まずアクションが選択され、そのあとにアクションをと
ることが続き(つまり、アクションが実行される)、このプロセスは、対話型対
話のコストが利益よりも上回るまで続けられ、その時点で、不確実性の下で期待
有用性を最大限にするという全体目標に従って、なんらかのアクションが実世界
でとられることになる。
明されている。以下では、本発明の一実施形態によるシステムを示している図6
を参照して、システムについて説明することにする。
ユーザの入力602を受け取り、ユーザ604に対し出力を行って、コンピュー
タとユーザとの対話環境のコンテキストにおいてユーザの目標を評価する(例え
ば、アクションが選択されると、そのアクションが実行されるといったように)
。その結果として、ユーザの目標630が評価されるが、これは、一実施形態で
は、メカニズム(機械装置)638によって実行される目標に基づくアクション
にし、外の世界632がそのアクションによって影響されるようにすることがで
きる。決定エンジン600は、一連のレベルからなり、そこでは、各レベルは、
前述したように、直前レベルの目標の各々に対して少なくとも1つの目標をもっ
ているタスク抽象階層のレベル間をナビゲートしていくことによって(例えば、
1つまたは2つ以上のベイズネットワークの使用によって)、ユーザの目標を評
価するようにしている。一実施形態における決定エンジン600は、コンピュー
タのコンピュータ読取可能媒体からプロセッサによって実行されるコンピュータ
プログラムになっている。なお、本発明はそれだけに限定されるものではない。
00に入力することができる。例えば、テキスト入力はキーボード614を通し
て取り出すことことができ、オーディオ入力はマイクロホン616を通して取り
出すことができ、イメージ/ビデオ情報はビデオカメラ618を通して取り出す
ことができ、他の情報612は他のメカニズム620を通して取り出すことがで
きる。同様に、ユーザの出力は、いくつかの異なるメカニズムを通して決定エン
ジン600に出力させることができる。オーディオ出力622はスピーカ626
から出力することができ、イメージ/ビデオ出力624は、モニタなどのディス
プレイデバイス628から出力することができ、他の出力634は他のメカニズ
ム636から出力することができる。なお、本発明はそれだけに限定されるもの
ではない。
自身、スピーカ626、ディスプレイデバイス628、他のメカニズム636な
どの、出力メカニズムの1つにすることができる。なお、本発明はそれだけに限
定されるものではない。このメカニズム638によると、決定エンジン600に
よって評価された目標630に基づいて、アクションを外の世界632に対して
実行することができる。例えば、受付係ドメインのコンテキストでは、ユーザの
目標が別のキャンパスへのシャトルが必要であると判断されることがあるので、
このメカニズム638を、テキストから音声へのエンジン (text-to-speech eng
ine) にすると、電話でシャトルセンタを呼び出してシャトルを要求することが
できる。
analysis) が説明されている。これらの変則的レベルは、本明細書で上述して
きた本発明の他の実施形態に従って利用することができる。しかし、本発明はそ
れだけに限定されるものではない。
する際に利用可能であることと、情報価値 (VOI) は、急いでいるユーザのよう
な観察の関数としても、すでにユーザに尋ねていた質問の数といった、対話型ダ
イアログ自体に関する観察の関数としても定義できることである。
存する)コストの特殊ケースは、変則的解析レベルとしてマークされている詳細
レベルで、ユーザに質問をすることを熟考するときに利用することができる。変
則的解析レベルの例としては、シャトルを企業キャンパスのどこかに走行させる
上位レベル目標に関連する別のレベルがある。この別レベルでは、ある人が特殊
な種類のシャトルを必要としているかどうかを発見することを求めることができ
、その中には、身体障害者を運ぶことができる車両や、上級重役のための特殊シ
ャトルの要求が含まれている。
を表す特殊な目標状態がある。このレベルでサブ目標についてユーザを巻き込む
ことは、ほとんどのケースでは不自然のように見える。従って、VOI解析で使用
される期待コストは、変則的結果が関連性をもつとの確率を考慮することで、動
的に更新される。証拠p(R|E) が与えられているときの関連性の確率は、無関連
性の状態に割り当てられる確率の補数である。関連性の確率が大きくなると、質
問される自然さが増すので、質問は意外性が減少し、その結果、質問するコスト
が低下することになる。
関連性あるときと、関連性がないときのコストの和に、推論確率の重みを付けた
ものとして計算される。 期待コスト= p(R|E) Cost(Asking, Relevant) + 1-p(R|E) Cost(Asking, not Re
levant) 上記において、cost(Asking, Relevant) は、レベルが関連性をもつとき変則的
事情に関して質問をするコストであり、Cost(Asking, not Relevant) は、レベ
ルが非関連性のとき質問するコストである。従って、この期待コストは、変則的
詳細レベルで明示的質問をするときVOIで使用することができる(ビジュアルキ
ューの収集に集中するものとは対比)。
る者ならば理解されるように、同じ目的を達成することを目的とした構成ならば
、図示した特定実施形態は、その構成で置換することが可能である。本出願は、
本発明の一切の適応または変形を包含することも目的としている。従って、本発
明は、特許請求の範囲に記載の内容とその等価技術によってのみ限定されるもの
である。
層のカレントレベルでの情報を収集する方法をフローチャートで示す図である。
方法をフローチャートで示す図である。
Claims (55)
- 【請求項1】 コンピュータ実行の方法であって、 いくつかのレベルからなるタスク抽象階層のカレントレベルに関する情報を
受け取って、コンピュータとユーザとの間の対話コンテキスト内でユーザの目標
を評価し、 受け取った情報が十分であるかどうかを、判定解析アプローチに基づいて判
断し、 受け取った情報が十分であると判断したとき、判定解析アプローチに基づい
てアクションを選択する、 ことを含むことを特徴とするコンピュータ実行の方法。 - 【請求項2】 請求項1に記載の方法において、判定解析アプローチに基づ
いてアクションを選択することは、階層のカレントレベルにあるタスクによって
表されている目標についての確率分布を判断することを含むことを特徴とする方
法。 - 【請求項3】 請求項2に記載の方法において、アクションを選択すること
は、さらに、確率分布の引数最大値 (arg max) を判断することを含むことを特
徴とする方法。 - 【請求項4】 請求項1に記載の方法において、判定解析アプローチに基づ
いてアクションを選択することは、 推論確率を判断し、 推論確率が前進しきい値を超えていると判断したとき、カレントレベルを次
レベルへ進めることを含むことを特徴とする方法。 - 【請求項5】 請求項4に記載の方法において、さらに、ユーザの目標が評
価されるまで、カレントレベルに関する情報の受取りを継続することを含むこと
を特徴とする方法。 - 【請求項6】 請求項1に記載の方法において、いくつかのレベルからなる
タスク抽象は少なくとも1つの変則的レベルを含み、そこでは、関連性の確率と
非関連性の確率が判断されることを特徴とする方法。 - 【請求項7】 請求項1に記載の方法において、カレントレベルに関する情
報を受取ることは、いくつかのレベルからなるタスク抽象階層のカレントレベル
に関する情報を受取ることを含み、タスク抽象階層は一連のレベルで構成され、
各レベルは、直前レベルの少なくとも1つの目標のうちの、少なくとも1つの各
々について少なくとも1つの目標を含んでいることを特徴とする方法。 - 【請求項8】 請求項1に記載の方法において、情報を受取ることは、情報
タイプグループの中の、少なくとも1つの情報タイプの情報を受取ることを含み
、前記情報タイプグループは、基本的に、テキスト情報タイプ、オーディオ情報
タイプ、イメージ/ビデオ情報タイプ、および他の情報タイプからなることを特
徴とする方法。 - 【請求項9】 請求項1に記載の方法において、情報を受取ることは、ユー
ザとやりとりすることを含むことを特徴とする方法。 - 【請求項10】 請求項9に記載の方法において、ユーザとのやりとりは、
最初にユーザに第2情報を提供することを含むことを特徴とする方法。 - 【請求項11】 請求項10に記載の方法において、ユーザに第2情報を提
供することは、第2情報タイプグループの中の、少なくとも1つの第2情報タイ
プの第2情報をユーザに提供することを含み、前記第2情報タイプグループは、
基本的に、第2オーディオ情報タイプ、第2イメージ/ビデオ情報タイプ、およ
び他の第2情報タイプからなることを特徴とする方法。 - 【請求項12】 請求項1に記載の方法において、受け取った情報が十分で
あるかどうかを判断することは、情報価値解析を実行することを含むことを特徴
とする方法。 - 【請求項13】 請求項12に記載の方法において、情報価値解析を実行す
ることは、貪欲算法による情報価値解析を実行することを含むことを特徴とする
方法。 - 【請求項14】 請求項12に記載の方法において、情報価値解析を実行す
ることは、追加情報を受取る期待コストが追加情報の期待利益を超えているかど
うかを判断することを含むことを特徴とする方法。 - 【請求項15】 請求項4に記載の方法において、推論確率を判断すること
は、 カレントレベルに対する次レベルの少なくとも1つの目標の各々について、
初期推論確率を判断し、 カレントレベルに対する次レベルの少なくとも1つの目標のうち、最高推論
確率をもつ目標の初期推論確率を推論確率として選択する、 ことを含むことを特徴とする方法。 - 【請求項16】 請求項15に記載の方法において、カレントレベルに対す
る次レベルの少なくとも1つの目標の各々について初期推論確率を判断すること
は、カレントレベルに対する次レベルの少なくとも1つの目標の各々についての
初期推論確率を、ベイズ (Bayesian) ネットワークの使用によって判断すること
を含むことを特徴とする方法。 - 【請求項17】 請求項15に記載の方法において、カレントレベルを次レ
ベルへ進めることは、カレントレベルに対する次レベルの少なくとも1つの目標
のうち、最高推論確率をもつ目標へ進むことを含むことを特徴とする方法。 - 【請求項18】 請求項4に記載の方法において、受け取った情報が十分で
あると判断したとき、および推論確率が前進しきい値を超えていると判断したと
き、カレントレベルを次レベルへ進めたあとに続いて、 推論確率がダイアログしきい値を超えていると判断したとき、 次レベルへ進むかどうかに関するダイアログにユーザを参加させ、 次レベルへ進むとの確認をユーザから受け取ったとき、カレントレベル
を次レベルへ進めることを、さらに含むことを特徴とする方法。 - 【請求項19】 請求項4に記載の方法において、受け取った情報が十分で
あると判断したとき、および確率推論が前進しきい値を超えている判断したとき
、カレントレベルを次レベルへ進めた後に続いて、 第2推論確率を判断し、 第2推論確率がリターンしきい値を超えていると判断したとき、カレントレ
ベルを直前レベルへ戻すことを、さらに含むことを特徴とする方法。 - 【請求項20】 請求項19に記載の方法において、第2推論確率を判断す
ることは、第2推論確率を、直前レベルへ戻る目標の確率として判断することを
含むことを特徴とする方法。 - 【請求項21】 請求項19に記載の方法において、第2推論確率を判断す
ることは、ベイズネットワークの使用によって第2推論確率を判断することを含
むことを特徴とする方法。 - 【請求項22】 コンピュータ実行の方法であって、 いくつかのレベルからなるタスク抽象階層のカレントレベルに関する情報を
受け取って、コンピュータとユーザとの対話コンテキスト内のユーザの目標を評
価し、 受け取った情報が十分であるかどうかを、情報価値解析を実行することによ
って判断し、 受け取った情報が十分であると判断したとき、 推論確率を判断し、 推論確率が前進しきい値を超えていると判断したとき、カレントレベル
を次レベルへ進め、 第2推論確率を判断し、 第2推論確率がリターンしきい値を超えていると判断したとき、カレン
トレベルを直前レベルへ戻し、 ユーザの目標が評価されるまで、カレントレベルに関する情報の受取りを継
続する、 ことを含むことを特徴とするコンピュータ実行の方法。 - 【請求項23】 請求項22に記載の方法において、カレントレベルに関す
る情報を受取ることは、いくつかのレベルからなるタスク抽象階層のカレントレ
ベルに関する情報を受取ることを含み、タスク抽象階層は一連のレベルで構成さ
れ、各レベルは、直前レベルの少なくとも1つの目標のうちの、少なくとも1つ
の各々について少なくとも1つの目標を含んでいることを特徴とする方法。 - 【請求項24】 請求項22に記載の方法において、情報を受取ることは、
ユーザとやりとりすることを含むことを特徴とする方法。 - 【請求項25】 請求項22に記載の方法において、情報価値解析を実行す
ることは、追加情報を受取る期待コストが追加情報の期待利益を超えているかど
うかを判断することを含むことを特徴とする方法。 - 【請求項26】 請求項23に記載の方法において、推論確率を判断するこ
とは、 カレントレベルに対する次レベルの少なくとも1つの目標の各々についての
初期推論確率を、ベイズネットワークの使用によって判断し、 カレントレベルに対する次レベルの少なくとも1つの目標のうち、最高推論
確率をもつ目標の初期推論確率を推論確率として選択する、 ことを含むことを特徴とする方法。 - 【請求項27】 請求項23に記載の方法において、カレントレベルを次レ
ベルへ進めることは、カレントレベルに対する次レベルの少なくとも1つの目標
のうち、最高推論確率をもつ目標へ進むことを含むことを特徴とする方法。 - 【請求項28】 請求項22に記載の方法において、受け取った情報が十分
であると判断したとき、および推論確率が前進しきい値を超えていると判断した
とき、カレントレベルを次レベルへ進めたあとに続いて、 推論確率が第2確率しきい値を超えていると判断したとき、 次レベルへ進むかどうかに関するダイアログにユーザを参加させ、 次レベルへ進むとの確認をユーザから受け取ったとき、カレントレベル
を次レベルへ進めることを、さらに含むことを特徴とする方法。 - 【請求項29】 請求項22に記載の方法において、第2推論確率を判断す
ることは、第2推論確率を、ベイズネットワークの使用によって直前レベルへ戻
る目標の確率として判断することを含むことを特徴とする方法。 - 【請求項30】 方法を実行するためにプロセッサによって実行される命令
がそこに格納されているマシン読取可能媒体であって、前記方法は、 いくつかのレベルからなるタスク抽象階層のカレントレベルに関する情報を
受け取って、コンピュータとユーザとの対話コンテキスト内でユーザの目標を評
価し、 受け取った情報が十分であるかどうかを判断し、 受け取った情報が十分であると判断したとき、 推論確率を判断し、 推論確率が前進しきい値を超えていると判断したとき、カレントレベル
を次レベルへ進め、 ユーザの目標が評価されるまで、カレントレベルに関する情報の受取りを継
続する、 ことを含むことを特徴とするマシン読取可能媒体。 - 【請求項31】 請求項30に記載のマシン読取可能媒体において、カレン
トレベルに関する情報を受取ることは、いくつかのレベルからなるタスク抽象階
層のカレントレベルに関する情報を受取ることを含み、タスク抽象階層は一連の
レベルで構成され、各レベルは、直前レベルの少なくとも1つの目標のうちの、
少なくとも1つの各々について少なくとも1つの目標を含んでいることを特徴と
するマシン読取可能媒体。 - 【請求項32】 請求項30に記載のマシン読取可能媒体において、情報を
受取ることは、ユーザとやりとりすることを含むことを特徴とするマシン読取可
能媒体。 - 【請求項33】 請求項30に記載のマシン読取可能媒体において、受け取
った情報が十分であるかどうかを判断することは、情報価値解析を実行すること
を含むことを特徴とするマシン読取可能媒体。 - 【請求項34】 請求項33に記載のマシン読取可能媒体において、情報価
値解析を実行することは、貪欲算法による情報価値解析を実行することを含むこ
とを特徴とするマシン読取可能媒体。 - 【請求項35】 請求項33に記載のマシン読取可能媒体において、情報価
値解析を実行することは、追加情報を受取る期待コストが追加情報の期待利益を
超えているかどうかを判断することを含むことを特徴とするマシン読取可能媒体
。 - 【請求項36】 請求項30に記載のマシン読取可能媒体において、推論確
率を判断することは、 カレントレベルに対する次レベルの少なくとも1つの目標の各々についての
初期推論確率を、ベイズネットワークの使用によって判断し、 カレントレベルに対する次レベルの少なくとも1つの目標のうち、最高推論
確率をもつ目標の初期推論確率を推論確率として選択する、 ことを含むことを特徴とするマシン読取可能媒体。 - 【請求項37】 請求項36に記載のマシン読取可能媒体において、カレン
トレベルを次レベルへ進めることは、カレントレベルに対する次レベルの少なく
とも1つの目標のうち、最高推論確率をもつ目標へ進むことを含むことを特徴と
するマシン読取可能媒体。 - 【請求項38】 請求項30に記載のマシン読取可能媒体において、受け取
った情報が十分であると判断したとき、および推論確率が前進しきい値を超えて
いると判断したとき、カレントレベルを次レベルへ進めたあとに続いて、 推論確率がダイアログしきい値を超えていると判断したとき、 次レベルへ進むかどうかに関するダイアログにユーザを参加させ、 次レベルへ進むとの確認をユーザから受け取ったとき、カレントレベル
を次レベルへ進めることを、さらに含むことを特徴とするマシン読取可能媒体。 - 【請求項39】 請求項30に記載のマシン読取可能媒体において、受け取
った情報が十分であると判断したとき、および確率推論が前進しきい値を超えて
いる判断したとき、カレントレベルを次レベルへ進めた後に続いて、 直前レベルへ戻る目標の第2推論確率を、ベイズネットワークの使用によっ
て判断し、 第2推論確率がリターンしきい値を超えていると判断したとき、カレントレ
ベルを直前レベルへ戻すことを、さらに含むことを特徴とするマシン読取可能媒
体。 - 【請求項40】 方法を実行するためにプロセッサによって実行される命令
がそこに格納されているマシン読取可能媒体であって、前記方法は、 いくつかのレベルからなるタスク抽象階層のカレントレベルに関する情報を
受け取って、コンピュータとユーザとの対話コンテキスト内でユーザの目標を評
価し、タスク抽象階層は一連のレベルから構成され、各レベルは、直前レベルの
少なくとも1つの目標のうちの、少なくとも1つの各々について少なくとも1つ
の目標を含んでいるものと、 受け取った情報が十分であるかどうかを、情報価値解析を実行することによ
って判断し、 受け取った情報が十分であると判断したとき、 カレントレベルに対する次レベルの少なくとも1つの目標の各々につい
ての初期推論確率を、ベイズネットワークの使用によって判断し、 カレントレベルに対する次レベルの少なくとも1つの目標のうち、最高
推論確率をもつ目標の初期推論確率を、初期推論確率として選択し、 推論確率が前進しきい値を超えていると判断したとき、カレントレベル
を次レベルへ進め、 直前レベルへ戻る目標の第2推論確率がリターンしきい値を超えている
と判断したとき、カレントレベルを直前レベルへ戻し、 ユーザの目標が評価されるまで、カレントレベルに関する情報の受取りを継
続する、 ことを含むことを特徴とするマシン読取可能媒体。 - 【請求項41】 請求項40に記載のマシン読取可能媒体において、情報を
受取ることは、ユーザとやりとりすることを含むことを特徴とするマシン読取可
能媒体。 - 【請求項42】 請求項40に記載のマシン読取可能媒体において、情報価
値解析を実行することは、追加情報を受取る期待コストが追加情報の期待利益を
超えているかどうかを判断することを含むことを特徴とするマシン読取可能媒体
。 - 【請求項43】 請求項40に記載のマシン読取可能媒体において、カレン
トレベルを次レベルへ進めることは、カレントレベルに対する次レベルの少なく
とも1つの目標のうち、最高推論確率をもつ目標へ進むことを含むことを特徴と
するマシン読取可能媒体。 - 【請求項44】 請求項40に記載のマシン読取可能媒体において、受け取
った情報が十分であると判断したとき、および推論確率が前進しきい値を超えて
いると判断したとき、カレントレベルを次レベルへ進めたあとに続いて、 推論確率がダイアログしきい値を超えていると判断したとき、 次レベルへ進むかどうかに関するダイアログにユーザを参加させ、 次レベルへ進むとの確認をユーザから受け取ったとき、カレントレベル
を次レベルへ進めることを、さらに含むことを特徴とするマシン読取可能媒体。 - 【請求項45】 コンピュータ化システムであって、 少なくとも1つのユーザ情報ソースと、 ユーザに出力する少なくとも1つの受け手と、 前記少なくとも1つのソースと前記少なくとも1つの受け手に動作可能に結
合されて、いくつかのレベルからなるタスク抽象階層をナビゲーションすること
によって、コンピュータとユーザとの対話コンテキスト内でユーザの目標を評価
する決定エンジンと、 を備えたことを特徴とするコンピュータ化システム。 - 【請求項46】 請求項45に記載のシステムにおいて、決定エンジンによ
って評価されたユーザの目標に基づいてアクションをとる機能を備えたメカニズ
ムを、さらに含むことを特徴とするシステム。 - 【請求項47】 請求項45に記載のシステムにおいて、少なくとも1つの
ソースは、次のうちの少なくとも1つ、すなわち、キーボード、マイクロホン、
およびビデオカメラを含むことを特徴とするシステム。 - 【請求項48】 請求項45に記載のシステムにおいて、少なくとも1つの
受け手は、次のうちの少なくとも1つ、すなわち、スピーカ、およびディスプレ
イデバイスを含むことを特徴とするシステム。 - 【請求項49】 請求項45に記載のシステムにおいて、タスク抽象階層は
一連のレベルで構成され、各レベルは、直前レベルの少なくとも1つの目標のう
ちの、少なくとも1つの目標の各々について少なくとも1つの目標を含むことを
特徴とするシステム。 - 【請求項50】 請求項45に記載のシステムにおいて、決定エンジンは、
少なくとも1つのベイズネットワークの使用によってタスク抽象回路のナビゲー
ションを実行することを特徴とするシステム。 - 【請求項51】 請求項45に記載のシステムにおいて、決定エンジンは、
コンピュータ読取可能媒体からプロセッサによって実行されるコンピュータプロ
グラムを含むことを特徴とするシステム。 - 【請求項52】 コンピュータ実行の方法であって、 判定解析アプローチを使用して、コンピュータとユーザとの対話コンテキス
ト内でユーザの目標の評価に関係するアクショングループからアクションを選択
し、アクショングループは、情報を取得すること、いくつかのレベルからなるタ
スク抽象階層の次レベルへ進むこと、およびタスク抽象階層の直前レベルへ戻る
ことを含み、 選択したアクションを実行し、 ユーザの目標の1つが評価され、対話を継続するコストが利益よりも上回る
まで繰り返す、 ことを含むことを特徴とするコンピュータ実行の方法。 - 【請求項53】 請求項52に記載の方法において、情報を取得することは
、黙示的に情報を取得することと、ユーザの明示的質問を通して情報を取得する
ことを含むことを特徴とする方法。 - 【請求項54】 請求項52に記載の方法において、次レベルへ進むことは
、ユーザからの確認を得たあとに続いて次レベルへ進むことを含むことを特徴と
する方法。 - 【請求項55】 請求項52に記載の方法において、直前レベルへ戻ること
は、ユーザからの確認を求める試みに続いて直前レベルへ戻ることを含むことを
特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/326,254 US6421655B1 (en) | 1999-06-04 | 1999-06-04 | Computer-based representations and reasoning methods for engaging users in goal-oriented conversations |
US09/326,254 | 1999-06-04 | ||
PCT/US2000/015285 WO2000075863A2 (en) | 1999-06-04 | 2000-06-02 | Representations and reasoning for goal-oriented conversations |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003501754A true JP2003501754A (ja) | 2003-01-14 |
JP2003501754A5 JP2003501754A5 (ja) | 2007-08-23 |
Family
ID=23271456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001502062A Pending JP2003501754A (ja) | 1999-06-04 | 2000-06-02 | 目標達成志向会話の表現と推論 |
Country Status (9)
Country | Link |
---|---|
US (1) | US6421655B1 (ja) |
EP (1) | EP1194891B1 (ja) |
JP (1) | JP2003501754A (ja) |
CN (1) | CN1320498C (ja) |
AT (1) | ATE466351T1 (ja) |
AU (1) | AU5594000A (ja) |
DE (1) | DE60044295D1 (ja) |
HK (1) | HK1046758B (ja) |
WO (1) | WO2000075863A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016502696A (ja) * | 2012-10-11 | 2016-01-28 | ベベオ, インコーポレイテッド | 会話型インターフェースの一部として動的に適用されるフィルタリングオペレータを伴う適応会話状態管理のための方法 |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7103806B1 (en) * | 1999-06-04 | 2006-09-05 | Microsoft Corporation | System for performing context-sensitive decisions about ideal communication modalities considering information about channel reliability |
US7389351B2 (en) * | 2001-03-15 | 2008-06-17 | Microsoft Corporation | System and method for identifying and establishing preferred modalities or channels for communications based on participants' preferences and contexts |
US6513026B1 (en) * | 2000-06-17 | 2003-01-28 | Microsoft Corporation | Decision theoretic principles and policies for notification |
US6785651B1 (en) * | 2000-09-14 | 2004-08-31 | Microsoft Corporation | Method and apparatus for performing plan-based dialog |
GB2367914A (en) * | 2000-10-09 | 2002-04-17 | Johnson Davies David Boris | An iterative method for identification of an item from a dataset by selecting questions to eliminate the maximum number of items at each ite tion |
US7158935B1 (en) * | 2000-11-15 | 2007-01-02 | At&T Corp. | Method and system for predicting problematic situations in a automated dialog |
AU2002237495A1 (en) * | 2001-03-13 | 2002-09-24 | Intelligate Ltd. | Dynamic natural language understanding |
US7251696B1 (en) | 2001-03-15 | 2007-07-31 | Microsoft Corporation | System and methods enabling a mix of human and automated initiatives in the control of communication policies |
US7330895B1 (en) * | 2001-03-15 | 2008-02-12 | Microsoft Corporation | Representation, decision models, and user interface for encoding managing preferences, and performing automated decision making about the timing and modalities of interpersonal communications |
US6917928B1 (en) * | 2001-04-12 | 2005-07-12 | Idego Methodologies, Inc. | System and method for personal development training |
US7287017B2 (en) * | 2001-04-12 | 2007-10-23 | Igego Methodologies, Inc. | Decision engine |
WO2002101594A2 (en) * | 2001-06-11 | 2002-12-19 | Hrl Laboratories, Llc | Method and apparatus for determining and assessing information to be collected based on information-theoretic measures |
US7644144B1 (en) | 2001-12-21 | 2010-01-05 | Microsoft Corporation | Methods, tools, and interfaces for the dynamic assignment of people to groups to enable enhanced communication and collaboration |
US7146348B2 (en) * | 2002-01-22 | 2006-12-05 | Honeywell International Inc. | Probabilistic goal recognition system and method incorporating inferred unobserved actions |
US20030214523A1 (en) * | 2002-05-16 | 2003-11-20 | Kuansan Wang | Method and apparatus for decoding ambiguous input using anti-entities |
US7502730B2 (en) * | 2002-06-14 | 2009-03-10 | Microsoft Corporation | Method and apparatus for federated understanding |
US7870240B1 (en) | 2002-06-28 | 2011-01-11 | Microsoft Corporation | Metadata schema for interpersonal communications management systems |
US7292982B1 (en) * | 2003-05-29 | 2007-11-06 | At&T Corp. | Active labeling for spoken language understanding |
US7640506B2 (en) * | 2003-06-27 | 2009-12-29 | Microsoft Corporation | Method and apparatus for viewing and managing collaboration data from within the context of a shared document |
US7739141B2 (en) * | 2003-07-10 | 2010-06-15 | International Business Machines Corporation | Consulting assessment environment |
CN1839382A (zh) | 2003-09-30 | 2006-09-27 | 英特尔公司 | 动态贝叶斯网络的最可能解释生成 |
DE10356399B4 (de) * | 2003-12-03 | 2006-06-14 | Ontoprise Gmbh | Datenverarbeitungssystem |
US7873724B2 (en) * | 2003-12-05 | 2011-01-18 | Microsoft Corporation | Systems and methods for guiding allocation of computational resources in automated perceptual systems |
US7499913B2 (en) * | 2004-01-26 | 2009-03-03 | International Business Machines Corporation | Method for handling anchor text |
US8296304B2 (en) * | 2004-01-26 | 2012-10-23 | International Business Machines Corporation | Method, system, and program for handling redirects in a search engine |
US7293005B2 (en) * | 2004-01-26 | 2007-11-06 | International Business Machines Corporation | Pipelined architecture for global analysis and index building |
US7424467B2 (en) * | 2004-01-26 | 2008-09-09 | International Business Machines Corporation | Architecture for an indexer with fixed width sort and variable width sort |
US7908663B2 (en) | 2004-04-20 | 2011-03-15 | Microsoft Corporation | Abstractions and automation for enhanced sharing and collaboration |
US7707167B2 (en) * | 2004-09-20 | 2010-04-27 | Microsoft Corporation | Method, system, and apparatus for creating a knowledge interchange profile |
US7730010B2 (en) * | 2004-09-20 | 2010-06-01 | Microsoft Corporation | Method, system, and apparatus for maintaining user privacy in a knowledge interchange system |
US7593924B2 (en) * | 2004-09-20 | 2009-09-22 | Microsoft Corporation | Method, system, and apparatus for receiving and responding to knowledge interchange queries |
US7461064B2 (en) | 2004-09-24 | 2008-12-02 | International Buiness Machines Corporation | Method for searching documents for ranges of numeric values |
US20060287937A1 (en) * | 2005-01-18 | 2006-12-21 | Manyworlds, Inc. | Generative Investment Process |
US20060168546A1 (en) * | 2005-01-21 | 2006-07-27 | International Business Machines Corporation | System and method for visualizing and navigating objectives |
US20060256937A1 (en) * | 2005-05-12 | 2006-11-16 | Foreman Paul E | System and method for conversation analysis |
US8417693B2 (en) | 2005-07-14 | 2013-04-09 | International Business Machines Corporation | Enforcing native access control to indexed documents |
US20090253113A1 (en) * | 2005-08-25 | 2009-10-08 | Gregory Tuve | Methods and systems for facilitating learning based on neural modeling |
US7461043B2 (en) * | 2005-12-14 | 2008-12-02 | Siemens Aktiengesellschaft | Methods and apparatus to abstract events in software applications or services |
US20080059395A1 (en) * | 2006-01-10 | 2008-03-06 | Manyworlds, Inc. | Adaptive Online Experimentation |
EP1987477A2 (en) * | 2006-02-10 | 2008-11-05 | Numenta, Inc. | Architecture of a hierarchical temporal memory based system |
US20080028062A1 (en) * | 2006-07-25 | 2008-01-31 | Microsoft Corporation | Determining measures of traffic accessing network locations |
US8631005B2 (en) | 2006-12-28 | 2014-01-14 | Ebay Inc. | Header-token driven automatic text segmentation |
US7711716B2 (en) | 2007-03-06 | 2010-05-04 | Microsoft Corporation | Optimizations for a background database consistency check |
US7818271B2 (en) * | 2007-06-13 | 2010-10-19 | Motorola Mobility, Inc. | Parameterized statistical interaction policies |
US8108777B2 (en) | 2008-08-11 | 2012-01-31 | Microsoft Corporation | Sections of a presentation having user-definable properties |
US8694734B2 (en) * | 2009-01-31 | 2014-04-08 | International Business Machines Corporation | Expiring virtual content from a cache in a virtual universe |
US8782556B2 (en) | 2010-02-12 | 2014-07-15 | Microsoft Corporation | User-centric soft keyboard predictive technologies |
JP5815534B2 (ja) | 2010-08-31 | 2015-11-17 | アトナープ株式会社 | センサーにより測定されたデータから候補を見つける方法および装置 |
US9460082B2 (en) | 2012-05-14 | 2016-10-04 | International Business Machines Corporation | Management of language usage to facilitate effective communication |
US9058563B1 (en) * | 2014-10-15 | 2015-06-16 | Blackwerks LLC | Suggesting activities |
US11094320B1 (en) * | 2014-12-22 | 2021-08-17 | Amazon Technologies, Inc. | Dialog visualization |
DE112018004578T5 (de) * | 2017-10-26 | 2020-07-16 | Omron Corporation | Zielmanagementsystem und zielmanagementprogramm |
US10453455B2 (en) * | 2017-11-22 | 2019-10-22 | Adobe Inc. | Multiple turn conversational task assistance |
CN109992657B (zh) * | 2019-04-03 | 2021-03-30 | 浙江大学 | 一种基于强化动态推理的对话式问题生成方法 |
EP4004796A1 (en) * | 2019-08-29 | 2022-06-01 | Siemens Aktiengesellschaft | Conversational design bot for system design |
CN110688478B (zh) * | 2019-09-29 | 2021-11-30 | 腾讯科技(深圳)有限公司 | 一种答案排序方法、装置及存储介质 |
US20220019909A1 (en) * | 2020-07-14 | 2022-01-20 | Adobe Inc. | Intent-based command recommendation generation in an analytics system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998003907A2 (en) * | 1996-07-19 | 1998-01-29 | Microsoft Corporation | Intelligent user assistance facility |
WO1998013771A1 (fr) * | 1996-09-26 | 1998-04-02 | Mitsubishi Denki Kabushiki Kaisha | Processeur interactif |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4809219A (en) * | 1985-06-26 | 1989-02-28 | International Business Machines Corporation | Method for processing an expert system rulebase on a system having limited memory |
US4763277A (en) * | 1986-01-17 | 1988-08-09 | International Business Machines Corporation | Method for obtaining information in an expert system |
US5103498A (en) * | 1990-08-02 | 1992-04-07 | Tandy Corporation | Intelligent help system |
JPH04196528A (ja) * | 1990-11-28 | 1992-07-16 | Toshiba Corp | マグネトロンエッチング装置 |
US5903454A (en) * | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
US5434777A (en) * | 1992-05-27 | 1995-07-18 | Apple Computer, Inc. | Method and apparatus for processing natural language |
US5390281A (en) * | 1992-05-27 | 1995-02-14 | Apple Computer, Inc. | Method and apparatus for deducing user intent and providing computer implemented services |
US5477447A (en) * | 1992-05-27 | 1995-12-19 | Apple Computer, Incorporated | Method and apparatus for providing computer-implemented assistance |
CA2115210C (en) * | 1993-04-21 | 1997-09-23 | Joseph C. Andreshak | Interactive computer system recognizing spoken commands |
US5748841A (en) | 1994-02-25 | 1998-05-05 | Morin; Philippe | Supervised contextual language acquisition system |
US5809499A (en) * | 1995-10-20 | 1998-09-15 | Pattern Discovery Software Systems, Ltd. | Computational method for discovering patterns in data sets |
US5822218A (en) * | 1996-08-27 | 1998-10-13 | Clemson University | Systems, methods and computer program products for prediction of defect-related failures in integrated circuits |
DE29615563U1 (de) * | 1996-08-28 | 1998-01-02 | Siemens Ag | Bewegbare Schaltkontaktanordnung mit Kontaktkraftfedern |
US5864848A (en) | 1997-01-31 | 1999-01-26 | Microsoft Corporation | Goal-driven information interpretation and extraction system |
US6327581B1 (en) | 1998-04-06 | 2001-12-04 | Microsoft Corporation | Methods and apparatus for building a support vector machine classifier |
-
1999
- 1999-06-04 US US09/326,254 patent/US6421655B1/en not_active Expired - Lifetime
-
2000
- 2000-06-02 EP EP00941198A patent/EP1194891B1/en not_active Expired - Lifetime
- 2000-06-02 AU AU55940/00A patent/AU5594000A/en not_active Abandoned
- 2000-06-02 WO PCT/US2000/015285 patent/WO2000075863A2/en active Search and Examination
- 2000-06-02 DE DE60044295T patent/DE60044295D1/de not_active Expired - Lifetime
- 2000-06-02 CN CNB008069247A patent/CN1320498C/zh not_active Expired - Fee Related
- 2000-06-02 JP JP2001502062A patent/JP2003501754A/ja active Pending
- 2000-06-02 AT AT00941198T patent/ATE466351T1/de not_active IP Right Cessation
-
2002
- 2002-11-15 HK HK02108283.7A patent/HK1046758B/zh not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998003907A2 (en) * | 1996-07-19 | 1998-01-29 | Microsoft Corporation | Intelligent user assistance facility |
WO1998013771A1 (fr) * | 1996-09-26 | 1998-04-02 | Mitsubishi Denki Kabushiki Kaisha | Processeur interactif |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016502696A (ja) * | 2012-10-11 | 2016-01-28 | ベベオ, インコーポレイテッド | 会話型インターフェースの一部として動的に適用されるフィルタリングオペレータを伴う適応会話状態管理のための方法 |
Also Published As
Publication number | Publication date |
---|---|
AU5594000A (en) | 2000-12-28 |
CN1349636A (zh) | 2002-05-15 |
EP1194891B1 (en) | 2010-04-28 |
HK1046758B (zh) | 2007-11-09 |
DE60044295D1 (de) | 2010-06-10 |
WO2000075863A3 (en) | 2001-07-26 |
ATE466351T1 (de) | 2010-05-15 |
CN1320498C (zh) | 2007-06-06 |
US6421655B1 (en) | 2002-07-16 |
HK1046758A1 (en) | 2003-01-24 |
EP1194891A2 (en) | 2002-04-10 |
WO2000075863A2 (en) | 2000-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003501754A (ja) | 目標達成志向会話の表現と推論 | |
US20230214781A1 (en) | Generating Smart Reminders by Assistant Systems | |
KR102535338B1 (ko) | 화자 임베딩(들)과 트레이닝된 생성 모델을 이용한 화자 분리 | |
US6490698B1 (en) | Multi-level decision-analytic approach to failure and repair in human-computer interactions | |
Yalcin | Epistemic modals | |
US5918222A (en) | Information disclosing apparatus and multi-modal information input/output system | |
US7386449B2 (en) | Knowledge-based flexible natural speech dialogue system | |
US7734471B2 (en) | Online learning for dialog systems | |
CN108346430A (zh) | 对话系统、具有对话系统的车辆以及对话处理方法 | |
US20090106026A1 (en) | Speech recognition method, device, and computer program | |
AU2019219717B2 (en) | System and method for analyzing partial utterances | |
KR20110072847A (ko) | 열려진 사용자 의도 처리를 위한 대화관리 시스템 및 방법 | |
JPH0981632A (ja) | 情報公開装置 | |
WO2019140390A1 (en) | Probabilistic modeling system and method | |
EP4172843A1 (en) | Using a single request for multi-person calling in assistant systems | |
CN114127694A (zh) | 用于会话系统的错误恢复 | |
Shibata et al. | Chat-like conversational system based on selection of reply generating module with reinforcement learning | |
McTear | Intelligent interface technology: from theory to reality? | |
CN116303949A (zh) | 一种对话处理方法、系统、存储介质及终端 | |
WO2021011139A1 (en) | The conversational assistant for conversational engagement | |
WO2022226131A1 (en) | Active listening for assistant systems | |
Horvitz et al. | Deeplistener: harnessing expected utility to guide clarification dialog in spoken language systems. | |
KR101212795B1 (ko) | 다중 목적 영역의 통계적 대화 정책 추론 방법 | |
CN112328776A (zh) | 对话生成方法、装置、电子设备和存储介质 | |
US10674952B1 (en) | Detection and management of memory impairment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070525 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070525 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100827 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110204 |