JP2003501754A - 目標達成志向会話の表現と推論 - Google Patents

目標達成志向会話の表現と推論

Info

Publication number
JP2003501754A
JP2003501754A JP2001502062A JP2001502062A JP2003501754A JP 2003501754 A JP2003501754 A JP 2003501754A JP 2001502062 A JP2001502062 A JP 2001502062A JP 2001502062 A JP2001502062 A JP 2001502062A JP 2003501754 A JP2003501754 A JP 2003501754A
Authority
JP
Japan
Prior art keywords
level
information
user
goal
inference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001502062A
Other languages
English (en)
Other versions
JP2003501754A5 (ja
Inventor
ホービッツ エリック
ピーク ティモシー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2003501754A publication Critical patent/JP2003501754A/ja
Publication of JP2003501754A5 publication Critical patent/JP2003501754A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Image Analysis (AREA)
  • Communication Control (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)
  • Peptides Or Proteins (AREA)

Abstract

(57)【要約】 目標判断抽象階層をベイズ推論法と併用し、対話型と観察型アクションを決定理論的に解析することによって、ユーザとの対話を通してユーザの目標についての判断を増分的に精細化していく仕組みが開示されている。コンピュータ実行の方法によれば、抽象階層のある特定レベルで、可視的および言語的キューを含むユーザ目標に関する複数の情報クラスを受け取って、目標を評価するようにしている。この方法によれば、次に、追加情報を取得する有用性が情報価値解析によって判断され、この判断は、追加の観察を行うか、あるいは明示的にユーザにクエリ(問い合わせ)することと、ユーザ目標の解析の精細レベルを変更する決定を行うこととを対比させながら行われる。解析を通して、ユーザの目標について確率分布が推論される。この確率は、異なる結果の有用性を表したものと併用され、最大期待有用性をもつ情報アクションとナビゲーションアクションが特定される。

Description

【発明の詳細な説明】
【0001】 発明の分野 本発明は、一般的には、コンピュータとユーザとの対話 (computer-user inte
raction) に関し、さらに具体的には、会話とも呼ばれることがある、コンピュ
ータと人間との間の対話であって、不確実性(uncertainty)の下にあるユーザ
の目標を言語的情報と非言語的情報の両方から推論し、前記不確実性を解決する
ために収集される最も重要な情報を計算し、タスク抽象階層を進むべきか、後退
すべきかの意思決定を行う方法とタスク抽象階層とを併用することによって達成
される対話に関する。
【0002】 発明の背景 一般的に、コンピュータとユーザとの対話は、コンピュータがユーザの特異性
に順応するのではなく、ユーザがコンピュータの特異性に順応することが中心に
なっていた。例えば、非コンピュータとの対話(人間と人間との対話など)では
、ユーザは、言葉のシグナル (verbal signal) と非言葉のシグナル (nonverbal
signal) を組み合わせて通信しているのが代表的であるの対し、コンピュータ
とユーザとの対話では、そのようなことは行われないのが一般的である。むしろ
、ユーザは、制限付き音声入力 (constrained voice input)、キーボードからの
テキスト入力、マウスから入力をポインティングし、移動し、クリックするとい
ったように、コンピュータに理解しやすい形で情報をコンピュータに情報を入力
することが強要されている。その結果、コンピュータとユーザとの対話にはこの
ような不自然さがあるため、コンピュータを使い易くし、日常生活の直観的な一
部にしようとする努力の妨げとなっている。
【0003】 対話における対話型ダイアログ (interactive dialog) は、人間同士のコミュ
ニケーションの基礎となっており、そこでは、各々の人間は独自の要求、目標お
よび情報をもっている。対話は、情報を獲得し、共有し、あるいは批判すること
を意図して、および要求を表明したり、サービスを要求したりするために開始さ
れるのが代表的である。一般的に、不確実性の下で情報を収集し、意思決定する
ことは、対話では中心的役割を果たしている。このことは、コンピュータとユー
ザとの対話で、より自然なコンピュータとユーザとの対話を達成するのを困難に
している理由の1つになっている。
【0004】 対話によるコミュニケーションが聴覚だけでないことが、この困難性をさらに
複雑にしている。むしろ、一方の当事者に関する情報のタイプとしては、他方の
当事者に対話でどのように反応させるかを指示できるものが他にもある。例えば
、ある人の外観、挙動、空間的形状、および小道具 (props)(つまり、搬送アイ
テム)は、対話をどのように進めるべきかを判断するとき、すべてが考慮される
ことがある。しかし、一般的には、対話を通したコンピュータとユーザとの対話
に関係する従来技術は、ユーザに関する非言語的情報が中心になっていなかった
。また、コンピュータシステムとの大部分の対話では、不確実性に関して対話で
議論することも、質問を通して、あるいは情報収集の指示を通して追加情報の増
分的問い合わせ (incremental inquiry) を行ってさまざまな情報ソースを調べ
ることもできず、この情報ソースの中には、自然言語理解システムを使用して発
言の自動化構文解析で認識される区別、発言の中に現れるワードやフレーズ、お
よびさまざまな音響的キューと視覚的キュー (cue) などが含まれている。
【0005】 従って、ユーザとコンピュータの間のコミュニケーションをより直観的かつ自
然にするための、改良された対話型コンピュータとユーザとの対話が望まれてい
る。本発明が必要とされているのは、上記理由とその他の理由によるものである
【0006】 発明の概要 本発明は、ユーザ目標のタスク抽象階層 (task abstraction hierarchy) を使
用してコンピュータとユーザとの対話を行うことに関し、このタスク抽象階層は
、いくつかの異なる精細レベルに編成され、ユーザの目標に関するダイアログ(
対話)に参加するようにしている。一実施形態における、コンピュータ実行の方
法によれば、抽象階層のカレントレベルにあるユーザの目標(つまり、ユーザ側
から見たときのコンピュータとユーザとの対話の目的)に関する情報を受取りし
、あるいは情報に関する照会を積極的に行って、目標を評価し、精細化するよう
にしている。この方法によれば、受け取った情報が十分であるかどうかは、例え
ば、すでに収集された情報から確率的推論 (probabilistic inference) を行っ
て、ユーザの代替目標(alternate goal)に確率を割り当て、情報価値解析 (va
lue-of-information analysis) を行って新しい情報を獲得することによって判
断されている。受け取った情報が不十分であれば、追加情報がユーザから受取り
され、推論が行われ、十分であるかどうかが再び評価されるが、その評価は、ユ
ーザの目標に関する1つまたは2つ以上の、先行仮説 (leading hypotheses) に
割り当てられた確率の判定解析的評価 (decision-analytic assessment) が中心
になっている。カレント情報を使用した判定解析的評価に応じて、システムは追
加情報を獲得することを求め、カレントレベルで表された精度にある目標を仮定
し、そのあとで階層内の次の精細レベルにある、より具体的な目標の解析へ進む
ことも、あるいはユーザから目標の確認を求めてから、次の解析レベルへ移るよ
うにすることも可能になっている。各レベルでの代替目標の確率は、一実施形態
では、ベイズネットワーク (Bayesian network) によって判断される。この実施
形態では、先行確率 (leading probability) をもつ目標は、その判断を行うた
めに使用される。最高確率のサブ目標 (sub-goal) が、前進 (progression) の
コストと利益を考慮する判定解析によって判断された前進しきい値 (progressio
n threshold) を超えていれば、そのサブ目標へ進められる。すなわち、カレン
トレベルは後続レベルへ進められ、情報解析と獲得がこの新レベルで再び開始さ
れる。
【0007】 タスク抽象階層を使用すると、従来技術に見られない利点が得られる。ユーザ
の目標をいくつかの層に分解すると、徐々に精細度を増しながら、共有理解(sh
ared understanding)に向かう自然収束経路 (path of natural convergence)
上を、対話を導いていくことが可能になる。レベルを複数にすると、各レベルで
の不確実性に関する共通基礎を確立することが可能になり、また、特定レベルで
の理解または誤解に関して対話を行ってから、次レベルへ進むようにすることも
可能になる。収集される情報としては、言語的情報のほかに、ユーザに関する可
視的情報のような、非言語的情報がある。
【0008】 本発明の実施形態のいくつかを示すと、コンピュータ実行の方法、コンピュー
タ読取可能媒体、およびコンピュータ化システムがあり、これらは種々態様に変
形することが可能である。本発明の他の実施形態、利点および側面は、図面を参
照して下述する「詳細説明」の中で明らかにする。
【0009】 実施形態の詳細説明 以下では、本明細書の一部を構成している添付図面を参照して、本発明の例示
実施形態について詳しく説明するが、図示の実施形態は、本発明が実施されると
きの特定実施形態を例示したものである。これらの実施形態は、この分野の精通
者が本発明を実施することを可能にする程度に詳しく説明されているが、当然に
理解されるように、他の実施形態を利用することも可能であり、また、本発明の
精神と範囲から逸脱しない限り、論理的、機械的、電気的および他の変更を行う
ことも可能である。従って、以下の詳細説明は、限定的なものではなく、本発明
の範囲は特許請求の範囲によってのみ解釈されるものである。
【0010】 以下の詳細説明の中には、コンピュータメモリ内のデータビットに対するオペ
レーション(操作、演算)をアルゴリズムとシンボルで表して示されている部分
がある。これらのアルゴリズムの説明と表現は、データ処理分野の精通者が使用
すると、作業の内容を他の精通者に最も効果的に伝えることができる手段となる
ものである。アルゴリズムとは、本明細書においても、一般的にも、所望の結果
に導く、それ自身が統一されたステップのシーケンスであると考えられている。
ステップとは、物理量の物理的操作を必要とするステップである。通常は、必ず
しもそうとは限らないが、これらの物理量は、ストアし、転送し、結合し、比較
し、その他の操作をすることができる電気的または磁気的シグナルの形体になっ
ている。
【0011】 これらのシグナルを、ビット、値、エレメント、シンボル、文字、用語、数な
どで表すと、一般に広く使用されていることから、時には好都合であることが実
証されている。なお、ここで留意しておくべきことは、これらの用語と類似用語
は、該当する物理量と関連付けられるので、これらの物理量に付けられる便利な
ラベルにすぎないことである。以下の説明から明らかであるように、特に断りが
ない限り、本明細書全体を通して、処理する、コンピューティングする、計算す
る、判断する、表示する、といった用語を使用している説明個所はコンピュータ
システムのレジスタやメモリ内に物理(電子)量で表されているデータを操作し
て、コンピュータシステムのメモリやレジスタまたは他の情報ストレージ、伝送
またはディスプレイデバイス内に同じように物理量で表されている他のデータに
変換するコンピュータシステムまたは類似エレクトロニックコンピューティング
デバイスのアクションとプロセスのことを指している。
【0012】動作環境 図1を参照して説明すると、図1は、本発明の実施形態が実施に関連するハー
ドウェアと動作環境を示す図である。図1の記載は、本発明が実現されるときに
用いられる適当なコンピュータハードウェアの概要を要約して説明したものであ
る。必ずしもその必要はないが、本発明は、プログラムモジュールのように、パ
ーソナルコンピュータなどのコンピュータによって実行されるコンピュータ実行
可能命令という広い意味で説明されている。一般的に、プログラムモジュールと
しては、特定のタスクを実行し、あるいは特定の抽象データ型を実行している、
ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などがある
【0013】 さらに、この分野の精通者ならば理解されるように、本発明は、他のコンピュ
ータシステム構成で実施することも可能であり、その中には、ハンドヘルドデバ
イス、マイクロプロセッサシステム、マイクロプロセッサベースまたはプログラ
マブルコンシューマエレクトロニクス、ネットワークPC、ミニコンピュータ、メ
インフレームコンピュータなどが含まれている。また、本発明は、コミュニケー
ションネットワークを通してリンクされているリモート処理デバイスによってタ
スクが実行されるような、分散コンピューティング環境で実施することも可能で
ある。分散コンピューティング環境では、プログラムモジュールは、ローカルと
リモートのどちらのメモリストレージデバイスにも置いておくことが可能である
【0014】 本発明を実現するための、図1に示す例示ハードウェアと動作環境は、コンピ
ュータ20の形体になった汎用コンピュータデバイスを含み、そこには、処理ユ
ニット21、システムメモリ22、およびシステムメモリを含む種々システムコ
ンポーネントを動作可能に処理ユニット21に結合しているシステムバス23が
含まれている。処理ユニット21は1つだけのこともあれば、2つ以上のことも
あり、コンピュータ20のプロセッサは、単一の中央処理ユニット (central-pr
ocessing unit CPU)、または並列処理環境と一般に呼ばれている複数の処理ユ
ニットを装備している。コンピュータ20は、従来のコンピュータ、分散コンピ
ュータ、または他のタイプのコンピュータにすることが可能であるが、本発明は
それだけに限定されるものではない。
【0015】 システムバス23は、複数タイプのバス構造のいずれかにすることが可能であ
り、その中には、種々のバスアーキテクチャのいずれかを採用しているメモリバ
スやメモリコントローラ、ペリフェラル(周辺)バス、およびローカルバスが含
まれている。システムメモリは単にメモリと呼ばれることもあり、その中には、
リードオンリメモリ (read only memory ROM) 24とランダムアクセスメモリ
(random access memory RAM) 25が含まれている。基本入出力システム (bas
ic input/output system BIOS) 26は、スタートアップ時のときのように、コ
ンピュータ20内のエレメント間で情報を転送するのを支援する基本ルーチンか
ら構成され、ROM 24に格納されている。コンピュータ20は、さらに、ハード
ディスク(図示せず)との間で読み書きするハードディスクドライブ27、取り
外し可能磁気ディスク29との間で読み書きする磁気ディスクドライブ28、お
よびCD-ROMや他の光メディアのような、取り外し可能光ディスク31との間で読
み書きする光ディスクドライブ30を装備している。
【0016】 ハードディスクドライブ27、磁気ディスクドライブ28、および光ディスク
ドライブ30は、それぞれハードディスクドライブインタフェース32、磁気デ
ィスクドライブインタフェース33、および光ディスクドライブインタフェース
34を介してシステムバス23に接続されている。これらのドライブとそれぞれ
の関連コンピュータ読取可能媒体は不揮発性ストレージとして、コンピュータ2
0のためのコンピュータ読取可能命令、データ構造、プログラムモジュールおよ
び他のデータを格納している。この分野の精通者ならば理解されるように、磁気
カセット、フラッシュメモリカード、デジタルビデオディスク、ベルヌーイ (Be
rnoulli) カートリッジ、ランダムアクセスメモリ (RAM)、リードオンリメモリ
(ROM) などのように、コンピュータによってアクセス可能なデータを格納してお
くことができるものならば、どのタイプのコンピュータ読取可能媒体でも例示動
作環境で使用することが可能である。
【0017】 いくつかのプログラムモジュールは、ハードディスク、磁気ディスク29、光
ディスク31、ROM 24、またはRAM 25に格納しておくことが可能であり、そ
の中には、オペレーティングシステム35、1つまたは2つ以上のアプリケーシ
ョンプログラム36、他のプログラムモジュール37、およびプログラムデータ
38が含まれている。ユーザは、キーボード40やポインティングデバイス42
などの、入力デバイスを通してコマンドや情報をコンピュータ20に入力するこ
とができる。他の入力デバイス(図示せず)としては、マイクロホン、ジョイス
ティック、ゲームパッド、サテライトディッシュ、スキャナなどがある。上記お
よび他の入力デバイスは、システムバスに結合されたシリアルポートインタフェ
ース46を通して処理ユニット21に接続されていることがよくあるが、パラレ
ルポート、ゲームポート、またはユニバーサルシリアルバス (universal serial
bus USB) などの、他のインタフェースを介して接続することも可能である。
モニタ47や他のタイプのディスプレイデバイスも、ビデオアダプタ48などの
インタフェースを介してシステムバス23に接続されている。モニタのほかに、
コンピュータは、スピーカやプリンタなどの、他のペリフェラル(周辺)出力デ
バイス(図示せず)を実行しているのが代表的である。
【0018】 コンピュータ20は、リモートコンピュータ49などの、1つまたは2つ以上
のリモートコンピュータとの論理コネクションを使用するネットワーキング環境
で動作することができる。これらの論理コネクションは、コンピュータ20に結
合されたコミュニケーションデバイスまたはコンピュータ20の一部によって達
成されている。なお、本発明は、特定タイプのコミュニケーションデバイスに限
定されない。リモートコンピュータ49は、別のコンピュータ、サーバ、ルータ
、ネットワークPC、クライアント、ピア(peer)デバイスまたは他の共通ネット
ワークノードにすることが可能であり、図1にはメモリストレージデバイス50
だけが示されているが、コンピュータ20に関連して上述したエレメントの多く
または全部を含んでいるのが代表的である。図1に示す論理コネクションとして
は、ローカルエリアネットワーク (local area network LAN) 51と広域ネッ
トワーク (wide-area network WAN) 52がある。このようなネットワーキング
環境は、オフィスネットワーク、企業内コンピュータネットワーク (enterprise
-wide computer network)、イントラネット (intranet) およびインターネット
(the Internet) で普及しており、これらはいずれも一種のネットワークである
【0019】 LANネットワーキング環境で使用されるときは、コンピュータ20は、一種の
コミュニケーションデバイスであるネットワークインタフェースまたはアダプタ
53を通してローカルネットワーク51に接続されている。WANネットワーキン
グ環境で使用されるときは、コンピュータ20は、インターネットなどの広域ネ
ットワーク52上のコミュニケーションを確立するための、一種のコミュニケー
ションデバイスであるモデム54、または他のタイプのコミュニケーションデバ
イスを装備しているのが代表的である。モデム54は内蔵型と外付け型があり、
どちらも、シリアルポートインタフェース46を介してシステムバス23に接続
されている。ネットワーキング環境では、パーソナルコンピュータ20に関連し
て上述したプログラムモジュールまたはその一部は、リモートメモリストレージ
デバイスに格納しておくことができる。以上から理解されるように、図示のネッ
トワークコネクションは単なる例示であり、コンピュータ間のコミュニケーショ
ンを確立する他の手段やコミュニケーションデバイスを使用することも可能であ
る。
【0020】ユーザの目標を判断するためのタスク抽象階層 「詳細説明」のこのセクションでは、異なる精細レベルを表しているタスク抽
象階層を使用してユーザの目標を判断していくことによって、対話型コンピュー
タとユーザとの対話を実現する一般的概念が説明されている。本発明の少なくと
も一部の実施形態では、タスク抽象階層は、コンピュータとユーザとの改善され
た対話を達成する上で重要になっている。
【0021】 「発明の背景」セクションで言及したように、ダイアログの重要な側面は、コ
ミュニケーションされる情報または目標の性質に関して継続的に推論し、意思決
定することである。不確実性の下にある情報収集と意思決定は、対話では中心的
役割を果たしている。不確実性の管理は、キーとなる不確実性を明確化する上で
、およびダイアログを該当の詳細レベルに導き、そこで情報をやりとりしたり、
質問をしたりする上で役立つと思われる、分析的な質問(discriminating quest
ions)を形成する際に重要になることがよくある。
【0022】 ここで説明しているタスク抽象階層は、本発明の少なくとも一部の実施形態で
は、ユーザとの対話における不確実性、特に共同活動 (joint activity) のコン
テキスト(なお、これに限定されない)における不確実性を、コンピュータで管
理するときに利用すると便利である。この共同活動は、参加者、セッティング(
情景)、および特に、各参加者が妥当であると考えている貢献の種類に制約のあ
る、タスク中心の社会的イベントである行動 (behavior) を説明するために、心
理言語学者によって使用されている用語である。共同活動における参加者は、作
業に関して共通の利益を共有しているものと想定しており、その中には、他の参
加者の想定された役割と責任が含まれている。例えば、受付係ドメイン(行動圏
) (receptionist domain) は、受付係が精通しているものと他の参加者が期待
しているタスクを、他の参加者のために手助けする共同活動である。受付係の主
要タスクは、他の参加者が活動で定義された目標を達成するのを、迅速かつ協力
的に手助けすることである。
【0023】 次に、図2を参照して説明すると、図2は、本発明の実施形態に従って使用で
きる、代表的なタスク抽象階層を示す図である。このタスク抽象階層200によ
ると、ユーザの目標を判断するという問題を、連続する詳細レベルで診断される
ように分解することができる。このように分解すると、最終的に、改善されたコ
ンピュータとユーザとの対話が得られることになる。
【0024】 タスク抽象階層200は、図2に示すように、ゼロ番目レベル202といった
ように、いくつかのレベル0 . . kに分割されている。各レベルは、第1レベル
の目標204と目標206といったように、1つまたは2つ以上の目標をもって
いる。ゼロ番目レベル202は目標が最も抽象化されており、このことは、ユー
ザが階層200によってモデル化されたコンピュータとユーザとの対話コンテキ
ストにおいて、目標をもっていることを示している。あるレベルの各目標は、次
レベルで2つまたはそれ以上の目標になるように連続的に精細化され、あるレベ
ルになると、目標はこれ以上精細化できないようになっている。
【0025】 従って、初期抽象レベルでユーザの目標について推論することにより、タスク
抽象階層200をナビゲーションして行くと、ナビゲーションが行われているカ
レント抽象レベルに対して正しい情報が求められる仕方が得られるので、レベル
を下方に向かってナビゲーションして行くのに伴い、ユーザの目標に関するより
具体的な情報が、人間と人間との対話に矛盾しない形で求められることになる。
あるレベルでの情報収集は、レベル2での円形矢印208のように、図2に円形
矢印で示されている。
【0026】 例えば、受付係ドメイン内では、大きな企業キャンパス(構内)の建物の受付
係側から見たとき、第1レベル目標(つまり、レベル1の目標1 . . n)には、
シャトル(定期往復運転の乗物)を呼んでキャンパスの別の部分に移動させる要
求、建物内に入る要求、なにかをピックアップする(持ち上げる)要求、なにか
をドロップする(降ろす)要求、指示を求める要求、情報に関する質問 (query)
に対して応答を求める要求、公共輸送を利用して通勤するときパスを求める要
求、ファックスを送信する要求、ポスタを貼る要求、ポスタを取り除く要求、な
どを含めることができる。本発明の一実施形態では、セットになった目標を網羅
的にするために、そのリストの中で明示的に考慮されていない目標のことを指す
ために、別の目標が使用されている。
【0027】 次レベルの目標、つまり、レベル2は、上位レベルの目標がより具体的な目標
に精細化されていることを示している。例えば、シャトルをキャンパスの別の部
分へ走行させることを要求する目標をレベル2で精細化することには、受付係ド
メイン側から見たとき、ある人についてはメインキャンパスロケーション(主構
内位置)へシャトルすること、ある人については予備的キャンパスロケーション
へシャトルすること、ある人については外部(オフサイト)ロケーションへシャ
トルすること、グループについてはメインキャンパスロケーションへシャトルす
ること、ある人については予備的キャンパスロケーションへシャトルすること、
グループについては外部(オフサイト)ロケーションへシャトルすること、など
を含めることができる。さらに、次レベルの目標、つまり、レベル3は、身体障
害者を運ぶといった特殊ケースの場合や、上級重役を急行シャトルで運ぶ場合に
、シャトルのタイプを追加指定することを考慮することができる。
【0028】 ユーザの目標をいくつかの詳細レベルに分解すると、前述したように、徐々に
詳細化させながら共用理解(shared understanding)に向かう自然収束経路上を
、対話を導いて行くことが可能になる。また、レベルを複数にすると、各レベル
での不確実性に関する共通基礎を確立すること、および特定レベルで理解または
誤解について対話してから次レベルへ進むようにすることも可能になる。ユーザ
に対しては、ユーザの目標に関する自然ダイアログの一部として、あるレベルで
の誤解を黙示的または明示的に確認または否認するように指示し、不確実性が減
少してから次レベルへ進むようにすることができる。また、分解を行うと、各レ
ベルで管理しやすくなるモデルに推論が集中されることになる。
【0029】 「詳細説明」の以下に続くセクションに説明されているように、本発明の少な
くとも一部の実施形態では、ダイアログ(対話)は、コンピュータとユーザが協
力し合って各レベルでの目標を明確化する方法がとられており、これは、最も有
益な質問をするか、あるいはそのレベルで最も有用な非言語的証拠 (non-lingui
stic evidence) を収集し、そのレベルでの目標を確認することを試みることに
よって行われている。カレントレベルでの発言者の目標が確認されるか、強い確
信が得られると、システムはその証拠を次の詳細化された解析レベルへ渡し、そ
の次レベルでその確信を精細化することを試みることができる。これは、ユーザ
の目標について結論が得られるまで続けられる。
【0030】目標の精細化(タスク抽象階層の構築) このセクションでは、本発明の少なくとも一部の実施形態による方法のもので
、タスク抽象階層がどのようにして構築されるか、つまり、目標がどのようにし
て他の目標に精細化されるかが説明されている。なお、本発明は、このセクショ
ンで説明している方法に限定されるものではない。
【0031】 この分野の通常の知識を有する者ならば理解されるように、ベイズ (Bayesian
) ネットワークは、複数の情報クラスの関連性 (relevance) を1つに融合する
能力を備えている。そのために、発言(つまり、聴覚的または言語的情報)から
も、ビジュアル情報のような非聴覚的情報からも、ユーザの目標について推論す
ることが可能になっている。ベイズネットワークによると、入力情報がもっと抽
象化された目標(ただし、存在する場合)と共に与えられていれば、精細化され
た目標ごとにその確率を生成することが可能になっている。これらの確率にアク
セスすることにより、コンピュータは、情報価値の計算に基づいて質問をするこ
とに導くことが可能になる(これは、「詳細説明」の次のセクションに説明され
ている)。
【0032】 従って、本発明の一実施形態では、ベイズネットワークが、タスク階層の異な
るレベルに対して構築されている。望ましいことは、これらのネットワークが言
語的観察 (linguistic observations) と非言語的観察 (non-linguistic observ
ations) を考慮することである。非言語的観察によると、ユーザの外観、ロケー
ション、および移動軌跡 (trajectory of locomotion) に関するビジュアルフィ
ーチャ(視覚的特徴)といった、追加のコンテキスト情報が得られる(これらは
、例えば、大きな建物のフロントデスクでさまざまな人、質問、および要求に応
対する受付係がサービスする役割のドメインにおいて有用である)。
【0033】言語的証拠(観察) この分野の通常の知識を有する者ならば理解されるように、本発明の少なくと
も一部の実施形態でコンピュータとユーザとの自然の対話を達成するための1つ
の側面は、コンピュータがユーザからの言語的観察にアクセスできることである
。ユーザからの発言は、構文(シンタックス)、長さ、および特徴が変化する可
能性がある。従って、「詳細説明」のこのセクションでは、本発明の一実施形に
従って言語的証拠にアクセスし、処理する方法が説明されている。
【0034】 最初に、喚起的なワードとフレーズの集まりが、コンピュータとユーザとの所
望の対話コンテキスト(例えば、上述した受付係ドメイン)における発言の中で
特定される。これらのワードとフレーズは、この分野ではメタニムス (metanyms
) として知られている。自動化自然言語処理 (natural language processing N
LP) を使用すると、シンタクティックな特徴とセマンティックな特徴などのよう
な、よりハイレベルの言語的抽象を、観察変数としてベイズモデルに導入するこ
とが可能になる。なお、本発明では、そうすることは必ずしも要件になっていな
い。NLPは、この分野では公知である。一実施形態では、使用されるNLPは、NLPw
inと呼ばれるシステムであり、これは、Microsoft Research Natural Language
Processing Groupによって開発されたものである。なお、本発明はそれだけに限
定されるものではない。
【0035】 このNLPwinは、以下に示す文献に記載されているシステムをベースにしている
。すなわち、S. D. Richardson著「統計的処理をルールベース自然言語パーサに
ブートストラップする (Bootstrapping statistical processing into a rule-b
ased natural language parser)」(Proceedings of the Workshop on Combining
Symbolic and Statistical Approaches to Language, pages 96-103 (1994))
に説明されている。NLPwinは、さらに具体的には、George E. Heidorn著「イン
テリジェントライティングアシスタンス(Intelligent Writing Assistance)」(A
Handbook of Natural Language Processing Techniques (Marcel Dekker 1999)
(R. Dale他編集) (ISBN 0-8247-9000-6))、Karen Jensen、George E. Heidorn
およびStephen D. Richardson編集「自然言語処理:PLNLPアプローチ(Natural L
anguage Processing: The PLNLP Approach)」(Kluwer Academic Publishers, Bo
ston, 1993 (ISBN 0792392795))、さらに詳しくは、S. D. Richardson、Lucy Va
nderwende、William Dolan共著「自然言語解析のためのディクショナリベースと
例示ベースの方法の結合(Combining Dictionary-Based and Example-Based Meth
ods for Natural Language Analysis)」(MSR-TR-93-08, June 1993とS. D. Rich
ardson、William Dolan、Lucy Vanderwende共著「MindNet:テキストからのセマ
ンティック情報の獲得と構造化(MindNet: acquiring and structuring semantic
information from text)」(MSR-TR-98-23, May 29, 1998)。
【0036】 NLPwinでは、システムは、5ステージの解析で各発言を処理することによって
、よりハイレベルな言語的抽象である、シンタクティック(構文上)、論理上、
およびセマンティック(意味論上)のキュー (cue:合図) を出力し、これらを
使用して目標を区別することを可能にしている。第1ステージでは、システムは
、入力された発言を個々のトークン(字句)にセグメント(区分)化し、その語
形構造によってワードを解析し、オンラインディクショナリ(辞書)でこれらの
ワード(語)を調べるが、このディクショナリの中には、特にマルチワードエン
トリ用に作り替えられたソース(情報源)が含まれている。第2ステージは、シ
ンタクティックスケッチ (syntactic sketch) とも呼ばれ、そこでは、システム
は、文法規則に基づいて発言をそのシンタクティックコンポーネント(構文成分
)に構文解析 (parse) する。第3ステージはシンタクティックポートレート (s
yntactic portrait) とも呼ばれ、そこでは、システムは、オンラインディクシ
ョナリの定義から派生された、コンパイル済み解析から抜き出されたセマンティ
ック関係 (semantic relation:意味関係、概念同士の論理関係) を使用して、
付加曖昧性 (attachment ambiguities) を解決する。最初の3ステージからは、
シンタクティックキューをもつベイズモデルが得られる。第4ステージでは、シ
ステムは、照応指示 (anaphoric reference) を解決し、発言の論理形体を構築
してから、深層主語 (deep subject) や深層間接目的語 (deep indirect object
) などの、機能的役割にセンテンスエレメント(文要素)を割り当てることによ
って述語項関係 (predicate-argument relation) をセマンティックグラフ(意
味グラフ)で表している。最後に、NLPwinは、発言の中のワードについて最も該
当する意味を、意味リストから判断することを試みて、セマンティックキューを
出力する。
【0037】観察とダイアログを導くための情報の価値 「詳細説明」のこのセクションでは、本発明の一実施形態による情報の価値 (
value of information VOI)(これは情報の期待価値 (expected value of info
rmation - EVI) 解析としても表されている)を通した情報収集が説明されてい
る。例えば、情報が、このセクションで説明されているように、どのように収集
されるかは、すでに説明したように、図2に円形矢印で示すように表すことがで
きる。すなわち、このセクションで説明されている情報収集の仕方を利用すると
、図2を参照して説明したタスク抽象階層(task abstraction hierarchy)のカ
レントレベルで情報を取得することができる。
【0038】 収集するのに最も価値のある追加観察を特定して、不確実性を解決し、実世界
で最終的にとられるアクション(行動)の価値を向上することは、決定理論的診
断(または解析)では重要な側面となっている。情報価値 (VOI) 解析は、この
分野では公知であるように、タスク抽象階層 (task decomposition hierarchy)
の、あるレベルでの異なる目標またはサブ目標の推論確率に照らして、および情
報を収集するコストと、新情報があるときと無いときにアクションをとるときの
コストと利益に照らして、尋ねるべき最良質問および行うべき観察を特定するた
めに採用されている。すなわち、VOIによると、情報価値と不確実性の下で観察
を行うコストを考慮することにより、以前に観察されなかった証拠の異なる部分
を評価する期待有用性(expected utility)が得られる。VOIを計算するには、
行うことのできる観察ごとに、最良決定の期待有用性は、観察の対象となる各々
の値に関連付けられる。次に、解析では、各々の値の期待有用性が、観察が行わ
れると異なる値が現れる確率で重み付けされて総和される。
【0039】 図3(a) は、本発明の一実施形態によるVOI/EVI情報収集プロセス(処理)の
方法をフローチャートで示したものである。コンピュータ実行の方法は、望まし
くは、少なくともその一部が、コンピュータ上で実行される1つまたは2つ以上
のプログラムとして実現されている。すなわち、メモリなどのコンピュータ読取
可能媒体からコンピュータのプロセッサによって実行されるプログラムとして実
現されている。このプログラムは、望ましくは、フロッピディスクやCD-ROMなど
のマシン読取可能媒体に格納しておけば、別のコンピュータに配布し、インスト
ールしたあとで、そこで実行することが可能になる。
【0040】 302で、タスク抽象階層のカレントレベルでのユーザの目標とサブ目標に関
する推論が、現在利用可能な情報に基づいて行われる。304で、以前に未観察
であった証拠の追加部分を取得する期待有用性が、前述したように、その追加有
用性を取得する期待コストと共に判断される。証拠部分が無いため、その証拠部
分を受け取るコストが情報の有用性より小であれば、この方法は306へ進み、
そこで終了する。そうでなければ、この方法は308へ進み、最も有用な情報(
つまり、最大有用性をもつ証拠部分)が、例えば、ダイアログを通して収集され
る。次に、別の推論が302で行われ、プロセスは、追加の証拠部分を収集する
コストがその有用性よりも大になるまで繰り返される。従って、図3(a) の方法
は、可能な限り最良の情報を、VOI解析に基づいて収集するので、その情報を収
集する有用性がその収集コストよりも大でなければ、情報は収集されないという
利点がある。
【0041】 以下では、もっと公式的な仕方でコストと利益を考慮する方法について説明す
る。アクションA*の即時アクションを表す値は、その期待有用性であり、これは
次式のように書くことができる。
【0042】
【数1】
【0043】 上記において、u(Ai,Hj) は、ユーザが目標Hj をもっているときの特定アクショ
ンAi の有用性であり、p(Hj|E) は、観察され、かつバックグラウンドの証拠Eの
カレント集合が与えられているときの、ユーザ目標Hj の確率である。従って、
別の観察ex が行われたときは、アクションA*' の新期待有用性は次のようにな
る。
【0044】
【数2】
【0045】 上記において、ex は、テストの結果によっては、異なる値ex,k をとることがあ
る。従って、観察ex を行う次の価値は、その観察をもつアクションをとる期待
有用性から、その観察をもたないときアクションをとる期待有用性を差し引き、
さらに、観察を行うコストC(ex) を差し引いたもの、つまり、次の通りである。
【0046】
【数3】
【0047】 この分野の通常の知識を有する者ならば理解されるように、VOIを正確に計算
するには、起こり得るあらゆる観察シーケンスを考慮する必要がある。しかるに
、貪欲算法による(greedy) VOIは、観察するのに次善の、単一の最良証拠部分を
計算することが中心になっているので、VOIを近似化するのに好都合であること
がよくあるため、本発明の一実施形態で利用することができる。もっと具体的に
は、情報理論的VOIを利用することで、観察するのに次善の言語的および非言語
的証拠を特定して、タスク抽象階層のカレントレベル内のカレント不確実性を解
決することができる。従って、貪欲算法によるVOI解析は、タスク抽象階層の各
レベル内で利用されて、質問をすることを制御し、非言語的証拠にアクセスする
ことについて決定を行っている。新観察が評価されるたびに、図3(a) の方法に
関連して説明したように、システムは、タスク階層のレベル内の個別目標または
サブ目標の確率を更新し(つまり、推論を行い)、VOIを再計算する。
【0048】 従って、階層のレベル内では、VOIは、観察を評価する期待コストが観察の期
待値を超えるまで、および/または行うべき観察がなくなるまで(これは、図3(
a) の方法では説明されていない)続けられ、さもなければ、もっとハイレベル
の決定理論的解析は、「詳細説明」の次のセクションで説明するように、システ
ムを次レベルへ進めることになる。
【0049】タスク抽象階層のレベルのナビゲーション 「詳細説明」のこのセクションでは、タスク抽象階層のレベル間の前進 (prog
ression) と後退 (retreat) が、本発明の一実施形態によればどのように行われ
るかが説明されている。一特定実施形態では、その仕方は特定の方法と関連付け
て説明されており、そのフローチャートは図5に示されている。なお、本発明は
それだけに限定されるものではない。
【0050】 ある詳細レベルで目標が確認され、強い確信が与えられていれば、もっと詳細
な解析レベルで目標について推論し、質問をし、確認を行うために先に進むこと
が妥当な場合がある。例えば、対話の途中で、参加者の一人が、別の参加者の目
標について直接的確認を求めることがある。しかし、明示的に推論を行うと、コ
ストがかかることになる。対話の初期で不十分な推論を行うことは不自然であり
、ユーザは、対話しているエージェントは先走っているか、あるいは明らかな手
がかり(clue)を考慮していないと思うことになる。具体的には、対話を行って
いる人の相手側は、与えられた証拠から目標を理解しているのが代表的であるた
め、そのような状況で目標について直接的質問を行うと、コストが大になる。別
の方法として、エージェントは、情報収集したあとに続いて、代替目標の確率に
基づいて黙示的決定を行って、カレントレベルでの目標を想定することも可能で
ある。ここで誤った推論を行うと、ユーザはその決定について対話する機会を失
うことになるので、コストがかかることになる。
【0051】 上記バックグラウンド(背景)の下で、図5の方法によると、タスク抽象階層
のレベル間のナビゲーションは、自然な方法で行われることになる。このコンピ
ュータ実行の方法は、望ましくは、その一部がコンピュータ上で実行される1つ
または2つ以上のプログラムとして実現されている。すなわち、メモリのような
コンピュータ読取可能媒体からコンピュータのプロセッサによって実行されるプ
ログラムとして実現されている。このプログラムは、望ましくは、フロッピディ
スクやCD-ROMなどのマシン読取可能媒体に格納しておけば、別のコンピュータに
配布し、インストールしたあとで、そこで実行することが可能になる。
【0052】 500で、この方法は最上位レベルであるレベル0、具体的には、そのレベル
の目標からスタートする。すなわち、カレントレベルは、階層の第1レベルにセ
ットされている。そのあと、502で、情報収集が行われる。すなわち、情報は
、タスク抽象階層のカレントレベルに関するものが受取りされ、コンピュータと
ユーザとの対話コンテキストにおけるユーザの目標が評価される。502で収集
された情報が十分であるかどうかも、評価される。不十分であれば、方法は50
2に留まって、追加情報を収集する。502は、一実施形態では、「詳細説明」
の前セクションで説明したように、情報価値解析によって行うことができる。
【0053】 502で受けとられ情報には、多数のタイプのものがあるが、本発明はそれだ
けに限定されるものではない。例えば、情報としては、テキスト情報、オーディ
オ情報、イメージ/ビデオ情報、またはその他の情報が可能である。情報の受取
りは、特にオーディオ情報(例えば、発言)のコンテキストでは、ユーザとやり
とりすることによって行われるのが代表的である。従って、本発明によれば、最
初にユーザに質問の形で(第2)情報を与え、そのあとこの情報に対する応答を
待ち、ダイアログ(対話)が行われるようにしている。本方法によって与えられ
る情報は、オーディオ情報(例えば、スピーチ)やイメージ/ビデオ情報(例え
ば、ディスプレイデバイス上のエージェントの挙動)にすることも、他の情報に
することも可能である。なお、本発明はそれだけに限定されるものではない。
【0054】 この分野の通常の知識を有する者ならば理解されるように、あるレベルのとき
に受取りされる情報(従って、そのレベルに関係する情報)は、階層の別の、よ
り詳細なレベルに関係していることもある。従って、本発明の少なくとも一部の
実施形態では、あるレベルのときに受取りされる情報は、すべてのレベルに利用
できるので、正しい判断が生成されることになる。
【0055】 502で受取りされた情報が十分であると判断されると、例えば、情報価値 (
VOI) 解析のコンテキストでは、追加情報を取得する期待コストはその情報の期
待有用性よりも大であるので、一特定実施形態では、2つの推論確率が判断され
ることになるが、本発明はそのことだけに限定されるものではなく、これについ
ては、以下で詳しく説明する。一実施形態における推論確率は、ベイズネットワ
ークの使用によって生成される。
【0056】 本発明の別実施形態では、この分野の通常の知識を有する者ならば理解される
ように、ここで説明するように完全判定解析 (complete decision analysis) で
はなく、近似判定解析 (approximate decision analysis) が行われる。この解
析によると、最高確率をもつ目標に関する特殊確率の集合を考慮することによっ
て、アクションを導くことが可能になる。例えば、確率しきい値の集合は、アク
ションを導くように開発されており、そのアクションは、アクションをとるとき
のコストと利益を不確実性の下で考慮することによって導き出されようになって
いる。とられるアクションとしては、アクションをとる前に推量 (guess) を確
認すること、確認なしで前進すること、情報の収集を続けること、および後退し
て次に上位の解析レベルに戻ること、がある。このような確率しきい値が開発さ
れるときの仕方は、「メッセ−ジングとスケジューリングのための自動化サービ
スを指示するためのシステムと方法(Systems and Methods for Directing Autom
ated Services for Messaging and Scheduling)」という名称で、1999年4月20日
に出願され、係属中の特許出願第09/295,146号 [docket no. 1018.014US1](本
件出願人に譲渡済み)に記載されているアプローチに類似している。なお、この
特許出願の内容は、この分野の通常の知識を有する者ならば理解されるように、
引用により本明細書の一部に含まれている。すなわち、確率しきい値は、1999年
4月20日出願の特許出願に記載されているように、「インアクション(無活動)
」対「アクションに関するダイアログ」対「アクション」としてではなく、むし
ろ、「アクションをとる」対「アクションをとる前に確認」対「確認なしで前進
」対「情報収集の継続」対「後退して次の上位解析レベルに戻る」として判断さ
れる。
【0057】 504で判断される推論確率を、図3(b)に示すベイズネットワークの図を参
照して詳しく説明する。なお、この分野の通常の知識を有する者ならば理解され
るように、説明の便宜上、図3(b) のベイズネットワークには、どの情報入力(
つまり、言語的または非言語的観察)も示されていない。むしろ、精細化された
目標702、704および706(すなわち、目標1 . . . n)が精細度の低い
(つまり、抽象度の高い)目標700に従属することが示されているだけである
【0058】 すなわち、目標700が与えられていて、評価された情報入力が与えられてい
ると、それぞれの目標がユーザの実際の目標であるとする、推論確率ipが各目標
702、704および706に対して得られる。本発明の目的上、目標700が
与えられているときの推論確率p1は、目標1 . . . nに対応する推論確率ip1 . .
. ipnの最大値であると定義されている。推論確率ip1 . . . ipnは、初期推論
確率と呼ばれる。言い換えれば、抽象目標700が与えられているとき、最大尤
(maximum likelihood) をもつ精細化目標1 . . . nは、対応するipが最高であ
る精細化目標1 . . . nである。
【0059】 図3(b) のベイズネットワークを参照して、第2推論確率も定義されている。
この第2推論確率は、カレントレベルへ進んだのは誤りであり、その代わりに、
直前レベルへ戻るべきであるとする確率p2である。しかし、図3(b) のコンテキ
ストでは、リターン目標708はカレント目標700の別のサブ目標になってい
る。
【0060】 言い換えれば、図3(b) では、カレントレベルのカレント目標は目標700と
して示されている。この目標には、サブ目標702、704および706のよう
に、n個のサブ目標があり、これらは、すべてがタスク抽象階層の次レベルに置
かれている。目標700には、リターンサブ目標708もあり、これはタスク抽
象階層の直前レベルに戻る目標である。サブ目標702、704および706の
各々は推論確率をもち、第1推論確率が最大尤をもつサブ目標の推論確率になる
ようになっている。従って、初期推論確率は各々のサブ目標について判断され、
第1推論確率は、最高確率をもつサブ目標の推論確率になっている。第2推論確
率は、リターンサブ目標708の推論確率になっている。
【0061】 図5に戻って説明すると、第1と第2推論確率の判断は、本発明の一実施形態
では、図3(b) を参照して上述したようにベイズネットワークによって行われる
。次に、506で(その後、510で)、第1推論確率は2つのしきい値、すな
わち、前進しきい値と推量しきい値と突き合わせて解析される。この2しきい値
は、それぞれ、p*前進しきい値およびp*推量しきい値と呼ぶことができる。
【0062】 第1推論確率がp*前進しきい値よりも大であると506で判断されたときは、
そのことは、確率が508でタスク抽象階層の次レベルへ前進するのを保証する
だけ十分に大であること、つまり、具体的には、カレントレベルの最大尤目標(
つまり、最高初期推論確率をもつ目標)で階層のカレントレベルを次レベルへ進
めることを意味している。そのあと、本方法は502へ戻り、その次レベルで情
報を収集する。
【0063】 第1推論確率がp*前進しきい値よりも大でなければ、本方法は、その代わりに
510へ進み、そこで、確率が抽象階層の次レベルへ進むのを保証するだけ十分
に大であるかどうかが判断されるが、これは、ユーザからの確認を得て行われる
。従って、次レベルへ進むことに関して、512でユーザとのダイアログに入る
ことになる。確認されていれば、本方法は514から508へ移って次レベルへ
進んだあと、本方法は502に戻って継続し、その新レベルで情報を収集する。
そうでなければ、本方法は516へ進む。
【0064】 従って、516へたどり着くのは、第1推論確率がp*前進しきい値とp*推量し
きい値のどちらよりも大でないか、あるいはp*推量しきい値よりも大であるが、
ユーザがレベル前進を確認しなかった場合である。そのあと、516で、直前レ
ベルに戻るべきか(後退すべきか)どうかが判断される。つまり、第2推論確率
がしきい値よりも大であれば(なお、このしきい値はp*リターンと呼ぶことがで
きる)、直前レベルは518に戻されるので、本方法は502に戻って、直前レ
ベルで情報を受取ることになる(一実施形態では、直前レベルに戻るとき、それ
に見合った謝罪 (apology) または弁明 (justification) が与えられるので、対
話の自然さが保たれることになる)。そうでなければ、本方法は502に戻り、
追加情報がカレントレベルで受取りされる。
【0065】 p*推量、p*前進、およびp*リターンの各しきい値を理解しやすくするために、
これらのしきい値の相互関係を示している図4(a) と図4(b) を参照して説明す
ることにする。図4(a) では、例えば、マッピング400は、第1推論確率が左
から右へ向かって大きくなると、異なる領域402、404および406に入る
ようになっており、そこでは、これらの領域の境界は、p*推量408とp*前進4
10で示されている。従って、推論確率がp*推量408より小であれば、その確
率は領域402に置かれているので、本方法はカレントレベルに残っている。推
論確率がp*推量408よりも大であるが、p*前進410より小であれば、その確
率は領域404に置かれているので、次レベルへ進むべきかどうかに関してユー
ザとのダイアログに入ることになる。最後に、推論確率がp*前進410よりも大
であれば、その確率は領域406に置かれているので、自動的に次レベルへ進む
ことになる。
【0066】 同様に、図4(b)に示すように、マッピング450は、第2推論確率が左から
右へ向かって大きくなっていくと、その境界がp*リターン456で示されている
ように、異なる領域452と454に入っていく。従って、第2推論確率がp*リ
ターン456より小であれば、その確率は領域452に置かれているので、本方
法は同じレベルに留まっている。第2推論確率がp*リターン456よりも大であ
れば、その確率は領域454に置かれているので、本方法は直前レベル454に
戻ることになる(一実施形態では、直前レベルに戻るとき、それに見合う謝罪ま
たは弁明が与えられるので、対話の自然さが保たれることになる)。この分野の
通常の知識を有する者ならば理解されるように、図4(a)の3領域と同じように
、直前レベルへ戻ることに関してユーザとのダイアログのための第3領域を図4
(b) に追加することができ、同様に、図4(b) の2領域と同じように、図4(a)
のダイアログ領域を除去することも可能である。
【0067】 p*推量、p*前進およびp*リターンの各しきい値はユーザが定義することも、決
定理論の使用によって求めることも可能である。つまり、これらのしきい値は、
文脈依存の (context-sensitive:文脈によって変化する)コスト計算によって求
めることが可能である。この計算で使用されるコストは、急いでいるユーザのよ
うな観察の関数にすることが可能であり、対話型ダイアログに関する観察の関数
にすることも可能であり、その中には、ユーザに行った質問の数などが含まれて
いる。例えば、ユーザの要求に関する質問が1つのときは、初期コストは少なく
て済むことになる。しかし、システムが同じ要求について複数の質問をする必要
があるときは、アクションをとるだけのときよりも、別の質問をすることの方が
コスト高になることがある。
【0068】 しきい値p*の一般的設定方法、および決定理論を使用してしきい値を個別的に
設定する方法は、「メッセ−ジングとスケジューリングのための自動化サービス
を指示するためのシステムと方法(Systems and Methods for Directing Automat
ed Services for Messaging and Scheduling)」という名称で、1999年4月20日に
出願され、係属中の特許出願第09/295,146号 [docket no. 1018.014US1](本件
出願人に譲渡済み)に記載されているが、この出願の内容は引用により本明細書
の一部になっている。なお、本発明はそれだけに限定されるものではない。
【0069】 図5の方法を要約すると、以下に説明する通りとなる。本方法は費用便益分析
(cost-benefit analysis)を行い、次の詳細レベルへ進むか、以前に調べたレベ
ルへ戻るか、の判断を行うことを、あるレベル内の推論確率に基づいて導いてい
く。この解析では、直接に前進するか、あるいは目標の確認を求める質問を行う
ことの期待値は、カレント解析レベルに留まって、VOIに基づいて情報収集を継
続することと対比させて考慮される。異なる対話結果の有用性が評価され、前進
のためのしきい値確率を計算するための近似判定解析が採用され、確認を求める
か、あるいは以前に通ったレベルに戻るようにしている。結果の有用性の考慮に
よる導出とは別に、このしきい値確率は直接に評価することができる。
【0070】 具体的には、p*前進、p*推量、およびp*リターンの3つのしきい値が使用され
ている。最高尤をもつ目標の確率がp*推量またはp*前進よりも大でなければ、シ
ステムはVOIを実行することを続け、目標に関する追加情報を収集する。VOIが非
正数になるか、あるいは行うべき観察が他になければ、システムは追加情報の要
求を発行する。カレントレベルでの最大尤目標がp*前進よりも大であれば、シス
テムは目標を想定し、次の詳細レベルへ移動する。最大尤がp*推量よりも大であ
るが、p*前進よりも大でなければ、システムは目標を確認するか、拒否するよう
にユーザに求める。目標が無効であるときっぱり拒否されると、ゼロの確率がそ
の目標に割り当てられ、残りの実現可能な目標に対する確率分布が再正規化され
る。戻るためのp*しきい値が使用されて、上位詳細レベルへリターンする決定が
行われる。レベル0より詳細化されたレベルで目標を明確化するベイズモデルに
は、リターン仮説 (return hypothesis) が含まれている。すべてのサブ目標の
確率が減少し、リターン仮説の尤がp*リターンよりも大になったときは、システ
ムは直前レベルにリターンする。このようなことが起こると、システムは誤解に
ついて謝罪し、直前レベルでVOIを続けるか、あるいはVOIが非正数であれば、追
加情報を要求する。
【0071】階層内のレベル間をナビゲーションするためのより一般化されたアプローチ 「詳細説明」のこのセクションでは、階層内のレベル間をナビゲーションする
ための、より一般化された判定解析アプローチが説明されている。すなわち、前
のセクションでは、階層内のレベル間のナビゲーションは、推論確率を判断し、
これらの推論確率があるしきい値よりも大であるか、大でないかに基づいてアク
ションをとること(レベル間のナビゲーション)に関連して説明されていた。し
かし、この分野の通常の知識を有する者ならば理解されるように、これは、各結
果に関連する有用性の考慮が与えられているとき、不確実性の下で理想的アクシ
ョン(ideal action)の計算と呼ばれるものを具体化した1つの判定解析方法で
ある。すなわち、前のセクションでの説明は、ここで説明しようとするレベル間
のナビゲーションのための、より一般化されたアプローチを具体化した実施形態
である。
【0072】 一般化されたアプローチでは、階層のカレントレベルのタスクで表されたすべ
ての目標にわたる確率分布は、最初に、例えば、この分野では公知のようにベイ
ズネットワークの使用によって判断される。次に、確率分布に関連する最大期待
値のアクションが判断される。アクションA*の即時アクションの値はその期待有
用性であり、これは次式のように書くことができる。
【0073】
【数4】
【0074】 上記において、maxA は総和を最大にするようにアクションAを選択したことを示
し、u(Ai,Hj) はユーザが目標Hj をもつときの特定アクションAi の有用性であ
り、p(Hj|E) は観察され、かつバックグランドの証拠Eのカレントレベルが与え
られているときのユーザ目標Hjの確率である。A*は、上式のarg maxaをとると得
られる、最大期待有用性をもつアクションAであることを示すために使用されて
いる。
【0075】 この一般化されたアプローチで考慮されるアクションは、前のセクションに説
明されている、より具体的なアプローチと同じである。すなわち、次レベルへ進
むアクションと直前レベルへ戻るアクションの各々の期待有用性、および前進と
後退の各々に関するダイアログが判断される。確率分布内で関連付けられた最大
期待値のアクションがその後に続いてとられる。
【0076】 さらに、別実施形態では、上述したばかりの決定理論的アプローチは、レベル
間をナビゲートするだけではなく、すべてのアクションを含んでいる。従って、
決定理論的アプローチは、追加情報を黙示的に取得するか、追加情報を明示的に
取得するか、次レベルへ進むか、直前レベルへ戻るか、ユーザの確認を得て次レ
ベルへ進むか、ユーザの確認を得て直前レベルへ戻るか、のアクションの中から
選択するために使用されている。この分野の通常の知識を有する者ならば理解さ
れるように、本明細書の他の個所に説明されている推論確率判断といった、単一
の確率を使用するといったように、意思決定プロセスのどの側面に対しても、ど
の近似化を使用することが可能である。従って、より一般化された決定理論的ア
プローチを使用すると、まずアクションが選択され、そのあとにアクションをと
ることが続き(つまり、アクションが実行される)、このプロセスは、対話型対
話のコストが利益よりも上回るまで続けられ、その時点で、不確実性の下で期待
有用性を最大限にするという全体目標に従って、なんらかのアクションが実世界
でとられることになる。
【0077】システム 「詳細説明」のこのセクションでは、本発明の一実施形態によるシステムが説
明されている。以下では、本発明の一実施形態によるシステムを示している図6
を参照して、システムについて説明することにする。
【0078】 一般的レベルにある決定エンジン (decision engine) 600は、対話方式で
ユーザの入力602を受け取り、ユーザ604に対し出力を行って、コンピュー
タとユーザとの対話環境のコンテキストにおいてユーザの目標を評価する(例え
ば、アクションが選択されると、そのアクションが実行されるといったように)
。その結果として、ユーザの目標630が評価されるが、これは、一実施形態で
は、メカニズム(機械装置)638によって実行される目標に基づくアクション
にし、外の世界632がそのアクションによって影響されるようにすることがで
きる。決定エンジン600は、一連のレベルからなり、そこでは、各レベルは、
前述したように、直前レベルの目標の各々に対して少なくとも1つの目標をもっ
ているタスク抽象階層のレベル間をナビゲートしていくことによって(例えば、
1つまたは2つ以上のベイズネットワークの使用によって)、ユーザの目標を評
価するようにしている。一実施形態における決定エンジン600は、コンピュー
タのコンピュータ読取可能媒体からプロセッサによって実行されるコンピュータ
プログラムになっている。なお、本発明はそれだけに限定されるものではない。
【0079】 ユーザの入力602は、いくつかの異なるメカニズムを通して決定エンジン6
00に入力することができる。例えば、テキスト入力はキーボード614を通し
て取り出すことことができ、オーディオ入力はマイクロホン616を通して取り
出すことができ、イメージ/ビデオ情報はビデオカメラ618を通して取り出す
ことができ、他の情報612は他のメカニズム620を通して取り出すことがで
きる。同様に、ユーザの出力は、いくつかの異なるメカニズムを通して決定エン
ジン600に出力させることができる。オーディオ出力622はスピーカ626
から出力することができ、イメージ/ビデオ出力624は、モニタなどのディス
プレイデバイス628から出力することができ、他の出力634は他のメカニズ
ム636から出力することができる。なお、本発明はそれだけに限定されるもの
ではない。
【0080】 目標630に基づいてアクションを実行するためのメカニズム638は、それ
自身、スピーカ626、ディスプレイデバイス628、他のメカニズム636な
どの、出力メカニズムの1つにすることができる。なお、本発明はそれだけに限
定されるものではない。このメカニズム638によると、決定エンジン600に
よって評価された目標630に基づいて、アクションを外の世界632に対して
実行することができる。例えば、受付係ドメインのコンテキストでは、ユーザの
目標が別のキャンパスへのシャトルが必要であると判断されることがあるので、
このメカニズム638を、テキストから音声へのエンジン (text-to-speech eng
ine) にすると、電話でシャトルセンタを呼び出してシャトルを要求することが
できる。
【0081】変則的解析レベル 「詳細説明」のこのセクションでは、変則的解析レベル (atypical levels of
analysis) が説明されている。これらの変則的レベルは、本明細書で上述して
きた本発明の他の実施形態に従って利用することができる。しかし、本発明はそ
れだけに限定されるものではない。
【0082】 最初に、ここで述べておくことは、文脈依存の有用性は、しきい値確率を計算
する際に利用可能であることと、情報価値 (VOI) は、急いでいるユーザのよう
な観察の関数としても、すでにユーザに尋ねていた質問の数といった、対話型ダ
イアログ自体に関する観察の関数としても定義できることである。
【0083】 従って、一実施形態では、VOIを制御するための確率センシティブ(確率に依
存する)コストの特殊ケースは、変則的解析レベルとしてマークされている詳細
レベルで、ユーザに質問をすることを熟考するときに利用することができる。変
則的解析レベルの例としては、シャトルを企業キャンパスのどこかに走行させる
上位レベル目標に関連する別のレベルがある。この別レベルでは、ある人が特殊
な種類のシャトルを必要としているかどうかを発見することを求めることができ
、その中には、身体障害者を運ぶことができる車両や、上級重役のための特殊シ
ャトルの要求が含まれている。
【0084】 変則的レベルとマークされたレベルとしては、レベルが無関係であるとの前提
を表す特殊な目標状態がある。このレベルでサブ目標についてユーザを巻き込む
ことは、ほとんどのケースでは不自然のように見える。従って、VOI解析で使用
される期待コストは、変則的結果が関連性をもつとの確率を考慮することで、動
的に更新される。証拠p(R|E) が与えられているときの関連性の確率は、無関連
性の状態に割り当てられる確率の補数である。関連性の確率が大きくなると、質
問される自然さが増すので、質問は意外性が減少し、その結果、質問するコスト
が低下することになる。
【0085】 一実施形態では、質問する期待コストは、以下に示すように、レベルの結果が
関連性あるときと、関連性がないときのコストの和に、推論確率の重みを付けた
ものとして計算される。 期待コスト= p(R|E) Cost(Asking, Relevant) + 1-p(R|E) Cost(Asking, not Re
levant) 上記において、cost(Asking, Relevant) は、レベルが関連性をもつとき変則的
事情に関して質問をするコストであり、Cost(Asking, not Relevant) は、レベ
ルが非関連性のとき質問するコストである。従って、この期待コストは、変則的
詳細レベルで明示的質問をするときVOIで使用することができる(ビジュアルキ
ューの収集に集中するものとは対比)。
【0086】結論 以上、特定の実施形態を図示し、説明してきたが、この分野の通常知識を有す
る者ならば理解されるように、同じ目的を達成することを目的とした構成ならば
、図示した特定実施形態は、その構成で置換することが可能である。本出願は、
本発明の一切の適応または変形を包含することも目的としている。従って、本発
明は、特許請求の範囲に記載の内容とその等価技術によってのみ限定されるもの
である。
【図面の簡単な説明】
【図1】 本発明の実施形態が実施されるときの動作環境を示す図である。
【図2】 本発明の実施形態に従って使用できる代表的タスク抽象階層を示す図である。
【図3(a)】 本発明の一実施形態に従って、情報価値解析を行うことによってタスク抽象階
層のカレントレベルでの情報を収集する方法をフローチャートで示す図である。
【図3(b)】 本発明の一実施形態による代表的ベイズネットワークを示す図である。
【図4(a)】 本発明の一実施形態による前進しきい値p*と推量しきい値p*を示す図である。
【図4(b)】 本発明の一実施形態によるリターンしきい値p*を示す図である。
【図5】 本発明の一実施形態従って、タスク抽象階層のレベル間をナビゲーションする
方法をフローチャートで示す図である。
【図6】 本発明の一実施形態によるシステムを示す図である。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AL,AM,AT,AU, AZ,BA,BB,BG,BR,BY,CA,CH,C N,CU,CZ,DE,DK,EE,ES,FI,GB ,GD,GE,GH,GM,HR,HU,ID,IL, IN,IS,JP,KE,KG,KP,KR,KZ,L C,LK,LR,LS,LT,LU,LV,MD,MG ,MK,MN,MW,MX,NO,NZ,PL,PT, RO,RU,SD,SE,SG,SI,SK,SL,T J,TM,TR,TT,UA,UG,UZ,VN,YU ,ZA,ZW (72)発明者 ティモシー ピーク アメリカ合衆国 98052 ワシントン州 レックモンド マイクロソフト ウェイ 1 Fターム(参考) 5E501 AA01 AC22 EA01 FA22

Claims (55)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータ実行の方法であって、 いくつかのレベルからなるタスク抽象階層のカレントレベルに関する情報を
    受け取って、コンピュータとユーザとの間の対話コンテキスト内でユーザの目標
    を評価し、 受け取った情報が十分であるかどうかを、判定解析アプローチに基づいて判
    断し、 受け取った情報が十分であると判断したとき、判定解析アプローチに基づい
    てアクションを選択する、 ことを含むことを特徴とするコンピュータ実行の方法。
  2. 【請求項2】 請求項1に記載の方法において、判定解析アプローチに基づ
    いてアクションを選択することは、階層のカレントレベルにあるタスクによって
    表されている目標についての確率分布を判断することを含むことを特徴とする方
    法。
  3. 【請求項3】 請求項2に記載の方法において、アクションを選択すること
    は、さらに、確率分布の引数最大値 (arg max) を判断することを含むことを特
    徴とする方法。
  4. 【請求項4】 請求項1に記載の方法において、判定解析アプローチに基づ
    いてアクションを選択することは、 推論確率を判断し、 推論確率が前進しきい値を超えていると判断したとき、カレントレベルを次
    レベルへ進めることを含むことを特徴とする方法。
  5. 【請求項5】 請求項4に記載の方法において、さらに、ユーザの目標が評
    価されるまで、カレントレベルに関する情報の受取りを継続することを含むこと
    を特徴とする方法。
  6. 【請求項6】 請求項1に記載の方法において、いくつかのレベルからなる
    タスク抽象は少なくとも1つの変則的レベルを含み、そこでは、関連性の確率と
    非関連性の確率が判断されることを特徴とする方法。
  7. 【請求項7】 請求項1に記載の方法において、カレントレベルに関する情
    報を受取ることは、いくつかのレベルからなるタスク抽象階層のカレントレベル
    に関する情報を受取ることを含み、タスク抽象階層は一連のレベルで構成され、
    各レベルは、直前レベルの少なくとも1つの目標のうちの、少なくとも1つの各
    々について少なくとも1つの目標を含んでいることを特徴とする方法。
  8. 【請求項8】 請求項1に記載の方法において、情報を受取ることは、情報
    タイプグループの中の、少なくとも1つの情報タイプの情報を受取ることを含み
    、前記情報タイプグループは、基本的に、テキスト情報タイプ、オーディオ情報
    タイプ、イメージ/ビデオ情報タイプ、および他の情報タイプからなることを特
    徴とする方法。
  9. 【請求項9】 請求項1に記載の方法において、情報を受取ることは、ユー
    ザとやりとりすることを含むことを特徴とする方法。
  10. 【請求項10】 請求項9に記載の方法において、ユーザとのやりとりは、
    最初にユーザに第2情報を提供することを含むことを特徴とする方法。
  11. 【請求項11】 請求項10に記載の方法において、ユーザに第2情報を提
    供することは、第2情報タイプグループの中の、少なくとも1つの第2情報タイ
    プの第2情報をユーザに提供することを含み、前記第2情報タイプグループは、
    基本的に、第2オーディオ情報タイプ、第2イメージ/ビデオ情報タイプ、およ
    び他の第2情報タイプからなることを特徴とする方法。
  12. 【請求項12】 請求項1に記載の方法において、受け取った情報が十分で
    あるかどうかを判断することは、情報価値解析を実行することを含むことを特徴
    とする方法。
  13. 【請求項13】 請求項12に記載の方法において、情報価値解析を実行す
    ることは、貪欲算法による情報価値解析を実行することを含むことを特徴とする
    方法。
  14. 【請求項14】 請求項12に記載の方法において、情報価値解析を実行す
    ることは、追加情報を受取る期待コストが追加情報の期待利益を超えているかど
    うかを判断することを含むことを特徴とする方法。
  15. 【請求項15】 請求項4に記載の方法において、推論確率を判断すること
    は、 カレントレベルに対する次レベルの少なくとも1つの目標の各々について、
    初期推論確率を判断し、 カレントレベルに対する次レベルの少なくとも1つの目標のうち、最高推論
    確率をもつ目標の初期推論確率を推論確率として選択する、 ことを含むことを特徴とする方法。
  16. 【請求項16】 請求項15に記載の方法において、カレントレベルに対す
    る次レベルの少なくとも1つの目標の各々について初期推論確率を判断すること
    は、カレントレベルに対する次レベルの少なくとも1つの目標の各々についての
    初期推論確率を、ベイズ (Bayesian) ネットワークの使用によって判断すること
    を含むことを特徴とする方法。
  17. 【請求項17】 請求項15に記載の方法において、カレントレベルを次レ
    ベルへ進めることは、カレントレベルに対する次レベルの少なくとも1つの目標
    のうち、最高推論確率をもつ目標へ進むことを含むことを特徴とする方法。
  18. 【請求項18】 請求項4に記載の方法において、受け取った情報が十分で
    あると判断したとき、および推論確率が前進しきい値を超えていると判断したと
    き、カレントレベルを次レベルへ進めたあとに続いて、 推論確率がダイアログしきい値を超えていると判断したとき、 次レベルへ進むかどうかに関するダイアログにユーザを参加させ、 次レベルへ進むとの確認をユーザから受け取ったとき、カレントレベル
    を次レベルへ進めることを、さらに含むことを特徴とする方法。
  19. 【請求項19】 請求項4に記載の方法において、受け取った情報が十分で
    あると判断したとき、および確率推論が前進しきい値を超えている判断したとき
    、カレントレベルを次レベルへ進めた後に続いて、 第2推論確率を判断し、 第2推論確率がリターンしきい値を超えていると判断したとき、カレントレ
    ベルを直前レベルへ戻すことを、さらに含むことを特徴とする方法。
  20. 【請求項20】 請求項19に記載の方法において、第2推論確率を判断す
    ることは、第2推論確率を、直前レベルへ戻る目標の確率として判断することを
    含むことを特徴とする方法。
  21. 【請求項21】 請求項19に記載の方法において、第2推論確率を判断す
    ることは、ベイズネットワークの使用によって第2推論確率を判断することを含
    むことを特徴とする方法。
  22. 【請求項22】 コンピュータ実行の方法であって、 いくつかのレベルからなるタスク抽象階層のカレントレベルに関する情報を
    受け取って、コンピュータとユーザとの対話コンテキスト内のユーザの目標を評
    価し、 受け取った情報が十分であるかどうかを、情報価値解析を実行することによ
    って判断し、 受け取った情報が十分であると判断したとき、 推論確率を判断し、 推論確率が前進しきい値を超えていると判断したとき、カレントレベル
    を次レベルへ進め、 第2推論確率を判断し、 第2推論確率がリターンしきい値を超えていると判断したとき、カレン
    トレベルを直前レベルへ戻し、 ユーザの目標が評価されるまで、カレントレベルに関する情報の受取りを継
    続する、 ことを含むことを特徴とするコンピュータ実行の方法。
  23. 【請求項23】 請求項22に記載の方法において、カレントレベルに関す
    る情報を受取ることは、いくつかのレベルからなるタスク抽象階層のカレントレ
    ベルに関する情報を受取ることを含み、タスク抽象階層は一連のレベルで構成さ
    れ、各レベルは、直前レベルの少なくとも1つの目標のうちの、少なくとも1つ
    の各々について少なくとも1つの目標を含んでいることを特徴とする方法。
  24. 【請求項24】 請求項22に記載の方法において、情報を受取ることは、
    ユーザとやりとりすることを含むことを特徴とする方法。
  25. 【請求項25】 請求項22に記載の方法において、情報価値解析を実行す
    ることは、追加情報を受取る期待コストが追加情報の期待利益を超えているかど
    うかを判断することを含むことを特徴とする方法。
  26. 【請求項26】 請求項23に記載の方法において、推論確率を判断するこ
    とは、 カレントレベルに対する次レベルの少なくとも1つの目標の各々についての
    初期推論確率を、ベイズネットワークの使用によって判断し、 カレントレベルに対する次レベルの少なくとも1つの目標のうち、最高推論
    確率をもつ目標の初期推論確率を推論確率として選択する、 ことを含むことを特徴とする方法。
  27. 【請求項27】 請求項23に記載の方法において、カレントレベルを次レ
    ベルへ進めることは、カレントレベルに対する次レベルの少なくとも1つの目標
    のうち、最高推論確率をもつ目標へ進むことを含むことを特徴とする方法。
  28. 【請求項28】 請求項22に記載の方法において、受け取った情報が十分
    であると判断したとき、および推論確率が前進しきい値を超えていると判断した
    とき、カレントレベルを次レベルへ進めたあとに続いて、 推論確率が第2確率しきい値を超えていると判断したとき、 次レベルへ進むかどうかに関するダイアログにユーザを参加させ、 次レベルへ進むとの確認をユーザから受け取ったとき、カレントレベル
    を次レベルへ進めることを、さらに含むことを特徴とする方法。
  29. 【請求項29】 請求項22に記載の方法において、第2推論確率を判断す
    ることは、第2推論確率を、ベイズネットワークの使用によって直前レベルへ戻
    る目標の確率として判断することを含むことを特徴とする方法。
  30. 【請求項30】 方法を実行するためにプロセッサによって実行される命令
    がそこに格納されているマシン読取可能媒体であって、前記方法は、 いくつかのレベルからなるタスク抽象階層のカレントレベルに関する情報を
    受け取って、コンピュータとユーザとの対話コンテキスト内でユーザの目標を評
    価し、 受け取った情報が十分であるかどうかを判断し、 受け取った情報が十分であると判断したとき、 推論確率を判断し、 推論確率が前進しきい値を超えていると判断したとき、カレントレベル
    を次レベルへ進め、 ユーザの目標が評価されるまで、カレントレベルに関する情報の受取りを継
    続する、 ことを含むことを特徴とするマシン読取可能媒体。
  31. 【請求項31】 請求項30に記載のマシン読取可能媒体において、カレン
    トレベルに関する情報を受取ることは、いくつかのレベルからなるタスク抽象階
    層のカレントレベルに関する情報を受取ることを含み、タスク抽象階層は一連の
    レベルで構成され、各レベルは、直前レベルの少なくとも1つの目標のうちの、
    少なくとも1つの各々について少なくとも1つの目標を含んでいることを特徴と
    するマシン読取可能媒体。
  32. 【請求項32】 請求項30に記載のマシン読取可能媒体において、情報を
    受取ることは、ユーザとやりとりすることを含むことを特徴とするマシン読取可
    能媒体。
  33. 【請求項33】 請求項30に記載のマシン読取可能媒体において、受け取
    った情報が十分であるかどうかを判断することは、情報価値解析を実行すること
    を含むことを特徴とするマシン読取可能媒体。
  34. 【請求項34】 請求項33に記載のマシン読取可能媒体において、情報価
    値解析を実行することは、貪欲算法による情報価値解析を実行することを含むこ
    とを特徴とするマシン読取可能媒体。
  35. 【請求項35】 請求項33に記載のマシン読取可能媒体において、情報価
    値解析を実行することは、追加情報を受取る期待コストが追加情報の期待利益を
    超えているかどうかを判断することを含むことを特徴とするマシン読取可能媒体
  36. 【請求項36】 請求項30に記載のマシン読取可能媒体において、推論確
    率を判断することは、 カレントレベルに対する次レベルの少なくとも1つの目標の各々についての
    初期推論確率を、ベイズネットワークの使用によって判断し、 カレントレベルに対する次レベルの少なくとも1つの目標のうち、最高推論
    確率をもつ目標の初期推論確率を推論確率として選択する、 ことを含むことを特徴とするマシン読取可能媒体。
  37. 【請求項37】 請求項36に記載のマシン読取可能媒体において、カレン
    トレベルを次レベルへ進めることは、カレントレベルに対する次レベルの少なく
    とも1つの目標のうち、最高推論確率をもつ目標へ進むことを含むことを特徴と
    するマシン読取可能媒体。
  38. 【請求項38】 請求項30に記載のマシン読取可能媒体において、受け取
    った情報が十分であると判断したとき、および推論確率が前進しきい値を超えて
    いると判断したとき、カレントレベルを次レベルへ進めたあとに続いて、 推論確率がダイアログしきい値を超えていると判断したとき、 次レベルへ進むかどうかに関するダイアログにユーザを参加させ、 次レベルへ進むとの確認をユーザから受け取ったとき、カレントレベル
    を次レベルへ進めることを、さらに含むことを特徴とするマシン読取可能媒体。
  39. 【請求項39】 請求項30に記載のマシン読取可能媒体において、受け取
    った情報が十分であると判断したとき、および確率推論が前進しきい値を超えて
    いる判断したとき、カレントレベルを次レベルへ進めた後に続いて、 直前レベルへ戻る目標の第2推論確率を、ベイズネットワークの使用によっ
    て判断し、 第2推論確率がリターンしきい値を超えていると判断したとき、カレントレ
    ベルを直前レベルへ戻すことを、さらに含むことを特徴とするマシン読取可能媒
    体。
  40. 【請求項40】 方法を実行するためにプロセッサによって実行される命令
    がそこに格納されているマシン読取可能媒体であって、前記方法は、 いくつかのレベルからなるタスク抽象階層のカレントレベルに関する情報を
    受け取って、コンピュータとユーザとの対話コンテキスト内でユーザの目標を評
    価し、タスク抽象階層は一連のレベルから構成され、各レベルは、直前レベルの
    少なくとも1つの目標のうちの、少なくとも1つの各々について少なくとも1つ
    の目標を含んでいるものと、 受け取った情報が十分であるかどうかを、情報価値解析を実行することによ
    って判断し、 受け取った情報が十分であると判断したとき、 カレントレベルに対する次レベルの少なくとも1つの目標の各々につい
    ての初期推論確率を、ベイズネットワークの使用によって判断し、 カレントレベルに対する次レベルの少なくとも1つの目標のうち、最高
    推論確率をもつ目標の初期推論確率を、初期推論確率として選択し、 推論確率が前進しきい値を超えていると判断したとき、カレントレベル
    を次レベルへ進め、 直前レベルへ戻る目標の第2推論確率がリターンしきい値を超えている
    と判断したとき、カレントレベルを直前レベルへ戻し、 ユーザの目標が評価されるまで、カレントレベルに関する情報の受取りを継
    続する、 ことを含むことを特徴とするマシン読取可能媒体。
  41. 【請求項41】 請求項40に記載のマシン読取可能媒体において、情報を
    受取ることは、ユーザとやりとりすることを含むことを特徴とするマシン読取可
    能媒体。
  42. 【請求項42】 請求項40に記載のマシン読取可能媒体において、情報価
    値解析を実行することは、追加情報を受取る期待コストが追加情報の期待利益を
    超えているかどうかを判断することを含むことを特徴とするマシン読取可能媒体
  43. 【請求項43】 請求項40に記載のマシン読取可能媒体において、カレン
    トレベルを次レベルへ進めることは、カレントレベルに対する次レベルの少なく
    とも1つの目標のうち、最高推論確率をもつ目標へ進むことを含むことを特徴と
    するマシン読取可能媒体。
  44. 【請求項44】 請求項40に記載のマシン読取可能媒体において、受け取
    った情報が十分であると判断したとき、および推論確率が前進しきい値を超えて
    いると判断したとき、カレントレベルを次レベルへ進めたあとに続いて、 推論確率がダイアログしきい値を超えていると判断したとき、 次レベルへ進むかどうかに関するダイアログにユーザを参加させ、 次レベルへ進むとの確認をユーザから受け取ったとき、カレントレベル
    を次レベルへ進めることを、さらに含むことを特徴とするマシン読取可能媒体。
  45. 【請求項45】 コンピュータ化システムであって、 少なくとも1つのユーザ情報ソースと、 ユーザに出力する少なくとも1つの受け手と、 前記少なくとも1つのソースと前記少なくとも1つの受け手に動作可能に結
    合されて、いくつかのレベルからなるタスク抽象階層をナビゲーションすること
    によって、コンピュータとユーザとの対話コンテキスト内でユーザの目標を評価
    する決定エンジンと、 を備えたことを特徴とするコンピュータ化システム。
  46. 【請求項46】 請求項45に記載のシステムにおいて、決定エンジンによ
    って評価されたユーザの目標に基づいてアクションをとる機能を備えたメカニズ
    ムを、さらに含むことを特徴とするシステム。
  47. 【請求項47】 請求項45に記載のシステムにおいて、少なくとも1つの
    ソースは、次のうちの少なくとも1つ、すなわち、キーボード、マイクロホン、
    およびビデオカメラを含むことを特徴とするシステム。
  48. 【請求項48】 請求項45に記載のシステムにおいて、少なくとも1つの
    受け手は、次のうちの少なくとも1つ、すなわち、スピーカ、およびディスプレ
    イデバイスを含むことを特徴とするシステム。
  49. 【請求項49】 請求項45に記載のシステムにおいて、タスク抽象階層は
    一連のレベルで構成され、各レベルは、直前レベルの少なくとも1つの目標のう
    ちの、少なくとも1つの目標の各々について少なくとも1つの目標を含むことを
    特徴とするシステム。
  50. 【請求項50】 請求項45に記載のシステムにおいて、決定エンジンは、
    少なくとも1つのベイズネットワークの使用によってタスク抽象回路のナビゲー
    ションを実行することを特徴とするシステム。
  51. 【請求項51】 請求項45に記載のシステムにおいて、決定エンジンは、
    コンピュータ読取可能媒体からプロセッサによって実行されるコンピュータプロ
    グラムを含むことを特徴とするシステム。
  52. 【請求項52】 コンピュータ実行の方法であって、 判定解析アプローチを使用して、コンピュータとユーザとの対話コンテキス
    ト内でユーザの目標の評価に関係するアクショングループからアクションを選択
    し、アクショングループは、情報を取得すること、いくつかのレベルからなるタ
    スク抽象階層の次レベルへ進むこと、およびタスク抽象階層の直前レベルへ戻る
    ことを含み、 選択したアクションを実行し、 ユーザの目標の1つが評価され、対話を継続するコストが利益よりも上回る
    まで繰り返す、 ことを含むことを特徴とするコンピュータ実行の方法。
  53. 【請求項53】 請求項52に記載の方法において、情報を取得することは
    、黙示的に情報を取得することと、ユーザの明示的質問を通して情報を取得する
    ことを含むことを特徴とする方法。
  54. 【請求項54】 請求項52に記載の方法において、次レベルへ進むことは
    、ユーザからの確認を得たあとに続いて次レベルへ進むことを含むことを特徴と
    する方法。
  55. 【請求項55】 請求項52に記載の方法において、直前レベルへ戻ること
    は、ユーザからの確認を求める試みに続いて直前レベルへ戻ることを含むことを
    特徴とする方法。
JP2001502062A 1999-06-04 2000-06-02 目標達成志向会話の表現と推論 Pending JP2003501754A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/326,254 US6421655B1 (en) 1999-06-04 1999-06-04 Computer-based representations and reasoning methods for engaging users in goal-oriented conversations
US09/326,254 1999-06-04
PCT/US2000/015285 WO2000075863A2 (en) 1999-06-04 2000-06-02 Representations and reasoning for goal-oriented conversations

Publications (2)

Publication Number Publication Date
JP2003501754A true JP2003501754A (ja) 2003-01-14
JP2003501754A5 JP2003501754A5 (ja) 2007-08-23

Family

ID=23271456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001502062A Pending JP2003501754A (ja) 1999-06-04 2000-06-02 目標達成志向会話の表現と推論

Country Status (9)

Country Link
US (1) US6421655B1 (ja)
EP (1) EP1194891B1 (ja)
JP (1) JP2003501754A (ja)
CN (1) CN1320498C (ja)
AT (1) ATE466351T1 (ja)
AU (1) AU5594000A (ja)
DE (1) DE60044295D1 (ja)
HK (1) HK1046758B (ja)
WO (1) WO2000075863A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016502696A (ja) * 2012-10-11 2016-01-28 ベベオ, インコーポレイテッド 会話型インターフェースの一部として動的に適用されるフィルタリングオペレータを伴う適応会話状態管理のための方法

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103806B1 (en) * 1999-06-04 2006-09-05 Microsoft Corporation System for performing context-sensitive decisions about ideal communication modalities considering information about channel reliability
US7389351B2 (en) * 2001-03-15 2008-06-17 Microsoft Corporation System and method for identifying and establishing preferred modalities or channels for communications based on participants' preferences and contexts
US6513026B1 (en) * 2000-06-17 2003-01-28 Microsoft Corporation Decision theoretic principles and policies for notification
US6785651B1 (en) * 2000-09-14 2004-08-31 Microsoft Corporation Method and apparatus for performing plan-based dialog
GB2367914A (en) * 2000-10-09 2002-04-17 Johnson Davies David Boris An iterative method for identification of an item from a dataset by selecting questions to eliminate the maximum number of items at each ite tion
US7158935B1 (en) * 2000-11-15 2007-01-02 At&T Corp. Method and system for predicting problematic situations in a automated dialog
AU2002237495A1 (en) * 2001-03-13 2002-09-24 Intelligate Ltd. Dynamic natural language understanding
US7251696B1 (en) 2001-03-15 2007-07-31 Microsoft Corporation System and methods enabling a mix of human and automated initiatives in the control of communication policies
US7330895B1 (en) * 2001-03-15 2008-02-12 Microsoft Corporation Representation, decision models, and user interface for encoding managing preferences, and performing automated decision making about the timing and modalities of interpersonal communications
US6917928B1 (en) * 2001-04-12 2005-07-12 Idego Methodologies, Inc. System and method for personal development training
US7287017B2 (en) * 2001-04-12 2007-10-23 Igego Methodologies, Inc. Decision engine
WO2002101594A2 (en) * 2001-06-11 2002-12-19 Hrl Laboratories, Llc Method and apparatus for determining and assessing information to be collected based on information-theoretic measures
US7644144B1 (en) 2001-12-21 2010-01-05 Microsoft Corporation Methods, tools, and interfaces for the dynamic assignment of people to groups to enable enhanced communication and collaboration
US7146348B2 (en) * 2002-01-22 2006-12-05 Honeywell International Inc. Probabilistic goal recognition system and method incorporating inferred unobserved actions
US20030214523A1 (en) * 2002-05-16 2003-11-20 Kuansan Wang Method and apparatus for decoding ambiguous input using anti-entities
US7502730B2 (en) * 2002-06-14 2009-03-10 Microsoft Corporation Method and apparatus for federated understanding
US7870240B1 (en) 2002-06-28 2011-01-11 Microsoft Corporation Metadata schema for interpersonal communications management systems
US7292982B1 (en) * 2003-05-29 2007-11-06 At&T Corp. Active labeling for spoken language understanding
US7640506B2 (en) * 2003-06-27 2009-12-29 Microsoft Corporation Method and apparatus for viewing and managing collaboration data from within the context of a shared document
US7739141B2 (en) * 2003-07-10 2010-06-15 International Business Machines Corporation Consulting assessment environment
CN1839382A (zh) 2003-09-30 2006-09-27 英特尔公司 动态贝叶斯网络的最可能解释生成
DE10356399B4 (de) * 2003-12-03 2006-06-14 Ontoprise Gmbh Datenverarbeitungssystem
US7873724B2 (en) * 2003-12-05 2011-01-18 Microsoft Corporation Systems and methods for guiding allocation of computational resources in automated perceptual systems
US7499913B2 (en) * 2004-01-26 2009-03-03 International Business Machines Corporation Method for handling anchor text
US8296304B2 (en) * 2004-01-26 2012-10-23 International Business Machines Corporation Method, system, and program for handling redirects in a search engine
US7293005B2 (en) * 2004-01-26 2007-11-06 International Business Machines Corporation Pipelined architecture for global analysis and index building
US7424467B2 (en) * 2004-01-26 2008-09-09 International Business Machines Corporation Architecture for an indexer with fixed width sort and variable width sort
US7908663B2 (en) 2004-04-20 2011-03-15 Microsoft Corporation Abstractions and automation for enhanced sharing and collaboration
US7707167B2 (en) * 2004-09-20 2010-04-27 Microsoft Corporation Method, system, and apparatus for creating a knowledge interchange profile
US7730010B2 (en) * 2004-09-20 2010-06-01 Microsoft Corporation Method, system, and apparatus for maintaining user privacy in a knowledge interchange system
US7593924B2 (en) * 2004-09-20 2009-09-22 Microsoft Corporation Method, system, and apparatus for receiving and responding to knowledge interchange queries
US7461064B2 (en) 2004-09-24 2008-12-02 International Buiness Machines Corporation Method for searching documents for ranges of numeric values
US20060287937A1 (en) * 2005-01-18 2006-12-21 Manyworlds, Inc. Generative Investment Process
US20060168546A1 (en) * 2005-01-21 2006-07-27 International Business Machines Corporation System and method for visualizing and navigating objectives
US20060256937A1 (en) * 2005-05-12 2006-11-16 Foreman Paul E System and method for conversation analysis
US8417693B2 (en) 2005-07-14 2013-04-09 International Business Machines Corporation Enforcing native access control to indexed documents
US20090253113A1 (en) * 2005-08-25 2009-10-08 Gregory Tuve Methods and systems for facilitating learning based on neural modeling
US7461043B2 (en) * 2005-12-14 2008-12-02 Siemens Aktiengesellschaft Methods and apparatus to abstract events in software applications or services
US20080059395A1 (en) * 2006-01-10 2008-03-06 Manyworlds, Inc. Adaptive Online Experimentation
EP1987477A2 (en) * 2006-02-10 2008-11-05 Numenta, Inc. Architecture of a hierarchical temporal memory based system
US20080028062A1 (en) * 2006-07-25 2008-01-31 Microsoft Corporation Determining measures of traffic accessing network locations
US8631005B2 (en) 2006-12-28 2014-01-14 Ebay Inc. Header-token driven automatic text segmentation
US7711716B2 (en) 2007-03-06 2010-05-04 Microsoft Corporation Optimizations for a background database consistency check
US7818271B2 (en) * 2007-06-13 2010-10-19 Motorola Mobility, Inc. Parameterized statistical interaction policies
US8108777B2 (en) 2008-08-11 2012-01-31 Microsoft Corporation Sections of a presentation having user-definable properties
US8694734B2 (en) * 2009-01-31 2014-04-08 International Business Machines Corporation Expiring virtual content from a cache in a virtual universe
US8782556B2 (en) 2010-02-12 2014-07-15 Microsoft Corporation User-centric soft keyboard predictive technologies
JP5815534B2 (ja) 2010-08-31 2015-11-17 アトナープ株式会社 センサーにより測定されたデータから候補を見つける方法および装置
US9460082B2 (en) 2012-05-14 2016-10-04 International Business Machines Corporation Management of language usage to facilitate effective communication
US9058563B1 (en) * 2014-10-15 2015-06-16 Blackwerks LLC Suggesting activities
US11094320B1 (en) * 2014-12-22 2021-08-17 Amazon Technologies, Inc. Dialog visualization
DE112018004578T5 (de) * 2017-10-26 2020-07-16 Omron Corporation Zielmanagementsystem und zielmanagementprogramm
US10453455B2 (en) * 2017-11-22 2019-10-22 Adobe Inc. Multiple turn conversational task assistance
CN109992657B (zh) * 2019-04-03 2021-03-30 浙江大学 一种基于强化动态推理的对话式问题生成方法
EP4004796A1 (en) * 2019-08-29 2022-06-01 Siemens Aktiengesellschaft Conversational design bot for system design
CN110688478B (zh) * 2019-09-29 2021-11-30 腾讯科技(深圳)有限公司 一种答案排序方法、装置及存储介质
US20220019909A1 (en) * 2020-07-14 2022-01-20 Adobe Inc. Intent-based command recommendation generation in an analytics system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998003907A2 (en) * 1996-07-19 1998-01-29 Microsoft Corporation Intelligent user assistance facility
WO1998013771A1 (fr) * 1996-09-26 1998-04-02 Mitsubishi Denki Kabushiki Kaisha Processeur interactif

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4809219A (en) * 1985-06-26 1989-02-28 International Business Machines Corporation Method for processing an expert system rulebase on a system having limited memory
US4763277A (en) * 1986-01-17 1988-08-09 International Business Machines Corporation Method for obtaining information in an expert system
US5103498A (en) * 1990-08-02 1992-04-07 Tandy Corporation Intelligent help system
JPH04196528A (ja) * 1990-11-28 1992-07-16 Toshiba Corp マグネトロンエッチング装置
US5903454A (en) * 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US5434777A (en) * 1992-05-27 1995-07-18 Apple Computer, Inc. Method and apparatus for processing natural language
US5390281A (en) * 1992-05-27 1995-02-14 Apple Computer, Inc. Method and apparatus for deducing user intent and providing computer implemented services
US5477447A (en) * 1992-05-27 1995-12-19 Apple Computer, Incorporated Method and apparatus for providing computer-implemented assistance
CA2115210C (en) * 1993-04-21 1997-09-23 Joseph C. Andreshak Interactive computer system recognizing spoken commands
US5748841A (en) 1994-02-25 1998-05-05 Morin; Philippe Supervised contextual language acquisition system
US5809499A (en) * 1995-10-20 1998-09-15 Pattern Discovery Software Systems, Ltd. Computational method for discovering patterns in data sets
US5822218A (en) * 1996-08-27 1998-10-13 Clemson University Systems, methods and computer program products for prediction of defect-related failures in integrated circuits
DE29615563U1 (de) * 1996-08-28 1998-01-02 Siemens Ag Bewegbare Schaltkontaktanordnung mit Kontaktkraftfedern
US5864848A (en) 1997-01-31 1999-01-26 Microsoft Corporation Goal-driven information interpretation and extraction system
US6327581B1 (en) 1998-04-06 2001-12-04 Microsoft Corporation Methods and apparatus for building a support vector machine classifier

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998003907A2 (en) * 1996-07-19 1998-01-29 Microsoft Corporation Intelligent user assistance facility
WO1998013771A1 (fr) * 1996-09-26 1998-04-02 Mitsubishi Denki Kabushiki Kaisha Processeur interactif

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016502696A (ja) * 2012-10-11 2016-01-28 ベベオ, インコーポレイテッド 会話型インターフェースの一部として動的に適用されるフィルタリングオペレータを伴う適応会話状態管理のための方法

Also Published As

Publication number Publication date
AU5594000A (en) 2000-12-28
CN1349636A (zh) 2002-05-15
EP1194891B1 (en) 2010-04-28
HK1046758B (zh) 2007-11-09
DE60044295D1 (de) 2010-06-10
WO2000075863A3 (en) 2001-07-26
ATE466351T1 (de) 2010-05-15
CN1320498C (zh) 2007-06-06
US6421655B1 (en) 2002-07-16
HK1046758A1 (en) 2003-01-24
EP1194891A2 (en) 2002-04-10
WO2000075863A2 (en) 2000-12-14

Similar Documents

Publication Publication Date Title
JP2003501754A (ja) 目標達成志向会話の表現と推論
US20230214781A1 (en) Generating Smart Reminders by Assistant Systems
KR102535338B1 (ko) 화자 임베딩(들)과 트레이닝된 생성 모델을 이용한 화자 분리
US6490698B1 (en) Multi-level decision-analytic approach to failure and repair in human-computer interactions
Yalcin Epistemic modals
US5918222A (en) Information disclosing apparatus and multi-modal information input/output system
US7386449B2 (en) Knowledge-based flexible natural speech dialogue system
US7734471B2 (en) Online learning for dialog systems
CN108346430A (zh) 对话系统、具有对话系统的车辆以及对话处理方法
US20090106026A1 (en) Speech recognition method, device, and computer program
AU2019219717B2 (en) System and method for analyzing partial utterances
KR20110072847A (ko) 열려진 사용자 의도 처리를 위한 대화관리 시스템 및 방법
JPH0981632A (ja) 情報公開装置
WO2019140390A1 (en) Probabilistic modeling system and method
EP4172843A1 (en) Using a single request for multi-person calling in assistant systems
CN114127694A (zh) 用于会话系统的错误恢复
Shibata et al. Chat-like conversational system based on selection of reply generating module with reinforcement learning
McTear Intelligent interface technology: from theory to reality?
CN116303949A (zh) 一种对话处理方法、系统、存储介质及终端
WO2021011139A1 (en) The conversational assistant for conversational engagement
WO2022226131A1 (en) Active listening for assistant systems
Horvitz et al. Deeplistener: harnessing expected utility to guide clarification dialog in spoken language systems.
KR101212795B1 (ko) 다중 목적 영역의 통계적 대화 정책 추론 방법
CN112328776A (zh) 对话生成方法、装置、电子设备和存储介质
US10674952B1 (en) Detection and management of memory impairment

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070525

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070525

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100827

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110204