JP4949407B2 - 最適化ベースのビジュアル・コンテキスト管理 - Google Patents

最適化ベースのビジュアル・コンテキスト管理 Download PDF

Info

Publication number
JP4949407B2
JP4949407B2 JP2008535505A JP2008535505A JP4949407B2 JP 4949407 B2 JP4949407 B2 JP 4949407B2 JP 2008535505 A JP2008535505 A JP 2008535505A JP 2008535505 A JP2008535505 A JP 2008535505A JP 4949407 B2 JP4949407 B2 JP 4949407B2
Authority
JP
Japan
Prior art keywords
visual
user
context
overlap
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008535505A
Other languages
English (en)
Other versions
JP2009512061A (ja
Inventor
アガーワール・ヴィクラム
ワン・ジャーン
ジョウ・ミシェル・エックス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2009512061A publication Critical patent/JP2009512061A/ja
Application granted granted Critical
Publication of JP4949407B2 publication Critical patent/JP4949407B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、情報探索システムに係り、さらに詳細に説明すれば、情報探索システムにおけるビジュアル・コンテキスト管理用の最適化ベースの技術に係る。
人間−コンピュータ間の対話では、ユーザが新しい1組のデータを求めるとき、コンピュータ・システムは、そのビジュアル出力プレゼンテーションを動的に更新する必要がある。本発明は、ビジュアル・コンテキスト管理、すなわち、ユーザが全ての関連情報を全体として理解することができるように、新しく要求される情報を既存のビジュアル・コンテキストにどのように取り込むかを動的に決定するプロセスに注目する。ここで、「ビジュアル・コンテキスト」という用語は、ユーザがクエリを発するときに知覚するビジュアル・シーンを意味する。かかるプロセスは、人間−コンピュータ間の会話中に導入される、種々の制約(例えば、意味的な連続性を保証すること及びビジュアル・クラッタを最小化すること)や、不測の情報を免れないことが多い。例えば、新しいデータを伝えるために特定のビジュアル・オブジェクトを導入する場合、関係するデータを提示するための既存のビジュアル・オブジェクトによって影響されることがある。新しい情報を既存のシーンと統合しなければ、ユーザは、情報を比較し且つ組み合わせることに困難を感じることがある。
人間−コンピュータ間の会話がどのように展開するかを予測することは非常に困難であるので、全ての可能なビジュアル・コンテキスト変換を事前に計画することは実際的ではない。従来、研究者及び技術者は、ビジュアル・コンテキスト管理に対する欲張り又はスキーマ・ベースの接近方法を試みた。しかし、これらの接近方法は、通常、一度に1つの制約を扱うに過ぎないばかりか、これらの制約自体が互いにどのように影響するかを考慮していない。その結果、かかる既存の接近方法から得られたビジュアル・コンテキスト管理の結果は、望ましくないことがある。
「Optimization-Based Data Content Determination」と題する、米国特許出願第10/969581号(2004年10月20日出願) 「Optimization-Based Media Allocation」と題する、米国特許出願第11/031951号(2005年1月7日出願) K. Houck, "Contextual Revision in Information-Seeking Conversation Systems," ICSLP 2004 J. Chai et al., "Context-based MultimodalInput Understanding in Conversation Systems,"Proceedings IEEE ICMI, pp. 67-92, 2002 S. Pan, "A Multi-layer Conversation Management Approach for Information-Seeking Applications," ISCLP 2004 M. Zhou and M. Chen, "AutomatedGeneration of Graphic Sketches by Examples," IJCAI ’03, pp. 65-71, 2003
従って、改良されたビジュアル・コンテキスト管理技術に対する要請が存在する。
本発明は、改良されたビジュアル・コンテキスト管理技術を提供する。かかる改良されたビジュアル・コンテキスト管理技術は、改良された情報探索システムを構築するために使用することができる。
例えば、本発明の1つの代表的側面では、新しい情報を取り込むように既存のビジュアル表示を更新するための技術は、後のユーザ・クエリによって要求される新しい情報を獲得する第1のステップと、前記新しい情報を取り込むように前記既存の表示の少なくとも一部を更新するための1つ以上のビジュアル変換を動的に導出する第2のステップとを含み、前記変換の導出が、ビジュアル・コンテキスト管理制約をバランスさせ且つ意図される情報の所望のプレゼンテーションを達成するように試みる最適化演算としてモデル化される。
前記第1のステップは、前記ビジュアル・コンテキスト管理制約をフィーチャ・ベースの望ましさメトリックとしてモデル化することをさらに含むことができる。前記フィーチャ・ベースのメトリックは、表示オーバーラップ値(display overlap value)、知覚目印の保存値(perceptual landmark preservation value)、遷移の滑らか値(transition smoothnessvalue)、ビジュアル順序値(visual ordering value)、ビジュアル・クラッタ値(visual clutter value)のうちの1つ以上を測定することができる。前記フィーチャ・ベースのメトリックは、ユーザ情報、例えば、ユーザのデータ・ナビゲーション・プリファレンスを使用して作成することができる。
前記第1のステップは、1つ以上のビジュアル変換オペレータについて前記望ましさメトリックが最大化されるように前記最適化演算を行うステップをさらに含むことができる。
さらに、前記最適化演算は大域的最適化法(例えば、焼きなまし法(simulated-annealing technique))を含むことができる。
有利なことに、人間−コンピュータ間の会話中に導入される種々の、不測の情報を徐々に提示するために、本発明は、ビジュアル・コンテキスト管理を最適化問題としてモデル化する。1つの主目的は、全ての関連する制約(例えば、意味的な連続性を保証すること及びビジュアル・クラッタを最小化すること)の満足度を最大化する、1組の最適のビジュアル変換を見つけることである。その結果、本発明は、1組の包括的な制約を同時にバランスさせることによって、1組の近似最適のビジュアル変換を導出することができる。かかる技術は、容易に拡張可能である。というのは、かかる技術は、全てのビジュアル・コンテキスト管理制約を一様にモデル化するために、フィーチャ・ベースのメトリックを使用するからである。
以下では、本発明を不動産アプリケーション及びサービス・アプリケーションのような代表的な情報探索アプリケーションに関連して説明する。しかし、本発明は、かかるアプリケーションに限定されないことを理解されたい。むしろ、本発明は、最適化ベースのビジュアル・コンテキスト管理技術及びサービスを提供することが望ましい任意のアプリケーションに対し、一般的に適用可能である。さらに、本発明は、高品質の情報プレゼンテーション又はかかるプレゼンテーション・サービスを提供することが望ましい任意のアプリケーションに対し、一般的に適用可能である。
先ず、次の用語を定義する。「データ・オブジェクト」という用語は、提示することを意図する任意のタイプのデータ内容(例えば、不動産データベース内に存在する住宅リスト又はウェブサイト上に存在するホテルのリスト)を広く意味する。「メディア・オブジェクト」という用語は、データ内容を提示するために使用することができる任意のタイプのメディア(例えば、音声、テキスト、グラフィックス等)を広く意味する。また、「コンテキスト」という用語は、意図したデータ内容のプレゼンテーションが与えられる状況を意味する。これは、ユーザが実行中のタスク、人間−コンピュータ間の対話中に確立された会話コンテキスト、ユーザの嗜好(プリファレンス)及び興味を含むユーザ・モデル、装置プロパティを含む環境モデルのような、情報を含むことができる。
以下で詳述するように、本発明が提供するフレームワーク、システム及び方法は、後のユーザ・クエリによって要求される新しい情報を取り込むように、情報探索システムに関連する既存のビジュアル表示を動的に更新することに係る。かかる技術は、前記新しい情報を取り込むように前記既存の表示の少なくとも一部を更新するための1つ以上のビジュアル変換を動的に導出する。その場合において、ビジュアル・コンテキスト管理は、種々のビジュアル・コンテキスト管理制約をバランスさせ且つ意図される情報の所望のプレゼンテーションを達成するように試みる最適化演算としてモデル化される。
図面を参照して説明する。図1は、本発明の1つの実施形態に従ったビジュアル・コンテキスト管理コンポーネントを使用する、知的で且つコンテキスト・センシティブな情報探索システムを示す。かかるシステムを「会話システム」と称することもできるが、その理由は、ユーザとシステムの間の1つ以上のクエリと1つ以上の応答のシーケンスを一般的に会話と称することができるからである。
図示のように、情報探索システム100は、解釈モジュール102、会話管理モジュール104、内容決定モジュール106、コンテキスト管理モジュール108及びプレゼンテーション設計モジュール110を含む。
解釈モジュール102は、K. Houck, “Contextual Revision in Information-Seeking Conversation Systems,” ICSLP 2004 及び/又は J. Chai et al., “Context-based MultimodalInput Understanding in Conversation Systems,”Proceedings IEEE ICMI, pp. 67-92, 2002 に記載の技術を使用することができる。但し、本発明は、かかる技術に限定されるものではない。
また、会話管理モジュール104は、S. Pan, “A Multi-layer Conversation Management Approach for Information-Seeking Applications,” ISCLP 2004 に記載の技術を使用することができる。
また、内容決定モジュール106は、「Optimization-Based Data Content Determination」と題する、米国特許出願第10/969581号(2004年10月20日出願)に記載の技術を使用することができる。
さらに、コンテキスト管理モジュール108は、前掲の J. Chai et al., “Context-based MultimodalInput Understanding in Conversation Systems,”Proceedings IEEE ICMI, pp. 67-92, 2002 に記載の技術を使用することができる。
前記コンポーネントによって使用することができる技術について引用された前記文献は、かかるコンポーネントが使用することができる技術の単なる例に過ぎないことを理解されたい。すなわち、かかるコンポーネントは、かかる例示的な技術を実装することに限定されない。
しかし、本発明のビジュアル・コンテキスト管理技術は、好ましくはプレゼンテーション設計モジュール110内で実装されることを理解されたい。
システム100への入力は、1つ以上の形式で(例えば、グラフィカル・ユーザ・インタフェースを通して、又は音声及びジェスチャによって)与えられるユーザ要求である。かかる要求を与えられると、解釈モジュール102を使用して、当該要求の意味を解釈する。その解釈結果に基づき、会話管理モジュール104は、ハイ・レベルの適切なシステム処置を決定する。コンテキストに依存して、会話管理モジュール104は、要求されたデータを提示することによりユーザ要求を直接的に受け入れるように決定するか、又はユーザに対し追加の質問を行うことを選択することができる。ハイ・レベルのシステム処置は、提示すべき正確な内容を記述しないので、このシステム処置は、詳細化のために内容決定モジュール106に送られる。
内容決定モジュール106は、対話コンテキストに基づいて、応答の適正なデータ内容(例えば、現在のユーザ・クエリ及び時間や空間のような利用可能なプレゼンテーション資源に基づいて、どれだけのデータが検索されるか)を決定する。コンテキスト管理モジュール108は、種々の決定(例えば、ユーザの興味及びプリファレンス)を行うために必要とされるコンテキスト情報を管理し且つこれを提供する。一般に、コンテキストのタイプには、会話コンテキスト、ユーザ・コンテキスト及び環境コンテキストの3つがある。かかる情報は、1つ以上のデータベース内に格納することができる。会話情報は、ユーザ要求及びコンピュータ応答のシーケンスを記録する。ユーザ情報は、ユーザのプリファレンス及び興味を含む。環境情報は、システム環境に関する情報(例えば、使用される表示のタイプ)を含む。
データ内容が決定された後、メディア割り振りコンポーネント(図示せず)を使用して、1つ以上のデータ・メディア・マッピングの形式で意図したデータを伝えるために異なるメディアを割り振ることができる。なお、メディア割り振りコンポーネントは、例えば、「Optimization-Based Media Allocation」と題する、米国特許出願第11/031951号(2005年1月7日出願)に記載のものとすることができる。
その後、かかる結果は、提示のためにプレゼンテーション設計モジュール110に送られる。前述のように、本発明のビジュアル・コンテキスト管理技術は、好ましくはプレゼンテーション設計モジュール110内で実装される。
情報探索システム100は、知的で且つマルチモーダルの会話の使用を通して、コンテキスト・センシティブな情報アクセス及び探査をサポートする。具体的には、本システムは、ユーザが、自然言語、グラフィカル・ユーザ・インタフェース(GUI)及びジェスチャを含む複数の様式を使用して、コンテキストにおいて情報要求を表現することを可能にする。さらに、本システムは、ビジュアル及び音声出力を含む独自の応答を動的に作成する(例えば、図2を参照)。本システムは、種々のアプリケーションのうち任意のアプリケーションで実装できるが、本明細書では、本システムの特徴を説明するため2つの代表的アプリケーション、すなわち、ユーザが居住用財産を探索するのを援助する不動産アプリケーション、並びにユーザがホテル及びその快適な設備(例えば、レストラン)を見つけるのを援助するサービス・アプリケーションを使用する。
ユーザ要求を理解することに基づき、本システムは、その応答を3つのステップで自動的に作成する。第1に、本システムは、応答のタイプを決定する。図2のユーザ・クエリU1の場合、本システムは、要求された住宅を直接的に提示することを決定する。コンテキストに依存して、本システムは、異なるタイプの応答を作成することができる。例えば、本システムは、検索されるデータ・セットが非常に大きければ、追加の制約を供給するようにユーザに求めることができる。第2に、本システムは、応答の内容を決定する。U1に応答する場合、本システムは、価格及び様式のような住宅属性のサブセットを選択する。第3に、本システムは、適切なメディア及びプレゼンテーション技術を使用して、応答の形式を設計する。例えば、図2のシステム応答R1では、本システムは、グラフィックスを使用して地図上に住宅データを表示し、そして音声を使用して検索された住宅の数を要約する。
ユーザ・クエリU2(図2)のような後続の要求を扱うために、本システムは、R1に関連する既存のビジュアル・コンテキストの殆どを保存しつつ、最も安い住宅を強調する応答R2を作成する。対照的に、要求U2’については、本システムは、要求された住宅を拡大表示し、他の住宅を最小表示に維持する(応答R2’)。ここで、ビジュアル・コンテキストという用語は、ユーザがクエリを発する場合に知覚するビジュアル・シーンを意味する。新しい情報を既存のシーンと統合しなければ、ユーザは、情報を比較し且つ組み合わせることに困難を感じることがある。例えば、応答R2が最も安い住宅だけを表示するのであれば、ユーザは、この住宅を以前に検索された他の住宅に容易に関係付けることができない。
この例によって実証されるように、本システムは、ユーザ要求に対するその応答をランタイムで調整する。本発明は、ビジュアル・コンテキスト管理、すなわち、ユーザが全ての関連情報を全体として理解することができるように、新しく要求される情報を既存のビジュアル・コンテキストにどのように取り込むかを動的に決定するプロセスに注目する。より正確に説明すれば、ビジュアル・コンテキスト管理を使用して1組のビジュアル変換を導出することにより、新しい情報を取り込むように既存のコンテキストを更新する。例えば、図2の応答R2を得るために、本システムは、最も安い住宅に詳細事項を追加し且つ検索された他の住宅を単純化することにより、応答R1を更新する。
図3は、本発明の1つの実施形態に従った、プレゼンテーション設計モジュール(例えば、図1のモジュール110)を示す。具体的には、図3は、最適化ベースのビジュアル・コンテキスト管理フレームワーク300の実施形態を示す。すなわち、このプレゼンテーション設計モジュールによって実装されたビジュアル・コンテキスト管理技術は、ユーザが全ての関連情報を全体として理解することができるように、新しく要求される情報を既存のビジュアル・コンテキストにどのように取り込むかを動的に決定する。
フレームワーク300への入力は、既存のコンテキスト(以下で詳述)と、伝えるべき1つ以上のデータ・オブジェクト及び1組の利用可能なメディア・オブジェクトの形式を有するプレゼンテーション結果とを含む。例えば、データ・オブジェクトは、ユーザが提示することを要求する1組の住宅とすることができ、メディア・オブジェクトは、音声、テキスト及びグラフィックスのような使用すべき利用可能なメディアを含むことができる。ビジュアル・コンテキスト・マネージャ302に従って、最適化されたプレゼンテーションが生成される。以下、かかる最適化されたプレゼンテーションの生成方法を具体的に説明する。
図4は、ビジュアル設計機構とも称する、プレゼンテーション設計モジュール300(図3)の全体的な動作を示す。このビジュアル設計機構は、与えられたユーザ・クエリを扱うために、ビジュアル出力を自動的に作成する。実施形態では、これは3ステップ・プロセスである。第1に、スケッチ・ジェネレータは、ビジュアル・スケッチを作成する。このスケッチ・ジェネレータは、1組のビジュアル・オブジェクトを使用してビジュアル化すべきデータを符号化する。従来のスケッチ生成技術は、例えば、M. Zhou and M. Chen, “AutomatedGeneration of Graphic Sketches by Examples,” IJCAI ’03, pp. 65-71, 2003 に記載されている。
第2に、ビジュアル・レイアウト・マネージャは、このスケッチ内のビジュアル・オブジェクトのサイズ及び位置を決定する。具体的には、そのプロセスは、ビジュアル・バランスを保証し且つオブジェクト遮蔽(object occlusion)を回避するような、1組の空間レイアウト制約を自動的に導出する。1つの実施形態では、このプロセスは、非線形の制約ソルバを使用して幾何制約(例えば、プロポーショナル及びレイヤリング制約)を解決することができ、そして空間マネージャを使用して浮遊オブジェクト(例えば、コールアウト及び文字ラベル)の位置を決めることができる。
第3に、コンテキスト・マネージャは、スケッチを取り込むように既存のビジュアル・コンテキストを更新する。
このプロセスは3ステップのパイプラインとして実装できるが、これらの3ステップは相互に関連付けることができる。例えば、レイアウト・マネージャは、コンテキスト・マネージャが何を行うかということを殆ど知らないので、コンテキスト・マネージャがどのオブジェクトを維持/削除すべきかを決定した後に、これらのオブジェクトを再配置することを必要とすることがある。これらの2つのステップの間で行ったり来たりするのを回避するため、レイアウト・マネージャは、当該シーン内の各ビジュアル・オブジェクトごとに一連の候補サイズ及び位置パラメータを計算することができる。
以下では、1組の例を使用して、ビジュアル・コンテキスト管理が、ユーザ・プリファレンス及び種々のビジュアル化制約のような多くの要因にどのように影響されるかを説明する。第1に、(ユーザ・クエリ表現によってしばしば暗示される)ユーザのデータ・ナビゲーション・プリファレンスは、ビジュアル・コンテキスト管理に影響を与える。例えば、図2のクエリU2は、ユーザがデータを閲覧していることを暗示するのに対し、クエリU2’は、ユーザがデータをフィルタしていることを暗示することがある。本システムは、ユーザの意図を推測するために、「まさに」又は「どれが」のような言語キューを使用することができる。従って、クエリU2については、本システムは、さらなるデータ閲覧を容易にするためにビジュアル・コンテキストの殆どを保存するのに対し(応答R2)、クエリU2’については、データ・フィルタリングを満たすために最も安い住宅を拡大表示する(応答R2’)。
さらに、ユーザの会話に関するプリファレンスが、ビジュアル・コンテキスト管理に影響する。デフォルトにより、本システムは、ユーザが連続的な会話を行うものと仮定し、ユーザ・クエリを以前のクエリのコンテキストにおいて解釈する。ここで、図2のクエリU1の後に図5のクエリU3が発せられるものと仮定する。その延長として、本システムは、応答R1内に示した関連する住宅を保存しつつ、要求された地区データを提示する。しかし、会話中に、ユーザは新しいコンテキストの開始を望むことがある。その場合、本システムは、ユーザが「新しいコンテキスト」ボタンをクリックして、当該ユーザのコンテクスト・スイッチング・プリファレンスを指示することを許可することができる。クエリU1の後にクエリU3を発する代わりに、ユーザは、図6のクエリU4を発して、新しいコンテキストにスイッチする。この場合、本システムは、要求された学校のデータだけを示す新しいビジュアル出力を作成する。
ユーザのプリファレンスに加えて、複数の表示にわたって連続性を維持したり、ビジュアル・クラッタを最小化するような種々のビジュアル化制約が、ビジュアル・コンテキスト管理に影響を及ぼす。例えば、図5のクエリU3について意味的な連続性を維持するために、本システムは、要求された地区データを関連する住宅のコンテキストに取り込む。さらに、図7のビジュアルな連続性を維持するために、本システムは、以前に検索されたホテルと共に要求されたレストランを表示する。但し、本発明者のデータ・オントロジ(data ontology)によれば、これらのレストランとホテルは、遠隔的に関係付けられる。
ユーザ−システム間の会話中に、複数のビジュアル・オブジェクトをビジュアル・コンテキスト内に累積することができる。複雑なビジュアル表示は、ユーザの作業メモリを過負荷にしたり、情報の理解を妨げることがあるので、本システムは、連続性を維持しつつ、ビジュアル・クラッタを最小化するように試みる。クラッタを削減するために、本システムは、図5の住宅及び図7のホテルのような比較的重要でない情報を単純化するか、又は無関係のデータを削除することができる。
また、ユーザが複数のシーンにわたって情報を統合するのを支援するために、本システムは、重要な知覚目印を保存し且つ滑らかな遷移を提供する。例えば、図2では、本システムは、ビジュアルな遷移を固定するのを支援する、ハドソン川や主要な幹線道路のような地理的目印を保存する。さらに、本システムは、ユーザが変更の経過を追うことを可能にするために、滑らかなビジュアル遷移を保証する。例えば、本システムは、カメラの変更及びビジュアル・オブジェクトのアニメーション表示を行うことができる。
従って、本システムは、ユーザのプリファレンスに対応すること、視覚的な連続性を保証すること、ビジュアル・クラッタを最小化することを含む、種々のビジュアル・コンテキスト管理制約を考慮する。これらの制約は、しばしば相互依存性を呈するばかりか、互いに矛盾することもある。例えば、意味的な連続性の保存は、ビジュアル・クラッタの削減制約に違反することがある。従って、全ての制約をバランスさせることができない単純なヒューリスティックスを使用して、一貫性のあるビジュアル・コンテキストを維持することは非常に困難であるだろう。
関連する全ての制約を同時にバランスさせるために、本発明は、ビジュアル・コンテキスト管理に対する最適化ベースの接近方法を提供する。以下では、(例えば、図1の情報探索システム100のプレゼンテーション設計モジュール110によって実装された)この接近方法の詳細を説明する。
このプロセスについては、これを3つのステップに分けて説明する。第1に、ビジュアル・コンテキスト及びビジュアル・オペレータを特徴付ける、本発明のフィーチャ・ベースの表現を提示する(サブセクションA)。ここで、ビジュアル・オペレータは、1つ以上のビジュアル・オブジェクトのプロパティを更新する、ビジュアル変換を定義する。例えば、強調表示オペレータは、ビジュアル・オブジェクトの外観を更新する。第2に、定義されたフィーチャを使用して、種々のビジュアル・コンテキスト管理制約を一様にモデル化する、1組のメトリックを作成する(サブセクションB)。具体的には、各メトリックは、ビジュアル・コンテキストを更新するために1つ以上のビジュアル・オペレータを適用する望ましさを評価する。第3に、関連する全ての制約(サブセクションC)の満足度を最大化することによって1組のビジュアル・オペレータを動的に導出する、焼きなましアルゴリズムを提示する。
(A)フィーチャ・ベースの表現
ビジュアル・コンテキストは、ユーザ−システム間の会話中に継続的に更新される。かかる動的なビジュアル・コンテキストをモデル化するため、各ユーザの順番(user turn)の開始時又は終了時におけるコンテキストの状態を記述する。形式的に、次の表記法を使用する。ユーザの順番t+1 が与えられると、St は、当該順番の開始時におけるビジュアル・コンテキストを表し、St+1 は当該順番の終了時におけるビジュアル・コンテキストを表す。1組のフィーチャを使用して、St 及び St+1の意味的及び構文的なプロパティを記述する。同様に、1組のフィーチャを使用して、各ビジュアル・オペレータを特徴付ける。
(A)(i)2レベルのビジュアル・コンテキスト表現
ビジュアル・コンテキスト St は、1組のビジュアル・オブジェクトから構成される。例えば、ユーザの順番U2(図2)の開始時において、ビジュアル・コンテキストは、検索された住宅及び地区(R1)のようなオブジェクトを含む。Sにおける全体的なシーン及びこれに関連する各ビジュアル・オブジェクトを特徴付けるために、本発明者は、シーンの全体的なプロパティ及び各ビジュアル・オブジェクトの細目を記述するための2レベルの記述子を開発した。
具体的には、或るシーン内にあるビジュアル・オブジェクトの総数(volume)及び使用される色の数(colorVariety)のような集合化されたフィーチャを使用して、当該シーンを記述する。本発明の目標は、新しいシーンを既存のビジュアル・コンテキストに取り込むことにあるから、同じ1組のフィーチャを使用して、当該新しいシーン(例えば、図2のU2における最も安い住宅の細目)を記述する。この統合を容易にするために、 foci 及び scope という2つのフィーチャを追加する。foci というフィーチャは、現クエリの焦点を記述する。これに対し、scope というフィーチャは、当該新しいシーン内に現われるべき全ての情報を含む。図8のクエリU8については、foci は、要求された鉄道駅である。これに対し、scope は、当該鉄道駅及び当該鉄道駅を制約する住宅の両方を含む。一のユーザ・クエリを与えられると、本システムは、foci 及び scope の両方を動的に決定する。これらのフィーチャは、カメラ・パラメータを設定し且つ新しいシーンと既存のビジュアル・コンテキストとの間の意味的な関連を評価するために使用される。
全体的なシーンを記述することに加えて、各ビジュアル・オブジェクトのプロパティを特徴付ける。ビジュアル・オブジェクトは、データ・オブジェクトを符号化したものであって、色、サイズ及び位置のような基本的なビジュアル・プロパティを有する。ここで、ビジュアル・コンテキスト管理を容易にするため、データ及びビジュアルな意味的フィーチャに注目する。category のようなデータ・フィーチャを使用して、符号化されたデータの意味的カテゴリを記述し、prominence のようなビジュアル・フィーチャを使用して、ビジュアル符号化がどのように知覚されるかを指定する。次の表1は、本システムが使用する意味的フィーチャをリストする。これらのフィーチャのうち、以下で重点的に説明する3つの複雑なフィーチャは、データ重要度(dImportance)、ビジュアル重要度(vlmportance)及びビジュアル卓立度(prominence)である。なお、表1において記号 * を付したフィーチャは、動的に計算されるものである。
Figure 0004949407
データ重要度について説明する。「データ重要度」というフィーチャは、所与のユーザの順番に対し、データ・オブジェクトがどの程度重要であるかを指示する。全てのデータ・オブジェクトは、同じ重要度の値(0.0)で開始する。本システムは、データ重要度を2つの方法で動的に更新する。第1に、本システムは、その内容セレクタを使用して、データ重要度を決定する。もし、内容セレクタが、所与のユーザの順番において提示すべきデータ・オブジェクトを選択すれば、その結果、内容セレクタは、このオブジェクトの重要度を更新する。図8のクエリU8については、内容セレクタは、最も高い重要度を有する要求された鉄道駅を選択するとともに、より低い重要度を有する鉄道駅を制約する住宅を選択する。もし、データ・オブジェクトが選択されていなければ、その重要度は、時間減衰関数を使用して減少される。例えば、図2のU2に応答するために、本システムは、最も安い住宅を除いて、以前に示された住宅を選択しない。従って、それらの重要度の値は、順番U2において減少される。ユーザが新しいコンテキストを開始する特別なケースでは、本システムは、選択されていないデータの重要度を0.0にリセットする。
第2に、本システムは、データ関係を使用して、データ重要度を決定する。これが非常に有用であるのは、内容セレクタが、同じ重要度を複数のデータ・オブジェクトに割り当てる場合である。応答R1(図2)では、内容セレクタは、同じ重要度を検索された全ての住宅に割り当てる。これらの住宅は、U3(図5)では言及されていないので、それらの重要度は減少される。しかし、ハーツデール(Hartsdale)にある住宅は、他の住宅に比べると、U3に対しより意味的に関連する。その結果、本システムは、検索された地区データ(図5)を理解するのに有用なコンテキストをユーザに供給するために、これらの住宅を良好に保存する。従って、意味に関連するメトリックを次のように定義する。
Figure 0004949407
Figure 0004949407
本システムは、データ・オントロジを使用して、d 及び d'jの間のデータ関係 r を検索する。その後、本システムは、当該データベースを使用して、当該関係を確認する。ここで、d を住宅とし、 d'j をデータベース内の地区とする。本発明のオントロジによれば、住宅は地区内に位置する。本システムは、この関係を使用して、住宅 d がデータベース内の地区 d'j に実際に存在するか否かを確認する。この関係が成立すれば、 β=1 であり、さもなければ、 β=0 である。次に、オントロジにおけるデータ関係の各タイプごとに r() の値を静的に定義する。
要するに、所与のユーザの順番 t+1 におけるデータ・オブジェクト d のデータ重要度を次式のように定義する。
Figure 0004949407
ビジュアル重要度について説明する。データ重要度は、ビジュアル・オブジェクトがユーザ・クエリに対しどのように意味的に関係するかを評価する。これに対し、ビジュアル重要度は、ビジュアル・オブジェクトが現クエリの foci に対しどのように空間的に関係付けられるかを測定する。一般に、ユーザが要求した情報を提示する場合、近傍に位置するアイテムを示すことが望ましい。なぜなら、かかるアイテムは、ユーザが意図した情報を理解するのに有用なコンテキストを確立することを援助するからである。例えば、図7の(b)では、本システムは、要求されたレストランに加えて、近傍のホテルを示すことにより、全てのアイテムが何処にあるかという全体的な印象をユーザに与えるようにしている。
この概念によって、ビジュアル重要度というフィーチャは、次式に示すように、現クエリのfoci のビジュアル表現 V' に対するビジュアル・オブジェクト v の空間的関連度である。
Figure 0004949407
ビジュアル卓立度について説明する。ビジュアル卓立度は、ユーザがビジュアル・オブジェクトをどの程度容易に知覚することができるかを測定する。ビジュアル卓立度は、色、サイズ及び位置という3つの基本的なビジュアル変数を使用してモデル化される。ビジュアル・オブジェクト v が与えられると、その色卓立度 P1(v)、サイズ卓立度 P2(v)及び位置卓立度 P3(v)を定義する。
色卓立度は、背景に対するビジュアル・オブジェクトのコントラストが増大すればするほど、当該ビジュアル・オブジェクトの知覚を容易にする卓立度が増大することを記述する。例えば、背景が白色である場合、赤色のオブジェクトは、黄色のオブジェクトよりも目立ち安い。関数 contrast() は、次式に示すように、2色間のコントラスト値を戻す。
Figure 0004949407
サイズ卓立度は、ビジュアル・オブジェクトが大きくなればなるほど、当該ビジュアル・オブジェクトが目立って現われることを記述する。これは、次式に示す通りである。
Figure 0004949407
位置卓立度は、表示の中心近傍に置かれたオブジェクトが、他の任意の位置に置かれたオブジェクトよりも目立つことを記述する。これは、次式に示す通りである。
Figure 0004949407
前記3つの式を組み合わせることにより、次式に示すように、ビジュアル・オブジェクト v の全体的なビジュアル卓立度がモデル化される。
Figure 0004949407
(A)(ii)ビジュアル・オペレータ表現
ビジュアル・コンテキストを更新し且つ新しい情報を取り込むビジュアル変換をモデル化するために1組のビジュアル・オペレータを使用する。ビジュアル・オペレータは、それらの効果に基づいて、分類することができる。本発明者は、4グループのオペレータとして、カメラのパラメータを修正するカメラ・オペレータと、ビジュアル外観を更新する外観オペレータ(例えば、Highlight )と、幾何的プロパティを変更する幾何的オペレータ(例えば、Move 及び Scale )と、シーン構造を修正する構造オペレータ(例えば、Add )とを識別した。次の表2は、本システムが使用するオペレータをリストする。実際の実装に依存して、オペレータは、異なるビジュアル効果を呈することがある。例えば、オブジェクトを透明にするか、又は単にオブジェクトを隠蔽することによって、Delete を実装することができる。
Figure 0004949407
全てのビジュアル・オペレータを一様に表すために、各オペレータを7つのフィーチャに関連付ける。フィーチャ・オペランドは、オペレータが演算するビジュアル・オブジェクトを表し、フィーチャ・パラメータは、意図した変換を実行するために必要とされる特定の情報を保持する。以下に示すように、Scale というオペレータは、scaleFactor という1つのパラメータを有する。effect というフィーチャは、演算の後にオペランドのどのプロパティが修正されるべきかを測定する関数である。例えば、Scale は、オブジェクトのサイズを変更する。他方、cost というフィーチャは、意図したビジュアル変換を実行するコストを評価する。Cost は、ユーザが当該変換を知覚するのに必要な知覚的コストを測定する。例えば、ユーザにとっては、強調表示の効果よりもオブジェクトの移動を知覚する方がより高価につく。最後に、temporal-priority、startTime 及びendTime というフィーチャは、オペレータを適用するタイミングを制御する。次の表3は、Scale というオペレータの定義を概説する。
Figure 0004949407
(B)フィーチャ・ベースの望ましさメトリック
前述のように、多くの制約は、ユーザのプリファレンス及びビジュアル化制約を含む、ビジュアル・コンテキスト管理に影響を及ぼす。全ての制約を一様にモデル化するために、ビジュアル・コンテキスト及びビジュアル・オペレータの表現に基づいて、1組のメトリックを定義する。これらのメトリックは、新しい情報を取り込むように既存のビジュアル・コンテキストに1つ以上のビジュアル・オペレータを適用することの望ましさを評価する。それらの目的に沿って、これらのメトリックを2つのグループ、すなわちビジュアル運動量メトリック及びビジュアル構造化メトリックに分割する。ビジュアル運動量メトリックは、複数の表示間にわたるビジュアル・コンテキストの一貫性を評価する。ビジュアル構造化メトリックは、新しい情報が統合された後、ビジュアル・コンテキストの構造的な一貫性を評価する。ここでの目的は、完全な1組のビジュアル・コンテキスト管理制約を列挙することではない。そうではなく、重要な制約をどのようにして定量化するかを示すことである。説明の便宜上、全てのフィーチャ/メトリック値は、[0,1]の間に位置するように正規化される。
(B)(i)ビジュアル運動量メトリック
ビジュアル運動量は、複数の表示にわたって情報を抽出し且つ統合するユーザの能力を測定する。ビジュアル運動量の値は、複数の表示にわたって情報を理解するユーザの能力に比例する。このため、本システムは、ビジュアル・コンテキストを更新するときに、そのビジュアル運動量を最大化するように試みる。具体的には、ビジュアル・コンテキスト管理タスクに適用可能な3つの技術を使用する。すなわち、(1)連続的な表示の意味的及びビジュアル・オーバーラップを最大化する技術、(2)知覚的な目印を保存する技術、(3)滑らかなビジュアル遷移を保証する技術を使用するということである。
表示オーバーラップの最大化について説明する。適正な表示オーバーラップは、連続的な表示間にわたる情報を、ユーザが徐々につなぎ合わせることを支援する。2つのメトリック、すなわちビジュアル・オーバーラップ・メトリック及び意味的オーバーラップ・メトリックを定義する。ビジュアル・オーバーラップ・メトリックは、2つの表示間の不変性、特に、各ビジュアル・オブジェクトの状態 St とその新しい状態 St + 1 の間の平均的不変性を次式のように計算する。
Figure 0004949407
Figure 0004949407
同様に、複数の表示にわたって意味的に関係するアイテムがともに残っているか否かを評価する、意味的オーバーラップ・メトリックを定義する。これは、次式に示すように、St 及び St + 1 の意味的な関連性を計算する。
Figure 0004949407
前述のように定義されたビジュアル・オーバーラップ・メトリック及び意味的オーバーラップ・メトリックを使用して、ユーザ・ナビゲーション・プリファレンスによって規制される、全体的な表示オーバーラップをモデル化する。これは、次式に示すように、データ閲覧のためにより多くの表示オーバーラップを許容するが、データ・フィルタリングのためにより少ないオーバーラップしか許可しない。
Figure 0004949407
知覚目印の保存について説明する。知覚目印は、ユーザが連続するシーン内の情報を関係付けることを援助する、ビジュアル・コンテキスト遷移を固定する識別しやすいフィーチャである。例えば、米国ニューヨーク州ウェストチェスタ郡の地図が、図2及び図4〜図6に示される表示用の共通の背景として用いられ、そして可能である限り、主要な川及びハイウェイのような重要な地理的目印(例えば、図2のハドソン川)が複数のシーン内に存続する。ビジュアル・コンテキスト内に最大数の知覚目印を保存するため、次式に示すように、当該コンテキスト内にある目印の正規化された数をカウントする。
Figure 0004949407
滑らかな遷移の保証について説明する。シーン内の突然の変化は、ユーザがこれらの変化を視覚的に追跡するのを困難にする。その結果、既存のシーンと新しいシーンとの間の因果関係が失われることがある。連続的な表示間の滑らかな遷移を保証するために、アニメーションを使用して、ユーザに対しこれらの変化を解釈するための強力なキューを提供することがしばしば行われる。1組のビジュアル・オペレータを適用する場合の平均的な滑らか度を計算するためのメトリックを、次式のように定義する。
Figure 0004949407
前記メトリックは、オペレータが被る精神的コストが小さくなればなるほど、ユーザが知覚する遷移がより滑らかになることを記述する。
式(4)〜式(6)を組み合わせて、最大の表示間連続性を保証するための全体的なビジュアル運動量メトリックを、次式のように定義する。
Figure 0004949407
(B)(ii)ビジュアル構造化メトリック
ビジュアル・コンテキストの遷移中にビジュアル運動量を最大化することに加えて、当該遷移の後に当該コンテキストの構造が一貫していることを保証する。図4のスケッチ生成は、ビジュアル符号化に関する構造化問題を扱うので、ここでは、2つの側面からビジュアル統合に関する構造化問題に注目する。1つは、ユーザが新しい内容に容易に専念できるように、適正なビジュアル順序を保証することである。他は、新しい情報の統合後にビジュアル・クラッタを最小化することである。
適正なビジュアル順序の確立について説明する。適正なビジュアル順序を確立するため、現ユーザ・クエリにとって重要なデータ・アイテムが目立って表現されるように制約する。例えば、図8の(b)では、本システムは、新しく要求された鉄道駅の情報を強調表示する一方、住宅の表現を当該鉄道駅へのそれらの関連性に基づいて単純化する。すなわち、これらの鉄道駅を制約する住宅が僅かに単純化されるのに対し、他の住宅はそれらの最小値に減少される(図8の(a)及び(b)を参照)。データの重要度及びビジュアルな卓立度の間のかかる所望の相関性を捕捉するため、ビジュアル順序メトリックを次式のように定義する。
Figure 0004949407
Figure 0004949407
ビジュアル・クラッタの最小化について説明する。視覚的に乱雑なプレゼンテーションは混乱を生み、シーンの走査を不可能にすることがある。有用な情報を有するが乱雑でないビジュアル・コンテキストを提供するため、表示の全体的な複雑度を測定する。ビジュアルな複雑度に影響する、複数組の要因が知られている。1組の要因は、シーン内に現われる異なる色及び形状の数のような、オブジェクトの量及びそれらのプロパティの変化を含む。他の1組の要因は、対称性及び開放性のような、シーンの空間レイアウトに関係がある。図4のレイアウト・マネージャは、対称性を含む空間レイアウト制約を維持するので、ここでは、最初の1組の要因を使用して、ビジュアル複雑度を次式のように測定する。
Figure 0004949407
メトリック areaUsage() は、St + 1 によって占有される正規化スクリーン空間を次式のように計算する。
Figure 0004949407
メトリックshapeComplexity() は、次式に示すように、St+1 における異なる形状の総数及び全ての形状の平均的な複雑度を計算する(異なる形状は、異なる複雑度値を割り当てられる。例えば、テキストは、円のような簡単な幾何形状よりも複雑であると見なされる。)。
Figure 0004949407
シーンのビジュアル複雑度を最小化するために、以下の式を最大化する。
Figure 0004949407
(C) 焼きなましアルゴリズム
式(7)〜式(9)を組み合わせて、全体的な目的関数を次式のように定義する。
Figure 0004949407
ここでの目標は、目的関数を最大化するような1組のビジュアル・オペレータを見つけることである。このタスクは、典型的な二次割当問題を解決することであり、これはNP困難である。単純な欲張りアルゴリズムは、ローカルな極大に陥ることがあるので、本発明は、このクラスの問題を解決するのに有効であることが分かっている焼きなまし法を使用する。
次の表4は、例示的な焼きなましアルゴリズムを概説する。
Figure 0004949407
このアルゴリズムへの入力は、ユーザの順番 t + 1の開始時におけるビジュアル・コンテキスト S 及び統合すべき新しいシーン S´ である。このアルゴリズムは、所望の結果リストに反復的に追加するために(第2行〜第15行)、「温度」パラメータ T を使用する。本発明者の実験では、 T0=2.0、最小温度 Tmin=0.05 及び減少率 Δt=0.1 であるように T を初期化した。これらの値は、ともに反復の回数を制御するものである。
各反復中、このアルゴリズムは1組のオペレータをサンプルする(今や MAX_SAMPLE_COUNT=40)(第4行〜第13行)。各サンプリングでは、ルーチン find_operator() は、欲張り戦略を使用して一番上の候補を見つける(第5行)。具体的には、このアルゴリズムは、既に選択されたオペレータ及びオペレータ op を同じオペレータによって更新されていないビジュアル・オブジェクトに適用するために、reward() を計算する(式(10))。その後、このアルゴリズムは、全ての候補をそれらの報酬値によってランク付けし、一番上のものを戻す。このアルゴリズムは、一番上の候補及び既存の1組の結果を使用して、前記報酬が、既存の1組の結果だけを使用する場合よりも大きいか否かをテストする(第7行〜第8行)。もし、前記報酬の方が良ければ、一番上の候補が既存の1組の結果に追加される(第9行)。さもなければ、このアルゴリズムは、現在の制御確率が、[0,1]の間で rand() によって生成される乱数より大きいか否かをテストする(第10行)。それが真であれば、前記候補が追加される(第11行)。
各反復中、パラメータ T は、最適以下のオペレータを受け入れる確率を制御する。すなわち、このアルゴリズムが最適以下のオペレータを受け入れる可能性を小さくするように、パラメータ T は徐々に減少される(第14行)。このアルゴリズムが最終的に収束する場合(すなわち、T が目標の最小温度に達する場合)、このアルゴリズムは、式(10)の目的関数を最大化する、1組のビジュアル・オペレータを戻す(第16行)。複雑度の find_operator() は、 O(n2×m2) である。但し、n は St 及び S´ におけるビジュアル・オブジェクトの総数であり、m は使用可能なオペレータの数である。温度減少中のステップ数及び各温度において評価されるサンプルの総数は一定であるので、このアルゴリズムの総合的な複雑度は O(n2×m2) である。
1組の所望のビジュアル・オペレータを見つけた後、本システムは、当該オペレータをそれらのタイプ及びそれらのオペランドによってグループ化する。例えば、本システムは、同じタイプのオペランドを有する全ての Highlight オペレータをともにグループ化する。その後、本システムは、これらのオペレータを適用する順序を決定する。1グループ内のオペレータは、同時に適用することができる。かかる適用は、ビジュアル遷移中に知覚的なグループを認識するようにユーザをガイドする。例えば、1グループの住宅を同時に強調表示すると、ユーザは、それらの住宅をグループとして知覚することができる。さらに、異なるグループ内のオペレータは、時間的な優先順位によって順序付けられる。例えば、古いデータが新しいデータを上書きするのを防止するため、通常の場合、Delete はAdd よりも前に生じる。ここで、オペレータの各タイプごとの時間的な優先順位を静的に定義する。
1つの実施形態では、ビジュアル・コンテキスト管理方法を設定するために、3つのステップが使用される。第1に、データ意味カテゴリを割り当てるような静的フィーチャを定義する(表1)。本発明者の経験から、簡単なデータ・オントロジを構築すると、これらのフィーチャを定義するのが楽になる。第2に、ビジュアル・オペレータのカタログを構築する(表2)。第3に、アプリケーションにとって重要な種々の制約をモデル化するために、フィーチャ・ベースのメトリックを作成する。例えば、モバイル・アプリケーションでは、装置に依存するビジュアル・コンテキスト管理制約をモデル化することができる。また、アプリケーションのニーズに基づいて、メトリックのチューニングを望むことがある。例えば、データ閲覧アプリケーションでは、表示オーバーラップのための重みを増加させることができる(式(4))。
本プロセスをブートストラップし且つチューニング上の誤りを回避するためには、単純に開始することを提案する。前述の説明では、2つの異なるアプリケーションにおける種々の対話状況を適正に扱うために、簡単なデータ・オントロジ、1組の基本的なビジュアル・オペレータ及び等しく重み付けられたメトリック(式(10))を使用した。必要であれば、これを拡張するのは容易である。第1に、新しいビジュアル・オペレータを容易に導入することができる(例えば、ビジュアル・モーフィング用の魚眼ビュー・オペレータの追加)。さらに、所望の機能性を得るため、本発明の目的関数に新しいフィーチャ/メトリック(例えば、装置に依存するオペレータ・コスト・メトリック)を容易に取り込むことができる。
マルチモーダル会話システムをサポートすることに加えて、ビジュアル・コンテキスト管理に対する本発明の接近方法は、一層良好なビジュアル出力を作成するというより広い問題に適用可能である。例えば、この接近方法は、GUI駆動式の対話型のビジュアル出力システム内で使用することができ、その場合には、ユーザ対話の複数の順番にわたって得られる情報を統合するために、より一貫性のあるビジュアル出力を生成することができる。
対話型環境においてビジュアル出力を作成する場合、全体的なコンテキストの一貫性を保証するために、新しい情報を既存の表示へどのようにして徐々に統合するかを動的に決定することが必要である。以上で詳述したように、本発明は、ビジュアル・コンテキスト管理に対する最適化ベースの接近方法を提示する。既存のビジュアル・コンテキスト及び新しい情報を与えられると、本発明の目標は、最良の態様で既存のビジュアル・コンテキストを更新し且つ新しい情報を取り込むことができる、1組のビジュアル・オペレータを見つけることである。この目標を達成するため、本発明は、ビジュアル順序を保存し、ビジュアル運動量を維持するような種々のコンテキスト管理制約をモデル化するための、1組のメトリックを形成する。これらのメトリックを使用して、本発明は、1組のビジュアル・オペレータを適用する場合の全体的な望ましさを評価するために、全体的な目的関数を定義する。最後に、本発明は、焼きなましアルゴリズムを使用して目的関数を最大化し、所望のオペレータを見つける。
前述の制約のサブセットをより決定論的なコンテキストでしばしば考慮する既存の接近方法とは異なり、本発明の最適化ベースの接近方法は、種々の対話状況について包括的な1組の制約を動的にバランスさせる。また、本発明は、新しいフィーチャ/制約を容易に取り込むことができるという理由で、容易に拡張可能である。本発明を2つの異なるアプリケーションに適用した結果は、本システムが、人間の設計者に対して遜色がないほど適切に機能することを示している。
最後に、図9を参照して説明する。図9は、本発明の1つの実施形態に従った情報探索システムを実装するのに適したコンピュータ・システムを示す。例えば、図9のアーキテクチャは、図1〜図8を参照して説明した任意及び全てのコンポーネント及び/又はステップを実装するのに使用することができる。
図示のように、コンピュータ・システム900は、プロセッサ902、メモリ904、I/O装置906及びコンピュータ・バス910又は代替的接続手段を介して結合されたネットワーク・インタフェース908に従って、実装することができる。
「プロセッサ」という用語は、例えばCPU(中央処理装置)及び/又は他の処理回路を含む、任意の処理装置を包含するものと理解されたい。また、「プロセッサ」という用語は、複数の処理装置を意味することがあり、そして一の処理装置に関連する種々の要素を他の処理装置によって共有可能であることも理解されたい。
「メモリ」という用語は、プロセッサ又はCPUに関連するメモリ、例えば、RAM、ROM、固定メモリ装置(例えば、ハードドライブ)、取り外し可能なメモリ装置(例えば、フレキシブル・ディスク)、フラッシュ・メモリ等を含むように意図される。
また、「I/O装置」という用語は、処理装置にデータを入力するための1つ以上の入力装置(例えば、キーボード、マウス等)及び/又は処理装置に関連する結果を提示するための1つ以上の出力装置(例えば、スピーカ、表示装置等)を含むように意図される。
また、「ネットワーク・インタフェース」という用語は、例えば、コンピュータ・システムが適切な通信プロトコルを介して他のコンピュータ・システムと通信することを可能にする、1つ以上のトランシーバを含むように意図される。
従って、本明細書で説明した方法を実施するための命令又はコードを含むソフトウェア・コンポーネントは、これを関連するメモリ装置(例えば、ROM、固定式又は取り外し可能なメモリ)の1つ以上に格納し、そして使用する準備が完了した場合、その一部又は全部を(例えば、RAMへ)ロードし、CPUによって実行することができる。
さらに、本発明は、ビジュアル・コンテキスト管理サービスを提供するための技術を含むことを理解されたい。例えば、サービス・プロバイダは、ビジュアル・コンテキスト管理サービスを提供することについて、(例えば、サービス・レベルの契約又は他の非公式の合意を介して)サービス顧客又はクライアントと合意する。すなわち、1つの例だけを挙げれば、サービス・プロバイダは、顧客のウェブ・サイト及び関連するアプリケーションをホストすることができる。その場合、サービス・プロバイダは、当該サービス・プロバイダとサービス顧客との間の契約条件に従って、本明細書で説明した1つ以上の方法を含むビジュアル・コンテキスト管理サービスを提供することができる。
以上では、添付の図面を参照して本発明の実施形態を説明したが、本発明はこれらの実施形態それ自体に限定されるものではないこと、そして当業者によれば、本発明の範囲又は精神から逸脱することなく、種々の他の変更及び修正をなし得ることを理解されたい。
本発明の1つの実施形態に従った、ビジュアル・コンテキスト管理コンポーネントを使用する、知的で且つコンテキスト・センシティブな情報探索システムを示す図である。 本発明の1つの実施形態に従った、第1の記録済みユーザ−システム会話フラグメントを示す図である。 本発明の1つの実施形態に従った、ビジュアル・コンテキスト管理フレームワークを示す図である。 本発明の1つの実施形態に従った、ビジュアル出力生成方法を示す図である。 本発明の1つの実施形態に従った、第2の記録済みユーザ−システム会話フラグメントを示す図である。 本発明の1つの実施形態に従った、第3の記録済みユーザ−システム会話フラグメントを示す図である。 本発明の1つの実施形態に従った、第4の記録済みユーザ−システム会話フラグメントを示す図である。 本発明の1つの実施形態に従った、第5の記録済みユーザ−システム会話フラグメントを示す図である。 本発明の1つの実施形態に従った、情報探索システムを実装するのに適したコンピュータ・システムを示す図である。
符号の説明
100 情報探索システム
102 解釈モジュール
104 会話管理モジュール
106 内容決定モジュール
108 コンテキスト管理モジュール
110 プレゼンテーション設計モジュール
300 プレゼンテーション設計モジュール
302 ビジュアル・コンテキスト・マネージャ

Claims (2)

  1. 新しい情報を取り込むように既存のビジュアル表示を更新するための装置であって、
    メモリと、
    前記メモリに結合されたプロセッサとを備え、
    前記プロセッサが、
    後のユーザ・クエリによって要求される新しい情報を獲得する第1の動作と、
    前記新しい情報を取り込むように前記既存の表示の少なくとも一部を更新するための1つ以上のビジュアル変換を動的に導出する第2の動作とを実行し、
    前記変換の導出が、ビジュアル・コンテキスト管理制約をバランスさせ且つ意図される情報の所望のプレゼンテーションを達成するように試みる最適化演算としてモデル化され、
    前記最適化演算が、2つの表示間の不変性を示すビジュアル・オーバーラップ・メトリック、及び複数の表示にわたって意味的に関連するアイテムがともに残っているか否かを評価する意味オーバーラップ・メトリックに基づいて、一の表示アプリケーションについてはより多くのオーバーラップを許容し、他の表示アプリケーションについてはより少ないオーバーラップを許容するよう表示オーバーラップ・メトリックを計算する動作を含む、
    装置
  2. コンピュータ可読媒体に保持されるプログラムであって、
    後のユーザ・クエリによって要求される新しい情報を獲得する第1のステップと、
    前記新しい情報を取り込むように前記既存の表示の少なくとも一部を更新するための1つ以上のビジュアル変換を動的に導出する第2のステップとをコンピュータに実行させ、
    前記変換の導出が、ビジュアル・コンテキスト管理制約をバランスさせ且つ意図される情報の所望のプレゼンテーションを達成するように試みる最適化演算としてモデル化され、
    前記最適化演算が、2つの表示間の不変性を示すビジュアル・オーバーラップ・メトリック、及び複数の表示にわたって意味的に関連するアイテムがともに残っているか否かを評価する意味オーバーラップ・メトリックに基づいて、一の表示アプリケーションについてはより多くのオーバーラップを許容し、他の表示アプリケーションについてはより少ないオーバーラップを許容するよう表示オーバーラップ・メトリックを計算する動作を含む、
    プログラム
JP2008535505A 2005-10-17 2006-03-01 最適化ベースのビジュアル・コンテキスト管理 Expired - Fee Related JP4949407B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/251,686 US20070088735A1 (en) 2005-10-17 2005-10-17 Optimization-based visual context management
US11/251,686 2005-10-17
PCT/US2006/007275 WO2007046847A2 (en) 2005-10-17 2006-03-01 Optimization-based visual context management

Publications (2)

Publication Number Publication Date
JP2009512061A JP2009512061A (ja) 2009-03-19
JP4949407B2 true JP4949407B2 (ja) 2012-06-06

Family

ID=37949338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008535505A Expired - Fee Related JP4949407B2 (ja) 2005-10-17 2006-03-01 最適化ベースのビジュアル・コンテキスト管理

Country Status (6)

Country Link
US (2) US20070088735A1 (ja)
EP (1) EP1952275A4 (ja)
JP (1) JP4949407B2 (ja)
CN (1) CN101292240B (ja)
CA (1) CA2625726C (ja)
WO (1) WO2007046847A2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9116989B1 (en) 2005-08-19 2015-08-25 At&T Intellectual Property Ii, L.P. System and method for using speech for data searching during presentations
US8977965B1 (en) 2005-08-19 2015-03-10 At&T Intellectual Property Ii, L.P. System and method for controlling presentations using a multimodal interface
US9026915B1 (en) 2005-10-31 2015-05-05 At&T Intellectual Property Ii, L.P. System and method for creating a presentation using natural language
US7685200B2 (en) * 2007-03-01 2010-03-23 Microsoft Corp Ranking and suggesting candidate objects
US10481878B2 (en) * 2008-10-09 2019-11-19 Objectstore, Inc. User interface apparatus and methods
US8935292B2 (en) * 2008-10-15 2015-01-13 Nokia Corporation Method and apparatus for providing a media object
US9146969B2 (en) * 2012-11-26 2015-09-29 The Boeing Company System and method of reduction of irrelevant information during search
US20160275067A1 (en) * 2015-03-20 2016-09-22 Microsoft Technology Licensing, Llc Domain-based generation of communications media content layout
US9652218B2 (en) 2015-06-17 2017-05-16 International Business Machines Corporation Feature exploitation evaluator
US10599320B2 (en) 2017-05-15 2020-03-24 Microsoft Technology Licensing, Llc Ink Anchoring
US11928483B2 (en) * 2017-05-16 2024-03-12 Apple Inc. Devices, methods, and graphical user interfaces for seamless transition of user interface behaviors
US10318109B2 (en) 2017-06-09 2019-06-11 Microsoft Technology Licensing, Llc Emoji suggester and adapted user interface
US10366166B2 (en) * 2017-09-07 2019-07-30 Baidu Usa Llc Deep compositional frameworks for human-like language acquisition in virtual environments

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5577254A (en) * 1993-06-29 1996-11-19 Bull Hn Information Systems Inc. Method and apparatus for capturing the presentation of an interactive user session, monitoring, replaying and joining sessions
US5726979A (en) * 1996-02-22 1998-03-10 Mci Corporation Network management system
EP0899703B1 (en) * 1997-08-25 2002-10-30 Texas Instruments France A navigational system
US6307573B1 (en) * 1999-07-22 2001-10-23 Barbara L. Barros Graphic-information flow method and system for visually analyzing patterns and relationships
AU2001238311A1 (en) * 2000-02-14 2001-08-27 Geophoenix, Inc. System and method for graphical programming
US6424933B1 (en) * 2000-03-17 2002-07-23 Vicinity Corporation System and method for non-uniform scaled mapping
AU2001247789A1 (en) * 2000-03-22 2001-10-03 Sidestep, Inc. Method and apparatus for dynamic information connection engine
US6655963B1 (en) * 2000-07-31 2003-12-02 Microsoft Corporation Methods and apparatus for predicting and selectively collecting preferences based on personality diagnosis
US6985929B1 (en) * 2000-08-31 2006-01-10 The United States Of America As Represented By The Secretary Of The Navy Distributed object-oriented geospatial information distribution system and method thereof
CA2361022A1 (en) * 2000-11-03 2002-05-03 Charles Allan Armstrong Knowledge management system
US7155510B1 (en) * 2001-03-28 2006-12-26 Predictwallstreet, Inc. System and method for forecasting information using collective intelligence from diverse sources
KR100475432B1 (ko) * 2002-02-26 2005-03-10 삼성전자주식회사 그래픽 사용자 인터페이스의 디자인 변경 방법 및 이를 위한 기록매체
US20040231914A1 (en) 2003-01-02 2004-11-25 3M Innovative Properties Company Low thickness sound absorptive multilayer composite
US7529728B2 (en) * 2003-09-23 2009-05-05 Salesforce.Com, Inc. Query optimization in a multi-tenant database system
CA2453605C (en) * 2003-12-17 2009-06-30 Ibm Canada Limited-Ibm Canada Limitee Integrated visual and language-based system and method for reusable data transformations
US20060085387A1 (en) 2004-10-20 2006-04-20 Inernational Business Machines Corporation Optimization-based data content determination
US7461052B2 (en) * 2004-12-06 2008-12-02 International Business Machines Corporation Abstract query plan
US20060167835A1 (en) 2005-01-07 2006-07-27 International Business Machines Corporation Optimization-based media allocation
US8005643B2 (en) * 2007-06-26 2011-08-23 Endeca Technologies, Inc. System and method for measuring the quality of document sets
US20090089293A1 (en) * 2007-09-28 2009-04-02 Bccg Ventures, Llc Selfish data browsing

Also Published As

Publication number Publication date
WO2007046847A3 (en) 2008-02-14
EP1952275A4 (en) 2009-04-08
CN101292240B (zh) 2012-03-28
JP2009512061A (ja) 2009-03-19
US20070088735A1 (en) 2007-04-19
WO2007046847A2 (en) 2007-04-26
CN101292240A (zh) 2008-10-22
US9298855B2 (en) 2016-03-29
US20080306988A1 (en) 2008-12-11
EP1952275A2 (en) 2008-08-06
CA2625726C (en) 2019-03-05
CA2625726A1 (en) 2007-04-26

Similar Documents

Publication Publication Date Title
JP4949407B2 (ja) 最適化ベースのビジュアル・コンテキスト管理
CN103098051B (zh) 搜索引擎优化助理
US9405847B2 (en) Contextual grouping of a page
JP2020024698A (ja) ナレッジグラフの生成方法、装置、機器およびコンピュータ読み取り可能な記憶媒体
US20160266766A1 (en) Three dimensional conditional formatting
US20130185657A1 (en) Media Annotation Visualization Tools and Techniques, and an Aggregate-Behavior Visualization System Utilizing Such Tools and Techniques
US20160364115A1 (en) Method, system, and media for collaborative learning
JP2015511746A (ja) 会話式情報検索システムおよび方法
US10467781B1 (en) Information environment map
CN102902697A (zh) 用于生成结构化文档导视图的方法和系统
CN105653134A (zh) 应用切换方法及其系统
US10762902B2 (en) Method and apparatus for synthesizing adaptive data visualizations
US20090132506A1 (en) Methods and apparatus for integration of visual and natural language query interfaces for context-sensitive data exploration
KR20140040920A (ko) 매쉬업 블록 유저 인터페이스를 이용한 매쉬업 저작 장치 및 그 방법
JP2007164285A (ja) 情報処理システムおよび情報処理方法
CN109791545A (zh) 用于包括图像的显示的资源的上下文信息
WO2005003919A2 (en) Multi-level confidence measures for task modeling and its application to task-oriented multi-modal dialog management
Paternò Tools for Task Modelling: Where we are, Where we are headed.
Wen et al. An optimization-based approach to dynamic visual context management
Kray et al. Map plasticity
Garrigós et al. Adapting the presentation layer in rich internet applications
Paterno et al. Engineering the design of usable hypermedia
Lemon et al. Statistical approaches to adaptive natural language generation
Lemon et al. Reinforcement learning approaches to natural language generation in interactive systems.
Dubois et al. Usability Recommendations for Mixed Interactive Systems: extraction and integration in a design process

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120307

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees