JP4101239B2 - 自動クエリクラスタリング - Google Patents

自動クエリクラスタリング Download PDF

Info

Publication number
JP4101239B2
JP4101239B2 JP2005018656A JP2005018656A JP4101239B2 JP 4101239 B2 JP4101239 B2 JP 4101239B2 JP 2005018656 A JP2005018656 A JP 2005018656A JP 2005018656 A JP2005018656 A JP 2005018656A JP 4101239 B2 JP4101239 B2 JP 4101239B2
Authority
JP
Japan
Prior art keywords
items
properties
item
cluster
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005018656A
Other languages
English (en)
Other versions
JP2005235196A (ja
JP2005235196A5 (ja
Inventor
トゥルスキ アンジェ
チェン リリ
マクローリン マシュー
エフ.ラシド リチャード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2005235196A publication Critical patent/JP2005235196A/ja
Publication of JP2005235196A5 publication Critical patent/JP2005235196A5/ja
Application granted granted Critical
Publication of JP4101239B2 publication Critical patent/JP4101239B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B62LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
    • B62BHAND-PROPELLED VEHICLES, e.g. HAND CARTS OR PERAMBULATORS; SLEDGES
    • B62B5/00Accessories or details specially adapted for hand carts
    • B62B5/04Braking mechanisms; Locking devices against movement
    • B62B5/0485Braking mechanisms; Locking devices against movement by braking on the running surface, e.g. the tyre
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60BVEHICLE WHEELS; CASTORS; AXLES FOR WHEELS OR CASTORS; INCREASING WHEEL ADHESION
    • B60B33/00Castors in general; Anti-clogging castors
    • B60B33/04Castors in general; Anti-clogging castors adjustable, e.g. in height; linearly shifting castors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Library & Information Science (AREA)
  • Transportation (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、一般にコンピュータシステムに関し、より詳細には情報アイテムを様々なプロパティクラスタ(property clusters)に関連付けられたアイテムの分類を分析することで、情報アイテムをより小さなサブセットに自動的に体系化するシステムおよび方法に関する。
データベースベースのオペレーティングシステムが備える1つの重要な特徴は、多くのアイテムプロパティに関連するクエリを実行することで、該当するアイテムを迅速に見つけ出すことができることである。これに比べて、従来のシステムでは、例えば必要な情報を取り出すためにはフォルダ階層内のファイルの場所がわかっていなければならない。このクエリを使用したアプローチは非常に強力であるが、新しいシステムが成功するかどうかの大部分は、平均的なユーザがクエリを実行できる簡単でわかりやすいユーザインターフェース(UI)を作成できるかどうかにかかっている。データベースクエリ(例えばT−SQL言語で表現される)は、本来の形では専門のプログラマにとっても処理が難しいので、通常、エンドユーザには適していない。
クエリの問題への1つのアプローチは、事前に定義されたいくつかのクエリに直接アクセスできるユーザインターフェースコマンドを提供することである。例えば、ディスク(ピクチャライブラリ)上のすべてのピクチャファイルや、すべての未読電子メールを見つけ出す事前定義のクエリを作成できる。さらに、システムは特定の方法で結果のグループ分けを提示することもできる。例えば、写真を撮影日によって自動的にグループ分けしてもよい。このようなパターンの事前定義クエリは、共通のシナリオの多くで役に立つが、一般性に欠けるため、データベースの機能をフルに活用することはできない。写真の例を使用すると、すべての写真を同じ日に撮影した(あるいはおそらくカメラのクロックがセットされていなかった)場合は、日付でグループ分けするのは無意味である。サードパーティのプロパティ(アプリケーション定義、管理者定義、あるいはユーザ定義のプロパティ)を処理する場合は、この状況がさらに悪化する。こうしたプロパティはオペレーティングシステムの作成元では把握していないので、このようなプロパティに関する事前定義のクエリを設定するのはほとんど不可能であろう。
もう1つのアプローチは、一見自然言語に近いテキストのクエリを使用してユーザがデータベースのクエリを実行できるようにすることである。こうしたクエリは、データベースという観点から見て十分に一般的であり、ユーザにもわかりやすいと言える。しかし、完全な自由形式による自然言語のクエリを記述できるようにする場合、個々のケースでユーザの意図を正しく理解するパーサを作成するのは困難である。何らかの文法上の制約を課す場合、多くの式の組合せで処理できるクエリを、ユーザが正しい構文で作成するのはさらに困難になる。いずれにしても、クエリのテキストを入力しなければならないという発想自体が多くのユーザを遠ざける恐れがある。小さな子供、英語を母国語としないユーザ、キーボードのないデバイス(例えばタブレットPC)のユーザのいずれにとっても、テキストの入力は困難である。したがって、ポイントアンドクリック方式で簡単に情報を見つけ出し、取り出すことができるクエリインターフェースが必要である。
本発明のいくつかの態様について基本的な理解が得られるように、本発明の概要について以下に簡単に説明する。以下の説明は、本発明の広範囲の概要を示すものではない。本発明の重要/不可欠な要素を特定したり、本発明の範囲を限定したりする意図はない。唯一の目的は、後述の実施形態に関する説明の準備として、本発明に関するいくつかの概念を簡略化した形で示すことである。
本発明は、必要な情報を管理しやすい情報クラスタのサブセットの形で自動的に取り出し、表示する方法に関する。ファイルシステムのユーザインターフェースでは、必要な情報を見つけ出し、取り出そうとする場合に、例えばアイテムをリスト形式で表示することによって大規模なアイテムセット内をナビゲートする(navigating)のは厄介な作業になる。本発明は、アイテムのプロパティに基づいて分類された大規模なアイテムセットをナビゲートできる改良型のポイントアンドクリック方式のインターフェースを提供する。このようなプロパティに基づいてクラスタリングされたアイテムは、フォルダと同様の形式で(あるいは他の形式で)表示できる。これにより、別のプロパティまたは下位の(subsequent )プロパティを使用して自動的なクラスタ化を行い、クエリの結果を容易に管理できるクラスタのサブセットに分割または体系化できる。そして、こうしたサブセットを選択して必要な情報を取り出したり、他のクラスタリング手順(例えばネストされたクラスタ化)を実行したりできる。クラスタリングの基準となる最適なプロパティは、様々なプロパティクラスタ内のアイテム分類を分析することで決定できる。
本発明の一態様により、クラスタ化のプロパティが自動的に選択される。このようなプロパティを決定するための問題は、次のように記述できる。「開始アイテムセットとグループ分けに使用できる一連のアイテムプロパティが指定された場合、このアイテムセットに関連付けられたどのプロパティを使用すれば結果の最適なクラスタリングを実現できるか。」本発明では、結果の最適なクラスタリングによって、結果を均一にグループ分けし、適切な数のクラスタに分割しようとする。したがって、クラスタ数がほんのわずかでそれぞれのアイテム数が非常に多い場合、またはクラスタ数が非常に多くてそれぞれのアイテム数がほんのわずかの場合は、必要な情報を効率的に見つけ出し、取り出すためには一般的に望ましくない。
前述の問題は、アイテムプロパティごとにクラスタ化のスコアを割り当て、スコアが最も高いプロパティを選択することで解決できる。クラスタ化のスコアは、各クラスタに属するアイテムの数をかけ合わせることで計算できる。アイテムがN個の場合にクラスタサイズの積としてクラスタ化のスコアを計算する関数は、アイテムが
Figure 0004101239
個のクラスタに分割され、各クラスタに
Figure 0004101239
個のアイテムが属する場合に最大値をとる。他の分類については、このスコアを利用してこの分類が理想的な分類からどれだけかけ離れているかを測定し、比較する。別のスコア関数の例は、例えば2項分布に基づいていてもよい。この種の分布では、スコアの値に統計的な意味があり、合計N個アイテムを特定のサイズのクラスタに分割できる多くの方法が提供される。ユーザにとって最も価値のあるクラスタ化は、それに代わる分類の最大数を軽減するものである。下位のクラスタ化に使用できる様々なプロパティを比較するために、すべてのプロパティについてクラスタ化のスコアを計算してもよい。このような計算は、一連のアイテムを1回ずつ使用して容易に実行できる。
前述の目的と関連の目的を達成するために、ここで本発明の特定の例示的な態様について、以下の実施形態と添付の図面に関連付けながら説明する。これらの態様は、本発明を実施できる様々な方法を示している。こうした方法は、すべて本発明の範囲に含まれるものとする。本発明のその他の利点と新しい機能は、以下に示す本発明の実施形態に添付の図面を関連付けて考察することで明らかになるであろう。
本発明は、ローカルデータベースシステムまたはリモートデータベースシステム内のデータアイテムを自動的にクラスタ化し、表示するシステムおよび方法に関する。こうしたクラスタ化は、データアイテムに関連する、タイプ、場所、人物、日付、時刻、ユーザ定義などのプロパティに基づいていてもよい。この場合、最初のプロパティを使用してクラスタ化の最初のレベルを形成し、さらに下位のプロパティを自動的に決定して最適なクラスタ化を形成し、ここから必要な情報を見つけ出し、取り出す。一態様では、データを体系化し、取り出すコンピュータ制御のインターフェースが提供される。このインターフェースには、少なくとも2つのクラスタプロパティに関するアイテムの分類を決定するプロパティアアナライザと、部分的にこのアイテムの分類に基づいて新しいクラスタを形成するオーガナイザが含まれる。
本出願で使用する限り、「コンポーネント」、「アナライザ」、「クラスタ」、「システム」などの用語は、コンピュータ関連のエンティティを表すものとし、ハードウェア、ハードウェアとソフトウェアの組合せ、ソフトウェア、実行中のソフトウェア(software in execution)のいずれでもよい。例えば、コンポーネントは、プロセッサで実行するプロセス、プロセッサ、オブジェクト、実行可能ファイル、実行中のスレッド、プログラム、および/またはコンピュータのいずれでもよいが、これらに限定はされない。例えば、サーバ上で動作するアプリケーションとサーバはいずれもコンポーネントとすることができる。実行中のプロセスおよび/またはスレッド内に1つまたは複数のコンポーネントが存在してもよい。また、コンポーネントは1台のコンピュータに集中しても、かつ/または2台またはそれ以上のコンピューに分散してもよい。さらに、こうしたコンポーネントは、様々なデータ構造を格納した様々なコンピュータ可読媒体から実行してもよい。コンポーネントは、ローカルプロセスおよび/またはリモートプロセスを介して、例えば1つまたは複数のデータパケット(例えば、ローカルシステム内、分散システム内の別のコンポーネントと、および/またはインターネットなどのネットワークを経由して信号を介して他のシステムと対話するコンポーネントのデータ)を含む信号に従って通信できる。
初めに図1を参照すると、本発明の一態様に従ったクエリクラスタリングシステム100が示されている。システム100は、ユーザインターフェース(図示せず)に表示する複数のデータアイテム120を格納するデータストレージ110を備えている。こうしたアイテム120には、文書、ファイル、フォルダ、イメージ、オーディオファイル、ソースコードなどを含めてもよい。これらは、後で詳細に説明するユーザインターフェースに様々な状態で表示できる。また、アイテム120には、アイテムのタイプ(イメージ、文書、スプレッドシート、バイナリなど)、作成日、アイテムに関連付けられた人物、場所、カテゴリ、ユーザ定義のプロパティなどの側面を表す様々なプロパティ(例えばメタデータ)が関連付けられている。アグリゲータ(aggregator)130はアイテム120と関連のプロパティを収集してプロパティアナライザ140に提供し、プロパティアナライザ140は個々のアイテムとプロパティの分析を行う。例えば、こうした分析の中で、様々なクラスタリングのシナリオあるいはアイテムのグループ分けの可能性を探るためのスコアを自動的に決定してもよい。
アナライザ140の分析に基づいて、クラスタオーガナイザ150は新しいクラスタ160の最適なグループ分けをユーザに提示する。クラスタ160の最適なグループ分けによって、データストレージ110から必要な情報を容易に見つけ出し、取り出すことができる。データストレージ110は、ローカルストレージ媒体、リモートストレージ媒体、ローカルストレージとリモートストレージの組合せのいずれでもよい。
自動クラスタリングの1つの例では、デフォルトの最上位レベルのクラスタ化によってアイテムをアイテムタイプに基づいてグループ化できる。ユーザの研究では、第1レベルのアイテムタイプに基づくグループ化は実用的であり、ユーザが理解しやすいことがわかっている。ただし、別のプロパティによる第2レベルのクラスタ化は自明ではなく、わかりにくいことも示されている。こうして、本発明の一態様により、クラスタ化のプロパティを自動的に選択できる。この問題は、次のように記述できる。「開始アイテムセットとグループ化に使用できるアイテムプロパティセットとが指定された場合、どのプロパティを使用すれば最適なクラスタリングされた結果を実現できるか。」最適なクラスタリングされた結果によって、アイテムを均一に適切な数のクラスタに分割することが目標である。
上の目標は、アイテムのプロパティごとにクラスタ化のスコアを割り当て、スコアが最も高いプロパティを選択することで達成できる。クラスタ化のスコアは、以下の式に示すように、各クラスタに属するアイテムの数をかけ合わせることで計算できる。
score=n_itemscluster1*n_itemscluster2*...
アイテムがN個の場合は、クラスタサイズの積としてクラスタ化のスコアを計算する関数は、アイテムが
Figure 0004101239
個のクラスタに分類され、各クラスタには
Figure 0004101239
個のアイテムが属する場合に最大値をとる。他の分類については、このスコアを利用してこの分類が最適な分類からどれだけ離れているかを測定し、比較する。上のスコア関数により、テストケースで妥当な結果が得られることがわかっている。ただし、利用されたスコア関数は1つの例であることに留意されたい。例えば、他の関数を利用して様々な相対的な重みを割り当て、分類が理想的な分類からどれだけかけ離れているかを表すことができる。
別のスコア関数の例は、次のように2項分布に基づいていてもよい。
score=(N_total)!/(n_itemscluster1)!*(n_itemscluster2)!*...)
この例では、スコアの値に統計的な意味があり、合計N個アイテムを特定のサイズのクラスタに分類できる多くの方法が提供される。ユーザにとって最も価値のあるクラスタ化は、それに代わる分類の最大数を軽減するものである。下位のクラスタ化に使用することができる様々なプロパティを比較するために、すべてのプロパティについてクラスタ化のスコアを計算する。この計算は、図2に詳細に示されているように、一連のアイテムを1回ずつ使用して容易に実行できる。
図2は、本発明の一態様に従った自動クエリクラスタリングプロセス200を示す流れ図である。説明を簡単にするために、本方法は一連の動作として図示され、説明されているが、本発明がこの動作の順序に限定されないことを理解されたい。例えば、いくつかの動作は、本発明に従って以下に説明する様々な順序で、かつ/またはここで図示され、説明される他の動作と同時に発生してもよい。例えば、方法論は、状態図のように相互に関連する一連の状態またはイベントとしても表現できることを当業者は理解するであろう。さらに、本発明に従った方法を実装するために、図示されたすべての動作が必要なわけではない。
N個のアイテムとM個のプロパティが存在し、これらについて比較する場合は、プロセス200を次のように使用できる。210で、M個のハッシュテーブルを初期化する。220で、N個のアイテムについて繰り返す。230で、アイテムごとにM個のプロパティについて繰り返す。240で、アイテムプロパティごとにハッシュ値を計算する。ハッシュ関数は、同じクラスタに属する2つのプロパティの値は同じハッシュ値を返すように選択される。例えば、日付/時刻のプロパティによるクラスタリングの場合に、ハッシュ関数は日付の要素のみに基づき、時刻の要素を無視してもよい。250で、ハッシュテーブルを使用してクラスタの数と各クラスタに属するアイテムの数を追跡する。260で、プロパティごとに関連のハッシュテーブルのデータを使用してクラスタ化のスコアを計算する。
270で、リスト上に記載されるプロパティは、それぞれが生成するクラスタの品質によって順序付けられる。アイテムの数が特定のしきい値を超えると(例えば10アイテムを超えると)、280でリストの最上位のプロパティを使用して結果を自動的にクラスタリングできる。次の順位に相当する別のクラスタリングを代わりに指定してもよい。例えば、タイプが電子メールメッセージのすべてのアイテムを選択すると、電子メールメッセージのテストケースでは、前述のプロセスによって結果をメッセージの送信者ごとに自動的にクラスタリングする。ただし、タイプがWord文書のアイテムを選択すると、例えば最終更新日に基づいてクラスタが作成される。一方、タイプがC#ソースファイルのアイテムの場合は、格納される場所ごとにグループ化される(これはプログラミングプロジェクトごとのグループ分けに対応する)。前述のアプローチの一般的な性質により、カスタムプロパティおよびサードパーティのプロパティの評価も含めて、特定のアイテムセットに最適なグループ化のアルゴリズムを決定できる。
図3〜10は、前述の1つまたは複数の自動クラスタリングシステムおよびプロセスを説明するユーザインターフェースの様々な例を示している。このようなインターフェースには、複数の寸法、形状、色、テキスト、データ、サウンドを設定できる設定可能なアイコン、ボタン、スライダ、入力ボックス、選択オプション、メニュー、タブなどの形でこうした態様を含む1つまたは複数の表示オブジェクトを備えており、システム100の動作を円滑化する表示が含まれることに留意されたい。さらに、このインターフェースには本発明の1つまたは複数の態様を調整し、設定する他の複数の入力またはコントロールも含まれる。これらについては、以下で詳説する。これには、マウス、キーボード、音声入力、Webサイト、リモートWebサービス、および/またはカメラやビデオの入力のような他のデバイスからのユーザコマンドを受信して、システム100のインターフェースの動作または他の態様を左右したり変更したりすることが含まれてよい。
以下の説明は、本発明の様々な態様を説明しており、図3〜10に示すインターフェースの例に関連する。フォルダまたは他のタイプの構造体を設計する場合は、設計者(アプリケーションプログラマでもエンドユーザでもよい)の自由度が高いので、あまり重要でないアイテムまたはほとんど使用しないアイテムを非表示のフォルダに移動することで上位の表示から隠すことができる。同様に、プロパティベースのブラウザを作成する場合は、クラスタリングアルゴリズムで高スコアが割り当てられた場合でも、様々なメカニズムを使用して意味のないプロパティまたは役に立たないプロパティを非表示にできる。
プロパティの格上げ/格下げ(up/downgrading)は、様々なレベルで考慮できる。アプリケーションレベルでは、どのプロパティがユーザインターフェースにさらすべき第1位のプロパティか、およびどのプロパティが第2位のあるいは補助のプロパティかをアプリケーション設計者が指定できる。これは、通常はアイテムタイプごとに個別に定義される。前のセクションで説明した自動クエリクラスタリングでは、一般に第1位のプロパティを考慮する。さらに、アイテムタイプごとに、すべてのアイテムに共通のプロパティのプロパティマッピングを定義する必要がある。例えば、共通の日付プロパティは、写真の場合は撮影日にマッピングされ、文書の場合は最終更新日にマッピングされる。同様に、人物のフィールドは、文書の場合は作成者であるが、電子メールの場合は送信者である。他のプロパティについても同様である。
一般に、個々のデータを表示する場合にどのプロパティが最適であるかを決定できるのはユーザである。特定のプロパティを格上げまたは格下げするための明示的なUIがあってもよいが、本発明はユーザの操作から暗黙的に学習することもできる(例えば学習アルゴリズムを介して)。各プロパティには重みが割り当てられており、この重みはユーザが異なるプロパティのクラスタ化から別のプロパティのクラスタ化に切り替える場合に増大し、終了(switch out)する場合に減少する。各プロパティの最終的な格付け(rating)(どのプロパティでクラスタリングするかの判断に使用する)は、プロパティの重みとクラスタ化のスコア(前述の式に従って計算した値)の積である。
前述のように、ユーザは一般にフラットなリストよりアイテムタイプのクラスタを使用した階層構造を好む。階層によって特定のタイプの順序が導入され、要求されたアイテムタイプの値を見つけ出しやすくなる。ある程度の数の異なるプロパティ値をとる任意のプロパティについて同じことが言える。以下に、プロパティ値を階層表示の形で体系化する方法の個別の例について説明する。
通常のファイルの場合は、アイテムタイプがファイル拡張子によって定義される。現在のビューアプログラムで定義するユーザがわかりやすいファイルタイプ名を使用してもよい。ファイル拡張子が異なってもわかりやすい名前が同じになる場合は、一般にはすでに同じグループに統合されている(例えば、.hと.hxxはC/C++ヘッダーファイルと呼ばれる)。さらに、同様のタイプのすべてのファイルをグループ化することでもう1つの階層レベルを導入できる。プロトタイプ(prototype)では、文書ファイル、ピクチャファイル、ミュージックおよびビデオファイル、プログラミングファイル、さらにその他のファイルがメタグループと見なされ、処理される。また、人物メタグループをクラスオブジェクトとして処理してもよい。
例えば、アイテムタイプ=人物のリストを通信チャネルのタイプごとのより小さなセクションに分割し、これを使用して特定の個人に到達できる。これには、例えば、郵便、電話、インスタントメッセージング、または電子メールによって到達できる人物のグループが含まれる。これらのグループは、それぞれ必要に応じてさらに分割してもよい。例えば、企業環境では電子メールアドレスを社内(企業のアドレス帳から抽出)と社外(通常はユーザ個人の連絡先リストによる)に分割できる。一部の人物は複数の通信手段を備えていてもよい。その場合、このような人物は複数のクラスタに属していてもよい。プロパティのクラスタには、従来のフォルダとは異なり、各アイテムが唯一の場所に入るという制限はない。
フォルダは、ユーザが作成するアイテムのグループを表している。時間の経過に伴い、アイテムのプロパティベースのクラスタリングによってフォルダの必要性と意味は低減するが、フォルダは依然としてサポートされる。フォルダは一般に階層構造をとっており、フォルダのクラスタもこの階層と同様である。フォルダ階層の1つの欠点は、Program FilesやWindows(登録商標)ディレクトリのように、ユーザがほとんど関心のない多くのディレクトリが存在することである。既存のフォルダを使用してアイテムのクラスタを構成する場合の明らかな改良点は、いくつかの関心のあるアイテムを含むフォルダ階層の一部のみを表示することである。
図3は、(ボリュームC:)上のプログラムファイルを含むサンプルインターフェース300である。例えば、Windows(登録商標)エクスプローラでは、フォルダ構造全体が表示される。プロトタイプでは、「カテゴリ」によるファイルのクラスタリングには実際に選択されたアイテムのセットに関連するフォルダ(フォルダツリー全体のサブセット)のみが表示される。
図4は、フォルダごとのクラスタリングを表示するインターフェース400である。フォルダ階層のもう1つの態様では、物理ロケーション(location)の概念(このディスクかあのディスクか、あるいは外部共有か)を論理ロケーションの概念(フォルダ階層内の位置)に関連付けている。複数の物理ロケーションにまたがる論理グループを作成できるので、物理ロケーションをフォルダのプロパティから分離し、物理ロケーションにかかわらず、名前の同じ統合されたフォルダを提示してもよい。理解されるように、場所ごとのグループ分けも提供される。
図5は、2つのドライブ(ボリュームC:とボリュームD:)上に存在するフォルダ(VSS)のサンプルインターフェース500である。「カテゴリ」VSSに注目すると、510でインターフェース500は物理ロケーションのフォルダの内容を組み合わせている。この機能性は、2つまたはそれを上回るフォルダの名前が同じ場合は意図的にこうなるという仮定に基づいている。それ以外の場合は、図6に示すユーザインターフェース600で場所のプロパティ610によってファイルを容易に分離できる。
図7は、日付のプロパティごとのクラスタリングを表示するインターフェース700である。日付と時刻によるクラスタリングは、実際の年/月/日/時間/分(year/month/day/hour/minute)による階層構造をとる。しかし、現在を基準とした相対的な時間の概念も存在する。いずれの概念も重要であると考えられる。日付のクラスタには、今日、昨日などのアイテムを含む事前に定義した多くのクエリ(動的なグループ)が含まれる。
1つの興味深いアイテム分類は、アイテムを人物に関連付けることによる。このような関連付けの作成に利用できる多くのアイテムプロパティが存在する。例えば、電子メールメッセージまたは添付ファイルの送信者または受信者、文書の作成者、写真の撮影者などがある。人物によるアイテムのクラスタリングでは、人物階層を表示することで伝えられる社会的な意味によって、特殊な問題が発生する場合がある。例えば、人物は社内または社外の連絡先のような形式的な属性によってグループ化できるが、こうしたグループの一部は依然として大きすぎて効率的に処理できない場合がある。例えば、サンプル電子メールメッセージで参照する社内の連絡先リストには、約5,000の名前が含まれる。
リストはアルファベット順に並べたり、頭文字ごとにグループ化したりできるが(辞書と同様に)、一般に長いリストがあるとわかりにくい。1つの問題は、ユーザにとって重要な人物の名前がたまたま存在するほとんど知らない人物の名前に紛れてわかりにくくなることである。最も重要な連絡先は、ユーザが非常に頻繁に、あるいはごく最近、電子メールを送信した相手や、ユーザのディスク上にある文書の作成者または共同作成者などである。何らかの重みを考慮した分析を使用して、すべての人物をユーザにとって重要な順に並べたリストを作成してもよい。
ただし、計算した重要度の順に人物の名前を並べた長いリストを作成しても、適切なソリューションにはならない場合もある。計算した順序は偶然であり、ユーザの重要度の感覚を正しく反映していない場合もあるが、リストの中ほどや下位に位置する名前を見つけ出すのは非常に困難である。重要度の情報を使用してどの名前を先頭または上位に表示するかを選択し、一方で、名前をアルファベット順に並べて特定の名前を検索しやすくし、人物の相対的な重要度に関する考えられる提案があいまいになる。
図8は、関連の人物の一部折りたたんだ(semi−collapsed)リストを表示するサンプルインターフェース800である。このインターフェースでは、人物のリストの階層を展開して表示できる。展開しないと、ユーザにはフラットなアルファベット順のリストとして表示される。リストを初めて表示すると、最も重要な上位の少数(10〜20)の名前のみがアルファベット順に表示される。このことにより、1回のクリックだけで最適な人物に関する情報にアクセスできる。同時に、最上位の名前は辞書のブックマークの役割を果たしており、それぞれを展開すると第2レベル、第3レベルの名前を表示できる。
これは、階層の展開に似ているが、全ての展開された名前は第1レベルの名前と同等に最上位レベルに表示される。この場合、1個人が別の個人より上にあることの意味があいまいになるので、階層構造をとらないと否定的に感じられる可能性がある。リストの展開は、重要度リストの下位にある名前が表示されるまで続けることができる。ただし、展開はリストの選択領域で実行できるので、表示できる名前の総数は限定され、通常は10人のみである。指定した任意の時点で、表示できる名前はアルファベット順にソートされ、唯一のリストに表示される。これで、要求された名前を見つけ出しやすくなる。一部折りたたんだリストは、人物だけでなく様々な分類に利用できることに留意されたい。わかりやすい例としては、キーワード(カテゴリ)のリストや、辞書(百科事典)のエントリがある。
既存のエントリをカタログのインデックスとして使用するという考え方は一般的である。実際、これは印刷した辞書を編成するための標準的な方法である。ただし、標準的な辞書のアプローチでは、インデックスを各ページの先頭と末尾に印刷してページの内容を示している。これは、連続するインデックス間の「一定の間隔」として説明できる。インデックスとして選択されたことばは、何も特別ではなく、たまたまページの最初と最後に記載されているにすぎない。
本発明では、インデックスとして選択することばは「重要度」リストの上位に位置するものである。辞書で類推すると、これらは最も頻繁に参照することばである。さらに、これらの名前自体がエントリである。つまり、名前をクリックするとそれが選択される。したがって、1回のクリックで多くの一般的なエントリにアクセスでき、そのエントリが記載されるページまでスクロールする必要はない。一方、インデックス同士の間に、数が変動する第2レベルのエントリが存在してもよい。第2レベルのエントリの数が多い場合は、第3レベルのインデックスを作成してもよい。同様にさらに下位のインデックスも作成できる。
図9は、一部折りたたんだグループ900を示している。一方、図10のグループ1000はグループ900から選択して展開した状態で示されている。図10には、グループ1000の一部折りたたんだ状態1010も示されている。クラスタ(またはアイテムをグループ分けする他の方法)を視覚化する場合のもう1つの問題は、画面上にクラスタをどう表示するかである。グループを表示する一般的な方法は、グループ全体の表示(折りたたんだビュー(view))、またはグループに属するすべてのアイテムの集まり(展開したビュー)として表示することである。標準的なWindows(登録商標)の表示では、左側のフォルダのリスト、および右側のフォルダのリストは、現在見られるフォルダに対する拡大ビュー、および他のすべてのフォルダに対する展開ビューとすることができる。現在表示しているフォルダの展開されたビューとして右側にアイテムのリストが表示される。他のすべてのフォルダは折りたたんだビューで表示される。現在のフォルダのサブフォルダは、サブフォルダのサムネイルにいくつかの所属アイテムのコラージュ(collage)が含まれる場合でも、通常は折りたたんだビューで表示される。場合によっては、複数の展開されたグループを同時に表示したり、アイテムをスタックにグループ化して表示したりすることもできる。
グループ化や複数グループの同時の表示が可能なファイルビューアでは、グループを「折りたたみ可能」、つまりグループの内容を個別に表示したり非表示にしたりできるのが一般的である。それにもかかわらず、グループは依然として2つの状態が可能であり、展開された状態によってグループ内の個々のアイテムとの相互作用(interacting)が可能になる。大規模なグループの場合は、1つのグループを展開すると他のすべてのグループを表示できなくなるので、複数のグループビューは実用的ではない。
本発明では、グループの先頭に位置するいくつかのアイテムを表示する第3の状態が導入される。これは、900に示すグループの「圧縮された(squeezed)」状態または「一部折りたたんだ」状態と呼ばれる。1つのボタンを繰り返し押すことで、展開された状態1000、圧縮された状態1010、および折りたたんだ状態900を切り替えることができる。インターフェース900は、2つの一部折りたたんだグループを表示するファイルビューアであり、910で第3の小規模なグループが完全に展開された状態で表示されている。
圧縮された状態の1つの利点は、グループが占める画面の領域が展開した状態より小さいが、折りたたんだ状態より多くのグループの情報をユーザに提供することである。これで、より多くのグループを表示しながら、グループの内容に関する詳細な情報も提供できる。ユーザは、大規模なアイテムセット内でグループをより迅速に評価できるので、大規模なアイテムグループのより効率的な評価と操作が可能になる。
第2の利点は、折りたたんだ状態でも依然として表示されているいくつかのアイテムに1回のクリックでアクセスできることである。表示されているアイテムがユーザにとっての「重要度」(例えば、ごく最近アクセスした、またはこれまでに最も頻繁にアクセスした)によって選択されたと仮定すればと、ユーザは表示されているアイテムを探している可能性が高い。例えば、最近だれかに送信した写真を印刷するには、ユーザがピクチャグループまでスクロールすると、右側のリストの上位にファイルが表示されるはずである(最近アクセスしたファイルの1つとして)。これに現在のビューアと比較すると、写真のサムネイルがフォルダアイコンで表示される場合に、ユーザはさらにフォルダを展開してファイルにアクセスする必要がある。最後に、圧縮したビューは折りたたんだビューと展開したビューのほぼ中間であり、グループ全体の表示および操作と個々のアイテムへのアクセスを両立しようとしている。
一部折りたたんだビューによってグループ内の選択したアイテムに簡単にアクセスする方法が提供され(グループ内のすべてのアイテムを操作する必要がない)、ユーザは一部折りたたんだビューにどのアイテムをいくつ表示するかを制御できる。1つのアプローチとして、事前に指定した基準に基づいてアイテムをソートし、ソートしたリストの上位のアイテムを表示してもよい。ユーザは、ソート基準と表示エレメント数を変更できる。例えば、文書をソートする場合の便利で実用的な方法は、最終更新日を使用した方法である。一部折りたたんだビューには、最近更新された文書のリストの上位n個がデフォルトで表示され、次のn個を表示するボタンが表示される。あるいは、今日、昨日、先週、先月などのその他の文書を表示するボタンを備えていてもよい。一般に、こうしたすべてのケースで、アイテムを表示する順序は、表示するアイテムを限定するための順序と同じである。ただし、別のアプローチでは、ユーザにとって最も都合のよい順序でアイテムが表示され、アイテムを選択する基準と必ずしも同じでなくてもよい。例えば、人物は、「重要度」の順に選択された場合でも、一般にアルファベット順にソートするのが最適である。
圧縮されたグループに属するアイテムは、一部折りたたんだリストとして表示できる。一部折りたたんだリストは、選択的に展開してより多くのアイテムを表示できる。(あるいは、グループ全体を展開してすべてのアイテムを表示することもできる。)一部折りたたんだリストビューは、任意のタイプのアイテムに利用でき、ソート順が選択順と異なる場合にも利用できる(ソート順が選択順と同じ場合にも、一部展開したビューを利用できる。)例として、人気のある歌をアルファベット順にソートしたリストが挙げられる。ユーザはリストの一部を展開すればあまり知られていない歌を表示できるが、次に表示される歌は人気のあるものが選択される。
プロパティの階層を作成する場合は、一般に上位のクラスタにはネストされたすべてのクラスタの内容が属する。例えば、文書(Documents)クラスタにはWord文書、Excelワークシートなどがすべて含まれる。同様に、2003年のアイテムには各月のアイテムが含まれ、各月のアイテムには各日のアイテムが含まれる。任意のコンテナ(クラスタまたはフォルダ)は独立したアイテムと考えられるので、ビューを体系化する場合に、唯一のエンティティとしても、単にアイテムのグループとしても操作できる。
アイテムブラウザ(item browser)の最も重要な機能は、要求されたアイテム(1つ以上)を容易に見つけ出すことができることである。ただし、プロパティクラスタをたどる(traversing down)ことは方法の1つにすぎない。横方向の検索を可能にすることで、ブラウズ機能性は大幅に向上し、プロパティ階層をたどることなく該当するアイテムに到達する。さらに、ブラウザはユーザが定義する任意の方法でアイテムを体系化できる。アイテムを検索する場合に、ユーザはたびたびアイテム同士を関連付けて処理する。例えば、文書が最後に編集された正確な日付は不明であるが、重要な会議の直前であったことをユーザが覚えているとする。会議自体は容易に確認でき、この時点で最適なクエリは「日付の同じ文書をすべて表示(show all documents from the same date)」である。
図11を参照すると、本発明の様々な態様を実装する例示的な環境1110にはコンピュータ1112が含まれる。コンピュータ1112には、プロセッシングユニット1114、システムメモリ1116、システムバス1118が含まれる。システムバス1118は、システムメモリ1116からプロセッシングユニット1114までを含みこれに限定されないシステムコンポーネントを接続する。プロセッシングユニット1114は、市販の様々なプロセッサのいずれでもよい。デュアルマイクロプロセッサやその他のマルチプロセッサアーキテクチャもプロセッシングユニット1114として利用できる。
システムバス1118は、16ビットバス、業界標準アーキテクチャ(ISA:Industrial Standard Architecture)、マイクロチャネルアーキテクチャ(MSA:Micro−Channel Architecture)、拡張業界標準アーキテクチャ(EISA:Xtended ISA)、インテリジェントドライブエレクトロニクス(IDE:Intelligent Drive Electronics)、VESAローカルバス(VLB:VESA Local Bus)、PCI(Peripheral Component Interconnect)、ユニバーサルシリアルバス(USB:Universal Serial Bus)、アドバンストグラフィクスポート(AGP:Advanced Graphics Port)、PCMCIA(Personal Computer Memory Card International Association)バス、小型コンピュータ用周辺機器インターフェース(SCSI:Small Computer Systems Interface)などを含みこれに限定されない市販の様々なバスアーキテクチャを使用する、メモリバス、メモリコントローラ、周辺バス、外部バス、またはローカルバスを含む複数のバス構造タイプのいずれでもよい。
システムメモリ1116には、揮発性メモリ1120と不揮発性メモリ1122が含まれる。コンピュータ1112内のエレメント間で情報を転送する起動時などの基本ルーチンを含む基本入出力システム(BIOS:basic input/output system)は、不揮発性メモリ1122に格納される。例として、不揮発性メモリ1122には、読み出し専用メモリ(ROM:read only memory)、プログラマブルROM(PROM:programmable ROM)、電気的プログラマブルROM(EPROM:electrically programmable ROM)、電気的消去可能ROM(EEPROM:electrically erasable ROM)、またはフラッシュメモリが含まれるが、これらに限定はされない。揮発性メモリ1120には、外部キャッシュメモリとして動作するランダムアクセスメモリ(RAM:random access memory)が含まれる。例として、RAMは、シンクロナスRAM(SRAM:)、ダイナミックRAM(DRAM:dynamic RAM)、シンクロナスDRAM(SDRAM:synchronous DRAM)、ダブルデータレートSDRAM(DDR SDRAM:double data rate SDRAM)、拡張SDRAM(ESDRAM:enhanced SDRAM)、シンクリンクDRAM(SLDRAM:Synchlink DRAM)、ダイレクトラムバスRAM(DRRAM:direct Rambus RAM)などの様々な形式を利用できるが、これらに限定はされない。
コンピュータ1112には、取り外し可能/不可能、揮発性/不揮発性のコンピュータ記憶媒体も含まれる。図11には、例としてディスクストレージ1124が示されている。ディスクストレージ1124には、磁気ディスクドライブ、フロッピー(登録商標)ディスクドライブ、テープドライブ、ジャズ(Jaz)ドライブ、ジップ(Zip)ドライブ、LS−100ドライブ、フラッシュメモリカード、メモリースティックなどのデバイスが含まれるが、これらに限定はされない。また、ディスクストレージ1124には、CD−ROM(compact disk ROM)装置、CD−R(CD recordable )ドライブ、CD−RW(CD rewritable)ドライブ、DVD ROM(digital versatile disk ROM)装置などの光ディスクドライブを含むがこれらに限定はされない記憶媒体の個別の配置も複数の記憶媒体の組合せも含まれる。ディスクストレージデバイス1124からシステムバス1118への接続を容易にするために、通常はインターフェース1126のような取り外し可能または取り外し不可能なインターフェースを使用する。
図11がユーザと適切な動作環境1110で記述される基本コンピュータリソースとの仲介として動作するソフトウェアを示すことを理解されたい。こうしたソフトウェアには、オペレーティングシステム1128が含まれる。オペレーティングシステム1128は、ディスクストレージ1124に格納でき、コンピュータシステム1112のリソースの制御および割り当てを行う。システムアプリケーション1130は、システムメモリ1116またはディスクストレージ1124に格納されたプログラムモジュール1132とプログラムデータ1134を使用して、オペレーティングシステム1128によるリソースの管理を利用する。本発明が様々なオペレーティングシステムまたは複数のオペレーティングシステムの組合せで実装できることを理解されたい。
ユーザは、入力装置(1つまたは複数)1136を使用してコンピュータ1112にコマンドまたは情報を入力する。入力装置1136には、マウス、トラックボール、スタイラス、タッチパッドなどのポインティングデバイス、キーボード、マイクロフォン、ジョイスティック、ゲームパッド、衛星放送用パラボラアンテナ、スキャナ、テレビチューナーパッド、デジタルカメラ、デジタルビデオカメラ、ウェブカメラなどが含まれるが、これらに限定されない。これらの入力装置およびその他の入力装置は、1つまたは複数のインターフェースポート1138を経由してプロセッシングユニット1114からシステムバス1118に接続する。インターフェースポート1138には、例えばシリアルポート、パラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)が含まれる。出力装置(1つまたは複数)1140は、入力装置(1つまたは複数)1136と同じタイプのポートのいくつかを使用する。このように、例えばUSBポートはコンピュータ1112に入力を提供するため、およびコンピュータ1112からの出力情報を出力装置1140に提供するために使用できる。出力アダプタ1142は、出力装置1140の中でもモニタ、スピーカー、プリンタのように専用アダプタを必要とするものがあることを説明するために図示している。出力アダプタ1142には、例として出力装置1140とシステムバス1118の接続手段を提供するビデオカードやサウンドカードが含まれるが、これらに限定はされない。他のデバイスおよび/またはデバイスのシステムは、リモートコンピュータ(1台または複数台)1144のように入出力両方の機能を提供することに留意されたい。
コンピュータ1112は、リモートコンピュータ1144のようなリモートコンピュータ(1台または複数台)への論理接続を使用してネットワーク環境で動作できる。リモートコンピュータ1144は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ワークステーション、マイクロプロセッサベースの機器、ピアデバイス、または他の一般的なネットワークノードなどでもよく、通常はコンピュータ1112に関連して説明したエレメントの多くのまたはすべてが含まれる。簡潔にするために、リモートコンピュータ1144に伴ってメモリ記憶装置1146だけが図示されている。リモートコンピュータ1144は、ネットワークインターフェース1148を介してコンピュータ1112に論理的に接続され、さらに通信接続1150を介して物理的に接続されている。ネットワークインターフェース1148には、ローカルエリアネットワーク(LAN:local area network)、ワイドエリアネットワーク(WAN:wide area network)といった通信ネットワークが含まれる。LANの技術には、光ファイバー分散データインターフェース(FDDI:Fiber Distributed Data Interface)、より対線FDDI(CDDI:Copper Distributed Data Interface)、イーサネット(登録商標)/IEEE 1102.3、トークンリングIEEE 1102.5などが含まれる。WANの技術には、ポイントツーポイントリンク、統合サービスデジタル通信網(ISDN:Integrated Services Digital Networks)やその変形のような回路切り替えネットワーク、パケット切り替えネットワーク、デジタルサブスクライバーライン(DSL:Digital Subscriber Lines)が含まれるが、これらに限定はされない。
通信接続(1つまたは複数)1150は、ネットワークインターフェース1148をバス1118に接続するためのハードウェアまたはソフトウェアを意味する。通信接続1150は、コンピュータ1112の内部を明確に示すために図示しているが、コンピュータ1112の外部にあってもよい。ネットワークインターフェース1148の接続に必要なハードウェア/ソフトウェアには、例示の目的に限定して、通常電話回線モデム、ケーブルモデム、DSLモデム、ISDNアダプタ、イーサネット(登録商標)カードなどの内蔵および外付けのテクノロジーが含まれる。
図12は、本発明が対話できるサンプルコンピューティング環境1200の概略を示すブロック図である。システム1200には、クライアント(1つまたは複数)1210が含まれる。クライアント1210は、ハードウェアおよび/またはソフトウェア(例えばスレッド、プロセス、コンピューティングデバイス)である。システム1200には、サーバ(1つまたは複数)1230も含まれる。サーバ1230は、ハードウェアおよび/またはソフトウェア(例えばスレッド、プロセス、コンピューティングデバイス)である。サーバ1230には、例えば本発明を使用した変形を実行するスレッドを格納できる。クライアント1210とサーバ1230の間で可能な1つの通信の例は、2つ以上のコンピュータプロセス間で送信できるデータパケットの形でもよい。システム1200は、クライアント1210とサーバ1230の間の通信を容易にする通信フレームワーク1250を備えている。クライアント1210は、クライアント1210のローカルな情報を格納するための1つまたは複数のクライアントデータストレージ1260に操作可能に接続される。同様に、サーバ1230はサーバ1230のローカルな情報を格納するための1つまたは複数のサーバデータストレージ1240に操作可能に接続される。
以上の説明には、本発明の例が含まれる。本発明について説明するためにコンポーネントまたは方法のあらゆる組合せについて説明するのはもちろん不可能であるが、他にも本発明の多くの組合せや置き換えが可能であることは当業者には言うまでもない。したがって、本発明には添付の特許請求の精神と範囲を逸脱しない代替、変更、変形のすべてが含まれるものとする。さらに、発明の実施の形態と特許請求の範囲のいずれかで使用する「含む」という用語およびその変形の範囲は、「備える、含む」が特許請求の範囲で遷移語(transitional word)として使用された場合に解釈される用語「備える、含む」と同様に包括的な意味を表す。
本発明の一態様に従ったクラスタリングシステムの概略を示すブロック図である。 本発明の一態様に従った自動クエリクラスタリングプロセスを示す流れ図である。 本発明の一態様に従った自動クエリクラスタリングのためのユーザインターフェースの例を示す図である。 本発明の一態様に従った自動クエリクラスタリングのためのユーザインターフェースの例を示す図である。 本発明の一態様に従った自動クエリクラスタリングのためのユーザインターフェースの例を示す図である。 本発明の一態様に従った自動クエリクラスタリングのためのユーザインターフェースの例を示す図である。 本発明の一態様に従った自動クエリクラスタリングのためのユーザインターフェースの例を示す図である。 本発明の一態様に従った自動クエリクラスタリングのためのユーザインターフェースの例を示す図である。 本発明の一態様に従った自動クエリクラスタリングのためのユーザインターフェースの例を示す図である。 本発明の一態様に従った自動クエリクラスタリングのためのユーザインターフェースの例を示す図である。 本発明の一態様に従った適切な動作環境の概略を示すブロック図である。 本発明と対話できるサンプルコンピューティング環境の概略を示すブロック図である。
符号の説明
110 データストレージ
120 アイテムおよび様々なアイテムのアイテムプロパティ
130 アグリゲータ
140 プロパティアナライザ
150 クラスタオーガナイザ

Claims (7)

  1. 検索を最適化し情報を表示するために、コンピュータに複数の機能を実現させるためのコンピュータインターフェースプログラムであって、該機能は、プロパティアナライザとオーガナイザとを含み、
    コンピュータ上で、該プロパティアアナライザは、アイテムの分布を決定し、複数のプロパティのうちの第1のプロパティに部分的に基づいて複数のクラスタを形成し、前記複数のプロパティの他のプロパティの各々に対してクラスタ化スコアを自動的に計算し、最高のクラスタ化スコアに基づいて他のプロパティの少なくとも一つを選択し、前記クラスタ化スコアは、他の各クラスタにおける1クラスタ当りのアイテム数を乗算することにより得られる各クラスタのアイテム数の積に等しいか、アイテムの総数の階乗を、他の各クラスタにおける1クラスタ当りのアイテム数の階乗を乗算することにより得られる各クラスタのアイテム数の階乗の積により除した値に等しいものであり
    コンピュータ上で、該オーガナイザは、前記他のプロパティの一つに部分的に基づいて、複数の最適化されたクラスタを自動的に形成し、かつ、複数の最適化されたクラスタの複数のアイテムを分配し、前記複数の最適化されたクラスタを提供する、
    インターフェースプログラム
  2. 請求項に記載のインターフェースプログラムであって、前記複数のアイテムは、ローカルストレージロケーション又はリモートストレージロケーションの少なくとも一方、又は両者の組み合わせに格納される、インターフェースプログラム
  3. 請求項に記載のインターフェースプログラムであって、前記複数のアイテムは、文書、ファイル、フォルダ、イメージ、オーディオファイル、ビデオファイル、コード、メッセージ、又は、人物又は場所を含む外部オブジェクトのコンピュータ表現、のうちの少なくとも2つのもの、又はそれらの組み合わせを含む、インターフェースプログラム
  4. 請求項に記載のインターフェースプログラムであって、前記複数のプロパティは、アイテムタイプ、前記アイテムが作成された日付または時刻、前記アイテムに関連付けられた人物、前記アイテムの場所、前記アイテムのカテゴリ、又は、システム、アプリケーション、管理者、又はユーザが定義したアイテムのプロパティ、又は、それらの組み合わせを含む、インターフェースプログラム
  5. 請求項1に記載のインターフェースプログラムであって、前記複数のプロパティは、メタデータを含む、インターフェースプログラム
  6. 請求項に記載のインターフェースプログラムであって、前記複数の最適化されたクラスタ又は前記複数のアイテムの少なくとも1つ、又は、それらの組み合わせが、重要性基準に基づいて、一部折りたたんだフォームで提供される、インターフェースプログラム
  7. 検索を最適化し情報を表示するためのコンピュータインターフェースシステムであって、該システムは、プロパティアナライザとオーガナイザとを含み、
    該プロパティアアナライザは、アイテムの分布を決定し、複数のプロパティのうちの第1のプロパティに部分的に基づいて複数のクラスタを形成し、前記複数のプロパティの他のプロパティの各々に対してクラスタ化スコアを自動的に計算し、最高のクラスタ化スコアに基づいて他のプロパティの少なくとも一つを選択し、前記クラスタ化スコアは、他の各クラスタにおける1クラスタ当りのアイテム数を乗算することにより得られる各クラスタのアイテム数の積に等しいか、アイテムの総数の階乗を、他の各クラスタにおける1クラスタ当りのアイテム数の階乗を乗算することにより得られる各クラスタのアイテム数の階乗の積により除した値に等しいものであり、
    該オーガナイザは、前記他のプロパティの一つに部分的に基づいて、複数の最適化されたクラスタを自動的に形成し、かつ、複数の最適化されたクラスタの複数のアイテムを分配し、前記複数の最適化されたクラスタを提供する、
    インターフェースシステム。
JP2005018656A 2004-01-26 2005-01-26 自動クエリクラスタリング Active JP4101239B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/764,738 US7257571B2 (en) 2004-01-26 2004-01-26 Automatic query clustering

Publications (3)

Publication Number Publication Date
JP2005235196A JP2005235196A (ja) 2005-09-02
JP2005235196A5 JP2005235196A5 (ja) 2008-02-14
JP4101239B2 true JP4101239B2 (ja) 2008-06-18

Family

ID=34634626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005018656A Active JP4101239B2 (ja) 2004-01-26 2005-01-26 自動クエリクラスタリング

Country Status (14)

Country Link
US (2) US7257571B2 (ja)
EP (1) EP1557774A3 (ja)
JP (1) JP4101239B2 (ja)
KR (1) KR101029403B1 (ja)
CN (1) CN1648903A (ja)
AU (1) AU2005200286A1 (ja)
BR (1) BRPI0500784A (ja)
CA (1) CA2494410A1 (ja)
HK (1) HK1080164A1 (ja)
MX (1) MXPA05001072A (ja)
MY (1) MY145961A (ja)
RU (1) RU2368948C2 (ja)
TW (1) TW200529063A (ja)
ZA (1) ZA200500736B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101208667B (zh) * 2005-06-22 2012-01-11 日本电气株式会社 调试系统及方法

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8448069B2 (en) * 2004-04-23 2013-05-21 International Business Machines Corporation Object set property viewer
US8090698B2 (en) 2004-05-07 2012-01-03 Ebay Inc. Method and system to facilitate a search of an information resource
JP4533007B2 (ja) * 2004-06-09 2010-08-25 キヤノン株式会社 画像管理装置、画像管理方法、及びプログラム
US9552141B2 (en) 2004-06-21 2017-01-24 Apple Inc. Methods and apparatuses for operating a data processing system
US7693860B2 (en) * 2005-03-18 2010-04-06 Microsoft Corporation Method and system to associate cell and item metadata
US7739314B2 (en) * 2005-08-15 2010-06-15 Google Inc. Scalable user clustering based on set similarity
US8234293B2 (en) * 2005-09-08 2012-07-31 Microsoft Corporation Autocompleting with queries to a database
KR100713534B1 (ko) * 2005-09-08 2007-04-30 삼성전자주식회사 이동 통신 단말의 사용자 데이터 검색 방법
US7792847B2 (en) * 2005-09-09 2010-09-07 Microsoft Corporation Converting structured reports to formulas
US8843481B1 (en) * 2005-09-30 2014-09-23 Yongyong Xu System and method of forming action based virtual communities and related search mechanisms
US7805433B2 (en) * 2005-10-14 2010-09-28 Microsoft Corporation Multidimensional cube functions
US20070168323A1 (en) * 2006-01-03 2007-07-19 Microsoft Corporation Query aggregation
US20090055390A1 (en) * 2006-02-01 2009-02-26 Matsushita Electric Industrial Co., Ltd. Information sorting device and information retrieval device
KR100725411B1 (ko) * 2006-02-06 2007-06-07 삼성전자주식회사 컨텐츠 검색을 위한 사용자 인터페이스, 사용자 인터페이스제공 방법, 및 컨텐츠 검색 장치
US20070239682A1 (en) * 2006-04-06 2007-10-11 Arellanes Paul T System and method for browser context based search disambiguation using a viewed content history
US8214360B2 (en) * 2006-04-06 2012-07-03 International Business Machines Corporation Browser context based search disambiguation using existing category taxonomy
KR100806115B1 (ko) 2006-05-02 2008-02-21 인하대학교 산학협력단 다중레벨 dbms에서 질의 분류 컴포넌트의 설계 방법
US20070260600A1 (en) * 2006-05-08 2007-11-08 Mita Group Information discovery and group association
CN101122910A (zh) * 2006-08-07 2008-02-13 鸿富锦精密工业(深圳)有限公司 存储装置及打开其所存储文件的方法
WO2008034213A1 (en) * 2006-09-18 2008-03-27 Infobright Inc. A method and system for data compression in a relational database
US8266147B2 (en) * 2006-09-18 2012-09-11 Infobright, Inc. Methods and systems for database organization
US9817436B2 (en) * 2007-01-07 2017-11-14 Apple Inc. Portable multifunction device, method, and graphical user interface for displaying user interface objects adaptively
JP4412342B2 (ja) * 2007-03-30 2010-02-10 ソニー株式会社 コンテンツ管理装置、画像表示装置、撮像装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラム
US20090228826A1 (en) * 2008-03-04 2009-09-10 Microsoft Corporation Group filtering of items in a view
US7860866B2 (en) * 2008-03-26 2010-12-28 Microsoft Corporation Heuristic event clustering of media using metadata
WO2010060179A1 (en) * 2008-11-28 2010-06-03 Infobright Inc. Methods for organizing a relational database by using clustering operations
US20100299603A1 (en) * 2009-05-22 2010-11-25 Bernard Farkas User-Customized Subject-Categorized Website Entertainment Database
US20110116416A1 (en) * 2009-11-18 2011-05-19 Dobson Eric L System and method for geographically optimized wireless mesh networks
US8839128B2 (en) * 2009-11-25 2014-09-16 Cooliris, Inc. Gallery application for content viewing
AU2010347724B2 (en) 2010-03-12 2016-06-23 Exxonmobil Upstream Research Company Dynamic grouping of domain objects via smart groups
US8521748B2 (en) 2010-06-14 2013-08-27 Infobright Inc. System and method for managing metadata in a relational database
US8417727B2 (en) 2010-06-14 2013-04-09 Infobright Inc. System and method for storing data in a relational database
US9608941B2 (en) * 2011-02-07 2017-03-28 Google Inc. Methods and systems for clustering emails using email addresses
CN102253967B (zh) * 2011-06-03 2013-03-27 用友软件股份有限公司 数据查找系统和数据查找方法
US10078819B2 (en) * 2011-06-21 2018-09-18 Oath Inc. Presenting favorite contacts information to a user of a computing device
CN103049444B (zh) * 2011-10-12 2016-09-28 阿里巴巴集团控股有限公司 一种数据信息分类结构的存储方法和系统
US9218118B2 (en) 2012-09-11 2015-12-22 Apple Inc. Media player playlist management
US9558278B2 (en) 2012-09-11 2017-01-31 Apple Inc. Integrated content recommendation
US10140372B2 (en) * 2012-09-12 2018-11-27 Gracenote, Inc. User profile based on clustering tiered descriptors
US9047368B1 (en) * 2013-02-19 2015-06-02 Symantec Corporation Self-organizing user-centric document vault
US9792289B2 (en) * 2014-11-07 2017-10-17 Semandex Networks Inc. Systems and methods for file clustering, multi-drive forensic analysis and data protection
RU2611960C2 (ru) * 2015-03-31 2017-03-01 Общество С Ограниченной Ответственностью "Яндекс" Способ организации в кластеры точек интереса и сервер для его осуществления
CN108460049B (zh) * 2017-02-21 2021-10-19 阿里巴巴集团控股有限公司 一种确定信息类别的方法和系统
RU2666331C1 (ru) * 2017-04-04 2018-09-06 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания оффлайн страницы результатов поиска
US20190228378A1 (en) * 2018-01-24 2019-07-25 Microsoft Technology Licensing, Llc Intelligent targeting of files needing attention
US11074408B2 (en) 2019-06-01 2021-07-27 Apple Inc. Mail application features

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6122405A (en) * 1993-08-27 2000-09-19 Martin Marietta Corporation Adaptive filter selection for optimal feature extraction
US5801699A (en) * 1996-01-26 1998-09-01 International Business Machines Corporation Icon aggregation on a graphical user interface
US5899992A (en) * 1997-02-14 1999-05-04 International Business Machines Corporation Scalable set oriented classifier
US6415282B1 (en) * 1998-04-22 2002-07-02 Nec Usa, Inc. Method and apparatus for query refinement
US6742003B2 (en) * 2001-04-30 2004-05-25 Microsoft Corporation Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications
US6732149B1 (en) * 1999-04-09 2004-05-04 International Business Machines Corporation System and method for hindering undesired transmission or receipt of electronic messages
US6564197B2 (en) * 1999-05-03 2003-05-13 E.Piphany, Inc. Method and apparatus for scalable probabilistic clustering using decision trees
US6539374B2 (en) * 1999-06-03 2003-03-25 Microsoft Corporation Methods, apparatus and data structures for providing a uniform representation of various types of information
US6606613B1 (en) * 1999-06-03 2003-08-12 Microsoft Corporation Methods and apparatus for using task models to help computer users complete tasks
RU2177174C1 (ru) * 2000-05-12 2001-12-20 Серебренников Олег Александрович Способ поиска в базах данных с разметкой данных
US6578032B1 (en) * 2000-06-28 2003-06-10 Microsoft Corporation Method and system for performing phrase/word clustering and cluster merging
US7519605B2 (en) * 2001-05-09 2009-04-14 Agilent Technologies, Inc. Systems, methods and computer readable media for performing a domain-specific metasearch, and visualizing search results therefrom
US6920448B2 (en) * 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US6910026B2 (en) * 2001-08-27 2005-06-21 Verity, Inc. Method and apparatus for determining classifier features with minimal supervision
US6944612B2 (en) * 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101208667B (zh) * 2005-06-22 2012-01-11 日本电气株式会社 调试系统及方法

Also Published As

Publication number Publication date
KR101029403B1 (ko) 2011-04-14
US20050165825A1 (en) 2005-07-28
RU2368948C2 (ru) 2009-09-27
CA2494410A1 (en) 2005-07-26
KR20050077036A (ko) 2005-07-29
MXPA05001072A (es) 2005-10-05
US7257571B2 (en) 2007-08-14
TW200529063A (en) 2005-09-01
ZA200500736B (en) 2006-10-25
CN1648903A (zh) 2005-08-03
JP2005235196A (ja) 2005-09-02
EP1557774A3 (en) 2007-07-04
MY145961A (en) 2012-05-31
BRPI0500784A (pt) 2005-08-30
US20080021896A1 (en) 2008-01-24
AU2005200286A1 (en) 2005-08-11
RU2005101735A (ru) 2006-07-10
HK1080164A1 (zh) 2006-04-21
EP1557774A2 (en) 2005-07-27

Similar Documents

Publication Publication Date Title
JP4101239B2 (ja) 自動クエリクラスタリング
US11409777B2 (en) Entity-centric knowledge discovery
US9483169B2 (en) Computer system for automatic organization, indexing and viewing of information from multiple sources
JP5313337B2 (ja) モバイル・コンピューティング装置に対する検索結果の提供
KR100984400B1 (ko) 공통 요소에 기초하여 아이템들을 필터링하고 편성하기위한 시스템 및 방법
US7587411B2 (en) System and method for filtering and organizing items based on common elements
US7509321B2 (en) Selection bins for browsing, annotating, sorting, clustering, and filtering media objects
KR20080076958A (ko) 이메일과 관련된 항목들을 브라우징하는 시스템 및 방법,및 브라우징 시스템
JP2005242996A (ja) 可視結果集合を制御するためのシステムおよび方法
US20080313158A1 (en) Database file management system, integration module and browsing interface of database file management system, database file management method
TWI290687B (en) System and method for search information based on classifications of synonymous words
Al Nasar et al. Personal information management systems and interfaces: An overview
KR100831055B1 (ko) 온톨로지 기반의 정보 검색 방법
Golub Subject access in online information services for humanities: the case of LGBTQI fiction: Invited speech
Schäppi Personal information management tools
Huynh et al. Haystack’s User Experience for Interacting with Semistructured Information

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071218

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071218

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20071218

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071226

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20080124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080318

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250