JP2009543203A

JP2009543203A - 視覚的な多次元の検索

Info

Publication number: JP2009543203A
Application number: JP2009518262A
Authority: JP
Inventors: ローラースティーブン; ジェイ．ホルビッツエリック; ティー．グッドマンジョシュア; グプタアヌープ; エー．ミーククリストファー; ディー．ブリルエリック; ダブリュ．フレイクゲイリー; ナームラメズ; チャウドゥーリースラジット; ハースト−ヒラーオリバー
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 2006-06-28
Filing date: 2007-06-26
Publication date: 2009-12-03
Also published as: US20080005091A1; EP2038775A4; EP2038775A1; US7739221B2; CN101479728A; KR20090023613A; KR101377389B1; WO2008002638A1; JP2013225319A

Abstract

多次元入力を解析し、その後にこの入力から抽出した特徴に基づいて検索クエリを構築することができるシステム。特定の例では、検索メカニズムへの入力として画像を使用することができる。この画像にパターン認識および画像解析を適用し、その後にこの画像入力から抽出された特徴に対応する検索クエリを構築することができる。またこのシステムは、多次元の検索可能項目をインデックス付けし、それによって検索クエリの結果としてそれらの項目を取り出せるようにすることを容易にすることができる。さらに詳細には、このシステムは、テキスト解析、パターンおよび／または言語認識メカニズムを使用して、検索可能項目から特徴を抽出することができる。これらの抽出された特徴を使用して、検索可能項目をインデックス付けすることができる。

Description

本発明は、視覚的な多次元の検索に関する。

コンピュータに基づく従来の検索は一般に、検索エンジンが結果を返すために通常は英数字の検索クエリを解析するという点で、極めてテキスト中心的である。視覚化が検索に取り入れられる範囲では、その視覚化は、たとえばメタデータを使用することによって行われることが多く、たとえば項目には、視覚的な項目の物理属性に対応するメタデータが手作業であらかじめタグ付けされている。言い換えれば、伝統的な検索エンジンは、検索クエリへの応答に画像データを返すために、あらかじめインデックス付けされたメタデータを使用する。

検索エンジンエージェントは、スパイダまたはクローラと呼ばれることが多く、系統立った方法でウェブサイトをナビゲートし、訪問サイトに関する情報を検索する。たとえばクローラは、ウェブサイトおよび関連情報の全部または一部のコピーを作成することができる。次に検索エンジンが、１つまたは複数のクローラによって取り込まれたコンテンツを分析し、ページのインデックス付け方法を決定する。ウェブサイト上のすべての語をインデックス付けするエンジンもあれば、たとえばタイトル、ヘッダ、メタタグなど特定のタグと関連する用語をインデックス付けするエンジンもある。またクローラは、定期的にウェブページを再訪して、最後のインデックス付け操作からの変更を検出し、取り込まなければならない。

インデックスが生成されると、通常インデックスは、一定のキーワードに関してランキングを割り当てられ、データベースに格納される。たとえば、特にウェブページ上の単語の頻度および位置に基づく適合性についてインデックスを評価するために、独自のアルゴリズムを用いることが多い。このそれぞれに使用されるランキングアルゴリズムが、従来の検索エンジンの中で特徴的な要素である。

検索クエリとして１つまたは複数のキーワードを入力すると、検索エンジンは、このクエリと一致するインデックス付けされた情報をデータベースから検索し、一致するサイトのそれぞれと関連するテキストの抜粋を生成し、その結果をユーザに表示する。その後ユーザは、サイトがユーザの興味と関連しているかどうかを判断するにあたって、複数の返されたサイトをくまなくスクロールすることができる。しかしながら、検索エンジンはかなりの数のサイトを返すことが多いため、これは非常に時間がかかり、もどかしい手順となりうる。多くの場合ユーザは、求められている情報を提供するウェブサイトに集中するために、キーワードおよびブール演算子を変更および／または追加することによって、検索をさらに狭めるよう繰り返して強いられる。迅速で、効率がよく、かつシームレスな検索への増え続ける要望に対処するために、改善された検索パラダイムが必要とされている。

本明細書に開示して特許請求する技術革新は、その一態様では、多次元入力を解析し、多次元入力から抽出された特徴に基づいて検索クエリを構築することができるシステムを含む。たとえば、検索メカニズムへの入力として画像データを使用することができる。したがって、パターン認識および画像解析を使用して、画像入力から抽出された特徴に対応する検索クエリを構築することができる。

別の態様ではこのシステムは、多次元の検索可能項目をインデックス付けし、それによってこれらの項目が検索クエリへの結果として検索可能にすることを容易にすることができる。さらに詳細にはこのシステムは、テキスト解析、パターンおよび／または言語認識メカニズムを使用して、検索可能項目から特徴を抽出することができる。これらの抽出された特徴を使用して、検索可能項目をインデックス付けすることができる。

本発明は、人間が視覚に基づく手がかりに関連して知的検索を行う方法と同様の方法で検索を行う動的な視覚的検索に基づくシステムを提供する。たとえば、一実施形態によれば、「青い」という用語が検索クエリに使用される場合、このシステムは、項目が「青い」というメタデータをあらかじめタグ付けされているかどうかにかかわらず、「青い」という物理的特性を持つ項目を検索することができる。

さらに他の態様では、本発明による検索は、さまざまな次元で実行されることが可能である。検索クエリの一部は、特定のコンテキスト（たとえば時間、場所、状態）内の個人の写真を含むことができる。このように、たとえばテキストのクエリを手作業で打ち込むのではなく、入力として画像を使用することができる。画像抽出コンポーネントは、入力された画像から関連情報（たとえば対象の特性、時間、場所、状態）を抽出し、検索クエリ（たとえばテキストおよび／または画像に基づく）を作成し、パターン認識コンポーネントを使用して、入力画像の対象／コンテキストと関連するすべての結果（たとえばウェブサイト）を探し出すことを容易にすることができる。

上記およびその関連の目的を達成するために、次の詳細な説明および添付の図面と併せて本発明のいくつかの例示的な態様について説明する。しかしながら、これらの態様は、本発明の原理を用いることができるさまざまな方法のほんの数例を示すものであり、本発明は、このようなすべての態様およびその均等物を含むものとする。図面と併せて考えられると本発明の次の詳細な説明から、本発明の他の利点および特徴が明らかになるであろう。

次に、全体を通して同じ要素を指すために同じ参照符号を使用する図面を参照して本発明について詳細に説明する。次の記載では、本発明を十分に理解できるように、説明の目的で数多くの特定の詳細を示す。しかしながら、本発明はこのような特定の詳細がなくとも実行可能であることは明らかであろう。他の場合では、本発明の説明を容易にするために、周知の構造および装置をブロック図の形で示す。

本出願で使用する、「コンポーネント」および「システム」という用語は、コンピュータ関連のエンティティ、すなわちハードウェア、ハードウェアとソフトウェアの組合せ、ソフトウェア、または実行中のソフトウェアを指すものとする。たとえば、コンポーネントは、１つのプロセッサで実行中のプロセス、プロセッサ、オブジェクト、実行ファイル、実行のスレッド、プログラム、および／またはコンピュータである可能性があるが、これらに限定されない。実例としては、サーバで実行中のアプリケーションも、そのサーバも、コンポーネントである可能性がある。１つまたは複数のコンポーネントは、プロセスおよび／または実行のスレッドの中にある可能性があり、またコンポーネントは、１つのコンピュータに局在化される、および／または２つ以上のコンピュータ間で分散される可能性がある。

本明細書で使用する、「推論する」または「推論」という用語は、一般に、事象および／またはデータによって取り込まれる一連の観察から、システム、環境、および／またはユーザの状態を推測するまたは推論するプロセスを指す。推論は、特定のコンテキストまたは動作を識別するために用いられることが可能であり、あるいは推論により、たとえば状態に関する確率分布を生成することができる。推論は、確率的とする、すなわちデータおよび事象の検討に基づいた興味のある状態に関する確率分布の計算とすることができる。また推論は、一連の事象および／またはデータから上位レベルの事象を構成するために使用される技術を指すこともできる。このような推論は、事象が時間的に近接した相関関係にあるかどうか、また事象およびデータが１つまたはいくつかの事象およびデータのソースから発生しているかどうかにかかわらず、一連の観察された事象および／または格納された事象データから新しい事象または動作を構成する結果となる。

情報をユーザに表示するいくつかの方法について、スクリーンショットとしていくつかの図に関して示し、説明しているが、他のさまざまな代替物を使用することができるということを当業者は理解するであろう。「画面」、「ウェブページ」、および「ページ」という用語は、本明細書では一般に同義で使用される。ページすなわち画面は、表示記述として、グラフィカルユーザインターフェースとして、または画面上に情報を表す他の方法（たとえばパーソナルコンピュータ、ＰＤＡ、携帯電話、または他の好適な装置のいずれか）によって格納および／または転送され、ページに表示されるレイアウトおよび情報もしくは内容は、メモリ、データベース、または別の保存場所に格納される。

まず図面を参照すると、図１は、少なくとも２つの全体的な態様を有する多次元検索システム１００を示している。第一に、このシステム１００は、多次元を有する入力（たとえばテキスト、音声、映像、マルチメディア）から、特徴およびデータを抽出することができる。抽出されるとこの特徴を使用して、検索クエリを生成する（または変更する）ことができる。次に、検索クエリを使用して、入力に関する検索結果を返すことができる。システム１００の別の態様は、検索可能なデータ項目の特徴に基づいて検索結果を探す能力である。言い換えれば、システム１００は、特徴を抽出するために検索可能データ項目（ウェブページ、画像ファイル、音声ファイル、マルチメディアファイル）を解析しやすくすることができる。特徴があるデータ項目から抽出されると、システム１００は、この項目を返しておよび／またはインデックス付けして、検索に利用可能にすることを容易にすることができる。これらのシナリオのそれぞれについて、以下により詳細に説明する。

一般に、多次元検索システム１００は、入力解析器コンポーネント１０２と、検索エンジンコンポーネント１０４とを含むことができる。図のように、入力（たとえばテキスト、音声、画像）は、入力解析器コンポーネント１０２に伝送され、ここでこの入力から特徴（たとえば属性、特性）を抽出することができる。以下に説明するように、１つの態様ではパターン認識を使用して、入力画像から属性および／または特性を判断することができる。より詳細な例では、この入力がランドマークの前に立っている人物の画像であるとすると、入力解析器は、ユーザの正体を判断するために、パターン認識の特殊形態（たとえば顔認識）を利用することができる。同様に、パターン認識を利用してランドマークを解析することにより、この人物の位置を判断することができる。

これらのおよび他の特徴ならびに属性が判断されると、検索クエリが構築されて、検索エンジン１０４へ転送可能になる。検索エンジン１０４を用いて、クエリによる検索結果を引き出すことができる。他の例では、検索エンジン１０４は、インターネット、イントラネット、ローカルまたはリモートのサーバ／記憶装置などから結果を検索することができる。事実上本発明の実施形態は、さまざまな非従来型の入力から検索クエリを構築することを容易にする。

伝統的なシステムは、さまざまなデータタイプ（たとえばテキスト、ウェブページのリンク、画像ファイル）で結果を伝えることができるが、こうした従来のシステムは、検索クエリを可能性のある結果にマッピングするために、手作業で生成されたメタデータおよびタグに依存しているため、依然としてテキスト中心である。視覚化が取り入れられる範囲では、このような視覚化は一般に、ユーザ定義のメタデータを使用することによって行われ、検索可能な項目は、項目の属性に対応したメタデータをあらかじめ手作業でタグ付けされている。

従来の検索メカニズムとは対照的に、本システム１００の１つの特徴は、入力から特徴および属性を抽出することである。たとえば、このシステムは、入力として画像ファイルを受信し、色、パターン、位置などの、ただしこれらに限定されない特徴を抽出することができる。この態様では、パターン認識システムを利用して画像を解析し、その後検索クエリを構築することができ、これを使用して関連する検索結果を引き出すことができる。

検索で考慮されるプロパティは、文書のサイズおよび構造を含むことができ、学術文献に含まれているような一連の参考文献が文書の最後に付いているかどうかにかかわらず、文書の長さと、文書の中に含まれる図（たとえば線図、漫画、画像、数字表、図表、文書の中に含まれる１つまたは複数の画像のヒストグラムのパラメータの指定など）の数、分布、および全体的な性質という面を含むことができる。

諸態様において、文書に含まれる図に関する詳細を見分けてインデックス付けすることができ、たとえば地図または地心から測定されたコンテンツ（geocentric content）のグラフィカルもしくは画像ベースの表示が、文書内に表示されているかどうかに関する情報を認識し、エンコードする。他の例には、文書内に図表があることの認識、グラフの軸上に特定のプロパティ（たとえばテキストまたは他のトークンで表示される）を有するデカルトグラフまたは３次元プロットを格納するものとしてこのようなプロパティを認識することがある。

インデックス付けおよび検索に使用されるプロパティは、たとえば１つまたは複数の測定の経済値が時間とともに増えることを示す「財務グラフ」など、含まれるグラフィックデータが、「時間とともに量が増えること」を示す傾向を見せているかどうかなど、グラフ中心に視覚化して自動的に認識される構造を含むこともできる。

このように認識される図のプロパティおよびさまざまなグラフなどの視覚的コンポーネントのこのようなクラスを使用することは、視覚的オブジェクトの多くの他の可能性のあるクラスの１つの例である。

ページの中で、またはテキストもしくはグラフィックコンテンツの中で、グラフィックコンテンツとテキストコンテンツとの、およびポインタもしくはＵＲＬ（ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＬｏｃａｔｏｒ）など他のプロパティとの関係は、テキストコンテンツをインデックス付けおよび検索する際にポインタが使用された方法と類似した方法で、インデックス付けおよび検索する際に考慮されることが可能である。

テキスト中心のクエリ以外に、グラフィックプロパティの低レベル仕様または高レベル仕様の形態で、テキスト情報を付けてまたは付けずにグラフィックコンテンツを使用し、クエリを作成することができる。たとえば、クエリを作る際に、サンプル図または他のグラフィックコンポーネントなど、グラフィックコンテンツの例を使用することができる。

インデックス付けおよび検索において使用する以外に、グラフィックコンテンツのプロパティは、テキストコンテンツに追加し、入力されたクエリへの応答で項目の表示を構築することに使用可能である。

本発明に全体的な見通しを追加するために次のシナリオを提供するが、これは本発明を決して限定するものではない。このため、本発明の特徴を用いる他のシナリオが存在する可能性があることは理解されるであろう。これらのさらなるシナリオは、本発明および添付の特許請求の範囲の範囲内に含まれるものとする。

上述したように、本発明による検索は、さまざまな次元で実行されることが可能である。たとえば、検索クエリの一部は、特定のコンテキストの中で個人の写真を含むことができる。したがって、たとえば「青いスーツを着て、ディナーでプリンスチャールズの隣に座っているビル・クリントン」のようなテキストの検索クエリを入力するのではなく、このような事象の画像をシステム１００への入力として使用することができる。図１のシステム１００によれば、入力解析器コンポーネント１０２は、入力された画像から関連情報（たとえばビル・クリントンおよびチャールズ皇太子の認識、青いスーツ、ならびにディナーのコンテキスト）を抽出し、クエリ（テキストベースおよび／または画像ベース）を作成し、上記の事象に関連するすべてのウェブサイトを探しやすくすることができる。

図２は、本発明の一態様により入力から検索クエリを生成する方法を示している。説明を簡潔にするために、本明細書ではたとえば流れ図の形で示す１つまたは複数の方法は、一連の動作として示して説明しているが、本発明は動作の順序によって限定されず、一部の動作は、本発明により異なる順序でおよび／または本明細書に示して説明した他の動作と同時に起こる可能性があることを理解され、認識されたい。たとえば、方法は代替的に、状態図など、一連の相互に関係のある状態または事象として表されることが可能であることを、当業者は理解し、認識するであろう。さらに、例示したすべての動作が、本発明による方法を実行するために必要とされるわけではない。

２０２において、特定のデータ型を表す入力を受信することができる。たとえば入力は、テキスト、画像、音声などの形態の、ただしこれらに限定されない形態のデータを含むことができる。その上入力は、複数のデータ型を含む多次元データの形態をとることができる。たとえば、映像ストリームは、画像データおよび音声データを含むことができる。入力は、入力と関連する特徴、属性、および／または特性を識別するために、２０４において解析されることが可能である。たとえば、上述のようにパターン認識メカニズムを画像文書に適用して、特定の画像の対象およびコンテキストを識別することができる。特定の例では、あるスポーツの試合の航空画像を解析して、どのチームが試合をしているか、スタジアムの名前、試合時間（昼間または夜間）などの基準を判断することができる。これらの特徴を使用して、検索クエリを生成することができる。

特定の例を参照すると、パターン認識を使用して、この画像が「スリーリバーススタジアム」で行われている「ピッツバーグパイレーツ」と「ボルチモアオリオールズ」との「野球の試合」を示していることを判断することができる。したがって、「スリーリバースタジアムでのピッツバーグパイレーツとボルチモアオリオールズの野球の試合」という抽出された特徴を使用して、２０６において検索クエリを作成することができる。

画像入力から構築された検索クエリにより、２０８において結果を引き出すことができる。この例を続けると、１９７１年および１９７９年のワールドシリーズと関連する結果を引き出すことができる。さらに詳細には、スリーリバースタジアムでの１９７１年および１９７０年のワールドシリーズのパイレーツとボルチモアオリオールズに関連して、ウェブページのリンク、画像、映像、ならびに音声ファイルが返されることが可能である。こうした結果を２１０において伝える（たとえば表示する）ことができる。

図３は、本発明の一態様により入力を解析する方法を示している。３０２において、上述のように本質的にいかなるメディア型とすることもできる入力を受信することができる。たとえば入力は、テキスト、画像、ストリーミング音声、ストリーミング映像、またはその組合せとすることができる。次の方法の概略で理解されるように、本発明を使用して、ほぼいかなる多次元（ならびに一次元）入力をも解析することができる。

３０４において、この入力はテキストデータを含んでいるかどうかを判断するために、判定を行う。含んでいる場合、３０６において入力をパースして解析し、キーワードを決定することができる。同様に、３０８において、この入力が可聴データを含んでいるかどうかを判断するために、判定を行う。この入力が可聴データを含んでいる場合、３１０において言語認識メカニズムを使用し、この可聴データと関連するキーワードを構築することができる。例として、可聴データが歌である場合、この歌に対して言語認識メカニズムを使用して可聴言語をテキストの歌詞に変換することができる。

さらにまた３１２において、入力が可視データ（たとえば画像データ）を含んでいるかどうかを判断する。上述のテキストおよび音声と同様に、可視データが存在する場合は、３１４においてパターン認識メカニズムにより鍵となる特徴（たとえば属性および／または特性）を構築することができる。１つの特定の態様では、顔認識メカニズムを使用して、画像の中の人物の正体を判定することができる。さらに、パターン認識を使用して、たとえば場所、建物、ランドマーク、色、会場など、画像の中に含まれる他の特性を判定することができる。

入力を解析する（たとえば３０４〜３１４）と、３１６において集めた情報を利用して検索クエリを構築することができる。その後、３１８において、この検索クエリに対する結果を引き出すことができる。続く図を参照してさらに詳細に説明するように、結果は、ユーザに伝える（たとえば表示する）際に所望するように構成される（たとえばフィルタをかけられる、ランク付けされる、順序付けされる）ことが可能である。

次に図４を参照し、多次元検索システム１００の代替的なブロック図を示す。より詳細には、システム１００の代替的態様は、検索エンジン１０４が結果検索コンポーネント４０２と、多次元インデックス生成コンポーネント４０４と、検索インデックス４０６とを含むことができることを示している。動作では、これら３つのサブコンポーネント（４０２、４０４、４０６）は、検索クエリに対して多次元項目を動的にインデックス付けおよび／または検索することを容易にすることができる。

上述のように、１つの態様ではシステム１００は、人間が視覚に基づく手がかりに関連して知的検索（mental searches）を行う方法に対する方法で検索を行う動的な視覚的検索を提供することができる。たとえば、本発明の一実施形態によれば、「青い」という用語を入力として使用する場合、または「青い」色が入力画像に表示される場合、このシステムはこの特徴を認識し、項目が「青い」というメタデータを手作業であらかじめタグ付けされているかどうかにかかわらず、「青い」という物理的特性を持つ項目を検索することができる。そうする際に、検索エンジン１０４は、結果検索コンポーネント４０２を使用して、この属性を持つ結果を動的に探すことができる。より詳細には検索エンジン１０４は、たとえば（結果検索コンポーネント４０２を介して）パターン認識システムを使用して、検索可能項目から視覚情報を抽出することができる。別の態様では、図４に示すようにインデックス付けするシステムの一部として、視覚情報のこのような抽出を行うことができる。図４に示す態様によれば、多次元インデックス生成コンポーネント４０４は、データ項目（たとえばウェブページ、ファイル、画像データ、ストリーミング音声、または映像データ）と関連する特徴に基づいて、インデックス４０６を構築することができる。

次に図５を参照すると、多次元検索システム１００の代替的なブロック図が示してある。詳細には、図５のシステム１００は、入力解析器コンポーネント１０２および多次元インデックス生成器コンポーネント４０２が、それぞれテキスト分析器（５０２、５０４）と、音声分析器（５０６、５０８）と、画像分析器（５１０、５１２）とを含むことができることを示している。各コンポーネント（１０２、４０２）は、コンテンツ解析器コンポーネント（５０２〜５１２）を含むように示してあるが、ただ１組のコンテンツ解析器コンポーネントを設けて、入力解析器コンポーネント１０２ならびに多次元インデックス生成器４０２がこれを使用し、それぞれ入力された検索可能な項目の中に含まれる特徴を発見することができるということを理解されたい。

上述のように、サブコンポーネント（５０２〜５１２）のそれぞれにより、システムは入力ならびに検索可能項目から特徴を抽出することができる。１つの態様では、こうした特徴の抽出によってユーザの入力が解析可能になり、その後抽出された特徴から検索クエリを構築する。別の態様では、こうした特徴の抽出によって、検索可能な項目を自動的かつ動的にインデックス付けしやすくする。言い換えれば、こうしたインデックス付けのメカニズムにより、このシステムは、検索可能な項目から特徴を自動的および／または動的に抽出することができ、その後特定のクエリまたはクエリのセットに基づいてこの特徴を検索に利用可能にする。

入力解析器コンポーネント１０２を参照すると、図６は、特定の解析を実行することができる、入力解析器コンポーネント１０２の例示的なサブコンポーネントを示している。さらに詳細には、１つの態様においてテキスト解析器５０２は、入力をパースして適切な検索クエリを構築することができる言語パーサ６０２を含むことができる。明らかなように、入力をパースすることにより、入力の語を、検索クエリに変換可能である機能単位に解体することができる。別の例では、構文解析メカニズムは、「ビル・クリントンがチャールズ皇太子と最後に会ったのはどこか？」のような入力を、「場所、ビル・クリントン、会う、チャールズ皇太子」というキーワードに解釈することができる。こうしたキーワードを検索クエリとして使用し、関連する結果を返すことができる。

他の態様では、音声解析器５０４は、言語認識（speech recognition）コンポーネント６０４を含むことができ、画像解析器コンポーネント５０６は、パターン認識コンポーネント６０６を含むことができる。たとえば、入力が画像であると仮定する。したがって、画像処理メカニズムを使用して、陰、色と関係、図柄、形状などを識別することができる技術を用いて画像を解析することができる。パターン認識コンポーネント６０６の画像処理機能は、たとえばデジタルカメラによってスキャンされたまたは取り込まれたビットマップのグラフィック形式の画像を処理することができる。

パターン認識６０６は、システムが事前知識に基づいておよび／または画像内の識別されたパターンから抽出される統計的情報に基づいてデータのパターンを分類することができる機械学習および推論（ＭＬＲ）の領域内のフィールドを参照することができるほとんどの場合、分類されるパターンは、適切な多次元空間においてポイントを定義する測定群または観察群である。パターン認識システム６０６は、分類される、すなわち前述の観察を集めるセンサまたはセンサ群を含むことができる。特徴抽出メカニズムを使用して、観察から情報（たとえば数値または記号）を算出することができる。その上パターン認識システムは、抽出された特徴に基づいて観察を実際に分類するまたは記述する分類または記述メカニズムを含むことができる。画像解析は、パターン認識システムへの入力としてデジタル画像に向けられるパターン認識の形式である。

本質的に画像解析は、画像からの重要な情報の抽出を参照する。画像解析技術は、バーコードリーダーのような簡単なタスクから、顔の特徴の解析に基づいて個人を識別することができる顔認識システムのような複雑かつ高度な解析まで、多岐にわたる場合があることを理解されるであろう。

次に図７を参照すると、システム１００の代替的態様が示してあり、この多次元検索システムは結果構成コンポーネント７０２を含む。動作において、結果構成コンポーネント７０２は、所望の方法で結果をフィルタにかける、ソートする、インデックス付けする、ランキングを付ける、およびその後に表示することを容易にすることができる。１つの特定の例では、検索結果がむしろ視覚中心の形態をとれるようにすることが、本発明の特徴である。たとえば、検索結果としてテキストに基づく統一資源位置指定子（ＵＲＬ）またはストリングを提供するのではなく、結果は、画像（または画像群）の形態で提示されて、高い一瞥性（ｇｌａｎｃｅａｂｉｌｉｔｙ）を促すことができる。さらに結果は、テキストデータ、視覚データ、および可聴データの組合せを含むことができ、それによって本発明のメカニズムの提示を向上させる。

その上、図７に示すように、検索入力は、多次元で行うことが可能であり、付帯的次元のデータ（たとえば時間、音声、視覚、コンテキスト、雰囲気、事象など）を検索クエリおよび結果にマップし、多次元にわたって大量のデータをインデックス付けおよび視聴できるようにすることができる。

図８は、本発明の一態様による例示的な結果構成コンポーネント７０２を示している。図のように、結果構成コンポーネント７０２は、フィルタコンポーネント８０２と、ランク付けコンポーネント８０４と、順序付けコンポーネント８０６とを含むことができる。こうしたコンポーネントのそれぞれは、所望の基本設定および／または多次元コンテキストにより検索結果の提示に作用するように使用されることが可能である。

たとえば、フィルタコンポーネント８０２を使用して、時刻、位置、デバイスコンテキストなどに少なくとも部分的に基づいて検索結果のサブセットを自動的にフィルタにかけることができる。各シナリオにおいて、フィルタコンポーネント８０２は、付帯的多次元要素に基づいて適切なソーティングおよび／またはフィルタリングの基準を推論することができる。同様に、ランク付けコンポーネント８０４および順序付けコンポーネント８０６を使用して、判断および／または推論したコンテキストまたは外部の多次元データに基づき結果を整然とまとめることができる。

本発明に全体的な見通しを付加するために次のシナリオを提供するが、これは本発明を決して限定するものではない。言い換えれば、本開示および／またはこれに添付する特許請求の範囲の範囲を限定するつもりはなく、次のシナリオを提供して、本発明の特徴のいくつかを説明する。

ここで図９を参照すると、本発明の一態様による検索入力のスクリーンショットが示してある。さらに詳細には、図のように検索操作への入力は、街のスカイラインの画像とすることができる。上述のように、本発明の特徴により、この画像に画像解析を行って、この画像の特徴を判断および抽出することができる。抽出されると、抽出された特徴に基づいて、システムは検索クエリを構築することができる。

図１０は、検索結果の例示的セットを示している。図のように結果は、構築した検索クエリへの適合性に従う順序で伝えることができる。この例では、システムは、画像解析によりこの画像がニューヨーク市のものであることを確定することができる。このために、検索を行い、図１０に示すように結果を伝えることができる。図１０の結果はテキスト形式で示されているが、本発明の趣旨および／または範囲を逸脱することなく、結果を伝える他の手段（たとえば映像、音声）を使用することができるということを理解され、認識されたい。たとえば、別の態様では、テキストの結果に加えてまたはこれに代えて画像を提示し、それによってレビュー時間（たとえば一瞥性）を向上させることができる。

図１１は、選択メカニズム１１０２を使用して、入力として使用する画像の一部を識別することができることを示している。この例では、選択メカニズム１１０２は、世界貿易センターを囲む範囲を定める正方形である。したがって図１２は、この選択から自動的に作成された検索クエリに基づいて提示されることが可能である検索結果１２０２、１２０４の例示的なセットを示している。

図のように、結果は、任意の方法で順序付けされた、ランク付けされた、および／またはフィルタにかけられたテキストの結果１２０２を含むことができる。たとえば、結果は、ユーザのコンテキスト（たとえば時間、場所、装置の型、ユーザの状態、雰囲気…）に基づいて構成されることが可能である。その上、一瞥性を向上させるために、図示したテキストの結果に代えて、画像を追加するまたは挿入することができる。同様に、結果を伝える効果を高めるために、結果にアノテーション（たとえば強調表示、アンダーライン付け、フォント整形）技術を追加することができる。こうしたアノテーション技術は、本発明および添付の特許請求の範囲の範囲内に含まれるものとする。

さらに、本発明の機能によれば、このシステムは、検索クエリに対応した画像１２０４を返すことができる。上述のように、これらの画像は、上述の可能性のある検索結果から特徴を抽出することによって提供されることが可能である。抽出した特徴により、本質的に異なる態様において、検索可能項目をインデックス付けすることができる。このようにシステムは、インデックスを検索し、その後結果を伝えることができる。同様にシステムは、あらかじめインデックス付けする代わりに検索クエリにより、オンザフライで特徴を抽出して画像ベースの結果を伝えることができる。

本発明の態様によれば、システム１００は、本発明による１つまたは複数の特徴を自動化することを促すＭＬＲコンポーネント（図示せず）を使用することができる。この特定の実施では、ＭＬＲコンポーネントは、入力解析器コンポーネント１０２、検索エンジン１０４、および結果構成コンポーネント７０２のそれぞれと接続されるように配置することができる。このためにＭＬＲコンポーネントを使用して、ここに記載した各コンポーネントの機能による動作を自動化および／または推論することができる。

本発明は（たとえば、クエリの生成／変更、結果の選択／構成、検索可能項目のインデックス付けと関連して）、そのさまざまな態様を実行するために、さまざまなＭＬＲに基づく方法を使用することができる。たとえば、どの結果が所望されているか、またコンテキスト要素を考慮して入力に基づいて結果をどのように提示すべきかを予測することに関する学習および推論のプロセスは、自動分類子システムおよびプロセスにより容易にされることが可能である。

分類子は、入力属性ベクトル、ｘ＝（ｘ１，ｘ２，ｘ３，ｘ４，ｘｎ）をクラスラベルｃｌａｓｓ（ｘ）にマップする関数である。また分類子は、入力があるクラス、すなわちｆ（ｘ）＝ｃｏｎｆｉｄｅｎｃｅ（ｃｌａｓｓ（ｘ））に属するという信頼度を出力することができる。このような分類は、確率論的なおよび／または他の統計的解析を使用して、ユーザが自動的に実行されることを望む動作を予知するまたは推論することができる。

サポートベクターマシーン（ＳＶＭ）は、使用することができる分類子の一例である。ＳＶＭは、考えられる入力の空間に、最適な方法でトリガ入力事象を非トリガ事象から分ける超曲面を見つけることによって動作する。直感的にこれは、学習用データと近いがまったく同じではない検証用データについて分類を正しくする。その他の有向および無向モデル分類手法には、さまざまな独立性のパターンを使用することができる場合、たとえばナイーブベイズ（ｎａｉｖｅＢａｙｅｓ）、ベイジアン（Ｂａｙｅｓｉａｎ）ネットワーク、決定木、ニューラルネットワーク、ファジー論理モデル、および確率論的分類モデルが含まれる。またここで使用する分類は、ランク付けまたは優先度のモデルを開発するために利用される統計的回帰を含んでいる。

本明細書から容易にわかるように、本発明は、明示的に（たとえば一般的な学習用データによって）教え込まれると同時に、暗黙に（たとえばユーザの行動を観察すること、付帯的情報を受信することによって）教え込まれる分類子を使用することができる。たとえば、ＳＶＭは、分類子組立ておよび特徴選択モジュールの中で学習または訓練段階を経て構成される。したがって、分類子を使用して自動的に学習し、あらかじめ定められた基準に従っていくつかの機能を実行することができる。

１つのさらに特定の例では、ＭＬＲコンポーネントは、コンテキスト情報（たとえば時刻、週、位置、ユーザの役割）に基づいて、判断および／または推論されたクエリを考慮してどのようなタイプの結果が所望であるか、ならびに結果はどのように提示されるべきかを学習することができる。たとえば、ユーザが日常的に特定の情報を求めてクエリを行い、その後提示された結果から同じまたは同様の結果のセットを選択する場合、時間の経過とともに、ＭＬＲコンポーネントはこの使用パターンを学習することができる。したがってシステムは、このユーザが同じまたは同様の検索クエリを実行する際に再び同じ結果を選択する可能性が高いと考える（または予測する）ことができる。結果的に、この情報を用いて、またクエリの実行時に所望の方法で特定の結果のセットを提示する目的で、統計モデルを生成することができる。

個人化されたモデル（personalized models）は、ユーザの好みと関わる履歴データ、ならびに以前の検索に関するユーザのフィードバックに基づいて特徴を引き出すように教え込まれることが可能である。装置が本明細書に記載する実施形態を組み込むようにして、シード分類子を配置することができ、このような分類子は、消費者によって使用される間に調整されることが可能である。さらに、入力の一定の特徴には、他の特徴よりも大きく重み付けを行うことができる。たとえば、写真の中央にある像は、このような像が一般に周辺のイメージと比べて直接的に関連する可能性が大きいため、より高い重み付けを行うことができる。同様に、人間の話し言葉と関連する周波数領域内の音声の特徴には、このような周波数帯以外の音声よりも高い重み付けを行うことができる。ピクセルマッピング技術を使用して、ピクセル群を同様の色および近接性に応じて関連付けることができる。本明細書に記載する実施形態により、特徴を抽出することを容易にするいかなる好適な方法を使用することもできる。

次に図１３を参照すると、視覚および多次元検索の開示したアーキテクチャを実行するように動作可能なコンピュータのブロック図が示してある。本発明のさまざまな態様に追加のコンテキストを提供するために、図１３および次の記述は、本発明のさまざまな態様を実施することができる好適なコンピューティング環境１３００について簡潔で、概括的な説明を行うものとする。１つまたは複数のコンピュータ上で実行することができるコンピュータ実行命令の一般的なコンテキストで本発明を上述したが、本発明はまた、他のプログラムモジュールと組み合わせて、および／またはハードウェアおよびソフトウェアの組合せとして、実行可能であることを当業者には理解されるであろう。

一般に、プログラムモジュールは、特定のタスクを実行するまたは特定の抽象データ型を実装するルーチン、プログラム、コンポーネント、データ構造などを含む。さらに、本発明の方法が、シングルプロセッサもしくはマルチプロセッサのコンピュータシステム、ミニコンピュータ、大型コンピュータ、ならびにパーソナルコンピュータ、ハンドヘルドのコンピューティング装置、マイクロプロセッサベースのもしくはプログラム可能な家庭用電化製品などを含む、他のコンピュータシステムの構成で実行可能であり、これらのそれぞれが１つまたは複数の関連する装置と適切に結合可能であることを、当業者は理解するであろう。

また本発明の例示した態様は、通信ネットワークを介してリンクされたリモート処理装置により一定のタスクが実行される分散型コンピューティング環境でも実施されることが可能である。分散型コンピューティング環境では、プログラムモジュールは、ローカルとリモートの両方の記憶装置に置かれることが可能である。

コンピュータは、通常さまざまなコンピュータ可読媒体を含んでいる。コンピュータ可読媒体は、コンピュータによってアクセスされることが可能であるいかなる利用可能な媒体とすることもでき、揮発性媒体および不揮発性媒体、取り外し可能な媒体および取り外しで不可能な媒体を含む。一例として、コンピュータ可読媒体は、コンピュータ記憶媒体および通信媒体を含むことができるが、これらに限定されない。コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を格納するためのあらゆる方法または技術で実現される揮発性および不揮発性、取り外し可能および取り外し不可能な媒体を含む。コンピュータ記憶媒体には、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリもしくは他のメモリ技術、ＣＤ−ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）もしくは他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶装置、または所望の情報を保存するために使用することができ、コンピュータによってアクセスされることが可能な他の媒体があるが、これらに限定されない。

通信媒体は通常、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータを、搬送波または他の搬送機構などの変調されたデータ信号に組み入れるものであり、あらゆる情報配信媒体を含む。「変調されたデータ信号」という用語は、信号の中の情報を符号化するような方法で特性の１つまたは複数が設定されたまたは変更された信号を意味する。一例として、通信媒体は、有線ネットワークもしくは直接接続などの有線媒体、ならびに音響、ＲＦ、赤外線、その他の無線媒体を含むが、これらに限定されない。上述したいずれかの組合せもまた、コンピュータ可読媒体の範囲内に含まれなければならない。

再び図１３を参照すると、本発明のさまざまな態様を実施する例示的環境１３００は、処理ユニット１３０４と、システムメモリ１３０６と、システムバス１３０８とを備えているコンピュータ１３０２を含んでいる。このシステムバス１３０８は、限定ではないがシステムメモリ１３０６を備えているシステムコンポーネントを、処理ユニット１３０４に結合する。処理ユニット１３０４は、市販されているさまざまなプロセッサのいずれかとすることができる。また、処理ユニット１３０４として、デュアルマイクロプロセッサのアーキテクチャおよび他のマルチプロセッサのアーキテクチャを使用することもできる。

システムバス１３０８は、さまざまな市販のバスのアーキテクチャを用いてメモリバス（メモリコントローラのあるものもしくはないもの）、周辺バス、およびローカルバスとさらに相互に接続することができるいくつかのタイプのバス構造のいずれかとすることができる。システムメモリ１３０６は、リードオンリーメモリ（ＲＯＭ）１３１０およびランダムアクセスメモリ（ＲＡＭ）１３１２を含む。ベーシックインプット／アウトプットシステム（ＢＩＯＳ）は、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭなど非揮発性メモリ１３１０に格納されており、このＢＩＯＳは、スタートアップ中など、コンピュータ１３０２内の要素間で情報を転送する助けとなる基本ルーチンを含んでいる。またＲＡＭ１３１２は、データをキャッシュするためのスタティックＲＡＭなど高速ＲＡＭを含むことができる。

コンピュータ１３０２は、内蔵ハードディスクドライブ（ＨＤＤ）１３１４（たとえばＥＩＤＥ、ＳＡＴＡ）と、磁気フロッピー（登録商標）ディスクドライブ（ＦＤＤ）１３１６（たとえばリムーバブルディスケット１３１８から読み取るまたはこれに書き込む）と、光ディスクドライブ１３２０（たとえばＣＤ−ＲＯＭディスク１３２２を読み取る、またはＤＶＤなど他の高容量光メディアから読み取るまたはこれに書き込む）とをさらに含み、内蔵ハードディスクドライブ１３１４は、好適なシャシ（図示せず）で外付けに使用するように構成することもできる。ハードディスクドライブ１３１４、磁気ディスクドライブ１３１６、および光ディスクドライブ１３２０は、それぞれハードディスクドライブのインターフェース１３２４、磁気ディスクドライブのインターフェース１３２６、および光ディスクドライブのインターフェース１３２８によってシステムバス１３０８に接続することができる。外付けドライブ実装用のインターフェース１３２４は、ユニバーサルシリアルバス（ＵＳＢ）およびＩＥＥＥ１３９４のインターフェース技術のうち少なくとも一方または両方を含む。他の外付けドライブ接続技術についても、本発明が意図するものである。

ドライブおよびそれに関連するコンピュータ可読媒体は、データ、データ構造、コンピュータ実行可能命令などの不揮発性の記憶装置となる。コンピュータ１３０２については、ドライブおよびメディアは、好適なデジタル形式でいかなるデータも格納する。上記のコンピュータ可読媒体という記述は、ＨＤＤ、取り外し可能な磁気ディスケット、およびＣＤもしくはＤＶＤのような取り外し可能な光メディアを指すが、ｚｉｐドライブ、磁気カセット、フラッシュメモリカード、カートリッジなどコンピュータで読み取り可能である他のタイプのメディアも例示の動作環境で使用可能であること、さらにこのようないかなるメディアも本発明の方法を実行するためにコンピュータで実行可能な命令を含むことができることを、当業者には理解されたい。

ドライブおよびＲＡＭ１３１２には、オペレーティングシステム１３３０、１つまたは複数のアプリケーションプログラム１３３２、その他のプログラムモジュール１３３４、およびプログラムデータ１３３６を含む、いくつかのプログラムモジュールを格納することができる。オペレーティングシステム、アプリケーション、モジュール、および／またはデータの全部または一部を、ＲＡＭ１３１２にキャッシュすることもできる。本発明は、さまざまな市販のオペレーティングシステムまたはオペレーティングシステムの組合せを用いて実行されることが可能であることがわかる。

ユーザは、たとえばキーボード１３３８およびマウス１３４０のようなポインティングデバイスなど、１つまたは複数の有線／無線の入力装置を介してコマンドおよび情報をコンピュータ１３０２に入力することができる。その他の入力装置（図示せず）には、マイクロフォン、ＩＲリモートコントロール、ジョイスティック、ゲームパッド、スタイラスペン、タッチスクリーンなどが含まれる。これらのおよび他の入力装置は、システムバス１３０８に結合された入力装置のインターフェース１３４２を介して処理ユニット１３０４に接続されることが多いが、パラレルポート、ＩＥＥＥ１３９４シリアルポート、ゲームポート、ＵＳＢポート、ＩＲインターフェースなど、他のインターフェースによって接続されることも可能である。

モニタ１３４４または他のタイプのディスプレイ装置もまた、映像アダプタ１３４６などのインターフェースを介してシステムバス１３０８に接続される。モニタ１３４４に加えてコンピュータは、通常、スピーカ、プリンタなど他の周辺出力装置（図示せず）を含む。

コンピュータ１３０２は、リモートコンピュータ１３４８のような１つまたは複数のリモートコンピュータと、有線通信および／または無線通信による論理接続を用いてネットワーク化された環境で動作することができる。リモートコンピュータ１３４８は、ワークステーション、サーバコンピュータ、ルータ、パーソナルコンピュータ、ポータブルコンピュータ、マイクロプロセッサベースのエンターテイメントアプライアンス、ピア装置、または他の一般的なネットワークノードとすることができ、簡潔にするためにメモリ／格納装置１３５０のみを示しているが、通常、コンピュータ１３０２に関して説明した要素の多くまたはすべてを含む。図示した論理接続は、ローカルエリアネットワーク（ＬＡＮ）１３５２および／またはたとえばワイドエリアネットワーク（ＷＡＮ）１３５４などより大きなネットワークとの有線／無線の接続を含む。このようなＬＡＮおよびＷＡＮのネットワーク環境は、オフィスおよび会社では一般的であり、イントラネットなど企業規模のコンピュータネットワークを円滑にし、そのすべてがたとえばインターネットなどのグローバル通信ネットワークと接続することができる。

ＬＡＮネットワーク環境で使用されるとき、コンピュータ１３０２は、有線および／または無線通信ネットワークのインターフェースまたはアダプタ１３５６を介してローカルネットワーク１３５２と接続される。アダプタ１３５６は、ＬＡＮ１３５２との有線または無線接続を容易にすることができ、ＬＡＮ１３５２は、無線アダプタ１３５６と通信するために配置された無線アクセスポイントを含む場合もある。

ＷＡＮネットワーク環境で使用されるとき、コンピュータ１３０２は、モデム１３５８を含むことができる、またはＷＡＮ１３５４上の通信サーバと接続される、またはインターネット経由などのＷＡＮ１３５４を通って通信を確立するための他の手段を有する。モデム１３５８は、内蔵もしくは外付け、および有線もしくは無線とすることができ、シリアルポートインターフェース１３４２によってシステムバス１３０８と接続される。ネットワーク化された環境では、コンピュータ１３０２またはその一部と関連して図示したプログラムモジュールは、リモートのメモリ／格納装置１３５０に格納することができる。図のネットワーク接続は例示であり、コンピュータ間の通信リンクを確立する他の手段を使用することが可能であることは、理解されるであろう。

コンピュータ１３０２は、たとえばプリンタ、スキャナ、デスクトップおよび／またはポータブルコンピュータ、携帯情報端末、通信衛星、無線で検出可能なタグと関連付けられた装置または場所の一部（たとえばキオスク、新聞の売店、化粧室）、ならびに電話など、無線通信で動作可能に配置されたいかなる無線装置またはエンティティとも通信するように動作する。これは、少なくともＷｉ−ＦｉおよびＢｌｕｅｔｏｏｔｈ（商標）の無線技術を含む。したがって、通信は、従来のネットワークと同様の所定の構造とするか、または単に少なくとも２つの装置間のアドホック通信とすることができる。

Ｗｉ−Ｆｉ、すなわちＷｉｒｅｌｅｓｓＦｉｄｅｌｉｔｙにより、自宅の長いす、ホテルの部屋のベッド、または職場の会議室から、無線でインターネットへ接続することが可能になる。Ｗｉ−Ｆｉは、携帯電話で使用されるものと同様の無線技術であり、これによりたとえばコンピュータなどの装置は、基地局の範囲内のどこでも、屋内および屋外でデータを送受信することができるようになる。Ｗｉ−Ｆｉネットワークは、ＩＥＥＥ８０２．１１（ａ、ｂ、ｇなど）と呼ばれる無線技術を使用して、安全で、信頼性のある、高速の無線接続を提供する。Ｗｉ−Ｆｉネットワークを使用して、コンピュータを互いに、インターネットに、および有線ネットワーク（ＩＥＥＥ８０２．３またはイーサネット（登録商標）を使用する）に接続することができる。Ｗｉ−Ｆｉネットワークは、免許不要の２．４および５ＧＨｚ無線帯域で、たとえば１１Ｍｂｐｓ（８０２．１１ａ）または５４Ｍｂｐｓ（８０２．１１ｂ）のデータレートで、または両帯域を含む（デュアルバンド）製品で動作するため、このネットワークは、多くのオフィスで使用される基本的な１０ＢａｓｅＴの有線イーサネット（登録商標）ネットワークと同様の実環境性能を提供することができる。

次に図１４を参照すると、本発明による例示的コンピューティング環境１４００の概略ブロック図が示してある。このシステム１４００は、１つまたは複数のクライアント１４０２を含む。クライアント１４０２は、ハードウェアおよび／またはソフトウェア（たとえばスレッド、プロセス、コンピューティング装置）とすることができる。クライアント１４０２は、たとえば本発明を使用することによってクッキーおよび／または関連するコンテキスト情報を収容することができる。

このシステム１４００はまた、１つまたは複数のサーバ１４０４を含む。サーバ１４０４もまた、ハードウェアおよび／またはソフトウェア（たとえばスレッド、プロセス、コンピューティング装置）とすることができる。サーバ１４０４は、たとえば本発明を使用することによって変換を行うスレッドを収容することができる。クライアント１４０２とサーバ１４０４との間の１つの可能な通信は、２つ以上のコンピュータプロセスの間で転送されるように適合されたデータパケットの形とすることができる。データパケットは、たとえばクッキーおよび／または関連するコンテキスト情報を含むことができる。このシステム１４００は、クライアント１４０２とサーバ１４０４との間の通信を容易にするために使用可能である通信フレームワーク１４０６（たとえばインターネットのようなグローバル通信ネットワーク）を含む。

通信は、有線（光ファイバを含む）および／または無線技術により容易にすることができる。クライアント１４０２は、クライアント１４０２にローカルな情報（たとえばクッキーおよび／または関連するコンテキスト情報）を格納するために使用することができる１つまたは複数のクライアントデータ格納装置１４０８と動作可能に接続されている。同様にサーバ１４０４は、サーバ１４０４にローカルな情報を格納するために使用することができる１つまたは複数のサーバデータ格納装置１４１０と動作可能に接続されている。

上述したものは、本発明の実例を含んでいる。当然ながら、本発明を述べる目的で構成要素または方法の考えられるあらゆる組合せを記載することは不可能であるが、当業者には本発明のさらなる組合せおよび変形が多く考えられることを理解されるであろう。したがって、本発明は、添付の特許請求の範囲の趣旨および範囲内にあるこのような代替形態、変更形態、および変形形態を包含するものとする。さらに、「含む（ｉｎｃｌｕｄｅｓ）」という用語が詳細な説明または特許請求の範囲のいずれかで使用される限りでは、このような用語は、「備える（ｃｏｍｐｒｉｓｉｎｇ）」という用語が請求項の移行語として使用されるときに解釈される「備える」と同様の意味で包含的であるとする。

本発明の一態様により多次元入力から検索クエリを構築することを容易にする検索システムのブロック図である。本発明の一態様により多次元入力から検索クエリを生成することを容易にする手順の例示的流れ図である。本発明の一態様によりテキスト、可聴特性および可視特性を有する入力を解析することを容易にする手順の例示的流れ図である。本発明の一態様により多次元の検索可能項目をインデックス付けすることを容易にするシステムのブロック図である。本発明の一態様により検索クエリを構築する際および／または検索可能項目をインデックス付けする際にテキスト解析、音声解析、および画像解析を使用する構造ブロック図である。本発明の一態様により検索クエリを構築するために言語パーサ、言語認識、およびパターン認識メカニズムを使用する入力解析コンポーネントのブロック図である。本発明の一態様により検索結果をフィルタにかけるためおよび／または整理するために結果構成コンポーネントを使用するシステムのブロック図である。本発明の一態様による例示的な結果構成コンポーネントを示す図である。本発明の一態様による画像入力の例示的スクリーンショットを示す図である。図９の入力による結果の例示的セットを示す図である。本発明の一態様による入力画像に重ねた例示的選択範囲を示す図である。図１１の選択範囲によるテキストおよび画像の結果の例示的セットを示す図である。開示したアーキテクチャを実行することができるコンピュータのブロック図である。本発明による例示的コンピューティング環境の概略ブロック図である。

Claims

入力から特徴を抽出する入力解析器と、
前記抽出した特徴のサブセットに少なくとも部分的に基づいて検索クエリを作成する検索エンジンと
を備えることを特徴とする多次元検索システム。
前記入力は画像データであることを特徴とする請求項１に記載の多次元検索システム。
前記入力は、テキスト、視覚データ、および音声データのうちの少なくとも２つの組合せであることを特徴とする請求項１に記載の多次元検索システム。
前記検索エンジンは、
複数の次元にわたって検索に関連する情報を収集してインデックス付けする多次元インデックス生成器と、
前記抽出された特徴のサブセットに少なくとも部分的に基づいて前記複数の次元のうちの１つまたは複数にわたって検索を行うインデックス項目ロケータコンポーネントと
を備えることを特徴とする請求項１に記載の多次元検索システム。
前記検索に関連する情報をインデックス付けすることを容易にするテキスト解析器、音声解析器、および画像解析器をさらに備えることを特徴とする請求項４に記載の多次元検索システム。
テキスト解析器、画像解析器、および音声解析器のうちの少なくとも１つをさらに備えることを特徴とする請求項１に記載の多次元検索システム。
前記テキスト解析器は、前記入力から前記特徴を抽出する言語パーサを含むことを特徴とする請求項６に記載の多次元検索システム。
前記音声解析器は、前記入力から前記特徴を抽出する言語認識コンポーネントを含むことを特徴とする請求項６に記載のシステム。
前記画像解析器は、前記入力から前記特徴を抽出するパターン認識コンポーネントを含むことを特徴とする請求項６に記載のシステム。
前記入力に関連する複数の検索結果を管理する結果構成コンポーネントをさらに備えることを特徴とする請求項１に記載の多次元検索システム。
前記結果構成コンポーネントは、ユーザのコンテキスト、ユーザの好み、前記入力に対する適合率、およびデバイスコンテキストのうちの少なくとも１つに従って前記複数の検索結果のサブセットをソートするフィルタコンポーネントを含むことを特徴とする請求項１０に記載の多次元検索システム。
前記結果構成コンポーネントは、ユーザの好みおよび適合率のうちの１つに少なくとも部分的に基づいて前記複数の検索結果のサブセットを配列するランク付けコンポーネントを含むことを特徴とする請求項１０に記載の多次元検索システム。
前記結果構成コンポーネントは、前記複数の検索結果のサブセットに対して表示の順序を決定する順序付けコンポーネントを含むことを特徴とする請求項１０に記載の多次元検索システム。
自動的に実行されることをユーザが望む動作を推論するために確率論的解析および統計に基づく解析のうちの少なくとも１つを用いる機械学習および推論コンポーネントをさらに含むことを特徴とする請求項１に記載のシステム。
コンピュータによって実施される多次元検索を行う方法であって、
入力を受信することと、
前記入力から複数の特徴語を抽出することと、
前記抽出された特徴のサブセットに少なくとも部分的に基づいて複数の検索語を確立することと、
前記検索語のサブセットに少なくとも部分的に基づいて複数の結果を引き出すことと
を含むことを特徴とする方法。
前記入力クエリ中の画像パターンを認識することと、
前記認識した画像化パターンを前記検索語のサブセットに変換することと
をさらに含むことを特徴とする請求項１５に記載の方法。
検索に関連するデータを収集することと、
前記検索に関連するデータを解析することと、
前記検索に関連するデータをインデックス付けすることとをさらに備え、前記複数の結果は、前記検索に関連するデータの中に含まれることを特徴とする請求項１５に記載の方法。
前記複数の検索結果のサブセットを構成することと、
前記複数の検索結果の前記サブセットをユーザに提示することと
をさらに含むことを特徴とする請求項１６に記載の方法。
入力を受信する手段と、
前記入力から複数の特徴を抽出する手段と、
前記複数の特徴のサブセットに少なくとも部分的に基づいて検索クエリを生成する手段と
を備えることを特徴とするコンピュータで実行可能なシステム。
多次元にわたって検索に関連する情報を収集する手段と、
前記収集した検索に関連する情報をインデックス付けする手段と、
前記検索クエリに少なくとも部分的に基づいて前記検索に関連する情報に検索を行う手段と
をさらに備えることを特徴とする請求項１９に記載のコンピュータで実行可能なシステム。