JP4694215B2 - 検索を容易にするシステム及び焦点を絞った検索を行う方法 - Google Patents

検索を容易にするシステム及び焦点を絞った検索を行う方法 Download PDF

Info

Publication number
JP4694215B2
JP4694215B2 JP2005016102A JP2005016102A JP4694215B2 JP 4694215 B2 JP4694215 B2 JP 4694215B2 JP 2005016102 A JP2005016102 A JP 2005016102A JP 2005016102 A JP2005016102 A JP 2005016102A JP 4694215 B2 JP4694215 B2 JP 4694215B2
Authority
JP
Japan
Prior art keywords
subweb
search
sites
site
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005016102A
Other languages
English (en)
Other versions
JP2005209210A (ja
Inventor
ディー.ブリル エリック
チェン ハル
チャンドラセカー ラマン
エイチ.コルストン シモン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2005209210A publication Critical patent/JP2005209210A/ja
Application granted granted Critical
Publication of JP4694215B2 publication Critical patent/JP4694215B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F11/00Indicating arrangements for variable information in which the complete information is permanently attached to a movable support which brings it to the display position
    • G09F11/02Indicating arrangements for variable information in which the complete information is permanently attached to a movable support which brings it to the display position the display elements being secured to rotating members, e.g. drums, spindles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、検索を容易にするシステム及び焦点を絞った検索を行う方法に関する。より詳細には、本発明は、一般にインターネットおよび/またはイントラネットの検索に関連し、トピックのカテゴリ分類、またはドメインおよび/またはパスのバイアス(biasing;偏倚)を容易にし、さらにこうしたカテゴリ分類の検索を容易にする、検索を容易にするシステム、クローリング(crawling)システム、焦点を絞った検索の実行を容易にするシステム、焦点を絞った検索を行う方法、サブウェブ構築システム、サブウェブを生成する方法、サイトの集まりを検索するシステム、及び記録媒体に関する。
高コストで低性能なデータ処理システムから、低コストで高性能な通信/問題解決/エンターテイメントシステムへとコンピュータおよびネットワーキング技術が進化したことにより、通信、請求書の支払い、買い物、予算管理、情報収集など、日々のタスクを行う負担を軽減する費用効率の高い、時間を節約する手段がもたらされた。例えば、有線または無線技術を介してインターネットに接続されたコンピューティングシステムは、世界中に位置するウェブサイトおよびウェブサーバのリポジトリからの大量の情報にユーザの意のままにほぼ瞬時にアクセスするためのチャネルをユーザに提供することができる。
一般に、ウェブサイトおよびウェブサーバを介して入手可能な情報には、(コンピュータなど)ウェブクライアント上で実行するウェブブラウザを介してアクセスする。例えばウェブユーザは、ウェブブラウザを導入し、ウェブブラウザのアドレスバーにウェブサイトのユニフォームリソースロケータ(URL)(ウェブアドレスおよび/またはインターネットアドレスおよび/またはイントラネットアドレス)を入力し、キーボードのエンターキーを押す、またはマウスで「進め」ボタンをクリックすることによってウェブサイトにアクセスすることができる。URLは一般に、アクセスを容易にする4つの情報、つまり情報を交換するための1組のルールおよび標準を示すプロトコル(コンピュータが互いに通信するための言語)、ウェブサイトの場所、ウェブサイトを維持する組織名、および組織のタイプを識別するウェブアドレスの接尾語(com、org、net、gov、eduなど)を含む。
場合によって、ユーザは、アクセスしたいサイトまたはサーバの名前、および/またはサイトまたはサーバへのURLを事前に知っていることがある。こうした状況では、ユーザは、上述したように、アドレスバーにURLを入力し、サイトに接続することによって、そのサイトにアクセスすることができる。しかし、ほとんどの場合、ユーザはURLまたはサイト名を知らない。ユーザは、代わりに、ユーザが提供したキーワードに基づいて特定のサイトを容易に探し出せるようにする検索機能を使用する。現在、検索が特定のドメインまたはサイト(www.domain.comなど)に制限されるドメイン限定検索機能と、提供されたキーワードに関連するサイトについてWWW(World Wide Web)(またはイントラネット)全体を検索する一般の検索機能(一般の検索エンジンなど)という2つの異なるタイプの検索機能がある。例えばユーザは、コンピュータウィルスに関連する情報を含むサイトを探し出したい場合がある。第1の選択肢は、コンピュータウィルスに関連する情報を専門とする特定のドメイン(www.computervirus.comなど)に直接アクセスし、そのドメイン内で関連の情報を含むドキュメント(www.computervirus.com/virusl.htmなど)を探すことである。より具体的には、ユーザは、ウェブブラウザのアドレスバーにURLwww.computervirus.comを入力してこうしたサイトに向かう。ユーザはそのサイトで、検索ダイアログボックスにキーワードを入力することができ、検索は、ユーザが選択できるドメインwww.computervirus.com内のドキュメントを返す。しかし、そのドメインの外部にある関連の情報は、ユーザには返されない。例えば、ドメインwww.compvirus.comを持つ関連のページは、ドメインwww.computervirus.com内にはないため返されない。したがって、ユーザがドメインwww.computervirus.comの外部の関連のデータを取得するには、情報を含む他のドメインのURLアドレスを知っており、こうした特定のドメインを検索する必要がある。
あるいは、ユーザは、一般の検索エンジンにキーワードを入力することができる。検索エンジンは、WWWまたは他のサイトの集まり(イントラネットなど)の全体を検索し、キーワードに関連すると判定したサイトを返す。しかし、一般の検索エンジンは、ユーザの特定の興味にまったく無関係のかなりの数のサイトを返すことが多い。例えば、ユーザは、キ―ワード「ウィルス」を使用して検索した場合、コンピュータウィルスに関連する情報のみを得るのではなく、生物学的なウィルスおよびコンピュータウィルスに関連する情報を受信することになる。その後ユーザは、返された複数のサイトをスクロールし、それらがユーザの興味に関連するかどうかの判定を試みることができる。検索を行うと、一般の検索エンジンはかなりの量のサイトを返す可能性があるため、返された結果をスクロールするのは、極めて時間がかかり、ユーザをいらいらさせる可能性がある。ユーザは、ブール演算子の組合せを使用することによって検索を絞ることを試みることはできるが、関連の情報のみを含むサイトを返す適切なブール検索を構築することは難しい可能性がある。さらに、従来の一般的な検索エンジンの中には、キーワードに基づいてユーザが何を探しているかの推論を試みるものもある。例えば、ユーザが一般の検索エンジンに「ウィルス」という用語を入力すると、検索エンジンは、複数のサイトを、検索を絞るための提案と共に返すことができる。より詳細には、検索エンジンは、「コンピュータウィルスを探したいですか」、「生物学的ウィルスを探したいですか」など、複数の提案を返すことができる。多くの検索(特により詳しく具体的な検索の場合)では、この従来の方法は、提案された検索の連続的な階層を選択する必要があり、返されたサイトは、依然として関連の情報に不足している可能性がある。さらに、ユーザは、返された検索の提案に含まれていないサイトを探し出すことを望むかもしれない。
いくつかの文献に上述のような従来の技術に関連した技術内容が開示されている(例えば、特許文献1、2参照)。
米国特許第6,718,324号明細書 米国特許第6,704,729号明細書
したがって、当分野では、一般の検索エンジンによって行われる検索に関連する利益を犠牲にすることになく、ドメイン限定の検索において見られるように焦点を絞った結果を提供する検索システムおよび/または方法が強く求められている。
本発明は、このような状況に鑑みてなされたもので、その目的とするところは、焦点を絞った検索のためのシステムの構築および使用を実現した、検索を容易にするシステム及び焦点を絞った検索を行う方法を提供することにある。
以下に、本発明のいくつかの態様を基本的に理解できるようにするために、本発明の簡単な概要を示す。この概要は、本発明の広範な全体像ではない。本発明の鍵となる/重要な要素を識別するためのもの、または本発明の範囲を規定するためのものではない。単に、後述するより詳細な説明の前置きとして、本発明の一部の概念を簡単な形で提示するためのものである。
本発明は、特定のトピック、個々のサブセット、または他の任意の適したサイトのグループに関連するドメインおよび/またはパスの部分母集団のグループ(以下まとめて単に「サイト」と呼ぶ)を使用して、インターネットの検索に関する改良を促進する。以下、こうしたサイトは、ユーザによって取り出すことができるドキュメントページを含む。例えば、サイトの部分母集団は、一般にこうしたサイトを見る個人の年齢層、こうしたサイトを見る個人の政治的所属、こうしたサイトを見る個人の地理的場所、こうしたサイトを見る個人の宗教などに基づいて選択し、グループ分けすることができる。例えば、関連サイトの部分母集団は、望ましくはユーザによって検索される特定のトピックに関連し得る。より詳細には、10歳から20歳の間のユーザは、40歳から50歳の間のユーザと異なるサイトを探す可能性があり、第1の政治的所属に関する個人は、一般に対立する政治的所属の個人と異なるサイトを探す。別の例では、サイトの集まり(インターネットなど)は、概念上複数のトピックとみなすことができ、あるトピックは、そのトピックに関連するサイトの集まり内のサイトによって定義される。特定のトピックに関連する情報を探すとき、検索を行う前にそのトピックに関連するとすでにわかっているサイトのリストを所有することが有益となる。本発明は、トピック、個人の年齢、個人の政治的所属、個人の地理的場所などによってグループ分けすることができるサイトのリストをコンパイルするシステムおよび/または方法を示し、さらに、列挙されたサイトのそれぞれに関連性の重みを割り当てるシステムおよび/または方法を開示する。読みやすくするために、以下、「トピック」という用語を使用して、「トピック」の従来の定義のみではなく、他のグループの関連サイト(特定の年齢幅、地理的場所との関連性によりグループ分けされたサイトなど)も指す。特定のトピックまたはグループに関連する関連性により重み付けされたサイトのこの集まりを以下サブウェブと呼ぶ。インターネット上で情報が変更されたとき、ユーザのプリファランス(preferences)が変更されたとき、または他の任意の適した理由のために、サブウェブを変更して最新のままの状態を維持することができる。さらにサブウェブは、(ハードドライブ、CD(compact disc)、DVD(Digital Versatile Disc)などに)格納し、複写し、ユーザ間で転送することができる。
本発明の一態様によれば、サブウェブは、サブウェブによって表されるトピックに関連するサイトのリストを含み、サブウェブ内の各サイトに、トピックとのサイトの関連性によって、バイアスされた(biased)重みが割り当てられる。したがって、例えば、サブウェブによって表されるトピックとの関連性が高いことがわかったサイトに割り当てられる関連性の重みは、トピックとの関連性が低いことがわかったサイトより高くなる。その後、一般の検索エンジンは、1つまたは複数のトピック限定のサブウェブを使用して、検索を絞りやすくすることができる。より詳細には、適切に検索を絞るために1つまたは複数のサブウェブを選択して、検索クエリを一般の検索エンジンに入力することができる。その後、検索の結果を、サブウェブを定義するサイトに割り当てられた関連性の重みと共に、従来の検索エンジンのランク付けシステムに基づいて判定することができる。例えば、サブウェブ内に存在する検索エンジンによって返されるサイトは、割り当てられた関連性の重みのランク付けに対応するランクが上がる。本発明の別の態様によれば、一般の検索エンジンから返された複数のサイトは、検索を絞るために選択されたサブウェブによって含まれていないため破棄される。また、本発明は、分類された/クラスタ化された検索エンジンの返した結果をユーザに提示するために使用することもでき、返された結果の所与の組について、それぞれ特定の異なるサブウェブの一部であるサイトの複数のサブセットをまとめる(binned)ことができる。例えば、健康および医学に関連するサブウェブ、およびコンピュータに関連するサブウェブが存在し、これらを検索エンジンと共に使用することができる。「ウィルス」のクエリを検索エンジンに入力した場合、医学に関連する結果およびコンピュータに関連する結果を分類し、ユーザに別々に表示することができる(例えば健康および医学のサブウェブ内のサイト、およびコンピュータのサブウェブ内のサイトを、状況に応じてグループ分けすることができる)。
本発明の一態様によれば、サブウェブは、特定のトピックに関連するクエリ用語のリストを使用して作成することができる。例えば、トピック限定のウェブサイトに関連するクエリログからのクエリをクエリ用語のリストとして使用することができる。その後、複数の異なるトピック関連のクエリ用語を使用しながら、一般の検索エンジンを使用して複数の検索を行うことができる。クエリ用語は特定のトピックに関連するため、異なるクエリ用語ごとにトピックに関連するウェブサイトが複数回返される(例えば、異なるクエリ用語を使用したとき、同じウェブサイトが返される)。さらに、本発明は、(例えば検索で返されたサイトに/からインリンクされた、およびアウトリンクされたサイトなど)近接するサイトを調査し、対象のトピックに関するそれらの関連性を判定することを企図する。トピックとの特定のサイトの関連性を示す重みが、返された検索内のサイトに割り当てられる。重みは、複数の異なるトピック関連の検索用語を使用したときにサイトおよび/または近接するサイトが返された回数に少なくとも部分的に基づいて計算することができる。さらに、少なくとも部分的にユーザのプロパティに基づいてサブウェブを作成することができる。例えば、検索エンジンのユーザの年齢/性別/場所などがわかっている場合、こうした年齢/性別/場所などの特徴のサブウェブを構築することができる。より詳細には、現在テキサスに住んでいる20〜30歳の男性によって使用されるサブウェブを構築することができる。さらに、サブウェブ内のサイトに対応する重みは、少なくとも部分的に、個々のユーザの前の検索、ブラウズの履歴、結果ページの内容などを基にすることができる。
本発明の別の態様によれば、ウェブクローラ(crawler)は、WWW上のどのページにアクセスすべきかの判定に関してサブウェブを使用することができる。例えば、ウェブクローラは、人気のないサブウェブ内にあるページ、またはサブウェブと共にまったく使用されていないページと比べて、人気のあるサブウェブ内のページにより頻繁にアクセスする。
上記および関連の目的を達成するために、本発明のいくつかの態様の例を、以下の説明および添付の図面との関連で本明細書に記載している。しかし、これらの態様は、本発明の原理を使用し得る様々な方法のほんの一部を示しているにすぎず、本発明は、こうしたすべての態様およびその均等物を含むものとする。本発明の他の利点および新規の特徴は、本発明の以下の詳細な説明を図面と併せ読めば明らかになる。
本発明によれば、焦点を絞った検索のためのシステムの構築および使用を実現できる。
次に、本発明を図面との関連で説明する。図中、図面を通じて同様の要素には同様の参照番号を付す。以下の説明では、説明上、本発明を完全に理解できるようにするために様々な特定の詳細を記載している。しかし、こうした特定の詳細なしに本発明を実施できることは明らかである。他の例では、本発明を説明しやすくするために、周知の構造および装置をブロック図の形で示している。以下、図面を参照して本発明を適用できる実施形態を詳細に説明する。
本出願で使用する場合、「コンポーネント」、「ハンドラ」、「モデル」、「システム」などの用語は、ハードウェア、ハードウェアおよびソフトウェアの組合せ、ソフトウェア、または実行中のソフトウェアのいずれかのコンピュータ関連のエンティティを指すものとする。例えば、コンポーネントは、それだけには限定されないが、プロセッサ上で動作するプロセス、プロセッサ、オブジェクト、実行可能ファイル、実行のスレッド、プログラム、および/またはコンピュータとすることができる。例として、サーバ上で動作するアプリケーションおよびサーバはいずれもコンポーネントである。1つまたは複数のコンポーネントがプロセスおよび/または実行のスレッド内に存在する可能性があり、1つのコンポーネントを1つのコンピュータ上に配置する、および/または2つ以上のコンピュータの間に分散することができる。また、これらのコンポーネントは、様々なデータ構造を格納している様々なコンピュータ可読媒体から実行することができる。コンポーネントは、例えば1つまたは複数のデータパケットを有する信号によるなど(例えば信号を介して、ローカルシステム、分散システムにおいて他のコンポーネントと、かつ/またはインターネットなどのネットワークを介して他のシステムと対話する1つのコンポーネントからのデータなど)、ローカルおよび/またはリモートのプロセスを介して通信することができる。
次に図1を参照すると、サイトの集まりにわたって検索を行うときに精度および効率の向上を促進するシステム100を示している。システム100は、ユーザのクエリに関連する情報についてのインターネットの検索に関して使用される。しかし、インターネットは単に、本発明によって検索することができるサイトの集まりの一例にすぎないことを理解されたい。インターネットであろうと、イントラネットであろうと、他のどこかであろうと、本発明を使用すれば、その上の任意のサイトの集まりを検索することができる。例えば、本発明との関連で、クライアントのハードドライブに格納されるサイトの集まりを検索することができる。本発明は、概念上、複数のドメイン(www.domain.comなど)、パス(www.domain.com/パスなど)、ドメインおよび/またはパスのクラスタ、およびインターネット上に配置される他の適したサイトの、データストア108内に格納される近接する関連のサイトまたはサブウェブ102〜106へのパーティショニングを介した従来の検索技術を改良する。各サブウェブ102〜106は、ユーザにとって興味のある特定のトピックに関連しており、したがってそのトピックに関連する複数のサイト(ドメイン、パス、ドメインおよび/またはパスのクラスタなど)を含む。例えば、サブウェブ102は、自動車に関連する可能性があり、したがってサブウェブ102内に含まれる各サイトはすべて、自動車のトピックに関連する。インターネット(または他の任意のサイトの集まり)は、任意の数のトピックの集まりとみなすことができ、2つ以上のトピックが関連の情報を含むことができることを理解されたい。したがって、関連のトピックを表す異なるサブウェブが同じサイトを複数含むことができる。さらに、1つのサブウェブが完全に別のサブウェブを含むことができる。サブウェブ102〜106は、単に説明上互いに完全に分離されたものとして示されているにすぎず、こうした分離は、本発明の範囲を限定するものと解釈されないものとする。さらに、サブウェブを、少なくとも部分的に検索エンジンのユーザの特徴に基づいて作成することができる。例えば、特定の年齢幅内の個人によって一般に検索されるサイトを含むサブウェブを作成することができる。また、ユーザの場所、ユーザの性別、ユーザの政治的所属、人種など、他のユーザの特徴を使用して、こうしたユーザの特徴に関連するサイトを含むサブウェブを作成することもできる。
サブウェブ102〜106内のサイトは、サブウェブ102〜106が表すトピックおよび/またはユーザの特徴との関連性によって重みによりバイアスされる。例えば、サブウェブ104は、N個のサイトおよびN個の重みを含む。ここではNは整数である。各サイトは、サブウェブ104内の他の重みと集合的に比較したとき、サブウェブ104のトピックとのサイトの関連性を示すことができる重みに関連付けられている。より詳細には、サブウェブ104内のサイト1には重み1の重み、サイト2には重み2の重みが割り当てられる。したがって、重み1を重み2と比較することによって、2つのサイトのどちらが有するサブウェブ104のトピックとの関連性がより高いかに関する判定を行うことができる。さらに、サブウェブ102〜106を、ユーザプロファイルの一部、および/または独立したオブジェクトとしてデータベース内に格納することができる。例えば、データストア108は、ウェブサイトを介してアクセス可能とすることができる。ウェブサイトにアクセスし、ユーザ識別情報(ユーザ名やパスワードなど)を入力すると、検索に関してサブウェブ102〜106を取り出し、使用することができる。また、サブウェブ102〜106を、オブジェクトとして格納して、異なるユーザに転送して各自で使用することができる(例えばサブウェブ102〜106を電子メールに添付し、異なるユーザによって使用することができる)。さらに、特定のニーズを満たすように、サブウェブ102〜106を複数のユーザによってカスタマイズすることができる。
システム100は、サブウェブ102〜106を使用して、1つまたは複数のトピックに関連するサイトの集まり(インターネットなど)にわたって焦点を絞った検索を行う。サブウェブ102〜106内のサイトは、特定のトピックに関連しているが、1つの特定のドメインに限定されないため、ユーザは、無関連の情報が氾濫する恐れなしにトピックの情報を確信を持って探すことができる。システム100は、検索中に使用する1つまたは複数のサブウェブを選択するサブウェブセレクタ110を含む。本発明の一態様によれば、サブウェブセレクタ110を、ユーザのディスプレイ112に提示されるユーザインタフェース(図示せず)に関連付けることができ、ユーザインタフェースによってユーザは、トピックの情報の検索に関して使用する所望のサブウェブを選択することができるようになる。本発明の別の態様によれば、サブウェブセレクタ110は、サイトの集まりまたは検討している現在のサイト(ウェブサイトなど)上のエントリポイントに基づいて、情報の検索に関連して使用する1つまたは複数のサブウェブを自動的に選択することができる。例えば、ユーザが現在自動車の購入に関するサイトにいるとき、サブウェブセレクタ110は、自動車に関連するトピックを含む1つまたは複数のサブウェブを自動的に選択することができる。さらに、サブウェブセレクタ110は、一般の検索エンジンおよび/またはユーザの履歴に入力されたクエリ用語に基づいて適切なサブウェブを選択することができる。例えば、ユーザは、コンピュータ支援ページを調べた履歴があり、「ウィルス」という用語を検索エンジンに入力すると、サブウェブセレクタ110は、生物学的な疾病に関連するサブウェブを選択するのではなく、コンピュータに関連するサブウェブを選択することができる。
サブウェブセレクタ110は、検索クエリを受信する検索コンポーネント114と共に動作する。例えば、検索コンポーネント114は、一般の検索エンジンとすることができ、クエリは、ユーザ、コンピュータプログラムなどから行うことができる。サブウェブセレクタ110は、検索コンポーネント114が検索クエリを受信する前、または検索コンポーネント114が検索クエリを受信した後に、1つまたは複数のサブウェブを選択することができる。例えば、ユーザが検索に関して使用する1つまたは複数のサブウェブを手動で選択した場合、サブウェブは、検索クエリの受信前に選択される。しかし、サブウェブセレクタ110が検索クエリを使用して選択すべきサブウェブを判定する場合、こうした選択は、明らかに、検索コンポーネント114が検索クエリを受信するまで完了されない。
検索クエリを受信すると、検索コンポーネント114は、こうしたクエリによって情報を探し、検索に関して選択されたサブウェブが使用される。サブウェブ104は、選択されたサブウェブとして示されているが、サブウェブセレクタは、使用可能な任意のサブウェブまたはサブウェブの組合せを選択して検索を助けることができることを理解されたい。本発明の一態様によれば、検索は、選択されたサブウェブ106に含まれるサイトにわたってのみ行うことができる。これによって一般の検索エンジンは、既存の検索アルゴリズムを使用しても、サブウェブ106によって表されるトピックに関連するとわかったサイトのみを返すことができる。同様に、検索コンポーネント114は、関連の情報についてインターネット全体(または他の適したサイトの集まり)を検索することができ、ユーザに検索結果を返す前にサブウェブ104に存在しない返されたサイトを削除することができる。検索コンポーネント114によって探し出され、削除されていない結果を、ディスプレイ112を介してユーザに提供することができる。
本発明の別の態様によれば、検索コンポーネント114によって探し出したサブウェブ104内のサイトに、割り当てられた重みに従ってプリファランス(preference)を与えることができる。より詳細には、検索コンポーネント114は、一般の検索エンジンとすることができ、検索クエリに基づいて従来のやり方でサイトを探し出し/ランク付けすることができる。サブウェブ104内に存在する検索コンポーネント114によって探し出されたサイトを、その後、割り当てられた関連性の重みに従って格上げすることができる。したがって、検索コンポーネント114によって使用される従来のランク付けシステムおよび/または方法を、サブウェブ104内のサイトの重み付けと一体化することができる。したがって、例えば、従来の検索方法を使用すると、4番目に列挙されているサブウェブ104内のサイトを、検索クエリとの関連性がより高いことを示す位置に格上げすることができる。したがって、従来のランク付けシステムの機能およびサイトに割り当てられた重みを使用して、検索結果がランク付けされる。次いでランク付けされた、探し出された結果を、ディスプレイ112を介してユーザに提供することができる。さらに、ランク付けおよびフィルタリングの組合せを、検索結果のユーザへの提供に関して使用することができる。
次に図2を参照すると、1つまたは複数の対象のトピックエリアにわたって焦点を絞った検索を容易にするシステム200を示している。また、システム200は、ユーザの特徴(性別、人種、場所、年齢など)によってフィルタ付けされた検索を容易にする。システム200は、ユーザからアクセス可能なデータストア204内にあるサブウェブ202を使用することによってサイトの集まりにわたって検索する。サブウェブ202は、N個のサイトを含む。この場合Nは整数である。サイトは、ドメイン、パス、サイトのクラスタ、または他の同様のサイトとすることができる。サブウェブ202内のN個のサイトのそれぞれは、サブウェブ202によって表されるトピックおよび/またはユーザの特徴に関連する情報を含み、N個のサイトのそれぞれに、トピックおよび/またはユーザの特徴とのその関連性を示す重みが割り当てられる。より詳細には、サイト1には重み1の重みが、サイト2には重み2の重みが、サイトNには重みNの重みが割り当てられる。したがって、重み1を重み2と比較することによって、サブウェブ202によって表されるトピックとの関連性についてサイト2よりサイト1の方が高いかどうかに関する情報が得られる。
システム200は、トピックに基づいて、バイアスされた、かつ/またはフィルタ付けされた検索に関して使用する1つまたは複数のサブウェブを選択するサブウェブセレクタ206を含む。データストア204は、サブウェブのみを含むものとして示されているが、焦点を絞った検索を行うときに、適した任意の数のサブウェブを生成し、使用することができることを理解されたい。この例では、サブウェブセレクタ206は、サブウェブ202を選択している。サブウェブセレクタ206は、どのサブウェブが選択されたかに関する情報をディスプレイ208に中継することができる。システム200は、クエリに応答して、少なくともサブウェブ202内に含まれるサイトにわたって検索を行う検索コンポーネント210をさらに含む。本発明の一態様によれば、検索コンポーネント210は、従来のやり方で動作し、クエリの検索用語に関してサイトの集まり全体(例えばインターネット全体)にわたって検索する。その後、サブウェブ202内に含まれていない返されたサイトを削除する、または返されたサイトを、サブウェブ202内のサイトに割り当てられた重みと共に、従来のランク付け方法によってランク付けすることができる。したがって、検索コンポーネント210によって探し出され、サブウェブ202内に含まれるサイトは、ランクが上がり、検索コンポーネント210によって探し出され、サブウェブ202内に含まれていないサイトは、ランクは上がらない。したがって、サイトのランク付けは、従来の検索エンジンのランク付け方法の機能、およびサブウェブ202内のサイトに割り当てられた重みとすることができる。ランク付けされた結果は、次いで検索コンポーネント210からディスプレイ208に中継することができる。
システム200は、(例えばサブウェブ202がサブウェブセレクタ206によって選択される前および/または選択された後などに)サブウェブ202の変更/カスタマイズを容易にするチューニング(tuning;調整)コンポーネント212に関連付けることができる。例えば、チューニングコンポーネント212を使用して、ユーザインタフェース214を介してサブウェブ202に特定のサイトを追加し、サブウェブ202から特定のサイトを取り除くことができる。これは、ドメインおよび/またはパスの名前が変更されたとき、サイトがインターネットに追加された、またはそこから削除されたとき、サイトの内容が変更されたときなどに有益となり得る。したがって、チューニングコンポーネント212は、ユーザがサブウェブ202の内容を手動で変更することができる機構を提供する。本発明の別の態様によれば、チューニングコンポーネント212を使用して、サブウェブ202を自動的に維持することができる。例えば、チューニングコンポーネント212は、クローラ(図示せず)と共に動作して、サブウェブ202内のサイトを最新に保つことができる。より詳細には、クローラは、サブウェブのリスト、およびサブウェブ内に含まれるサイトにアクセスすることができる。サイトの集まり(インターネット、イントラネット、サーバ、クライアントハードドライブなど)内にいったん存在したサイトがもはや存在しないと判定すると、クローラは、サブウェブ内のサイトを探して、こうしたサイトが1つまたは複数のサブウェブ内に存在する場合は、それらを削除することができる。同様に、クローラは、新しく作成されたサイトを探し出し、チューニングコンポーネント212にこうした新しいサイトを知らせることができる。その後、チューニングコンポーネント212は、インリンク、アウトリンク、サイト内の検索用語の存在、サイトが関連のドメインの一部であるかどうか、および他の適した標識に基づいて、サイトが1つまたは複数のサブウェブ内に含まれるべきかどうかを判定することができる。同様に、クローラは、サブウェブ202内のサイトが変更されたと判定することができ、チューニングコンポーネント212は、例えばキーワードを探す、インリンクおよび/またはアウトリンクを調べるなどによってサイトが依然としてサブウェブ202によって表されるトピックと関連していることを確認するために変更を調べることができる。チューニングコンポーネント212は、人工知能/機械学習アルゴリズムを使用してサブウェブ202を維持することもできる。
また、チューニングコンポーネント212は、サブウェブ202内のサイトに割り当てられた重みのカスタマイズを容易にする。例えば、重みを各サイトに自動的に割り当てるアルゴリズムは、サブウェブ202によって表されるトピックとの関連性はサイト2よりサイト1の方が高いと判定することができる。しかし、過去の存在および嗜好に基づいて、ユーザは、サブウェブ202によって表されるトピックおよび/またはユーザの特徴との関連性はサイト1より高くなるような方法でサイト2に重みを付けるべきであると判定することができる。したがってユーザは、ユーザインタフェース214を使用して特定のサイトの重み付け(スライドバー、テキスト入力ボックスなど)を変更することができる。したがってユーザは、嗜好および経験によってサブウェブをカスタマイズすることができる。重みは、人工知能/機械学習アルゴリズムによっても変更することができる。
次に図3を参照すると、1つまたは複数の特定のトピックおよび/またはユーザの特徴に関して改良された検索を提供するシステム300を示している。システム300を、1つまたは複数の特定のトピックおよび/または1つまたは複数のユーザの特徴304〜308に関連する情報についてのサイト302の集まり(インターネット、イントラネット、サイトのデータストアなど)の検索に関して使用し、サブウェブは、1つの特定のトピックおよび/または1つまたは複数のユーザの特徴を表す。サブウェブは、サブウェブによって表されるトピックおよび/またはユーザの特徴と関連する複数のサイト(ドメイン、パス、クラスタなど)を含み、サイトは、関連性に従って重みによりバイアスされる。したがって、サブウェブによって表されるトピックおよび/またはユーザの特徴との関連性が高いサイトは、サブウェブによって表されるトピックおよび/またはユーザの特徴との関連性が低いサイトより重みが高くなる。
サブウェブセレクタ310は、1つまたは複数のサブウェブによって表される1つまたは複数の特定のトピックおよび/またはユーザの特徴304〜308に関連する情報についてのサイトの集まり302の検索に関して使用する1つまたは複数のサブウェブを選択する。本発明の一態様によれば、サブウェブセレクタ310は、ユーザプロファイル314を含むデータストア312にアクセスすることができる。データストア312は、ハードドライブ、ランダムアクセスメモリ、読取り専用メモリ、リムーバブル媒体、およびCD−ROMなどのデータ記憶装置とすることができる。ユーザプロファイル314は、トピック情報および/または特定のユーザの特徴に関連する情報についてのサイトの集まり302の検索に関して使用することができる1つまたは複数のサブウェブ316を含む。例えば、データストア312(およびしたがってサブウェブ316)には、ネットワーク接続を介してアクセスすることができる(データストア312は、ウェブサイトを介してアクセス可能なオンラインデータストアとすることができる)。その後、例えばユーザ名およびパスワードをウェブサイト上で入力することによってユーザプロファイル314にアクセスすることができる。こうした一態様によってユーザは、1つまたは複数のサブウェブ316をユーザプロファイル314内に格納でき、ユーザがネットワーク接続を取得するために使用できる任意の端末からサブウェブ316にアクセスできるようになる。したがってサブウェブ316は、1つまたは複数のトピックおよび/またはユーザの特徴304〜308に関連するサブウェブを含むことができ、こうしたサブウェブ316を、トピック情報およびこうしたユーザの特徴に関連する情報についてのサイトの集まり302の検索に関して使用することができる。
検索コンポーネント318は、検索クエリおよび選択されたサブウェブに基づいてサイトの集まり302を検索する。検索コンポーネント318は、検索コンポーネント318を介して探し出されたサイトをランク付けするランク付けコンポーネント320を含む。ランク付けコンポーネント320は、従来の検索エンジンアルゴリズムを、サブウェブ316内のサイトに割り当てられた重みと共に使用して、探し出されたサイトをランク付けすることができる。例えば、検索コンポーネント318によって探し出され、サブウェブ316によって含まれるサイトは、サイトの対応する重みに従ってランクが上がり、検索コンポーネント318によって探し出され、サブウェブ318内に含まれていないサイトは、ランクは上がらない。検索コンポーネント318がサイトを探し出し、ランク付けコンポーネント320によってサイトのランク付けを行うと、結果をディスプレイ322に提供することができる。
検索コンポーネント318は、ユーザがサイトの集まりにわたる将来の検索を向上させることができるフィードバックコンポーネント324も含む。フィードバックコンポーネント324は、検査に関連する調査をユーザに提供し、または検査に関連するコメントをユーザから受け取ることができ、ユーザは、システム300に関連付けられたユーザインタフェース326を介してフィードバックコンポーネントと通信することができる。例えば、ユーザはクエリを検索コンポーネント318に提供し、サブウェブセレクタ310を使用して1つまたは複数のサブウェブ316を選択して、トピック/ユーザの特徴304〜308のうちの1つに対して検索を絞ることができる。検索コンポーネント318は、選択されたサブウェブ316内にあるサイト、およびサブウェブ316内にはない、ユーザのクエリに従って関連があるとわかったサイトを返すことができる。次いでランク付けコンポーネント320は、返されたサイトにランク付けをすることができ、重みに従って選択されたサブウェブ316内の返されたサイトのランクを上げる。サブウェブ316によって表されるトピックと無関係であるとユーザが感じたサイトがユーザに返されると、ユーザは、フィードバックコンポーネント324を使用して選択されたサブウェブ316を使用する将来の検索からこうしたサイトを除外することができる。ユーザは、ユーザインタフェース326を介して、より特定のフィードバックをフィードバックコンポーネント324に中継することもできる。例えば、ユーザは、検索に関して選択されたサブウェブ316を使用するときに、特定の日および/または特定の時刻に特定のサイトの受信することのみを望んでいることをフィードバックコンポーネント324に知らせることができる。別の例では、ユーザは、特定のサブウェブを使用して焦点を絞った検索を行っているときはいつでも、特定のサイトのインリンクおよび/またはアウトリンクを受信することが望ましいことをフィードバックコンポーネント324に知らせることができる。フィードバックコンポーネント324は、暗黙のユーザフィードバックを収集することもできる。例えば、ユーザがアクセスした返されたサイトを使用して、サブウェブ316内のそれぞれの重みを格上げすることができる。したがって、時間が経つにつれて、ユーザは、嗜好に従って特定のサイトまたはトピックに関して検索をカスタマイズすることができる。
1つまたは複数のサブウェブ(1つまたは複数のサブウェブ316など)を変更し、カスタマイズするために、ユーザインタフェース326と共にチューニングコンポーネント328を提供することもできる。例えば、チューニングコンポーネント328を使用して、特定のサイトをサブウェブ内に追加し、かつ/またはサブウェブから削除し、またサブウェブ内のサイトの重みを変更することができる。ユーザは、ユーザインタフェース326を使用して、サイトを手動で追加および/または削除し、異なるサイトに対応する重みを変更することができる。本発明の別の態様によれば、チューニングコンポーネント328を使用して、1つまたは複数のクローラ(図示せず)と通信することによってサブウェブを自動的に維持することができる。例えば、クローラは、チューニングコンポーネント328に、1つまたは複数のサブウェブ内の1つまたは複数のサイトが変更された、または削除されたことを知らせることができる。同様に、クローラは、1つまたは複数のサイトがサイトの集まり302に追加されたときにチューニングコンポーネント328に知らせることができる。より詳細には、クローラは、1つまたは複数のサイトがインターネットまたはイントラネットに追加されたときにチューニングコンポーネント328に知らせるウェブクローラとすることができる。
次に図4を参照すると、1つまたは複数の特定のトピックおよび/またはユーザの特徴に関してサイトの集まりの検索を容易にするシステム400を示している。システム400を使用して、1つまたは複数のトピックおよび/またはユーザの特徴に関する情報についてサイトの集まり(インターネット、イントラネットなど)を検索する。1つまたは複数のトピック/ユーザの特徴は、データストア404内に格納されている1つまたは複数のサブウェブ402によって表される。サブウェブ402は、サブウェブ402が表すトピック/ユーザの特徴と関連するサイトの集まり内で見つけることができる複数のサイトを含む。サブウェブ402内の各サイトは、サブウェブによって表されるトピック/ユーザの特徴との関連性に従って重み付けされる。例えば、関連性の高いサイトにはそれだけ高い重みが付けられる。
システム400は、望ましくは検索を絞るために使用される1つまたは複数のサブウェブの選択を容易にするサブウェブセレクタ406を含む。サブウェブセレクタ406は、ユーザが焦点を絞った検索に関して使用する特定のサブウェブを手動で選択することができるユーザインタフェース408に関連付けることができる。本発明の別の態様によれば、サブウェブセレクタ406は、サイトの集まり(インターネットなど)内のエントリポイントに少なくとも部分的に基づいて選択すべきサブウェブを判定することができる。さらに、サブウェブセレクタ406は、少なくとも部分的にクエリ、ユーザの履歴、ユーザの状態、および/またはユーザの状況に基づいてどのサブウェブを選択すべきかを推論する(infer)ことができる人工知能コンポーネント410に関連付けることができる。
本明細書で使用する場合、「推論(inference)」という用語は、一般に、イベントおよび/またはデータを介して捕捉された1組の観測結果からシステム、環境、および/またはユーザの状態について推論する、または推論するプロセスを指す。推論は、例えば、特定の状況または動作を識別するために使用したり、状態にわたる確率分布を生成したりすることができる。推論は、確率的、つまりデータおよびイベントの考察に基づく対象の状態にわたる確率分布の計算とすることができる。推論は、1組のイベントおよび/またはデータからより高いレベルのイベントを構成するために使用される技術を指すこともできる。こうした推論によって、イベントが時間的に接近して相関していようとそうでなかろうと、またイベントおよびデータが1つのイベントおよびデータソースからのものであろうと複数のものからであろうと、1組の観測されたイベントおよび/または格納されたイベントデータから新しいイベントまたは動作が構築される。様々な分類方式および/またはシステム(サポートベクトルマシン、ニューラルネットワーク、エキスパートシステム、ベイズ信念(belief)ネットワーク、ファジーロジック、データフュージョンエンジン(data fusion engine)など)を、本発明との関連において自動式のおよび/または推論された動作の実行に関して使用することができる。
したがって例えば、人工知能コンポーネント410は、ユーザを監視し、特定のユーザの状態および状況を考慮して、ユーザの望みを時間にわたって「学ぶ」ことができる。例えば、ユーザは一般に、特定の時間の間、および/またはユーザが特定の場所にいるときにインターネット検索に関してサブウェブの特定のサブセットを使用することができる。人工知能コンポーネント410は、様々なセンサ412からデータ(時刻、ユーザの場所など)を受信し、こうしたデータを使用して適切な推論を行うことができる。さらに、人工知能コンポーネントは、特定のサブウェブを選択することをサブウェブセレクタ406に通知することに関してコスト/費用分析を使用することができる。より詳細には、人工知能コンポーネントは、1つまたは複数の正しいサブウェブを選択することをサブウェブセレクタ406に知らせる利益を、1つまたは複数の正しくないサブウェブを選択する、または望ましいサブウェブを除外することをサブウェブセレクタ406に知らせるコストと比較することができる。
検索コンポーネント414は、検索クエリを受信し、1つまたは複数の選択されたサブウェブと共に、検索クエリに起因するサイトを探し出し、それをランク付けする。検索コンポーネント414は、1つまたは複数の選択されたサブウェブ内のサイトに割り当てられた重みと共に、従来の検索エンジンのランク付けシステムおよび/または方法を使用して、検索結果をランク付けすることができる。次いでこうした結果を、ディスプレイ418を介してユーザに中継することができる。検索コンポーネント414は、人工知能コンポーネント410と通信して、より正確な検索を提供することもできる。例えば、ユーザの状況が変わるとサブセット内の特定のサイトによってユーザの嗜好は変わり得る。例えば、天気情報を探しているユーザは、第1の地理的場所にいるとき、インターネット上の天気に関連する第1のサイトを好み、第2の地理的場所にいるとき、インターネット上の天気に関連する第2のサイトを好むかもしれない。人工知能コンポーネントは、ユーザを監視し、ユーザの状況が変わると、1つまたは複数のサブウェブ内のどのサイトをユーザが好むかを学ぶことができる。センサ412を使用して、人工知能コンポーネント410にユーザの状況の変化を通知することができる。
システム400は、1つまたは複数のサブウェブ(サブウェブ404など)を変更するために使用できるチューニングコンポーネント420をさらに含む。例えば、ユーザは、ユーザインタフェース408を介してサブウェブ402にアクセスし、サブウェブ内のサイトに変更を加えること(サイトの追加、削除、重みの変更など)ができる。さらに、チューニングコンポーネント420は、人工知能コンポーネント410と共に動作して、サブウェブ402を自動的に調整する(tune)ことができる。例えば、サブウェブ402は、最初に、そのサイトがサブウェブ402によって表されるトピックとの関連性が高いことを示す対応する重みを備えたサイトを含むことができる。しかし、サブウェブ402を使用して検索を行うとき、ユーザは、たとえランク付けが高くてもそのサイトをめったに選択しない。人工知能コンポーネント410は、ユーザの状態および状況に関してある期間にわたってユーザの行動を監視し、ユーザがどのサイトを好むかを学ぶことができる。その後人工知能コンポーネント410は、特定のサブウェブ内の特定のサイトを調整すべきであることをチューニングコンポーネント420に知らせることができる。人工知能コンポーネント410は、サブウェブ402に対する正しい変更を加える確率を判定し、こうした確率を考慮して正しい変更の利益に対するサブウェブ402の誤った変更のコストを測定することができる。
次に図5を参照すると、1つまたは複数のサブウェブを使用することによってトピック検索を行う方法500を示している。説明を簡潔にするために、方法500を一連の動作として示し、説明しているが、一部の動作は、本発明によれば、異なる順序で、かつ/または本明細書に示し説明した他の動作と同時に行うことができるため、本発明は動作の順序によって限定されないことを了解し、理解されたい。例えば、方法を、代わりに相互に関係のある一連の状態またはイベントとして、例えば状態図などで表すことができることを当業者であれば了解し、理解されよう。さらに、本発明による方法を実施するのに示したすべての動作が必要であるとは限らない。
502で、ドキュメントの集まり(インターネット、イントラネット、ローカルハードドライブ上のサイトの集まりなど)のかなりの部分にわたって情報を探すことができる検索エンジンが提供される。検索エンジンは、検索クエリに基づいて検索結果を探し出し、ランク付けする従来のシステムおよび/または方法を含むことができる。504で、ユーザにとって興味のあるトピックを表す1つまたは複数のサブウェブが選択される。本発明の一態様によれば、ユーザが1つまたは複数の所望のサブウェブを手動で選択することができるユーザインタフェースを提供することができる。さらに、現在のクエリ、最近のクエリ、エントリポイント、およびユーザが検索を望むトピックの情報を提供し得る他の標識に基づいて1つまたは複数のサブウェブを選択することができる。本発明の別の態様によれば、ユーザの状態および状況を監視することができ、1つまたは複数のサブウェブを、少なくとも部分的にこうしたユーザの状態および状況に基づいて選択することができる。
506で、検索エンジンは、ユーザのクエリを受信する。クエリは、検索エンジンを使用するときの従来のようなブール値の形式、または検索エンジンがサイトの集まりにわたって検索を行うことができる他の任意の形式とすることができ、検索は、少なくとも部分的にクエリに基づいている。508で、検索はクエリに基づいて行われる。本発明の一態様によれば、ユーザは、検索を行う前に選択されたサブウェブ内のサイトのみにわたって検索を行うかどうかを決定することができる。これは、実装に応じて、少数のサイトのみが検索されるので、極めて高速の検索を可能にし得る。あるいは、ユーザは、検索エンジンがサイトの集まりのかなりの部分(インターネット全体など)にわたって従来の検索を行うことができるようにすることができる。
510で、選択されたサブウェブ内にはないサイトのすべてがフィルタにかけられるのが望ましいか、一部がフィルタにかけられるのが望ましいかに関する判定が行われる。選択されたサブウェブ内にはないサイトのすべてまたは一部がフィルタにかけられるのが望ましい場合、512でこうしたサイトがフィルタにかけられる。フィルタリングが望ましくてもそうでなくとも、514で、サブウェブ内のサイトに割り当てられた重みに従って結果に再度ランク付けすべきかどうかに関する判定が行われる。ユーザが単に従来の検索エンジンのランク付け技術を使用することを望む場合、516で、検索の結果がユーザに返される。しかし、従来の検索に起因するサイトのランク付けと共に、サブウェブ内のサイトに割り当てられた重みを考慮することが望ましい場合、518で、サイトの重みに従って検索結果が再度ランク付けされる。例えば、サブウェブ内において関連性が高いと重み付けされた、検索中に返されたサイトは、ランクが上がり、関連性がより高いことを示す検索結果内の位置(例えば4番目から1番目など)に移動される可能性がある。検索エンジンによって返された、サブウェブ内にないサイトは、ランクは上がらない。サブウェブ内のサイトに割り当てられた重みに従って検索結果に再度ランク付けがなされた後、516で再ランク付けを示す検索の結果がユーザに提供される。
次に図6を参照すると、1つまたは複数のサブウェブの変更を容易にする方法600を示している。602で、検索クエリが定式化され、検索エンジンに提供される。604で、1つまたは複数のサブウェブが使用されて、焦点を絞った検索がサイトの集まりにわたって行われる。例えば、ユーザが自動車のトピックに関連する情報を探すことを望んでいる場合、自動車に関連するサイトを含む1つまたは複数のサブウェブを使用して検索を絞ることができる。例えば、サブウェブは、自動車に関する一般的なものおよび/または具体的なものとすることができ、例えば自動車の特定のメーカー、自動車の販売、自動車の特定のスタイルに関連し得る。
606で、検索の結果およびサブウェブ内に含まれるサイトの対応する重みがユーザに表示される。したがってユーザは、以前の経験および現在の嗜好が与えられた場合、重みを再検討し、こうした重みの妥当性を判定することができる。608で、ユーザがサブウェブ内のサイトに割り当てられた1つまたは複数の重みを変更することを望んでいるかどうかに関する判定が行われる。ユーザにこうした望みがない場合、方法600は610で終了する。しかし、重みを変更したい場合、612でユーザインタフェースがユーザに提供されてこうした変更が行われる。例えば、スライドツール、データ入力の位置を含むデータテーブルなどをユーザに提示して、重みの変更を容易にすることができる。614で、ユーザは、サイトの重みに所望の変更を加え、それによって変更されたサイトに関連するユーザの嗜好に従って将来の検索をカスタマイズする。その後、方法が610で終了する。
簡単に図7を参照すると、インターネット700の異なる複数のトピックへの分割例を示している。サイトの集まりは、図7に関してインターネットとして示してあるが、任意の適したサイトの集まりを実質的に同様のやり方で分割できることを理解されたい。インターネット700は、異なる様々なトピックに分類することができる情報の集まりとみなすことができる。したがってインターネット自体を複数のトピックとみなすことができる。これらのトピックは、範囲が異なっていてよく、異なる2つのトピックが同じサイトおよび/または情報を含むことができる。例えば、「スポーツ」のトピック、および「ゴルフ」のトピックは、インターネット内に含まれ得る。ゴルフに関連する情報は、一般に明らかにスポーツに関連する。したがってゴルフおよびスポーツのトピックに関連するサブウェブは、それぞれ重なるサイトを含む。さらに、スポーツに関連するサブウェブは、ゴルフに関連するサブウェブを完全に含み得る。イントラネット(図示せず)も同様に複数のトピックに分割することができる。
インターネット700のこの分割例では、いくつかのトピックが識別されている。例えば、有機農業のトピック702、クラシックミュージックのトピック704、ゴルフのトピック706、旅行のトピック708、車のトピック710、Microsoft(登録商標)ヘルプおよびサポートのトピック712、Microsoft.Net技術のトピック714が識別されている。さらに、自動車のトピック710および旅行のトピック708は、少なくとも部分的に重なっており、Microsoft(登録商標)ヘルプおよびサポートのトピック712、およびMicrosoft.Net技術714もそうであることがわかる。これらの各トピック、および定義することができるインターネット700内に存在する他のトピックを表すサブウェブを作成することができる。
次に図8を参照すると、1つまたは複数のサブウェブの使用による特定のトピックおよび/またはユーザの特徴(characteristic(s))に関して焦点を絞った検索を可能にするユーザインタフェース800の例を示している。インタフェース800は、クエリ入力ポジション802を含み、ユーザはここに所望の検索クエリを入力することができる。サブウェブセレクタポジション804は、ユーザがサブウェブによって表されるトピック/ユーザの特徴の周囲に検索を絞るために使用される1つまたは複数のサブウェブを選択できるようにする。サブウェブセレクタポジション804および他のデータ入力機構をプルダウンメニューとして表しているが、1つまたは複数の入力の選択を可能にする任意の適した機構は、本発明によって企図され、本明細書に添付した特許請求の範囲内に含まれるものとすることを理解されたい。例えば、サブウェブセレクタポジション804は、一連のリンクとすることができ、各リンクの選択によって、検索に関して使用する対応するサブウェブを選択することができる。同様に、サブウェブセレクタポジション804は、サブウェブのそれぞれに関連付けられている選択可能なボックスを備える使用可能なサブウェブのリストとすることができる。したがって、ユーザは、ボックスを選択することによって、検索を絞ることに関して使用するサブウェブを選択する。特定のエンティティを選択するこれらの方法は例にすぎず、本発明の範囲を限定するものではない。
バイアス(bias)ポジション806によって、ユーザは、検索エンジンが従来の検索システムおよび/または方法によって検索結果をランク付けすべきか、あるいは選択されたサブウェブ内に含まれるサイトに関連付けられた重みを考慮するかを判定することができる。さらに、バイアスポジション806によって、ユーザは、選択されたサブウェブ内に存在しない少なくとも1つの返されたサイトを削除することができる(例えばユーザは、選択されたサブウェブ内に存在しない返されたサイトに関してフィルタリングのレベルを選択することができる)。結果セットサイズセレクタ(result set size selector)808は、ユーザに返される結果の数を判定するために使用する。
クエリをクエリ入力ポジション802に入力し、サブウェブセレクタポジション804、バイアスポジション806、および結果サイズセレクタ808を介して他の所望の選択パラメータを選択すると、ユーザは、検索ボタン810を選択して、入力したパラメータに基づいて検索を行うことができる。ディスプレイポジション812は、検索から返された結果を示す。この例の図では、N個の結果が表示される。この場合Nは整数である。各結果は、結果の関連性をユーザに知らせる情報を含むことができる。例えば、結果は、検索を行うとき、従来のように、ページタイトル、およびページの内容の短い説明を含むことができる。また、結果は、結果が選択されたサブウェブ内にあるサイトであるかどうかをユーザに知らせるサブウェブインジケータを含むこともできる。例えば、結果が選択されたサブウェブ内のサイトである場合、それを第1の色で表示し、選択されたサブウェブ内に存在しないサイトである場合、第2の色で表示することができる。結果が選択されたサブウェブ内のサイトであるかどうかを示す他のシステムおよび/または方法が企図されており、本明細書に添付の特許請求の範囲内に含まれるものとする。ディスプレイ812上の結果は、結果が存在するドメインおよび/パスをユーザに知らせるためにそのページのURLを含むこともできる。さらに、選択されたサブウェブによって表されるトピックに関するサイトの関連性を示す重みを表示することができる。図示してはいないが、選択されたサブウェブ内のサイトの重みによるランク付けの変更をユーザに表示することができる。例えば、従来の検索エンジンは、結果1で表されるサイトに割り当てられた重みがない場合、最高の結果として(第1のサイトを表す)結果3を返すことになる。したがって、選択されたサブウェブ内のサイトの重み付けによるランクの変更をユーザに表示することができる。
次に図9を参照すると、トピック限定および/または特徴限定のサブウェブの生成を容易にするシステム900を示している。システム900は、特にコンピュータに強いわけではないコンピュータユーザによって簡単に使用され、それによって本発明の利益はコンピュータ科学者、コンピュータプログラマなどに限定されないことを理解されたい。システム900は、特定のトピックおよび/またはユーザの特徴に関連したインターネット上のサイトを探し出すトピック/特徴サイトロケータ902を含む。例えば、トピック/特徴サイトロケータ902と共に一般の検索エンジンを使用して、ユーザにとって興味のあるトピックに関連するサイトの集まり(インターネット、イントラネットなど)にわたってサイトを探し出すことができる。あるいは、ユーザはトピック/特徴サイトロケータ902を使用して、単に興味のあるトピックに関連するとユーザが感じた既知のサイトをコンパイルすることができる。例えば、こうしたドメインは興味のあるゴルフのトピックに関連するとユーザが感じた場合、ユーザはパスwww.golfaddict.comを入力することができる。さらに、特定の特徴を含むユーザに関連するサイトを、トピック/特徴サイトロケータ902によって取り出すことができる。本発明の一態様によれば、トピック/特徴サイトロケータ902は、特定のトピックおよび/またはユーザの特徴に関連する複数の検索用語を受信し、こうした用語のそれぞれを使用して一般の検索を実行する。異なる検索用語を使用して複数回返されるサイトは、おそらく(必ずしもそうではないが)トピックおよび/またはユーザの特徴について関連している。
トピック/特徴サイトロケータ902は、探し出されたサイトを、重みアサイナ(assignor)906を含むサブウェブジェネレータ904に中継する。重みアサイナ906は、興味のあるトピックおよび/またはユーザの特徴との計算された関連性に従ってトピック/特徴サイトロケータ902によって探し出された各サイトに重みを割り当てる。本発明の一態様によれば、トピック/特徴サイトロケータ902は、一般の検索エンジンでの特定のトピック/ユーザの特徴に関する複数の検索を使用する。例えば、トピックおよび/またはユーザの特徴に関する検索用語の集まりは、検索エンジンに入力され、返された結果が重みアサイナ906に中継される。より詳細には、ゴルフのトピックに興味のあるユーザは、「フェアウェイ」、「グリーン」、「アイアン」、「ウッド」、「ハザード」などの検索結果用語を入力することができる。個別に検索すると、これらの検索用語に起因する結果は、ゴルフのトピックと関連のない大量のデータを含む。しかし、集合的な結果の一部は、2つ以上の検索用語の間で共通している。トピックに関するサイトの関連性は、おそらく異なるトピックのクエリに関するサイトが返された回数が増えるにつれて高くなる。したがって重みアサイナ906は、異なるトピック/ユーザの特徴の検索クエリの使用を介して検索が行われたときにサイトが一般の検索から返される回数に少なくとも部分的に基づいて関連性の重みをサイトに割り当てる。また、サブウェブジェネレータ904は、閾値の重みが割り当てられていないサイトをフィルタにかけることもできる。
本発明の別の態様によれば、重みアサイナ906は、以前のユーザの履歴に従って関連性の重みをサイトに割り当てることができる。例えば、ユーザが頻繁に1つの特定のウェブサイトにアクセスし、そのサイトがトピック/特徴サイトロケータ902によって探し出される場合、そのサイトは、ユーザ(および興味のあるトピックおよび/またはユーザの特徴)と特に関連するものとすることができる。トピック/特徴サイトロケータ902によって探し出されたサイトに重みを割り当て、必要に応じて、割り当てられた重みが低いサイトをフィルタにかけると、サブウェブジェネレータ904は、識別可能なサブウェブ908を作成する。サブウェブ908は、サブウェブが表すトピックおよび/またはユーザの特徴と関連する複数のサイト、およびトピック/ユーザの特徴との関連性の度合いを示す、バイアスされた関連性の重みを含む。その後、サブウェブ908は、保存され、複写され、異なるユーザなどに転送され、上述したように焦点を絞った検索の実行に関して使用することができる。
次に図10を参照すると、特定のトピックを表すサブウェブの作成を容易にするシステムを示している。システム1000は、対象の特定のトピックおよび/またはユーザの特徴と関連する複数のサイトを探し出すトピック/特徴サイトロケータ1002を含む。トピック/特徴サイトロケータ1002は、検索クエリとして一般の検索エンジン1006に入力される複数のトピッククエリ用語1004を含む。本発明の一態様によれば、トピッククエリ用語1004は、トピック限定サイトのクエリログとすることができる。例えば、www.golfaddict.comは、特にゴルフのトピックに関連するサイトとすることができ、そのサイト上の検索クエリのログは、おそらくゴルフに関連している可能性がある。トピックサイトのクエリログに存在する検索クエリは、一般の検索エンジンへの検索クエリとして使用することができ、複数のドメインからの結果が返される。この複数の検索から得られた結果を取得し、サブウェブジェネレータ1008に中継して、結果を使用して対象のトピックを表すサブウェブを作成することができる。本発明の別の態様によれば、トピック限定サイトからキーワードを抽出することによってトピッククエリ用語1004を取得することができる。さらに、ユーザは単に、興味のあるトピックと関連すると感じた検索用語のリストを生成し、そのリストをトピックのクエリ用語として使用することができる。本発明の別の態様によれば、1組のシードURLおよび/または有意なパスを使用することができ、キーワードをこれらのウェブサイトから抽出することができる。さらに、特定のユーザの特徴(年齢、人種、性別、政治的所属など)に関連したサイトの取得に関して同様の行動を起こすことができる。
サブウェブジェネレータ1008は、検索の結果(サイト)を受信し、バイアスされた関連性の重みを探し出されたサイトに割り当てる重みアサイナ1010を含む。重みアサイナ1010は、結果内のパスの分布(distribution paths)を計算するパス分布計算器(path distribution calculator)1012と関連付けられる。より具体的には、パス分布計算器1012は、異なるクエリの結果としてどのサイトが返されたかを判定し、結果としてサイトが返されたいくつかのインスタンス(a number of instances)を表にまとめる(tabulate)。パス分布計算器1012は、さらに、パスの分布を計算するときに、一般の検索エンジンによって返されたサイトに割り当てられたランク付け、およびそのサイトに関連するインリンクおよびアウトリンクを考慮することができる。より詳細には、一般の検索エンジンによって高くランク付けされたサイトは、パスの分布を計算するときに追加で重み付けすることができ、返されたサイトに近接するサイトの分布を判定するときにこれらのサイトに関連付けられたインリンクおよびアウトリンクも追加で重み付けすることができる。近接パス分布計算器(neighborhood path distribution calculator)1014は、検索の結果として返されたサイトに近接するサイトの分布を計算する。例えば、近接パス分布計算器1014は、検索で返されるサイトを指し示すURL(インリンクなど)、および検索で返されるサイトからリンクするURL(アウトリンクなど)の分布を判定することができる。近接パス分布の計算の実行可能性を確実にするために、考慮すべきインリンクおよびアウトリンクの閾値数を提供することができる。
重みアサイナ1010は、パス分布計算器1012および近接パス分布計算器1014を介して取得された結果を組み合わせることによって正味のパス分布を判定する正味パス分布計算器(net path distribution calculator)1016をさらに含む。正味のパス分布は、パス分布計算器1016によって計算されたパスの分布に近接するパスの確率分布を追加することによって判定される。重み付けの差を使用して、最適な正味のパス分布を提供することができる。ノーマライザ1018は、正味のパス分布を正規化するために使用する。ノーマライザ1018を使用して、かなりの量のリンクを有し、興味のあるトピックに関連していない可能性があるサイトの関連性を減らす。本発明の一態様によれば、一般の検索エンジン1006は、複数の無作為な検索用語を使用して、1組の結果を取得する。その後パス分布計算器1012は、検索結果内のパスの分布を計算する。次いで近接パス分布計算器1014は、近接パス分布および近接するパスの確率分布を計算する。次いで正味パス分布計算器1016は、上述したように正味のパス分布を計算する。次いでノーマライザ1018は、トピック限定/ユーザの特徴の検索用語に関連する確率分布を計算し、無作為な検索用語に関連する確率分布から同じ数を差し引く。複数のサイトはかなりの量のインリンクおよびアウトリンクを有しており、任意の1つの特定のトピックおよび/またはユーザの特徴に関連していない可能性があるため、ノーマライザは必要である。
これらの計算に基づいて、バイアスされた重み付けが、重みアサイナ1010を介して各サイトに割り当てられる。必要に応じて、閾値の重みを有していない返されたサイトを破棄することができる。同様に、サブウェブ内のサイトの閾値数Nを定義することができ、最も関連性のあるNの重みを備えたサイトをサブウェブで使用することができる。さらに、サブウェブジェネレータ1008は、対象のトピックおよび/またはユーザの特徴に関連していないと判定されたサイトのリストを含む停止リスト1020を含むことができる。例えば、対象のトピックおよび/またはユーザの特徴に関連がないと事前にわかっているサイトは、サブウェブジェネレータ1008を介して生成されるサブウェブから自動的に破棄される。フィルタにかけられない各サイトに重みを割り当てると、サブウェブジェネレータ1008は、対象のトピックおよび/またはユーザの特徴に特定のサブウェブ1022を生成する。その後、サブウェブ1022は、保存され、複写され、異なるユーザなどに転送され、上述したようにトピックおよび/またはユーザの特徴に関するフィルタにかけられた検索の実行に関して使用することができる。本発明の別の態様によれば、サブウェブ1022は、サブウェブ階層の一部となるように生成することができる。したがって連続的により限定的なサブウェブの階層を生成することができる。
次に図11を参照すると、特定のトピックおよび/または特徴に関連するサブウェブの生成を容易にするシステム1100を示している。1102では、トピック限定/ユーザの特徴に特定のクエリログが生成される。これは、トピック限定のウェブサイトからのクエリログの取得、トピック限定のテキストサイトからのキーワードの抽出、シードURLの提供、およびそのシードおよび関連のインリンク/アウトリンクからのキーワードの抽出などを介して生成することができる。さらに、ユーザは、経験および嗜好に基づいて、対象のトピックに特有であると感じた検索用語のリストの作成を介してトピック限定、および/またはユーザの特徴限定のクエリログを生成することができる。
1104で、一般の検索エンジンは、クエリログ内に存在するクエリ用語を使用して、サイトの集まり(インターネット、イントラネットなど)にわたって複数の検索を行う。これらの検索の結果の組は、将来の計算および分析のために格納される。1106で、検索結果内に存在するパスの分布が計算される。異なるトピック/特徴の検索クエリを使用して複数の検索が行われるので、結果の組の少なくとも一部は、対象のトピックおよび/またはユーザの特徴に無関係であることは避けられない。しかし、異なるトピック限定の検索クエリを使用して同じサイトが複数回返されると、こうしたサイトは、おそらく対象のトピックおよび/またはユーザの特徴に関連している。
1108では、返されたサイトに近接するサイトは、対象のトピック/ユーザの特徴に関連する可能性があるため、結果の組内のサイトに近接するサイトのパス分布が計算される。例えば、返された組内のサイトにリンクされたサイト、および返された組内のサイトからリンクされているサイトを考慮に入れることができ、これらは、近接するサイトのパス分布の計算に使用される。1110で、最適なサブウェブの作成を確実にするために何らかの重み付けの差を使用して、検索結果内に存在するパスの分布に近接するパスの確率分布を加えることによって正味のパス分布が判定される。1112で、トピックに関連しない返された組内のサイトは、フィルタにかけられ、サブウェブには含まれない。例えば、複数のサイトは、かなりの数のインリンクおよびアウトリンクを含んでおり、したがって対象のトピックおよび/ユーザの特徴に関連しない(例えばそれらは、多くの人々がそこに/からリンクする大きい一般的なサイトである)ため、それらを破棄することができる。さらに、正味パス分布計算での重みの低いサイトは、サブウェブが表すトピックおよび/またはユーザの特徴にそれほど特有ではないため、サブウェブから除外することができる。
次に図12を参照すると、サブウェブを手動で生成する方法1200を示している。1202で、ユーザインタフェースがユーザに提供される。ユーザインタフェースには、複数のデータ入力ポジションがある可能性があり、それによってユーザは、サブウェブの生成に必要なデータを入力することができる。1204で、作成されるサブウェブに適切な名前が与えられ、それによってユーザおよび他のユーザは、どのトピックおよび/またはユーザの特徴をサブウェブが表すのかを容易に識別できるようになる。1206で、サブウェブ内に含まれるサイト(ドメイン、パスなど)がユーザインタフェース内のデータ入力ポジションに入力される。ユーザは、現在の嗜好、以前の経験、口コミ、検索エンジン、または特定のトピック/ユーザの特徴に関連すると確信されるサイトを選択する他の適したやり方に基づいてこれらのサイトを選択することができる。1208で、ユーザは、サブウェブを定義するために選択されたサイトに重みを割り当てることができる。また、ユーザの嗜好、経験などに基づいて重みを割り当てることができる。さらに、ユーザの履歴、状況など、および特定のユーザに関連する他の情報に基づいてサブウェブの生成後に重みを割り当てることができる。1210で、サブウェブは、確定され、入力されたサイトおよびこれらのサイトに割り当てられた重みによって定義される。その後サブウェブは、保存、複写、変更することができ、または同様の目的に対してとることができる他の任意の適した行動に使用してもよい。
次に図13を参照すると、クエリログ1300の例およびその結果として得られるサブウェブ1302を示している。サブウェブ1302は、望ましくはコンピュータ関連の支援の特定のトピックを表すために作成された。したがってクエリログ1300は、コンピュータ支援のトピックについて関連する複数の検索用語を含む。例えば、用語「ファイヤウォール」、「ネットミーティング」、「DVD」などはすべてコンピュータ支援に関連付けられる。クエリログ1300内の各クエリは、一般の検索エンジンに入力され、結果がサブウェブジェネレータ904に提供された(図9)。結果として得られたサブウェブ1302は、関連付けられた関連性の重みを備える複数のコンピュータ関連のサイトを含む。例えば、computer.comには最も大きい重み(例えば0.01)が割り当てられており、したがってこれは、推定上、コンピュータ支援のトピックを参照したときに最も関連性の高いサイトである。サブウェブ1302内のサイトの重みに少なくとも部分的に基づいて結果をバイアスすることによって、コンピュータ支援のトピックについてのサイトの集まりにわたって焦点を絞った検索を行うためにサブウェブ1302を使用することができる。
次に図14を参照すると、クローラ1402を使用して、検索エンジン1406を介して探し出すことができるサイトの集まり1404(WWWなど)内の新しいおよび/または変更されたサイトを探し出すシステム1400を示している。例えば、クローラ1402は、ウェブクローラ(自動式の秩序立ったやり方でWWWをブラウズするプログラム)とすることができる。しかし、以下に示すクローラ1402は、サイトの集まり内のサイトをブラウズする任意のコンポーネントを指すことを理解されたい。サイトのこうした集まりをサーバ、ローカルハードドライブ、または他の任意の適したデータ記憶位置に格納することができる。クローラは、例えば検索エンジンによって後で処理するためにアクセスされたすべてのページのコピーを保持する。またクローラは、これらのページを使用して、検索を絞りやすくする。例えば、インターネット検索エンジンは、検索中に返されるサイトが確実に依然としてWWW上に存在し、サイトの最新のバージョンであるようにするためにウェブクローラに依存する。
本発明の一態様によれば、クローラ1402は、複数のサブウェブ1410を含むデータストア1408にアクセスする。各サブウェブは、サブウェブによって表される特定のトピックおよび/またはユーザの特徴に関連するサイトを含み、対応するサイト1412は、サイトの集まり1404内に存在する。トピックは、サブウェブ1410の作成者が作成時に望んだのと同じだけ広く、または狭くすることができる。クローラ1402は、サブウェブ1410を定義するサイトのリストにアクセスすることができ、これらのサイト1412が、サブウェブ1410を定義していないサイトより、サイトの集まり(WWWなど)1404内で確実により頻繁にチェックされるようにすることができる。したがって検索を絞るために頻繁に使用されるサブウェブ内のサイトには、検索に関してあまり使用されないサブウェブの外部のサイト、またはサブウェブ内のサイトより、クローリングに関して大きい優先度を与えることができる。さらに、クローラ1402によってとられた行動に関して確率に基づく分析を行うことができるユーティリティコンポーネント1414にクローラ1402を関連付けることができる。例えば、ユーティリティコンポーネント1414は、ウェブクローラがサイトの集まり1404内のサイト1412にアクセスした最後のインスタンス以降サブウェブ1410内の1つまたは複数のサイトが変更/削除された特定の確率が存在すると判定することができる。
さらに、ユーティリティコンポーネント1414は、クローラ1402がサイトの集まり1404内のサイト1412にアクセスした最後のインスタンス以降1つまたは複数のインリンクおよび/または1つまたは複数のアウトリンクがサブウェブ1410を定義しているサイトに追加された確率を判定することができる。本発明の別の態様によれば、ユーティリティコンポーネント1414は、クローラ1402がサブウェブ1410を定義するサイトの集まり1406内の1つまたは複数のサイト1412にアクセスすることに関して、コスト/利益分析を行うことができる。例えば、ユーティリティコンポーネント1414は、サイトにアクセスする利益(例えば高トラフィックのサイトが最新のままであることを確実にするなど)に関して、サイトの集まり内の1つまたは複数のサイト1412にクローラ1402を配置するコスト(例えばサイト/サイトの表示を遅くする、クローリングリソースを異なるサイトに割り振るなど)を考えることができる。
次に図15を簡単に参照すると、本発明の1つまたは複数の利益を示すネットワーキング環境1500の例を示している。環境は、第1のデータストア1502および第2のデータストア1504を含み、第1のデータストア1502は、特定のトピックを表すサブウェブ1506を含む。第2のデータストア1504のユーザは、実質的に同様のトピックに向けられた新しいサブウェブを生成するより、サブウェブ1502の複写を取得し、こうしたサブウェブ1502を使用して検索を絞ることを望む。サブウェブをオブジェクトと考えることができるので、第2のデータストア1504のユーザは、第1のデータストア1502に存在するサブウェブ1506の複写を取得することができる。サブウェブ1506の複写を、ネットワーク接続を介して転送し、第2のデータストアで受信することができる。さらに、サブウェブ1506の複写は、いったんデータストア1504内に存在するようになると、ユーザの嗜好に従って変更することができる。したがってサブウェブは、サイトの集まりの検索に関して、個別化を提供する。これは、従来の検索システムおよび技術と比べて重要な改良である。
次に図16を参照すると、こうした検索を絞るためにサブウェブを使用する検索を、従来の検索エンジンを使用した検索と比較している。より詳細には、1つまたは複数のサブウェブを使用して検索を絞ることができるようにするインタフェース1602を示しており、選択されたサブウェブは、コンピュータヘルプおよびサポート(HSC)に関連する。使用された検索クエリは「トロイの木馬」であり、ユーザは、悪意のあるコンピュータプログラムに関連する情報を取り出すことを望む。返される結果の焦点を絞るためにサブウェブを使用することによって得られた返された結果は、一般の検索エンジン1604、およびドメイン限定の検索エンジン1606(Microsoft(登録商標)ドメインにわたってのみ検索されるなど)への関連性がより高かった。一般の検索エンジン1604は、トロイ戦争の歴史に関連する関係のない結果を返す。ドメイン限定検索エンジン1606は、検索にかなり関連する結果を除外する。
次に図17および18を参照すると、サブウェブ支援検索を介して取得した結果と2つの従来の検索エンジンから取得した結果との間の比較例を示している。結果の関連性を測定するために、1組の所与のクエリについて標準の1組の関連の結果が構築され、サブウェブ支援検索および一般の検索エンジン検索によって取得された結果が標準と比較された。示した実験に使用したサブウェブは、450のトピック関連クエリから構築され、1000の無作為なクエリの組に対して正規化された。結果の取得に使用されたクエリは、特定のドメインでの500個の最も多いクエリ、および同じドメイン内で使用された500個の無作為なクエリの混合から取り出した。クエリごとに、これらの検索プロバイダのそれぞれからの上位の結果が取得され、マージされ、複写された。次いでこれらの結果を、無作為に格納し、無関係な注釈者に提示した。サブウェブの構築に使用されたクエリの組、および注釈者に提供された結果の取得に使用されたクエリの組は、相互に排他的なものとした。
この比較に関して使用した注釈者は、結果の出所を知らない(すなわち取得された結果が従来の検索エンジンからのものか、サブウェブで焦点を絞った検索であるかを判定することができない)。注釈者は、選択されたトピックに対して、「良い」(結果がクエリに直接関連している)、「OK」(結果は何らかの洞察を与えるが、質問に完全に回答しているわけではない)、「悪い」(結果は役に立たない)として結果を評価した。例えば、所望のトピックがコンピュータウィルスである場合、返された結果は、「トロイの木馬」についてのクエリが使用されたときにトロイの古都についての情報を説明している場合、(例えば「悪い」など)無関係の結果となる。あるいは、コンピュータウィルスをどのように防ぐかに関する情報は、関係あるとして評価された。簡単な注釈ツールを使用して(サブウェブで焦点を絞った検索エンジンおよび2つの従来の検索エンジンに送信された510個のクエリから取得された)全部で17741の結果に注釈が付された。これらの注釈は、標準にコンパイルされた。この標準が取得されると、サブウェブで焦点を絞った検索エンジン、および2つの従来の検索エンジンに対してクエリが再度実行された。図17および18は、こうした比較の結果を示している。
図17を特に参照すると、比較1700は、2つの従来の検索エンジン結果と比べてサブウェブで焦点を絞った検索結果がより高い平均逆順位を有することを示す。平均逆順位は、ユーザの必要性を満たす第1の結果の平均位置を示している。明らかに平均逆順位がより高い方が望ましい。サブウェブで焦点を絞った検索に関連付けられた平均逆順位は、2つの従来の検索エンジンに関連付けられたもののほぼ倍である。特に図18を参照すると、サブウェブで焦点を絞った検索および従来の検索から取得された結果に関連する様々な比較1800を示している。より詳細には、第1のいくつかのサイト内で取得された結果の関連性が、サブウェブで焦点を絞った検索と従来の検索との間で比較される。サブウェブで焦点を絞った検索結果は、一貫して従来の検索エンジンより関連性が高い。より詳細には、次の表は、比較1800を構築するために使用されたデータを示している。
Figure 0004694215
上の表は、他の従来の検索エンジン結果のかなり低い数値に比べて、検索を絞るためにサブウェブを使用することによって返された上位の結果が検索の51.8%について「良い」または「OK」と注釈されたことを示している。同様に、検索を絞るためにサブウェブを使用することによって返された上位の結果は、検索の32.16%について「良い」と注釈された。関連性の結果にわたる平均精度の平均(Mean Average Precision over Relevant Results:MAP)は、各結果リストの関連性の結果の精度レベルの「平均の平均」である。無関係な結果は、結果リストの平均精度に寄与しない。上位Nの精度およびMAPでは、数が多いとそれだけ関連性が高くなる。図17および18、および上記の表を詳しく調べることからわかるように、サブウェブで焦点を絞った検索は、一貫して一般の検索より性能が優れている。
図19を参照すると、本発明の様々な態様を実施する環境1910の例はコンピュータ1912を含む。コンピュータ1912は、任意の適したコンピューティング装置とすることができる(例えばPDA(Personal Digital Assistant)、ラップトップコンピュータ、サーバ、デスクトップコンピュータなど)。コンピュータ1912は、プロセッサ1914、システムメモリ1916、およびシステムバス1918を含む。システムバス1918は、それだけには限定されないが、システムメモリ1916を含むシステムコンポーネントをプロセッサ1914に結合する。プロセッサ1914は、使用可能な様々なプロセッサのうちのどんなものでもよい。デュアルマイクロプロセッサおよび他のマルチプロセッサアーキテクチャをプロセッサ1914として使用することもできる。
システムバス1918は、使用可能な様々なバスアーキテクチャのうちの任意のものを使用するメモリバスまたはメモリコントローラ、周辺バスまたは外部バス、および/またはローカルバスを含むいくつかのタイプのバス構造のうちどんなものでもよい。こうしたアーキテクチャには、それだけには限定されないが、8ビットバス、ISA(Industry Standard Architecture)、MSA(Micor-Channel Architecture)、EISA(Extended Industry Standard Architecture)、IDE(Integrated Drive Electronics)、VESA(Video Electronics Standards Association)ローカルバス(VLB)、PCI(peripheral component interconnect)、ユニバーサルシリアルバス(USB)、AGP(Accelerated Graphics Port)、PCMCIA(Personal Computer Memory Card International Association)バス、およびSCSI(small computer system interface)などがある。
システムメモリ1916は、揮発性メモリ1920および不揮発性メモリ1922を含む。BIOS(Basic Input/Output System)は、例えば起動中など、コンピュータ1912内の要素間で情報を転送する基本ルーチンを含み、不揮発性メモリ1922に格納されている。不揮発性メモリ1922には、それだけには限定されないが一例として、読取り専用メモリ(ROM)、プログラマブルROM(PROM)、電気的プログラマブルROM(EPROM)、電気的消去可能ROM(EEPROM)、フラッシュメモリなどがある。揮発性メモリ1920には、ランダムアクセスメモリ(RAM)などがあり、これは外部キャッシュメモリとして働く。RAMは、それだけには限定されないが一例として、シンクロナスRAM(SRAM)、ダイナミックRAM(DRAM)、シンクロナスDRAM(SDRAM)、ダブルデータレートSDRAM(DDR SDRAM)、拡張SDRAM(ESDRAM)、シンクリンクDRAM(SLDRAM)、およびダイレクトラムバスRAM(DRRAM)など多くの形態で使用可能である。
コンピュータ1912は、リムーバブル/非リムーバブル、揮発性/不揮発性コンピュータ記憶媒体も含む。図19は、例えばディスク記憶装置1924を示している。ディスク記憶装置1924には、それだけには限定されないが、磁気ディスクドライブ装置、フロッピー(登録商標)ディスクドライブ、テープドライブ、Jazドライブ、Zipドライブ、LS−100ドライブ、フラッシュメモリカード、またはメモリスティックなどがある。さらに、ディスク記憶装置1924は、記憶媒体を別個に含む、または、それだけには限定されないが、コンパクトディスクROM装置(CD−ROM)、CDレコーダブルドライブ(CD−R Drive)、CDリライタブルドライブ(CD−RW Drive)、またはデジタル多用途ディスクROMドライブ(DVD−ROM)などの光ディスクドライブなど他の記憶媒体と組み合わせて含むことができる。ディスク記憶装置1924のシステムバス1918への接続を容易にするために、一般に、インタフェース1926などリムーバブルまたは非リムーバブルインタフェースが使用される。
図19は、ユーザと適した動作環境1910で説明した基本的なコンピュータリソースとの間の媒介として働くソフトウェアを説明していることを理解されたい。こうしたソフトウェアには、オペレーティングシステム1928などがある。オペレーティングシステム1928は、ディスク記憶装置1924に格納することができ、コンピュータシステム1912のリソースを制御し、割り振るよう働く。システムアプリケーション1930は、システムメモリ1916またはディスク記憶装置1924のいずれかに格納されているプログラムモジュール1932およびプログラムデータ1934を介してオペレーティングシステム1928によるリソースの管理を利用する。本発明は、様々なオペレーティングシステムまたはオペレーティングシステムの組合せと共に実施できることを理解されたい。
ユーザは、入力装置1936を介してコマンドまたは情報をコンピュータ1912に入力する。入力装置1936には、それだけには限定されないが、マウスなどのポインティング装置、トラックボール、スタイラス、タッチパッド、キーボード、マイクロフォン、ジョイスティック、ゲームパッド、衛星パラボラアンテナ、スキャナ、TVチューナカード、デジタルカメラ、デジタルビデオカメラ、ウェブカメラなどがある。これらおよび他の入力装置は、インタフェースポート1938を経由してシステムバス1918によってプロセッサ1914に接続される。インタフェースポート1938には、例えば、シリアルポート、パラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)などがある。出力装置1940は、入力装置1936と同じタイプの何らかのポートを使用する。したがって、例えばUSBポートを使用して、コンピュータ1912への入力を提供し、コンピュータ1912から出力装置1940に情報を出力することができる。出力アダプタ1942は、出力装置1940の中でも一部の出力装置1940にはモニタ、スピーカー、プリンタなど特殊なアダプタを必要とするものがあることを示すために提供されている。出力アダプタ1942には、それだけには限定されないが一例として、出力装置1940とシステムバス1918の間の接続手段を提供するビデオカードおよびサウンドカードなどがある。リモートコンピュータ1944など、他の装置および/または装置のシステムは、入力および出力の機能を提供することに留意されたい。
コンピュータ1912は、リモートコンピュータ1944など1つまたは複数のリモートコンピュータへの論理接続を使用してネットワーク式環境で動作することができる。リモートコンピュータ1944は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC(Basic Input/Output System)、ワークステーション、マイクロプロセッサベースの装置、ピア装置、または他の一般のネットワークノードなどでよく、一般にコンピュータ1912に関連して記載した多くまたはすべての要素を含む。簡潔にするために、リモートコンピュータ1944と共にメモリ記憶装置1946のみを示している。リモートコンピュータ1944は、ネットワークインタフェース1948を介してコンピュータ1912に論理的に接続され、次いで通信接続1950を介して物理的に接続される。ネットワークインタフェース1948は、ローカルエリアネットワーク(LAN)および広域ネットワーク(WAN)などの通信ネットワークを含む。LAN技術は、FDDI(fiber distributed data interface)、CDDI(copper distributed data interface)、Ethernet(登録商標)/IEEE(Institute of Electrical and Electronics Engineers)802.3、トークンリング/IEEE802.5などがある。WAN技術には、それだけには限定されないが、ポイントツーポイントリンク、ISDN(Integrated Services Digital Network)およびそのバリエーションなどの回線交換ネットワーク、パケット交換ネットワーク、デジタル加入者回線(DSL)などがある。
通信接続1950は、ネットワークインタフェース1948をバス1918に接続するために使用されるハードウェア/ソフトウェアを指す。通信接続1950は、説明上わかりやすくするために、コンピュータ1912内に示しているが、コンピュータ1912の外部にあってもよい。ネットワークインタフェース1948への接続に必要なハードウェア/ソフトウェアには、一例にすぎないが、通常の電話用モデム、ケーブルモデム、DSLモデムなどのモデム、ISDNアダプタ、Ethernet(登録商標)カードなど内部技術および外部技術がある。
図20は、本発明が対話することができるサンプルのコンピューティング環境2000の概略ブロック図である。システム2000は、1つまたは複数のクライアント2010を含む。クライアント2010は、ハードウェアおよび/またはソフトウェア(スレッド、プロセス、コンピューティング装置など)とすることができる。システム2000は、1つまたは複数のサーバ2030も含む。サーバ2030もハードウェアおよび/またはソフトウェア(スレッド、プロセス、コンピューティング装置など)とすることができる。サーバ2030は、スレッドを収容して、例えば本発明を使用することによって変形を行うことができる。クライアント2010とサーバ2030との間の1つの考え得る通信は、2つ以上のコンピュータプロセス間で送信されるように構成されたデータパケットの形式とすることができる。システム2000は、クライアント2010とサーバ2030との間の通信を容易にするために使用できる通信フレームワーク2050を含む。クライアント2010は、クライアント2010に対してローカルに情報を格納するために使用できる1つまたは複数のクライアントデータストア2060に動作可能に接続される。同様に、サーバ2030は、サーバ2030に対してローカルに情報を格納するために使用できる1つまたは複数のサーバデータストア2040に動作可能に接続される。
上記で説明してきたことは、本発明の例を含む。当然、本発明を説明するためにコンポーネントまたは方法の予想されるすべての組合せについて説明することは不可能であるが、本発明の他の多くの組合せおよび置換えが可能であることを当業者であれば理解できよう。したがって、本発明は、添付の特許請求の範囲の意図および範囲内のこうしたすべての代替形態、変更形態、および変形形態を含むものとする。さらに、「含む(include)」という用語が詳細な説明または特許請求の範囲で使用されている限り、こうした用語は、請求項で移行句として使用されるときに「備える(comprising)」が解釈されるように、「備える」という用語と同じように包含的であるものとする。
本発明の一態様による改良された検索(improved searching)を容易にするシステムを示すブロック図である。 本発明の一態様による改良された検索を容易にするシステムを示す別のブロック図である。 本発明の一態様による改良された検索を容易にするシステムを示すさらに別のブロック図である。 本発明の一態様による改良された検索を容易にするシステムを示すさらに別のブロック図である。 本発明の一態様による検索結果の関連性の向上に関してサブウェブを使用する方法を示すフロー図である。 本発明の一態様によるサブウェブを変更する方法を示すフロー図である。 本発明の一態様による複数のトピックへのインターネットのパーティショニングの例を示す図である。 本発明に関して使用できる検索表示の例を示す図である。 本発明の一態様によるサブウェブの作成を容易にするシステムを示すブロック図である。 本発明の一態様によるサブウェブの作成を容易にするシステムを示す別のブロック図である。 本発明の一態様によるサブウェブを作成する方法を示すフロー図である。 本発明の一態様によるサブウェブを作成する方法を示す別のフロー図である。 本発明の一態様によるクエリログの例およびクエリログに基づいて生成されたサブウェブの例を示す図である。 本発明の一態様による改良されたウェブクローリングを容易にするシステムを示すブロック図である。 本発明の一態様によるサブウェブの可搬性を示す図である。 本発明の一態様によるサブウェブで焦点を絞った検索から返された結果と比較して様々な検索エンジンから返された結果を示す図である。 本発明の一態様による従来の検索と比較してサブウェブで焦点を絞った検索が優れていることを示すデータである。 本発明の一態様による従来の検索と比較してサブウェブで焦点を絞った検索が優れていることを示すデータである。 本発明が機能することができる動作環境の例を示す図である。 本発明が機能することができる動作環境の別の例を示す図である。
符号の説明
100 改良された検索を容易にするシステム
102〜106 サブウェブ
108 データストア
110 サブウェブセレクタ
112 ディスプレイ
114 検索コンポーネント

Claims (24)

  1. サイトの集まりにわたる検索を容易にするシステムであって、
    複数のサブウェブのリスト格納する記憶装置であって前記サブウェブは、特定のトピックにそれぞれ関連付けられ、当該トピックに分類されるサイト、および、当該トピックと当該サイトとの関連性を示す重みを対応づけて定義し、前記重みは、前記トピックに関連する複数の検索用語を使用した検索結果に当該サイトが含まれる回数に応じて高くなる、記憶装置と、
    検索用語を受信する入力コンポーネントと
    前記受信した検索用語に基づいて、前記複数のサブウェブのうち少なくとも1つを選択するサブウェブセレクタと、
    前記受信した検索用語に基づいて前記サイトの集まりにおいて検索を行い、前記選択されたサブウェブに含まれるサイトに対応する前記重みに基づいて、検索結果をランク付けする検索コンポーネントと、
    サブウェブをカスタマイズするチューニングコンポーネントであって、サブウェブに追加するサイトに対応する重みを割り当てる、チューニングコンポーネントと、
    前記サイトの集まり内に前記サブウェブに含まれるサイトが存在するかどうかを判定し、前記サブウェブに含まれるサイトの変更または削除を前記チューニングコンポーネントに通知するクローリングコンポーネントであって、検索に頻繁に使用されるサブウェブのサイトは、当該サブウェブと比較して検索に使用される頻度が少ないサブウェブのサイトより頻繁に判定される、クローリングコンポーネントと
    を備えたことを特徴とするシステム。
  2. 前記システムが、サーバ上に存在することを特徴とする請求項1に記載のシステム。
  3. 前記システムが、クライアント上に存在することを特徴とする請求項1に記載のシステム。
  4. 前記サブウェブは前記システムのユーザごと生成されることを特徴とする請求項1に記載のシステム。
  5. 時刻またはユーザの場所を含むデータを受信して、前記検索コンポーネントに通知する状況コンポーネントをさらに備え
    前記検索コンポーネントは、前記状況コンポーネントから通知されたデータに基づいて検索およびランク付けを行うことを特徴とする請求項1に記載のシステム。
  6. 前記サブウェブセレクタは、検索時に表示されているサイトに関連するトピックに関連付けられたサブウェブを選択することを特徴とする請求項に記載のシステム。
  7. 前記サブウェブセレクタは、閲覧履歴に含まれるサイトに関連するトピックに関連付けられたサブウェブを選択することを特徴とする請求項に記載のシステム。
  8. 前記サブウェブセレクタは感知されたユーザの場所に関連するトピックに関連付けられたサブウェブを選択することを特徴とする請求項に記載のシステム。
  9. 前記サブウェブセレクタはユーザインタフェースに関連付けられており、ユーザは、前記ユーザインタフェースを介して前記検索に関して使用するサブウェブを選択することを特徴とする請求項に記載のシステム。
  10. 前記チューニングコンポーネントはユーザインタフェースに関連付けられており、ユーザは、前記ユーザインタフェースを介して前記サブウェブに含まれるサイトに対応する前記重みを変更することを特徴とする請求項に記載のシステム。
  11. 前記サブウェブはウェブサイトを介してアクセス可能であることを特徴とする請求項に記載のシステム。
  12. 前記システムはデータストアをさらに備え、
    前記サブウェブは、前記データストアに含まれるユーザに関するプロファイルに関連付けられており、前記プロファイルは移送可能であることを特徴とする請求項に記載のシステム。
  13. 前記検索結果に関連するフィードバックを受け付ける、ユーザインタフェースに関連付けられたフィードバックコンポーネントをさらに備えユーザは、前記ユーザインタフェースを介して検索に使用したサブウェブから特定のサイトを除外することを特徴とする請求項に記載のシステム。
  14. 前記検索結果の順序は一般の検索エンジンのランク付けシステムの機能、および前記サブウェブ内の前記複数のサイトの対応する重みに基づくことを特徴とする請求項に記載のシステム。
  15. 前記複数のサブウェブには、ユーザの年齢、場所、性別、人種、政治的所属、および宗教のうちの1つまたは複数に関連するトピックに関連付けられるサブウェブが含まれることを特徴とする請求項に記載のシステム。
  16. 複数のサブウェブを前記検索に関して使用し、前記検索から取得した結果は、前記結果に関連するサブウェブによって分類されることを特徴とする請求項に記載のシステム。
  17. 前記サイトの集まりはインターネットおよびイントラネットのうちの少なくとも一方であることを特徴とする請求項に記載のシステム。
  18. サイトの集まりにわたる検索を容易にするシステムにおいて実施される方法であって、当該方法は、記憶装置に記憶されたコンピュータ実行可能命令を処理装置が実行することによって実施され、
    記憶装置が、複数のサブウェブのリストを提供するステップであって、前記サブウェブは、特定のトピックにそれぞれ関連付けられ、当該トピックに分類されるサイト、および、当該トピックと当該サイトとの関連性を示す重みを対応づけて定義し、前記重みは、前記トピックに関連する複数の検索用語を使用した検索結果に当該サイトが含まれる回数に応じて高くなる、ステップと、
    入力コンポーネントが、検索用語を受信するステップと、
    サブウェブセレクタが、前記受信した検索用語に基づいて、前記複数のサブウェブのうち少なくとも1つを選択するステップと、
    検索コンポーネントが、前記受信した検索用語に基づいて前記サイトの集まりにおいて検索を行い、前記選択されたサブウェブに含まれるサイトに対応する前記重みに基づいて、検索結果をランク付けするステップと、
    クローリングコンポーネントが、前記サイトの集まり内に前記サブウェブに含まれるサイトが存在するかどうかを判定し、前記サブウェブに含まれるサイトの変更または削除をチューニングコンポーネントに通知するステップであって、検索に頻繁に使用されるサブウェブのサイトは、当該サブウェブと比較して検索に使用される頻度が少ないサブウェブのサイトより頻繁に判定される、ステップと、
    前記クローリングコンポーネントからの前記通知に基づいて、前記チューニングコンポーネントが、前記サブウェブをカスタマイズするステップと
    を備えることを特徴とする方法。
  19. 前記サブウェブセレクタは、閲覧履歴に含まれるサイトに関連するトピックに関連付けられたサブウェブを選択することを特徴とする請求項18に記載の方法。
  20. 前記サイトの集まりはインターネットおよびイントラネットのうちの少なくとも一方であることを特徴とする請求項18に記載の方法。
  21. 前記サブウェブセレクタは、検索時に表示されているサイトに関連するトピックに関連付けられたサブウェブを選択することを特徴とする請求項20に記載の方法。
  22. フィードバックコンポーネントが、検索に使用したサブウェブから特定のサイトを除外するユーザインタフェースを提供するステップをさらに備えることを特徴とする請求項18に記載の方法。
  23. 前記チューニングコンポーネントが、前記サブウェブに含まれるサイトに対応する前記重みを変更するユーザインタフェースを提供するステップをさらに備えることを特徴とする請求項18に記載の方法。
  24. 処理装置によって実行された際、サイトの集まりにわたる検索を容易にする方法を実施することができるコンピュータ実行可能命令を有するコンピュータ読み取り可能な記録媒体であって、前記方法は、
    記憶装置が、複数のサブウェブのリストを提供するステップであって、前記サブウェブは、特定のトピックにそれぞれ関連付けられ、当該トピックに分類されるサイト、および、当該トピックと当該サイトとの関連性を示す重みを対応づけて定義し、前記重みは、前記トピックに関連する複数の検索用語を使用した検索結果に当該サイトが含まれる回数に応じて高くなる、ステップと、
    入力コンポーネントが、検索用語を受信するステップと、
    サブウェブセレクタが、前記受信した検索用語に基づいて、前記複数のサブウェブのうち少なくとも1つを選択するステップと、
    検索コンポーネントが、前記受信した検索用語に基づいて前記サイトの集まりにおいて検索を行い、前記選択されたサブウェブに含まれるサイトに対応する前記重みに基づいて、検索結果をランク付けするステップと、
    クローリングコンポーネントが、前記サイトの集まり内に前記サブウェブに含まれるサイトが存在するかどうかを判定し、前記サブウェブに含まれるサイトの変更または削除をチューニングコンポーネントに通知するステップであって、検索に頻繁に使用されるサブウェブのサイトは、当該サブウェブと比較して検索に使用される頻度が少ないサブウェブのサイトより頻繁に判定される、ステップと、
    前記クローリングコンポーネントからの前記通知に基づいて、前記チューニングコンポーネントが、前記サブウェブをカスタマイズするステップと
    を備えることを特徴とするコンピュータ読み取り可能な記録媒体。
JP2005016102A 2004-01-23 2005-01-24 検索を容易にするシステム及び焦点を絞った検索を行う方法 Expired - Fee Related JP4694215B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US53883804P 2004-01-23 2004-01-23
US60/538,838 2004-01-23
US10/778,498 US7392278B2 (en) 2004-01-23 2004-02-13 Building and using subwebs for focused search
US10/778,498 2004-02-13

Publications (2)

Publication Number Publication Date
JP2005209210A JP2005209210A (ja) 2005-08-04
JP4694215B2 true JP4694215B2 (ja) 2011-06-08

Family

ID=34636700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005016102A Expired - Fee Related JP4694215B2 (ja) 2004-01-23 2005-01-24 検索を容易にするシステム及び焦点を絞った検索を行う方法

Country Status (10)

Country Link
US (1) US7392278B2 (ja)
EP (1) EP1557770A1 (ja)
JP (1) JP4694215B2 (ja)
KR (1) KR101130509B1 (ja)
CN (1) CN1645370B (ja)
AU (1) AU2004240188B8 (ja)
BR (1) BRPI0500105A (ja)
CA (1) CA2490594C (ja)
MX (1) MXPA05000981A (ja)
RU (1) RU2382400C2 (ja)

Families Citing this family (153)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977621B1 (en) * 2000-02-24 2015-03-10 Richard Paiz Search engine optimizer
US7769794B2 (en) 2003-03-24 2010-08-03 Microsoft Corporation User interface for a file system shell
US7240292B2 (en) 2003-04-17 2007-07-03 Microsoft Corporation Virtual address bar user interface control
US7627552B2 (en) 2003-03-27 2009-12-01 Microsoft Corporation System and method for filtering and organizing items based on common elements
US7823077B2 (en) 2003-03-24 2010-10-26 Microsoft Corporation System and method for user modification of metadata in a shell browser
US7712034B2 (en) 2003-03-24 2010-05-04 Microsoft Corporation System and method for shell browser
US7421438B2 (en) 2004-04-29 2008-09-02 Microsoft Corporation Metadata editing control
US7650575B2 (en) 2003-03-27 2010-01-19 Microsoft Corporation Rich drag drop user interface
US7925682B2 (en) 2003-03-27 2011-04-12 Microsoft Corporation System and method utilizing virtual folders
US8024335B2 (en) 2004-05-03 2011-09-20 Microsoft Corporation System and method for dynamically generating a selectable search extension
US8086591B2 (en) * 2004-01-23 2011-12-27 Microsoft Corporation Combining domain-tuned search systems
US7392278B2 (en) 2004-01-23 2008-06-24 Microsoft Corporation Building and using subwebs for focused search
US7657846B2 (en) * 2004-04-23 2010-02-02 Microsoft Corporation System and method for displaying stack icons
US7694236B2 (en) 2004-04-23 2010-04-06 Microsoft Corporation Stack icons representing multiple objects
US8707209B2 (en) 2004-04-29 2014-04-22 Microsoft Corporation Save preview representation of files being created
US7996462B2 (en) * 2004-07-30 2011-08-09 Sap Ag Collaborative agent for a work environment
US11468128B1 (en) 2006-10-20 2022-10-11 Richard Paiz Search engine optimizer
US10959090B1 (en) 2004-08-25 2021-03-23 Richard Paiz Personal search results
CN101073077A (zh) * 2004-09-10 2007-11-14 色杰斯提卡股份有限公司 对用于进行由一组无层次话题指导的搜索的附连的用户创建和分级及其用户界面
US7490082B2 (en) * 2004-09-16 2009-02-10 International Business Machines Corporation System and method for searching internet domains
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7739277B2 (en) 2004-09-30 2010-06-15 Microsoft Corporation System and method for incorporating anchor text into ranking search results
US7761448B2 (en) 2004-09-30 2010-07-20 Microsoft Corporation System and method for ranking search results using click distance
US7716198B2 (en) 2004-12-21 2010-05-11 Microsoft Corporation Ranking search results using feature extraction
US8538970B1 (en) * 2004-12-30 2013-09-17 Google Inc. Personalizing search results
WO2006076579A2 (en) * 2005-01-14 2006-07-20 Cosmix Corporation Web operation language
US8122030B1 (en) * 2005-01-14 2012-02-21 Wal-Mart Stores, Inc. Dual web graph
US7792833B2 (en) 2005-03-03 2010-09-07 Microsoft Corporation Ranking search results using language types
US8412698B1 (en) * 2005-04-07 2013-04-02 Yahoo! Inc. Customizable filters for personalized search
US8195646B2 (en) 2005-04-22 2012-06-05 Microsoft Corporation Systems, methods, and user interfaces for storing, searching, navigating, and retrieving electronic information
US20060242122A1 (en) * 2005-04-22 2006-10-26 Microsoft Corporation Systems, methods, and user interfaces for storing, searching, navigating, and retrieving electronic information
US8396864B1 (en) * 2005-06-29 2013-03-12 Wal-Mart Stores, Inc. Categorizing documents
US7665028B2 (en) 2005-07-13 2010-02-16 Microsoft Corporation Rich drag drop user interface
US7599917B2 (en) * 2005-08-15 2009-10-06 Microsoft Corporation Ranking search results using biased click distance
KR100736275B1 (ko) * 2005-11-16 2007-07-06 강한구 정보통신망 내 개인전용페이지를 이용한 정보제공방법
US7584202B2 (en) * 2006-01-13 2009-09-01 Oracle International Corporation High performance in memory data cubes
US7933890B2 (en) * 2006-03-31 2011-04-26 Google Inc. Propagating useful information among related web pages, such as web pages of a website
JP2007293769A (ja) * 2006-04-27 2007-11-08 Sony Corp プログラム、情報処理方法、情報処理装置
US7542970B2 (en) * 2006-05-11 2009-06-02 International Business Machines Corporation System and method for selecting a sub-domain for a specified domain of the web
US7849079B2 (en) * 2006-07-31 2010-12-07 Microsoft Corporation Temporal ranking of search results
US20080033953A1 (en) * 2006-08-07 2008-02-07 International Business Machines Corporation Method to search transactional web pages
US20080082519A1 (en) * 2006-09-29 2008-04-03 Zentner Michael G Methods and systems for managing similar and dissimilar entities
US20080114755A1 (en) * 2006-11-15 2008-05-15 Collective Intellect, Inc. Identifying sources of media content having a high likelihood of producing on-topic content
US7793230B2 (en) * 2006-11-30 2010-09-07 Microsoft Corporation Search term location graph
KR100842039B1 (ko) * 2006-12-05 2008-06-30 엔에이치엔(주) 사용자 질의에 대한 검색 결과를 제공하는 방법 및 상기방법을 수행하는 시스템
US7685119B2 (en) * 2006-12-20 2010-03-23 Yahoo! Inc. System and method for query expansion
US8631005B2 (en) 2006-12-28 2014-01-14 Ebay Inc. Header-token driven automatic text segmentation
US8073850B1 (en) 2007-01-19 2011-12-06 Wordnetworks, Inc. Selecting key phrases for serving contextually relevant content
JP5239367B2 (ja) * 2007-03-19 2013-07-17 富士通株式会社 情報提供システム、情報提供プログラムおよび情報提供方法
US9535810B1 (en) 2007-04-24 2017-01-03 Wal-Mart Stores, Inc. Layout optimization
US8161040B2 (en) * 2007-04-30 2012-04-17 Piffany, Inc. Criteria-specific authority ranking
US8768932B1 (en) * 2007-05-14 2014-07-01 Google Inc. Method and apparatus for ranking search results
CN101308493B (zh) * 2007-05-18 2010-12-08 亿览在线网络技术(北京)有限公司 实体关系展现方法和系统
US20080301104A1 (en) * 2007-06-01 2008-12-04 Kendall Gregory Lockhart System and method for implementing enhanced search functionality
KR100898459B1 (ko) * 2007-08-10 2009-05-21 엔에이치엔(주) 질의 분류 방법 및 그 시스템
US20090091798A1 (en) * 2007-10-05 2009-04-09 Lawther Joel S Apparel as event marker
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US7840569B2 (en) 2007-10-18 2010-11-23 Microsoft Corporation Enterprise relevancy ranking using a neural network
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
US20090132514A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. method and system for building text descriptions in a search database
US20090132513A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. Correlation of data in a system and method for conducting a search
US20090132645A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method in a local search system with multiple-field comparison
US9400843B2 (en) * 2007-12-04 2016-07-26 Yahoo! Inc. Adjusting stored query relevance data based on query term similarity
US20090150497A1 (en) * 2007-12-06 2009-06-11 Mcafee Randolph Preston Electronic mail message handling and presentation methods and systems
KR100974064B1 (ko) * 2008-02-22 2010-08-04 주식회사 솔트룩스 사용자 맞춤형 정보 제공 시스템 및 그 방법
US7836058B2 (en) 2008-03-27 2010-11-16 Microsoft Corporation Web searching
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8171007B2 (en) 2008-04-18 2012-05-01 Microsoft Corporation Creating business value by embedding domain tuned search on web-sites
US20090287645A1 (en) * 2008-05-15 2009-11-19 Yahoo! Inc. Search results with most clicked next objects
WO2009156988A1 (en) * 2008-06-23 2009-12-30 Double Verify Ltd. Automated monitoring and verification of internet based advertising
US10922363B1 (en) 2010-04-21 2021-02-16 Richard Paiz Codex search patterns
US10915523B1 (en) 2010-05-12 2021-02-09 Richard Paiz Codex search patterns
US11048765B1 (en) 2008-06-25 2021-06-29 Richard Paiz Search engine optimizer
US8180771B2 (en) * 2008-07-18 2012-05-15 Iac Search & Media, Inc. Search activity eraser
US8818992B2 (en) * 2008-09-12 2014-08-26 Nokia Corporation Method, system, and apparatus for arranging content search results
US8095545B2 (en) * 2008-10-14 2012-01-10 Yahoo! Inc. System and methodology for a multi-site search engine
CN101739407A (zh) * 2008-11-19 2010-06-16 日电(中国)有限公司 自动构建用于相关信息浏览的信息组织结构的方法和系统
MX2011006340A (es) * 2008-12-12 2011-10-28 Atigeo Llc Suministro de recomendaciones utilizando la informacion determinada para dominios de interés.
US20100161592A1 (en) * 2008-12-22 2010-06-24 Colin Shengcai Zhao Query Intent Determination Using Social Tagging
US9519712B2 (en) * 2009-01-06 2016-12-13 At&T Intellectual Property I, L.P. Systems and methods to evaluate search qualities
US8341167B1 (en) 2009-01-30 2012-12-25 Intuit Inc. Context based interactive search
CN102834823B (zh) * 2010-02-11 2017-07-28 瑞典爱立信有限公司 目录数据库处的数据管理
US8650172B2 (en) * 2010-03-01 2014-02-11 Microsoft Corporation Searchable web site discovery and recommendation
US8972397B2 (en) * 2010-03-11 2015-03-03 Microsoft Corporation Auto-detection of historical search context
US8751511B2 (en) * 2010-03-30 2014-06-10 Yahoo! Inc. Ranking of search results based on microblog data
US8825648B2 (en) * 2010-04-15 2014-09-02 Microsoft Corporation Mining multilingual topics
US11379473B1 (en) 2010-04-21 2022-07-05 Richard Paiz Site rank codex search patterns
US10936687B1 (en) 2010-04-21 2021-03-02 Richard Paiz Codex search patterns virtual maestro
US11423018B1 (en) 2010-04-21 2022-08-23 Richard Paiz Multivariate analysis replica intelligent ambience evolving system
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US9177045B2 (en) 2010-06-02 2015-11-03 Microsoft Technology Licensing, Llc Topical search engines and query context models
US20120005183A1 (en) * 2010-06-30 2012-01-05 Emergency24, Inc. System and method for aggregating and interactive ranking of search engine results
US8589378B2 (en) * 2010-10-11 2013-11-19 Yahoo! Inc. Topic-oriented diversified item recommendation
US9805022B2 (en) * 2010-12-09 2017-10-31 Apple Inc. Generation of topic-based language models for an app search engine
US20120166415A1 (en) * 2010-12-23 2012-06-28 Microsoft Corporation Supplementing search results with keywords derived therefrom
US8626681B1 (en) * 2011-01-04 2014-01-07 Google Inc. Training a probabilistic spelling checker from structured data
US9495453B2 (en) * 2011-05-24 2016-11-15 Microsoft Technology Licensing, Llc Resource download policies based on user browsing statistics
CN102810096B (zh) * 2011-06-02 2016-03-16 阿里巴巴集团控股有限公司 一种基于单字索引系统的检索方法和装置
US9529915B2 (en) * 2011-06-16 2016-12-27 Microsoft Technology Licensing, Llc Search results based on user and result profiles
US8688688B1 (en) 2011-07-14 2014-04-01 Google Inc. Automatic derivation of synonym entity names
US9268859B2 (en) 2011-10-13 2016-02-23 Yahoo! Inc. Method and system for customizing a web site
US8843477B1 (en) 2011-10-31 2014-09-23 Google Inc. Onsite and offsite search ranking results
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
US20140059443A1 (en) * 2012-08-26 2014-02-27 Joseph Akwo Tabe Social network for media topics of information relating to the science of positivism
US10007731B2 (en) * 2012-09-12 2018-06-26 Google Llc Deduplication in search results
US11809506B1 (en) 2013-02-26 2023-11-07 Richard Paiz Multivariant analyzing replicating intelligent ambience evolving system
US11741090B1 (en) 2013-02-26 2023-08-29 Richard Paiz Site rank codex search patterns
US8631325B1 (en) 2013-08-09 2014-01-14 Zoomdata, Inc. Real-time data visualization of streaming data
EP3039581A4 (en) 2013-08-29 2016-08-10 Yandex Europe Ag SYSTEM AND METHOD FOR DISPLAYING VERTICALLY RELEVANT VERTICAL RESEARCH RESULTS
US9529848B2 (en) * 2013-12-06 2016-12-27 Vmware, Inc. Predictive query result computation
US9436739B2 (en) 2013-12-13 2016-09-06 Vmware, Inc. Dynamic priority-based query scheduling
WO2015174061A1 (ja) * 2014-05-15 2015-11-19 日本電気株式会社 検索装置、方法、およびプログラムの記録媒体
US9773067B2 (en) * 2014-05-30 2017-09-26 Microsoft Technology Licensing, Llc Personal intelligence platform
RU2597476C2 (ru) 2014-06-27 2016-09-10 Общество С Ограниченной Ответственностью "Яндекс" Система и способ выполнения поиска
US10592539B1 (en) 2014-07-11 2020-03-17 Twitter, Inc. Trends in a messaging platform
US10601749B1 (en) 2014-07-11 2020-03-24 Twitter, Inc. Trends in a messaging platform
US10467269B2 (en) * 2015-02-13 2019-11-05 Samsung Electronics Co., Ltd. Accessing category-specific search servers
US9251276B1 (en) 2015-02-27 2016-02-02 Zoomdata, Inc. Prioritization of retrieval and/or processing of data
CN105335493B (zh) 2015-10-21 2017-08-29 广州神马移动信息科技有限公司 一种分层过滤文档的方法及装置
RU2634211C1 (ru) 2016-07-06 2017-10-24 Общество с ограниченной ответственностью "Траст" Способ и система анализа протоколов взаимодействия вредоносных программ с центрами управления и выявления компьютерных атак
RU2649793C2 (ru) 2016-08-03 2018-04-04 ООО "Группа АйБи" Способ и система выявления удаленного подключения при работе на страницах веб-ресурса
RU2634209C1 (ru) 2016-09-19 2017-10-24 Общество с ограниченной ответственностью "Группа АйБи ТДС" Система и способ автогенерации решающих правил для систем обнаружения вторжений с обратной связью
US9942312B1 (en) 2016-12-16 2018-04-10 Zoomdata, Inc. System and method for facilitating load reduction at a landing zone
RU2671991C2 (ru) 2016-12-29 2018-11-08 Общество с ограниченной ответственностью "Траст" Система и способ сбора информации для обнаружения фишинга
RU2637477C1 (ru) 2016-12-29 2017-12-04 Общество с ограниченной ответственностью "Траст" Система и способ обнаружения фишинговых веб-страниц
RU2656982C1 (ru) * 2017-03-27 2018-06-07 Федеральное государственное автономное образовательное учреждение высшего образования "Волгоградский государственный университет" Способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда
JP6375083B1 (ja) * 2017-03-30 2018-08-15 株式会社オプティム 検索システム、方法及びプログラム
US11017037B2 (en) * 2017-07-03 2021-05-25 Google Llc Obtaining responsive information from multiple corpora
RU2689816C2 (ru) 2017-11-21 2019-05-29 ООО "Группа АйБи" Способ для классифицирования последовательности действий пользователя (варианты)
RU2677368C1 (ru) 2018-01-17 2019-01-16 Общество С Ограниченной Ответственностью "Группа Айби" Способ и система для автоматического определения нечетких дубликатов видеоконтента
RU2680736C1 (ru) 2018-01-17 2019-02-26 Общество с ограниченной ответственностью "Группа АйБи ТДС" Сервер и способ для определения вредоносных файлов в сетевом трафике
RU2676247C1 (ru) 2018-01-17 2018-12-26 Общество С Ограниченной Ответственностью "Группа Айби" Способ и компьютерное устройство для кластеризации веб-ресурсов
RU2677361C1 (ru) 2018-01-17 2019-01-16 Общество с ограниченной ответственностью "Траст" Способ и система децентрализованной идентификации вредоносных программ
RU2668710C1 (ru) 2018-01-17 2018-10-02 Общество с ограниченной ответственностью "Группа АйБи ТДС" Вычислительное устройство и способ для обнаружения вредоносных доменных имен в сетевом трафике
RU2681699C1 (ru) * 2018-02-13 2019-03-12 Общество с ограниченной ответственностью "Траст" Способ и сервер для поиска связанных сетевых ресурсов
RU2708508C1 (ru) 2018-12-17 2019-12-09 Общество с ограниченной ответственностью "Траст" Способ и вычислительное устройство для выявления подозрительных пользователей в системах обмена сообщениями
RU2701040C1 (ru) 2018-12-28 2019-09-24 Общество с ограниченной ответственностью "Траст" Способ и вычислительное устройство для информирования о вредоносных веб-ресурсах
KR20200092742A (ko) 2019-01-25 2020-08-04 삼성전자주식회사 보이스 어시스턴트 서비스를 제공하는 시스템 및 방법
SG11202101624WA (en) 2019-02-27 2021-03-30 Group Ib Ltd Method and system for user identification by keystroke dynamics
US11250214B2 (en) 2019-07-02 2022-02-15 Microsoft Technology Licensing, Llc Keyphrase extraction beyond language modeling
US11874882B2 (en) * 2019-07-02 2024-01-16 Microsoft Technology Licensing, Llc Extracting key phrase candidates from documents and producing topical authority ranking
CN110457599B (zh) * 2019-08-15 2021-09-03 中国电子信息产业集团有限公司第六研究所 热点话题追踪方法、装置、服务器及可读存储介质
RU2728498C1 (ru) 2019-12-05 2020-07-29 Общество с ограниченной ответственностью "Группа АйБи ТДС" Способ и система определения принадлежности программного обеспечения по его исходному коду
RU2728497C1 (ru) 2019-12-05 2020-07-29 Общество с ограниченной ответственностью "Группа АйБи ТДС" Способ и система определения принадлежности программного обеспечения по его машинному коду
RU2743974C1 (ru) 2019-12-19 2021-03-01 Общество с ограниченной ответственностью "Группа АйБи ТДС" Система и способ сканирования защищенности элементов сетевой архитектуры
SG10202001963TA (en) 2020-03-04 2021-10-28 Group Ib Global Private Ltd System and method for brand protection based on the search results
US11475090B2 (en) 2020-07-15 2022-10-18 Group-Ib Global Private Limited Method and system for identifying clusters of affiliated web resources
CN111859148A (zh) * 2020-07-30 2020-10-30 深圳前海微众银行股份有限公司 主题的提取方法、装置、设备及计算机可读存储介质
RU2743619C1 (ru) 2020-08-06 2021-02-20 Общество с ограниченной ответственностью "Группа АйБи ТДС" Способ и система генерации списка индикаторов компрометации
CN112218160A (zh) * 2020-10-12 2021-01-12 北京达佳互联信息技术有限公司 视频转换方法及装置和视频转换设备及存储介质
US11947572B2 (en) 2021-03-29 2024-04-02 Group IB TDS, Ltd Method and system for clustering executable files
NL2030861B1 (en) 2021-06-01 2023-03-14 Trust Ltd System and method for external monitoring a cyberattack surface
US20230259374A1 (en) * 2022-02-16 2023-08-17 International Business Machines Corporation Task-oriented user guidance

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058575A (ja) * 2001-08-21 2003-02-28 Ricoh Techno Systems Co Ltd 検索結果情報生成装置
JP2003248691A (ja) * 2002-02-25 2003-09-05 Nippon Telegr & Teleph Corp <Ntt> 分散型検索方法、及び、分散型検索装置、及び、分散型検索プログラム、及び、分散型検索プログラムを格納した記憶媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366956B1 (en) 1997-01-29 2002-04-02 Microsoft Corporation Relevance access of Internet information services
US6078917A (en) 1997-12-18 2000-06-20 International Business Machines Corporation System for searching internet using automatic relevance feedback
IL125432A (en) * 1998-01-30 2010-11-30 Easynet Access Inc Personalized internet interaction
WO2000008573A1 (en) 1998-08-04 2000-02-17 Rulespace, Inc. Method and system for deriving computer users' personal interests
US6981040B1 (en) * 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US6546388B1 (en) 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US7099859B2 (en) * 2000-01-20 2006-08-29 International Business Machines Corporation System and method for integrating off-line ratings of businesses with search engines
US7181412B1 (en) * 2000-03-22 2007-02-20 Comscore Networks Inc. Systems and methods for collecting consumer data
US6704729B1 (en) 2000-05-19 2004-03-09 Microsoft Corporation Retrieval of relevant information categories
US6636848B1 (en) * 2000-05-31 2003-10-21 International Business Machines Corporation Information search using knowledge agents
US7085753B2 (en) * 2001-03-22 2006-08-01 E-Nvent Usa Inc. Method and system for mapping and searching the Internet and displaying the results in a visual form
US20030074400A1 (en) * 2001-03-30 2003-04-17 David Brooks Web user profiling system and method
US20020188554A1 (en) * 2001-05-04 2002-12-12 Donald Holbrook Method of employing a computer network to regulate contact between enconomic development officials and site selectors
US7082428B1 (en) * 2002-09-16 2006-07-25 Bellsouth Intellectual Property Corporation Systems and methods for collaborative searching
US7392278B2 (en) 2004-01-23 2008-06-24 Microsoft Corporation Building and using subwebs for focused search

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058575A (ja) * 2001-08-21 2003-02-28 Ricoh Techno Systems Co Ltd 検索結果情報生成装置
JP2003248691A (ja) * 2002-02-25 2003-09-05 Nippon Telegr & Teleph Corp <Ntt> 分散型検索方法、及び、分散型検索装置、及び、分散型検索プログラム、及び、分散型検索プログラムを格納した記憶媒体

Also Published As

Publication number Publication date
AU2004240188B2 (en) 2010-07-29
BRPI0500105A (pt) 2005-09-06
CN1645370B (zh) 2010-07-21
AU2004240188A1 (en) 2005-08-11
EP1557770A1 (en) 2005-07-27
AU2004240188B8 (en) 2010-09-16
RU2382400C2 (ru) 2010-02-20
RU2005101449A (ru) 2006-07-10
CA2490594C (en) 2013-09-17
CN1645370A (zh) 2005-07-27
CA2490594A1 (en) 2005-07-23
MXPA05000981A (es) 2005-10-18
KR20050076811A (ko) 2005-07-28
KR101130509B1 (ko) 2012-03-28
US7392278B2 (en) 2008-06-24
JP2005209210A (ja) 2005-08-04
US20050165753A1 (en) 2005-07-28

Similar Documents

Publication Publication Date Title
JP4694215B2 (ja) 検索を容易にするシステム及び焦点を絞った検索を行う方法
US8086591B2 (en) Combining domain-tuned search systems
US9613149B2 (en) Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
US8352396B2 (en) Systems and methods for improving web site user experience
CN105956116B (zh) 用于处理将要显示的内容的方法和系统
JP5592505B2 (ja) トピックに基づいて調整可能なデーター・フィードの総計
CN1934569B (zh) 集成有用户注释的搜索系统和方法
US9305100B2 (en) Object oriented data and metadata based search
US20090319512A1 (en) Aggregator, filter, and delivery system for online content
US20140337372A1 (en) Method of providing program using semantic mashup technology
US20070038600A1 (en) Detecting spam related and biased contexts for programmable search engines
EP2062169A2 (en) Search document generation and use to provide recommendations
KR20140058522A (ko) 소셜 네트워크의 강화된 쿼리 제안 기법
JP2006209743A (ja) ドキュメントセントリックソフトウェアアプリケーションに対するタスク指向ユーザインターフェースモデル
KR100961437B1 (ko) 개인화된 컨텐츠를 사용자 간에 공유할 수 있도록 하는방법, 시스템, 및 컴퓨터 판독 가능한 기록 매체
Herder Forward, back and home again-analyzing user behavior on the web
Vijaya et al. Metasearch engine: a technology for information extraction in knowledge computing
Renganathan et al. A Tutorial on Information Filtering Concepts and Methods for Bio-medical Searching
Sreeja et al. Review of web crawlers
Rástočný et al. Web search results exploration via cluster-based views and zoom-based navigation
RU2775824C2 (ru) Способ и система для определения аномальных посещений веб-сайтов
Guenther Getting your Web site recognized.
Chau Searching and mining the web for personalized and specialized information
Kumar et al. Exclusively your’s: Dynamic individuate search by extending user profile
Jo zed Inf t by E and I

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110218

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110223

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350