JP2006018843A - ページカテゴリ情報の使用による検索エンジン結果の分散 - Google Patents

ページカテゴリ情報の使用による検索エンジン結果の分散 Download PDF

Info

Publication number
JP2006018843A
JP2006018843A JP2005193707A JP2005193707A JP2006018843A JP 2006018843 A JP2006018843 A JP 2006018843A JP 2005193707 A JP2005193707 A JP 2005193707A JP 2005193707 A JP2005193707 A JP 2005193707A JP 2006018843 A JP2006018843 A JP 2006018843A
Authority
JP
Japan
Prior art keywords
data
index
document
category
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005193707A
Other languages
English (en)
Other versions
JP2006018843A5 (ja
Inventor
Bama Ramarathnam
ラマラスナム バマ
Darren A Shakib
エー.シャキブ ダレン
Gregory N Hullender
エヌ.ヒューレンダー グレゴリー
Nicole A Hamilton
エー.ハミルトン ニコル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006018843A publication Critical patent/JP2006018843A/ja
Publication of JP2006018843A5 publication Critical patent/JP2006018843A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】 検索エンジン結果をカテゴリ別に分散すること
【解決手段】 検索エンジン・アプリケーションは、検索要求に応答して複数の電子ドキュメントに関連付けられるドキュメント・データの検索可能インデックスにクエリして、検索要求に含まれるデータに適合するドキュメント・データを有する1つ又は複数の電子ドキュメントを識別する。検索エンジン・アプリケーションは、識別された電子ドキュメントを、ユーザに対して表示するため、ドキュメント・データに含まれるカテゴリ・データ別に分散する。
【選択図】 図2

Description

本発明は、データ通信ネットワーク上の電子ドキュメントの形の関係データを検索する分野に関する。より詳細には、本発明の実施例は、検索結果を、検索中に発見する電子ドキュメントのカテゴリにしたがって分散することに関する。
インターネットは、多数のコンピュータ上に分散した膨大な量の情報を有し、それによりユーザに、様々な題材に関する大量の情報を提供する。このことは、イントラネット及びエクストラネット等の、その他の多数の通信ネットワークについても言えることである。大量の情報がネットワークによって入手可能であるが、所望する情報を発見するのは、容易ではなく、迅速にはできない。
求める情報を、ネットワーク上で発見する際の問題に対処する検索エンジンが開発されてきた。従来の検索エンジンは、クローラ(スパイダ又はボットとも言う)を含み、これがネットワーク上の電子ドキュメントにアクセスして、それを「読取り」、次にリンクにしたがってウェブサイト内の別の電子ドキュメントにアクセスする。クローラは定期的にウェブサイトに戻って更新を探す。検索エンジンの別の部分であるインデックスは、クローラが発見する電子ドキュメントに関する情報を格納する。検索エンジンは、1つ又は複数のユーザ指定の検索用語に応答して、ユーザ指定の検索用語に関連する電子ドキュメントを含むと検索エンジンが判定するネットワーク・ロケーション(例えば、ユニフォーム・リソース・ロケータ(URL))のリストを返す。検索エンジンによっては、ユーザが選択する情報のカテゴリ(例えば、ニュース、ウェブ、画像など)及びこれらのカテゴリ内のカテゴリを提供するものもあり、これによりユーザはこれらのカテゴリから関心のある領域に絞り込むことができる。
検索エンジン・ソフト・ウエアは、典型的に、提出される検索要求を満たす電子ドキュメントに対して、それらの読取れる関連性(relevance)によってランクを付け、そのランクによって検索結果をユーザに表示する手段を提供する。典型的な関連性ランクは、所定のネットワーク・ロケーションンにある電子ドキュメントを、他の電子ドキュメントと比較して、ユーザ指定の検索用語に関連する可能性を相対的に見積もったものである。例えば、従来の検索エンジンは、電子ドキュメントに特定の検索用語が使用される回数、電子ドキュメント内におけるその位置(例えば、タイトルに使用される用語は、電子ドキュメントの最後に使用される用語より重要であると見なされることが多い)に基づいて関連性ランクを提供する。リンク分析、アンカー・テキスト分析、ウェブ・ページ構造分析、重要用語一覧の使用、及びURLテキストは、ウェブ・ページおよびその他のハイパーリンク・ドキュメントのランク付けをする別の公知技術である。
現在利用することのできる検索エンジンは、典型的に、読み取ったランクに従った検索結果の表示に限定される。残念なことにこれは、最高ランクの結果が全て1つの情報のカテゴリに含まれることがあるため、ユーザに対し十分な情報を提供できないことがある。例えば、多くの製品の名称は2つ以上の意味を有する(自動車が惑星名から命名され、パーソナル・コンピュータが果物名から命名される、等)。ユーザに対する最初のページの検索結果の価値は、ユーザがその情報、例えば、惑星としての土星と同名の自動車の何れに興味を持つかに左右される。その結果、最初のページに表示される結果には、単一の題材またはカテゴリに関連するものが多過ぎるために、ユーザはクエリを絞り込むか、又は検索結果を数ページ読む必要がある場合が多い。
このように、従来のランク付けとは無関係に、多様な題材又はカテゴリに関連する検索結果を、検索結果の単一ページに表示する検索エンジンが必要とされている。このような分散した検索結果を表示することにより、ユーザは、結果の最初のページ上で、各種の結果を閲覧することができる。
本発明の実施例は、特に、データ通信ネットワーク上で関連データを検索する改善された検索方法を提供することにより、先行技術における1つ又は複数の難点を克服する。検索要求に応答して、検索結果の最初のページ上で、様々な検索結果をユーザに対し表示することにより、本発明は、ユーザがいっそう容易に関連ドキュメントをネットワーク上で発見することを可能にする。詳細には、本発明の一実施例は、検索結果をカテゴリ別に分散して、ユーザが、異なるカテゴリに関する検索結果を、検索結果の最初のページ上で容易に閲覧することができるようにする。検索結果をカテゴリ別に分散することにより、各種カテゴリ範囲内の結果を、検索結果の次のページにスクロール又は移動することなく、閲覧することができる。さらに、検索結果を検索結果の最初のページ上でカテゴリ別に分散することにより、ユーザは関連する結果をいっそう簡単に識別することができ、したがって、いっそう楽しく効率的な検索を経験することができる。加えて、ここに記述する本発明の特徴は、現在利用可能な技術より実行が面倒な場合が少なく容易であると同時に、経済的に実現可能で、商業的に実用的である。
本発明の一態様にかかる検索結果作成方法を提供する。この方法は、ユーザからの検索要求を受信することを含む。その方法は、受信した検索要求の関数として検索可能なインデックスにクエリして、検索要求に関連する電子ドキュメントを識別することも含む。このインデックスは、複数の電子ドキュメントに関連付けられるドキュメント・データを含む。このドキュメント・データは、各々の電子ドキュメントに関連付けられる1つ又は複数のカテゴリを特定する。この方法は、識別された電子ドキュメントに関連付けられる1つ又は複数のカテゴリの関数として、前記クエリの結果をソートすることを含む。この方法はさらに、異なるカテゴリ内の1つ又は複数の識別された電子ドキュメントは、ユーザに対し単一ページ上に表示されるようにソートした結果を表示する。
本発明の別の態様により、コンピュータ可読媒体は、検索結果を生成するコンピュータ実行可能命令を含む。検索フォーム・コンポーネントは、ユーザからの検索要求を受信する。検索エンジン・コンポーネントは、受信した検索要求の関数として検索可能なインデックスにクエリして、検索要求に関連する電子ドキュメントを識別し、前記クエリの結果をソートする。このインデックスは、複数の電子ドキュメントに関連付けられるドキュメント・データを含む。このドキュメント・データは、各々の電子ドキュメントに関連付けられる1つ又は複数のカテゴリを特定する。結果は、識別された電子ドキュメントに関連付けられる1つ又は複数のカテゴリの関数としてソートされる。ユーザ・インターフェース・コンポーネントは、格納した結果を、異なるカテゴリ内の1つ又は複数の識別された電子ドキュメントが、ユーザに対し単一ページ上に表示されるように表示する。
本発明の別の態様にかかる、クライアント・コンピュータを介してユーザから受信する検索要求に応答して検索結果を生成するシステムを、提供する。このシステムは、クライアントを介してユーザから検索要求を受信する第1サーバを含む。この第1サーバは、通信ネットワークを介してクライアントに結合される。このシステムは、複数の電子ドキュメントに関連付けられるドキュメント・データを含むインデックスも含む。このドキュメント・データは、各々の電子ドキュメントに関連付けられる1つ又は複数のカテゴリを特定する。前記第1サーバは、受信した検索要求の関数としてインデックスにクエリして、検索要求に関連する電子ドキュメントを識別し、前記クエリの結果をソートするように構成されている。結果は、識別された電子ドキュメントに関連付けられる1つ又は複数のカテゴリの関数として、クライアント側のユーザに対し、異なるカテゴリ内の1つ又は複数の識別された電子ドキュメントは、単一ページ上に表示されるようにソートされる。
本発明のさらに別の態様にかかる、検索可能データ構造を格納する1つ又は複数のコンピュータ可読媒体を提供する。第1フィールドは、ネットワーク上に置かれる電子ドキュメントに関連付けられる検索エンジンのインデックス用語を表すデータを格納するためのフィールドである。インデックス用語は、電子ドキュメント中に含まれる。第2フィールドは、電子ドキュメントに関連付けられるカテゴリを表すデータを格納するためのフィールドである。第3フィールドは、電子ドキュメントのネットワーク上の位置を表すデータを格納するためのフィールドである。第2フィールドに含まれるドキュメント・データは、第1フィールドにより、1つ又は複数のカテゴリがインデックス用語に関連付けられるようにインデックスされ、第3フィールドに含まれるデータは、第2フィールドにより、電子ドキュメントの1つ又は複数の電子ドキュメントの位置が、1つ又は複数の各々のカテゴリに関連付けられるようにインデックスされる。
ここで、本発明を利用することのできる例示的なネットワーク環境100を示す図1を参照する。クライアント102が、インターネット(又はワールド・ワイド・ウェブ)などの、データ通信ネットワーク104に結合されている。1つ又は複数のサーバが、ネットワーク104を介し、インターネット上における情報交換に一般的に使用される、ハイパー・テキスト転送プロトコル(HTTP)等のプロトコルを使用してクライアント102と通信する。図示する実施例においては、フロントエンド・サーバ106及びバックエンド・サーバ108(例えは、ウェブ・サーバ、またはネットワーク・サーバ)が、ネットワーク104に結合されている。クライアント102は、ネットワーク104、フロントエンド・サーバ106、およびバックエンド・サーバ108を利用して、例えば、1つ又は複数のサーバ・ノード110に格納されるウェブ・ページ・データにアクセスする。このようにして、クライアント102は、1つ又は複数のサーバ・ノード110が維持するウェブ・ページ・データ112に対するネットワーク104を介したアクセスを要求することができる。
本発明の実施例は、多様な検索結果を、ユーザ114に対して、ユーザ指定の検索結果に応答する検索結果の単一ページ上への表示を可能にすることにより、データ通信ネットワーク上の関連データの改善された検索を提供する。詳細には、本発明の一実施例においては、検索結果を、ユーザ114が異なるカテゴリに関する検索結果を、検索結果の最初のページ上で、容易に閲覧することができるように、カテゴリ別に分散する。検索結果をカテゴリ別に分散することにより、ユーザ114は、検索結果の次のページにスクロール又は移動することなく、各種のカテゴリ内の結果を閲覧することができる。さらに、検索結果をカテゴリ別に検索結果の単一ページ(例えば、最初のページ)上に分散することにより、ユーザは、関連する結果をいっそう簡単に識別することができるので、いっそう楽しく効果的な検索を経験することができる。
この実施例において、ユーザ114はクライアント102を使用して、関心のある特定の題材について、記述する及び/又はそれに関連する電子ドキュメント(例えば、ウェブ・ページ)をユーザ114が識別したい、関心のある特定の題材について、1つ又は複数の用語を含む検索要求を入力する。例えば、フロントエンド・サーバ106は、クライアント102に対し応答して、ユーザ114を認証し、認証されたユーザからの要求をバックエンド・サーバ108にリダイレクトする。
バックエンド・サーバ108は、1つ又は複数のアフィリエイト・ノード・サーバ(affiliated node servers)110に対しクエリを提出するリダイレクトされた検索要求等に応答して、ユーザに関連する電子ドキュメント(即ち、検索結果)に関するデータを取り出す。各アフィリエイト・ノード・サーバは、インターネットを介して利用することのできるウェブ・ページ等の電子ドキュメントに関する情報を収容する中央データ・インデクス(インデクス)116に。さらに、各々のノード・サーバ110は、以前に取り出したドキュメント・データ(即ち、ウェブ・ページ・データ112)を格納するメモリ・キャッシュ(示さず)を含んでもよい。図2を参照して以下に詳細を記述するように、インデックス116は、位置(location)(例えば、リンク、又はURL)、メタタグ、テキスト、およびドキュメント・カテゴリ等の、電子ドキュメントに関するデータを含む。図1の例においては、1つ又は複数のアフィリエイト・ノード・サーバ110から受信する検索結果をカテゴリ別に分散すること、分散検索結果をユーザ114に対しクライアント102を介して表示することとの関連において、本発明は記述されている。とりわけ、フロントエンド・サーバ106及びバックエンド・サーバ108はネットワーク環境内の異なる構成要素として記述されているが、単一サーバが双方の機能を実行することができることは、理解できる。
本発明は、検索エンジン・アプリケーション(アプリケーション)118を採用する。これは、バックエンド・サーバ108により実行され、クライアント102から受信する検索要求に応答して各種カテゴリ内のウェブ・ページ等(即ち、電子ドキュメント)を識別する。より具体的には、アプリケーション118は、インデックス116から、検索要求に含まれる1つ又は複数の用語に対応する各種カテゴリ内の関連ウェブ・ページを識別し、識別されたカテゴリ毎に、クライアント102を介してユーザ114に表示すべき、最も関連のあるウェブ・ページを識別する。例えば、ユーザ入力(即ち、検索要求)が用語「apple」を定義しているとき、検索エンジン・アプリケーション118は、結果を果物のカテゴリとApple(登録商標)コンピュータのカテゴリに分散する。カテゴリ化を通して分散すること、および各カテゴリから最良の(即ち最も適合度の高い)結果のいくつかを表示用に選択することにより、ユーザ114は、検索結果の最初のページ上で、異なる様々なカテゴリに関連付けられる最も適合度の高いウェブ・ページを閲覧することができる。
ここで図2を参照すると、ブロック図は、インデックス116を取り込んで使用する例示的コンピュータ・ネットワーク200の構成要素を示している。本発明は、これに対してアクセスして、検索結果を各種カテゴリの中から取出し、検索結果の単一ページ上に表示する。
一実施例において、フェッチング・サーバ204は、シード・データ(seed data)206に応答してフェッチング・モジュール(fetching module)208を実行し、ウェブ・ページのようなHTMLドキュメントを、インターネット(又はワールド・ワイド・ウェブ)104を介してアクセス可能な各種ウェブ・サーバ210から取出す。当業者には公知のように、シード・データ206は、URLのリストを含み、その各々は、1つ又は複数のHTMLドキュメントを含む特定のウェブ・サーバの位置を識別する。フェッチング・モジュール208は、シード・データ206(即ち、シードURL)を使用して、ネットワーク104(例えば、ワールド・ワイド・ウェブ)のクロールを開始する。ここで使用する用語「クロール(crawl)」は、シード・データ206が識別するウェブ・ページ上のコンテンツを取り出して分析するプロセスを意味する。例えば、クロールする過程で、取出されたウェブ・ページの各々に含まれるURLを、フェッチング・モジュール208により識別して、それを使用して、追加のウェブ・ページにアクセスして内容を分析する。
インターネットで利用可能なウェブ・ページの量は膨大であるため、各々がフェッチング・モジュール208を実行する複数のフェッチング・サーバ204が、ウェブ・ページのコンテンツを取り出して分析するのに使用することができる。例えば、フェッチング・サーバ204のグループを、ドメイン・ハッシュで区分することができる。ドメイン・ハッシュは、URLの標準型を意味する。例えば、URL「http://www.a.com/services」は、「http:www.a.com:80」に変形することができる。例えば、この10バイト・ハッシュの文字列を取り上げて、そのハッシュ文字列内の特定バイト(例えば80)が、ハッシュのその特定パーティションを扱うフェッチング・サーバ204の判定に使用する。言い換えると、各フェッチング・サーバ204は、ドメイン・ハッシュ空間の1つのパーティションを担当する。例えば、4つのフェッチング・サーバ204があって、全ドメイン・ハッシュ空間が、1−400の範囲の値を有するとき、分割の内訳は次のようになる。
フェッチング・サーバ 1:
下位ハッシュ:1
上位ハッシュ:100
フェッチング・サーバ 2:
下位ハッシュ:101
上位ハッシュ:200
フェッチング・サーバ 3:
下位ハッシュ:201
上位ハッシュ:300
フェッチング・サーバ 4:
下位ハッシュ:301
上位ハッシュ:400
したがって、「http:www.a.com:80」と変形されたURLの場合は、フェッチング・サーバ#1が、その特定URLに再割当てされる。その後、フェッチング・モジュール208が、取出した電子ドキュメントを、インデックス・ビルダ・モジュール(index builder module)214に渡す。
インデックス・ビルダ・モジュール214は、受信したウェブ・ページに応答して、フェッチング・サーバ204により実行可能であり、取り出した各々のウェブ・ページのコンテンツを分析してドキュメント・データを識別し、受信した各々の電子ドキュメントについて、識別されるドキュメント・データのインデックス116を作成して維持する。この実施例において、インデックス116は、サーバ204のメモリ216内に格納されており、識別されたデータ構造の各種の型の体系的なリストとそのスキーマを含む。例えば、インデックス・ビルダ214は、特徴抽出ツール217を含み、取り込んだ電子ドキュメントを分析して構造データ(例えば、URL、ワード、メタタグ等)を検出し、検出した構造データを表すインデックス用語を、メモリ216内のインデックス116に対して、次々に追加する。とりわけ、インデックス116はサーバ204上のメモリ216内に維持されると上述したが、このインデックスをリモート・サーバに関連付けられる外部ストレージ媒体上に維持することが可能であると考えられている。
カテゴリ・ツール218は、インデックス116にリンクしており、取り出した各々のウェブ・ページの1つ又は複数のカテゴリを、分析したコンテンツ(即ち、識別されたドキュメント・データ)の関数として識別し、オープン・ディレクトリ・プロジェクト(ODP)又は以前にカテゴリ化されたウェブ・ページに関するインデックス・データなどの、1つ又は複数の外部データ・ソースを識別する。
当業者には公知のように、ODPは、人によって分類されたコンテンツの、最も広く配布されているデータベースの1つである。例えば、ODPが、URL www.gs.com.を有するウェブ・ページをビジネス→金融(Finance)に属すると分類し、URL www.gs.com/venturecapital/を有するウェブ・ページをビジネス→金融→起業家精神(Entrepreneurship)に属すると分類すると仮定しよう。カテゴリ・ツール218に、カテゴリ化するためにURL www.gs.com/venturecapital/foo/bar.htmlが与えられると、先ず、適合する(matching)URLを求めて、外部データ・ソース及び/又はインデックスにクエリする。URL www.gs.com/venturecapital/foo/bar.htmlが発見できない場合、カテゴリ・ツール218は、次に、www.gs.com/venturecapital/fooを求めて、外部データ・ソース及び/又はインデックスに、クエリする。最終的に、www.gs.com/venturecapital/fooが発見できない場合、カテゴリ・ツール218は、www.gs.com/venturecapitalを点検して、そのウェブ・ページ(即ち、www.gs.com/venturecapital/foo/bar.html)に、ビジネス→金融→起業家精神のカテゴリを割当てる。www.gs.com自体にカテゴリを持たせることも可能である。また、短いURLが、個別のカテゴリを有することも可能である。例えば、www.gs.comは、ビジネス→金融だけになる。特定のページをカテゴリ化した後、その特定ページについて識別されるカテゴリ情報は、インデックス116内に維持される。インデックス内で特定される識別されたデータの型には、ドキュメント源(document origin)(即ちURL)、ワード、メタタグ、ハイパー・テキスト転送プロトコル(HTTP)ヘッダで返されるドキュメント・データ、リソース記述フレームワーク(RDF)データ、も含まれる。識別されたカテゴリと共に、カテゴリに信頼水準を割当ててもよい。例えば、ハワイに関する旅行ページは、信頼度80%の「リクリエーション\旅行」のカテゴリと、信頼度75%の米国\州\ハワイのカテゴリを含んでもよい。
ランク付けツール220は、特定のカテゴリ内のドキュメントについて、関連性評価値(relevance rating)を算出する。一実施例において、ランク付けエンジンは1つ又は複数の学習ベースの分類器(classifiers)を使用して、選択されるカテゴリ又は題材(自動車のような)に関連するドキュメントに関する1つ又は複数の評価値(rating)を判定し、次にその結果を組合せて全体としての分類及び/又は評価値を作成する。ドキュメントの評価には様々な学習ベースの分類器を使用することができる。このような分類器の例には、デシジョン・ツリー、ニューラル・ネットワーク、ベイジアン・ネットワーク(Bayesian networks)、および同一出願人による米国特許6,192,360号に記述されるようなサポート・ベクトル・マシンが含まれるが、これらに限定されない。米国特許6,192,360号の開示全文は、ここに参照して組み込まれる。特定のカテゴリに関連する特定のドキュメントについて判定した評価値は、当該インデックス内でドキュメントを編成するのに使用することができる。
単一のコンピュータには大きなインデックスを格納するのに十分なメモリがないため、インデックス116は、多数のアフィリエイト・サーバ(例えば、数百のアフィリエイト・ノード・サーバ110)全体に亘って分散してもよい。したがって、インデックス116は、多数のコンピュータ上に1つ又は複数のファイル(例えば、ドキュメント)として格納される。さらに、多数のアフィリエイト・サーバ(又はサーバ110)は各々、インデックス116のサブセットを含んでもよい。例えば、インデックス116には10億ものネットワーク・ロケーションンをリストアップしてもよく、この場合、ネットワーク・ロケーションン1−1000は、第1アフィリエイト・サーバ上に格納されるサブインデックス222内にリストし、ネットワーク・ロケーションン1001−2000は、別のアフィリエイト・サーバ上に格納されるサブインデックス222内にリストするといった具合である。このとき、これらのファイルは、単一の大きいファイルとして扱えるように、連結するか、又はリンクして長いネットワーク・ロケーションのリストにする。検索要求に応答して、クエリ・プロセッサが、インデックス116を含むコンピュータにクエリを発行する。
本発明の一実施例においては、インデックス・ビルダ214は、多数のアフィリエイト・サーバに分散するため、例えば、リストされたインデックス用語に基づいてインデックス116を分割する。したがって、これらのファイル内のインデックス用語のパーティションが分かっている場合は、特定のインデックス用語が出てくる特定のファイルを、このインデックス用語が1つ以上のファイルに出てくる場合でも判定することができる。本発明の別の実施例において、インデックス・ビルダ214は、インデックス116を多数のアフィリエイト・サーバに対して、ランダムに、又は半ランダムに配分する。インデックス116をランダム又は半ランダムに分散することにより、クエリ・プロセッサ間に効率の良い負荷配分をもたらす。これにより、例えば、頻出用語のコロケーションのため、特定のクエリ・プロセッサが別のクエリ・プロセッサより多量のクエリを処理することが回避できる。こうして、インデックス116をランダム又は半ランダムに分散することにより、クエリ処理がクエリ・プロセッサ間でより均等に、予想通りに分割される。
インデックス116を複数のサーバにわたって配分するため、インデックス・ビルダ214は、インデックス116を複数のチャンクに分割する。詳細には、インデックス・ビルダ214は、検出した構造データから判定されるインデックス用語を、インデックスからなる複数のチャンクに編成し、それらのチャンクを複数のコンピュータに分散することにより、インデクス116を作成する。定期的に、インデックス・ビルダ214は、新しいインデックスのチャンクをインデックス116の中にスタックする。つまり、インデックス・ビルダ214は、定期的に(例えば、1分間に5回)、小さな、追加のインデックスの小さな集まりを、より大きいインデックス116にマージする。
本発明の一実施例において、最新のデータを表す新しいインデックスのチャンク(即ち、以前に取得して解析した電子文書は、新しい又は最新の構造データを含む可能性がある)をインデックス116にマージするため、インデックス・ビルダ214は、先ず新しいチャンクを抽出する。続いて、インデックス・ビルダ214は、新しいチャンクのセット内の最初のインデックス用語を検出する。インデックス・ビルダ214は、さらに、新しいチャンクのセット全体を通してこのインデックス用語に関連付けられるネットワーク・ロケーションと属性とを、結合して単一のリストを作成する。次に、インデックス・ビルダ214は、このリストを新しいインデックス・ファイルに挿入する。さらに、インデックス・ビルダ214は、新しいチャンクをインデックス116にマージした際に、インデックスのチャンクを更新可能なインデックス116から定期的に削除する。加えて、インデックス・ビルダ214が新しいインデックスのチャンクをマージする前に、これらの新しいチャンクは、クエリ・プロセッサによるクエリには利用することができない。しかし、インデックス・ビルダ214が新しいチャンクをインデックス116にマージした後は、新たにマージされたインデックス116をクエリに利用することができる。2つのページが同一であるか否かを判定して、クエリの際の重複を解消するのを助けるため、シングル・プリント(shingle prints)を使用する。シングル・プリントは、6つの、16ビットの符号なしの値で構成される。各々の16ビット値は、2つのドキュメントの間の重要な統語的類似性を表現する。例えば、2つのドキュメント間の基礎にある類似性が95%以上であるとき、6つのシングル(shingle)のうち4つは、ほとんど常に一致する。
ここで、表1を参照するが、例示的なインデックス116に含まれるドキュメント・データを示す。
Figure 2006018843
図1及び2を参照して上述したように、インデックス116は、クロールする過程に識別される複数の電子ドキュメントに関するドキュメント・データを含む。各カラム(C1−C5)は、特定の電子ドキュメントに関する様々なデータ・フィールドの値に対応する。各行(R1−R5)は、特定の電子ドキュメントに対応する。この例において、インデックスは、一意のインデックス用語(unique index terms)(即ち、ワード)のリストを含む。一意のインデックス用語(index term)に続いて、カテゴリ識別子(カテゴリID)のリストがあり、各々一意のインデックス用語を有する電子ドキュメントが割当てられている特定のカテゴリを表す。カテゴリIDは、特定のカテゴリIDを一意に識別する指定されたバイト値(例えば4バイト)の一意のカテゴリIDで、クエリと集約の目的に使用することができる。例えば、ODPのようなカテゴリ・データ・ソースにより割当てられる各カテゴリもまた、一意のカテゴリIDを割当てられる。例えば、表1に記載する値2のカテゴリIDは、フルーツのカテゴリに対応する(例えば、表1のR1とC2の位置のセル参照:以下R1C2と呼ぶ)。一実施例において、インデックス116は、カテゴリ名のリストとそれに対応するカテゴリIDを含むルックアップ表にリンクしている。こうして、カテゴリIDが与えられると、インデックス・ビルダ214は検索要求に応答して、この表にクエリし、特定のカテゴリIDに関するカテゴリ名を迅速に取り出す。さらに、カテゴリIDが与えられると、インデックス・ビルダ214はそのカテゴリの親カテゴリ及びサブ・カテゴリの全部を識別することができる。例えば、図1を参照して上述の例に触れると、ユーザがカテゴリ「ビジネス→金融→」の中にあるウェブ・ページに対応する検索用語を入力すると、検索エンジンは、ビジネス→金融→住宅ローンのような、このカテゴリのサブ・カテゴリからの結果全てを示すことが可能になる。
別の例として、最初の検索用語に応答して取り出される検索結果が、自動車\サターンのカテゴリ内にある場合、ユーザは、自動車\サターンのカテゴリでさらに結果を閲覧する選択肢を選んでもよい。この場合、サターンのサブ・カテゴリで分散が生じる。サブ・カテゴリには、中古車、販売特約店、アフター・サービス、モデルの詳細等を含むことができる。反対に、ユーザが最初の検索用語としてサターン(Saturn)を入力すると、分散はトップ・レベルで生じ、トップ・レベルでカテゴリが異なるので、異なる検索結果が取り出される。例えば、結果は自動車\サターン、科学\惑星\サターン、又はリクリエーション\占星術\星占い等のカテゴリに入ることもある。言い換えると、クエリ用語によって、ユーザは、トップ・レベルのカテゴリとサブ・カテゴリの何れでも検索結果を閲覧することができる。その結果、ユーザには、検索結果を絞り込むか又はカテゴリをフィルタで除去するかして、関心のあるカテゴリ内の検索結果が分散したフォーマットでユーザに示されるようにすることができる。
カテゴリIDの次にくるのは、一意のインデックス用語が出現するカテゴリIDを有する電子ドキュメントのドキュメントIDのリストである。ドキュメントIDは、URL、又はURLを表すドメイン・ハッシュの形でもよい。さらに、ドキュメントIDの次は、ドキュメントIDにより表わされる電子ドキュメントのインデックス用語の属性のリストである。このような属性は、検索結果における電子ドキュメントの関連性ランクを判定するのに使用される。例えば、この関連性ランクは、ランク・ツール220により判定されるときの、特定のカテゴリに関連する特定のドキュメントについての関連性評価値の属性に対応する。さらに、ドキュメントIDの属性の次には、インデクス116が維持している各々の特定のドキュメントIDに関する文脈上の記述(contextual description)又は抜粋(snippets)片に対応するコンテンツのチャンク・データである。即ち、コンテンツのチャンク・データは、ディスプレイを介してユーザに表示するための、ドキュメントIDにより確認される各ウェブ・ページに関する概要記述情報を含む。
表1に示すように、インデックス116の例示的部分は、インデックス用語「アップル」(R1C1を参照)を含む。このインデックス用語の次にあるのが、インデックス用語「アップル」に対応するドキュメント・データが存在するカテゴリIDのリストである。この例においては、カテゴリIDの値2及び4(R1−R3C2及びR4−R6C2を参照)が、用語「アップル」に対応する。各々のカテゴリIDの次にあるのは、電子ドキュメントのドキュメントIDのリストであり、特定のインデックス用語に対応するドキュメント・データが存在する特定のカテゴリIDを有するリストである。その結果、ドキュメントIDは、インデックスにリストアップされた特定の用語に対応する各カテゴリIDにしたがって、グループ分けすることができる。例えば、インデックス用語「州−ワシントン」に対応するドキュメント・データは、307、308、及び315のドキュメントIDを有する電子ドキュメント内に存在する。また、表1に示すように、インデックス116の例示的部分は、のリストの次のインデックス用語「サターン」を含む。これらの各々のカテゴリIDの次にあるのは、このインデックス用語に対応するドキュメント・データが出現する電子ドキュメントのドキュメントIDのリストである。
次に図3を参照すると、例示的ブロック図は、本発明の一実施例にかかる構成要素のクライアント102、アプリケーション・サーバ304(例えば、バックエンド・サーバ108)、及び1つ又は複数のアフィリエイト・サーバ110を示す。
クライアント・アプリケーション306により、ユーザ114は、通信ネットワーク104を介してサーバ304からHTMLドキュメントを取り出すことができる。クライアント・アプリケーション306は、クライアント102により実行可能で、このようなHTMLドキュメント(即ち、ウェブ・フォーム)310の取り出しを開始するためのユーザ入力データに応答する。当業者には、クライアント・アプリケーション306が、マイクロソフト社が提供するインターネット・エクスプローラ(登録商標)ブラウザのようなウェブ・ブラウザであることは明白である。ユーザ114は、頻繁にクライアント・アプリケーション306を使用して、サーバ304と連絡を取り、ユーザ114から入力データを受け取るウェブ・フォーム310を取り出す。
クライアント102にリンクするユーザ・インターフェース(UI)314により、ユーザ114は、取り出したウェブ・フォーム310と交信することができる。例えば、UI314は、319に示すように、ウェブ・フォーム310を閲覧するコンピュータ・モニタのようなディスプレイ316、及びウェブ・フォーム310にデータを記入するキー・ボード又はポインティング・デバイス(例えば、マウス、トラック・ボール、ペン、又はタッチパッド)のような入力置318を含む。言い換えると、UI314によりユーザ114は、ホーム・クライアント上で検索データを特定することができ、また、サーバ304に要求を提出して、特定したデータに対して、各々のアフィリエイト・サーバ110上に維持されているインデックス・データ112(又はサブインデックス・データ222)を、検索することができる。
この例示的実施例において、アプリケーション・サーバ304は、ユーザ要求の認証と、認証したユーザに対するリソース及び/又はサービスの提供の双方ともおこなう(例えば、フロントエンド・サーバ106及びバックエンド・サーバ108として作動)。検索エンジン・アプリケーション322は、ユーザの検索要求に応答して、アプリケーション・サーバ304により、アフィリエイト・サーバ110の各々が維持するインデックス・データ112に、特定した検索データに適合するドキュメント・データをクエリすることが可能である。例えば、ユーザは、クライアント・コンピュータ102を使用して、用語「アップル」をウェブ・フォームに入力し、用語「アップル」についての検索要求をサーバ304に提出する。検索エンジン・アプリケーション322は、インデックス・データ112にリストアップされているインデックス用語をクエリして、ユーザの特定する検索データに適合するインデックス用語を問い合わせするクエリ命令324を含む。適合するインデックス用語を発見した場合、検索エンジン・アプリケーション322は、取り出し命令325を実行して、対応するカテゴリIDデータ、ドキュメントIDデータ、属性データ、及びコンテンツのチャンク・データをインデックスから取り出す。検索エンジン322は、図4に示すような検索結果フォームをディスプレイ316の上でユーザに対し表示するための分散命令326を含む。表示した検索結果は、適合するインデックス用語に対応する特定のドキュメントIDにより識別される、各電子ドキュメントの概要記述情報(即ちコンテンツのチャンク・データ)を含む。
一実施例において、分散命令326は、検索結果フォームを生成し、その中で適合するインデックス用語に隣接するインデックス内にリストアップされた各々のカテゴリIDに対して、所定数のドキュメントIDのコンテンツのチャンク・データが表示される。一例として、検索用語「アップル」に関し分散命令326は、用語「アップル」に関連付けられる次のカテゴリ、ビジネス又はメーカー(例えば、アップル(登録商標)コンピュータ)、調理レシピ、科学/健康、及び農業、の各々について最大5つのリンクを表示するフォーム328を生成する。ここで、もう一度、表1を参照すると、生成された検索結果フォームは、表1に示すインデクス内にリストアップされた概要記述データのような、コンテンツのチャンク・データを含んでもよい。さらに、適合する用語を有すると識別された各々の電子ドキュメントに関して表示されるリンク及び/又はコンテンツデータは、特定のカテゴリにしたがってリスト内でグループ分けされ、特定のカテゴリに対応するカテゴリIDに隣接してリストアップされる各々のドキュメントIDに関連付けられる関連性評価値にしたがって、編成される。例えば、検索用語「アップル」に関し、概要記述「リンゴ&長期保存リンゴ」を有する電子ドキュメントは、フルーツ・カテゴリ(即ち、カテゴリID=2)に関連してグループ分けしたリストのトップに出現し、概要記述「リンゴ&栄養リンゴ料理」を有する電子ドキュメントは、この特定のグループ分けの隣に出現し、概要記述「簡易フルーツ・サラダ」を有する電子ドキュメントは、この特定のグループ分けの最後に出現する。したがって、ユーザ114が定義する検索用語が広い範囲のカテゴリに関連付けられる場合であっても、ユーザには、異なるカテゴリから最良の結果が検索結果の最初のページ上に供給されるので、ユーザは所望の結果を容易に識別することができる。
別の実施例において、検索結果フォーム上にユーザに対し表示される検索結果の数は、適合するインデックス用語に近いインデックス・データ112内にリストアップされるカテゴリID(即ちカテゴリ)の数の関数である。例えば、適合するインデックス用語に近い用語として全体で3つのカテゴリIDがリストアップされている場合、上位3分の1(33.33%)の関連性評価値を有するドキュメントIDに対応するコンテンツのチャンク・データが、検索結果フォームを介してユーザ114に表示される。言い換えると、ユーザの特定する検索用語が広い範囲の題材(即ち、カテゴリ)に関連付けられる場合でも、ユーザは所望の結果を容易に識別することができるように、ユーザ114には、異なるカテゴリからの結果が、検索結果の単一ページ上に供給される。
さらに別の実施例において、検索エンジン・アプリケーション322は、広告検索命令330を含む。広告検索命令330は、取り出したカテゴリIDデータに応答して、1つ又は複数の識別されたカテゴリに関連する広告情報に関し、検索結果上でユーザに対し表示するため、アプリケーション・サーバ304により、第3者データ・ソース332をクエリすることが可能である。例えば、カテゴリIDデータが自動車のカテゴリを指定する場合、広告命令330は、第3者データ・ソースをクエリし、自動車メーカーに関連する広告バナーを表示する。さらに別の例として、再度表1を参照すると、一致するインデックス用語が「サターン」(R1:C10参照)の場合、対応するカテゴリIDデータ・フィールドのうち1つは、値「7」(R2:C10参照)を有しており、これは、この例において、自動車カテゴリを示す。広告命令330は、サターン(登録商標)自動車販売店に関する広告情報を表示する。
次に図5を参照すると、例示的フローチャートが、検索結果の単一ページ上でのユーザ114に対する表示のため、カテゴリ別に検索結果を分散する方法を示す。502において、検索エンジン・アプリケーション118のようなアプリケーションが、ユーザ114から検索要求を受信する。この検索要求は、ユーザが定義する用語で、インターネットを介して利用することのできる1つ又は複数の所望のウェブ・ページに、出現するか、又は出現することが期待される1つ又は複数の用語、を指定する(例えば、単一のワード、複数のワード)。検索エンジン・アプリケーション118は、複数の既知ウェブ・ページに関するインデックス用語を含むドキュメント・データを格納するインデックス116にクエリし、504において指定したインデックス用語に適合するインデックス用語を有する1つ又は複数の既知ウェブ・ページを識別する。506においては、検索エンジン・アプリケーション118は、識別された1つ又は複数の各々のウェブ・ページに関して、格納されたドキュメント・データから、カテゴリ及びドキュメント位置を識別する。検索エンジン・アプリケーション118は、508において識別された1つ又は複数の各々のドキュメントに関して、格納されたドキュメント・データから、評価値(レーティング、rating)又はランク付与値を判定する。ランク付与又は評価値は、識別された特定のドキュメントの識別された特定のカテゴリに対する関連性を指示する。510においては、プロセスは、格納されたドキュメント・データから概要記述を識別して、識別された各々のドキュメントに関する検索結果として示す。検索エンジン・アプリケーション118は、512で、例えば、識別された各々のカテゴリに関する所定量の検査結果が、ユーザに対し検索結果の最初のページ上に表示されるように、検索結果を分散する。言い換えると、識別された各々のカテゴリ(即ち、カテゴリID)関しての検索結果のグループが、検索結果の最初のページ上に表示される。検索結果は、識別されたドキュメント位置(例えば、ドキュメントID)も含むが、これは、概要記述と共にユーザに提示される識別された共通のカテゴリにしたがって、グループ分けされている。好適な一実施例において、グループ分けされた検索結果は、特定のカテゴリ・グループ内に表示される各々のドキュメントID及び/又は概要記述がそれらの対応するランク付与値に応じた順序で並ぶように、編成される。
ここで図6を参照すると、汎用コンピューティング・デバイスが、コンピュータ130の形で示されている。本発明の一実施例において、コンピュータ130のようなコンピュータは、ここに示して記述する他の図において使用するのに適している。コンピュータ130は、1つ又は複数のプロセッサ又は処理ユニット132及びシステム・メモリ134を有する。図示する実施例において、システム・バス136は、システム・メモリ134を含む各種システム・コンポーネントをプロセッサ132に結合する。バス136は、メモリ・バス又はメモリ・コントローラ、周辺バス、加速式グラフィック・ポート、及び各種バス・アーキテクチャの何れかを使用するプロセッサ又はローカル・バスを含むいくつかの型のバス構造のうちのいずれか1つ又は複数を表す。限定するものではないが、一例として、これらのアーキテクチャは、業界標準アーキテクチャ(ISA)バス、マイクロ・チャネル・アーキテクチャ(MCA)バス、拡張ISA(EISA)バス、ビデオ電子規格協会(VESA)ローカル・バス、及びメザニン・バスとしても知られる周辺部品相互接続(PCI)バスを含む。
コンピュータ130は、典型的に少なくとも何らかの形でコンピュータ可読媒体を有する。コンピュータ可読媒体は、揮発性及び不揮発性媒体、リムーバブル及び非リムーバブル媒体を含むが、コンピュータ130がアクセスすることのできる利用可能な媒体であればいずれでもよい。限定するものではないが。一例として、コンピュータ可読媒体は、コンピュータ・ストレージ媒体と通信媒体を含む。コンピュータ・ストレージ媒体は、コンピュータ可読命令、データ構造体、プログラム・モジュール又はその他のデータのような情報を格納する任意の方法又は技術により、実施される揮発性及び不揮発性媒体、リムーバブル及び非リムーバブル媒体を含む。例えば、コンピュータ・ストレージ媒体は、RAM、ROM、EEPROM、フラッシュ・メモリ又はその他のメモリ技術、CD−ROM、デジタル揮発性ディスク(DVD)又はその他の光ディスク・ストレージ、磁気カセット、磁気テープ、磁気ディスク・ストレージ又はその他の磁気ストレージ装置、又は所望の情報を格納するのに使用され、コンピュータ130がアクセスすることのできるその他の任意の媒体を含む。通信媒体は典型的に、コンピュータ可読命令、データ構造体、プログラム・モジュール又はその他のデータを、搬送波又はその他の転送機構のような変調データ信号内に具現し、任意の情報配送媒体を含む。当業者は、信号内の情報を符号化する方法で、その1つ又は複数の特性を設定又は変更する変調データ信号に精通している。有線ネットワーク又は直接配線接続のような有線媒体、及び音響、RF、赤外線及びその他の無線媒体のような無線媒体は、通信媒体の例である。上の何れの組合せも、コンピュータ可読媒体の範囲内に含まれる。
システム・メモリ134は、リムーバブル及び/又は非リムーバブル・メモリ、揮発性及び/又は不揮発性メモリの形のコンピュータ・ストレージ媒体を含む。図示する実施例において、システム・メモリ134は、読取専用メモリ(ROM)138及びランダムアクセス・メモリ(RAM)140を含む。立ち上がりの間などに、コンピュータ130内の要素間の情報転送に役立つ基本ルーチンを含む基本入出力システム(BIOS)は、典型的にROM138内に格納される。RAM140は、典型的に、即座にアクセスすることのできる及び/又は現在処理ユニット132が操作をしているデータ及び/又はプログラム・モジュールを含む。限定ではないが一例として、図6は、オペレーティング・システム144、アプリケーション・プログラム146、その他のプログラム・モジュール148、及びプログラム・データ150を示す。
コンピュータ130は、別のリムーバブル/非リムーバブル、揮発性/不揮発性コンピュータ・ストレージ媒体も含む。例えば、図6は、非リムーバブル、不揮発性磁気媒体に読取り又は書込みをおこなうハードディスク・ドライブ154を示す。図6は、リムーバブル、不揮発性磁気ディスク158に読取り又は書込みをおこなう磁気ディスク・ドライブ156、及びCD−ROM又は別の光媒体のようなリムーバブル、不揮発性光ディスク162に読取り書込みをおこなう光ディスク・ドライブ160をも示す。例示的操作環境内で使用することのできるその他のリムーバブル/非リムーバブル、揮発性/不揮発性コンピュータ・ストレージ媒体には、磁気テープ・カセット、フラッシュ・メモリ・カード、デジタル揮発性ディスク、デジタル・ビデオ・テープ、半導体RAM、半導体ROM等が含まれるが、これらに限らない。ハードディスク・ドライブ154、磁気ディスク・ドライブ156及び光ディスク・ドライブ160は、典型的に、インターフェース166のような不揮発性メモリ・インターフェースを用いて、システム・バス136に関連付けられる。
上述し図6に示すドライブ又はその他のマス・ストレージ装置及びそれらの関連コンピュータ・ストレージ媒体は、コンピュータ可読命令、データ構造体、プログラム・モジュール及びその他のデータの記憶を、コンピュータ103のために提供する。図6はまた、例えば、ハードディスク・ドライブ154は、オペレーティング・システム170、アプリケーション・プログラム172、その他のプログラム・モジュール174、及びプログラム・データ176を格納するとして示してある。これらのコンポーネントは、オペレーティング・システム144、アプリケーション・プログラム146、その他のプログラム・モジュール148、及びプログラム・データ150と、同一であっても異なっていてもよいことに注意をする必要がある。オペレーティング・システム170、アプリケーション・プログラム172、その他のプログラム・モジュール174、及びプログラム・データ176には、ここでは異なる番号を与えているが、少なくともこれらが異なる題材であることを示す。
ユーザは、コマンド及び情報を、キー・ボード180及びポインティング・デバイス182(例えば、マウス、トラック・ボール、ペン、又はタッチパッド)のような、入力装置又はユーザ・インターフェース選択装置を通じて、コンピュータ130に記入する。その他の入力装置(不図示)には、マイクロフォン、ジョイスティック、ゲームパッド、衛星放送受信アンテナ、スキャナ等が含まれる。これら及びその他の入力装置は、ユーザ入力インターフェース184を通じて処理ユニット132に接続される。このユーザ入力インターフェースは、システム・バス136にリンクされるが、パラレル・ポート、ゲーム・ポート、又はユニバーサル・シリアル・ポート(USB)のような別のインターフェース又はバス構造体を使用して接続されることもある。モニタ188又はその他の型の表示装置も、ビデオ・インターフェースのような、インターフェースを介してシステム・バス136に接続される。モニタ188に加えて、コンピュータは、プリンタ及びスピーカのような別の周辺出力装置(不図示)を含むことが多い。これらは、出力ペリフェラル・インターフェース(示さず)を通じて結合される。
コンピュータ130は、ローミング・クライアント194のような1つ又は複数のローミング・クライアントに対する論理接続を用いてネットワーク環境内で作動する。ローミング・クライアント194は、個人用、コンピュータ、サーバ、ルータ、ネットワークPC、ピア・デバイス又はその他の共通ネットワーク・ノードであって、典型的に、コンピュータ130に関して上述した要素の多く又は全部を含む。図6に示す論理接続には、ローカル・エリア・ネットワーク(LAN)196、及び広域ネットワーク(WAN)198、が含まれるが、別のネットワークも含む。このようなネットワーク環境は、事務所、企業規模コンピュータ・ネットワーク、イントラネット、及び世界的コンピュータ・ネットワーク(例えば、インターネット)では、普通のことである。
ローカル・エリア・ネットワーク環境内で使用するとき、コンピュータ130は、ネットワーク・インターフェース又はアダプタ186を通じてLAN196に結合される。広域ネットワーク環境内で使用するとき、コンピュータ130は、インターネットのようなWAN198の上で通信を確立するため、典型的にモデム178又はその他の手段を含む。内蔵又は外付けのモデム178は、ユーザ入力インターフェース184又はその他の適切な機構を介してシステム・バス136に接続される。ネットワーク環境内において、コンピュータ130又はその部分に関連して描写するプログラム・モジュールは、リモート・メモリ・ストレージ装置(不図示)に記憶されることがある。限定ではないが一例として、図6にメモリ装置上に常駐するときのリモート・アプリケーション・プログラム192を示す。示すネットワーク接続は、例示であって、コンピュータ間に通信リンクを確立する手段を使用してもよいことは理解されるであろう。
一般的に、コンピュータ130のデータ・プロセッサは、その時々においてコンピュータの様々なコンピュータ可読ストレージ上に格納される命令を用いてプログラムされる。プログラムとオペレーティング・システムは、典型的に、例えば、フロッピイ・ディスク又はCD−ROMの上に分散される。そこから、これらはコンピュータの2次メモリに設置又はロードされる。実行に際して、これらは、少なくとも部分的にコンピュータの1次電子メモリにロードされる。ここに記述する本発明は、マイクロ・プロセッサ又は別のデータ・プロセッサとの関連で、以下に記述する各ステップを実装するための命令又はプログラムを、これら及びその他の各種の型のコンピュータ可読ストレージ媒体が収容する場合、それらの媒体を含む。本発明は、ここに記述する方法及び技術にしたがってプログラムされた場合、そのコンピュータ自体をも含む。
説明目的のため、オペレーティング・システムのような、プログラム及びその他の実行可能なプログラム構成要素は、ここで別個のブロックとして示す。しかし、このようなプログラム及び構成要素は、様々な時点にコンピュータの異なるストレージ要素の中に存在し、コンピュータのデータ・プロセッサにより実行されることは認識できる。
コンピュータ130を含む例示的なコンピューティング・システム環境との関連で記述したが、本発明は、他の汎用又は特殊目的コンピューティング・システム環境又は構成を用いて、使用することができる。コンピューティング・システム環境は、本発明の使用範囲又は機能性に関して何らの制限を意図するものではない。さらに、コンピューティング・システム環境は、例示的動作環境において示した構成要素の何れか1つ又は組合せに関して、いかなる依存性又は要件を有すると解釈してはならない。本発明と共に使用することに適している公知のコンピューティング・システム、環境、及び/又は構成は、パーソナル・コンピュータ、サーバ・コンピュータ、ハンドヘルド又はラップトップ・デバイス、マルチ・プロセッサ・システム、マイクロ・プロセッサ・ベースのシステム、セットトップボックス、プログラム可能家電製品、ネットワークPC、ミニ・コンピュータ、大型コンピュータ、上記のシステム又は装置の何れかを含む分散コンピューティング環境等を含むが、これらに限定されない。
本発明は、1つ又は複数のコンピュータ又はその他の装置により実行される、プログラム・モジュールのような、コンピュータ実行可能命令を一般背景として記述される。典型的に、プログラム・モジュールは、特定のタスクを実行するか又は特定の抽象データ型を実施するルーチン、プログラム、オブジェクト、コンポーネント、及びデータ構造を含むが、これらに限定されない。本発明は、通信ネットワークを通じてリンクされるリモートプロセス装置がタスクを実行する分散コンピューティング環境においても実践される。分散コンピューティング環境において、プログラム・モジュールは、ローカル及びローミング双方のメモリ・ストレージ・デバイスを含むクライアント・ストレージ媒体内に置かれる。
動作中に、コンピュータ130は、図5に示すようなコンピュータ実行可能命令を実行して、検索結果を生成する。
本発明の要素又は本発明の実施例(単数又は複数)を紹介するとき、特に複数として表さない場合であっても、1つ又は複数の要素があることを意味することを意図している。用語「備える」、「含む」、及び「有する」は、包括的であるとの意味で、記載した要素の他にも追加の要素があることを意味する。
以上のことから、本発明のいくつかの目的が実現され、他の有効な結果が得られることが理解できる。
本発明の範囲から逸脱することなく構成及び方法において様々の変更を加えることができるので、上の記述に含まれ、添付図面に示した事項の全ては、説明のためであって、制限を意味するものではないと解釈するべきである。
本発明を利用することのできる例示的なネットワーク環境を示すブロック図。 本発明の一実施例にかかる、インデックスを配置するのに使用されるシステムの構成成分を示すブロック図。 本発明の一実施例にかかる、検索結果の最初のページ上に表示するため、カテゴリ検索結果を分散させるためのシステムの構成要素を示すブロック図。 検索結果ページの例示的な画面を示すブロック図。 本発明の一実施例にかかる、検索結果の最初のページ上にユーザに対し表示するため、カテゴリ別に検索結果を分散させる方法を示す例示的なフローチャート。 本発明の一実施例を実施することのできる適切なコンピューティング・システム環境の例示的実施例を示すブロック図。
符号の説明
102 クライアント・コンピュータ・システム
104 通信ネットワーク
106 フロントエンド・サーバ サーバ(認証)
108 バックエンド・サーバ
110 サーバ・ノード
112 データ
114 ユーザ
118 検索エンジン・アプリケーション
116 インデックス
130 コンピュータ
132 処理ユニット
134 システム・メモリ
136 システム・バス
138 (ROM)
140 (RAM)
142 BIOS
144 オペレーティング・システム
146 アプリケーション・プログラム
148 その他のプログラム・モジュール
150 プログラム・データ
154 ハードディスク・ドライブ
156 磁気ディスク・ドライブ
158 不揮発性磁気ディスク
160 光ディスク・ドライブ
162 不揮発性光ディスク
166 不揮発性メモリ・インターフェース
170 オペレーティング・システム
172 アプリケーション・プログラム
174 その他のプログラム・モジュール
176 プログラム・データ
178 モデム
180 キー・ボード
182 マウス
184 ユーザ入力インターフェース
186 ネットワーク・インターフェース
188 ディスプレイ
190 ビデオ・インターフェース
192 リモート・アプリケーション
194 ローミング・クライアント
196 ローカル・エリア・ネットワーク
198 広域ネットワーク
204 フェッチング・サーバ
206 シード・データ (即ち、URL)
208 フェッチング・モジュール
210 ウェブ・サーバ
214 インデックス・ビルダ
216 メモリ
217 特徴抽出ツール
218 カテゴリ・ツール
220 ランク・ツール
222 サブインデックス・データ
304 アプリケーション・サーバ
306 クライアント・アプリケーション
310 ウェブ・フォーム(HTML) (例えば、ブラウザ)
314 ユーザ・インターフェース
316 ディスプレイ
318 入力装置
322 フェデレーション・アプリケーション
324 クエリ命令
325 取り出し命令
326 分散命令
330 広告命令
332 第3者データ

Claims (23)

  1. 検索結果を生成する方法であって、
    ユーザから検索要求を受信すること、
    前記受信した検索要求の関数として検索可能なインデックスで、複数の電子ドキュメントの各々に関連付けられる1つ又は複数のカテゴリを規定するドキュメント・データを収容するインデックスにクエリして、前記検索要求に関連する可能性のある前記電子ドキュメントを識別すること、
    前記クエリの結果を、前記識別した電子ドキュメントに関連付けられる前記1つ又は複数のカテゴリの関数としてソートすること、および
    前記ソートした結果を、異なるカテゴリ内の1つ又は複数の前記識別された電子ドキュメントが前記ユーザに対し単一ページに表示されるように、前記ユーザに対し表示すること
    を備えることを特徴とする方法。
  2. 前記ドキュメント・データは、前記1つ又は複数のカテゴリに関連する前記電子ドキュメントの各々に関連付けられるランク付与値を含み、
    前記ランク付与値は、前記インデックスに格納され、特定のカテゴリに対する特定の電子ドキュメントの関連性を指示し、および
    前記表示することは、前記異なる各々のカテゴリ内の所定数の識別された電子ドキュメントを、前記ランク付与値の関数として表示することを含む
    ことを特徴とする請求項1に記載の方法。
  3. 前記表示することは、前記ソートした結果を、異なるカテゴリの総数、及び前記異なるカテゴリ各々における前記識別された電子ドキュメントの各々に関するランク付与値、の両者の関数として、表示することを含むことを特徴とする請求項2に記載の方法。
  4. 前記表示することは、前記ソートした結果を、それぞれが特定のカテゴリに対応する複数のグループの形態で表示することを含み、
    各グループは、前記特定のカテゴリ内の前記識別された電子ドキュメントの記述を、前記特定のカテゴリ内の識別された各々の前記電子ドキュメントに関連付けられるランク付与値に基づき、降順でリストアップされている
    ことを特徴とする請求項2に記載の方法。
  5. 前記電子ドキュメントの各々は、ウェブ・ページ及びマルチメディアファイルのうちの1つ又は複数を備えることを特徴とする請求項2に記載の方法。
  6. 前記検索可能なインデックスをクエリすることは、第3者データ・ソースにクエリして、前記異なるカテゴリに関連する広告データを取り出すことをさらに含み、
    前記ソートした結果を表示することは、前記取り出した広告データを、前記識別された電子ドキュメントの前記異なるカテゴリに関連して、表示することをさらに含む
    ことを特徴とする請求項1に記載の方法。
  7. 検索結果を生成するコンピュータ実行可能命令を含むコンピュータ可読媒体であって、
    ユーザから検索要求を受信する検索フォーム・コンポーネント、
    前記受信した検索要求の関数として検索可能なインデックスで、複数の電子ドキュメントに関連付けられ、各々の電子ドキュメントに関連付けられる1つ又は複数のカテゴリを特定するドキュメント・データを含むインデックスにクエリして、前記検索要求に関連する可能性のある電子ドキュメントを識別し、及び前記クエリの結果を、前記識別された電子ドキュメントに関連付けられる前記1つ又は複数のカテゴリの関数としてソートする検索エンジン・コンポーネント、および
    前記ソートした結果を、異なるカテゴリ内の前記1つ又は複数の識別された電子ドキュメントが前記ユーザに対し単一ページに表示されるよう、前記ユーザに対して表示するユーザ・インターフェース・コンポーネント
    を備えることを特徴とするコンピュータ可読媒体。
  8. 前記ドキュメント・データは、前記1つ又は複数のカテゴリに関連する前記電子ドキュメントの各々に関連付けられるランク付与値を含み、
    前記ランク付与値は、前記インデックスに格納され、特定のカテゴリに対する特定の電子ドキュメントの関連性を指示し、および
    前記ユーザ・インターフェース・コンポーネントは、前記異なる各カテゴリ内の所定数の識別された電子ドキュメントを、前記ランク付与値の関数として表示するように、構成されている
    ことを特徴とする請求項7に記載のコンピュータ可読媒体。
  9. 前記ユーザ・インターフェース・コンポーネントはさらに、前記ソートした結果を、異なるカテゴリの総数、及び前記異なるカテゴリ各々における前記識別された電子ドキュメントの各々に関するランク付与値、の両者の関数として、表示するように構成されていることを特徴とする請求項8に記載のコンピュータ可読媒体。
  10. 前記ユーザ・インターフェース・コンポーネントはさらに、前記複数のソートした結果を、それぞれが特定のカテゴリに対応する複数のグループの形態で表示するように構成され、
    各グループは、前記特定のカテゴリ内の識別された前記電子ドキュメントの記述を、前記特定のカテゴリ内の識別された各々の前記電子ドキュメントに関連付けられるランク付与値に基づき、降順でリストアップされている
    ことを特徴とする請求項8に記載のコンピュータ可読媒体。
  11. 前記検索エンジン・コンポーネントはさらに、
    第3者データ・ソースにクエリして、前記異なるカテゴリに関連する広告データを取り出すように構成され、
    前記ユーザ・インターフェース・コンポーネントはさらに、
    前記取り出した広告データを、前記識別された電子ドキュメントの前記異なるカテゴリに関連して、表示するように構成されている
    ことを特徴とする請求項7に記載のコンピュータ可読媒体。
  12. クライアントを介して検索要求を生成するユーザから受信した検索要求に応答して検索結果を生成するためのシステムであって、
    前記システムは、
    前記クライアントを介して前記ユーザから前記検索要求を受信する、通信ネットワークを介してクライアントに結合されている第1サーバ、および
    複数の電子ドキュメントに関連付けられるドキュメント・データで、電子ドキュメントの各々に関連付けられる1つ又は複数のカテゴリを特定するドキュメント・データ、を含むインデックス
    を備え、
    前記第1サーバは、前記受信した検索要求の関数として前記インデックスをクエリして、前記検索結果に関連する可能性のある電子ドキュメントを識別し、前記クエリの結果をソートするように構成され、前記結果は、前記識別された電子ドキュメントに関連付けられる1つ又は複数のカテゴリの関数としてソートされ、異なるカテゴリ内の1つ又は複数の前記識別された電子ドキュメントが前記ユーザに対し単一ページに表示されるように、クライアントでユーザに対し表示する
    ことを特徴とするシステム。
  13. 前記ドキュメント・データは、1つ又は複数のカテゴリに関連する前記電子ドキュメントの各々に関連付けられるランク付与値を含み、
    前記ランク付与値は、インデックスに格納され、特定のカテゴリに対する特定の電子ドキュメントの関連性を指示し、および
    前記異なる各々のカテゴリ内の所定数の識別された電子ドキュメントを、前記ランク付与値の関数として表示する
    ことを特徴とする請求項12に記載のシステム。
  14. 前記ソートした結果を、異なるカテゴリの総数、及び前記異なるカテゴリ各々における前記識別された電子ドキュメントの各々に関するランク付与値、の両者の関数として表示することを特徴とする請求項13に記載のシステム。
  15. 前記ソートした結果を、それぞれが特定のカテゴリに対応する複数のグループの形態で表示して、各グループは、前記特定のカテゴリ内の前記識別された電子ドキュメントの記述を、前記特定のカテゴリ内の前記識別された電子ドキュメントの各々に関連付けられるランク付与値に基づき降順でリストアップされていることを特徴とする請求項13に記載のシステム。
  16. 前記第1サーバは、前記ユーザから前記検索要求を受信するクライアントに対してウェブ・フォームを供給するように構成されることを特徴とする請求項12に記載のシステム。
  17. 前記第1サーバはさらに、第3者データ・ソースにクエリして、前記異なるカテゴリに関連する広告データを取り出すように構成され、
    前記取り出される広告データを、前記識別された電子ドキュメントの前記異なるカテゴリに関連して、表示する
    ことを特徴とする請求項12に記載のシステム。
  18. 前記インデックスに含まれる前記ドキュメント・データは、複数のサブインデックスに分割し、転送されて格納され、前記複数のサブインデックス各々は、各々複数のアフィリエイト・サーバ上に維持され、前記第1サーバは、受信した検索要求に応答して前記複数のサブインデックスのうち少なくとも1つにクエリして、異なるカテゴリ内の1つ又は複数の電子ドキュメントを識別することを特徴とする請求項12に記載のシステム。
  19. 検索可能データ構造を格納した1つ又は複数のコンピュータ可読媒体であって、
    ネットワーク上に位置する電子ドキュメントに関連付けられる検索エンジンのインデックス用語で、前記電子ドキュメントに含まれるインデックス用語、を表すデータを格納するための第1フィールド、
    前記電子ドキュメントに関連付けられるカテゴリを表すデータを格納するための第2フィールド、及び
    ネットワーク上の電子ドキュメントの位置を表すデータを格納するための第3フィールド、
    を備え、
    前記第2フィールドに含まれる前記ドキュメント・データは、第1フィールドにしたがって、1つ又は複数のカテゴリが前記インデックス用語に関連付けられるようにインデックスされ、
    前記第3フィールドに含まれるドキュメント・データは、前記第2フィールドにしたがって前記電子ドキュメントの1つ又は複数の位置が前記1つ又は複数の各々のカテゴリに関連付けられるように、インデックスされる
    ことを特徴とするコンピュータ可読媒体。
  20. 前記データ構造はさらに、前記電子ドキュメントに関連付けられるランク付与値を表す第4フィールドを含み、前記ランク付与値は特定のカテゴリに対する特定の電子ドキュメントの関連性を指示し、第4フィールドに含まれるドキュメント・データは、第3フィールドにしたがって、1つ又は複数の評価値が、前記特定のカテゴリに関連付けられる前記電子ドキュメントの各々に関連付けられるように、インデックスされることを特徴とする請求項19に記載のコンピュータ可読媒体。
  21. アプリケーションが、
    検索要求を受信してインデックスを検索し、第1フィールド内に格納されている前記インデックス用語が前記受信した検索要求内で特定されたクエリ・データに適合するか否かを判定するように、構成され、
    前記第1フィールド内に格納されている前記インデックス用語が前記クエリ・データに一致する場合、前記アプリケーションはさらに、前記第2フィールド内に特定されている前記対応するカテゴリを識別し、前記第3フィールド内に格納されている前記対応するドキュメント位置を識別するように構成されており、前記アプリケーションは、識別されるドキュメント位置を含む、カテゴリ別にグループ分けされている検索結果をユーザに提供する、
    ことを特徴とする請求項19に記載のコンピュータ可読媒体。
  22. 前記データ構造はさらに、
    既知の電子ドキュメントに関連付けられる概要記述を表す第5フィールドを含み、
    前記アプリケーションが前記ユーザに供給する前記グループ分けした検索結果は、前記電子ドキュメントに関連付けられる前記概要記述を含む
    ことを特徴とする請求項21に記載のコンピュータ可読媒体。
  23. 前記ドキュメント・データはさらに、ハイパー・テキスト転送プロトコル(HTTP)ヘッダのデータ、メタタグ、拡張可能マークアップ言語(XML)データ、及びリソース記述フレームワーク(RDF)データ、のうちの1つまたは複数のデータを含むことを特徴とする請求項19に記載のコンピュータ可読媒体。
JP2005193707A 2004-07-01 2005-07-01 ページカテゴリ情報の使用による検索エンジン結果の分散 Pending JP2006018843A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/883,460 US7428530B2 (en) 2004-07-01 2004-07-01 Dispersing search engine results by using page category information

Publications (2)

Publication Number Publication Date
JP2006018843A true JP2006018843A (ja) 2006-01-19
JP2006018843A5 JP2006018843A5 (ja) 2008-08-14

Family

ID=34979176

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005193707A Pending JP2006018843A (ja) 2004-07-01 2005-07-01 ページカテゴリ情報の使用による検索エンジン結果の分散

Country Status (8)

Country Link
US (1) US7428530B2 (ja)
EP (1) EP1612704A1 (ja)
JP (1) JP2006018843A (ja)
KR (1) KR101183312B1 (ja)
CN (1) CN1716255B (ja)
BR (1) BRPI0502537A (ja)
CA (1) CA2511098C (ja)
MX (1) MXPA05007079A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011520201A (ja) * 2008-05-08 2011-07-14 マイクロソフト コーポレーション モバイル・コンピューティング装置に対する検索結果の提供
JP2012501492A (ja) * 2008-08-28 2012-01-19 アリババ・グループ・ホールディング・リミテッド インターネット上で商品のオブジェクト情報を提供するための方法およびシステム
JP2013196216A (ja) * 2012-03-16 2013-09-30 Ricoh Co Ltd サーバ装置、検索方法及びプログラム
JP2015518216A (ja) * 2012-04-26 2015-06-25 アマデウス エス.エイ.エス 旅行関連検索結果の分類およびランク付け
JP2015535114A (ja) * 2012-11-13 2015-12-07 マイクロソフト テクノロジー ライセンシング,エルエルシー 検索結果の意図ベースのプレゼンテーション
JP2017505936A (ja) * 2013-12-02 2017-02-23 キューベース リミテッド ライアビリティ カンパニー インメモリデータベースをホストするシステム及び方法
JP2020004426A (ja) * 2016-08-31 2020-01-09 株式会社ぐるなび サーバ、情報提供方法、及び情報提供プログラム

Families Citing this family (133)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711672B2 (en) 1998-05-28 2010-05-04 Lawrence Au Semantic network methods to disambiguate natural language meaning
US8396824B2 (en) 1998-05-28 2013-03-12 Qps Tech. Limited Liability Company Automatic data categorization with optimally spaced semantic seed terms
US6883135B1 (en) * 2000-01-28 2005-04-19 Microsoft Corporation Proxy server using a statistical model
US10296919B2 (en) 2002-03-07 2019-05-21 Comscore, Inc. System and method of a click event data collection platform
US20080189408A1 (en) 2002-10-09 2008-08-07 David Cancel Presenting web site analytics
US8095589B2 (en) * 2002-03-07 2012-01-10 Compete, Inc. Clickstream analysis methods and systems
US7640267B2 (en) 2002-11-20 2009-12-29 Radar Networks, Inc. Methods and systems for managing entities in a computing device using semantic objects
US7403939B1 (en) 2003-05-30 2008-07-22 Aol Llc Resolving queries based on automatic determination of requestor geographic location
US7584221B2 (en) * 2004-03-18 2009-09-01 Microsoft Corporation Field weighting in text searching
US8775436B1 (en) * 2004-03-19 2014-07-08 Google Inc. Image selection for news search
US7716216B1 (en) * 2004-03-31 2010-05-11 Google Inc. Document ranking based on semantic distance between terms in a document
WO2005106658A1 (en) 2004-04-26 2005-11-10 Google Inc. Methods and systems for dynamically composing distributed interactive applications from high-level programming languages
US7562069B1 (en) * 2004-07-01 2009-07-14 Aol Llc Query disambiguation
US7519595B2 (en) * 2004-07-14 2009-04-14 Microsoft Corporation Method and system for adaptive categorial presentation of search results
US7921226B2 (en) * 2004-07-20 2011-04-05 Alcatel-Lucent Usa Inc. User specific request redirection in a content delivery network
US7873622B1 (en) 2004-09-02 2011-01-18 A9.Com, Inc. Multi-column search results interface
US8341143B1 (en) 2004-09-02 2012-12-25 A9.Com, Inc. Multi-category searching
GB2418037B (en) * 2004-09-09 2007-02-28 Surfcontrol Plc System, method and apparatus for use in monitoring or controlling internet access
GB2418999A (en) * 2004-09-09 2006-04-12 Surfcontrol Plc Categorizing uniform resource locators
GB2418108B (en) 2004-09-09 2007-06-27 Surfcontrol Plc System, method and apparatus for use in monitoring or controlling internet access
US20060059225A1 (en) * 2004-09-14 2006-03-16 A9.Com, Inc. Methods and apparatus for automatic generation of recommended links
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7827181B2 (en) 2004-09-30 2010-11-02 Microsoft Corporation Click distance determination
US7761448B2 (en) 2004-09-30 2010-07-20 Microsoft Corporation System and method for ranking search results using click distance
US7739277B2 (en) 2004-09-30 2010-06-15 Microsoft Corporation System and method for incorporating anchor text into ranking search results
US7716198B2 (en) * 2004-12-21 2010-05-11 Microsoft Corporation Ranking search results using feature extraction
US7349896B2 (en) * 2004-12-29 2008-03-25 Aol Llc Query routing
US9760629B1 (en) * 2004-12-29 2017-09-12 Google Inc. Systems and methods for implementing a news round table
US7272597B2 (en) 2004-12-29 2007-09-18 Aol Llc Domain expert search
US7818314B2 (en) * 2004-12-29 2010-10-19 Aol Inc. Search fusion
US8510325B1 (en) * 2004-12-30 2013-08-13 Google Inc. Supplementing search results with information of interest
US7792833B2 (en) 2005-03-03 2010-09-07 Microsoft Corporation Ranking search results using language types
WO2006107141A1 (en) * 2005-03-04 2006-10-12 Chutnoon Inc. Server, method and system for providing information search service by using sheaf of pages
US8019749B2 (en) * 2005-03-17 2011-09-13 Roy Leban System, method, and user interface for organizing and searching information
JP4368336B2 (ja) * 2005-07-13 2009-11-18 富士通株式会社 カテゴリ設定支援方法及び装置
US9105028B2 (en) 2005-08-10 2015-08-11 Compete, Inc. Monitoring clickstream behavior of viewers of online advertisements and search results
US8849830B1 (en) * 2005-10-14 2014-09-30 Wal-Mart Stores, Inc. Delivering search results
US20070094242A1 (en) * 2005-10-26 2007-04-26 John Dove System and method for returning search results
US20070174257A1 (en) * 2006-01-18 2007-07-26 Bruce Thomas Howard Systems and methods for providing sorted search results
US7584183B2 (en) * 2006-02-01 2009-09-01 Yahoo! Inc. Method for node classification and scoring by combining parallel iterative scoring calculation
US8615800B2 (en) * 2006-07-10 2013-12-24 Websense, Inc. System and method for analyzing web content
US8020206B2 (en) 2006-07-10 2011-09-13 Websense, Inc. System and method of analyzing web content
CN101606152A (zh) * 2006-10-03 2009-12-16 Qps技术有限责任公司 通过分类而自动匹配主体到客户的内容的机制
US9654495B2 (en) * 2006-12-01 2017-05-16 Websense, Llc System and method of analyzing web addresses
US7822734B2 (en) * 2006-12-12 2010-10-26 Yahoo! Inc. Selecting and presenting user search results based on an environment taxonomy
US20080147578A1 (en) * 2006-12-14 2008-06-19 Dean Leffingwell System for prioritizing search results retrieved in response to a computerized search query
US20080147641A1 (en) * 2006-12-14 2008-06-19 Dean Leffingwell Method for prioritizing search results retrieved in response to a computerized search query
US20080147631A1 (en) * 2006-12-14 2008-06-19 Dean Leffingwell Method and system for collecting and retrieving information from web sites
US20080155426A1 (en) * 2006-12-21 2008-06-26 Microsoft Corporation Visualization and navigation of search results
GB2445764A (en) * 2007-01-22 2008-07-23 Surfcontrol Plc Resource access filtering system and database structure for use therewith
KR100771577B1 (ko) * 2007-02-16 2007-10-30 드림아이 커뮤니케이션즈(주) 웹페이지 접속 이력정보 관리방법
US8015174B2 (en) * 2007-02-28 2011-09-06 Websense, Inc. System and method of controlling access to the internet
US7698344B2 (en) * 2007-04-02 2010-04-13 Microsoft Corporation Search macro suggestions relevant to search queries
US8768932B1 (en) * 2007-05-14 2014-07-01 Google Inc. Method and apparatus for ranking search results
GB0709527D0 (en) 2007-05-18 2007-06-27 Surfcontrol Plc Electronic messaging system, message processing apparatus and message processing method
US8019760B2 (en) * 2007-07-09 2011-09-13 Vivisimo, Inc. Clustering system and method
US9268856B2 (en) * 2007-09-28 2016-02-23 Yahoo! Inc. System and method for inclusion of interactive elements on a search results page
US20090094211A1 (en) * 2007-10-05 2009-04-09 Fujitsu Limited Implementing an expanded search and providing expanded search results
US8145660B2 (en) 2007-10-05 2012-03-27 Fujitsu Limited Implementing an expanded search and providing expanded search results
US20090094210A1 (en) * 2007-10-05 2009-04-09 Fujitsu Limited Intelligently sorted search results
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US7840569B2 (en) 2007-10-18 2010-11-23 Microsoft Corporation Enterprise relevancy ranking using a neural network
US20090199115A1 (en) * 2008-01-31 2009-08-06 Vik Singh System and method for utilizing tiles in a search results page
US8219544B2 (en) * 2008-03-17 2012-07-10 International Business Machines Corporation Method and a computer program product for indexing files and searching files
US20090248669A1 (en) * 2008-04-01 2009-10-01 Nitin Mangesh Shetti Method and system for organizing information
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8051083B2 (en) * 2008-04-16 2011-11-01 Microsoft Corporation Forum web page clustering based on repetitive regions
US9405831B2 (en) * 2008-04-16 2016-08-02 Gary Stephen Shuster Avoiding masked web page content indexing errors for search engines
US7949643B2 (en) * 2008-04-29 2011-05-24 Yahoo! Inc. Method and apparatus for rating user generated content in search results
US20090300012A1 (en) * 2008-05-28 2009-12-03 Barracuda Inc. Multilevel intent analysis method for email filtration
US8364693B2 (en) * 2008-06-13 2013-01-29 News Distribution Network, Inc. Searching, sorting, and displaying video clips and sound files by relevance
AU2009267107A1 (en) 2008-06-30 2010-01-07 Websense, Inc. System and method for dynamic and real-time categorization of webpages
US8407202B2 (en) * 2008-10-06 2013-03-26 At&T Intellectual Property I, L.P. Embedded business metadata
US20100121790A1 (en) * 2008-11-13 2010-05-13 Dennis Klinkott Method, apparatus and computer program product for categorizing web content
US20100121842A1 (en) * 2008-11-13 2010-05-13 Dennis Klinkott Method, apparatus and computer program product for presenting categorized search results
CN101770481B (zh) * 2008-12-31 2013-12-25 北京联想软件有限公司 搜索终端装置、搜索方法
KR101020007B1 (ko) * 2009-03-27 2011-03-09 조광현 시맨틱 정보를 활용한 직답형 검색 시스템 및 검색 방법
US8185544B2 (en) * 2009-04-08 2012-05-22 Google Inc. Generating improved document classification data using historical search results
US8200617B2 (en) 2009-04-15 2012-06-12 Evri, Inc. Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
US8862579B2 (en) * 2009-04-15 2014-10-14 Vcvc Iii Llc Search and search optimization using a pattern of a location identifier
US10628847B2 (en) 2009-04-15 2020-04-21 Fiver Llc Search-enhanced semantic advertising
US9069808B2 (en) * 2009-05-20 2015-06-30 International Business Machines Corporation Indexing provenance data and evaluating provenance data queries in data processing systems
EP2443580A1 (en) * 2009-05-26 2012-04-25 Websense, Inc. Systems and methods for efficeint detection of fingerprinted data and information
US8583673B2 (en) * 2009-08-17 2013-11-12 Microsoft Corporation Progressive filtering of search results
EP2517163A4 (en) * 2009-12-23 2014-01-01 One Person Health Inc METHOD, SYSTEM AND MANUFACTURED ARTICLE FOR GENERATING AD GROUPS FOR ONLINE ADVERTISING
JP2011138197A (ja) * 2009-12-25 2011-07-14 Sony Corp 情報処理装置、関連度評価方法及びプログラム
US8421766B2 (en) 2010-02-12 2013-04-16 Acer Incorporated Visualized information conveying system
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US8306964B2 (en) * 2010-07-20 2012-11-06 Microsoft Corporation Extraction of rich search information from index servers via an alternative asynchronous data path
US9043306B2 (en) * 2010-08-23 2015-05-26 Microsoft Technology Licensing, Llc Content signature notification
US9262474B2 (en) * 2010-09-30 2016-02-16 Microsoft Technology Licensing, Llc Dynamic domain query and query translation
US10346479B2 (en) 2010-11-16 2019-07-09 Microsoft Technology Licensing, Llc Facilitating interaction with system level search user interface
US8515984B2 (en) 2010-11-16 2013-08-20 Microsoft Corporation Extensible search term suggestion engine
US20120124072A1 (en) 2010-11-16 2012-05-17 Microsoft Corporation System level search user interface
US10073927B2 (en) 2010-11-16 2018-09-11 Microsoft Technology Licensing, Llc Registration for system level search user interface
CN102480524B (zh) * 2010-11-26 2014-09-10 中国科学院声学研究所 一种网页爬虫协作方法
US8843507B2 (en) 2011-03-28 2014-09-23 Microsoft Corporation Serving multiple search indexes
US9589056B2 (en) 2011-04-05 2017-03-07 Microsoft Technology Licensing Llc User information needs based data selection
CN102207963A (zh) * 2011-05-30 2011-10-05 何吴迪 一种云计算视窗平台的搜索后即时智能导航技术方法
US8560509B2 (en) * 2011-07-08 2013-10-15 Microsoft Corporation Incremental computing for web search
CN102236719A (zh) * 2011-07-25 2011-11-09 西交利物浦大学 基于网页分类的网页搜索引擎及快速查找方法
US8799263B2 (en) * 2011-09-04 2014-08-05 Leigh M Rothschild Systems, devices, and methods for providing multidimensional search results
US9558274B2 (en) * 2011-11-02 2017-01-31 Microsoft Technology Licensing, Llc Routing query results
US9189563B2 (en) 2011-11-02 2015-11-17 Microsoft Technology Licensing, Llc Inheritance of rules across hierarchical levels
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
US8954580B2 (en) 2012-01-27 2015-02-10 Compete, Inc. Hybrid internet traffic measurement using site-centric and panel data
US9900395B2 (en) 2012-01-27 2018-02-20 Comscore, Inc. Dynamic normalization of internet traffic
US20130212089A1 (en) * 2012-02-10 2013-08-15 Google Inc. Search Result Categorization
US9934224B2 (en) 2012-05-15 2018-04-03 Google Llc Document editor with research citation insertion tool
CN103577476B (zh) * 2012-08-06 2016-06-08 腾讯科技(深圳)有限公司 网页浏览记录的处理方法及网页浏览装置
US8965880B2 (en) * 2012-10-05 2015-02-24 Google Inc. Transcoding and serving resources
US20140109137A1 (en) * 2012-10-11 2014-04-17 Faisal Mushtaq Method and apparatus for user interaction with programs utilizing closed captioning data content
US9117054B2 (en) 2012-12-21 2015-08-25 Websense, Inc. Method and aparatus for presence based resource management
CN104021125B (zh) * 2013-02-28 2018-04-06 阿里巴巴集团控股有限公司 一种搜索引擎排序的方法、系统以及一种搜索引擎
CN104424233A (zh) * 2013-08-26 2015-03-18 联想(北京)有限公司 一种信息处理方法和装置
CN104468940B (zh) * 2013-09-15 2018-10-12 联想(北京)有限公司 电子设备的显示方法、显示装置及电子设备
US9507751B2 (en) * 2013-09-19 2016-11-29 Oracle International Corporation Managing seed data
CN104462138B (zh) * 2013-09-24 2018-10-26 腾讯科技(深圳)有限公司 一种媒介交互方法、装置和系统
US9996588B2 (en) 2013-12-09 2018-06-12 International Business Machines Corporation Managing a search
CN103995881B (zh) * 2014-05-28 2018-04-13 百度在线网络技术(北京)有限公司 搜索结果的展现方法及装置
CN106294436B (zh) * 2015-05-27 2019-09-20 富泰华工业(深圳)有限公司 网页评论分类方法、系统及网页管理装置
US20170270577A1 (en) * 2016-03-15 2017-09-21 Ebay Inc. Catalogue management
US10817519B2 (en) * 2016-06-06 2020-10-27 Baidu Usa Llc Automatic conversion stage discovery
US10346457B2 (en) 2016-07-27 2019-07-09 Microsoft Technology Licensing, Llc Platform support clusters from computer application metadata
US10339148B2 (en) * 2016-07-27 2019-07-02 Microsoft Technology Licensing, Llc Cross-platform computer application query categories
US10387435B2 (en) 2016-07-27 2019-08-20 Microsoft Technology Licensing, Llc Computer application query suggestions
CN109446445B (zh) * 2018-10-23 2022-03-22 北京乐我无限科技有限责任公司 一种资源获取方法及装置
CN109284460A (zh) * 2018-11-02 2019-01-29 张康德 两种类型第三级的搜索方法及淘宝京东等改革
US11232166B2 (en) * 2019-01-17 2022-01-25 Salesforce.Com, Inc. Networked page access and addressing based on partial categorization indexing
KR102300185B1 (ko) * 2019-10-21 2021-09-09 주식회사 알에스엔 실시간 통합분석검색 시스템
CN111580881B (zh) * 2020-04-30 2023-06-16 支付宝(杭州)信息技术有限公司 文件加载方法、装置和电子设备
CN111666369B (zh) * 2020-05-22 2022-07-12 安徽省交通控股集团有限公司 一种基于桥梁的三维模型构件索引文档的方法
US11750371B1 (en) 2023-04-14 2023-09-05 Morgan Stanley Services Group Inc. Web domain correlation hashing method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08235160A (ja) * 1995-02-22 1996-09-13 Canon Inc 文書検索方法及び装置
JPH11249938A (ja) * 1998-02-27 1999-09-17 Toshiba Corp 文書処理装置および同装置のデータ表示方法
JP2000250925A (ja) * 1999-02-26 2000-09-14 Matsushita Electric Ind Co Ltd 文書検索・分類方法および装置
JP2003016112A (ja) * 2001-07-03 2003-01-17 Nec Corp 情報検索システム及び情報検索方法並びに情報検索プログラム
US6516337B1 (en) * 1999-10-14 2003-02-04 Arcessa, Inc. Sending to a central indexing site meta data or signatures from objects on a computer network
US20040049514A1 (en) * 2002-09-11 2004-03-11 Sergei Burkov System and method of searching data utilizing automatic categorization

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4991094A (en) * 1989-04-26 1991-02-05 International Business Machines Corporation Method for language-independent text tokenization using a character categorization
CA2175187A1 (en) * 1993-10-28 1995-05-04 William K. Thomson Database search summary with user determined characteristics
US5752025A (en) 1996-07-12 1998-05-12 Microsoft Corporation Method, computer program product, and system for creating and displaying a categorization table
EP0822502A1 (en) * 1996-07-31 1998-02-04 BRITISH TELECOMMUNICATIONS public limited company Data access system
US6233575B1 (en) * 1997-06-24 2001-05-15 International Business Machines Corporation Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values
US6389436B1 (en) * 1997-12-15 2002-05-14 International Business Machines Corporation Enhanced hypertext categorization using hyperlinks
US6334131B2 (en) * 1998-08-29 2001-12-25 International Business Machines Corporation Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
US6678681B1 (en) 1999-03-10 2004-01-13 Google Inc. Information extraction from a database
US20030195872A1 (en) * 1999-04-12 2003-10-16 Paul Senn Web-based information content analyzer and information dimension dictionary
US6711585B1 (en) * 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
AU4712601A (en) 1999-12-08 2001-07-03 Amazon.Com, Inc. System and method for locating and displaying web-based product offerings
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US6701314B1 (en) 2000-01-21 2004-03-02 Science Applications International Corporation System and method for cataloguing digital information for searching and retrieval
WO2001055905A1 (en) 2000-01-28 2001-08-02 Websense, Inc. Automated categorization of internet data
US6910029B1 (en) * 2000-02-22 2005-06-21 International Business Machines Corporation System for weighted indexing of hierarchical documents
US6615209B1 (en) 2000-02-22 2003-09-02 Google, Inc. Detecting query-specific duplicate documents
US6631365B1 (en) * 2000-03-14 2003-10-07 Requisite Technology, Inc. Method and apparatus for analyzing the quality of the content of a database
US7136854B2 (en) 2000-07-06 2006-11-14 Google, Inc. Methods and apparatus for providing search results in response to an ambiguous search query
US6529903B2 (en) 2000-07-06 2003-03-04 Google, Inc. Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query
US6687696B2 (en) * 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
WO2002041190A2 (en) 2000-11-15 2002-05-23 Holbrook David M Apparatus and method for organizing and/or presenting data
US6658423B1 (en) 2001-01-24 2003-12-02 Google, Inc. Detecting duplicate and near-duplicate files
US6526440B1 (en) 2001-01-30 2003-02-25 Google, Inc. Ranking search results by reranking the results based on local inter-connectivity
US8001118B2 (en) 2001-03-02 2011-08-16 Google Inc. Methods and apparatus for employing usage statistics in document retrieval
US7188106B2 (en) * 2001-05-01 2007-03-06 International Business Machines Corporation System and method for aggregating ranking results from various sources to improve the results of web searching
US6944609B2 (en) * 2001-10-18 2005-09-13 Lycos, Inc. Search results using editor feedback
US8117072B2 (en) * 2001-11-13 2012-02-14 International Business Machines Corporation Promoting strategic documents by bias ranking of search results on a web browser
CN1360267A (zh) * 2002-01-30 2002-07-24 北京大学 文件分类查找方法
US6993534B2 (en) * 2002-05-08 2006-01-31 International Business Machines Corporation Data store for knowledge-based data mining system
US20040003097A1 (en) * 2002-05-17 2004-01-01 Brian Willis Content delivery system
ATE392667T1 (de) * 2002-05-27 2008-05-15 Sap Ag Verfahren und computersystem zum indexieren strukturierter dokumente
US20040249824A1 (en) * 2003-06-05 2004-12-09 International Business Machines Corporation Semantics-bases indexing in a distributed data processing system
US7424469B2 (en) * 2004-01-07 2008-09-09 Microsoft Corporation System and method for blending the results of a classifier and a search engine

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08235160A (ja) * 1995-02-22 1996-09-13 Canon Inc 文書検索方法及び装置
JPH11249938A (ja) * 1998-02-27 1999-09-17 Toshiba Corp 文書処理装置および同装置のデータ表示方法
JP2000250925A (ja) * 1999-02-26 2000-09-14 Matsushita Electric Ind Co Ltd 文書検索・分類方法および装置
US6516337B1 (en) * 1999-10-14 2003-02-04 Arcessa, Inc. Sending to a central indexing site meta data or signatures from objects on a computer network
JP2003016112A (ja) * 2001-07-03 2003-01-17 Nec Corp 情報検索システム及び情報検索方法並びに情報検索プログラム
US20040049514A1 (en) * 2002-09-11 2004-03-11 Sergei Burkov System and method of searching data utilizing automatic categorization

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011520201A (ja) * 2008-05-08 2011-07-14 マイクロソフト コーポレーション モバイル・コンピューティング装置に対する検索結果の提供
US9690875B2 (en) 2008-05-08 2017-06-27 Microsoft Technology Licensing, Llc Providing search results for mobile computing devices
JP2012501492A (ja) * 2008-08-28 2012-01-19 アリババ・グループ・ホールディング・リミテッド インターネット上で商品のオブジェクト情報を提供するための方法およびシステム
JP2013196216A (ja) * 2012-03-16 2013-09-30 Ricoh Co Ltd サーバ装置、検索方法及びプログラム
JP2015518216A (ja) * 2012-04-26 2015-06-25 アマデウス エス.エイ.エス 旅行関連検索結果の分類およびランク付け
JP2015535114A (ja) * 2012-11-13 2015-12-07 マイクロソフト テクノロジー ライセンシング,エルエルシー 検索結果の意図ベースのプレゼンテーション
JP2017505936A (ja) * 2013-12-02 2017-02-23 キューベース リミテッド ライアビリティ カンパニー インメモリデータベースをホストするシステム及び方法
JP2020004426A (ja) * 2016-08-31 2020-01-09 株式会社ぐるなび サーバ、情報提供方法、及び情報提供プログラム
US10949489B2 (en) 2016-08-31 2021-03-16 Gurunavi, Inc. Server, method, and storage medium for searching and displaying results

Also Published As

Publication number Publication date
US20060004717A1 (en) 2006-01-05
CA2511098A1 (en) 2006-01-01
US7428530B2 (en) 2008-09-23
EP1612704A1 (en) 2006-01-04
CA2511098C (en) 2014-09-02
CN1716255A (zh) 2006-01-04
KR20060048765A (ko) 2006-05-18
CN1716255B (zh) 2012-01-11
KR101183312B1 (ko) 2012-09-17
MXPA05007079A (es) 2006-02-13
BRPI0502537A (pt) 2006-02-14

Similar Documents

Publication Publication Date Title
JP2006018843A (ja) ページカテゴリ情報の使用による検索エンジン結果の分散
US11860921B2 (en) Category-based search
Jansen et al. Determining the user intent of web search engine queries
He et al. Crawling deep web entity pages
US9081861B2 (en) Uniform resource locator canonicalization
US10025855B2 (en) Federated community search
US20080065602A1 (en) Selecting advertisements for search results
US20090292674A1 (en) Parameterized search context interface
US20170255652A1 (en) Method for dynamically matching images with content items based on keywords in response to search queries
US20020129062A1 (en) Apparatus and method for cataloging data
US20070067304A1 (en) Search using changes in prevalence of content items on the web
US20110196861A1 (en) Propagating Information Among Web Pages
CA2790421C (en) Indexing and searching employing virtual documents
WO2007051397A1 (fr) Systeme d’extraction d’informations et procede d’extraction d’informations
KR20110050478A (ko) 검색 질의에 응답하여 디스커션 스레드에 대한 포스트를 제공하는 방법 및 시스템
EP2519896A2 (en) Search suggestion clustering and presentation
KR20100075545A (ko) 검색 결과 페이지에 인터랙티브 요소를 포함하는 시스템 및 그 방법
US10275472B2 (en) Method for categorizing images to be associated with content items based on keywords of search queries
US7840557B1 (en) Search engine cache control
JP2007172375A (ja) 情報検索システム及び方法
JP2010257453A (ja) サーチクエリデータを用いて文書にタグ付けするシステム
US8661069B1 (en) Predictive-based clustering with representative redirect targets
US7836108B1 (en) Clustering by previous representative
JP2007172571A (ja) 情報検索システム及び方法
US20060116992A1 (en) Internet search environment number system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080627

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110708