JP2007519106A - 通信ネットワーク中の一つ以上の検索エンジンに渡って検索トレイルを記録するための方法及びシステム - Google Patents

通信ネットワーク中の一つ以上の検索エンジンに渡って検索トレイルを記録するための方法及びシステム Download PDF

Info

Publication number
JP2007519106A
JP2007519106A JP2006549768A JP2006549768A JP2007519106A JP 2007519106 A JP2007519106 A JP 2007519106A JP 2006549768 A JP2006549768 A JP 2006549768A JP 2006549768 A JP2006549768 A JP 2006549768A JP 2007519106 A JP2007519106 A JP 2007519106A
Authority
JP
Japan
Prior art keywords
search
trail
automated method
client
search query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006549768A
Other languages
English (en)
Inventor
ナイジェル ハミルトン
Original Assignee
ナイジェル ハミルトン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2004900248A external-priority patent/AU2004900248A0/en
Application filed by ナイジェル ハミルトン filed Critical ナイジェル ハミルトン
Publication of JP2007519106A publication Critical patent/JP2007519106A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

通信ネットワーク中のクライアントによってアクセスされたサイトを記録するための自動化された方法であって、前記クライアントから一つ以上の検索エンジンへの検索クエリーの提出を検出するステップ(10)と、前記クライアントへの検索クエリー結果の応答に続いて、続けてアクセスされたサイトの一つ以上のパラメータの検索トレイルを記録するステップ(11)とを含む方法。

Description

本発明は、通信ネットワーク中のクライアントによってアクセスされたサイトを自動的に記録するための方法及びシステムに関し、より詳細には、クライアントによって連続的にアクセスされたサイトのトレイルの記録に関する。本発明は、インターネットの一部を形成する一以上のサーバからクライアントがサイトにアクセスする応用例での使用に適しており、その例示的な応用例との関連で本発明を記載するのが便利であろう。しかしながら、その発明がその応用例に制限されないことが理解されるべきである。
毎日、何百万もの検索が、インターネット検索エンジンを使用することによってインターネット上で実行される。これら検索エンジンは、いくつかの基準に基づいてデータを検索するソフトウェアである。典型的には、ユーザが検索クエリーを入力し、アルゴリズムが用いられて、検索エンジンによって行われる検索アルゴリズムに基づいて、検索クエリーにマッチするハイパー・テキスト・マークアップ・ランゲージ(HTML)文書又は他のコンテンツを決定する。一旦検索アルゴリズムが実行されると、多数の関連するHTML文書又は他のコンテンツへのリンクのリストを含む検索結果が、クライアントの表示装置へ返される。ユーザはリンクのうちの一つをクリックし、そのリンクに位置するコンテンツがクライアントに提示される。このコンテンツは他のサイトへの一以上のリンクを提供し、それらの妥当性に依って、ユーザはこれら更なるリンクの一つを選択してクリックするであろう。このように、連続的にアクセスされたサイトの連鎖からなる検索トレイルが、ユーザによって生成される。
現在の検索エンジンは、新しい検索クエリーが作成される毎に、希望の検索結果へのパスを再発見することを検索者に要求する。個々に又は他のユーザによって発展させられた検索トレイルは、インターネット上で実行される検索の効率及び検索能力を改良するために現在利用されることができない。
ウェブ検索者の振る舞いを分析するために、相当な学術研究が捧げられてきた。典型的には、この研究は、ウェブ使用データを記録するウェブサーバログが頼りである。しかしながら、複数のサーバからのユーザデータをマージすることは非現実的であり、これはサーバ所有者間の協力を必要とするからである。さらに、サーバログは、ハイパー・テキスト・トランスファー・プロトコル(HTTP)GETリクエスト中で用いられる限られた数のパラメータのみを記録し、検索トレイルを構成するために意味のある情報が記録されることを可能としない。ユーザによる全てのページ訪問をウェブサーバログ中に記録することは、多くのユーザにとってプライバシーに関する懸念に帰着する。さらに、ウェブサーバログは、第三者サーバ上における、ユーザのページ訪問を記録することができない。全てのページ訪問を記録することはまた、相当な量のディスク装置容量を消費する。
インターネットを閲覧中のユーザの振る舞いについての他の研究は、クライアント側ブラウザ及びインターネット間のHTTPリクエストをインターセプトするためのHTTPプロキシの使用を示した。そのようなシステムは、ユーザの検索の振る舞いに取り組むのではなく、ユーザの一般的なウェブ閲覧の振る舞いに焦点を合わせている。ユーザの閲覧の振る舞いを記録するためのプロキシベースのソリューションはまた、多くの重要な制限を有する、即ち、全てのリクエストがプロキシを経由し、過剰なネットワーク帯域幅が消費され、それらがプロキシを経由して通過しなければならないので、新しいページリクエストが低速で伝送され、全てのページリクエストがインターセプトされる故に、ユーザのプライバシーが十分に保護されない。
インターネット検索者が、検索と、これによって適切な結果を見つけた検索トレイルとを記録することを可能にする、通信ネットワーク中のクライアントによってアクセスされたサイトを記録するための自動化された方法及びシステムを提供することが望ましいであろう。
複数のエンジンに渡って検索トレイルの記録を可能にすることもまた望ましいであろう。
以前に生成された検索トレイルの検索をその後になって可能にすること、及び検索者が、以前に彼ら自身又は他のインターネット検索によって生成された検索トレイルに追従することを可能にすることもまた望ましいであろう。
本発明の一態様は、通信ネットワーク中のクライアントによってアクセスされたサイトを記録するための自動化された方法であって、クライアントから複数の検索エンジンのうちの一つへの検索クエリーの提出を検出するステップと、前記クライアントへの検索クエリー結果の応答に続いて、続けてアクセスされたサイトの一つ以上のパラメータの検索トレイルを記録するステップとを含む方法を提供する。
前記検索クエリーの提出を検出する前記ステップが、前記クライアントからの完全なフォームオブジェクトの提出を検出するステップと、前記フォームオブジェクトの一部が、複数の前記検索エンジンの任意の既知の検索コマンドフォーマットとマッチするか否かを判断するステップとを含むことができる。
前記検索コマンドフォーマットが、前記検索クエリーを実行するための検索エンジンプログラムのネットワークアドレスを含むことができる。
前記検索コマンドフォーマットが、ユーザ入力された検索クエリーを識別する一つ以上の検索パラメータを更に含むことができる。
前記クライアントからの完全なフォームオブジェクトの提出を検出する前記ステップが、クライアントへ提示されたコンテンツのオブジェクトモデル内のフォームオブジェクトを見つけるステップと、提出時に、前記完全なフォームオブジェクトのインターセプトを可能にするために、各々のフォームオブジェクトへルーチンを追加するステップとを含むことができる。
クライアントへ提示されたコンテンツのドキュメント・オブジェクト・モデル内の全てのフォームオブジェクトを見つける前記ステップが、前記コンテンツが前記クライアントへ提示された後に実行される。
前記コンテンツがHTMLドキュメントであり、一旦DocumentCompleteイベントが発生すると、前記HTMLドキュメントのドキュメント・オブジェクト・モデル内の全てのフォームオブジェクトが見つけられることができる。
前記HTMLドキュメントが、GET又はPOSTフォームを含むことができる。
一旦検索クエリーが検出されると、前記検索クエリー結果から続けてアクセスされた前記サイトの一つ以上のパラメータを記録する前記ステップが、前記クライアントにおいて任意に選択可能であることができる。
前記検索クエリー結果から続けてアクセスされた前記サイトの一つ以上のパラメータを記録する前記ステップが、続けてアクセスされた前記サイトの前記ネットワークアドレスを記録するステップを含むことができる。
前記検索クエリー結果から続けてアクセスされた前記サイトの一つ以上のパラメータを記録する前記ステップが、一つ以上の検索識別子、参照するサイトのネットワークアドレス、クライアントの前記ネットワークアドレス、及び、検索ターム又は前記クライアントにおいて前記ユーザによって入力されたタームを記録するステップを更に含むことができる。
前記検索クエリー結果から続けてアクセスされた前記サイトの一つ以上のパラメータを記録する前記ステップが、前記クライアントにおいて識別された前記一つ以上のパラメータを、記録用のトレイル記録サーバに伝送するステップを更に含むことができる。
その方法は、前記トレイル記録サーバにおいて、前記一つ以上のパラメータを初めにRAMテーブル中に記録するステップを更に含むことができる。
その方法は、前記トレイル記録サーバにおいて、RAMテーブルデータをディスクベースのテーブルへ周期的に保存するステップを更に含むことができる。
第1のディスクベースのテーブルが、その検索トレイルを特徴付けるデータを記録することができる。
第2のディスクベースのテーブルが、各々の検索トレイル中でアクセスされた連続的なサイトを特徴付けるデータを記録することができる。
続けてアクセスされたサイトの数が、所定の最大値に制限されることができる。
その方法は、複数の検索エンジンについての既知の検索コマンドフォーマットのアダプターテーブルを維持するステップを更に含むことができる。
その方法は、前記アダプターテーブル中に維持された前記検索コマンドフォーマットを周期的に検証するステップを更に含むことができる。
その方法は、新しい検索エンジンの検索コマンドフォーマットを自動的に識別するステップと、前記アダプターテーブルを更新するステップとを更に含むことができる。
その方法は、検索エンジンの検索ボックスページを識別する検索情報を収集するステップと、前記検索情報からの前記検索コマンドフォーマットを識別するステップとを更に含むことができる。
検索情報を収集する前記ステップが、検索ボックスの前記HTMLコードを収集するステップと、前記HTMLコードを分析し、前記検索コマンドフォーマットを識別するステップとを含むことができる。
その方法は、前記検索クエリーを以前の検索クエリーにマッチさせ、関連する検索トレイルを識別するステップを更に含むことができる。
前記検索クエリーを以前の検索クエリーにマッチさせる前記ステップが、前記検索クエリー及び以前の検索クエリーに対して全文検索を実行するステップを含むことができる。
前記検索クエリーを以前の検索クエリーにマッチさせるステップが、前記関連する検索トレイルを、同じユーザからの検索クエリーに起因する検索トレイルに制限するステップを含むことができる。
代わりに、前記関連する検索トレイルが、同じユーザ及び他のユーザからの検索クエリーに起因する検索トレイルを含むことができる。
その方法は、前記クライアントにおいて前記関連する検索トレイルを提示するステップを更に含むことができる。
前記関連する検索トレイルを提示する前記ステップが、一つ以上のランキング基準によって前記関連する検索結果を順序づけるステップを含むことができる。
前記ランキング基準が、一つ以上の任意の日付、インバース・ドキュメント・フリークエンシー・マッチ、ターゲット検索エンジン、ユーザ識別子、又は関連する検索トレイル中のステップへのユーザ訪問の累積頻度を示すトレイル重みを含むことができる。
発明の別の態様は、通信ネットワーク中のクライアントによってアクセスされたサイトを記録するためのシステムであって、前記クライアントから複数の検索エンジンのうちの1つへの検索クエリーの提出を検出するための検索クエリーディテクタと、前記クライアントへの検索クエリー結果の応答に続いて、続けてアクセスされたサイトの一つ以上のパラメータの検索トレイルを記録するための検索トレイルレコーダとを備えるシステムを提供する。
そのシステムは、複数の前記検索エンジンについての既知の検索コマンドフォーマットのアダプターテーブルを維持するためのアダプターマネージャを更に備えることができる。
そのシステムは、前記検索クエリーを以前の検索クエリーにマッチさせ、関連する検索トレイルを識別するためのトレイルサーチャを更に備えることができる。
本発明の別の態様は、上記記載のシステムと共に用いるための検索クエリーディテクタを提供する。
本発明の更なる態様は、上記記載のシステムと共に用いるための検索トレイルレコーダを提供する。
本発明の更に別の態様は、上記記載のシステムと共に用いるためのアダプターマネージャを提供する。
本発明のまだ更なる態様は、上記記載のシステムと共に用いるためのトレイルサーチャを提供する。
本発明の更なる態様は、前記検索クエリーディテクタ、検索トレイルレコーダ、アダプターマネージャ、及び/又はトレイルサーチャによって行われる前記方法を実行するための命令セットを含むコンピュータソフトウェアを含む。
以下の記述は、本発明の様々な特徴についてより詳細に言及する。理解を促進するために、好ましい実施の形態における上記自動化された方法及びシステムが図示された添付の図面への参照が、詳細な説明においてなされる。しかしながら、図面に図示された好ましい実施の形態に発明が制限されないことが理解されるべきである。
今、図1及び図2を参照すると、本発明の一実施形態に係る通信ネットワーク(この場合、インターネット)中のクライアントによってアクセスされたサイトを記録するためのシステムは、次の4つの主な構成要素、検索クエリーディテクタ10、検索トレイルレコーダ11、アダプターマネージャ12、及びトレイルサーチャ13を備える。検索クエリーディテクタ10は、クライアントから一つ以上の検索エンジンへの検索クエリーの提出を検出するクライアント側のアプリケーションである。図1に示された例では、検索クエリーディテクタ10は、クライアント側でインストールされたインターネットブラウザ内で動作可能なツールバー20として実現される。発明の他の実施の形態では、検索クエリーディテクタ10は、ブラウザアドオン若しくは拡張、デスクバー、エージェント、プロキシ、又は検索フォームからのデータが解釈され得る同様のクライアント側のアプリケーションとして実現されるであろう。クライアントからの検索クエリーの提出を検出することにより、トレイルウォッチャは、検索クエリーを満たす情報を探しているクライアントへ提供される様々なコンテンツを通じて閲覧する時に、ユーザが行う検索トレイルの開始及び後続のウェブリンク又は検索トレイルステップをキャプチャする。ユーザが検索フォームへ入力する各々の新しい検索トレイルについて、個々の検索トレイルが記録される。その後、トレイルレコーダ11は、ブラウザウィンドゥ21中のクライアントへの検索クエリー結果の応答に続いて、連続的にアクセスされたサイトの一つ以上のパラメータの検索トレイルを記録する。
トレイルレコーダ11はまた、ユーザのIPアドレス(又は他のネットワーク識別子)をキャプチャするように適合されるであろう。この方法では、複数のユーザのIPアドレスはその後分析されて、ユーザを国、組織、又は部門等の基準によってグループ化することができる。
検索クエリーディテクタ10は、DocumentComplete等のウェブブラウザイベントをキャプチャするように適合される。DocumentCompleteイベントは、ブラウザが新しいウェブページのロード及び表示を完了する度に発生する。DocumentCompleteイベントが発生する時までに、ブラウザは、ドキュメント・オブジェクト・モデル(DOM)に基づく内部プリデート構造を生成し、ページを記録する。Javascript(登録商標)等のクライアント側のスクリプト言語は、ブラウザのメモリ内のこのデータ構造を取り扱うことができ、フォーム及び表示された画像等のウェブページの対応する要素を順番に取り扱うことができる。この実施例での検索クエリーディテクタ10は、インターネットブラウザ内のツールバーを形成するJavascriptプログラムとして実現され、ウェブページのDOMへの部分的又は完全なアクセスを有する。検索ユーザ14が、インターネットブラウザウィンドゥ21内に表示されたリンクをクリックして、インターネットからのコンテンツの提供をリクエストすると、新しいウェブページがロードされる。
一旦クライアントにコンテンツが提供されると、図3に示されるように、ステップ30でキャプチャされるDocumentCompleteイベントが発生する。ウェブページ中で見つけられる全てのフォームオブジェクトに対して、検索クエリーディテクタ10は、検索ユーザ14による検索クエリーの提出時に完全なフォームオブジェクトのインターセプトを可能とするルーチンを含む。本実施の形態では、検索クエリーディテクタ14は、クライアントへ提供されるウェブページのドキュメント・オブジェクト・モデル内部の全てのフォームオブジェクトに、onSubmitイベントハンドラーを付加する。onSubmitイベントが発生すると、そしてそのイベントが発生した時に、onSubmitハンドラーは、ドキュメントの全てのフォームについてそのonSubmitイベントをキャッチしようとする。onSubmitイベントは、ユーザがリモートサーバへウェブフォームのコンテンツを提出する度に発生する。イベントをキャッチすることにより、検索クエリーディテクタはフォームの提出をインターセプトし、ドキュメント中の任意のフォームが第3者のウェブサーバへ提出される前に新しいonSubmitハンドラーが実行されることを保証する。例えば、ユーザがGoogle(登録商標)検索エンジンを使用している場合には、ユーザが検索フォームを提出する度に検索クエリーディテクタはインターセプトする。検索変数がGoogleサーバへ提出される前に、新しい検索トレイルの開始が記録され得るように、それらは最初に検索トレイルレコーダ11に提出される。ステップ32においてドキュメント・オブジェクト・モデルの更新が起こる一方、図3中のステップ31においてonSubmitハンドラーの挿入が起こる。
表1に、簡単な検索ボックスのHTMLソースコードの例が示されている。
Figure 2007519106
HTMLソースコードは、属性、即ち、検索リクエストを処理するサーバ側スクリプトのユニフォーム・リソース・ロケータ(URL)を含む。HTMLソースコードはまた、パラメータがどのようにサーバへ渡されるかを決定するメソッド属性を含む。HTMLフォームデータをサーバへ提出する2つのリクエストメソッドは、「GET」及び「POST」メソッドである。クライアントへ提供されたウェブページの全てのフォームオブジェクト内に挿入されたonSubmitハンドラーは、ステップ33において全ての完全な検索フォームがインターセプトされることを保証する。ステップ34において、アクション属性が既知の検索エンジンの或るアクション属性に対応するか否かを決定するために、検索フォームのアクション属性がトレイルレコーダ11に伝送される。検索クエリーディテクタ10は、GET及びPOST両方のフォーム提出を有利にインターセプトすることができる。検索クエリーディテクタ10はまた、検索フォーム提出のアクション属性のみを伝送することにより、ユーザ名及びパスワード、又はクレジットカードの詳細等を含むロギングフォーム等のユーザのプライバシーを漏洩し得るサーバ側のトレイルレコーダ11へ、プライベートなフォームデータが安全でない状態で伝送されないことを保証する。アクション属性の値は、検索クエリーを実行するための検索エンジンプログラムのURL又はネットワークアドレスである。例えば、表1に示されるHTMLソースコードの例でのアクション属性の値は、http://turbo10.com/x/search.cgiである。ステップ31においてフォームオブジェクト内に挿入されたonSubmitハンドラーは、ステップ35において、分離したHTTP GETリクエスト中のアクション属性をトレイルレコーダ11へ渡す。ところで、図4を参照すると、検索クエリーディテクタ10からのHTTP GETリクエストを受信すると、トレイルレコーダ11は、スキーム、ホスト名及びパスのみが残るように、検索クエリーを実行するための検索エンジンプログラムのネットワークアドレス又はURLの任意のパラメータ部分を取り除く。ユーザのプライバシーを維持するために、この時点ではフォームパラメータはトレイルレコーダ11に提出されない。アクション属性の値のみがサーバに送信される。例えば、表1に示された例での、この必要最低限のバージョンの検索エンジンのURLは、http://turbo10.com/x/search.cgiである。
URLのこの部分を用いて、トレイルレコーダ11は、検索クエリーディテクタ10から伝送されたアクション属性の値とマッチするアクション属性について、「検索エンジンアダプター」のテーブル40を検索する。アダプターURLがマッチする場合、その後、検索クエリーディテクタ10は、ユーザによって提出された検索クエリーが新しい検索トレイルの始まりであると判断する。より一般的には、クライアントからの完全なフォームオブジェクトの提出を検出すると、検索クエリーディテクタ10及び検索トレイルレコーダ11は、フォームオブジェクトの一部が、既知の検索エンジン検索コマンドフォーマットのデータベース内に維持されている複数の任意の検索エンジンの既知の検索コマンドフォーマットとマッチするか否かを判断する。
検索トレイルレコーダ11によって行われるマッチング処理は、クライアントから提出されたフォームが検索フォーム、又は問い合わせフォームやログインフォームなどのフォーム提出の別のタイプであったか否かを判断するのに重要である。マッチング処理はまた、検索を実行しようとする特定の検索エンジン、そして勿論、その検索エンジンによって用いられた検索クエリーパラメータを決定するために重要である。検索トレイルレコーダに知られている様々な検索エンジンについての既知の検索コマンドフォーマットのアダプターテーブル40は、どの検索クエリーパラメータがデフォルトであり、どれが検索者によって入力されるかを識別するために用いられる。例えば、表1に示されている例から続けると、検索エンジンURLについての検索HTTP GETリクエストは、http://turbo10.com/x/search.cgi?q=cars&fmt=htmlであり得る。2つの潜在的な検索クエリーパラメータ、即ち「q」及び「fmt」がこのリクエストから現れる。一方は検索フォーム中でユーザによって入力されるが、他方はデフォルト値である。アダプターテーブル40は、どのパラメータがユーザによって入力された検索クエリーと対応するかを記録する。この場合、アダプターテーブル40中に記録された検索クエリーパラメータは「q」であり、従って、検索トレイルレコーダ11は、これが「html」ではなく「cars」についての検索トレイルの始まりであると判断することができる。従って、アダプターテーブル40に記録されたアダプター定義は、検索者によって入力されたフォームパラメータと、セッション識別子、ユーザ識別子、又は他の隠れ変数といったデフォルト値とを区別することができる。より一般的には、アダプターテーブル40によって維持される検索コマンドフォーマットは、検索クエリーを実行するための検索エンジンプログラムのネットワークアドレスだけではなく、ユーザ入力された検索クエリーを識別する一つ以上の検索パラメータを付加的に含む。
クライアントによって提出されたフォームオブジェクトの一部を構成する対応するアクション属性が、アダプターテーブル40内に記録されたアクション属性にマッチすることが分かると、その後、検索トレイルレコーダ11は、今まさに提出されようとしているフォームが検索フォームであると判断する。ステップ41において検索トレイルレコーダによって検索フォームが見つけられると、ステップ42において、既知の検索フォームクエリーの提出が検出されたことを示すために、アダプター識別子が検索クエリーディテクタ10に伝送される。検索クエリーディテクタ10に返されたアダプター識別子は、カレントアダプター識別子テーブル35内に維持される。
アダプター識別子が検索クエリーディテクタ10に返されると、ツールバー20上のボタン22は記録シンボルを表示し、検索トレイルが今まさに記録されようとしていることをユーザに示す。検索フォームが見つからなかった場合、及びアダプター識別子が返らなかった場合、記録アイコンは表示されない。検索ユーザ14は、記録ボタンをオン又はオフにするためにトレイルレコーダボタン22をクリックすることができ、従って、検索トレイルレコーダの検索トレイル記録機能を選択的に活性化することができる。検索トレイルレコーダのオン又はオフの切り換えは図3のステップ37において実行され、それは、検索クエリーディテクタ10によって維持された検索トレイルレコーダステータスデータ38のステータスを変更する効果を有する。ステップ39において、検索クエリーディテクタ10が、検索トレイルレコーダステータスデータ38のステータスが記録の発生を示すか否かを判断し、また、トレイルレコーダ11によって既知のアダプター識別子が返され、検索クエリーディテクタ10が、クライアントへの検索クエリー結果の応答に続いて、検索トレイル中で連続的にアクセスされたサイトのネットワークアドレスの記録を開始する。破損の無い検索トレイルは、ブラウザから送られたリファラーURLの「連鎖」から構成される。ユーザがURLを打ち込む、ブラウザを閉じる又は「Home」ボタンを押下すると、これらのアクションは「Referrer」がサーバへ送られるようにしないため、トレイルは中断される。
従って、検索トレイルレコーダ機能が「オン」されると、ステップ30において検出された全てのDocumentCompleteイベントに対して、分離したHTTP GETリクエストが、ステップ40において検索クエリーディテクタ10によって検索トレイルレコーダ11に送られて、検索トレイル中のステップを記録する。GETリクエストで送られたパラメータは、一意なユーザ識別子、カレントページのURL、参照URL、ページのタイトル、クライアントのネットワークアドレス、検索エンジンのアダプター識別子、及び検索ターム又はユーザによって用いられたタームを含む。サーバのコモン・ゲートウェイ・インタフェース(CGI)プログラムは、ステップ43においてこれらのパラメータを受信し、リモートサーバによって維持されたRAMベースのデータベーステーブル44内にそれらを記録する。RAMベースのデータベーステーブルは、速やかな挿入を可能にする利点、及び検索トレイル中の全てのステップを表現するパラメータのストレージを提供する。
周期的に、RAMベースのデータベーステーブル44は、検索トレイルレコーダ11によって維持される空にするルーチン47によって、2つのディスクベースのテーブル45及び46のうちの一つに移されて空にされる。第1のディスクベースのテーブル45は、各々の検索トレイルを特徴付けるデータを記録する一方、第2のディスクベースのテーブルは、各々の検索トレイル中で連続的にアクセスされたサイトを特徴付けるデータを記録する。ステップ41に位置するアダプター識別子がヌルでない(即ち、ユーザが、検索クエリーと、検索トレイルレコーダ11に知られている検索エンジンについての検索フォームとを入力した)時はいつでも、新しいトレイルが生成される。RAMベースのデータベーステーブル44中の後続のエントリーは、その後、ユーザが追跡した検索トレイル中でステップを形成する。
固有のユーザそれぞれに対して、検索トレイル中の各々の後続のステップが、データベーステーブル44中に連続的に入力される。時には、検索者は検索トレイルから外れる、又は乱されるかもしれない。この場合、データベーステーブル44は、検索ターム又はユーザによって最初に入力されたタームとは無関係のURLを記録するであろう。あまりにも多くの関連性の無いトレイルステップを記録しないよう支援するために、検索トレイルレコーダ11は、検索トレイルの長さを、ステップの最大数、又は、検索トレイルの開始及びカレント検索トレイルステップ間の所定の最大経過時間に制限してもよい。
RAMベースのテーブル44、並びにディスクベースのテーブル45及び46中に維持されるデータのタイプの例が以下に示される。トレイルバケットテーブル44は、速度及び拡張性のために、ディスクドライブにアクセスせずに、RAMへ一時的にデータを記録する。表2は、テーブル44中に記録されるデータの一例を示す。
Figure 2007519106
表3に示されるように、トレイルテーブル45は、トレイルを開始させた検索ターム及びソースのエンジン(即ち、adapterid)を記録する。
Figure 2007519106
表4に示されるように、トレイルステップテーブル46は、訪問したURLに関する詳細を記録する。
Figure 2007519106
表5に示されるように、アダプターテーブル40は、内在するサーチエンジンを駆動する検索フォームパラメータの詳細を記録する。
Figure 2007519106
上記説明されたように、検索トレイルレコーダ11に知られている様々な検索エンジンについての既知の検索コマンドフォーマットのアダプターテーブル40は、アダプターマネージャ12によって管理される。アダプターテーブル40内に管理されている検索コマンドフォーマットは、アダプターマネージャ12によって周期的に検証される。アダプターテーブル40は、検索エンジンの検索フォームを一意に識別する表記を含む。アダプターマネージャ12は、存在する検索コマンドフォーマットを周期的(例えば、1日1回)にテストし、新しい検索エンジンに接続して新しい検索コマンドフォーマットを引き出す。検索コマンドフォーマットの破損が見つけられると、アダプターマネージャは、破損したフォーマットの修復を試みるであろう。検索エンジンへの適合に要求される唯一の情報は、検索ボックスを含むウェブページのURLである。
発明のこの例では、他の全ての情報はアダプターマネージャ12によって自動的に集められる。発明の他の実施の形態では、半自動化及び/又は手動処理もまた、正確なフォームへの適合精度を増大させるために用いられ得る。従って、検索フォームURLが検索ユーザ14によってアダプターマネージャ12に伝送されると、ステップ50において、アダプターマネージャは、URLに位置する検索エンジンが既知であることを確証するアダプターテーブル40内に現在のアダプター識別子が存在するか否かを決定する。もしこの場合には、確認が検索ユーザ14に返される。そうでなければ、検索フォーム提出メソッド(即ち、GET又はPOST)及びアクション属性の値(即ち、http//google.com.search)を含む、ターゲットの検索エンジンの検索フォームについての詳細を自動的に集めるフォーム探知コンポーネントへ、検索フォームURLが伝送される。
従って、ステップ51において、フォーム探知コンポーネントは、検索フォームについてのリクエストを外部の検索エンジン52へ伝送する。その後、ステップ53において、対応する外部の検索エンジン52からの検索ページが、フォーム探知コンポーネントへ返される。ステップ54において、フォーム探知コンポーネントは、検索ページのドキュメント・オブジェクト・モデルから検索フォームを見つけ、クエリーパラメータ、フォーム提出メソッド、クッキー設定、及び検索URLを含む、内在する検索エンジンを駆動するために必要とされるパラメータを識別する。このパラメータ識別ステップは、検索ボックスフォームページのHTMLソースをリクエストして、HTMLパーサを用いてHTMLソースコードを分析することにより実行される。多くの場合、ページの最初のフォームが検索ページである。一旦フォームが見つけられると、ステップ55においてフォーム中の第1のテキストボックスが用いられて、外部の検索エンジン52と共に検索コマンドフォーマット(アダプター)のテストが行われる。ステップ56においてテストクエリーが伝送され、それはその後外部検索エンジン52によって処理される。正しい検索コマンドフォーマットでテストクエリーが提出されると、その後、ステップ57においてテスト結果ページがアダプターマネージャ12によって受信される。テストタームについての結果ページが見つけられると、アダプターテーブル40内のアダプターステータスは「live」に設定される。
トレイルサーチャ13は、検索者が、与えられた検索クエリーにマッチする彼ら自身のトレイル又は他人によって生成されたトレイルを検索することを可能とする。検索ユーザ14からの検索クエリーを受信すると、ステップ60において、トレイルサーチャ13は、関連する検索トレイルを識別するために、トレイルテーブル45内に記録された以前の検索クエリーに対して検索クエリーのマッチングを実行する。検索タームフィールドで全文インデックス付けが実行されて、ストップワードを除去し、及び各々のマッチングについてのインバース・ドキュメント・フリークエンシー(IDF)値を計算した後に、マッチングが実行されることを可能とする。トレイルサーチャ13は、ユーザが、検索を彼ら自身のトレイルのみに制限、又は付加的に、他人の検索トレイルを含む検索に拡張することを可能とするように適合される。ステップ61において、関連する検索結果が検索ユーザに提示される順序が、一つ以上のランキング基準によって決定される。トレイル検索結果が提示される順序は、日付、インバース・ドキュメント・フリークエンシー・マッチング、ターゲット検索エンジン、ユーザ識別子、及び/又はトレイル重みによって決定され得る。これらランキング基準の任意の一つ以上の組み合わせは、ユーザによって選択され得る。他の実施の形態では、トレイルは、クライアントのネットワークアドレス、及び/又は最初にそのトレイルに抗したユーザとの地理的な近接性に基づいて提示され得る。
トレイルレコーダ11によってユーザのIPアドレスがキャプチャされる発明の実施の形態では、類似のユーザが、互いの過去の検索経験から利益を得ることができるように、ユーザは、自ら自身の国、組織、部門、又は他のサブグループ化を用いて、他のユーザによって生成されたトレイルを検索することを選択することができる。
ユーザは、自らの検索トレイルを他人と共有するか共有しないかを選択的に決定することができる。これは、トレイルレコーダ11中の検索トレイルを使用するアクセス権データを付加することにより達成され得る。アクセス権データは、トレイルウォッチャ10からユーザによって(例えば、ツールバー20上のボタンを選択することにより)、又はトレイルレコーダ11によって記録されたデータをその後編集することによって付加され得る。トレイルサーチャ13は、その後、第3者へのアクセス権が許可されている検索トレイルデータについてのみ検索し得るように適合される。
トレイル上のステップがユーザによって訪問される度に、トレイル重みがインクリメントされる。トレイルの重みはトレイル中の全てのステップの累積的な重みであり、初期値はゼロである。トレイルステップが表示されてユーザがステップをクリックする度に、サーバ側のCGIプログラムがトレイルステップの合計の重みを1だけインクリメントする(例えば、http://turbo10.com/cgi−bin/addweight.cgi?stepid=2132213)。より頻繁にクリックされるステップ12は、より多くの重みを得る。トレイルの重みは、そのトレイルステップの全ての重みの合計である。結果ステップ中のトレイルの順序は、より抗されたトレイルを1番目に表示して、重みの降順で表示され得る。他の実施の形態では、トレイルの重みが時間の経過につれて次第に減少することができ、結果セット中により早く現れることにより、より新しいトレイルはポピュラーになり得る。ユーザはまた、ユーザが抗した他のトレイルの閲覧を選択することができる。従って、ステップ62においてフォーマットした後に、順序づけられた検索トレイル結果がユーザに提示される。ステップ63においてなされたトレイル重みのどのような調整も、トレイルステップテーブル46中に維持される検索トレイルのステップへ重みを加える効果を有し、それはその後、ステップ61において、関連する検索結果のソート時に考慮される。
検索クエリーディテクタ10、検索トレイルレコーダ11、アダプターマネージャ12、及びトレイルサーチャ13によって実行される上記されたクライアント側及びサーバ側の機能が、プログラム可能な装置又は機器に、望まれる機能を実行させるための一連の命令を備えるコンピュータプログラムによって実行されることが理解されるであろう。上記された実施の形態では、トレイルレコーダ11、アダプターマネージャ12、及びトレイルサーチャ13は、リモートサーバに維持されたコンピュータプログラム又はコンピュータプログラムコンポーネントであるのに対して、検索クエリーディテクタは、クライアント中にインストールされたコンピュータプログラムによって実現される。発明の他の実施の形態では、トレイルレコーダ11、アダプターマネージャ12、及びトレイルサーチャ13は、同じ物理的なサーバ上にホストされる必要が無い。同様に、アダプターテーブル40、トレイルテーブル45、トレイルステップテーブル46、トレイルバケット44、及び他のテーブル、並びに上記された機能を実行するために必要とされるデータベースは、それらデータベース又はテーブルにアクセスする1つ又は複数のコンピュータプログラムから、同じ又は異なるサーバ上に位置されることができる。
最後に、ここに添付された特許請求の範囲内において定められる技術的思想又は領域から逸脱しない範囲内で、本発明に対して様々な修正及び/又は追加がなされ得ることが理解されるべきである。例えば、上記された発明の実施の形態は、クライアントによってアクセスされたインターネットサイトの記録に関する一方、発明の他の実施の形態では、サイトは、イントラネット、エクストラネット、又はクライアント/サーバアプリケーションを実行する他のネットワークを通じてアクセスされ得る。
本発明に係る通信ネットワーク中のクライアントによってアクセスされたサイトを記録するためのシステムの検索クエリーディテクタの一部を形成するブラウザツールバーの表示である。 本発明に係る通信ネットワーク中のクライアントによってアクセスされたサイトを記録するためのシステムの相互に関連する構成要素の概略図である。 図2のシステムの一部を構成する検索クエリーディテクタの概略図である。 図2のシステムの一部を構成する検索トレイルレコーダである。 図2のシステムの一部を構成するアダプターマネージャの概略図である。 図2のシステムの一部を構成するトレイルサーチャの概略図である。

Claims (40)

  1. 通信ネットワーク中のクライアントによってアクセスされたサイトを記録するための自動化された方法であって、
    前記クライアントから一つ以上の検索エンジンへの検索クエリーの提出を検出するステップと、
    前記クライアントへの検索クエリー結果の応答に続いて、続けてアクセスされたサイトの一つ以上のパラメータの検索トレイルを記録するステップとを含む方法。
  2. 前記検索クエリーの提出を検出する前記ステップが、
    前記クライアントからの完全なフォームオブジェクトの提出を検出するステップと、
    前記フォームオブジェクトの一部が、複数の前記検索エンジンの任意の既知の検索コマンドフォーマットとマッチするか否かを判断するステップとを含む請求項1に記載の自動化された方法。
  3. 前記検索コマンドフォーマットが、前記検索クエリーを実行するための検索エンジンプログラムのネットワークアドレスを含む請求項2に記載の自動化された方法。
  4. 前記検索コマンドフォーマットが、ユーザ入力された検索クエリーを識別する一つ以上の検索パラメータを更に含む請求項3に記載の自動化された方法。
  5. 前記クライアントからの完全なフォームオブジェクトの提出を検出する前記ステップが、
    クライアントへ提示されたコンテンツのオブジェクトモデル内のフォームオブジェクトを見つけるステップと、
    提出時に、前記完全なフォームオブジェクトのインターセプトを可能にするために、各々のフォームオブジェクトへルーチンを追加するステップとを含む請求項2〜4の何れか一項に記載の自動化された方法。
  6. クライアントへ提示されたコンテンツのドキュメント・オブジェクト・モデル内の全てのフォームオブジェクトを見つける前記ステップが、前記コンテンツが前記クライアントへ提示された後に実行される請求項5に記載の自動化された方法。
  7. 前記コンテンツがHTMLドキュメントであり、一旦DocumentCompleteイベントが発生すると、前記HTMLドキュメントのドキュメント・オブジェクト・モデル内の全てのフォームオブジェクトが見つけられる請求項6に記載の自動化された方法。
  8. 前記HTMLドキュメントが、GET又はPOSTフォームを含む請求項7に記載の自動化された方法。
  9. 一旦検索クエリーが検出されると、前記検索クエリー結果から続けてアクセスされた前記サイトの一つ以上のパラメータを記録する前記ステップが、前記クライアントにおいて任意に選択可能である請求項1〜8の何れか一項に記載の自動化された方法。
  10. 前記検索クエリー結果から続けてアクセスされた前記サイトの一つ以上のパラメータを記録する前記ステップが、
    続けてアクセスされた前記サイトの前記ネットワークアドレスを記録するステップを含む請求項1〜9の何れか一項に記載の自動化された方法。
  11. 前記検索クエリー結果から続けてアクセスされた前記サイトの一つ以上のパラメータを記録する前記ステップが、
    一つ以上のユーザ識別子、参照するサイトの前記ネットワークアドレス、前記クライアントの前記ネットワークアドレス、及び、検索ターム又は前記クライアントにおいて前記ユーザによって入力されたタームを記録するステップを更に含む請求項10に記載の自動化された方法。
  12. 前記検索クエリー結果から続けてアクセスされた前記サイトの一つ以上のパラメータを記録する前記ステップが、
    前記クライアントにおいて識別された前記一つ以上のパラメータを、記録用のトレイル記録サーバに伝送するステップを更に含む請求項10又は11の何れか一項に記載の自動化された方法。
  13. 前記トレイル記録サーバにおいて、前記一つ以上のパラメータを初めにRAMテーブル中に記録するステップを更に含む請求項12に記載の自動化された方法。
  14. 前記トレイル記録サーバにおいて、RAMテーブルデータをディスクベースのテーブルへ周期的に保存するステップを更に含む請求項13に記載の自動化された方法。
  15. 第1のディスクベースのテーブルが、各々の検索トレイルを特徴付けるデータを記録する請求項14に記載の自動化された方法。
  16. 第2のディスクベースのテーブルが、各々の検索トレイル中でアクセスされた連続的なサイトを特徴付けるデータを記録する請求項14又は15の何れか一項に記載の自動化された方法。
  17. 続けてアクセスされたサイトの数が、所定の最大値に制限される請求項1〜16の何れか一項に記載の自動化された方法。
  18. 複数の前記検索エンジンについての既知の検索コマンドフォーマットのアダプターテーブルを維持するステップを更に含む上記請求項の何れか一項に記載の自動化された方法。
  19. 前記アダプターテーブル中に維持された前記検索コマンドフォーマットを周期的に検証するステップを更に含む請求項18に記載の自動化された方法。
  20. 新しい検索エンジンの検索コマンドフォーマットを自動的に識別するステップと、
    前記アダプターテーブルを更新するステップとを更に含む請求項18又は19の何れか一項に記載の自動化された方法。
  21. 検索エンジンの検索ボックスページを識別する検索情報を収集するステップと、
    前記検索情報からの前記検索コマンドフォーマットを識別するステップとを更に含む請求項18〜20の何れか一項に記載の自動化された方法。
  22. 検索情報を収集する前記ステップが、
    前記検索ボックスの前記HTMLコードを収集するステップと、
    前記HTMLコードを分析し、前記検索コマンドフォーマットを識別するステップとを含む請求項21に記載の自動化された方法。
  23. 前記検索クエリーを以前の検索クエリーにマッチさせ、関連する検索トレイルを識別するステップを更に含む請求項9〜17の何れか一項に記載の自動化された方法。
  24. 前記検索クエリーを以前の検索クエリーにマッチさせる前記ステップが、
    前記検索クエリー及び以前の検索クエリーに対して全文検索を実行するステップを含む請求項23に記載の自動化された方法。
  25. 前記検索クエリーを以前の検索クエリーにマッチさせるステップが、
    前記関連する検索トレイルを、同じユーザからの検索クエリーに起因する検索トレイルに制限するステップを含む請求項23又は24の何れか一項に記載の自動化された方法。
  26. 前記関連する検索トレイルが、同じユーザ及び他のユーザからの検索クエリーに起因する検索トレイルを含む請求項23又は24の何れか一項に記載の自動化された方法。
  27. 前記クライアントにおいて前記関連する検索トレイルを提示するステップを更に含む請求項23〜26の何れか一項に記載の自動化された方法。
  28. 前記関連する検索トレイルを提示する前記ステップが、
    一つ以上のランキング基準によって前記関連する検索結果を順序づけるステップを含む請求項27に記載の自動化された方法。
  29. 前記ランキング基準が、一つ以上の任意の日付、インバース・ドキュメント・フリークエンシー・マッチ、ターゲット検索エンジン、ユーザ識別子、又は関連する検索トレイル中のステップへのユーザ訪問の累積頻度を示すトレイル重みを含む請求項28に記載の自動化された方法。
  30. 前記通信ネットワークが、前記インターネット、イントラネット、エクストラネット、又はクライアント/サーバアプリケーションを実行する他のネットワークである請求項1〜29の何れか一項に記載の自動化された方法。
  31. 前記一つ以上の検索エンジンが前記クライアント上に維持される請求項1〜30の何れか一項に記載の自動化された方法。
  32. 通信ネットワーク中のクライアントによってアクセスされたサイトを記録するためのシステムであって、
    前記クライアントから複数の検索エンジンのうちの1つへの検索クエリーの提出を検出するための検索クエリーディテクタと、
    前記クライアントへの検索クエリー結果の応答に続いて、続けてアクセスされたサイトの一つ以上のパラメータの検索トレイルを記録するための検索トレイルレコーダとを備えるシステム。
  33. 複数の前記検索エンジンについての既知の検索コマンドフォーマットのアダプターテーブルを維持するためのアダプターマネージャを更に備える請求項32に記載のシステム。
  34. 前記検索クエリーを以前の検索クエリーにマッチさせ、関連する検索トレイルを識別するためのトレイルサーチャを更に備える請求項32又は33に記載のシステム。
  35. 前記検索クエリーディテクタが、ツールバー、ブラウザアドオン又は拡張、デスクバー、エージェント、又はプロキシー等のクライアント側のアプリケーションである請求項32〜34の何れか一項に記載のシステム。
  36. 請求項32〜34の何れか一項に記載のシステムと共に用いるための検索クエリーディテクタ。
  37. 請求項32〜34の何れか一項に記載のシステムと共に用いるための検索トレイルレコーダ。
  38. 請求項33に記載のシステムと共に用いるためのアダプターマネージャ。
  39. 請求項34に記載のシステムと共に用いるためのトレイルサーチャ。
  40. 請求項32〜39の何れか一項に記載の前記検索クエリーディテクタ、検索トレイルレコーダ、アダプターマネージャ、及び/又はトレイルサーチャによって行われる前記方法を実行するためのプログラム命令を含むコンピュータソフトウェア。
JP2006549768A 2004-01-19 2004-12-15 通信ネットワーク中の一つ以上の検索エンジンに渡って検索トレイルを記録するための方法及びシステム Withdrawn JP2007519106A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AU2004900248A AU2004900248A0 (en) 2004-01-19 Method and system for recording search trails across one or more search engines in a communications network
PCT/AU2004/001763 WO2005069161A1 (en) 2004-01-19 2004-12-15 Method and system for recording search trails across one or more search engines in a communications network

Publications (1)

Publication Number Publication Date
JP2007519106A true JP2007519106A (ja) 2007-07-12

Family

ID=34754158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006549768A Withdrawn JP2007519106A (ja) 2004-01-19 2004-12-15 通信ネットワーク中の一つ以上の検索エンジンに渡って検索トレイルを記録するための方法及びシステム

Country Status (9)

Country Link
US (2) US8572100B2 (ja)
EP (1) EP1716508A4 (ja)
JP (1) JP2007519106A (ja)
CN (1) CN1906612A (ja)
BR (1) BRPI0418413A (ja)
CA (1) CA2552791A1 (ja)
IL (1) IL176743A0 (ja)
RU (1) RU2006129938A (ja)
WO (1) WO2005069161A1 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8838622B2 (en) 2002-07-13 2014-09-16 Cricket Media, Inc. Method and system for monitoring and filtering data transmission
US20040122692A1 (en) 2002-07-13 2004-06-24 John Irving Method and system for interactive, multi-user electronic data transmission in a multi-level monitored and filtered system
US8943035B2 (en) 2005-11-14 2015-01-27 Patrick J. Ferrel Distributing web applications across a pre-existing web
US8949217B2 (en) * 2006-01-09 2015-02-03 Google Inc. Server bookmarks
US20080010252A1 (en) * 2006-01-09 2008-01-10 Google, Inc. Bookmarks and ranking
US8019777B2 (en) * 2006-03-16 2011-09-13 Nexify, Inc. Digital content personalization method and system
EP1826943A1 (en) * 2006-07-31 2007-08-29 Siemens Aktiengesellschaft Method for searching information in a network
US20080091637A1 (en) * 2006-10-17 2008-04-17 Terry Dwain Escamilla Temporal association between assets in a knowledge system
JP5393471B2 (ja) 2006-11-08 2014-01-22 イーパルズ インコーポレイテッド 意味ネットワークにおけるノードの動的特性化
US20080176194A1 (en) 2006-11-08 2008-07-24 Nina Zolt System for developing literacy skills using loosely coupled tools in a self-directed learning process within a collaborative social network
US20080176985A1 (en) * 2006-11-13 2008-07-24 Verrall Andrew P Water-soluble film
JP2008146207A (ja) * 2006-12-07 2008-06-26 Yuichiro Matsuda コンテンツ検索方法、コンテンツ検索プログラム、および記録媒体
US20080294626A1 (en) * 2007-03-08 2008-11-27 Amarnath Mukherjee Method and apparatus for leveraged search and discovery - leveraging properties of trails and resources within
US7827184B2 (en) * 2007-04-10 2010-11-02 Yahoo! Inc. System and method for modeling user selection feedback in a search result page
US7743047B2 (en) * 2007-05-08 2010-06-22 Microsoft Corporation Accounting for behavioral variability in web search
US7774339B2 (en) * 2007-06-11 2010-08-10 Microsoft Corporation Using search trails to provide enhanced search interaction
US20090248661A1 (en) * 2008-03-28 2009-10-01 Microsoft Corporation Identifying relevant information sources from user activity
US20090254529A1 (en) * 2008-04-04 2009-10-08 Lev Goldentouch Systems, methods and computer program products for content management
US8589395B2 (en) * 2008-04-15 2013-11-19 Yahoo! Inc. System and method for trail identification with search results
US8051068B2 (en) * 2008-04-21 2011-11-01 Yahoo! Inc. Trail-based exploration of a repository of documents
US20100042476A1 (en) * 2008-08-14 2010-02-18 Gauri Dinesh K Method and system for target marketing and category based search
WO2011046899A1 (en) 2009-10-13 2011-04-21 Epals, Inc. Dynamic collaboration in social networking environment
US7716205B1 (en) 2009-10-29 2010-05-11 Wowd, Inc. System for user driven ranking of web pages
US10289735B2 (en) * 2010-04-27 2019-05-14 Microsoft Technology Licensing, Llc Establishing search results and deeplinks using trails
US8983996B2 (en) * 2011-10-31 2015-03-17 Yahoo! Inc. Assisted searching
US9858313B2 (en) 2011-12-22 2018-01-02 Excalibur Ip, Llc Method and system for generating query-related suggestions
CN102567497B (zh) * 2011-12-23 2013-07-24 浙江大学 一种最匹配模糊轨迹问题的查询方法
JP5861545B2 (ja) * 2012-03-30 2016-02-16 富士通株式会社 情報処理装置、履歴制御方法および履歴制御プログラム
US20130290830A1 (en) * 2012-04-30 2013-10-31 Salesforce.Com, Inc. System and method for managing a viewstate of a web application
US9699272B2 (en) * 2012-09-29 2017-07-04 Oracle International Corporation Mechanism for initiating behavior in a native client application from a web client application via a custom URL scheme
US9424352B2 (en) 2012-12-20 2016-08-23 Ebay Inc. View item related searches
CN103713894B (zh) * 2013-11-28 2017-04-05 百度时代网络技术(北京)有限公司 一种用于确定用户的访问需求信息的方法与设备
US9672288B2 (en) * 2013-12-30 2017-06-06 Yahoo! Inc. Query suggestions
US9501851B2 (en) 2014-10-03 2016-11-22 Palantir Technologies Inc. Time-series analysis system
US9767172B2 (en) * 2014-10-03 2017-09-19 Palantir Technologies Inc. Data aggregation and analysis system
IN2015CH02762A (ja) * 2015-06-01 2015-07-17 Wipro Ltd
CN105701231B (zh) * 2016-01-20 2018-04-20 深圳市迅雷网络技术有限公司 网络资源搜索系统及方法

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6206829B1 (en) * 1996-07-12 2001-03-27 First Opinion Corporation Computerized medical diagnostic and treatment advice system including network access
US5890172A (en) * 1996-10-08 1999-03-30 Tenretni Dynamics, Inc. Method and apparatus for retrieving data from a network using location identifiers
JP3560758B2 (ja) * 1997-03-17 2004-09-02 シャープ株式会社 データ管理方法およびそれを用いたデータ管理装置
US6035332A (en) * 1997-10-06 2000-03-07 Ncr Corporation Method for monitoring user interactions with web pages from web server using data and command lists for maintaining information visited and issued by participants
US6243091B1 (en) * 1997-11-21 2001-06-05 International Business Machines Corporation Global history view
US6195679B1 (en) * 1998-01-06 2001-02-27 Netscape Communications Corporation Browsing session recording playback and editing system for generating user defined paths and allowing users to mark the priority of items in the paths
US6636886B1 (en) * 1998-05-15 2003-10-21 E.Piphany, Inc. Publish-subscribe architecture using information objects in a computer network
US6377983B1 (en) * 1998-08-31 2002-04-23 International Business Machines Corporation Method and system for converting expertise based on document usage
US20050257400A1 (en) * 1998-11-06 2005-11-24 Microsoft Corporation Navigating a resource browser session
JP3278406B2 (ja) * 1998-12-10 2002-04-30 富士通株式会社 ドキュメント検索仲介装置、ドキュメント検索システム、および、ドキュメント検索仲介プログラムを記録した記録媒体
US6633316B1 (en) * 1999-05-13 2003-10-14 International Business Machines Corporation Method and apparatus for implementing direct link selection of cached, previously visited links in nested web pages
WO2000072199A2 (en) * 1999-05-21 2000-11-30 The Brodia Group Autonomous browsing agent
AUPQ475799A0 (en) * 1999-12-20 2000-01-20 Youramigo Pty Ltd An internet indexing system and method
US7543078B2 (en) * 1999-12-31 2009-06-02 Subdomain Identity Partners Individuals' URL identity exchange and communications
US6519648B1 (en) * 2000-01-24 2003-02-11 Friskit, Inc. Streaming media search and continuous playback of multiple media resources located on a network
AU2001233141A1 (en) 2000-02-04 2001-08-14 America Online Incorporated Methods and systems of automated client-server data validation
IL134893A0 (en) * 2000-03-06 2001-05-20 Joinweb Inc Method and system for locating internet users having similar navigation patterns
US20010054020A1 (en) * 2000-03-22 2001-12-20 Barth Brian E. Method and apparatus for dynamic information connection engine
US6968332B1 (en) * 2000-05-25 2005-11-22 Microsoft Corporation Facility for highlighting documents accessed through search or browsing
US7725526B1 (en) * 2000-06-23 2010-05-25 International Business Machines Corporation System and method for web based sharing of search engine queries
US6785666B1 (en) * 2000-07-11 2004-08-31 Revenue Science, Inc. Method and system for parsing navigation information
US7451099B2 (en) * 2000-08-30 2008-11-11 Kontera Technologies, Inc. Dynamic document context mark-up technique implemented over a computer network
GB2368410A (en) 2000-10-23 2002-05-01 Navigationzone Ltd A user interface for assisting navigation through a network
US20020087522A1 (en) * 2000-12-29 2002-07-04 Macgregor Robert Method and apparatus for facilitating internet based sales transactions by local vendors
US7047294B2 (en) * 2001-05-02 2006-05-16 Microsoft Corporation Page-view recording with click-thru tracking
US6934702B2 (en) * 2001-05-04 2005-08-23 Sun Microsystems, Inc. Method and system of routing messages in a distributed search network
US7099871B2 (en) * 2001-05-04 2006-08-29 Sun Microsystems, Inc. System and method for distributed real-time search
US6968334B2 (en) * 2001-05-15 2005-11-22 Nokia Corporation Method and business process to maintain privacy in distributed recommendation systems
US6795820B2 (en) * 2001-06-20 2004-09-21 Nextpage, Inc. Metasearch technique that ranks documents obtained from multiple collections
US7188141B2 (en) * 2001-06-29 2007-03-06 International Business Machines Corporation Method and system for collaborative web research
JP4066621B2 (ja) * 2001-07-19 2008-03-26 富士通株式会社 全文検索システム及び全文検索プログラム
US7254526B2 (en) * 2001-08-24 2007-08-07 International Business Machines Corporation Apparatus and method for determining compatibility of web sites with designated requirements based on functional characteristics of the web sites
JP2003157259A (ja) * 2001-09-05 2003-05-30 Fuji Xerox Co Ltd 情報検索システム
US20020156779A1 (en) * 2001-09-28 2002-10-24 Elliott Margaret E. Internet search engine
US6988240B2 (en) * 2002-03-29 2006-01-17 Global Knowledge, Inc. Methods and apparatus for low overhead enhancement of web page and markup language presentations
US20040003351A1 (en) * 2002-06-28 2004-01-01 Microsoft Corporation Navigating a resource browser session
US7225407B2 (en) * 2002-06-28 2007-05-29 Microsoft Corporation Resource browser sessions search
WO2004008348A1 (en) * 2002-07-16 2004-01-22 Horn Bruce L Computer system for automatic organization, indexing and viewing of information from multiple sources
US20040193612A1 (en) * 2003-03-31 2004-09-30 Chang William I. System and method for testing, monitoring, and tracking distributed transactions using a search engine
US20050097189A1 (en) * 2003-10-30 2005-05-05 Avaya Technology Corp. Automatic detection and dialing of phone numbers on web pages
US7389295B2 (en) * 2004-06-25 2008-06-17 Searete Llc Using federated mote-associated logs
US20060062252A1 (en) * 2004-06-30 2006-03-23 Jung Edward K Mote appropriate network power reduction techniques
US8856145B2 (en) * 2006-08-04 2014-10-07 Yahoo! Inc. System and method for determining concepts in a content item using context

Also Published As

Publication number Publication date
RU2006129938A (ru) 2008-02-27
US20090030876A1 (en) 2009-01-29
WO2005069161A1 (en) 2005-07-28
EP1716508A1 (en) 2006-11-02
BRPI0418413A (pt) 2007-05-15
US20140032519A1 (en) 2014-01-30
IL176743A0 (en) 2006-10-31
US8572100B2 (en) 2013-10-29
CA2552791A1 (en) 2005-07-28
CN1906612A (zh) 2007-01-31
EP1716508A4 (en) 2008-01-23

Similar Documents

Publication Publication Date Title
US8572100B2 (en) Method and system for recording search trails across one or more search engines in a communications network
US7945637B2 (en) Server architecture and methods for persistently storing and serving event data
Tanasa et al. Advanced data preprocessing for intersites web usage mining
US5931912A (en) Traversal path-based approach to understanding user-oriented hypertext object usage
US9300755B2 (en) System and method for determining information reliability
US7827166B2 (en) Handling dynamic URLs in crawl for better coverage of unique content
Chitraa et al. A novel technique for sessions identification in web usage mining preprocessing
US20060212265A1 (en) Method and system for assessing quality of search engines
US9740795B2 (en) Methods, systems, and computer program products for consolidating web pages displayed in multiple browsers
US20090248818A1 (en) Cooperating system, chat server, program, and cooperating method
Langhnoja et al. Pre-processing: procedure on web log file for web usage mining
US20060235886A1 (en) Method, system and software for centralized generation and storage of individualized requests and results
US20030084034A1 (en) Web-based search system
Reddy et al. Preprocessing the web server logs: an illustrative approach for effective usage mining
CN101551813A (zh) 网络连接设备、搜索设备及搜集搜索引擎数据源的方法
JP5431475B2 (ja) 検索システム、及び検索空間マップサーバ装置、並びにプログラム
KR20110122719A (ko) 탐색 엔진 결과 페이지 연구 보조를 위한 시스템 및 방법
CA2789909C (en) Synchronizing http requests with respective html context
KR20100119333A (ko) 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법
US7668854B2 (en) System and method of building proven search paths
AU2004313991B2 (en) Method and system for recording search trails across one or more search engines in a communications network
JP5523268B2 (ja) 検索空間設定装置およびそれを用いた検索システム
Sun et al. Botseer: An automated information system for analyzing web robots
TW595158B (en) Method and system for blocking networked limitative information
JP3725836B2 (ja) 知識情報収集システムおよび知識情報収集方法

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090115