JP2008511057A - エンドユーザの情報要求に応答するための方法及び装置 - Google Patents

エンドユーザの情報要求に応答するための方法及び装置 Download PDF

Info

Publication number
JP2008511057A
JP2008511057A JP2007528053A JP2007528053A JP2008511057A JP 2008511057 A JP2008511057 A JP 2008511057A JP 2007528053 A JP2007528053 A JP 2007528053A JP 2007528053 A JP2007528053 A JP 2007528053A JP 2008511057 A JP2008511057 A JP 2008511057A
Authority
JP
Japan
Prior art keywords
user
information
search engine
window
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007528053A
Other languages
English (en)
Inventor
レミジアス ケイ パッツコウスキー
マシュー イー ウェストオーヴァー
ベンジャミン リンゼイ
スコット ヴァンドヴェルド
ジェイソン フェアチャイルド
アダム ウィリアム ピンゲル
ドミニク ベネット
Original Assignee
クラリア コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/015,583 external-priority patent/US8078602B2/en
Application filed by クラリア コーポレイション filed Critical クラリア コーポレイション
Publication of JP2008511057A publication Critical patent/JP2008511057A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Abstract

本発明は高度検索エンジンに関する。高度検索エンジンは、エンドユーザのブラウジング活動を監視するためのクライアント構成要素、クライアント構成要素から受け取ったデータを格納し処理するためのリモートサーバ(1つ又はそれ以上のコンピュータを含むことができる)、及びウェブページを処理してエンドユーザに検索結果を提供するモジュールを含むことができる。高度検索エンジンは、1つ又はそれ以上のキーワードに関する情報を求めるエンドユーザの検索要求に応答して、所定の関心対象キーワードに関するウェブページを収集し、エンドユーザによって要求されたウェブページをフェッチし、ウェブページの抜粋又は要約を生成し、重複ウェブページを排除し、ウェブページの重要度をランク付けし、更に関連性のあるウェブページ又はウェブページへのリンクを提供することができる。本発明の特定の態様は請求項、明細書、及び図面内に説明されている。
【選択図】図2

Description

(関連の出願)
本出願は、2004年8月19日に出願されたWestover他による名称「Method and Apparatus for Responding to End−User Request for Information(エンドユーザの情報要求に応答するための方法及び装置)」の米国仮特許出願第60/603,140号、2004年12月20日に出願されたWohlers他による名称「Method and Device Publishing Cross−Network User Behavioral Data(クロスネットワークユーザの行動データを公開するための方法及びデバイス)」の米国仮特許出願第60/637,684号、2005年3月17日に出願されたEagle他による名称「Method and Device for Publishing Behavioral Observations to Customers(顧客に対して行動観測を公開するための方法及びデバイス)」の米国仮特許出願第60/662,680号、及び2005年3月11日に出願されたWestover他による名称「Method and Apparatus for Responding to End−User Requests for Information(エンドユーザの情報要求に応答するための方法及び装置)」の米国仮特許出願第60/660,798号の恩恵を主張する。本出願は、2004年12月17日に出願されたAnthony G.Martinによる名称「Search Engine for a Computer Network(コンピュータネットワークのための検索エンジン)」の米国特許出願第11/015,583号の一部継続出願である。これらに示した出願は、あらゆる目的のために引用により組み込まれる。
本発明は、高度検索エンジンに関する。高度検索エンジンは、エンドユーザのブラウジング動作を監視するためのクライアント構成要素、クライアント構成要素から受け取ったデータを格納し処理するためのリモートサーバ(1つ又はそれ以上のコンピュータを含むことができる)、及びウェブページを処理してエンドユーザに検索結果を提供するモジュールを含むことができる。高度検索エンジンは、例えば1つ又はそれ以上のキーワードに関する情報を求めるエンドユーザ検索要求に応答して、所定の関心のあるキーワードについてのウェブページを収集し、エンドユーザによって要求されたウェブページをフェッチし、ウェブページの抜粋又は要約を生成し、重複ウェブページを排除し、ウェブページの重要度をランク付けし、更に関連性のあるウェブページ又はウェブページへのリンクを提供することができる。解決される技術的問題、用いた手法、及び得られた結果を以下に説明する。
Googleによってとられた検索エンジンに対する1つの手法は、世界中の情報を編成して、これを広くアクセス可能で有用なものにすることである。かつてDogpileによってとられた別の手法は、メタ検索エンジンに他の検索エンジンの結果を集約させることである。これらの手法は、膨大な結果をもたらす。例えば「cheap travel」というキーワードは、2005年夏現在で、Googleから約18,000,000件、Yahooからは約85,800,000件、MSNからは68,377,619件の結果を返している。
膨大な結果の最上位に「針」を浮上させ、クエリに応答して返ってきたリンクをランク付けする方法を考案するために多くの研究がなされてきた。Googleの公開特許出願では、その名称において、ローカルな相互接続性、記事情報、ロケーション認識、及び他の因子を用いて、結果の位置付けを決定することを提案している。Yahoo、Overture、及びMicrosoftも同様に、これらの結果の提示を改良するよう研究をおこなってきた。
どのような情報セットにおいても、検索用語は、どのような結果が求められているのかを判断するのには十分ではないことがある。2005年6月16日に公開されたBharat他の「Generating User Information for Use in Targeted Advertising(ターゲット広告において用いるためのユーザ情報の生成)」のUS2005/0131762A1、2005年1月20日に公開されたCarrasco他の「Disambiguation of Search Phrases Using Interpreation Clusters(解釈クラスタを用いた検索フレーズの曖昧性の除去)」のUS2005/0015366A1において広範囲に説明されているように、ある意味では検索用語は曖昧であってもよい。用語「jaguar」は、自動車、動物、フットボールチーム、又はオペレーティングシステムを意味している可能性がある。用語が曖昧でない場合でも、様々なユーザは、異なる情報にアクセスすることを望んでいる可能性がある。例えば、十代の旅行者、ビジネス旅行者、及び豪華旅行者は、異なる旅行手配及び宿泊設備を探しているが、場合によっては同様の検索用語を用いる。
検索に対する応答又はより一般的には情報フィードに関係するか否かにかかわらず、最も関連する結果を返すことが望ましい。ウェブサイト上で公開されるドキュメント数(及び個人のサーバ上でアクセス可能なドキュメント数)の増加は、ユーザのクエリに応答する関連結果を迅速に返すための代替技術又は改善技術の発展を生じさせる。実際には、キーワードが「cheap travel」である特定のユーザに最も関連する50件又は100件のウェブサイトを見つけ、これらをユーザに対して効果的に要約する。これによって、コンテンツ、スポンサー付きコンテンツ、又は広告であるか否かにかかわらず、返された情報をユーザの関心に基づいてパーソナライズする技術の発展が更に起こる。
米国仮特許出願第60/603,140号公報 米国仮特許出願第60/637,684号公報 米国仮特許出願第60/662,680号公報 米国仮特許出願第60/660,798号公報 米国特許出願第11/015,583号公報 US公開2005/0131762A1公報 US公開2005/0015366A1公報 米国特許出願第10/152,204号公報 米国特許出願第10/464,419号公報
以下の詳細な説明は図面を参照しながら行われる。好ましい実施形態は、請求項を限定するためではなく、例証のために説明される。当業者であれば、以下の説明に対する様々な均等な変形形態を認識するであろう。しかしながら、説明される本実施形態はこの特定の詳細のうちの1つ又はそれ以上がなくとも実施することができる点も当業者であれば理解されるであろう。場合によっては、本実施形態の態様を曖昧にするのを避けるため、公知の詳細部分は図示又は説明されていない。
コンピュータ関連では、本明細書で開示される構成要素は、ハードウェア、ソフトウェア、又はハードウェアとソフトウェアとの組み合せ(例えばファームウェア)内に実装することができることは理解することができる。ソフトウェア構成要素は、メモリ、大容量記憶装置、又はリムーバブル記憶装置などのコンピュータ読取り可能記憶媒体内に格納されたコンピュータ読取り可能プログラムコードの形態とすることができる。例えばコンピュータ読取り可能媒体は、特定の構成要素の機能を実行するためのコンピュータ読取り可能プログラムコードを含むことができる。同様にコンピュータメモリは、後でプロセッサが実行することができる1つ又はそれ以上の構成要素を含むように構成することができる。構成要素は、複数のモジュール内に別個に、又は単一のモジュール内に共に実装することができる。
以下で説明する実施形態及び実施形態の態様は、様々な技術上の問題を解決するために適用することができる。1つの問題は、大規模ネットワークに該当し、すなわち、ユーザ、検索エンジン、及びアクセスされるドキュメント間の通信パターンを監視し、有効に集約する方法である。1つの事象では、ユーザは広範に分配されたパーソナルコンピュータにおいてインターネットを利用しており、検索エンジンは、Baidu、Google、Yahoo!、及びMSNを含み、ドキュメントは、世界中でウェブサイトに掲載されたページである。別の事象では、雇用者が、ワークグループサーバ上に公表された参照ドキュメントを特定するために企業内検索エンジンを有する企業イントラネットを利用する。これらの問題への取り組みは、好ましくはユーザの通常業務を妨害することなく使用中の通信チャンネルを監視しサーバに観測結果を報告することができる行動観測モジュールを配置する段階を含むことができる。1つの実施形態では、行動観測モジュールは、ユーザのパーソナルコンピュータ(デスクトップ、ラップトップ、又はハンドヘルドコンピュータ、或いはメディアセンターデバイスなど)上で実行することができる。このモジュールは、通信を行う際にユーザマシンの通信とステータスの両方を観測することができる。例えば、ユーザはどのような検索用語及び結果で特定のウェブサイトまで辿ったのであろうか。このモジュールは、報告をフィルタリングし、活動をカテゴリー別にコード化することによって処理の分散を達成し、通信行動を集約するのに必要なリソースをかなり低減することができる。このモジュールは、リソースが利用可能であるとき、又はユーザが所属ドメインをブラウズするときに観測結果をサーバに報告することができる。観測結果のクッキーは、アクセスするドメインへの通常のクッキーのアップロードの一部としてサーバに送信することができる。サーバは、報告された通信パターンを集約することができる。1つの技術的な成果は、大規模ネットワークにわたって位置付けられた通信モニタから報告を受信し、通信が行われたときに個々のコンピュータのステータス又は状態を含むパターンを集約することである。結果として、集約された通信パターンを用いて、クエリ又はコンタクトに備えて、検索又は公開のための情報を事前に編成することができる。
関連する技術上の問題は、ユーザに提示される最初のレコードの関連性を高めるために、ネットワークに接続された特定の端末の最新ステータス及び最近のステータスに基づいて過剰な電子レコードを編成する方法である。過剰な電子レコードは、「jaguar」についてのウェブサイトのように世界中のウェブサイトに由来することができる。或いはこれらは、ワークグループサーバ上に格納されたドキュメントとすることができる。これらは、繰返し「ページダウン」などを押下することなしにユーザの画面上に表示するのがあまりにも多いという意味で過剰である。好ましくは特定ユーザと関連付けられた端末の現在及び最近のステータスは、検索クエリが実行依頼された直前の24時間(又は他のなんらかの期間)以内に訪れたウェブサイトを含むことができる。或いはステータスは、ワークグループサーバから検索されたドキュメントの履歴を含むことができる。いずれの種類の活動も事前処理して、カテゴリー別に分類することができる。端末ステータスの報告期間は、端末の現在及び最近のステータスに基づいて情報を選択及びフィルタリングするパーソナライズド電子ジャーナルに対するクエリ又はリクエストに先行することができる。技術的な方法はやはり、ユーザのコンピュータ上で実行される行動監視モジュールを含む。この実施形態では、モジュールは端末ステータスを要約し、この要約を電子レコード(例えばクッキー)に公開して、該レコードをユーザがコンタクトする検索エンジン又は他のサイトに通信する。ステータス又は活動のカテゴリー上の要約を報告することにより、処理が分散され、サーバベースのリソースに対する必要性が軽減される。検索エンジンは、例えばどの意味の「jaguar」が関心対象であるかを判定するためにこの情報を用いる。「jaguar」について検索を行う自動車カテゴリーに高度に関心のあるユーザは、Jaguar自動車に関連するリンクを得ることになるが、関連カテゴリーへの関心のない人は、自動車、動物等の混合リンクを得ることになる。カテゴリープロファイルは、ユーザの関心対象を更にカテゴリー化するように発展させることができる。郊外に住む新しく親になった者は、アクセスしたコンテンツから認識され、独身のX世代の20代の人とは異なるホームアクセサリ又は車のカテゴリーに割り当てることができる。結婚や住宅購入、又は出産といった人生を変える出来事も同様に認識することができる。「jaguar」の例と同様に、「travel Italy」という問い合わせに対して、検索エンジンは、ユーザが関心を持つ旅行スタイルを判断し、これに応じて過剰な電子レコードを編成する。技術的結果は、端末のステータス又は最近の活動の電子報告に基づくクエリ又はコンタクト、並びに過剰な電子レコードから現在及び最近の端末ステータスに最も関連性が高い可能性のある特定のレコードのセットの選択に応答する。
ウェブワイドの行動ターゲティングは、サイト側の行動ターゲティングとは実質的に異なる。サイト側の行動ターゲティングを実施すると、提携サイトのグループは商業的行動を識別しようと試みる。ポータルサイト及びニュースサイトなどのサイトは通常広告を配信する。メッセージは、提携サイトへの訪問から識別される行動に応答して、提携サイト上に表示される。サイト側行動ターゲティングの結果は、行動ターゲティングなしのキャンペーンよりも良好であるが、図12に例示しているようにユーザ行動の狭い部分から得ることができるインサイトに依存しており、これは以下に説明する。サイト側とは対照的にウェブワイドの行動ターゲティングは、広告を認めないサイトでも全てのサイトにわたる関心対象の商業的サーフィン行動及び任意的に非商業的ネットサーフィン行動を識別することができる。商業的ウェブ活動の90%は広告を表示しないサイト又はページ上で行われているため、このことは大きな意味を持つ。従ってポータルは、ページビューによって測定されたユーザ全体の商業的活動の10%未満を見ているわけである。非ポータルの発行元は、そのユーザ全体の商業的活動の3%未満を見ている。行動監視モジュールは、ウェブサイト運営者との関係を単純化することができ、サイト側行動ターゲティングに参加するよりも大きな発行元ネットワークにわたってメッセージを表示することを可能にする。ウェブワイドの行動ターゲティングは、サイト側行動ターゲティングよりも良好な結果をもたらす。
ここで図1を参照すると、種々の実施形態で用いることができる例示的なコンピュータの概略図が示されている。図1の実施例で示されるコンピュータは、その構成に応じて、クライアントコンピュータ、サーバコンピュータ、又は他のデータ処理デバイスとして利用することができる。図1のコンピュータは、特定のアプリケーションの要求を満たす多少の構成要素を有することができる。図1に示されるように、コンピュータは、例えばIntel Corporation、Advanced Micro Devices、又はIBMから提供されるプロセッサ101を含むことができる。コンピュータは、その様々な構成要素を結合する1つ又はそれ以上のバス103を有することができる。コンピュータは、1つ又はそれ以上の入力デバイス102(例えばキーボード、マウス)、コンピュータ読取り可能記憶媒体(CRSM)105(例えばフロッピーディスク、CD−ROM)、CRSMリーダ104(例えばフロッピードライブ、CD−ROMドライブ)、ディスプレイモニタ109(例えば陰極線管、フラットパネルディスプレイ)、ネットワークに結合するための通信インターフェース106(例えばネットワークアダプタ、モデム)、1つ又はそれ以上のデータ記憶装置107(例えばハードディスクドライブ、光学ドライブ、FLASHメモリ)、及びメインメモリ108(例えばRAM)を含むことができる。ソフトウェアの実施形態は、コンピュータ読取り可能記憶媒体105内に格納することができ、データ記憶装置107又はメインメモリ108に転送される。メインメモリ108内のソフトウェア実施形態は、プロセッサ101によって実行することができる。図1の実施例において、メインメモリ108は、行動監視及びメッセージ配信プログラム120を有するように示されており、これは以下に詳細に説明する。メインメモリ108内の行動監視及びメッセージ配信プログラム120、並びに他のプログラムは、例えばコンピュータ読取り可能記憶媒体105、データ記憶装置107、又は通信インターフェース106を用いてインターネットからロードすることができる。メインメモリ108内の行動監視及びメッセージ配信プログラム120、並びに他のプログラムは、プロセッサ101によって実行することができる。
図2は、この技術が動作するコンピューティング環境の概略図を示している。図2の実施例ではコンピューティング環境は、1つ又はそれ以上のウェブサーバコンピュータ160(すなわち160−1、160−2、・・・)、1つ又はそれ以上のクライアントコンピュータ110、1つ又はそれ以上のメッセージサーバコンピュータ140、及び具体的には図示されていない他のコンピュータを含む。図2の実施例では、クライアントコンピュータ110は、インターネットを介してサーバコンピュータ(例えばウェブサーバコンピュータ又はメッセージサーバコンピュータ)と通信する。従って、矢印201は、この実施例におけるインターネット接続を示している。ゲートウェイ、ルータ、ブリッジ、インターネットサービスプロバイダーネットワーク、公衆交換電話網、プロキシサーバ、ファイアウォール及び他のネットワークコンピュータ等の中間ノードは、明確にするために図示されていない。
クライアントコンピュータ110は通常、必須ではないが、例えばMicrosoft Windows(商標)オペレーティングシステムを動作させるようなパーソナルコンピュータである。消費者は、インターネットに乗り、そこに結合されたコンピュータにアクセスするのに適切に装備されたクライアントコンピュータ110を利用することができる。例えばクライアントコンピュータ110は、ウェブサーバコンピュータ160からのウェブページにアクセスするために用いることができる。
ウェブサーバコンピュータ160は、ウェブサイトをホストするサーバコンピュータとすることができ、ウェブサイトはインターネット上をサーフィンする消費者を引き付けるように設計されたウェブページを含む。ウェブサーバコンピュータ160は、広告、ダウンロード可能コンピュータプログラム、オンライン購入で入手可能な製品等をサポートするウェブページを含むことができる。理解できるように、ウェブサイトは1つ又はそれ以上のサーバコンピュータ上に存在することができる。
メッセージサーバコンピュータ140は、ウェブサーバコンピュータ160の機能を含むことができる。1つの実施形態では、メッセージサーバコンピュータ140は更に、データベース171を含む。データベース171は、Oracle Corporationから入手可能なような市販のデータベースとすることができる。データベース171は、クライアントコンピュータ110内で動作する行動監視及びメッセージ配信プログラム120から受け取られたクライアントデータを格納することができる。クライアントデータは、クライアントコンピュータ110からメッセージサーバコンピュータ140にデータパケット121で送信することができる。クライアントデータは、行動監視及びメッセージ配信プログラム120で消費者のオンライン活動を監視することによって得られたナビゲーション及び行動データを含むことができる。図2の実施例では、説明を簡単にするために、メッセージサーバコンピュータ140は1つのクライアントコンピュータ110と通信するように図示されている。実際にはメッセージサーバコンピュータ140は、各々が行動監視及びメッセージ配信プログラム120を有する複数のクライアントコンピュータ110からクライアントデータを含むデータパケット121を受け取る。メッセージサーバコンピュータ140はまた、クライアントコンピュータ110上のソフトウェア構成要素をサポート、更新、及び維持するためのダウンロード可能コンピュータプログラム及びファイルを含むことができる。メッセージサーバコンピュータ140は、検索エンジン650を含むか、或いは検索エンジンに接続することができる。
ウェブサーバコンピュータ160及びメッセージサーバコンピュータ140は通常、必須ではないが、Sun Microsystems、Hewlett−Packard、又はInternational Business Machinesから入手可能なようなサーバコンピュータである。クライアントコンピュータ110は、クライアント−サーバプロトコルを用いてウェブサーバコンピュータ160又はメッセージサーバコンピュータ140と通信することができる。クライアント−サーバ間コンピューティングは当該技術分野で公知であり、本明細書では詳細には説明しない点に留意されたい。
図2に示されるように、クライアントコンピュータ110は、ウェブブラウザ112及び行動監視及びメッセージ配信プログラム120を含むことができる。ウェブブラウザ112は、市販のウェブブラウザ又はウェブクライアントとすることができる。1つの実施形態では、ウェブブラウザ112は、Microsoft Internet Explorer(商標)ウェブブラウザを含む。ウェブブラウザは、クライアントコンピュータ上の消費者がウェブページにアクセスすることを可能にする。図2の実施例では、ウェブブラウザ112は、ウェブサーバコンピュータ160からのウェブページ113をディスプレイするように図示されており、ウェブページ113のようなウェブページは、「URL」(ユニフォームリソースロケータ)と呼ばれる対応アドレスを有しており、ウェブブラウザ112は、クライアントコンピュータ110において当該ウェブページを受け取るために、そのウェブページのURLに向けられる。ウェブブラウザ112は、例えばウェブブラウザ112のアドレスウィンドウにURLを入力すること、又はそのURLに向けられたリンクをクリックすることによりそのURLに向けることができる。
1つの実施形態では、行動監視及びメッセージ配信プログラム120は、メッセージサーバコンピュータ140又はウェブサーバコンピュータ160からダウンロード可能である。行動監視及びメッセージ配信プログラム120は、別のコンピュータプログラムのダウンロードと共にクライアントコンピュータ110にダウンロードすることができる。例えば、行動監視及びメッセージ配信プログラム120は、無料又は低コストで提供されるユーティリティプログラム181と共にクライアントコンピュータ110にダウンロードすることができる。ユーティリティプログラム181は、例えばウォレット又はカレンダープログラムとすることができる。ユーティリティプログラム181は、行動監視及びメッセージ配信プログラム120を介して消費者のクライアントコンピュータ110に広告を配信する権利と引き換えにその消費者に提供することができる。本質的に、消費者に配信される広告からの収入は、ユーティリティプログラムの作成及び維持のコストの支払に役立つ。行動監視及びメッセージ配信プログラム120はまた、例えば無料又は低コストでのオンラインサービスへのアクセスと共に消費者に提供することができる。
行動監視及びメッセージ配信プログラム120は、クライアントコンピュータ110内で格納及び実行される点でクライアント側プログラムである。行動監視及びメッセージ配信プログラム120は、クライアントコンピュータ110において広告を表示し、クライアントコンピュータ110上で消費者のオンライン活動を監視するためのコンピュータ読取り可能プログラムコードを含むことができる。消費者がクライアントコンピュータ110において受け取られるウェブページのURLにナビゲートしている場所、消費者によって訪問されたウェブサイトのドメイン名、消費者がウェブページ上でタイプしている内容、消費者が検索エンジンに与えたキーワード、消費者がリンク又は広告をクリックしたか否か、消費者がマウス又はキーボードを作動させた時間、及び同様のものを判断するような消費者のオンライン活動の監視の仕組みは、一般に当該技術分野において公知であり、本明細書では詳細には説明されない点に留意されたい。例えば、行動監視及びメッセージ配信プログラム120は、ウェブブラウザ112から事象通知を受け取ることによって消費者のオンライン活動を知ることができる。
行動監視及びメッセージ配信プログラム120は、メッセージサーバコンピュータ140に報告するために消費者のオンライン活動を記録することができる。記録された消費者のオンライン活動はまた、「クライアントデータ」とも呼ばれ、データパケット121を用いてメッセージサーバコンピュータ140に供給される。メッセージサーバコンピュータ140は、クライアントデータを用いて、消費者にターゲット広告を提供することができる。メッセージサーバコンピュータ140は、メッセージユニット141内に広告を表示するための広告又はデータを含むことができる。図2の実施例では、ターゲット広告は広告116として表記され、表示媒体内に表示される。提示媒体115は、ポップアンダー、ポップアップ、別ブラウザウィンドウ、又はコンピュータ画面上に広告を表示するための他の手段とすることができる。クライアント側プログラムを用いてクライアントコンピュータに広告を配信する技術はまた、Scott G.Eagle、David L.Goulden、 Anthony G.Martin、及びEugene A.Veteskaによって2002年5月21日に出願された「Method and Apparatus for Displaying Messages in Computer Systems(コンピュータシステムにおいてメッセージを表示するための方法及び装置)」という名称の同一出願人の米国特許出願第10/152,204号にも開示されており、引用により全体が本明細書に組み込まれる。
以下でより明らかになるように、行動監視及びメッセージ配信プログラムは、主に検索エンジンインデックスを構成するためのクライアントデータを入手するのに用いられ、必ずしもクライアントコンピュータ110において提示媒体を表示するとは限らず、すなわち行動監視及びメッセージ配信プログラムは、必ずしもクライアントコンピュータ110において広告を表示する必要はない。このことは、消費者がユーティリティプログラムのプロバイダー又はスポンサーからの広告を見ることを必要とせずに、無料又は低コストのユーティリティプログラム181(又は他の恩恵)を得ることができる点で有利である。
図3は、コンバージョンプロセスの追跡を概略的に示している。「コンバージョン」は、消費者に提示された広告に応答して、消費者がオンライン購入又は登録を行う際に発生する。以下により明らかとなるように、この実施形態は、キーワード−リンクの組み合せをランク付けする際の因子としてコンバージョンを用いることができる。図3の実施例では、ウェブページ202(すなわち202−1、202−2、・・・)は、ウェブブラウザ112の同じウィンドウ又は別ウィンドウで順次表示することができる。各ウェブページ202はページ識別子21 13(すなわち210−1、210−2、・・・)を含み、これらはURLであってもよい。行動監視及びメッセージ配信プログラム120は、消費者が閲覧したウェブページ202の20箇所のURLを記録し、同様に消費者が各ウェブページに消費した時間量をナビゲーションデータとして記録する。本開示の目的においては、消費者によって「閲覧された」ウェブページは、クライアントコンピュータにおいて受け取られたウェブページである。図3の実施例では、ナビゲーションデータ627は、ログエントリ117(すなわち117−1、117−2、・・・)を含む。各ログエントリ117は、クライアントコンピュータ110(又は消費者)を匿名で識別するマシンID、ページ識別子、及びログエントリ417がいつ形成されたかを示すタイムスタンプを含む。ログエントリ117間のタイムスタンプは、消費者が表示されたウェブページを閲覧するのに消費した時間量の推定値を提供する。ログエントリ117は、消費者によって閲覧された各ウェブページ202毎に作成することができる。例えばログエントリ117−1は、消費者がリンク501をクリックしてウェブページ202−2を受信した時に作成することができる。クライアントコンピュータ110では、ログエントリ117−2は、消費者がクライアントコンピュータ110においてウェブページ202−3を受信した時などに作成することができる。
図3の実施例では、ウェブページ202−2はまた、ウェブページ202−1においてリンクを有する広告によって直接向けられるウェブページであるので、「待ち受けページ」とも呼ばれる。オンライン上で製品を販売するウェブサイトはまた、「確認ページ」202−5を有することができる。確認ページは、直前に完了したオンライン購入を確認するために消費者に対して提供されるウェブページである。或いは確認ページは、登録情報の確認送信を含むことができる。ウェブサイトは、待ち受けページ202−2と確認ページ202−5との間に「中間ページ」202−3、202−4などを有することができる。中間ページは、オンライン製品カタログ、ショッピングカート、及び他の種類のウェブページとすることができる。人気の高い又は提携ウェブサイトの待ち受けページ及び確認ページのページ識別子は、メッセージサーバコンピュータ140のデータベース171内に格納することができ、待ち受けページ及び確認ページのページ識別子は、クライアントコンピュータ110のナビゲーションデータ627内のものと比較して、特定のウェブページからオンライン購入を行う消費者の番号を求めることができる。理解されるように、消費者が購入を行うウェブページは、関連性が高い可能性があり、従って消費者の好みのページであると考えることができる。消費者の購入行動を監視するための技術はまた、David L.Goulden及びDominic Bennettによって2003年6月17日に出願された「Generation of Statistical Information in a Computer Network(コンピュータネットワークにおける統計情報の生成)」という名称の同一出願人の米国特許出願第10/464,419号にも開示されており、これは引用により全体が本明細書に組み込まれる。
(プロセスの流れ)
図4は、スポンサー付き及びスポンサーなしの情報配信をパーソナライズする検索エンジンを提供するために互いに機能することができる構成要素の高レベルブロック図である。背景として、行動監視モジュールは現在、米国及び米国外において4千万台を上回るマシン上の行動ウェブナビゲーション情報を取り込んでいる。収集される情報は拡大しており、必要に応じて適合される。現在このナビゲーション行動情報は、ウェブワイドGMT広告媒体(例えばポップアップ及びスライドアンダー)を強化するだけでなく、ウェブ全体にわたって消費者の行動に固有のインサイトを与える数多くのデータリッチアプリケーションを強化するのに用いられている。行動監視モジュールは、最初に入力されたキーワードの観測から結果として表示されたリンクまで、更に滞留時間、閲覧ページ、反復訪問数、及びクリック後の購入又は登録を含むクリック後のメトリックに至るまでの全体の検索ライフサイクルを調べる能力を有する。ユーザ行動を集約することによって、カテゴリープロファイル及び人生を変える事象を判定することができる。検索エンジンの使用及びカテゴリー関心度による高度なユーザ情報は、経時的に求めることができる。この情報を用いて、ロボットではなく検索を要求した人間によってフィルタリングされた検索結果を選択し再ランク付けすることができる。
(データ収集)
ウェブ使用統計値は、インターネット又は企業イントラネットにわたって選択された検索エンジン上で検索を行うユーザについて行動監視モジュール(120)を用いて収集される(401)。このモジュールは、ユーザの検索に関連付けられた情報、及び各特定のキーワードについてユーザの検索が各特定の検索エンジン上でどのように有効であったかを送り返す。この情報はデータベース内に取り込まれ、このデータベースは毎日又は他のなんらかの同時発生の頻度でロードされる。入手可能な情報は、ユーザが見たもの及びその反応がどのようであったかを含む。ユーザが調べたURLは、この結果をアルゴリズム的又は自然なセクション内に表示することができる。単一の検索用語で入手可能な関連情報は、マシンid、キーワード、検索が実行された検索エンジン、結果として得られたURL、アルゴリズム的URL、入札URL、ペイドインクルージョンURL、URLがクリックされたか否か、閲覧されたページ数、滞留時間、反復訪問数、並びにカテゴリーの関心度及び検索エンジンの高度化などのユーザのメトリックを含む。
米国ユーザからのある統計値は、データ収集及びランク付けの分析範囲を有効なものにすることができる。現時点で百万個の最も頻繁に検索されたキーワードは、主な検索エンジン上で行われた検索の半分を上回り、検索の53%を占める。45,000個の最も頻繁に検索されたキーワードは38%を占める。検索として入力されたキーワードの分布は、Zipf分布で表すことができ、これは、両軸に対数目盛を有するグラフ上で直線としてプロットされる。例えば、2005年8月13日にhttp://www.useit.com/alertbox/20030616.htmlにアクセスしたAlertbox(2003年6月16日)のJacob Nielsonによる「Diversity is Power for Specialized Sites(特殊なサイトにとって多様性は力である)」を参照されたい。2,000個の行動監視モジュールは、10,000件の最も頻繁な検索をランク付けするのに十分なデータを生成することになると予測される。20,000個の行動監視モジュールのより大きなグループは、45,000個の最も頻繁に検索されるキーワードをカバーすることになる。4,000万個を基準とする行動監視モジュールは、観測された1,500億件のページビューからフィルタリングされた300億件のデータ列を毎月取り込むことができる。観測されたページビューの中で毎月80億件のオーダーの商業的事象が記録され、これらは250万件を上回る購入を含む。これらの数字は、たとえ統計学への精通が一時的なものであっても、極めて大多数のサーチャーの情報及び行動を集約すること、及び大衆の高い評価によって検索エンジンからの結果の第1ページ上に最も重要なウェブサイトを提示することに対してリーダを刺激するに違いない。集約された消費者行動を用いる検索エンジンは、検索要求に迅速に応答するようにページ/ドキュメントの権威及び人気をランク付けするにはよい状況にある。
図5〜11は、行動監視モジュールからの情報をランク付け及びリンク追従サーバ並びにパーソナライズされた結果をもたらす検索エンジンに伝達することができるデータレコード又はクッキーの実施例である。図5は、クリックされたURLを報告するクッキー又はデータレコードの実施例である。キーワード501、タイムスタンプ502、及びユーザによって選択された1つ又はそれ以上のURL503は、例えば、ユーザがサーバのうちの1つと提携しているウェブサイトに到達した時のクッキー内において、又は行動監視モジュールが活動を報告する時のデータレコード内においてインターネットサーフィン行動とは無関係に伝送される。コンバージョンステータスに関する追加データ、リターンコンバージョンステータス、ユーザが見たリストのランク等々は、こうしたクッキー又はデータレコード内に含めることができる。
図6は、最新の商業的な関心対象キーワードを格納するクッキーの実施例である。これは、検索からの最新の商業的関心対象キーワード或いはURL又はクリックスルーに関連付けられたキーワードとすることができる。図6の実施例に従って1つより多い最近の商業的関心対象キーワードを1つ又はそれ以上のクッキー内に格納することができる。このクッキーの1つの属性又はフィールドは、クラム602のバージョンである。別のものは書き込み時間604であり、これは1970年からクッキーが書き込まれた時間まで秒単位で表すことができる。商業的フラグ606は、キーワードの種類、例えば現在の商業的関心対象であるキーワードと売り物のキーワードとの間をカテゴリー化するのに用いることができる。キーワードは、テキスト又は省略コードとして含めることができる608。UFT−8のような文字コード610は、キーワード608のデコードを助けるために含めることができる。これは国際環境では重要となる可能性がある。
図7は、パーシスタントメモリに書き込むことができる行動ウォッチャー120によって維持される要約データの実施例である。この実施例では、カテゴリーID802は特定のカテゴリーについての省略形である。ビン(bin)は、1日のような現在の期間702に対して割り当てられる。期間は、様々な時間期間に対して等しい時間の長さのものとすることができる。1つの実施形態では、ビットストリング(列)がビンを実装する。60日の履歴は、60ビットに加えてカテゴリーIDの記憶領域によって実装することができる。各ビンは、特定の時間セグメントに対応する。ビットフラグは、特定の時間セグメントの間にカテゴリーに関連する活動があったかどうかを示す。いずれかのビンによって表される最短期間に対応する一定時間において、ビットストリングが更新される。データは古いビンに移動され、最新のビンを空にする。最近の活動に関するデータは、数字のゼロで表記された最新のビン内にまとめられる。ビンが、不均一な時間量を表している場合には、短時間のビンと長時間のビンとの間の境界においてアルゴリズム的に、又は追加の記憶領域を割り当てることのいずれかによって特別な対応が行われる。例えば、前日中のいずれかの1時間セグメントの間の活動は、丸一日の時間セグメント内にビットフラグを立てることになる場合がある。真夜の更新が生じる場合には、真夜中の時間セグメントフラグが「0」である場合に限り、丸一日の時間セグメントはフラグ「0」である。これは、1時間セグメントと丸一日セグメントとの間の境界におけるアルゴリズム上の対応の実施例である。或いは記憶領域は、特定の時間セグメント内の訪問回数を記録するためにビンに割り当てることができる。このことは、報告される行動を認識するサーバ132がどのように応答するかを変更する必要もなく、必要とされる記憶領域の量を有意に増大させる可能性がある。何百ものカテゴリーが存在し、クッキーサイズに対する実用的な制限値が2Kから4Kバイトである場合には、コンパクトな記憶装置が好ましい。クッキーは、ユーザ活動データをアーカイブするサーバに送信することができる。ユーザ活動データは、分析又は広告のターゲティングのために用いることができる。ビットストリングは、カテゴリーによって更にまとめることができ、これは図8〜10に示されている。
図9は、検索ワードの使用、クリックスルー、URL宛先の入力、又はユーザ関心対象の他の指標の新しさに対して適用することができるバケットを示している。最新の訪問は特定のバケット内のメンバーシップによって記録される。15又は16個のバケットのうちの1つは4ビットで識別することができる。その数字においてバケットは不均一な長さのものである。図6によって例示されているような単一の最新の訪問レコード、又はメモリ内に保持されているエントリを用いて、特定のバケットにカテゴリーを割り当てることができる。
図19は、バナー広告に応答した最近の行動の重要度を示しており、これはクリックスルー率によって測定されている。広告カテゴリーにおいて直前の1時間以内に行動をとったユーザは、そのカテゴリーにおいて直前の7日間に行動のないユーザに較べてバナー広告に応答する可能性は30倍であった。直前の1時間、2時間、又は3時間における行動は、バナー広告への応答性において大幅な増加を生じさせることが観測された。直前の7日以内の行動でさえも、ユーザの関心対象と強い相関性がある。好ましくは新しさのバケットサイズの選択は、数字によって示されている最近の行動の観測された累乗を反映する。
図10は訪問の頻度に適用することができるバケットを示している。図7のビットストリングが日数で編成される場合には、カテゴリーにおける活動は、ユーザが興味を示した直前の60日の中から0、1、2、3、4又は5、6から10、11から30、或いは31から60日といった異なる訪問頻度のバケットに割り当てることができる。ビットストリング内に設定されたビット数は、このカテゴリーを用いてカウントされてまとめられる。
新しさ及び頻度のカテゴリーコーディングを考慮して図8を参照する。単一のクッキーは多くのカテゴリーID802のデータを記録することができる。各カテゴリーIDに対して3つ又はそれ以上のユーザの関心対象のメトリックを記録することができる。1つ又はそれ以上の新しさのカテゴリー804を記録することができる。新しさの記録は、上述の検索エンジンに実行依頼されたキーワード又は他の種類のユーザ行動に適用することができる。1つ又はそれ以上の頻度カテゴリー806を記録し、実行依頼されたキーワード、又は他の種類のユーザ行動に適用することができる。バナークリック808は、新しさ、頻度、又はその両方で別個にカテゴリー化することができる。データ列810のコメントは、テーブル内のデータを説明する編集コメントであり、データの一部ではない。カテゴリーID98409は最近のヘビーユーザの関心が認められる。カテゴリーID65625は前月にヘビーユーザの関心が認められる。カテゴリーID68530は、最近の軽度のユーザ関心が認められる。カテゴリー147374は、前月に軽度の活動が認められ、恐らくは頻度806で非ゼロ値によっても反映されるはずである。
行動監視モジュール120は、最も重要なカテゴリーが最初にリストされるように図8のカテゴリー履歴情報をソートするのが好ましい。或いは、システムは、カテゴリーのソートを報告される行動に応答するサーバにまかせることができる。図11に示されているように、カテゴリーID1102は、カテゴリー名1104及び収入優先度1106の両方に関連付けることができる。特にクライアント側のユーザ行動データの一部のみが、報告される行動に応答するサーバに送信される場合には、カテゴリー履歴情報を収入優先度によってソートすることは有益とすることができる。
ウェブ使用に関して返された統計値は、商業的キーワード検索と非商業的キーワード検索とを区別する場合があり、或いは区別しない場合もある。この区別は、Overtureが入札を行う用語のような常に変わる商業的用語のリストに対してキーワードがチェックされる場合のデータベース中へのロード時に行われる。キーワードが商業的であると判断される場合には、このキーワードにはキーワードidが割り当てられ、これはOvertureキーワードidリストと互換性を有することができる。キーワードが商業的ではないとみなされる場合には、別のidがデータロードプロセスにおいて割り当てられる。
これらの2つの種類のデータ(商業的及び非商業的)は、データ倉庫の別個のセクションにロードされる。新しい検索エンジンのロード実行時には、キーワードデータは商業的及び非商業的テーブルの両方から抽出される。この結果は統合され、一意のキーワードidがマスターテーブルから割り当てられる。キーワードは商業的及び非商業的コンテキストの両方で見つけられる場合もある。例えばキーワードの商業的性質が、キーワードが入札されているか否かに関係している場合には、本日に商業的でなかったキーワードが入札を受けると翌日には商業的なものになることができる。同一のキーワードは入札プロセスによって生成されるキーワードidとロードプロセスを通じて生成される第2のキーワードの両方を有することができるので、このキーワードの二重性は一意でないキーワードidを生成する。このことを排除するためには、全てのキーワードに対して単一の一意のキーワードを生成し維持することが好ましい。このリストは、新しいキーワードが発見されると更新され、既存のidを既にシステム内に存在するキーワードに割り当てる。
報告されるURLを簡単にするために、行動監視モジュールによってなんらかの事前処理を行うことができる。URLはアンラップされ、別個のプロセスで取り除かれる。用いている検索エンジンが提供されるURL上のクリックを追跡することができるように、URLは検索エンジンによってラップされる場合が多い。多くの異なる形式のURLラッピングが存在する。例えば、yahoo.comによってラップされたURLは、http://rds.yahoo.com/S=2766679/K=bmw/v=2/SID=w/l=WSl/R=2/SS=100040736/H=l/SHE=0/*−http://ww.bmwmotorcycles.com/とすることができる。このURLをアンラップすると、http://www.bmwmotorcycles.comが得られる。
サーバの観点からすれば、プロセスは行動情報の受け取り(402)で始まる。サーバは、受け取った情報はどのようなものでも利用する。ユーザの観点からすると、行動監視モジュールはその観測結果を報告し、ユーザは他の情報とユーザの情報とを集約したものを順序付けた検索結果を受け取ることになり、及び/又はユーザの最近の行動にパーソナライズされたものを受け取ることになる。
重複除去もまたURLレベルで行うことができる。2つの同一のURLについての情報は単一のURLに集約される。しかしながら、2つのURLが僅かでも異なる場合(例えばスラッシュだけ)には、2つの異なる形態は保持され、例えばタイトルと生成された抜粋との組み合せを用いて、以下に示すような重複除去において別の試みが行われる。
コンバージョンデータは、予め設定されたウィンドウ内で起こる特定のコンバージョン事象に検索URLクリックを結びつけるアルゴリズムによって特定の検索に関連付けることができる。利用及びコンバージョンデータは、マシンid、クエリ時間、広告主ドメインレベルにおいてクリックを有する広告主ドメイン(URL)に対して整合される。特定の広告主ドメイン上にクリックを有する特定のマシンにおいて、コンバージョン統計値が予め設定されたウィンドウ内で観測された場合には、コンバージョンはその検索クリックに帰属する。コンバージョンが予め設定されたウィンドウの外側にある場合には、検索クリックは帰属されない。
帰属されたコンバージョン統計値を有するマシンid−広告主ドメインのペアにおいて、これに続く以後のコンバージョンは反復コンバージョンとして帰属される。またこれらの属性は保持することができ、ランク付けアルゴリズム(404)により利用可能である。検索データに含まれるメトリックは、訪問回数、消費時間(滞留時間)、及び閲覧ページ数を含む。
google.com、msn.com及びyahoo.comにおいて米国マシンの検索行動を組み合せるために、ドメイン事象データは、ソース全体にわたってマシンid−広告主ドメインレベルでユーザデータ(コンバージョンメトリックを伴う)と統合される。これらの結果は、マシンid及び広告主ドメイン内に時間系列順に入れられる。検索クリックに続く予め設定された時間期間内に発生するドメイン事象は、その特定の広告主ドメイン上のその検索クリックについてのクリック後メトリックとして割り当てられる。クリック後メトリックを特定の検索クリックに割り当てることができない場合には、レコードは破棄される。
ドメインの事象データ要素の幾つかは、クライアントが送信したス統計値内に現れる不正確さの影響を受けやすい。消費時間及び閲覧ページ数の両方は、誤って報告される場合もあり、またある時には正確に報告されるが、論理主導の制限が課される必要がある。
消費時間は、不良又は不正確な時計を有するマシンによって誤って伝えられる可能性がある。これは正確に表すことは可能であるが、マシンが特定のドメインに長期間放置されているような場合には上限を設ける必要がある。異常値に上限を設け、クリック掲載のサイト上で消費される時間に対して妥当な閾値を維持する(403)ため、30分の時間制限が利用されている。閲覧ページ数に対する上限も実装されており、5ページに設定されている。他の時間及び閲覧ページ数の制限を代用してもよい。これらの上限は、行動監視クライアント側、又はホストでデータが受け取られた後に実装することができる。加えて、ユーザの活動は、長期間の静止状態は滞留時間としてカウントしないように行動監視モジュールによって監視することができる。
データがマシンid、キーワード、及びURLレベルにおいて統合及び集約される場合、結果として得られるデータ構造は、マシンid、キーワード、キーワードid、URL、URL ID、ドメインid(URLのドメインに対応する)、クリック、クリック当たりの滞留、クリック当たりのページ数、クリック当たりのコンバージョン、ランク位置(ユーザによって閲覧される検索結果リストからのもの)を含むことができる。任意的に、予め設定された関心対象のキーワード(402)のみを処理することができる。例えば、入札キーワード等の商業的関心を有するキーワードを処理することができる。
異常を記録することを回避するために異常値を任意選択的に除去することができる(403)。異常値の一例は、検索エンジンによって一度だけ返され、返された時にユーザによって熱心に辿られたリンクである。単一の強いサンプル点は、強力な平均スコアをリンクに与える可能性がある。キーワードが再記録される直前に出現したリンクは、場合によっては、単一のサンプルに基づいてそのキーワードの最上位の位置にランクされる可能性がある。これに応じて任意選択的に異常値を除去する一例は、リンクが予め設定された回数を辿るまではリンクをランク付けしないものである。例えば、リンクがユーザによって選択されておらず、少なくとも10又は100回辿られている場合には、その活動レベルが予め設定されたレベル又は閾値に到達しない限りランク付けせずに保持することができる。
(ランク付けアルゴリズム)
URLのランク付けアルゴリズム(404)は、あらゆる所与のキーワードについてリンクを識別しランク付けするように開発されてきた。集約された観測結果のセットみ合せに関する多くの変形形態は、以下で説明するように価値がある。1つの組み合せでは、URLを選択し、ランク付けするためにURLクリック率及び滞留時間メトリック(ドメインにおける消費時間、及び/又は閲覧ページ数)が用いられる。
任意選択的に、ユーザ応答は検索結果セット内でURL位置について正規化することができる。位置は、検索結果に対するURLクリックデータにおける本質的な偏りを生じ、これは望ましい場合もあれば、望ましくない場合もある。高ランクを占めるURLは、より多くのクリックを獲得する。この偏りを考慮に入れるために、同じ基盤上の異なる位置にリンク上のクリックを置くように正規化アルゴリズムが開発された。
データは、各位置について集約され、平均クリックスルー率、平均消費時間、及び平均閲覧ページ数が計算される。各ランク位置(1〜n)について、その位置の重要度の少なくとも3つの平均集約基準値が存在し、クリックスルー率、消費時間、及び閲覧ページ数である。これらの基準値の正規化は次式で表すことができる。
Figure 2008511057

Figure 2008511057

Figure 2008511057
この実施形態では、観測されたユーザメトリックに基づいてあらゆるキーワード(404)についての上位URLが計算及びランク付けされる。
この実施形態では、個々のマシンのパーセンテージ票に対応する時間シェアメトリックに基づいて結果を再ランク付けすることができる。このアルゴリズムは、ユーザのウェブサーフィンパターンを考慮し、関連するリンクに対して平等な投票にユーザを効果的に参加させる。ユーザが、検索クリック掲載のサイト上で消費する一定時間量を有することが前提となる。これらの時間は合計され、検索クリックを掲載するサイトを閲覧するのに消費されたユーザの合計時間値を形成する。次いで、合計時間のパーセンテージは、その特定のユーザによってクリックされた各URLについて計算され、結果として時間比率の票が得られる。
この方法論を用いる際に、一般にウェブをサーフィンするのに少ない時間を消費するユーザは、長い時間量を消費する傾向にあるユーザと同じ投票権を有する。これにより全カテゴリーにわたる活動の場が等しくなる。或いは他の実施形態では、個々のユーザプロファイルを構成する他の因子を考慮することができる。カテゴリーを熟知している者として知られているユーザは、より大きな票を有することができる。例えば電子機器カテゴリーに関心の高いユーザは、このカテゴリーが初めてのユーザよりもクリックしたリンクに対してより多くの票数を有することができる。投票ブロックは、全体として全てのカテゴリーにわたるのではなく、特定のカテゴリー内で行われる。
以下の詳細な計算例は、集約及び除去プロセスを通じて特定のキーワード−URLペアに適合する。
高い位置にあるリンクは、高いクリック数を獲得し、よって高いクリックスルー率を有する。同様にユーザはこれらの高いランクを占有するURLのページにより長い時間量を消費し、より多くを閲覧する傾向にある。この偏りに対処するために、正規化プロセスが適用される。
平均クリック数、平均滞留時間、及び平均閲覧ページ数は、キーワード又はURLの組み合せに関係なく各位置について計算される。これらの数値は、位置平均値として以下に示されている。平均比率クリック数、滞留時間、及びページビューもまた、このキーワード、URLの組み合せに対し示されている。これらの平均比率は、全マシンによって各キーワード、URL、及び位置グループ化に充てられる各メトリックのパーセンテージに対応する。
Figure 2008511057
上昇係数を各位置について計算して適切な観測メトリックに適用し、これらを位置について正規化する。正規化方程式は次式である。
Figure 2008511057
低い位置におけるクリック数、滞留時間、及びページビューは、その特定の位置において観測される適切な上昇係数によって係数倍される。以下の実施例では、位置7の事前正規化における平均比率滞留時間は0.32であった。上昇係数の適用後は、平均比率滞留時間は0.53であった。この数値は正規化された滞留時間である。
Figure 2008511057
加重平均は各位置における各メトリックについて計算され、合計はクリックについての位置、及び加重平均比率測定値の全て、すなわちクリック数、時間、及びページビューにわたって計算される。
経時的に、行動監視モジュールからのウェブ使用の新しい報告を得て、特定のキーワードについてのURLは、それらの位置を調節することになる。今週に位置1にあるURLは、次の週には位置7にある可能性がある。従って、位置についての調節は、クリーンアップ及び調節プロセスである。
Figure 2008511057
最終結果は、あらゆる位置におけるキーワード01、URL101についての正規化合計の加重平均である。全てのキーワード、URLの組み合せについて計算すると、単一のスコアが、v17.1のアルゴリズムに必要とされる各メトリックについて計算される。これらのメトリックは、ここで位置について正規化され、更に複数のランク発生ついて正規化される。
Figure 2008511057
スコアリングのランクは、ドメイン上でユーザがページ閲覧するのに消費する時間に基づくことができる。行動監視モジュールから受け取られる情報は、あらゆる閲覧セッションに対して割り当てられることになる最大時間量を制限することができ、又は、行動監視モジュールは、プログラム、マウスクリック又はマウス移動の間のウィンドウナビゲーションなどのユーザ行動を追跡し、更に滞留時間の計算時に非活動状態の期間を無視することができる。
ランク付けは、予め設定された回数よりも少なくユーザが選択したリンクを無視することができ、この予め設定された回数は固定回数或いはキーワード又はカテゴリーについてのトラフィックの関数とすることができる。異常値のリンク(403)を無視することにより、検索エンジンによって稀にしか提示されず、1〜2度しか辿られなかったリンクに高いランク付けを与えるのを回避することができる。
スコアリングのためのランクはまた、クリックスルー率、滞留時間、及びリンクを辿った後に閲覧されたページ又はドキュメント数の組み合せに基づくことができる。これらの係数を組み合せると、幾つかの例では係数のうちの1つが優位を占めることになり、すなわち、ランク重み付けの全て又は3分の2よりも多くは、クリックスルー率、滞留時間、又は閲覧されるページ又はドキュメント数のうちの1つだけに割り当てることができる。或いは、これらは、均等値±10%に重み付けすることができ、又は1つの係数に全重み付けのほぼ半分が与えられるように、係数は、ほぼ2:1:1±10%の重み付け率を割り当てることができる。
ランク付けにおいて用いることができる別の因子は再訪問である。ユーザがドメインを離れた後に予め設定された時間内、又はナビゲーション事象の予め設定された回数内にそのドメインに戻った場合には、そのサイトへのユーザの帰還には有意性を割り当てることができる。サイトへの帰還は、他のサイトを考慮した後の好意的な印象を反映している可能性がある。
閲覧者から購入者又は登録先導者へのコンバージョンは、因子として特に価値があるとみなすことができる。この場合もコンバージョンは、ドメインにおける購入及び登録の両方を含むことができる。自動車又は住宅購入等の幾つかの場合では、購入はウェブサイトでは実現性がなく、又は稀にしか達成されない可能性があるので、登録はより現実的な手段である。帰還コンバージョンもまた考慮に入れることができる。
結果は、分析のために検索エンジン及びスコアリングされたランク毎に分離することができる。次いで、別個のランクスコアは、総合的ランク付けに組み合せることができる。
統計的分析又は他の分析をカテゴリー又はキーワード内に適用し、ランク付け因子のどの組み合せが検索に対して応答してリンクを辿るようにユーザを最も惹きつけるかを判断することができる。ランク付け情報は、キーワードカテゴリーの間で異なって使用されることが予想される。消費時間は自動車カテゴリーでは重要となる。コンバージョンは、音楽ダウンロードカテゴリーではより一層重要となる。
任意選択的に、クリックセグメントバンドを適用することができる。これらのバンドは高いクリック数を有するURLに優先順位を与える。これらのバンドを利用することにより、選択されたアルゴリズム上で結果として得られるリンクを改善することができる。
セグメントバンドは、特定のURLによって受け取られた合計のクリック数に基づいて識別される。例えば以下の通りである。

階級1:100+回のクリック数を有するURL
階級2:50回から99回の間のクリック数を有するURL
階級3:10回から49回の間のクリック数を有するURL
階級4:10回未満のクリック数を有するURL
特定のキーワードについてのURLは、最初に適切なセグメントバンドに入れられる。バンドが識別されると、これらのURLはランクスコアによって降順に設定される。
上位15リンク(405)といった予め設定されたリンク数をデータ収集のために選択することができ、これらはスパイダエンジン(406)によって辿られることになる。
出力として、次の3つのテーブルがランク付けプロセスから生成される。
キーワードテーブル(KEYWORDID、KEYWORD)、
URLテーブル(DOMAINID、URL_ID、URL)、
ランクテーブル(キーワード、URL、ランク)
(追従リンク)
他の検索エンジンにおける慣習的な巡回プログラム(例えばYahoo!におけるSlurp、GoogleにおけるGooglebot、MSNにおけるMSNBot)は、所与のキーワードについて表示するために、リンクのランク順の決定において用いられるインデックスに関連するページを探してウェブ全体を巡回する。対照的に、本明細書で開示される実施形態では、巡回するURLの簡潔な数字が与えられ、これは行動監視モジュール(401)によって報告されるリンクから任意的に選択することができる(405)。これらのリンクは事前にランク付けされ、従って、この情報検索プロセスは、所与のURLの相対重要度をそのURLの他への接続から判断する必要はなく、むしろURLからの可能な最良の説明情報を得る必要がある。
この実施形態では、URLの特定のセットがとられ、幾つかの特定のタスクが次のように実行される。すなわち、全てのHTMLタグが除去され、最初の1,000k又は別の予め設定されたページ上のテキストチャンクがファイルに返される。テキストオブジェクトの値から、テキストシグネチャ又はテキスト指紋として用いられる均一スカラー空間へのマッピングを取得して格納される。MD5又は他のドキュメント(htmlタグを有するものもあれば、有さないものもある)の指紋が計算される。ドキュメントから抽出されたテキスト内の文字の要約カウントが計算される。
この方法は、図18によって示されているようにLinux環境で動作するJavaアプリケーションによって実装することができる。このアプリケーション(1811)は、ブローカアプリケーションであり、多数且つ拡張性のある数のスレッドが複数のLinuxサーバにわたって同時に実行することが可能となる。現行の構成では、各Linuxサーバ(1821、1822)は、最大10個のスパイダインスタンス(1831−33、1834−36)までを処理することができる。その結果、各スパイダは、200個ワーカスレッド(1841−43、1844−46)を実行する。全能力では、この構成は1秒間に800リンクを張ることができる。
単一のブローカにおいて作動している合計スレッド数は、次式で得ることができる。
スパイダ数iで各々がワーカ数j(スレッド数)を有するとすると:
Figure 2008511057
二重ブローカモデル(1821、1822)は、キーワード速度によってキーワードを分離することができる。一般的なキーワードは、ランク付けアルゴリズムの堅牢でヘビーデューティな形態を通じて送られる。動きの速いキーワード(例えば、ニュース、最新事象)は、履歴をあまり利用しない高速形態のランク付けアルゴリズムを通じて処理することができる。キーワード速度は、キーワードの人気がどのように迅速に変化するかに関する尺度である。最も高速なキーワードは、直前の24時間(0日目)内のキーワード検索数をその前の24時間(−1日目)と比較することによって選択することができる。勿論、4又は8時間といった異なる時間を用いてもよい。0日目/−1日目の比率が「1」からどこまで大きく変化するかがキーワード速度である。比率が1よりも小さければキーワードは人気が低く、「古いニュース」となる。比率が1よりも遥かに大きければキーワードは新しい話題に関係する可能性がある。一般に、予め設定された数値の比較的高速のキーワードは、予め設定された間隔又はリソースに応じてインデックスが再作成される。1つの実施形態では、上位10,000個のキーワードは毎日インデックスが再作成される。キーワード速度又は揮発性の1つのメトリックを説明してきたが、変形形態も予期される。
ヘビーデューティな形態は、ランク付けキーワードURLペアを処理する。これらのランク付けキーワードURLペアは、Oracleのデータベース上のテーブルを通じて利用可能となる。URL_TABLEは、DOMAINID,URLID、URL、LENGTH、SIGNATURE_H、SIGNATURE_T、SPIDER_DATE、及びHOSTを含む。
DOMAINID、URLID、及びURLのフィールドは、リンクを辿る前に参照データベースからデータが読み込まれる。特定のURLについてのリンク追従プロセスの後、LENGTH、SIGNATURE_H、SIGNATURE_T、SPIDER_DATE、及びHOSTのフィールドは、データベースに書き戻される。
ブローカは、Oracleデータベースに接続するためにJDBC(Java Database Connectivity)を用いる。ブローカは、ランク付けプロセスからURL_TABLEにアクセスする。ブローカは、URLテーブルにおいて利用可能な合計ドメイン数の1/100について要求し、このURLテーブルに対してSPIDER_DATEはヌルである。これらのドメインに関連付けられた全てのURLは、ブローカによって抽出され、ここでURLはドメインによってグループ化される。個々のスパイダボックスは、遠隔メソッド呼び出し(RMI)を介してブローカと通信し、ドメインに向けて一度に1,000個のドメインにURLを要求する。次いでドメインは、スパイダから、ドメインに関連付けられたURLの全てを取得してこれらのURL上で動作するワーカに渡される。
一般的に受け入れられる巡回又はリンク追従の手法に対応するために、URLはドメインによってグループ化されたワーカへと渡され、何千もの同時要求によってドメインに殺到しないようにする。一度に1つを上回る要求で単一のドメインにアクセスしないことは、一般に受け入れられる手法である。リンク追従プロセス(406)は、所与のドメインに関連付けられた全てのURLを各ワーカに割り当てることで、この一般的に受け入れられる原理を順守する。
リンク追従プロセス(406)は、コンテンツをフェッチして特定のURLから統計値を計算するロバストで拡張性のあるアプリケーションである。ワーカがドメイン及びその関連付けられたURLを受け取ると、ワーカはHTTPプロトコルを用いてそのURLにアクセスする。良好な応答コードを受け取ると、リンク追従ワーカはそのページで作業を開始する。ワーカは、その時の98%を上回る応答コード200(OKステータス)を受け取る。ページがリダイレクト(コード301、302、303、及び307)を示すHTTPコードを返す場合は、そのURLについての情報を取得するために、ワーカ又はシステムは追加の措置をとる必要がある。ワーカは、断念する前に最初のURLから5回までのリダイレクトを辿ることになる。ワーカがエンドポイントに到達すると、次のタスクが生じ、すなわちURLからHTTP戻りコードを取得する。良好な応答コードが得られると、次のタスクが生じ、すなわち利用可能であればタイトルのメタタグを識別し、全体のドキュメント(HTMLとテキストとの両方)のMD5指紋を計算し、ページからHTMLを構文解析して、テキストの最初の1,000kをディスクに書き戻す。
コンテンツが構文解析され、ディスクに書き戻されると、後続のオペレータが引き継ぐ。このオペレータは、ドキュメント指紋に用いられる幾つかの計算を行い、Oracleデータベースにこれら及び他の統計値を書き戻す。システムは、次のフィールドをOracleに書き戻す:URL_TABLE、DOMAINID,URLID、URL、LENGTH、SIGNATURE_H、SIGNATURE_T、SPIDER_DATE、及びHOST。
LENGTHは、ドキュメントのテキスト(最初の1,000k)内の文字数である。この特徴は、後にプロセス(408)でURLの重複除去を行うのに用いることができる。SIGNATURE_Hは、MD5ハッシュコードシグネチャである。SIGNATURE_Tは、テキスト(最初の1,000k)のCRC32チェックサムコードである。SPIDER_DATEは、特定のURLがアクセスされた日付と時間を示す。HOSTは、どのスパイダマシンがURLのテキストを格納したかに関係する。
次のシステムは、ドキュメント重複除去(409)を支援するように設計された3つの異なる手法を作成することができる。この重複除去プロセスは、所与のキーワードの結果セット内で同一の又は極めて類似したドキュメントを識別することを目的とする。別個には示されていない先行する段階において、URLは、URLレベルで重複除去される。2つの全く同一のURLの発生のような容易に識別される重複が排除される。システムは、同一のページを指し示すようには見えないが、実際には指し示しているURLを排除しようとする。1つの実施形態では、各URLについて数学的なシグネチャ(指紋)がとられ、所与のキーワード結果セット内で他のURLと比較される。3つの例示的なシグネチャは、長さシグネチャ、MD5シグネチャ、及びCRC32チェックサムである。他のシグネチャを代用してもよい。
長さシグネチャでは、テキストドキュメントの文字長が計算される。この手法は、重複として識別されたページにコンテキストを与えるのを助ける点で重複除去処理の一助となる。例えば、2つのサイトが同一のMD5及びCRC32シグネチャを示しているが、本質的に異なるURLを有する場合には、このシグネチャが分析される。長さシグネチャが小さい、つまりページが小さいと、これら2つのURLは、例えばアダルトコンテンツサイトに入る前に見られるような標準警告画面を共有している可能性が高い。
MD5シグネチャは通常、データの完全性を検証するための手段である。MD5アルゴリズムは、任意長のメッセージを入力としてとり、出力として入力の128ビット「指紋」又は「メッセージダイジェスト」を生成する。MD5アルゴリズムは、大きなファイルが安全な方法で「圧縮」される必要がある場合のデジタルシグネチャアプリケーションを対象としている。システムは、全体のドキュメントについてMD5シグネチャを計算し、例えば同値比較プロセスを128ビット比較にまで軽減させる。
CRC32チェックサムは、32ビット長の巡回冗長チェックサム多項式を生成する。通常これは送信されているデータの完全性を確認するために用いられる。CRCはファイルの「デジタル指紋」である。CRC32を用いると、巨大な20MB(又は更に大きな)ファイルを「解凍し」、ファイルへの小さく扱いやすい参照符号である有する7d9c42fb(16進法表記)のような単一の32ビットの数字が得られ、これはこの巨大なファイルのコンテンツ全体を反映している。システムは、ドキュメントのテキストのCRC32シグネチャを計算し、ページのテキストコンテンツへのインサイトを得る。
計算及び使用可能な別のシグネチャは、Rabinの指紋生成アルゴリズム、例えばコンパクトなチェックサムを生成するBroederの実装である。
チェックサム又は指紋のいずれかは、全ドキュメント、取り除かれたHTMLタグが少ない全ドキュメント、キャッシュされるドキュメントの選択されたチャンク、タイトル及び抜粋、或いはドキュメントからの他のなんらかの予め設定された抜粋に対して適用することができる。1,000k前後のドキュメントを用いることができる。
プロセスは、特定のURLについての実行を完了し、データはOracleデータベース及びスパイダボックスに書き込まれる。Oracleデータベースは、URL_TABLEに書き込まれた指紋情報(長さ、MD5、crc32)、及びスパイダの日付/時間、ホストのロケーション情報、並びにKEYWORDテーブルに書き込まれたスパイダの日付/時間スタンプを受け取る。スパイダボックスは、該スパイダボックスが辿ったデータリンクについてのファイルを受け取り、すなわち、URL、タイトル(そのURLからの最初のフェッチ中に得られる場合)、及び抜粋生成に用いられることになるドキュメントのテキスト(最初の1,000k)である。このテキストは、メタ記述の要素及びドキュメントの本文を含む。
(抜粋生成)
抜粋生成プロセスは、表示(407)用にタイトル及び抜粋を生成する。抜粋プロセスは、キーワードフレーズとURLとの組み合せを取り、そのURLを説明する最良のタイトルを創出し、そのURL内に含まれており且つそのキーワードに関係する情報を200文字スペース内で概説するそのURLについての抜粋を生成する。抜粋生成はリンク追従プロセスに続く。抜粋は、選ばれたURLから検索されたドキュメントのテキストから生成される。
キーワード「somec bicycles」は、表示のために以下の例示的なテキストを作成する。
Figure 2008511057
この実施例では、タイトルは「Upland Sports...Frames」である。この抜粋はタイトルに続いて2つの行がある。URLは最終行にある。
タイトルは通常、リンクが辿られた時に検索されたページのタイトルから生成される。ほとんどのサイトでは、検索エンジンのためにHTMLメタタグを利用することによりページタイトルに注釈を付けている。タイトルを識別するタグは全体の97%を超えるURLに存在している。
HTMLタグがタイトルを供給しないこの3%のURLでは、本プロセスがタイトルを作成する。URLに利用可能なテキストがある場合、プロセスはテキストの最初のおよそ70文字をとり(ワードの境界を尊重しながら)、タイトルを作成する。URLから生成されたテキストがない場合には、そのURLからドメイン名(wwwから.comまでの間の全情報)が剥され、タイトルとして表示される。
抜粋生成は芸術と科学の組み合わせである。このプロセスは、数式と言語科学とを利用して抜粋を作成する。1つの実施形態では、抜粋は1つの単一のサブ抜粋、又は省略記号(...)で分離された最大3つまでのサブ抜粋からなることができる。スコアリングアルゴリズムは、組み合せ(単一のサブ抜粋の場合ではそうではないが)時にどのサブ抜粋が最良のスコアをもたらすかを決定する。
抜粋スコアリングアルゴリズムは、ドキュメントのテキストの様々な部分をスコアリングするマルチステッププロセスである。このアルゴリズムは、4つの部分にキーワードトークン化、ウィンドウスコアリング、ウィンドウトレーディング、及び最終決定を含む。
キーワードトークン化が適用されるのは、キーワードが常に単一ワードとは限らないためである。キーワードは、複数ワードのフレーズである。プロセスはトークン化を行うか、又はフレーズ内の個々のワードを選び出す。個々のワードトークンの識別は通常、スペース、ピリオド、コンマ、又はコロン/セミコロンなどのワード区切り記号の検索を含む。キーワードフレーズのトークン化が完了すると、ウィンドウスコアリングルーチンが開始することができる。
ウィンドウスコアリングの1つのバージョンにおいて、例えば、200文字、100文字、及び66文字の長さのサブ抜粋に対して、3つの異なるサイズのウィンドウがドキュメントのテキスト内で計算される。様々な表示フォーマット及びユーザプリファレンスに対し、50、100、200、500、又は1,000文字の合計抜粋長が最も良好に働くことができる。ここでの実施例は200文字である。図20は、ウィンドウスコアリングルーチンがどのようにドキュメント(2001)内のテキスト(2003)の第1のワードで開始するかを示している。第1の事例では、ウィンドウは200文字の範囲である。このウィンドウは、幾つかのメトリックに基づくスコアを受け取る。スコアが計算されると、ウィンドウは右に1文字移動し、次のウィンドウについて別のスコアを計算する。或いはウィンドウは、ウィンドウ開始又はウィンドウエンドのどちらかをワードの境界と整合させながら右に1ワード移動することができる。このプロセスは、最終ウィンドウについてのスコアが得られるまで繰り返す(2004、2005)。アルゴリズムに知能を組み込み、各ウィンドウ全体についてスコアを計算する必要性を排除することができるが、それよりもむしろ先行ウィンドウのスコアに追加情報を付加し、移動で失われた情報を差し引くことができる。上述のようにしてタイトル(2002)も同様に取り込むことができる。
プロセスが完了すると、以下が存在することができる。すなわち、
長さ200のiウィンドウ(ここでi=ドキュメント長−200)
長さ100のjウィンドウ(ここでj=ドキュメント長−100)
長さ200のkウィンドウ(ここでk=ドキュメント長−66)
ウィンドウスコアリングは、ウィンドウ内で見つかった固有のトークン数、ウィンドウ内で見つかったトークンの合計数、及び/又はウィンドウ内で見つかったトークンの最長ストリングなどの1つ又はそれ以上のメトリックに基づくことができる。各ウィンドウについての式は、これらのメトリックの組み合せから計算され、当該ウィンドウに割り当てられる。
1つの200文字の抜粋がある場合には、最も高いスコアを有するウィンドウが選ばれる。2つの最も高いスコアの長さ100のウィンドウは、2つのサブ抜粋モデルに対して選ばれる。3つの最も高いスコアの長さ66のウィンドウは、3つのサブ抜粋モデルに対して選ばれる。
最良のスコアは、各モデル(1、2、又は3サブ抜粋)について計算される。最終アルゴリズムは、2又は3つのウィンドウが抜粋に対して適確である場合に適用することができる。1つのウィンドウが別のウィンドウに文字を引き渡すことにより全体的なウィンドウスコアを高めることができる場合には、この動作は利得と判断され実行される。この仕方で全体のウィンドウスコアを引き上げることができない場合には、抜粋はトレード無しに用いられる。
抜粋生成からの出力は、5つの異なるスコアを含むことができ、すなわち、:単一のサブ抜粋モデルのスコア、トレード無しの2つのサブ抜粋モデルのスコア、トレードされた2つのサブ抜粋モデルのスコア、トレード無しの3つのサブ抜粋モデルのスコア、及び/又はトレードされた3つのサブ抜粋モデルのスコアである。これらのうちで単一の最も高いスコアが選ばれ、そのサブ抜粋モデルは、そのキーワード、URLの組み合せに適用される。
サンプルキーワード=「red dog run」では、以下の段階に従うことができる。
段階1:キーワードを3つのトークンにトークン化する。
トークン1=red
トークン2=dog
トークン3=run
段階2a:テキストドキュメント内でトークンのインスタンスを特定する。
Figure 2008511057
段階2b:ウィンドウをスコアリングし上位のものを識別する。この実施例、すなわち3つのサブ抜粋モデルでは、最良の3つのウィンドウが計算された。
Figure 2008511057
段階3:トレードの実施を許可する。この例ではウィンドウ1が、左縁内にあるトークンを含まない文字の幾つかをウィンドウ3に引き渡すことができる場合である。これによりウィンドウ3は拡張し、最後のトークン「run」を含むことが可能になり、抜粋の全体的なスコアが上昇する。
Figure 2008511057
別の実施形態では、抜粋生成プロセスは、関連するリンクに対しての記述子として用いられるおよそ200バイトのフィールドの作成を含むことができる。抜粋生成はスパイダリング後に行われ、選ばれたURLに関連付けられたドキュメントの完全なテキスト又は格納されたドキュメントの少なくとも一部から生成される。
(パーソナライゼーション及びランク付け)
ランク付けアルゴリズムでは、ユーザの行動プロファイルに基づいて、リンクカウントの特定のカテゴリーに対する票が他のユーザよりも多く有する匿名のユーザを選択する能力がある。
ヘビーサーチャーであるユーザ(ユーザの観測された検索行動に基づく)は、クリックするリンク上に、同じリンク上の新参のサーチャーの票に比べてより多くの票カウントを有することになる。このようにして、検索熟練者は、より関連性の高いランク付け結果を生成するのを助けることになる。
同様に、特定のカテゴリーに高度に関心のあるユーザは、そのカテゴリーにおいて関心のないユーザに較べてより多くの票カウントを有することになる。行動監視モジュールを用いると、デジタルカメラ、ファンタジースポーツ、又は自動車などの様々なカテゴリーに高度に関心のあるユーザを識別することができる。例えば、デジタルカメラカテゴリーに高度に関心があると識別されたユーザは、同一のキーワードで検索しているそのカテゴリーに対し新規のユーザに較べ「Cannon G3」についての検索後にユーザがクリックしたリンクにおいてより多くの票カウントを有することになる。
ユーザのカテゴリー関心ステータスの識別はまた、パーソナライゼーションを生じる。特定のカテゴリーにおいて高度の関心を有するユーザは、関心が少ないと識別されたユーザとは異なる結果が得られることになる。サービス中のこのパーソナライズ結果は、特定のマシン上で利用可能なクッキーのようなオブジェクトを必要とする。このライフスタイルのクッキーは、ユーザのカテゴリーナビゲーションパターンから得られたユーザの行動プロファイルを検索エンジンに提供することになる。これらのカテゴリーに特有のナビゲーションパターンは、ターゲット広告に同様に用いることができるカテゴリー化構造内に含まれる情報から得られる。商業的目的のために、予算カテゴリー又は見込み予算を訪問サイトから推測することができる。IKEA and Targetへの訪問者は、Sachs Fifth Avenue又はBloomingdale’sへの訪問者とは異なる衣服に対する予算を有する可能性が高い。同様にHyattホテルはユースホステルとは異なる予算カテゴリーにある。
調査では、ユーザのコンテンツを手作業でパーソナライズしているのはユーザの8〜14パーセントに過ぎないことが示されていることから、観測された通信に基づくパーソナライゼーションは、ユーザ入力のカスタマイズよりも遙かに強力である。パーソナライゼーションはドメインにおいて閲覧されるページと高い相関性があり、すなわちパーソナライズを行うユーザは、パーソナライズを行わないユーザよりもドメインにおいて130%多くのページを閲覧していると報告されている。
場合によっては、検索結果に違いが生じるように異なる行動プロファイルを利用することができる。他の場合では、2人のユーザの行動プロファイル間の相違は、特定の検索キーワードのコンテキストにおいて役立たない。
有用な幾つかの実施例がある。最初に、曖昧な検索用語の例として、識別可能なカテゴリーへの関心の無い人に対する自動車及び動物関連リンクの通常の混在と比べると、「jaguar」について検索を行う自動車カテゴリーに高い関心があるユーザは、動物のjaguarに関連するリンクよりも自動車のJaguarに関連するリンクをより多く得ることになる。これらの行動プロファイルの識別及び使用は、結果を完全に差し替えずに結果を偏向させることができる。上述の実施例では、自動車カテゴリーに関心があるユーザは、100%自動車の結果を得ることができ、又は人気のウェブサイトの中から見つけられるものよりも僅かに大きなパーセンテージの自動車の結果を得ることができる。
次に、サブカテゴリー識別の例として、3人のユーザがキーワード「rental car」について検索を行う。3つの別々の結果のセットが現れ、各々は各ユーザに対してパーソナライズされる。各ユーザは、旅行カテゴリー内で観測されたユーザの過去のナビゲーションパターンから得られる特定の行動プロファイルを有する。これらの行動は、観測される通信から容易に識別可能である。
ユーザ1:頻繁に出張する人−このユーザのレンタカーの結果は、によっては頻繁に利用するレンタルポイントがより多い、出張者用の車両レンタル結果に偏ることになる。
ユーザ2:限られた予算内の旅行者−このユーザのレンタカーの結果は、すなわちRent−a−wreckタイプの結果、サブコンパクトカーの特別割引など、限られた予算内の旅行者向けに偏っていることになる。
ユーザ3:豪華旅行者−このユーザのレンタカーの結果は、スポーツカーレンタル、クラッシックカーレンタルなど最高級の豪華旅行者向けに偏っていることになる。
図12は、ユーザのマシン上の行動監視モジュールがウェブサーフィンに関してもたらすインサイトをサーバが達成可能な制限付きビューと比較している。これらの統計値は、行動監視モジュールが見ることと対比させて、Yahoo!サーバがユーザ行動について把握していることを比較するために生成された。x軸1202はウェブサイトのカテゴリーを示している。y軸は、Yahoo!サーバの観測結果のスケールを「1」とした相対スケールである。各スタックにおいてYahoo!1203は1の可視性を有する。行動監視モジュールは、カテゴリー間で高く強く変化する相対スコア1204を有する。この驚くべき程度の相違は、マシン上の行動監視モジュールを、多くの提携サイトにおいて幅広く用いられている検索エンジンが達成できる可視性とは強力に区別する。
図13は、キーワード「cars」に関連性が高いウェブページを示している。ランク付けアルゴリズムを適用すると、CarsDirectのホームページが、100のうち97のスコアを示す。このスコアを計算するために用いられる因子は、初回訪問のメトリック、後続の訪問のメトリック、及びユーザレベルのメトリックを含むことができる。キーワード「cars」に応答する検索エンジンにわたって特定のサイトに対するユーザの応答を観測すると、行動監視モジュールは12パーセントのクリックスルーレートを観測した。平均ユーザは、このウェブサイトにおいてサイトを離れる前に初期リンクに続いて5つのページを閲覧した。平均ユーザは、ページを見るのに55秒を消費し、ここでは購入よりも可能性が高い登録のコンバージョン率は80パーセントであった。次の場合、検索又は初回訪問の後の予め設定された時間内の平均帰還者は、このサイトで15ページを閲覧し、300秒を消費した。帰還者は、15パーセントのコンバージョン率で登録を行った。このキーワードについてこのリンクを辿るユーザの間では、カテゴリー(例えば自動車カテゴリー)関心は高く、「熟練者」にランク付けされた。検索エンジン使用は、一般的なユーザがコンピュータ熟練者に比べてより頻繁であったことを示す「専門家」であった。このカテゴリーにおいて、米国のユーザの間ではウェブサイトの地理的場所は重要であった。米国内のウェブサイトは、米国外のウェブサイトよりもユーザ(例えば自動車の購入者)にとってより興味深いものであった。
図14は、「cars」に関連性が弱いページの反例である。この記事のタイトルは、キーワードと一致しているが、クリックスルー率及び他のメトリックは、CarsDirectホームページよりもこのページが「cars」についての検索に関連性が極めて低いとユーザが考えていることを示している。このページについて計算された関連性スコアは僅か11であった。
図15は、本明細書で説明された検索エンジンの実施形態を伴う、Yahoo!、MSN Search、及びGoogleからの「cars」についての結果を並べたものである。関連性インデックスを用いると、この実施形態はより関連が高い検索結果をもたらす。関連性インデックスはランク付けスコアであり、これは検索結果リスト内のリンクに対するユーザの応答を反映している。サンプルスコアは:MSN598、Google524、及びYahoo!487である。この実施形態についての有意な改善スコアは、マシン上の行動監視モジュールの使用と、主要な検索エンジンのランク付けアルゴリズムからの複数のユーザの行動の集約とを強力に区別する。
図16は、行動監視モジュールからの結果を用いたユーザの区別化を例示している。ユーザ行動の大規模サンプル、具体的には衣服カテゴリーにおけるショッピングが、この図に報告されている。ユーザは、このカテゴリー(1601)における閲覧の量、及び特定のウェブドメインへの(或いはベンダー、ブランド、又は他のカテゴリーへの)忠実度の程度に沿って9つのボックス内に分類された。閲覧量は、ライト、ミディアム、又はヘビーに分類された。ユーザの4分の1はヘビー及びミディアム使用カテゴリーの各々にあり、残りの半分はライト使用カテゴリーであった。忠実度は、忠実、ソース間スイッチャ、又は競合相手に忠実として分類されている。3×3の属性配列は、9つのボックスを生成する。忠実な購入予定者の間で約百万件のユニークユーザ観測がなされた。検索に応答して特定の結果が表示された時に、ヘビーユーザは高いクリックスルー率を有し、ミディアムユーザにおける5.40%、ライトユーザにおける僅か3.99%と比較して、7.90%であった。クリックスルー事象の後に、ヘビーユーザの購入又は登録へのコンバートは、ミディアムユーザにおける7.20%、ライトユーザにおける6.50%と比較して、8.00%の率であった。予想通り、観測される特定のドメインにおけるよりも、より多くのスイッチャ及び競合者に忠実なユーザの固有の観測結果が存在する。広告等のコンテンツのパーソナライゼーションは、ユーザが9つのボックスのどれに当てはまるかに依存することができる。例えば忠実なヘビーユーザは、ミディアムからライトのスイッチャとは異なるメッセージ(マイレージサービス様式のプログラム)を得ることになる。競合者に忠実なヘビーユーザは、忠実なユーザに対しては完全に見当違いとなるはずの試用提案を得ることがある。ヘビーで忠実なユーザに対して訴えかけるための戦略は、これらのユーザを競合者から隔離することである。ミディアムからライトの忠実なユーザに対しては、戦略はアップセリング及びクロスセリングを狙うことができる。ヘビーからミディアムのスイッチャに対しては、目的はシェアを増大させることである。ヘビーからミディアムの競合者に忠実なユーザは、獲得することを目標とされる。ライトのスイッチャ及びライトの競合者に忠実なユーザは、広告リソースに集中させるために無視することができる。
行動監視モジュールからの再訪問データは、特定の広告の有効性の評価において広告主を支援することができる。ボックスによるユーザの区別化は、広告の選択及び広告の有効性の評価と更に関連付けることができる。
ユーザのクロスブラウジングもまた報告することができる。ユーザは、フォロースルーによって例えば全てのクリックスルー又は全てのコンバージョンユーザを選択することができる。特定のドメイン(又は例えばベンダー或いはブランド)においてコンバージョンを伴うユーザは、競合者のドメイン(又はベンダー或いはブランド)へのユーザの訪問頻度によって評価することができる。
図17は、キーワードによる特定の検索エンジンから特定のドメインへのトラフィックを示している。この情報は、広告を考案する会社にとって有益であり、また検索エンジンの結果ページ上に位置付けられるスポンサー付きコンテンツに向けたキーワードを入札する際に有用とすることができる。行動監視モジュールからのデータは、検索エンジンの結果ページ上のインプレッション数、クリック、クリックスルー率、コンバージョン率、及び位置を与えることができる。
(幾つかの特定の実施形態)
本発明は、方法又は本方法を実施するように適合された装置として実施することができる。幾つかの方法は、ユーザの端末又はパーソナルコンピュータにおけるそのユーザの観点から、或いはユーザから情報を収集するサーバ側で見ることができる。本発明は、コンピュータ支援による方法を実行するためのロジックが焼き付けられた媒体等の製造者の商品とすることができる。
ユーザの観点からすると、デバイスの実施形態は、ユーザのコンピュータ上で実行し、動作観測結果を収集するモジュール内で具現化することができ、このモジュールは、行動観測結果に対してユーザにパーソナライズされた情報で応答するサーバに結合されている。
本発明は、好ましい実施形態及び上述の詳細な実施例を参照することよって開示されたが、これらの実施例は限定の意味ではなく例証のものである点を理解されたい。コンピュータ支援による処理が説明された実施形態において関係している。従って、本発明は、通信パターンを集約し、キーワード検索に応答してリンクを事前処理し、該応答リンクをランク付けするために集約された通信パターンを用いてキーワード検索に対して応答し、更に曖昧性を解消し及び/又はユーザ特性に基づいて応答をパーソナライズするために最近及び最新のナビゲーション情報システムを用いてキーワード検索に応答する方法において具現化することができる。デバイスとしての他の実施形態は、本方法を実施するためのロジック及びリソースを含む。システムとしての他の実施形態は更に、端末上の行動監視モジュール、行動データの処理又はこれに応答するサーバ、又はこの両方を含む。他の実施形態は、本方法を実施するためのロジックが焼き付けられた媒体、本方法を実施するためのロジックが焼き付けられたデータストリーム、又は本方法を実施するコンピュータアクセス可能なサービスを含む。当業者であれば修正及び組み合せが容易に想起されることは企図されており、これらの修正及び組み合せは本発明の精神及び以下の請求項の範囲内にあることになる。
開示される実施形態は、方法又は該方法を実施するように適合された装置として実施することができる。これらは、システムとして実施することができる。本方法は、データを収集するサーバ、又はデータを生成する行動監視モジュールの観点から見ることができる。本発明は、本方法を実施する命令を含む機械読取り可能メモリ、又は本方法を実施する命令を含むデータストリームなどの製造者の製品を含むことができる。
1つの実施形態は、検索要求に応答してユーザに返すことができるウェブページを選択的に収集する方法である。この方法は、複数のユーザのコンピュータ上で動作する行動監視モジュールから1つ又はそれ以上の検索エンジンにわたるユーザの検索エンジン使用に関する情報を受け取る段階を含む。この情報は、特定のユーザによって検索エンジンに実行依頼される少なくともキーワード(フレーズを含む)、検索エンジンによって返される結果から特定のユーザによって選択されるリンク、及び選択されたリンクを辿る時の滞留時間又は特定のユーザによって閲覧されるドキュメント数の少なくとも一方を含む。この方法は更に、検索エンジン使用情報を用いて関心対象キーワードを選び、関心対象キーワードに対応してユーザによって選択されたリンクを選ぶ段階を含む。
この実施形態における複数のユーザは、実行依頼される頻度が多い検索用語の望ましい適用範囲に応じて、2,000又は100,000ユーザを超えることができる。行動監視モジュールから受け取る情報は、複数の非提携検索エンジンに及ぶことができ、単一の検索エンジンが収集することができないデータを提供する。
この実施形態は、選ばれたキーワードについて、検索エンジン使用情報並びに滞留時間又は閲覧ページ数の少なくとも一方から計算されるユーザアクセス率に基づいて対応するリンクをランク付けする段階を更に含むことができる。本方法は、特定のキーワードについて上位10又は上位15リンクのみを辿るといった予め設定されたランク付けの適用に基づいてコンテンツの収集を制限する段階を更に含むことができる。
幾つかの実施形態では、特定のユーザが注目をしていなかった可能性が高い期間中の滞留時間を無視するように受信するまでは、前記検索エンジン使用情報は適格であると認識される。
この実施形態は、選ばれたリンクの1つを辿ることによって到達するドキュメントのコンテンツから抜粋を選択する段階を更に含むことができる。この抜粋選択段階は、ドキュメントに予め設定された長さのウィンドウを適用し、ドキュメントを通してウィンドウを繰返し移動させる段階を含むことができる。関心対象キーワードは、これがフレーズである場合にはワードに分割される。本方法は、ウィンドウ内のワードのインスタンスのカウント及びウィンドウ内のワードの近接度の測定値を含む、ウィンドウ内のワードについて1つ又はそれ以上のウィンドウスコアを繰返し計算する段階を更に含む。ウィンドウスコアを用いて複数の非オーバーラップウィンドウ位置が抜粋として選ばれる。抜粋又は抜粋に対する参照は、機械読取り可能メモリ内に格納される。この方法は、多くの手法で改良することができる。ウィンドウの繰返し移動は、ウィンドウの開始点又はエンドポイントがワードの境界に一致するようにウィンドウを整合させる。ウィンドウは繰返し移動されるので、ウィンドウ内のスコアは、ウィンドウから取り除かれる文字についてスコアを低減させ、ウィンドウに追加される文字についてスコアを増大させるによって計算することができる。
抜粋生成は、全抜粋の組み合せの長さをほぼ維持しながら抜粋長をトレードすることにより改良することができる。抜粋長がトレードオフされるため、1つ又はそれ以上のウィンドウスコアが再計算される。本方法は、再計算されたウィンドウスコアを用いて抜粋リンクの特定のトレードを選ぶ段階、任意的に抜粋をマージする段階、及び選ばれた抜粋又は選ばれた抜粋に対する参照を機械読取り可能メモリ内に格納する段階を更に含む。
行動監視モジュールのネットワークの観点から見ると、本方法は複数のユーザのコンピュータ上で動作する複数の行動監視モジュールを用いる段階を含み、これらの行動監視モジュールは、1つ又はそれ以上の検索エンジンにわたるユーザの検索エンジン使用に関する情報を収集する。収集された情報は、特定のユーザによって検索エンジンに実行依頼された少なくともキーワード(フレーズを含む)、検索エンジンによって返された結果から特定のユーザによって選択されるリンク、及び選択されたリンクを辿る時に滞留時間又は特定のユーザによって閲覧されるドキュメント数のうちの少なくとも一方を含む。本方法は、検索エンジン使用情報を1つ又はそれ以上の提携サーバに電子的に報告する行動監視モジュールを更に含む。上述と同様に、この実施形態における複数のユーザは、実行依頼される頻度が多い検索用語の望ましい適用範囲に応じて2,000又は100,000ユーザを超えることができる。行動監視モジュールから受け取る情報は、複数の非提携検索エンジンに及ぶことができ、単一の検索エンジンが収集することができないデータを提供する。
行動監視モジュールは、特定のユーザが注目をしていなかった可能性が高い期間中の滞留時間を無視することを報告するまでは、検索エンジン使用情報を適格であるとすることができる。
行動監視モジュールの実施形態は、特定のユーザがキーワードによって検索エンジンを呼び出し、報告された検索エンジン情報を反映するように編成された検索エンジンから結果を受け取ることを更に含む。
システム実施形態は、少なくとも1つの受信モジュール、及びその受信モジュールと通信状態にある少なくとも1つのコンピュータ又はコンピュータクラスタを含む。受信モジュールは、ネットワークによって接続された複数のユーザのコンピュータ上で動作する行動監視モジュールから、1つ又はそれ以上の検索エンジンにわたるそのユーザの検索エンジン使用に関する情報を受け取るネットワークインターフェースを含む。この情報は、特定のユーザによって検索エンジンに実行依頼されたキーワード(フレーズを含む)、検索エンジンによって返された結果から特定のユーザによって選択されるリンク、及び選択されたリンクを辿る時に滞留時間又は特定のユーザによって閲覧されたキュメント数のうちの少なくとも一方を少なくとも含む。受信モジュールと通信状態にあるコンピュータ又はコンピュータクラスタは、検索エンジン使用情報を処理し、関心対象キーワードと、その関心対象キーワードに対応してユーザによって選択されたリンクとを選び、選ばれたリンクを辿って、該選ばれたリンクによってアドレスが指定されたドキュメントのコンテンツの少なくとも一部を収集し、更に収集されたコンテンツを対応する関心対象キーワードと関連付けるように適合されたロジック及びリソースを含む1つ又はそれ以上のモジュールを動作させる。
この実施形態における複数のユーザは、実行依頼される頻度が多い検索用語の望ましい適用範囲に応じて、2,000又は100,000ユーザを超えることができる。行動監視モジュールから受け取る情報は、複数の非提携検索エンジンに及ぶことができ、単一の検索エンジンが収集することができないデータを提供する。
別の実施形態は、検索要求に応答してユーザに返すことができるドキュメントコンテンツから抜粋を選択する方法である。抜粋選択段階は、ドキュメントに予め設定された長さのウィンドウを適用し、ドキュメントを通してウィンドウを繰返し移動させる段階を含む。関心対象キーワードがフレーズの場合にはワードに分割される。ウィンドウ内のワードについて、ウィンドウ内のワードのインスタンスのカウントとウィンドウ内のワードの近接度の測定値とを含む1つ又はそれ以上のウィンドウスコアを繰返し計算する段階を更に含む。ウィンドウスコアを用いて複数の非オーバーラップウィンドウ位置が抜粋として選ばれる。抜粋又は抜粋に対する参照は機械読取り可能メモリ内に格納される。本方法は数多くの手法で改良することができる。ウィンドウの繰返し移動は、ウィンドウの開始点又はエンドポイントがワードの境界に一致するようにウィンドウを整合させる。ウィンドウは繰返し移動されるため、ウィンドウ内のスコアは、ウィンドウから取り除かれる文字についてスコアを低減させ、ウィンドウに追加される文字についてスコアを増大させることによって計算することができる。
抜粋生成は、全抜粋の組み合せの長さをほぼ維持しながら抜粋長をトレードすることにより改良することができる。抜粋長がトレードされると、1つ又はそれ以上のウィンドウスコアが再計算される。本方法は、再計算されたウィンドウスコアを用いて抜粋長の特定のトレードを選ぶ段階、任意的に抜粋をマージする段階、及び選ばれた抜粋又は選ばれた抜粋に対する参照を機械読取り可能メモリ内に格納する段階を更に含む。
抜粋生成は、重複除去と組み合せることができる。本方法は、タイトル及び計算された抜粋に基づいてより多くのドキュメントに対して評価する段階を更に含む。タイトル及び抜粋、或いはそのタイトル及び抜粋から計算された指紋又はチェックサムが一致するか、又は非常に類似している場合には、ドキュメントは重複していると断定し処理することができる。
抜粋生成では、ウィンドウ内のワードのインスタンスのカウントは、キーワード内のワードの幾つがウィンドウ内に出現したか、及びウィンドウ内に何度ワードが出現したかの両方をカウントする段階を含むことができる。
別の実施形態は、ランク付けの方法であって、複数のユーザのコンピュータ上で動作する行動監視モジュールから複数の検索エンジンにわたるユーザの検索エンジン使用に関する情報を受け取る段階を含む。受け取られる情報は、特定のユーザによって検索エンジンに実行依頼される少なくともキーワード(フレーズを含む)と、検索エンジンによって返された結果から特定のユーザによって選択されるリンクと、選択されたリンクを辿る時に滞留時間又は特定のユーザが閲覧するドキュメント数のうちの少なくとも一方とを含む。本方法は、前記検索エンジン使用情報からの(ユーザアクセス率)と((滞留時間)又は(閲覧されたドキュメント数)の少なくとも一方)との両方を用いて特定のキーワードに対応するリンクをランク付けする段階を更に含む。更にランクは機械読取り可能メモリ内に格納され、特定のキーワードによる票における検索に応答して利用可能である。
ユーザアクセス率、滞留時間、及び閲覧ページ数の様々な重み付けを適用することができる。重み付けが適用されるデータの一態様は、特定のユーザが注目をしていなかった可能性が高い期間を無視するように受信するまでは、滞留時間が適格であると認識されるものとすることができる。別の態様は、検索エンジン使用の範囲外の観測結果を取り除くようにデータをフィルタリングし、予め設定された回数よりも少なく特定のユーザによって選択されたリンクを排除することができるものである。同様に、データが受け取られた後、予め設定された時間長を超える滞留時間を無視することができる。
ユーザアクセス率、滞留時間、及び閲覧ページ数を考慮に入れると、1つの変形形態は、係数のうちの1つが他の2つよりも優位を占めるものである。優位要因は、クリックスルー率、滞留時間、又はドメインにおいて閲覧されたページ数とすることができる。別の変形形態では、均衡のとれた重み付けが係数に与えられ、ほぼ均等値±10%である。更に別の変形形態では、3つの係数のうちの1つに全重み付けのおよそ半分が与えられるように、ほぼ2:1:1±10%の重み付け率が割り当てられる。
ランク付けにおいて考慮することができる2つの追加の要因は、リンクが選択されてからの予め設定された時間内での再訪問、及びコンバージョン事象である。上述のように、コンバージョン事象は購入又は登録とすることができる。コンバージョン及び反復コンバージョンは別個に重み付けを与えることができる。
ランク付けについては、単一のユーザからの組み合せデータは、検索に消費された時間量、又は辿られたリンク数を反映し、重み付け1、又は全重み付けを与えることができる。しかしならが単一のユーザは正規化重み付けが与えられ、行動による結果の偏りはロボット行動を単一の票まで低減させることで緩和される。
この実施形態の段階におけるランク付けは、上述のように同類のリンクをバンドにグループ化し、バンド内の選択されたリンクをランク付けする段階を更に含むことができる。ランク付け段階はまた、特定の検索エンジンのユーザによって選択されたリンクを別個にランク付けし、特定の検索エンジンからのランクを全体のランク付けに組み合せる段階を含むことができる。
別の実施形態は、ユーザによって検索エンジンに実行依頼されたキーワード検索用語における曖昧性を解消する方法である。本方法は、ユーザの最近のナビゲーション行動に関する情報を、ユーザのコンピュータ上で動作する行動監視モジュールから受け取る段階を含む。ナビゲーション行動は、特定のサーバ側行動データ収集ネットワークと全てが関連付けられている訳ではないドキュメントにアクセスすることを含み、マウスクリックスルー、入力キーストローク、又は他の選択動作のうちの少なくとも1つと、選択動作のコンテキストから得た少なくとも1つのキーワードとを更に含む。サーバは、検索用語が属する可能性が高い複数の関心カテゴリーを決定し、最近のナビゲーション情報を用いて複数の関心カテゴリーの中から選択する。
行動監視モジュールの動作の一態様は、関心対象のカテゴリー及び新しさによって行動をカテゴリー化することができるものである。アクセスされたドキュメントは、ウェブページとすることができ、サーバ側の行動データ収集ネットワークは広告ネットワークとすることができる。
行動監視モジュールのこの観点から、この実施形態は、ネットワークを介してアクセス可能なドキュメントの間でのユーザの最近のナビゲーション行動を反映する情報で検索要求を補足する方法として実施することができる。この方法は、ユーザの最近のナビゲーション行動に関する情報を収集する行動監視モジュールをユーザのコンピュータ上で動作させる段階を含む。最近のナビゲーション行動情報は、少なくともユーザによってアクセスされたドキュメントを電子的に識別し、アクセスドキュメントをカテゴリー化し、カテゴリー内のドキュメントがいつアクセスされたかを示す行動監視モジュールは、検索エンジンを含む1つ又はそれ以上のサーバへのクエリと共に最近のナビゲーション行動情報の少なくとも要約を実行依頼する。ユーザは、実行依頼された最近のナビゲーション行動情報に対応する関心対象のカテゴリーに偏った結果のセットを検索エンジンから受け取る。或いはユーザは、実行依頼された最近のナビゲーション行動情報に対応する予算カテゴリーに偏った結果のセットを検索エンジンから受け取ることができる。更に一般的に、最近のナビゲーション行動から識別することができるあらゆるカテゴリーは、クエリに応答して受け取った検索エンジンの結果の偏りに反映することができる。
別の実施形態は、ユーザによって検索エンジンに実行依頼されたキーワード検索用語に応答してコンテンツをパーソナライズする方法である。上述の曖昧解消法と同様に、本方法は、ユーザの最近のナビゲーション行動に関する情報をユーザのコンピュータ上で動作する行動監視モジュールから受け取る段階を含む。ナビゲーション行動は、特定のサーバ側行動データ収集ネットワークに全てが関連付けられている訳ではないドキュメントにアクセスする段階を含み、マウスクリックスルー、入力キーストローク、又は他の選択動作のうちの少なくとも1つと、選択動作のコンテキストから得た少なくとも1つのキーワードとを更に含む。サーバは、結果が属する複数の見込み予算カテゴリーを決定し、最近のナビゲーション情報を用いて見込み予算カテゴリーの中から選択を行う。
最近のナビゲーション行動を用いる実施形態において、ナビゲーション行動は、直前の1時間及び直前の1日内のナビゲーションを含む最近のナビゲーションを反映することができる。或いはナビゲーション行動は、情報へのユーザの応答性に相関付けられるように決定された期間内での最近のナビゲーションを含むことができる。ユーザナビゲーション情報は、受信時又は受信後に関心カテゴリー又は見込み予算カテゴリーにまとめることができる。更に一般的に、最近のナビゲーション行動から識別することができるあらゆるカテゴリーは、クエリに応答して受け取られた検索エンジンの結果の偏り内に反映することができる。
上述の実施形態及び実施形態の様々な態様は、説明された方法及び方法の態様を実施するための命令を含む機械読取り可能メモリ、又は機械読取り可能命令を含むデータストリームとして実施することができる。更に装置は、説明された方法及び方法の態様を実施するように適合されたロジック及びリソースを有する1つ又はそれ以上のサーバ、パーソナルコンピュータ、又は他のコンピュータ装置を含むことができる。
種々の実施形態において用いることができる例示的なコンピュータの概略図である。 本技術が動作することができるコンピューティング環境の概略図である。 コンバージョンプロセスの追跡を概略的に例示している図である。 スポンサー付き及びスポンサーなしの情報配信をパーソナライズする検索エンジンを生成するのに互いに機能することができる構成要素の高レベルのブロック図である。 クリックされたURLを報告するクッキー又はデータレコードの実施例を示す図である。 最新の商業的関心対象キーワードを格納するクッキーの実施例を示す図である。 パーシスタントメモリに書き込むことができる行動監視モジュールによって維持される要約データの実施例を示す図である。 カテゴリーによって更にまとめられたビットストリングを例示する図である。 検索ワードの使用、クリックスルー、URL宛先の入力、又はユーザ関心対象の他の指標の新しさに適用することができるバケットを例示している図である。 訪問頻度に適用することができるバケットを例示している図である。 カテゴリーIDをカテゴリー名及び収入優先度の両方に如何に関連付けすることができるかを例示している図である。 ウェブサーフィンに関してユーザのマシン上の行動監視モジュールが生み出すインサイトをサーバが達成可能な制限付きビューと比較している図である。 キーワード「cars」に関連性が高いウェブページの図である。 「cars」に関連が弱いページの反対の例である。 Yahoo!、MSN Search、及びGoogleからの「cars」についての結果を本明細書で説明した検索エンジンの実施形態と共に並べたものである。 行動監視モジュールからの結果を用いたユーザの区別化を例示している図である。 特定の検索エンジンから特定のドメインへのキーワードによるトラフィックの図である。 リンクを辿り、コンテンツを検索するためのアーキテクチャの図である。 クリックスルー率によって評価されたバナー広告に応答した最近の行動の重要度を例示している図である。 ウィンドウスコアリングルーチンが、どのようにドキュメント内のテキストの第1のワードで始まるかを示す図である。
符号の説明
160−1 ウェブサーバコンピュータ
110 クライアントコンピュータ
112 ウェブブラウザ
120 行動監視モジュール
121 データパケット
650 検索エンジン

Claims (71)

  1. 検索要求に応答してユーザに返すことができるウェブページを選択的に収集する方法であって、
    複数のユーザのコンピュータ上で動作する行動監視モジュールから1つ又はそれ以上の検索エンジンにわたる該ユーザの検索エンジン使用に関する情報を受け取る段階を含み、前記情報が、
    特定のユーザによって前記検索エンジンに実行依頼されるキーワード(フレーズを含む)と、
    前記検索エンジンによって返された結果から前記特定のユーザによって選択されるリンクと、
    前記選択されたリンクを辿る時に滞留時間又は前記特定のユーザが閲覧するドキュメント数のうちの少なくとも一方と、
    を少なくとも有し、
    前記方法が更に、
    前記検索エンジン使用情報を用いて、関心対象キーワードと該関心対象キーワードに対応して前記ユーザによって選択された前記リンクとを選ぶ段階と、
    前記選ばれたリンクを辿り、前記選ばれたリンクがアドレス指定するドキュメントのコンテンツの少なくとも一部を収集する段階と、
    前記収集されたコンテンツを前記対応する関心対象キーワードと関連付ける段階と、
    を含む方法。
  2. 前記複数のユーザが2,000ユーザを超え、前記受け取られた検索エンジン使用情報が複数の非提携検索エンジンの範囲に及ぶことを特徴とする請求項1に記載の方法。
  3. 前記複数のユーザは20,000ユーザを超えることを特徴とする請求項1に記載の方法。
  4. 前記選ばれたキーワードに対して、前記検索エンジン使用情報と、前記滞留時間又は前記閲覧ドキュメント数の少なくとも一方とから計算されるユーザアクセス率に基づいて前記対応するリンクをランク付けする段階と、
    を更に含む請求項1に記載の方法。
  5. 予め設定された前記ランク付けの適用に基づいてコンテンツの収集を制限する段階を更に含む請求項4に記載の方法。
  6. 特定のユーザが注目していなかった可能性が高い期間中の滞留時間を無視するように受信するまでは、前記検索エンジン使用情報は適格であると認識されることを特徴とする請求項1に記載の方法。
  7. 前記選ばれたリンクの1つを辿ることによって到達したドキュメントのコンテンツから抜粋を選択する段階を更に含み、
    前記抜粋選択方法が、
    前記ドキュメントに予め設定された長さのウィンドウを適用し、該ドキュメントを通して該ウィンドウを繰返し移動させる段階と、
    前記関心対象キーワード(フレーズである場合)をワードに分割する段階と、
    前記ウィンドウ内の前記ワードについて、該ワードのインスタンスのカウントと前記ワードの近接度の測定値とを含む1つ又はそれ以上のウィンドウスコアを繰返し計算する段階と、
    前記ウィンドウスコアを用いて複数の非オーバーラップウィンドウ位置を抜粋として選ぶ段階と、
    機械読取り可能メモリ内に前記抜粋又は該抜粋に対する参照を格納する段階と、
    を含む請求項1に記載の方法。
  8. 前記ウィンドウの繰返し移動は、該ウィンドウの開始点又は該ウィンドウのエンドポイントをワードの境界と整合させることを特徴とする請求項7に記載の方法。
  9. 全抜粋の組み合せられた長さをほぼ維持しながら前記抜粋の長さをトレードオフする段階と、
    変更された長さの抜粋に対する1つ又はそれ以上のウィンドウスコアを再計算する段階と、
    前記再計算されたウィンドウスコアを用いて抜粋長の特定のトレードオフを選び、任意的に前記抜粋をマージする段階と、
    前記選ばれた抜粋又は該選ばれた抜粋に対する参照を機械読取り可能メモリ内に格納する段階と、
    を更に含む請求項7に記載の方法。
  10. 請求項1に記載の方法を実施するための命令を含む機械読取り可能メモリ。
  11. 請求項1に記載の方法を実施するための機械読取り可能命令を含むデータストリーム。
  12. 請求項1に記載の方法を実施するように適合されたロジック及びリソースを有する1つ又はそれ以上のサーバを含む装置。
  13. サーバの提携するシステムにデータを送信する行動監視モジュールのネットワークを用いてデータを生成する方法であって、
    前記方法が、
    複数のユーザのコンピュータ上で動作する複数の行動監視モジュールを用いて、該行動監視モジュールが、1つ又はそれ以上の検索エンジンにわたる前記ユーザの検索エンジン使用に関する情報を収集する段階を含み、
    前記情報が、
    特定のユーザによって前記検索エンジンに実行依頼されるキーワード(フレーズを含む)と、
    前記検索エンジンによって返された結果から前記特定のユーザによって選択されるリンクと、
    前記選択されたリンクを辿る時に滞留時間又は前記特定のユーザが閲覧するドキュメント数のうちの少なくとも一方と、
    を少なくとも有し、
    前記方法が更に、
    前記行動監視モジュールが、前記検索エンジン使用情報を1つ又はそれ以上の提携サーバに電子的に報告する段階と、
    を含む方法。
  14. 前記複数の行動監視モジュールが2,000ユーザを超え、該行動監視モジュールは複数の非提携検索エンジンにわたって検索エンジン使用情報を収集することを特徴とする請求項13に記載の方法。
  15. 前記複数の行動監視モジュールは20,000ユーザを超えることを特徴とする請求項13に記載の方法。
  16. 前記行動監視モジュールは、特定のユーザが注目をしていなかった可能性が高い期間中の滞留時間を無視するように報告するまでは、前記検索エンジン使用情報を適格とすることを特徴とする請求項13に記載の方法。
  17. 特定のユーザがキーワードによって検索エンジンを呼び出し、前記報告された検索エンジン情報を反映するように編成された前記検索エンジンからの結果を受け取る段階を更に含む請求項13に記載の方法。
  18. 請求項13に記載の方法を実施するための命令を含む機械読取り可能メモリ。
  19. 請求項13に記載の方法を実施するための機械読取り可能命令を含むデータストリーム。
  20. 請求項13に記載の方法を実施するように適合されたロジック及びリソースを有するパーソナルコンピュータを含む装置。
  21. 検索要求に応答してユーザに返すことができるウェブページを選択的に収集するコンピュータ実装システムであって、
    ネットワークによって接続された複数のユーザのコンピュータ上で動作する行動監視モジュールから、1つ又はそれ以上の検索エンジンにわたる前記ユーザの検索エンジン使用に関する情報を受け取るネットワークインターフェースを有する少なくとも1つの受信モジュールを備え、
    前記情報が、
    特定のユーザによって前記検索エンジンに実行依頼されたキーワード(フレーズを含む)と、
    前記検索エンジンによって返された結果から前記特定のユーザによって選択されるリンクと、
    前記選択されたリンクを辿る時に滞留時間又は前記特定のユーザが閲覧するドキュメント数のうちの少なくとも一方と、
    を少なくとも含み、
    前記システムが更に、
    前記受信モジュールと通信状態にある1つ又はそれ以上のモジュールを動作させる少なくとも1つのコンピュータ又はコンピュータクラスタと、
    を備え、
    前記少なくとも1つのコンピュータ又はコンピュータクラスタが、
    前記検索エンジン使用情報を処理し、関心対象のキーワードと、該関心対象のキーワードに対応して前記ユーザによって選択された前記リンクとを選び、
    前記選ばれたリンクを辿って、該選ばれたリンクによってアドレス指定されたドキュメントのコンテンツの少なくとも一部を収集し、
    前記収集されたコンテンツを前記対応する関心対象キーワードと関連付ける、
    ように適合されたロジック及びリソースを含むことを特徴とするシステム。
  22. 前記受信モジュールと通信状態にある前記ユーザのコンピュータ上で動作する少なくとも2,000個の行動監視モジュールを更に備える請求項21に記載のシステム。
  23. 検索要求に応答してユーザに返すことができるドキュメントコンテンツから抜粋を選択する方法であって、
    前記抜粋の選択が、
    前記ドキュメントに予め設定された長さのウィンドウを適用し、前記ドキュメントを通して前記ウィンドウを繰返し移動させる段階と、
    関心対象のキーワード(フレーズ)をワードに分割する段階と、
    前記ウィンドウ内のワードについて、該ワードのインスタンスのカウントと前記ワードの近接度の測定値(キーワードがフレーズの時)とを含む1つ又はそれ以上のウィンドウスコアを繰返し計算する段階と、
    前記ウィンドウスコアを用いて複数の非オーバーラップウィンドウ位置を抜粋として選ぶ段階と、
    機械読取り可能メモリ内に前記選ばれた抜粋又は該選ばれた抜粋に対する参照を格納する段階と、
    を含む方法。
  24. 前記ウィンドウの繰返し移動は、該ウィンドウの開始点又は該ウィンドウのエンドポイントをワードの境界と整合させることを特徴とする請求項23に記載の方法。
  25. 前記ドキュメントからのタイトル及び前記抜粋に基づいて2つ又はそれ以上のドキュメントが完全に又はほとんど重複しているとみなすべきか否かを評価する段階を更に含む請求項23に記載の方法。
  26. 前記インスタンスのカウントは、前記ウィンドウ内に前記ワードの幾つが出現するか、及び該ウィンドウ内に該ワードが何回出現するかの両方をカウントする段階を含む請求項23に記載の方法。
  27. 請求項23に記載の方法を実施するための命令を含む機械読取り可能メモリ。
  28. 請求項23に記載の方法を実施するための機械読取り可能命令を含むデータストリーム。
  29. 請求項23に記載の方法を実施するように適合されたロジック及びリソースを有する1つ又はそれ以上のサーバを含む装置。
  30. ランク付け方法であって、
    複数のユーザのコンピュータ上で動作する行動監視モジュールから複数の検索エンジンにわたる前記ユーザの検索エンジン使用に関する情報を受け取る段階を含み、
    前記情報が、
    特定のユーザによって前記検索エンジンに実行依頼されるキーワード(フレーズを含む)と、
    前記検索エンジンによって返された結果から前記特定のユーザによって選択されるリンクと、
    前記選択されたリンクを辿る時に滞留時間又は前記特定のユーザが閲覧するドキュメント数のうちの少なくとも一方と、
    を少なくとも有し、
    前記方法が更に、
    前記検索エンジン使用情報からのユーザアクセス率と、前記滞留時間又は前記閲覧ドキュメント数の少なくとも一方との両方を用いて特定のキーワードに対応するリンクをランク付けする段階と、
    前記特定のキーワードによって呼び出される検索に応答して利用可能な前記ランクを機械読取り可能メモリ内に格納する段階と、
    を含む方法。
  31. 特定のユーザが注目をしていなかった可能性が高い期間を無視するように受信するまでは前記検索エンジン使用情報は適格であると認識されることを特徴とする請求項30に記載の方法。
  32. 前記ランク付け段階は、前記リンクをランク付けする段階の前に、前記特定のユーザによって選択され、前記検索エンジンによって予め設定された回数よりも少ない回数返されたリンクを排除することによって、前記検索エンジン使用の範囲外の観測結果をフィルタリングする段階を更に含む請求項30に記載の方法。
  33. 前記ランク付け段階が更に、前記リンクをランク付けする段階の前に、予め設定された時間長を超える滞留時間を無視することによって、前記検索エンジン使用の範囲外の観測結果をフィルタリングする段階を含む請求項30に記載の方法。
  34. 前記ランク付け段階が更に、前記ユーザアクセス率及び前記閲覧されたドキュメント数情報よりも優位を占めるように前記滞留時間情報を重み付けする段階を含む請求項30に記載の方法。
  35. 前記ランク付け段階が更に、前記滞留時間及び前記閲覧されたドキュメント数情報よりも優位を占めるように前記ユーザアクセス率を重み付けする段階を含む請求項30に記載の方法。
  36. 前記ランク付け段階が更に、前記ユーザアクセス率及び前記滞留時間よりも優位を占めるように前記閲覧されたドキュメント数情報を重み付けする段階を含む請求項30に記載の方法。
  37. 前記ランク付け段階が更に、前記ユーザアクセス率、前記滞留時間、及び前記閲覧されたドキュメント数情報に対してほぼ等しい重み付け±10%を割り当てる段階を含む請求項30に記載の方法。
  38. 前記ランク付け段階は更に、前記ユーザアクセス率、前記滞留時間、又は前記閲覧されたドキュメント数情報のうちの1つに全重み付けのおよそ半分が与えられるように、ほぼ2:1:1±10パーセントの重み付け率を割り当てる段階を含む請求項30に記載の方法。
  39. 前記受信段階は更に、予め設定された時間内の選択されたリンクへの再訪問についての情報を含み、前記ランク付け段階が更に、前記再訪問情報を用いる段階を含む請求項30に記載の方法。
  40. 前記受信段階が更に、前記選択されたリンクへのアクセスの購入又は登録へのコンバージョンに関する情報を含み、前記ランク付け段階が更に、該コンバージョン情報を用いる段階を含む請求項30に記載の方法。
  41. 多少の検索エンジン使用を有する他のユーザとほぼ等しい正規化された重み付けを特定のユーザによる前記検索エンジン使用に与えるように前記検索エンジン使用を重み付けする段階を前記ランク付け段階内に更に含めることによって、結果を偏らせるロボット行動が軽減されることを特徴とする請求項30に記載の方法。
  42. 前記ランク付け段階が更に、選択されたリンクをバンドにグループ化し、該バンド内の該選択されたリンクをランク付けする段階を含む請求項30に記載の方法。
  43. 前記ランク付け段階が更に、リンクを返した前記特定の検索エンジンによって選択されたリンクを別個にランク付けし、次いで該別個のランク付けを全体のランク付け組み合わせる段階を含む請求項30に記載の方法。
  44. 請求項30に記載の方法を実施するための命令を含む機械読取り可能メモリ。
  45. 請求項30に記載の方法を実施するための機械読取り可能命令を含むデータストリーム。
  46. 請求項30に記載の方法を実施するように適合されたロジック及びリソースを有する1つ又はそれ以上のサーバを含む装置。
  47. ユーザによって検索エンジンに実行依頼されたキーワード検索用語における曖昧性を解消する方法であって、
    特定のサーバ側行動データ収集ネットワークに全てが関連付けられている訳ではないドキュメントにアクセスすることを含み、マウスクリックスルー、入力キーストローク、又は他の選択動作のうちの少なくとも1つと該選択動作のコンテキストから得た少なくとも1つのキーワードとを更に含むユーザの最近のナビゲーション行動に関する情報をユーザのコンピュータ上で動作する行動監視モジュールから受け取る段階と、
    前記検索用語が属する可能性が高い複数の関心カテゴリーを決定する段階と、
    前記最近のナビゲーション情報を用いて前記複数の関心カテゴリーの中から選択する段階と、
    を含む方法。
  48. 前記最近のナビゲーション行動情報が、関心カテゴリーによって、更に行動の新しさによってカテゴリー化されることを特徴とする請求項47に記載の方法。
  49. 前記ドキュメントはウェブページであり、前記サーバ側行動データ収集ネットワークが広告ネットワークであることを特徴とする請求項47に記載の方法。
  50. 請求項47に記載の方法を実施するための命令を含む機械読取り可能メモリ。
  51. 請求項47に記載の方法を実施するための機械読取り可能命令を含むデータストリーム。
  52. 請求項47に記載の方法を実施するように適合されたロジック及びリソースを有する1つ又はそれ以上のサーバを含む装置。
  53. ネットワークを介してアクセス可能なドキュメント間のユーザの最近のナビゲーション行動を反映する情報で検索要求を補足する方法であって、
    前記ユーザによってアクセスされたドキュメントを電子的に識別し、
    前記アクセスされたドキュメントをカテゴリー化し、
    前記カテゴリー内のドキュメントがいつアクセスされたかを示す、
    ことを含む、前記ユーザの最近のナビゲーション行動に関する情報を収集する行動監視モジュールを前記ユーザのコンピュータ上で動作させる段階と、
    検索エンジンを含む1つ又はそれ以上のサーバにクエリと共に前記最近のナビゲーション行動情報の少なくとも要約を実行依頼する段階と、
    前記実行依頼された最近のナビゲーション行動情報に対応する関心カテゴリーに偏った結果のセットを前記検索エンジンから受け取る段階と、
    を含む方法。
  54. 前記行動監視モジュールが前記アクセスされるドキュメントをフィルタリングし、前記カテゴリーがいつアクセスされたかに関する指標をカテゴリー化する段階を更に含む請求項53に記載の方法。
  55. 請求項53に記載の方法を実施するための命令を含む機械読取り可能メモリ。
  56. 請求項53に記載の方法を実施するための機械読取り可能命令を含むデータストリーム。
  57. 請求項53に記載の方法を実施するように適合されたロジック及びリソースを有する1つ又はそれ以上のサーバを含む装置。
  58. ユーザによって検索エンジンに実行依頼されたキーワード検索用語に応答して返されたコンテンツをパーソナライズする方法であって、
    特定のサーバ側行動データ収集ネットワークに全てが関連付けられている訳ではないドキュメントにアクセスすることを含み、マウスクリックスルー、入力キーストローク、又は他の選択動作のうちの少なくとも1つと該選択動作のコンテキストから得た少なくとも1つのキーワードとを更に含むユーザの最近のナビゲーション行動に関する情報をユーザのコンピュータ上で動作する行動監視モジュールから受け取る段階と、
    前記検索用語に応答するドキュメントが関心対象のものであろう複数の見込み予算カテゴリーを決定する段階と、
    前記ナビゲーション情報を用いて前記複数の見込み予算カテゴリーの中から少なくとも1つを選択する段階と、
    を含む方法。
  59. 前記ユーザナビゲーション情報は、少なくとも直前の1時間及び直前の1日内のナビゲーションを含む最近のナビゲーションを反映していることを特徴とする請求項58に記載の方法。
  60. 前記ユーザナビゲーション情報は、受信時に前記見込み予算カテゴリーの1つ又はそれ以上にまとめられることを特徴とする請求項58に記載の方法。
  61. 前記ユーザナビゲーション情報は、受信後に前記見込み予算カテゴリーの1つ又はそれ以上にまとめられることを特徴とする請求項58に記載の方法。
  62. 前記選択された見込み予算カテゴリーにおいて少なくとも幾つかの結果を高くランク付けするように偏らせた結果で前記ユーザに応答する段階を更に含む請求項58に記載の方法。
  63. 前記選択された見込み予算カテゴリーにおいて、応答するドキュメントに好都合な結果をフィルタリングすることによって前記ユーザに応答する段階を更に含む請求項58に記載の方法。
  64. 請求項58に記載の方法を実施するための命令を含む機械読取り可能メモリ。
  65. 請求項58に記載の方法を実施するための機械読取り可能命令を含むデータストリーム。
  66. 請求項58に記載の方法を実施するように適合されたロジック及びリソースを有する1つ又はそれ以上のサーバを含む装置。
  67. ネットワークを介してアクセス可能なドキュメント間のユーザの最近のナビゲーション行動を反映する情報で検索要求を補足する方法であって、
    前記ユーザによってアクセスされたドキュメントを電子的に識別し、
    前記アクセスされたドキュメントをカテゴリー化し、
    前記カテゴリー内のドキュメントがいつアクセスされたかを示す、
    ことを含む、前記ユーザのナビゲーション行動に関する情報を収集する行動監視モジュールを前記ユーザのコンピュータ上で動作させる段階と、
    検索エンジンへの情報要求と共に前記ナビゲーション行動情報の少なくとも要約を実行依頼する段階と、
    前記実行依頼されたナビゲーション行動情報に対応する見込み予算に偏った結果のセットを前記検索エンジンから受け取る段階と、
    を含む方法。
  68. 前記行動監視モジュールが前記アクセスされるドキュメントをフィルタリングし、前記カテゴリーがいつアクセスされたかに関する指標をカテゴリー化する段階を更に含む請求項67に記載の方法。
  69. 請求項67に記載の方法を実施するための命令を含む機械読取り可能メモリ。
  70. 請求項67に記載の方法を実施するための機械読取り可能命令を含むデータストリーム。
  71. 請求項67に記載の方法を実施するように適合されたロジック及びリソースを有する1つ又はそれ以上のサーバを含む装置。
JP2007528053A 2004-08-19 2005-08-19 エンドユーザの情報要求に応答するための方法及び装置 Pending JP2008511057A (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US60314004P 2004-08-19 2004-08-19
US11/015,583 US8078602B2 (en) 2004-12-17 2004-12-17 Search engine for a computer network
US63768404P 2004-12-20 2004-12-20
US66079805P 2005-03-11 2005-03-11
US66268005P 2005-03-17 2005-03-17
PCT/US2005/029615 WO2006023765A2 (en) 2004-08-19 2005-08-19 Method and apparatus for responding to end-user request for information

Publications (1)

Publication Number Publication Date
JP2008511057A true JP2008511057A (ja) 2008-04-10

Family

ID=35910770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007528053A Pending JP2008511057A (ja) 2004-08-19 2005-08-19 エンドユーザの情報要求に応答するための方法及び装置

Country Status (10)

Country Link
US (2) US7444358B2 (ja)
EP (1) EP1779276A4 (ja)
JP (1) JP2008511057A (ja)
KR (1) KR20070053282A (ja)
AU (1) AU2005277210A1 (ja)
CA (1) CA2577841A1 (ja)
IL (1) IL181323A0 (ja)
NZ (1) NZ553287A (ja)
TW (1) TWI386824B (ja)
WO (1) WO2006023765A2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008181186A (ja) * 2007-01-23 2008-08-07 Yahoo Japan Corp クエリーログを利用したキーワードとサイトの関連度を求める方法
JP2009003617A (ja) * 2007-06-20 2009-01-08 Denso Corp 携帯通信装置
JP2010524141A (ja) * 2007-04-12 2010-07-15 マイクロソフト コーポレーション 履歴重要度のファクタリングによるドキュメントの重要度の計算
JP2013015920A (ja) * 2011-06-30 2013-01-24 Fujitsu Ltd 情報処理装置、情報処理方法、および情報処理プログラム
JP2016095866A (ja) * 2010-12-20 2016-05-26 ザ ニールセン カンパニー (ユー エス) エルエルシー 分散人口統計情報を使用してメディアインプレッション(mediaimpressions)を決定するための方法及び装置
JP2018023146A (ja) * 2017-09-19 2018-02-08 キヤノン株式会社 情報処理装置、その制御方法、プログラム
JP2018537763A (ja) * 2015-10-27 2018-12-20 株式会社A1 Media Group インターネットコンテンツ提供サーバ及びその方法が具現化されたコンピュータで判読できる記録媒体
JP2020126694A (ja) * 2020-05-19 2020-08-20 ヤフー株式会社 推定装置、推定方法、及び推定プログラム

Families Citing this family (252)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8868448B2 (en) 2000-10-26 2014-10-21 Liveperson, Inc. Systems and methods to facilitate selling of products and services
US9819561B2 (en) 2000-10-26 2017-11-14 Liveperson, Inc. System and methods for facilitating object assignments
US20090018922A1 (en) * 2002-02-06 2009-01-15 Ryan Steelberg System and method for preemptive brand affinity content distribution
US20090112715A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg Engine, system and method for generation of brand affinity content
US20090228354A1 (en) * 2008-03-05 2009-09-10 Ryan Steelberg Engine, system and method for generation of brand affinity content
US20090112698A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg System and method for brand affinity content distribution and optimization
US20090112692A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg Engine, system and method for generation of brand affinity content
US20090024409A1 (en) * 2002-02-06 2009-01-22 Ryan Steelberg Apparatus, system and method for a brand affinity engine using positive and negative mentions
US7383513B2 (en) * 2002-09-25 2008-06-03 Oracle International Corporation Graphical condition builder for facilitating database queries
US7698267B2 (en) * 2004-08-27 2010-04-13 The Regents Of The University Of California Searching digital information and databases
US20070011155A1 (en) * 2004-09-29 2007-01-11 Sarkar Pte. Ltd. System for communication and collaboration
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US8635216B1 (en) * 2004-09-30 2014-01-21 Avaya Inc. Enhancing network information retrieval according to a user search profile
US7856413B2 (en) * 2004-10-14 2010-12-21 International Business Machines Corporation Dynamic search criteria on a search graph
US7631007B2 (en) * 2005-04-12 2009-12-08 Scenera Technologies, Llc System and method for tracking user activity related to network resources using a browser
US7699707B2 (en) * 2005-05-09 2010-04-20 Hotbox Sports Llc Fantasy sports system and method thereof
US7546289B2 (en) 2005-05-11 2009-06-09 W.W. Grainger, Inc. System and method for providing a response to a search query
US20060294196A1 (en) * 2005-06-27 2006-12-28 Elie Feirouz Method and system for storing a web browser application session cookie from another client application program
US8321198B2 (en) * 2005-09-06 2012-11-27 Kabushiki Kaisha Square Enix Data extraction system, terminal, server, programs, and media for extracting data via a morphological analysis
US9432468B2 (en) 2005-09-14 2016-08-30 Liveperson, Inc. System and method for design and dynamic generation of a web page
US8738732B2 (en) 2005-09-14 2014-05-27 Liveperson, Inc. System and method for performing follow up based on user interactions
US8688673B2 (en) * 2005-09-27 2014-04-01 Sarkar Pte Ltd System for communication and collaboration
US20070088690A1 (en) * 2005-10-13 2007-04-19 Xythos Software, Inc. System and method for performing file searches and ranking results
US8219457B2 (en) * 2005-10-28 2012-07-10 Adobe Systems Incorporated Custom user definable keyword bidding system and method
CN100539503C (zh) * 2005-12-31 2009-09-09 华为技术有限公司 信息发布系统、公共媒体信息发布系统和发布方法
US7853602B2 (en) * 2006-01-24 2010-12-14 At&T Intellectual Property, I, L.P. System and method for creating an enhanced enterprise directory
JP4005100B2 (ja) * 2006-01-30 2007-11-07 株式会社カナックス 広告配信システムと装置、方法並びに広告配信プログラム
US8862572B2 (en) * 2006-02-17 2014-10-14 Google Inc. Sharing user distributed search results
US7844603B2 (en) * 2006-02-17 2010-11-30 Google Inc. Sharing user distributed search results
US8122019B2 (en) 2006-02-17 2012-02-21 Google Inc. Sharing user distributed search results
US20070208730A1 (en) * 2006-03-02 2007-09-06 Microsoft Corporation Mining web search user behavior to enhance web search relevance
US8402022B2 (en) * 2006-03-03 2013-03-19 Martin R. Frank Convergence of terms within a collaborative tagging environment
US8112324B2 (en) * 2006-03-03 2012-02-07 Amazon Technologies, Inc. Collaborative structured tagging for item encyclopedias
CN101443801A (zh) * 2006-04-21 2009-05-27 布卢鲁姆公司 用户配置方法
KR100785352B1 (ko) * 2006-04-21 2007-12-18 엔에이치엔(주) 검색결과리스트 생성 방법 및 검색결과리스트 생성 시스템
US10042927B2 (en) * 2006-04-24 2018-08-07 Yeildbot Inc. Interest keyword identification
KR100777409B1 (ko) * 2006-06-05 2007-11-19 주식회사 알티캐스트 디지털 양방향 방송에서의 네트워크 서비스 프로바이더애플리케이션 프로비저닝 방법
US8196039B2 (en) 2006-07-07 2012-06-05 International Business Machines Corporation Relevant term extraction and classification for Wiki content
US20080010338A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for client and server interaction
US7954052B2 (en) * 2006-07-07 2011-05-31 International Business Machines Corporation Method for processing a web page for display in a wiki environment
US8775930B2 (en) * 2006-07-07 2014-07-08 International Business Machines Corporation Generic frequency weighted visualization component
US20080010388A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for server wiring model
US8219900B2 (en) * 2006-07-07 2012-07-10 International Business Machines Corporation Programmatically hiding and displaying Wiki page layout sections
US20080010386A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for client wiring model
US20080065769A1 (en) * 2006-07-07 2008-03-13 Bryce Allen Curtis Method and apparatus for argument detection for event firing
US8560956B2 (en) 2006-07-07 2013-10-15 International Business Machines Corporation Processing model of an application wiki
US20080010387A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method for defining a Wiki page layout using a Wiki page
US20080010345A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for data hub objects
US8255383B2 (en) * 2006-07-14 2012-08-28 Chacha Search, Inc Method and system for qualifying keywords in query strings
US7792967B2 (en) * 2006-07-14 2010-09-07 Chacha Search, Inc. Method and system for sharing and accessing resources
US8280921B2 (en) * 2006-07-18 2012-10-02 Chacha Search, Inc. Anonymous search system using human searchers
US9268873B2 (en) * 2006-08-04 2016-02-23 Yahoo! Inc. Landing page identification, tagging and host matching for a mobile application
US7765203B2 (en) * 2006-09-11 2010-07-27 International Business Machines Corporation Implicit context collection and processing
US20080071797A1 (en) * 2006-09-15 2008-03-20 Thornton Nathaniel L System and method to calculate average link growth on search engines for a keyword
US7860886B2 (en) * 2006-09-29 2010-12-28 A9.Com, Inc. Strategy for providing query results based on analysis of user intent
US20080091548A1 (en) * 2006-09-29 2008-04-17 Kotas Paul A Tag-Driven Concept-Centric Electronic Marketplace
US20080091524A1 (en) * 2006-10-13 2008-04-17 Yahoo! Inc. System and method for advertisement price adjustment utilizing traffic quality data
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US20080154889A1 (en) * 2006-12-22 2008-06-26 Pfeiffer Silvia Video searching engine and methods
US20080168045A1 (en) * 2007-01-10 2008-07-10 Microsoft Corporation Content rank
US20080183561A1 (en) * 2007-01-26 2008-07-31 Exelate Media Ltd. Marketplace for interactive advertising targeting events
US20080183691A1 (en) * 2007-01-30 2008-07-31 International Business Machines Corporation Method for a networked knowledge based document retrieval and ranking utilizing extracted document metadata and content
ITBG20070012A1 (it) * 2007-02-13 2008-08-14 Web Lion Sas Metodo di ricerca e selezione di siti web
US7756867B2 (en) * 2007-02-16 2010-07-13 Yahoo! Inc. Ranking documents
US7930286B2 (en) * 2007-02-16 2011-04-19 Yahoo! Inc. Federated searches implemented across multiple search engines
US20080228719A1 (en) * 2007-03-13 2008-09-18 Fatdoor, Inc. People and business search result optimization
US20080235163A1 (en) * 2007-03-22 2008-09-25 Srinivasan Balasubramanian System and method for online duplicate detection and elimination in a web crawler
US9912766B2 (en) * 2007-03-23 2018-03-06 Yahoo Holdings, Inc. System and method for identifying a link and generating a link identifier for the link on a webpage
US7580945B2 (en) * 2007-03-30 2009-08-25 Microsoft Corporation Look-ahead document ranking system
US7958103B1 (en) * 2007-03-30 2011-06-07 Emc Corporation Incorporated web page content
US8041778B2 (en) * 2007-04-26 2011-10-18 Microsoft Corporation Extended browser data storage
US8015181B2 (en) * 2007-06-19 2011-09-06 Conduit, Ltd System for providing enhanced search results on the internet
US7783630B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Tuning of relevancy ranking for federated search
US7783620B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Relevancy scoring using query structure and data structure for federated search
KR100902036B1 (ko) * 2007-07-20 2009-06-15 주식회사 네티모커뮤니케이션즈 웹문서의 본문 문장내 키워드 광고 시스템 및 그 방법
US8666819B2 (en) 2007-07-20 2014-03-04 Yahoo! Overture System and method to facilitate classification and storage of events in a network
US8688521B2 (en) * 2007-07-20 2014-04-01 Yahoo! Inc. System and method to facilitate matching of content to advertising information in a network
US9178848B1 (en) * 2007-07-23 2015-11-03 Google Inc. Identifying affiliated domains
US8200694B1 (en) 2007-07-23 2012-06-12 Google Inc. Identification of implicitly local queries
US20090132493A1 (en) * 2007-08-10 2009-05-21 Scott Decker Method for retrieving and editing HTML documents
KR100901938B1 (ko) * 2007-08-14 2009-06-10 엔에이치엔비즈니스플랫폼 주식회사 Ctr을 보정하는 방법 및 시스템
US20090112718A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg System and method for distributing content for use with entertainment creatives
US8725563B2 (en) * 2007-09-07 2014-05-13 Brand Affinity Technologies, Inc. System and method for searching media assets
US20100114704A1 (en) * 2007-09-07 2010-05-06 Ryan Steelberg System and method for brand affinity content distribution and optimization
US20110131141A1 (en) * 2008-09-26 2011-06-02 Ryan Steelberg Advertising request and rules-based content provision engine, system and method
US20090112714A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg Engine, system and method for generation of brand affinity content
US8548844B2 (en) 2007-09-07 2013-10-01 Brand Affinity Technologies, Inc. Apparatus, system and method for a brand affinity engine using positive and negative mentions and indexing
US8751479B2 (en) * 2007-09-07 2014-06-10 Brand Affinity Technologies, Inc. Search and storage engine having variable indexing for information associations
US20100318375A1 (en) * 2007-09-07 2010-12-16 Ryan Steelberg System and Method for Localized Valuations of Media Assets
US20100131085A1 (en) * 2007-09-07 2010-05-27 Ryan Steelberg System and method for on-demand delivery of audio content for use with entertainment creatives
US20100082598A1 (en) * 2008-02-07 2010-04-01 Brand Affinity Technologies, Inc. Engine, system and method for generation of brand affinity content
US7809603B2 (en) * 2007-09-07 2010-10-05 Brand Affinity Technologies, Inc. Advertising request and rules-based content provision engine, system and method
US20110078003A1 (en) * 2007-09-07 2011-03-31 Ryan Steelberg System and Method for Localized Valuations of Media Assets
US9633505B2 (en) 2007-09-07 2017-04-25 Veritone, Inc. System and method for on-demand delivery of audio content for use with entertainment creatives
US20100114701A1 (en) * 2007-09-07 2010-05-06 Brand Affinity Technologies, Inc. System and method for brand affinity content distribution and optimization with charitable organizations
US20100217664A1 (en) * 2007-09-07 2010-08-26 Ryan Steelberg Engine, system and method for enhancing the value of advertisements
US20110040648A1 (en) * 2007-09-07 2011-02-17 Ryan Steelberg System and Method for Incorporating Memorabilia in a Brand Affinity Content Distribution
US20100114693A1 (en) * 2007-09-07 2010-05-06 Ryan Steelberg System and method for developing software and web based applications
US9294727B2 (en) 2007-10-31 2016-03-22 Veritone, Inc. System and method for creation and management of advertising inventory using metadata
US20100030746A1 (en) * 2008-07-30 2010-02-04 Ryan Steelberg System and method for distributing content for use with entertainment creatives including consumer messaging
US20100131337A1 (en) * 2007-09-07 2010-05-27 Ryan Steelberg System and method for localized valuations of media assets
US20100106601A1 (en) * 2007-09-07 2010-04-29 Ryan Steelberg System and method for distributing text content for use in one or more creatives
US20110047050A1 (en) * 2007-09-07 2011-02-24 Ryan Steelberg Apparatus, System And Method For A Brand Affinity Engine Using Positive And Negative Mentions And Indexing
US8452764B2 (en) * 2007-09-07 2013-05-28 Ryan Steelberg Apparatus, system and method for a brand affinity engine using positive and negative mentions and indexing
US20100114719A1 (en) * 2007-09-07 2010-05-06 Ryan Steelberg Engine, system and method for generation of advertisements with endorsements and associated editorial content
US20090112700A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg System and method for brand affinity content distribution and optimization
US20090112717A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg Apparatus, system and method for a brand affinity engine with delivery tracking and statistics
US20100131357A1 (en) * 2007-09-07 2010-05-27 Ryan Steelberg System and method for controlling user and content interactions
US8285700B2 (en) 2007-09-07 2012-10-09 Brand Affinity Technologies, Inc. Apparatus, system and method for a brand affinity engine using positive and negative mentions and indexing
US20100274644A1 (en) * 2007-09-07 2010-10-28 Ryan Steelberg Engine, system and method for generation of brand affinity content
US20090138304A1 (en) * 2007-09-11 2009-05-28 Asaf Aharoni Data Mining
US7761471B1 (en) 2007-10-16 2010-07-20 Jpmorgan Chase Bank, N.A. Document management techniques to account for user-specific patterns in document metadata
US20090299837A1 (en) * 2007-10-31 2009-12-03 Ryan Steelberg System and method for brand affinity content distribution and optimization
US20110106632A1 (en) * 2007-10-31 2011-05-05 Ryan Steelberg System and method for alternative brand affinity content transaction payments
US20100076866A1 (en) * 2007-10-31 2010-03-25 Ryan Steelberg Video-related meta data engine system and method
US9922119B2 (en) * 2007-11-08 2018-03-20 Entit Software Llc Navigational ranking for focused crawling
US8626823B2 (en) * 2007-11-13 2014-01-07 Google Inc. Page ranking system employing user sharing data
US8577894B2 (en) 2008-01-25 2013-11-05 Chacha Search, Inc Method and system for access to restricted resources
US7853587B2 (en) 2008-01-31 2010-12-14 Microsoft Corporation Generating search result summaries
CN101971198A (zh) * 2008-02-07 2011-02-09 品牌亲和度技术有限公司 利用关键词定性和定量评价品牌的方法
US10269024B2 (en) * 2008-02-08 2019-04-23 Outbrain Inc. Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content
US7814074B2 (en) * 2008-03-14 2010-10-12 International Business Machines Corporation Method and system for assuring integrity of deduplicated data
US20090241058A1 (en) * 2008-03-18 2009-09-24 Cuill, Inc. Apparatus and method for displaying search results with an associated anchor area
US8209331B1 (en) 2008-04-02 2012-06-26 Google Inc. Context sensitive ranking
JP5150341B2 (ja) * 2008-04-10 2013-02-20 株式会社東芝 データ作成装置及び方法
US7567188B1 (en) * 2008-04-10 2009-07-28 International Business Machines Corporation Policy based tiered data deduplication strategy
US8515909B2 (en) * 2008-04-29 2013-08-20 International Business Machines Corporation Enhanced method and system for assuring integrity of deduplicated data
US8095980B2 (en) * 2008-04-30 2012-01-10 International Business Machines Corporation Detecting malicious behavior in data transmission of a de-duplication system
US8229911B2 (en) * 2008-05-13 2012-07-24 Enpulz, Llc Network search engine utilizing client browser activity information
US20090307053A1 (en) * 2008-06-06 2009-12-10 Ryan Steelberg Apparatus, system and method for a brand affinity engine using positive and negative mentions
WO2009151611A1 (en) * 2008-06-12 2009-12-17 Ryan Steelberg Barcode advertising
US8788490B1 (en) 2008-06-27 2014-07-22 Google Inc. Link based locale identification for domains and domain content
US8799200B2 (en) 2008-07-25 2014-08-05 Liveperson, Inc. Method and system for creating a predictive model for targeting webpage to a surfer
US8762313B2 (en) 2008-07-25 2014-06-24 Liveperson, Inc. Method and system for creating a predictive model for targeting web-page to a surfer
US8805844B2 (en) 2008-08-04 2014-08-12 Liveperson, Inc. Expert search
US8392791B2 (en) * 2008-08-08 2013-03-05 George Saliba Unified data protection and data de-duplication in a storage system
US20120166414A1 (en) * 2008-08-11 2012-06-28 Ultra Unilimited Corporation (dba Publish) Systems and methods for relevance scoring
US8368698B2 (en) * 2008-09-24 2013-02-05 Microsoft Corporation Calculating a webpage importance from a web browsing graph
US8103599B2 (en) * 2008-09-25 2012-01-24 Microsoft Corporation Calculating web page importance based on web behavior model
AU2009296763A1 (en) * 2008-09-26 2010-04-01 Brand Affinity Technologies, Inc. An advertising request and rules-based content provision engine, system and method
US20100114692A1 (en) * 2008-09-30 2010-05-06 Ryan Steelberg System and method for brand affinity content distribution and placement
AU2009298436A1 (en) * 2008-10-01 2010-04-08 Chad Steelberg On-site barcode advertising
US9892417B2 (en) 2008-10-29 2018-02-13 Liveperson, Inc. System and method for applying tracing tools for network locations
WO2010056545A1 (en) * 2008-10-29 2010-05-20 Brand Affinity Technologies, Inc. System and method for metricizing assets in a brand affinity content distribution
WO2010054250A1 (en) * 2008-11-06 2010-05-14 Brand Affinity Technologies, Inc. System and method for triggering development and delivery of advertisements
US20100121702A1 (en) * 2008-11-06 2010-05-13 Ryan Steelberg Search and storage engine having variable indexing for information associations and predictive modeling
EP2350870A4 (en) * 2008-11-06 2012-11-21 Brand Affinity Tech Inc SYSTEM AND METHOD FOR RESEARCH IN MULTIMEDIA GOODS
US20100153372A1 (en) * 2008-12-17 2010-06-17 Sea Woo Kim 3d visualization system for web survey
AU2010208097B2 (en) 2009-01-30 2015-03-12 Google Llc Conversion crediting
US9477763B2 (en) * 2009-03-02 2016-10-25 Excalibur IP, LC Personalized search results utilizing previously navigated web sites
US9275067B2 (en) * 2009-03-16 2016-03-01 International Busines Machines Corporation Apparatus and method to sequentially deduplicate data
US8412679B1 (en) * 2009-03-31 2013-04-02 Intuit Inc. Method and system for identifying obsolete discussion threads in a forum
US8229909B2 (en) * 2009-03-31 2012-07-24 Oracle International Corporation Multi-dimensional algorithm for contextual search
US8554602B1 (en) 2009-04-16 2013-10-08 Exelate, Inc. System and method for behavioral segment optimization based on data exchange
US20100306224A1 (en) * 2009-06-02 2010-12-02 Yahoo! Inc. Online Measurement of User Satisfaction Using Long Duration Clicks
KR101011726B1 (ko) * 2009-06-09 2011-01-28 성균관대학교산학협력단 스니펫 제공 장치 및 방법
US8719240B2 (en) * 2009-06-19 2014-05-06 International Business Machines Corporation Apparatus and method to sequentially deduplicate groups of files comprising the same file name but different file version numbers
US20100331075A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Using game elements to motivate learning
US8979538B2 (en) * 2009-06-26 2015-03-17 Microsoft Technology Licensing, Llc Using game play elements to motivate learning
US9396485B2 (en) * 2009-12-24 2016-07-19 Outbrain Inc. Systems and methods for presenting content
US20110040604A1 (en) * 2009-08-13 2011-02-17 Vertical Acuity, Inc. Systems and Methods for Providing Targeted Content
US8621068B2 (en) * 2009-08-20 2013-12-31 Exelate Media Ltd. System and method for monitoring advertisement assignment
US9081857B1 (en) * 2009-09-21 2015-07-14 A9.Com, Inc. Freshness and seasonality-based content determinations
US7716205B1 (en) 2009-10-29 2010-05-11 Wowd, Inc. System for user driven ranking of web pages
US9256692B2 (en) * 2009-12-03 2016-02-09 Hewlett Packard Enterprise Development Lp Clickstreams and website classification
US10607235B2 (en) * 2009-12-24 2020-03-31 Outbrain Inc. Systems and methods for curating content
US20110197137A1 (en) * 2009-12-24 2011-08-11 Vertical Acuity, Inc. Systems and Methods for Rating Content
US10713666B2 (en) 2009-12-24 2020-07-14 Outbrain Inc. Systems and methods for curating content
US20110161091A1 (en) * 2009-12-24 2011-06-30 Vertical Acuity, Inc. Systems and Methods for Connecting Entities Through Content
US8693353B2 (en) * 2009-12-28 2014-04-08 Schneider Electric USA, Inc. Intelligent ethernet gateway system and method for optimizing serial communication networks
US10263827B2 (en) * 2009-12-31 2019-04-16 Schneider Electric USA, Inc. Information bridge between manufacturer server and monitoring device on a customer network
US8949980B2 (en) * 2010-01-25 2015-02-03 Exelate Method and system for website data access monitoring
US9855503B2 (en) 2010-03-01 2018-01-02 Rishi Nangia System and method for providing secondary gaming
US20110238670A1 (en) * 2010-03-23 2011-09-29 Microsoft Corporation Crowd-sourcing and contextual reclassification of rated content
US9996614B2 (en) 2010-04-07 2018-06-12 Excalibur Ip, Llc Method and system for determining relevant text in a web page
WO2011127049A1 (en) 2010-04-07 2011-10-13 Liveperson, Inc. System and method for dynamically enabling customized web content and applications
US8863000B2 (en) * 2010-04-07 2014-10-14 Yahoo! Inc. Method and system for action suggestion using browser history
US10083248B2 (en) 2010-04-07 2018-09-25 Excalibur Ip, Llc Method and system for topic-based browsing
US9135354B2 (en) * 2010-04-07 2015-09-15 Yahoo! Inc. Method and system for topical browser history
KR20110116562A (ko) * 2010-04-19 2011-10-26 서울대학교산학협력단 대규모 다중 사용자 온라인 롤플레잉 게임에서 봇을 검출하는 방법 및 시스템
US20110270850A1 (en) * 2010-04-30 2011-11-03 Microsoft Corporation Prioritization of Resources based on User Activities
US9697500B2 (en) * 2010-05-04 2017-07-04 Microsoft Technology Licensing, Llc Presentation of information describing user activities with regard to resources
US8676875B1 (en) * 2010-05-19 2014-03-18 Adobe Systems Incorporated Social media measurement
US8655938B1 (en) 2010-05-19 2014-02-18 Adobe Systems Incorporated Social media contributor weight
WO2012009672A1 (en) * 2010-07-16 2012-01-19 Altruik, Inc. System and method for improving webpage indexing and optimization
US8489560B1 (en) * 2010-09-08 2013-07-16 Conductor, Inc. System and method for facilitating the management of keyword/universal resource locator (URL) data
US20120066359A1 (en) * 2010-09-09 2012-03-15 Freeman Erik S Method and system for evaluating link-hosting webpages
US8843817B2 (en) * 2010-09-14 2014-09-23 Yahoo! Inc. System and method for obtaining user information
US8825641B2 (en) * 2010-11-09 2014-09-02 Microsoft Corporation Measuring duplication in search results
US20120130910A1 (en) * 2010-11-19 2012-05-24 Salesforce.Com, Inc. Customer support flow
US9350598B2 (en) 2010-12-14 2016-05-24 Liveperson, Inc. Authentication of service requests using a communications initiation feature
US8918465B2 (en) 2010-12-14 2014-12-23 Liveperson, Inc. Authentication of service requests initiated from a social networking site
US20120240019A1 (en) * 2011-03-17 2012-09-20 Ebay Inc. Method and system for tracking web link usage
US9477574B2 (en) 2011-05-12 2016-10-25 Microsoft Technology Licensing, Llc Collection of intranet activity data
US8819009B2 (en) 2011-05-12 2014-08-26 Microsoft Corporation Automatic social graph calculation
US9218422B2 (en) 2011-07-26 2015-12-22 Microsoft Technology Licensing, Llc Personalized deeplinks for search results
US8838643B2 (en) 2011-07-26 2014-09-16 Microsoft Corporation Context-aware parameterized action links for search results
US9367638B2 (en) 2011-07-26 2016-06-14 Microsoft Technology Licensing, Llc Surfacing actions from social data
CN103034633B (zh) 2011-09-30 2016-08-03 国际商业机器公司 生成扩展的搜索结果页面摘要的方法及装置
US20130086083A1 (en) * 2011-09-30 2013-04-04 Microsoft Corporation Transferring ranking signals from equivalent pages
US20130144847A1 (en) * 2011-12-05 2013-06-06 Google Inc. De-Duplication of Featured Content
US8805941B2 (en) 2012-03-06 2014-08-12 Liveperson, Inc. Occasionally-connected computing interface
US9311417B2 (en) * 2012-03-09 2016-04-12 Oracle International Corporation Personalized navigation shortcuts
KR101413988B1 (ko) * 2012-04-25 2014-07-01 (주)이스트소프트 문서의 이산분리시스템 및 방법
US9563336B2 (en) 2012-04-26 2017-02-07 Liveperson, Inc. Dynamic user interface customization
US9672196B2 (en) 2012-05-15 2017-06-06 Liveperson, Inc. Methods and systems for presenting specialized content using campaign metrics
US9705964B2 (en) 2012-05-31 2017-07-11 Intel Corporation Rendering multiple remote graphics applications
CN104272285B (zh) * 2012-05-31 2017-06-20 英特尔公司 用于渲染图形应用程序的方法和装置
EP2873050A4 (en) * 2012-07-13 2016-01-20 Trueffect Inc DETERMINING MEASUREMENT OF ENHANCED ADVERTISING SERVICES
US9591173B2 (en) * 2012-08-17 2017-03-07 Samsung Electrônica da Amazônia Ltda. System and method for digital analysis of authenticity and integrity of documents using portable devices
US9634977B2 (en) 2012-10-01 2017-04-25 Salesforce.Com, Inc. Systems and methods of redactive messaging
US9098511B1 (en) * 2012-10-02 2015-08-04 Google Inc. Watch time based ranking
US9202332B2 (en) 2013-01-14 2015-12-01 Hotbox Sports Llc Online fantasy sports game system and method
US9858526B2 (en) 2013-03-01 2018-01-02 Exelate, Inc. Method and system using association rules to form custom lists of cookies
US9292405B2 (en) 2013-03-08 2016-03-22 Sap Se HANA based multiple scenario simulation enabling automated decision making for complex business processes
US20140278796A1 (en) * 2013-03-14 2014-09-18 Nick Salvatore ARINI Identifying Target Audience for a Product or Service
JP5939580B2 (ja) * 2013-03-27 2016-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 匿名化データを名寄せするための名寄せシステム、並びに、その方法及びコンピュータ・プログラム
US9805124B2 (en) * 2013-04-25 2017-10-31 Microsoft Technology Licensing, Llc Automatic generation of a collection of content
US9269049B2 (en) 2013-05-08 2016-02-23 Exelate, Inc. Methods, apparatus, and systems for using a reduced attribute vector of panel data to determine an attribute of a user
CN104252456B (zh) * 2013-06-25 2018-10-09 阿里巴巴集团控股有限公司 一种权重估计方法、装置及系统
EP3036923A4 (en) * 2013-08-22 2017-05-10 Inc. Sensoriant Method and system for addressing the problem of discovering relevant services and applications that are available over the internet or other communcations network
US9792357B2 (en) * 2013-09-10 2017-10-17 Adobe Systems Incorporated Method and apparatus for consuming content via snippets
US9767158B1 (en) 2013-10-09 2017-09-19 Google Inc. Ranking algorithms using unique bucketing identifiers
RU2583739C2 (ru) 2013-10-16 2016-05-10 Общество С Ограниченной Ответственностью "Яндекс" Сервер для определения поисковой выдачи на поисковый запрос и электронное устройство
US9633017B2 (en) * 2013-11-07 2017-04-25 Yahoo! Inc. Dwell-time based generation of a user interest profile
US11386442B2 (en) 2014-03-31 2022-07-12 Liveperson, Inc. Online behavioral predictor
US10579630B2 (en) * 2015-01-14 2020-03-03 Microsoft Technology Licensing, Llc Content creation from extracted content
US10067985B2 (en) * 2015-03-05 2018-09-04 Telenav, Inc. Computing system with crowd-source mechanism and method of operation thereof
US10009308B2 (en) * 2015-04-24 2018-06-26 International Business Machines Corporation Social content features based on user tracking
US10733594B1 (en) * 2015-05-11 2020-08-04 Square, Inc. Data security measures for mobile devices
CA2988120A1 (en) 2015-06-02 2016-12-08 Liveperson, Inc. Dynamic communication routing based on consistency weighting and routing rules
CN106487844A (zh) * 2015-08-28 2017-03-08 北京奇虎科技有限公司 一种检测推广url的有效性的方法和系统
US10546028B2 (en) 2015-11-18 2020-01-28 International Business Machines Corporation Method for personalized breaking news feed
CN105468730A (zh) * 2015-11-20 2016-04-06 广州华多网络科技有限公司 一种网页信息提取方法及其设备
US9690828B1 (en) 2015-12-21 2017-06-27 International Business Machines Corporation Collaborative search of databases
US11269972B2 (en) 2016-05-31 2022-03-08 Target Brands, Inc. Date-specific webpage versions
US10360622B2 (en) 2016-05-31 2019-07-23 Target Brands, Inc. Method and system for attribution rule controls with page content preview
US10546302B2 (en) 2016-06-30 2020-01-28 Square, Inc. Logical validation of devices against fraud and tampering
US10373167B2 (en) 2016-06-30 2019-08-06 Square, Inc. Logical validation of devices against fraud
CN109844717B (zh) 2016-08-14 2023-05-23 利维帕尔森有限公司 用于移动应用程序的实时远程控制的系统和方法
US10496993B1 (en) 2017-02-15 2019-12-03 Square, Inc. DNS-based device geolocation
US10552308B1 (en) 2017-06-23 2020-02-04 Square, Inc. Analyzing attributes of memory mappings to identify processes running on a device
US10678831B2 (en) * 2017-08-31 2020-06-09 Ca Technologies, Inc. Page journey determination from fingerprint information in web event journals
US10715536B2 (en) 2017-12-29 2020-07-14 Square, Inc. Logical validation of devices against fraud and tampering
US10977670B2 (en) * 2018-01-23 2021-04-13 Mass Minority Inc. Method and system for determining and monitoring brand performance based on paid expenditures
US11138276B2 (en) * 2018-06-27 2021-10-05 At&T Intellectual Property I, L.P. Method and apparatus for generating a search query for a search engine
US10942979B2 (en) * 2018-08-29 2021-03-09 International Business Machines Corporation Collaborative creation of content snippets
US11494762B1 (en) 2018-09-26 2022-11-08 Block, Inc. Device driver for contactless payments
US11507958B1 (en) 2018-09-26 2022-11-22 Block, Inc. Trust-based security for transaction payments
SG11202112609TA (en) * 2019-02-19 2021-12-30 Zirca Digital Solutions Pvt Ltd A platform for providing relevant content on targeted url's and method thereof
US11281733B2 (en) 2019-03-14 2022-03-22 Microsoft Technology Licensing, Llc Selective presentation of rich experiences in search
WO2023057988A1 (en) * 2021-10-08 2023-04-13 Graphite Growth, Inc. Generation and use of content briefs for network content authoring

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166099A (ja) * 1997-08-15 1999-03-09 Nippon Telegr & Teleph Corp <Ntt> 検索機能付代理情報提供装置および情報検索システム
JP2001084256A (ja) * 1999-09-10 2001-03-30 Toshiba Corp データベース処理装置、データベース処理方法、及びデータベース処理プログラムを記録したコンピュータ読み取り可能な記憶媒体
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
JP2002259371A (ja) * 2001-03-02 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> 文書要約方法および装置と文書要約プログラムおよび該プログラムを記録した記録媒体
JP2002334104A (ja) * 2001-05-07 2002-11-22 Sony Corp 情報配信システム、情報配信サーバ、クライアント、情報送信方法、受信方法、並びにプログラム
JP2003058572A (ja) * 2001-08-10 2003-02-28 Seiko Epson Corp マルチメディア情報システム及びコンピュータプログラム
JP2003141155A (ja) * 2001-11-06 2003-05-16 Pfu Ltd Webページ検索システムおよびWebページ検索プログラム
JP2003178092A (ja) * 2001-12-10 2003-06-27 Mitsubishi Electric Corp 情報検索システム、情報提供装置及び情報検索方法並びにプログラム
JP2003271647A (ja) * 2002-03-18 2003-09-26 Toshiba Corp 閲覧ファイルデータ提供方法、閲覧頻度データ提供方法、そのための中継装置、プログラム及び記録媒体

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5446919A (en) 1990-02-20 1995-08-29 Wilkins; Jeff K. Communication system and method with demographically or psychographically defined audiences
US5898434A (en) 1991-05-15 1999-04-27 Apple Computer, Inc. User interface system having programmable user interface elements
DE69315969T2 (de) 1992-12-15 1998-07-30 Sun Microsystems Inc Darstellung von Informationen in einem Anzeigesystem mit transparenten Fenstern
US5956030A (en) 1993-06-11 1999-09-21 Apple Computer, Inc. Computer system with graphical user interface including windows having an identifier within a control region on the display
US5642484A (en) 1994-05-13 1997-06-24 Captive Communications, Inc. Pump top advertisement distribution and display system with performance and sales information feedback
JPH10508964A (ja) 1994-11-08 1998-09-02 バーミア、テクノロジーズ、インコーポレーテッド 料金設定機能を有するオンラインサービス開発ツール
US6026368A (en) 1995-07-17 2000-02-15 24/7 Media, Inc. On-line interactive system and method for providing content and advertising information to a targeted set of viewers
US5823879A (en) 1996-01-19 1998-10-20 Sheldon F. Goldberg Network gaming system
US5794259A (en) 1996-07-25 1998-08-11 Lextron Systems, Inc Apparatus and methods to enhance web browsing on the internet
US5933811A (en) 1996-08-20 1999-08-03 Paul D. Angles System and method for delivering customized advertisements within interactive communication systems
US6253188B1 (en) 1996-09-20 2001-06-26 Thomson Newspapers, Inc. Automated interactive classified ad system for the internet
US5854897A (en) 1996-12-27 1998-12-29 Quantum Systems, Inc. Network communications marketing system
US6285987B1 (en) 1997-01-22 2001-09-04 Engage, Inc. Internet advertising system
US5796952A (en) 1997-03-21 1998-08-18 Dot Com Development, Inc. Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database
US6144944A (en) 1997-04-24 2000-11-07 Imgis, Inc. Computer system for efficiently selecting and providing information
US5937037A (en) 1998-01-28 1999-08-10 Broadpoint Communications, Inc. Communications system for delivering promotional messages
US6073105A (en) 1997-06-13 2000-06-06 Tele-Publishing, Inc. Interactive personals online network method and apparatus
US6029141A (en) 1997-06-27 2000-02-22 Amazon.Com, Inc. Internet-based customer referral system
US6078916A (en) 1997-08-01 2000-06-20 Culliss; Gary Method for organizing information
JP3000972B2 (ja) 1997-08-18 2000-01-17 日本電気株式会社 情報提供装置及びプログラムを記録した機械読み取り可能な記録媒体
US6119098A (en) 1997-10-14 2000-09-12 Patrice D. Guyot System and method for targeting and distributing advertisements over a distributed network
US6222520B1 (en) 1997-12-31 2001-04-24 At&T Corp. Information display for a visual communication device
US6163778A (en) 1998-02-06 2000-12-19 Sun Microsystems, Inc. Probabilistic web link viability marker and web page ratings
US6421675B1 (en) 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6133912A (en) 1998-05-04 2000-10-17 Montero; Frank J. Method of delivering information over a communication network
WO1999060504A1 (en) 1998-05-15 1999-11-25 Unicast Communications Corporation A technique for implementing browser-initiated network-distributed advertising and for interstitially displaying an advertisement
JPH11328724A (ja) * 1998-05-18 1999-11-30 Fuji Photo Film Co Ltd 3次元光メモリ
US6141010A (en) 1998-07-17 2000-10-31 B. E. Technology, Llc Computer interface method and apparatus with targeted advertising
US6324569B1 (en) 1998-09-23 2001-11-27 John W. L. Ogilvie Self-removing email verified or designated as such by a message distributor for the convenience of a recipient
US6297819B1 (en) 1998-11-16 2001-10-02 Essential Surfing Gear, Inc. Parallel web sites
US6084628A (en) 1998-12-18 2000-07-04 Telefonaktiebolaget Lm Ericsson (Publ) System and method of providing targeted advertising during video telephone calls
JP2000242392A (ja) 1999-02-12 2000-09-08 Dbm Korea:Kk 動的な情報ディスプレイのためのコンピュータシステム及びその方法
US6321209B1 (en) 1999-02-18 2001-11-20 Wired Solutions, Llc System and method for providing a dynamic advertising content window within a window based content manifestation environment provided in a browser
US6314457B1 (en) 1999-04-21 2001-11-06 Airclic, Inc. Method for managing printed medium activated revenue sharing domain name system schemas
US6269361B1 (en) 1999-05-28 2001-07-31 Goto.Com System and method for influencing a position on a search result list generated by a computer network search engine
US6502076B1 (en) 1999-06-01 2002-12-31 Ncr Corporation System and methods for determining and displaying product promotions
US6681247B1 (en) * 1999-10-18 2004-01-20 Hrl Laboratories, Llc Collaborator discovery method and system
CA2384315A1 (en) 1999-11-11 2001-05-17 United Virtualities, Inc. Computerized advertising method and system
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US6480837B1 (en) * 1999-12-16 2002-11-12 International Business Machines Corporation Method, system, and program for ordering search results using a popularity weighting
US6401075B1 (en) 2000-02-14 2002-06-04 Global Network, Inc. Methods of placing, purchasing and monitoring internet advertising
KR100618997B1 (ko) 2000-04-10 2006-08-31 삼성전자주식회사 홈 페이지 광고 방법
US6718365B1 (en) 2000-04-13 2004-04-06 International Business Machines Corporation Method, system, and program for ordering search results using an importance weighting
US20020010626A1 (en) 2000-05-22 2002-01-24 Eyal Agmoni Internert advertising and information delivery system
JP2003534599A (ja) 2000-05-24 2003-11-18 エスポッティング・(ユーケイ)・リミテッド 検索装置と検索方法
AU2001264965A1 (en) 2000-05-26 2001-12-11 Exitexchange Corporation Post-session internet advertising system
US20040225716A1 (en) * 2000-05-31 2004-11-11 Ilan Shamir Methods and systems for allowing a group of users to interactively tour a computer network
US6795856B1 (en) * 2000-06-28 2004-09-21 Accountability International, Inc. System and method for monitoring the internet access of a computer
US6529903B2 (en) * 2000-07-06 2003-03-04 Google, Inc. Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query
US7062488B1 (en) 2000-08-30 2006-06-13 Richard Reisman Task/domain segmentation in applying feedback to command control
GB2368935A (en) * 2000-11-14 2002-05-15 Itt Mfg Enterprises Inc Updating a searchable database of descriptive information describing information stored at a plurality of addressable logical locations
US7194454B2 (en) 2001-03-12 2007-03-20 Lucent Technologies Method for organizing records of database search activity by topical relevance
AU2002254476A1 (en) 2001-03-30 2002-10-15 Fpba Group, Llc Network banner advertisement system and method
TW531702B (en) * 2001-04-23 2003-05-11 Tendy Information Corp Collection and management method for network information
US7216290B2 (en) 2001-04-25 2007-05-08 Amplify, Llc System, method and apparatus for selecting, displaying, managing, tracking and transferring access to content of web pages and other sources
US7219139B2 (en) 2001-06-29 2007-05-15 Claria Corporation System and method for using continuous messaging units in a network architecture
US7149704B2 (en) * 2001-06-29 2006-12-12 Claria Corporation System, method and computer program product for collecting information about a network user
US20030046150A1 (en) 2001-08-01 2003-03-06 Jamie Ader System and method of advertiser-subsidized customizable ordering and delivery of multimedia products
US7565367B2 (en) * 2002-01-15 2009-07-21 Iac Search & Media, Inc. Enhanced popularity ranking
US9235849B2 (en) * 2003-12-31 2016-01-12 Google Inc. Generating user information for use in targeted advertising
US20040024756A1 (en) 2002-08-05 2004-02-05 John Terrell Rickard Search engine for non-textual data
US8086559B2 (en) 2002-09-24 2011-12-27 Google, Inc. Serving content-relevant advertisements with client-side device support
TWI220719B (en) * 2002-12-30 2004-09-01 Inventec Corp Computer network system providing intelligent on-line data search function and enhancing linking performance of network nodes
US7225184B2 (en) 2003-07-18 2007-05-29 Overture Services, Inc. Disambiguation of search phrases using interpretation clusters
US20050097088A1 (en) 2003-11-04 2005-05-05 Dominic Bennett Techniques for analyzing the performance of websites
US20050222982A1 (en) 2004-03-31 2005-10-06 Paczkowski Remigiusz K System and method for responding to search requests in a computer network
US20060136524A1 (en) 2004-12-20 2006-06-22 Claria Corporation Method and device for backing up cookies

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166099A (ja) * 1997-08-15 1999-03-09 Nippon Telegr & Teleph Corp <Ntt> 検索機能付代理情報提供装置および情報検索システム
JP2001084256A (ja) * 1999-09-10 2001-03-30 Toshiba Corp データベース処理装置、データベース処理方法、及びデータベース処理プログラムを記録したコンピュータ読み取り可能な記憶媒体
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
JP2002259371A (ja) * 2001-03-02 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> 文書要約方法および装置と文書要約プログラムおよび該プログラムを記録した記録媒体
JP2002334104A (ja) * 2001-05-07 2002-11-22 Sony Corp 情報配信システム、情報配信サーバ、クライアント、情報送信方法、受信方法、並びにプログラム
JP2003058572A (ja) * 2001-08-10 2003-02-28 Seiko Epson Corp マルチメディア情報システム及びコンピュータプログラム
JP2003141155A (ja) * 2001-11-06 2003-05-16 Pfu Ltd Webページ検索システムおよびWebページ検索プログラム
JP2003178092A (ja) * 2001-12-10 2003-06-27 Mitsubishi Electric Corp 情報検索システム、情報提供装置及び情報検索方法並びにプログラム
JP2003271647A (ja) * 2002-03-18 2003-09-26 Toshiba Corp 閲覧ファイルデータ提供方法、閲覧頻度データ提供方法、そのための中継装置、プログラム及び記録媒体

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008181186A (ja) * 2007-01-23 2008-08-07 Yahoo Japan Corp クエリーログを利用したキーワードとサイトの関連度を求める方法
JP2010524141A (ja) * 2007-04-12 2010-07-15 マイクロソフト コーポレーション 履歴重要度のファクタリングによるドキュメントの重要度の計算
JP4746712B2 (ja) * 2007-04-12 2011-08-10 マイクロソフト コーポレーション 履歴重要度のファクタリングによるドキュメントの重要度の計算
JP2009003617A (ja) * 2007-06-20 2009-01-08 Denso Corp 携帯通信装置
US10951721B2 (en) 2010-12-20 2021-03-16 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
US11533379B2 (en) 2010-12-20 2022-12-20 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
US9596150B2 (en) 2010-12-20 2017-03-14 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
JP2017142802A (ja) * 2010-12-20 2017-08-17 ザ ニールセン カンパニー (ユー エス) エルエルシー 分散人口統計情報を使用してメディアインプレッション(media impressions)を決定するための方法及び装置
JP2016095866A (ja) * 2010-12-20 2016-05-26 ザ ニールセン カンパニー (ユー エス) エルエルシー 分散人口統計情報を使用してメディアインプレッション(mediaimpressions)を決定するための方法及び装置
US9979614B2 (en) 2010-12-20 2018-05-22 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
US10284667B2 (en) 2010-12-20 2019-05-07 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
US10567531B2 (en) 2010-12-20 2020-02-18 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
US11729287B2 (en) 2010-12-20 2023-08-15 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
US11218555B2 (en) 2010-12-20 2022-01-04 The Nielsen Company (Us), Llc Methods and apparatus to use client-server communications across internet domains to determine distributed demographic information for media impressions
JP2013015920A (ja) * 2011-06-30 2013-01-24 Fujitsu Ltd 情報処理装置、情報処理方法、および情報処理プログラム
JP2018537763A (ja) * 2015-10-27 2018-12-20 株式会社A1 Media Group インターネットコンテンツ提供サーバ及びその方法が具現化されたコンピュータで判読できる記録媒体
JP2019212345A (ja) * 2015-10-27 2019-12-12 株式会社A1 Media Group インターネットコンテンツ提供サーバ及びその方法が具現化されたコンピュータで判読できる記録媒体
JP2018023146A (ja) * 2017-09-19 2018-02-08 キヤノン株式会社 情報処理装置、その制御方法、プログラム
JP7021290B2 (ja) 2020-05-19 2022-02-16 ヤフー株式会社 推定装置、推定方法、及び推定プログラム
JP2020126694A (ja) * 2020-05-19 2020-08-20 ヤフー株式会社 推定装置、推定方法、及び推定プログラム

Also Published As

Publication number Publication date
WO2006023765A2 (en) 2006-03-02
US20060041553A1 (en) 2006-02-23
IL181323A0 (en) 2007-07-04
TWI386824B (zh) 2013-02-21
AU2005277210A1 (en) 2006-03-02
TW200630828A (en) 2006-09-01
NZ553287A (en) 2010-10-29
WO2006023765A3 (en) 2006-05-04
US20060041562A1 (en) 2006-02-23
KR20070053282A (ko) 2007-05-23
EP1779276A4 (en) 2007-08-29
EP1779276A2 (en) 2007-05-02
US7836009B2 (en) 2010-11-16
US7444358B2 (en) 2008-10-28
CA2577841A1 (en) 2006-03-02

Similar Documents

Publication Publication Date Title
JP2008511057A (ja) エンドユーザの情報要求に応答するための方法及び装置
US8255413B2 (en) Method and apparatus for responding to request for information-personalization
US20230164127A1 (en) Method and Device for Publishing Cross-Network User Behavioral Data
US6691106B1 (en) Profile driven instant web portal
US7801896B2 (en) Database access system
US7953740B1 (en) Detection of behavior-based associations between search strings and items
US8090621B1 (en) Method and system for associating feedback with recommendation rules
Eirinaki et al. Web mining for web personalization
US9020933B2 (en) Identifying inadequate search content
KR101245089B1 (ko) 검색에서의 키워드의 값을 결정하는 데이터베이스 검색시스템 및 방법
US20100299360A1 (en) Extrapolation of item attributes based on detected associations between the items
KR20070005873A (ko) 컴퓨터 네트워크에서의 위치들 및 문서들을 분류하는 방법및 시스템
Jian-guo et al. Web mining for electronic business application
KR20030063275A (ko) 인터넷 상에서의 타겟팅 광고를 위한 광고 시스템 및 방법
Haigang Study of Application of Web Mining Techniques in E-Business
Electronic-Business Search Engine Optimization for E-Business Website
Mahoui et al. User Content Mining Supporting Usage Content for Web Personalization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101227

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110420

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110405

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111222

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20111222

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120326

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20120420