JP4024426B2 - ネットワーク・ユーザによるウェブ・サイトの使用パターンの特性を記述し視覚化する方法 - Google Patents
ネットワーク・ユーザによるウェブ・サイトの使用パターンの特性を記述し視覚化する方法 Download PDFInfo
- Publication number
- JP4024426B2 JP4024426B2 JP14088899A JP14088899A JP4024426B2 JP 4024426 B2 JP4024426 B2 JP 4024426B2 JP 14088899 A JP14088899 A JP 14088899A JP 14088899 A JP14088899 A JP 14088899A JP 4024426 B2 JP4024426 B2 JP 4024426B2
- Authority
- JP
- Japan
- Prior art keywords
- web
- information
- hit
- file
- directory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/323—Visualisation of programs or trace data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
【発明の属する技術分野】
本発明は、例えば、ウェブ・サイトのコンテンツ・プロバイダによって使用されるウェブ・サイトへの訪問者が示す使用パターンを記述する情報を一覧的にまたは要約的に表示するツールに関する。
【0002】
【発明の分野】
ワールド・ワイド・ウェブ(World Wide Web)は、現在急速に増大する強い関心の対象である。
【0003】
ワールド・ワイド・ウェブは、インターネットのようなデータ通信ネットワークを通じてコンピュータ・ユーザにアクセス可能な相互接続されたデータ・ソースから構成されている。ワールド・ワイド・ウェブ上で利用可能なデータは、個人、企業、政府機関および特殊業界団体によって集められたものである。この集められた情報の多くはウェブ・ページとして構成される。ウェブ・サイトは、スポンサ企業(ここではサイト所有者という)が提供するウェブ・ページ(および、場合によっては、ウェブ・ページと共に一般にウェブ・コンポーネントと呼ばれる他のデータ)の集合である。
【0004】
大規模なウェブ・サイトは、通常、階層的に構成される。例えば、企業のウェブ・サイトは、各々親会社の業務単位に関する情報を提供する小さなウェブ・サイトからなっていることが多い。
【0005】
ウェブ・サイト自体は、1つかそれ以上のサーバ・ホストに存在している。サーバ・ホストに保存されたウェブ・コンポーネント(web component) が、ウェブ・サーバとして知られるソフトウェア・プログラムを通じてワールド・ワイド・ウェブのユーザに提供される。ネットワーク・ユーザは、クライアント・ホスト上で動作するソフトウェア・プログラムであるブラウザを通じてウェブ・サイトからデータをダウンロードする。ブラウザは、ウェブ・サイトとのコンタクトを確立し、サーバ・ホストに保存されたデータに対する要求を出す。これによってデータがサーバ・ホストからブラウザにダウンロードされる。このデータは、通常、ブラウザがウェブ・ページを表示するために必要な情報(すなわち、ページの構造を指定するフォーマット情報、またはページに配置される画像のURL)を指定するハイパーテキスト文書、ブラウザで実行される組込型のクライアント・ソフトウェア・プログラム(例えば、Java(登録商標、以下同じ)バイトコード)および、クライアント・コンピュータにダウンロードされるか、またはブラウザの機能に追加されたクライアント・ソフトウェア・プログラム(「ブラウザ・プラグイン」と呼ばれることがある)を通じて表示可能な他のコンテンツである。
【0006】
ウェブ・サイトの訪問は、時間的に連続した、固定したクライアント・ブラウザによる特定のウェブ・サーバからの一連のダウンロードとして定義される。訪問の過程でクライアント・ブラウザが行うウェブ・コンポーネントに対する各要求はヒットと呼ばれる(少なくとも場合によっては、異なる訪問を識別するためにあるクライアント・ブラウザによる成功したヒット間の休止期間を検討することが有益な場合がある。例えば、15分といったしきい値を超える休止期間は訪問の終了を示すと考えられる)。
【0007】
商業的なウェブ・サーバはログファイルにクライアントの要求を記録し、各ヒットの個別のエントリを生成する機能が選択できる。多くの場合、ログファイルは(少なくとも一時的には)サーバ・ホストに存在する。このファイルに収集された情報には、訪問したクライアントのホスト名またはホスト・アドレス、ヒットの時間および、要求されたデータ・ファイル名が含まれる。クライアントの要求の記録の例を以下に示す。
【0008】
147.atlanta-02.ga.dial-access.att.net ホスト名
-- ユーザIDと認証(ここでは図示しない)
[30/Nov/1997:00:03:09-0500] 日付と時間
GET 要求方法
/work/work.htlm 要求されたページ名
HTTP/1.0 使用プロトコル
200 戻りコード
9391 転送バイト数
http://biz.yahoo.com/lucent.html 参照ページ
Mozilla/2.02E(Macintosh;U;68K) 使用エージェント(ブラウザ)
【0009】
訪問者の立場から見ると、あるウェブ・サイトへの訪問がそのウェブ・サーバの最初の要求(入口点)によって開始され、多数の連続したダウンロードからなり、訪問者が(i)他のウェブ・サイトからのページの要求を開始するか、または(ii)ブラウジングを完全に停止したときに終了することが明らかである。訪問者の最終要求は出口点と呼ばれる。
【0010】
他方、サーバ・ホストは多くのユーザからのヒットを同時に経験し、全ての要求を時系列的に記録する。その結果、サーバ・ホストはログファイル中で別のクライアントからの訪問情報を混ぜてしまう。そのため、未処理のログファイル(raw logfile) を検討しても、どのヒットがどの訪問に対応するかすぐには明らかにならない。ある訪問の長ささえすぐには明らかにならない。この情報がないと使用パターンの高レベル要約の編集ができない。
【0011】
市販のソフトウェア・ツールの中にはウェブ・サイトの利用を記述したデータを要約し又は一覧で表示するものがある。こうしたパッケージは利用データを見るために専用クライアント・ソフトウェア・プログラムの実行を必要とするものが多い。
【0012】
こうしたツールの欠点の1つは、たとえ多くの地理的に離れた人々がウェブ・サイトの利用情報に正当な関心を有していても、この利用情報にアクセスできるのはクライアント・ソフトウェアをインストールしたユーザだけだということである。このグループには、例えば、コンテンツ・プロバイダ、ウェブ・デザイナ、さらには訪問者が含まれる。
【0013】
第2の欠点は、こうした専用クライアントによる手法は、各関係者でクライアント・プログラムをインストールし保守する費用ついて実用的でなくなっているということである。
【0014】
第3の欠点は、報告される情報の表示がウェブ・サイト自体の当面の状況から分離しているということである。すなわち、あるウェブ・ページに関する統計値からすぐにそのページ自体に移動するユーザには好都合であるが、何らかの望ましいページまたはそのページの表示内容から対応する統計値に移動するユーザには非常に不都合である。
【0015】
ハイパーテキスト文書の形態で、(最も一般的なもの等)選択されたページの利用に関するレポートを提供する他のソフトウェア・ツールもある。こうしたレポートの情報はユーザ側のブラウザによって表示され、選択されたウェブ・ページを見るリンクが提供される。しかし、こうしたソフトウェア・ツールもウェブ・ページから関連する統計値への使いやすいアクセスを提供することはできない。
【0016】
【発明の概要】
我々は、任意の選択されたウェブ・ページからそれに関連する利用情報、および利用情報の任意の選択された表示からそれに関連するウェブ・ページ(単数または複数)への高速で使いやすいアクセスのための機構を提供した。ウェブ・サイト・コンテンツと利用情報のそれぞれの表示は、例えば、ユーザのパーソナル・コンピュータの画面上に共存できる。(例えば、マウスのクリックによって)それぞれの表示の1つの中の関心のある項目を指定することによって、指定された項目に対応する別の表示中の情報が更新される。さらにこの機構によってそれぞれの表示の1つを他の表示と同期させることが容易に達成される。すなわち、ユーザが表示の1つを通じてブラウジングする際、もう1つの表示中の情報は自動的に更新され、第1の表示中の情報に対応する。
【0017】
すなわち、広範な態様では、本発明は、ウェブ・ページの利用に関する情報を表示するシステムを含む。本システムは、第1および第2のウェブ・サイトを含んでいる。第1のウェブ・サイトは、各々がウェブ・サイト・ディレクトリの名前を有する複数のウェブ・コンポーネント・ファイルを含んでいる。第2のウェブ・サイトは、各々が対応するウェブ・コンポーネント・ファイルまたはウェブ・コンポーネント・ファイルのサブディレクトリに関する利用情報を含む複数の統計値ファイルを含んでいる。本システムは、さらに、表示画面を有し、ユーザによって操作され、第1および第2のウェブ・サイトと通信する計算装置を備えている。この計算装置は、画面上にそれぞれのウェブ・サイトのウェブ・コンポーネントを表示する際有効なウェブ・ブラウザ・ソフトウェアの制御の下で動作する。重要なことだが、この計算装置は、何れかのウェブ・サイトから、ユーザが指定したウェブ・コンポーネントに対応するデータを要求し検索する際有効であり、他のウェブ・サイトのウェブ・コンポーネントのユーザ指定に応答して、何れかのウェブ・サイトにデータ要求を送る際有効である。
【0018】
この好ましいアクセス機構は、ウェブ・サイトと利用情報が保存されるデータベースとの間の関係を含んでいる。周知のように、各ウェブ・コンポーネント(すなわち、ウェブ・ページまたはその基本的なデータ構築ブロックの1つ)は、そのURLを通じてアクセス可能なファイルに存在している。本アクセス機構によれば、利用情報を含むデータベースは、各記録がウェブ・サイト・ディレクトリ中の対応するファイルの名前によって索引付け・検索されるように構成される。
【0019】
すなわち、本発明の特定の実施例では、各統計値ファイルは対応するウェブ・ファイルまたはウェブ・ファイルのサブディレクトリの名前によって索引付けされ、計算装置は、他のウェブ・サイトからのウェブ・コンポーネントのユーザ指定に応答して1つのウェブ・サイトにデータ要求を送る際、ファイルまたはファイル・ディレクトリの共通する名前を使用する。
【0020】
本発明の別の実施例によれば、それぞれの訪問毎に、ウェブ・サーバ・ログファイルから訪問情報を区別し、その情報から有益な利用統計値を抽出する機構がさらに提供される。
【0021】
<用語解説>
ブラウザ:クライアント・ホストで実行され、サーバ・ホストからウェブ・ページ等のデータを要求するために使用されるソフトウェア・プログラム。こうしたデータはクライアントのディスクにダウンロードされるか、またはブラウザによって画面上に表示される。
クライアント・ホスト:サーバ・ホストからウェブ・ページを要求し、かつ一般にブラウザ・プログラムを通じて通信を行うコンピュータ。
コンテンツ・プロバイダ:ウェブ・ページの集合を構成する情報の提供に責任を負う人物。
組込型のクライアント・ソフトウェア・プログラム:ウェブ・サイトの一部を含み、ブラウザにダウンロードされ、実行されるソフトウェア・プログラム。
ヒット:1つのウェブ・コンポーネントを要求するブラウザのイベント。
ホスト:インターネットのようなネットワークに接続されたコンピュータ。ホスト毎にホスト名(例えば、mypc.mycompany.com)と数字によるIPアドレス(例えば、123.104.35.12)を有する。
HTML(ハイパーテキスト・マークアップ言語(HyperText Markup Language)):ウェブ・ページを書くために使用される言語。未処理の状態ではHTMLはフォーマット・コマンドの挿入された通常のテキストのように見える。ブラウザの主要な機能はHTMLを読み、レンダリングすることである。
HTTP(ハイパーテキスト転送プロトコル(HyperText Transfer Protocol)):インターネットを通じてブラウザとウェブ・サーバ間でウェブ・ページ等のデータを交換するために使用されるプロトコル。
ハイパーテキスト(HyperText):他のウェブ・ページへのリンクによって注釈されたテキスト(例えば、HTML)。
IP(インターネット・プロトコル(Internet Protocol)):インターネットを管理する通信プロトコル。
ログファイル:ウェブ・サイト上に存在し、ウェブ・サーバが、ウェブ・コンポーネントを要求したブラウザに関する情報のログを記録するファイル。ログファイルは通常ヒット毎に1行を含む。
ページビュー:ウェブ・ページを構成するウェブ・コンポーネントの一部またはすべてをダウンロードし、ウェブ・ページを表示するブラウザのイベント。ページビューはいくつかのヒットからなることが多い。
参照ページ:訪問者を現在見ているデータに導いたハイパーテキスト・リンクを含むウェブ・ページのURL。大部分の市販のブラウザでは、「戻る」ボタンによって訪問者はこの参照ページに戻ることができる。
サーバ・ホスト:ウェブ・サーバ・プログラムを通じてウェブ・ページを送出するコンピュータ。
URL(ユニフォーム・リソース・ロケータ(Uniform Resource Locator)):ウェブ・コンポーネント等のデータのアドレス。URLは、サーバ・ホストとの通信で使用されるプロトコル、サーバ・ホストのIPアドレスおよび、サーバ・ホスト上の要求されたデータのロケーションを特定する。例えば、「http://www.lucent.com/work.html」は、サーバ・ホストwww.lucent.comにHTTP接続し、そこからウェブ・ページ(HTMLファイル)であるwork.htmlが要求されていることを規定する。
UWUサーバ:本発明との関連では、ウェブのトラフィックを記述する統計値の分配を担当する専用ウェブ・サーバ。
訪問:時間的に連続して発生する、(ブラウザを通じた)1人の人物による固定したウェブ・サーバへの一連の要求。
訪問者:ブラウザを操作し、それを通じてウェブ・サイトを訪問する人物。
ウェブ・コンポーネント:ウェブ・ページを構成する基本データ構築ブロック。ウェブ・コンポーネントはテキスト、ハイパーテキスト、画像、組込型のクライアント・ソフトウェア・プログラムまたは他の(例えば、QuickTime(登録商標)ビデオ等の)ブラウザによって表示可能なデータを含む。
ウェブ・デザイナ:通常グラフィカル・デザインに熟練し、ウェブ・ページのデザインを担当する人物。
ウェブ・マスタ:ホスト・サーバとウェブ・サーバ・プログラムの運用を維持する(通常、技術的に訓練された)人物。
ウェブ・ページ:ウェブ・サイト上のマルチメディア情報の標準的な一部分。ウェブ・ページは通常、画像等の他のウェブ・コンポーネントを含むHTML文書である。
ウェブ・サーバ:ウェブ・ページを送出する、サーバ・ホスト上で実行されるソフトウェア・プログラム。
ウェブ・サイト:1つまたは多数のサーバ・ホスト上に存在し、(例えば、www.lucent.comといった)同じホスト名を通じてアクセスできるウェブ・ページの集合。
【0022】
【発明の詳細な記述】
1.ウェブ利用情報の視認
図1を参照すると(また図1A−図1Cを参照すると)、クライアント10は、ネットスケープ・ナビゲータ(登録商標)、マイクロソフト・インターネット・エクスプローラ(登録商標)または他の同種の容易に入手できる標準ブラウザといったウェブ・ブラウザである。クライアント10はUWUサーバ20の記憶装置15に保存された利用統計値にアクセスするためには、データ・ブラウザとして機能するよう特に設定しなければならない。この設定は、UWUサーバ20から初期設定ページを要求することによって実行される。このページには、ウェブ・サイト25(表示を簡単にするため、参符25はこのウェブ・サイトに対応するサーバも示す)のウェブ・ページの通常のブラウジングを、UWUサーバ20に保存された利用統計値の検索および表示と統合する組込型クライアント・プログラムが含まれる。現行の実現では、Javaスクリプト1.2が使用され、この対話を管理する。
【0023】
使用の際、ウェブ・サイト25に属するウェブ・ページ(記憶装置27に保存されている)が、例えば、ユーザのパーソナル・コンピュータ(pc)の画面のブラウザ・ウィンドウ30に表示される。サイト25への訪問から収集された利用データがサーバ20から要求され、ブラウザ・ウィンドウ35および40に表示される。さらに、UWUサーバ20からの統計値情報が一連のレイヤ42を通じて直接ウィンドウ30の上に重ね合わされる。
【0024】
ウェブ・サイトのコンポーネントと利用情報の間の完全な対応を達成するには、データ・ブラウザ10の表示は同期されなければならない。例えば、ページ45のリンク(ブラウザ・ウィンドウ30に表示されているものとして示される)が選択される場合、要求されたURLがブラウザ・ウィンドウ30にダウンロードされるが、一方同時に要求されたURLに対応する利用情報が、ウィンドウ35および40と、レイヤ42に表示される。現行の実現では、Javaスクリプト1.2が使用され、ブラウザ・ウィンドウ30で発生する「クリック」イベントを傍受し、要求をサーバ20と25の両方に発送する。こうした要求は制御された通信リンク50、55および60によって指示される。ウィンドウ30のイベント「クリック」に応答してウィンドウ35および40とレイヤ42を更新する操作は、図の矢印65によって示される。
【0025】
クライアント10の中で、2つの別の種類の同期対話が可能になる。第1のに(図の矢印70によって示される)、ユーザはブラウザ・ウィンドウ35に表示されたハイパーテキスト・リンクを「クリック」し、関連URLのウィンドウ30へのロードを開始する。例えば、ウィンドウ35には、ブラウザ・ウィンドウ30に表示されたページを要求する訪問者がたどる、もっとも頻繁な参照ページのリストが含まれる。この種の利用情報はハイパーテキスト・リンクのリストとして表示されるので、「クリック」すると、ブラウザ・ウィンドウ30は(ウェブ・サイト25内外の)選択された参照ページに導かれる。
【0026】
通信分岐75および80によって示される、第2の統合された対話では、(分散グラフ、単純な表および木またはグラフによる表示といった)統計値の表示が使用され、ブラウザのウィンドウ42およびウィンドウ30を管理する。例えば、現行の実現では、ウィンドウ30に表示されたページにアクセスするすべての訪問の一覧又は要約(summary) が表示される。この一覧又は要約は補助ブラウザ・ウィンドウ40で見ることができる。
【0027】
一例として、ウィンドウ35は利用対時間(1日を単位とする)のグラフを示すが、そこではグラフに描かれた量は、(各日付の)訪問中に特定のページが要求される訪問の合計数である。グラフの特定の部分をクリックすることによって、ユーザは特定の日を選択することができる。それに応答して、補助ウィンドウ(単数または複数)40は、選択された日に行われたすべての訪問の一覧又は要約リストを表示する。この方法で補助ウィンドウを使用することによって、もとのグラフを消すことなく情報が表示される。
【0028】
さらにこの例を追求すると、ウィンドウ40で表示されるリンクは、記憶装置15に組み込まれたデータベースから訪問中に訪問者が出した実際の要求を検索する際有効である。ウィンドウ40で表示される表の各要素はブラウザ・ウィンドウ30を表示されたページに振り向けるHTMLリンクである。
【0029】
現行の実現では、統計値の表示はJavaで書かれ、Javaスクリプト1.2プロトコルを通じて他のブラウザ・ウィンドウと通信する。個別の表示(例えば、図示されるウィンドウ30、35および40)に加えて、データ・ブラウザは、上記のように、統計値情報を目に見えるオーバレイ(overlay) 42の形態で、例えば、ウィンドウ30に直接重ね合わせることができる。
【0030】
こうしたオーバレイの使用法の例の1つは、ページ30を要求する訪問者がたどる選択されたリンクのそれぞれの支持率を表示することである。例えば、リンクは、オーバレイ中で、各々の大きさが対応するリンクの相対的支持率を表すそれぞれの画像によってラベルを付けられる。この方法で容易にいろいろな大きさにすることのできる画像の1つは単純な丸印である。
【0031】
別の例としては、あるリンクを要求する母集団が分析され、企業コンテンツ・プロバイダの「顧客」、「競争相手」といった種類に分けられる。こうした様々な種類にわたる要求の相対的分布を示す棒グラフ等の図表画像が、オーバレイによって容易に重ね合わされる。
【0032】
また別の例では、それぞれのリンクを主として「コンテンツを提供するもの」または主として「ウェブの探索を支援するもの(aiding navigation)」として指定する記号が含まれる。また別の例では、オーバレイは、あるリンクに対応するウェブ・ページの小型ポップアップ・ビュー(pop-up view)を提供する。
【0033】
現行の実現では、Javaスクリプト1.2レイヤと、Javaスクリプト1.2リンク・オブジェクトに含まれる座標情報が使用され、オーバレイ42の位置を特定する。
【0034】
すなわち、上記で説明したように、オーバレイ42とウィンドウ30、35および40を使用することによって、ユーザは自然な方法で訪問者に関する情報を収集し、利用データを適切な脈絡で、すなわちウェブ・サイト25の実際のウェブ・ページの中で直接視覚化することができる。
【0035】
この点で、Javaスクリプト1.2レイヤとHTMLフレームが、異なったサーバからの情報を同じページに表示する機能を有していることに留意されたい。これを行うため必要なことは、単に各関連URLをSRCタグを通じてブラウザに提供するだけである。すなわち、当業技術分野に熟練した者が認識するように、ここで説明するようにウェブ・ページをその使用パターンに関する情報と同時に表示することは、市販のソフトウェアを使用して容易に実現可能である。
【0036】
本発明の大きな利点は、訪問者に関する情報がウェブ・サイト25のどのページからも容易に得られることである。これは、最も一般的なページに関する情報だけを収集する(かつ通常サブページのような小さなコンポーネントを無視する)従来技術のアプローチとは対照的である。特に、この制限された形の報告は、毎週数千から数十万、さらには数百万人の訪問者を引きつける大企業のサイトには不利である。こうした大きなトラフィックがあるにもかかわらず、企業内の個別の組織に対応するサブサイトは毎週数百人の訪問者しか迎えることができない。従来の制限された報告のアプローチでは、こうしたサイトは、通常、利用情報なしで運営するか、または専用報告ソフトウェアを使用することを余儀なくされているが、こうした専用ソフトウェアはウェブ・サイトを変更する度に再表示しなければならない。
【0037】
2.前処理
さらに図1を参照すると、前処理段85が有利にも適用され、記憶装置90から得られた未処理ログファイルから、利用統計値のオンライン・ブラウジングのために必要な、記憶装置15に存在するファイルを編集する。
【0038】
この図では、矢印95は未処理データを装置90から前処理装置85に導く操作を示し、矢印100は処理された記録を装置15に導く操作を示す。操作95と100は周期的に行われるので有利である。これらの操作の反復周期は通常1日1回である。しかし、この周期は本発明にとって本質的でなく、実際にはシステム設計者にはこの周期を任意に決定する大幅な裁量権がある。実際には、統計値の処理と更新を連続的に行うこともできる。
【0039】
例示としての実現では、前処理は次の4つの段階で実行される。
(1)ログ・データのフィルタリングとクリーニング。
(2)訪問の定義。
(3)シャドー・ディレクトリ・データベースの構築。
(4)訪問情報の階層的アカウンティング。
ここで、これらの各段階を簡単に説明する。
【0040】
2.1 フィルタリング:上記で言及したように、すべてのヒットはウェブ・サーバのよってログに記録される。しかし、さらに処理するためにはログの選択された行だけを保持するので、多くの場合有利である(特に、それによって以後操作され保存されるデータの量が減少し、経済性と速度が改善される)。この選択はログの任意のフィールドについて実行される。当業技術分野に熟練した者に周知のように、この選択は設定ファイルで容易に指定できる。このフィルタリングがどこで実行されるかは重要でない。現行の実現では、一例として、フィルタリングはUWUサーバによって実行される。
一例として、次のフィールドの一部またはすべてが前処理段階での処理の対象になる。
ホスト名:利用データにアクセスするユーザはそのウェブ・サイトへの自分自身のアクセスを除外することを希望するが、それはそうしないと統計値がゆがめられるからである。さらに、特に内部または外部の訪問者に焦点を当てるためにはこのフィールドでのフィルタリングが望ましい。
要求方法:一般的なウェブ・ブラウザは通常GET要求を使用してウェブ・ページをダウンロードするが、ウェブ・ロボット(またはウェブ・スパイダ(Web Spiders))といった、ページをダウンロードした後で索引付けする自動プログラムは代わりにHEAD要求を使用することが多い。こうしたプログラムによるアクセスを排除するため、ユーザはHEAD要求を除外することがある。
復帰コード:このフィールドは成功したダウンロードだけを保持するために使用される(通常200の復帰コードによって示される)。
ファイルの種類:通常のウェブ・ページは、画像または音声といった他のウェブ・コンポーネントと結合されたHTML文書からなっている。ページビューだけに関心がある場合、このフィールドを使用して画像または音声ファイル(一般に画像の場合なら“.gif”といったファイル拡張子を通じて識別できる)へのヒットを除外することができる。
【0041】
2.2 訪問の特定:いくつかの機構が使用されヒットを訪問にグループ分けする。1つの可能性はいわゆる“cookie”を使用することである。訪問者があるウェブ・サイトを初めて訪れると、ウェブ・サーバは固有の“cookie”をブラウザに与える。次のヒットの際ブラウザはこのcookieをウェブ・サーバに返送する。従って、決まった訪問者に由来するヒットはcookieによってグループ分けできる。この機構によって訪問を定義する確実な方法が得られる。しかし、ウェブ・ユーザが次第にcookieの使用および悪用に関心を持つようになり、現在のブラウザはユーザがcookie機構を無効にできるようになっている。従って、この機構の使用はこの目的のためだけに制限されている。
【0042】
cookieを使用せずにウェブ・サイトへの訪問者を追跡する方法には、いわゆるcgi(共通ゲートウェイ・インタフェース(Common Gateway Interface))機構を通じて各ウェブ・コンポーネントを提供することが含まれる。すなわち、初めて訪問者がサイトに来ると、固有の番号がそのユーザに割り当てられる(初めてかどうかは、その要求に訪問者番号機構が含まれないという事実によって識別され、2回目以降の要求にはすべて含まれる)。ここで要求されたページはcgi機構を通じて提供され、そのページのすべての内部リンクは、固有の訪問者番号を含む適当なcgiリンクに変更される。その結果、その後のすべての要求はcgi機構を通じて行われ、提供されるすべてのページはしかるべく変更されたリンクを有する。ここで訪問者番号によって訪問者の確実な追跡が可能になる。
【0043】
現行の実現で使用されるもう1つの機構はログファイル中の情報だけから訪問シーケンスを推論する。ヒットの間隔が選択された時間間隔T(通常10分間だが、この間隔の設定には大幅な自由裁量の範囲がある)より短く、それらが同じホストからの訪問を生じるものである場合、ヒットは結合されて特定の訪問シーケンスになる。
【0044】
この機構は良好に動作することが多いことが発見された。しかし、同じホストを通じて行動する2つかそれ以上のユーザが同時に同じウェブ・サイトのページを要求する場合誤った結果を生じることがある。これは通常、ユーザ要求がいわゆる「プロキシ(proxy) 」マシンによってグループ分けされている場合に発生する。個々のユーザはプロキシだけからページを要求するが、プロキシはページをキャッシュし、新しいページを実際のウェブ・サーバから要求する。ウェブ・サーバはプロキシからの要求だけを見るので、この方法では同じプロキシを使用する異なった訪問者を区別することはできない。しかし、この状況が発生するのはあまり頻繁でないことが発見されている。
【0045】
ヒットを訪問にグループ分けするより高度な方法も使用される。例えば、ヒットが別のウェブ・サイトのウェブ・ページの参照フィールドを有する場合、これは新しい訪問が開始されたことを示すものとして受け取られる。また、同じプロキシを使用する2つの訪問者が同じウェブ・サイトを同時に訪問する場合でも、それらが見ているウェブ・サイトの部分が異なっていることがあるので、訪問者がダウンロードする実際のウェブ・コンポーネントによって訪問者を区別することができる。
【0046】
さらに、ブラウザがサーバと通信する追加情報を利用する方法もある。例えば、HTTPプロトコルでは、ブラウザは、他の種類の情報と共に次の情報を提供できる。
(1)使用されるブラウザの種類、そのバージョンおよびプラットフォームの種類。
(2)画面の解像度。
(3)ブラウザが表示できるウェブ・コンポーネントの種類。
従って、これらのフィールドの何れかが異なるユーザを区別することができる。
【0047】
以下の議論では、ユーザを区別するために使用される情報がユーザ・タグに結合されると想定される。図2を参照すると、ここでヒット(変数“hitnr ”によって索引付けされる)をそれぞれの訪問(変数“visitnr ”によって索引付けされる)に組み合わせる手順の例が説明される。
【0048】
行がログから順次検索される(囲み105)。検索された新しい行は現在のヒットである。各々の新しいヒットについて訪問者タグが構成される(囲み110)。この訪問者タグが新しい訪問に属するかが判定される(囲み115)。すなわち、現在開いている訪問がすべて作業メモリに記憶される。訪問者タグが現在開いているどの訪問にも属していない場合その訪問は新しい。
【0049】
訪問が新しいと判断された場合、新しい訪問者記録データ構造が作業メモリに作成され、現在のヒットとhitnr がデータ構造に追加される(囲み120)。訪問が新しくないと判断された場合、ヒットとhitnr は訪問者タグによって特定された現在開いている訪問者記録に追加される(囲み125)。(これに関して、新しい訪問を開始した以前の訪問者は新しい訪問者として扱われることに留意されたい。)新しい訪問者記録データ構造が各々作成されると、順次索引番号(visitnr )が対応する訪問に割り当てられる(囲み130)。
【0050】
次に、現在開いている訪問の何れかが時間切れになっているかが判定される。現在開いている訪問記録の各々について、記録にある最終ヒットの時間が現在のヒットの時間から引き算される(囲み135)。差がしきい値Tより大きい場合、その訪問は時間切れと考えられる。訪問が時間切れの場合、その訪問の記録はディスクの訪問データベースに追加され、作業メモリから除去される(囲み140)。visitnr はディスク記憶装置に送信されたデータに含まれる。
【0051】
その後、次のヒットが検索され、処理が繰り返される。同じ訪問タグを有するヒットは、その間隔が時間間隔Tより短い限り時系列順に追加される。
【0052】
2.3 シャドー・ディレクトリの構築:次に、訪問データベースは処理されて記憶装置15に存在する新しいデータベースになるが、これはシャドー・ディレクトリ・データベース(shadow-directory database)と呼ばれる。
【0053】
階層型ファイル構造に組織されることが、ウェブ・コンポーネントを含むファイルの一般的な特徴である。この階層型ファイル構造への対応がシャドー・ディレクトリ・データベースに組み込まれるので、その記録はウェブ・サーバ上の対応するファイルの名前によって検索できる。
【0054】
一例として、この対応は、対応するウェブ・ページ・ファイルとして、シャドー・ディレクトリ・データベースでも同じファイル名を使用することによって達成される。また、当業技術分野に熟練した者が認識するように、この対応は、シャドー・ディレクトリ・データベースのファイルを対応するウェブ・ページ・ファイルに関連させる周知のデータベース技術を使用して容易に達成される。
【0055】
その結果、ウェブ・サイト・ディレクトリ中の各ファイルは、シャドー・ディレクトリ・データベース中に固有の相当物を有することになる。上記で説明した対応は、シャドー・ディレクトリ・データベースを並列ウェブ・サイト(parallel Web site) として操作することによって、シャドー・ディレクトリ・データベースからの情報のオンライン検索を促進する際、有益である。
【0056】
シャドー・ディレクトリ・データベース中の各ファイルには、対応するウェブ・コンポーネントに対してなされたヒットに関して編集された情報が含まれる。図3を参照すると、ここでこの情報を編集する方法が説明される。
【0057】
今度は各訪問記録が検索される(囲み145)。各訪問記録について、そこに含まれる各ヒットの情報が記録される。すなわち、ダウンロードされたウェブ・コンポーネントのファイル名(囲み150)とヒットに関する他の情報が、hitnr指標、visitnr指標、前後のヒットのファイル名および現在のヒットと次のヒットの間の時間間隔(囲み155)と共に記録される。
【0058】
一度構築されると、シャドー・ディレクトリ・データベースは、単に対応するファイルにアクセスすることによって、特定のウェブ・コンポーネントへのすべてのヒットへの即時アクセスを提供する。
【0059】
シャドー・ディレクトリを構築する上記で説明した処理は、シャドー・ディレクトリ・ファイルを何回も開いたり閉じたりする必要があるため、場合によっては望ましくないほど遅いことがある。この理由で、少なくとも場合によっては、まずヒットにhitnr、visitnrおよび「前」と「後」のフィールドという注釈を付けてからファイル名によって(すなわち要求されたウェブ・ファイルの名前によって)ヒットを分類する方が有利なことがある。この方法ではシャドー・ディレクトリの各ファイルを開閉する必要が生じるのは一度だけである。その後、所与のウェブ・ファイルの各々に関連するすべての記録が、ひとまとめに対応するシャドー・ディレクトリ・ファイルにロードされる。
【0060】
すなわち、例えば、図4に示すように、シャドー・ディレクトリ・データベースは、ここでは分類された記録の各収集を検索することによって構築される(囲み160)ので有利である。それぞれのウェブ・コンポーネントのファイル名が記録される(囲み165)。つぎに収集中の注釈されたヒット記録の各々についてヒット情報が記録される(囲み170)。
【0061】
以下は“shadow/card.html”と名付けられた架空のシャドー・ディレクトリ・ファイル中の、注釈の例を付した行の例である。
pool044-max1.sc-ca-us.dialup.earthlink.net ホスト名
- ユーザID[ここでは示されない]
1/05/1998 23:43:09 日付と時間
/card.html アクセスされたファイル
200 戻りコード
14176 転送バイト
/work.html 前のファイル
/contact/contact.html 次のファイル
78 時間間隔(単位:秒)
【0062】
例えば、本発明の代替としての実施例では、シャドー・ディレクトリ・データベースは、訪問者の記録全体ではなく、visitnr指標を保存するだけで十分なことに留意されたい。完全な記録は保存しなくとも、visitnrによって、UWUサーバに存在する訪問データベースから容易に検索できる。このスキームは重複を避け、ディスク空間の節約に役立つ。
【0063】
2.4 階層型アカウンティング:シャドー・ディレクトリの構築後、前処理が有利にもさらに行われる。第1の段階では、図5に示されているように、ここでは各シャドー・ディレクトリ・ファイルが処理される。各ファイルについて、一定時間のヒットの数、「前」と「後」のヒットの分布および、使われた時間の分布が計算され保存される(囲み175)。対応するウェブ・ファイルのヒットを含む各訪問について、有利にも指標visitnrも保存される。これに関して、訪問者は1回の訪問でウェブ・コンポーネントを何回もダウンロードすることがあるため、ファイルへの訪問は通常ファイルへのヒットより少ないことに留意されたい。
【0064】
第2の段階では、図6を参照すると、ファイル木中の各ディレクトリについて、ディレクトリ・レベルの情報が計算される(ステップ176)。これは、木の最下層レベルのサブディレクトリに始まり、階層的に行われる。各ディレクトリについて、そのディレクトリとそのサブディレクトリ中のすべてのファイルに対する一定時間のヒットの合計数が記録される。訪問のvisitnr指標をディレクトリ中のファイルに併合することによって、各ディレクトリ中のファイルへの個々の訪問者の数を数えることも有利である。
【0065】
ディレクトリ・レベルの記録には特に何らかの1つのファイルに関連するものはないので、各該当するディレクトリ中に、この情報を含む別のファイルが作成される(ステップ177)(現行の実現では、こうしたファイルの各々を“UWU.info”という名前で表すことが好都合であることが発見された)。すなわち、各UWU.infoファイルには、特に、一定期間に累積したヒット数と訪問数が含まれる。
【0066】
すなわち、図7を参照すると、ディレクトリ・レベルの情報は、ウェブ・ファイル木中の各ディレクトリ(180、180.1〜180.3)についてファイル190中に提供される。この図では、シャドー・ディレクトリ・データベースの対応するディレクトリは、それぞれ180’、180.1’〜180.3’という番号が付けられている。木の最下層レベルのサブディレクトリには180.3、180.3’という番号が付けられていることが示される。各ウェブ・ファイル185には、シャドー・ディレクトリ・データベース中のファイル185’が対応する。
【0067】
図の概念的な助けとして、各ファイル190を表す記号は、さらに低いレベルのファイル190の記号を含むものとして描かれ、その情報が(完全または部分的に)コンポーネント要素として含まれる。
【図面の簡単な説明】
【図1】例示としての実施例における本発明によるウェブ・サイト利用情報を検索し表示するシステムを示すブロック図である。
【図1A】図1のウィンドウ30の表示の例の詳細を示す図である。
【図1B】図1のウィンドウ35の表示の例の詳細を示す図である。
【図1C】図1のウィンドウ40の表示の例の詳細を示す図である。
【図2】本発明により、ヒット情報を集めて訪問記録にする例示としての手順の流れ図である。
【図3】本発明により、シャドー・ディレクトリ・データベースを構築する例示としての手順の流れ図である。
【図4】シャドー・ディレクトリを構築する代替手順の流れ図である。
【図5】ある実施例において、本発明により、シャドー・ディレクトリ・データベースをさらに処理する例示としての手順の流れ図である。
【図6】ある実施例において、本発明により、ディレクトリ・レベルの利用情報を編集する例示としての手順の流れ図である。
【図7】例示としてのウェブ・サイトとその対応するシャドー・ディレクトリ・データベースのトリー・ダイヤグラムを示す図である。シャドー・ディレクトリの木構造には、ディレクトリ・レベルの利用情報を含む追加ファイルが含まれる。
Claims (1)
- ウェブ・サイトへの訪問に関する情報のデータベースを構築する方法であって、該ウェブ・サイトは、ディレクトリとサブディレクトリを有するファイル・ディレクトリ構造に組織されたウェブ・コンポーネントからなっており、該方法は、
a)未処理のヒット記録を検索する段階と、該未処理ヒット記録の各々は、該ウェブ・サイトの特定のウェブ・コンポーネントへのアクセス要求記録であり、
b)該未処理ヒット記録の各々からフィルタリングされたヒット記録を作成するために、該未処理ヒット記録から選択された情報を抽出する段階と、該選択された情報は、該ヒット記録のそれぞれが関連するウェブ・コンポーネントを特定する情報を含むのもであり、
c)フィルタリングされたそれぞれのヒット記録をそれらの各々が属する訪問に従って区別し、そしてフィルタリングされた各ヒット記録に訪問指標を付与する段階と、
d)フィルタリングされたヒット記録各々を添付された訪問指標の対応するものとを関連させ、且つ、複数のヒットのシーケンスと関連する情報を含むような方法で、該フィルタリングされた複数のヒット記録を、対応するウェブ・コンポーネントと同じファイル名を用いてデータ記憶装置に階層的に記憶してシャドウファイル・ディレクトリ構造を構成し、対応するウェブ・コンポーネントのサブディレクトリ又はディレクトリとファイル名を参照することによって該フィルタリングされたヒット記録を検索可能であるようする段階と、
e)該シャドウファイル・ディレクトリにおける最下層サブディレクトリから最上層ディレクトリに階層的に進み、そして各サブディレクトリとディレクトリについて、該サブディレクトリまたはディレクトリに関連する全てのウェブ・コンポーネントに関して一定期間に累積されたヒット数と訪問数を含む集合的な利用情報の記録のそれぞれを編集する段階と、
f)該集合的な利用情報記録を該シャドウディレクトリ構造において該データ記憶装置に記憶する段階と、そして
g)該フィルタリングされたヒット記録と該集合的な利用情報記録を別なウェブ・サイトとして組織する段階とからなることを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/082792 | 1998-05-21 | ||
US09/082,792 US6182097B1 (en) | 1998-05-21 | 1998-05-21 | Method for characterizing and visualizing patterns of usage of a web site by network users |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000040046A JP2000040046A (ja) | 2000-02-08 |
JP4024426B2 true JP4024426B2 (ja) | 2007-12-19 |
Family
ID=22173497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14088899A Expired - Fee Related JP4024426B2 (ja) | 1998-05-21 | 1999-05-21 | ネットワーク・ユーザによるウェブ・サイトの使用パターンの特性を記述し視覚化する方法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US6182097B1 (ja) |
EP (1) | EP0959419A3 (ja) |
JP (1) | JP4024426B2 (ja) |
CA (1) | CA2267451C (ja) |
Families Citing this family (126)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6108637A (en) * | 1996-09-03 | 2000-08-22 | Nielsen Media Research, Inc. | Content display monitor |
US7523191B1 (en) * | 2000-06-02 | 2009-04-21 | Yahoo! Inc. | System and method for monitoring user interaction with web pages |
JP3485253B2 (ja) * | 1999-06-18 | 2004-01-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報処理方法、情報端末支援サーバ、情報処理プログラムを格納する記憶媒体 |
AUPQ206399A0 (en) | 1999-08-06 | 1999-08-26 | Imr Worldwide Pty Ltd. | Network user measurement system and method |
US7035926B1 (en) * | 1999-11-30 | 2006-04-25 | International Business Machines Corporation | Real-time monitoring of web activities |
US6864904B1 (en) * | 1999-12-06 | 2005-03-08 | Girafa.Com Inc. | Framework for providing visual context to www hyperlinks |
FR2807604B1 (fr) * | 2000-04-07 | 2003-08-01 | Netvalue | Procede pour la mesure d'activite des utilisateurs de terminaux wap |
EP1113381A1 (en) * | 1999-12-30 | 2001-07-04 | Alexander Dresen | Method and system for tracking web usage and internet applications |
US6996612B1 (en) | 1999-12-30 | 2006-02-07 | Vignette Corporation | Method of providing information related to activity of a user and a data processing system program product |
US6691104B1 (en) * | 2000-01-12 | 2004-02-10 | International Business Machines Corporation | System and method for personalizing and applying a post processing tool system |
WO2001052462A2 (en) | 2000-01-12 | 2001-07-19 | Jupiter Media Metrix, Inc. | System and method for estimating prevalence of digital content on the world-wide-web |
US6665658B1 (en) * | 2000-01-13 | 2003-12-16 | International Business Machines Corporation | System and method for automatically gathering dynamic content and resources on the world wide web by stimulating user interaction and managing session information |
US20020004749A1 (en) | 2000-02-09 | 2002-01-10 | Froseth Barrie R. | Customized food selection, ordering and distribution system and method |
WO2001067304A1 (en) * | 2000-03-07 | 2001-09-13 | Hotlens.Com Inc. | Server-side web browsing and multiple lens system, method and apparatus |
WO2001071523A1 (en) * | 2000-03-20 | 2001-09-27 | Hotlens.Com Inc. | Transparent user and session management for web applications |
WO2001084351A2 (en) * | 2000-04-28 | 2001-11-08 | Inceptor, Inc. | Method of and system for enhanced web page delivery |
US8086697B2 (en) * | 2005-06-28 | 2011-12-27 | Claria Innovations, Llc | Techniques for displaying impressions in documents delivered over a computer network |
US7475404B2 (en) | 2000-05-18 | 2009-01-06 | Maquis Techtrix Llc | System and method for implementing click-through for browser executed software including ad proxy and proxy cookie caching |
US7962603B1 (en) * | 2000-06-06 | 2011-06-14 | Nobuyoshi Morimoto | System and method for identifying individual users accessing a web site |
US6882977B1 (en) * | 2000-07-31 | 2005-04-19 | Hewlett-Packard Development Company, L.P. | Method and facility for displaying customer activity and value |
US6904461B1 (en) * | 2000-10-19 | 2005-06-07 | Unitel Technologies, Inc. | Method for making time-sensitive determinations of traffic intensity for a visitable site |
GB0027280D0 (en) | 2000-11-08 | 2000-12-27 | Malcolm Peter | An information management system |
US20020062223A1 (en) * | 2000-11-21 | 2002-05-23 | Netiq Corporation | System and method for adding network traffic data to a database of network traffic data |
US6928474B2 (en) * | 2000-12-14 | 2005-08-09 | Honeywell International, Inc. | Using a probability associative matrix algorithm to modify web pages |
US20060288212A1 (en) * | 2001-03-20 | 2006-12-21 | Gutenberg Printing Llc | Transparent user and session management for web applications |
US20020186237A1 (en) * | 2001-05-16 | 2002-12-12 | Michael Bradley | Method and system for displaying analytics about a website and its contents |
US7139972B2 (en) * | 2001-07-26 | 2006-11-21 | International Business Machines Corporation | Preemptive downloading of web pages with terms associated with user interest keywords |
US6963874B2 (en) * | 2002-01-09 | 2005-11-08 | Digital River, Inc. | Web-site performance analysis system and method utilizing web-site traversal counters and histograms |
US6973492B2 (en) * | 2001-09-07 | 2005-12-06 | International Business Machines Corporation | Method and apparatus for collecting page load abandons in click stream data |
US7376730B2 (en) * | 2001-10-10 | 2008-05-20 | International Business Machines Corporation | Method for characterizing and directing real-time website usage |
US20030101160A1 (en) * | 2001-11-26 | 2003-05-29 | International Business Machines Corporation | Method for safely accessing shared storage |
US7216056B2 (en) * | 2001-12-06 | 2007-05-08 | C-Live, Inc. | Access log analyzer and access log analyzing method |
US20030131097A1 (en) * | 2002-01-09 | 2003-07-10 | Stephane Kasriel | Interactive path analysis |
US20030131106A1 (en) * | 2002-01-09 | 2003-07-10 | Stephane Kasriel | Web-page performance toolbar |
US20030128231A1 (en) * | 2002-01-09 | 2003-07-10 | Stephane Kasriel | Dynamic path analysis |
US7631035B2 (en) * | 2002-01-09 | 2009-12-08 | Digital River, Inc. | Path-analysis toolbar |
US20030149567A1 (en) * | 2002-02-04 | 2003-08-07 | Tony Schmitz | Method and system for using natural language in computer resource utilization analysis via a communications network |
US20030202009A1 (en) * | 2002-04-24 | 2003-10-30 | Stephane Kasriel | Integration toolbar |
US7069515B1 (en) * | 2002-05-21 | 2006-06-27 | Claria Corporation | Method and apparatus for displaying messages in computer systems |
US20040098229A1 (en) * | 2002-06-28 | 2004-05-20 | Brett Error | Efficient click-stream data collection |
JP4369868B2 (ja) | 2002-06-28 | 2009-11-25 | オムニチャー, インク. | サイト訪問パスデータの取得および表示 |
US8271778B1 (en) | 2002-07-24 | 2012-09-18 | The Nielsen Company (Us), Llc | System and method for monitoring secure data on a network |
SE0202718L (sv) | 2002-09-12 | 2004-01-20 | Admeta Ab | Anordning för indikering av nedladdning av en datapost |
US7853684B2 (en) * | 2002-10-15 | 2010-12-14 | Sas Institute Inc. | System and method for processing web activity data |
US7603341B2 (en) | 2002-11-05 | 2009-10-13 | Claria Corporation | Updating the content of a presentation vehicle in a computer network |
US20040122939A1 (en) * | 2002-12-19 | 2004-06-24 | Russell Perkins | Method of obtaining economic data based on web site visitor data |
US7603373B2 (en) * | 2003-03-04 | 2009-10-13 | Omniture, Inc. | Assigning value to elements contributing to business success |
US20050216844A1 (en) * | 2004-03-03 | 2005-09-29 | Error Brett M | Delayed transmission of website usage data |
US7441195B2 (en) * | 2003-03-04 | 2008-10-21 | Omniture, Inc. | Associating website clicks with links on a web page |
US7519704B2 (en) * | 2003-04-28 | 2009-04-14 | International Business Machines Corporation | Filtering non-invasive data collection |
US7480716B2 (en) * | 2003-04-28 | 2009-01-20 | International Business Machines Corporation | Non-invasive collection of data |
US9081863B2 (en) | 2005-06-03 | 2015-07-14 | Adobe Systems Incorporated | One-click segmentation definition |
US7991732B2 (en) | 2005-06-03 | 2011-08-02 | Adobe Systems Incorporated | Incrementally adding segmentation criteria to a data set |
US8255514B2 (en) * | 2003-11-04 | 2012-08-28 | Covenant Eyes, Inc. | Internet use monitoring system and method |
US8170912B2 (en) | 2003-11-25 | 2012-05-01 | Carhamm Ltd., Llc | Database structure and front end |
US20050198315A1 (en) * | 2004-02-13 | 2005-09-08 | Wesley Christopher W. | Techniques for modifying the behavior of documents delivered over a computer network |
US7584435B2 (en) * | 2004-03-03 | 2009-09-01 | Omniture, Inc. | Web usage overlays for third-party web plug-in content |
US7707265B2 (en) * | 2004-05-15 | 2010-04-27 | International Business Machines Corporation | System, method, and service for interactively presenting a summary of a web site |
US8255413B2 (en) * | 2004-08-19 | 2012-08-28 | Carhamm Ltd., Llc | Method and apparatus for responding to request for information-personalization |
US8078602B2 (en) * | 2004-12-17 | 2011-12-13 | Claria Innovations, Llc | Search engine for a computer network |
US7693863B2 (en) * | 2004-12-20 | 2010-04-06 | Claria Corporation | Method and device for publishing cross-network user behavioral data |
US8645941B2 (en) | 2005-03-07 | 2014-02-04 | Carhamm Ltd., Llc | Method for attributing and allocating revenue related to embedded software |
US20060235965A1 (en) * | 2005-03-07 | 2006-10-19 | Claria Corporation | Method for quantifying the propensity to respond to an advertisement |
US8073866B2 (en) * | 2005-03-17 | 2011-12-06 | Claria Innovations, Llc | Method for providing content to an internet user based on the user's demonstrated content preferences |
US8578041B2 (en) * | 2005-06-03 | 2013-11-05 | Adobe Systems Incorporated | Variable sampling rates for website visitation analysis |
US8538969B2 (en) * | 2005-06-03 | 2013-09-17 | Adobe Systems Incorporated | Data format for website traffic statistics |
US7941394B2 (en) * | 2005-06-03 | 2011-05-10 | Adobe Systems Incorporated | User interface providing summary information or a status pane in a web analytics tool |
US7761457B2 (en) | 2005-06-06 | 2010-07-20 | Adobe Systems Incorporated | Creation of segmentation definitions |
US7908254B2 (en) * | 2005-06-10 | 2011-03-15 | Hewlett-Packard Development Company, L.P. | Identifying characteristics in sets of organized items |
US20070061869A1 (en) * | 2005-07-25 | 2007-03-15 | Dehaas Ronald J | Access of Internet use for a selected user |
US7383334B2 (en) * | 2005-10-28 | 2008-06-03 | Omniture, Inc. | Comparison of website visitation data sets generated from using different navigation tools |
US20070156923A1 (en) * | 2005-12-29 | 2007-07-05 | Webex Communications, Inc. | Methods and apparatuses for tracking progress of an invited participant |
US7941525B1 (en) | 2006-04-01 | 2011-05-10 | ClickTale, Ltd. | Method and system for monitoring an activity of a user |
US8775919B2 (en) | 2006-04-25 | 2014-07-08 | Adobe Systems Incorporated | Independent actionscript analytics tools and techniques |
US7992135B1 (en) * | 2006-06-26 | 2011-08-02 | Adobe Systems Incorporated | Certification of server-side partner plug-ins for analytics and privacy protection |
US8352917B2 (en) * | 2006-06-26 | 2013-01-08 | Adobe Systems Incorporated | Web-beacon plug-ins and their certification |
US8868533B2 (en) | 2006-06-30 | 2014-10-21 | International Business Machines Corporation | Method and apparatus for intelligent capture of document object model events |
US8127000B2 (en) | 2006-06-30 | 2012-02-28 | Tealeaf Technology, Inc. | Method and apparatus for monitoring and synchronizing user interface events with network data |
US8949406B2 (en) * | 2008-08-14 | 2015-02-03 | International Business Machines Corporation | Method and system for communication between a client system and a server system |
US8583772B2 (en) | 2008-08-14 | 2013-11-12 | International Business Machines Corporation | Dynamically configurable session agent |
US7644375B1 (en) | 2006-09-18 | 2010-01-05 | Adobe Systems Incorporated | Dynamic path flow reports |
US8620952B2 (en) | 2007-01-03 | 2013-12-31 | Carhamm Ltd., Llc | System for database reporting |
US9405830B2 (en) * | 2007-02-28 | 2016-08-02 | Aol Inc. | Personalization techniques using image clouds |
US10169781B1 (en) | 2007-03-07 | 2019-01-01 | The Nielsen Company (Us), Llc | Method and system for generating information about portable device advertising |
US20080299895A1 (en) * | 2007-05-31 | 2008-12-04 | University Of Georgia Research Foundation, Inc. | Systems and Methods for Providing Information to Exhibition Visitors |
US8042055B2 (en) | 2007-08-31 | 2011-10-18 | Tealeaf Technology, Inc. | Replaying captured network interactions |
US9946722B2 (en) * | 2007-11-30 | 2018-04-17 | Red Hat, Inc. | Generating file usage information |
US7890511B2 (en) * | 2008-02-05 | 2011-02-15 | Blue Coat Systems, Inc. | System and method for conducting network analytics |
US20090327913A1 (en) * | 2008-06-27 | 2009-12-31 | Microsoft Corporation | Using web revisitation patterns to support web interaction |
US8341540B1 (en) | 2009-02-03 | 2012-12-25 | Amazon Technologies, Inc. | Visualizing object behavior |
US8250473B1 (en) * | 2009-02-03 | 2012-08-21 | Amazon Technoloies, Inc. | Visualizing object behavior |
US8234582B1 (en) | 2009-02-03 | 2012-07-31 | Amazon Technologies, Inc. | Visualizing object behavior |
US9934320B2 (en) | 2009-03-31 | 2018-04-03 | International Business Machines Corporation | Method and apparatus for using proxy objects on webpage overlays to provide alternative webpage actions |
US8930818B2 (en) * | 2009-03-31 | 2015-01-06 | International Business Machines Corporation | Visualization of website analytics |
US8214390B2 (en) * | 2009-06-03 | 2012-07-03 | Yahoo! Inc. | Binary interest vector for better audience targeting |
US8533532B2 (en) | 2010-06-23 | 2013-09-10 | International Business Machines Corporation | System identifying and inferring web session events |
US9031863B2 (en) * | 2010-08-19 | 2015-05-12 | Yahoo! Inc. | Contextual advertising with user features |
US8938534B2 (en) | 2010-12-30 | 2015-01-20 | Ss8 Networks, Inc. | Automatic provisioning of new users of interest for capture on a communication network |
US9058323B2 (en) | 2010-12-30 | 2015-06-16 | Ss8 Networks, Inc. | System for accessing a set of communication and transaction data associated with a user of interest sourced from multiple different network carriers and for enabling multiple analysts to independently and confidentially access the set of communication and transaction data |
CN103384864B (zh) | 2011-02-22 | 2016-12-14 | 国际商业机器公司 | 渲染内容的方法和系统 |
US8972612B2 (en) | 2011-04-05 | 2015-03-03 | SSB Networks, Inc. | Collecting asymmetric data and proxy data on a communication network |
US9563714B2 (en) | 2011-06-16 | 2017-02-07 | Microsoft Technology Licensing Llc. | Mapping selections between a browser and the original file fetched from a web server |
US9460224B2 (en) | 2011-06-16 | 2016-10-04 | Microsoft Technology Licensing Llc. | Selection mapping between fetched files and source files |
US9753699B2 (en) | 2011-06-16 | 2017-09-05 | Microsoft Technology Licensing, Llc | Live browser tooling in an integrated development environment |
US10061860B2 (en) * | 2011-07-29 | 2018-08-28 | Oath Inc. | Method and system for personalizing web page layout |
US20130091214A1 (en) * | 2011-10-08 | 2013-04-11 | Broadcom Corporation | Media social network |
US9350762B2 (en) | 2012-09-25 | 2016-05-24 | Ss8 Networks, Inc. | Intelligent feedback loop to iteratively reduce incoming network data for analysis |
US9635094B2 (en) | 2012-10-15 | 2017-04-25 | International Business Machines Corporation | Capturing and replaying application sessions using resource files |
US9536108B2 (en) | 2012-10-23 | 2017-01-03 | International Business Machines Corporation | Method and apparatus for generating privacy profiles |
US8793236B2 (en) | 2012-11-01 | 2014-07-29 | Adobe Systems Incorporated | Method and apparatus using historical influence for success attribution in network site activity |
US9535720B2 (en) | 2012-11-13 | 2017-01-03 | International Business Machines Corporation | System for capturing and replaying screen gestures |
US10474735B2 (en) | 2012-11-19 | 2019-11-12 | Acoustic, L.P. | Dynamic zooming of content with overlays |
US9247273B2 (en) | 2013-06-25 | 2016-01-26 | The Nielsen Company (Us), Llc | Methods and apparatus to characterize households with media meter data |
US20150067472A1 (en) * | 2013-08-28 | 2015-03-05 | F5 Networks, Inc. | Web browser fingerprinting |
WO2015123201A1 (en) | 2014-02-11 | 2015-08-20 | The Nielsen Company (Us), Llc | Methods and apparatus to calculate video-on-demand and dynamically inserted advertisement viewing probability |
US9830593B2 (en) | 2014-04-26 | 2017-11-28 | Ss8 Networks, Inc. | Cryptographic currency user directory data and enhanced peer-verification ledger synthesis through multi-modal cryptographic key-address mapping |
US9516001B2 (en) | 2014-09-30 | 2016-12-06 | The Nielsen Company (Us), Llc | Methods and apparatus to identify media distributed via a network |
US10219039B2 (en) | 2015-03-09 | 2019-02-26 | The Nielsen Company (Us), Llc | Methods and apparatus to assign viewers to media meter data |
US9848224B2 (en) | 2015-08-27 | 2017-12-19 | The Nielsen Company(Us), Llc | Methods and apparatus to estimate demographics of a household |
US10546036B2 (en) * | 2016-02-26 | 2020-01-28 | International Business Machines Corporation | Web browser having improved navigational functionality |
US10594577B2 (en) | 2016-12-19 | 2020-03-17 | Cisco Technology, Inc. | Sorting and displaying network traffic analytics |
US10476790B2 (en) | 2016-12-19 | 2019-11-12 | Cisco Technology, Inc. | Service chaining at a network device |
US10791355B2 (en) | 2016-12-20 | 2020-09-29 | The Nielsen Company (Us), Llc | Methods and apparatus to determine probabilistic media viewing metrics |
US10965596B2 (en) | 2017-10-04 | 2021-03-30 | Cisco Technology, Inc. | Hybrid services insertion |
US10965598B1 (en) | 2017-10-04 | 2021-03-30 | Cisco Technology, Inc. | Load balancing in a service chain |
US11082312B2 (en) | 2017-10-04 | 2021-08-03 | Cisco Technology, Inc. | Service chaining segmentation analytics |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0991308A (ja) * | 1995-09-28 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 情報探索システム |
JPH09153059A (ja) * | 1995-11-30 | 1997-06-10 | Matsushita Electric Ind Co Ltd | 履歴表示装置 |
US5751956A (en) * | 1996-02-21 | 1998-05-12 | Infoseek Corporation | Method and apparatus for redirection of server external hyper-link references |
JPH09282210A (ja) * | 1996-04-15 | 1997-10-31 | Hitachi Ltd | データベース監視方法及びそのシステム |
JP3437373B2 (ja) * | 1996-04-16 | 2003-08-18 | 株式会社野村総合研究所 | 情報利用状況把握方法およびその方法を利用した情報提供システム |
US5935207A (en) * | 1996-06-03 | 1999-08-10 | Webtv Networks, Inc. | Method and apparatus for providing remote site administrators with user hits on mirrored web sites |
JP3996673B2 (ja) * | 1996-08-08 | 2007-10-24 | 義宇 江 | インターネット上の情報収集方法、および情報収集システム |
US5974572A (en) * | 1996-10-15 | 1999-10-26 | Mercury Interactive Corporation | Software system and methods for generating a load test using a server access log |
US5958008A (en) * | 1996-10-15 | 1999-09-28 | Mercury Interactive Corporation | Software system and associated methods for scanning and mapping dynamically-generated web documents |
US5870559A (en) * | 1996-10-15 | 1999-02-09 | Mercury Interactive | Software system and associated methods for facilitating the analysis and management of web sites |
US5875446A (en) * | 1997-02-24 | 1999-02-23 | International Business Machines Corporation | System and method for hierarchically grouping and ranking a set of objects in a query context based on one or more relationships |
JPH1185654A (ja) * | 1997-09-12 | 1999-03-30 | Matsushita Electric Ind Co Ltd | 仮想wwwサーバ装置およびカメラ制御可能なwwwサーバ装置 |
-
1998
- 1998-05-21 US US09/082,792 patent/US6182097B1/en not_active Expired - Lifetime
-
1999
- 1999-03-29 CA CA002267451A patent/CA2267451C/en not_active Expired - Fee Related
- 1999-05-10 EP EP99303604A patent/EP0959419A3/en not_active Ceased
- 1999-05-21 JP JP14088899A patent/JP4024426B2/ja not_active Expired - Fee Related
-
2000
- 2000-06-06 US US09/588,488 patent/US6449604B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6449604B1 (en) | 2002-09-10 |
JP2000040046A (ja) | 2000-02-08 |
EP0959419A2 (en) | 1999-11-24 |
US6182097B1 (en) | 2001-01-30 |
CA2267451C (en) | 2002-04-30 |
CA2267451A1 (en) | 1999-11-21 |
EP0959419A3 (en) | 2003-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4024426B2 (ja) | ネットワーク・ユーザによるウェブ・サイトの使用パターンの特性を記述し視覚化する方法 | |
US7013323B1 (en) | System and method for developing and interpreting e-commerce metrics by utilizing a list of rules wherein each rule contain at least one of entity-specific criteria | |
US6983320B1 (en) | System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages | |
US7596533B2 (en) | Personalized multi-service computer environment | |
US6401118B1 (en) | Method and computer program product for an online monitoring search engine | |
Eirinaki et al. | Web mining for web personalization | |
CA2530565C (en) | Server architecture and methods for persistently storing and serving event data | |
US7480694B2 (en) | Web playlist system, method, and computer program | |
CA2410747C (en) | System and method for saving browsed data | |
US8326986B2 (en) | System and method for analyzing web paths | |
US7194524B2 (en) | Information processing system, information disclosing server, and portal server | |
US20020147805A1 (en) | Software system and methods for generating and graphically representing web site usage data | |
CN1494680A (zh) | 收集高速缓存web内容的多样化web服务器活动数据 | |
US20020191015A1 (en) | Method and apparatus for managing history logs in a data processing system | |
Suresh et al. | An overview of data preprocessing in data and web usage mining | |
US7809858B1 (en) | Cross-protocol URL mapping | |
CA2349466C (en) | Method for characterizing and visualizing patterns of usage of a web site by network users | |
JP2005031867A (ja) | ウエブ情報収集装置及びウエブ情報収集方法 | |
JP3725088B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
Raiyani et al. | Enhance preprocessing technique Distinct user identification using web log usage data | |
JP3725087B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP3725837B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP3725836B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
EP1205857A2 (en) | Apparatus for retrieving data | |
Yesilada et al. | Experiments toward reverse linking on the web |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20040212 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040512 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040910 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20041025 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20041112 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070110 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071003 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101012 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101012 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111012 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111012 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121012 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121012 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131012 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |