JP2000105739A - サブジェクト・マップを形成し、該サブジェクト・マップに応じたインタ―ネット・デ―タを提供する方法及び装置 - Google Patents

サブジェクト・マップを形成し、該サブジェクト・マップに応じたインタ―ネット・デ―タを提供する方法及び装置

Info

Publication number
JP2000105739A
JP2000105739A JP11158445A JP15844599A JP2000105739A JP 2000105739 A JP2000105739 A JP 2000105739A JP 11158445 A JP11158445 A JP 11158445A JP 15844599 A JP15844599 A JP 15844599A JP 2000105739 A JP2000105739 A JP 2000105739A
Authority
JP
Japan
Prior art keywords
web page
subject
mapping
file
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11158445A
Other languages
English (en)
Inventor
Karen A Papierniak
エー パピエルニアク カレン
James E Thaisz
イー タイスズ ジェィムズ
Luo-Jen Chiang
チャング ルージェン
Paresh B Shah
ビー シャー パレッシュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR International Inc
Original Assignee
NCR International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=22078522&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2000105739(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by NCR International Inc filed Critical NCR International Inc
Publication of JP2000105739A publication Critical patent/JP2000105739A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【課題】本発明は、複数のウェブ・ページ・ファイルに
対するアクセス状況を示すデータ・レコードを含む一群
のログと共に使用される方法を提供する。 【解決手段】現在、ウェブサイトは、ウェブ・ブラウザ
からのリクエストに応じてアクセスされたファイルに対
するファイル・アクセス状況を示すインターネット・デ
ータを記憶している。残念乍ら、インターネット・デー
タは、リクエストが受信されて処理された時刻に従って
時間順に配置された一連の別個の非相関データ・レコー
ドとして保持される。故に、インターネット・データは
マネジメントおよびビジネス活動に対して有用なフォー
マットで配置されていない。本発明は、ウェブ・ページ
・ファイル(HTML、SHTML、DHTMLまたはCGIファイル)を
サブジェクト分野(スポーツ、ニュース、娯楽、レスト
ラン、ショッピング、コンピュータ関連、ビジネス、健
康、家族、旅行および天気など)と相関させる方法およ
び装置を提供する。この様にして、インターネット・デ
ータはマネジメントおよびビジネス活動に対して有用な
フォーマットで提供され得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、マネジメントおよびビ
ジネス活動に対して有用なフォーマットでインターネッ
ト・データを提供する方法および装置に関する。
【0002】
【従来の技術】情報テクノロジおよびネットワークのイ
ンフラストラクチャの発展により、非常に多くの商取引
がインターネット上で電子的に行われつつある。インタ
ーネットを利用して商取引を行うことは今や一般的であ
り、現在では企業および個人による電子商取引(または
インターネット商取引)として知られている。将来的に
ビジネスを行い且つ管理を行う上で電子商取引が大きな
影響を与えると予測するのは当然である。従って、電子
商取引環境における消費者の反応および判断プロセスを
研究して理解することには大きな関心が寄せられてい
る。
【0003】従来における商取引は店舗内で行われると
共に、伝統的なビジネス環境に対する消費者の反応およ
び判断プロセスを研究する方法および技術が存在した。
例えば小売業者は、四季の変化に応じて配置された陳列
棚に商品を陳列することができる。その配置に対する消
費者の反応を観察することにより、小売業者は陳列棚の
レイアウトを調整し、商品の販売を促進できる。
【0004】
【発明が解決しようとする課題】電子商取引環境におけ
る小売業者またはサービス提供者は典型的には、インタ
ーネットを介して(少なくともひとつのサーバを含む)ウ
ェブサイトにおいて商品またはサービスに関する情報を
表示する。詳細には、ウェブサイトの為のサーバはHTML
(ハイパーテキスト・マークアップ言語)ファイルなどの
一群のウェブ・ページ・ファイルに情報を記憶する。テ
キスト内容を含むことに加え、HTMLファイルは、ピクチ
ャおよびアイコンを表示すると共にオーディオ・メッセ
ージを演奏する為のグラフィックまたはオーディオ・フ
ァイル等の他形式ファイルへのリンクも含み得る。HTML
ファイルは更に、他のウェブ・ページ・ファイルへのリ
ンクも含み得る。他形式ファイルもまたサーバに記憶さ
れ得る。
【0005】ウェブ・ブラウザを利用することにより、
顧客(または潜在的な顧客)はウェブサイトを通じて遠隔
的にナビゲーションを行い、商品およびサービスに関す
る情報を入手しまたは選択した商品もしくはサービスを
注文する。残念乍ら伝統的なビジネス環境とは異なり、
現在の電子商取引環境においてウェブサイトのレイアウ
トの実効性を評価する信頼できる方法は無い。これは、
インターネット上では消費者の反応を観察すると共に消
費者の判断プロセスを分析することが困難だからであ
る。
【0006】歴史的にインターネットは開放構造として
設計されており、何らの制約無しに自由に情報交換を行
うのが主要目的である。ウェブサイトから(HTMLファイ
ルなどの)ウェブ・ページ・ファイルを獲得する為に、
ウェブ・ブラウザは先ずそのウェブサイトに対するサー
バに対してリクエストを送信する。このリクエストを受
信すると、サーバはリクエストされたHTMLファイルを検
索し、それを上記ウェブ・ブラウザに送信する。HTMLフ
ァイルを受信するとウェブ・ブラウザはHTMLファイルを
ウェブ・ページとして表示する。もしそのHTMLファイル
が(グラフィックまたはオーディオ・ファイルなどの)他
形式ファイルも含んでいれば、ブラウザは引き続き上記
サーバに対してこれらのファイルのリクエストを送信す
る。
【0007】リクエストを受信するとサーバはこれらの
ファイルを検索して上記ウェブ・ブラウザに送信する。
ブラウザはこれらのファイルを受信するとピクチャおよ
びアイコンをウェブ・ページ上に表示し、または、上記
ウェブ・ページに埋め込まれたオーディオ・ファイルを
演奏するアプリケーションを実行する。もしHTMLファイ
ルが別のHTMLファイルへのリンクを更に含んでいれば、
リンクをクリック(または起動)すると同時にブラウザは
そのHTMLファイルに対する更なるリクエストを上記サー
バに送信する。更なるリクエストを受信するとサーバは
そのHTMLファイルを検索してウェブ・ブラウザに送信す
る。尚、ブラウザはステートレス(stateless)にウェブ
サイトと交信することを銘記すべきである。
【0008】インターネット上では、特定のウェブサイ
トが数千個のブラウザによりランダムにアクセスされ
る。ブラウザがウェブサイトに対して一連のリクエスト
を送信している間、任意の二つの連続するリクエストの
間においてブラウザはそのウェブサイトに対して定常的
な接続を維持するのではない。サーバに対し、ブラウザ
は一連のリクエストに亙り制御を有するのでは無く;引
き続くリクエストは先行リクエストと何らの論理関係を
有さないこともあり;一連のリクエストが異なるウェブ
・ブラウザから到来することもあり;HTMLファイルに埋
め込まれたリンクからリクエストが発生することもあ
る。従って、インターネット上の電子商取引環境におけ
る顧客の行動および反応を継続的に観察することは困難
である。
【0009】現在の技術によれば、サーバにより一連の
リクエストが受信かつ処理されつつある間にウェブ・ペ
ージおよび他形式ファイルに対するアクセス状態データ
(すなわちインターネット・データ)を記録するメカニズ
ムが提供される。しかし乍ら、現在の技術は(ビジネ
ス、教育、ニュースなどの)サブジェクト分野(subjecta
rea)に従ってインターネット・データを系統化して提供
するメカニズムを有していない、と言うのも、インター
ネット・データは、リクエストが受信されて処理された
時刻に従って時間順に配置された一連の別個の非相関デ
ータ・レコードとして保持されるからである。
【0010】従って、マネジメントおよびビジネス活動
に対して有用なフォーマットでインターネット・データ
を提供する方法および装置に対する要望がある。また、
ウェブ・ページ・ファイルを、マネジメントおよびビジ
ネス活動に対して有用なサブジェクト分野にマッピング
する規則を定義する方法および装置に対する別の要望も
ある。更に、サブジェクト分野に従ってインターネット
・データを提供する方法および装置に対する要望もあ
る。
【0011】
【課題を解決するための手段】本発明の第1の見地に依
れば、請求項1に請求された方法が提供される。本発明
の第2の見地に依れば、請求項10に請求された方法が
提供される。本発明の第3の見地に依れば、請求項11
に請求された方法が提供される。本発明はまた、本発明
の第1、第2および第3の見地の各々に係る方法を実施す
る手段を備えたデータ処理装置も提供する。
【0012】本発明は、インターネット・データを処理
する新規な方法および関連装置を提供する。現在のウェ
ブサイトは、ウェブ・ブラウザからのリクエストに応じ
てアクセスされたファイルに対するファイル・アクセス
状況を示すインターネット・データを記憶できる。残念
乍らインターネット・データは、リクエストが受信され
て処理された時刻に従って時間順に配置された一連の別
個の非相関データ・レコードとして保持される。典型的
には、ウェブ・ページには他形式ファイルを更に埋め込
み得るウェブ・ページ・ファイルが結合されている。但
し、ウェブ・ページ・ファイルおよび該ウェブ・ページ
・ファイルに埋め込まれた他形式ファイルに対するアク
セス状況を示すデータ・レコードは複数のデータ・レコ
ードに分散される可能性がある。従って、インターネッ
ト・データはマネジメントおよびビジネス活動に対して
有用な手法で配置されていない。
【0013】(作用) 本発明はインターネット・デー
タを、マネジメントおよびビジネス活動に対して有用な
フォーマットで提供する。より詳細に述べれば本発明
は、一群のマッピング規則に従い、ビジネス、教育、ニ
ュース、健康、コンピュータ関連、旅行、天気、娯楽、
趣味およびスポーツなどのサブジェクト分野により、ウ
ェブ・ページ・ファイルに対するデータ・レコードを相
関させ得るものである。上記マッピング規則は、ユーザ
・インタフェースを介してユーザにより定義もしくは変
更され得る。
【0014】広範囲な見地において本発明は、複数のウ
ェブ・ページ・ファイルに対するアクセス状況を示すデ
ータ・レコードを含む一群のログと共に使用される方法
を提供する。該方法は、(a)ウェブ・ページ・ファイル
を分類する複数のサブジェクト分野を記憶するステップ
と、(b)上記データ・レコードを上記サブジェクト分野
にマッピングする複数のマッピング規則を記憶するステ
ップと、(c)上記ログからデータ・レコードを収集する
ステップと、(d)上記マッピング規則に基づいて上記デ
ータ・レコードを上記サブジェクト分野と相関させるス
テップと、を備えて成る。
【0015】本発明のこれらのおよび他の特徴および利
点は、例示的に与えられる以下の詳細な説明および添付
図面から明らかとなろう。当業者であれば、添付図面を
参照して以下の詳細な説明を参照することにより本発明
の目的および利点は明らかであろう。
【0016】本発明は、インターネット・データを提供
する新規な方法および関連装置を備えて成る。以下の説
明は当業者が本発明を実施して活用し得る如く提供され
ると共に特定の用途およびその要件に関して提供され
る。当業者であれば好適実施例に対する種々の変更は容
易に明らかであり、本明細書中で定義された原理は発明
の精神および範囲から逸脱すること無く他の実施例およ
び用途に適用され得る。従って、本発明は示された実施
例に限定されることを意図するものでなく、本明細書中
に開示された原理および特徴に一致する最大限の範囲に
従うものである。
【0017】図1を参照すると、インターネット105お
よびイントラネット(LAN−ローカル・エリア・ネットワ
ーク)107を含む本発明に従う好適なネットワーク・シス
テム100が示されている。インターネット105には、4個
のウェブサイトおよび4個のユーザ端末またはコンピュ
ータ(106.1、106.2、106.3および106.4)に対する4個の
サーバ(102.1、102.2、102.3および102.4)が接続されて
いる。イントラネット107には、4個のサーバ(102.1、1
02.2、102.3および102.4)およびデータ処理コンピュー
タ108が接続される。また、データ処理コンピュータ108
にはデータ保管装置118が接続される。
【0018】尚、本発明を記述する上で図1はインター
ネット105に接続された4個のサーバおよび4個のコン
ピュータのみを示していることを銘記されたい。実際に
は、インターネット105には数千のサーバおよびユーザ
・コンピュータが接続される。
【0019】4個のサーバ(102.1、102.2、102.3または
102.4)の各々は、夫々のウェブ・ページ格納器(103.1
103.2、103.3または103.4)および夫々のサーバ・ログ(1
04.1、104.2、104.3または104.4)を含んでいる。4個の
ウェブ・ページ格納器(103.1、103.2、103.3または103.
4)の各々は、(HTML、SHTML、DHTML、またはCGIファイル
などの)複数のウェブ・ページ・ファイルを記憶してい
る。ウェブ・ページ・ファイルは、(AVI、GIF、JPEGお
よびPNGファイルなどの)他形式ファイルへのリンクを含
み得る。(注意:HTMLはハイパーテキスト・マークアッ
プ言語を、SHTMLは秘密保護HTMLを、CGIは共通ゲートウ
ェイ・インタフェースを、GIFはグラフィック・インタ
ーチェンジ・フォーマットを、JPEGはジョイント・フォ
トグラフィック・エキスパート・グループを、AVIはオ
ーディオ・ビデオ・インタフェースを、且つ、PNGはポ
ータブル・ネットワーク・グラフィックを意味する。)
他形式ファイルもまた4個のサーバのひとつに記憶され
る。4組のサーバ・ログ(104.1、104.2、104.3または10
4.4)の各々は、アクセスされたまたはアクセスが試行さ
れたファイルのアクセス状況を示すアクセス状況データ
(すなわちインターネット・データ)を含んでいる。
【0020】4個のユーザ・コンピュータ(106.1、106.
2、106.3または106.4)の各々は夫々のウェブ・ブラウザ
(108.1、108.2、108.3または108.4)を実行するが、該ブ
ラウザの各々は、インターネット105を介して4個のサ
ーバの任意のものからファイルを獲得してこれらのファ
イルをウェブ・ページ・フォーマットで表示できる。サ
ーバからウェブ・ページ・ファイルを獲得する為に、ウ
ェブ・ブラウザはサーバに対してGetリクエストを送信
する。Getリクエストは、ブラウザが実行されているユ
ーザ・コンピュータを識別するIPアドレス、および、UR
L(ユニフォーム・リソース・ロケータ)を含んでいる。U
RLは、上記ウェブ・ページ・ファイルの名称およびパス
(path)を含んでいる。Getリクエストを受信するとサー
バは、Getリクエスト内のURLに従ってウェブ・ページ・
ファイルを検索する共に、Getリクエスト内のIPアドレ
スにより指定された(上記ブラウザが実行されつつある)
ユーザ・コンピュータに対してウェブ・ページ・ファイ
ルを送信する。
【0021】このときにサーバは、ウェブ・ページ・フ
ァイルに対するアクセス状況データをサーバ・ログに記
録する。上記ウェブ・ページ・ファイルを受信するとウ
ェブ・ブラウザはそれをウェブ・ページとして表示す
る。もし上記ウェブ・ページ・ファイルが他形式ファイ
ルへのリンクを含むのであればブラウザはGetリクエス
トを更にサーバに送信することから、これらのファイル
は獲得されてウェブ・ページ・ファイルと共に表示され
る。ウェブ・ページ・ファイル内に埋め込まれたリンク
は、これらのファイルの名称およびパスを含んでいる。
これらファイルをブラウザに送信した後、サーバはこれ
らのファイルに対するアクセス状況データをサーバ・ロ
グ内に記録する。もし上記ウェブ・ページ・ファイルが
別のウェブ・ページ・ファイルへのリンクを更に含むの
であれば、リンクのクリック(起動)に応じてブラウザは
Getリクエストをサーバに送信し、そのウェブ・ページ
・ファイルが獲得されて新たなウェブ・ページが表示さ
れ得る。このリンクはそのウェブ・ページ・ファイルの
名称およびパスを含んでいる。このウェブ・ページ・フ
ァイルを(ブラウザが実行されつつある)ユーザ・コンピ
ュータに送信した後、サーバはそのウェブ・ページ・フ
ァイルに対するアクセス状況データをサーバ・ログ中に
記録する。
【0022】図1においてブラウザ(108.1、108.2、10
8.3および108.4)はステートレスにサーバ(102.1、10
2.2、102.3および102.4)と交信する。また、ウェブ・ブ
ラウザ(108.1、108.2、108.3および108.4)は、サーバ(1
02.1、102.2、102.3および102.4)に対してランダムにリ
クエストを送信する。ブラウザ(108.1、108.2、108.3
たは108.4)はサーバ(102.1、102.2、102.3または102.4)
に対して一連のリクエストを送信する間、任意の二つの
連続するリクエストの間においてサーバへの定常的な接
続を維持するのではない。サーバに対し、ブラウザは一
連のリクエストに亙り制御を有するのでは無く;引き続
くリクエストは先行リクエストと何らの論理関係を有さ
ないこともあり;一連のリクエストが異なるウェブ・ブ
ラウザから到来することもあり;ウェブ・ページ・ファ
イルに埋め込まれたリンクからリクエストが発生するこ
ともある。従って、インターネット・データは、リクエ
ストが受信されて処理された時刻に従って時間順に配置
された一連の別個の非相関データ・レコードとして保持
される。故に、更なる処理を行わずに4群のサーバ・ロ
グ(104.1、104.2、104.3および104.4)中に記憶されたイ
ンターネット・データは、マネジメントおよびビジネス
活動に対して有用なものでは無い。
【0023】図1に示された如くデータ処理コンピュー
タ108は、ユーティリティ・アプリケーション112、ペー
ジ・マップ113、サブジェクト(コンテキスト)マップ11
4、サブジェクト(コンテキスト)ページ・マップ115、お
よびローディング・ユーティリティ116を含んでいる。
イントラネット107を介してユーティリティ・アプリケ
ーション112は4組のサーバ・ログ(104.1、104.2、104.
3および104.4)に対してアクセスし、それらからデータ
を収集し、収集されたデータを処理し、処理されたデー
タをページ・マップ113、サブジェクト・マップ114およ
びサブジェクト・ページ・マップ115に記憶する。ロー
ディング・ユーティリティ116は、更なる処理の為にペ
ージ・マップ113、コンテキスト・マップ114およびコン
テキスト・ページ・マップ115からのデータをデータ保
管装置118にロードできる。
【0024】図2を参照すると、ウェブ・ページ・ファ
イル(HTML、SHTML、DHTML、またはCGIファイル)201と結
合されたウェブ・ページ200の一部が示されている。図
2に示された如く、ウェブ・ページ200の一部は次の6
個の領域を含んでいる:テキスト領域202;GIFファイル
へのリンク205と結合されたグラフィック領域204;JPEG
ファイルへのリンク207と結合されたグラフィック領域2
06;AVIファイルへのリンク209と結合されたマルチメデ
ィア領域208;ウェブ・ページ200の他の部分へのリンク
215と結合された領域214;および、別のウェブ・ページ
・ファイルへのリンク217と結合された領域216、であ
る。上記リンク205、207、209、215および217はウェブ
・ページ・ファイル201内に埋め込まれる。
【0025】図3を参照すると、サーバ・ログ(104.1
104.2、104.3または104.4)内の複数の好適なデータ・レ
コードが或る程度詳細に示されている。図3に示された
如く4個のレコードJ1−4は、ウェブ・ページ・ファイ
ル201と、該ウェブ・ページ・ファイル201にリンクされ
た他形式ファイル(GIF、JPEGおよびAVIファイル)に対す
るアクセス状況を示している。4個のレコード(J1−4)
を生成する処理をより良く記述する為に、次のことを仮
定する:(1)ウェブ・ページ・ファイル201はページ格納
器102.1内に記憶され、(2)ウェブ・ページ・ファイル20
1はブラウザ108.1によりアクセスされており;(3)サー
バ102.1はサーバ・ログ104.1内にレコードJ1−4を生成
し;且つ、(4)4個のブラウザ(108.1、108.2、108.3
よび108.4)の全てがサーバ102.1に対してGetリクエスト
を送信している。
【0026】ウェブ・ページ・ファイル201を獲得する
為にブラウザ108.1はインターネット105を介してGetリ
クエストをサーバ102.1に送信する。このGetリクエスト
は、ユーザ・コンピュータ106.1に割当てられたIPアド
レスと、ウェブ・ページ・ファイル201の名称およびパ
スを示すURLとを含んでいる。Getリクエストを受信する
とサーバ102.1はウェブ・ページ格納器103.1からウェブ
・ページ・ファイル201を検索すると共に、上記Getリク
エスト内に含まれたIPアドレスに従ってインターネット
105を介してユーザ・コンピュータ106.1に該ウェブ・ペ
ージ・ファイル201を送信する。
【0027】一方、サーバ102.1は、ウェブ・ページ・
ファイル201に対するアクセス状況を示す情報をレコー
ドJ1に記憶する。ウェブ・ページ・ファイル201内にはG
IF、JPEGおよびAVIファイルに対するリンク205、207お
よび209が夫々埋め込まれていることから、ウェブ・ブ
ラウザ108.1はサーバ102.1に対して3個のGetリクエス
トを更に送信する。リンク205、207および209は夫々、G
IF、JPEGおよびAVIファイルの名称およびパスを含んで
いる。ユーザ・コンピュータ106.1に割当てられたIPア
ドレスを含むことに加え、3個のGetリクエストはGIF、
JPEGおよびAVIファイルの夫々の名称およびパスを含ん
でいる。3個のGetリクエストを受信するとサーバ102.1
はGIF、JPEGおよびAVIファイルをウェブ・ページ格納器
103.1から検索し、これらのファイルを、Getリクエスト
内に含まれたIPアドレスに従ってインターネット105を
介してユーザ・コンピュータ106.1へと送信する。
【0028】一方、サーバ102.1はGIF、JPEGおよびAVI
ファイルに対するアクセス状況を示す情報をレコード
J2、J3およびJ4内に夫々記憶する。図3に示された如
く、データ・レコードJ1−4はサーバ・ログ104.1内の他
のレコードに亙り分散されている、と言うのも、4個の
ブラウザ(108.1、108.2、108.3および108.4)の全てがGe
tリクエストをサーバ102.1に送信しており、各サーバ・
ログ104.1内のデータ・レコードはGetリクエストがサー
バ102.1により受信されて処理される時間に従って時間
順に生成されるからである。尚、図3は特定のウェブ・
ページ・レイアウトを有するウェブ・ページ・ファイル
210を示しているが、図3に示された原則は任意のウェ
ブ・ページ・レイアウトを有する任意のウェブ・ページ
・ファイルに適用される。
【0029】典型的には、サーバ・ログ(104.1、10
4.2、104.3および104.4)内の各レコードは次のフィール
ドを含んでいる: ・単一または複数のユーザのドメイン・ネームに割当て
られたIPアドレス ・(Getなどの)リクエストの名称 ・リクエストが受信された時点に関するタイムスタンプ ・(ファイルへのパスおよび受け渡されたパラメータを
含む)URL ・サーバ名称 ・単一または複数のIPアドレスのドメイン・ネーム ・ブラウザから受信したバイト ・ブラウザに送信したバイト、および ・リクエストを処理した作用状況を示すステータス・コ
ード。
【0030】図4を参照すると、図1に示されたユーテ
ィリティ・アプリケーション112により本発明に従って
サブジェクト・マップ114を作成する操作を表すフロー
チャートが示されている。ステップ402において、ユー
ティリティ・アプリケーション112はサーバ・ログ(104.
1、104.2、104.3および104.4)内に記憶されたインター
ネット・データをイントラネット107を介して収集す
る。
【0031】ステップ404においてユーティリティ・ア
プリケーション112はどのタイプのサーバがインターネ
ット・データを生成したかを識別する、と言うのも、4
組のサーバ・ログ(104.1、104.2、104.3および104.4)は
異なるタイプのサーバにより生成され得るからである。
例えば、図1に示された4個のサーバ(102.1、102.2、1
02.3および102.4)は夫々、ウェブ・サーバ、仮想ドメイ
ンを有するホスト・ウェブ・サーバ、商用サーバ、プロ
キシ・サーバであり得る。異なるタイプのサーバは異な
るフォーマットでインターネット・データを生成し得る
ことから、1組のサーバ・ログ(104.1、104.2、104.3
たは104.4)内のデータ・フォーマットおよび内容は他の
3組のサーバ・ログのものと異なり得る。サーバ・タイ
プを識別することによりユーティリティ・アプリケーシ
ョン112は、識別されたサーバ・ログ内のデータ・フォ
ーマットおよび内容に適した様にインターネット・デー
タを処理できる。その様にすることで、ユーティリティ
・アプリケーション112は種々のタイプのサーバにより
生成されたインターネット・データを処理して組合せ得
る。本発明においてサーバ・タイプは、サーバ・ログ内
に含まれたフィールドおよびフィールドの順番により識
別され得る。
【0032】ステップ406においてユーティリティ・ア
プリケーション112は、ステップ402で収集されたデータ
から使用できないをキャラクタを除去する。一例とし
て、URLのバックスペースは使用できないキャラクタで
あり;URLの2個の“//”の一方は使用できないキャラ
クタである、と言うのも、2個の“//”はサーバに対し
て1個の“/”と同一の意味を有するからである。従っ
て、バックスペースおよび1個の“/”は除去され得
る。別の例として、認識不能なURLに結合されたファイ
ルを検索するレコード内のデータは使用できない、と言
うのも、そのURLに対して何らのファイルも発見され得
ないからである。従って、そのレコード全体が除去され
得る。典型的には、データ・レコード内のステータス・
コード・フィールドは、リクエストが好首尾に処理され
たか否かを示している。このステップは有益である、と
言うのも、サーバは膨大な量のデータを含み得るからで
ある。使用できないデータをデータ保管アプリケーショ
ンなどに保持しておけば、記憶空間の浪費であるだけで
なく、レポートにおけるエラーおよび分析の間における
エラーを引き起こし得る。
【0033】ステップ408においてユーティリティ・ア
プリケーション112は、ウェブ・ページ・ファイル(HTM
L、SHTML、DHTMLまたはCGIファイル)に対するファイル
・アクセス状況を示すデータを記憶しているレコードを
識別する。図3に示された例では、図2に示されたウェ
ブ・ページ・ファイル201に対するレコードJ1がステッ
プ408で識別される。
【0034】ステップ410においてユーティリティ・ア
プリケーション112は、夫々のウェブ・ページ・ファイ
ルにリンクされた(GIF、JPEGおよびAVIファイルなどの)
他形式ファイルに対するファイル・アクセス状況を示す
データを記憶するレコードを識別する。図3に示された
例においては、図2に示されたウェブ・ページ・ファイ
ル201にリンクされたものとしてレコードJ2−3が識別さ
れ得る。
【0035】ステップ412においてユーティリティ・ア
プリケーション112は、(上記ブラウザを実行しつつある
ユーザ・コンピュータに割当てられた)IPアドレスと上
記レコード内のタイムスタンプ・フィールドとを使用す
ることにより、識別された他形式ファイルに対するレコ
ードを、それらに対して夫々識別されたウェブ・ページ
・ファイルと相関させる。上述の如く、もしウェブ・ペ
ージ・ファイルに何らかの他形式ファイルがリンクされ
ていれば、ブラウザはウェブ・ページ・ファイルを受信
した直後にその他形式ファイルを検索するリクエストを
送信する。
【0036】故に、上記ウェブ・ページ・ファイルを検
索する為のリクエスト内のIPアドレスは、上記他形式フ
ァイルを検索する為のリクエストにおけるIPアドレスと
同一である。同様に、ウェブ・ページ・ファイルを検索
するリクエストが受信された時点は、他形式ファイルに
対するリクエストが受信された時点に近接していなけれ
ばならない。故に、ユーティリティ・アプリケーション
112は次のレコードを相互に相関させる:(1)特定のウェ
ブ・ページ・ファイルに対する特定のレコードであっ
て、IPアドレスおよびタイムスタンプを有する特定のレ
コード;および(2)上記他形式ファイルに対する一群の
レコードであって、上記特定レコードにおけるIPアドレ
スと同一のIPアドレスを含むと共に上記特定レコードに
おけるタイムスタンプと近接したタイムスタンプ(例え
ば、1〜2秒以内)を含む一群のレコード。
【0037】図3に示された例においては、レコードJ
2−4がレコードJ1と相関され得る。ステップ414におい
て、ウェブ・ページ・ファイルの各々の長さをユーティ
リティ・アプリケーション112は計算するが、この計算
は、ひとつのウェブ・ページ・ファイルに対して送信さ
れたバイトを、このひとつのウェブ・ページ・ファイル
にリンクされた他形式ファイルに対して送信されたバイ
トに組合せることで行われる。図2に示された実施例に
おいて、ウェブ・ページ・ファイル201に対して送信さ
れたバイトは、GIF、JPEGおよびAVIファイルに対して送
信されたバイトと組合される。その長さはインターネッ
ト・サービス・プロバイダがその運営を管理する上で有
用である、と言うのも斯かる長さは、これらのファイル
により使用された帯域幅とこれらのファイルの送信コス
トとを決定する情報を提供し得るからである。
【0038】ステップ416においてユーティリティ・ア
プリケーション112は、ステップ(406,408,410,412およ
び414)にて処理されたデータを、図1に示されたページ
・マップ113に記憶する。
【0039】図5を参照すると、本発明に従い、ページ
・マップ113内の複数の好適データ・レコードが示され
ている。図5に示された如く、ページ・マップ113は複
数のデータ・レコード502.1、502.2、・・502.iを含ん
でいる。これらのレコードの各々は、幾つかの物理的な
又は論理的な記憶ユニットを含み得る。レコードの各々
は、ウェブ・ページ・ファイルを検索すべくブラウザに
より使用されるIPアドレスと、ウェブ・ページ・ファイ
ルおよび該ウェブ・ページ・ファイルにリンクされた他
形式ファイルに対するアクセス状況を示す相関情報と、
タイムスタンプと、を記憶する。レコードの各々は、ウ
ェブ・ページ・ファイルと他形式ファイルとに対して送
信されたバイトの全ての組合せ長さも記憶する。
【0040】図6を参照すると、ウェブサイトにおける
ステップの階層構造を示す複数の好適なURLが示されて
いる。図6に示された如く、項目(a)、http://www.xyz.
comは、XYZ社のウェブサイトまたはホームページ・ファ
イル(レベル1ウェブ・ページ・ファイル)に対するURLリ
ンクである。項目(b)に示された如く上記ホームページ
・ファイルは、その各々がスポーツの種類に関する情報
を含む一群のウェブ・ページ・ファイル(レベル2ウェブ
・ページ・ファイル)へのリンクを含み得る。項目(b)に
示された如く、http://www.xyz.com/sports/(sports_ty
pe).htmlはスポーツの種類に関する情報を含むウェブ・
ページ・ファイルへのURLリンクである。URLであるhtt
p://www.xyz.com/sports/(sports_type).htmlは、2個
の単一スラッシュ(/)により区分された3個のセクショ
ンを含んでいる。
【0041】詳細には、セクション(1)“xyz.com”はXY
Z社のウェブサイトのドメイン・ネームまたはIPアドレ
スを示し、セクション(2)“sports”はXYZ社のウェブ・
ページ・ディレクトリ“sports”の名称およびパスを示
し、且つ、セクション(3)“(sports_type)”はファイル
(sports_type).htmlの名称およびパスを示している。セ
クション(3)においては、スポーツ種類の名称は:フッ
トボール、野球、バスケットボール、ホッケー、テニ
ス、卓球・・とされ得る。レベル2のウェブ・ページ・
ファイルは、一群のウェブ・ページ・ファイル(レベル3
ウェブ・ページ)へのリンク(項目(c)および項目(d)に示
されている)を含み、又は、検索キー・ワードの入力を
ユーザに許容する検索フォームを含み得る。例えば、野
球に関する情報を含むウェブ・ページ・ファイルにおい
てユーザは、該ウェブ・ページ・ファイルに含まれた検
索フォームに検索キー・ワード“tigers”を入力するこ
とにより野球チームを検索できる。
【0042】項目(c)に示された如くhttp://www.xyz.co
m/sports/(sports_type) /(team).htmlはスポーツの種
類のチームに関する情報を含むウェブ・ページ・ファイ
ルに対するURLリンクである。URLであるhttp://www.xy
z.com/ sports/(sports_type)/(team).htmlは、3個の
単一スラッシュ(/)により区分された4個のセクション
を含んでいる。セクション(1)“xyz.com”はXYZ社のウ
ェブサイトのドメイン・ネームまたはIPアドレスを示
し、セクション(2)“sports”はXYZ社のウェブ・ページ
・ディレクトリ“sports”の名称およびパスを示し、セ
クション(3)(sports_type)はXYZ社のウェブ・ページ・
サブディレクトリ“sports_type”の名称およびパスを
示し、且つ、セクション(4)“team”はウェブ・ページ
・ファイル(team).htmlの名称およびパスを示してい
る。
【0043】項目(d)を説明する上では、レベル3のウェ
ブ・ページ・ファイル内の検索フォーム内にユーザが検
索キー・ワード“tigers”を入力したものと仮定する。
項目(d)に示された如く、http://www.xyz.com/sports/
(sports_ type)/search.cgi?team=tigersは、検索コマ
ンド“team=tigers”に基づくウェブ・ページ・ファイ
ルへのURLリンクである。URLであるhttp:// www.xyz.co
m/sports/(sports_type)/search.cgi?team=tigersは、
3個の単一スラッシュ(/)により区分された4個のセク
ションを含んでいる。詳細には、セクション(1)“xyz.c
om”はXYZ社のウェブサイトのドメイン・ネームまたはI
Pアドレスを示し、セクション(2)“sports”はXYZ社の
ウェブ・ページ・ディレクトリ“sports”の名称および
パスを示し、セクション(3)“(sports_type)”はXYZ社
のウェブ・ページ・サブディレクトリ“sports_type”
の名称およびパスを示し、且つ、セクション(4)“searc
h. cgi?team=tigers”はCGI(共通ゲートウェイ・インタ
フェース)プログラムにより実行された検索に基づくウ
ェブ・ページ・ファイルの名称およびパスを示してい
る。
【0044】図7を参照すると、本発明に従いウェブ・
ページ・ファイルをサブジェクト分野にマッピングする
好適なマッピング規則(サブジェクトまたはコンテキス
ト・マップ114内に記憶されたもの)が示されている。図
7に示された如く、サブジェクト分野は:ビジネス、教
育、スポーツ、ニュース、健康、コンピュータ関連、旅
行、天気、娯楽および趣味に分割され得る。
【0045】ウェブ・ページ・ファイルをサブジェクト
分野にマッピングする上ではひとつ以上のキー・ワード
がサブジェクト分野にマッピングされ得る、と言うの
も、実際にはウェブサイトのウェブ・ページ・ファイル
およびファイルシステムは図7のサブジェクト分野にお
けるのと同一語句を使用しないこともあるからである。
例えば図7において、sports、sport、sportingおよびs
abcというキー・ワードは全てスポーツのサブジェクト
分野にマッピングされる。従って、第1および第2の単一
スラッシュ(/)間に配置されたキー・ワード、sports、s
port、sportingまたはsabcを含む全てのURLは、スポー
ツのサブジェクト分野にマッピングされる。上記マッピ
ング規則はURLの一定のレベルにてはキー・ワードは頼
らず、また、マッピング規則はユーザ・インタフェース
を介してユーザにより変更され得る。
【0046】図8を参照すると、本発明に従いウェブ・
ページ・ファイルを下位サブジェクト分野にマッピング
する好適な下位マッピング規則(サブジェクト・マップ
すなわちコンテキスト・マップに記憶されたもの)が示
されている。図8に示された如くスポーツのサブジェク
ト分野は、野球、バスケットボール、ホッケー、テニ
ス、卓球などの下位サブジェクト分野に更に区分され得
る。
【0047】図9を参照すると、本発明に従いマッピン
グ規則および下位マッピング規則に基づいてウェブ・ペ
ージ・ファイルを(図7および図8に示された)サブジェ
クト分野および下位サブジェクト分野にマッピングする
操作を表すフローチャートが示されている。ステップ90
2においてユーティリティ・アプリケーション112は、所
定の分類またはグラフィック・ユーザ・インタフェース
を介してユーザにより入力された分類のいずれかに基づ
いてサブジェクト分野および下位サブジェクト分野を定
義する。
【0048】ステップ904においてユーティリティ・ア
プリケーション112は、所定の規則またはグラフィック
・ユーザ・インタフェースを介してユーザにより入力さ
れた規則のいずれかに基づいて(図7および図8に示さ
れた)マッピング規則および下位マッピング規則を定義
する。ステップ906においてユーティリティ・アプリケ
ーション112は、サブジェクト分野、下位サブジェクト
分野、マッピング規則および下位マッピング規則をサブ
ジェクト・マップ114に記憶する。
【0049】ステップ908においてユーティリティ・ア
プリケーション112はログ(104.1、104.2、104.3および1
04.4)からデータ・レコードを収集する。ステップ910に
おいてユーティリティ・アプリケーション112は、図4
に示されたステップを実施することによりページ・マッ
プ113を作成する。
【0050】ステップ912においてユーティリティ・ア
プリケーション112は、サブジェクト(即ちコンテキス
ト)マップ114に記憶されたマッピング規則および下位マ
ッピング規則に基づいて、ページ・マップ113内のウェ
ブ・ページ・ファイルをサブジェクト分野および下位サ
ブジェクト分野にマッピングする。
【0051】ひとつの方法に依れば、ユーティリティ・
アプリケーション112はURLを(単一スラッシュにより区
分された)セクションに分解する。次にユーティリティ
・アプリケーションは、サブジェクト(即ちコンテキス
ト)マップ114に記憶されたマッピング規則および下位マ
ッピング規則に従い、URLの第1および第2の単一スラッ
シュの間に含まれた情報を使用して(ページ・マップ113
に記憶された)夫々のウェブ・ページ・ファイルをサブ
ジェクト分野にマッピングすると共に、URLの第2および
第3単一スラッシュの間(または第2の単一スラッシュの
後)に含まれた情報を使用して夫々のウェブ・ページ・
ファイルを下位サブジェクト分野にマッピングする。
【0052】別の方法に依ればユーティリティ・アプリ
ケーション112は、サーバ・ログ内のデータ・レコード
を分解し、URLにより受け渡され且つその後にサーバで
実行されているアプリケーションに与えられたパラメー
タを収集する。例えば図6に示された如く、パラメータ
は、URL(d)により受け渡された“team=tigers”中のtig
ersである。ユーティリティ・アプリケーション112は次
に、そのパラメータおよび(サブジェクト・マップ114に
記憶された)パラメータ・マッピング規則およびパラメ
ータ・マッピング下位規則に従い、夫々のウェブ・ペー
ジ・ファイルをサブジェクト分野および下位サブジェク
ト分野にマッピングする。
【0053】更に別の方法に依ればユーティリティ・ア
プリケーション112は、(ウェブ・ページ・ファイル格納
器103.1、103.2、103.3および103.4内に記憶された)ウ
ェブ・ページ・ファイルの内容中の一群のキー・ワード
を検索する。例えば、主要キー・ワードはsports、spor
t、sportingとされ得ると共に、2次的キー・ワードはt
able tennis、ping pongおよびtable ballとされ得る。
ユーティリティ・アプリケーション112は次に:上記キ
ー・ワードおよび(サブジェクト(即ちコンテキスト)マ
ップ114に記憶されたマッピング規則および下位マッピ
ング規則に従い;(ページ・マップ113に記憶された)ウ
ェブ・ページ・ファイルをサブジェクト分野および下位
サブジェクト分野にマッピングする。
【0054】更に別の方法に依ればユーティリティ・ア
プリケーション112は、(ウェブ・ページ・ファイル格納
器103.1、103.2、103.3および103.4に記憶された)ウェ
ブ・ページ・ファイルおよび他形式ファイル中の一群の
タグを検索する。タグはウェブ・ページ・ファイルまた
は他形式ファイル中に含まれると共にユーザは視認でき
ないのが典型的である。それはまた、ウェブ・ページ・
ファイルまたは他形式ファイルの分類を示す。例えば主
要タグは、ビジネス、教育、スポーツ、・・趣味であ
り、2次タグはバスケットボール、野球、ホッケー、・
・であり得る。次にユーティリティ・アプリケーション
112は、上記タグとサブジェクト(即ちコンテキスト)マ
ップ114に記憶されたマッピング規則および下位マッピ
ング規則に従い;(ページ・マップ113に記憶された)ウ
ェブ・ページ・ファイルをサブジェクト分野および下位
サブジェクト分野にマッピングする。ステップ914にお
いてユーティリティ・アプリケーション112は、マッピ
ングされたファイルをサブジェクト(コンテキスト)ペー
ジ・マップ115に記憶する。
【0055】図10を参照すると、本発明に従うサブジ
ェクト・ページ・マップ115内の複数の好適レコード・
ユニットが示されている。図10に示された如くサブジ
ェクト・ページ・マップ115は、サブジェクト分野であ
るビジネス、教育、・・旅行、・・の夫々に対する複数
のレコード・ユニット(1006.1、1006.2、・・、100
6. i、・・)を含んでいる。レコード・ユニットの各々
は、サブジェクト分野にマッピングされた複数のページ
・ファイルを含んでいる。
【0056】図11を参照すると、本発明に従うサブジ
ェクト・ページ・マップ115内の複数の好適なレコード
・ユニットが示されている。図11に示された如くサブ
ジェクト・ページ・マップ115は、下位サブジェクト分
野である野球、バスケットボール、・・卓球の夫々に対
する複数のレコード・ユニット(1106.1、1106.2、・
・、1106.i、・・)を含んでいる。レコード・ユニット
の各々は、スポーツのサブジェクト分野にマッピングさ
れた複数のページ・ファイルを含んでいる。
【0057】図12を参照すると、本発明に従い、ユー
ティリティ・アプリケーション112を実行するデータ処
理コンピュータとして使用される好適なコンピュータ・
システム1200が示されている。図12に示された如くコ
ンピュータ・システム1200は、処理ユニット1202、メモ
リ装置1204、ハードディスク1206、ディスク・ドライブ
・インタフェース1208、ディスプレイ・モニタ1210、デ
ィスプレイ・インタフェース1212、バス・インタフェー
ス1224、マウス1225、キーボード1226、ネットワーク通
信インタフェース1234およびシステム・バス1214を備え
て成る。
【0058】ハードディスク1206はディスク・ドライブ
・インタフェース1208に連結され、ディスプレイ・モニ
タ1210はディスプレイ・インタフェース1212に連結さ
れ、且つ、マウス1225およびキーボード1226はバス・イ
ンタフェース1224に連結されている。システム・バス12
14に連結されるのは次のものである:処理ユニット120
2、メモリ装置1204、ディスク・ドライブ・インタフェ
ース1208、ディスプレイ・インタフェース1212、バス・
インタフェース1224、および、ネットワーク通信インタ
フェース1234。
【0059】メモリ装置1204は(命令およびデータを含
む)プログラムを記憶できる。ディスク・ドライブ・イ
ンタフェース1208と協働することによりハードディスク
1206もまたプログラムを記憶できる。但し、メモリ装置
1204はハードディスク1206よりも高速なアクセス速度を
有すると共に、ハードディスク1206はメモリ装置1204よ
りも大きな容量を有している。ディスプレイ・インタフ
ェース1212と協働することによりディスプレイ・モニタ
1210は実行されつつあるプログラムとユーザとの間のビ
ジュアル・インタフェースを提供できる。
【0060】バス・インタフェース1224と協働すること
によりマウス1225およびキーボード1226はコンピュータ
・システム1200に対して入力を提供できる。ネットワー
ク通信インタフェース1234は、コンピュータ・システム
1200とイントラネット107との間のインタフェースを提
供できる。一個以上のプロセッサを含み得る処理ユニッ
ト1202はメモリ装置1204およびハードディスク1206に対
してアクセスすると共に、メモリ装置1204またはハード
ディスク1206内に記憶されたプログラムを実行すること
により上記コンピュータの作動を制御できる。処理ユニ
ット1202は、メモリ装置1204とハードディスク1206との
間のプログラムおよびデータの伝達を制御できる。
【0061】本発明においてユーティリティ・アプリケ
ーション112、ページ・マップ113、サブジェクト・マッ
プ114およびサブジェクト・ページ・マップ115は、メモ
リ装置1204またはハードディスク1206のいずれかに記憶
され得る。また、ユーティリティ・アプリケーション11
2は処理ユニット1202により実行され得る。
【0062】
【発明の効果】以上、図面および上記記載において本発
明を詳細に図示かつ説明して来たが、本発明の精神の範
囲内の代替実施例によっても実施され得ることは理解さ
れる。従って、本発明の範囲は本明細書中の記載および
図示内容に限定されることは意図されておらず、添付の
請求の範囲により定義されるものである。
【図面の簡単な説明】
【図1】本発明に係る新規なインターネット・データ処
理コンピュータを含む好適なネットワーク・システムを
示す図である。
【図2】ウェブ・ページ・ファイルと結合された好適な
ウェブ・ページを示す図である。
【図3】サーバのログ内の好適データ・レコードを示す
図である。
【図4】本発明に従ってページ・マップを作成する操作
を示すフローチャートである。
【図5】本発明に従い、図1に示されたページ・マップ
に記憶された好適なデータ・レコードを示す図である。
【図6】ウェブサイトにおけるウェブ・ページ・ファイ
ルの階層構造を示す好適URLを示す図である。
【図7】本発明に従ってウェブ・ページ・ファイルをサ
ブジェクト分野にマッピングする好適なマッピング規則
を示す図である。
【図8】本発明に従ってウェブ・ページ・ファイルを下
位サブジェクト分野にマッピングする下位マッピング規
則を示す図である。
【図9】本発明に従い、マッピング規則および下位マッ
ピング規則に基づいてウェブ・ページ・ファイルをサブ
ジェクト分野および下位サブジェクト分野にマッピング
する操作を示すフローチャートである。
【図10】本発明に従い、マッピング規則に基づいてサ
ブジェクト分野にマッピングされた複数の好適ウェブ・
ページ・ファイルを含むサブジェクト(コンテキスト)マ
ップを示す図である。
【図11】本発明に従い、下位マッピング規則に基づい
て下位サブジェクト分野にマッピングされた複数の好適
ウェブ・ページ・ファイルを含むサブジェクト(コンテ
キスト)マップを示す図である。
【図12】本発明に従ってユーティリティ・アプリケー
ションを実行し得る好適なコンピュータ・システムを示
す図である。
【符号の説明】
100 ネットワーク・システム 102 サーバ 102.1、102.2、102.3、102.4 ページ格納器 103 ウェブ・ページ格納器 104 サーバ・ログ 104.1、104.2、104.3、104.4 サーバ・ログ 105 インターネット 106.1、106.2、106.3、106.4 ユーザ・コンピュータ 107 イントラネット 108 データ処理コンピュータ 108.1、108.2、108.3、108.4 ウェブ・ブラウザ 112 ユーティリティ・アプリケーション 113 ページ・マップ 114 サブジェクト(コンテキスト)マップ 115 サブジェクト(コンテキスト)ページ・マップ 116 ローディング・ユーティリティ 118 データ保管装置 200 ウェブ・ページ 201 ウェブ・ページ・ファイル 202 テキスト領域 204 グラフィック領域 205 リンク 206 グラフィック領域 207 リンク 208 マルチメディア領域 209 リンク 210 ウェブ・ページ・ファイル 214 領域 215 リンク 216 領域 217 リンク 1200 コンピュータ・システム 1202 処理ユニット 1204 メモリ装置 1206 ハードディスク 1208 ディスク・ドライブ・インタフェース 1210 ディスプレイ・モニタ 1212 ディスプレイ・インタフェース 1214 システム・バス 1224 バス・インタフェース 1225 マウス 1226 キーボード 1234 ネットワーク通信インタフェース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 カレン エー パピエルニアク アメリカ合衆国 ミネソタ州 55108 セ ント ポール アパートメント6 レイモ ンド アヴェニュー 1404 (72)発明者 ジェィムズ イー タイスズ アメリカ合衆国 ニュージャージー州 07738 リンクロフト サークル パレス 63 (72)発明者 ルージェン チャング アメリカ合衆国 ニュージャージー州 07728 フリーホールド グレンブルック ロード 169 (72)発明者 パレッシュ ビー シャー アメリカ合衆国 ニュージャージー州 07060 ノース プレインフィールド #F−5 ロック アヴェニュー 1275

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 複数のウェブ・ページ・ファイルに対す
    るアクセス状況を示すデータ・レコードを含む一群のロ
    グと共に使用される方法であって、 (a)ウェブ・ページ・ファイルを分類する複数のサブ
    ジェクト分野を記憶するステップと、 (b)データ・レコードを上記サブジェクト分野にマッ
    ピングする複数のマッピング規則を記憶するステップ
    と、 (c)上記ログからデータ・レコードを収集するステッ
    プと、 (d)上記マッピング規則に基づいて上記データ・レコ
    ードを上記サブジェクト分野と相関させるステップと、
    を含むことを特徴とする方法。
  2. 【請求項2】 ステップ(d)において相関せしめられ
    たデータ・レコードを分析し、サブジェクト分野に基づ
    く情報を生成するステップと、 サブジェクト分野に従って情報を配置するレポートを作
    成するステップとを含むことを特徴とする請求項1に記
    載の方法。
  3. 【請求項3】 前記データ・レコードは夫々のウェブ・
    ページ・ファイルをリンクする為のユニフォーム・リソ
    ース・ロケータ(URL)を含み、 前記ステップ(b)は、上記URLに含まれた情報に基づ
    いて上記データ・レコードを前記サブジェクト分野にマ
    ッピングし得るマッピング規則を記憶し、且つ、 前記ステップ(d)は、URL内に含まれた情報に基づい
    て上記データ・レコードをサブジェクト分野と相関させ
    る請求項1乃至2に記載の方法。
  4. 【請求項4】 前記ステップ(b)は、少なくともひと
    つのウェブ・ページ・ファイルを検索するパラメータに
    基づいて前記データ・レコードを前記サブジェクト分野
    にマッピングし得るマッピング規則を記憶し、且つ、 前記ステップ(d)は前記パラメータに基づいて上記デ
    ータ・レコードを上記サブジェクト分野に相関させる請
    求項1乃至3に記載の方法。
  5. 【請求項5】 前記パラメータは少なくともひとつのウ
    ェブ・ページ・ファイルにアクセスしたユーザにより与
    えられる請求項4に記載の方法。
  6. 【請求項6】 前記データ・レコードは夫々のウェブ・
    ページ・ファイルをリンクするユニフォーム・リソース
    ・ロケータ(URL)を含み、前記パラメータは上記URLに含
    まれる請求項4に記載の方法。
  7. 【請求項7】 前記コンテキスト分野の各々に対して複
    数の下位サブジェクト分野を記憶するステップと、 前記データ・レコードを上記下位サブジェクト分野へと
    マッピングする複数の下位マッピング規則を記憶するス
    テップと、 前記マッピング規則および上記下位マッピング規則に基
    づいて上記データ・レコードをサブジェクト分野および
    下位サブジェクト分野に相関させるステップとを更に備
    えて成る請求項1乃至7に記載の方法。
  8. 【請求項8】 ステップ(b)は、前記ウェブ・ページ
    ・ファイルに含まれた一個以上のキー・ワードに基づい
    て前記データ・レコードを前記サブジェクト分野にマッ
    ピングし得るマッピング規則を記憶し、且つ、 前記ステップ(d)は上記一個以上のキー・ワードに基
    づいて上記データ・レコードを上記サブジェクト分野に
    相関させる、請求項1乃至7に記載の方法。
  9. 【請求項9】 ステップ(b)は、前記ウェブ・ページ
    ・ファイルに含まれた一個以上のタグに基づいて前記デ
    ータ・レコードを前記サブジェクト分野にマッピングし
    得るマッピング規則を記憶し、且つ、 前記ステップ(d)は上記一個以上のタグに基づいて上
    記データ・レコードを上記サブジェクト分野に相関させ
    る請求項1乃至8に記載の方法。
  10. 【請求項10】 複数のウェブ・ページ・ファイルを含
    むサーバと共に使用される方法であって、 (a)ウェブ・ページ・ファイルを分類する複数のサブ
    ジェクト分野を記憶するステップと、 (b)データ・レコードを上記サブジェクト分野にマッ
    ピングする複数のマッピング規則を記憶するステップ
    と、 (c)上記ウェブ・ページ・ファイルからキー・ワード
    を検索するステップと、 (d)上記マッピング規則およびキー・ワードに基づい
    て上記データ・レコードを上記サブジェクト分野と相関
    させるステップと、を含むことを特徴とする方法。
  11. 【請求項11】 複数のウェブ・ページ・ファイルを含
    むサーバと共に使用される方法であって、 (a)ウェブ・ページ・ファイルを分類する複数のサブ
    ジェクト分野を記憶するステップと、 (b)データ・レコードを上記サブジェクト分野にマッ
    ピングする複数のマッピング規則を記憶するステップ
    と、 (c)上記ウェブ・ページ・ファイルからタグを検索す
    るステップと、 (d)上記マッピング規則およびタグに基づいて上記デ
    ータ・レコードを上記サブジェクト分野と相関させるス
    テップと、を含むことを特徴とする方法。
  12. 【請求項12】 前記サブジェクト分野は以下のサブジ
    ェクト分野、ビジネス、教育、ニュース、健康、コンピ
    ュータ関連、旅行、天気、娯楽、趣味およびスポーツ、
    の中の任意の2個以上を含む請求項1乃至11に記載の
    方法
JP11158445A 1998-04-29 1999-04-28 サブジェクト・マップを形成し、該サブジェクト・マップに応じたインタ―ネット・デ―タを提供する方法及び装置 Pending JP2000105739A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/067804 1998-04-29
US09/067,804 US6169997B1 (en) 1998-04-29 1998-04-29 Method and apparatus for forming subject (context) map and presenting Internet data according to the subject map

Publications (1)

Publication Number Publication Date
JP2000105739A true JP2000105739A (ja) 2000-04-11

Family

ID=22078522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11158445A Pending JP2000105739A (ja) 1998-04-29 1999-04-28 サブジェクト・マップを形成し、該サブジェクト・マップに応じたインタ―ネット・デ―タを提供する方法及び装置

Country Status (3)

Country Link
US (1) US6169997B1 (ja)
EP (1) EP0953924A3 (ja)
JP (1) JP2000105739A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7441027B2 (en) * 2001-09-28 2008-10-21 At&T Intellectual Property I, L.P. Methods, systems, and products for creating message logs
US8271591B2 (en) 2001-09-28 2012-09-18 At&T Intellectual Property I, L.P. Methods, systems, and products for managing communications
US8560673B2 (en) 2001-09-28 2013-10-15 At&T Intellectual Property I, L. P. Methods, systems and products for presenting information correlated to communications

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020030854A1 (en) 1998-09-08 2002-03-14 Jared Schutz Generating a courier shipping label or the like, including an ornamental graphic design, at a non-courier printer
US6452609B1 (en) * 1998-11-06 2002-09-17 Supertuner.Com Web application for accessing media streams
EP1006462A3 (en) 1998-12-01 2005-03-30 Lucent Technologies Inc. A method and apparatus for persistent storage of web resources
US7131062B2 (en) * 1998-12-09 2006-10-31 International Business Machines Corporation Systems, methods and computer program products for associating dynamically generated web page content with web site visitors
US7546530B1 (en) * 1999-04-15 2009-06-09 Hoshiko Llc Method and apparatus for mapping a site on a wide area network
US6502062B1 (en) * 1999-06-21 2002-12-31 Lucent Technologies Inc. System and method for scheduling data delivery using flow and stretch algorithms
EP1076304A1 (en) * 1999-08-13 2001-02-14 Mindpass A/S A method and an apparatus for searching and presenting electronic information from one or more information sources
US7116765B2 (en) 1999-12-16 2006-10-03 Intellisync Corporation Mapping an internet document to be accessed over a telephone system
US6701362B1 (en) * 2000-02-23 2004-03-02 Purpleyogi.Com Inc. Method for creating user profiles
US7177904B1 (en) 2000-05-18 2007-02-13 Stratify, Inc. Techniques for sharing content information with members of a virtual user group in a network environment without compromising user privacy
US6785666B1 (en) * 2000-07-11 2004-08-31 Revenue Science, Inc. Method and system for parsing navigation information
US20020174132A1 (en) * 2001-05-04 2002-11-21 Allresearch, Inc. Method and system for detecting unauthorized trademark use on the internet
US7171624B2 (en) * 2001-10-05 2007-01-30 International Business Machines Corporation User interface architecture for storage area network
US6993520B2 (en) * 2002-01-15 2006-01-31 International Business Machines Corporation Integrated content management and block layout technique
US7987491B2 (en) 2002-05-10 2011-07-26 Richard Reisman Method and apparatus for browsing using alternative linkbases
US20040158504A1 (en) * 2003-01-31 2004-08-12 Gross John N. Method of providing access to playable media
US7389243B2 (en) * 2003-01-31 2008-06-17 Gross John N Notification system and method for media queue
US8712867B2 (en) * 2003-01-31 2014-04-29 Media Queue, Llc System for providing access to playable media
US8700538B2 (en) * 2003-01-31 2014-04-15 Media Queue, Llc Media exchange system and method
US20040158503A1 (en) * 2003-01-31 2004-08-12 Gross John N. Media queue monitor
US20040162783A1 (en) * 2003-01-31 2004-08-19 Gross John N. Media queue replenisher
US8688462B2 (en) * 2003-01-31 2014-04-01 Media Queue, Llc Media auto exchange system and method
US8433622B2 (en) * 2003-05-28 2013-04-30 Media Queue, Llc Method of controlling electronic commerce queue
US20040243479A1 (en) * 2003-05-28 2004-12-02 Gross John N. Method of monitoring electronic commerce queue
US7685028B2 (en) * 2003-05-28 2010-03-23 Gross John N Method of testing inventory management/shipping systems
US8612311B2 (en) * 2004-05-28 2013-12-17 Media Queue, Llc Hybrid distribution method for playable media
US20060212367A1 (en) * 2003-05-28 2006-09-21 Gross John N Method of selecting and distributing items to consumers of electronic media
US7783512B2 (en) * 2003-05-28 2010-08-24 Gross John N Method of evaluating learning rate of recommender systems
US20080015870A1 (en) * 2003-05-30 2008-01-17 Lawrence Benjamin Elowitz Apparatus and method for facilitating a search for gems
US8738541B2 (en) * 2003-06-25 2014-05-27 Media Queue, Llc Method of processing rental requests and returns
US20040268225A1 (en) * 2003-06-26 2004-12-30 Walsh Raymond V. Method and system for controlling navigation of a graphical user interface
US20050261989A1 (en) * 2004-04-06 2005-11-24 Mark Vadon Apparatus and method for facilitating a search for gem settings
US20070198494A1 (en) * 2005-07-08 2007-08-23 Vadon Mark C Apparatus and method for facilitating a search for sets of gems
US8271521B2 (en) * 2006-03-20 2012-09-18 Blue Nile, Inc. Computerized search technique, such as an internet-based gemstone search technique
US8949406B2 (en) * 2008-08-14 2015-02-03 International Business Machines Corporation Method and system for communication between a client system and a server system
US8127000B2 (en) * 2006-06-30 2012-02-28 Tealeaf Technology, Inc. Method and apparatus for monitoring and synchronizing user interface events with network data
US8868533B2 (en) 2006-06-30 2014-10-21 International Business Machines Corporation Method and apparatus for intelligent capture of document object model events
US8583772B2 (en) 2008-08-14 2013-11-12 International Business Machines Corporation Dynamically configurable session agent
WO2008094515A2 (en) * 2007-01-29 2008-08-07 Medicomp Systems, Inc. Method and system for displaying hierarchical information
US8042055B2 (en) * 2007-08-31 2011-10-18 Tealeaf Technology, Inc. Replaying captured network interactions
US8229757B2 (en) 2007-10-01 2012-07-24 Aetna Inc. System and method for managing health care complexity via an interactive health map interface
US8140963B2 (en) * 2007-12-19 2012-03-20 Yahoo! Inc. Tag aggregator
US8538958B2 (en) * 2008-07-11 2013-09-17 Satyam Computer Services Limited Of Mayfair Centre System and method for context map generation
US9934320B2 (en) 2009-03-31 2018-04-03 International Business Machines Corporation Method and apparatus for using proxy objects on webpage overlays to provide alternative webpage actions
US8930818B2 (en) * 2009-03-31 2015-01-06 International Business Machines Corporation Visualization of website analytics
EP2372577A1 (en) * 2010-03-31 2011-10-05 British Telecommunications public limited company Context system
US8533532B2 (en) 2010-06-23 2013-09-10 International Business Machines Corporation System identifying and inferring web session events
CN103384864B (zh) 2011-02-22 2016-12-14 国际商业机器公司 渲染内容的方法和系统
US9635094B2 (en) 2012-10-15 2017-04-25 International Business Machines Corporation Capturing and replaying application sessions using resource files
US9536108B2 (en) 2012-10-23 2017-01-03 International Business Machines Corporation Method and apparatus for generating privacy profiles
US9535720B2 (en) 2012-11-13 2017-01-03 International Business Machines Corporation System for capturing and replaying screen gestures
US10474735B2 (en) 2012-11-19 2019-11-12 Acoustic, L.P. Dynamic zooming of content with overlays

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3689127B2 (ja) * 1993-04-22 2005-08-31 ゼロックス コーポレイション 文書処理システムと文書処理方法
US5544302A (en) * 1993-06-03 1996-08-06 Taligent, Inc. Object-oriented framework for creating and using container objects with built-in properties
JPH0830620A (ja) * 1994-07-19 1996-02-02 Fuji Xerox Co Ltd 構造検索装置
US5864856A (en) * 1995-04-21 1999-01-26 Actuate Software, Inc. Process and apparatus for simplifying access to information stored in databases
US5717914A (en) * 1995-09-15 1998-02-10 Infonautics Corporation Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query
US5892917A (en) * 1995-09-27 1999-04-06 Microsoft Corporation System for log record and log expansion with inserted log records representing object request for specified object corresponding to cached object copies
JP2001525951A (ja) * 1995-12-08 2001-12-11 テルコーディア テクノロジーズ インコーポレイテッド コンピュータ・ネットワークにおいて、広告を設置する方法およびシステム
US5913215A (en) * 1996-04-09 1999-06-15 Seymour I. Rubinstein Browse by prompted keyword phrases with an improved method for obtaining an initial document set
US5913208A (en) * 1996-07-09 1999-06-15 International Business Machines Corporation Identifying duplicate documents from search results without comparing document content
US5968125A (en) * 1997-01-21 1999-10-19 Net. Roi Process for optimizing the effectiveness of a hypertext element
US5819258A (en) * 1997-03-07 1998-10-06 Digital Equipment Corporation Method and apparatus for automatically generating hierarchical categories from large document collections
US5963969A (en) * 1997-05-08 1999-10-05 William A. Tidwell Document abstraction system and method thereof

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7441027B2 (en) * 2001-09-28 2008-10-21 At&T Intellectual Property I, L.P. Methods, systems, and products for creating message logs
US8271591B2 (en) 2001-09-28 2012-09-18 At&T Intellectual Property I, L.P. Methods, systems, and products for managing communications
US8341018B2 (en) 2001-09-28 2012-12-25 At&T Intellectual Property I, L. P. Methods and systems for providing contextual information on communication devices and services
US8560673B2 (en) 2001-09-28 2013-10-15 At&T Intellectual Property I, L. P. Methods, systems and products for presenting information correlated to communications
US10902466B2 (en) 2001-09-28 2021-01-26 Facebook, Inc. Methods and systems for a communications and information resource manager
US11195206B2 (en) 2001-09-28 2021-12-07 Facebook, Inc. Methods and systems for providing contextual information

Also Published As

Publication number Publication date
US6169997B1 (en) 2001-01-02
EP0953924A3 (en) 2007-08-15
EP0953924A2 (en) 1999-11-03

Similar Documents

Publication Publication Date Title
US6169997B1 (en) Method and apparatus for forming subject (context) map and presenting Internet data according to the subject map
Eirinaki et al. Web mining for web personalization
KR101475126B1 (ko) 검색 결과 페이지에 인터랙티브 요소를 포함하는 시스템 및 그 방법
US6311194B1 (en) System and method for creating a semantic web and its applications in browsing, searching, profiling, personalization and advertising
US6401118B1 (en) Method and computer program product for an online monitoring search engine
US6175838B1 (en) Method and apparatus for forming page map to present internet data meaningful to management and business operation
CN102257525B (zh) 用于基于先前捕捉的相关性数据重定向广告的系统和方法
EP0953922A2 (en) Method and apparatus for forming user sessions and presenting internet data according to the user sessions
TWI477992B (zh) 覆蓋於搜尋結果上之第三方資訊之方法、系統及電腦可讀取媒體
US20080162506A1 (en) Device and method for world wide web organization
KR102281186B1 (ko) 검색 결과에 대한 애니메이션 스니핏
US20060253594A1 (en) Personalized multi-service computer environment
AU2016259424A1 (en) Clickstream visual analytics based on maximal sequential patterns
JP5425906B2 (ja) リサーチセッションの検出に基づくリサーチツールへのアクセス
US8931002B2 (en) Explanatory-description adding apparatus, computer program product, and explanatory-description adding method
US20100057695A1 (en) Post-processing search results on a client computer
JP2003178092A (ja) 情報検索システム、情報提供装置及び情報検索方法並びにプログラム
US20110029613A1 (en) Evaluation of an attribute of an information object
JP5522166B2 (ja) 情報処理装置、通信制御方法および通信制御プログラム
CN113127721A (zh) 一种基于搜索历史记录定向跳转页面的方法及装置
August et al. Mobile web searching
JP5482512B2 (ja) リンク辞書生成処理装置,リンク辞書生成処理プログラム,リンク処理装置,およびリンク処理プログラム
Yesilada et al. Experiments toward reverse linking on the web
Liu et al. Understanding Hidden-Web Traffic from The Perspective of A Metasearcher
KR20010093871A (ko) 인터넷 웹사이트에서 매트릭스 검색창을 이용한 정보/자료제공방법 및 그 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080205

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080502

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080509

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080603

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080609

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080704

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080805

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081120