JP2001142907A - インターネット・プロファイリングシステム - Google Patents

インターネット・プロファイリングシステム

Info

Publication number
JP2001142907A
JP2001142907A JP2000298045A JP2000298045A JP2001142907A JP 2001142907 A JP2001142907 A JP 2001142907A JP 2000298045 A JP2000298045 A JP 2000298045A JP 2000298045 A JP2000298045 A JP 2000298045A JP 2001142907 A JP2001142907 A JP 2001142907A
Authority
JP
Japan
Prior art keywords
category
user
web
proreach
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000298045A
Other languages
English (en)
Inventor
M Riu Albert
エム リウ アルバート
F Gauer Stephen
エフ ガウアー ステファン
Ben-Malek Haamiddo
ベン−マレック ハーミッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2001142907A publication Critical patent/JP2001142907A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation

Abstract

(57)【要約】 【課題】 本発明は、多数のドメインに亘るユーザの関
心を追跡し、追跡したユーザの時間的に変化する関心を
記述する時間ベースモデルを生成するシステム、方法、
並びに、種々のソフトウェア製品の提供を目的とする。 【解決手段】 本発明は、ウェブビジターの識別と、ウ
ェブビジターの時間的に変化する関心を把握する。変化
するユーザの関心は、多数の定義済みユーザグループ内
で各ユーザのメンバーシップを判定するため使用され
る。各ユーザの関心の時間ベースモデル及びグループメ
ンバーシップは、インターネット行動の詳細なプロフィ
ールを形成する。詳細なプロフィールは、ユーザへのマ
ーケット情報及び製品情報の提示、ウェブコンテンツの
動的なカスタマイズ、並びに、その他の販売目的に使用
可能である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オンラインネット
ワークのユーザの挙動及び関心の分析に係り、特に、イ
ンターネット及びワールド・ワイド・ウェブのユーザに
関するユーザの関心の分析及びモデリングに関する。
【0002】
【従来の技術】どのような市場でも顧客の行動は重要で
ある。このことは、従来からの小売業にも当てはまる
が、小売業では、顧客の関心を判定するための十分に発
展したメカニズムが存在する。既存の店舗ビジネスで
は、ビジネスの顧客は店内を歩く様子を観察される。顧
客の行動は(たとえば、クレジットカードの購入品を通
じて)買物を追跡することによっても観察される。顧客
の観察は、実際上、多数の小売業で使用される重要な技
術である。顧客の観察は非常に重要であり、顧客行動に
関する大規模データベースが存在し、継続して使用され
る。たとえば、殆どのスーパーマーケット・チェーン
は、顧客行動の大規模データベースを保有する。このデ
ータベース内のデータを分析結果は、多数の目的(たと
えば、在庫管理、商品配置、新商品分析など)のため使
用される。
【0003】顧客行動の理解は、電子商取引の場合にも
必要であるが、電子商取引における顧客を観察する技術
は必然的に異なる。顧客が電子商取引ウェブサイトと相
互作用する方法は、本人が店に入り買物を行う経験とは
根本的に異なるが、変わらないままのものも多数ある。
ウェブを訪れる人、すなわち、ウェブビジターがウェブ
サイトを見て回るとき、購入するときもあれば、購入し
ないときもある。店側は、ビジターが購入した理由、及
び、購入しなかった理由を把握することに関心がある。
そこで、電子商取引者は、自分の潜在的な顧客層及び顧
客を理解しようとする。電子商取引者は、ウェブビジタ
ーを観察する必要がある。この観察は、顧客の関心を時
間的にモデリングする必要性、モデリングに必然的に付
随する多量データの管理の必要性、ならびに、ユーザ関
心の有意なモデルを提供するたウェブ内容のカテゴリー
の必要性を生じる。
【0004】従来、オンラインシステムのユーザの観察
は、典型的にユーザ関心に関するユーザが提供した情
報、たとえば、顧客に重要な情報のカテゴリーを識別さ
せることができる質問又はフォームのような情報を使用
する。このようなアプローチの例には、YahooやExciteの
ような検索ポータルによって提供される種々のカスタマ
イズ可能なホームページが含まれる。これらのポータル
では、ユーザは、多数の予め決められたカテゴリーの中
から興味のあるカテゴリーを選択し、関連したニュース
及び関連データがユーザに提供される。しかし、ユーザ
の関心が時間に応じて変化する場合、カテゴリーの変更
は自動的には行われないので、ユーザは指定した興味の
あるカテゴリーを手動で変更しなければならない。これ
らのサイトは、ユーザが自分の興味を簡単なキーワード
を使って指定できるようにするが、興味のある対象が変
化した場合、ユーザはキーワードを自分でマニュアル変
更しなければならない。
【0005】クリックスルー(clickthrough)及びページ
閲覧に関してユーザの行動をより系統的に追跡し、これ
らの行動に関する情報を集める別のウェブサイトが存在
する。ユーザの行動は特定のウェブサイト上で変化する
ので、集められた情報は更新される。このアプローチ
は、ユーザの行動の変化のある局面を捉えることができ
るが、単一のウェブサイトに関する興味の識別に制限さ
れる。他のウェブサイトでのユーザの行動は、たとえ、
この別の行動がユーザの関心を最も正確に表現している
としても、特定サイトで集められた情報に影響を与えな
い。より詳細には、ユーザ行動の分析は、典型的に、使
用状況を追跡するサーバーの特定のインターネット・ド
メインに制限される。別のドメインでのユーザ行動は追
跡されない。
【0006】さらに、このようなサーバー上で集められ
た情報は、現在のユーザの関心を表現するだけであり、
潜在的な将来の関心や過去の関心を表さない。すなわ
ち、この情報は、ユーザ関心の時間的変化をモデル化で
きない。しかし、ウェブ上の商取引者や、コンテンツを
ウェブビジターに配信しようとする側にとって価値のあ
る情報は、時間的に変化するユーザの関心である。
【0007】
【発明が解決しようとする課題】本発明は、上記の従来
技術による制限を解決するため、多数のドメインに亘る
ユーザの関心を追跡し、追跡したユーザの時間的に変化
する関心を記述する時間ベースモデルを生成するシステ
ム、方法、並びに、種々のソフトウェア製品の提供を目
的とする。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、本発明によれば、変化するユーザの関心は、多数の
定義済みユーザグループ内で各ユーザのメンバーシップ
を判定するため使用される。各ユーザの関心の時間ベー
スモデル及びグループメンバーシップは、インターネッ
ト行動の詳細なプロフィールを形成し、この詳細なプロ
フィールは、ユーザへのマーケット情報及び製品情報の
提示や、ウェブコンテンツの動的なカスタマイズを行う
ため、あるいは、その他の販売目的に使用可能である。
【0009】そのため、本発明は、ウェブビジターの識
別と、ウェブビジターの時間的に変化する関心を把握す
るという重要な要求を満たす。本発明は、ワールド・ワ
イド・ウェブ上のウェブビジターを追跡し分析するソフ
トウェアシステムであり、以下の説明中、"ProReach"又
は"ProReaach system"のように呼ばれる。
【0010】本発明の特徴及び局面は以下の通りであ
る。第一に、本発明は、ウェブビジターがウェブサイト
を訪問するとき、ウェブビジターを識別し監視すること
ができる。勿論、インターネット上には多数のウェブサ
イトがあり、多数のウェブビジターが存在する。関連す
るウェブサイトの数が二つであるか、あるいは、数千で
あるか、ならびに、ウェブビジターの数が数百万人であ
るかどうかとは無関係に、本発明は、多数のウェブサイ
トに亘って多数のビジターを識別することができるシス
テムを提供する。この局面に関して、本発明は、ウェブ
サイトへの各ビジターを固有識別情報で識別する。この
固有識別情報によって、ビジターは、多数のビジターが
同一ウェブサイトを訪問している間でも、このビジター
が他のウェブサイトを訪問しているときでも一貫して識
別される。
【0011】ProReachは、ウェブビジターのより完全な
像を得るため、多数のウェブ行動からのデータを結合す
る。ProReachのビジター識別プロセスはウェブ全域で動
くので、ProReachはこれらの異なるウェブサイトからの
データを結合することができる。このことは、換言する
と、ウェブビジターがワールド・ワイド・ウェブ上であ
ちらこちらを見て回るときに、ProReachがこのウェブビ
ジターを繰り返し、一貫して識別し得ることを意味す
る。さらに詳細には、他のウェブ追跡用製品に対し、Pr
oReachシステムは、ウェブサーバーとウェブクライアン
トの両方に関するデータを収集する。ProReachは、ウェ
ブクライアントがシステム上にインストールできるダウ
ンロード可能なソフトウェアを配布することによって、
ウェブクライアントに関する情報を獲得する。このソフ
トウェアは、インストールされた後、ウェブユーザのマ
シーンからのウェブユーザの行動を追跡する。ウェブビ
ジターがウェブサイトを訪問するとき、ウェブビジター
の行動が記録される。周期的に、このデータのコンパク
ト版がProReachにアップロードされ、このユーザに関す
るプロフィール及びユーザグループ情報を保持する他の
ウェブサイトに配布される。
【0012】したがって、各ウェブサイトでのユーザ行
動は、ユーザが相互作用を行ったウェブコンテンツの項
目、たとえば、ページビュー、購入などを識別するため
監視される。監視はウェブサーバー自体で行っても、ク
ライアント側のソフトウェアで行ってもよい。監視の中
には、ユーザがコンテンツを閲覧していた時間の長さに
関する情報と共に、たとえば、URL若しくはURIを用いて
ウェブコンテンツの各項目を識別することが含まれる。
これは、ウェブページを読むような時間のかかるウェブ
行動が非常に高いユーザ関心を反映しているので効果を
奏する。ユーザのコンテンツの項目との特別な相互作用
のデータはウェブイベントレコードに蓄積される。たと
えば、簡単な高速クリックスルーのようなウェブ行動は
ユーザ関心を有効に反映していないのでウェブイベント
レコードで追跡されない。ウェブビジターを識別し、ウ
ェブビジターが相互作用するウェブ内容を監視するこの
プロセスは、自動的かつ継続的に行われる。時間経過と
共に、多数のウェブイベントレコードが、多数のウェブ
ユーザによる多数のウェブサイトでの行動から作成され
る。
【0013】ウェブサイトを閲覧するウェブビジターの
データが収集された時点で、このデータは未だビジネス
上の決定を行うために特に有用な形式ではない。たとえ
ば、一部のウェブビジターがたくさんのウェブサイトの
何百ものページを閲覧していることを知ることは、特に
有用ではない。しかし、ウェブビジターがどういう種類
の内容を閲覧しているか、たとえば、車、化粧品、ニュ
ース、技術情報、音楽CD,書籍などを閲覧しているかど
うかを知ることは非常に有用である。
【0014】理想的には、ワールド・ワイド・ウェブ上
のあらゆる文書は、その文書がどういう内容に関するも
のであるかを簡単に記述した説明文が添付されている。
すなわち、この説明文は、たとえば、書籍が図書館で分
類されるのと同じように文書を分類する。しかし、この
ような理想的な状況が直ちに現実化するとは考えられな
い。そこで、ウェブビジターが閲覧する文書を自動的に
分類する方法が必要になる。この分類技術は、頑強性と
正確性と保守性とを備えるべきである。
【0015】ProReachシステムは、まさにこの能力を具
備している。ProReachシステムは、そのためコンテンツ
認識エンジンを有する。コンテンツ認識エンジンは、文
書及びカテゴリーの組を選択し、文書がこれらのカテゴ
リーとよく一致する程度を計算するソフトウェアコンポ
ーネントである。コンテンツ認識エンジンを使用するこ
とにより、ProReachシステムは多種類のウェブ文書を分
類し、文書に与えられた階層的カテゴリーを含むカテゴ
リーのランク付けリストを生成する。基本的な考え方
は、コンテンツ認識エンジンが、所与の文書と一致する
カテゴリー若しくは一致しない一部のカテゴリーを評価
することである。コンテンツ認識エンジンは、文書をテ
ストし、各カテゴリーとどの程度一致しているかを示す
スコアを返却する。このプロセス中、文書は多数のカテ
ゴリーに対してテストされ、その結果として得られる分
類は、分類スコアのベクトルである。このベクトルの各
分類スコアは、当該文書がスポーツ、ニュース、あるい
は、コンピュータのような所与のカテゴリーにどの程度
一致しているかを示す。
【0016】したがって、各ウェブイベントレコード
は、多数の定義済みのカテゴリーとの関連性を判定する
ため処理される。このカテゴリーは、広範なカテゴリー
及びトピックスを含む分類ツリーの形で維持される。好
ましくは、ウェブコンテンツは、カテゴリー毎にそのコ
ンテンツがカテゴリーに関して表現している程度を示す
ため得点化される。この分類は、ウェブマスタ若しくは
システム管理者による行動を要求することなく自動的に
行われる。
【0017】分類プロセスの一部として使用されるカテ
ゴリー自体は、コンテンツ認識エンジンに与えられるデ
ータの一部である。ProReachは、好ましくは、ProReach
がインストールされ、特定のウェブサイトで動き始める
と直ぐに、システムがウェブコンテンツ分類できるよう
に、ターンキーカテゴリーを与える。一実施例におい
て、ターンキーカテゴリーは、特定のローカルProReach
システム装置と通信する集中ホストシステムから与えら
れる。ホストProReachシステムは、企業の情報システム
の体系を構築するビジネス(e-business)の実際的な情
報ニーズをターゲットするカテゴリーの包括的な組と、
それらのカテゴリーのサンプルデータとを与える。
【0018】オプション機能として、ProReachシステム
のユーザは、カテゴリーを変更し、あるいは、専用カテ
ゴリーを作成することができる。このようにして、ProR
eachシステムを使用するウェブサイトは、潜在的顧客及
び顧客の閲覧習性をカスタム形式で分類することができ
る。ProReachシステムのユーザは新しい種類のカテゴリ
ーを作成するこができる。このカスタム化はオプション
であり、ユーザはカスタム化をしなくてもよい。ProRea
chは、カスタム化可能なターンキーシステムであるが、
カスタム化をしなくても利用できるシステムである。ま
た、ProReachは、カテゴリー作成やカテゴリー保守のプ
ロセスを支援するその他のツールも提供する。
【0019】ウェブビジターの行動に関するデータはそ
れ自体でも価値があるが、ProReachは、このデータから
より意味のある情報を抽出する。電子商取引意思決定者
は、ユーザの心理学的、人口統計学的なプロフィールに
関心がある。電子商取引意思決定者は、ユーザ行動のあ
らゆる単独の細部を求めるのではなく、ユーザ行動の細
部から抽象化されたユーザの関心のサマリーを必要とす
る。そのため、ユーザ行動の全ての細部データが非常に
有意義なサマリーに圧縮されることが非常に望まれるよ
うになる。したがって、本発明は、各ユーザ及び異なる
グループの詳細なインターネットプロフィールと、情報
のカテゴリーを生ずるためにこの情報を更に処理する。
【0020】本発明のProReachシステムは、ウェブ行動
収集のプロセスを用いてウェブビジターの行動のサマリ
ーを作成する。このプロセスを通じて、ProReachシステ
ムは、ビジターの行動の履歴を自動的に取得し、この履
歴を新たな訪問によって収集されたデータと一体的に統
合する。新たな訪問を取得し、これらを前の訪問と統合
するプロセスは、必要に応じて行われる。このようにし
て、ウェブビジターのプロフィールは、常に最新状態に
更新され、ウェブビジターの関心を反映する。
【0021】より詳細には、ProReachは、ウェブビジタ
ーのウェブ行動データを3次元的に、すなわち、誰が
(身元)、いつ(時刻)、何を行ったか(コンテンツ分
類)に関して収集する。このプロセスは、次元の合成と
呼ばれる。これらの3次元の他に、ProReachは複雑な統
計ベースの集計を行う。
【0022】ProReachシステムの別の長所は、ビジター
の行動を収集するアプローチがフレキシブルな点であ
る。異種の電子商取引は、ビジターの行動を異なる方法
で要約することを求める。その理由は、異なる企業が顧
客の特性を把握する異なるニーズをもつからである。
【0023】ProReachシステムは、ProReachシステム管
理者によって調整され得る優れた集計能力を提供する。
集計プロセスを制御するパラメータを設定することが可
能である。パワーとフレキシビリティは合成される。こ
れらのパラメータは、保持される情報と、その情報を保
持するために許容される記憶容量とを制御する。
【0024】本発明のこの局面において、所定のウェブ
サーバーに蓄積されたウェブイベントレコードは、最初
に、そのウェブサーバーの各ウェブユーザ毎に、好まし
くは、毎日のように一定間隔で周期的に収集された結果
の組に集計される。ユーザは、一日に何回も特定のウェ
ブサイトを訪問する場合があるので、個人ウェブイベン
トレコードがその都度生成される。同じことが多数の別
個のユーザについても当てはまる。したがって、ユーザ
毎に、そのユーザの全ての分類情報を集めるため、ウェ
ブイベントレコードが合成される。さらに、各ウェブイ
ベントレコード内のカテゴリースコア情報は、ウェブ行
動の間隔を反映させるため処理される。この処理によっ
て、カテゴリー重みの組が生成される。
【0025】1日のような期間に収集された合成された
カテゴリーのカテゴリー重み付け情報は、多数のカテゴ
リーに亘るユーザの関心の程度を詳細に記述する。しか
し、ユーザ関心のより良く要約されたモデルを獲得する
ため、更なる処理が有益である。重み付きカテゴリー情
報から、種々の統計的測定量、たとえば、時間的な平均
カテゴリー重み、最大重み、最小重み、標準偏差などが
得られる。さらに、ユーザのカテゴリーに対する関心が
上昇中、下降中、又は、一定であることを表すトレンド
パターンが獲得される。時間区間的にカテゴリー重みに
関して要約された表現は蓄積され、その時間区間的に多
数のカテゴリーの全域でユーザ関心の変化がもっとも巧
く捕捉される。その結果として、基礎となるウェブイベ
ントレコードの未加工データは削除され、効率的な記憶
が実現される。
【0026】第一に、周期的情報は、より長い時間に亘
って各カテゴリーに関するユーザ毎に集計される。たと
えば、ユーザに関して毎日集計された情報は、週毎の時
間的区間、1月毎、3ヶ月毎、1年毎などのより長い時
間で更に集計される。これにより、いわゆる「ユーザ・
カテゴリーコンプレックス」が形成され、多数の異なる
日からの単一のカテゴリーに関する統計的情報は集計関
数によって合成される。一例として、集計関数は平均化
である、特定のカテゴリーに関する時間的なカテゴリー
重みの平均がトレンドパターン及びその他の統計的測定
量と共に獲得される。
【0027】第二に、次元結合は、カテゴリーコンプレ
ックスを形成するため使用される。カテゴリーコンプレ
ックスは、選択された時間的区間の間に特定のカテゴリ
ーにおける多数のユーザ関心を要約する。カテゴリーコ
ンプレックスは、特定のカテゴリーのおけるユーザの集
団の時間的な関心のレベルを記述する。
【0028】別のタイプの次元結合は、ユーザ・カテゴ
リーコンプレックスを使用する。第一に、個別のユーザ
に対する多数のユーザ・カテゴリーコンプレックスは、
選択された時間的区間の間に結合され、ユーザの全体的
な関心の集計された見解を形成する。すなわち、多数の
異なるカテゴリーからのカテゴリー情報が集計され、ユ
ーザの全体的な関心を記述する。
【0029】さらに、ユーザ・カテゴリーコンプレック
スは、ユーザグループ・カテゴリーコンプレックスを形
成するため、個別のカテゴリーと、ユーザグループを形
成する選択されたユーザとに関して結合してもよい。ユ
ーザグループメンバーは、ユーザのカテゴリー関心とオ
プションとして人口統計学とに基づくある種のメンバー
シップテストに合致することによって選択される。これ
により、そのカテゴリーについての時間的なユーザグル
ープの関心のサマリーが得られる。
【0030】ユーザコンプレックスは、全てのカテゴリ
ーにおける全体的なグループ関心を記述するため、ユー
ザグループコンプレックスに結合されうる。最終的に、
グループコンプレックスは、選択された時間的区間の間
に全カテゴリー域での総集団の関心を記述する全体的な
総コンプレックスを形成するため集計される。
【0031】集計される多数のコンプレックスの他に、
ユーザの個別のプロフィールは、ユーザグループ情報が
更に追加される。特定のメンバーシップ基準を有する多
数のユーザグループが定義される。商取引者は、関心を
共有するユーザのグループ、購買傾向、又は、人口統計
学を定義することができる。メンバーシップ基準は、好
ましくは、一つ以上のカテゴリーに対し、特定のレベル
若しくは範囲のカテゴリー重みを持つ(又は持たない)
ユーザに基づく。ユーザは複数のユーザグループのメン
バーでもよい。グループメンバーシップは、ユーザが規
定時間以上、ウェブコンテンツと相互作用したとき、並
びに、ユーザの関心がカテゴリー重みのレベル変化によ
って表されるように変化するときに、自動的に更新され
る。ProReachシステムは、ユーザのプロフィールに基づ
いて、ユーザを正しいユーザグループに自動的に分類す
る。ユーザグループの定義が変化したとき、ProReachシ
ステムは、ユーザを正しいユーザグループに自動的に再
分類する。同様に、ユーザの関心が変化すると共に、ユ
ーザは新しい関心に基づいて正しいビジターセグメント
に自動的に収容される。このように、商取引者は、オン
デマンドでマーケットセグメントに直接アクセスし、電
子セールスキャンペーンを迅速に実施することができ
る。
【0032】ProReachシステムが生成するビジタープロ
フィール情報は、その情報を作成したウェブサイトの単
独の用途及び利益のため確保される。ProReachシステム
は、ユーザプロフィール情報を共有してもよい。この共
有化を容易に実現するため、ProReachは、ProReachシス
テムが相互に情報の転送の方針を決めるのを補助する集
中サービスを提供する。相互により深い関係を必要とす
るProReachの顧客に対し、本発明はアライアンス(同盟
機構)を提供する。アライアンスは、ユーザプロフィー
ルをプロフィールデータベースに供与することが決めら
れたProReachシステムのグループである。アライアンス
の全メンバーはプロフィールを供与し、アライアンスの
全メンバーはアライアンスプロフィールへのアクセス権
を取得することにより恩恵を授かる。特に、アライアン
スは、企業がワールド・ワイド・ウェブ上で一体的に仕
事をしようとする垂直的に統合されたマーケットで有用
である。このような企業のグループは、情報を結合する
ことにより利益が得られるが、共有化を促進し、調整
し、確実なものとするため、基盤構造を必要とする。Pr
oReachは、共有化を可能にさせる基盤構造を提供する。
アライアンスにおいて、各メンバーは、ビジターに対し
て作成されたビジタープロフィールをメンバーのウェブ
サイトに供与する。これらの供与されたプロフィール
は、アライアンスにより維持されるプロフィールのデー
タベースに一体的に収集される。このアライアンスへの
全メンバーは、これらのプロフィールへの条件付きアク
セス権を取得する。共有ルールのシステムは、全体的な
共有プロセスを制御するので、企業は選択された情報だ
けを共有する。ProReachは、多数のアライアンスの情報
を支援する。ProReachを使用可能なシステムは、二つ以
上のアライアンスに所属することが可能である。
【0033】非常に多量のビジター行動データは、ProR
eachシステムを使用するウェブサイトによって生成され
る。このデータの存在は、プライバシー事項を増加させ
る。また、このデータは、ProReachシステム自体がシス
テム間でデータを共有する方法に関する問題を生じさせ
る。ProReachは、プライバシー事項を扱うアーキテクチ
ャーを具備する。ProReachは、いわゆる身元情報ファイ
アウォールを用いてウェブビジターのプライバシーを保
障する。身元情報ファイアウォールの目的は境界を確定
することである。身元情報ファイアウォールの境界の内
側で、ウェブビジターの身元は、許可を得た人又はプロ
セスにアクセス権がある。電子メールアドレス、ホーム
ページアドレス及び年齢のような他の個人情報も利用可
能である。
【0034】身元情報ファイアウォールの境界の外側で
は、ウェブビジターを識別するため使用できる情報は与
えられない。実際上、身元情報ファイアウォールの外側
で情報を要求する人若しくはプロセスは、不透明なビジ
ター識別子しか得られない。不透明なビジター識別子を
発行するProReachシステムは、ウェブビジターを個別に
識別するためそのビジター識別子を使用することができ
る。したがって、不透明なビジター識別子は、ProReach
ビジターへの外部参照可能な名前である。
【0035】不透明なビジター識別子を備えた人若しく
はプロセスは、不透明なビジター識別子をPrpReachシス
テムに提示することができる。ProReachシステムは、不
透明なビジター識別子を実際のビジターに割り当てる。
この方法を用いることにより、ウェブ商取引者は、たと
えば、ウェブビジターの関心に関する多量の情報を得る
ことができるが、商取引者はビジターの身元情報や連絡
先情報はわからない。ウェブ商取引者は不透明なビジタ
ー識別子(若しくは、ビジター識別子の組)しか与えら
れない。商取引者は自分が必要とする情報を取得する
が、ビジターのデータのプライバシーは保護される。し
たがって、身元情報ファイアウォールの外側で、ProRea
chによって追跡されるウェブビジターは匿名である。
【0036】ウェブ商取引者は、IProのビジター交信サ
ービス(Visitor Contact Service)を用いて自分の代
わりにProReachシステムをウェブビジターと交信させ
る。不透明なビジター識別子及びメッセージが与えられ
た場合、ビジター交信サービスは電子メールアドレス
(又は、その他の必要な情報)を参照する。次に、ビジ
ター連絡サービスは、メッセージをウェブビジターに送
信する。ウェブ商取引者は、自分のメッセージをウェブ
ビジターへ配信させるが、ウェブ商取引者はウェブビジ
ターの身元情報を知らない。
【0037】身元情報ファイアウォールはフレキシブル
に構成することができる。身元情報ファイアウォール
は、単一のProReachシステムを取り囲むように構成する
ことが可能である。身元情報ファイアウォールは、ProR
eachシステムのグループを取り囲むように構成してもよ
い。ProReachシステムのグループを取り囲む構成は、
(たとえば、多数のサーバーを備えたポータルの場合
に)グループとして働く多数のProReachサーバーが存在
し、データがサーバー間で共有されるべき場合に意味を
もつ。
【0038】
【発明の実施の形態】本発明の好ましい実施例を以下の
順序で説明する。 I.ウェブイベント及び集計 A.ウェブイベントレコード II.ProReachシステムアーキテクチャーの概
要 A.グローバルサービス III.基本システム処理 A.ProReach機能的概要 B.カテゴリー発見及び保守 1.カテゴリー発見 2.カテゴリー保守 IV.アライアンスを含むProReachシステム V.集計 A.毎日のウェブイベント集計 1.カテゴリースコアの重みへの変換 2.ユーザによるカテゴリー重みの順序付けのためのウ
ェブイベントレコードの再構成 3.カテゴリー関心時間モデル情報の作成 B.次元結合 C.ユーザグループシステム D.毎日の集計 E.アフィニティグループマネージャ F.更新オブジェクト G.スケジューラ H.イベントディスパッチャ I.プロフィールシステム J.AQLシステム 1.AQL言語 2.AQLインタープリタ VI.カテゴリー及び分類 A.分類の概要 B.カテゴリー及び階層組織データ 1.カテゴリー階層の構築及び維持 C.カテゴリー名及びID 1.デフォルト変更不可ユーザ・カテゴリー構造 2.カテゴリーとグループの類似性及び相違性 D.分類におけるソース及びロケーションの使用 E.コンテンツカテゴリーライフサイクル:形成、調整
及び変更 1.標準カテゴリーツリーと、ProReachシステ
ム管理者による追加 a)ProReachシステムでのカテゴリーの追加 b)標準カテゴリーツリーの更新 c)標準カテゴリーツリーの構築 d)カテゴリーの発見、改良及び編集 F.コンテンツ認識エンジンの分類モデル 1.カテゴリー作成 2.文書分類 3.多重辞書分類 4.カテゴリーキャッシュ VII.グローバルサービス A.グローバル識別子(GID)サービス 1.GID要求 2.PIDを用いた個人識別 B.グローバルアップロードサービス C.グローバルクライアント管理サービス D.イエローページ E.グローバル交換手段 VIII.ProReachクライアント側のウェブ使
用データ収集 A.ウェブ行動監視 B.ProReachクライアントウェブ使用データの
フィルタ及び集計 1.時間ベース統合 a)ウェブイベントレコードタイムスタンプの調整 b)短時間行動の無視 c)ウェブ行動の集計 2.他のデータのフィルタ 3.プライバシー制御 C.プライバシー設定値(ユーザ変更可能)に基づくフ
ィルタ 1.URLパターンベースフィルタ 2.キーワードベースフィルタ D.デフォルトプライバシー関連フィルタ E.ProReachクライアントデータアップロード 1.ProReachクライアントアップロードキュー 2.ProReachアップロードストリーム及びアッ
プロードレコード 3.データアップロード a)ウェブイベントレコードアップロード b)ホームページURLアップロード 4.時間のアップロード及びアップロードステージ a)プレアップロードステージ b)アップロードステージ c)ポストアップロードステージ 5.ProReachアップロードサービス及びアップ
ロード IX.コンテンツターゲッティング A.CGIによるプロフィールへのアクセス 1.CGIによるページメタデータへのアクセス a)実行時におけるマルチパートページの動的コンテン
ツ分類の取り扱い以下、本発明の実施例を詳細に説明す
る。
【0039】I.ウェブイベント及び集計 図1を参照するに、ウェブコンテンツ内でウェブビジタ
ーの関心を測る基本モデリングユニットとして使用され
るウェブイベントの概念説明図が示されている。ウェブ
イベント101は、3種類の情報の結合体である。第一
に、ウェブイベント101は、特定のウェブビジター1
03、すなわち、一般的に、「ユーザ」を個別に識別す
る情報を含む。このユーザは、個人でも、ユーザが所属
していると考えられる個人のグループでもよい。第二
に、ウェブイベント101は、ウェブビジターがウェブ
コンテンツを閲覧し、あるいは、ウェブコンテンツと相
互作用する際に消費した時間の長さを記述する情報10
7若しくは測定量を含む。
【0040】第三に、ウェブイベント101は、一つ以
上のカテゴリー105を識別する情報を含む。カテゴリ
ーにはウェブビジターが訪れたウェブコンテンツが属
し、カテゴリー毎にユーザの関心の測定量が含まれる。
ウェブコンテンツを記述するため使用されるカテゴリー
は、好ましくは、カテゴリーの階層を形成し、親カテゴ
リー(たとえば、「スポーツ」)は、多数の子カテゴリ
ー(たとえば、「サッカー」及び「ゴルフ」)をもつ。
【0041】これらの3種類のデータは、ウェブコンテ
ンツの項目を閲覧し、あるいは、項目と相互作用するユ
ーザは、そのウェブコンテンツに関するカテゴリーに
「関心(興味)」を抱いていることを表現しているとい
う基本的なアイデアをモデル化するため使用される。ビ
ジターがウェブコンテンツを閲覧、相互作用する時間が
長くなるほど、ビジターの関心が高くなると考えられる
(勿論、関心のレベルを測るためには、単にページを眺
めるだけ、あるいは、商品を購入するなどの相互作用タ
イプのようなその他の要因も使用される)。
【0042】特定の時刻若しくは間隔におけるあるカテ
ゴリーへのユーザの関心の測定量は、以下の説明では、
「重み」と呼ぶ。重みは、ウェブコンテンツの項目と相
互作用するビジターが費やした時間の長さと、カテゴリ
ーがそのコンテンツを記述していると思われる程度との
関数である。多数のカテゴリーが利用できる好ましい一
実施例において、ウェブイベントはカテゴリー毎に重み
を含む。これは、ウェブコンテンツの所与の項目が多数
のカテゴリーに異なる度合いで関係する事実を反映して
いる。
【0043】これらの重みの解釈の重要な尺度、すなわ
ち、カテゴリーへの関心のレベルを与えるため、重み
は、相互作用ユニットと呼ばれる標準ユニットに応じて
決められる。相互作用ユニットは、ユーザがコンテンツ
の項目に1分間の注意を払ったことを意味する。相互作
用ユニットを用いてウェブイベントを測ることにより、
多種多様なユーザの関心及びウェブコンテンツのカテゴ
リーを有意に比較することができる。
【0044】上記3通りの情報は、特定のウェブサイト
でウェブビジターが訪れたウェブコンテンツの項目ごと
に収集され、多数のウェブサイトに亘る多数の異なるビ
ジターによって拡張される。たとえば、ビジターが所与
のウェブサイト上であるウェブページから別のウェブペ
ージに移動するとき、ビジターを識別する情報と、ペー
ジのカテゴリー説明と、ページ上でビジターが費やした
時間の長さとをカプセル化したウェブイベントが生成さ
れる。同じビジターが異なるウェブサイトを訪れると
き、ビジターは識別され、コンテンツのカテゴリーと、
このコンテンツの閲覧に費やされた時間とを獲得したウ
ェブイベントが生成される。
【0045】ウェブイベント自体は、単に個別のデータ
項目であり、個々のユーザ若しくはユーザグループの関
心の全体的なパターン、又は、カテゴリー若しくは時刻
に関するパターンを直接的に記述するものではない。こ
の抽象化のレベルは、本発明の第2の局面である集計に
よって与えられる。一般的に説明すると、集計は、関心
のパターンを確定するためウェブイベントの異なるグル
ープの重みを要約するプロセスである。一般的に、ウェ
ブイベントは、時間的区間、個別のユーザ、ユーザのグ
ループ、カテゴリーのグループ、あるいは、これらの組
み合わせに関して結合され得る。全体をまとめて考慮す
ると、ウェブイベントを結合するには以下の6通りの方
法がある。
【0046】方法1)二つの日付の間で全ウェブイベン
トを結合する。この結合方法は、ユーザの集合の総合的
な関心、すなわち、グローバル関心のモデルを得るた
め、所定の時間的区間に亘る全カテゴリー及び全ユーザ
に関するウェブイベントを結合する。
【0047】方法2)二つの日付の間であるカテゴリー
に対する全ウェブイベントを結合する。この結合方法
は、特定のカテゴリーに関するユーザの関心のレベル及
びパターンのモデルを得るため、所定の時間的区間に亘
る全ユーザに関する特定のカテゴリー(又は、カテゴリ
ーのグループ)に対するウェブイベントを結合する。
【0048】方法3)二つの日付の間であるユーザ及び
あるカテゴリーに関するウェブイベントを結合する。こ
の方法は、特定のカテゴリーに関するユーザの関心のレ
ベル及びパターンのモデルを得るため、所定の時間的区
間に亘って特定のユーザ及び特定のカテゴリーのウェブ
イベントを結合する。
【0049】方法4)二つの日付の間であるユーザグル
ープ及びあるカテゴリーに関するウェブイベントを結合
する。この方法は、特定のカテゴリーに関するユーザグ
ループの関心のモデルを与える。
【0050】方法5)全カテゴリーを通じて二つの日付
の間で特定のユーザに関するウェブイベントを結合す
る。この方法は、全カテゴリーに対するユーザの関心の
全体的な分布の様子と、ウェブサイトに保持されている
一つ乃至少数の狭いカテゴリーに関心があるか、あるい
は、ウェブサイトの多数のカテゴリーに広範な関心があ
るかどうかを説明する。
【0051】方法6)全カテゴリーを通じて二つの日付
の間でユーザグループに関するウェブサイトを結合す
る。
【0052】一実施例において、上記の種々のタイプの
結合を行うとき、所定の時間的区間中に選択されたイベ
ントは、その時間的区間内に始まったイベントであり、
選択された時間的区間後に終了するイベントも含まれ
る。
【0053】このような種々の方法でウェブイベントを
結合するプロセスは、ウェブイベントを結合するために
使用される次元がデータ内に6次元存在するので、以下
の説明では「次元結合」と呼ぶ。これらの実施可能な結
合方法は、時間的な期間中にあるカテゴリーに関するユ
ーザ若しくはグループの関心を分析する。図2を参照す
るに、ウェブイベントを結合する種々の方法が示されて
いる。
【0054】図2に示された多数の離散的なウェブイベ
ント101は、ある時間的区間、たとえば、長い日数に
発生する。1日毎のウェブイベント101は全てユーザ
固有の毎日集計される結果201に集められる。これら
の毎日集計される結果201は、同図ではレベル0のよ
うに表される。ウェブビジターの関心を理解するため、
ある日数(たとえば、1週、1ヶ月、3ヶ月、1年な
ど)に亘るウェブイベントは、上述の通り種々の方法で
結合される。
【0055】最初に、レベル1において、毎日の集計
は、上述の方法3)にしたがって、UC(ユーザ・カテ
ゴリー)コンプレックス203に結合され、あるいは、
方法2)にしたがって、C(カテゴリー)コンプレック
ス205に結合される。1日毎に集計された結果101
は、コンプレックス203とコンプレックス205の両
方に寄与することに注意する必要がある。すなわち、特
定のウェブビジターのウェブ行動は、そのビジター行動
による影響を受ける全てのカテゴリーに対するカテゴリ
ーコンプレックス205と、種々のカテゴリーに対する
ユーザの関心のレベルを記述するユーザ固有のユーザ・
カテゴリーコンプレックス203とに寄与する。
【0056】次に、レベル2では、個々のUCコンプレ
ックスが結合される。第1に、上述の方法4)にしたが
って、ユーザグループを形成するあるユーザについての
特定のUCコンプレックスがGC(グループ・カテゴリ
ー)コンプレックス206に結合される。このコンプレ
ックス206は、そのデータに関する特定のカテゴリー
へのグループの関心を記述する。第2に、上述の方法
5)にしたがって、特定のユーザに対するユーザ・カテ
ゴリーコンプレックスの全てが単一のU(ユーザ)コン
プレックス207を形成するため結合される。このユー
ザコンプレックス207は、カテゴリーの全域における
ユーザ関心を要約する。ユーザコンプレックス207
は、特に、ユーザ関心の広さ若しくは狭さを測るため有
用である。たとえば、ウェブサイトがコンテンツのカテ
ゴリーを制限される場合を考える。このウェブサイトの
一人のユーザについて、ユーザコンプレックス207は
1乃至2個のカテゴリーだけに高レベルの関心を示し、
他のユーザのユーザコンプレックス207は大多数のカ
テゴリーに高レベルの関心を示す。この2番目のタイプ
のユーザは、商取引の目的のため、若しくは、その他の
価値駆動型行動のためのウェブサイトにとって大切であ
る可能性が高い。
【0057】次に、レベル3では、個別のユーザのため
のコンプレックス207が上述の方法6)にしたがっ
て、全てのカテゴリーを通じてG(グループ)コンプレ
ックス209に結合される。
【0058】最後に、レベル4において、多数のグルー
プからのコンプレックス209が上述の方法1)にした
がって、全ユーザの全カテゴリー域への関心を記述する
T(総合)コンプレックス211に結合される。
【0059】このウェブイベントモデリング及び集計の
枠組みは多数の有利な特徴を与える。第一に、システム
管理者(若しくは、ProReachシステムのメンバー)は、
ユーザ関心の時間的パターンのより広い分析又はより狭
い分析を獲得するために集計が行われる時間的区間を自
由に選択することができる。これは、非常に短期間の関
心の傾向、又は、より長期間のユーザ関心の傾向を識別
するため有用である。第二に、集計の各レベルは下位レ
ベルの情報を完全に獲得するので、下位レベルのウェブ
イベントデータは記憶効率を高めるため選択的に消去し
ても構わない。たとえば、(小さい重みによって確認さ
れる)非常に低いレベルの関心しかないカテゴリーに関
するウェブイベントは、そのデータがUCデータ若しく
はCデータ中に要約された後、消去してもよい。より大
きい重みをもつウェブイベントは、より多くの分析若し
くは販売のため使用できるように、より長期間記憶され
る。
【0060】A.ウェブイベントレコード ウェブビジターが、ユニフォーム・リソース・ロケータ
(URL)のコンテンツを閲覧したり、あるいは、ウェ
ブ取引を開始するサブミットボタンをクリックするよう
なウェブ行動を実行するとき、このウェブ行動は、クラ
イアント側又はサーバー側のトラッカーによって記録さ
れ、ウェブイベントが記録される。各ウェブイベントの
データはウェブイベントレコードに蓄積される。ウェブ
イベントレコードは、次に、毎日集計される結果101
に集計され、その結果から多数のコンプレックスが得ら
れる。ウェブイベントレコードの基本的な特徴は以下の
通りである。
【0061】
【表1】 たとえば、ユーザのウェブ行動として以下の行動を考え
る。
【0062】
【表2】 ウェブイベントレコードは、ウェブクライアント108
若しくはウェブサーバー102によって生成される。ウ
ェブクライアント108上で生成された場合、対応した
ウェブイベントレコードは以下の通りである(ユーザI
D及びカテゴリ−スコア情報は示されていない)。
【0063】
【表3】 注1:URLが取得されたとき、現在時刻がウェブイベン
トレコード内の標準時刻タイムスタンプフィールドに記
憶される。現在時刻と、前のレコードのタイムスタンプ
内の時刻との差が計算され、前のレコードの間隔フィー
ルドに記憶される。
【0064】注2:間隔は、終了時刻−開始時刻に一致
する場合と一致しない場合とがある。その理由は、この
URLへの最先のダウンロードと最新のダウンロードの間
に他のイベントが存在し得るからである。たとえば、<U
RL B>と<URL C>のビジットの間に2分のギャップがあ
る。行動テーブル内の間隔フィールドは、ユーザが特定
のURLをブラウズ(読む)際に費やした実際の時間を示
し、一方、ウェブイベントレコード内の間隔フィールド
は、その時間の近似である。ウェブイベントレコードが
ウェブクライアント108によって作成された場合、ク
ライアントソフトウェアは、現在URLの終了時刻として
次のURLの開始時刻を選ぶことにより現実の間隔を近似
するだけである。ソフトウェアは、ユーザの介入なくし
て、URLビジットの間のアイドルギャップを知る方法が
ない。ウェブイベントレコードがユーザを追跡するウェ
ブサーバー102によって生成されるとき、その間隔を
推定することができる。
【0065】注3:ここで、<URL E>に対する間隔は、
ウェブクライアント108によって、13分50秒(10:30-1
0:16:10=00:13:50)として計算される。ウェブクライア
ント108は、<URL E>へのアクセス後のアイドル時間
がわからない。しかし、ウェブクライアント108(若
しくは、ウェブサーバー102)は、単一のURLアクセ
スの間隔に対し予め設定された最大時間、たとえば、5
分間を保持する。これは、唯一のURLアクセスが異常に
大きい間隔をとることがないように、間隔因子を正規化
するためにある。ユーザは、2回のURLアクセス間にし
ばらくの期間、他の行動に拘わり、その結果として、異
常に長い間隔の数値を生じる場合がある。このような異
常に長い間隔の数値は、ユーザのウェブ使用状況パター
ン及びプロフィールを不正確にする影響がある。しか
し、累算的間隔は、最大間隔数値には制限されないこと
に注意する必要がある。たとえば、<URL A>の間隔は、
二つの別々のURLアクセスの集計であるので、5分間の限
界によって制限されない。
【0066】注4:行動5、7及び8は、時間的区間が
非常に短いため取り除かれるので、いずれのウェブイベ
ントの合計間隔にも含まれない。このような短時間の閲
覧はユーザの実際の関心を示す可能性が少ないので、短
時間の行動を間隔から除くことはデータ収集要求量を減
少させるため役立つ。
【0067】次節では、ウェブイベントを記録し、上述
のデータを集計する多数の能力を与えるシステムのアー
キテクチャー及び機能性を説明する。
【0068】II.ProReachシステムアーキテ
クチャーの概要 本発明は、ProReachと呼ばれるシステムに組み込まれ
る。最初に、ProReachアーキテクチャーの非常に上位レ
ベルの概要を説明し、次に、このアーキテクチャーに含
まれる上位レベルの構成要素について説明し、これらの
構成要素間の上位レベルの関係を示す。また、ProReach
のいくつかの典型的なコンフィギュレーションを説明
し、ProReachがファイアウォールの向こう側にある一つ
以上のウェブサーバーをファイアウォールを通してサポ
ートする方法を説明する。アライアンスの基本要素の説
明もなされる。
【0069】図3を参照するに、インターネット経由で
動作する多数のProReachシステム100が示されてい
る。各ProReachシステム100は、1台以上のウェブサ
ーバー102を扱う。これらのウェブサーバー102
は、全て同じドメインに属してもよく、あるいは、別の
ドメインに属してもよい。図3には、二つのProReachシ
ステム100が示されている。一方のProReachシステム
100は、1台のウェブサーバー102をサポートし、
もう一方のProReachシステム100は2台のウェブサー
バー102をサポートする。同図には、全部で3台のPr
oReach使用可能ウェブサーバー102がある。
【0070】ProReachシステム100の各ProReach使用
可能ウェブサーバー102は、ウェブサーバー102が
サービスを提供するウェブサイトで個別のウェブビジタ
ーのウェブビジットを追跡する。ウェブサーバー102
は、ウェブビジターを追跡、識別し、閲覧されたコンテ
ンツに対するカテゴリー情報を獲得し、ビジットの時刻
及び間隔を含むログを記録する。このデータが収集され
た後、ProReachシステム100は、ウェブビジターを評
価するためデータを分析し、ウェブビジターのプロフィ
ールを作成若しくは更新する。これにより得られたユー
ザのプロフィール(又は、ユーザのビジットによる影響
を受けたその他のプロフィール)が販売目的、ページ編
集、若しくは、バーナー広告の推進のため使用され得
る。
【0071】多数のProReachシステムは、ProReachグロ
ーバルサービス110を利用する。グローバルサービス
110は、情報の効率及び真正の観点から高度に集中さ
れた多数のタスクを実行する。以下に更に説明されるグ
ローバルサービス110には、ウェブビジターの識別、
標準化カテゴリーの保持及び多数のシステムへの配信、
並びに、システム100間で情報を交換するメカニズム
が含まれる。
【0072】図3には、2台のウェブクライアント10
6及び108が示される。ウェブクライアントは、Nets
cape Communicatior(R)又はMicrosoft Internet Explor
er(R )のようなウェブブラウザを含む通常のコンピュー
タである。ProReachは、既存のウェブブラウザと統合さ
れ、本発明の特徴若しくは効果を得るために特別のブラ
ウザは必要とされない。しかし、選択的な改良として、
一部のウェブクライアント108はProReach使用可能で
ある。すなわち、クライアント108はクライアント側
の追跡ソフトウェアを実行する。周期的に、ProReach使
用可能クライアント108は、ウェブ行動のデータをア
ップロードするため、特に、ProReachシステム100を
持たないウェブサイト上のウェブクライアントのユーザ
のウェブイベントを追跡するため、ProReachグローバル
サービス110を自動的に使用する。この特徴によっ
て、ProReachシステム100及びサーバー102におけ
るユーザの行動だけでなく、ユーザの全てのウェブ行動
に関する情報を統合できるので、ユーザ関心の非常に完
全な観察が行える。ProReachグローバルサービス110
は、このクライアントデータを多数のProReachシステム
100に送信する役割を担う。
【0073】図4を参照するに、多数のウェブサーバー
102をサポートするため、各ProReachシステム100
は、ハブ204と1台以上のスポーク202とを含むハ
ブ及びスポークトポロジーで構成される。各ハブ及びス
ポークは、実行可能なソフトウェアモジュールの集まり
である。全体として、ProReachシステム100は、4台
のPentium(R)II XeonTMプロセッサと8GBのメモリと
を具備した大規模ウェブホスト用サーバーであるFujits
u teamserver M800i シリーズサーバーのような企業サ
ーバークラスハードウェア上で動く。ソフトウェア環境
は、好ましくは、オペレーティングシステムとしてMicr
osoft Windows NT 4.0を含み、ウェブサイト管理用のMi
crosoft(R) Internet Information Server(R) 4.0 (I
IS)と、ファイアウォール管理用のMicrosoft Proxy Ser
ver 2.0と、コンテンツ管理並びにユーザ及びグループ
プロフィールに基づく配信用のMicrosoft Site Server
3.0とを含む。
【0074】より詳細には、各スポーク202は、ウェ
ブサーバー102からのビジターデータを収集し、分類
するために設けられる。データがウェブサーバー102
から収集された後、データはスポーク202上で部分的
に処理される。部分的に処理されたデータは、スポーク
202からハブ204に移される。ハブ204で、デー
タが集計され、最新のビジタープロフィールを生成する
ため分析される。同じウェブビジターからのデータは、
異なるスポーク202から送られてくるが、ハブ204
はこのデータを適当なユーザプロフィールに集計するこ
とに注意する必要がある。
【0075】ProReachは、殆どのProReachサービスが企
業ファイアウォール内に含まれるように構成される。ウ
ェブサーバー102自体は、ファイアウォールの外側に
ある。単一のウェブs-バー用のProReachシステム100
を含む典型的なProReach構造は、図5に示されている。
ProReach使用可能ウェブサーバー102はファイアウォ
ール206の外側にある。ProReachスポーク202は、
ウェブサーバー102に接続され、Javaサーブレットの
ようなサーバー側プラグインを用いて通信を行う。ProR
eachスポーク202自体は、上述のようにProReachハブ
204に接続される。図5には、一つのスポーク202
しか示されていないが、既に説明した通り、それぞれが
専用のウェブサーバー102をサポートする多数のスポ
ーク202を使用してもよい。ProReach使用可能クライ
アント108は、ProReachを含まない非ProReachウェブ
サーバー113におけるユーザビジットを追跡し、蓄積
した使用状況データをProReachグローバルサービス11
2に送信する。次に、ProReachグローバルサービス11
2は、使用状況データを適当なProReachシステム100
に回送する。図5には、ProReachシステム100が他の
ProReachシステム100と協働する方式が示されてい
る。一方のProReachシステムのハブ204が別のProRea
chシステム100と通信する方式に注意する必要があ
る。このような通信はシステム100の間でのデータの
共用を扱うことができる。
【0076】ProReachは、ウェブファイアウォール20
6を越えて働く。たとえば、企業が2台のウェブサーバ
ー102を有し、それぞれのウェブサーバーが固有ドメ
イン名及びファイアウォール206をもつ場合を考え
る。それらのウェブサイトにおいて、全ウェブビジター
を追跡することが望ましい。この場合、異なるProReach
の構造、すなわち、一つのスポーク202がローカルハ
ブ204に取り付けられ、他のスポーク202は遠隔地
にあり、別のファイアウォール206の向こう側にある
構造が使用される。ProReachがファイアウォールを越え
て作用することができる能力は、特に、異なる組織若し
くは企業に属するウェブサイトが論理ユニットとして一
体としてグループ化され、それらのウェブビジターのデ
ータが共用されるべき場合に望まれる。
【0077】A.グローバルサービス 一実施例において、ProReachは、多数のグローバルサー
ビス112を提供する。これらのサービスは、マスター
・ホスト・システム及びサーバーによって提供され、た
とえば、ProReachシステム100の総合的なプロバイダ
によって与えられる。このグローバルサービスは図6に
示されている。
【0078】グローバル識別子サービス602は、グロ
ーバル識別子[GID]を割り当て、ビジター識別情報に関
連した他の機能性を実現する。GIDは、ウェブビジター
を大域的に識別するため使用され、これにより、ビジタ
ーのウェブイベント及びその他の使用状況データは、多
数の異なるProReachシステム100又はProReach使用可
能ウェブクライアント108から受信されたとき、適切
に順番に揃えられる。
【0079】グローバルカテゴリーツリーサービス60
4は、標準的なカテゴリーの収集物を保持し、配信す
る。これにより、異なるProReachシステム100は、ウ
ェブコンテンツを説明し、分類するため共通のカテゴリ
ー集合を使用する。このように、多数のウェブサイトか
らの関心情報は、カテゴリーの共通フレームワークに対
して測定され、評価される。
【0080】グローバルアップロードサービス606
は、多数のProReach使用可能ウェブクライアント108
からアップロードされたウェブ行動データを受信するた
め、クライアント追跡ソフトウェアと共に動作する。こ
のグローバルサービスは、ウェブ行動データを適切なPr
oReachシステム100に配信する。
【0081】グローバルクライアント管理サービス60
8は、全てのRroReach使用可能ウェブクライアント10
8のリストを保持し、このリストを保守することにより
(たとえば、新しいProReach使用可能ウェブクライアン
ト108を追加し、動作しなくなったウェブクライアン
トを削除することにより)、ProReach使用可能ウェブク
ライアントの管理を助ける。
【0082】グローバルイエローページ610のサービ
スは、ProReachシステム100のLDAPディレクトリを保
持する。
【0083】グローバル交換手段サービス612は、個
々のProReachシステム100が、他のProReach使用可能
システム100とウェブビジター情報を交換するための
ビジネス規則を記述する。
【0084】III.基本システム処理 ProReachの役割は、ユーザデータを取得し、ユーザデー
タを分析し、個別のビジター若しくはビジターの集合的
なグループに対するビジタープロフィールサマリーを生
成することである。ビジタープロフィールサマリーは、
所与のウェブビジター若しくはグループの関心を記述す
る。このウェブプロフィールサマリーの生成には多数の
異なるプロセスが関連する。これらのプロセスは一般的
に以下の通りである。 ・ウェブサーバー上でウェブビジター行動を追跡 ・ウェブクライアントからウェブビジター行動を追跡 ・ウェブビジターが閲覧した文書を分離し、重みを決定 ・時刻、ユーザ及びカテゴリーによってウェブイベント
を集計 ・異なるウェブサイトを訪れた同じウェブビジターを識
別 ・異なるウェブサイトで、同一ウェブビジターに関する
データを集計し、ウェブビジターのグローバルプロフィ
ールを生成 ・カテゴリーの発見と保守 次の2節の前半部では、一部のProReachのキーアプリケ
ーションプロセスの全体を概括する。次の節で、カテゴ
リーの発見と保守について説明する。
【0085】A.ProReach機能的概要 本節では、基本ProReachシステム100を流れるデータ
フローを示すため、基本処理ステップを説明する。ま
た、ProReachシステム100の構造的特徴について詳細
に調べる。
【0086】基本処理ステップを集中的に説明するた
め、ある程度の簡単化を行い、特定のシナリオだけを明
らかにする。以下では、ProReach使用可能ウェブサーバ
ー102だけがウェブクライアント106に常駐するク
ッキーに基づいてウェブビジットを追跡する場合を考え
る。ProReachは、ログイン名とその他の情報にも基づい
てウェブビジターを追跡するが、この追跡については説
明しない。さらに、殆どのウェブクライアントで成り立
つように、ウェブクライアント106がクッキーを許容
する場合を想定する。
【0087】一般的に、ウェブ行動を追跡するプロセス
の全体は以下のとおりである。
【0088】・ウェブクライアント106がProReach使
用可能サイト100を訪れる。
【0089】・ProReach使用可能ウェブサーバー102
は、ウェブクライアント106をグローバルサービスウ
ェブサーバー112へ切り換える。このウェブサーバー
112は、ウェブビジターを識別するグローバル識別子
(GID)を割り当てる。ウェブビジターは、できる限り
明確に識別される。識別情報は実際の人を正確に示す場
合もあれば、使用されるウェブクライアント106を識
別するだけの場合もある。
【0090】・グローバルサービスウェブサーバー11
2は、ウェブクライアント106を元のProReach使用可
能ウェブサイト100に切り換え、ウェブビジターを識
別する付加データを与える。
【0091】・ProReach使用可能ウェブサーバー102
は、この識別子を受け取り、ログ上にウェブヒットを記
録する。ログ上のエントリーはこの識別子を含む。
【0092】・ウェブサーバー102は、このウェブヒ
ットのログからデータを読み出し、ProReachスポーク2
02に送信する。このログ上の各エントリーの処理は、
スポーク202上で始まる。ビジターによって閲覧され
たウェブページのカテゴリーが計算される。この時点
で、ProReachシステム100は、ウェブページにアクセ
スした人と、そのウェブページのコンテンツの分野を判
定する。
【0093】・規定時間を超えて、ビジターがウェブサ
イト100を繰り返しビジットする場合、そのウェブビ
ジターに関連したウェブイベントの履歴が作られる。Pr
oReachは、このデータを集計プロセスで処理することに
よってこのデータを管理する。このプロセスは、データ
をできるだけコンパクトに保つが、有用な分析特性は保
存する。特に、集計プロセスは、ウェブイベントをより
一般化された説明、たとえば、ユーザ及び/又はカテゴ
リーの全体のサマリーを含む説明に要約する。
【0094】・集計ステップの終了後、プロファイリン
グステップが行われる。プロファイリングステップは、
ウェブビジターの関心を識別する。これにより、ウェブ
ビジターの関心のプロフィールサマリーが得られる。
【0095】上記のステップは、ウェブビジターデータ
を追跡、分類、集計する基本処理ステップを実証する。
これらのステップの結果物は、ウェブ商取引者が調査す
ることのでき、他の目的(バーナー広告の選択、コンテ
ンツ若しくはサービスの個人化)のためにも使用される
ウェブビジタープロフィールのデータベースである。あ
るいは、ウェブ商取引者は、問い合わせツールを使用す
ることにより、自分のウェブビジターの集団を調査して
もよい。
【0096】これらのステップは、この節の後半部で詳
細に解明される。
【0097】図7乃至9を参照するに、ProReachシステ
ム100のウェブサーバー102の部分が示される。ウ
ェブサーバー102は、プロフィールサーブレット73
0と、カテゴリーサーブレット731と、ロガー702
と、ビジターログ704とを含む。
【0098】ウェブクライアント106からのビジット
によって処理が始まる。ウェブクライアント106は、
ウェブサーバー102によりホストされたウェブページ
にアクセスする(701)。ロガー702は、ウェブク
ライアントのGIDを要求する。このGIDを取得するため、
ロガー702は、グローバルProReachサービス112の
グローバル識別子サービス602に要求を行う。この要
求は、HTTPプロトコルを用いて、ウェブクライアント
を、ProReachグローバルサービス612の一部であるPr
oReachウェブサーバーに切り換えることによって開始さ
れる。図9において、このウェブサーバーはウェブクラ
イアント106からの要求がProReachクッキーを含むか
どうかを検査する。ProReachクッキーが要求中に現れる
とき、GIDがクッキーから取り出される。これは、この
ウェブクライアント106を識別するGIDである。
【0099】要求がProReachクッキーを含まない場合、
すなわち、ウェブクライアントがGIDを含まない場合、
新しいGIDがグローバル識別子612によって生成され
る。このGIDは大域的にユニークであることが保証され
る。グローバルサービスが計算したGIDは、ウェブ・リダ
イレクションによって、ProReach使用可能ウェブサーバ
ー102に返信される(707)。実際のGIDはURLにエ
ンコードされるので、ProReach使用可能ウェブクライア
ント106は、このURLを受信し、URLからGIDを取り出
し、GIDをクッキーに格納することができる。他の情報
もURLにエンコードされるので、ウェブクライアント1
06は最初に要求したページに返信される。
【0100】ウェブビジターのブラウザがクッキーを受
け付けないように構成されている場合、グローバル識別
子サービス602はその旨を検出し、通常の方法でGID
としてリダイレクトによって返信されたこのウェブビジ
ターにGIDを割り当てる。しかし、このGIDの値は、ProR
each使用可能ウェブサーバー102がセッションクッキ
ーを試行、発行しないこと、並びに、このウェブビジタ
ーのイベントを未知若しくは匿名ユーザとして記録する
ことを表す。
【0101】図10では、GIDがウェブサーバー102
に返信されたとき、ロガー702はウェブクライアント
をユニークに識別し、ロガーはウェブイベントレコード
をProReachビジターログ704に記録する。このエント
リーは、ウェブアクセスが発生した時刻、GID、アクセ
スされたウェブページのURLに関する情報を収容すると
共に、その他の情報も含む。この動作のシーケンスは、
ウェブページ毎に繰り返され、あるいは、ビジターが発
生したその他のウェブ行動毎に繰り返される。
【0102】図10に示されるように、ログ704の内
容は、ウェブサーバー102から、ファイアウォールの
内側にあるProReachスポーク202に定期的に転送され
る。スポーク202は、ログプレプロセッサ706、ハ
ブビジターログ708、イベントキュー710、イベン
トプロセッサ712、カテゴライザ714、ページメタ
データキャッシュ716、及び、コンテンツ認識エンジ
ン718等の多数のその他の処理モジュールを含む。
【0103】データがスポーク202に到達した後、デ
ータは、ビジターログ708に収容するため前処理され
る(706)。この前処理は、データのフォーマットが
特有であるかどうかとは無関係に、データを標準形式の
ウェブイベント(たとえば、データのオブジェクト表
現)に変換する。
【0104】イベントキュー710は、このログ708
を監視し、新しいウェブイベントデータが利用可能であ
るとき、イベントキュー710はそのデータを獲得し、
ウェブイベントをGIDによってソートする。イベントキ
ュー710は、ログ708内の各ウェブイベントを処理
するためイベントプロセッサ712を要求する。イベン
トプロセッサ712は、カテゴライザ714への要求を
行うことによりウェブイベントが分類されることを保証
する。ウェブページを予め分類し、この分類情報をペー
ジメタデータ716にエントリーとして与えてもよい。
先行の分類は、ProReachがランタイムに分類を行うこと
が回避されるようできるだけ早期にウェブページを分類
するためウェブサイトを検出してから始まる。しかし、
一部のウェブサイトはウェブコンテンツを動的に生成す
るので、ProReachは全てのウェブページを予め分類でき
るとは限らず、ジャストインタイムで分類されたウェブ
ページを準備する必要がある。
【0105】ウェブビジターにより訪れられたURLが既
に分類されている場合、このデータはページメタデータ
キャッシュ716から取り出され得る。このデータを取
り出せない場合、カテゴライザ714は、コンテンツ認
識エンジン718を呼び出す。コンテンツ認識エンジン
718は、カテゴリーのデータベースを管理する。各カ
テゴリーは、「スポーツ」や「ニュース」のようなある
種のトピックスを表現する。ウェブページは任意の数の
カテゴリーと照合される。一致したカテゴリーは、ウェ
ブページが関連する分野を表し、ビジターの関心を識別
するための手段を提供する。
【0106】コンテンツ認識エンジン718は、多数の
カテゴリーのスコアを与える。各スコアは、ページがカ
テゴリーと関連する度合いを測る量である。好ましく
は、スコアは、カテゴリーデータベースのカテゴリー毎
にコンテンツ認識エンジン718によって与えられる。
あるいは、スコアは、選択された個数の最高スコアカテ
ゴリー(たとえば、最高から10番目までのスコアカテ
ゴリー)だけに対し与えられる。
【0107】コンテンツ認識エンジン718は、所定の
ウェブイベントの分類プロセスを完了したとき、スコア
付きカテゴリーとそれぞれのスコアのリストを収容する
ようにウェブイベントに対するページメタデータキャッ
シュ916を更新する。キャッシュが更新されたとき、
ウェブイベントのカテゴリー及びそれぞれのスコアはイ
ベントプロセッサ712に返信される。イベントプロセ
ッサ712は、そのウェブイベントに対する分類の結果
を収容するためウェブイベントレコードを変更する。あ
るいは、分類情報は、ウェブイベントとは別々に記憶さ
れてもよく、URLのような他の手段を用いてウェブイベ
ントからアクセスされる。ウェブイベントレコードが分
類された後、ウェブイベントは、次の処理ステージに発
送する準備ができている。次の処理ステージは、ProRea
chハブ204上にある。より一般的には、分類されたウ
ェブイベントは、ProReachスポーク202からハブ20
4に流れる。
【0108】図12を参照するに、ProReachハブ204
が示されている。ProReachハブ204は、集計キュー7
22と、集計システム724と、プロフィール726
と、データベースエージェント728と、プロフィール
データベース720とを有する。
【0109】ハブ204は、ウェブプロフィールのデー
タベース720を保持する。このデータベース720の
各プロフィールは、GIDによってユニークに識別され
る。各ウェブプロフィール内で、ウェブビジターのウェ
ブイベントはカテゴリーによって保持される。例示的な
ウェブプロフィールは、カテゴリーデータベースに収容
されたカテゴリーの数毎に個人(又はグループ)の関心
を記述する、ProReachハブ204は、新たに分類された
ウェブイベントを獲得し、このデータを既存のウェブプ
ロフィールのデータと統合し、ウェブ行動から生成され
るようなウェブイベントで獲得されたような関心に関す
る最新情報を用いてビジターのプロフィールを更新す
る。ウェブプロフィールがそのウェブビジターに対して
存在しない場合、一つのプロファイルが作成される。
【0110】この集計処理の第1ステップは、ウェブプ
ロフィールを選択するためウェブビジターのGIDを用い
て、必要とされるウェブプロフィールをデータベース7
20から獲得することである。ウェブイベントレコード
又はイベントレコードの集合が集計されたとき、それら
は各ウェブイベントが同一GIDを有するグループ単位で
処理される。
【0111】あるGIDに対するウェブプロフィールが獲
得された後、集計システム724は、ウェブビジターが
アクセスした文書の全カテゴリーに対し集計動作を実行
する。好ましい一実施例において、カテゴリー重みを更
新する閾値が確定され、閾値よりも高いスコアが付けら
れた文書に対するカテゴリーだけが更新される。
【0112】一般的に、集計器726は、図2を参照し
て説明したように、多数のユーザ、グループ、及び、カ
テゴリーサマリーを更新する。各サマリーは、専用のウ
ェブイベントレコードに保持され、ユーザ若しくはユー
ザグループ、又は、適用されるカテゴリーと、適当な他
の集計された重み値を識別する。このアプローチの場
合、ProReachは、多量で高品質のビジターデータを低コ
ストで保存することができる。その理由は、ProReachが
ウェブ商取引者によって必要とされる動作の類、すなわ
ち、ユーザ関心及び傾向の分析をサポートするよう設計
されているからである。
【0113】集計プロセスが終了したとき、次のステッ
プは、ビジターのプロフィールを更新することである。
プロファイリング726は、ウェブビジターの関心を識
別する作業である。この作業の働きを理解するため、最
初に、簡単な例を説明する。ウェブサイトのビジットを
利用して、「スポーツファン」を識別しようとするウェ
ブ商取引者がいる場合を想定する。このウェブ商取引者
は、まず、「スポーツファン」が何を意味しているかを
定義する。この用語を定義するためには多数の方法が考
えられる。
【0114】・絶対的関心度定義:スポーツファンと
は、1年に少なくとも20回にわたりスポーツ関連ウェ
ブページを閲覧する人である。
【0115】・相対的関心頻度定義:スポーツファンと
は、スポーツ関連ウェブページを他のウェブページより
も頻繁に閲覧する人である。たとえば、スポーツファン
は、ウェブページを100回閲覧する場合に、スポーツ
関連ウェブページを10回閲覧する人である。
【0116】・比較的関心頻度定義:スポーツファンと
は、他のウェブビジターよりも頻繁にスポーツ関連文書
を閲覧する人である。
【0117】用語「スポーツファン」に対するこれらの
3通りの定義の候補は、ユーザのウェブ行動から判定さ
れるようなスポーツカテゴリーの重みの関数として関心
を記述する。
【0118】いずれのタイプの定義法(あるいは、他の
定義法)もカテゴリーの集合に関して関心を定義するた
め使用される。論理的に、関心は、ウェブビジターが関
心を抱いているかどうかを判定するため、プロフィール
データベース720に対するSQLで使用するような問い
合わせとして理解される。問い合わせは、任意のカテゴ
リーの組み合わせの重みを評価するため定義される。Pr
oReachを用いる場合、ウェブ商取引者は、例示による問
い合わせツールのような簡単な問い合わせツールを用い
てこのような関心を命名し、定義することができる。こ
のツールは、データベースエージェント728を介して
データベース720上で動作する。
【0119】関心が定義された後、新しい関心は、所与
のProReachシステム100に追加され、利用できるよう
にされる。関心が利用できるようにアクティブにされる
と、各関心を選択し、所与のウェブビジターがその関心
を持つかどうかをテストするのは、プロファイラ726
の役割である。プロファイリングが行われるとき、活性
化された関心は、ビジターが関心を持つかどうかを判定
するため、ウェブビジターのデータに適用される。その
結果は、ビジターに相応しい関心を識別するプロフィー
ルである。
【0120】たとえば、データベース720中に5種類
のアクティブ関心、たとえば、スポーツファン、保守的
な人(保守派)、趣味に熱中する人(趣味熱中派)、離
婚直後の人、退職を計画中の人のような関心があり、そ
れぞれの関心は、多数のカテゴリーに関する上述したよ
うな規準の集合によって予め定義されている場合を想定
する。保守的な人の関心は、保守的な考え又は信念と関
連していると考えられるカテゴリーに分類されたページ
にアクセスする相対的頻度によって定義され、離婚直後
の人の関心は、離婚代理人に関連したウェブコンテンツ
を閲覧する(最新の挙動を識別する)相対的頻度によっ
て定義される。
【0121】このような関心の集合は、データベース7
20に格納され、プロファイラ726によってウェブビ
ジターのデータに適用される。各関心に関連した問い合
わせは、(述語として)適用され、この述語評価の結果
はブール代数値である。このよりから、たとえば、以下
の結果集合が得られる。
【0122】
【表4】 結果はビジターが関心を持っているかどうかを示すブー
ル代数値であることに注意する必要がある。他の実施例
では、ファジィ集合メンバーシップが使用され、各関心
の結果は、ユーザが関心を持っている程度の測度(たと
えば、0.1から1.0までに定められた値)として表
現される。
【0123】たとえば、このような結果に基づいて、こ
のウェブビジターのウェブプロフィールが更新される
(723)。好ましくは、データベース720内のウェ
ブプロフィールサマリーレコードは、ウェブビジターの
関心を列挙する。一実施例において、ウェブプロフィー
ルサマリーレコードは、プロファイラ726によって決
められるようなウェブビジターの関心を記載する関心フ
ィールドを含む。プロファイリングの終了後、この関心
フィールドは更新される。各関心は関心識別子と関連付
けられる。関心識別子は、{101,321,19}のような関心フ
ィールドに割り当てられた整数のシーケンスである。た
とえば、スポーツファン関心のIDが101であり、保守派
関心のIDが321であり、退職計画中関心のIDが19である
とき、{101,321,19}は、{スポーツファン、保守派、退
職計画中}と同じことを表す。
【0124】各関心IDは、ウェブビジターの関心を簡潔
に識別する。
【0125】関心はウェブビジターを分類するために役
立つので有用である。しかし、関心は、ある意味でカテ
ゴリーとは区別される。第一に、関心はユーザ若しくは
ユーザのグループを表すが、カテゴリーはウェブコンテ
ンツを表す。第二に、関心は、訪れたウェブコンテンツ
のカテゴリースコア、人口統計学など含む多数の要因の
組み合わせから形成されるので、関心は、コンテンツ認
識エンジン718のカテゴリーによって典型的に表され
るような階層的な親子関係に簡単には限定されない。
【0126】ProReachがウェブビジターをプロファイル
するとき、ProReachは各ウェブビジターの関心を計算
し、必要に応じて再計算する。この計算が行われると
き、更新されたプロフィールサマリーは、データベース
エージェント728を介してデータベース720に記憶
される(722)。これにより、更新されたウェブプロ
フィールが得られ、カテゴリーに関係した全データ、お
よび、そのウェブビジターの全ての関心も同様に更新さ
れる。
【0127】問い合わせツールのような他のProReachツ
ールは、ProReachウェブビジターのグループを素早く正
確に指定するためこのデータを使用できる。たとえば、
スポーツファンであり、かつ、保守派である全ウェブビ
ジターを識別するため問い合わせが行われる。あるい
は、スポーツファンではあるが、保守派ではない全ての
ウェブビジターを識別する問い合わせを行うことも可能
である。
【0128】次に、関心を定義する方法と、ウェブビジ
ターの現在の関心の集合を反映させるためプロフィール
を更新する方法を説明する。図9は、ウェブサーバー7
02がウェブビジターのウェブプロフィールにアクセス
する方法を示す。ウェブサーバー102上のプロフィー
ルサーブレット730は、GIDに基づいて既知ウェブビ
ジターのウェブプロフィールを獲得する(731)。GI
Dは、ウェブクライアント106に常駐するクッキー又
はグローバル識別子サービスから得られる。この機能に
よって、ウェブビジターのGIDを識別することが望ましく
なる。ウェブサーバー102がビジターのGIDにアクセ
スした後、ウェブサーバーは、ウェブビジターの対応し
たプロフィールからデータを選択的に取得するためGID
を使用することができる。プロフィール内に関心が与え
られているとき、ウェブサーバー102は、たとえば、
ビジターが関心をもつカテゴリーに最もよく一致するコ
ンテンツを選択することによって、ウェブビジターに最
も関心のあるコンテンツが最大限に生かされるようウェ
ブページを動的に作成することができる。
【0129】ProReachは、ウェブクライアントからウェ
ブ行動を追跡する機能、ProReachシステム間でウェブプ
ロフィールデータを交換する機能のような多数の能力を
有する。ProReachは、ウェブ商取引者が候補者(顧客に
なりそうな人)を識別し、連絡をとるために役立つ便宜
を図る。ProReachは、垂直的マーケット内でのビジネス
がそのビジネスに適してカテゴリーを作成できるように
先進的な分類技術を提供する。また、ProReachは、カテ
ゴリーを開発及び保守するプロセスを自動化する分類技
術を提供する。
【0130】B.カテゴリー発見及び保守 この節では、カテゴリー発見及びカテゴリー保守のプロ
セスを例を用いて説明する。
【0131】1.カテゴリー発見 ProReachシステム100がコンピュータ周辺機器に関し
てコンテン認識エンジン718によって管理されるよう
な以下のカテゴリーを有する場合を考える。
【0132】
【表5】 記憶装置カテゴリーは、他のカテゴリーの親カテゴリー
である。第一に、サブカテゴリー内の文書の総数は43
0であり、一方、記憶装置には500文書が分類されて
いることに注意する必要がある。これは、文書中に記憶
装置に関連しておるが、既存のサブカテゴリーでは区別
できないた他のカテゴリーが存在することを示す。
【0133】カテゴリー発見プロセスは、既存のカテゴ
リー内に潜むカテゴリーを見つけるため統計的分析を使
用する。以下に詳述するように、カテゴリー発見は、頻
度と、文書の集合に出現する語の間の関係とに基づい
て、カテゴリーを識別する。上述の例において、このカ
テゴリー発見プロセスが、DVDに関する多数の記憶装
置の文書の存在を発見した場合を考える。カテゴリー発
見プロセスは、潜在的な新しいカテゴリーとしてDVD
を識別する。逆に、カテゴリー発見プロセスによって指
摘されたカテゴリー変化は、オペレータによって検査、
確認される。このオペレータとの相互作用は、多数の理
由から望ましい。第一に、カテゴリー発見プロセスは、
多数の価値のある示唆を与えるが、常に正しいとは限ら
ない。人によるある程度のガイダンスは、意味のあるカ
テゴリーだけが追加されることを保証するため有効であ
る。
【0134】上述のケースで、オペレータが新しいDV
Dカテゴリーを追加すべきであることを確認した場合を
考える。この確認が与えられた後、残りのプロセスは自
動的に行われ、カテゴリーは、文書を分類するためコン
テンツ認識エンジン718によって直ちに使用される。
既存の文書は、カテゴリースコアを決定するため再評価
される。
【0135】カテゴリー発見プロセスを適用するときを
決める際の問題は、新しいカテゴリーの探索を何時行う
べきかということである。一実施例において、新カテゴ
リーの探索は、以下のいずれかの条件が成立したときに
行われる。 ・所定のカテゴリー内に多数の文書が分類されている
(たとえば、分類された全文書の中で所定数、若しく
は、所定の割合を超えるとき) ・分類の見落としの兆候がある(たとえば、親カテゴリ
ーがサブカテゴリーに対して所定数、若しくは、所定の
割合を超える文書を含むとき) ・所定のカテゴリーに分類された文書をアクセスする多
数のウェブビジターが存在する(たとえば、選択された
時間的区間のビジター数が所定数、若しくは、所定の割
合を超えるとき) カテゴリーツリーの一部の分枝は、時間的に非常に不安
定であるかもしれない(たとえば、高度技術)。そこ
で、カテゴリーツリーのその区分の時間的不安定性も要
因となり得る。
【0136】2.カテゴリー保守 カテゴリー発見は新カテゴリーの発見に関係する。カテ
ゴリー保守は、既存のカテゴリーの維持及び改良に関す
る。カテゴリー発見の場合と同様に、カテゴリー保守の
プロセスは、好ましくは、カテゴリーの変更を示唆する
忠告型プロセスである。カテゴリー保守プロセスは、確
認が与えられるまで、変更を行わない。あるいは、自動
的に変更が行われるようにしてもよい。
【0137】特に、カテゴリー保守は、以下の場合に示
唆を与える。 ・カテゴリーの消去 ・カテゴリーに関連した訓練用文書の変更 カテゴリー発見と同様に、カテゴリー保守は統計的分析
を含む。たとえば、カテゴリーを消去する示唆は、その
トピックに関連したウェブページの数が非常に少なく、
かつ、その文書を閲覧する人の数が非常に少ない場合に
行われる。文書が少なく、その文書の閲覧者が少ないと
いうことは、そのカテゴリーが消去するカテゴリーの候
補である。
【0138】たとえば、訓練用文書はスコアに基づいて
選択され、カテゴリースコアが閾値よりも低い場合、訓
練用文書は再選択される。カテゴリーに関連したキーワ
ードに十分に高いスコアが付けられていないとき、カテ
ゴリーは移される。
【0139】カテゴリーを作成するため、カテゴリーを
選択し、訓練用文書を選択し、キーワードを生成するた
め訓練用文書にスコアを付け、キーワードがカテゴリー
を反映しているかどうかを人が判断する。
【0140】IV.アライアンスを含むProReac
hシステム 図1乃至6は、ProReachスポーク202がウェブ行動デ
ータをProReachシステム100の集中ハブ204に供給
する様子を示している。ハブとスポークのトポロジー
は、フレキシブルかつスケール変更可能な形式で1台以
上のウェブサーバー102を取り扱う。しかし、ProRea
chは、このウェブイベントの局所的な蓄積よりも優れて
いる。ハブ204に保持されたビジターのプロフィール
は価値があるが、情報の価値は、多数のハブ及びProRea
chシステム100の全域における集計によって増加す
る。この集計は、情報のソースが別々の企業に属してい
ても、多数のソースからのプロフィールを併合すること
によって達成される。
【0141】既存システムの場合に、ビジタープロフィ
ール情報の共有による恩恵を享受する企業は、いくつか
の理由から情報の共有を拒む。ビジタープロフィール情
報の共有を促進する基盤技術はないので、情報の共有化
のためには、ソフトウェアサポートの大規模な初期投資
が必要である。また、プロフィール情報自体に関して
も、どの企業がプロフィール情報を所有するのか、決定
権は誰にあるのかという所有権及び使用権の問題があ
る。
【0142】本発明では、アライアンス(同盟)は、企
業間でプロフィール情報の共有化を促進し、共有化のた
めの障害を解決する手段である。アライアンスを用いる
ことによって、ProReachは、ビジネス当事者の双方に有
益なデータのビジネス間での供給かを実現する。多くの
場合に、アライアンスは、ある垂直的統合マーケットの
周りでクラスタ化されたビジネスをサービスするため形
成される。たとえば、薬剤のアライアンスが存在し、あ
るいは、石油関連ビジネスのアライアンスが存在する。
図13を参照するに、各ProReachシステム100は、ア
ライアンス800のメンバーではないか、あるいは、一
つ以上のアライアンス800のメンバーである。アライ
アンスにおけるメンバーシップは変化する。アライアン
ス800のメンバーは、自分のプロフィールデータのコ
ピーをアライアンス800に送信する。このデータは、
アライアンスプロフィールに集計される。アライアンス
プロフィールは、アライアンスメンバーから収集された
プロフィールの集合体である。
【0143】勿論、同じウェブビジターは、同一アライ
アンス800のメンバーである多数のProReachシステム
100を訪れる。異なるローカルハブが同一ウェブビジ
ターのプロフィールを送信するとき、アライアンス80
0は、別々のローカルプロフィールを取得し、そのウェ
ブビジターに関する単一のアライアンスプロフィールに
組み合わせる。GIDを使用することにより、アライアンス
は、同じウェブビジターに属するプロフィールを簡単に
計算し、重複を回避するためこれらのプロフィール中の
情報を正しく併合することができる。
【0144】ローカルプロフィール情報をアライアンス
に供給する代わりに、アライアンス800のメンバー
は、アライアンスプロフィールにある程度のアクセス権
をもつ。ProReachシステム100は、アライアンス80
0の完全アクセス、制限アクセス、若しくは、最小アク
セスメンバーである。各メンバーシップレベルの責任及
び利益は変化する。 ・完全アクセスメンバーは、垂直統合型プロフィールに
対し最大許容アクセス権をもつ。完全アクセスメンバー
は、ローカルプロフィールからの最大量の情報を与え
る。 ・制限アクセスメンバーは、適度なアクセス権を有し、
ローカルプロファイルから適当な量の情報を与えること
が必要である。 ・最小アクセスメンバーは、垂直統合型プロフィールに
対し最小アクセス権をもつ。最小アクセスメンバーは、
ローカルプロフィールからの最小量のプロフィール情報
を与えることが必要である。
【0145】垂直統合型アライアンスへの参加により、
各メンバーは共同で生成したアライアンスプロフィール
への条件付きアクセスが許可される。利益及び責任は、
少数のメンバーシップレベルの間で合理的に取り扱われ
る。メンバーシップは、与えようとする情報のカテゴリ
ーと、その量と、対象とするウェブビジターとを指定す
る必要がある。したがって、このスキームは、個別のPr
oReachシステム100が多数のアライアンスに参加する
確実な動機を与える。
【0146】ProReachシステム100は、アライアンス
のメンバーであることから、ウェブビジターのアライア
ンスプロフィールへのアクセス権を保有する恩恵を享受
する。アライアンスプロフィールは多数のウェブサイト
及びProReachシステム100に亘って集計されるので、
ウェブビジターの関心についての非常に正確で包括的な
評価を与える。これにより、所定のProReachシステム1
00は、ビジターがアライアンスメンバーであるProRea
chシステム100をビジットしたときに、ウェブコンテ
ンツをウェブビジターに向けることができる。
【0147】V.集計 この節では、ウェブイベントが集計システム724と集
計キュー722とによって集計されるプロセスの一実施
例を詳細に説明する。集計キュー722は、変換されて
いないウェブイベントレコードの組を蓄積する。これら
のレコードは、スポーク202上のイベントプロセッサ
712によって、到達順に、すなわち、一つ以上のスポ
ークから到来した順にキュー722に与えられる。概略
的に、キューは、ある時間的区間に亘って多数の異なる
ユーザによって生成されたウェブイベントを蓄積する。
【0148】図14を参照するに、集計キュー722の
論理構造が示されている。集計キュー722は、ウェブ
イベント900の集合体を蓄積する。各ウェブイベント
はウェブコンテンツの項目と相互作用するビジターのイ
ンスタンスを表現する。各ウェブイベント900は、ユ
ーザ識別子902(好ましくは、GID)と、ウェブ行動
が始まったときを表す開始時刻904と、行動の間隔
(秒単位)(間隔が得られないとき、デフォルトとして
1分)906と、タイプ(取引、クリックスルー又はペ
ージ閲覧のいずれかを表現)914と、URL(ウェブサ
イトのドメイン名)912と、カテゴリーベクトル91
6とを収容する。カテゴリーベクトル908は、カテゴ
リー識別子のリスト910と、それぞれのカテゴリース
コアとを収容する。各カテゴリースコアは、ウェブコン
テンツがコンテンツ認識エンジン718によってカテゴ
リーに関して評価された程度を示す。好ましくは、カテ
ゴリー毎にカテゴリースコアがコンテンツ認識エンジン
718によって保存される。したがって、たとえば、コ
ンテンツ認識エンジン718によって使用されるカテゴ
リーが1000カテゴリーである場合に、ベクトル908
は、1000個の<カテゴリーID、スコア>タプルを収容す
る。一実施例において、カテゴリースコアは0から1,000,
000の範囲に収まるが、任意の有効なレンジが適切なス
ケーリング係数と共に使用される。
【0149】図15を参照するに、集計システム724
のコンポーネントが示されている。集計システム724
は、一般的に、多種類のサービスを果たす。第一に、毎
日集計システム919は、ウェブサーバー102で生じ
たウェブイベントから毎日の集計を集める。第二に、次
元集計システム941は、図2に示されるような多数の
ユーザコンプレックス及びカテゴリーコンプレックスに
次元結合することにより、毎日の集計を組み合わせる。
第三に、ユーザグループシステム950は、ユーザグル
ープの定義及び定義の維持を行う。プロフィールサーバ
ー955は、個々のユーザプロフィールを保持し、ユー
ザプロフィールの局面に関する問い合わせに応答する。
全てのサービスは、集計システム724の範囲に含まれ
る。
【0150】毎日集計システムは、ハンドラーオブジェ
クト920と、計算オブジェクト922と、パーサーオ
ブジェクト924と、集計器オブジェクト926とを含
む。集計キュー722は、毎日集計システム724への
エントリーポイントとして理解され、図7乃至10では
便宜的に個別に示されている。
【0151】イベントディスパッチャ930は、集計シ
ステムの全サービスの範囲内の全ての行動を監視し、イ
ベントを聞くことに関心のある人にイベントを送る。イ
ベントディスパッチャは、集計システム内のサービスの
一部ではない。イベントディスパッチャは、カメラのよ
うに、集計システム内部で行われる全ての行動を監視
し、見渡し、注視するだけである。
【0152】毎日問合わせオブジェクト932は毎日集
計システムの一部であり、毎日の集計に関する全ての問
合わせを担う。毎日問合わせオブジェクトは、上述のよ
うにユーザの関心に関する全種類の問合わせ、たとえ
ば、関心の定義、及び、(1日単位で)特定の関心をも
つユーザの識別の問合わせを取り扱う。問合わせは、問
合わせ言語946を使用する問合わせ言語インタープリ
ター944によって処理される。ハンドラ920は毎日
集計システムのインタフェースをエクスポートし、ウェ
ブイベントのパケットの毎日集計プロセス中に毎日集計
サービスの残りのコンポーネントを管理する。
【0153】結合器938は、次元集計システムの一部
であり、ProReachのメンバーによって計画されたように
次元集計を行う。より詳細には、合成器938は、一部
のメンバーによって行われた計画されタスクに図2のレ
ベル1乃至レベル4に示されるように、毎日集計された
ウェブイベント(又は、コンプレックス)を上位レベル
サマリー(たとえば、時刻、ユーザ、グループ、及び、
カテゴリーなどに関して)次元結合する役割を担う。
【0154】更新オブジェクト940は、毎日集計シス
テムがウェブイベントのパケットを処理するとき、毎日
集計を更新する。
【0155】データベース720は、ウェブイベントか
らの集計された情報を多数の異なるテーブルに格納す
る。多数のテーブルには以下のテーブルが含まれる。
【0156】ユーザテーブル:ユーザテーブルは、各ユ
ーザを識別し、記述する情報を格納する。このテーブル
のフィールドには、ユーザID、ラストネーム、ファース
トネームが含まれ、このテーブルはユーザIDで索引付け
られる。
【0157】ユーザID連絡テーブル:このテーブルは連
絡アドレスに関する以下の欄、ユーザID、アドレス1、
アドレス2、市、州、郵便番号、国、電子メールを含
む。
【0158】人口統計学テーブル:人口統計学テーブル
は、ユーザに関する人口統計学情報を収容する。人口統
計学テーブルは、ユーザID、性別、年齢、学歴、職業な
どの欄を含む。
【0159】メンバーテーブル:メンバーテーブルは、
ProReachシステムのメンバー、すなわち、ProReachシス
テムにアカウントをもつ人(若しくは、企業)に関する
情報を収容する。このテーブルは、ID番号、ラストネー
ム、ファーストネーム、電子メール、ログイン、パスワ
ード、URL、アカウント種別などの欄を含む。URLはメン
バーによって所有されるウェブサイトのドメイン名を表
現する。メンバーがウェブサイトを所有しないとき、UR
L欄は空白である。アカウント種別は、メンバーが保持
するアカウントの種別を表現する。この種別にしたがっ
て、メンバーはある種のサービスにアクセスし、他のサ
ービスは拒否される。
【0160】カテゴリーテーブル:カテゴリーテーブル
は、コンテンツ領域エンジン718によって使用される
全てのカテゴリーを格納する。このテーブルに含まれる
フィールドは、カテゴリーID、カテゴリー名、及び、親
カテゴリーIDである。テーブルは、カテゴリーIDと、名
前及び親に関する2次的索引によって索引付けられる。
親カテゴリーIDは、カテゴリーの階層を構築するため使
用され、低レベルカテゴリー情報を上位カテゴリーに集
めるため使用される。
【0161】毎日集計テーブル:毎日集計テーブルの各
行は、所定の日に出現した特定のユーザ・カテゴリーの
組み合わせに関して毎日集計するオブジェクトを格納す
る。この情報は、図2に示された集計ツリーのレベル0
のデータに対応する。このフィールドには、ユーザID、
カテゴリーID、重み、偏差、日付、及び、傾向が含まれ
る。
【0162】偏差フィールドは、(カテゴリーID)によ
って指定されたカテゴリーに関する所定の時間的区間に
亘るカテゴリー重みの標準偏差を格納する。
【0163】日付フィールドは曜日若しくは日数を格納
する。
【0164】傾向フィールドは、時間的区間のユーザの
関心の曲線の形状若しくは勾配を記述する文字列又は符
号化値を格納する。たとえば、以下に詳細に説明するよ
うに、傾向フィールドは、この曲線を「増加のち減少」
あるいは「一定のち増加」のように記述する。
【0165】ユーザグループテーブル:このテーブル
は、各ユーザグループを識別し、そのサイズと、そのユ
ーザグループに関する説明、あるいは、メンバーシップ
を決める規則が共に格納される。このテーブルのフィー
ルドには、ユーザーグループID、グループ名、説明及び
サイズが含まれる。サイズはグループメンバーの数を表
す。
【0166】規準テーブル:規準テーブルは、ユーザグ
ループに対する種々のメンバーシップテストを定義する
ため使用されるルールを格納する。ユーザグループ規準
と共に使用されるこのテーブルは、以下のフィールドを
含む。
【0167】規準IDフィールドは、ルール番号を指定す
る。
【0168】カテゴリーIDフィールドは、規準が適用さ
れるカテゴリーを指定する。
【0169】最小フィールドは、ルールを満たすためユ
ーザが取り得る最小重みを定義する。
【0170】最大フィールドは、ルールを満たす最大重
みを定義する。
【0171】否定フィールドは、ルールを満たすことが
グループ包括若しくはグループ除外のどちらであるかを
指定する。
【0172】一例として、ルールの最小フィールド=2
0、最大フィールド=80、否定フィールド="NO"であ
る場合を考える。このメンバーシップルールは、「メン
バーシップテストを満たすユーザに対し、カテゴリーの
重みは、20乃至80でなければならない」を意味す
る。
【0173】否定フィールド="YES"である場合には、こ
のルールは、ルールのメンバー足り得るためには、重み
が20乃至80意外でなければならないことを意味す
る。
【0174】ユーザグループ規準テーブル:ユーザグル
ープ規準テーブルは、各ユーザグループを規準テーブル
に定義された一つ以上のメンバーシップルールと関連付
ける。フィールドには、ユーザグループIDフィールド
と、規準IDフィールドとが含まれる。
【0175】保持カテゴリーテーブル:保持カテゴリテ
ーブルは、情報(たとえば、重み、ユーザグループ、プ
ロフィールなど)が保持されるカテゴリーの集合を含
む。このテーブルのフィールドには、カテゴリーID、現
在値(CurrentValue)、パーマネント(Permanent)、低程
度関心(LowInteresterd)、中程度関心(MidiumIntereste
d)、高程度関心(HighInterested)、及び、極高程度関心
(VeryHighInterested)が含まれる。
【0176】このテーブルは、システム管理者又は商取
引者が、保持されるべきカテゴリーと、無視されるカテ
ゴリーとを選択できるようにする。この選択は絶対的選
択でも動的選択でもよい。絶対的選択の場合、商取引者
は、全体から一つのカテゴリーの集合を選択し、これら
のカテゴリーに関する情報だけを保持する。動的選択の
場合、商取引者は、同時に全てのカテゴリーを考慮し、
各カテゴリーの現在値フィールドにあるランクを与え
る。現在値ランクは、そのカテゴリーに関心のあるユー
ザ数に応じて動的に変えられる。たとえば、現在値があ
るレベルよりも下がったとき、カテゴリーは無視され、
テーブルから削除される。新カテゴリーがある程度の重
要度を獲得したときにはテーブルに追加される。これが
動的選択である。
【0177】商取引者は動的選択と絶対的選択の両方を
組み合わせてもよい。たとえば、商取引者は、所定数の
カテゴリーをパーマネント(ブール代数フラグ)として
選択し、他のカテゴリーをパーマネントではない動的な
カテゴリーとして選択してもよい。パーマネントカテゴ
リーは常にテーブルに置かれ、関連した情報(ユーザグ
ループ全体、プロフィールなど)が常に保持される。動
的カテゴリーは、現在値があるレベルよりも低下したと
きにテーブルから削除されるカテゴリーである。この閾
値は、好ましくは、集計システム724用のコンフィギ
ュレーションファイル、若しくは、システム管理者によ
って定められる。
【0178】保持カテゴリーテーブルのLowIntereste
d、MediumInterested、HigInterested、VeryHighIntere
stedのような他の欄は、それぞれ、重みによって判定さ
れるように、そのカテゴリーへの関心が低いユーザ、普
通のユーザ、高いユーザ、非常に高いユーザの数が収容
される。一実施例において、これらの関心グループは、
重みの四分位数と関連付けられる。すなわち、重みが1
から24までのとき、関心が低いので、ユーザはLowInt
erestedにカウントされ、重みが25から49の範囲に
あるとき、関心は中間程度なので、ユーザはMediumInte
restedにカウントされ、重みが50から74までのと
き、関心が高いのでユーザはHighInterestedにカウント
され、重みが75から100までのとき、関心が非常に
高いのでユーザはVeryHighInterestedにカウントされ
る。
【0179】保持ユーザテーブル:保持ユーザテーブル
は、プロフィールが保持された全てのユーザを掲載す
る。このテーブルのフィールドには、ユーザID、ラン
ク、及び、ホットカテゴリーIDが含まれる。
【0180】ランクフィールドは、ユーザの重要度に応
じて変更される値のフィールドである。値があるレベル
よりも低いとき(すなわち、100番目若しくは100
0番目のランクよりも低いとき)、ユーザはテーブルか
ら削除され、このユーザに関するプロフィールは保持さ
れない。しかし、新ユーザが非常に重要になったとき、
このユーザはテーブルに追加され、そのユーザのプロフ
ィールが保持される。
【0181】ホットカテゴリーIDは、そのユーザに関し
て最高カテゴリー重みを有するカテゴリーを識別する。
【0182】プロフィールテーブル:プロフィールテー
ブルは、ユーザがメンバーになっているユーザグループ
に関して、各ユーザのプロフィールを記述する。このテ
ーブルのフィールドには、ユーザID、ユーザグループI
D、メンバー開始時、メンバーシップ終了時、現在メン
バー、及び、最終更新が含まれる。
【0183】メンバー開始時フィールドは、ユーザがグ
ループのメンバーになった日付を識別する。
【0184】ユーザは、多数のユーザグループのメンバ
ーになることができ、メンバーシップは動的であり、時
間的に変化する。プロフィールテーブルは、ユーザグル
ープメンバーシップの履歴レコードを保持する。全ての
ユーザグループに対し、プロフィールテーブルは、ユー
ザが始めてメンバーになったとき(メンバー開始時)
と、ユーザが現在メンバーであるかどうか(現在メンバ
ー)と、メンバーシップが終了するとき(メンバーシッ
プ終了時)とを指定する。この異なるユーザグループ間
の変更の履歴レコードから、将来のユーザの反応を予測
するため使用され得るある種の挙動及びパターンを抽出
し、販売目的にこの情報を利用することができる。
【0185】ユーザ・カテゴリーコンプレックステーブ
ル:このテーブルは、図2に示されたUC(ユーザ・カ
テゴリー)コンプレックス203のデータを格納する。
このテーブルのフィールドには、ユーザID、カテゴリー
ID、重みWeight、偏差Deviation、カテゴリーに対する
重みWeightAgainstCategory、集団に対する重みWeightA
gainstPopulation、傾向Trend、区間FromAndToなどが含
まれる。
【0186】ユーザID及びカテゴリーIDは、ユーザとカ
テゴリーの組合せを指定する。
【0187】重みは、カテゴリーIDによって指定された
カテゴリーへのユーザ関心の平均重みを表す。
【0188】偏差は、このユーザ関心の平均重みの標準
偏差である。
【0189】カテゴリーに対する重みは、ユーザ毎に指
定されたカテゴリーの他のカテゴリーに対する重要度の
測定量を格納する。一実施例において、カテゴリーに対
する重みの値は、指定されたカテゴリーに関して総計さ
れたカテゴリー重さのパーセンテージである。すなわ
ち、カテゴリーjについてのカテゴリーに対する重み
は、カテゴリーjの重みを全てのカテゴリー重みの合計
で割り算し、パーセンテージ表記するためその結果を1
00倍した値に一致する(パーセンテージに変換する前
の値をそのまま使用する場合もある)。
【0190】集団に対する重みWeightAgainstPopulatio
nは、ユーザ毎に指定されたカテゴリーの重要度を他の
全ユーザと相対的に表した測定量を格納する。一実施例
において、集団に対する重みは、指定されたカテゴリー
に関して総計されたカテゴリー重さの他の全ユーザに対
する相対的なパーセンテージである。すなわち、カテゴ
リーjとユーザkに関する集団に対する重みは、ユーザ
kに関するカテゴリーjの重みを全ユーザに関するカテ
ゴリーjのカテゴリー重みの合計で割り算した結果をパ
ーセンテージ表記するため100倍した値に一致する
(100倍する前の値をそのまま使用してもよい)。
【0191】傾向Trendは、区間FromAndToによって定義
された時間的区間に亘るカテゴリーへのユーザ関心の形
状又は勾配を記述する。
【0192】区間FromAndToは、このコンプレックスを
生成するため使用されたウェブ行動の最先開始時刻と最
新開始時刻を定義する。
【0193】ユーザコンプレックステーブル:ユーザコ
ンプレックステーブルは、U(ユーザ)コンプレックス
205の内容を記憶する。このテーブルのフィールドに
は、ユーザID、重み、偏差、傾向、区間FromAndTo、カ
テゴリーカウントが含まれる。ユーザコンプレックス
は、多数のカテゴリーに関するユーザの関心を要約する
ので、カテゴリーカウントは、ユーザに関心のあるカテ
ゴリーの数を追跡する。このカテゴリー数は、集計ツリ
ーにおけるユーザコンプレックスオブジェクトの子供の
数でもある。
【0194】カテゴリーカウント値は、重みを増加的に
更新する際に使用される。新しいユーザ・カテゴリーコ
ンプレックス207が重みwで形成されるとき(すなわ
ち、ユーザコンプレックスの新しい子供が形成されると
き)、ユーザコンプレックスの新しい重みは、以下の式
にしたがって増加される。 New weight(Ucomplex) = ([categoriesCount * old weight(Ucomplex)] + w)/ (categoriesCount + 1) カテゴリーコンプレックステーブル:カテゴリーコンプ
レックステーブルは、図2に示されたC(カテゴリー)
コンプレックス205を格納する。このテーブルのフィ
ールドには、カテゴリーID、重み、偏差、傾向、区間Fr
omAndToが含まれる。このコンプレックスは多数のユー
ザに関する要約を行うので、重み及び偏差は、区間From
AndToによって定義された時間的区間に亘る全ユーザに
関するものである。
【0195】グループカテゴリーコンプレックステーブ
ル:グループコンプレックスカテゴリーテーブルは、GC
(グループ・カテゴリー)207の内容を格納する。こ
のテーブルのフィールドには、ユーザグループID、カテ
ゴリーID、重み、偏差、傾向、区間FromAndTo、及び、
ユーザカウントが含まれる。ユーザカウントは、選択さ
れたカテゴリーについて、このグループ内のユーザ数を
追跡する。
【0196】ユーザカウントは、以下の式にしたがって
増加的な集計中にグループの重みを更新するため使用さ
れる。 new weight(GComplex)=((usersCount * old weight(GComplex)) + w)/ (usersCount + 1) 式中、wはユーザグループに新たに追加されたメンバー
の重みである。
【0197】総コンプレックステーブル:最後に、総コ
ンプレックステーブルは、全体的な総コンプレックス2
11を格納する。各行は所定の時間的区間の総コンプレ
ックス211に対応する。このテーブルのフィールドに
は、開始日付、日数、週数、月数、年数、重み、偏差、
傾向、及び、ユーザグループカウントが含まれる。種々
の長さフィールドは、特定のコンプレックスに対し集計
が行われた期間を定義する。ユーザグループカウント
は、総計の集計に使用されるユーザグループの総数を格
納する。他のカウントと同様に、ユーザグループカウン
トは、増加的な集計の間に使用される。 new weight(TComplex) = ((usergroupCount * old weight(TComplex)) + w)/ (usergroupCount + 1) 式中、wは総コンプレックスに追加された新しいユーザ
グループコンプレックス209の重みである。
【0198】次に、ウェブイベントを集計するプロセス
を説明する。
【0199】A.毎日のウェブイベント集計 スケジューラ934は、多数の時間的区間に亘ってウェ
ブイベントを集計情報に集計する多数のプロセスを始動
する。したがって、少なくとも毎日、スケジューラ93
4は、図2にレベル0に示されるように、集計キュー7
22からのウェブイベントを毎日集計される毎日集計イ
ベントに集めるためハンドラー920を呼び出す。ハン
ドラー920は、所定の日に関して集計キュー722か
らウェブイベントを要求し、受信する。キュー722
は、取得されたイベントを追跡し、所望の日に対応した
イベントを集めるハンドラーの要求に応じて、処理され
ていないイベントを供給する。
【0200】集計システムは二つのサブシステムを組み
合わせて使用する。第一のサブシステムは、ウェブイベ
ント(このウェブイベントは集計システムの用語ではユ
ーザヒットと呼ばれる)から毎日の集計を生成する。第
二のシステムは、より上位レベルの集計(週単位の集
計、月単位の集計、3ヶ月単位の集計、年単位の集計、
カテゴリー全域の集計、ユーザ全域の集計、ユーザグル
ープ全域の集計)を生成し、このプロセスは次元結合と
呼ばれる。
【0201】毎日集計サービスは以下のように動作す
る。 1.ハンドラーオブジェクトは、集計キューからウェブ
イベントのパケットを取り出す。 2.ハンドラーは、ウェブイベントの重みを計算し、そ
の重みを0から100までの値に定めるため、パケット
を計算オブジェクトに送る。
【0202】非常に簡単な例について説明する。パケッ
トが二つのウェブイベントA及びBしか含まない場合を
考える。ウェブイベントAは、スコアが200で間隔が
4分間のひとつのカテゴリーC1だけを収容し、ウェブ
イベントBは、スコアが300で間隔が2分間のひとつ
のカテゴリーC2だけを収容する場合を考える。最初
に、計算オブジェクトは、ウェブイベントA内でカテゴ
リーC1の重みを計算する。 weight(C1) = score(C1) * duration = 200*4 = 800 ウェブイベントAには他のカテゴリーが存在しないの
で、ウェブイベントBに移り、第2のウェブイベントで
カテゴリーC2重みを計算する。 weight(C2) = score(C2) * duration = 300*2 = 600 ウェブイベントBには他のカテゴリーが存在しないの
で、重みの計算が終了する。次に、計算した数字、すな
わち、800と600を率に応じて定める必要がある。
スケーリングは800と600を以下の式にように置換
することにより行われる。800に対し、 [800/(800+600)]*100=57.14% 600に対し、 [600/(800+600)]*100=42.8% 次に、ウェブイベントAのユーザIDとウェブイベントB
のユーザIDが同一であり、カテゴリーC1とカテゴリーC2
が同一である場合、集計器オブジェクトは二つの重みを
平均化し、 (57.14%+42.8%)/2 この平均を保持する。二つのウェブイベントA及びBが
異なるユーザID若しくは異なるカテゴリーを有する場
合、平均化は行われず、二つの重み57.14%と42.8%が保
持される。
【0203】いずれの場合も、毎日集計オブジェクト内
で、各ペア(ユーザID、カテゴリー)は、0と100の
間の1個の数字(パーセント数)を有し、この数字はペ
ア(ユーザID、カテゴリー)の重みと称される。ウェブ
イベントの1個のパケット内で1個の(ユーザID、カテ
ゴリー)ペアが多数のパーセント数(すなわち、多数の
重み)をもつとき、それらは平均化される(平均化は、
後述のようにパーサーがハッシュマップを集計器オブジ
ェクトに与えたときに、集計器オブジェクトで行われ
る)。
【0204】1.計算オブジェクトは、(スコアがスケ
ーリングされた重みである)ウェブイベントのパケット
をハンドラーオブジェクトに返し、ハンドラーはそのパ
ケットをパーサーオブジェクトに渡す。パーサーオブジ
ェクトは、パケットのデータ構造をベクトルからハッシ
ュマップに変換し、ハッシュマップを集計器オブジェク
トに与える。
【0205】2.集計器オブジェクトは、平均、分散、
傾向及び時間間隔(from,to)のような量を計算する。集
計器オブジェクトは、これらの量を計算するため、計算
オブジェクトのサービスを使用する。これらの量を計算
した後、集計器オブジェクトは更新(update)オブジェク
トの更新メソッドを呼ぶ。更新オブジェクトは(update
という語で始まる)多数のメソッドを有する。各メソッ
ドには特殊用途がある。たとえば、メソッドupdateDail
yAggregate()は、集計器によって生成された新しいハッ
シュマップからの増加的集計を使用してDailyAggregate
オブジェクト内の値を更新する。メソッドupdateUCComp
lex()は、集計ツリーのレベル0で変化した増加的集計
を利用して全てのUCComplexオブジェクトの値を更新
し、その他のメソッドも同様である。すなわち、次元集
計は、集計器がウェブイベントの1個のパケットの処理
を終了した直後に自動的に(増加的に)行われる。
【0206】したがって、更新オブジェクトは、毎日集
計システムと次元集計システムの二つのシステムの間で
データアクセスを実現する。毎日集計システムがウェブ
イベントのパケットの処理を終了すると、更新オブジェ
クトは、ウェブイベントの新しいパケットの処理に起因
して集計ツリーのレベル0で変更されたデータに基づい
て次元集計を増加的に始動させる。
【0207】次元集計の別の局面はスケジューリングで
ある。上述のように、次元集計は、毎日集計システムが
ウェブイベントの1個のパケットの処理を終了するたび
に、自動的に増加的に始まる。以下、スケジューリング
された次元集計を使用する理由を説明する。
【0208】ProReachシステムが動いているとき、メン
バーが存在する。メンバーとは、集中ProReachシステム
にアカウントを持っている人、若しくは、企業である。
ユーザAはメンバーであるとする。ユーザAは、ログイ
ン名及びパスワードと、(新規加入したときに)ProRea
chシステムによってユーザAに与えられたID番号とをも
つ。ユーザAがProReachシステムによって提供されるシ
ステムを使用したいとき、ユーザAは、最初に集中ProR
eachシステムのウェブページを訪れ、自分のログイン名
及びパスワードを用いてログインする。ログインした
後、ユーザAはサービスを使用することができる。ユー
ザAが使用できるサービスの短いリストは以下のとおり
である。
【0209】a.(ウェブページで)問合わせを発行
し、問合わせへの回答がウェブページに示される。
【0210】問合わせは、プロフィール、ユーザグルー
プ、ある種のカテゴリーに関する関心などである。
【0211】b.ユーザグループを作成し、ユーザAが
作成したユーザグループにユーザが追加されるため満た
されるべきメンバーシップルールを設定する。ユーザA
は、各ユーザグループのメンバーを更新するとき、新メ
ンバーを追加するとき、各ユーザグループをデータベー
スに保持する期間をスケジュールすることができる。
【0212】c.ユーザAがウェブサイトを保有する場
合、ユーザAは集中ProReachシステムに送信されるウェ
ブサイトのウェブトラヒックをもつことができ、それに
より、ProReachシステムは自分のサイトのウェブイベン
トを集計し、いつでもユーザAからの問合わせに応じる
ことができるように分析の結果をProReachのデータベー
スに保持することができる。
【0213】これらのサービスは、ProReachシステムが
ウェブを通じて提供することができるサービスの例に過
ぎない。各サービスには料金がかかる。数種類のアカウ
ントが存在する。一部のアカウントは、ユーザに一組の
サービスを提供し、別のアカウントはより膨大なサービ
スの組をユーザに提供する。たとえば、ウェブサイトを
保有し、上記リストのサービスcを使用するメンバー
(人又は企業)を想定する。このメンバーは、自分のウ
ェブサイトのウェブイベントに関する次元集計を行うと
きと、時間間隔とを選択する権利を有する。このような
メンバーは、自分のアカウントからこれらのタスクをス
ケジュールすることができる。この次元集計は、毎日集
計システムがウェブイベントの単一のパケットを処理し
終えたときに自動的に行われる次元集計とは異なる。
【0214】1.カテゴリースコアの重みへの変換 ハンドラー920は、最初に、計算パッケージ922に
対し、(ウェブイベントの単一のパケット内で)各ウェ
ブイベント900のカテゴリースコアを間隔が調整され
たスコアに変換することを要求する。このステップはス
コアを正規化し、カテゴリースコアとイベントの間隔の
両方を別々に記憶する必要性を除く。正規化は、異なる
ウェブイベントが、任意のカテゴリー若しくはユーザに
関して、全体的な重要度を比較できるようにする。
【0215】計算オブジェクト922は、この機能を支
援するため以下のように動作する。ここで注意すべきこ
とは、各ウェブイベント900がカテゴリー及びスコア
のベクトルを含むことである。計算オブジェクト922
は、ウェブイベントのパケット内で、各ウェブイベント
900を順番に処理する。単一のウェブイベント900
のカテゴリーベクトル内の各カテゴリーに対し、計算パ
ッケージ922は、ウェブイベントの間隔に応じて、か
つ、そのウェブイベントに対する他の全てのカテゴリー
スコアに基づいて、各カテゴリースコアの尺度を定め
る。一実施例において、スケーリングプロセスは以下の
通りである。
【0216】第一に、計算オブジェクト922は、ウェ
ブイベントの間隔とウェブイベントのタイプを用いて各
スコアを調整する。
【0217】NewScore=Score*Duration*type 式中、NewScoreは調整済みのカテゴリースコア(0から
100の範囲にスケーリングされた後には、重みと称さ
れる)を表し、Scoreは元のカテゴリースコアであり、D
urationは開始時刻と終了時刻の間の時間であり(ある
いは、直ちに得られる場合には間隔値であり、得られな
い場合に、間隔のデフォルト値は1分である)、type
は、ウェブイベントのタイプに依存した数である。たと
えば、ウェブイベントが取引である場合、タイプは、単
なるクリックスルーやページ閲覧よりも高い数である。
ページ閲覧のタイプは、クリックスルーのタイプよりも
高い。
【0218】次に、計算オブジェクト922は、調整済
みのスコアの合計に基づいて調整済みのスコアをスケー
リングする。
【0219】
【数2】 式中、nはカテゴリー数である(ウェブイベントのパケ
ット内の全カテゴリーである。ウェブイベントのパケッ
トは10個のウェブイベントを収容する。各ウェブイベ
ントは20個のカテゴリーを収容する。したがって、カ
テゴリーの総数は200である)。iは各カテゴリーに
対し繰り返される。
【0220】このプロセスの結果は、各ウェブイベント
が元のカテゴリースコアの代わりに重みのリストを格納
することである。重みは、特定のウェブイベントの全て
のカテゴリーに関してカテゴリの重要度を簡潔に記述
し、特に、重みは、各カテゴリーのスコアを、時間的に
調整済みのスコアの全体に対するパーセンテージとして
記述する。
【0221】2.ユーザによるカテゴリー重みの順序付
けのためのウェブイベントレコードの再構成 ハンドラー920は、次にパーサー924を呼び出し、
ウェブイベント900の更新されたパケットを渡す。パ
ーサー924は、集計オブジェクト926に入力するた
めパケットを再構築する。より詳細には、パーサー92
4は、多数のウェブイベントレコード900のカテゴリ
ー重みを、最初にユーザ順に、次に、カテゴリー順に揃
える。
【0222】図16を参照するに、パーサー924の処
理機能の一例が示されている。パーサーは、入力とし
て、パケット900を受け、パケット内の各ウェブイベ
ントは、一方でカテゴリーベクトル908を収容する。
上述の通り、ウェブイベントは、ユーザID902と、開
始時刻と、間隔と、タイプ(すなわち、取引、クリック
スルー、又は、ページ閲覧など)と、URL(訪れたウェ
ブサイトのドメイン名)と、N組の<カテゴリー、重み
>ペアとを含む。Nはカテゴリー数である。クリックス
ルー、取引、ページ閲覧などはウェブイベントを生成す
るので、種々のウェブイベントが異なるユーザに対応
し、同じユーザに多数のウェブイベントが対応する可能
性がある。
【0223】次に、非常に簡単な例を用いてパーサーオ
ブジェクトのタスクを説明する。ウェブイベントのパケ
ットが5個のウェブイベントwe1、we2、we3、we4及びwe
5しか含まない場合を考える。そして、最初の3個のウ
ェブイベントwe1、we2及びwe3は同じユーザID(たとえ
ば、Jack)をもつとする。さらに、カテゴリーCが3個
のウェブイベントwe1、we3、we5の中に存在するとす
る。また、ペア<Jack,C>に対し、3個の重みw1、w3
及びw5が与えられているとする。第1の重みw1は、第
1のウェブイベントwe1内のカテゴリーCの重みである。
したがって、ウェブイベントwe1内で、w1=weight(Jac
k,C)と表される。
【0224】第2の重みw3は、同じユーザJackと同じカ
テゴリーCに対する重みであるが、第3のウェブイベン
トwe3内の重みである。したがって、この重みは、ウェ
ブイベントwe3内で、w3=weight(Jack,C)と表され
る。
【0225】第3の重みw5は、同じユーザJackと同じカ
テゴリーCに対する重みであるが、第5のウェブイベン
トwe5内の重みである。したがって、この重みは、ウェ
ブイベントwe5内で、w5=weight(Jack,C)と表され
る。
【0226】パーサーオブジェクトは、シーケンス(w
1,w3,w5)をペア(Jack,C)に関連付ける。シーケン
ス(w1,w3,w5)は、異なる時点における重みのシーケ
ンスであり、曲線を描く(カテゴリーCに対するユーザJ
ackの関心を測定する時刻の関数である)。この関数
は、シーケンス(w1,w3,w5)だけを用いて与えられる
ので離散関数である。連続関数はグラフの形状をより明
瞭に示すので,理想的には連続関数が好ましい。このグ
ラフの形状は曲線であることがわかっている場合、カテ
ゴリーCに関するユーザJackの関心が時刻と共にどのよ
うに変化しているかがわかる。シーケンス(w1,w3,w
5)は、連続関数ではなく離散関数を表すので、変化に
関する情報を得るため,この離散関数に確率論のルール
を適用する。
【0227】この離散関数に対して最初に行われること
は、確率論においてランダム値の期待値と呼ばれる値を
計算することである。本例の場合、期待値は、単にシー
ケンス(w1,w3,w5)の重みの平均である。この平均は
統計学的な平均meanであり、集計オブジェクトによって
(計算オブジェクトを用いて)計算される。次に、集計
器が行うことは、確率論ではランダム値の分散variance
と呼ばれる誤差を計算することである。集計オブジェク
トが3番目に行うことは、値(w1,w3,w5)によって表
現された離散関数のグラフの形状を粗く判定することで
ある。すなわt、増加曲線であるか、減少曲線である
か、あるいは、増加曲線と減少曲線の組み合わせである
かなどが判定される。この曲線の形状は傾向trendと呼
ばれる。傾向が判定された後、集計器オブジェクトは、
ある種のデータ構造(たとえば、ハッシュマップ、ハッ
シュテーブルなど)の形として、これらのデータ(平均
mean、分散variance、傾向trend)をペア(Jack,C)に
関連付ける。集計器は、この処理を全てのペア(ユー
ザ、カテゴリー)に対し行う。
【0228】集計器が上記の一連の処理を終了したと
き、その結果(ハッシュマップ,ハッシュテーブルな
ど)は、本明細書で毎日集計DailyAggregateと称するオ
ブジェクトを形成する。したがって、毎日集計DailyAgg
regateは、ペア(ユーザ、カテゴリー)を収容するオブ
ジェクトであり、各ペア(ユーザ、カテゴリー)毎にソ
ートデータ(平均、分散、傾向)が関連付けられる。さ
らに、ウェブイベントのパケットによってカバーされた
時間的間隔であるタイムスタンプが設けられる。
【0229】以上の通り、毎日集計DailyAggregationシ
ステムは、ウェブイベントの一つのパケットを処理し、
毎日集計DailyAggregateオブジェクトを生成する。
【0230】毎日集計システムが(毎日集計DailyAggre
gateオブジェクトを生成することによって)ウェブイベ
ントのパケットの処理を終了したとき、毎日集計システ
ムは、集計キューAggregationQueueから別のウェブイベ
ントのパケットを獲得する。毎日集計システムは、集計
キューからのウェブイベントをパケット単位で処理し続
ける。
【0231】以下では、毎日集計DailyAggregationサー
ビスを最初に開始する場合を考える。毎日集計システム
は、集計キューからウェブイベントの第1のパケットpa
cket1を取得する。第1のパケットの処理後に、毎日集
計システムは、毎日集計DailyAggregateオブジェクトを
生成する。この毎日集計オブジェクトをagg1とする。次
に、毎日集計システムは、再び集計キューからウェブイ
ベントの第2のパケットpacket2を取得し、第2のパケ
ットを処理する。第2のパケットpacket2の処理後、毎
日集計システムは第2の毎日集計オブジェクトagg2を生
成する。第2の毎日集計オブジェクトagg2は、第1の毎
日集計オブジェクトagg1と併合され、一つの集計オブジ
ェクトagg12を形成する。融合された後、毎日集計オブ
ジェクトagg1及びagg2は存在しなくなり、集計オブジェ
クトagg12だけがデータベースに存在する。オブジェク
トagg1とagg2の融合は、メソッドupdateDailyAggregate
()を用いて更新オブジェクトよって実行される増加的集
計である。新しい集計オブジェクトagg12は、最初の2
個のパケットpacket1及びpacket2の組み合わせであるウ
ェブイベントの単一のパケットの処理結果を表す。
【0232】毎日集計オブジェクト(すなわち、集計オ
ブジェクト)は、図2に示された集計ツリーのレベル0
のデータである。一日毎に1個の毎日集計DailyAggrega
teオブジェクトによって表現される。
【0233】その結果として,典型的にウェブサイトの
ビジット中に出現し、20乃至100個、あるいは、そ
れ以上のウェブイベントを生成する多数のウェブイベン
トレコードと関連付けられた所定のユーザについて、多
数の異なるレコードからのカテゴリー重みが収集され、
単一のハッシュカテゴリーテーブル1100に順序正し
く並べられ、カテゴリー毎に、全ての重み及び開始時刻
がまとめて詰め込まれる。これにより、一日のユーザの
ウェブ行動に関してウェブイベントレコードが収集した
全ての関連情報は、単一のデータソースから入手できる
ようになる。
【0234】3.カテゴリー関心時間モデル情報の作成
上記ステップの結果として、処理当日にウェブサーバー
102に現れたユーザ毎に一つのユーザ・カテゴリー・
テーブル1100が得られる。これらのユーザ・カテゴ
リー・ハッシュテーブル1100毎に、ハンドラー92
0は集計エンジン926を呼び出す。集計エンジン92
6は、これらのテーブルを処理し、ユーザ毎にカテゴリ
ー関心時間モデル情報を得る。要約された情報は、収集
されたうウェブイベントレコードの当日における多数の
カテゴリーに関する特定のユーザの関心を記述する。集
計エンジン926は、受け取ったユーザ・カテゴリー・
ハッシュテーブル毎に以下のように動作する。
【0235】第一に、カテゴリーテーブル1100に対
し、集計エンジン926は、開始時刻を用いてカテゴリ
ーの重みリスト1102をソートする。集計エンジン9
26は、好ましくは,計算パッケージ922内のソーテ
ィングルーチンを呼び出すことによってソートを行う。
この結果として、本質的に曲線であるデータ点の集合が
得られる。この曲線は、最初の開始時刻から最後の開始
時刻までの時間的区間におけるそのカテゴリーに関する
ユーザの関心のレベルを示す。図17には、たとえば、
カテゴリー:"Art Deco"に対するカテゴリー関心曲線1
200が示されている。このグラフには、当該カテゴリ
ーに関連した14個のウェブイベントのデータが、開始
時刻順にソートされて示されている。このグラフから、
ユーザの関心が最初は非常に高く、次に降下し、その後
再び上昇したことがわかる。
【0236】次のステージの目標は、各カテゴリー関心
曲線1200を数学的に取得し、その基礎となる重みリ
ストの重みデータ及び時刻データを記憶する必要性を無
くすことである。より詳細には、カテゴリー毎に、集計
エンジン926は、時間的区間(たとえば、1日)のカ
テゴリー関心曲線1200の期待値を決定する。一実施
例において,集計エンジン926は、時間的区間中のカ
テゴリーに関する平均重み及び重みの標準偏差を判定す
る。この平均重みは、当該カテゴリーに関する重みリス
ト1102内の全ての重みの合計を、重みの個数、すな
わち、この時間的区間中にこのユーザに対するウェブイ
ベントの数で割り算した値である。標準偏差は通常とお
りに計算される。また、これらの計算は、好ましくは、
集計エンジン926の要求に応じて計算パッケージ92
2を用いて行われる。
【0237】集計エンジン926は、次に、カテゴリー
関心曲線に対する傾向trend説明情報を作成する。傾向
説明情報は、曲線によって表現された時間的区間におけ
るカテゴリーに関するユーザの関心レベルの変化を記述
する。好ましくは、この傾向説明情報は文字列の説明文
(あるいは、符号化された等価物)である。
【0238】一実施例において、この傾向を獲得するた
め、集計エンジン926は、最初に、最先開始時刻の重
みと平均重みの差をとる。この差は、曲線が最先開示時
刻に対して、増加的、減少的、若しくは、一定であるこ
とを示す。次に、集計エンジン926は、平均重みと最
新開始時刻の重みの差を取り、同様に、この曲線が減少
的、増加的、若しくは、一定のいずれであるかを判定す
る。このようにして、以下の9通りの傾向が得られる。 1.増加、減少 2.増加、一定 3.増加、増加 4.一定、減少 5.一定,一定 6.一定、増加 7.減少,減少 8.減少,一定 9.減少、増加 集計エンジン926は、適切な時間的傾向を判定し、カ
テゴリーについての時間的傾向の情報を記憶する。記憶
される情報は、文字列自体(「増加」、「減少」及び
「一定」)でもよく、あるいは、これらの文字列に対応
した符号値(たとえば、「増加」に対応した値1など)
でもよい。勿論、更に複雑な時間傾向説明情報を得るた
めに、3箇所以上の時点と、三つ以上のセグメントを選
択してもよい。
【0239】集計エンジン926は、カテゴリー関心曲
線の時間的傾向を判定するため他の方式を採用してもよ
い。他の実施例において、集計エンジン926は、最先
開始時刻の時点若しくはその付近、最新開始時刻の時点
若しくはその付近、及び、これら二つの時点の間にある
多数の時点を含む多数のサンプル時点を選択する。最初
に選択された時点からはじめて,集計エンジン926
は、曲線が次の選択時点に対し増加的であるか、減少的
であるか、あるいは,一定であるかを判定し、文字列若
しくは符号等価物を曲線のその部分に割り当てる。たと
えば、一実施例において、最先開始時刻と、中間開始時
刻と、最新開始時刻の3箇所の時点が選択される。これ
らの三つの時点によって二つの曲線セグメントが形成さ
れ、集計エンジン926は、曲線が増加的、減少的、若
しくは、一定のいずれであるかをセグメント毎に判定す
る。
【0240】更に別の実施例では、集計エンジン926
は、カテゴリー関心曲線の勾配が正から負に変化する時
点を識別し、開始時刻と、時間的区間に関する適切な説
明情報とを共に記憶することにより、時間的傾向を判定
する。
【0241】時間的傾向情報を使用することにより、集
計エンジン926は、所定の日に対するユーザのカテゴ
リー関心の完全な記述を有する。より詳細には、集計エ
ンジン926は、後で使用するため、以下のようなカテ
ゴリー時間パターンモデルを格納する。 {ユーザID(User ID)、カテゴリーID(Category ID)、平
均カテゴリー重み(MeanCategory Weight)、カテゴリー
重み標準偏差(Category Weight Standard Deviation)、
始まり(From)、終わり(To)、傾向(Trend)}ここで、Fro
mは、重みリスト1102に格納された最先開始時刻で
あり、Toは最新開始時刻であり、Trendは曲線変化の説
明情報(文字列若しくは符号化情報)である。
【0242】未加工のウェブイベントからの基本的なカ
テゴリー重み情報は、ここで削除してもよく,カテゴリ
ー時間パターンモデルはユーザ・カテゴリーテーブルの
データベース720に記憶される。このプロセスは、ユ
ーザ・カテゴリー・ハッシュテーブル1100内のカテ
ゴリー重みリスト毎に繰り返される。
【0243】B.次元結合 結合器938は、種々のコンプレックスの毎日集計され
た情報が要約されたコンプレックス情報を結合するため
のコンポーネントである。結合器オブジェクトによって
行われる次元集計タスクは、一部のメンバーによって行
われるスケジューリングタスクに対応する。いつでも行
われる自動(増加的)次元集計は、更新オブジェクトに
よって実行される。
【0244】再度図2を参照するに、ProReachによって
提供され、特に、結合器938によって計算された多数
の集計情報のレベルが示されている。結合器938は、
与えられたカテゴリー関心時間パターン情報の組を、ユ
ーザ、カテゴリー、又は、時間的区間の任意の組み合わ
せに関して結合するよう設計される。図2には、集計情
報の種々のレベルに関する結合器938の動作が示され
ている。
【0245】一般的に、図2に示された各集計コンプレ
ックスは、データベース720の各テーブルに関して説
明されたように重み値を格納する。重み値は、評価中の
コンプレックスに寄与する全てのコンプレックスの重み
値に関して動作する集計関数によって計算される。たと
えば、特定のユーザグループが100人のメンバーを有
する場合、ユーザグループコンプレックスに対する重み
は、全てのグループメンバーのユーザコンプレックスの
重みの関数である。同様に、ユーザコンプレックスの重
み(全カテゴリーに関して相対的なユーザの全体的関
心)は、ユーザに対する全てのユーザ・カテゴリーコン
プレックスの重み(特定の各ユーザ・カテゴリー関心)
の関数である。
【0246】一実施例において,集計関数は平均重み値
である。他の実施例では、異なる集計関数が使用され,
好ましくは、集計関数は要求に応じて選択される。この
ため、説明の便宜上、一般的に集計関数について説明
し、平均重み集計関数を使用する具体例を提示する。
【0247】レベル1には、ユーザ・カテゴリー(User-
Category)コンプレックス203と、カテゴリー(Catego
ry)コンプレックス205の2タイプの集計データがあ
る。カテゴリーコンプレックス205は、1週、1月、
3ヶ月などの選択された時間的区間における全ユーザ及
び特定カテゴリーに関するカテゴリー重みの集計関数に
よって計算される。望ましいカテゴリーのカテゴリーI
D、開始日付及び終了日付は、結合器938に渡され
る。結合器938は、カテゴリーID及び時間的区間を与
え、ユーザ・カテゴリーテーブルから照合レコードを取
得することによって、データベース720から適切なカ
テゴリー関心時間モデルを獲得する。獲得されたレコー
ドに対するカテゴリー重み平均は、コンプレックスに対
する最終値を生成するため集計関数によって処理され
る。集計関数が平均化関数であるとき、平均値は,平均
化される日数に亘って取得された重みの合計をこの日数
で除算した結果である。得られた集計重み値は、カテゴ
リーID、分散、傾向、開始日付及び終了日付と共に、カ
テゴリーコンプレックステーブルに格納される。このコ
ンプレックスに対し、傾向は、集計された重み値が、前
の値よりも増加的、減少的、若しくは、一定のいずれで
あるかによって判定される。
【0248】ユーザ・カテゴリーコンプレックス203
の場合、プロセスは類似しているが、所定の時間的区間
の特定ユーザに限定される。得られた結果はユーザ・カ
テゴリーコンプレックステーブルに記憶される。
【0249】レベル2には、グループ・カテゴリー(Gro
up-Category)コンプレックス205とユーザコンプレッ
クス207とがある。グループ・カテゴリーコンプレッ
クス205を獲得するため、結合器938は、ユーザ・
カテゴリーコンプレックステーブルから、指定されたユ
ーザグループに対する全てのユーザ・カテゴリーコンプ
レックス205を取得する。ユーザグループメンバーシ
ップ情報は、データベースにプロフィールテーブルの形
で記憶され、プロフィールテーブルはユーザID毎に、ユ
ーザがメンバーとして属するグループを識別する。グル
ープIDが与えられたとき、結合器938は、このグルー
プのユーザを識別することができ、それらのユーザ毎に
ユーザ・カテゴリーコンプレックス205を獲得するこ
とができる。獲得されたコンプレックスの重みは、適切
な集計関数を用いて集計され、得られた結果がグループ
・カテゴリー(Group-Category)コンプレックステーブル
に格納される。
【0250】特定ユーザに対するユーザコンプレックス
207を作成するため、合成器938は、ユーザのユー
ザIDと、所望の開始時刻及び終了時刻とが与られた場合
に、ユーザ・カテゴリーコンプレックステーブルからユ
ーザ・カテゴリーコンプレックスを獲得し、重みを集計
する。得られた結果はユーザコンプレックステーブルに
格納される。
【0251】レベル3にはグループ(Group)コンプレッ
クス209が存在する。グループコンプレックスを作成
するため、結合器938は、ユーザ・コンプレックステ
ーブルから、所望のユーザグループに対するユーザグル
ープIDと、所望の開始から終了までの間隔とを使用し
て、全てのユーザコンプレックス207を取得する。得
られた結果はグループコンプレックステーブルに格納さ
れる。好ましくは、所定のグループに対するユーザコン
プレックス207を獲得するとき、結合器938は、ユ
ーザグループ規準テーブルについて問合わせを行い、各
ユーザが現在所望のユーザグループのメンバーであるこ
とを確認し、集計が行われるときにメンバーであるユー
ザだけを対象に含める。
【0252】最後に、総(Total)コンプレックス211
が図2のレベル4に示される。総コンプレックスを作成
するため、結合器938は、グループコンプレックステ
ーブルから指定された時間的区間における利用可能な全
グループコンプレックス209を取得し、それらの重み
を集計する。得られた結果は総コンプレックステーブル
に格納される。
【0253】上述の通り、一実施例において、重みの集
計関数は平均化関数であり、任意の望ましいコンプレッ
クスに対し、重み値は、所望のコンプレックスに寄与す
るコンプレックスの重み値の平均である。
【0254】より詳細には,集計サービスは、コンプレ
ックスのタイプ毎に、使用されるべき集計関数を定義す
るコンフィギュレーションファイルを格納する。さら
に、コンフィギュレーションファイルは、コンプレック
ス毎に、コンプレックスが消去されるまでデータベース
に記憶されるべき期間を定義する寿命値を格納する。
【0255】C.ユーザグループシステム ユーザグループマネージャ936は、ユーザグループを
定義、保持し、特定のグループ内のユーザのメンバーシ
ップに関する問合わせに応答する役割を担う。上述の通
り、各ユーザグループは、規準テーブルに格納された一
つ以上のメンバーシップルールを有する。ユーザグルー
プマネージャ936は以下の関数を含む。
【0256】ユーザグループのリスト取得 Get List o
f User Group:ユーザグループテーブルからユーザグル
ープのリストを返す。
【0257】グループサイズの取得 Get Group Size(U
ser Group):指定されたユーザグループのサイズを返
す。
【0258】ユーザ所属グループの取得 Get Which Gr
oup User Belongs To(User):指定されたユーザがメン
バーとして属するグループのリストを返す。
【0259】グループ説明情報の取得 Get Group Desc
ription(User Group):ユーザグループテーブルから指
定されたユーザグループの説明情報を返す。
【0260】グループのユーザ取得 Get Users of Gro
up(User Group):プロフィールテーブルを再検証するこ
とによって現在メンバーであるユーザのリストを返す。
【0261】グループへのユーザ追加 Add User to Gr
oup(User, User Group):指定されたユーザが指定され
たグループのメンバーシップルールを満たすかどうかを
試験し、満たす場合にそのユーザをプロフィールテーブ
ル内でグループに追加する。
【0262】この関数は、新しいユーザがユーザテーブ
ルに追加されるときにも実行され、ユーザグループマネ
ージャ938は、ユーザグループ規準テーブル内の既存
の各グループに対して新しいユーザを試験し、そのユー
ザがメンバーシップルールを満たす各ユーザグループの
プロフィールテーブルを更新する。
【0263】グループからユーザ削除 Remove User fr
om Group(User, User Group):プロフィールテーブル内
で指定されたユーザグループから指定されたユーザを削
除。
【0264】メンバーシップルールの定義 Define Mem
bership Rule(Category, Minimum,Maximum, Negatio
n):新しいメンバーシップルールを規準テーブルに追加
する。たとえば、カテゴリー"Auto Racing Enthusiast
s"を定義するため、規準が以下の通り定義される。
【0265】AUTO_RACING_GROUP=user.category(auto_r
acing)>80これは、特定ユーザに対する"Auto racing"カ
テゴリーの重みが80よりも大きいということを意味す
る。
【0266】したがって、"Auto racing"カテゴリーにM
inimum=0及びNegation=Noが渡される。
【0267】ルールの削除 Delete Rule(Criterion):
規準Criterionテーブルから指定されたメンバーシップ
ルールを削除する。
【0268】グループのルール定義 Define Rule for
Group(User Group, Criterion):ユーザグループ規準テ
ーブルの指定されたユーザグループに指定された規準を
追加する。
【0269】グループからのルール削除 Delete Rule
from Group(User Group, Criterion):ユーザグループ
規準テーブルの指定されたグループから指定された規準
を削除する。
【0270】上記の全ての関数は、ユーザ及びユーザグ
ループテーブルを自動的に更新するため、周期的に実行
されるようにスケジューラ934を用いてスケジューリ
ングされる。
【0271】D.毎日の集計(Daily Aggregation) 毎日問合わせDailyQueryオブジェクト932(毎日集計
システムの一部)は、毎日の集計に対し多数のカテゴリ
ー重みで表現されるようなユーザ関心レベルに関する問
合わせに応答する役割を担う。1日は、単一の毎日集計
オブジェクトによって表現される。毎日問合わせオブジ
ェクトは、毎日問合わせオブジェクトに関する全種類の
情報、たとえば、対応した日付、ユーザは誰か、最も活
動的なユーザは誰か、どのようなカテゴリーがあるか、
最も重要なカテゴリー(ユーザに対し最大の重みを有す
るカテゴリー)は何かのような情報を獲得できるように
する。
【0272】E.アフィニティ(Affinity)グループマネ
ージャ アフィニティグループマネージャ936は、相互に関連
したユーザグループを識別する役割を担う。アフィニテ
ィグループは、関心に関連した規準と、ブール代数論理
を用いて結合された(たとえば、特別会員データベース
からの)他のカスタマプロフィール情報とによって定義
される。たとえば、年齢(age)、収入(income)、及び、
学歴(education)の人口統計学を用いて、以下のメンバ
ーシップ条件によってアフィニティグループ"yuppie sp
ortsters"を定義することがでいる。
【0273】 age <= 35 AND (income > 60,000 OR education >= undergraduate) AND interest(sports) > 1.5 この例では、特別会員データは、相対的な関心ProReach
データと結合される。アフィニティグループ"yuppie sp
ortsters"は、通常のユーザグループについての問合わ
せと同じ方法で問い合わせることができる。本例の場
合、グループメンバーシップの計算は、高価な演算であ
るため、アフィニティグループは、メンバーシップ再計
算コマンドrecalculateMembership()を有し、最後の再
計算を記憶する。
【0274】アフィニティグループが作成された後、個
別のユーザのイベントレコードはアフィニティグループ
に集められるが、アフィニティグループ自体は他のグル
ープ若しくはコンプレックスに集められない。かくし
て、数回の集計サイクル中に拒否され続けた後、アフィ
ニティグループはより有用になるが、管理者は自由にア
フィニティグループを除去することができる。
【0275】アフィニティグループマネージャ936は
以下の機能を提供する。
【0276】1.アフィニティグループ並びに市場取引
者カスタムメードアフィニティグループの自動作成2.
アフィニティグループに対するユーザの自動追加/自動
削除3.アフィニティグループについて質問し、アフィ
ニティグループを操作するメソッド上記3.に含まれる
メソッドを以下に列挙する。
【0277】getListOfAffinityGroups:アフィニティ
グループのリストを返す howManyUsersIn(AffinityGroup group):指定されたア
フィニティグループ内のユーザ数を返す toWhichAffinityGroupsBelong(String user):指定され
たユーザが所属する全てのアフィニティグループのリス
トを返す getUsersIn(AffinityGroup group):指定されたアフィ
ニティグループ内の全ユーザのリストを返す add(AffinityGroup, user):これは指定されたユーザを
指定されたアフィニティグループに追加する remove(AffinityGroup, user):これは指定されたユー
ザを指定されたアフィニティグループから削除する。
【0278】F.更新オブジェクト 更新オブジェクト940は、図2を参照して説明したよ
うに、毎日の集計を増加的に更新し、集計ツリーのコン
プレックスを更新する役割を担う。増加的な更新は、毎
日集計システムがウェブイベントの単一のパケットを処
理し終えたときに行われる。増加的な更新は、レベル1
のコンプレックスから順番に集計ツリーを昇りながら各
コンプレックスに適用される。増加的な更新のための式
は、多数のコンプレックステーブルに関して既に説明し
た。この増加的な更新は、自動的に、(毎日集計システ
ムがパケットの処理を終了したとき)常時行われる。こ
の増加的な更新は、結合器オブジェクトによって行われ
るタスクとは異なる。結合器オブジェクトは、(特定の
オブジェクトに対する)メンバーの要求時に次元集計を
行う。更新オブジェクトは次元集計システムの一部であ
る。更新オブジェクトは、毎日集計システムと次元集計
システムの間の出入口である。
【0279】G.スケジューラ スケジューラ934は、データベース720の保守に関
係した多数のタスクの実行をスケジューリングする。ス
ケジューラ934は、ユーザが定義した周期に基づいて
以下のタスクを実行することができる。
【0280】1.所与のカテゴリーに対し、ユーザ及び
時間的区間に関する集計(カテゴリーは集計の間、固定
される)。この集計の結果はカテゴリーコンプレックス
である。
【0281】2.所与のユーザ及びカテゴリーに対し、
時間的区間に関する集計(ユーザ及びカテゴリーは、集
計の期間中、固定される)。この集計の結果は、ユーザ
・カテゴリーコンプレックスである。
【0282】3.所与のカテゴリー及びユーザグループ
に対し、所与のユーザグループ内のユーザ及び時間的区
間に関する集計(カテゴリー及びユーザグループは、集
計の期間中、固定される)。この集計の結果は、グルー
プ・カテゴリーコンプレックスである。
【0283】4.所与のユーザに対し、全カテゴリー及
び時間的区間に関する集計(ユーザは、集計の期間中、
固定される)。この集計の結果は、ユーザ・カテゴリー
コンプレックスである。
【0284】5.所与のユーザグループに対し、所与の
ユーザグループ内のユーザ、全カテゴリー、及び、時間
的区間に関する集計(ユーザグループは集計の期間中、
固定される)。
【0285】6.全ユーザグループ、全カテゴリー、及
び、時間的区間に関する集計。この集計の結果は総コン
プレックス211であり、全ウェブ行動の総集計を表
す。
【0286】7.一日の結果の削除 8.カテゴリーコンプレックスオブジェクトの削除 9.ユーザ・カテゴリーコンプレックスオブジェクトの
削除 10.グループ・カテゴリーコンプレックスオブジェク
トの削除 11.ユーザコンプレックスオブジェクトの削除 12.グループコンプレックスオブジェクトの削除 13.総コンプレックスオブジェクトの削除 14.集計キューからのウェブイベントレコードの獲得
の頻度。頻度はスケジューリング可能であり、ハンドラ
ーは、たとえば、15分毎、1時間毎、1分毎にイベン
トレコードを獲得する。
【0287】上記の各タスクは、スケジューラ934内
で対応したタスク番号によって識別される。タスクをス
ケジュールするため、このスケジュールは以下の関数を
提供する。
【0288】Schedule(task, startTime, maxDuration,
frequency, timeInterval):taskは、上記のタスクの
中から一つのタスクを番号で識別する。startTimeは、
タスクが実行される時刻を識別する。maxDurationは、
タスクが終了するために要する最大時間を指定する。こ
の最大時間を経過してもタスクが終了しない場合、その
タスクのプロセスは停止される。timeIntervalは、タス
クが実行されるべき時間的区間、たとえば、毎日、毎
週、毎月などを指定する。frequencyは、タスクが定義
された時間的区間内に実行されるべき回数である。
【0289】H.イベントディスパッチャ イベントディスパッチャ930は、集計サービスのイベ
ント駆動型管理を行い、特に、データベース内の多数の
コンプレックステーブル、ユーザテーブル、及び、カテ
ゴリーテーブルの管理を行う。イベントディスパッチャ
930は以下のイベントを発送することができる。
【0290】1.CComplexBeginEvent:このイベント
は、ユーザ及び多数の日数に関する集計の開始の際に、
(CComplexオブジェクトを生成するため)イベントディ
スパッチャ930によって処理される。
【0291】2.CComplexEndEvent:このイベントは、
ユーザに関する集計の終了の際に(すなわち、CComplex
オブジェクトが作成された後)、イベントディスパッチ
ャ930によって処理される。
【0292】3.UCComplexBeginEvent:このイベント
は、毎日の結果に関する集計の開始の際に、(UCComple
xオブジェクトを生成するため)イベントディスパッチ
ャ930によって処理される。
【0293】4.UCComplexEndEvent:このイベント
は、ユーザに関する集計の終了の際に(すなわち、UCCo
mplexオブジェクトが作成された後)、イベントディス
パッチャ930によって処理される。
【0294】5.GCComplexBeginEvent:このイベント
は、UCComplexオブジェクトに関する集計の開始の際
に、(GCComplexオブジェクトを生成するため)イベン
トディスパッチャ930によって処理される。
【0295】6.GCComplexEndEvent:このイベント
は、UCComplexオブジェクトに関する集計の終了の際に
(すなわち、GCComplexオブジェクトが作成された
後)、イベントディスパッチャ930によって処理され
る。
【0296】7.UComplexBeginEvent:このイベント
は、UCComplexオブジェクトに関する集計の開始の際
に、(UComplexオブジェクトを生成するため)イベント
ディスパッチャ930によって処理される。
【0297】8.UComplexEndEvent:このイベントは、
UCComplexオブジェクトに関する集計の終了の際に(す
なわち、UComplexオブジェクトが作成された後)、イベ
ントディスパッチャ930によって処理される。
【0298】9.GComplexBeginEvent:このイベント
は、UComplexオブジェクトに関する集計の開始の際に、
(GComplexオブジェクトを生成するため)イベントディ
スパッチャ930によって処理される。
【0299】10.GComplexEndEvent:このイベント
は、UComplexオブジェクトに関する集計の終了の際に
(すなわち、GComplexオブジェクトが作成された後)、
イベントディスパッチャ930によって処理される。
【0300】11.TComplexBeginEvent:このイベント
は、GComplexオブジェクトに関する集計の開始の際に、
(TComplexオブジェクトを生成するため)イベントディ
スパッチャ930によって処理される。
【0301】12.TComplexEndEvent:このイベント
は、GComplexオブジェクトに関する集計の終了の際に
(すなわち、TComplexオブジェクトが作成された後)、
イベントディスパッチャ930によって処理される。
【0302】13.UserGroupAddEvent:このイベント
は、ユーザがユーザグループのメンバーになるとき(す
なわち、ユーザがユーザグループに追加されるとき)、
イベントディスパッチャ930によって処理される。
【0303】14.UserGroupRemoveEvent:このイベン
トは,ユーザグループのメンバーがユーザグループから
削除されるとき、イベントディスパッチャ930によっ
て処理される。
【0304】15.UserGroupCreatedEvent:このイベ
ントは、新しいユーザグループが作成されるとき、イベ
ントディスパッチャ930によって処理される。
【0305】16.UserGroupDeletedEvent:このイベ
ントは、ユーザグループが削除されるとき、イベントデ
ィスパッチャ930によって処理される。
【0306】17.UserGroupTestBeginEvent:このイ
ベントは、ユーザグループマネージャが、ユーザグルー
プのメンバーがユーザグループメンバーシップテストを
満たしているか否かをテストするとき、イベントディス
パッチャ930によって処理される。
【0307】18.UserGroupTestEndEvent:このイベ
ントは、ユーザグループマネージャUserGroupManagerク
ラスがユーザグループメンバーシップテストを終了した
とき、イベントディスパッチャ930によって処理され
る。
【0308】19.CComplexDeletedEvent:このイベン
トは、CComplexオブジェクトが削除されたとき、イベン
トディスパッチャ930によって処理される。
【0309】20.UCComplexDeletedEvent:このイベ
ントは、UCComplexオブジェクトが削除されたとき、イ
ベントディスパッチャ930によって処理される。
【0310】21.GCComplexDeletedEvent:このイベ
ントは、GCComplexオブジェクトが削除されたとき、イ
ベントディスパッチャ930によって処理される。
【0311】22.UComplexDeletedEvent:このイベン
トは、UComplexオブジェクトが削除されたとき、イベン
トディスパッチャ930によって処理される。
【0312】23.GComplexDeletedEvent:このイベン
トは、GComplexオブジェクトが削除されたとき、イベン
トディスパッチャ930によって処理される。
【0313】24.TComplexDeletedEvent:このイベン
トは、TComplexオブジェクトが削除されたとき、イベン
トディスパッチャ930によって処理される。
【0314】25.DailyResultCreatedEvent:このイ
ベントは、毎日の結果が作成されたとき、イベントディ
スパッチャ930によって処理される。
【0315】26.DailyResultsDeletedEvent:このイ
ベントオブジェクトは、毎日の結果が削除されたとき、
イベントディスパッチャ930によって始動される。
【0316】イベントディスパッチャ930は、これら
のイベントを集計サービスのほかのコンポーネントに送
ることによって、このようなコンポーネントをイベント
に適切に応答させることができる。たとえば、更新マネ
ージャは、適切なコンプレックスの増加的な更新を行う
ため、DailyResultsAddedEventに応答する。
【0317】I.プロフィールシステム プロフィールシステム955は、プロフィールに関する
全ての問合わせに応答するプロフィール問合わせProfil
eQueryという名称のオブジェクトを提供する。このサー
ビスには、プロフィールの管理を担うプロフィールマネ
ージャオブジェクトが含まれる。このような管理は、た
とえば、以下のプロフィール共有化が含まれる。メンバ
ーAは、集中ProReachシステムのデータベース内に自分
のウェブサイトのプロフィールを保持する。別のメンバ
ーBが、そのプロフィールの一部(たとえば、エレクト
ロニクスに高い関心を示すプロフール)を保有したい場
合を考える。メンバーBは、自分専用のプロフィールを
所有しないにもかかわらず、上記プロフィールの一部を
受け取りたい。このような要求を処理し、どのプロフィ
ールが共有されているかの記録を保持することは、全て
プロフィールマネージャオブジェクトによって行われ
る。
【0318】より具体的には、プロフィール問合わせオ
ブジェクトは、ユーザプロフィールに関する問合わせを
処理する役割を担う。プロフィール問合わせオブジェク
トは、ユーザIDを指定する問合わせを受け、プロフィー
ルテーブルからそのユーザのグループのメンバーシップ
情報を取得し、ユーザ・カテゴリーテーブルから問題の
カテゴリーに関するそのユーザの関心情報(たとえば、
重み、分散、若しくは、傾向情報)を獲得する。問合わ
せオブジェクトは、取得した情報からユーザプロフィー
ルを作成する。ユーザプロフィールには、ユーザが現在
メンバーとして属するユーザグループの現在ユーザグル
ープリストと、ユーザがある時間的区間に亘り新しいメ
ンバーとして属するグループ、及び、ユーザがメンバー
から外れたグループを識別するグループ変更履歴リスト
と、カテゴリー重みに基づいて関心の程度が上位N番
目、たとえば、上位10番目までのカテゴリーのリスト
の中の少なくとも一つの項目が含まれる。カテゴリーリ
ストは、販売目的用にユーザの将来の関心を予測するた
め、増加傾向を示すカテゴリーだけを収容するように改
良してもよい。
【0319】好ましい一実施例において、ローカルとグ
ローバルの2種類のユーザプロフィールが保持される。
ローカルユーザプロフィールは、ウェブサイトを訪れた
ユーザから収集したウェブイベント情報を用いて、ProR
each使用可能ウェブサイト100毎に保持される。グロ
ーバルユーザプロフィールは、ホストシステム103若
しくはグローバルサーバー112によって保持され、ユ
ーザ毎のローカルユーザプロフィールから作成される。
【0320】J.AQLシステム ユーザグループマネージャ(UserGroup Manager)オブジ
ェクト936、毎日問合わせ(DailyQuery)オブジェクト
932、及び、プロファイラ(Profiler)オブジェクト7
26は、システム管理者(及び、ProReachシステムの多
数のメンバー)がユーザの関心、カテゴリー、グループ
などに関する問合わせを形成することができる機構を必
要とする。一実施例において,この機構は、集計問合わ
せ言語(AQL)と称されるフレキシブル問合わせ言語に
よって与えられる。このAQLは、多数のマネージャが実
行する問合わせオブジェクトを形成するため、AQLシス
テム944によって処理される。
【0321】1.AQL言語 AQLは述語問合わせ言語であり、主として述語だけに基
づく言語である。データタイプの宣言は無い。全ての述
語は、いくつかの引数(その項数arity)と、引数がも
つべきデータタイプとを有する。述語が問合わせに使用
されるとき、述語の引数のデータタイプが使用されるこ
とが暗黙的に想定され、変数のデータタイプを宣言する
必要がない。AQLには以下の特徴がある。
【0322】1.原始データタイプ及び原始述語が豊富
である。
【0323】2.元の述語又は原始述語から新しい述語
を構築でき、それを行うための構文が非常に簡単であ
る。
【0324】3.述語を用いて問合わせを構築する構文
が非常に簡単である。
【0325】4.商取引者と述語の間のインタフェース
が簡単であるため、商取引者は問い合わせ言語を学習す
る必要がない。
【0326】Aggregation Query Language(AQL)には、
2種類のステートメント(文)が存在する。 1.問合わせステートメント(ある情報を問い合わせる
ステートメント) 2.述語定義ステートメント(新しい述語を構築するス
テートメント) 問合わせステートメントの形式は以下の通りである。
【0327】
【外1】 この文は、文P(x, y,…, z)が真となるような全てのタ
プル(x, y, …, z)に関心があることを意味する。た
とえば、P(x)が、「ユーザxは釣りにとても関心があ
る」を意味するならば、問合わせ:
【0328】
【外2】 は、「釣り」にとても関心のある全てのユーザを返答す
る。
【0329】より形式的に説明すると、問合わせステー
トメントの文は、常に、キーワード
【0330】
【外3】 で始まり、次に、識別子(コンマで区切られた多数の識
別子でも構わない)と述語が続く。
【0331】述語は、合成述語でも組込み述語でもよ
い。組込み述語は、集計サービスによって予め与えられ
た述語である。合成述語は、組込み述語を論理結合子
(論理積、論理和、否定など)と組み合わせることによ
って構築される述語である。勿論、他の合成述語を組み
合わせることによって別の合成述語を構築することがで
きる。すなわち、合成述語は商取引者によって構築され
る述語であり、組込み述語は既存の(予め集計サービス
によって設けられた)使用可能な述語である。以下の説
明で、述語という用語は、組込み述語と合成述語の両方
の意味で使用される。述語を記述する構文は以下の通り
である。
【0332】合成述語は、論理積、論理和、若しくは、
否定のいずれでもよい。
【0333】述語がコンマで区切られるとき、論理積を
表す。たとえば、次の文:[P,Q,R]は3個の述語P、Q及
びRの論理積を表す。
【0334】述語がコロンで区切られているとき、論理
和を表す。たとえば、次の文:[P:Q:R]は、3個の述語
P、Q及びRの論理和である。
【0335】述語が中括弧{}で囲まれているとき、否定
を表す。たとえば、次の文:{P}は、述語Pの否定を表
す。
【0336】新しい述語は、2個以上の述語を上記の論
理積、論理和又は否定用の論理結合子を用いて結合する
ことにより、既存の述語から構築することができる。新
しい述語を定義するため、以下の述語定義ステートメン
トを使用する。
【0337】
【外4】 一例として、述語P(x)が「カテゴリーxには人口の半分
以上が関心をもっている」を表し、述語Q(y)が「ユーザ
yは医学に関心がある」を表し、第3の述語R(y, z)が
「ユーザyはカテゴリーzだけに強い関心がある」を表
す場合を考える。ここから新しい述語K(y, x)を以下の
通り構築することができる。
【0338】
【外5】 この新しい述語は、以下のような問合わせを作成するた
め使用することができる。
【0339】
【外6】 この問合わせは、ユーザyが医学に関心があり、かつ、
カテゴリーxだけに強い関心があり、このカテゴリーx
には人口の半分以上が関心をもっているような全てのユ
ーザyとカテゴリーxを返す。
【0340】AQLでは、限量子付きのステートメント
(すなわち、論理限量子を含むステートメント)を表現
することができる。述語P(x, y)が「ユーザxはカテゴ
リーyに程々の関心がある」を意味するとする。ここ
で、「ユーザxが程々の関心をもつカテゴリーが存在す
る」というような文を表現したい場合を考える。述語計
算では、この表現は、存在限量子を用いて行われる。
【0341】∃y P(x, y) AQLの場合、 P(x, Y) のように表現することができる。大文字は、その変数が
限量子付き変数であることを意味する。次の問合わせ:
【0342】
【外7】 は、あるカテゴリーに程々の関心のある全てのユーザz
を返す。
【0343】AQLは、全称限量子を表現することもでき
る。1階論理の規則によると、全称限量子は,否定と存
在限量子の組み合わせによって表現できる。たとえば、
次の文:「全てのカテゴリーに対し、ユーザzの関心は
70%よりも高い」を表現したい場合を考える。
【0344】新しい述語P(z)は、ユーザzが全てのカテ
ゴリーにカテゴリーとは無関係に常に70%よりも高い
関心をもつことを表す。
【0345】「ユーザxのカテゴリーyに対する関心は
70%よりも高い」という意味の述語Q(x, y)が既に存
在すると仮定すると、新しい述語Pは、既存の述語Qを用
いて、
【0346】
【外8】
【0347】
【外9】 のように表現される。
【0348】2.AQLインタープリタ AQLシステム944は、AQL言語を実行可能オブジェクト
(たとえば、Javaオブジェクト)に翻訳し、その結果を
返すために働くインタープリターを含む。インタープリ
ターのコンポーネントには、ステートメントアナライ
ザ、述語定義プロセッサ、レコーダー、ツリービルダ
ー、ファクトリー、述語ツリービルダー、述語ビルダー
及び評価器が含まれる。
【0349】あるAQL言語が与えられた場合に、ステー
トメントを取得する最初のコンポーネントは、ステート
メントアナライザコンポーネントである。このコンポー
ネントは、そのステートメントが問合わせステートメン
ト又は述語定義ステートメントのどちらの種類のステー
トメントであるかを判定するだけである。このステート
メントが問合わせステートメントであることが判明した
場合、ステートメントアナライザは、ステートメントの
述語部をツリービルダーコンポーネントに送る。ツリー
ビルダーコンポーネントは、ステートメントの述語部か
らツリーを構築する。たとえば、元のステートメント
が、
【0350】
【外10】 という形式の問合わせステートメントである場合を考え
る。
【0351】上記ステートメントの述語部は、最初の括
弧"["で始まり、最後の括弧"]"で終わる文字列である。
ツリービルダーが上記問合わせステートメントから構築
するツリーは以下の通りである。
【0352】 ツリービルダーコンポーネントによってこのツリーが構
築された後、ファクトリーコンポーネントは、ツリーの
各リーフに対し(すなわち,R(x, y), P(x),Q(y)に対
し)述語オブジェクトを構築する。次に、述語ツリービ
ルダーは、ツリーの各リーフを,ファクトリーコンポー
ネントによって構築された対応した述語オブジェクトで
置換する。述語ビルダーコンポーネントは、ツリー全体
に対し述語オブジェクトを構築する。評価器コンポーネ
ントは、述語ビルダーコンポーネントによって構築され
た述語オブジェクトを取得し、その述語オブジェクトに
引数を与え、述語オブジェクトを評価し、問合わせステ
ートメントの結果を要求側のエンティティに与える。た
とえば、評価器は、問合わせのタイプと、問合わせを取
り扱うべきオブジェクトとに依存して、その結果をユー
ザグループマネージャオブジェクト、プロファイラオブ
ジェクト、毎日キューオブジェクト、AggQueryオブジェ
クトに返す。
【0353】上述の通り、ステートメントアナライザコ
ンポーネントは、最初に、ステートメントのタイプが何
であるか(問合わせステートメント、又は、述語ステー
トメント)を判定する。次に、ステートメントが問合わ
せステートメントではなく、述語ステートメントである
ことが判明した場合、ステートメントアナライザは、述
語定義プロセッサコンポーネントへのステートメントを
処理する。このコンポーネントは、ステートメントの述
語部を取得し、この述語部をツリービルダーコンポーネ
ントと、ファクトリーコンポーネントと、述語ビルダー
とに与える。次に、述語定義プロセッサは、述語ビルダ
ーコンポーネントによって作成された述語オブジェクト
を取得する。述語定義プロセッサコンポーネントは、述
語オブジェクトを、述語定義ステートメントの識別子部
と共に、レコーダーコンポーネントに与える。レコーダ
ーコンポーネントは、ペア(識別子、述語オブジェク
ト)をインタープリターのハッシュテーブルに収容し、
後続の問合わせの際に利用するため記憶される。
【0354】VI.カテゴリー及び分類 A.分類の概要 ウェブビジターがウェブページを閲覧するような行動を
しているとき、ProReachシステムは、発生したこと、す
なわち、誰が,何時、何を行ったかを判定することによ
って行動を分析する。以下では、ProReachが分類化によ
って「誰が」と「何を」を識別する方法を説明する。他
の実施例では、分類化のための付加的な次元が適用さ
れ、行動が行われた場所が判定され、たとえば、どの企
業のウェブサイト若しくは部門で行動が行われたかが示
される。
【0355】文書及びその他のウェブコンテンツを分類
するため、ProReachのコンテンツ認識エンジン718
は、サンプル文書からカテゴリーパターンを構築し、文
書が最も良く一致するカテゴリーパターンに基づいて文
書を分類する。一実施例において、コンテンツ認識エン
ジン718は、Autonomy, Inc., San Mateo, Californi
aから入手可能なエンジンに基づいている。コンテンツ
認識エンジンは、キーワードを識別するため、文書に対
して言語解析を行う。
【0356】コンテンツ認識エンジンは、電子商取引に
関係したカテゴリーのライブラリーを含む。カテゴリー
は、ユーザがウェブ関連コンテンツを判断する方法によ
り良く接近するため、階層的に構成される。ProReach
は、半自動的に、並びに、人の管理の下で、カテゴリー
を追加、正確化、及び、編集するアーキテクチャーをコ
ンテンツ認識エンジンに与える。
【0357】ProReachは、システム管理者が自分の専門
領域若しくはトラヒックの重い領域に拡張することがで
きる標準的なカテゴリーツリーを有する。文書が分類さ
れ、その用途が記録されると共に、ProReachは、カテゴ
リー間の確率的関係を記述する二つのベイズのネットワ
ークを構築する。第一に、インヘリタンスツリーは、階
層的カテゴリー構造の改良と、分類化性能の効率化とに
役立つ。第二に、関係ネットワークは、カテゴリーがど
のように同時に生起したかを調べる自動的データ及び人
手で操作されたデータの両方によって構築される。これ
らの関係を理解することは、商取引者にとって重要な利
点がある。選択された付加情報を標準的なカテゴリーツ
リーに統合することによって,システム管理者が自分の
ウェブサイトで使用するコンテンツの徐々に正確な測定
がこのツリーで行われることが予想される。
【0358】上述の通り、全ウェブイベントレコード
は、ユーザコンプレックス、ユーザグループコンプレッ
クス及びカテゴリーコンプレックスのようなウェブイベ
ントのコンプレックスとして集計されるときに重み付け
られる。この重み付けは、ProReachシステム所有者に関
連した全ての計算を最適化する。コンテンツカテゴリー
及びユーザグループの結合毎に、集計コンプレックスは
この結合のためのウェブトラヒックをモデル化する。
【0359】一実施例において、各ProReachシステム1
00は、"systemEveryone"(システム全員)と称されるユ
ーザグループを有し、このユーザグループは、特定のコ
ンテンツカテゴリーと組み合わされて、特定のカテゴリ
ーに関する所定のProReachシステム100への全ビジタ
ーの行動を記述する。これは、グループ・カテゴリーコ
ンプレックスとして実現され、グループは、"systemEve
ryone"である。同様に、コンテンツカテゴリー"everyth
ing"(全部)は、全てのカテゴリーを要約し、特定のユ
ーザグループの全コンテンツカテゴリーに関する関心を
記述するため、ユーザ・カテゴリーコンプレックス20
3の各ユーザと共に使用される。かくして、分類化は更
なる分析のためデータをグループ化する方法として機能
する。より一般的に説明すると、集中ProReach管理は、
どこかでわかっている全カテゴリー及び全ユーザに対
し、グループ"everyone"及びコンテンツカテゴリー"eve
rything"を使用する。"global"カテゴリーを使用する集
計コンプレックスは、必要に応じてシステムによってダ
ウンロードしてもよい。
【0360】B.カテゴリー及び階層組織データ 好ましい実施例において、全てのコンテンツカテゴリー
は厳密な階層に収容される。各階層はルートを有し、全
ユーザは"everyone"ユーザグループに含まれ、全コンテ
ンツは"everything"カテゴリーに含まれる。カテゴリー
は子カテゴリーを包含する場合があり、子カテゴリーは
1個の親カテゴリーの子である。親カテゴリーのイベン
ト(又は、ユーザ)を1個の子カテゴリーに分類するこ
とにより付加的なデータが得られる。これらのデータ
は、有用性の点で重要な情報を提供すると評価できる。
これらのデータは、人にとって重要である。
【0361】子カテゴリーは、概念的、並びに、ウェブ
トラヒックパターンの点で、相互に異なり、かつ、親カ
テゴリーとも異なる。特に、子カテゴリーは、計算上、
容易に識別できなければならない。子カテゴリーは、カ
テゴリー内の文書をビジターが閲覧した量から得られた
重みに基づいて互いに識別される。独立して存在するに
は非常に「軽い」カテゴリー、すなわち、トラヒックが
不十分であるカテゴリーは、親カテゴリーに組み込ま
れ、その子カテゴリーの重み情報は親カテゴリーの重み
情報と集計される。カテゴリーの重みは、一方で、シス
テム管理者が個別のウェブページ及び他の文書に重みを
つけるため選択した方法に依存する。
【0362】ProReachによってカテゴリーに関して記憶
される細部のレベルは、グローバルオプションを設定す
ることによって調節される。これらのオプションが記憶
容量を低下させるように調節されたとき、データは、時
間的パターンに関して記憶される細部の量を減少させ、
かつ、小さいカテゴリーを親カテゴリーに組み込むこと
によって圧縮される。
【0363】1.カテゴリー階層の構築及び維持 データパターンが変化すると共に、既存のカテゴリーは
調整され、新しいカテゴリーが作成されなければならな
い。カテゴリーの有用性は、好ましくは、他のカテゴリ
ーとの識別性によって測定される。本発明は、カテゴリ
ーに対するイベントレコードを文書化することによっ
て、カテゴリー発見及びカテゴリー保守を行う。細分さ
れていないカテゴリーが重くなりすぎたとき、以下の4
ステップが行われる。 ・成長中のカテゴリーからのサンプル文書が統計的サン
プルによって収集される。 ・キーフレーズがサンプル文書から明らかにされる。 ・アルゴリズムが1個以上の新しいサブカテゴリーを割
り出すため、(キーフレーズのような)特徴を探索す
る。 ・集中ProReach管理者は、新しいサブカテゴリーの取り
込みを承認若しくは否認するよう促される。
【0364】2番目及び3番目のステップは、文書の適
切なグルーピングを判定し、実現性のある名称を提案す
るコンテンツ認識エンジン718によって自動的に行わ
れる。管理者は、提案を受け入れるてもよいが、自動提
案の改良に基づいてカテゴリーを調節してもよい。たと
えば、管理者は、カテゴリーの別の代表的な文書を選択
し、新しいカテゴリーの記述的な名称を選択してもよ
い。新しいカテゴリーは、標準ProReach配布物の一部に
なり、ProReachシステムによるダウンロードに利用する
ことができる。ProReachシステムは、次に、新しいカテ
ゴリーがこの分野で十分なトラヒックをもつ場合には、
新しいカテゴリーをカバーするイベントレコードを構築
する。
【0365】ProReachシステムによって使用されるカテ
ゴリーは、厳密な階層と擬似階層の組み合わせから形成
される。厳密な階層は、単一のインヘリタンスをもつ有
向ツリー状の構造として定義される。各ノード(但し、
ルートを除く)は、必ず1個の親ノードをもつので、親
ノードの子はいずれも100%の確率でその親ノードの
子ノードである。ツリー構造は、子ノードが自分自身の
先祖になり得ないこと、及び、子ノードから先祖へのパ
スは1本しかないことを意味する。この構造は、簡明で
あり、かつ、カテゴリーの階層として使用するのに都合
が良い。しかし、厳密な階層は、文書若しくはユーザが
関連したカテゴリー間の実際の非常に複雑なコンプレッ
クスを取得できない場合がある。また、厳密な階層は不
確実性、すなわち、特定の文書若しくはユーザが属する
カテゴリー若しくはグループの不確定性を考慮できな
い。
【0366】擬似階層はこれらの欠点を解決する。擬似
階層は親子関係を維持するが、文書若しくはユーザが多
数のカテゴリーに部分的に属することを許容する。たと
えば、"dogs"に関する文書は、"pet"カテゴリーに60
%所属し、"mammal"カテゴリーに30%所属する。本発
明の一実施例において、これらの擬似階層は、文書をコ
ンテンツカテゴリー、又は、ユーザグループ内のユーザ
に分類する確率をモデル化するため、ベイズのネットワ
ークとして取り扱われる。本例の場合、1カテゴリー毎
に1ノードが存在する。"sports"カテゴリーと、その子
カテゴリー"football"の間の関係は、(30%,85%)であ
る。この関係は、所与の文書が"sports"として分類され
ていることがわかっている場合に、その文書が"fottbal
l"として分類される可能性が30%であり、逆に、文書
が"football"として分類されている場合に、その文書
が"sports"としても分類される可能性は85%であるこ
とを意味する。特に、スポーツは別の親カテゴリーを有
する。
【0367】ProReachは、実際のコンテンツ分類エンジ
ンの性能が擬似階層型である場合でも、最初にコンテン
ツカテゴリーを厳密な階層でモデル化することによっ
て、階層構造と擬似階層構造の二つのアプローチを合成
する。この原則によれば、子カテゴリー内で発生したウ
ェブトラヒックは、親カテゴリー内でも発生していると
みなされる。
【0368】このような外面的な視点の他に、ProReach
は、親カテゴリーと子カテゴリーが相互に関係している
程度についての統計量、たとえば、一方のカテゴリーが
他方のカテゴリーに分類される確率などの統計量を収集
する。
【0369】C.カテゴリー名及びID ProReachシステム100で使用されるカテゴリーは、独
立した無関係の企業及び機関によって作成される。独立
したエンティティ(たとえば、企業、機関など)によっ
て命名されたカテゴリーは同じ名称をもたないことが必
要である。より具体的には、ProReachシステム100
は、内部の二つのカテゴリーに同じ名称を付けてはなら
ない。このような名称の衝突は、著しい困難を引き起こ
し、処理エラーを招く。
【0370】主として人の認識に適するように英数字名
が用いられ、実際のカテゴリー識別は(ユーザと文書の
両方に対して)カテゴリーIDに基づいて行われるので、
二つの識別子は異なるアプローチを使用する。たとえ
ば、偶然的に重複する可能性の低い情報を識別子中にエ
ンコーディングすることによって、カテゴリー識別子の
固有性が容易に実現される。他方で、テキスト形式の名
称は、その意味を伝達するため、できる限り簡易である
ことが必要である。場所に特有のカテゴリー名を付ける
ことは意味がある。
【0371】IDに対するあいまいさの無いネーミングを
強制し、テキスト形式の名称にもこのネーミングを促進
するため、各ProReachシステム100は、システム実装
時に決定された固有識別子及び固有テキスト文字列を保
持する。カテゴリーの発生場所が不確かである場合、こ
のカテゴリーは、ローカルカテゴリーID又はローカルカ
テゴリー名に依存させられるべきである。かくして、"S
portsWorld"に固有識別子"4Q5f4"をもつProReachシステ
ムが"Football"と呼ばれるカテゴリー"Xj542"を定義す
る場合、このカテゴリーは、 ID: 4Q5f4.Xj542 name: SportsWorld.Football として取り扱われる。
【0372】前後の内容から明らかである場合、接頭
辞"SportsWorld"はデフォルトであるとみなされ、ユー
ザが見るときには隠されるか、若しくは、カラーでエン
コードされる。ProReachが既に"H730"のようなカテゴリ
ー"FootBall"を定義しているような場合、カテゴリー"S
portsWorld"のProReach管理者は、標準カテゴリーと同
じ名称のローカルカテゴリーを作成しようとしたときに
警告メッセージを受け取る。集中システムの集中ProRea
chシステムが固有の識別子、たとえば、ID B345を保有
する場合、集中システムの対応したカテゴリーは、 ID: B345.H730 name:Central.Football のように表される。注:本例において、システムの識別
子(たとえば、B345又はSportsWorld)は接頭辞と呼ば
れる。
【0373】更新プロセス中、ProReachシステム100
は情報を集中システムとの間で交換する。手段に依存し
て、ProReachシステムは、多少のイベントレコード情報
を集中システムに供給し、次に、集中システムは、全Pr
oReachシステム100及び集中システムの管理者から組
み合わされた更新情報を与える。新しいカテゴリーは、
階層の適当な場所に追加され、ProReachシステム100
のカテゴリー改良が集中システムのカテゴリー改良に実
質的に重なる場合に、新しいカテゴリーがリストに掲載
される。ProReachシステム100は、専用化されたカテ
ゴリーを、集中システムが標準カテゴリーツリー(次節
を参照のこと)に追加したカテゴリーに組み入れる機会
が与えられる。
【0374】1.デフォルト変更不可ユーザ・カテゴリ
ー構造 異なるProReachシステム100の間の通信を容易に行う
ため、ユーザグループの初期の粗い集合が与えられる。
全ProReachシステム100は、これらのユーザグループ
を、階層の最上部付近で共有し、付加的な新しいグルー
プ及びサブグループの組込みが行えるようにする。後述
のコンテンツカテゴリーと共に、このユーザ・カテゴリ
ー構造は、図18に示されるように標準構造である。
【0375】第一に、ユーザグループ"global.everyon
e"は、集中システムで収集されたデータによって構築さ
れた唯一のカテゴリーであることに注意する必要があ
る。他の全てのカテゴリーは、各システム100に専用
であり、同図では、"system1.everyone"などのように表
された第2レベルのユーザグループに対応する。かくし
て、たとえば、SportWorldの組では、"system1"の代わ
りに"SportWorld"が用いられる。これらの名称は記述的
な名称であり、実際のカテゴリー識別子はシステムによ
って割り当てられた番号であることに注意する必要があ
る。
【0376】集中システムが情報を追跡するのは、カテ
ゴリー"everyone"と"gloval.everyone"だけである。各P
roReachシステム100には、system.everyoneをルート
とする別の副階層が存在する。集計に関して後述するよ
うに、システムの更新中に、システム100は、システ
ム100のsystem.everyoneに関する情報を集中システ
ムに送る。集中システムは、集中システムのsystem.eve
ryoneに関する情報を返信することによって応答する。
このように、多数の異なるProReachシステム100から
のカテゴリーは更新され続ける。
【0377】カテゴリー"anonymous"、"cookie"及び"re
gistered"は、それぞれ、識別されない匿名の顧客のカ
テゴリー、ProReachが保存することを許可した人に知ら
れた顧客のカテゴリー、及び、完全な登録を終えた顧客
のカテゴリーであり、一般的に、このような人口統計が
名称及びアドレスとして含まれる。
【0378】2.カテゴリーとグループの類似性及び相
違性 管理者は、ユーザやコンテンツのいずれかの種類のサブ
カテゴリーを追加しようとするとき、縦型の特殊化を行
う。サブカテゴリーは、常に、既存カテゴリーの一つに
付加される。システム管理者は、自分の専用システムの
命名法、すなわち、固有の名前空間に基づくカテゴリー
を追加する。二つのタイプのカテゴリーの間には重大な
相違点がある。これらの相違点は、コンテンツカテゴリ
ーについて後で説明することによってより明瞭になる。
【0379】
【表6】 D.分類におけるソース及びロケーションの使用 ソースは、ユーザグループによって取得される次元に類
似した別の次元である。たとえば、集団SportWorldは、
クライアントが競合するウェブサイトSportsOnline.com
を訪れる頻度に非常に関心がある。SportWorldとSports
Online.comが共にProReachシステム100であるとき、
競合相手が自分のサイトの顧客行動をスパイするためPr
oReachを使用できるならば、両者は互いに非常に不満を
示し、また、集中システムの管理者にも不満を示すであ
ろう。これに対し、顧客行動(たとえば、football上の
行動)が自分のウェブサイトにおける行動であるか、あ
るいは、他のウェブサイト上での行動であるかは、Spor
tWorldにとって重大な関心事である。
【0380】これらの関心事のバランスをとるため、Pr
oReachシステムは、ユーザグループ及びコンテンツカテ
ゴリーを取り扱う方法と同様の方法でイベントのソース
を記憶するが、ProReachシステムの所与の集団の内部と
外部だけを区別する。すなわち、任意のユーザ及びカテ
ゴリーに対し、(SportWorldのような)システムは、二
つの拡張型イベントレコードを有する。一方は、集団内
の行動用のイベントレコードであり、他方は、その他の
全ての行動用のイベントレコードである。拡張型イベン
トレコードは、最初、次の章で説明されるイベントレコ
ードと殆ど同様に振る舞うが、拡張型イベントレコード
を索引付けするため使用されるソースの付加パラメータ
が設けられている点が異なる。集中システムは、二つ以
上のソースを記憶し、異なるシステム間の区別、並び
に、システムの内側ソースと外側ソースの区別を行う。
【0381】E.コンテンツカテゴリーライフサイク
ル:形成、調整及び変更 1.標準カテゴリーツリーと、ProReachシステ
ム管理者による追加図19を参照するに、集中システム
103は、各ProReachシステム100の一体的な部分と
して、標準コンテンツカテゴリーツリー1400を提供
する。このツリーのルートは、カテゴリー"STANDARD.ev
erything"であり、このカテゴリーは、各ProReachシス
テム100の個別に付加されたコンテンツカテゴリーの
先祖でもある。標準カテゴリーツリー内の全カテゴリー
は、特に、好ましくは、これらのカテゴリーだけが、接
頭辞"STANDARD"を含む。
【0382】個々のProReachシステム100は、標準カ
テゴリーツリー内のカテゴリーを変更することが認めら
れない。より一般的には、ProReachシステム100は、
専用システムの下のカテゴリー1302、すなわち、そ
のシステムに割り当てられた接頭辞を含むカテゴリーだ
けを変更することができる。ProReachシステムが"Stand
ard"カテゴリーを削除しようとした場合、仮想的な削除
に過ぎない。換言すると、削除されたカテゴリーはその
ProReachシステムからは見えなくなり、目に見える分類
は、不可視にされたカテゴリーには伝えられない。
【0383】a)ProReachシステムでのカテゴ
リーの追加 ProReachシステム100の管理者は、サンプル文書を作
成し、ProReachに対し新しいカテゴリーを作成するた
め、そのサンプル文書を使用するよう命令することによ
って、既存のカテゴリーの新しいサブカテゴリーをロー
カルカテゴリーツリーに手動で追加する。これらのカテ
ゴリーは、好ましくは、ある文書が非常に頻繁に使用さ
れていることを示す行動1404、すなわち、コンテン
ツを文書が分類されているカテゴリー内で更なるサブカ
テゴリーに分類する必要があることを示す行動に応じて
追加される。ProReachは、最初、新しいカテゴリーの親
を決めるため、旧いツリーの下で文書を分類する。親カ
テゴリーが予定していたものでは無い場合、旧い親カテ
ゴリーが十分に機能していないか、あるいは、サンプル
文書が管理者の意図した状況に適合していないというこ
とがわかる。特に、サンプル文書が単一のカテゴリーに
含まれないことがあり、この場合には、おそらく、文書
の部分集合、若しくは、全く別の文書が新しいカテゴリ
ーを訓練するため使用されるべきである。
【0384】ProReachは、組み入れられるカテゴリーに
関するカテゴリー編集行動を監視する。これらのデータ
は局所的に記憶され、更新時に送信されるので、いくつ
かのシステムの管理者が同様の追加を行おうとする場
合、再検査するカテゴリーが指定される。
【0385】カテゴリーを順番に追加することにより、
特定のProReachシステム100は、専門分野に関する専
用階層1402を蓄積する。新しいカテゴリーは、既存
のカテゴリーのサブカテゴリーとして追加されるので、
新しいカテゴリーは、標準カテゴリーツリーに先祖をも
つ。したがって、標準カテゴリーツリーが特定の分野に
拡張されなくても、これらのカテゴリーのイベントカテ
ゴリーは、他の全てのProReachシステム100に有用な
先祖カテゴリーの全体に寄与する。
【0386】カテゴリーツリーの特殊化された拡張は、
専門技術を獲得し、集団に特有の経験を高めるので、特
に、集中システム103にとって興味深い。標準カテゴ
リーツリーが最も重いトラヒックをもつ新しい第三者サ
ブカテゴリーを取り入れるように拡張されると共に、標
準カテゴリーツリーはコンテンツを徐々に正確に反映す
ることができる。
【0387】各ProReachシステム100は、固有のビジ
ネスに関連した細部のレベルだけを保持するので、標準
カテゴリーツリーが大きくなりすぎると企業は標準カテ
ゴリーツリーを使用できなくなる。非常に軽いカテゴリ
ーツリーは、親カテゴリーに組み入れられる。
【0388】b)標準カテゴリーツリーの更新 集中システム103は、到来するデータと実際上の経験
とに基づいて標準カテゴリーツリーを改良する。これら
の改良によって、標準カテゴリーツリーは継続的に更新
される。変更毎にタイムスタンプが押されるので、ProR
each使用可能サイトは、未だ組み入れていない更新内容
だけをダウンロードする。
【0389】更新情報の一部として、ProReachシステム
100は、専用システム上のトラヒックに関するサマリ
ー情報を提供する。このような形でビジネスから収集さ
れる情報の量は変化する。しかし、データは、好ましく
は、控えめにされ、個別の顧客や、企業の精確な財政状
況に関する情報を開示しないように設計される。その代
わりとして、サマリーイベントレコード及びカテゴリー
性能統計量だけが共有される。これにより、集中システ
ム103と他のProReachシステム100の間の共生的関
係が得られ、各ProReachシステムは固有のデータの非常
に精確なモデルを構築できるようになる。
【0390】c)標準カテゴリーツリーの構築 ProReach標準カテゴリーツリー1400は、好ましく
は、約800種類のカテゴリーを含む。これらのカテゴ
リーには、化粧品、スポーツ、ボードゲーム、切手、
車、トラック、本、健康、不動産、旅行などが含まれ
る。標準カテゴリー1400は階層構造である。カテゴ
リーは、カテゴリーのデータベーステーブルに組み込ま
れ、データベーステーブルのエントリーは親カテゴリー
を識別するフィールドをもつ。
【0391】ProReachは、AltaVistaのような主要なウ
ェブポータルサイトのツリーに基づいて初期標準カテゴ
リーツリー1400を構築する。これらのサイトは、既
に、連続的なトラヒックによって確認されたカテゴリー
を構築している。ProReachは、これらのサイトからペー
ジを収集し、カテゴリーからのリンクしたページによっ
て訓練される分類化エンジンを構築するスパイダリング
システムを使用する。主要なポータルサイトからは、数
万件のカテゴリーを入手することができる。スパイダリ
ングは、トップダウン式に始まり、時間の経過と共にカ
テゴリーの知識を増加する。
【0392】カテゴリーは、コンテンツが変化するので
周期的に改定される。多数のカテゴリーは、毎日のニュ
ースのように現在関心のあるトピックスに限定されるこ
とに注意する必要がある。非常に動的なカテゴリーは、
動向に遅れないように非常に頻繁に再計算される。
【0393】d)カテゴリーの発見、改良及び編集 ProReachシステム100で追加されたカテゴリーは、常
に標準カテゴリーへの子孫として追加されるので、標準
カテゴリーを妨害しない。しかし、ProReachシステム管
理者は、固有の子カテゴリーを追加することによって標
準カテゴリーを自由に改良することができる。時間の経
過と共に、集中システム103及びProReachシステム1
00の所有者は、カテゴリーをツリー1400に追加す
ることを選ぶ。カテゴリーは、常に、既存カテゴリーの
子として追加され、親カテゴリーの専門化された部分集
合を定義する。カテゴリーは手動で追加されるだけでは
なく、トラヒックの重いカテゴリーは、より小型の、よ
り専門的な部分に分割される。そのため、カテゴリー
は、抜粋された文書の統計的サンプルを記憶し、管理者
によって別々のサブカテゴリーに分類される。
【0394】カテゴリーの性能は常に測定可能であり、
適宜、特殊化を駆動(若しくは阻止)するための基本手
段として使用される。カテゴリーが十分に機能しないと
き、その情報が警告信号として記憶され、警告信号によ
って、カテゴリーの監視と、場合によってはカテゴリー
の再訓練が始動される。改良は、標準カテゴリーツリー
内でトラヒックによって厳密に制御される。高レベルの
トラヒック1404が与えられたとき、文書の統計的サ
ンプルが収集され、特殊化サブカテゴリーの候補が生成
される。テスト後、サブカテゴリーは標準カテゴリーツ
リー1400に追加される。
【0395】カテゴリーは徐々にトラヒックを失う場合
がある。トラヒックの損失がProReachシステム100で
発生する場合、ProReachシステムは、カテゴリーを使用
できない状態におき、関連したトラヒックを親カテゴリ
ーに切り換える。集中システムで検出されたグローバル
カテゴリー性能がカテゴリーを維持する価値が無い程度
に低い場合、カテゴリーの履歴が後で復元できるように
保管され、カテゴリーは、標準カテゴリーツリー140
0の親カテゴリーに組み入れられる。
【0396】カテゴリーが変更されたとき、元の目標文
書を完璧に分類できない場合がある。その結果として、
新しいカテゴリーIDが生成され(できれば、同じ名前を
用いて)、旧いパターンに対するイベントレコードは、
新しいカテゴリーのイベントレコードに変換される。こ
れを巧く行うために、旧いカテゴリーは、そのイベント
レコードを切り換えるため新しいカテゴリーに割り当て
られる。このとき同時に、旧いコンテンツの中のどれく
らいの部分が新しいカテゴリーに分類されるかを示す数
が割り当てられる。デフォルトとして、1からその部分
を除いた残りの部分が旧いカテゴリーの親に分類され
る。親カテゴリーが変更されたとき、子カテゴリーは新
しいカテゴリーを親とするように切り換えられる。
【0397】F.コンテンツ認識エンジンの分類モデル コンテンツ認識エンジン718は、訓練用文書に基づい
てカテゴリーを訓練することができるので、他の文書は
カテゴリーに対しスコアが与えられる。すなわち、文書
と訓練されたカテゴリーとに対し、コンテンツ認識エン
ジン718は、 score(document, category) を出力する。このスコアは、0から1,000,1000、あるい
は、その他の適当な最大値まで変化し、スコアが高くな
ると共に、文書がカテゴリーにより良く適合することが
示される。ここで、1,000,000は、浮動小数点値の代わ
りに整数で高精度の結果を記憶するため、1.0の代わり
に最大値として使用される。
【0398】図20には、コンテンツ認識エンジンの動
作の上位レベルの概要図である。適当なコンテンツ認識
エンジンは、Autonomy, Inc., San Mateo, California
から入手できる。所定の文書1501はコンテンツ認識
エンジン718に供給され、コンテンツ認識エンジン
は、その文書を記憶されたパターンと照合する。パター
ンは、カテゴリーツリー1400、1402のコンテン
ツカテゴリー毎に一つずつ設けられる。カテゴリー毎
に、コンテンツ認識エンジン718はカテゴリースコア
を出力する。
【0399】多数のウェブページには、ProReachシステ
ムユーザが頻繁に訪れる。ユーザによって閲覧される都
度に各文書を分類するのでは不十分である。したがっ
て、一つの最適な戦略は、カテゴリー重みを再計算する
のではなく、できるだけ記憶することである。カテゴリ
ー重みの記憶は、二つの手段を用いて実現される。ロー
カルProReachシステム100上のページに対し、カテゴ
リー識別情報がメタデータとしてページの内部に格納さ
れる。あるいは、頻繁にビジットされるページの分類情
報がページメタデータキャッシュ716に蓄えられる。
ProReachがURLへのビジットの記録を調べるとき、最初
に、キャッシュ716を検査し、次に、メタデータを探
索する。キャッシュとメタデータのいずれからも分類情
報が得られない場合に限り、他の手続きが行われる。
【0400】1.カテゴリー作成 カテゴリー作成の第1ステップは、代表的な文書の集合
を割り出すことである。カテゴリーの文書は、システム
管理者、又は、このカテゴリーの主題の専門家によって
選択され、コンテンツ認識エンジン718を用いて分類
され、実世界の文書に基づいて管理者若しくは他のコン
テンツ専門家によって品質がテストされ、分類化の結果
が確認される。生成された分類が専門家の観点で優れて
いる場合、良好である代表的な文書の集合が使用され
る。分類結果がよくない場合、代表的な文書の集合は変
更されるべきであり、テストプロセスが繰り返される。
テストによって良好な頻度で良好な結果が得られると
き、分類は完了する。
【0401】カテゴリーを訓練するため使用されたこの
文書の集合は、カテゴリーのプロトタイプである。統計
的な手法を用いることにより、コンテンツ認識エンジン
718は、代表的な文書の集合を分析し、カテゴリーパ
ターンを生成する。このパターンは、重み付きキーフレ
ーズにより構成され、カテゴリー定義用データベーステ
ーブルに格納される。各キーフレーズは、サンプル文書
から抽出され標準的な語形式に制御された語のグループ
である。たとえば、フットボールに関する文書は、"foo
tball players"と"football player"の両方の用語を含
む可能性がある。この例の場合、両方の用語は等価的で
あるとみなされ、単数形の方がカテゴリーパターンにキ
ーフレーズとして記憶される。
【0402】2.文書分類 このようなパターンが存在する場合、コンテンツ認識エ
ンジン718は、文書をそのパターンと比較し、その文
書がパターンに適合する度合いを計算することができ
る。文書が分類されたとき、文書は、最初に文書のテキ
ストをフレーズに分割することによって処理される。言
語解析及び情報理論処理によって、文書中で重要である
可能性が最も高いフレーズが割り出される。たとえ
ば、"I"若しくは"or"のような単語は、頻繁に出現する
ため、文書の意味を区別するために有効ではないので、
考慮の対象から除かれる。残りのフレーズの一部は、キ
ーフレーズとして識別され、文書の意味を定義している
と考えられる程度に応じて重み付けされる。
【0403】文書から抽出されたキーフレーズは、次
に、カテゴリー定義用データベーステーブルでルックア
ップされ、記憶されたカテゴリーパターンと照合され
る。文書のキーフレーズを含むパターンだけが文書のカ
テゴリーの候補として考慮される。4個のカテゴリーパ
ターンがいずれかのキーフレーズに一致した場合を考え
る。この場合、各カテゴリーの文書のスコアが図20に
示されるように計算される。
【0404】ある文書は、たとえば、パターンと90%
一致し、あるいは、50%しか一致しない場合もある。
この一致の程度はスコアと称され、0から1,000,000の範
囲に較正される。最高可能スコアの1,000,000は、文書
がパターン用に記憶されたキーフレーズの所定の個数、
又は、所定のパーセンテージと完全に一致した場合に与
えられる。スコア0は、全く一致しなかった場合に与え
られ、上記のステップの前に除去されたパターンに対し
生じる。一般的に、スコアは、パターンのキーフレーズ
と文書のキーフレーズの一致度の合計によって計算され
る。上述の通り、カテゴリースコアの組は、一致が肯定
されるカテゴリーのパターン毎に得られるパターンマッ
チング結果のカテゴリーベクトル908である。パター
ンマッチが無いカテゴリーの場合、そのカテゴリーに対
するカテゴリーベクトルとして0が記憶される。
【0405】好ましい一実施例において、特定のカテゴ
リーに与えられたスコアは、カテゴリーのサブカテゴリ
ーに与えられたカテゴリースコアの関数として表され
る。これにより、親カテゴリーに対する合成スコア(com
posite score)が得られる。たとえば、"ECOMMERCE"が"B
USINESS"のサブカテゴリーであり、文書のスコアが"ECO
MMERCE"に対しては高く、"BUSINESS"に対しては低い場
合、コンテンツ認識エンジン718は"BUSINESS"カテゴ
リーに対するスコアを増加させる。このアプローチは、
カテゴリーの階層関係を保存し、文書のスコアがサブカ
テゴリーで高く、親カテゴリーで低いという直観に反し
た事例を解決する。
【0406】このアプローチは、以下の通り実現され
る。親カテゴリーがサブカテゴリーを有する場合、親カ
テゴリーのスコアは、そのスコア自体、又は、親カテゴ
リーのスコアとサブカテゴリーの中の最高スコアの平均
スコアの高い方が選ばれる。カテゴリーB、C、Dがカテ
ゴリーAのサブカテゴリーであり、文書の未加工のカテ
ゴリースコアが、A=300000、B=700000、C=10000、D=200
000である場合を想定する。この例では、Aに対する合成
スコアは、300000と700000(サブカテゴリーBに対する
最大サブカテゴリースコア)の平均である。当業者は、
このアプローチを変形することによって親カテゴリーの
スコアを増大させる種々の方法が得られることを認める
であろう。かくして、一般的に、合成スコアは、親カテ
ゴリーに対する合成スコアを与える関数f(親カテゴリ
ースコア、サブカテゴリーのスコア)で表される。
【0407】3.多重辞書分類 ProReachシステムは、カテゴリーを多数のカテゴリーテ
ーブルに分割することによって、特定の環境に調整する
ことができる。一実施例において、これは、異なるカテ
ゴリーの組をカバーするカテゴリー辞書を多種類使用す
ることによって行われる。辞書は、データベース720
内に別々のカテゴリーテーブルとして実現してもよい。
一つのカテゴリーは、一つ以上の辞書に存在する。
【0408】ProReachは、最初に、第1の辞書を用いて
文書を分類する。殆どの場合、これによって、文書の最
終的なカテゴリーが決まる。例示のため、選択されたカ
テゴリーが標準ツリー1400の分枝全体を通じて共通
しない親カテゴリー、たとえば、第2の別の辞書に格納
されたカテゴリーである場合を考える。この例の場合、
更なる分類が行われ、再び、更なる分類では未だ十分で
はないという極めて異常な状況が発生し、精密な起こり
得る細部を獲得するために第3の辞書が必要とされる。
本例の場合、第3の辞書のルートカテゴリーがその子孫
よりも文書に最も良く適合することがわかる。したがっ
て、第3の辞書を使用する3番目のステップだけが先に
行われた分類を承認する。時間的制約に依存して、2番
目及び3番目のステップを省いてもよい。その場合、1
番目のステップが有用な部分的情報を提供する。多数の
分類が3ステップ先まで降下した場合、周期的な最適化
によって、辞書の間で、この降下の尤度を小さくさせる
ように再配分が行われる傾向がある。
【0409】各辞書の動作は、データベーステーブル問
合わせと、その後に続く僅かな処理である。この動作
は、第1の辞書の内部で行われた分類の約3倍の時間を
必要とする。このように構造が複雑化した理由は、大規
模データベース探索に関連した性能限界と、カテゴリー
の集まりが過剰に膨大化することとを避けるためであ
る。特に、この動作は、多数のカテゴリーの高精度化と
予測処理時間の短縮を組み合わせるため、複雑化する。
【0410】トラヒックの少ないProReachシステム10
0の場合、データが制約されているため最も精細なレベ
ルの細部を記憶するには及ばないので、辞書は一つで十
分であると考えられる。しかし、大規模システムでは、
性能の低いカテゴリーが存在する場合に、それらのカテ
ゴリーは、主として2次的なより具体的な辞書に委ねら
れる。これらの2次的な辞書は、あまり頻繁に使用され
ない領域の細部も記憶する。
【0411】この最適化は、第1の辞書内に完全に分類
されたイベントレコード重みを最大化しようとする。こ
れは、システム100毎に、現在のイベントレコード履
歴に基づいて自動的に最適化される。このため、最も重
いカテゴリーが第1の辞書に格納される。本例の場合、
一つの2次的な辞書が、第1のパスによって返されたカ
テゴリーのサブカテゴリーを格納し、これらのサブカテ
ゴリーは更なる細部を判定するため使用される。
【0412】一実施例において、このアプローチは、以
下の通り実現される。
【0413】カテゴリー間に親子関係のあるカテゴリー
のツリーを、たとえば、標準カテゴリーツリー1400
に与える。カテゴリーツリーを形成するように、各カテ
ゴリーの親の数は0若しくは1である。親のないカテゴ
リーはルートとして知られている。0から1,000,000まで
を含む整数で表される閾値Tを考える(この範囲はスコ
アのレンジと同一である)。
【0414】次に、カテゴリーのキューQを定義する。
カテゴリーツリーのルートを順序付きキューQに追加す
る。
【0415】分類されるべき文書を選択する。Rは、カ
テゴリーベクトル908のようなカテゴリー/スコアの
ペアのベクトルを表す。すなわち、ベクトルの各要素は
カテゴリー及びスコアを含むレコードである。
【0416】キューQが空ではない間、以下の1.〜
5.を実行する。 1.キューからカテゴリーCを取り出す。 2.カテゴリーCのサブカテゴリーの集合Sを獲得する。 3.文書Dを集合S内のカテゴリーの集合を用いて分類す
ることにより得られるカテゴリ/スコアペアPのベクト
ルをVで表す。 4.ベクトルVの要素をベクトルRに加える。 5.Vのカテゴリー/スコアペアP毎に、 P.score>=T の場合に限り、P.categoryをQに加える。
【0417】このアプローチは、親カテゴリーに対する
文書のスコアがどの程度優れているかによって制御され
るカテゴリーのツリーの中の子孫を与える。親カテゴリ
ーに対するスコアが非常に低い場合(すなわち、閾値よ
りも低い場合)、親カテゴリーのサブカテゴリーの分類
化は行われない。
【0418】4.カテゴリーキャッシュ ProReachは、好ましくは、ProReachシステム100に常
駐する文書をその分類情報と関連付けるキャッシュサブ
システムを使用する。これにより、文書が変更されない
限り、文書の再分類は回避される。
【0419】より詳細には、ProReachは2種類のキャッ
シュを保持する。一方のキャッシュは、常時存在するペ
ージメタデータキャッシュ716であり、データベース
720に記憶される。もう一方のキャッシュは、メイン
メモリに常駐する。必要に応じて、データベースキャッ
シュからのデータは、メインメモリキャッシュに渡され
る。リソース制限(たとえば、メインメモリ、CPU利
用)のため、項目はメインメモリキャッシュから取り出
され得る。データベースキャッシュは、文書、タイムス
タンプ、及び、それらの分類情報の関係として保存され
る。ページメタデータキャッシュ716は以下のように
使用される。
【0420】文書が指定されたとき、メモリキャッシュ
内でその文書が探索される。文書がメモリキャッシュに
存在しない場合、文書がメタデータキャッシュ716に
存在するかどうかが検査される。文書がメタデータキャ
ッシュに存在する場合、情報を表現する項目がデータベ
ースからメモリキャッシュに入れられる。キャッシュさ
れた項目がメタデータキャッシュにも無い場合、この文
書は分類されていない。したがって、この文書は分類さ
れ、最終的に分類情報がデータベースに送り込まれる。
メモリキャッシュからデータベースへのフラッシュ更新
はバックグラウンドプロセスとして行われる。
【0421】文書に関してキャッシュされた項目が検出
されたとき、文書上のタイムスタンプがキャッシュされ
たデータ上のタイムスタンプよりも新しい場合、このキ
ャッシュされたデータは無視される。タイムスタンプに
基づいて文書が更新されたと考えられる場合、文書は再
分類される。
【0422】ある種の最適化が時間経過と共にこのキャ
ッシュに対し行われる。特に、非常に動的なデータは、
不必要に関連した再分類化の試みのために、キャッシュ
を激しく動かす可能性がある。このような無駄な作業
は、キャッシュ項目毎にカウンタを保持し、キャッシュ
項目が変更される都度カウンタを更新することによって
回避される。所定の時間的区間内に所定回数を超える変
更がなされたとき、文書は内容に関して動的であると推
定することがおそらく合理的であり、キャッシュすべき
ではないと考えられる。
【0423】このため、キャッシュされた項目は、"UNC
HACHEABLE"フィールドを持つことが可能である。キャッ
シュされた項目のこのフィールドがセットされると、キ
ャッシュマネージャは、データベース上のこの項目の見
つけ出しを直ちに停止し、この項目をメモリキャッシュ
に保持しようとしない。
【0424】近年、ウェブサイトがウェブページコンテ
ンツをユーザ向けにカスタマイズしようとするとき、ユ
ーザは、特定のパラメータを、URLで渡されたパラメー
タ(したがって、CGIスクリプトに渡されるパラメー
タ)ではなく、クッキーに格納する傾向が見られる。し
たがって、ProReachは、URLをUNCACHEABLE(キャッシュ
不可)としてラベル付ける動作を識別しようとする。
【0425】キャッシュサブシステムのクライアント
は、キャッシュを集中的に占有しようとするかもしれな
い。典型的に、これは、文書の一部の集合を自動検出
(スパイダリング)し、それらの文書に対応したユニフ
ォーム・リソース・ロケータをコンテンツ認識エンジン
に通すことによって行われる。このようなスパイダリン
グは、1回だけ実行されることも、定期的に実行される
こともある。殆どのシステムでは、略全部の文書がキャ
ッシュサブシステムにエントリーを持つことが完全に可
能である。これによって、計算コストが減少し、実行時
の分類の遅延が減少する。
【0426】VII.グローバルサービス ProReachサービスは、グローバルサービスサーバー11
2を介してグローバルサービスの組を提供する。グロー
バルサービスは、全ProReachシステム100及びProRea
ch使用可能ウェブクライアント108が利用可能なサー
ビスの集中された組として、インターネットを経由して
動かされるという意味でグローバル(大域的)である。
このようなグローバルサービスの一つの機能は、ウェブ
ビジターを識別するため使用されるグローバル識別子の
割り振りであるが、具ルーバルサービスはその他にも多
数の機能を提供する。
【0427】たとえば、以下の6種類のグローバルサー
ビスがある。 ・グローバル識別子サービス ・グローバルアップロードサービス ・グローバルクライアントマネージメントサービス ・イエローページサービス ・グローバル交換手段(エクスチェンジポリシー)サー
ビス ・グローバル集計サービス A.グローバル識別子(GID)サービス ProReachにおいて、ウェブクライアントをできる限り正
確に認識することは常に目標である。このため、多数の
最新技術がウェブクライアントを識別するためグローバ
ル識別子サービス602によって使用される。第一に、
各ウェブビジター(又はウェブクライアント)は、12
8ビット値のような固有の識別子によって表現される。
【0428】殆どの場合に、ウェブビジターは個人とし
て識別されない。その代わりに、ウェブビジターがウェ
ブブラウザを使用している機器を識別するだけである。
場合によっては、ウェブブラウザによって保持されるク
ッキーの検査によってウェブブラウザを識別することし
かできないので、機器をおおよそ識別するに過ぎない。
1台のコンピュータが一つのウェブブラウザだけを使用
する場合、コンピュータとウェブブラウザの間の1対1
の対応関係によって、より正確な識別情報を得ることが
できる。しかし、1台の機器のユーザは、多数(N種
類)のウェブブラウザを備える場合があるので、その場
合、N人の別々のウェブビジターとして取り扱われる。
また、多数の人が同じウェブブラウザを使用する場合も
ある。この場合、同じウェブブラウザを使用中の異なる
個人を検出することができず、同じブラウザを使用中の
個人の集合が一人のウェブビジターとして扱われる。
【0429】それ以外の場合、ウェブビジターは個別に
識別され得る。これらの違いに注意して、2種類の12
8ビット識別子が使用される。
【0430】GID:グローバルIDは、クッキー内でこのG
IDをもつクッキーを使用するコンピュータを識別する。
【0431】PID:個人IDは、ログイン名及び他の人口
統計学的データに基づいて個々のウェブビジターを識別
する。
【0432】上記のGID及びPIDは、共に128ビットで
ある。これら2種類の識別子を区別するため、GIDの第
1ビットは常にゼロに設定され、PIDの第1ビットは常
に1に設定される。したがって、GIDとPIDは相互に容易
に区別される。
【0433】グローバル識別子サービス602は、GID
及びPIDの割り振り、若しくは、計算の際に重要な役割
を果たす。グローバルサービスサーバー112のこの局
面での「クライアント」は、他のウェブサーバー、特
に、ProReach使用可能ウェブサーバー102である。こ
れらのProReach使用可能ウェブサーバー102は、ウェ
ブビジターを識別するため、すなわち、コンピュータの
場合にはGIDを、人の場合にはPIDを識別するため、グロ
ーバル識別子サーバー602の補助を必要とする。識別
情報を要求するProReach使用可能ウェブサーバー102
は、識別子要求元と呼ばれる。これらの識別子要求元
は、グローバル識別子サービス612に識別情報要求を
行う。各識別情報要求は、2種類の要求のいずれか一方
である。2種類の要求とは、匿名識別情報要求と、個人
識別情報要求である。それぞれの要求は以下のように取
り扱われる。
【0434】1.GID要求 ウェブクライアント106を識別するためGIDを要求す
るProReach使用可能ウェブサーバー102は、グローバ
ル識別子サーバー612に要求を出す。使用されるプロ
トコルは、ウェブサーバーとして動作するグローバル識
別子サーバー612がProReachクッキーへのアクセス権
を獲得できるようにHTTPベースである。この要求のプロ
セスフローは図7乃至9を参照して既に説明した。
【0435】HTTPプロトコルはウェブサーバーがそのウ
ェブサーバー専用のクッキーを調べることだけを許可す
るので、ProReach使用可能ウェブサーバー102は、こ
のProReachクッキーを直接には検査できない。ProReach
使用可能ウェブサーバー102はProReachドメインに属
するのではなく、固有のドメインに属するので、ウェブ
サーバー102はProReachクッキーにアクセスできな
い。そのため、ProReach使用可能ウェブサーバーは、
(もしあれば)ProReachクッキーに格納されたGIDへの
アクセス権を取得するため、ProReachドメインで動くグ
ローバルサーバーに依存する。
【0436】ウェブクライアント106がProReach使用
可能ウェブサーバーと交信するとき、ProReach使用可能
ウェブサーバーは、ウェブクライアント106をグロー
バルサービスサーバー112に切り換えるため、HTTPプ
ロトコルを使用する。しかし、グローバルサービスサー
バー112は、ウェブクライアント106を元のウェブ
サーバー102に切り換えることができなければならな
い。これは、コールバック情報を含むURLを用いてウェ
ブクライアントをグローバルサービスサーバー112に
切り換えるウェブサーバー102によって行われる。特
に、URLはウェブサーバー102のドメインと、その他
のデータとを含む。
【0437】URL符号化要求の厳密なフォーマットは、
おおよそ以下のようなフォーマットである。
【0438】http://www.ProReach.com/servlet/getGid
?webserver=www.webserver.com/index.html ここで、www.webserver.comは、要求側ウェブサーバー
102のドメインを識別する。
【0439】ウェブクライアント106は、転送(切り
換え)要求の一部としてURLを受信する。ウェブクライ
アントは、自動的にこのURLに進み、ProReachクッキー
を伝達する。グローバル識別子サーバー602は、この
要求を受け、ウェブサーバーの要求識別子及びの名称を
抽出する。グローバル識別子サーバー602はProReach
クッキーを調べる。ウェブサーバーが存在する場合、グ
ローバル識別子サーバー602はそのGIDを取得する。
ウェブサーバーが存在しない場合、グローバル識別子サ
ーバー602はGIDを生成し、そのGIDが埋め込まれたPr
oReachクッキーを作成する。このGIDはシステム全体を
通じて唯一(ユニーク)であることが保証される。GID
を含むクッキーは、ウェブクライアントに保存され、次
の機会までウェブクライアントに置かれる。また、クラ
イアントは、このクッキーを承認しているとは想定でき
ないので、クッキーは承認された場合に限り視覚化され
る。このことは、そのクッキーが承認されたかどうかを
判定するための検査を十分に保証するために重要であ
る。
【0440】次に、ProReachウェブサーバーは、元の
「クライアント」ウェブサーバーへのウェブ切り換えを
行う。したがって、このスキームを巧く動作させるため
に2回のウェブ切り換えが行われる。2番目のウェブ切
り換えは、第1のウェブ切り換えと逆向きに行われ、こ
のとき、ウェブクライアントが転送されるURLには、獲
得されたGIDが収容される。
【0441】128ビットのGIDが8進数表記で、12345
6787012345677と表される場合に、ProReach使用可能サ
ーバー102に対し得られるメッセージは次のような形
で表される。
【0442】http://www.webserver.com/index.html?gi
d=123456787012345677 情報をエンコーディングするため使用されたこのフォー
マットは一例に過ぎない。元のウェブサーバー102
は、このメタデータを受け取り、入力した要求をGIDと
関連付け、次に、このGIDを使用する何らかのHTTPセッ
ションに関連付ける。
【0443】グローバル識別子サーバー612は、GIDH
IDテーブルと呼ばれる別のテーブルを保持する。このテ
ーブルには、HID列とGID列の2列が含まれる。HIDは、P
roReachシステム100を一つずつ識別する識別子であ
り、特に、ハブIDが用いられる。その例は以下の通りで
ある。
【0444】
【表7】 ProReachがGIDをProReachシステム100に返すとき、
このテーブルの行には、要求側ProReachシステムのHID
と返却されたGIDが確実に収容される。この行が既に存
在する場合には、変更する必要はない。行が存在しない
場合(たとえば、新しく作成されたGIDの場合、或い
は、サーバー102への新しいウェブクライアントのGI
Dの場合)、行が挿入される。これは、多対多の関係で
あることに注意する必要がある。各HIDは、多数のGIDと
関連付けられ得る。各GIDは多数のHIDと関連付けられ得
る。たとえば、GID 023231787012345677は、二つのハ
ブ391と421に関連付けられる。すなわち、このウ
ェブクライアント106は両方のハブを訪れたときに使
用されたことを意味する。
【0445】このGIDHIDテーブルを使用することによ
り、ウェブビジターが訪れたハブはどのハブであるかを
計算することができるSQLのような問合わせが簡単に作
成される。また、一つののハブを訪れたウェブビジター
を計算することも容易である。さらに、二つの異なるハ
ブを訪れたウェブビジターが簡単に計算される。
【0446】2.PIDを用いた個人識別 個人を一人ずつ個別に識別することは困難な場合が多
い。たとえば、二人の別々の人が、同一名と同じ誕生日
をもつことがある。逆に、職業に携わるときには旧姓を
名乗り、それ以外の場合には結婚後の苗字を使用する人
は、同じ人であるにもかかわらず二つの名前を持つ。し
たがって、二人のウェブビジターが実際に同一人物であ
るかどうかを判定するため、二人のウェブビジターの人
口統計学的データを比較し、比較ルールの組を用いるこ
とによって、この人口統計学的データが同一人物を表す
かどうかを判定する。この結論は、人口統計学的データ
と比較ルールの質及び量の両方に依存した判断である。
【0447】個人の人口統計学的データを(特定人物
の)一件書類と呼ぶ。一件書類中の実際のデータは変化
し得るが、典型的に、名前、生年月日、性別、現住国、
出身国などの標準的な人口統計学的データのような属性
を含む。一件書類は、主要な電子メールアドレス、公開
された全電子メールアドレス、職場電話番号、自宅電話
番号、携帯電話番号、友人関係、出身校、配偶者名、教
育レベル、宗教、職業、趣味、好きなスポーツ、好きな
音楽、好きな本、好みのウェブサイト、好みのウェブペ
ージ等を含む。一件書類に格納されるべきあらゆる属性
を予測することは困難であるため、一件書類は、単にハ
ッシュテーブルとして実現されるので、属性名はキーと
して使用され、属性値はキーに基づいてハッシュテーブ
ルに記憶される。
【0448】PIDを用いて個人を識別する要求は、個人
識別要求を呼ばれる。個人識別要求は、PIDと関連付け
られた一件書類から選択された人口統計学的情報の一部
の集合(たとえば、名前、生年月日、性別及び職業)を
含む。かくして、PID毎に、ProReachシステムは一件書
類テーブルに一件書類を保持する。一件書類テーブルの
一例は以下の通りである。
【0449】
【表8】 上記表の列の項目は例示に過ぎない。たとえば、以下の
テーブル定義は、同一人物が多数の電子メールアドレス
又は物理的アドレスをもつ可能性を考慮していないが、
これは、各PIDに多数の電子メールアドレス用フィール
ドを設けることによって容易に実現される。同様に、そ
の他の人口統計学的属性のための付加フィールドを簡単
に設けることができる。
【0450】一件書類テーブルを使用することにより、
グローバル識別子サービス612は、このようなウェブ
ビジター一件書類のデータベースを保持する。テーブル
の各行は、特定のウェブビジターの一件書類を表す。
【0451】ビジターがウェブサーバー103をビジッ
トしたとき、サーバーは、ユーザが以前に訪れたことが
あるかどうかを判定する。典型的に、これは、ウェブビ
ジターからの名前及びパスワードを要求することによっ
て行われる。名前及びパスワードを使用することによ
り、同じ名前と同じパスワードをもつユーザが登録され
ているかどうかが検査される。このようなユーザが登録
されている場合、このユーザのPIDは既に取得済みであ
る。このPIDは以下の方法によって取得される。
【0452】登録プロセス中に、登録中のユーザから人
口統計学的データが収集される。典型的に、データの収
集は、ユーザにウェブベースのフォーム上でこの情報を
含むフォームを書き込ませることによって行われる。登
録ユーザに関する人口統計学的データは一件書類を作成
するため使用される。
【0453】ウェブサイトに登録されるユーザの一件書
類は、グローバル識別子サービスに発送され、そこで、
この一件書類は、一件書類テーブル内の他の全ての一件
書類と照合される。一件書類が既存の一件書類と一致し
ているかどうかを判定するため使用される実際の照合ル
ールは、システム管理者によって指定され、たとえば、
二つの一件書類が同一人物を表すかどうかを判定するル
ールを含むエキスパートシステムに実現される。一致す
る一件書類が見つけられたとき、一件書類と関連したPI
Dは、この新しく登録されたユーザのPIDであり、PIDが
ウェブサーバー102に返される。
【0454】一致している一件書類が見つからなかった
場合、ビジター一件書類がこのウェブクライアントのた
め作成される。このビジター一件書類は、PIDと、名前
と、電子メールアドレスと、その他の利用可能なメタデ
ータとを含む。一件書類は、次に、ビジター一件書類の
一件書類テーブルに付け加えられる。新しいPIDは、識
別要求の結果として、ProReach使用可能ウェブサーバー
102に返される。
【0455】一件書類が一致したとき、(識別要求中
の)新しい一件書類は、既存の一件書類には存在しない
情報を含む、このとき、新しい情報は、既存の一件書類
に追加され、将来一致する可能性が高くなる。
【0456】他の実施例は、PIDをウェブサーバーに返
却しない。その代わりに、RIDと称される固有のユニー
ク識別子がウェブサーバーに返される。RIDは整数又は
その他の文字列でもよい。一体的に、ウェブサーバーの
HID(ハブ識別子)とRIDは、グローバルサービスサーバ
ー上でPIDを個別に識別する複合キーを形成する。これ
らのキーは、グローバルサービスサーバーに保持された
HIDRIDテーブルに格納される。HID及びPIDは、RIDをユ
ニークに識別することに注意する必要がある。
【0457】PID要求が満たされるとき、ユニークなPID
及びRIDは、ProReach使用可能サーバーに返される。こ
れは以下の通り行われる。計算されたPIDと、要求側ハ
ブのHIDは、HIDRIDテーブルからRIDを選択するため使用
される。テーブル内にこのようなPIDとHIDの組合せが存
在しない場合、ユニークなRID値がその組合せに対して
生成され、テーブルに格納される。RIDは、HIDの列とRI
Dの列が複合キーを形成するという意味でユニークに決
めなければならない。最後に、選択された(若しくは、
動的に生成された)RIDがPID要求の結果として返され
る。以下の例示的なHIDRIDテーブルはこの関係を表して
いる。
【0458】
【表9】 このアプローチの利点は、RIDとPIDの間に間接的なレベ
ルが存在することである。この間接的なレベルが存在す
ることにより、一件書類照合の間違いを訂正することが
できる。たとえば、PID 0232310000345677と765231789
345644が実際に同一人物を表現することが判明した場合
を考える。このエラーは、関連したHID-PIDが同じPIDを
もつように、一方のPIDを他方のPIDで置換すべくHIDRID
テーブルを調整することにより修正される。たとえば、
第2行のPIDの欄は、以下のように値0232310000345677
をとるように更新される。
【0459】
【表10】 この変更は、RIDが343242であるハブ184のウェブビジタ
ーが、RID444343をとるハブ100のウェブビジターと比較
されるとき、両者が同一人物と知て識別されることを保
証する。
【0460】グローバル識別子サービスは、このような
HID/RIDの2個のペアを受け取り、それらがHIDRIDテー
ブル内の同じPIDと関連している場合に「真」を返すサ
ービスを提供する。それ以外の場合、このサービスは
「偽」を返す。
【0461】この間接的なレベルは、二人の実際には別
人のウェブビジターが一件書類照合によって、間違って
同一人物であると判定された場合に、一件書類の照合誤
りを修正するためにも使用される。上記の例と同様に、
この間違いは、HID/RIDテーブル内で修正される。同一P
IDをもつ2行以上の行は、それらのPID欄が別個になる
ように変更される。さらに、新しいPIDに対する新しい
一件書類が一件書類テーブルに作成される。
【0462】B.グローバルアップロードサービス グローバルアップロードサービス606は、ProReach使
用可能ウェブサイト108にそのウェブ行動をアップロ
ードさせる。受信データに応じて、このサービスは、ア
ップロードが成功したときに、承認情報をProReachクラ
イアント108に送信する。
【0463】さらに、グローバルアップロードサービス
606は、このデータを適当なProReachシステム100
に配信する責任がある。グローバルアップロードサービ
スは、ProReachシステム100がウェブビジターデータ
に加入することを許可する。グローバルアップロードサ
ービスは、ProReachシステムがウェブビジターデータへ
の加入を停止することも許可する。各システム100
は、特定のウェブビジターのアップロードされたデータ
に加入することが可能である。そのため、サーバー60
6は、GIDのリストをシステム100に送り、システム
は加入したいビジターのGIDを返す。
【0464】ウェブクライアントがグローバルアップロ
ードサービスを使用して自分のウェブ行動をアップロー
ドするとき、グローバルアップロードサービスは、この
ビジターデータに加入しているシステム100を見つけ
る。サービスは、加入者ProReachシステム100に、そ
のシステムが待望しているデータが到着した旨を通知す
る。この通知は、各加入者ProReachシステム100の受
信クライアントデータサービスに送信される。ProReach
システムに待機中データの到着が通知されると、通知さ
れた各ProReachシステム100は、適当な時間的区間内
(たとえば、24乃至72時間)にそのデータを取得す
る。そのデータが獲得されなかった場合には、削除され
る。
【0465】アップロードされたデータの配信を管理す
るため、グローバルアップロードサービス606は、ア
ップロードされたデータを含むパッケージと、受取人リ
ストを作成する。このリストは、加入者であるProReach
システム100をHIDによって識別し、タイムスタンプ
を含む。データは現在時刻がタイムスタンプよりも進ん
でいるときに削除される。同時に、アップロードされた
データの期限が満了し、削除される。
【0466】さらに、加入者が現れて、アップロードさ
れたデータを取得したとき、その加入者は受取人リスト
から削除される。全ての加入者がリストから削除された
とき、データは全受取人に配付されているので、データ
は破棄される。勿論、受取人がデータを獲得できなかっ
たとしても、データの期限が過ぎると、データは破棄さ
れる。
【0467】C.グローバルクライアント管理サービス ProReachは、ウェブユーザの行動を監視するクライアン
ト側ソフトウェアを備えているウェブクライアントを追
跡する。定期的に、収集されたデータが上述のようにPr
oReachにアップロードされる。
【0468】この機能を実現するため、ユーザは自分の
コンピュータにインストールするためProReachクライア
ントソフトウェアをダウンロードすることができる。グ
ローバルマネージャサービス608は、クライアントソ
フトウェアをダウンロードした(GIDによって識別され
た)このようなクライアントコンピュータのリストを保
持する。ソフトウェアがインストールされたとき、クラ
イアント108は、クライアントのGIDと共に確認情報
をサービス608に送信する。確認情報が与えられたと
き、確認情報と共に与えられたGIDがGIDリストに保持さ
れる。インストレーション先から受信されたGIDと、一
件書類中の電子メールアドレスとを使用して、クライア
ント側追跡ソフトウェアをインストールしたウェブクラ
イアントと交信することが可能になる。
【0469】クライアント側追跡ソフトウェアがアンイ
ンストールされた場合、アンインストール先はアンイン
ストールメッセージを関連したGIDと共にサービスに送
信する。このGIDは、クライアント側追跡が許可されたG
IDリストから削除される。
【0470】D.イエローページ このサービス610は、ProReachシステム100のデー
タベースを保持する。各ProReachシステム100はイエ
ローページサービス610を用いて登録され、このデー
タベースに掲載される。データベースには、ProReachシ
ステム100ごとに以下の項目が格納される。 ・ProReachシステムの名称 ・ハブのIPアドレス及びポートと、サポートされるドメ
インのリスト ・システム管理者の電子メールアドレスを含むProReach
システムの連絡先情報は、ProReachシステムの責任者に
電子メールを送信するため収容される。 ・ProReachシステムを個々に識別するユニークProReach
システムID(たとえば、HID) ・リストが私設、保護、若しくは、公開のいずれである
かを示す情報。リストは、(ProReachグローバルサービ
ス以外の)他人が参照できない場合、私設リストであ
る。リストは、共通ProReachアライアンス800を共有
するProReachシステムだけによって参照される場合、保
護リストである。リストが公開リストであるとは、全て
のProReachシステム100による参照が許可されること
である。デフォルトは、私設リストである。 ・ProReachシステムがメンバーとして所属するアライア
ンス800のリスト ProReachシステム100は、自分自身のエントリーを追
加、削除、若しくは、更新することができる。ProReach
システム100は、公開リストのエントリーと、私設リ
ストであって同じアライアンス内に含まれるリストのエ
ントリーとを参照することができる。
【0471】サービス610は、エントリーを追加、削
除、更新する機能と、エントリーを公開エントリー、私
設エントリー、若しくは、保護エントリーに変更する機
能とを有する。このサービスは、さらに、システム10
0がアライアンスに加入、若しくは、退会することを許
可する。サービスは、さらに、企業名、ドメイン、若し
くは、アライアンスによる参照機能を提供する。最後
に、サービス610は、アライアンスを作成し、全アラ
イアンスのリストを作成し、アライアンスのメンバーの
リストを作成する機能がある。
【0472】E.グローバル交換手段(エクスチェンジ
ポリシー) 各ProReachシステム100は、交換手段を決定すること
ができる。交換手段は、二つの関連した別々の目的に利
用される。第一に、交換ポリシーは、人口統計学的ステ
ートメントを記述する。人口統計学的ステートメント
は、どのような種類のビジターがProReachシステムを訪
問したか、すなわち、ビジターの数、関心の種類、ビジ
ットの頻度、ウェブビジターの種類などを説明する。こ
の人口統計学的ステートメント中の情報は、ステートメ
ントを作成する個々のProReachシステムの責務である。
人口統計学的ステートメントは、このProReachシステム
を評価するための手段として他のシステムによって使用
される。このような評価は、一つのProReachシステムが
他のProReachシステムとの共有関係を検討する場合に行
われる。第二に、交換手段は、匿名ユーザグループと、
カテゴリーコンプレックスと、ユーザプロフィールの取
引を可能にする。この手段は、取引で利用できるよう
に、一つ以上の特定ユーザと、ユーザグループと、コン
プレックスを識別することができる。プロフィール及び
コンプレックスは、受取人が個別ユーザを私的に識別す
るため使用できる情報を含まないので、この情報は匿名
である。このような情報の集まりは情報リソースに記述
され、情報リソースは他のシステムがリソースを識別す
る探索を用意に行えるようにキーワードと関連付けられ
る。情報リソースは、取引されない情報(たとえば、プ
ロフィール、カテゴリー、グループ、又は、コンプレッ
クス)を記述する一つ以上の例外を含むことができる。
【0473】たとえば、ProReach使用可能なwww.acme.c
omは、SportsCustomerリソースをもち、別のProReachシ
ステム使用可能なwww.womensclothig.comは、WomensClo
thingリソースをもつ。これらの二つのProReachシステ
ムは、双方のグループのプロフィールデータが、1回だ
け、若しくは、定期的に互いに送信されるような交換に
同意する場合がある。このような交換手段のデータは、
これらのProReachシステムが互いに相手を見つけて、何
らかの取引を行うプロセスを簡単化する。このデータの
伝送は、好ましくは、顧客連絡先情報を含まないので、
ウェブビジターの匿名性は、システム全体を通じて確保
される。しかし、たとえ、この制約がある場合でも、各
ProReachシステムのプロフィール情報のデータベースは
増加するので、情報は依然として有用である。
【0474】たとえば、この交換を通じて、www.acme.c
omがGID9834232122に関連したウェブビジターのプロフ
ィール情報を獲得した場合を考える。また、www.acme.c
omには、GID9834232122に関連したウェブビジターが訪
れたことがないとする。そして、GID9834232122に関連
したウェブビジターがこのサイトをビジットしたとす
る。このウェブビジターGID9834232122は、www.acme.co
mをはじめて訪れたとしても、ProReach使用可能ウェブ
サイトは、このウェブビジターに関する情報を既に保有
している。このウェブサイトは、この情報をwww.womens
clothing.comから取得している。
【0475】交換手段は、ジャストインタイム方式の共
有手段を指定することができる。ジャストインタイム方
式の共有手段は、特定GIDに対するプロフィール情報が
要求され得ることを意味する。このような明示的な要求
は有用である。なぜならば、新しいビジターがProReach
使用可能ウェブサイトを訪問したとき、ウェブサイトは
ウェブビジターを歓迎し、バックグラウンドで、このGI
Dに関連したプロフィール情報を要求し、交換相手から
の情報を調べることができるからである。
【0476】したがって、グローバル交換手段サービス
612は、ProReachシステムが、交換手段を作成、削
除、及び、変更できるようにする。作成の中には、シス
テム100が取引を望む情報リソースの定義が含まれ
る。このサービスは、さらに、交換手段のための情報リ
ソースを作成、削除、及び、変更するメソッドを与え
る。サーバー612は、リストに掲載された交換手段の
データベースを保持し、キーワード、カテゴリー、ユー
ザグループ、若しくは、ユーザGIDによるデータベース
の検索を可能にする。
【0477】グローバルプロフィールは、個別のProRea
chシステムで保持されるのと全く同様に保持される。し
かし、ローカルなシステム専用プロフィールとは異な
り、グローバルプロフィールは、標準カテゴリーツリー
1400内のカテゴリーに関心のあるユーザだけを追跡
する。このデータベースは、非常に膨大であると予想さ
れるので、高性能かつ規模を変更することができるデー
タベースが望ましい。好ましい一実施例において、この
ようなデータベースを実現するためOracle8Iデータベー
スが使用されるので、Java処理は、実際のデータベース
サーバー内で実行され得る。
【0478】VIII.ProReachクライアント
側のウェブ使用データ収集 A.ウェブ行動監視 上述の通り、ある種のウェブクライアントは、ウェブ行
動を追跡するクライアント側ソフトウェアを搭載するこ
とによってProReach使用可能になる。このウェブ行動
は、ProReach使用可能ではなく、ウェブ行動を直接追跡
する能力のないウェブサーバー110上で生じたウェブ
行動に対してのみ記録されるべきである。
【0479】ウェブ行動は、ウェブイベントレコードに
記録され、グローバルアップロードサービスにアップロ
ードされる。一実施例において、この行動は、動作中に
ブラウザを監視することによって捕捉される。一つの方
法は、ブラウザが外部アプリケーションのためのAPIサ
ポートを有する場合に、ブラウザイベントを監視し、ブ
ラウザと通信するため、ブラウザAPIを使用することで
ある。別の考え得る方法は、ブラウザのウィンドウイベ
ントを監視するため、Windowsのフックのような低レベ
ルWindows API/サービスを使用することである。
【0480】Microsoft Internet Explorerブラウザを
監視するため、COMベースオブジェクトモデルを有するI
nternet Explorerに付属するブラウザ・ヘルパー・オブ
ジェクト(BHO)を使用するのが好適である。BHOは、ある
種の登録キーの下で登録されたCOMインプロセスサーバ
ーである。起動時に、Explorerは、そのキーを捜し、CL
SIDが格納されている全てのオブジェクトをロードす
る。BHOは、ブラウザのメインウィンドウに拘束され
る。ブラウザウィンドウの新しいインスタンスは、それ
ぞれ、専用のBHOが関連付けられる。BHOは、ブラウザウ
ィンドウが壊されたとき、アンロードされる。BHOは、E
xplorer OLE-COMイベントに関する通知を受信すること
ができる。ブラウザが始動させることができるイベント
の種類は全部で18種類である。DownloadComplete、Na
vigateComplete2、OnStatusBarなどのイベントを監視す
ることにより、BHOはブラウザウィンドウにロードされ
た文書を知ることができる。
【0481】Netscapeブラウザは、NCAPI(ネットスケ
ープクライアントAPI)と呼ばれるAPIを提供する。NCAP
Iは、二つの主要部をもつ。一方の主要部はOLEを使用
し、もう一方の主要部はDDEML(ダイナミック・データ
・エクスチェンジ・マネージメント・ライブラリ)を使
用する。ProReachクライアント側追跡への利点の一つは
DDEMLである。ExplorerにおけるBHOと同様に、アプリケ
ーションは、Netscapeブラウザと通信し、ある種のブラ
ウザ行動が発生したときに通知を受けるため、NCAPIのD
DEMLを使用することができる。BHOと異なる点は、NCAPI
のDDEMLプログラムが外部アプリケーションであり、ブ
ラウザウィンドウではなく、Netscapeプロセスに固定さ
れることである。NCAPI DDEMLプログラムの一例は、Ne
tscapeブラウザプロセスに関連した全ブラウザウィドウ
内の全ウェブ行動を監視することができる。
【0482】B.ProReachクライアントウェブ
使用データのフィルタ及び集計 1.時間ベース統合 第一に、ウェブコンテンツ間のユーザの閲覧及び移動が
素早い場合、殆どのウェブイベントは記録しても意味が
ないと考えられる。第二に、多数のウェブクライアント
108は時間的に同期していないので、レコードに記録
された時刻はクライアント間で一致しない。この問題を
取り扱うため多様なメカニズムが設けられる。
【0483】a)ウェブイベントレコードタイムスタン
プの調整 各クライアント機器は異なるクロック設定値をもつ。そ
のため、ユーザのウェブ行動の時刻をクライアント機器
のクロックに基づいて記録しても意味がない。ProReach
クライアントソフトウェアは、グローバル基準時刻を用
いて各ユーザウェブ行動のタイムスタンプを調整する必
要がある。この調整は、ウェブイベントレコードがアッ
プロードされる前に行われる。
【0484】1)ProReachクライアントソフトウェア
は、最初に、ProReachグローバルアップロードソフトウ
ェアにサーバーのGMT基準時刻を問い合わせる。
【0485】2)ProReachクライアントソフトウェア
は、クライアント機器とProReachサーバーのGMT時刻の
差を計算する。この差はTDで表される。
【0486】3)ProReachクライアントソフトウェア
は、この差TDをタイムスタンプに加えることによりウェ
ブイベントレコードの各エントリーのタイムスタンプを
調整する。
【0487】b)短時間行動の無視 ウェブ行動が非常に短時間、たとえば、10秒未満しか
続かない場合、ProReachは、そのウェブ行動をウェブイ
ベントレコードに記録しない。この状況は、ユーザが以
前ビジットしたURLを探索するためブラウザの戻る(bac
k)/進む(forward)ボタンを使用している間、あるい
は、ユーザがリンクの中を通過するときに生じる。
【0488】c)ウェブ行動の集計 既に説明したように、多数回出現する同じウェブ行動は
集計される。この集計は、URLがProReachクライアント
ソフトウェアによって捕捉される途中で行われる。計算
のスピードを上げるため、ProReachクライアントソフト
ウェアは、WURを格納するためハッシュテーブルを使用
する。
【0489】2.他のデータのフィルタ 収集されるデータをさらに制限するため、クライアント
108は、ユーザのホームページへのアクセスについて
のレコードを除去し、記憶しない。しかし、ユーザのホ
ームページは、ユーザに関する付加的な人口統計学的情
報又は関心情報を与えるため、ユーザのプロフィールに
記憶される。
【0490】上述の通り、クライアント108がProRea
ch使用可能ウェブサーバー102をビジットするとき、
クライアント108はウェブイベントを捕捉しなくても
よい。したがって、クライアント108がウェブサーバ
ー102、又は、このようなサーバーによるサービスを
享受するドメインのURLを観察するとき、クライアント
はウェブ行動データを記憶しない。
【0491】3.プライバシー制御 ProReachクライアント108のユーザは、インフォーム
ド・コンセントに基づいてProReachクライアントソフト
ウェアの使用に同意する。ProReachシステムは、潜在的
なユーザがProReachクライアントソフトウェアのユーザ
になる前に、明示的なプライバシーステートメントを潜
在的なユーザに与えるので、ユーザは自分の行動が追
跡、記録されることがわかる。ProReachクライアントソ
フトウェアは、ユーザ変更可能制御メカニズムとデフォ
ルト制御メカニズムを含む。デフォルト制御メカニズム
は、全ユーザに適用され得る共通のプライバシー関連問
題の制御を扱う。これらのメカニズムは、ユーザが自分
の好みに応じて、記録されるウェブ行動データを選別で
きるようにする。
【0492】C.プライバシー設定値(ユーザ変更可
能)に基づくフィルタ ProReachクライアントソフトウェアは、構成可能なユー
ザプライバシー優先度と、ユーザプライバシー設定値に
基づく少なくとも2種類のフィルタ法、すなわち、URL
パターンベースフィルタ法及びキーワードベースフィル
タ法をサポートする。
【0493】1.URLパターンベースフィルタ ProReachクライアントソフトウェアは、ユーザが、記録
されることを望まず、かつ、ProReachシステム100と
共有されたくないURLのパターンを設定することを可能
にする。URLパターンは、完全なURL、URLのドメイン
部、あるいは、ワイルドカード文字を含むURLの一部の
いずれでもよい。URLパターンの例は、 1)完全URL:http://www.xyz.com/xyz/abc.html 2)部分URL:http://www.xyz.com 3)URLのドメイン部:http://www.xyz.com 4)ワイルドカードパターン:*xyz* である。
【0494】2.キーワードベースフィルタ ユーザは、プライバシー優先度設定値の一部としてキー
ワードのリストを指定することができる。ProReachクラ
イアントソフトウェアは、捕捉されたURLの内容をキー
ワードと照合し、一致するキーワードが存在する場合、
URLはウェブイベントレコードに記録されない。キーワ
ード照合には、一つの単語、多数の単語、及び、句(フ
レーズ)が含まれる。一実施例において、このプロセス
がユーザのコンピュータに与えるオーバーヘッドを少な
くするため、デフォルトとして、クライアント108
は、文書タイトルと、HTML”keyword”の<メタ>タグだ
けに対しキーワード照合を行う。あるいは、全文書内容
のキーワード照合は、ユーザ選択可能なオプションとし
て提供される。
【0495】一実施例において、ProReachクライアント
ソフトウェアは、そのユーザに標準キーワードテンプレ
ートを与える。各テンプレートは、ProReach標準カテゴ
リーツリーからの特定カテゴリーに基づく。ユーザは、
特定のテンプレートにより多数のキーワードを付加する
選択肢がある。また、テンプレートからのキーワードが
ウェブコンテンツのページと一致する場合、URLは記録
されない。
【0496】D.デフォルトプライバシー関連フィルタ ProReachクライアントソフトウェアは、ユーザのウェブ
行動データへのプライバシー関連アクセス権に関するデ
フォルト手段をサポートする。あるプライバシー関連行
動は、ユーザログインプロセスである。多数のウェブサ
イトは、簡単なHTMLフォームベースログインを使用し、
ユーザログイン情報はHTTPの”GET”要求によってCGIプ
ログラムに送られる。このような場合に、ユーザのログ
インデータは、URLに全て収容され、ProReachクライア
ントソフトウェアはこれらのデータを全て獲得すること
ができる。最も簡単なフォームの場合、ログインデータ
は、ユーザのウェブブラウザから送信される前に暗号化
さえなされていない。ProReachクライアントソフトウェ
アがこの種のURLを平等に取り扱い、全部をProReachシ
ステムに送信した場合、プライベート情報が不用意に漏
れてしまう。ProReachシステムの制御権を有する人は、
多数の人の非常にプライベートな情報、たとえば、銀行
口座、社会保険番号などにアクセスできることになる。
したがって、ProReachクライアントシステムは、URLに
含まれるログインデータを選別し、除去することをデフ
ォルト方針とする。たとえば、ユーザJoeがブラウザを
用いてXYZ銀行のオンラインサービスにログインしよう
としているとき、URLは、 http://www.XYZbank.com/login.cgi?login=joe&pwd=joe
xyz&set_cookie=xyz1234567abcdefg のように見える。
【0497】この場合、ProReachクライアントソフトウ
ェアは、URL内の“?”以降の部分文字列を除去し、あ
るいは、URL全体を完全に無視する。
【0498】E.ProReachクライアントデータ
アップロード 1.ProReachクライアントアップロードキュー ProReachクライアントソフトウェアはアップロードキュ
ーを保持する。クライアントコンピュータのオペレーテ
ィングシステムのファイルシステムがProReachクライア
ントアップロードキューを作成するため使用される。ア
ップロードキューの各項目はファイルである。ファイル
名は、固定部と可変部とを有する。ファイル名の可変部
は番号である。ProReachクライアントソフトウェアは、
このキュー番号のカウンタを保持する。たえとば、ファ
イル名は、ProReach1.WER、ProReach2.WER、ProReach3.
HOMなどである。"WER"は、アップロード項目がウェブイ
ベントレコードのリストであることを意味し、"HOM"
は、アップロード項目がユーザのブラウザのスターアッ
プページURLであることを意味する。キューが空である
とき、カウンタは0にリセットされる。アップロードキ
ューにはプリセットサイズがあり、キューはFIFO(先入
れ先出し)である。アップロードキューがフル(満杯状
態)になり、かつ、新しいデータをキューに入れる必要
がある場合、キューの最初の項目を破棄する必要があ
る。アップロードキューサイズは、十分なサイズ、たと
えば、500Kのサイズがあるので、データのアップロ
ードが行われる前に、データが破棄されることはない。
データは、アップロードが成功した後、あるいは、数回
の反復的なアップロードの試みの後に破棄される。
【0499】2.ProReachアップロードストリ
ーム及びアップロードレコード ProReachアップロードストリームは、アップロードセッ
ションにアップロードされたデータを表現する。1回の
アップロードでアップロードされたデータは、数個のア
ップロードレコードを有する。アップロードストリーム
はヘッダ部及びデータ部を有する。ヘッダは、アップロ
ードストリームの始まりを示し、ユーザのProReachグロ
ーバルIDと、そのアップロードストリームに収容された
アップロードレコード数を収容する。データ部は、1個
以上のアップロードレコードを収容する。アップロード
ストリーム中の各アップロードレコードは、アップロー
ドキュー内のアップロード項目に対応する。アップロー
ドレコードには、ウェブイベントレコードと、HOMレコ
ードの2種類のレコードが存在する。各アップロードレ
コードは、ヘッダ部とデータ部とを有する。ヘッダは、
アップロードレコードの始まりを示し、データは実際の
アップロードデータである。アップロードレコードのヘ
ッダは、ヘッダデバイダと、このレコードのアップロー
ドキュー項目の名称と、アップロードレコード番号と、
データ長(ヘッダ及びレコードデバイダを除く)と、デ
ータ部のレコード数とを収容する。アップロードストリ
ームとアップロードレコードの両方のヘッダは、固定長
である。ウェブイベントレコード、及び、HOMレコード
は、可変長である。ProReachクライアントソフトウェア
は、レコードデバイダとして、非印刷文字を使用する。
【0500】3.データアップロード a)ウェブイベントレコードアップロード ProReachクライアントソフトウェアは、予め構成された
時間的区間で捕捉されたウェブイベントをアップロード
しなければならない。この時間的区間は、予め決めら
れ、好ましくは、ProReachクライアントユーザによって
リセットできないようにされる。好ましい時間的区間
は、15乃至30分間隔である。
【0501】b)ホームページURLアップロード このアップロードは、頻繁にはスケジューリングされな
いタスクである。ユーザがスタートアップページを毎日
若しくは毎週変更する可能性は低い。ProReachクライア
ントソフトウェアは、始動されたときに、ユーザのブラ
ウザスタートアップページが変更されたかどうかを検査
する。スタートアップページが変更された場合、ProRea
chクライアントソフトウェアは"HOM"アップロードレコ
ードをアップロードキューに挿入する。ProReachクライ
アントソフトウェアは、スタートアップページが"http"
プロトコルを用いて指定されたウェブページである場合
に限り、この動作を実行するので、スタートアップペー
ジがローカルファイルである場合には、この動作は行わ
れない。
【0502】4.時間のアップロード及びアップロード
ステージ 次に、プレアップロード、アップロード及びポストアッ
プロードの3種類nステージにおけるデータアップロー
ドに関連したProReachクライアントソフトウェア動作に
ついて説明する。アップロードは、メモリ内のウェブイ
ベントレコードが空ではないとき,又は、アップロード
キューが空ではないときに限り必要とされる。アップロ
ードを行うため、以下の二つの条件がある。 1)ユーザがインターネットに接続され、メモリ内のウ
ェブイベントが空ではないか、若しくは、アップロード
キューが空ではないときに、予め設定されたプリセット
間隔で行われる。 2)新しいブラウザプロセスが始動され、アップロード
キューが空ではないときに行われる。
【0503】a)プレアップロードステージ ウェブイベントレコードをアップロードする前に、次の
動作を行う。 1)タイムスタンプの調整 2)メモリ内の現在ウェブイベントレコードをProReach
アップロードキューに追加。プリセットアップロード時
刻の他に、ProReachクライアントソフトウェアは、もし
存在するならばメモリ内のウェブイベントレコードをア
ップロードキューに追加する必要がある。
【0504】b)アップロードステージ ProReachクライアントソフトウェアは、常に、アップロ
ードキューからデータをアップロードする。ProReachク
ライアントソフトウェアは「アップロード閾値」を有す
る。これは、各アップロード中にアップロード可能なデ
ータの量を表す。ProReachクライアントソフトウェア初
期化時に、この閾値はクライアントコンピュータのモデ
ム速度に基づいて計算される。各アップロードタスク
は、5秒以上継続しないように制限されるのが望まし
い。たとえば、クライアントが14.4Kのモデムを使
用する場合、アップロード閾値は、(14.4K/8)
*5=9Kバイトのように計算される。各アップロード
時に、ProReachクライアントソフトウェアは、アップロ
ードキュー内の項目及び閾値までのアップロードデータ
のサイズを検査する。一例として、アップロードキュー
には、1Kの項目1と、6Kの項目2と、5Kの項目3
の併せて3項目が存在する。項目1及び項目2だけが現
在アップロードでアップロードされ、項目3は次のアッ
プロードに残される。アップロード項目がアップロード
閾値よりも大きい場合、ProReachクライアントソフトウ
ェアが実際のアップロードを実行する前に、より小さい
項目に分割される。ユーザが高速ネットワークコネクシ
ョンを使用する場合、閾値は大きくすることができる。
ユーザのネットワークコネクション速度は、初期化時
に、ProReachクライアントソフトウェアによって検出さ
れる。
【0505】c)ポストアップロードステージ アップロード後、ProReachクライアントソフトウェア
は、アップロードされたデータを破棄する前に、アップ
ロードされたデータに関するProReachグローバルアップ
ロードサービスからの承認を待つ必要がある。承認が無
い場合、アップロードキュー内の同じ項目は、承認が受
信されるまで繰り返しアップロードされる。アップロー
ドキューのサイズには制限があるので、承認無しに先に
アップロードされた項目は最終的に破棄される。しか
し、このような状況が発生する場合、通常、ネットワー
ク若しくはProReachグローバルアップロードサービスに
重大な問題が生じていることを意味する。
【0506】5.ProReachアップロードサービ
ス及びアップロード 前節で説明したように、ProReachクライアントソフトウ
ェアは、アップロードキュー内のアップロード項目を破
棄する前に、アップロードサービスからの承認を待機す
る必要がある。アップロードストリームのヘッダ内のPr
oReachグローバルIDは、アップロードストリームの発信
元と、アップロードされたデータに関係しているユーザ
が誰であるかについて、アップロードサービスに通知す
る。アップロードサービスは、全てのデータが正しく受
信されたことを保証するため、アップロードサービスヘ
ッダ及びアップロードレコードヘッダに収容された情報
を検査する。アップロードサービスは、アップロードス
トリームを正しく受信したことを知らせるため、承認レ
コードをProReachクライアントに送信する。承認レコー
ドは、ヘッダ及びデータを収容する。ヘッダは、承認情
報のデータ部に収容された名前の個数を表現する数を含
む。データ部は、受信されたアップロード項目の名前を
含む文字列であり、名前は","で区切られる。ProReach
クライアントソフトウェアは、承認レコードを受信した
後、承認レコードに含まれる名前と一致する名前を有す
るアップロードキュー項目を削除する。
【0507】このクライアントデータアップロードはHT
TPを用いて実現され得る。この場合、グローバルアップ
ロードサービスは、ウェブサーバー112に常駐する
か、あるいは、HTTPプロトコルを処理できる必要があ
り、ProReachクライアントソフトウェアはHTTPクライア
ント(エージェント)として実現される。ProReachアッ
プロードストリームは、HTTP POST要求として送信され
る。HTTP POST要求に対するアップロードサービスHTTP
サーバーの応答を待機するProReachクライアントのため
にタイムアウトが設定される。ProReachクライアントが
タイムアウト内に応答が得られないとき、アップロード
データストリームは後で再送される。
【0508】IX.コンテンツターゲッティング(コン
テンツの絞込み) ProReachの特徴の一つは、ウェブビジターに、絞り込ま
れたターゲットコンテンツを配信できることである。ウ
ェブサーバー上で動作し、このターゲットコンテンツを
配信するサービスは、現在のウェブビジターのプロフィ
ールにアクセスするメカニズム、又は、ウェブビジター
が選択した所定のページに関するカテゴリー情報にアク
セスするメカニズムを持つ必要がある。ProReachは、ビ
ジタープロフィール上のPreReachデータ及びページ分類
情報にアクセスするため、Java、"C"、又は、Perl用のA
PIを明らかにすることによって、このメカニズムを実現
する。
【0509】動的なウェブサーバープロセスが、CGI若
しくはフィルタ/モジュールから実行時にProReachデー
タにアクセスしなければならない二つの状況がある。
【0510】A.CGIによるプロフィールへのアクセ
ス 各ProReachサーバー102は、このProReachハブのネッ
トワーク内のサイトを訪れたことがあるビジター毎にビ
ジタープロフィールのデータベースを保持する。このデ
ータベースは、データベース720のプロフィールテー
ブルである。このデータベース720をJavaで実現した
一例では、ビジタープロフィールオブジェクトは、この
ウェブビジターの行動の分類情報を表す関心のベクトル
により構成される。このビジタープロフィールのJavaベ
ースのインスタンスは、このビジターに提示されるウェ
ブを定める際に利用されるウェブビジターの実際の名前
及び住所のような文字列型データにアクセスする数種類
のメソッドを含む。たとえば、ウェブビジターに対し、
そのウェブビジターが生活している領域には存在しない
自動車販売店の広告を提示しても意味が無い。
【0511】HTTPプロトコル転送機能及びクッキーを使
用してGIDでウェブビジターを個別に識別するプロセス
については既に説明した。ProReach使用可能システム1
00がターゲットコンテンツ配信を行う場合、ウェブビ
ジターのプロフィールを取得するため同様の方法を使用
することができる。図21には、典型的なProReach使用
可能ウェブサイトの構成が示されている。同図におい
て、プロファイラ726はProReachスポーク202にあ
る。ウェブサイトが、ウェブサイトのページを要求する
ユーザ毎にユーザプロファイルレコードを取得しようと
するとき、サイト側のフィルタは、ユーザプロファイル
レコードの情報を取得するため、その要求を再度スポー
ク上のウェブサーバー102に転送するよう構成され
る。図21には、ProReachバックオフィスウェブサーバ
ーに転送される要求のフローが示され、プロフィールレ
コードはGET変数としてURLに付加される。これは、実行
時にプロフィールデータを取得する簡単かつ最適に動作
する実現例である。
【0512】一部のウェブサイトは、Javaサーブレット
又はアプリケーションからのプロフィールデータにアク
セスしようとする。この場合、APIが設けられる。Java
APIへのアクセスの例は、 VisitorProfile joeUser = new VisitorProfile(ProReachGID); // constru ctor for visitor profile, takes GID as input For (int i = 0; i < joeUser.interestvec.length(); i++) /* Each profile contains a vector of interest names and integer valu es, called interestvec here. This loop will print out all of the intere st names and values for this web visitor */ system.out.println("interst" + joeUser.interestvec[i].get_name( ) + "score is" + joeUser.interestvec[i].get_value()); Int interest_value = joeUser.interstvec.get_value(int interest_indec ); // get the interest value given the index String inerest_name = joeUser.interestvec.get_name(int interest_inde x); // get interest name given index Identity joesData = new Identity(ProReachGID); // constructor for th e demographic portion of profile Identity joeUser.Identity; // getting identity out of the profile String firstname = joesDate.firstname; // getting first name from de mographic portion of profile String lastname = joesData.lastname; // getting last name from demog raphic portion of profile String email = joesData.email; // getting emai from demographic port ion of profile String address1 = joesData.address1; // getting address from demogra phic portion of profile String day_phome = joesData.day_phone; // getting phone from demogra phic portion of profile である。
【0513】1.CGIによるページメタデータへのア
クセス ProReachサーバーは、サイトのページ毎に分類情報のデ
ータベースを保持する。これは、ページメタデータ71
6と呼ばれる。ProReachスポーク上のプロフィールにア
クセスするためhttpプロトコルを使用する上述の方法
は、ページメタデータに効率的にアクセスるため使用さ
れ得る。実行時にページに関するメタデータを取得する
この解決法は、サイトのあらゆるURLと、その分類情報
との間に対応関係が存在する場合に限り、正しく機能す
る。この対応関係、すなわち、マッピングは、ページコ
ンテンツスパイダーによって作成される。これは、サー
ビスを始める前に、サイト上の全ウェブページを予め分
類するためウェブマスターによって使用されるツールで
ある。ページメタデータサービスは、ProReach使用可能
ウェブサーバーからのページ分類情報の要求に応じるた
めこのデータを使用することができる。
【0514】一部のウェブサイトは、ウェブサーバーに
入る全てのページ要求に対し一つのエントリーポイント
を有する。これは、IISフィルタ、若しくは、アパッチ
(Apache)モジュールと同様であり、サーブレットでも構
わない。このようなアーキテクチャーがProReach顧客の
ウェブサイトに予め存在する場合、或いは、ProReach使
用可能ウェブサイト上に実現可能である場合、ProReach
使用可能ウェブサイトのページメタデータへのアクセス
を最適化するために有利である。ウェブ開発計者は、最
初にマッピング全体をメインメモリに読み込み、実行時
に最速な方法でページのメタデータにアクセスするた
め、メインメモリからこの構造への索引付けを行うフィ
ルタ、モジュール、若しくは、サーブレットを設計す
る。
【0515】Java言語の場合、ページインデックスオブ
ジェクトがハッシュオブジェクトから抽出される。ペー
ジインデックスオブジェクトは、索引付けを行うため使
用される有効なURLオブジェクト毎にカテゴリースコア
のベクトルオブジェクトを返す。これは、 PageIndex pageIndex = New LoadPageIndex(String SiteIdentifier); // c onstructor for page metadata object Vector Cat = pagIndex.get_value(Url); // retrieve the categorization for the page given the url Vector Cat = GetCatFromPageIndex(Integer Index); // retrieve the cat egorization of a page given its index のように表される。
【0516】次に、Javaと同じタスクを実行する統計的
手法を示す。この手法では、CGIは、単一のページに対
するカテゴリーベクトルを必要とするだけである。
【0517】 Vector Cat = GetCatFromUrl(URL url); // this is a static method call to get one categorization for one URL 統計的手法ではこのように表される。
【0518】a)実行時におけるマルチパートページの
動的コンテンツ分類の取り扱い 上記のサーバー側コンテンツターゲッティング及びペー
ジ分類の解決法は、サーバーから要求された各URLが予
め分類されていることを必要とする。別の実施例によれ
ば、多数のコンポーネント文書からページを構築し、合
成文書を形成するため使用できるあらゆる並べ替えを分
類できないか、或いは、分類しようとしないウェブサイ
ト開発者のための解決法が得られる。
【0519】この特徴を実現するため、getCategoryFro
mComponents(A, B, C, …)のような関数を定義する。こ
こで、A、B、Cは、ページのサブコンポーネントである
文書を表し、予め分類され、ページメタデータに格納さ
れている。PrReachサイトのシステム管理者は、各コン
ポーネントを分類する上記のProReach APIコールを行
うため、コンポーネントからページを編成するサイトCG
Iを設ける。これにより、実行時に上記の三つのコンポ
ーネントの分類情報から獲得された合成分類情報を決定
する能力が得られる。
【0520】
【発明の効果】本発明は、多数のウェブサイト、サーバ
ー及びドメインに亘ってウェブユーザの一貫した識別情
報を与え、ユーザのウェブ行動を記述するデータを監
視、捕捉し、ウェブ行動データを分類し、データをユー
ザ及びグループの時間的な関心を記述する時間依存型モ
デルに集計する、システム、方法並びに種々のソフトウ
ェア製品である。分類は、ウェブサイト毎に標準化又は
カスタム化されたカテゴリーツリーに関して行われる。
ユーザグループは、カテゴリー関心情報及び人口学的統
計のメンバーシップルールに基づいて定義される。個別
のユーザプロフィールは、ユーザグループメンバーシッ
プルールの充足度に基づいて自動的にユーザ毎に作成さ
れる。新しいデータが時間的にユーザに関して収集され
るとき、ユーザのウェブ行動から抽出されたカテゴリー
関心情報は、種々のカテゴリーに関するユーザの関心の
現在モデルを形成するため更新される。この情報は,グ
ループメンバーシップ及びユーザプロフィール情報を自
動的に更新するためにも使用される。多数のサイトに亘
るユーザの識別情報は、各ユーザを認識し、要求側ウェ
ブサーバーに大域的にユニークな識別子を与えるグロー
バルサービスによって生成され、要求側ウェブサーバー
はそのユーザの行動データを蓄積するためその識別子を
使用することができる。クライアント側のユーザ識別情
報は、グローバルサービスと通信を行わず、カテゴリー
に関する情報を処理しないウェブサーバー上のユーザ行
動データを追跡するため与えられる。ユーザプロフィー
ルは、アライアンスを形成するウェブサイトの間で共有
してもよい。ユーザ行動データは、所望の時間スケール
で関心の頑強なモデルを提供するため、ユーザ/ユーザ
グループ、分類情報、及び、時刻を含む種々の次元に沿
って集計される。
【0521】したがって、本発明によれば、マーケット
情報及び製品情報をユーザに有効に提示し、ウェブコン
テンツの動的なカスタマイズを行い、あるいは、ウェブ
コンテンツを販売目的に使用できるようになる。
【図面の簡単な説明】
【図1】ウェブイベントの特徴を示す図である。
【図2】ウェブイベントを集計し、ユーザプロフィール
を作成するプロセスにおけるデータフローである。
【図3】多数のProReachシステムの上位レベルシステム
アーキテクチャーの説明図である。
【図4】ProReachシステムのハブ及びスポークアーキテ
クチャーの説明図である。
【図5】ファイアウォールを用いて動作するProReachシ
ステムの一実施例の説明図である。
【図6】グローバルサービスサーバーの説明図である。
【図7】ProReachシステムの全体的な処理フローの説明
図である。
【図8】ProReachシステムの全体的な処理フローの説明
図である。
【図9】ProReachシステムの全体的な処理フローの説明
図である。
【図10】ProReachシステムの全体的な処理フローの説
明図である。
【図11】ProReachシステムの全体的な処理フローの説
明図である。
【図12】ProReachシステムの全体的な処理フローの説
明図である。
【図13】ProReachシステムのアライアンスの説明図で
ある。
【図14】ウェブイベントレコードを蓄積するため使用
される集計キューの説明図である。
【図15】集計サービスの特徴の説明図である。
【図16】パーサーの処理機能の説明図である。
【図17】カテゴリー関心曲線の概念説明図である。
【図18】集中カテゴリーツリーの根元部分の説明図で
ある。
【図19】標準カテゴリーツリーの更新プロセスの説明
図である。
【図20】コンテンツ認識エンジンの動作説明図であ
る。
【図21】ユーザプロフィールに基づくコンテンツのカ
スタマイズプロセスの説明図である。
【符号の説明】
102 ウェブサーバー 106 ウェブクライアント 701 ウェブページアクセス 702 ロガー 704 ProReachビジターログ 730 プロフィールサーブレット 731 ページカテゴリー取得サーブレット
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/60 504 G06F 17/60 504 (72)発明者 ステファン エフ ガウアー アメリカ合衆国,カリフォルニア 94536, フリモント,キャリッジ・サークル・コモ ン 37690番 (72)発明者 ハーミッド ベン−マレック アメリカ合衆国,カリフォルニア 94086, サニーヴェール,タマラック・レーン 888番,アパートメント71

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 オンライン情報システムのユーザをプロ
    ファイリングするシステムであって、 ウェブコンテンツ項目に関するユーザの要求を受信し、
    選択されたウェブコンテンツ項目に対し、上記ウェブコ
    ンテンツ項目を識別するコンテンツ識別情報と、ユーザ
    が上記ウェブコンテンツ項目と相互作用した時間の長さ
    を表す時間情報と、上記ウェブコンテンツ項目に関する
    複数のカテゴリーに対するカテゴリー関連性情報とを含
    むウェブイベントを記録するウェブサーバーと、 上記ウェブイベントを受信し、上記ウェブイベントを選
    択された時間的区間、選択されたユーザ、選択されたユ
    ーザグループ及び選択されたカテゴリーに関して集計さ
    れた情報に集計する集計サービスと、 少なくとも一つのカテゴリーにおけるユーザの関心に関
    して評価され得る定義可能なメンバーシップルールを個
    々に有する複数のユーザグループを定義するユーザグル
    ープサービスと、 各ユーザに対し、ユーザがメンバーとして属するユーザ
    グループを含むユーザプロフィールを決定するプロフィ
    ールサービスとを有するシステム。
  2. 【請求項2】 上記ウェブサーバーから遠隔した場所に
    設置され、上記ウェブサーバーから転送されたユーザの
    要求を受信し、上記転送された要求に応じてユーザを固
    有に識別するグローバル識別値を与えるグローバル識別
    サービスを更に有する請求項1記載のシステム。
  3. 【請求項3】 ユーザによって使用されるコンピュータ
    に搭載され、ウェブサーバーからのウェブコンテンツ要
    求の選択された項目に対し、上記ウェブサーバー自体で
    は記録されないウェブイベントを記憶するクライアント
    アプリケーションと、 上記ウェブサーバーから遠隔したアップロードサービス
    とを更に有し、 上記クライアントアプリケーションによって記録される
    各ウェブイベントは、ウェブコンテンツ項目を識別する
    情報及びユーザが上記ウェブコンテンツと相互作用した
    時間の長さを表す時間情報を含み、 上記クライアントアプリケーションは上記記録されたウ
    ェブイベントを上記グローバルアップロードサービスに
    定期的にアップロードし、 上記グローバルアップロードサービスは、ユーザ毎に、
    そのユーザに関するウェブイベントを受信するために加
    入する一つ以上のウェブサーバーを示す情報を保持し、
    ユーザの上記クライアントアプリケーションから上記ウ
    ェブイベントを受信し、ユーザの上記ウェブイベントに
    加入する上記ウェブサーバーに上記ウェブイベントを提
    供する、請求項1記載のシステム。
  4. 【請求項4】 上記ウェブコンテンツ項目を表すコンテ
    ンツ識別情報を上記ウェブサーバーから受信し、上記カ
    テゴリー関連性情報に応じて上記ウェブコンテンツ項目
    に関する複数のカテゴリーを与えるため接続されたコン
    テンツ認識エンジンを更に有する請求項1記載のシステ
    ム。
  5. 【請求項5】 上記コンテンツ認識エンジンは各カテゴ
    リーに対しカテゴリースコアを与える、請求項4記載の
    システム。
  6. 【請求項6】 上記集計サービスは、ウェブコンテンツ
    項目の上記カテゴリー関連性情報をユーザが上記ウェブ
    コンテンツと相互作用した上記時間の長さの関数として
    スケーリングするスケーリングプロセスを更に有する、
    請求項1記載のシステム。
  7. 【請求項7】 上記スケーリングプロセスは、各カテゴ
    リーの上記カテゴリー関連性情報を、カテゴリースコア
    と、ユーザが上記ウェブコンテンツ項目と相互作用した
    時間の長さと、スケーリングファクタと、全てのカテゴ
    リーに対し総時間でスケーリングされたカテゴリースコ
    アとの関数である重みに変換する、請求項6記載のシス
    テム。
  8. 【請求項8】 iが各カテゴリーを表す添え字、間隔i
    はユーザがウェブコンテンツ項目と相互作用した時間の
    長さ、定数はスケーリングファクタであるとき、 各カテゴリーiは、次式: 新スコアi=(カテゴリースコアi)×(間隔i)×定
    数 でスケーリングされたカテゴリースコアを受信し、各カ
    テゴリーは、以下の式で表される重み: 【数1】 を受信する請求項7記載のシステム。
  9. 【請求項9】 上記集計サービスは、ユーザ毎に、選択
    された時間的区間に発生したウェブイベントを単一の集
    計されたデータレコードに集計する定期的集計プロセス
    を更に有する、請求項1記載のシステム。
  10. 【請求項10】 上記集計サービスは、個々のユーザ毎
    に、かつ、時間的区間に発生するユーザの複数のウェブ
    イベントの中のウェブイベント毎に、複数のウェブイベ
    ントからカテゴリー関連性情報を収集し、上記時間的区
    間に各イベントに対しカテゴリー関連性情報の統計モデ
    ルを形成し、集計された時間的区間ユーザ結果を形成す
    るプロセスを更に有する、請求項1記載のシステム。
  11. 【請求項11】 カテゴリー毎に、カテゴリー関連性情
    報の統計モデルは、上記時間的区間の平均カテゴリー重
    みと、上記時間的区間のカテゴリー重さの標準偏差とを
    含む、請求項10記載のシステム。
  12. 【請求項12】 各カテゴリーの上記カテゴリー関連性
    情報は、カテゴリースコアと、ユーザがウェブコンテン
    ツ項目と相互作用した時間の長さと、スケーリングファ
    クタと、全カテゴリーに対し総時間でスケーリングされ
    たカテゴリースコアとの関数であるカテゴリー重さであ
    る、請求項11記載のシステム。
  13. 【請求項13】 上記統計モデルは、時間的区間の上記
    カテゴリー関連性情報の変化を記述する傾向情報を含
    む、請求項10記載のシステム。
  14. 【請求項14】 上記傾向情報は、上記カテゴリー関連
    性情報の変化を、増加傾向、減少傾向、一定傾向、又
    は、上記傾向の中の少なくとも二つの傾向の組み合わせ
    として記述する、請求項13記載のシステム。
  15. 【請求項15】 上記集計サービスは、 選択された時間的区間と、選択されたカテゴリー、選択
    されたユーザ、又は、選択されたユーザグループの中の
    少なくとも一つとを受信し、上記選択された時間的区間
    に生じた集計された時間的区間のユーザ結果から、少な
    くとも選択されたカテゴリー、選択されたユーザ、又
    は、選択されたユーザグループに対する上記選択された
    統計モデルを集計する集計プロセスを更に有する、請求
    項10記載のシステム。
  16. 【請求項16】 上記集計サービスは、 選択された時間的区間と、選択されたカテゴリーと、選
    択されたユーザとを受信し、上記選択された時間的区間
    におけるユーザの関心のユーザ・カテゴリー統計モデル
    を形成するため、上記選択された時間的区間に生じた集
    計された時間的区間のユーザ結果から、選択されたカテ
    ゴリー及び選択されたユーザに対する統計モデルを集計
    する集計プロセスを更に有する、請求項10記載のシス
    テム。
  17. 【請求項17】 上記集計プロセスは、選択された時間
    的区間及び選択されたユーザを更に受信し、上記選択さ
    れた時間的区間に全カテゴリーに関するユーザの関心の
    ユーザ統計モデルを形成するため、上記選択された時間
    的区間における上記選択されたユーザのユーザ・カテゴ
    リー統計モデルを集計する、請求項16記載のシステ
    ム。
  18. 【請求項18】 上記集計プロセスは、選択された時間
    的区間及び選択されたユーザグループを更に受信し、上
    記選択された時間的区間に全カテゴリーに関するユーザ
    グループの関心のユーザグループ統計モデルを形成する
    ため、上記選択された時間的区間における上記ユーザグ
    ループのメンバーである全ユーザのユーザ統計モデルを
    集計する、請求項17記載のシステム。
  19. 【請求項19】 上記集計プロセスは、選択された時間
    的区間及び選択されたユーザグループを更に受信し、上
    記選択された時間的区間に上記選択されたカテゴリーに
    関するユーザグループの関心のユーザグループ統計モデ
    ルを形成するため、上記選択された時間的区間における
    上記ユーザグループのメンバーである全ユーザのユーザ
    ・カテゴリー統計モデルを集計する、請求項16記載の
    システム。
  20. 【請求項20】 上記集計サービスは、 選択された時間的区間と、選択されたカテゴリーとを受
    信し、上記選択された時間的区間における上記カテゴリ
    ーに関する全ユーザの関心のカテゴリー統計モデルを形
    成するため、上記選択された時間的区間に生じた全ユー
    ザの集計された時間的区間のユーザ結果から、選択され
    たカテゴリー及び全ユーザに対する統計モデルを集計す
    る集計プロセスを更に有する、請求項10記載のシステ
    ム。
JP2000298045A 1999-09-30 2000-09-29 インターネット・プロファイリングシステム Withdrawn JP2001142907A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US410151 1999-09-30
US09/410,151 US6839680B1 (en) 1999-09-30 1999-09-30 Internet profiling

Publications (1)

Publication Number Publication Date
JP2001142907A true JP2001142907A (ja) 2001-05-25

Family

ID=23623448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000298045A Withdrawn JP2001142907A (ja) 1999-09-30 2000-09-29 インターネット・プロファイリングシステム

Country Status (2)

Country Link
US (1) US6839680B1 (ja)
JP (1) JP2001142907A (ja)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020096428A (ko) * 2001-06-19 2002-12-31 주식회사 케이티 웹 상에서 사용자 행위정보를 이용한 학습방법
JP2003015913A (ja) * 2001-06-29 2003-01-17 Sharp Corp 操作分析装置、操作分析方法、操作分析プログラムおよびコンピュータ読み取り可能な記録媒体
WO2003034301A1 (fr) * 2001-10-11 2003-04-24 Direktplanet Co., Ltd. Appareil de traitement de l'information, procede de traitement de l'information et programme
JP2007528058A (ja) * 2004-01-27 2007-10-04 エヌエイチエヌ コーポレーション 検索者の検索要請に応じて検索結果リストを生成して検索語広告を提供する方法および検索語広告提供システム
JP2007286951A (ja) * 2006-04-18 2007-11-01 Rakuten Inc 検索履歴保存システム
JP2007299275A (ja) * 2006-05-01 2007-11-15 Softbank Mobile Corp 中継サーバ
JP2009518701A (ja) * 2005-10-28 2009-05-07 オムニチャー, インク. ウェブサイト訪問データセット比較
KR20090052882A (ko) * 2006-08-18 2009-05-26 아카마이 테크놀로지스, 인크. 분산 네트워크에서의 데이터 수집 방법
JP2009531782A (ja) * 2006-03-29 2009-09-03 ヤフー! インコーポレイテッド 行動ターゲティングシステム
JP2011507063A (ja) * 2007-12-07 2011-03-03 アルカテル−ルーセント 選択された情報を情報源で見つけるためのセマンティック検索要求を自動的に実行するためのデバイスおよび方法
JP2011515767A (ja) * 2008-03-21 2011-05-19 アリババ グループ ホールディング リミテッド クロスドメインクッキーを使用したウェブアクセス
US8341102B2 (en) 2007-08-13 2012-12-25 Fujitsu Limited User state presumption system, user state presumption method, and recording media storing user state presumption program
JP2014139765A (ja) * 2013-01-21 2014-07-31 Richplay Information Co Ltd 電子情報の表示方法
JP2014522004A (ja) * 2011-03-08 2014-08-28 アリババ・グループ・ホールディング・リミテッド 決定されたプリファレンス値に基づく製品情報の送信
JP2014215955A (ja) * 2013-04-30 2014-11-17 Necパーソナルコンピュータ株式会社 情報処理装置、その制御方法、及びプログラム
US9189562B2 (en) 2008-09-30 2015-11-17 Kabushiki Kaisha Toshiba Apparatus, method and program product for classifying web browsing purposes
JP2018060241A (ja) * 2016-09-30 2018-04-12 富士通株式会社 関心度評価プログラム、対話プログラム、表示プログラム、装置、及び方法
JP2021508897A (ja) * 2017-12-22 2021-03-11 6センス インサイツ,インコーポレイテッド エンティティのアカウントへのマッピング
EP4150546A4 (en) * 2020-05-15 2023-10-18 Telefonaktiebolaget LM ERICSSON (PUBL) METHOD FOR FILTERING DATA TRAFFIC SENT TO A USER DEVICE

Families Citing this family (630)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU9377098A (en) 1997-09-05 1999-03-22 C Y Research, Inc. Portrayal of human information visualization
US8914507B2 (en) * 1998-09-01 2014-12-16 International Business Machines Corporation Advice provided for offering highly targeted advice without compromising individual privacy
US6263362B1 (en) * 1998-09-01 2001-07-17 Bigfix, Inc. Inspector for computed relevance messaging
US6256664B1 (en) * 1998-09-01 2001-07-03 Bigfix, Inc. Method and apparatus for computed relevance messaging
US7197534B2 (en) * 1998-09-01 2007-03-27 Big Fix, Inc. Method and apparatus for inspecting the properties of a computer
US7222293B1 (en) * 1999-08-12 2007-05-22 Applieoe, Inc. Professional time tracking and reporting system
EP1228461A4 (en) * 1999-09-22 2005-07-27 Oleg Kharisovich Zommers INTERACTIVE PERSONAL INFORMATION SYSTEM AND METHOD
US7610289B2 (en) * 2000-10-04 2009-10-27 Google Inc. System and method for monitoring and analyzing internet traffic
US6594691B1 (en) * 1999-10-28 2003-07-15 Surfnet Media Group, Inc. Method and system for adding function to a web page
IL133489A0 (en) 1999-12-13 2001-04-30 Almondnet Inc A descriptive-profile mercantile method
US6606659B1 (en) * 2000-01-28 2003-08-12 Websense, Inc. System and method for controlling access to internet sites
US7136860B2 (en) 2000-02-14 2006-11-14 Overture Services, Inc. System and method to determine the validity of an interaction on a network
US6771289B1 (en) * 2000-03-02 2004-08-03 Microsoft Corporation Cluster-based visualization of user traffic on an internet site
US7340464B2 (en) * 2000-03-10 2008-03-04 General Electric Company Method for automated web site maintenance via searching
GB0006159D0 (en) * 2000-03-14 2000-05-03 Ncr Int Inc Predicting future behaviour of an individual
WO2001072002A2 (en) * 2000-03-17 2001-09-27 America Online, Inc. Shared groups rostering system
US7260837B2 (en) * 2000-03-22 2007-08-21 Comscore Networks, Inc. Systems and methods for user identification, user demographic reporting and collecting usage data usage biometrics
US7493655B2 (en) * 2000-03-22 2009-02-17 Comscore Networks, Inc. Systems for and methods of placing user identification in the header of data packets usable in user demographic reporting and collecting usage data
US7930285B2 (en) * 2000-03-22 2011-04-19 Comscore, Inc. Systems for and methods of user demographic reporting usable for identifying users and collecting usage data
US7181412B1 (en) * 2000-03-22 2007-02-20 Comscore Networks Inc. Systems and methods for collecting consumer data
US7051073B1 (en) * 2000-04-03 2006-05-23 International Business Machines Corporation Method, system and program for efficiently distributing serial electronic publications
CA2303739C (en) * 2000-04-04 2009-06-30 Webhancer Corporation Method and system for managing performance of data transfers for a data access system
US7523114B2 (en) 2000-04-24 2009-04-21 Ebay Inc. Method and system for categorizing items in both actual and virtual categories
US6862610B2 (en) 2000-05-08 2005-03-01 Ideaflood, Inc. Method and apparatus for verifying the identity of individuals
US6901056B1 (en) * 2000-05-11 2005-05-31 Sun Microsystems, Inc. System and method for time multiplexing of multi-domain transactions
EP1316026A2 (en) * 2000-05-30 2003-06-04 Koki Uchiyama Distributed monitoring system providing knowledge services
US7996259B1 (en) 2000-06-07 2011-08-09 Perfect Web Technologies, Inc. Method for developing electronic documents providing e-commerce tools
US10878178B2 (en) 2000-06-07 2020-12-29 Pt 291, Llc Modifying web pages to be served by computer server system
CA2349914C (en) * 2000-06-09 2013-07-30 Invidi Technologies Corp. Advertising delivery method
US8037152B2 (en) * 2000-06-20 2011-10-11 At&T Intellectual Property Ii, L.P. Active requesting of information for psuedo-live performance
US8090791B1 (en) 2000-06-20 2012-01-03 At&T Intellectual Property Ii, L.P. Active requesting of information for pseudo-live performance
US7076445B1 (en) 2000-06-20 2006-07-11 Cartwright Shawn D System and methods for obtaining advantages and transacting the same in a computer gaming environment
GB2379779A (en) * 2000-06-21 2003-03-19 Only Company Pty Ltd Interactive on line marketing system and method therefor
US7152039B1 (en) * 2000-06-29 2006-12-19 Oracle International Corporation Methods and systems for customer lifecycle definition and categorization
US7139844B2 (en) 2000-08-04 2006-11-21 Goldman Sachs & Co. Method and system for processing financial data objects carried on broadcast data streams and delivering information to subscribing clients
US7958025B2 (en) 2000-08-04 2011-06-07 Goldman Sachs & Co. Method and system for processing raw financial data streams to produce and distribute structured and validated product offering objects
US7958251B2 (en) 2000-08-04 2011-06-07 Goldman Sachs & Co. Method and system for processing raw financial data streams to produce and distribute structured and validated product offering data to subscribing clients
US7054900B1 (en) * 2000-08-18 2006-05-30 Netzero, Inc. Automatic, profile-free web page recommendation
US7437312B2 (en) * 2000-08-23 2008-10-14 Bizrate.Com Method for context personalized web browsing
US7146416B1 (en) * 2000-09-01 2006-12-05 Yahoo! Inc. Web site activity monitoring system with tracking by categories and terms
US7266503B2 (en) * 2001-03-22 2007-09-04 International Business Machines Corporation System and method for generating a company group user profile
US7386495B2 (en) 2001-03-23 2008-06-10 International Business Machines Corporation System and method for processing tax codes by company group
US8027892B2 (en) 2001-03-28 2011-09-27 International Business Machines Corporation System and method for automating invoice processing with positive confirmation
US7155403B2 (en) 2001-03-22 2006-12-26 International Business Machines Corporation System and method for leveraging procurement across companies and company groups
US8868448B2 (en) 2000-10-26 2014-10-21 Liveperson, Inc. Systems and methods to facilitate selling of products and services
US9819561B2 (en) 2000-10-26 2017-11-14 Liveperson, Inc. System and methods for facilitating object assignments
US20060015390A1 (en) * 2000-10-26 2006-01-19 Vikas Rijsinghani System and method for identifying and approaching browsers most likely to transact business based upon real-time data mining
US7111057B1 (en) * 2000-10-31 2006-09-19 Akamai Technologies, Inc. Method and system for purging content from a content delivery network
CA2427678A1 (en) * 2000-11-02 2002-06-06 Netiq Corporation System and method for generating and reporting cookie values at a client node
US7313622B2 (en) * 2000-11-08 2007-12-25 [X+1] Solutions, Inc. Online system and method for dynamic segmentation and content presentation
US7024380B2 (en) * 2000-11-08 2006-04-04 Matsushita Electric Industrial Co., Ltd. E-commerce system and method
EP2631856A3 (en) 2000-11-10 2013-10-30 Affinnova, Inc. Method and apparatus for for dynamic, real-time market segmentation
US7370073B2 (en) * 2000-11-28 2008-05-06 Navic Systems, Inc. Using viewership profiles for targeted promotion deployment
US6832207B1 (en) 2000-11-28 2004-12-14 Almond Net, Inc. Super saturation method for information-media
US20020065920A1 (en) * 2000-11-30 2002-05-30 Siegel Brian M. Host site based internet traffic meter
US7343390B2 (en) * 2000-12-20 2008-03-11 Microsoft Corporation Systems and methods for conducting internet content usage experiments
US7085834B2 (en) * 2000-12-22 2006-08-01 Oracle International Corporation Determining a user's groups
US7937655B2 (en) * 2000-12-22 2011-05-03 Oracle International Corporation Workflows with associated processes
US7711818B2 (en) * 2000-12-22 2010-05-04 Oracle International Corporation Support for multiple data stores
US7475151B2 (en) * 2000-12-22 2009-01-06 Oracle International Corporation Policies for modifying group membership
US7581011B2 (en) * 2000-12-22 2009-08-25 Oracle International Corporation Template based workflow definition
US7802174B2 (en) * 2000-12-22 2010-09-21 Oracle International Corporation Domain based workflows
US8015600B2 (en) * 2000-12-22 2011-09-06 Oracle International Corporation Employing electronic certificate workflows
US7028033B2 (en) * 2001-01-02 2006-04-11 Hall Aluminum Llc Method and apparatus for simplified access to online services
US20030074253A1 (en) * 2001-01-30 2003-04-17 Scheuring Sylvia Tidwell System and method for matching consumers with products
US20020138331A1 (en) * 2001-02-05 2002-09-26 Hosea Devin F. Method and system for web page personalization
US20020107776A1 (en) * 2001-02-05 2002-08-08 Homestore.Com System and method for anonymous lead generation and management
US20020152402A1 (en) * 2001-02-07 2002-10-17 Tov Ofer Shem Personalized visitor pages
EP1231788A1 (en) * 2001-02-12 2002-08-14 Koninklijke Philips Electronics N.V. Arrangement for distributing content, profiling center, receiving device and method
US7243077B2 (en) 2001-03-02 2007-07-10 International Business Machines Corporation Method and computer program product for managing an internet trading network
US7216095B2 (en) * 2001-03-13 2007-05-08 Sony Corporation Method and system for distributing product information
CA2350735A1 (en) * 2001-03-14 2002-09-14 Ibm Canada Limited-Ibm Canada Limitee A method for providing open access to application profiling data
US7003565B2 (en) * 2001-04-03 2006-02-21 International Business Machines Corporation Clickstream data collection technique
GB2374688B (en) 2001-04-19 2004-12-29 Ibm A method and system for distributing software features to a computer
AUPR460001A0 (en) * 2001-04-24 2001-05-24 Canon Kabushiki Kaisha Functional planning system
US6782350B1 (en) * 2001-04-27 2004-08-24 Blazent, Inc. Method and apparatus for managing resources
US7058590B2 (en) * 2001-05-04 2006-06-06 Hewlett-Packard Development Company, L.P. System and method for generating conversion-related estimates utilizing adaptive sample size
US20030014336A1 (en) * 2001-05-04 2003-01-16 Fu-Tak Dao Analytically determining revenue of internet companies using internet metrics
JP4028187B2 (ja) * 2001-05-07 2007-12-26 本田技研工業株式会社 ユーザに適したウェブページを提供するコンピュータ・システム。
US7505936B2 (en) * 2001-05-11 2009-03-17 Accenture Global Services Gmbh Digital content subscription conditioning system
US7313621B2 (en) * 2001-05-15 2007-12-25 Sony Corporation Personalized interface with adaptive content presentation
US7945600B1 (en) 2001-05-18 2011-05-17 Stratify, Inc. Techniques for organizing data to support efficient review and analysis
US7308451B1 (en) * 2001-09-04 2007-12-11 Stratify, Inc. Method and system for guided cluster based processing on prototypes
US7469246B1 (en) 2001-05-18 2008-12-23 Stratify, Inc. Method and system for classifying or clustering one item into multiple categories
US7895123B1 (en) 2001-06-12 2011-02-22 Accenture Global Services Limited Digital content publication
US7120928B2 (en) * 2001-06-15 2006-10-10 Dinesh Sheth Secure selective sharing of account information on an internet information aggregation system
US20030005081A1 (en) * 2001-06-29 2003-01-02 Hunt Preston J. Method and apparatus for a passive network-based internet address caching system
US10497007B2 (en) * 2001-07-06 2019-12-03 Kantar Llc Method and system for conducting an on-line survey
US7249139B2 (en) 2001-07-13 2007-07-24 Accenture Global Services Gmbh Secure virtual marketplace for virtual objects and services
US7526439B2 (en) 2001-08-06 2009-04-28 Proficient Systems, Incorporated Systems and methods to facilitate selling of products and services
US7035944B2 (en) * 2001-09-19 2006-04-25 International Business Machines Corporation Programmatic management of software resources in a content framework environment
US7343428B2 (en) * 2001-09-19 2008-03-11 International Business Machines Corporation Dynamic, real-time integration of software resources through services of a content framework
EP1483739A2 (en) * 2001-09-27 2004-12-08 BRITISH TELECOMMUNICATIONS public limited company Method and apparatus for data analysis
WO2003034283A1 (en) * 2001-10-16 2003-04-24 Kimbrough Steven O Process and system for matching products and markets
US7587484B1 (en) * 2001-10-18 2009-09-08 Microsoft Corporation Method and system for tracking client software use
US7162522B2 (en) * 2001-11-02 2007-01-09 Xerox Corporation User profile classification by web usage analysis
US7194464B2 (en) 2001-12-07 2007-03-20 Websense, Inc. System and method for adapting an internet filter
US7506060B2 (en) * 2001-12-11 2009-03-17 Hewlett-Packard Development Company, L.P. Technique for reducing network bandwidth for delivery of dynamic and mixed content
US20030115318A1 (en) * 2001-12-13 2003-06-19 Microsoft Corporation. Concentric user-targeting delivery system and methods
US9967633B1 (en) 2001-12-14 2018-05-08 At&T Intellectual Property I, L.P. System and method for utilizing television viewing patterns
GB2383505B (en) * 2001-12-21 2004-03-31 Searchspace Ltd System and method for monitoring usage patterns
US20030128236A1 (en) * 2002-01-10 2003-07-10 Chen Meng Chang Method and system for a self-adaptive personal view agent
US7603469B2 (en) * 2002-01-15 2009-10-13 International Business Machines Corporation Provisioning aggregated services in a distributed computing environment
US8156216B1 (en) 2002-01-30 2012-04-10 Adobe Systems Incorporated Distributed data collection and aggregation
US20030144898A1 (en) * 2002-01-31 2003-07-31 Eric Bibelnieks System, method and computer program product for effective content management in a pull environment
US7185085B2 (en) * 2002-02-27 2007-02-27 Webtrends, Inc. On-line web traffic sampling
JP2003258911A (ja) * 2002-03-06 2003-09-12 Hitachi Ltd アクセスノード装置およびインターネット利用状況の分析方法
US10296919B2 (en) 2002-03-07 2019-05-21 Comscore, Inc. System and method of a click event data collection platform
US20070055937A1 (en) * 2005-08-10 2007-03-08 David Cancel Presentation of media segments
US8095589B2 (en) 2002-03-07 2012-01-10 Compete, Inc. Clickstream analysis methods and systems
US20080189408A1 (en) 2002-10-09 2008-08-07 David Cancel Presenting web site analytics
US9129032B2 (en) * 2002-03-07 2015-09-08 Compete, Inc. System and method for processing a clickstream in a parallel processing architecture
US9092788B2 (en) * 2002-03-07 2015-07-28 Compete, Inc. System and method of collecting and analyzing clickstream data
US20030212710A1 (en) * 2002-03-27 2003-11-13 Michael J. Guy System for tracking activity and delivery of advertising over a file network
AU2003216104A1 (en) * 2002-04-09 2003-10-27 Ecos Technologies, Inc. Task driven taxonomy and applications delivery platform
FR2838843B1 (fr) * 2002-04-23 2004-12-17 Cit Alcatel Dispositif d'adaptation dynamique de filtres de donnees
US6993534B2 (en) * 2002-05-08 2006-01-31 International Business Machines Corporation Data store for knowledge-based data mining system
US7840658B2 (en) * 2002-05-15 2010-11-23 Oracle International Corporation Employing job code attributes in provisioning
US7552205B2 (en) * 2002-05-21 2009-06-23 Accenture Global Services Gmbh Distributed transaction event matching
US20040098229A1 (en) * 2002-06-28 2004-05-20 Brett Error Efficient click-stream data collection
EP1540955A4 (en) 2002-07-09 2007-08-01 Kaleidescape Inc CONTENT AND LOCK DISTRIBUTION SYSTEM FOR MEDIA-STR ME REPRESENTING DIGITAL CONTENTS
US7747856B2 (en) * 2002-07-26 2010-06-29 Computer Associates Think, Inc. Session ticket authentication scheme
US7480724B2 (en) 2002-09-25 2009-01-20 At&T Intellectual Property I, L.P. API tool-set for providing services through a residential communication gateway
US7584263B1 (en) 2002-09-25 2009-09-01 At&T Intellectual Property I, L. P. System and method for providing services access through a family home page
US7890451B2 (en) * 2002-10-09 2011-02-15 Compete, Inc. Computer program product and method for refining an estimate of internet traffic
US7389430B2 (en) * 2002-12-05 2008-06-17 International Business Machines Corporation Method for providing access control to single sign-on computer networks
US7392160B2 (en) * 2002-12-18 2008-06-24 Fortent Limited System and method for monitoring usage patterns
US7240298B2 (en) 2002-12-19 2007-07-03 Microsoft Corporation Contact page
US7636719B2 (en) * 2002-12-19 2009-12-22 Microsoft Corporation Contact schema
US7418663B2 (en) 2002-12-19 2008-08-26 Microsoft Corporation Contact picker interface
US7359935B1 (en) * 2002-12-20 2008-04-15 Versata Development Group, Inc. Generating contextual user network session history in a dynamic content environment
US8683016B1 (en) * 2002-12-20 2014-03-25 Versata Development Group, Inc. Data recording components and processes for acquiring selected web site data
US7778999B1 (en) * 2003-01-24 2010-08-17 Bsecure Technologies, Inc. Systems and methods for multi-layered packet filtering and remote management of network devices
WO2004070585A2 (en) 2003-01-31 2004-08-19 Kaleidescape, Inc. Detecting collusion among multiple recipients of fingerprinted information
US20050216844A1 (en) * 2004-03-03 2005-09-29 Error Brett M Delayed transmission of website usage data
US20040210560A1 (en) * 2003-04-16 2004-10-21 Shuster Gary Stephen Method and system for searching a wide area network
US8572104B2 (en) * 2003-04-18 2013-10-29 Kaleidescape, Inc. Sales of collections excluding those already purchased
US20050125405A1 (en) * 2003-04-18 2005-06-09 Kaleidescape, Inc. Distinct display of differentiated rights in property
US20040225553A1 (en) * 2003-05-05 2004-11-11 Broady George Vincent Measuring customer interest to forecast product consumption
US20040249871A1 (en) * 2003-05-22 2004-12-09 Mehdi Bazoon System and method for automatically removing documents from a knowledge repository
WO2005008380A2 (en) * 2003-07-03 2005-01-27 General Motors Corporation System and method for electronically managing privileged and non-privileged documents
US7779039B2 (en) 2004-04-02 2010-08-17 Salesforce.Com, Inc. Custom entities and fields in a multi-tenant database system
US8543566B2 (en) 2003-09-23 2013-09-24 Salesforce.Com, Inc. System and methods of improving a multi-tenant database query using contextual knowledge about non-homogeneously distributed tenant data
US7529728B2 (en) 2003-09-23 2009-05-05 Salesforce.Com, Inc. Query optimization in a multi-tenant database system
US7346839B2 (en) 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US20050097088A1 (en) * 2003-11-04 2005-05-05 Dominic Bennett Techniques for analyzing the performance of websites
WO2005045673A2 (en) * 2003-11-04 2005-05-19 Kimberly-Clark Worldwide, Inc. Testing tool for complex component based software systems
KR101102638B1 (ko) * 2003-11-13 2012-01-04 파나소닉 주식회사 프로그램 추천장치, 프로그램 추천장치의 프로그램 추천방법 및 기록매체
US7711743B2 (en) * 2003-12-15 2010-05-04 Telecom Consulting Group N.E. Corp. Process and system that dynamically links contents of websites to a directory record to display as a combined return from a search result
US8010459B2 (en) 2004-01-21 2011-08-30 Google Inc. Methods and systems for rating associated members in a social network
US7269590B2 (en) * 2004-01-29 2007-09-11 Yahoo! Inc. Method and system for customizing views of information associated with a social network user
US7953759B2 (en) 2004-02-17 2011-05-31 Microsoft Corporation Simplifying application access to schematized contact data
US10339538B2 (en) * 2004-02-26 2019-07-02 Oath Inc. Method and system for generating recommendations
US20050210121A1 (en) * 2004-03-22 2005-09-22 Qualcomm Incorporated Satellite anticipatory bandwith acceleration
US7467399B2 (en) 2004-03-31 2008-12-16 International Business Machines Corporation Context-sensitive confidentiality within federated environments
US20050222982A1 (en) * 2004-03-31 2005-10-06 Paczkowski Remigiusz K System and method for responding to search requests in a computer network
US8326658B1 (en) * 2004-04-12 2012-12-04 Amazon Technologies, Inc. Generation and contextual presentation of statistical data reflective of user selections from an electronic catalog
US7424476B2 (en) * 2004-04-16 2008-09-09 Aol Llc Categorized web browsing history
US8386488B2 (en) 2004-04-27 2013-02-26 International Business Machines Corporation Method and system for matching appropriate content with users by matching content tags and profiles
US7711313B2 (en) * 2004-05-14 2010-05-04 Google Inc. Broadcast monitoring system and method for intelligent optimization
US7739142B2 (en) * 2004-05-17 2010-06-15 Yahoo! Inc. System and method for providing automobile marketing research information
US8010458B2 (en) 2004-05-26 2011-08-30 Facebook, Inc. System and method for managing information flow between members of an online social network
US8145512B1 (en) 2004-06-09 2012-03-27 Amazon Technologies, Inc. Data mining of user activity data to identify sequential item acquisition patterns
US20060004621A1 (en) * 2004-06-30 2006-01-05 Malek Kamal M Real-time selection of survey candidates
US8620915B1 (en) 2007-03-13 2013-12-31 Google Inc. Systems and methods for promoting personalized search results based on personal information
US20060155750A1 (en) * 2004-08-12 2006-07-13 Fowler James F System to generate unpublished corporate data
GB2418037B (en) * 2004-09-09 2007-02-28 Surfcontrol Plc System, method and apparatus for use in monitoring or controlling internet access
GB2418108B (en) 2004-09-09 2007-06-27 Surfcontrol Plc System, method and apparatus for use in monitoring or controlling internet access
US7719971B1 (en) * 2004-09-15 2010-05-18 Qurio Holdings, Inc. Peer proxy binding
US7930649B2 (en) * 2004-10-08 2011-04-19 Emc Corporation Method and system for sharing and managing context information
US11283885B2 (en) * 2004-10-19 2022-03-22 Verizon Patent And Licensing Inc. System and method for location based matching and promotion
JP4243862B2 (ja) * 2004-10-26 2009-03-25 ソニー株式会社 コンテンツ利用装置およびコンテンツ利用方法
US7953725B2 (en) * 2004-11-19 2011-05-31 International Business Machines Corporation Method, system, and storage medium for providing web information processing services
RU2007123612A (ru) * 2004-11-23 2008-12-27 Конинклейке Филипс Электроникс Н.В. (Nl) Способ и устройство управления файлами
US7440968B1 (en) * 2004-11-30 2008-10-21 Google Inc. Query boosting based on classification
US8874570B1 (en) 2004-11-30 2014-10-28 Google Inc. Search boost vector based on co-visitation information
US9760629B1 (en) 2004-12-29 2017-09-12 Google Inc. Systems and methods for implementing a news round table
US7698270B2 (en) 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US20060149710A1 (en) 2004-12-30 2006-07-06 Ross Koningstein Associating features with entities, such as categories of web page documents, and/or weighting such features
JP4247626B2 (ja) * 2005-01-20 2009-04-02 ソニー株式会社 再生装置および再生方法
JP4595555B2 (ja) * 2005-01-20 2010-12-08 ソニー株式会社 コンテンツ再生装置およびコンテンツ再生方法
US8185560B2 (en) * 2005-01-28 2012-05-22 Thomson Reuters Global Resources Systems, methods, software for integration of case law, legal briefs, and litigation documents into law firm workflow
US20060173696A1 (en) * 2005-01-31 2006-08-03 Drew Julie W Method and apparatus for product management
US20060200469A1 (en) * 2005-03-02 2006-09-07 Lakshminarayanan Chidambaran Global session identifiers in a multi-node system
US20090276277A1 (en) * 2005-03-04 2009-11-05 Quadrat Optimized Appointment Scheduling Method
US9141589B2 (en) * 2005-03-09 2015-09-22 Google Inc. Method and an apparatus to provide a personalized page
EP1859350B1 (en) * 2005-03-16 2015-06-24 BRITISH TELECOMMUNICATIONS public limited company Monitoring computer-controlled processes
US20060212353A1 (en) * 2005-03-16 2006-09-21 Anton Roslov Targeted advertising system and method
JP2006260420A (ja) * 2005-03-18 2006-09-28 Fujitsu Ltd ウェブサイト分析システム
JP4741267B2 (ja) * 2005-03-28 2011-08-03 ソニー株式会社 コンテンツ推薦システム、通信端末およびコンテンツ推薦方法
EP1708099A1 (en) * 2005-03-29 2006-10-04 BRITISH TELECOMMUNICATIONS public limited company Schema matching
EP1864247A1 (en) * 2005-04-01 2007-12-12 British Telecommunications Public Limited Company Adaptive classifier, and method of creation of classification parameters therefor
US20060224435A1 (en) * 2005-04-01 2006-10-05 Male Kenneth F Method and system for quantifying relative immediacy of events and likelihood of occurrence
US7631007B2 (en) * 2005-04-12 2009-12-08 Scenera Technologies, Llc System and method for tracking user activity related to network resources using a browser
US7451161B2 (en) 2005-04-28 2008-11-11 Friendster, Inc. Compatibility scoring of users in a social network
US20100082480A1 (en) * 2008-09-30 2010-04-01 Jason Alexander Korosec Payments with virtual value
US9792359B2 (en) * 2005-04-29 2017-10-17 Entit Software Llc Providing training information for training a categorizer
US9047290B1 (en) 2005-04-29 2015-06-02 Hewlett-Packard Development Company, L.P. Computing a quantification measure associated with cases in a category
US7827061B2 (en) * 2005-05-03 2010-11-02 International Business Machines Corporation Dynamic selection of outbound marketing events
US7881959B2 (en) * 2005-05-03 2011-02-01 International Business Machines Corporation On demand selection of marketing offers in response to inbound communications
US20060259867A1 (en) * 2005-05-13 2006-11-16 Microsoft Corporation System and method for automatic generation of browsing favorites
AU2006249685B2 (en) * 2005-05-23 2011-01-27 Google Inc. System and method for broadcast tagging and target advertising
US8732234B2 (en) * 2005-06-07 2014-05-20 Yahoo! Inc. Providing relevant non-requested content to a mobile device
US11210632B2 (en) 2005-06-13 2021-12-28 Rakuten Group, Inc. Computer method and apparatus for targeting advertising
US10510043B2 (en) * 2005-06-13 2019-12-17 Skyword Inc. Computer method and apparatus for targeting advertising
US7630977B2 (en) * 2005-06-29 2009-12-08 Xerox Corporation Categorization including dependencies between different category systems
JP2007011928A (ja) * 2005-07-04 2007-01-18 Sony Corp コンテンツ提供システム、コンテンツ提供装置、コンテンツ配信サーバ、コンテンツ受信端末およびコンテンツ提供方法
US20070011020A1 (en) * 2005-07-05 2007-01-11 Martin Anthony G Categorization of locations and documents in a computer network
US20070016985A1 (en) * 2005-07-18 2007-01-18 Pioneer Hi-Bred International, Inc. Particle Preparation for Direct-Delivery Transformation
JP5133508B2 (ja) 2005-07-21 2013-01-30 ソニー株式会社 コンテンツ提供システム、コンテンツ提供装置、コンテンツ配信サーバ、コンテンツ受信端末およびコンテンツ提供方法
US7188051B2 (en) * 2005-08-03 2007-03-06 The Boeing Company Apparatus and methods for maintenance task analysis
US20070033233A1 (en) * 2005-08-05 2007-02-08 Hwang Min J Log management system and method of using the same
US9105028B2 (en) 2005-08-10 2015-08-11 Compete, Inc. Monitoring clickstream behavior of viewers of online advertisements and search results
JP4479623B2 (ja) * 2005-08-22 2010-06-09 ソニー株式会社 コンテンツ通信システム、コンテンツ通信方法及び通信端末装置
US7925578B1 (en) 2005-08-26 2011-04-12 Jpmorgan Chase Bank, N.A. Systems and methods for performing scoring optimization
US7949684B2 (en) 2005-09-09 2011-05-24 Salesforce.Com, Inc. Systems and methods for exporting, publishing, browsing and installing on-demand applications in a multi-tenant database environment
US9432468B2 (en) 2005-09-14 2016-08-30 Liveperson, Inc. System and method for design and dynamic generation of a web page
US8738732B2 (en) 2005-09-14 2014-05-27 Liveperson, Inc. System and method for performing follow up based on user interactions
US8843481B1 (en) * 2005-09-30 2014-09-23 Yongyong Xu System and method of forming action based virtual communities and related search mechanisms
US7983961B1 (en) 2005-10-27 2011-07-19 Alvin Chang Methods and apparatus for marketing profiling while preserving user privacy
US7734632B2 (en) * 2005-10-28 2010-06-08 Disney Enterprises, Inc. System and method for targeted ad delivery
US8516057B2 (en) * 2005-11-30 2013-08-20 Digital River, Inc. Subscriber list system and method
JP2007179276A (ja) * 2005-12-27 2007-07-12 Internatl Business Mach Corp <Ibm> 適合判定方法、装置、およびプログラム
US7693836B2 (en) 2005-12-27 2010-04-06 Baynote, Inc. Method and apparatus for determining peer groups based upon observed usage patterns
US7716472B2 (en) * 2005-12-29 2010-05-11 Bsecure Technologies, Inc. Method and system for transparent bridging and bi-directional management of network data
US7474980B2 (en) * 2006-01-24 2009-01-06 The United States Of America As Represented By The Secretary Of The Army Automated tool for monitoring archaeological sites (ATMAS™)
US8489497B1 (en) * 2006-01-27 2013-07-16 Jpmorgan Chase Bank, N.A. Online interactive and partner-enhanced credit card
JP4811046B2 (ja) 2006-02-17 2011-11-09 ソニー株式会社 コンテンツの再生装置、オーディオ再生機およびコンテンツの再生方法
US7779004B1 (en) 2006-02-22 2010-08-17 Qurio Holdings, Inc. Methods, systems, and products for characterizing target systems
US7764701B1 (en) * 2006-02-22 2010-07-27 Qurio Holdings, Inc. Methods, systems, and products for classifying peer systems
US7657526B2 (en) * 2006-03-06 2010-02-02 Veveo, Inc. Methods and systems for selecting and presenting content based on activity level spikes associated with the content
US7818279B2 (en) * 2006-03-13 2010-10-19 Microsoft Corporation Event detection based on evolution of click-through data
US20070220010A1 (en) * 2006-03-15 2007-09-20 Kent Thomas Ertugrul Targeted content delivery for networks
US7752152B2 (en) * 2006-03-17 2010-07-06 Microsoft Corporation Using predictive user models for language modeling on a personal device with user behavior models based on statistical modeling
US8032375B2 (en) * 2006-03-17 2011-10-04 Microsoft Corporation Using generic predictive models for slot values in language modeling
US7624081B2 (en) * 2006-03-28 2009-11-24 Microsoft Corporation Predicting community members based on evolution of heterogeneous networks using a best community classifier and a multi-class community classifier
US7836052B2 (en) * 2006-03-28 2010-11-16 Microsoft Corporation Selection of attribute combination aggregations
US7904448B2 (en) * 2006-03-29 2011-03-08 Yahoo! Inc. Incremental update of long-term and short-term user profile scores in a behavioral targeting system
US7814109B2 (en) * 2006-03-29 2010-10-12 Yahoo! Inc. Automatic categorization of network events
US8438170B2 (en) * 2006-03-29 2013-05-07 Yahoo! Inc. Behavioral targeting system that generates user profiles for target objectives
US7809740B2 (en) * 2006-03-29 2010-10-05 Yahoo! Inc. Model for generating user profiles in a behavioral targeting system
US8166027B2 (en) * 2006-03-30 2012-04-24 International Business Machines Corporation System, method and program to test a web site
US20070239529A1 (en) * 2006-03-30 2007-10-11 Shumeet Baluja Targeting and/or scoring advertisements using information derived from called telephone numbers or the called telephone numbers themselves
US8630903B2 (en) * 2006-03-31 2014-01-14 Google Inc. Providing a locator, such as a URL, for tracking multiple types of user-advertisement actions
US7689420B2 (en) * 2006-04-06 2010-03-30 Microsoft Corporation Personalizing a context-free grammar using a dictation language model
US8423408B1 (en) 2006-04-17 2013-04-16 Sprint Communications Company L.P. Dynamic advertising content distribution and placement systems and methods
US8190742B2 (en) * 2006-04-25 2012-05-29 Hewlett-Packard Development Company, L.P. Distributed differential store with non-distributed objects and compression-enhancing data-object routing
WO2007143394A2 (en) * 2006-06-02 2007-12-13 Nielsen Media Research, Inc. Digital rights management systems and methods for audience measurement
WO2007147080A1 (en) 2006-06-16 2007-12-21 Almondnet, Inc. Media properties selection method and system based on expected profit from profile-based ad delivery
WO2007149888A2 (en) 2006-06-19 2007-12-27 Almondnet, Inc. Providing collected profiles to media properties having specified interests
US10839332B1 (en) 2006-06-26 2020-11-17 Stamps.Com Image-customized labels adapted for bearing computer-based, generic, value-bearing items, and systems and methods for providing image-customized labels
US10410237B1 (en) 2006-06-26 2019-09-10 Sprint Communications Company L.P. Inventory management integrating subscriber and targeting data
EP1873657A1 (en) * 2006-06-29 2008-01-02 France Télécom User-profile based web page recommendation system and method
US8615800B2 (en) * 2006-07-10 2013-12-24 Websense, Inc. System and method for analyzing web content
US8020206B2 (en) * 2006-07-10 2011-09-13 Websense, Inc. System and method of analyzing web content
US20080016546A1 (en) * 2006-07-13 2008-01-17 Li Tong L Dynamic profile access control
US8442858B1 (en) 2006-07-21 2013-05-14 Sprint Communications Company L.P. Subscriber data insertion into advertisement requests
US8452832B2 (en) * 2006-07-27 2013-05-28 Yahoo! Inc. System and method for population-targeted advertising
US8468561B2 (en) * 2006-08-09 2013-06-18 Google Inc. Preemptible station inventory
JP2008047067A (ja) * 2006-08-21 2008-02-28 Ricoh Co Ltd カプセル化文書管理装置、カプセル化文書管理方法及びカプセル化文書管理プログラム
US20080051081A1 (en) * 2006-08-24 2008-02-28 Sony Ericsson Mobile Communications Profile tracker for portable communication device
US7801971B1 (en) 2006-09-26 2010-09-21 Qurio Holdings, Inc. Systems and methods for discovering, creating, using, and managing social network circuits
US7925592B1 (en) 2006-09-27 2011-04-12 Qurio Holdings, Inc. System and method of using a proxy server to manage lazy content distribution in a social network
US20080086741A1 (en) * 2006-10-10 2008-04-10 Quantcast Corporation Audience commonality and measurement
US8751418B1 (en) 2011-10-17 2014-06-10 Quantcast Corporation Using proxy behaviors for audience selection
US8892756B2 (en) 2006-10-19 2014-11-18 Ebay Inc. Method and system of publishing campaign data
WO2008052079A2 (en) * 2006-10-24 2008-05-02 Hello-Hello, Inc. Method for creating and analyzing advertisements
US20080103868A1 (en) * 2006-10-31 2008-05-01 Santos Cipriano A Methods for planning workforce resources
US8539349B1 (en) 2006-10-31 2013-09-17 Hewlett-Packard Development Company, L.P. Methods and systems for splitting a chinese character sequence into word segments
US10664851B1 (en) 2006-11-08 2020-05-26 Sprint Communications Company, L.P. Behavioral analysis engine for profiling wireless subscribers
US10068261B1 (en) 2006-11-09 2018-09-04 Sprint Communications Company L.P. In-flight campaign optimization
US9654495B2 (en) * 2006-12-01 2017-05-16 Websense, Llc System and method of analyzing web addresses
US20080140765A1 (en) * 2006-12-07 2008-06-12 Yahoo! Inc. Efficient and reproducible visitor targeting based on propagation of cookie information
US7886334B1 (en) 2006-12-11 2011-02-08 Qurio Holdings, Inc. System and method for social network trust assessment
US7730216B1 (en) 2006-12-14 2010-06-01 Qurio Holdings, Inc. System and method of sharing content among multiple social network nodes using an aggregation node
WO2008076343A2 (en) * 2006-12-15 2008-06-26 American Express Travel Related Service Company, Inc. Identifying and managing strategic partner relationships
US8694361B2 (en) * 2006-12-15 2014-04-08 American Express Travel Related Services Company, Inc. Identifying and managing strategic partner relationships
US20080147425A1 (en) * 2006-12-15 2008-06-19 American Express Travel Related Services Company, Inc. Strategic Partner Recognition
US7849097B2 (en) * 2006-12-15 2010-12-07 Microsoft Corporation Mining latent associations of objects using a typed mixture model
US7788265B2 (en) * 2006-12-21 2010-08-31 Finebrain.Com Ag Taxonomy-based object classification
WO2008079405A1 (en) * 2006-12-22 2008-07-03 Phorm Uk, Inc. Systems and methods for channeling client network activity
US20080222283A1 (en) * 2007-03-08 2008-09-11 Phorm Uk, Inc. Behavioral Networking Systems And Methods For Facilitating Delivery Of Targeted Content
US9195996B1 (en) 2006-12-27 2015-11-24 Qurio Holdings, Inc. System and method for classification of communication sessions in a social network
US8135800B1 (en) 2006-12-27 2012-03-13 Qurio Holdings, Inc. System and method for user classification based on social network aware content analysis
US8326673B1 (en) 2006-12-28 2012-12-04 Sprint Communications Company L.P. Carrier data based product inventory management and marketing
US8010403B2 (en) 2006-12-29 2011-08-30 American Express Travel Related Services Company, Inc. System and method for targeting transaction account product holders to receive upgraded transaction account products
GB2458094A (en) * 2007-01-09 2009-09-09 Surfcontrol On Demand Ltd URL interception and categorization in firewalls
GB2445764A (en) * 2007-01-22 2008-07-23 Surfcontrol Plc Resource access filtering system and database structure for use therewith
US20080189171A1 (en) * 2007-02-01 2008-08-07 Nice Systems Ltd. Method and apparatus for call categorization
KR101078175B1 (ko) * 2007-02-12 2011-10-28 이민화 이동 단말 사용자들의 가상 그룹을 형성하는 시스템 및방법
AU2008221475B2 (en) * 2007-02-26 2012-08-30 Hello-Hello, Inc. Mass comparative analysis of advertising
US8015174B2 (en) * 2007-02-28 2011-09-06 Websense, Inc. System and method of controlling access to the internet
WO2008119037A1 (en) * 2007-03-27 2008-10-02 Slc Consultants, Inc. Strategic business management system
US20080249789A1 (en) * 2007-04-05 2008-10-09 Agelio Networks, Inc. System and method for providing royalty offers to mineral interest owners
CN101657857A (zh) * 2007-04-12 2010-02-24 汤姆逊许可证公司 用于工作流接口的消息机制
CA2631040A1 (en) * 2007-05-10 2008-11-10 Publicinsite, Ltd. Website affiliation analysis method and system
US7752201B2 (en) * 2007-05-10 2010-07-06 Microsoft Corporation Recommendation of related electronic assets based on user search behavior
US8037042B2 (en) * 2007-05-10 2011-10-11 Microsoft Corporation Automated analysis of user search behavior
GB0709527D0 (en) * 2007-05-18 2007-06-27 Surfcontrol Plc Electronic messaging system, message processing apparatus and message processing method
US8335714B2 (en) 2007-05-31 2012-12-18 International Business Machines Corporation Identification of users for advertising using data with missing values
US10706429B2 (en) * 2007-05-31 2020-07-07 International Business Machines Corporation Identification of users for advertising purposes
US7818396B2 (en) * 2007-06-21 2010-10-19 Microsoft Corporation Aggregating and searching profile data from multiple services
EP2007114B1 (en) * 2007-06-22 2016-08-10 Alcatel Lucent A system for providing information to users sharing a nomadic experience
US9396254B1 (en) 2007-07-20 2016-07-19 Hewlett-Packard Development Company, L.P. Generation of representative document components
US8224739B2 (en) * 2007-07-30 2012-07-17 Hewlett-Packard Development Company, L.P. Allocating goods to bidders in combinatorial auctions
US8627403B1 (en) 2007-07-31 2014-01-07 Hewlett-Packard Development Company, L.P. Policy applicability determination
JP2010536102A (ja) * 2007-08-08 2010-11-25 ベイノート,インク. コンテキストに基づくコンテンツレコメンデーションの方法及び装置
WO2009029222A1 (en) 2007-08-24 2009-03-05 Clear Channel Management Services, L.P. System and method for providing a radio-like experience
US9699232B2 (en) 2007-08-24 2017-07-04 Iheartmedia Management Services, Inc. Adding perishable content to media stream based on user location preference
US9990655B2 (en) 2007-08-24 2018-06-05 Iheartmedia Management Services, Inc. Live media stream including personalized notifications
US11265355B2 (en) 2007-08-24 2022-03-01 Iheartmedia Management Services, Inc. Customized perishable media content based on user-specified preference for static or variable location
US7698422B2 (en) 2007-09-10 2010-04-13 Specific Media, Inc. System and method of determining user demographic profiles of anonymous users
US20090077163A1 (en) * 2007-09-14 2009-03-19 Phorm Uk, Inc. Approach for identifying and providing targeted content to a network client with reduced impact to the service provider
US20090077495A1 (en) * 2007-09-19 2009-03-19 Yahoo! Inc. Method and System of Creating a Personalized Homepage
US20090083141A1 (en) * 2007-09-25 2009-03-26 Ari Craine Methods, systems, and computer program products for detecting and predicting user content interest
US20090106253A1 (en) * 2007-10-22 2009-04-23 Ilja Fischer Portal event verification
US8332404B2 (en) * 2007-10-25 2012-12-11 Hewlett-Packard Development Company, L.P. Data processing apparatus and method of processing data
WO2009054834A1 (en) * 2007-10-25 2009-04-30 Hewlett-Packard Development Company, L.P. Data processing apparatus and method of processing data
DE112007003693B4 (de) * 2007-10-25 2014-05-15 Hewlett-Packard Development Co., L.P. Datenverarbeitungsvorrichtung und Verfahren zur Datenverarbeitung
US8140637B2 (en) * 2007-10-25 2012-03-20 Hewlett-Packard Development Company, L.P. Communicating chunks between devices
CN101855620B (zh) * 2007-10-25 2013-06-12 惠普开发有限公司 数据处理设备和数据处理方法
US8099573B2 (en) * 2007-10-25 2012-01-17 Hewlett-Packard Development Company, L.P. Data processing apparatus and method of processing data
US8150851B2 (en) * 2007-10-25 2012-04-03 Hewlett-Packard Development Company, L.P. Data processing apparatus and method of processing data
US9576001B2 (en) * 2007-10-31 2017-02-21 Yahoo! Inc. Content optimization system and method
US20090119619A1 (en) * 2007-11-02 2009-05-07 Bailey Thomas J Method, apparatus and software for providing path usage data for links between data pages in a computer system
GB2454509A (en) * 2007-11-09 2009-05-13 Motorola Inc Method and apparatus for modifying a user preference profile
US20090132366A1 (en) * 2007-11-15 2009-05-21 Microsoft Corporation Recognizing and crediting offline realization of online behavior
US20090138562A1 (en) * 2007-11-28 2009-05-28 Loyal Technology Solutions, L.L.C. Method and system for aggregation of electronic messages
US7433960B1 (en) * 2008-01-04 2008-10-07 International Business Machines Corporation Systems, methods and computer products for profile based identity verification over the internet
US8751492B1 (en) * 2008-01-17 2014-06-10 Amdocs Software Systems Limited System, method, and computer program product for selecting an event category based on a category score for use in providing content
US10269024B2 (en) * 2008-02-08 2019-04-23 Outbrain Inc. Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content
US8560964B2 (en) 2008-02-20 2013-10-15 International Business Machines Corporation Method and system for predictive browsing
EP2266081A1 (en) * 2008-03-10 2010-12-29 Ubs Ag Methods and systems for group data management and classification
US8029359B2 (en) 2008-03-27 2011-10-04 World Golf Tour, Inc. Providing offers to computer game players
EP2107761A1 (en) * 2008-03-31 2009-10-07 Sony Corporation Method to determine a subgroup of users
US8090822B2 (en) 2008-04-11 2012-01-03 The Nielsen Company (Us), Llc Methods and apparatus for nonintrusive monitoring of web browser usage
US8959089B2 (en) * 2008-04-25 2015-02-17 Hewlett-Packard Development Company, L.P. Data processing apparatus and method of processing data
US8554767B2 (en) * 2008-12-23 2013-10-08 Samsung Electronics Co., Ltd Context-based interests in computing environments and systems
US8117085B1 (en) 2008-06-05 2012-02-14 Amazon Technologies, Inc. Data mining processes for supporting item pair recommendations
US7680703B1 (en) 2008-06-05 2010-03-16 Amazon Technologies, Inc. Data mining system capable of generating pairwise comparisons of user-selectable items based on user event histories
US20090313550A1 (en) * 2008-06-17 2009-12-17 Microsoft Corporation Theme Based Content Interaction
US11048765B1 (en) 2008-06-25 2021-06-29 Richard Paiz Search engine optimizer
US9268843B2 (en) * 2008-06-27 2016-02-23 Cbs Interactive Inc. Personalization engine for building a user profile
US8214346B2 (en) * 2008-06-27 2012-07-03 Cbs Interactive Inc. Personalization engine for classifying unstructured documents
US8416695B2 (en) * 2008-06-30 2013-04-09 Huawei Technologies Co., Ltd. Method, device and system for network interception
CN102077201A (zh) 2008-06-30 2011-05-25 网圣公司 用于网页的动态及实时归类的系统及方法
US8473518B1 (en) 2008-07-03 2013-06-25 Salesforce.Com, Inc. Techniques for processing group membership data in a multi-tenant database system
US8762313B2 (en) 2008-07-25 2014-06-24 Liveperson, Inc. Method and system for creating a predictive model for targeting web-page to a surfer
US8260846B2 (en) 2008-07-25 2012-09-04 Liveperson, Inc. Method and system for providing targeted content to a surfer
US8010526B1 (en) * 2008-07-30 2011-08-30 Zscaler, Inc. Instance counting and ranking
US8805844B2 (en) 2008-08-04 2014-08-12 Liveperson, Inc. Expert search
US20100034102A1 (en) * 2008-08-05 2010-02-11 At&T Intellectual Property I, Lp Measurement-Based Validation of a Simple Model for Panoramic Profiling of Subnet-Level Network Data Traffic
US7552210B1 (en) 2008-08-12 2009-06-23 International Business Machines Corporation Method of and system for handling cookies
US8380793B2 (en) * 2008-09-05 2013-02-19 Microsoft Corporation Automatic non-junk message list inclusion
US20100070296A1 (en) * 2008-09-15 2010-03-18 ZocDoc, Inc. Patient verification for booking of healthcare appointments across practice groups
US20100070295A1 (en) * 2008-09-15 2010-03-18 ZocDoc, Inc. Centralized marketplace for healthcare appointments across practice groups
US8688466B2 (en) * 2008-09-15 2014-04-01 ZocDoc, Inc. Data synchronization for booking of healthcare appointments across practice groups
US20100070303A1 (en) * 2008-09-15 2010-03-18 ZocDoc, Inc. Consumer portal for healthcare appointments across practice groups
US20110191122A1 (en) * 2008-09-15 2011-08-04 ZocDoc, Inc. Method and apparatus for managing physician referrals
US8429216B2 (en) * 2008-09-23 2013-04-23 Hewlett-Packard Development Company, L.P. Generating a hash value from a vector representing a data object
US8195601B2 (en) * 2008-09-26 2012-06-05 Microsoft Corporation Visitor-assisted user profile creation
US8640163B2 (en) * 2008-09-30 2014-01-28 Microsoft Corporation Determining user-to-user similarities in an online media environment
US8103675B2 (en) 2008-10-20 2012-01-24 Hewlett-Packard Development Company, L.P. Predicting user-item ratings
CN102239673B (zh) * 2008-10-27 2015-01-14 意大利电信股份公司 剖析电信网络中的数据业务的方法和系统
US9576027B2 (en) * 2008-10-27 2017-02-21 Hewlett Packard Enterprise Development Lp Generating a query plan for estimating a number of unique attributes in a database
US8117343B2 (en) * 2008-10-28 2012-02-14 Hewlett-Packard Development Company, L.P. Landmark chunking of landmarkless regions
US20100205024A1 (en) * 2008-10-29 2010-08-12 Haggai Shachar System and method for applying in-depth data mining tools for participating websites
US9892417B2 (en) 2008-10-29 2018-02-13 Liveperson, Inc. System and method for applying tracing tools for network locations
US8234166B2 (en) * 2008-10-29 2012-07-31 Yahoo! Inc. Automated user segment selection for delivery of online advertisements
US20100114654A1 (en) * 2008-10-31 2010-05-06 Hewlett-Packard Development Company, L.P. Learning user purchase intent from user-centric data
US8364699B2 (en) 2008-11-14 2013-01-29 Morgan Stanley Commodities framework
US8037067B1 (en) * 2008-11-14 2011-10-11 United Services Automobile Association (Usaa) Systems and methods for tracking user activity at website
US8156435B2 (en) * 2008-11-25 2012-04-10 At&T Intellectual Property I, L.P. Systems and methods to select media content
US8694496B2 (en) * 2008-11-26 2014-04-08 At&T Intellectual Property I, L.P. Harvesting application metadata
US8180715B2 (en) * 2008-12-11 2012-05-15 Hewlett-Packard Development Company, L.P. Systems and methods for collaborative filtering using collaborative inductive transfer
US20100161380A1 (en) * 2008-12-23 2010-06-24 Samsung Electronics Co., Ltd. Rating-based interests in computing environments and systems
US8175902B2 (en) * 2008-12-23 2012-05-08 Samsung Electronics Co., Ltd. Semantics-based interests in computing environments and systems
US8099453B2 (en) * 2009-01-22 2012-01-17 Hewlett-Packard Development Company, L.P. System and method for data clustering
US20100185503A1 (en) * 2009-01-22 2010-07-22 Julie Ward Drew Product Warranties Having a Residual Value
US20100191734A1 (en) * 2009-01-23 2010-07-29 Rajaram Shyam Sundar System and method for classifying documents
US20100191557A1 (en) * 2009-01-26 2010-07-29 Julie Ward Drew Usage-Limited Product Warranties
US20100192055A1 (en) * 2009-01-27 2010-07-29 Kutano Corporation Apparatus, method and article to interact with source files in networked environment
US20100198604A1 (en) * 2009-01-30 2010-08-05 Samsung Electronics Co., Ltd. Generation of concept relations
US20100235231A1 (en) * 2009-01-30 2010-09-16 Cbs Interactive, Inc. Lead acquisition, promotion and inventory management system and method
US8375182B2 (en) * 2009-02-10 2013-02-12 Hewlett-Packard Development Company, L.P. System and method for segmenting a data stream
US20100211960A1 (en) * 2009-02-17 2010-08-19 Google Inc. Characterizing User Information
US20100223105A1 (en) * 2009-02-27 2010-09-02 Kindsight, Inc. Method and apparatus for content targeting one user group based on behavioral profiling of another user group
US8352319B2 (en) * 2009-03-10 2013-01-08 Google Inc. Generating user profiles
US8001273B2 (en) * 2009-03-16 2011-08-16 Hewlett-Packard Development Company, L.P. Parallel processing of input data to locate landmarks for chunks
US8150974B2 (en) * 2009-03-17 2012-04-03 Kindsight, Inc. Character differentiation system generating session fingerprint using events associated with subscriber ID and session ID
US7979491B2 (en) * 2009-03-27 2011-07-12 Hewlett-Packard Development Company, L.P. Producing chunks from input data using a plurality of processing elements
US8290880B2 (en) * 2009-04-22 2012-10-16 Hewlett-Packard Development Company, L.P. System and method for estimating a parameter that represents data describing a physical system
US9633117B2 (en) * 2009-04-27 2017-04-25 Hewlett Packard Enterprise Development Lp System and method for making a recommendation based on user data
US20100281077A1 (en) * 2009-04-30 2010-11-04 Mark David Lillibridge Batching requests for accessing differential data stores
US9141621B2 (en) * 2009-04-30 2015-09-22 Hewlett-Packard Development Company, L.P. Copying a differential data store into temporary storage media in response to a request
US8224693B2 (en) * 2009-05-14 2012-07-17 Hewlett-Packard Development Company, L.P. Advertisement selection based on key words
CN102598007B (zh) * 2009-05-26 2017-03-01 韦伯森斯公司 有效检测采指纹数据和信息的系统和方法
US8713453B2 (en) * 2009-05-29 2014-04-29 Microsoft Corporation Progressively discovering and integrating services
US20100312653A1 (en) * 2009-06-05 2010-12-09 Microsoft Corporation Verifiable advertisement presentation
US8949407B2 (en) * 2009-06-17 2015-02-03 Microsoft Corporation Capturing a computing experience
US20100324968A1 (en) * 2009-06-19 2010-12-23 Roland Schoettle System and method for automatically restructuring database entries based on data obtained among a plurality of users
US8448057B1 (en) 2009-07-07 2013-05-21 Quantcast Corporation Audience segment selection
US9998552B1 (en) * 2010-04-30 2018-06-12 Open Invention Network Llc Dynamic creation, data population, and communication establishment across various mediums
US8725660B2 (en) * 2009-07-30 2014-05-13 Hewlett-Packard Development Company, L.P. Applying non-linear transformation of feature values for training a classifier
US20110029505A1 (en) * 2009-07-31 2011-02-03 Scholz Martin B Method and system for characterizing web content
US20110029515A1 (en) * 2009-07-31 2011-02-03 Scholz Martin B Method and system for providing website content
US20110029454A1 (en) * 2009-07-31 2011-02-03 Rajan Lukose Linear programming using l1 minimization to determine securities in a portfolio
US20110035375A1 (en) * 2009-08-06 2011-02-10 Ron Bekkerman Building user profiles for website personalization
US8463784B1 (en) 2009-08-07 2013-06-11 Hewlett-Packard Development Company, L.P. Improving data clustering stability
US9213767B2 (en) 2009-08-10 2015-12-15 Hewlett-Packard Development Company, L.P. Method and system for characterizing web content
US9396485B2 (en) * 2009-12-24 2016-07-19 Outbrain Inc. Systems and methods for presenting content
US20110040604A1 (en) * 2009-08-13 2011-02-17 Vertical Acuity, Inc. Systems and Methods for Providing Targeted Content
US20110047213A1 (en) * 2009-08-20 2011-02-24 Alan David Manuel Method and process for identifying trusted information of interest
US10528972B2 (en) * 2009-08-27 2020-01-07 Micro Focus Llc Predicting email responses
US8352396B2 (en) * 2009-09-08 2013-01-08 Hewlett-Packard Development Company, L.P. Systems and methods for improving web site user experience
US8266179B2 (en) * 2009-09-30 2012-09-11 Hewlett-Packard Development Company, L.P. Method and system for processing text
US8140541B2 (en) * 2009-09-30 2012-03-20 Michael Campbell Koss Time-weighted scoring system and method
US20110093312A1 (en) * 2009-10-19 2011-04-21 Julie Ward Drew Modeling wholesale price schedules to reduce double marginalization
US20110106885A1 (en) * 2009-10-29 2011-05-05 Cisco Technology, Inc. Methods and apparatus for supporting multiple party login into a single session
US8185535B2 (en) * 2009-10-30 2012-05-22 Hewlett-Packard Development Company, L.P. Methods and systems for determining unknowns in collaborative filtering
US8954893B2 (en) * 2009-11-06 2015-02-10 Hewlett-Packard Development Company, L.P. Visually representing a hierarchy of category nodes
US20110112824A1 (en) * 2009-11-06 2011-05-12 Craig Peter Sayers Determining at least one category path for identifying input text
US20110110604A1 (en) * 2009-11-10 2011-05-12 Prakash Reddy Cropping scanned pages to remove artifacts
US8355997B2 (en) * 2009-11-13 2013-01-15 Hewlett-Packard Development Company, L.P. Method and system for developing a classification tool
US8311957B2 (en) * 2009-11-13 2012-11-13 Hewlett-Packard Development Company, L.P. Method and system for developing a classification tool
US9576251B2 (en) * 2009-11-13 2017-02-21 Hewlett Packard Enterprise Development Lp Method and system for processing web activity data
US20110116514A1 (en) * 2009-11-13 2011-05-19 Kirshenbaum Evan R Communication system with nestable delimited streams
US20110126122A1 (en) * 2009-11-20 2011-05-26 George Forman Systems and methods for generating profiles for use in customizing a website
US9886681B2 (en) 2009-11-24 2018-02-06 International Business Machines Corporation Creating an aggregate report of a presence of a user on a network
US8572039B2 (en) 2009-11-30 2013-10-29 Hewlett-Packard Development Company, L.P. Focused backup scanning
US8447734B2 (en) * 2009-11-30 2013-05-21 Hewlett-Packard Development Company, L.P. HDAG backup system with variable retention
US9256692B2 (en) * 2009-12-03 2016-02-09 Hewlett Packard Enterprise Development Lp Clickstreams and website classification
US8776067B1 (en) 2009-12-11 2014-07-08 Salesforce.Com, Inc. Techniques for utilizing computational resources in a multi-tenant on-demand database system
US8443366B1 (en) 2009-12-11 2013-05-14 Salesforce.Com, Inc. Techniques for establishing a parallel processing framework for a multi-tenant on-demand database system
US9037733B2 (en) * 2009-12-17 2015-05-19 American Express Travel Related Services Company, Inc. System and method for enabling product development
US8650315B2 (en) 2009-12-17 2014-02-11 American Express Travel Related Services Company, Inc. System and method for enabling healthcare industry channels in an IP marketplace
US20110153851A1 (en) * 2009-12-17 2011-06-23 American Express Travel Related Services Company, Inc. System and method for adjusting intake based on intellectual property asset data
US8868767B2 (en) 2009-12-17 2014-10-21 American Express Travel Related Services Company, Inc. System and method for enabling IP marketplace APIs
US20110154451A1 (en) * 2009-12-17 2011-06-23 American Express Travel Related Services Company, Inc System and method for for an industry based template for intellectual property asset data
US20110153444A1 (en) * 2009-12-17 2011-06-23 American Express Travel Related Services Company, Inc. System and method for registering users for an ip marketplace
US20110153473A1 (en) * 2009-12-17 2011-06-23 American Express Travel Related Services Company, Inc. System and method for managing royalty payments
US8977761B2 (en) * 2009-12-17 2015-03-10 American Express Travel Related Services Company, Inc. System and method for enabling product development
US20110154476A1 (en) * 2009-12-17 2011-06-23 American Expres Travel Related Services Company, Inc. System and method for collecting and validating intellectual property asset data
US20110153852A1 (en) * 2009-12-17 2011-06-23 American Express Travel Related Services Company, Inc. System and method for valuing and rating intellectual property assets
US20110153552A1 (en) * 2009-12-17 2011-06-23 American Express Travel Related Services Company, Inc. System and method for standardizing ip transactions
US20110153573A1 (en) * 2009-12-17 2011-06-23 American Express Travel Related Services Company, Inc. System and method for valuing an ip asset based upon patent quality
US8001012B2 (en) * 2009-12-17 2011-08-16 American Express Travel Related Services Company, Inc. System and method for enabling product development
US20110153434A1 (en) * 2009-12-17 2011-06-23 American Express Travel Related Services Company, Inc. System and method for merchandising intellectual property assets
US10607235B2 (en) * 2009-12-24 2020-03-31 Outbrain Inc. Systems and methods for curating content
US20110197137A1 (en) * 2009-12-24 2011-08-11 Vertical Acuity, Inc. Systems and Methods for Rating Content
US10713666B2 (en) 2009-12-24 2020-07-14 Outbrain Inc. Systems and methods for curating content
US20110161091A1 (en) * 2009-12-24 2011-06-30 Vertical Acuity, Inc. Systems and Methods for Connecting Entities Through Content
US8554619B2 (en) * 2009-12-31 2013-10-08 Google Inc. Multi-campaign content allocation
US8374982B2 (en) * 2010-01-14 2013-02-12 Hewlett-Packard Development Company, L.P. System and method for constructing forecast models
US8645377B2 (en) * 2010-01-15 2014-02-04 Microsoft Corporation Aggregating data from a work queue
US8676859B2 (en) * 2010-01-21 2014-03-18 Hewlett-Packard Development Company, L.P. Method and system for analyzing data stored in a database
US8463041B2 (en) 2010-01-26 2013-06-11 Hewlett-Packard Development Company, L.P. Word-based document image compression
US20110181616A1 (en) * 2010-01-26 2011-07-28 Craig Peter Sayers Graphical effects for an electronic print media viewer
US9262306B2 (en) 2010-01-27 2016-02-16 Hewlett Packard Enterprise Development Lp Software application testing
US8660994B2 (en) * 2010-01-28 2014-02-25 Hewlett-Packard Development Company, L.P. Selective data deduplication
JP5911432B2 (ja) * 2010-02-08 2016-04-27 フェイスブック,インク. ソーシャル・ネットワーク・システムにおける別のドメインからの活動についての情報の通信
US8935797B1 (en) * 2010-02-25 2015-01-13 American Express Travel Related Services Company, Inc. System and method for online data processing
US8478709B2 (en) 2010-03-08 2013-07-02 Hewlett-Packard Development Company, L.P. Evaluation of client status for likelihood of churn
US20110225157A1 (en) * 2010-03-12 2011-09-15 Rajaram Shyam Sundar Method and system for providing website content
US20110231215A1 (en) * 2010-03-16 2011-09-22 Santos Cipriano A Optimization of a resource matching model by mapping a model to a bipartite graph
US9189090B2 (en) 2010-03-26 2015-11-17 Salesforce.Com, Inc. Techniques for interpreting signals from computer input devices
US8977675B2 (en) 2010-03-26 2015-03-10 Salesforce.Com, Inc. Methods and systems for providing time and date specific software user interfaces
WO2011127049A1 (en) 2010-04-07 2011-10-13 Liveperson, Inc. System and method for dynamically enabling customized web content and applications
US10467655B1 (en) 2010-04-15 2019-11-05 Quantcast Corporation Protected audience selection
US9990641B2 (en) 2010-04-23 2018-06-05 Excalibur Ip, Llc Finding predictive cross-category search queries for behavioral targeting
US8255399B2 (en) * 2010-04-28 2012-08-28 Microsoft Corporation Data classifier
US20130024429A1 (en) * 2010-04-29 2013-01-24 Hewlett-Packard Development Company, L.P. Multi-Jurisdiction Retention Scheduling For Record Management
US8595181B2 (en) 2010-05-03 2013-11-26 Salesforce.Com, Inc. Report preview caching techniques in a multi-tenant database
US8977739B2 (en) 2010-05-03 2015-03-10 Salesforce.Com, Inc. Configurable frame work for testing and analysis of client-side web browser page performance
US8655695B1 (en) * 2010-05-07 2014-02-18 Aol Advertising Inc. Systems and methods for generating expanded user segments
US9355414B2 (en) 2010-05-30 2016-05-31 Hewlett Packard Enterprise Development Lp Collaborative filtering model having improved predictive performance
FR2961645A1 (fr) * 2010-06-17 2011-12-23 Kindsight Inc Dispositif et procede de differenciation des caracteristiques par reconnaissance de modeles
US8307006B2 (en) 2010-06-30 2012-11-06 The Nielsen Company (Us), Llc Methods and apparatus to obtain anonymous audience measurement data from network server data for particular demographic and usage profiles
US9817637B2 (en) 2010-07-01 2017-11-14 Salesforce.Com, Inc. Methods and systems for providing enhancements to a business networking feed
US8452779B1 (en) 2010-07-09 2013-05-28 Collective Labs, Llc Methods and system for targeted content delivery
US8819632B2 (en) 2010-07-09 2014-08-26 Salesforce.Com, Inc. Techniques for distributing information in a computer network related to a software anomaly
US8886773B2 (en) 2010-08-14 2014-11-11 The Nielsen Company (Us), Llc Systems, methods, and apparatus to monitor mobile internet activity
US8910259B2 (en) 2010-08-14 2014-12-09 The Nielsen Company (Us), Llc Systems, methods, and apparatus to monitor mobile internet activity
US9069901B2 (en) 2010-08-19 2015-06-30 Salesforce.Com, Inc. Software and framework for reusable automated testing of computer software systems
CA2809980C (en) * 2010-09-01 2018-06-12 Google Inc. Joining multiple user lists
US8843817B2 (en) * 2010-09-14 2014-09-23 Yahoo! Inc. System and method for obtaining user information
US11869024B2 (en) 2010-09-22 2024-01-09 The Nielsen Company (Us), Llc Methods and apparatus to analyze and adjust demographic information
US9092797B2 (en) 2010-09-22 2015-07-28 The Nielsen Company (Us), Llc Methods and apparatus to analyze and adjust demographic information
JP5462418B2 (ja) 2010-09-22 2014-04-02 ザ ニールセン カンパニー (ユー エス) エルエルシー 分散された人口統計情報を使用してインプレッションを特定する方法及び装置
US20130185315A1 (en) * 2010-09-30 2013-07-18 Ming C. Hao Identification of Events of Interest
US20120084160A1 (en) 2010-10-05 2012-04-05 Gregory Joseph Badros Providing Social Endorsements with Online Advertising
US8661067B2 (en) * 2010-10-13 2014-02-25 International Business Machines Corporation Predictive migrate and recall
US20120143912A1 (en) * 2010-12-05 2012-06-07 Unisys Corp. Extending legacy database engines with object-based functionality
US9477537B2 (en) * 2010-12-13 2016-10-25 Microsoft Technology Licensing, Llc Reactive coincidence
US9350598B2 (en) 2010-12-14 2016-05-24 Liveperson, Inc. Authentication of service requests using a communications initiation feature
US8918465B2 (en) 2010-12-14 2014-12-23 Liveperson, Inc. Authentication of service requests initiated from a social networking site
CA2977942C (en) 2010-12-20 2021-08-03 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
US20120215793A1 (en) * 2011-02-08 2012-08-23 Neuralitic Systems Method and system for matching segment profiles to a device identified by a privacy-compliant identifier
US9443224B2 (en) 2011-03-01 2016-09-13 Salesforce.Com, Inc. Systems, apparatus and methods for selecting updates to associated records to publish on an information feed
WO2012122431A1 (en) 2011-03-08 2012-09-13 Affinnova, Inc. System and method for concept development
US20120232998A1 (en) * 2011-03-08 2012-09-13 Kent Schoen Selecting social endorsement information for an advertisement for display to a viewing user
US9208132B2 (en) 2011-03-08 2015-12-08 The Nielsen Company (Us), Llc System and method for concept development with content aware text editor
US9031961B1 (en) 2011-03-17 2015-05-12 Amazon Technologies, Inc. User device with access behavior tracking and favorite passage identifying functionality
EP2686779A4 (en) 2011-03-18 2014-09-17 Nielsen Co Us Llc METHOD AND DEVICE FOR DETERMINING MEDIA IMPRESSIONS
US20120259676A1 (en) 2011-04-07 2012-10-11 Wagner John G Methods and apparatus to model consumer choice sourcing
US8620933B2 (en) 2011-04-11 2013-12-31 Google Inc. Illustrating cross channel conversion paths
US8510326B2 (en) 2011-04-11 2013-08-13 Google Inc. Priority dimensional data conversion path reporting
US8315620B1 (en) 2011-05-27 2012-11-20 The Nielsen Company (Us), Llc Methods and apparatus to associate a mobile device with a panelist profile
US9208187B2 (en) * 2011-06-24 2015-12-08 Salesforce.Com, Inc. Using a database system for selective inclusion and exclusion of types of updates to provide a configuration feed of a social networking system
US9124920B2 (en) 2011-06-29 2015-09-01 The Nielson Company (Us), Llc Methods, apparatus, and articles of manufacture to identify media presentation devices
US8594617B2 (en) 2011-06-30 2013-11-26 The Nielsen Company (Us), Llc Systems, methods, and apparatus to monitor mobile internet activity
US8170925B1 (en) 2011-07-18 2012-05-01 Nor1, Inc. Computer-implemented methods and systems for automatic merchandising
US8655907B2 (en) * 2011-07-18 2014-02-18 Google Inc. Multi-channel conversion path position reporting
US9443225B2 (en) 2011-07-18 2016-09-13 Salesforce.Com, Inc. Computer implemented methods and apparatus for presentation of feed items in an information feed to be displayed on a display device
US9521205B1 (en) * 2011-08-01 2016-12-13 Google Inc. Analyzing changes in web analytics metrics
US8346774B1 (en) * 2011-08-08 2013-01-01 International Business Machines Corporation Protecting network entity data while preserving network properties
US8959450B2 (en) 2011-08-22 2015-02-17 Google Inc. Path explorer visualization
US8543543B2 (en) * 2011-09-13 2013-09-24 Microsoft Corporation Hash-based file comparison
US10346874B2 (en) 2011-09-15 2019-07-09 Quotient Technology Inc. Checkout-based distributed of digital promotions
US9299085B2 (en) 2011-09-27 2016-03-29 Google Inc. System and method for estimating potential unique online users an advertisement can reach
US9064269B1 (en) * 2011-09-27 2015-06-23 Google Inc. Cookie correction system and method
US9218611B1 (en) 2011-09-27 2015-12-22 Google Inc. System and method for determining bid amount for advertisement to reach certain number of online users
US8538333B2 (en) 2011-12-16 2013-09-17 Arbitron Inc. Media exposure linking utilizing bluetooth signal characteristics
US9355366B1 (en) 2011-12-19 2016-05-31 Hello-Hello, Inc. Automated systems for improving communication at the human-machine interface
US20130166609A1 (en) * 2011-12-22 2013-06-27 General Instrument Corporation Hierarchical behavioral profile
US9110998B2 (en) 2011-12-22 2015-08-18 Google Technology Holdings LLC Hierarchical behavioral profile
US8943015B2 (en) 2011-12-22 2015-01-27 Google Technology Holdings LLC Hierarchical behavioral profile
US9311383B1 (en) 2012-01-13 2016-04-12 The Nielsen Company (Us), Llc Optimal solution identification system and method
US8843431B2 (en) 2012-01-16 2014-09-23 International Business Machines Corporation Social network analysis for churn prediction
US9900395B2 (en) 2012-01-27 2018-02-20 Comscore, Inc. Dynamic normalization of internet traffic
US8954580B2 (en) 2012-01-27 2015-02-10 Compete, Inc. Hybrid internet traffic measurement using site-centric and panel data
US8943002B2 (en) 2012-02-10 2015-01-27 Liveperson, Inc. Analytics driven engagement
US9015255B2 (en) 2012-02-14 2015-04-21 The Nielsen Company (Us), Llc Methods and apparatus to identify session users with cookie information
US8805941B2 (en) 2012-03-06 2014-08-12 Liveperson, Inc. Occasionally-connected computing interface
US8566165B1 (en) * 2012-03-30 2013-10-22 Palo Alto Research Center Incorporated Performance-efficient system and method for sampling users for population-centric activity modeling
US10908792B2 (en) * 2012-04-04 2021-02-02 Recorded Future, Inc. Interactive event-based information system
US9563336B2 (en) 2012-04-26 2017-02-07 Liveperson, Inc. Dynamic user interface customization
US8745728B2 (en) * 2012-05-10 2014-06-03 Bank Of America Corporation Creating federated associate identifiers to positively identify associates interfacing across multiple business applications
US9672196B2 (en) 2012-05-15 2017-06-06 Liveperson, Inc. Methods and systems for presenting specialized content using campaign metrics
AU2013204865B2 (en) 2012-06-11 2015-07-09 The Nielsen Company (Us), Llc Methods and apparatus to share online media impressions data
CN104471571B (zh) * 2012-07-11 2018-01-19 谢晚霞 事件驱动架构下对Web活动索引、排序和分析的系统和方法
US9348936B2 (en) * 2012-07-25 2016-05-24 Oracle International Corporation Heuristic caching to personalize applications
CN103631787B (zh) * 2012-08-22 2019-01-11 腾讯科技(深圳)有限公司 网页类型识别方法以及网页类型识别装置
AU2013204953B2 (en) 2012-08-30 2016-09-08 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions
US10803471B2 (en) * 2012-09-27 2020-10-13 Adobe Inc. Audience size estimation and complex segment logic
US9232065B1 (en) 2012-10-17 2016-01-05 Google Inc. Group pseudo-profiles for online sessions
US20140157132A1 (en) * 2012-11-30 2014-06-05 Emo2 Inc. Systems and methods for selectively delivering messages to multiuser touch sensitive display devices
US10212986B2 (en) 2012-12-09 2019-02-26 Arris Enterprises Llc System, apparel, and method for identifying performance of workout routines
US9278255B2 (en) 2012-12-09 2016-03-08 Arris Enterprises, Inc. System and method for activity recognition
US8996526B1 (en) 2012-12-11 2015-03-31 Imdb.Com, Inc. Determining a lasting value of content items and performers
CN103888498B (zh) * 2012-12-21 2018-04-13 腾讯科技(深圳)有限公司 信息推送方法、装置、终端及服务器
US9117054B2 (en) 2012-12-21 2015-08-25 Websense, Inc. Method and aparatus for presence based resource management
US20140180808A1 (en) * 2012-12-22 2014-06-26 Coupons.Com Incorporated Generation and management of dynamic electronic offers
US11157954B1 (en) 2012-12-22 2021-10-26 Quotient Technology Inc. Forming and using master records based on consumer transaction data
US11741090B1 (en) 2013-02-26 2023-08-29 Richard Paiz Site rank codex search patterns
US11809506B1 (en) 2013-02-26 2023-11-07 Richard Paiz Multivariant analyzing replicating intelligent ambience evolving system
US10356579B2 (en) 2013-03-15 2019-07-16 The Nielsen Company (Us), Llc Methods and apparatus to credit usage of mobile devices
US9301173B2 (en) 2013-03-15 2016-03-29 The Nielsen Company (Us), Llc Methods and apparatus to credit internet usage
WO2014152010A1 (en) 2013-03-15 2014-09-25 Affinnova, Inc. Method and apparatus for interactive evolutionary algorithms with respondent directed breeding
US9799041B2 (en) 2013-03-15 2017-10-24 The Nielsen Company (Us), Llc Method and apparatus for interactive evolutionary optimization of concepts
US20150006258A1 (en) * 2013-03-15 2015-01-01 Studio Sbv, Inc. Subscription-based mobile reading platform
US9231996B2 (en) * 2013-04-12 2016-01-05 International Business Machines Corporation User-influenced page loading of web content
US9697533B2 (en) 2013-04-17 2017-07-04 The Nielsen Company (Us), Llc Methods and apparatus to monitor media presentations
US20140316849A1 (en) * 2013-04-22 2014-10-23 Kiosked Oy Method and system for determining item specific user interest
US9519914B2 (en) 2013-04-30 2016-12-13 The Nielsen Company (Us), Llc Methods and apparatus to determine ratings information for online media presentations
US10402846B2 (en) * 2013-05-21 2019-09-03 Fotonation Limited Anonymizing facial expression data with a smart-cam
US10405173B1 (en) 2013-06-05 2019-09-03 Sprint Communications Company L.P. Method and systems of collecting and segmenting device sensor data while in transit via a network
US10068246B2 (en) 2013-07-12 2018-09-04 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions
KR102189609B1 (ko) 2013-07-12 2020-12-11 스카이후크 와이어리스, 인크. 속성과 네트워크 주소 사이의 연관
US9319379B1 (en) 2013-08-01 2016-04-19 Sprint Communications Company L.P. Methods and systems of generating a unique mobile device identifier
US9313294B2 (en) 2013-08-12 2016-04-12 The Nielsen Company (Us), Llc Methods and apparatus to de-duplicate impression information
US10333882B2 (en) 2013-08-28 2019-06-25 The Nielsen Company (Us), Llc Methods and apparatus to estimate demographics of users employing social media
US9374335B2 (en) 2013-09-11 2016-06-21 Sprint Communications Company L.P. System and method for distributing messages to particular mobile devices
US9590938B1 (en) 2013-09-11 2017-03-07 Sprint Communications Company L.P. System and method for identifying a mobile device with near real time visualization to action
US9332035B2 (en) 2013-10-10 2016-05-03 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US10410241B1 (en) 2013-11-27 2019-09-10 Sprint Communications Company L.P. Swipe screen advertisement metrics and tracking
US10241988B2 (en) * 2013-12-05 2019-03-26 Lenovo (Singapore) Pte. Ltd. Prioritizing smart tag creation
US10956947B2 (en) 2013-12-23 2021-03-23 The Nielsen Company (Us), Llc Methods and apparatus to measure media using media object characteristics
US9852163B2 (en) 2013-12-30 2017-12-26 The Nielsen Company (Us), Llc Methods and apparatus to de-duplicate impression information
US9237138B2 (en) 2013-12-31 2016-01-12 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions and search terms
US20150193816A1 (en) 2014-01-06 2015-07-09 The Nielsen Company (Us), Llc Methods and apparatus to correct misattributions of media impressions
US10147114B2 (en) 2014-01-06 2018-12-04 The Nielsen Company (Us), Llc Methods and apparatus to correct audience measurement data
US9734515B1 (en) 2014-01-09 2017-08-15 Sprint Communications Company L.P. Ad management using ads cached on a mobile electronic device
US10013707B1 (en) 2014-01-21 2018-07-03 Sprint Communications Company L.P. Address modification for advertisement mediation
US9836771B1 (en) 2014-01-21 2017-12-05 Sprint Communications Company L.P. Client mediation and integration to advertisement gateway
US10055757B1 (en) 2014-01-21 2018-08-21 Sprint Communications Company L.P. IP address hashing in advertisement gateway
US9984395B1 (en) 2014-01-21 2018-05-29 Sprint Communications Company L.P. Advertisement mediation of supply-demand communications
US10769644B2 (en) * 2014-03-11 2020-09-08 Adobe Inc. Cross-domain identity service
EP3117385A4 (en) 2014-03-13 2017-08-02 The Nielsen Company (US), LLC Methods and apparatus to compensate impression data for misattribution and/or non-coverage by a database proprietor
US9953330B2 (en) 2014-03-13 2018-04-24 The Nielsen Company (Us), Llc Methods, apparatus and computer readable media to generate electronic mobile measurement census data
US11386442B2 (en) * 2014-03-31 2022-07-12 Liveperson, Inc. Online behavioral predictor
US9836765B2 (en) 2014-05-19 2017-12-05 Kibo Software, Inc. System and method for context-aware recommendation through user activity change detection
US20150348059A1 (en) * 2014-05-29 2015-12-03 Wipro Limited System and method for determining the shopping phase of a shopper
US10394922B2 (en) * 2014-06-30 2019-08-27 Facebook, Inc. User index with nicknames
US9537963B2 (en) 2014-07-15 2017-01-03 Aol Inc. Systems and methods for tracking sharing of web content
US10311464B2 (en) 2014-07-17 2019-06-04 The Nielsen Company (Us), Llc Methods and apparatus to determine impressions corresponding to market segments
US10944655B2 (en) * 2014-07-31 2021-03-09 Cisco Technology, Inc. Data verification based upgrades in time series system
US20160063539A1 (en) 2014-08-29 2016-03-03 The Nielsen Company (Us), Llc Methods and apparatus to associate transactions with media impressions
JP5905551B1 (ja) * 2014-09-19 2016-04-20 ヤフー株式会社 情報処理装置、端末装置、情報処理方法及び情報処理プログラム
US10324960B1 (en) * 2014-09-19 2019-06-18 Google Llc Determining a number of unique viewers of a content item
US9508090B1 (en) 2014-09-24 2016-11-29 Sprint Communications Company L.P. End user participation in mobile advertisement
US9818133B1 (en) 2014-10-20 2017-11-14 Sprint Communications Company L.P. Method for consumer profile consolidation using mobile network identification
US10242101B2 (en) * 2014-10-28 2019-03-26 Adobe Inc. Automatic identification of sources of web metric changes
US20160125330A1 (en) * 2014-10-31 2016-05-05 AppDynamics, Inc. Rolling upgrade of metric collection and aggregation system
US10025863B2 (en) * 2014-10-31 2018-07-17 Oath Inc. Recommending contents using a base profile
US9762688B2 (en) 2014-10-31 2017-09-12 The Nielsen Company (Us), Llc Methods and apparatus to improve usage crediting in mobile devices
US20160189182A1 (en) 2014-12-31 2016-06-30 The Nielsen Company (Us), Llc Methods and apparatus to correct age misattribution in media impressions
US20160371662A1 (en) * 2015-02-04 2016-12-22 Empire Technology Development Llc Adaptive merchant site sampling linked to payment transactions
US11423420B2 (en) 2015-02-06 2022-08-23 The Nielsen Company (Us), Llc Methods and apparatus to credit media presentations for online media distributions
US9760657B2 (en) * 2015-02-19 2017-09-12 Adp, Llc Task based semantic search
US20180040010A1 (en) * 2015-02-23 2018-02-08 Nec Corporation Grouping system, method and program
US10147108B2 (en) 2015-04-02 2018-12-04 The Nielsen Company (Us), Llc Methods and apparatus to identify affinity between segment attributes and product characteristics
US10142908B2 (en) 2015-06-02 2018-11-27 Liveperson, Inc. Dynamic communication routing based on consistency weighting and routing rules
US10380633B2 (en) 2015-07-02 2019-08-13 The Nielsen Company (Us), Llc Methods and apparatus to generate corrected online audience measurement data
US10045082B2 (en) 2015-07-02 2018-08-07 The Nielsen Company (Us), Llc Methods and apparatus to correct errors in audience measurements for media accessed using over-the-top devices
US9838754B2 (en) 2015-09-01 2017-12-05 The Nielsen Company (Us), Llc On-site measurement of over the top media
CN105488697A (zh) * 2015-12-09 2016-04-13 焦点科技股份有限公司 一种基于客户行为特征的潜在客户挖掘方法
US10205994B2 (en) 2015-12-17 2019-02-12 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions
US10270673B1 (en) 2016-01-27 2019-04-23 The Nielsen Company (Us), Llc Methods and apparatus for estimating total unique audiences
US20170228462A1 (en) * 2016-02-04 2017-08-10 Microsoft Technology Licensing, Llc Adaptive seeded user labeling for identifying targeted content
WO2017173012A1 (en) * 2016-03-29 2017-10-05 Alibaba Group Holding Limited Methods, systems, and devices for evaluating a health condition of an internet user
US10210459B2 (en) 2016-06-29 2019-02-19 The Nielsen Company (Us), Llc Methods and apparatus to determine a conditional probability based on audience member probability distributions for media audience measurement
US10575055B2 (en) * 2016-07-11 2020-02-25 Sony Corporation Using automatic content recognition (ACR) to weight search results for audio video display device (AVDD)
US10278065B2 (en) 2016-08-14 2019-04-30 Liveperson, Inc. Systems and methods for real-time remote control of mobile applications
US10558647B1 (en) * 2016-12-30 2020-02-11 Amazon Technologies, Inc. High performance data aggregations
US10831511B2 (en) * 2017-04-04 2020-11-10 Adp, Llc Customized application programming interface presentation
US20180315132A1 (en) * 2017-04-28 2018-11-01 Linkedin Corporation Machine-language-based model for identifying peers on an online social network
KR102034840B1 (ko) * 2018-03-26 2019-10-21 주식회사 하이퍼커넥트 테스트 그룹 분배 방법을 실행하기 위한 컴퓨터 프로그램 및 서버
US11205045B2 (en) * 2018-07-06 2021-12-21 International Business Machines Corporation Context-based autocompletion suggestion
US11550629B2 (en) 2020-06-15 2023-01-10 Bank Of America Corporation System for implementing data analytics in mainframe environments

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619709A (en) 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
JPH0926970A (ja) 1994-12-20 1997-01-28 Sun Microsyst Inc 情報を検索するコンピュータによる実行方法及び装置
US5901287A (en) 1996-04-01 1999-05-04 The Sabre Group Inc. Information aggregation and synthesization system
US5848396A (en) * 1996-04-26 1998-12-08 Freedom Of Information, Inc. Method and apparatus for determining behavioral profile of a computer user
US6092105A (en) * 1996-07-12 2000-07-18 Intraware, Inc. System and method for vending retail software and other sets of information to end users
US6144944A (en) * 1997-04-24 2000-11-07 Imgis, Inc. Computer system for efficiently selecting and providing information
US6345293B1 (en) * 1997-07-03 2002-02-05 Microsoft Corporation Personalized information for an end user transmitted over a computer network
US6009410A (en) * 1997-10-16 1999-12-28 At&T Corporation Method and system for presenting customized advertising to a user on the world wide web
US6321206B1 (en) * 1998-03-05 2001-11-20 American Management Systems, Inc. Decision management system for creating strategies to control movement of clients across categories
US6189008B1 (en) * 1998-04-03 2001-02-13 Intertainer, Inc. Dynamic digital asset management
US6483523B1 (en) * 1998-05-08 2002-11-19 Institute For Information Industry Personalized interface browser and its browsing method

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020096428A (ko) * 2001-06-19 2002-12-31 주식회사 케이티 웹 상에서 사용자 행위정보를 이용한 학습방법
JP2003015913A (ja) * 2001-06-29 2003-01-17 Sharp Corp 操作分析装置、操作分析方法、操作分析プログラムおよびコンピュータ読み取り可能な記録媒体
WO2003034301A1 (fr) * 2001-10-11 2003-04-24 Direktplanet Co., Ltd. Appareil de traitement de l'information, procede de traitement de l'information et programme
JP2007528058A (ja) * 2004-01-27 2007-10-04 エヌエイチエヌ コーポレーション 検索者の検索要請に応じて検索結果リストを生成して検索語広告を提供する方法および検索語広告提供システム
JP2009518701A (ja) * 2005-10-28 2009-05-07 オムニチャー, インク. ウェブサイト訪問データセット比較
JP2009531782A (ja) * 2006-03-29 2009-09-03 ヤフー! インコーポレイテッド 行動ターゲティングシステム
JP2007286951A (ja) * 2006-04-18 2007-11-01 Rakuten Inc 検索履歴保存システム
JP2007299275A (ja) * 2006-05-01 2007-11-15 Softbank Mobile Corp 中継サーバ
KR20090052882A (ko) * 2006-08-18 2009-05-26 아카마이 테크놀로지스, 인크. 분산 네트워크에서의 데이터 수집 방법
JP2010501939A (ja) * 2006-08-18 2010-01-21 アカマイ テクノロジーズ インコーポレイテッド 分散ネットワークにおけるデータ収集方法
KR101588428B1 (ko) * 2006-08-18 2016-01-27 아카마이 테크놀로지스, 인크. 분산 네트워크에서의 데이터 수집 방법
US8341102B2 (en) 2007-08-13 2012-12-25 Fujitsu Limited User state presumption system, user state presumption method, and recording media storing user state presumption program
JP2011507063A (ja) * 2007-12-07 2011-03-03 アルカテル−ルーセント 選択された情報を情報源で見つけるためのセマンティック検索要求を自動的に実行するためのデバイスおよび方法
US9307036B2 (en) 2008-03-21 2016-04-05 Alibaba Group Holding Limited Web access using cross-domain cookies
JP2011515767A (ja) * 2008-03-21 2011-05-19 アリババ グループ ホールディング リミテッド クロスドメインクッキーを使用したウェブアクセス
US9189562B2 (en) 2008-09-30 2015-11-17 Kabushiki Kaisha Toshiba Apparatus, method and program product for classifying web browsing purposes
JP2014522004A (ja) * 2011-03-08 2014-08-28 アリババ・グループ・ホールディング・リミテッド 決定されたプリファレンス値に基づく製品情報の送信
JP2014139765A (ja) * 2013-01-21 2014-07-31 Richplay Information Co Ltd 電子情報の表示方法
JP2014215955A (ja) * 2013-04-30 2014-11-17 Necパーソナルコンピュータ株式会社 情報処理装置、その制御方法、及びプログラム
JP2018060241A (ja) * 2016-09-30 2018-04-12 富士通株式会社 関心度評価プログラム、対話プログラム、表示プログラム、装置、及び方法
JP2021508897A (ja) * 2017-12-22 2021-03-11 6センス インサイツ,インコーポレイテッド エンティティのアカウントへのマッピング
JP2022031685A (ja) * 2017-12-22 2022-02-22 6センス インサイツ,インコーポレイテッド エンティティのアカウントへのマッピング
JP7068478B2 (ja) 2017-12-22 2022-05-16 6センス インサイツ,インコーポレイテッド エンティティのアカウントへのマッピング
JP7105356B2 (ja) 2017-12-22 2022-07-22 6センス インサイツ,インコーポレイテッド エンティティのアカウントへのマッピング
US11588782B2 (en) 2017-12-22 2023-02-21 6Sense Insights, Inc. Mapping entities to accounts
EP4150546A4 (en) * 2020-05-15 2023-10-18 Telefonaktiebolaget LM ERICSSON (PUBL) METHOD FOR FILTERING DATA TRAFFIC SENT TO A USER DEVICE
US11824952B2 (en) 2020-05-15 2023-11-21 Telefonaktiebolaget Lm Ericsson (Publ) Method of filtering data traffic sent to a user device

Also Published As

Publication number Publication date
US6839680B1 (en) 2005-01-04

Similar Documents

Publication Publication Date Title
US6839680B1 (en) Internet profiling
TWI386824B (zh) 響應終端使用者資訊請求之方法及裝置
Eirinaki et al. Web mining for web personalization
US10423880B2 (en) Systems and methods for providing recommendations based on collaborative and/or content-based nodal interrelationships
US8504441B2 (en) Services for providing item association data
US7945485B2 (en) Service for providing item recommendations
JP5620933B2 (ja) エンタープライズウェブマイニングシステム及び方法
US8255413B2 (en) Method and apparatus for responding to request for information-personalization
US20140164093A1 (en) System and method to manage and publish promotions electronically
EP2153312A1 (en) Service for providing item recommendations
US20170004402A1 (en) Predictive recommendation engine
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
KR20010106953A (ko) 기능성 배너의 1:1 맞춤광고 제공방법 및 장치
KR20230126048A (ko) 빅데이터 기반 인공지능 디지털 마케팅 방법
Singh et al. An Exclusive Survey on Web Usage Mining For User Identification
Puri The new age search engines
Das et al. Suitability of Web Usage Mining for Web Content Syndication
Kabir New similarity measures for capturing browsing interests of users into web usage profiles
Piotrowiak WYDZIAŁ INFORMATYKI I ZARZĄDZANIA INSTYTUT INFORMATYKI STOSOWANEJ
George Web Mining & Pattern Discovery
Nayak et al. Innovations in Web Applications by Using the Artificial Intelligence Paradigm

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071204