JP4377473B2 - リンク付けされた文書の集合体における文書アクセスの予測システム - Google Patents

リンク付けされた文書の集合体における文書アクセスの予測システム Download PDF

Info

Publication number
JP4377473B2
JP4377473B2 JP07249199A JP7249199A JP4377473B2 JP 4377473 B2 JP4377473 B2 JP 4377473B2 JP 07249199 A JP07249199 A JP 07249199A JP 7249199 A JP7249199 A JP 7249199A JP 4377473 B2 JP4377473 B2 JP 4377473B2
Authority
JP
Japan
Prior art keywords
www
page
activation
site
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07249199A
Other languages
English (en)
Other versions
JPH11328226A (ja
Inventor
エイ ヒューバーマン バーナード
イー ピトカウ ジェームス
エル ピロリ ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH11328226A publication Critical patent/JPH11328226A/ja
Application granted granted Critical
Publication of JP4377473B2 publication Critical patent/JP4377473B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はリンク付けされた文書の集合体の使用分析の分野に関し、特にリンク付けされた文書の集合体における文書へのアクセスパターンの分析に関する。
【0002】
【従来の技術】
例えばWWW(World Wide Web)に見られるような、増大し続ける電子情報の宇宙は、人々の関心(実際には固定的で限られているが)を引こうと競い合っている。消費者と情報提供者は共に、どのような種類の情報が利用可能であるか、それがどれほど求められているか、そしてその内容や使用が時間を経てどのように変化するかを知りたがっている。
【0003】
リンク付けされた文書の極めて膨大な集合体に意味付けを行ない、またこのような環境下で専門的な支援無しに情報を渉猟することは難しい。リンク付けされた文書の集合体は、ハイパーテキスト・リンクを用いて互いに関連付けられていることが多い。リンク付けされたハイパーテキストの基本構造はハイパーテキスト・リンクに沿って一つの文書から別の文書へとブラウズするプロセスを促進するよう設計されているが、残念なことにハイパーテキストの集合体が非常に大きく、異なる種類が混在している場合、ハイパーテキスト・リンクは非常に遅くて非効率的である。このような状況下で二種類の支援法が進展した。第一のものは分類システムのある形式に従って情報を抽出し、クラスタリングする構造またはツールである。そのような例としてライブラリカードカタログや“Yahoo!Web”サイト(URL http://www.yahoo.com)がある。第二のものは、ユーザーニーズに関連する情報を予測し、それに応じて情報の表示順序を決めようとするシステムである。“Lycos”(URL:http://www.lycos.com)等のサーチ・エンジンもそのような例に含まれるであろう。ユーザーによる必要情報の指定を単語や語句の形で取り込み、ユーザーニーズに関連があると予測される文書のリストをランク付けして返す。
【0004】
WWW上で情報を捜す手助けをするもう一つのシステムが、“Alexa Internet Web”サイト(URL:http://www.alexa.com)で提供される“Recommend(リコメンド)”機能である。“Recommend”機能は、ユーザーが現在見ているWWWページに基づいて検索したり、見たがるかも知れない関連WWWページのリストを提供する。
【0005】
情報入手を容易にする一つの方法としてWWWサイトの特定ソースページに関連するWWWページの予測を用いればよい、とされてきた。このような予測技術の一つがP・Pirolli、J.PitkowおよびR.Raoにより、Conference on Human Factors in Computing Systems(CHI96)、カナダ、ブリティッシュコロンビア州バンクーバー、1996年4月号に“Silk from Sow’s Ear:Extracting Usable Structures from the Web”と題された出版物の中で述べられている。その中で“活性化伝播(spreading activation)”技術が説明されている。活性化伝播技術は、WWWページの間の使用、ページ内容、およびハイパーテキスト関連表わすグラフネットワーク中のノード(節)としてのWWWページの表現に基づいている。概念的には、WWWページ(すなわち注目ポイント)の開始集合を表わすノードにおいて1個以上のグラフネットワークに活性が注入され、そして活性はアーク(弧)強度(アークの伝送容量であるとも見なすことができる)によって調整された流量でグラフ構造のアークを通って流れる。ノード活性化の漸近的パターンは、WWWページがWWWページの開始集合にどの程度関連するかを予測するものと定義される。最高に活性化されたノード、あるいは設定されたある基準値を超えるノードを選択することにより、予測される関連度合いに基づいて、WWWページが集められ、かつ/またはランク付けされる。
【0006】
【発明が解決しようとする課題】
上述のグラフネットワークは、獲得された情報、すなわちWWWサイトの使用、内容(コンテンツ)やハイパーテキストなどの情報に基づいている点に注意すべきである。このように獲得された情報、特に使用情報は時として取得することが難しい。
【0007】
本発明は、リンク付けされた文書の集合体の使用情報を取得するための技術を提供するためのものである。
【0008】
【課題を解決するための手段】
リンク付けされた文書の集合体における文書アクセスの頻度を予測するための方法および装置を開示する。特に、本発明は、ユーザーがリンク付けされた文書の集合体をブラウズしている間に文書にアクセスする確率を示すモデルを具体化する。本発明はWWW(World wide Web)上で実現され、WWWのユーザーに何らかの実用的な利益を提供するであろう。例えば、本発明は1個以上の注目ページの集合に関連のあるページを識別するために、あるいはリンク付けされた文書の集合体の中で文書がアクセスされるであろう回数を予測するために用いることができる。さらに、本発明は単独で、あるいは組み合わせて、WWWサイトを設計または再設計するための情報を生成するのに用いることができる。
【0009】
本発明は、リンク付けされた文書の集合体の中でトランザクション的な振る舞いをシミュレートするために活性化伝播(spreading activation)技術を利用する。本発明で具体化された活性化伝播技術は、P・Pirolli、J.PitkowおよびR.Raoにより、Conference on Human Factors in Computing Systems(CHI96)、カナダ、ブリティッシュコロンビア州バンクーバー、1996年4月号に“Silk from Sow’s Ear:Extracting Usable Structures from the Web”と題された出版物の中で述べられたとおりである。
【0010】
活性化の伝播において、文書の集合体はマトリクスによりネットワークとして表現される。活性化伝播技術における極めて重要な分析的要素として、ネットワークを通して活性が広がる際の減衰がある。減衰とは、活性が1個のノードから他のリンク付けされたノードへ広がる際に失われる量である。本発明において、活性の減衰を調整する値を生成するために“サーフィンの法則(the law of surfing)”が経験的データに適用される。“サーフィンの法則”はユーザーが次の文書に渡り歩く確率を示すことにより、文書の集合体中におけるユーザーの渡り歩き(すなわちネットサーフィン)行動のモデルを提供する。
【0011】
本発明の方法は、コンピュータを用いたシステム上で実行するためのソフトウェアプログラムとして実装されるのが好ましく、一般に、文書集合体の経験的データを収集し、初期活性化パターンを初期化し、ページ対ページ遷移マトリクスを初期化し、サーフィンの法則と集められた経験的データを用いて減衰関数を生成し、初期活性化パターンに基づいてネットワーク上で活性を伝播し、そして測定された活性化レベルに基づいてページ使用情報を収集するステップから構成される。
【0012】
【発明の実施の形態】
リンク付けされた文書の集合体中の文書アクセスを予測するための方法およびシステムを開示する。このようなシステムから得られた情報はユーザーが集合体をブラウズしたり、集合体を再編成したり、あるいは集合体の視覚化イメージを生成するのを支援するために利用されよう。本発明は1個以上の注目文書に対して関連のある文書を識別することを前提とする。本出願の文脈において、最も関連があるのは、その情報が注目文書を見ている者にとって関心がある可能性が高く、WWWサイト上での使用の経験的情報に基づいていることを示すことである。この情報に基づいて、種々の種類のツールが構築できる。例えば、望ましい使用パターンに適合すべくWWWサイトを再設計するための支援ツールや、現在見られている文書に「関連する」文書を関連付けるブラウズツール、および特定のWWWページが特定の時間枠内で得る「ヒット」すなわちアクセスの数を予測するツール等である。
【0013】
本発明の現在の好適実施例は、WWW(World Wide Web)として知られているインターネットの一部に存在するリンク付けされた文書の集合体(すなわちWWWページ)を分析するために実装されている。WWWはリンク付けされた文書を保管し、それにアクセスするために使われるインターネットの一部である。WWWページは、他のページへの相対または絶対リンクと、マルチメディアコンテンツを備える。WWWサイトは、会社、教育機関のようにWWWの上に存在するエンティティーに付随する関連WWWページの集合体である。WWWサイトを“サーフィンする”とは、種々のWWWページ間のリンクを使ってWWWサイトをくまなく渡り歩いているユーザーの行動を記述するために使われる用語である。
【0014】
この記述で、WWWページという用語は、リンク付けされた文書のインスタンスであり、これら「WWWページ」と「リンク付けされた文書」という二つの用語は相互に交換可能に使われる。さらに、本発明はWWWの使用に限定されておらず、文書、イメージ、ビデオ、音声等の文書を含む、リンク付けされたエンティティーにアクセスを許す任意のシステムにおいても利用され得ることに注意すべきである。
【0015】
WWWページの集合体は、個々のWWWページに含まれるリンクによって定義されるトポロジーを有することが観察される。リンクとは、別のWWWページを参照し、そして通常はポイント・アンド・クリック操作で照会できるWWWページ上のインジケータである。リンクは他のWWWページのアドレス、すなわちURL(Uniform Resource Locator)を指定する。WWWでURLは一般にHTTP(Hyper Text Transport Protocol)を使って指定される。
【0016】
図1はWWWページの基礎構造を示すブロック図である。当分野において通常の熟練度を有する者には公知のように、そのようなWWWページは通常HTML(Hyper Text Mark-up Language)等のマークアップ言語で特定され、またWWWブラウザによって表示できる。WWWブラウザは、ユーザーにWWW上に存在する文書を渡り歩く(すなわち、WWWをサーフィンする)ことを可能にするツールである。ブラウザと結び付いた他のレンダリング手段により文書の音声部分を聞いたり、あるいは文書のイメージ部分を見ることができる。商業的に入手可能なWWWブラウザの例としてネットスケープ・コミュニケーションズ(Netscape Communications)社から入手可能なネットスケープ・ナビゲータ(“Netscape Navigator”:登録商標)と、マイクロソフト(Microsoft)社から入手可能なインターネット・エクスプローラ(“Internet Explorer”:登録商標)がある。
【0017】
WWWを渡り歩くことすなわちサーフィンは、リンクの選択を示し、次にリンクによって示されるWWWページをブラウザがロードして表示するコマンドを呼び出すことによって、通常実現される。前述のブラウザにおいて、マウスあるいはトラックボール等のカーソル制御装置を使って望みのリンクを指し示し、選択を示すために所定のスイッチを押下することによって、これが実現される。この操作は、一般に「ポイント・アンド・クリック」操作、あるいはリンクの「クリック」と呼ばれる。
【0018】
いずれにせよ、WWWページ101にはテキスト内容部分102とリンク103、104、105がある。テキスト内容部分102は単に文書の標準的なテキストである。リンク103〜105は表示されたページにテキスト(例えばリンク103,104)あるいはイメージ(例えばリンク105)として表現される。図1に示すように、リンクがテキストとして表現される場合、普通のテキストと視覚的に区別できる。図1においてリンク103と104は下線を引かれている。
【0019】
図2のフローチャートは本実施形態の一般的なステップを記述する。最初に、ステップ201で文書集合体に関連する経験的データが集められる。経験的データは、大抵は特定の文書集合体の使用レコード(例えばWWWサイト使用レコードから生じた)上に存在するであろう。次にステップ202で初期活性化パターンN(O)が初期化される。初期活性化パターンは、一人以上のユーザーが初期の段階で実際に関心を持つか、又は関心を持つと仮定(あるいは予測)される情報に対応しているWWWページの注目集合を示す。これはそのWWWサイトの各ページから見始めるユーザー数の予想値として表現されるのが好ましい。
【0020】
次に、ステップ203においてページからページへの遷移Sのマトリクスが初期化される。これは使用ベースのマトリクスであることが好ましい。マトリクスのエントリは、あるページを見ているユーザーが別のリンク付けされたページに行く割合を示す。
【0021】
次に、ステップ204において、サーフィンの法則を取り入れた確率関数あるいは確率ベクトルが初期化される。サーフィンの法則は、文書集合体の使用に関する生データの観察に基づいている。一般的にサーフィンの法則は、(L−1)回クリックを行い、それからもう一度L回目のクリックをした人々(すなわち、L−1クリックの後に去らなかった人々)の比率を表示する。
【0022】
次に、ステップ205において適当な活性化伝播技術を用いて活性化の伝播が行われる。活性化の伝播は、これまでに生成された初期活性化マトリクス、遷移マトリクスおよび(ベクトルの)確率関数を利用する。最後に、ステップ206において、すべてのノード(すなわちWWWページ)にわたって活性化が安定パターンに落ち着いた時点で、望ましい情報が抽出される。この情報はWWWページの初期注目集合に対する文書の予測アクセス頻度を与える。
【0023】
各ステップついて、以下により詳細に述べる。
【0024】
WWW回りの使用記録やアクセスログから、あるいは文書集合体中のWWWページやWWWサイトを直接渡り歩くことにより、経験的生データが文書集合体やWWWサイトのために集められる。本実施形態を検証するために用いられた生データは、ゼロックス(Xerox)社のWWWサイトのシステム管理者、および大規模なオンライン・サービスプロバイダのWWWサイトの管理者から得た。このような生データを集めるために「エージェント」が使われてもよい。しかし、上述のエージェントが基本特徴ベクトルの生データ(基礎データ)を得るための唯一の可能な方法ではないことに注意されたい。インターネット・サービスプロバイダがこのような生データを提供する能力を持ち、将来そのようにするかも知れないと予想される。
【0025】
本実施形態で用いる収集された経験的データは、特定の時間枠(例えば一日、週あるいは月)に及ぶであろう。しかし、実際に分析のために使われたデータは、関心のある特定の時間帯、例えば月曜日から金曜日の運用時間帯、に限定されるかもしれない。もし週末と週の中とにおける文書集合体のアクセスパターンの比較を予測することが望ましいならば、これは有用であろう。
【0026】
上述のように、初期活性化パターンは、一人以上のユーザーの実際の初期情報関心度、または仮定あるいは予測された初期情報関心度、に対応するWWWページの注目集合である。その成分が文書集合体、すなわちWWWサイトの各ページからスタートするユーザー数の予想値(すなわち、各ページごとに、そのページをスタートページとするユーザの予想数)を示すマトリクスとして表現されるのが好ましい。
【0027】
本実施形態が用いられるツールのタイプに依存して、初期活性化パターンを変えてもよい。例えば、もし特定のクラスのページが何度アクセスされるかに興味があるなら、初期活性化マトリクスはそれらのページ(例えば、それらの特定のページを表現するマトリクスにのみ成分を持つ)に焦点を合わせるであろう。
【0028】
ページからページへの遷移マトリクスは、経験的データに基づいて文書集合体におけるユーザーの実際の渡り歩き方を表す。つまり、それは使用に基礎を置くネットワークとしての文書集合体の表現である。このような使用に基礎を置くネットワークの生成については、アメリカ合衆国にて出願中の出願番号08/831,807号の出願(本出願人が譲渡を受けている)に記述されている。
【0029】
異なる複数のユーザーコミュニティを用いた大規模な経験的研究を通して、WWWユーザーのサーフィンパターンにいくつかの強い規則性が見いだされた。これらの規則性は以下で導かれるサーフィンの法則によって説明することができ、あるWWWサイトの中でユーザーが訪問するページの数の確率分布を決定する。活性化伝播アルゴリズムとともに、この法則はあるWWWサイト上におけるユーザーのサーフィンパターンをシミュレートするために用いることができる。これはページヒットの正確な予測につながる。
【0030】
サーフィンの法則はユーザーがWWWサイト中で追跡するリンクLの数を示す確率P(L)により定義される。ユーザーが訪問する各ページには価値があり、次のページをクリックするのはそこに同様の価値があるだろうと仮定するからだ、との考えに基づいてP(L)が得られる。次のページの価値が確かではないため、それが確率的に前のページと関連があると仮定することができる。換言すれば、現在のページの価値は前のページの価値に確率項を加減したものである。かくして、ページ価値は次式で表わされる。
【0031】
【数1】
L = VL-1+εL (1)
ここに、値εLは独立で均等に分布するガウス確率変数である。ページ評価のシーケンスはランダム過程の結果であって、各ユーザーにとって異なることに注意されたい。この定式化において、サーフィンし続けることによる予想コストが、将来見い出される情報の割り引かれた予想価値よりも大きくなると感じるまで、人はサーフィンし続けるであろう。これは、「続行する」という選択肢を実行するの閾値が存在するということがよく知られている金融経済学で、現実の選択であると考えられている。たとえ現在のページの価値が否定的であっても、高い価値を持つページの集合体がまだ見い出されるかもしれないため、進むことに意味が有り得ることに注意されたい。しかしながら、価値が十分に否定的であるなら、もう継続するリスクを負う意味は無い。すなわち、VLがある閾値よりも下回るときにやめるのが最適である。
【0032】
ページ価値が最初に停止閾値に到達する前にユーザーが追跡するリンクの数が確率変数Lである。式(1)のランダム・ウォークについて、閾値への初到達時刻(first passage times)の確率分布は二変数逆ガウス分布によって漸近的に与えられることが分かっている。すなわち、
【数2】
Figure 0004377473
ただし、平均E[L]=μ、分散Var[L]=μ3/λである。
【0033】
WWW集合体のサーフィン経路の分布に適合する逆ガウス分布(IVGD:Inverse Gaussian Distribution)を評価することによって、λとμが推定される。IVGDフィッティングは、μおよびλパラメータを、モーメント法、最小二乗フィッティング、ベイズ共役優先等、公知の標準的統計手法を用いて推定することにより行なわれる。現状での好適な例では、モーメント法を用いている。パラメータは、ある深さ(すなわちクリック回数)でサーフィンする人数をプロットし、次に分布とパラメータを導くために式(2)あるいは式(4)を用いて得られた経験的データから得られる。
【0034】
サーフィンの法則に特徴的な逆ガウス分布の例を図3に示す。この分布は、ユーザーのサーフィンパターンの文脈で強調する価値のある、二つの特徴を持っている。第一に、非常に長い尾部を持っており、それは同等の平均と分散を持つ標準的な分布の尾部よりはるかに長く伸びている。このことは、標準的な分布によって記述されたならばありそうもない事象についての有限確率を含んでいる。従って、サイトにおいて計算されたユーザークリックの平均数からの大きい偏差が観察されよう。第二に、分布関数の非対称性のため、ユーザーの典型的な行動は、彼らの平均的行動と同じではないであろう。このように、最頻値が平均値より小さいため、サーフィンされている典型的な深さを過大評価するので、クリックの平均数について入手可能なデータについて注意が必要である。
【0035】
式(2)がユーザーのサーフィンパターンをうまく記述することがわかったので、それが活性化の伝播と関連して、電子商取引きにおいて興味ある数値である、WWWサイトの各ページのヒット数をどのように予測することができるかが分かる。活性化の伝播は、グラフの連結ノードの間に数値(あるいは活性化レベル)を伝播するための技術のクラス(分類)に関連する。それらの技術の応用は、人間の記憶モデルや意味論から情報検索までにわたる。WWWとの関連においてノードはページに、アークはハイパーリンクに対応し、それによって活性化伝播はWWWサイトを通るユーザーの流れをシミュレートする。続いて活性化の伝播について詳細に説明する。
【0036】
各々がi=1、2、...、n、とインデックスが付与され、ハイパーリンクエッジで結ばれてグラフを形成するn個のWWWページの集合体を考える。i番目とj番目のノードの間に重みSj,iを割り当てることにより、ユーザーのサーフィン行動をシミュレートすることができる。この重みSj,iは、Sj,iのjに関する総和が1ならば、ノードiにいるユーザのうちノードjに進む者の割合と解釈することができる。ここでの総和はノードiにエッジでつながるすべてのノードについて求める。fLを、(L−1)個のリンクをたどってサーフィンし終えて深さLまでサーフィンを続けようとするユーザーの割合とする。活性化値Ni,Lを、L回のクリックを通してサーフィンした後でノードiにいるユーザーの数と定義すると次式が得られる。
【0037】
【数3】
Figure 0004377473
式(3)は、好適な実施例で用いられる活性化伝播の定義であることに注意されたい。いずれにせよ、割合fLはユーザーのグループにおいて、L個以上のリンクをサーフィンするユーザーの数と、L−1個以上のリンクをサーフィンするユーザーの数との比と等しいことに注意して、式(2)から見いだされる。これは逆ガウス分布のCDFであるF(L,μ,λ)を用いて、次式で与えられる。
【0038】
【数4】
Figure 0004377473
この定義では、式(4)は初期状態Ni,1から反復される。大部分のサーファーが停止した後では、各ページについてのヒットの予測総数は、各ページのすべての反復についての単純合計である。
【0039】
活性化の伝播は、ある関心の的に関連すると予測される知識を識別するプロセスであると特徴づけられる。P・Pirolli、J.PitkowおよびR.Raoによる、Conference on Human Factors in Computing Systems(CHI96)、カナダ、ブリティッシュコロンビア州バンクーバー、1996年4月号の“Silk from Sow’s Ear:Extracting Usable Structures from the Web”と題された出版物の中で述べられているように、活性化の伝播は、ソースページの特定の集合に関連のあるページに関する予測を行なうために用いることができる技術としてWWWに適用されてきた。サーフィンの法則と合わせて用いると、WWWサイトの特定ページへのヒット数の予測のように、別の興味深い情報群が得られる。
【0040】
減衰関数は、本実施形態で用いられる活性化の伝播の極めて重要な分析要素である。上で述べたように、サーフィンの法則は、ネットワークを介して活性を弱めるための減衰値を生成するために用いられる。減衰関数の性質に従えば、活性化値は、入力された注目文書(または入力された注目文書中のページ群のうち、あるページが必要とされるであろう確率)との関連度合いの予測値であると仮定される。
【0041】
これまで述べてきた手法は、多重入力ソースの結果として生じる活性化パターンは、各ソースから個別に作り出した活性化パターンの加法的組み合わせである(すなわち多重の重み付きソースは、個別のソースの単なる重み付き加算である)、という性質を持つ。この性質を用いて、各グラフと組み合わせた各ソースから生ずる活性化パターンを予め計算することができる。すべての複雑なパターンは、単純なベクトル加算によりこれらから導くことができる。また前述の出願番号08/831,807の出願に記述されているように、WWWサイトで典型的なWWW作製者を評価したり、あるいはホームページ訪問者の興味を予測するなどの多くの興味深い問題に答えるために用いることができる。
【0042】
先に概説したように、ネットワークは、WWWサイトを通したユーザーのサーフィンパターンによって反映される、WWWページ間の関連の強さを表すために用いられる。ネットワークすなわちグラフは、活性化伝播の方程式のマトリクスにより表現される。すなわち、マトリクスの各行はWWWページを表すネットワークノードに対応し、同様に各列はWWWページを表すネットワークノードに対応する。1、2、...、N番目のWWWページに索引を付けると、グラフネットワークを表す各マトリクスについてi=I、2、...N個の列とj=I、2、...N個の行があることになる。
【0043】
マトリクスの第i列と第j行の各成分は、第iページと第jページの間の結合強度(あるいは同様に、潜在的な活性の流量すなわち容量)を表す。これらの成分の意味は、活性化が伝播されているネットワークの種類に依存して変化する。現在の好適な実施例において、成分の値はページ間遷移の実測値を表す。
【0044】
図4〜図5はネットワークおよび対応するマトリクス表現を示す。図4において、対応するリンクが存在するノード間だけにサーフィンが起こり得ることに注意されたい。図4にはそのようなリンクとサーフィン経路の強度の両方が示されている。次に図5において、サーフィンネットワークのマトリクス表現について、第i列、第j行のエントリである整数値の強度s≧0は、ページiからページjへサーフィンしているユーザーの確率を示す。
【0045】
ネットワークにおいて活性化を伝播して、関連ページを見い出すことを図6を参照しつつ概念的に説明する。図6を参照するに、活性601は注目WWWページのある開始集合を表すノードにおいて1個以上のグラフネットワーク602に送り込まれる。活性はグラフ構造のアークを通ってある流量で流れる。その流量は、アーク強度(アークの伝送容量とも考えられる)により調整されて、サーフィンの法則で与えられる確率値により弱められたものである。複数のノードにわたる活性化の漸近的パターンは、活性化されたネットワーク603においてノード群に含まれるバー604が示すように、注目WWWページの開始集合に関係のある他のWWWページのヒット回数を定める。
【0046】
以下は、異なる種類の情報を抽出するために本実施形態の手法を用いた場合のいろいろな例である。
【0047】
現在、最先端のWWWサイト・ログファイル分析ツールによりWWWサイトにおけるトラフィックの事後分析が可能である。ログファイルは、例えばWWWサイト内外の、あるいはページ内のリンクなどの、行為の記録である。サーフィンの法則から導かれた逆ガウス分布によりWWWサイトにおけるトラフィックの予測モデルの構築が可能になる。この実施例について、WWWサイトのログファイルを分析し、以下のデータを計算した。
【0048】
*あるWWWページを経由して、WWWサイトに入る回数(すなわち、ユーザーはメインページすなわちホームページ(例えば、www.xerox.com)からではなく、ユーザーのブックマークが指す他のページや、検索エンジンの結果等からWWWサイトに入ることが極めて多い。)を求める。このステップの結果、WWWサイト中の全ページについて頻度ベクトルが得られる。
【0049】
*人々がそのWWWサイトでたどる経路を決定する。
【0050】
*各ユーザーの経路に基づいて状態遷移マトリクスを生成する。
【0051】
*すべてのユーザーがそのWWWサイトで行なうクリック回数についての逆ガウス分布を仮定して平均と標準偏差を計算する。
【0052】
*エントリポイントを初期活性化マトリクスとして用い、結合強度(すなわちアーク強度)を状態遷移マトリクスとして用い、サイトの平均と標準偏差とを伴う逆ガウス分布を減衰パラメータとして用いて、活性化伝播アルゴリズムを実行する。活性化伝播アルゴリズムの各繰り返しの間、各ページにおける活性を合計することにより、各ページのヒットカウント(すなわち頻度)の予測値を表にする。
【0053】
関連ページの予測は動的に、または事前に行なわれ、ブラウジングの支援に用いることができる。例えば、ユーザーが特定のページから次にどこへ行くべきか決心がつかない時、関連ページのリストが示されるようにしてもよい。特定のページあるいはページ集合に関連するページの予測は以下により実現される。
【0054】
*所望のページ集合を示すために初期活性化マトリクスを初期化する。
【0055】
*WWWサイトの使用情報に基づいて遷移マトリクスを初期化する。
【0056】
*すべてのユーザーがWWWサイトで行なうクリック回数に関して逆ガウス分布を仮定して平均と標準偏差を計算する。
【0057】
*エントリポイントを初期活性化マトリクスとして用い、結合強度(すなわちアーク強度)を状態遷移マトリクスとして用い、サイトの平均と標準偏差を伴う逆ガウス分布を減衰パラメータとして用いて、活性化伝播アルゴリズムを実行する。あらかじめ定めた閾値を超える活性化値を持つページが、関連ページ群のリストとして提供される。
【0058】
本実施形態は、コンフィギュレーションに基づくWWWのトラフィック予測を提供することにより、WWW設計を容易にする。WWW設計すなわちネットワークを変えることにより、異なる使用および活性化パターンが得られよう。本実施形態は、WWWサイトのページの使用や活性化パターンの変化を予測するために用いることができよう。WWW設計は以下により達成されるであろう。
【0059】
*WWWサイトがどのように再設計されるかに基づいて初期活性化マトリクスを初期化する。このことは通常、特定のWWWページが特定の場所(例えば、そこへ関連付けられる確率がより高いポイント)において提示されるように、WWWサイトで種々のページをリンク付けし直すことである。
【0060】
*WWWサイトの使用情報に基づいて遷移マトリクスを初期化する。
【0061】
*すべてのユーザーがWWWサイトで行なうクリック回数について逆ガウス分布を仮定して平均と標準偏差を計算する。
【0062】
*エントリポイントを初期活性化マトリクスとして用い、結合強度(アーク強度)を状態遷移マトリクスとして用い、サイトの平均と標準偏差を伴う逆ガウス分布を減衰パラメータとして用いて、活性化伝播アルゴリズムを実行する。WWWサイトの変更が望ましい効果(例えばリンク付けし直したWWWページがより多くのヒットを受け取るという予測がある)を持つかどうか決定する。
【0063】
*予測された結果が満足すべきものでないなら、WWWサイトのトポグラフィー(構造パターン)を変更して活性化伝播を繰り返す。
【0064】
本発明の好適な実施形態が実装され得るコンピュータを用いたシステムについて図6を参照しながら説明する。コンピュータを用いたシステムおよび付随する動作命令(例えばソフトウェア)は、本実施形態の実装に用いる回路構成を具体化する。図7では、コンピュータを用いたシステムは、バス701を介して接続された複数の要素から構成されている。バス701は、バス(例えばプロセッサバス、ローカルバスおよび入/出力バス)の階層と同様に、複数のパラレルバス(例えばアドレス、データおよび状態バス)から構成されていてよい。いずれにせよ、コンピュータシステムはさらに、内部メモリ703(内部メモリ703は典型的には、RAMとROMの組み合わせであることに注意されたい)からバス701経由で与えられた命令を実行するためのプロセッサ702を含む。プロセッサ702は、WWWサイトから生データを抽出し、生データを望ましい特徴ベクトルやトポロジー、使用パスやテキスト類似性マトリクスに変換し、分類して、活性化を伝播するのを支援する種々の動作を行うために用いられる。このような動作実行のための命令が内部のメモリ703から読み出される。プロセッサ702が行うこのような動作は、図2に記述される処理ステップを含む。この動作は通常、よく知られているプログラミング技術を利用した適当なプログラミング言語でコーディングされた命令の形で提供される。プロセッサ702と内部メモリ703は別々のコンポーネントであっても、またASICチップのような一体化されたデバイスであってよい。
【0065】
バス701にはまた、入力のためのキーボード704、データを保存するための外部記憶装置705、カーソルを操作するためのマウス等のカーソル制御装置706、視覚的出力を表示するためのディスプレイ707、およびネットワーク接続708が結合されている。キーボード704は通常、標準のQWERTYキーボードであろうが、同じく電話のキーパッドのようなものであってもよい。外部記憶装置705は固定式の、あるいは着脱可能な磁気ディスクドライブ、または光ディスクドライブなどである。例えばマウスやトラックボールのようなカーソル制御装置706には、通常ある特定機能の実行がプログラムできるボタンやスイッチが付いている。ネットワーク接続708は、ネットワークに接続するための手段、例えばローカルエリアネットワーク(LAN)カードやモデムカードとその適切なソフトウェアを備える。最終的に接続されるネットワークはインターネットであるが、これはプロキシサーバー、または仲介ネットワーク、あるいはAOL(America On-Line)、Prodigy(登録商標)、あるいはCompuServe(登録商標)のようなダイアルアップサービスを経由することになろう。
【図面の簡単な説明】
【図1】 WWWページの基礎構造を示すブロック図である。
【図2】 文書アクセスを予測するための基本ステップを示すフローチャートである。
【図3】 ユーザーの渡り歩きパターンを示す逆ガウス分布の説明図である。
【図4】 活性化伝播に利用できるネットワークの表現を示す説明図である。
【図5】 活性化伝播に利用できるネットワークの表現を示す説明図である。
【図6】 ソースページに関連のあるページを見い出すための活性化伝播とその結果を示す説明図である。
【図7】 実施の形態を実装するために利用されるであろうコンピュータシステムのブロック図である。
【符号の説明】
101 WWWページ、102 テキスト内容部分、103,104,105リンク、701 バス、702 プロセッサ、703 内部メモリ、704 キーボード、705 外部記憶装置、706 カーソル制御装置、707 ディスプレイ、708 ネットワーク接続。

Claims (1)

  1. WWWサイト内のWWWページi(iは、前記WWWサイト内の各WWWページの識別番号)ごとに、当該WWWページiから当該WWWサイトの閲覧をスタートするユーザーの予想数を表す初期活性化情報N i,1 を記憶する第1の記憶手段と、
    前記WWWサイトの使用レコードから求められた、前記WWWサイト内でのWWWページからWWWページへの遷移を表す遷移マトリクスを記憶する第2の記憶手段であって、前記遷移マトリクスの各エントリS i,k (i,kは前記WWWサイト内の各WWWページの識別番号)は、WWWページkを閲覧しているユーザーが当該WWWページkから別のWWWページiに移る割合を表すことを特徴とする第2の記憶手段と、
    前記WWWサイトの使用レコードから求められた、前記WWWサイト内でユーザーが辿るリンクの数Lの確率分布P(L)を記憶する第3の記憶手段と、
    前記第1の記憶手段に記憶された前記初期活性化情報N i,1 、前記第2の記憶手段に記憶された前記遷移マトリクスの各エントリS i,k 、及び前記第3の記憶手段に記憶された確率分布P(L)を用いて活性化伝播処理を実行する活性化伝播手段であって、前記活性化伝播処理として、
    前記第3の記憶手段に記憶された確率分布P(L)に、
    Figure 0004377473
    で表される逆ガウス分布をフィッティングすることによりλ及びμを求め、
    活性化値N i,L の初期値として前記初期活性化情報N i,1 を用い、S i,k として前記遷移マトリクスを用いて、
    Figure 0004377473
    で表される演算を、L=1からLを1ずつ増やながら反復実行し、
    この反復実行の中で、前記f L は逆ガウス分布のCDFである関数Fと前記λ及び前記μを用いて
    Figure 0004377473
    を計算することにより求める、ことを特徴とする活性化伝播手段と、
    前記活性化伝搬手段により求められた各反復LにおけるN i,L をWWWページiごとに合計することで、WWWページiのアクセス数の予測値を計算するアクセス数計算手段と、
    を備えるシステム。
JP07249199A 1998-04-01 1999-03-17 リンク付けされた文書の集合体における文書アクセスの予測システム Expired - Fee Related JP4377473B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/053,616 1998-04-01
US09/053,616 US6115718A (en) 1998-04-01 1998-04-01 Method and apparatus for predicting document access in a collection of linked documents featuring link proprabilities and spreading activation

Publications (2)

Publication Number Publication Date
JPH11328226A JPH11328226A (ja) 1999-11-30
JP4377473B2 true JP4377473B2 (ja) 2009-12-02

Family

ID=21985462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07249199A Expired - Fee Related JP4377473B2 (ja) 1998-04-01 1999-03-17 リンク付けされた文書の集合体における文書アクセスの予測システム

Country Status (3)

Country Link
US (1) US6115718A (ja)
EP (1) EP0947936A3 (ja)
JP (1) JP4377473B2 (ja)

Families Citing this family (133)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7954056B2 (en) * 1997-12-22 2011-05-31 Ricoh Company, Ltd. Television-based visualization and navigation interface
US7596755B2 (en) * 1997-12-22 2009-09-29 Ricoh Company, Ltd. Multimedia visualization and integration environment
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US20080034113A1 (en) 1998-05-04 2008-02-07 Frank Montero Method of contextually determining missing components of an incomplete uniform resource locator
US7783468B2 (en) * 1998-05-13 2010-08-24 Accretive Technologies, Inc. Automated system and method for service and cost architecture modeling of enterprise systems
US6311144B1 (en) 1998-05-13 2001-10-30 Nabil A. Abu El Ata Method and apparatus for designing and analyzing information systems using multi-layer mathematical models
US7031901B2 (en) * 1998-05-13 2006-04-18 Abu El Ata Nabil A System and method for improving predictive modeling of an information system
US20020049573A1 (en) * 1998-05-13 2002-04-25 El Ata Nabil A. Abu Automated system and method for designing model based architectures of information systems
US7389211B2 (en) * 1998-05-13 2008-06-17 Abu El Ata Nabil A System and method of predictive modeling for managing decisions for business enterprises
US6990437B1 (en) * 1999-07-02 2006-01-24 Abu El Ata Nabil A Systems and method for determining performance metrics for constructing information systems
US6665837B1 (en) * 1998-08-10 2003-12-16 Overture Services, Inc. Method for identifying related pages in a hyperlinked database
IL126373A (en) * 1998-09-27 2003-06-24 Haim Zvi Melman Apparatus and method for search and retrieval of documents
US6263361B1 (en) * 1998-11-19 2001-07-17 Ncr Corporation Method for calculating capacity measurements for an internet web site
US6631496B1 (en) * 1999-03-22 2003-10-07 Nec Corporation System for personalizing, organizing and managing web information
US6269361B1 (en) * 1999-05-28 2001-07-31 Goto.Com System and method for influencing a position on a search result list generated by a computer network search engine
US6526398B2 (en) * 1999-05-28 2003-02-25 Ricoh Co., Ltd. Generating labels indicating gaps in retrieval of electronic documents
US6990628B1 (en) * 1999-06-14 2006-01-24 Yahoo! Inc. Method and apparatus for measuring similarity among electronic documents
US6499034B1 (en) * 1999-10-07 2002-12-24 Xerox Corporation Bristlelines: a visualization for discovery relationships between sorted web documents and their usage data
US6976032B1 (en) * 1999-11-17 2005-12-13 Ricoh Company, Ltd. Networked peripheral for visitor greeting, identification, biographical lookup and tracking
US7653925B2 (en) * 1999-11-17 2010-01-26 Ricoh Company, Ltd. Techniques for receiving information during multimedia presentations and communicating the information
US7299405B1 (en) 2000-03-08 2007-11-20 Ricoh Company, Ltd. Method and system for information management to facilitate the exchange of ideas during a collaborative effort
EP1252735B1 (en) * 2000-01-12 2011-08-24 Jupiter Media Metrix, Inc. System and method for estimating prevalence of digital content on the world-wide-web
US6801945B2 (en) * 2000-02-04 2004-10-05 Yahoo ! Inc. Systems and methods for predicting traffic on internet sites
US7974875B1 (en) * 2000-03-21 2011-07-05 Aol Inc. System and method for using voice over a telephone to access, process, and carry out transactions over the internet
US7017110B1 (en) * 2000-03-31 2006-03-21 Xerox Corporation System and method for inferring user information need in hypermedia linked document collection
US6671711B1 (en) 2000-03-31 2003-12-30 Xerox Corporation System and method for predicting web user flow by determining association strength of hypermedia links
US6549896B1 (en) * 2000-04-07 2003-04-15 Nec Usa, Inc. System and method employing random walks for mining web page associations and usage to optimize user-oriented web page refresh and pre-fetch scheduling
US6842748B1 (en) * 2000-04-14 2005-01-11 Rightnow Technologies, Inc. Usage based strength between related information in an information retrieval system
US6728695B1 (en) 2000-05-26 2004-04-27 Burning Glass Technologies, Llc Method and apparatus for making predictions about entities represented in documents
US6640218B1 (en) * 2000-06-02 2003-10-28 Lycos, Inc. Estimating the usefulness of an item in a collection of information
AU6831801A (en) * 2000-06-12 2001-12-24 Previsor Inc Computer-implemented system for human resources management
JP2002117206A (ja) * 2000-07-28 2002-04-19 Toshiba Corp Web視聴者分析方法、Web視聴者分析プログラム、記録媒体、Web視聴者分析システム
US7881920B2 (en) 2000-08-29 2011-02-01 Abu El Ata Nabil A Systemic enterprise management method and apparatus
US7253919B2 (en) 2000-11-30 2007-08-07 Ricoh Co., Ltd. Printer with embedded retrieval and publishing interface
US6928474B2 (en) * 2000-12-14 2005-08-09 Honeywell International, Inc. Using a probability associative matrix algorithm to modify web pages
US20020133614A1 (en) * 2001-02-01 2002-09-19 Samaradasa Weerahandi System and method for remotely estimating bandwidth between internet nodes
JP4191902B2 (ja) * 2001-02-28 2008-12-03 株式会社日立製作所 コンテンツ配信装置
US6907459B2 (en) * 2001-03-30 2005-06-14 Xerox Corporation Systems and methods for predicting usage of a web site using proximal cues
JP4489994B2 (ja) * 2001-05-11 2010-06-23 富士通株式会社 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体
US7003566B2 (en) * 2001-06-29 2006-02-21 International Business Machines Corporation Method and system for predictive directional data caching
US7117434B2 (en) * 2001-06-29 2006-10-03 International Business Machines Corporation Graphical web browsing interface for spatial data navigation and method of navigating data blocks
US20030004996A1 (en) * 2001-06-29 2003-01-02 International Business Machines Corporation Method and system for spatial information retrieval for hyperlinked documents
US7188141B2 (en) * 2001-06-29 2007-03-06 International Business Machines Corporation Method and system for collaborative web research
JP4283466B2 (ja) * 2001-10-12 2009-06-24 富士通株式会社 リンク関係に基づく文書整理方法
US6898596B2 (en) * 2001-10-23 2005-05-24 Therma-Wave, Inc. Evolution of library data sets
US6826572B2 (en) * 2001-11-13 2004-11-30 Overture Services, Inc. System and method allowing advertisers to manage search listings in a pay for placement search system using grouping
US7861169B2 (en) 2001-11-19 2010-12-28 Ricoh Co. Ltd. Multimedia print driver dialog interfaces
US8635531B2 (en) 2002-02-21 2014-01-21 Ricoh Company, Ltd. Techniques for displaying information stored in multiple multimedia documents
US7747655B2 (en) 2001-11-19 2010-06-29 Ricoh Co. Ltd. Printable representations for time-based media
US7495795B2 (en) 2002-02-21 2009-02-24 Ricoh Company, Ltd. Interface for printing multimedia information
US7424129B2 (en) 2001-11-19 2008-09-09 Ricoh Company, Ltd Printing system with embedded audio/video content recognition and processing
US7314994B2 (en) * 2001-11-19 2008-01-01 Ricoh Company, Ltd. Music processing printer
US7415670B2 (en) * 2001-11-19 2008-08-19 Ricoh Co., Ltd. Printer with audio/video localization
US7716207B2 (en) * 2002-02-26 2010-05-11 Odom Paul S Search engine methods and systems for displaying relevant topics
US7340466B2 (en) * 2002-02-26 2008-03-04 Kang Jo Mgmt. Limited Liability Company Topic identification and use thereof in information retrieval systems
US20060004732A1 (en) * 2002-02-26 2006-01-05 Odom Paul S Search engine methods and systems for generating relevant search results and advertisements
US7203899B2 (en) * 2002-04-12 2007-04-10 Xerox Corporation Systems and methods for assessing user success rates of accessing information in a collection of contents
US7130844B2 (en) * 2002-10-31 2006-10-31 International Business Machines Corporation System and method for examining, calculating the age of an document collection as a measure of time since creation, visualizing, identifying selectively reference those document collections representing current activity
US7103609B2 (en) * 2002-10-31 2006-09-05 International Business Machines Corporation System and method for analyzing usage patterns in information aggregates
US20040088322A1 (en) * 2002-10-31 2004-05-06 International Business Machines Corporation System and method for determining connections between information aggregates
US7249123B2 (en) * 2002-10-31 2007-07-24 International Business Machines Corporation System and method for building social networks based on activity around shared virtual objects
US7257569B2 (en) * 2002-10-31 2007-08-14 International Business Machines Corporation System and method for determining community overlap
US7080082B2 (en) * 2002-10-31 2006-07-18 International Business Machines Corporation System and method for finding the acceleration of an information aggregate
US7853594B2 (en) 2002-10-31 2010-12-14 International Business Machines Corporation System and method for determining founders of an information aggregate
US7065532B2 (en) * 2002-10-31 2006-06-20 International Business Machines Corporation System and method for evaluating information aggregates by visualizing associated categories
US7331038B1 (en) * 2003-07-02 2008-02-12 Amazon.Com, Inc. Predictive prefetching to improve parallelization of document generation subtasks
US7328201B2 (en) * 2003-07-18 2008-02-05 Cleverset, Inc. System and method of using synthetic variables to generate relational Bayesian network models of internet user behaviors
JP2005108230A (ja) 2003-09-25 2005-04-21 Ricoh Co Ltd オーディオ/ビデオコンテンツ認識・処理機能内蔵印刷システム
US8077341B2 (en) 2003-09-25 2011-12-13 Ricoh Co., Ltd. Printer with audio or video receiver, recorder, and real-time content-based processing logic
US7511846B2 (en) 2003-09-25 2009-03-31 Ricoh Co., Ltd. Printer having embedded functionality for printing time-based media
US7505163B2 (en) 2003-09-25 2009-03-17 Ricoh Co., Ltd. User interface for networked printer
US7528976B2 (en) 2003-09-25 2009-05-05 Ricoh Co., Ltd. Stand alone printer with hardware/software interfaces for sharing multimedia processing
US7440126B2 (en) 2003-09-25 2008-10-21 Ricoh Co., Ltd Printer with document-triggered processing
US7864352B2 (en) 2003-09-25 2011-01-04 Ricoh Co. Ltd. Printer with multimedia server
US7528977B2 (en) * 2003-09-25 2009-05-05 Ricoh Co., Ltd. Printer with hardware and software interfaces for peripheral devices
US7573593B2 (en) * 2003-09-25 2009-08-11 Ricoh Company, Ltd. Printer with hardware and software interfaces for media devices
US7570380B2 (en) 2003-09-25 2009-08-04 Ricoh Company, Ltd. Printer user interface
US7508535B2 (en) 2003-09-25 2009-03-24 Ricoh Co., Ltd. Stand alone multimedia printer with user interface for allocating processing
US7555441B2 (en) * 2003-10-10 2009-06-30 Kronos Talent Management Inc. Conceptualization of job candidate information
US20050080657A1 (en) * 2003-10-10 2005-04-14 Unicru, Inc. Matching job candidate information
WO2005048052A2 (en) * 2003-11-05 2005-05-26 Dipsie, Inc. Identifying cataloging and retrieving web pages using client-side scripting and web forms
US20050216474A1 (en) * 2003-11-05 2005-09-29 Jason Wiener Retrieving dynamically-generated and database-driven web pages using a search engine robot
US7689712B2 (en) 2003-11-26 2010-03-30 Ricoh Company, Ltd. Techniques for integrating note-taking and multimedia information
US7603615B2 (en) * 2004-03-30 2009-10-13 Ricoh Co., Ltd. Multimedia projector-printer
US8274666B2 (en) 2004-03-30 2012-09-25 Ricoh Co., Ltd. Projector/printer for displaying or printing of documents
US7707575B2 (en) 2004-09-20 2010-04-27 Hewlett-Packard Development Company, L.P. System and method for selecting a portfolio of resources in a heterogeneous data center
US20060064411A1 (en) * 2004-09-22 2006-03-23 William Gross Search engine using user intent
US8930400B2 (en) * 2004-11-22 2015-01-06 Hewlett-Packard Development Company, L. P. System and method for discovering knowledge communities
US7634430B2 (en) * 2004-12-06 2009-12-15 Hewlett-Packard Development Company, L.P. System and method for allocating resources in a distributed computational system using proportional share auctions
US7551312B1 (en) 2005-03-17 2009-06-23 Ricoh Co., Ltd. Annotable document printer
US8781977B1 (en) 2005-03-29 2014-07-15 Hewlett-Packard Development Company, L.P. System and method of pricing resources
US8805929B2 (en) 2005-06-20 2014-08-12 Ricoh Company, Ltd. Event-driven annotation techniques
US7996391B2 (en) 2005-06-20 2011-08-09 Google Inc. Systems and methods for providing search results
US7554576B2 (en) * 2005-06-20 2009-06-30 Ricoh Company, Ltd. Information capture and recording system for controlling capture devices
US7565489B2 (en) * 2005-07-01 2009-07-21 Microsoft Corporation Identifying relevant data to cache
US8160915B2 (en) * 2005-07-07 2012-04-17 Sermo, Inc. Method and apparatus for conducting an information brokering service
US7673019B2 (en) * 2005-11-04 2010-03-02 Palo Alto Research Center Incorporated System and method for determining a quantitative measure of qualitative usability of related Web pages
WO2007064639A2 (en) * 2005-11-29 2007-06-07 Scientigo, Inc. Methods and systems for providing personalized contextual search results
US7769805B1 (en) * 2006-03-31 2010-08-03 Spring Communications Company L.P. Mobile device catalog and caching and architecture
US7707162B2 (en) * 2007-01-08 2010-04-27 International Business Machines Corporation Method and apparatus for classifying multimedia artifacts using ontology selection and semantic classification
US7930303B2 (en) * 2007-04-30 2011-04-19 Microsoft Corporation Calculating global importance of documents based on global hitting times
US20080270398A1 (en) * 2007-04-30 2008-10-30 Landau Matthew J Product affinity engine and method
US20080313115A1 (en) * 2007-06-12 2008-12-18 Brian Galvin Behavioral Profiling Using a Behavioral WEB Graph and Use of the Behavioral WEB Graph in Prediction
US20090112668A1 (en) * 2007-10-31 2009-04-30 Abu El Ata Nabil A Dynamic service emulation of corporate performance
US10083420B2 (en) 2007-11-21 2018-09-25 Sermo, Inc Community moderated information
US8127235B2 (en) 2007-11-30 2012-02-28 International Business Machines Corporation Automatic increasing of capacity of a virtual space in a virtual world
US20090164919A1 (en) 2007-12-24 2009-06-25 Cary Lee Bates Generating data for managing encounters in a virtual world environment
US20090198559A1 (en) * 2008-02-06 2009-08-06 Disney Enterprises, Inc. Multi-resolutional forecasting system
US8234274B2 (en) * 2008-12-18 2012-07-31 Nec Laboratories America, Inc. Systems and methods for characterizing linked documents using a latent topic model
US8380866B2 (en) 2009-03-20 2013-02-19 Ricoh Company, Ltd. Techniques for facilitating annotations
JP2011091522A (ja) * 2009-10-21 2011-05-06 Fujifilm Corp ドキュメント画像生成サーバ及びプログラム、並びにドキュメント閲覧システム
US20110099164A1 (en) * 2009-10-23 2011-04-28 Haim Zvi Melman Apparatus and method for search and retrieval of documents and advertising targeting
US9205328B2 (en) 2010-02-18 2015-12-08 Activision Publishing, Inc. Videogame system and method that enables characters to earn virtual fans by completing secondary objectives
US9087307B2 (en) 2011-07-28 2015-07-21 Antonio Trias Long tail monetization procedure
US9081866B2 (en) 2011-09-23 2015-07-14 Oracle International Corporation Dynamic display of web page content based on a rules system
US9438480B2 (en) * 2014-03-24 2016-09-06 Ca, Inc. Generating a representation of the status of a data processing system based on empirical operations metrics and derived sentiment metrics
US10322351B2 (en) 2014-07-03 2019-06-18 Activision Publishing, Inc. Matchmaking system and method for multiplayer video games
US10118099B2 (en) 2014-12-16 2018-11-06 Activision Publishing, Inc. System and method for transparently styling non-player characters in a multiplayer video game
US10315113B2 (en) 2015-05-14 2019-06-11 Activision Publishing, Inc. System and method for simulating gameplay of nonplayer characters distributed across networked end user devices
US10471348B2 (en) 2015-07-24 2019-11-12 Activision Publishing, Inc. System and method for creating and sharing customized video game weapon configurations in multiplayer video games via one or more social networks
US10909209B2 (en) 2016-01-29 2021-02-02 Oracle International Corporation Dynamic insertion of content into webpages
JP6053249B1 (ja) * 2016-08-26 2016-12-27 株式会社シンメトリック Webページの閲覧回数を推定するための装置、プログラムおよび記録媒体
US10500498B2 (en) 2016-11-29 2019-12-10 Activision Publishing, Inc. System and method for optimizing virtual games
US10268536B2 (en) 2016-11-30 2019-04-23 Oracle International Corporation Secure debugging with an encrypted token
US10561945B2 (en) 2017-09-27 2020-02-18 Activision Publishing, Inc. Methods and systems for incentivizing team cooperation in multiplayer gaming environments
US11040286B2 (en) 2017-09-27 2021-06-22 Activision Publishing, Inc. Methods and systems for improved content generation in multiplayer gaming environments
US10974150B2 (en) 2017-09-27 2021-04-13 Activision Publishing, Inc. Methods and systems for improved content customization in multiplayer gaming environments
US10765948B2 (en) 2017-12-22 2020-09-08 Activision Publishing, Inc. Video game content aggregation, normalization, and publication systems and methods
US11679330B2 (en) 2018-12-18 2023-06-20 Activision Publishing, Inc. Systems and methods for generating improved non-player characters
US11097193B2 (en) 2019-09-11 2021-08-24 Activision Publishing, Inc. Methods and systems for increasing player engagement in multiplayer gaming environments
US11712627B2 (en) 2019-11-08 2023-08-01 Activision Publishing, Inc. System and method for providing conditional access to virtual gaming items
US11351459B2 (en) 2020-08-18 2022-06-07 Activision Publishing, Inc. Multiplayer video games with virtual characters having dynamically generated attribute profiles unconstrained by predefined discrete values
US11524234B2 (en) 2020-08-18 2022-12-13 Activision Publishing, Inc. Multiplayer video games with virtual characters having dynamically modified fields of view

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5305389A (en) * 1991-08-30 1994-04-19 Digital Equipment Corporation Predictive cache system
US5265065A (en) * 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5668988A (en) * 1995-09-08 1997-09-16 International Business Machines Corporation Method for mining path traversal patterns in a web environment by converting an original log sequence into a set of traversal sub-sequences
US5842199A (en) * 1996-10-18 1998-11-24 Regents Of The University Of Minnesota System, method and article of manufacture for using receiver operating curves to evaluate predictive utility
US5835905A (en) * 1997-04-09 1998-11-10 Xerox Corporation System for predicting documents relevant to focus documents by spreading activation through network representations of a linked collection of documents
US5878223A (en) * 1997-05-07 1999-03-02 International Business Machines Corporation System and method for predictive caching of information pages

Also Published As

Publication number Publication date
EP0947936A3 (en) 2001-12-12
EP0947936A2 (en) 1999-10-06
JPH11328226A (ja) 1999-11-30
US6115718A (en) 2000-09-05

Similar Documents

Publication Publication Date Title
JP4377473B2 (ja) リンク付けされた文書の集合体における文書アクセスの予測システム
US6272507B1 (en) System for ranking search results from a collection of documents using spreading activation techniques
Ahmad Wasfi Collecting user access patterns for building user profiles and collaborative filtering
Claypool et al. Inferring user interest
Downey et al. Models of Searching and Browsing: Languages, Studies, and Application.
Chi et al. The bloodhound project: automating discovery of web usability issues using the InfoScentπ simulator
Xue et al. Optimizing web search using web click-through data
White et al. Investigating behavioral variability in web search
US9053215B2 (en) Page grouping for site traffic analysis reports
KR101712988B1 (ko) 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치
Ahmadi-Abkenari et al. An architecture for a focused trend parallel Web crawler with the application of clickstream analysis
US20080313168A1 (en) Ranking documents based on a series of document graphs
US20080281817A1 (en) Accounting for behavioral variability in web search
Ting et al. UBB mining: finding unexpected browsing behaviour in clickstream data to improve a Web site's design
Lee et al. An adaptive website system to improve efficiency with web mining techniques
Burklen et al. User centric walk: An integrated approach for modeling the browsing behavior of users on the web
Chen et al. A unified framework for web link analysis
GB2338324A (en) Information management system
Bharamagoudar et al. Literature survey on web mining
Guo et al. A web crawler detection algorithm based on web page member list
Menasalvas et al. Subsessions: a granular approach to click path analysis
Dujmović et al. Evaluation and comparison of search engines using the LSP method
KR20170026433A (ko) 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치
Wu et al. An adaptive user profile based on memory model
CN101383838A (zh) 一种Web界面在线评估的方法、系统和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060310

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090415

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090420

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090518

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090521

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090618

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090818

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090911

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130918

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees