JP3666638B2 - 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP3666638B2
JP3666638B2 JP30565799A JP30565799A JP3666638B2 JP 3666638 B2 JP3666638 B2 JP 3666638B2 JP 30565799 A JP30565799 A JP 30565799A JP 30565799 A JP30565799 A JP 30565799A JP 3666638 B2 JP3666638 B2 JP 3666638B2
Authority
JP
Japan
Prior art keywords
information
url
data file
client computer
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30565799A
Other languages
English (en)
Other versions
JP2001125822A (ja
Inventor
克良 土居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP30565799A priority Critical patent/JP3666638B2/ja
Publication of JP2001125822A publication Critical patent/JP2001125822A/ja
Application granted granted Critical
Publication of JP3666638B2 publication Critical patent/JP3666638B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えばサーバコンピュータとクライアントコンピュータとがネットワークで結ばれたシステムにおいて、サーバコンピュータ上にあるハイパーリンク構造をもったデータファイルをクライアントコンピュータ上において閲覧する際に利用される情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体に関するものである。
【0002】
【従来の技術】
昨今、複数のサーバコンピュータおよび複数のクライアントコンピュータがネットワークで結ばれ、各サーバコンピュータにハイパーテキスト構造のマルチメディアデータが記憶されており、各クライアントコンピュータにおいて、ブラウザソフトウェアによって、このようなマルチメディアデータを閲覧することが可能なシステムが広く普及している。このようなシステムの例としては、例えば、インターネットにおけるWWW(world wide web)と呼ばれるシステムなどが挙げられる。
【0003】
マルチメディアデータを含む文書は、例えばHTML(hyper text markup language)と呼ばれる記述言語によって記述されており、テキスト文書、静止画、動画、音楽データ、およびJava(登録商標)アプレットなどのアプリケーションプログラムなどを含むことが可能になっている。このような文書(以下、HTMLページと称する)およびマルチメディアデータには、それぞれURL(uniform resource locator)と呼ばれる固有のアドレスが割り当てられている。ユーザは、ブラウザ上においてURLを指定することによって、所望のHTMLページあるいはマルチメディアデータにアクセスすることができる。また、HTMLページには、他のページやマルチメディアデータへアクセスするためのリンクなども埋め込まれており、ユーザは、このリンクをブラウザ上でポイントすることによって、リンク先のページやマルチメディアデータに移動することも可能となっている。
【0004】
そして、クライアントコンピュータにおけるHTML文書表示ソフトウェアであるブラウザとしては、例えば、Netscape Communications 社のNetscape Communicator (登録商標)や、Microsoft 社のInternet Explorer (登録商標)などの製品が広く普及している。
【0005】
これらのブラウザでは、アクセスしたHTMLページおよびマルチメディアデータのURL、アクセス日時、およびタイトルなどが、履歴データとしてクライアントコンピュータ内のハードディスクに記憶することが可能になっている。そして、ユーザは、過去にアクセスしたHTMLページあるいはマルチメディアデータに再びアクセスしたい時に、この履歴データを参照することによって、容易に所望のHTMLページあるいはマルチメディアデータにアクセスすることが可能である。
【0006】
また、例えばNetscape Communicator では、履歴データに基づいて、過去にアクセスしたHTMLページおよびマルチメディアデータのURLを、頻度順、あるいは日時順などに並べ替えて表示することが可能となっている。
【0007】
さらに、例えば、公開特許公報「特開平10−143519号公報(公開日:平成10年(1998)5月29日)」には、ユーザが過去にアクセスしたURLに対して、頻度や視聴時間をもとに順序づけを行い、その結果を表示する方法および装置が開示されている。
【0008】
また、例えば、公開特許公報「特開平9−204347号公報(公開日:平成9年(1997)8月5日)」、公開特許公報「特開平10−21134号公報(公開日:平成10年(1998)1月23日)」には、サーバコンピュータとクライアントコンピュータとの間でURLの中継を行うゲートウェイコンピュータにおいて、ゲートウェイコンピュータに中継キャッシュが内蔵されている場合、過去に中継したURLに対して、その頻度の算出を行ってリストを作成するとともに、頻度順にゲートウェイコンピュータが自発的にキャッシュの更新を行う方法が開示されている。
【0009】
これらの方式に共通する点としては、過去にアクセスしたHTMLページおよびマルチメディアデータのURLに関して、その頻度に注目し、それらを統計処理することによって頻度を算出し、頻度の高いHTMLページおよびマルチメディアデータは、ユーザの要求度が高いと判断している点である。
【0010】
【発明が解決しようとする課題】
ここで、情報を提供する複数のサーバコンピュータと、ゲートウェイコンピュータと、クライアントコンピュータとからなるシステムを想定する。なお、ゲートウェイコンピュータとは、異なるネットワーク/システムを相互接続するためのコンピュータである。
【0011】
そして、例えば、図14に示すように、あるサーバコンピュータ上に、URLが“http://www.news/”で示されるHTMLページが存在し、別のサーバコンピュータ上に、URLが“http://www.hello.nara/”で示されるHTMLページが存在するとする。
【0012】
URLが“http://www.news/”で示されるHTMLページは、あるニュース情報(「日々新聞」)を提供するページであり、「新刊情報(“http://www.news/1.html”)」、「天気予報(“http://www.news/2.html”)」、「A社新製品(“http://www.news/3.html”)」、「B社新製品(“http://www.news/4.html”)」、および「C社新製品(“http://www.news/5.html”)」の5つのHTMLページへのリンクがはられている。
【0013】
また、URLが“http://www.hello.nara/”で示されるHTMLページは、奈良県地域情報を提供するページであり、「株式情報(“http://www/a.mov”)」および「道路情報(“http://www/b.mov”)」の2つの動画データ、および「お知らせ(“http://www/index.html”)」のHTMLページにリンクがはられている。
【0014】
ここで、あるユーザが、クライアントコンピュータにおいて、まず、URLが“http://www.news/”で示されるHTMLページにアクセスし、このページからリンクされている5つのHTMLページ(テキストデータ)を閲覧し、その後、URLが“http://www.hello.nara/”で示されるHTMLページにアクセスし、このページからリンクされている2つの動画データ、および1つのHTMLページ(テキストデータ)を閲覧したとする。このとき、図15に示すようなアクセスログが、ゲートウェイコンピュータに記録される。
【0015】
なお、図15において、URLが“http://www.news/”で示されるHTMLページが1回しかカウントされていないのは、次のような理由によるものである。例えば、URLが“http://www.news/”で示されるHTMLページから、リンク先である「新刊情報(“http://www.news/1.html”)」のページへ移動し、閲覧後、ブラウザのバックボタン(戻るボタン)を押すことによって再び“http://www.news/”のページに戻り、同様にして他の4つのリンク先に移動したとする。この際に、ブラウザには、通常、キャッシュが一定量蓄積されており、「新刊情報(“http://www.news/1.html”)」のページから、“http://www.news/”のページに戻る際には、このキャッシュから“http://www.news/”のページのデータが取り出されることになる。この場合、ゲートウェイコンピュータには、URLの取得要求が伝達されないので、ゲートウェイコンピュータのアクセスログには、URLが“http://www.news/”で示されるHTMLページが、1回しか現れてこないことになる。
【0016】
図15に示す集計結果によれば、どのURLも1回の出現頻度であるから、上記のように、出現頻度に基づいてユーザの要求度を判断する方式によれば、どのURLもユーザの要求度は同等とみなされることになる。しかしながら、実際には、ユーザは、後日、URLが“http://www.news/”で示されるHTMLページや、URLが“http://www.hello.nara/”で示されるHTMLページに再びアクセスし、新しいリンクが作られていれば、その新しいリンクにアクセスする、というアクセス動作を行う可能性が高いと予想される。この際に、すでにアクセス済みのURLである“http://www.news/1.html”や、“http://www.news/2.html”などへ再びアクセスすることはほとんどないものと予想される。
【0017】
すなわち、上記のように、出現頻度に基づいてユーザの要求度を判断する方式では、ハイパーテキストが多階層のツリー構造をなす場合、下位階層のファイルオブジェクトに対してもそのURL単独でアクセス頻度が算出されて、URLの重要度が決定されるため、実際のユーザの要求度を反映した判定を行っていないことになる。したがって、このような方式によって示された結果には、無駄なデータが多く含まれることになり、ユーザにとって有用な情報が示されない場合がある。
【0018】
本発明は上記の問題点を解決するためになされたもので、その目的は、WWWなどのハイパーテキストシステムにおいて、ユーザがどのようなページを参照元としてURLページを参照しているかを集計し、その参照元のリストをユーザに提示することができる情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体を提供することにある。
【0019】
【課題を解決するための手段】
本発明の情報源観測装置は、上記の課題を解決するために、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測装置であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する抽出手段と、上記抽出された参照元のURLを参照情報として保存する参照情報保存手段と、上記参照情報を各URL毎に集計するカウント手段と、上記カウント手段による集計結果を、上記特定クライアントコンピュータに出力する出力手段とを有するとともに、1つの参照元のURLから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する重複 アクセス排除手段を有することを特徴としている。
【0020】
また、本発明の情報源観測方法は、上記の課題を解決するために、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測方法であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する第1ステップと、上記抽出された参照元のURLを参照情報として保存する第2ステップと、上記参照情報を各URL毎に集計する第3ステップと、上記第3ステップによる集計結果を、上記特定クライアントコンピュータに出力する第4ステップとを含むとともに、1つの参照元のURLから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する第5ステップを含んでいることを特徴としている。
【0021】
また、本発明の情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体は、上記の課題を解決するために、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体において、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する抽出手段と、上記抽出された参照元のURLを参照情報として保存する参照情報保存手段と、上記参照情報を各URL毎に集計するカウント手段と、上記カウント手段による集計結果を、上記特定クライアントコンピュータに出力する出力手段と、1つの参照元のURLから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する重複アクセス排除手段と、をコンピュータに実現させるための情報源観測プログラムを記録したことを特徴としている。
【0022】
上記の構成および方法により、参照情報保存手段(ステップ)によって、クライアントコンピュータからアクセスされたデータファイルの参照元データファイルのアドレス情報を参照情報として保存し、カウント手段(ステップ)によって、上記参照情報を、参照元データファイルのアドレス情報ごとに集計するので、参照元として頻繁に利用されるデータファイルを把握することが可能となる。
【0023】
加えて、重複アクセス排除手段(ステップ)によって、データファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算して修正するので、参照頻度の統計から重複したアクセスを削減除去して、より有用な情報を多く含んでいるデータファイルをユーザに提示することが可能となる。
【0024】
これにより、新規に多数出現するマルチメディアデータ等のデータファイルの参照起点となる情報源を参照頻度の統計に基づいて自動的に発見し、これをユーザに提示することができる優れたユーザインタフェースを提供することが可能となる。また、処理を高速化して、ユーザの情報アクセス時間を短縮することができる。
【0025】
したがって、上記の構成および方法によれば、サーバコンピュータとクライアントコンピュータとがネットワークで結ばれたコンピュータシステムにおいて、サーバコンピュータの上にあるハイパーテキスト構造を持ったマルチメディア文書の参照をクライアントコンピュータから容易に行うことが可能となる。
【0026】
さらに、本発明の情報源観測装置は、上記の課題を解決するために、上記サーバコンピュータが、上記クライアントコンピュータから要求されたデータファイルの更新日時と、該クライアントコンピュータが前回アクセスした該データファイルの更新日時とを比較して、これら更新日時が一致しない場合には、要求されたデータファイルが更新されている旨の応答コードを該データファイルとともに送信し、一致する場合には、要求されたデータファイルが更新されていない旨の応答コードを送信するものであって、上記重複アクセス排除手段が、クライアントコンピュータが要求したデータファイルが更新されているか否かを、上記応答コードに基づいて判定するものであることを特徴としている。
【0027】
上記の構成により、さらに、上記重複アクセス排除手段は、サーバコンピュータがクライアントコンピュータによりアクセス要求されたデータファイルが前回のアクセス以降に更新されたか否かを示すために送信した応答コードを検出することによって、同一データファイルの転送を検知することができる。したがって、このような応答コードを送信するプロトコル(例えば、HTTP)を用いるネットワークでは、容易な処理によって、上記重複アクセス排除手段を実現することができる。
【0028】
さらに、本発明の情報源観測装置は、上記の課題を解決するために、上記重複アクセス排除手段が、上記クライアントコンピュータから要求されたデータファイルのサイズと、該クライアントコンピュータが前回アクセスした該データファイルのサイズとを比較して所定の閾値以上の差がない場合、要求されたデータファイルは更新されていないと判定するものであることを特徴としている。
【0029】
上記の構成により、さらに、上記重複アクセス排除手段は、上記クライアントコンピュータから要求されたデータファイルのサイズと、該クライアントコンピュータが前回アクセスした該データファイルのサイズとを比較して、サイズが閾値以上に変化していなければ、そのデータファイルは更新されていないとみなして、参照頻度を修正することができる。
【0030】
したがって、ユーザにとっては表示ページの意味内容に変化がないにもかかわらず、ファイルサイズがわずかに異なるためにファイルが転送されたアクセスを統計の対象から排除することができ、より精度の高い参照頻度を算出することが可能となる。
【0031】
【発明の実施の形態】
〔前提となる技術〕
本発明の前提となる技術として、ユーザが実際にアクセスしたURLのハイパーリンクの関係から、ユーザの情報源URLとなるものを統計的に推定する方法がある(特願平11−28647号)。以下では、この技術について、図1,8,9,16を用いて説明する。
【0032】
まず、情報提供のための複数のサーバコンピュータと、ゲートウェイコンピュータと、クライアントコンピュータとからなるシステムを考える。なお、このシステムの構成は、図1に示すシステムから、同一URL排除手段(重複アクセス排除手段)7Aを除いた構成と考えてよい。よって、上記ゲートウェイコンピュータは、後述する情報源観測手段2(図1)に相当する。そこで、以下では、上記ゲートウェイコンピュータを情報源観測手段と記す。
【0033】
例えば、図16のように、“http://diary/”から“http://books/”、さらに“http://news/”にアクセスし、“http://news/”からリンクがはられている各ニュース記事にアクセスした場合を考える。
【0034】
具体的な履歴情報(URLアクセスログ)は、図8に示すとおりである。まず、99年1月1日には、“http://news/”に3つの新規ニュース“http://news/1.html”,“http://news/2.html”,“http://news/3.html”が現れ、いずれもユーザによってアクセスされている。さらに、99年1月2日には、“http://news/4.html”という新しい記事がユーザによってアクセスされている。ここで、両日の履歴とも、“http://diary/”からスタートし、順次リンクをたどってアクセスされている。
【0035】
なお、図8のアクセスログのReferer URL(参照元アドレス情報)は、クライアントコンピュータが発行するHTTPの標準ヘッダのReferer ヘッダを観測したものであり、アクセスされたURL(HTMLページ)がどのURLにリンクされていたかを示すものである。
【0036】
ここで、上記情報源観測手段は、アクセスログのRefererヘッダに現れるURLをデータタイプ別に集計する。すなわち、上記情報源観測手段は、ユーザがURLをアクセスする際の要求ヘッダに含まれるRefererヘッダを観測し、アクセスしたURLがどのURLにリンクされていたかをゲートウェイ部(参照情報保存手段)にて記憶し、参照統計を作成する。
【0037】
これにより、ユーザが実際にアクセスしたURLのハイパーリンクのReferer関係から、統計的にユーザの情報源URLとなるものを推定できる。すなわち、ユーザが手繰ったリンクが数多く集中しているURLを、情報源として検出することができる。例えば、図8のアクセスログからは、図9のようにRefererURLが集計され、“http://news/”,“http://books/”,“http://diary/”などがユーザの情報源URLであると推定できる。
【0038】
さらに、本発明の他の前提となる技術として、上記情報源観測手段で推定された情報源URLに対して、新着リンクが出現していないかどうかを定期的に観測するエージェントシステムがある(特願平11−224620号)。
【0039】
このエージェントシステムは、上記情報源観測手段によって情報源として推定されたURLをアクセスし、HTMLのタグを解析してハイパーリンクURL情報をデータベースに記憶し、前回のアクセス時に解析されたハイパーリンクURLと比較して、新しく出現したリンクのURLを検出し、ユーザに新着情報として提示する。
【0040】
ここで、図16の例では、“http://news/”は新着情報が検出できる可能性が高いページであるが、“http://diary/”や“http://books/”はハイパーリンクの通り道にすぎず、新着情報が得られる可能性が低いページである。しかし、上記情報源観測手段による推定では、ユーザが定期的に“http://diary/”から始めて“http://books/”を経て“http://news/”にアクセスした場合、Refererヘッダに基づいて統計を作成するため、図9に示すように、出現頻度値が高く出てしまう。
【0041】
このため、上記エージェントシステムが自動巡回する際、新着情報が得られる可能性が低いURLにもアクセスして、処理時間が増大する。したがって、上記エージェントシステムが、新着情報が出現する確率の高いURLに絞って定期的に観測して、効率的により多くの新着情報を得る必要があるため、単なる通り道となるURLの重要度を落とした統計を作成することが望ましい。例えば、統計的に基づいて推定されたユーザの情報源URLから、単なる通り道に過ぎないリンクを取り除くことが望ましい。
【0042】
〔実施の形態〕
本発明の一実施の形態について図1から図13に基づいて説明すれば、以下のとおりである。
【0043】
図1は、本実施の形態に係るコンピュータネットワークシステムの構成の概略を示すブロック図である。上記コンピュータネットワークシステムは、サーバコンピュータ1、情報源観測手段(情報源観測装置)2、およびクライアントコンピュータ3を備えて構成されている。なお、図1中において、サーバコンピュータ1は1つしか記載されていないが、サーバコンピュータ1としては、インターネット等のネットワークに接続された複数のサーバコンピュータが該当することになる。
【0044】
上記サーバコンピュータ1は、データファイル記憶装置1AにHTMLページや各種マルチメディアデータ等のデータファイルを保持している。そして、例えばHTTP(hypertext transfer protocol )デーモンと呼ばれるサーバソフトウェアによって、これらのデータの管理、および外部コンピュータからのアクセスの管理を行っている。
【0045】
上記クライアントコンピュータ3は、HTMLページや各種マルチメディアデータを表示可能なソフトウェアであるブラウザ(情報ブラウザ)3Aを備えている。そして、ユーザはこのクライアントコンピュータ3上においてブラウザ3Aを操作することによって、所望のHTMLページや各種マルチメディアデータを閲覧することができる。
【0046】
また、クライアントコンピュータ3は、ブラウザ3Aで閲覧したHTMLページや各種マルチメディアデータを、所定期間あるいは所定容量まで記憶するキャッシュメモリ3Bを備えている。そして、過去にアクセスされキャッシュメモリ3Bに記憶されているデータファイル(ファイルオブジェクト)が再度要求された場合、ブラウザ3Aは所望のデータファイルをキャッシュメモリ3Bから読み出して表示する。また、一定期間以上書き込みから時間が経過していれば、サーバコンピュータ1に最新かどうかを問い合わせ、最新のファイルオブジェクトを表示しようとする。
【0047】
上記情報源観測手段2としては、例えばファイアウォール上に設けられるゲートウェイコンピュータや、インターネット上に設けられるHTTPプロキシサーバコンピュータなどが該当し、HTTPのリクエスト(要求)およびレスポンス(応答)の中継を行うことを基本としている。この情報源観測手段2は、参照情報抽出手段4、参照情報保存手段5、カウント手段6、ソート手段7、データ変換手段8、情報更新手段9、情報蓄積手段10、検索手段11を備えて構成されている。さらに、ソート手段7には同一URL排除手段(重複アクセス排除手段)7Aが設けられている。なお、これらの各手段についての説明は後述する。
【0048】
また、図2に示すように、情報源観測手段2を、クライアントコンピュータ3に内蔵させた構成とすることも可能である。このように、クライアントコンピュータ3に内蔵可能なHTTPプロキシサーバとしては、シャープ株式会社製のシャープモバイルプロキシ(商品名)やインターネット快速便(商品名)などがある。
【0049】
さらに、情報源観測手段2を、クライアントコンピュータ3におけるブラウザ3Aの一部として構成することも可能である。
【0050】
図3は、クライアントコンピュータ3(図2)の構成の概略を示すブロック図である。図3に示すように、クライアントコンピュータ3は、CPU(central processing unit )12、RAM(random access memory)などで構成されるメモリ13、ハードディスクやフラッシュメモリなどで構成される不揮発性メモリ14、外部ネットワークとのインタフェースとなるネットワークI/O(input/output)15、キーボードやマウスなどで構成される入力装置16、および表示装置17を備えており、これらがバス18によって接続されている。また、アクセスしたデータを一定量あるいは一定期間保存し、必要に応じて読み出すためのキャッシュメモリ3Bは、不揮発性メモリ14に割り当てられている。このような構成のクライアントコンピュータ3は、一般的にパーソナルコンピュータと呼ばれるコンピュータによって構成することができる。
【0051】
ここで、クライアントコンピュータ3において、ブラウザ3AによってWWW上のHTMLページを閲覧する際の、情報源観測手段2の動作について説明する。
【0052】
まず、あるHTMLページをブラウザ3A上に表示させている状態から、そのHTMLページに埋め込まれているリンクをマウスカーソルでポイントし、クリックすることによって、リンク先のURL(アドレス情報)にアクセスした場合を想定する。例えば、図16に示す例において、URLが“http://news/”で示されるHTMLページを表示させている状態から、「99/1/1/A」のHTMLページを示すリンクをクリックしたとする。この時、クライアントコンピュータ3において、ネットワークI/O15を介して、情報源観測手段2に対してTCP/IP(transmission control protocol/internet porotocol)のコネクションがオープンされ、図5に示すような要求ヘッダが発行される。
【0053】
この要求ヘッダに含まれるRefererヘッダは、ブラウザによって発行されているものであり、要求されているURLの参照元情報が示されている。図5に示す例では、現在要求しているURL“http://news/1.html”が、URLが“http://news/”のHTMLページ(参照元データファイル)からのリンクによって要求されていることを示している。なお、このような要求ヘッダは、HTTP/1.0の仕様で規定されている標準ヘッダである。また、このような要求ヘッダの情報は、通常サーバコンピュータにて記録されることを想定して定義されているものである。
【0054】
また、クライアントコンピュータ3がすでに該当URLのデータファイルへ過去にアクセスしたことがある場合、要求ヘッダに過去アクセスした時にURLの応答データに含まれていたLast-Modifiedヘッダの日付をIf-Modified-Sinceヘッダに付けたGET要求が行われる。例えば、図5は、クライアントコンピュータ3がFri,23 Oct 1998 04:23:34 GMTの日付のファイルオブジェクトURLを保持している。これは、サーバコンピュータ1のファイルオブジェクトURLが、前回のアクセス以後に変化しているか否かを問い合わせるものである。
【0055】
情報源観測手段2は、上記のような要求ヘッダを受けて、URLが“news”で示されるサーバコンピュータ1にコネクションを張り、該当するファイル(“1.html”)を受信し、クライアントコンピュータ3のブラウザ3Aに転送する。この際、情報源観測手段2がサーバコンピュータ1から受信する応答データは、図6に示すように、応答ヘッダとテキストデータ(HTMLデータ)とからなっている。
【0056】
図6において、応答ヘッダにあるContent-Typeヘッダは、後に続くデータのマルチメディアタイプを示しており、図6に示す例では、後に続くデータがテキストデータ(HTMLデータ)であることを示している。また、応答ヘッダにあるContent-lengthヘッダは、後続のテキストデータ(HTMLデータ)本体のデータサイズである。
【0057】
したがって、上記情報源観測手段2の参照情報抽出手段4は、応答ヘッダに含まれるRefererヘッダを取得し、応答ヘッダが正常応答を示す場合(HTTP応答コード200番)で、かつ、Content-typeヘッダがテキストであるものを集計して、取得情報源を集計することができる。
【0058】
これに対して、サーバコンピュータ1は、If-Modified-Sinceヘッダの時刻と要求されたファイルオブジェクトの最終変更時刻とを比較して変化がなければ、HTTP応答コードとして304番を付した、データ部分のないヘッダデータのみの応答を、情報源観測手段2を介して、クライアントコンピュータ3へ送信する。なお、図7は、クライアントコンピュータ3のキャッシュメモリ3B中のキャッシュデータが有効な場合に、サーバコンピュータ1が送信する応答ヘッダおよび応答ボディデータの例である。
【0059】
本実施の形態では、クライアントコンピュータ3がキャッシュメモリ3Bを備えているため、応答コードが304番であるときは、そのファイルオブジェクトがすでにクライアントコンピュータ3にて過去アクセスされ、キャッシュされているデータであることを意味する。したがって、この場合、要求ヘッダに含まれるRefererヘッダのURL、すなわち参照元URLを情報源観測統計から排除する処理を行う。すなわち、同一情報へのリンクを複数回アクセスしても、その参照元URLは情報源とみなさないという処理を行う。
【0060】
ここで、上記の処理について、さらに詳細に説明する。図16のようなハイパーリンク構造のHTMLページを、図8のような順序でアクセスした場合を考える。図8は、参照情報抽出手段4で抽出し、参照情報保存手段5で記録した中継ログであり、中継URL、Referer URL、HTTP応答コード,ボディ部分の転送バイト数が記録されている。
【0061】
図16では、第1日目(99/1/1)は、“http://diary/”から始まり、“http://books/”を経て、そこから“http://news/”をアクセスし、さらに“http://news/”の3つのURL(“http://news/1.html”,“http://news/2.html”,“http://news/3.html”)へアクセスを行っている。また、第2日目(99/1/2)は、“http://diary/”から始まり、“http://books/”を経て、“http://news/”をアクセスし、1つの新しいURL(“http://news/4.html”)をアクセスしている。また、第3日目(99/1/3)は、“http://diary/ ”から始まり、“http://books/”を経て、“http://news/”をアクセスするが、新しいリンクはない。また、第4日目(99/1/4)は、第3日目(99/1/3)と同じアクセスを繰り返している。
【0062】
ここで、“ http://diary/”は“ http://books/”の参照元であるが、“http://books/”は変化がないページであるため、“http://diary/”をRefererURLとする応答コードは2回目以後304番となっている。これは、1回目でアクセスしたページが、キャッシュメモリ3Bにキャッシュされていたからである。
【0063】
また、“http://books/”は“http://news/”の参照元であるが、第1日目および第2日目の“http://news/”が変化しているため、“http://books/”をRefererURLとする応答コードは200番(304番でない)である。そして、第3日目および第4日目の“http://news/”は変化がないため、“http://books/”をRefererURLとする応答コードは304番となっている。
【0064】
ここで、図9に示すように、カウント手段6によって、単純にRefererヘッダのURLを集計すると、“http://diary/”,“http://books/”,“http://news/”は、いずれも出現頻度(参照頻度)が4回となり、“http://news/”にのみが新しい情報が現れるという状態を反映していない。
【0065】
そこで、同一URL排除手段7Aによって、応答コードが304番の場合は、クライアントコンピュータ3が過去に同一ファイルオブジェクトをアクセスしたことがあるとみなして、Referer統計から削除する。図10は、応答コードが304番の場合を排除して出現頻度情報を付加して作成された履歴情報であり、“http://diary/”(1回)および“http://books/”(2回)の出現頻度がアクセス履歴の実態に沿って修正されている。よって、図10は、単純にRefererヘッダのURLを集計した結果(図9)とは異なっている。
【0066】
なお、図10では、“http://books/”の出現頻度(参照頻度)が2回として算出されているが、これは参照先である“http://news/”が2度のアクセスにおいて内容が変わっていたからである。このように、“http://books/”は変化する情報へのリンクを有するページであり、“http://diary/”に比べて重要度が高い情報源であることが検出できている。
【0067】
以上のように、同一URL排除手段7Aによって、3つのURLに関して、変化する情報へのリンクをユーザがたどった割合の高いものほど出現頻度が高い、すなわち情報源として重要とみなす統計が得られている。
【0068】
図10のReferer URLリストをもとに、ゲートウェイコンピュータのキャッシュを自発的に更新したり、あるいは、新しいリンクを探すエージェントソフトウェアにより、出現頻度順に一定数のURLに対して観測を行うことも可能となる。よって、HTTPプロキシサーバコンピュータやゲートウェイコンピュータなどのような、キャッシュを蓄積するタイプのコンピュータに情報源観測手段2を設けた場合、情報源リストに基づいて、参照元として頻度の高いURLに対して、キャッシュを自発的に更新する構成とすることが可能となる。
【0069】
また、上記情報源観測手段2は、上記のような要求ヘッダおよび応答ヘッダに含まれる情報を利用して、アクセスしたURLのうちで正常応答を示したURLの参照元情報およびマルチメディアタイプを取得し、アクセスログの項目として記録している。これにより、例えば、アクセスログにおいて参照元情報に注目して集計を行えば、アクセスしたURLの参照元となったURLを頻度順に並べ替えて、情報源リストとしてユーザに提示することが可能となる。
【0070】
また、参照元情報は、マルチメディアデータタイプごとに集計することもできる。例えば、テキストデータ、動画データ、音楽データなどのデータタイプごとに分別して、情報源リストとしてユーザに提示することも可能となる。
【0071】
以上のように、上記情報源観測手段2は、ネットワークで繋がれたサーバコンピュータ1のデータファイル記憶装置1Aのハイパーリンク構造を有するデータファイルを、クライアントコンピュータ3のブラウザ3Aで閲覧する際に用いられる。
【0072】
上記サーバコンピュータ1は、上記クライアントコンピュータ3から要求されたデータファイルの更新日時と、クライアントコンピュータ3が前回アクセスした該データファイルの更新日時とを比較して、これら更新日時が一致しない場合には、要求されたデータファイルが更新されている旨の応答コード(HTTPでは200番)を該データファイルとともに送信し、一致する場合には、要求されたデータファイルが更新されていない旨の応答コード(HTTPでは304番)を送信する。
【0073】
そして、上記情報源観測手段2の参照情報保存手段4は、クライアントコンピュータ3からアクセスされたデータファイルの参照元データファイルのアドレス情報を参照情報として保存する。また、上記カウント手段6は、上記参照情報をアドレス情報ごとに集計して参照元データファイルの参照頻度を算出する。さらに、上記同一URL排除手段7Aは、1つの参照データファイルから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する。その際、同一URL排除手段7Aは、クライアントコンピュータ3が要求したデータファイルが更新されているか否かを、上記応答コードに基づいて判定する。
【0074】
つづいて、図4に示すフローチャートに基づいて、情報源観測手段2における処理の流れを図2を参照しながら説明する。なお、以下の説明において、情報源観測手段2は、クライアントコンピュータ3に内蔵されているものとするが、クライアントコンピュータ3の外部に設けられた構成においても、ほぼ同様の処理が行われる。
【0075】
まず、情報源観測手段2は、ネットワークI/O15を用いてサーバソケットをオープンし、中継要求を受け付ける待機状態に入る(S1)。そして、中継要求を受信した場合、ステップS2に進む。なお、上記のように、情報源観測手段2がクライアントコンピュータ3に内蔵されている場合には、情報源観測手段2は、メモリ13を経由してブラウザ3Aと通信する。
【0076】
つぎに、情報源観測手段2は、ブラウザ3Aから中継要求を受け付けると、参照情報抽出手段4によって、要求ヘッダから、参照元情報であるReferer ヘッダを抽出し、この内容をメモリ13に一時記憶させる(S2)。
【0077】
つぎに、情報源観測手段2は、サーバコンピュータ1に対してコネクションを開いて要求ヘッダを中継する(S3)。この際、要求したURLが存在しない場合には、エラーメッセージがクライアントコンピュータ3の表示装置17によってユーザに提示され、メモリ13に一次記憶させたReferer ヘッダの情報が破棄される(S4)。
【0078】
また、情報源観測手段2は、要求したURLがサーバコンピュータ1に存在し、かつ、そのURLがクライアントコンピュータ3によるアクセス履歴がない新規なデータファイルである場合(応答コードが正常(200番)である場合)には、そのURLに該当するサーバコンピュータ1からの応答データを受け取り、クライアントコンピュータ3のブラウザ3Aに応答データを中継する。これと同時に、参照情報保存手段5によって、要求したURLが、Referer ヘッダに基づいて検出される参照元情報、応答コードおよび応答ヘッダに含まれるContent-lengthヘッダに基づいて検出される応答ボディ部の転送バイト数とともに、参照情報として不揮発性メモリ14に記録され、保存される(S5)。この保存された参照情報の保存データの例を図8に示す。
【0079】
また、情報源観測手段2は、要求したURLがサーバコンピュータ1に存在するが、そのURLがクライアントコンピュータ3によるアクセス履歴を有する場合(応答コードが正常(304番)である場合)、すなわち、クライアントコンピュータ3による前回アクセス以降更新されていないデータファイルである場合には、応答ボディ部のない応答データをブラウザ3Aに中継する。これと同時に、参照情報保存手段5によって、要求したURLが、Referer ヘッダに基づいて検出される参照元情報、応答コードとともに、参照情報として不揮発性メモリ14に記録され、保存される(S5)。
【0080】
ここで、応答ヘッダに含まれるContent-typeヘッダに基づいて検出されるデータタイプ(text/html 等)に基づいて、指定されたデータタイプだけを保存してもよい。また、参照元のタイトルを保存してもよい。なお、Content-typeヘッダがtext/html であれば、応答データのHTMLデータを構文解析し、<title> タグで囲まれた部分を抽出することによって、該当ページのタイトルを抽出できる。
【0081】
上記のような参照情報の保存処理は、保存データが一定数になるまで繰り返して行われる(S6)。すなわち、保存データが一定数になるまでは(NO)、ステップS1に戻り、保存データが一定数に達したら(YES)、次のステップ(S7)に進む。
【0082】
一定数に達した保存データに対して、カウント手段6によって、参照元情報ごとに参照に用いられた回数を集計し、集計データを作成する(S7)。図9は、図8のアクセスログを集計した結果である。
【0083】
つづいて、ソート手段7によって、上記集計データを参照頻度に関してソートする(S8)。なお、データタイプについてのソートを同時に行うこともできる。
【0084】
このとき、同一ファイルオブジェクトの中継を除いて集計する。すなわち、同一URL排除手段7Aにより、サーバコンピュータ1からのHTTP応答コード304番を検出し、同一ファイルオブジェクトの中継か否かを判定して、そうであれば出現頻度のカウントから取り除く。図10は、図9の履歴情報から応答コードが304番の参照元URLを排除した結果である。
【0085】
そして、ソートされた参照情報のデータを、データ変換手段8によって、例えばHTMLデータなどの、ブラウザ3Aで表示することが可能なデータ形式に変換し、情報源リストとして表示装置17に表示することによって、ユーザに提示する(S9)。このような情報源リストの例を図11に示す。
【0086】
情報源リストから、クライアントコンピュータ3を使用するユーザが、どのような情報を求めることを習慣としているかを把握できる。すなわち、この情報源リストは、嗜好データベースとして利用できる。例えば、図11に示す例では、ユーザが“http://news/”を情報ソースとして最も重要と考えていることがわかる。また、各データタイプごとに参照元情報を集計して提示できるので、データタイプごとに、重要となる参照元情報を把握することも可能である。
【0087】
ここで、情報源観測手段2が、アクセスしたURLのデータをキャッシュとして情報貯蓄手段10に一定量蓄積するものである場合を考える。なお、情報源観測手段2がクライアントコンピュータ3に内蔵されている場合には、情報貯蓄手段10とキャッシュメモリ3Bとを一つにすることができる。この場合、情報更新手段9が、所定の時間ごとに、上記のソートされた参照情報のデータに基づいて、サーバコンピュータ1から情報を自発的に取得し、情報蓄積手段10に蓄積されたデータの更新が行われる(S10)。このような情報更新処理は、ソートされた参照情報のデータにおいて、例えば全てのデータタイプにおける参照元として頻度の高い順、あるいは、ユーザが指定したデータタイプにおける参照元として頻度の高い順などに基づいて行われる。
【0088】
この情報更新手段9による情報更新処理において、情報源リストに掲載されたURL群を対象にリンクレベル2以上でファイルオブジェクトの自動収集する処理を行えば、参照元としてのURLからリンクされているデータ、すなわち、ユーザがアクセスする可能性の高いデータをも自動的に情報蓄積手段10に蓄積されることになる。すなわち、リンクレベルを深くすれば、参照元としてのURLからリンクされている広い範囲の関連情報まで自動収集することになるが、ユーザが参照元として数多く利用するURLを起点にした情報収集となるので、ユーザが利用する可能性の高い、的確な情報収集が可能となる。これにより、参照元のURLからリンクされているデータに対してユーザがアクセスした場合にも、キャッシュデータの中からデータを取り出すことが可能となり、アクセススピードの向上およびネットワークトラフィックの低減を図ることができる。なお、情報更新手段9としては、Microsoft社のWWWブラウザであるInternet Explorer の定期購読機能を利用することもできる。
【0089】
さらに、上記のように、情報源リストに掲載されたURL群を対象に所定のリンクレベル以上で自動収集したファイルオブジェクトに対して、検索手段11により検索をかけ、ユーザに結果を提示することも可能である。この場合、ユーザの情報源をもとに情報収集されたファイルオブジェクトに対して検索が行われるので、一般のインターネット検索エンジンなどに比べて、情報の鮮度が高く、かつ、ユーザのニーズに適した検索結果を提供することができる。
【0090】
以上のようなステップS1からステップS10の処理を、情報源観測手段2は繰り返し行うことになる。
【0091】
このように、参照情報を集計し、出現頻度順にソートした結果において、ユーザが参照元として頻繁に利用したURLは上位にランクされることになる。したがって、このようなソート結果をユーザに提示すれば、ユーザは、所望の情報をどこから得ることができるかを、自分の情報源リストから発見することが可能となり、この情報源リストからリンクをたどることによって、容易に情報を得ることが可能となる。
【0092】
加えて、同一URL排除手段7Aにより、同一ファイルオブジェクトを参照するURLを排除できる。これにより、参照統計から単なる通り道のURLを削除することにより、真のユーザ情報源統計として参照統計情報の精度を向上させることができる。すなわち、参照統計情報は新着リンク情報の予測や、それらの事前ダウンロードに使用されるので、より精度の高い新着リンク情報検出が可能になり、また無駄なURLへのアクセスがなくなるため、新着情報のための調査時間の短縮が可能になる。
【0093】
上記の説明では、同一URL排除手段7Aにより、サーバコンピュータ1からのHTTP応答コード304番を検出して、同一ファイルオブジェクトの中継か否かを判定し、そうであれば出現頻度のカウントから取り除いた。しかし、同一URL排除手段7Aによる同一ファイルオブジェクトの検出は、ファイルサイズが設定値以上に変化していなければ、更新されていないとみなすことによっても可能である。
【0094】
ここで、WWWの世界では、広告の画像がリンクされてHTMLファイルに埋め込まれている場合がある。さらに、このような広告にはアクセスするごとに異なる画像を表示するものが多い。そのため、広告の画像URLの長さが変化しただけのページにアクセスした場合、ユーザにとっては表示ページの意味内容に変化がないにもかかわらず、ファイルサイズ(転送バイト数)が異なるため、サーバコンピュータ1からは応答コード304番ではなく、応答コード200番とHTMLファイルが転送される。
【0095】
そこで、上記同一URL排除手段7Aでは、ファイルサイズが閾値Wバイト(例えば10バイト)以上変化したときだけ、ファイルが更新されて同一性がなくなったと判断して、統計に加える処理を行う。つまり、ファイルサイズの差が閾値Wバイト以下のファイルを同一ファイルとみなし、応答コード304番と同じく重複があるとして排除する。もちろん、閾値Wバイトは、コンピュータシステムの状態に応じて適宜設定することができる。
【0096】
具体的には、ステップS8(図4)において、同一参照ページへの複数回アクセスを排除して統計を作る際に、(1)アクセスログの一番下(最新)のURLについてデータファイルの転送バイト数を変数Mjに格納し、(2)同一URLがないかどうかをアクセスログの上に向かって遡って調べる。そして、(3)同一URLがi行目にあれば、転送バイト数である変数Mi,Mjの差を計算し、
Mi−Mjの絶対値<W
という条件式で判別する。(4)この条件式を満たしているものは、ファイルサイズの変化が閾値以下であるので、j行目の応答コードを304番に置き換える。(5)以上の処理を、jを1つ減算しながら繰り返し行う。
【0097】
一例として、図12のアクセスログを図13に補正する場合について説明する。なお、以下では“http://books/”からのアクセスについてのみ説明する。また、アクセスログの「Referer 採用」欄には、統計に採用する場合には「○」、採用しない場合には「×」が記されている。
【0098】
まず、99/1/4の“http://books/”のアクセスを処理する。ここから遡ると、同じURLである“http://books/”が99/1/3にある。しかし、99/1/4のアクセスは、99/1/3のアクセスと最終変更時刻が一致して、応答コード(304番)のみが転送されているため、ファイルサイズによる同一性判定の対象とならない。
【0099】
つぎに、99/1/3の“http://books/”のアクセスを処理する。ここから遡ると、同じURLである“http://books/”が99/1/2にある。これらのアクセスの転送バイト数の差は3バイトであり、閾値(10バイト)以下である。よって、99/1/3のアクセスではデータファイルが実質的に更新されていなかったと判断して、応答コードを304番に書き換える。
【0100】
つぎに、99/1/2の“http://books/”のアクセスを処理する。ここから遡ると、同じURLである“http://books/”が99/1/1にある。これらのアクセスの転送バイト数の差は11バイトであり、閾値(10バイト)より大きい。よって、99/1/2のアクセスではデータファイルが実質的に更新されていたと判断して、応答コードを200番のままとする。
【0101】
以上のように、同一URL排除手段7Aにおいて、ファイルサイズによる同一性判定を行い、転送バイト数は異なるが更新されていないとみなせるアクセスの応答コードを304番に書き換えて、アクセスログを補正する。これにより、この補正の後、上述した応答コード304番の検出の処理にそのまま移行して、同一と思われるファイルオブジェクトへの重複アクセスを統計からまとめて排除することができる。
【0102】
以上のように、本発明に係る情報源観測装置は、ハイパーリンクを有するページの参照頻度統計を作成する際に、同一ファイルオブジェクトのアクセスを統計から取り除いて、変化の多い参照元URLを推定する。
【0103】
具体的には、上記情報源観測装置は、ブラウザからの要求をサーバコンピュータに中継し、応答をブラウザに中継する情報源観測手段において実現される。そして、この情報源観測手段は、サーバコンピュータ上のハイパーリンク構造を持ったファイルオブジェクトをクライアントコンピュータで閲覧するシステムにおいて、参照情報抽出手段(参照元情報抽出手段)と、参照情報保存手段と、カウント手段と、同一ファイルオブジェクトの転送検知手段(同一URL排除手段)と、ソート手段と、データ変換手段(表示手段)とを備えて構成されてもよい。さらに、同一ファイルオブジェクトの転送検知手段に、サーバコンピュータからの応答コードを利用するように構成されてもよい。
【0104】
詳細には、上記情報源観測手段は、URL要求プロトコルの要求ヘッダに含まれる参照情報を抽出する参照情報抽出手段と、ファイルオブジェクト中継応答ヘッダの応答コードを記録して、同一ファイルオブジェクトへのアクセスを排除する手段(または、中継ファイルサイズを比較することにより、同一ファイル名へのアクセスにおいて、一定数以上のファイルサイズの変化がない場合は、同一情報へのアクセスであると判断して統計から排除する手段)と、参照情報別に統計を行うカウント手段と、これらの参照情報の統計をソートし並べ替えるソート手段と、統計結果を記憶装置に記憶し、ユーザに提示する形式にデータを変換するデータ変換手段とを備えて構成されてもよい。加えて、情報更新手段を備え、統計結果をもとに、情報源観測手段が保持する情報蓄積手段を使って情報更新を行う構成であってもよい。
【0105】
また、上記情報源観測手段は、URL要求プロトコルの要求ヘッダに含まれるReferer ヘッダから参照URL元情報を抽出して記憶する手段と、URL応答ヘッダのデータタイプからテキストなど特定のメディアタイプを示す情報を抽出する手段と、目的メディアタイプに合致しているか判断する手段を使ってメディアタイプ別に参照URL元情報を選別して記憶する手段と、これらの参照URL元情報の統計を計算する手段と、参照URLの重複を取り除く手段と、統計結果を記憶装置に記憶し、ユーザに提示する手段とを備えて構成されてもよい。加えて、統計結果を元に情報を自動収集する手段を起動する構成であってもよい。
【0106】
これにより、上記情報源観測手段は、ファイルオブジェクトの参照元情報の統計情報を集計して、クライアントコンピュータに提示することができる。そして、ハイパーリンクを有するページの参照頻度統計を作成する時に、単なる通り道のページを検出して、統計から除去することによって、精度の高いユーザアクセス参照頻度統計を作成することができる。
【0107】
このように、本発明に係る情報源観測装置は、図8のようにアクセスログを作成する際、要求ヘッダに含まれる参照元URL情報と、正常なファイルオブジェクト転送であり、サーバコンピュータからの応答コードが304番でないものを抽出し、ファイル転送サイズを記録し、統計を取ることにより、どのURLにリンクされていた情報へのアクセスかを示す参照頻度を記録する。これにより、同一ファイルオブジェクト参照による参照統計を排除できる。すなわち、統計上、異なるファイルオブジェクトへアクセスした場合の参照元URLを重要視して、新着情報が得られる確率の高い情報を多く含んでいるURLをユーザに示すことができる。
【0108】
ここで、本発明に係る情報源観測装置は、同一ファイルオブジェクトへのアクセス(参照行動)を取り除いて、参照情報(参照URL元情報、情報源情報)を集計し、出現頻度順にソートし、ユーザに提示することによって、異なる情報をより多く引き出したURLを重要度の上位にランク付けすることができる。
【0109】
これにより、ランク付けした参照URL元情報を情報源リスト(図11)としてユーザに提示すれば、ユーザは自分にとって新規情報が得やすい情報源を的確に把握することができ、必要な情報を即座に得ることができる。また、例えば、多数のニュース記事にリンクが張られ、毎日異なる記事のURLへのリンクが出現するページをユーザがアクセスすれば、自動的に将来の新着情報を予測して効果的に自動巡回を行うことが可能となる。
【0110】
また、参照元URLの統計から得られたリストをもとに、ゲートウェイコンピュータが内蔵キャッシュに情報を自動更新するようにすることができる。また、ゲートウェイコンピュータが自発的にこれら有用な情報源URLをアクセスして、新しいハイパーリンクを検出して、ユーザに提示する場合に、効率的な調査が可能になる。
【0111】
そして、前記の手段がブラウザソフトウェアに内蔵されていれば、無駄な情報源を排除して、ユーザにとってより有用な情報を数多く提示できる。また、ブラウザが自発的にこれら有用な情報源URLにアクセスして、新しいハイパーリンクを検出して、ユーザに提示する場合に効率的な調査が可能になる。
【0112】
したがって、本発明に係る情報源観測装置によれば、WWWなどのハイパーテキストシステムにおいて、ユーザがどのページを起点としてURLページを参照しているかという情報源URL(参照元URL・情報源アドレス)を抽出して統計を作成し、ユーザの情報源を予測する処理において、情報源URLからの同一参照ページへの複数回のアクセスを排除することができる。これにより、新規情報の出現可能性が高い情報源URLの予測精度を高めることが可能となる。
【0113】
上記の実施の形態は本発明の範囲を限定するものではなく、本発明の範囲内で種々の変更が可能である。特に、本実施の形態では、インターネット上のHTMLを例として説明したが、ネットワークの構成(HTTP等のプロトコルを含む)およびファイルオブジェクトの形式はこれに限定されない。
【0114】
最後に、本発明は、複数の機器(例えば、ホストコンピュータ、端末コンピュータ、インタフェース機器、ネットワーク機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、携帯型コンピュータ、ワープロ装置など)に適用してもよい。
【0115】
また、本発明の目的は、上述した機能を実現するソフトウエアである情報源観測プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。この場合、記録媒体から読み出されたプログラムコード自体が上述した機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0116】
上記プログラムコードを供給するための記録媒体は、システムあるいは装置と分離可能に構成することができる。また、上記記録媒体は、プログラムコードを供給可能であるように固定的に担持する媒体であってもよい。そして、上記記録媒体は、記録したプログラムコードをコンピュータが直接読み取ることができるようにシステムあるいは装置に装着されるものであっても、外部記憶装置としてシステムあるいは装置に接続されたプログラム読み取り装置を介して読み取ることができるように装着されるものであってもよい。
【0117】
例えば、上記記録媒体としては、磁気テープやカセットテープ等のテープ系、フロッピーディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0118】
また、上記プログラムコードは、コンピュータが記録媒体から読み出して直接実行できるように記録されていてもよいし、記録媒体から主記憶のプログラム記憶領域へ転送された後コンピュータが主記憶から読み出して実行できるように記録されていてもよい
【0119】
お、プログラムコードを記録媒体から読み出して主記憶に格納するためのプログラム、および、通信ネットワークからプログラムコードをダウンロードするためのプログラムは、コンピュータによって実行可能にあらかじめシステムあるいは装置に格納されているものとする。
【0120】
上述した機能は、コンピュータが読み出した上記プログラムコードを実行することによって実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行うことによっても実現される。
【0121】
さらに、上述した機能は、上記記録媒体から読み出された上記プログラムコードが、コンピュータに装着された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことによっても実現される。
【0122】
【発明の効果】
本発明の情報源観測装置は、以上のように、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測装置であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する抽出手段と、上記抽出された参照元のURLを参照情報として保存する参照情報保存手段と、上記参照情報を各URL毎に集計するカウント手段と、上記カウント手段による集計結果を、上記特定クライアントコンピュータに出力する出力手段とを有するとともに、1つの参照元のURLから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する重複アクセス排除手段を有する構成である。
【0123】
また、本発明の情報源観測方法は、以上のように、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測方法であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する第1ステップと、上記抽出された参照元のURLを参照情報として保存する第2ステップと、上記参照情報を各URL毎に集計する第3ステップと、上記第3ステップによる集計結果を、上記特定クライアントコンピュータに出力する第4ステップとを含むとともに、1つの参照元のURLから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する第5ステップを含んでいる方法である。
【0124】
また、本発明の情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体は、以上のように、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体において、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する抽出手段と、上記抽出された参照元のURLを参照情報として保存する参照情報保存手段と、上記参照情報を各URL毎に集計するカウント手段と、上記カウント手段による集計結果を、上記特定クライアントコンピュータに出力する出力手段と、1つの参照元のURLから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する重複アクセス排除手段と、をコンピュータに実現させるための情報源観測プログラムを記録した構成である。
【0125】
それゆえ、重複アクセス排除手段(ステップ)によって、データファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算して修正するので、参照頻度の統計から重複したアクセスを削減除去して、より有用な情報を多く含んでいるデータファイルをユーザに提示することが可能となる。
【0126】
よって、新規に多数出現するマルチメディアデータ等のデータファイルの参照起点となる情報源を参照頻度の統計に基づいて自動的に発見し、これをユーザに提示することができる優れたユーザインタフェースを提供することが可能となるという効果を奏する。また、処理を高速化して、ユーザの情報アクセス時間を短縮することができるという効果を奏する。
【0127】
したがって、上記の構成および方法によれば、サーバコンピュータとクライアントコンピュータとがネットワークで結ばれたコンピュータシステムにおいて、サーバコンピュータの上にあるハイパーテキスト構造を持ったマルチメディア文書の参照をクライアントコンピュータから容易に行うことが可能となるという効果を奏する。
【0128】
本発明の情報源観測装置は、以上のように、さらに、上記サーバコンピュータが、上記クライアントコンピュータから要求されたデータファイルの更新日時と、該クライアントコンピュータが前回アクセスした該データファイルの更新日時とを比較して、これら更新日時が一致しない場合には、要求されたデータファイルが更新されている旨の応答コードを該データファイルとともに送信し、一致する場合には、要求されたデータファイルが更新されていない旨の応答コードを送信するものであって、上記重複アクセス排除手段が、クライアントコンピュータが要求したデータファイルが更新されているか否かを、上記応答コードに基づいて判定する構成である。
【0129】
それゆえ、さらに、上記重複アクセス排除手段は、サーバコンピュータがクライアントコンピュータによりアクセス要求されたデータファイルが前回のアクセス以降に更新されたか否かを示すために送信した応答コードを検出することによって、同一データファイルの転送を検知することができる。したがって、このような応答コードを送信するプロトコル(例えば、HTTP)を用いるネットワークでは、容易な処理によって、上記重複アクセス排除手段を実現することができるという効果を奏する。
【0130】
本発明の情報源観測装置は、以上のように、さらに、上記重複アクセス排除手段が、上記クライアントコンピュータから要求されたデータファイルのサイズと、該クライアントコンピュータが前回アクセスした該データファイルのサイズとを比較して所定の閾値以上の差がない場合、要求されたデータファイルは更新されていないと判定する構成である。
【0131】
それゆえ、さらに、上記重複アクセス排除手段は、上記クライアントコンピュータから要求されたデータファイルのサイズと、該クライアントコンピュータが前回アクセスした該データファイルのサイズとを比較して、サイズが閾値以上に変化していなければ、そのデータファイルは更新されていないとみなして、参照頻度を修正することができる。
【0132】
したがって、ユーザにとっては表示ページの意味内容に変化がないにもかかわらず、ファイルサイズがわずかに異なるためにファイルが転送されたアクセスを統計の対象から排除することができ、より精度の高い参照頻度を算出することが可能となるという効果を奏する。
【図面の簡単な説明】
【図1】 本発明の一実施の形態に係る情報源観測装置の構成の概略を示す機能ブロック図であり、情報源観測装置がクライアントコンピュータとは別に設けられている場合を示す。
【図2】 本発明の一実施の形態に係る情報源観測装置の他の構成の概略を示す機能ブロック図であり、情報源観測装置がクライアントコンピュータ内に設けられている場合を示す。
【図3】 図2に示す情報源観測装置を含むクライアントコンピュータの物理的構成の概略を示すブロック図である。
【図4】 図1および図2に示す情報源観測装置の動作の概略を示すフローチャートである。
【図5】 クライアントコンピュータから発行される要求ヘッダの一例を示す説明図である。
【図6】 サーバコンピュータから発行される応答ヘッダの一例であり、通常の場合の応答ヘッダを示す説明図である。
【図7】 サーバコンピュータから発行される応答ヘッダの一例であり、ファイルが更新されていない場合の応答ヘッダを示す説明図である。
【図8】 図1および図2に示す情報源観測装置で作成されるURLアクセスログの一例を示す説明図である。
【図9】 図1および図2に示す情報源観測装置で作成される参照元URL情報としての頻度統計情報を示す説明図であり、URLの参照元URLを集計した一例を示す。
【図10】 図1および図2に示す情報源観測装置で作成される参照元URL情報としての頻度統計情報を示す説明図であり、応答コード304の参照元URLを除いて集計した一例を示す。
【図11】 図1および図2に示す情報源観測装置が備えるデータ変換手段によって生成されたデータの一表示例を示す説明図である。
【図12】 図1および図2に示す情報源観測装置で作成されるURLアクセスログのファイルサイズによる同一性判定の説明図であり、補正前のアクセスログの一例を示す。
【図13】 図1および図2に示す情報源観測装置で作成されるURLアクセスログのファイルサイズによる同一性判定の説明図であり、図12に示すアクセスログを補正したアクセスログを示す。
【図14】 WWW上におけるHTMLページおよびデータファイルのリンクの様子の一例を示す概念図である。
【図15】 URLアクセスログの一例を示す説明図である。
【図16】 WWW上におけるHTMLページおよびデータファイルのリンクの様子の他の例を示す概念図である。
【符号の説明】
1 サーバコンピュータ
2 情報観測手段(情報源観測装置)
3 クライアントコンピュータ
5 参照情報保存手段
6 カウント手段
7A 同一URL排除手段(重複アクセス排除手段)

Claims (5)

  1. ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測装置であって、
    上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する抽出手段と、
    上記抽出された参照元のURLを参照情報として保存する参照情報保存手段と、
    上記参照情報を各URL毎に集計するカウント手段と、
    上記カウント手段による集計結果を、上記特定クライアントコンピュータに出力する出力手段とを有するとともに、
    1つの参照元のURLから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する重複アクセス排除手段を有することを特徴とする情報源観測装置。
  2. 上記サーバコンピュータが、上記クライアントコンピュータから要求されたデータファイルの更新日時と、該クライアントコンピュータが前回アクセスした該データファイルの更新日時とを比較して、これら更新日時が一致しない場合には、要求されたデータファイルが更新されている旨の応答コードを該データファイルとともに送信し、一致する場合には、要求されたデータファイルが更新されていない旨の応答コードを送信するものであって、
    上記重複アクセス排除手段が、クライアントコンピュータが要求したデータファイルが更新されているか否かを、上記応答コードに基づいて判定するものであることを特徴とする請求項1に記載の情報源観測装置。
  3. 上記重複アクセス排除手段が、上記クライアントコンピュータから要求されたデータファイルのサイズと、該クライアントコンピュータが前回アクセスした該データファイルのサイズとを比較して所定の閾値以上の差がない場合、要求されたデータファイルは更新されていないと判定するものであることを特徴とする請求項1または2に記載の情報源観測装置。
  4. ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測方法であって、
    上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する第1ステップと、
    上記抽出された参照元のURLを参照情報として保存する第2ステップと、
    上記参照情報を各URL毎に集計する第3ステップと、
    上記第3ステップによる集計結果を、上記特定クライアントコンピュータに出力する第4ステップとを含むとともに、
    1つの参照元のURLから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する第5ステップを含んでいることを特徴とする情報源観測方法。
  5. ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュー タと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体において、
    上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する抽出手段と、
    上記抽出された参照元のURLを参照情報として保存する参照情報保存手段と、
    上記参照情報を各URL毎に集計するカウント手段と、
    上記カウント手段による集計結果を、上記特定クライアントコンピュータに出力する出力手段と、
    1つの参照元のURLから行われた1つのデータファイルへのアクセスのうち、そのデータファイルが更新されてから次に更新されるまでの間に行われた複数回のアクセスを参照頻度1回に換算する重複アクセス排除手段と、をコンピュータに実現させるための情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP30565799A 1999-10-27 1999-10-27 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3666638B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30565799A JP3666638B2 (ja) 1999-10-27 1999-10-27 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30565799A JP3666638B2 (ja) 1999-10-27 1999-10-27 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2001125822A JP2001125822A (ja) 2001-05-11
JP3666638B2 true JP3666638B2 (ja) 2005-06-29

Family

ID=17947786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30565799A Expired - Fee Related JP3666638B2 (ja) 1999-10-27 1999-10-27 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3666638B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171798A (ja) * 2001-08-03 2006-06-29 Saora Inc 情報処理システム及び装置、及びその方法、及びそのプログラム
JP2006171799A (ja) * 2001-08-17 2006-06-29 Saora Inc 情報処理システム及びその方法、及びそのプログラム、クライアント端末装置、サーバ端末装置
JP4635757B2 (ja) * 2005-07-14 2011-02-23 日本電気株式会社 リンク先へのアクセス制限方法、装置及びプログラム
JP4856591B2 (ja) * 2007-06-27 2012-01-18 富士フイルム株式会社 サーバ・システムならびにその動作制御方法およびその制御プログラム
CN101504649B (zh) * 2008-11-14 2011-11-30 北京搜狗科技发展有限公司 一种页面资源的处理方法及装置
US8392452B2 (en) * 2010-09-03 2013-03-05 Hulu Llc Method and apparatus for callback supplementation of media program metadata
JP5100855B2 (ja) * 2011-02-09 2012-12-19 株式会社エヌ・ティ・ティ・ドコモ 潜在クラス分析装置、潜在クラス分析方法及びプログラム
JP6148023B2 (ja) * 2013-01-30 2017-06-14 キヤノン電子株式会社 システム、情報処理装置、履歴情報サーバ、履歴情報を取得もしくは収集する方法、処理方法およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3550929B2 (ja) * 1997-01-28 2004-08-04 富士通株式会社 対話型ハイパーテキスト情報参照システムにおける参照回数計数装置及び方法
JP3664906B2 (ja) * 1999-02-05 2005-06-29 シャープ株式会社 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2001125822A (ja) 2001-05-11

Similar Documents

Publication Publication Date Title
KR100447526B1 (ko) 인터넷 사용자의 접속 의도 판단 방법 및 이를 이용한인터넷 상의 광고 방법과 그 시스템
JP4304205B2 (ja) インターネットユーザのアクセス意図を用いたインターネット上での広告誘致および広告提供方法とそのシステム
US7146415B1 (en) Information source monitor device for network information, monitoring and display method for the same, storage medium storing the method as a program, and a computer for executing the program
US8413042B2 (en) Referrer-based website personalization
US8893043B2 (en) Method and system for predictive browsing
US7945637B2 (en) Server architecture and methods for persistently storing and serving event data
KR101891493B1 (ko) 사용자 탐색 이벤트의 예측
US8744988B1 (en) Predicting user navigation events in an internet browser
US7895227B1 (en) System and method for detecting trends in network-based content
KR100377515B1 (ko) 인터넷광고 관리방법 및 이를 위한 시스템
CN100375088C (zh) 利用事务语义法分段和处理连续数据流
JP4868245B2 (ja) 検索システム、検索装置、および検索方法
WO2007140364A2 (en) Method for scoring changes to a webpage
JP4875911B2 (ja) コンテンツ特定方法及び装置
JP2002140224A (ja) コンテンツ変更管理方法
US7069292B2 (en) Automatic display method and apparatus for update information, and medium storing program for the method
JP3666638B2 (ja) 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3664906B2 (ja) 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体
JP3664923B2 (ja) 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003141155A (ja) Webページ検索システムおよびWebページ検索プログラム
JP2001209655A (ja) 情報提供装置、情報更新方法、情報提供プログラムを記録した記録媒体、及び情報提供システム
JPH11110410A (ja) データ検索装置及び方法、情報処理システム及び方法並びにデータ検索用プログラムを記録した記録媒体
JP2002351913A (ja) ポータルサイト作成方法およびポータルサイト作成装置
JP4009342B2 (ja) 情報提供要求方法,情報提供要求プログラムを記憶した記憶媒体およびサーバコンピュータ
JP2003173351A (ja) 情報解析、収集、検索方法、装置、プログラム、および記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050217

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050330

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080415

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090415

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090415

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100415

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100415

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110415

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120415

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120415

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130415

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130415

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees