JP3664906B2 - 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体 - Google Patents

情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP3664906B2
JP3664906B2 JP02864799A JP2864799A JP3664906B2 JP 3664906 B2 JP3664906 B2 JP 3664906B2 JP 02864799 A JP02864799 A JP 02864799A JP 2864799 A JP2864799 A JP 2864799A JP 3664906 B2 JP3664906 B2 JP 3664906B2
Authority
JP
Japan
Prior art keywords
information
url
client computer
data
data file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02864799A
Other languages
English (en)
Other versions
JP2000227886A (ja
Inventor
克良 土居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP02864799A priority Critical patent/JP3664906B2/ja
Publication of JP2000227886A publication Critical patent/JP2000227886A/ja
Application granted granted Critical
Publication of JP3664906B2 publication Critical patent/JP3664906B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えばサーバコンピュータとクライアントコンピュータとがネットワークで結ばれたシステムにおいて、サーバコンピュータ上にあるハイパーリンク構造をもったデータファイルをクライアントコンピュータ上において閲覧する際に利用される情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体に関するものである。
【0002】
【従来の技術】
昨今、複数のサーバコンピュータおよび複数のクライアントコンピュータがネットワークで結ばれ、各サーバコンピュータにハイパーテキスト構造のマルチメディアデータが記憶されており、各クライアントコンピュータにおいて、ブラウザと呼ばれるソフトウェアによって、このようなマルチメディアデータを閲覧することが可能なシステムが広く普及している。このようなシステムの例としては、例えば、インターネットにおけるWorld Wide Web(WWW)と呼ばれるシステムなどが挙げられる。
【0003】
マルチメディアデータを含む文書は、例えばHyper Text Markup Language(HTML)と呼ばれる記述言語によって記述されており、テキスト文書、静止画、動画、音楽データ、およびJava(登録商標)アプレットなどのアプリケーションプログラムなどを含むことが可能になっている。このような文書(以下、HTMLページと称する)およびマルチメディアデータには、それぞれURL(Uniform Resource Locator)と呼ばれる固有のアドレスが割り当てられている。ユーザは、ブラウザ上においてURLを指定することによって、所望のHTMLページあるいはマルチメディアデータにアクセスすることができる。また、HTMLページには、他のページやマルチメディアデータへアクセスするためのリンクなども埋め込まれており、ユーザは、このリンクをブラウザ上でポイントすることによって、リンク先のページやマルチメディアデータに移動することも可能となっている。
【0004】
クライアントコンピュータにおけるHTML表示ソフトウェアであるブラウザとしては、例えば、Netscape Communications 社のNetscape Communicator (登録商標)や、Microsoft 社のInternet Explorer (登録商標)などの製品が広く普及している。これらのブラウザでは、アクセスしたHTMLページおよびマルチメディアデータのURL、アクセス日時、およびタイトルなどが、履歴データとしてクライアントコンピュータ内のハードディスクに記憶することが可能になっている。そして、ユーザは、過去にアクセスしたHTMLページあるいはマルチメディアデータに再びアクセスしたい時に、この履歴データを参照することによって、容易に所望のHTMLページあるいはマルチメディアデータにアクセスすることが可能となる。
【0005】
また、例えばNetscape Communicator では、履歴データに基づいて、過去にアクセスしたHTMLページおよびマルチメディアデータのURLを、頻度順、あるいは日時順などに並べ変えて表示することが可能となっている。
【0006】
さらに、例えば特開平10-143519号公報には、ユーザが過去にアクセスしたURLに対して、頻度や視聴時間をもとに順序づけを行い、その結果を表示する方法および装置が開示されている。
【0007】
また、例えば特開平9-204347号公報、特開平10-21134号公報には、サーバコンピュータとクライアントコンピュータとの間でURLの中継を行うゲートウェイコンピュータにおいて、ゲートウェイコンピュータに中継キャッシュが内蔵されている場合、過去に中継したURLに対して、その頻度の算出を行ってリストを作成するとともに、頻度順にゲートウェイコンピュータが自発的にキャッシュの更新を行う方法が開示されている。
【0008】
これらの方式に共通する点としては、過去にアクセスしたHTMLページおよびマルチメディアデータのURLに関して、その頻度に注目し、それらを統計処理することによって頻度を算出し、頻度の高いHTMLページおよびマルチメディアデータは、ユーザの要求度が高いと判断している点である。
【0009】
【発明が解決しようとする課題】
ここで、情報を提供する複数のサーバコンピュータと、ゲートウェイコンピュータと、
クライアントコンピュータとからなるシステムを想定する。なお、ゲートウェイコンピュータとは、異なるネットワーク/システムを相互接続するためのコンピュータを示すものである。
【0010】
そして、例えば、図8に示すように、あるサーバコンピュータ上に、URLが“http://www.news/”で示されるHTMLページが存在し、別のサーバコンピュータ上に、URLが“http://www.hello.nara/”で示されるHTMLページが存在するとする。
【0011】
URLが“http://www.news/”で示されるHTMLページは、あるニュース情報(「日々新聞」)を提供するページであり、「新刊情報(“http://www.news/1.html”)」、「天気予報(“http://www.news/2.html”)」、「A社新製品(“http://www.news/3.html”)」、「B社新製品(“http://www.news/4.html”)」、および「C社新製品(“http://www.news/5.html”)」の5つのHTMLページへのリンクがはられてある。
【0012】
また、URLが“http://www.hello.nara/”で示されるHTMLページは、奈良県地域情報を提供するページであり、「株式情報(“http://www/a.mov”)」および「道路情報(“http://www/b.mov”)」の2つの動画データ、および「お知らせ(“http://www/index.html ”)」のHTMLページにリンクがはられてある。
【0013】
ここで、あるユーザが、クライアントコンピュータにおいて、まず、URLが“http://www.news/”で示されるHTMLページにアクセスし、このページからリンクされている5つのHTMLページ(テキストデータ)を閲覧し、その後、URLが“http://www.hello.nara/”で示されるHTMLページにアクセスし、このページからリンクされている2つの動画データ、および1つのHTMLページ(テキストデータ)を閲覧したとする。
【0014】
このとき、以下に示す表1のようなアクセスログが、ゲートウェイコンピュータに記録される。
【0015】
【表1】
Figure 0003664906
【0016】
なお、表1において、URLが“http://www.news/”で示されるHTMLページが一回しかカウントされていないのは、次のような理由によるものである。例えば、URLが“http://www.news/”で示されるHTMLページから、リンク先である「新刊情報(“http://www.news/1.html”)」のページへ移動し、閲覧後、ブラウザのバックボタン(戻るボタン)を押すことによって再び“http://www.news/”のページに戻り、同様にして他の4つのリンク先に移動したとする。この際に、ブラウザには、通常、キャッシュが一定量蓄積されており、「新刊情報(“http://www.news/1.html”)」のページから、“http://www.news/”のページに戻る際には、このキャッシュから“http://www.news/”のページのデータが取り出されることになる。この場合、ゲートウェイコンピュータには、URLの取得要求が伝達されないので、ゲートウェイコンピュータのアクセスログには、URLが“http://www.news/”で示されるHTMLページが、一回しか現れてこないことになる。
【0017】
表1に示す集計結果によれば、どのURLも1回の出現頻度であるから、上記のように、出現頻度に基づいてユーザの要求度を判断する方式によれば、どのURLもユーザの要求度は同等とみなされることになる。しかしながら、実際には、ユーザは、後日、URLが“http://www.news/”で示されるHTMLページや、URLが“http://www.hello.nara/”で示されるHTMLページに再びアクセスし、新しいリンクが作られていれば、その新しいリンクにアクセスする、というアクセス動作を行う可能性が高いと予想される。この際に、すでにアクセス済みのURLである“http://www.news/1.html”や、“http://www.news/2.html”などへ再びアクセスすることはほとんどないものと予想される。
【0018】
すなわち、上記のように、出現頻度に基づいてユーザの要求度を判断する方式の場合には、実際のユーザの要求度を反映した判定を行っていないことになる。よって、このような方式によって示された結果には、無駄なデータが多く含まれることになり、ユーザにとって有用な情報が示されているとは言いがたい場合がありうる。
【0019】
本発明は上記の問題点を解決するためになされたもので、その目的は、WWWなどのハイパーテキストシステムにおいて、ユーザがどのようなページを参照元としてURLページを参照しているかを集計し、その参照元のリストをユーザに提示することにある。
【0020】
【課題を解決するための手段】
上記の課題を解決するために、本発明の情報源観測装置は、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを 閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測装置であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する抽出手段と、上記抽出された参照元のURLを参照情報として保存する参照情報保存手段と、上記参照情報を各URL毎に集計するカウント手段と、上記カウント手段による集計結果を、上記特定クライアントコンピュータに出力する出力手段とを備えていることを特徴としている。
【0021】
上記の構成によれば、参照情報保存手段によって、クライアントコンピュータからアクセスがあったデータファイルの参照元のURLを参照情報として保存し、カウント手段によって、上記参照情報を、参照元となる各URL毎に集計するので、参照元として頻繁に利用されるURLを把握することが可能となる。すなわち、ユーザにとって有用なURLを的確に提示することが可能となる。
【0022】
さらに、上記の構成によれば、抽出手段によって、クライアントコンピュータから発行される要求ヘッダから参照元となるURLの情報を抽出しており、このような要求ヘッダは、HTTP1.0の仕様に基づいているものであるので、特別にクライアントコンピュータにデータを要求することなく、参照元となるURLの情報を取得することができる。
【0023】
さらに、本発明の情報源観測装置は、上記構成において、上記抽出手段が、上記特定クライアントコンピュータにおいて、上記不特定多数のサーバコンピュータ上のデータファイルにアクセスが行われた際に、サーバコンピュータから発行される応答ヘッダから、上記データファイルのデータタイプを抽出するものであり、上記参照情報を、上記データタイプ別に、参照元となる各URL毎に集計するソート手段をさらに備えていることを特徴としている。
【0024】
上記の構成によれば、抽出手段が、クライアントコンピュータにおいて、サーバコンピュータ上のデータファイルにアクセスが行われた際に、サーバコンピュータから発行される応答ヘッダから、上記データファイルのデータタイプを抽出しており、このような応答ヘッダは、HTTP1.0の仕様に基づいているものであるので、特別にサーバコンピュータにデータを要求することなく、データファイルのデータタイプを取得することができる。
【0025】
さらに、上記の構成によれば、ソート手段によって、参照情報を、データタイプ別に、
参照元となる各URL毎に集計するので、データタイプ毎に、参照元として頻繁に利用されるURLを把握することが可能となる。すなわち、データタイプに応じて、ユーザにとって有用なURLを的確に提示することが可能となる。
【0026】
さらに、本発明の情報源観測装置は、上記構成において、参照情報保存手段が、さらに、上記参照元のURLのタイトルを示す情報を保存するものであり、上記出力手段は、当該保存された参照元のURLのタイトルを示す情報を、上記特定クライアントコンピュータに出力することを特徴としている。
【0027】
上記の構成によれば、参照情報保存手段によって、クライアントコンピュータからアクセスがあったデータファイルに付随するテキストが参照情報としてさらに保存されるので、ユーザにとって有用なURLを提示する際に、ユーザの嗜好する内容をも提示することができる。
【0028】
さらに、本発明の情報源観測装置は、上記構成において、クライアントコンピュータからアクセスがあったデータファイルをキャッシュとして所定量蓄積する情報蓄積手段と、
上記参照情報の集計結果に基づいて、上記キャッシュのうち、参照元となるURLのデータファイル、および、参照元となるURLのデータファイルに所定のリンクレベルでリンクされているデータファイルを、所定の時間毎に、該当するサーバコンピュータにアクセスすることによって更新する情報更新手段とをさらに備えていることを特徴としている。
【0029】
上記の構成によれば、情報蓄積手段によって、クライアントコンピュータからアクセスがあったデータファイルをキャッシュとして所定量蓄積し、情報更新手段によって、参照情報の集計結果に基づいて、上記キャッシュのうち、参照元となるURLのデータファイル、および、参照元となるURLのデータファイルに所定のリンクレベルでリンクされているデータファイルを、所定の時間毎に、該当するサーバコンピュータにアクセスすることによって更新するので、ユーザが参照元として数多く利用するURLを起点にした情報収集となり、ユーザが利用する可能性の高い、的確な情報収集が可能となる。これにより、参照元のURLからリンクされているデータに対してユーザがアクセスした場合にも、
キャッシュデータの中からデータを取り出すことが可能となり、アクセススピードの向上およびネットワークトラフィックの低減を図ることができる。
【0030】
さらに、本発明の情報源観測装置は、上記構成において、上記キャッシュ内のデータファイルに対して、検索処理を行う検索手段をさらに備えていることを特徴としている。
【0031】
上記の構成によれば、検索手段によって、上記キャッシュ内のデータファイルに対して、検索処理を行うので、ユーザの情報源をもとに情報収集されたファイルオブジェクトに対して検索が行われることになり、一般のインターネット検索エンジンなどに比べて、情報の鮮度が高く、かつ、ユーザのニーズに適した検索結果を提供することができる。
【0032】
本発明の情報源観測方法は、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測方法であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する第1ステップと、上記抽出された参照元のURLを参照情報として保存する第2ステップと、上記参照情報を各URL毎に集計する第3ステップと、上記第3ステップによる集計結果を、上記特定クライアントコンピュータに出力する第4ステップとを備えていることを特徴としている。
【0033】
上記の方法によれば、クライアントコンピュータからアクセスがあったデータファイルの参照元のURLを参照情報として保存し、上記参照情報を、参照元となる各URL毎に集計するので、参照元として頻繁に利用されるURLを把握することが可能となる。すなわち、ユーザにとって有用なURLを的確に提示することが可能となる。
【0034】
本発明のコンピュータ読み取り可能な記録媒体は、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測処理を実行させるプログラムを記録した記録媒体であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する第1ステップと、上記抽出された参照元のURLを参照情報として保存する第2ステップと、上記参照情報を各URL毎に集計する第3ステップと、上記第3ステップによる集計結果を、上記特定クライアントコンピュータに出力する第4ステップとを、
コンピュータに実行させるためのプログラムを記録したことを特徴としている。
【0035】
上記の構成によれば、クライアントコンピュータからアクセスがあったデータファイルの参照元のURLを参照情報として保存し、上記参照情報を、参照元となる各URL毎に集計するプログラムが記録されているので、参照元として頻繁に利用されるURLを把握することが可能なプログラムを提供することができる。すなわち、ユーザにとって有用なURLを的確に提示することが可能なプログラムを提供することができる。
【0036】
【発明の実施の形態】
本発明の実施の一形態について図1ないし図7に基づいて説明すれば、以下のとおりである。
【0037】
図1は、本実施形態に係るコンピュータネットワークシステムの概略構成を示すブロック図である。該コンピュータネットワークシステムは、サーバコンピュータ1、情報源観測手段(情報源観測装置)2、およびクライアントコンピュータ3とを備えている。なお、図中において、サーバコンピュータ1は1つしか記載されていないが、サーバコンピュータ1としては、インターネット上に存在する無数のサーバコンピュータが該当することになる。
【0038】
サーバコンピュータ1は、HTMLページや各種マルチメディアデータを保持しており、例えばHTTP(Hyper Text Transfer Protocol)デーモンと呼ばれるサーバソフトウェアによって、これらのデータの管理、および外部コンピュータからのアクセスの管理を行っている。
【0039】
クライアントコンピュータ3は、HTMLページや各種マルチメディアデータを表示可能なブラウザとよばれるソフトウェアを備えており、ユーザはこのクライアントコンピュータ3上においてブラウザを操作することによって、所望のHTMLページや各種マルチメディアデータを閲覧することができる。
【0040】
情報源観測手段2としては、例えばファイアーウォール上に設けられるゲートウェイコンピュータや、インターネット上に設けられるHTTPプロキシサーバコンピュータなどが該当し、HTTPリクエストと応答の中継を行うことを基本としている。この情報源観測手段2は、参照情報抽出手段4、参照情報保存手段5、カウント手段6、ソート手段7、データ変換手段8、情報更新手段9、情報蓄積手段10、および検索手段11を備えている。これらの各手段についての説明は後述する。
【0041】
また、図2に示すように、情報源観測手段2を、クライアントコンピュータ3に内蔵させた構成とすることも可能である。このように、クライアントコンピュータ3に内蔵可能なHTTPプロキシサーバとしては、シャープ株式会社製のシャープモバイルプロキシ(商品名)などがある。
【0042】
さらに、情報源観測手段2を、クライアントコンピュータ3におけるブラウザの一部として、ソフトウェア的に構成することも可能である。
【0043】
図3は、クライアントコンピュータ3の概略構成を示すブロック図である。図3に示すように、クライアントコンピュータ3は、CPU(Central Processing Unit) 12、RAM(Random Access Memory)などで構成されるメモリ13、ハードディスクやフラッシュメモリなどで構成される不揮発性メモリ14、外部ネットワークとのインターフェースとなるネットワークI/O(Input/Output)15、キーボードやマウスなどで構成される入力装置16、および表示装置17を備えており、これらがバス18によって接続されている。
このような構成のクライアントコンピュータ3は、一般的にパーソナルコンピュータと呼ばれるコンピュータによって構成されることになる。
【0044】
ここで、クライアントコンピュータ3におけるブラウザによってWWW上のHTMLページを閲覧する際の、情報源観測手段2の動作について説明する。
【0045】
まず、あるHTMLページをブラウザ上に表示させている状態から、そのHTMLページに埋め込まれているリンクをマウスカーソルでポイントし、クリックすることによって、リンク先のURLにアクセスした場合を想定する。例えば、図8に示す例において、URLが“http://www.news/" で示されるHTMLページを表示させている状態から、「新刊情報」のHTMLページを示すリンクをクリックしたとする。この時、クライアントコンピュータ3において、ネットワークI/O15を介して、情報源観測手段2に対してTCP/IP(Transmission Control Protocol/Internet Protocol) のコネクションがオープンされ、図4に示すような要求ヘッダが発行される。
【0046】
この要求ヘッダに含まれるReferer ヘッダは、ブラウザによって発行されているものであり、要求されているURLの参照元情報が示されている。図4に示す例では、現在要求しているURL“http:// www.news/1.html"が、URLが“http://www.news/" のHTMLページからのリンクによって要求されていることを示している。このような要求ヘッダは、HTTP1.0の仕様で規定されている標準ヘッダである。このような要求ヘッダの情報は、通常サーバコンピュータにて記録されることを想定して定義されているものである。
【0047】
情報源観測手段2は、上記のような要求ヘッダを受けて、URLが“www.news" で示されるサーバコンピュータ1にコネクションを張り、該当するファイル(1.html)を受信し、クライアントコンピュータ3のブラウザに転送する。この際に、情報源観測手段2がサーバコンピュータ1から受信する応答データは、図5に示すように、応答ヘッダとテキストデータ(HTMLデータ)とからなっている。
【0048】
図5において、応答ヘッダにあるContent-Typeヘッダは、後に続くデータのマルチメディアタイプを示しており、図5に示す例では、後に続くデータがテキストデータ(HTMLデータ)であることを示している。
【0049】
本実施形態における情報源観測手段2は、上記のような要求ヘッダおよび応答ヘッダに含まれる情報を利用して、アクセスしたURLのうちで正常応答を示したURLの参照元情報およびマルチメディアタイプを取得し、アクセスログの項目として記録している。これにより、例えば、アクセスログにおいて参照元情報に注目して集計を行えば、アクセスしたURLの参照元となったURLを頻度順に並びかえて、情報源リストとしてユーザに提示することが可能となる。
【0050】
また、参照元情報は、マルチメディアデータタイプ毎に集計することも可能となる。例えば、テキストデータ、動画データ、音楽データなどのデータタイプ毎に分別して、情報源リストとしてユーザに提示することも可能となる。
【0051】
また、情報源観測手段2として、HTTPプロキシサーバコンピュータやゲートウェイコンピュータなどのような、キャッシュを蓄積するタイプのコンピュータの場合、情報源リストに基づいて、参照元として頻度の高いURLに対して、キャッシュを自発的に更新する構成とすることも可能である。
【0052】
次に、情報源観測手段2における処理の流れを、図2を参照しながら、図6に示すフローチャートに基づいて説明する。なお、以下の説明において、情報源観測手段2は、クライアントコンピュータ3に内蔵されているものとしているが、クライアントコンピュータ3の外部に設けられた構成においても、ほぼ同様の処理が行われる。
【0053】
まず、情報源観測手段2は、ネットワークI/O15を用いてサーバソケットをオープンし、中継要求を受け付ける待機状態に入る(ステップ1、以降、S1のように表記する)。中継要求を受信した場合には、S2に進む。なお、上記のように、情報源観測手段2がクライアントコンピュータ3に内蔵されている場合には、情報源観測手段2は、メモリ13を経由してブラウザ3Aと通信する。
【0054】
次に、情報源観測手段2は、中継要求を受け付けると、参照情報抽出手段4によって、
要求ヘッダから、参照元情報であるReferer ヘッダを抽出し、この内容をメモリ13に一時記憶させる(S2)。
【0055】
次に、情報源観測手段2は、サーバコンピュータ1に対してコネクションを開いて要求ヘッダを中継する(S3)。この際に、要求したURLが存在しない場合には、エラーメッセージがクライアントコンピュータ3の表示装置17によってユーザに提示され、メモリ13に一次記憶させたReferer ヘッダの情報が破棄される(S4)。
【0056】
要求したURLが存在する場合(応答コードが正常である場合)には、そのURLに該当するサーバコンピュータ1からの応答データを受け取り、クライアントコンピュータ3におけるブラウザ3Aに該応答データを送信する。また、これと同時に、参照情報保存手段5によって、要求したURLが、応答ヘッダに含まれるContent-typeヘッダに基づいて検出されるデータタイプ、Referer ヘッダに基づいて検出される参照元情報、および参照元のタイトルとともに、参照情報として不揮発性メモリ14に記録され、保存される(S5)。この保存された参照情報の保存データの例を表2に示す。
【0057】
【表2】
Figure 0003664906
【0058】
ここで、保存されるデータのデータタイプとしてはtext/htmlなどがあるが、これ以外にあらかじめ指定されたデータタイプだけを保存してもよい。なお、Content-typeヘッダがtext/htmlであるときにおいて、応答データのHTMLデータを構文解析し、<title> タグで囲まれた部分を抽出することによって、該当ページのタイトルとして同時に保存してもよい。
【0059】
上記のような参照情報の保存処理は、保存データが一定数になるまで繰り返して行われる(S6)。そして、保存データが一定数に達したら、次のステップ(S7)に進む。
【0060】
一定数に達した保存データに対して、カウント手段6によって、参照元情報毎に参照に用いられた回数を集計し、集計データを作成する(S7)。そして、ソート手段7によって上記集計データをデータタイプ別にソートする(S8)。このソート結果の例を表3および表4に示す。なお、表3は、表2に示す参照情報の保存データの例において、データタイプとしてtext/htmlまたはmovie を集計した結果を示し、表4は、データタイプとしてtext/htmlのみを集計した結果を示している。
【0061】
【表3】
Figure 0003664906
【0062】
【表4】
Figure 0003664906
【0063】
このようにソートされた参照情報のデータを、データ変換手段によって、例えばHTMLデータなどの、ユーザがブラウザで表示することが可能なデータ形式に変換し、情報源リストとして表示装置17に表示することによって、ユーザに提示する(S9)。このような情報源リストの例を図7に示す。
【0064】
情報源リストには、参照元情報のページのタイトルを示す情報が付随しているので、クライアントコンピュータ3を使用するユーザが、どのような情報を求めることを習慣としているかを把握することができる。すなわち、この情報源リストは、嗜好データベースとして利用できる。例えば、図7に示す例では、ユーザが日々新聞、奈良県の地域情報などを情報ソースとして重要と考えていることがわかる。また、各データタイプ毎に参照元情報の集計が提示されているので、データタイプ毎に、重要となる参照元情報を把握することができる。
【0065】
ここで、情報源観測手段2が、アクセスしたURLのデータをキャッシュとして情報貯蓄手段10に一定量蓄積するものである場合を考える。この場合、情報更新手段9が、所定の時間毎に、上記のソートされた参照情報のデータに基づいて、サーバコンピュータ1から情報を自発的に取得し、情報蓄積手段10に蓄積されたデータの更新が行われる(S10)。このような情報更新処理は、ソートされた参照情報のデータにおいて、例えば全てのデータタイプにおける参照元として頻度の高い順、あるいは、ユーザが指定したデータタイプにおける参照元として頻度の高い順などに基づいて行われる。
【0066】
この情報更新手段9による情報更新処理において、情報源リストに掲載されたURL群を対象にリンクレベル2以上でファイルオブジェクトの自動収集する処理を行えば、参照元としてのURLからリンクされているデータ、すなわち、ユーザがアクセスする可能性の高いデータをも自動的に情報蓄積手段10に蓄積されることになる。すなわち、リンクレベルを深くすれば、参照元としてのURLからリンクされている広い範囲の関連情報まで自動収集することになるが、ユーザが参照元として数多く利用するURLを起点にした情報収集となるので、ユーザが利用する可能性の高い、的確な情報収集が可能となる。これにより、参照元のURLからリンクされているデータに対してユーザがアクセスした場合にも、キャッシュデータの中からデータを取り出すことが可能となり、アクセススピードの向上およびネットワークトラフィックの低減を図ることができる。
【0067】
さらに、上記のように、情報源リストに掲載されたURL群を対象に所定のリンクレベル以上で自動収集したファイルオブジェクトに対して、検索手段11により検索をかけ、
ユーザに結果を提示することも可能である。この場合、ユーザの情報源をもとに情報収集されたファイルオブジェクトに対して検索が行われるので、一般のインターネット検索エンジンなどに比べて、情報の鮮度が高く、かつ、ユーザのニーズに適した検索結果を提供することができる。
【0068】
以上のようなS1からS10のステップを、情報源観測手段2は繰り返し行うことになる。
【0069】
このように、参照情報を集計し、出現頻度順にソートした結果において、ユーザが参照元として頻繁に利用したURLは上位にランクされることになる。したがって、このようなソート結果をユーザに提示すれば、ユーザは、所望の情報をどこから得ることが出来るかを、自分の情報源リストから発見することが可能となり、この情報源リストからリンクをたどることによって、容易に情報を得ることが可能となる。
【0070】
ここで、情報源観測手段2がクライアントコンピュータ3に内蔵されている構成の場合において、情報源観測手段2が備える各手段が、クライアントコンピュータ2内でどのように構成されるかについて、その一例を説明する。まず、上記のS1からS10までの処理を行うプログラムコード、およびこのプログラムコードを実行可能なOS(Operating System)コードが、ファイル形態で不揮発性メモリ14に格納されている。また、CPUアドレス空間にマッピング可能な、ROM(Read Only Memory)などの不揮発性メモリ14に、電源がONされた時に、上記のOSコードをメモリ13にロードさせる処理などを行うコードが格納されている。すなわち、情報源観測手段2が備える各手段は、不揮発性メモリに格納されたプログラムコードおよびOSコードが、メモリ12にロードされて、CPU12によって実行されることによって実現される。また、情報源観測手段2が、クライアントコンピュータ3とは別の、外部のコンピュータに設けられている場合にも、上記とほぼ同様の構成によって実現されることになる。
【0071】
また、情報源観測手段2が、例えばインターネット対応テレビやインターネット対応電話などの情報家電機器に内蔵されている場合には、例えば、上記のような処理を行うプログラムコードが直接ROMなどの不揮発性メモリに記憶され、CPUがこのプログラムコードをROMから読み出すことによって実行されることになる。また、このような情報家電機器においても、OSを備えた構成とし、OS上でプログラムを実行する構成とすることも可能である。
【0072】
なお、本発明の情報源観測装置は、ライアントコンピュータにおいて、サーバコンピュータ上のデータファイルにアクセスが行われる際に、クライアントコンピュータから発行される要求ヘッダから参照元となるURLの情報を抽出する参照情報抽出手段をさらに備えている構成であってもよい。
【0073】
上記の構成によれば、参照情報抽出手段によって、クライアントコンピュータから発行される要求ヘッダから参照元となるURLの情報を抽出しており、このような要求ヘッダは、HTTP1.0の仕様に基づいているものであるので、特別にクライアントコンピュータにデータを要求することなく、参照元となるURLの情報を取得することができる。
【0074】
【発明の効果】
以上のように、発明に係る情報源観測装置は、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測装置であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する抽出手段と、上記抽出された参照元のURLを参照情報として保存する参照情報保存手段と、上記参照情報を各URL毎に集計するカウント手段と、上記カウント手段による集計結果を、上記特定クライアントコンピュータに出力する出力手段とを備えている構成である。
【0075】
これにより、参照元として頻繁に利用されるURLを把握することが可能となるという効果を奏する。すなわち、ユーザにとって有用なURLを的確に提示することが可能となるという効果を奏する。
【0076】
さらに、抽出手段により、特別にクライアントコンピュータにデータを要求することなく、参照元となるURLの情報を取得することができるという効果を奏する。
【0077】
さらに、本発明に係る情報源観測装置は、上記抽出手段が、上記特定クライアントコンピュータにおいて、上記不特定多数のサーバコンピュータ上のデータファイルにアクセスが行われた際に、サーバコンピュータから発行される応答ヘッダから、上記データファイルのデータタイプを抽出するものであり、上記参照情報を、上記データタイプ別に、参照元となる各URL毎に集計するソート手段をさらに備えている構成である。
【0078】
これにより、特別にサーバコンピュータにデータを要求することなく、データファイルのデータタイプを取得することができるという効果を奏する。
【0079】
さらに、ソート手段を備えていることにより、データタイプ毎に、参照元として頻繁に利用されるURLを把握することが可能となるという効果を奏する。すなわち、データタイプに応じて、ユーザにとって有用なURLを的確に提示することが可能となるという効果を奏する。
【0080】
さらに、本発明に係る情報源観測装置は、上記参照情報保存手段が、さらに、上記参照元のURLのタイトルを示す情報を保存するものであり、上記出力手段は、当該保存された参照元のURLのタイトルを示す情報を、上記特定クライアントコンピュータに出力する構成である。
【0081】
これにより、ユーザにとって有用なURLを提示する際に、ユーザの嗜好する内容をも提示することができるという効果を奏する。
【0082】
さらに、本発明に係る情報源観測装置は、クライアントコンピュータからアクセスがあったデータファイルをキャッシュとして所定量蓄積する情報蓄積手段と、上記参照情報の集計結果に基づいて、上記キャッシュのうち、参照元となるURLのデータファイル、および、参照元となるURLのデータファイルに所定のリンクレベルでリンクされているデータファイルを、所定の時間毎に、該当するサーバコンピュータにアクセスすることによって更新する情報更新手段とをさらに備えている構成である。
【0083】
これにより、ユーザが参照元として数多く利用するURLを起点にした情報収集となり、ユーザが利用する可能性の高い、的確な情報収集が可能となる。これにより、参照元のURLからリンクされているデータに対してユーザがアクセスした場合にも、キャッシュデータの中からデータを取り出すことが可能となり、アクセススピードの向上およびネットワークトラフィックの低減を図ることができるという効果を奏する。
【0084】
さらに、本発明に係る情報源観測装置は、上記キャッシュ内のデータファイルに対して、検索処理を行う検索手段をさらに備えている構成である。
【0085】
これにより、ユーザの情報源をもとに情報収集されたファイルオブジェクトに対して検索が行われることになり、一般のインターネット検索エンジンなどに比べて、情報の鮮度が高く、かつ、ユーザのニーズに適した検索結果を提供することができるという効果を奏する。
【0086】
本発明に係る情報源観測方法は、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測方法であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する第1ステップと、上記抽出された参照元のURLを参照情報として保存する第2ステップと、上記参照情報を各URL毎に集計する第3ステップと、上記第3ステップによる集計結果を、上記特定クライアントコンピュータに出力する第4ステップとを有している。
【0087】
これにより、参照元として頻繁に利用されるURLを把握することが可能となるという効果を奏する。すなわち、ユーザにとって有用なURLを的確に提示することが可能となるという効果を奏する。
【0088】
本発明に係るコンピュータ読み取り可能な記録媒体は、ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測処理を実行させるプログラムを記録した記録媒体であって、上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する第1ステップと、上記抽出された参照元のURLを参照情報として保存する第2ステップと、上記参照情報を各URL毎に集計する第3ステップと、上記第3ステップによる集計結果を、上記特定クライアントコンピュータに出力する第4ステップとを、コンピュータに実行させるためのプログラムを記録した構成である。
【0089】
これにより、参照元として頻繁に利用されるURLを把握することが可能なプログラムを提供することができるという効果を奏する。すなわち、ユーザにとって有用なURLを的確に提示することが可能なプログラムを提供することができるという効果を奏する。
【図面の簡単な説明】
【図1】 本発明の実施の一形態に係る情報源観測手段の概略構成、および、該情報源観測手段と、それに接続されるサーバコンピュータおよびクライアントコンピュータとの関係を示すブロック図である。
【図2】 上記情報源観測手段がクライアントコンピュータに内蔵された場合の概略構成を示すブロック図である。
【図3】 上記情報源観測手段の構成要素の概略を示すブロック図である。
【図4】 クライアントコンピュータから発行される要求ヘッダの一例を示す説明図である。
【図5】 サーバコンピュータから発行される応答ヘッダの一例を示す説明図である。
【図6】 情報源観測手段における処理の流れを示すフローチャートである。
【図7】 情報源観測手段が備えるデータ変換手段によって生成されたデータを表示させたときの一例を示す説明図である。
【図8】 WWW上におけるHTMLページおよびデータファイルのリンクの様子の一例を示す概念図である。
【符号の説明】
1 サーバコンピュータ
2 情報源観測手段(情報源観測装置)
3 クライアントコンピュータ
4 参照情報抽出手段
5 参照情報保存手段
6 カウント手段
7 ソート手段
8 データ変換手段
9 情報更新手段
10 情報蓄積手段
11 検索手段

Claims (8)

  1. ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測装置であって、
    上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する抽出手段と、
    上記抽出された参照元のURLを参照情報として保存する参照情報保存手段と、
    上記参照情報を各URL毎に集計するカウント手段と、
    上記カウント手段による集計結果を、上記特定クライアントコンピュータに出力する出力手段とを備えていることを特徴とする情報源観測装置。
  2. 上記出力手段は、上記カウント手段による集計結果を、上記特定クライアントコンピュータにて表示可能なデータ形式に変換して出力することを特徴とする請求項1記載の情報源観測装置。
  3. 上記抽出手段が、上記特定クライアントコンピュータにおいて、上記不特定多数のサーバコンピュータ上のデータファイルにアクセスが行われた際に、サーバコンピュータから発行される応答ヘッダから、上記データファイルのデータタイプを抽出するものであり、
    上記参照情報を、上記データタイプ別に、参照元となる各URL毎に集計するソート手段をさらに備えていることを特徴とする請求項1記載の情報源観測装置。
  4. 上記参照情報保存手段は、さらに、上記参照元のURLのタイトルを示す情報を保存するものであり、
    上記出力手段は、当該保存された参照元のURLのタイトルを示す情報を、上記特定クライアントコンピュータに出力することを特徴とする請求項1記載の情報源観測装置。
  5. クライアントコンピュータからアクセスがあったデータファイルをキャッシュとして所定量蓄積する情報蓄積手段と、
    上記参照情報の集計結果に基づいて、上記キャッシュのうち、参照元となるURLのデータファイル、および、参照元となるURLのデータファイルに所定のリンクレベルでリンクされているデータファイルを、所定の時間毎に、該当するサーバコンピュータにアクセスすることによって更新する情報更新手段とをさらに備えていることを特徴とする請求項1記載の情報源観測装置。
  6. 上記キャッシュ内のデータファイルに対して、検索処理を行う検索手段をさらに備えていることを特徴とする請求項5記載の情報源観測装置。
  7. ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測方法であって、
    上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する第1ステップと、
    上記抽出された参照元のURLを参照情報として保存する第2ステップと、
    上記参照情報を各URL毎に集計する第3ステップと、
    上記第3ステップによる集計結果を、上記特定クライアントコンピュータに出力する第4ステップとを備えていることを特徴とする情報源観測方法。
  8. ハイパーリンク構造を有するデータファイルを保持する不特定多数のサーバコンピュータと、上記データファイルを閲覧する特定クライアントコンピュータとがネットワーク接続された環境下で、特定クライアントコンピュータから不特定多数のサーバコンピュータへのアクセスを観測する情報源観測処理を実行させるプログラムを記録した記録媒体であって、
    上記特定クライアントコンピュータからネットワーク上に出力されるデータファイルの要求ヘッダから参照元となるURLを抽出する第1ステップと、
    上記抽出された参照元のURLを参照情報として保存する第2ステップと、
    上記参照情報を各URL毎に集計する第3ステップと、
    上記第3ステップによる集計結果を、上記特定クライアントコンピュータに出力する第4ステップとを、コンピュータに実行させるためのプログラムを記録した、コンピュータ読み取り可能であることを特徴とする記録媒体。
JP02864799A 1999-02-05 1999-02-05 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体 Expired - Fee Related JP3664906B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02864799A JP3664906B2 (ja) 1999-02-05 1999-02-05 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02864799A JP3664906B2 (ja) 1999-02-05 1999-02-05 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2000227886A JP2000227886A (ja) 2000-08-15
JP3664906B2 true JP3664906B2 (ja) 2005-06-29

Family

ID=12254314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02864799A Expired - Fee Related JP3664906B2 (ja) 1999-02-05 1999-02-05 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3664906B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3664917B2 (ja) * 1999-08-06 2005-06-29 シャープ株式会社 ネットワーク情報の表示方法およびその方法をプログラムとして格納した記憶媒体ならびにそのプログラムを実行するコンピュータ
JP3666638B2 (ja) * 1999-10-27 2005-06-29 シャープ株式会社 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3664923B2 (ja) * 1999-10-27 2005-06-29 シャープ株式会社 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2002025490A1 (fr) * 2000-09-20 2002-03-28 Cai Co.. Ltd. Procede et systeme de recherche automatique d'une page d'accueil sur internet
JP2002117073A (ja) * 2000-10-04 2002-04-19 Sharp Corp 新着情報提示方法およびその方法を実行させるプログラムを記録した記録媒体ならびにそのプログラムを実行するコンピュータ
US20020133603A1 (en) * 2001-03-13 2002-09-19 Fujitsu Limited Method of and apparatus for filtering access, and computer product
JP3623939B2 (ja) * 2001-12-11 2005-02-23 株式会社エヌ・ティ・ティ・データ リクエストデータを基にした情報提供システム及び方法
JP4909748B2 (ja) * 2007-01-22 2012-04-04 ヤフー株式会社 ページ移動操作の履歴情報に基づいてWebページへの参照元のWebページに関する情報を推薦する方法及びサーバ
JP4935621B2 (ja) * 2007-10-25 2012-05-23 大日本印刷株式会社 広告決定装置

Also Published As

Publication number Publication date
JP2000227886A (ja) 2000-08-15

Similar Documents

Publication Publication Date Title
US7146415B1 (en) Information source monitor device for network information, monitoring and display method for the same, storage medium storing the method as a program, and a computer for executing the program
CA2673110C (en) Method and system for intellegent processing of electronic information
RU2522103C2 (ru) Способ и браузер для уведомления об обновлении
US5649186A (en) System and method for a computer-based dynamic information clipping service
CN100424694C (zh) 一种网络收藏夹的实现方法
US20020107847A1 (en) Method and system for visual internet search engine
US20160070797A1 (en) Methods and systems for prioritizing a crawl
JP2006520939A (ja) インターネット使用者の接続意図判断方法およびこれを用いたインターネット上の広告方法とそのシステム
KR102222287B1 (ko) 은닉 url에 포함된 정형 및 비정형 데이터의 수집을 위한 웹 크롤러 시스템
JP2006309515A (ja) 情報配信方法および情報配信サーバ
JP2006099341A (ja) 更新履歴生成装置及びプログラム
JP3664906B2 (ja) 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体
JP2002140224A (ja) コンテンツ変更管理方法
CN106557584A (zh) 一种网址收藏方法及装置
US7114124B2 (en) Method and system for information retrieval from query evaluations of very large full-text databases
JP3666638B2 (ja) 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009075908A (ja) ウェブ・ページ閲覧履歴管理システム及びウェブ・ページ閲覧履歴管理方法、並びにコンピュータ・プログラム
JP3664923B2 (ja) 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4602104B2 (ja) サイト情報収集システム
JP2003271647A (ja) 閲覧ファイルデータ提供方法、閲覧頻度データ提供方法、そのための中継装置、プログラム及び記録媒体
JP4751643B2 (ja) 検索装置及び検索方法
JP2006227925A (ja) 情報提供方法および情報提供装置
JP6510452B2 (ja) 検索サーバー、検索システム、検索情報配信システム、検索プログラム、検索情報配信プログラム
JP2002189917A (ja) 情報処理装置、ネットワークデータ評価方法、並びにその評価方法を実行させるためのプログラムを記録した記録媒体
KR20030004653A (ko) 실시간 웹검색을 통한 정보제공시스템 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20010727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050217

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050330

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080408

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090408

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090408

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100408

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100408

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110408

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120408

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120408

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130408

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130408

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees