以下、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、現在から所定期間内のアクセス数をパラメータとして用いて、ホームページ等の情報群のランキングを行う情報処理システム等について説明する。また、本実施の形態において、ランキングの精度を高めるために、アクセス数は、所定時間以上開いているページのみカウントする処理についても説明する。また、ページの出力時間の測定のために、あるページから次のページに飛ぶまでの時間を測定したり、いわゆるブラウザが閉じられたことの通知を受け、その通知を用いてページの出力時間を測定したりする処理についても説明する。また、出力中のページから、定期的に出力状態にあることの通知を受け、その通知を用いてページの出力時間を測定したりする処理についても説明する。
図1は、本実施の形態における情報処理システムの概念図である。情報処理システム1は、1以上の情報端末装置11、情報処理装置12を具備する。情報端末装置11は、いわゆるユーザの端末装置である。情報端末装置11は、いわゆるパーソナルコンピュータ、携帯端末(PDA)、携帯電話、テレビ、車載用端末など、何でも良い。情報処理装置12は、例えば、いわゆるWeb上のサーバ装置である。
図2は、本実施の形態における情報処理システムのブロック図である。情報端末装置11は、受付部1101、情報送信部1102、情報受信部1103、情報出力部1104を具備する。
情報処理装置12は、アクセスログ情報格納部1201、アクセスログ情報受信部1202、信号受信部1203、アクセスログ情報蓄積部1204、命令受付部1205、出力終了時刻情報取得部1206、出力時間情報取得部1207、アクセス関連情報取得部1208、ランキング情報構成部1209、出力部1210を具備する。なお、情報処理装置12は、出力終了時刻情報取得部1206、出力時間情報取得部1207のうちのどちらかを有する場合が好適であり、両方有する必要はない。
受付部1101は、ユーザから各種のデータや命令を受け付ける。受け付ける命令等の例は、例えば、ホームページのランキングの出力指示や、検索の指示である検索情報である。検索情報は、検索命令であり、1以上のキーワードだけでも良いし、SQLなどの検索式でも良いし、検索のための自然言語の文等でも良い。また、受け付ける命令等の例は、例えば、現在、世の中のユーザに閲覧されている数が多いホームページのランキング(「ホームページ視聴ランキング」いうこととする。)の出力命令である。命令やデータの入力手段は、キーボードやマウスやメニュー画面によるもの等、何でも良い。受付部1101は、キーボードやマウス等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
情報送信部1102は、受付部1101が受け付けた命令やデータ等を情報処理装置12に送信する。また、情報送信部1102は、アクセスログ情報を構成し、情報処理装置12に送信しても良い。アクセスログ情報は、例えば、情報群識別子と、現在時刻と、ユーザ識別子を有する。情報群識別子は、情報出力部1104が出力した情報群を識別する情報である。情報群識別子は、例えば、URL、URIである。また、情報群識別子は、それが存在するフォルダとファイル名でも良い。ユーザ識別子は、情報送信部1102が予め保持している。ユーザ識別子とは、ユーザに振られたIDでも良いし、ユーザが使用するソフトウェアやツールバーに振られたIDや、ユーザがログインする場合のIDでも良いし、ユーザが使用する情報端末装置11のID(IPアドレスやMACアドレスなども含む)でも良い。さらに、情報送信部1102は、情報群が出力中である場合に、所定の期間(一定であるとは限らない)ごとに、情報群を出力中である旨を示す出力中信号を送信しても良い。かかる場合、情報端末装置11は、図示しない手段により、出力中信号を構成する。また、情報送信部1102は、情報群を閲覧するアプリケーション(例えば、いわゆるWebブラウザ)が終了した旨を示す終了信号を送信しても良い。かかる場合、情報端末装置11は、図示しない手段により、当該アプリケーションが終了したことを検知し、終了信号を構成する。また、情報送信部1102は、情報処理装置12に情報を送信するための情報処理装置識別子(例えば、情報処理装置12のIPアドレスやURLやメールアドレスなど)を予め格納している。なお、現在時刻は、図示しない時計から取得される。また、情報群は、例えば、Web上のホームページなどであるが、2以上のホームページの集合(一サイトのホームページ群)でも良い。情報送信部1102は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
情報受信部1103は、情報送信部1102における命令等の送信に対応して、情報処理装置12から情報を受信する。ここでの情報は、例えば、ランキング情報や検索結果である。ランキング情報とは、2以上の情報群のランキングを示す情報である。情報群とは、例えば、いわゆるウェブページやホームページであるが、データベースレコードや他のファイルでも良い。情報群のデータ形式は、静止画、動画、テキスト、音声、またはこれらの組み合わせ等、問わない。また、検索結果については、実施の形態4で説明する。情報受信部1103は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
情報出力部1104は、情報受信部1103が受信した情報を出力する。ここで、出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。情報出力部1104は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。情報出力部1104は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
アクセスログ情報格納部1201は、アクセスログ情報を、2以上格納している。アクセスログ情報は、情報群識別子と、アクセス時刻情報を有する。アクセス時刻情報は、情報群がアクセスされた時刻に関する情報である。アクセスログ情報は、ユーザ識別子を有しても良い。また、アクセスログ情報格納部1201は、後述する終了信号や、出力中信号を格納していても良い。また、アクセスログ情報は、終了信号や、出力中信号を含んでも良い。その場合、アクセスログ情報は、時刻についての情報や、ユーザ識別子を有しても良い。アクセスログ情報格納部1201は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
アクセスログ情報受信部1202は、アクセスログ情報を2以上の情報端末装置11から受信する。アクセスログ情報受信部1202は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
信号受信部1203は、情報端末装置11から終了信号を受信する。終了信号とは、情報群が閲覧される情報端末装置11における、情報群を閲覧するアプリケーションが終了した旨を示す信号である。終了信号は、時刻情報(情報群の閲覧が終了した時刻についての情報)やユーザ識別子を有しても良い。終了信号のデータ構造は問わない。また、信号受信部1203は、情報端末装置11から出力中信号を、所定の間隔で受信しても良い。出力中信号とは、情報群が閲覧される情報端末装置11における、情報群を出力中である旨を示す信号である。所定の間隔とは、通常、一定であるが、一定でなくても良い。出力中信号は、時刻情報(情報群の閲覧中における時刻についての情報)やユーザ識別子を有しても良い。信号受信部1203は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
アクセスログ情報蓄積部1204は、アクセスログ情報受信部1202が受信した2以上のアクセスログ情報をアクセスログ情報格納部1201に蓄積する。また、アクセスログ情報蓄積部1204は、信号受信部1203が受信した出力中信号や、終了信号なども、アクセスログ情報格納部1201に蓄積しても良い。ここでの蓄積とは、一時的な蓄積も含む。アクセスログ情報蓄積部1204は、通常、MPUやメモリ等から実現され得る。アクセスログ情報蓄積部1204の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
命令受付部1205は、各種の命令を受け付ける。命令とは、例えば、ランキング情報の出力命令である。また、ここでの受け付けとは、情報端末装置11からの受信、ユーザからの入力の受け付けなどである。命令受付部1205は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
出力終了時刻情報取得部1206は、出力終了時刻情報を取得する。出力終了時刻情報とは、信号受信部1203が終了信号を受信した時刻に関する情報である。出力終了時刻情報は、例えば、信号受信部1203が終了信号を受信した時刻、情報端末装置11が、情報群の出力が終了したとして、取得した時刻などである。
また、出力時間情報取得部1207は、出力時間情報を取得しても良い。出力時間情報は、情報群が出力されていた時間を示す情報である。出力時間情報は、例えば、信号受信部1203が出力中信号を受信しなくなったことを検知し、当該検知を基に、取得される出力時間に関する情報である。出力時間情報とは、出力時間でも良いし、出力終了時刻情報でも良い。出力時間情報取得部1207は、通常、MPUやメモリ等から実現され得る。出力時間情報取得部1207の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
アクセス関連情報取得部1208は、アクセス数を取得する。アクセス数は、現在から所定期間内にアクセスされた回数を示す情報である。アクセス関連情報取得部1208は、情報群識別子で識別される情報群ごとに、アクセスログ情報のアクセス時刻情報を用いて、アクセス数を算出する。アクセス関連情報取得部1208は、情報群が、所定時間以上、情報端末装置11で出力されている場合に、アクセスされたとする、ことは好適である。このことにより、例えば、瞬時に切り替えられ、実質的にユーザに閲覧されていない場合を、アクセスされていないものと扱うことができる。また、ここで、所定期間内とは、固定でも良いし、動的に変わっても良い。また、所定時間とは、固定でも良いし、動的に変化しても良い。である。
また、アクセス関連情報取得部1208は、出力時間が予め決められた時間に対して長い場合に、情報群がアクセスされたとする、ことは好適である。出力時間とは、一のユーザ識別子と対になる情報群識別子で識別される情報群の出力の開始から終了までの時間であり、当該ユーザ識別子と対になる二つ以上のアクセス時刻情報を用いて取得され得る。このことにより、例えば、瞬時に切り替えられ、実質的にユーザに閲覧されていない場合を、アクセスされていないものと扱うことができる。二つ以上のアクセス時刻情報とは、通常、2つであるが、3つ以上でも良い。
また、アクセス関連情報取得部1208は、出力終了時刻情報をも用いて、情報群の出力が切り替わるまでの時間である情報群の出力時間を取得し、当該出力時間が予め決められた時間に対して長い場合に、情報群がアクセスされたとする、ことは好適である。または、アクセス関連情報取得部1208は、出力時間情報をも用いて、情報群の出力が切り替わるまでの時間である情報群の出力時間を取得し、当該出力時間が予め決められた時間に対して長い場合に、情報群がアクセスされたとする、ことは好適である。なお、通常、アクセス関連情報取得部1208は、出力終了時刻情報または出力時間情報のどちらかを用いて、情報群が、本当に閲覧されたか否かを判断する。ここで、長い場合とは、以上、より長い、のどちらでも良い。
アクセス関連情報取得部1208は、通常、MPUやメモリ等から実現され得る。アクセス関連情報取得部1208の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
ランキング情報構成部1209は、アクセス数を用いて、2以上の情報群のランキングを示す情報であるランキング情報を構成する。ここで「アクセス数を用いて」とは、アクセス数以外の他の情報を用いても良い。他の情報とは、例えば、情報群への他の情報からのリンク数や、リンクが張られている情報群(ホームページなど)の信頼度など、である。また、ランキング情報とは、情報群識別子をソートした結果、または、情報群識別子に順位を付した結果、または、情報群識別子とアクセス数を有する情報など、である。ランキング情報のデータ構造は問わない。ランキング情報構成部1209は、通常、MPUやメモリ等から実現され得る。ランキング情報構成部1209の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力部1210は、ランキング情報構成部1209が構成したランキング情報を出力する。ここで、出力とは、通常、他の装置(ここでは、情報端末装置11)への送信であるが、ディスプレイへの表示、プリンタへの印字、音出力、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。出力部1210は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
次に、情報処理システムの動作について説明する。まず、情報端末装置11の動作について説明する。
情報端末装置11の受付部1101は、ユーザから情報群のランキングの出力指示などを受け付ける。そして、情報送信部1102は、出力指示を、情報処理装置12に送信する。次に、情報受信部1103は、出力指示の送信に対応して、ランキング情報を受信する。そして、情報出力部1104は、ランキング情報を出力する。なお、かかる情報端末装置11は、例えば、Webブラウザがインストールされたパーソナルコンピュータなどであり、公知技術である。
次に、情報処理装置12の動作について図3から図6のフローチャートを用いて説明する。まず、図3のフローチャートは、情報処理装置12が、情報端末装置11から各種データ、信号(信号もデータも同意義である)を受信して、少なくとも一時蓄積する処理である蓄積処理を説明するフローチャートである。
(ステップS301)アクセスログ情報受信部1202は、情報端末装置11からアクセスログ情報を受信したか否かを判断する。アクセスログ情報を受信すればステップS302に行き、アクセスログ情報を受信しなければステップS303に行く。
(ステップS302)アクセスログ情報蓄積部1204は、ステップS301で受信したアクセスログ情報をアクセスログ情報格納部1201に、少なくとも一時格納する。
(ステップS303)信号受信部1203は、情報端末装置11から終了信号を受信したか否かを判断する。終了信号を受信すればステップS304に行き、終了信号を受信しなければステップS305に行く。
(ステップS304)アクセスログ情報蓄積部1204は、ステップS303で受信した終了信号をアクセスログ情報格納部1201に、少なくとも一時格納する。かかる場合、アクセスログ情報蓄積部1204は、時刻情報(終了信号を受信した時刻を示す情報)を、終了信号に対応付けて蓄積しても良い。なお、終了信号は、通常、情報群識別子とユーザ識別子を有する。また、この場合の時刻情報は、情報群の閲覧が終了した時刻を示している、と考える。
(ステップS305)信号受信部1203は、情報端末装置11から出力中信号を受信したか否かを判断する。出力中信号を受信すればステップS306に行き、出力中信号を受信しなければステップS301に戻る。
(ステップS306)アクセスログ情報蓄積部1204は、ステップS305で受信した出力中信号をアクセスログ情報格納部1201に、少なくとも一時格納する。なお、アクセスログ情報蓄積部1204は、時刻情報(出力中信号を受信した時刻を示す情報)を、出力中信号に対応付けて蓄積しても良い。また、出力中信号は、通常、情報群識別子とユーザ識別子を有する。
なお、図3のフローチャートのステップS305の「N」の場合に、次の図4のステップS401に移行しても良い。
また、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、情報処理装置12がランキング情報を構成し、送信する処理を図4のフローチャートを用いて説明する。
(ステップS401)命令受付部1205は、ランキングの出力命令を受信したか否かを判断する。ランキングの出力命令を受信すればステップS402に行き、ランキングの出力命令を受信しなければステップS401に戻る。
(ステップS402)アクセス関連情報取得部1208は、カウンタiに1を代入する。
(ステップS403)アクセス関連情報取得部1208は、アクセスログ情報格納部1201を検査し、i番目の情報群(i番目の情報群識別子でも同意義)が、存在するか否かを判断する。なお、アクセス関連情報取得部1208は、アクセスログ情報格納部1201とは別に、情報群識別子の集合を保持しており、その情報群識別子の集合を検査し、i番目の情報群が、存在するか否かを判断しても良い。
(ステップS404)アクセス関連情報取得部1208等は、アクセス関連情報を取得する処理を行う。アクセス関連情報取得処理について、図5、図6のフローチャートを用いて説明する。
(ステップS405)アクセス関連情報取得部1208は、カウンタiを1、インクリメントする。ステップS403に戻る。
(ステップS406)ランキング情報構成部1209は、アクセス数をキーとして、情報群識別子をソートする。ここで、通常、降順に情報群識別子はソートされる。
(ステップS407)ランキング情報構成部1209は、ステップS406におけるソート結果を用いて、ランキング情報を構成する。ランキング情報の具体例は後述する。
(ステップS408)出力部1210は、ランキング情報を、情報端末装置11に送信する。処理を終了する。
なお、図4のフローチャートにおいて、ステップS406の処理を行わず、ランキング情報がソート結果を含まなくても良い。
次に、ステップS404のアクセス関連情報取得処理の第一の例について、図5のフローチャートを用いて説明する。
(ステップS501)アクセス関連情報取得部1208は、i番目の情報群のアクセスログ情報を、アクセスログ情報格納部1201から取得する。アクセス関連情報取得部1208は、i番目の情報群に対応する情報群識別子をキーとして、アクセスログ情報格納部1201を検索し、当該情報群識別子を含むアクセスログ情報を取得し、メモリ上に配置する。
(ステップS502)アクセス関連情報取得部1208は、ステップS501で取得したアクセスログ情報が有するアクセス時刻情報を用いて、現在から所定期間内のアクセスログ情報のみを抽出する。
(ステップS503)アクセス関連情報取得部1208は、ステップS502で抽出したアクセスログ情報から、アクセス数を取得する。通常、アクセス数は、ステップS502で抽出したアクセスログ情報の数である。
(ステップS504)アクセス関連情報取得部1208は、i番目の情報群の情報群識別子と、ステップS503で取得したアクセス数を対にして、メモリ等の記憶媒体に、少なくとも一時格納する。上位処理にリターンする。
なお、図5のフローチャートにおいて、所定期間内のアクセスログ情報を取得してから、各情報群のアクセスログ情報を抽出し、情報群ごとのアクセス数を取得しても良い。
次に、ステップS404のアクセス関連情報取得処理の第二の例について、図6のフローチャートを用いて説明する。図6のフローチャートにおいて、図5のフローチャートと同様の処理について、説明を省略する。
(ステップS601)アクセス関連情報取得部1208は、初期化を行う。初期化とは、ここでは、カウンタjに1を代入し、変数「アクセス回数」に「0」を設定する処理である。
(ステップS602)アクセス関連情報取得部1208は、ステップS502で抽出したアクセスログ情報の中に、j番目のアクセスログ情報が存在するか否かを判断する。j番目のアクセスログ情報が存在すればステップS603に行き、j番目のアクセスログ情報が存在しなければ上位処理にリターンする。
(ステップS603)出力時間情報取得部1207またはアクセス関連情報取得部1208は、j番目のアクセスログ情報に対応するアクセス時の、情報群の出力時間を取得する。ここでの出力時間を取得する第一の処理の例は以下である。つまり、出力終了時刻情報取得部1206は、j番目のアクセスログ情報に対応する、出力終了時刻情報を取得する。そして、アクセス関連情報取得部1208は、j番目のアクセスログ情報が有するアクセス時刻情報を取得する。そして、アクセス関連情報取得部1208は、アクセスの終了時刻を示す出力終了時刻情報と、アクセスの開始時刻を示すアクセス時刻情報から、出力時間を算出する。かかる場合、処理対象のアクセスログ情報は、同一のユーザ識別子を有することは言うまでもない。また、出力時間を取得する第二の処理の例は以下である。つまり、出力時間情報取得部1207は、j番目のアクセスログ情報に対応する出力中信号を取得し、出力中信号の数を算出する。そして、出力時間情報取得部1207は、出力中信号の数と、出力中信号が送信される時間間隔を乗算し、出力時間を算出する。なお、出力時間情報取得部1207は、j番目のアクセスログ情報が有するユーザ識別子を有する(または、対になる)出力中信号であり、j番目のアクセスログ情報が有するアクセス時刻情報が示す時刻以降の時刻で連続する時刻(所定の間隔があるのは良い)を有する(または、対になる)出力中信号を、アクセスログ情報格納部1201から取得し、その出力中信号の数を算出する。また、出力時間情報取得部1207は、出力中信号が送信される時間間隔を、予め保持している。
(ステップS604)アクセス関連情報取得部1208は、ステップS603で取得した出力時間が、予め格納している所定時間より長いか、短いかを判断する。「出力時間>所定時間」であればステップS605に行き、「出力時間>所定時間」でなければステップS606に行く。なお、「出力時間>所定時間」の代わりに、「出力時間>=所定時間」という条件を適用しても良い。
(ステップS605)アクセス関連情報取得部1208は、変数「アクセス数」に1を加える。
(ステップS606)アクセス関連情報取得部1208は、カウンタjを1、インクリメントする。ステップS602に戻る。
なお、図6のフローチャートにおいて、出力時間と固定的な所定時間を比較して、出力された情報群がアクセスされたとしたが、出力時間と動的な時間を比較して、出力された情報群がアクセスされたとしても良い。つまり、出力時間を用いて、アクセス(厳密には、閲覧)されたか否かを判断すれば良い。
また、図6のフローチャートにおいて、所定期間内のアクセスログ情報を取得してから、各情報群のアクセスログ情報を抽出し、情報群ごとのアクセス数を取得しても良い。
以下、本実施の形態における情報処理装置の具体的な動作について説明する。情報処理システムの概念図は図1である。
今、情報端末装置11の情報出力部1104は、いわゆるWebブラウザである。そして、Webブラウザには、当該Webブラウザで出力された情報群(例えば、ホームページ)の情報群識別子(例えば、URL)を含むアクセスログ情報が、情報処理装置12に送信されるツールバーが組み込まれている。このツールバーは、情報送信部1102を構成し、ツールバーは、ユーザ識別子を保持している。また、かかる場合、情報送信部1102は、情報出力部1104が出力した情報群の情報群識別子と、現在時刻と、ユーザ識別子を取得し、アクセスログ情報を構成する。そして、情報送信部1102は、アクセスログ情報を情報処理装置12に送信する。
そして、情報処理装置12のアクセスログ情報受信部1202は、1以上の情報端末装置11から、アクセスログ情報を受信する。
そして、アクセスログ情報蓄積部1204は、アクセスログ情報受信部1202が受信したアクセスログ情報を、アクセスログ情報格納部1201に蓄積する。
以下、かかる状況において、二つの具体例について説明する。
(具体例1)
具体例1は、現在から所定期間内のアクセスログ情報を用いてアクセス数を算出する場合の処理である。ここでは、情報群の出力時間を考慮せずに、アクセス数を算出する。つまり、情報送信部1102は、情報端末装置11で情報群がオープンされた際に、アクセスログ情報を情報処理装置12に送信する。
そして、上記の処理により、アクセスログ情報格納部1201に蓄積されたアクセスログ情報の例を、図7に示す。図7は、アクセスログ情報管理表である。アクセスログ情報管理表は、「ID」「アクセスログ情報」を有するレコードを多数、格納している。「アクセスログ情報」は、「ユーザ識別子」「URL」「時刻」を有する。「URL」は、情報群識別子の一例である。「時刻」はアクセス時刻情報の一例である。
かかる状況において、ある情報端末装置11のユーザは、情報端末装置11に対して、ホームページのランキング情報の出力指示を入力する。そして、情報端末装置11の受付部1101は、ランキング情報の出力指示を受け付ける。次に、情報送信部1102は、ランキング情報の出力指示を、情報処理装置12に送信する。
次に、情報処理装置12の命令受付部1205は、ランキング情報の出力指示を受信する。そして、アクセス関連情報取得部1208は、以下に示すように、1番目の情報群識別子(URL)から順に処理していく。
つまり、アクセス関連情報取得部1208は、図7のアクセスログ情報管理表の「ID=1」のURL「yaaoo.co.jp」を取得し、既に処理(アクセス数の算出)していてない否かを判断する。URL「yaaoo.co.jp」は未処理であるので、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」に対応するアクセスログ情報をアクセスログ情報管理表から検索し、メモリ上に配置する(図8参照)。図8は、特定のURL「yaaoo.co.jp」に対応するアクセスログ情報を集めた中間表である。
次に、アクセス関連情報取得部1208は、取得したアクセスログ情報が有するアクセス時刻情報から、現在(例えば、「2007/6/19 17時37分00秒」)から所定期間(例えば、7日間)内のアクセスログ情報のみを抽出する。
そして、アクセス関連情報取得部1208は、所定期間(例えば、7日間)内のアクセスログ情報のレコード数(例えば、「257」)を算出し、その数をアクセス数とする。
なお、ここで、アクセス関連情報取得部1208がアクセス数を算出する場合に、例えば、同一のユーザ識別子に対応するアクセスログ情報は重複してカウントしない、などの処理を施しても良い。
次に、アクセス関連情報取得部1208は、i番目の情報群の情報群識別子「yaaoo.co.jp」と、取得したアクセス数「257」を対にして、メモリ等の記憶媒体に、格納する。
次に、同様に、アクセス関連情報取得部1208は、2つ目以降のURLに対して、現在から所定期間内にアクセスされた回数を示すアクセス数を算出する。そして、アクセス関連情報取得部1208は、情報群の情報群識別子(URL)と、取得したアクセス数を対にして、メモリ等の記憶媒体に、格納する。そして、アクセス関連情報取得部1208は、図9に示すアクセス関連情報を得る。このアクセス関連情報は、URLとアクセス数を有する。
次に、ランキング情報構成部1209は、図9に示すアクセス関連情報に対して、アクセス数をキーとして、URLをソートする。そして、ランキング情報構成部1209は、ソート結果を用いて、ランキング情報を構成する。そして、ランキング情報構成部1209は、図10に示すランキング情報管理表を得る。
次に、出力部1210は、図10に示すランキング情報管理表を、情報端末装置11に送信する。
そして、情報端末装置11の情報受信部1103は、図10に示すランキング情報管理表を受信する。次に、情報出力部1104は、図10に示すランキング情報管理表を出力する。ランキング情報管理表の出力態様は問わない。ランキング情報管理表の出力態様は、例えば、図28に示すような態様でも良い。図28において、ランキングの上位から情報群に対応する見出しが表示されている。かかることは、他の具体例においても同様である。
(具体例2)
具体例2は、情報群の出力時間を考慮して、アクセス数を算出する場合の処理である。つまり、具体例2では、情報群の出力時間が短い場合には、アクセス数に含めず、出力時間が長い場合のみ、アクセス数に含める処理を行う。また、ここでは、出力時間は、出力中信号を用いて算出される。
今、情報端末装置11の情報送信部1102は、アクセスログ情報と、出力中信号を情報処理装置12に送信する。そして、情報処理装置12のアクセスログ情報受信部1202はアクセスログ情報を受信する。また、信号受信部1203は、出力中信号を、所定の間隔で受信する。なお、ここでは、所定の間隔は、例えば、2秒である、とする。
そして、アクセスログ情報蓄積部1204は、アクセスログ情報受信部1202が受信した2以上のアクセスログ情報をアクセスログ情報格納部1201に蓄積する。また、アクセスログ情報蓄積部1204は、信号受信部1203が受信した出力中信号をアクセスログ情報格納部1201に蓄積する。ここでの出力中信号は、アクセスログ情報と同じデータ構造である。つまり、出力中信号は、ユーザ識別子とURLを含む。
そして、アクセスログ情報格納部1201に、図11に示すアクセスログ情報等が蓄積されるに至ったとする。図11は、アクセスログ情報等が管理されているアクセスログ情報管理表である。
かかる状況において、ある情報端末装置11のユーザは、情報端末装置11に対して、ホームページのランキング情報の出力指示を入力する。そして、情報端末装置11の受付部1101は、ランキング情報の出力指示を受け付ける。次に、情報送信部1102は、ランキング情報の出力指示を、情報処理装置12に送信する。
次に、情報処理装置12の命令受付部1205は、ランキング情報の出力指示を受信する。そして、アクセス関連情報取得部1208は、以下に示すように、1番目の情報群識別子(URL)から順に処理していく。
つまり、アクセス関連情報取得部1208は、図11のアクセスログ情報管理表の「ID=1」のURL「yaaoo.co.jp」を取得し、既に処理(アクセス数の算出)しているか否かを判断する。URL「yaaoo.co.jp」は未処理であるので、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」に対応するアクセスログ情報をアクセスログ情報管理表から検索し、メモリ上に配置する。
次に、アクセス関連情報取得部1208は、取得したアクセスログ情報が有するアクセス時刻情報から、現在(例えば、「2007/6/19 17時37分00秒」)から所定期間(例えば、10日間)内のアクセスログ情報のみを抽出する。そして、アクセス関連情報取得部1208は、変数「アクセス回数」に「0」を設定する。ここでは、図11のURL「yaaoo.co.jp」に対応するすべてのアクセスログ情報が対象となる。
次に、出力時間情報取得部1207は、まず、最初のアクセスログ情報「AABC,yaaoo.co.jp,2007/6/11/12:00:10」を取得する。そして、出力時間情報取得部1207は、2番目以降のアクセスログ情報を取得し、そのアクセスログ情報の中から、ユーザ識別子「AABC」は同じで、URL「yaaoo.co.jp」が、他のURLに切り替わるまで(ここでは、「tototo.co.jp」)のアクセスログ情報の数(ここでは、「5」)を算出する。次に、出力時間情報取得部1207は、アクセスログ情報の数「5」と出力中信号の受信間隔「2秒」を乗算し、出力時間「10秒」を得る。
次に、アクセス関連情報取得部1208は、記憶媒体に予め格納されている所定時間「8秒」を読み出し、「出力時間>所定時間」であるか否かを判断する。ここでは、「出力時間>所定時間」を満たすので、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」に対応する「アクセス数」に1を加え、アクセス数を「1」とする。
同様に、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」を含む、以降のアクセスログ情報を取得し、アクセスがあった場合の出力時間を算出する。そして、アクセス関連情報取得部1208は、「出力時間>所定時間」を満たすか否かを判断し、「出力時間>所定時間」を満たす場合のみ、URL「yaaoo.co.jp」に対応する「アクセス数」に1を加えていく。そして、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」に対応する「アクセス数」として、「122」を得たとする。そして、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」とアクセス数「122」を対にして、記憶媒体に一時格納する。このURLとアクセス数の対の情報は、アクセス関連情報である。
次に、アクセス関連情報取得部1208は、図11のアクセスログ情報管理表の「ID=2」のURL「yaaoo.co.jp」を取得し、既に処理(アクセス数の算出)しているか否かを判断する。これは、すでに処理済みであるので、次に移行する。
そして、アクセス関連情報取得部1208は、図11のアクセスログ情報管理表の「ID=3」のURL「www.ama.co.jp」を取得し、既に処理(アクセス数の算出)しているか否かを判断する。これは、未処理であるので、アクセス関連情報取得部1208は、URL「www.ama.co.jp」に対応するアクセスログ情報をアクセスログ情報管理表から検索し、メモリ上に配置する。
次に、アクセス関連情報取得部1208は、取得したアクセスログ情報が有するアクセス時刻情報から、現在(例えば、「2007/6/19 17時37分00秒」)から所定期間(例えば、10日間)内のアクセスログ情報のみを抽出する。そして、アクセス関連情報取得部1208は、変数「アクセス回数」に「0」を設定する。ここでは、図11のURL「www.ama.co.jp」に対応するすべてのアクセスログ情報が対象となる。
次に、出力時間情報取得部1207は、まず、最初のアクセスログ情報「MQLL,www.ama.co.jp,2007/6/11/12:00:12」を取得する。そして、出力時間情報取得部1207は、そのアクセスログ情報の中から、ユーザ識別子「MQLL」は同じで、URL「www.ama.co.jp」を有する「ID=5」のアクセスログ情報「MQLL,www.ama.co.jp,2007/6/11/12:00:14」を取得する。そして、出力時間情報取得部1207は、ユーザ識別子「MQLL」URL「www.ama.co.jp」のレコードが時刻「2007/6/11/12:00:14」以降、途切れていることを検出する。そして、出力時間情報取得部1207は、最初のアクセスログ情報「MQLL,www.ama.co.jp,2007/6/11/12:00:12」と最後のアクセスログ情報「MQLL,www.ama.co.jp,2007/6/11/12:00:14」の間のアクセスログ情報数「2」を取得する。そして、出力時間情報取得部1207は、アクセスログ情報の数「2」と出力中信号の受信間隔「2秒」を乗算し、出力時間「4秒」を得る。
次に、アクセス関連情報取得部1208は、記憶媒体に予め格納されている所定時間「8秒」を読み出し、「出力時間>所定時間」であるか否かを判断する。ここでは、「出力時間>所定時間」を満たさないので、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」に対応する「アクセス数」に1を加えず、アクセス数は「0」のままである。その後、URL「www.ama.co.jp」についての処理を続ける。
同様に、他のURLについても処理し、出力時間を考慮したアクセス数を算出し、URLとアクセス数を対にして、記憶媒体に一時格納する。
次に、具体例1と同様に、ランキング情報構成部1209は、得られたアクセス関連情報に対して、アクセス数をキーとして、URLをソートする。そして、ランキング情報構成部1209は、ソート結果を用いて、ランキング情報を構成する。
次に、出力部1210は、得られたランキング情報を、情報端末装置11に送信する。そして、情報端末装置11の情報受信部1103は、ランキング情報を受信する。次に、情報出力部1104は、ランキング情報を出力する。
(具体例3)
具体例3は、情報群の出力時間を考慮して、アクセス数を算出する場合の処理である。また、ここでは、出力時間は、終了信号を用いて算出される。具体例3と具体例2の違いは、出力中信号が終了信号に変わっている点である。
具体例3において、具体例2と同様のアクセスログ情報等の受信、蓄積処理を行って、アクセスログ情報格納部1201に、図12に示すアクセスログ情報等が蓄積されるに至ったとする。図12は、アクセスログ情報等が管理されているアクセスログ情報管理表である。図12のアクセスログ情報管理表において、図11等のアクセスログ情報管理表と比較して「終了フラグ」の属性が増えている。「終了フラグ」は、情報端末装置11で、いわゆるブラウザが閉じられた場合に、「1」の値が代入された終了信号が、情報端末装置11から送信され、情報処理装置12が受信したものである。終了信号は、「ユーザ識別子」「URL」「時刻」「終了フラグ」を有する。
かかる状況において、ある情報端末装置11のユーザは、情報端末装置11に対して、ホームページのランキング情報の出力指示を入力する。そして、情報端末装置11の受付部1101は、ランキング情報の出力指示を受け付ける。次に、情報送信部1102は、ランキング情報の出力指示を、情報処理装置12に送信する。
次に、情報処理装置12の命令受付部1205は、ランキング情報の出力指示を受信する。そして、アクセス関連情報取得部1208は、以下に示すように、1番目の情報群識別子(URL)から順に処理していく。
つまり、アクセス関連情報取得部1208は、図12のアクセスログ情報管理表の「ID=1」のURL「yaaoo.co.jp」を取得し、既に処理(アクセス数の算出)していてない否かを判断する。URL「yaaoo.co.jp」は未処理であるので、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」に対応するアクセスログ情報をアクセスログ情報管理表から検索し、メモリ上に配置する。
次に、アクセス関連情報取得部1208は、取得したアクセスログ情報が有するアクセス時刻情報から、現在(例えば、「2007/6/19 17時37分00秒」)から所定期間(例えば、10日間)内のアクセスログ情報のみを抽出する。そして、アクセス関連情報取得部1208は、変数「アクセス回数」に「0」を設定する。ここでは、図12のすべてのアクセスログ情報が対象となる。
次に、出力時間情報取得部1207は、まず、最初のアクセスログ情報「AABC,yaaoo.co.jp,2007/6/11/12:00:10」を取得する。そして、出力時間情報取得部1207は、2番目以降のアクセスログ情報を取得し、そのアクセスログ情報の中から、ユーザ識別子「AABC」は同じで、URL「yaaoo.co.jp」が、他のURLに切り替わるまで(ここでは、「tototo.co.jp」)の時間を、「2007/6/11/12:00:20−2007/6/11/12:00:10」により算出し、出力時間「10秒」を得る。
次に、アクセス関連情報取得部1208は、記憶媒体に予め格納されている所定時間「8秒」を読み出し、「出力時間>所定時間」であるか否かを判断する。ここでは、「出力時間>所定時間」を満たすので、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」に対応する「アクセス数」に1を加え、アクセス数を「1」とする。
同様に、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」を含む、以降のアクセスログ情報を取得し、アクセスがあった場合の出力時間を算出する。そして、アクセス関連情報取得部1208は、「出力時間>所定時間」を満たすか否かを判断し、「出力時間>所定時間」を満たす場合のみ、URL「yaaoo.co.jp」に対応する「アクセス数」に1を加えていく。そして、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」に対応する「アクセス数」として、例えば、「186」を得たとする。そして、アクセス関連情報取得部1208は、URL「yaaoo.co.jp」とアクセス数「186」を対にして、記憶媒体に一時格納する。このURLとアクセス数の対の情報は、アクセス関連情報である。
同様に、アクセス関連情報取得部1208は、図12のアクセスログ情報管理表の「ID=2」のURL「www.ama.co.jp」を取得し、既に処理(アクセス数の算出)していてない否かを判断する。URL「www.ama.co.jp」は未処理であるので、アクセス関連情報取得部1208は、URL「www.ama.co.jp」に対応するアクセスログ情報をアクセスログ情報管理表から検索し、メモリ上に配置する。
次に、アクセス関連情報取得部1208は、取得したアクセスログ情報が有するアクセス時刻情報から、現在(例えば、「2007/6/19 17時37分00秒」)から所定期間(例えば、10日間)内のアクセスログ情報のみを抽出する。そして、アクセス関連情報取得部1208は、変数「アクセス回数」に「0」を設定する。ここでは、図12のURL「www.ama.co.jp」に対応するすべてのアクセスログ情報が対象となる。
次に、出力時間情報取得部1207は、まず、URL「www.ama.co.jp」に対応する最初のアクセスログ情報「MQLL,www.ama.co.jp,2007/6/11/12:00:12」を取得する。そして、出力時間情報取得部1207は、URL「www.ama.co.jp」に対応する次のアクセスログ情報(終了信号を含む)「MQLL,www.ama.co.jp,2007/6/11/12:08:57,1」を取得する。そして、出力時間情報取得部1207は、2つのアクセスログ情報が有する時刻情報の差から、出力時間を算出する。つまり、出力時間情報取得部1207は、「2007/6/11/12:08:57−2007/6/11/12:00:12」により、出力時間「8分45秒」を算出し、メモリ上に配置する。なお、「MQLL,www.ama.co.jp,2007/6/11/12:08:57,1」により、ユーザ識別子「MQLL」で識別されるユーザは、「www.ama.co.jp」を閲覧した後、いわゆるブラウザを終了した(閲覧を中止した)ことが分かる。
次に、アクセス関連情報取得部1208は、記憶媒体に予め格納されている所定時間「8秒」を読み出し、「出力時間>所定時間」であるか否かを判断する。ここでは、「出力時間>所定時間」を満たすので、アクセス関連情報取得部1208は、URL「www.ama.co.jp」に対応する「アクセス数」に1を加え、アクセス数を「1」とする。
同様に、アクセス関連情報取得部1208は、URL「www.ama.co.jp」を含むアクセスログ情報であり、既に処理した以降のアクセスログ情報を取得し、アクセスがあった場合の出力時間を算出する。そして、アクセス関連情報取得部1208は、「出力時間>所定時間」を満たすか否かを判断し、「出力時間>所定時間」を満たす場合のみ、URL「www.ama.co.jp」に対応する「アクセス数」に1を加えていく。そして、アクセス関連情報取得部1208は、URL「www.ama.co.jp」に対応する「アクセス数」として、例えば、「255」を得たとする。そして、アクセス関連情報取得部1208は、URL「www.ama.co.jp」とアクセス数「255」を対にして、記憶媒体に一時格納する。このURLとアクセス数の対の情報は、アクセス関連情報である。
同様に、他のURLについても処理し、出力時間を考慮したアクセス数を算出し、URLとアクセス数を対にして、記憶媒体に一時格納する。
次に、具体例1と同様に、ランキング情報構成部1209は、得られたアクセス関連情報に対して、アクセス数をキーとして、URLをソートする。そして、ランキング情報構成部1209は、ソート結果を用いて、ランキング情報を構成する。
次に、出力部1210は、得られたランキング情報を、情報端末装置11に送信する。そして、情報端末装置11の情報受信部1103は、ランキング情報を受信する。次に、情報出力部1104は、ランキング情報を出力する。
以上、本実施の形態によれば、現在から所定期間内にアクセスされた回数を示すアクセス数を用いて、情報群(例えば、ホームページ)のランキングが可能となる。
また、本実施の形態によれば、所定時間以上出力されている情報群(例えば、ホームページ)のみ、アクセスされているとしてカウントした場合に、さらに実質的な情報群のランキングが可能となる。
なお、本実施の形態によれば、ランキング対象の情報群(例えば、ホームページ)は一つであった。しかし、一サイトの複数のホームページを、一の情報群として捕らえ、一サイトの複数のホームページに対してランキングを行っても良い。また、かかる場合でも、複数のホームページを代表する一のURLに対して、ランキングを行っているように、ランキング情報を構成し、出力しても良い。かかることは、他の実施の形態においても同様である。
また、本実施の形態によれば、アクセス数のみで情報群をランキングした。しかし、アクセス数に加えて、他の内容も考慮して、情報群をランキングしても良い。他の内容とは、他の情報群からのリンク数や、情報群の更新頻度など、何でも良い。かかることも、他の実施の形態においても同様である。
また、本実施の形態によれば、情報端末装置11のユーザから、情報端末装置11に対して、ホームページのランキング情報の出力指示が入力された後、情報処理装置12は、ランキング情報を構成していた。しかし、情報処理装置12は、予め、ランキング情報を構成し、保持していても良い。かかる構成によれば、ユーザからのランキング情報の出力指示により、高速にランキング情報の出力ができる。かかることは、他の実施の形態においても同様である。
また、本実施の形態によれば、出力時間を算出する場合に、終了信号と出力中信号の両方を用いた。しかし、信号のフォーマット、仕様は統一されている場合が多く、かかる場合は、情報処理装置は、どちらかの信号を用いて出力時間を算出する。かかることは、他の実施の形態においても同様である。
また、本実施の形態におけるアクセス数の算出方法は、他の実施の形態においても適用され得る。
また、本実施の形態において、アクセスログ情報を受信し、蓄積する装置と、情報群のランキングを行う装置が分離されていても良いことは言うまでもない。かかることは、他の実施の形態においても同様である。
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、情報群識別子で識別される情報群ごとに、記憶媒体に格納されているアクセスログ情報のアクセス時刻情報を用いて、現在から所定期間内にアクセスされた回数を示すアクセス数を算出するアクセス関連情報取得部と、前記アクセスログ情報中のアクセス数を用いて、2以上の情報群のランキングを示す情報であるランキング情報を構成するランキング情報構成部と、前記ランキング情報構成部が構成したランキング情報を出力する出力部として機能させるためのプログラム、である。
上記プログラムは、アクセス関連情報取得部を、前記情報群が、所定時間以上、情報端末装置で出力されている場合に、アクセスされたとして、コンピュータを機能させるためのプログラム、であることは好適である。
また、上記プログラムにおいて、前記アクセスログ情報は、アクセスしたユーザを特定するユーザ識別子をも有し、前記アクセス関連情報取得部は、一のユーザ識別子と対になる情報群識別子で識別される情報群の出力の開始から終了までの時間である情報群の出力時間を、当該ユーザ識別子と対になる二つ以上のアクセス時刻情報を用いて取得し、当該出力時間が予め決められた時間に対して長い場合に、前記情報群がアクセスされたとして、コンピュータを機能させるためのプログラム、であることは好適である。
また、上記プログラムにおいて、情報群が閲覧される情報端末装置における、情報群を閲覧するアプリケーションが終了した旨を示す終了信号を受信する信号受信部と、前記信号受信部が終了信号を受信した時刻に関する情報である出力終了時刻情報を取得する出力終了時刻情報取得部をさらに具備し、前記アクセス関連情報取得部は、前記出力終了時刻情報をも用いて、情報群の出力が切り替わるまでの時間である情報群の出力時間を取得し、当該出力時間が予め決められた時間に対して長い場合に、前記情報群がアクセスされたとするものとして、コンピュータを機能させるためのプログラム、であることは好適である。
また、上記プログラムにおいて、情報群が閲覧される情報端末装置における、情報群を出力中である旨を示す出力中信号を、所定の間隔で受信する信号受信部と、前記信号受信部が出力中信号を受信しなくなったことを検知し、当該検知を基に、出力時間に関する情報である出力時間情報を取得する出力時間情報取得部をさらに具備し、前記アクセス関連情報取得部は、前記出力時間情報をも用いて、情報群の出力が切り替わるまでの時間である情報群の出力時間を取得し、当該出力時間が予め決められた時間に対して長い場合に、前記情報群がアクセスされたとするものとして、コンピュータを機能させるためのプログラム、であることは好適である。
さらに、上記プログラムにおいて、アクセスログ情報を2以上の情報端末装置から受信するアクセスログ情報受信部と、前記アクセスログ情報受信部が受信した2以上のアクセスログ情報を前記アクセスログ情報格納部に蓄積するアクセスログ情報蓄積部をさらに具備するものとして、コンピュータを機能させるためのプログラム、であることは好適である。
(実施の形態2)
本実施の形態において、実施の形態1とは、現在から所定期間内のアクセス数の変化をパラメータとして用いている点が異なる。本実施の形態において、アクセス数の変化の情報を、パラメータとして用いて、ホームページ等の情報群のランキングを行う情報処理システム等について説明する。
図1は、本実施の形態における情報処理システムの概念図である。図13は、本実施の形態における情報処理システムのブロック図である。
情報処理システム2は、情報端末装置11、情報処理装置22を具備する。
情報処理装置22は、アクセスログ情報格納部1201、アクセスログ情報受信部1202、信号受信部1203、アクセスログ情報蓄積部1204、命令受付部1205、出力終了時刻情報取得部1206、出力時間情報取得部1207、アクセス関連情報取得部2208、ランキング情報構成部2209、出力部1210を具備する。
アクセス関連情報取得部2208は、情報群識別子で識別される情報群ごとに、アクセスログ情報のアクセス時刻情報を用いて、アクセス数の変化に関する情報であるアクセス数変化情報を取得する。アクセス関連情報取得部2208は、情報群が、所定時間以上、情報端末装置11で出力されている場合に、アクセスされたとする、ことは好適である。アクセス関連情報取得部2208は、一のユーザ識別子と対になる情報群識別子で識別される情報群の出力の開始から終了までの時間である情報群の出力時間を、当該ユーザ識別子と対になる二つ以上のアクセス時刻情報を用いて取得し、当該出力時間が予め決められた時間に対して長い場合に、情報群がアクセスされたとする、ことは好適である。アクセス関連情報取得部2208は、出力終了時刻情報をも用いて、情報群の出力が切り替わるまでの時間である情報群の出力時間を取得し、当該出力時間が予め決められた時間に対して長い場合に、情報群がアクセスされたとする、ことは好適である。アクセス関連情報取得部2208は、出力時間情報をも用いて、情報群の出力が切り替わるまでの時間である情報群の出力時間を取得し、当該出力時間が予め決められた時間に対して長い場合に、情報群がアクセスされたとする、ことは好適である。
ここで、アクセス数変化情報とは、アクセス数の各日の1日の平均値からの差でも良いし、同じ曜日のアクセス数の平均値からの差でも良いし、所定期間における平均値からの差でも良い。その他、アクセス数変化情報は、アクセス数の変化についての情報であれば良い。
また、上記の所定時間とは、固定でも良いし、動的に変化しても良い。さらに、上記の「二つ以上のアクセス時刻情報」の二つ以上とは、通常、2つであるが、3つ以上でも良い。さらに、「長い場合」とは、以上、より長い、のどちらでも良い。アクセス関連情報取得部2208は、通常、MPUやメモリ等から実現され得る。アクセス関連情報取得部2208の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
ランキング情報構成部2209は、アクセス数変化情報を用いて、2以上の情報群のランキングを示す情報であるランキング情報を構成する。ここで「アクセス数変化情報を用いて」とは、アクセス数変化情報以外の他の情報を用いても良い。他の情報とは、例えば、アクセス数、情報群への他の情報からのリンク数や、リンクが張られている情報群(ホームページなど)の信頼度など、である。また、ランキング情報とは、情報群識別子をソートした結果、情報群識別子に順位を付した結果、情報群識別子とアクセス数を有する情報など、である。ランキング情報のデータ構造は問わない。ランキング情報とは、情報群識別子をソートした結果、情報群識別子に順位を付した結果などである。ランキング情報構成部2209は、通常、MPUやメモリ等から実現され得る。ランキング情報構成部2209の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
次に、情報処理装置22の動作について説明する。情報処理装置22が、情報端末装置11から各種データ、信号(信号もデータも同意義である)を受信して、少なくとも一時蓄積する処理である蓄積処理については、図3のフローチャートを用いて説明した処理と同様である。また、情報処理装置22がランキング情報を構成し、送信する処理について、アクセス関連情報取得処理を除いて、図4のフローチャートを用いて説明した処理と概ね同様である。情報処理装置のアクセス関連情報取得処理の第一の処理例について図14のフローチャートを用いて説明する。図14のフローチャートにおいて、図5のフローチャートと同様の処理について、その説明を省略する。
(ステップS1401)アクセス関連情報取得部2208は、i番目の情報群について、単位時間(例えば、1日)あたりのアクセス数を、各単位時間(例えば、1日)について取得する。そして、アクセス関連情報取得部2208は、各単位時間あたりのアクセス数の平均値を算出し、メモリ上に配置する。なお、単位時間(例えば、1日)あたりのアクセス数は、実施の形態1で説明したように、単位時間におけるアクセスログ情報のレコード数などにより取得できる。
(ステップS1402)アクセス関連情報取得部2208は、i番目の情報群についての現在から所定時間前(たとえば、本日)のアクセス数(ステップS503で取得)と、ステップS1401で取得した単位時間あたりのアクセス数の平均値の差を取得し、メモリ上に配置する。この差が、ここでのアクセス数変化情報である。
(ステップS1403)アクセス関連情報取得部2208は、ステップS1402で算出したアクセス数変化情報をパラメータとして、i番目の情報群についてのスコアを算出する。アクセス関連情報取得部2208は、予め決められた算出式に、少なくとも、アクセス数変化情報を与え、スコアを算出しても良いし、アクセス数変化情報をスコアとしても良い。例えば、アクセス関連情報取得部2208は、「f(アクセス数変化情報,アクセス数の平均値,他の情報群からのリンク数)」により、スコアを算出しても良い。fは、例えば、アクセス数変化情報,アクセス数の平均値,他の情報群からのリンク数をパラメータとし、各パラメータを引数とする増加関数である。
(ステップS1404)アクセス関連情報取得部2208は、ステップS1403で算出したスコアと、i番目の情報群の情報群識別子を対にして、一時格納する。上位処理にリターンする。
なお、図14のフローチャートにおいて、単位時間は、例えば、1日であったが、1週間や、3日など、他の期間であっても良いことは言うまでもない。
次に、情報処理装置のアクセス関連情報取得処理の第二の処理例について図15のフローチャートを用いて説明する。図15のフローチャートにおいて、図5、図14のフローチャートと同様の処理について、その説明を省略する。
(ステップS1501)アクセス関連情報取得部2208は、i番目の情報群について、各曜日のアクセス数の平均値を、曜日ごとに算出し、曜日を識別する情報と、各曜日のアクセス数の平均値を対にして、記憶媒体に、少なくとも一時的に格納する。
(ステップS1502)アクセス関連情報取得部2208は、i番目の情報群について、本日のアクセスログ情報を取得する。
(ステップS1503)アクセス関連情報取得部2208は、本日の曜日を取得する。なお、情報処理装置22は、例えば、カレンダー情報等を格納しており、本日の曜日を取得することができる、とする。
(ステップS1504)アクセス関連情報取得部2208は、本日の曜日の平均アクセス数を取得する。また、アクセス関連情報取得部2208は、ステップS1502で取得した本日のアクセスログ情報から本日のアクセス数を取得する。そして、アクセス関連情報取得部2208は、本日の曜日の平均アクセス数と、本日のアクセス数との差を算出する。この差が、アクセス数変化情報となる。
なお、図15のフローチャートにおいて、ステップS1502で取得するアクセスログ情報は、昨日のアクセスログ情報でも良い。かかる場合、例えば、アクセス数変化情報は、昨日の曜日の平均アクセス数と、昨日のアクセス数との差となる。
以下、本実施の形態における情報処理装置の具体的な動作について説明する。情報処理装置の概念図は図1である。
ここでの情報処理装置22は、実施の形態1で説明した、図7、図11、図12などのアクセスログ情報管理表を蓄積している、とする。なお、アクセスログ情報管理表が蓄積されるまでの処理は、実施の形態1で説明した。以下、ランキング情報の出力処理について、2つの具体例を用いて説明する。
(具体例1)
具体例1は、平均のアクセス数と比較した、現在のアクセス数の差を算出し、この差をアクセス数変化情報とする態様である。かかる場合、情報処理装置22は、以下の処理により、ランキング情報の蓄積を行う。なお、ここでは、ユーザからのランキング情報の出力指示により、ランキング情報の出力する、とする。
今、情報処理装置22に蓄積されているアクセスログ情報管理表から、実施の形態1で説明したアクセス数を算出する処理により、図16に示すようなグラフの情報を取得した、とする。図16において、URL「www.abc.com/def.html」と、URL「www.hij.com/jkl.html」のアクセス数の変遷を示している。図16において、横軸が時刻、縦軸がアクセス数である。なお、図7、図11、図12等の構造を有するアクセスログ情報管理表から、実施の形態1で説明したアクセス数の取得処理により、図16に示すようなグラフの情報を得ることができる。図16において、2つの情報群の平均アクセス数と、現在のアクセス数と平均アクセス数との差(ε1、ε2)を得ることができる。
図16において、URL「www.abc.com/def.html」の情報群の平均アクセス数は、URL「www.hij.com/jkl.html」の情報群の平均アクセス数と比較して多い。
一方、図16において、URL「www.abc.com/def.html」の情報群の現在のアクセス数と平均アクセス数の差(ε1)は、URL「www.hij.com/jkl.html」の情報群の現在のアクセス数と平均アクセス数の差(ε2)と比較して、少ない。
本具体例において、アクセス関連情報取得部2208は、図14を用いて説明した処理により、URL「www.abc.com/def.html」のアクセス数変化情報(ε1)を算出した、とする。また、アクセス関連情報取得部2208は、URL「www.abc.com/def.html」の日々のアクセス数の平均値(a1)を算出した、とする。そして、アクセス関連情報取得部2208は、アクセス数変化情報(ε1)をパラメータとして、情報群「www.abc.com/def.html」についてのスコアを算出する、とする。ここでは、アクセス関連情報取得部2208は、f(ε1,a1)により、スコアを算出する。そして、関数f(ε1,a1)を演算することにより、アクセス関連情報取得部2208は、スコア「126」を得た、とする。次に、アクセス関連情報取得部2208は、算出したスコア「126」と、情報群識別子「www.abc.com/def.html」を対にして、一時格納する。
次に、同様に、アクセス関連情報取得部2208は、URL「www.hij.com/jkl.html」のアクセス数変化情報(ε2)を算出した、とする。また、アクセス関連情報取得部2208は、URL「www.hij.com/jkl.html」の日々のアクセス数の平均値(a2)を算出した、とする。そして、アクセス関連情報取得部2208は、アクセス数変化情報(ε2)をパラメータとして、情報群「www.hij.com/jkl.html」についてのスコアを、f(ε2,a2)により、算出する。このf(ε2,a2)により、アクセス関連情報取得部2208は、スコア「298」を得た、とする。次に、アクセス関連情報取得部2208は、算出したスコア「298」と、情報群識別子「www.hij.com/jkl.html」を対にして、一時格納する。
以上の処理を、他の情報群に対しても行う。そして、ランキング情報構成部2209は、スコアをキーとして、情報群識別子をソートする。次に、ランキング情報構成部2209は、そのソート結果を用いて、ランキング情報を構成する。ランキング情報の例を、図17に示す。図17は、ランキング情報管理表であり、「ID」「URL」「スコア」の属性を有するレコードを1以上、保持している。
そして、命令受付部1205がランキングの出力命令を受信した場合、出力部1210は、図17のランキング情報を読み出し、情報端末装置11に送信する。
次に、情報端末装置11の情報受信部1103は、出力指示の送信に対応して、ランキング情報を受信する。そして、情報出力部1104は、ランキング情報を出力する。
(具体例2)
具体例2は、同一の曜日の平均のアクセス数と比較した、本日または昨日のアクセス数との差を算出し、この差をアクセス数変化情報とする態様である。かかる場合、情報処理装置22は、以下の処理により、ランキング情報の蓄積を行う。
つまり、ある情報群(サイト)へのアクセス数の変化を図18に示す。図18において、アクセス数が落ち込んでいる日は、土曜日、日曜日、または祝日である。つまり、本サイトにおいて、一般の人の勤務日に、アクセスが多くなる傾向にある。図18において、横軸は日、縦軸はアクセス数である。
つまり、情報処理装置22に蓄積されているアクセスログ情報管理表から、実施の形態1で説明したアクセス数を算出する処理により、図18に示すようなグラフの情報が取得された、とする。かかるグラフの取得は、上記した処理により可能である。
また、情報処理装置22のアクセス関連情報取得部2208は、情報群「yaaoo.co.jp」について、各曜日のアクセス数の平均値を、曜日ごとに算出し、曜日を識別する情報と、各曜日のアクセス数の平均値を対にして、記憶媒体に、少なくとも一時的に格納する。アクセス関連情報取得部2208は、カレンダー情報を保持しており、アクセスログ情報の時刻情報から曜日を取得できる。そして、アクセス関連情報取得部2208は、各曜日について、日ごとのアクセス数の平均値を取得する。図19の曜日別平均アクセス数管理表の「ID=1」のレコードを参照のこと。
次に、アクセス関連情報取得部2208は、情報群「yaaoo.co.jp」について、昨日のアクセスログ情報を取得する。そして、アクセス関連情報取得部2208は、昨日の曜日「水曜日」を取得する、とする。次に、アクセス関連情報取得部2208は、昨日の曜日「水曜日」の平均アクセス数「456,904」を取得する。また、アクセス関連情報取得部2208は、取得した昨日のアクセスログ情報から昨日のアクセス数「932,542」を取得した、とする。そして、アクセス関連情報取得部2208は、昨日の曜日の平均アクセス数「456,904」と、昨日のアクセス数「932,542」との差「932,542−456,904=475,638」を算出する。この差「475,638」が、ここでの情報群「yaaoo.co.jp」のアクセス数変化情報となる。そして、アクセス関連情報取得部2208は、情報群識別子「yaaoo.co.jp」とアクセス数変化情報「475,638」を対にして格納する。そして、ランキング情報構成部2209は、アクセス数変化情報「475,638」をパラメータとして、情報群「yaaoo.co.jp」のスコア(例えば、「5823」)を算出する。図20のランキング情報管理表の「ID=1」のレコードを参照のこと。ここで、例えば、ランキング情報構成部2209は、関数「f(アクセス数変化情報,平均アクセス数)」により、スコアを算出する、とする。ここで、平均アクセス数とは、1日の平均のアクセス数である。ここで、関数fは、通常、アクセス数変化情報,平均アクセス数をパラメータとする増加関数である。つまり、アクセス数変化情報の値が大きいほど、平均アクセス数が大きいほど、スコアが大きくなる。ただし、アクセス数変化情報の方が、スコアに与える影響は大きい方が好ましい。なお、関数fは、「f(アクセス数変化情報)」であり、例えば、スコアは、アクセス数変化情報そのものでも良いことは言うまでもない。
また、次に、アクセス関連情報取得部2208は、2つ目の情報群「www.ama.co.jp」について、各曜日のアクセス数の平均値を、曜日ごとに算出し、曜日を識別する情報と、各曜日のアクセス数の平均値を対にして、記憶媒体に、少なくとも一時的に格納する。そして、アクセス関連情報取得部2208は、各曜日について、日ごとのアクセス数の平均値を取得する。図19の曜日別平均アクセス数管理表の「ID=2」のレコードを参照のこと。
次に、アクセス関連情報取得部2208は、情報群「www.ama.co.jp」について、昨日のアクセスログ情報を取得する。そして、アクセス関連情報取得部2208は、昨日の曜日「水曜日」を取得する、とする。次に、アクセス関連情報取得部2208は、昨日の曜日「水曜日」の平均アクセス数「211,587」を取得する。また、アクセス関連情報取得部2208は、取得した昨日のアクセスログ情報から昨日のアクセス数「211,349」を取得した、とする。そして、アクセス関連情報取得部2208は、昨日の曜日の平均アクセス数「211,587」と、昨日のアクセス数「211,349」との差「211,349−211,587=−238」を算出する。この差「−238」が、ここでの情報群「www.ama.co.jp」のアクセス数変化情報となる。そして、アクセス関連情報取得部2208は、情報群識別子「www.ama.co.jp」とアクセス数変化情報「−238」を対にして格納する。そして、ランキング情報構成部2209は、アクセス数変化情報「−238」をパラメータとして、情報群「www.ama.co.jp」のスコアを算出する。ここで、例えば、ランキング情報構成部2209は、関数「f(アクセス数変化情報,平均アクセス数)」により、スコア「19」を算出する、とする。図20のランキング情報管理表の「ID=2」のレコードを参照のこと。
以上の処理を、他の情報群に対しても行う。そして、ランキング情報構成部2209は、スコアをキーとして、情報群識別子をソートする。次に、ランキング情報構成部2209は、そのソート結果を用いて、ランキング情報を構成する。最終的なランキング情報は、例えば、図20のランキング情報管理表のレコードをスコア順に降順にソートして得られた表である。
以上、本実施の形態によれば、アクセス数の変化の情報を用いて、ホームページ等の情報群のランキングを行うことができる。
また、本実施の形態によれば、所定時間以上出力されている情報群(例えば、ホームページ)のみ、アクセスされているとしてカウントした場合に、さらに実質的な情報群のランキングが可能となる。
さらに、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、情報群識別子で識別される情報群ごとに、記憶媒体に格納されているアクセスログ情報のアクセス時刻情報を用いて、アクセス数の変化に関する情報であるアクセス数変化情報を取得するアクセス関連情報取得部と、前記アクセス数変化情報を用いて、2以上の情報群のランキングを示す情報であるランキング情報を構成するランキング情報構成部と、前記ランキング情報構成部が構成したランキング情報を出力する出力部として機能させるためのプログラム、である。
上記プログラムは、アクセス関連情報取得部を、前記情報群が、所定時間以上、情報端末装置で出力されている場合に、アクセスされたとして、コンピュータを機能させるためのプログラム、であることは好適である。
また、上記プログラムにおいて、前記アクセスログ情報は、アクセスしたユーザを特定するユーザ識別子をも有し、前記アクセス関連情報取得部は、一のユーザ識別子と対になる情報群識別子で識別される情報群の出力の開始から終了までの時間である情報群の出力時間を、当該ユーザ識別子と対になる二つ以上のアクセス時刻情報を用いて取得し、当該出力時間が予め決められた時間に対して長い場合に、前記情報群がアクセスされたとして、コンピュータを機能させるためのプログラム、であることは好適である。
また、上記プログラムにおいて、情報群が閲覧される情報端末装置における、情報群を閲覧するアプリケーションが終了した旨を示す終了信号を受信する信号受信部と、前記信号受信部が終了信号を受信した時刻に関する情報である出力終了時刻情報を取得する出力終了時刻情報取得部をさらに具備し、前記アクセス関連情報取得部は、前記出力終了時刻情報をも用いて、情報群の出力が切り替わるまでの時間である情報群の出力時間を取得し、当該出力時間が予め決められた時間に対して長い場合に、前記情報群がアクセスされたとするものとして、コンピュータを機能させるためのプログラム、であることは好適である。
また、上記プログラムにおいて、情報群が閲覧される情報端末装置における、情報群を出力中である旨を示す出力中信号を、所定の間隔で受信する信号受信部と、前記信号受信部が出力中信号を受信しなくなったことを検知し、当該検知を基に、出力時間に関する情報である出力時間情報を取得する出力時間情報取得部をさらに具備し、前記アクセス関連情報取得部は、前記出力時間情報をも用いて、情報群の出力が切り替わるまでの時間である情報群の出力時間を取得し、当該出力時間が予め決められた時間に対して長い場合に、前記情報群がアクセスされたとするものとして、コンピュータを機能させるためのプログラム、であることは好適である。
さらに、上記プログラムにおいて、アクセスログ情報を2以上の情報端末装置から受信するアクセスログ情報受信部と、前記アクセスログ情報受信部が受信した2以上のアクセスログ情報を前記アクセスログ情報格納部に蓄積するアクセスログ情報蓄積部をさらに具備するものとして、コンピュータを機能させるためのプログラム、であることは好適である。
(実施の形態3)
本実施の形態において、1以上の情報群に対する現在の視聴数を出力することができる情報処理装置等について説明する。また、本実施の形態において、情報群が現在、出力中であることを検出する技術、または、出力が完了したことを検出する技術についても説明する。
図1は、本実施の形態における情報処理システムの概念図である。図21は、本実施の形態における情報処理システムのブロック図である。
情報処理システム3は、情報端末装置11、情報処理装置32を具備する。
情報処理装置32は、アクセスログ情報格納部1201、アクセスログ情報受信部1202、信号受信部1203、アクセスログ情報蓄積部1204、命令受付部1205、アクセス関連情報取得部3208、現アクセス数関連情報出力部3201を具備する。
アクセス関連情報取得部3208は、情報群識別子で識別される情報群ごとに、現アクセス数関連情報を取得する。現アクセス数関連情報とは、現在、アクセスされているユーザ数または情報端末装置の数に関する情報である。また、現アクセス数関連情報は、例えば、全体のアクセスの中での特定の情報群のアクセスの率である視聴率(アクセス率、とも言うこととする。)などである。アクセス関連情報取得部3208は、アクセスログ情報のアクセス時刻情報を用いて、現在、アクセス中の端末数を示す現アクセス数関連情報を取得する。また、アクセス関連情報取得部3208は、信号受信部1203が終了信号に対応する情報群は、現在、アクセス中ではない、と判断し、現在、アクセス中の端末数を示す現在アクセス数を取得することは好適である。また、アクセス関連情報取得部3208は、信号受信部1203が出力中信号を受信しなくなった情報群は、現在、アクセス中ではない、と判断し、現在、アクセス中の端末数を示す現アクセス数関連情報を取得することは好適である。さらに、アクセス関連情報取得部3208は、ある情報群に対して、出力の切り替わりの情報がなく、一定時間以上、経過している場合に、その情報群は出力中でない、と判断することは好適である。ここで、アクセスとは、通常、表示や閲覧、という意味である。また、ここでは、端末数とは、ユーザ数でも良い。アクセス関連情報取得部3208は、通常、MPUやメモリ等から実現され得る。アクセス関連情報取得部3208の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
現アクセス数関連情報出力部3201は、アクセス関連情報取得部3208が取得した現アクセス数関連情報を、情報群ごとに出力する。ここで、出力とは、通常、外部の装置(情報端末装置11)への送信であるが、ディスプレイへの表示、プリンタへの印字、音出力、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。現アクセス数関連情報出力部3201は、は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
次に、情報処理装置32の動作について説明する。情報処理装置32が、情報端末装置11から各種データ、信号(信号もデータも同意義である)を受信して、少なくとも一時蓄積する処理である蓄積処理については、図3のフローチャートを用いて説明した処理と同様である。
次に、情報処理装置32の動作について図22のフローチャートを用いて説明する。
(ステップS2201)命令受付部1205は、現アクセス数関連情報の出力命令を受信したか否かを判断する。現アクセス数関連情報の出力命令を受信すればステップS2202に行き、現アクセス数関連情報の出力命令を受信しなければステップS2201に戻る。
(ステップS2202)アクセス関連情報取得部3208は、カウンタiに1を代入する。
(ステップS2203)アクセス関連情報取得部3208は、アクセスログ情報格納部1201を検査し、i番目の情報群(i番目の情報群識別子)が、存在するか否かを判断する。なお、アクセス関連情報取得部3208は、アクセスログ情報格納部1201とは別に、情報群識別子の集合を保持しており、その情報群識別子の集合を検査し、i番目の情報群が、存在するか否かを判断しても良い。i番目の情報群が存在すればステップS2204に行き、i番目の情報群が存在しなければステップS2206に行く。なお、ここで、iを新しいアクセスログ情報からチェックするように設定することは好適である。また、アクセス関連情報取得部3208は、現在から所定時間内のアクセスログ情報のみを最初に抽出してから処理を行うことは好適である。かかることは、他のフローチャートにおいても同様である。
(ステップS2204)アクセス関連情報取得部3208等は、現アクセス数関連情報を取得する処理を行う。現アクセス数関連情報取得処理について、図23のフローチャートを用いて説明する。
(ステップS2205)アクセス関連情報取得部3208は、カウンタiを1、インクリメントする。ステップS2203に戻る。
(ステップS2206)アクセス関連情報取得部3208は、現アクセス数関連情報をキーとして、情報群識別子をソートする。ここで、通常、降順に情報群識別子はソートされる。また、ソートの対象は、情報群識別子と現アクセス数関連情報等対の情報でも良い。
(ステップS2207)アクセス関連情報取得部3208は、ステップS2206におけるソート結果を用いて、出力する情報を構成する。
(ステップS2208)出力部1210は、ステップS2207で構成した情報を、情報端末装置11に送信する。処理を終了する。
なお、図22のフローチャートにおいて、ステップS2206の処理を行わず、出力する情報がソート結果を含まなくても良い。
次に、ステップS2204の現アクセス数関連情報取得処理の例について、図23のフローチャートを用いて説明する。図23のフローチャートにおいて、図5のフローチャートと同様の処理について、説明を省略する。
(ステップS2301)アクセス関連情報取得部3208は、初期化を行う。初期化とは、カウンタjに1を代入することである。また、初期化とは、変数「現アクセス数関連情報」に0を代入することである。
(ステップS2302)アクセス関連情報取得部3208は、ステップS501で取得したアクセスログ情報の中に、j番目のユーザ識別子が存在するか否かを判断する。j番目のユーザ識別子が存在すればステップS2303に行き、j番目のユーザ識別子が存在しなければステップS2310に行く。
(ステップS2303)アクセス関連情報取得部3208は、ステップS501で取得したアクセスログ情報の中で、j番目のユーザ識別子を含む最新のアクセスログ情報を取得する。アクセス関連情報取得部3208は、最新のアクセスログ情報を取得するために、アクセスログ情報が有する時刻情報を用いる。
(ステップS2304)アクセス関連情報取得部3208は、ステップS2303で取得したアクセスログ情報を用いて、j番目のユーザ識別子で識別されるユーザが閲覧している情報群が、他の情報群に移行しているか否かを判断する。他の情報群に移行していればステップS2309に行き、他の情報群に移行していなければステップS2305に行く。他の情報群に移行しているか否かについて、アクセス関連情報取得部3208は、例えば、以下のように判断する。アクセス関連情報取得部3208は、j番目のユーザ識別子を有する最新のアクセスログ情報をアクセスログ情報格納部1201から読み出す。次に、アクセス関連情報取得部3208は、読み出したアクセスログ情報が有する情報群識別子がi番目の情報群の識別子であるか否かを検査し、i番目の情報群の識別子でなければ、他の情報群に移行していると判断する。
(ステップS2305)アクセス関連情報取得部3208は、ステップS2303で取得したアクセスログ情報が終了信号である、または終了信号を含むものであるか否かを判断する。アクセスログ情報が終了信号等であればステップS2309に行き、アクセスログ情報が終了信号等でなければステップS2306に行く。
(ステップS2306)アクセス関連情報取得部3208は、ステップS2303で取得したアクセスログ情報を検査し、情報処理装置32が、情報端末装置11からi番目の情報群の出力中信号を受信してきているか否かを判断する。i番目の情報群の出力中信号を受信してきていなければステップS2309に行き、i番目の情報群の出力中信号を受信してきていればステップS2307に行く。情報端末装置11からi番目の情報群の出力中信号を受信してきているか否かについて、アクセス関連情報取得部3208は、例えば、以下のように判断する。アクセス関連情報取得部3208は、ステップS2303で取得したアクセスログ情報が現在時刻から所定時間以内(より短い、でも良い。)の時刻情報を含む場合、情報端末装置11からi番目の情報群の出力中信号を受信してきていると判断する。一方、アクセス関連情報取得部3208は、ステップS2303で取得したアクセスログ情報が現在時刻から所定時間以上(より長い、でも良い。)経過している時刻情報を含む場合、情報端末装置11からi番目の情報群の出力中信号を受信してきていないと判断する。
(ステップS2307)アクセス関連情報取得部3208は、ステップS2303で取得したアクセスログ情報を検査し、当該アクセスログ情報が有する時刻情報が示す時刻が、現在時刻より、所定時間以上経過しているか否かを判断する。所定時間以上経過していればステップS2309に行き、所定時間以上経過していなければステップS2308に行く。なお、所定時間(例えば、1時間など)以上の経過は、例えば、いわゆるブラウザの終了、または、情報端末装置11の画面に表示したまま、ユーザが席をはずしており、情報群が閲覧されていないことを示す。
(ステップS2308)アクセス関連情報取得部3208は、i番目の情報群に対応する現アクセス数関連情報に1を加える。
(ステップS2309)アクセス関連情報取得部3208は、カウンタjを1、インクリメントする。ステップS2302に戻る。
(ステップS2310)アクセス関連情報取得部3208は、i番目の情報群の情報群識別子と、現アクセス数関連情報を対にして、少なくとも、一時的に記憶媒体に格納する。
なお、図23のフローチャートにおいて、ステップS2304からステップS2307の現在アクセス中であるか否かの判断ロジックは、すべて利用しなくても良い。つまり、当該複数の判断ロジックのうち、1以上の判断ロジックを適用すれば良い。また、図23のフローチャートにおいて、現在アクセス中であるか否かの判断ロジックについて、ステップS2304からステップS2307における判断処理とは、異なる判断処理を行っても良い。
また、図23のステップS501の処理において、i番目の情報群のアクセスログ情報をすべて取得するのではなく、「現在」時刻から「所定時間」分だけさかのぼって取得することは好適である。かかる処理により、全体の処理速度を高速にできる。
また、図23のフローチャートにおいて、時刻が新しいアクセスログ情報からチェックするようにすることは好適である。
以下、本実施の形態における情報処理装置の具体的な動作について説明する。情報処理装置の概念図は図1である。
(具体例1)
今、情報処理装置32は、実施の形態1で説明した、図7のアクセスログ情報管理表を蓄積している、とする。また、現在時刻は、「2007/6/11/12:09:12」であるとする。
かかる場合、ある情報端末装置11のユーザは、情報端末装置11に対して、ホームページの現アクセス数関連情報の出力指示を入力する。そして、情報端末装置11の受付部1101は、現アクセス数関連情報の出力指示を受け付ける。次に、情報送信部1102は、現アクセス数関連情報の出力指示を、情報処理装置12に送信する。
次に、情報処理装置32の命令受付部1205は、現アクセス数関連情報の出力指示を受信する。そして、アクセス関連情報取得部3208は、以下に示すように、1番目の情報群識別子(URL)から順に処理していく。
アクセス関連情報取得部3208は、図7のアクセスログ情報管理表から、1番目の情報群識別子「yaaoo.co.jp」を読み出す。そして、アクセス関連情報取得部3208は、図7のアクセスログ情報管理表から、情報群識別子「yaaoo.co.jp」を有するアクセスログ情報をすべて読み出す。そして、アクセス関連情報取得部3208は、取得したすべてのアクセスログ情報の中で、1番目のユーザ識別子「AABC」を取得する。次に、アクセス関連情報取得部3208は、情報群識別子「yaaoo.co.jp」、1番目のユーザ識別子「AABC」を含む最新のアクセスログ情報を取得する。
次に、アクセス関連情報取得部3208は、取得したアクセスログ情報を用いて、ユーザ識別子「AABC」で識別されるユーザが閲覧している情報群が、他の情報群に移行しているか否かを判断する。ここでは、アクセス関連情報取得部3208は、図7の「ID=3」により、他の情報群に移行していると判断する。
次に、アクセス関連情報取得部3208は、情報群識別子「yaaoo.co.jp」を有するアクセスログ情報中において、2番目のユーザ識別子を取得し、2番目のユーザ識別子に対して、図23のフローチャートに従った判断処理を行う。そして、情報群識別子「yaaoo.co.jp」に対して、まさに現在、閲覧中のユーザ識別子を取得し、記憶媒体に格納する。そして、アクセス関連情報取得部3208は、情報群識別子「yaaoo.co.jp」に対して、まさに現在、閲覧中のユーザ識別子の数を算出し、その数を、情報群識別子「yaaoo.co.jp」に対する現アクセス数関連情報として、情報群識別子「yaaoo.co.jp」と対にして、記憶媒体に格納する。
かかる処理を、すべての情報群識別子に対して行う。
次に、アクセス関連情報取得部3208は、現アクセス数関連情報をキーとして、情報群識別子と現アクセス数関連情報の対の情報をソートする。そして、アクセス関連情報取得部3208は、図24に示す現アクセス数関連情報管理表を得る。なお、アクセス関連情報取得部3208は、情報群識別子ごとに、全体の視聴数に対する視聴の割合である視聴率も算出する、とする、図24において、視聴数は、現在閲覧している情報端末装置の数であり、視聴率は、「視聴数/全視聴数の合計(%)」により算出される割合である。
次に、出力部1210は、図24に示す現アクセス数関連情報管理表を、情報端末装置11に送信する。
そして、情報端末装置11は、図24に示す現アクセス数関連情報管理表を受信し、出力する。なお、情報端末装置11における現アクセス数関連情報の出力態様は問わない。
(具体例2)
今、情報処理装置32は、実施の形態1で説明した、図11のアクセスログ情報管理表を蓄積している、とする。また、現在時刻は、「2007/6/11/12:09:12」であるとする。
かかる場合、具体例1と同様に、情報処理装置32の命令受付部1205は、現アクセス数関連情報の出力指示を受信し、アクセス関連情報取得部3208は、以下に示すように、1番目の情報群識別子(URL)から順に処理していく。
アクセス関連情報取得部3208は、図11のアクセスログ情報管理表から、1番目の情報群識別子「yaaoo.co.jp」を読み出す。そして、アクセス関連情報取得部3208は、図11のアクセスログ情報管理表から、情報群識別子「yaaoo.co.jp」を有するアクセスログ情報をすべて読み出す。そして、アクセス関連情報取得部3208は、取得したすべてのアクセスログ情報の中で、1番目のユーザ識別子「AABC」を取得する。次に、アクセス関連情報取得部3208は、情報群識別子「yaaoo.co.jp」、1番目のユーザ識別子「AABC」を含む最新のアクセスログ情報(図11の「ID=7」のレコード)を取得する。
次に、アクセス関連情報取得部3208は、取得したアクセスログ情報(図11の「ID=7」のレコード)を用いて、ユーザ識別子「AABC」で識別されるユーザが閲覧している情報群が、他の情報群に移行しているか否かを判断する。ここでは、アクセス関連情報取得部3208は、図11の「ID=8」により、他の情報群に移行していると判断する。
次に、アクセス関連情報取得部3208は、情報群識別子「yaaoo.co.jp」を有するアクセスログ情報中において、2番目以降の各ユーザ識別子を取得し、各ユーザ識別子に対して、図23のフローチャートに従った判断処理を行う。
つまり、アクセス関連情報取得部3208は、情報群識別子「yaaoo.co.jp」を有し、現在時刻「2007/6/11/12:09:12」と所定期間(例えば、「2秒」)の間(時刻「2007/6/11/12:09:10」から時刻「2007/6/11/12:09:12」の間)の時刻情報を有するアクセスログ情報を抽出し、そのアクセスログ情報の数を算出する。そして、その数を現アクセス数関連情報とする。
そして、アクセス関連情報取得部3208は、情報群識別子「yaaoo.co.jp」と現アクセス数関連情報を対応付けて、蓄積する。
そして、アクセス関連情報取得部3208は、図24に示すような現アクセス数関連情報管理表を得る。そして、出力部1210は、図24に示す現アクセス数関連情報管理表を、情報端末装置11に送信する。
そして、情報端末装置11は、図24に示す現アクセス数関連情報管理表を受信し、出力する。なお、情報端末装置11における現アクセス数関連情報の出力態様は問わない。
(具体例3)
今、情報処理装置32は、実施の形態1で説明した、図12のアクセスログ情報管理表を蓄積している、とする。また、現在時刻は、「2007/6/11/12:09:12」であるとする。
かかる場合、具体例1、2と同様に、情報処理装置32の命令受付部1205は、現アクセス数関連情報の出力指示を受信し、アクセス関連情報取得部3208は、以下に示すように、1番目の情報群識別子(URL)から順に処理していく。
つまり、アクセス関連情報取得部3208は、各情報群識別子に対して、図12のアクセスログ情報管理表から、当該情報群識別子を有し、ユーザ識別子ごとの最新のアクセスログ情報を取得する。そして、ユーザ識別子ごとの最新のアクセスログ情報が有する終了フラグが「1」でもなく、当該アクセスログ情報が有する時刻情報が、現在時刻「2007/6/11/12:09:12」から所定期間(例えば、10分、など)以上経過していないか否かを判断する。アクセス関連情報取得部3208は、ユーザ識別子ごとの最新のアクセスログ情報が有する終了フラグが「1」でもなく、かつ、当該アクセスログ情報が有する時刻情報が、現在時刻「2007/6/11/12:09:12」から所定期間(例えば、10分、など)以上経過していないアクセスログ情報を抽出し、そのアクセスログ情報の数を算出する。そして、アクセス関連情報取得部3208は、そのアクセスログ情報の数を現アクセス数関連情報として、当該情報群識別子と対にして格納する。
そして、アクセス関連情報取得部3208は、図24に示すような現アクセス数関連情報管理表を得る。そして、出力部1210は、図24に示す現アクセス数関連情報管理表を、情報端末装置11に送信する。
そして、情報端末装置11は、図24に示す現アクセス数関連情報管理表を受信し、出力する。なお、情報端末装置11における現アクセス数関連情報の出力態様は問わない。
以上、本実施の形態によれば、能動的にユーザがアクセスする情報群(例えば、Web上のホームページ)に対して、リアルタイムな視聴数(閲覧数、出力数、表示数と言っても良い。)や視聴率を取得し、提示することができる。かかることにより、ユーザが能動的に取得する情報にも関わらず、まさに現在の人気度合いを知ることができる。
なお、本実施の形態によれば、現在、ある情報群が、まさに閲覧中であるか否かを判断するアルゴリズムをいくつか説明したが、他のアルゴリズムにより、閲覧中であるか否かを判断しても良い。
また、本実施の形態において、アクセスログ情報のすべてを利用して、各情報群の現在の視聴数や視聴率を算出したが、「現在」時刻から「所定時間」分だけさかのぼって、アクセスログ情報を取得し、少ないアクセスログ情報を用いて各情報群の現在の視聴数や視聴率を算出することは好適である。かかることにより、全体の処理速度を高速にできるからである。
さらに、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、アクセスログ情報を2以上の情報端末装置から受信するアクセスログ情報受信部と、前記アクセスログ情報受信部が受信したアクセスログ情報を記憶媒体に蓄積するアクセスログ情報蓄積部と、前記情報群識別子で識別される情報群ごとに、前記アクセスログ情報のアクセス時刻情報を用いて、現在、アクセス中の端末数を示す現在アクセス数に関する情報である現アクセス数関連情報を取得するアクセス関連情報取得部と、前記アクセス関連情報取得部が取得した現アクセス数関連情報を出力する現アクセス数関連情報出力部として機能させるためのプログラム、である。
また、上記プログラムにおいて、コンピュータを、情報群が閲覧される情報端末装置における、情報群を閲覧するアプリケーションが終了した旨を示す終了信号を受信する信号受信部としてさらに機能させ、前記アクセス関連情報取得部は、前記信号受信部が終了信号に対応する情報群は、現在、アクセス中ではない、と判断し、現在、アクセス中の端末数を示す現在アクセス数を取得するものとして機能させるためのプログラム、であることは好適である。
また、上記プログラムにおいて、コンピュータを、情報群が閲覧される情報端末装置における、情報群を出力中である旨を示す出力中信号を、所定の間隔で受信する信号受信部としてさらに機能させ、前記アクセス関連情報取得部は、前記信号受信部が出力中信号を受信しなくなった情報群は、現在、アクセス中ではない、と判断し、現在、アクセス中の端末数を示す現在アクセス数を取得するものとして機能させるためのプログラム、であることは好適である。
(実施の形態4)
本実施の形態において、実施の形態1から実施の形態3で述べた情報処理装置に格納されている情報群のアクセス数や、アクセス数変化情報や、ランキング情報や、視聴率などを用いて、情報群をランク付けして、情報を出力する情報処理装置について説明する。本情報処理装置は、いわゆる検索エンジンと言われるものである。
図1は、本実施の形態における情報処理システムの概念図である。図25は、本実施の形態における情報処理装置のブロック図である。情報処理システム4は、情報端末装置11、情報処理装置42を具備する。
情報処理装置42は、情報群検索情報格納部4201、ランキング情報格納部4202、検索情報受信部4203、情報群検索部4204、検索結果構成部4205、検索結果送信部4206を具備する。
情報群検索情報格納部4201は、情報群識別子と1以上のキーワードを対に有する情報群検索情報を2以上、格納している。情報群検索情報格納部4201は、情報群識別子に対応する情報群や、情報群に対する紹介文の情報や見出し情報などを保持していても良い。情報群や情報群識別子などは、例えば、Web上の2以上のサーバ装置から収集された情報である。情報群検索情報格納部4201の情報群検索情報は、例えば、Web上の多数のサーバ装置に格納されているホームページとキーワードの対の情報である。情報群検索情報格納部4201は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
ランキング情報格納部4202は、アクセス数、アクセス数変化情報、現アクセス数関連情報のうちのいずれか1以上の情報を用いて構成されたランキング情報であり、2以上の情報群のランキング情報を格納している。ここでのランキング情報とは、情報群識別子をソートした結果、情報群識別子に順位を付した結果、情報識別子とアクセス数を含む情報などである。ここでのランキング情報は、実施の形態1や実施の形態2のアクセス関連情報やランキング情報、実施の形態3の現アクセス数関連情報などと同じ情報でも良い。ランキング情報格納部4202は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
検索情報受信部4203は、情報端末装置11から検索情報を受信する。検索情報は、検索を指示する情報や命令である。検索情報とは、検索指示の命令だけでも良いし、1以上のキーワードだけでも良いし、SQLなどの検索式でも良いし、検索のための自然言語の文等でも良い。検索情報受信部4203は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
情報群検索部4204は、検索情報受信部4203の検索情報の受信に対応して、2以上の情報群識別子を取得する。情報群検索部4204は、検索情報を用いて検索し、2以上の情報群識別子を取得する。情報群検索部4204は、通常、情報群検索情報格納部4201から、検索情報が有するキーワードを用いて検索し、2以上の情報群識別子を取得する。情報群検索部4204が行う検索処理は、公知の検索エンジンが行うホームページ(URL)の検索処理と同様でも良い。例えば、情報群検索部4204は、検索情報が有する1以上のキーワードのうち、すべてのキーワードと対になる情報群識別子のみを取得しても良いし、一つのキーワードと対になる情報群識別子をも取得しても良い。かかる場合、情報群検索部4204は、多数のキーワードと対になる情報群識別子ほど、ランクを上げて、検索することが好適である。この場合、情報群検索部4204は、情報群識別子ごとに、第一のスコアを取得し、第一のスコアと対にして情報群識別子を取得する。情報群検索部4204は、通常、MPUやメモリ等から実現され得る。情報群検索部4204の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
検索結果構成部4205は、ランキング情報を用いて、情報群検索部4204が取得した2以上の情報群識別子を順序付けし、情報端末装置11で出力される情報である検索結果を構成する。順序付けとは、2以上の情報群識別子のフィルタリング処理でも良い。つまり、順序付けとは、ランキング情報を用いて、情報端末装置に送信する情報群識別子と、送信しない情報群識別子を分類する処理でも良い。かかる場合でも、「送信する/しない」という2段階に順位付けされた、といえる。また、順序付けとは、ランキング情報から得られるスコアの順に降順に並び替えることでも良い。検索結果とは、通常、2以上の情報群識別子がソートされている。ただし、検索結果は、情報群識別子とスコアの対の情報の集合でも良い。検索結果構成部4205は、通常、MPUやメモリ等から実現され得る。検索結果構成部4205の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
検索結果送信部4206は、検索結果構成部4205が構成した検索結果を情報端末装置11に送信する。検索結果送信部4206は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
次に、情報処理装置42の動作について図26のフローチャートを用いて説明する。
(ステップS2601)検索情報受信部4203は、情報端末装置11から検索情報を受信したか否かを判断する。検索情報を受信すればステップS2602に行き、検索情報を受信しなければステップS2601に戻る。
(ステップS2602)情報群検索部4204は、ステップS2601で受信した検索情報が有するキーワードを抽出し、当該キーワードを用いて、情報群検索情報格納部4201から2以上の情報群識別子を取得する。なお、ここで、情報群検索部4204は、各情報群識別子に対する第一のスコアをも取得しても良い。例えば、情報群検索部4204は、ヒットしたキーワードの数や、ヒットしたキーワードの定義の順序などにより、スコアを決定する。
(ステップS2603)検索結果構成部4205は、カウンタiに1を代入する。
(ステップS2604)検索結果構成部4205は、ステップS2602で取得した情報群識別子の中で、i番目の情報群識別子が存在するか否かを判断する。i番目の情報群識別子が存在すればステップS2605に行き、i番目の情報群識別子が存在しなければステップS2608に行く。なお、i番目の情報群識別子は、i番目の情報群と同意義である。
(ステップS2605)検索結果構成部4205は、i番目の情報群識別子をキーとしてランキング情報格納部4202を検索し、i番目の情報群識別子のスコアを取得する。検索結果構成部4205は、ランキング情報格納部4202に格納されているi番目の情報群識別子と対になるスコアを検索するだけでも良いし、ランキング情報格納部4202に格納されているi番目の情報群識別子と対になるスコアと、ステップS2602で取得された第一のスコアを用いて、最終的なスコアを算出しても良い。この算出方法は、例えば、2つのスコアを加算する処理であったり、2つのスコアの平均値を算出する処理であったり、2つのスコアの加重平均を算出する処理等である。
(ステップS2606)検索結果構成部4205は、i番目の情報群識別子と、ステップS2605で取得したスコアを対にして格納する。ここでの格納先は、ハードディスク等の不揮発性の記録媒体でも良いし、主メモリ等の揮発性の記憶媒体でも良い。
(ステップS2607)検索結果構成部4205は、カウンタiを1、インクリメントする。ステップS2604に戻る。
(ステップS2608)検索結果構成部4205は、ステップS2606で格納された情報群識別子とスコアの対の情報を、スコアをキーとしてソートする。ここでのソートは、通常、降順のソートである。
(ステップS2609)検索結果構成部4205は、ステップS2608でのソート結果を用いて、検索結果を構成する。検索結果は、例えば、スコア順に並べられた情報群識別子と、情報群の見出し情報がアンカーになったHTMLファイルである。
(ステップS2610)検索結果送信部4206は、ステップS2609で構成された検索結果を情報端末装置11に送信する。ステップS2601に戻る。
なお、図26のフローチャートにおいて、実施の形態1から実施の形態3で述べた情報処理装置に格納されている情報群のアクセス数や、ランキング情報や、視聴率などを用いて、情報群をランク付けするべく、スコアを算出すれば良い。そのスコアの算出式や算出アルゴリズムは問わない。
また、図26のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
以下、本実施の形態における情報処理装置の具体的な動作について説明する。情報処理装置の概念図は図1である。
今、情報群検索情報格納部4201は、図27に示すような情報群管理表を保持している。情報群管理表は、「ID」「情報群識別子」「キーワード」「見出し」の属性を有する。また、情報群検索情報格納部4201は、情報群識別子に対応する情報群(例えば、ホームページであり、ファイルである。)をも保持していても良い。また、情報群識別子に対応する情報群は、いわゆるWeb上の1以上のサーバ装置が保持していても良い。かかる場合、「情報群識別子」は、情報群にアクセス可能なURLなどである。
かかる状況において、情報端末装置11のユーザは、「車」というキーワードを含む検索情報を入力した、とする。そして、情報端末装置11の受付部1101は検索情報を受付、情報送信部1102は、当該検索情報を情報処理装置42に送信する。
そして、情報処理装置42の検索情報受信部4203は、「車」というキーワードを含む検索情報を受信する。そして、情報群検索部4204、検索結果構成部4205、および検索結果送信部4206は、以下のように検索結果を、情報端末装置11に送信する。以下、検索結果の送信までの処理例について、3つの具体例を用いて説明する。
(具体例1)
今、図10に示すランキング情報管理表が、ランキング情報格納部4202に格納されている。
そして、情報群検索部4204は、受信された検索情報からキーワード「車」を取り出し、メモリ上に配置する。そして、情報群検索部4204は、キーワード「車」から、図27に示す情報群管理表を検索し、キーワード「車」を含む情報群識別子(「yaaoo.co.jp」「www.ama.co.jp」「tototo.co.jp」「niss.co.jp」)を抽出し、メモリ上に配置する。
次に、検索結果構成部4205は、抽出された4つの情報群識別子に対するアクセス数を、図10に示すランキング情報管理表から取得し、情報群識別子とアクセス数の対の情報(「yaaoo.co.jp,12576」「www.ama.co.jp,1825」「tototo.co.jp,572」「niss.co.jp,822」)を得る。ここでは、アクセス数がスコアとなっている。
次に、検索結果構成部4205は、情報群識別子とアクセス数の対の情報を、アクセス数をキーとして降順にソートする。そして、検索結果構成部4205は、「yaaoo.co.jp,ようこそ"yaaoo"へ」「www.ama.co.jp,ama自動車へようこそ」「niss.co.jp,niss自動車」「tototo.co.jp,自動車ならtototo社へ」を得る。ここでは、検索結果として、スコアは削除され、見出しの情報が挿入されている。
そして、検索結果構成部4205は、ソート結果を用いて、検索結果(「yaaoo.co.jp,ようこそ"yaaoo"へ」「www.ama.co.jp,ama自動車へようこそ」「niss.co.jp,niss自動車」「tototo.co.jp,自動車ならtototo社へ」と、各見出しをアンカーとするHTMLファイル)を構成する。このアンカーが示すリンク情報は、情報処理識別子(URL)になっている。そして、次に、検索結果送信部4206は、構成された検索結果を情報端末装置11に送信する。
次に、情報端末装置11の情報受信部1103は、検索結果を受信する。そして、情報出力部1104は、検索結果を、例えば、図28に示すように出力する。
(具体例2)
今、図17に示すランキング情報管理表が、ランキング情報格納部4202に格納されている。
そして、情報群検索部4204は、受信された検索情報からキーワード「車」を取り出し、メモリ上に配置する。そして、情報群検索部4204は、キーワード「車」から、図27に示す情報群管理表を検索し、キーワード「車」を含む(部分一致も含む)情報群識別子(「yaaoo.co.jp,3」「www.ama.co.jp,3」「tototo.co.jp,2」「atta.co.jp,2」「niss.co.jp,3」)を抽出し、メモリ上に配置する。情報群識別子の直後の数値は、図27の属性「キーワード」中の属性値の中で、「車」を含む(部分一致も含む)キーワードの個数である。この個数は、第一のスコアである。
次に、検索結果構成部4205は、抽出された5つの情報群識別子に対するスコア(第二のスコア、とする)を、図10に示すランキング情報管理表から取得し、情報群識別子と第一のスコアと第二のスコアの対の情報(「yaaoo.co.jp,3,102」「www.ama.co.jp,3,27」「tototo.co.jp,2,37」「atta.co.jp,2,191」「niss.co.jp,3,101」)を得る、とする。
次に、検索結果構成部4205は、第一のスコア(x1)と第二のスコア(x2)を用いて、最終的なスコア(以下、単にスコアという)を算出する、とする。ここでは、「スコア=x1+x2」である、とする。そして、検索結果構成部4205は、「yaaoo.co.jp,105」「www.ama.co.jp,30」「tototo.co.jp,39」「atta.co.jp,193」「niss.co.jp,104」を得る。
次に、検索結果構成部4205は、情報群識別子とスコアの対の情報を、スコアをキーとして降順にソートする。そして、検索結果構成部4205は、「atta.co.jp,193」「yaaoo.co.jp,105」「niss.co.jp,104」「tototo.co.jp,39」「www.ama.co.jp,30」を得る。
次に、検索結果構成部4205は、ソート結果を用いて、検索結果(「1. atta.co.jp,193」「2. yaaoo.co.jp,105」「3. niss.co.jp,104」「4. tototo.co.jp,39」「5. www.ama.co.jp,30」と、各見出しをアンカーとするHTMLファイル)を構成する。そして、次に、検索結果送信部4206は、構成された検索結果を情報端末装置11に送信する。
次に、情報端末装置11の情報受信部1103は、検索結果を受信する。そして、情報出力部1104は、検索結果を、出力する。出力態様は、例えば、図28に示すようものと同様で良いし、他の態様でも良い。
(具体例3)
今、図20に示すランキング情報管理表が、ランキング情報格納部4202に格納されている。
そして、情報群検索部4204は、具体例1と同様に、キーワード「車」から、図27に示す情報群管理表を検索し、キーワード「車」を含む4つの情報群識別子(「yaaoo.co.jp」「www.ama.co.jp」「tototo.co.jp」「niss.co.jp」)を抽出し、メモリ上に配置する。
次に、検索結果構成部4205は、抽出された4つの情報群識別子に対するアクセス数変化情報を、図20に示すランキング情報管理表から取得し、情報群識別子とアクセス数変化情報の対の情報(「yaaoo.co.jp,475638」「www.ama.co.jp,−238」「tototo.co.jp,12」「niss.co.jp,−4」)を得る。ここでは、アクセス数変化情報がスコアとなっている。
次に、検索結果構成部4205は、情報群識別子とアクセス数変化情報の対の情報を、アクセス数変化情報をキーとして降順にソートする。そして、検索結果構成部4205は、「yaaoo.co.jp,475638」「tototo.co.jp,12」「niss.co.jp,−4」「www.ama.co.jp,−238」を得る。次に、検索結果構成部4205は、アクセス数変化情報が正(+)のもののみ抽出し、「yaaoo.co.jp,475638,ようこそ"yaaoo"へ」「tototo.co.jp,12」を得る。そして、検索結果構成部4205は、ソート結果を用いて、検索結果(「yaaoo.co.jp,475638」「tototo.co.jp,12,自動車ならtototo社へ」と、各見出しをアンカーとするHTMLファイル)を構成する。このアンカーが示すリンク情報は、情報処理識別子(URL)になっている。そして、次に、検索結果送信部4206は、構成された検索結果を情報端末装置11に送信する。
次に、情報端末装置11の情報受信部1103は、検索結果を受信する。そして、情報出力部1104は、検索結果を出力する。
(具体例4)
今、図24に示す現アクセス数関連情報管理表が、ランキング情報格納部4202に格納されている。ここで、現アクセス数関連情報管理表はランキング情報管理表とも言うこととする。
そして、情報群検索部4204は、具体例1と同様に、キーワード「車」から、図27に示す情報群管理表を検索し、キーワード「車」を含む4つの情報群識別子(「yaaoo.co.jp」「www.ama.co.jp」「tototo.co.jp」「niss.co.jp」)を抽出し、メモリ上に配置する。
次に、検索結果構成部4205は、抽出された4つの情報群識別子に対する視聴率を、図24に示す現アクセス数関連情報管理表から取得し、情報群識別子と視聴率の対の情報(「yaaoo.co.jp,1.8」「www.ama.co.jp,2.5」「tototo.co.jp,0.8」「niss.co.jp,1.0」)を得る。ここでは、視聴率がスコアとなっている。
そして、以下、他の具体例と同様に、検索結果構成部4205は、視聴率をキーとして情報群識別子をソートし、検索結果(「www.ama.co.jp,ama自動車へようこそ」「yaaoo.co.jp,ようこそ"yaaoo"へ」「niss.co.jp,niss自動車」「tototo.co.jp,自動車ならtototo社へ」と、各見出しをアンカーとするHTMLファイル)を構成する。このアンカーが示すリンク情報は、情報処理識別子(URL)になっている。そして、次に、検索結果送信部4206は、構成された検索結果を情報端末装置11に送信する。
次に、情報端末装置11の情報受信部1103は、検索結果を受信する。そして、情報出力部1104は、検索結果を出力する。
以上、本実施の形態によれば、情報群のアクセス数や、ランキング情報や、視聴率などを用いて、情報群をランク付けして、情報を出力することができる。かかる情報処理装置によれば、本当に閲覧されている頻度や、現在のまさに閲覧されている状態に基づいて、情報群に順位付けし、情報群を検索できる。
なお、本実施の形態において、情報群検索部4204の検索アルゴリズムは問わない。
また、本実施の形態によれば、情報群検索部4204が先に動作した後、検索結果構成部4205のランク付けが行われた。しかし、検索結果構成部4205によるランク付けが予め行われており、その後、情報群検索部4204による検索処理を行っても良い。
なお、本実施の形態における具体例で、検索情報はキーワードを有した。しかし、検索情報はキーワードを有さなくても良い。つまり、検索情報は、検索の指示だけでも良い。かかる場合、すべての情報群(例えば、ホームページやサイトなど)が対象となり、情報群のアクセス数や、ランキング情報や、視聴率など(実施の形態1から実施の形態3で述べた情報処理装置に格納されている情報)を用いて、情報群をランク付けし、ランク付けした情報群の情報(情報群識別子など)を、ユーザに提示できる。つまり、例えば、検索の指示だけの検索情報を受け付けた場合、例えば、図10や、図17や、図20や、図24に示すランキング情報管理表のうちの、例えば、上位10の情報群識別子等が、そのまま出力される。このことにより、現在、流行っているものが何か、または、ある時期に流行っていたものが何か、などが情報群から把握できる。そして、注目度の高い情報群に容易にアクセスできる。つまり、本情報処理システムは、例えば、WWWの羅針盤として利用できる。
かかる場合の情報処理装置は、上記の実施の形態で説明した情報処理装置が出力した2以上の情報群のランキング情報を格納しているランキング情報格納部と、情報端末装置から検索指示である検索情報を受信する検索情報受信部と、前記検索情報の受信に対応して、2以上の情報群識別子を取得する情報群検索部と、前記ランキング情報を用いて、前記情報群検索部が取得した2以上の情報群識別子を順序付けし、情報端末装置で出力される情報である検索結果を構成する検索結果構成部と、前記検索結果を前記情報端末装置に送信する検索結果送信部を具備する情報処理装置、である。なお、検索結果は、順序付けランキング)した上位10の情報群識別子のみを含んでも良い。
さらに、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、情報端末装置からキーワードを含む検索情報を受信する検索情報受信部と、前記検索情報を用いて検索し、2以上の情報群識別子を取得する情報群検索部と、請求項1から請求項7いずれか記載の情報処理装置が出力した2以上の情報群のランキング情報を用いて、前記情報群検索部が取得した2以上の情報群識別子を順序付けし、情報端末装置で出力される情報である検索結果を構成する検索結果構成部と、前記検索結果を前記情報端末装置に送信する検索結果送信部として機能させるためのプログラム、である。
また、このプログラムは、コンピュータを、実施の形態1から3いずれか記載の情報処理装置が出力した2以上の情報群のランキング情報を用いて、情報群検索部が取得した2以上の情報群識別子を順序付けし、情報端末装置で出力される情報である検索結果を構成する検索結果構成部と、前記検索結果を前記情報端末装置に送信する検索結果送信部として機能させるためのプログラム、である。
また、上記プログラムにおいて、前記情報群検索部は、前記検索情報が有するキーワードを用いて、情報群識別子と1以上のキーワードを対に有する2以上の情報群検索情報を検索し、2以上の情報群識別子を取得するものとして機能させるためのプログラム、である。
(実施の形態5)
本実施の形態において、出力時間頻度分布情報を出力する情報処理装置について説明する。出力時間頻度分布情報とは、情報群ごとに、出力時間ごとの、頻度の分布を示す情報である。
図29は、出力時間頻度分布情報を示すグラフである。図29の縦軸は、アクセス数、横軸は、出力時間である。図29において、10秒間読まれている情報群(例えば、ホームページ)は、約750万件あることが分かる。
図1は、本実施の形態における情報処理システムの概念図である。図30は、本実施の形態における情報処理システムのブロック図である。
情報処理システム5は、情報端末装置11、情報処理装置52を具備する。
情報処理装置52は、アクセスログ情報格納部1201、命令受付部1205、出力終了時刻情報取得部1206、出力時間情報取得部1207、アクセス関連情報取得部5208、出力部5210を具備する。
アクセス関連情報取得部5208は、情報群識別子で識別される情報群ごとに、出力時間ごとの分布についての情報である出力時間頻度分布情報を取得する。ここでの出力時間とは、幅をもった時間である。ただし、その幅は一定であるとは限らない。アクセス関連情報取得部5208は、情報群ごとに、各出力時間の幅単位で、アクセス数を算出する。アクセス関連情報取得部5208は、例えば、ある情報群に対して、出力時間「1秒から3秒」「4秒から6秒」「7秒から9秒」「10秒から12秒」「13秒から15秒」などの各出力時間に対して、それだけのアクセス数が該当するかを取得する。上記の実施の形態において、出力時間を算出する処理を示したが、かかる出力時間を算出できれば、その出力時間に対応するアクセス数をインクリメントとすれば良い。アクセス関連情報取得部5208は、通常、MPUやメモリ等から実現され得る。アクセス関連情報取得部5208の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力部5210は、アクセス関連情報取得部5208が取得した出力時間頻度分布情報を出力する。ここで、出力とは、通常、他の装置(ここでは、情報端末装置11)への送信であるが、ディスプレイへの表示、プリンタへの印字、音出力、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。出力部5210は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
次に、情報処理装置52の動作について、図6のフローチャートと比較して、ステップS601、ステップS605が異なる。つまり、情報処理装置52の動作では、ステップS601において、出力時間に対応する2以上のアクセス数の変数、すべてに0を代入する。そして、ステップS603で取得した出力時間に対応するアクセス数を1、インクリメントする。
そして、アクセス関連情報取得部5208は、図31に示すような構造のアクセス関連情報管理表を得る。アクセス関連情報管理表は、情報群ごとに、出力時間ごとのアクセス数を管理している。
次に、出力部5210は、例えば、図31に示すようなアクセス関連情報管理表を、情報端末装置11に送信する。
そして、情報端末装置11は、図31に示すようなアクセス関連情報管理表を受信し、例えば、図29に示すようなグラフを出力する。
以上、本実施の形態によれば、情報群の閲覧のされ方の傾向を掴むことができる。
なお、本実施の形態において、出力時間頻度分布情報の傾向が他と異なり、例えば、「60秒」間ぐらいのアクセス数が、他の時間のアクセス数と比較して多いような情報群のランクを、他の一般的な傾向(図29に示すような傾向)を示す情報群と比較して、ランキングを上げるようにすることは好適である。
また、実施の形態1等で述べた情報処理装置のアクセス関連情報取得部が、出力時間頻度分布情報の傾向を示すデータであるアクセス関連情報を取得し、アクセス関連情報が他のアクセス関連情報との差が大きい場合に、ランキングを上げる(スコアを上げる)ようにすることは好適である。この場合のアクセス関連情報は、例えば、図29の曲線の、ある時間(X)の傾きの情報である。例えば、アクセス関連情報は、「時間t=1」「t=3」「t=5」「t=8」「t=10」「t=20」などのXの値の場合の曲線の傾き(微分値)をベクトルとする情報である。そして、アクセス関連情報取得部は、着目する情報群のベクトルと、標準的なベクトルとの距離を算出し、その距離をスコアとする、などの処理を行う。
さらに、本実施の形態に情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、情報群を識別する情報である情報群識別子と、前記情報群がアクセスされた時刻に関する情報であるアクセス時刻情報と、アクセスしたユーザを特定するユーザ識別子を有する情報である2以上のアクセスログ情報を用いて、前記情報群識別子で識別される情報群ごとに、出力時間ごとの分布についての情報である出力時間頻度分布情報を取得するアクセス関連情報取得部と、前記出力時間頻度分布情報を出力する出力部として機能させるためのプログラムである。
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
また、図32は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の広告情報サーバ装置や情報サーバ装置や端末装置を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図32は、このコンピュータシステム340の概観図であり、図33は、コンピュータシステム340のブロック図である。
図32において、コンピュータシステム340は、FD(Flexible Disk)ドライブ、CD−ROM(Compact Disk Read Only Memory)ドライブを含むコンピュータ341と、キーボード342と、マウス343と、モニタ344とを含む。
図33において、コンピュータ341は、FDドライブ3411、CD−ROMドライブ3412に加えて、CPU(Central Processing Unit)3413と、CPU3413、CD−ROMドライブ3412及びFDドライブ3411に接続されたバス3414と、ブートアッププログラム等のプログラムを記憶するためのROM(Read−Only Memory)3415と、CPU3413に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM(Random Access Memory)3416と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3417とを含む。ここでは、図示しないが、コンピュータ341は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
コンピュータシステム340に、上述した実施の形態の広告情報サーバ装置等の機能を実行させるプログラムは、CD−ROM3501、またはFD3502に記憶されて、CD−ROMドライブ3412またはFDドライブ3411に挿入され、さらにハードディスク3417に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ341に送信され、ハードディスク3417に記憶されても良い。プログラムは実行の際にRAM3416にロードされる。プログラムは、CD−ROM3501、FD3502またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ341に、上述した実施の形態の広告情報サーバ装置等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム340がどのように動作するかは周知であり、詳細な説明は省略する。
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。