JP2005084823A - 閲覧履歴分析装置、分析方法及び分析プログラム - Google Patents

閲覧履歴分析装置、分析方法及び分析プログラム Download PDF

Info

Publication number
JP2005084823A
JP2005084823A JP2003314424A JP2003314424A JP2005084823A JP 2005084823 A JP2005084823 A JP 2005084823A JP 2003314424 A JP2003314424 A JP 2003314424A JP 2003314424 A JP2003314424 A JP 2003314424A JP 2005084823 A JP2005084823 A JP 2005084823A
Authority
JP
Japan
Prior art keywords
content data
access
time
browsing
access list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003314424A
Other languages
English (en)
Inventor
Hiroshi Taira
博司 平
Jun Hirai
潤 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003314424A priority Critical patent/JP2005084823A/ja
Publication of JP2005084823A publication Critical patent/JP2005084823A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】各コンテンツデータの閲覧履歴から正確なアクセスシーケンスを抽出する。
【解決手段】 各コンテンツデータに対する閲覧履歴メモリに記憶された閲覧履歴を用いてアクセスリストを分析する閲覧履歴分析装置において、各コンテンツデータの特有情報とアクセスリストの切断判定時間との関係を定めた規則に従って、各コンテンツデータにおけるアクセスリストの切断判定時間を算出する切断判定時間算出手段14と、アクセスリストから各アクセス要求側が各コンテンツデータの閲覧に要した時間を示す閲覧時間を算出する閲覧時間算出手段16と、各コンテンツデータの閲覧時間がアクセスリストの切断判定時間より長いと、当該コンテンツデータが含まれるアクセスリストが当該コンテンツデータの終了位置で切断されたと判定する切断判定手段17とを備えている。
【選択図】 図1

Description

本発明は、WWWにおけるアクセス要求側を示すアクセス要求側識別データと、アクセス要求側にアクセスされたアクセス先を示すアクセス先識別データとを関連付けた各コンテンツデータに対する閲覧履歴メモリに記憶された閲覧の履歴を用いて、同一のアクセス要求側によるアクセスを示すアクセスリストを分析する閲覧履歴分析装置、閲覧履歴分析方法、及び閲覧履歴分析プログラムに関する。
各企業は、例えば自社製品を宣伝したり、自社を社会にアピールしたりするために、図12に示すように、自社の企業サイト1をインターネット2に接続して、一般の人が自己の閲覧端末4を用いて、プロバイダ3、インターネット2を介して、自社の企業サイト1を構成する各種データを自由に閲覧可能としている。ここでサイトを構成する各種データを「コンテンツデータ」と称する。コンテンツデータには、文字データや画像データ、動画データ、音楽データなど、及びこれらを組み合わせたものなどがある。
このような企業サイト1内には、LANの伝送路6に対して、インターネット2に接続されたWebサーバ5、複数のコンテンツデータを記憶するコンテンツデータメモリ7、インターネット2を介した各コンテンツデータに対する閲覧履歴を記憶する閲覧履歴メモリ8、及び分析サーバ9が接続されている。
コンテンツデータメモリ7内には、図13に示すように、それぞれコンテンツデータ番号が付された複数のコンテンツデータ10が記憶されている。また、閲覧履歴メモリ8には、アクセス要求側のIDと閲覧(アクセス)コンテンツデータと閲覧(アクセス)日時とからなる閲覧データが時系列的に記憶保持される。
企業にとって、個々のアクセス要求側が、どのコンテンツデータをどの順序で閲覧するかを分析することは、例えば宣伝効果やホームページの有用性などを確認する上で重要なことである。ここで同一のアクセス要求側によるアクセスを示すものを「アクセスリスト」と称する。企業サイト1内に設けられた分析サーバ9は、閲覧履歴メモリ8に記憶された閲覧履歴を用いて、このアクセスリストに対する分析を実施する。
ここで、アクセスリストについて詳細に検討する。前述したように、アクセスリストとは同一のアクセス要求側によるアクセスを示す。例えば、図13にようにコンテンツデータ番号1,2,3,4,5の5つのコンテンツデータ10からなる文書へ、アクセス要求側が1番→3番→2番→4番→5番の順番で閲覧(アクセス)を行えば、この1番→3番→2番→4番→5番の各コンテンツデータ10の閲覧をアクセスリストと考えるのが原則である。
ここで、WWWサイトにおける同一のアクセス要求側による連続的なアクセスを示すものとして「アクセスシーケンス」というものがある。アクセスシーケンスはセッションと呼ばれることもある。アクセスシーケンスは、WWWサイトにおける「訪問」ととらえられることもあり、アクセスシーケンスの数を数えたものはWWWサイトにおける「訪問数」ととらえられることもある。あるサイトにおける訪問数を、例えば時系列的に表示し、その時系列に沿った訪問数の増減の程度などをサイトの構成などと結びつけて議論することはサイトの改善などに有用である。
よって、アクセスシーケンスを抽出することはそのアクセスシーケンスを含むWWWサイトにおいて有用な効果を生むこととなり、一般に抽出の精度が高いほど効果の度合いは高くなる傾向がある。したがって、アクセスシーケンスをより高い精度で抽出することは有用で意味のあることである。
アクセスシーケンスは、時系列順にデータが並替えされたアクセスリストを、そのまま、もしくは適切な境目で分割して抽出される。これはアクセスシーケンスが同一のアクセス要求側による閲覧の一連の流れを知るために用いられているためであり、例えばアクセスリストにおいて隣接する2つのコンテンツデータの閲覧時刻が一定時間以上離れている場合などは、その間でアクセスの連続性が無くなったとみなして境目とするのが自然だからである。
例えば、各コンテンツデータ10へのアクセス日時が図14に示すように、コンテンツデータ番号3のコンテンツデータ10のアクセス日時と、コンテンツデータ番号2のコンテンツデータ10のアクセス日時に大きな時間差があった場合、1番→3番→2番→4番→5番の一つのアクセスリストを、1番→3番というアクセスシーケンスと、2番→4番→5番というアクセスシーケンスとに分割するのが一般的である。
このように、アクセスリストから、アクセスシーケンスの境目を判定することを「アクセスシーケンスの境界を判定する」、境目においてアクセスリストを切断することを「アクセスリストの切断」、アクセスシーケンスの境界を判定する材料となる、コンテンツデータ10ごとに定められ動的に変更される時間間隔を「アクセスリストの切断判定時間」と呼ぶ。
企業サイト1内に組込まれている従来の分析サーバ9においては、アクセスリストの切断判定時間は、コンテンツデータメモリ7に設定された全てのコンテンツデータ10に亘って同一値に設定されている。しかしながら、各コンテンツデータ10は、例えば、読むのに時間がかかったり、すぐに読み終わったり、それぞれ異なる特有情報を有している。このため、従来の分析手法においては、本来なら独立して存在する複数のアクセスシーケンスを誤って繋ないでしまう、もしくは1つのアクセスシーケンスを誤って切断してしまうなどの問題があり、これがアクセスリストを分析する際の障害になっていた。
ここで各コンテンツデータの特有情報には、各コンテンツデータの構成に関する情報や利用の程度に関する情報が少なくとも含まれる。例えば、各コンテンツデータの構成に関する情報には各コンテンツデータのファイルサイズや、文字データであれば文字数や行数、動画データや音楽データであれば視聴にかかる時間、画像データであれば画像の大きさ、などがある。また、例えば各コンテンツデータの利用の程度に関する情報には平均閲覧時間などがある。
本発明はこのような事情に鑑みてなされたものであり、各コンテンツデータのアクセスリストの切断判定時間がコンテンツデータ毎に自動的により適した値に設定され、この切断判定時間に基づいて、必要に応じて、同一のアクセス要求側によるアクセスを示すアクセスリストをより適切な位置で切断でき、より精度を高めたアクセスシーケンスを抽出でき、ひいてはこのアクセスシーケンスを用いた各アクセス要求側の各コンテンツデータに対する閲覧の分析をより正確に実施できる閲覧履歴分析装置、閲覧履歴分析方法、及び閲覧履歴分析プログラムを提供することを目的とする。
上記課題を解消するために、本発明は、WWWにおけるアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされたアクセス先を示すアクセス先識別データとを関連付けた、各コンテンツデータに対する閲覧履歴メモリに記憶された閲覧履歴を用いて、同一のアクセス要求側によるアクセスを示すアクセスリストを分析する閲覧履歴分析装置において、閲覧履歴メモリに記憶された閲覧履歴を用いてアクセスリストを抽出する抽出手段と、各コンテンツデータの特有情報とアクセスリストの切断判定時間との関係を定めた規則に従って、各コンテンツデータにおける抽出手段により抽出されたアクセスリストの切断判定時間を算出する切断判定時間算出手段と、アクセスリストから前記各アクセス要求側が各コンテンツデータの閲覧に要した時間を示す閲覧時間を算出する閲覧時間算出手段と、閲覧時間算出手段により算出された前記各コンテンツデータの閲覧時間が、切断判定時間算出手段によって算出された当該コンテンツデータにおけるアクセスリストの切断判定時間より長いと、当該コンテンツデータが含まれる抽出手段により抽出されたアクセスリストが当該コンテンツデータの終了位置で切断されたと判定する切断判定手段とを備えている。
このように構成された閲覧履歴分析装置においては、切断判定時間算出手段の規則として、各コンテンツデータの特有情報とアクセスリストの切断判定時間との関係を定めている。すなわち、アクセスリストの切断判定時間は、全てのコンテンツデータに亘って同一値に設定されているのではなくて、例えば文字数や閲覧時間等の各コンテンツデータの特有情報に基づいて決定される。そして、各コンテンツデータの閲覧時間が当該コンテンツデータの切断判定時間より長いと、当該コンテンツデータが含まれるアクセスシーケンスが当該コンテンツデータの終了位置で切断されたと判定される。
したがって、必要に応じて、同一のアクセス要求側によるアクセスを示すアクセスリストをより適した位置で切断でき、結果として、より精度の高いアクセスシーケンスを抽出することができる。
また別の発明では、WWWにおけるアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされたアクセス先を示すアクセス先識別データとを関連付けた、各コンテンツデータに対する閲覧履歴メモリに記憶された閲覧履歴を用いて、同一の前記アクセス要求側によるアクセスを示すアクセスリストを分析する閲覧履歴分析方法において、閲覧履歴メモリに記憶された閲覧履歴を用いてアクセスリストを抽出する工程と、各コンテンツデータの特有情報とアクセスリストの切断判定時間との関係を定めた規則に従って、各コンテンツデータにおける抽出する工程により抽出されたアクセスリストの切断判定時間を算出する工程と、アクセスリストから各アクセス要求側が各コンテンツデータの閲覧に要した時間を示す閲覧時間を算出する工程と、閲覧時間を算出する工程により算出された各コンテンツデータの閲覧時間が、切断判定時間を算出する工程によって算出された当該コンテンツデータにおけるアクセスリストの切断判定時間より長いと、当該コンテンツデータが含まれる抽出する工程により抽出されたアクセスリストが当該コンテンツデータの終了位置で切断されたと判定する工程とを備えている。
このように構成された閲覧履歴分析方法においても、上述した閲覧履歴分析装置とほぼ同じ作用効果を奏することが可能である。
また別の発明では、WWWにおけるアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされたアクセス先を示すアクセス先識別データとを関連付けた、各コンテンツデータに対する閲覧履歴メモリに記憶された閲覧履歴を用いて、同一の前記アクセス要求側によるアクセスを示すアクセスリストを分析する閲覧履歴分析プログラムにおいて、閲覧履歴分析プログラムはコンピュータに、閲覧履歴メモリに記憶された閲覧履歴を用いて前記アクセスリストを抽出する工程と、各コンテンツデータの特有情報とアクセスリストの切断判定時間との関係を定めた規則に従って、各コンテンツデータにおける抽出する工程により抽出されたアクセスリストの切断判定時間を算出する工程と、アクセスリストから各アクセス要求側が各コンテンツデータの閲覧に要した時間を示す閲覧時間を算出する工程と、閲覧時間を算出する工程により算出された各コンテンツデータの閲覧時間が、切断判定時間を算出する工程によって算出された当該コンテンツデータにおけるアクセスリストの切断判定時間より長いと、当該コンテンツデータが含まれる抽出する工程により抽出されたアクセスリストが当該コンテンツデータの終了位置で切断されたと判定する工程とを実行させる。
このように構成された閲覧履歴分析プログラムにおいても、上述した閲覧履歴分析装置とほぼ同じ作用効果を奏することが可能である。
また、別の発明では、上述した発明の閲覧履歴分析プログラムにおける切断判定時間算出手段の規則は、各コンテンツデータの平均閲覧時間に所定の算術演算を行って当該コンテンツデータの切断判定時間を求めることである。
このように、各コンテンツデータにおけるアクセスリストの切断判定時間を当該コンテンツデータの平均閲覧時間をもとにした適切な時間に設定することによって、アクセスリストをより適切な位置で切断可能となる。
また、別の発明は、上述した発明の閲覧履歴分析プログラムにおける切断判定時間算出手段の規則は、各コンテンツデータの内容量を示す指標に所定の算術演算を行って当該コンテンツデータの切断判定時間を求めることである。
このように、各コンテンツデータにおけるアクセスリストの切断判定時間を当該コンテンツデータの内容量を元にした適切な時間に設定することによって、アクセスリストをより適切な位置で切断可能となる。
また、別の発明では、上述した発明の閲覧履歴分析プログラムにおける切断判定時間算出手段の規則は、各コンテンツデータの平均閲覧時間に所定の倍数を乗算して当該コンテンツデータの切断判定時間を求めることである。
このように、各コンテンツデータにおけるアクセスリストの切断判定時間を当該コンテンツデータの平均閲覧時間をもとにした適切な時間に設定することによって、アクセスリストをより適切な位置で切断可能となる。
また、別の発明は、上述した発明の閲覧履歴分析プログラムにおける切断判定時間算出手段の規則は、各コンテンツデータの文字数に所定の倍数を乗算して当該コンテンツデータの切断判定時間を求めることである。
このように、各コンテンツデータにおけるアクセスリストの切断判定時間を当該コンテンツデータの文字数を元にした適切な時間に設定することによって、アクセスリストをより適切な位置で切断可能となる。
本発明の閲覧履歴分析装置、閲覧履歴分析方法、及び閲覧履歴分析プログラムにおいては、各コンテンツデータの特有情報とアクセスリストの切断判定時間との関係を定めた規則に基づいて各コンテンツデータにおけるアクセスリストの切断判定時間を決定するようにしている。
したがって、各コンテンツデータにおけるアクセスリストの切断判定時間がコンテンツデータ毎に自動的により適した値に設定され、このアクセスリストの切断判定時間に基づいて、必要に応じて、同一のアクセス要求側によるアクセスを示すアクセスリストをより適切な位置で切断でき、より精度を高めたアクセスシーケンスを抽出でき、ひいてはこのアクセスシーケンスを用いた各アクセス要求側の各コンテンツデータに対する閲覧の分析をより正確に実施できる。
以下、本発明の各実施形態を図面を用いて説明する。
(第1実施形態)
図1は本発明の第1実施形態に係わる閲覧履歴分析方法及び閲覧履歴分析プログラムが適用される閲覧履歴分析装置が組込まれた企業サイトの概略構成を示すブロック図である。図12に示す従来の企業サイトと同一部分には同一符号を付して重複する部分の詳細説明を省略する。
なお、本実施形態ではアクセス要求側を人間としているが、例えば機械やプログラムなどによる人間以外によるアクセスでも本発明を実現可能である。
インターネット2に、企業サイト11、及びプロバイダ3を介してアクセス要求側の閲覧端末4が接続されている。企業サイト11内には、LANの伝送路6に対して、インターネット2に接続されたWebサーバ5、複数のコンテンツデータを記憶するコンテンツデータメモリ7、インターネット2を介した各コンテンツデータ10に対する閲覧履歴を記憶する閲覧履歴メモリ8、及び閲覧履歴分析装置としての分析サーバ12が接続されている。
コンテンツデータメモリ7内には、図13に示すように、それぞれコンテンツデータ番号1,2,3,4,5が付された5つのコンテンツデータ10が記憶されている。また、閲覧履歴メモリ8には、図2に示すように、アクセス要求側の識別子であるアクセス者IDと閲覧(アクセス)ページと閲覧(アクセス)日時とからなる閲覧データが時系列的に記憶保持される。なお、アクセス者IDが取得できない機構の場合には、アクセス要求側のIPアドレスとアクセス要求側の閲覧環境に関する情報(UserAgent)の組み合わせでこれを代用することもある。
アクセス要求側が自己の閲覧端末4を用いてプロバイダ3を通じて、インターネット2を介して企業サイト11のWebサーバ5にアクセスする。Webサーバ5は必要なコンテンツデータ10の情報を、インターネット2を介してアクセス要求側に送り、アクセス要求側はそのコンテンツデータ10の情報を、閲覧端末4を通して閲覧する。このとき、Webサーバ5は、アクセス者IDと閲覧(アクセス)コンテンツデータと閲覧(アクセス)日時とからなる閲覧データを閲覧履歴メモリ8に時系列的に書込む。
分析サーバ12内には、アクセスリスト抽出部26、規則メモリ13、切断判定時間算出部14、切断判定時間メモリ15、閲覧時間算出部16、切断判定部17、平均閲覧時間算出部18、及びプログラムメモリ19が設けられている。アクセスリスト抽出部26、切断判定時間算出部14、閲覧時間算出部16、切断判定部17、平均閲覧時間算出部18は、プログラムメモリ19に記憶された各閲覧履歴分析プログラムがロードされている。
分析サーバ12には、LANの伝送路20を介して、分析クライアント21、及び分析結果記憶部22が接続されている。分析結果記憶部22内には、平均閲覧時間メモリ23及びアクセスシーケンス抽出メモリ24が設けられている。
平均閲覧時間メモリ23内には、図3に示すように、平均閲覧時間算出部18で算出された前回のアクセスリストの分析時点までにおける各コンテンツデータ10の平均閲覧時間が記憶されている。
ここで、あるコンテンツデータ10の閲覧に要した時間を「閲覧時間」、あるコンテンツデータ10への全てもしくは所定の範囲の閲覧について閲覧時間の平均を取ったものを「平均閲覧時間」と称する。
切断判定時間メモリ15内には、図4に示すように、切断判定時間算出部14で算出された各コンテンツデータ10におけるアクセスリストの切断判定時間が記憶されている。
規則メモリ13内には、各コンテンツデータ10の特有情報とアクセスリストの切断判定時間との関係を定めた規則が記憶されている。具体的には、この規則においては、各コンテンツデータ10におけるアクセスリストの切断判定時間を以下のように決定する。
(a) 平均閲覧時間メモリ23内に、前回のアクセスリストの分析時点までにおける平均閲覧時間が記憶されていない(未記憶)場合、及び当該コンテンツデータ10が同一の識別子であっても更新がなされている場合は、当該コンテンツデータ10におけるアクセスリストの切断判定時間を30分とする。
(b) 当該コンテンツデータ10の平均閲覧時間が平均閲覧時間メモリ23内に記憶されている場合は、この平均閲覧時間の10倍の時間を当該コンテンツデータ10の切断判定時間とする。
なお、平均閲覧時間を10倍するのは、同一のコンテンツデータであってもアクセス要求側の閲覧速度はアクセス要求側によってまちまちであり、平均閲覧時間そのものをアクセスリストの切断時間として用いると、平均閲覧時間を超えてはいるがそれほど時間差は無い正常な閲覧状態のものもふるい落としてしまう可能性があるため、ある一定の余裕を持たせるために倍数化しているのである。
なお、閲覧時間の分布と平均閲覧時間との関係によっては、10以外の定数倍を行うこともある。また、定数倍以外の対数などの算術演算を行うこともある。
また、アクセスリストの切断時間が平均閲覧時間を下回るような算術演算を行うこともある。これは、各閲覧時間の中で他の閲覧時間に比べて極端に長い閲覧時間があった場合、この値の影響で平均閲覧時間が長くなってしまうためこれを短めに補正する必要があるためである。
アクセスリスト抽出部26は、閲覧履歴メモリ8に記憶された閲覧履歴を用いて、指定されたアクセス要求側のアクセスリストを抽出する。アクセスリストは、閲覧履歴を入力されたアクセス要求側識別子(例えばアクセス者ID)についてまとめる。
ここでアクセスリスト抽出部26はその後の処理を容易化するためにまとめられたデータにさらに閲覧(アクセス)日時で並び替えを行うとしてもよい。
また、アクセスリスト抽出部26は、別の構成となっていてもよい。例えば、アクセスリストは、閲覧履歴をまず全アクセス者IDごとについてまとめ、その後指定されたアクセス要求側のアクセスリストを抽出するとしてもよい。
切断判定時間算出部14は、上記規則に基づいて各コンテンツデータ10におけるアクセスリストの切断判定時間を算出して、切断判定時間メモリ15に書込む。例えば、平均閲覧時間メモリ23内に記憶されている前回の各コンテンツデータの10平均閲覧時間が、図3に示すように、コンテンツデータ1番:9秒、コンテンツデータ2番:16秒、コンテンツデータ3番:51秒、コンテンツデータ4番:7秒、コンテンツデータ5番:未記憶であったとすると、各コンテンツデータ10におけるアクセスリストの切断判定時間は、図4に示すように、コンテンツデータ1番:90秒、コンテンツデータ2番:160秒、コンテンツデータ3番:510秒、コンテンツデータ4番:70秒、コンテンツデータ5番:30分となる。
閲覧時間算出部16は、閲覧履歴メモリ8に記憶された同一閲覧端末4(同一アクセス要求側)から連続してアクセスされた各コンテンツデータ10の閲覧時間を算出する。例えば、A0001のIDのアクセス要求側が、図5に示す順序で各コンテンツデータ10を閲覧すると、コンテンツデータ1番は (2002/03/13 08:51:26 − 2002/03/13 08:50:36)より50秒となる。同様に、コンテンツデータ3番:247秒、コンテンツデータ2番:190秒、コンテンツデータ4番;98秒となる。また、コンテンツデータ5番についてはアクセスリストの終端にあたり次の閲覧データがないため「未定」と定義する。
切断判定部17は、この算出された各コンテンツデータの閲覧時間が当該コンテンツデータにおけるアクセスリストの切断判定時間より長いと、当該コンテンツデータが含まれるアクセスリストが当該コンテンツデータの終了位置で切断されたと判定して、切断された各アクセスシーケンスを分析結果記憶部22のアクセスシーケンス抽出メモリ24へ書込む。なお、切断判定部17は、この算出された全てのコンテンツデータの閲覧時間が対応する各コンテンツデータにおけるアクセスリストの切断判定時間より短いと、各コンテンツデータが含まれるアクセスリストは切断されなないと判定して、このアクセスリストをそのままアクセスシーケンスとして分析結果記憶部22のアクセスシーケンス抽出メモリ24へ書込む。
例えば、前述した、図5に示す各コンテンツデータ10の閲覧時間と図4に示す各コンテンツデータ10におけるアクセスリストの切断判定時間とを比較することによって、2番のコンテンツデータの閲覧時間190秒が切断判定時間160秒より長いので、2番のコンテンツデータと4番のコンテンツデータとの間でアクセスリストが切断され、1番→3番→2番の各コンテンツデータ10を閲覧するアクセスシーケンスと、4番→5番の各コンテンツデータ10を閲覧するアクセスシーケンスとが抽出され、アクセスシーケンス抽出メモリ24へ書込まれる。
平均閲覧時間算出部18は、今回、閲覧時間算出部16で算出された各コンテンツデータの閲覧時間を用いて、平均閲覧時間メモリ23に記憶されている各コンテンツデータの平均閲覧時間を更新する。すなわち、平均閲覧時間算出部18は、今回のアクセスリストの分析時点までにおける各コンテンツデータ10の平均閲覧時間を算出して平均閲覧時間メモリ23に書込む。
この企業サイト11の管理者や企業の経営者、マーケティング担当者などは、分析クライアント21を操作して、分析サーバ12へアクセスリストの分析指令を入力したり、分析結果記憶部22から分析結果を読出したりする。
図6は、第1実施形態の閲覧履歴分析装置としての分析サーバ12の全体動作を示す流れ図である。
分析クライアント21が、アクセス要求側を指定したアクセスリストの分析指令を受け付けると(S1)、各コンテンツデータ10の平均閲覧時間を平均閲覧時間メモリ23から読出す(S2)。規則メモリ13から規則を読出して(S3)、この規則を用いて各コンテンツデータにおけるアクセスリストの切断判定時間を算出する(S4)。算出した各コンテンツデータにおけるアクセスリストの切断判定時間を切断判定時間メモリ15へ書込む(S5)。アクセスリスト抽出部26は、閲覧履歴メモリ8に記憶された閲覧履歴を用いて、指定されたアクセス要求側のアクセスリストを抽出し(S6)、閲覧時間算出部16は各コンテンツデータ10の閲覧時間を算出する(S8)。
次に、各コンテンツデータ10の閲覧時間と当該コンテンツデータにおけるアクセスリストの切断判定時間とを比較し(S9)、アクセスリストの切断判定を行い(S10)、各アクセスシーケンスを抽出(特定)して、アクセスシーケンスメモリ24へ書込む(S11)。その後、現在までの各コンテンツデータ10の平均閲覧時間を算出して(S12)、平均閲覧時間メモリ23の平均閲覧時間を更新する(S13)。
このように構成された第1実施形態の閲覧履歴分析装置においては、規則メモリ13内には、各コンテンツデータ10の特有情報としての平均閲覧時間とアクセスリストの切断判定時間との関係を定めた規則が記憶されている。すなわち、アクセスリストの切断判定時間は、全てのコンテンツデータに亘って同一値に設定されているのではなくて、各コンテンツデータの平均閲覧時間に基づいて決定される。
そして、各コンテンツデータの閲覧時間が当該コンテンツデータの切断判定時間より長いと、当該コンテンツデータが含まれるアクセスリストが当該コンテンツデータの終了位置で切断されたと判定される。
したがって、必要に応じて、アクセスリストをより適した位置で切断でき、結果として、より精度を高めたアクセスシーケンスがアクセスシーケンスメモリ24へ書込まれるので、このアクセスシーケンスを用いた各アクセス要求側の各コンテンツデータに対する閲覧の分析をより正確に実施できる。
(第2実施形態)
図7は本発明の第2実施形態に係わる閲覧履歴分析方法及び閲覧履歴分析プログラムが適用される閲覧履歴分析装置が組込まれた企業サイトの概略構成を示すブロック図である。図1に示す第1実施形態の閲覧履歴分析装置が組込まれた企業サイトと同一部分には同一符号を付して重複する部分の詳細説明を省略する。
なお、本実施形態ではアクセス要求側を人間としているが、例えば機械やプログラムなどの人間以外によるアクセスでも本発明を実現可能である。
また、本実施形態においてはコンテンツデータのうちの文字データを用いる場合について話を進める。
この第2実施形態の閲覧履歴分析装置が組込まれた企業サイト11においては、第2実施形態の閲覧履歴分析装置しての分析サーバ12a内に、規則メモリ13a、切断判定時間算出部14a、切断判定時間メモリ15a、アクセスリスト抽出部26、閲覧時間算出部16、切断判定部17、コンテンツデータ文字数検出部25、及びプログラムメモリ19が設けられている。
分析サーバ12aには、LANの伝送路20を介して、分析クライアント21、及び分析結果記憶部22aが接続されている。分析結果記憶部22a内にはアクセスシーケンス抽出メモリ24が設けられている。
コンテンツデータ文字数検出部25は、コンテンツデータメモリ7内に記憶されたそれぞれコンテンツデータ番号1,2,3,4,5が付された5つのコンテンツデータ10の文字数を検出して、自己内に設けられた、図8に示す文字数メモリ25aへ書込む。
切断判定時間メモリ15a内には、図9に示すように、切断判定時間算出部14aで算出された各コンテンツデータ10におけるアクセスリストの切断判定時間が記憶されている。
規則メモリ13a内には、各コンテンツデータ10の特有情報とアクセスリストの切断判定時間との関係を定めた規則が記憶されている。この規則においては、各コンテンツデータの文字数に適切な倍数(例えば、単位文字の読み取り所要時間)を乗算して当該コンテンツデータの切断判定時間とする。より具体的には、
(a) (当該コンテンツデータ10の総文字数/100)*60秒(小数点以下四捨五入)をアクセスリストの切断判定時間とする。
切断判定時間算出部14aは、この規則に基づいて各コンテンツデータ10におけるアクセスリストの切断判定時間を算出して、切断判定時間メモリ15aに書込む。例えば、文字数メモリ25aに記憶されている各コンテンツデータ10の文字数が、図8に示すように、コンテンツデータ1番:250文字、コンテンツデータ2番:300文字、コンテンツデータ3番:400文字、コンテンツデータ4番:180文字、コンテンツデータ5番:1100文字であったとすると、各コンテンツデータ10におけるアクセスリストの切断判定時間は、図9に示すように、コンテンツデータ1番:150秒、コンテンツデータ2番:180秒、コンテンツデータ3番:240秒、コンテンツデータ4番:108秒、コンテンツデータ5番:660秒となる。
閲覧時間算出部16は、閲覧履歴メモリ8に記憶された同一閲覧端末4(同一アクセス要求側)から連続してアクセスされた各コンテンツデータ10の閲覧時間を算出する。例えば、A0001のIDのアクセス要求側が、図10に示す順序で各コンテンツデータ10を閲覧すると、コンテンツデータ1番:50秒、コンテンツデータ3番:247秒、コンテンツデータ2番:190秒、コンテンツデータ4番;98秒となる。また、コンテンツデータ5番についてはアクセスリストの終端にあたり次の閲覧データがないため「未定」と定義する。
切断判定部17は、この算出された各コンテンツデータの閲覧時間が当該コンテンツデータの切断判定時間より長いと、当該コンテンツデータが含まれるアクセスリストが当該コンテンツデータの終了位置で切断されたと判定して、切断された各アクセスシーケンスを分析結果記憶部22aのアクセスシーケンス抽出メモリ24へ書込む。なお、切断判定部17は、この算出された全てのコンテンツデータの閲覧時間が対応する各コンテンツデータの切断判定時間より短いと、各コンテンツデータが含まれるアクセスリストは切断されなないと判定して、このアクセスリストをそのままアクセスシーケンスとして分析結果記憶部22aのアクセスシーケンス抽出メモリ24へ書込む。
例えば、前述した、図10に示す各コンテンツデータ10の閲覧時間と図9に示す各コンテンツデータ10の切断判定時間とを比較することによって、3番のコンテンツデータ10の閲覧時間247秒が切断判定時間240秒より長いので、3番のコンテンツデータ10と2番のコンテンツデータ10との間でアクセスリストが切断され、さらに、2番のコンテンツデータ10の閲覧時間190秒が切断判定時間180秒より長いので、2番のコンテンツデータ10と4番のコンテンツデータ10との間でアクセスリストが切断される。
その結果、1番→3番の各コンテンツデータ10を閲覧するアクセスシーケンスと、2番のコンテンツデータ10を閲覧するアクセスシーケンスと、4番→5番の各コンテンツデータ10を閲覧するアクセスシーケンスとが抽出され、アクセスシーケンス抽出メモリ24へ書込まれる。
この企業サイト11の管理者や企業の経営者、マーケティング担当者などは、分析クライアント21を操作して、分析サーバ12aへアクセスシーケンスの分析指令を入力したり、分析結果記憶部22aから分析結果を読出したりする。
図11は、第2実施形態の閲覧履歴分析装置としての分析サーバ12aの全体動作を示す流れ図である。
分析クライアント21が、アクセス要求側を指定したアクセスリストの分析指令を受け付けると(Q1)、各コンテンツデータ10の文字数を検出する(Q2)。規則メモリ13aから規則を読出して(Q3)、この規則を用いて各コンテンツデータにおけるアクセスリストの切断判定時間を算出する(Q4)。算出した切断判定時間を切断判定時間メモリ15aへ書込む(Q5)。アクセスリスト抽出部26は、閲覧履歴メモリ8に記憶された閲覧履歴を用いて、指定されたアクセス要求側のアクセスリストを抽出し(Q6)、閲覧時間算出部16は各コンテンツデータ10の閲覧時間を算出する(Q7)。
次に、各コンテンツデータ10の閲覧時間と当該コンテンツにおけるアクセスリストの切断判定時間とを比較し(Q8)、アクセスリストの切断判定を行い(Q9)、各アクセスシーケンスを抽出(特定)して、アクセスシーケンスメモリ24へ書込む(Q10)。
このように構成された第2実施形態の閲覧履歴分析装置においては、規則メモリ13a内には、各コンテンツデータ10の特有情報としての文字数とアクセスリストの切断判定時間との関係を定めた規則が記憶されている。そして、各コンテンツデータの閲覧時間が当該コンテンツデータにおけるアクセスリストの切断判定時間より長いと、当該コンテンツデータが含まれるアクセスリストが当該コンテンツデータの終了位置で切断されたと判定される。
したがって、前述した第1実施形態の閲覧履歴分析装置と同様に、必要に応じて、アクセスリストをより適した位置で切断でき、結果として、より精度の高いアクセスシーケンスがアクセスシーケンスメモリ24へ書込まれるので、このアクセスシーケンスを用いた各アクセス要求側の各コンテンツデータに対する閲覧の分析をより正確に実施できる。
なお、本実施形態にかかわる、各コンテンツデータ10の特有情報とアクセスリストの切断判定時間との関係を定めた規則は、本実施形態のもの以外の算術演算であってもかまわない。例えば、対数や指数を用いたり、複数の式を組み合わせてもかまわない。
また、本実施形態にかかわる各コンテンツデータ10の特有情報とアクセスリストの切断判定時間との関係を定めた規則において使用する各コンテンツデータ10の特有情報は、文字データ以外のものであってもかまわない。例えば各コンテンツデータ10のファイルサイズを用いるとしてもよい。この際、規則メモリ13aに記憶された各コンテンツデータ10の特有情報とアクセスリストの切断判定時間との関係を定めた規則、切断判定時間算出部14a、コンテンツデータ文字数検出部25をそれぞれ特有情報の種類に応じた適切な規則および機能に変更することで対応することができる。
上記各実施形態にかかわる各構成要素は、同様の作用を実現できれば配置を変更させてもよく、また各構成要素を自由に組み合わせてもよい。
また、同様の作用を実現できれば処理の順番を適宜変更したり、並列に処理したりしてもよい。
また、上記各実施形態において、閲覧履歴分析装置は複数の装置により構成され、互いに連携を取りつつ処理を実行するとしてもよい。
また、上記各実施形態において、コンテンツデータ10は上記各実施形態において示した以外の構成、個数、内容となっていてもよい。また閲覧履歴メモリ8、平均閲覧時間メモリ23、切断判定時間メモリ15、切断判定時間メモリ15a、文字数メモリ25aは上記各実施形態において示した以外の値となっていてもよい。
また、コンテンツデータメモリ7、閲覧履歴メモリ8、規則メモリ13、規則メモリ13a、プログラムメモリ19、平均閲覧時間メモリ23、切断判定時間メモリ15、切断判定時間メモリ15a、文字数メモリ25a、アクセスシーケンス抽出メモリ24は半導体メモリの他、HDDなど、どのような記憶手段であってもかまわない。
本発明の第1実施形態に係わる閲覧履歴分析方法及び閲覧履歴分析プログラムが適用される閲覧履歴分析装置が組込まれた企業サイトの概略構成を示すブロック図 同企業サイトに組込まれた閲覧履歴メモリの記憶内容を示す図 同企業サイトに組込まれた平均閲覧時間メモリの記憶内容を示す図 同企業サイトに組込まれた切断判定時間メモリの記憶内容を示す図 同企業サイトの閲覧時間算出部で算出された各コンテンツデータの閲覧時間を示す図 同企業サイトに組込まれた分析サーバの全体動作を示す流れ図 本発明の第2実施形態に係わる閲覧履歴分析方法及び閲覧履歴分析プログラムが適用される閲覧履歴分析装置が組込まれた企業サイトの概略構成を示すブロック図 同企業サイトに組込まれた文字数メモリの記憶内容を示す図 同企業サイトに組込まれた切断判定時間メモリの記憶内容を示す図 同企業サイトの閲覧時間算出部で算出された各コンテンツデータの閲覧時間を示す図 同企業サイトに組込まれた分析サーバの全体動作を示す流れ図 従来の企業サイトの概略構成を示すブロック図 コンテンツデータメモリに記憶された各コンテンツデータを示す図 各コンテンツデータの閲覧履歴を示す図
符号の説明
1,11…企業サイト、2…インターネット、4…閲覧端末、5…Webサーバ、7…コンテンツデータメモリ、8…閲覧履歴メモリ、10…コンテンツデータ、12,12a…分析サーバ、13,13a…規則メモリ、14,14a…切断判定時間算出部、15,15a…切断判定時間メモリ、16…閲覧時間算出部、17…切断判定部、18…平均閲覧時間算出部、19…プログラムメモリ、21…分析クライアント、22,22a…分析結果ファイル、23…平均閲覧時間メモリ、24…アクセスシーケンス抽出メモリ、25…コンテンツデータ文字数検出部、26…アクセスリスト抽出部

Claims (7)

  1. WWWにおけるアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされたアクセス先を示すアクセス先識別データとを関連付けた、各コンテンツデータに対する閲覧履歴メモリに記憶された閲覧履歴を用いて、同一のアクセス要求側によるアクセスを示すアクセスリストを分析する閲覧履歴分析装置において、
    前記閲覧履歴メモリに記憶された前記閲覧履歴を用いて前記アクセスリストを抽出する抽出手段と、
    前記各コンテンツデータの特有情報と前記アクセスリストの切断判定時間との関係を定めた規則に従って、前記各コンテンツデータにおける前記抽出手段により抽出されたアクセスリストの切断判定時間を算出する切断判定時間算出手段と、
    前記アクセスリストから前記各アクセス要求側が前記各コンテンツデータの閲覧に要した時間を示す閲覧時間を算出する閲覧時間算出手段と、
    前記閲覧時間算出手段により算出された前記各コンテンツデータの閲覧時間が、前記切断判定時間算出手段によって算出された当該コンテンツデータにおけるアクセスリストの切断判定時間より長いと、当該コンテンツデータが含まれる前記抽出手段により抽出されたアクセスリストが当該コンテンツデータの終了位置で切断されたと判定する切断判定手段と
    を備えたことを特徴とする閲覧履歴分析装置。
  2. WWWにおけるアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされたアクセス先を示すアクセス先識別データとを関連付けた、各コンテンツデータに対する閲覧履歴メモリに記憶された閲覧履歴を用いて、同一のアクセス要求側によるアクセスを示すアクセスリストを分析する閲覧履歴分析方法において、
    前記閲覧履歴メモリに記憶された前記閲覧履歴を用いて前記アクセスリストを抽出する工程と、
    前記各コンテンツデータの特有情報と前記アクセスリストの切断判定時間との関係を定めた規則に従って、前記各コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を算出する工程と、
    前記アクセスリストから前記各アクセス要求側が前記各コンテンツデータの閲覧に要した時間を示す閲覧時間を算出する工程と、
    前記閲覧時間を算出する工程により算出された前記各コンテンツデータの閲覧時間が、前記切断判定時間を算出する工程によって算出された当該コンテンツデータにおけるアクセスリストの切断判定時間より長いと、当該コンテンツデータが含まれる前記抽出する工程により抽出されたアクセスリストが当該コンテンツデータの終了位置で切断されたと判定する工程と
    を備えたことを特徴とする閲覧履歴分析方法。
  3. WWWにおけるアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされたアクセス先を示すアクセス先識別データとを関連付けた、各コンテンツデータに対する閲覧履歴メモリに記憶された閲覧履歴を用いて、同一のアクセス要求側によるアクセスを示すアクセスリストを分析する閲覧履歴分析プログラムにおいて、
    前記閲覧履歴分析プログラムはコンピュータに、
    前記閲覧履歴メモリに記憶された前記閲覧履歴を用いて前記アクセスリストを抽出する工程と、
    前記各コンテンツデータの特有情報と前記アクセスリストの切断判定時間との関係を定めた規則に従って、前記各コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を算出する工程と、
    前記アクセスリストから前記各アクセス要求側が前記各コンテンツデータの閲覧に要した時間を示す閲覧時間を算出する工程と、
    前記閲覧時間を算出する工程により算出された前記各コンテンツデータの閲覧時間が、前記切断判定時間を算出する工程によって算出された当該コンテンツデータにおけるアクセスリストの切断判定時間より長いと、当該コンテンツデータが含まれる前記抽出する工程により抽出されたアクセスリストが当該コンテンツデータの終了位置で切断されたと判定する工程と
    を実行させることを特徴とする閲覧履歴分析プログラム。
  4. 前記各コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を算出する工程は、前記規則に従って、前記各コンテンツデータの平均閲覧時間に所定の算術演算を行って、当該コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を求めることを特徴とする請求項3記載の閲覧履歴分析プログラム。
  5. 前記各コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を算出する工程は、前記規則に従って、前記各コンテンツデータの内容量を示す指標に所定の算術演算を行って、当該コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を求めることを特徴とする請求項3記載の閲覧履歴分析プログラム。
  6. 前記各コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を算出する工程は、前記規則に従って、前記各コンテンツデータの平均閲覧時間に所定の倍数を乗算して、当該コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を求めることを特徴とする請求項3記載の閲覧履歴分析プログラム。
  7. 前記各コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を算出する工程は、前記規則に従って、前記各コンテンツデータの文字数に所定の倍数を乗算して、当該コンテンツデータにおける前記抽出する工程により抽出されたアクセスリストの切断判定時間を求めることを特徴とする請求項3記載の閲覧履歴分析プログラム。
JP2003314424A 2003-09-05 2003-09-05 閲覧履歴分析装置、分析方法及び分析プログラム Pending JP2005084823A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003314424A JP2005084823A (ja) 2003-09-05 2003-09-05 閲覧履歴分析装置、分析方法及び分析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003314424A JP2005084823A (ja) 2003-09-05 2003-09-05 閲覧履歴分析装置、分析方法及び分析プログラム

Publications (1)

Publication Number Publication Date
JP2005084823A true JP2005084823A (ja) 2005-03-31

Family

ID=34415040

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003314424A Pending JP2005084823A (ja) 2003-09-05 2003-09-05 閲覧履歴分析装置、分析方法及び分析プログラム

Country Status (1)

Country Link
JP (1) JP2005084823A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148687A (ja) * 2005-11-25 2007-06-14 Nippon Telegr & Teleph Corp <Ntt> 閲覧履歴検索・表示方法及び装置及びコンピュータ読み取り可能な記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148687A (ja) * 2005-11-25 2007-06-14 Nippon Telegr & Teleph Corp <Ntt> 閲覧履歴検索・表示方法及び装置及びコンピュータ読み取り可能な記録媒体
JP4567580B2 (ja) * 2005-11-25 2010-10-20 日本電信電話株式会社 閲覧履歴検索・表示方法及び装置及びコンピュータ読み取り可能な記録媒体

Similar Documents

Publication Publication Date Title
US7373606B2 (en) Method for visualizing weblog social network communities
US8874731B1 (en) Use of timing information for document understanding
US8930447B2 (en) Method, apparatus, and program for usability analysis of web applications
US9529893B1 (en) Search engine analytics and optimization for media content in social networks
US20130198240A1 (en) Social Network Analysis
KR20190097327A (ko) 스크롤 맵을 제공하는 방법 및 시스템
US20170371969A1 (en) Identifying equivalent links on a page
CN108345601A (zh) 搜索结果排序方法及装置
JP5367632B2 (ja) 知識量推定装置及びプログラム
JP2018018133A (ja) 情報処理装置、ストリームストレージ制御プログラム、及びインデックスデータ参照方法
JP2020123321A (ja) クリップボードデータに基づく検索処理方法および装置
JP2010231442A (ja) 情報提供装置
JPH10307845A (ja) 閲覧支援装置およびその方法
JP2005084823A (ja) 閲覧履歴分析装置、分析方法及び分析プログラム
WO2020006834A1 (zh) 金融机构推荐方法、设备、存储介质及装置
JP2002123516A (ja) ウェブサイト評価システム、ウェブサイト評価方法、記録媒体
JP6147904B1 (ja) サーバ装置、制御方法、及び、プログラム
JP6700146B2 (ja) 評価値に基づいて推奨するコンテンツを決定するシステム
JP2013131227A (ja) コンテンツ管理装置、コンテンツ管理方法およびプログラム
WO2016134576A1 (zh) 漫画搜索方法及装置
US20210224408A1 (en) Non-transitory computer-readable recording medium having stored therein screen displaying program, method for screen displaying, and screen displaying apparatus
JP5197128B2 (ja) 依存関係推定装置及び依存関係推定プログラム及び記録媒体
JP2011227789A (ja) 情報処理装置及びプログラム
US11797707B2 (en) Non-transitory computer-readable recording medium having stored therein information processing program, information processing method, and information processing apparatus
JP5616473B2 (ja) 情報処理装置および情報処理方法