JP2002123452A - アクセスログ情報管理装置、Webサイト評価システム、Webサイト評価方法、及び、コンピュータ読取り可能な記録媒体 - Google Patents

アクセスログ情報管理装置、Webサイト評価システム、Webサイト評価方法、及び、コンピュータ読取り可能な記録媒体

Info

Publication number
JP2002123452A
JP2002123452A JP2000314012A JP2000314012A JP2002123452A JP 2002123452 A JP2002123452 A JP 2002123452A JP 2000314012 A JP2000314012 A JP 2000314012A JP 2000314012 A JP2000314012 A JP 2000314012A JP 2002123452 A JP2002123452 A JP 2002123452A
Authority
JP
Japan
Prior art keywords
log information
access log
information
web site
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000314012A
Other languages
English (en)
Inventor
Yohei Yamane
洋平 山根
Takehiro Nakayama
雄大 中山
Hiroki Kato
裕樹 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2000314012A priority Critical patent/JP2002123452A/ja
Publication of JP2002123452A publication Critical patent/JP2002123452A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 ユーザ情報のリークを防止しつつWebサイ
トを評価できるWebサイト評価システム、Webサイ
ト評価方法、これに好適に使用されるアクセスログ情報
管理装置、及び、コンピュータ読取り可能な記録媒体を
提供すること。 【解決手段】 本発明のWebサイト評価システム10
0では、アクセスログ情報管理装置10において、アク
セスログ情報のユーザ特定情報を匿名化して匿名アクセ
スログ情報を生成し、Webサイト評価装置20におい
て、この匿名アクセスログ情報とコンテンツ情報とに基
づいてWebサイトの構成を評価する。ユーザ特定情報
が匿名化されているため、ユーザの情報がリークするの
を防止できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、アクセスログ情報
管理装置、Webサイト評価システム、Webサイト評
価方法、及び、コンピュータ読取り可能な記録媒体に関
するものである。
【0002】
【従来の技術】近年の情報伝達メディアの急速な進展に
伴い、Webサイトを利用した企業情報の宣伝広告、情
報公開等が頻繁に行われている。このWebサイトは、
ユーザがインターネットを利用して見ることができ、W
ebページへのアクセス履歴がアクセスログ情報として
Webサーバに記憶される。
【0003】そして、このアクセスログ情報を解析し
て、Webサイトの構成を評価する技術が注目を集めて
いる。一般的にWebサイトの評価は、Webサイトの
所有者がサイト評価センタに依頼して行われる。また、
Webサイトの評価にあたっては、Webサイトを管理
するWebサイト管理者が、Webサーバに記憶された
上記のアクセスログ情報をサイト評価センタに送信す
る。そして、サイト評価センタは、このアクセスログ情
報に基づいてWebサイトのリンク構造等の良否を評価
していた。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来のWebサイトの評価技術には、次のような問題があ
った。すなわち、Webサイトの評価にあたっては、W
ebサーバからサイト評価センタにアクセスログ情報が
送られるが、このアクセスログ情報にはWebサイトに
アクセスしたユーザを特定できる情報が含まれている。
このため、サイト評価センタ側は、評価対象となったW
ebサイトにアクセスしたユーザの個人情報を取得する
ことが可能となり、セキュリティー対策が万全とはいえ
なかった。
【0005】本発明は、上記問題を解決するためになさ
れたものであり、ユーザ情報のリークを防止しつつWe
bサイトを評価できるWebサイト評価システム、We
bサイト評価方法、これに好適に使用されるアクセスロ
グ情報管理装置、及び、コンピュータ読取り可能な記録
媒体を提供することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、本発明のアクセスログ情報管理装置は、Webサイ
トのアクセス履歴を示すアクセスログ情報を管理する装
置であって、ユーザを特定するユーザ特定情報を含んだ
アクセスログ情報を格納したアクセスログ情報格納手段
と、アクセスログ情報格納手段からアクセスログ情報を
読み出すアクセスログ情報読出手段と、アクセスログ情
報読出手段で読み出されたアクセスログ情報のユーザ特
定情報を匿名化して匿名アクセスログ情報を生成する匿
名化手段と、匿名アクセスログ情報を出力する出力手段
と、を備えることを特徴とする。
【0007】本発明に係るアクセスログ情報管理装置に
よれば、アクセスログ情報に含まれるユーザ特定情報が
匿名化され、匿名アクセスログ情報として出力される。
そして、この匿名アクセスログ情報に基づいてWebサ
イトを評価すれば、ユーザの情報がリークすることが防
止される。
【0008】また、本発明のアクセスログ情報管理装置
において、アクセスログ情報格納手段に格納されたアク
セスログ情報の中から所望のアクセスログ情報を選定す
るためのアクセスログ情報選定手段を更に備え、匿名化
手段は、アクセスログ情報選定手段で選定されたアクセ
スログ情報のみを匿名化して匿名アクセスログ情報を生
成することが好ましい。
【0009】この場合、アクセスログ情報選定手段で選
定したアクセスログ情報のみに基づいて、Webサイト
を評価することができる。これにより、全てのアクセス
ログ情報をWebサイトの評価側へ送る場合よりも、ア
クセスログ情報の送信に要する負担を軽減させることが
できる。
【0010】また、本発明のアクセスログ情報管理装置
において、変換手段は、所定の時間間隔で区分けされる
セッション毎に匿名アクセスログ情報を生成すると共
に、各セッションに同一のユーザ特定情報を有するアク
セスログ情報が含まれる場合は、そのアクセスログ情報
に対応する匿名アクセスログ情報に同一の識別子を含ま
せるようにしてもよい。
【0011】Webサイトを評価するにあたって、2つ
のページ間のリンク構造を分析する場合がある。この場
合には、同一ユーザが各ページにアクセスしたか否かの
情報が用いられることがある。このような情報を得るに
は、アクセスログ情報を匿名化しつつも、各匿名アクセ
スログ情報が同一ユーザのものか否かを識別できるよう
にする必要がある。上記のように、匿名アクセスログ情
報に同一の識別子を含ませることで、同一ユーザのアク
セスログ情報であることを識別できる。さらに、ログイ
ン−ログアウトの作業が行われるWebサイトの場合
は、ログインからログアウトまでの間のアクセスログ情
報を用いればよいが、ログイン手続きが不要で誰がいつ
でもアクセスできるWebサイトの場合は、何時から何
時までのアクセスログ情報を用いてWebサイトを評価
してよいか判断に迷うことになる。そこで、所定の時間
間隔でアクセスログ情報を複数のセッションに区分け
し、区分けされたセッション毎に匿名アクセスログ情報
を生成するようにすることで、各セッション毎にWeb
サイトを評価すればよくなる。
【0012】また、本発明のWebサイト評価システム
は、Webサイトの構成を評価するWebサイト評価シ
ステムであって、上記のアクセスログ情報管理装置と、
Webサイトのコンテンツ情報を格納したコンテンツ情
報格納手段と、アクセスログ情報管理装置にネットワー
クを介して接続されたWebサイト評価装置と、を備
え、Webサイト評価装置は、アクセスログ情報管理装
置から出力された匿名アクセスログ情報と、コンテンツ
情報格納手段に格納されたWebサイトのコンテンツ情
報とに基づいて、Webサイトの構成を評価することを
特徴とする。
【0013】本発明に係るWebサイト評価システムに
よれば、アクセスログ情報に含まれるユーザ特定情報が
匿名化され、匿名アクセスログ情報として出力される。
そして、Webサイト評価装置は、この匿名アクセスロ
グ情報とWebサイトのコンテンツ情報とに基づいて、
Webサイトのリンク構造等を評価する。ここで、本発
明では、ユーザ特定情報が匿名化された匿名アクセスロ
グ情報がWebサイト評価装置に対して出力されている
ため、ユーザの情報がリークすることが防止される。
【0014】さらに、本発明のWebサイト評価方法
は、Webサイトの構成を評価するWebサイト評価方
法であって、ユーザを特定するユーザ特定情報を含んだ
アクセスログ情報を格納したアクセスログ情報格納手段
からアクセスログ情報を読み出すアクセスログ情報読出
ステップと、アクセスログ情報読出ステップで読み出さ
れたアクセスログ情報のユーザ特定情報を匿名化して匿
名アクセスログ情報を生成する匿名化ステップと、匿名
化ステップで生成された匿名アクセスログ情報と、We
bサイトのコンテンツ情報とに基づいて、Webサイト
の構成を評価する評価ステップと、を含むことを特徴と
する。
【0015】本発明に係るWebサイト評価方法によれ
ば、アクセスログ情報に含まれるユーザ特定情報が匿名
化され、匿名アクセスログ情報として出力される。そし
て、この匿名アクセスログ情報とWebサイトのコンテ
ンツ情報とに基づいて、Webサイトのリンク構造等が
評価される。ここで、本発明では、ユーザ特定情報が匿
名化された匿名アクセスログ情報が用いられるため、ユ
ーザの情報がリークすることが防止される。
【0016】また、本発明のコンピュータ読取り可能な
記録媒体は、ユーザを特定するユーザ特定情報を含んだ
アクセスログ情報を記憶部に格納するアクセスログ情報
格納処理と、記憶部からアクセスログ情報を読み出すア
クセスログ情報読出処理と、アクセスログ情報読出処理
で読み出されたアクセスログ情報のユーザ特定情報を匿
名化して匿名アクセスログ情報を生成する匿名化処理
と、匿名アクセスログ情報を出力する出力処理と、をコ
ンピュータに実行させるためのプログラムを記録したこ
とを特徴とする。
【0017】本発明に係るコンピュータ読取り可能な記
録媒体によれば、コンピュータは、アクセスログ情報に
含まれるユーザ特定情報を匿名化し、匿名アクセスログ
情報として出力される。そして、この匿名アクセスログ
情報に基づいてWebサイトを評価すれば、ユーザの情
報がリークすることが防止される。
【0018】
【発明の実施の形態】以下、添付図面を参照して、本発
明に係るアクセスログ情報管理装置、Webサイト評価
システム、Webサイト評価方法、及び、コンピュータ
読取り可能な記録媒体の好適な実施形態について詳細に
説明する。尚、同一要素には同一符号を用いるものと
し、重複する説明は省略する。
【0019】図1は、本実施形態のアクセスログ情報管
理装置10及びこれを備えたWebサイト評価システム
100を示す構成図である。Webサイト評価システム
100は、依頼者の要請によってWebサイトの構成の
良否を評価するためのシステムであり、アクセスログ情
報管理装置10と、これにインターネット等のネットワ
ークを介して接続されたWebサイト評価装置20と、
から構成されている。ここでは、Webサイトを運営す
る業者がアクセスログ情報管理装置10を構築した場合
について説明する。
【0020】アクセスログ情報管理装置10は、ユーザ
のWebサイトへのアクセスログ情報を格納したアクセ
スログ情報格納データベース30(以下、データベース
を「DB」と称する)と、Webサイトのコンテンツ情
報を格納したコンテンツ情報DB40と、アクセスログ
情報DB30に格納されたアクセスログ情報を読み出し
て所定の形式に変換する変換部(アクセスログ情報読出
手段、匿名化手段)50と、Webサイトの評価に用い
るアクセスログ情報を選定するためのアクセスログ情報
選定部60と、コンテンツ情報DB40に格納されたコ
ンテンツ情報を読み出すコンテンツ情報読出部70と、
変換部50で変換されたアクセスログ情報及びコンテン
ツ情報読出部70から読み出されたコンテンツ情報をW
ebサイト評価装置20へ送信する出力部(出力手段)
80と、を備えている。
【0021】図2は、アクセスログ情報DB30に格納
されたアクセスログ情報を示す図である。このアクセス
ログ情報は、ユーザがWebサイトへアクセスした履歴
を示すものであり、No.1から順に時系列で並べられ
ている。また、各アクセスログ情報の先頭には、ユーザ
を特定できるユーザ特定情報が含まれている。ここでい
うユーザの特定とは、ログインネームでユーザ個人を特
定するような場合に限られず、複数人が使用できる状態
にあるコンピュータをIPアドレスで特定するような場
合をも含む意である。例えば、No.1のアクセスログ
情報におけるユーザ特定情報は、「IP1」であり、N
o.3のアクセスログ情報におけるユーザ特定情報は、
「IP3」である。さらに、各アクセスログ情報におい
て、ユーザ特定情報の右側にはユーザがそのWebペー
ジにアクセスした日時が示され、さらに右側にはアクセ
スしたWebページを示す情報が含まれている。
【0022】コンテンツ情報DB40には、評価対象と
なるWebサイトのコンテンツ情報が含まれている。コ
ンテンツ情報には、文字や図形の情報や、各Webペー
ジ間のリンク構造に関する情報等が含まれている。
【0023】アクセスログ情報選定部60は、Webサ
イトの評価に使用するアクセスログ情報を選定するため
のものであり、例えば、所望のユーザに関するアクセス
ログ情報を選定したり、所定の時刻にアクセスされたも
ののみを選定したり、所望のWebページに関する情報
のみを選定することができる。更には、評価依頼者がW
ebサイトの評価に支払える金額をアクセスログ情報選
定部60に入力し、アクセスログ情報選定部60が、評
価に要する額がこの金額内になる分量のアクセスログ情
報を自動的に選定するようにしてもよい。
【0024】変換部50は、アクセスログ情報選定部6
0で選定されたアクセスログ情報をアクセスログ情報D
B30から読み出し、読み出したアクセスログ情報のユ
ーザ特定情報を匿名化して匿名アクセスログ情報とす
る。ここでいうユーザ特定情報の匿名化とは、この匿名
アクセスログ情報を見たり分析したりした者が、Web
サイトにアクセスしたユーザ又はコンピュータを特定で
きない程度にアクセスログ情報を変換することをいう。
但し、Webサイトを評価するにあたって、2つのペー
ジにおけるページ間アクセス類似度を求める際に、同一
ユーザが各ページにアクセスしたか否かを見極める必要
があるため、同一のユーザ特定情報を含んだアクセスロ
グ情報は同一の識別子を含んだ匿名アクセスログ情報と
なるように変換する必要がある。例えば、図2に示した
No.1とNo.6のアクセスログ情報には同一のユー
ザ特定情報(IPアドレス)「IP1」が含まれているた
め、各匿名アクセスログ情報に「USER1」という識別子
を含ませることが考えられる。
【0025】また、アクセスログ情報DB30のアクセ
スログ情報は上述のように時系列的に並べられている
が、IPアドレス毎にWebサイトを訪れてから立ち去
るまでを一つの単位として複数のセッションに区分けさ
れている。そして、変換部50は、各セッション毎に匿
名アクセスログ情報を生成する。ログイン−ログアウト
の作業が行われるWebサイトの場合は、評価に際して
ログインからログアウトまでの間のアクセスログ情報を
用いれば分かり易いが、ログイン手続きが不要で誰がい
つでもアクセスできるWebサイトの場合には、何時か
ら何時までのアクセスログを一つのセッションとみなし
Webサイトを評価してよいか判断に迷うことになる。
そのような場合には、あるIPアドレスのマシンが最後
にWebサーバーにアクセスしてから所定時間が経過し
た場合、つまり所定時間以上の間隔が開いた場合は、そ
こでセッションが切れるとみなし区分けを行う。これに
より、所定の時間間隔で区分けされるセッション毎に匿
名アクセスログ情報を生成することができ、評価するア
クセスログ情報の範囲が明確に区分され、評価をスムー
スに行うことができる。
【0026】さらに、変換部50は、同一セッション中
のアクセスを同一ユーザのものとみなし、当該セッショ
ン中のアクセスログのユーザ特定情報を同一のユーザ識
別子に変換し、異なるセッション中の同じIPアドレス
のアクセスは別のユーザのアクセスとみなして先程とは
異なるユーザ識別子に変換する。例えば、変換部50
は、セッション1のIP1のアクセスログでは、ユーザ特
定情報が同一の「USER1」というユーザ識別子に変換さ
れるが、セッション2中のIP1には異なるユーザ識別子
「USER2」を含ませる。
【0027】変換部50は、生成した匿名アクセスログ
情報を圧縮して出力部80に出力すると共に、評価に用
いるアクセスログ情報に関するWebサイトをコンテン
ツ情報読出部70に通知する。
【0028】コンテンツ情報読出部70は、変換部50
からの上記通知に応じて、コンテンツ情報DB40から
Webサイトの評価に用いられるコンテンツ情報を読み
出し、これを出力部80に送信する。
【0029】出力部80は、変換部50から受信した匿
名アクセスログ情報と、コンテンツ情報読出部70から
受信したコンテンツ情報とをネットワークを介してWe
bサイト評価装置20へ送信する。
【0030】Webサイト評価装置20は、アクセスロ
グ情報管理装置10から受信した匿名アクセスログ情報
とコンテンツ情報とに基づいて、Webサイトの構成を
評価する。Webサイトの評価にあたっては、2つのW
ebページのページ間アクセス類似度とリンク距離との
関係を示すデータや、ページ間アクセス類似度とページ
間コンテンツ類似度との関係を示すデータが用いられ
る。評価過程の詳細は、後述する。
【0031】次に、図3のフローチャートを参照して、
上記のような構成のWebサイト評価システム100を
用いたWebサイト評価方法を説明する。
【0032】まず、ステップ101(以下、ステップを
「S」と略す)において、Webサイトの評価依頼者又
はWebサイト評価システム100を運営するオペレー
タが、アクセスログ情報選定部60を操作して評価に利
用するアクセスログ情報を選定する(S101)。ここ
では、HTML形式のWebページに関するアクセスロ
グ情報のみを選定し、gif形式のデータを含んだアク
セスログ情報は評価に用いないことにする。また、ユー
ザ特定情報とそのユーザの属性(年齢、性別、住所、職
業等)との関係を示すデータテーブルを具備しておき、
アクセスログ情報選定部60に属性を入力し、この属性
に対応したユーザ特定情報が含まれるアクセスログ情報
を使用するようにしてもよい。
【0033】次に、S102において、変換部50は、
アクセスログ情報DB30からアクセスログ情報選定部
60で選定されたアクセスログ情報を読み出し、S10
3において、アクセスログ情報のユーザ特定情報を匿名
化して匿名アクセスログ情報を生成する。このように、
本実施形態ではユーザ特定情報が匿名化された匿名アク
セスログ情報がWebサイト評価装置20に対して出力
されるため、ユーザ情報のリークを防止することができ
る。また、アクセスログ情報選定部60で選定したアク
セスログ情報のみを匿名化してWebサイト評価装置2
0に送信するようにすることで、全てのアクセスログ情
報をWebサイト評価装置20へ送る場合よりも、匿名
アクセスログ情報の送信に要する負担を軽減させること
ができる。尚、変換部50は、生成した匿名アクセスロ
グ情報を圧縮して出力部80に送信する。
【0034】ここで、図2及び図4を参照して、匿名ア
クセスログ情報の生成過程を詳説する。変換部50は、
上述のように各セッション毎に匿名アクセスログ情報を
生成する。まず、図2(a)のセッション1では、HT
ML形式のWebページのアクセスログ情報であるNo.
1,No.6のみが匿名化の対照となる。図2(b)に示すよ
うに、No.1,No.6は同一セッションであるため、これら
の匿名アクセスログ情報には同一の識別子が含まれるこ
とになる。同様に、No.31,No.32も同一の識別子が含ま
れることになる。しかし、No.1とNo.31は同一のIPア
ドレス(IP1)よりのアクセスではあるが、セッション
が異なるために異なる識別子が付される。詳しくは、図
4に示すように、No.1,No.6,No.31,No.32のアクセスロ
グ情報がそれぞれA1,A2,D1,D2とされ、ユーザ特定情報
が識別子に変換して匿名化されている。同一セッション
のNo.1及びNo.6の識別子はUSER1とされ、同じく同一セ
ッションのNo.31,No.32の識別子はUSER4とされている。
【0035】尚、アクセスログ情報管理装置10におい
て、匿名化のルールをデータベースに記憶しておけば、
Webサイトの評価を終えた後に、どのユーザの振る舞
いによって得られた評価なのかが分かる。
【0036】このようにして匿名アクセスログ情報を生
成した後、コンテンツ情報読出部70は、コンテンツ情
報DB40からコンテンツ情報を読み出す(S10
4)。この際、コンテンツ情報読出部70は、変換部5
0から送信された、匿名化されたアクセスログ情報に対
応したWebページに関するコンテンツ情報を読み出
す。さらに、コンテンツ情報読出部70は、読み出した
コンテンツ情報を出力部80に送信する。
【0037】次に、出力部80は、変換部50からの匿
名アクセスログ情報とコンテンツ情報読出部70からの
コンテンツ情報とを、ネットワークを介してWebサイ
ト評価装置20に送信する(S105)。
【0038】匿名アクセスログ情報とコンテンツ情報と
を受信したWebサイト評価装置20は、これらの情報
に基づいてWebサイトの構成を評価する(S10
6)。以下、Webサイトの評価過程を述べる。
【0039】Webサイトを評価する方法として、主と
して、ページ間アクセス類似度とリンク距離との関係を
用いるものと、ページ間アクセス類似度とページ間コン
テンツ類似度との関係を用いるものとがある。
【0040】まず、前者のリンク距離に着目した評価方
法を説明する。まず、匿名アクセスログ情報に基づい
て、評価を望む2つのページのページ間アクセス類似度
を算出する。ページ間アクセス類似度は、2つのページ
における訪問者の共通度合いを示すものであり、以下の
ように求められる。例えば、図5に示すように、Web
ページIにUSER1が1回、USER2が2回、USER3が2回アク
セスしており、WebページIIにUSER1が2回、USER2が
1回、USER3が1回アクセスしているとする。この場
合、ページ間アクセス類似度Raは、 Ra=Sim(A,B)=(1/5)×(2/4)+(2/5)×(1/4)+(2/5)×
(1/4)=0.3 となる。
【0041】また、各Webページ間のリンク距離は、
ユーザが何回クリックして他方のWebページにアクセ
スできるかを示すものであり、匿名アクセスログ情報と
コンテンツ情報とに基づいて求められる。Webページ
Iが開かれている状態から2回クリックするとWebペ
ージIIを開ける場合は、リンク距離は2となる。
【0042】以上のような作業を各匿名アクセスログ情
報に基づいて行った後、図6に示すように、ページ間ア
クセス類似度とリンク距離との関係をプロットする。各
プロットは、2つのページ(ページ群)の関係を示して
いる。そして、Webサイト評価装置20は、このデー
タに基づいてWebサイトの構成の良否を評価する。
【0043】例えば、図6の表においては、実線の円で
囲んだ箇所に問題があることが分かる。この円で囲んだ
箇所は、ページ間アクセス類似度とリンク距離の値が共
に高い領域である。すなわち、この領域では、2つのペ
ージに同一ユーザがアクセスする割合が高いにもかかわ
らず、何度もクリックしないと他方のページに辿り着け
ないリンク構造にされているのである。つまり、ユーザ
のWebサイト上の振るまいとWebサイトの制作者の
意図との間にギャップが生じているのである。一方、ペ
ージ間アクセス類似度が高い2つのWebページのリン
ク距離が短い場合は、ユーザが利用しやすく、ユーザの
振る舞いとWebサイトの制作者の意図との間のギャッ
プが少ないことになる。そして、Webサイト評価装置
20は、円で囲まれた領域に含まれるページ群のリンク
構造が好ましくなく、円で囲まれない領域のページ群の
リンク構造は好適であると評価する。
【0044】次に、後者のページ間アクセス類似度とペ
ージ間コンテンツ類似度との関係に着目した評価方法を
説明する。
【0045】まず、上記と同様にして、匿名アクセスロ
グ情報に基づいて、評価を望む2つのページのページ間
アクセス類似度を算出する。さらに、コンテンツ情報に
基づいて、ページ間コンテンツ類似度を算出する。ペー
ジ間コンテンツ類似度は、次のようにして求められる。
例えば、図7に示すように、WebページIにW1という
単語が2回、W2が1回、W3が2回使用されており、We
bページIIにW1が2回、W2が0回、W3が1回使用されて
いるとする。この場合、ページ間コンテンツ類似度Rc
は、 Rc=Sim(A,B)=(2/5)×(2/3)+(1/5)×(0/3)+(2/5)×
(1/3)=0.4 となる。
【0046】そして、ページ間コンテンツ類似度を各匿
名アクセスログ情報に対応するコンテンツ情報に基づい
て行った後、図8に示すように、ページ間アクセス類似
度とページ間コンテンツ類似度との関係をプロットす
る。各プロットは、2つのページ(ページ群)の関係を
示すものである。そして、Webサイト評価装置20
は、このデータに基づいてWebサイトの構成の良否を
評価する。
【0047】例えば、図8の表においては、実線の円で
囲んだ箇所に問題があることが分かる。この円で囲んだ
箇所は、ページ間コンテンツ類似度が高く、且つ、ペー
ジ間アクセス類似度が低い領域である。すなわち、この
領域では、2つのページの内容が近似するにもかかわら
ず、同一ユーザがアクセスする確率が低くなっているの
である。つまり、Webサイトの制作者は関連情報が掲
載されたWebページを近くに配置したつもりだが、ユ
ーザは各Webページを一緒に見ていないことになる。
このため、Webサイト評価装置20は、円で囲まれた
領域に含まれるページ群のリンク構造が好ましくなく、
円の外部のページ群のリンク構造は好適であると評価す
る。
【0048】次に、本実施形態の4つの変形例を説明す
る。
【0049】第1の変形例は、図6のようなWebサイ
ト評価装置20の評価結果を評価依頼者に見せ、依頼者
にどのページ群の問題の原因を究明するかを指定しても
らい、指定されたページ群を中心とした問題を解決する
ものである。
【0050】第2の変形例では、まず、評価の結果、W
ebサイトの中で好ましくないと判断された箇所を仮想
的に作製する。次いで、匿名アクセスログ情報によって
得られるユーザモデルを利用して、この仮想サイト上で
ユーザがどのように振る舞うか、すなわち、どのように
Webページ間を移動するかを分析する。そして、この
予想されたユーザの振る舞いを仮想Webサイトに併せ
て、評価依頼者に知らせる。
【0051】第3の変形例では、評価の結果、Webサ
イトの中で問題があると判断された箇所を既存のコンテ
ンツ情報を用いて改善し、改善されたWebサイトを提
案サイトとして評価依頼者に知らせる。
【0052】第4の変形例では、匿名アクセスログ情報
によって得られるユーザモデルを利用して競合他社のW
ebサイト上でのユーザの振る舞いをシミュレートし、
依頼者のWebサイトにおけるユーザの振る舞いと比較
して、その結果を評価依頼者に知らせる。
【0053】次に、図9〜図11を参照して、上記We
bサイトの評価方法を実現可能な、コンピュータ読取り
可能な記録媒体(以下、単に「記録媒体」と称す)につ
いて説明する。ここで、記録媒体とは、プログラムの記
述内容に応じて磁気、光、電気等のエネルギを変化さ
せ、その変化に対応する信号の形式でコンピュータのハ
ードウェア資源に備えられている読取装置にプログラム
の記述内容を伝達できるものである。このような記録媒
体としては、例えば、磁気ディスク、光ディスク、CD
−ROM、コンピュータに内蔵されるメモリ等が該当す
る。
【0054】図9は、本実施形態の記録媒体110の構
成図である。記録媒体110には、プログラムを記録し
たプログラム領域110aとデータファイルを格納した
データ領域110bとが設けられている。
【0055】データ領域110bには、アクセスログ情
報ファイル及びコンテンツ情報ファイルが記録されてい
る。これらの内容は、それぞれ図1に示すアクセスログ
情報DB30に格納されたアクセスログ情報及びコンテ
ンツ情報DB40に格納されたコンテンツ情報と同様で
ある。
【0056】プログラム領域110aには、処理を統括
するメインモジュール111と、アクセスログ情報を選
定させるためのアクセスログ情報選定モジュール112
と、データ領域110bのアクセスログ情報をコンピュ
ータのメモリ(記憶部)に記憶させるためのアクセスロ
グ情報記憶モジュール113と、選定されたアクセスロ
グ情報をメモリから読み出すためのアクセスログ情報読
出モジュール114と、データ領域110bのコンテン
ツ情報をコンピュータのメモリに記憶させるためのコン
テンツ情報記憶モジュール115と、メモリに記憶され
たコンテンツ情報を読み出すためのコンテンツ情報読出
モジュール116と、メモリから読み出したアクセスロ
グ情報のユーザ特定情報を匿名化して匿名アクセスログ
情報を生成する匿名化モジュール117と、匿名アクセ
スログ情報及びコンテンツ情報をWebサイト評価装置
等へ出力するための出力モジュール118と、が含まれ
ている。
【0057】ここで、アクセスログ情報選定モジュール
112を動作させることによって実現する機能は、図1
に示したアクセスログ情報選定部60の機能と同様であ
る。アクセスログ情報読出モジュール114及び匿名化
モジュール117を動作させることによって実現する機
能は、変換部50の機能と同様である。コンテンツ情報
読出モジュール116を動作させることによって実現す
る機能は、コンテンツ情報読出部70の機能と同様であ
る。出力モジュール118を動作させることによって実
現する機能は、出力部80の機能と同様である。
【0058】図10は、記録媒体110に記録されたプ
ログラムを実行するためのコンピュータ150のハード
ウェア構成を示す図であり、図11は、記録媒体110
に記録されたプログラムを実行するためのコンピュータ
150の斜視図である。各図に示すように、コンピュー
タ150は、フレキシブルドライブ装置、CD−ROM
ドライブ装置、磁気テープドライブ装置等の読み取り装
置122と、オペレーティングシステム(OS)を常駐
させた作業用メモリ(RAM)124と、記録媒体11
0に記録されたアクセスログ情報及びコンテンツ情報を
記憶するためのメモリ125と、表示手段であるディス
プレイ126と、入力手段であるマウス128及びキー
ボード130と、作成したWebページを印刷出力する
プリンタ132と、プログラムの実行を制御するCPU
134と、を備えている。ここで、記録媒体110が読
み取り装置122に挿入されると、記録媒体110に記
録された情報が読み取り装置122からアクセス可能に
なり、記録媒体110のプログラム領域110aに記録
されたプログラムが、コンピュータ150によって実行
可能となる。
【0059】本実施形態の記録媒体110によれば、コ
ンピュータ150は、アクセスログ情報に含まれるユー
ザ特定情報を匿名化して匿名アクセスログ情報を生成
し、この情報がWebサイト評価装置等を備える評価セ
ンタに送信される。このように、匿名アクセスログ情報
に基づいてWebサイトを評価すれば、ユーザの情報が
リークすることを防止できる。
【0060】尚、本実施形態では、記録媒体110のデ
ータ領域110bにアクセスログ情報及びコンテンツ情
報を記録させているが、これらを記録媒体110に記録
させておくのではなく、外部のデータベースに記憶させ
てもよい。この場合、アクセスログ情報記憶モジュール
113及びコンテンツ情報記憶モジュール115を動作
させることで、当該データベースに格納されたアクセス
ログ情報及びコンテンツ情報をコンピュータ150のメ
モリ125に記憶させることができる。
【0061】以上、本発明者らによってなされた発明を
実施形態に基づき具体的に説明したが、本発明は上記実
施形態に限定されるものではない。例えば、コンテンツ
情報を管理してWebサイトを運営する業者がアクセス
ログ情報管理装置を構築しなくてもよい。この場合、コ
ンテンツ情報格納手段は、アクセスログ情報管理装置の
外部に設けられることになる。
【0062】
【発明の効果】以上説明したように、本発明によれば、
ユーザ特定情報が匿名化された匿名アクセスログ情報に
基づいてWebサイトの構成が評価されるため、ユーザ
の情報がリークすることを防止できる。
【図面の簡単な説明】
【図1】本発明のアクセスログ情報管理装置及びWeb
サイト評価システムの構成図である。
【図2】アクセスログ情報DBに格納されたアクセスロ
グ情報を示す図である。
【図3】Webサイトの評価方法を示すフローチャート
である。
【図4】匿名アクセスログ情報を示す図である。
【図5】ページIとページIIのアクセス類似度を求める
ために用いた図である。
【図6】ページ間アクセス類似度とリンク距離との関係
を示す図である。
【図7】ページIとページIIのコンテンツ類似度を求め
るために用いた図である。
【図8】ページ間アクセス類似度とページ間コンテンツ
類似度との関係を示す図である。
【図9】本発明のコンピュータ読取り可能な記録媒体を
示す構成図である。
【図10】記録媒体に記録されたプログラムを実行する
ためのコンピュータのハードウェア構成を示す図であ
る。
【図11】記録媒体に記録されたプログラムを実行する
ためのコンピュータの斜視図である。
【符号の説明】
10…アクセスログ情報管理装置、20…Webサイト
評価装置、30…アクセスログ情報DB(アクセスログ
情報格納手段)、40…コンテンツ情報DB(コンテン
ツ情報格納手段)、50…変換部(匿名化手段、アクセ
スログ情報読出手段)、60…アクセスログ情報選定部
(アクセスログ情報選定手段)、70…コンテンツ情報
読出部(コンテンツ情報格納手段)、80…出力部(出
力手段)、100…Webサイト評価システム、110
…記録媒体、125…メモリ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 加藤 裕樹 神奈川県足柄上郡中井町境430グリーンテ クなかい 富士ゼロックス株式会社内 Fターム(参考) 5B049 AA05 BB00 CC00 EE02 FF03 GG04 GG09 5B075 KK07 KK60 KK63 UU08 5B085 AA04 AE00

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 Webサイトのアクセス履歴を示すアク
    セスログ情報を管理する装置であって、 ユーザを特定するユーザ特定情報を含んだアクセスログ
    情報を格納したアクセスログ情報格納手段と、 前記アクセスログ情報格納手段から前記アクセスログ情
    報を読み出すアクセスログ情報読出手段と、 前記アクセスログ情報読出手段で読み出された前記アク
    セスログ情報の前記ユーザ特定情報を匿名化して匿名ア
    クセスログ情報を生成する匿名化手段と、 前記匿名アクセスログ情報を出力する出力手段と、 を備えることを特徴とするアクセスログ情報管理装置。
  2. 【請求項2】 前記アクセスログ情報格納手段に格納さ
    れた前記アクセスログ情報の中から所望の前記アクセス
    ログ情報を選定するためのアクセスログ情報選定手段を
    更に備え、 前記匿名化手段は、前記アクセスログ情報選定手段で選
    定されたアクセスログ情報のみを匿名化して前記匿名ア
    クセスログ情報を生成することを特徴とする請求項1記
    載のアクセスログ情報管理装置。
  3. 【請求項3】 前記変換手段は、 所定の時間間隔で区分けされるセッション毎に前記匿名
    アクセスログ情報を生成すると共に、 前記各セッションに同一の前記ユーザ特定情報を有する
    前記アクセスログ情報が含まれる場合は、そのアクセス
    ログ情報に対応する前記匿名アクセスログ情報に同一の
    識別子を含ませることを特徴とする請求項1又は請求項
    2記載のアクセスログ情報管理装置。
  4. 【請求項4】 Webサイトの構成を評価するWebサ
    イト評価システムであって、 請求項1〜請求項3のうち何れか一項記載のアクセスロ
    グ情報管理装置と、 前記Webサイトのコンテンツ情報を格納したコンテン
    ツ情報格納手段と、 前記アクセスログ情報管理装置にネットワークを介して
    接続されたWebサイト評価装置と、を備え、 前記Webサイト評価装置は、前記アクセスログ情報管
    理装置から出力された前記匿名アクセスログ情報と、前
    記コンテンツ情報格納手段に格納された前記Webサイ
    トのコンテンツ情報とに基づいて、前記Webサイトの
    構成を評価することを特徴とするWebサイト評価シス
    テム。
  5. 【請求項5】 Webサイトの構成を評価するWebサ
    イト評価方法であって、 ユーザを特定するユーザ特定情報を含んだアクセスログ
    情報を格納したアクセスログ情報格納手段から、前記ア
    クセスログ情報を読み出すアクセスログ情報読出ステッ
    プと、 前記アクセスログ情報読出ステップで読み出された前記
    アクセスログ情報の前記ユーザ特定情報を匿名化して匿
    名アクセスログ情報を生成する匿名化ステップと、 前記匿名化ステップで生成された前記匿名アクセスログ
    情報と、前記Webサイトのコンテンツ情報とに基づい
    て、前記Webサイトの構成を評価する評価ステップ
    と、 を含むことを特徴とするWebサイト評価方法。
  6. 【請求項6】 ユーザを特定するユーザ特定情報を含ん
    だアクセスログ情報を記憶部に格納するアクセスログ情
    報格納処理と、 前記記憶部から前記アクセスログ情報を読み出すアクセ
    スログ情報読出処理と、 前記アクセスログ情報読出処理で読み出された前記アク
    セスログ情報の前記ユーザ特定情報を匿名化して匿名ア
    クセスログ情報を生成する匿名化処理と、 前記匿名アクセスログ情報を出力する出力処理と、 をコンピュータに実行させるためのプログラムを記録し
    たコンピュータ読取り可能な記録媒体。
JP2000314012A 2000-10-13 2000-10-13 アクセスログ情報管理装置、Webサイト評価システム、Webサイト評価方法、及び、コンピュータ読取り可能な記録媒体 Pending JP2002123452A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000314012A JP2002123452A (ja) 2000-10-13 2000-10-13 アクセスログ情報管理装置、Webサイト評価システム、Webサイト評価方法、及び、コンピュータ読取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000314012A JP2002123452A (ja) 2000-10-13 2000-10-13 アクセスログ情報管理装置、Webサイト評価システム、Webサイト評価方法、及び、コンピュータ読取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2002123452A true JP2002123452A (ja) 2002-04-26

Family

ID=18793336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000314012A Pending JP2002123452A (ja) 2000-10-13 2000-10-13 アクセスログ情報管理装置、Webサイト評価システム、Webサイト評価方法、及び、コンピュータ読取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2002123452A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829564B2 (en) 2002-09-09 2004-12-07 Fuji Xerox Co., Ltd. Usability evaluation support apparatus
JP2006293903A (ja) * 2005-04-14 2006-10-26 Konica Minolta Business Technologies Inc 情報処理装置および情報処理プログラム
US7152016B2 (en) 2002-09-19 2006-12-19 Fuji Xerox Co., Ltd. Usability evaluation support apparatus and method
JP2013123189A (ja) * 2011-12-12 2013-06-20 Furuno Electric Co Ltd 管理サーバ、特定情報管理システム、及び特定情報管理方法
US20140344355A1 (en) * 2013-05-17 2014-11-20 Xerox Corporation Method and apparatus for monitoring access of pre-read materials for a meeting

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829564B2 (en) 2002-09-09 2004-12-07 Fuji Xerox Co., Ltd. Usability evaluation support apparatus
US7152016B2 (en) 2002-09-19 2006-12-19 Fuji Xerox Co., Ltd. Usability evaluation support apparatus and method
JP2006293903A (ja) * 2005-04-14 2006-10-26 Konica Minolta Business Technologies Inc 情報処理装置および情報処理プログラム
US7948646B2 (en) 2005-04-14 2011-05-24 Konica Minolta Business Technologies, Inc. Information processing apparatus easy for users to operate
JP2013123189A (ja) * 2011-12-12 2013-06-20 Furuno Electric Co Ltd 管理サーバ、特定情報管理システム、及び特定情報管理方法
US20140344355A1 (en) * 2013-05-17 2014-11-20 Xerox Corporation Method and apparatus for monitoring access of pre-read materials for a meeting
US9444853B2 (en) * 2013-05-17 2016-09-13 Xerox Corporation Method and apparatus for monitoring access of pre-read materials for a meeting

Similar Documents

Publication Publication Date Title
Drennan et al. Privacy, risk perception, and expert online behavior: An exploratory study of household end users
Olson et al. A study of preferences for sharing and privacy
US8095629B2 (en) Managing user accounts and groups in multiple forests
US20080071912A1 (en) Multiple Redundant Services with Reputation
EP1580946A1 (en) Publish-subscribe method and apparatus with access control
US20040083243A1 (en) Privacy preferences roaming and enforcement
CA2789899A1 (en) User role based customizable semantic search
JP2005208945A (ja) 人材検索システム、人材検索サーバ、人材検索方法、プログラムおよび記録媒体
CN102930010A (zh) 实体属性和关系的排序
JP2007073024A (ja) マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム
García-Avilés et al. How COVID-19 is revamping journalism: newsroom practices and innovations in a crisis context
JP2020187723A (ja) プライバシーを保護しながら分散された顧客データ上で機械学習すること
Dame-Griff Herding the ‘performing elephants:’Using computational methods to study Usenet
US7620729B2 (en) Compliance initiative navigation
Dunlop Reflections on Mira: Interactive evaluation in information retrieval
JP2002123452A (ja) アクセスログ情報管理装置、Webサイト評価システム、Webサイト評価方法、及び、コンピュータ読取り可能な記録媒体
JP2014016916A (ja) ソーシャル・グラフの拡張方法、プログラム及びシステム
Wang et al. A neural computing approach to the construction of information credibility assessments for online social networks
CN117032634A (zh) 组件处理方法及系统
Cranor Designing a privacy preference specification interface: A case study
JPH11306100A (ja) 審査支援システムに特徴を有する通信ネットワーク上の投稿閲覧システム
Rayner Improving systems: Understanding ‘work as imagined’versus ‘work as done’
Murray An investigation of specifications for migrating to a web portal framework for the dissemination of health information within a public health network
CN102111433A (zh) 信息处理装置、信息处理方法、以及计算机程序
Chan et al. Shifting platform values in community guidelines: Examining the evolution of TikTok’s governance frameworks