JP2007293520A - 情報処理装置および情報処理プログラム - Google Patents
情報処理装置および情報処理プログラム Download PDFInfo
- Publication number
- JP2007293520A JP2007293520A JP2006119434A JP2006119434A JP2007293520A JP 2007293520 A JP2007293520 A JP 2007293520A JP 2006119434 A JP2006119434 A JP 2006119434A JP 2006119434 A JP2006119434 A JP 2006119434A JP 2007293520 A JP2007293520 A JP 2007293520A
- Authority
- JP
- Japan
- Prior art keywords
- category
- web page
- information
- web
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】Webサーバが端末装置に配信する各種Webページ群の品質の良し悪しの比較にかかる精度を向上させる。
【解決手段】カテゴリ平均滞在時間算出部11は、WebアクセスログDB3に記憶されるログ情報およびカテゴリ情報DB12に記憶されるカテゴリ情報をもとに各カテゴリに属するWebページ群の質的評価値の仮の値を計算する。カテゴリ規模算出部13はカテゴリ情報DB12に記憶されたカテゴリ情報をもとに各カテゴリと対応するWebページ群の規模を計算する。質的評価値補正部14はカテゴリ平均滞在時間算出部11により計算した質的評価値の仮の値の補正値とカテゴリ規模算出部13による計算結果とをもとに質的評価値の補正値を計算する。
【選択図】 図1
【解決手段】カテゴリ平均滞在時間算出部11は、WebアクセスログDB3に記憶されるログ情報およびカテゴリ情報DB12に記憶されるカテゴリ情報をもとに各カテゴリに属するWebページ群の質的評価値の仮の値を計算する。カテゴリ規模算出部13はカテゴリ情報DB12に記憶されたカテゴリ情報をもとに各カテゴリと対応するWebページ群の規模を計算する。質的評価値補正部14はカテゴリ平均滞在時間算出部11により計算した質的評価値の仮の値の補正値とカテゴリ規模算出部13による計算結果とをもとに質的評価値の補正値を計算する。
【選択図】 図1
Description
本発明は、Webサーバが端末装置に配信するWebページ群の品質の良し悪しを分析する情報処理装置および情報処理プログラムに関する。
従来、インターネットにおける端末装置によるアクセス先の例としてWebサーバが保持するWebページ又はWebページ群が挙げられる。Webページ又はWebページ群は宣伝広告、情報発信および受注受付などの様々な目的のために運営される。この目的を効果的に達成するためにユーザはWebページ又はWebページ群の分析および調査を行なう。
Webページ又はWebページ群の分析および調査の方法としてはどのWebページが何時どのようにアクセスされたかを記録するWebアクセスログを用いたいわゆるWebアクセスログ分析が挙げられる(例えば特許文献1参照)。
Webアクセスログ分析では例えばWebページ又はWebページ群の訪問者数が例えば時間毎や曜日毎にどのように変化するかを調査する。またWebアクセスログ分析では訪問者が使用しているブラウザ又はコンピュータのOSの種類が調査される場合もある。
またWebアクセスログ分析では訪問者がWebページ群のどのような閲覧行動をとるかについて調査する場合もある。例えば一訪問者がWebページ“A”を閲覧し、次にWebページ“B”を閲覧したことを明らかにするなどの経路分析もWebアクセスログ分析に含まれる。
なお、このような分析をするために必要となるWebアクセスログには種々のものがある。Webアクセスログは単一又は複数のWebサーバに記録されるログ情報とする場合がある。またWebサーバとアクセス元の端末装置との間の通信路上で伝送されるパケットを受信することでWebアクセスログを得る手法もある。
さらにWebページに特殊なスクリプトを埋め込んでおいて、そのページがブラウザによってアクセスされると別のWebサーバに対して当該ブラウザが情報取得のアクセスを行なう方法もある。この場合には前述した別のWebサーバにおいてWebアクセスログを保持する。
特開2004−252911号公報
Webアクセスログ分析ではWebページ群の内容の改善のために当該Webページ群の品質をカテゴリの単位で分析する場合がある。具体的にはページビュー数や訪問数のような量的評価値を例えば横軸にとり、質的評価値を例えば縦軸にとったグラフを作成する。このグラフでは各々のカテゴリと対応する点をプロットする。
量的評価値は例えば各カテゴリに属するWebページ群への訪問数である。つまり量的評価値は各カテゴリに属するWebページ群に対するニーズの規模を示す。
一方、質的評価値は各カテゴリに属するWebページ群を訪問者がどの位じっくりと閲覧したかを示す。一般的に訪問者はWebページ群の内容に興味を持たなければ短時間のうちに閲覧を終了する。逆に訪問者はWebページ群の内容に興味を持てばこのWebページ群をある程度の時間をかけて閲覧する。これらの理由によりWebページ群の質的評価値は当該Webページ群への訪問者の訪問あたりの閲覧時間をもとに示される。
例えば読みやすさや探しやすさの程度が同程度の2種類のWebページ群が存在する場合には、それぞれのWebページ群に関する前述した閲覧時間を比較することで各Webページ群の内容の良し悪しを比較することができる。
しかしWebページ群自体の規模が大きくなればそのWebページ群の内容の良し悪しに関わらず必然的に閲覧時間が長くなる傾向にある。従って前述したような閲覧時間をもとにした質的評価値を用いても規模の異なるWebページ群の間ではその良し悪しの相互比較が適切に行なえないという問題があった。
そこで、本発明の目的は、Webサーバが端末装置に配信する各種Webページ群の品質の良し悪しの比較にかかる精度を向上させることが可能になる情報処理装置および情報処理プログラムを提供することにある。
すなわち、本発明に係わる情報処理装置は、Webサーバが端末装置に配信するWebページ群に関するログ情報を取得し、Webサーバが保持するWebページ群のカテゴリ情報を記憶し、前述のように取得したログ情報をもとにWebページ群の質的評価値をカテゴリ情報で分類される種別ごとに計算し、Webページ群の規模を種別ごとに計算し、Webページ群の質的評価値の計算結果およびWebページ群の規模の計算結果をもとに質的評価値の補正値を計算することを特徴とする。
本発明に係わる情報処理装置では、Webサーバが端末装置に配信するWebページ群に関するログ情報を取得し、Webサーバが保持するWebページ群のカテゴリ情報を記憶し、前述のように取得したログ情報をもとにWebページ群の質的評価値をカテゴリ情報で分類される種別ごとに計算し、Webページ群の規模を種別ごとに計算し、Webページ群の質的評価値の計算結果およびWebページ群の規模の計算結果をもとに質的評価値の補正値を計算するので、Webサーバが端末装置に配信する各種Webページ群の品質の良し悪しの比較にかかる精度を向上させることができる。
以下図面により本発明の実施形態について説明する。
(第1の実施形態)
まず、本発明の第1の実施形態について説明する。
図1は、本発明の第1の実施形態にしたがったWebアクセスログ分析システムの構成例を示すブロック図である。
本発明の第1の実施形態にしたがったWebアクセスログ分析システム1はネットワークを介してWebサーバ2と接続される。
(第1の実施形態)
まず、本発明の第1の実施形態について説明する。
図1は、本発明の第1の実施形態にしたがったWebアクセスログ分析システムの構成例を示すブロック図である。
本発明の第1の実施形態にしたがったWebアクセスログ分析システム1はネットワークを介してWebサーバ2と接続される。
Webサーバ2は各種Webページ群を保持する。Webページは文書および画像などを示すデータである。Webサーバ2はユーザが所有する図示しない端末装置からのリクエストにしたがってWebページ群のうちリクエストで示されるWebページをリクエスト元の端末装置に配信する。
Webサーバ2はWebアクセスログDB3を備える。Webサーバ2は端末装置に配信したWebページ群に関するログ情報をWebアクセスログDB3に記憶する。
Webサーバ2はWebアクセスログDB3を備える。Webサーバ2は端末装置に配信したWebページ群に関するログ情報をWebアクセスログDB3に記憶する。
図2は、本発明の第1の実施形態にしたがったWebアクセスログ分析システム1と接続されるWebサーバ2のWebアクセスログDB3に記憶されるWebアクセスログ情報の構成例を表形式で示す図である。
WebアクセスログDB3に記憶されるWebアクセスログ情報はアクセスURL(Uniform Resource Locator)、アクセス日時およびアクセス元IPアドレスが対応付けられて管理される情報である。
アクセスURLはWebサーバ2が保持するWebページ群のうちユーザの端末装置から配信要求のあったWebページのURLである。このURLは図2に示すような拡張子が“html”であるファイルのURLに限らず、例えば拡張子が“gif”や“jpg”などであるファイルのURLを含む。
アクセス日時はWebアクセスログ情報上で対応付けられるアクセスURLと対応するWebページを配信要求元の端末装置に配信した日時を示す。アクセス元IPアドレスは前述したアクセスURLと対応するWebページの配信要求を行なった端末装置のIPアドレスである。
Webアクセスログ分析システム1はWebアクセスログ情報をもとにWebサーバ2内の各種Webページ群の品質の良し悪しを分析する機能を有する。
図1に示すように、Webアクセスログ分析システム1はカテゴリ平均滞在時間算出部11、カテゴリ情報DB12、カテゴリ規模算出部13、質的評価値補正部14および分析結果表示部15を備える。
図1に示すように、Webアクセスログ分析システム1はカテゴリ平均滞在時間算出部11、カテゴリ情報DB12、カテゴリ規模算出部13、質的評価値補正部14および分析結果表示部15を備える。
カテゴリ情報DB12はWebサーバ2が保持するWebページ群に属する各Webページのカテゴリ情報を記憶する。カテゴリ情報とは各Webページが予め定めたカテゴリのいずれに属するかを示す情報である。
図3は、本発明の第1の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ情報DB12に記憶されるカテゴリ情報の構成例を表形式で示す図である。
カテゴリ情報DB12に記憶されるカテゴリ情報はWebサーバ2が保持するWebページ群のカテゴリを示す情報であり、例えば、本実施形態では、URL、機種カテゴリおよび製品カテゴリが対応付けられて管理される情報である。
カテゴリ情報DB12に記憶されるカテゴリ情報はWebサーバ2が保持するWebページ群のカテゴリを示す情報であり、例えば、本実施形態では、URL、機種カテゴリおよび製品カテゴリが対応付けられて管理される情報である。
製品カテゴリとは取り扱い製品の各機種の種別の名称を示す情報である。製品カテゴリとは製品カテゴリで示された各機種が属する製品の種別の名称を示す情報である。URLはカテゴリ情報上で対応付けられる製品カテゴリおよび製品カテゴリと対応するWebページのURLである。
このようなカテゴリ情報は予め構築するものであってもよいし、Webサーバ2が保持するWebページ群に属する各WebページのURLの文字列の完全一致、前方一致、後方一致および部分一致などに基づいて構築するものであってもよい。
図3に示したカテゴリ情報は電化製品のカテゴリ情報であるが、これに限らず例えば衣料品のブランド別のカテゴリ情報や生活用品の品目別のカテゴリ情報であってもよいしその他のカテゴリ情報であってもよい。
カテゴリ平均滞在時間算出部11はWebアクセスログDB3に記憶されるログ情報およびカテゴリ情報DB12に記憶されるカテゴリ情報をもとに各カテゴリに属するWebページ群の質的評価値の仮の値をカテゴリで分類される種別ごとに計算する。カテゴリ平均滞在時間算出部11は質的評価値の仮の値の計算のためのワークメモリを備える。
質的評価値の仮の値は端末装置のユーザによる各カテゴリに属するWebページの平均滞在時間に基づいてカテゴリ平均滞在時間算出部11が計算する値である。この平均滞在時間については後述する。また、カテゴリ平均滞在時間算出部11は前述した平均滞在時間自体を質的評価値の仮の値としてもよい。
カテゴリ規模算出部13はカテゴリ情報DB12に記憶されたカテゴリ情報をもとに各カテゴリと対応するWebページ群の規模をカテゴリで分類される種別ごとに計算する。カテゴリ規模算出部13は各カテゴリと対応するWebページ群の規模の計算のためのワークメモリを備える。
図4は、本発明の第1の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13の内部構成例を示す図である。
カテゴリ規模算出部13はURL数カウント部21およびカテゴリ規模決定部22を備える。URL数カウント部21はカテゴリ情報DB12に記憶されたカテゴリ情報をもとに各カテゴリと対応するWebページ群に属するWebページのURLの数を検出する。カテゴリ規模決定部22はURL数カウント部21による検出結果をもとに各カテゴリに属するWebページ群の規模を示す値を計算する。
カテゴリ規模算出部13はURL数カウント部21およびカテゴリ規模決定部22を備える。URL数カウント部21はカテゴリ情報DB12に記憶されたカテゴリ情報をもとに各カテゴリと対応するWebページ群に属するWebページのURLの数を検出する。カテゴリ規模決定部22はURL数カウント部21による検出結果をもとに各カテゴリに属するWebページ群の規模を示す値を計算する。
カテゴリ規模決定部22はURL数カウント部21によりカウントしたURLの数をそのまま規模を示す値としてもよいし、このURLの数に係数を乗じて規模を示す値を計算してもよい。
質的評価値補正部14はカテゴリ平均滞在時間算出部11により計算した質的評価値の補正値を計算する。質的評価値補正部14は質的評価値の補正値の計算のためのワークメモリを備える。分析結果表示部15は質的評価値補正部14による計算結果をモニタ表示する。
次に、本発明の第1の実施形態にしたがったWebアクセスログ分析システム1の処理動作について説明する。
Webアクセスログ分析システム1のカテゴリ平均滞在時間算出部11はWebアクセスログDB3に記憶されたWebアクセスログ情報のうち予め定めた期間に関するログ情報を取得する。予め定めた期間とは例えば過去一週間や過去一ヶ月である。
Webアクセスログ分析システム1のカテゴリ平均滞在時間算出部11はWebアクセスログDB3に記憶されたWebアクセスログ情報のうち予め定めた期間に関するログ情報を取得する。予め定めた期間とは例えば過去一週間や過去一ヶ月である。
カテゴリ平均滞在時間算出部11はWebアクセスログDB3から取得したログ情報およびカテゴリ情報DB12に記憶されたカテゴリ情報に基づいて各Webページのアクセス情報を計算する。
図5は、本発明の第1の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ平均滞在時間算出部11による各Webページのアクセス情報の計算結果の一例を表形式で示す図である。
このアクセス情報はURL、延べアクセス時間、訪問数、機種カテゴリおよび製品カテゴリが対応付けられる情報である。
このアクセス情報はURL、延べアクセス時間、訪問数、機種カテゴリおよび製品カテゴリが対応付けられる情報である。
延べアクセス時間はアクセス情報上で対応付けられるURLと対応するWebページに対して前述した期間内における各ユーザの端末装置によるアクセス時間の累計値である。このアクセス時間はWebアクセスログ情報におけるアクセス日時から当該アクセス日時とアクセスログ情報上で対応付けられるアクセス元IPアドレスと同一のIPアドレスが付与される端末装置が次にアクセスしたWebページのアクセス日時までの時間である。
訪問数はアクセス情報上で対応付けられる各カテゴリに属する各Webページのいずれかに対する前述した期間内における同一のIPアドレスが付与される端末装置による一連のアクセスを単一の訪問とした各ユーザの端末装置による訪問の累計値である。
一連のアクセスとは単一のWebページに対するアクセスおよび各Webページに対する予め定められた時間以内の間隔による連続したアクセスのいずれかである。予め定められた時間とは例えば30分である。つまり端末装置からのアクセス先であるWebページへのアクセス時刻と当該端末装置から次にアクセスされたWebページのアクセス時刻との間隔が前述した予め定められた時間内であれば、単一の訪問が途切れることなく続いている事を意味する。
カテゴリ平均滞在時間算出部11は前述した一連のアクセス先のWebページ群に同一カテゴリに属するWebページが複数含まれる場合には当該カテゴリに対して1つの訪問がなされたとして訪問数を計算する。
また、カテゴリ平均滞在時間算出部11は前述した一連のアクセス先のWebページ群に異なるカテゴリに属するWebページがそれぞれ含まれる場合には当該それぞれのカテゴリに対して1つずつの訪問がなされたとして訪問数を計算する。
カテゴリ平均滞在時間算出部11はカテゴリ情報で定義された各カテゴリに属するWebページ群の平均滞在時間を各Webページのアクセス情報をもとに計算する。
カテゴリ平均滞在時間算出部11はカテゴリ情報で定義された各カテゴリに属するWebページ群の平均滞在時間を各Webページのアクセス情報をもとに計算する。
図6は、本発明の第1の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ平均滞在時間算出部11によるWebページ群の平均滞在時間の計算結果の一例を表形式で示す図である。
カテゴリ平均滞在時間算出部11が計算する各カテゴリのいずれかに属するWebページ群の平均滞在時間はアクセス情報で示される同一カテゴリに属する各Webページに対する延べアクセス時間の総和と当該カテゴリに属するWebページへの訪問数との商である。ある製品カテゴリに属するWebページ群の平均滞在時間は当該製品カテゴリの下位の各製品カテゴリに属するWebページ群の平均滞在時間の総和である。
また、カテゴリ規模算出部13のURL数カウント部21はカテゴリ情報DB12に記憶されたカテゴリ情報をもとに各カテゴリと対応するWebページ群に属するWebページのURLの数をカウントし、このカウントした数を当該カウントしたURLと対応するカテゴリ情報と関連付けてカテゴリ規模決定部22に出力する。カテゴリ規模決定部22はURL数カウント部21からの情報をもとに各カテゴリに属するWebページ群の規模を示す値を計算する。
ある製品カテゴリに属するWebページ群の規模を示す値は当該製品カテゴリの下位の各製品カテゴリに属するWebページ群の規模を示す値の総和である。
ある製品カテゴリに属するWebページ群の規模を示す値は当該製品カテゴリの下位の各製品カテゴリに属するWebページ群の規模を示す値の総和である。
図7は、本発明の第1の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13による計算結果の一例を表形式で示す図である。
質的評価値補正部14はカテゴリ平均滞在時間算出部11により計算した質的評価値の仮の値とカテゴリ規模算出部13による計算結果とをもとに各カテゴリに属する質的評価値の補正値を計算する。
質的評価値補正部14はカテゴリ平均滞在時間算出部11により計算した質的評価値の仮の値とカテゴリ規模算出部13による計算結果とをもとに各カテゴリに属する質的評価値の補正値を計算する。
一例として、質的評価値補正部14は各カテゴリと対応するWebページ群の平均滞在時間と当該カテゴリに対応するWebページ群に属する各WebページのURL数との商を求めることで各カテゴリと対応するWebページ群の質的評価値の補正値を計算する。ある製品カテゴリに属するWebページ群の質的評価値の補正値は当該製品カテゴリの下位の各製品カテゴリに属するWebページ群の質的評価値の補正値の総和である。
図8は、本発明の第1の実施形態にしたがったWebアクセスログ分析システム1の質的評価値補正部14による計算結果の一例を表形式で示す図である。
以上説明したように本発明の第1の実施形態にしたがったWebアクセスログ分析システムは予め定めた各カテゴリと対応するWebページ群に属する各Webページの質的評価値の仮の値および各カテゴリの規模を示す値をもとにして各カテゴリと対応するWebページ群に属する各Webページの質的評価値の補正値を計算する。つまりこのシステムは各カテゴリの規模を考慮して当該カテゴリと対応するWebページ群の質的評価値を計算する。よって、規模の異なる複数種類のカテゴリとそれぞれ対応するWebページ群の内容の良し悪しの比較にかかる精度を向上させることができる。
以上説明したように本発明の第1の実施形態にしたがったWebアクセスログ分析システムは予め定めた各カテゴリと対応するWebページ群に属する各Webページの質的評価値の仮の値および各カテゴリの規模を示す値をもとにして各カテゴリと対応するWebページ群に属する各Webページの質的評価値の補正値を計算する。つまりこのシステムは各カテゴリの規模を考慮して当該カテゴリと対応するWebページ群の質的評価値を計算する。よって、規模の異なる複数種類のカテゴリとそれぞれ対応するWebページ群の内容の良し悪しの比較にかかる精度を向上させることができる。
ここで例えば各カテゴリとそれぞれ対応するWebページ群の質的評価値の補正値を縦軸にとり、各カテゴリとそれぞれ対応するWebページ群への訪問数やアクセス数といった量的評価値を横軸にとり、規模の異なる第1、第2および第3のカテゴリと対応する点をプロットしたグラフを作成する場合を考える。アクセス数とはカテゴリ情報上の各URLと対応するWebページに対する各ユーザの端末装置によるアクセス数の累計値である。
ここでは第2のカテゴリ“機種A”と対応するWebページ群の量的評価値は第1のカテゴリ“携帯電話”と対応するWebページ群の量的評価値と同等であるが当該第2のカテゴリと対応するWebページ群の質的評価値が第1のカテゴリと対応するWebページ群の質的評価値より低く、第3のカテゴリ“デジタルカメラ”と対応するWebページ群の質的評価値は第1のカテゴリと対応するWebページ群の質的評価値と同等であるが当該第3のカテゴリと対応するWebページ群の量的評価値が第1のカテゴリと対応するWebページ群の量的評価値より低いと仮定する。
図9は、各カテゴリに属するWebページ群の量的評価値および質的評価値の関係を示すグラフの一例を示す図である。
この場合には、第2のカテゴリと対応するWebページ群の認知度は第1のカテゴリと対応するWebページ群の認知度と同等であるが、第2のカテゴリと対応するWebページ群の満足度が第1のカテゴリと対応するWebページ群の満足度より低いことが明らかとなる。
この場合には、第2のカテゴリと対応するWebページ群の認知度は第1のカテゴリと対応するWebページ群の認知度と同等であるが、第2のカテゴリと対応するWebページ群の満足度が第1のカテゴリと対応するWebページ群の満足度より低いことが明らかとなる。
また、第3のカテゴリと対応するWebページ群の満足度は第1のカテゴリと対応するWebページ群の満足度と同等であるが、第3のカテゴリと対応するWebページ群の認知度が第1のカテゴリと対応するWebページ群の認知度より低いことが明らかとなる。
よって、ユーザは例えば第2のカテゴリと対応するWebページ群の文章内容を第1のカテゴリと対応するWebページ群の文章内容を参考に改善したり、第3のカテゴリと対応するWebページ群へのリンクの表示箇所を第1のカテゴリと対応するWebページ群へのリンクの表示箇所を参考に改善したりするなどの見直しを行なうことができる。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。なお、本実施形態に係るWebアクセスログ分析システムの構成は図1に示したものと基本的にほぼ同様であるので同一部分の説明は省略する。
次に、本発明の第2の実施形態について説明する。なお、本実施形態に係るWebアクセスログ分析システムの構成は図1に示したものと基本的にほぼ同様であるので同一部分の説明は省略する。
本発明の第1の実施形態にしたがったWebアクセスログ分析システム1ではカテゴリ規模算出部13は各カテゴリと対応するWebページ群に属するWebページの数をもとに当該Webページ群の規模を計算した。これに対し本発明の第2の実施形態にしたがったWebアクセスログ分析システム1ではカテゴリ規模算出部13は各カテゴリと対応するWebページ群に属する各Webページの情報量をもとに当該Webページ群の規模を計算する。
図10は、本発明の第2の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13の内部構成例を示す図である。
本発明の第2の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13はWebページ取得部31、Webページ蓄積部32、テキスト部分情報量カウント部33およびカテゴリ規模決定部22を備える。
本発明の第2の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13はWebページ取得部31、Webページ蓄積部32、テキスト部分情報量カウント部33およびカテゴリ規模決定部22を備える。
Webページ取得部31はカテゴリ情報DB12に記憶されたカテゴリ情報に基づいて各カテゴリに属するWebページ群の各WebページのデータをWebサーバ2から取得する。
Webページ蓄積部32はWebページ取得部31が取得したデータを一時的に記憶する。テキスト部分情報量カウント部33はWebページ蓄積部32に記憶される各カテゴリに属するWebページ群の各Webページのテキスト部分の情報量をカテゴリ情報DB12に記憶されたカテゴリ情報をもとに計算する。
図11は、本発明の第2の実施形態にしたがったWebアクセスログ分析システム1のテキスト部分情報量カウント部33の内部構成例を示す図である。
本発明の第2の実施形態にしたがったWebアクセスログ分析システム1のテキスト部分情報量カウント部33はテキスト部分抽出部41およびテキスト部分情報量計測部42を備える。
本発明の第2の実施形態にしたがったWebアクセスログ分析システム1のテキスト部分情報量カウント部33はテキスト部分抽出部41およびテキスト部分情報量計測部42を備える。
テキスト部分抽出部41はカテゴリ情報DB12に記憶されたカテゴリ情報をもとにWebページ蓄積部32に記憶される各カテゴリに属するWebページ群の各Webページのテキスト部分のデータを抽出する。テキスト部分情報量計測部42はテキスト部分抽出部41が抽出した各データの情報量を計測する。
次に、本発明の第2の実施形態にしたがったWebアクセスログ分析システム1の処理動作について説明する。このWebアクセスログ分析システム1ではカテゴリ規模算出部13のWebページ取得部31はカテゴリ情報DB12に記憶されたカテゴリ情報で示される各WebページのURLと対応するWebページのデータをWebサーバ2から取得し、これをWebページ蓄積部32に記憶する。
テキスト部分情報量カウント部33のテキスト部分抽出部41はカテゴリ情報DB12に記憶されたカテゴリ情報で示される各WebページのURLと対応するWebページのテキスト部分のデータ例えば拡張子が“html”であるデータをWebページ蓄積部32から取得し、この取得したデータを各データが対応するカテゴリの情報と関連付けてテキスト部分情報量計測部42に出力する。
テキスト部分情報量計測部42はテキスト部分抽出部41が抽出した各データのバイト数を計測し、この計測したバイト数の情報を各ページが対応するカテゴリの情報と関連付けてカテゴリ規模決定部22に出力する。
カテゴリ規模決定部22はテキスト部分抽出部41からの情報をもとに各カテゴリに属するWebページ群の規模を示す値を計算する。テキスト部分抽出部41が計測したバイト数はモニタ表示対象の単語に加え、ヘッダなども含まれる。
カテゴリ規模決定部22はテキスト部分情報量計測部42による計測結果をもとに各カテゴリに属するWebページ群の情報量を計算する。
カテゴリ規模決定部22はテキスト部分情報量計測部42による計測結果をもとに各カテゴリに属するWebページ群の情報量を計算する。
図12は、本発明の第2の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13のカテゴリ規模決定部22による計算結果の一例を表形式で示す図である。
質的評価値補正部14は各カテゴリと対応するWebページ群の平均滞在時間と当該カテゴリに対応するWebページ群に属する各Webページの情報量との商を計算することで各カテゴリと対応するWebページ群の質的評価値の補正値を計算する。
以上説明したように本発明の第2の実施形態にしたがったWebアクセスログ分析システムは各カテゴリと対応するWebページ群に属する各Webページの情報量をもとに当該Webページ群の規模を計算する。これにより、本発明の第2の実施形態にしたがったWebアクセスログ分析システムはWebページ群に属する各Webページの規模を本発明の第1の実施形態にしたがったWebアクセスログ分析システムと比較して精度良く計算することができる。よって、ユーザは規模の異なる複数種類のカテゴリとそれぞれ対応するWebページ群の内容の良し悪しの比較にかかる精度をより向上させることができる。
本発明の第2の実施形態にしたがったWebアクセスログ分析システムのテキスト部分情報量計測部42はテキスト部分抽出部41が取得した各データのバイト数を計測することで各Webページのテキスト部分の情報量を計算したが、これに限らず、各データで示されるモニタ表示対象の単語の数を計測することで各Webページのテキスト部分の情報量を計算してもよい。
この場合、テキスト部分情報量計測部42は例えば日本語のテキストから単語と単語の境界を見つけて単語を抽出することで単語の数の計測する。この計測手法は形態素解析と呼ばれる手法により実現できる。また、テキスト部分が英語の場合にはテキスト部分情報量計測部42はテキスト部分のスペース文字を区切れとして単語を抽出する。
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。なお、本実施形態に係るWebアクセスログ分析システムの構成は図1に示したものと基本的にほぼ同様であるので同一部分の説明は省略する。
次に、本発明の第3の実施形態について説明する。なお、本実施形態に係るWebアクセスログ分析システムの構成は図1に示したものと基本的にほぼ同様であるので同一部分の説明は省略する。
本発明の第2の実施形態にしたがったWebアクセスログ分析システム1ではカテゴリ規模算出部13は各カテゴリと対応するWebページ群に属する各Webページのテキスト部分の情報量をもとに当該Webページ群の規模を計算した。これに対し、本発明の第3の実施形態にしたがったWebアクセスログ分析システム1ではカテゴリ規模算出部13は各カテゴリと対応するWebページ群に属する各Webページのテキスト部分および画像部分の情報量をもとに当該Webページ群の規模を計算する。
図13は、本発明の第3の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13の内部構成例を示す図である。
本発明の第3の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13はWebページ取得部31、Webページ蓄積部32、テキスト部分情報量カウント部33、画像部分情報量カウント部34およびカテゴリ規模決定部22を備える。
本発明の第3の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13はWebページ取得部31、Webページ蓄積部32、テキスト部分情報量カウント部33、画像部分情報量カウント部34およびカテゴリ規模決定部22を備える。
画像部分情報量カウント部34はカテゴリ情報DB12に記憶されたカテゴリ情報をもとに、Webページ蓄積部32に記憶される各カテゴリに属するWebページ群の各Webページの画像部分の情報量を計算する。
図14は、本発明の第3の実施形態にしたがったWebアクセスログ分析システム1の画像部分情報量カウント部34の内部構成例を示す図である。
本発明の第3の実施形態にしたがったWebアクセスログ分析システム1の画像部分情報量カウント部34は画像部分抽出部51および画像部分情報量計測部52を備える。
本発明の第3の実施形態にしたがったWebアクセスログ分析システム1の画像部分情報量カウント部34は画像部分抽出部51および画像部分情報量計測部52を備える。
画像部分抽出部51はカテゴリ情報DB12に記憶されたカテゴリ情報をもとに、Webページ蓄積部32に記憶される各カテゴリに属するWebページ群の各Webページの画像部分のデータを抽出する。画像部分情報量計測部52は画像部分抽出部51が抽出したデータをモニタ表示した場合に現れる文字部分の情報量を計測する。
図15は、本発明の第3の実施形態にしたがったWebアクセスログ分析システム1の画像部分情報量カウント部34の画像部分情報量計測部52の内部構成例を示す図である。
画像部分情報量計測部52は画像部分テキスト変換部61およびテキスト部分情報量計測部62を備える。
画像部分情報量計測部52は画像部分テキスト変換部61およびテキスト部分情報量計測部62を備える。
図16は、本発明の第3の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ情報DB12に記憶されるカテゴリ情報の構成例を表形式で示す図である。
このカテゴリ情報DB12に記憶されるカテゴリ情報上のURLは本発明の第1の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ情報DB12に記憶されるカテゴリ情報上のURLと異なり、カテゴリ情報上で対応付けられる製品カテゴリおよび製品カテゴリと対応するWebページ内の画像ファイルのURLを含む。
このカテゴリ情報DB12に記憶されるカテゴリ情報上のURLは本発明の第1の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ情報DB12に記憶されるカテゴリ情報上のURLと異なり、カテゴリ情報上で対応付けられる製品カテゴリおよび製品カテゴリと対応するWebページ内の画像ファイルのURLを含む。
Webアクセスログ分析システム1のカテゴリ情報DB12に記憶されるカテゴリ情報の構成が図5に示した構成である事にともない、カテゴリ平均滞在時間算出部11は前述した各画像ファイルの延べアクセス時間及び各画像ファイルが属するカテゴリの訪問数をさらに計算する。
図17は、本発明の第3の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ平均滞在時間算出部11による各Webページのアクセス情報の計算結果の一例を表形式で示す図である。
次に、本発明の第3の実施形態にしたがったWebアクセスログ分析システム1の処理動作について説明する。このWebアクセスログ分析システム1では、画像部分情報量カウント部34の画像部分抽出部51はカテゴリ情報DB12に記憶されたカテゴリ情報で示される各WebページのURLと対応するWebページの画像部分データをWebページ蓄積部32から取得し、この取得したデータを各データが対応するカテゴリの情報と関連付けて画像部分情報量計測部52に出力する。
画像部分情報量計測部52は画像部分抽出部51が取得した各データで示される画像に含まれる文字の情報量を計測する。具体的には画像部分情報量計測部52の画像部分テキスト変換部61は画像部分抽出部51が抽出したデータで示される画像に含まれる文字をOCRなどの手法により抽出する。テキスト部分情報量計測部62は画像部分テキスト変換部61が抽出した文字の情報量を計測し、この計測したバイト数の情報を各ページが対応するカテゴリの情報と関連付けてカテゴリ規模決定部22に出力する。
カテゴリ規模決定部22はテキスト部分情報量計測部62による計測結果および画像部分情報量計測部52による計測結果をもとに各カテゴリに属するWebページ群の情報量を計算する。
図18は、本発明の第3の実施形態にしたがったWebアクセスログ分析システム1のカテゴリ規模算出部13のカテゴリ規模決定部22による計算結果の一例を表形式で示す図である。
そして質的評価値補正部14は各カテゴリと対応するWebページ群の平均滞在時間と当該カテゴリと対応するWebページ群に属する各Webページの情報量との商を計算することで各カテゴリと対応するWebページ群の質的評価値の補正値を計算する。
以上説明したように本発明の第3の実施形態にしたがったWebアクセスログ分析システムは各カテゴリと対応するWebページ群に属する各Webページのテキスト部分および画像部分の情報量をもとに当該Webページ群の規模を計算する。これにより、本発明の第3の実施形態にしたがったWebアクセスログ分析システムはWebページ群に属する各Webページの規模を本発明の第2の実施形態にしたがったWebアクセスログ分析システムより精度良く計算することができる。よって、ユーザは規模の異なる複数種類のカテゴリとそれぞれ対応するWebページ群の内容の良し悪しの比較にかかる精度をより向上させることができる。
前述した画像部分情報量計測部52は、画像部分抽出部51が取得した各データで示される画像自体の情報量を計測し、この情報を各ページが対応するカテゴリの情報と関連付けてカテゴリ規模決定部22に出力してもよい。
なお、この発明は、前記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を省略してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
1…Webアクセスログ分析システム、2…Webサーバ、3…WebアクセスログDB、11…カテゴリ平均滞在時間算出部、12…カテゴリ情報DB、13…カテゴリ規模算出部、14…質的評価値補正部、15…分析結果表示部、21…URL数カウント部、22…カテゴリ規模決定部、31…Webページ取得部、32…Webページ蓄積部、33…テキスト部分情報量カウント部、34…画像部分情報量カウント部、41…テキスト部分抽出部、42,62…テキスト部分情報量計測部、51…画像部分抽出部、52…画像部分情報量計測部、61…画像部分テキスト変換部。
Claims (6)
- Webサーバが端末装置に配信するWebページ群に関するログ情報を取得する取得手段と、
前記Webサーバが保持するWebページ群のカテゴリ情報を記憶するカテゴリ情報記憶手段と、
前記取得手段により取得したログ情報をもとに前記Webサーバが前記端末装置に配信したWebページ群の質的評価値を前記カテゴリ情報記憶手段に記憶されるカテゴリ情報で分類される種別ごとに計算する評価値計算手段と、
前記Webページ群の規模を前記カテゴリ情報記憶手段に記憶されるカテゴリ情報で分類される種別ごとに計算する規模計算手段と、
前記評価値計算手段による計算結果および前記規模計算手段による計算結果をもとに前記質的評価値の補正値を計算する補正値計算手段と
を備えたことを特徴とする情報処理装置。 - Webサーバが保持するWebページ群のカテゴリ情報を記憶するカテゴリ情報記憶手段を備えたコンピュータを制御するための情報処理プログラムであって、
前記コンピュータを、
前記Webサーバが端末装置に配信するWebページ群に関するログ情報を取得する取得手段、
この取得手段により取得したログ情報をもとに前記Webサーバが前記端末装置に配信したWebページ群の質的評価値を前記カテゴリ情報記憶手段に記憶されるカテゴリ情報で分類される種別ごとに計算する評価値計算手段、
前記Webページ群の規模を前記カテゴリ情報記憶手段に記憶されるカテゴリ情報で分類される種別ごとに計算する規模計算手段、
前記評価値計算手段による計算結果および前記規模計算手段による計算結果をもとに前記質的評価値の補正値を計算する補正値計算手段
として機能させるようにしたコンピュータ読み取り可能な情報処理プログラム。 - 前記コンピュータを、前記カテゴリ情報記憶手段に記憶されるカテゴリ情報で分類される各種別に属するWebページ群のページ数を計算するページ数計算手段としてさらに機能させ、
前記規模計算手段は、前記ページ数計算手段による計算結果をもとに前記Webページ群の規模を前記カテゴリ情報で分類される種別ごとに計算する請求項2に記載の情報処理プログラム。 - 前記コンピュータを、
前記Webサーバが保持するWebページ群のデータを取得するデータ取得手段、
このデータ取得手段により取得したデータの情報量を検出する情報量検出手段としてさらに機能させ、
前記規模計算手段は、前記情報量検出手段による検出結果をもとに前記Webページ群の規模を前記カテゴリ情報で分類される種別ごとに計算する請求項2に記載の情報処理プログラム。 - 前記カテゴリ情報記憶手段は、前記Webサーバが保持するWebページ群のテキスト部分のカテゴリ情報を記憶し、
前記情報量検出手段は、前記データ取得手段により取得したデータのテキスト部分の情報量を検出する請求項4に記載の情報処理プログラム。 - 前記カテゴリ情報記憶手段は、前記Webサーバが保持するWebページ群の画像部分のカテゴリ情報をさらに記憶し、
前記情報量検出手段は、前記データ取得手段により取得したデータの画像部分の情報量をさらに検出する請求項4に記載の情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006119434A JP2007293520A (ja) | 2006-04-24 | 2006-04-24 | 情報処理装置および情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006119434A JP2007293520A (ja) | 2006-04-24 | 2006-04-24 | 情報処理装置および情報処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007293520A true JP2007293520A (ja) | 2007-11-08 |
Family
ID=38764104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006119434A Withdrawn JP2007293520A (ja) | 2006-04-24 | 2006-04-24 | 情報処理装置および情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007293520A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011048465A (ja) * | 2009-08-25 | 2011-03-10 | Nippon Telegr & Teleph Corp <Ntt> | データ処理装置、そのプログラム、そのプログラムを記憶した記憶媒体及びデータ処理方法 |
JP2013239131A (ja) * | 2012-05-17 | 2013-11-28 | Brother Ind Ltd | プログラムおよび携帯端末 |
JP2015036919A (ja) * | 2013-08-14 | 2015-02-23 | 富士ゼロックス株式会社 | 評価支援システム及びプログラム |
-
2006
- 2006-04-24 JP JP2006119434A patent/JP2007293520A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011048465A (ja) * | 2009-08-25 | 2011-03-10 | Nippon Telegr & Teleph Corp <Ntt> | データ処理装置、そのプログラム、そのプログラムを記憶した記憶媒体及びデータ処理方法 |
JP2013239131A (ja) * | 2012-05-17 | 2013-11-28 | Brother Ind Ltd | プログラムおよび携帯端末 |
JP2015036919A (ja) * | 2013-08-14 | 2015-02-23 | 富士ゼロックス株式会社 | 評価支援システム及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5632574B2 (ja) | ニュース記事のランク付けを向上させるためのシステムおよび方法 | |
US8160985B2 (en) | Web server system | |
AU2015230772A1 (en) | Methods and apparatus to share online media impressions data | |
US20050034065A1 (en) | Method and apparatus for processing content | |
CN102932206B (zh) | 监测网站访问信息的方法和系统 | |
CN108304410A (zh) | 一种异常访问页面的检测方法、装置及数据分析方法 | |
JP6721057B2 (ja) | 通信セッションログ解析装置、方法 | |
US20130305131A1 (en) | Method, system and computer storage medium for pre-reading network data | |
CN103544150A (zh) | 为移动终端浏览器提供推荐信息的方法及系统 | |
CN116015842A (zh) | 一种基于用户访问行为的网络攻击检测方法 | |
US20160034915A1 (en) | Document performance indicators based on referral context | |
CN106354622A (zh) | 测试网页的展示方法和装置 | |
CN102841922B (zh) | 数据采集方法及装置 | |
JP2007293520A (ja) | 情報処理装置および情報処理プログラム | |
CN105786858A (zh) | 信息搜索系统及方法 | |
CN110110219B (zh) | 根据网络行为确定用户偏好的方法及装置 | |
CN107526748A (zh) | 一种识别用户点击行为的方法和设备 | |
JP5466133B2 (ja) | 画像付文書検索装置及び画像付文書検索プログラム | |
US10171602B2 (en) | Determining device counts | |
JP2001209655A (ja) | 情報提供装置、情報更新方法、情報提供プログラムを記録した記録媒体、及び情報提供システム | |
CN110263082B (zh) | 数据库的数据分布分析方法、装置、电子设备及存储介质 | |
WO2010045848A1 (zh) | 一种数据显示的方法及装置 | |
US6704783B1 (en) | Reference state output system, reference state output method, and computer readable medium on which reference state output program is recorded | |
KR20090003853A (ko) | 룰을 이용한 실시간 자동 정보 추출 시스템 및 방법 | |
CN113723720B (zh) | 页面浏览质量评估方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20090707 |