JP2004110123A - ハイパーテキスト解析方法、解析プログラム及びその装置 - Google Patents
ハイパーテキスト解析方法、解析プログラム及びその装置 Download PDFInfo
- Publication number
- JP2004110123A JP2004110123A JP2002268268A JP2002268268A JP2004110123A JP 2004110123 A JP2004110123 A JP 2004110123A JP 2002268268 A JP2002268268 A JP 2002268268A JP 2002268268 A JP2002268268 A JP 2002268268A JP 2004110123 A JP2004110123 A JP 2004110123A
- Authority
- JP
- Japan
- Prior art keywords
- page
- hypertext
- sessions
- category
- accessed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3447—Performance evaluation by modeling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/875—Monitoring of systems including the internet
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/88—Monitoring involving counting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【課題】ハイパーテキスト3のページ構成を的確に評価及び解析する。
【解決手段】ハイパーテキスト3の各ページ2ヘのアクセス履歴情報4を取込み、1つ又は複数のページを目的ページと設定し、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッション14に分割し、セッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成し、セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する。さらに、ページ毎に、セッション数と成功率とを計算し、各ページをセッション数及び成功率をパラメータとして直交座標にグラフィック表示する。
【選択図】 図1
【解決手段】ハイパーテキスト3の各ページ2ヘのアクセス履歴情報4を取込み、1つ又は複数のページを目的ページと設定し、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッション14に分割し、セッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成し、セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する。さらに、ページ毎に、セッション数と成功率とを計算し、各ページをセッション数及び成功率をパラメータとして直交座標にグラフィック表示する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析方法、ハイパーテキスト解析プログラム、及びハイパーテキスト解析装置に関する。
【0002】
【従来の技術】
例えば、不特定多数の人がアクセス可能なインターネットに接続されたWebサーバ等のネットワークサーバ上に、複数のページが互いにリンクされたハイパーテキストを構築して、外部の人(訪問者)がハイパーテキストの各ページを任意に閲覧可能にしたシステムが実用化されている。
【0003】
このようなハイパーテキストの各ページにおいては、このページの訪問者が関連する次のページへリンク先を指定した複数のアイコンあるいはアンカーが配設されている。そして、このハイパーテキストが企業案内のホームページや通信販売のホームページ等であった場合においては、このホームページをアクセスする訪問者(顧客)にとって、必要とする情報が記載された各ページまでいかに効率的に遷移させ、表示させるが課題となる。
【0004】
したがって、実際にネットワークサーバ上に構築されたハイパーテキストの各ページがどのような手順で訪問者(顧客)によってアクセスされているかを解析することは、非常に重要なことである。
【0005】
従来、このハイパーテキストの解析方法として、特開2001−66981号公報に「ハイパーテキスト解析装置および方法」が開示されている。この特開2001−166981号公報に開示されている「ハイパーテキスト解析装置および方法」においては、ハイパーテキストを構成する任意のページ組について、ページ内容から抽出される様々な属性とページ間遷移頻度との相関を予め計算しておき、あるページ間の遷移頻度を上げたい場合にどの属生を変化させれば良いかを表示することを提案している。
【0006】
また、任意のページ組について、ページ内容から抽出される様々な属性とページ間アクセス類似度(訪問者が双方のページをアクセスした度合い)との相関を予め計算しておき、あるページ間のアクセス類似度を上げたい場合にどの属性を変化させれば良いかを表示することを提案している。
【0007】
これらによって、ハイパーテキスト管理者はページ間の遷移頻度を上げるように、あるいはページ間のアクセス類似度を上げるようにページ内容を変更することができる。
【0008】
【発明が解決しようとする課題】
しかしながら、特開2001−166981号公報に開示されている「ハイパーテキスト解析装置および方法」においても、まだ、解決すべき次のような課題があった。
【0009】
すなわち、特開2001−166981号公報においては、ページとページの間の遷移頻度、あるいはアクセス類似度を上げるための方法を問題にしているが、実際のハイパーテキストでどのページ間の遷移頻度、あるいはアクセス類似度を上げればよいのか、その方針は示されていない。
【0010】
また、インターネット上で企業が運営しているWebサーバのハイパーテキストでは、このホームページをアクセスした訪問者(顧客)を商品購買、資料請求、問合せなどの目的ページに導き、ビジネスチャンスを増やすことを目的としているが、特開2001−166981号公報においては、訪問者をどのような経路で目的ページまで導けば良いのかが示されていないため、どのページ間の遷移頻度、アクセス類似度を上げれば良いのかが分からない問題がある。
【0011】
本発明はこのような事情に鑑みてなされたものであり、ハイパーテキストの各ページへのアクセス履歴情報から目的ページ又は目的カテゴリへ遷移するセッションを選別することにより、訪問者(アクセス者)を商品購買、資料請求、問合せなどの目的ページ又は目的カテゴリに導き、ビジネスチャンスを増やすことができるようにページ間のリンク構成やページ内容の改善を支援することができるハイパーテキスト解析方法、ハイパーテキスト解析プログラム、及びハイパーテキスト解析装置を提供することを目的とする。
【0012】
【課題を解決するための手段】
上記課題を解消するために、第1の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析方法において、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、ハイパーテキストを構成する複数ページの中から指定された1つ又は複数のページを目的ページと設定する工程と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、分割されたセッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成してメモリに記憶する工程と、セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、ハイパーテキストを構成するページ毎に、そのページをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に各ページをプロットしたグラフを作成し、このグラフを解析結果として出力する工程とを備えている。
【0013】
なお、この発明のハイパーテキスト解析方法におけるセッションとはハイパーテキストの各ページに対する一人の訪問者(アクセス者)による一連のアクセスを示す。訪問者(アクセス者)はこの訪問者が利用する計算機のIPアドレスなどにより識別され、ハイパーテキストのページへ連続してアクセスすると、それが一つのセッションになり、一定時間以上アクセスされないと、そこでセッションが終了する。すなわち、ネットワークサーバから取込まれたアクセス履歴情報は複数のセッションに分割される。
【0014】
セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定される。そして、最終的に、各ページが、直交座標上に、セッション数、成功率を各軸におけるパラメータとして、グラフィック表示される。
【0015】
したがって、この解析結果を参照して、グラフ上でアクセス頻度が低い、すなわちセッション数が小さいページは、アクセス頻度が高くなるように、また、成功率が低いページは成功率が高くなるように、ページ間のリンク構成やページ内容を改善することができる。
【0016】
成功率の低いページでは、例えば訪問者(アクセス者)がそのページから外部へ出て行くことが多い場合には、訪問者が一つ前に訪問したページを見て抱いていた期待とそのページの内容が合ってないことが考えられるので、ページ内容、あるいは一つ前に訪問したページの説明文の見直しが必要である。
【0017】
また、そのページからハイパーテキスト内部の成功率が低いページヘの遷移が多い場合は、リンク説明を見直すか、あるいは別の成功率の高いページヘの遷移数が増えるようにページ内容を見直す必要がある。
【0018】
成功率は高いがアクセス頻度が低いページでは、そのページヘのアクセスを増加させるために、そのページヘの例えばアイコンで示すリンクを目立つようにすることや、アクセス頻度の高いページからリンクを張ることによって訪問者が訪れるように改善する。
【0019】
すなわち、グラフのセッション数(アクセス頻度)、成功率が共に高い領域にページがプロットされるようにページ内容やリンク構成を修正すればよい。
【0020】
第2の発明は、上述した発明のハイパーテキスト解析方法において、セッション数と成功率とを計算する工程において、成功のセッションを、目的ページをアクセスするまでのページ列のみとする。
【0021】
このように構成されたハイパーテキスト解析方法においては、セッションの目的ページを訪問した後に遷移するページ列を「成功」のセッション数を数える対象から外すことができ、成功率の意味が、そのページに遷移した場合に、その後、目的ページに達する確率になる。したがって、このハイパーテキストの管理者が、表示された解析結果を参照してページ内容やリンク構成を修正する場合に、より正確に支援を行うことができる。
【0022】
第3の発明は、上述した発明のハイパーテキスト解析方法において、グラフを解析結果として表示する工程において、所定頻度以上のページ間アクセスが生じたページ相互間に有向線を表示する。
【0023】
このように構成されたハイパーテキスト解析方法においては、グラフ上で所定頻度以上のページ間アクセスが生じた各ページがより簡単に把握できるので、ハイパーテキストの管理者が、表示された解析結果を参照してページ内容やリンク構成を修正する場合に、より的確に解析結果を利用できる。
【0024】
第4の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析方法において、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、ハイパーテキストを構成する各ページを複数のカテゴリに分類する工程と、複数のカテゴリの中から指定された1つ又は複数のカテゴリを目的カテゴリと設定する工程と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、分割されたセッション毎に、該当セッションに含まれる各ページに対応するカテゴリにおける遷移した順のカテゴリ列を生成してメモリに記憶する工程と、セッション毎に、目的カテゴリをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、ハイパーテキストを構成するページに対応するカテゴリ毎に、そのカテゴリをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に各カテゴリをプロットしたグラフを作成し、このグラフを解析結果として出力する工程とを備えている。
【0025】
この第4の発明のハイパーテキスト解析方法は、第1の発明のハイパーテキスト解析方法に対して、ハイパーテキストのページをカテゴリ分類する工程が付加され、カテゴリ単位で分析を行う点が異なる。
【0026】
すなわち、解析すべきハイパーテキストのページ数が多い場合には、ページ単位の解析を行うには膨大な計算機資源や時間を要してしまう問題がある。そこで、この第4の発明を利用すれば、ページをカテゴリ分類し、カテゴリ単位で解析することができるので、膨大な計算機資源や時間を要してしまう問題が解決する。
【0027】
また、ハイパーテキストの管理者が、表示された解析結果を参照してページ内容やリンク構成を修正する場合に、ページ単位の解析結果では多くのページの関連を理解することは困難であるが、カテゴリ単位の解析結果では理解し易くなる。
【0028】
第5の発明は、上述した発明のハイパーテキスト解析方法のセッション数と成功率とを計算する工程において、成功のセッションを、目的カテゴリをアクセスするまでのカテゴリ列のみとする。
【0029】
このように構成されたハイパーテキスト解析方法においては、前述した第2の発明のハイパーテキスト解析方法とほぼ同じ作用効果が得られる。
【0030】
第6の発明は、上述した発明のハイパーテキスト解析方法のグラフを解析結果として表示する工程において、所定頻度以上のカテゴリ間アクセスが生じたカテゴリ相互間に有向線を表示する。
【0031】
このように構成されたハイパーテキスト解析方法においては、前述した第3の発明のハイパーテキスト解析方法とほぼ同じ作用効果が得られる。
【0032】
第7の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析プログラムである。そして、このハイパーテキスト解析プログラムにおいては、コンピュータに、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、ハイパーテキストを構成する複数ページの中から指定された1つ又は複数のページを目的ページと設定する工程と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、分割されたセッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成してメモリに記憶する工程と、セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、ハイパーテキストを構成するページ毎に、そのページをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に各ページをプロットしたグラフを作成し、このグラフを解析結果として出力する工程とを実行させる。
【0033】
このように構成されたハイパーテキスト解析プログラムにおいても、前述した第1の発明のハイパーテキスト解析方法とほぼ同じ作用効果を奏することができる。
【0034】
第8の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析プログラムである。そして、このハイパーテキスト解析プログラムにおいては、コンピュータに、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、ハイパーテキストを構成する各ページを複数のカテゴリに分類する工程と、複数のカテゴリの中から指定された1つ又は複数のカテゴリを目的カテゴリと設定する工程と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、分割されたセッション毎に、該当セッションに含まれる各ページに対応するカテゴリにおける遷移した順のカテゴリ列を生成してメモリに記憶する工程と、セッション毎に、目的カテゴリをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、ハイパーテキストを構成するページに対応するカテゴリ毎に、そのカテゴリをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各カテゴリをプロットしたグラフを作成し、このグラフを解析結果として出力する工程とを実行させる。
【0035】
このように構成されたハイパーテキスト解析プログラムにおいても、前述した第4の発明のハイパーテキスト解析方法とほぼ同じ作用効果を奏することができる。
【0036】
第9の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析装置である。そして、このハイパーテキスト解析装置においては、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む手段と、ハイパーテキストを構成する複数ページの中から指定された1つ又は複数のページを目的ページと設定する手段と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する手段と、分割されたセッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成する手段と、セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する手段と、ハイパーテキストを構成するページ毎に、そのページをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する手段と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各ページをプロットしたグラフを作成し、このグラフを解析結果として出力する手段とを備えている。
【0037】
このように構成されたハイパーテキスト解析装置においても、前述した第1の発明のハイパーテキスト解析方法とほぼ同じ作用効果を奏することができる。
【0038】
第10の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析装置である。そして、このハイパーテキスト解析装置においては、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む手段と、ハイパーテキストを構成する各ページを複数のカテゴリに分類する手段と、複数のカテゴリの中から指定された1つ又は複数のカテゴリを目的カテゴリと設定する手段と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する手段と、分割されたセッション毎に、該当セッションに含まれる各ページに対応するカテゴリにおける遷移した順のカテゴリ列を生成する手段と、セッション毎に、目的カテゴリをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する手段と、ハイパーテキストを構成するページに対応するカテゴリ毎に、そのカテゴリをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する手段と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に各カテゴリをプロットしたグラフを作成し、このグラフを解析結果として出力する手段とを備えている。
【0039】
このように構成されたハイパーテキスト解析装置においても、前述した第4の発明のハイパーテキスト解析方法とほぼ同じ作用効果を奏することができる。
【0040】
【発明の実施の形態】
以下、本発明の各実施形態を図面を用いて説明する。
(第1実施形態)
図1は本発明の第1実施形態に係るハイパーテキスト解析方法が適用されかつハイパーテキスト解析プログラムが組込まれたハイパーテキスト解析装置の概略構成を示すブロック図である。
【0041】
図示しないインターネットに接続されたネットワークサーバとしてのWebサーバ1内に、複数のページ2が互いにリンクされたハイパーテキスト3が構築されている。そして、任意の人は、インターネットに接続された自己の計算機でインターネットを介してWebサーバ1内に構築されたハイパーテキスト3の各ページ2をアクセス(訪問)することが可能である。
【0042】
そして、任意の人が各ページ2をアクセス(訪問)すると、該当ページを特定するページ番号又は該当ページのURLと、アクセス(訪問)時刻と、アクセス者(訪問者)を特定するアクセス者の計算機のIPアドレスとが時系列的にログファイル5に書込まれる。すなわち、ログファイル5内には、ハイパーテキスト3の各ページ2へのアクセス履歴情報4が蓄積される。
【0043】
このWebサーバ1に接続されたコンピュータからなるハイパーテキスト解析装置6内には、アプリケーションプログラム上に構成された、入力部7、目的ページ設定部8、セッション生成部9、遷移ページ列生成部10、判定部11、到達回数/成功率計算部12が設けられている。さらに、ハイパーテキスト解析装置6内には表示部13が組込まれている。
【0044】
入力部7はWebサーバ1のログファイル5に蓄積されているアクセス履歴情報4を取込み、目的ページ設定部8及びセッション生成部9へ送出する。
【0045】
目的ページ設定部8は、アクセス履歴情報4に含まれる、すなわち、ハイパーテキスト3に含まれる複数のページ2のうち、このハイパーテキスト解析装置6の操作者(管理者)が操作指定した訪問者(アクセス者)に訪問(アクセス)させたいページ2を目的ページと設定して判定部11へ送出する。
【0046】
セッション生成部9は、入力されたアクセス履歴情報4を各ページ2に対する一人の訪問者(アクセス者)による一連のアクセスを示す複数のセッションに分割して、遷移ページ列生成部10へ送出する。なお、訪問者(アクセス者)は前述したように、訪問者(アクセス者)が利用する計算機のIPアドレスなどにより識別される。
【0047】
遷移ページ列生成部10はセッション生成部9から入力された各セッションに遷移順のページ列を組込んで一旦メモリへ書込んだ後、判定部11へ送出する。図3に、遷移順のページ列が組込まれた状態の各セッション14を示す。図示するように、各セッション14は、連続してアクセスされた複数のページ2が遷移順(アクセス順)に組込まれている。
【0048】
判定部11は遷移ページ列生成部10から送信されたセッション14毎の遷移順ページ列と、目的ページ設定部8から送信された目的ページとを照合し、各セッション14内に目的ページが含まれているか否かを調べ、目的ページが含まれているセッション14は成功、目的ページが含まれていないセッション14は失敗と判定する。そして、判定部11はセッション14毎の遷移順ページ列と判定結果とを到達回数/成功率計算部12へに送出する。
【0049】
到達回数/成功率計算部12は、ハイパーテキスト3の各ページ2について、そのページ2を通った(アクセスされた)セッション14の数と、そのうち「成功」と判定されたセッション14の数とを数え、アクセスされたセッション数のうち成功のセッション数の割合である成功率を計算する。そしてセッション14毎の遷移順ページ列と成功率との情報を表示部13へ送出する。
【0050】
なお、各ページ2の成功率を計算する過程で、成功と判定されたセッション14を、目的ページをアクセスするまでのページ列のみと限定することも可能である。
【0051】
このように、成功と判定されたセッション14のページ列を、目的ページをアクセスするまでのページ列のみと限定することにより、目的ページを通り過ぎた後に遷移(アクセス)されるページ2の成功率に対する影響を排除でき、成功率の精度を向上できる。
【0052】
表示部13は、図4に示すように、横軸にページを通ったセッション数を示し、縦軸に成功率を示す直交座標に各ページ2をプロットしたグラフを作成して解析結果として表示する。
【0053】
ハイパーテキスト3の管理者は、表示部13に表示された解析結果のグラフを参照して、ハイパーテキスト3のページ2間のリンク構成やページ内容を改善することができる。
【0054】
次に、このように構成されたハイパーテキスト解析装置6における具体的処理手順を図2の流れ図を用いて説明する。
【0055】
まず、Webサーバ1に記憶されたアクセス履歴情報4が入力部7によって取り込まれ、セッション生成部9及び目的ページ設定部8へ送出される(ステップS1)。目的ページ設定部8ではハイパーテキスト3における各ページ2のうちの訪問者に訪問させたいページ2が目的ページに設定され、判定部11へ送出される(ステップS2)。
【0056】
セッション生成部9では、入力されたアクセス履歴情報4が各ページ2に対する一人の訪問者(アクセス者)による一連のアクセスを示す複数のセッションに分割されて、遷移ページ列生成部10へ送出する(ステップS3)。
【0057】
遷移ページ列生成部10においてはセッション生成部9から入力された各セッション14に遷移順のページ列が組込まれ判定部11へ送出される(ステップS4)。判定部11においては、セッション14毎の遷移順ページ列と、目的ページが照合され、目的ページが含まれているセッション14は成功、目的ページが含まれていないセッション14は失敗と判定され、判定結果が到達回数/成功率計算部12へ送出される(ステップS5)。
【0058】
到達回数/成功率計算部12では、ハイパーテキスト3におけるページ2毎に、そのページ2を通ったセッション14の数と、成功率とが計算され、表示部13へ送出される(ステップS6)。表示部13では横軸にページ2を通ったセッション数、縦軸に成功率をとり、各ページ2を直交座標上にプロットした解析結果のグラフが表示される(ステップS7)。
【0059】
次に、このように構成された第1実施形態のハイパーテキスト解析装置6を用いて実際にWebサーバ1上に構築されたハイパーテキスト3を解析した場合の解析結果を図4を用いて説明する。
【0060】
この例においては、インターネットを用いて各商品の通信販売を実施するための互いにリンクされた複数のページ2からなるハイパーテキスト3に適用される。したがって、最終的に訪問者(アクセス者=顧客)が商品の購入を指示するためのページ2が目的ページとなる。
【0061】
図4の解析結果のグラフにおいて、円がページ2を示し、円の横の数字がページ2を特定するページ番号を示す。さらに、横軸が各ページ2を通るセッション14の数であり、縦軸が各ページ2を通るセッション14のうち目的ページを通る成功のセッション14の割合を示す成功率である。さらに、グラフ上のページ2相互間を接続する有向線15は、一定値以上の頻度を有するページ間遷移(ページ間アクセス)を表している。
【0062】
このように、一定値以上の頻度を有するページ間遷移を示す有向線15を表示することによって、この解析結果を参照するハイパーテキスト3の管理者は、各ページ2間の遷移(ページ間アクセス)の量の大小を一瞥して理解できる。
【0063】
さらに、入口は外から訪問者がこのハイパーテキスト3をアクセス開始したことを示し、出口は訪問者がこのハイパーテキスト3に対するアクセスを終了したことを示す。したがって、入口、出口のセッション数は最大値を示す。
【0064】
この解析結果においては、ページ番号483のページ2が目的ページである。したがって、このページ2を通るセッション14は必ず成功になり、ページ番号483のページ2の成功率は100%になる。
【0065】
ハイパーテキスト3の管理者は、この図4の解析結果を参照して、ハイパーテキスト3を構成する各ページ2の内容やリンク構成を変更する。例えば、51番のページ2から目的ページである483番のページ2へ遷移する場合もあるが、多くのセッション14は51番のページ2から55番のページ2へ遷移している場合、51番のページ2から483番のページ2へ遷移しやすくするようにリンク構造を変更することが考えられる。また、715番のページ2から出口に遷移するセッション14が多い場合、715番のページ2から16番のページ2へ遷移するようにページ内容を変更することが考えられる。
【0066】
図5は、ハイパーテキスト3の管理者が51番のページ2と715番のページ2の内容を変更して、Webサーバ1を一定期間稼働したのちに、ハイパーテキスト3を再度解析した場合における解析結果のグラフである。
【0067】
この解析結果によると、51番のページ2から55番のページ2への遷移が減少し、483番のページ2への遷移が増加することにより、51番のページ2の成功率が増加し、また、483番のページ2(目的ページ)のセッション数が増加していることが理解できる。
【0068】
また、715番のページ2の内容を変えることにより、出口への遷移が減少し、16番のページ2に戻る遷移が増加することにより、715番のページ2の成功率が増加している。
【0069】
このように、ハイパーテキスト3の管理者は、ハイパーテキスト3に対する図4に示す解析結果を参照して、各ページ2のセッション数、成功率、主な遷移先ページを考慮し、ページ内容、リンク構成を修正することにより、各ページ2のアクセス頻度や成功率を上げることができ、また目的ページのアクセス頻度(セッション数)を高めることができ、ビジネスチャンスを大幅に増加することができる。
【0070】
(第2実施形態)
図6は本発明の第2実施形態に係るハイパーテキスト解析方法が適用されかつハイパーテキスト解析プログラムが組込まれたハイパーテキスト解析装置6aの概略構成を示すブロック図である。図1に示す第1実施形態のハイパーテキスト解析装置6と同一部分には同一が付されており、重複する部分の詳細説明は省略されている。
【0071】
図6において、Webサーバ1の構成は図1に示すWebサーバ1と同一構成である。そして、この第2実施形態のコンピュータからなるハイパーテキスト解析装置6a内には、アプリケーションプログラム上に構成された、入力部7、カテゴリ設定部16、目的カテゴリ設定部8a、セッション生成部9、遷移カテゴリ列生成部10a、判定部11a、到達回数/成功率計算部12aが設けられている。さらに、ハイパーテキスト解析装置6a内にはカテゴリファイル17及び表示部13aが組込まれている。
【0072】
カテゴリファイル17内には、ハイパーテキスト3を構成する各ページ2を複数のカテゴリ(種別)に分類する場合における各カテゴリ(種別)が記憶されている。例えば、ハイパーテキスト3が通信販売目的のハイパーテキストの場合、各ページ2のカテゴリ(種別)として、「商品購入」、「商品情報」、「購入ガイド」、…等が記憶されている。
【0073】
入力部7はWebサーバ1のログファイル5に蓄積されているアクセス履歴情報4を取込み、カテゴリ設定部16及びセッション生成部9へ送出する。
【0074】
カテゴリ設定部16は、入力部7を介して入力されたアクセス履歴情報4に含まれる、すなわち、ハイパーテキスト3に含まれる各ページ2がカテゴリファイル17に記憶されたどのカテゴリに所属するかを、このハイパーテキスト解析装置6の操作者(管理者)の操作指定にて判断して、図8(a)に示すように、各ページ2に対して対応するカテゴリ18を付加した形式で、遷移カテゴリ列生成部10aへ送出する。さらに、カテゴリ設定部16は設定した各カテゴリ18を目的カテゴリ設定部8aへ送出する。
【0075】
目的カテゴリ設定部8aは、入力された複数のカテゴリ18のうち、このハイパーテキスト解析装置6の操作者(管理者)が操作指定した訪問者(アクセス者)に訪問(アクセス)させたいカテゴリ18を目的カテゴリと設定して判定部11aへ送出する。
【0076】
セッション生成部9は、入力されたアクセス履歴情報4を各ページ2に対する一人の訪問者(アクセス者)による一連のアクセスを示す複数のセッションに分割して、遷移カテゴリ列生成部10aへ送出する。
【0077】
遷移カテゴリ列生成部10aはセッション生成部9から入力された各セッションに遷移順のカテゴリ列を組込んで一旦メモリへ書込んだ後、判定部11aへ送出する。図8(b)に、遷移順のカテゴリ列が組込まれた状態のセッション14aを示す。図示するように、セッション14aは、図3に示すセッション14における各ページ2を対応するカテゴリ18に置き換えたものである。
【0078】
判定部11aは遷移カテゴリ列生成部10aから送信されたセッション14a毎の遷移順カテゴリ列と、目的カテゴリ設定部8aから送信された目的カテゴリとを照合し、各セッション14a内に目的カテゴリが含まれているか否かを調べ、目的カテゴリが含まれているセッション14aは成功、目的カテゴリが含まれていないセッション14aは失敗と判定する。そして、判定部11aはセッション14a毎の遷移順カテゴリ列と判定結果とを到達回数/成功率計算部12aへに送出する。
【0079】
到達回数/成功率計算部12aは、各ページ2対応する各カテゴリ18について、そのカテゴリ18を通った(アクセスされた)セッション14aの数と、そのうち「成功」と判定されたセッション14aの数とを数え、アクセスされたセッション数のうち成功のセッション数の割合である成功率を計算する。そしてセッション14a毎の遷移順カテゴリ列と成功率との情報を表示部13aへ送出する。
【0080】
なお、各カテゴリ18の成功率を計算する過程で、成功と判定されたセッション14aを、目的カテゴリをアクセスするまでのカテゴリ列のみと限定することも可能である。
【0081】
表示部13aは、図9に示すように、横軸にカテゴリを通ったセッション数を示し、縦軸に成功率を示す直交座標に各カテゴリ18をプロットしたグラフを作成して解析結果として表示する。
【0082】
ハイパーテキスト3の管理者は、表示部13aに表示された解析結果のグラフを参照して、ハイパーテキスト3の各カテゴリ18に対応する各ページ2間のリンク構成やページ内容を改善することができる。
【0083】
次に、このように構成されたハイパーテキスト解析装置6aにおける具体的処理手順を図7の流れ図を用いて説明する。
【0084】
まず、Webサーバ1に記憶されたアクセス履歴情報4が入力部7によって取り込まれ、セッション生成部9及びカテゴリ設定部16へ送出される(ステップP1)。カテゴリ設定部16では、入力した各ページ2に対応するカテゴリ18が付されて遷移カテゴリ列生成部10aへ送出されるとともに、設定した各カテゴリ18が目的カテゴリ設定部8aへ送出される(ステップP2)。
【0085】
目的カテゴリ設定部8aでは入力された各カテゴリ18のうちの訪問者に訪問させたいカテゴリ18が目的カテゴリに設定され、判定部11aへ送出される(ステップP3)。
【0086】
セッション生成部9では、入力されたアクセス履歴情報4が各ページ2に対する一人の訪問者(アクセス者)による一連のアクセスを示す複数のセッションに分割されて、遷移カテゴリ列生成部10aへ送出する(ステップP4)。
【0087】
遷移カテゴリ列生成部10aは、セッション生成部9から入力された各セッションの各ページ2を、カテゴリ設定部16から送付された対応するカテゴリ18に置き換えた、遷移順のカテゴリ列を生成して、図8(b)に示すセッション14aとして判定部11aへ送出する(ステップP5)。
【0088】
判定部11aにおいては、セッション14a毎の遷移順カテゴリ列と、目的カテゴリが照合され、目的カテゴリが含まれているセッション14aは成功、目的カテゴリが含まれていないセッション14aは失敗と判定され、判定結果が到達回数/成功率計算部12aへ送出される(ステップP6)。
【0089】
到達回数/成功率計算部12aでは、カテゴリ18毎に、そのカテゴリ18を通ったセッション14aの数と、成功率が計算され、表示部13aへ送出される(ステップP7)。表示部13aでは横軸にカテゴリ18を通ったセッション数、縦軸に成功率をとり、各カテゴリ18を直交座標上にプロットした解析結果のグラフが表示される(ステップP8)。
【0090】
次に、このように構成された第2実施形態のハイパーテキスト解析装置6aを用いて実際にWebサーバ1上に構築されたハイパーテキスト3を解析した場合の解析結果を図9を用いて説明する。
【0091】
この例においては、インターネットを用いて各商品の通信販売を実施するための互いにリンクされた複数のページ2からなるハイパーテキスト3に適用される。したがって、最終的に訪問者(アクセス者=顧客)が商品の購入を指示するためのページ2に対応する「商品購入」のカテゴリ18が目的カテゴリとなる。
【0092】
この通信販売のハイパーテキスト3の各ページ2は、上述した「商品購入」のカテゴリ18の他に、「購入ガイド」、「商品情報」、「新製品」、「問い合わせ」、「アンケート」、「ホーム」、「サービス」、「ダウンロード」、「お知らせ」、「企業紹介」等のカテゴリ18に分類される。
【0093】
図9の解析結果のグラフにおいて、正方形がカテゴリ18を示し、正方形の横の文字がカテゴリ名を示す。さらに、横軸が各カテゴリ18を通るセッション14aの数であり、縦軸が各カテゴリ18を通るセッション14aのうち目的カテゴリを通る成功のセッション14aの割合を示す成功率である。さらに、グラフ上のカテゴリ18相互間を接続する有向線15aは、一定値以上の頻度を有するカテゴリ間遷移(カテゴリ間アクセス)を表している。
【0094】
さらに、入口は外から訪問者がこのハイパーテキスト3にアクセス開始したことを示し、出口は訪問者がこのハイパーテキスト3に対するアクセスを終了したことを示す。したがって、入口、出口のセッション数は最大値を示す。
【0095】
この解析結果においては、商品購入のカテゴリ18が目的カテゴリある。したがって、このカテゴリ18を通るセッション14aは必ず成功になり、商品購入のカテゴリ18の成功率は100%になる。
【0096】
ハイパーテキスト3の管理者は、この図9の解析結果を参照して、ハイパーテキスト3を構成する各ページ2の内容やリンク構成を変更する。例えば、「新製品」のカテゴリ18から「商品情報」のカテゴリ18に遷移すると目的カテゴリである「商品購入」のカテゴリ18へ遷移する確率が高くなるが、「新製品」のカテゴリ18から「ダウンロード」のカテゴリ18へ遷移すると、成功率は低下している。
【0097】
よって「新製品」のカテゴリ18から「商品情報」のカテゴリ18へ遷移しやすくするようにリンク構造を変更することが考えられる。また、「ホーム」のカテゴリ18から「お知らせ」のカテゴリ18に遷移し、出口に遷移する場合が多いので、「お知らせ」のカテゴリ18のページ内容を変更することが考えられる。
【0098】
図10は、ハイパーテキスト3の管理者が、「新製品」のカテゴリ18に対応するページ2の内容と「お知らせ」のカテゴリ18に対応するページ2の内容とを変更して、Webサーバ1を一定期間稼働したのちに、ハイパーテキスト3を再度解析した場合における解析結果のグラフである。
【0099】
この解析結果によると、「新製品」のカテゴリ18から「ダウンロード」のカテゴリ18ヘの遷移が減少し、「商品情報」のカテゴリ18ヘの遷移が増加することにより「新製品」のカテゴリ18の成功率が増加し、「商品購入」のカテゴリ18ヘのセッション数が増加していることが理解できる。
【0100】
また、「お知らせ」のカテゴリ18に対応するページ2の内容を変えることにより、出口への遷移が減少し、「ホーム」のカテゴリ18に戻る遷移が増加することにより、「お知らせ」のカテゴリ18の成功率が増加している。
【0101】
このように、ハイパーテキスト3の管理者は、ハイパーテキスト3に対する図9に示す解析結果を参照して、各カテゴリ18のセッション数、成功率、主な遷移先カテゴリを考慮し、各カテゴリ18を構成している各ページ2のページ内容、リンク構成を修正することにより、各カテゴリ18のアクセス頻度や成功率を上げることができ、また目的カテゴリのアクセス頻度(セッション数)を高めることができ、ビジネスチャンスを増加することができる。
【0102】
さらに、この第2実施形態のハイパーテキスト解析装置6aにおいては、ハイパーテキスト3を構成する多くのページ2を代表的な複数のカテゴリ18に分類して、この代表的な複数のカテゴリ18に対するアクセス履歴でもって、ハイパーテキスト3を解析して、図9に示すように、解析結果をグラフィック表示している。
【0103】
したがって、ハイパーテキスト3の管理者にとって、表示された解析結果を参照してページ内容やリンク構成を修正する場合に、解析結果をカテゴリ単位で把握でき、修正作業の効率を向上できる。さらに、ページ2をカテゴリ18に分類し、カテゴリ単位で解析することができるので、計算機資源や計算時間を大幅に節減できる。
【0104】
【発明の効果】
以上説明したように、本発明のハイパーテキスト解析方法、ハイパーテキスト解析プログラム、及びハイパーテキスト解析装置においては、ハイパーテキストの各ページへのアクセス履歴情報から目的ページ又は目的カテゴリへ遷移するセッションを選別して、ページ毎又はカテゴリ毎に目的ページ又は目的カテゴリへの遷移の成功率を評価している。
【0105】
したがって、訪問者(アクセス者)を商品購買、資料請求、問合せなどの目的ページ又は目的カテゴリに導き、ビジネスチャンスを増やすことができるようにページ間のリンク構成やページ内容の改善を支援することができる。
【図面の簡単な説明】
【図1】本発明の第1実施形態に係るハイパーテキスト解析方法が適用されかつハイパーテキスト解析プログラムが組込まれたハイパーテキスト解析装置の概略構成を示すブロック図
【図2】同第1実施形態のハイパーテキスト解析装置の動作を示す流れ図
【図3】同第1実施形態のハイパーテキスト解析装置で用いるセッションの構成を示す図
【図4】同第1実施形態のハイパーテキスト解析装置の表示部に表示された解析結果を示す図
【図5】同じく第1実施形態のハイパーテキスト解析装置の表示部に表示された解析結果を示す図
【図6】本発明の第2実施形態に係るハイパーテキスト解析方法が適用されかつハイパーテキスト解析プログラムが組込まれたハイパーテキスト解析装置の概略構成を示すブロック図
【図7】同第2実施形態のハイパーテキスト解析装置の動作を示す流れ図
【図8】同第2実施形態のハイパーテキスト解析装置で用いるカテゴリ及びセッションの構成を示す図
【図9】同第2実施形態のハイパーテキスト解析装置の表示部に表示された解析結果を示す図
【図10】同じく第2実施形態のハイパーテキスト解析装置の表示部に表示された解析結果を示す図
【符号の説明】
1…Webサーバ
2…ページ
3…ハイパーテキスト
4…アクセス履歴情報
5…ログファイル
6、6a…ハアイパーテキスト解析装置
7…入力部
8…目的ページ設定部
8a…目的カテゴリ設定部
9…セッション生成部
10…遷移ページ列生成部
10a…遷移カテゴリ列生成部
11、11a…判定部
12、12a…到達回数/成功率計算部
13、13a…表示部
14、14a…セッション
15…有向線
16…カテゴリ設定部
17…カテゴリファイル
18…カテゴリ
【発明の属する技術分野】
本発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析方法、ハイパーテキスト解析プログラム、及びハイパーテキスト解析装置に関する。
【0002】
【従来の技術】
例えば、不特定多数の人がアクセス可能なインターネットに接続されたWebサーバ等のネットワークサーバ上に、複数のページが互いにリンクされたハイパーテキストを構築して、外部の人(訪問者)がハイパーテキストの各ページを任意に閲覧可能にしたシステムが実用化されている。
【0003】
このようなハイパーテキストの各ページにおいては、このページの訪問者が関連する次のページへリンク先を指定した複数のアイコンあるいはアンカーが配設されている。そして、このハイパーテキストが企業案内のホームページや通信販売のホームページ等であった場合においては、このホームページをアクセスする訪問者(顧客)にとって、必要とする情報が記載された各ページまでいかに効率的に遷移させ、表示させるが課題となる。
【0004】
したがって、実際にネットワークサーバ上に構築されたハイパーテキストの各ページがどのような手順で訪問者(顧客)によってアクセスされているかを解析することは、非常に重要なことである。
【0005】
従来、このハイパーテキストの解析方法として、特開2001−66981号公報に「ハイパーテキスト解析装置および方法」が開示されている。この特開2001−166981号公報に開示されている「ハイパーテキスト解析装置および方法」においては、ハイパーテキストを構成する任意のページ組について、ページ内容から抽出される様々な属性とページ間遷移頻度との相関を予め計算しておき、あるページ間の遷移頻度を上げたい場合にどの属生を変化させれば良いかを表示することを提案している。
【0006】
また、任意のページ組について、ページ内容から抽出される様々な属性とページ間アクセス類似度(訪問者が双方のページをアクセスした度合い)との相関を予め計算しておき、あるページ間のアクセス類似度を上げたい場合にどの属性を変化させれば良いかを表示することを提案している。
【0007】
これらによって、ハイパーテキスト管理者はページ間の遷移頻度を上げるように、あるいはページ間のアクセス類似度を上げるようにページ内容を変更することができる。
【0008】
【発明が解決しようとする課題】
しかしながら、特開2001−166981号公報に開示されている「ハイパーテキスト解析装置および方法」においても、まだ、解決すべき次のような課題があった。
【0009】
すなわち、特開2001−166981号公報においては、ページとページの間の遷移頻度、あるいはアクセス類似度を上げるための方法を問題にしているが、実際のハイパーテキストでどのページ間の遷移頻度、あるいはアクセス類似度を上げればよいのか、その方針は示されていない。
【0010】
また、インターネット上で企業が運営しているWebサーバのハイパーテキストでは、このホームページをアクセスした訪問者(顧客)を商品購買、資料請求、問合せなどの目的ページに導き、ビジネスチャンスを増やすことを目的としているが、特開2001−166981号公報においては、訪問者をどのような経路で目的ページまで導けば良いのかが示されていないため、どのページ間の遷移頻度、アクセス類似度を上げれば良いのかが分からない問題がある。
【0011】
本発明はこのような事情に鑑みてなされたものであり、ハイパーテキストの各ページへのアクセス履歴情報から目的ページ又は目的カテゴリへ遷移するセッションを選別することにより、訪問者(アクセス者)を商品購買、資料請求、問合せなどの目的ページ又は目的カテゴリに導き、ビジネスチャンスを増やすことができるようにページ間のリンク構成やページ内容の改善を支援することができるハイパーテキスト解析方法、ハイパーテキスト解析プログラム、及びハイパーテキスト解析装置を提供することを目的とする。
【0012】
【課題を解決するための手段】
上記課題を解消するために、第1の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析方法において、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、ハイパーテキストを構成する複数ページの中から指定された1つ又は複数のページを目的ページと設定する工程と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、分割されたセッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成してメモリに記憶する工程と、セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、ハイパーテキストを構成するページ毎に、そのページをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に各ページをプロットしたグラフを作成し、このグラフを解析結果として出力する工程とを備えている。
【0013】
なお、この発明のハイパーテキスト解析方法におけるセッションとはハイパーテキストの各ページに対する一人の訪問者(アクセス者)による一連のアクセスを示す。訪問者(アクセス者)はこの訪問者が利用する計算機のIPアドレスなどにより識別され、ハイパーテキストのページへ連続してアクセスすると、それが一つのセッションになり、一定時間以上アクセスされないと、そこでセッションが終了する。すなわち、ネットワークサーバから取込まれたアクセス履歴情報は複数のセッションに分割される。
【0014】
セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定される。そして、最終的に、各ページが、直交座標上に、セッション数、成功率を各軸におけるパラメータとして、グラフィック表示される。
【0015】
したがって、この解析結果を参照して、グラフ上でアクセス頻度が低い、すなわちセッション数が小さいページは、アクセス頻度が高くなるように、また、成功率が低いページは成功率が高くなるように、ページ間のリンク構成やページ内容を改善することができる。
【0016】
成功率の低いページでは、例えば訪問者(アクセス者)がそのページから外部へ出て行くことが多い場合には、訪問者が一つ前に訪問したページを見て抱いていた期待とそのページの内容が合ってないことが考えられるので、ページ内容、あるいは一つ前に訪問したページの説明文の見直しが必要である。
【0017】
また、そのページからハイパーテキスト内部の成功率が低いページヘの遷移が多い場合は、リンク説明を見直すか、あるいは別の成功率の高いページヘの遷移数が増えるようにページ内容を見直す必要がある。
【0018】
成功率は高いがアクセス頻度が低いページでは、そのページヘのアクセスを増加させるために、そのページヘの例えばアイコンで示すリンクを目立つようにすることや、アクセス頻度の高いページからリンクを張ることによって訪問者が訪れるように改善する。
【0019】
すなわち、グラフのセッション数(アクセス頻度)、成功率が共に高い領域にページがプロットされるようにページ内容やリンク構成を修正すればよい。
【0020】
第2の発明は、上述した発明のハイパーテキスト解析方法において、セッション数と成功率とを計算する工程において、成功のセッションを、目的ページをアクセスするまでのページ列のみとする。
【0021】
このように構成されたハイパーテキスト解析方法においては、セッションの目的ページを訪問した後に遷移するページ列を「成功」のセッション数を数える対象から外すことができ、成功率の意味が、そのページに遷移した場合に、その後、目的ページに達する確率になる。したがって、このハイパーテキストの管理者が、表示された解析結果を参照してページ内容やリンク構成を修正する場合に、より正確に支援を行うことができる。
【0022】
第3の発明は、上述した発明のハイパーテキスト解析方法において、グラフを解析結果として表示する工程において、所定頻度以上のページ間アクセスが生じたページ相互間に有向線を表示する。
【0023】
このように構成されたハイパーテキスト解析方法においては、グラフ上で所定頻度以上のページ間アクセスが生じた各ページがより簡単に把握できるので、ハイパーテキストの管理者が、表示された解析結果を参照してページ内容やリンク構成を修正する場合に、より的確に解析結果を利用できる。
【0024】
第4の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析方法において、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、ハイパーテキストを構成する各ページを複数のカテゴリに分類する工程と、複数のカテゴリの中から指定された1つ又は複数のカテゴリを目的カテゴリと設定する工程と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、分割されたセッション毎に、該当セッションに含まれる各ページに対応するカテゴリにおける遷移した順のカテゴリ列を生成してメモリに記憶する工程と、セッション毎に、目的カテゴリをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、ハイパーテキストを構成するページに対応するカテゴリ毎に、そのカテゴリをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に各カテゴリをプロットしたグラフを作成し、このグラフを解析結果として出力する工程とを備えている。
【0025】
この第4の発明のハイパーテキスト解析方法は、第1の発明のハイパーテキスト解析方法に対して、ハイパーテキストのページをカテゴリ分類する工程が付加され、カテゴリ単位で分析を行う点が異なる。
【0026】
すなわち、解析すべきハイパーテキストのページ数が多い場合には、ページ単位の解析を行うには膨大な計算機資源や時間を要してしまう問題がある。そこで、この第4の発明を利用すれば、ページをカテゴリ分類し、カテゴリ単位で解析することができるので、膨大な計算機資源や時間を要してしまう問題が解決する。
【0027】
また、ハイパーテキストの管理者が、表示された解析結果を参照してページ内容やリンク構成を修正する場合に、ページ単位の解析結果では多くのページの関連を理解することは困難であるが、カテゴリ単位の解析結果では理解し易くなる。
【0028】
第5の発明は、上述した発明のハイパーテキスト解析方法のセッション数と成功率とを計算する工程において、成功のセッションを、目的カテゴリをアクセスするまでのカテゴリ列のみとする。
【0029】
このように構成されたハイパーテキスト解析方法においては、前述した第2の発明のハイパーテキスト解析方法とほぼ同じ作用効果が得られる。
【0030】
第6の発明は、上述した発明のハイパーテキスト解析方法のグラフを解析結果として表示する工程において、所定頻度以上のカテゴリ間アクセスが生じたカテゴリ相互間に有向線を表示する。
【0031】
このように構成されたハイパーテキスト解析方法においては、前述した第3の発明のハイパーテキスト解析方法とほぼ同じ作用効果が得られる。
【0032】
第7の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析プログラムである。そして、このハイパーテキスト解析プログラムにおいては、コンピュータに、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、ハイパーテキストを構成する複数ページの中から指定された1つ又は複数のページを目的ページと設定する工程と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、分割されたセッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成してメモリに記憶する工程と、セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、ハイパーテキストを構成するページ毎に、そのページをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に各ページをプロットしたグラフを作成し、このグラフを解析結果として出力する工程とを実行させる。
【0033】
このように構成されたハイパーテキスト解析プログラムにおいても、前述した第1の発明のハイパーテキスト解析方法とほぼ同じ作用効果を奏することができる。
【0034】
第8の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析プログラムである。そして、このハイパーテキスト解析プログラムにおいては、コンピュータに、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、ハイパーテキストを構成する各ページを複数のカテゴリに分類する工程と、複数のカテゴリの中から指定された1つ又は複数のカテゴリを目的カテゴリと設定する工程と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、分割されたセッション毎に、該当セッションに含まれる各ページに対応するカテゴリにおける遷移した順のカテゴリ列を生成してメモリに記憶する工程と、セッション毎に、目的カテゴリをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、ハイパーテキストを構成するページに対応するカテゴリ毎に、そのカテゴリをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各カテゴリをプロットしたグラフを作成し、このグラフを解析結果として出力する工程とを実行させる。
【0035】
このように構成されたハイパーテキスト解析プログラムにおいても、前述した第4の発明のハイパーテキスト解析方法とほぼ同じ作用効果を奏することができる。
【0036】
第9の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析装置である。そして、このハイパーテキスト解析装置においては、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む手段と、ハイパーテキストを構成する複数ページの中から指定された1つ又は複数のページを目的ページと設定する手段と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する手段と、分割されたセッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成する手段と、セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する手段と、ハイパーテキストを構成するページ毎に、そのページをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する手段と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各ページをプロットしたグラフを作成し、このグラフを解析結果として出力する手段とを備えている。
【0037】
このように構成されたハイパーテキスト解析装置においても、前述した第1の発明のハイパーテキスト解析方法とほぼ同じ作用効果を奏することができる。
【0038】
第10の発明は、ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析装置である。そして、このハイパーテキスト解析装置においては、ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む手段と、ハイパーテキストを構成する各ページを複数のカテゴリに分類する手段と、複数のカテゴリの中から指定された1つ又は複数のカテゴリを目的カテゴリと設定する手段と、取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する手段と、分割されたセッション毎に、該当セッションに含まれる各ページに対応するカテゴリにおける遷移した順のカテゴリ列を生成する手段と、セッション毎に、目的カテゴリをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する手段と、ハイパーテキストを構成するページに対応するカテゴリ毎に、そのカテゴリをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する手段と、直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に各カテゴリをプロットしたグラフを作成し、このグラフを解析結果として出力する手段とを備えている。
【0039】
このように構成されたハイパーテキスト解析装置においても、前述した第4の発明のハイパーテキスト解析方法とほぼ同じ作用効果を奏することができる。
【0040】
【発明の実施の形態】
以下、本発明の各実施形態を図面を用いて説明する。
(第1実施形態)
図1は本発明の第1実施形態に係るハイパーテキスト解析方法が適用されかつハイパーテキスト解析プログラムが組込まれたハイパーテキスト解析装置の概略構成を示すブロック図である。
【0041】
図示しないインターネットに接続されたネットワークサーバとしてのWebサーバ1内に、複数のページ2が互いにリンクされたハイパーテキスト3が構築されている。そして、任意の人は、インターネットに接続された自己の計算機でインターネットを介してWebサーバ1内に構築されたハイパーテキスト3の各ページ2をアクセス(訪問)することが可能である。
【0042】
そして、任意の人が各ページ2をアクセス(訪問)すると、該当ページを特定するページ番号又は該当ページのURLと、アクセス(訪問)時刻と、アクセス者(訪問者)を特定するアクセス者の計算機のIPアドレスとが時系列的にログファイル5に書込まれる。すなわち、ログファイル5内には、ハイパーテキスト3の各ページ2へのアクセス履歴情報4が蓄積される。
【0043】
このWebサーバ1に接続されたコンピュータからなるハイパーテキスト解析装置6内には、アプリケーションプログラム上に構成された、入力部7、目的ページ設定部8、セッション生成部9、遷移ページ列生成部10、判定部11、到達回数/成功率計算部12が設けられている。さらに、ハイパーテキスト解析装置6内には表示部13が組込まれている。
【0044】
入力部7はWebサーバ1のログファイル5に蓄積されているアクセス履歴情報4を取込み、目的ページ設定部8及びセッション生成部9へ送出する。
【0045】
目的ページ設定部8は、アクセス履歴情報4に含まれる、すなわち、ハイパーテキスト3に含まれる複数のページ2のうち、このハイパーテキスト解析装置6の操作者(管理者)が操作指定した訪問者(アクセス者)に訪問(アクセス)させたいページ2を目的ページと設定して判定部11へ送出する。
【0046】
セッション生成部9は、入力されたアクセス履歴情報4を各ページ2に対する一人の訪問者(アクセス者)による一連のアクセスを示す複数のセッションに分割して、遷移ページ列生成部10へ送出する。なお、訪問者(アクセス者)は前述したように、訪問者(アクセス者)が利用する計算機のIPアドレスなどにより識別される。
【0047】
遷移ページ列生成部10はセッション生成部9から入力された各セッションに遷移順のページ列を組込んで一旦メモリへ書込んだ後、判定部11へ送出する。図3に、遷移順のページ列が組込まれた状態の各セッション14を示す。図示するように、各セッション14は、連続してアクセスされた複数のページ2が遷移順(アクセス順)に組込まれている。
【0048】
判定部11は遷移ページ列生成部10から送信されたセッション14毎の遷移順ページ列と、目的ページ設定部8から送信された目的ページとを照合し、各セッション14内に目的ページが含まれているか否かを調べ、目的ページが含まれているセッション14は成功、目的ページが含まれていないセッション14は失敗と判定する。そして、判定部11はセッション14毎の遷移順ページ列と判定結果とを到達回数/成功率計算部12へに送出する。
【0049】
到達回数/成功率計算部12は、ハイパーテキスト3の各ページ2について、そのページ2を通った(アクセスされた)セッション14の数と、そのうち「成功」と判定されたセッション14の数とを数え、アクセスされたセッション数のうち成功のセッション数の割合である成功率を計算する。そしてセッション14毎の遷移順ページ列と成功率との情報を表示部13へ送出する。
【0050】
なお、各ページ2の成功率を計算する過程で、成功と判定されたセッション14を、目的ページをアクセスするまでのページ列のみと限定することも可能である。
【0051】
このように、成功と判定されたセッション14のページ列を、目的ページをアクセスするまでのページ列のみと限定することにより、目的ページを通り過ぎた後に遷移(アクセス)されるページ2の成功率に対する影響を排除でき、成功率の精度を向上できる。
【0052】
表示部13は、図4に示すように、横軸にページを通ったセッション数を示し、縦軸に成功率を示す直交座標に各ページ2をプロットしたグラフを作成して解析結果として表示する。
【0053】
ハイパーテキスト3の管理者は、表示部13に表示された解析結果のグラフを参照して、ハイパーテキスト3のページ2間のリンク構成やページ内容を改善することができる。
【0054】
次に、このように構成されたハイパーテキスト解析装置6における具体的処理手順を図2の流れ図を用いて説明する。
【0055】
まず、Webサーバ1に記憶されたアクセス履歴情報4が入力部7によって取り込まれ、セッション生成部9及び目的ページ設定部8へ送出される(ステップS1)。目的ページ設定部8ではハイパーテキスト3における各ページ2のうちの訪問者に訪問させたいページ2が目的ページに設定され、判定部11へ送出される(ステップS2)。
【0056】
セッション生成部9では、入力されたアクセス履歴情報4が各ページ2に対する一人の訪問者(アクセス者)による一連のアクセスを示す複数のセッションに分割されて、遷移ページ列生成部10へ送出する(ステップS3)。
【0057】
遷移ページ列生成部10においてはセッション生成部9から入力された各セッション14に遷移順のページ列が組込まれ判定部11へ送出される(ステップS4)。判定部11においては、セッション14毎の遷移順ページ列と、目的ページが照合され、目的ページが含まれているセッション14は成功、目的ページが含まれていないセッション14は失敗と判定され、判定結果が到達回数/成功率計算部12へ送出される(ステップS5)。
【0058】
到達回数/成功率計算部12では、ハイパーテキスト3におけるページ2毎に、そのページ2を通ったセッション14の数と、成功率とが計算され、表示部13へ送出される(ステップS6)。表示部13では横軸にページ2を通ったセッション数、縦軸に成功率をとり、各ページ2を直交座標上にプロットした解析結果のグラフが表示される(ステップS7)。
【0059】
次に、このように構成された第1実施形態のハイパーテキスト解析装置6を用いて実際にWebサーバ1上に構築されたハイパーテキスト3を解析した場合の解析結果を図4を用いて説明する。
【0060】
この例においては、インターネットを用いて各商品の通信販売を実施するための互いにリンクされた複数のページ2からなるハイパーテキスト3に適用される。したがって、最終的に訪問者(アクセス者=顧客)が商品の購入を指示するためのページ2が目的ページとなる。
【0061】
図4の解析結果のグラフにおいて、円がページ2を示し、円の横の数字がページ2を特定するページ番号を示す。さらに、横軸が各ページ2を通るセッション14の数であり、縦軸が各ページ2を通るセッション14のうち目的ページを通る成功のセッション14の割合を示す成功率である。さらに、グラフ上のページ2相互間を接続する有向線15は、一定値以上の頻度を有するページ間遷移(ページ間アクセス)を表している。
【0062】
このように、一定値以上の頻度を有するページ間遷移を示す有向線15を表示することによって、この解析結果を参照するハイパーテキスト3の管理者は、各ページ2間の遷移(ページ間アクセス)の量の大小を一瞥して理解できる。
【0063】
さらに、入口は外から訪問者がこのハイパーテキスト3をアクセス開始したことを示し、出口は訪問者がこのハイパーテキスト3に対するアクセスを終了したことを示す。したがって、入口、出口のセッション数は最大値を示す。
【0064】
この解析結果においては、ページ番号483のページ2が目的ページである。したがって、このページ2を通るセッション14は必ず成功になり、ページ番号483のページ2の成功率は100%になる。
【0065】
ハイパーテキスト3の管理者は、この図4の解析結果を参照して、ハイパーテキスト3を構成する各ページ2の内容やリンク構成を変更する。例えば、51番のページ2から目的ページである483番のページ2へ遷移する場合もあるが、多くのセッション14は51番のページ2から55番のページ2へ遷移している場合、51番のページ2から483番のページ2へ遷移しやすくするようにリンク構造を変更することが考えられる。また、715番のページ2から出口に遷移するセッション14が多い場合、715番のページ2から16番のページ2へ遷移するようにページ内容を変更することが考えられる。
【0066】
図5は、ハイパーテキスト3の管理者が51番のページ2と715番のページ2の内容を変更して、Webサーバ1を一定期間稼働したのちに、ハイパーテキスト3を再度解析した場合における解析結果のグラフである。
【0067】
この解析結果によると、51番のページ2から55番のページ2への遷移が減少し、483番のページ2への遷移が増加することにより、51番のページ2の成功率が増加し、また、483番のページ2(目的ページ)のセッション数が増加していることが理解できる。
【0068】
また、715番のページ2の内容を変えることにより、出口への遷移が減少し、16番のページ2に戻る遷移が増加することにより、715番のページ2の成功率が増加している。
【0069】
このように、ハイパーテキスト3の管理者は、ハイパーテキスト3に対する図4に示す解析結果を参照して、各ページ2のセッション数、成功率、主な遷移先ページを考慮し、ページ内容、リンク構成を修正することにより、各ページ2のアクセス頻度や成功率を上げることができ、また目的ページのアクセス頻度(セッション数)を高めることができ、ビジネスチャンスを大幅に増加することができる。
【0070】
(第2実施形態)
図6は本発明の第2実施形態に係るハイパーテキスト解析方法が適用されかつハイパーテキスト解析プログラムが組込まれたハイパーテキスト解析装置6aの概略構成を示すブロック図である。図1に示す第1実施形態のハイパーテキスト解析装置6と同一部分には同一が付されており、重複する部分の詳細説明は省略されている。
【0071】
図6において、Webサーバ1の構成は図1に示すWebサーバ1と同一構成である。そして、この第2実施形態のコンピュータからなるハイパーテキスト解析装置6a内には、アプリケーションプログラム上に構成された、入力部7、カテゴリ設定部16、目的カテゴリ設定部8a、セッション生成部9、遷移カテゴリ列生成部10a、判定部11a、到達回数/成功率計算部12aが設けられている。さらに、ハイパーテキスト解析装置6a内にはカテゴリファイル17及び表示部13aが組込まれている。
【0072】
カテゴリファイル17内には、ハイパーテキスト3を構成する各ページ2を複数のカテゴリ(種別)に分類する場合における各カテゴリ(種別)が記憶されている。例えば、ハイパーテキスト3が通信販売目的のハイパーテキストの場合、各ページ2のカテゴリ(種別)として、「商品購入」、「商品情報」、「購入ガイド」、…等が記憶されている。
【0073】
入力部7はWebサーバ1のログファイル5に蓄積されているアクセス履歴情報4を取込み、カテゴリ設定部16及びセッション生成部9へ送出する。
【0074】
カテゴリ設定部16は、入力部7を介して入力されたアクセス履歴情報4に含まれる、すなわち、ハイパーテキスト3に含まれる各ページ2がカテゴリファイル17に記憶されたどのカテゴリに所属するかを、このハイパーテキスト解析装置6の操作者(管理者)の操作指定にて判断して、図8(a)に示すように、各ページ2に対して対応するカテゴリ18を付加した形式で、遷移カテゴリ列生成部10aへ送出する。さらに、カテゴリ設定部16は設定した各カテゴリ18を目的カテゴリ設定部8aへ送出する。
【0075】
目的カテゴリ設定部8aは、入力された複数のカテゴリ18のうち、このハイパーテキスト解析装置6の操作者(管理者)が操作指定した訪問者(アクセス者)に訪問(アクセス)させたいカテゴリ18を目的カテゴリと設定して判定部11aへ送出する。
【0076】
セッション生成部9は、入力されたアクセス履歴情報4を各ページ2に対する一人の訪問者(アクセス者)による一連のアクセスを示す複数のセッションに分割して、遷移カテゴリ列生成部10aへ送出する。
【0077】
遷移カテゴリ列生成部10aはセッション生成部9から入力された各セッションに遷移順のカテゴリ列を組込んで一旦メモリへ書込んだ後、判定部11aへ送出する。図8(b)に、遷移順のカテゴリ列が組込まれた状態のセッション14aを示す。図示するように、セッション14aは、図3に示すセッション14における各ページ2を対応するカテゴリ18に置き換えたものである。
【0078】
判定部11aは遷移カテゴリ列生成部10aから送信されたセッション14a毎の遷移順カテゴリ列と、目的カテゴリ設定部8aから送信された目的カテゴリとを照合し、各セッション14a内に目的カテゴリが含まれているか否かを調べ、目的カテゴリが含まれているセッション14aは成功、目的カテゴリが含まれていないセッション14aは失敗と判定する。そして、判定部11aはセッション14a毎の遷移順カテゴリ列と判定結果とを到達回数/成功率計算部12aへに送出する。
【0079】
到達回数/成功率計算部12aは、各ページ2対応する各カテゴリ18について、そのカテゴリ18を通った(アクセスされた)セッション14aの数と、そのうち「成功」と判定されたセッション14aの数とを数え、アクセスされたセッション数のうち成功のセッション数の割合である成功率を計算する。そしてセッション14a毎の遷移順カテゴリ列と成功率との情報を表示部13aへ送出する。
【0080】
なお、各カテゴリ18の成功率を計算する過程で、成功と判定されたセッション14aを、目的カテゴリをアクセスするまでのカテゴリ列のみと限定することも可能である。
【0081】
表示部13aは、図9に示すように、横軸にカテゴリを通ったセッション数を示し、縦軸に成功率を示す直交座標に各カテゴリ18をプロットしたグラフを作成して解析結果として表示する。
【0082】
ハイパーテキスト3の管理者は、表示部13aに表示された解析結果のグラフを参照して、ハイパーテキスト3の各カテゴリ18に対応する各ページ2間のリンク構成やページ内容を改善することができる。
【0083】
次に、このように構成されたハイパーテキスト解析装置6aにおける具体的処理手順を図7の流れ図を用いて説明する。
【0084】
まず、Webサーバ1に記憶されたアクセス履歴情報4が入力部7によって取り込まれ、セッション生成部9及びカテゴリ設定部16へ送出される(ステップP1)。カテゴリ設定部16では、入力した各ページ2に対応するカテゴリ18が付されて遷移カテゴリ列生成部10aへ送出されるとともに、設定した各カテゴリ18が目的カテゴリ設定部8aへ送出される(ステップP2)。
【0085】
目的カテゴリ設定部8aでは入力された各カテゴリ18のうちの訪問者に訪問させたいカテゴリ18が目的カテゴリに設定され、判定部11aへ送出される(ステップP3)。
【0086】
セッション生成部9では、入力されたアクセス履歴情報4が各ページ2に対する一人の訪問者(アクセス者)による一連のアクセスを示す複数のセッションに分割されて、遷移カテゴリ列生成部10aへ送出する(ステップP4)。
【0087】
遷移カテゴリ列生成部10aは、セッション生成部9から入力された各セッションの各ページ2を、カテゴリ設定部16から送付された対応するカテゴリ18に置き換えた、遷移順のカテゴリ列を生成して、図8(b)に示すセッション14aとして判定部11aへ送出する(ステップP5)。
【0088】
判定部11aにおいては、セッション14a毎の遷移順カテゴリ列と、目的カテゴリが照合され、目的カテゴリが含まれているセッション14aは成功、目的カテゴリが含まれていないセッション14aは失敗と判定され、判定結果が到達回数/成功率計算部12aへ送出される(ステップP6)。
【0089】
到達回数/成功率計算部12aでは、カテゴリ18毎に、そのカテゴリ18を通ったセッション14aの数と、成功率が計算され、表示部13aへ送出される(ステップP7)。表示部13aでは横軸にカテゴリ18を通ったセッション数、縦軸に成功率をとり、各カテゴリ18を直交座標上にプロットした解析結果のグラフが表示される(ステップP8)。
【0090】
次に、このように構成された第2実施形態のハイパーテキスト解析装置6aを用いて実際にWebサーバ1上に構築されたハイパーテキスト3を解析した場合の解析結果を図9を用いて説明する。
【0091】
この例においては、インターネットを用いて各商品の通信販売を実施するための互いにリンクされた複数のページ2からなるハイパーテキスト3に適用される。したがって、最終的に訪問者(アクセス者=顧客)が商品の購入を指示するためのページ2に対応する「商品購入」のカテゴリ18が目的カテゴリとなる。
【0092】
この通信販売のハイパーテキスト3の各ページ2は、上述した「商品購入」のカテゴリ18の他に、「購入ガイド」、「商品情報」、「新製品」、「問い合わせ」、「アンケート」、「ホーム」、「サービス」、「ダウンロード」、「お知らせ」、「企業紹介」等のカテゴリ18に分類される。
【0093】
図9の解析結果のグラフにおいて、正方形がカテゴリ18を示し、正方形の横の文字がカテゴリ名を示す。さらに、横軸が各カテゴリ18を通るセッション14aの数であり、縦軸が各カテゴリ18を通るセッション14aのうち目的カテゴリを通る成功のセッション14aの割合を示す成功率である。さらに、グラフ上のカテゴリ18相互間を接続する有向線15aは、一定値以上の頻度を有するカテゴリ間遷移(カテゴリ間アクセス)を表している。
【0094】
さらに、入口は外から訪問者がこのハイパーテキスト3にアクセス開始したことを示し、出口は訪問者がこのハイパーテキスト3に対するアクセスを終了したことを示す。したがって、入口、出口のセッション数は最大値を示す。
【0095】
この解析結果においては、商品購入のカテゴリ18が目的カテゴリある。したがって、このカテゴリ18を通るセッション14aは必ず成功になり、商品購入のカテゴリ18の成功率は100%になる。
【0096】
ハイパーテキスト3の管理者は、この図9の解析結果を参照して、ハイパーテキスト3を構成する各ページ2の内容やリンク構成を変更する。例えば、「新製品」のカテゴリ18から「商品情報」のカテゴリ18に遷移すると目的カテゴリである「商品購入」のカテゴリ18へ遷移する確率が高くなるが、「新製品」のカテゴリ18から「ダウンロード」のカテゴリ18へ遷移すると、成功率は低下している。
【0097】
よって「新製品」のカテゴリ18から「商品情報」のカテゴリ18へ遷移しやすくするようにリンク構造を変更することが考えられる。また、「ホーム」のカテゴリ18から「お知らせ」のカテゴリ18に遷移し、出口に遷移する場合が多いので、「お知らせ」のカテゴリ18のページ内容を変更することが考えられる。
【0098】
図10は、ハイパーテキスト3の管理者が、「新製品」のカテゴリ18に対応するページ2の内容と「お知らせ」のカテゴリ18に対応するページ2の内容とを変更して、Webサーバ1を一定期間稼働したのちに、ハイパーテキスト3を再度解析した場合における解析結果のグラフである。
【0099】
この解析結果によると、「新製品」のカテゴリ18から「ダウンロード」のカテゴリ18ヘの遷移が減少し、「商品情報」のカテゴリ18ヘの遷移が増加することにより「新製品」のカテゴリ18の成功率が増加し、「商品購入」のカテゴリ18ヘのセッション数が増加していることが理解できる。
【0100】
また、「お知らせ」のカテゴリ18に対応するページ2の内容を変えることにより、出口への遷移が減少し、「ホーム」のカテゴリ18に戻る遷移が増加することにより、「お知らせ」のカテゴリ18の成功率が増加している。
【0101】
このように、ハイパーテキスト3の管理者は、ハイパーテキスト3に対する図9に示す解析結果を参照して、各カテゴリ18のセッション数、成功率、主な遷移先カテゴリを考慮し、各カテゴリ18を構成している各ページ2のページ内容、リンク構成を修正することにより、各カテゴリ18のアクセス頻度や成功率を上げることができ、また目的カテゴリのアクセス頻度(セッション数)を高めることができ、ビジネスチャンスを増加することができる。
【0102】
さらに、この第2実施形態のハイパーテキスト解析装置6aにおいては、ハイパーテキスト3を構成する多くのページ2を代表的な複数のカテゴリ18に分類して、この代表的な複数のカテゴリ18に対するアクセス履歴でもって、ハイパーテキスト3を解析して、図9に示すように、解析結果をグラフィック表示している。
【0103】
したがって、ハイパーテキスト3の管理者にとって、表示された解析結果を参照してページ内容やリンク構成を修正する場合に、解析結果をカテゴリ単位で把握でき、修正作業の効率を向上できる。さらに、ページ2をカテゴリ18に分類し、カテゴリ単位で解析することができるので、計算機資源や計算時間を大幅に節減できる。
【0104】
【発明の効果】
以上説明したように、本発明のハイパーテキスト解析方法、ハイパーテキスト解析プログラム、及びハイパーテキスト解析装置においては、ハイパーテキストの各ページへのアクセス履歴情報から目的ページ又は目的カテゴリへ遷移するセッションを選別して、ページ毎又はカテゴリ毎に目的ページ又は目的カテゴリへの遷移の成功率を評価している。
【0105】
したがって、訪問者(アクセス者)を商品購買、資料請求、問合せなどの目的ページ又は目的カテゴリに導き、ビジネスチャンスを増やすことができるようにページ間のリンク構成やページ内容の改善を支援することができる。
【図面の簡単な説明】
【図1】本発明の第1実施形態に係るハイパーテキスト解析方法が適用されかつハイパーテキスト解析プログラムが組込まれたハイパーテキスト解析装置の概略構成を示すブロック図
【図2】同第1実施形態のハイパーテキスト解析装置の動作を示す流れ図
【図3】同第1実施形態のハイパーテキスト解析装置で用いるセッションの構成を示す図
【図4】同第1実施形態のハイパーテキスト解析装置の表示部に表示された解析結果を示す図
【図5】同じく第1実施形態のハイパーテキスト解析装置の表示部に表示された解析結果を示す図
【図6】本発明の第2実施形態に係るハイパーテキスト解析方法が適用されかつハイパーテキスト解析プログラムが組込まれたハイパーテキスト解析装置の概略構成を示すブロック図
【図7】同第2実施形態のハイパーテキスト解析装置の動作を示す流れ図
【図8】同第2実施形態のハイパーテキスト解析装置で用いるカテゴリ及びセッションの構成を示す図
【図9】同第2実施形態のハイパーテキスト解析装置の表示部に表示された解析結果を示す図
【図10】同じく第2実施形態のハイパーテキスト解析装置の表示部に表示された解析結果を示す図
【符号の説明】
1…Webサーバ
2…ページ
3…ハイパーテキスト
4…アクセス履歴情報
5…ログファイル
6、6a…ハアイパーテキスト解析装置
7…入力部
8…目的ページ設定部
8a…目的カテゴリ設定部
9…セッション生成部
10…遷移ページ列生成部
10a…遷移カテゴリ列生成部
11、11a…判定部
12、12a…到達回数/成功率計算部
13、13a…表示部
14、14a…セッション
15…有向線
16…カテゴリ設定部
17…カテゴリファイル
18…カテゴリ
Claims (10)
- ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析方法において、
前記ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、
前記ハイパーテキストを構成する複数ページの中から指定された1つ又は複数のページを目的ページと設定する工程と、
前記取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、
前記分割されたセッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成してメモリに記憶する工程と、
セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、
前記ハイパーテキストを構成するページ毎に、そのページをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、
直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各ページをプロットしたグラフを作成し、このグラフを解析結果として出力する工程と
を備えたことを特徴とするハイパーテキスト解析方法。 - 前記セッション数と成功率とを計算する工程において、成功のセッションを、目的ページをアクセスするまでのページ列のみとすることを特徴とする請求項1記載のハイパーテキスト解析方法。
- 前記グラフを解析結果として表示する工程において、所定頻度以上のページ間アクセスが生じたページ相互間に有向線を表示することを特徴とする請求項1又は2記載のハイパーテキスト解析方法。
- ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析方法において、
前記ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、
前記ハイパーテキストを構成する各ページを複数のカテゴリに分類する工程と、
前記複数のカテゴリの中から指定された1つ又は複数のカテゴリを目的カテゴリと設定する工程と、
前記取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、
前記分割されたセッション毎に、該当セッションに含まれる各ページに対応するカテゴリにおける遷移した順のカテゴリ列を生成してメモリに記憶する工程と、
セッション毎に、目的カテゴリをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、
前記ハイパーテキストを構成するページに対応するカテゴリ毎に、そのカテゴリをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、
直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各カテゴリをプロットしたグラフを作成し、このグラフを解析結果として出力する工程と
を備えたことを特徴とするハイパーテキスト解析方法。 - 前記セッション数と成功率とを計算する工程において、成功のセッションを、目的カテゴリをアクセスするまでのカテゴリ列のみとすることを特徴とする請求項4記載のハイパーテキスト解析方法。
- 前記グラフを解析結果として表示する工程において、所定頻度以上のカテゴリ間アクセスが生じたカテゴリ相互間に有向線を表示することを特徴とする請求項4又は5記載のハイパーテキスト解析方法。
- ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析プログラムにおいて、
コンピュータに、
前記ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、
前記ハイパーテキストを構成する複数ページの中から指定された1つ又は複数のページを目的ページと設定する工程と、
前記取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、
前記分割されたセッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成してメモリに記憶する工程と、
セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、
前記ハイパーテキストを構成するページ毎に、そのページをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、
直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各ページをプロットしたグラフを作成し、このグラフを解析結果として出力する工程と
を実行させることを特徴とするハイパーテキスト解析プログラム。 - ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析プログラムにおいて、
コンピュータに、
前記ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む工程と、
前記ハイパーテキストを構成する各ページを複数のカテゴリに分類する工程と、
前記複数のカテゴリの中から指定された1つ又は複数のカテゴリを目的カテゴリと設定する工程と、
前記取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する工程と、
前記分割されたセッション毎に、該当セッションに含まれる各ページに対応するカテゴリにおける遷移した順のカテゴリ列を生成してメモリに記憶する工程と、
セッション毎に、目的カテゴリをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する工程と、
前記ハイパーテキストを構成するページに対応するカテゴリ毎に、そのカテゴリをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する工程と、
直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各カテゴリをプロットしたグラフを作成し、このグラフを解析結果として出力する工程と
を実行させることを特徴とするハイパーテキスト解析プログラム。 - ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析装置において、
前記ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む手段と、
前記ハイパーテキストを構成する複数ページの中から指定された1つ又は複数のページを目的ページと設定する手段と、
前記取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する手段と、
前記分割されたセッション毎に、該当セッションに含まれる各ページにおける遷移した順のページ列を生成する手段と、
セッション毎に、目的ページをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する手段と、
前記ハイパーテキストを構成するページ毎に、そのページをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する手段と、
直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各ページをプロットしたグラフを作成し、このグラフを解析結果として出力する手段と
を備えたことを特徴とするハイパーテキスト解析装置。 - ネットワークサーバ上に構築され、複数のページが互いにリンクされたハイパーテキストを解析するハイパーテキスト解析装置において、前記ネットワークサーバ内に蓄積されたハイパーテキストの各ページヘのアクセス履歴情報を取込む手段と、
前記ハイパーテキストを構成する各ページを複数のカテゴリに分類する手段と、
前記複数のカテゴリの中から指定された1つ又は複数のカテゴリを目的カテゴリと設定する手段と、
前記取込んだアクセス履歴情報を一連のアクセスを示す複数のセッションに分割する手段と、
前記分割されたセッション毎に、該当セッションに含まれる各ページに対応するカテゴリにおける遷移した順のカテゴリ列を生成する手段と、
セッション毎に、目的カテゴリをアクセスした場合を成功、アクセスしなかった場合を失敗として判定する手段と、
前記ハイパーテキストを構成するページに対応するカテゴリ毎に、そのカテゴリをアクセスしたセッション数と、そのアクセスしたセッション数のうち成功のセッション数の割合である成功率とを計算する手段と、
直交する一方の軸がアクセスしたセッション数を示し他方の軸が成功率を示す直交座標に前記各カテゴリをプロットしたグラフを作成し、このグラフを解析結果として出力する手段と
を備えたことを特徴とするハイパーテキスト解析装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002268268A JP2004110123A (ja) | 2002-09-13 | 2002-09-13 | ハイパーテキスト解析方法、解析プログラム及びその装置 |
US10/659,638 US20040054682A1 (en) | 2002-09-13 | 2003-09-11 | Hypertext analysis method, analysis program, and apparatus |
CNB031581390A CN1249584C (zh) | 2002-09-13 | 2003-09-12 | 超文本分析方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002268268A JP2004110123A (ja) | 2002-09-13 | 2002-09-13 | ハイパーテキスト解析方法、解析プログラム及びその装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004110123A true JP2004110123A (ja) | 2004-04-08 |
Family
ID=31986752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002268268A Pending JP2004110123A (ja) | 2002-09-13 | 2002-09-13 | ハイパーテキスト解析方法、解析プログラム及びその装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20040054682A1 (ja) |
JP (1) | JP2004110123A (ja) |
CN (1) | CN1249584C (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008026972A (ja) * | 2006-07-18 | 2008-02-07 | Fujitsu Ltd | ウェブサイト構築支援システム、ウェブサイト構築支援方法およびウェブサイト構築支援プログラム |
JP6347567B1 (ja) * | 2017-10-23 | 2018-06-27 | 株式会社サードパーティートラスト | 情報処理システム、処理方法、処理プログラム |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7779021B1 (en) * | 2004-03-09 | 2010-08-17 | Versata Development Group, Inc. | Session-based processing method and system |
CA2625247A1 (en) * | 2005-10-28 | 2007-10-04 | Openconnect Systems, Incorporated | Modeling interactions with a computer system |
US8396737B2 (en) * | 2006-02-21 | 2013-03-12 | Hewlett-Packard Development Company, L.P. | Website analysis combining quantitative and qualitative data |
US9348936B2 (en) | 2012-07-25 | 2016-05-24 | Oracle International Corporation | Heuristic caching to personalize applications |
CN109885679A (zh) * | 2019-01-11 | 2019-06-14 | 平安科技(深圳)有限公司 | 获取优选话术的方法、装置、计算机设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001166981A (ja) * | 1999-12-06 | 2001-06-22 | Fuji Xerox Co Ltd | ハイパーテキスト解析装置および方法 |
US6963874B2 (en) * | 2002-01-09 | 2005-11-08 | Digital River, Inc. | Web-site performance analysis system and method utilizing web-site traversal counters and histograms |
-
2002
- 2002-09-13 JP JP2002268268A patent/JP2004110123A/ja active Pending
-
2003
- 2003-09-11 US US10/659,638 patent/US20040054682A1/en not_active Abandoned
- 2003-09-12 CN CNB031581390A patent/CN1249584C/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008026972A (ja) * | 2006-07-18 | 2008-02-07 | Fujitsu Ltd | ウェブサイト構築支援システム、ウェブサイト構築支援方法およびウェブサイト構築支援プログラム |
JP6347567B1 (ja) * | 2017-10-23 | 2018-06-27 | 株式会社サードパーティートラスト | 情報処理システム、処理方法、処理プログラム |
JP2019079195A (ja) * | 2017-10-23 | 2019-05-23 | 株式会社サードパーティートラスト | 情報処理システム、処理方法、処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20040054682A1 (en) | 2004-03-18 |
CN1249584C (zh) | 2006-04-05 |
CN1493994A (zh) | 2004-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7131062B2 (en) | Systems, methods and computer program products for associating dynamically generated web page content with web site visitors | |
US6928474B2 (en) | Using a probability associative matrix algorithm to modify web pages | |
US7047294B2 (en) | Page-view recording with click-thru tracking | |
US9185016B2 (en) | System and method for monitoring and analyzing internet traffic | |
US8239489B1 (en) | Web page experiments with fragmented section variations | |
US20190095929A1 (en) | Unification of web page reporting and updating through a page tag | |
JP2004171539A (ja) | ウェブページの利用パターンを特定する方法および装置 | |
US20030187677A1 (en) | Processing user interaction data in a collaborative commerce environment | |
US8793236B2 (en) | Method and apparatus using historical influence for success attribution in network site activity | |
JP2007517283A (ja) | 営業上の成功に貢献する要素に対する値の割当て | |
US20060253411A1 (en) | Method, system and program product for inserting visual controls for data values in web content from a legacy web application without rewriting the legacy web application | |
JP7161538B2 (ja) | ウェブトラフィックデータを処理および管理するシステム、装置、および方法 | |
JP2002334101A (ja) | ユーザに適したウェブページを提供するコンピュータ・システム。 | |
CN107239970A (zh) | 一种基于行为日志确定广告点击率的方法及系统 | |
US8886800B2 (en) | System and method for traffic analysis | |
CN111858255A (zh) | 基于屏幕截图的用户行为采集方法及相关设备 | |
US20020143890A1 (en) | Method and system for selective content display | |
CN112035744A (zh) | 一种页面推荐方法、装置、设备及存储介质 | |
US7562039B2 (en) | Method and computer system for computing and displaying a phase space | |
US8051110B2 (en) | Identifying screen flows to support multiple entities and their diverse rules with a single application instance | |
JP2004110123A (ja) | ハイパーテキスト解析方法、解析プログラム及びその装置 | |
CN1589434A (zh) | 用于重放预先确定的通过互联网的路径的系统和方法 | |
US20230153179A1 (en) | Visitor stitching with data science notebooks | |
EP1218835A1 (en) | Managing the delivery of content to users | |
WO2021181900A1 (ja) | ターゲットユーザ特徴抽出方法、ターゲットユーザ特徴抽出システム及びターゲットユーザ特徴抽出サーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050901 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081007 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090217 |