JP5705772B2 - Website analysis method, apparatus, system, and program - Google Patents
Website analysis method, apparatus, system, and program Download PDFInfo
- Publication number
- JP5705772B2 JP5705772B2 JP2012048285A JP2012048285A JP5705772B2 JP 5705772 B2 JP5705772 B2 JP 5705772B2 JP 2012048285 A JP2012048285 A JP 2012048285A JP 2012048285 A JP2012048285 A JP 2012048285A JP 5705772 B2 JP5705772 B2 JP 5705772B2
- Authority
- JP
- Japan
- Prior art keywords
- browsing
- web page
- website
- url
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ウェブサイト分析方法、装置、システム、及びプログラムに係り、特に、ウェブサイト内でのユーザの動線を分析するためのウェブサイト分析方法、装置、システム、及びプログラムに関する。 The present invention relates to a website analysis method, apparatus, system, and program, and more particularly, to a website analysis method, apparatus, system, and program for analyzing a user's flow line in a website.
ウェブサイト、特に電子商取引サイトの保有者にとって、保有するウェブサイトのユーザにとっての体感品質やユーザの利用状況を常々把握し、コンテンツや構造の改善を通して、利用者数及び利用効率の向上に繋げることは重要である。 For website owners, especially e-commerce site owners, to constantly grasp the quality of experience and usage of users for the website users, and to improve the number of users and usage efficiency through improvements in content and structure Is important.
例えば、ユーザの体感品質を定量的に測定する方法としては、ウェブサーバとユーザ端末との間の当該ウェブサイトの転送時間を推定して、ユーザが当該ウェブサイトを閲覧する際の通信品質を測定する方法が提案されている(例えば、特許文献1参照)。 For example, as a method of quantitatively measuring the user's quality of experience, the transfer time of the website between the web server and the user terminal is estimated, and the communication quality when the user browses the website is measured. A method has been proposed (see, for example, Patent Document 1).
また、ウェブサイト内で改善すべきポイントの発見を支援する方法としては、ウェブサーバのログファイルに基づいて分析を行うサーバログ型アクセス分析ツールを利用する方法や、分析対象のウェブサイトのコンテンツ内に埋め込まれたJavaScript(登録商標)タグを閲覧ユーザのブラウザが実行する際に、別途用意された閲覧ログ計測サーバにユーザの閲覧情報を付与した上でアクセスを行わせることによって、ユーザの閲覧情報を収集及び分析するウェブビーコン型アクセス分析ツールを利用する方法が存在する(例えば、非特許文献1参照)。 In addition, as a method for supporting the discovery of points that should be improved in the website, a method using a server log type access analysis tool that performs analysis based on the log file of the web server, or the contents of the analyzed website When the browser of the browsing user executes the JavaScript (registered trademark) tag embedded in the user, the browsing information of the user can be accessed by giving the browsing information to the browsing log measurement server prepared separately. There is a method using a web beacon type access analysis tool that collects and analyzes data (see, for example, Non-Patent Document 1).
ウェブサイトの保有者が、自身の保有するウェブサイトのコンテンツや構造の改善を計画する際に、従来から用いられてきたサーバログ型アクセス分析ツールやウェブビーコン型アクセス分析ツールを利用すると、分析対象のウェブサイト、すなわち自身の保有するウェブサイトにおいてユーザに有効に活用されていないコンテンツを把握することは可能である。より詳細には、自身の保有するウェブサイトの他のコンテンツと比較して有効に活用されていないコンテンツを把握することが可能である。しかし、分析対象である自身のウェブサイトと類似する他者のウェブサイトにおける同種のコンテンツと比較している訳ではないため、改善の対象として選んだコンテンツが、実際は他者のウェブサイトにおける同種のコンテンツよりも有効に活用されていたという可能性が存在する。同様に、自身のウェブサイトで有効に働いていると考えていたコンテンツが、他者のウェブサイトにおける同種のコンテンツよりも効率が低かったというようなことも起こりうる。 When a website owner plans to improve the content and structure of his / her own website, the server log type access analysis tool and the web beacon type access analysis tool used in the past can be analyzed. It is possible to grasp the content that is not effectively utilized by the user on the website of the company, that is, the website owned by the user. More specifically, it is possible to grasp content that is not effectively used compared with other content of the website that the user owns. However, since it is not compared with similar content on other websites that are similar to your website being analyzed, the content you choose to improve is actually the same type of content on other websites. There is a possibility that it was used more effectively than content. Similarly, it can happen that content that was considered working effectively on its website was less efficient than similar content on someone else's website.
つまり、従来技術においては、分析対象である自身の保有するウェブサイト内で有効に機能していないコンテンツを特定することは可能であったが、他者の保有するウェブサイトを比較対象として、有効に機能していないコンテンツを特定することは不可能であった。 In other words, in the prior art, it was possible to identify content that was not functioning effectively in the website owned by the subject of analysis, but it was effective to compare websites owned by others. It was impossible to identify content that was not functioning properly.
本発明は上記事情に鑑みてなされたものであり、分析対象のウェブサイトについて、比較対象のウェブサイトと比較可能な指標により、ウェブサイト内でのユーザの動線を分析することができるウェブサイト分析方法、装置、システム、及びプログラムを提供することを目的とする。 The present invention has been made in view of the above circumstances, and a website capable of analyzing a user's flow line in a website by using an index comparable to the website to be compared with respect to the website to be analyzed. An object is to provide an analysis method, an apparatus, a system, and a program.
上記目的を達成するために、本発明のウェブサイト分析方法は、収集手段が、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び前記第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを複数収集するステップと、判別手段が、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別するステップと、分析手段が、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析するステップと、を含む方法である。 In order to achieve the above object, according to the website analysis method of the present invention, the collecting means includes the URL of the first browsing web page in the website browsed by the user and immediately before the first browsing web page. A step of collecting a plurality of browsing logs of the website including the URL of the browsed second browsing web page and acquired at the user terminal ; A regular expression that associates a plurality of functions, each of which has a common definition among a plurality of websites, with a regular expression obtained by extracting a common part in URLs of a plurality of web pages corresponding to each of the functions. A function conversion dictionary, each URL of the first browsing web page included in each of a plurality of browsing logs collected by the collecting means, and the first Determining a function corresponding to each of the first browsing web page and each of the second browsing web pages based on each of the URLs of the browsing web pages, and analyzing means comprising the plurality of browsing Based on the log and the function corresponding to each of the first browsing web page and the second browsing web page determined by the determination means, the browsing transition state of each web page in the website Are analyzed as transition probabilities between functions, which is an index comparable to other websites .
本発明のウェブサイト分析方法によれば、収集手段が、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを複数収集する。そして、判別手段が、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、収集手段が収集した複数の閲覧ログの各々に含まれる第1の閲覧ウェブページのURLの各々及び第2の閲覧ウェブページのURLの各々とに基づいて、第1の閲覧ウェブページの各々及び第2の閲覧ウェブページの各々に対応する機能を判別する。そして、分析手段が、複数の閲覧ログ、及び判別手段が判別した第1の閲覧ウェブページの各々及び第2の閲覧ウェブページの各々に対応する機能に基づいて、ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する。 According to the website analysis method of the present invention, the collecting means includes the URL of the first browsing web page in the website browsed by the user and the second browsing browsed immediately before the first browsing web page. A plurality of browsing logs of websites including URLs of web pages and acquired at the user terminal are collected. Then, for each of a plurality of web page groups having different uses possessed by the website, the discrimination means has a plurality of functions assigned a common definition among the plurality of websites, and a plurality of webs corresponding to each of the functions. A regular expression-function conversion dictionary that associates a regular expression obtained by extracting a common part in the URL of the page, and each URL of the first browsing web page included in each of the plurality of browsing logs collected by the collecting unit and The function corresponding to each of the first browsing web page and each of the second browsing web page is determined based on each of the URLs of the two browsing web pages. Then, each web page in the website is analyzed based on a function corresponding to each of the plurality of browsing logs and each of the first browsing web page and the second browsing web page determined by the determining unit. The transition state of browsing is analyzed as the transition probability between each function, which is an index that can be compared with other websites .
このように、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書を用いて、閲覧ウェブページに対応する機能を判別した上で、機能間の遷移確率を求めるため、ウェブサイト間の違いを吸収し、分析対象のウェブサイトについて、比較対象のウェブサイトと比較可能な指標により、ウェブサイト内での各ウェブページの閲覧の遷移状態、すなわちユーザの動線を分析することができる。 In this way, for each of a plurality of web page groups having different usages that the website has, a plurality of functions having a common definition among the plurality of websites, and a plurality of web pages corresponding to each of the functions. In order to obtain a transition probability between functions after determining a function corresponding to a browsing web page using a regular expression-function conversion dictionary that matches a regular expression obtained by extracting a common part in a URL, between websites It is possible to analyze the transition state of browsing of each web page in the website, that is, the flow line of the user, by absorbing the difference and using the index that can be compared with the website to be compared for the website to be analyzed.
また、前記分析手段が、各遷移状態に対応するウェブページの閲覧数、各遷移状態に対応するウェブページを閲覧したユーザ数、及び各遷移状態に対応するウェブページへのセッション数の少なくとも1つに基づいて、機能間の遷移確率を分析することができる。 In addition, the analysis unit may include at least one of the number of browsing web pages corresponding to each transition state, the number of users viewing the web page corresponding to each transition state, and the number of sessions to the web page corresponding to each transition state. Based on the above, the transition probability between functions can be analyzed.
また、本発明のウェブサイト分析装置は、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び前記第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを複数収集する収集手段と、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別する判別手段と、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する分析手段と、を含んで構成されている。 In addition, the website analysis apparatus of the present invention includes the URL of the first browsing web page in the website browsed by the user and the second browsing web page browsed immediately before the first browsing web page. Collecting means for collecting a plurality of browsing logs of websites including URLs and acquired at the user terminal, and common to a plurality of websites for each of a plurality of web page groups for a plurality of different uses possessed by the websites A regular expression-function conversion dictionary in which a plurality of functions to which a definition is assigned and a regular expression obtained by extracting a common part in URLs of a plurality of web pages corresponding to each of the functions are associated with each other; Based on each of the URLs of the first browsing web page and each of the URLs of the second browsing web page included in each of the browsing logs A discriminating means for discriminating a function corresponding to each of the first browsing web pages and each of the second browsing web pages, the plurality of browsing logs, and the first browsing web discriminated by the discriminating means. Each function which is an index which can compare the transition state of browsing of each web page in the website with other websites based on the function corresponding to each of the pages and the second browsing web page And analyzing means for analyzing as a transition probability between them.
また、本発明のウェブサイト分析システムは、ユーザ端末に組み込まれ、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び前記第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを取得する閲覧ログ取得装置と、前記閲覧ログ取得装置が取得した閲覧ログを複数収集する収集手段、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別する判別手段、並びに、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する分析手段を含むウェブサイト分析装置と、を含んで構成されている。 In addition, the website analysis system of the present invention is incorporated in a user terminal, the URL of the first browsing web page in the website browsed by the user, and the first browsing web page just before the first browsing web page. A browsing log acquisition device for acquiring a browsing log of a website acquired at a user terminal, and a collecting means for collecting a plurality of browsing logs acquired by the browsing log acquisition device; For each of a plurality of web page groups having different uses, a plurality of functions assigned a common definition among a plurality of websites , and a common portion in a URL of a plurality of web pages corresponding to each of the functions Included in each of the regular expression-function conversion dictionary corresponding to the extracted regular expression and the plurality of browsing logs collected by the collecting means Corresponding to each of the first browsing web page and each of the second browsing web page based on each of the URLs of the first browsing web page and each of the URLs of the second browsing web page. Based on the function corresponding to each of the first browsing web page and the second browsing web page determined by the determining means for determining the function, the plurality of browsing logs, and the determining means, A website analysis device including analysis means for analyzing a transition state of browsing of each web page in the website as a transition probability between each function, which is an index comparable to the other websites. ing.
また、本発明のウェブサイト分析プログラムは、コンピュータに、上記のウェブサイト分析方法の各ステップを実行させるためのプログラムである。 Moreover, the website analysis program of this invention is a program for making a computer perform each step of said website analysis method.
以上説明したように、本発明のウェブサイト分析方法、装置、システム、及びプログラムによれば、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能の各々を正規表現した正規表現−機能変換辞書を用いて、閲覧ウェブページに対応する機能を判別した上で、機能間の遷移確率を求めるため、ウェブサイト間の違いを吸収し、分析対象のウェブサイトについて、比較対象のウェブサイトと比較可能な指標により、ウェブサイト内でのユーザの動線を分析することができる、という効果が得られる。 As described above, according to the website analysis method, apparatus, system, and program of the present invention, for each of a plurality of web page groups for different uses that the website has , common to the plurality of websites. Differences between websites to determine transition probabilities between functions after identifying functions corresponding to browsing web pages using regular expression-function conversion dictionaries that regularly express each of a plurality of functions to which definitions have been added. As a result, the flow of the user in the website can be analyzed by using an index that can be compared with the website to be compared.
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、ウェブサイトとして主に電子商取引サイトを想定して説明するが、本発明の分析対象は電子商取引サイトに限定されるものではない。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the present embodiment, an electronic commerce site is mainly assumed as a website. However, the analysis target of the present invention is not limited to the electronic commerce site.
本実施の形態に係るウェブサイト分析システム10は、図1に示すように、ユーザ端末に組み込まれた閲覧ログ取得装置11と、ウェブサイト分析装置12とで構成されている。ウェブサイト分析装置12は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述するウェブサイト分析処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、閲覧ログ収集部13と、閲覧ログ集積データベース(DB)14と、機能判別部15と、URL正規表現−機能変換辞書16と、閲覧ログ分析部17とを含んだ構成で表すことができる。
As shown in FIG. 1, the
閲覧ログ取得装置11は、ユーザがウェブサイトの閲覧を行うユーザ端末に組み込まれる機能である。例えば、ウェブブラウザに追加機能(アドオンとも呼ばれる)として組み込むことができる。閲覧ログ取得装置11は、ユーザがウェブサイト内のウェブページの閲覧を行う度に、ユーザが閲覧しているウェブサイトを一意に識別可能なサイトID、閲覧しているウェブページ(以下、「閲覧ウェブページ」という)のURL、ユーザが現在の閲覧ウェブページの直前に閲覧していたウェブページのURL(以下、「リファラー」という)、各ウェブページを閲覧した閲覧日時、各ウェブページのタイトル、各ウェブページを閲覧しているユーザを一意に識別可能なユーザID等を含む閲覧ログを取得する。
The browsing
なお、閲覧ウェブページが、本発明の第1の閲覧ウェブページの一例であり、リファラーにより示されるウェブページが、本発明の第2の閲覧ウェブページの一例である。 The browsing web page is an example of the first browsing web page of the present invention, and the web page indicated by the referrer is an example of the second browsing web page of the present invention.
閲覧ログ収集部13は、複数のユーザ端末に組み込まれた各閲覧ログ取得装置11から、ネットワークを介して閲覧ログを収集する。閲覧ログ収集の対象とするユーザは、大衆からサンプリングを行うことによって抽出されたユーザとしてもよいが、より効果的に自身の保有するウェブサイトの分析を行うためには、分析対象のウェブサイトの利用者であるユーザを対象として閲覧ログを収集することが望ましい。
The browsing
閲覧ログ収集部13は、収集した閲覧ログを閲覧ログ集積DB14に保存する。閲覧ログ集積DB14の一例を図2に示す。図2の例では、閲覧ログ毎に各項目(ユーザID、サイトID、閲覧日時、閲覧ウェブページのURL、リファラー、及び閲覧ウェブページのタイトル)が順次保存される。なお、リファラーを閲覧ログに含めることなく、ユーザID、サイトID、閲覧日時、及び閲覧ウェブページのURLに基づいて、既に閲覧ログ集積DB14に保存された閲覧ログからリファラーを検索するようにしてもよい。
The browsing
機能判別部15は、URL正規表現−機能変換辞書16を用いて、閲覧ログ集積DB14に蓄積された各閲覧ログに含まれる閲覧ウェブページのURLに対応した機能を判別する。URL正規表現−機能変換辞書16の一例を図3に示す。図3の例では、サイトID、機能、及びURL正規表現が対応付けられている。
The
ここで、機能とは、分析対象のウェブサイト内のウェブページ群において、同一の用途で作成されているウェブページ群を指す。一例として、電子商取引サイトであれば、商品をカート(ウェブサイトによっては「買物かご」と表記されることもある)に投入した際に表示されるウェブページ群が存在することが一般的であり、そのようなウェブページ群を[機能:カート]と定義することが可能である。同様に、電子商取引サイトにおいては、商品の注文手続きを行うためのウェブページ群、注文手続きを完了した際に注文確定を示すウェブページ群、商品の詳細な情報を表示するウェブページ群などが存在し、それぞれ[機能:注文]、[機能:注文確定]、[機能:商品詳細]等のように定義することができる。これにより、同一の用途で作成されたウェブページ群を「機能」として抽象化することができる。 Here, the function refers to a web page group created for the same purpose in the web page group in the website to be analyzed. As an example, in the case of an electronic commerce site, there is generally a web page group that is displayed when a product is put into a cart (sometimes referred to as “shopping basket” depending on the website). Such a web page group can be defined as [function: cart]. Similarly, in the e-commerce site, there are a web page group for ordering products, a web page group for confirming the order when the order procedure is completed, a web page group for displaying detailed product information, etc. [Function: Order], [Function: Order confirmation], [Function: Product details], etc. can be defined. Thereby, web page groups created for the same purpose can be abstracted as “functions”.
URL正規表現とは、分析対象のウェブサイトにおいて、各機能に対応したウェブページ群に共通のURLとして用いられる正規表現である。ここで、電子商取引サイトに限らず、近年の企業が作成主体となっているウェブサイトにおいては、ウェブサイト内の各ウェブページはプログラムにより動的に生成されることが多く、生成されるウェブページのURLが一意になるように、URL中にウェブページや商品等の固有IDをパラメータとして付与する場合が多い。その結果として、同一の機能に対応したウェブページ群においては、URLに着目した場合、パラメータ部分を除いて共通したURLとなっている場合が多い。そこで、各機能に対応したウェブページのURLの各々からパラメータを除いた部分を、その機能に対応したウェブページ群のURL正規表現として定める。図3の例では、URL正規表現の“*”の部分には、元のURLにおいてパラメータが用いられていたことを示す。これにより、効率的にウェブページ群に対応する機能を判別することが可能となる。 The URL regular expression is a regular expression used as a URL common to a group of web pages corresponding to each function in a website to be analyzed. Here, not only electronic commerce sites but also websites created by companies in recent years, each web page in the website is often generated dynamically by a program, and the generated web page In many cases, a unique ID such as a web page or a product is given as a parameter in the URL so that the URL is unique. As a result, in the web page group corresponding to the same function, when paying attention to the URL, the URL is often the same except for the parameter portion. Therefore, a part obtained by removing the parameter from each URL of the web page corresponding to each function is defined as a URL regular expression of the web page group corresponding to the function. In the example of FIG. 3, the “*” portion of the URL regular expression indicates that a parameter was used in the original URL. As a result, it is possible to efficiently determine the function corresponding to the web page group.
また、サイトIDとは、ウェブサイトを一意に識別可能な識別子である。なお、以下では、サイトIDが“A”のウェブサイトをウェブサイトAのように表記する。 The site ID is an identifier that can uniquely identify a website. In the following, a website with a site ID “A” is represented as website A.
なお、各機能に対応したウェブページ群を単一のURL正規表現で表すことができない機能については、URL正規表現を複数登録する必要がある。例えば、ウェブサイトAが、商品の注文手続きを行うためのウェブページとして、2種類のウェブページを有する場合、図3の例に示すように、ウェブサイトAについては、[機能:注文]に対応して、2つのURL正規表現が登録されることになる。 In addition, it is necessary to register a plurality of URL regular expressions for a function that cannot represent a web page group corresponding to each function with a single URL regular expression. For example, when the website A has two types of web pages as web pages for ordering products, the website A corresponds to [function: order] as shown in the example of FIG. Thus, two URL regular expressions are registered.
機能判別部15は、上記のように定義されたURL正規表現−機能変換辞書16において、分析対象のウェブサイトについて定義されたURL正規表現と機能との対応関係を参照して、閲覧ログ集積DB14に蓄積された各閲覧ログに含まれる閲覧ウェブページに対応する機能を判別する。
The
具体的には、URL正規表現−機能変換辞書16において、サイトIDが分析対象のウェブサイトのサイトIDのURL正規表現の各々と、閲覧ログに含まれる閲覧ウェブページのURLとを比較する。URL正規表現のいずれかが閲覧ウェブページのURLにマッチした場合には、そのURL正規表現に対応する機能を、その閲覧ウェブページに対応する機能として判別する。
Specifically, the URL regular expression-
また、機能判別部15は、同様にして、分析対象閲覧ログ集積DB14に蓄積された各閲覧ログに含まれるリファラーに対応する機能も判別する。なお、リファラーに対応する機能については、閲覧ログ集積DB14に蓄積されたサイトIDが“A”の閲覧ログから、リファラーと同一のURLの閲覧ウェブページのURLを検索し、検索された閲覧ウェブページのURLに対応する機能として判別された機能を、そのリファラーに対応する機能として判別してもよい。
Similarly, the
閲覧ログ分析部17は、機能判別部15により判別された閲覧ウェブページの機能に基づいて、分析対象のウェブサイト内でのユーザの動線を分析する。ここで、ユーザの動線とは、ユーザによる分析対象のウェブサイト内での各ウェブページの閲覧の遷移状態をいう。閲覧ログ分析部17は、この遷移状態を表す指標として、機能間の遷移確率を求める。上記のように、機能は、同一の用途のウェブページ群を抽象化したものであるため、機能間の遷移確率を分析することにより、ウェブサイトそれぞれに存在する特徴的なコンテンツ及びサイト構造の違いを吸収して、ユーザの動線を分析することが可能となる。すなわち、分析対象のウェブサイトについて算出された機能間の遷移確率は、比較対象のウェブサイトについて算出された機能間の遷移確率と比較可能な指標として用いることができる。
The browsing
閲覧ログ分析部17は、PV(Page View)数、UU(Unique User)数、またはセッション数の3種類の指標に基づいて、機能間の遷移確率を算出する。
The browsing
例えば、あるウェブサイトAにおいて、[機能:カート]から[機能:注文]への遷移状態を表す遷移確率PA(注文|カート)を求める際に、PV数を用いる場合には、下記(1)式により遷移確率PA(注文|カート)を算出する。 For example, in a certain website A, when obtaining the transition probability P A (order | cart) representing the transition state from [function: cart] to [function: order], when using the PV number, the following (1) ) To calculate the transition probability P A (order | cart).
(1)式において、「URLが[機能:カート]に該当した件数」は、閲覧ログ集積DB14において、サイトIDが“A”で、機能判別部15により閲覧ウェブページのURLに対応する機能が“カート”と判別された行をカウントすることにより得られる。また、「リファラーが[機能:カート]に該当し、かつURLが[機能:注文]に該当した件数」は、閲覧ログ集積DB14において、サイトIDが“A”で、機能判別部15によりリファラーに対応する機能が“カート”と判別され、かつ閲覧ウェブページのURLに対応する機能が“注文”と判別された行をカウントすることにより得られる。
In the formula (1), “the number of URLs corresponding to [function: cart]” has a function corresponding to the URL of the browsing web page by the
UU数を用いて上記のPA(注文|カート)を算出する場合には、(1)式の分子及び分母の各件数を、閲覧ログ集積DB14において、条件に該当する行を保有するユーザIDの数とすればよい。例えば、上記の例の場合、「URLが[機能:カート]に該当した件数」は、閲覧ログ集積DB14において、サイトIDが“A”で、閲覧ウェブページのURLに対応する機能が“カート”の行のユーザIDを重複無しでカウントすることにより得られる。また、「リファラーが[機能:カート]に該当し、かつURLが[機能:注文]に該当した件数」は、閲覧ログ集積DB14において、サイトIDが“A”で、リファラーに対応する機能が“カート”、かつ閲覧ウェブページのURLに対応する機能が“注文”の行のユーザIDを重複無しでカウントすることにより得られる。 When calculating the above P A (order | cart) using the number of UUs, the number of cases of the numerator and denominator of the equation (1) is stored in the viewing log accumulation DB 14 as the user ID that holds the row that meets the condition. The number of For example, in the case of the above example, “the number of URLs corresponding to [function: cart]” indicates that the site ID is “A” in the browsing log accumulation DB 14 and the function corresponding to the URL of the browsing web page is “cart”. It is obtained by counting the user IDs in the rows without duplication. “The number of referrers corresponding to [function: cart] and URL corresponding to [function: order]” indicates that the function corresponding to the referrer is “A” in the browsing log accumulation DB 14 as “ The function corresponding to the URL of the “cart” and the browsing web page is obtained by counting the user ID of the “order” line without duplication.
セッション数を用いて上記のPA(注文|カート)を算出する場合には、閲覧ログ取得装置11において、セッションの終了を、予め設定された時間ウェブページの閲覧が行われなかった場合と定義し、ユーザID単位でセッション毎に閲覧ログを取得する。そして、上記と同様に閲覧ログ収集部13でセッション毎に取得された閲覧ログを収集して、閲覧ログ集積DB14に保存する。遷移確率を算出する際には、上記と同様に、(1)式の分子及び分母に該当する件数を、閲覧ログ集積DB14において、条件に該当する行をカウントすることにより、セッション数に応じた該当件数が得られる。
When calculating the above P A (order | cart) using the number of sessions, the browsing
なお、PV数、UU数、及びセッション数を各々組み合わせて用いて、遷移確率を算出してもよい。 Note that the transition probability may be calculated using a combination of the PV number, the UU number, and the session number.
上記のような遷移確率を、各機能間についてそれぞれ算出する。また、機能間の遷移確率を求める際には、閲覧ログ集積DB14に蓄積された閲覧日時の情報を利用し、特定期間における遷移状態を表す遷移確率を求めることもできる。 The transition probability as described above is calculated for each function. Further, when obtaining the transition probability between functions, it is also possible to obtain a transition probability representing a transition state in a specific period by using information on the browsing date and time stored in the browsing log accumulation DB 14.
次に、本実施の形態のウェブサイト分析システム10の作用について説明する。ユーザ端末において、ユーザによりウェブサイトが閲覧され、閲覧ログ取得装置11により閲覧ログが取得されると、ウェブサイト分析装置12において、CPUがROMから図4に示すウェブサイト分析処理ルーチンを実行するためのプログラムを読み出して実行する。
Next, the operation of the
ステップ100で、閲覧ログ収集部13が、複数のユーザ端末に組み込まれた各閲覧ログ取得装置11から、ネットワークを介して、ユーザID、サイトID、閲覧日時、閲覧ウェブページのURL、リファラー、及び閲覧ウェブページのタイトルの情報を含む閲覧ログを収集し、閲覧ログ集積DB14に保存する。
In
次に、ステップ102で、機能判別部15が、URL正規表現−機能変換辞書16において、サイトIDが分析対象のウェブサイトのサイトIDのURL正規表現の各々と、閲覧ログに含まれる閲覧ウェブページのURLとを比較する。そして、閲覧ウェブページのURLに含まれるURL正規表現を検索し、検索されたURL正規表現に対応する機能を、その閲覧ウェブページに対応する機能として判別する。また、同様にして、分析対象閲覧ログ集積DB14に蓄積された各閲覧ログに含まれるリファラーに対応する機能も判別する。
Next, in
次に、ステップ104で、閲覧ログ分析部17が、閲覧ログ集積DB14に蓄積された閲覧ログ、及び上記ステップ102で判別された各閲覧ウェブページ及びリファラーの各々に対応する機能に基づいて、ユーザによる分析対象のウェブサイト内での各ウェブページの閲覧の遷移状態を表す機能間の遷移確率を算出する。各機能間のそれぞれについて算出された遷移確率を、分析対象のウェブサイトの分析結果として出力し、ウェブサイト分析処理ルーチンを終了する。
Next, in
以上説明したように、本実施の形態のウェブサイト分析システム10によれば、同一の用途のウェブページ群を抽象化した機能を定義し、各機能をURL形式で正規表現したURL正規表現−機能変換辞書を用いて、閲覧ウェブページに対応する機能を判別した上で、機能間の遷移確率を求めるため、ウェブサイトそれぞれに存在する特徴的なコンテンツ及びサイト構造が吸収され、他者の保有するウェブサイトとも比較が容易な指標を算出することができる。このような指標を分析対象のウェブサイト、及び比較対象のウェブサイトについて各々算出して比較することにより、分析対象のウェブサイトにおいて、比較対象のウェブサイトよりも効率の悪い機能、つまり効率の悪いウェブページ群を改善の候補として特定することが可能になる。
As described above, according to the
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.
また、上述のウェブサイト分析装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。 In addition, the website analysis apparatus described above has a computer system inside, but the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used. .
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。 In the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium.
10 ウェブサイト分析システム
11 閲覧ログ取得装置
12 ウェブサイト分析装置
13 閲覧ログ収集部
14 閲覧ログ集積データベース14
15 機能判別部
16 URL正規表現−機能変換辞書
17 閲覧ログ分析部
DESCRIPTION OF
15
Claims (5)
判別手段が、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別するステップと、
分析手段が、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析するステップと、
を含むウェブサイト分析方法。 The collecting means includes the URL of the first browsing web page in the website browsed by the user and the URL of the second browsing web page browsed immediately before the first browsing web page, and the user terminal Collecting a plurality of website browsing logs acquired in
A plurality of functions in which the determination unit assigns a common definition among a plurality of websites to each of a plurality of web page groups having different uses possessed by the website , and a plurality of web pages corresponding to each of the functions Each of the URLs of the first browsing web pages included in each of the plurality of browsing logs collected by the collecting means, Determining a function corresponding to each of the first browsing web page and each of the second browsing web page based on each of the URLs of the second browsing web page;
Based on the function corresponding to each of the plurality of browsing logs and each of the first browsing web page and the second browsing web page determined by the determining unit, Analyzing the transition state of each web page browsing as a transition probability between functions, which is an index comparable to other websites ;
Website analysis method including.
ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別する判別手段と、
前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する分析手段と、
を含むウェブサイト分析装置。 The URL of the first browsing web page in the website browsed by the user and the URL of the second browsing web page browsed immediately before the first browsing web page, and acquired at the user terminal A collection means for collecting multiple website browsing logs;
For each of a plurality of web page groups having different uses on a website, a plurality of functions assigned a common definition among the plurality of websites , and a common URL in a plurality of web pages corresponding to each of the functions A regular expression-function conversion dictionary in which a regular expression from which a part is extracted is associated with each other, each of the URLs of the first browsing web pages included in each of the plurality of browsing logs collected by the collecting unit, and the second Discrimination means for discriminating a function corresponding to each of the first browsing web page and each of the second browsing web page based on each of the URLs of the browsing web pages;
Based on the functions corresponding to each of the plurality of browsing logs and each of the first browsing web pages and each of the second browsing web pages determined by the determination unit, each of the web pages in the website An analysis means for analyzing the transition state of browsing as a transition probability between each function, which is an index that can be compared with other websites ;
Including website analysis equipment.
前記閲覧ログ取得装置が取得した閲覧ログを複数収集する収集手段、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別する判別手段、並びに、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する分析手段を含むウェブサイト分析装置と、
を含むウェブサイト分析システム。 A URL of a first browsing web page in a website browsed by a user, which is incorporated in a user terminal, and a URL of a second browsing web page browsed immediately before the first browsing web page; and A browsing log acquisition device for acquiring a browsing log of a website acquired in a user terminal;
Collecting means for collecting a plurality of browsing logs acquired by the browsing log acquisition device, and a plurality of functions provided with a common definition among a plurality of websites for each of a plurality of different web page groups possessed by the website And a regular expression-function conversion dictionary that associates a regular expression obtained by extracting common parts in URLs of a plurality of web pages corresponding to each of the functions, and a plurality of browsing logs collected by the collecting means Corresponding to each of the first browsing web page and each of the second browsing web page based on each of the URLs of the first browsing web page and each of the URLs of the second browsing web page A discriminating means for discriminating a function to be performed, each of the plurality of browsing logs, each of the first browsing web pages determined by the discriminating means, and the second browsing web. Based on the function corresponding to each of the Bupeji, the analysis means for analyzing the transition state of viewing of each web page in the web site, the transition probabilities between each feature in a comparable indicator with other websites Including a website analysis device,
Including website analysis system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012048285A JP5705772B2 (en) | 2012-03-05 | 2012-03-05 | Website analysis method, apparatus, system, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012048285A JP5705772B2 (en) | 2012-03-05 | 2012-03-05 | Website analysis method, apparatus, system, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013182602A JP2013182602A (en) | 2013-09-12 |
JP5705772B2 true JP5705772B2 (en) | 2015-04-22 |
Family
ID=49273177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012048285A Active JP5705772B2 (en) | 2012-03-05 | 2012-03-05 | Website analysis method, apparatus, system, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5705772B2 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7216056B2 (en) * | 2001-12-06 | 2007-05-08 | C-Live, Inc. | Access log analyzer and access log analyzing method |
JP2004280501A (en) * | 2003-03-17 | 2004-10-07 | Nri & Ncc Co Ltd | Web traffic line analysis system |
JP2009230566A (en) * | 2008-03-24 | 2009-10-08 | Nifty Corp | Profile processing method and apparatus |
-
2012
- 2012-03-05 JP JP2012048285A patent/JP5705772B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013182602A (en) | 2013-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102663000B (en) | The maliciously recognition methods of the method for building up of network address database, maliciously network address and device | |
CN106934627B (en) | Method and device for detecting cheating behaviors of e-commerce industry | |
Petricek et al. | The web structure of e-government-developing a methodology for quantitative evaluation | |
CN106021583B (en) | Statistical method and system for page flow data | |
CN105808639B (en) | Network access behavior identification method and device | |
CN1949259B (en) | Method for collecting click information of web page by embedding code in web page | |
WO2016101777A1 (en) | Analysis and collection system for user interest data and method therefor | |
TW201513019A (en) | Method and system for extracting user behavior features to personalize recommendations | |
CN112434208A (en) | Training of isolated forest and identification method and related device of web crawler of isolated forest | |
US20090222426A1 (en) | Computer-Implemented System And Method For Analyzing Search Queries | |
CN109242553A (en) | A kind of user behavior data recommended method, server and computer-readable medium | |
KR20180075852A (en) | System and method for intelligent marketing analysis through processing non-fixed form bigdata | |
CN108304410A (en) | A kind of detection method, device and the data analysing method of the abnormal access page | |
JP2009223456A (en) | Price investigation system and price investigation method | |
US10614500B2 (en) | Identifying search friendly web pages | |
TW201329890A (en) | Processing method and system of shop visiting data | |
JP5511782B2 (en) | New advertisement capable URL providing system and new advertisement capable URL providing method | |
JP2011034399A (en) | Method, device and program for extracting relevance of web pages | |
CN108280102A (en) | Internet behavior recording method, device and user terminal | |
Bari et al. | Web usage mining | |
JP5705772B2 (en) | Website analysis method, apparatus, system, and program | |
JP2010218475A (en) | Blog analysis method and device | |
JP2016118957A (en) | Server device, system, information processing method, and program | |
CN102360484B (en) | Group buying websites sales data verity detection method and device | |
CN117040827A (en) | Abnormal account detection method and device, storage medium and electronic equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141118 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5705772 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |