JP5705772B2 - Website analysis method, apparatus, system, and program - Google Patents

Website analysis method, apparatus, system, and program Download PDF

Info

Publication number
JP5705772B2
JP5705772B2 JP2012048285A JP2012048285A JP5705772B2 JP 5705772 B2 JP5705772 B2 JP 5705772B2 JP 2012048285 A JP2012048285 A JP 2012048285A JP 2012048285 A JP2012048285 A JP 2012048285A JP 5705772 B2 JP5705772 B2 JP 5705772B2
Authority
JP
Japan
Prior art keywords
browsing
web page
website
url
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012048285A
Other languages
Japanese (ja)
Other versions
JP2013182602A (en
Inventor
滋 藤村
滋 藤村
内山 匡
匡 内山
杉崎 正之
正之 杉崎
裕介 市川
裕介 市川
典子 高屋
典子 高屋
健司 江崎
健司 江崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012048285A priority Critical patent/JP5705772B2/en
Publication of JP2013182602A publication Critical patent/JP2013182602A/en
Application granted granted Critical
Publication of JP5705772B2 publication Critical patent/JP5705772B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ウェブサイト分析方法、装置、システム、及びプログラムに係り、特に、ウェブサイト内でのユーザの動線を分析するためのウェブサイト分析方法、装置、システム、及びプログラムに関する。   The present invention relates to a website analysis method, apparatus, system, and program, and more particularly, to a website analysis method, apparatus, system, and program for analyzing a user's flow line in a website.

ウェブサイト、特に電子商取引サイトの保有者にとって、保有するウェブサイトのユーザにとっての体感品質やユーザの利用状況を常々把握し、コンテンツや構造の改善を通して、利用者数及び利用効率の向上に繋げることは重要である。   For website owners, especially e-commerce site owners, to constantly grasp the quality of experience and usage of users for the website users, and to improve the number of users and usage efficiency through improvements in content and structure Is important.

例えば、ユーザの体感品質を定量的に測定する方法としては、ウェブサーバとユーザ端末との間の当該ウェブサイトの転送時間を推定して、ユーザが当該ウェブサイトを閲覧する際の通信品質を測定する方法が提案されている(例えば、特許文献1参照)。   For example, as a method of quantitatively measuring the user's quality of experience, the transfer time of the website between the web server and the user terminal is estimated, and the communication quality when the user browses the website is measured. A method has been proposed (see, for example, Patent Document 1).

また、ウェブサイト内で改善すべきポイントの発見を支援する方法としては、ウェブサーバのログファイルに基づいて分析を行うサーバログ型アクセス分析ツールを利用する方法や、分析対象のウェブサイトのコンテンツ内に埋め込まれたJavaScript(登録商標)タグを閲覧ユーザのブラウザが実行する際に、別途用意された閲覧ログ計測サーバにユーザの閲覧情報を付与した上でアクセスを行わせることによって、ユーザの閲覧情報を収集及び分析するウェブビーコン型アクセス分析ツールを利用する方法が存在する(例えば、非特許文献1参照)。   In addition, as a method for supporting the discovery of points that should be improved in the website, a method using a server log type access analysis tool that performs analysis based on the log file of the web server, or the contents of the analyzed website When the browser of the browsing user executes the JavaScript (registered trademark) tag embedded in the user, the browsing information of the user can be accessed by giving the browsing information to the browsing log measurement server prepared separately. There is a method using a web beacon type access analysis tool that collects and analyzes data (see, for example, Non-Patent Document 1).

特開2004−78712号公報JP 2004-78712 A

渡邊裕一、服部哲、速水治夫、「IP地理位置情報を付加したアクセスログの時間的空間的分析システムの提案」、情報処理学会、研究報告−グループウェアとネットワークサービス(GN)、Vol2009、No.33,pp.103−107.Yuichi Watanabe, Satoshi Hattori, Haruo Hayami, "Proposal of Temporal and Spatial Analysis System for Access Logs with IP Geolocation Information", Information Processing Society of Japan, Research Report-Groupware and Network Services (GN), Vol 2009, No. 33, pp. 103-107.

ウェブサイトの保有者が、自身の保有するウェブサイトのコンテンツや構造の改善を計画する際に、従来から用いられてきたサーバログ型アクセス分析ツールやウェブビーコン型アクセス分析ツールを利用すると、分析対象のウェブサイト、すなわち自身の保有するウェブサイトにおいてユーザに有効に活用されていないコンテンツを把握することは可能である。より詳細には、自身の保有するウェブサイトの他のコンテンツと比較して有効に活用されていないコンテンツを把握することが可能である。しかし、分析対象である自身のウェブサイトと類似する他者のウェブサイトにおける同種のコンテンツと比較している訳ではないため、改善の対象として選んだコンテンツが、実際は他者のウェブサイトにおける同種のコンテンツよりも有効に活用されていたという可能性が存在する。同様に、自身のウェブサイトで有効に働いていると考えていたコンテンツが、他者のウェブサイトにおける同種のコンテンツよりも効率が低かったというようなことも起こりうる。   When a website owner plans to improve the content and structure of his / her own website, the server log type access analysis tool and the web beacon type access analysis tool used in the past can be analyzed. It is possible to grasp the content that is not effectively utilized by the user on the website of the company, that is, the website owned by the user. More specifically, it is possible to grasp content that is not effectively used compared with other content of the website that the user owns. However, since it is not compared with similar content on other websites that are similar to your website being analyzed, the content you choose to improve is actually the same type of content on other websites. There is a possibility that it was used more effectively than content. Similarly, it can happen that content that was considered working effectively on its website was less efficient than similar content on someone else's website.

つまり、従来技術においては、分析対象である自身の保有するウェブサイト内で有効に機能していないコンテンツを特定することは可能であったが、他者の保有するウェブサイトを比較対象として、有効に機能していないコンテンツを特定することは不可能であった。   In other words, in the prior art, it was possible to identify content that was not functioning effectively in the website owned by the subject of analysis, but it was effective to compare websites owned by others. It was impossible to identify content that was not functioning properly.

本発明は上記事情に鑑みてなされたものであり、分析対象のウェブサイトについて、比較対象のウェブサイトと比較可能な指標により、ウェブサイト内でのユーザの動線を分析することができるウェブサイト分析方法、装置、システム、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and a website capable of analyzing a user's flow line in a website by using an index comparable to the website to be compared with respect to the website to be analyzed. An object is to provide an analysis method, an apparatus, a system, and a program.

上記目的を達成するために、本発明のウェブサイト分析方法は、収集手段が、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び前記第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを複数収集するステップと、判別手段が、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別するステップと、分析手段が、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析するステップと、を含む方法である。 In order to achieve the above object, according to the website analysis method of the present invention, the collecting means includes the URL of the first browsing web page in the website browsed by the user and immediately before the first browsing web page. A step of collecting a plurality of browsing logs of the website including the URL of the browsed second browsing web page and acquired at the user terminal ; A regular expression that associates a plurality of functions, each of which has a common definition among a plurality of websites, with a regular expression obtained by extracting a common part in URLs of a plurality of web pages corresponding to each of the functions. A function conversion dictionary, each URL of the first browsing web page included in each of a plurality of browsing logs collected by the collecting means, and the first Determining a function corresponding to each of the first browsing web page and each of the second browsing web pages based on each of the URLs of the browsing web pages, and analyzing means comprising the plurality of browsing Based on the log and the function corresponding to each of the first browsing web page and the second browsing web page determined by the determination means, the browsing transition state of each web page in the website Are analyzed as transition probabilities between functions, which is an index comparable to other websites .

本発明のウェブサイト分析方法によれば、収集手段が、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを複数収集する。そして、判別手段が、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、収集手段が収集した複数の閲覧ログの各々に含まれる第1の閲覧ウェブページのURLの各々及び第2の閲覧ウェブページのURLの各々とに基づいて、第1の閲覧ウェブページの各々及び第2の閲覧ウェブページの各々に対応する機能を判別する。そして、分析手段が、複数の閲覧ログ、及び判別手段が判別した第1の閲覧ウェブページの各々及び第2の閲覧ウェブページの各々に対応する機能に基づいて、ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する。 According to the website analysis method of the present invention, the collecting means includes the URL of the first browsing web page in the website browsed by the user and the second browsing browsed immediately before the first browsing web page. A plurality of browsing logs of websites including URLs of web pages and acquired at the user terminal are collected. Then, for each of a plurality of web page groups having different uses possessed by the website, the discrimination means has a plurality of functions assigned a common definition among the plurality of websites, and a plurality of webs corresponding to each of the functions. A regular expression-function conversion dictionary that associates a regular expression obtained by extracting a common part in the URL of the page, and each URL of the first browsing web page included in each of the plurality of browsing logs collected by the collecting unit and The function corresponding to each of the first browsing web page and each of the second browsing web page is determined based on each of the URLs of the two browsing web pages. Then, each web page in the website is analyzed based on a function corresponding to each of the plurality of browsing logs and each of the first browsing web page and the second browsing web page determined by the determining unit. The transition state of browsing is analyzed as the transition probability between each function, which is an index that can be compared with other websites .

このように、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書を用いて、閲覧ウェブページに対応する機能を判別した上で、機能間の遷移確率を求めるため、ウェブサイト間の違いを吸収し、分析対象のウェブサイトについて、比較対象のウェブサイトと比較可能な指標により、ウェブサイト内での各ウェブページの閲覧の遷移状態、すなわちユーザの動線を分析することができる。 In this way, for each of a plurality of web page groups having different usages that the website has, a plurality of functions having a common definition among the plurality of websites, and a plurality of web pages corresponding to each of the functions. In order to obtain a transition probability between functions after determining a function corresponding to a browsing web page using a regular expression-function conversion dictionary that matches a regular expression obtained by extracting a common part in a URL, between websites It is possible to analyze the transition state of browsing of each web page in the website, that is, the flow line of the user, by absorbing the difference and using the index that can be compared with the website to be compared for the website to be analyzed.

また、前記分析手段が、各遷移状態に対応するウェブページの閲覧数、各遷移状態に対応するウェブページを閲覧したユーザ数、及び各遷移状態に対応するウェブページへのセッション数の少なくとも1つに基づいて、機能間の遷移確率を分析することができる。   In addition, the analysis unit may include at least one of the number of browsing web pages corresponding to each transition state, the number of users viewing the web page corresponding to each transition state, and the number of sessions to the web page corresponding to each transition state. Based on the above, the transition probability between functions can be analyzed.

また、本発明のウェブサイト分析装置は、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び前記第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを複数収集する収集手段と、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別する判別手段と、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する分析手段と、を含んで構成されている。 In addition, the website analysis apparatus of the present invention includes the URL of the first browsing web page in the website browsed by the user and the second browsing web page browsed immediately before the first browsing web page. Collecting means for collecting a plurality of browsing logs of websites including URLs and acquired at the user terminal, and common to a plurality of websites for each of a plurality of web page groups for a plurality of different uses possessed by the websites A regular expression-function conversion dictionary in which a plurality of functions to which a definition is assigned and a regular expression obtained by extracting a common part in URLs of a plurality of web pages corresponding to each of the functions are associated with each other; Based on each of the URLs of the first browsing web page and each of the URLs of the second browsing web page included in each of the browsing logs A discriminating means for discriminating a function corresponding to each of the first browsing web pages and each of the second browsing web pages, the plurality of browsing logs, and the first browsing web discriminated by the discriminating means. Each function which is an index which can compare the transition state of browsing of each web page in the website with other websites based on the function corresponding to each of the pages and the second browsing web page And analyzing means for analyzing as a transition probability between them.

また、本発明のウェブサイト分析システムは、ユーザ端末に組み込まれ、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び前記第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを取得する閲覧ログ取得装置と、前記閲覧ログ取得装置が取得した閲覧ログを複数収集する収集手段、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別する判別手段、並びに、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する分析手段を含むウェブサイト分析装置と、を含んで構成されている。 In addition, the website analysis system of the present invention is incorporated in a user terminal, the URL of the first browsing web page in the website browsed by the user, and the first browsing web page just before the first browsing web page. A browsing log acquisition device for acquiring a browsing log of a website acquired at a user terminal, and a collecting means for collecting a plurality of browsing logs acquired by the browsing log acquisition device; For each of a plurality of web page groups having different uses, a plurality of functions assigned a common definition among a plurality of websites , and a common portion in a URL of a plurality of web pages corresponding to each of the functions Included in each of the regular expression-function conversion dictionary corresponding to the extracted regular expression and the plurality of browsing logs collected by the collecting means Corresponding to each of the first browsing web page and each of the second browsing web page based on each of the URLs of the first browsing web page and each of the URLs of the second browsing web page. Based on the function corresponding to each of the first browsing web page and the second browsing web page determined by the determining means for determining the function, the plurality of browsing logs, and the determining means, A website analysis device including analysis means for analyzing a transition state of browsing of each web page in the website as a transition probability between each function, which is an index comparable to the other websites. ing.

また、本発明のウェブサイト分析プログラムは、コンピュータに、上記のウェブサイト分析方法の各ステップを実行させるためのプログラムである。   Moreover, the website analysis program of this invention is a program for making a computer perform each step of said website analysis method.

以上説明したように、本発明のウェブサイト分析方法、装置、システム、及びプログラムによれば、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能の各々を正規表現した正規表現−機能変換辞書を用いて、閲覧ウェブページに対応する機能を判別した上で、機能間の遷移確率を求めるため、ウェブサイト間の違いを吸収し、分析対象のウェブサイトについて、比較対象のウェブサイトと比較可能な指標により、ウェブサイト内でのユーザの動線を分析することができる、という効果が得られる。 As described above, according to the website analysis method, apparatus, system, and program of the present invention, for each of a plurality of web page groups for different uses that the website has , common to the plurality of websites. Differences between websites to determine transition probabilities between functions after identifying functions corresponding to browsing web pages using regular expression-function conversion dictionaries that regularly express each of a plurality of functions to which definitions have been added. As a result, the flow of the user in the website can be analyzed by using an index that can be compared with the website to be compared.

本実施の形態に係るウェブサイト分析システムの機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the website analysis system which concerns on this Embodiment. 閲覧ログ集積データベースの一例を示す図である。It is a figure which shows an example of a browsing log accumulation | storage database. URL正規表現−機能変換辞書の一例を示す図である。It is a figure which shows an example of a URL regular expression-function conversion dictionary. 本実施の形態に係るウェブサイト分析装置におけるウェブサイト分析処理ルーチンの内容を示すフローチャートである。It is a flowchart which shows the content of the website analysis processing routine in the website analysis apparatus which concerns on this Embodiment.

以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、ウェブサイトとして主に電子商取引サイトを想定して説明するが、本発明の分析対象は電子商取引サイトに限定されるものではない。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the present embodiment, an electronic commerce site is mainly assumed as a website. However, the analysis target of the present invention is not limited to the electronic commerce site.

本実施の形態に係るウェブサイト分析システム10は、図1に示すように、ユーザ端末に組み込まれた閲覧ログ取得装置11と、ウェブサイト分析装置12とで構成されている。ウェブサイト分析装置12は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述するウェブサイト分析処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、閲覧ログ収集部13と、閲覧ログ集積データベース(DB)14と、機能判別部15と、URL正規表現−機能変換辞書16と、閲覧ログ分析部17とを含んだ構成で表すことができる。   As shown in FIG. 1, the website analysis system 10 according to the present embodiment includes a browsing log acquisition device 11 incorporated in a user terminal and a website analysis device 12. The website analysis device 12 includes a CPU (Central Processing Unit), a RAM (Random Access Memory), and a ROM (Read Only Memory) that stores a program for executing a website analysis processing routine to be described later. It consists of As shown in FIG. 1, this computer functionally includes a browsing log collection unit 13, a browsing log accumulation database (DB) 14, a function determination unit 15, a URL regular expression-function conversion dictionary 16, a browsing It can be expressed by a configuration including the log analysis unit 17.

閲覧ログ取得装置11は、ユーザがウェブサイトの閲覧を行うユーザ端末に組み込まれる機能である。例えば、ウェブブラウザに追加機能(アドオンとも呼ばれる)として組み込むことができる。閲覧ログ取得装置11は、ユーザがウェブサイト内のウェブページの閲覧を行う度に、ユーザが閲覧しているウェブサイトを一意に識別可能なサイトID、閲覧しているウェブページ(以下、「閲覧ウェブページ」という)のURL、ユーザが現在の閲覧ウェブページの直前に閲覧していたウェブページのURL(以下、「リファラー」という)、各ウェブページを閲覧した閲覧日時、各ウェブページのタイトル、各ウェブページを閲覧しているユーザを一意に識別可能なユーザID等を含む閲覧ログを取得する。   The browsing log acquisition device 11 is a function incorporated in a user terminal where a user browses a website. For example, it can be incorporated into a web browser as an additional function (also called an add-on). Each time the user browses a web page in the website, the browsing log acquisition device 11 has a site ID that can uniquely identify the website that the user is browsing, a web page that is being browsed (hereinafter referred to as “browsing”). URL of web page), URL of the web page that the user was browsing immediately before the current browsing web page (hereinafter referred to as “referrer”), browsing date and time when browsing each web page, title of each web page, A browsing log including a user ID that can uniquely identify a user browsing each web page is acquired.

なお、閲覧ウェブページが、本発明の第1の閲覧ウェブページの一例であり、リファラーにより示されるウェブページが、本発明の第2の閲覧ウェブページの一例である。   The browsing web page is an example of the first browsing web page of the present invention, and the web page indicated by the referrer is an example of the second browsing web page of the present invention.

閲覧ログ収集部13は、複数のユーザ端末に組み込まれた各閲覧ログ取得装置11から、ネットワークを介して閲覧ログを収集する。閲覧ログ収集の対象とするユーザは、大衆からサンプリングを行うことによって抽出されたユーザとしてもよいが、より効果的に自身の保有するウェブサイトの分析を行うためには、分析対象のウェブサイトの利用者であるユーザを対象として閲覧ログを収集することが望ましい。   The browsing log collection unit 13 collects browsing logs from each browsing log acquisition device 11 incorporated in a plurality of user terminals via a network. The user who is the target of browsing log collection may be a user extracted by sampling from the public, but in order to analyze the website owned by the user more effectively, the website of the analysis target website It is desirable to collect browsing logs for users who are users.

閲覧ログ収集部13は、収集した閲覧ログを閲覧ログ集積DB14に保存する。閲覧ログ集積DB14の一例を図2に示す。図2の例では、閲覧ログ毎に各項目(ユーザID、サイトID、閲覧日時、閲覧ウェブページのURL、リファラー、及び閲覧ウェブページのタイトル)が順次保存される。なお、リファラーを閲覧ログに含めることなく、ユーザID、サイトID、閲覧日時、及び閲覧ウェブページのURLに基づいて、既に閲覧ログ集積DB14に保存された閲覧ログからリファラーを検索するようにしてもよい。   The browsing log collection unit 13 stores the collected browsing logs in the browsing log accumulation DB 14. An example of the browsing log accumulation DB 14 is shown in FIG. In the example of FIG. 2, each item (user ID, site ID, browsing date, browsing web page URL, referrer, browsing web page title) is sequentially stored for each browsing log. Note that the referrer may be searched from the browsing log already stored in the browsing log accumulation DB 14 based on the user ID, the site ID, the browsing date and the URL of the browsing web page, without including the referrer in the browsing log. Good.

機能判別部15は、URL正規表現−機能変換辞書16を用いて、閲覧ログ集積DB14に蓄積された各閲覧ログに含まれる閲覧ウェブページのURLに対応した機能を判別する。URL正規表現−機能変換辞書16の一例を図3に示す。図3の例では、サイトID、機能、及びURL正規表現が対応付けられている。   The function determination unit 15 uses the URL regular expression-function conversion dictionary 16 to determine a function corresponding to the URL of the browsing web page included in each browsing log accumulated in the browsing log accumulation DB 14. An example of the URL regular expression-function conversion dictionary 16 is shown in FIG. In the example of FIG. 3, a site ID, a function, and a URL regular expression are associated with each other.

ここで、機能とは、分析対象のウェブサイト内のウェブページ群において、同一の用途で作成されているウェブページ群を指す。一例として、電子商取引サイトであれば、商品をカート(ウェブサイトによっては「買物かご」と表記されることもある)に投入した際に表示されるウェブページ群が存在することが一般的であり、そのようなウェブページ群を[機能:カート]と定義することが可能である。同様に、電子商取引サイトにおいては、商品の注文手続きを行うためのウェブページ群、注文手続きを完了した際に注文確定を示すウェブページ群、商品の詳細な情報を表示するウェブページ群などが存在し、それぞれ[機能:注文]、[機能:注文確定]、[機能:商品詳細]等のように定義することができる。これにより、同一の用途で作成されたウェブページ群を「機能」として抽象化することができる。   Here, the function refers to a web page group created for the same purpose in the web page group in the website to be analyzed. As an example, in the case of an electronic commerce site, there is generally a web page group that is displayed when a product is put into a cart (sometimes referred to as “shopping basket” depending on the website). Such a web page group can be defined as [function: cart]. Similarly, in the e-commerce site, there are a web page group for ordering products, a web page group for confirming the order when the order procedure is completed, a web page group for displaying detailed product information, etc. [Function: Order], [Function: Order confirmation], [Function: Product details], etc. can be defined. Thereby, web page groups created for the same purpose can be abstracted as “functions”.

URL正規表現とは、分析対象のウェブサイトにおいて、各機能に対応したウェブページ群に共通のURLとして用いられる正規表現である。ここで、電子商取引サイトに限らず、近年の企業が作成主体となっているウェブサイトにおいては、ウェブサイト内の各ウェブページはプログラムにより動的に生成されることが多く、生成されるウェブページのURLが一意になるように、URL中にウェブページや商品等の固有IDをパラメータとして付与する場合が多い。その結果として、同一の機能に対応したウェブページ群においては、URLに着目した場合、パラメータ部分を除いて共通したURLとなっている場合が多い。そこで、各機能に対応したウェブページのURLの各々からパラメータを除いた部分を、その機能に対応したウェブページ群のURL正規表現として定める。図3の例では、URL正規表現の“*”の部分には、元のURLにおいてパラメータが用いられていたことを示す。これにより、効率的にウェブページ群に対応する機能を判別することが可能となる。   The URL regular expression is a regular expression used as a URL common to a group of web pages corresponding to each function in a website to be analyzed. Here, not only electronic commerce sites but also websites created by companies in recent years, each web page in the website is often generated dynamically by a program, and the generated web page In many cases, a unique ID such as a web page or a product is given as a parameter in the URL so that the URL is unique. As a result, in the web page group corresponding to the same function, when paying attention to the URL, the URL is often the same except for the parameter portion. Therefore, a part obtained by removing the parameter from each URL of the web page corresponding to each function is defined as a URL regular expression of the web page group corresponding to the function. In the example of FIG. 3, the “*” portion of the URL regular expression indicates that a parameter was used in the original URL. As a result, it is possible to efficiently determine the function corresponding to the web page group.

また、サイトIDとは、ウェブサイトを一意に識別可能な識別子である。なお、以下では、サイトIDが“A”のウェブサイトをウェブサイトAのように表記する。   The site ID is an identifier that can uniquely identify a website. In the following, a website with a site ID “A” is represented as website A.

なお、各機能に対応したウェブページ群を単一のURL正規表現で表すことができない機能については、URL正規表現を複数登録する必要がある。例えば、ウェブサイトAが、商品の注文手続きを行うためのウェブページとして、2種類のウェブページを有する場合、図3の例に示すように、ウェブサイトAについては、[機能:注文]に対応して、2つのURL正規表現が登録されることになる。   In addition, it is necessary to register a plurality of URL regular expressions for a function that cannot represent a web page group corresponding to each function with a single URL regular expression. For example, when the website A has two types of web pages as web pages for ordering products, the website A corresponds to [function: order] as shown in the example of FIG. Thus, two URL regular expressions are registered.

機能判別部15は、上記のように定義されたURL正規表現−機能変換辞書16において、分析対象のウェブサイトについて定義されたURL正規表現と機能との対応関係を参照して、閲覧ログ集積DB14に蓄積された各閲覧ログに含まれる閲覧ウェブページに対応する機能を判別する。   The function discriminating unit 15 refers to the correspondence between the URL regular expression defined for the website to be analyzed and the function in the URL regular expression-function conversion dictionary 16 defined as described above, and the browsing log accumulation DB 14 The function corresponding to the browsing web page included in each browsing log accumulated in the database is determined.

具体的には、URL正規表現−機能変換辞書16において、サイトIDが分析対象のウェブサイトのサイトIDのURL正規表現の各々と、閲覧ログに含まれる閲覧ウェブページのURLとを比較する。URL正規表現のいずれかが閲覧ウェブページのURLにマッチした場合には、そのURL正規表現に対応する機能を、その閲覧ウェブページに対応する機能として判別する。   Specifically, the URL regular expression-function conversion dictionary 16 compares each URL regular expression of the site ID of the website whose analysis target is the site ID with the URL of the browsing web page included in the browsing log. If any of the URL regular expressions matches the URL of the browsing web page, the function corresponding to the URL regular expression is determined as the function corresponding to the browsing web page.

また、機能判別部15は、同様にして、分析対象閲覧ログ集積DB14に蓄積された各閲覧ログに含まれるリファラーに対応する機能も判別する。なお、リファラーに対応する機能については、閲覧ログ集積DB14に蓄積されたサイトIDが“A”の閲覧ログから、リファラーと同一のURLの閲覧ウェブページのURLを検索し、検索された閲覧ウェブページのURLに対応する機能として判別された機能を、そのリファラーに対応する機能として判別してもよい。   Similarly, the function determination unit 15 also determines the function corresponding to the referrer included in each browsing log accumulated in the analysis target browsing log accumulation DB 14. As for the function corresponding to the referrer, the URL of the browsing web page having the same URL as the referer is searched from the browsing log having the site ID “A” stored in the browsing log accumulation DB 14, and the browsing web page searched The function determined as the function corresponding to the URL may be determined as the function corresponding to the referrer.

閲覧ログ分析部17は、機能判別部15により判別された閲覧ウェブページの機能に基づいて、分析対象のウェブサイト内でのユーザの動線を分析する。ここで、ユーザの動線とは、ユーザによる分析対象のウェブサイト内での各ウェブページの閲覧の遷移状態をいう。閲覧ログ分析部17は、この遷移状態を表す指標として、機能間の遷移確率を求める。上記のように、機能は、同一の用途のウェブページ群を抽象化したものであるため、機能間の遷移確率を分析することにより、ウェブサイトそれぞれに存在する特徴的なコンテンツ及びサイト構造の違いを吸収して、ユーザの動線を分析することが可能となる。すなわち、分析対象のウェブサイトについて算出された機能間の遷移確率は、比較対象のウェブサイトについて算出された機能間の遷移確率と比較可能な指標として用いることができる。   The browsing log analysis unit 17 analyzes the user's flow line in the analysis target website based on the browsing web page function determined by the function determination unit 15. Here, the user's flow line refers to a transition state of browsing of each web page in the website to be analyzed by the user. The browsing log analysis part 17 calculates | requires the transition probability between functions as a parameter | index showing this transition state. As described above, since the functions are abstracted from a group of web pages for the same purpose, the difference in characteristic content and site structure existing in each website is analyzed by analyzing the transition probability between functions. It is possible to analyze the user's flow line. That is, the transition probability between functions calculated for the website to be analyzed can be used as an index that can be compared with the transition probability between functions calculated for the website to be compared.

閲覧ログ分析部17は、PV(Page View)数、UU(Unique User)数、またはセッション数の3種類の指標に基づいて、機能間の遷移確率を算出する。   The browsing log analysis unit 17 calculates transition probabilities between functions based on three types of indicators: the number of PV (Page View), the number of UU (Unique User), or the number of sessions.

例えば、あるウェブサイトAにおいて、[機能:カート]から[機能:注文]への遷移状態を表す遷移確率P(注文|カート)を求める際に、PV数を用いる場合には、下記(1)式により遷移確率P(注文|カート)を算出する。 For example, in a certain website A, when obtaining the transition probability P A (order | cart) representing the transition state from [function: cart] to [function: order], when using the PV number, the following (1) ) To calculate the transition probability P A (order | cart).

Figure 0005705772
Figure 0005705772

(1)式において、「URLが[機能:カート]に該当した件数」は、閲覧ログ集積DB14において、サイトIDが“A”で、機能判別部15により閲覧ウェブページのURLに対応する機能が“カート”と判別された行をカウントすることにより得られる。また、「リファラーが[機能:カート]に該当し、かつURLが[機能:注文]に該当した件数」は、閲覧ログ集積DB14において、サイトIDが“A”で、機能判別部15によりリファラーに対応する機能が“カート”と判別され、かつ閲覧ウェブページのURLに対応する機能が“注文”と判別された行をカウントすることにより得られる。   In the formula (1), “the number of URLs corresponding to [function: cart]” has a function corresponding to the URL of the browsing web page by the function determination unit 15 with the site ID “A” in the browsing log accumulation DB 14. It is obtained by counting the lines identified as “cart”. In addition, “the number of cases where the referrer corresponds to [function: cart] and the URL corresponds to [function: order]” is the site ID “A” in the browsing log accumulation DB 14 and is referred to by the function determination unit 15. It is obtained by counting the lines in which the corresponding function is determined as “cart” and the function corresponding to the URL of the browsing web page is determined as “order”.

UU数を用いて上記のP(注文|カート)を算出する場合には、(1)式の分子及び分母の各件数を、閲覧ログ集積DB14において、条件に該当する行を保有するユーザIDの数とすればよい。例えば、上記の例の場合、「URLが[機能:カート]に該当した件数」は、閲覧ログ集積DB14において、サイトIDが“A”で、閲覧ウェブページのURLに対応する機能が“カート”の行のユーザIDを重複無しでカウントすることにより得られる。また、「リファラーが[機能:カート]に該当し、かつURLが[機能:注文]に該当した件数」は、閲覧ログ集積DB14において、サイトIDが“A”で、リファラーに対応する機能が“カート”、かつ閲覧ウェブページのURLに対応する機能が“注文”の行のユーザIDを重複無しでカウントすることにより得られる。 When calculating the above P A (order | cart) using the number of UUs, the number of cases of the numerator and denominator of the equation (1) is stored in the viewing log accumulation DB 14 as the user ID that holds the row that meets the condition. The number of For example, in the case of the above example, “the number of URLs corresponding to [function: cart]” indicates that the site ID is “A” in the browsing log accumulation DB 14 and the function corresponding to the URL of the browsing web page is “cart”. It is obtained by counting the user IDs in the rows without duplication. “The number of referrers corresponding to [function: cart] and URL corresponding to [function: order]” indicates that the function corresponding to the referrer is “A” in the browsing log accumulation DB 14 as “ The function corresponding to the URL of the “cart” and the browsing web page is obtained by counting the user ID of the “order” line without duplication.

セッション数を用いて上記のP(注文|カート)を算出する場合には、閲覧ログ取得装置11において、セッションの終了を、予め設定された時間ウェブページの閲覧が行われなかった場合と定義し、ユーザID単位でセッション毎に閲覧ログを取得する。そして、上記と同様に閲覧ログ収集部13でセッション毎に取得された閲覧ログを収集して、閲覧ログ集積DB14に保存する。遷移確率を算出する際には、上記と同様に、(1)式の分子及び分母に該当する件数を、閲覧ログ集積DB14において、条件に該当する行をカウントすることにより、セッション数に応じた該当件数が得られる。 When calculating the above P A (order | cart) using the number of sessions, the browsing log acquisition device 11 defines the end of the session as the case where the web page is not browsed for a preset time. The browsing log is acquired for each session in units of user IDs. And the browsing log acquired for every session by the browsing log collection part 13 is collected similarly to the above, and it preserve | saves in browsing log accumulation | storage DB14. When calculating the transition probability, the number of cases corresponding to the numerator and denominator of equation (1) is counted according to the number of sessions by counting the rows corresponding to the condition in the browsing log accumulation DB 14 as described above. The number of hits can be obtained.

なお、PV数、UU数、及びセッション数を各々組み合わせて用いて、遷移確率を算出してもよい。   Note that the transition probability may be calculated using a combination of the PV number, the UU number, and the session number.

上記のような遷移確率を、各機能間についてそれぞれ算出する。また、機能間の遷移確率を求める際には、閲覧ログ集積DB14に蓄積された閲覧日時の情報を利用し、特定期間における遷移状態を表す遷移確率を求めることもできる。   The transition probability as described above is calculated for each function. Further, when obtaining the transition probability between functions, it is also possible to obtain a transition probability representing a transition state in a specific period by using information on the browsing date and time stored in the browsing log accumulation DB 14.

次に、本実施の形態のウェブサイト分析システム10の作用について説明する。ユーザ端末において、ユーザによりウェブサイトが閲覧され、閲覧ログ取得装置11により閲覧ログが取得されると、ウェブサイト分析装置12において、CPUがROMから図4に示すウェブサイト分析処理ルーチンを実行するためのプログラムを読み出して実行する。   Next, the operation of the website analysis system 10 of the present embodiment will be described. In the user terminal, when the user browses the website and the browsing log acquisition device 11 acquires the browsing log, the CPU executes the website analysis processing routine shown in FIG. 4 from the ROM in the website analysis device 12. The program is read and executed.

ステップ100で、閲覧ログ収集部13が、複数のユーザ端末に組み込まれた各閲覧ログ取得装置11から、ネットワークを介して、ユーザID、サイトID、閲覧日時、閲覧ウェブページのURL、リファラー、及び閲覧ウェブページのタイトルの情報を含む閲覧ログを収集し、閲覧ログ集積DB14に保存する。   In step 100, the browsing log collection unit 13 transmits a user ID, a site ID, a browsing date, a browsing web page URL, a referrer, and a browsing ID from each browsing log acquisition device 11 incorporated in a plurality of user terminals. A browsing log including information on the title of the browsing web page is collected and stored in the browsing log accumulation DB 14.

次に、ステップ102で、機能判別部15が、URL正規表現−機能変換辞書16において、サイトIDが分析対象のウェブサイトのサイトIDのURL正規表現の各々と、閲覧ログに含まれる閲覧ウェブページのURLとを比較する。そして、閲覧ウェブページのURLに含まれるURL正規表現を検索し、検索されたURL正規表現に対応する機能を、その閲覧ウェブページに対応する機能として判別する。また、同様にして、分析対象閲覧ログ集積DB14に蓄積された各閲覧ログに含まれるリファラーに対応する機能も判別する。   Next, in step 102, the function determination unit 15 causes the URL regular expression-function conversion dictionary 16 to include each of the URL regular expressions of the site IDs of the websites to be analyzed and the browsing web pages included in the browsing log. Is compared with the URL. Then, a URL regular expression included in the URL of the browsing web page is searched, and a function corresponding to the searched URL regular expression is determined as a function corresponding to the browsing web page. Similarly, the function corresponding to the referrer included in each browsing log accumulated in the analysis target browsing log accumulation DB 14 is also determined.

次に、ステップ104で、閲覧ログ分析部17が、閲覧ログ集積DB14に蓄積された閲覧ログ、及び上記ステップ102で判別された各閲覧ウェブページ及びリファラーの各々に対応する機能に基づいて、ユーザによる分析対象のウェブサイト内での各ウェブページの閲覧の遷移状態を表す機能間の遷移確率を算出する。各機能間のそれぞれについて算出された遷移確率を、分析対象のウェブサイトの分析結果として出力し、ウェブサイト分析処理ルーチンを終了する。   Next, in step 104, the browsing log analysis unit 17 determines the user based on the browsing log accumulated in the browsing log accumulation DB 14 and the functions corresponding to each browsing web page and referrer determined in step 102. The transition probability between functions representing the transition state of browsing of each web page in the website to be analyzed by is calculated. The transition probability calculated for each of the functions is output as the analysis result of the analysis target website, and the website analysis processing routine is terminated.

以上説明したように、本実施の形態のウェブサイト分析システム10によれば、同一の用途のウェブページ群を抽象化した機能を定義し、各機能をURL形式で正規表現したURL正規表現−機能変換辞書を用いて、閲覧ウェブページに対応する機能を判別した上で、機能間の遷移確率を求めるため、ウェブサイトそれぞれに存在する特徴的なコンテンツ及びサイト構造が吸収され、他者の保有するウェブサイトとも比較が容易な指標を算出することができる。このような指標を分析対象のウェブサイト、及び比較対象のウェブサイトについて各々算出して比較することにより、分析対象のウェブサイトにおいて、比較対象のウェブサイトよりも効率の悪い機能、つまり効率の悪いウェブページ群を改善の候補として特定することが可能になる。   As described above, according to the website analysis system 10 of the present embodiment, a function that abstracts a group of web pages for the same purpose is defined, and a URL regular expression-function in which each function is represented in a URL format. In order to determine the transition probability between functions after identifying the function corresponding to the browsing web page using the conversion dictionary, the characteristic content and site structure existing in each website are absorbed and held by others It is possible to calculate an index that can be easily compared with the website. By calculating and comparing such indicators for the analysis target website and the comparison target website, the analysis target website has a function that is less efficient than the comparison target website, that is, the efficiency is low. It becomes possible to specify a web page group as a candidate for improvement.

また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.

また、上述のウェブサイト分析装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。   In addition, the website analysis apparatus described above has a computer system inside, but the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used. .

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。   In the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium.

10 ウェブサイト分析システム
11 閲覧ログ取得装置
12 ウェブサイト分析装置
13 閲覧ログ収集部
14 閲覧ログ集積データベース14
15 機能判別部
16 URL正規表現−機能変換辞書
17 閲覧ログ分析部
DESCRIPTION OF SYMBOLS 10 Website analysis system 11 Browsing log acquisition apparatus 12 Website analysis apparatus 13 Browsing log collection part 14 Browsing log accumulation database 14
15 Function Discriminator 16 URL Regular Expression-Function Conversion Dictionary 17 Browsing Log Analyzer

Claims (5)

収集手段が、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び前記第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを複数収集するステップと、
判別手段が、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別するステップと、
分析手段が、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析するステップと、
を含むウェブサイト分析方法。
The collecting means includes the URL of the first browsing web page in the website browsed by the user and the URL of the second browsing web page browsed immediately before the first browsing web page, and the user terminal Collecting a plurality of website browsing logs acquired in
A plurality of functions in which the determination unit assigns a common definition among a plurality of websites to each of a plurality of web page groups having different uses possessed by the website , and a plurality of web pages corresponding to each of the functions Each of the URLs of the first browsing web pages included in each of the plurality of browsing logs collected by the collecting means, Determining a function corresponding to each of the first browsing web page and each of the second browsing web page based on each of the URLs of the second browsing web page;
Based on the function corresponding to each of the plurality of browsing logs and each of the first browsing web page and the second browsing web page determined by the determining unit, Analyzing the transition state of each web page browsing as a transition probability between functions, which is an index comparable to other websites ;
Website analysis method including.
前記分析手段が、各遷移状態に対応するウェブページの閲覧数、各遷移状態に対応するウェブページを閲覧したユーザ数、及び各遷移状態に対応するウェブページへのセッション数の少なくとも1つに基づいて、前記機能間の遷移確率を分析する請求項1記載のウェブサイト分析方法。   The analysis means is based on at least one of the number of browsing web pages corresponding to each transition state, the number of users viewing web pages corresponding to each transition state, and the number of sessions to the web page corresponding to each transition state. The website analysis method according to claim 1, wherein the transition probability between the functions is analyzed. ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び前記第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを複数収集する収集手段と、
ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別する判別手段と、
前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する分析手段と、
を含むウェブサイト分析装置。
The URL of the first browsing web page in the website browsed by the user and the URL of the second browsing web page browsed immediately before the first browsing web page, and acquired at the user terminal A collection means for collecting multiple website browsing logs;
For each of a plurality of web page groups having different uses on a website, a plurality of functions assigned a common definition among the plurality of websites , and a common URL in a plurality of web pages corresponding to each of the functions A regular expression-function conversion dictionary in which a regular expression from which a part is extracted is associated with each other, each of the URLs of the first browsing web pages included in each of the plurality of browsing logs collected by the collecting unit, and the second Discrimination means for discriminating a function corresponding to each of the first browsing web page and each of the second browsing web page based on each of the URLs of the browsing web pages;
Based on the functions corresponding to each of the plurality of browsing logs and each of the first browsing web pages and each of the second browsing web pages determined by the determination unit, each of the web pages in the website An analysis means for analyzing the transition state of browsing as a transition probability between each function, which is an index that can be compared with other websites ;
Including website analysis equipment.
ユーザ端末に組み込まれ、ユーザにより閲覧されたウェブサイト内の第1の閲覧ウェブページのURL、及び前記第1の閲覧ウェブページの直前に閲覧された第2の閲覧ウェブページのURLを含み、かつユーザ端末において取得されたウェブサイトの閲覧ログを取得する閲覧ログ取得装置と、
前記閲覧ログ取得装置が取得した閲覧ログを複数収集する収集手段、ウェブサイトが有する異なる複数の用途のウェブページ群の各々に対して、複数のウェブサイト間で共通の定義を付与した複数の機能と、該機能の各々に対応した複数のウェブページのURLにおける共通部分を抽出した正規表現とを対応させた正規表現−機能変換辞書と、前記収集手段が収集した複数の閲覧ログの各々に含まれる前記第1の閲覧ウェブページのURLの各々及び前記第2の閲覧ウェブページのURLの各々とに基づいて、前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能を判別する判別手段、並びに、前記複数の閲覧ログ、及び前記判別手段が判別した前記第1の閲覧ウェブページの各々及び前記第2の閲覧ウェブページの各々に対応する機能に基づいて、前記ウェブサイト内での各ウェブページの閲覧の遷移状態を、他のウェブサイトと比較可能な指標である各機能間の遷移確率として分析する分析手段を含むウェブサイト分析装置と、
を含むウェブサイト分析システム。
A URL of a first browsing web page in a website browsed by a user, which is incorporated in a user terminal, and a URL of a second browsing web page browsed immediately before the first browsing web page; and A browsing log acquisition device for acquiring a browsing log of a website acquired in a user terminal;
Collecting means for collecting a plurality of browsing logs acquired by the browsing log acquisition device, and a plurality of functions provided with a common definition among a plurality of websites for each of a plurality of different web page groups possessed by the website And a regular expression-function conversion dictionary that associates a regular expression obtained by extracting common parts in URLs of a plurality of web pages corresponding to each of the functions, and a plurality of browsing logs collected by the collecting means Corresponding to each of the first browsing web page and each of the second browsing web page based on each of the URLs of the first browsing web page and each of the URLs of the second browsing web page A discriminating means for discriminating a function to be performed, each of the plurality of browsing logs, each of the first browsing web pages determined by the discriminating means, and the second browsing web. Based on the function corresponding to each of the Bupeji, the analysis means for analyzing the transition state of viewing of each web page in the web site, the transition probabilities between each feature in a comparable indicator with other websites Including a website analysis device,
Including website analysis system.
コンピュータに、請求項1または請求項2記載のウェブサイト分析方法の各ステップを実行させるためのウェブサイト分析プログラム。   A website analysis program for causing a computer to execute each step of the website analysis method according to claim 1.
JP2012048285A 2012-03-05 2012-03-05 Website analysis method, apparatus, system, and program Active JP5705772B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012048285A JP5705772B2 (en) 2012-03-05 2012-03-05 Website analysis method, apparatus, system, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012048285A JP5705772B2 (en) 2012-03-05 2012-03-05 Website analysis method, apparatus, system, and program

Publications (2)

Publication Number Publication Date
JP2013182602A JP2013182602A (en) 2013-09-12
JP5705772B2 true JP5705772B2 (en) 2015-04-22

Family

ID=49273177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012048285A Active JP5705772B2 (en) 2012-03-05 2012-03-05 Website analysis method, apparatus, system, and program

Country Status (1)

Country Link
JP (1) JP5705772B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7216056B2 (en) * 2001-12-06 2007-05-08 C-Live, Inc. Access log analyzer and access log analyzing method
JP2004280501A (en) * 2003-03-17 2004-10-07 Nri & Ncc Co Ltd Web traffic line analysis system
JP2009230566A (en) * 2008-03-24 2009-10-08 Nifty Corp Profile processing method and apparatus

Also Published As

Publication number Publication date
JP2013182602A (en) 2013-09-12

Similar Documents

Publication Publication Date Title
CN102663000B (en) The maliciously recognition methods of the method for building up of network address database, maliciously network address and device
CN106934627B (en) Method and device for detecting cheating behaviors of e-commerce industry
Petricek et al. The web structure of e-government-developing a methodology for quantitative evaluation
CN106021583B (en) Statistical method and system for page flow data
CN105808639B (en) Network access behavior identification method and device
CN1949259B (en) Method for collecting click information of web page by embedding code in web page
WO2016101777A1 (en) Analysis and collection system for user interest data and method therefor
TW201513019A (en) Method and system for extracting user behavior features to personalize recommendations
CN112434208A (en) Training of isolated forest and identification method and related device of web crawler of isolated forest
US20090222426A1 (en) Computer-Implemented System And Method For Analyzing Search Queries
CN109242553A (en) A kind of user behavior data recommended method, server and computer-readable medium
KR20180075852A (en) System and method for intelligent marketing analysis through processing non-fixed form bigdata
CN108304410A (en) A kind of detection method, device and the data analysing method of the abnormal access page
JP2009223456A (en) Price investigation system and price investigation method
US10614500B2 (en) Identifying search friendly web pages
TW201329890A (en) Processing method and system of shop visiting data
JP5511782B2 (en) New advertisement capable URL providing system and new advertisement capable URL providing method
JP2011034399A (en) Method, device and program for extracting relevance of web pages
CN108280102A (en) Internet behavior recording method, device and user terminal
Bari et al. Web usage mining
JP5705772B2 (en) Website analysis method, apparatus, system, and program
JP2010218475A (en) Blog analysis method and device
JP2016118957A (en) Server device, system, information processing method, and program
CN102360484B (en) Group buying websites sales data verity detection method and device
CN117040827A (en) Abnormal account detection method and device, storage medium and electronic equipment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150225

R150 Certificate of patent or registration of utility model

Ref document number: 5705772

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150