JP5178219B2 - Access analysis device, access analysis method, and access analysis program - Google Patents
Access analysis device, access analysis method, and access analysis program Download PDFInfo
- Publication number
- JP5178219B2 JP5178219B2 JP2008021540A JP2008021540A JP5178219B2 JP 5178219 B2 JP5178219 B2 JP 5178219B2 JP 2008021540 A JP2008021540 A JP 2008021540A JP 2008021540 A JP2008021540 A JP 2008021540A JP 5178219 B2 JP5178219 B2 JP 5178219B2
- Authority
- JP
- Japan
- Prior art keywords
- response
- data
- user
- web page
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Description
本発明は、アクセス解析装置及びアクセス解析方法及びアクセス解析プログラムに関するものである。本発明は、特に、パケットキャプチャ型のWebサイトアクセス解析装置及びWebサイトアクセス解析方法及びWebサイトアクセス解析プログラムに関するものである。 The present invention relates to an access analysis device, an access analysis method, and an access analysis program. The present invention particularly relates to a packet capture type website access analysis device, a website access analysis method, and a website access analysis program.
インターネットを利用して商品販売を行っている企業(事業主)は年々増加しており、インターネット経由の商品販売規模も大きくなってきている。それに伴い、各企業にとって、販売規模の拡大のために自社のWebサイトで買い物をするユーザの行動解析を行い、その動向を把握することが、販売戦略上欠かせなくなってきている。ここでいう行動解析とは、
(1)ユーザがどのようにして自社のWebサイトに来たのか
・検索サイトでキーワードを入力し、ヒットしたリンクから来たのか
・どこかのブログ内のリンクから来たのか
(2)ユーザがどのWebページ(コンテンツ)に興味を示し、どの商品を購入したのか(購買に結びついたのか)
・人気のあるWebページはどれか
・滞在時間が長いWebページはどれか
(3)ユーザが商品を購入せず(購買に結びつかず)、どのWebページから自社のWebサイト外へ出て行ったのか
・アクセスが続かなくなった(離脱した)Webページはどれか
といった、Webサイト内でのユーザの行動を解析すること(即ち、Webページへのアクセス解析)である。企業は、アクセス解析の結果から、離脱率が低下し、アクセス数、購入率、販売数が増加するように、Webページの改良などを行い、販売規模の拡大を図っている。
The number of companies (business owners) that sell products using the Internet is increasing year by year, and the scale of product sales via the Internet is also increasing. Along with this, it has become indispensable for each company to analyze the behavior of users who shop on their Web site and grasp their trends in order to expand the sales scale. The behavioral analysis here is
(1) How the user came to the company's website ・ Enter the keyword on the search site, came from the hit link ・ Did it come from a link in some blog (2) Which web pages (contents) are interested and which products are purchased (whether they lead to purchases)
・ Which web page is popular ・ Which web page has a long stay time (3) The user did not purchase the product (does not lead to purchase), and from which web page he / she went outside his / her own website The analysis of the user's behavior in the Web site, such as which Web page is no longer accessed (leaved), ie, access analysis to the Web page. From the results of access analysis, companies are trying to expand the sales scale by improving Web pages so that the withdrawal rate decreases and the number of accesses, purchase rates, and sales increases.
従来のアクセス解析の方式には、主に、以下の3種類がある。
(1)アクセスログ型:Webサーバが、Webページへのアクセスがある度に、HTTP(ハイパーテキスト転送プロトコル)リクエストやHTTPレスポンスの一部を所定の形式でアクセスログに記録する。アクセス解析は、このアクセスログを解析することによって行われる(例えば、特許文献1〜5参照)。
(2)ビーコン(タグ)型:各Webページには小さなプログラム(タグ)が貼付され、ユーザのWebブラウザがWebページを読み込むと、そのプログラムが取得した情報が、Webサーバとは別の解析サーバに送信される。解析サーバは、この情報をデータベース化して記録する。アクセス解析は、このデータベース上の情報を解析することによって行われる。
(3)パケットキャプチャ型:パケットキャプチャ装置が、Webサーバを外部と接続するネットワーク上を流れる全てのパケット(HTTPリクエスト又はHTTPレスポンスを含むパケット)をキャプチャする。アクセス解析は、キャプチャされたパケットからHTTP通信を復元し、このHTTP通信を解析することによって行われる。
(1) Access log type: Each time a Web server accesses a Web page, an HTTP (Hypertext Transfer Protocol) request or a part of an HTTP response is recorded in an access log in a predetermined format. The access analysis is performed by analyzing the access log (see, for example, Patent Documents 1 to 5).
(2) Beacon (tag) type: A small program (tag) is affixed to each Web page, and when a user's Web browser reads the Web page, the information acquired by the program is an analysis server separate from the Web server. Sent to. The analysis server records this information in a database. Access analysis is performed by analyzing information on this database.
(3) Packet capture type: A packet capture device captures all packets (packets including an HTTP request or an HTTP response) that flow on a network connecting a Web server to the outside. The access analysis is performed by restoring the HTTP communication from the captured packet and analyzing the HTTP communication.
アクセスログ型、ビーコン型の場合、アクセス解析を行うための仕組みをWebサイトごとに実装する作業が必要となる、という課題があった。具体的には、アクセスログ型の場合、Webサーバに手を入れる必要があった。例えば、通常、Webサーバのデフォルト設定では、Referer(直前にアクセスされたWebページのURL)やCookieなどがログに出力されないため、それらの情報をアクセスログに記録するようにWebサーバの設定を変更する作業が必要であった。また、Webサイトごとに異なるログイン認証方式に合わせて、ログイン中のユーザを識別するユーザID(識別子)などをアクセスログに記録する処理を実装する作業が必要であった。ビーコン型の場合、ビーコン(タグ)を各Webページに埋め込む作業が必要であった。 In the case of the access log type and the beacon type, there is a problem that a work for implementing an access analysis for each website is required. Specifically, in the case of the access log type, it is necessary to put a hand in the Web server. For example, since the referrer (URL of the web page accessed immediately before), cookie, etc. are not normally output to the log in the default setting of the web server, the web server setting is changed to record such information in the access log. It was necessary to work. Further, it is necessary to implement a process of recording a user ID (identifier) for identifying a logged-in user in an access log in accordance with a login authentication method that is different for each Web site. In the case of the beacon type, it is necessary to embed a beacon (tag) in each Web page.
従来のパケットキャプチャ型の場合、アクセス解析を行うための仕組みをWebサイトごとに実装する作業は必要ないが、Webサイト内でのユーザごとの行動を把握することができない、という課題があった。アクセスログ型の場合は、アクセスログに記録されたユーザIDなどを参照することで、個々のユーザの行動(例えば、どのような順番でどのWebページにアクセスしたのか)を解析することができる。ビーコン型の場合は、ユーザごとに動作するビーコンから情報が送信されるため、情報の送信元となったビーコンを特定することで、個々のユーザの行動を解析することができる。一方、従来のパケットキャプチャ型の場合は、あるWebページを起点として1人のユーザがそのWebページの2つ以上前に閲覧していたWebページがどれであるか、といったことが分からないため(1つ前に閲覧していたWebページはRefererを参照することで分かる)、個々のユーザの行動を十分に解析することができない(ただし、ユーザが携帯電話を利用してアクセスする場合、端末IDを送信するように設定されていれば、携帯電話から端末IDが送信されるため、個々の携帯電話を特定することで、個々のユーザの行動を解析することができる)。 In the case of the conventional packet capture type, there is no need to implement a mechanism for performing access analysis for each website, but there is a problem that it is impossible to grasp the behavior of each user in the website. In the case of the access log type, by referring to the user ID or the like recorded in the access log, it is possible to analyze each user's behavior (for example, in what order and which web page was accessed). In the case of the beacon type, since information is transmitted from a beacon that operates for each user, the behavior of each user can be analyzed by specifying the beacon that is the transmission source of the information. On the other hand, in the case of the conventional packet capture type, it is not known which Web page was browsed by a single user two or more times before that Web page as a starting point ( The previous web page can be seen by referring to the Referer), and the behavior of each user cannot be analyzed sufficiently (however, if the user accesses using a mobile phone, the terminal ID If the terminal ID is transmitted from the mobile phone, the behavior of each user can be analyzed by specifying the individual mobile phone).
本発明は、例えば、アクセス解析を行うための仕組みをWebサイトごとに実装しなくても、Webサイト内でのユーザごとの行動を把握できるようにすることを目的とする。 For example, an object of the present invention is to make it possible to grasp an action for each user in a website without mounting a mechanism for performing access analysis for each website.
本発明の一の態様に係るアクセス解析装置は、
Webページのページデータとユーザに対して個別に設定される個別設定データとを含むレスポンスを載せたパケットを収集するパケットキャプチャ装置から、複数のパケットを取得して記憶装置に保存するパケット取得部と、
前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元部と、
前記レスポンス復元部により復元された複数のレスポンスの各々から、個別設定データを処理装置により抽出する個別設定データ抽出部と、
前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定部と、
前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成部とを備えることを特徴とする。
An access analysis device according to one aspect of the present invention includes:
A packet acquisition unit that acquires a plurality of packets from a packet capture device that collects a packet including a response including page data of a Web page and individual setting data individually set for a user and stores the packets in a storage device; ,
Analyzing a plurality of packets stored by the packet acquisition unit, and restoring a plurality of responses transmitted on the plurality of packets by a processing device;
An individual setting data extraction unit for extracting individual setting data from each of a plurality of responses restored by the response restoration unit by a processing device;
A response identifying unit that identifies a response common to the individual setting data extracted by the individual setting data extraction unit as a single response group among a plurality of responses restored by the response restoration unit;
It is estimated that the same user has accessed a web page including page data in each response of the response group identified by the response identifying unit, and access history data indicating that the same user has accessed the web page And an access history data generation unit generated by the processing device.
前記パケットキャプチャ装置は、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、ログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される当該ユーザの属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出部は、前記レスポンス復元部により復元された複数のレスポンスの各々から、個別設定データとして、属性データを処理装置により抽出し、
前記レスポンス特定部は、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。
The packet capture device is a response returned by the Web server in response to a request from the user, and is added to the page data of the Web page to which the logged-in user requests access by the Web server Collecting packets with responses containing attribute data of
The individual setting data extraction unit extracts attribute data as individual setting data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response identifying unit identifies, as a response group, a response having a common attribute data extracted by the individual setting data extraction unit among a plurality of responses restored by the response restoration unit, as a response group. And
前記個別設定データ抽出部は、ユーザがログイン中のWebページのページデータとユーザがログイン中でないWebページ又は他のユーザがログイン中のWebページのページデータとを比較して、差異がある部分のデータが属性データであると処理装置により推定することを特徴とする。 The individual setting data extraction unit compares the page data of the web page in which the user is logged in with the page data of the web page in which the user is not logged in or the web page in which another user is logged in. The processing device estimates that the data is attribute data.
前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページにて特定の表示データから所定の相対位置、もしくは、2つの特定の表示データをそれぞれ起点及び終点とする範囲に表示される属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出部は、前記レスポンス復元部により復元された複数のレスポンスの各々から、前記特定の表示データを抽出して、前記特定の表示データから前記所定の相対位置もしくは前記範囲に表示される部分のデータが属性データであると処理装置により推定することを特徴とする。
The packet capture device has, as attribute data, a specific relative position from a specific display data on a Web page to which a logged-in user requests access, or a range having two specific display data as a starting point and an ending point, respectively. It collects packets with responses containing attribute data to be displayed.
The individual setting data extraction unit extracts the specific display data from each of a plurality of responses restored by the response restoration unit, and displays the specific display data at the predetermined relative position or the range from the specific display data. The processing device estimates that the portion of the data is attribute data.
前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページに表示される当該ユーザの名前データを含むレスポンスを載せたパケットを収集するものであり、
記憶装置には、人名の辞書データが予め記憶されており、
前記個別設定データ抽出部は、記憶装置に記憶された辞書データを用いて、前記レスポンス復元部により復元された複数のレスポンスの各々から、Webページに人名を表示する部分のデータを抽出して、当該部分のデータが名前データであると処理装置により推定することを特徴とする。
The packet capture device collects a packet containing a response including name data of the user displayed on a web page that the logged-in user requests access as attribute data,
The storage device stores personal name dictionary data in advance,
The individual setting data extraction unit uses the dictionary data stored in the storage device to extract data of a part that displays a person's name on a Web page from each of a plurality of responses restored by the response restoration unit, The processing device estimates that the data of the part is name data.
前記パケットキャプチャ装置は、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、ログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される、当該ユーザが複数のWebページに共通に設定したレイアウトを示すレイアウト設定データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出部は、前記レスポンス復元部により復元された複数のレスポンスの各々から、個別設定データとして、レイアウト設定データを処理装置により抽出し、
前記レスポンス特定部は、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。
The packet capture device is a response returned by a Web server in response to a request from a user, and is added by the Web server to page data of a Web page for which a logged-in user requests access. Collecting packets with responses including layout setting data indicating layouts commonly set by a user on a plurality of Web pages;
The individual setting data extraction unit extracts layout setting data as individual setting data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response specifying unit specifies, by a processing device, a response having a common layout setting data extracted by the individual setting data extracting unit among a plurality of responses restored by the response restoring unit as one response group. Features.
前記レスポンス特定部は、前記レスポンス復元部により同一の送信元アドレスをもつパケットから復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。 The response specifying unit includes a response having a common response of the individual setting data extracted by the individual setting data extracting unit among a plurality of responses restored from a packet having the same source address by the response restoring unit. A group is specified by a processing device.
本発明の一の態様に係るアクセス解析方法は、
パケットキャプチャ装置が、Webページのページデータとユーザに対して個別に設定される個別設定データとを含むレスポンスを載せたパケットを収集し、
アクセス解析装置のパケット取得部が、前記パケットキャプチャ装置により収集された複数のパケットを取得して記憶装置に保存し、
前記アクセス解析装置のレスポンス復元部が、前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元し、
前記アクセス解析装置の個別設定データ抽出部が、前記レスポンス復元部により復元された複数のレスポンスの各々から、個別設定データを処理装置により抽出し、
前記アクセス解析装置のレスポンス特定部が、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定し、
前記アクセス解析装置のアクセス履歴データ生成部が、前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成することを特徴とする。
An access analysis method according to one aspect of the present invention includes:
A packet capture device collects a packet with a response including page data of a web page and individual setting data individually set for a user,
The packet acquisition unit of the access analysis device acquires a plurality of packets collected by the packet capture device and stores them in a storage device,
The response restoration unit of the access analysis device analyzes a plurality of packets stored by the packet acquisition unit, and restores a plurality of responses transmitted on the plurality of packets by a processing device,
The individual setting data extraction unit of the access analysis device extracts individual setting data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response identifying unit of the access analysis device uses the processing device as a response group with a response shared by the individual setting data extracted by the individual setting data extraction unit among a plurality of responses restored by the response restoration unit. Identify,
The access history data generation unit of the access analysis device estimates that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying unit, and the same to the Web page The access history data indicating that the user has accessed is generated by the processing device.
本発明の一の態様に係るアクセス解析プログラムは、
Webページのページデータとユーザに対して個別に設定される個別設定データとを含むレスポンスを載せたパケットを収集するパケットキャプチャ装置から、複数のパケットを取得して記憶装置に保存するパケット取得処理と、
前記パケット取得処理により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元処理と、
前記レスポンス復元処理により復元された複数のレスポンスの各々から、個別設定データを処理装置により抽出する個別設定データ抽出処理と、
前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定処理と、
前記レスポンス特定処理により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成処理とをコンピュータに実行させることを特徴とする。
An access analysis program according to one aspect of the present invention includes:
A packet acquisition process for acquiring a plurality of packets from a packet capture device that collects a packet containing a response including page data of a Web page and individual setting data individually set for a user and storing the packets in a storage device; ,
Analyzing a plurality of packets stored by the packet acquisition processing, and restoring a plurality of responses sent on the plurality of packets by a processing device; and
Individual setting data extraction processing for extracting individual setting data from each of a plurality of responses restored by the response restoration processing by a processing device;
A response specifying process for specifying, by one processing group, a response having a common response to the individual setting data extracted by the individual setting data extraction process among a plurality of responses restored by the response restoration process;
It is estimated that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying process, and access history data indicating that the same user has accessed the Web page is stored. An access history data generation process generated by a processing device is executed by a computer.
前記パケットキャプチャ装置は、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、ログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される当該ユーザの属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出処理は、前記レスポンス復元処理により復元された複数のレスポンスの各々から、個別設定データとして、属性データを処理装置により抽出し、
前記レスポンス特定処理は、前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。
The packet capture device is a response returned by the Web server in response to a request from the user, and is added to the page data of the Web page to which the logged-in user requests access by the Web server Collecting packets with responses containing attribute data of
In the individual setting data extraction process, the attribute data is extracted by the processing device as individual setting data from each of the plurality of responses restored by the response restoration process,
The response specifying process specifies a response having a common attribute data extracted by the individual setting data extraction process among a plurality of responses restored by the response restoration process as one response group by a processing device. And
前記個別設定データ抽出処理は、ユーザがログイン中のWebページのページデータとユーザがログイン中でないWebページ又は他のユーザがログイン中のWebページのページデータとを比較して、差異がある部分のデータが属性データであると処理装置により推定することを特徴とする。 The individual setting data extraction process compares the page data of the web page where the user is logged in with the page data of the web page where the user is not logged in or the web page where the other user is logged in. The processing device estimates that the data is attribute data.
前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページにて特定の表示データから所定の相対位置、もしくは、2つの特定の表示データをそれぞれ起点及び終点とする範囲に表示される属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出処理は、前記レスポンス復元処理により復元された複数のレスポンスの各々から、前記特定の表示データを抽出して、前記特定の表示データから前記所定の相対位置もしくは前記範囲に表示される部分のデータが属性データであると処理装置により推定することを特徴とする。
The packet capture device has, as attribute data, a specific relative position from a specific display data on a Web page to which a logged-in user requests access, or a range having two specific display data as a starting point and an ending point, respectively. It collects packets with responses containing attribute data to be displayed.
The individual setting data extraction process extracts the specific display data from each of a plurality of responses restored by the response restoration process, and displays the specific display data at the predetermined relative position or the range from the specific display data. The processing device estimates that the portion of the data is attribute data.
前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページに表示される当該ユーザの名前データを含むレスポンスを載せたパケットを収集するものであり、
記憶装置には、人名の辞書データが予め記憶されており、
前記個別設定データ抽出処理は、記憶装置に記憶された辞書データを用いて、前記レスポンス復元処理により復元された複数のレスポンスの各々から、Webページに人名を表示する部分のデータを抽出して、当該部分のデータが名前データであると処理装置により推定することを特徴とする。
The packet capture device collects a packet containing a response including name data of the user displayed on a web page that the logged-in user requests access as attribute data,
The storage device stores personal name dictionary data in advance,
The individual setting data extraction process uses the dictionary data stored in the storage device to extract data of a part that displays a person's name on a Web page from each of a plurality of responses restored by the response restoration process. The processing device estimates that the data of the part is name data.
前記パケットキャプチャ装置は、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、ログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される、当該ユーザが複数のWebページに共通に設定したレイアウトを示すレイアウト設定データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出処理は、前記レスポンス復元処理により復元された複数のレスポンスの各々から、個別設定データとして、レイアウト設定データを処理装置により抽出し、
前記レスポンス特定処理は、前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。
The packet capture device is a response returned by a Web server in response to a request from a user, and is added by the Web server to page data of a Web page for which a logged-in user requests access. Collecting packets with responses including layout setting data indicating layouts commonly set by a user on a plurality of Web pages;
In the individual setting data extraction process, the layout setting data is extracted by the processing device as individual setting data from each of the plurality of responses restored by the response restoration process,
In the response specifying process, a response having a common layout setting data extracted by the individual setting data extraction process is specified by the processing device as one response group among a plurality of responses restored by the response restoring process. Features.
前記レスポンス特定処理は、前記レスポンス復元処理により同一の送信元アドレスをもつパケットから復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。 The response specifying process is a response including a response having a common individual setting data extracted by the individual setting data extraction process among a plurality of responses restored from a packet having the same source address by the response restoration process. A group is specified by a processing device.
本発明の一の態様によれば、アクセス解析装置において、レスポンス復元部が、パケットキャプチャ装置から取得された複数のパケットを解析して、複数のレスポンスを復元し、個別設定データ抽出部が、復元された複数のレスポンスの各々から、ユーザに対して個別に設定される個別設定データを抽出し、レスポンス特定部が、復元された複数のレスポンスのうち、抽出された個別設定データが共通するレスポンスを1つのレスポンス群として特定し、アクセス履歴データ生成部が、特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定することにより、例えば、アクセス解析を行うための仕組みをWebサイトごとに実装しなくても、Webサイト内でのユーザごとの行動を把握できるようになる。 According to one aspect of the present invention, in the access analysis device, the response restoration unit analyzes a plurality of packets acquired from the packet capture device, restores a plurality of responses, and the individual setting data extraction unit performs restoration. The individual setting data individually set for the user is extracted from each of the plurality of responses, and the response specifying unit generates a response having the same extracted individual setting data among the restored responses. For example, the access history data generation unit performs an access analysis by estimating that the same user has accessed a Web page in which page data is included in each response of the specified response group. Behavior for each user on a website without implementing a mechanism for each website It will be able to grasp.
以下、本発明の実施の形態について、図を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
実施の形態1.
図1は、本実施の形態に係るアクセス解析装置100の利用形態の一例を示す図である。
Embodiment 1 FIG.
FIG. 1 is a diagram illustrating an example of a usage pattern of an
図1において、ユーザ端末201は、ユーザが利用するコンピュータであり、ユーザがWebページを閲覧するためのWebブラウザを動作させる。ユーザ端末201は、例えばPC(パーソナルコンピュータ)である。
In FIG. 1, a
Webサーバ202は、複数のWebページからなるWebサイトを実現するサーバコンピュータである。以下では、説明を簡単にするため、1つのWebサイトを実現するものであれば、サーバコンピュータが2台以上ある場合でも、それらをまとめて1つのWebサーバ202として考えるものとする。また、単にHTML(ハイパーテキストマークアップ言語)ファイルを提供するHTTP(ハイパーテキスト転送プロトコル)サーバだけでなく、Webサイト上で電子商取引サービスを提供するために必要なログイン認証機能やデータベース処理機能を有するWebアプリケーションサーバなどもまとめて1つのWebサーバ202として考えるものとする。なお、ここでは、ハードウェア及びソフトウェアの組み合わせであるサーバコンピュータとソフトウェアのみであるサーバプログラムは厳密に区別していない(どちらを指す場合にも、Webサーバ202という)。
The
ユーザ端末201とWebサーバ202は、インターネット203を介して、IP(インターネットプロトコル)通信を行う。IP通信において、ユーザ端末201は、インターネット203を介して、IPパケット211をWebサーバ202へ送信する。同様に、Webサーバ202は、インターネット203を介して、IPパケット212をユーザ端末201へ送信する。ユーザ端末201で動作するWebブラウザとWebサーバ202は、IP通信を利用してHTTP通信を行う。
The
ここで、図2に、ユーザがログイン中でない場合に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ311の一例を示す。また、図3に、このWebページ311をユーザ端末201で動作するWebブラウザが取得するためのHTTP通信の一例を示す。HTTP通信において、Webブラウザは、HTTPリクエスト401をWebサーバ202へ送信する。Webサーバ202は、HTTPリクエスト401に応じて、HTTPレスポンス402をユーザ端末201へ返信する。
Here, FIG. 2 shows an example of a web page 311 displayed on the web browser screen 301 of the
図3において、ユーザが、Webブラウザ画面301にWebページ311のURL321(Uniform・Resource・Locator)を入力して(Webブラウザ画面301で閲覧中の他のWebページ内にあるリンクをクリックするなど、他の方法を用いてもよい)、Webページ311へのアクセスを要求すると、Webブラウザは、そのWebページ311のURLデータ411を含むHTTPリクエスト401を生成する。ユーザ端末201は、HTTPリクエスト401をIPパケット211に載せてWebサーバ202へ送信する。
In FIG. 3, the user inputs the URL 321 (Uniform / Resource / Locator) of the Web page 311 on the Web browser screen 301 (clicks a link in another Web page being browsed on the Web browser screen 301, etc.) When an access to the web page 311 is requested, the web browser generates an HTTP request 401 including the
Webサーバ202は、HTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれるURLデータ411に基づいて、ユーザがアクセスを要求したWebページ311を特定し、そのWebページ311のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、特定の表示データ413を付加するものとする。Webサーバ202は、特定の表示データ413が付加されたページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。
When the
ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ311をWebブラウザ画面301に表示する。図2に示したように、例えば、Webブラウザは、ページデータ412に付加された特定の表示データ413を、「こんにちは。」という特定の文字列322としてWebページ311の一部に表示する。また、Webブラウザは、Webサイトで扱われている商品カテゴリのメニュー323をWebページ311の一部に表示する。Webブラウザは、メニュー323内に、各商品カテゴリの商品販売用のWebページへのリンク324を表示する。
When the
図4に、ユーザがログインした直後に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ312の一例を示す。また、図5に、このWebページ312をユーザ端末201で動作するWebブラウザが取得するためのHTTP通信の一例を示す。
FIG. 4 shows an example of a web page 312 displayed on the web browser screen 301 of the
図5において、ユーザが、Webブラウザ画面301で閲覧中のログイン認証用のWebページ内にあるフォームに、Webサイトで予め設定されたユーザID(識別子)とパスワードの組み合わせを入力して、Webサイトへのログインを要求すると、Webブラウザは、認証データ414を含むHTTPリクエスト401を生成する。ユーザ端末201は、HTTPリクエスト401をIPパケット211に載せてWebサーバ202へ送信する。
In FIG. 5, the user inputs a combination of a user ID (identifier) and a password set in advance on the website into a form in the login authentication web page being browsed on the web browser screen 301. When requesting login to, the Web browser generates an HTTP request 401 including authentication data 414. The
Webサーバ202は、HTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれる認証データ414に基づいて、ユーザを認証する。Webサーバ202は、ユーザの認証が成功すると(これによりユーザはログインしたことになる)、ログイン中のユーザに対してデフォルトで表示するWebページ312のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、ログイン中のユーザの個別設定データを付加する。個別設定データは、ユーザに対して個別に設定されるもの(即ち、ユーザを区別できる情報)で、例えば、ユーザの属性データである。ここでは、Webサーバ202は、ログイン中のユーザの属性データとして、ユーザの名前データ415をページデータ412に付加するものとする。Webサーバ202は、属性データとして、他にも、ユーザID、ユーザのポイントデータ(Webサイトで商品を購入したユーザなどに与えられるポイントを記録したデータ)、ユーザの購入履歴データ(Webサイトでユーザが購入した商品などを記録したデータ)、ユーザの嗜好データ(Webサイトでユーザが購入した商品によって推定されるユーザの嗜好に合わせて動的に生成されるWebページへのリンク324)などをページデータ412に付加してもよい。Webサーバ202は、ログイン中のユーザの属性データを付加したページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。
When receiving the
ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ312をWebブラウザ画面301に表示する。図4に示したように、例えば、Webブラウザは、ページデータ412に付加された特定の表示データ413を、「こんにちは、」という特定の文字列322としてWebページ312の一部に表示する。また、Webブラウザは、ページデータ412に付加された特定の表示データ416を、「さん。」という特定の文字列326としてWebページ312の一部に表示する。さらに、Webブラウザは、ページデータ412に付加されたユーザの名前データ415に基づいて、ユーザの「山田太郎」という名前325を特定の文字列322の後(所定の相対位置の一例)、もしくは、特定の文字列322と特定の文字列326との間(特定の文字列322を起点とし、特定の文字列326を終点とする範囲)に表示する。また、Webブラウザは、ページデータ412に付加された他の属性データに基づいて、ユーザIDやユーザの購入履歴データが(hiddenパラメータなどとして)埋め込まれたWebページ312を表示する。あるいは、Webブラウザは、ユーザのポイントデータをWebページ312の一部に表示する。あるいは、Webブラウザは、ユーザの嗜好データであるリンク324を含むメニュー323をWebページ312の一部に表示する。
When the
図6に、ユーザがログイン中に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ313の一例を示す。
FIG. 6 shows an example of a web page 313 displayed on the web browser screen 301 of the
図示していないが、ログイン中のユーザが、Webブラウザ画面301にWebページ313のURL321を入力するなど、前述した方法を用いて、Webページ313へのアクセスを要求すると、Webブラウザは、そのWebページ313のURLデータ411を含むHTTPリクエスト401を生成する。このとき、Webブラウザは、ユーザがWebサイトにログインしたときにCookieに書き込まれたデータ(ユーザID、ユーザがログイン中であることを示すデータなど)をHTTPリクエスト401に付加する。ユーザ端末201は、HTTPリクエスト401をIPパケット211に載せてWebサーバ202へ送信する。
Although not shown, when a logged-in user requests access to the Web page 313 using the method described above, such as inputting the
Webサーバ202は、HTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれるURLデータ411に基づいて、ユーザがアクセスを要求したWebページ313を特定し、そのWebページ313のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、特定の表示データ413,416とユーザの名前データ415を付加する。Webサーバ202は、さらに、他の属性データをページデータ412に付加してもよい。Webサーバ202は、HTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。
When receiving the
ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ313をWebブラウザ画面301に表示する。
When the
図2に示したWebページ311と図4に示したWebページ312とを比較すると、いずれもURL321や表示されているコンテンツは同じであるが、図2に示したWebページ311の上部には、特定の文字列322のみが表示されているのに対し、図4に示したWebページ312の上部には、特定の文字列322のほか、その後に続けてログイン中のユーザの名前325が表示されている。また、図4に示したWebページ312と図6に示したWebページ313とを比較すると、URL321や表示されているコンテンツは異なっているが、いずれのWebページ312,313の上部にも、特定の文字列322のほか、その後に続けてログイン中のユーザの名前325が表示されている。このように、上記の例におけるWebサイトでは、ユーザがログインすると、各Webページの上部にユーザの名前325が共通の形式で表示されるようになっている。
When the Web page 311 shown in FIG. 2 is compared with the Web page 312 shown in FIG. 4, the
図1において、ネットワーク機器204は、Webサーバ202とインターネット203の間に接続される通信機器であり、ユーザ端末201からインターネット203を介してWebサーバ202へ送信されるIPパケット211、及び、Webサーバ202からインターネット203を介してユーザ端末201へ送信されるIPパケット212を中継する。ネットワーク機器204は、中継する全てのIPパケット211,212をミラーポートからも出力する。ネットワーク機器204は、例えばスイッチングハブやルータである。
In FIG. 1, a network device 204 is a communication device connected between the
パケットキャプチャ装置205は、ネットワーク機器204のミラーポートに接続されるコンピュータである。パケットキャプチャ装置205は、ネットワーク機器204のミラーポートから出力される複数のIPパケット211,212を収集し、ハードディスクなどの記録媒体に蓄積する。
The
アクセス解析装置100は、パケットキャプチャ装置205に接続されるコンピュータである。アクセス解析装置100は、パケットキャプチャ装置205が記録媒体に蓄積した複数のIPパケット211,212を解析することで、Webサイト内でのユーザごとの行動を解析する。アクセス解析装置100は、パケットキャプチャ装置205を内蔵していてもよい。具体的には、アクセス解析装置100は、パケットキャプチャ装置205の機能を有するプログラムを実行するコンピュータであってもよい。
The
図7は、アクセス解析装置100の構成を示すブロック図である。
FIG. 7 is a block diagram illustrating a configuration of the
図7において、アクセス解析装置100は、パケット取得部101、リクエスト・レスポンス復元部102(レスポンス復元部の一例)、個別設定データ抽出部103、レスポンス特定部104、アクセス履歴データ生成部105、アクセス解析部106を備える。また、アクセス解析装置100は、記憶装置151、処理装置152、入力装置153、出力装置154などのハードウェアを備える(又はこれらのハードウェアがアクセス解析装置100に接続される)。ハードウェアはアクセス解析装置100の各部によって利用される。例えば、処理装置152は、アクセス解析装置100の各部でデータや情報の演算、加工、読み取り、書き込みなどを行うために利用される。記憶装置151は、そのデータや情報を記憶するために利用される。また、入力装置153は、そのデータや情報を入力するために、出力装置154は、そのデータや情報を出力するために利用される。
In FIG. 7, the
パケット取得部101は、パケットキャプチャ装置205から全てのIPパケット211,212を取得する。そして、パケット取得部101は、取得したIPパケット211,212を記憶装置151に保存する。
The
リクエスト・レスポンス復元部102は、パケット取得部101により保存されたIPパケット211,212のうち、複数のHTTPレスポンス402を載せた複数のIPパケット212を処理装置152により解析する。そして、リクエスト・レスポンス復元部102は、複数のIPパケット212に載せて送信された複数のHTTPレスポンス402を処理装置152により復元する。ここでは、リクエスト・レスポンス復元部102は、複数のIPパケット211も解析して、複数のIPパケット211に載せて送信された複数のHTTPリクエスト401を処理装置152により復元するものとする。
The request /
個別設定データ抽出部103は、リクエスト・レスポンス復元部102により復元された複数のHTTPレスポンス402の各々から、個別設定データを処理装置152により抽出する。個別設定データ抽出部103は、さらに、リクエスト・レスポンス復元部102により復元された複数のHTTPリクエスト401の各々から、個別設定データ(もしあれば)を抽出してもよい。
The individual setting
レスポンス特定部104は、リクエスト・レスポンス復元部102により復元された複数のHTTPレスポンス402のうち、個別設定データ抽出部103により抽出された個別設定データが共通するHTTPレスポンス402を1つのレスポンス群として処理装置152により特定する。このとき、レスポンス特定部104は、リクエスト・レスポンス復元部102により復元された複数のHTTPリクエスト401のうち、上記レスポンス群の各HTTPレスポンス402に対応するHTTPリクエスト401を処理装置152により特定しておく。レスポンス特定部104は、さらに、リクエスト・レスポンス復元部102により復元された複数のHTTPリクエスト401のうち、個別設定データ抽出部103により抽出された個別設定データが共通するHTTPリクエスト401(もしあれば)を1つのリクエスト群として処理装置152により特定してもよい。
The
アクセス履歴データ生成部105は、レスポンス特定部104により特定されたレスポンス群の各HTTPレスポンス402にページデータ412が含まれるWebページへ同一のユーザがアクセスしたと推定する。そして、アクセス履歴データ生成部105は、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置152により生成する。このとき、アクセス履歴データ生成部105は、上記レスポンス群の各HTTPレスポンス402に対応するものとしてレスポンス特定部104により特定された各HTTPリクエスト401からURLを抽出し、それぞれのWebページを識別するために利用することができる。あるいは、アクセス履歴データ生成部105は、各HTTPレスポンス402に含まれるデータ(例えば、Webサイトのナビゲーション用にWebページに表示されるデータ)のみを、それぞれのWebページを識別するために利用してもよい。アクセス履歴データ生成部105は、生成したアクセス履歴データを記憶装置151に保存する。
The access history
アクセス解析部106は、アクセス履歴データ生成部105により保存されたアクセス履歴データに基づいて、個々のユーザの行動を処理装置152により解析する。
Based on the access history data stored by the access history
図8は、アクセス解析装置100のハードウェア資源の一例を示す図である。
FIG. 8 is a diagram illustrating an example of hardware resources of the
図8において、アクセス解析装置100は、CRT(Cathode・Ray・Tube)やLCD(液晶ディスプレイ)の表示画面を有する表示装置901、キーボード902(K/B)、マウス903、FDD904(Flexible・Disk・Drive)、CDD905(Compact・Disc・Drive)、プリンタ装置906などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。
In FIG. 8, the
アクセス解析装置100は、プログラムを実行するCPU911(Central・Processing・Unit)を備えている。CPU911は、処理装置152の一例である。CPU911は、バス912を介してROM913(Read・Only・Memory)、RAM914(Random・Access・Memory)、通信ボード915、表示装置901、キーボード902、マウス903、FDD904、CDD905、プリンタ装置906、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置920の代わりに、光ディスク装置、メモリカードリーダライタなどの記憶媒体、NAS(Network・Attached・Storage)などのネットワークストレージが用いられてもよい。
The
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置151の一例である。通信ボード915、キーボード902、マウス903、FDD904、CDD905などは、入力装置153の一例である。また、通信ボード915、表示装置901、プリンタ装置906などは、出力装置154の一例である。
The
通信ボード915は、LAN(ローカルエリアネットワーク)などに接続されている。通信ボード915は、LANに限らず、インターネット、あるいは、IP−VPN(Internet・Protocol・Virtual・Private・Network)、広域LAN、ATM(Asynchronous・Transfer・Mode)ネットワークなどのWAN(ワイドエリアネットワーク)などに接続されていても構わない。LAN、インターネット、WANは、ネットワークの一例である。
The
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。プログラム群923には、本実施の形態の説明において「〜部」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。また、ファイル群924には、本実施の形態の説明において、「〜データ」、「〜情報」、「〜ID(識別子)」、「〜フラグ」、「〜結果」として説明するデータや情報や信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」や「〜テーブル」の各項目として記憶されている。「〜ファイル」や「〜データベース」や「〜テーブル」は、ディスクやメモリなどの記憶媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶されたデータや情報や信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・制御・出力・印刷・表示などのCPU911の処理(動作)に用いられる。抽出・検索・参照・比較・演算・計算・制御・出力・印刷・表示などのCPU911の処理中、データや情報や信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
The
また、本実施の形態の説明において用いるブロック図やフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号は、RAM914などのメモリ、FDD904のフレキシブルディスク(FD)、CDD905のコンパクトディスク(CD)、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク(MD)、DVD(Digital・Versatile・Disc)などの記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体により伝送される。
In addition, the arrows in the block diagrams and flowcharts used in the description of this embodiment mainly indicate input / output of data and signals, and the data and signals are the memory such as the
また、本実施の形態の説明において「〜部」として説明するものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜工程」、「〜手順」、「〜処理」であってもよい。即ち、「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。あるいは、ソフトウェアのみ、あるいは、素子・デバイス・基板・配線などのハードウェアのみ、あるいは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実現されていても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVDなどの記録媒体に記憶される。このプログラムはCPU911により読み出され、CPU911により実行される。即ち、プログラムは、本実施の形態の説明で述べる「〜部」としてコンピュータを機能させるものである。あるいは、本実施の形態の説明で述べる「〜部」の手順や方法をコンピュータに実行させるものである。
In addition, what is described as “˜unit” in the description of this embodiment may be “˜circuit”, “˜device”, “˜device”, and “˜step”, “˜process”. , “˜procedure”, and “˜processing”. That is, what is described as “˜unit” may be realized by firmware stored in the
図9は、本実施の形態に係るアクセス解析方法を示すフローチャートである。 FIG. 9 is a flowchart showing an access analysis method according to the present embodiment.
図9のフローチャートに示したフローは、アクセス解析装置100を実現するコンピュータ上で実行されるプログラム(アクセス解析プログラム)の処理手順に相当する。以下では、アクセス解析装置100が図8に例示したコンピュータとハードウェア資源により実現されているものとして、本実施の形態に係るアクセス解析方法について説明する。
The flow shown in the flowchart of FIG. 9 corresponds to a processing procedure of a program (access analysis program) executed on a computer that implements the
パケット取得部101は、パケットキャプチャ装置205から全てのIPパケット211,212を取得する。そして、パケット取得部101は、取得したIPパケット211,212を磁気ディスク装置920(記憶装置151の一例)に保存する(ステップS101:パケット取得処理)。
The
リクエスト・レスポンス復元部102は、ステップS101で保存されたIPパケット211,212をCPU911(処理装置152の一例)により解析する。そして、リクエスト・レスポンス復元部102は、複数のIPパケット211に載せて送信された複数のHTTPリクエスト401、及び、複数のIPパケット212に載せて送信された複数のHTTPレスポンス402をCPU911により復元する(ステップS102:レスポンス復元処理)。ここでは、リクエスト・レスポンス復元部102は、図3〜図6の例におけるHTTPリクエスト401及びHTTPレスポンス402を復元するものとする。
The request /
個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、個別設定データとして、ユーザの名前データ415をCPU911により抽出する(ステップS103:個別設定データ抽出処理)。具体的には、まず、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、URLデータ411をCPU911により抽出する。次に、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の中から、対応するHTTPレスポンス402から抽出したURLデータ411で示されるURL321が同じWebページ、あるいは、同種のWebページ(例えばトップページ)に該当するもの(例えば、Webページ311,312)を少なくとも2つ選択する。そして、個別設定データ抽出部103は、例えば、ユーザがログイン中のWebページ312のページデータ412を含むHTTPレスポンス402とユーザがログイン中でないWebページ311のページデータ412を含むHTTPレスポンス402とを選択する。あるいは、個別設定データ抽出部103は、ユーザがログイン中のWebページ312のページデータ412を含むHTTPレスポンス402と他のユーザがログイン中のWebページのページデータ412を含むHTTPレスポンス402とを選択する。そして、個別設定データ抽出部103は、選択したHTTPレスポンス402のそれぞれに含まれるページデータ412を比較して、差異がある部分(図3及び図5の例では「山田太郎さん」の部分)のデータがユーザの名前データ415であるとCPU911により推定する。
The individual setting
レスポンス特定部104は、ステップS102で復元された複数のHTTPレスポンス402のうち、ステップS103で抽出された名前データ415が共通するHTTPレスポンス402(例えば、Webページ312,313のページデータ412を含むHTTPレスポンス402)を1つのレスポンス群としてCPU911により特定する(ステップS104:レスポンス特定処理)。このとき、レスポンス特定部104は、ステップS102で同一の送信元IPアドレスをもつIPパケット212から復元された複数のHTTPレスポンス402だけを対象にしてもよい。つまり、レスポンス特定部104は、同一の送信元IPアドレスをもつIPパケット212に含まれるHTTPレスポンス402であり、かつ、ステップS103で抽出された名前データ415が共通するHTTPレスポンス402を1つのレスポンス群としてCPU911により特定してもよい。これにより、アクセス履歴データ生成部105が同一のユーザがアクセスしたと推定する際の精度が向上する。なお、ステップS104において、レスポンス特定部104は、ステップS102で復元された複数のHTTPリクエスト401のうち、上記レスポンス群の各HTTPレスポンス402に対応するHTTPリクエスト401をCPU911により特定しておく。
The
アクセス履歴データ生成部105は、ステップS104で特定されたレスポンス群の各HTTPレスポンス402にページデータ412が含まれるWebページへ同一のユーザがアクセスしたと推定する。そして、アクセス履歴データ生成部105は、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データをCPU911により生成する。例えば、まず、アクセス履歴データ生成部105は、ステップS104で特定されたレスポンス群の各HTTPレスポンス402に対応するものとして、同じくステップS104で特定された各HTTPリクエスト401からURLデータ411を抽出する。次に、アクセス履歴データ生成部105は、ステップS104で特定されたレスポンス群の各HTTPレスポンス402にページデータ412が含まれるWebページのURLデータ411として各HTTPリクエスト401から抽出したものと当該Webページへのアクセスの時刻データとの組み合わせをアクセス履歴データとして生成する。そして、アクセス履歴データ生成部105は、生成したアクセス履歴データを磁気ディスク装置920に保存する(ステップS105:アクセス履歴データ生成処理)。
The access history
アクセス解析部106は、ステップS105で保存されたアクセス履歴データに基づいて、個々のユーザの行動をCPU911により解析する(ステップS106:アクセス解析処理)。例えば、アクセス履歴データが、WebページのURLデータ411と当該Webページへのアクセスの時刻データとの組み合わせであれば、アクセス解析部106は、ユーザごとに、どのような順番でどのWebページがアクセスされたかを解析する。さらに、アクセス解析部106は、ユーザがどのWebページに興味を示し、どの商品を購入したのか、あるいは、ユーザが商品を購入せず、どのWebページからWebサイト外へ出て行ったのか、といったことを分析し、当該分析結果を表示装置901の画面に表示する。
Based on the access history data stored in step S105, the
このように、本実施の形態では、アクセス解析装置100において、リクエスト・レスポンス復元部102が、パケットキャプチャ装置205から取得された複数のIPパケット212を解析して、複数のHTTPレスポンス402を復元し、個別設定データ抽出部103が、復元された複数のHTTPレスポンス402の各々から、ユーザに対して個別に設定される個別設定データ(例えば、同一URLのWebページに対し、ログイン中とログイン中でないページの差異、あるいは、所定の相対位置に表示される属性データ、あるいは、2つの特定の文字列を起点及び終点とする範囲に表示される属性データ、あるいは、人名辞書データを参照し、抽出した人名、あるいは、同一ユーザの複数のWebページに共通するレイアウト設定データ)を抽出し、レスポンス特定部104が、復元された複数のHTTPレスポンス402のうち、抽出された個別設定データが共通するHTTPレスポンス402を1つのレスポンス群として特定し、アクセス履歴データ生成部105が、特定されたレスポンス群の各HTTPレスポンス402にページデータ412が含まれるWebページへ同一のユーザがアクセスしたと推定することにより、例えば、アクセス解析を行うための仕組みをWebサイトごとに実装しなくても、Webサイト内でのユーザごとの行動を把握できるようになる。
Thus, in this embodiment, in the
従来のアクセスログ型のアクセス解析では、HTTPリクエスト401やHTTPレスポンス402の一部を所定の形式に変換した上でアクセスログに出力しなければならなかったため、出力処理に時間がかかっていた。また、アクセス解析を行う際に必要になったデータが、HTTPリクエスト401やHTTPレスポンス402のうち、アクセスログに出力されない部分のデータである、という事態が生じる可能性があった。一方、パケットキャプチャ型のアクセス解析では、パケットキャプチャ装置205が全てのIPパケット211,212をそのまま保存するだけで済むため、処理速度が速い。また、全てのIPパケット211,212を解析して、全てのHTTP通信を復元することができる。本実施の形態では、このようなパケットキャプチャ型の特徴を活かして、ユーザごとの行動を解析することで、従来よりもユーザの行動を詳しく把握できるようになる。
In the conventional access log type access analysis, since a part of the HTTP request 401 and the HTTP response 402 must be converted into a predetermined format and then output to the access log, the output process takes time. In addition, there is a possibility that the data required for performing the access analysis is a part of the HTTP request 401 or the HTTP response 402 that is not output to the access log. On the other hand, in the packet capture type access analysis, since the
実施の形態2.
本実施の形態について、主に実施の形態1との差異を説明する。
Embodiment 2. FIG.
In the present embodiment, differences from the first embodiment will be mainly described.
以下では、実施の形態1と同様に、図9を用いて、本実施の形態に係るアクセス解析方法について説明する。 Hereinafter, as in the first embodiment, the access analysis method according to the present embodiment will be described with reference to FIG.
ステップS101、S102、ステップS104〜S106は、実施の形態1と同様である。 Steps S101 and S102 and steps S104 to S106 are the same as in the first embodiment.
ステップS103において、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、特定の表示データ413をCPU911(処理装置152の一例)により抽出する。そして、個別設定データ抽出部103は、抽出した特定の表示データ413から所定の相対位置に表示される部分のデータが属性データであるとCPU911により推定する。具体的には、個別設定データ抽出部103は、抽出した特定の表示データ413(図3及び図5の例では、句読点を無視するものとすると「こんにちは」の部分)の後に続けて表示される部分(図3及び図5の例では、句読点及び名前の後に付ける「さん」を無視するものとすると「山田太郎」の部分)のデータがユーザの名前データ415であると推定する。
In step S103, the individual setting
ステップS103において、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、特定の表示データ413だけでなく、特定の表示データ416も抽出することができる。この場合、個別設定データ抽出部103は、抽出した特定の表示データ413,416をそれぞれ起点及び終点とする範囲に表示される部分のデータが属性データであるとCPU911により推定する。具体的には、個別設定データ抽出部103は、抽出した特定の表示データ413,416(図3及び図5の例では、句読点を無視するものとすると「こんにちは」と「さん」の部分)の間に表示される部分(図3及び図5の例では「山田太郎」の部分)のデータがユーザの名前データ415であると推定する。
In step S103, the individual setting
このように、本実施の形態によれば、各HTTPレスポンス402のどこにユーザの属性データが含まれているかを容易に探し当てることが可能となる。 As described above, according to the present embodiment, it is possible to easily find where in each HTTP response 402 the user attribute data is included.
実施の形態3.
本実施の形態について、主に実施の形態1との差異を説明する。
Embodiment 3 FIG.
In the present embodiment, differences from the first embodiment will be mainly described.
以下では、実施の形態1と同様に、図9を用いて、本実施の形態に係るアクセス解析方法について説明する。 Hereinafter, as in the first embodiment, the access analysis method according to the present embodiment will be described with reference to FIG.
ステップS101、S102、ステップS104〜S106は、実施の形態1と同様である。 Steps S101 and S102 and steps S104 to S106 are the same as in the first embodiment.
磁気ディスク装置920(記憶装置151の一例)には、人名の辞書データが予め記憶されているものとする。 It is assumed that personal name dictionary data is stored in advance in the magnetic disk device 920 (an example of the storage device 151).
ステップS103において、個別設定データ抽出部103は、磁気ディスク装置920に記憶された辞書データを用いて、ステップS102で復元された複数のHTTPレスポンス402の各々から、Webページに人名を表示する部分(図3及び図5の例では「山田太郎」の部分)のデータをCPU911(処理装置152の一例)により抽出する。そして、個別設定データ抽出部103は、当該部分のデータがユーザの名前データ415であるとCPU911により推定する。
In step S103, the individual setting
このように、本実施の形態によれば、各HTTPレスポンス402に含まれるユーザの名前データ415を容易に探し当てることが可能となる。 Thus, according to the present embodiment, it is possible to easily find the user name data 415 included in each HTTP response 402.
実施の形態4.
本実施の形態について、主に実施の形態1との差異を説明する。
Embodiment 4 FIG.
In the present embodiment, differences from the first embodiment will be mainly described.
実施の形態1と同様に、図2に、ユーザがログイン中でない場合に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ311の一例を示す。
Similar to the first embodiment, FIG. 2 shows an example of a web page 311 displayed on the web browser screen 301 of the
図示していないが、Webサーバ202は、ユーザがログイン中でない場合に、図2に示したWebページ311のURLデータ411を含むHTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、Webページ311のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、デフォルトで設定されたレイアウトを示すレイアウト設定データを付加する。Webサーバ202は、レイアウト設定データが付加されたページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。
Although not shown, the
ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ311をWebブラウザ画面301に表示する。図2に示したように、例えば、Webブラウザは、ページデータ412に付加されたレイアウト設定データに基づいて、メニュー323内に、デフォルトで設定された商品カテゴリの商品販売用のWebページへのリンク324を予め設定された順番で表示する。
When the
図10に、ユーザがログインした直後に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ312の一例を示す。
FIG. 10 shows an example of a web page 312 displayed on the web browser screen 301 of the
図示していないが、Webサーバ202は、ユーザがログイン中でない場合に、認証データ414を含むHTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれる認証データ414に基づいて、ユーザを認証する。Webサーバ202は、ユーザの認証が成功すると、図10に示したWebページ312のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、ログイン中のユーザの個別設定データとして、そのユーザが同じWebサイト内の複数のWebページに共通に設定したレイアウトを示すレイアウト設定データを付加する。Webサーバ202は、レイアウト設定データが付加されたページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。
Although not shown, when the
ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ312をWebブラウザ画面301に表示する。図10に示したように、例えば、Webブラウザは、ページデータ412に付加されたレイアウト設定データに基づいて、メニュー323内に、ログイン中のユーザが予め選択した商品カテゴリの商品販売用のWebページへのリンク324を、ユーザが予め設定した順番で表示する。
When the
図11に、ユーザがログイン中に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ313の一例を示す。
FIG. 11 shows an example of a web page 313 displayed on the web browser screen 301 of the
図示していないが、Webサーバ202は、ユーザがログイン中に、図11に示したWebページ313のURLデータ411を含むHTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、Webページ313のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、ログイン中のユーザの個別設定データとして、そのユーザが同じWebサイト内の複数のWebページに共通に設定したレイアウトを示すレイアウト設定データを付加する。Webサーバ202は、レイアウト設定データが付加されたページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。
Although not shown, the
ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ313をWebブラウザ画面301に表示する。図11に示したように、例えば、Webブラウザは、ページデータ412に付加されたレイアウト設定データに基づいて、メニュー323内に、ログイン中のユーザが予め選択した商品カテゴリの商品販売用のWebページへのリンク324を、ユーザが予め設定した順番で表示する。
When the
図2に示したWebページ311と図10に示したWebページ312とを比較すると、いずれもURL321や右側及び中央に表示されているコンテンツは同じであるが、図2に示したWebページ311の左側に表示されているメニュー323と図4に示したWebページ312の左側に表示されているメニュー323の項目(リンク324)の種類や数や順番が異なっている。また、図10に示したWebページ312と図11に示したWebページ313とを比較すると、URL321や右側及び中央に表示されているコンテンツは異なっているが、Webページ312,313の左側に表示されているメニュー323の項目の種類や数や順番が同じである。このように、上記の例におけるWebサイトでは、ユーザがログインすると、各Webページの左側に表示されるメニュー323の項目の種類や数や順番が、ログイン中のユーザの設定通りに表示されるようになっている。
When the Web page 311 shown in FIG. 2 is compared with the Web page 312 shown in FIG. 10, the
以下では、実施の形態1と同様に、図9を用いて、本実施の形態に係るアクセス解析方法について説明する。 Hereinafter, as in the first embodiment, the access analysis method according to the present embodiment will be described with reference to FIG.
ステップS101、S102、S105、S106は、実施の形態1と同様である。 Steps S101, S102, S105, and S106 are the same as those in the first embodiment.
ステップS103において、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、個別設定データとして、レイアウト設定データをCPU911(処理装置152の一例)により抽出する。
In step S103, the individual setting
ステップS104において、レスポンス特定部104は、ステップS102で復元された複数のHTTPレスポンス402のうち、ステップS103で抽出されたレイアウト設定データが共通するHTTPレスポンス402を1つのレスポンス群としてCPU911により特定する。このとき、レスポンス特定部104は、ステップS102で同一の送信元IPアドレスをもつIPパケット212から復元された複数のHTTPレスポンス402だけを対象にしてもよい。つまり、レスポンス特定部104は、同一の送信元IPアドレスをもつIPパケット212に含まれるHTTPレスポンス402であり、かつ、ステップS103で抽出されたレイアウト設定データが共通するHTTPレスポンス402を1つのレスポンス群としてCPU911により特定してもよい。これにより、アクセス履歴データ生成部105が同一のユーザがアクセスしたと推定する際の精度が向上する。
In step S104, the
以上、本発明の実施の形態について説明したが、これらのうち、2つ以上の実施の形態を組み合わせて実施しても構わない。あるいは、これらのうち、1つの実施の形態を部分的に実施しても構わない。あるいは、これらのうち、2つ以上の実施の形態を部分的に組み合わせて実施しても構わない。 As mentioned above, although embodiment of this invention was described, you may implement combining 2 or more embodiment among these. Alternatively, one of these embodiments may be partially implemented. Or you may implement combining two or more embodiment among these partially.
100 アクセス解析装置、101 パケット取得部、102 リクエスト・レスポンス復元部、103 個別設定データ抽出部、104 レスポンス特定部、105 アクセス履歴データ生成部、106 アクセス解析部、151 記憶装置、152 処理装置、153 入力装置、154 出力装置、201 ユーザ端末、202 Webサーバ、203 インターネット、204 ネットワーク機器、205 パケットキャプチャ装置、211,212 IPパケット、301 Webブラウザ画面、311,312,313 Webページ、321 URL、322,326 特定の文字列、323 メニュー、324 リンク、325 名前、401 HTTPリクエスト、402 HTTPレスポンス、411 URLデータ、412 ページデータ、413,416 特定の表示データ、414 認証データ、415 名前データ、901 表示装置、902 キーボード、903 マウス、904 FDD、905 CDD、906 プリンタ装置、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 磁気ディスク装置、921 オペレーティングシステム、922 ウィンドウシステム、923 プログラム群、924 ファイル群。 100 Access Analysis Device, 101 Packet Acquisition Unit, 102 Request / Response Restoration Unit, 103 Individual Setting Data Extraction Unit, 104 Response Identification Unit, 105 Access History Data Generation Unit, 106 Access Analysis Unit, 151 Storage Device, 152 Processing Device, 153 Input device, 154 Output device, 201 User terminal, 202 Web server, 203 Internet, 204 Network device, 205 Packet capture device, 211, 212 IP packet, 301 Web browser screen, 311, 312, 313 Web page, 321 URL, 322 , 326 Specific character string, 323 menu, 324 link, 325 name, 401 HTTP request, 402 HTTP response, 411 URL data, 412 page data 413, 416 Specific display data, 414 Authentication data, 415 Name data, 901 Display device, 902 Keyboard, 903 Mouse, 904 FDD, 905 CDD, 906 Printer device, 911 CPU, 912 bus, 913 ROM, 914 RAM, 915 Communication board, 920 magnetic disk unit, 921 operating system, 922 window system, 923 program group, 924 file group.
Claims (14)
前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元部と、
前記レスポンス復元部により復元された複数のレスポンスの各々から、属性データを処理装置により抽出する個別設定データ抽出部と、
前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定部と、
前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成部とを備えることを特徴とするアクセス解析装置。 A response is returned by the Web server in response to a request from the user, the user the user in the page data and login Web page is added by the Web server to the page data of the Web page to request access A packet acquisition unit that acquires a plurality of packets and stores them in a storage device from a packet capture device that collects a packet including a response including the attribute data of
Analyzing a plurality of packets stored by the packet acquisition unit, and restoring a plurality of responses transmitted on the plurality of packets by a processing device;
From each of a plurality of responses restored by the response restoration unit, an individual setting data extraction unit for extracting attribute data by a processing device,
A response identifying unit that identifies, as a response group, a response having a common attribute data extracted by the individual setting data extraction unit among a plurality of responses restored by the response restoration unit;
It is estimated that the same user has accessed a web page including page data in each response of the response group identified by the response identifying unit, and access history data indicating that the same user has accessed the web page An access history data generation unit that is generated by a processing device.
前記個別設定データ抽出部は、前記レスポンス復元部により復元された複数のレスポンスの各々から、前記特定の表示データを抽出して、前記特定の表示データから前記所定の相対位置もしくは前記範囲に表示される部分のデータが属性データであると処理装置により推定することを特徴とする請求項1又は2に記載のアクセス解析装置。 The packet capture device has, as attribute data, a specific relative position from a specific display data on a Web page to which a logged-in user requests access, or a range having two specific display data as a starting point and an ending point, respectively. It collects packets with responses containing attribute data to be displayed.
The individual setting data extraction unit extracts the specific display data from each of a plurality of responses restored by the response restoration unit, and displays the specific display data at the predetermined relative position or the range from the specific display data. access analysis apparatus according to claim 1 or 2 data portions that are and estimates by the processor as an attribute data.
記憶装置には、人名の辞書データが予め記憶されており、
前記個別設定データ抽出部は、記憶装置に記憶された辞書データを用いて、前記レスポンス復元部により復元された複数のレスポンスの各々から、Webページに人名を表示する部分のデータを抽出して、当該部分のデータが名前データであると処理装置により推定することを特徴とする請求項1から3までのいずれかに記載のアクセス解析装置。 The packet capture device collects a packet containing a response including name data of the user displayed on a web page that the logged-in user requests access as attribute data,
The storage device stores personal name dictionary data in advance,
The individual setting data extraction unit uses the dictionary data stored in the storage device to extract data of a part that displays a person's name on a Web page from each of a plurality of responses restored by the response restoration unit, access analysis apparatus according to claim 1 in which the data of the portion and estimating the processing device and the name data until 3.
前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元部と、
前記レスポンス復元部により復元された複数のレスポンスの各々から、レイアウト設定データを処理装置により抽出する個別設定データ抽出部と、
前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定部と、
前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成部とを備えることを特徴とするアクセス解析装置。 A response is returned by the Web server in response to a request from the user, the user in the page data and login Web page is added by the Web server to the page data of the Web page requesting access, the A packet acquisition unit that acquires a plurality of packets and stores them in a storage device from a packet capture device that collects a packet including a response including layout setting data indicating a layout commonly set by a user on a plurality of Web pages ;
Analyzing a plurality of packets stored by the packet acquisition unit, and restoring a plurality of responses transmitted on the plurality of packets by a processing device;
An individual setting data extraction unit that extracts layout setting data from each of a plurality of responses restored by the response restoration unit by a processing device;
A response specifying unit for specifying a response having a common layout setting data extracted by the individual setting data extracting unit as a single response group among a plurality of responses restored by the response restoring unit;
It is estimated that the same user has accessed a web page including page data in each response of the response group identified by the response identifying unit, and access history data indicating that the same user has accessed the web page An access history data generation unit that is generated by a processing device.
アクセス解析装置のパケット取得部が、前記パケットキャプチャ装置により収集された複数のパケットを取得して記憶装置に保存し、
前記アクセス解析装置のレスポンス復元部が、前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元し、
前記アクセス解析装置の個別設定データ抽出部が、前記レスポンス復元部により復元された複数のレスポンスの各々から、属性データを処理装置により抽出し、
前記アクセス解析装置のレスポンス特定部が、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定し、
前記アクセス解析装置のアクセス履歴データ生成部が、前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成することを特徴とするアクセス解析方法。 Packet capture device, a response that is returned by the Web server in response to a request from the user, by the Web server to the page data of the Web page the user in the page data and login Web page requests access Collect a packet with a response including the attribute data of the user to be added ,
The packet acquisition unit of the access analysis device acquires a plurality of packets collected by the packet capture device and stores them in a storage device,
The response restoration unit of the access analysis device analyzes a plurality of packets stored by the packet acquisition unit, and restores a plurality of responses transmitted on the plurality of packets by a processing device,
The individual setting data extraction unit of the access analysis device extracts attribute data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response identifying unit of the access analysis device identifies, as a response group, a response having a common attribute data extracted by the individual setting data extracting unit from among a plurality of responses restored by the response restoring unit. And
The access history data generation unit of the access analysis device estimates that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying unit, and the same to the Web page The access analysis method is characterized in that the access history data indicating that the user has accessed is generated by the processing device.
アクセス解析装置のパケット取得部が、前記パケットキャプチャ装置により収集された複数のパケットを取得して記憶装置に保存し、
前記アクセス解析装置のレスポンス復元部が、前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元し、
前記アクセス解析装置の個別設定データ抽出部が、前記レスポンス復元部により復元された複数のレスポンスの各々から、レイアウト設定データを処理装置により抽出し、
前記アクセス解析装置のレスポンス特定部が、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定し、
前記アクセス解析装置のアクセス履歴データ生成部が、前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成することを特徴とするアクセス解析方法。 Packet capture device, a response that is returned by the Web server in response to a request from the user, by the Web server to the page data of the Web page the user in the page data and login Web page requests access Collecting a packet with a response including layout setting data added and layout setting data indicating a layout commonly set by the user on a plurality of Web pages ;
The packet acquisition unit of the access analysis device acquires a plurality of packets collected by the packet capture device and stores them in a storage device,
The response restoration unit of the access analysis device analyzes a plurality of packets stored by the packet acquisition unit, and restores a plurality of responses transmitted on the plurality of packets by a processing device,
The individual setting data extraction unit of the access analysis device extracts layout setting data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response specifying unit of the access analysis device uses the processing device as a response group with a response having a common layout setting data extracted by the individual setting data extracting unit among a plurality of responses restored by the response restoring unit. Identify,
The access history data generation unit of the access analysis device estimates that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying unit, and the same to the Web page The access analysis method is characterized in that the access history data indicating that the user has accessed is generated by the processing device.
前記パケット取得処理により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元処理と、
前記レスポンス復元処理により復元された複数のレスポンスの各々から、属性データを処理装置により抽出する個別設定データ抽出処理と、
前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定処理と、
前記レスポンス特定処理により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成処理とをコンピュータに実行させることを特徴とするアクセス解析
プログラム。 A response is returned by the Web server in response to a request from the user, the user the user in the page data and login Web page is added by the Web server to the page data of the Web page to request access A packet acquisition process for acquiring a plurality of packets and storing them in a storage device from a packet capture device that collects a packet including a response including the attribute data of
Analyzing a plurality of packets stored by the packet acquisition processing, and restoring a plurality of responses sent on the plurality of packets by a processing device; and
Individual setting data extraction processing for extracting attribute data by a processing device from each of a plurality of responses restored by the response restoration processing;
A response specifying process for specifying a response having a common attribute data extracted by the individual setting data extraction process as a single response group among a plurality of responses restored by the response restoration process;
It is estimated that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying process, and access history data indicating that the same user has accessed the Web page is stored. An access analysis program for causing a computer to execute access history data generation processing generated by a processing device.
前記個別設定データ抽出処理は、前記レスポンス復元処理により復元された複数のレスポンスの各々から、前記特定の表示データを抽出して、前記特定の表示データから前記所定の相対位置もしくは前記範囲に表示される部分のデータが属性データであると処理装置により推定することを特徴とする請求項9又は10に記載のアクセス解析プログラム。 The packet capture device has, as attribute data, a specific relative position from a specific display data on a Web page to which a logged-in user requests access, or a range having two specific display data as a starting point and an ending point, respectively. It collects packets with responses containing attribute data to be displayed.
The individual setting data extraction process extracts the specific display data from each of a plurality of responses restored by the response restoration process, and displays the specific display data at the predetermined relative position or the range from the specific display data. The access analysis program according to claim 9 or 10 , wherein the processing device estimates that the portion of the data is attribute data.
記憶装置には、人名の辞書データが予め記憶されており、
前記個別設定データ抽出処理は、記憶装置に記憶された辞書データを用いて、前記レスポンス復元処理により復元された複数のレスポンスの各々から、Webページに人名を表示する部分のデータを抽出して、当該部分のデータが名前データであると処理装置により推定することを特徴とする請求項9から11までのいずれかに記載のアクセス解析プログラム。 The packet capture device collects a packet containing a response including name data of the user displayed on a web page that the logged-in user requests access as attribute data,
The storage device stores personal name dictionary data in advance,
The individual setting data extraction process uses the dictionary data stored in the storage device to extract data of a part that displays a person's name on a Web page from each of a plurality of responses restored by the response restoration process. The access analysis program according to any one of claims 9 to 11 , wherein the processing device estimates that the data of the part is name data.
前記パケット取得処理により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元処理と、
前記レスポンス復元処理により復元された複数のレスポンスの各々から、レイアウト設定データを処理装置により抽出する個別設定データ抽出処理と、
前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定処理と、
前記レスポンス特定処理により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成処理とをコンピュータに実行させることを特徴とするアクセス解析
プログラム。 A response is returned by the Web server in response to a request from the user, the user in the page data and login Web page is added by the Web server to the page data of the Web page requesting access, the A packet acquisition process for acquiring a plurality of packets and storing them in a storage device from a packet capture device that collects a packet including a response including layout setting data indicating a layout commonly set by a user on a plurality of Web pages ;
Analyzing a plurality of packets stored by the packet acquisition processing, and restoring a plurality of responses sent on the plurality of packets by a processing device; and
From each of a plurality of responses restored by the response restoration processing, individual setting data extraction processing for extracting layout setting data by a processing device;
A response specifying process for specifying a response having a common layout setting data extracted by the individual setting data extraction process as a single response group among a plurality of responses restored by the response restoration process;
It is estimated that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying process, and access history data indicating that the same user has accessed the Web page is stored. An access analysis program for causing a computer to execute access history data generation processing generated by a processing device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008021540A JP5178219B2 (en) | 2008-01-31 | 2008-01-31 | Access analysis device, access analysis method, and access analysis program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008021540A JP5178219B2 (en) | 2008-01-31 | 2008-01-31 | Access analysis device, access analysis method, and access analysis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009181459A JP2009181459A (en) | 2009-08-13 |
JP5178219B2 true JP5178219B2 (en) | 2013-04-10 |
Family
ID=41035370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008021540A Expired - Fee Related JP5178219B2 (en) | 2008-01-31 | 2008-01-31 | Access analysis device, access analysis method, and access analysis program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5178219B2 (en) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5322972B2 (en) * | 2010-02-24 | 2013-10-23 | 三菱スペース・ソフトウエア株式会社 | Web screen restoration device, web screen restoration method, and web screen restoration program |
US8713168B2 (en) | 2010-09-22 | 2014-04-29 | The Nielsen Company (Us), Llc | Methods and apparatus to determine impressions using distributed demographic information |
JP5709448B2 (en) * | 2010-09-29 | 2015-04-30 | 三菱スペース・ソフトウエア株式会社 | Access analysis device, access analysis method, and access analysis program |
US20140337104A1 (en) * | 2013-05-09 | 2014-11-13 | Steven J. Splaine | Methods and apparatus to determine impressions using distributed demographic information |
US10956947B2 (en) | 2013-12-23 | 2021-03-23 | The Nielsen Company (Us), Llc | Methods and apparatus to measure media using media object characteristics |
US20150262207A1 (en) | 2014-03-13 | 2015-09-17 | The Nielsen Company (US),LLC | Methods and apparatus to compensate impression data for misattribution and/or non-coverage by a database proprietor |
US20160189182A1 (en) | 2014-12-31 | 2016-06-30 | The Nielsen Company (Us), Llc | Methods and apparatus to correct age misattribution in media impressions |
US10380633B2 (en) | 2015-07-02 | 2019-08-13 | The Nielsen Company (Us), Llc | Methods and apparatus to generate corrected online audience measurement data |
US10045082B2 (en) | 2015-07-02 | 2018-08-07 | The Nielsen Company (Us), Llc | Methods and apparatus to correct errors in audience measurements for media accessed using over-the-top devices |
JP6347567B1 (en) * | 2017-10-23 | 2018-06-27 | 株式会社サードパーティートラスト | Information processing system, processing method, processing program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2474735C (en) * | 2002-01-31 | 2009-10-13 | Witness Systems, Inc. | Method, apparatus, and system for capturing, processing, and/or playing selected data exchanged between a server and a user |
JP2006120130A (en) * | 2004-09-21 | 2006-05-11 | Software Partner:Kk | System and method for managing access log |
-
2008
- 2008-01-31 JP JP2008021540A patent/JP5178219B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009181459A (en) | 2009-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5178219B2 (en) | Access analysis device, access analysis method, and access analysis program | |
US8645453B2 (en) | Method and system of processing cookies across domains | |
US20070220145A1 (en) | Computer product, access-restricting method, and proxy server | |
JP4633049B2 (en) | Associating a website click with a link on a web page | |
CN102436564A (en) | Method and device for identifying falsified webpage | |
CN102594934A (en) | Method and device for identifying hijacked website | |
MXPA06002206A (en) | System and method for highlighting a domain in a browser display. | |
JP5709448B2 (en) | Access analysis device, access analysis method, and access analysis program | |
JP4282312B2 (en) | Web server, Web server having Java servlet function, and computer program | |
JP2014056612A (en) | Device, method, and program for controlling browsing | |
JP2006107524A (en) | Www server and system having user terminal connected to www server via communication line | |
JP4729089B2 (en) | Website counting device and website counting program | |
JP5322972B2 (en) | Web screen restoration device, web screen restoration method, and web screen restoration program | |
KR102141484B1 (en) | Method and system for generating automatically personal online shopping mall using social network service | |
JP5231328B2 (en) | Advertisement information providing device | |
JP5300648B2 (en) | RECOMMENDATION INFORMATION PROVIDING DEVICE, USER TERMINAL, OPERATION RECOMMENDING METHOD, AND PROGRAM | |
JP5088269B2 (en) | Screen information management method | |
JP4090494B1 (en) | Access analysis method, access analysis system, and access analysis program | |
JP6148023B2 (en) | System, information processing apparatus, history information server, method for acquiring or collecting history information, processing method, and program | |
JP5669330B2 (en) | RECOMMENDATION DEVICE, RECOMMENDATION METHOD, AND RECOMMENDATION PROGRAM | |
JP7422990B2 (en) | Website analysis system, website analysis method, website analysis device, and program | |
JP6758582B1 (en) | Content distribution system, content distribution program | |
JP2012043425A (en) | Login authentication system and method | |
JP2002215623A (en) | Screen display method and system, server, recording medium and program | |
JP7069090B2 (en) | Analysts, detectors, systems and programs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110125 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120613 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130108 |
|
LAPS | Cancellation because of no payment of annual fees |