JP5178219B2 - Access analysis device, access analysis method, and access analysis program - Google Patents

Access analysis device, access analysis method, and access analysis program Download PDF

Info

Publication number
JP5178219B2
JP5178219B2 JP2008021540A JP2008021540A JP5178219B2 JP 5178219 B2 JP5178219 B2 JP 5178219B2 JP 2008021540 A JP2008021540 A JP 2008021540A JP 2008021540 A JP2008021540 A JP 2008021540A JP 5178219 B2 JP5178219 B2 JP 5178219B2
Authority
JP
Japan
Prior art keywords
response
data
user
web page
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008021540A
Other languages
Japanese (ja)
Other versions
JP2009181459A (en
Inventor
十郎 鷲尾
耕一 和田
隆宏 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Space Software Co Ltd
Original Assignee
Mitsubishi Space Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Space Software Co Ltd filed Critical Mitsubishi Space Software Co Ltd
Priority to JP2008021540A priority Critical patent/JP5178219B2/en
Publication of JP2009181459A publication Critical patent/JP2009181459A/en
Application granted granted Critical
Publication of JP5178219B2 publication Critical patent/JP5178219B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、アクセス解析装置及びアクセス解析方法及びアクセス解析プログラムに関するものである。本発明は、特に、パケットキャプチャ型のWebサイトアクセス解析装置及びWebサイトアクセス解析方法及びWebサイトアクセス解析プログラムに関するものである。   The present invention relates to an access analysis device, an access analysis method, and an access analysis program. The present invention particularly relates to a packet capture type website access analysis device, a website access analysis method, and a website access analysis program.

インターネットを利用して商品販売を行っている企業(事業主)は年々増加しており、インターネット経由の商品販売規模も大きくなってきている。それに伴い、各企業にとって、販売規模の拡大のために自社のWebサイトで買い物をするユーザの行動解析を行い、その動向を把握することが、販売戦略上欠かせなくなってきている。ここでいう行動解析とは、
(1)ユーザがどのようにして自社のWebサイトに来たのか
・検索サイトでキーワードを入力し、ヒットしたリンクから来たのか
・どこかのブログ内のリンクから来たのか
(2)ユーザがどのWebページ(コンテンツ)に興味を示し、どの商品を購入したのか(購買に結びついたのか)
・人気のあるWebページはどれか
・滞在時間が長いWebページはどれか
(3)ユーザが商品を購入せず(購買に結びつかず)、どのWebページから自社のWebサイト外へ出て行ったのか
・アクセスが続かなくなった(離脱した)Webページはどれか
といった、Webサイト内でのユーザの行動を解析すること(即ち、Webページへのアクセス解析)である。企業は、アクセス解析の結果から、離脱率が低下し、アクセス数、購入率、販売数が増加するように、Webページの改良などを行い、販売規模の拡大を図っている。
The number of companies (business owners) that sell products using the Internet is increasing year by year, and the scale of product sales via the Internet is also increasing. Along with this, it has become indispensable for each company to analyze the behavior of users who shop on their Web site and grasp their trends in order to expand the sales scale. The behavioral analysis here is
(1) How the user came to the company's website ・ Enter the keyword on the search site, came from the hit link ・ Did it come from a link in some blog (2) Which web pages (contents) are interested and which products are purchased (whether they lead to purchases)
・ Which web page is popular ・ Which web page has a long stay time (3) The user did not purchase the product (does not lead to purchase), and from which web page he / she went outside his / her own website The analysis of the user's behavior in the Web site, such as which Web page is no longer accessed (leaved), ie, access analysis to the Web page. From the results of access analysis, companies are trying to expand the sales scale by improving Web pages so that the withdrawal rate decreases and the number of accesses, purchase rates, and sales increases.

従来のアクセス解析の方式には、主に、以下の3種類がある。
(1)アクセスログ型:Webサーバが、Webページへのアクセスがある度に、HTTP(ハイパーテキスト転送プロトコル)リクエストやHTTPレスポンスの一部を所定の形式でアクセスログに記録する。アクセス解析は、このアクセスログを解析することによって行われる(例えば、特許文献1〜5参照)。
(2)ビーコン(タグ)型:各Webページには小さなプログラム(タグ)が貼付され、ユーザのWebブラウザがWebページを読み込むと、そのプログラムが取得した情報が、Webサーバとは別の解析サーバに送信される。解析サーバは、この情報をデータベース化して記録する。アクセス解析は、このデータベース上の情報を解析することによって行われる。
(3)パケットキャプチャ型:パケットキャプチャ装置が、Webサーバを外部と接続するネットワーク上を流れる全てのパケット(HTTPリクエスト又はHTTPレスポンスを含むパケット)をキャプチャする。アクセス解析は、キャプチャされたパケットからHTTP通信を復元し、このHTTP通信を解析することによって行われる。
特開2002−24127号公報 特開2002−63102号公報 特開2004−152209号公報 特開2004−280240号公報 特開2004−280501号公報
There are mainly the following three types of conventional access analysis methods.
(1) Access log type: Each time a Web server accesses a Web page, an HTTP (Hypertext Transfer Protocol) request or a part of an HTTP response is recorded in an access log in a predetermined format. The access analysis is performed by analyzing the access log (see, for example, Patent Documents 1 to 5).
(2) Beacon (tag) type: A small program (tag) is affixed to each Web page, and when a user's Web browser reads the Web page, the information acquired by the program is an analysis server separate from the Web server. Sent to. The analysis server records this information in a database. Access analysis is performed by analyzing information on this database.
(3) Packet capture type: A packet capture device captures all packets (packets including an HTTP request or an HTTP response) that flow on a network connecting a Web server to the outside. The access analysis is performed by restoring the HTTP communication from the captured packet and analyzing the HTTP communication.
JP 2002-24127 A JP 2002-63102 A JP 2004-152209 A JP 2004-280240 A JP 2004-280501 A

アクセスログ型、ビーコン型の場合、アクセス解析を行うための仕組みをWebサイトごとに実装する作業が必要となる、という課題があった。具体的には、アクセスログ型の場合、Webサーバに手を入れる必要があった。例えば、通常、Webサーバのデフォルト設定では、Referer(直前にアクセスされたWebページのURL)やCookieなどがログに出力されないため、それらの情報をアクセスログに記録するようにWebサーバの設定を変更する作業が必要であった。また、Webサイトごとに異なるログイン認証方式に合わせて、ログイン中のユーザを識別するユーザID(識別子)などをアクセスログに記録する処理を実装する作業が必要であった。ビーコン型の場合、ビーコン(タグ)を各Webページに埋め込む作業が必要であった。   In the case of the access log type and the beacon type, there is a problem that a work for implementing an access analysis for each website is required. Specifically, in the case of the access log type, it is necessary to put a hand in the Web server. For example, since the referrer (URL of the web page accessed immediately before), cookie, etc. are not normally output to the log in the default setting of the web server, the web server setting is changed to record such information in the access log. It was necessary to work. Further, it is necessary to implement a process of recording a user ID (identifier) for identifying a logged-in user in an access log in accordance with a login authentication method that is different for each Web site. In the case of the beacon type, it is necessary to embed a beacon (tag) in each Web page.

従来のパケットキャプチャ型の場合、アクセス解析を行うための仕組みをWebサイトごとに実装する作業は必要ないが、Webサイト内でのユーザごとの行動を把握することができない、という課題があった。アクセスログ型の場合は、アクセスログに記録されたユーザIDなどを参照することで、個々のユーザの行動(例えば、どのような順番でどのWebページにアクセスしたのか)を解析することができる。ビーコン型の場合は、ユーザごとに動作するビーコンから情報が送信されるため、情報の送信元となったビーコンを特定することで、個々のユーザの行動を解析することができる。一方、従来のパケットキャプチャ型の場合は、あるWebページを起点として1人のユーザがそのWebページの2つ以上前に閲覧していたWebページがどれであるか、といったことが分からないため(1つ前に閲覧していたWebページはRefererを参照することで分かる)、個々のユーザの行動を十分に解析することができない(ただし、ユーザが携帯電話を利用してアクセスする場合、端末IDを送信するように設定されていれば、携帯電話から端末IDが送信されるため、個々の携帯電話を特定することで、個々のユーザの行動を解析することができる)。   In the case of the conventional packet capture type, there is no need to implement a mechanism for performing access analysis for each website, but there is a problem that it is impossible to grasp the behavior of each user in the website. In the case of the access log type, by referring to the user ID or the like recorded in the access log, it is possible to analyze each user's behavior (for example, in what order and which web page was accessed). In the case of the beacon type, since information is transmitted from a beacon that operates for each user, the behavior of each user can be analyzed by specifying the beacon that is the transmission source of the information. On the other hand, in the case of the conventional packet capture type, it is not known which Web page was browsed by a single user two or more times before that Web page as a starting point ( The previous web page can be seen by referring to the Referer), and the behavior of each user cannot be analyzed sufficiently (however, if the user accesses using a mobile phone, the terminal ID If the terminal ID is transmitted from the mobile phone, the behavior of each user can be analyzed by specifying the individual mobile phone).

本発明は、例えば、アクセス解析を行うための仕組みをWebサイトごとに実装しなくても、Webサイト内でのユーザごとの行動を把握できるようにすることを目的とする。   For example, an object of the present invention is to make it possible to grasp an action for each user in a website without mounting a mechanism for performing access analysis for each website.

本発明の一の態様に係るアクセス解析装置は、
Webページのページデータとユーザに対して個別に設定される個別設定データとを含むレスポンスを載せたパケットを収集するパケットキャプチャ装置から、複数のパケットを取得して記憶装置に保存するパケット取得部と、
前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元部と、
前記レスポンス復元部により復元された複数のレスポンスの各々から、個別設定データを処理装置により抽出する個別設定データ抽出部と、
前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定部と、
前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成部とを備えることを特徴とする。
An access analysis device according to one aspect of the present invention includes:
A packet acquisition unit that acquires a plurality of packets from a packet capture device that collects a packet including a response including page data of a Web page and individual setting data individually set for a user and stores the packets in a storage device; ,
Analyzing a plurality of packets stored by the packet acquisition unit, and restoring a plurality of responses transmitted on the plurality of packets by a processing device;
An individual setting data extraction unit for extracting individual setting data from each of a plurality of responses restored by the response restoration unit by a processing device;
A response identifying unit that identifies a response common to the individual setting data extracted by the individual setting data extraction unit as a single response group among a plurality of responses restored by the response restoration unit;
It is estimated that the same user has accessed a web page including page data in each response of the response group identified by the response identifying unit, and access history data indicating that the same user has accessed the web page And an access history data generation unit generated by the processing device.

前記パケットキャプチャ装置は、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、ログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される当該ユーザの属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出部は、前記レスポンス復元部により復元された複数のレスポンスの各々から、個別設定データとして、属性データを処理装置により抽出し、
前記レスポンス特定部は、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。
The packet capture device is a response returned by the Web server in response to a request from the user, and is added to the page data of the Web page to which the logged-in user requests access by the Web server Collecting packets with responses containing attribute data of
The individual setting data extraction unit extracts attribute data as individual setting data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response identifying unit identifies, as a response group, a response having a common attribute data extracted by the individual setting data extraction unit among a plurality of responses restored by the response restoration unit, as a response group. And

前記個別設定データ抽出部は、ユーザがログイン中のWebページのページデータとユーザがログイン中でないWebページ又は他のユーザがログイン中のWebページのページデータとを比較して、差異がある部分のデータが属性データであると処理装置により推定することを特徴とする。   The individual setting data extraction unit compares the page data of the web page in which the user is logged in with the page data of the web page in which the user is not logged in or the web page in which another user is logged in. The processing device estimates that the data is attribute data.

前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページにて特定の表示データから所定の相対位置、もしくは、2つの特定の表示データをそれぞれ起点及び終点とする範囲に表示される属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出部は、前記レスポンス復元部により復元された複数のレスポンスの各々から、前記特定の表示データを抽出して、前記特定の表示データから前記所定の相対位置もしくは前記範囲に表示される部分のデータが属性データであると処理装置により推定することを特徴とする。
The packet capture device has, as attribute data, a specific relative position from a specific display data on a Web page to which a logged-in user requests access, or a range having two specific display data as a starting point and an ending point, respectively. It collects packets with responses containing attribute data to be displayed.
The individual setting data extraction unit extracts the specific display data from each of a plurality of responses restored by the response restoration unit, and displays the specific display data at the predetermined relative position or the range from the specific display data. The processing device estimates that the portion of the data is attribute data.

前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページに表示される当該ユーザの名前データを含むレスポンスを載せたパケットを収集するものであり、
記憶装置には、人名の辞書データが予め記憶されており、
前記個別設定データ抽出部は、記憶装置に記憶された辞書データを用いて、前記レスポンス復元部により復元された複数のレスポンスの各々から、Webページに人名を表示する部分のデータを抽出して、当該部分のデータが名前データであると処理装置により推定することを特徴とする。
The packet capture device collects a packet containing a response including name data of the user displayed on a web page that the logged-in user requests access as attribute data,
The storage device stores personal name dictionary data in advance,
The individual setting data extraction unit uses the dictionary data stored in the storage device to extract data of a part that displays a person's name on a Web page from each of a plurality of responses restored by the response restoration unit, The processing device estimates that the data of the part is name data.

前記パケットキャプチャ装置は、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、ログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される、当該ユーザが複数のWebページに共通に設定したレイアウトを示すレイアウト設定データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出部は、前記レスポンス復元部により復元された複数のレスポンスの各々から、個別設定データとして、レイアウト設定データを処理装置により抽出し、
前記レスポンス特定部は、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。
The packet capture device is a response returned by a Web server in response to a request from a user, and is added by the Web server to page data of a Web page for which a logged-in user requests access. Collecting packets with responses including layout setting data indicating layouts commonly set by a user on a plurality of Web pages;
The individual setting data extraction unit extracts layout setting data as individual setting data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response specifying unit specifies, by a processing device, a response having a common layout setting data extracted by the individual setting data extracting unit among a plurality of responses restored by the response restoring unit as one response group. Features.

前記レスポンス特定部は、前記レスポンス復元部により同一の送信元アドレスをもつパケットから復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。   The response specifying unit includes a response having a common response of the individual setting data extracted by the individual setting data extracting unit among a plurality of responses restored from a packet having the same source address by the response restoring unit. A group is specified by a processing device.

本発明の一の態様に係るアクセス解析方法は、
パケットキャプチャ装置が、Webページのページデータとユーザに対して個別に設定される個別設定データとを含むレスポンスを載せたパケットを収集し、
アクセス解析装置のパケット取得部が、前記パケットキャプチャ装置により収集された複数のパケットを取得して記憶装置に保存し、
前記アクセス解析装置のレスポンス復元部が、前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元し、
前記アクセス解析装置の個別設定データ抽出部が、前記レスポンス復元部により復元された複数のレスポンスの各々から、個別設定データを処理装置により抽出し、
前記アクセス解析装置のレスポンス特定部が、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定し、
前記アクセス解析装置のアクセス履歴データ生成部が、前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成することを特徴とする。
An access analysis method according to one aspect of the present invention includes:
A packet capture device collects a packet with a response including page data of a web page and individual setting data individually set for a user,
The packet acquisition unit of the access analysis device acquires a plurality of packets collected by the packet capture device and stores them in a storage device,
The response restoration unit of the access analysis device analyzes a plurality of packets stored by the packet acquisition unit, and restores a plurality of responses transmitted on the plurality of packets by a processing device,
The individual setting data extraction unit of the access analysis device extracts individual setting data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response identifying unit of the access analysis device uses the processing device as a response group with a response shared by the individual setting data extracted by the individual setting data extraction unit among a plurality of responses restored by the response restoration unit. Identify,
The access history data generation unit of the access analysis device estimates that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying unit, and the same to the Web page The access history data indicating that the user has accessed is generated by the processing device.

本発明の一の態様に係るアクセス解析プログラムは、
Webページのページデータとユーザに対して個別に設定される個別設定データとを含むレスポンスを載せたパケットを収集するパケットキャプチャ装置から、複数のパケットを取得して記憶装置に保存するパケット取得処理と、
前記パケット取得処理により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元処理と、
前記レスポンス復元処理により復元された複数のレスポンスの各々から、個別設定データを処理装置により抽出する個別設定データ抽出処理と、
前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定処理と、
前記レスポンス特定処理により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成処理とをコンピュータに実行させることを特徴とする。
An access analysis program according to one aspect of the present invention includes:
A packet acquisition process for acquiring a plurality of packets from a packet capture device that collects a packet containing a response including page data of a Web page and individual setting data individually set for a user and storing the packets in a storage device; ,
Analyzing a plurality of packets stored by the packet acquisition processing, and restoring a plurality of responses sent on the plurality of packets by a processing device; and
Individual setting data extraction processing for extracting individual setting data from each of a plurality of responses restored by the response restoration processing by a processing device;
A response specifying process for specifying, by one processing group, a response having a common response to the individual setting data extracted by the individual setting data extraction process among a plurality of responses restored by the response restoration process;
It is estimated that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying process, and access history data indicating that the same user has accessed the Web page is stored. An access history data generation process generated by a processing device is executed by a computer.

前記パケットキャプチャ装置は、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、ログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される当該ユーザの属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出処理は、前記レスポンス復元処理により復元された複数のレスポンスの各々から、個別設定データとして、属性データを処理装置により抽出し、
前記レスポンス特定処理は、前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。
The packet capture device is a response returned by the Web server in response to a request from the user, and is added to the page data of the Web page to which the logged-in user requests access by the Web server Collecting packets with responses containing attribute data of
In the individual setting data extraction process, the attribute data is extracted by the processing device as individual setting data from each of the plurality of responses restored by the response restoration process,
The response specifying process specifies a response having a common attribute data extracted by the individual setting data extraction process among a plurality of responses restored by the response restoration process as one response group by a processing device. And

前記個別設定データ抽出処理は、ユーザがログイン中のWebページのページデータとユーザがログイン中でないWebページ又は他のユーザがログイン中のWebページのページデータとを比較して、差異がある部分のデータが属性データであると処理装置により推定することを特徴とする。   The individual setting data extraction process compares the page data of the web page where the user is logged in with the page data of the web page where the user is not logged in or the web page where the other user is logged in. The processing device estimates that the data is attribute data.

前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページにて特定の表示データから所定の相対位置、もしくは、2つの特定の表示データをそれぞれ起点及び終点とする範囲に表示される属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出処理は、前記レスポンス復元処理により復元された複数のレスポンスの各々から、前記特定の表示データを抽出して、前記特定の表示データから前記所定の相対位置もしくは前記範囲に表示される部分のデータが属性データであると処理装置により推定することを特徴とする。
The packet capture device has, as attribute data, a specific relative position from a specific display data on a Web page to which a logged-in user requests access, or a range having two specific display data as a starting point and an ending point, respectively. It collects packets with responses containing attribute data to be displayed.
The individual setting data extraction process extracts the specific display data from each of a plurality of responses restored by the response restoration process, and displays the specific display data at the predetermined relative position or the range from the specific display data. The processing device estimates that the portion of the data is attribute data.

前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページに表示される当該ユーザの名前データを含むレスポンスを載せたパケットを収集するものであり、
記憶装置には、人名の辞書データが予め記憶されており、
前記個別設定データ抽出処理は、記憶装置に記憶された辞書データを用いて、前記レスポンス復元処理により復元された複数のレスポンスの各々から、Webページに人名を表示する部分のデータを抽出して、当該部分のデータが名前データであると処理装置により推定することを特徴とする。
The packet capture device collects a packet containing a response including name data of the user displayed on a web page that the logged-in user requests access as attribute data,
The storage device stores personal name dictionary data in advance,
The individual setting data extraction process uses the dictionary data stored in the storage device to extract data of a part that displays a person's name on a Web page from each of a plurality of responses restored by the response restoration process. The processing device estimates that the data of the part is name data.

前記パケットキャプチャ装置は、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、ログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される、当該ユーザが複数のWebページに共通に設定したレイアウトを示すレイアウト設定データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出処理は、前記レスポンス復元処理により復元された複数のレスポンスの各々から、個別設定データとして、レイアウト設定データを処理装置により抽出し、
前記レスポンス特定処理は、前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。
The packet capture device is a response returned by a Web server in response to a request from a user, and is added by the Web server to page data of a Web page for which a logged-in user requests access. Collecting packets with responses including layout setting data indicating layouts commonly set by a user on a plurality of Web pages;
In the individual setting data extraction process, the layout setting data is extracted by the processing device as individual setting data from each of the plurality of responses restored by the response restoration process,
In the response specifying process, a response having a common layout setting data extracted by the individual setting data extraction process is specified by the processing device as one response group among a plurality of responses restored by the response restoring process. Features.

前記レスポンス特定処理は、前記レスポンス復元処理により同一の送信元アドレスをもつパケットから復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出された個別設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする。   The response specifying process is a response including a response having a common individual setting data extracted by the individual setting data extraction process among a plurality of responses restored from a packet having the same source address by the response restoration process. A group is specified by a processing device.

本発明の一の態様によれば、アクセス解析装置において、レスポンス復元部が、パケットキャプチャ装置から取得された複数のパケットを解析して、複数のレスポンスを復元し、個別設定データ抽出部が、復元された複数のレスポンスの各々から、ユーザに対して個別に設定される個別設定データを抽出し、レスポンス特定部が、復元された複数のレスポンスのうち、抽出された個別設定データが共通するレスポンスを1つのレスポンス群として特定し、アクセス履歴データ生成部が、特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定することにより、例えば、アクセス解析を行うための仕組みをWebサイトごとに実装しなくても、Webサイト内でのユーザごとの行動を把握できるようになる。   According to one aspect of the present invention, in the access analysis device, the response restoration unit analyzes a plurality of packets acquired from the packet capture device, restores a plurality of responses, and the individual setting data extraction unit performs restoration. The individual setting data individually set for the user is extracted from each of the plurality of responses, and the response specifying unit generates a response having the same extracted individual setting data among the restored responses. For example, the access history data generation unit performs an access analysis by estimating that the same user has accessed a Web page in which page data is included in each response of the specified response group. Behavior for each user on a website without implementing a mechanism for each website It will be able to grasp.

以下、本発明の実施の形態について、図を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

実施の形態1.
図1は、本実施の形態に係るアクセス解析装置100の利用形態の一例を示す図である。
Embodiment 1 FIG.
FIG. 1 is a diagram illustrating an example of a usage pattern of an access analysis device 100 according to the present embodiment.

図1において、ユーザ端末201は、ユーザが利用するコンピュータであり、ユーザがWebページを閲覧するためのWebブラウザを動作させる。ユーザ端末201は、例えばPC(パーソナルコンピュータ)である。   In FIG. 1, a user terminal 201 is a computer used by a user, and operates a Web browser for the user to browse a Web page. The user terminal 201 is, for example, a PC (personal computer).

Webサーバ202は、複数のWebページからなるWebサイトを実現するサーバコンピュータである。以下では、説明を簡単にするため、1つのWebサイトを実現するものであれば、サーバコンピュータが2台以上ある場合でも、それらをまとめて1つのWebサーバ202として考えるものとする。また、単にHTML(ハイパーテキストマークアップ言語)ファイルを提供するHTTP(ハイパーテキスト転送プロトコル)サーバだけでなく、Webサイト上で電子商取引サービスを提供するために必要なログイン認証機能やデータベース処理機能を有するWebアプリケーションサーバなどもまとめて1つのWebサーバ202として考えるものとする。なお、ここでは、ハードウェア及びソフトウェアの組み合わせであるサーバコンピュータとソフトウェアのみであるサーバプログラムは厳密に区別していない(どちらを指す場合にも、Webサーバ202という)。   The Web server 202 is a server computer that implements a Web site composed of a plurality of Web pages. In the following, for the sake of simplicity, it is assumed that a single Web site can be realized as a single Web server 202 even if there are two or more server computers, as long as one Web site is realized. In addition to an HTTP (Hypertext Transfer Protocol) server that simply provides an HTML (Hypertext Markup Language) file, it also has a login authentication function and a database processing function necessary for providing an electronic commerce service on a Web site. Web application servers and the like are collectively considered as one Web server 202. Here, a server computer that is a combination of hardware and software and a server program that is only software are not strictly distinguished (in either case, the Web server 202 is referred to).

ユーザ端末201とWebサーバ202は、インターネット203を介して、IP(インターネットプロトコル)通信を行う。IP通信において、ユーザ端末201は、インターネット203を介して、IPパケット211をWebサーバ202へ送信する。同様に、Webサーバ202は、インターネット203を介して、IPパケット212をユーザ端末201へ送信する。ユーザ端末201で動作するWebブラウザとWebサーバ202は、IP通信を利用してHTTP通信を行う。   The user terminal 201 and the Web server 202 perform IP (Internet Protocol) communication via the Internet 203. In IP communication, the user terminal 201 transmits an IP packet 211 to the Web server 202 via the Internet 203. Similarly, the Web server 202 transmits an IP packet 212 to the user terminal 201 via the Internet 203. A Web browser operating on the user terminal 201 and the Web server 202 perform HTTP communication using IP communication.

ここで、図2に、ユーザがログイン中でない場合に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ311の一例を示す。また、図3に、このWebページ311をユーザ端末201で動作するWebブラウザが取得するためのHTTP通信の一例を示す。HTTP通信において、Webブラウザは、HTTPリクエスト401をWebサーバ202へ送信する。Webサーバ202は、HTTPリクエスト401に応じて、HTTPレスポンス402をユーザ端末201へ返信する。   Here, FIG. 2 shows an example of a web page 311 displayed on the web browser screen 301 of the user terminal 201 when the user is not logged in. FIG. 3 shows an example of HTTP communication for acquiring the Web page 311 by a Web browser operating on the user terminal 201. In HTTP communication, the Web browser transmits an HTTP request 401 to the Web server 202. The Web server 202 returns an HTTP response 402 to the user terminal 201 in response to the HTTP request 401.

図3において、ユーザが、Webブラウザ画面301にWebページ311のURL321(Uniform・Resource・Locator)を入力して(Webブラウザ画面301で閲覧中の他のWebページ内にあるリンクをクリックするなど、他の方法を用いてもよい)、Webページ311へのアクセスを要求すると、Webブラウザは、そのWebページ311のURLデータ411を含むHTTPリクエスト401を生成する。ユーザ端末201は、HTTPリクエスト401をIPパケット211に載せてWebサーバ202へ送信する。   In FIG. 3, the user inputs the URL 321 (Uniform / Resource / Locator) of the Web page 311 on the Web browser screen 301 (clicks a link in another Web page being browsed on the Web browser screen 301, etc.) When an access to the web page 311 is requested, the web browser generates an HTTP request 401 including the URL data 411 of the web page 311. The user terminal 201 transmits an HTTP request 401 on the IP packet 211 to the Web server 202.

Webサーバ202は、HTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれるURLデータ411に基づいて、ユーザがアクセスを要求したWebページ311を特定し、そのWebページ311のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、特定の表示データ413を付加するものとする。Webサーバ202は、特定の表示データ413が付加されたページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。   When the Web server 202 receives the IP packet 211 carrying the HTTP request 401 from the user terminal 201, the Web server 202 specifies the Web page 311 requested by the user to access based on the URL data 411 included in the HTTP request 401, and the Web server An HTTP response 402 including page data 412 of the page 311 is generated. At this time, the Web server 202 adds specific display data 413 to the page data 412. The Web server 202 returns an HTTP response 402 including the page data 412 to which the specific display data 413 is added on the IP packet 212 to the user terminal 201.

ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ311をWebブラウザ画面301に表示する。図2に示したように、例えば、Webブラウザは、ページデータ412に付加された特定の表示データ413を、「こんにちは。」という特定の文字列322としてWebページ311の一部に表示する。また、Webブラウザは、Webサイトで扱われている商品カテゴリのメニュー323をWebページ311の一部に表示する。Webブラウザは、メニュー323内に、各商品カテゴリの商品販売用のWebページへのリンク324を表示する。   When the user terminal 201 receives the IP packet 212 carrying the HTTP response 402 from the Web server 202, the Web browser operating on the user terminal 201 changes the Web page 311 to the Web based on the page data 412 included in the HTTP response 402. It is displayed on the browser screen 301. As shown in FIG. 2, for example, Web browser, the particular display data 413 added to the page data 412 is displayed on a part of the Web page 311 as a specific character string 322 of "hello.". Further, the Web browser displays a menu 323 of the product category handled on the Web site on a part of the Web page 311. The Web browser displays a link 324 to a Web page for product sales in each product category in the menu 323.

図4に、ユーザがログインした直後に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ312の一例を示す。また、図5に、このWebページ312をユーザ端末201で動作するWebブラウザが取得するためのHTTP通信の一例を示す。   FIG. 4 shows an example of a web page 312 displayed on the web browser screen 301 of the user terminal 201 immediately after the user logs in. FIG. 5 shows an example of HTTP communication for acquiring a Web page 312 by a Web browser operating on the user terminal 201.

図5において、ユーザが、Webブラウザ画面301で閲覧中のログイン認証用のWebページ内にあるフォームに、Webサイトで予め設定されたユーザID(識別子)とパスワードの組み合わせを入力して、Webサイトへのログインを要求すると、Webブラウザは、認証データ414を含むHTTPリクエスト401を生成する。ユーザ端末201は、HTTPリクエスト401をIPパケット211に載せてWebサーバ202へ送信する。   In FIG. 5, the user inputs a combination of a user ID (identifier) and a password set in advance on the website into a form in the login authentication web page being browsed on the web browser screen 301. When requesting login to, the Web browser generates an HTTP request 401 including authentication data 414. The user terminal 201 transmits an HTTP request 401 on the IP packet 211 to the Web server 202.

Webサーバ202は、HTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれる認証データ414に基づいて、ユーザを認証する。Webサーバ202は、ユーザの認証が成功すると(これによりユーザはログインしたことになる)、ログイン中のユーザに対してデフォルトで表示するWebページ312のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、ログイン中のユーザの個別設定データを付加する。個別設定データは、ユーザに対して個別に設定されるもの(即ち、ユーザを区別できる情報)で、例えば、ユーザの属性データである。ここでは、Webサーバ202は、ログイン中のユーザの属性データとして、ユーザの名前データ415をページデータ412に付加するものとする。Webサーバ202は、属性データとして、他にも、ユーザID、ユーザのポイントデータ(Webサイトで商品を購入したユーザなどに与えられるポイントを記録したデータ)、ユーザの購入履歴データ(Webサイトでユーザが購入した商品などを記録したデータ)、ユーザの嗜好データ(Webサイトでユーザが購入した商品によって推定されるユーザの嗜好に合わせて動的に生成されるWebページへのリンク324)などをページデータ412に付加してもよい。Webサーバ202は、ログイン中のユーザの属性データを付加したページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。   When receiving the IP packet 211 carrying the HTTP request 401 from the user terminal 201, the Web server 202 authenticates the user based on the authentication data 414 included in the HTTP request 401. When the user authentication is successful (which means that the user has logged in), the Web server 202 generates an HTTP response 402 including the page data 412 of the Web page 312 displayed by default for the logged-in user. At this time, the Web server 202 adds individual setting data of the logged-in user to the page data 412. The individual setting data is individually set for the user (that is, information that can distinguish the user), and is, for example, user attribute data. Here, it is assumed that the Web server 202 adds user name data 415 to the page data 412 as attribute data of the logged-in user. In addition to the attribute data, the Web server 202 also includes a user ID, user point data (data recording points given to a user who purchased a product on the website, etc.), user purchase history data (users on the website) Page, etc.), user preference data (link 324 to a web page dynamically generated according to the user's preference estimated by the product purchased by the user on the website), etc. It may be added to the data 412. The Web server 202 returns an HTTP response 402 including page data 412 to which the attribute data of the logged-in user is added to the IP packet 212 and returns it to the user terminal 201.

ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ312をWebブラウザ画面301に表示する。図4に示したように、例えば、Webブラウザは、ページデータ412に付加された特定の表示データ413を、「こんにちは、」という特定の文字列322としてWebページ312の一部に表示する。また、Webブラウザは、ページデータ412に付加された特定の表示データ416を、「さん。」という特定の文字列326としてWebページ312の一部に表示する。さらに、Webブラウザは、ページデータ412に付加されたユーザの名前データ415に基づいて、ユーザの「山田太郎」という名前325を特定の文字列322の後(所定の相対位置の一例)、もしくは、特定の文字列322と特定の文字列326との間(特定の文字列322を起点とし、特定の文字列326を終点とする範囲)に表示する。また、Webブラウザは、ページデータ412に付加された他の属性データに基づいて、ユーザIDやユーザの購入履歴データが(hiddenパラメータなどとして)埋め込まれたWebページ312を表示する。あるいは、Webブラウザは、ユーザのポイントデータをWebページ312の一部に表示する。あるいは、Webブラウザは、ユーザの嗜好データであるリンク324を含むメニュー323をWebページ312の一部に表示する。   When the user terminal 201 receives the IP packet 212 carrying the HTTP response 402 from the Web server 202, the Web browser operating on the user terminal 201 changes the Web page 312 to the Web page 312 based on the page data 412 included in the HTTP response 402. It is displayed on the browser screen 301. As shown in FIG. 4, for example, Web browser, the particular display data 413 added to the page data 412 is displayed on a part of the Web page 312 as a specific character string 322 of "hello,". Further, the Web browser displays the specific display data 416 added to the page data 412 as a specific character string 326 “san” on a part of the Web page 312. Furthermore, the Web browser changes the name 325 of the user “Taro Yamada” after a specific character string 322 (an example of a predetermined relative position) based on the user name data 415 added to the page data 412, or It is displayed between the specific character string 322 and the specific character string 326 (a range starting from the specific character string 322 and ending with the specific character string 326). Further, the web browser displays the web page 312 in which the user ID and the purchase history data of the user are embedded (as a hidden parameter or the like) based on other attribute data added to the page data 412. Alternatively, the Web browser displays the user point data on a part of the Web page 312. Alternatively, the Web browser displays a menu 323 including a link 324 that is user preference data on a part of the Web page 312.

図6に、ユーザがログイン中に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ313の一例を示す。   FIG. 6 shows an example of a web page 313 displayed on the web browser screen 301 of the user terminal 201 while the user is logged in.

図示していないが、ログイン中のユーザが、Webブラウザ画面301にWebページ313のURL321を入力するなど、前述した方法を用いて、Webページ313へのアクセスを要求すると、Webブラウザは、そのWebページ313のURLデータ411を含むHTTPリクエスト401を生成する。このとき、Webブラウザは、ユーザがWebサイトにログインしたときにCookieに書き込まれたデータ(ユーザID、ユーザがログイン中であることを示すデータなど)をHTTPリクエスト401に付加する。ユーザ端末201は、HTTPリクエスト401をIPパケット211に載せてWebサーバ202へ送信する。   Although not shown, when a logged-in user requests access to the Web page 313 using the method described above, such as inputting the URL 321 of the Web page 313 on the Web browser screen 301, the Web browser displays the Web page 313. An HTTP request 401 including the URL data 411 of the page 313 is generated. At this time, the Web browser adds data (such as a user ID and data indicating that the user is logged in) written in the cookie when the user logs in to the Web site to the HTTP request 401. The user terminal 201 transmits an HTTP request 401 on the IP packet 211 to the Web server 202.

Webサーバ202は、HTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれるURLデータ411に基づいて、ユーザがアクセスを要求したWebページ313を特定し、そのWebページ313のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、特定の表示データ413,416とユーザの名前データ415を付加する。Webサーバ202は、さらに、他の属性データをページデータ412に付加してもよい。Webサーバ202は、HTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。   When receiving the IP packet 211 carrying the HTTP request 401 from the user terminal 201, the Web server 202 identifies the Web page 313 requested by the user for access based on the URL data 411 included in the HTTP request 401, An HTTP response 402 including page data 412 of the page 313 is generated. At this time, the Web server 202 adds specific display data 413 and 416 and user name data 415 to the page data 412. The Web server 202 may further add other attribute data to the page data 412. The Web server 202 returns an HTTP response 402 on the IP packet 212 and returns it to the user terminal 201.

ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ313をWebブラウザ画面301に表示する。   When the user terminal 201 receives the IP packet 212 carrying the HTTP response 402 from the Web server 202, the Web browser operating on the user terminal 201 changes the Web page 313 to the Web based on the page data 412 included in the HTTP response 402. It is displayed on the browser screen 301.

図2に示したWebページ311と図4に示したWebページ312とを比較すると、いずれもURL321や表示されているコンテンツは同じであるが、図2に示したWebページ311の上部には、特定の文字列322のみが表示されているのに対し、図4に示したWebページ312の上部には、特定の文字列322のほか、その後に続けてログイン中のユーザの名前325が表示されている。また、図4に示したWebページ312と図6に示したWebページ313とを比較すると、URL321や表示されているコンテンツは異なっているが、いずれのWebページ312,313の上部にも、特定の文字列322のほか、その後に続けてログイン中のユーザの名前325が表示されている。このように、上記の例におけるWebサイトでは、ユーザがログインすると、各Webページの上部にユーザの名前325が共通の形式で表示されるようになっている。   When the Web page 311 shown in FIG. 2 is compared with the Web page 312 shown in FIG. 4, the URL 321 and the displayed content are the same, but the upper part of the Web page 311 shown in FIG. While only the specific character string 322 is displayed, in addition to the specific character string 322, the name 325 of the currently logged-in user is displayed at the top of the Web page 312 shown in FIG. ing. Further, when the Web page 312 shown in FIG. 4 and the Web page 313 shown in FIG. 6 are compared, the URL 321 and the displayed content are different, but the upper part of each of the Web pages 312 and 313 is specified. In addition to the character string 322, the name 325 of the currently logged-in user is displayed. Thus, in the Web site in the above example, when the user logs in, the user name 325 is displayed in a common format at the top of each Web page.

図1において、ネットワーク機器204は、Webサーバ202とインターネット203の間に接続される通信機器であり、ユーザ端末201からインターネット203を介してWebサーバ202へ送信されるIPパケット211、及び、Webサーバ202からインターネット203を介してユーザ端末201へ送信されるIPパケット212を中継する。ネットワーク機器204は、中継する全てのIPパケット211,212をミラーポートからも出力する。ネットワーク機器204は、例えばスイッチングハブやルータである。   In FIG. 1, a network device 204 is a communication device connected between the Web server 202 and the Internet 203. The IP packet 211 transmitted from the user terminal 201 to the Web server 202 via the Internet 203, and the Web server The IP packet 212 transmitted from the user 202 to the user terminal 201 via the Internet 203 is relayed. The network device 204 also outputs all IP packets 211 and 212 to be relayed from the mirror port. The network device 204 is, for example, a switching hub or a router.

パケットキャプチャ装置205は、ネットワーク機器204のミラーポートに接続されるコンピュータである。パケットキャプチャ装置205は、ネットワーク機器204のミラーポートから出力される複数のIPパケット211,212を収集し、ハードディスクなどの記録媒体に蓄積する。   The packet capture device 205 is a computer connected to the mirror port of the network device 204. The packet capture device 205 collects a plurality of IP packets 211 and 212 output from the mirror port of the network device 204 and stores them in a recording medium such as a hard disk.

アクセス解析装置100は、パケットキャプチャ装置205に接続されるコンピュータである。アクセス解析装置100は、パケットキャプチャ装置205が記録媒体に蓄積した複数のIPパケット211,212を解析することで、Webサイト内でのユーザごとの行動を解析する。アクセス解析装置100は、パケットキャプチャ装置205を内蔵していてもよい。具体的には、アクセス解析装置100は、パケットキャプチャ装置205の機能を有するプログラムを実行するコンピュータであってもよい。   The access analysis device 100 is a computer connected to the packet capture device 205. The access analysis device 100 analyzes a plurality of IP packets 211 and 212 stored in a recording medium by the packet capture device 205, thereby analyzing an action for each user in the Web site. The access analysis device 100 may incorporate a packet capture device 205. Specifically, the access analysis device 100 may be a computer that executes a program having the function of the packet capture device 205.

図7は、アクセス解析装置100の構成を示すブロック図である。   FIG. 7 is a block diagram illustrating a configuration of the access analysis device 100.

図7において、アクセス解析装置100は、パケット取得部101、リクエスト・レスポンス復元部102(レスポンス復元部の一例)、個別設定データ抽出部103、レスポンス特定部104、アクセス履歴データ生成部105、アクセス解析部106を備える。また、アクセス解析装置100は、記憶装置151、処理装置152、入力装置153、出力装置154などのハードウェアを備える(又はこれらのハードウェアがアクセス解析装置100に接続される)。ハードウェアはアクセス解析装置100の各部によって利用される。例えば、処理装置152は、アクセス解析装置100の各部でデータや情報の演算、加工、読み取り、書き込みなどを行うために利用される。記憶装置151は、そのデータや情報を記憶するために利用される。また、入力装置153は、そのデータや情報を入力するために、出力装置154は、そのデータや情報を出力するために利用される。   In FIG. 7, the access analysis device 100 includes a packet acquisition unit 101, a request / response restoration unit 102 (an example of a response restoration unit), an individual setting data extraction unit 103, a response identification unit 104, an access history data generation unit 105, an access analysis. Part 106 is provided. Further, the access analysis device 100 includes hardware such as a storage device 151, a processing device 152, an input device 153, and an output device 154 (or these hardware are connected to the access analysis device 100). The hardware is used by each unit of the access analysis device 100. For example, the processing device 152 is used to perform calculation, processing, reading, writing, and the like of data and information in each unit of the access analysis device 100. The storage device 151 is used to store the data and information. The input device 153 is used to input the data and information, and the output device 154 is used to output the data and information.

パケット取得部101は、パケットキャプチャ装置205から全てのIPパケット211,212を取得する。そして、パケット取得部101は、取得したIPパケット211,212を記憶装置151に保存する。   The packet acquisition unit 101 acquires all IP packets 211 and 212 from the packet capture device 205. Then, the packet acquisition unit 101 stores the acquired IP packets 211 and 212 in the storage device 151.

リクエスト・レスポンス復元部102は、パケット取得部101により保存されたIPパケット211,212のうち、複数のHTTPレスポンス402を載せた複数のIPパケット212を処理装置152により解析する。そして、リクエスト・レスポンス復元部102は、複数のIPパケット212に載せて送信された複数のHTTPレスポンス402を処理装置152により復元する。ここでは、リクエスト・レスポンス復元部102は、複数のIPパケット211も解析して、複数のIPパケット211に載せて送信された複数のHTTPリクエスト401を処理装置152により復元するものとする。   The request / response restoration unit 102 uses the processing device 152 to analyze a plurality of IP packets 212 carrying a plurality of HTTP responses 402 out of the IP packets 211 and 212 stored by the packet acquisition unit 101. Then, the request / response restoration unit 102 restores the plurality of HTTP responses 402 transmitted on the plurality of IP packets 212 by the processing device 152. Here, it is assumed that the request / response restoration unit 102 also analyzes the plurality of IP packets 211 and restores the plurality of HTTP requests 401 transmitted in the plurality of IP packets 211 by the processing device 152.

個別設定データ抽出部103は、リクエスト・レスポンス復元部102により復元された複数のHTTPレスポンス402の各々から、個別設定データを処理装置152により抽出する。個別設定データ抽出部103は、さらに、リクエスト・レスポンス復元部102により復元された複数のHTTPリクエスト401の各々から、個別設定データ(もしあれば)を抽出してもよい。   The individual setting data extraction unit 103 uses the processing device 152 to extract individual setting data from each of the plurality of HTTP responses 402 restored by the request / response restoration unit 102. The individual setting data extraction unit 103 may further extract individual setting data (if any) from each of the plurality of HTTP requests 401 restored by the request / response restoration unit 102.

レスポンス特定部104は、リクエスト・レスポンス復元部102により復元された複数のHTTPレスポンス402のうち、個別設定データ抽出部103により抽出された個別設定データが共通するHTTPレスポンス402を1つのレスポンス群として処理装置152により特定する。このとき、レスポンス特定部104は、リクエスト・レスポンス復元部102により復元された複数のHTTPリクエスト401のうち、上記レスポンス群の各HTTPレスポンス402に対応するHTTPリクエスト401を処理装置152により特定しておく。レスポンス特定部104は、さらに、リクエスト・レスポンス復元部102により復元された複数のHTTPリクエスト401のうち、個別設定データ抽出部103により抽出された個別設定データが共通するHTTPリクエスト401(もしあれば)を1つのリクエスト群として処理装置152により特定してもよい。   The response identifying unit 104 processes, as one response group, the HTTP response 402 having the same individual setting data extracted by the individual setting data extracting unit 103 among the plurality of HTTP responses 402 restored by the request / response restoring unit 102. It is specified by the device 152. At this time, the response specifying unit 104 uses the processing device 152 to specify the HTTP request 401 corresponding to each HTTP response 402 of the response group among the plurality of HTTP requests 401 restored by the request / response restoring unit 102. . The response specifying unit 104 further includes an HTTP request 401 (if any) in which the individual setting data extracted by the individual setting data extracting unit 103 among the plurality of HTTP requests 401 restored by the request / response restoring unit 102 is common. May be specified by the processing device 152 as one request group.

アクセス履歴データ生成部105は、レスポンス特定部104により特定されたレスポンス群の各HTTPレスポンス402にページデータ412が含まれるWebページへ同一のユーザがアクセスしたと推定する。そして、アクセス履歴データ生成部105は、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置152により生成する。このとき、アクセス履歴データ生成部105は、上記レスポンス群の各HTTPレスポンス402に対応するものとしてレスポンス特定部104により特定された各HTTPリクエスト401からURLを抽出し、それぞれのWebページを識別するために利用することができる。あるいは、アクセス履歴データ生成部105は、各HTTPレスポンス402に含まれるデータ(例えば、Webサイトのナビゲーション用にWebページに表示されるデータ)のみを、それぞれのWebページを識別するために利用してもよい。アクセス履歴データ生成部105は、生成したアクセス履歴データを記憶装置151に保存する。   The access history data generation unit 105 estimates that the same user has accessed the Web page in which the page data 412 is included in each HTTP response 402 of the response group specified by the response specifying unit 104. Then, the access history data generation unit 105 uses the processing device 152 to generate access history data indicating that the same user has accessed the Web page. At this time, the access history data generation unit 105 extracts the URL from each HTTP request 401 specified by the response specifying unit 104 as corresponding to each HTTP response 402 in the response group, and identifies each Web page. Can be used. Alternatively, the access history data generation unit 105 uses only data included in each HTTP response 402 (for example, data displayed on a web page for navigation of the website) to identify each web page. Also good. The access history data generation unit 105 stores the generated access history data in the storage device 151.

アクセス解析部106は、アクセス履歴データ生成部105により保存されたアクセス履歴データに基づいて、個々のユーザの行動を処理装置152により解析する。   Based on the access history data stored by the access history data generation unit 105, the access analysis unit 106 analyzes the actions of individual users by the processing device 152.

図8は、アクセス解析装置100のハードウェア資源の一例を示す図である。   FIG. 8 is a diagram illustrating an example of hardware resources of the access analysis device 100.

図8において、アクセス解析装置100は、CRT(Cathode・Ray・Tube)やLCD(液晶ディスプレイ)の表示画面を有する表示装置901、キーボード902(K/B)、マウス903、FDD904(Flexible・Disk・Drive)、CDD905(Compact・Disc・Drive)、プリンタ装置906などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。   In FIG. 8, the access analysis apparatus 100 includes a display device 901 having a display screen of a CRT (Cathode Ray Tube) or LCD (Liquid Crystal Display), a keyboard 902 (K / B), a mouse 903, an FDD 904 (Flexible Disk, (Drive), CDD 905 (Compact Disc Drive), and printer device 906, etc., which are connected by cables and signal lines.

アクセス解析装置100は、プログラムを実行するCPU911(Central・Processing・Unit)を備えている。CPU911は、処理装置152の一例である。CPU911は、バス912を介してROM913(Read・Only・Memory)、RAM914(Random・Access・Memory)、通信ボード915、表示装置901、キーボード902、マウス903、FDD904、CDD905、プリンタ装置906、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置920の代わりに、光ディスク装置、メモリカードリーダライタなどの記憶媒体、NAS(Network・Attached・Storage)などのネットワークストレージが用いられてもよい。   The access analysis apparatus 100 includes a CPU 911 (Central Processing Unit) that executes a program. The CPU 911 is an example of the processing device 152. The CPU 911 includes a ROM 913 (Read / Only / Memory), a RAM 914 (Random / Access / Memory), a communication board 915, a display device 901, a keyboard 902, a mouse 903, an FDD904, a CDD905, a printer device 906, and a magnetic disk. It is connected to the device 920 and controls these hardware devices. Instead of the magnetic disk device 920, a storage medium such as an optical disk device or a memory card reader / writer, or a network storage such as NAS (Network / Attached / Storage) may be used.

RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置151の一例である。通信ボード915、キーボード902、マウス903、FDD904、CDD905などは、入力装置153の一例である。また、通信ボード915、表示装置901、プリンタ装置906などは、出力装置154の一例である。   The RAM 914 is an example of a volatile memory. The storage media of the ROM 913, the FDD 904, the CDD 905, and the magnetic disk device 920 are an example of a nonvolatile memory. These are examples of the storage device 151. The communication board 915, the keyboard 902, the mouse 903, the FDD 904, the CDD 905, and the like are examples of the input device 153. The communication board 915, the display device 901, the printer device 906, and the like are examples of the output device 154.

通信ボード915は、LAN(ローカルエリアネットワーク)などに接続されている。通信ボード915は、LANに限らず、インターネット、あるいは、IP−VPN(Internet・Protocol・Virtual・Private・Network)、広域LAN、ATM(Asynchronous・Transfer・Mode)ネットワークなどのWAN(ワイドエリアネットワーク)などに接続されていても構わない。LAN、インターネット、WANは、ネットワークの一例である。   The communication board 915 is connected to a LAN (local area network) or the like. The communication board 915 is not limited to a LAN, but is the Internet, or an IP-VPN (Internet, Protocol, Private, Network), a wide area LAN, a WAN (Wide Area Network) such as an ATM (Asynchronous, Transfer, Mode) network, or the like. It does not matter if it is connected to. LAN, the Internet, and WAN are examples of networks.

磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。プログラム群923には、本実施の形態の説明において「〜部」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。また、ファイル群924には、本実施の形態の説明において、「〜データ」、「〜情報」、「〜ID(識別子)」、「〜フラグ」、「〜結果」として説明するデータや情報や信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」や「〜テーブル」の各項目として記憶されている。「〜ファイル」や「〜データベース」や「〜テーブル」は、ディスクやメモリなどの記憶媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶されたデータや情報や信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・制御・出力・印刷・表示などのCPU911の処理(動作)に用いられる。抽出・検索・参照・比較・演算・計算・制御・出力・印刷・表示などのCPU911の処理中、データや情報や信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。   The magnetic disk device 920 stores an operating system 921 (OS), a window system 922, a program group 923, and a file group 924. The programs in the program group 923 are executed by the CPU 911, the operating system 921, and the window system 922. The program group 923 stores a program for executing a function described as “˜unit” in the description of the present embodiment. The program is read and executed by the CPU 911. The file group 924 includes data and information described as “˜data”, “˜information”, “˜ID (identifier)”, “˜flag”, and “˜result” in the description of this embodiment. Signal values, variable values, and parameters are stored as items of “˜file”, “˜database”, and “˜table”. The “˜file”, “˜database”, and “˜table” are stored in a storage medium such as a disk or a memory. Data, information, signal values, variable values, and parameters stored in a storage medium such as a disk or memory are read out to the main memory or cache memory by the CPU 911 via a read / write circuit, and extracted, searched, referenced, compared, and calculated. Used for processing (operation) of the CPU 911 such as calculation / control / output / printing / display. Data, information, signal values, variable values, and parameters are temporarily stored in the main memory, cache memory, and buffer memory during processing of the CPU 911 such as extraction, search, reference, comparison, calculation, control, output, printing, and display. Is remembered.

また、本実施の形態の説明において用いるブロック図やフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号は、RAM914などのメモリ、FDD904のフレキシブルディスク(FD)、CDD905のコンパクトディスク(CD)、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク(MD)、DVD(Digital・Versatile・Disc)などの記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体により伝送される。   In addition, the arrows in the block diagrams and flowcharts used in the description of this embodiment mainly indicate input / output of data and signals, and the data and signals are the memory such as the RAM 914, the flexible disk (FD) of the FDD 904, and the compact of the CDD 905. Recording is performed on a recording medium such as a disk (CD), a magnetic disk of the magnetic disk device 920, another optical disk, a mini disk (MD), or a DVD (Digital Versatile Disc). Data and signals are transmitted by a bus 912, a signal line, a cable, and other transmission media.

また、本実施の形態の説明において「〜部」として説明するものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜工程」、「〜手順」、「〜処理」であってもよい。即ち、「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。あるいは、ソフトウェアのみ、あるいは、素子・デバイス・基板・配線などのハードウェアのみ、あるいは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実現されていても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVDなどの記録媒体に記憶される。このプログラムはCPU911により読み出され、CPU911により実行される。即ち、プログラムは、本実施の形態の説明で述べる「〜部」としてコンピュータを機能させるものである。あるいは、本実施の形態の説明で述べる「〜部」の手順や方法をコンピュータに実行させるものである。   In addition, what is described as “˜unit” in the description of this embodiment may be “˜circuit”, “˜device”, “˜device”, and “˜step”, “˜process”. , “˜procedure”, and “˜processing”. That is, what is described as “˜unit” may be realized by firmware stored in the ROM 913. Alternatively, it may be realized only by software, or only by hardware such as an element, a device, a board, and wiring, or a combination of software and hardware, and further by a combination of firmware. Firmware and software are stored as programs in a recording medium such as a magnetic disk, flexible disk, optical disk, compact disk, minidisk, or DVD. This program is read by the CPU 911 and executed by the CPU 911. That is, the program causes the computer to function as “to part” described in the description of the present embodiment. Alternatively, it causes the computer to execute the procedures and methods described in the description of the present embodiment.

図9は、本実施の形態に係るアクセス解析方法を示すフローチャートである。   FIG. 9 is a flowchart showing an access analysis method according to the present embodiment.

図9のフローチャートに示したフローは、アクセス解析装置100を実現するコンピュータ上で実行されるプログラム(アクセス解析プログラム)の処理手順に相当する。以下では、アクセス解析装置100が図8に例示したコンピュータとハードウェア資源により実現されているものとして、本実施の形態に係るアクセス解析方法について説明する。   The flow shown in the flowchart of FIG. 9 corresponds to a processing procedure of a program (access analysis program) executed on a computer that implements the access analysis apparatus 100. Hereinafter, the access analysis method according to the present embodiment will be described assuming that the access analysis apparatus 100 is realized by the computer and hardware resources illustrated in FIG.

パケット取得部101は、パケットキャプチャ装置205から全てのIPパケット211,212を取得する。そして、パケット取得部101は、取得したIPパケット211,212を磁気ディスク装置920(記憶装置151の一例)に保存する(ステップS101:パケット取得処理)。   The packet acquisition unit 101 acquires all IP packets 211 and 212 from the packet capture device 205. The packet acquisition unit 101 stores the acquired IP packets 211 and 212 in the magnetic disk device 920 (an example of the storage device 151) (step S101: packet acquisition processing).

リクエスト・レスポンス復元部102は、ステップS101で保存されたIPパケット211,212をCPU911(処理装置152の一例)により解析する。そして、リクエスト・レスポンス復元部102は、複数のIPパケット211に載せて送信された複数のHTTPリクエスト401、及び、複数のIPパケット212に載せて送信された複数のHTTPレスポンス402をCPU911により復元する(ステップS102:レスポンス復元処理)。ここでは、リクエスト・レスポンス復元部102は、図3〜図6の例におけるHTTPリクエスト401及びHTTPレスポンス402を復元するものとする。   The request / response restoration unit 102 analyzes the IP packets 211 and 212 stored in step S101 by the CPU 911 (an example of the processing device 152). Then, the request / response restoration unit 102 restores the plurality of HTTP requests 401 transmitted in the plurality of IP packets 211 and the plurality of HTTP responses 402 transmitted in the plurality of IP packets 212 by the CPU 911. (Step S102: Response restoration process). Here, it is assumed that the request / response restoration unit 102 restores the HTTP request 401 and the HTTP response 402 in the examples of FIGS.

個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、個別設定データとして、ユーザの名前データ415をCPU911により抽出する(ステップS103:個別設定データ抽出処理)。具体的には、まず、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、URLデータ411をCPU911により抽出する。次に、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の中から、対応するHTTPレスポンス402から抽出したURLデータ411で示されるURL321が同じWebページ、あるいは、同種のWebページ(例えばトップページ)に該当するもの(例えば、Webページ311,312)を少なくとも2つ選択する。そして、個別設定データ抽出部103は、例えば、ユーザがログイン中のWebページ312のページデータ412を含むHTTPレスポンス402とユーザがログイン中でないWebページ311のページデータ412を含むHTTPレスポンス402とを選択する。あるいは、個別設定データ抽出部103は、ユーザがログイン中のWebページ312のページデータ412を含むHTTPレスポンス402と他のユーザがログイン中のWebページのページデータ412を含むHTTPレスポンス402とを選択する。そして、個別設定データ抽出部103は、選択したHTTPレスポンス402のそれぞれに含まれるページデータ412を比較して、差異がある部分(図3及び図5の例では「山田太郎さん」の部分)のデータがユーザの名前データ415であるとCPU911により推定する。   The individual setting data extraction unit 103 extracts the user name data 415 as individual setting data from each of the plurality of HTTP responses 402 restored in step S102 (step S103: individual setting data extraction processing). Specifically, first, the individual setting data extraction unit 103 extracts the URL data 411 by the CPU 911 from each of the plurality of HTTP responses 402 restored in step S102. Next, the individual setting data extraction unit 103 has the same Web page or the same type of URL 321 indicated by the URL data 411 extracted from the corresponding HTTP response 402 out of the plurality of HTTP responses 402 restored in step S102. At least two items (for example, Web pages 311 and 312) corresponding to the Web page (for example, the top page) are selected. Then, the individual setting data extraction unit 103 selects, for example, the HTTP response 402 including the page data 412 of the Web page 312 where the user is logged in and the HTTP response 402 including the page data 412 of the Web page 311 where the user is not logged in. To do. Alternatively, the individual setting data extraction unit 103 selects the HTTP response 402 including the page data 412 of the web page 312 in which the user is logged in and the HTTP response 402 including the page data 412 of the web page in which another user is logged in. . Then, the individual setting data extraction unit 103 compares the page data 412 included in each of the selected HTTP responses 402, and finds a portion with a difference (“Taro Yamada” in the examples of FIGS. 3 and 5). The CPU 911 estimates that the data is user name data 415.

レスポンス特定部104は、ステップS102で復元された複数のHTTPレスポンス402のうち、ステップS103で抽出された名前データ415が共通するHTTPレスポンス402(例えば、Webページ312,313のページデータ412を含むHTTPレスポンス402)を1つのレスポンス群としてCPU911により特定する(ステップS104:レスポンス特定処理)。このとき、レスポンス特定部104は、ステップS102で同一の送信元IPアドレスをもつIPパケット212から復元された複数のHTTPレスポンス402だけを対象にしてもよい。つまり、レスポンス特定部104は、同一の送信元IPアドレスをもつIPパケット212に含まれるHTTPレスポンス402であり、かつ、ステップS103で抽出された名前データ415が共通するHTTPレスポンス402を1つのレスポンス群としてCPU911により特定してもよい。これにより、アクセス履歴データ生成部105が同一のユーザがアクセスしたと推定する際の精度が向上する。なお、ステップS104において、レスポンス特定部104は、ステップS102で復元された複数のHTTPリクエスト401のうち、上記レスポンス群の各HTTPレスポンス402に対応するHTTPリクエスト401をCPU911により特定しておく。   The response specifying unit 104 includes the HTTP response 402 (for example, the HTTP data 402 including the page data 412 of the Web pages 312 and 313) that is common to the name data 415 extracted in Step S <b> 103 among the plurality of HTTP responses 402 restored in Step S <b> 102. The CPU 911 identifies the response 402) as one response group (step S104: response identifying process). At this time, the response specifying unit 104 may target only a plurality of HTTP responses 402 restored from the IP packet 212 having the same transmission source IP address in step S102. That is, the response specifying unit 104 converts the HTTP response 402 that is the HTTP response 402 included in the IP packet 212 having the same source IP address and that has the same name data 415 extracted in step S103 into one response group. May be specified by the CPU 911. This improves the accuracy when the access history data generation unit 105 estimates that the same user has accessed. In step S104, the response specifying unit 104 uses the CPU 911 to specify the HTTP request 401 corresponding to each HTTP response 402 in the response group among the plurality of HTTP requests 401 restored in step S102.

アクセス履歴データ生成部105は、ステップS104で特定されたレスポンス群の各HTTPレスポンス402にページデータ412が含まれるWebページへ同一のユーザがアクセスしたと推定する。そして、アクセス履歴データ生成部105は、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データをCPU911により生成する。例えば、まず、アクセス履歴データ生成部105は、ステップS104で特定されたレスポンス群の各HTTPレスポンス402に対応するものとして、同じくステップS104で特定された各HTTPリクエスト401からURLデータ411を抽出する。次に、アクセス履歴データ生成部105は、ステップS104で特定されたレスポンス群の各HTTPレスポンス402にページデータ412が含まれるWebページのURLデータ411として各HTTPリクエスト401から抽出したものと当該Webページへのアクセスの時刻データとの組み合わせをアクセス履歴データとして生成する。そして、アクセス履歴データ生成部105は、生成したアクセス履歴データを磁気ディスク装置920に保存する(ステップS105:アクセス履歴データ生成処理)。   The access history data generation unit 105 estimates that the same user has accessed a Web page in which the page data 412 is included in each HTTP response 402 of the response group specified in step S104. Then, the access history data generation unit 105 causes the CPU 911 to generate access history data indicating that the same user has accessed the Web page. For example, first, the access history data generation unit 105 extracts the URL data 411 from each HTTP request 401 similarly specified in step S104 as corresponding to each HTTP response 402 of the response group specified in step S104. Next, the access history data generation unit 105 extracts the Web page URL data 411 extracted from each HTTP request 401 as the Web page URL data 411 in which the page data 412 is included in each HTTP response 402 of the response group specified in step S104. A combination with access time data is generated as access history data. Then, the access history data generation unit 105 stores the generated access history data in the magnetic disk device 920 (step S105: access history data generation process).

アクセス解析部106は、ステップS105で保存されたアクセス履歴データに基づいて、個々のユーザの行動をCPU911により解析する(ステップS106:アクセス解析処理)。例えば、アクセス履歴データが、WebページのURLデータ411と当該Webページへのアクセスの時刻データとの組み合わせであれば、アクセス解析部106は、ユーザごとに、どのような順番でどのWebページがアクセスされたかを解析する。さらに、アクセス解析部106は、ユーザがどのWebページに興味を示し、どの商品を購入したのか、あるいは、ユーザが商品を購入せず、どのWebページからWebサイト外へ出て行ったのか、といったことを分析し、当該分析結果を表示装置901の画面に表示する。   Based on the access history data stored in step S105, the access analysis unit 106 analyzes the actions of individual users by the CPU 911 (step S106: access analysis processing). For example, if the access history data is a combination of URL data 411 of a web page and time data of access to the web page, the access analysis unit 106 accesses which web page in what order for each user. Analyze what has been done. Further, the access analysis unit 106 indicates which Web page the user is interested in, which product is purchased, or which Web page the user has gone out of the website without purchasing the product. And the analysis result is displayed on the screen of the display device 901.

このように、本実施の形態では、アクセス解析装置100において、リクエスト・レスポンス復元部102が、パケットキャプチャ装置205から取得された複数のIPパケット212を解析して、複数のHTTPレスポンス402を復元し、個別設定データ抽出部103が、復元された複数のHTTPレスポンス402の各々から、ユーザに対して個別に設定される個別設定データ(例えば、同一URLのWebページに対し、ログイン中とログイン中でないページの差異、あるいは、所定の相対位置に表示される属性データ、あるいは、2つの特定の文字列を起点及び終点とする範囲に表示される属性データ、あるいは、人名辞書データを参照し、抽出した人名、あるいは、同一ユーザの複数のWebページに共通するレイアウト設定データ)を抽出し、レスポンス特定部104が、復元された複数のHTTPレスポンス402のうち、抽出された個別設定データが共通するHTTPレスポンス402を1つのレスポンス群として特定し、アクセス履歴データ生成部105が、特定されたレスポンス群の各HTTPレスポンス402にページデータ412が含まれるWebページへ同一のユーザがアクセスしたと推定することにより、例えば、アクセス解析を行うための仕組みをWebサイトごとに実装しなくても、Webサイト内でのユーザごとの行動を把握できるようになる。   Thus, in this embodiment, in the access analysis device 100, the request / response restoration unit 102 analyzes the plurality of IP packets 212 acquired from the packet capture device 205 and restores the plurality of HTTP responses 402. The individual setting data extracting unit 103 sets individual setting data individually set for the user from each of the plurality of restored HTTP responses 402 (for example, login to the Web page with the same URL is not logged in) Extracted by referring to the difference of pages, attribute data displayed at a predetermined relative position, attribute data displayed in the range starting from two specific character strings and the end point, or personal name dictionary data Layout setting data common to multiple people's name or the same user's Web pages The response identification unit 104 identifies the HTTP response 402 having the same extracted individual setting data as one response group among the restored HTTP responses 402, and the access history data generation unit 105 However, by estimating that the same user has accessed the Web page including the page data 412 in each HTTP response 402 of the identified response group, for example, a mechanism for performing access analysis is implemented for each Web site. Even without it, it becomes possible to grasp the behavior of each user in the website.

従来のアクセスログ型のアクセス解析では、HTTPリクエスト401やHTTPレスポンス402の一部を所定の形式に変換した上でアクセスログに出力しなければならなかったため、出力処理に時間がかかっていた。また、アクセス解析を行う際に必要になったデータが、HTTPリクエスト401やHTTPレスポンス402のうち、アクセスログに出力されない部分のデータである、という事態が生じる可能性があった。一方、パケットキャプチャ型のアクセス解析では、パケットキャプチャ装置205が全てのIPパケット211,212をそのまま保存するだけで済むため、処理速度が速い。また、全てのIPパケット211,212を解析して、全てのHTTP通信を復元することができる。本実施の形態では、このようなパケットキャプチャ型の特徴を活かして、ユーザごとの行動を解析することで、従来よりもユーザの行動を詳しく把握できるようになる。   In the conventional access log type access analysis, since a part of the HTTP request 401 and the HTTP response 402 must be converted into a predetermined format and then output to the access log, the output process takes time. In addition, there is a possibility that the data required for performing the access analysis is a part of the HTTP request 401 or the HTTP response 402 that is not output to the access log. On the other hand, in the packet capture type access analysis, since the packet capture device 205 only needs to store all the IP packets 211 and 212 as they are, the processing speed is high. Also, all HTTP packets 211 and 212 can be analyzed to restore all HTTP communications. In the present embodiment, it is possible to grasp the user's behavior in more detail than before by analyzing the behavior for each user by making use of such a packet capture type feature.

実施の形態2.
本実施の形態について、主に実施の形態1との差異を説明する。
Embodiment 2. FIG.
In the present embodiment, differences from the first embodiment will be mainly described.

以下では、実施の形態1と同様に、図9を用いて、本実施の形態に係るアクセス解析方法について説明する。   Hereinafter, as in the first embodiment, the access analysis method according to the present embodiment will be described with reference to FIG.

ステップS101、S102、ステップS104〜S106は、実施の形態1と同様である。   Steps S101 and S102 and steps S104 to S106 are the same as in the first embodiment.

ステップS103において、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、特定の表示データ413をCPU911(処理装置152の一例)により抽出する。そして、個別設定データ抽出部103は、抽出した特定の表示データ413から所定の相対位置に表示される部分のデータが属性データであるとCPU911により推定する。具体的には、個別設定データ抽出部103は、抽出した特定の表示データ413(図3及び図5の例では、句読点を無視するものとすると「こんにちは」の部分)の後に続けて表示される部分(図3及び図5の例では、句読点及び名前の後に付ける「さん」を無視するものとすると「山田太郎」の部分)のデータがユーザの名前データ415であると推定する。   In step S103, the individual setting data extraction unit 103 extracts specific display data 413 from each of the plurality of HTTP responses 402 restored in step S102 by the CPU 911 (an example of the processing device 152). Then, the individual setting data extraction unit 103 estimates by the CPU 911 that the data of the portion displayed at a predetermined relative position from the extracted specific display data 413 is attribute data. Specifically, the individual setting data extraction unit 103 extracts a specific display data 413 (in the example of FIG. 3 and FIG. 5, if it is assumed to ignore punctuation portion "Hello") appears continuously after It is estimated that the data of the part (in the example of FIGS. 3 and 5, the part of “Taro Yamada” if “san” added after the punctuation mark and the name is ignored) is the user name data 415.

ステップS103において、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、特定の表示データ413だけでなく、特定の表示データ416も抽出することができる。この場合、個別設定データ抽出部103は、抽出した特定の表示データ413,416をそれぞれ起点及び終点とする範囲に表示される部分のデータが属性データであるとCPU911により推定する。具体的には、個別設定データ抽出部103は、抽出した特定の表示データ413,416(図3及び図5の例では、句読点を無視するものとすると「こんにちは」と「さん」の部分)の間に表示される部分(図3及び図5の例では「山田太郎」の部分)のデータがユーザの名前データ415であると推定する。   In step S103, the individual setting data extraction unit 103 can extract not only the specific display data 413 but also the specific display data 416 from each of the plurality of HTTP responses 402 restored in step S102. In this case, the individual setting data extraction unit 103 uses the CPU 911 to infer that the portion of data displayed in the range having the extracted specific display data 413 and 416 as the start point and the end point is attribute data. Specifically, the individual setting data extraction unit 103, the extracted specific display data 413 and 416 (in the example of FIG. 3 and FIG. 5, if it is assumed to ignore punctuation as "hello" part of "Mr.") of It is estimated that the data of the portion displayed in between (the portion of “Taro Yamada” in the examples of FIGS. 3 and 5) is the user name data 415.

このように、本実施の形態によれば、各HTTPレスポンス402のどこにユーザの属性データが含まれているかを容易に探し当てることが可能となる。   As described above, according to the present embodiment, it is possible to easily find where in each HTTP response 402 the user attribute data is included.

実施の形態3.
本実施の形態について、主に実施の形態1との差異を説明する。
Embodiment 3 FIG.
In the present embodiment, differences from the first embodiment will be mainly described.

以下では、実施の形態1と同様に、図9を用いて、本実施の形態に係るアクセス解析方法について説明する。   Hereinafter, as in the first embodiment, the access analysis method according to the present embodiment will be described with reference to FIG.

ステップS101、S102、ステップS104〜S106は、実施の形態1と同様である。   Steps S101 and S102 and steps S104 to S106 are the same as in the first embodiment.

磁気ディスク装置920(記憶装置151の一例)には、人名の辞書データが予め記憶されているものとする。   It is assumed that personal name dictionary data is stored in advance in the magnetic disk device 920 (an example of the storage device 151).

ステップS103において、個別設定データ抽出部103は、磁気ディスク装置920に記憶された辞書データを用いて、ステップS102で復元された複数のHTTPレスポンス402の各々から、Webページに人名を表示する部分(図3及び図5の例では「山田太郎」の部分)のデータをCPU911(処理装置152の一例)により抽出する。そして、個別設定データ抽出部103は、当該部分のデータがユーザの名前データ415であるとCPU911により推定する。   In step S103, the individual setting data extraction unit 103 uses the dictionary data stored in the magnetic disk device 920 to display a personal name on a Web page from each of the plurality of HTTP responses 402 restored in step S102 ( 3 and 5, the data of “Taro Yamada”) is extracted by the CPU 911 (an example of the processing device 152). Then, the individual setting data extraction unit 103 estimates by the CPU 911 that the data of the part is the user name data 415.

このように、本実施の形態によれば、各HTTPレスポンス402に含まれるユーザの名前データ415を容易に探し当てることが可能となる。   Thus, according to the present embodiment, it is possible to easily find the user name data 415 included in each HTTP response 402.

実施の形態4.
本実施の形態について、主に実施の形態1との差異を説明する。
Embodiment 4 FIG.
In the present embodiment, differences from the first embodiment will be mainly described.

実施の形態1と同様に、図2に、ユーザがログイン中でない場合に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ311の一例を示す。   Similar to the first embodiment, FIG. 2 shows an example of a web page 311 displayed on the web browser screen 301 of the user terminal 201 when the user is not logged in.

図示していないが、Webサーバ202は、ユーザがログイン中でない場合に、図2に示したWebページ311のURLデータ411を含むHTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、Webページ311のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、デフォルトで設定されたレイアウトを示すレイアウト設定データを付加する。Webサーバ202は、レイアウト設定データが付加されたページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。   Although not shown, the Web server 202 receives the IP packet 211 containing the HTTP request 401 including the URL data 411 of the Web page 311 shown in FIG. An HTTP response 402 including the page data 412 of the Web page 311 is generated. At this time, the Web server 202 adds layout setting data indicating a layout set by default to the page data 412. The Web server 202 returns an HTTP response 402 including the page data 412 with the layout setting data added thereto to the user terminal 201 with the IP packet 212.

ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ311をWebブラウザ画面301に表示する。図2に示したように、例えば、Webブラウザは、ページデータ412に付加されたレイアウト設定データに基づいて、メニュー323内に、デフォルトで設定された商品カテゴリの商品販売用のWebページへのリンク324を予め設定された順番で表示する。   When the user terminal 201 receives the IP packet 212 carrying the HTTP response 402 from the Web server 202, the Web browser operating on the user terminal 201 changes the Web page 311 to the Web based on the page data 412 included in the HTTP response 402. It is displayed on the browser screen 301. As shown in FIG. 2, for example, the Web browser links to a Web page for product sales of a product category set by default in the menu 323 based on the layout setting data added to the page data 412. 324 are displayed in a preset order.

図10に、ユーザがログインした直後に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ312の一例を示す。   FIG. 10 shows an example of a web page 312 displayed on the web browser screen 301 of the user terminal 201 immediately after the user logs in.

図示していないが、Webサーバ202は、ユーザがログイン中でない場合に、認証データ414を含むHTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれる認証データ414に基づいて、ユーザを認証する。Webサーバ202は、ユーザの認証が成功すると、図10に示したWebページ312のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、ログイン中のユーザの個別設定データとして、そのユーザが同じWebサイト内の複数のWebページに共通に設定したレイアウトを示すレイアウト設定データを付加する。Webサーバ202は、レイアウト設定データが付加されたページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。   Although not shown, when the Web server 202 receives from the user terminal 201 the IP packet 211 carrying the HTTP request 401 including the authentication data 414 when the user is not logged in, the authentication data 414 included in the HTTP request 401 is received. Authenticate the user based on When the user authentication is successful, the Web server 202 generates an HTTP response 402 including the page data 412 of the Web page 312 shown in FIG. At this time, the Web server 202 adds, to the page data 412, layout setting data indicating the layout set by the user in common for a plurality of Web pages in the same Web site as individual setting data of the logged-in user. . The Web server 202 returns an HTTP response 402 including the page data 412 with the layout setting data added thereto to the user terminal 201 with the IP packet 212.

ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ312をWebブラウザ画面301に表示する。図10に示したように、例えば、Webブラウザは、ページデータ412に付加されたレイアウト設定データに基づいて、メニュー323内に、ログイン中のユーザが予め選択した商品カテゴリの商品販売用のWebページへのリンク324を、ユーザが予め設定した順番で表示する。   When the user terminal 201 receives the IP packet 212 carrying the HTTP response 402 from the Web server 202, the Web browser operating on the user terminal 201 changes the Web page 312 to the Web page 312 based on the page data 412 included in the HTTP response 402. It is displayed on the browser screen 301. As shown in FIG. 10, for example, the Web browser uses the menu setting 323 based on the layout setting data added to the page data 412 to display a Web page for selling products in the product category previously selected by the logged-in user. Links 324 to are displayed in the order preset by the user.

図11に、ユーザがログイン中に、ユーザ端末201のWebブラウザ画面301に表示されるWebページ313の一例を示す。   FIG. 11 shows an example of a web page 313 displayed on the web browser screen 301 of the user terminal 201 while the user is logged in.

図示していないが、Webサーバ202は、ユーザがログイン中に、図11に示したWebページ313のURLデータ411を含むHTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、Webページ313のページデータ412を含むHTTPレスポンス402を生成する。このとき、Webサーバ202は、そのページデータ412に、ログイン中のユーザの個別設定データとして、そのユーザが同じWebサイト内の複数のWebページに共通に設定したレイアウトを示すレイアウト設定データを付加する。Webサーバ202は、レイアウト設定データが付加されたページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。   Although not shown, the Web server 202 receives the IP packet 211 containing the HTTP request 401 including the URL data 411 of the Web page 313 shown in FIG. An HTTP response 402 including the page data 412 of 313 is generated. At this time, the Web server 202 adds, to the page data 412, layout setting data indicating the layout set by the user in common for a plurality of Web pages in the same Web site as individual setting data of the logged-in user. . The Web server 202 returns an HTTP response 402 including the page data 412 with the layout setting data added thereto to the user terminal 201 with the IP packet 212.

ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をWebサーバ202から受信すると、ユーザ端末201で動作するWebブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、Webページ313をWebブラウザ画面301に表示する。図11に示したように、例えば、Webブラウザは、ページデータ412に付加されたレイアウト設定データに基づいて、メニュー323内に、ログイン中のユーザが予め選択した商品カテゴリの商品販売用のWebページへのリンク324を、ユーザが予め設定した順番で表示する。   When the user terminal 201 receives the IP packet 212 carrying the HTTP response 402 from the Web server 202, the Web browser operating on the user terminal 201 changes the Web page 313 to the Web based on the page data 412 included in the HTTP response 402. It is displayed on the browser screen 301. As shown in FIG. 11, for example, the Web browser uses the menu setting 323 based on the layout setting data added to the page data 412 to display a Web page for selling products in the product category selected in advance by the logged-in user. Links 324 to are displayed in the order preset by the user.

図2に示したWebページ311と図10に示したWebページ312とを比較すると、いずれもURL321や右側及び中央に表示されているコンテンツは同じであるが、図2に示したWebページ311の左側に表示されているメニュー323と図4に示したWebページ312の左側に表示されているメニュー323の項目(リンク324)の種類や数や順番が異なっている。また、図10に示したWebページ312と図11に示したWebページ313とを比較すると、URL321や右側及び中央に表示されているコンテンツは異なっているが、Webページ312,313の左側に表示されているメニュー323の項目の種類や数や順番が同じである。このように、上記の例におけるWebサイトでは、ユーザがログインすると、各Webページの左側に表示されるメニュー323の項目の種類や数や順番が、ログイン中のユーザの設定通りに表示されるようになっている。   When the Web page 311 shown in FIG. 2 is compared with the Web page 312 shown in FIG. 10, the URL 321 and the contents displayed on the right side and the center are the same, but the Web page 311 shown in FIG. The type, number, and order of the items (link 324) of the menu 323 displayed on the left side and the menu 323 displayed on the left side of the Web page 312 shown in FIG. Further, when the Web page 312 shown in FIG. 10 and the Web page 313 shown in FIG. 11 are compared, the URL 321 and the contents displayed on the right side and the center are different, but displayed on the left side of the Web pages 312 and 313. The type, number, and order of items in the menu 323 are the same. As described above, in the website in the above example, when the user logs in, the type, number, and order of items of the menu 323 displayed on the left side of each web page are displayed as set by the logged-in user. It has become.

以下では、実施の形態1と同様に、図9を用いて、本実施の形態に係るアクセス解析方法について説明する。   Hereinafter, as in the first embodiment, the access analysis method according to the present embodiment will be described with reference to FIG.

ステップS101、S102、S105、S106は、実施の形態1と同様である。   Steps S101, S102, S105, and S106 are the same as those in the first embodiment.

ステップS103において、個別設定データ抽出部103は、ステップS102で復元された複数のHTTPレスポンス402の各々から、個別設定データとして、レイアウト設定データをCPU911(処理装置152の一例)により抽出する。   In step S103, the individual setting data extraction unit 103 extracts layout setting data as individual setting data from each of the plurality of HTTP responses 402 restored in step S102 by the CPU 911 (an example of the processing device 152).

ステップS104において、レスポンス特定部104は、ステップS102で復元された複数のHTTPレスポンス402のうち、ステップS103で抽出されたレイアウト設定データが共通するHTTPレスポンス402を1つのレスポンス群としてCPU911により特定する。このとき、レスポンス特定部104は、ステップS102で同一の送信元IPアドレスをもつIPパケット212から復元された複数のHTTPレスポンス402だけを対象にしてもよい。つまり、レスポンス特定部104は、同一の送信元IPアドレスをもつIPパケット212に含まれるHTTPレスポンス402であり、かつ、ステップS103で抽出されたレイアウト設定データが共通するHTTPレスポンス402を1つのレスポンス群としてCPU911により特定してもよい。これにより、アクセス履歴データ生成部105が同一のユーザがアクセスしたと推定する際の精度が向上する。   In step S104, the response identifying unit 104 identifies the HTTP response 402 having the same layout setting data extracted in step S103 among the plurality of HTTP responses 402 restored in step S102 as one response group by the CPU 911. At this time, the response specifying unit 104 may target only a plurality of HTTP responses 402 restored from the IP packet 212 having the same transmission source IP address in step S102. That is, the response specifying unit 104 converts the HTTP response 402 that is the HTTP response 402 included in the IP packet 212 having the same transmission source IP address and has the same layout setting data extracted in step S103 into one response group. May be specified by the CPU 911. This improves the accuracy when the access history data generation unit 105 estimates that the same user has accessed.

以上、本発明の実施の形態について説明したが、これらのうち、2つ以上の実施の形態を組み合わせて実施しても構わない。あるいは、これらのうち、1つの実施の形態を部分的に実施しても構わない。あるいは、これらのうち、2つ以上の実施の形態を部分的に組み合わせて実施しても構わない。   As mentioned above, although embodiment of this invention was described, you may implement combining 2 or more embodiment among these. Alternatively, one of these embodiments may be partially implemented. Or you may implement combining two or more embodiment among these partially.

実施の形態1に係るアクセス解析装置の利用形態の一例を示す図である。6 is a diagram illustrating an example of a usage pattern of an access analysis device according to Embodiment 1. FIG. 実施の形態1においてWebブラウザ画面に表示されるWebページの一例を示す図である。3 is a diagram illustrating an example of a Web page displayed on a Web browser screen in Embodiment 1. FIG. 実施の形態1におけるHTTP通信の一例を示す図である。3 is a diagram illustrating an example of HTTP communication according to Embodiment 1. FIG. 実施の形態1においてWebブラウザ画面に表示されるWebページの一例を示す図である。3 is a diagram illustrating an example of a Web page displayed on a Web browser screen in Embodiment 1. FIG. 実施の形態1におけるHTTP通信の一例を示す図である。3 is a diagram illustrating an example of HTTP communication according to Embodiment 1. FIG. 実施の形態1においてWebブラウザ画面に表示されるWebページの一例を示す図である。3 is a diagram illustrating an example of a Web page displayed on a Web browser screen in Embodiment 1. FIG. 実施の形態1に係るアクセス解析装置の構成を示すブロック図である。1 is a block diagram illustrating a configuration of an access analysis device according to a first embodiment. 実施の形態1に係るアクセス解析装置のハードウェア資源の一例を示す図である。3 is a diagram illustrating an example of hardware resources of the access analysis apparatus according to Embodiment 1. FIG. 実施の形態1に係るアクセス解析方法を示すフローチャートである。3 is a flowchart illustrating an access analysis method according to the first embodiment. 実施の形態4においてWebブラウザ画面に表示されるWebページの一例を示す図である。FIG. 20 is a diagram illustrating an example of a web page displayed on a web browser screen in the fourth embodiment. 実施の形態4においてWebブラウザ画面に表示されるWebページの一例を示す図である。FIG. 20 is a diagram illustrating an example of a web page displayed on a web browser screen in the fourth embodiment.

符号の説明Explanation of symbols

100 アクセス解析装置、101 パケット取得部、102 リクエスト・レスポンス復元部、103 個別設定データ抽出部、104 レスポンス特定部、105 アクセス履歴データ生成部、106 アクセス解析部、151 記憶装置、152 処理装置、153 入力装置、154 出力装置、201 ユーザ端末、202 Webサーバ、203 インターネット、204 ネットワーク機器、205 パケットキャプチャ装置、211,212 IPパケット、301 Webブラウザ画面、311,312,313 Webページ、321 URL、322,326 特定の文字列、323 メニュー、324 リンク、325 名前、401 HTTPリクエスト、402 HTTPレスポンス、411 URLデータ、412 ページデータ、413,416 特定の表示データ、414 認証データ、415 名前データ、901 表示装置、902 キーボード、903 マウス、904 FDD、905 CDD、906 プリンタ装置、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 磁気ディスク装置、921 オペレーティングシステム、922 ウィンドウシステム、923 プログラム群、924 ファイル群。   100 Access Analysis Device, 101 Packet Acquisition Unit, 102 Request / Response Restoration Unit, 103 Individual Setting Data Extraction Unit, 104 Response Identification Unit, 105 Access History Data Generation Unit, 106 Access Analysis Unit, 151 Storage Device, 152 Processing Device, 153 Input device, 154 Output device, 201 User terminal, 202 Web server, 203 Internet, 204 Network device, 205 Packet capture device, 211, 212 IP packet, 301 Web browser screen, 311, 312, 313 Web page, 321 URL, 322 , 326 Specific character string, 323 menu, 324 link, 325 name, 401 HTTP request, 402 HTTP response, 411 URL data, 412 page data 413, 416 Specific display data, 414 Authentication data, 415 Name data, 901 Display device, 902 Keyboard, 903 Mouse, 904 FDD, 905 CDD, 906 Printer device, 911 CPU, 912 bus, 913 ROM, 914 RAM, 915 Communication board, 920 magnetic disk unit, 921 operating system, 922 window system, 923 program group, 924 file group.

Claims (14)

ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、Webページのページデータとログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される当該ユーザの属性データとを含むレスポンスを載せたパケットを収集するパケットキャプチャ装置から、複数のパケットを取得して記憶装置に保存するパケット取得部と、
前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元部と、
前記レスポンス復元部により復元された複数のレスポンスの各々から、属性データを処理装置により抽出する個別設定データ抽出部と、
前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定部と、
前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成部とを備えることを特徴とするアクセス解析装置。
A response is returned by the Web server in response to a request from the user, the user the user in the page data and login Web page is added by the Web server to the page data of the Web page to request access A packet acquisition unit that acquires a plurality of packets and stores them in a storage device from a packet capture device that collects a packet including a response including the attribute data of
Analyzing a plurality of packets stored by the packet acquisition unit, and restoring a plurality of responses transmitted on the plurality of packets by a processing device;
From each of a plurality of responses restored by the response restoration unit, an individual setting data extraction unit for extracting attribute data by a processing device,
A response identifying unit that identifies, as a response group, a response having a common attribute data extracted by the individual setting data extraction unit among a plurality of responses restored by the response restoration unit;
It is estimated that the same user has accessed a web page including page data in each response of the response group identified by the response identifying unit, and access history data indicating that the same user has accessed the web page An access history data generation unit that is generated by a processing device.
前記個別設定データ抽出部は、ユーザがログイン中のWebページのページデータとユーザがログイン中でないWebページ又は他のユーザがログイン中のWebページのページデータとを比較して、差異がある部分のデータが属性データであると処理装置により推定することを特徴とする請求項に記載のアクセス解析装置。 The individual setting data extraction unit compares the page data of the web page in which the user is logged in with the page data of the web page in which the user is not logged in or the web page in which another user is logged in. The access analysis apparatus according to claim 1 , wherein the processing apparatus estimates that the data is attribute data. 前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページにて特定の表示データから所定の相対位置、もしくは、2つの特定の表示データをそれぞれ起点及び終点とする範囲に表示される属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出部は、前記レスポンス復元部により復元された複数のレスポンスの各々から、前記特定の表示データを抽出して、前記特定の表示データから前記所定の相対位置もしくは前記範囲に表示される部分のデータが属性データであると処理装置により推定することを特徴とする請求項又はに記載のアクセス解析装置。
The packet capture device has, as attribute data, a specific relative position from a specific display data on a Web page to which a logged-in user requests access, or a range having two specific display data as a starting point and an ending point, respectively. It collects packets with responses containing attribute data to be displayed.
The individual setting data extraction unit extracts the specific display data from each of a plurality of responses restored by the response restoration unit, and displays the specific display data at the predetermined relative position or the range from the specific display data. access analysis apparatus according to claim 1 or 2 data portions that are and estimates by the processor as an attribute data.
前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページに表示される当該ユーザの名前データを含むレスポンスを載せたパケットを収集するものであり、
記憶装置には、人名の辞書データが予め記憶されており、
前記個別設定データ抽出部は、記憶装置に記憶された辞書データを用いて、前記レスポンス復元部により復元された複数のレスポンスの各々から、Webページに人名を表示する部分のデータを抽出して、当該部分のデータが名前データであると処理装置により推定することを特徴とする請求項からまでのいずれかに記載のアクセス解析装置。
The packet capture device collects a packet containing a response including name data of the user displayed on a web page that the logged-in user requests access as attribute data,
The storage device stores personal name dictionary data in advance,
The individual setting data extraction unit uses the dictionary data stored in the storage device to extract data of a part that displays a person's name on a Web page from each of a plurality of responses restored by the response restoration unit, access analysis apparatus according to claim 1 in which the data of the portion and estimating the processing device and the name data until 3.
ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、Webページのページデータとログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される、当該ユーザが複数のWebページに共通に設定したレイアウトを示すレイアウト設定データとを含むレスポンスを載せたパケットを収集するパケットキャプチャ装置から、複数のパケットを取得して記憶装置に保存するパケット取得部と、
前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元部と、
前記レスポンス復元部により復元された複数のレスポンスの各々から、レイアウト設定データを処理装置により抽出する個別設定データ抽出部と、
前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定部と、
前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成部とを備えることを特徴とするアクセス解析装置。
A response is returned by the Web server in response to a request from the user, the user in the page data and login Web page is added by the Web server to the page data of the Web page requesting access, the A packet acquisition unit that acquires a plurality of packets and stores them in a storage device from a packet capture device that collects a packet including a response including layout setting data indicating a layout commonly set by a user on a plurality of Web pages ;
Analyzing a plurality of packets stored by the packet acquisition unit, and restoring a plurality of responses transmitted on the plurality of packets by a processing device;
An individual setting data extraction unit that extracts layout setting data from each of a plurality of responses restored by the response restoration unit by a processing device;
A response specifying unit for specifying a response having a common layout setting data extracted by the individual setting data extracting unit as a single response group among a plurality of responses restored by the response restoring unit;
It is estimated that the same user has accessed a web page including page data in each response of the response group identified by the response identifying unit, and access history data indicating that the same user has accessed the web page An access history data generation unit that is generated by a processing device.
前記レスポンス特定部は、前記レスポンス復元部により同一の送信元アドレスをもつパケットから復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出されたデータが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする請求項1からまでのいずれかに記載のアクセス解析装置。 The response specifying unit, the plurality of responses that have been restored from the packet having the same source address by the response restoring unit, wherein one response data extracted by the individual setting data extraction unit is common response access analysis apparatus according to claim 1, wherein the identifying the processing unit as a group to 5. パケットキャプチャ装置が、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、Webページのページデータとログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される当該ユーザの属性データとを含むレスポンスを載せたパケットを収集し、
アクセス解析装置のパケット取得部が、前記パケットキャプチャ装置により収集された複数のパケットを取得して記憶装置に保存し、
前記アクセス解析装置のレスポンス復元部が、前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元し、
前記アクセス解析装置の個別設定データ抽出部が、前記レスポンス復元部により復元された複数のレスポンスの各々から、属性データを処理装置により抽出し、
前記アクセス解析装置のレスポンス特定部が、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定し、
前記アクセス解析装置のアクセス履歴データ生成部が、前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成することを特徴とするアクセス解析方法。
Packet capture device, a response that is returned by the Web server in response to a request from the user, by the Web server to the page data of the Web page the user in the page data and login Web page requests access Collect a packet with a response including the attribute data of the user to be added ,
The packet acquisition unit of the access analysis device acquires a plurality of packets collected by the packet capture device and stores them in a storage device,
The response restoration unit of the access analysis device analyzes a plurality of packets stored by the packet acquisition unit, and restores a plurality of responses transmitted on the plurality of packets by a processing device,
The individual setting data extraction unit of the access analysis device extracts attribute data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response identifying unit of the access analysis device identifies, as a response group, a response having a common attribute data extracted by the individual setting data extracting unit from among a plurality of responses restored by the response restoring unit. And
The access history data generation unit of the access analysis device estimates that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying unit, and the same to the Web page The access analysis method is characterized in that the access history data indicating that the user has accessed is generated by the processing device.
パケットキャプチャ装置が、ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、Webページのページデータとログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される、当該ユーザが複数のWebページに共通に設定したレイアウトを示すレイアウト設定データとを含むレスポンスを載せたパケットを収集し、
アクセス解析装置のパケット取得部が、前記パケットキャプチャ装置により収集された複数のパケットを取得して記憶装置に保存し、
前記アクセス解析装置のレスポンス復元部が、前記パケット取得部により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元し、
前記アクセス解析装置の個別設定データ抽出部が、前記レスポンス復元部により復元された複数のレスポンスの各々から、レイアウト設定データを処理装置により抽出し、
前記アクセス解析装置のレスポンス特定部が、前記レスポンス復元部により復元された複数のレスポンスのうち、前記個別設定データ抽出部により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定し、
前記アクセス解析装置のアクセス履歴データ生成部が、前記レスポンス特定部により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成することを特徴とするアクセス解析方法。
Packet capture device, a response that is returned by the Web server in response to a request from the user, by the Web server to the page data of the Web page the user in the page data and login Web page requests access Collecting a packet with a response including layout setting data added and layout setting data indicating a layout commonly set by the user on a plurality of Web pages ;
The packet acquisition unit of the access analysis device acquires a plurality of packets collected by the packet capture device and stores them in a storage device,
The response restoration unit of the access analysis device analyzes a plurality of packets stored by the packet acquisition unit, and restores a plurality of responses transmitted on the plurality of packets by a processing device,
The individual setting data extraction unit of the access analysis device extracts layout setting data from each of a plurality of responses restored by the response restoration unit by a processing device,
The response specifying unit of the access analysis device uses the processing device as a response group with a response having a common layout setting data extracted by the individual setting data extracting unit among a plurality of responses restored by the response restoring unit. Identify,
The access history data generation unit of the access analysis device estimates that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying unit, and the same to the Web page The access analysis method is characterized in that the access history data indicating that the user has accessed is generated by the processing device.
ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、Webページのページデータとログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される当該ユーザの属性データとを含むレスポンスを載せたパケットを収集するパケットキャプチャ装置から、複数のパケットを取得して記憶装置に保存するパケット取得処理と、
前記パケット取得処理により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元処理と、
前記レスポンス復元処理により復元された複数のレスポンスの各々から、属性データを処理装置により抽出する個別設定データ抽出処理と、
前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出された属性データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定処理と、
前記レスポンス特定処理により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成処理とをコンピュータに実行させることを特徴とするアクセス解析
プログラム。
A response is returned by the Web server in response to a request from the user, the user the user in the page data and login Web page is added by the Web server to the page data of the Web page to request access A packet acquisition process for acquiring a plurality of packets and storing them in a storage device from a packet capture device that collects a packet including a response including the attribute data of
Analyzing a plurality of packets stored by the packet acquisition processing, and restoring a plurality of responses sent on the plurality of packets by a processing device; and
Individual setting data extraction processing for extracting attribute data by a processing device from each of a plurality of responses restored by the response restoration processing;
A response specifying process for specifying a response having a common attribute data extracted by the individual setting data extraction process as a single response group among a plurality of responses restored by the response restoration process;
It is estimated that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying process, and access history data indicating that the same user has accessed the Web page is stored. An access analysis program for causing a computer to execute access history data generation processing generated by a processing device.
前記個別設定データ抽出処理は、ユーザがログイン中のWebページのページデータとユーザがログイン中でないWebページ又は他のユーザがログイン中のWebページのページデータとを比較して、差異がある部分のデータが属性データであると処理装置により推定することを特徴とする請求項に記載のアクセス解析プログラム。 The individual setting data extraction process compares the page data of the web page where the user is logged in with the page data of the web page where the user is not logged in or the web page where the other user is logged in. The access analysis program according to claim 9 , wherein the processing device estimates that the data is attribute data. 前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページにて特定の表示データから所定の相対位置、もしくは、2つの特定の表示データをそれぞれ起点及び終点とする範囲に表示される属性データを含むレスポンスを載せたパケットを収集するものであり、
前記個別設定データ抽出処理は、前記レスポンス復元処理により復元された複数のレスポンスの各々から、前記特定の表示データを抽出して、前記特定の表示データから前記所定の相対位置もしくは前記範囲に表示される部分のデータが属性データであると処理装置により推定することを特徴とする請求項又は10に記載のアクセス解析プログラム。
The packet capture device has, as attribute data, a specific relative position from a specific display data on a Web page to which a logged-in user requests access, or a range having two specific display data as a starting point and an ending point, respectively. It collects packets with responses containing attribute data to be displayed.
The individual setting data extraction process extracts the specific display data from each of a plurality of responses restored by the response restoration process, and displays the specific display data at the predetermined relative position or the range from the specific display data. The access analysis program according to claim 9 or 10 , wherein the processing device estimates that the portion of the data is attribute data.
前記パケットキャプチャ装置は、属性データとして、ログイン中のユーザがアクセスを要求するWebページに表示される当該ユーザの名前データを含むレスポンスを載せたパケットを収集するものであり、
記憶装置には、人名の辞書データが予め記憶されており、
前記個別設定データ抽出処理は、記憶装置に記憶された辞書データを用いて、前記レスポンス復元処理により復元された複数のレスポンスの各々から、Webページに人名を表示する部分のデータを抽出して、当該部分のデータが名前データであると処理装置により推定することを特徴とする請求項から11までのいずれかに記載のアクセス解析プログラム。
The packet capture device collects a packet containing a response including name data of the user displayed on a web page that the logged-in user requests access as attribute data,
The storage device stores personal name dictionary data in advance,
The individual setting data extraction process uses the dictionary data stored in the storage device to extract data of a part that displays a person's name on a Web page from each of a plurality of responses restored by the response restoration process. The access analysis program according to any one of claims 9 to 11 , wherein the processing device estimates that the data of the part is name data.
ユーザからのリクエストに応じてWebサーバにより返信されるレスポンスであって、Webページのページデータとログイン中のユーザがアクセスを要求するWebページのページデータに対して前記Webサーバにより付加される、当該ユーザが複数のWebページに共通に設定したレイアウトを示すレイアウト設定データとを含むレスポンスを載せたパケットを収集するパケットキャプチャ装置から、複数のパケットを取得して記憶装置に保存するパケット取得処理と、
前記パケット取得処理により保存された複数のパケットを解析して、前記複数のパケットに載せて送信された複数のレスポンスを処理装置により復元するレスポンス復元処理と、
前記レスポンス復元処理により復元された複数のレスポンスの各々から、レイアウト設定データを処理装置により抽出する個別設定データ抽出処理と、
前記レスポンス復元処理により復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出されたレイアウト設定データが共通するレスポンスを1つのレスポンス群として処理装置により特定するレスポンス特定処理と、
前記レスポンス特定処理により特定されたレスポンス群の各レスポンスにページデータが含まれるWebページへ同一のユーザがアクセスしたと推定して、当該Webページへ同一のユーザがアクセスしたことを示すアクセス履歴データを処理装置により生成するアクセス履歴データ生成処理とをコンピュータに実行させることを特徴とするアクセス解析
プログラム。
A response is returned by the Web server in response to a request from the user, the user in the page data and login Web page is added by the Web server to the page data of the Web page requesting access, the A packet acquisition process for acquiring a plurality of packets and storing them in a storage device from a packet capture device that collects a packet including a response including layout setting data indicating a layout commonly set by a user on a plurality of Web pages ;
Analyzing a plurality of packets stored by the packet acquisition processing, and restoring a plurality of responses sent on the plurality of packets by a processing device; and
From each of a plurality of responses restored by the response restoration processing, individual setting data extraction processing for extracting layout setting data by a processing device;
A response specifying process for specifying a response having a common layout setting data extracted by the individual setting data extraction process as a single response group among a plurality of responses restored by the response restoration process;
It is estimated that the same user has accessed a Web page including page data in each response of the response group specified by the response specifying process, and access history data indicating that the same user has accessed the Web page is stored. An access analysis program for causing a computer to execute access history data generation processing generated by a processing device.
前記レスポンス特定処理は、前記レスポンス復元処理により同一の送信元アドレスをもつパケットから復元された複数のレスポンスのうち、前記個別設定データ抽出処理により抽出されたデータが共通するレスポンスを1つのレスポンス群として処理装置により特定することを特徴とする請求項9から13までのいずれかに記載のアクセス解析プログラム。 The response specifying process, said one of the plurality of responses that have been restored from the packet having the same source address by the response recovery processing, the single response data extracted by individual setting data extraction processing is common response access analysis program according to any of claims 9 to 13, characterized in that identifying the processing unit as a group.
JP2008021540A 2008-01-31 2008-01-31 Access analysis device, access analysis method, and access analysis program Expired - Fee Related JP5178219B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008021540A JP5178219B2 (en) 2008-01-31 2008-01-31 Access analysis device, access analysis method, and access analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008021540A JP5178219B2 (en) 2008-01-31 2008-01-31 Access analysis device, access analysis method, and access analysis program

Publications (2)

Publication Number Publication Date
JP2009181459A JP2009181459A (en) 2009-08-13
JP5178219B2 true JP5178219B2 (en) 2013-04-10

Family

ID=41035370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008021540A Expired - Fee Related JP5178219B2 (en) 2008-01-31 2008-01-31 Access analysis device, access analysis method, and access analysis program

Country Status (1)

Country Link
JP (1) JP5178219B2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5322972B2 (en) * 2010-02-24 2013-10-23 三菱スペース・ソフトウエア株式会社 Web screen restoration device, web screen restoration method, and web screen restoration program
CN103119565B (en) 2010-09-22 2016-05-11 尼尔森(美国)有限公司 Utilize distributed demographics information to determine the method and apparatus of impression
JP5709448B2 (en) * 2010-09-29 2015-04-30 三菱スペース・ソフトウエア株式会社 Access analysis device, access analysis method, and access analysis program
US20140337104A1 (en) * 2013-05-09 2014-11-13 Steven J. Splaine Methods and apparatus to determine impressions using distributed demographic information
US10956947B2 (en) 2013-12-23 2021-03-23 The Nielsen Company (Us), Llc Methods and apparatus to measure media using media object characteristics
KR102193392B1 (en) 2014-03-13 2020-12-22 더 닐슨 컴퍼니 (유에스) 엘엘씨 Methods and apparatus to compensate impression data for misattribution and/or non-coverage by a database proprietor
US10045082B2 (en) 2015-07-02 2018-08-07 The Nielsen Company (Us), Llc Methods and apparatus to correct errors in audience measurements for media accessed using over-the-top devices
US10380633B2 (en) 2015-07-02 2019-08-13 The Nielsen Company (Us), Llc Methods and apparatus to generate corrected online audience measurement data
JP6347567B1 (en) * 2017-10-23 2018-06-27 株式会社サードパーティートラスト Information processing system, processing method, processing program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003065232A1 (en) * 2002-01-31 2003-08-07 Witness Systems, Inc. Method, apparatus, and system for capturing, processing, and/or playing selected data exchanged between a server and a user
JP2006120130A (en) * 2004-09-21 2006-05-11 Software Partner:Kk System and method for managing access log

Also Published As

Publication number Publication date
JP2009181459A (en) 2009-08-13

Similar Documents

Publication Publication Date Title
JP5178219B2 (en) Access analysis device, access analysis method, and access analysis program
US8645453B2 (en) Method and system of processing cookies across domains
US20070220145A1 (en) Computer product, access-restricting method, and proxy server
JP4633049B2 (en) Associating a website click with a link on a web page
CN102436564A (en) Method and device for identifying falsified webpage
CN102594934A (en) Method and device for identifying hijacked website
MXPA06002206A (en) System and method for highlighting a domain in a browser display.
JP5709448B2 (en) Access analysis device, access analysis method, and access analysis program
US20150113383A1 (en) Analysis of web application state
JP2014056612A (en) Device, method, and program for controlling browsing
JP2006107524A (en) Www server and system having user terminal connected to www server via communication line
JP4729089B2 (en) Website counting device and website counting program
JP5860389B2 (en) Web browsing history acquisition system and method, proxy server, and Web browsing history acquisition program
JP5231328B2 (en) Advertisement information providing device
JP5300648B2 (en) RECOMMENDATION INFORMATION PROVIDING DEVICE, USER TERMINAL, OPERATION RECOMMENDING METHOD, AND PROGRAM
JP4831728B2 (en) Marketing system using web bookmarks
JP4090494B1 (en) Access analysis method, access analysis system, and access analysis program
JP5322972B2 (en) Web screen restoration device, web screen restoration method, and web screen restoration program
JP5669330B2 (en) RECOMMENDATION DEVICE, RECOMMENDATION METHOD, AND RECOMMENDATION PROGRAM
JP7422990B2 (en) Website analysis system, website analysis method, website analysis device, and program
JP6758582B1 (en) Content distribution system, content distribution program
JP2012043425A (en) Login authentication system and method
KR102141484B1 (en) Method and system for generating automatically personal online shopping mall using social network service
JP7069090B2 (en) Analysts, detectors, systems and programs
JP2010049294A (en) Screen information management method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120613

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130108

LAPS Cancellation because of no payment of annual fees