JP5709448B2 - Access analysis device, access analysis method, and access analysis program - Google Patents

Access analysis device, access analysis method, and access analysis program Download PDF

Info

Publication number
JP5709448B2
JP5709448B2 JP2010218969A JP2010218969A JP5709448B2 JP 5709448 B2 JP5709448 B2 JP 5709448B2 JP 2010218969 A JP2010218969 A JP 2010218969A JP 2010218969 A JP2010218969 A JP 2010218969A JP 5709448 B2 JP5709448 B2 JP 5709448B2
Authority
JP
Japan
Prior art keywords
message
identification information
information
user
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010218969A
Other languages
Japanese (ja)
Other versions
JP2012073878A (en
Inventor
敬 明石
敬 明石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Space Software Co Ltd
Original Assignee
Mitsubishi Space Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Space Software Co Ltd filed Critical Mitsubishi Space Software Co Ltd
Priority to JP2010218969A priority Critical patent/JP5709448B2/en
Publication of JP2012073878A publication Critical patent/JP2012073878A/en
Application granted granted Critical
Publication of JP5709448B2 publication Critical patent/JP5709448B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、アクセス解析装置及びアクセス解析方法及びアクセス解析プログラムに関するものである。本発明は、特に、キャプチャ型ウェブ(Web)解析システムにおける訪問者情報取得方法に関するものである。   The present invention relates to an access analysis device, an access analysis method, and an access analysis program. The present invention particularly relates to a method for acquiring visitor information in a capture type web (Web) analysis system.

従来、ウェブ解析技術には、主に、アクセスログ型、ビーコン(タグ)型、キャプチャ(パケットキャプチャ)型の3種類がある。このうち、キャプチャ型のウェブ解析技術では、パケットキャプチャ装置が、ウェブサーバを外部と接続するネットワーク上を流れる全てのパケットをキャプチャする。そして、アクセス解析装置が、パケットキャプチャ装置によりキャプチャされたパケットからHTTP(ハイパーテキスト転送プロトコル)通信を復元し、このHTTP通信を解析することによってアクセス解析を行う(例えば、特許文献1参照)。   Conventionally, there are mainly three types of web analysis technologies: an access log type, a beacon (tag) type, and a capture (packet capture) type. Among these, in the capture-type web analysis technology, the packet capture device captures all packets flowing on the network connecting the web server to the outside. Then, the access analysis device restores HTTP (Hypertext Transfer Protocol) communication from the packet captured by the packet capture device, and performs access analysis by analyzing the HTTP communication (see, for example, Patent Document 1).

特開2009−181459号公報JP 2009-181459 A

従来のキャプチャ型のウェブ解析技術において、訪問者(ユーザ)の識別は、例えば長期間有効なクッキー(Cookie)を用いて実施していた。この方式には以下のような課題があるため、訪問者の識別が困難であった。
・ユーザは常に同じ端末の同じブラウザからアクセスするとは限らない。
・クッキーを禁止にしているユーザもいる。
・長期間有効なクッキーを利用しないサイトが多い。
In the conventional capture-type web analysis technology, a visitor (user) is identified using, for example, a cookie that is valid for a long period of time. This method has the following problems, making it difficult to identify visitors.
-Users do not always access from the same browser on the same terminal.
・ Some users prohibit cookies.
・ Many sites do not use cookies that are valid for a long time.

特許文献1に記載のように、アクセス解析装置が、パケットキャプチャ装置によりキャプチャされたパケットからHTTPレスポンスを復元し、復元したHTTPレスポンスから、ユーザに対して個別に設定される個別設定データを抽出して訪問者の識別に利用する方法もある。しかし、この方法では、HTTPレスポンスに個別設定データが含まれている必要があった。   As described in Patent Document 1, the access analysis device restores the HTTP response from the packet captured by the packet capture device, and extracts individual setting data individually set for the user from the restored HTTP response. There is also a method used to identify visitors. However, in this method, it is necessary to include individual setting data in the HTTP response.

本発明は、例えば、IP(インターネットプロトコル)アドレスやクッキー情報といったような、個別のユーザ端末とウェブサーバとの通信を識別するための通信識別情報を利用しつつ、より確実に訪問者の識別を行うことを目的とする。   The present invention uses a communication identification information for identifying a communication between an individual user terminal and a web server, such as an IP (Internet Protocol) address and cookie information, for example, to more reliably identify a visitor. The purpose is to do.

本発明の一の態様に係るアクセス解析装置は、
複数のユーザ端末と各ユーザ端末にウェブページを配信するウェブサーバとの間で送受信されるパケットを収集して保存するパケットキャプチャ装置から、個別のユーザ端末と前記ウェブサーバとの通信を識別するための通信識別情報を含むパケット群であって、ウェブページの送受信のために用いられるHTTPメッセージを載せたパケット群を順次取得し、取得したパケット群から当該HTTPメッセージを処理装置により復元するメッセージ復元部と、
個別のユーザを識別するためのユーザ識別情報を含むHTTPメッセージであって、認証を要求するために前記ウェブサーバへ送信されたHTTPメッセージである第1メッセージが前記メッセージ復元部により復元された場合、前記第1メッセージに含まれるユーザ識別情報を処理装置により取得する情報取得部と、
前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージが前記メッセージ復元部により復元された場合、前記メッセージ復元部が前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を処理装置により取得し、取得した通信識別情報と前記情報取得部により取得されたユーザ識別情報とを対応付けて記憶装置に格納する情報格納部と、
前記情報格納部により格納されたユーザ識別情報ごとに、ユーザ識別情報によって識別されるユーザのアクセスログを記憶装置に格納するアクセスログ格納部と、
前記情報格納部により格納された通信識別情報と同じ通信識別情報を含むパケット群から、ウェブページへのアクセスを要求するために前記ウェブサーバへ送信されたHTTPメッセージである第2メッセージが前記メッセージ復元部により復元された場合、前記情報格納部により当該通信識別情報と対応付けて格納されたユーザ識別情報に対応する、前記アクセスログ格納部により格納されたアクセスログに、前記第2メッセージによって要求されたウェブページへのアクセスを示すアクセス情報を処理装置により記録するアクセス情報記録部とを備える。
An access analysis device according to one aspect of the present invention includes:
To identify communications between individual user terminals and the web server from a packet capture device that collects and stores packets transmitted and received between a plurality of user terminals and a web server that distributes web pages to each user terminal Is a packet group including communication identification information, and sequentially acquires a packet group carrying an HTTP message used for transmission / reception of a web page, and restores the HTTP message from the acquired packet group by a processing device When,
When the message restoration unit restores the first message, which is an HTTP message including user identification information for identifying an individual user, and is an HTTP message transmitted to the web server to request authentication, An information acquisition unit for acquiring user identification information included in the first message by a processing device;
When an HTTP message transmitted from the web server to notify the success of authentication requested by the first message is restored by the message restoration unit, the message restoration unit restores the first message; An information storage unit that acquires the communication identification information included in the packet group that has been acquired by the processing device, and stores the acquired communication identification information in association with the user identification information acquired by the information acquisition unit in the storage device;
For each user identification information stored by the information storage unit, an access log storage unit that stores a user access log identified by the user identification information in a storage device;
A second message which is an HTTP message transmitted to the web server to request access to a web page from a packet group including the same communication identification information as the communication identification information stored by the information storage unit is the message restoration. The access log stored by the access log storage unit corresponding to the user identification information stored in association with the communication identification information by the information storage unit is requested by the second message. An access information recording unit that records access information indicating access to the web page by the processing device.

前記アクセス情報記録部は、前記第1メッセージより前に前記ウェブサーバへ送信されたHTTPメッセージと、前記第1メッセージより後に前記ウェブサーバへ送信されたHTTPメッセージとの両方について、前記第2メッセージに該当するHTTPメッセージを処理対象とする。   The access information recording unit includes the second message for both the HTTP message transmitted to the web server before the first message and the HTTP message transmitted to the web server after the first message. The corresponding HTTP message is the processing target.

前記通信識別情報は、IPアドレスとクッキー情報との少なくともいずれかを含む。   The communication identification information includes at least one of an IP address and cookie information.

本発明の一の態様に係るアクセス解析方法では、
コンピュータの処理装置が、複数のユーザ端末と各ユーザ端末にウェブページを配信するウェブサーバとの間で送受信されるパケットを収集して保存するパケットキャプチャ装置から、個別のユーザ端末と前記ウェブサーバとの通信を識別するための通信識別情報を含むパケット群であって、ウェブページの送受信のために用いられるHTTPメッセージを載せたパケット群を順次取得し、取得したパケット群から当該HTTPメッセージを復元し、
コンピュータの処理装置が、個別のユーザを識別するためのユーザ識別情報を含むHTTPメッセージであって、認証を要求するために前記ウェブサーバへ送信されたHTTPメッセージである第1メッセージを復元した場合、前記第1メッセージに含まれるユーザ識別情報を取得し、
コンピュータの処理装置が、前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージを復元した場合、前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を取得し、コンピュータの記憶装置が、取得された通信識別情報とユーザ識別情報とを対応付けて格納し、
コンピュータの記憶装置が、格納したユーザ識別情報ごとに、ユーザ識別情報によって識別されるユーザのアクセスログを格納し、
コンピュータの処理装置が、格納された通信識別情報と同じ通信識別情報を含むパケット群から、ウェブページへのアクセスを要求するために前記ウェブサーバへ送信されたHTTPメッセージである第2メッセージを復元した場合、当該通信識別情報と対応付けて格納されたユーザ識別情報に対応するアクセスログに、前記第2メッセージによって要求されたウェブページへのアクセスを示すアクセス情報を記録する。
In the access analysis method according to one aspect of the present invention,
A processing device of a computer collects and stores packets transmitted and received between a plurality of user terminals and a web server that distributes web pages to each user terminal, from an individual user terminal and the web server Is a packet group including communication identification information for identifying the communication, and sequentially acquires a packet group carrying an HTTP message used for transmission / reception of a web page, and restores the HTTP message from the acquired packet group. ,
When the computer processing apparatus restores a first message that is an HTTP message including user identification information for identifying an individual user and is an HTTP message transmitted to the web server to request authentication, Obtaining user identification information included in the first message;
When the processing device of the computer restores the HTTP message transmitted from the web server in order to notify the success of the authentication requested by the first message, the packet group from which the first message is restored The communication identification information included is acquired, and the storage device of the computer stores the acquired communication identification information and user identification information in association with each other,
A storage device of the computer stores a user access log identified by the user identification information for each stored user identification information,
The processing device of the computer restored the second message, which is an HTTP message sent to the web server in order to request access to the web page, from the packet group including the same communication identification information as the stored communication identification information. In this case, the access information indicating the access to the web page requested by the second message is recorded in the access log corresponding to the user identification information stored in association with the communication identification information.

本発明の一の態様に係るアクセス解析プログラムは、
複数のユーザ端末と各ユーザ端末にウェブページを配信するウェブサーバとの間で送受信されるパケットを収集して保存するパケットキャプチャ装置から、個別のユーザ端末と前記ウェブサーバとの通信を識別するための通信識別情報を含むパケット群であって、ウェブページの送受信のために用いられるHTTPメッセージを載せたパケット群を順次取得し、取得したパケット群から当該HTTPメッセージを処理装置により復元するメッセージ復元処理と、
個別のユーザを識別するためのユーザ識別情報を含むHTTPメッセージであって、認証を要求するために前記ウェブサーバへ送信されたHTTPメッセージである第1メッセージが前記メッセージ復元処理により復元された場合、前記第1メッセージに含まれるユーザ識別情報を処理装置により取得する情報取得処理と、
前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージが前記メッセージ復元処理により復元された場合、前記メッセージ復元処理が前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を処理装置により取得し、取得した通信識別情報と前記情報取得処理により取得されたユーザ識別情報とを対応付けて記憶装置に格納する情報格納処理と、
前記情報格納処理により格納されたユーザ識別情報ごとに、ユーザ識別情報によって識別されるユーザのアクセスログを記憶装置に格納するアクセスログ格納処理と、
前記情報格納処理により格納された通信識別情報と同じ通信識別情報を含むパケット群から、ウェブページへのアクセスを要求するために前記ウェブサーバへ送信されたHTTPメッセージである第2メッセージが前記メッセージ復元処理により復元された場合、前記情報格納処理により当該通信識別情報と対応付けて格納されたユーザ識別情報に対応する、前記アクセスログ格納処理により格納されたアクセスログに、前記第2メッセージによって要求されたウェブページへのアクセスを示すアクセス情報を処理装置により記録するアクセス情報記録処理とをコンピュータに実行させる。
An access analysis program according to one aspect of the present invention includes:
To identify communications between individual user terminals and the web server from a packet capture device that collects and stores packets transmitted and received between a plurality of user terminals and a web server that distributes web pages to each user terminal Message recovery processing in which a packet group including communication identification information is sequentially acquired, and a packet group on which an HTTP message used for transmission / reception of a web page is loaded is acquired, and the HTTP message is recovered from the acquired packet group by a processing device When,
When an HTTP message including user identification information for identifying an individual user and the first message that is an HTTP message transmitted to the web server to request authentication is restored by the message restoration process, Information acquisition processing for acquiring user identification information included in the first message by a processing device;
When an HTTP message transmitted from the web server to notify the success of authentication requested by the first message is restored by the message restoration process, the message restoration process restores the first message; An information storage process for acquiring communication identification information included in the packet group, and storing the acquired communication identification information in association with the user identification information acquired by the information acquisition process in a storage device;
For each user identification information stored by the information storage process, an access log storage process for storing an access log of a user identified by the user identification information in a storage device;
A second message which is an HTTP message transmitted to the web server to request access to a web page from a packet group including the same communication identification information as the communication identification information stored by the information storing process is the message restoration. When restored by the process, the access log stored by the access log storage process corresponding to the user identification information stored in association with the communication identification information by the information storage process is requested by the second message. The computer is caused to execute access information recording processing for recording access information indicating access to the web page by the processing device.

前記アクセス情報記録処理は、前記第1メッセージより前に前記ウェブサーバへ送信されたHTTPメッセージと、前記第1メッセージより後に前記ウェブサーバへ送信されたHTTPメッセージとの両方について、前記第2メッセージに該当するHTTPメッセージを処理対象とする。   In the access information recording process, both the HTTP message transmitted to the web server before the first message and the HTTP message transmitted to the web server after the first message are included in the second message. The corresponding HTTP message is the processing target.

前記通信識別情報は、IPアドレスとクッキー情報との少なくともいずれかを含む。   The communication identification information includes at least one of an IP address and cookie information.

本発明の一の態様によれば、IPアドレスやクッキー情報といったような、個別のユーザ端末とウェブサーバとの通信を識別するための通信識別情報を利用しつつ、より確実に訪問者の識別を行うことが可能となる。   According to one aspect of the present invention, visitor identification is more reliably performed using communication identification information such as an IP address and cookie information for identifying communication between an individual user terminal and a web server. Can be done.

実施の形態1に係るアクセス解析装置の利用形態の一例を示す図。FIG. 4 is a diagram illustrating an example of a usage pattern of the access analysis device according to the first embodiment. 実施の形態1においてウェブブラウザ画面に表示されるウェブページの一例を示す図。FIG. 3 shows an example of a web page displayed on the web browser screen in the first embodiment. 実施の形態1におけるHTTP通信の一例を示す図。FIG. 3 shows an example of HTTP communication in the first embodiment. 実施の形態1においてウェブブラウザ画面に表示されるウェブページの一例を示す図。FIG. 3 shows an example of a web page displayed on the web browser screen in the first embodiment. 実施の形態1におけるHTTP通信の一例を示す図。FIG. 3 shows an example of HTTP communication in the first embodiment. 実施の形態1においてウェブブラウザ画面に表示されるウェブページの一例を示す図。FIG. 3 shows an example of a web page displayed on the web browser screen in the first embodiment. 実施の形態1に係るアクセス解析装置の構成を示すブロック図。FIG. 2 is a block diagram showing a configuration of an access analysis device according to the first embodiment. 実施の形態1に係るアクセス解析装置のハードウェア資源の一例を示す図。FIG. 3 is a diagram illustrating an example of hardware resources of the access analysis apparatus according to the first embodiment. 実施の形態1に係るアクセス解析装置の動作を示すフローチャート。5 is a flowchart showing the operation of the access analysis apparatus according to the first embodiment. 実施の形態2に係るアクセス解析装置の動作を示すフローチャート。10 is a flowchart showing the operation of the access analysis apparatus according to the second embodiment.

以下、本発明の実施の形態について、図を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

実施の形態1.
図1は、本実施の形態に係るアクセス解析装置100の利用形態の一例を示す図である。
Embodiment 1 FIG.
FIG. 1 is a diagram illustrating an example of a usage pattern of an access analysis device 100 according to the present embodiment.

図1において、複数あるユーザ端末201は、それぞれユーザが利用するコンピュータであり、ユーザがウェブページを閲覧するためのウェブブラウザを動作させる。ユーザ端末201は、例えばPC(パーソナルコンピュータ)である。   In FIG. 1, a plurality of user terminals 201 are computers used by the user, and operate a web browser for the user to browse web pages. The user terminal 201 is, for example, a PC (personal computer).

ウェブサーバ202は、複数のウェブページからなるウェブサイトを実現するサーバコンピュータであり、各ユーザ端末201にウェブページを配信する。以下では、説明を簡単にするため、1つのウェブサイトを実現するものであれば、サーバコンピュータが2台以上ある場合でも、それらをまとめて1つのウェブサーバ202として考えるものとする。また、単にHTML(ハイパーテキストマークアップ言語)ファイルを提供するHTTPサーバだけでなく、ウェブサイト上で電子商取引サービスを提供するために必要なログイン認証機能やデータベース処理機能を有するウェブアプリケーションサーバ等もまとめて1つのウェブサーバ202として考えるものとする。なお、ここでは、ハードウェア及びソフトウェアの組み合わせであるサーバコンピュータとソフトウェアのみであるサーバプログラムは厳密に区別していない(どちらを指す場合にも、ウェブサーバ202という)。   The web server 202 is a server computer that realizes a website composed of a plurality of web pages, and delivers the web page to each user terminal 201. In the following, for the sake of simplification of description, as long as one web site is realized, even when there are two or more server computers, they are collectively considered as one web server 202. In addition to HTTP servers that simply provide HTML (Hyper Text Markup Language) files, Web application servers that have a login authentication function and database processing function necessary for providing electronic commerce services on a website are also summarized. Assume that one web server 202 is considered. Here, a server computer that is a combination of hardware and software and a server program that is only software are not strictly distinguished (in either case, they are referred to as the web server 202).

各ユーザ端末201とウェブサーバ202は、インターネット203を介して、IP通信を行う。IP通信において、各ユーザ端末201は、インターネット203を介して、IPパケット211をウェブサーバ202へ送信する。同様に、ウェブサーバ202は、インターネット203を介して、IPパケット212を各ユーザ端末201へ送信する。各ユーザ端末201で動作するウェブブラウザとウェブサーバ202は、IP通信を利用してHTTP通信を行う。即ち、ウェブブラウザとウェブサーバ202は、ウェブページの送受信のために用いられるHTTPメッセージを載せたIPパケット211,212をやり取りする。   Each user terminal 201 and the web server 202 perform IP communication via the Internet 203. In IP communication, each user terminal 201 transmits an IP packet 211 to the web server 202 via the Internet 203. Similarly, the web server 202 transmits an IP packet 212 to each user terminal 201 via the Internet 203. The web browser and web server 202 operating on each user terminal 201 perform HTTP communication using IP communication. That is, the web browser and the web server 202 exchange IP packets 211 and 212 carrying HTTP messages used for transmission and reception of web pages.

ここで、図2に、ユーザがログイン中でない場合に、ユーザ端末201のウェブブラウザ画面301に表示されるウェブページ311の一例を示す。また、図3に、このウェブページ311をユーザ端末201で動作するウェブブラウザが取得するためのHTTP通信の一例を示す。HTTP通信において、ウェブブラウザは、HTTPメッセージの一種であるHTTPリクエスト401をウェブサーバ202へ送信する。ウェブサーバ202は、HTTPリクエスト401に応じて、HTTPメッセージの一種であるHTTPレスポンス402をユーザ端末201へ返信する。   Here, FIG. 2 shows an example of a web page 311 displayed on the web browser screen 301 of the user terminal 201 when the user is not logged in. FIG. 3 shows an example of HTTP communication for acquiring the web page 311 by a web browser operating on the user terminal 201. In HTTP communication, the web browser transmits an HTTP request 401, which is a kind of HTTP message, to the web server 202. In response to the HTTP request 401, the web server 202 returns an HTTP response 402, which is a kind of HTTP message, to the user terminal 201.

図3において、ユーザが、ウェブブラウザ画面301にウェブページ311のURL321(Uniform・Resource・Locator)を入力して(ウェブブラウザ画面301で閲覧中の他のウェブページ内にあるリンクをクリックする等、他の方法を用いてもよい)、ウェブページ311へのアクセスを要求すると、ウェブブラウザは、そのウェブページ311のURLデータ411を含むHTTPリクエスト401を生成する。ユーザ端末201は、HTTPリクエスト401をIPパケット211に載せてウェブサーバ202へ送信する。   In FIG. 3, the user inputs the URL 321 (Uniform / Resource / Locator) of the web page 311 on the web browser screen 301 (clicks a link in another web page being browsed on the web browser screen 301, etc.) When requesting access to the web page 311, another method may be used), the web browser generates an HTTP request 401 including the URL data 411 of the web page 311. The user terminal 201 transmits an HTTP request 401 on the IP packet 211 to the web server 202.

ウェブサーバ202は、HTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれるURLデータ411に基づいて、ユーザがアクセスを要求したウェブページ311を特定し、そのウェブページ311のページデータ412を含むHTTPレスポンス402を生成する。このページデータ412は静的なデータであってもよいが、ここでは、ウェブサーバ202が、ページデータ412に特定の表示データ413を動的に付加するものとする。ウェブサーバ202は、特定の表示データ413が付加されたページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。   When the web server 202 receives the IP packet 211 carrying the HTTP request 401 from the user terminal 201, the web server 202 identifies the web page 311 requested by the user to access based on the URL data 411 included in the HTTP request 401, An HTTP response 402 including page data 412 of the page 311 is generated. The page data 412 may be static data, but here, it is assumed that the web server 202 dynamically adds specific display data 413 to the page data 412. The web server 202 replies to the user terminal 201 with an HTTP response 402 including the page data 412 to which the specific display data 413 is added on the IP packet 212.

ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をウェブサーバ202から受信すると、ユーザ端末201で動作するウェブブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、ウェブページ311をウェブブラウザ画面301に表示する。図2に示したように、例えば、ウェブブラウザは、ページデータ412に付加された特定の表示データ413を、「こんにちは。」という特定の文字列322としてウェブページ311の一部に表示する。また、ウェブブラウザは、ウェブサイトで扱われている商品カテゴリのメニュー323をウェブページ311の一部に表示する。ウェブブラウザは、メニュー323内に、各商品カテゴリの商品販売用のウェブページへのリンク324を表示する。   When the user terminal 201 receives the IP packet 212 carrying the HTTP response 402 from the web server 202, the web browser operating on the user terminal 201 changes the web page 311 to the web page 311 based on the page data 412 included in the HTTP response 402. It is displayed on the browser screen 301. As shown in FIG. 2, for example, a web browser, a particular display data 413 added to the page data 412, and displays a portion of a web page 311 as a specific character string 322 of "hello.". In addition, the web browser displays a product category menu 323 handled by the website on a part of the web page 311. The web browser displays in the menu 323 a link 324 to the product sales web page of each product category.

図4に、ユーザがログインした直後に、ユーザ端末201のウェブブラウザ画面301に表示されるウェブページ312の一例を示す。また、図5に、このウェブページ312をユーザ端末201で動作するウェブブラウザが取得するためのHTTP通信の一例を示す。   FIG. 4 shows an example of a web page 312 displayed on the web browser screen 301 of the user terminal 201 immediately after the user logs in. FIG. 5 shows an example of HTTP communication for acquiring the web page 312 by a web browser operating on the user terminal 201.

図5において、ユーザが、ウェブブラウザ画面301で閲覧中のログイン認証用のウェブページ内にあるフォームに、ウェブサイトで予め設定されたユーザID(識別子)とパスワードの組み合わせを入力して、ウェブサイトへのログインを要求すると、ウェブブラウザは、入力されたユーザIDとパスワードとを認証データ414として含むHTTPリクエスト401を生成する。ユーザ端末201は、HTTPリクエスト401をIPパケット211に載せてウェブサーバ202へ送信する。ここで、ユーザIDは、個別のユーザを識別するためのユーザ識別情報の一例である。また、パスワードは、ウェブサーバ202においてユーザ識別情報と対応付けて記憶され、ユーザの認証のために照合される認証情報の一例である。例えば、ユーザがパスワードの代わりに、暗証番号や生体情報といった他の種類の認証情報を入力するようにしてもよい。この場合、認証データ414には、当該認証情報がユーザIDとともに含まれることになる。   In FIG. 5, the user inputs a combination of a user ID (identifier) and a password set in advance on the website into a form in the web page for login authentication being browsed on the web browser screen 301, and the website When requesting login to, the web browser generates an HTTP request 401 including the input user ID and password as authentication data 414. The user terminal 201 transmits an HTTP request 401 on the IP packet 211 to the web server 202. Here, the user ID is an example of user identification information for identifying individual users. The password is an example of authentication information that is stored in association with the user identification information in the web server 202 and verified for user authentication. For example, the user may input other types of authentication information such as a password or biometric information instead of a password. In this case, the authentication data 414 includes the authentication information together with the user ID.

ウェブサーバ202は、HTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれる認証データ414に基づいて、ユーザを認証する。具体的には、ウェブサーバ202は、認証データ414に含まれるユーザIDに対応するパスワードをデータベース等から読み出し、読み出したパスワードが認証データ414に含まれるパスワードと一致するかどうかを確認する。パスワードが一致すれば、認証が成功したことになり、パスワードが一致しなければ、認証は失敗したことになる。   When the web server 202 receives the IP packet 211 carrying the HTTP request 401 from the user terminal 201, the web server 202 authenticates the user based on the authentication data 414 included in the HTTP request 401. Specifically, the web server 202 reads a password corresponding to the user ID included in the authentication data 414 from a database or the like, and checks whether the read password matches the password included in the authentication data 414. If the passwords match, the authentication has succeeded, and if the passwords do not match, the authentication has failed.

ウェブサーバ202は、ユーザの認証が成功すると(これによりユーザはログインしたことになる)、ログイン中のユーザに対してデフォルトで表示するウェブページ312のページデータ412を含むHTTPレスポンス402を生成する。このページデータ412は静的なデータであってもよいが、ここでは、ウェブサーバ202が、ページデータ412に、ログイン中のユーザの個別設定データを付加するものとする。個別設定データは、ユーザに対して個別に設定されるもの(即ち、ユーザを区別できる情報)で、例えば、ユーザの属性データである。ここでは、ウェブサーバ202は、ログイン中のユーザの属性データとして、ユーザの名前データ415をページデータ412に付加するものとする。ウェブサーバ202は、属性データとして、他にも、ユーザID、ユーザのポイントデータ(ウェブサイトで商品を購入したユーザ等に与えられるポイントを記録したデータ)、ユーザの購入履歴データ(ウェブサイトでユーザが購入した商品等を記録したデータ)、ユーザの嗜好データ(ウェブサイトでユーザが購入した商品によって推定されるユーザの嗜好に合わせて動的に生成されるウェブページへのリンク324)等をページデータ412に付加してもよい。ウェブサーバ202は、ログイン中のユーザの属性データを付加したページデータ412を含むHTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。   When the user authentication is successful (which means that the user has logged in), the web server 202 generates an HTTP response 402 including the page data 412 of the web page 312 displayed by default for the logged-in user. The page data 412 may be static data, but here, it is assumed that the web server 202 adds individual setting data of the logged-in user to the page data 412. The individual setting data is individually set for the user (that is, information that can distinguish the user), and is, for example, user attribute data. Here, it is assumed that the web server 202 adds user name data 415 to the page data 412 as attribute data of the logged-in user. In addition to the attribute data, the web server 202 also includes a user ID, user point data (data recording points given to users who have purchased products on the website, etc.), user purchase history data (users on the website) Page, etc.), user preference data (link 324 to a web page dynamically generated according to the user's preference estimated by the product purchased by the user on the website), etc. It may be added to the data 412. The web server 202 replies to the user terminal 201 with an HTTP response 402 including the page data 412 to which the attribute data of the logged-in user is added added to the IP packet 212.

ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をウェブサーバ202から受信すると、ユーザ端末201で動作するウェブブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、ウェブページ312をウェブブラウザ画面301に表示する。図4に示したように、例えば、ウェブブラウザは、ページデータ412に付加された特定の表示データ413を、「こんにちは、」という特定の文字列322としてウェブページ312の一部に表示する。また、ウェブブラウザは、ページデータ412に付加された特定の表示データ416を、「さん。」という特定の文字列326としてウェブページ312の一部に表示する。さらに、ウェブブラウザは、ページデータ412に付加されたユーザの名前データ415に基づいて、ユーザの「山田太郎」という名前325を特定の文字列322の後(所定の相対位置の一例)、もしくは、特定の文字列322と特定の文字列326との間(特定の文字列322を起点とし、特定の文字列326を終点とする範囲)に表示する。また、ウェブブラウザは、ページデータ412に付加された他の属性データに基づいて、ユーザIDやユーザの購入履歴データが(hiddenパラメータ等として)埋め込まれたウェブページ312を表示する。あるいは、ウェブブラウザは、ユーザのポイントデータをウェブページ312の一部に表示する。あるいは、ウェブブラウザは、ユーザの嗜好データであるリンク324を含むメニュー323をウェブページ312の一部に表示する。   When the user terminal 201 receives the IP packet 212 carrying the HTTP response 402 from the web server 202, the web browser operating on the user terminal 201 displays the web page 312 based on the page data 412 included in the HTTP response 402. It is displayed on the browser screen 301. As shown in FIG. 4, for example, a web browser, a particular display data 413 added to the page data 412, and displays a portion of a web page 312 as a specific character string 322 of "hello,". Further, the web browser displays the specific display data 416 added to the page data 412 as a specific character string 326 “san” on a part of the web page 312. Furthermore, the web browser changes the name 325 of the user “Taro Yamada” after the specific character string 322 (an example of a predetermined relative position) based on the user name data 415 added to the page data 412, or It is displayed between the specific character string 322 and the specific character string 326 (a range starting from the specific character string 322 and ending with the specific character string 326). Further, the web browser displays the web page 312 in which the user ID and the purchase history data of the user are embedded (as a hidden parameter or the like) based on other attribute data added to the page data 412. Alternatively, the web browser displays the user's point data on a part of the web page 312. Alternatively, the web browser displays a menu 323 including a link 324 that is user preference data on a part of the web page 312.

図6に、ユーザがログイン中に、ユーザ端末201のウェブブラウザ画面301に表示されるウェブページ313の一例を示す。   FIG. 6 shows an example of a web page 313 displayed on the web browser screen 301 of the user terminal 201 while the user is logged in.

図示していないが、ログイン中のユーザが、ウェブブラウザ画面301にウェブページ313のURL321を入力する等、前述した方法を用いて、ウェブページ313へのアクセスを要求すると、ウェブブラウザは、そのウェブページ313のURLデータ411を含むHTTPリクエスト401を生成する。このとき、ウェブブラウザは、ユーザがウェブサイトにログインしたときにクッキーに書き込まれたデータ(ユーザID、ユーザがログイン中であることを示すデータ等)をHTTPリクエスト401に付加する。ユーザ端末201は、HTTPリクエスト401をIPパケット211に載せてウェブサーバ202へ送信する。   Although not shown, when a logged-in user requests access to the web page 313 using the method described above, such as inputting the URL 321 of the web page 313 on the web browser screen 301, the web browser displays the web page. An HTTP request 401 including the URL data 411 of the page 313 is generated. At this time, the web browser adds data (user ID, data indicating that the user is logged in, etc.) written in the cookie when the user logs in to the website to the HTTP request 401. The user terminal 201 transmits an HTTP request 401 on the IP packet 211 to the web server 202.

ウェブサーバ202は、HTTPリクエスト401を載せたIPパケット211をユーザ端末201から受信すると、HTTPリクエスト401に含まれるURLデータ411に基づいて、ユーザがアクセスを要求したウェブページ313を特定し、そのウェブページ313のページデータ412を含むHTTPレスポンス402を生成する。前述したように、このページデータ412は静的なデータであってもよいが、ここでは、ウェブサーバ202が、ページデータ412に特定の表示データ413,416とユーザの名前データ415を付加するものとする。ウェブサーバ202は、さらに、他の属性データをページデータ412に付加してもよい。ウェブサーバ202は、HTTPレスポンス402をIPパケット212に載せてユーザ端末201へ返信する。   When the web server 202 receives the IP packet 211 carrying the HTTP request 401 from the user terminal 201, the web server 202 specifies the web page 313 requested by the user based on the URL data 411 included in the HTTP request 401, An HTTP response 402 including page data 412 of the page 313 is generated. As described above, the page data 412 may be static data, but here, the web server 202 adds specific display data 413 and 416 and user name data 415 to the page data 412. And The web server 202 may further add other attribute data to the page data 412. The web server 202 places an HTTP response 402 on the IP packet 212 and returns it to the user terminal 201.

ユーザ端末201が、HTTPレスポンス402を載せたIPパケット212をウェブサーバ202から受信すると、ユーザ端末201で動作するウェブブラウザは、HTTPレスポンス402に含まれるページデータ412に基づいて、ウェブページ313をウェブブラウザ画面301に表示する。   When the user terminal 201 receives the IP packet 212 carrying the HTTP response 402 from the web server 202, the web browser operating on the user terminal 201 changes the web page 313 to the web based on the page data 412 included in the HTTP response 402. It is displayed on the browser screen 301.

図2に示したウェブページ311と図4に示したウェブページ312とを比較すると、いずれもURL321や表示されているコンテンツは同じであるが、図2に示したウェブページ311の上部には、特定の文字列322のみが表示されているのに対し、図4に示したウェブページ312の上部には、特定の文字列322のほか、その後に続けてログイン中のユーザの名前325が表示されている。また、図4に示したウェブページ312と図6に示したウェブページ313とを比較すると、URL321や表示されているコンテンツは異なっているが、いずれのウェブページ312,313の上部にも、特定の文字列322のほか、その後に続けてログイン中のユーザの名前325が表示されている。このように、上記の例におけるウェブサイトでは、ユーザがログインすると、各ウェブページの上部にユーザの名前325が共通の形式で表示されるようになっている。   When the web page 311 shown in FIG. 2 and the web page 312 shown in FIG. 4 are compared, the URL 321 and the displayed content are the same, but the upper part of the web page 311 shown in FIG. While only the specific character string 322 is displayed, the upper part of the web page 312 shown in FIG. 4 displays the name 325 of the currently logged-in user in addition to the specific character string 322. ing. Further, when the web page 312 shown in FIG. 4 is compared with the web page 313 shown in FIG. 6, the URL 321 and the displayed content are different, but the upper part of each of the web pages 312 and 313 is specified. In addition to the character string 322, the name 325 of the currently logged-in user is displayed. Thus, in the website in the above example, when the user logs in, the user name 325 is displayed in a common format at the top of each web page.

図1において、ネットワーク機器204は、ウェブサーバ202とインターネット203の間に接続される通信機器であり、各ユーザ端末201からインターネット203を介してウェブサーバ202へ送信されるIPパケット211、及び、ウェブサーバ202からインターネット203を介して各ユーザ端末201へ送信されるIPパケット212を中継する。ネットワーク機器204は、中継する全てのIPパケット211,212をミラーポートからも出力する。ネットワーク機器204は、例えばスイッチングハブやルータである。   In FIG. 1, a network device 204 is a communication device connected between the web server 202 and the Internet 203, and an IP packet 211 transmitted from each user terminal 201 to the web server 202 via the Internet 203, and a web The IP packet 212 transmitted from the server 202 to each user terminal 201 via the Internet 203 is relayed. The network device 204 also outputs all IP packets 211 and 212 to be relayed from the mirror port. The network device 204 is, for example, a switching hub or a router.

パケットキャプチャ装置205は、ネットワーク機器204のミラーポートに接続されるコンピュータである。パケットキャプチャ装置205は、ネットワーク機器204のミラーポートから出力される複数のIPパケット211,212を収集し、ハードディスク等の記録媒体に蓄積する。即ち、パケットキャプチャ装置205は、各ユーザ端末201とウェブサーバ202との間で送受信されるIPパケット211,212を収集して保存する。   The packet capture device 205 is a computer connected to the mirror port of the network device 204. The packet capture device 205 collects a plurality of IP packets 211 and 212 output from the mirror port of the network device 204 and stores them in a recording medium such as a hard disk. That is, the packet capture device 205 collects and stores IP packets 211 and 212 transmitted and received between each user terminal 201 and the web server 202.

アクセス解析装置100は、パケットキャプチャ装置205に接続されるコンピュータである。アクセス解析装置100は、パケットキャプチャ装置205が記録媒体に蓄積した複数のIPパケット211,212を解析することで、ウェブサイト内でのユーザごとの行動を解析する。アクセス解析装置100は、パケットキャプチャ装置205を内蔵していてもよい。具体的には、アクセス解析装置100は、パケットキャプチャ装置205の機能を有するプログラムを実行するコンピュータであってもよい。   The access analysis device 100 is a computer connected to the packet capture device 205. The access analysis device 100 analyzes a plurality of IP packets 211 and 212 stored in the recording medium by the packet capture device 205, thereby analyzing an action for each user in the website. The access analysis device 100 may incorporate a packet capture device 205. Specifically, the access analysis device 100 may be a computer that executes a program having the function of the packet capture device 205.

図7は、アクセス解析装置100の構成を示すブロック図である。   FIG. 7 is a block diagram illustrating a configuration of the access analysis device 100.

図7において、アクセス解析装置100は、メッセージ復元部101、情報取得部102、情報格納部103、アクセスログ格納部104、アクセス情報記録部105、アクセス解析部106を備える。アクセス解析装置100の各部の動作については、フローチャートを用いて後で説明する。   7, the access analysis apparatus 100 includes a message restoration unit 101, an information acquisition unit 102, an information storage unit 103, an access log storage unit 104, an access information recording unit 105, and an access analysis unit 106. The operation of each part of the access analysis device 100 will be described later using a flowchart.

アクセス解析装置100は、処理装置151、記憶装置152、入力装置153、出力装置154等のハードウェアを備える。ハードウェアはアクセス解析装置100の各部によって利用される。例えば、処理装置151は、アクセス解析装置100の各部でデータや情報の演算、加工、読み取り、書き込み等を行うために利用される。記憶装置152は、そのデータや情報を記憶するために利用される。また、入力装置153は、そのデータや情報を入力するために、出力装置154は、そのデータや情報を出力するために利用される。   The access analysis device 100 includes hardware such as a processing device 151, a storage device 152, an input device 153, and an output device 154. The hardware is used by each unit of the access analysis device 100. For example, the processing device 151 is used to perform calculation, processing, reading, writing, and the like of data and information in each unit of the access analysis device 100. The storage device 152 is used to store the data and information. The input device 153 is used to input the data and information, and the output device 154 is used to output the data and information.

図8は、アクセス解析装置100のハードウェア構成の一例を示す図である。   FIG. 8 is a diagram illustrating an example of a hardware configuration of the access analysis device 100.

図8において、アクセス解析装置100は、コンピュータであり、LCD901(Liquid・Crystal・Display)、キーボード902(K/B)、マウス903、FDD904(Flexible・Disk・Drive)、CDD905(Compact・Disc・Drive)、プリンタ906といったハードウェアデバイスを備えている。これらのハードウェアデバイスはケーブルや信号線で接続されている。LCD901の代わりに、CRT(Cathode・Ray・Tube)、あるいは、その他の表示装置が用いられてもよい。マウス903の代わりに、タッチパネル、タッチパッド、トラックボール、ペンタブレット、あるいは、その他のポインティングデバイスが用いられてもよい。   In FIG. 8, an access analysis apparatus 100 is a computer, and includes an LCD 901 (Liquid / Crystal / Display), a keyboard 902 (K / B), a mouse 903, an FDD 904 (Flexible / Disk / Drive), and a CDD 905 (Compact / Disk / Drive). ) And a hardware device such as a printer 906. These hardware devices are connected by cables and signal lines. Instead of the LCD 901, a CRT (Cathode / Ray / Tube) or other display device may be used. Instead of the mouse 903, a touch panel, a touch pad, a trackball, a pen tablet, or other pointing devices may be used.

アクセス解析装置100は、プログラムを実行するCPU911(Central・Processing・Unit)を備えている。CPU911は、処理装置151の一例である。CPU911は、バス912を介してROM913(Read・Only・Memory)、RAM914(Random・Access・Memory)、通信ボード915、LCD901、キーボード902、マウス903、FDD904、CDD905、プリンタ906、HDD920(Hard・Disk・Drive)と接続され、これらのハードウェアデバイスを制御する。HDD920の代わりに、フラッシュメモリ、光ディスク装置、メモリカードリーダライタ又はその他の記憶媒体が用いられてもよい。   The access analysis apparatus 100 includes a CPU 911 (Central Processing Unit) that executes a program. The CPU 911 is an example of the processing device 151. The CPU 911 includes a ROM 913 (Read / Only / Memory), a RAM 914 (Random / Access / Memory), a communication board 915, an LCD 901, a keyboard 902, a mouse 903, an FDD 904, a CDD 905, a printer 906, and an HDD 920 (Hard / Disk) via a bus 912. Connected with Drive) to control these hardware devices. Instead of the HDD 920, a flash memory, an optical disk device, a memory card reader / writer, or other storage medium may be used.

RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、HDD920は、不揮発性メモリの一例である。これらは、記憶装置152の一例である。通信ボード915、キーボード902、マウス903、FDD904、CDD905は、入力装置153の一例である。また、通信ボード915、LCD901、プリンタ906は、出力装置154の一例である。   The RAM 914 is an example of a volatile memory. The ROM 913, the FDD 904, the CDD 905, and the HDD 920 are examples of nonvolatile memories. These are examples of the storage device 152. The communication board 915, the keyboard 902, the mouse 903, the FDD 904, and the CDD 905 are examples of the input device 153. The communication board 915, the LCD 901, and the printer 906 are examples of the output device 154.

通信ボード915は、LAN(Local・Area・Network)等に接続されている。通信ボード915は、LANに限らず、IP−VPN(Internet・Protocol・Virtual・Private・Network)、広域LAN、ATM(Asynchronous・Transfer・Mode)ネットワークといったWAN(Wide・Area・Network)、あるいは、インターネット203に接続されていても構わない。LAN、WAN、インターネット203は、ネットワークの一例である。   The communication board 915 is connected to a LAN (Local / Area / Network) or the like. The communication board 915 is not limited to a LAN, but is an IP-VPN (Internet, Protocol, Private, Network), a wide area LAN, an ATM (Asynchronous / Transfer / Mode) network, a WAN (Wide / Area / Network), or the Internet. 203 may be connected. LAN, WAN, and the Internet 203 are examples of networks.

HDD920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。プログラム群923には、本実施の形態の説明において「〜部」として説明する機能を実行するプログラムが含まれている。プログラムは、CPU911により読み出され実行される。ファイル群924には、本実施の形態の説明において、「〜データ」、「〜情報」、「〜ID(識別子)」、「〜フラグ」、「〜結果」として説明するデータや情報や信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」や「〜テーブル」の各項目として含まれている。「〜ファイル」や「〜データベース」や「〜テーブル」は、RAM914やHDD920等の記憶媒体に記憶される。RAM914やHDD920等の記憶媒体に記憶されたデータや情報や信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出、検索、参照、比較、演算、計算、制御、出力、印刷、表示といったCPU911の処理(動作)に用いられる。抽出、検索、参照、比較、演算、計算、制御、出力、印刷、表示といったCPU911の処理中、データや情報や信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。   The HDD 920 stores an operating system 921 (OS), a window system 922, a program group 923, and a file group 924. The programs in the program group 923 are executed by the CPU 911, the operating system 921, and the window system 922. The program group 923 includes programs that execute the functions described as “˜units” in the description of the present embodiment. The program is read and executed by the CPU 911. The file group 924 includes data, information, and signal values described as “˜data”, “˜information”, “˜ID (identifier)”, “˜flag”, and “˜result” in the description of this embodiment. And variable values and parameters are included as items of “˜file”, “˜database”, and “˜table”. The “˜file”, “˜database”, and “˜table” are stored in a storage medium such as the RAM 914 or the HDD 920. Data, information, signal values, variable values, and parameters stored in a storage medium such as the RAM 914 and the HDD 920 are read out to the main memory and the cache memory by the CPU 911 via a read / write circuit, and extracted, searched, referenced, compared, and calculated. It is used for processing (operation) of the CPU 911 such as calculation, control, output, printing, and display. During the processing of the CPU 911 such as extraction, search, reference, comparison, calculation, calculation, control, output, printing, and display, data, information, signal values, variable values, and parameters are temporarily stored in the main memory, cache memory, and buffer memory. Remembered.

本実施の形態の説明において用いるブロック図やフローチャートの矢印の部分は主としてデータや信号の入出力を示す。データや信号は、RAM914等のメモリ、FDD904のフレキシブルディスク(FD)、CDD905のコンパクトディスク(CD)、HDD920の磁気ディスク、光ディスク、DVD(Digital・Versatile・Disc)、あるいは、その他の記録媒体に記録される。また、データや信号は、バス912、信号線、ケーブル、あるいは、その他の伝送媒体により伝送される。   The arrows in the block diagrams and flowcharts used in the description of this embodiment mainly indicate input / output of data and signals. Data and signals are recorded in memory such as RAM 914, FDD904 flexible disk (FD), CDD905 compact disk (CD), HDD920 magnetic disk, optical disk, DVD (Digital Versatile Disc), or other recording media Is done. Data and signals are transmitted by a bus 912, a signal line, a cable, or other transmission media.

本実施の形態の説明において「〜部」として説明するものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜工程」、「〜手順」、「〜処理」であってもよい。即ち、「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。あるいは、「〜部」として説明するものは、ソフトウェアのみ、あるいは、素子、デバイス、基板、配線といったハードウェアのみで実現されていても構わない。あるいは、「〜部」として説明するものは、ソフトウェアとハードウェアとの組み合わせ、あるいは、ソフトウェアとハードウェアとファームウェアとの組み合わせで実現されていても構わない。ファームウェアとソフトウェアは、プログラムとして、フレキシブルディスク、コンパクトディスク、磁気ディスク、光ディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。即ち、プログラムは、本実施の形態の説明で述べる「〜部」としてコンピュータを機能させるものである。あるいは、プログラムは、本実施の形態の説明で述べる「〜部」の手順や方法をコンピュータに実行させるものである。   In the description of the present embodiment, what is described as “to part” may be “to circuit”, “to device”, “to device”, and “to step”, “to process”, “to”. ~ Procedure "," ~ process ". That is, what is described as “˜unit” may be realized by firmware stored in the ROM 913. Alternatively, what is described as “˜unit” may be realized only by software, or only by hardware such as an element, a device, a board, and wiring. Alternatively, what is described as “to part” may be realized by a combination of software and hardware, or a combination of software, hardware and firmware. Firmware and software are stored as programs in a recording medium such as a flexible disk, a compact disk, a magnetic disk, an optical disk, and a DVD. The program is read by the CPU 911 and executed by the CPU 911. That is, the program causes the computer to function as “to part” described in the description of the present embodiment. Or a program makes a computer perform the procedure and method of "-part" described by description of this Embodiment.

図9は、アクセス解析装置100の動作(本実施の形態に係るアクセス解析方法、本実施の形態に係るアクセス解析プログラムの処理手順)を示すフローチャートである。   FIG. 9 is a flowchart showing the operation of the access analysis apparatus 100 (access analysis method according to the present embodiment, processing procedure of the access analysis program according to the present embodiment).

ステップS101(メッセージ復元処理の一部)において、メッセージ復元部101は、パケットキャプチャ装置205から、個別のユーザ端末201とウェブサーバ202との通信を識別するための通信識別情報を含み、HTTPメッセージを1つずつ載せたパケット群を順次取得する。   In step S101 (part of message restoration processing), the message restoration unit 101 includes communication identification information for identifying communication between the individual user terminal 201 and the web server 202 from the packet capture device 205, and transmits an HTTP message. Packet groups placed one by one are acquired sequentially.

各ユーザ端末201からウェブサーバ202へ送信されるパケット群は、複数のIPパケット211で構成される。それぞれのIPパケット211には、その送信元のIPアドレスやポート番号が含まれる。IPアドレス、あるいは、IPアドレスとポート番号との組み合わせは、通信識別情報の一例である。   A packet group transmitted from each user terminal 201 to the web server 202 includes a plurality of IP packets 211. Each IP packet 211 includes the IP address and port number of the transmission source. An IP address or a combination of an IP address and a port number is an example of communication identification information.

各ユーザ端末201からウェブサーバ202へ送信されるパケット群には、HTTPメッセージとしてHTTPリクエスト401が載せられている。HTTPリクエスト401には、ユーザエージェント情報やクッキー情報等が含まれる。ユーザエージェント情報やクッキー情報等も、通信識別情報の一例である。ここで、ユーザエージェント情報は、HTTPリクエスト401の送信元のユーザ端末201で動作するウェブブラウザの種類(プログラム名、バージョン等)を示す情報である。クッキー情報は、ウェブサーバ202がクッキーに書き込む情報であり、例えば、ユーザID等、そのユーザを識別するための情報である。クッキーは、ユーザがウェブサイトにアクセスした際に、ウェブサーバ202から送信され、ユーザ端末201で動作するウェブブラウザによって保存される。クッキー情報は、ユーザがウェブサイトにアクセスする際にクッキーが既に保存されていれば、ユーザ端末201で動作するウェブブラウザからウェブサーバ202へ送信される。   A packet group transmitted from each user terminal 201 to the web server 202 includes an HTTP request 401 as an HTTP message. The HTTP request 401 includes user agent information, cookie information, and the like. User agent information, cookie information, and the like are also examples of communication identification information. Here, the user agent information is information indicating the type (program name, version, etc.) of the web browser operating on the user terminal 201 that is the transmission source of the HTTP request 401. The cookie information is information that the web server 202 writes in the cookie, and is information for identifying the user, such as a user ID, for example. The cookie is transmitted from the web server 202 when the user accesses the website, and is stored by the web browser operating on the user terminal 201. The cookie information is transmitted from the web browser operating on the user terminal 201 to the web server 202 if the cookie is already stored when the user accesses the website.

ウェブサーバ202から各ユーザ端末201へ送信されるパケット群は、複数のIPパケット212で構成される。それぞれのIPパケット212には、その送信元のIPアドレスやポート番号が含まれる。前述したように、IPアドレス、あるいは、IPアドレスとポート番号との組み合わせは、通信識別情報の一例である。   A packet group transmitted from the web server 202 to each user terminal 201 includes a plurality of IP packets 212. Each IP packet 212 includes the IP address and port number of the transmission source. As described above, an IP address or a combination of an IP address and a port number is an example of communication identification information.

ステップS102(メッセージ復元処理の一部)において、メッセージ復元部101は、ステップS101で取得したパケット群から、当該パケット群に載せて送信されたHTTPメッセージを処理装置151により復元する。このとき、メッセージ復元部101は、当該パケット群を当該HTTPリクエスト401と対応付けて記憶装置152に保存しておくことが望ましい。これにより、後述するステップS107で、情報格納部103が、当該パケット群に含まれる通信識別情報を効率的に取得することが可能となる。また、同様に、後述するステップS109で、メッセージ復元部101が、当該パケット群に含まれる通信識別情報を効率的に参照することが可能となる。   In step S102 (part of the message restoration process), the message restoration unit 101 restores the HTTP message transmitted in the packet group from the packet group acquired in step S101 by the processing device 151. At this time, the message restoration unit 101 preferably stores the packet group in the storage device 152 in association with the HTTP request 401. Thereby, in step S107 described later, the information storage unit 103 can efficiently acquire the communication identification information included in the packet group. Similarly, in step S109 described later, the message restoration unit 101 can efficiently refer to the communication identification information included in the packet group.

ステップS103(メッセージ復元処理の一部)において、メッセージ復元部101は、ステップS102で復元したHTTPメッセージの種別を(例えばヘッダを参照することで)処理装置151により判定する。復元したHTTPメッセージがHTTPリクエスト401であれば、ステップS104に進み、HTTPレスポンス402であれば、ステップS106に進む。   In step S103 (part of the message restoration process), the message restoration unit 101 determines the type of the HTTP message restored in step S102 by the processing device 151 (for example, by referring to the header). If the restored HTTP message is an HTTP request 401, the process proceeds to step S104. If the restored HTTP message is an HTTP response 402, the process proceeds to step S106.

ステップS104(メッセージ復元処理の一部)において、メッセージ復元部101は、ステップS102で復元したHTTPリクエスト401が、ユーザ識別情報を含み、認証を要求するためにウェブサーバ202へ送信されたHTTPリクエスト401(第1メッセージ)であるかどうかを処理装置151により判定する。具体的には、メッセージ復元部101は、復元したHTTPリクエスト401に、ユーザIDとパスワードとで構成される認証データ414が含まれているかどうかを判定する。復元したHTTPリクエスト401に認証データ414が含まれていれば、ステップS105に進み、認証データ414が含まれていなければ、ステップS109に進む。   In step S104 (part of the message restoration process), the message restoration unit 101 determines that the HTTP request 401 restored in step S102 includes the user identification information and is transmitted to the web server 202 to request authentication. The processing device 151 determines whether the message is (first message). Specifically, the message restoration unit 101 determines whether or not the restored HTTP request 401 includes authentication data 414 including a user ID and a password. If authentication data 414 is included in the restored HTTP request 401, the process proceeds to step S105, and if authentication data 414 is not included, the process proceeds to step S109.

ステップS105(情報取得処理)において、情報取得部102は、ステップS102でメッセージ復元部101により復元されたHTTPリクエスト401(第1メッセージ)に含まれるユーザ識別情報を処理装置151により取得する。具体的には、情報取得部102は、ユーザ識別情報としてユーザIDを取得し、取得したユーザIDを記憶装置152に仮データとして格納する。その後、ステップS101に戻る。   In step S105 (information acquisition process), the information acquisition unit 102 acquires the user identification information included in the HTTP request 401 (first message) restored by the message restoration unit 101 in step S102 by the processing device 151. Specifically, the information acquisition unit 102 acquires a user ID as user identification information, and stores the acquired user ID in the storage device 152 as temporary data. Then, it returns to step S101.

前述したように、ウェブサーバ202は、ユーザ端末201から認証データ414を含むHTTPリクエスト401(第1メッセージ)を受信すると、認証データ414に基づいて、ユーザを認証する。そして、ウェブサーバ202は、ユーザの認証が成功すると、ログイン中のユーザに対してデフォルトで表示するウェブページ312のページデータ412(ログイン中のユーザの個別設定データが付加されている)を含むHTTPレスポンス402を生成し、ユーザ端末201へ送信する。即ち、ウェブサーバ202は、HTTPリクエスト401(第1メッセージ)によって要求された認証が成功すると、認証の成功を通知するためのHTTPレスポンス402をユーザ端末201へ送信する。   As described above, when receiving the HTTP request 401 (first message) including the authentication data 414 from the user terminal 201, the web server 202 authenticates the user based on the authentication data 414. When the user authentication is successful, the web server 202 includes the page data 412 of the web page 312 displayed by default for the logged-in user (including individual setting data of the logged-in user). A response 402 is generated and transmitted to the user terminal 201. That is, when the authentication requested by the HTTP request 401 (first message) is successful, the web server 202 transmits an HTTP response 402 for notifying the success of the authentication to the user terminal 201.

ステップS106(メッセージ復元処理の一部)において、メッセージ復元部101は、ステップS102で復元したHTTPレスポンス402が、認証の成功を通知するためにウェブサーバ202から送信されたHTTPレスポンス402であるかどうかを処理装置151により判定する。具体的には、メッセージ復元部101は、復元したHTTPレスポンス402に、ログイン中のユーザの個別設定データが含まれているかどうかを判定する。復元したHTTPレスポンス402にログイン中のユーザの個別設定データが含まれていれば、ステップS107に進み、ログイン中のユーザの個別設定データが含まれていなければ、ステップS101に戻る。ステップS101に戻る場合には、情報取得部102が、記憶装置152に仮データとして格納したユーザIDを削除する。   In step S106 (part of the message restoration process), the message restoration unit 101 determines whether the HTTP response 402 restored in step S102 is the HTTP response 402 transmitted from the web server 202 to notify the success of the authentication. Is determined by the processing device 151. Specifically, the message restoration unit 101 determines whether or not the restored HTTP response 402 includes individual setting data of the logged-in user. If the restored HTTP response 402 includes the individual setting data of the logged-in user, the process proceeds to step S107. If the individual setting data of the logged-in user is not included, the process returns to step S101. When returning to step S101, the information acquisition unit 102 deletes the user ID stored as temporary data in the storage device 152.

なお、ステップS106において、メッセージ復元部101が、復元したHTTPレスポンス402に、ログイン中のユーザの個別設定データが含まれているかどうかを判定する代わりに、認証の失敗を示すエラーメッセージが含まれていないかどうかを判定してもよい。この場合、復元したHTTPレスポンス402にエラーメッセージが含まれていなければ、ステップS107に進み、エラーメッセージが含まれていれば、ステップS101に戻る。   In step S106, instead of determining whether the restored HTTP response 402 includes the individual setting data of the logged-in user, the message restoration unit 101 includes an error message indicating an authentication failure. It may be determined whether or not there is. In this case, if no error message is included in the restored HTTP response 402, the process proceeds to step S107, and if an error message is included, the process returns to step S101.

ステップS107(情報格納処理)において、情報格納部103は、ステップS102でメッセージ復元部101により復元されたHTTPレスポンス402に対応するHTTPリクエスト401(第1メッセージ)をメッセージ復元部101が復元する元となったパケット群に含まれる通信識別情報を処理装置151により取得する。そして、情報格納部103は、取得した通信識別情報と、情報取得部102により取得されたユーザ識別情報とを対応付けて記憶装置152に格納する。具体的には、情報格納部103は、通信識別情報として、IPアドレスやクッキー情報(IPアドレス又はIPアドレスとポート番号との組み合わせと、クッキー情報とのうち、少なくともいずれか、あるいは、少なくともいずれかとユーザエージェント情報等との組み合わせ)を取得して、記憶装置152に実装されたデータベース(ユーザIDテーブル)に格納する。そして、情報格納部103は、IPアドレスやクッキー情報に対応するユーザIDとして、情報取得部102により記憶装置152に仮データとして格納されているユーザIDを正式なデータとして当該データベースに改めて格納する。このとき、記憶装置152に仮データとして格納したユーザIDは削除する。   In step S107 (information storage processing), the information storage unit 103 is the source from which the message restoration unit 101 restores the HTTP request 401 (first message) corresponding to the HTTP response 402 restored by the message restoration unit 101 in step S102. The communication device 151 acquires the communication identification information included in the packet group. Then, the information storage unit 103 stores the acquired communication identification information and the user identification information acquired by the information acquisition unit 102 in association with each other in the storage device 152. Specifically, the information storage unit 103 uses, as communication identification information, at least one or at least one of an IP address and cookie information (IP address or a combination of an IP address and a port number and cookie information). (A combination with user agent information and the like) is acquired and stored in a database (user ID table) implemented in the storage device 152. Then, the information storage unit 103 stores the user ID stored as temporary data in the storage device 152 by the information acquisition unit 102 as the user ID corresponding to the IP address or the cookie information as formal data in the database. At this time, the user ID stored as temporary data in the storage device 152 is deleted.

ここで、ユーザがウェブサイトにログインするのが初めてではない場合、前回のログイン時に、情報格納部103がIPアドレスやクッキー情報とユーザIDとを対応付けてデータベース(ユーザIDテーブル)に既に格納していることになる。この場合、ステップS107において、情報格納部103は、既にデータベースに格納されているIPアドレスやクッキー情報と、今回取得したIPアドレスやクッキー情報とが異なっていれば、前者を後者で更新する。即ち、情報格納部103は、前回データベースに格納したIPアドレスやクッキー情報に代えて、今回取得したIPアドレスやクッキー情報を、ユーザIDと対応付けてデータベースに格納する。   Here, if it is not the first time that the user logs in to the website, at the time of the previous login, the information storage unit 103 associates the IP address or cookie information with the user ID and stores them in the database (user ID table). Will be. In this case, in step S107, if the IP address or cookie information already stored in the database is different from the IP address or cookie information acquired this time, the information storage unit 103 updates the former with the latter. That is, the information storage unit 103 stores the IP address and cookie information acquired this time in the database in association with the user ID instead of the IP address and cookie information stored in the previous database.

なお、ステップS105において、情報取得部102がHTTPリクエスト401(第1メッセージ)に含まれる認証データ414からユーザIDを取得する際に、情報格納部103が、そのHTTPリクエスト401をメッセージ復元部101が復元する元となったパケット群に含まれるIPアドレスやクッキー情報を処理装置151により取得して記憶装置152に仮データとして格納してもよい。この場合、ステップS107では、情報格納部103が、IPアドレスやクッキー情報の仮データを単に記憶装置152から取得し、正式なデータとしてデータベース(ユーザIDテーブル)に改めて格納する。このとき、記憶装置152に仮データとして格納したIPアドレスやクッキー情報は削除する。   In step S105, when the information acquisition unit 102 acquires the user ID from the authentication data 414 included in the HTTP request 401 (first message), the information storage unit 103 transmits the HTTP request 401 to the message restoration unit 101. The IP address and cookie information included in the packet group that is the source of restoration may be acquired by the processing device 151 and stored as temporary data in the storage device 152. In this case, in step S107, the information storage unit 103 simply acquires temporary data such as an IP address and cookie information from the storage device 152, and stores it again in the database (user ID table) as formal data. At this time, the IP address and cookie information stored as temporary data in the storage device 152 are deleted.

また、ステップS105において、情報取得部102がHTTPリクエスト401(第1メッセージ)に含まれる認証データ414からユーザIDを取得し、取得したユーザIDをデータベース(ユーザIDテーブル)に仮データとして格納してもよい。このとき、さらに、情報格納部103が、そのHTTPリクエスト401をメッセージ復元部101が復元する元となったパケット群に含まれるIPアドレスやクッキー情報を取得してデータベース(ユーザIDテーブル)に仮データとして、ユーザIDと対応付けて格納してもよい。この場合、ステップS107では、情報格納部103が、データベース(ユーザIDテーブル)に格納したIPアドレスやクッキー情報とユーザIDとの仮データを単に正式なデータに更新すればよい(例えば、データが仮データであるか正式なデータであるかを示すフラグ等を更新する)。後述するステップS109では、仮データは無視される。   In step S105, the information acquisition unit 102 acquires a user ID from the authentication data 414 included in the HTTP request 401 (first message), and stores the acquired user ID as temporary data in a database (user ID table). Also good. At this time, the information storage unit 103 further acquires the IP address and cookie information included in the packet group from which the message restoration unit 101 restores the HTTP request 401, and stores temporary data in the database (user ID table). May be stored in association with the user ID. In this case, in step S107, the information storage unit 103 may simply update the temporary data of the IP address and cookie information stored in the database (user ID table) and the user ID to formal data (for example, the data is temporarily stored). Update the flag indicating whether the data is official or official data). In step S109 described later, the temporary data is ignored.

ステップS108(アクセスログ格納処理)において、アクセスログ格納部104は、ステップS107で情報格納部103により格納されたユーザ識別情報ごとに、ユーザ識別情報によって識別されるユーザのアクセスログ(アクセス履歴情報)を記憶装置152に格納する。具体的には、アクセスログ格納部104は、ステップS107でデータベース(ユーザIDテーブル)に格納されたユーザIDに対応するアクセスログとして、ステップS102でメッセージ復元部101により復元されたHTTPレスポンス402にページデータ412が含まれるウェブページ312のURL321等を記録したデータを記憶装置152に格納する。その後、ステップS101に戻る。   In step S108 (access log storage processing), the access log storage unit 104 determines, for each user identification information stored by the information storage unit 103 in step S107, a user access log (access history information) identified by the user identification information. Is stored in the storage device 152. Specifically, the access log storage unit 104 displays a page in the HTTP response 402 restored by the message restoration unit 101 in step S102 as an access log corresponding to the user ID stored in the database (user ID table) in step S107. Data in which the URL 321 of the web page 312 including the data 412 is recorded is stored in the storage device 152. Then, it returns to step S101.

ここで、ユーザがウェブサイトにログインするのが初めてではない場合、前回のログイン時に、アクセスログ格納部104が当該ユーザのアクセスログを記憶装置152に既に格納していることになる。この場合、ステップS108において、アクセスログ格納部104は、既に記憶装置152に格納されているアクセスログに、今回復元されたHTTPレスポンス402にページデータ412が含まれるウェブページ312のURL321等を記録する。   Here, if it is not the first time that the user logs in to the website, the access log storage unit 104 has already stored the access log of the user in the storage device 152 at the previous login. In this case, in step S108, the access log storage unit 104 records the URL 321 or the like of the web page 312 in which the page data 412 is included in the HTTP response 402 restored this time, in the access log already stored in the storage device 152. .

ステップS109(メッセージ復元処理の一部)において、メッセージ復元部101は、ステップS102で復元したHTTPリクエスト401が、情報格納部103により格納された通信識別情報と同じ通信識別情報を含むパケット群から復元したものであり、ウェブページへのアクセスを要求するためにウェブサーバ202へ送信されたHTTPリクエスト401(第2メッセージ)であるかどうかを処理装置151により判定する。具体的には、メッセージ復元部101は、ステップS102でHTTPリクエスト401を復元する元となったパケット群に含まれるIPアドレスやクッキー情報が、データベース(ユーザIDテーブル)に格納済のものと一致するかどうかを判定する。IPアドレスやクッキー情報が格納済のものと一致すれば、ステップS110に進み、一致しなければ、ステップS101に戻る。   In step S109 (part of the message restoration process), the message restoration unit 101 restores the HTTP request 401 restored in step S102 from a packet group including the same communication identification information as the communication identification information stored by the information storage unit 103. The processing device 151 determines whether the request is an HTTP request 401 (second message) transmitted to the web server 202 in order to request access to the web page. Specifically, the message restoration unit 101 matches the IP address and cookie information included in the packet group from which the HTTP request 401 is restored in step S102 with those already stored in the database (user ID table). Determine whether or not. If the IP address and cookie information match those already stored, the process proceeds to step S110. If not, the process returns to step S101.

ステップS110(アクセス情報記録処理)において、アクセス情報記録部105は、情報格納部103により格納されたユーザ識別情報のうち、ステップS102でHTTPリクエスト401を復元する元となったパケット群に含まれる通信識別情報(ステップS109で判定の対象となったもの)と同じ通信識別情報と対応するユーザ識別情報を処理装置151により取得する。そして、アクセス情報記録部105は、アクセスログ格納部104により格納されたアクセスログのうち、取得したユーザ識別情報に対応するアクセスログに、ステップS102でメッセージ復元部101により復元されたHTTPリクエスト401(第2メッセージ)によって要求されたウェブページへのアクセスを示すアクセス情報を処理装置151により記録する。具体的には、アクセス情報記録部105は、ステップS102でHTTPリクエスト401を復元する元となったパケット群に含まれるIPアドレスやクッキー情報に対応するユーザIDをデータベース(ユーザIDテーブル)から取得する。そして、アクセス情報記録部105は、取得したユーザIDに対応するアクセスログに、ステップS102でメッセージ復元部101により復元されたHTTPリクエスト401(第2メッセージ)に含まれるURLデータ411が示すURL321等を記録する。その後、ステップS101に戻る。   In step S110 (access information recording process), the access information recording unit 105 includes communication included in the packet group that is the source of restoring the HTTP request 401 in step S102 among the user identification information stored by the information storage unit 103. The processing device 151 acquires user identification information corresponding to the same communication identification information as the identification information (identified in step S109). Then, the access information recording unit 105 adds the HTTP request 401 (restored by the message restoration unit 101 in step S102) to the access log corresponding to the acquired user identification information among the access logs stored by the access log storage unit 104. The access information indicating the access to the web page requested by the second message is recorded by the processing device 151. Specifically, the access information recording unit 105 acquires, from the database (user ID table), the user ID corresponding to the IP address and cookie information included in the packet group from which the HTTP request 401 is restored in step S102. . Then, the access information recording unit 105 adds the URL 321 indicated by the URL data 411 included in the HTTP request 401 (second message) restored by the message restoration unit 101 in step S102 to the access log corresponding to the acquired user ID. Record. Then, it returns to step S101.

なお、ステップS110において、アクセス情報記録部105が、HTTPリクエスト401(第2メッセージ)に基づいてアクセスログを更新する代わりに、そのHTTPリクエスト401に対応するHTTPレスポンス402に基づいてアクセスログを更新してもよい。この場合、アクセス情報記録部105は、ステップS102でメッセージ復元部101により復元されたHTTPリクエスト401に対応するHTTPレスポンス402がユーザ端末201に送信され、メッセージ復元部101により復元されるまで待機する。そして、アクセス情報記録部105は、そのHTTPレスポンス402にページデータ412が含まれるウェブページのURL321等を、アクセスログ格納部104により格納されたアクセスログに記録する。   In step S110, instead of updating the access log based on the HTTP request 401 (second message), the access information recording unit 105 updates the access log based on the HTTP response 402 corresponding to the HTTP request 401. May be. In this case, the access information recording unit 105 waits until the HTTP response 402 corresponding to the HTTP request 401 restored by the message restoration unit 101 in step S102 is transmitted to the user terminal 201 and restored by the message restoration unit 101. Then, the access information recording unit 105 records the URL 321 or the like of the web page whose page data 412 is included in the HTTP response 402 in the access log stored by the access log storage unit 104.

図示していないが、アクセス解析処理において、アクセス解析部106は、アクセスログ格納部104により格納されたアクセスログに基づいて、個々のユーザの行動を処理装置151により解析する。   Although not shown, in the access analysis process, the access analysis unit 106 analyzes the behavior of each user by the processing device 151 based on the access log stored by the access log storage unit 104.

上記のように、本実施の形態では、アクセス解析装置100において、メッセージ復元部101が、パケットキャプチャ装置205から通信識別情報を含むパケット群を順次取得し、HTTPメッセージを復元する。HTTPメッセージが、ユーザIDを含み、認証を要求するためのHTTPリクエスト401(第1メッセージ)であれば、当該ユーザIDを情報取得部102が取得する。HTTPメッセージが、認証の成功を通知するためのHTTPレスポンス402であれば、対応するHTTPリクエスト401が復元されたパケット群に含まれる通信識別情報と当該ユーザIDとを情報格納部103が対応付けて格納する。これ以降、通信識別情報が同じHTTPリクエスト401(第2メッセージ)が復元される度に、当該ユーザIDのアクセスログをアクセス情報記録部105が更新する。これにより、本実施の形態では、通信識別情報を利用しつつ、より確実に訪問者の識別を行って、その訪問者の行動をより多く記録することが可能となる。   As described above, in the present embodiment, in the access analysis device 100, the message restoration unit 101 sequentially acquires packet groups including communication identification information from the packet capture device 205, and restores the HTTP message. If the HTTP message includes a user ID and is an HTTP request 401 (first message) for requesting authentication, the information acquisition unit 102 acquires the user ID. If the HTTP message is an HTTP response 402 for notifying the success of authentication, the information storage unit 103 associates the communication identification information included in the packet group in which the corresponding HTTP request 401 is restored with the user ID. Store. Thereafter, each time an HTTP request 401 (second message) having the same communication identification information is restored, the access information recording unit 105 updates the access log of the user ID. Thereby, in this Embodiment, it becomes possible to identify a visitor more reliably using communication identification information, and to record more visitor actions.

以上説明したように、本実施の形態では、ユーザがログインを実施するサイトを対象とし、ユーザがログイン認証時に入力したユーザIDを訪問者の識別に利用する。   As described above, in this embodiment, a site where a user logs in is targeted, and the user ID input by the user during login authentication is used for visitor identification.

まず、アクセス解析装置100は、以下のように訪問者識別情報を取得する。   First, the access analysis device 100 acquires visitor identification information as follows.

ユーザがログイン認証としてユーザID及びパスワードを入力すると、入力された情報がユーザ端末201から送信される。アクセス解析装置100は、ユーザ端末201から送信された情報を解析し、ユーザIDを取得する。ウェブサーバ202が認証の成功を示すコンテンツを返信すると、アクセス解析装置100は、そのコンテンツを解析し、ユーザIDとともに、IPアドレス、ユーザエージェント情報、クッキー情報等をユーザIDテーブルに保持する。   When the user inputs a user ID and password as login authentication, the input information is transmitted from the user terminal 201. The access analysis device 100 analyzes the information transmitted from the user terminal 201 and acquires a user ID. When the web server 202 returns a content indicating that the authentication is successful, the access analysis apparatus 100 analyzes the content and stores the IP address, user agent information, cookie information and the like together with the user ID in the user ID table.

次に、アクセス解析装置100は、以下のようにログイン認証後の訪問者を識別する。   Next, the access analysis device 100 identifies visitors after login authentication as follows.

ユーザ端末201がウェブサーバ202にアクセスすると、アクセス解析装置100は、IPアドレスやクッキー情報を捕捉し、ユーザIDテーブルからユーザIDを取得する。そして、アクセス解析装置100は、取得したユーザIDに対応するアクセスログにアクセス情報を書き込む。   When the user terminal 201 accesses the web server 202, the access analysis device 100 captures the IP address and cookie information, and acquires the user ID from the user ID table. Then, the access analysis apparatus 100 writes the access information in the access log corresponding to the acquired user ID.

このように、本実施の形態に係るアクセス解析装置100は、キャプチャ型のウェブ解析で訪問者を識別し、よりリアルなウェブ解析を行うことができる。また、本実施の形態に係るアクセス解析装置100は、単純にある瞬間の個人を識別するのではなく、ユーザIDを利用することで永続的に個人を識別することができる。IPアドレスやクッキー情報は端末によって変わるが、本実施の形態では、少なくともログイン時にはIPアドレスやクッキー情報とユーザIDとのマッピングを行うため、端末によらず個人を識別することが可能である。また、IPアドレスやクッキー情報は同じ端末でも、時期によって変わる場合があるが、本実施の形態では、少なくともログイン時にはIPアドレスやクッキー情報とユーザIDとのマッピングを行うため、時期にもよらず個人を識別することが可能である。さらに、本実施の形態に係るアクセス解析装置100は、ユーザIDを毎回の個人識別の情報とするのではなく、他の識別情報(IPアドレスやクッキー情報)と紐付けることで、そのような情報から永続的に個人を識別することができる(例えば、ログイン時の情報だけにユーザIDがあれば、2回目以降の通信にはユーザIDがなくてよい)。   As described above, the access analysis apparatus 100 according to the present embodiment can identify a visitor by capture-type web analysis and perform more realistic web analysis. Further, the access analysis apparatus 100 according to the present embodiment can identify an individual permanently by using a user ID instead of simply identifying an individual at a certain moment. Although the IP address and cookie information vary depending on the terminal, in this embodiment, since the IP address and cookie information are mapped to the user ID at least during login, it is possible to identify an individual regardless of the terminal. In addition, the IP address and cookie information may change depending on the time even on the same terminal. However, in this embodiment, the IP address and cookie information are mapped to the user ID at least at the time of login. Can be identified. Furthermore, the access analysis apparatus 100 according to the present embodiment does not use the user ID as information for personal identification every time, but associates the user ID with other identification information (IP address or cookie information). Can be identified permanently (for example, if there is a user ID only in the information at the time of login, the second and subsequent communications may not have a user ID).

実施の形態2.
本実施の形態について、主に実施の形態1との差異を説明する。
Embodiment 2. FIG.
In the present embodiment, differences from the first embodiment will be mainly described.

図10は、本実施の形態に係るアクセス解析装置100の動作(本実施の形態に係るアクセス解析方法、本実施の形態に係るアクセス解析プログラムの処理手順)を示すフローチャートである。   FIG. 10 is a flowchart showing the operation of the access analysis apparatus 100 according to the present embodiment (the access analysis method according to the present embodiment, the processing procedure of the access analysis program according to the present embodiment).

ステップS101〜S106の処理については、図9に示した実施の形態1のものと同様である。ステップS107,S108の処理については後述する。   The processing in steps S101 to S106 is the same as that in the first embodiment shown in FIG. Steps S107 and S108 will be described later.

ステップS109(メッセージ復元処理の一部)において、メッセージ復元部101は、ステップS102で復元したHTTPリクエスト401が、情報格納部103により格納された通信識別情報(後述するステップS111で格納されたものも含む)と同じ通信識別情報を含むパケット群から復元したものであり、ウェブページへのアクセスを要求するためにウェブサーバ202へ送信されたHTTPリクエスト401(第2メッセージ)であるかどうかを処理装置151により判定する。具体的には、メッセージ復元部101は、ステップS102でHTTPリクエスト401を復元する元となったパケット群に含まれるIPアドレスやクッキー情報が、データベース(ユーザIDテーブル)に格納済のものと一致するかどうかを判定する。IPアドレスやクッキー情報が格納済のものと一致すれば、ステップS110に進み、一致しなければ、ステップS111に進む。   In step S109 (part of the message restoration process), the message restoration unit 101 determines that the HTTP request 401 restored in step S102 is the communication identification information stored in the information storage unit 103 (the one stored in step S111 described later). The processing apparatus determines whether or not the HTTP request 401 (second message) is restored to the web server 202 to request access to the web page. 151. Specifically, the message restoration unit 101 matches the IP address and cookie information included in the packet group from which the HTTP request 401 is restored in step S102 with those already stored in the database (user ID table). Determine whether or not. If the IP address and cookie information match those already stored, the process proceeds to step S110, and if not, the process proceeds to step S111.

ステップS110(アクセス情報記録処理)において、アクセス情報記録部105は、情報格納部103により格納されたユーザ識別情報(後述するステップS111で格納されたものも含む)のうち、ステップS102でHTTPリクエスト401を復元する元となったパケット群に含まれる通信識別情報と同じ通信識別情報と対応するユーザ識別情報を処理装置151により取得する。そして、アクセス情報記録部105は、アクセスログ格納部104により格納されたアクセスログ(後述するステップS112で格納されたものも含む)のうち、取得したユーザ識別情報に対応するアクセスログに、ステップS102でメッセージ復元部101により復元されたHTTPリクエスト401(第2メッセージ)によって要求されたウェブページへのアクセスを示すアクセス情報を処理装置151により記録する。具体的には、アクセス情報記録部105は、ステップS102でHTTPリクエスト401を復元する元となったパケット群に含まれるIPアドレスやクッキー情報に対応するユーザIDをデータベース(ユーザIDテーブル)から取得する。そして、アクセス情報記録部105は、取得したユーザIDに対応するアクセスログに、ステップS102でメッセージ復元部101により復元されたHTTPリクエスト401(第2メッセージ)に含まれるURLデータ411が示すURL321等を記録する。その後、ステップS101に戻る。   In step S110 (access information recording process), the access information recording unit 105 includes HTTP request 401 in step S102 among the user identification information stored in the information storage unit 103 (including information stored in step S111 described later). The processing device 151 acquires the user identification information corresponding to the same communication identification information as the communication identification information included in the packet group from which the data is restored. Then, the access information recording unit 105 adds the access log corresponding to the acquired user identification information among the access logs stored in the access log storage unit 104 (including those stored in step S112 described later) in step S102. Then, the processing device 151 records access information indicating access to the web page requested by the HTTP request 401 (second message) restored by the message restoration unit 101. Specifically, the access information recording unit 105 acquires, from the database (user ID table), the user ID corresponding to the IP address and cookie information included in the packet group from which the HTTP request 401 is restored in step S102. . Then, the access information recording unit 105 adds the URL 321 indicated by the URL data 411 included in the HTTP request 401 (second message) restored by the message restoration unit 101 in step S102 to the access log corresponding to the acquired user ID. Record. Then, it returns to step S101.

ステップS111(情報格納処理の一部)において、情報格納部103は、ステップS102でメッセージ復元部101により復元されたHTTPリクエスト401をメッセージ復元部101が復元する元となったパケット群に含まれる通信識別情報を処理装置151により取得する。また、情報格納部103は、仮の通信識別情報を新たに処理装置151により生成する。そして、情報格納部103は、取得した通信識別情報と、生成した仮のユーザ識別情報とを対応付けて記憶装置152に格納する。具体的には、情報格納部103は、通信識別情報として、IPアドレスやクッキー情報を取得して、記憶装置152に実装されたデータベース(ユーザIDテーブル)に格納する。そして、情報格納部103は、IPアドレスやクッキー情報に対応するユーザIDとして、新たに生成した仮のユーザIDを当該データベースに格納する。なお、仮のユーザIDの代わりに、ユーザIDとは異なる形式の識別子を用いてもよい。この場合、その識別子として、IPアドレスやクッキー情報をそのまま用いてもよい。   In step S111 (part of the information storage process), the information storage unit 103 includes a communication included in the packet group from which the message restoration unit 101 restores the HTTP request 401 restored by the message restoration unit 101 in step S102. The identification information is acquired by the processing device 151. In addition, the information storage unit 103 newly generates temporary communication identification information by the processing device 151. Then, the information storage unit 103 stores the acquired communication identification information and the generated temporary user identification information in the storage device 152 in association with each other. Specifically, the information storage unit 103 acquires an IP address and cookie information as communication identification information and stores them in a database (user ID table) mounted on the storage device 152. Then, the information storage unit 103 stores the newly generated temporary user ID in the database as a user ID corresponding to the IP address or cookie information. Instead of the temporary user ID, an identifier having a format different from the user ID may be used. In this case, the IP address or cookie information may be used as it is as the identifier.

ステップS112(アクセスログ格納処理の一部)において、アクセスログ格納部104は、ステップS111で情報格納部103により格納された仮のユーザ識別情報に対応付けて新たなアクセスログ(アクセス履歴情報)を記憶装置152に格納する。具体的には、アクセスログ格納部104は、ステップS111でデータベース(ユーザIDテーブル)に格納されたユーザIDに対応するアクセスログとして、ステップS102でメッセージ復元部101により復元されたHTTPリクエスト401に含まれるURLデータ411が示すURL321等を記録したデータを記憶装置152に格納する。その後、ステップS101に戻る。   In step S112 (part of the access log storage process), the access log storage unit 104 creates a new access log (access history information) in association with the temporary user identification information stored by the information storage unit 103 in step S111. Store in the storage device 152. Specifically, the access log storage unit 104 is included in the HTTP request 401 restored by the message restoration unit 101 in step S102 as an access log corresponding to the user ID stored in the database (user ID table) in step S111. Data in which the URL 321 indicated by the URL data 411 to be recorded is stored in the storage device 152. Then, it returns to step S101.

なお、ステップS112において、アクセスログ格納部104が、HTTPリクエスト401に基づいてアクセスログを生成する代わりに、そのHTTPリクエスト401に対応するHTTPレスポンス402に基づいてアクセスログを生成してもよい。この場合、アクセスログ格納部104は、ステップS102でメッセージ復元部101により復元されたHTTPリクエスト401に対応するHTTPレスポンス402がユーザ端末201に送信され、メッセージ復元部101により復元されるまで待機する。そして、アクセスログ格納部104は、そのHTTPレスポンス402にページデータ412が含まれるウェブページのURL321等を記録したデータを、アクセスログとして記憶装置152に格納する。   In step S 112, the access log storage unit 104 may generate an access log based on an HTTP response 402 corresponding to the HTTP request 401 instead of generating an access log based on the HTTP request 401. In this case, the access log storage unit 104 waits until the HTTP response 402 corresponding to the HTTP request 401 restored by the message restoration unit 101 in step S102 is transmitted to the user terminal 201 and restored by the message restoration unit 101. Then, the access log storage unit 104 stores the data in which the URL 321 or the like of the web page including the page data 412 in the HTTP response 402 is recorded in the storage device 152 as an access log.

本実施の形態では、ステップS107(情報格納処理の一部)において、情報格納部103は、ステップS102でメッセージ復元部101により復元されたHTTPレスポンス402に対応するHTTPリクエスト401(第1メッセージ)をメッセージ復元部101が復元する元となったパケット群に含まれる通信識別情報を処理装置151により取得する。本実施の形態では、取得した通信識別情報を既に仮のユーザ識別情報と対応付けて記憶装置152に格納している場合、情報格納部103は、その仮のユーザ識別情報を、情報取得部102により取得されたユーザ識別情報に変更する。具体的には、情報格納部103は、IPアドレスやクッキー情報を取得すると、取得したIPアドレスやクッキー情報を仮のユーザIDと対応付けてデータベース(ユーザIDテーブル)に格納済かどうかを処理装置151により確認する。そして、格納済であれば、情報格納部103は、その仮のユーザIDを、情報取得部102により記憶装置152に仮データとして格納されているユーザIDで上書きする。このとき、記憶装置152に仮データとして格納したユーザIDは削除する。なお、情報格納部103は、取得したIPアドレスやクッキー情報をデータベースに未だ格納していなければ、実施の形態1と同様に動作する。   In the present embodiment, in step S107 (part of the information storage process), the information storage unit 103 sends an HTTP request 401 (first message) corresponding to the HTTP response 402 restored by the message restoration unit 101 in step S102. The processing device 151 acquires communication identification information included in the packet group from which the message restoration unit 101 restores. In the present embodiment, when the acquired communication identification information is already stored in the storage device 152 in association with the temporary user identification information, the information storage unit 103 stores the temporary user identification information in the information acquisition unit 102. To the user identification information acquired by Specifically, when the information storage unit 103 acquires an IP address and cookie information, the processing device determines whether the acquired IP address and cookie information are stored in a database (user ID table) in association with a temporary user ID. 151 to confirm. If stored, the information storage unit 103 overwrites the temporary user ID with the user ID stored as temporary data in the storage device 152 by the information acquisition unit 102. At this time, the user ID stored as temporary data in the storage device 152 is deleted. Note that the information storage unit 103 operates in the same manner as in the first embodiment if the acquired IP address and cookie information are not yet stored in the database.

ステップS107で情報格納部103が仮のユーザ識別情報を、情報取得部102により取得されたユーザ識別情報に変更した場合、ステップS108(アクセスログ格納処理の一部)において、アクセスログ格納部104は、アクセスログ格納部104により格納されたアクセスログのうち、当該仮のユーザ識別情報に対応するアクセスログを、変更後のユーザ識別情報に対応するアクセスログとして記憶装置152に改めて格納する。具体的には、アクセスログ格納部104は、ステップS107で仮のユーザIDが正式なユーザIDで上書きされた場合、当該仮のユーザIDに対応するアクセスログを当該正式なユーザIDに対応するアクセスログに変換し(移行させ)、変換後のアクセスログに、ステップS102でメッセージ復元部101により復元されたHTTPレスポンス402にページデータ412が含まれるウェブページ312のURL321等を記録する。その後、ステップS101に戻る。   If the information storage unit 103 changes the temporary user identification information to the user identification information acquired by the information acquisition unit 102 in step S107, the access log storage unit 104 in step S108 (part of the access log storage process) Of the access logs stored by the access log storage unit 104, the access log corresponding to the temporary user identification information is stored again in the storage device 152 as the access log corresponding to the changed user identification information. Specifically, when the temporary user ID is overwritten with the formal user ID in step S107, the access log storage unit 104 accesses the access log corresponding to the temporary user ID corresponding to the formal user ID. The log is converted (migrated), and the URL 321 and the like of the web page 312 in which the page data 412 is included in the HTTP response 402 restored by the message restoration unit 101 in step S102 are recorded in the converted access log. Then, it returns to step S101.

上記のように、本実施の形態では、アクセス解析装置100において、アクセス情報記録部105が、ユーザIDを含み、認証を要求するためのHTTPリクエスト401(第1メッセージ)より後にウェブサーバ202へ送信されたHTTPリクエスト401だけでなく、ユーザIDを含み、認証を要求するためのHTTPリクエスト401(第1メッセージ)より前にウェブサーバ202へ送信されたHTTPリクエスト401についても、通信識別情報が同じHTTPリクエスト401(第2メッセージ)を処理対象とする。これにより、本実施の形態では、実施の形態1と比べて、訪問者の行動をより多く記録することが可能となる。   As described above, in the present embodiment, in the access analysis apparatus 100, the access information recording unit 105 includes the user ID and transmits it to the web server 202 after the HTTP request 401 (first message) for requesting authentication. The HTTP request 401 including the user ID and transmitted to the web server 202 prior to the HTTP request 401 (first message) for requesting the authentication is not limited to the HTTP request 401 that has been transmitted, but has the same communication identification information. The request 401 (second message) is to be processed. Thereby, in this Embodiment, compared with Embodiment 1, it becomes possible to record more visitor's actions.

以上説明したように、本実施の形態では、アクセス解析装置100が、以下のようにログイン前のユーザのアクセス情報もアクセスログに書き込む。   As described above, in the present embodiment, the access analysis apparatus 100 also writes the access information of the user before login in the access log as follows.

ユーザ端末201がウェブサーバ202にアクセスすると、アクセス解析装置100は、IPアドレスやクッキー情報を捕捉し、ユーザIDテーブルに仮データとして書き込む。このとき、アクセス解析装置100は、ダミーのユーザIDを設定し、このユーザIDとともに、IPアドレス、ユーザエージェント情報、クッキー情報等をユーザIDテーブルに保持してもよい。アクセス解析装置100は、IPアドレスやクッキー情報、あるいは、ダミーのユーザIDに対応するアクセスログにアクセス情報を書き込む。その後、訪問者識別情報を取得できた場合、アクセス解析装置100は、既にアクセス情報を書き込んだアクセスログを、実際のユーザIDに対応するアクセスログに変更する。   When the user terminal 201 accesses the web server 202, the access analysis apparatus 100 captures the IP address and cookie information and writes them as temporary data in the user ID table. At this time, the access analysis apparatus 100 may set a dummy user ID, and may hold an IP address, user agent information, cookie information, and the like together with the user ID in the user ID table. The access analysis device 100 writes the access information in the access log corresponding to the IP address, cookie information, or dummy user ID. Thereafter, when the visitor identification information can be acquired, the access analysis apparatus 100 changes the access log in which the access information has already been written to an access log corresponding to the actual user ID.

このように、本実施の形態に係るアクセス解析装置100は、ユーザがログインする前から当該ユーザのアクセスログを記録することができるため、より詳しいアクセス解析を行うことが可能となる。   As described above, the access analysis apparatus 100 according to the present embodiment can record the access log of the user before the user logs in, and thus can perform more detailed access analysis.

以上、本発明の実施の形態について説明したが、これらのうち、2つ以上の実施の形態を組み合わせて実施しても構わない。あるいは、これらのうち、1つの実施の形態を部分的に実施しても構わない。あるいは、これらのうち、2つ以上の実施の形態を部分的に組み合わせて実施しても構わない。   As mentioned above, although embodiment of this invention was described, you may implement combining 2 or more embodiment among these. Alternatively, one of these embodiments may be partially implemented. Or you may implement combining two or more embodiment among these partially.

100 アクセス解析装置、101 メッセージ復元部、102 情報取得部、103 情報格納部、104 アクセスログ格納部、105 アクセス情報記録部、106 アクセス解析部、151 処理装置、152 記憶装置、153 入力装置、154 出力装置、201 ユーザ端末、202 ウェブサーバ、203 インターネット、204 ネットワーク機器、205 パケットキャプチャ装置、211,212 IPパケット、301 ウェブブラウザ画面、311,312,313 ウェブページ、321 URL、322,326 特定の文字列、323 メニュー、324 リンク、325 名前、401 HTTPリクエスト、402 HTTPレスポンス、411 URLデータ、412 ページデータ、413,416 特定の表示データ、414 認証データ、415 名前データ、901 LCD、902 キーボード、903 マウス、904 FDD、905 CDD、906 プリンタ、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 HDD、921 オペレーティングシステム、922 ウィンドウシステム、923 プログラム群、924 ファイル群。   DESCRIPTION OF SYMBOLS 100 Access analysis apparatus, 101 Message restoration part, 102 Information acquisition part, 103 Information storage part, 104 Access log storage part, 105 Access information recording part, 106 Access analysis part, 151 Processing apparatus, 152 Storage apparatus, 153 Input apparatus, 154 Output device, 201 User terminal, 202 Web server, 203 Internet, 204 Network device, 205 Packet capture device, 211, 212 IP packet, 301 Web browser screen, 311, 312, 313 Web page, 321 URL, 322, 326 Specific Character string, 323 menu, 324 link, 325 name, 401 HTTP request, 402 HTTP response, 411 URL data, 412 page data, 413, 416 Specific display data 414 Authentication data, 415 Name data, 901 LCD, 902 Keyboard, 903 Mouse, 904 FDD, 905 CDD, 906 Printer, 911 CPU, 912 Bus, 913 ROM, 914 RAM, 915 Communication board, 920 HDD, 921 Operating System, 922 window system, 923 programs, 924 files.

Claims (11)

複数のユーザ端末と各ユーザ端末にウェブページを配信するウェブサーバとの間で送受信されるパケットを収集して保存するパケットキャプチャ装置から、個別のユーザ端末と前記ウェブサーバとの通信を識別するための通信識別情報を含むパケット群であって、ウェブページの送受信のために用いられるHTTP(ハイパーテキスト転送プロトコル)メッセージを載せたパケット群を順次取得し、取得したパケット群から当該HTTPメッセージを処理装置により復元するメッセージ復元部と、
個別のユーザを識別するためのユーザ識別情報を含むHTTPメッセージであって、認証を要求するために前記ウェブサーバへ送信されたHTTPメッセージである第1メッセージが前記メッセージ復元部により復元された場合、前記第1メッセージに含まれるユーザ識別情報を処理装置により取得する情報取得部と、
前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージが前記メッセージ復元部により復元された場合、前記メッセージ復元部が前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を処理装置により取得し、取得した通信識別情報と前記情報取得部により取得されたユーザ識別情報とを対応付けて記憶装置に格納する情報格納部と、
前記情報格納部により格納されたユーザ識別情報ごとに、ユーザ識別情報によって識別されるユーザのアクセスログを記憶装置に格納するアクセスログ格納部と、
前記情報格納部により格納された通信識別情報と同じ通信識別情報を含むパケット群から、ウェブページへのアクセスを要求するために前記ウェブサーバへ送信されたHTTPメッセージである第2メッセージが前記メッセージ復元部により復元された場合、前記情報格納部により当該通信識別情報と対応付けて格納されたユーザ識別情報に対応する、前記アクセスログ格納部により格納されたアクセスログに、前記第2メッセージによって要求されたウェブページへのアクセスを示すアクセス情報を処理装置により記録するアクセス情報記録部と
を備えることを特徴とするアクセス解析装置。
To identify communications between individual user terminals and the web server from a packet capture device that collects and stores packets transmitted and received between a plurality of user terminals and a web server that distributes web pages to each user terminal Packet group including communication identification information of the above, and sequentially acquiring a packet group carrying an HTTP (Hypertext Transfer Protocol) message used for transmission / reception of a web page, and processing the HTTP message from the acquired packet group A message restoration unit to restore by
When the message restoration unit restores the first message, which is an HTTP message including user identification information for identifying an individual user, and is an HTTP message transmitted to the web server to request authentication, An information acquisition unit for acquiring user identification information included in the first message by a processing device;
When an HTTP message transmitted from the web server to notify the success of authentication requested by the first message is restored by the message restoration unit, the message restoration unit restores the first message; An information storage unit that acquires the communication identification information included in the packet group that has been acquired by the processing device, and stores the acquired communication identification information in association with the user identification information acquired by the information acquisition unit in the storage device;
For each user identification information stored by the information storage unit, an access log storage unit that stores a user access log identified by the user identification information in a storage device;
A second message which is an HTTP message transmitted to the web server to request access to a web page from a packet group including the same communication identification information as the communication identification information stored by the information storage unit is the message restoration. The access log stored by the access log storage unit corresponding to the user identification information stored in association with the communication identification information by the information storage unit is requested by the second message. And an access information recording unit that records access information indicating access to the web page by the processing device.
前記アクセス情報記録部は、前記第1メッセージより前に前記ウェブサーバへ送信されたHTTPメッセージと、前記第1メッセージより後に前記ウェブサーバへ送信されたHTTPメッセージとの両方について、前記第2メッセージに該当するHTTPメッセージを処理対象とすることを特徴とする請求項1のアクセス解析装置。   The access information recording unit includes the second message for both the HTTP message transmitted to the web server before the first message and the HTTP message transmitted to the web server after the first message. The access analysis apparatus according to claim 1, wherein a corresponding HTTP message is a processing target. 前記通信識別情報は、IP(インターネットプロトコル)アドレスとクッキー情報との少なくともいずれかを含むことを特徴とする請求項1又は2のアクセス解析装置。   The access analysis apparatus according to claim 1 or 2, wherein the communication identification information includes at least one of an IP (Internet Protocol) address and cookie information. 前記情報格納部は、前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージが前記メッセージ復元部により復元された場合であって、前記情報取得部により取得されたユーザ識別情報が前記情報格納部により既に格納されている場合、前記メッセージ復元部が前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を取得し、取得した通信識別情報と、前記情報格納部により当該ユーザ識別情報と対応付けて既に格納されている通信識別情報とが異なっていれば、前記情報格納部により既に格納されている通信識別情報を、取得した通信識別情報で更新することを特徴とする請求項1から3のいずれかのアクセス解析装置。The information storage unit is a case where an HTTP message transmitted from the web server to notify the success of authentication requested by the first message is restored by the message restoration unit, and the information acquisition unit When the acquired user identification information is already stored by the information storage unit, the message recovery unit acquires the communication identification information included in the packet group from which the first message is recovered, and acquires the acquired communication. If the identification information is different from the communication identification information already stored in association with the user identification information by the information storage unit, the communication identification information already stored by the information storage unit is acquired. 4. The access analysis device according to claim 1, wherein the access analysis device is updated with identification information. 前記情報格納部は、ユーザ識別情報を含まない、前記ウェブサーバへ送信されたHTTPメッセージが前記メッセージ復元部により復元された場合、当該HTTPメッセージを復元する元となったパケット群に含まれる通信識別情報を処理装置により取得し、取得した通信識別情報と仮のユーザ識別情報とを対応付けて記憶装置に格納し、その後、前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージが前記メッセージ復元部により復元された場合、前記メッセージ復元部が前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を取得し、取得した通信識別情報が前記情報格納部により前記仮のユーザ識別情報と対応付けて既に格納されていれば、前記仮のユーザ識別情報を、前記情報取得部により取得されたユーザ識別情報で更新することを特徴とする請求項1から4のいずれかのアクセス解析装置。The information storage unit does not include user identification information, and when the HTTP message transmitted to the web server is restored by the message restoration unit, the communication identification included in the packet group from which the HTTP message is restored The information is acquired by the processing device, the acquired communication identification information and temporary user identification information are stored in the storage device in association with each other, and then the web is sent to notify the success of the authentication requested by the first message. When the HTTP message transmitted from the server is restored by the message restoration unit, the message restoration unit obtains communication identification information included in the packet group from which the first message is restored, and the obtained communication identification If information is already stored in association with the temporary user identification information by the information storage unit, User identification information Kikari, any access analyzing apparatus 4 from claim 1, characterized in that updating the user identification information acquired by the information acquisition unit. コンピュータの処理装置が、複数のユーザ端末と各ユーザ端末にウェブページを配信するウェブサーバとの間で送受信されるパケットを収集して保存するパケットキャプチャ装置から、個別のユーザ端末と前記ウェブサーバとの通信を識別するための通信識別情報を含むパケット群であって、ウェブページの送受信のために用いられるHTTP(ハイパーテキスト転送プロトコル)メッセージを載せたパケット群を順次取得し、取得したパケット群から当該HTTPメッセージを復元し、
コンピュータの処理装置が、個別のユーザを識別するためのユーザ識別情報を含むHTTPメッセージであって、認証を要求するために前記ウェブサーバへ送信されたHTTPメッセージである第1メッセージを復元した場合、前記第1メッセージに含まれるユーザ識別情報を取得し、
コンピュータの処理装置が、前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージを復元した場合、前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を取得し、コンピュータの記憶装置が、取得された通信識別情報とユーザ識別情報とを対応付けて格納し、
コンピュータの記憶装置が、格納したユーザ識別情報ごとに、ユーザ識別情報によって識別されるユーザのアクセスログを格納し、
コンピュータの処理装置が、格納された通信識別情報と同じ通信識別情報を含むパケット群から、ウェブページへのアクセスを要求するために前記ウェブサーバへ送信されたHTTPメッセージである第2メッセージを復元した場合、当該通信識別情報と対応付けて格納されたユーザ識別情報に対応するアクセスログに、前記第2メッセージによって要求されたウェブページへのアクセスを示すアクセス情報を記録する
ことを特徴とするアクセス解析方法。
A processing device of a computer collects and stores packets transmitted and received between a plurality of user terminals and a web server that distributes web pages to each user terminal, from an individual user terminal and the web server A packet group including communication identification information for identifying the communication of the packet, and sequentially acquiring a packet group carrying an HTTP (Hypertext Transfer Protocol) message used for transmission / reception of a web page, from the acquired packet group Restore the HTTP message,
When the computer processing apparatus restores a first message that is an HTTP message including user identification information for identifying an individual user and is an HTTP message transmitted to the web server to request authentication, Obtaining user identification information included in the first message;
When the processing device of the computer restores the HTTP message transmitted from the web server in order to notify the success of the authentication requested by the first message, the packet group from which the first message is restored The communication identification information included is acquired, and the storage device of the computer stores the acquired communication identification information and user identification information in association with each other,
A storage device of the computer stores a user access log identified by the user identification information for each stored user identification information,
The processing device of the computer restored the second message, which is an HTTP message sent to the web server in order to request access to the web page, from the packet group including the same communication identification information as the stored communication identification information. In this case, access information indicating access to the web page requested by the second message is recorded in an access log corresponding to the user identification information stored in association with the communication identification information. Method.
複数のユーザ端末と各ユーザ端末にウェブページを配信するウェブサーバとの間で送受信されるパケットを収集して保存するパケットキャプチャ装置から、個別のユーザ端末と前記ウェブサーバとの通信を識別するための通信識別情報を含むパケット群であって、ウェブページの送受信のために用いられるHTTP(ハイパーテキスト転送プロトコル)メッセージを載せたパケット群を順次取得し、取得したパケット群から当該HTTPメッセージを処理装置により復元するメッセージ復元処理と、
個別のユーザを識別するためのユーザ識別情報を含むHTTPメッセージであって、認証を要求するために前記ウェブサーバへ送信されたHTTPメッセージである第1メッセージが前記メッセージ復元処理により復元された場合、前記第1メッセージに含まれるユーザ識別情報を処理装置により取得する情報取得処理と、
前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージが前記メッセージ復元処理により復元された場合、前記メッセージ復元処理が前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を処理装置により取得し、取得した通信識別情報と前記情報取得処理により取得されたユーザ識別情報とを対応付けて記憶装置に格納する情報格納処理と、
前記情報格納処理により格納されたユーザ識別情報ごとに、ユーザ識別情報によって識別されるユーザのアクセスログを記憶装置に格納するアクセスログ格納処理と、
前記情報格納処理により格納された通信識別情報と同じ通信識別情報を含むパケット群から、ウェブページへのアクセスを要求するために前記ウェブサーバへ送信されたHTTPメッセージである第2メッセージが前記メッセージ復元処理により復元された場合、前記情報格納処理により当該通信識別情報と対応付けて格納されたユーザ識別情報に対応する、前記アクセスログ格納処理により格納されたアクセスログに、前記第2メッセージによって要求されたウェブページへのアクセスを示すアクセス情報を処理装置により記録するアクセス情報記録処理と
をコンピュータに実行させることを特徴とするアクセス解析プログラム。
To identify communications between individual user terminals and the web server from a packet capture device that collects and stores packets transmitted and received between a plurality of user terminals and a web server that distributes web pages to each user terminal Packet group including communication identification information of the above, and sequentially acquiring a packet group carrying an HTTP (Hypertext Transfer Protocol) message used for transmission / reception of a web page, and processing the HTTP message from the acquired packet group Message restoration process restored by
When an HTTP message including user identification information for identifying an individual user and the first message that is an HTTP message transmitted to the web server to request authentication is restored by the message restoration process, Information acquisition processing for acquiring user identification information included in the first message by a processing device;
When an HTTP message transmitted from the web server to notify the success of authentication requested by the first message is restored by the message restoration process, the message restoration process restores the first message; An information storage process for acquiring communication identification information included in the packet group, and storing the acquired communication identification information in association with the user identification information acquired by the information acquisition process in a storage device;
For each user identification information stored by the information storage process, an access log storage process for storing an access log of a user identified by the user identification information in a storage device;
A second message which is an HTTP message transmitted to the web server to request access to a web page from a packet group including the same communication identification information as the communication identification information stored by the information storing process is the message restoration. When restored by the process, the access log stored by the access log storage process corresponding to the user identification information stored in association with the communication identification information by the information storage process is requested by the second message. An access analysis program for causing a computer to execute access information recording processing for recording access information indicating access to a web page by a processing device.
前記アクセス情報記録処理は、前記第1メッセージより前に前記ウェブサーバへ送信されたHTTPメッセージと、前記第1メッセージより後に前記ウェブサーバへ送信されたHTTPメッセージとの両方について、前記第2メッセージに該当するHTTPメッセージを処理対象とすることを特徴とする請求項のアクセス解析プログラム。 In the access information recording process, both the HTTP message transmitted to the web server before the first message and the HTTP message transmitted to the web server after the first message are included in the second message. 8. The access analysis program according to claim 7 , wherein the corresponding HTTP message is a processing target. 前記通信識別情報は、IP(インターネットプロトコル)アドレスとクッキー情報との少なくともいずれかを含むことを特徴とする請求項又はのアクセス解析プログラム。 It said communication identification information, IP (Internet Protocol) according to claim 7 or 8 access analysis program, characterized in that it comprises at least one of the address and cookie information. 前記情報格納処理は、前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージが前記メッセージ復元処理により復元された場合であって、前記情報取得処理により取得されたユーザ識別情報が前記情報格納処理により既に格納されている場合、前記メッセージ復元処理が前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を取得し、取得した通信識別情報と、前記情報格納処理により当該ユーザ識別情報と対応付けて既に格納されている通信識別情報とが異なっていれば、前記情報格納処理により既に格納されている通信識別情報を、取得した通信識別情報で更新することを特徴とする請求項7から9のいずれかのアクセス解析プログラム。The information storage process is a case where an HTTP message transmitted from the web server to notify the success of the authentication requested by the first message is restored by the message restoration process, and the information acquisition process If the acquired user identification information is already stored by the information storage process, the message recovery process acquires the communication identification information included in the packet group from which the first message is recovered, and acquires the acquired communication. If the identification information is different from the communication identification information already stored in association with the user identification information by the information storage process, the communication identification information already stored by the information storage process is acquired. The access analysis program according to claim 7, wherein the access analysis program is updated with identification information. 前記情報格納処理は、ユーザ識別情報を含まない、前記ウェブサーバへ送信されたHTTPメッセージが前記メッセージ復元処理により復元された場合、当該HTTPメッセージを復元する元となったパケット群に含まれる通信識別情報を処理装置により取得し、取得した通信識別情報と仮のユーザ識別情報とを対応付けて記憶装置に格納し、その後、前記第1メッセージによって要求された認証の成功を通知するために前記ウェブサーバから送信されたHTTPメッセージが前記メッセージ復元処理により復元された場合、前記メッセージ復元処理が前記第1メッセージを復元する元となったパケット群に含まれる通信識別情報を取得し、取得した通信識別情報が前記情報格納処理により前記仮のユーザ識別情報と対応付けて既に格納されていれば、前記仮のユーザ識別情報を、前記情報取得処理により取得されたユーザ識別情報で更新することを特徴とする請求項7から10のいずれかのアクセス解析プログラム。In the information storage process, when the HTTP message transmitted to the web server that does not include user identification information is restored by the message restoration process, the communication identification included in the packet group that is the origin of restoring the HTTP message The information is acquired by the processing device, the acquired communication identification information and temporary user identification information are stored in the storage device in association with each other, and then the web is sent to notify the success of the authentication requested by the first message. When the HTTP message transmitted from the server is restored by the message restoration process, the message restoration process obtains communication identification information included in the packet group from which the first message is restored, and the obtained communication identification Information has already been stored in association with the temporary user identification information by the information storage process. Put it, the user identification information of the temporary, any access analysis program according to claim 7 to 10, characterized in that updating the user identification information acquired by the information acquisition process.
JP2010218969A 2010-09-29 2010-09-29 Access analysis device, access analysis method, and access analysis program Expired - Fee Related JP5709448B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010218969A JP5709448B2 (en) 2010-09-29 2010-09-29 Access analysis device, access analysis method, and access analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010218969A JP5709448B2 (en) 2010-09-29 2010-09-29 Access analysis device, access analysis method, and access analysis program

Publications (2)

Publication Number Publication Date
JP2012073878A JP2012073878A (en) 2012-04-12
JP5709448B2 true JP5709448B2 (en) 2015-04-30

Family

ID=46169969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010218969A Expired - Fee Related JP5709448B2 (en) 2010-09-29 2010-09-29 Access analysis device, access analysis method, and access analysis program

Country Status (1)

Country Link
JP (1) JP5709448B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014182055A1 (en) * 2013-05-07 2014-11-13 주식회사 시맨틱렙홀딩스 System and method for providing object information
JP6275481B2 (en) * 2013-12-27 2018-02-07 株式会社堀場製作所 Analytical apparatus and reagent deterioration degree calculation method
KR101500704B1 (en) * 2014-10-08 2015-03-10 주식회사 넷스루 Method and apparatus for detecting session of vistor
CN107659602B (en) * 2016-07-26 2020-12-29 株式会社理光 Method, device and system for associating user access records
JP6811639B2 (en) * 2017-02-20 2021-01-13 三菱スペース・ソフトウエア株式会社 File monitoring device and file monitoring program
CN112351090B (en) * 2020-10-29 2024-04-05 深圳Tcl新技术有限公司 Log information transmission method and device based on intelligent large screen and storage medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4166093B2 (en) * 2003-01-09 2008-10-15 東芝テック株式会社 Information storage system and information storage service method
JP2005234689A (en) * 2004-02-17 2005-09-02 Hitachi Ltd Community evaluation support method and apparatus
JP5178219B2 (en) * 2008-01-31 2013-04-10 三菱スペース・ソフトウエア株式会社 Access analysis device, access analysis method, and access analysis program

Also Published As

Publication number Publication date
JP2012073878A (en) 2012-04-12

Similar Documents

Publication Publication Date Title
US7343559B1 (en) Computer-readable recorded medium on which image file is recorded, device for producing the recorded medium, medium on which image file creating program is recorded, device for transmitting image file, device for processing image file, and medium on which image file processing program is recorded
US8645453B2 (en) Method and system of processing cookies across domains
TWI424708B (en) Reduced traceability electronic message system and method
JP5709448B2 (en) Access analysis device, access analysis method, and access analysis program
US8560669B2 (en) Tracking identifier synchronization
JP5178219B2 (en) Access analysis device, access analysis method, and access analysis program
KR102504075B1 (en) Matching and attributes of user device events
US11610182B2 (en) System and method for electronic lead verification
JP2007249657A (en) Access limiting program, access limiting method and proxy server device
CN110580318B (en) Information display method, device and storage medium
WO2017219733A1 (en) Method and device for responding to request
US9521034B2 (en) Method and apparatus for generating resource address, and system thereof
RU2272318C2 (en) Computer-readable data carrier, on which image file is recorded, device for making a data carrier, carrier on which program is recorded for forming an image file, device for transferring image file, device for processing image file and carrier, on which program for processing an image file is recorded
JP3520264B2 (en) Authentication information input system, authentication information storage system, authentication information input method and authentication information input program
CN108322420A (en) The detection method and device of backdoor file
US20080215794A1 (en) Storage terminal and information processing system
CN110866196A (en) Printer network information acquisition method and device and electronic equipment
JP5640752B2 (en) Attack imitation test method, attack imitation test device, and attack imitation test program
JP5322972B2 (en) Web screen restoration device, web screen restoration method, and web screen restoration program
CN113918865A (en) Data processing method, data processing apparatus, storage medium, and electronic apparatus
JP4729089B2 (en) Website counting device and website counting program
JP2000222329A (en) Information communication system and information providing device and user attribute information collecting method and record medium
CN114301892B (en) Method, device and system for simulating Web application to realize example function
JP2011134255A (en) Web server and method
JP2022067412A (en) Advertisement distribution system, advertisement distribution program, and advertisement distribution method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140624

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150303

R150 Certificate of patent or registration of utility model

Ref document number: 5709448

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees