KR101500704B1 - Method and apparatus for detecting session of vistor - Google Patents
Method and apparatus for detecting session of vistor Download PDFInfo
- Publication number
- KR101500704B1 KR101500704B1 KR20140135999A KR20140135999A KR101500704B1 KR 101500704 B1 KR101500704 B1 KR 101500704B1 KR 20140135999 A KR20140135999 A KR 20140135999A KR 20140135999 A KR20140135999 A KR 20140135999A KR 101500704 B1 KR101500704 B1 KR 101500704B1
- Authority
- KR
- South Korea
- Prior art keywords
- web
- visitor
- session
- detected
- click stream
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
- H04L67/146—Markers for unambiguous identification of a particular session, e.g. session cookie or URL-encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/51—Discovery or management thereof, e.g. service location protocol [SLP] or web services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
Abstract
Description
본 발명은 방문자 세션 탐지 방법 및 장치에 관한 것으로, 더 상세하게는 웹 클릭 스트림 데이터 분석에서 정확한 웹 방문자 세션을 파악할 수 있도록 하는 방문자 세션 탐지 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for detecting a visitor session, and more particularly, to a method and apparatus for detecting a visitor session in a web click stream data analysis.
일반적으로 인터넷 환경은 개방형 환경으로, 불특정 다수의 방문자가 웹 서버에 접속하여 웹 서비스를 받는다. 웹 서비스를 받기 위해 동일 방문자가 웹 서버에 접속해서 사이트를 떠날 때까지를 세션이라 하고, 방문자는 하나의 세션 동안에 여러 메시지를 웹 서버에 요청할 수 있다.Generally, the Internet environment is an open environment, and an unspecified number of visitors access the web server to receive the web service. In order to receive a web service, a session is called a session until the same visitor connects to the web server and leaves the site, and the visitor can request multiple messages from the web server during one session.
이때, 웹 서버는 방문자로부터 요청된 메시지를 웹 로그 파일에 저장한다. 웹 로그 파일에는 방문자 단말기의 인터넷 주소(IP : Internet Protocol), 요청 메시지, 및 접속시간 등의 정보가 포함될 수 있다.At this time, the web server stores the requested message from the visitor in the web log file. The web log file may include information such as an Internet address (IP) of a visitor terminal, a request message, and an access time.
웹 클릭 스트림(Web Click Stream) 분석은 웹 서버에 저장된 웹 로그 파일을 분석하여, 웹 사이트를 방문한 방문자의 행동 분석, 사이트의 사용량 등에 대한 분석 결과를 도출해내는 것을 말한다.Web click stream analysis analyzes Web log files stored on a Web server and analyzes the behavior of visitors to the Web site and analyzes the usage of the site.
한편, 웹 클릭 스트림 분석에서 방문자의 세션 탐지 방법은 분석의 정확성에 많은 영향을 끼친다. 이러한 웹 클릭 스트림 분석에서는 방문자를 식별하기 위해 방문자 식별자 쿠키를 사용하고 있다. 방문자 식별자 쿠키는 웹 서버로부터 발급되는데, 동일한 방문자 식별자 쿠키의 요청은 동일한 세션으로 구분된다.On the other hand, in the Web clickstream analysis, the visitor's session detection method has a great influence on the accuracy of the analysis. In this Web clickstream analysis, a visitor identifier cookie is used to identify a visitor. The visitor identifier cookie is issued from the web server, and the request for the same visitor identifier cookie is divided into the same session.
그런데, 웹서버 로그 파일 방식에서 방문자의 첫번째 요청에는 방문자를 식별할 수 있는 방문자 식별자 쿠키가 기록되지 않기 때문에 방문자 식별자 쿠키만을 이용하여 방문자 세션을 탐지할 경우 방문자 세션이 과다 산정되어 통계에 오류가 발생하는 문제점이 있다.However, in the web server log file method, since the visitor identifier cookie that can identify the visitor is not recorded in the first request of the visitor, when the visitor session is detected using only the visitor identifier cookie, the visitor session is overestimated, .
본 발명은 웹 클릭 스트림 데이터 분석에서 정확한 웹 방문자 세션을 파악할 수 있도록 하는 방문자 세션 탐지 방법 및 장치를 제공하는데 그 목적이 있다.It is an object of the present invention to provide a method and apparatus for detecting a visitor session so that an accurate web visitor session can be grasped in web click stream data analysis.
또한, 본 발명은 방문자 식별자 쿠키와 방문자 인터넷 주소를 이용하여 방문자 세션을 정확히 탐지할 수 있는 방문자 세션 탐지 방법 및 장치를 제공하는데 그 목적이 있다.It is another object of the present invention to provide a visitor session detection method and apparatus that can accurately detect a visitor session using a visitor identifier cookie and a visitor's Internet address.
또한, 본 발명은 방문자 식별자 쿠키 없이 방문한 방문자를 정확히 탐지하므로 웹 클릭 스트림 분석 결과의 신뢰도를 향상시킬 수 있는 방문자 세션 탐지 방법 및 장치를 제공하는데 그 목적이 있다.
It is another object of the present invention to provide a visitor session detection method and apparatus capable of improving the reliability of a web click stream analysis result because it accurately detects a visitor who visited without a visitor identifier cookie.
본 발명에 의한 방문자 세션 탐지 방법은, (a) 방문자 식별자 쿠키를 설정하는 단계; (b) 처리할 로그 레코드가 있으면 웹 클릭 스트림 데이터를 불러오는 단계; 및 (c) 상기 로그 레코드에 기록된 상기 방문자 식별자 쿠키의 유무에 대응하여 상기 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하거나 상기 방문자 식별자 쿠키 및 상기 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하는 단계;를 포함한다.A visitor session detection method according to the present invention comprises the steps of: (a) setting a visitor identifier cookie; (b) retrieving web click stream data if there is a log record to process; And (c) detecting a web visitor session using the Internet address in the web click stream data corresponding to the presence or absence of the visitor identifier cookie recorded in the log record, or using the visitor identifier cookie and the internet address to access the web visitor And detecting the session.
본 발명에 의한 방문자 세션 탐지 장치는, 웹 서버의 웹 로그 파일로부터 로그 레코드를 수집하고, 수집한 상기 로그 레코드를 웹 클릭 스트림 데이터에 저장하는 수집 시스템; 및 상기 로그 레코드 분석시 상기 로그 레코드에 방문자 식별자 쿠키의 기록 유무에 대응하여 상기 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하거나 상기 방문자 식별자 쿠키 및 상기 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하는 클릭 스트림 분석 시스템;을 포함한다.A visitor session detection apparatus according to the present invention includes: a collection system for collecting log records from a web log file of a web server and storing the collected log records in web click stream data; And detecting a web visitor session using the internet address in the web click stream data in response to the presence or absence of the recording of the visitor identifier cookie in the log record when analyzing the log record or detecting the web visitor session using the visitor identifier cookie and the internet address And a click-stream analysis system for detecting a click stream.
상술한 바와 같이, 본 발명은 웹서버 로그 파일 방식으로 수집된 웹 클릭 스트림 통계 분석 시스템에서 방문자 식별자 쿠키와 방문자 인터넷 주소를 이용하여 방문자의 세션을 정확히 탐지할 수 있다.As described above, the present invention can accurately detect the visitor's session using the visitor identifier cookie and the visitor's Internet address in the web click stream statistical analysis system collected by the web server log file method.
또한, 본 발명은 방문자 식별자 쿠키가 없이 방문한 방문자를 정확히 탐지하여 웹 클릭 스트림 분석 결과의 통계 오류를 줄일 수 있으므로 분석 결과의 신뢰도를 향상시킬 수 있다.In addition, the present invention can accurately detect visitors who visit without a visitor identifier cookie, thereby reducing statistical errors of a Web click stream analysis result, thereby improving the reliability of analysis results.
도 1은 본 발명의 방문자 세션 탐지 장치의 일 실시예에 따른 블럭도이다.
도 2은 본 발명의 방문자 세션 탐지 방법의 일 실시예에 따른 흐름도이다.
도 3는 도 1의 웹 로그 파일의 생성 흐름을 설명하기 위한 흐름도이다.
도 4는 도 1의 웹 로그 파일 및 분석결과 데이터의 예시도이다.1 is a block diagram according to an embodiment of the visitor session detection apparatus of the present invention.
FIG. 2 is a flow diagram according to an embodiment of the visitor session detection method of the present invention.
3 is a flowchart for explaining the generation flow of the web log file of FIG.
4 is an exemplary view of the web log file and analysis result data of FIG.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명한다. 본 명세서 및 특허청구범위에 사용된 용어는 통상적이거나 사전적 의미로 한정되어 해석되지 아니하며, 본 발명의 기술적 사항에 부합하는 의미와 개념으로 해석되어야 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. It is to be understood that the terminology used herein is for the purpose of description and should not be interpreted as limiting the scope of the present invention.
본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 바람직한 실시예이며, 본 발명의 기술적 사상을 모두 대변하는 것이 아니므로, 본 출원 시점에서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있다.The embodiments described in the present specification and the configurations shown in the drawings are preferred embodiments of the present invention and are not intended to represent all of the technical ideas of the present invention and thus various equivalents and modifications Can be.
도 1은 본 발명의 방문자 세션 탐지 장치의 일 실시예에 따른 블럭도이다.1 is a block diagram according to an embodiment of the visitor session detection apparatus of the present invention.
도 1을 참고하면, 본 발명의 방문자 세션 탐지 장치는 수집 시스템(21), 및 클릭 스트림 분석 시스템(23)을 포함한다.Referring to FIG. 1, the visitor session detection apparatus of the present invention includes a
수집 시스템(21)은 하나 이상의 웹 서버(12)로부터 웹 로그 파일(13)을 수집한다. 구체적으로 설명하면, 웹 서버(12)는 방문자의 웹 사이트 접속에 의해 발생되는 로그 레코드를 웹 로그 파일(13)에 저장한다. 웹 로그 파일(13)에는 방문자 단말기(11)의 인터넷 주소(IP), 요청 메시지, 및 접속시간 등의 정보가 포함될 수 있다. 수집 시스템(21)은 상기와 같은 웹 서버(12)의 웹 로그 파일(13)에 저장된 모든 로그 레코드를 수집하여 웹 클릭 스트림 데이터(22)에 저장한다. 웹 로그 파일의 수집 방법에 대한 구체적인 설명은 본 실시예에서는 생략하기로 한다.The
클릭 스트림 분석 시스템(23)은 웹 사이트를 방문한 방문자의 행동 분석, 사이트의 사용량 등에 대한 분석 결과를 도출하기 위해 웹 클릭 스트림 데이터를 분석한다. 이러한 웹 클릭 스트림 분석에서 방문자의 세션 탐지 방법은 방문자의 행동 분석, 및 사이트의 사용량 분석 등의 정확성에 많은 영향을 준다. The click
본 실시예에 의한 클릭 스트림 분석 시스템(23)은 분석이 시작되면 방문자 식별자 쿠키를 설정한다. 각각의 웹 서버(12)는 서로 다른 방문자 식별자 쿠키를 사용하는데, 분석하고자는 하는 웹 서버(12)에 대응되는 방문자 식별자 쿠키를 설정한다. 일례로, 각각의 웹 서버(12)는 방문자 식별자 쿠키로 PCID, PID, 및 ID 등을 사용할 수 있다. 본 실시예에서는 방문자 식별자 쿠키로 PCID가 설정된 것을 예시로 설명한다.The click
클릭 스트림 분석 시스템(23)은 처리할 로그 레코드가 있으면 웹 클릭 스트림 데이터(22)를 불러오고, 방문자 식별자 쿠키가 로그 레코드에 기록되어 있는지 여부를 검사하며, 방문자 식별자 쿠키의 기록 유무에 대응하여 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하거나 방문자 식별자 쿠키 및 인터넷 주소를 이용하여 웹 방문자 세션을 탐지한다. The click
일례로, 로그 레코드에 방문자 식별자 쿠키의 기록이 없으면 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하고, 로그 레코드에 방문자 식별자 쿠키의 기록이 있으면 방문자 식별자 쿠키를 이용하여 웹 방문자 세션을 탐지한다. 이때, 방문자 식별자 쿠키를 이용하여 웹 방문자 세션이 탐지되지 않으면 인터넷 주소를 이용하여 웹 방문자 세션을 한번 더 탐지하도록 구성할 수 있다.For example, if there is no record of the visitor identifier cookie in the log record, the web visitor session is detected using the Internet address, and if there is a record of the visitor identifier cookie in the log record, the web visitor session is detected using the visitor identifier cookie. At this time, if the web visitor session is not detected using the visitor identifier cookie, the web visitor session may be detected once more using the internet address.
이어서, 클릭 스트림 분석 시스템(23)은 웹 방문자 세션이 탐지되지 않거나 세션이 종료(time out)된 웹 방문자 세션이 탐지된 경우에는 방문자의 첫번째 요청으로서 신규 웹 방문자 세션을 생성하여 세션 테이블에 추가한다. 일례로, 신규 웹 방문자 세션 추가시, 신규 웹 방문자 세션에 인터넷 주소, 및 방문자 식별자 쿠키 중 적어도 하나 이상을 포함하여 세션 테이블에 추가한다.The click
또한, 클릭 스트림 분석 시스템(23)은 인터넷 주소 또는 방문자 식별자 쿠키에 대응되는 웹 방문자 세션이 탐지되면 동일한 방문자의 요청으로서 탐지된 웹 방문자 세션의 정보를 변경한다. 일반적으로, 방문자 식별자 쿠키는 웹 서버로부터 발급되는데, 동일한 방문자 식별자 쿠키의 요청은 동일한 세션으로 구분된다. In addition, the
상기와 같은 클릭 스트림 분석 시스템에서의 방문자 세션 탐지 방법을 구체적으로 설명하면 다음과 같다.The visitor session detection method in the above-described click stream analysis system will be described in detail as follows.
도 2는 본 발명의 방문자 세션 탐지 방법의 일 실시예에 따른 흐름도이다.2 is a flow diagram according to an embodiment of the visitor session detection method of the present invention.
도 2를 참고하면, 먼저 방문자 식별자 쿠키를 설정한다(S1).Referring to FIG. 2, first, a visitor identifier cookie is set (S1).
이어서, 처리할 로그 레코드가 있는지 검사하고(S2), 처리할 로그 레코드가 있으면 웹 클릭 스트림 데이터(22)를 불러온다(S3). 여기서 로그 레코드가 방문자의 첫번째 요청이면 방문자 식별자 쿠키가 존재하지 않을 것이고, 두번째 요청부터는 로그 레코드에 방문자 식별자 쿠키가 기록되어 있을 것이다.Then, it is checked whether there is a log record to be processed (S2). If there is a log record to be processed, the Web
이어서, 처리할 로그 레코드에 방문자 식별자 쿠키가 기록되어 있는지 여부를 검사하며(S4), 방문자 식별자 쿠키의 기록이 없으면 인터넷 주소로 웹 클릭 스트림 데이터(22)에서 웹 방문자 세션을 탐지하고(S5), 방문자 식별자 쿠키의 기록이 있으면 방문자 식별자 쿠키로 웹 클릭 스트림 데이터(22)에서 웹 방문자 세션을 탐지한다(S6).Next, it is checked whether a visitor identifier cookie is recorded in the log record to be processed (S4). If there is no recording of the visitor identifier cookie, a web visitor session is detected from the web
일례로, 로그 레코드에 방문자 식별자 쿠키의 기록이 없으면 웹 클릭 스트림 데이터(22)의 웹 방문자 세션들을 모아 놓은 세션 테이블에서 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하고, 로그 레코드에 방문자 식별자 쿠키의 기록이 있으면 방문자 식별자 쿠키를 이용하여 웹 클릭 스트림 데이터(22)의 세션 테이블에서 웹 방문자 세션을 탐지한다.For example, if there is no record of the visitor identifier cookie in the log record, a web visitor session is detected using the internet address in the session table of the web visitor sessions of the web
이어서, 웹 클릭 스트림 데이터(22)에서 탐지하고자 하는 웹 방문자 세션이 있는지를 검사한다(S7,S8). 이때, 방문자 식별자 쿠키를 이용하여 웹 방문자 세션이 탐지되지 않으면 인터넷 주소를 이용하여 웹 방문자 세션을 탐지한다(S5).Then, it is checked whether there is a web visitor session to be detected in the web click stream data 22 (S7, S8). At this time, if a web visitor session is not detected using the visitor identifier cookie, a web visitor session is detected using the Internet address (S5).
이어서, 탐지된 웹 방문자 세션이 있으면 세션 종료(time out)가 발생했는지를 검사한다(S9).Then, if there is a detected web visitor session, it is checked whether a timeout occurs (S9).
이때, 웹 방문자 세션이 탐지되지 않거나 종료(time out)된 웹 방문자 세션이 탐지되면 신규 웹 방문자 세션을 생성하여 세션 테이블에 추가한다(S10). 세션 테이블에 추가시 인터넷 주소, 및 방문자 식별자 쿠키 중 적어도 하나 이상을 신규 웹 방문자 세션에 포함하여 추가한다. 그리고, 종료되지 않은 웹 방문자 세션이 탐지되면 탐지된 웹 방문자 세션의 정보를 변경한다(S11). 웹 방문자 세션의 정보에는 방문자가 웹 사이트를 방문한 방문시간, 및 웹 사이트에서 방문자가 요청한 요청 메시지 등이 포함될 수 있다.At this time, if a web visitor session in which a web visitor session is not detected or a time out is detected, a new web visitor session is created and added to the session table (S10). When adding to the session table, at least one of the Internet address and the visitor identifier cookie is included in the new web visitor session. Then, if an unfinished web visitor session is detected, the information of the detected web visitor session is changed (S11). The information of the web visitor session may include the time when the visitor visited the web site, and the request message requested by the visitor from the web site.
그리고, 웹 클릭 스트림 데이터(22)에 처리할 로그 레코드가 없으면 종료한다.If there is no log record to be processed in the Web
이와 같이 이루어진 본 발명의 방문자 세션 탐지 방법을 예를 들어 살펴보면 다음과 같다. The visitor session detection method according to the present invention will now be described in detail.
도 3는 도 1의 웹 로그 파일의 생성 흐름을 설명하기 위한 흐름도이고, 도 4는 도 1의 웹 로그 파일 및 분석결과 데이터의 예시도이다.FIG. 3 is a flowchart for explaining a generation flow of the web log file of FIG. 1, and FIG. 4 is an exemplary view of the web log file and analysis result data of FIG.
먼저, 도 3에 도시한 바와 같이 인터넷 주소(IP) 1.1.1.1에서 방문자가 웹 사이트를 처음으로 방문한다고 가정해 보자. 웹 브라우저가 구비된 방문자 단말기(11)와 웹 서버(12)는 다음과 같이 동작할 것이다.First, as shown in FIG. 3, suppose that a visitor first visits a Web site at Internet address (IP) 1.1.1.1. The
일례로, 방문자가 /index.html 페이지 주소를 입력하면, 방문자 단말기(11)의 웹 브라우저는 웹 서버(12)로 “GET /index.html HTTP/1.0” 이라는 HTTP(Hyper Text Transfer Protocol) 메시지를 요청한다.For example, when a visitor enters an /index.html page address, the web browser of the
이때, 웹 서버(12)는 웹 로그 파일(13)에 “1.1.1.1 GET /index.html HTTP/1.0” 이라는 로그를 기록한다. 여기서, 방문자가 웹 사이트를 처음 방문한 것이므로 방문자 식별자 쿠키는 기록되지 않는다.At this time, the
그리고, 웹 서버(12)는 방문자 단말기(11)로 응답 메시지를 보내면서 방문자를 식별하기 위한 PCID 쿠키를 12345로 설정한다.Then, the
첫 번째 요청이 완료되고, 방문자가 /view 라는 링크를 클릭하면, 방문자 단말기(11)의 웹 브라우저는 웹 서버(12)로 두번째 요청인 “GET /view HTTP/1.0” 이라는 HTTP 메시지를 요청한다. 이때, 이전 HTTP 요청의 결과로 받은 PCID 쿠키값을 쿠키 헤더에 추가하여 메시지를 요청한다.When the first request is completed and the visitor clicks the link / view, the web browser of the
웹 서버(12)는 두번째 요청에서 받은 방문자 식별자 쿠키값을 웹 로그 파일(13)에 기록한다.The
웹 서버(12)가 기록하는 웹 로그 파일(13) 중에서, 웹 방문자 세션 탐지와 관련된 필드만을 살펴보면 방문자가 사용하는 인터넷 주소(IP), 방문자 식별자 쿠키(PCID), 방문시간(TimeStamp) 등이 도 4의 (a)와 같이 기록될 것이다.The Internet address (IP), the visitor identifier cookie (PCID), the visit time (TimeStamp), and the like used by the visitor are also displayed in the
도 4의 (a)에 도시된 바와 같이, 웹 서버(12)의 사이트를 처음으로 방문한 방문자의 첫번째 요청에는 방문자 식별자 쿠키가 존재하지 않는다. 첫번째 요청 이후의 요청에는 방문자 식별자 쿠키가 웹 서버(12)로 전달되고, 웹 서버(12)는 방문자 식별자 쿠키를 웹 로그 파일(13)에 기록한다.As shown in FIG. 4 (a), there is no visitor identifier cookie in the first request of the visitor who visited the site of the
이때, 방문자 식별자 쿠키만을 이용하여 웹 방문자 세션을 탐지하면 각각의 웹 방문자 세션은 도 4의 (b)와 같이 판별될 것이며, 실제 방문수는 1이지만 분석된 방문수는 2가 될 수 있다.At this time, if a web visitor session is detected using only the visitor identifier cookie, each web visitor session will be discriminated as shown in FIG. 4 (b), and the actual number of visits is 1, but the analyzed number of visits can be two.
그러나, 본 발명의 방문자 세션 탐지 방법으로 웹 방문자 세션을 탐지하면 각각의 로그 레코드의 세션 식별자는 도 4의 (c)와 같이 판별될 것이며, 분석된 방문수는 실제 방문수와 같은 1이 될 수 있다.However, if a web visitor session is detected by the visitor session detection method of the present invention, the session identifier of each log record will be discriminated as shown in (c) of FIG. 4, and the analyzed number of visits can be equal to 1 as the actual number of visits.
이와 같이, 본 발명은 방문자 식별자 쿠키가 없이 첫번째로 웹 사이트에 방문한 방문자를 정확히 탐지하여 웹 클릭 스트림 분석 결과의 통계 오류를 줄일 수 있다. 따라서, 본 발명은 방문자의 행동 분석, 및 사이트의 사용량 분석 결과의 신뢰도를 향상시킬 수 있다.
As described above, the present invention can accurately detect a visitor who visited a website for the first time without having a visitor identifier cookie, thereby reducing a statistical error of a result of analysis of a web click stream. Therefore, the present invention can improve the reliability of visitor behavior analysis and site usage analysis results.
11 : 방문자 단말기 12 : 웹 서버
13 : 웹 로그 파일 21 : 수집 시스템
22 : 웹 클릭 스트림 데이터 23 : 클릭 스트림 분석 시스템
24 : 분석결과 데이터 11: visitor terminal 12: web server
13: Web log file 21: Collection system
22: Web clickstream data 23: Clickstream analysis system
24: Analysis result data
Claims (10)
(a) 상기 웹 클릭 스트림 분석시 분석하고자 하는 상기 웹 서버에 대응되는 방문자 식별자 쿠키를 설정하는 단계;
(b) 처리할 로그 레코드가 있으면 상기 웹 서버의 상기 웹 로그 파일들이 수집되어 있는 웹 클릭 스트림 데이터를 불러오는 단계;
(c) 상기 로그 레코드에 상기 방문자 식별자 쿠키의 기록이 없으면 상기 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하고, 상기 로그 레코드에 상기 방문자 식별자 쿠키의 기록이 있으면 상기 웹 클릭 스트림 데이터에서 상기 방문자 식별자 쿠키 및 상기 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하며, 상기 웹 방문자 세션이 탐지되면 상기 웹 방문자 세션에 종료(time out)가 발생했는지를 검사하는 단계; 및
(d) 상기 웹 방문자 탐지 결과 및 상기 웹 방문자 세션 종료 여부에 대응하여 상기 웹 방문자 세션이 탐지되지 않거나 종료된 상기 웹 방문자 세션이 탐지되면 방문자의 첫번째 요청으로서 신규 웹 방문자 세션을 생성하여 세션 테이블에 추가하고, 종료되지 않은 상기 웹 방문자 세션이 탐지되면 동일한 방문자의 요청으로서 탐지된 상기 웹 방문자 세션의 정보를 변경하는 단계;를 포함하는 방문자 세션 탐지 방법.CLAIMS 1. A method for detecting a visitor session in a web click stream analysis for analyzing a behavior of a visitor who visited the web server and a result of usage of the web server in web log files collected from one or more web servers,
(a) setting a visitor identifier cookie corresponding to the web server to be analyzed in the web click stream analysis;
(b) retrieving web click stream data from which the web log files of the web server are collected if there is a log record to be processed;
(c) if there is no record of the visitor identifier cookie in the log record, detects the web visitor session using the Internet address in the web click stream data, and if the visitor identifier cookie is recorded in the log record, Detecting the web visitor session using the visitor identifier cookie and the internet address in the data and checking if a time out occurred in the web visitor session when the web visitor session is detected; And
(d) if the web visitor session in which the web visitor session is not detected or terminated is detected in response to the web visitor detection result and the end of the web visitor session, a new web visitor session is generated as a first request of the visitor, And changing the information of the web visitor session detected as a request of the same visitor if the web visitor session not terminated is detected.
상기 신규 웹 방문자 세션 추가시, 상기 신규 웹 방문자 세션에 상기 인터넷 주소, 및 상기 방문자 식별자 쿠키 중 적어도 하나 이상을 포함하여 상기 세션 테이블에 추가하는 방문자 세션 탐지 방법.2. The method of claim 1, wherein step (d)
Adding at least one of the Internet address and the visitor identifier cookie to the new web visitor session when adding the new web visitor session to the session table.
상기 웹 서버를 방문한 방문자의 행동 분석과 상기 웹 서버의 사용량에 대한 결과를 도출해내는 웹 클릭 스트림 분석시 방문자 세션을 탐지함에 있어서, 분석하고자 하는 상기 웹 서버에 대응되는 방문자 식별자 쿠키를 설정하고, 처리할 로그 레코드에 방문자 식별자 쿠키의 기록이 없으면 상기 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하고, 상기 로그 레코드에 상기 방문자 식별자 쿠키의 기록이 있으면 상기 웹 클릭 스트림 데이터에서 상기 방문자 식별자 쿠키 및 상기 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하는 클릭 스트림 분석 시스템;을 포함하며,
상기 클릭 스트림 분석 시스템은 상기 웹 방문자 세션이 탐지되면 상기 웹 방문자 세션에 종료(time out)가 발생했는지를 검사하고, 상기 웹 방문자 탐지 결과 및 상기 웹 방문자 세션 종료 여부에 대응하여 상기 웹 방문자 세션이 탐지되지 않거나 종료된 상기 웹 방문자 세션이 탐지되면 방문자의 첫번째 요청으로서 신규 웹 방문자 세션을 생성하여 세션 테이블에 추가하고, 종료되지 않은 상기 웹 방문자 세션이 탐지되면 동일한 방문자의 요청으로서 탐지된 상기 웹 방문자 세션의 정보를 변경하는 방문자 세션 탐지 장치.A collection system for collecting web log files from one or more web servers and storing the collected web log files in web click stream data; And
A visitor identifier cookie corresponding to the web server to be analyzed is set in the visitor session detection in analyzing a behavior of a visitor visiting the web server and a web click stream analyzing a result of usage of the web server, If there is no record of the visitor identifier cookie in the log record to be performed, detects the web visitor session using the Internet address in the web click stream data, and if there is a record of the visitor identifier cookie in the log record, And a click stream analysis system for detecting the web visitor session using the identifier cookie and the internet address,
Wherein the click stream analysis system checks whether a timeout has occurred in the web visitor session when the web visitor session is detected, and if the web visitor session is detected in response to the web visitor detection result and the end of the web visitor session, If the web visitor session that is not detected or terminated is detected, a new web visitor session is created and added to the session table as the first request of the visitor, and when the web visitor session that has not been terminated is detected, A visitor session detector that changes information in a session.
상기 신규 웹 방문자 세션 추가시, 상기 신규 웹 방문자 세션에 상기 인터넷 주소, 및 상기 방문자 식별자 쿠키 중 적어도 하나 이상을 포함하여 상기 세션 테이블에 추가하는 방문자 세션 탐지 장치.
8. The system of claim 7, wherein the clickstream analysis system
Upon adding the new web visitor session, adds at least one of the internet address and the visitor identifier cookie to the new web visitor session to the session table.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20140135999A KR101500704B1 (en) | 2014-10-08 | 2014-10-08 | Method and apparatus for detecting session of vistor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20140135999A KR101500704B1 (en) | 2014-10-08 | 2014-10-08 | Method and apparatus for detecting session of vistor |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101500704B1 true KR101500704B1 (en) | 2015-03-10 |
Family
ID=53026977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20140135999A KR101500704B1 (en) | 2014-10-08 | 2014-10-08 | Method and apparatus for detecting session of vistor |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101500704B1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090001804A (en) * | 2007-05-23 | 2009-01-09 | 주식회사 다음커뮤니케이션 | Method of tracking contents visitor |
JP2012073878A (en) * | 2010-09-29 | 2012-04-12 | Mitsubishi Space Software Kk | Access analysis device, access analysis method and access analysis program |
-
2014
- 2014-10-08 KR KR20140135999A patent/KR101500704B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090001804A (en) * | 2007-05-23 | 2009-01-09 | 주식회사 다음커뮤니케이션 | Method of tracking contents visitor |
JP2012073878A (en) * | 2010-09-29 | 2012-04-12 | Mitsubishi Space Software Kk | Access analysis device, access analysis method and access analysis program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111159514B (en) | Method, device and equipment for detecting task effectiveness of web crawler and storage medium | |
JP2020061152A (en) | Methods and apparatus to determine media impressions using distributed demographic information | |
CN103257989B (en) | Web page download time is analyzed | |
US8504673B2 (en) | Traffic like NXDomains | |
CN107294919A (en) | A kind of detection method and device of horizontal authority leak | |
US10057155B2 (en) | Method and apparatus for determining automatic scanning action | |
US10305760B2 (en) | Identifying an analysis reporting message in network traffic | |
CN102055815B (en) | System for acquiring local domain name analyses server of caller | |
CN109656797B (en) | Log data association method and device | |
Reddy et al. | Preprocessing the web server logs: an illustrative approach for effective usage mining | |
CN107231271A (en) | A kind of detection method and device of shared verification | |
US20150082206A1 (en) | Methods and apparatus to detect pop-up/pop-under windows in a browser | |
CN102035905B (en) | Method for obtaining visitor Local DNS (Local Domain-Name Server) | |
KR101824924B1 (en) | System and method for performance measurements of web site in response to the real time load | |
CN104182327A (en) | Client error log collecting method and client error log collecting system | |
RU2669172C2 (en) | Method and monitoring system of web-site consistency | |
KR101055871B1 (en) | Apparatus and method for extracting user session information through real-time analysis of web logs | |
CN108268370B (en) | Website quality analysis method, device and system based on Referer and template library matching | |
WO2015195407A1 (en) | Method and apparatus for monitoring and determining page load times | |
Rizothanasis et al. | Identifying user actions from HTTP (S) traffic | |
CN105450462A (en) | On-line state monitoring method and system | |
KR101500704B1 (en) | Method and apparatus for detecting session of vistor | |
US8825843B2 (en) | System and methods for monitoring a geographic information system | |
CN102932400A (en) | Method and device for identifying uniform resource locator primary links | |
JP5061316B1 (en) | Communication packet analyzer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20180319 Year of fee payment: 4 |