KR101500704B1 - Method and apparatus for detecting session of vistor - Google Patents

Method and apparatus for detecting session of vistor Download PDF

Info

Publication number
KR101500704B1
KR101500704B1 KR20140135999A KR20140135999A KR101500704B1 KR 101500704 B1 KR101500704 B1 KR 101500704B1 KR 20140135999 A KR20140135999 A KR 20140135999A KR 20140135999 A KR20140135999 A KR 20140135999A KR 101500704 B1 KR101500704 B1 KR 101500704B1
Authority
KR
South Korea
Prior art keywords
web
visitor
session
detected
click stream
Prior art date
Application number
KR20140135999A
Other languages
Korean (ko)
Inventor
오재훈
김종달
권일혁
Original Assignee
주식회사 넷스루
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 넷스루 filed Critical 주식회사 넷스루
Priority to KR20140135999A priority Critical patent/KR101500704B1/en
Application granted granted Critical
Publication of KR101500704B1 publication Critical patent/KR101500704B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/146Markers for unambiguous identification of a particular session, e.g. session cookie or URL-encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

The present invention provides a method for detecting a session. The purpose of the present invention is to provide a method and a device for detecting a session which are capable of precisely understanding a web visitor session in web click stream data analysis. The method for detecting a session according to the above includes: a step (a) of setting up a visitor identifier cookie; a step (b) of loading web click stream data if a log record to be processed exists; a step (c) of detecting a web visitor session by using an internet address in the web click stream data corresponding to the existence of the visitor identifier cookie recorded in the log record or detecting the web visitor session by using the visitor identifier cookie and internet address.

Description

방문자 세션 탐지 방법 및 장치{METHOD AND APPARATUS FOR DETECTING SESSION OF VISTOR}[0001] METHOD AND APPARATUS FOR DETECTING SESSION OF VISION [0002]

본 발명은 방문자 세션 탐지 방법 및 장치에 관한 것으로, 더 상세하게는 웹 클릭 스트림 데이터 분석에서 정확한 웹 방문자 세션을 파악할 수 있도록 하는 방문자 세션 탐지 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for detecting a visitor session, and more particularly, to a method and apparatus for detecting a visitor session in a web click stream data analysis.

일반적으로 인터넷 환경은 개방형 환경으로, 불특정 다수의 방문자가 웹 서버에 접속하여 웹 서비스를 받는다. 웹 서비스를 받기 위해 동일 방문자가 웹 서버에 접속해서 사이트를 떠날 때까지를 세션이라 하고, 방문자는 하나의 세션 동안에 여러 메시지를 웹 서버에 요청할 수 있다.Generally, the Internet environment is an open environment, and an unspecified number of visitors access the web server to receive the web service. In order to receive a web service, a session is called a session until the same visitor connects to the web server and leaves the site, and the visitor can request multiple messages from the web server during one session.

이때, 웹 서버는 방문자로부터 요청된 메시지를 웹 로그 파일에 저장한다. 웹 로그 파일에는 방문자 단말기의 인터넷 주소(IP : Internet Protocol), 요청 메시지, 및 접속시간 등의 정보가 포함될 수 있다.At this time, the web server stores the requested message from the visitor in the web log file. The web log file may include information such as an Internet address (IP) of a visitor terminal, a request message, and an access time.

웹 클릭 스트림(Web Click Stream) 분석은 웹 서버에 저장된 웹 로그 파일을 분석하여, 웹 사이트를 방문한 방문자의 행동 분석, 사이트의 사용량 등에 대한 분석 결과를 도출해내는 것을 말한다.Web click stream analysis analyzes Web log files stored on a Web server and analyzes the behavior of visitors to the Web site and analyzes the usage of the site.

한편, 웹 클릭 스트림 분석에서 방문자의 세션 탐지 방법은 분석의 정확성에 많은 영향을 끼친다. 이러한 웹 클릭 스트림 분석에서는 방문자를 식별하기 위해 방문자 식별자 쿠키를 사용하고 있다. 방문자 식별자 쿠키는 웹 서버로부터 발급되는데, 동일한 방문자 식별자 쿠키의 요청은 동일한 세션으로 구분된다.On the other hand, in the Web clickstream analysis, the visitor's session detection method has a great influence on the accuracy of the analysis. In this Web clickstream analysis, a visitor identifier cookie is used to identify a visitor. The visitor identifier cookie is issued from the web server, and the request for the same visitor identifier cookie is divided into the same session.

그런데, 웹서버 로그 파일 방식에서 방문자의 첫번째 요청에는 방문자를 식별할 수 있는 방문자 식별자 쿠키가 기록되지 않기 때문에 방문자 식별자 쿠키만을 이용하여 방문자 세션을 탐지할 경우 방문자 세션이 과다 산정되어 통계에 오류가 발생하는 문제점이 있다.However, in the web server log file method, since the visitor identifier cookie that can identify the visitor is not recorded in the first request of the visitor, when the visitor session is detected using only the visitor identifier cookie, the visitor session is overestimated, .

본 발명은 웹 클릭 스트림 데이터 분석에서 정확한 웹 방문자 세션을 파악할 수 있도록 하는 방문자 세션 탐지 방법 및 장치를 제공하는데 그 목적이 있다.It is an object of the present invention to provide a method and apparatus for detecting a visitor session so that an accurate web visitor session can be grasped in web click stream data analysis.

또한, 본 발명은 방문자 식별자 쿠키와 방문자 인터넷 주소를 이용하여 방문자 세션을 정확히 탐지할 수 있는 방문자 세션 탐지 방법 및 장치를 제공하는데 그 목적이 있다.It is another object of the present invention to provide a visitor session detection method and apparatus that can accurately detect a visitor session using a visitor identifier cookie and a visitor's Internet address.

또한, 본 발명은 방문자 식별자 쿠키 없이 방문한 방문자를 정확히 탐지하므로 웹 클릭 스트림 분석 결과의 신뢰도를 향상시킬 수 있는 방문자 세션 탐지 방법 및 장치를 제공하는데 그 목적이 있다.
It is another object of the present invention to provide a visitor session detection method and apparatus capable of improving the reliability of a web click stream analysis result because it accurately detects a visitor who visited without a visitor identifier cookie.

본 발명에 의한 방문자 세션 탐지 방법은, (a) 방문자 식별자 쿠키를 설정하는 단계; (b) 처리할 로그 레코드가 있으면 웹 클릭 스트림 데이터를 불러오는 단계; 및 (c) 상기 로그 레코드에 기록된 상기 방문자 식별자 쿠키의 유무에 대응하여 상기 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하거나 상기 방문자 식별자 쿠키 및 상기 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하는 단계;를 포함한다.A visitor session detection method according to the present invention comprises the steps of: (a) setting a visitor identifier cookie; (b) retrieving web click stream data if there is a log record to process; And (c) detecting a web visitor session using the Internet address in the web click stream data corresponding to the presence or absence of the visitor identifier cookie recorded in the log record, or using the visitor identifier cookie and the internet address to access the web visitor And detecting the session.

본 발명에 의한 방문자 세션 탐지 장치는, 웹 서버의 웹 로그 파일로부터 로그 레코드를 수집하고, 수집한 상기 로그 레코드를 웹 클릭 스트림 데이터에 저장하는 수집 시스템; 및 상기 로그 레코드 분석시 상기 로그 레코드에 방문자 식별자 쿠키의 기록 유무에 대응하여 상기 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하거나 상기 방문자 식별자 쿠키 및 상기 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하는 클릭 스트림 분석 시스템;을 포함한다.A visitor session detection apparatus according to the present invention includes: a collection system for collecting log records from a web log file of a web server and storing the collected log records in web click stream data; And detecting a web visitor session using the internet address in the web click stream data in response to the presence or absence of the recording of the visitor identifier cookie in the log record when analyzing the log record or detecting the web visitor session using the visitor identifier cookie and the internet address And a click-stream analysis system for detecting a click stream.

상술한 바와 같이, 본 발명은 웹서버 로그 파일 방식으로 수집된 웹 클릭 스트림 통계 분석 시스템에서 방문자 식별자 쿠키와 방문자 인터넷 주소를 이용하여 방문자의 세션을 정확히 탐지할 수 있다.As described above, the present invention can accurately detect the visitor's session using the visitor identifier cookie and the visitor's Internet address in the web click stream statistical analysis system collected by the web server log file method.

또한, 본 발명은 방문자 식별자 쿠키가 없이 방문한 방문자를 정확히 탐지하여 웹 클릭 스트림 분석 결과의 통계 오류를 줄일 수 있으므로 분석 결과의 신뢰도를 향상시킬 수 있다.In addition, the present invention can accurately detect visitors who visit without a visitor identifier cookie, thereby reducing statistical errors of a Web click stream analysis result, thereby improving the reliability of analysis results.

도 1은 본 발명의 방문자 세션 탐지 장치의 일 실시예에 따른 블럭도이다.
도 2은 본 발명의 방문자 세션 탐지 방법의 일 실시예에 따른 흐름도이다.
도 3는 도 1의 웹 로그 파일의 생성 흐름을 설명하기 위한 흐름도이다.
도 4는 도 1의 웹 로그 파일 및 분석결과 데이터의 예시도이다.
1 is a block diagram according to an embodiment of the visitor session detection apparatus of the present invention.
FIG. 2 is a flow diagram according to an embodiment of the visitor session detection method of the present invention.
3 is a flowchart for explaining the generation flow of the web log file of FIG.
4 is an exemplary view of the web log file and analysis result data of FIG.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명한다. 본 명세서 및 특허청구범위에 사용된 용어는 통상적이거나 사전적 의미로 한정되어 해석되지 아니하며, 본 발명의 기술적 사항에 부합하는 의미와 개념으로 해석되어야 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. It is to be understood that the terminology used herein is for the purpose of description and should not be interpreted as limiting the scope of the present invention.

본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 바람직한 실시예이며, 본 발명의 기술적 사상을 모두 대변하는 것이 아니므로, 본 출원 시점에서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있다.The embodiments described in the present specification and the configurations shown in the drawings are preferred embodiments of the present invention and are not intended to represent all of the technical ideas of the present invention and thus various equivalents and modifications Can be.

도 1은 본 발명의 방문자 세션 탐지 장치의 일 실시예에 따른 블럭도이다.1 is a block diagram according to an embodiment of the visitor session detection apparatus of the present invention.

도 1을 참고하면, 본 발명의 방문자 세션 탐지 장치는 수집 시스템(21), 및 클릭 스트림 분석 시스템(23)을 포함한다.Referring to FIG. 1, the visitor session detection apparatus of the present invention includes a collection system 21, and a clickstream analysis system 23.

수집 시스템(21)은 하나 이상의 웹 서버(12)로부터 웹 로그 파일(13)을 수집한다. 구체적으로 설명하면, 웹 서버(12)는 방문자의 웹 사이트 접속에 의해 발생되는 로그 레코드를 웹 로그 파일(13)에 저장한다. 웹 로그 파일(13)에는 방문자 단말기(11)의 인터넷 주소(IP), 요청 메시지, 및 접속시간 등의 정보가 포함될 수 있다. 수집 시스템(21)은 상기와 같은 웹 서버(12)의 웹 로그 파일(13)에 저장된 모든 로그 레코드를 수집하여 웹 클릭 스트림 데이터(22)에 저장한다. 웹 로그 파일의 수집 방법에 대한 구체적인 설명은 본 실시예에서는 생략하기로 한다.The collection system 21 collects the web log files 13 from one or more web servers 12. More specifically, the web server 12 stores a log record generated by accessing a visitor's web site in the web log file 13. The web log file 13 may include information such as an Internet address (IP) of the visitor terminal 11, a request message, and an access time. The collection system 21 collects all the log records stored in the web log file 13 of the web server 12 and stores them in the web click stream data 22. A detailed description of the collection method of the web log file will be omitted in the present embodiment.

클릭 스트림 분석 시스템(23)은 웹 사이트를 방문한 방문자의 행동 분석, 사이트의 사용량 등에 대한 분석 결과를 도출하기 위해 웹 클릭 스트림 데이터를 분석한다. 이러한 웹 클릭 스트림 분석에서 방문자의 세션 탐지 방법은 방문자의 행동 분석, 및 사이트의 사용량 분석 등의 정확성에 많은 영향을 준다. The click stream analysis system 23 analyzes the web click stream data to derive the analysis results of the visitor's behavior of the visitor who visited the website, the usage amount of the site, and the like. In this Web clickstream analysis, visitors' session detection methods have a great influence on the accuracy of visitor behavior analysis and site usage analysis.

본 실시예에 의한 클릭 스트림 분석 시스템(23)은 분석이 시작되면 방문자 식별자 쿠키를 설정한다. 각각의 웹 서버(12)는 서로 다른 방문자 식별자 쿠키를 사용하는데, 분석하고자는 하는 웹 서버(12)에 대응되는 방문자 식별자 쿠키를 설정한다. 일례로, 각각의 웹 서버(12)는 방문자 식별자 쿠키로 PCID, PID, 및 ID 등을 사용할 수 있다. 본 실시예에서는 방문자 식별자 쿠키로 PCID가 설정된 것을 예시로 설명한다.The click stream analysis system 23 according to the present embodiment sets a visitor identifier cookie when analysis starts. Each web server 12 uses a different visitor identifier cookie, and sets a visitor identifier cookie corresponding to the web server 12 to be analyzed. For example, each web server 12 may use PCID, PID, ID, etc. as the visitor identifier cookie. In the present embodiment, the PCID is set as the visitor identifier cookie.

클릭 스트림 분석 시스템(23)은 처리할 로그 레코드가 있으면 웹 클릭 스트림 데이터(22)를 불러오고, 방문자 식별자 쿠키가 로그 레코드에 기록되어 있는지 여부를 검사하며, 방문자 식별자 쿠키의 기록 유무에 대응하여 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하거나 방문자 식별자 쿠키 및 인터넷 주소를 이용하여 웹 방문자 세션을 탐지한다. The click stream analysis system 23 retrieves the web click stream data 22 if there is a log record to be processed, checks whether the visitor identifier cookie is recorded in the log record, Detect web visitor sessions using Internet addresses in clickstream data or detect web visitor sessions using visitor identifier cookie and Internet address.

일례로, 로그 레코드에 방문자 식별자 쿠키의 기록이 없으면 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하고, 로그 레코드에 방문자 식별자 쿠키의 기록이 있으면 방문자 식별자 쿠키를 이용하여 웹 방문자 세션을 탐지한다. 이때, 방문자 식별자 쿠키를 이용하여 웹 방문자 세션이 탐지되지 않으면 인터넷 주소를 이용하여 웹 방문자 세션을 한번 더 탐지하도록 구성할 수 있다.For example, if there is no record of the visitor identifier cookie in the log record, the web visitor session is detected using the Internet address, and if there is a record of the visitor identifier cookie in the log record, the web visitor session is detected using the visitor identifier cookie. At this time, if the web visitor session is not detected using the visitor identifier cookie, the web visitor session may be detected once more using the internet address.

이어서, 클릭 스트림 분석 시스템(23)은 웹 방문자 세션이 탐지되지 않거나 세션이 종료(time out)된 웹 방문자 세션이 탐지된 경우에는 방문자의 첫번째 요청으로서 신규 웹 방문자 세션을 생성하여 세션 테이블에 추가한다. 일례로, 신규 웹 방문자 세션 추가시, 신규 웹 방문자 세션에 인터넷 주소, 및 방문자 식별자 쿠키 중 적어도 하나 이상을 포함하여 세션 테이블에 추가한다.The click stream analysis system 23 then creates a new web visitor session as the first request of the visitor and adds it to the session table if a web visitor session is not detected or the session is terminated (time out) . For example, when adding a new web visitor session, the new web visitor session includes at least one of an internet address, and a visitor identifier cookie to the session table.

또한, 클릭 스트림 분석 시스템(23)은 인터넷 주소 또는 방문자 식별자 쿠키에 대응되는 웹 방문자 세션이 탐지되면 동일한 방문자의 요청으로서 탐지된 웹 방문자 세션의 정보를 변경한다. 일반적으로, 방문자 식별자 쿠키는 웹 서버로부터 발급되는데, 동일한 방문자 식별자 쿠키의 요청은 동일한 세션으로 구분된다. In addition, the clickstream analysis system 23 changes the information of the detected web visitor session as a request of the same visitor if a web visitor session corresponding to the internet address or the visitor identifier cookie is detected. Typically, a visitor identifier cookie is issued from a web server, where requests for the same visitor identifier cookie are divided into the same session.

상기와 같은 클릭 스트림 분석 시스템에서의 방문자 세션 탐지 방법을 구체적으로 설명하면 다음과 같다.The visitor session detection method in the above-described click stream analysis system will be described in detail as follows.

도 2는 본 발명의 방문자 세션 탐지 방법의 일 실시예에 따른 흐름도이다.2 is a flow diagram according to an embodiment of the visitor session detection method of the present invention.

도 2를 참고하면, 먼저 방문자 식별자 쿠키를 설정한다(S1).Referring to FIG. 2, first, a visitor identifier cookie is set (S1).

이어서, 처리할 로그 레코드가 있는지 검사하고(S2), 처리할 로그 레코드가 있으면 웹 클릭 스트림 데이터(22)를 불러온다(S3). 여기서 로그 레코드가 방문자의 첫번째 요청이면 방문자 식별자 쿠키가 존재하지 않을 것이고, 두번째 요청부터는 로그 레코드에 방문자 식별자 쿠키가 기록되어 있을 것이다.Then, it is checked whether there is a log record to be processed (S2). If there is a log record to be processed, the Web click stream data 22 is loaded (S3). Here, if the log record is the visitor's first request, the visitor identifier cookie will not exist, and from the second request, the visitor identifier cookie will be recorded in the log record.

이어서, 처리할 로그 레코드에 방문자 식별자 쿠키가 기록되어 있는지 여부를 검사하며(S4), 방문자 식별자 쿠키의 기록이 없으면 인터넷 주소로 웹 클릭 스트림 데이터(22)에서 웹 방문자 세션을 탐지하고(S5), 방문자 식별자 쿠키의 기록이 있으면 방문자 식별자 쿠키로 웹 클릭 스트림 데이터(22)에서 웹 방문자 세션을 탐지한다(S6).Next, it is checked whether a visitor identifier cookie is recorded in the log record to be processed (S4). If there is no recording of the visitor identifier cookie, a web visitor session is detected from the web click stream data 22 by the Internet address (S5) If there is a record of the visitor identifier cookie, a web visitor session is detected in the web click stream data 22 with the visitor identifier cookie (S6).

일례로, 로그 레코드에 방문자 식별자 쿠키의 기록이 없으면 웹 클릭 스트림 데이터(22)의 웹 방문자 세션들을 모아 놓은 세션 테이블에서 인터넷 주소를 이용하여 웹 방문자 세션을 탐지하고, 로그 레코드에 방문자 식별자 쿠키의 기록이 있으면 방문자 식별자 쿠키를 이용하여 웹 클릭 스트림 데이터(22)의 세션 테이블에서 웹 방문자 세션을 탐지한다.For example, if there is no record of the visitor identifier cookie in the log record, a web visitor session is detected using the internet address in the session table of the web visitor sessions of the web click stream data 22, and a record of the visitor identifier cookie It detects the web visitor session in the session table of the web click stream data 22 using the visitor identifier cookie.

이어서, 웹 클릭 스트림 데이터(22)에서 탐지하고자 하는 웹 방문자 세션이 있는지를 검사한다(S7,S8). 이때, 방문자 식별자 쿠키를 이용하여 웹 방문자 세션이 탐지되지 않으면 인터넷 주소를 이용하여 웹 방문자 세션을 탐지한다(S5).Then, it is checked whether there is a web visitor session to be detected in the web click stream data 22 (S7, S8). At this time, if a web visitor session is not detected using the visitor identifier cookie, a web visitor session is detected using the Internet address (S5).

이어서, 탐지된 웹 방문자 세션이 있으면 세션 종료(time out)가 발생했는지를 검사한다(S9).Then, if there is a detected web visitor session, it is checked whether a timeout occurs (S9).

이때, 웹 방문자 세션이 탐지되지 않거나 종료(time out)된 웹 방문자 세션이 탐지되면 신규 웹 방문자 세션을 생성하여 세션 테이블에 추가한다(S10). 세션 테이블에 추가시 인터넷 주소, 및 방문자 식별자 쿠키 중 적어도 하나 이상을 신규 웹 방문자 세션에 포함하여 추가한다. 그리고, 종료되지 않은 웹 방문자 세션이 탐지되면 탐지된 웹 방문자 세션의 정보를 변경한다(S11). 웹 방문자 세션의 정보에는 방문자가 웹 사이트를 방문한 방문시간, 및 웹 사이트에서 방문자가 요청한 요청 메시지 등이 포함될 수 있다.At this time, if a web visitor session in which a web visitor session is not detected or a time out is detected, a new web visitor session is created and added to the session table (S10). When adding to the session table, at least one of the Internet address and the visitor identifier cookie is included in the new web visitor session. Then, if an unfinished web visitor session is detected, the information of the detected web visitor session is changed (S11). The information of the web visitor session may include the time when the visitor visited the web site, and the request message requested by the visitor from the web site.

그리고, 웹 클릭 스트림 데이터(22)에 처리할 로그 레코드가 없으면 종료한다.If there is no log record to be processed in the Web click stream data 22, the process ends.

이와 같이 이루어진 본 발명의 방문자 세션 탐지 방법을 예를 들어 살펴보면 다음과 같다. The visitor session detection method according to the present invention will now be described in detail.

도 3는 도 1의 웹 로그 파일의 생성 흐름을 설명하기 위한 흐름도이고, 도 4는 도 1의 웹 로그 파일 및 분석결과 데이터의 예시도이다.FIG. 3 is a flowchart for explaining a generation flow of the web log file of FIG. 1, and FIG. 4 is an exemplary view of the web log file and analysis result data of FIG.

먼저, 도 3에 도시한 바와 같이 인터넷 주소(IP) 1.1.1.1에서 방문자가 웹 사이트를 처음으로 방문한다고 가정해 보자. 웹 브라우저가 구비된 방문자 단말기(11)와 웹 서버(12)는 다음과 같이 동작할 것이다.First, as shown in FIG. 3, suppose that a visitor first visits a Web site at Internet address (IP) 1.1.1.1. The visitor terminal 11 and the web server 12 equipped with the web browser will operate as follows.

일례로, 방문자가 /index.html 페이지 주소를 입력하면, 방문자 단말기(11)의 웹 브라우저는 웹 서버(12)로 “GET /index.html HTTP/1.0” 이라는 HTTP(Hyper Text Transfer Protocol) 메시지를 요청한다.For example, when a visitor enters an /index.html page address, the web browser of the visitor terminal 11 transmits an HTTP (Hyper Text Transfer Protocol) message of "GET /index.html HTTP / 1.0" to the web server 12 request.

이때, 웹 서버(12)는 웹 로그 파일(13)에 “1.1.1.1 GET /index.html HTTP/1.0” 이라는 로그를 기록한다. 여기서, 방문자가 웹 사이트를 처음 방문한 것이므로 방문자 식별자 쿠키는 기록되지 않는다.At this time, the web server 12 records the log "1.1.1.1 GET /index.html HTTP / 1.0" in the web log file 13. Here, since the visitor first visited the website, the visitor identifier cookie is not recorded.

그리고, 웹 서버(12)는 방문자 단말기(11)로 응답 메시지를 보내면서 방문자를 식별하기 위한 PCID 쿠키를 12345로 설정한다.Then, the web server 12 sends a response message to the visitor terminal 11, and sets the PCID cookie for identifying the visitor to 12345.

첫 번째 요청이 완료되고, 방문자가 /view 라는 링크를 클릭하면, 방문자 단말기(11)의 웹 브라우저는 웹 서버(12)로 두번째 요청인 “GET /view HTTP/1.0” 이라는 HTTP 메시지를 요청한다. 이때, 이전 HTTP 요청의 결과로 받은 PCID 쿠키값을 쿠키 헤더에 추가하여 메시지를 요청한다.When the first request is completed and the visitor clicks the link / view, the web browser of the visitor terminal 11 requests the web server 12 for the HTTP request "GET / view HTTP / 1.0" which is the second request. At this time, the PCID cookie value received as a result of the previous HTTP request is added to the cookie header to request a message.

웹 서버(12)는 두번째 요청에서 받은 방문자 식별자 쿠키값을 웹 로그 파일(13)에 기록한다.The web server 12 records the visitor identifier cookie value received from the second request in the web log file 13. [

웹 서버(12)가 기록하는 웹 로그 파일(13) 중에서, 웹 방문자 세션 탐지와 관련된 필드만을 살펴보면 방문자가 사용하는 인터넷 주소(IP), 방문자 식별자 쿠키(PCID), 방문시간(TimeStamp) 등이 도 4의 (a)와 같이 기록될 것이다.The Internet address (IP), the visitor identifier cookie (PCID), the visit time (TimeStamp), and the like used by the visitor are also displayed in the web log file 13 recorded by the web server 12 4 (a).

도 4의 (a)에 도시된 바와 같이, 웹 서버(12)의 사이트를 처음으로 방문한 방문자의 첫번째 요청에는 방문자 식별자 쿠키가 존재하지 않는다. 첫번째 요청 이후의 요청에는 방문자 식별자 쿠키가 웹 서버(12)로 전달되고, 웹 서버(12)는 방문자 식별자 쿠키를 웹 로그 파일(13)에 기록한다.As shown in FIG. 4 (a), there is no visitor identifier cookie in the first request of the visitor who visited the site of the web server 12 for the first time. In the request after the first request, the visitor identifier cookie is transmitted to the web server 12, and the web server 12 records the visitor identifier cookie in the web log file 13. [

이때, 방문자 식별자 쿠키만을 이용하여 웹 방문자 세션을 탐지하면 각각의 웹 방문자 세션은 도 4의 (b)와 같이 판별될 것이며, 실제 방문수는 1이지만 분석된 방문수는 2가 될 수 있다.At this time, if a web visitor session is detected using only the visitor identifier cookie, each web visitor session will be discriminated as shown in FIG. 4 (b), and the actual number of visits is 1, but the analyzed number of visits can be two.

그러나, 본 발명의 방문자 세션 탐지 방법으로 웹 방문자 세션을 탐지하면 각각의 로그 레코드의 세션 식별자는 도 4의 (c)와 같이 판별될 것이며, 분석된 방문수는 실제 방문수와 같은 1이 될 수 있다.However, if a web visitor session is detected by the visitor session detection method of the present invention, the session identifier of each log record will be discriminated as shown in (c) of FIG. 4, and the analyzed number of visits can be equal to 1 as the actual number of visits.

이와 같이, 본 발명은 방문자 식별자 쿠키가 없이 첫번째로 웹 사이트에 방문한 방문자를 정확히 탐지하여 웹 클릭 스트림 분석 결과의 통계 오류를 줄일 수 있다. 따라서, 본 발명은 방문자의 행동 분석, 및 사이트의 사용량 분석 결과의 신뢰도를 향상시킬 수 있다.
As described above, the present invention can accurately detect a visitor who visited a website for the first time without having a visitor identifier cookie, thereby reducing a statistical error of a result of analysis of a web click stream. Therefore, the present invention can improve the reliability of visitor behavior analysis and site usage analysis results.

11 : 방문자 단말기 12 : 웹 서버
13 : 웹 로그 파일 21 : 수집 시스템
22 : 웹 클릭 스트림 데이터 23 : 클릭 스트림 분석 시스템
24 : 분석결과 데이터
11: visitor terminal 12: web server
13: Web log file 21: Collection system
22: Web clickstream data 23: Clickstream analysis system
24: Analysis result data

Claims (10)

하나 이상의 웹 서버로부터 수집된 웹 로그 파일들에서 상기 웹 서버를 방문한 방문자의 행동 분석과 상기 웹 서버의 사용량에 대한 결과를 도출해내는 웹 클릭 스트림 분석에서 방문자 세션을 탐지하는 방법으로서,
(a) 상기 웹 클릭 스트림 분석시 분석하고자 하는 상기 웹 서버에 대응되는 방문자 식별자 쿠키를 설정하는 단계;
(b) 처리할 로그 레코드가 있으면 상기 웹 서버의 상기 웹 로그 파일들이 수집되어 있는 웹 클릭 스트림 데이터를 불러오는 단계;
(c) 상기 로그 레코드에 상기 방문자 식별자 쿠키의 기록이 없으면 상기 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하고, 상기 로그 레코드에 상기 방문자 식별자 쿠키의 기록이 있으면 상기 웹 클릭 스트림 데이터에서 상기 방문자 식별자 쿠키 및 상기 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하며, 상기 웹 방문자 세션이 탐지되면 상기 웹 방문자 세션에 종료(time out)가 발생했는지를 검사하는 단계; 및
(d) 상기 웹 방문자 탐지 결과 및 상기 웹 방문자 세션 종료 여부에 대응하여 상기 웹 방문자 세션이 탐지되지 않거나 종료된 상기 웹 방문자 세션이 탐지되면 방문자의 첫번째 요청으로서 신규 웹 방문자 세션을 생성하여 세션 테이블에 추가하고, 종료되지 않은 상기 웹 방문자 세션이 탐지되면 동일한 방문자의 요청으로서 탐지된 상기 웹 방문자 세션의 정보를 변경하는 단계;를 포함하는 방문자 세션 탐지 방법.
CLAIMS 1. A method for detecting a visitor session in a web click stream analysis for analyzing a behavior of a visitor who visited the web server and a result of usage of the web server in web log files collected from one or more web servers,
(a) setting a visitor identifier cookie corresponding to the web server to be analyzed in the web click stream analysis;
(b) retrieving web click stream data from which the web log files of the web server are collected if there is a log record to be processed;
(c) if there is no record of the visitor identifier cookie in the log record, detects the web visitor session using the Internet address in the web click stream data, and if the visitor identifier cookie is recorded in the log record, Detecting the web visitor session using the visitor identifier cookie and the internet address in the data and checking if a time out occurred in the web visitor session when the web visitor session is detected; And
(d) if the web visitor session in which the web visitor session is not detected or terminated is detected in response to the web visitor detection result and the end of the web visitor session, a new web visitor session is generated as a first request of the visitor, And changing the information of the web visitor session detected as a request of the same visitor if the web visitor session not terminated is detected.
삭제delete 삭제delete 삭제delete 삭제delete 제 1 항에 있어서, 상기 (d) 단계는
상기 신규 웹 방문자 세션 추가시, 상기 신규 웹 방문자 세션에 상기 인터넷 주소, 및 상기 방문자 식별자 쿠키 중 적어도 하나 이상을 포함하여 상기 세션 테이블에 추가하는 방문자 세션 탐지 방법.
2. The method of claim 1, wherein step (d)
Adding at least one of the Internet address and the visitor identifier cookie to the new web visitor session when adding the new web visitor session to the session table.
하나 이상의 웹 서버로부터 웹 로그 파일들을 수집하고, 수집한 상기 웹 로그 파일들을 웹 클릭 스트림 데이터에 저장하는 수집 시스템; 및
상기 웹 서버를 방문한 방문자의 행동 분석과 상기 웹 서버의 사용량에 대한 결과를 도출해내는 웹 클릭 스트림 분석시 방문자 세션을 탐지함에 있어서, 분석하고자 하는 상기 웹 서버에 대응되는 방문자 식별자 쿠키를 설정하고, 처리할 로그 레코드에 방문자 식별자 쿠키의 기록이 없으면 상기 웹 클릭 스트림 데이터에서 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하고, 상기 로그 레코드에 상기 방문자 식별자 쿠키의 기록이 있으면 상기 웹 클릭 스트림 데이터에서 상기 방문자 식별자 쿠키 및 상기 인터넷 주소를 이용하여 상기 웹 방문자 세션을 탐지하는 클릭 스트림 분석 시스템;을 포함하며,
상기 클릭 스트림 분석 시스템은 상기 웹 방문자 세션이 탐지되면 상기 웹 방문자 세션에 종료(time out)가 발생했는지를 검사하고, 상기 웹 방문자 탐지 결과 및 상기 웹 방문자 세션 종료 여부에 대응하여 상기 웹 방문자 세션이 탐지되지 않거나 종료된 상기 웹 방문자 세션이 탐지되면 방문자의 첫번째 요청으로서 신규 웹 방문자 세션을 생성하여 세션 테이블에 추가하고, 종료되지 않은 상기 웹 방문자 세션이 탐지되면 동일한 방문자의 요청으로서 탐지된 상기 웹 방문자 세션의 정보를 변경하는 방문자 세션 탐지 장치.
A collection system for collecting web log files from one or more web servers and storing the collected web log files in web click stream data; And
A visitor identifier cookie corresponding to the web server to be analyzed is set in the visitor session detection in analyzing a behavior of a visitor visiting the web server and a web click stream analyzing a result of usage of the web server, If there is no record of the visitor identifier cookie in the log record to be performed, detects the web visitor session using the Internet address in the web click stream data, and if there is a record of the visitor identifier cookie in the log record, And a click stream analysis system for detecting the web visitor session using the identifier cookie and the internet address,
Wherein the click stream analysis system checks whether a timeout has occurred in the web visitor session when the web visitor session is detected, and if the web visitor session is detected in response to the web visitor detection result and the end of the web visitor session, If the web visitor session that is not detected or terminated is detected, a new web visitor session is created and added to the session table as the first request of the visitor, and when the web visitor session that has not been terminated is detected, A visitor session detector that changes information in a session.
삭제delete 삭제delete 제 7 항에 있어서, 상기 클릭 스트림 분석 시스템은
상기 신규 웹 방문자 세션 추가시, 상기 신규 웹 방문자 세션에 상기 인터넷 주소, 및 상기 방문자 식별자 쿠키 중 적어도 하나 이상을 포함하여 상기 세션 테이블에 추가하는 방문자 세션 탐지 장치.
8. The system of claim 7, wherein the clickstream analysis system
Upon adding the new web visitor session, adds at least one of the internet address and the visitor identifier cookie to the new web visitor session to the session table.
KR20140135999A 2014-10-08 2014-10-08 Method and apparatus for detecting session of vistor KR101500704B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20140135999A KR101500704B1 (en) 2014-10-08 2014-10-08 Method and apparatus for detecting session of vistor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20140135999A KR101500704B1 (en) 2014-10-08 2014-10-08 Method and apparatus for detecting session of vistor

Publications (1)

Publication Number Publication Date
KR101500704B1 true KR101500704B1 (en) 2015-03-10

Family

ID=53026977

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20140135999A KR101500704B1 (en) 2014-10-08 2014-10-08 Method and apparatus for detecting session of vistor

Country Status (1)

Country Link
KR (1) KR101500704B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090001804A (en) * 2007-05-23 2009-01-09 주식회사 다음커뮤니케이션 Method of tracking contents visitor
JP2012073878A (en) * 2010-09-29 2012-04-12 Mitsubishi Space Software Kk Access analysis device, access analysis method and access analysis program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090001804A (en) * 2007-05-23 2009-01-09 주식회사 다음커뮤니케이션 Method of tracking contents visitor
JP2012073878A (en) * 2010-09-29 2012-04-12 Mitsubishi Space Software Kk Access analysis device, access analysis method and access analysis program

Similar Documents

Publication Publication Date Title
CN111159514B (en) Method, device and equipment for detecting task effectiveness of web crawler and storage medium
JP2020061152A (en) Methods and apparatus to determine media impressions using distributed demographic information
CN103257989B (en) Web page download time is analyzed
US8504673B2 (en) Traffic like NXDomains
CN107294919A (en) A kind of detection method and device of horizontal authority leak
US10057155B2 (en) Method and apparatus for determining automatic scanning action
US10305760B2 (en) Identifying an analysis reporting message in network traffic
CN102055815B (en) System for acquiring local domain name analyses server of caller
CN109656797B (en) Log data association method and device
Reddy et al. Preprocessing the web server logs: an illustrative approach for effective usage mining
CN107231271A (en) A kind of detection method and device of shared verification
US20150082206A1 (en) Methods and apparatus to detect pop-up/pop-under windows in a browser
CN102035905B (en) Method for obtaining visitor Local DNS (Local Domain-Name Server)
KR101824924B1 (en) System and method for performance measurements of web site in response to the real time load
CN104182327A (en) Client error log collecting method and client error log collecting system
RU2669172C2 (en) Method and monitoring system of web-site consistency
KR101055871B1 (en) Apparatus and method for extracting user session information through real-time analysis of web logs
CN108268370B (en) Website quality analysis method, device and system based on Referer and template library matching
WO2015195407A1 (en) Method and apparatus for monitoring and determining page load times
Rizothanasis et al. Identifying user actions from HTTP (S) traffic
CN105450462A (en) On-line state monitoring method and system
KR101500704B1 (en) Method and apparatus for detecting session of vistor
US8825843B2 (en) System and methods for monitoring a geographic information system
CN102932400A (en) Method and device for identifying uniform resource locator primary links
JP5061316B1 (en) Communication packet analyzer

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180319

Year of fee payment: 4