KR101055871B1 - 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법 - Google Patents

웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법 Download PDF

Info

Publication number
KR101055871B1
KR101055871B1 KR1020090038403A KR20090038403A KR101055871B1 KR 101055871 B1 KR101055871 B1 KR 101055871B1 KR 1020090038403 A KR1020090038403 A KR 1020090038403A KR 20090038403 A KR20090038403 A KR 20090038403A KR 101055871 B1 KR101055871 B1 KR 101055871B1
Authority
KR
South Korea
Prior art keywords
session
web log
web
time
type
Prior art date
Application number
KR1020090038403A
Other languages
English (en)
Other versions
KR20100119333A (ko
Inventor
김종성
윤규환
Original Assignee
삼성에스디에스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성에스디에스 주식회사 filed Critical 삼성에스디에스 주식회사
Priority to KR1020090038403A priority Critical patent/KR101055871B1/ko
Publication of KR20100119333A publication Critical patent/KR20100119333A/ko
Application granted granted Critical
Publication of KR101055871B1 publication Critical patent/KR101055871B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/143Termination or inactivation of sessions, e.g. event-controlled end of session
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Debugging And Monitoring (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법에 관한 것이다.
본 발명에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보를 추출하는 장치 및 방법은, 웹 로그를 실시간으로 분석하여 세션 처리를 위한 웹 로그를 결정하고, 상기 세션 처리를 위한 웹 로그로 결정된 웹 로그에 대해 IP 주소 및 URL을 기초로 세션 유형을 판단하며, 상기 판단된 세션 유형에 따른 사용자 세션 정보를 전송하는 것을 특징으로 한다.

Description

웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법{Apparatus and method for extracting user session information by realtime web log analysis}
본 발명은 웹 로그(web log)의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법에 관한 것으로, 보다 상세하게는 웹 사이트의 분석 항목 중 하나인 사용자 세션 정보를 웹 로그의 실시간 분석을 통해 추출하는 장치 및 방법에 관한 것이다.
웹 로그 분석이란 웹 서버가 서비스를 제공하면서 생성되는 로그 파일(Log File)을 분석하여 웹 서버의 트래픽(Traffic), 에러 상태 및 방문경로 등에 대한 정보를 얻으며, 웹 서버의 시스템적 문제와 기본적인 웹 사이트의 사용량에 대한 결과 등을 도출하는 것을 말한다. 웹 로그는 사용자가 웹 페이지에 액세스할 때마다 기록되는 것으로, 여기에는 사용자의 IP(Internet Protocol) 주소와 요청한 파일, 접속한 시간 등의 정보가 남겨져 있다.
이러한 웹 로그 분석은 크게 2가지 방식으로 구분할 수 있는데, 이는 웹 로그 파일 분석 방식과 스크립트(script)를 이용한 페이지 태깅(page tagging) 방식 이다.
먼저, 웹 로그 파일 분석 방식은 웹 서버(web server)에 텍스트(text) 형태로 저장되는 로그 파일 정보를 이용하는 분석 방식이다. 예컨대, 사용자(방문객)가 웹 사이트를 방문하게 되면 웹 서버에는 액세스 로그(access log), 에러 로그(error log) , 리퍼럴 로그(referral log), 에이전트 로그(agent log) 등의 자료가 파일 형태로 기록되는데, 웹 로그 파일 분석 방식은 이와 같이 기록된 로그 파일 정보를 이용하여 방문자 수, 방문 유형, 웹 페이지별 방문 횟수, 시간·요일·월별 접속 횟수 등을 분석한다.
그리고, 스크립트를 이용한 페이지 태깅 방식은 사용자에게 웹 페이지를 제공할 때 웹 서버에서 필요로 하는 정보를 사용자가 응답할 수 있도록 스크립트를 삽입하여 제공하고 사용자가 웹 페이지를 읽으면 해당 정보를 웹 서버로 전송하도록 함으로써 이를 통해 얻어진 정보를 분석하는 방식이다.
그러나, 기존의 웹 로그 파일 분석 방식은 웹 로그 파일이 일정량 이상 저장된 후에야 이를 분석하여 히트(Hits), 페이지 뷰(Page Views), 방문(Visits), 순방문자(Unique Visitors) 등을 구분함으로써 사용자 세션 정보를 추출할 수 있기 때문에, 실시간으로 웹 로그를 분석하여 사용자 세션 정보를 추출할 수 없는 문제점이 있었다.
또한, 페이지 태깅 방식은 페이지 태그를 웹 페이지 안에 위치시켜야만 데이터를 수집할 수 있기 때문에 웹 페이지 수정을 위해 웹 서버에 별도의 작업을 해야 하고, 만약 페이지 태그를 잘못 삽입하거나 삭제되면 정확한 데이터를 수집할 수 없는 문제점이 있었다.
그러므로, 종래기술에서는 비록 일정량 이상의 웹 로그 파일을 분석하거나 페이지 태깅을 통해 사용자 세션 정보를 추출하는 방식은 있었지만, 웹 서버에 별도의 작업을 하지 않고서도 웹 로그 분석 항목 중 중요한 항목인 사용자 세션 정보를 실시간으로 추출할 수 있는 방안이 없었다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 창안된 것으로, 본 발명의 목적은 웹 사이트 분석 항목 중 하나인 사용자 세션 정보를 웹 로그의 실시간 분석을 통해 추출하는 장치 및 방법을 제공하는 것이다.
본 발명의 다른 목적은 기존의 일정량 이상 저장된 웹 로그 파일을 분석하거나 페이지 태깅 방식(Page Tagging) 방식으로 추출했던 사용자 세션 정보를 웹 로그의 실시간 분석을 통해 추출할 수 있는 장치 및 방법을 제공하는 것이다.
상기 목적을 위하여, 본 발명의 일 형태에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치는, 웹 로그를 실시간으로 분석하여 세션 처리를 위한 웹 로그를 결정하는 실시간 웹 로그 분석부; 및 상기 세션 처리를 위한 웹 로그로 결정된 웹 로그에 대해 IP 주소 및 URL을 기초로 사용자 세션 정보를 추출하는 세션 분석부를 포함하는 것을 특징으로 한다.
그리고, 본 발명의 일 형태에 따른 웹 로그를 실시간으로 분석하는 웹 로그 분석 서버는, 웹 서버로부터 웹 로그를 수집하는 웹 로그 수집부; 상기 수집된 웹 로그를 실시간으로 분석하여 세션 처리를 위한 웹 로그를 결정하는 실시간 웹 로그 분석부; 및 상기 세션 처리를 위한 웹 로그로 결정된 웹 로그에 대해 IP 주소 및 URL을 기초로 사용자 세션 정보를 추출하는 세션 분석부를 포함하는 것을 특징으로 한다.
바람직하게는, 상기 세션 분석부는, 이전 생성된 세션의 웹 로그에 대한 IP 주소 및 URL을 키(key)로 하여 해당 키 값(value)을 저장하고 있는 캐시 메모리부; 상기 세션 처리를 위한 웹 로그로 결정된 웹 로그의 IP 주소 및 URL을 기초로 상기 캐시 메모리부에 저장된 키 및 키 값을 참조하여 세션 유형을 판단하는 세션 유형 판단부; 및 상기 판단된 세션 유형에 따른 세션 정보를 전송하는 세션 정보 전달부를 포함한다.
한편, 본 발명의 일 형태에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보를 추출하는 방법은, a) 웹 로그를 실시간으로 분석하여 세션 처리를 위한 웹 로그를 결정하는 단계; b) 상기 세션 처리를 위한 웹 로그로 결정된 웹 로그에 대해 IP 주소 및 URL을 기초로 세션 유형을 판단하는 단계; 및 c) 상기 판단된 세션 유형에 따른 사용자 세션 정보를 전송하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 웹 로그 파일을 일정량 이상 저장하여 분석했던 웹 로그 파일 분석 방식과는 달리 실시간으로 사용자 세션 정보를 추출함으로써 사용자에게 원하는 정보를 빠른 시간에 제공할 수 있는 효과를 가진다.
그리고, 본 발명에 따르면, 페이지 태깅 방식을 사용하지 않고 사용자 세션 정보를 추출하기 때문에 별도의 웹 페이지 수정이 필요없어 웹 서버 운영자의 편의성을 향상시킬 수 있는 효과를 가진다.
또한, 본 발명에 따르면, 기존의 웹 로그 파일을 기반으로 한 분석에서도 실시간으로 사용자 세션 정보를 추출할 수 있음으로 웹 로그 분석 자료를 마케팅 자료 등 보다 다양한 자료로서 활용할 수 있는 효과를 가진다.
이하에서는 첨부 도면 및 바람직한 실시예를 참조하여 본 발명을 상세히 설명한다. 참고로, 하기 설명에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략하였다.
먼저, 본 발명에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법을 구체적으로 설명하기에 앞서 웹 사이트 분석 항목에 대하여 설명한다.
도 1은 웹 사이트 분석 항목들을 데이터 양과 정보 중요도의 측면에서 그 상관 관계를 도시한 도면이다. 참고로, 도 1은 에릭 피터슨(Peterson, Eric T.)의 "Web Site Measurement Hacks"에서 인용한 것이다.
도 1을 참조하면, 일반적으로 널리 사용되고 있는 웹 사이트 분석 항목으로는 '히트(Hits)', '페이지 뷰(Page Views)', '방문(Visits)', '순방문자(Unique Visitors)' 등을 들 수 있으며, 여기서 데이터 양이 가장 큰 '히트'는 정보 중요도가 낮은 반면 데이터 양이 가장 작은 '순방문자'는 정보 중요도가 가장 높다.
이들 웹 사이트 분석 항목에 대해 상술하면, 먼저 '히트(Hits)'는 웹 데이터 분석에서 가장 많이 사용되는 용어로서, 사용자가 웹 페이지를 보거나 파일을 다운로드 하는 것과 같은 웹 사이트 상에서의 활동을 말한다. 여기서, 파일은 실행파일, PDF 파일, 사운드 파일, JPEG, PNG, GIF 와 같은 이미지 파일 등을 포함하며, 하나의 '페이지'는 기술적으로 수백 개의 '히트'일 수 있다.
'페이지 뷰(Page Views)'는 웹 데이터 분석의 기본 단위로서, 한 사람이 하나의 웹 페이지를 본 것을 말한다. 대게 페이지 뷰란 웹 사이트 방문자가 요청한 문서(즉, 내용이 담긴 하나의 웹 페이지)를 성공적으로 읽어온 횟수를 말하고, 이때 전송 방법이나 컨텐츠를 요청받은 빈도와는 상관이 없다. 실제로 페이지 뷰는 특정 웹 사이트나 특정 웹 페이지의 인기를 가늠할 수 있는 손쉬운 방법 중 하나이다.
'방문(Visits)'은 세션(session) 또는 사용자 세션이라고도 하며, 웹 사이트를 돌아다닐 때의 페이지를 모은 것으로 정의할 수 있다. IAB(Internet Advertising Bureau)에서는 하나의 페이지 뷰에 해당하는 텍스트/그래픽을 다운로드하고 일정 시간(예컨대, 30분) 동안 사이트 내에서 활동이 있는 경우 하나의 세션으로 정의한다.
그러므로, 방문(세션)은 특정 방문자의 웹 상에서의 활동(여러 페이지를 클릭해서 이동하면서 보는 것)을 하나로 셈한 것이라 할 수 있으며, 따라서 본 발명에서는 일정 시간 동안 클릭이나 다른 활동이 없는 경우 방문자가 웹 사이트를 떠난 것으로 간주하고 이것을 하나의 방문으로 설정하여 사용자 세션 정보를 추출한 다. 이 경우 방문자 한 명이 클릭하는 횟수에는 제한이 없으며, 이전 클릭과 다음 클릭 사이에 일정 시간(예컨대, 30분)이 초과하지 않은 경우 유효한 것으로 한다.
'순방문자(Unique Visitors)'는 일정 시간 동안 사이트를 방문한 실제 사람수를 의미하고, 일정 시간 이내의 클릭 및 기타 활동은 모두 한 명의 순방문자로 간주할 수 있다. 따라서 한 사람이 웹 브라우저를 이용해서 웹 사이트를 방문할 때를 하나의 순방문자로 인정하고 방문한 시간대가 달라도 한 명의 방문자로 식별할 수 있어야 하는데, 이때 사용자가 읽은 페이지 수, 클릭 수, 머문 시간 등은 고려하지 않는다.
한편, 도 2는 본 발명에 따른 웹 로그 실시간 분석을 통한 사용자 세션 정보 추출 방식을 위한 네트워크 구성도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 네트워크 구성은 적어도 하나의 웹 서버와 웹 로그 분석 서버를 포함하며, 웹 서버가 네트워크를 통해 웹 로그 분석 서버로 웹 로그를 전송하면, 웹 로그 분석 서버는 실시간으로 수집된 웹 로그를 분석하고 웹 로그 분석 결과를 데이터 저장부에 저장하거나 또는 웹 로그 통계 서버로 전송한다.
여기서, 본 발명에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치는 웹 로그 분석 서버의 구성요소로 구현되거나 또는 자체적인 하나의 서버(예, 사용자 세션 정보 추출 서버)로 구현될 수 있다.
참고로, 도 2에서는 웹 로그 분석 서버가 각각의 웹 서버로부터 웹 로그를 수집하여 이를 분석하는 구조로 구현하였지만, 실제 구현에 있어서는 각각의 웹 서버로부터 웹 로그를 수집하는 웹 로그 수집 서버와 상기 웹 로그 수집 서버에서 수집된 정보를 기초로 웹 로그를 분석하는 웹 로그 분석 서버가 별개로 구현될 수 있음은 물론이다.
이하에서는 도 3 내지 도 8을 참조하여 본 발명에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법을 상세 설명한다.
도 3은 본 발명의 일 실시예에 따른 웹 로그 분석 서버의 구성도이다. 그리고, 도 4는 본 발명의 일 실시예에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치의 구성도이다.
참고로, 도 3에서는 사용자 세션 정보 추출 장치가 웹 로그 분석 서버의 구성요소로 구현된 예를 도시하였으며, 도 4에서는 사용자 세션 정보 추출 장치가 별개의 장치 또는 서버로 구현된 예를 도시하였다. 그러나, 비록 도 3 및 도 4에서 본 발명에 따른 사용자 세션 정보 추출 장치의 서로 다른 구현 형태를 도시하였지만, 이들이 포함하는 실시간 웹 로그 분석부와 세션 분석부는 실질적으로 동일하거나 유사한 기능을 수행하므로, 이하에서는 도 3의 웹 로그 분석 서버를 중심으로 본 발명을 설명한다.
도 3에 도시된 바와 같이, 본 발명에 따른 웹 로그 분석 서버(100)는 웹 로그 수집부(110), 실시간 웹 로그 분석부(120), 세션 분석부(130), 웹 로그 파일 분석부(140), 데이터 저장부(150) 등을 포함한다. 물론, 도 4에 도시된 바와 같이, 개별적인 형태로 구현된 사용자 세션 정보 추출 장치(100')는 실시간 웹 로그 분석 부(120), 세션 분석부(130) 등을 포함한다.
먼저, 웹 로그 수집부(110)는 적어도 하나의 웹 서버(도 2 참조)로부터 웹 로그를 수집한다. 구체적으로는, 각각의 웹 서버는 사용자들이 웹 사이트를 방문하여 발생하는 모든 웹 로그를 웹 로그 관리 서버(100)로 전송하며, 웹 로그 관리 서버(100)의 웹 로그 수집부(110)는 이들 웹 서버로부터 웹 로그를 수신하여 실시간 로그 분석부(120)로 전송한다.
실시간 웹 로그 분석부(120)는, 도 5에 도시된 바와 같이, 웹 로그 URL 분석부(122), 페이지 뷰 판단부(124), 웹 검색 엔진 판단부(126) 등으로 구성되어, 웹 로그 수집부(110)에서 수신된 웹 로그를 실시간으로 분석하여 세션 처리를 위한 로그를 결정한다.
이를 상술하면, 웹 로그 URL 분석부(122)는 웹 로그 수집부(110)에서 수집된 웹 로그를 전송받아 웹 로그의 URL(Uniform Resource Locator)을 분석한다.
그리고, 페이지 뷰 판단부(124)는 웹 로그 URL 분석부(122)에서 분석된 웹 로그가 특정 페이지를 나타내는 타입의 파일(html, jsp, asp 등)을 요청한 것으로 판단되는 경우 이를 하나의 '페이지 뷰'로 결정한다. 이는 웹 페이지의 경우 다수의 이미지 파일 등으로 인해 많은 히트 수가 발생할 수 있으므로, 히트가 아닌 페이지 뷰를 발생시키는 웹 로그를 대상으로 세션을 계산하기 위함이다. 따라서, 이에 의해 페이지 뷰가 아닌 히트만 발생시키는 웹 로그는 세션 분석 대상 로그에서 제외된다.
또한, 웹 검색 엔진 판단부(126)는 웹 로그 중 일반 사용자가 아닌 웹 검색 엔진의 로봇이 접속한 것으로 판단되는 경우에는 세션 처리를 위한 웹 로그에서 배제한다. 웹 검색 엔진의 로봇은 각 검색 엔진이 자신들의 인덱스 파일을 갱신하기 위해 사용하는 것이므로 일반적인 사용자가 해당 웹 사이트에 접속했다고 판단하기는 어렵기 때문이다.
한편, 이와 같이 실시간 웹 로그 분석부(120)에서 세션 처리를 위한 웹 로그를 결정하면, 실시간 웹 로그 분석부(120)는 해당 웹 로그의 IP 주소, URL, 타임스탬프(timestamp) 등을 세션 분석부(130)로 전송한다.
참고로, 로그인(login)한 사용자의 ID를 이용하면 방문자의 판단이 더 용이할 수 있으나 ID가 웹 로그에 남지 않는 경우를 고려하여, 본 발명에서는 IP 주소와 URL (실제로는 전체 요청 파일의 주소(예, www.naver.com/index.html)가 아닌 도메인 네임(예, www.naver.com)을 사용함)을 통해 방문자를 분석한다. 그리고, 타임스탬프는 웹 서버에서 상기 웹 로그가 발생한 시간을 예컨대 초 단위로 변환한 것이다.
세션 분석부(130)는, 도 6에 도시된 바와 같이, 캐시 메모리부(132), 세션 유형 판단부(134), 세션 정보 전달부(136) 등으로 구성되어, 실시간 웹 로그 분석부(120)에서 세션 처리를 위한 웹 로그로 판단된 웹 로그를 기초로 사용자 세션 정보를 추출하고 분석한다.
이를 상술하면, 캐시(Cache) 메모리부(132)(이하, '캐시(Cache)'라 약칭함)는 최근 수집된 웹 로그의 IP 주소와 URL 및 이와 관련된 정보를 임시 저장한다.
본 발명의 바람직한 실시예에서는, 도 7에 도시된 바와 같이, 예컨대 IP 주 소와 URL을 짝으로 하는 'IP 주소 - URL'을 키(key)로 설정하고, 이 키에 따른 '세션 종료 타임스탬프 - 세션 시간 - 딜레이(Delay)' 를 해당 키 값(value)으로 설정하여 캐시에 저장한다.
여기서, 세션 종료 타임스탬프는 'IP 주소 - URL'의 키에 해당하는 세션이 종료한 시점을 나타내는 타임스탬프이며, 딜레이(Delay)는 캐시에 임시 저장된 세션을 일정 시간(예, 2400초) 경과 후 삭제하기 위해 설정된 시간이다. 이는 세션 처리를 위해 캐시에 많은 양의 세션 정보를 저장하고 있을 경우 메모리를 너무 많이 사용하기 때문에, 딜레이를 이용하여 종료된 세션 내용을 캐시에서 삭제하기 위함이다. 참고로, 네트워크 및 서버의 상황을 고려하여 로그가 지연되어 수신 및 처리될 수 있으므로, 딜레이는 세션 생성 후 세션 인정 시간(예, 1800초)에서 추가의 시간(예, 600초)이 경과된 시간(예, 2400초)으로 설정한다.
세션 유형 판단부(134)는 캐시 메모리부(132)에 'IP 주소 - URL' 키가 있는지를 검사하여 웹 로그와 관련된 세션 유형을 판단한다.
구체적으로, 세션 유형 판단부(134)는 캐시 내에 'IP 주소 - URL' 키가 있는 경우, 해당 키 값을 받아 그 값의 '세션 종료 타임스탬프' 와 현재 수신한 웹 로그의 타임스탬프를 비교한다.
그리고, 만약 두 타임스탬프의 차이가 제1 기준시간(예, 1800초) 이내에 있는 경우(도 8의 '제1 유형' 참조), 이는 하나의 세션이 여전히 진행 중인 것으로 판단하고, 현재의 타임스탬프를 '세션 종료 타임스탬프'로 대체한 뒤 두 타임스탬프의 차이는 '세션 시간'에 저장한다(즉, 기존의 '세션 시간' 값에 두 타임스탬프 의 차이를 더함). 그리고, 딜레이는 현재부터 제2 기준시간(예, 2400초) 후 동작하도록 재설정한다.
만약, 두 타임스탬프의 차이가 제1 기준시간(예, 1800초)을 초과할 경우(도 8의 '제2 유형' 참조), 이는 동일한 키를 가지고 있지만 다른 세션이 시작된 것으로 판단하고, 현재의 타임스탬프를 '세션 종료 타임스탬프' 로 대체하고 '세션 시간'은 0으로 설정한다. 그리고, 딜레이는 제2 기준시간(예, 2400초) 후 동작하도록 설정한다. 이에 의해, 동일한 키를 가지고 있지만 새로운 세션이라고 판단되는 경우라도, 기존의 '키(key) - 키 값(value)'을 지우고 새로 입력하기 보다는 기존 키의 키 값만 대체함으로써 작업량을 줄이고 새로운 세션을 입력할 수 있다.
한편, 캐시 내에 'IP 주소 - URL' 키가 없는 경우(도 8의 '제3 유형' 참조), 세션 유형 판단부(134)는 새로운 세션을 캐시에 입력한다. 즉, 수신한 'IP 주소 - URL' 을 키로 하고, '세션 종료 타임스탬프'에 현재의 타임스탬프를 입력하며, '세션 시간'은 0으로, 딜레이는 제2 기준시간(예, 2400초) 후 동작하도록 설정한다.
이와 같이 웹 로그의 세션 유형이 판단되어 그에 따라 새로운 키 값이 캐시에 입력되면, 세션 정보 전달부(136)는 세션 유형에 따른 세션 정보를 실시간 웹 로그 분석부(120)로 전송한다. 여기서, 실시간 웹 로그 분석부(120)로 전송되는 세션 정보에는 '세션', '체류 시간' 등을 들 수 있는데, 이하 본 발명에 따른 각 유형별 '세션' 및 '세션 시간' 값을 예시적으로 설명한다.
첫째, 기존의 세션이 지속되는 경우(제1 유형), 이는 해당 세션이 종료되지 않아 그 사용자의 세션 시간을 아직 판단할 수 없으므로, 키 값에 저장된 '세션 시 간'을 전달하지 않고 '세션' 및 '체류 시간'을 각각 0으로 설정하여 전달한다(참고로, 본 실시예에서 '세션' 값 0은 기존 세션의 연장을 의미하고, 1은 새로운 세션의 생성을 의미함).
둘째, 기존에 저장된 키가 있지만 키 값에서 두 타임스탬프의 차이가 커 새로운 세션으로 받아들여지는 경우(제2 유형), '세션'은 1, '체류 시간'은 기존 키 값에 저장된 '세션 시간'의 값으로 하고 이 값들을 전달한다. 즉, 이전 세션에 대한 사용자의 체류 시간은 동일 사용자의 새로운 세션이 시작될 때 전달하게 된다.
셋째, 캐시 내에 'IP 주소 - URL' 키가 없어 새로운 '키 - 키 값'을 입력하는 경우(제3 유형), '세션'은 1, '체류 시간'은 0으로 설정하여 전달한다. 이는, 새로운 세션의 시작을 의미한다.
한편, 딜레이(Delay)에 의해 만료된 세션을 캐시에서 삭제하는 경우에는 만료된 세션에 저장되어 있던 '세션 시간' 값을 임의의 '세션 체류 시간'에 저장하고, 세션 정보 전달부(136)가 '세션'과 '체류 시간' 값을 실시간 웹 로그 분석부(120)로 전달할 때 만료된 세션의 '세션 체류 시간'을 '체류 시간'에 합하여 전달한다.
다시 도 3을 참조하면, 웹 로그 파일 분석부(140)는 웹 로그 수집부(110)에서 수집된 웹 로그 파일에 대해 방문자 수, 방문 유형, 웹 페이지별 방문 횟수, 시간·요일·월별 접속 횟수 등을 분석한다. 이 경우, 바람직하게는, 웹 로그 파일 분석부(140)는 세션 분석부(130)에서 전송된 세션 정보를 기초로 하여 웹 로그 파일을 분석함으로써 보다 정확한 정보를 얻을 수 있다.
그리고, 데이터 저장부(150)는 웹 로그 수집부(110)에서 수집된 웹 로그, 세션 분석부(130)에서 전송된 세션 정보, 웹 로그 파일 분석부(140)에서 분석된 웹 로그 파일 분석 정보 등을 저장한다.
이하에서는 도 8을 참조하여 본 발명에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 방법을 설명한다. 참고로, 본 발명에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 방법에 대한 구체적 과정 또는 동작 원리는 전술한 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치에 대한 설명을 참조할 수 있으며, 따라서 이하에서는 중복적인 설명은 생략하고 흐름도 위주로 설명한다.
도 8은 본 발명의 일 실시예에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 방법의 흐름도이다.
먼저, 단계 S810에서, 실시간 웹 로그 분석부(120)는 웹 로그 URL 분석부(122)는 웹 로그 수집부(110)에서 전송된 웹 로그를 수신한다. 그리고, 단계 S820에서, 실시간 웹 로그 분석부(120)는 웹 로그의 URL(Uniform Resource Locator)을 분석한다.
단계 S830에서, 실시간 웹 로그 분석부(120)는 세션 처리를 위한 웹 로그를 결정하게 되는데, 이 경우 실시간 웹 로그 분석부(120)는 분석된 웹 로그가 특정 페이지를 나타내는 타입의 파일(html, jsp, asp 등)을 요청한 것으로 파악되면 이를 하나의 '페이지 뷰'로 판단하여 세션 처리를 위한 웹 로그로 결정하며, 여기서 웹 로그 중 일반 사용자가 아닌 웹 검색 엔진의 로봇이 접속한 것으로 판단되는 것은 세션 처리를 위한 웹 로그에서 배제한다. 다시 말해, 페이지 뷰에 해당하면서 웹 검색 엔진의 로봇이 아닌 경우를 세션 처리를 위한 웹 로그로 결정하고, 그 이외의 경우에는 배제한다.
만약, 단계 S830에서 세션 처리를 위한 웹 로그로 결정되면, 실시간 웹 로그 분석부(120)는 해당 웹 로그의 IP 주소, URL, 타임스탬프(timestamp) 등을 세션 분석부(130)로 전송하며, 단계 S840에서, 세션 분석부(130)는 이를 수신한다.
단계 S841에서, 세션 분석부(130)는 캐시(Cache)에 'IP 주소 - URL' 키가 있는지를 검사한다. 그리고, 만약 캐시에 'IP 주소 - URL' 키가 있으면, 다시 단계 S842에서 해당 키 값을 받아 그 값의 '세션 종료 타임스탬프' 와 현재 수신한 웹 로그의 타임스탬프를 비교한다.
그리고, 만약 두 타임스탬프의 차이가 제1 기준시간(예, 1800초) 이내에 있는 경우(도 8의 '제1 유형' 참조)에는, 단계 S843에서, 이는 하나의 세션이 여전히 진행 중인 것으로 판단한다.
만약, 두 타임스탬프의 차이가 제1 기준시간(예, 1800초)을 초과할 경우(도 8의 '제2 유형' 참조)에는, 단계 S844에서, 이는 동일한 키를 가지고 있지만 다른 세션이 시작된 것으로 판단한다. 한편, 단계 S841에서 캐시에 'IP 주소 - URL' 키가 없는 경우(도 8의 '제3 유형' 참조)로 판단되면, 마찬가지로 단계 S844에서, 새로운 세션이 생성된 것으로 판단한다.
단계 S845에서는, 전술한 바와 같이 판단된 세션 유형에 따라 캐시 업데이트 를 수행한다. 즉, 제1 유형으로 판단된 경우, 현재의 타임스탬프를 '세션 종료 타임스탬프'로 대체한 뒤 두 타임스탬프의 차이는 '세션 시간'에 저장하고, 딜레이는 현재부터 제2 기준시간(예, 2400초) 후 동작하도록 재설정한다.
그리고, 제2 유형으로 판단된 경우, 현재의 타임스탬프를 '세션 종료 타임스탬프' 로 대체하고 '세션 시간'은 0으로 설정하며, 딜레이는 제2 기준시간(예, 2400초) 후 동작하도록 설정한다.
마지막으로, 제3 유형으로 판단된 경우, 새로운 세션을 캐시에 입력한다. 즉, 수신한 'IP 주소 - URL' 을 키로 하고, '세션 종료 타임스탬프'에 현재의 타임스탬프를 입력하며, '세션 시간'은 0으로, 딜레이는 제2 기준시간(예, 2400초) 후 동작하도록 설정한다.
이와 같이 웹 로그의 세션 유형이 판단되어 그에 따라 새로운 키 값이 캐시에 입력되면, 단계 S846에서, 세션 분석부(130)는 세션 유형에 따른 세션 정보를 실시간 웹 로그 분석부(120)로 전송한다. 여기서, 실시간 웹 로그 분석부(120)로 전송되는 세션 정보에는 '세션', '체류 시간' 등을 들 수 있다.
참고로, 본 발명에 따른 각 유형별 '세션' 및 '세션 시간' 값은 다음과 같이 설정될 수 있는데, 첫째, 기존의 세션이 지속되는 경우(제1 유형)에는 '세션' 및 '체류 시간'을 각각 0으로 설정하여 전달하며, 둘째, 기존에 저장된 키가 있지만 키 값에서 두 타임스탬프의 차이가 커 새로운 세션으로 받아들여지는 경우(제2 유형)에는 '세션'은 1, '체류 시간'은 기존 키 값에 저장된 '세션 시간'의 값으로 하여 전달하며, 셋째, 캐시 내에 'IP 주소 - URL' 키가 없는 경우(제3 유형)에는 '세션' 은 1, '체류 시간'은 0으로 설정하여 전달한다.
마지막으로, 단계 S850에서, 실시간 웹 로그 분석부(120)는 세션 분석부(130)에서 전송된 세션 정보를 수신한다.
지금까지, 도 3 내지 도 8을 참조하여 본 발명에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법을 상세 설명하였는데, 이와 같이 분석된 사용자 세션 정보는 여러 종류의 웹 사이트를 분석하기 위한 KPI(Key Performance Indicator)의 기초 자료로 활용할 수 있다.
예컨대, 온라인 쇼핑몰 분석 시 KPI로서 방문자당 판매량, 새 방문자 비율과 재 방문자 비율, 머문 시간이 90초 미만인 경우의 비율 등의 자료를 활용할 수 있으며, 광고 및 컨텐츠 사이트 분석 시 KPI로서 방문 당 평균 페이지 뷰 횟수, 방문자당 평균 방문 횟수, 새 방문자 비율과 재 방문자 비율, 웹 사이트에서 머문 평균 시간, 머문 시간이 90초 미만인 경우의 비율 등의 자료를 활용할 수 있다. 또한, 고객지원 사이트 분석 시 KPI로서 방문 당 평균 페이지 뷰, 새 방문자 비율과 재 방문자 비율, 웹 사이트에서 머문 평균 시간 등의 자료를 활용할 수 있으며, 비즈니스 사이트 분석 시 KPI로서 방문자 당 평균 방문 횟수, 새 방문자 비율과 재 방문자 비율, 웹 사이트에서 머문 평균시간, 머문 시간이 90초 미만인 경우의 비율, 관심방문 비율(방문하는 동안 일정 수 이상의 페이지를 본 경우), 의미방문 비율(방문자가 상대적으로 많은 페이지를 보는 경우) 등의 자료를 활용할 수 있다.
한편, 본 발명에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독가능 기록매체를 통하여 실시될 수 있다. 상기 컴퓨터 판독가능 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 기록매체는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독가능 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크와 같은 자기-광 매체, 및 롬, 램, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
지금까지 본 발명을 바람직한 실시예를 참조하여 상세히 설명하였지만, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있으므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다.
그리고, 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 특정되는 것이며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부 터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
도 1은 웹 사이트 분석 항목들을 데이터 양과 정보 중요도의 측면에서 그 상관 관계를 도시한 도면이다.
도 2는 본 발명에 따른 웹 로그 실시간 분석을 통한 사용자 세션 정보 추출 방식을 위한 네트워크 구성도이다.
도 3은 본 발명의 일 실시예에 따른 웹 로그 분석 서버의 구성도이다.
도 4는 본 발명의 일 실시예에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치의 구성도이다.
도 5는 본 발명의 일 실시예에 따른 실시간 웹 로그 분석부의 상세 구성도이다.
도 6은 본 발명의 일 실시예에 따른 세션 분석부의 상세 구성도이다.
도 7은 본 발명에 따른 캐시의 구조를 예시한 도면이다.
도 8은 본 발명의 일 실시예에 따른 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 방법의 흐름도이다.

Claims (22)

  1. 웹 로그의 실시간 분석을 통한 사용자 세션 정보를 추출하는 장치로서,
    웹 로그를 실시간으로 분석하여 세션 처리를 위한 웹 로그를 결정하는 실시간 웹 로그 분석부; 및
    상기 세션 처리를 위한 웹 로그로 결정된 웹 로그에 대해 IP 주소 및 URL을 기초로 사용자 세션 정보를 추출하는 세션 분석부를 포함하고,
    상기 세션 분석부는,
    이전 생성된 세션의 웹 로그에 대한 IP 주소 및 URL을 키(key)로 하고 해당 키 값(value)으로서 세션 종료 타임스탬프 및 세션 시간을 저장하는 캐시 메모리부;
    상기 세션 처리를 위한 웹 로그로 결정된 웹 로그의 IP 주소 및 URL을 기초로 상기 캐시 메모리부에 저장된 키 및 키 값을 참조하여 세션 유형을 판단하는 세션 유형 판단부; 및
    상기 판단된 세션 유형에 따른 세션 정보를 전송하는 세션 정보 전달부를 포함하며,
    상기 세션 유형 판단부는,
    상기 세션 처리를 위한 웹 로그로 결정된 웹 로그의 IP 주소 및 URL이 상기 캐시 메모리부에 저장되어 있는 경우, 해당 웹 로그의 현재 타임스탬프와 세션 종료 타임스탬프의 차이가 기 설정된 제1 기준 시간 이내인 경우 기존 세션의 연장에 해당하는 제1 유형으로 판단하고, 해당 웹 로그의 현재 타임스탬프와 세션 종료 타임스탬프의 차이가 상기 제1 기준 시간을 초과하는 경우 시간 경과 후 새로운 세션의 생성에 해당하는 제2 유형으로 판단하는 것을 특징으로 하는 사용자 세션 정보 추출 장치.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제1항에 있어서, 상기 세션 정보 전달부는
    상기 제1 유형에 해당하는 웹 로그에 대해 세션을 기존 세션의 연장에 해당하는 값으로 설정하고 체류 시간을 0으로 설정하여 세션 정보를 전송하고,
    상기 제2 유형에 해당하는 웹 로그에 대해 세션을 새로운 세션의 생성에 해당하는 값으로 설정하고 체류 시간을 세션 시간의 값으로 설정하여 세션 정보를 전송하는 것을 특징으로 하는 사용자 세션 정보 추출 장치.
  6. 제1항에 있어서, 상기 캐시 메모리부는
    상기 제2 유형에 해당하는 웹 로그에 대해 기 저장된 키는 유지하고 해당 키 값을 변경하는 것을 특징으로 하는 사용자 세션 정보 추출 장치.
  7. 제1항에 있어서, 상기 세션 유형 판단부는
    상기 세션 처리를 위한 웹 로그로 결정된 웹 로그의 IP 주소 및 URL이 상기 캐시 메모리부에 저장되어 있지 않은 경우, 새로운 세션의 생성에 해당하는 제3 유형으로 판단하는 것을 특징으로 하는 사용자 세션 정보 추출 장치.
  8. 제7항에 있어서, 세션 정보 전달부는
    상기 제3 유형에 해당하는 웹 로그에 대해 세션을 새로운 세션의 생성에 해당하는 값으로 설정하고 체류 시간을 0으로 설정하여 세션 정보를 전송하는 것을 특징으로 하는 사용자 세션 정보 추출 장치.
  9. 제1항, 제5항 내지 제8항 중 어느 한 항에 있어서, 상기 실시간 웹 로그 분석부는
    웹 로그가 특정 페이지를 나타내는 타입의 파일을 요청한 것으로 판단되면 해당 웹 로그를 페이지 뷰로 결정하는 페이지 뷰 판단부; 및
    웹 로그가 웹 검색 엔진의 로봇이 접속한 것인지 여부를 판단하는 웹 검색 엔진 판단부를 포함하고,
    상기 세션 처리를 위한 웹 로그는 상기 페이지 뷰로 결정된 웹 로그 중 웹 검색 엔진의 로봇이 접속한 경우가 아닌 것을 특징으로 하는 사용자 세션 정보 추출 장치.
  10. 제9항에 있어서, 상기 실시간 웹 로그 분석부는
    웹 로그의 IP 주소 및 URL를 실시간으로 분석하는 웹 로그 URL 분석부를 더 포함하는 것을 특징으로 하는 사용자 세션 정보 추출 장치.
  11. 웹 로그를 실시간으로 분석하는 웹 로그 분석 서버로서,
    웹 서버로부터 웹 로그를 수집하는 웹 로그 수집부;
    상기 수집된 웹 로그를 실시간으로 분석하여 세션 처리를 위한 웹 로그를 결정하는 실시간 웹 로그 분석부; 및
    상기 세션 처리를 위한 웹 로그로 결정된 웹 로그에 대해 IP 주소 및 URL을 기초로 사용자 세션 정보를 추출하는 세션 분석부를 포함하고,
    상기 세션 분석부는,
    이전 생성된 세션의 웹 로그에 대한 IP 주소 및 URL을 키(key)로 하고 해당 키 값(value)으로서 세션 종료 타임스탬프 및 세션 시간을 저장하는 캐시 메모리부;
    상기 세션 처리를 위한 웹 로그로 결정된 웹 로그의 IP 주소 및 URL을 기초로 상기 캐시 메모리부에 저장된 키 및 키 값을 참조하여 세션 유형을 판단하는 세션 유형 판단부; 및
    상기 판단된 세션 유형에 따른 세션 정보를 전송하는 세션 정보 전달부를 포함하며,
    상기 세션 유형 판단부는,
    상기 세션 처리를 위한 웹 로그로 결정된 웹 로그의 IP 주소 및 URL이 상기 캐시 메모리부에 저장되어 있는 경우, 해당 웹 로그의 현재 타임스탬프와 세션 종료 타임스탬프의 차이가 기 설정된 제1 기준 시간 이내인 경우 기존 세션의 연장에 해당하는 제1 유형으로 판단하고, 해당 웹 로그의 현재 타임스탬프와 세션 종료 타임스탬프의 차이가 상기 제1 기준 시간을 초과하는 경우 시간 경과 후 새로운 세션의 생성에 해당하는 제2 유형으로 판단하는 것을 특징으로 하는 웹 로그 분석 서버.
  12. 제11항에 있어서, 상기 실시간 웹 로그 분석부는
    상기 수집된 웹 로그의 IP 주소 및 URL를 실시간으로 분석하는 웹 로그 URL 분석부;
    상기 분석된 웹 로그가 특정 페이지를 나타내는 타입의 파일을 요청한 것으로 판단되면 해당 웹 로그를 페이지 뷰로 결정하는 페이지 뷰 판단부; 및
    상기 분석된 웹 로그가 웹 검색 엔진의 로봇이 접속한 것인지 여부를 판단하는 웹 검색 엔진 판단부를 포함하고,
    상기 세션 처리를 위한 웹 로그는 상기 페이지 뷰로 결정된 웹 로그 중 웹 검색 엔진의 로봇이 접속한 경우가 아닌 것을 특징으로 하는 웹 로그 분석 서버.
  13. 삭제
  14. 제11항에 있어서, 상기 세션 유형 판단부는,
    상기 세션 처리를 위한 웹 로그로 결정된 웹 로그의 IP 주소 및 URL이 상기 캐시 메모리부에 저장되어 있지 않은 경우, 새로운 세션의 생성에 해당하는 제3 유형으로 판단하는 것을 특징으로 하는 웹 로그 분석 서버.
  15. 제14항에 있어서, 상기 세션 정보 전달부는
    상기 제1 유형에 해당하는 웹 로그에 대해 세션을 기존 세션의 연장에 해당하는 값으로 설정하고 체류 시간을 0으로 설정하여 세션 정보를 전송하고,
    상기 제2 유형에 해당하는 웹 로그에 대해 세션을 새로운 세션의 생성에 해당하는 값으로 설정하고 체류 시간을 세션 시간의 값으로 설정하여 세션 정보를 전송하며,
    상기 제3 유형에 해당하는 웹 로그에 대해 세션을 새로운 세션의 생성에 해당하는 값으로 설정하고 체류 시간을 0으로 설정하여 세션 정보를 전송하는 것을 특징으로 하는 웹 로그 분석 서버.
  16. 제11항에 있어서, 상기 웹 로그 분석 서버는
    상기 세션 처리를 위한 웹 로그에 대해 상기 추출된 사용자 세션 정보를 기초로 웹 로그 파일을 분석하는 웹 로그 파일 분석부를 더 포함하는 것을 특징으로 하는 웹 로그 분석 서버.
  17. 웹 로그의 실시간 분석을 통한 사용자 세션 정보를 추출하는 방법으로서,
    a) 웹 로그를 실시간으로 분석하여 세션 처리를 위한 웹 로그를 결정하는 단계;
    b) 상기 세션 처리를 위한 웹 로그로 결정된 웹 로그에 대해 IP 주소 및 URL을 기초로 세션 유형을 판단하는 단계; 및
    c) 상기 판단된 세션 유형에 따른 사용자 세션 정보를 전송하는 단계를 포함하고,
    상기 b) 단계는,
    b1) 상기 세션 처리를 위한 웹 로그로 결정된 웹 로그의 IP 주소 및 URL을 기 생성된 세션에 대한 IP 주소 및 URL과 비교하여 동일 세션 여부를 판단하는 단계;
    b2) 상기 b1) 단계의 판단 결과 동일 세션인 경우, 상기 세션 처리를 위한 웹 로그로 결정된 웹 로그의 현재 타임스탬프와 이전 생성된 세션의 타임스탬프를 비교하는 단계; 및
    b3) 상기 b2) 단계의 비교 결과 상기 현재 타임스탬프와 이전 생성된 타임스탬프의 차이가 기 설정된 제1 기준 시간 이내인 경우, 기존 세션의 연장에 해당하는 제1 유형으로 판단하고, 상기 b2) 단계의 비교 결과 상기 현재 타임스탬프와 이전 생성된 타임스탬프의 차이가 상기 제1 기준 시간을 초과하는 경우, 시간 경과 후 새로운 세션의 생성에 해당하는 제2 유형으로 판단하는 단계를 포함하는 것을 특징으로 하는 사용자 세션 정보 추출 방법.
  18. 삭제
  19. 제17항에 있어서, 상기 b) 단계는
    b4) 상기 b1) 단계의 판단 결과 동일 세션이 아닌 경우, 새로운 세션의 생성에 해당하는 제3 유형으로 판단하는 단계를 더 포함하는 것을 특징으로 하는 사용자 세션 정보 추출 방법.
  20. 제19항에 있어서, 상기 c) 단계는
    상기 제1 유형에 해당하는 웹 로그에 대해 세션을 기존 세션의 연장에 해당하는 값으로 설정하고 체류 시간을 0으로 설정하여 세션 정보를 전송하고,
    상기 제2 유형에 해당하는 웹 로그에 대해 세션을 새로운 세션의 생성에 해당하는 값으로 설정하고 체류 시간을 세션 시간의 값으로 설정하여 세션 정보를 전송하며,
    상기 제3 유형에 해당하는 웹 로그에 대해 세션을 새로운 세션의 생성에 해당하는 값으로 설정하고 체류 시간을 0으로 설정하여 세션 정보를 전송하는 것을 특징으로 하는 사용자 세션 정보 추출 방법.
  21. 제17항에 있어서, 상기 b) 단계 이후에
    세션 유형에 따라서 상이한 방법으로 상기 웹 로그의 타임스탬프를 업데이트하는 것을 특징으로 하는 사용자 세션 정보 추출 방법.
  22. 제17항, 제19항 내지 제21항 중 어느 한 항에 따른 사용자 세션 정보 추출 방법을 수행하는 프로그램이 기록된 컴퓨터 판독가능 기록매체.
KR1020090038403A 2009-04-30 2009-04-30 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법 KR101055871B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090038403A KR101055871B1 (ko) 2009-04-30 2009-04-30 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090038403A KR101055871B1 (ko) 2009-04-30 2009-04-30 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20100119333A KR20100119333A (ko) 2010-11-09
KR101055871B1 true KR101055871B1 (ko) 2011-08-09

Family

ID=43405412

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090038403A KR101055871B1 (ko) 2009-04-30 2009-04-30 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101055871B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101126126B1 (ko) * 2009-08-05 2012-04-12 삼성에스디에스 주식회사 웹 로그의 사용자 세션 정보 추출 장치 및 방법
KR101148002B1 (ko) * 2010-04-06 2012-05-24 국방과학연구소 웹 로봇 탐지 시스템 및 방법
US10241957B2 (en) 2012-02-06 2019-03-26 Infosys Limited Workload patterns for realistic load recreation in performance testing
KR102500695B1 (ko) * 2021-01-28 2023-02-17 주식회사 앤다스 이벤트 영상 제공 시스템, 이벤트 영상 제공 방법 및 기록 매체에 저장된 프로그램

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010097408A (ko) * 2000-04-22 2001-11-08 이태균 사용자 행동 분석 방법 및 장치
US20040073644A1 (en) 2002-10-15 2004-04-15 Koch Donald O. System and method for processing web activity data
JP2006302218A (ja) 2005-04-25 2006-11-02 Tasco System:Kk 情報処理システム
KR100823075B1 (ko) * 2007-11-29 2008-04-21 방용정 웹사이트 접속자 개개인별 실시간 로그 분석 시스템 및 그방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010097408A (ko) * 2000-04-22 2001-11-08 이태균 사용자 행동 분석 방법 및 장치
US20040073644A1 (en) 2002-10-15 2004-04-15 Koch Donald O. System and method for processing web activity data
JP2006302218A (ja) 2005-04-25 2006-11-02 Tasco System:Kk 情報処理システム
KR100823075B1 (ko) * 2007-11-29 2008-04-21 방용정 웹사이트 접속자 개개인별 실시간 로그 분석 시스템 및 그방법

Also Published As

Publication number Publication date
KR20100119333A (ko) 2010-11-09

Similar Documents

Publication Publication Date Title
AU774177B2 (en) Information collection system and information collection method on network, each using technique of internet, and recording medium in which the information collection method is recorded
US8572100B2 (en) Method and system for recording search trails across one or more search engines in a communications network
US6411998B1 (en) World wide web internet delay monitor
US6973492B2 (en) Method and apparatus for collecting page load abandons in click stream data
US20080168169A1 (en) Request tracking for analysis of website navigation
US20090024748A1 (en) Website monitoring and cookie setting
US8751184B2 (en) Transaction based workload modeling for effective performance test strategies
Sisodia et al. Web usage pattern analysis through web logs: A review
JP2017528782A (ja) ユーザとコンテンツデータとの対話によってデータをルーティングしてユーザを接続するシステムおよび方法
US20040205119A1 (en) Method and apparatus for capturing web page content development data
Nithya et al. Novel pre-processing technique for web log mining by removing global noise and web robots
Langhnoja et al. Pre-processing: procedure on web log file for web usage mining
JP2011034399A (ja) Webページの関連性抽出方法、装置、及びプログラム
KR101055871B1 (ko) 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법
US6535916B1 (en) Systems, methods and computer program products for linking transactions by multiple web site servers to web site visitors
Jyothi et al. A study on raise of web analytics and its benefits
CN103714174B (zh) 用于互联网中加速经验知识积累的信息采集方法及系统
Suguna et al. User interest level based preprocessing algorithms using web usage mining
KR101126126B1 (ko) 웹 로그의 사용자 세션 정보 추출 장치 및 방법
Shivaprasad et al. Knowledge discovery from web usage data: An efficient implementation of web log preprocessing techniques
CN106126538B (zh) 页面的转化处理方法及装置
Shrivastava et al. Extracting knowledge from user access logs
Jose et al. Application of ARIMA (1, 1, 0) model for predicting time delay of search engine crawlers.
Shu-yue et al. The study on the preprocessing in web log mining
JP5673391B2 (ja) 情報処理装置、ログ処理方法、及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140603

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150629

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160701

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170629

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180625

Year of fee payment: 8