KR100868852B1 - Visiting hours measurement method in web log analysis system - Google Patents

Visiting hours measurement method in web log analysis system Download PDF

Info

Publication number
KR100868852B1
KR100868852B1 KR1020010060910A KR20010060910A KR100868852B1 KR 100868852 B1 KR100868852 B1 KR 100868852B1 KR 1020010060910 A KR1020010060910 A KR 1020010060910A KR 20010060910 A KR20010060910 A KR 20010060910A KR 100868852 B1 KR100868852 B1 KR 100868852B1
Authority
KR
South Korea
Prior art keywords
time
web page
visit
webpage
web
Prior art date
Application number
KR1020010060910A
Other languages
Korean (ko)
Other versions
KR20030027565A (en
Inventor
이광준
송주원
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020010060910A priority Critical patent/KR100868852B1/en
Publication of KR20030027565A publication Critical patent/KR20030027565A/en
Application granted granted Critical
Publication of KR100868852B1 publication Critical patent/KR100868852B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야1. TECHNICAL FIELD OF THE INVENTION

본 발명은 웹로그 분석 시스템에서의 방문시간 측정 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.The present invention relates to a method for measuring visit time in a web analytics system and a computer readable recording medium recording a program for realizing the method.

2. 발명이 해결하려고 하는 기술적 과제2. The technical problem to be solved by the invention

본 발명은, 웹 로그를 분석하여 사용자들의 행태를 파악하기 위하여, 페이지별 기준 열람시간을 설정하여 웹 사용자들의 방문 시간을 측정하기 위한 방문시간 측정 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하고자 함.The present invention provides a computer that records a visit time measuring method for measuring visit time of web users by setting a reference reading time per page in order to analyze the web log to identify user's behavior, and a program for realizing the method. To provide a readable recording medium.

3. 발명의 해결방법의 요지3. Summary of Solution to Invention

본 발명은, 웹로그 분석 시스템에서의 방문시간 측정 방법에 있어서, 웹페이지에 대한 기준 열람시간을 초기 설정하는 단계; 및 상기 웹페이지에 접속한 사용자의 다른 웹페이지로의 전이시간[이하, "웹페이지 전이시간"이라 함]이 상기 기준 열람시간을 초과한 경우에 상기 사용자에 관한 웹페이지 방문시간을 상기 기준 열람시간으로 결정하는 웹페이지 방문시간 결정 단계를 포함함.The present invention provides a method for measuring a visit time in an analytics system, comprising: initially setting a reference reading time for a web page; And the webpage visit time for the user when the transition time of the user accessing the webpage to another webpage (hereinafter referred to as "webpage transition time") exceeds the reference viewing time. Includes steps to determine webpage visit time, as determined by time.

4. 발명의 중요한 용도4. Important uses of the invention

본 발명은 웹로그 분석 시스템 등에 이용됨.The present invention is used in a web analytics system.

웹로그 분석, 기준 열람시간, 방문시간, 방문리스트 생성Analytics, reference view time, visit time, visit list generation

Description

웹로그 분석 시스템에서의 방문시간 측정 방법{Visiting hours measurement method in web log analysis system} Visting hours measurement method in web log analysis system             

도 1 은 종래의 웹로그 분석 시스템에서 방문리스트 생성 과정에 대한 예시도.1 is an exemplary diagram for a process of generating a visit list in a conventional analytics system.

도 2 는 본 발명이 적용되는 웹로그 분석 시스템의 구성예시도.Figure 2 is an example configuration of a web analytics system to which the present invention is applied.

도 3 은 본 발명이 적용되는 웹로그 분석 시스템에서 뷰(View)를 기록한 예시도.3 is an exemplary view of recording a view in a web analytics system to which the present invention is applied.

도 4 는 상기 도 3을 통해 도출된 방문리스트에 대한 일실시예 설명도.4 is a diagram illustrating an embodiment of a visit list derived through FIG. 3;

도 5 는 본 발명에 따른 웹로그 분석 시스템에서 기준 열람시간을 나타낸 예시도.5 is an exemplary view showing a reference reading time in the analytics system according to the present invention.

도 6 은 본 발명에 따른 웹로그 분석 시스템에서의 방문시간 측정 방법에 대한 일실시예 흐름도.
6 is a flowchart illustrating a method for measuring a visit time in an analytics system according to the present invention;

* 도면의 주요 부분에 대한 부호의 설명* Explanation of symbols for the main parts of the drawings

21 : 주 전산장비 22 : 메인메모리21: main computing equipment 22: main memory

23 : 하드디스크
23: hard disk

본 발명은 웹로그 분석 시스템에서의 방문시간 측정 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 특히 웹로그를 분석하여 웹 사용자들의 행태를 파악하기 위한 방문시간 측정 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.The present invention relates to a method for measuring visit time in a web analytics system and a computer-readable recording medium recording a program for realizing the method. In particular, the visit time for analyzing web logs to grasp the behavior of web users. A computer readable recording medium having recorded thereon a measuring method and a program for realizing the method.

방문(Visit)이라고 하는 것은 하나 또는 그 이상의 뷰(View)로서 이루어지며, 이는 사용자가 웹사이트에 들어와서 어떠한 페이지들을 보고 나서 빠져나갔다는 것을 알려주는 좋은 정보이다. 그러나 명시적으로 사이트를 빠져나갔다는 정보는 없으므로 대부분의 경우 접속간 최소시간을 설정하고, 이 뷰와 뷰 사이의 시간이 이 접속간 최소시간을 초과하면 별개의 방문으로 취급하게 된다. 실제로 한 사용자가 한 번의 뷰만으로 방문을 구성하는 경우는 매우 드물며, 대부분 수차례의 뷰를 통하여 하나의 방문을 이루게 된다. 즉, 방문은 방문리스트로 구성된다.A visit is made up of one or more views, which is good information to tell you that a user has entered a website, viewed some pages, and then exited. However, there is no information about leaving the site explicitly, so in most cases, you set a minimum time between connections, and if the time between views exceeds the minimum time between connections, it is treated as a separate visit. In fact, it is very rare for a user to construct a visit with only one view, and most visits are made through several views. In other words, the visit consists of a visit list.

이 방문리스트를 효율적으로 생성하는 방법이 매우 중요하다. 뷰 리스트로부터 방문리스트를 생성하는 가장 간단하고도 종래에 주로 사용되던 방법은, 매 뷰에 대하여 접속간 최소시간만큼의 뷰를 미리보아(look-ahead) 그 사이에 동일 사용자에 대한 또 다른 뷰가 있는지를 순차적으로 검색하는 방법이다. 그러나 이 순차적 검색 방법은 접속간 최소시간 윈도우 이내에 많은 양의 웹로그 데이터가 들어있을 경우 성능에 문제를 가져오게 된다(도 1 참조).How to efficiently generate this visit list is very important. The simplest and most commonly used method of creating a visit list from a view list is to look-ahead the minimum time between connections for each view, while another view for the same user How to search sequentially. However, this sequential search method has a performance problem when a large amount of weblog data is contained within a minimum time window between connections (see FIG. 1).

종래 방문리스트 생성 과정을 상세하게 살펴보면 다음의 도 1과 같다.Looking at the process of creating a conventional visit list in detail as shown in FIG.

도 1 은 종래의 웹로그 분석 시스템에서 방문리스트 생성 과정에 대한 예시도이다.1 is an exemplary diagram for a process of generating a visit list in a conventional web analytics system.

도 1에 도시된 바와 같이, 처음에는 "TOM 15시 16분"이라는 노드에서 출발한다. 다음 노드로 진행하면서 시간이 30분 이내이고, 사용자 아이디가 TOM인 노드를 찾는다. 이 예에서 다음 다음의 노드에 "TOM 15시 26분"이라는 노드가 발견되었다. 이 노드로부터 다시 시간이 30분 이내이고, 사용자 아이디가 TOM인 노드를 찾는다. 이 예에서는 발견되지 않았으므로 이 방문리스트는 두 개의 뷰(View) 노드로 구성된다. 이 과정을 처리되지 않은 다음 노드인 "JANE 15시 19분"에 대하여 반복한다.As shown in FIG. 1, initially start at the node "TOM 15:16". Proceed to the next node and look for a node whose time is less than 30 minutes and whose user ID is TOM. In this example, the node "TOM 15:26" was found on the next node. Find the node whose time is again within 30 minutes and whose user ID is TOM. In this example, it was not found, so this visit list consists of two View nodes. This process is repeated for the next unprocessed node "JANE 15:19".

따라서 상기와 같은 방법은 접속이 많은 웹사이트에 대한 분석 시 접속간 최소시간 이내에 다수의 뷰가 있을 때 이를 처리하는데 많은 시간이 걸리게 되는 문제점이 있다. 예를 들어, 초당 1회의 뷰가 생성되는 웹로그에서 접속간 최소시간을 30분으로 설정하였을 때 매 뷰마다 60×30=1800회의 미리보기를 실행하여야 하는데, 이는 방문리스트 생성 과정 성능을 저하시키는 요인이 된다.Therefore, the above method has a problem that it takes a lot of time to process when there are a plurality of views within the minimum time between accesses when analyzing a website with a lot of access. For example, if we set the minimum time between connections in a weblog that generates one view per second to 30 minutes, 60 × 30 = 1800 previews should be executed for each view, which degrades the performance of the visit list generation process. It becomes a factor.

본 발명은, 상기한 바와 같은 문제점을 해결하기 위하여 제안된 것으로, 웹 로그를 분석하여 사용자들의 행태를 파악하기 위하여, 페이지별 기준 열람시간을 설정하여 웹 사용자들의 방문 시간을 측정하기 위한 방문시간 측정 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.The present invention has been proposed to solve the problems described above, in order to determine the behavior of the user by analyzing the web log, to determine the visit time of the web users by setting the reference time for each page visit time measurement It is an object of the present invention to provide a computer-readable recording medium storing a method and a program for realizing the method.

상기 목적을 달성하기 위한 본 발명의 방법은, 웹로그 분석 시스템에서의 방문시간 측정 방법에 있어서, 웹페이지에 대한 기준 열람시간을 초기 설정하는 단계; 및 상기 웹페이지에 접속한 사용자의 다른 웹페이지로의 전이시간[이하, "웹페이지 전이시간"이라 함]이 상기 기준 열람시간을 초과한 경우에 상기 사용자에 관한 웹페이지 방문시간을 상기 기준 열람시간으로 결정하는 웹페이지 방문시간 결정 단계를 포함한다.
또한, 상기 본 발명의 방법은, 상기 웹페이지 방문시간 결정 단계를 수행한 후에, 상기 기준 열람시간이 설정된 웹페이지에 대해 "T 분포 검정 방식"을 사용한 결과로, 소정의 사용자들의 실제접속에 따른 각각의 웹페이지 전이시간들이 임의의 유의수준을 만족함에 따라 상기 기준 열람시간을 상기 각각의 웹페이지 전이시간들을 토대로 변경하는 단계를 더 포함한다.
The method of the present invention for achieving the above object, the method of measuring the visit time in the analytics system, comprising: initially setting a reference viewing time for the web page; And the webpage visit time for the user when the transition time of the user accessing the webpage to another webpage (hereinafter referred to as "webpage transition time") exceeds the reference viewing time. Web site visit time determination step of determining by time.
In addition, the method of the present invention, after performing the web page visit time determination step, as a result of using the "T distribution test method" for the web page set the reference time, according to the actual connection of the predetermined user Changing the reference browsing time based on the respective webpage transition times as each webpage transition time satisfies any significance level.

한편, 본 발명은, 프로세서를 구비한 웹로그 분석 시스템에, 웹페이지에 대한 기준 열람시간을 초기 설정하는 기능; 및 상기 웹페이지에 접속한 사용자의 다른 웹페이지로의 전이시간[이하, "웹페이지 전이시간"이라 함]이 상기 기준 열람시간을 초과한 경우에 상기 사용자에 관한 웹페이지 방문시간을 상기 기준 열람시간으로 결정하는 웹페이지 방문시간 결정 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
또한, 상기 본 발명은, 상기 웹페이지 방문시간 결정 기능을 수행한 후에, 상기 기준 열람시간이 설정된 웹페이지에 대해 "T 분포 검정 방식"을 사용한 결과로, 소정의 사용자들의 실제접속에 따른 각각의 웹페이지 전이시간들이 임의의 유의수준을 만족함에 따라 상기 기준 열람시간을 상기 각각의 웹페이지 전이시간들을 토대로 변경하는 기능을 더 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
On the other hand, the present invention, a web analytics system equipped with a processor, the function of initially setting the reference viewing time for the web page; And the webpage visit time for the user when the transition time of the user accessing the webpage to another webpage (hereinafter referred to as "webpage transition time") exceeds the reference viewing time. Provided is a computer readable recording medium having recorded thereon a program for realizing a time determining function of a web page visit time determined by time.
In addition, the present invention, after performing the web page visit time determination function, as a result of using the "T distribution test method" for the web page set the reference reading time, each of the user according to the actual connection A computer readable recording medium having recorded thereon a program for further realizing a function of changing the reference browsing time based on the respective web page transition times as the webpage transition times satisfy any significance level.

상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 2 는 본 발명이 적용되는 웹로그 분석 시스템의 구성예시도로서, 장비는 특정 기종이나 특정 운영체제에 국한되지 않고 본 발명에서 제안하는 기본적 기능을 갖춘 시스템이면 모두 운영 가능하다.2 is an exemplary view illustrating a configuration of a web analytics system to which the present invention is applied, and the equipment is not limited to a specific model or a specific operating system, and may be operated as long as the system has basic functions proposed by the present invention.

도 2에 도시된 바와 같이, 입력 데이터와 출력 데이터를 보관하기 위한 하드디스크(23)를 가진 주 전산장비(21)와 이를 처리하는 메인메모리(22)는 소프트웨어 프로그램(방문시간 계산 프로그램, 기준 열람시간 변경 프로그램)으로 구현되어 있음을 잘 알 수 있다.As shown in Fig. 2, the main computer 21 having a hard disk 23 for storing input data and output data and the main memory 22 for processing the same are software programs (visit time calculation program, reference reading). You can see that it is implemented as a time change program.

도 3 은 본 발명이 적용되는 웹로그 분석 시스템에서 뷰(View)를 기록한 예시도이다.3 is an exemplary view of recording a view in a web analytics system to which the present invention is applied.

웹은 그 특성상 한 차례의 자료(페이지)를 전송하고 설정이 종료되기 때문에 그 페이지를 받아서 보고 있는 사용자가 과연 그 페이지를 언제까지 보고 있는가에 대한 명확한 정보를 알 수 없다.Due to its nature, the web transmits one set of data (pages) and the setting is completed, so there is no clear information about how long a user who receives the page is viewing the page.

도 3에 도시된 바와 같이, 웹 서버는 도 3과 같은 형식의 웹로그를 생성한다. 웹로그의 한 행은 한 번의 접속(Hit)에 대한 정보를 나타내며, 어디서(호스트(Host) 필드), 누가(사용자(AuthUser) 필드), 언제(시간(Time) 필드), 어떤(요청(Request) 필드) 데이터를 가져갔는지를 나타낸다. 하나의 페이지가 여러 개의 그림 등으로 이루어졌을 경우, 사용자가 한 페이지를 보았을 때 이는 웹로그에 여러 번의 접속으로 나타나게 된다. 이와 같이, 사용자가 완성된 하나의 페이지를 보는 것을 뷰(View)라고 하며, 대부분의 경우 접속 기록에서 이미지 파일과 같은 부분을 제거하면 뷰가 된다. 방문(Visit)이라고 하는 것은 하나 또는 그 이상의 뷰로서 이루어지며, 이는 사용자가 웹사이트에 들어와서 어떠한 일련의 페이지들을 보고 나서 빠져나갔다는 것을 알려주는 좋은 정보이다.As shown in FIG. 3, the web server generates a weblog of the form shown in FIG. 3. One line of weblog shows information about one hit, where (Host field), who (AuthUser field), when (Time field), and what (Request (Field) Indicates whether data has been taken. When a page consists of several pictures, when a user views a page, it appears as multiple connections to the weblog. In this way, when a user sees a completed page, it is called a view, and in most cases, removing a portion such as an image file from the connection record becomes a view. A visit is made up of one or more views, which is good information to let the user know that a user has entered a website, viewed some set of pages, and then exited.

즉, 하나 이상의 접속이 모여 뷰를 이루며, 하나 이상의 뷰가 모여 방문을 이룬다. 도 3의 예에서는 두 개 또는 세 개의 접속이 모여 뷰를 이루고 있음을 알 수 있다.That is, one or more connections gather to form a view, and one or more views form a visit. In the example of FIG. 3, it can be seen that two or three connections form a view.

도 3의 뷰를 이용하여 사용자별로 분류하면 도 4와 같은 방문리스트가 생성된다.When classified by user using the view of FIG. 3, a visit list as shown in FIG. 4 is generated.

접속과 뷰는 그 정의에 의해 웹로그로부터 명확히 추출할 수 있다. 그러나 방문은 실제 사용자가 요청한 페이지를 보았는가 안 보았는가, 보았다면 얼마나 오랫동안 보았는가에 대한 정보가 없기 때문에 대부분의 경우 추측에 의해 구성하게 된다. 도 4의 예에서 TOM이 15시 36분에 "menu.html" 페이지를 보고 16시38분에 "user.php" 페이지를 보았는데, 이를 하나의 방문으로 구성할 것인가 아니면 별개의 방문으로 구성할 것인가는 대부분 운영자의 직관에 의해 이루어진다. 실제로 사용자가 사이트를 빠져나갔다는 명시적인 정보가 없으므로, 대부분의 경우 접속간 최소시간을 설정하고, 이 뷰와 뷰 사이의 시간이 이 접속간 최소시간을 초과하면 별개의 방문으로 취급하게 된다. 이 접속간 최소 시간을 30분으로 설정한다면 도 4에서 TOM의 방문은 두 번으로 계산되는 것이다.Connections and views can be explicitly extracted from the weblog by their definition. However, in most cases, the visit is constructed by guessing because there is no information about whether or not the actual user requested the page. In the example of FIG. 4, the TOM saw the "menu.html" page at 15:36 and the "user.php" page at 16:38. Should it be configured as a visit or as a separate visit? This is mostly done by the intuition of the operator. In fact, there is no explicit information that the user has left the site, so in most cases you set a minimum time between connections, and if the time between this view exceeds the minimum time between connections, it is treated as a separate visit. If the minimum time between connections is set to 30 minutes, the visit of the TOM in FIG. 4 is calculated twice.

접속간 최소 시간을 30분으로 설정하였다는 것은 사용자들이 그 기간 중에는 그 페이지를 관심있게 지켜보고 있다고 가정하여 분석하는 것이다. 그러나 실제 사용자들은 일련의 페이지를 관심 있게 지켜볼 수도 있고 아니면 그 사이사이에 다른 작업을 병행하여 수행할 수도 있다.Setting the minimum time between connections to 30 minutes analyzes assuming that users are watching the page with interest during that period. But real users can watch a series of pages with interest, or do other tasks in between.

이제부터, 도 5 및 도 6을 참조하여 웹로그 분석 시스템에서의 방문시간 측정 방법에 대해서 살펴보기로 한다.Now, the visit time measurement method in the web analytics system will be described with reference to FIGS. 5 and 6.

도 6 은 본 발명에 따른 웹로그 분석 시스템에서의 방문시간 측정 방법에 대한 일실시예 흐름도이다.6 is a flowchart illustrating a method for measuring a visit time in an analytics system according to the present invention.

도 6에 도시된 바와 같이, 우선 웹페이지를 구성하는 웹서버의 페이지별 초기값(tp)을 생성한다(601).As shown in FIG. 6, first, an initial value t p of each page of a web server constituting a web page is generated (601).

페이지의 내용이 단순한 경우에는 수십 초에 불과할 수도 있고, 복잡하고 어려운 내용을 담고 있는 페이지는 수십 분까지 이를 수도 있다. 물론, 이는 이 페이지를 참조하는 사용자들의 특성에 따라 다를 수 있지만, 초기 설정은 객관적 지표인 페이지의 크기와 복잡도 등을 고려하여 웹서버 관리자의 직관적 판단에 의해 결정한다.If the content of the page is simple, it can be tens of seconds, or a page containing complex and difficult content can be up to tens of minutes. Of course, this may vary according to the characteristics of the users referencing this page, but the initial setting is determined by the web server administrator's intuitive judgment in consideration of the size and complexity of the page as an objective indicator.

이어서, 각 페이지마다 기준 시간이 설정되면 이의 운용에 들어간다(602).Subsequently, if a reference time is set for each page, it enters its operation (602).

페이지 P1의 기준열람시간을 3분으로 설정하였을 때 페이지 P1에서 P2로의 전이가 5분 후에 발생하였다면 사용자는 5분간 P1을 열람한 것이 아니라 3분은 페이지를 열람하고 나머지 2분은 다른 작업을 한 것으로 가정한다. 이렇게 함으로써 보다 정확한 방문 시간을 측정할 수 있다.Page in a page P 1 when the reference viewing time of the P 1 have set to 3 minutes, If the transition to the P 2 occurs in 5 minutes, the user 3 minutes, rather than the reading for 5 minutes P 1 is viewing a page and the remaining two minutes, Suppose you have done something else. This will allow you to measure your visit time more accurately.

이를 도 3의 예에 적용시켜 보면, TOM은 15시15분부터 16시38분까지 1시간 23분간 이 사이트에 머문 것이 아니라 실제로는 5분간 머물렀다고 방문 시간을 추측하게 된다. 이 방법을 적용하면 사이트 방문객의 평균 방문 시각을 정확히 계산할 수 있고, 배너 광고 등의 단가를 설정할 경우에도 이 정보를 이용할 수 있다.Applying this to the example of FIG. 3, the TOM assumes that the visit time is actually 5 minutes rather than staying at this site for 15 hours from 15:15 to 16:38. By applying this method, it is possible to accurately calculate the average visit time of site visitors, and use this information when setting unit prices such as banner advertisements.

실제 서버 운용 과정에서는 이 페이지별 기준 열람시간을 사용자의 실제 방문 시간을 기준으로 보정한다. 즉, 페이지 관람시간 재계산 및 검증 과정을 거쳐(603), 새로운 페이지 기준시간을 설정한다(604).In the actual server operation process, the reference reading time for each page is corrected based on the actual visit time of the user. That is, the page viewing time is recalculated and verified (603), and a new page reference time is set (604).

예를 들어, 기준시간을 3분으로 설정한 페이지가 계속 2분 이내에 다른 페이지로 넘어가는 것이 발견되면 이 페이지의 기준 시간은 3분에서 2분 이내의 어떤 값으로 변경되어야 할 것이다.For example, if a page with a reference time set to three minutes is found to continue to another page within two minutes, the reference time on this page should be changed to a value within three to two minutes.

여기서, 동적으로 페이지별 기준 열람시간을 정확하게 변경하는 방법은 통계학에서 사용하는 T분포 검정 방법을 사용한다. T분포 검정이란, 어떠한 가설(예를 들어, 페이지 P1의 기준 열람시간은 3분이다.)에 대하여 실제 데이터를 관측하여 이 가설을 기각할 것인가를 결정하는 검정법이며, 여기서는 간단한 내용만 설명한다.In this case, the T distribution test method used in statistics is used to dynamically change the reference reading time for each page. T distribution black is, and any hypothesis assays that by observing the actual data with respect to (e.g., page reference viewing time of P 1 is 3 minutes.) Determining whether or not to reject this hypothesis, will be described here only simple information, .

페이지 P에 대한 기준 열람 시간을 t로 가정하였을 때 n번의 해당 페이지 접속이 일어났다고 가정하자. 그러면, 실제 페이지 열람시간이 (t1, t2, …, tn )으로 나타날 것이다.Suppose that n corresponding page accesses occur when a reference reading time for page P is assumed to be t. Then, the actual page browsing time will be represented by (t 1 , t 2 ,..., T n ).

이 데이터에 대하여 가설을 "P의 기준 열람시간이 t이다."로 놓고, 임의의 유의 수준(보통 95%를 많이 사용)으로 검증하면 가설의 기각 또는 유지 여부가 결정된다.For this data, if the hypothesis is set to "the reference reading time of P is t", and verified at any significance level (typically 95% is used), it is determined whether the hypothesis is rejected or maintained.

가설이 기각되면 페이지 P의 기준 열람시간을 t에서 (t1, t2, …, tn)의 평균값으로 바꾸어 주고, 가설이 유지되면 페이지 P의 기준 열람시간을 변경하지 않는다. 이 작업은 매일 새벽 또는 며칠에 한 번 정도 배치작업을 통해서 수행하여 서버의 부하를 최소화한다.If the hypothesis is rejected, the reference reading time of page P is changed from t to an average value of (t 1 , t 2 ,..., T n ). If the hypothesis is maintained, the reference reading time of page P is not changed. This is done by batching every day or every few days to minimize the load on the server.

이후, 방문 시간을 계산하고(605) 리포트를 작성하여(606) 결과를 보고한다(607).The visit time is then calculated (605) and a report generated (606) to report the results (607).

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.The method of the present invention as described above may be implemented as a program and stored in a computer-readable recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.).

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
The present invention described above is not limited to the above-described embodiments and the accompanying drawings, and various substitutions, modifications, and changes are possible in the art without departing from the technical spirit of the present invention. It will be clear to those of ordinary knowledge.

상기한 바와 같은 본 발명은, 웹사용자들의 방문 시간을 측정하여 사용자 행태를 분석하는 시스템 구축에 사용할 수 있으며, 전체 방문자들의 평균 방문 시간 등을 측정할 수 있고, 이를 이용하여 페이지별 배너 광고 단가 설정에도 적용할 수 있는 효과가 있다.The present invention as described above, can be used in the construction of a system that analyzes the user behavior by measuring the visit time of the web users, can measure the average visit time of all visitors, such as setting the banner advertisement price per page using this There is also an effect that can be applied.

Claims (6)

웹로그 분석 시스템에서의 방문시간 측정 방법에 있어서,In the visit time measurement method in the Analytics system, 웹페이지에 대한 기준 열람시간을 초기 설정하는 단계; 및Initial setting a reference reading time for the web page; And 상기 웹페이지에 접속한 사용자의 다른 웹페이지로의 전이시간[이하, "웹페이지 전이시간"이라 함]이 상기 기준 열람시간을 초과한 경우에 상기 사용자에 관한 웹페이지 방문시간을 상기 기준 열람시간으로 결정하는 웹페이지 방문시간 결정 단계When the user's access to the web page transition time to another web page (hereinafter referred to as "web page transition time") exceeds the reference viewing time, the webpage visit time for the user is referred to the reference viewing time. Steps to determine webpage visit time 를 포함하는 웹로그 분석 시스템에서의 방문시간 측정 방법.Visiting time measurement method in the analytics system comprising a. 제 1 항에 있어서,The method of claim 1, 상기 웹페이지 방문시간 결정 단계를 수행한 후에, 상기 기준 열람시간이 설정된 웹페이지에 대해 "T 분포 검정 방식"을 사용한 결과로, 소정의 사용자들의 실제접속에 따른 각각의 웹페이지 전이시간들이 임의의 유의수준을 만족함에 따라 상기 기준 열람시간을 상기 각각의 웹페이지 전이시간들을 토대로 변경하는 단계After performing the web page visit time determining step, as a result of using the "T distribution test method" for the web page for which the reference reading time is set, each web page transition times according to actual accesses of predetermined users are random. Changing the reference reading time based on the respective webpage transition times as the significance level is satisfied. 를 더 포함하는 웹로그 분석 시스템에서의 방문시간 측정 방법.Visiting time measurement method in the analytics system further comprising. 제 2 항에 있어서,The method of claim 2, 상기 기준 열람시간을 상기 각각의 웹페이지 전이시간들을 토대로 변경하는 단계는,The step of changing the reference viewing time based on the respective webpage transition times, 상기 각각의 웹페이지 전이시간들의 평균값으로서 상기 기준 열람시간을 변경하는 것을 특징으로 하는 웹로그 분석 시스템에서의 방문시간 측정 방법.And changing the reference reading time as an average value of the respective web page transition times. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,The method according to any one of claims 1 to 3, 상기 초기 설정한 웹페이지에 대한 기준 열람시간은,The reference reading time for the initially set web page, 해당 웹페이지의 크기 및 복잡도에 따라 상기 기준 열람시간의 값이 결정되는 것을 특징으로 하는 웹로그 분석 시스템에서의 방문시간 측정 방법.The visit time measurement method of the web analytics system, characterized in that the value of the reference reading time is determined according to the size and complexity of the web page. 프로세서를 구비한 웹로그 분석 시스템에,In an analytics system with a processor, 웹페이지에 대한 기준 열람시간을 초기 설정하는 기능; 및A function of initially setting a reference reading time for a web page; And 상기 웹페이지에 접속한 사용자의 다른 웹페이지로의 전이시간[이하, "웹페이지 전이시간"이라 함]이 상기 기준 열람시간을 초과한 경우에 상기 사용자에 관한 웹페이지 방문시간을 상기 기준 열람시간으로 결정하는 웹페이지 방문시간 결정 기능When the user's access to the web page transition time to another web page (hereinafter referred to as "web page transition time") exceeds the reference viewing time, the webpage visit time for the user is referred to the reference viewing time. Web page visit time decision function 을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium having recorded thereon a program for realizing this. 제 5 항에 있어서,The method of claim 5, wherein 상기 웹페이지 방문시간 결정 기능을 수행한 후에, 상기 기준 열람시간이 설정된 웹페이지에 대해 "T 분포 검정 방식"을 사용한 결과로, 소정의 사용자들의 실제접속에 따른 각각의 웹페이지 전이시간들이 임의의 유의수준을 만족함에 따라 상기 기준 열람시간을 상기 각각의 웹페이지 전이시간들을 토대로 변경하는 기능After performing the web page visit time determination function, as a result of using the "T distribution test method" for the web page for which the reference viewing time is set, each web page transition times according to actual accesses of predetermined users are randomly set. A function of changing the reference reading time based on each webpage transition time as the significance level is satisfied 을 더 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium that records a program for further realization.
KR1020010060910A 2001-09-29 2001-09-29 Visiting hours measurement method in web log analysis system KR100868852B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010060910A KR100868852B1 (en) 2001-09-29 2001-09-29 Visiting hours measurement method in web log analysis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010060910A KR100868852B1 (en) 2001-09-29 2001-09-29 Visiting hours measurement method in web log analysis system

Publications (2)

Publication Number Publication Date
KR20030027565A KR20030027565A (en) 2003-04-07
KR100868852B1 true KR100868852B1 (en) 2008-11-14

Family

ID=29563074

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010060910A KR100868852B1 (en) 2001-09-29 2001-09-29 Visiting hours measurement method in web log analysis system

Country Status (1)

Country Link
KR (1) KR100868852B1 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070156382A1 (en) 2005-12-29 2007-07-05 Graham James L Ii Systems and methods for designing experiments
KR100698880B1 (en) * 2006-09-26 2007-03-23 (주)다하미 커뮤니케이션즈 Service method of analytic reading information for mass-media contents and therefor service apparatus
US8392350B2 (en) 2007-07-03 2013-03-05 3M Innovative Properties Company System and method for assigning pieces of content to time-slots samples for measuring effects of the assigned content
CN101785022B (en) * 2007-07-03 2016-06-01 3M创新有限公司 For produce can by content assignment to time-slot samples thereon for measure assigned content effect system and method
US8458103B2 (en) 2009-01-07 2013-06-04 3M Innovative Properties Company System and method for concurrently conducting cause-and-effect experiments on content effectiveness and adjusting content distribution to optimize business objectives
KR101126126B1 (en) * 2009-08-05 2012-04-12 삼성에스디에스 주식회사 Apparatus and method for extracting user session information of web log
KR101112493B1 (en) * 2009-08-14 2012-03-14 삼성에스디에스 주식회사 Apparatus and method for measuring visit time of visitor in web log analysis
CN113010831A (en) * 2021-04-06 2021-06-22 金宝贝网络科技(苏州)有限公司 Thermodynamic diagram optimization method, thermodynamic diagram optimization system and storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000024517A (en) * 2000-02-18 2000-05-06 김삼근 Page Logging System for Web Mining Systems
KR20010044515A (en) * 2001-03-02 2001-06-05 임찬웅 System for computing connection statistics of Web Sites and Method thereof
KR20010078638A (en) * 2000-02-09 2001-08-21 곽동욱 System and method for counting an web access, and system and method for advertising using the same
KR20020066645A (en) * 2001-02-13 2002-08-21 박왕근 Method and Device for Providing Contents which is Able to Detect User's Preference

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010078638A (en) * 2000-02-09 2001-08-21 곽동욱 System and method for counting an web access, and system and method for advertising using the same
KR20000024517A (en) * 2000-02-18 2000-05-06 김삼근 Page Logging System for Web Mining Systems
KR20020066645A (en) * 2001-02-13 2002-08-21 박왕근 Method and Device for Providing Contents which is Able to Detect User's Preference
KR20010044515A (en) * 2001-03-02 2001-06-05 임찬웅 System for computing connection statistics of Web Sites and Method thereof

Also Published As

Publication number Publication date
KR20030027565A (en) 2003-04-07

Similar Documents

Publication Publication Date Title
Menascé et al. A methodology for workload characterization of e-commerce sites
US9317539B2 (en) Time-series database setup automatic generation method, setup automatic generation system and monitoring server
JP4369868B2 (en) Acquisition and display of site visit path data
Stewart et al. Exploiting nonstationarity for performance prediction
Kallepalli et al. Measuring and modeling usage and reliability for statistical web testing
US9665659B1 (en) System and method for website experimentation
US20080183664A1 (en) Presenting web site analytics associated with search results
US8504558B2 (en) Framework to evaluate content display policies
JPH11328226A (en) Document access estimating method for group of linked documents and device therefor
JP2004252911A (en) Search keyword analysis program, system and method
JP2010117757A (en) Performance monitoring system and performance monitoring method
US20120331128A1 (en) Method and a system for analysing impact of changes to content of a website
US20080320124A1 (en) Data-assisted content programming
Dasu Data glitches: Monsters in your data
CN109214647B (en) Method for analyzing overflow effect among online access channels based on network access log data
KR100868852B1 (en) Visiting hours measurement method in web log analysis system
US7035772B2 (en) Method and apparatus for calculating data integrity metrics for web server activity log analysis
Wang et al. Characterizing customer groups for an e-commerce website
Huntington et al. Website usage metrics: A re-assessment of session data
Arellano-Uson et al. Protocol-agnostic method for monitoring interactivity time in remote desktop services
CN109711849B (en) Ether house address portrait generation method and device, electronic equipment and storage medium
Huynh et al. Empirical observations on the session timeout threshold
Noskov Smart City Webgis Applications: Proof of Work Concept For High-Level Quality-Of-Service Assurance
US20230078577A1 (en) Query result set processing
US9787786B1 (en) Determining device counts

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121101

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20131101

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee