KR20000024517A - 웹 마이닝 시스템을 위한 페이지 로깅 시스템 - Google Patents

웹 마이닝 시스템을 위한 페이지 로깅 시스템 Download PDF

Info

Publication number
KR20000024517A
KR20000024517A KR1020000007701A KR20000007701A KR20000024517A KR 20000024517 A KR20000024517 A KR 20000024517A KR 1020000007701 A KR1020000007701 A KR 1020000007701A KR 20000007701 A KR20000007701 A KR 20000007701A KR 20000024517 A KR20000024517 A KR 20000024517A
Authority
KR
South Korea
Prior art keywords
page
user
logging system
web
information
Prior art date
Application number
KR1020000007701A
Other languages
English (en)
Inventor
김삼근
이진배
윤선희
Original Assignee
김삼근
이진배
윤선희
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김삼근, 이진배, 윤선희 filed Critical 김삼근
Priority to KR1020000007701A priority Critical patent/KR20000024517A/ko
Publication of KR20000024517A publication Critical patent/KR20000024517A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 웹 마이닝 시스템에서의 사용자 세션 파일 생성 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 웹 브라우저로부터 사용자 정보를 직접 획득하여 정확하고 효과적인 사용자 세션 파일을 생성하는 방법을 제공하고자 함.
3. 본 발명의 해결 방법의 요지
본 발명은, 웹 마이닝 시스템에 적용되는 사용자 세션 파일을 생성하는데 있어서, 각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 단계; 각 페이지에 삽입된 코드에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료를 획득하는 단계; 페이지 로거로부터 획득한 자료를 이용하여 페이지 로깅 시스템의 로그 처리기에 의하여 사용자 세션 파일을 생성하여 데이터베이스에 기록하는 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 웹 마이닝 시스템에 이용됨.

Description

웹 마이닝 시스템을 위한 페이지 로깅 시스템{Page Logging System for Web Mining Systems}
본 발명은 웹 마이닝 시스템에서 필수적으로 요구되는 데이터 전처리 과정을 수행하지 않고 정확한 사용자 세션 파일을 얻을 수 있는 페이지 로깅 시스템 및 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
종래의 웹 마이닝 시스템은 웹 서버의 공통 로그 파일에 어떤 사용자가 하나의 웹 페이지를 방문한 경우 그 페이지에 대한 정보뿐만 아니라 그 페이지에서 사용자가 본 모든 정보(예: 그림 파일 등)가 하나의 항목으로 기록되었기 때문에 이러한 불필요한 정보를 제거하는 데이터 클리닝 작업이 필수적으로 요구되었다.
또한 사용자 대부분이 로컬 캐쉬를 사용하기 때문에 한 세션에 2회 이상 방문하는 경우에 두번째 이후부터는 그 페이지에 대한 기록이 공통 로그 파일에 남지 않아 정확한 데이터를 얻을 수 없다. 이 문제를 해결하기 위해 종래의 웹 마이닝 시스템은 쿠키를 사용하여 해결하고자 하였으나, 쿠키를 이용하는 방법 역시 기본적으로 사용자에 대한 정보를 추적하는 것이 아니라 웹 브라우저를 추적하는 방법이기 때문에 한계가 있었다. 이와 비슷한 문제점으로 프락시 서버를 사용하는 경우 사용자의 IP조차도 구분할 수 없는 경우가 발생한다. 이러한 문제점을 해결하기 위하여 종래의 기술은 폼을 이용하여 사용자로 하여금 사용자 정보를 등록하도록 하는 방법을 취했다. 그러나 이 방법 역시 사용자가 거짓 정보를 입력한다거나 사용자의 개인 정보 유출을 우려하여 등록하지 않는 경우에는 정확한 사용자 정보를 얻을 수 없었다.
따라서, 상기한 바와 같은 제반 문제점을 해결하기 위해 안출된 본 발명은, 웹 마이닝 시스템에서 필수적으로 요구하는 정확한 사용자 세션 파일 생성을 위해, 사용자가 각 웹 페이지를 방문할 때마다 관련 정보를 수집하는 페이지 로거와 페이지 로거로부터 수집된 자료를 처리하여 정확한 사용자 세션 파일을 생성하는 로그 처리기로 구성된 페이지 로깅 시스템 및 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1은 본 발명이 적용되는 일반적인 웹 마이닝 시스템의 구성예시도.
도 2는 본 발명에 따른 웹 마이닝 시스템에서의 페이지 로깅 시스템의
구성도.
도 3은 본 발명에 따른 페이지 로깅 시스템의 개념도.
도 4는 본 발명에 따른 페이지 로깅 시스템의 일실시예 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
301 : 웹 브라우저 302 : 웹 서버 로그 파일
303 : 페이지 로거 304 : 로그 처리기
305 : 페이지 접근정보 데이터베이스 306 : 사용자 세션 파일
상기 목적을 달성하기 위한 본 발명은, 웹 마이닝 시스템에 적용되는 사용자 세션 파일을 생성하는데 있어서, 각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 제 1 단계; 상기 제 1 단계에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료(사용자의 계정, 사용자의 URL, 사용자의 로그인 시간, 사용자가 그 페이지를 본 시간 등)를 획득하는 제 2 단계; 상기 제 2 단계에서 획득한 자료를 이용하여 페이지 로깅 시스템의 로그 처리기에 의하여 사용자 세션 파일을 생성하여 페이지 접근정보 데이터베이스에 기록하는 제 3 단계를 포함한다.
또한, 본 발명은 프로세서를 구비한 웹 마이닝 시스템에, 각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 제 1 기능; 상기 제 1 기능에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료(사용자의 계정, 사용자의 URL, 사용자의 로그인 시간, 사용자가 그 페이지를 본 시간 등)를 획득하는 제 2 기능; 상기 제 2 기능에서 획득한 자료를 이용하여 페이지 로깅 시스템의 로그 처리기에 의하여 사용자 세션 파일을 생성하여 페이지 접근정보 데이터베이스에 기록하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 내용을 상세히 설명한다.
도 1은 본 발명이 적용되는 웹 마이닝 시스템의 구성예시도로서, 웹 브라우저(101), 웹 서버(102), 데이터 전처리기(103), 사용자 세션 파일(104), 트랜잭션 파일(105) 및 웹 마이닝 시스템(106)을 구비한다.
도면에 도시된 바와 같이, 웹 브라우저(101)가 웹 서버에 접근하면 웹 서버(102)의 로그 파일에 방문 자료가 기록된다. 데이터 전처리기(103)는 이 로그 파일의 자료를 이용하여 데이터 클리닝, 사용자 구분, 세션 구분 등의 과정에 의해 사용자 세션 파일(104)을 생성하게 된다.
일반적으로 웹 마이닝 시스템(106)의 목적이 관계 규칙 생성이라면 트랜잭션 구분기(105)를 통하여 트랜잭션 파일(105)을 생성하여 웹 마이닝을 수행하는 방법을 사용한다.
도 2는 본 발명이 제시하는 페이지 로깅 시스템에 관한 설명도이다.
도면에 도시된 바와 같이, 페이지 로깅 시스템(203)은 페이지 로깅 시스템을 구동하는 코드 부분을 포함하고 있는 웹 브라우저(201)로부터 사용자 정보를 획득하여 직접 사용자 세션 파일(205)을 생성함으로써 데이터 전처리기(204)의 필요성을 제거함은 물론 종래의 웹 서버 로그 파일(202)에서 발생되는 불필요한 정보를 하나의 항목으로 기록하는 문제, 로컬 캐쉬 및 프락시 서버를 사용하는 경우에 파생되는 문제 등을 해결한다.
도 3은 본 발명이 적용되는 페이지 로깅 시스템의 구성 요소들인 페이지 로거와 로그 처리기에 관한 상세한 설명도이다.
도면에 도시된 바와 같이, 페이지 로깅 시스템은 웹 브라우저(301)로부터 사용자 정보를 획득하는 페이지 로거(303), 페이지 로거(303)로부터 획득한 정보를 처리하여 페이지 접근정보 데이터베이스에 기록함으로써 사용자 세션 파일을 생성하는 로그 처리기(305)로 구성된다.
도 4는 본 발명에 따른 페이지 로깅 시스템의 일실시예 흐름도이다.
도면에 도시된 바와 같이, 사용자의 웹 브라우저에서 웹 서버의 페이지 로거가 포함된 문서를 열면 카운터가 1부터 시작한다(401). 그 페이지를 방문한 사용자가 웹 브라우저를 종료하거나 다른 페이지로 이동한 것인 가를 확인한 후(402), 이동하지 않은 경우는 카운터를 계속 1씩 증가시켜 방문자가 그 페이지를 본 시간을 계산하고(403), 사용자가 브라우저를 종료하거나 다른 페이지로 이동하면 클라이언트의 쿠키, 카운터 등 로깅에 필요한 정보들을 웹 서버의 로그 처리기에 전달한다(404). 서버에서는 클라이언트 쪽의 페이지 로거로부터 전달된 정보를 저장하고(405), 이 정보와 함께 사용자가 시스템에 로그인 한 시간, 사용자가 방문한 페이지의 URL, 사용자의 웹 브라우저의 종류 등 부가적인 정보를 추가하여 페이지 접근 정보 데이터베이스에 저장한다(406). 이 데이터베이스에 저장된 내용이 바로 웹 마이닝 시스템의 목적에 따라 다양하게 포맷하여 사용할 수 있는 사용자 세션 파일이 된다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기와 같은 본 발명은, 웹 마이닝 시스템에서 공통 웹 로그 파일로부터 얻은 자료를 이용하여 사용자 세션 파일을 생성하는 데이터 전처리기를 거치지 않고, 각 페이지마다 웹 브라우저로부터 직접 사용자 정보를 획득하여 정확한 사용자 세션 파일을 생성함으로써 데이터 전처리 과정에 과다하게 투입되었던 노력을 크게 줄일 수 있고, 또한 사용자가 로컬 캐쉬 및 프락시 서버를 사용함으로써 야기되는 부정확한 사용자 정보가 아닌 정확한 사용자 정보를 획득하는 효과가 있다.

Claims (2)

  1. 웹 마이닝 시스템에 적용되는 사용자 세션 파일을 생성하는데 있어서,
    각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 제 1 단계;
    상기 제 1 단계에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료(사용자의 계정, 사용자의 URL, 사용자의 로그인 시간 등)를 획득하는 제 2 단계;
    상기 제 2 단계에서 획득한 정보와 함께 페이지 로깅 시스템의 로그 처리기에 의하여 획득한 정보를(사용자가 그 페이지를 본 시간 등) 추가하여 페이지 접근정보 데이터베이스에 기록하는 제 3 단계
    를 포함하는 웹 마이닝 시스템에서의 사용자 세션 파일 생성 방법.
  2. 프로세서를 구비한 웹 마이닝 시스템에,
    각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 제 1 기능;
    상기 제 1 기능에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료(사용자의 계정, 사용자의 URL, 사용자의 로그인 시간 등)를 획득하는 제 2 기능;
    상기 제 2 기능에서 획득한 정보와 함께 페이지 로깅 시스템의 로그 처리기에 의하여 획득한 정보를(사용자가 그 페이지를 본 시간 등) 추가하여 페이지 접근정보 데이터베이스에 기록하는 제 3 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020000007701A 2000-02-18 2000-02-18 웹 마이닝 시스템을 위한 페이지 로깅 시스템 KR20000024517A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000007701A KR20000024517A (ko) 2000-02-18 2000-02-18 웹 마이닝 시스템을 위한 페이지 로깅 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000007701A KR20000024517A (ko) 2000-02-18 2000-02-18 웹 마이닝 시스템을 위한 페이지 로깅 시스템

Publications (1)

Publication Number Publication Date
KR20000024517A true KR20000024517A (ko) 2000-05-06

Family

ID=19647567

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000007701A KR20000024517A (ko) 2000-02-18 2000-02-18 웹 마이닝 시스템을 위한 페이지 로깅 시스템

Country Status (1)

Country Link
KR (1) KR20000024517A (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000058869A (ko) * 2000-07-03 2000-10-05 권혁도 인터넷을 이용한 정보의 수요공급 매개시스템
KR20020020095A (ko) * 2000-09-07 2002-03-14 김우섭 웹 사용자 이동경로의 파악방법
KR20030060521A (ko) * 2002-01-09 2003-07-16 콤텔시스템(주) 고객데이터 분석 시스템
KR100433531B1 (ko) * 2001-12-11 2004-05-31 삼성전자주식회사 사용자 개인 정보 데이터 관리 방법, 사용자 개인 정보 데이터 관리 컴퓨터 및 기록매체
KR100868852B1 (ko) * 2001-09-29 2008-11-14 주식회사 케이티 웹로그 분석 시스템에서의 방문시간 측정 방법
KR100972455B1 (ko) * 2008-04-24 2010-07-26 주식회사 다음커뮤니케이션 검색 히스토리 서비스 방법 및 시스템
CN108319651A (zh) * 2017-12-28 2018-07-24 南京烽火软件科技有限公司 一种互联网信息发掘方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000058869A (ko) * 2000-07-03 2000-10-05 권혁도 인터넷을 이용한 정보의 수요공급 매개시스템
KR20020020095A (ko) * 2000-09-07 2002-03-14 김우섭 웹 사용자 이동경로의 파악방법
KR100868852B1 (ko) * 2001-09-29 2008-11-14 주식회사 케이티 웹로그 분석 시스템에서의 방문시간 측정 방법
KR100433531B1 (ko) * 2001-12-11 2004-05-31 삼성전자주식회사 사용자 개인 정보 데이터 관리 방법, 사용자 개인 정보 데이터 관리 컴퓨터 및 기록매체
KR20030060521A (ko) * 2002-01-09 2003-07-16 콤텔시스템(주) 고객데이터 분석 시스템
KR100972455B1 (ko) * 2008-04-24 2010-07-26 주식회사 다음커뮤니케이션 검색 히스토리 서비스 방법 및 시스템
CN108319651A (zh) * 2017-12-28 2018-07-24 南京烽火软件科技有限公司 一种互联网信息发掘方法
CN108319651B (zh) * 2017-12-28 2022-02-15 南京烽火星空通信发展有限公司 一种互联网信息发掘方法

Similar Documents

Publication Publication Date Title
US7346703B2 (en) Request tracking for analysis of website navigation
US7761558B1 (en) Determining a number of users behind a set of one or more internet protocol (IP) addresses
Eirinaki et al. Web mining for web personalization
EP1428104B1 (en) Method and system for characterization of online behavior
US20100094860A1 (en) Indexing online advertisements
US20020029290A1 (en) System and method for tracking affiliates and merchants
US20120297062A1 (en) System and method for generating and reporting cookie values at a client node
EP1193603A1 (en) Information collection system and information collection method on network, each using technique of internet, and recording medium in which the information collection method is recorded
KR100645742B1 (ko) 웹 문서 생성을 포함한 다양한 정보 획득을 통한 검색데이터 수집 방법 및 그 장치
US20190289085A1 (en) System and method for tracking online user behavior across browsers or devices
WO2000075827A1 (en) Internet website traffic flow analysis
JP2010500689A (ja) 対話的ウェブアプリケーションのウェブ分析可能化方法
Schatz et al. A correlation method for establishing provenance of timestamps in digital evidence
GB2425194A (en) Tracking user network activity using a client identifier
Fenstermacher et al. Mining client-side activity for personalization
KR20000024517A (ko) 웹 마이닝 시스템을 위한 페이지 로깅 시스템
KR101055871B1 (ko) 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법
KR20070115348A (ko) 인터넷 광고 노출 시간 분석 방법 및 그 시스템
JP4878193B2 (ja) 判定プログラム、判定方法及び判定装置
Mowla et al. Analysis of web server logs to understand internet user behaviour and develop digital marketing strategies
KR101126126B1 (ko) 웹 로그의 사용자 세션 정보 추출 장치 및 방법
Bauer Who Goes There?
NL2031256B1 (en) Method and computing device for detection of target malicious web resource
JP3567845B2 (ja) メタ情報提供方法、装置及びメタ情報提供プログラムを記録した記録媒体
Durgadevi A Discovery on Web usage mining using Preprocessing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application