KR20000024517A - 웹 마이닝 시스템을 위한 페이지 로깅 시스템 - Google Patents
웹 마이닝 시스템을 위한 페이지 로깅 시스템 Download PDFInfo
- Publication number
- KR20000024517A KR20000024517A KR1020000007701A KR20000007701A KR20000024517A KR 20000024517 A KR20000024517 A KR 20000024517A KR 1020000007701 A KR1020000007701 A KR 1020000007701A KR 20000007701 A KR20000007701 A KR 20000007701A KR 20000024517 A KR20000024517 A KR 20000024517A
- Authority
- KR
- South Korea
- Prior art keywords
- page
- user
- logging system
- web
- information
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Debugging And Monitoring (AREA)
Abstract
1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 웹 마이닝 시스템에서의 사용자 세션 파일 생성 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 웹 브라우저로부터 사용자 정보를 직접 획득하여 정확하고 효과적인 사용자 세션 파일을 생성하는 방법을 제공하고자 함.
3. 본 발명의 해결 방법의 요지
본 발명은, 웹 마이닝 시스템에 적용되는 사용자 세션 파일을 생성하는데 있어서, 각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 단계; 각 페이지에 삽입된 코드에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료를 획득하는 단계; 페이지 로거로부터 획득한 자료를 이용하여 페이지 로깅 시스템의 로그 처리기에 의하여 사용자 세션 파일을 생성하여 데이터베이스에 기록하는 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 웹 마이닝 시스템에 이용됨.
Description
본 발명은 웹 마이닝 시스템에서 필수적으로 요구되는 데이터 전처리 과정을 수행하지 않고 정확한 사용자 세션 파일을 얻을 수 있는 페이지 로깅 시스템 및 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
종래의 웹 마이닝 시스템은 웹 서버의 공통 로그 파일에 어떤 사용자가 하나의 웹 페이지를 방문한 경우 그 페이지에 대한 정보뿐만 아니라 그 페이지에서 사용자가 본 모든 정보(예: 그림 파일 등)가 하나의 항목으로 기록되었기 때문에 이러한 불필요한 정보를 제거하는 데이터 클리닝 작업이 필수적으로 요구되었다.
또한 사용자 대부분이 로컬 캐쉬를 사용하기 때문에 한 세션에 2회 이상 방문하는 경우에 두번째 이후부터는 그 페이지에 대한 기록이 공통 로그 파일에 남지 않아 정확한 데이터를 얻을 수 없다. 이 문제를 해결하기 위해 종래의 웹 마이닝 시스템은 쿠키를 사용하여 해결하고자 하였으나, 쿠키를 이용하는 방법 역시 기본적으로 사용자에 대한 정보를 추적하는 것이 아니라 웹 브라우저를 추적하는 방법이기 때문에 한계가 있었다. 이와 비슷한 문제점으로 프락시 서버를 사용하는 경우 사용자의 IP조차도 구분할 수 없는 경우가 발생한다. 이러한 문제점을 해결하기 위하여 종래의 기술은 폼을 이용하여 사용자로 하여금 사용자 정보를 등록하도록 하는 방법을 취했다. 그러나 이 방법 역시 사용자가 거짓 정보를 입력한다거나 사용자의 개인 정보 유출을 우려하여 등록하지 않는 경우에는 정확한 사용자 정보를 얻을 수 없었다.
따라서, 상기한 바와 같은 제반 문제점을 해결하기 위해 안출된 본 발명은, 웹 마이닝 시스템에서 필수적으로 요구하는 정확한 사용자 세션 파일 생성을 위해, 사용자가 각 웹 페이지를 방문할 때마다 관련 정보를 수집하는 페이지 로거와 페이지 로거로부터 수집된 자료를 처리하여 정확한 사용자 세션 파일을 생성하는 로그 처리기로 구성된 페이지 로깅 시스템 및 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1은 본 발명이 적용되는 일반적인 웹 마이닝 시스템의 구성예시도.
도 2는 본 발명에 따른 웹 마이닝 시스템에서의 페이지 로깅 시스템의
구성도.
도 3은 본 발명에 따른 페이지 로깅 시스템의 개념도.
도 4는 본 발명에 따른 페이지 로깅 시스템의 일실시예 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
301 : 웹 브라우저 302 : 웹 서버 로그 파일
303 : 페이지 로거 304 : 로그 처리기
305 : 페이지 접근정보 데이터베이스 306 : 사용자 세션 파일
상기 목적을 달성하기 위한 본 발명은, 웹 마이닝 시스템에 적용되는 사용자 세션 파일을 생성하는데 있어서, 각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 제 1 단계; 상기 제 1 단계에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료(사용자의 계정, 사용자의 URL, 사용자의 로그인 시간, 사용자가 그 페이지를 본 시간 등)를 획득하는 제 2 단계; 상기 제 2 단계에서 획득한 자료를 이용하여 페이지 로깅 시스템의 로그 처리기에 의하여 사용자 세션 파일을 생성하여 페이지 접근정보 데이터베이스에 기록하는 제 3 단계를 포함한다.
또한, 본 발명은 프로세서를 구비한 웹 마이닝 시스템에, 각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 제 1 기능; 상기 제 1 기능에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료(사용자의 계정, 사용자의 URL, 사용자의 로그인 시간, 사용자가 그 페이지를 본 시간 등)를 획득하는 제 2 기능; 상기 제 2 기능에서 획득한 자료를 이용하여 페이지 로깅 시스템의 로그 처리기에 의하여 사용자 세션 파일을 생성하여 페이지 접근정보 데이터베이스에 기록하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 내용을 상세히 설명한다.
도 1은 본 발명이 적용되는 웹 마이닝 시스템의 구성예시도로서, 웹 브라우저(101), 웹 서버(102), 데이터 전처리기(103), 사용자 세션 파일(104), 트랜잭션 파일(105) 및 웹 마이닝 시스템(106)을 구비한다.
도면에 도시된 바와 같이, 웹 브라우저(101)가 웹 서버에 접근하면 웹 서버(102)의 로그 파일에 방문 자료가 기록된다. 데이터 전처리기(103)는 이 로그 파일의 자료를 이용하여 데이터 클리닝, 사용자 구분, 세션 구분 등의 과정에 의해 사용자 세션 파일(104)을 생성하게 된다.
일반적으로 웹 마이닝 시스템(106)의 목적이 관계 규칙 생성이라면 트랜잭션 구분기(105)를 통하여 트랜잭션 파일(105)을 생성하여 웹 마이닝을 수행하는 방법을 사용한다.
도 2는 본 발명이 제시하는 페이지 로깅 시스템에 관한 설명도이다.
도면에 도시된 바와 같이, 페이지 로깅 시스템(203)은 페이지 로깅 시스템을 구동하는 코드 부분을 포함하고 있는 웹 브라우저(201)로부터 사용자 정보를 획득하여 직접 사용자 세션 파일(205)을 생성함으로써 데이터 전처리기(204)의 필요성을 제거함은 물론 종래의 웹 서버 로그 파일(202)에서 발생되는 불필요한 정보를 하나의 항목으로 기록하는 문제, 로컬 캐쉬 및 프락시 서버를 사용하는 경우에 파생되는 문제 등을 해결한다.
도 3은 본 발명이 적용되는 페이지 로깅 시스템의 구성 요소들인 페이지 로거와 로그 처리기에 관한 상세한 설명도이다.
도면에 도시된 바와 같이, 페이지 로깅 시스템은 웹 브라우저(301)로부터 사용자 정보를 획득하는 페이지 로거(303), 페이지 로거(303)로부터 획득한 정보를 처리하여 페이지 접근정보 데이터베이스에 기록함으로써 사용자 세션 파일을 생성하는 로그 처리기(305)로 구성된다.
도 4는 본 발명에 따른 페이지 로깅 시스템의 일실시예 흐름도이다.
도면에 도시된 바와 같이, 사용자의 웹 브라우저에서 웹 서버의 페이지 로거가 포함된 문서를 열면 카운터가 1부터 시작한다(401). 그 페이지를 방문한 사용자가 웹 브라우저를 종료하거나 다른 페이지로 이동한 것인 가를 확인한 후(402), 이동하지 않은 경우는 카운터를 계속 1씩 증가시켜 방문자가 그 페이지를 본 시간을 계산하고(403), 사용자가 브라우저를 종료하거나 다른 페이지로 이동하면 클라이언트의 쿠키, 카운터 등 로깅에 필요한 정보들을 웹 서버의 로그 처리기에 전달한다(404). 서버에서는 클라이언트 쪽의 페이지 로거로부터 전달된 정보를 저장하고(405), 이 정보와 함께 사용자가 시스템에 로그인 한 시간, 사용자가 방문한 페이지의 URL, 사용자의 웹 브라우저의 종류 등 부가적인 정보를 추가하여 페이지 접근 정보 데이터베이스에 저장한다(406). 이 데이터베이스에 저장된 내용이 바로 웹 마이닝 시스템의 목적에 따라 다양하게 포맷하여 사용할 수 있는 사용자 세션 파일이 된다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기와 같은 본 발명은, 웹 마이닝 시스템에서 공통 웹 로그 파일로부터 얻은 자료를 이용하여 사용자 세션 파일을 생성하는 데이터 전처리기를 거치지 않고, 각 페이지마다 웹 브라우저로부터 직접 사용자 정보를 획득하여 정확한 사용자 세션 파일을 생성함으로써 데이터 전처리 과정에 과다하게 투입되었던 노력을 크게 줄일 수 있고, 또한 사용자가 로컬 캐쉬 및 프락시 서버를 사용함으로써 야기되는 부정확한 사용자 정보가 아닌 정확한 사용자 정보를 획득하는 효과가 있다.
Claims (2)
- 웹 마이닝 시스템에 적용되는 사용자 세션 파일을 생성하는데 있어서,각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 제 1 단계;상기 제 1 단계에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료(사용자의 계정, 사용자의 URL, 사용자의 로그인 시간 등)를 획득하는 제 2 단계;상기 제 2 단계에서 획득한 정보와 함께 페이지 로깅 시스템의 로그 처리기에 의하여 획득한 정보를(사용자가 그 페이지를 본 시간 등) 추가하여 페이지 접근정보 데이터베이스에 기록하는 제 3 단계를 포함하는 웹 마이닝 시스템에서의 사용자 세션 파일 생성 방법.
- 프로세서를 구비한 웹 마이닝 시스템에,각 페이지마다 페이지 로깅 시스템을 구동시켜주는 코드 부분을 삽입하는 제 1 기능;상기 제 1 기능에 의하여 구동되는 페이지 로깅 시스템의 페이지 로거로부터 사용자의 웹 페이지 방문 자료(사용자의 계정, 사용자의 URL, 사용자의 로그인 시간 등)를 획득하는 제 2 기능;상기 제 2 기능에서 획득한 정보와 함께 페이지 로깅 시스템의 로그 처리기에 의하여 획득한 정보를(사용자가 그 페이지를 본 시간 등) 추가하여 페이지 접근정보 데이터베이스에 기록하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000007701A KR20000024517A (ko) | 2000-02-18 | 2000-02-18 | 웹 마이닝 시스템을 위한 페이지 로깅 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000007701A KR20000024517A (ko) | 2000-02-18 | 2000-02-18 | 웹 마이닝 시스템을 위한 페이지 로깅 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20000024517A true KR20000024517A (ko) | 2000-05-06 |
Family
ID=19647567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020000007701A KR20000024517A (ko) | 2000-02-18 | 2000-02-18 | 웹 마이닝 시스템을 위한 페이지 로깅 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20000024517A (ko) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000058869A (ko) * | 2000-07-03 | 2000-10-05 | 권혁도 | 인터넷을 이용한 정보의 수요공급 매개시스템 |
KR20020020095A (ko) * | 2000-09-07 | 2002-03-14 | 김우섭 | 웹 사용자 이동경로의 파악방법 |
KR20030060521A (ko) * | 2002-01-09 | 2003-07-16 | 콤텔시스템(주) | 고객데이터 분석 시스템 |
KR100433531B1 (ko) * | 2001-12-11 | 2004-05-31 | 삼성전자주식회사 | 사용자 개인 정보 데이터 관리 방법, 사용자 개인 정보 데이터 관리 컴퓨터 및 기록매체 |
KR100868852B1 (ko) * | 2001-09-29 | 2008-11-14 | 주식회사 케이티 | 웹로그 분석 시스템에서의 방문시간 측정 방법 |
KR100972455B1 (ko) * | 2008-04-24 | 2010-07-26 | 주식회사 다음커뮤니케이션 | 검색 히스토리 서비스 방법 및 시스템 |
CN108319651A (zh) * | 2017-12-28 | 2018-07-24 | 南京烽火软件科技有限公司 | 一种互联网信息发掘方法 |
-
2000
- 2000-02-18 KR KR1020000007701A patent/KR20000024517A/ko not_active Application Discontinuation
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000058869A (ko) * | 2000-07-03 | 2000-10-05 | 권혁도 | 인터넷을 이용한 정보의 수요공급 매개시스템 |
KR20020020095A (ko) * | 2000-09-07 | 2002-03-14 | 김우섭 | 웹 사용자 이동경로의 파악방법 |
KR100868852B1 (ko) * | 2001-09-29 | 2008-11-14 | 주식회사 케이티 | 웹로그 분석 시스템에서의 방문시간 측정 방법 |
KR100433531B1 (ko) * | 2001-12-11 | 2004-05-31 | 삼성전자주식회사 | 사용자 개인 정보 데이터 관리 방법, 사용자 개인 정보 데이터 관리 컴퓨터 및 기록매체 |
KR20030060521A (ko) * | 2002-01-09 | 2003-07-16 | 콤텔시스템(주) | 고객데이터 분석 시스템 |
KR100972455B1 (ko) * | 2008-04-24 | 2010-07-26 | 주식회사 다음커뮤니케이션 | 검색 히스토리 서비스 방법 및 시스템 |
CN108319651A (zh) * | 2017-12-28 | 2018-07-24 | 南京烽火软件科技有限公司 | 一种互联网信息发掘方法 |
CN108319651B (zh) * | 2017-12-28 | 2022-02-15 | 南京烽火星空通信发展有限公司 | 一种互联网信息发掘方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7346703B2 (en) | Request tracking for analysis of website navigation | |
US7761558B1 (en) | Determining a number of users behind a set of one or more internet protocol (IP) addresses | |
Eirinaki et al. | Web mining for web personalization | |
EP1428104B1 (en) | Method and system for characterization of online behavior | |
US20100094860A1 (en) | Indexing online advertisements | |
US20020029290A1 (en) | System and method for tracking affiliates and merchants | |
US20120297062A1 (en) | System and method for generating and reporting cookie values at a client node | |
EP1193603A1 (en) | Information collection system and information collection method on network, each using technique of internet, and recording medium in which the information collection method is recorded | |
KR100645742B1 (ko) | 웹 문서 생성을 포함한 다양한 정보 획득을 통한 검색데이터 수집 방법 및 그 장치 | |
US20190289085A1 (en) | System and method for tracking online user behavior across browsers or devices | |
WO2000075827A1 (en) | Internet website traffic flow analysis | |
JP2010500689A (ja) | 対話的ウェブアプリケーションのウェブ分析可能化方法 | |
Schatz et al. | A correlation method for establishing provenance of timestamps in digital evidence | |
GB2425194A (en) | Tracking user network activity using a client identifier | |
Fenstermacher et al. | Mining client-side activity for personalization | |
KR20000024517A (ko) | 웹 마이닝 시스템을 위한 페이지 로깅 시스템 | |
KR101055871B1 (ko) | 웹 로그의 실시간 분석을 통한 사용자 세션 정보 추출 장치 및 방법 | |
KR20070115348A (ko) | 인터넷 광고 노출 시간 분석 방법 및 그 시스템 | |
JP4878193B2 (ja) | 判定プログラム、判定方法及び判定装置 | |
Mowla et al. | Analysis of web server logs to understand internet user behaviour and develop digital marketing strategies | |
KR101126126B1 (ko) | 웹 로그의 사용자 세션 정보 추출 장치 및 방법 | |
Bauer | Who Goes There? | |
NL2031256B1 (en) | Method and computing device for detection of target malicious web resource | |
JP3567845B2 (ja) | メタ情報提供方法、装置及びメタ情報提供プログラムを記録した記録媒体 | |
Durgadevi | A Discovery on Web usage mining using Preprocessing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |