KR100771577B1 - 웹페이지 접속 이력정보 관리방법 - Google Patents

웹페이지 접속 이력정보 관리방법 Download PDF

Info

Publication number
KR100771577B1
KR100771577B1 KR1020070016364A KR20070016364A KR100771577B1 KR 100771577 B1 KR100771577 B1 KR 100771577B1 KR 1020070016364 A KR1020070016364 A KR 1020070016364A KR 20070016364 A KR20070016364 A KR 20070016364A KR 100771577 B1 KR100771577 B1 KR 100771577B1
Authority
KR
South Korea
Prior art keywords
web page
log data
client terminal
data
internet user
Prior art date
Application number
KR1020070016364A
Other languages
English (en)
Inventor
서재영
Original Assignee
드림아이 커뮤니케이션즈(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 드림아이 커뮤니케이션즈(주) filed Critical 드림아이 커뮤니케이션즈(주)
Priority to KR1020070016364A priority Critical patent/KR100771577B1/ko
Application granted granted Critical
Publication of KR100771577B1 publication Critical patent/KR100771577B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/02Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators
    • G06F15/025Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators adapted to a specific application
    • G06F15/0283Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators adapted to a specific application for data storage and retrieval
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • H04L63/0236Filtering by address, protocol, port number or service, e.g. IP-address or URL

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 인터넷사용자가 접속하는 웹페이지에 대한 정보를 로그데이터로 기록하고, 이러한 로그데이터의 기록을 별도의 관리서버가 아닌 인터넷사용자의 클라이언트 단말기에서 진행함으로서, 관리서버가 로그데이터를 관리하기 위해 요구되는 부하를 줄이면서도 인터넷사용자의 관점에서 보는 현실적인 웹페이지 이력정보를 구체적으로 확인하여 활용할 수 있도록 하는 웹페이지 접속 이력정보 관리시스템과 이력정보 관리방법에 관한 것으로, 웹브라우저에서 처리한 웹페이지의 스크립트를 확인하여 유효 데이터의 포함여부를 확인하는 파싱수단과, 유효 데이터가 존재하는 웹페이지를 유효 데이터별로 정리한 로그데이터를 생성하는 제어수단과, 상기 로그데이터를 저장하는 로컬DB 및 상기 로컬DB에 저장된 로그데이터를 외부로 전송하는 데이터 전송수단을 구비하는 일반 인터넷사용자의 클라이언트 단말기; 및 다수의 상기 클라이언트 단말기로부터 전송되는 로그데이터들을 수신하여 저장하는 DB를 구비한 데이터 관리서버를 포함하는 것이다.

Description

웹페이지 접속 이력정보 관리방법{Web-page connecting record information management method}
도 1은 본 발명에 따른 이력정보 관리시스템의 구성을 도시한 블록도이고,
도 2는 본 발명에 따른 이력정보 관리방법의 실시모습을 순차 도시한 플로우차트이고,
도 3은 본 발명에 따른 이력정보 관리방법의 다른 실시모습을 순차 도시한 플로우차트이고,
도 4는 본 발명에 따른 이력정보 관리방법에서 'A' 이후의 실시모습을 순차 도시한 플로우차트이고,
도 5는 본 발명에 따른 이력정보 관리방법에서 로그데이터가 데이터 관리서버로 전송되는 실시모습을 순차 도시한 플로우차트이고,
도 6은 본 발명에 따른 이력정보 관리방법에서 데이터 관리서버가 로그데이터를 처리하는 실시모습을 순차 도시한 플로우차트이다.
본 발명은 인터넷사용자가 접속하는 웹페이지에 대한 정보를 로그데이터로 기록하고, 이러한 로그데이터의 기록을 별도의 관리서버가 아닌 인터넷사용자의 클라이언트 단말기에서 진행함으로서, 관리서버가 로그데이터를 관리하기 위해 요구되는 부하를 줄이면서도 인터넷사용자의 관점에서 보는 현실적인 웹페이지 이력정보를 구체적으로 확인하여 활용할 수 있도록 하는 웹페이지 접속 이력정보 관리시스템과 이력정보 관리방법에 관한 것이다.
종래, 인터넷사용자의 검색패턴과, 검색결과에 따른 접속패턴 및 접속 웹페이지에 대한 각종 이력정보의 수집은 특정 관리서버에서 집중적으로 이루어졌다.
이러한 관리서버는 수많은 인터넷사용자의 인터넷 이용모습을 관찰함에 있어 관리서버에 집중되는 부하를 최소화하기 위해, 현실적으로는 인터넷사용자에 의한 인터넷 이용모습을 개략적으로 확인할 수 밖에 없었다.
이러한 관찰 및 확인결과는 인터넷사용자에 따른 검색패턴과 검색결과물에 대한 배치 등, 인터넷 검색환경을 최적화하는데 활용되고, 각종 광고링크방법과 키워드에 링크되는 검색결과물을 지정하는데에도 참고된다.
그런데, 인터넷 이용모습에 대한 로그데이터의 내용이 앞서 설명한 바와 같이 관리서버가 갖는 시스템 자원의 한계로 구체화되지 못하면서, 섬세하고 정밀함을 요구하는 검색분야에 대해서는 관리서버가 수집한 로그데이터의 적용이 크게 도움되지 못하였고, 통상적인 검색분야에 적용하더라도 그 결과가 미미하여 종래 수집방식에 따른 로그데이터의 활용 신뢰도가 크지 못한 문제가 있었다.
이러한 문제는 보다 구체적이고 상세하면서 현실성을 갖는 인터넷사용자의 웹페이지 접속 이력정보를 수집할 수 있는 시스템에 대한 필요성을 증가시켰다.
이에 본 발명은 상기와 같은 문제를 해소하기 위해 발명된 것으로, 인터넷사용자의 인터넷 검색패턴 및 활용모습에 대한 상세한 이력정보를 확보할 수 있으면서도 시스템이 갖는 부하를 최소화하는 웹페이지 접속 이력정보 관리시스템과 이력정보 관리방법의 제공을 기술적 과제로 한다.
상기의 기술적 과제를 달성하기 위하여 본 발명은,
웹브라우저에서 처리한 웹페이지의 스크립트를 확인하여 유효 데이터의 포함여부를 확인하는 파싱수단과, 유효 데이터가 존재하는 웹페이지를 유효 데이터별로 정리한 로그데이터를 생성하는 제어수단과, 상기 로그데이터를 저장하는 로컬DB 및 상기 로컬DB에 저장된 로그데이터를 외부로 전송하는 데이터 전송수단을 구비하는 일반 인터넷사용자의 클라이언트 단말기; 및
다수의 상기 클라이언트 단말기로부터 전송되는 로그데이터들을 수신하여 저장하는 DB를 구비한 데이터 관리서버;
를 포함하는 웹페이지 접속 이력정보 관리시스템이다.
상기의 기술적 과제를 달성하기 위하여 본 발명은,
클라이언트 단말기의 웹브라우저가 수신한 웹페이지를 파싱하는 웹페이지 파싱단계;
파싱한 웹페이지에서 유효 데이터를 확인하는 유효 데이터 확인단계;
유효 데이터를 포함하는 웹페이지를 로그데이터로서 상기 클라이언트 단말기의 로컬DB에 저장하는 유효 데이터 저장단계;
상기 로컬DB에 저장된 로그데이터를, 다수의 상기 클라이언트 단말기로부터 전송되는 로그데이터들을 수신하여 저장하는 DB를 구비한 데이터 관리서버로 전송하는 로그데이터 전송단계; 및
상기 로그데이터의 전송이 완료되면 상기 로컬DB가 저장하는 로그데이터를 삭제하는 로그데이터 삭제단계;
를 포함하는 웹페이지 접속 이력정보 관리방법이다.
이하 본 발명을 첨부된 예시도면에 의거하여 상세히 설명한다.
도 1은 본 발명에 따른 이력정보 관리시스템의 구성을 도시한 블록도인바, 이를 참조하여 설명한다.
본 발명에 따른 이력정보 관리시스템은 각종 서비스를 제공하는 웹사이트에 대한 웹페이지 관리서버(200)와, 웹페이지 관리서버(200)에 접속하여 상기 서비스를 제공받는 인터넷사용자의 클라이언트 단말기(100)를 포함한다.
상기 웹페이지 관리서버(200)는 구축된 웹사이트에 대한 인터넷 통신유지와 접속하는 다수의 클라이언트 단말기(100)와의 교통을 제어하고, 필요한 웹페이지로의 이동과 각종 컨텐츠의 제공을 관리한다.
URL을 갖는 일반적인 웹사이트의 경우, 해당 웹페이지 관리서버(200)를 통해 관리되고 있고, 당업자에게 이러한 웹페이지 관리서버(200)의 구성은 널리 알려진 기술이므로 관련 설명은 생략한다.
인터넷사용자는 자신의 클라이언트 단말기(100)를 통해 웹브라우저(110)를 매개로 인터넷에 접속하고, URL 입력으로 상기 웹페이지 관리서버(200)에 접속한다. 물론, 상기 웹페이지 관리서버(200)는 자신이 갖는 웹페이지 정보를 해당 클라이언트 단말기(100)로 전송하고, 웹브라우저(110)의 웹페이지 확인수단(111)은 웹페이지 관리서버(200)로부터 전송된 웹페이지 정보를 분석하여 각종 링크정보를 갖는 웹페이지를 출력한다. 일반적으로, 웹페이지는 HTML, XML 등의 형식으로 표현되며, 이러한 하이퍼텍스트형식은 상기 웹페이지 확인수단(111)이 처리한다.
한편, 본 발명에 따른 이력정보 관리시스템은, 상기 웹페이지 확인수단(111)을 통해 웹페이지를 구성하는 각 카테고리에 대한 스크립트가 분석/분류되면, 이를 카테고리 별로 확인하여 유효 데이터의 존재여부를 확인하는 파싱수단(120)을 더 포함한다.
여기서 웹페이지의 각 카테고리라 하면, 웹페이지를 구성하고 있는 광고물, 이미지, 텍스트, 동영상 및 오디오데이터 등을 말하며, 각 카테고리를 구성하는 데이터는 링크정보 및 각종 태그 등으로 된 스크립트 형태로 표현될 수 있다.
한편, 유효 데이터란, 웹페이지의 각 카테고리 중 로그데이터로 기록해야 할 필요성이 있는 지정된 데이터로, 인터넷사용자의 검색패턴과 자주 접속하는 웹사이트에 대한 성향 분석을 위해 로그데이터로서 저장할 가치가 있는 데이터이다.
예를 들어, 유효 데이터는, 특정 키워드를 검색사이트의 검색창에 입력하여 얻어낸 검색결과들에 대한 각각의 정보와, 인터넷사용자가 상기 검색결과들 중 선택한 검색결과에 링크된 URL 정보 등이 있을 수 있다. 즉, 인터넷사용자가 특정 키워드를 검색하기 위해 웹페이지에 당해 키워드를 입력하면, 검색창에 기재된 텍스트인 당해 키워드의 존재가 유효 데이터가 되는 것이다. 또한, 상기 키워드의 검색결과물에 대한 링크정보가 또 다른 유효 데이터가 된다. 보다 구체적인 예시는 실시예를 통해 보이도록 한다.
계속해서, 클라이언트 단말기(100)는 파싱수단(120)에서 확인한 결과에 대하여 이를 처리하는 제어수단(130)을 더 포함한다. 상기 제어수단(130)은 파싱수단(120)에서 전송된 데이터를 통계 처리하며, 이를 위한 키워드 확인모듈(131), 방문횟수 확인모듈(132), 사용자 확인모듈(133) 및 컨텐츠 확인모듈(134)을 포함할 수 있다.
이렇게 처리된 데이터는 로그데이터로서 로컬DB(140)에 저장된다.
또한, 상기 로컬DB(140)에 저장된 로그데이터는 특정 데이터 관리서버(300)로 전송되어야 하며, 이를 위한 데이터 전송수단(150)을 더 포함한다.
앞서 설명한 파싱수단(120), 제어수단(130) 및 데이터 전송수단(150)에 대해 본 발명에 따른 이력정보 관리방법을 설명하면서 상세히 한다.
도 2는 본 발명에 따른 이력정보 관리방법의 실시모습을 순차 도시한 플로우차트인바, 본 도면과 도 1을 참조하여 설명한다.
S11 ; 웹사이트 확인단계
클라이언트 단말기(100)가 접속한 웹사이트를 확인하는 단계로, 기술적으로는 상기 클라이언트 단말기(100)가 웹브라우저(110)를 매개로 해당 웹사이트의 웹페이지 관리서버(200)와 통신하며, 이때 해당 웹페이지 관리서버(200)의 URL을 확인함으로서, 현재 접속한 웹사이트를 구분할 수 있다.
본 단계(S11)에 따른 웹사이트의 확인은 특정 웹사이트에서 이루어지는 인터넷사용자의 성향을 분석하기 위한 것으로, 웹페이지 확인수단(111)에서 웹사이트를 확인하여 지정된 웹사이트가 아닐 경우 이력정보 관리방법의 절차를 정지하고, 지정된 웹사이트일 경우 다음 절차를 진행한다.
S18 ; 웹페이지 파싱단계
상기 파싱수단(120)은 해당 웹페이지를 구성하는 카테고리를 분석/분류한다. 앞서 설명한 바와 같이, 카테고리는 웹페이지를 구성하는 각종 컨텐츠를 포함하고 이들은 스크립트 형태의 태그 또는 링크정보로 구성되어서, 상기 파싱수단(120)은 웹페이지의 전체적인 구성을 확인할 수 있다.
S19 ; 유효 데이터 확인단계
상기 파싱수단(120)을 통해 웹페이지가 분석/분류되면, 당해 웹페이지에 유효 데이터가 있는지 여부를 확인한다.
여기서, 유효 데이터라 함은 필요에 의해 유효한 것으로 지정된 데이터를 말한다. 예를 들면, 인터넷에서 진행되는 특정 광고물의 홍보효과를 확인하기 위해 해당 웹페이지를 구성하고 있는 카테고리 중 당해 광고물에 대한 내용이 있는지를 확인한다고 할 때, 상기 광고물이 유효 데이터가 되는 것이다.
물론, 예시한 바와 같이 유효 데이터가 특정한 내용에 한정하는 것은 아니며, 검색창에 키워드를 입력하여 검색을 실행할 경우, 해당 검색결과물이 있다면 이 검색결과물이 모두 유효 데이터가 될 수도 있을 것이다.
S21 ; 유효 데이터 저장단계
상기 파싱수단(134)이 웹페이지 내에서 유효 데이터를 확인하고 관련 데이터를 로그데이터로써 상기 로컬DB(140)에 저장할 경우, 해당 로그데이터를 가공없이 그대로 저장할 수 있고, 설정된 기준에 맞춰 저장할 수도 있다. 일반적으로, 상기 유효 데이터가 포함된 해당 웹페이지가 로그데이터로 남을 것이다.
이를 좀 더 상세히 설명하면, 본 발명에 따른 이력정보 관리시스템은 제어수단(130)을 포함하고, 인터넷사용자의 검색패턴과 검색결과물에 대한 이용성향 등을 파악하는 본 발명에 따른 실시예에서 상기 제어수단(130)은 키워드 확인모듈(131), 방문횟수 확인모듈(132), 사용자 확인모듈(133) 및 컨텐츠 확인모듈(134)을 포함한다.
상기 키워드 확인모듈(131)은 인터넷사용자가 검색을 위해 검색창에 입력한 키워드를 확인하고 이에 따라 해당 로그데이터를 분류하는 것으로, 파싱수단(120)에서 확인된 로그데이터를 어느 키워드에 분류할지를 결정하게 된다.
상기 방문횟수 확인모듈(132)은 동일한 키워드에 대한 검색결과물 중에서 어 느 검색결과물을 선택했는지에 대한 횟수, 검색결과물 리스트에서 어느 순서에 위치한 검색결과물을 선택했는지에 대한 횟수, 검색결과물을 소개하는 문장이 해당 키워드와 어떠한 관련성을 가질 때 주로 선택되고 있는지에 대한 일반화 등을 처리하게 된다.
상기 사용자 확인모듈(133)은 로그데이터를 제공한 클라이언트 단말기(100)의 사용주체가 누구인지를 확인할 수 있도록, 해당 로그데이터에 표찰수단를 삽입하게 된다. 여기서 표찰수단은 사용주체인 해당 인터넷사용자의 ID가 될 수 있다.
상기 컨텐츠 확인모듈(134)은 해당 웹페이지가 RSS(Really Simple Syndication, Rich Site Summary) 또는 Atom 등의 기능을 포함하고 있는지 여부를 확인한다.
이상 설명한 제어수단(130)의 각 구성은 파싱된 웹페이지에 대한 데이터를 키워드, 방문횟수, 인터넷사용자 별로 분류하여 로그데이터로 저장하고, RSS 또는 Atom 등의 링크정보 데이터가 확인되면 URL을 포함하는 링크정보를 상기 로그데이터와 더불어 로컬DB(140)에 저장한다.
도 3은 본 발명에 따른 이력정보 관리방법의 다른 실시모습을 순차 도시한 플로우차트인바, 이를 참조하여 설명한다.
S11 ; 웹사이트 확인단계
전술한 바 있으므로 본 단계에 대한 설명은 생략한다.
S12 ; RSS데이터 확인단계
웹사이트 확인단계(S11)에서 확인된 웹페이지에서 RSS데이터의 존재여부를 확인하고, 그 존재가 확인되면 RSS데이터에 포함된 링크정보를 유효 데이터로 인식하여 이를 로컬DB(140)에 저장한다. 상술한 바와 같이, RSS데이터는 어느 웹페이지 내에 다른 웹페이지의 일부 카테고리 또는 영역을 분리하여 링크한 것으로, 상기 RSS데이터에는 RSS주소 및 RSS타이틀 그리고 다른 웹페이지의 URL 정보가 포함된다.
한편, 검색결과를 RSS로 제공해주는 곳도 있고, 검색창이 붙어 있는 페이지 (포탈 메인)에서도 RSS를 제공해줄 수 있다. 따라서, 도 3에 도시한 절차에 한정하지 않고, RSS데이터가 확인되더라도 웹페이지 파싱단계(S18)를 수행할 수 있다.
S13 ; 파싱엔진 유효성 확인단계
본 발명에 따른 이력정보 관리시스템은 웹사이트를 관리하는 상기 웹페이지 관리서버(200)와는 별도로, 상기 로그데이터를 수집하여 이들을 일반화하고 특정 사안에 적용되도록 가공하는 데이터 관리서버(300)를 더 포함한다.
상기 데이터 관리서버(300)는 클라이언트 단말기(100)로부터 전송된 로그데이터를 수신받아 이를 체계화한다.
한편, 상기 데이터 관리서버(300)는 파싱모듈(310)을 구비하고, 상기 파싱모듈(310)은 클라이언트 단말기(100)에 설치된 파싱수단(120)의 파싱엔진(파서: paser)에 대한 유효성 여부를 확인한다.
S14 ; 파싱엔진 확인단계
이전 단계인 파싱엔진 유효성 확인단계(S13)에서 파싱수단(120)이 웹페이지의 분석/분류를 수행할 수 없는 것으로 확인되면, 그 원인을 조사한다.
우선, 상기 파싱엔진은 접속한 웹페이지의 형식에 따라 그 모습을 달리할 수 있으므로, 상기 파싱수단(120)은 앞서 확인된 웹사이트에 호응하는 파싱엔진을 클라이언트 단말기(100)에서 검색한다. 즉, 당해 웹페이지를 파싱하기 위한 파싱엔진이 존재하는지를 확인하는 것이다. 물론, 당해 웹페이지에 호응하는 파싱엔진이 검색되더라도 당해 파싱엔진은 파싱을 정상적으로 수행할 수 없는 무효이므로, 버전이 낮거나 파손된 파싱엔진으로 간주된다.
한편, 파싱엔진이 검색되지 않는다면, 당연히 파싱엔진의 부존재로 인한 정상적인 파싱은 이루어지지 않는다.
S15 ; 파싱엔진 다운로드/업데이트 단계
파싱엔진 확인단계(S14)를 통해 해당 파싱엔진이 낮은 버전인 것으로 간주되면 상기 파싱모듈(310)은 신규 버전의 파싱엔진을 파싱수단(120)으로 전송하여 설치하고, 파싱엔진이 해당 클라이언트 단말기(100)에 미설치되거나 파손된 것으로 추정되면 상기 파싱모듈(310)은 파싱엔진 자체를 전송하여 이를 설치한다.
S16 ; 검색단계
이력정보 관리를 위한 클라이언트 단말기(100)의 기본 구성이 모두 완비되면, 당해 웹페이지의 검색창에 키워드를 입력하여 인터넷사용자가 요구하는 검색결과물을 요청한다.
물론, 인터넷사용자가 입력한 키워드는 상기 키워드 확인모듈(131)이 확인한다.
S17 ; 웹페이지 출력단계
인터넷사용자가 입력한 키워드에 따라 웹페이지 관리서버(200)가 검색을 시작하고, 그 검색결과물을 새로운 웹페이지로써 출력한다.
물론, 상기 새로운 웹페이지는 웹페이지 관리서버(200)로부터 전송되고, 웹브라우저(110)는 이를 수신하여 클라이언트 단말기(100)에 출력시킨다.
S18 ; 웹페이지 파싱단계, S19 ; 유효 데이터 확인단계, S21 ; 유효 데이터 저장단계는 전술한 바 있으므로 본 단계에 대한 설명은 생략한다.
S20 ; 사용자 확인단계
한편, 사용자 확인모듈(133)은 해당 로그데이터의 출처를 확인시키기 위해 클라이언트 단말기(100)의 인터넷사용자에 대한 표찰수단인 ID를 로그데이터 생성시 첨부 저장한다. 이러한 표찰수단은 ID에 한정되지는 않으며, 클라이언트 단말기(100)의 IP일 수도 있다.
그런데, ID를 표찰수단으로 할 경우엔, 회원제로 운영되어야 한다는 전제가 있고, IP 또한 유일한 값이 될수가 없으므로, 클라이언트 단말기의 HDD 시리얼 번호화 조합된 유일한 ID(Unique ID)를 생성해서 관리하는 것이 바람직하다.
참고로, 상기 표찰수단이 인증받기 위해서는 해당 인터넷사용자의 개인정보를 데이터 관리서버(300)에 제공하여, 표찰수단과 인터넷사용자 간의 관계를 명확히 하는 것이 바람직하다.
결국, 상기 유효 데이터 저장단계(S21)에서 로컬DB(140)에 최종 저장되는 로그데이터는 인터넷사용자의 표찰수단을 포함한다.
도 4는 본 발명에 따른 이력정보 관리방법에서 'A' 이후의 실시모습을 순차 도시한 플로우차트인바, 본 도면과 도 1을 참조하여 설명한다.
S22 ; 웹페이지 생성/이동단계
키워드가 입력된 웹페이지에서 다른 웹페이지로의 생성/이동여부를 확인한다. 즉, 웹브라우저(110)가 접속한 URL이 다르므로 다른 웹페이지가 생성되거나 또는 접속중인 웹페이지가 이동변경된 것으로 간주된다.
S23 ; 검색결과에 대한 처리여부 확인단계
웹페이지의 생성/이동이 확인되면, 당해 생성/이동이 검색결과물과 관련한 것인지 여부를 확인한다. 즉, 인터넷사용자가 검색결과물 중 하나를 선택하면 링크된 웹페이지가 출력되는데 이러한 과정으로 출력된 것이면 상기 검색결과물과 관 련한 웹페이지의 생성/이동이고, 인터넷사용자가 웹브라우저(110) 창을 새롭게 띄우면서 출력되는 웹페이지 또는 검색결과물을 선택하지 않고 주소창에 직접 새로운 URL을 입력하여 다른 웹페이지에 접속함으로서 웹페이지가 출력되면 상기 검색결과물과 관련없는 웹페이지의 생성/이동이다.
물론, 이에 대한 확인은 파싱수단(120)에서 분석/분류된 검색결과물의 링크된 URL과 생성/이동된 웹페이지의 URL의 일치 여부를 확인하는 것으로 그 처리가 가능할 것이다.
이러한 확인결과, 현재 클라이언트 단말기(100)로 출력되고 있는 웹페이지가 검색결과물과 관련된 웹페이지의 생성/이동이면 이후 단계(S24)를 진행하고, 그렇지 않다면 당해 키워드에 대한 추적은 중지한다.
S24 ; 웹페이지 확인단계
인터넷사용자가 검색결과물 중 하나를 선택하여 생성/이동된 웹페이지의 구성을 파싱수단(120)에서 분석/분류하고, 방문횟수 확인모듈(132)은 로컬DB(140)에서 동일 유사한 키워드에 대한 로그데이터를 검색하여 당해 웹페이지로의 접속횟수를 카운트한다.
즉, 현 인터넷사용자는 동일한 키워드에 대한 검색에서 주로 접속하는 웹페이지가 어디인지를 로그데이터를 통해 확인할 수 있는 것이다.
S25 ; URL 확인단계
생성/이동된 웹페이지의 URL을 확인하여서 새로운 웹페이지 내용이 갱신되더라도 로그데이터에는 동일한 웹페이지임을 인식할 수 있도록 새로운 웹페이지의 URL을 확인한다.
S26 ; 데이터 저장단계
새로운 웹페이지와 관련한 키워드와, 이전에도 새로운 웹페이지에 방문한 이력이 있다면 그 방문 횟수와, 이러한 성향을 보이는 인터넷사용자에 대한 정보들을 로그데이터로 하여 상기 로컬DB(140)에 저장한다.
한편, 로컬DB(140)에 저장되는 로그데이터는 상술한 실시예에 한정하는 것은 아니다. 즉, 인터넷사용자가 접속하는 웹페이지에 대한 각종 정보가 도 4에 도시한 관계에 따라 선택적으로 저장되는 것이 아니고, 인터넷사용자가 접속한 모든 웹페이지에 대한 정보가 저장될 수도 있는 것이다.
도 5는 본 발명에 따른 이력정보 관리방법에서 로그데이터가 데이터 관리서버로 전송되는 실시모습을 순차 도시한 플로우차트인바, 이를 참조하여 설명한다.
S27 ; 온라인 확인단계
클라이언트 단말기(100)가 온라인 상태인지를 확인한다.
데이터 전송수단(150)은 로컬DB(140)에 저장된 로그데이터를 데이터 관리서버(300)로 전송하여 DB(350, 360, 370)에 저장하고, 이를 위해서는 상기 클라이언트 단말기(100)와 데이터 관리서버(300)가 서로 통신해야 한다. 따라서, 로그데이 터를 전송하기 위해서는 클라이언트 단말기(100)가 온라인 상태인지 확인되어야 하고, 상기 데이터 전송수단(150)은 웹브라우저(110)와 연동하여 온라인 상태를 확인한다.
S28 ; 전송조건 확인단계
로그데이터를 데이터 관리서버(300)로 전송할 때에는 통신부하가 발생한다. 즉, 클라이언트 단말기(100)가 현재 온라인 작업중일 경우 이러한 통신부하는 인터넷사용자에게 불편을 초래하므로, 이러한 불편을 자각하지 못하면서 로컬DB(140)에 저장된 로그데이터를 DB(350, 360, 370)로 전송하는 것이 바람직하다.
따라서, 로그데이터를 DB(350, 360, 370)로 전송하기 위한 조건이 다양하게 제시될 수 있는데, 그 실시예를 기술하면, (1)모니터의 절전모드 원리를 응용한 것으로, 일정시간동안 키보드의 조작이 없을 경우 로그데이터를 전송하는 방식과, (2)클라이언트 단말기(100)를 사용중인 인터넷사용자가 로그데이터의 전송을 명령할 때 로그데이터를 전송하는 방식과, (3)인터넷사용자가 클라이언트 단말기(100)를 로그아웃할 때, 로그아웃을 잠시 보류하고 로그데이터를 전송한 후 로그아웃을 완료하는 방식 등이 있다.
하지만, 이에 한정하는 것은 아니며, 본 발명의 청구범위를 벗어나지 않는 한도 내에서 다양하게 변형실시될 수 있음은 물론이다.
S29 ; 로그데이터 전송단계
전송조건이 만족되면, 데이터 전송수단(150)은 데이터 관리서버(300)의 DB(350, 360, 370)로 로그데이터를 전송한다.
로그데이터의 경우, 앞서 설명한 바와 같이 다양한 데이터를 포함하므로, 필요에 따라 로그데이터를 데이터 별로 분류하여 키워드DB(350), 웹DB(360) 및 사용자DB(370) 등에 각각 분리 저장할 수 있다.
S30 ; 데이터 삭제단계
상기 로컬DB(140)에서 모든 로그데이터가 전송되면, 로컬DB(140)에 저장된 로그데이터를 삭제하여 클라이언트 단말기(100)가 갖는 부담을 줄일 수 있다.
본 발명의 기술적 과제에서 언급한 바대로, 본 발명의 기술적 사상은 데이터 관리서버(300)가 갖는 부담을 클라이언트 단말기(100)가 분담하면서, 아울러 인터넷사용자별로 구체적이고 섬세한 로그데이터를 확보할 수 있도록 하여, 인터넷사용자의 성향을 파악하는데 유리하도록 하는데 있다. 하지만, 클라이언트 단말기(100)를 사용하는 인터넷사용자는 상기 부담을 분담하면서 불편을 초래해서는 안되므로 로컬DB(140)가 갖게 되는 시스템 재원은 가능한 작을수록 좋다. 따라서, 클라이언트 단말기(100)가 갖는 저장공간에서 로그데이터를 저장할 수 있는 최소한의 공간만을 로컬DB(140)로 하는 것이 바람직하고, 따라서 로컬DB(140)에 저장된 로그데이터는 주기적으로 데이터 관리서버(300)에 전송한 후 로컬DB(140)에 있는 로그데이터는 삭제시키는 것이 바람직하다.
도 6은 본 발명에 따른 이력정보 관리방법에서 데이터 관리서버가 로그데이터를 처리하는 실시모습을 순차 도시한 플로우차트인바, 본 도면과 도 1을 참조하여 설명한다.
S31 ; 로그데이터 수신단계
상기 데이터 관리서버(300)는 클라이언트 단말기(100)로부터 전송된 로그데이터를 수신하고, 이를 DB(350, 360, 370)에 저장한다.
S32 ; 데이터 정리단계
이렇게 저장된 로그데이터는 DB(350, 360, 370) 즉, 키워드DB(350), 웹DB(360), 사용자DB(370)에 각각 분류 저장될 수 있다.
한편, 분석모듈(320)은 상기 DB(350, 360, 370)에 저장된 각종 로그데이터를 순위화하여서 다수 클라이언트 단말기(100)로부터 전송된 로그데이터를 동일한 분야에 따라 서열화한다.
이를 구체적으로 설명하면, 인터넷사용자가 동일한 키워드에 대한 검색결과물에서 가장 많이 선택한 검색결과물은 무엇인지, 검색결과물의 배치위치에 따라 인터넷사용자는 어느 위치의 검색결과물을 빈번히 선택하였는지 등에 대한 확인이 가능한 것이다. 또한, 인터넷사용자의 연령별, 성별, 직업별로도 세분화하여 로그데이터를 이용한 각종 분석이 가능하다.
검색모듈(330)은 분석모듈(320)의 동작시 필요한 데이터를 상기 DB(350, 360, 370)에서 검색할 때 연동할 수 있다.
사용자 관리모듈(340)은 로그데이터의 수집기능을 분담하고 있는 클라이언트 단말기(100) 사용자인 인터넷사용자의 정보를 저장하는 사용자DB(370)를 제어하고, 신규 인터넷사용자의 정보를 제공받아 새롭게 저장할 수 있다. 또한, 상기 분석모듈(320)의 동작시 필요한 데이터를 상기 사용자DB(370)에서 검색하여 연동할 수 있다.
이상 상기와 같은 본 발명에 따르면, 인터넷사용자의 웹사이트 접속시 생성되는 각종 로그데이터에 대한 처리를 클라이언트 단말기가 분담하면서 이를 수행하는 시스템의 자원을 줄일 수 있고, 이러한 로그데이터는 인터넷사용자가 직접 수행한 작업을 기초로 하여 생성되므로 보다 정확하고 구체적인 인터넷 이용에 대한 정보를 수집 및 분석해낼 수 있으며, 각종 데드링크에 대한 확인도 로그데이터에 기록되므로 데드링크된 웹페이지에 대한 신속한 처리가 가능하다. 또한, 웹사이트 이외에 동영상, 이미지 등 다양한 형식의 멀티미디어 콘텐츠와 RSS기반의 각종 블로그 및 홈페이지에 대한 정보 또한 로그데이터에 남게 되므로, 인터넷상에서 웹서버와 웹서버는 물론 웹서버와 각종 형식의 콘텐츠 간의 링크구조를 정밀하게 분석할 수 있는 효과가 있다.

Claims (7)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 클라이언트 단말기의 웹브라우저가 수신한 웹페이지 정보를 확인하여서, 당해 웹페이지가 로그데이터를 생성할 대상인지를 확인하고, 비대상으로 확인되면 실행을 중지하는 웹사이트 확인단계
    상기 웹페이지를 파싱하는 웹페이지 파싱단계;
    파싱한 상기 웹페이지의 스크립트에서 인터넷사용자가 검색을 위해 입력한 키워드인 유효 데이터의 포함 여부를 확인하는 유효 데이터 확인단계;
    상기 키워드와, 키워드별로 검색 분류된 관련 웹페이지의 URL과, 검색 후 인터넷사용자가 상기 URL의 웹페이지에 접속하는 횟수를 로그데이터로 하여서, 상기 클라이언트 단말기의 로컬DB에 저장하는 유효 데이터 저장단계;
    해당 인터넷사용자의 ID, 클라이언트 단말기의 IP 또는 클라이언트 단말기의 HDD 시리얼 번호와 조합된 유일한 ID 중 선택된 어느 하나를 확인하여서, 인터넷사용자를 확인하는 인터넷 사용자 확인단계;
    상기 인터넷사용자의 정보와 상기 로컬DB에 저장된 로그데이터를, 다수의 상기 클라이언트 단말기로부터 전송되는 로그데이터들을 수신하여 저장하는 DB를 구비한 데이터 관리서버로 전송하되, 일정시간 동안 클라이언트 단말기의 키보드 조작이 없을 때와, 클라이언트 단말기를 사용중인 인터넷사용자가 로그데이터의 전송을 명령할 때와, 인터넷사용자가 클라이언트 단말기를 로그아웃할 때 중 선택된 어느 하나의 조건이 성립하면 전송하는 로그데이터 전송단계; 및
    상기 로그데이터의 전송이 완료되면 상기 로컬DB가 저장하는 로그데이터를 삭제하는 로그데이터 삭제단계;
    를 포함하는 것을 특징으로 하는 웹페이지 접속 이력정보 관리방법.
  6. 삭제
  7. 제 5 항에 있어서,
    상기 웹페이지 파싱단계에서, 해당 웹페이지에 RSS데이터가 확인되면 RSS데이터에 포함된 URL을 로그데이터로 저장하는 것을 특징으로 하는 웹페이지 접속 이력정보 관리방법.
KR1020070016364A 2007-02-16 2007-02-16 웹페이지 접속 이력정보 관리방법 KR100771577B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070016364A KR100771577B1 (ko) 2007-02-16 2007-02-16 웹페이지 접속 이력정보 관리방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070016364A KR100771577B1 (ko) 2007-02-16 2007-02-16 웹페이지 접속 이력정보 관리방법

Publications (1)

Publication Number Publication Date
KR100771577B1 true KR100771577B1 (ko) 2007-10-30

Family

ID=38816359

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070016364A KR100771577B1 (ko) 2007-02-16 2007-02-16 웹페이지 접속 이력정보 관리방법

Country Status (1)

Country Link
KR (1) KR100771577B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101028928B1 (ko) 2008-09-30 2011-04-12 삼성에스디에스 주식회사 Cdn 환경에서 웹 로그 분석을 위한 스크립트 관리 장치 및 방법
CN110020278A (zh) * 2017-09-08 2019-07-16 阿里巴巴集团控股有限公司 页面数据的展示、提供方法、客户端及服务器
US10521474B2 (en) 2014-04-30 2019-12-31 Samsung Electronics Co., Ltd. Apparatus and method for web page access

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030001018A (ko) * 2001-06-28 2003-01-06 박일남 웹 사이트상의 로그 관리 시스템 및 방법
KR20030047528A (ko) * 2001-12-11 2003-06-18 삼성전자주식회사 Crm 데이터 관리 방법, crm 서버 및 기록매체
KR20050007238A (ko) * 2004-12-17 2005-01-17 주식회사 비즈모델라인 개인정보 관리 서버
KR20060048765A (ko) * 2004-07-01 2006-05-18 마이크로소프트 코포레이션 페이지 카테고리 정보를 이용하여 검색 엔진 결과를분배하는 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030001018A (ko) * 2001-06-28 2003-01-06 박일남 웹 사이트상의 로그 관리 시스템 및 방법
KR20030047528A (ko) * 2001-12-11 2003-06-18 삼성전자주식회사 Crm 데이터 관리 방법, crm 서버 및 기록매체
KR20060048765A (ko) * 2004-07-01 2006-05-18 마이크로소프트 코포레이션 페이지 카테고리 정보를 이용하여 검색 엔진 결과를분배하는 방법
KR20050007238A (ko) * 2004-12-17 2005-01-17 주식회사 비즈모델라인 개인정보 관리 서버

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101028928B1 (ko) 2008-09-30 2011-04-12 삼성에스디에스 주식회사 Cdn 환경에서 웹 로그 분석을 위한 스크립트 관리 장치 및 방법
US10521474B2 (en) 2014-04-30 2019-12-31 Samsung Electronics Co., Ltd. Apparatus and method for web page access
CN110020278A (zh) * 2017-09-08 2019-07-16 阿里巴巴集团控股有限公司 页面数据的展示、提供方法、客户端及服务器
CN110020278B (zh) * 2017-09-08 2023-05-02 阿里巴巴集团控股有限公司 页面数据的展示、提供方法、客户端及服务器

Similar Documents

Publication Publication Date Title
US20170228469A1 (en) Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
CN101452453B (zh) 一种输入法网址导航的方法和一种输入法系统
US8326818B2 (en) Method of managing websites registered in search engine and a system thereof
CN101178722B (zh) 用于选择和显示后代页面的方法和系统
CN1934569B (zh) 集成有用户注释的搜索系统和方法
US8645358B2 (en) Systems and methods for personalized search sourcing
US20060059133A1 (en) Hyperlink generation device, hyperlink generation method, and hyperlink generation program
JP5379978B2 (ja) 検索システム及び検索方法
US20070162524A1 (en) Network document management
CN1404590A (zh) 元数据分类和信息入口的创建方法
US9529922B1 (en) Computer implemented systems and methods for dynamic and heuristically-generated search returns of particular relevance
KR100771577B1 (ko) 웹페이지 접속 이력정보 관리방법
CN114328947A (zh) 一种基于知识图谱的问答方法和装置
KR100968545B1 (ko) 연관 컨텐츠 제공 방법
KR101485593B1 (ko) 검색결과 처리 방법
JP4842921B2 (ja) 検索システムおよびその方法
US10061859B2 (en) Computer implemented systems and methods for dynamic and heuristically-generated search returns of particular relevance
Mattosinho Mining Product Opinions and Reviews on the Web
TWI680666B (zh) 網路使用者身份辨識方法與系統
JP2007122504A (ja) 情報処理装置閲覧支援装置
Bathumalai Self adapting websites: mining user access logs.
Ali et al. RSS Feeds Filtering from Multiple Sources Using Automated Techniques of Natural Language Processing
US20090144231A1 (en) System and Method for Adding Search Keywords to Web Content
CN117952202A (zh) 业务知识管理系统和平台
KR20010090309A (ko) 등록/로그인 대행 시스템 및 그 대행 방법

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]
FPAY Annual fee payment

Payment date: 20121024

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20131024

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20141024

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee