KR101164289B1 - System and method for extracting a history of web activities - Google Patents

System and method for extracting a history of web activities Download PDF

Info

Publication number
KR101164289B1
KR101164289B1 KR1020080031633A KR20080031633A KR101164289B1 KR 101164289 B1 KR101164289 B1 KR 101164289B1 KR 1020080031633 A KR1020080031633 A KR 1020080031633A KR 20080031633 A KR20080031633 A KR 20080031633A KR 101164289 B1 KR101164289 B1 KR 101164289B1
Authority
KR
South Korea
Prior art keywords
web
message
user terminal
function
extraction
Prior art date
Application number
KR1020080031633A
Other languages
Korean (ko)
Other versions
KR20090106116A (en
Inventor
최승락
권동훈
Original Assignee
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이플래닛 주식회사 filed Critical 에스케이플래닛 주식회사
Priority to KR1020080031633A priority Critical patent/KR101164289B1/en
Publication of KR20090106116A publication Critical patent/KR20090106116A/en
Application granted granted Critical
Publication of KR101164289B1 publication Critical patent/KR101164289B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 사용자가 컴퓨터 단말기나 휴대 전화 등의 통신 단말기를 통해 웹 서버에서 제공하는 웹 서비스를 이용할 때, 사용자가 구매한 상품이나 조회했던 동영상 등의 컨텐츠를 사용한 웹 활동 정보를 추출해 저장해 두었다가, 다시 사용자가 통신 단말기로 웹 서버에 접속해 컨텐츠를 이용하고자 할 때 웹 활동 정보를 근거로 이전의 웹 활동 이력을 조회할 수 있도록 하는, 웹 활동 추출 방법 및 시스템에 관한 것으로서,According to the present invention, when a user uses a web service provided by a web server through a communication terminal such as a computer terminal or a mobile phone, the user extracts and stores web activity information using content such as a product purchased or a video viewed, and then stores the web activity information again. The present invention relates to a web activity extraction method and system that enables a user to access a web server through a communication terminal and use a content to inquire a previous web activity history based on web activity information.

본 발명에 따른 웹 활동 추출 시스템은, 통신망을 통해 웹 페이지를 제공하는 웹 서버; 및 상기 웹 서버로부터 제공받은 상기 웹 페이지부터 API 후킹을 이용하여 HTTP 메시지를 캡쳐하고, 상기 HTTP 메시지로부터 특정 추출 규칙에 근거해 컨텐츠 정보를 추출하는 사용자 단말기를 포함하고,Web activity extraction system according to the present invention, a web server for providing a web page via a communication network; And a user terminal which captures an HTTP message using API hooking from the web page provided from the web server, and extracts content information from the HTTP message based on a specific extraction rule.

본 발명에 의하면, 사용자 단말기에서 추출한 웹 활동 정보를 근거로 자신이 과거에 조회한 컨텐츠를 다시 열람할 수 있다. 또한, 웹 활동 정보를 기준으로 특정 컨텐츠를 용이하게 검색할 수 있다. 또한, 웹 페이지 요청시 컨텐츠의 URL 정보가 기록되어 있는 해당 컨텐츠를 포함하고 있는 웹 페이지를 바로 제공받을 수 있다. 그리고, 구체적인 컨텐츠에 대한 정보를 자동으로 기록하여 사용자가 편리한 방식으로 조회한 컨텐츠를 용이하게 관리할 수 있다.According to the present invention, it is possible to re-view the content that has been viewed in the past based on the web activity information extracted from the user terminal. In addition, specific content can be easily searched based on web activity information. In addition, when a web page is requested, a web page including the corresponding content in which the URL information of the content is recorded may be directly provided. In addition, by automatically recording information about the specific content, the user can easily manage the content in a convenient way.

웹 페이지, 캡쳐, 컨텐츠 정보, HTTP, 웹 활동, 추출, DLL, API, IAT Web Page, Capture, Content Info, HTTP, Web Activity, Extract, DLL, API, IAT

Description

웹 활동 추출 시스템 및 방법{System and method for extracting a history of web activities}System and method for extracting a history of web activities}

본 발명은 웹 활동 추출 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 사용자가 컴퓨터 단말기나 휴대 전화 등의 통신 단말기를 통해 웹 서버에서 제공하는 웹 사이트에 접속하여 웹 서비스를 이용할 때, 사용자가 구매한 상품이나 조회했던 동영상 등의 컨텐츠를 사용한 웹 활동 정보를 추출해 저장해 두었다가, 다시 사용자가 통신 단말기로 웹 서버에 접속해 컨텐츠를 이용하고자 할 때 웹 활동 정보를 근거로 이전의 웹 활동 이력을 조회할 수 있도록 하는, 웹 활동 추출 시스템 및 방법에 관한 것이다.The present invention relates to a web activity extraction system and method, and more particularly, when a user accesses a web site provided by a web server and uses a web service through a communication terminal such as a computer terminal or a mobile phone, After extracting and storing web activity information using contents such as products or videos that have been viewed, the user can view previous web activity history based on the web activity information when the user wants to access the web server using a communication terminal. To a web activity extraction system and method.

최근에, 컴퓨터 단말기 또는 휴대 전화 단말기를 이용한 웹 페이지의 사용이 증가하면서, 웹 활동을 추출하는 기술이 등장하고 있다.In recent years, as the use of web pages using a computer terminal or a mobile phone terminal increases, a technique for extracting web activity has emerged.

웹 활동은 사용자가 웹 사이트에 접속하여 상품을 구매하거나, 음악이나 동영상 등의 컨텐츠를 조회하거나 이용하는 동작을 포함한다.Web activity includes an operation in which a user accesses a web site, purchases a product, or views or uses content such as music or a video.

이러한 웹 활동을 추출하는 종래 기술은 웹 페이지 이용자의 이용 행태를 분석하거나 웹 페이지에 접속한 사용자의 웹 로그 파일을 분석하는 것을 들 수 있다.Conventional techniques for extracting such web activities include analyzing the usage behavior of web page users or analyzing web log files of users accessing web pages.

여기서 이용자의 이용 행태를 분석하는 방법으로 클릭스트림 기반 분석을 사용하고 있다. 클릭스트림 기반 분석 방법은 웹 페이지 이용자가 클릭한 웹 컨텐츠에 대하여 분석하는 방법으로, 이러한 분석 방법은 한 화면 이상으로 구성된 웹 컨텐츠의 경우 얼마나 노출되었는지 여부를 판단할 수 없다.Here, clickstream based analysis is used as a method of analyzing user usage behavior. The clickstream based analysis method is a method of analyzing web content clicked by a web page user, and such an analysis method cannot determine how exposed the web content is composed of more than one screen.

또한, 클릭스트림 분석의 경우 로그에 저장된 제한된 정보만을 이용하여 분석하므로 웹 컨텐츠를 다운로드하는데 소요되는 시간 및 이용자가 클릭하였지만 다른 행동으로 인하여 해당 컨텐츠를 제대로 보지 않고 지나가는 비활동 시간, 해당 컨텐츠에 대한 관심도 등에 따라 마우스 이동량 및 화면 이동량 등의 다양한 이용 행태 정보를 배제하고 일괄적으로 분석하고 있는 상태에 머물고 있다.In addition, in case of clickstream analysis, it analyzes using only limited information stored in the log, so the time required to download web content and inactivity time passed by users without clicking properly due to other actions and interest in the content For example, various usage behavior information such as mouse movement amount and screen movement amount are excluded and remain in a state of analysis.

한편, 웹 로그 분석은 웹 서버가 서비스를 제공하면서 생성하는 로그 파일(log file)을 분석하여 웹 서버의 트래픽(traffic) 및 에러 상태, 그리고 방문 경로 등 기본적인 분석을 수행하여 웹 서버의 시스템 문제와 기본적인 웹 사이트 사용량에 대하여 분석하는 것이다.On the other hand, web log analysis analyzes the log files generated by the web server while providing services, and performs basic analysis such as traffic and error status, and visit path of the web server, Analyze basic Web site usage.

이러한 웹 로그 분석을 위해서는 별도의 응용 프로그램 즉, HTML 코드의 화면 렌더링을 위해 응용 프로그램이 분석대상 웹 사이트와 통신하여 HTML 페이지를 수신한 후에 응용 프로그램을 클라이언트 단말기에 설치해야 하거나, 클라이언트 단말기의 웹 브라우저에서 사용할 플러그인을 설치해야 하는 불편함이 있었다.For this web log analysis, the application must be installed on the client terminal after receiving the HTML page by communicating with the web site to analyze the separate application, that is, rendering the HTML code. I had to install a plug-in for use.

따라서, 종래의 웹 활동 추출 방법은 웹 활동에 대해 기술적으로 분석하는 수준에 머물고 있으므로, 사용자가 웹 서비스를 이용할 때 웹 활동 정보를 저장해 두었다가, 이후에 접속해서 다시 웹 서비스를 이용할 때 이전의 웹 활동 정보를 활용할 수 있는 방안이 요구되고 있다.Therefore, the conventional method of extracting web activity remains at the level of technically analyzing the web activity. Therefore, when the user uses the web service, the web activity information is stored, and when the user accesses the web service again, the previous web activity is stored. There is a demand for ways to utilize information.

전술한 문제점을 해결하기 위해 본 발명은, 사용자가 컴퓨터 단말기나 휴대 전화 등의 통신 단말기를 통해 웹 서버에서 제공하는 웹 서비스를 이용할 때, 사용자가 구매한 상품이나 조회했던 동영상 등의 컨텐츠를 사용한 웹 활동 정보를 추출해 저장해 두었다가, 다시 사용자가 통신 단말기로 웹 서버에 접속해 컨텐츠를 이용하고자 할 때 웹 활동 정보를 근거로 이전의 웹 활동 이력을 조회할 수 있도록 하는, 웹 활동 추출 시스템 및 방법을 제공함에 그 목적이 있다.In order to solve the above-described problems, the present invention, when a user uses a web service provided by a web server through a communication terminal such as a computer terminal or a mobile phone, the web using the content, such as the product purchased by the user or the video that was viewed Provides a web activity extraction system and method that extracts and stores activity information, and allows the user to retrieve previous web activity history based on the web activity information when the user wants to access the web server with the communication terminal and use the content. Has its purpose.

전술한 목적을 달성하기 위한 본 발명에 따른 웹 활동 추출 시스템은, 통신망을 통해 웹 페이지를 제공하는 웹 서버; 및 상기 웹 서버로부터 제공받은 상기 웹 페이지부터 API 후킹을 이용하여 HTTP 메시지를 캡쳐하고, 상기 HTTP 메시지로부터 특정 추출 규칙에 근거해 컨텐츠 정보를 추출하는 사용자 단말기를 포함한다.Web activity extraction system according to the present invention for achieving the above object, a web server for providing a web page through a communication network; And a user terminal for capturing an HTTP message using API hooking from the web page provided from the web server and extracting content information based on a specific extraction rule from the HTTP message.

또한, 상기 사용자 단말기에서 상기 API 후킹은, 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하고, 상기 웹 서버로 웹 페이지를 요청하는 명령에 따라 상기 변경된 번지수의 특정 함수를 호출하며, 상기 특정 함수에 의해 상기 HTTP 메시지를 캡쳐하게 된다.In addition, the API hooking in the user terminal changes the address of the function of the import address table (IAT) that stores the address where the function is stored, and according to the command to request a web page to the web server. Call a specific function of the changed address, and capture the HTTP message by the specific function.

또한, 상기 API는 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 디엘엘(DLL) 정보는 상기 피이(PE) 파일의 임포트 어드레스 테이블(IAT)에 존재하게 된 다.In addition, the API is provided in the form of DL (DLL) in Windows, the corresponding DL (DLL) information is present in the import address table (IAT) of the PE file.

또한, 상기 사용자 단말기는, 웹 브라우저가 호출하는 윈속(WinSock) 에이피아이(API)를 후킹하여 상기 HTTP 메시지를 캡쳐하게 된다.In addition, the user terminal hooks a WinSock API called by a web browser to capture the HTTP message.

또한, 상기 사용자 단말기는, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 상기 특정 추출 규칙에 근거해 상기 컨텐츠 정보를 추출하게 된다.In addition, the user terminal extracts the content information based on the specific extraction rule defined for each web site and content type.

이때, 상기 특정 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다. 여기서, 상기 규칙 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함한다.In this case, the specific extraction rule is described as an XML document, and a plurality of rules are described through one or more rule tags. Here, the rule tag includes a match rule tag for matching and extracting a specific string.

그리고, 상기 사용자 단말기는 캡쳐한 상기 컨텐츠 정보를 웹 활동 정보로 저장하게 된다.The user terminal stores the captured content information as web activity information.

한편, 전술한 목적을 달성하기 위한 본 발명에 따른 웹 활동 추출 방법은, 웹 페이지를 제공하는 웹 서버와 상기 웹 서버로부터 상기 웹 페이지를 수신하는 클라이언트 단말기를 포함하는 시스템의 웹 활동 추출 방법에 있어서, (a) 상기 클라이언트 단말기가 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하는 단계; (b) 상기 클라이언트 단말기가 상기 웹 페이지를 요청하는 명령에 대응된 상기 변경된 번지수의 특정 함수를 호출하는 단계; (c) 상기 클라이언트 단말기가 상기 특정 함수를 통해 상기 웹 서버로 상기 웹 페이지를 요청하는 단계; (d) 상기 웹 서버가 상기 웹 페이지를 상기 클라이언트 단말기에게 제공하는 단계; (e) 상기 클라이언트 단말기가 상기 웹 페이지로 부터 HTTP 메시지를 캡쳐하는 단계; 및 (f) 상기 클라이언트 단말기가 상기 HTTP 메시지로부터 컨텐츠 정보를 추출하는 단계를 포함한다.On the other hand, the web activity extraction method according to the present invention for achieving the above object, in the web activity extraction method of the system comprising a web server for providing a web page and a client terminal for receiving the web page from the web server (a) changing, by the client terminal, the address number of a function of an import address table (IAT) that stores the address number at which the function is stored; (b) calling, by the client terminal, a specific function of the changed address number corresponding to the command for requesting the web page; (c) the client terminal requesting the web page to the web server through the specific function; (d) the web server providing the web page to the client terminal; (e) the client terminal capturing an HTTP message from the web page; And (f) the client terminal extracting content information from the HTTP message.

또한, 상기 특정 함수는, 상기 에이피아이(API)의 후킹(Hooking)을 이용하여 상기 HTTP 메시지를 캡쳐하는 기능을 수행하게 된다.In addition, the specific function performs a function of capturing the HTTP message by using hooking of the API.

또한, 상기 에이피아이(API)는 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 디엘엘(DLL) 정보는 상기 임포트 어드레스 테이블(IAT)에 존재하게 된다.In addition, the API is provided in the form of a DL (DLL) in Windows, the corresponding DL (DLL) information is present in the import address table (IAT).

또한, 상기 (e) 단계는, 웹 브라우저가 호출하는 윈속(WinSock) 에이피아이(API)를 후킹하여 상기 HTTP 메시지를 캡쳐하게 된다.Also, in the step (e), the HTTP message is captured by hooking a WinSock API called by a web browser.

또한, 상기 (f) 단계는, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 상기 컨텐츠 정보를 추출하게 된다.In the step (f), the content information is extracted based on an extraction rule defined for each web site and for each type of content information.

또한, 상기 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다.In addition, the extraction rule is described in an XML document, and a plurality of rules are described through one or more rule tags.

또한, 상기 규칙 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함한다.The rule tag may also include a match rule tag that matches and extracts a specific string.

그리고, (g) 상기 클라이언트 단말기가 상기 컨텐츠 정보를 웹 활동 정보로 저장하는 단계를 더 포함한다.And (g) storing, by the client terminal, the content information as web activity information.

한편, 전술한 목적을 달성하기 위한 본 발명에 따른 클라이언트 단말기는, 웹 페이지를 제공하는 웹 서버와 HTTP 메시지를 송수신하는 통신부; 상기 HTTP 메시지로부터 웹 활동 정보를 추출하기 위해, 함수가 저장되어 있는 번지수를 저장하 고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 특정 함수의 번지수로 변경하고, 상기 통신부에서 상기 웹 서버로 상기 HTTP 메시지를 요청 시 상기 변경된 번지수의 특정 함수를 호출하여 상기 웹 활동 정보의 추출을 제어하는 제어부; 상기 호출된 특정 함수에 의해 상기 웹 페이지로부터 상기 HTTP 메시지를 캡쳐하고, 상기 HTTP 메시지로부터 컨텐츠 정보를 추출하는 웹 활동 추출기; 및 상기 웹 서버에서 수신된 상기 HTTP 메시지를 이용하여 상기 웹 페이지를 디스플레이하는 표시부를 포함한다.On the other hand, the client terminal according to the present invention for achieving the above object, Communication unit for transmitting and receiving an HTTP message with a web server for providing a web page; In order to extract the web activity information from the HTTP message, the address of the function of the import address table (IAT), which stores the address where the function is stored, is changed to the address of a specific function, and the web is transmitted to the communication unit. A control unit which controls the extraction of the web activity information by calling a specific function of the changed address when requesting the HTTP message to a server; A web activity extractor for capturing the HTTP message from the web page by the called specific function and extracting content information from the HTTP message; And a display unit for displaying the web page using the HTTP message received from the web server.

또한, 상기 웹 활동 추출기는, 상기 HTTP 메시지를 캡쳐하는 메시지 캡쳐 모듈과, 상기 HTTP 메시지로부터 상기 컨텐츠 정보를 추출하는 메시지 분석 모듈 및 상기 HTTP 메시지로부터 상기 컨텐츠 정보와 상관없는 데이터를 제거하는 필터를 포함한다.The web activity extractor may include a message capture module for capturing the HTTP message, a message analysis module for extracting the content information from the HTTP message, and a filter for removing data not related to the content information from the HTTP message. do.

또한, 상기 웹 활동 추출기는, 상기 웹 브라우저의 생성 시에 상기 HTTP 메시지를 캡쳐하는 후크 DLL을 상기 웹 브라우저 상으로 로딩시키게 된다.The web activity extractor also loads a hook DLL on the web browser that captures the HTTP message upon creation of the web browser.

또한, 상기 메시지 분석 모듈은, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 상기 컨텐츠 정보를 추출하게 된다.The message analysis module extracts the content information based on an extraction rule defined for each web site and for each type of content information.

또한, 상기 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙 태그를 통해 다수의 규칙이 기술되고, 상기 추출 태그는 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함한다.In addition, the extraction rule is described in an XML document, a plurality of rules are described through one or more rule tags, and the extraction tag includes a match rule tag that matches and extracts a specific string.

그리고, 상기 컨텐츠 정보를 상기 웹 활동 정보로 저장하기 위한 저장부를 더 포함한다.The apparatus may further include a storage unit for storing the content information as the web activity information.

한편, 전술한 목적을 달성하기 위한 본 발명에 따른 클라이언트 단말기의 웹 활동 추출 방법은, 웹 페이지를 제공하는 웹 서버로부터 상기 웹 페이지를 수신하는 클라이언트 단말기의 웹 활동 추출 방법에 있어서, 웹 페이지를 제공하는 웹 서버로부터 HTTP 메시지를 수신하는 클라이언트 단말기의 웹 활동 추출 방법에 있어서, (a) 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하는 단계; (b) 상기 웹 페이지를 요청하는 명령에 대응된 상기 변경된 번지수의 특정 함수를 호출하는 단계; (c) 상기 특정 함수를 통해 상기 웹 서버로 상기 HTTP 메시지를 요청하는 단계; (d) 상기 웹 서버로부터 상기 HTTP 메시지를 수신하는 단계; (e) 수신된 상기 HTTP 메시지를 캡쳐하는 단계; 및 (f) 상기 HTTP 메시지로부터 컨텐츠 정보를 추출하는 단계를 포함한다.On the other hand, the web activity extraction method of the client terminal according to the present invention for achieving the above object, in the web activity extraction method of the client terminal receiving the web page from a web server for providing a web page, provides a web page A method of extracting a web activity of a client terminal receiving an HTTP message from a web server, the method comprising: (a) changing a number of functions of an import address table (IAT) that stores a number of stored addresses; (b) calling a specific function of the changed address number corresponding to the command for requesting the web page; (c) requesting the HTTP message to the web server through the specific function; (d) receiving the HTTP message from the web server; (e) capturing the received HTTP message; And (f) extracting content information from the HTTP message.

또한, 상기 특정 함수는, 에이피아이(API)의 후킹을 이용하여 상기 HTTP 메시지를 캡쳐하는 기능을 수행하게 된다.In addition, the specific function performs a function of capturing the HTTP message using hooking of an API.

또한, 상기 에이피아이(API)는 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 디엘엘(DLL) 정보는 상기 임포트 어드레스 테이블(IAT)에 존재한다.In addition, the API is provided in the form of a DL (DLL) in Windows, the corresponding DL (DLL) information is present in the import address table (IAT).

또한, 상기 (e) 단계는, 웹 브라우저가 호출하는 윈속(WinSock) 에이피아이(API)를 후킹하여 상기 HTTP 메시지를 캡쳐하게 된다.Also, in the step (e), the HTTP message is captured by hooking a WinSock API called by a web browser.

또한, 상기 (f) 단계는, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 상기 컨텐츠 정보를 추출하게 된다.In the step (f), the content information is extracted based on an extraction rule defined for each web site and for each type of content information.

또한, 상기 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규 칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다.In addition, the extraction rule is described in an XML document, and a plurality of rules are described through one or more rule tags.

그리고, 상기 규칙 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함한다.The rule tag includes a match rule tag for matching and extracting a specific string.

한편, 전술한 목적을 달성하기 위한 본 발명에 따른 프로그램이 기록된 기록 매체는, (a) 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하는 과정; (b) 상기 변경된 번지수의 특정 함수를 웹 페이지를 요청하는 명령에 따라 호출하는 과정; (c) 상기 특정 함수에 의해 상기 웹 서버로부터 수신되는 상기 HTTP 메시지를 캡쳐하는 과정; 및 (d) 상기 HTTP 메시지로부터 컨텐츠 정보를 추출하는 과정을 처리하는 프로그램이 기록되어 있다.On the other hand, in the recording medium in which the program according to the present invention for achieving the above object is recorded, (a) the process of changing the address of the function of the import address table (IAT) that stores the address where the function is stored ; (b) calling a specific function of the changed address number according to a command for requesting a web page; (c) capturing the HTTP message received from the web server by the specific function; And (d) a program for processing a process of extracting content information from the HTTP message.

본 발명에 의하면, 사용자 단말기에서 추출한 웹 활동 정보를 근거로 자신이 과거에 조회한 컨텐츠를 다시 열람할 수 있다. 또한, 웹 활동 정보를 기준으로 특정 컨텐츠를 용이하게 검색할 수 있다. 또한, 웹 페이지 요청시 컨텐츠의 URL 정보가 기록되어 있는 해당 컨텐츠를 포함하고 있는 웹 페이지를 바로 제공받을 수 있다. 그리고, 구체적인 컨텐츠에 대한 정보를 자동으로 기록하여 사용자가 편리한 방식으로 조회한 컨텐츠를 용이하게 관리할 수 있다.According to the present invention, it is possible to re-view the content that has been viewed in the past based on the web activity information extracted from the user terminal. In addition, specific content can be easily searched based on web activity information. In addition, when a web page is requested, a web page including the corresponding content in which the URL information of the content is recorded may be directly provided. In addition, by automatically recording information about the specific content, the user can easily manage the content in a convenient way.

본 발명의 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Reference will now be made in detail to the preferred embodiments of the present invention, examples of which are illustrated in the accompanying drawings, wherein like reference numerals refer to the like elements throughout. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 실시예에 따른 웹 활동 추출 시스템의 구성을 개략적으로 나타낸 구성도이다.1 is a block diagram schematically showing the configuration of a web activity extraction system according to an embodiment of the present invention.

도 1을 참조하면, 본 발명에 따른 웹 활동 추출 시스템(100)은, 사용자 단말기(110, 112), 통신망(120), 웹 서버(130)를 포함한다.Referring to FIG. 1, the web activity extraction system 100 according to the present invention includes user terminals 110 and 112, a communication network 120, and a web server 130.

여기서, 사용자 단말기(110, 112)는 이동 통신망과 인터넷을 경유해 웹 서버(130)로부터 웹 페이지를 수신하는 이동통신 단말기나, 인터넷을 통해 웹 서버(130)로부터 웹 페이지를 수신하는 컴퓨터 등의 유선 단말기를 포함한다.Here, the user terminals 110 and 112 are mobile communication terminals that receive a web page from the web server 130 via a mobile communication network and the Internet, or a computer that receives a web page from the web server 130 via the Internet. It includes a wired terminal.

사용자 단말기(110, 112)는 웹 서버(130)로부터 제공받은 웹 페이지에서 HTTP(HyperText Transfer Protocol) 메시지를 캡쳐하고, HTTP 메시지로부터 컨텐츠 정보를 추출하게 된다.The user terminals 110 and 112 capture a HyperText Transfer Protocol (HTTP) message from a web page provided from the web server 130 and extract content information from the HTTP message.

사용자 단말기(110, 112)는 HTTP 메시지를 캡쳐할 때, 피이(Portable Execution) 파일의 임포트 어드레스 테이블(Import Address Table, 이하 IAT) 변경을 통한 API(Application Program Interface) 후킹(Hooking) 기능을 이용하여 HTTP 메시지를 캡쳐하게 된다. When capturing HTTP messages, the user terminals 110 and 112 use an API (Application Program Interface) hooking function by changing an import address table (hereinafter referred to as an IAT) of a portable execution file. It will capture HTTP messages.

IAT는 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이 블(Import Address Table)이다. 원래 IAT에는 시스템에서 기본적으로 이용하는 API가 저장되어 있는 번지수가 저장되어 있으나, 본 발명에서는 API 대신에 마이콜백(My Callback) 함수를 정의하고, API의 번지수를 마이콜백 함수의 번지수로 변경하는 것이다. 여기서, 마이콜백 함수는 HTTP 메시지를 캡쳐하는 기능을 가진다. IAT is an Import Address Table that stores the address where the function is stored. Originally, the IAT stores the address where the API is basically used in the system. However, in the present invention, the My Callback function is defined instead of the API, and the address of the API is changed to the address of the My Callback function. will be. Here, the callback function has a function of capturing an HTTP message.

따라서, 사용자 단말기(110, 112)가 웹 서버(130)로부터 웹 페이지를 수신하기 위한 함수를 호출할 때, IAT에 근거해 이전의 API 대신에 마이콜백 함수를 호출하고, 마이콜백 함수를 통해 HTTP 메시지를 캡쳐하게 되는 것이다. 이러한 기능을 본 발명의 실시예에서는 'API 후킹 기능'이라 칭한다.Therefore, when the user terminals 110 and 112 call a function for receiving a web page from the web server 130, the user terminal 110 and 112 call the callback function instead of the previous API based on the IAT, and the HTTP call through the callback function. It will capture the message. Such a function is called an "API hooking function" in the embodiment of the present invention.

PE 파일은 윈도우즈에서 실행 가능한 파일이 실행되기 위해 운영체제에서 필요한 모든 정보를 담고 있는 자료구조이고, 웹 브라우저를 통해 웹 서버(130)로부터 웹 페이지를 가져오기 위한 일반 API 함수를 포함하고 있다.The PE file is a data structure that contains all the information needed by the operating system in order to execute an executable file on Windows, and contains a general API function for getting a web page from the web server 130 through a web browser.

API는 응용 프로그램 인터페이스로서, 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 DLL 정보는 PE 파일의 IAT 테이블에 존재하게 된다. API는 응용 프로그램에서 사용할 수 있도록 운영 체제나 프로그래밍 언어가 제공하는 기능을 제어할 수 있도록 만든 인터페이스를 뜻한다. 주로 파일 제어, 윈도우 제어, 화상 처리, 문자 제어 등을 위한 인터페이스가 제공된다.API is an application program interface. It is provided in the form of DL (DLL) in Windows, and the DLL information is present in the IAT table of the PE file. An API is an interface that allows an application to control the functionality provided by an operating system or programming language for use in an application. Mainly provided are interfaces for file control, window control, image processing, character control, and the like.

즉, API는 운영체계나 다른 응용프로그램에게 처리 요구를 할 수 있도록 컴퓨터 운영 체계나 다른 응용프로그램에 의해 미리 정해진 특별한 메쏘드(Method)이다. 따라서, API는 운영체계나 프로그램의 인터페이스로서 사용자와 직접적으로 대하게 되는 그래픽 사용자 인터페이스나 명령형 인터페이스와는 뚜렷한 차이가 있 다. 또한, API는 응용프로그램이 운영체계나 데이터베이스 관리시스템과 같은 시스템 프로그램과 통신할 때 사용되는 언어나 메시지 형식을 말한다. API는 프로그램 내에서 실행을 위해 특정 서브루틴에 연결을 제공하는 함수를 호출함으로써 구현된다. 그러므로 하나의 API는 함수 호출에 의해 요청되는 작업을 수행하기 위해 이미 존재하거나 또는 연결되어야 하는 몇 개의 프로그램 모듈이나 루틴을 가진다.In other words, an API is a special method predetermined by a computer operating system or another application to make a processing request to an operating system or another application. Thus, the API is distinct from the graphical user interface or the command-line interface, which directly interacts with the user as the operating system or program interface. In addition, an API is a language or message format used when an application program communicates with a system program such as an operating system or a database management system. An API is implemented by calling a function that provides a link to a specific subroutine for execution within a program. Thus, an API has several program modules or routines that must already exist or be linked to perform the work requested by the function call.

사용자 단말기(110, 112)는 웹 브라우저가 호출하는 윈속(WinSock)에 API를 후킹하여 HTTP 메시지를 캡쳐하게 된다.The user terminals 110 and 112 hook an API to WinSock called by a web browser to capture an HTTP message.

또한, 사용자 단말기(110, 112)는 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 컨텐츠 정보를 추출하게 된다. In addition, the user terminals 110 and 112 extract content information based on an extraction rule defined for each web site and for each type of content information.

그리고, 사용자 단말기(110, 112)는 캡쳐한 컨텐츠 정보를 웹 활동 정보로 저장하게 된다.The user terminals 110 and 112 store the captured content information as web activity information.

통신망(120)은 유선 통신을 위한 인터넷 망이나 무선 통신을 위한 이동 통신망을 포함한다.The communication network 120 includes an internet network for wired communication or a mobile communication network for wireless communication.

여기서, 통신망(120)이 인터넷 망일 경우에 사용자 단말기(110)는 컴퓨터 단말기일 수 있다.Here, when the communication network 120 is the Internet network, the user terminal 110 may be a computer terminal.

또한, 통신망(120)이 이동 통신망일 경우에, 사용자 단말기(112)는 PDA(Personal Digital Assistant), 셀룰러폰, PCS(Personal Communication Service)폰, GSM(Global System for Mobile)폰, W-CDMA(Wideband CDMA)폰, CDMA-2000폰, MBS(Mobile Broadband System)폰 등을 포함한다. In addition, when the communication network 120 is a mobile communication network, the user terminal 112 may be a personal digital assistant (PDA), a cellular phone, a personal communication service (PCS) phone, a global system for mobile (GSM) phone, a W-CDMA ( Wideband CDMA) phones, CDMA-2000 phones, Mobile Broadband System (MBS) phones and the like.

또한, 통신망(120)이 이동 통신망일 경우에, 본 발명은 코드분할 다중접 속(CDMA:Code Division Multiple Access), 광대역 코드분할 다중접속(WCDMA:Wideband Code Division Multiple Access), 고속 데이터 패킷 접속(HSDPA:High Speed Data Packet Access), 와이브로(Wibro) 등의 네트워크에 적용할 수 있다. In addition, when the communication network 120 is a mobile communication network, the present invention provides a code division multiple access (CDMA), a wideband code division multiple access (WCDMA), and a high speed data packet connection. It can be applied to a network such as HSDPA: High Speed Data Packet Access (WSD) and Wibro.

웹 서버(130)는 통신망(120)을 통해 사용자 단말기(110, 112)로 웹 서비스를 제공한다. 여기서, 웹 서비스는 사용자 단말기(110, 112)에게 웹 페이지를 비롯하여 음악 파일이나 동영상을 제공하거나, 사용자 단말기(110, 112)가 웹 서버(130)로 데이터 읽기나 쓰기를 수행하도록 하는 서비스를 포함한다. 본 발명의 실시예에서는 설명의 편의를 위해 웹 서버(130)가 사용자 단말기(110, 112)에게 웹 페이지를 제공하는 것으로 설명한다.The web server 130 provides a web service to the user terminals 110 and 112 through the communication network 120. Here, the web service includes a service for providing music files or a video to the user terminals 110 and 112, including a web page, or allowing the user terminals 110 and 112 to read or write data to the web server 130. do. In the embodiment of the present invention, for convenience of description, the web server 130 will be described as providing a web page to the user terminals 110 and 112.

도 2는 본 발명에 따른 사용자 단말기의 내부 구성을 개략적으로 나타낸 구성도이다.2 is a configuration diagram schematically showing an internal configuration of a user terminal according to the present invention.

도 2를 참조하면, 본 발명에 따른 사용자 단말기(110, 112)는 통신부(210), 저장부(220), 제어부(230), 웹 활동 추출기(240) 및 표시부(250)를 포함한다.Referring to FIG. 2, the user terminals 110 and 112 according to the present invention include a communication unit 210, a storage unit 220, a control unit 230, a web activity extractor 240, and a display unit 250.

위 구성에서, 각 통신부(210)와 저장부(220), 제어부(230), 웹 활동 추출기(240) 및 표시부(250)는 버스(Bus)로 연결될 수 있다.In the above configuration, each communication unit 210, the storage unit 220, the control unit 230, the web activity extractor 240 and the display unit 250 may be connected by a bus (Bus).

여기서, 웹 활동 추출기(240)는 메시지 캡쳐모듈(240)과 메시지 분석모듈(250)을 포함한다.Here, the web activity extractor 240 includes a message capture module 240 and a message analysis module 250.

통신부(210)는 통신망(120) 통해 웹 서버(130)와 통신하여, 웹 서버(130)로 부터 제공된 웹 페이지를 수신한다. 즉, 통신부(210)는 웹 페이지를 제공하는 웹 서버와 HTTP 메시지를 송수신한다.The communication unit 210 communicates with the web server 130 through the communication network 120 to receive a web page provided from the web server 130. That is, the communication unit 210 transmits and receives an HTTP message with a web server that provides a web page.

저장부(220)는 통신부(210)를 통해 수신한 데이터를 저장하기 위한 데이터 메모리를 포함한다. 또한, 저장부(220)는 일부 저장 영역을 통해 버퍼(Buffer) 역할을 한다. 또한, 저장부(220)는 메시지 캡쳐모듈(240)에 의해 캡쳐된 HTTP 메시지를 저장하고, 단말기가 위치한 위치 정보 및 시스템 사양 정보를 저장하고 있다.The storage unit 220 includes a data memory for storing data received through the communication unit 210. In addition, the storage unit 220 serves as a buffer through some storage areas. In addition, the storage unit 220 stores the HTTP message captured by the message capture module 240, and stores the location information and system specification information where the terminal is located.

그리고, 저장부(220)는 HTTP 메시지로부터 추출된 컨텐츠 정보를 웹 활동 정보로 저장한다.The storage unit 220 stores the content information extracted from the HTTP message as web activity information.

제어부(230)는 웹 서버(130)로부터 제공되는 웹 페이지에서 HTTP 메시지를 캡쳐하고, HTTP 메시지로부터 컨텐츠 정보를 추출하여 웹 활동 정보로 저장하는 동작을 제어한다. 즉, 제어부(230)는 HTTP 메시지로부터 웹 활동 정보를 추출하기 위해, 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 특정 함수의 번지수로 변경하고, 통신부(210)에서 웹 서버(130)로 HTTP 메시지를 요청 시 변경된 번지수의 특정 함수를 호출하여 웹 활동 정보의 추출을 제어한다.The controller 230 controls an operation of capturing an HTTP message from a web page provided from the web server 130, extracting content information from the HTTP message, and storing the content information as web activity information. That is, in order to extract web activity information from the HTTP message, the controller 230 changes the address number of the function of the import address table IAT, which stores the address where the function is stored, to the address number of the specific function, When the communication unit 210 requests the HTTP message from the web server 130, the specific function of the changed address is called to control the extraction of the web activity information.

웹 활동 추출기(240)는 호출된 특정 함수에 의해 웹 페이지에서 HTTP 메시지를 캡쳐하고, HTTP 메시지로부터 컨텐츠 정보를 추출하는 기능을 한다. The web activity extractor 240 functions to capture an HTTP message from a web page and extract content information from the HTTP message by a specific function called.

이때, 웹 활동 추출기(240)는 HTTP 메시지를 캡쳐하는 메시지 캡쳐 모듈(242)과, HTTP 메시지로부터 컨텐츠 정보를 추출하는 메시지 분석 모듈(244)을 포함한다.In this case, the web activity extractor 240 includes a message capture module 242 for capturing an HTTP message and a message analysis module 244 for extracting content information from the HTTP message.

즉, 웹 활동 추출기(240)는 웹 페이지를 수신하기 위한 함수를 호출할 때, 메시지 캡쳐 모듈(242)을 통해 IAT에 근거해 마이콜백 함수를 호출하고, 마이콜백 함수를 통해 HTTP 메시지를 캡쳐하게 된다. 그리고, 웹 활동 추출기(240)는 메시지 분석 모듈(244)을 통해 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 컨텐츠 정보를 추출하게 된다. That is, when the web activity extractor 240 calls a function for receiving a web page, the web activity extractor 240 calls the mycallback function based on the IAT through the message capture module 242 and captures the HTTP message through the mycallback function. do. The web activity extractor 240 extracts the content information based on the extraction rule defined for each web site and the content information type through the message analysis module 244.

이때, 추출 규칙은 XML 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다. 여기서, 추출 태그는, 특정 문자열을 매칭하여 추출하는 매치 태그(<match_rule>)를 포함한다.In this case, the extraction rule is described as an XML document, and a plurality of rules are described through one or more rule tags. Here, the extraction tag includes a match tag <match_rule> for matching and extracting a specific string.

표시부(250)는 웹 브라우저가 표시되도록 하고, 웹 브라우저를 통해 웹 페이지를 디스플레이한다. 즉, 표시부(250)는 웹 서버(130)에서 수신된 HTTP 메시지를 이용하여 웹 페이지를 디스플레이한다.The display unit 250 allows a web browser to be displayed and displays a web page through the web browser. That is, the display unit 250 displays a web page using the HTTP message received from the web server 130.

도 3은 본 발명의 실시예에 따른 사용자 단말기에서 웹 활동 추출기의 구성을 개략적으로 나타낸 구성도이다.3 is a schematic diagram showing the configuration of a web activity extractor in a user terminal according to an embodiment of the present invention.

도 3을 참조하면, 본 발명에 따른 웹 활동 추출기(240)는 메시지 캡쳐 모듈(242), 필터(310), 메시지 분석 모듈(244) 및 후크 DLL 로더(Loader)(320)를 포함한다.Referring to FIG. 3, the web activity extractor 240 in accordance with the present invention includes a message capture module 242, a filter 310, a message analysis module 244, and a hook DLL loader 320.

필터(310)는 HTTP 메시지 중 추출하고자 하는 컨텐츠 정보와 상관이 없는 예컨대, CSS나 자바 스크립트 등의 데이터를 제거하는 역할을 한다.The filter 310 removes data, for example, CSS or JavaScript, which is not related to content information to be extracted from the HTTP message.

후크 DLL 로더(320)는 웹 브라우저(330)가 표시부(250)에 생성될 때 웹 활동 추출기(240)로부터 후크 DLL(322)을 웹 브라우저(330) 상으로 로딩(Loading)시키는 역할을 한다.The hook DLL loader 320 serves to load the hook DLL 322 onto the web browser 330 from the web activity extractor 240 when the web browser 330 is generated on the display 250.

따라서, 표시부(250)의 웹 브라우저(330)는 후크 DLL(322)을 포함하고 있다. 이때, 후크 DLL(322)은 윈속(WinSock) API를 후킹하여 웹 브라우저(330)가 송수신하는 HTTP 메시지를 얻어서 메시지 캡쳐 모듈(242)로 전달한다.Accordingly, the web browser 330 of the display unit 250 includes the hook DLL 322. At this time, the hook DLL 322 hooks the WinSock API to obtain an HTTP message transmitted and received by the web browser 330 and delivers it to the message capture module 242.

메시지 캡쳐 모듈(242)은 후크 DLL(322)로부터 전달받은 HTTP 메시지를 Request/Response pair를 맞춰 필터(310)로 전달한다.The message capture module 242 delivers the HTTP message received from the hook DLL 322 to the filter 310 by matching the request / response pair.

메시지 분석 모듈(244)은 캡쳐된 HTTP 메시지의 호스트(host) 정보에 대해 키(Key)를 이용한 해쉬(hash) 값과 같은 추출 규칙만을 선택하여, 그 추출 규칙에 따라 스트링 매칭(String Matching)을 통해 컨텐츠 정보를 추출하게 된다.The message analysis module 244 selects only an extraction rule such as a hash value using a key for the host information of the captured HTTP message, and performs string matching according to the extraction rule. Through the content information is extracted.

도 4는 본 발명의 실시예에 따른 웹 활동 추출 방법을 설명하기 위한 흐름도이다.4 is a flowchart illustrating a web activity extraction method according to an embodiment of the present invention.

도 4를 참조하면, 사용자 단말기(110, 112)에서 웹 활동 추출기(240)는 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 API에 관한 함수의 번지수를 본 발명에 따른 마이콜백 함수의 번지수로 변경한다(S410).Referring to FIG. 4, the web activity extractor 240 in the user terminals 110 and 112 may use the address of a function related to an API of an import address table (IAT) that stores the address where a function is stored. The address of the MyCallback function is changed (S410).

따라서, 사용자가 웹 페이지를 요청하게 될 때, 웹 활동 추출기(240)는 변경된 IAT를 참조해 일반적인 API에 관한 함수를 호출하는 것이 아니라 마이콜백 함수를 호출하게 되는 것이다.Therefore, when a user requests a web page, the web activity extractor 240 refers to the changed IAT and calls a callback function instead of calling a function related to a general API.

이어, 사용자가 웹 브라우저(330)를 실행함에 따라 사용자로부터 웹 페이지 의 요청이 있는 경우에, 제어부(230)는 웹 활동 추출기(240)를 통해 API에 관한 함수를 호출하게 되는데, 후크 DLL 로더(320)를 통해 후크 DLL(322)을 웹 브라우저(330) 상으로 로딩하고, 도 5에 도시된 바와 같이 IAT의 변경된 번지수를 참조해 마이콜백 함수를 호출한다(S420). Subsequently, when a user requests a web page as the user executes the web browser 330, the controller 230 calls a function related to an API through the web activity extractor 240, and includes a hook DLL loader ( The hook DLL 322 is loaded onto the web browser 330 through 320, and the callback function is called with reference to the changed address of the IAT as shown in FIG. 5 (S420).

여기서, 도 5는 본 발명의 실시예에 따라 웹 페이지 요청시 변경 IAT를 참조해 마이콜백 함수를 호출하는 과정을 나타낸 도면이다.5 is a diagram illustrating a process of calling a callback function with reference to a changed IAT when a web page is requested according to an embodiment of the present invention.

즉, 도 5에 도시된 바와 같이 웹 활동 추출기(240)는 웹 서버(130)로 웹 페이지를 요청하기 위해, 예컨대, 'xxAPI'를 호출하게 되는데, IAT는 "0031322" 번지를 가리키고 있어 'xxAPI'는 "0031322" 번지를 읽게 되고(S510), "0031322"번지는 다시 "0x002011" 번지를 가리키고 있으므로, 'xxAPI'는 "0x002011" 번지를 읽게 된다(S520). 이때, IAT의 "0x002011" 번지에는 마이콜백 함수가 저장되어 있는 번지수 "Ox201201"가 저장되어 있어, 'xxAPI'는 기존의 "0x10032" 번지에 있는 일반적인 DLL을 호출하지 않고 "0x201201" 번지에 있는 마이콜백 함수를 호출하게 되는 것이다(S530). 이어, 마이콜백 함수는 "0x10032" 번지에 있는 원래의 'xxAPI'를 호출하여(S540), 소켓으로부터 읽는 데이터와 쓰는 데이터를 가져온다.That is, as shown in FIG. 5, the web activity extractor 240 calls, for example, 'xxAPI' to request a web page from the web server 130, and the IAT indicates the address of '0031322', so the 'xxAPI' 'Reads the address "0031322" (S510), and since "0031322" refers to the address "0x002011" again,' xxAPI 'reads the address "0x002011" (S520). At this time, "0x002011" of IAT stores address "Ox201201" where mycallback function is stored, so 'xxAPI' does not call the general DLL of existing "0x10032" and does not call the existing DLL at "0x201201". The callback function will be called (S530). Subsequently, the callback function calls the original 'xxAPI' at the address "0x10032" (S540) to obtain data read from the socket and data to be written.

웹 활동 추출기(240)는 웹 브라우저(330)가 HTTP 메시지를 송수신 하도록 WIN32 API 중 WinSock API를 이용하게 된다. 따라서, 웹 활동 추출기(240)는 웹 브라우저(330)가 호출하는 WinSock API를 후킹함으로써, 웹 브라우저(330)가 후크 DLL(322)을 통해 소켓에서 읽는 데이터와 쓰는 데이터를 가져올 수 있다.The web activity extractor 240 uses the WinSock API of the WIN32 API to allow the web browser 330 to send and receive an HTTP message. Accordingly, the web activity extractor 240 hooks the WinSock API called by the web browser 330, so that the web browser 330 can get data read from the socket and write data through the hook DLL 322.

제어부(230)는 웹 브라우저(330) 상으로 후크 DLL(322)이 로딩된 상태에서, 웹 페이지를 요청하는 메시지를 웹 서버로 전송한다(S430).The controller 230 transmits a message requesting a web page to a web server while the hook DLL 322 is loaded onto the web browser 330 (S430).

이에 대해, 웹 서버(130)는 통상적인 절차에 따라 해당 웹 페이지를 사용자 단말기(110, 112)로 전송해 주고, 사용자 단말기(110, 112)는 웹 서버(130)로부터 해당 웹 페이지를 수신하게 된다(S440).In this regard, the web server 130 transmits the web page to the user terminals 110 and 112 according to a conventional procedure, and the user terminals 110 and 112 receive the web page from the web server 130. (S440).

제어부(230)는 수신된 웹 페이지를 웹 브라우저(330) 상으로 디스플레이하게 되는데, 이때 웹 브라우저(330) 상에 로딩되어 있는 후크 DLL(322)이 웹 페이지로부터 HTTP 메시지를 캡쳐하여 웹 활동 추출기(240)의 메시지 캡쳐 모듈(242)로 전달함으로써, HTTP 메시지를 캡쳐하게 된다(S450).The controller 230 displays the received web page on the web browser 330. At this time, the hook DLL 322 loaded on the web browser 330 captures an HTTP message from the web page and extracts the web activity extractor. By passing to the message capture module 242 of 240, to capture the HTTP message (S450).

메시지 캡쳐 모듈(242)은 HTTP 메시지를 필터(310)로 전달하고, 필터(310)는 추출할 컨텐츠 정보와 상관이 없는 CSS나 자바 스크립트 등의 패킷 데이터를 제거한 후 메시지 분석 모듈(244)로 전달한다.The message capture module 242 delivers the HTTP message to the filter 310, and the filter 310 removes packet data such as CSS or JavaScript that is not correlated with the content information to be extracted, and then delivers the packet data to the message analysis module 244. do.

이에 따라, 웹 활동 추출기(240)는 메시지 분석 모듈(244)을 통해 HTTP 메시지로부터 컨텐츠 정보를 추출한다(S460).Accordingly, the web activity extractor 240 extracts content information from the HTTP message through the message analysis module 244 (S460).

이때, 컨텐츠 정보는 HTTP 메시지 내에 포함되어 있는데, 그 위치가 웹 사이트 별, 컨텐츠 정보 유형 별로 다르다. 따라서, 메시지 분석 모듈(244)은 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 특정 추출 규칙에 따라 컨텐츠 정보를 추출하게 된다. 이 컨텐츠 정보는 예컨대, 사용자가 이용한 웹 사이트 주소를 비롯해 이용한 음악 파일이나 동영상 파일에 대한 정보, 쇼핑몰의 경우에 구매했던 상품 정보 등을 포함할 수 있다. 또한, 컨텐츠 정보는 컨텐츠의 제목, 사진, 태그, 가격 등에 대한 정보를 포함할 수 있다.At this time, the content information is included in the HTTP message, and its location is different for each web site and content type. Accordingly, the message analysis module 244 extracts the content information according to a specific extraction rule defined for each web site and for each type of content information. The content information may include, for example, a website address used by a user, information on a music file or a video file used, and product information purchased in a shopping mall. In addition, the content information may include information about a title, a picture, a tag, a price, and the like of the content.

여기서, 특정 추출 규칙은 웹 문서로부터 웹 활동 관련 정보를 추출하기 위한 규칙으로서, 도 6에 도시된 바와 같이 XML 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다. 도 6은 본 발명이 적용된 메시지 분석 모듈에서 이용하는 특정 추출 규칙의 문서 내용의 일 예를 나타낸 도면이다. 이때, 추출 태그는 도 6에 도시된 바와 같이 특정 문자열을 매칭하여 추출하는 매치 룰(<match_rule>) 태그를 포함한다. Here, the specific extraction rule is a rule for extracting web activity related information from a web document, which is described as an XML document as shown in FIG. 6, and a plurality of rules are defined through one or more rule tags. Are described. 6 is a diagram illustrating an example of document contents of a specific extraction rule used in the message analysis module to which the present invention is applied. At this time, the extraction tag includes a match rule (<match_rule>) tag that matches and extracts a specific string as shown in FIG. 6.

제어부(230)는 웹 활동 추출기(240)를 통해 추출된 컨텐츠 정보를 웹 활동 정보로 저장부(220)에 저장한다(S470).The controller 230 stores the content information extracted through the web activity extractor 240 as the web activity information in the storage unit 220 (S470).

따라서, 이후에 사용자가 웹 페이지를 다시 요청할 때, 제어부(230)는 저장부(220)에 저장되어 있는 웹 활동 정보를 표시부(250)를 통해 표시해 줌으로써, 사용자가 이전에 이용했던 웹 활동 정보를 참조할 수 있도록 한다.Therefore, when the user requests the web page again later, the control unit 230 displays the web activity information stored in the storage unit 220 through the display unit 250 to display the web activity information previously used by the user. For reference.

전술한 바와 같이 본 발명에 의하면, 사용자가 컴퓨터 단말기나 휴대 전화 등의 통신 단말기를 통해 웹 서버에서 제공하는 웹 사이트에 접속하여 웹 서비스를 이용할 때, 사용자가 구매한 상품이나 조회했던 동영상 등의 컨텐츠를 사용한 웹 활동 정보를 추출해 저장해 두었다가, 다시 사용자가 통신 단말기로 웹 서버에 접속해 컨텐츠를 이용하고자 할 때 웹 활동 정보를 근거로 이전의 웹 활동 이력을 조회할 수 있도록 하는, 웹 활동 추출 시스템 및 방법을 실현할 수 있다.As described above, according to the present invention, when a user accesses a web site provided by a web server through a communication terminal such as a computer terminal or a mobile phone and uses a web service, content such as a product purchased by the user or a video that has been viewed Web activity extraction system that extracts and stores the web activity information using the web server, and allows the user to search the previous web activity history based on the web activity information when the user wants to access the web server using the communication terminal. The method can be realized.

본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있으므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이 해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.As those skilled in the art to which the present invention pertains may implement the present invention in other specific forms without changing the technical spirit or essential features, the embodiments described above are exemplary in all respects and are not intended to be limiting. You must do it. The scope of the present invention is shown by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the present invention. do.

본 발명은 웹 서버에서 제공하는 웹 서비스를 이용하는 단말기에 적용할 수 있고, 웹 브라우저를 통해 웹 페이지를 디스플레이하는 단말기에 적용할 수 있다.The present invention can be applied to a terminal using a web service provided by a web server, and can be applied to a terminal displaying a web page through a web browser.

또한, 자신이 구매했던 상품을 다시 찾아가거나 자신이 조회했던 동영상을 다시 보고자 하는 웹 서비스 시스템에 적용할 수 있다.In addition, it can be applied to a web service system that wants to revisit the product purchased by the user or to watch the video that the user has viewed again.

그리고, 사용자가 과거에 이용했던 웹 서비스에 대한 이력을 열람할 수 있는 서비스를 제공하는 시스템에도 적용할 수 있다.In addition, the present invention can be applied to a system that provides a service for viewing a history of a web service used by a user in the past.

도 1은 본 발명의 실시예에 따른 웹 활동 추출 시스템의 구성을 개략적으로 나타낸 구성도,1 is a schematic view showing the configuration of a web activity extraction system according to an embodiment of the present invention;

도 2는 본 발명에 따른 사용자 단말기의 내부 구성을 개략적으로 나타낸 구성도,2 is a configuration diagram schematically showing an internal configuration of a user terminal according to the present invention;

도 3은 본 발명의 실시예에 따른 사용자 단말기에서 웹 활동 추출기의 구성을 개략적으로 나타낸 구성도,3 is a block diagram schematically showing the configuration of a web activity extractor in a user terminal according to an embodiment of the present invention;

도 4는 본 발명의 실시예에 따른 웹 활동 추출 방법을 설명하기 위한 흐름도,4 is a flowchart illustrating a web activity extraction method according to an embodiment of the present invention;

도 5는 본 발명의 실시예에 따라 웹 페이지 요청시 변경 IAT를 참조해 마이콜백 함수를 호출하는 과정을 나타낸 도면, 그리고5 is a diagram illustrating a process of calling a callback function with reference to a changed IAT when a web page is requested according to an embodiment of the present invention; and

도 6은 본 발명이 적용된 메시지 분석 모듈에서 이용하는 특정 추출 규칙의 문서 내용의 일 예를 나타낸 도면이다. 6 is a diagram illustrating an example of document contents of a specific extraction rule used in the message analysis module to which the present invention is applied.

< 도면의 주요 부분에 대한 부호의 설명 >Description of the Related Art

110, 112 : 사용자 단말기 120 : 통신망110, 112: user terminal 120: communication network

130 : 웹 서버 210 : 통신부130: web server 210: communication unit

220 : 저장부 230 : 제어부220: storage unit 230: control unit

240 : 웹 활동 추출기 242 : 메시지 캡쳐 모듈240: Web Activity Extractor 242: Message Capture Module

244 : 메시지 분석 모듈 250 : 표시부244: message analysis module 250: display unit

310 : 필터 320 : 후크 DLL 로더310: filter 320: hook DLL loader

322 : 후크 DLL 330 : 웹 브라우저322: Hook DLL 330: Web Browser

Claims (31)

통신망을 통해 웹 페이지를 제공하는 웹 서버; 및A web server for providing a web page through a communication network; And 상기 웹 서버로부터 제공받은 상기 웹 페이지로부터 에이피아이(API) 후킹(Hooking)을 이용하여 에이치티티피(HTTP) 메시지를 캡쳐하고, 상기 에이치티티피(HTTP) 메시지로부터 특정 추출 규칙(extraction rule)에 근거해 컨텐츠 정보를 추출하는 사용자 단말기;를 포함하고, Capture an HTTP message using API hooking from the web page provided from the web server, and extract a HTTP message from the HTTP message to a specific extraction rule. A user terminal for extracting content information based on the content; 상기 에이피아이(API) 후킹은, 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT:Import Address Table)의 에이피아이(API) 번지수를 변경하고, 상기 웹 서버로 웹 페이지를 요청하는 명령에 따라 상기 변경된 에이피아이(API) 번지수의 특정 함수를 호출하며, 상기 특정 함수에 의해 상기 에이치티티피(HTTP) 메시지를 캡쳐하는 것을 특징으로 하는 웹 활동 추출 시스템.The API hooking changes an API address of an import address table (IAT) that stores an address where a function is stored, and requests a web page from the web server. And calling a specific function of the changed API address according to the command, and capturing the HTTP message by the specific function. 삭제delete 제 1 항에 있어서,The method of claim 1, 상기 에이피아이(API)는 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 디엘엘(DLL) 정보는 상기 임포트 어드레스 테이블(IAT)에 존재하는 것을 특징으로 하는 웹 활동 추출 시스템.The API is provided in the form of a DL (DLL) in Windows, the corresponding DL (DLL) information is present in the import address table (IAT). 제 1 항에 있어서,The method of claim 1, 상기 사용자 단말기는, 웹 브라우저가 호출하는 윈속(WinSock) 에이피아이(API)를 후킹하여 상기 에이치티티피(HTTP) 메시지를 캡쳐하는 것을 특징으로 하는 웹 활동 추출 시스템.The user terminal hooks a WinSock API called by a web browser to capture the HTTP message. 제 1 항에 있어서,The method of claim 1, 상기 사용자 단말기는, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 상기 특정 추출 규칙에 근거해 상기 컨텐츠 정보를 추출하는 것을 특징으로 하는 웹 활동 추출 시스템.And the user terminal extracts the content information based on the specific extraction rule defined for each web site and for each type of content information. 제 5 항에 있어서,6. The method of claim 5, 상기 특정 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술되는 것을 특징으로 하는 웹 활동 추출 시스템.The specific extraction rule is described in an XML document, and a plurality of rules are described through one or more rule tags. 제 6 항에 있어서,The method of claim 6, 상기 규칙 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함하는 것을 특징으로 하는 웹 활동 추출 시스템.The rule tag, Web activity extraction system comprising a match rule tag for matching and extracting a specific string. 제 1 항에 있어서,The method of claim 1, 상기 사용자 단말기는 캡쳐한 상기 컨텐츠 정보를 웹 활동 정보로 저장하는 것을 특징으로 하는 웹 활동 추출 시스템.And the user terminal stores the captured content information as web activity information. 웹 페이지를 제공하는 웹 서버와 상기 웹 서버로부터 상기 웹 페이지를 수신하는 사용자 단말기를 포함하는 시스템의 웹 활동 추출 방법에 있어서,In the web activity extraction method of a system comprising a web server for providing a web page and a user terminal for receiving the web page from the web server, (a) 상기 사용자 단말기가 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하는 단계;(a) changing, by the user terminal, the address number of a function of an import address table (IAT) that stores the address number where the function is stored; (b) 상기 사용자 단말기가 상기 웹 페이지를 요청하는 명령에 대응된 상기 변경된 번지수의 특정 함수를 호출하는 단계;(b) invoking, by the user terminal, a specific function of the changed address number corresponding to the command for requesting the web page; (c) 상기 사용자 단말기가 상기 특정 함수를 통해 상기 웹 서버로 상기 웹 페이지를 요청하는 단계;(c) the user terminal requesting the web page to the web server through the specific function; (d) 상기 웹 서버가 상기 웹 페이지를 상기 사용자 단말기에게 제공하는 단계;(d) the web server providing the web page to the user terminal; (e) 상기 사용자 단말기가 상기 웹 페이지로부터 에이치티티피(HTTP) 메시지를 캡쳐하는 단계; 및(e) capturing, by the user terminal, an HTTP message from the web page; And (f) 상기 사용자 단말기가 상기 에이치티티피(HTTP) 메시지로부터 컨텐츠 정보를 추출하는 단계;(f) extracting, by the user terminal, content information from the HTP message; 를 포함하는 웹 활동 추출 방법.Web activity extraction method comprising a. 제 9 항에 있어서,The method of claim 9, 상기 특정 함수는, 에이피아이(API)의 후킹(Hooking)을 이용하여 상기 에이치티티피(HTTP) 메시지를 캡쳐하는 기능을 수행하는 것을 특징으로 하는 웹 활동 추출 방법.The specific function is a web activity extraction method, characterized in that for performing the function of capturing the HTP message using the hooking (API). 제 10 항에 있어서,11. The method of claim 10, 상기 에이피아이(API)는 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 상기 디엘엘(DLL) 정보는 상기 임포트 어드레스 테이블(IAT)에 존재하는 것을 특징으로 하는 웹 활동 추출 방법.The API is provided in the form of a DL (DLL) in Windows, and the DL (DLL) information is present in the import address table (IAT). 제 9 항에 있어서,The method of claim 9, 상기 (e) 단계는, 웹 브라우저가 호출하는 윈속(WinSock) 에이피아이(API)를 후킹하여 상기 에이치티티피(HTTP) 메시지를 캡쳐하는 것을 특징으로 하는 웹 활동 추출 방법.In the step (e), a web activity extraction method comprising capturing the HTTP message by hooking a WinSock API called by a web browser. 제 9 항에 있어서,The method of claim 9, 상기 (f) 단계는, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙(extraction rule)에 근거해 상기 컨텐츠 정보를 추출하는 것을 특징으로 하는 웹 활동 추출 방법.In the step (f), the web activity extraction method comprises extracting the content information based on an extraction rule defined for each web site and for each type of content information. 제 13 항에 있어서,The method of claim 13, 상기 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술되는 것을 특징으로 하는 웹 활동 추출 방법.The extraction rule is described in an XML document, and a plurality of rules are described through one or more rule tags. 제 14 항에 있어서,The method of claim 14, 상기 규칙 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함하 는 것을 특징으로 하는 웹 활동 추출 방법.The rule tag, Web activity extraction method comprising a match rule tag for matching and extracting a specific string. 제 9 항에 있어서,The method of claim 9, (g) 상기 사용자 단말기가 상기 컨텐츠 정보를 웹 활동 정보로 저장하는 단계;(g) storing, by the user terminal, the content information as web activity information; 를 더 포함하는 것을 특징으로 하는 웹 활동 추출 방법.Web activity extraction method characterized in that it further comprises. 웹 페이지를 제공하는 웹 서버와 에이치티티피(HTTP) 메시지를 송수신하는 통신부;A communication unit for transmitting and receiving an HTP message with a web server providing a web page; 상기 에이치티티피(HTTP) 메시지로부터 웹 활동 정보를 추출하기 위해, 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 특정 함수의 번지수로 변경하고, 상기 통신부에서 상기 웹 서버로 상기 에이치티티피(HTTP) 메시지 요청 시 상기 변경된 번지수의 특정 함수를 호출하여 상기 웹 활동 정보의 추출을 제어하는 제어부;In order to extract web activity information from the HTTP message, the address of the function of the import address table IAT, which stores the address where the function is stored, is changed to the address of the specific function, and A control unit for controlling the extraction of the web activity information by calling a specific function of the changed address when the HTTP message is requested from the communication unit to the web server; 상기 호출된 특정 함수에 의해 상기 웹 페이지로부터 상기 에이치티티피(HTTP) 메시지를 캡쳐하고, 상기 에이치티티피(HTTP) 메시지로부터 컨텐츠 정보를 추출하는 웹 활동 추출기; 및A web activity extractor that captures the HTP message from the web page by the called specific function and extracts content information from the HTP message; And 상기 웹 서버에서 수신된 상기 에이치티티피(HTTP) 메시지를 이용하여 상기 웹 페이지를 디스플레이하는 표시부;A display unit which displays the web page using the HTTP message received from the web server; 를 포함하는 사용자 단말기.User terminal comprising a. 제 17 항에 있어서,The method of claim 17, 상기 웹 활동 추출기는, The web activity extractor, 상기 에이치티티피(HTTP) 메시지를 캡쳐하는 메시지 캡쳐 모듈;A message capture module for capturing the HTP message; 상기 에이치티티피(HTTP) 메시지로부터 상기 컨텐츠 정보를 추출하는 메시지 분석 모듈; 및 A message analysis module that extracts the content information from the HTP message; And 상기 에이치티티피(HTTP) 메시지로부터 상기 컨텐츠 정보와 상관없는 데이터를 제거하는 필터;를 포함하는 것을 특징으로 하는 사용자 단말기.And a filter for removing data not related to the content information from the HTP message. 제 17 항에 있어서,The method of claim 17, 상기 웹 활동 추출기는, 상기 웹 브라우저의 생성 시에 상기 에이치티티피(HTTP) 메시지를 캡쳐하는 후크 디엘엘(DLL)을 상기 웹 브라우저 상으로 로딩시키는 것을 특징으로 하는 사용자 단말기.And the web activity extractor loads a hook DL (DLL) onto the web browser to capture the HTTP message upon creation of the web browser. 제 18 항에 있어서,The method of claim 18, 상기 메시지 분석 모듈은, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙(extraction rule)에 근거해 상기 컨텐츠 정보를 추출하는 것을 특징으로 하는 사용자 단말기.The message analysis module extracts the content information based on an extraction rule defined for each web site and for each type of content information. 제 20 항에 있어서,21. The method of claim 20, 상기 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술되는 것을 특징으로 하는 사용자 단말기.The extraction rule is described in an XML document, and a plurality of rules are described through one or more rule tags. 제 21 항에 있어서,22. The method of claim 21, 상기 추출 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함하는 것을 특징으로 하는 사용자 단말기.The extraction tag, the user terminal characterized in that it comprises a match rule tag for matching and extracting a specific string. 제 17 항에 있어서,The method of claim 17, 상기 컨텐츠 정보를 상기 웹 활동 정보로 저장하기 위한 저장부;A storage unit for storing the content information as the web activity information; 를 더 포함하는 것을 특징으로 하는 사용자 단말기.The user terminal further comprises. 웹 페이지를 제공하는 웹 서버로부터 에이치티티피(HTTP) 메시지를 수신하는 사용자 단말기의 웹 활동 추출 방법에 있어서,In the web activity extraction method of a user terminal for receiving an HTTP message from a web server that provides a web page, (a) 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하는 단계;(a) changing the address number of the function in the import address table IAT storing the address number in which the function is stored; (b) 상기 웹 페이지를 요청하는 명령에 대응된 상기 변경된 번지수의 특정 함수를 호출하는 단계;(b) calling a specific function of the changed address number corresponding to the command for requesting the web page; (c) 상기 특정 함수를 통해 상기 웹 서버로 상기 에이치티티피(HTTP) 메시지를 요청하는 단계;(c) requesting the HTP message to the web server through the specific function; (d) 상기 웹 서버로부터 상기 에이치티티피(HTTP) 메시지를 수신하는 단계;(d) receiving the HTP message from the web server; (e) 수신된 상기 에이치티티피(HTTP) 메시지를 캡쳐하는 단계; 및(e) capturing the received HTTP message; And (f) 상기 에이치티티피(HTTP) 메시지로부터 컨텐츠 정보를 추출하는 단계;(f) extracting content information from the HTP message; 를 포함하는 사용자 단말기의 웹 활동 추출 방법.Web activity extraction method of the user terminal comprising a. 제 24 항에 있어서,25. The method of claim 24, 상기 특정 함수는, 에이피아이(API)의 후킹(Hooking)을 이용하여 상기 에이치티티피(HTTP) 메시지를 캡쳐하는 기능을 수행하는 것을 특징으로 하는 사용자 단말기의 웹 활동 추출 방법.The specific function is a web activity extraction method of a user terminal, characterized in that to perform the function of capturing the HTP message using the hooking (API). 제 25 항에 있어서,The method of claim 25, 상기 에이피아이(API)는 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 디엘엘(DLL) 정보는 상기 임포트 어드레스 테이블(IAT)에 존재하는 것을 특징으로 하는 사용자 단말기의 웹 활동 추출 방법.The API is provided in the form of a DL (DLL) in Windows, the corresponding DL (DLL) information is present in the import address table (IAT) characterized in that the web activity extraction method of the user terminal. 제 24 항에 있어서,25. The method of claim 24, 상기 (e) 단계는, 웹 브라우저가 호출하는 윈속(WinSock) 에이피아이(API)를 후킹하여 상기 에이치티티피(HTTP) 메시지를 캡쳐하는 것을 특징으로 하는 사용자 단말기의 웹 활동 추출 방법.In the step (e), the web activity extraction method of the user terminal, characterized in that to hook the WinSock API (API) called by the web browser to capture the HTTP message. 제 24 항에 있어서,25. The method of claim 24, 상기 (f) 단계는, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙(extraction rule)에 근거해 상기 컨텐츠 정보를 추출하는 것을 특징으로 하는 사용자 단말기의 웹 활동 추출 방법.The step (f), the web activity extraction method of the user terminal, characterized in that for extracting the content information based on the extraction rule (extraction rule) defined for each web site, content type. 제 28 항에 있어서,29. The method of claim 28, 상기 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술되는 것을 특징으로 하는 사용자 단말기의 웹 활동 추출 방법.The extraction rule is described in an XML document, and a plurality of rules are described through one or more rule tags. 제 29 항에 있어서,30. The method of claim 29, 상기 규칙 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함하는 것을 특징으로 하는 사용자 단말기의 웹 활동 추출 방법.The rule tag, Web activity extraction method of the user terminal, characterized in that it comprises a match rule tag for matching and extracting a specific string. (a) 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하는 과정;(a) changing the address of the function of the import address table IAT storing the address where the function is stored; (b) 상기 변경된 번지수의 특정 함수를 웹 페이지를 요청하는 명령에 따라 호출하는 과정;(b) calling a specific function of the changed address number according to a command for requesting a web page; (c) 상기 특정 함수에 의해 상기 웹 서버로부터 수신되는 에이치티티피(HTTP) 메시지를 캡쳐하는 과정; 및(c) capturing an HTP message received from the web server by the specific function; And (d) 상기 에이치티티피(HTTP) 메시지로부터 컨텐츠 정보를 추출하는 과정;(d) extracting content information from the HTP message; 을 처리하는 프로그램이 기록된 기록 매체.The recording medium on which a program for processing data is recorded.
KR1020080031633A 2008-04-04 2008-04-04 System and method for extracting a history of web activities KR101164289B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080031633A KR101164289B1 (en) 2008-04-04 2008-04-04 System and method for extracting a history of web activities

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080031633A KR101164289B1 (en) 2008-04-04 2008-04-04 System and method for extracting a history of web activities

Publications (2)

Publication Number Publication Date
KR20090106116A KR20090106116A (en) 2009-10-08
KR101164289B1 true KR101164289B1 (en) 2012-07-09

Family

ID=41535767

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080031633A KR101164289B1 (en) 2008-04-04 2008-04-04 System and method for extracting a history of web activities

Country Status (1)

Country Link
KR (1) KR101164289B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101396781B1 (en) 2013-01-08 2014-05-20 주식회사 한올테크놀로지 The device which manages a application program and managing method for the same

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101235139B1 (en) * 2012-05-29 2013-02-20 주식회사 비바엔에스 Detection method and system, the internal structure website

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101396781B1 (en) 2013-01-08 2014-05-20 주식회사 한올테크놀로지 The device which manages a application program and managing method for the same
WO2014109487A1 (en) * 2013-01-08 2014-07-17 주식회사 한올테크놀로지 Apparatus for managing application program and method therefor
CN104919415A (en) * 2013-01-08 2015-09-16 韩奥科技有限公司 Apparatus for managing application program and method therefor

Also Published As

Publication number Publication date
KR20090106116A (en) 2009-10-08

Similar Documents

Publication Publication Date Title
CN106294648B (en) Processing method and device for page access path
US8645453B2 (en) Method and system of processing cookies across domains
US8407363B2 (en) Generating low resolution user interfaces for transmission to mobile devices
CN110096660B (en) Method and device for loading page pictures and electronic equipment
CN102646135B (en) Webpage collecting method, device and system
US7840650B2 (en) Sharing of digital media on a network
US7987243B2 (en) Method for media discovery
US8959434B2 (en) Add-in program for upload, auxiliary program for upload and upload method
CN107291759B (en) Method and device for processing browser page resources
US8676880B2 (en) Server apparatus, communication apparatus, and method for generating navigation information
WO2016107465A1 (en) Method, device, and system for implementing card-type desktop
CN109684571B (en) Data acquisition method and device and storage medium
JP2014219974A (en) Method and device for acquiring partial contents of web page
CN103810176A (en) Pre-fetching accessing method and device of webpage information
CN103246699A (en) Method and device for data access control based on browser
CN111177623A (en) Information processing method and device
JP2008502038A (en) Save multiple browser instances as one selectable web project
JP5112401B2 (en) Web action history acquisition system, Web action history acquisition method, gateway device, and program
CN110825600B (en) Page information processing method, server and page display device
CN107341234B (en) Page display method and device and computer readable storage medium
KR101164289B1 (en) System and method for extracting a history of web activities
KR101282975B1 (en) A webpage crop server system of reconstructing a web page from tree structure of document elements
KR20120137629A (en) System for providing shorten url browsing with branding , method thereof, and web client thereof
CN112307386A (en) Information monitoring method, system, electronic device and computer readable storage medium
KR101692482B1 (en) Advertising Method of Mobile Device, the Mobile Device and Program Distributing Server therefor

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150622

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 8