KR101164289B1 - System and method for extracting a history of web activities - Google Patents
System and method for extracting a history of web activities Download PDFInfo
- Publication number
- KR101164289B1 KR101164289B1 KR1020080031633A KR20080031633A KR101164289B1 KR 101164289 B1 KR101164289 B1 KR 101164289B1 KR 1020080031633 A KR1020080031633 A KR 1020080031633A KR 20080031633 A KR20080031633 A KR 20080031633A KR 101164289 B1 KR101164289 B1 KR 101164289B1
- Authority
- KR
- South Korea
- Prior art keywords
- web
- message
- user terminal
- function
- extraction
- Prior art date
Links
- 230000000694 effects Effects 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 title claims description 41
- 238000000605 extraction Methods 0.000 claims abstract description 67
- 238000004891 communication Methods 0.000 claims abstract description 33
- 239000000284 extract Substances 0.000 claims abstract description 22
- 238000004458 analytical method Methods 0.000 claims description 23
- 230000008676 import Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 59
- 238000010586 diagram Methods 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000010295 mobile communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/219—Managing data history or versioning
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
Abstract
본 발명은 사용자가 컴퓨터 단말기나 휴대 전화 등의 통신 단말기를 통해 웹 서버에서 제공하는 웹 서비스를 이용할 때, 사용자가 구매한 상품이나 조회했던 동영상 등의 컨텐츠를 사용한 웹 활동 정보를 추출해 저장해 두었다가, 다시 사용자가 통신 단말기로 웹 서버에 접속해 컨텐츠를 이용하고자 할 때 웹 활동 정보를 근거로 이전의 웹 활동 이력을 조회할 수 있도록 하는, 웹 활동 추출 방법 및 시스템에 관한 것으로서,According to the present invention, when a user uses a web service provided by a web server through a communication terminal such as a computer terminal or a mobile phone, the user extracts and stores web activity information using content such as a product purchased or a video viewed, and then stores the web activity information again. The present invention relates to a web activity extraction method and system that enables a user to access a web server through a communication terminal and use a content to inquire a previous web activity history based on web activity information.
본 발명에 따른 웹 활동 추출 시스템은, 통신망을 통해 웹 페이지를 제공하는 웹 서버; 및 상기 웹 서버로부터 제공받은 상기 웹 페이지부터 API 후킹을 이용하여 HTTP 메시지를 캡쳐하고, 상기 HTTP 메시지로부터 특정 추출 규칙에 근거해 컨텐츠 정보를 추출하는 사용자 단말기를 포함하고,Web activity extraction system according to the present invention, a web server for providing a web page via a communication network; And a user terminal which captures an HTTP message using API hooking from the web page provided from the web server, and extracts content information from the HTTP message based on a specific extraction rule.
본 발명에 의하면, 사용자 단말기에서 추출한 웹 활동 정보를 근거로 자신이 과거에 조회한 컨텐츠를 다시 열람할 수 있다. 또한, 웹 활동 정보를 기준으로 특정 컨텐츠를 용이하게 검색할 수 있다. 또한, 웹 페이지 요청시 컨텐츠의 URL 정보가 기록되어 있는 해당 컨텐츠를 포함하고 있는 웹 페이지를 바로 제공받을 수 있다. 그리고, 구체적인 컨텐츠에 대한 정보를 자동으로 기록하여 사용자가 편리한 방식으로 조회한 컨텐츠를 용이하게 관리할 수 있다.According to the present invention, it is possible to re-view the content that has been viewed in the past based on the web activity information extracted from the user terminal. In addition, specific content can be easily searched based on web activity information. In addition, when a web page is requested, a web page including the corresponding content in which the URL information of the content is recorded may be directly provided. In addition, by automatically recording information about the specific content, the user can easily manage the content in a convenient way.
웹 페이지, 캡쳐, 컨텐츠 정보, HTTP, 웹 활동, 추출, DLL, API, IAT Web Page, Capture, Content Info, HTTP, Web Activity, Extract, DLL, API, IAT
Description
본 발명은 웹 활동 추출 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 사용자가 컴퓨터 단말기나 휴대 전화 등의 통신 단말기를 통해 웹 서버에서 제공하는 웹 사이트에 접속하여 웹 서비스를 이용할 때, 사용자가 구매한 상품이나 조회했던 동영상 등의 컨텐츠를 사용한 웹 활동 정보를 추출해 저장해 두었다가, 다시 사용자가 통신 단말기로 웹 서버에 접속해 컨텐츠를 이용하고자 할 때 웹 활동 정보를 근거로 이전의 웹 활동 이력을 조회할 수 있도록 하는, 웹 활동 추출 시스템 및 방법에 관한 것이다.The present invention relates to a web activity extraction system and method, and more particularly, when a user accesses a web site provided by a web server and uses a web service through a communication terminal such as a computer terminal or a mobile phone, After extracting and storing web activity information using contents such as products or videos that have been viewed, the user can view previous web activity history based on the web activity information when the user wants to access the web server using a communication terminal. To a web activity extraction system and method.
최근에, 컴퓨터 단말기 또는 휴대 전화 단말기를 이용한 웹 페이지의 사용이 증가하면서, 웹 활동을 추출하는 기술이 등장하고 있다.In recent years, as the use of web pages using a computer terminal or a mobile phone terminal increases, a technique for extracting web activity has emerged.
웹 활동은 사용자가 웹 사이트에 접속하여 상품을 구매하거나, 음악이나 동영상 등의 컨텐츠를 조회하거나 이용하는 동작을 포함한다.Web activity includes an operation in which a user accesses a web site, purchases a product, or views or uses content such as music or a video.
이러한 웹 활동을 추출하는 종래 기술은 웹 페이지 이용자의 이용 행태를 분석하거나 웹 페이지에 접속한 사용자의 웹 로그 파일을 분석하는 것을 들 수 있다.Conventional techniques for extracting such web activities include analyzing the usage behavior of web page users or analyzing web log files of users accessing web pages.
여기서 이용자의 이용 행태를 분석하는 방법으로 클릭스트림 기반 분석을 사용하고 있다. 클릭스트림 기반 분석 방법은 웹 페이지 이용자가 클릭한 웹 컨텐츠에 대하여 분석하는 방법으로, 이러한 분석 방법은 한 화면 이상으로 구성된 웹 컨텐츠의 경우 얼마나 노출되었는지 여부를 판단할 수 없다.Here, clickstream based analysis is used as a method of analyzing user usage behavior. The clickstream based analysis method is a method of analyzing web content clicked by a web page user, and such an analysis method cannot determine how exposed the web content is composed of more than one screen.
또한, 클릭스트림 분석의 경우 로그에 저장된 제한된 정보만을 이용하여 분석하므로 웹 컨텐츠를 다운로드하는데 소요되는 시간 및 이용자가 클릭하였지만 다른 행동으로 인하여 해당 컨텐츠를 제대로 보지 않고 지나가는 비활동 시간, 해당 컨텐츠에 대한 관심도 등에 따라 마우스 이동량 및 화면 이동량 등의 다양한 이용 행태 정보를 배제하고 일괄적으로 분석하고 있는 상태에 머물고 있다.In addition, in case of clickstream analysis, it analyzes using only limited information stored in the log, so the time required to download web content and inactivity time passed by users without clicking properly due to other actions and interest in the content For example, various usage behavior information such as mouse movement amount and screen movement amount are excluded and remain in a state of analysis.
한편, 웹 로그 분석은 웹 서버가 서비스를 제공하면서 생성하는 로그 파일(log file)을 분석하여 웹 서버의 트래픽(traffic) 및 에러 상태, 그리고 방문 경로 등 기본적인 분석을 수행하여 웹 서버의 시스템 문제와 기본적인 웹 사이트 사용량에 대하여 분석하는 것이다.On the other hand, web log analysis analyzes the log files generated by the web server while providing services, and performs basic analysis such as traffic and error status, and visit path of the web server, Analyze basic Web site usage.
이러한 웹 로그 분석을 위해서는 별도의 응용 프로그램 즉, HTML 코드의 화면 렌더링을 위해 응용 프로그램이 분석대상 웹 사이트와 통신하여 HTML 페이지를 수신한 후에 응용 프로그램을 클라이언트 단말기에 설치해야 하거나, 클라이언트 단말기의 웹 브라우저에서 사용할 플러그인을 설치해야 하는 불편함이 있었다.For this web log analysis, the application must be installed on the client terminal after receiving the HTML page by communicating with the web site to analyze the separate application, that is, rendering the HTML code. I had to install a plug-in for use.
따라서, 종래의 웹 활동 추출 방법은 웹 활동에 대해 기술적으로 분석하는 수준에 머물고 있으므로, 사용자가 웹 서비스를 이용할 때 웹 활동 정보를 저장해 두었다가, 이후에 접속해서 다시 웹 서비스를 이용할 때 이전의 웹 활동 정보를 활용할 수 있는 방안이 요구되고 있다.Therefore, the conventional method of extracting web activity remains at the level of technically analyzing the web activity. Therefore, when the user uses the web service, the web activity information is stored, and when the user accesses the web service again, the previous web activity is stored. There is a demand for ways to utilize information.
전술한 문제점을 해결하기 위해 본 발명은, 사용자가 컴퓨터 단말기나 휴대 전화 등의 통신 단말기를 통해 웹 서버에서 제공하는 웹 서비스를 이용할 때, 사용자가 구매한 상품이나 조회했던 동영상 등의 컨텐츠를 사용한 웹 활동 정보를 추출해 저장해 두었다가, 다시 사용자가 통신 단말기로 웹 서버에 접속해 컨텐츠를 이용하고자 할 때 웹 활동 정보를 근거로 이전의 웹 활동 이력을 조회할 수 있도록 하는, 웹 활동 추출 시스템 및 방법을 제공함에 그 목적이 있다.In order to solve the above-described problems, the present invention, when a user uses a web service provided by a web server through a communication terminal such as a computer terminal or a mobile phone, the web using the content, such as the product purchased by the user or the video that was viewed Provides a web activity extraction system and method that extracts and stores activity information, and allows the user to retrieve previous web activity history based on the web activity information when the user wants to access the web server with the communication terminal and use the content. Has its purpose.
전술한 목적을 달성하기 위한 본 발명에 따른 웹 활동 추출 시스템은, 통신망을 통해 웹 페이지를 제공하는 웹 서버; 및 상기 웹 서버로부터 제공받은 상기 웹 페이지부터 API 후킹을 이용하여 HTTP 메시지를 캡쳐하고, 상기 HTTP 메시지로부터 특정 추출 규칙에 근거해 컨텐츠 정보를 추출하는 사용자 단말기를 포함한다.Web activity extraction system according to the present invention for achieving the above object, a web server for providing a web page through a communication network; And a user terminal for capturing an HTTP message using API hooking from the web page provided from the web server and extracting content information based on a specific extraction rule from the HTTP message.
또한, 상기 사용자 단말기에서 상기 API 후킹은, 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하고, 상기 웹 서버로 웹 페이지를 요청하는 명령에 따라 상기 변경된 번지수의 특정 함수를 호출하며, 상기 특정 함수에 의해 상기 HTTP 메시지를 캡쳐하게 된다.In addition, the API hooking in the user terminal changes the address of the function of the import address table (IAT) that stores the address where the function is stored, and according to the command to request a web page to the web server. Call a specific function of the changed address, and capture the HTTP message by the specific function.
또한, 상기 API는 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 디엘엘(DLL) 정보는 상기 피이(PE) 파일의 임포트 어드레스 테이블(IAT)에 존재하게 된 다.In addition, the API is provided in the form of DL (DLL) in Windows, the corresponding DL (DLL) information is present in the import address table (IAT) of the PE file.
또한, 상기 사용자 단말기는, 웹 브라우저가 호출하는 윈속(WinSock) 에이피아이(API)를 후킹하여 상기 HTTP 메시지를 캡쳐하게 된다.In addition, the user terminal hooks a WinSock API called by a web browser to capture the HTTP message.
또한, 상기 사용자 단말기는, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 상기 특정 추출 규칙에 근거해 상기 컨텐츠 정보를 추출하게 된다.In addition, the user terminal extracts the content information based on the specific extraction rule defined for each web site and content type.
이때, 상기 특정 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다. 여기서, 상기 규칙 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함한다.In this case, the specific extraction rule is described as an XML document, and a plurality of rules are described through one or more rule tags. Here, the rule tag includes a match rule tag for matching and extracting a specific string.
그리고, 상기 사용자 단말기는 캡쳐한 상기 컨텐츠 정보를 웹 활동 정보로 저장하게 된다.The user terminal stores the captured content information as web activity information.
한편, 전술한 목적을 달성하기 위한 본 발명에 따른 웹 활동 추출 방법은, 웹 페이지를 제공하는 웹 서버와 상기 웹 서버로부터 상기 웹 페이지를 수신하는 클라이언트 단말기를 포함하는 시스템의 웹 활동 추출 방법에 있어서, (a) 상기 클라이언트 단말기가 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하는 단계; (b) 상기 클라이언트 단말기가 상기 웹 페이지를 요청하는 명령에 대응된 상기 변경된 번지수의 특정 함수를 호출하는 단계; (c) 상기 클라이언트 단말기가 상기 특정 함수를 통해 상기 웹 서버로 상기 웹 페이지를 요청하는 단계; (d) 상기 웹 서버가 상기 웹 페이지를 상기 클라이언트 단말기에게 제공하는 단계; (e) 상기 클라이언트 단말기가 상기 웹 페이지로 부터 HTTP 메시지를 캡쳐하는 단계; 및 (f) 상기 클라이언트 단말기가 상기 HTTP 메시지로부터 컨텐츠 정보를 추출하는 단계를 포함한다.On the other hand, the web activity extraction method according to the present invention for achieving the above object, in the web activity extraction method of the system comprising a web server for providing a web page and a client terminal for receiving the web page from the web server (a) changing, by the client terminal, the address number of a function of an import address table (IAT) that stores the address number at which the function is stored; (b) calling, by the client terminal, a specific function of the changed address number corresponding to the command for requesting the web page; (c) the client terminal requesting the web page to the web server through the specific function; (d) the web server providing the web page to the client terminal; (e) the client terminal capturing an HTTP message from the web page; And (f) the client terminal extracting content information from the HTTP message.
또한, 상기 특정 함수는, 상기 에이피아이(API)의 후킹(Hooking)을 이용하여 상기 HTTP 메시지를 캡쳐하는 기능을 수행하게 된다.In addition, the specific function performs a function of capturing the HTTP message by using hooking of the API.
또한, 상기 에이피아이(API)는 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 디엘엘(DLL) 정보는 상기 임포트 어드레스 테이블(IAT)에 존재하게 된다.In addition, the API is provided in the form of a DL (DLL) in Windows, the corresponding DL (DLL) information is present in the import address table (IAT).
또한, 상기 (e) 단계는, 웹 브라우저가 호출하는 윈속(WinSock) 에이피아이(API)를 후킹하여 상기 HTTP 메시지를 캡쳐하게 된다.Also, in the step (e), the HTTP message is captured by hooking a WinSock API called by a web browser.
또한, 상기 (f) 단계는, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 상기 컨텐츠 정보를 추출하게 된다.In the step (f), the content information is extracted based on an extraction rule defined for each web site and for each type of content information.
또한, 상기 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다.In addition, the extraction rule is described in an XML document, and a plurality of rules are described through one or more rule tags.
또한, 상기 규칙 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함한다.The rule tag may also include a match rule tag that matches and extracts a specific string.
그리고, (g) 상기 클라이언트 단말기가 상기 컨텐츠 정보를 웹 활동 정보로 저장하는 단계를 더 포함한다.And (g) storing, by the client terminal, the content information as web activity information.
한편, 전술한 목적을 달성하기 위한 본 발명에 따른 클라이언트 단말기는, 웹 페이지를 제공하는 웹 서버와 HTTP 메시지를 송수신하는 통신부; 상기 HTTP 메시지로부터 웹 활동 정보를 추출하기 위해, 함수가 저장되어 있는 번지수를 저장하 고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 특정 함수의 번지수로 변경하고, 상기 통신부에서 상기 웹 서버로 상기 HTTP 메시지를 요청 시 상기 변경된 번지수의 특정 함수를 호출하여 상기 웹 활동 정보의 추출을 제어하는 제어부; 상기 호출된 특정 함수에 의해 상기 웹 페이지로부터 상기 HTTP 메시지를 캡쳐하고, 상기 HTTP 메시지로부터 컨텐츠 정보를 추출하는 웹 활동 추출기; 및 상기 웹 서버에서 수신된 상기 HTTP 메시지를 이용하여 상기 웹 페이지를 디스플레이하는 표시부를 포함한다.On the other hand, the client terminal according to the present invention for achieving the above object, Communication unit for transmitting and receiving an HTTP message with a web server for providing a web page; In order to extract the web activity information from the HTTP message, the address of the function of the import address table (IAT), which stores the address where the function is stored, is changed to the address of a specific function, and the web is transmitted to the communication unit. A control unit which controls the extraction of the web activity information by calling a specific function of the changed address when requesting the HTTP message to a server; A web activity extractor for capturing the HTTP message from the web page by the called specific function and extracting content information from the HTTP message; And a display unit for displaying the web page using the HTTP message received from the web server.
또한, 상기 웹 활동 추출기는, 상기 HTTP 메시지를 캡쳐하는 메시지 캡쳐 모듈과, 상기 HTTP 메시지로부터 상기 컨텐츠 정보를 추출하는 메시지 분석 모듈 및 상기 HTTP 메시지로부터 상기 컨텐츠 정보와 상관없는 데이터를 제거하는 필터를 포함한다.The web activity extractor may include a message capture module for capturing the HTTP message, a message analysis module for extracting the content information from the HTTP message, and a filter for removing data not related to the content information from the HTTP message. do.
또한, 상기 웹 활동 추출기는, 상기 웹 브라우저의 생성 시에 상기 HTTP 메시지를 캡쳐하는 후크 DLL을 상기 웹 브라우저 상으로 로딩시키게 된다.The web activity extractor also loads a hook DLL on the web browser that captures the HTTP message upon creation of the web browser.
또한, 상기 메시지 분석 모듈은, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 상기 컨텐츠 정보를 추출하게 된다.The message analysis module extracts the content information based on an extraction rule defined for each web site and for each type of content information.
또한, 상기 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규칙 태그를 통해 다수의 규칙이 기술되고, 상기 추출 태그는 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함한다.In addition, the extraction rule is described in an XML document, a plurality of rules are described through one or more rule tags, and the extraction tag includes a match rule tag that matches and extracts a specific string.
그리고, 상기 컨텐츠 정보를 상기 웹 활동 정보로 저장하기 위한 저장부를 더 포함한다.The apparatus may further include a storage unit for storing the content information as the web activity information.
한편, 전술한 목적을 달성하기 위한 본 발명에 따른 클라이언트 단말기의 웹 활동 추출 방법은, 웹 페이지를 제공하는 웹 서버로부터 상기 웹 페이지를 수신하는 클라이언트 단말기의 웹 활동 추출 방법에 있어서, 웹 페이지를 제공하는 웹 서버로부터 HTTP 메시지를 수신하는 클라이언트 단말기의 웹 활동 추출 방법에 있어서, (a) 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하는 단계; (b) 상기 웹 페이지를 요청하는 명령에 대응된 상기 변경된 번지수의 특정 함수를 호출하는 단계; (c) 상기 특정 함수를 통해 상기 웹 서버로 상기 HTTP 메시지를 요청하는 단계; (d) 상기 웹 서버로부터 상기 HTTP 메시지를 수신하는 단계; (e) 수신된 상기 HTTP 메시지를 캡쳐하는 단계; 및 (f) 상기 HTTP 메시지로부터 컨텐츠 정보를 추출하는 단계를 포함한다.On the other hand, the web activity extraction method of the client terminal according to the present invention for achieving the above object, in the web activity extraction method of the client terminal receiving the web page from a web server for providing a web page, provides a web page A method of extracting a web activity of a client terminal receiving an HTTP message from a web server, the method comprising: (a) changing a number of functions of an import address table (IAT) that stores a number of stored addresses; (b) calling a specific function of the changed address number corresponding to the command for requesting the web page; (c) requesting the HTTP message to the web server through the specific function; (d) receiving the HTTP message from the web server; (e) capturing the received HTTP message; And (f) extracting content information from the HTTP message.
또한, 상기 특정 함수는, 에이피아이(API)의 후킹을 이용하여 상기 HTTP 메시지를 캡쳐하는 기능을 수행하게 된다.In addition, the specific function performs a function of capturing the HTTP message using hooking of an API.
또한, 상기 에이피아이(API)는 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 디엘엘(DLL) 정보는 상기 임포트 어드레스 테이블(IAT)에 존재한다.In addition, the API is provided in the form of a DL (DLL) in Windows, the corresponding DL (DLL) information is present in the import address table (IAT).
또한, 상기 (e) 단계는, 웹 브라우저가 호출하는 윈속(WinSock) 에이피아이(API)를 후킹하여 상기 HTTP 메시지를 캡쳐하게 된다.Also, in the step (e), the HTTP message is captured by hooking a WinSock API called by a web browser.
또한, 상기 (f) 단계는, 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 상기 컨텐츠 정보를 추출하게 된다.In the step (f), the content information is extracted based on an extraction rule defined for each web site and for each type of content information.
또한, 상기 추출 규칙은 엑스엠엘(XML) 문서로 기술되고, 한 개 이상의 규 칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다.In addition, the extraction rule is described in an XML document, and a plurality of rules are described through one or more rule tags.
그리고, 상기 규칙 태그는, 특정 문자열을 매칭하여 추출하는 매치 룰 태그를 포함한다.The rule tag includes a match rule tag for matching and extracting a specific string.
한편, 전술한 목적을 달성하기 위한 본 발명에 따른 프로그램이 기록된 기록 매체는, (a) 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 변경하는 과정; (b) 상기 변경된 번지수의 특정 함수를 웹 페이지를 요청하는 명령에 따라 호출하는 과정; (c) 상기 특정 함수에 의해 상기 웹 서버로부터 수신되는 상기 HTTP 메시지를 캡쳐하는 과정; 및 (d) 상기 HTTP 메시지로부터 컨텐츠 정보를 추출하는 과정을 처리하는 프로그램이 기록되어 있다.On the other hand, in the recording medium in which the program according to the present invention for achieving the above object is recorded, (a) the process of changing the address of the function of the import address table (IAT) that stores the address where the function is stored ; (b) calling a specific function of the changed address number according to a command for requesting a web page; (c) capturing the HTTP message received from the web server by the specific function; And (d) a program for processing a process of extracting content information from the HTTP message.
본 발명에 의하면, 사용자 단말기에서 추출한 웹 활동 정보를 근거로 자신이 과거에 조회한 컨텐츠를 다시 열람할 수 있다. 또한, 웹 활동 정보를 기준으로 특정 컨텐츠를 용이하게 검색할 수 있다. 또한, 웹 페이지 요청시 컨텐츠의 URL 정보가 기록되어 있는 해당 컨텐츠를 포함하고 있는 웹 페이지를 바로 제공받을 수 있다. 그리고, 구체적인 컨텐츠에 대한 정보를 자동으로 기록하여 사용자가 편리한 방식으로 조회한 컨텐츠를 용이하게 관리할 수 있다.According to the present invention, it is possible to re-view the content that has been viewed in the past based on the web activity information extracted from the user terminal. In addition, specific content can be easily searched based on web activity information. In addition, when a web page is requested, a web page including the corresponding content in which the URL information of the content is recorded may be directly provided. In addition, by automatically recording information about the specific content, the user can easily manage the content in a convenient way.
본 발명의 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Reference will now be made in detail to the preferred embodiments of the present invention, examples of which are illustrated in the accompanying drawings, wherein like reference numerals refer to the like elements throughout. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 실시예에 따른 웹 활동 추출 시스템의 구성을 개략적으로 나타낸 구성도이다.1 is a block diagram schematically showing the configuration of a web activity extraction system according to an embodiment of the present invention.
도 1을 참조하면, 본 발명에 따른 웹 활동 추출 시스템(100)은, 사용자 단말기(110, 112), 통신망(120), 웹 서버(130)를 포함한다.Referring to FIG. 1, the web activity extraction system 100 according to the present invention includes
여기서, 사용자 단말기(110, 112)는 이동 통신망과 인터넷을 경유해 웹 서버(130)로부터 웹 페이지를 수신하는 이동통신 단말기나, 인터넷을 통해 웹 서버(130)로부터 웹 페이지를 수신하는 컴퓨터 등의 유선 단말기를 포함한다.Here, the
사용자 단말기(110, 112)는 웹 서버(130)로부터 제공받은 웹 페이지에서 HTTP(HyperText Transfer Protocol) 메시지를 캡쳐하고, HTTP 메시지로부터 컨텐츠 정보를 추출하게 된다.The
사용자 단말기(110, 112)는 HTTP 메시지를 캡쳐할 때, 피이(Portable Execution) 파일의 임포트 어드레스 테이블(Import Address Table, 이하 IAT) 변경을 통한 API(Application Program Interface) 후킹(Hooking) 기능을 이용하여 HTTP 메시지를 캡쳐하게 된다. When capturing HTTP messages, the
IAT는 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이 블(Import Address Table)이다. 원래 IAT에는 시스템에서 기본적으로 이용하는 API가 저장되어 있는 번지수가 저장되어 있으나, 본 발명에서는 API 대신에 마이콜백(My Callback) 함수를 정의하고, API의 번지수를 마이콜백 함수의 번지수로 변경하는 것이다. 여기서, 마이콜백 함수는 HTTP 메시지를 캡쳐하는 기능을 가진다. IAT is an Import Address Table that stores the address where the function is stored. Originally, the IAT stores the address where the API is basically used in the system. However, in the present invention, the My Callback function is defined instead of the API, and the address of the API is changed to the address of the My Callback function. will be. Here, the callback function has a function of capturing an HTTP message.
따라서, 사용자 단말기(110, 112)가 웹 서버(130)로부터 웹 페이지를 수신하기 위한 함수를 호출할 때, IAT에 근거해 이전의 API 대신에 마이콜백 함수를 호출하고, 마이콜백 함수를 통해 HTTP 메시지를 캡쳐하게 되는 것이다. 이러한 기능을 본 발명의 실시예에서는 'API 후킹 기능'이라 칭한다.Therefore, when the
PE 파일은 윈도우즈에서 실행 가능한 파일이 실행되기 위해 운영체제에서 필요한 모든 정보를 담고 있는 자료구조이고, 웹 브라우저를 통해 웹 서버(130)로부터 웹 페이지를 가져오기 위한 일반 API 함수를 포함하고 있다.The PE file is a data structure that contains all the information needed by the operating system in order to execute an executable file on Windows, and contains a general API function for getting a web page from the
API는 응용 프로그램 인터페이스로서, 윈도우즈에서 디엘엘(DLL) 형태로 제공되며, 해당 DLL 정보는 PE 파일의 IAT 테이블에 존재하게 된다. API는 응용 프로그램에서 사용할 수 있도록 운영 체제나 프로그래밍 언어가 제공하는 기능을 제어할 수 있도록 만든 인터페이스를 뜻한다. 주로 파일 제어, 윈도우 제어, 화상 처리, 문자 제어 등을 위한 인터페이스가 제공된다.API is an application program interface. It is provided in the form of DL (DLL) in Windows, and the DLL information is present in the IAT table of the PE file. An API is an interface that allows an application to control the functionality provided by an operating system or programming language for use in an application. Mainly provided are interfaces for file control, window control, image processing, character control, and the like.
즉, API는 운영체계나 다른 응용프로그램에게 처리 요구를 할 수 있도록 컴퓨터 운영 체계나 다른 응용프로그램에 의해 미리 정해진 특별한 메쏘드(Method)이다. 따라서, API는 운영체계나 프로그램의 인터페이스로서 사용자와 직접적으로 대하게 되는 그래픽 사용자 인터페이스나 명령형 인터페이스와는 뚜렷한 차이가 있 다. 또한, API는 응용프로그램이 운영체계나 데이터베이스 관리시스템과 같은 시스템 프로그램과 통신할 때 사용되는 언어나 메시지 형식을 말한다. API는 프로그램 내에서 실행을 위해 특정 서브루틴에 연결을 제공하는 함수를 호출함으로써 구현된다. 그러므로 하나의 API는 함수 호출에 의해 요청되는 작업을 수행하기 위해 이미 존재하거나 또는 연결되어야 하는 몇 개의 프로그램 모듈이나 루틴을 가진다.In other words, an API is a special method predetermined by a computer operating system or another application to make a processing request to an operating system or another application. Thus, the API is distinct from the graphical user interface or the command-line interface, which directly interacts with the user as the operating system or program interface. In addition, an API is a language or message format used when an application program communicates with a system program such as an operating system or a database management system. An API is implemented by calling a function that provides a link to a specific subroutine for execution within a program. Thus, an API has several program modules or routines that must already exist or be linked to perform the work requested by the function call.
사용자 단말기(110, 112)는 웹 브라우저가 호출하는 윈속(WinSock)에 API를 후킹하여 HTTP 메시지를 캡쳐하게 된다.The
또한, 사용자 단말기(110, 112)는 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 컨텐츠 정보를 추출하게 된다. In addition, the
그리고, 사용자 단말기(110, 112)는 캡쳐한 컨텐츠 정보를 웹 활동 정보로 저장하게 된다.The
통신망(120)은 유선 통신을 위한 인터넷 망이나 무선 통신을 위한 이동 통신망을 포함한다.The
여기서, 통신망(120)이 인터넷 망일 경우에 사용자 단말기(110)는 컴퓨터 단말기일 수 있다.Here, when the
또한, 통신망(120)이 이동 통신망일 경우에, 사용자 단말기(112)는 PDA(Personal Digital Assistant), 셀룰러폰, PCS(Personal Communication Service)폰, GSM(Global System for Mobile)폰, W-CDMA(Wideband CDMA)폰, CDMA-2000폰, MBS(Mobile Broadband System)폰 등을 포함한다. In addition, when the
또한, 통신망(120)이 이동 통신망일 경우에, 본 발명은 코드분할 다중접 속(CDMA:Code Division Multiple Access), 광대역 코드분할 다중접속(WCDMA:Wideband Code Division Multiple Access), 고속 데이터 패킷 접속(HSDPA:High Speed Data Packet Access), 와이브로(Wibro) 등의 네트워크에 적용할 수 있다. In addition, when the
웹 서버(130)는 통신망(120)을 통해 사용자 단말기(110, 112)로 웹 서비스를 제공한다. 여기서, 웹 서비스는 사용자 단말기(110, 112)에게 웹 페이지를 비롯하여 음악 파일이나 동영상을 제공하거나, 사용자 단말기(110, 112)가 웹 서버(130)로 데이터 읽기나 쓰기를 수행하도록 하는 서비스를 포함한다. 본 발명의 실시예에서는 설명의 편의를 위해 웹 서버(130)가 사용자 단말기(110, 112)에게 웹 페이지를 제공하는 것으로 설명한다.The
도 2는 본 발명에 따른 사용자 단말기의 내부 구성을 개략적으로 나타낸 구성도이다.2 is a configuration diagram schematically showing an internal configuration of a user terminal according to the present invention.
도 2를 참조하면, 본 발명에 따른 사용자 단말기(110, 112)는 통신부(210), 저장부(220), 제어부(230), 웹 활동 추출기(240) 및 표시부(250)를 포함한다.Referring to FIG. 2, the
위 구성에서, 각 통신부(210)와 저장부(220), 제어부(230), 웹 활동 추출기(240) 및 표시부(250)는 버스(Bus)로 연결될 수 있다.In the above configuration, each
여기서, 웹 활동 추출기(240)는 메시지 캡쳐모듈(240)과 메시지 분석모듈(250)을 포함한다.Here, the
통신부(210)는 통신망(120) 통해 웹 서버(130)와 통신하여, 웹 서버(130)로 부터 제공된 웹 페이지를 수신한다. 즉, 통신부(210)는 웹 페이지를 제공하는 웹 서버와 HTTP 메시지를 송수신한다.The
저장부(220)는 통신부(210)를 통해 수신한 데이터를 저장하기 위한 데이터 메모리를 포함한다. 또한, 저장부(220)는 일부 저장 영역을 통해 버퍼(Buffer) 역할을 한다. 또한, 저장부(220)는 메시지 캡쳐모듈(240)에 의해 캡쳐된 HTTP 메시지를 저장하고, 단말기가 위치한 위치 정보 및 시스템 사양 정보를 저장하고 있다.The
그리고, 저장부(220)는 HTTP 메시지로부터 추출된 컨텐츠 정보를 웹 활동 정보로 저장한다.The
제어부(230)는 웹 서버(130)로부터 제공되는 웹 페이지에서 HTTP 메시지를 캡쳐하고, HTTP 메시지로부터 컨텐츠 정보를 추출하여 웹 활동 정보로 저장하는 동작을 제어한다. 즉, 제어부(230)는 HTTP 메시지로부터 웹 활동 정보를 추출하기 위해, 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 함수의 번지수를 특정 함수의 번지수로 변경하고, 통신부(210)에서 웹 서버(130)로 HTTP 메시지를 요청 시 변경된 번지수의 특정 함수를 호출하여 웹 활동 정보의 추출을 제어한다.The
웹 활동 추출기(240)는 호출된 특정 함수에 의해 웹 페이지에서 HTTP 메시지를 캡쳐하고, HTTP 메시지로부터 컨텐츠 정보를 추출하는 기능을 한다. The
이때, 웹 활동 추출기(240)는 HTTP 메시지를 캡쳐하는 메시지 캡쳐 모듈(242)과, HTTP 메시지로부터 컨텐츠 정보를 추출하는 메시지 분석 모듈(244)을 포함한다.In this case, the
즉, 웹 활동 추출기(240)는 웹 페이지를 수신하기 위한 함수를 호출할 때, 메시지 캡쳐 모듈(242)을 통해 IAT에 근거해 마이콜백 함수를 호출하고, 마이콜백 함수를 통해 HTTP 메시지를 캡쳐하게 된다. 그리고, 웹 활동 추출기(240)는 메시지 분석 모듈(244)을 통해 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 추출 규칙에 근거해 컨텐츠 정보를 추출하게 된다. That is, when the
이때, 추출 규칙은 XML 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다. 여기서, 추출 태그는, 특정 문자열을 매칭하여 추출하는 매치 태그(<match_rule>)를 포함한다.In this case, the extraction rule is described as an XML document, and a plurality of rules are described through one or more rule tags. Here, the extraction tag includes a match tag <match_rule> for matching and extracting a specific string.
표시부(250)는 웹 브라우저가 표시되도록 하고, 웹 브라우저를 통해 웹 페이지를 디스플레이한다. 즉, 표시부(250)는 웹 서버(130)에서 수신된 HTTP 메시지를 이용하여 웹 페이지를 디스플레이한다.The
도 3은 본 발명의 실시예에 따른 사용자 단말기에서 웹 활동 추출기의 구성을 개략적으로 나타낸 구성도이다.3 is a schematic diagram showing the configuration of a web activity extractor in a user terminal according to an embodiment of the present invention.
도 3을 참조하면, 본 발명에 따른 웹 활동 추출기(240)는 메시지 캡쳐 모듈(242), 필터(310), 메시지 분석 모듈(244) 및 후크 DLL 로더(Loader)(320)를 포함한다.Referring to FIG. 3, the
필터(310)는 HTTP 메시지 중 추출하고자 하는 컨텐츠 정보와 상관이 없는 예컨대, CSS나 자바 스크립트 등의 데이터를 제거하는 역할을 한다.The
후크 DLL 로더(320)는 웹 브라우저(330)가 표시부(250)에 생성될 때 웹 활동 추출기(240)로부터 후크 DLL(322)을 웹 브라우저(330) 상으로 로딩(Loading)시키는 역할을 한다.The
따라서, 표시부(250)의 웹 브라우저(330)는 후크 DLL(322)을 포함하고 있다. 이때, 후크 DLL(322)은 윈속(WinSock) API를 후킹하여 웹 브라우저(330)가 송수신하는 HTTP 메시지를 얻어서 메시지 캡쳐 모듈(242)로 전달한다.Accordingly, the
메시지 캡쳐 모듈(242)은 후크 DLL(322)로부터 전달받은 HTTP 메시지를 Request/Response pair를 맞춰 필터(310)로 전달한다.The
메시지 분석 모듈(244)은 캡쳐된 HTTP 메시지의 호스트(host) 정보에 대해 키(Key)를 이용한 해쉬(hash) 값과 같은 추출 규칙만을 선택하여, 그 추출 규칙에 따라 스트링 매칭(String Matching)을 통해 컨텐츠 정보를 추출하게 된다.The
도 4는 본 발명의 실시예에 따른 웹 활동 추출 방법을 설명하기 위한 흐름도이다.4 is a flowchart illustrating a web activity extraction method according to an embodiment of the present invention.
도 4를 참조하면, 사용자 단말기(110, 112)에서 웹 활동 추출기(240)는 함수가 저장되어 있는 번지수를 저장하고 있는 임포트 어드레스 테이블(IAT)의 API에 관한 함수의 번지수를 본 발명에 따른 마이콜백 함수의 번지수로 변경한다(S410).Referring to FIG. 4, the
따라서, 사용자가 웹 페이지를 요청하게 될 때, 웹 활동 추출기(240)는 변경된 IAT를 참조해 일반적인 API에 관한 함수를 호출하는 것이 아니라 마이콜백 함수를 호출하게 되는 것이다.Therefore, when a user requests a web page, the
이어, 사용자가 웹 브라우저(330)를 실행함에 따라 사용자로부터 웹 페이지 의 요청이 있는 경우에, 제어부(230)는 웹 활동 추출기(240)를 통해 API에 관한 함수를 호출하게 되는데, 후크 DLL 로더(320)를 통해 후크 DLL(322)을 웹 브라우저(330) 상으로 로딩하고, 도 5에 도시된 바와 같이 IAT의 변경된 번지수를 참조해 마이콜백 함수를 호출한다(S420). Subsequently, when a user requests a web page as the user executes the
여기서, 도 5는 본 발명의 실시예에 따라 웹 페이지 요청시 변경 IAT를 참조해 마이콜백 함수를 호출하는 과정을 나타낸 도면이다.5 is a diagram illustrating a process of calling a callback function with reference to a changed IAT when a web page is requested according to an embodiment of the present invention.
즉, 도 5에 도시된 바와 같이 웹 활동 추출기(240)는 웹 서버(130)로 웹 페이지를 요청하기 위해, 예컨대, 'xxAPI'를 호출하게 되는데, IAT는 "0031322" 번지를 가리키고 있어 'xxAPI'는 "0031322" 번지를 읽게 되고(S510), "0031322"번지는 다시 "0x002011" 번지를 가리키고 있으므로, 'xxAPI'는 "0x002011" 번지를 읽게 된다(S520). 이때, IAT의 "0x002011" 번지에는 마이콜백 함수가 저장되어 있는 번지수 "Ox201201"가 저장되어 있어, 'xxAPI'는 기존의 "0x10032" 번지에 있는 일반적인 DLL을 호출하지 않고 "0x201201" 번지에 있는 마이콜백 함수를 호출하게 되는 것이다(S530). 이어, 마이콜백 함수는 "0x10032" 번지에 있는 원래의 'xxAPI'를 호출하여(S540), 소켓으로부터 읽는 데이터와 쓰는 데이터를 가져온다.That is, as shown in FIG. 5, the
웹 활동 추출기(240)는 웹 브라우저(330)가 HTTP 메시지를 송수신 하도록 WIN32 API 중 WinSock API를 이용하게 된다. 따라서, 웹 활동 추출기(240)는 웹 브라우저(330)가 호출하는 WinSock API를 후킹함으로써, 웹 브라우저(330)가 후크 DLL(322)을 통해 소켓에서 읽는 데이터와 쓰는 데이터를 가져올 수 있다.The
제어부(230)는 웹 브라우저(330) 상으로 후크 DLL(322)이 로딩된 상태에서, 웹 페이지를 요청하는 메시지를 웹 서버로 전송한다(S430).The
이에 대해, 웹 서버(130)는 통상적인 절차에 따라 해당 웹 페이지를 사용자 단말기(110, 112)로 전송해 주고, 사용자 단말기(110, 112)는 웹 서버(130)로부터 해당 웹 페이지를 수신하게 된다(S440).In this regard, the
제어부(230)는 수신된 웹 페이지를 웹 브라우저(330) 상으로 디스플레이하게 되는데, 이때 웹 브라우저(330) 상에 로딩되어 있는 후크 DLL(322)이 웹 페이지로부터 HTTP 메시지를 캡쳐하여 웹 활동 추출기(240)의 메시지 캡쳐 모듈(242)로 전달함으로써, HTTP 메시지를 캡쳐하게 된다(S450).The
메시지 캡쳐 모듈(242)은 HTTP 메시지를 필터(310)로 전달하고, 필터(310)는 추출할 컨텐츠 정보와 상관이 없는 CSS나 자바 스크립트 등의 패킷 데이터를 제거한 후 메시지 분석 모듈(244)로 전달한다.The
이에 따라, 웹 활동 추출기(240)는 메시지 분석 모듈(244)을 통해 HTTP 메시지로부터 컨텐츠 정보를 추출한다(S460).Accordingly, the
이때, 컨텐츠 정보는 HTTP 메시지 내에 포함되어 있는데, 그 위치가 웹 사이트 별, 컨텐츠 정보 유형 별로 다르다. 따라서, 메시지 분석 모듈(244)은 웹 사이트 별, 컨텐츠 정보 유형 별로 정의된 특정 추출 규칙에 따라 컨텐츠 정보를 추출하게 된다. 이 컨텐츠 정보는 예컨대, 사용자가 이용한 웹 사이트 주소를 비롯해 이용한 음악 파일이나 동영상 파일에 대한 정보, 쇼핑몰의 경우에 구매했던 상품 정보 등을 포함할 수 있다. 또한, 컨텐츠 정보는 컨텐츠의 제목, 사진, 태그, 가격 등에 대한 정보를 포함할 수 있다.At this time, the content information is included in the HTTP message, and its location is different for each web site and content type. Accordingly, the
여기서, 특정 추출 규칙은 웹 문서로부터 웹 활동 관련 정보를 추출하기 위한 규칙으로서, 도 6에 도시된 바와 같이 XML 문서로 기술되고, 한 개 이상의 규칙(rule) 태그를 통해 다수의 규칙(rule)이 기술된다. 도 6은 본 발명이 적용된 메시지 분석 모듈에서 이용하는 특정 추출 규칙의 문서 내용의 일 예를 나타낸 도면이다. 이때, 추출 태그는 도 6에 도시된 바와 같이 특정 문자열을 매칭하여 추출하는 매치 룰(<match_rule>) 태그를 포함한다. Here, the specific extraction rule is a rule for extracting web activity related information from a web document, which is described as an XML document as shown in FIG. 6, and a plurality of rules are defined through one or more rule tags. Are described. 6 is a diagram illustrating an example of document contents of a specific extraction rule used in the message analysis module to which the present invention is applied. At this time, the extraction tag includes a match rule (<match_rule>) tag that matches and extracts a specific string as shown in FIG. 6.
제어부(230)는 웹 활동 추출기(240)를 통해 추출된 컨텐츠 정보를 웹 활동 정보로 저장부(220)에 저장한다(S470).The
따라서, 이후에 사용자가 웹 페이지를 다시 요청할 때, 제어부(230)는 저장부(220)에 저장되어 있는 웹 활동 정보를 표시부(250)를 통해 표시해 줌으로써, 사용자가 이전에 이용했던 웹 활동 정보를 참조할 수 있도록 한다.Therefore, when the user requests the web page again later, the
전술한 바와 같이 본 발명에 의하면, 사용자가 컴퓨터 단말기나 휴대 전화 등의 통신 단말기를 통해 웹 서버에서 제공하는 웹 사이트에 접속하여 웹 서비스를 이용할 때, 사용자가 구매한 상품이나 조회했던 동영상 등의 컨텐츠를 사용한 웹 활동 정보를 추출해 저장해 두었다가, 다시 사용자가 통신 단말기로 웹 서버에 접속해 컨텐츠를 이용하고자 할 때 웹 활동 정보를 근거로 이전의 웹 활동 이력을 조회할 수 있도록 하는, 웹 활동 추출 시스템 및 방법을 실현할 수 있다.As described above, according to the present invention, when a user accesses a web site provided by a web server through a communication terminal such as a computer terminal or a mobile phone and uses a web service, content such as a product purchased by the user or a video that has been viewed Web activity extraction system that extracts and stores the web activity information using the web server, and allows the user to search the previous web activity history based on the web activity information when the user wants to access the web server using the communication terminal. The method can be realized.
본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있으므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이 해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.As those skilled in the art to which the present invention pertains may implement the present invention in other specific forms without changing the technical spirit or essential features, the embodiments described above are exemplary in all respects and are not intended to be limiting. You must do it. The scope of the present invention is shown by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the present invention. do.
본 발명은 웹 서버에서 제공하는 웹 서비스를 이용하는 단말기에 적용할 수 있고, 웹 브라우저를 통해 웹 페이지를 디스플레이하는 단말기에 적용할 수 있다.The present invention can be applied to a terminal using a web service provided by a web server, and can be applied to a terminal displaying a web page through a web browser.
또한, 자신이 구매했던 상품을 다시 찾아가거나 자신이 조회했던 동영상을 다시 보고자 하는 웹 서비스 시스템에 적용할 수 있다.In addition, it can be applied to a web service system that wants to revisit the product purchased by the user or to watch the video that the user has viewed again.
그리고, 사용자가 과거에 이용했던 웹 서비스에 대한 이력을 열람할 수 있는 서비스를 제공하는 시스템에도 적용할 수 있다.In addition, the present invention can be applied to a system that provides a service for viewing a history of a web service used by a user in the past.
도 1은 본 발명의 실시예에 따른 웹 활동 추출 시스템의 구성을 개략적으로 나타낸 구성도,1 is a schematic view showing the configuration of a web activity extraction system according to an embodiment of the present invention;
도 2는 본 발명에 따른 사용자 단말기의 내부 구성을 개략적으로 나타낸 구성도,2 is a configuration diagram schematically showing an internal configuration of a user terminal according to the present invention;
도 3은 본 발명의 실시예에 따른 사용자 단말기에서 웹 활동 추출기의 구성을 개략적으로 나타낸 구성도,3 is a block diagram schematically showing the configuration of a web activity extractor in a user terminal according to an embodiment of the present invention;
도 4는 본 발명의 실시예에 따른 웹 활동 추출 방법을 설명하기 위한 흐름도,4 is a flowchart illustrating a web activity extraction method according to an embodiment of the present invention;
도 5는 본 발명의 실시예에 따라 웹 페이지 요청시 변경 IAT를 참조해 마이콜백 함수를 호출하는 과정을 나타낸 도면, 그리고5 is a diagram illustrating a process of calling a callback function with reference to a changed IAT when a web page is requested according to an embodiment of the present invention; and
도 6은 본 발명이 적용된 메시지 분석 모듈에서 이용하는 특정 추출 규칙의 문서 내용의 일 예를 나타낸 도면이다. 6 is a diagram illustrating an example of document contents of a specific extraction rule used in the message analysis module to which the present invention is applied.
< 도면의 주요 부분에 대한 부호의 설명 >Description of the Related Art
110, 112 : 사용자 단말기 120 : 통신망110, 112: user terminal 120: communication network
130 : 웹 서버 210 : 통신부130: web server 210: communication unit
220 : 저장부 230 : 제어부220: storage unit 230: control unit
240 : 웹 활동 추출기 242 : 메시지 캡쳐 모듈240: Web Activity Extractor 242: Message Capture Module
244 : 메시지 분석 모듈 250 : 표시부244: message analysis module 250: display unit
310 : 필터 320 : 후크 DLL 로더310: filter 320: hook DLL loader
322 : 후크 DLL 330 : 웹 브라우저322: Hook DLL 330: Web Browser
Claims (31)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080031633A KR101164289B1 (en) | 2008-04-04 | 2008-04-04 | System and method for extracting a history of web activities |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080031633A KR101164289B1 (en) | 2008-04-04 | 2008-04-04 | System and method for extracting a history of web activities |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090106116A KR20090106116A (en) | 2009-10-08 |
KR101164289B1 true KR101164289B1 (en) | 2012-07-09 |
Family
ID=41535767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080031633A KR101164289B1 (en) | 2008-04-04 | 2008-04-04 | System and method for extracting a history of web activities |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101164289B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101396781B1 (en) | 2013-01-08 | 2014-05-20 | 주식회사 한올테크놀로지 | The device which manages a application program and managing method for the same |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101235139B1 (en) * | 2012-05-29 | 2013-02-20 | 주식회사 비바엔에스 | Detection method and system, the internal structure website |
-
2008
- 2008-04-04 KR KR1020080031633A patent/KR101164289B1/en active IP Right Grant
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101396781B1 (en) | 2013-01-08 | 2014-05-20 | 주식회사 한올테크놀로지 | The device which manages a application program and managing method for the same |
WO2014109487A1 (en) * | 2013-01-08 | 2014-07-17 | 주식회사 한올테크놀로지 | Apparatus for managing application program and method therefor |
CN104919415A (en) * | 2013-01-08 | 2015-09-16 | 韩奥科技有限公司 | Apparatus for managing application program and method therefor |
Also Published As
Publication number | Publication date |
---|---|
KR20090106116A (en) | 2009-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106294648B (en) | Processing method and device for page access path | |
US8645453B2 (en) | Method and system of processing cookies across domains | |
US8407363B2 (en) | Generating low resolution user interfaces for transmission to mobile devices | |
CN110096660B (en) | Method and device for loading page pictures and electronic equipment | |
CN102646135B (en) | Webpage collecting method, device and system | |
US7840650B2 (en) | Sharing of digital media on a network | |
US7987243B2 (en) | Method for media discovery | |
US8959434B2 (en) | Add-in program for upload, auxiliary program for upload and upload method | |
CN107291759B (en) | Method and device for processing browser page resources | |
US8676880B2 (en) | Server apparatus, communication apparatus, and method for generating navigation information | |
WO2016107465A1 (en) | Method, device, and system for implementing card-type desktop | |
CN109684571B (en) | Data acquisition method and device and storage medium | |
JP2014219974A (en) | Method and device for acquiring partial contents of web page | |
CN103810176A (en) | Pre-fetching accessing method and device of webpage information | |
CN103246699A (en) | Method and device for data access control based on browser | |
CN111177623A (en) | Information processing method and device | |
JP2008502038A (en) | Save multiple browser instances as one selectable web project | |
JP5112401B2 (en) | Web action history acquisition system, Web action history acquisition method, gateway device, and program | |
CN110825600B (en) | Page information processing method, server and page display device | |
CN107341234B (en) | Page display method and device and computer readable storage medium | |
KR101164289B1 (en) | System and method for extracting a history of web activities | |
KR101282975B1 (en) | A webpage crop server system of reconstructing a web page from tree structure of document elements | |
KR20120137629A (en) | System for providing shorten url browsing with branding , method thereof, and web client thereof | |
CN112307386A (en) | Information monitoring method, system, electronic device and computer readable storage medium | |
KR101692482B1 (en) | Advertising Method of Mobile Device, the Mobile Device and Program Distributing Server therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150622 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160629 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20180628 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190701 Year of fee payment: 8 |