KR100481139B1 - A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service - Google Patents
A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service Download PDFInfo
- Publication number
- KR100481139B1 KR100481139B1 KR10-2003-0029717A KR20030029717A KR100481139B1 KR 100481139 B1 KR100481139 B1 KR 100481139B1 KR 20030029717 A KR20030029717 A KR 20030029717A KR 100481139 B1 KR100481139 B1 KR 100481139B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- web
- web page
- extracted
- web scraping
- Prior art date
Links
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
본 발명은 소정의 웹 페이지로부터 원하는 정보를 추출할 수 있는 정보 추출 장치 및 방법, 이를 이용한 타 바둑 서비스에서의 전적 또는 기력을 보상할 수 있는 인터넷 바둑 서비스 방법, 및 사용자의 기력 또는 기풍을 측정할 수 있는 인터넷 바둑 서비스 방법 및 장치에 관한 것이다. The present invention provides an information extraction apparatus and method for extracting desired information from a predetermined web page, an Internet Go service method capable of compensating all or strength in other Go services using the same, and a user's strength or ethos to be measured. It relates to a method and apparatus for Internet Go services.
본 발명에 따른 웹 페이지 정보 추출 장치는 웹 페이지로부터 소정의 데이터를 추출하기 위한 웹 스크래이핑 규칙을 유지하는 웹 스크래이핑 규칙 저장부, 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 상기 웹 페이지로부터 추출 데이터를 추출하는 검색 로봇, 제1 입력 데이터와 연관된 제1 추출 데이터를 유지하는 추출 데이터 저장부, 및 상기 검색 로봇을 제어하여 소정의 시간 간격으로 상기 제1 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 상기 웹 페이지로부터 제2 추출 데이터를 추출하도록 하고, 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하는지 판단하는 웹 스크래이핑 제어부를 포함하는 것을 특징으로 한다. An apparatus for extracting web page information according to the present invention includes a web scraping rule storage unit for maintaining a web scraping rule for extracting predetermined data from a web page, and extracting from the web page based on input data and the web scraping rule. A search robot for extracting data, an extraction data storage unit for holding first extraction data associated with first input data, and a control of the search robot based on the first input data and the web scraping rule at predetermined time intervals; And extracting second extracted data from the web page, and determining whether the first extracted data and the second extracted data match.
Description
본 발명은 소정의 웹 페이지로부터 원하는 정보를 추출할 수 있는 정보 추출 장치 및 방법, 이를 이용한 타 바둑 서비스에서의 전적 또는 기력을 보상할 수 있는 인터넷 바둑 서비스 방법, 및 사용자의 기력 또는 기풍을 측정할 수 있는 인터넷 바둑 서비스 방법 및 장치에 관한 것이다. The present invention provides an information extraction apparatus and method for extracting desired information from a predetermined web page, an Internet Go service method capable of compensating all or strength in other Go services using the same, and a user's strength or ethos to be measured. It relates to a method and apparatus for Internet Go services.
웹 스크래이핑(Web Scraping 또는 Screen Scraping)은 자동으로 소정의 시스템에 접속하여 데이터를 화면에 나타나게 한 후, 필요한 자료만을 추출해 가져오는 기술이다. 웹 스크래이핑을 이용하여 웹 사이트에 있는 소정의 데이터를 추출하여 사용할 수 있으며, 필요에 따라 상기 정보를 소정의 데이터베이스에 저장한 후 가공하여 사용할 수도 있다.Web scraping or screen scraping is a technology that automatically accesses a predetermined system to display data on a screen and extracts only necessary data. The web scraping may be used to extract and use predetermined data on a web site. If necessary, the information may be stored in a predetermined database and processed.
이러한 웹 스크래이핑은 인터넷 뱅킹, 마일리지(mileage)와 같은 보상 프로그램, 전자 우편 통합 조회, 온라인 쇼핑몰의 가격 비교 등 소정의 웹 페이지에 접속한 사용자가 상기 웹 페이지 상에서 정보를 얻을 수 있는 경우라면 어디라도 사용될 수 있다. Such web scraping can be performed in any case where a user who accesses a web page, such as internet banking, a reward program such as mileage, an integrated e-mail inquiry, or a price comparison of an online shopping mall, can obtain information on the web page. Can be used.
인터넷 뱅킹을 예로 들면, 일반적으로 복수의 금융 기관과 인터넷 뱅킹을 통해 금융 거래를 하는 사용자는, 각 금융 기관에서 운영하는 웹 페이지에 접속하여 상기 금융 기관이 제공하는 금융 정보만을 열람할 수 있다. In the case of Internet banking, for example, a user who makes a financial transaction through a plurality of financial institutions and Internet banking can access a web page operated by each financial institution and read only financial information provided by the financial institution.
그러나, 웹 스크래이핑을 이용하면, 각 금융 기관에서 제공하는 금융 정보를 추출하고, 상기 각 금융 기관이 제공하는 모든 금융 정보를 사용자에게 소정의 통합된 웹 페이지 상에 제공하는 것이 가능해진다. 따라서, 상기 사용자는 각 금융 기관이 운영하는 웹 페이지에 각각 접속할 필요가 없다. However, using web scraping, it is possible to extract financial information provided by each financial institution and provide all the financial information provided by each financial institution to a user on a predetermined integrated web page. Thus, the user does not need to access each web page operated by each financial institution.
그런데, 웹 스크래이핑을 이용하여 원하는 데이터를 추출하는 방법은 소정의 웹 스크래이핑 규칙에 따라 웹 스크래이핑을 수행하고 상기 웹 스크래이핑 규칙은 상기 웹 페이지 정보를 기반으로 하여 결정되기 때문에, 소정의 웹 페이지를 구성하는 웹 페이지 정보(예를 들면, HTML 구문)가 변경되는 경우에는 소기의 목적을 달성할 수 없다는 문제가 있다.However, the method of extracting desired data using web scraping is performed by web scraping according to a predetermined web scraping rule and the web scraping rule is determined based on the web page information. If the web page information (for example, HTML syntax) constituting the page is changed, there is a problem that the desired purpose cannot be achieved.
한편, 인터넷 상에서 바둑을 둘 수 있도록 하는 인터넷 바둑 서비스가 제공되고 있다. 사용자들은 자신의 단말기를 이용하여 인터넷을 통해 소정의 바둑 서비스 시스템에 접속하여, 상기 바둑 서비스 시스템이 제공하는 가상의 상대와 대국을 하거나, 상기 바둑 서비스 시스템에 접속한 다른 사용자와 대국을 할 수 있다. On the other hand, the Internet Go service that allows you to put the Go on the Internet is provided. Users can connect to a predetermined Go service system through the Internet using their terminal to play with a virtual opponent provided by the Go service system, or play with another user connected to the Go service system. .
그런데, 대국 횟수 및 상기 대국의 결과에 따라 전적 및 기력이 결정되고, 통상적으로 바둑은 1회의 대국에 많은 시간이 소모되므로 전적 및 기력을 높이기 위해서는 사용자들이 많은 시간을 투자해야 한다. 따라서, 인터넷 바둑 서비스를 제공하는 다양한 웹 페이지가 존재하고, 현재의 전적 및 기력을 쌓은 인터넷 바둑 서비스보다 좋은 서비스를 제공하는 타 인터넷 바둑 서비스가 존재하는 경우에도, 현재의 전적 또는 기력을 인정받지 못하고, 현재의 전적 및 기력을 다시 쌓는 것이 어렵기 때문에 다른 인터넷 바둑 서비스를 이용하는 것에 제약이 있다는 문제가 있다. By the way, the total number and strength of the game is determined according to the number of times and the result of the game. In general, Baduk consumes a lot of time in one game, so users have to invest a lot of time in order to increase the strength and strength. Therefore, even if there are various web pages that provide Internet Go services, and there are other Internet Go services that provide better services than the current Go and accumulated Internet Go services, the current total or strength is not recognized. However, there is a problem in that it is difficult to rebuild the current record and energy, and there are limitations in using other Internet Go services.
본 발명은 상기와 같은 종래 기술을 개선하기 위해 안출된 것으로서, 웹 스크래이핑을 수행하는 대상인 웹 페이지가 변경되는 경우에도 원하는 정보를 추출할 수 있는 정보 추출 장치 및 방법을 제공하는 것을 목적으로 한다.An object of the present invention is to provide an information extraction apparatus and method for extracting desired information even when a web page, which is a target of web scraping, is changed.
본 발명의 또 다른 목적은 상기 정보 추출 장치 및 방법에 따라 타 바둑 서비스에서의 사용자의 전적 또는 기력을 반영하여 상기 사용자의 전적 또는 기력을 산출할 수 있는 인터넷 바둑 서비스 방법을 제공하는 것이다.Still another object of the present invention is to provide an Internet Go service method that can calculate the whole or strength of the user by reflecting the whole or strength of the user in another Go service according to the information extraction apparatus and method.
본 발명의 또 다른 목적은 소정의 바둑 문제를 출제하고 상기 바둑 문제에 대한 사용자의 답변에 기초하여 상기 사용자의 기력 또는 바둑에 대한 기풍을 측정할 수 있는 인터넷 바둑 서비스 시스템을 제공하는 것이다. It is still another object of the present invention to provide an Internet Go service system that can create a predetermined Go problem and measure the user's energy or the wind for Go based on a user's answer to the Go problem.
상기의 목적을 이루고 종래기술의 문제점을 해결하기 위하여, 본 발명은 소정의 웹 페이지로부터 소정의 데이터를 추출하기 위한 웹 스크래이핑 규칙을 유지하는 웹 스크래이핑 규칙 저장부, 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 상기 웹 페이지로부터 추출 데이터를 추출하는 검색 로봇, 제1 입력 데이터와 연관된 제1 추출 데이터를 유지하는 추출 데이터 저장부, 및 상기 검색 로봇을 제어하여 소정의 시간 간격으로 상기 제1 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 상기 웹 페이지로부터 제2 추출 데이터를 추출하도록 하고, 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하는지 판단하는 웹 스크래이핑 제어부를 포함하는 웹 페이지 정보 추출 장치를 제공한다. In order to achieve the above object and to solve the problems of the prior art, the present invention provides a web scraping rule storage unit for maintaining a web scraping rule for extracting predetermined data from a predetermined web page, input data and the web scraping. A search robot for extracting extraction data from the web page based on a rule, an extraction data storage unit for holding first extraction data associated with first input data, and the first input at a predetermined time interval by controlling the search robot; Extracting web extraction information from the web page based on the data and the web scraping rule, and extracting web page information including a web scraping controller configured to determine whether the first extraction data and the second extraction data match. Provide the device.
또한, 본 발명은 사용자로부터 타 바둑 서비스에서의 상기 사용자와 연관된 전적 또는 기력의 보상 요청을 입력 받는 단계, 소정의 웹 스크래이핑 규칙에 따라 상기 타 바둑 서비스와 연관된 웹 페이지에 대한 웹 스크래이핑을 수행하여 상기 사용자와 연관된 제1 전적 데이터 또는 제1 기력 데이터를 추출하는 단계, 및 상기 추출된 제1 전적 데이터 또는 제1 기력 데이터에 기초하여 상기 사용자의 제2 전적 데이터 또는 제2 기력 데이터를 산출하는 단계를 포함하는 인터넷 바둑 서비스 방법을 제공한다. The present invention also provides a step of receiving a request for compensation of the total or energy associated with the user in the other Go service from the user, and performs web scraping on the web page associated with the other Go service according to a predetermined web scraping rule. Extracting first historical data or first energy data associated with the user, and calculating second historical data or second energy data of the user based on the extracted first historical data or first energy data; Provides an Internet Go service method comprising the steps.
또한, 본 발명은 소정의 난이도에 대응하는 바둑 문제 데이터 및 상기 바둑 문제 데이터와 연관된 바둑 해답 데이터를 유지하는 바둑 문제 데이터베이스, 사용자에게 상기 바둑 문제 데이터를 웹 페이지 상에 시각적으로 제공하는 바둑 문제 제공부, 상기 사용자로부터 상기 바둑 문제 데이터에 대한 바둑 답변 데이터를 입력 받기 위한 사용자 입력부, 상기 바둑 답변 데이터와 상기 바둑 해답 데이터를 비교하여 상기 사용자와 연관된 평가 지수를 산출하기 위한 평가 지수 산출부, 상기 평가 지수에 대응하는 기력 등급 데이터를 유지하는 기력 등급 데이터베이스, 및 상기 기력 등급 데이터베이스를 참조하여 상기 평가 지수에 대응하는 상기 사용자와 연관된 기력 등급 데이터를 산출하기 위한 기력 등급 산출부를 포함하는 인터넷 바둑 서비스 시스템을 제공한다. The present invention also provides a Go problem database for maintaining Go problem data corresponding to a predetermined difficulty and the Go answer data associated with the Go problem data, and a Go problem providing unit for visually providing the Go problem data to a user on a web page. A user input unit for receiving Go response data for the Go problem data from the user, an evaluation index calculator for comparing the Go answer data with the Go answer data and calculating an evaluation index associated with the user, the evaluation index An Internet Go service system including an energy rating database for maintaining energy rating data corresponding to and an energy rating calculator for calculating energy rating data associated with the user corresponding to the evaluation index with reference to the energy rating database. To provide.
또한, 본 발명은 바둑 문제 데이터, 상기 바둑 문제 데이터와 연관된 복수 개의 예시 답변 데이터, 상기 예시 답변 데이터의 각각에 대응하는 사용자 패턴 정보-상기 사용자 패턴 정보는 바둑의 기풍에 관한 정보를 포함함-를 유지하는 바둑 문제 데이터베이스, 사용자에게 상기 바둑 문제 데이터 및 상기 예시 답변 데이터를 웹 페이지 상에 시각적으로 제공하는 바둑 문제 제공부, 상기 사용자로부터 상기 예시 답변 데이터 중 하나의 선택을 입력 받기 위한 사용자 입력부, 및 상기 선택된 예시 답변 데이터에 대응하는 상기 사용자 패턴 정보를 식별하고 상기 사용자 패턴 정보에 포함된 바둑의 기풍에 관한 정보를 상기 사용자에게 제공하는 바둑 기풍 판단부를 포함하는 인터넷 바둑 서비스 시스템을 제공한다. The present invention also provides Go problem data, a plurality of example answer data associated with the Go problem data, user pattern information corresponding to each of the example answer data, wherein the user pattern information includes information on the wind of Go A Go problem database to maintain, a Go problem providing unit for visually providing the Go problem data and the example answer data to a user on a web page, a user input unit for receiving a selection of one of the example answer data from the user, and It provides an Internet Go service system including a Go gusts determination unit for identifying the user pattern information corresponding to the selected example answer data and provides the user with information about Go gusts included in the user pattern information.
또한, 본 발명은 상술한 웹 페이지 정보 추출 방법 및 인터넷 바둑 서비스 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체를 제공한다. The present invention also provides a computer-readable recording medium having recorded thereon a program for executing the above-described web page information extraction method and Internet Go service method.
이하에서는 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다.Hereinafter, with reference to the accompanying drawings will be described an embodiment of the present invention;
도 1은 본 발명의 일실시예에 따른 웹 페이지 정보 추출 장치를 도시한 블록도이다.1 is a block diagram illustrating an apparatus for extracting web page information according to an embodiment of the present invention.
웹 페이지 정보 추출 장치(100)는 웹 스크래이핑 규칙 저장부(101), 검색 로봇(102), 추출 데이터 저장부(103), 관리자 통지부(104) 및 예상 웹 스크래이핑 규칙 저장부(105)를 포함한다. The web page information extraction apparatus 100 includes a web scraping rule storage 101, a search robot 102, an extraction data storage 103, an administrator notification unit 104, and a predicted web scraping rule storage 105. It includes.
웹 스크래이핑 규칙 저장부(101)는 소정의 웹 페이지로부터 소정의 데이터를 추출하기 위한 웹 스크래이핑 규칙을 저장한다. 상기 웹 스크래이핑 규칙은 상기 웹 페이지에 기초하여 결정된다. The web scraping rule storage unit 101 stores a web scraping rule for extracting predetermined data from a predetermined web page. The web scraping rule is determined based on the web page.
도 2는 웹 페이지를 형성하기 위한 구문의 일부를 도시한 도면이다. 도 2에서 도면 부호(201)은 사용자와 연관된 바둑에서의 전적 데이터('0승 0무 0패')를 표시한다. 상기 사용자가 바둑에서 승리한 횟수(도 2의 경우에는 '0')를 추출하고자 하는 경우, 예를 들면, 상기 데이터가 도 2에서 도면 부호(201)로 표시한 바와 같은 '0'인 경우 상기 웹 스크래이핑 규칙은 i) '승'의 앞에 존재하고, ii) '<font color ="#SteelBlue">'와 '</font>' 사이에 존재하는 스트링을 추출하는 것 등일 수 있다.2 is a diagram illustrating a part of syntax for forming a web page. In FIG. 2, reference numeral 201 denotes total data ('0'0'0'0') at the Go associated with the user. When the user wants to extract the number of times the user wins in Go ('0' in FIG. 2), for example, when the data is '0' as indicated by reference numeral 201 in FIG. Web scraping rules may include i) extracting a string that exists before 'win', ii) between '<font color = "# SteelBlue">' and '</ font>'.
한편, 상술한 예에서는 도 2에서 도시한 바와 같은 웹 페이지의 구문에 기초하여 웹 스크래이핑 규칙을 결정하고 있으나, 상기 웹 스크래이핑 규칙은 CGI(Computer Gateway Interface)에 기초하여 결정될 수도 있다. 즉, 소정의 데이터를 입력한 경우, 상기 웹 페이지에서 소정의 데이터의 입력에 응답하여 CGI 프로그램으로부터 전달되는 출력 값을 기준으로 웹 스크래이핑 규칙을 설정할 수 있다. Meanwhile, in the above-described example, the web scraping rule is determined based on the syntax of the web page shown in FIG. 2, but the web scraping rule may be determined based on the CGI (Computer Gateway Interface). That is, when predetermined data is input, the web scraping rule may be set based on an output value transmitted from the CGI program in response to the input of the predetermined data in the web page.
검색 로봇(102)은 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 상기 웹 페이지로부터 추출 데이터를 추출한다. 상기 입력 데이터는 일반적으로 상기 웹 스크래이핑을 수행하고자 하는 대상인 상기 웹 페이지와 연관된 사용자 로그인 데이터일 수 있으며, 상기 웹 페이지에서 제공하는 서비스에 따라 계좌 데이터(금융 서비스를 제공하는 경우), 카드 번호(카드 사용에 따른 마일리지를 제공하는 서비스의 경우) 등일 수 있다. 예를 들면, 도 2에서는 사용자 별로 바둑 전적 정보데이터(0승 0무 0패)를 제공하는 웹 페이지 구문의 경우를 도시하고 있으므로, 도 2의 경우 상기 입력 데이터에는 사용자 로그인 데이터가 포함된다. 즉, 사용자 로그인 데이터를 이용하여 상기 사용자의 전적 데이터가 포함된 웹 페이지에 접속하여 상기 웹 페이지로부터 상기 전적 데이터를 추출할 수 있다. The search robot 102 extracts extraction data from the web page based on input data and the web scraping rule. The input data may generally be user login data associated with the web page that is the target of the web scraping, and account data (if a financial service is provided) and card number (depending on the service provided by the web page). A service that provides mileage according to the use of the card). For example, FIG. 2 illustrates a case of a web page syntax that provides the Go total information data (0 wins 0 nothing 0 loss) for each user. In the case of FIG. 2, the input data includes user login data. That is, by using the user login data to access the web page containing the full data of the user can extract the full data from the web page.
추출 데이터 저장부(103)는 제1 입력 데이터와 연관된 제1 추출 데이터를 유지한다. 상기 제1 입력 데이터는 입력 데이터 중의 하나이고, 상기 제1 추출 데이터는 상기 제1 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 검색 로봇(102)에 의해 소정의 웹 페이지로부터 추출된 추출 데이터(또는 상기 제1 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 검색 로봇(102)에 의해 추출될 것이라고 예상되는 데이터)이다. 상기 제1 입력 데이터 및 상기 제1 추출 데이터는 후술하는 바와 같이 상기 웹 페이지의 구성이 변경됐는지 여부를 판단하는 기준으로 사용된다. 예를 들어, 바둑 사이트의 소정의 웹 페이지와 연관된 추출 데이터는 전적 데이터정보(예를 들어, "100전 50승 50패"에서의 "100", "50" 및 "50"의 정보) 또는 형식과 관련된 정보데이터(예를 들어, "100전 50승 50패"에서의 "전", "승" 및 "패"의 정보)일 수도 있고, 또는 본 발명의 목적에 적합한 기타 여러 가지 웹 스크래이핑과 연관된 데이터 정보일 수 있다.The extraction data storage 103 maintains first extraction data associated with the first input data. The first input data is one of input data, and the first extracted data is extracted data (or extracted from a predetermined web page by the search robot 102 based on the first input data and the web scraping rule). Data expected to be extracted by search robot 102 based on the first input data and the web scraping rule. The first input data and the first extracted data are used as a criterion for determining whether the configuration of the web page is changed, as will be described later. For example, the extracted data associated with a given web page of a Go site may be entirely data information (for example, information of "100", "50" and "50" in "50 wins 50 losses" of 100) or a format. Related information data (eg, information of "before", "win" and "loss" in "100 wins 50 wins 50 losses"), or various other web scrapings suitable for the purposes of the present invention. And data information associated with the.
웹 스크래이핑 제어부(104)는 검색 로봇(103)을 제어하여 소정의 시간 간격으로 상기 제1 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 상기 웹 페이지로부터 제2 추출 데이터를 추출하도록 하고, 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하는지를 판단한다. The web scraping control unit 104 controls the search robot 103 to extract second extracted data from the web page based on the first input data and the web scraping rule at predetermined time intervals. It is determined whether the first extracted data and the second extracted data match.
상기 웹 페이지가 변경되지 않는 한, 동일한 제1 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 검색 로봇(103)이 추출한 제2 추출 데이터는 항상 제1 추출 데이터와 동일하다. 또한, 상기 제1 추출 데이터가 인터넷 바둑 서비스에서의 사용자의 전적, 또는 계좌에 대응하는 예금액 등으로 변경되는 경우에는 상기 제1 추출 데이터의 값이 웹 스크래이핑 시마다 상이하다고 하더라도 상기 제1 추출 데이터와 상기 제2 추출 데이터가 갖는 형식은 동일할 것이다. 따라서, 동일한 제1 입력 데이터 및 동일한 웹 스크래이핑 규칙에 기초하여 소정 간격으로 검색 로봇(103)이 웹 스크래이핑을 수행한 결과인 상기 제2 추출 데이터가 상기 제1 추출 데이터와 동일하거나 그 형식이 일치하는 경우에는 상기 웹 페이지가 변경되지 않았다고 판단할 수 있다. Unless the web page is changed, the second extracted data extracted by the search robot 103 based on the same first input data and the web scraping rule is always the same as the first extracted data. In addition, when the first extracted data is changed to the total amount of the user or the deposit amount corresponding to the account in the Internet Go service, even if the value of the first extracted data is different for each web scraping, the first extracted data is different from the first extracted data. The format of the second extracted data will be the same. Accordingly, the second extracted data, which is the result of the web scraping performed by the search robot 103 at predetermined intervals based on the same first input data and the same web scraping rule, may have the same or the same format as the first extracted data. If there is a match, it may be determined that the web page has not been changed.
상술한 바와 같이, 웹 스크래이핑 제어부(104)는 상기 제2 추출 데이터의 값이 상기 제1 추출 데이터의 값과 일치하는지, 또는 상기 제2 추출 데이터의 형식이 상기 제1 추출 데이터의 형식과 동일한지 여부를 판단함으로써 상기 웹 페이지가 변경되었는지 여부를 알 수 있으나, 보다 용이한 구성을 위해서는 상기 제1 추출 데이터는 상기 전적이나 예금액과는 달리 변동되지 않는 데이터 값을 갖도록 선택되는 것이 바람직할 것이다. 예를 들어, 특정 사용자와 연관된 전적이나 예금액이 변동되지 않는 것이 보장된다면, 상기 특정 사용자와 연관된 전적이나 예금액 데이터는 본 발명을 위한 바람직한 제1 추출 데이터가 될 수 있다.As described above, the web scraping control unit 104 determines whether the value of the second extracted data matches the value of the first extracted data, or the format of the second extracted data is the same as that of the first extracted data. It may be known whether the web page has been changed by determining whether the web page has been changed. However, for easier configuration, the first extracted data may be selected to have a data value which does not change unlike the total or deposit amount. For example, if it is guaranteed that the record or deposit amount associated with a particular user does not change, the record or deposit amount data associated with the particular user may be the first preferred extraction data for the present invention.
웹 스크래이핑 제어부(104)에서의 판단 결과 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하지 않는 경우, 관리자 통지부(105)는 그 사실을 소정의 관리자에게 통지한다. 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하지 않는 경우에는 상기 웹 페이지가 변경된 것이라고 할 수 있고, 상기 웹 페이지가 변경된 이상 기존의 웹 스크래이핑 정보에 기초해서는 원하는 데이터를 추출할 수 없다. If the first extraction data and the second extraction data do not coincide with the determination result of the web scraping control unit 104, the administrator notification unit 105 notifies a predetermined administrator of the fact. When the first extracted data and the second extracted data do not match, it may be said that the web page is changed, and the desired data cannot be extracted based on the existing web scraping information as long as the web page is changed.
따라서, 상기 관리자 통지부(105)로부터 상기 사실을 통지 받은 관리자는 변경된 웹 페이지에 기초하여 새로운 웹 스크래이핑 규칙을 형성하여 웹 스크래이핑 규칙 저장부(101)에 저장함으로써, 그 이후부터는 상기 새로운 웹 스크래이핑 규칙에 의해 웹 스크래이핑이 수행되도록 할 수 있다.Accordingly, the administrator notified of the fact from the administrator notification unit 105 forms a new web scraping rule based on the changed web page and stores the new web scraping rule in the web scraping rule storage unit 101, and thereafter, the new web. Scraping rules can cause web scraping to be performed.
한편, 관리자 통지부(105)로부터 통지를 받은 관리자가 그 때마다 상기 웹 스크래이핑 규칙을 변경해야 한다면 상기 웹 페이지로부터 원하는 데이터를 추출하는 것이 번거로울 수 있다.On the other hand, if the administrator who received the notification from the administrator notification unit 105 has to change the web scraping rule each time, it may be cumbersome to extract the desired data from the web page.
따라서, 본 발명의 또 다른 실시예에 따르면, 웹 페이지 정보 추출 장치(100)는 관리자 통지부(105)를 대체하여, 또는 병행하여 예상 웹 스크래이핑 규칙 저장부(106)를 포함한다. Therefore, according to another embodiment of the present invention, the web page information extraction apparatus 100 includes the predicted web scraping rule storage 106 in place of or in parallel with the administrator notification unit 105.
예상 웹 스크래이핑 규칙 저장부(106)는 적어도 하나 이상의 예상 웹 스크래이핑 규칙을 유지한다. 만약, 도 2에서 도시한 웹 페이지의 구문에서 추출하고자 하는 데이터가 상술한 바와 같은 전적 데이터인 경우, 상기 웹 페이지의 구문이 일부 변경된다고 하더라도, 'O승 O무 O패'에서 '승', '무' 및 '패'와 같은 단어는 계속 사용될 확률이 높다. 이때, 예상 웹 스크래이핑 규칙은 상기 '승', '무' 및 '패'라는 단어를 이용하여 형성될 수 있을 것이다.The predicted web scraping rule storage 106 maintains at least one predicted web scraping rule. If the data to be extracted from the syntax of the web page shown in FIG. 2 is the entire data as described above, even if the syntax of the web page is partially changed, 'O' or 'O' Words such as 'no' and 'l' are more likely to be used. In this case, the expected web scraping rule may be formed by using the words 'win', 'no' and 'L'.
이와 같이, 변경된 웹 페이지에서 사용 가능성이 높은 웹 페이지의 형식 및 내용을 예측하고 이에 기초하여 상기 예상 웹 스크래이핑 규칙을 형성할 수 있다. As such, it is possible to predict the format and content of a web page that is highly available in the changed web page, and form the expected web scraping rule based on this.
예를 들면, 상기 인터넷 바둑 서비스를 이용하는 사용자의 전적 정보데이터를 얻고자 하는 경우, 하기와 같은 예상 웹 스크래이핑 규칙들이 사용될 수 있다. For example, in order to obtain exclusive information data of a user who uses the Internet Go service, the following anticipated web scraping rules may be used.
1. 제1 예상 웹 스크래이핑 규칙1. First Expected Web Scraping Rule
i) 급수는 회원 ID(Member ID)뒤에 존재한다.i) The series is after the Member ID.
ii) 급수는 "급" 또는 "단" 이라는 글자 앞에 숫자로 존재하며 사이에 공백이나 탭(tab) 문자가 있을 수 있다. 또한 그 숫자 앞에는 "아마", "프로" 라는 단어가 존재할 수 있다.ii) A series is a number before the letters "grade" or "column", with spaces or tabs in between. Also, the numbers "perhaps" and "pro" may be present in front of the number.
iii) 전적은 회원 ID(Member ID)뒤에 존재한다.iii) The record is located after the Member ID.
iv) 총 전적의 수는 "전"이라는 단어 앞에 O개 이상의 공백을 사이에 둔 숫자이다. 전적의 승수는 "승" 이라는 단어 앞에 O개 이상의 공백을 사이에 둔 숫자이다. 전적의 "무"승부 수는 "무"라는 단어 앞에 O개 이상의 공백을 사이에 둔 숫자이다. 전적의 "패"수는 "패"라는 단어 앞에 O개 이상의 공백을 사이에 둔 숫자이다.iv) The total number of achievements is the number of zero or more spaces before the word "before". The whole multiplier is a number with at least O spaces in front of the word "wins". The total number of "no" matches is the number of zero or more spaces before the word "no". The total number of "losses" is the number of zero or more spaces before the word "loss".
2. 제2 예상 웹 스크래이핑 규칙2. Second Expected Web Scraping Rule
i) 급수는 회원 ID(Member ID)뒤에 존재한다.i) The series is after the Member ID.
ii) 급수는 "급수" 라는 단어 뒤에 ":"이 오고 그 뒤에 오는 "급" 또는 "단" 이라는 글자 앞에 숫자로 존재하며 사이에 공백이나 탭(tab) 문자가 있을 수 있다. 또한 그 숫자 앞에는 "아마", "프로" 라는 단어가 존재할 수 있다.ii) A series is a number followed by the word "grade" followed by a ":" followed by the letter "grade" or "column", with spaces or tabs between them. Also, the numbers "perhaps" and "pro" may be present in front of the number.
iii) 전적은 회원 ID(Member ID)뒤에 존재한다.iii) The record is located after the Member ID.
iv) 전적의 승수는 "승" 이라는 단어 뒤에 ":"이 오고 그 뒤에 처음으로 나오는 숫자이다. 전적의 무승부수는 "무"라는 단어 뒤에 ":"이 오고 그 뒤에 처음으로 나오는 숫자이다. 전적의 패수는 "패"라는 단어 뒤에 ":"이 오고 그 뒤에 처음으로 나오는 숫자이다.iv) The whole multiplier is the first number following the word "win" followed by ":". The total draw is the first number following the word "nothing" followed by ":". The total number of defeats is the first number following the word "L" followed by ":".
……
N. 제N 예상 웹 스크래이핑 규칙N. Zero expected web scraping rules
……
웹 스크래이핑 제어부(104)는 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하지 않는 경우, 검색 로봇(103)을 제어하여 상기 제1 입력 데이터, 및 예상 웹 스크래이핑 규칙 저장부(106)에 저장되어 있는 예상 웹 스크래이핑 규칙 중 어느 하나에 기초하여 상기 웹 페이지로부터 제3 추출 데이터를 추출하도록 하고, 추출된 상기 제3 추출 데이터가 상기 제1 추출 데이터와 일치하는지 여부를 판단한다. When the first extraction data and the second extraction data do not match, the web scraping control unit 104 controls the search robot 103 to store the first input data and the expected web scraping rule storage unit 106. And extracting third extracted data from the web page based on any one of the expected web scraping rules stored in the web page, and determining whether the extracted third extracted data matches the first extracted data.
판단 결과, 상기 제3 추출 데이터와 상기 제1 추출 데이터가 일치하는 경우에는, 상기 예상 웹 스크래이핑 규칙이 상기 변경된 웹 페이지로부터 원하는 데이터를 추출할 수 있는 웹 스크래이핑 규칙에 해당하므로, 상기 예상 웹 스크래이핑 규칙을 웹 스크래이핑 규칙 저장부(101)에 저장한다. 따라서, 검색 로봇(103)은 변경된 웹 스크래이핑 규칙에 따라 데이터를 추출하게 된다. As a result of the determination, when the third extracted data and the first extracted data match, the expected web scraping rule corresponds to a web scraping rule capable of extracting desired data from the changed web page. The scraping rule is stored in the web scraping rule storage 101. Accordingly, the search robot 103 extracts data according to the changed web scraping rule.
본 발명의 또 다른 실시예에 따르면, 추출 데이터 저장부(103)는 복수 개의 제1 입력 데이터와 각각 연관된 복수 개의 제1 추출 데이터를 저장하고, 웹 스크래이핑 제어부(104)는 검색 로봇(103)을 제어하여 복수 개의 상기 제1 입력 데이터, 및 상기 예상 웹 스크래이핑 규칙에 기초하여 복수 개의 제3 추출 데이터를 각각 추출하도록 한다. 즉, 하나의 예상 웹 스크래이핑 규칙에 대해 제1 입력 데이터만을 다르게 하여 복수 회 웹 스크래이핑을 수행한다. 웹 스크래이핑 제어부(104)는 상기 각각의 제1 데이터와 연관된 각각의 제1 추출 데이터 및 상기 각각의 제3 추출 데이터를 각각 비교함으로써, 예상 웹 스크래이핑 규칙이 상기 변경된 규칙에 잘 적용되는지 여부를 확실하게 할 수 있다. 즉, 본 실시예에 따른 웹 사이트 데이터 추출 장치(100)는 소정 횟수 이상 상기 예상 웹 스크래이핑 규칙을 사용하여 웹 스크래이핑을 수행하고, 수행 결과가 만족스러운 경우에만 상기 예상 웹 스크래이핑 규칙을 웹 스크래이핑 규칙 저장부(101)에 저장하여 새로운 웹 스크래이핑 규칙으로 채택하는 구성을 하고 있다. 본 실시예에 따르면, 우연히 하나의 상기 제1 입력 데이터 및 예상 웹 스크래이핑 규칙 중 어느 하나에 기초하여 상기 웹 페이지로부터 추출된 제3 추출 데이터가 상기 제1 추출 데이터와 일치하는 경우, 상기 예상 웹 스크래이핑 규칙이 적절한 규칙이라고 판단하는 실수를 피할 수 있도록 한다.According to another embodiment of the present invention, the extraction data storage unit 103 stores a plurality of first extraction data respectively associated with the plurality of first input data, the web scraping control unit 104 is a search robot 103 Control to extract a plurality of third pieces of extracted data based on the plurality of first input data and the expected web scraping rule, respectively. That is, web scraping is performed a plurality of times by differenting only the first input data with respect to one expected web scraping rule. The web scraping control unit 104 compares each of the first extraction data and each of the third extraction data associated with each of the first data to determine whether the expected web scraping rule is well applied to the changed rule. I can be sure. That is, the apparatus 100 for extracting web site data according to the present embodiment performs web scraping using the expected web scraping rule more than a predetermined number of times, and applies the expected web scraping rule to the web only when the execution result is satisfactory. The scraping rule storage unit 101 stores the scraping rule storage 101 to adopt a new web scraping rule. According to the present embodiment, when the third extraction data extracted from the web page by accident based on either one of the first input data and the expected web scraping rule coincides with the first extracted data, the expected web Make sure you avoid making the mistake of deciding that scraping rules are appropriate.
삭제delete
이하, 도 3을 참조하여 본 발명의 또 다른 실시예에 따른 웹 페이지 정보 추출 방법에 대해 설명한다. 본 실시예에 따른 웹 페이지 정보 추출 방법은 상술한 웹 페이지 정보 추출 시스템(100)에서 수행될 수 있다. Hereinafter, a web page information extraction method according to another embodiment of the present invention will be described with reference to FIG. 3. The web page information extraction method according to the present embodiment may be performed by the web page information extraction system 100 described above.
웹 페이지 정보 추출 시스템(100)은 단계(301)에서 소정의 웹 페이지로부터 소정의 데이터를 추출하기 위한 웹 스크래이핑 규칙을 소정의 웹 스크래이핑 규칙 저장부에 유지하고, 단계(302)에서 제1 입력 데이터와 연관된 제1 추출 데이터를 유지한다. 상기 제1 추출 데이터는 상기 제1 입력 데이터와 상기 웹 스크래이핑 규칙에 의해 상기 웹 페이지에 대한 웹 스크래이핑을 수행할 경우 추출되는 데이터에 해당한다. The web page information extraction system 100 maintains a web scraping rule in a predetermined web scraping rule storage unit in step 302 to extract predetermined data from a predetermined web page in step 301, and in step 302 Maintain first extraction data associated with the input data. The first extracted data corresponds to data extracted when the web scraping is performed on the web page by the first input data and the web scraping rule.
웹 페이지 정보 추출 시스템(100)은 단계(303)에서 소정 시간이 경과했는지 여부를 판단하고, 상기 기간이 경과한 경우 단계(304)에서 상기 제1 입력 데이터 및 상기 웹 스크래이핑 규칙에 기초하여 상기 웹 페이지로부터 상기 제2 추출 데이터를 추출한다. The web page information extraction system 100 determines whether a predetermined time has elapsed in step 303, and if the time has elapsed, in step 304, based on the first input data and the web scraping rule, The second extracted data is extracted from the web page.
웹 페이지 정보 추출 시스템(100)는 단계(305)에서 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하는지 여부를 판단한다. 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하는 경우에는 상기 웹 페이지가 변경되지 않았다고 볼 수 있고, 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하지 않는 경우에는 상기 웹 페이지가 변경되었다고 볼 수 있다. The web page information extraction system 100 determines whether the first extraction data and the second extraction data match at step 305. When the first extracted data and the second extracted data coincide, the web page is not changed. When the first extracted data and the second extracted data do not match, the web page is changed. can see.
상술한 바와 같은 구성에 의해, 웹 페이지 정보 추출 시스템(100)은 상기 시간 간격 동안 상기 웹 페이지가 변경되었는지 여부를 판단할 수 있다. 상기 웹 페이지가 변경된 경우에는 상기 웹 스크래이핑 규칙에 기초한 웹 스크래이핑에 의해 원하는 데이터를 추출하는 것이 곤란하다. With the above configuration, the web page information extraction system 100 may determine whether the web page has been changed during the time interval. When the web page is changed, it is difficult to extract desired data by web scraping based on the web scraping rule.
한편, 상기 소정의 시간 간격은 웹 페이지 정보 추출 시스템(100)에서의 설정에 따라 상이하다. 상기 시간 간격이 좁을수록 상기 웹 페이지가 변경된 사실을 빨리 체크할 수 있으나, 상기 웹 페이지가 오랜 시간 동안 변경되지 않는 경우에는 웹 페이지 추출 정보 시스템(100)에서의 부하를 크게 할 수 있으므로, 상기 시간 간격은 이러한 요소를 고려하여 적절하게 선택하는 것이 바람직하다. On the other hand, the predetermined time interval is different depending on the setting in the web page information extraction system 100. As the time interval is narrower, the fact that the web page is changed can be quickly checked. However, when the web page is not changed for a long time, the load on the web page extraction information system 100 can be increased. The spacing is preferably selected in consideration of these factors.
또한, 본 발명의 또 다른 실시예에 따르면, 단계(302)에서 제1 추출 데이터가 아닌 상기 제1 추출 데이터의 데이터 형식을 저장하고, 단계(305)에서는 상기 제1 추출 데이터의 형식과 상기 제2 추출 데이터의 형식이 일치하는지 여부를 판단함으로써 상기 웹 페이지의 변경 여부를 판단한다. According to another embodiment of the present invention, in step 302, the data format of the first extraction data is stored instead of the first extraction data, and in step 305, the format of the first extraction data and the first extraction data are stored. 2 It is determined whether or not the web page is changed by determining whether the formats of the extracted data match.
본 발명의 또 다른 실시예에 따르면, 웹 페이지 정보 추출 방법은 단계(306)에서 상기 제1 추출 데이터가 상기 제2 추출 데이터가 일치하지 않는 경우 그 사실을 관리자에게 통지한다. 상기 통지를 받은 관리자는 변경된 웹 페이지에 사용 가능한 새로운 웹 스크래이핑 규칙을 상기 웹 스크래이핑 규칙 저장부에 저장할 수 있다. According to another embodiment of the present invention, the web page information extraction method notifies the administrator of the fact that the first extraction data does not match the second extraction data in step 306. The administrator who has received the notification may store a new web scraping rule available in the changed web page in the web scraping rule storage.
이하, 도 4를 참조하여 본 발명의 또 다른 실시예에 따른 웹 페이지 정보 추출 방법에 대해 설명한다. 단계(401 내지 405)는 상술한 실시예에 따른 웹 페이지 정보 추출 방법에서의 단계(301 내지 305)와 동일하므로 이에 대한 설명은 생략한다. Hereinafter, a method of extracting web page information according to another embodiment of the present invention will be described with reference to FIG. 4. Since the steps 401 to 405 are the same as the steps 301 to 305 in the web page information extraction method according to the above-described embodiment, description thereof will be omitted.
웹 페이지 정보 추출 시스템(100)은 단계(406)에서 적어도 하나 이상의 예상 웹 스크래이핑 규칙을 유지하고, 단계(405)에서의 판단 결과 상기 제1 추출 데이터와 상기 제2 추출 데이터가 일치하지 않는 경우, 단계(407)에서 상기 예상 웹 스크래이핑 규칙 중 하나를 선택한다. 만약, 단계(406)에서 상기 예상 웹 스크래이핑 규칙이 하나만 유지되어 있는 경우에는 단계(407)은 수행하지 않는다. The web page information extraction system 100 maintains at least one or more expected web scraping rules in step 406, and if the first extracted data and the second extracted data do not match as a result of the determination in step 405 In step 407, one of the expected web scraping rules is selected. If only one expected web scraping rule is maintained in step 406, step 407 is not performed.
웹 페이지 정보 추출 시스템(100)은 단계(408)에서 상기 제1 입력 데이터 및 상기 예상 웹 스크래이핑 규칙 중 어느 하나의 예상 웹 스크래이핑 규칙에 기초하여 상기 웹 페이지로부터 제3 추출 데이터를 추출하고, 단계(409)에서 상기 제1 추출 데이터와 상기 제3 추출 데이터가 일치하는지 여부를 판단한다. The web page information extraction system 100 extracts third extraction data from the web page in step 408 based on the predicted web scraping rule of any one of the first input data and the predicted web scraping rule. In step 409, it is determined whether the first extracted data and the third extracted data match.
판단 결과, 상기 제1 추출 데이터와 상기 제3 추출 데이터가 일치하는 경우에는, 단계(402)로 돌아가서 상기 예상 웹 스크래이핑 규칙을 변경된 웹 페이지에 적용할 수 있는 웹 스크래이핑 규칙으로 사용하기 위해 상기 웹 스크래이핑 규칙 저장부에 저장한다. If it is determined that the first extracted data and the third extracted data match, the process returns to step 402 to use the expected web scraping rule as a web scraping rule that can be applied to a changed web page. Store in web scraping rule storage.
만약, 상기 예상 웹 스크래이핑 규칙이 복수 개 유지되어 있는 경우에는, 상기 제1 추출 데이터와 상기 제3 추출 데이터가 일치할 때까지 유지되어 있는 각각의 예상 웹 스크래이핑 규칙에 대해 단계(407 내지 409)를 반복한다. If a plurality of the predicted web scraping rules are maintained, for each predicted web scraping rule held until the first extracted data and the third extracted data match, steps 407 to 409. Repeat).
이와 같은 구성을 통해, 상기 웹 페이지가 변경되는 경우에도 변경된 웹 페이지에 적용될 수 있는 웹 스크래이핑 규칙을 찾아서 적용할 수 있게 된다. Through such a configuration, even when the web page is changed, it is possible to find and apply a web scraping rule that can be applied to the changed web page.
상기 예상 웹 스크래이핑 규칙의 예는 상술한 실시예에 따른 웹 페이지 정보 추출 시스템(100)에서 설명한 바와 같은 규칙들이 사용될 수 있다. As the example of the expected web scraping rule, the rules as described in the web page information extraction system 100 according to the above-described embodiment may be used.
본 발명의 또 다른 실시예에 따르면, 단계(407 내지 409)을 반복한 결과, 상기 제1 추출 데이터와 상기 제3 추출 데이터가 일치하는 경우의 예상 웹 스크래이핑 규칙이 유지되어 있지 않은 경우에는, 웹 페이지 정보 추출 시스템(100)은 적합한 예상 웹 스크래이핑 규칙이 유지되어 있지 않다는 사실을 소정의 관리자에게 통지하는 단계(미도시)를 수행한다. 상기 사실을 통지 받은 관리자는 변경된 웹 페이지에 적용될 수 있는 웹 스크래이핑 규칙을 상기 웹 스크래이핑 규칙 저장부에 저장함으로써, 변경된 웹 페이지로부터 원하는 데이터를 추출할 수 있게 된다. According to another embodiment of the present invention, if the expected web scraping rule is not maintained when the first extraction data and the third extraction data match as a result of repeating steps 407 to 409, The web page information extraction system 100 performs a step (not shown) of notifying a given administrator that suitable anticipated web scraping rules are not maintained. The administrator notified of the fact stores the web scraping rule that can be applied to the changed web page in the web scraping rule storage, thereby extracting desired data from the changed web page.
이하, 도 5를 참조하여 본 발명의 또 다른 실시예에 따른 인터넷 바둑 서비스 방법에 대해 설명한다. 본 실시예에 따른 인터넷 바둑 서비스 방법은 다른 바둑 서비스에서 사용자가 쌓아온 전적 데이터 또는 기력 데이터를 반영한 전적 데이터 또는 기력 데이터를 산출할 수 있는 것을 특징으로 한다. Hereinafter, an Internet Go service method according to another embodiment of the present invention will be described with reference to FIG. 5. The Internet Go service method according to the present embodiment is characterized in that it is possible to calculate the whole data or the energy data reflecting the total data or energy data accumulated by the user in another Go service.
인터넷 바둑 서비스 시스템은 단계(501)에서 사용자로부터 타 바둑 서비스에서의 상기 사용자와 연관된 전적 또는 기력의 보상 요청을 입력 받으면, 단계(502)에서 소정의 웹 스크래이핑을 수행하여 상기 사용자와 연관된 제1 전적 데이터 또는 제1 기력 데이터를 추출한다. If the Internet Go service system receives a request for compensation of the total or energy associated with the user in the other Go service in step 501, the Internet Go service system performs a predetermined web scraping in step 502 to perform the first web associated with the user. Extract whole data or first energy data.
상기 인터넷 바둑 서비스 시스템은 단계(509)에서 상기 추출된 제1 전적 데이터 또는 제1 기력 데이터에 기초하여 상기 사용자의 제2 전적 데이터 또는 제2 기력 데이터를 산출한다. The Internet Go service system calculates second user data or second user data of the user based on the extracted first job data or first machine data in step 509.
상기 인터넷 바둑 서비스 시스템은 상기 제1 전적 데이터 또는 상기 제1 기력 데이터를 그대로 상기 제2 전적 데이터 또는 상기 제2 기력 데이터로 이용할 수도 있고, 소정의 가중치를 주어 상기 제2 전적 데이터 또는 상기 제2 기력 데이터로 이용할 수도 있다. The Internet Go service system may use the first whole data or the first energy data as the second whole data or the second energy data as it is, and give a predetermined weight to the second whole data or the second energy. Can also be used as data.
한편, 본 발명의 또 다른 실시예에 따르면, 상기 제1 전적 데이터는 상기 타 바둑 서비스에서 바둑을 둔 대국 횟수에 관한 대국 횟수 데이터를 포함하고, 상기 인터넷 바둑 서비스 시스템은 단계(503)에서 상기 대국 횟수 데이터가 소정 횟수 이하인지 여부를 판단한다. 판단 결과 상기 대국 횟수 데이터가 소정 횟수 이하인 경우에는 상기 인터넷 바둑 서비스 시스템은 단계(504)에서 소정의 처리를 수행한다. 이러한 소정의 처리는 단계(509)에서 상기 제2 전적 데이터를 산출하는 경우, 상기 제2 전적 데이터에 포함되는 대국 횟수 데이터를 "0"으로 처리하도록 하는 것일 수 있다. On the other hand, according to another embodiment of the present invention, the first total data includes the game number data on the number of players played in the other Go service, the Internet Go service system in step 503 It is determined whether the count data is less than or equal to the predetermined number of times. If the determination result data is less than a predetermined number of times, the Internet Go service system performs a predetermined process in step 504. This predetermined process may be such that when the second record data is calculated in step 509, the number of play data included in the second record data is processed as "0".
본 실시예에 따른 인터넷 바둑 서비스 방법은 타 바둑 서비스에 쌓은 전적 또는 기력이 높을수록 그 의미가 크고, 만약 상기 대국 횟수가 미미한 경우에는 상기 대국 횟수를 굳이 제2 전적 데이터에 반영할 필요가 크지 않기 때문이다. 예를 들면, 상기 타 바둑 서비스에서 5회의 대국만을 한 경우라면 그 대국 횟수를 본 실시예에 따른 인터넷 바둑 서비스 방법에 따라 제공되는 바둑 서비스에서 인정해 줄 필요성이 적다.In the Internet Go service method according to the present embodiment, the higher the total or energy accumulated in the other Go services, the greater the meaning. If the number of the games is small, the number of the games is not necessarily reflected in the second whole data. Because. For example, if only five games are played in the other Go service, there is little need to recognize the number of plays in the Go service provided according to the Internet Go service method according to the present embodiment.
따라서, 본 실시예에 따른 인터넷 바둑 서비스 방법을 이용하면 타 바둑 서비스에서 쌓은 전적 또는 기력을 전부 또는 일정 부분 인정받을 수 있게 된다. Therefore, by using the Internet Go service method according to the present embodiment, it is possible to recognize all or a part of the whole or energy accumulated in other Go services.
본 발명의 또 다른 실시예에 따르면, 상기 인터넷 바둑 서비스 시스템은 단계(505)에서 상기 인터넷 바둑 서비스 시스템은 복수의 사용자와 연관된 상기 타 바둑 서비스에서의 기력 데이터를 유지하고, 소정의 기간이 경과한 후 상기 복수의 사용자와 연관된 상기 바둑 서비스에서의 기력 데이터를 유지한다(단계(506, 507)). 단계(505) 및 단계(507)에서 얻어진 결과인 상기 복수의 사용자와 연관된 상기 타 바둑 서비스에서의 기력 데이터 및 상기 소정의 기간이 경과한 후 상기 복수의 사용자와 연관된 상기 바둑 서비스에서의 기력 데이터로부터 상기 인터넷 바둑 서비스 시스템은 단계(508)에서 기력 변동률을 산출할 수 있다. According to another embodiment of the present invention, the Internet Go service system, in step 505, the Internet Go service system maintains the energy data in the other Go services associated with a plurality of users, a predetermined period of time has passed Maintain energy data in the Go service associated with the plurality of users (steps 506 and 507). From the energy data in the other Go service associated with the plurality of users which are the results obtained in steps 505 and 507 and the energy data in the Go service associated with the plurality of users after the predetermined period has elapsed. The Internet Go service system may calculate the energy change rate in step 508.
이때, 단계(509)에서 상기 추출된 제1 기력 데이터에 기초하여 상기 사용자의 제2 기력 데이터를 산출하는 단계는 상기 기력 변동률에 기초하여 상기 제2 기력 데이터를 산출하는 것을 특징으로 한다. In this case, the calculating of the second energy data of the user based on the extracted first energy data in step 509 is characterized in that the second energy data is calculated based on the rate of change of energy.
상기 타 바둑 서비스를 이용하는 사용자들의 기력 데이터와, 상기 소정의 기간이 경과한 후 본 실시예에 따른 인터넷 바둑 서비스 방법에 따른 바둑 서비스에서의 상기 사용자들의 기력 데이터로부터 기력 변동률을 산출하면, 서로 다른 기력 측정 방법을 갖는 타 바둑 서비스의 기력을 객관적으로 반영할 수 있다. When the energy change rate is calculated from the energy data of the users using the other Go service and the energy data of the users in the Go service according to the Internet Go service method according to the present embodiment after the predetermined period has elapsed, The strength of other Go services with a measurement method can be objectively reflected.
예를 들면, 상기 타 바둑 서비스를 이용한 사용자 A, 사용자 B 및 사용자 C의 기력 데이터가 각각 4급, 7급 및 2급이었으나, 상기 소정의 기간(예를 들면, 한 달)이 경과한 후 본 실시예에 따른 인터넷 바둑 서비스 방법을 이용한 바둑 서비스(이하 '본 바둑 서비스'라 함)에서의 상기 사용자 A 내지 C의 기력 데이터가 각각 5급, 9급 및 3급인 경우를 가정한다. 이때, 각 사용자의 기력 데이터의 변화량은 각각 1급, 2급 및 1급에 해당한다. 이러한 결과에 의해, 상기 사용자 A 내지 C의 기력 데이터가 타 바둑 서비스를 이용한 경우보다 전반적으로 하락된 것을 알 수 있다. 이는 타 바둑 서비스에서의 기력 측정 방법이 상이하거나, 타 바둑 서비스를 이용하는 사용자들의 바둑 실력이 전반적으로 떨어지는 것과 같은 다양한 원인이 있을 수 있다. 따라서, 상기 타 바둑 서비스에서의 기력 데이터를 본 바둑 서비스에 그대로 반영하는 것은 처음부터 본 바둑 서비스를 이용하던 사용자들과의 관계에서 형평성, 객관성을 담보할 수 없기 때문에, 상기 인터넷 바둑 서비스 시스템은 사용자들의 전반적인 기력 변동율을 산출하고, 이러한 변동율에 기초하여 단계(509)를 수행하고 있다. For example, the energy data of the user A, the user B, and the user C using the other Go service were 4th, 7th, and 2nd grade, respectively, but after the predetermined period (for example, one month) elapsed, It is assumed that the energy data of the users A to C in the Go service (hereinafter referred to as 'the main Go service') using the Internet Go service method according to the embodiment are Class 5, Class 9 and Class 3, respectively. At this time, the amount of change in the energy data of each user corresponds to the first, second and first class respectively. As a result, it can be seen that the energy data of the users A to C are generally lower than that of other Go services. This may be due to a variety of causes, such as different energy measurement method in the other Go services, or the overall baduk skills of users using the other Go services. Accordingly, since the energy data from the other Go service is reflected in the Go service as it is, the Internet Go service system cannot be secured in relation to the users who used the Go service from the beginning. Their overall energy change rate is calculated, and step 509 is performed based on this rate of change.
이와 같은 구성은 상기 기력 데이터뿐만이 아니라, 상기 전적 데이터에 대해서도 동일하게 적용될 수 있으며, 이에 대한 설명은 생략하기로 한다. Such a configuration may be equally applied to the whole data as well as the mechanical data, and a description thereof will be omitted.
또한, 본 발명은 상술한 각 실시예에 따른 웹 페이지 정보 추출 방법 및 인터넷 바둑 서비스 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체를 제공한다. The present invention also provides a computer-readable recording medium having recorded thereon a program for executing the web page information extraction method and the Internet Go service method according to each of the above-described embodiments.
이하, 본 발명의 또 다른 실시예에 따른 인터넷 바둑 서비스 시스템에 대해 설명한다. 본 실시예에 따른 인터넷 바둑 서비스 시스템은 인터넷 바둑 서비스를 이용하는 사용자의 기력을 측정할 수 있는 것을 특징으로 한다. Hereinafter, an Internet Go service system according to another embodiment of the present invention will be described. The Internet Go service system according to the present embodiment is characterized in that the user's strength using the Internet Go service can be measured.
도 6은 본 실시예에 따른 인터넷 바둑 서비스 시스템(600)을 도시한 블록도이다. 인터넷 바둑 서비스 시스템(600)은 바둑 문제 데이터베이스(601), 바둑 문제 제공부(602), 사용자 입력부(603), 평가 지수 산출부(604), 기력 등급 산출부(605), 기력 등급 데이터베이스(606) 및 출력부(607)을 포함한다. 6 is a block diagram showing an Internet Go service system 600 according to the present embodiment. The Internet Go service system 600 includes a Go problem database 601, a Go problem providing unit 602, a user input unit 603, an evaluation index calculation unit 604, an energy rating calculation unit 605, and an energy rating database 606. ) And an output unit 607.
바둑 문제 데이터베이스(601)는 소정의 난이도에 대응하는 바둑 문제 데이터 및 상기 바둑 문제 데이터와 연관된 바둑 해답 데이터를 유지하고, 바둑 문제 제공부(602)는 사용자에게 상기 바둑 문제 데이터를 웹 페이지 상에 시각적으로 제공한다.The Go problem database 601 maintains Go problem data corresponding to a predetermined difficulty and Go answer data associated with the Go problem data, and the Go problem provider 602 visualizes the Go problem data on a web page. To provide.
상기 웹 페이지를 통해 상기 바둑 문제 데이터를 제공 받은 사용자가 상기 바둑 문제 데이터를 풀고 이에 대한 바둑 답변 데이터를 입력하면, 사용자 입력부(603)는 상기 바둑 답변 데이터를 수신한다. When the user who has received the Go problem data through the web page solves the Go problem data and inputs the Go answer data, the user input unit 603 receives the Go answer data.
평가 지수 산출부(604)는 상기 바둑 답변 데이터와 상기 바둑 해답 데이터를 비교하여(즉, 상기 바둑 문제 데이터에 대해 맞는 답변을 입력했는지 여부를 판단하여) 상기 사용자와 연관된 평가 지수를 산출한다. 상기 바둑 문제 데이터가 복수 회 제공되고 이에 대한 바둑 답변 데이터가 복수 회 입력되는 경우, 평가 지수 산출부(604)는 상기 각각의 바둑 답변 데이터에 대해 평가 지수를 누적하여 산출한다. 즉, 첫 번째로 제공된 바둑 문제에 대해 사용자가 상기 바둑 해답 데이터와 일치하는 바둑 답변 데이터를 입력한 경우 상기 평가 지수를 소정 값 증가시키고, 다음으로 제공된 바둑 문제에 대해 상기 바둑 해답 데이터와 일치하지 않는 바둑 답변 데이터를 입력한 경우 상기 평가 지수를 소정 값 감소시키는 방법이 사용될 수 있다. An evaluation index calculator 604 calculates an evaluation index associated with the user by comparing the Go answer data with the Go answer data (ie, determining whether a correct answer is input for the Go problem data). When the Go question data is provided a plurality of times and the Go answer data is input a plurality of times, the evaluation index calculator 604 accumulates and calculates an evaluation index for each Go answer data. That is, when the user inputs the Go answer data that matches the Go answer data for the first provided Go problem, the evaluation index is increased by a predetermined value, and the next Go problem does not match the Go answer data for the provided Go problem. When inputting Go answer data, a method of reducing the evaluation index by a predetermined value may be used.
기력 등급 데이터베이스(605)는 상기 평가 지수에 대응하는 기력 등급 데이터를 유지하고, 기력 등급 산출부(606)는 기력 등급 데이터베이스(605)를 참조하여 상기 평가 지수에 대응하는 상기 사용자와 연관된 기력 등급 데이터를 산출한다. The energy rating database 605 maintains energy rating data corresponding to the evaluation index, and the energy rating calculation unit 606 refers to the energy rating database 605 to the energy rating data associated with the user corresponding to the evaluation index. To calculate.
예를 들면, 상기 평가 지수가 100 내지 150인 경우에는 상기 기력 등급 데이터가 9급, 상기 평가 지수가 151 내지 200인 경우에는 상기 기력 등급 데이터가 8급과 같은 데이터가 기력 등급 데이터베이스(605)에 유지될 수 있다. For example, when the evaluation index is 100 to 150, when the energy rating data is level 9, and when the evaluation index is 151 to 200, data such as the energy rating data as grade 8 is stored in the energy rating database 605. Can be maintained.
본 발명의 또 다른 실시예에 따른 인터넷 바둑 서비스 시스템(600)은 상기 사용자와 연관된 상기 평가 지수 및 상기 사용자와 연관된 기력 등급 데이터를 상기 사용자에게 제공하기 위한 출력부(607)를 더 포함한다. 출력부(607)는 상기 평가 지수 및 상기 사용자와 연관된 기력 등급 데이터를 소정의 수치로 표시할 수 있을 뿐만 아니라, 상기 웹 페이지 상에서 소정의 수형도를 이용하여 제공할 수 있다. 도 7은 출력부(607)에 의해 상기 웹 페이지 상에 제공되는 수형도의 일례이다. 도 7에서 도면 부호(701)로 표시한 도형은 사용자가 입력한 바둑 답변 데이터에 따라 좌우 둘 중의 하나를 선택하며 아래쪽으로 이동해 간다. 즉, 출력부(607)는 평가 지수 산출부(604)에서 산출된 평가 결과의 증감에 따라 또한 입력된 바둑 답변 데이터의 입력 횟수에 따라, 도면 부호(701)로 표시한 도형의 위치 및 상기 도형이 움직인 경로 등을 갱신하여 표시한다. 도면 상에서 사용자는 첫 번째 문제는 맞추고, 두 번째 문제는 틀렸다. 상기 사용자가 이러한 방법으로 8번의 문제를 푼 결과, 상기 사용자와 연관된 기력 등급 데이터는 도면 부호(702)로 표시한 바와 같이 '14급'이다.The Internet Go service system 600 according to another embodiment of the present invention further includes an output unit 607 for providing the user with the rating index associated with the user and the energy rating data associated with the user. The output unit 607 may not only display the evaluation index and the energy rating data associated with the user at a predetermined value, but also provide the predetermined index on the web page. 7 is an example of a tree diagram provided on the web page by an output portion 607. In FIG. 7, the figure indicated by reference numeral 701 moves downward by selecting one of left and right according to the Go answer data input by the user. That is, the output part 607 is the position and the figure of the figure indicated by the reference numeral 701 according to the increase and decrease of the evaluation result calculated by the evaluation index calculation unit 604 and the number of times of inputting the Go answer data The moved route and the like are updated and displayed. On the drawing, the user solved the first problem and the second problem was wrong. As a result of the user solving eight problems in this manner, the energy rating data associated with the user is grade 14 as indicated by reference numeral 702.
또한, 본 발명의 또 다른 실시예에 따르면, 바둑 문제 데이터베이스(601)는 상기 바둑 문제 데이터에 대응하는 출제 순서 정보를 더 유지하고, 바둑 문제 제공부(602)는 상기 출제 순서 정보에 기초하여 상기 바둑 문제 데이터를 상기 사용자에게 제공한다. 따라서, 상기 사용자에게 연달아 동일한 바둑 문제 데이터, 또는 출제된 지 얼마 되지 않은 동일한 바둑 문제 데이터가 제공되는 것이 방지되고, 상기 사용자와 연관된 평가 지수, 또는 기력 등급 데이터를 객관적으로 측정할 수 있다.In addition, according to another embodiment of the present invention, the Go problem database 601 further maintains the question order information corresponding to the Go problem data, the Go problem provider 602 is based on the question order information Provide Go problem data to the user. Therefore, it is possible to prevent the user from being provided with the same Go problem data, or the same Go problem data that has just been asked, and the evaluation index or the energy rating data associated with the user can be measured objectively.
이하, 본 발명의 또 다른 실시예에 따른 인터넷 바둑 서비스 시스템에 대해 설명한다. 본 실시예에 따른 인터넷 바둑 서비스 시스템은 인터넷 바둑 서비스를 이용하는 사용자의 기풍을 측정할 수 있는 것을 특징으로 한다. Hereinafter, an Internet Go service system according to another embodiment of the present invention will be described. The Internet Go service system according to the present embodiment is characterized in that the wind of the user using the Internet Go service can be measured.
도 8은 본 실시예에 따른 인터넷 바둑 서비스 시스템(800)을 도시한 블록도이다. 인터넷 바둑 서비스 시스템(800)은 바둑 문제 데이터베이스(801), 바둑 문제 제공부(802), 사용자 입력부(803) 및 바둑 기풍 판단부(804)를 포함한다. 8 is a block diagram showing an Internet Go service system 800 according to the present embodiment. The Internet Go service system 800 includes a Go problem database 801, a Go problem providing unit 802, a user input unit 803, and a Go ethos determination unit 804.
바둑 문제 데이터베이스(801)는 바둑 문제 데이터, 상기 바둑 문제 데이터와 연관된 복수 개의 예시 답변 데이터, 상기 예시 답변 데이터의 각각에 대응하는 사용자 패턴 정보를 유지한다. 상기 사용자 패턴 정보에는 바둑의 기풍에 관한 정보를 포함한다. 상기 바둑의 기풍에는 공격적 기풍 또는 방어적 기풍이 포함될 수 있다.The Go problem database 801 maintains Go problem data, a plurality of example answer data associated with the Go problem data, and user pattern information corresponding to each of the example answer data. The user pattern information includes information about the wind of Go. The wind of the monarch may include an aggressive wind or defensive wind.
바둑 문제 제공부(802)는 사용자에게 상기 바둑 문제 데이터 및 상기 바둑 문제 데이터와 연관된 복수 개의 예시 답변 데이터를 웹 페이지 상에 시각적으로 제공한다. 상기 사용자는 상기 제공된 바둑 문제 데이터를 보고, 상기 예시 답변 데이터 중에서 상기 바둑 문제 데이터에 대한 적절한 해답이라고 생각되는 예시 답변 데이터를 선택하여 사용자 입력부(803)를 통해 인터넷 바둑 서비스 시스템(800)으로 입력한다.The Go problem provider 802 visually provides the Go question data and a plurality of example answer data associated with the Go problem data on a web page. The user views the provided Go question data, selects the example answer data that is considered to be an appropriate answer to the Go question data from the example answer data, and inputs it to the Internet Go service system 800 through the user input unit 803. .
바둑 기풍 판단부(804)는 상기 선택된 예시 답변 데이터에 대응하는 상기 사용자 패턴 정보를 식별하고 상기 사용자 패턴 정보에 포함된 바둑의 기풍에 관한 정보를 상기 사용자에게 제공한다.The Go breeze judging unit 804 identifies the user pattern information corresponding to the selected example answer data and provides the user with information about the Go breeze included in the user pattern information.
도 9는 바둑 문제 제공부(802)로부터 상기 사용자에게 제공되는 바둑 문제 데이터 및 예시 답변 데이터의 일례를 도시한 도면이다. 사용자는 제공된 바둑 문제 데이터를 보고(도 9에서 '바둑판' 상의 각 '바둑돌'들의 위치를 보고) 예시 답변 데이터인 '가'(도면 부호(901)로 표시함) 또는 '나'(도면 부호(902)로 표시함) 중 하나를 선택할 수 있다. 바둑 문제 데이터베이스(801)에 유지되고 '가'에 대응하는 사용자 패턴 정보는 '공격적 기풍'이고, '나'에 대응하는 사용자 패턴 정보는 '방어적 기풍'인 경우, 상기 사용자로부터 '가'의 선택이 입력되면 상기 사용자는 공격적 기풍으로 바둑을 두는 사용자라고 생각될 수 있다. 인터넷 바둑 서비스 시스템(800)은 상기 기풍을 포함한 상기 사용자의 패턴을 더욱 정확하게 파악하기 위해 상기 사용자에게 상기 바둑 문제 데이터 및 예시 답변 데이터를 여러 번 제공하여 식별된 사용자의 패턴 정보의 평균을 종합적으로 판단하여 상기 사용자에게 제공할 수 있다.FIG. 9 is a diagram illustrating an example of Go problem data and example answer data provided to the user from the Go problem providing unit 802. The user looks at the provided Go problem data (see the location of each 'goblin' on the 'board' in FIG. 9) or the 'I' (shown with reference numeral 901) or the example answer data. 902). If the user pattern information maintained in the Go problem database 801 and corresponding to 'a' is 'aggressive ethos', and the user pattern information corresponding to 'I' is 'defense ethos,' If a selection is entered, the user may be considered to be a user who is playing with an aggressive ethos. In order to more accurately grasp the pattern of the user including the ethos, the Internet Go service system 800 provides the user with the Go problem data and the example answer data several times to comprehensively determine the average of the identified pattern information of the user. Can be provided to the user.
한편, 도 10은 본 발명에 따른 웹 사이트 데이터 추출 장치 또는 인터넷 바둑 서비스 시스템 등을 구성하는 데 채용될 수 있는 범용 컴퓨터 시스템의 내부 블록도이다.On the other hand, Figure 10 is an internal block diagram of a general-purpose computer system that can be employed to configure a website data extraction apparatus or Internet Go service system according to the present invention.
컴퓨터 시스템(1000)은 램(RAM: Random Access Memory)(1002)과 롬(ROM: Read Only Memory)(1003)을 포함하는 주기억장치와 연결되는 하나 이상의 프로세서(1001)를 포함한다. 프로세서(1001)는 중앙처리장치(CPU)로 불리기도 한다. 본 기술분야에서 널리 알려져 있는 바와 같이, 롬(1003)은 데이터(data)와 명령(instruction)을 단방향성으로 CPU에 전달하는 역할을 하며, 램(1002)은 통상적으로 데이터와 명령을 양방향성으로 전달하는 데 사용된다. 램(1002) 및 롬(1003)은 컴퓨터 판독 가능 매체의 어떠한 적절한 형태를 포함할 수 있다. 대용량 기억장치(Mass Storage)(1004)는 양방향성으로 프로세서(1001)와 연결되어 추가적인 데이터 저장 능력을 제공하며, 상기된 컴퓨터 판독 가능 기록 매체 중 어떠한 것일 수 있다. 대용량 기억장치(1004)는 프로그램, 데이터 등을 저장하는데 사용되며, 통상적으로 주기억장치보다 속도가 느린 하드디스크와 같은 보조기억장치이다. CD 롬(1006)과 같은 특정 대용량 기억장치가 사용될 수도 있다. 프로세서(1001)는 비디오 모니터, 트랙볼, 마우스, 키보드, 마이크로폰, 터치스크린 형 디스플레이, 카드 판독기, 자기 또는 종이 테이프 판독기, 음성 또는 필기 인식기, 조이스틱, 또는 기타 공지된 컴퓨터 입출력장치와 같은 하나 이상의 입출력 인터페이스(1005)와 연결된다. 마지막으로, 프로세서(1001)는 네트워크 인터페이스(1007)를 통하여 유선 또는 무선 통신 네트워크에 연결될 수 있다. 이러한 네트워크 연결을 통하여 상기된 방법의 절차를 수행할 수 있다. 상기된 장치 및 도구는 컴퓨터 하드웨어 및 소프트웨어 기술 분야의 당업자에게 잘 알려져 있다.Computer system 1000 includes one or more processors 1001 connected to a main memory including random access memory (RAM) 1002 and read only memory (ROM) 1003. The processor 1001 is also called a central processing unit (CPU). As is well known in the art, the ROM 1003 serves to transfer data and instructions to the CPU unidirectionally, and the RAM 1002 typically transfers data and instructions bidirectionally. Used to. RAM 1002 and ROM 1003 may include any suitable form of computer readable media. Mass storage 1004 is bidirectionally coupled to processor 1001 to provide additional data storage capability and may be any of the computer readable recording media described above. The mass storage device 1004 is used to store programs, data, and the like, and is a secondary memory device such as a hard disk which is generally slower than the main memory device. Certain mass storage devices, such as CD ROM 1006, may also be used. The processor 1001 may include one or more input / output interfaces such as video monitors, trackballs, mice, keyboards, microphones, touchscreen displays, card readers, magnetic or paper tape readers, voice or handwriting readers, joysticks, or other known computer input / output devices. Connected to 1005. Finally, the processor 1001 may be connected to a wired or wireless communication network through the network interface 1007. Through this network connection, the procedure of the method described above can be performed. The apparatus and tools described above are well known to those skilled in the computer hardware and software arts.
상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있다.The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention.
본 발명에 따른 웹 페이지 정보 추출 장치 및 방법에 따르면, 웹 스크래이핑을 수행하는 대상인 웹 페이지가 변경되는 경우에도 원하는 정보를 추출할 수 있게 된다. According to the apparatus and method for extracting web page information according to the present invention, desired information can be extracted even when a web page, which is a target of web scraping, is changed.
또한, 본 발명에 따른 인터넷 바둑 서비스 방법에 따르면, 타 바둑 서비스에서의 사용자의 전적 또는 기력을 반영하여 상기 사용자의 전적 또는 기력을 산출할 수 있다. 인터넷 바둑 서비스의 경우 전적 또는 기력을 올리기 위해서는 많은 대국을 해야 하고, 바둑은 하나의 대국에 시간이 많이 소요되는 게임이므로 사용자가 전적 또는 기력을 올리기 위해서는 많은 시간을 투자해야 한다. 따라서, 다른 인터넷 바둑 서비스를 이용하고자 하는 경우에는 이미 올려놓은 전적 또는 기력을 사용할 수 없게 되어 다시 처음부터 전적 또는 기력을 쌓아야 한다는 불편함이 있었으나, 본 발명에 따른 인터넷 바둑 서비스 방법을 이용하면 다른 인터넷 바둑 서비스를 이용하여 쌓은 전적 또는 기력을 이용할 수 있게 되므로 이러한 불편함이 해소될 수 있다.In addition, according to the Internet Go service method according to the present invention, it is possible to calculate the total or strength of the user by reflecting the total or strength of the user in the other Go services. In the case of the Internet Go service, many games must be played in order to increase the strength or strength, and since Go is a time-consuming game in one game, the user must invest a lot of time in order to increase the strength or strength. Therefore, if you want to use other Internet Go services, there is an inconvenience that you can not use the whole or energy already put up, and have to rebuild all or energy from the beginning, but if you use the Internet Go service method according to the present invention, This inconvenience can be eliminated because it is possible to use the whole or energy accumulated by using the Go service.
또한, 본 발명에 따른 인터넷 바둑 서비스 시스템에 따르면, 소정의 바둑 문제를 출제하고 상기 바둑 문제에 대한 사용자의 답변에 기초하여 상기 사용자의 기력, 또는 바둑에 대한 기풍을 포함하는 사용자의 패턴을 측정할 수 있다. In addition, according to the Internet Go service system according to the present invention, a predetermined Go problem is to be asked and based on the user's response to the Go problem, the user's strength, or the user's pattern including the ethos to go, can be measured. Can be.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above-described embodiments, which can be variously modified and modified by those skilled in the art to which the present invention pertains. Modifications are possible. Accordingly, the spirit of the present invention should be understood only by the claims set forth below, and all equivalent or equivalent modifications thereof will belong to the scope of the present invention.
도 1은 본 발명에 따른 웹 페이지 정보 추출 장치를 도시한 블록도.1 is a block diagram showing a web page information extraction apparatus according to the present invention.
도 2는 웹 페이지를 형성하기 위한 HTML 파일의 구문의 일부를 도시한 도면.2 illustrates part of the syntax of an HTML file for forming a web page.
도 3은 본 발명의 또 다른 실시예에 따른 웹 페이지 정보 추출 방법을 도시한 흐름도. 3 is a flowchart illustrating a web page information extraction method according to another embodiment of the present invention.
도 4는 본 발명의 또 다른 실시예에 따른 웹 페이지 정보 추출 방법을 도시한 흐름도. 4 is a flowchart illustrating a web page information extraction method according to another embodiment of the present invention.
도 5는 본 발명의 일실시예에 따른 인터넷 바둑 서비스 방법을 도시한 흐름도.5 is a flowchart illustrating an Internet Go service method according to an embodiment of the present invention.
도 6은 본 발명의 또 다른 실시예에 따른 인터넷 바둑 서비스 시스템을 도시한 블록도. Figure 6 is a block diagram showing an Internet Go service system according to another embodiment of the present invention.
도 7은 본 발명의 또 다른 실시예에 따른 인터넷 바둑 서비스 시스템에 있어서, 출력부에 의해 웹 페이지 상에 제공되는 수형도의 일례를 도시한 도면. 7 is a view showing an example of a tree diagram provided on a web page by an output unit in the Internet Go service system according to another embodiment of the present invention.
도 8은 본 발명의 또 다른 실시예에 따른 인터넷 바둑 서비스 시스템을 도시한 블록도. 8 is a block diagram showing an Internet Go service system according to another embodiment of the present invention.
도 9는 본 발명의 또 다른 실시예에 따른 인터넷 바둑 서비스 시스템에 있어서, 바둑 문제 제공부에서 사용자에게 제공하는 바둑 문제 데이터 및 예시 답변 데이터의 일례를 도시한 도면.9 is a diagram illustrating an example of Go problem data and example answer data provided by a Go problem providing unit to a user in an Internet Go service system according to another embodiment of the present invention.
도 10은 본 발명에 따른 웹 페이지 정보 추출 장치, 인터넷 바둑 서비스 시스템 등을 구성하는 데 채용될 수 있는 범용 컴퓨터 시스템의 내부 블록도. 10 is an internal block diagram of a general-purpose computer system that can be employed to construct a web page information extraction apparatus, an Internet Go service system, and the like according to the present invention.
<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>
101 웹 스크래이핑 규칙 저장부101 Web scraping rule store
102 검색 로봇102 search robot
103 추출 데이터 저장부103 Extraction Data Storage
104 웹 스크래이핑 제어부104 Web Scraping Controls
105 관리자 통지부105 Manager Notification Division
106 예상 웹 스크래이핑 규칙 저장부Expected Web Scraping Rule Store
Claims (22)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2003-0029717A KR100481139B1 (en) | 2003-05-12 | 2003-05-12 | A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2003-0029717A KR100481139B1 (en) | 2003-05-12 | 2003-05-12 | A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040003120A Division KR20040098505A (en) | 2004-01-15 | 2004-01-15 | A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service |
KR10-2004-0044780A Division KR100482184B1 (en) | 2004-06-17 | 2004-06-17 | A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040097430A KR20040097430A (en) | 2004-11-18 |
KR100481139B1 true KR100481139B1 (en) | 2005-04-08 |
Family
ID=37375599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2003-0029717A KR100481139B1 (en) | 2003-05-12 | 2003-05-12 | A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100481139B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230089189A1 (en) * | 2020-07-22 | 2023-03-23 | Capital One Services, Llc | Systems and methods for retrieving online merchant terms of a merchant and associating the same with transactions |
-
2003
- 2003-05-12 KR KR10-2003-0029717A patent/KR100481139B1/en active IP Right Grant
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230089189A1 (en) * | 2020-07-22 | 2023-03-23 | Capital One Services, Llc | Systems and methods for retrieving online merchant terms of a merchant and associating the same with transactions |
Also Published As
Publication number | Publication date |
---|---|
KR20040097430A (en) | 2004-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9137322B2 (en) | System and method for providing electronic content | |
KR101418221B1 (en) | Non-transitory information processing device-readable storage medium, and information processing device | |
CN112672795B (en) | In-game resource presentation platform | |
CN110348991A (en) | Assess the method, apparatus and electronic equipment of user's accrediting amount upper limit | |
US10688397B2 (en) | Information processing device, non-transitory computer readable medium, and information processing method | |
KR101353531B1 (en) | Method of providing video guide, server performing the same and storage media storing the same | |
JP2007041886A (en) | Management plan preparation support device, its method and program for making computer perform its method | |
JP5556345B2 (en) | Display information selection device and display information selection program | |
JP2013045412A (en) | Voting terminal device, voting system, and voting method | |
KR100481139B1 (en) | A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service | |
KR100482184B1 (en) | A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service | |
KR102024213B1 (en) | Method for managing game using proficiency in game and apparatus thereof | |
WO2021011901A1 (en) | Systems and methods for video streaming analysis | |
KR20050096366A (en) | A method and system for providing online game | |
KR20040098505A (en) | A Method and Apparatus for Extracting Information from a Web Page and A system and Method for the Internet Paduk Service | |
JP5509126B2 (en) | Predictive power diagnosis apparatus and predictive power diagnosis method | |
KR102028733B1 (en) | User matching system for cooperative play | |
KR101182564B1 (en) | Method and system providing soccer game, soccer game server, using message broadcasting item and record media program for implement thereof | |
US20070078001A1 (en) | System for managing divided points in on-line and method thereof | |
KR102632577B1 (en) | Device and method to invite friend | |
KR20150016660A (en) | Method and server for implementing skill for game play | |
KR101215256B1 (en) | Method and apparatus for displaying item in online game | |
JP2014150981A (en) | System and method providing platform capable of providing a plurality of pieces of service | |
JP2009134633A (en) | Ranking prediction system | |
CN114969556B (en) | User personalization-based interest point presenting and interacting method and related device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A107 | Divisional application of patent | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120130 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20131224 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20151223 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20161227 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20181226 Year of fee payment: 15 |
|
FPAY | Annual fee payment |
Payment date: 20200102 Year of fee payment: 16 |