KR100942902B1 - A method of searching web page and computer readable recording media for recording the method program - Google Patents

A method of searching web page and computer readable recording media for recording the method program Download PDF

Info

Publication number
KR100942902B1
KR100942902B1 KR1020040003124A KR20040003124A KR100942902B1 KR 100942902 B1 KR100942902 B1 KR 100942902B1 KR 1020040003124 A KR1020040003124 A KR 1020040003124A KR 20040003124 A KR20040003124 A KR 20040003124A KR 100942902 B1 KR100942902 B1 KR 100942902B1
Authority
KR
South Korea
Prior art keywords
identifier
webpage
web page
category
site
Prior art date
Application number
KR1020040003124A
Other languages
Korean (ko)
Other versions
KR20040100857A (en
Inventor
배상용
최기정
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020040003124A priority Critical patent/KR100942902B1/en
Publication of KR20040100857A publication Critical patent/KR20040100857A/en
Application granted granted Critical
Publication of KR100942902B1 publication Critical patent/KR100942902B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C01INORGANIC CHEMISTRY
    • C01BNON-METALLIC ELEMENTS; COMPOUNDS THEREOF; METALLOIDS OR COMPOUNDS THEREOF NOT COVERED BY SUBCLASS C01C
    • C01B13/00Oxygen; Ozone; Oxides or hydroxides in general
    • C01B13/02Preparation of oxygen
    • C01B13/0203Preparation of oxygen from inorganic compounds
    • C01B13/0207Water

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Inorganic Chemistry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 다종 다양한 정보가 위치하는 인터넷 상에서 소정의 웹사이트에 대한 정보를 제공하기 위한 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for creating a database in a search system for providing information on a predetermined website on the Internet on which various kinds of information are located, and a search system including a created database.

본 발명의 일측면에 따른 검색 시스템에서 소정의 인덱스 페이지를 포함하는 데이터베이스를 작성하는 방법 - 상기 인덱스 페이지는 등록된 사이트의 범용 리소스 로케이터 필드, 이에 대응하는 사이트 식별자 필드, 상기 사이트에 포함된 웹페이지의 범용 리소스 로케이터 필드, 이에 대응하는 페이지 식별자 필드, 및 상기 웹페이지의 소스 파일 필드를 포함함 -, 검색 로봇을 제어하여 상기 등록된 사이트에 포함된 상기 웹페이지의 정보를 수집하고, 상기 웹페이지의 소스 파일을 취득하도록 하는 단계; 상기 수집된 정보 중에서 상기 등록된 사이트의 범용 리소스 로케이터를 추출하여 상기 인덱스 페이지의 상기 범용 리소스 로케이터 필드에 기록하고, 상기 등록된 사이트의 범용 리소스 로케이터에 소정의 사이트 식별자를 부여하여 이를 상기 사이트 식별자 필드에 기록하는 단계; 상기 수집된 정보 중에서 상기 사이트에 포함된 상기 웹페이지의 범용 리소스 로케이터를 추출하여 상기 인덱스 페이지의 상기 웹페이지의 범용 리소스 로케이터 필드에 기록하고, 상기 웹페이지의 범용 리소스 로케이터에 소정의 페이지 식별자를 부여하여 이를 상기 페이지 식별자 필드에 기록하는 단계; 상기 취득한 웹페이지 소스 파일을 상기 인덱스 페이지의 상기 웹페이지의 소스 파일 필드에 기록하는 단계를 포함하는 것을 특징으로 한다.A method for creating a database including a predetermined index page in a search system according to an aspect of the present invention, wherein the index page includes a universal resource locator field of a registered site, a corresponding site identifier field, and a web page included in the site. A general-purpose resource locator field of a corresponding field, a page identifier field corresponding thereto, and a source file field of the webpage, to control a search robot to collect information of the webpage included in the registered site, Obtaining a source file of the; The universal resource locator of the registered site is extracted from the collected information and recorded in the universal resource locator field of the index page, a predetermined site identifier is assigned to the universal resource locator of the registered site, and the site identifier field is assigned. Recording on; The universal resource locator of the web page included in the site is extracted from the collected information and recorded in the universal resource locator field of the web page of the index page, and a predetermined page identifier is assigned to the universal resource locator of the web page. Recording it in the page identifier field; And recording the obtained web page source file in a source file field of the web page of the index page.

검색 엔진, 웹사이트, 카테고리, 데이터베이스, 인덱스Search engine, website, category, database, index

Description

웹페이지 검색 방법 및 상기 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 {A METHOD OF SEARCHING WEB PAGE AND COMPUTER READABLE RECORDING MEDIA FOR RECORDING THE METHOD PROGRAM}FIELD OF SEARCHING WEB PAGE AND COMPUTER READABLE RECORDING MEDIA FOR RECORDING THE METHOD PROGRAM}

도 1은 검색 서비스를 제공하기 위한 검색 시스템의 일예를 도시한 도면이다.1 is a diagram illustrating an example of a search system for providing a search service.

도 2는 본 발명의 바람직한 일실시예에 따른 웹페이지 정보 데이터베이스의 인덱스 페이지 구조를 도시한 도면이다.2 is a diagram illustrating an index page structure of a web page information database according to an embodiment of the present invention.

도 3은 본 발명의 바람직한 일실시예에 따른 키워드 색인 데이터베이스의 인덱스 페이지 구조를 도시한 도면이다.3 is a diagram illustrating an index page structure of a keyword index database according to an embodiment of the present invention.

도 4는 본 발명의 바람직한 일실시예에 따른 카테고리 색인 데이터베이스의 인덱스 페이지 구조를 도시한 도면이다.4 illustrates an index page structure of a category index database according to an exemplary embodiment of the present invention.

도 5는 본 발명의 바람직한 일실시예에 따른 사이트 색인 데이터베이스의 인덱스 페이지 구조를 도시한 도면이다.5 illustrates an index page structure of a site index database according to an exemplary embodiment of the present invention.

도 6은 본 발명의 바람직한 일실시예에 따른 검색 시스템에서의 데이터베이스 작성 방법에 의해 작성된 데이터베이스를 이용한 카테고리 웹 문서 검색 서비스 제공 방법의 흐름을 도시한 흐름도이다.6 is a flowchart illustrating a method of providing a category web document search service using a database created by a database creation method in a search system according to an exemplary embodiment of the present invention.

도 7는 본 발명의 바람직한 일실시예에 따른 검색 시스템에서의 데이터베이 스 작성 방법에 의해 작성된 데이터베이스를 이용한 하위 카테고리 포함 웹 문서 검색 서비스 제공 방법의 흐름을 도시한 흐름도이다.7 is a flowchart illustrating a flow of a method for providing a sub-category web document search service using a database created by a database creation method in a search system according to an exemplary embodiment of the present invention.

도 8은 본 발명의 바람직한 일실시예에 따른 검색 시스템에서의 데이터베이스 작성 방법에 의해 작성된 데이터베이스를 이용한 사이트 내 키워드 검색 서비스 제공 방법의 흐름을 도시한 흐름도이다.8 is a flowchart illustrating a method of providing an in-site keyword search service using a database created by a database creation method in a search system according to an exemplary embodiment of the present invention.

도 9는 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법에서 채용될 수 있는 범용 컴퓨터 시스템의 내부 블록도이다.9 is an internal block diagram of a general-purpose computer system that can be employed in the database creation method in the search system according to the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

910 : 대용량 기억장치 920 : CD 롬910: mass storage device 920: CD ROM

930 : 입출력 인터페이스 940 : 프로세서930: input and output interface 940: processor

950 : 네트워크 인터페이스 960 : 램950: network interface 960: RAM

970 : 롬970 ROM

본 발명은 다종 다양한 정보가 위치하는 인터넷 상에서 소정의 웹사이트에 대한 정보를 제공하기 위한 검색 시스템에서의 데이터베이스의 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템에 관한 것이다. 더욱 상세하게는, 소정의 웹사이트에 대한 정보를 더욱 세밀하게 검색할 수 있도록 한 검색 시스템에서의 데이터베이스 작성 방법 및 상기 데이터베이스를 포함하는 검색 시스템에 관한 것 이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method of creating a database in a search system for providing information on a predetermined website on the Internet on which various kinds of information are located, and to a search system including a created database. More particularly, the present invention relates to a method of creating a database in a retrieval system that enables more detailed retrieval of information on a predetermined website, and a retrieval system including the database.

알타비스타(http://www.altavista.com), 라이코스(http://www.lycos. com), 야후(http://www.yahoo.com) 등과 같은 통상의 검색 엔진은 통상 웹사이트 정보를 소정의 기준에 따라 분류 및 저장하고 관리하기 위한 데이터베이스, 웹 상을 지속적으로 순회하면서 새로운 웹사이트 정보를 기계적으로 수집하기 위한 소프트웨어로 구현되는 검색 로봇(robot), 수집된 데이터를 데이터베이스화하여 상기 검색 엔진을 이용하는 이용자로 하여금 검색할 수 있도록 하는 검색 엔진 소프트웨어로 구성된다. 이러한 통상의 검색 엔진 서비스를 제공하기 위한 전체 시스템의 블록도가 도 1에 도시되어 있다. 도 1을 참조하면, 사용자는 사용자 단말기(110)를 통하여 인터넷을 통해 검색 엔진 서버(150)로 접속한다. 사용자가 소정의 검색어를 입력하면, 검색 엔진 서버(150)는 검색 엔진 소프트웨어(140)로 해당 검색어에 대한 웹사이트 정보를 쿼리(query)하고, 검색 엔진 소프트웨어(140)는 해당 데이터베이스(130)를 검색하여 소정의 웹사이트 정보를 알려 준다. 검색 로봇(120)는 상기 설명한 바와 같이, 웹 상을 지속적으로 순회하면서 웹 서버(160)로부터 새로운 웹사이트 정보를 기계적으로 수집하기 위한 소프트웨어로 구현되는 엔티티(entity)이다. 검색 로봇(120)는 네트워크 상에서 HTML(HyperText Markup Language)로 기술된 문장을 탐색하고, 기재되어 있는 링크처를 파싱(parsing)하여 네트워크 상에 존재하는 웹 서버(160)로부터 데이터를 수집한다. 이와 같이 검색 로봇(120)에 의해 수집된 데이터는 데이터베이스화되는데, 여기에서 데이터베이스화라 함은 웹사이트에 위치하는 소정의 정보에 대해 형태소 분석(morphological analysis)을 수행하 고, 인덱스 페이지를 작성하여 데이터베이스(130)에 저장하는 일련의 수순을 의미한다. 데이터베이스(130)는 검색 로봇(120)에 의해 수집된 모든 웹사이트 정보를 저장하기 위한 것이다. 검색 엔진 소프트웨어(140)는 검색 결과를 사용자에게 보여주는 기능을 한다. 이 소프트웨어는 데이터베이스(130)에 저장된 수많은 페이지를 검색하여 검색 결과물을 검색 용어와 일치되는 정확도의 순서로 나열하게 된다. 도 1에는 검색 서버(150)와 검색 엔진부(120, 130, 140)가 별개의 엔티티인 것처럼 도시되어 있으나 이는 설명의 편의를 위한 것일 뿐, 동일한 엔티티일 수 있다.Conventional search engines such as AltaVista (http://www.altavista.com), Lycos (http://www.lycos.com), Yahoo (http://www.yahoo.com), and the like, typically have website information. A database for classifying, storing, and managing the data according to predetermined criteria, a search robot implemented as software for mechanically collecting new website information while continuously circulating on the web, and storing the collected data as a database. It consists of search engine software that allows a user using a search engine to search. A block diagram of the overall system for providing such a conventional search engine service is shown in FIG. Referring to FIG. 1, a user accesses the search engine server 150 through the Internet through the user terminal 110. When a user enters a predetermined search term, the search engine server 150 queries the search engine software 140 for website information about the search term, and the search engine software 140 queries the corresponding database 130. Search and inform the website information. As described above, the search robot 120 is an entity implemented in software for mechanically collecting new website information from the web server 160 while continuously circulating on the web. The search robot 120 searches a sentence described in HyperText Markup Language (HTML) on a network, parses the described link destination, and collects data from the web server 160 existing on the network. As such, the data collected by the search robot 120 is made into a database. In this case, the database is performed by performing morphological analysis on predetermined information located on a website and creating an index page. It means a series of procedures to be stored in 130. The database 130 is for storing all website information collected by the search robot 120. Search engine software 140 functions to present search results to the user. The software searches numerous pages stored in the database 130 and lists the search results in order of accuracy matching the search terms. In FIG. 1, the search server 150 and the search engine unit 120, 130, and 140 are illustrated as separate entities, but for convenience of description, the same may be the same entity.

이와 같이 검색 로봇을 이용하여 수집된 소정의 웹사이트 정보를 가공하여 이를 사용자에게 제공하기 위한 다양한 방법이 개발되고 있는데, 이 중의 하나가 웹사이트를 소정의 분류로 카테고리화하고, 상기 카테고리 내에서만 검색을 수행하도록 함으로써 종래의 검색 서비스보다는 정밀한 검색이 수행되도록 하는 이른바 "카테고리(디렉토리) 검색" 서비스이다.As described above, various methods for processing predetermined website information collected using a search robot and providing the same to a user have been developed. One of them categorizes a website into a predetermined category and searches only within the category. It is a so-called "category (directory) search" service that allows a precise search to be performed rather than a conventional search service.

이와 같이 검색 범위가 협소하다는 점은 카테고리 검색이 갖고 있는 "제한적 검색을 통한 양질의 정보 수집"이라는 측면에서 어느 정도 그 효용이 인정될 수 있는 반면, 사용자 입장에서는 "다양한 정보의 검색"이라는 사용자의 요구를 충족시키지 못한다는 문제점이 있다.This narrow search range can be recognized to some extent in terms of category information "collecting high quality information through limited search", while from the user's point of view, "search for various information" There is a problem that does not meet the needs.

또한, 종래 기술에 따른 카테고리 검색 방법에 의하면, 사용자가 특정한 카테고리에 속하는 웹사이트의 정보는 검색할 수 있지만, 상기 카테고리에 포함된 하위 카테고리에 대한 정보는 해당 하위 카테고리로 이동하여야만 검색이 가능하다는 문제점이 있다. 이러한 문제점 때문에 검색에 능숙하지 못한 사용자가 자신이 찾 고자 하는 정보가 위치한 카테고리가 아닌 상위 또는 하위 카테고리에서 소정의 정보에 대한 검색을 하는 경우 검색의 정확도가 떨어지게 된다는 또 다른 문제점이 대두된다. In addition, according to the category search method according to the prior art, the user can search the information of the website belonging to a specific category, the information about the sub-category included in the category can be searched only if you move to the corresponding sub-category There is this. Because of these problems, another problem that the accuracy of the search becomes poor when a user who is not good at searching searches for predetermined information in the upper or lower category instead of the category in which the information he wants to find is located.

또한, 종래 기술에 따른 웹페이지 검색 제공 방법에 의하면, 사용자로부터 소정의 검색어를 입력 받아 이에 대응하는 다수의 웹사이트 정보를 상기 사용자에게 제공해 주지만, 상기 웹사이트 자체에 대한 검색 기능은 지원하고 있지 아니하다는 문제점이 있다.In addition, according to the related art, the webpage search providing method receives a predetermined search word from a user and provides the user with a plurality of website information corresponding thereto, but does not support a search function for the website itself. There is a problem.

예를 들어, 검색창에 "특허청"을 입력한 경우, 특허청에 대한 간단한 설명과 함께, 특허청의 범용 리소스 로케이터(www.kipo.go.kr)에 대한 정보만이 제공될 뿐이고, 특허청의 웹사이트 내에 포함된 소정의 문서를 검색하기 위해서는 특허청 웹사이트로 이동하여 특허청 웹사이트 내에 따로 구성되어 있는 소정의 검색창을 이용하여야 한다는 불편이 있다. For example, if you type "Patent Office" into the search box, only a brief description of the Office is provided, and only the information about the Office's universal resource locator (www.kipo.go.kr) is provided. In order to search for a predetermined document included therein, it is inconvenient to move to the JPO website and use a predetermined search box configured separately in the JPO website.

따라서, 상기와 같이 카테고리 검색 등의 정밀한 검색은 물론, 통상의 웹 문서 검색과 같이 사용자가 원하는 수준의 정보를 적절하게 제공할 수 있고, 소정의 웹사이트에 포함된 웹페이지의 검색 또한 가능한 검색 시스템이 구현될 수 있다면 검색 서비스를 이용하는 사용자의 편의가 극대화될 수 있음은 물론, 검색 서비스의 활용도도 크게 제고될 수 있을 것이다.Therefore, as well as a precise search such as category search as described above, it is possible to appropriately provide the level of information desired by the user, such as a normal web document search, search system that can also search the web page contained in a predetermined website If this can be implemented, the convenience of the user using the search service can be maximized, and the utilization of the search service can be greatly improved.

본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템은 상술한 문제점을 해결하고자 안출된 것으로서, 종래의 검색 서비스에서 제공되는 카테고리 검색 서비스를 보강하여 보다 많은 정보의 검색을 원하는 사용자의 요구에 부응하도록 하는 것을 그 목적으로 한다.The search system including the database creation method and the created database in the search system according to the present invention has been devised to solve the above-mentioned problems, and it is desired to search for more information by reinforcing the category search service provided by the conventional search service. The purpose is to meet the needs of users.

또한, 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템은 종래의 카테고리 검색 서비스에서 검색 범위가 해당 카테고리 영역 내라는 문제점을 해결하고, 해당 카테고리의 하위 카테고리에 대한 정보도 검색할 수 있는 검색 서비스를 제공할 수 있도록 하는 것을 그 목적으로 한다.In addition, the search system including the database creation method and the created database in the search system according to the present invention solves the problem that the search range is within the corresponding category area in the conventional category search service, and also the information on the sub-categories of the category Its purpose is to provide a search service that can be searched.

또한, 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템은 검색 서비스 사용자에게 더욱 폭넓은 검색 범위를 제공함으로써, 사용자의 검색 능력에 따라 사용자가 원하는 정보를 정확하게 검색할 수 있는 검색 서비스를 제공할 수 있도록 하는 것을 그 목적으로 한다.In addition, the search system including the database creation method and the created database in the search system according to the present invention provides a broader search range to the search service user, thereby accurately searching for the desired information according to the user's search ability. Its purpose is to make it possible to provide search services.

또한, 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템은 소정의 카테고리에 포함된 하나 이상의 하위 카테고리에 대한 웹페이지 검색을 가능하도록 함으로써, 검색 서비스 제공자의 검색 서비스 제공 범위를 더 넓힐 수 있도록 하는 것을 그 목적으로 한다.In addition, the database creation method and the search system including the created database in the search system according to the present invention enables the web page search for one or more sub-categories included in a predetermined category, thereby providing a search service provider's scope of search service provider The aim is to make it wider.

또한, 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템은 소정의 웹사이트에 포함된 하나 이상의 웹페이지에 대한 검색을 가능하게 함으로써, 검색 서비스 사용자 및 소정의 웹사이트 운영자의 편의를 도모하는 것을 그 목적으로 한다.In addition, a search system including a database creation method and a created database in a search system according to the present invention enables a search for one or more web pages included in a predetermined website, thereby providing a search service user and a predetermined website operator. Its purpose is to aim at convenience.

상술한 목적을 달성하기 위하여, 본 발명의 일측면에 따른 검색 시스템에서 소정의 인덱스 페이지를 포함하는 데이터베이스를 작성하는 방법 - 상기 인덱스 페이지는 등록된 사이트의 범용 리소스 로케이터 필드, 이에 대응하는 사이트 식별자 필드, 상기 사이트에 포함된 웹페이지의 범용 리소스 로케이터 필드, 이에 대응하는 페이지 식별자 필드, 및 상기 웹페이지의 소스 파일 필드를 포함함 -, 검색 로봇을 제어하여 상기 등록된 사이트에 포함된 상기 웹페이지의 정보를 수집하고, 상기 웹페이지의 소스 파일을 취득하도록 하는 단계; 상기 수집된 정보 중에서 상기 등록된 사이트의 범용 리소스 로케이터를 추출하여 상기 인덱스 페이지의 상기 범용 리소스 로케이터 필드에 기록하고, 상기 등록된 사이트의 범용 리소스 로케이터에 소정의 사이트 식별자를 부여하여 이를 상기 사이트 식별자 필드에 기록하는 단계; 상기 수집된 정보 중에서 상기 사이트에 포함된 상기 웹페이지의 범용 리소스 로케이터를 추출하여 상기 인덱스 페이지의 상기 웹페이지의 범용 리소스 로케이터 필드에 기록하고, 상기 웹페이지의 범용 리소스 로케이터에 소정의 페이지 식별자를 부여하여 이를 상기 페이지 식별자 필드에 기록하는 단계; 상기 취득한 웹페이지 소스 파일을 상기 인덱스 페이지의 상기 웹페이지의 소스 파일 필드에 기록하는 단계를 포함하는 것을 특징으로 한다.In order to achieve the above object, a method for creating a database including a predetermined index page in a search system according to an aspect of the present invention, wherein the index page is a universal resource locator field of a registered site, the corresponding site identifier field A universal resource locator field of a web page included in the site, a page identifier field corresponding thereto, and a source file field of the web page. Collecting information and acquiring a source file of the web page; The universal resource locator of the registered site is extracted from the collected information and recorded in the universal resource locator field of the index page, a predetermined site identifier is assigned to the universal resource locator of the registered site, and the site identifier field is assigned. Recording on; The universal resource locator of the web page included in the site is extracted from the collected information and recorded in the universal resource locator field of the web page of the index page, and a predetermined page identifier is assigned to the universal resource locator of the web page. Recording it in the page identifier field; And recording the obtained web page source file in a source file field of the web page of the index page.

또한, 본 발명의 일측면에 따른 검색 시스템은, 소정의 인덱스 페이지를 기록하고 있는 웹페이지 정보 데이터베이스; 소정의 키워드와, 상기 키워드를 포함하는 웹페이지의 범용 리소스 로케이터에 대응하는 페이지 식별자를 기록하고 있는 키워드 색인 데이터베이스; 및 등록된 웹사이트를 순회하여 상기 등록된 사이트에 포함된 상기 웹페이지의 정보를 수집하고, 상기 웹페이지의 소스 파일을 취득하는 검색 로봇을 포함하고, 상기 데이터베이스에 기록된 상기 인덱스 페이지는 등록된 사이트의 범용 리소스 로케이터 필드, 이에 대응하는 사이트 식별자 필드, 상기 사이트에 포함된 웹페이지의 범용 리소스 로케이터 필드, 이에 대응하는 페이지 식별자 필드, 및 상기 웹페이지의 소스 파일 필드를 포함하는 것을 특징으로 한다.In addition, a search system according to an aspect of the present invention, a web page information database for recording a predetermined index page; A keyword index database that records a predetermined keyword and a page identifier corresponding to the universal resource locator of the web page including the keyword; And a search robot for circulating a registered website to collect information of the web page included in the registered site, and to obtain a source file of the web page, wherein the index page recorded in the database is registered. And a universal resource locator field of a site, a site identifier field corresponding thereto, a universal resource locator field of a webpage included in the site, a page identifier field corresponding thereto, and a source file field of the webpage.

이하 첨부된 도면을 참조하여 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템에 대하여 상술한다.Hereinafter, a method of creating a database in a search system and a search system including a created database will be described in detail with reference to the accompanying drawings.

<데이터베이스 작성 방법><How to create a database>

본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 검색 시스템에 의하면, 소정의 검색 서비스를 제공하기 위하여 하나 이상의 데이터베이스를 작성하도록 동작한다. 또한, 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법에 따라 작성된 데이터베이스는 하나 이상의 인덱스 페이지를 포함한다.The database creation method and search system in the search system according to the present invention operate to create one or more databases to provide a predetermined search service. In addition, the database created according to the database creation method in the search system according to the present invention includes one or more index pages.

당업자라면 주지하는 바와 같이, 인덱싱(indexing)은 검색 로봇이 다수의 웹사이트를 순회하면서 수집한 데이터를 검색 엔진에서 검색이 수행될 수 있는 포멧으로 변환하는 것을 의미한다. 일반적으로 검색 엔진의 인덱싱은 어떤 전형적인 필드를 가지지 않고 검색 엔진에서 검색이 수행될 수 있을 정도로 데이터를 정리해 놓는 것을 의미한다. 그러나 검색 엔진의 인덱싱이 데이터베이스에서의 인덱싱과 거의 동일한 경우도 있는데, 알타비스타의 경우에는 웹 문서의 제목, 내용, URL 등을 특화시켜서 검색할 수 있도록 데이터를 인덱싱한다. 인덱스 페이지는 통상 URL(Uniform Resource Locator), 키워드, 속성 정보 등으로 구성된다. As will be appreciated by those skilled in the art, indexing refers to converting data collected by a search robot as it traverses multiple websites into a format in which a search can be performed in a search engine. In general, indexing by a search engine means having the data organized so that the search can be performed by the search engine without any typical fields. However, in some cases, indexing by search engines is almost the same as indexing in a database. In the case of AltaVista, the data is indexed so that it can be searched by specifying the title, content, and URL of the web document. The index page is generally composed of a Uniform Resource Locator (URL), keywords, attribute information, and the like.                     

도 2는 본 발명의 바람직한 일실시예에 따른 웹페이지 정보 데이터베이스의 인덱스 페이지 구조를 도시한 도면이다.2 is a diagram illustrating an index page structure of a web page information database according to an embodiment of the present invention.

도 2를 참조하면, 웹페이지 정보 데이터베이스에 기록되는 인덱스 페이지는 "사이트 식별자(ID)", "사이트 범용 리소스 로케이터(URL)", "사이트 제목(title)", "사이트 설명(description)", 사이트가 속하는 "카테고리 식별자(ID)", 상기 사이트에 포함된 하나 이상의 웹페이지의 "페이지 식별자(ID)", "웹페이지 범용 리소스 로케이터(URL)", 및 상기 "웹페이지에 포함된 하이퍼텍스트 마크업 언어(HTML) 데이터"의 필드를 포함할 수 있다.Referring to FIG. 2, index pages recorded in the webpage information database include "site identifier", "site universal resource locator (URL)", "site title", "site description", "Category identifier (ID)" to which the site belongs, "page identifier (ID)" of one or more webpages contained in the site, "webpage universal resource locator (URL)", and "hypertext contained in the webpage" Markup Language (HTML) Data "field.

도 2에 도시된 사이트 식별자(ID), 카테고리 식별자(ID), 페이지 식별자(ID) 등은 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법에서 임의로 부여할 수 있는 것으로서, 사이트 식별자(ID)는 다수의 사이트 중 하나의 사이트에만 대응되는, 상기 사이트를 식별할 수 있는 유일한 식별자라는 조건을 만족시키기만 하면 어떠한 형태의 코드라도 무방하다. 또한, 카테고리 식별자(ID) 또한 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법에서 이용되는 카테고리 분류 하나에 대응하는 유일한 식별자이고, 페이지 식별자(ID) 또한 웹사이트에 포함된 하나 이상의 웹페이지 각각에 대응하는 각 웹페이지에 대해 유일한 식별자라는 조건을 만족시키기만 하면 어떠한 형태의 코드라도 무방하다. Site identifiers (IDs), category identifiers (IDs), page identifiers (IDs), and the like shown in FIG. 2 may be arbitrarily assigned in a database creation method in a search system according to the present invention. Any form of code may be used as long as it satisfies the condition of being the only identifier that can identify the site, which corresponds to only one of the sites of. In addition, the category identifier (ID) is also a unique identifier corresponding to one category classification used in the database creation method in the search system according to the present invention, and the page identifier (ID) also corresponds to each of one or more web pages included in the website. Any form of code can be used as long as it satisfies the condition of a unique identifier for each web page.

도 2에 도시된 웹페이지 정보 데이터베이스에 기록되는 인덱스 페이지는 사이트 식별자로서 "sIDxxxxxx"이 부여되어 있고, 상기 사이트의 범용 리소스 로케이터는 "www.naver.com"이며, 사이트 제목은 "네이버", 사이트에 대한 설명은 "검색 사이트", 카테고리 식별자는 "cIDyyyyyy"이다. 또한 상기 사이트에는 하나 이상의 웹페이지가 포함될 수 있는데, 이러한 웹페이지 각각에 대하여 유일한 식별자로서 페이지 식별자를 부여한다. 도 2에는 페이지 식별자의 일예로 "pIDzzzzzz_1"이, 상기 페이지 식별자에 대응하는 웹페이지 범용 리소스 로케이터는 www.naver.com/xxx가, 상기 웹페이지에 포함된 하이퍼텍스트 마크업 언어 데이터는 "<title="naver">……"가 각각 기록되어 있다. The index page recorded in the webpage information database shown in Fig. 2 is given "sIDxxxxxx" as the site identifier, the universal resource locator of the site is "www.naver.com", and the site title is "Naver", the site. The description is "search site" and the category identifier is "cIDyyyyyy". The site may also include one or more web pages, each of which is assigned a page identifier as a unique identifier. 2, "pIDzzzzzz_1" is an example of a page identifier, www.naver.com/xxx is a web page universal resource locator corresponding to the page identifier, and hypertext markup language data included in the web page is " <title " = "naver"> …… "is recorded respectively.

도 2에 도시된 웹페이지 정보 데이터베이스에 기록되는 인덱스 페이지는 검색 로봇이 각 웹사이트를 순회하면서 기계적으로 수집한 데이터를 각 웹사이트 별로 분류하는 작업을 통해 작성될 수 있다. 먼저 특정 웹사이트에 대하여 상기 웹사이트에 포함된 웹페이지의 모든 정보를 다 수집하고, 상기 웹사이트에 대하여 사이트 식별자를 부여하여 상기 웹페이지 정보 데이터베이스의 인덱스 페이지에 기록하고, 상기 웹사이트의 범용 리소스 로케이터, 제목, 설명, 상기 웹사이트가 속하는 카테고리에 대한 카테고리 식별자를 각각 기록한다. 또한, 상기 웹사이트에 포함된 웹페이지 각각에 대하여 소정의 페이지 식별자를 부여하고, 상기 페이지 식별자로 식별되는 웹페이지에 대한 각종 정보를 상기 웹페이지 정보 데이터베이스의 인덱스 페이지에 기록함으로써 상기 웹페이지 정보 데이터베이스를 작성하는 것이 가능하다.The index page recorded in the web page information database shown in FIG. 2 may be created through a process of classifying data collected mechanically by each search website while the search robot traverses each website. First, all the information of the webpage included in the website is collected for a specific website, the site identifier is given to the website, and recorded in the index page of the webpage information database. Record the Locator, Title, Description, and Category Identifier for the category to which the website belongs. In addition, the web page information database is provided by assigning a predetermined page identifier to each of the web pages included in the website, and recording various information on the web page identified by the page identifier in an index page of the web page information database. It is possible to write.

도 3은 본 발명의 바람직한 일실시예에 따른 키워드 색인 데이터베이스의 인덱스 페이지 구조를 도시한 도면이다.3 is a diagram illustrating an index page structure of a keyword index database according to an embodiment of the present invention.

도 3을 참조하면, 본 발명에 따른 키워드 색인 데이터베이스에 기록되는 인 덱스 페이지는 소정의 "키워드" 필드와, 상기 키워드를 포함하고 있는 웹페이지의 "페이지 식별자" 필드를 포함하여 구성될 수 있다.Referring to FIG. 3, an index page recorded in a keyword index database according to the present invention may include a predetermined "keyword" field and a "page identifier" field of a web page including the keyword.

도 3에 도시된 키워드 색인 데이터베이스에 기록되는 인덱스 페이지에는 키워드로서 "특허"가, "특허"라는 키워드가 하이퍼텍스트 마크업 언어 데이터 내에 포함된 웹페이지의 페이지 식별자(pIDxxxxxx_3, pIDxxxxxx_7 등)가 각각 기록되어 있다.In the index page recorded in the keyword index database shown in FIG. 3, page identifiers (pIDxxxxxx_3, pIDxxxxxx_7, etc.) of web pages in which "patent" as a keyword and a keyword "patent" are included in hypertext markup language data are recorded, respectively. It is.

도 3에 도시된 키워드 색인 데이터베이스의 인덱스 페이지는 소정의 키워드를 선정하여 키워드 필드에 기록하고, 검색 로봇이 수집한 다수의 웹페이지의 HTML 소스를 분석하여 상기 키워드가 포함된 웹페이지의 페이지 식별자를 페이지 식별자 필드에 기록함으로써 작성될 수도 있고, 상기 웹페이지 정보 데이터베이스를 참조하여 "페이지 HTML" 필드에 있는 HTML 데이터를 분석하고, 특정 키워드를 포함하고 있는 페이지 식별자를 추출하여 상기 키워드 색인 데이터베이스의 상기 페이지 식별자 필드에 기록함으로써 작성될 수도 있다. 또한, 키워드 색인 데이터베이스 작성 방법의 또 다른 일예로서, 검색 로봇이 수집한 웹페이지의 HTML 데이터를 분석하여 형태소 분석(morphological analysis)을 수행하고, 소정의 키워드(일예로 명사 또는 고유 명사 등)를 추출하여 추출된 키워드를 상기 키워드 색인 데이터베이스의 인덱스 페이지의 키워드 필드에 기록하며, 상기 키워드가 포함되어 있는 웹페이지의 페이지 식별자를 상기 인덱스 페이지의 페이지 식별자 필드에 기록하는 방법도 가능하다. 상기 방법의 경우, 키워드가 1회 추출될 때 마다 키워드 색인 데이터베이스에 기록하도록 구현하는 것도 가능하고, 상기 키워드가 소정 회수 이상 추출될 때 상기 키워드를 키워드 색인 데이터베이스에 기록하도록 구현하는 것도 가능하다. 또한, 기존의 검색 엔진에서 이미 작성되어 있는 키워드 색인 데이터베이스를 이용하여 구현하는 것도 가능하다.The index page of the keyword index database shown in FIG. 3 selects a predetermined keyword and records the keyword in a keyword field, and analyzes HTML sources of a plurality of web pages collected by a search robot to determine the page identifier of the web page including the keyword. It may be created by recording in a page identifier field, or may analyze the HTML data in the "Page HTML" field by referring to the webpage information database, extract a page identifier containing a specific keyword, and then extract the page identifier in the page of the keyword index database. It can also be created by writing to the identifier field. In addition, as another example of a method of creating a keyword index database, HTML data of a web page collected by a search robot is analyzed to perform morphological analysis, and a predetermined keyword (eg, noun or proper noun, etc.) is extracted. The extracted keyword is recorded in a keyword field of an index page of the keyword index database, and a page identifier of a web page including the keyword is recorded in a page identifier field of the index page. In the case of the method, it is also possible to implement to record the keyword in the keyword index database every time a keyword is extracted, or to record the keyword in the keyword index database when the keyword is extracted more than a predetermined number of times. It is also possible to implement using a keyword index database that has already been created in existing search engines.

도 4는 본 발명의 바람직한 일실시예에 따른 카테고리 색인 데이터베이스의 인덱스 페이지 구조를 도시한 도면이다.4 illustrates an index page structure of a category index database according to an exemplary embodiment of the present invention.

도 4를 참조하면, 본 발명에 따른 카테고리 색인 데이터베이스의 인덱스 페이지는 소정의 "카테고리 식별자(ID)" 필드와, 상기 카테고리의 하위 카테고리에 대한 "하위 카테고리(Sub-category) 식별자" 필드와, 상기 카테고리 및/또는 상기 하위 카테고리에 속하는 "페이지 식별자" 필드를 포함하여 구성될 수 있다. 또한, 본 발명에 따른 또 다른 실시예에 의하면, 상기 인덱스 페이지는 하위 카테고리 식별자 필드를 포함하지 아니하고, 상기 하위 카테고리 식별자 또 다른 카테고리 식별자로서 카테고리 식별자 필드에 기록되도록 작성될 수도 있다.4, an index page of a category index database according to the present invention includes a predetermined "category identifier (ID)" field, a "sub-category identifier" field for a subcategory of the category, and And a " page identifier " field belonging to a category and / or the subcategory. In addition, according to another embodiment of the present invention, the index page does not include a lower category identifier field, and may be created to be recorded in a category identifier field as another category identifier.

도 4에 도시된 카테고리 색인 데이터베이스의 인덱스 페이지에는 카테고리 식별자로서 "cIDxxxxxx"가, "cIDxxxxxx"로 식별되는 카테고리의 하위 카테고리 식별자로서 "cIDyyyyyy"가, 상기 카테고리와 상기 하위 카테고리에 속하는 웹페이지의 페이지 식별자로서 "pIDxxxxxx_1, pIDxxxxxx_2 등"이 각각 기록되어 있다.In the index page of the category index database shown in FIG. 4, "cIDxxxxxx" is a category identifier and "cIDyyyyyy" is a subcategory identifier of a category identified by "cIDxxxxxx". "PIDxxxxxx_1, pIDxxxxxx_2, etc." are recorded respectively.

도 4에 도시된 카테고리 색인 데이터베이스의 인덱스 페이지는 소정의 카테고리를 선정하여 상기 카테고리를 식별하기 위한 카테고리 식별자를 기록하고, 상기 카테고리의 하위 카테고리를 선정하여 상기 하위 카테고리를 식별하기 위한 카테고리 식별자를 기록하며, 상기 하위 카테고리에 속하는 것으로 분류된 웹페이지 의 페이지 식별자를 각각 기록함으로써 작성될 수도 있고, 상술한 도 2에 도시된 웹페이지 정보 데이터베이스를 참조하여, 카테고리 식별자와, 상기 카테고리 식별자에 속하는 웹페이지의 페이지 식별자를 각각 추출하여 카테고리 색인 데이터베이스에 포함된 인덱스 페이지의 해당 필드에 기록함으로써 구축될 수도 있다. 본 발명의 일실시예에 의하면, 상기 하위 카테고리는 카테고리 명칭과 무관하게 하나의 하위 카테고리에는 하나의 카테고리 식별자가 부여된다. 즉, "스포츠>구기종목>축구"의 하위 카테고리로서의 "월드컵"이라는 카테고리는 "사회,문화>역사>스포츠> 구기종목>축구"의 하위 카테고리로서의 "월드컵"이라는 카테고리와 상이한 카테고리이고, 각각의 카테고리 식별자는 상이할 수 있다.The index page of the category index database shown in FIG. 4 selects a predetermined category, records a category identifier for identifying the category, selects a subcategory of the category, and records a category identifier for identifying the subcategory. Or by recording the page identifiers of the web pages classified as belonging to the sub-category, respectively, or by referring to the web page information database shown in FIG. 2 above, the category identifiers and the web pages belonging to the category identifiers. It may also be constructed by extracting each page identifier and writing it in the corresponding field of the index page included in the category index database. According to an embodiment of the present invention, one category identifier is assigned to one subcategory regardless of the category name. That is, the category "World Cup" as a subcategory of "Sports> Balls> Soccer" is different from the category "World Cup" as a subcategory of "Society, Culture> History> Sports> Balls> Soccer". The category identifiers may be different.

도 5는 본 발명의 바람직한 일실시예에 따른 사이트 색인 데이터베이스의 인덱스 페이지 구조를 도시한 도면이다.5 illustrates an index page structure of a site index database according to an exemplary embodiment of the present invention.

도 5를 참조하면, 본 발명에 따른 사이트 색인 데이터베이스의 인덱스 페이지는 소정의 "사이트 식별자(ID)" 필드와, 상기 사이트에 포함된 웹페이지에 대한 "페이지 식별자" 필드를 포함하여 구성될 수 있다.Referring to FIG. 5, an index page of a site index database according to the present invention may include a predetermined "site identifier" field and a "page identifier" field for a web page included in the site. .

도 5에 도시된 사이트 색인 데이터베이스의 인덱스 페이지에는 사이트 식별자로서 "sIDxxxxxx"가, "sIDxxxxxx"로 식별되는 사이트에 포함된 페이지 식별자로서 "pIDxxxxxx_1", "pIDxxxxxx_2" 등이 각각 기록되어 있다.In the index page of the site index database shown in Fig. 5, " sIDxxxxxx " as a site identifier and " pIDxxxxxx_1 ", " pIDxxxxxx_2 "

도 5에 도시된 사이트 색인 데이터베이스는 소정의 사이트를 선정하여 상기 사이트를 식별하기 위한 사이트 식별자를 부여하여 이를 인덱스 페이지의 사이트 식별자 필드에 기록하고, 상기 사이트에 포함된 웹페이지를 검색하여 상기 웹페이 지를 식별하기 위한 페이지 식별자를 부여하여 이를 인덱스 페이지에 기록함으로써 작성될 수도 있고, 상술한 도 2에 도시된 웹페이지 정보 데이터베이스를 참조하여 사이트 식별자와, 상기 사이트 식별자에 속하는 웹페이지의 페이지 식별자를 각각 추출하여 인덱스 페이지에 기록함으로써 작성될 수도 있다. The site index database shown in FIG. 5 selects a predetermined site, gives a site identifier for identifying the site, records it in a site identifier field of an index page, searches a webpage included in the site, and retrieves the webpage. It may be created by assigning a page identifier for identifying a site and recording it in an index page, and referring to the web page information database shown in FIG. 2 described above, a site identifier and a page identifier of a web page belonging to the site identifier, respectively. It may be created by extracting and writing to an index page.

도 2 내지 도 5에 도시된 웹페이지 정보 데이터베이스, 키워드 색인 데이터베이스, 카테고리 색인 데이터베이스, 및 사이트 색인 데이터베이스는 상술한 방법을 통하여 작성될 수 있고, 이하 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법에 따라 작성된 데이터베이스를 이용한 검색 서비스 제공 방법의 일예를 설명한다.The web page information database, keyword index database, category index database, and site index database shown in Figs. 2 to 5 may be created through the above-described method, and according to the method of creating a database in the search system according to the present invention. An example of a search service providing method using the created database will be described.

<카테고리 내 웹 문서 검색 방법><How to Search Web Documents in Categories>

도 6은 본 발명의 바람직한 일실시예에 따른 검색 시스템에서의 데이터베이스 작성 방법에 따라 작성된 데이터베이스를 이용한 카테고리 웹 문서 검색 서비스 제공 방법의 흐름을 도시한 흐름도이다.6 is a flowchart illustrating a method of providing a category web document search service using a database created according to a database creation method in a search system according to an exemplary embodiment of the present invention.

도 6을 참조하면, 본 발명의 바람직한 일실시예에 따른 카테고리 웹문서 검색 방법은 다음의 단계를 포함한다.Referring to Figure 6, the category web document search method according to an embodiment of the present invention includes the following steps.

웹페이지 정보 데이터베이스를 유지한다(단계 601). 상기 웹페이지 정보 데이터베이스는 상술한 도 2에 도시된 웹페이지 정보 데이터베이스일 수 있고, 웹페이지 정보 데이터베이스의 필드 중에서 소정의 필드만을 따로 추출하여 기록한 데이터베이스일 수 있다. 웹페이지 정보 데이터베이스에는 소정의 웹사이트에 포함된 웹페이지의 페이지 식별자와, 상기 웹페이지에 포함된 하이퍼텍스트 마크업 언 어 데이터가 기록될 수 있다. Maintain a database of web page information (step 601). The webpage information database may be the webpage information database shown in FIG. 2 described above, or may be a database in which only a predetermined field is extracted and recorded separately from the fields of the webpage information database. In the webpage information database, a page identifier of a webpage included in a predetermined website and hypertext markup language data included in the webpage may be recorded.

키워드 색인 데이터베이스를 유지한다(단계 602). 상기 키워드 색인 데이터베이스는 상술한 도 3에 도시된 키워드 색인 데이터베이스와 동일할 수 있다. 즉, 상기 키워드 색인 데이터베이스에는 소정의 키워드와, 상기 키워드를 포함하고 있는 소정의 웹페이지의 페이지 식별자가 각각 기록될 수 있다.Maintain a keyword index database (step 602). The keyword index database may be the same as the keyword index database shown in FIG. 3. That is, a predetermined keyword and a page identifier of a predetermined web page including the keyword may be recorded in the keyword index database.

카테고리 색인 데이터베이스를 유지한다(단계 603). 상기 카테고리 색인 데이터베이스는 상술한 도 4에 도시된 카테고리 색인 데이터베이스와 동일할 수 있다. 즉, 상기 카테고리 색인 데이터베이스에는 소정의 카테고리에 대응하는 카테고리 식별자와, 상기 카테고리에 속하는 것으로 분류된 웹페이지의 페이지 식별자가 기록될 수 있다. 도 4에 도시된 카테고리 색인 데이터베이스에는 하위 카테고리 식별자도 포함되어 있으나, 도 6에 도시된 본 발명에 따른 데이터베이스를 이용한 카테고리 웹 문서 검색 방법에서는 하위 카테고리 식별자는 기록되지 아니할 수 있다. Maintain a category index database (step 603). The category index database may be the same as the category index database shown in FIG. 4 described above. That is, a category identifier corresponding to a predetermined category and a page identifier of a web page classified as belonging to the category may be recorded in the category index database. Although the category index database shown in FIG. 4 also includes a subcategory identifier, the category category document search method using the database according to the present invention shown in FIG. 6 may not record the subcategory identifier.

상술한 단계 602 및 단계 603에서, 키워드 색인 데이터베이스와 카테고리 색인 데이터베이스는 상술한 웹페이지 정보 데이터베이스에서 파생된 데이터베이스로서, 본 발명의 또 다른 일실시예에 의하면 키워드 색인 데이터베이스와 카테고리 색인 데이터베이스는 별도의 데이터베이스 수단으로 따로 유지되지 아니하고 상술한 웹페이지 정보 데이터베이스를 이용하여 사용자의 검색 요청이 있을 경우 임시적으로 해당 필드를 추출하여 구성될 수도 있다.In steps 602 and 603 described above, the keyword index database and the category index database are derived from the webpage information database described above. According to another embodiment of the present invention, the keyword index database and the category index database are separate databases. It may be configured by temporarily extracting a corresponding field when a user's search request is made using the above-described webpage information database.

사용자로부터 소정의 키워드를 입력 받고(단계 604), 상기 사용자로부터 상 기 키워드에 대한 검색 조건으로서 소정의 카테고리 검색 요청을 수신한다(단계 605). 단계 604 및 단계 605는 소정의 시간 간격을 두고 수행될 수도 있고, 하나의 입력창에서 카테고리 검색 요청 및 소정의 키워드를 함께 입력 받아 동시에 해당 정보를 수신하는 것도 가능하다. 입력된 키워드에 따라, 상기 키워드 색인 데이터베이스를 참조하여 상기 키워드 색인 데이터베이스의 키워드 필드에 상기 입력된 키워드와 동일한 키워드가 있는지를 판단하고, 동일한 키워드에 대응하는 페이지 식별자(제1 페이지 식별자)를 추출한다(단계 606). 또한, 상기 사용자로부터 수신한 카테고리 검색 요청에 따라, 상기 카테고리 색인 데이터베이스를 참조하여 상기 카테고리 색인 데이터베이스의 카테고리 식별자 필드에 상기 수신된 카테고리 정보와 동일한 카테고리 식별자가 있는지를 판단하고, 동일한 카테고리 식별자에 대응하는 페이지 식별자(제2 페이지 식별자)를 추출한다(단계 607). 추출된 제1 및 제2 페이지 식별자는 그 일부는 동일한 것이 있을 수 있고, 일부는 상이한 것이 있을 수 있다. 추출된 제1 및 제2 페이지 식별자 중에서 공통된 페이지 식별자로 식별되는 웹페이지에는 상기 사용자가 입력한 키워드가 포함되어 있을 뿐 아니라, 사용자가 검색 대상으로 특정한 소정의 카테고리에도 속하는 것이므로, 사용자가 검색하고자 하는 웹페이지라고 판단할 수 있다. 이와 같이 제1 페이지 식별자와 제2 페이지 식별자 중에서 동일한 페이지 식별자를 얻기 위하여, 상기 제1 페이지 식별자와 상기 제2 페이지 식별자를 연산한다(단계 608). 본 발명의 바람직한 일실시예에 의하면 상기 연산 과정은 상기 제1 페이지 식별자와 상기 제2 페이지 식별자를 AND 연산하는 것이다. 즉, 상기 제1 페이지 식별자와 상기 제2 페이지 식 별자를 각각의 조합으로 AND 연산하는 경우, 상기 제1 페이지 식별자와 상기 제2 페이지 식별자 중에서 공통되는 페이지 식별자(제3 페이지 식별자)가 추출될 수 있다. 이러한 AND 연산에 있어서는 다양한 구현 방법이 있을 수 있다. 일예로 상기 페이지 식별자를 2진(binary) 데이터로 변환하여 양 2진 데이터를 AND 연산하도록 구현될 수도 있다.A predetermined keyword is input from the user (step 604), and a predetermined category search request is received from the user as a search condition for the keyword (step 605). Steps 604 and 605 may be performed at predetermined time intervals, or may receive a category search request and a predetermined keyword together in one input window and simultaneously receive corresponding information. According to the input keyword, it is determined whether the same keyword as the input keyword exists in the keyword field of the keyword index database by referring to the keyword index database, and a page identifier (first page identifier) corresponding to the same keyword is extracted. (Step 606). In addition, according to the category search request received from the user, it is determined whether a category identifier equal to the received category information exists in a category identifier field of the category index database by referring to the category index database, and corresponds to the same category identifier. The page identifier (second page identifier) is extracted (step 607). The extracted first and second page identifiers may have some of the same and some of them may be different. Since the web page identified by the common page identifier among the extracted first and second page identifiers includes not only the keyword inputted by the user, but also belongs to a predetermined category that the user is searching for, the user wants to search. It can be determined as a web page. In order to obtain the same page identifier among the first page identifier and the second page identifier, the first page identifier and the second page identifier are calculated (step 608). According to a preferred embodiment of the present invention, the operation is to AND the first page identifier and the second page identifier. That is, when ANDing the first page identifier and the second page identifier with each combination, a common page identifier (third page identifier) among the first page identifier and the second page identifier may be extracted. have. There may be various implementation methods for such an AND operation. For example, the page identifier may be implemented to perform an AND operation on both binary data by converting the page identifier into binary data.

단계 608에서 상기 제3 페이지 식별자가 얻어지면, 상기 웹페이지 정보 데이터베이스를 참조하여 상기 웹페이지 정보 데이터베이스의 페이지 식별자 필드에 기록된 페이지 식별자 중 제3 페이지 식별자와 동일한 페이지 식별자를 검색하고, 상기 페이지 식별자에 대응하는 웹페이지 정보를 추출한다(단계 609). 단계 609에서 추출된 웹페이지 정보(웹페이지에 포함된 HTML 데이터)를 이용하여 사용자 인터페이스 화면을 재구성하여 이를 사용자에게 제공한다(단계 610).If the third page identifier is obtained in step 608, a page identifier identical to a third page identifier among the page identifiers recorded in the page identifier field of the webpage information database is searched by referring to the webpage information database, and the page identifier is obtained. Extract web page information corresponding to step S609. The user interface screen is reconfigured using the webpage information (HTML data included in the webpage) extracted in step 609 and provided to the user (step 610).

<하위 카테고리 포함 웹 문서 검색 방법><How to retrieve web documents with subcategories>

도 7은 본 발명의 바람직한 일실시예에 따른 검색 시스템에서의 데이터베이스 작성 방법에 따라 작성된 데이터베이스를 이용한 하위 카테고리 포함 웹 문서 검색 방법의 흐름을 도시한 흐름도이다.7 is a flowchart illustrating a flow of a method for searching a sub-category web document using a database created according to a database creation method in a search system according to an exemplary embodiment of the present invention.

도 7을 참조하면, 본 발명의 바람직한 일실시예에 따른 데이터베이스를 이용한 하위 카테고리 포함 웹 문서 검색 방법은 다음의 단계를 포함한다.Referring to FIG. 7, the method of searching for a sub-category web document using a database according to an exemplary embodiment of the present invention includes the following steps.

본 발명에 따른 웹사이트 검색 서비스 제공 시스템은 웹페이지 정보 데이터베이스를 유지한다(단계 701). 단계 701은 상술한 도 6의 단계 601과 동일하다. 상술한 바와 같이, 웹페이지 정보 데이터베이스에는 소정의 웹사이트에 포함된 웹 페이지의 페이지 식별자와, 상기 웹페이지에 포함된 하이퍼텍스트 마크업 언어 데이터가 기록될 수 있다. The system for providing a website search service according to the present invention maintains a webpage information database (step 701). Step 701 is the same as step 601 of FIG. 6 described above. As described above, a page identifier of a web page included in a predetermined website and hypertext markup language data included in the web page may be recorded in the web page information database.

키워드 색인 데이터베이스를 유지한다(단계 702). 단계 702는 상술한 도 6의 단계 602와 동일하다. 상술한 바와 같이, 상기 키워드 색인 데이터베이스에는 소정의 키워드와, 상기 키워드를 포함하고 있는 소정의 웹페이지의 페이지 식별자가 각각 기록될 수 있다.Maintain a keyword index database (step 702). Step 702 is the same as step 602 of FIG. 6 described above. As described above, a predetermined keyword and a page identifier of a predetermined web page including the keyword may be recorded in the keyword index database.

카테고리 색인 데이터베이스를 유지한다(단계 703). 단계 703은 상술한 단계 도 6의 단계 603과 동일할 수 있다. 다만, 도 7에 도시된 방법에서, 상기 카테고리 색인 데이터베이스에는 소정의 카테고리 식별자와, 상기 카테고리 식별자로 식별되는 카테고리의 하위 카테고리에 대한 카테고리 식별자, 상기 카테고리에 속하는 것으로 분류된 웹페이지의 식별자가 기록될 수 있다.Maintain a category index database (step 703). Step 703 may be the same as step 603 of step 6 described above. However, in the method illustrated in FIG. 7, a category identifier, a category identifier for a subcategory of a category identified by the category identifier, and an identifier of a webpage classified as belonging to the category may be recorded in the category index database. Can be.

상술한 단계 702 및 단계 703에서, 키워드 색인 데이터베이스와 카테고리 색인 데이터베이스는 상술한 웹페이지 정보 데이터베이스에서 파생된 데이터베이스로서, 본 발명의 또 다른 일실시예에 의하면 키워드 색인 데이터베이스와 카테고리 색인 데이터베이스는 별도의 데이터베이스 수단으로 따로 유지되지 아니하고 상술한 웹페이지 정보 데이터베이스를 이용하여 사용자의 검색 요청이 있을 경우 임시적으로 해당 필드를 추출하여 구성될 수도 있다.In steps 702 and 703 described above, the keyword index database and the category index database are derived from the webpage information database described above. According to another embodiment of the present invention, the keyword index database and the category index database are separate databases. It may be configured by temporarily extracting a corresponding field when a user's search request is made using the above-described webpage information database.

사용자로부터 소정의 키워드를 입력 받고(단계 704), 상기 사용자로부터 상기 키워드에 대한 검색 조건으로서 소정의 카테고리 이하의 카테고리를 포함하는 검색 요청을 수신한다(단계 705). 단계 704 및 단계 705는 소정의 시간 간격을 두 고 수행될 수도 있고, 하나의 입력창에서 카테고리 검색 요청 및 소정의 키워드를 함께 입력 받아 동시에 해당 정보를 수신하는 것도 가능하다. 입력된 키워드에 따라, 상기 키워드 색인 데이터베이스를 참조하여 상기 키워드 색인 데이터베이스의 키워드 필드에 상기 입력된 키워드와 동일한 키워드가 있는지를 판단하고, 동일한 키워드에 대응하는 페이지 식별자(제1 페이지 식별자)를 추출한다(단계 706). 또한, 상기 사용자로부터 수신한 카테고리 검색 요청에 따라, 상기 카테고리 색인 데이터베이스를 참조하여 상기 카테고리 색인 데이터베이스의 카테고리 식별자 필드에 상기 수신된 카테고리 정보와 동일한 카테고리 식별자가 있는지 검색하고, 동일한 카테고리 식별자에 대응하는 페이지 식별자(제2 페이지 식별자)를 추출한다(단계 707). 또한, 상기 카테고리 정보의 하위 카테고리와 동일한 카테고리 식별자가 있는지 검색하고, 하위 카테고리 식별자에 대응하는 페이지 식별자(제3 페이지 식별자)를 추출한다(단계 708). 추출된 제1 및 제2 페이지 식별자 중에서 공통된 페이지 식별자(제4 페이지 식별자)로 식별되는 웹페이지에는 상기 사용자가 입력한 키워드가 포함되어 있을 뿐 아니라, 사용자가 검색 대상으로 특정한 소정의 카테고리에도 속하는 것이므로 사용자가 검색하고자 웹페이지라고 판단할 수 있다. 또한, 추출된 제1 및 제3 페이지 식별자 중에서 공통된 페이지 식별자(제5 페이지 식별자)로 식별되는 웹페이지에는 상기 사용자가 입력한 키워드가 포함되어 있을 뿐 아니라, 사용자가 검색 대상으로 특정한 소정의 카테고리의 하위 카테고리에도 속하는 것이므로 사용자가 검색하고자 하는 웹페이지라고 판단할 수 있다. 이와 같이 제1 페이지 식별자와 제2 페이지 식별자, 제1 페이지 식별자와 제3 페이지 식별 자 중에서 동일한 페이지 식별자(제4 및 제5 페이지 식별자)를 얻기 위하여, 상기 제1 페이지 식별자와 상기 제2 페이지 식별자를 연산하고(단계 709), 상게 제1 페이지 식별자와 상기 제3 페이지 식별자를 연산한다(단계 710). 본 발명의 바람직한 일실시예에 의하면 상기 연산 과정은 상기 제1 페이지 식별자와 상기 제2 또는 제3 페이지 식별자를 AND 연산하는 것이다. 즉, 상기 제1 페이지 식별자와 상기 제2 페이지 식별자를 각각의 조합으로 AND 연산하는 경우, 상기 제1 페이지 식별자와 상기 제2 페이지 식별자 중에서 공통되는 페이지 식별자(제4 페이지 식별자)가 추출될 수 있다. 동일하게, 상기 제1 페이지 식별자와 상기 제3 페이지 식별자 중에서 공통되는 페이지 식별자(제5 페이지 식별자)가 추출될 수 있다.A user inputs a predetermined keyword from the user (step 704), and receives a search request including a category below a predetermined category as a search condition for the keyword from the user (step 705). Steps 704 and 705 may be performed at predetermined time intervals, or may receive a category search request and a predetermined keyword together in one input window and simultaneously receive corresponding information. According to the input keyword, it is determined whether the same keyword as the input keyword exists in the keyword field of the keyword index database by referring to the keyword index database, and a page identifier (first page identifier) corresponding to the same keyword is extracted. (Step 706). In addition, according to the category search request received from the user, by referring to the category index database, the category identifier field of the category index database searches whether the same category identifier as the received category information exists, and the page corresponding to the same category identifier. The identifier (second page identifier) is extracted (step 707). In addition, it is searched whether there is a category identifier identical to a subcategory of the category information, and a page identifier (third page identifier) corresponding to the subcategory identifier is extracted (step 708). Since the web page identified by the common page identifier (fourth page identifier) among the extracted first and second page identifiers includes not only the keyword inputted by the user, but also belongs to a predetermined category specified by the user as a search target. The user may determine that the web page is a search. In addition, the web page identified by the common page identifier (fifth page identifier) among the extracted first and third page identifiers includes not only the keyword inputted by the user, but also a predetermined category of the user specified as a search target. Since it belongs to a subcategory, it can be determined that the user is a web page to be searched. As such, the first page identifier and the second page identifier are used to obtain the same page identifier (the fourth and fifth page identifiers) among the first page identifier, the second page identifier, the first page identifier, and the third page identifier. (Step 709), and computes the first page identifier and the third page identifier (step 710). According to a preferred embodiment of the present invention, the operation is to AND the first page identifier and the second or third page identifier. That is, when ANDing the first page identifier and the second page identifier with each combination, a common page identifier (fourth page identifier) among the first page identifier and the second page identifier may be extracted. . Similarly, a page identifier (a fifth page identifier) that is common among the first page identifier and the third page identifier may be extracted.

단계 709 내지 단계 710에서 상기 제4 및 상기 제5 페이지 식별자가 얻어지면, 상기 웹페이지 정보 데이터베이스를 참조하여 상기 웹페이지 정보 데이터베이스의 페이지 식별자 필드에 기록된 페이지 식별자 중 제4 또는 제5 페이지 식별자와 동일한 페이지 식별자를 검색하고, 상기 페이지 식별자에 대응하는 웹페이지 정보를 추출한다(단계 711). 단계 711에서 추출된 웹페이지 정보(웹페이지에 포함된 HTML 데이터)를 이용하여 사용자 인터페이스 화면을 재구성하여 이를 사용자에게 제공한다(단계 712). 단계 712에서 사용자 인터페이스 화면을 재구성하는 단계는 현재 카테고리에서 검색된 웹페이지 정보를 우선 순위를 두어 표시하고, 현재 카테고리의 하위 카테고리에서 검색된 웹페이지 정보를 후 순위로 표시하도록 구현될 수 있다.If the fourth and fifth page identifiers are obtained in steps 709 to 710, the fourth and fifth page identifiers among the page identifiers recorded in the page identifier field of the webpage information database with reference to the webpage information database; The same page identifier is retrieved, and webpage information corresponding to the page identifier is extracted (step 711). The user interface screen is reconfigured using the webpage information (HTML data included in the webpage) extracted in step 711 and provided to the user (step 712). Reconstructing the UI screen in operation 712 may be implemented to display the webpage information searched in the current category with priority, and to display the webpage information searched in the subcategory of the current category in a subsequent order.

<사이트 내 웹 문서 검색 방법> <How to search web documents on site>                     

도 8은 본 발명의 바람직한 일실시예에 따른 검색 시스템에서의 데이터베이스 작성 방법에 따라 작성된 데이터베이스를 이용한 사이트 내 웹 문서 검색 방법의 흐름을 도시한 흐름도이다.8 is a flowchart illustrating a flow of a method for searching a web document in a site using a database created according to a database creation method in a search system according to an exemplary embodiment of the present invention.

도 8을 참조하면, 본 발명의 바람직한 일실시예에 따른 데이터베이스를 이용한 사이트 내 웹 문서 검색 방법은 다음의 단계를 포함한다.Referring to FIG. 8, a method for searching a web document in a site using a database according to an exemplary embodiment of the present invention includes the following steps.

웹페이지 정보 데이터베이스를 유지한다(단계 801). 상기 웹페이지 정보 데이터베이스는 상술한 도 6 및 도 7의 웹페이지 정보 데이터베이스와 동일할 수 있다.Maintain a webpage information database (step 801). The webpage information database may be the same as the webpage information database of FIGS. 6 and 7 described above.

키워드 색인 데이터베이스를 유지한다(단계 802). 상기 키워드 색인 데이터베이스는 상술한 도 6 및 도 7의 키워드 색인 데이터베이스와 동일할 수 있다.Maintain a keyword index database (step 802). The keyword index database may be the same as the keyword index database of FIGS. 6 and 7 described above.

사이트 색인 데이터베이스를 유지한다(단계 803). 상기 사이트 색인 데이터베이스는 상술한 도 5에 도시된 사이트 색인 데이터베이스일 수 있고, 도 2에 도시된 웹페이지 정보 데이터베이스의 필드 중에서 소정의 필드만을 따로 추출하여 기록한 데이터베이스일 수 있다. 사이트 색인 데이터베이스에는 소정의 웹사이트에 대응하는 웹사이트 식별자와, 상기 웹사이트에 포함된 웹페이지의 페이지 식별자가 기록될 수 있다. 이러한 사이트 색인 데이터베이스의 일예는 도 5에서 상술한 바와 같다. Maintain a site index database (step 803). The site index database may be the site index database shown in FIG. 5 described above, or may be a database in which only a predetermined field is extracted and recorded separately from the fields of the web page information database shown in FIG. 2. In the site index database, a website identifier corresponding to a predetermined website and a page identifier of a web page included in the website may be recorded. An example of such a site index database has been described above with reference to FIG. 5.

상술한 단계 802 및 단계 803에서, 키워드 색인 데이터베이스와 사이트 색인 데이터베이스는 도 2에서 상술한 웹페이지 정보 데이터베이스에서 파생된 데이터베이스로서, 본 발명의 또 다른 일실시예에 의하면 키워드 색인 데이터베이스와 사이 트 색인 데이터베이스는 별도의 데이터베이스 수단으로 따로 유지되지 아니하고 상술한 웹사이트 내 웹페이지 데이터베이스를 이용하여 사용자의 검색 요청이 있을 경우 임시적으로 해당 필드를 추출하여 구성될 수도 있다.In steps 802 and 803 described above, the keyword index database and the site index database are databases derived from the webpage information database described above with reference to FIG. 2, and according to another embodiment of the present invention, the keyword index database and the site index database are provided. Although not separately maintained as a separate database means, when a user's search request is made using the above-described webpage database in the website, the corresponding field may be temporarily extracted.

사용자로부터 웹사이트 검색 요청을 수신하고(단계 804), 상기 사용자로부터 소정의 키워드를 입력 받는다(단계 805). 검색 요청에서 특정된 사이트에 대하여 상기 사이트 색인 데이터베이스를 참조하여 상기 웹사이트에 포함된 웹페이지의 페이지 식별자(제1 페이지 식별자)를 추출한다(단계 806). 또한, 입력된 키워드에 따라, 상기 키워드 색인 데이터베이스를 참조하여 상기 키워드 색인 데이터베이스의 키워드 필드에 상기 입력된 키워드와 동일한 키워드가 있는지를 판단하고, 동일한 키워드에 대응하는 페이지 식별자(제2 페이지 식별자)를 추출한다(단계 807). 추출된 제1 및 제2 페이지 식별자는 그 일부는 동일한 것이 있을 수 있고, 일부는 상이한 것이 있을 수 있다. 추출된 제1 및 제2 페이지 식별자 중에서 공통된 페이지 식별자로 식별되는 웹페이지는 상기 사용자가 요청한 웹사이트에 포함된 웹페이지일 뿐 아니라, 사용자가 입력한 키워드가 포함되어 있는 웹페이지이므로, 사용자가 검색하고자 하는 웹페이지라고 판단할 수 있다. 이와 같이 제1 페이지 식별자와 제2 페이지 식별자 중에서 동일한 페이지 식별자를 얻기 위하여, 상기 제1 페이지 식별자와 상기 제2 페이지 식별자를 연산한다(단계 808). 본 발명의 바람직한 일실시예에 의하면 상기 연산 과정은 상기 제1 페이지 식별자와 상기 제2 페이지 식별자를 AND 연산하는 것이다. A website search request is received from the user (step 804), and a predetermined keyword is input from the user (step 805). The page identifier (first page identifier) of the web page included in the website is extracted for the site specified in the search request (step 806). Further, according to the input keyword, it is determined whether the same keyword as the input keyword exists in the keyword field of the keyword index database by referring to the keyword index database, and a page identifier (second page identifier) corresponding to the same keyword is determined. Extract (step 807). The extracted first and second page identifiers may have some of the same and some of them may be different. The web page identified by the common page identifier among the extracted first and second page identifiers is not only a web page included in the website requested by the user, but also a web page including a keyword input by the user. It can be determined that the web page to be. In order to obtain the same page identifier among the first page identifier and the second page identifier, the first page identifier and the second page identifier are calculated (step 808). According to a preferred embodiment of the present invention, the operation is to AND the first page identifier and the second page identifier.

단계 808에서 상기 제3 페이지 식별자가 얻어지면, 상기 웹페이지 정보 데이 터베이스를 참조하여 상기 웹페이지 정보 데이터베이스의 페이지 식별자 필드에 기록된 페이지 식별자 중 제3 페이지 식별자와 동일한 페이지 식별자를 검색하고, 상기 페이지 식별자에 대응하는 웹페이지 정보를 추출한다(단계 809). 단계 809에서 추출된 웹페이지 정보(웹페이지에 포함된 HTML 데이터)를 이용하여 사용자 인터페이스 화면을 재구성하여 이를 사용자에게 제공한다(단계 810).When the third page identifier is obtained in step 808, the same page identifier as the third page identifier is searched among the page identifiers recorded in the page identifier field of the webpage information database with reference to the webpage information database. Web page information corresponding to the page identifier is extracted (step 809). The user interface screen is reconfigured using the webpage information (HTML data included in the webpage) extracted in step 809 and provided to the user (step 810).

또한 본 발명의 실시예들은 다양한 컴퓨터로 구현될 수 있는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.Embodiments of the invention also include computer readable media containing program instructions for performing operations that may be implemented by various computers. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. The medium may be a transmission medium such as an optical or metal line, a wave guide, or the like, including a carrier wave for transmitting a signal designating a program command, a data structure, or the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.

도 9는 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 검색 시스템에서의 데이터베이스에서 채용될 수 있는 범용 컴퓨터 시스템의 내부 블록도이다.9 is an internal block diagram of a general purpose computer system that may be employed in a database creation method in a search system and a database in a search system in accordance with the present invention.

컴퓨터 시스템은 램(RAM: Random Access Memory)(960)과 롬(ROM: Read Only Memory)(970)을 포함하는 주기억장치와 연결되는 하나 이상의 프로세서(940)를 포함한다. 프로세서(940)는 중앙처리장치(CPU)로 불리기도 한다. 당업계에서 널리 알려져 있는 바와 같이, 롬(970)은 데이터(data)와 명령(instruction)을 단방향성으로 CPU에 전달하는 역할을 하며, 램(960)은 통상적으로 데이터와 명령을 양방향성으로 전달하는 데 사용된다. 램(960) 및 롬(970)은 컴퓨터 판독 가능 매체의 어떠한 적절한 형태를 포함할 수 있다. 대용량 기억장치(Mass Storage)(910)는 양방향성으로 프로세서(940)와 연결되어 추가적인 데이터 저장 능력을 제공하며, 상기된 컴퓨터 판독 가능 기록 매체 중 어떠한 것일 수 있다. 대용량 기억장치(910)는 프로그램, 데이터 등을 저장하는데 사용되며, 통상적으로 주기억장치보다 속도가 느린 하드디스크와 같은 보조기억장치이다. CD 롬(920)과 같은 특정 대용량 기억장치가 사용될 수도 있다. 프로세서(940)는 비디오 모니터, 트랙볼, 마우스, 키보드, 마이크로폰, 터치스크린 형 디스플레이, 카드 판독기, 자기 또는 종이 테이프 판독기, 음성 또는 필기 인식기, 조이스틱, 또는 기타 공지된 컴퓨터 입출력장치와 같은 하나 이상의 입출력 인터페이스(930)와 연결된다. 마지막으로, 프로세서(940)는 네트워크 인터페이스(950)를 통하여 유선 또는 무선 통신 네트워크에 연결될 수 있다. 이러한 네트워크 연결을 통하여 상기된 방법의 절차를 수행할 수 있다. 상기된 장치 및 도구는 컴퓨터 하드웨어 및 소프트웨어 기술 분야의 당업자에게 잘 알려져 있다.The computer system includes one or more processors 940 coupled with a main memory including random access memory (RAM) 960 and read only memory (ROM) 970. The processor 940 is also called a central processing unit (CPU). As is well known in the art, the ROM 970 serves to pass data and instructions to the CPU unidirectionally, and the RAM 960 typically transfers data and instructions bidirectionally. Used to. RAM 960 and ROM 970 may include any suitable form of computer readable media. Mass storage 910 is bidirectionally coupled to processor 940 to provide additional data storage capabilities and may be any of the computer readable recording media described above. The mass storage device 910 is used to store programs, data, and the like, and is typically an auxiliary memory device such as a hard disk which is slower than the main memory device. Certain mass storage devices such as CD ROM 920 may be used. The processor 940 may include one or more input / output interfaces such as video monitors, trackballs, mice, keyboards, microphones, touchscreen displays, card readers, magnetic or paper tape readers, voice or handwriting readers, joysticks, or other known computer input / output devices. 930 is connected. Finally, the processor 940 may be connected to a wired or wireless communication network through the network interface 950. Through this network connection, the procedure of the method described above can be performed. The apparatus and tools described above are well known to those skilled in the computer hardware and software arts.

상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수도 있다.The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention.

본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템에 의하면, 종래의 검색 서비스에서 제공되는 카테고리 검색 서비스를 보강하여 보다 많은 정보의 검색을 원하는 사용자의 요구에 부응하도록 할 수 있다는 효과를 얻을 수 있다.According to the retrieval system including the database creation method and the created database in the retrieval system according to the present invention, the category retrieval service provided by the conventional retrieval service can be augmented to meet the needs of users who want to retrieve more information. You can get the effect.

또한, 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템에 의하면, 종래의 카테고리 검색 서비스에서 검색 범위가 해당 카테고리 영역 내라는 문제점을 해결하고, 해당 카테고리의 하위 카테고리에 대한 정보도 검색할 수 있는 검색 서비스를 제공할 수 있다는 효과를 얻을 수 있다.Further, according to the present invention, a method for creating a database and a search system including a created database solves a problem that a search range is within a corresponding category area in a conventional category search service, and The effect of providing a search service that can also search for information can be obtained.

또한, 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템에 의하면, 검색 서비스 사용자에게 더욱 폭넓은 검색 범위를 제공함으로써, 사용자의 검색 능력에 따라 사용자가 원하는 정보를 정확하게 검색할 수 있는 검색 서비스를 제공할 수 있다는 효과를 얻을 수 있다.In addition, according to the search system including the database creation method and the created database in the search system according to the present invention, by providing a broader search range to the search service user, according to the user's search ability to accurately search for information desired by the user The effect of providing a search service can be obtained.

또한, 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템에 의하면, 소정의 카테고리에 포함된 하나 이상의 하위 카테고리에 대한 웹페이지 검색을 가능하도록 함으로써, 검색 서비스 제공자의 검색 서비스 제공 범위를 더 넓힐 수 있다는 효과를 얻을 수 있다.In addition, according to the search method including a database creation method and the created database in the search system according to the present invention, by enabling the web page search for one or more sub-categories included in a predetermined category, the search service of the search service provider It is possible to obtain an effect of broadening the coverage.

또한, 본 발명에 따른 검색 시스템에서의 데이터베이스 작성 방법 및 작성된 데이터베이스를 포함하는 검색 시스템에 의하면, 소정의 웹사이트에 포함된 하나 이상의 웹페이지에 대한 검색을 가능하게 함으로써, 검색 서비스 사용자 및 소정의 웹사이트 운영자의 편의를 도모할 수 있다는 효과를 얻을 수 있다.In addition, according to the search system including a database creation method and the created database in the search system according to the present invention, it is possible to search for one or more web pages included in a predetermined website, thereby providing a search service user and a predetermined web. It is possible to obtain the effect that the convenience of the site administrator can be achieved.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 상기 기재로부터 다양한 수정 및 변형이 가능하다는 점은 자명하다. 따라서, 본 발명 사상은 아래에 기재된 특허 청구 범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.As described above, although the present invention has been described by way of limited embodiments and drawings, the present invention is not limited to the above-described embodiments, which can be variously modified and modified by those skilled in the art to which the present invention pertains. It is obvious that modifications are possible. Accordingly, the spirit of the present invention should be understood only by the claims set forth below, and all equivalent or equivalent modifications thereof will belong to the scope of the present invention.

Claims (14)

사이트에 포함된 웹페이지에 대한 제1 검색 요청을 수신하는 단계;Receiving a first search request for a webpage included in a site; 키워드를 포함하는 웹페이지에 대한 제2 검색 요청을 수신하는 단계; Receiving a second search request for a webpage containing a keyword; 상기 제1 검색 요청에 대응하여 사이트 색인 데이터베이스로부터 상기 사이트에 포함된 웹페이지에 대한 제1 웹페이지 식별자를 추출하는 단계;Extracting a first webpage identifier for a webpage included in the site from a site index database in response to the first search request; 상기 제2 검색 요청에 대응하여 키워드 색인 데이터베이스로부터 상기 키워드를 포함하는 웹페이지에 대한 제2 웹페이지 식별자를 추출하는 단계;Extracting a second webpage identifier for the webpage containing the keyword from a keyword index database in response to the second search request; 상기 제1 웹페이지 식별자 및 상기 제2 웹페이지 식별자를 이용하여 공통된 웹페이지 식별자를 생성하는 단계; 및Generating a common webpage identifier using the first webpage identifier and the second webpage identifier; And 웹페이지 정보 데이터베이스로부터 상기 공통된 웹페이지 식별자에 따른 웹페이지 정보를 추출하는 단계Extracting web page information according to the common web page identifier from a web page information database; 를 포함하고,Including, 상기 웹페이지 정보 데이터베이스는,The web page information database, 소정의 사이트에 포함된 적어도 하나의 웹페이지에 대한 인덱스 페이지로 구성된 것을 특징으로 하는 웹페이지 검색 방법.Web page search method comprising an index page for at least one web page included in a predetermined site. 키워드를 포함하는 웹페이지에 대한 제1 검색 요청을 수신하는 단계;Receiving a first search request for a webpage containing a keyword; 상기 키워드에 대한 검색 조건인 카테고리에 속하는 웹페이지에 대한 제2 검색 요청을 수신하는 단계;Receiving a second search request for a webpage belonging to a category that is a search condition for the keyword; 상기 제1 검색 요청에 대응하여 키워드 색인 데이터베이스로부터 상기 키워드를 포함하는 웹페이지에 대한 제1 웹페이지 식별자를 추출하는 단계;Extracting a first webpage identifier for a webpage containing the keyword from a keyword index database in response to the first search request; 상기 제2 검색 요청에 대응하여 카테고리 색인 데이터베이스로부터 상기 카테고리에 속하는 웹페이지에 대한 제2 웹페이지 식별자를 추출하는 단계;Extracting a second webpage identifier for a webpage belonging to the category from a category index database in response to the second search request; 상기 제1 웹페이지 식별자 및 상기 제2 웹페이지 식별자를 이용하여 공통된 웹페이지 식별자를 생성하는 단계; 및Generating a common webpage identifier using the first webpage identifier and the second webpage identifier; And 웹페이지 정보 데이터베이스로부터 상기 공통된 웹페이지 식별자에 따른 웹페이지 정보를 추출하는 단계Extracting web page information according to the common web page identifier from a web page information database; 를 포함하고,Including, 상기 웹페이지 정보 데이터베이스는,The web page information database, 소정의 사이트에 포함된 적어도 하나의 웹페이지에 대한 인덱스 페이지로 구성된 것을 특징으로 하는 웹페이지 검색 방법.Web page search method comprising an index page for at least one web page included in a predetermined site. 키워드가 포함된 웹페이지에 대한 제1 검색 요청을 수신하는 단계;Receiving a first search request for a webpage including a keyword; 상기 키워드에 대한 검색 조건인 카테고리의 하위 카테고리에 속하는 웹페이지에 대한 제2 검색 요청을 수신하는 단계; 및Receiving a second search request for a webpage belonging to a subcategory of a category that is a search condition for the keyword; And 상기 제1 검색 요청에 대응하여 키워드 색인 데이터베이스로부터 상기 키워드가 포함된 웹페이지에 대한 제1 웹페이지 식별자를 추출하는 단계;Extracting a first webpage identifier for a webpage including the keyword from a keyword index database in response to the first search request; 상기 제2 검색 요청에 대응하여 카테고리 색인 데이터베이스로부터 상기 카테고리에 속하는 웹페이지에 대한 제2 웹페이지 식별자 및 상기 하위 카테고리에 속하는 웹페이지에 대한 제3 웹페이지 식별자를 추출하는 단계;Extracting a second webpage identifier for a webpage belonging to the category and a third webpage identifier for a webpage belonging to the subcategory from a category index database in response to the second search request; 상기 제1 웹페이지 식별자 및 상기 제2 웹페이지 식별자와 공통된 제4 웹페이지 식별자를 생성하는 단계;Generating a fourth webpage identifier in common with the first webpage identifier and the second webpage identifier; 상기 제1 웹페이지 식별자 및 상기 제3 웹페이지 식별자와 공통된 제5 웹페이지 식별자를 생성하는 단계; 및Generating a fifth webpage identifier in common with the first webpage identifier and the third webpage identifier; And 웹페이지 정보 데이터베이스로부터 상기 공통된 제4 웹페이지 식별자 및 상기 공통된 제5 웹페이지 식별자에 따른 웹페이지 정보를 추출하는 단계Extracting web page information according to the common fourth web page identifier and the common fifth web page identifier from a web page information database; 를 포함하고,Including, 상기 웹페이지 정보 데이터베이스는,The web page information database, 소정의 사이트에 포함된 적어도 하나의 웹페이지에 대한 인덱스 페이지로 구성된 것을 특징으로 하는 웹페이지 검색 방법.Web page search method comprising an index page for at least one web page included in a predetermined site. 삭제delete 삭제delete 제1항 내지 제3항 중 어느 하나의 항에 있어서,The method according to any one of claims 1 to 3, 상기 인덱스 페이지는,The index page, 상기 소정의 사이트에 대한 사이트 식별자, 상기 적어도 하나의 웹페이지 각각에 대한 웹페이지 식별자, 상기 소정의 사이트와 관련된 사이트 데이터 및 상기 적어도 하나의 웹페이지 각각에 관련된 웹페이지 데이터를 포함하는 것을 특징으로 하는 웹페이지 검색 방법.A site identifier for the predetermined site, a webpage identifier for each of the at least one webpage, site data associated with the predetermined site, and webpage data associated with each of the at least one webpage. How to search web pages. 제6항에 있어서,The method of claim 6, 상기 사이트 데이터는,The site data, 상기 사이트의 범용 리소스 로케이터(URL), 제목, 설명 또는 상기 사이트가 속하는 카테고리에 대한 카테고리 식별자 중 적어도 하나를 포함하고,At least one of a universal resource locator (URL), a title, a description of the site, or a category identifier for a category to which the site belongs, 상기 웹페이지 데이터는,The web page data, 상기 웹페이지의 범용 리소스 로케이터 또는 소스 파일 중 적어도 하나를 포함하는 웹페이지 검색 방법.And at least one of a universal resource locator or a source file of the webpage. 제1항에 있어서,The method of claim 1, 상기 사이트 색인 데이터베이스는,The site index database, 소정의 사이트에 대응하는 사이트 식별자 및 상기 소정의 사이트에 포함된 적어도 하나의 웹페이지 각각에 대한 웹페이지 식별자를 저장하는 것을 특징으로 하는 웹페이지 검색 방법.And a web page identifier for each of at least one web page included in the predetermined site. 제1항 내지 제3항 중 어느 하나의 항에 있어서,The method according to any one of claims 1 to 3, 상기 키워드 색인 데이터베이스는,The keyword index database, 소정의 키워드에 대응하는 키워드 식별자 및 상기 소정의 키워드를 포함하는 적어도 하나의 웹페이지 각각에 대한 웹페이지 식별자를 저장하는 것을 특징으로 하는 웹페이지 검색 방법.And a web page identifier for each of the at least one web page including the keyword and the keyword identifier corresponding to the predetermined keyword. 제2항 또는 제3항 중 어느 하나의 항에 있어서,The method according to any one of claims 2 to 3, 상기 카테고리 색인 데이터베이스는,The category index database, 미리 선정된 카테고리 기준에 따라 분류된 소정의 카테고리에 대응하는 카테고리 식별자 및 상기 소정의 카테고리에 속하는 적어도 하나의 웹페이지 각각에 대한 웹페이지 식별자를 저장하는 것을 특징으로 하는 웹페이지 검색 방법.And storing a category identifier corresponding to a predetermined category classified according to a pre-selected category criterion and a webpage identifier for each of at least one webpage belonging to the predetermined category. 제10항에 있어서,The method of claim 10, 상기 소정의 카테고리는,The predetermined category is 상기 소정의 카테고리에 대한 하위 카테고리를 포함하는 것을 특징으로 하는 웹페이지 검색 방법.And a sub-category for the predetermined category. 제1항 내지 제3항 중 어느 하나의 항에 있어서,The method according to any one of claims 1 to 3, 상기 제1 검색 요청 및 상기 제2 검색 요청에 공통된 웹페이지 정보를 추출하여 제공하는 단계는,Extracting and providing web page information common to the first search request and the second search request, 상기 공통된 웹페이지 정보를 사용자 인터페이스 화면으로 재구성하여 제공하는 것을 특징으로 하는 웹페이지 검색 방법.And reconstructing the common web page information into a user interface screen. 제6항에 있어서,The method of claim 6, 상기 사이트 식별자는, 상기 사이트의 범용 리소스 로케이터에 대응하고,The site identifier corresponds to a universal resource locator of the site, 상기 웹페이지 식별자는, 상기 웹페이지의 범용 리소스 로케이터에 대응하는 것을 특징으로 하는 웹페이지 검색 방법.And the web page identifier corresponds to a universal resource locator of the web page. 제1항 내지 제3항 중 어느 한 항의 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.A computer-readable recording medium having recorded thereon a program for implementing the method of claim 1 in a computer.
KR1020040003124A 2004-01-15 2004-01-15 A method of searching web page and computer readable recording media for recording the method program KR100942902B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040003124A KR100942902B1 (en) 2004-01-15 2004-01-15 A method of searching web page and computer readable recording media for recording the method program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040003124A KR100942902B1 (en) 2004-01-15 2004-01-15 A method of searching web page and computer readable recording media for recording the method program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020030032447 Division 2003-05-22

Publications (2)

Publication Number Publication Date
KR20040100857A KR20040100857A (en) 2004-12-02
KR100942902B1 true KR100942902B1 (en) 2010-02-16

Family

ID=37378156

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040003124A KR100942902B1 (en) 2004-01-15 2004-01-15 A method of searching web page and computer readable recording media for recording the method program

Country Status (1)

Country Link
KR (1) KR100942902B1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006101282A1 (en) * 2005-03-23 2006-09-28 Kwang Hyun Cho The real-time data grouping-searching method and the networking method of the computer servers in the internet environment
KR100726886B1 (en) * 2005-08-19 2007-06-12 (주)수도프리미엄엔지니어링 System and method for searching web document of internet
KR100834760B1 (en) * 2006-11-23 2008-06-05 삼성전자주식회사 Structure of index, apparatus and method for optimized index searching
CN108021706A (en) * 2017-12-28 2018-05-11 广州市西美信息科技有限公司 network information acquisition method and device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1031683A (en) * 1996-05-14 1998-02-03 Toshiba Corp Url information database constructing method and internet retrieval server utilizing the method
KR19990070968A (en) * 1998-02-26 1999-09-15 홍오성 How to Search and Database Your Internet Resources
KR20020022977A (en) * 2000-09-21 2002-03-28 한영석 Internet resource retrieval and browsing method based on expanded web site map and expanded natural domain names assigned to all web resources

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1031683A (en) * 1996-05-14 1998-02-03 Toshiba Corp Url information database constructing method and internet retrieval server utilizing the method
KR19990070968A (en) * 1998-02-26 1999-09-15 홍오성 How to Search and Database Your Internet Resources
KR20020022977A (en) * 2000-09-21 2002-03-28 한영석 Internet resource retrieval and browsing method based on expanded web site map and expanded natural domain names assigned to all web resources

Also Published As

Publication number Publication date
KR20040100857A (en) 2004-12-02

Similar Documents

Publication Publication Date Title
US10275419B2 (en) Personalized search
US8326818B2 (en) Method of managing websites registered in search engine and a system thereof
US7933890B2 (en) Propagating useful information among related web pages, such as web pages of a website
US20070022085A1 (en) Techniques for unsupervised web content discovery and automated query generation for crawling the hidden web
US20020099685A1 (en) Document retrieval system; method of document retrieval; and search server
US20060288001A1 (en) System and method for dynamically identifying the best search engines and searchable databases for a query, and model of presentation of results - the search assistant
JP5329540B2 (en) User-centric information search method, computer-readable recording medium, and user-centric information search system
JP2004054631A (en) Information retrieval system, information retrieval method, structural analysis method of html document, and program
KR100434902B1 (en) Knowledge base custom made information offer system and service method thereof
KR20040017008A (en) System and method for offering information using a search engine
US20040139200A1 (en) Systems and methods of generating a content aware interface
KR100557874B1 (en) Method of scientific information analysis and media that can record computer program thereof
KR100672278B1 (en) Personalized Search Method Using Bookmark List Of Web Browser And System For Enabling The Method
KR100942902B1 (en) A method of searching web page and computer readable recording media for recording the method program
KR100667917B1 (en) A method of providing website searching service and a system thereof
KR20040098889A (en) A method of providing website searching service and a system thereof
KR100931772B1 (en) A method of providing website searching service and a system thereof
KR19990010227A (en) Real-time information retrieval method using mobile search engine
JP2002049638A (en) Document information retrieval device, method, document information retrieval program and computer readable recording medium storing document information retrieval program
KR100955776B1 (en) Retrieval system and method
KR100931775B1 (en) A method of providing website searching service and a system thereof
JP2003173351A (en) Method, device, program and storage medium for analysis, collection and retrieval of information
KR100458458B1 (en) A method of managing web sites registered in search engine and a system thereof
KR101048590B1 (en) A method of managing web sites registered in search engine and a system thereof
Abdulmunim et al. Links Evaluation and Ranking Based on Semantic Metadata Analysis

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130111

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131231

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20151223

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170117

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190102

Year of fee payment: 10